/* SPDX-License-Identifier: GPL-2.0 */
#ifndef _LINUX_VIRTIO_CONFIG_H
#define _LINUX_VIRTIO_CONFIG_H

#include <linux/err.h>
#include <linux/bug.h>
#include <linux/virtio.h>
#include <linux/virtio_byteorder.h>
#include <linux/compiler_types.h>
#include <uapi/linux/virtio_config.h>

struct irq_affinity;

/**
 * virtio_config_ops - operations for configuring a virtio device
 * Note: Do not assume that a transport implements all of the operations
 *       getting/setting a value as a simple read/write! Generally speaking,
 *       any of @get/@set, @get_status/@set_status, or @get_features/
 *       @finalize_features are NOT safe to be called from an atomic
 *       context.
 * @get: read the value of a configuration field
 *	vdev: the virtio_device
 *	offset: the offset of the configuration field
 *	buf: the buffer to write the field value into.
 *	len: the length of the buffer
 * @set: write the value of a configuration field
 *	vdev: the virtio_device
 *	offset: the offset of the configuration field
 *	buf: the buffer to read the field value from.
 *	len: the length of the buffer
 * @generation: config generation counter (optional)
 *	vdev: the virtio_device
 *	Returns the config generation counter
 * @get_status: read the status byte
 *	vdev: the virtio_device
 *	Returns the status byte
 * @set_status: write the status byte
 *	vdev: the virtio_device
 *	status: the new status byte
 * @reset: reset the device
 *	vdev: the virtio device
 *	After this, status and feature negotiation must be done again
 *	Device must not be reset from its vq/config callbacks, or in
 *	parallel with being added/removed.
 * @find_vqs: find virtqueues and instantiate them.
 *	vdev: the virtio_device
 *	nvqs: the number of virtqueues to find
 *	vqs: on success, includes new virtqueues
 *	callbacks: array of callbacks, for each virtqueue
 *		include a NULL entry for vqs that do not need a callback
 *	names: array of virtqueue names (mainly for debugging)
 *		include a NULL entry for vqs unused by driver
 *	Returns 0 on success or error status
 * @del_vqs: free virtqueues found by find_vqs().
 * @get_features: get the array of feature bits for this device.
 *	vdev: the virtio_device
 *	Returns the first 64 feature bits (all we currently need).
 * @finalize_features: confirm what device features we'll be using.
 *	vdev: the virtio_device
 *	This gives the final feature bits for the device: it can change
 *	the dev->feature bits if it wants.
 *	Returns 0 on success or error status
 * @bus_name: return the bus name associated with the device (optional)
 *	vdev: the virtio_device
 *      This returns a pointer to the bus name a la pci_name from which
 *      the caller can then copy.
 * @set_vq_affinity: set the affinity for a virtqueue (optional).
 * @get_vq_affinity: get the affinity for a virtqueue (optional).
 */
typedef void vq_callback_t(struct virtqueue *);
struct virtio_config_ops {
	void (*get)(struct virtio_device *vdev, unsigned offset,
		    void *buf, unsigned len);
	void (*set)(struct virtio_device *vdev, unsigned offset,
		    const void *buf, unsigned len);
	u32 (*generation)(struct virtio_device *vdev);
	u8 (*get_status)(struct virtio_device *vdev);
	void (*set_status)(struct virtio_device *vdev, u8 status);
	void (*reset)(struct virtio_device *vdev);
	int (*find_vqs)(struct virtio_device *, unsigned nvqs,
			struct virtqueue *vqs[], vq_callback_t *callbacks[],
			const char * const names[], const bool *ctx,
			struct irq_affinity *desc);
	void (*del_vqs)(struct virtio_device *);
	u64 (*get_features)(struct virtio_device *vdev);
	int (*finalize_features)(struct virtio_device *vdev);
	const char *(*bus_name)(struct virtio_device *vdev);
	int (*set_vq_affinity)(struct virtqueue *vq,
			       const struct cpumask *cpu_mask);
	const struct cpumask *(*get_vq_affinity)(struct virtio_device *vdev,
			int index);
};

/* If driver didn't advertise the feature, it will never appear. */
void virtio_check_driver_offered_feature(const struct virtio_device *vdev,
					 unsigned int fbit);

/**
 * __virtio_test_bit - helper to test feature bits. For use by transports.
 *                     Devices should normally use virtio_has_feature,
 *                     which includes more checks.
 * @vdev: the device
 * @fbit: the feature bit
 */
static inline bool __virtio_test_bit(const struct virtio_device *vdev,
				     unsigned int fbit)
{
	/* Did you forget to fix assumptions on max features? */
	if (__builtin_constant_p(fbit))
		BUILD_BUG_ON(fbit >= 64);
	else
		BUG_ON(fbit >= 64);

	return vdev->features & BIT_ULL(fbit);
}

/**
 * __virtio_set_bit - helper to set feature bits. For use by transports.
 * @vdev: the device
 * @fbit: the feature bit
 */
static inline void __virtio_set_bit(struct virtio_device *vdev,
				    unsigned int fbit)
{
	/* Did you forget to fix assumptions on max features? */
	if (__builtin_constant_p(fbit))
		BUILD_BUG_ON(fbit >= 64);
	else
		BUG_ON(fbit >= 64);

	vdev->features |= BIT_ULL(fbit);
}

/**
 * __virtio_clear_bit - helper to clear feature bits. For use by transports.
 * @vdev: the device
 * @fbit: the feature bit
 */
static inline void __virtio_clear_bit(struct virtio_device *vdev,
				      unsigned int fbit)
{
	/* Did you forget to fix assumptions on max features? */
	if (__builtin_constant_p(fbit))
		BUILD_BUG_ON(fbit >= 64);
	else
		BUG_ON(fbit >= 64);

	vdev->features &= ~BIT_ULL(fbit);
}

/**
 * virtio_has_feature - helper to determine if this device has this feature.
 * @vdev: the device
 * @fbit: the feature bit
 */
static inline bool virtio_has_feature(const struct virtio_device *vdev,
				      unsigned int fbit)
{
	if (fbit < VIRTIO_TRANSPORT_F_START)
		virtio_check_driver_offered_feature(vdev, fbit);

	return __virtio_test_bit(vdev, fbit);
}

/**
 * virtio_has_dma_quirk - determine whether this device has the DMA quirk
 * @vdev: the device
 */
static inline bool virtio_has_dma_quirk(const struct virtio_device *vdev)
{
	/*
	 * Note the reverse polarity of the quirk feature (compared to most
	 * other features), this is for compatibility with legacy systems.
	 */
	return !virtio_has_feature(vdev, VIRTIO_F_ACCESS_PLATFORM);
}

static inline
struct virtqueue *virtio_find_single_vq(struct virtio_device *vdev,
					vq_callback_t *c, const char *n)
{
	vq_callback_t *callbacks[] = { c };
	const char *names[] = { n };
	struct virtqueue *vq;
	int err = vdev->config->find_vqs(vdev, 1, &vq, callbacks, names, NULL,
					 NULL);
	if (err < 0)
		return ERR_PTR(err);
	return vq;
}

static inline
int virtio_find_vqs(struct virtio_device *vdev, unsigned nvqs,
			struct virtqueue *vqs[], vq_callback_t *callbacks[],
			const char * const names[],
			struct irq_affinity *desc)
{
	return vdev->config->find_vqs(vdev, nvqs, vqs, callbacks, names, NULL, desc);
}

static inline
int virtio_find_vqs_ctx(struct virtio_device *vdev, unsigned nvqs,
			struct virtqueue *vqs[], vq_callback_t *callbacks[],
			const char * const names[], const bool *ctx,
			struct irq_affinity *desc)
{
	return vdev->config->find_vqs(vdev, nvqs, vqs, callbacks, names, ctx,
				      desc);
}

/**
 * virtio_device_ready - enable vq use in probe function
 * @vdev: the device
 *
 * Driver must call this to use vqs in the probe function.
 *
 * Note: vqs are enabled automatically after probe returns.
 */
static inline
void virtio_device_ready(struct virtio_device *dev)
{
	unsigned status = dev->config->get_status(dev);

	BUG_ON(status & VIRTIO_CONFIG_S_DRIVER_OK);
	dev->config->set_status(dev, status | VIRTIO_CONFIG_S_DRIVER_OK);
}

static inline
const char *virtio_bus_name(struct virtio_device *vdev)
{
	if (!vdev->config->bus_name)
		return "virtio";
	return vdev->config->bus_name(vdev);
}

/**
 * virtqueue_set_affinity - setting affinity for a virtqueue
 * @vq: the virtqueue
 * @cpu: the cpu no.
 *
 * Pay attention the function are best-effort: the affinity hint may not be set
 * due to config support, irq type and sharing.
 *
 */
static inline
int virtqueue_set_affinity(struct virtqueue *vq, const struct cpumask *cpu_mask)
{
	struct virtio_device *vdev = vq->vdev;
	if (vdev->config->set_vq_affinity)
		return vdev->config->set_vq_affinity(vq, cpu_mask);
	return 0;
}

static inline bool virtio_is_little_endian(struct virtio_device *vdev)
{
	return virtio_has_feature(vdev, VIRTIO_F_VERSION_1) ||
		virtio_legacy_is_little_endian();
}

/* Memory accessors */
static inline u16 virtio16_to_cpu(struct virtio_device *vdev, __virtio16 val)
{
	return __virtio16_to_cpu(virtio_is_little_endian(vdev), val);
}

static inline __virtio16 cpu_to_virtio16(struct virtio_device *vdev, u16 val)
{
	return __cpu_to_virtio16(virtio_is_little_endian(vdev), val);
}

static inline u32 virtio32_to_cpu(struct virtio_device *vdev, __virtio32 val)
{
	return __virtio32_to_cpu(virtio_is_little_endian(vdev), val);
}

static inline __virtio32 cpu_to_virtio32(struct virtio_device *vdev, u32 val)
{
	return __cpu_to_virtio32(virtio_is_little_endian(vdev), val);
}

static inline u64 virtio64_to_cpu(struct virtio_device *vdev, __virtio64 val)
{
	return __virtio64_to_cpu(virtio_is_little_endian(vdev), val);
}

static inline __virtio64 cpu_to_virtio64(struct virtio_device *vdev, u64 val)
{
	return __cpu_to_virtio64(virtio_is_little_endian(vdev), val);
}

#define virtio_to_cpu(vdev, x) \
	_Generic((x), \
		__u8: (x), \
		__virtio16: virtio16_to_cpu((vdev), (x)), \
		__virtio32: virtio32_to_cpu((vdev), (x)), \
		__virtio64: virtio64_to_cpu((vdev), (x)) \
		)

#define cpu_to_virtio(vdev, x, m) \
	_Generic((m), \
		__u8: (x), \
		__virtio16: cpu_to_virtio16((vdev), (x)), \
		__virtio32: cpu_to_virtio32((vdev), (x)), \
		__virtio64: cpu_to_virtio64((vdev), (x)) \
		)

#define __virtio_native_type(structname, member) \
	typeof(virtio_to_cpu(NULL, ((structname*)0)->member))

/* Config space accessors. */
#define virtio_cread(vdev, structname, member, ptr)			\
	do {								\
		typeof(((structname*)0)->member) virtio_cread_v;	\
									\
		might_sleep();						\
		/* Sanity check: must match the member's type */	\
		typecheck(typeof(virtio_to_cpu((vdev), virtio_cread_v)), *(ptr)); \
									\
		switch (sizeof(virtio_cread_v)) {			\
		case 1:							\
		case 2:							\
		case 4:							\
			vdev->config->get((vdev), 			\
					  offsetof(structname, member), \
					  &virtio_cread_v,		\
					  sizeof(virtio_cread_v));	\
			break;						\
		default:						\
			__virtio_cread_many((vdev), 			\
					  offsetof(structname, member), \
					  &virtio_cread_v,		\
					  1,				\
					  sizeof(virtio_cread_v));	\
			break;						\
		}							\
		*(ptr) = virtio_to_cpu(vdev, virtio_cread_v);		\
	} while(0)

/* Config space accessors. */
#define virtio_cwrite(vdev, structname, member, ptr)			\
	do {								\
		typeof(((structname*)0)->member) virtio_cwrite_v =	\
			cpu_to_virtio(vdev, *(ptr), ((structname*)0)->member); \
									\
		might_sleep();						\
		/* Sanity check: must match the member's type */	\
		typecheck(typeof(virtio_to_cpu((vdev), virtio_cwrite_v)), *(ptr)); \
									\
		vdev->config->set((vdev), offsetof(structname, member),	\
				  &virtio_cwrite_v,			\
				  sizeof(virtio_cwrite_v));		\
	} while(0)

/*
 * Nothing virtio-specific about these, but let's worry about generalizing
 * these later.
 */
#define virtio_le_to_cpu(x) \
	_Generic((x), \
		__u8: (u8)(x), \
		 __le16: (u16)le16_to_cpu(x), \
		 __le32: (u32)le32_to_cpu(x), \
		 __le64: (u64)le64_to_cpu(x) \
		)

#define virtio_cpu_to_le(x, m) \
	_Generic((m), \
		 __u8: (x), \
		 __le16: cpu_to_le16(x), \
		 __le32: cpu_to_le32(x), \
		 __le64: cpu_to_le64(x) \
		)

/* LE (e.g. modern) Config space accessors. */
#define virtio_cread_le(vdev, structname, member, ptr)			\
	do {								\
		typeof(((structname*)0)->member) virtio_cread_v;	\
									\
		might_sleep();						\
		/* Sanity check: must match the member's type */	\
		typecheck(typeof(virtio_le_to_cpu(virtio_cread_v)), *(ptr)); \
									\
		switch (sizeof(virtio_cread_v)) {			\
		case 1:							\
		case 2:							\
		case 4:							\
			vdev->config->get((vdev), 			\
					  offsetof(structname, member), \
					  &virtio_cread_v,		\
					  sizeof(virtio_cread_v));	\
			break;						\
		default:						\
			__virtio_cread_many((vdev), 			\
					  offsetof(structname, member), \
					  &virtio_cread_v,		\
					  1,				\
					  sizeof(virtio_cread_v));	\
			break;						\
		}							\
		*(ptr) = virtio_le_to_cpu(virtio_cread_v);		\
	} while(0)

#define virtio_cwrite_le(vdev, structname, member, ptr)			\
	do {								\
		typeof(((structname*)0)->member) virtio_cwrite_v =	\
			virtio_cpu_to_le(*(ptr), ((structname*)0)->member); \
									\
		might_sleep();						\
		/* Sanity check: must match the member's type */	\
		typecheck(typeof(virtio_le_to_cpu(virtio_cwrite_v)), *(ptr)); \
									\
		vdev->config->set((vdev), offsetof(structname, member),	\
				  &virtio_cwrite_v,			\
				  sizeof(virtio_cwrite_v));		\
	} while(0)


/* Read @count fields, @bytes each. */
static inline void __virtio_cread_many(struct virtio_device *vdev,
				       unsigned int offset,
				       void *buf, size_t count, size_t bytes)
{
	u32 old, gen = vdev->config->generation ?
		vdev->config->generation(vdev) : 0;
	int i;

	might_sleep();
	do {
		old = gen;

		for (i = 0; i < count; i++)
			vdev->config->get(vdev, offset + bytes * i,
					  buf + i * bytes, bytes);

		gen = vdev->config->generation ?
			vdev->config->generation(vdev) : 0;
	} while (gen != old);
}

static inline void virtio_cread_bytes(struct virtio_device *vdev,
				      unsigned int offset,
				      void *buf, size_t len)
{
	__virtio_cread_many(vdev, offset, buf, len, 1);
}

static inline u8 virtio_cread8(struct virtio_device *vdev, unsigned int offset)
{
	u8 ret;

	might_sleep();
	vdev->config->get(vdev, offset, &ret, sizeof(ret));
	return ret;
}

static inline void virtio_cwrite8(struct virtio_device *vdev,
				  unsigned int offset, u8 val)
{
	might_sleep();
	vdev->config->set(vdev, offset, &val, sizeof(val));
}

static inline u16 virtio_cread16(struct virtio_device *vdev,
				 unsigned int offset)
{
	__virtio16 ret;

	might_sleep();
	vdev->config->get(vdev, offset, &ret, sizeof(ret));
	return virtio16_to_cpu(vdev, ret);
}

static inline void virtio_cwrite16(struct virtio_device *vdev,
				   unsigned int offset, u16 val)
{
	__virtio16 v;

	might_sleep();
	v = cpu_to_virtio16(vdev, val);
	vdev->config->set(vdev, offset, &v, sizeof(v));
}

static inline u32 virtio_cread32(struct virtio_device *vdev,
				 unsigned int offset)
{
	__virtio32 ret;

	might_sleep();
	vdev->config->get(vdev, offset, &ret, sizeof(ret));
	return virtio32_to_cpu(vdev, ret);
}

static inline void virtio_cwrite32(struct virtio_device *vdev,
				   unsigned int offset, u32 val)
{
	__virtio32 v;

	might_sleep();
	v = cpu_to_virtio32(vdev, val);
	vdev->config->set(vdev, offset, &v, sizeof(v));
}

static inline u64 virtio_cread64(struct virtio_device *vdev,
				 unsigned int offset)
{
	__virtio64 ret;

	__virtio_cread_many(vdev, offset, &ret, 1, sizeof(ret));
	return virtio64_to_cpu(vdev, ret);
}

static inline void virtio_cwrite64(struct virtio_device *vdev,
				   unsigned int offset, u64 val)
{
	__virtio64 v;

	might_sleep();
	v = cpu_to_virtio64(vdev, val);
	vdev->config->set(vdev, offset, &v, sizeof(v));
}

/* Conditional config space accessors. */
#define virtio_cread_feature(vdev, fbit, structname, member, ptr)	\
	({								\
		int _r = 0;						\
		if (!virtio_has_feature(vdev, fbit))			\
			_r = -ENOENT;					\
		else							\
			virtio_cread((vdev), structname, member, ptr);	\
		_r;							\
	})

/* Conditional config space accessors. */
#define virtio_cread_le_feature(vdev, fbit, structname, member, ptr)	\
	({								\
		int _r = 0;						\
		if (!virtio_has_feature(vdev, fbit))			\
			_r = -ENOENT;					\
		else							\
			virtio_cread_le((vdev), structname, member, ptr); \
		_r;							\
	})
#endif /* _LINUX_VIRTIO_CONFIG_H */
: 0.2%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/adfs/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/adfs/Kconfig</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/adfs/adfs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/adfs/adfs.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/adfs/dir_f.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/adfs/dir_f.h</a></td><td class='right'>5</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/adfs/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/adfs/file.c</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/adfs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/adfs/inode.c</a></td><td class='right'>53</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/adfs/map.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/adfs/map.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/adfs/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/adfs/super.c</a></td><td class='right'>193</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.9%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 98.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/affs/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/affs/Kconfig</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/affs/affs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/affs/affs.h</a></td><td class='right'>13</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/affs/amigaffs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/affs/amigaffs.c</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/affs/amigaffs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/affs/amigaffs.h</a></td><td class='right'>9</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/affs/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/affs/dir.c</a></td><td class='right'>44</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/affs/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/affs/file.c</a></td><td class='right'>161</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/affs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/affs/inode.c</a></td><td class='right'>25</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/affs/namei.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/affs/namei.c</a></td><td class='right'>40</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/affs/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/affs/super.c</a></td><td class='right'>385</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.7%;'/><td class='rem' style='width: 1.7%;'/><td class='none' style='width: 96.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/affs/symlink.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/affs/symlink.c</a></td><td class='right'>15</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/Kconfig</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/Makefile</a></td><td class='right'>7</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/addr_list.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/addr_list.c</a></td><td class='right'>254</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 1.1%;'/><td class='none' style='width: 97.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/afs/addr_prefs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/addr_prefs.c</a></td><td class='right'>533</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 95.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/afs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/afs.h</a></td><td class='right'>9</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/afs_vl.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/afs_vl.h</a></td><td class='right'>10</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/afs/cache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/cache.c</a></td><td class='right'>68</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/callback.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/callback.c</a></td><td class='right'>147</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/cell.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/cell.c</a></td><td class='right'>625</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.6%;'/><td class='rem' style='width: 3.0%;'/><td class='none' style='width: 94.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/afs/cm_security.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/cm_security.c</a></td><td class='right'>340</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 96.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/cmservice.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/cmservice.c</a></td><td class='right'>93</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/dir.c</a></td><td class='right'>1201</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 6.2%;'/><td class='rem' style='width: 4.6%;'/><td class='none' style='width: 89.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/dir_edit.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/dir_edit.c</a></td><td class='right'>447</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.7%;'/><td class='rem' style='width: 1.3%;'/><td class='none' style='width: 96.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/afs/dir_search.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/dir_search.c</a></td><td class='right'>227</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/dir_silly.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/dir_silly.c</a></td><td class='right'>23</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/dynroot.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/dynroot.c</a></td><td class='right'>477</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.2%;'/><td class='rem' style='width: 2.1%;'/><td class='none' style='width: 95.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/file.c</a></td><td class='right'>558</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.4%;'/><td class='rem' style='width: 2.6%;'/><td class='none' style='width: 95.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/flock.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/flock.c</a></td><td class='right'>72</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/fs_operation.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/fs_operation.c</a></td><td class='right'>204</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.4%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 98.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/fs_probe.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/fs_probe.c</a></td><td class='right'>344</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.8%;'/><td class='rem' style='width: 1.3%;'/><td class='none' style='width: 96.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/fsclient.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/fsclient.c</a></td><td class='right'>139</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.9%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/inode.c</a></td><td class='right'>527</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.4%;'/><td class='rem' style='width: 2.3%;'/><td class='none' style='width: 95.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/internal.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/internal.h</a></td><td class='right'>818</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.5%;'/><td class='rem' style='width: 2.8%;'/><td class='none' style='width: 92.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/main.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/main.c</a></td><td class='right'>41</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/misc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/misc.c</a></td><td class='right'>40</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/mntpt.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/mntpt.c</a></td><td class='right'>39</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/proc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/proc.c</a></td><td class='right'>137</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/protocol_yfs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/protocol_yfs.h</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/rotate.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/rotate.c</a></td><td class='right'>533</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.5%;'/><td class='rem' style='width: 1.3%;'/><td class='none' style='width: 95.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/rxrpc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/rxrpc.c</a></td><td class='right'>348</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.8%;'/><td class='rem' style='width: 1.3%;'/><td class='none' style='width: 96.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/security.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/security.c</a></td><td class='right'>54</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/server.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/server.c</a></td><td class='right'>704</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.8%;'/><td class='rem' style='width: 3.5%;'/><td class='none' style='width: 93.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/server_list.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/server_list.c</a></td><td class='right'>180</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.3%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 98.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/super.c</a></td><td class='right'>58</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/afs/validation.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/validation.c</a></td><td class='right'>484</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 95.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/vl_alias.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/vl_alias.c</a></td><td class='right'>83</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/vl_list.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/vl_list.c</a></td><td class='right'>48</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/vl_probe.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/vl_probe.c</a></td><td class='right'>62</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/vl_rotate.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/vl_rotate.c</a></td><td class='right'>225</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 98.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/vlclient.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/vlclient.c</a></td><td class='right'>146</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/volume.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/volume.c</a></td><td class='right'>153</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/write.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/write.c</a></td><td class='right'>901</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.1%;'/><td class='rem' style='width: 7.0%;'/><td class='none' style='width: 91.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/xattr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/xattr.c</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/xdr_fs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/xdr_fs.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/afs/yfsclient.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/yfsclient.c</a></td><td class='right'>330</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.7%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 97.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/aio.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/aio.c</a></td><td class='right'>541</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.2%;'/><td class='rem' style='width: 1.7%;'/><td class='none' style='width: 95.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/anon_inodes.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/anon_inodes.c</a></td><td class='right'>183</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 98.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/attr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/attr.c</a></td><td class='right'>347</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.2%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 96.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/autofs/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/autofs/Kconfig</a></td><td class='right'>12</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/autofs/autofs_i.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/autofs/autofs_i.h</a></td><td class='right'>38</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/autofs/dev-ioctl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/autofs/dev-ioctl.c</a></td><td class='right'>131</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.9%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/autofs/expire.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/autofs/expire.c</a></td><td class='right'>16</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/autofs/init.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/autofs/init.c</a></td><td class='right'>10</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/autofs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/autofs/inode.c</a></td><td class='right'>460</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.4%;'/><td class='rem' style='width: 1.8%;'/><td class='none' style='width: 95.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/autofs/root.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/autofs/root.c</a></td><td class='right'>151</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/autofs/waitq.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/autofs/waitq.c</a></td><td class='right'>5</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/backing-file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/backing-file.c</a></td><td class='right'>357</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 96.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/bad_inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/bad_inode.c</a></td><td class='right'>36</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/befs/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/befs/Kconfig</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/befs/btree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/befs/btree.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/befs/linuxvfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/befs/linuxvfs.c</a></td><td class='right'>253</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.1%;'/><td class='rem' style='width: 1.1%;'/><td class='none' style='width: 97.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/bfs/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/bfs/Kconfig</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/bfs/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/bfs/dir.c</a></td><td class='right'>28</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/bfs/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/bfs/file.c</a></td><td class='right'>32</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/bfs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/bfs/inode.c</a></td><td class='right'>70</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/binfmt_aout.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/binfmt_aout.c</a></td><td class='right'>342</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 3.1%;'/><td class='none' style='width: 96.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/binfmt_elf.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/binfmt_elf.c</a></td><td class='right'>981</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.6%;'/><td class='rem' style='width: 5.2%;'/><td class='none' style='width: 91.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/binfmt_elf_fdpic.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/binfmt_elf_fdpic.c</a></td><td class='right'>232</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 1.1%;'/><td class='none' style='width: 97.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/binfmt_flat.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/binfmt_flat.c</a></td><td class='right'>240</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 1.5%;'/><td class='none' style='width: 97.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/binfmt_misc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/binfmt_misc.c</a></td><td class='right'>422</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.8%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 96.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/binfmt_script.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/binfmt_script.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/bpf_fs_kfuncs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/bpf_fs_kfuncs.c</a></td><td class='right'>422</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 96.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/Kconfig</a></td><td class='right'>86</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/Makefile</a></td><td class='right'>19</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/accessors.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/accessors.c</a></td><td class='right'>125</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/accessors.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/accessors.h</a></td><td class='right'>1020</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 9.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 90.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/acl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/acl.c</a></td><td class='right'>72</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/acl.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/acl.h</a></td><td class='right'>40</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/async-thread.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/async-thread.c</a></td><td class='right'>189</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 98.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/async-thread.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/async-thread.h</a></td><td class='right'>20</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/backref.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/backref.c</a></td><td class='right'>1721</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 10.2%;'/><td class='rem' style='width: 5.2%;'/><td class='none' style='width: 84.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/backref.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/backref.h</a></td><td class='right'>400</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.2%;'/><td class='rem' style='width: 1.4%;'/><td class='none' style='width: 96.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/bio.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/bio.c</a></td><td class='right'>1059</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 9.5%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 90.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/bio.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/bio.h</a></td><td class='right'>126</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/block-group.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/block-group.c</a></td><td class='right'>2049</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 12.2%;'/><td class='rem' style='width: 6.2%;'/><td class='none' style='width: 81.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/block-group.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/block-group.h</a></td><td class='right'>176</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.1%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/block-rsv.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/block-rsv.c</a></td><td class='right'>228</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 98.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/block-rsv.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/block-rsv.h</a></td><td class='right'>79</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/btrfs_inode.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/btrfs_inode.h</a></td><td class='right'>578</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.7%;'/><td class='rem' style='width: 1.5%;'/><td class='none' style='width: 94.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/btrfs/check-integrity.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/check-integrity.c</a></td><td class='right'>2875</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 25.8%;'/><td class='none' style='width: 74.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/btrfs/check-integrity.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/check-integrity.h</a></td><td class='right'>22</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/compression.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/compression.c</a></td><td class='right'>1331</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.1%;'/><td class='rem' style='width: 6.9%;'/><td class='none' style='width: 88.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/compression.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/compression.h</a></td><td class='right'>170</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 98.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/ctree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/ctree.c</a></td><td class='right'>2658</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 14.0%;'/><td class='rem' style='width: 9.9%;'/><td class='none' style='width: 76.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/ctree.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/ctree.h</a></td><td class='right'>3572</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.8%;'/><td class='rem' style='width: 30.3%;'/><td class='none' style='width: 67.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/defrag.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/defrag.c</a></td><td class='right'>1519</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 13.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 86.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/defrag.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/defrag.h</a></td><td class='right'>31</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/delalloc-space.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/delalloc-space.c</a></td><td class='right'>199</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/delalloc-space.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/delalloc-space.h</a></td><td class='right'>16</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/delayed-inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/delayed-inode.c</a></td><td class='right'>1401</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.8%;'/><td class='rem' style='width: 4.8%;'/><td class='none' style='width: 87.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/delayed-inode.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/delayed-inode.h</a></td><td class='right'>187</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.4%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 98.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/delayed-ref.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/delayed-ref.c</a></td><td class='right'>1268</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 6.7%;'/><td class='rem' style='width: 4.7%;'/><td class='none' style='width: 88.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/delayed-ref.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/delayed-ref.h</a></td><td class='right'>384</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.0%;'/><td class='rem' style='width: 1.5%;'/><td class='none' style='width: 96.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/dev-replace.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/dev-replace.c</a></td><td class='right'>343</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.4%;'/><td class='rem' style='width: 1.7%;'/><td class='none' style='width: 96.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/dev-replace.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/dev-replace.h</a></td><td class='right'>18</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/dir-item.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/dir-item.c</a></td><td class='right'>156</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/dir-item.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/dir-item.h</a></td><td class='right'>57</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/direct-io.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/direct-io.c</a></td><td class='right'>1106</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 9.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 90.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/direct-io.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/direct-io.h</a></td><td class='right'>16</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/discard.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/discard.c</a></td><td class='right'>221</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.3%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 98.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/discard.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/discard.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/disk-io.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/disk-io.c</a></td><td class='right'>3284</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 14.2%;'/><td class='rem' style='width: 15.4%;'/><td class='none' style='width: 70.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/disk-io.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/disk-io.h</a></td><td class='right'>106</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/export.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/export.c</a></td><td class='right'>102</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/export.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/export.h</a></td><td class='right'>7</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/extent-io-tree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/extent-io-tree.c</a></td><td class='right'>1959</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 17.6%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 82.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/extent-io-tree.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/extent-io-tree.h</a></td><td class='right'>327</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.4%;'/><td class='rem' style='width: 1.6%;'/><td class='none' style='width: 97.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/extent-tree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/extent-tree.c</a></td><td class='right'>3642</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 18.4%;'/><td class='rem' style='width: 14.3%;'/><td class='none' style='width: 67.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/extent-tree.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/extent-tree.h</a></td><td class='right'>167</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.5%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/extent_io.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/extent_io.c</a></td><td class='right'>8288</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 24.5%;'/><td class='rem' style='width: 50.0%;'/><td class='none' style='width: 25.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/extent_io.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/extent_io.h</a></td><td class='right'>334</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.8%;'/><td class='rem' style='width: 1.2%;'/><td class='none' style='width: 97.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/extent_map.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/extent_map.c</a></td><td class='right'>1292</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 9.1%;'/><td class='rem' style='width: 2.5%;'/><td class='none' style='width: 88.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/extent_map.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/extent_map.h</a></td><td class='right'>197</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.3%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/fiemap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/fiemap.c</a></td><td class='right'>929</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 8.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 91.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/fiemap.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/fiemap.h</a></td><td class='right'>11</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/file-item.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/file-item.c</a></td><td class='right'>894</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.6%;'/><td class='rem' style='width: 3.5%;'/><td class='none' style='width: 92.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/file-item.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/file-item.h</a></td><td class='right'>87</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/file.c</a></td><td class='right'>3438</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 15.6%;'/><td class='rem' style='width: 15.3%;'/><td class='none' style='width: 69.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/file.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/file.h</a></td><td class='right'>51</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/free-space-cache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/free-space-cache.c</a></td><td class='right'>834</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.5%;'/><td class='rem' style='width: 3.0%;'/><td class='none' style='width: 92.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/free-space-cache.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/free-space-cache.h</a></td><td class='right'>43</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/free-space-tree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/free-space-tree.c</a></td><td class='right'>803</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.2%;'/><td class='rem' style='width: 3.0%;'/><td class='none' style='width: 92.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/free-space-tree.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/free-space-tree.h</a></td><td class='right'>61</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/fs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/fs.c</a></td><td class='right'>275</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.5%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/fs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/fs.h</a></td><td class='right'>1186</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 10.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 89.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/inode-item.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/inode-item.c</a></td><td class='right'>491</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.6%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 95.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/inode-item.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/inode-item.h</a></td><td class='right'>116</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/inode.c</a></td><td class='right'>10588</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 45.9%;'/><td class='rem' style='width: 49.2%;'/><td class='none' style='width: 4.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/ioctl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/ioctl.c</a></td><td class='right'>3057</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 15.3%;'/><td class='rem' style='width: 12.2%;'/><td class='none' style='width: 72.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/ioctl.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/ioctl.h</a></td><td class='right'>29</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/locking.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/locking.c</a></td><td class='right'>211</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.4%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/locking.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/locking.h</a></td><td class='right'>139</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/lru_cache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/lru_cache.c</a></td><td class='right'>166</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.5%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/lru_cache.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/lru_cache.h</a></td><td class='right'>71</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/lzo.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/lzo.c</a></td><td class='right'>264</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.3%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 97.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/messages.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/messages.c</a></td><td class='right'>315</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/messages.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/messages.h</a></td><td class='right'>220</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/misc.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/misc.h</a></td><td class='right'>170</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 98.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/ordered-data.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/ordered-data.c</a></td><td class='right'>933</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.1%;'/><td class='rem' style='width: 3.3%;'/><td class='none' style='width: 91.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/ordered-data.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/ordered-data.h</a></td><td class='right'>136</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/orphan.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/orphan.c</a></td><td class='right'>26</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/orphan.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/orphan.h</a></td><td class='right'>16</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/print-tree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/print-tree.c</a></td><td class='right'>359</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.6%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 96.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/print-tree.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/print-tree.h</a></td><td class='right'>9</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/props.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/props.c</a></td><td class='right'>187</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.9%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 98.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/props.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/props.h</a></td><td class='right'>25</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/qgroup.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/qgroup.c</a></td><td class='right'>2316</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 13.2%;'/><td class='rem' style='width: 7.6%;'/><td class='none' style='width: 79.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/qgroup.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/qgroup.h</a></td><td class='right'>228</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.1%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 98.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/raid-stripe-tree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/raid-stripe-tree.c</a></td><td class='right'>470</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 95.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/raid-stripe-tree.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/raid-stripe-tree.h</a></td><td class='right'>60</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/raid56.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/raid56.c</a></td><td class='right'>3374</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 16.7%;'/><td class='rem' style='width: 13.6%;'/><td class='none' style='width: 69.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/raid56.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/raid56.h</a></td><td class='right'>280</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.3%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 97.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/btrfs/rcu-string.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/rcu-string.h</a></td><td class='right'>48</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/btrfs/reada.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/reada.c</a></td><td class='right'>1086</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 9.8%;'/><td class='none' style='width: 90.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/ref-verify.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/ref-verify.c</a></td><td class='right'>198</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.9%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 98.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/ref-verify.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/ref-verify.h</a></td><td class='right'>17</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/reflink.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/reflink.c</a></td><td class='right'>347</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.6%;'/><td class='rem' style='width: 1.5%;'/><td class='none' style='width: 96.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/reflink.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/reflink.h</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/relocation.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/relocation.c</a></td><td class='right'>1849</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 8.0%;'/><td class='rem' style='width: 8.6%;'/><td class='none' style='width: 83.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/relocation.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/relocation.h</a></td><td class='right'>35</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/root-tree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/root-tree.c</a></td><td class='right'>156</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/root-tree.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/root-tree.h</a></td><td class='right'>42</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/scrub.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/scrub.c</a></td><td class='right'>5111</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 18.6%;'/><td class='rem' style='width: 27.3%;'/><td class='none' style='width: 54.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/scrub.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/scrub.h</a></td><td class='right'>22</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/send.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/send.c</a></td><td class='right'>4275</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 22.8%;'/><td class='rem' style='width: 15.6%;'/><td class='none' style='width: 61.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/send.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/send.h</a></td><td class='right'>191</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.1%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/space-info.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/space-info.c</a></td><td class='right'>1291</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 8.4%;'/><td class='rem' style='width: 3.2%;'/><td class='none' style='width: 88.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/space-info.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/space-info.h</a></td><td class='right'>228</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.8%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 98.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/btrfs/struct-funcs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/struct-funcs.c</a></td><td class='right'>171</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.5%;'/><td class='none' style='width: 98.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/subpage.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/subpage.c</a></td><td class='right'>901</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.4%;'/><td class='rem' style='width: 3.7%;'/><td class='none' style='width: 91.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/subpage.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/subpage.h</a></td><td class='right'>232</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.3%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 97.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/super.c</a></td><td class='right'>3204</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 14.6%;'/><td class='rem' style='width: 14.2%;'/><td class='none' style='width: 71.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/super.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/super.h</a></td><td class='right'>38</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/sysfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/sysfs.c</a></td><td class='right'>1062</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 8.1%;'/><td class='rem' style='width: 1.5%;'/><td class='none' style='width: 90.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/sysfs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/sysfs.h</a></td><td class='right'>22</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/tests/btrfs-tests.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tests/btrfs-tests.c</a></td><td class='right'>72</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/tests/btrfs-tests.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tests/btrfs-tests.h</a></td><td class='right'>9</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/tests/delayed-refs-tests.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tests/delayed-refs-tests.c</a></td><td class='right'>1016</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 9.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 90.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/tests/extent-buffer-tests.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tests/extent-buffer-tests.c</a></td><td class='right'>27</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/tests/extent-io-tests.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tests/extent-io-tests.c</a></td><td class='right'>511</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.5%;'/><td class='rem' style='width: 1.1%;'/><td class='none' style='width: 95.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/tests/extent-map-tests.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tests/extent-map-tests.c</a></td><td class='right'>859</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 6.4%;'/><td class='rem' style='width: 1.3%;'/><td class='none' style='width: 92.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/tests/free-space-tests.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tests/free-space-tests.c</a></td><td class='right'>202</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.7%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 98.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/tests/free-space-tree-tests.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tests/free-space-tree-tests.c</a></td><td class='right'>101</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/tests/inode-tests.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tests/inode-tests.c</a></td><td class='right'>417</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.8%;'/><td class='rem' style='width: 2.0%;'/><td class='none' style='width: 96.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/tests/qgroup-tests.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tests/qgroup-tests.c</a></td><td class='right'>109</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/tests/raid-stripe-tree-tests.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tests/raid-stripe-tree-tests.c</a></td><td class='right'>1161</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 10.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 89.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/transaction.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/transaction.c</a></td><td class='right'>1171</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 6.3%;'/><td class='rem' style='width: 4.2%;'/><td class='none' style='width: 89.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/transaction.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/transaction.h</a></td><td class='right'>111</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/tree-checker.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tree-checker.c</a></td><td class='right'>792</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.8%;'/><td class='rem' style='width: 1.3%;'/><td class='none' style='width: 92.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/tree-checker.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tree-checker.h</a></td><td class='right'>75</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/btrfs/tree-defrag.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tree-defrag.c</a></td><td class='right'>140</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.3%;'/><td class='none' style='width: 98.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/tree-log.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tree-log.c</a></td><td class='right'>6401</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 34.3%;'/><td class='rem' style='width: 23.2%;'/><td class='none' style='width: 42.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/tree-log.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tree-log.h</a></td><td class='right'>81</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/tree-mod-log.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tree-mod-log.c</a></td><td class='right'>398</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.8%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 96.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/tree-mod-log.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tree-mod-log.h</a></td><td class='right'>19</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/ulist.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/ulist.c</a></td><td class='right'>122</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/ulist.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/ulist.h</a></td><td class='right'>5</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/uuid-tree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/uuid-tree.c</a></td><td class='right'>333</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.1%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 97.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/uuid-tree.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/uuid-tree.h</a></td><td class='right'>19</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/verity.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/verity.c</a></td><td class='right'>163</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 98.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/btrfs/verity.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/verity.h</a></td><td class='right'>35</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/volumes.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/volumes.c</a></td><td class='right'>4409</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 19.5%;'/><td class='rem' style='width: 20.1%;'/><td class='none' style='width: 60.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/volumes.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/volumes.h</a></td><td class='right'>544</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.6%;'/><td class='rem' style='width: 1.3%;'/><td class='none' style='width: 95.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/xattr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/xattr.c</a></td><td class='right'>215</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.1%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 98.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/xattr.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/xattr.h</a></td><td class='right'>12</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/zlib.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/zlib.c</a></td><td class='right'>386</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.9%;'/><td class='rem' style='width: 1.5%;'/><td class='none' style='width: 96.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/zoned.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/zoned.c</a></td><td class='right'>2301</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 14.9%;'/><td class='rem' style='width: 5.8%;'/><td class='none' style='width: 79.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/zoned.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/zoned.h</a></td><td class='right'>195</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/btrfs/zstd.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/zstd.c</a></td><td class='right'>517</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.5%;'/><td class='rem' style='width: 2.2%;'/><td class='none' style='width: 95.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/buffer.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/buffer.c</a></td><td class='right'>2150</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 8.5%;'/><td class='rem' style='width: 10.8%;'/><td class='none' style='width: 80.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/cachefiles/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/Kconfig</a></td><td class='right'>21</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/cachefiles/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/Makefile</a></td><td class='right'>7</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/cachefiles/bind.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/bind.c</a></td><td class='right'>278</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 2.5%;'/><td class='none' style='width: 97.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/cachefiles/cache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/cache.c</a></td><td class='right'>428</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 96.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/cachefiles/daemon.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/daemon.c</a></td><td class='right'>317</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.8%;'/><td class='rem' style='width: 1.1%;'/><td class='none' style='width: 97.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/cachefiles/error_inject.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/error_inject.c</a></td><td class='right'>36</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/cachefiles/interface.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/interface.c</a></td><td class='right'>765</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.9%;'/><td class='rem' style='width: 3.9%;'/><td class='none' style='width: 93.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/cachefiles/internal.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/internal.h</a></td><td class='right'>402</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.7%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 96.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/cachefiles/io.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/io.c</a></td><td class='right'>614</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.3%;'/><td class='rem' style='width: 1.2%;'/><td class='none' style='width: 94.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/cachefiles/key.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/key.c</a></td><td class='right'>202</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 98.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/cachefiles/main.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/main.c</a></td><td class='right'>22</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/cachefiles/namei.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/namei.c</a></td><td class='right'>1250</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.9%;'/><td class='rem' style='width: 6.3%;'/><td class='none' style='width: 88.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/cachefiles/ondemand.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/ondemand.c</a></td><td class='right'>762</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 6.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 93.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/cachefiles/rdwr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/rdwr.c</a></td><td class='right'>972</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 8.7%;'/><td class='none' style='width: 91.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/cachefiles/security.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/security.c</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/cachefiles/volume.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/volume.c</a></td><td class='right'>141</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/cachefiles/xattr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/xattr.c</a></td><td class='right'>456</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.0%;'/><td class='rem' style='width: 2.1%;'/><td class='none' style='width: 95.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ceph/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/Kconfig</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ceph/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/Makefile</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ceph/acl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/acl.c</a></td><td class='right'>17</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ceph/addr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/addr.c</a></td><td class='right'>2263</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 12.8%;'/><td class='rem' style='width: 7.5%;'/><td class='none' style='width: 79.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ceph/cache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/cache.c</a></td><td class='right'>239</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 1.6%;'/><td class='none' style='width: 97.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ceph/cache.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/cache.h</a></td><td class='right'>88</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ceph/caps.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/caps.c</a></td><td class='right'>1608</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 9.6%;'/><td class='rem' style='width: 4.8%;'/><td class='none' style='width: 85.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/ceph/crypto.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/crypto.c</a></td><td class='right'>604</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 94.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/ceph/crypto.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/crypto.h</a></td><td class='right'>272</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ceph/debugfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/debugfs.c</a></td><td class='right'>208</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.1%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 98.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ceph/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/dir.c</a></td><td class='right'>680</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.3%;'/><td class='rem' style='width: 1.9%;'/><td class='none' style='width: 93.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ceph/export.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/export.c</a></td><td class='right'>139</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ceph/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/file.c</a></td><td class='right'>1491</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 9.8%;'/><td class='rem' style='width: 3.6%;'/><td class='none' style='width: 86.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ceph/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/inode.c</a></td><td class='right'>1540</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 10.6%;'/><td class='rem' style='width: 3.2%;'/><td class='none' style='width: 86.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ceph/io.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/io.c</a></td><td class='right'>100</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ceph/io.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/io.h</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ceph/ioctl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/ioctl.c</a></td><td class='right'>157</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.3%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ceph/locks.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/locks.c</a></td><td class='right'>165</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.9%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ceph/mds_client.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/mds_client.c</a></td><td class='right'>2390</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 15.7%;'/><td class='rem' style='width: 5.8%;'/><td class='none' style='width: 78.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ceph/mds_client.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/mds_client.h</a></td><td class='right'>156</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.1%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ceph/mdsmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/mdsmap.c</a></td><td class='right'>70</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/ceph/mdsmap.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/mdsmap.h</a></td><td class='right'>79</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ceph/metric.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/metric.c</a></td><td class='right'>206</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 1.1%;'/><td class='none' style='width: 98.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ceph/metric.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/metric.h</a></td><td class='right'>151</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ceph/quota.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/quota.c</a></td><td class='right'>102</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ceph/snap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/snap.c</a></td><td class='right'>410</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.5%;'/><td class='rem' style='width: 1.2%;'/><td class='none' style='width: 96.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ceph/strings.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/strings.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ceph/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/super.c</a></td><td class='right'>545</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.1%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 95.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ceph/super.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/super.h</a></td><td class='right'>302</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.1%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 97.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ceph/xattr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/xattr.c</a></td><td class='right'>197</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/char_dev.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/char_dev.c</a></td><td class='right'>23</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/cifs/cache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/cache.c</a></td><td class='right'>105</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/cifs/cifs_dfs_ref.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/cifs_dfs_ref.c</a></td><td class='right'>429</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 3.9%;'/><td class='none' style='width: 96.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/cifs/cifs_unicode.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/cifs_unicode.h</a></td><td class='right'>404</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 3.6%;'/><td class='none' style='width: 96.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/cifs/cifs_uniupr.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/cifs_uniupr.h</a></td><td class='right'>239</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 2.1%;'/><td class='none' style='width: 97.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/cifs/cifsencrypt.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/cifsencrypt.c</a></td><td class='right'>763</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 6.9%;'/><td class='none' style='width: 93.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/cifs/dns_resolve.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/dns_resolve.c</a></td><td class='right'>89</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/cifs/dns_resolve.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/dns_resolve.h</a></td><td class='right'>18</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/cifs/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/file.c</a></td><td class='right'>5004</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 45.0%;'/><td class='none' style='width: 55.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/cifs/fscache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/fscache.c</a></td><td class='right'>361</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 3.2%;'/><td class='none' style='width: 96.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/cifs/fscache.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/fscache.h</a></td><td class='right'>183</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.6%;'/><td class='none' style='width: 98.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/cifs/smb2inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/smb2inode.c</a></td><td class='right'>738</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 6.6%;'/><td class='none' style='width: 93.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/cifs/smb2pdu.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/smb2pdu.h</a></td><td class='right'>1007</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 9.1%;'/><td class='none' style='width: 90.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/cifs/smbdirect.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/smbdirect.c</a></td><td class='right'>2524</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 22.7%;'/><td class='none' style='width: 77.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/cifs/smbdirect.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/smbdirect.h</a></td><td class='right'>316</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 2.8%;'/><td class='none' style='width: 97.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/cifs/trace.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/trace.h</a></td><td class='right'>1016</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 9.1%;'/><td class='none' style='width: 90.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/coda/cache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/coda/cache.c</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/coda/cnode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/coda/cnode.c</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/coda/coda_linux.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/coda/coda_linux.c</a></td><td class='right'>9</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/coda/coda_linux.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/coda/coda_linux.h</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/coda/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/coda/dir.c</a></td><td class='right'>49</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/coda/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/coda/file.c</a></td><td class='right'>40</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/coda/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/coda/inode.c</a></td><td class='right'>185</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/coda/pioctl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/coda/pioctl.c</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/coda/psdev.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/coda/psdev.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/coda/symlink.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/coda/symlink.c</a></td><td class='right'>18</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/coda/sysctl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/coda/sysctl.c</a></td><td class='right'>14</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/coda/upcall.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/coda/upcall.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/compat_binfmt_elf.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/compat_binfmt_elf.c</a></td><td class='right'>12</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/configfs/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/configfs/Kconfig</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/configfs/configfs_internal.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/configfs/configfs_internal.h</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/configfs/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/configfs/dir.c</a></td><td class='right'>109</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/configfs/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/configfs/file.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/configfs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/configfs/inode.c</a></td><td class='right'>43</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/configfs/item.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/configfs/item.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/configfs/mount.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/configfs/mount.c</a></td><td class='right'>7</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/configfs/symlink.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/configfs/symlink.c</a></td><td class='right'>37</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/coredump.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/coredump.c</a></td><td class='right'>1400</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 9.5%;'/><td class='rem' style='width: 3.1%;'/><td class='none' style='width: 87.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/cramfs/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cramfs/Kconfig</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/cramfs/README?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cramfs/README</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/cramfs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cramfs/inode.c</a></td><td class='right'>90</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/crypto/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/crypto/Kconfig</a></td><td class='right'>22</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/crypto/bio.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/crypto/bio.c</a></td><td class='right'>91</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/crypto/crypto.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/crypto/crypto.c</a></td><td class='right'>252</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 97.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/crypto/fname.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/crypto/fname.c</a></td><td class='right'>247</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 1.5%;'/><td class='none' style='width: 97.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/crypto/fscrypt_private.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/crypto/fscrypt_private.h</a></td><td class='right'>376</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.4%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 96.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/crypto/hkdf.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/crypto/hkdf.c</a></td><td class='right'>142</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 98.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/crypto/hooks.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/crypto/hooks.c</a></td><td class='right'>101</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/crypto/inline_crypt.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/crypto/inline_crypt.c</a></td><td class='right'>338</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.2%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 97.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/crypto/keyring.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/crypto/keyring.c</a></td><td class='right'>735</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.9%;'/><td class='rem' style='width: 2.7%;'/><td class='none' style='width: 93.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/crypto/keysetup.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/crypto/keysetup.c</a></td><td class='right'>405</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.1%;'/><td class='rem' style='width: 1.6%;'/><td class='none' style='width: 96.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/crypto/keysetup_v1.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/crypto/keysetup_v1.c</a></td><td class='right'>85</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/crypto/policy.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/crypto/policy.c</a></td><td class='right'>283</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.6%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 97.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/d_path.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/d_path.c</a></td><td class='right'>14</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dax.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dax.c</a></td><td class='right'>1283</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 8.1%;'/><td class='rem' style='width: 3.4%;'/><td class='none' style='width: 88.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dcache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dcache.c</a></td><td class='right'>1448</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 6.7%;'/><td class='rem' style='width: 6.3%;'/><td class='none' style='width: 87.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/debugfs/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/debugfs/file.c</a></td><td class='right'>487</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.1%;'/><td class='rem' style='width: 1.3%;'/><td class='none' style='width: 95.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/debugfs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/debugfs/inode.c</a></td><td class='right'>645</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.2%;'/><td class='rem' style='width: 2.6%;'/><td class='none' style='width: 94.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/debugfs/internal.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/debugfs/internal.h</a></td><td class='right'>58</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/devpts/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/devpts/inode.c</a></td><td class='right'>351</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.3%;'/><td class='rem' style='width: 1.9%;'/><td class='none' style='width: 96.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/direct-io.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/direct-io.c</a></td><td class='right'>216</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 1.2%;'/><td class='none' style='width: 98.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/Kconfig</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/Makefile</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/ast.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/ast.c</a></td><td class='right'>383</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.5%;'/><td class='rem' style='width: 1.9%;'/><td class='none' style='width: 96.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/ast.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/ast.h</a></td><td class='right'>11</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/config.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/config.c</a></td><td class='right'>269</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.5%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 97.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/config.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/config.h</a></td><td class='right'>34</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/debug_fs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/debug_fs.c</a></td><td class='right'>351</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.4%;'/><td class='rem' style='width: 1.7%;'/><td class='none' style='width: 96.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/dir.c</a></td><td class='right'>176</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 98.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/dir.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/dir.h</a></td><td class='right'>9</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/dlm_internal.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/dlm_internal.h</a></td><td class='right'>370</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.9%;'/><td class='rem' style='width: 1.4%;'/><td class='none' style='width: 96.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/lock.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/lock.c</a></td><td class='right'>2967</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 13.6%;'/><td class='rem' style='width: 13.1%;'/><td class='none' style='width: 73.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/lock.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/lock.h</a></td><td class='right'>47</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/lockspace.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/lockspace.c</a></td><td class='right'>516</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.0%;'/><td class='rem' style='width: 2.7%;'/><td class='none' style='width: 95.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/lockspace.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/lockspace.h</a></td><td class='right'>13</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/lowcomms.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/lowcomms.c</a></td><td class='right'>1792</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.9%;'/><td class='rem' style='width: 8.2%;'/><td class='none' style='width: 83.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/lowcomms.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/lowcomms.h</a></td><td class='right'>15</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/main.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/main.c</a></td><td class='right'>31</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/member.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/member.c</a></td><td class='right'>147</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/member.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/member.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/memory.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/memory.c</a></td><td class='right'>128</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/memory.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/memory.h</a></td><td class='right'>12</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/midcomms.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/midcomms.c</a></td><td class='right'>854</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.2%;'/><td class='rem' style='width: 3.5%;'/><td class='none' style='width: 92.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/midcomms.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/midcomms.h</a></td><td class='right'>15</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/dlm/netlink.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/netlink.c</a></td><td class='right'>138</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.2%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/plock.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/plock.c</a></td><td class='right'>415</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.4%;'/><td class='rem' style='width: 1.3%;'/><td class='none' style='width: 96.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/rcom.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/rcom.c</a></td><td class='right'>261</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 1.1%;'/><td class='none' style='width: 97.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/rcom.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/rcom.h</a></td><td class='right'>15</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/recover.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/recover.c</a></td><td class='right'>342</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.4%;'/><td class='rem' style='width: 1.7%;'/><td class='none' style='width: 96.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/recover.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/recover.h</a></td><td class='right'>22</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/recoverd.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/recoverd.c</a></td><td class='right'>198</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.4%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 98.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/requestqueue.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/requestqueue.c</a></td><td class='right'>70</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/requestqueue.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/requestqueue.h</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/user.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/user.c</a></td><td class='right'>187</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 98.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/user.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/user.h</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/util.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/util.c</a></td><td class='right'>92</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/dlm/util.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/util.h</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/drop_caches.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/drop_caches.c</a></td><td class='right'>27</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ecryptfs/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ecryptfs/Kconfig</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ecryptfs/crypto.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ecryptfs/crypto.c</a></td><td class='right'>179</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 1.3%;'/><td class='none' style='width: 98.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ecryptfs/dentry.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ecryptfs/dentry.c</a></td><td class='right'>32</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ecryptfs/ecryptfs_kernel.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ecryptfs/ecryptfs_kernel.h</a></td><td class='right'>51</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ecryptfs/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ecryptfs/file.c</a></td><td class='right'>76</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ecryptfs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ecryptfs/inode.c</a></td><td class='right'>306</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.5%;'/><td class='rem' style='width: 1.3%;'/><td class='none' style='width: 97.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ecryptfs/keystore.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ecryptfs/keystore.c</a></td><td class='right'>69</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ecryptfs/main.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ecryptfs/main.c</a></td><td class='right'>453</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.0%;'/><td class='rem' style='width: 2.1%;'/><td class='none' style='width: 95.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ecryptfs/mmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ecryptfs/mmap.c</a></td><td class='right'>243</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 1.2%;'/><td class='none' style='width: 97.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ecryptfs/read_write.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ecryptfs/read_write.c</a></td><td class='right'>56</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ecryptfs/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ecryptfs/super.c</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/efivarfs/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/efivarfs/Makefile</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/efivarfs/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/efivarfs/file.c</a></td><td class='right'>62</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/efivarfs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/efivarfs/inode.c</a></td><td class='right'>76</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/efivarfs/internal.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/efivarfs/internal.h</a></td><td class='right'>55</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/efivarfs/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/efivarfs/super.c</a></td><td class='right'>408</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.1%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 96.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/efivarfs/vars.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/efivarfs/vars.c</a></td><td class='right'>632</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 94.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/efs/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/efs/Kconfig</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/efs/efs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/efs/efs.h</a></td><td class='right'>5</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/efs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/efs/inode.c</a></td><td class='right'>18</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/efs/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/efs/super.c</a></td><td class='right'>86</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/efs/symlink.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/efs/symlink.c</a></td><td class='right'>17</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/erofs/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/Kconfig</a></td><td class='right'>128</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/erofs/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/Makefile</a></td><td class='right'>9</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/erofs/compress.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/compress.h</a></td><td class='right'>105</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/erofs/data.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/data.c</a></td><td class='right'>482</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.6%;'/><td class='rem' style='width: 1.7%;'/><td class='none' style='width: 95.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/erofs/decompressor.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/decompressor.c</a></td><td class='right'>530</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.1%;'/><td class='rem' style='width: 1.6%;'/><td class='none' style='width: 95.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/erofs/decompressor_crypto.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/decompressor_crypto.c</a></td><td class='right'>182</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.6%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/erofs/decompressor_deflate.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/decompressor_deflate.c</a></td><td class='right'>204</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/erofs/decompressor_lzma.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/decompressor_lzma.c</a></td><td class='right'>171</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 98.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/erofs/decompressor_zstd.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/decompressor_zstd.c</a></td><td class='right'>220</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/erofs/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/dir.c</a></td><td class='right'>126</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/erofs/erofs_fs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/erofs_fs.h</a></td><td class='right'>429</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.1%;'/><td class='rem' style='width: 1.7%;'/><td class='none' style='width: 96.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/erofs/fileio.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/fileio.c</a></td><td class='right'>191</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/erofs/fscache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/fscache.c</a></td><td class='right'>677</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 6.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 93.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/erofs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/inode.c</a></td><td class='right'>475</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.1%;'/><td class='rem' style='width: 2.2%;'/><td class='none' style='width: 95.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/erofs/internal.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/internal.h</a></td><td class='right'>577</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.5%;'/><td class='rem' style='width: 2.7%;'/><td class='none' style='width: 94.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/erofs/namei.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/namei.c</a></td><td class='right'>125</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/erofs/pcpubuf.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/pcpubuf.c</a></td><td class='right'>148</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.3%;'/><td class='none' style='width: 98.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/erofs/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/super.c</a></td><td class='right'>985</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.0%;'/><td class='rem' style='width: 3.9%;'/><td class='none' style='width: 91.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/erofs/sysfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/sysfs.c</a></td><td class='right'>305</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/erofs/tagptr.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/tagptr.h</a></td><td class='right'>107</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/erofs/utils.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/utils.c</a></td><td class='right'>288</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 2.6%;'/><td class='none' style='width: 97.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/erofs/xattr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/xattr.c</a></td><td class='right'>821</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.0%;'/><td class='rem' style='width: 4.3%;'/><td class='none' style='width: 92.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/erofs/xattr.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/xattr.h</a></td><td class='right'>57</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/erofs/zdata.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/zdata.c</a></td><td class='right'>2496</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 13.1%;'/><td class='rem' style='width: 9.4%;'/><td class='none' style='width: 77.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/erofs/zdata.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/zdata.h</a></td><td class='right'>182</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.6%;'/><td class='none' style='width: 98.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/erofs/zmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/zmap.c</a></td><td class='right'>973</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.7%;'/><td class='rem' style='width: 4.0%;'/><td class='none' style='width: 91.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/erofs/zpvec.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/zpvec.h</a></td><td class='right'>152</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.4%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/erofs/zutil.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/zutil.c</a></td><td class='right'>317</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/eventfd.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/eventfd.c</a></td><td class='right'>141</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 98.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/eventpoll.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/eventpoll.c</a></td><td class='right'>903</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.1%;'/><td class='rem' style='width: 3.0%;'/><td class='none' style='width: 91.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/exec.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exec.c</a></td><td class='right'>792</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.5%;'/><td class='rem' style='width: 3.6%;'/><td class='none' style='width: 92.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/exfat/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exfat/Kconfig</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/exfat/balloc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exfat/balloc.c</a></td><td class='right'>238</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.3%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 97.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/exfat/cache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exfat/cache.c</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/exfat/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exfat/dir.c</a></td><td class='right'>828</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.7%;'/><td class='rem' style='width: 2.8%;'/><td class='none' style='width: 92.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/exfat/exfat_fs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exfat/exfat_fs.h</a></td><td class='right'>186</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.1%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/exfat/exfat_raw.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exfat/exfat_raw.h</a></td><td class='right'>44</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/exfat/fatent.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exfat/fatent.c</a></td><td class='right'>161</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.9%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/exfat/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exfat/file.c</a></td><td class='right'>581</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.2%;'/><td class='rem' style='width: 1.1%;'/><td class='none' style='width: 94.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/exfat/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exfat/inode.c</a></td><td class='right'>378</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.0%;'/><td class='rem' style='width: 1.4%;'/><td class='none' style='width: 96.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/exfat/misc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exfat/misc.c</a></td><td class='right'>38</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/exfat/namei.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exfat/namei.c</a></td><td class='right'>820</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.3%;'/><td class='rem' style='width: 4.1%;'/><td class='none' style='width: 92.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/exfat/nls.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exfat/nls.c</a></td><td class='right'>33</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/exfat/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exfat/super.c</a></td><td class='right'>325</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.9%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 97.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/exportfs/expfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exportfs/expfs.c</a></td><td class='right'>132</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext2/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/Kconfig</a></td><td class='right'>16</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext2/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/Makefile</a></td><td class='right'>5</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext2/acl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/acl.c</a></td><td class='right'>7</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext2/acl.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/acl.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext2/balloc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/balloc.c</a></td><td class='right'>170</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 98.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext2/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/dir.c</a></td><td class='right'>354</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.6%;'/><td class='rem' style='width: 1.6%;'/><td class='none' style='width: 96.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext2/ext2.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/ext2.h</a></td><td class='right'>71</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext2/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/file.c</a></td><td class='right'>151</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.3%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext2/ialloc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/ialloc.c</a></td><td class='right'>15</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext2/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/inode.c</a></td><td class='right'>235</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 1.2%;'/><td class='none' style='width: 97.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext2/ioctl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/ioctl.c</a></td><td class='right'>14</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext2/namei.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/namei.c</a></td><td class='right'>122</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext2/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/super.c</a></td><td class='right'>699</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.5%;'/><td class='rem' style='width: 2.8%;'/><td class='none' style='width: 93.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/ext2/trace.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/trace.c</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/ext2/trace.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/trace.h</a></td><td class='right'>94</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext2/xattr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/xattr.c</a></td><td class='right'>211</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.9%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 98.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext2/xattr.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/xattr.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext2/xattr_security.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/xattr_security.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext2/xattr_trusted.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/xattr_trusted.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext2/xattr_user.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/xattr_user.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/Kconfig</a></td><td class='right'>31</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/Makefile</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/acl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/acl.c</a></td><td class='right'>17</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/acl.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/acl.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/balloc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/balloc.c</a></td><td class='right'>198</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/bitmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/bitmap.c</a></td><td class='right'>37</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/block_validity.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/block_validity.c</a></td><td class='right'>41</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/ext4/crypto.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/crypto.c</a></td><td class='right'>241</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/dir.c</a></td><td class='right'>95</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/ext4.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/ext4.h</a></td><td class='right'>995</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.7%;'/><td class='rem' style='width: 4.2%;'/><td class='none' style='width: 91.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/ext4_extents.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/ext4_extents.h</a></td><td class='right'>7</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/ext4_jbd2.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/ext4_jbd2.c</a></td><td class='right'>53</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/ext4_jbd2.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/ext4_jbd2.h</a></td><td class='right'>129</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/extents.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/extents.c</a></td><td class='right'>1945</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 9.1%;'/><td class='rem' style='width: 8.4%;'/><td class='none' style='width: 82.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/extents_status.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/extents_status.c</a></td><td class='right'>737</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.9%;'/><td class='rem' style='width: 2.7%;'/><td class='none' style='width: 93.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/extents_status.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/extents_status.h</a></td><td class='right'>44</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/fast_commit.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/fast_commit.c</a></td><td class='right'>1353</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 6.7%;'/><td class='rem' style='width: 5.4%;'/><td class='none' style='width: 87.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/fast_commit.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/fast_commit.h</a></td><td class='right'>42</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/file.c</a></td><td class='right'>450</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.2%;'/><td class='rem' style='width: 1.8%;'/><td class='none' style='width: 96.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/fsmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/fsmap.c</a></td><td class='right'>90</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/fsync.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/fsync.c</a></td><td class='right'>62</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/hash.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/hash.c</a></td><td class='right'>14</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/ialloc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/ialloc.c</a></td><td class='right'>118</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/indirect.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/indirect.c</a></td><td class='right'>26</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/inline.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/inline.c</a></td><td class='right'>656</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.8%;'/><td class='rem' style='width: 3.1%;'/><td class='none' style='width: 94.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/inode-test.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/inode-test.c</a></td><td class='right'>7</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/inode.c</a></td><td class='right'>3560</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 18.6%;'/><td class='rem' style='width: 13.4%;'/><td class='none' style='width: 68.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/ioctl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/ioctl.c</a></td><td class='right'>966</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.3%;'/><td class='rem' style='width: 1.4%;'/><td class='none' style='width: 91.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/ext4/mballoc-test.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/mballoc-test.c</a></td><td class='right'>999</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 9.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 91.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/mballoc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/mballoc.c</a></td><td class='right'>4062</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 21.2%;'/><td class='rem' style='width: 15.3%;'/><td class='none' style='width: 63.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/mballoc.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/mballoc.h</a></td><td class='right'>67</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/migrate.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/migrate.c</a></td><td class='right'>53</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/mmp.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/mmp.c</a></td><td class='right'>72</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/move_extent.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/move_extent.c</a></td><td class='right'>917</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.9%;'/><td class='rem' style='width: 4.3%;'/><td class='none' style='width: 91.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/namei.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/namei.c</a></td><td class='right'>986</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.9%;'/><td class='rem' style='width: 4.0%;'/><td class='none' style='width: 91.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/orphan.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/orphan.c</a></td><td class='right'>77</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/page-io.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/page-io.c</a></td><td class='right'>240</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 97.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/readpage.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/readpage.c</a></td><td class='right'>158</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/resize.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/resize.c</a></td><td class='right'>272</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.5%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 97.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/super.c</a></td><td class='right'>4693</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 25.0%;'/><td class='rem' style='width: 17.2%;'/><td class='none' style='width: 57.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/symlink.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/symlink.c</a></td><td class='right'>72</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/sysfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/sysfs.c</a></td><td class='right'>225</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 98.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/verity.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/verity.c</a></td><td class='right'>66</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/xattr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/xattr.c</a></td><td class='right'>810</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.1%;'/><td class='rem' style='width: 3.2%;'/><td class='none' style='width: 92.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/xattr.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/xattr.h</a></td><td class='right'>35</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/xattr_hurd.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/xattr_hurd.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/xattr_security.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/xattr_security.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/xattr_trusted.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/xattr_trusted.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ext4/xattr_user.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/xattr_user.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/Kconfig</a></td><td class='right'>12</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/acl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/acl.c</a></td><td class='right'>55</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/acl.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/acl.h</a></td><td class='right'>10</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/checkpoint.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/checkpoint.c</a></td><td class='right'>721</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.6%;'/><td class='rem' style='width: 2.9%;'/><td class='none' style='width: 93.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/compress.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/compress.c</a></td><td class='right'>1171</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.7%;'/><td class='rem' style='width: 4.8%;'/><td class='none' style='width: 89.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/data.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/data.c</a></td><td class='right'>3009</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 13.4%;'/><td class='rem' style='width: 13.7%;'/><td class='none' style='width: 73.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/debug.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/debug.c</a></td><td class='right'>444</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.9%;'/><td class='rem' style='width: 1.1%;'/><td class='none' style='width: 96.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/dir.c</a></td><td class='right'>532</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.3%;'/><td class='rem' style='width: 2.5%;'/><td class='none' style='width: 95.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/extent_cache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/extent_cache.c</a></td><td class='right'>1067</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 6.3%;'/><td class='rem' style='width: 3.3%;'/><td class='none' style='width: 90.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/f2fs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/f2fs.h</a></td><td class='right'>2455</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 13.7%;'/><td class='rem' style='width: 8.3%;'/><td class='none' style='width: 77.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/file.c</a></td><td class='right'>2501</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 15.5%;'/><td class='rem' style='width: 7.0%;'/><td class='none' style='width: 77.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/gc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/gc.c</a></td><td class='right'>1230</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 6.8%;'/><td class='rem' style='width: 4.2%;'/><td class='none' style='width: 88.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/gc.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/gc.h</a></td><td class='right'>77</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/hash.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/hash.c</a></td><td class='right'>13</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/inline.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/inline.c</a></td><td class='right'>437</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.1%;'/><td class='rem' style='width: 1.8%;'/><td class='none' style='width: 96.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/inode.c</a></td><td class='right'>685</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.8%;'/><td class='rem' style='width: 2.3%;'/><td class='none' style='width: 93.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/iostat.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/iostat.c</a></td><td class='right'>222</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.1%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 98.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/iostat.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/iostat.h</a></td><td class='right'>23</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/namei.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/namei.c</a></td><td class='right'>832</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.7%;'/><td class='rem' style='width: 3.7%;'/><td class='none' style='width: 92.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/node.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/node.c</a></td><td class='right'>1512</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.2%;'/><td class='rem' style='width: 6.4%;'/><td class='none' style='width: 86.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/node.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/node.h</a></td><td class='right'>123</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/recovery.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/recovery.c</a></td><td class='right'>477</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.5%;'/><td class='rem' style='width: 1.8%;'/><td class='none' style='width: 95.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/segment.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/segment.c</a></td><td class='right'>2862</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 15.0%;'/><td class='rem' style='width: 10.7%;'/><td class='none' style='width: 74.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/segment.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/segment.h</a></td><td class='right'>422</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.6%;'/><td class='rem' style='width: 1.2%;'/><td class='none' style='width: 96.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/shrinker.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/shrinker.c</a></td><td class='right'>124</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/super.c</a></td><td class='right'>3800</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 21.5%;'/><td class='rem' style='width: 12.6%;'/><td class='none' style='width: 65.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/sysfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/sysfs.c</a></td><td class='right'>1166</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 8.7%;'/><td class='rem' style='width: 1.8%;'/><td class='none' style='width: 89.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/verity.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/verity.c</a></td><td class='right'>63</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/xattr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/xattr.c</a></td><td class='right'>287</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.4%;'/><td class='rem' style='width: 1.2%;'/><td class='none' style='width: 97.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/f2fs/xattr.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/xattr.h</a></td><td class='right'>33</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fat/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fat/Kconfig</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fat/cache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fat/cache.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fat/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fat/dir.c</a></td><td class='right'>29</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fat/fat.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fat/fat.h</a></td><td class='right'>39</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fat/fat_test.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fat/fat_test.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fat/fatent.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fat/fatent.c</a></td><td class='right'>9</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fat/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fat/file.c</a></td><td class='right'>58</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fat/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fat/inode.c</a></td><td class='right'>779</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.5%;'/><td class='rem' style='width: 3.5%;'/><td class='none' style='width: 93.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fat/misc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fat/misc.c</a></td><td class='right'>92</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fat/namei_msdos.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fat/namei_msdos.c</a></td><td class='right'>52</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fat/namei_vfat.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fat/namei_vfat.c</a></td><td class='right'>312</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.2%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 97.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fat/nfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fat/nfs.c</a></td><td class='right'>11</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fcntl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fcntl.c</a></td><td class='right'>426</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.5%;'/><td class='rem' style='width: 1.4%;'/><td class='none' style='width: 96.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fhandle.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fhandle.c</a></td><td class='right'>382</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.6%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 96.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/file.c</a></td><td class='right'>968</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.5%;'/><td class='rem' style='width: 3.2%;'/><td class='none' style='width: 91.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/file_attr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/file_attr.c</a></td><td class='right'>490</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 95.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/file_table.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/file_table.c</a></td><td class='right'>424</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.9%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 96.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/filesystems.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/filesystems.c</a></td><td class='right'>14</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/freevxfs/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/Kconfig</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/freevxfs/vxfs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/vxfs.h</a></td><td class='right'>27</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/freevxfs/vxfs_bmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/vxfs_bmap.c</a></td><td class='right'>34</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/freevxfs/vxfs_dir.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/vxfs_dir.h</a></td><td class='right'>29</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/freevxfs/vxfs_extern.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/vxfs_extern.h</a></td><td class='right'>27</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/freevxfs/vxfs_fshead.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/vxfs_fshead.c</a></td><td class='right'>26</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/freevxfs/vxfs_fshead.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/vxfs_fshead.h</a></td><td class='right'>27</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/freevxfs/vxfs_immed.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/vxfs_immed.c</a></td><td class='right'>78</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/freevxfs/vxfs_inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/vxfs_inode.c</a></td><td class='right'>37</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/freevxfs/vxfs_inode.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/vxfs_inode.h</a></td><td class='right'>27</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/freevxfs/vxfs_lookup.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/vxfs_lookup.c</a></td><td class='right'>29</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/freevxfs/vxfs_olt.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/vxfs_olt.c</a></td><td class='right'>26</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/freevxfs/vxfs_olt.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/vxfs_olt.h</a></td><td class='right'>27</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/freevxfs/vxfs_subr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/vxfs_subr.c</a></td><td class='right'>55</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/freevxfs/vxfs_super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/vxfs_super.c</a></td><td class='right'>103</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fs-writeback.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fs-writeback.c</a></td><td class='right'>803</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.5%;'/><td class='rem' style='width: 2.7%;'/><td class='none' style='width: 92.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fs_context.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fs_context.c</a></td><td class='right'>98</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/fs_dirent.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fs_dirent.c</a> (renamed from fs/fs_types.c)</td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fs_parser.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fs_parser.c</a></td><td class='right'>151</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fs_struct.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fs_struct.c</a></td><td class='right'>46</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/fscache/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fscache/Kconfig</a></td><td class='right'>40</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/fscache/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fscache/Makefile</a></td><td class='right'>20</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/fscache/cache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fscache/cache.c</a></td><td class='right'>416</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 3.7%;'/><td class='none' style='width: 96.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/fscache/cookie.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fscache/cookie.c</a></td><td class='right'>1071</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 9.6%;'/><td class='none' style='width: 90.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/fscache/fsdef.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fscache/fsdef.c</a></td><td class='right'>98</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/fscache/internal.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fscache/internal.h</a></td><td class='right'>461</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 4.1%;'/><td class='none' style='width: 95.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/fscache/io.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fscache/io.c</a></td><td class='right'>116</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/fscache/main.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fscache/main.c</a></td><td class='right'>230</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 2.1%;'/><td class='none' style='width: 97.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/fscache/netfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fscache/netfs.c</a></td><td class='right'>74</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/fscache/object.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fscache/object.c</a></td><td class='right'>1125</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 10.1%;'/><td class='none' style='width: 89.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/fscache/operation.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fscache/operation.c</a></td><td class='right'>633</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 5.7%;'/><td class='none' style='width: 94.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/fscache/page.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fscache/page.c</a></td><td class='right'>1242</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 11.2%;'/><td class='none' style='width: 88.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/fscache/proc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fscache/proc.c</a></td><td class='right'>71</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/fscache/stats.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fscache/stats.c</a></td><td class='right'>283</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 2.5%;'/><td class='none' style='width: 97.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fsopen.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fsopen.c</a></td><td class='right'>206</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.1%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 98.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fuse/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/Kconfig</a></td><td class='right'>28</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fuse/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/Makefile</a></td><td class='right'>10</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fuse/acl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/acl.c</a></td><td class='right'>71</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/fuse/backing.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/backing.c</a></td><td class='right'>179</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.6%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fuse/control.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/control.c</a></td><td class='right'>89</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fuse/cuse.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/cuse.c</a></td><td class='right'>48</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fuse/dax.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/dax.c</a></td><td class='right'>123</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fuse/dev.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/dev.c</a></td><td class='right'>1159</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.1%;'/><td class='rem' style='width: 3.3%;'/><td class='none' style='width: 89.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/fuse/dev_uring.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/dev_uring.c</a></td><td class='right'>1373</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 12.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 87.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/fuse/dev_uring_i.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/dev_uring_i.h</a></td><td class='right'>211</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fuse/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/dir.c</a></td><td class='right'>1072</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.5%;'/><td class='rem' style='width: 2.1%;'/><td class='none' style='width: 90.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fuse/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/file.c</a></td><td class='right'>1866</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 8.5%;'/><td class='rem' style='width: 8.3%;'/><td class='none' style='width: 83.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/fuse/fuse_dev_i.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/fuse_dev_i.h</a></td><td class='right'>79</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fuse/fuse_i.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/fuse_i.h</a></td><td class='right'>516</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.8%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 95.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/fuse/fuse_trace.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/fuse_trace.h</a></td><td class='right'>132</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fuse/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/inode.c</a></td><td class='right'>660</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.6%;'/><td class='rem' style='width: 1.4%;'/><td class='none' style='width: 94.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fuse/ioctl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/ioctl.c</a></td><td class='right'>148</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.1%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 98.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/fuse/iomode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/iomode.c</a></td><td class='right'>275</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.5%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/fuse/passthrough.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/passthrough.c</a></td><td class='right'>197</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fuse/readdir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/readdir.c</a></td><td class='right'>93</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/fuse/sysctl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/sysctl.c</a></td><td class='right'>64</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/fuse/trace.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/trace.c</a></td><td class='right'>13</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fuse/virtio_fs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/virtio_fs.c</a></td><td class='right'>626</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.1%;'/><td class='rem' style='width: 1.5%;'/><td class='none' style='width: 94.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/fuse/xattr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/xattr.c</a></td><td class='right'>66</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/Kconfig</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/acl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/acl.c</a></td><td class='right'>7</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/acl.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/acl.h</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/aops.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/aops.c</a></td><td class='right'>463</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.8%;'/><td class='rem' style='width: 2.4%;'/><td class='none' style='width: 95.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/aops.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/aops.h</a></td><td class='right'>5</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/bmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/bmap.c</a></td><td class='right'>211</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 98.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/bmap.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/bmap.h</a></td><td class='right'>40</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/dentry.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/dentry.c</a></td><td class='right'>31</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/dir.c</a></td><td class='right'>61</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/dir.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/dir.h</a></td><td class='right'>38</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/export.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/export.c</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/file.c</a></td><td class='right'>398</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.9%;'/><td class='rem' style='width: 1.6%;'/><td class='none' style='width: 96.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/glock.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/glock.c</a></td><td class='right'>1682</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.8%;'/><td class='rem' style='width: 7.4%;'/><td class='none' style='width: 84.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/glock.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/glock.h</a></td><td class='right'>223</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 1.2%;'/><td class='none' style='width: 98.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/glops.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/glops.c</a></td><td class='right'>362</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 2.1%;'/><td class='none' style='width: 96.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/glops.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/glops.h</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/incore.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/incore.h</a></td><td class='right'>85</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/inode.c</a></td><td class='right'>517</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.8%;'/><td class='rem' style='width: 1.8%;'/><td class='none' style='width: 95.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/inode.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/inode.h</a></td><td class='right'>62</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/lock_dlm.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/lock_dlm.c</a></td><td class='right'>253</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.4%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 97.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/log.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/log.c</a></td><td class='right'>158</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/log.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/log.h</a></td><td class='right'>57</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/lops.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/lops.c</a></td><td class='right'>173</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 98.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/lops.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/lops.h</a></td><td class='right'>22</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/main.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/main.c</a></td><td class='right'>56</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/meta_io.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/meta_io.c</a></td><td class='right'>167</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 98.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/meta_io.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/meta_io.h</a></td><td class='right'>30</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/ops_fstype.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/ops_fstype.c</a></td><td class='right'>340</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.8%;'/><td class='rem' style='width: 1.2%;'/><td class='none' style='width: 96.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/quota.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/quota.c</a></td><td class='right'>862</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.0%;'/><td class='rem' style='width: 3.7%;'/><td class='none' style='width: 92.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/quota.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/quota.h</a></td><td class='right'>44</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/recovery.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/recovery.c</a></td><td class='right'>88</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/recovery.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/recovery.h</a></td><td class='right'>20</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/rgrp.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/rgrp.c</a></td><td class='right'>82</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/rgrp.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/rgrp.h</a></td><td class='right'>84</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/super.c</a></td><td class='right'>600</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.8%;'/><td class='rem' style='width: 2.6%;'/><td class='none' style='width: 94.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/super.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/super.h</a></td><td class='right'>51</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/sys.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/sys.c</a></td><td class='right'>94</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/trace_gfs2.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/trace_gfs2.h</a></td><td class='right'>16</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/trans.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/trans.c</a></td><td class='right'>62</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/trans.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/trans.h</a></td><td class='right'>26</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/util.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/util.c</a></td><td class='right'>435</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.4%;'/><td class='rem' style='width: 2.5%;'/><td class='none' style='width: 96.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/util.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/util.h</a></td><td class='right'>98</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/xattr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/xattr.c</a></td><td class='right'>85</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/gfs2/xattr.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/xattr.h</a></td><td class='right'>12</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/hfs/.kunitconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/.kunitconfig</a></td><td class='right'>7</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfs/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/Kconfig</a></td><td class='right'>17</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfs/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/Makefile</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfs/attr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/attr.c</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfs/bfind.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/bfind.c</a></td><td class='right'>17</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfs/bitmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/bitmap.c</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfs/bnode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/bnode.c</a></td><td class='right'>196</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.3%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfs/brec.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/brec.c</a></td><td class='right'>37</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfs/btree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/btree.c</a></td><td class='right'>90</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfs/btree.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/btree.h</a></td><td class='right'>113</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfs/catalog.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/catalog.c</a></td><td class='right'>137</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfs/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/dir.c</a></td><td class='right'>16</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfs/extent.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/extent.c</a></td><td class='right'>33</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfs/hfs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/hfs.h</a></td><td class='right'>269</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 2.4%;'/><td class='none' style='width: 97.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfs/hfs_fs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/hfs_fs.h</a></td><td class='right'>129</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/inode.c</a></td><td class='right'>129</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfs/mdb.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/mdb.c</a></td><td class='right'>22</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfs/string.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/string.c</a></td><td class='right'>5</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/hfs/string_test.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/string_test.c</a></td><td class='right'>133</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfs/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/super.c</a></td><td class='right'>355</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.5%;'/><td class='rem' style='width: 1.7%;'/><td class='none' style='width: 96.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfs/sysdep.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/sysdep.c</a></td><td class='right'>13</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfs/trans.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/trans.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/hfsplus/.kunitconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/.kunitconfig</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfsplus/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/Kconfig</a></td><td class='right'>17</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfsplus/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/Makefile</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfsplus/attributes.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/attributes.c</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfsplus/bfind.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/bfind.c</a></td><td class='right'>29</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfsplus/bitmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/bitmap.c</a></td><td class='right'>30</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfsplus/bnode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/bnode.c</a></td><td class='right'>250</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.3%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 97.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfsplus/brec.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/brec.c</a></td><td class='right'>12</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfsplus/btree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/btree.c</a></td><td class='right'>39</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfsplus/catalog.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/catalog.c</a></td><td class='right'>14</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfsplus/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/dir.c</a></td><td class='right'>31</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfsplus/extents.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/extents.c</a></td><td class='right'>57</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfsplus/hfsplus_fs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/hfsplus_fs.h</a></td><td class='right'>157</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.9%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfsplus/hfsplus_raw.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/hfsplus_raw.h</a></td><td class='right'>390</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 3.5%;'/><td class='none' style='width: 96.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfsplus/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/inode.c</a></td><td class='right'>187</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.1%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfsplus/ioctl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/ioctl.c</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfsplus/options.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/options.c</a></td><td class='right'>260</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.9%;'/><td class='rem' style='width: 1.5%;'/><td class='none' style='width: 97.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfsplus/part_tbl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/part_tbl.c</a></td><td class='right'>5</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfsplus/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/super.c</a></td><td class='right'>234</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.4%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 97.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfsplus/unicode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/unicode.c</a></td><td class='right'>63</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/hfsplus/unicode_test.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/unicode_test.c</a></td><td class='right'>1579</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 14.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 85.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfsplus/wrapper.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/wrapper.c</a></td><td class='right'>64</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfsplus/xattr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/xattr.c</a></td><td class='right'>88</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfsplus/xattr.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/xattr.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfsplus/xattr_security.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/xattr_security.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfsplus/xattr_trusted.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/xattr_trusted.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hfsplus/xattr_user.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/xattr_user.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hostfs/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hostfs/Makefile</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hostfs/hostfs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hostfs/hostfs.h</a></td><td class='right'>42</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hostfs/hostfs_kern.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hostfs/hostfs_kern.c</a></td><td class='right'>541</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.8%;'/><td class='rem' style='width: 2.0%;'/><td class='none' style='width: 95.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hostfs/hostfs_user.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hostfs/hostfs_user.c</a></td><td class='right'>57</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/hostfs/hostfs_user_exp.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hostfs/hostfs_user_exp.c</a></td><td class='right'>28</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hpfs/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hpfs/Kconfig</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hpfs/anode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hpfs/anode.c</a></td><td class='right'>43</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hpfs/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hpfs/dir.c</a></td><td class='right'>20</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hpfs/ea.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hpfs/ea.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hpfs/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hpfs/file.c</a></td><td class='right'>45</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hpfs/hpfs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hpfs/hpfs.h</a></td><td class='right'>44</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hpfs/hpfs_fn.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hpfs/hpfs_fn.h</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hpfs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hpfs/inode.c</a></td><td class='right'>28</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hpfs/map.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hpfs/map.c</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hpfs/namei.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hpfs/namei.c</a></td><td class='right'>85</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hpfs/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hpfs/super.c</a></td><td class='right'>433</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.9%;'/><td class='rem' style='width: 2.0%;'/><td class='none' style='width: 96.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/hugetlbfs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hugetlbfs/inode.c</a></td><td class='right'>967</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.7%;'/><td class='rem' style='width: 4.0%;'/><td class='none' style='width: 91.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/init.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/init.c</a></td><td class='right'>48</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/inode.c</a></td><td class='right'>1580</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 10.1%;'/><td class='rem' style='width: 4.1%;'/><td class='none' style='width: 85.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/internal.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/internal.h</a></td><td class='right'>238</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.8%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 97.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/io-wq.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/io-wq.c</a></td><td class='right'>1362</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 12.2%;'/><td class='none' style='width: 87.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/io-wq.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/io-wq.h</a></td><td class='right'>205</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.8%;'/><td class='none' style='width: 98.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/io_uring.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/io_uring.c</a></td><td class='right'>11127</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 100.0%;'/><td class='none' style='width: 0.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ioctl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ioctl.c</a></td><td class='right'>411</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 3.1%;'/><td class='none' style='width: 96.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/iomap/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/iomap/Makefile</a></td><td class='right'>12</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/iomap/bio.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/iomap/bio.c</a></td><td class='right'>88</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/iomap/buffered-io.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/iomap/buffered-io.c</a></td><td class='right'>2456</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 12.8%;'/><td class='rem' style='width: 9.2%;'/><td class='none' style='width: 77.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/iomap/direct-io.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/iomap/direct-io.c</a></td><td class='right'>587</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.4%;'/><td class='rem' style='width: 1.9%;'/><td class='none' style='width: 94.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/iomap/fiemap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/iomap/fiemap.c</a></td><td class='right'>25</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/iomap/internal.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/iomap/internal.h</a></td><td class='right'>21</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/iomap/ioend.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/iomap/ioend.c</a></td><td class='right'>432</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 96.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/iomap/iter.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/iomap/iter.c</a></td><td class='right'>82</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/iomap/seek.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/iomap/seek.c</a></td><td class='right'>20</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/iomap/swapfile.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/iomap/swapfile.c</a></td><td class='right'>11</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/iomap/trace.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/iomap/trace.h</a></td><td class='right'>157</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.3%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/isofs/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/isofs/Kconfig</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/isofs/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/isofs/Makefile</a></td><td class='right'>7</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/isofs/compress.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/isofs/compress.c</a></td><td class='right'>39</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/isofs/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/isofs/dir.c</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/isofs/export.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/isofs/export.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/isofs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/isofs/inode.c</a></td><td class='right'>535</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.5%;'/><td class='rem' style='width: 2.3%;'/><td class='none' style='width: 95.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/isofs/isofs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/isofs/isofs.h</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/isofs/rock.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/isofs/rock.c</a></td><td class='right'>72</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/isofs/rock.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/isofs/rock.h</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/isofs/util.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/isofs/util.c</a></td><td class='right'>49</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jbd2/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jbd2/Kconfig</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jbd2/checkpoint.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jbd2/checkpoint.c</a></td><td class='right'>348</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 2.0%;'/><td class='none' style='width: 96.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jbd2/commit.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jbd2/commit.c</a></td><td class='right'>181</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 98.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jbd2/journal.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jbd2/journal.c</a></td><td class='right'>1013</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.5%;'/><td class='rem' style='width: 4.6%;'/><td class='none' style='width: 90.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jbd2/recovery.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jbd2/recovery.c</a></td><td class='right'>487</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.5%;'/><td class='rem' style='width: 1.9%;'/><td class='none' style='width: 95.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jbd2/revoke.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jbd2/revoke.c</a></td><td class='right'>46</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jbd2/transaction.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jbd2/transaction.c</a></td><td class='right'>409</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.8%;'/><td class='rem' style='width: 1.9%;'/><td class='none' style='width: 96.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/Kconfig</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/acl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/acl.c</a></td><td class='right'>5</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/acl.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/acl.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/background.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/background.c</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/build.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/build.c</a></td><td class='right'>9</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/compr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/compr.c</a></td><td class='right'>50</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/compr.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/compr.h</a></td><td class='right'>26</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/compr_rtime.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/compr_rtime.c</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/compr_rubin.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/compr_rubin.c</a></td><td class='right'>5</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/debug.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/debug.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/dir.c</a></td><td class='right'>65</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/erase.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/erase.c</a></td><td class='right'>17</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/file.c</a></td><td class='right'>189</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.9%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 98.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/fs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/fs.c</a></td><td class='right'>45</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/gc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/gc.c</a></td><td class='right'>29</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/jffs2_fs_i.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/jffs2_fs_i.h</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/malloc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/malloc.c</a></td><td class='right'>32</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/nodemgmt.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/nodemgmt.c</a></td><td class='right'>41</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/os-linux.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/os-linux.h</a></td><td class='right'>10</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/readinode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/readinode.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/scan.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/scan.c</a></td><td class='right'>10</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/security.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/security.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/summary.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/summary.c</a></td><td class='right'>7</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/super.c</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/wbuf.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/wbuf.c</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/xattr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/xattr.c</a></td><td class='right'>47</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/xattr.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/xattr.h</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/xattr_trusted.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/xattr_trusted.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jffs2/xattr_user.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/xattr_user.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/Kconfig</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/Makefile</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/acl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/acl.c</a></td><td class='right'>7</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/file.c</a></td><td class='right'>25</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/inode.c</a></td><td class='right'>80</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/ioctl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/ioctl.c</a></td><td class='right'>13</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/jfs_acl.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_acl.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/jfs_dinode.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_dinode.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/jfs_discard.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_discard.c</a></td><td class='right'>14</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/jfs_dmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_dmap.c</a></td><td class='right'>208</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.9%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 98.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/jfs_dtree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_dtree.c</a></td><td class='right'>343</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 2.7%;'/><td class='none' style='width: 96.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/jfs_extent.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_extent.c</a></td><td class='right'>272</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 2.3%;'/><td class='none' style='width: 97.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/jfs_extent.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_extent.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/jfs_filsys.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_filsys.h</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/jfs_imap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_imap.c</a></td><td class='right'>63</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/jfs_incore.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_incore.h</a></td><td class='right'>10</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/jfs_inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_inode.c</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/jfs_inode.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_inode.h</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/jfs_logmgr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_logmgr.c</a></td><td class='right'>55</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/jfs_logmgr.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_logmgr.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/jfs_metapage.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_metapage.c</a></td><td class='right'>487</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.8%;'/><td class='rem' style='width: 1.6%;'/><td class='none' style='width: 95.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/jfs_metapage.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_metapage.h</a></td><td class='right'>16</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/jfs_mount.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_mount.c</a></td><td class='right'>27</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/jfs_txnmgr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_txnmgr.c</a></td><td class='right'>56</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/jfs_umount.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_umount.c</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/jfs_unicode.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_unicode.h</a></td><td class='right'>17</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/jfs/jfs_uniupr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_uniupr.c</a></td><td class='right'>121</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.1%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/jfs_xattr.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_xattr.h</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/jfs_xtree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_xtree.c</a></td><td class='right'>1101</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 9.2%;'/><td class='none' style='width: 90.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/jfs_xtree.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_xtree.h</a></td><td class='right'>45</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/namei.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/namei.c</a></td><td class='right'>65</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/super.c</a></td><td class='right'>492</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.3%;'/><td class='rem' style='width: 2.1%;'/><td class='none' style='width: 95.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/jfs/xattr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/xattr.c</a></td><td class='right'>50</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/kernel_read_file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/kernel_read_file.c</a></td><td class='right'>60</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/kernfs/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/kernfs/dir.c</a></td><td class='right'>719</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.1%;'/><td class='rem' style='width: 2.4%;'/><td class='none' style='width: 93.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/kernfs/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/kernfs/file.c</a></td><td class='right'>436</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.3%;'/><td class='rem' style='width: 1.6%;'/><td class='none' style='width: 96.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/kernfs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/kernfs/inode.c</a></td><td class='right'>181</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.9%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 98.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/kernfs/kernfs-internal.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/kernfs/kernfs-internal.h</a></td><td class='right'>83</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/kernfs/mount.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/kernfs/mount.c</a></td><td class='right'>133</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.9%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/kernfs/symlink.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/kernfs/symlink.c</a></td><td class='right'>35</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ksmbd/connection.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ksmbd/connection.h</a></td><td class='right'>213</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.9%;'/><td class='none' style='width: 98.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ksmbd/ksmbd_work.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ksmbd/ksmbd_work.c</a></td><td class='right'>80</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ksmbd/mgmt/user_config.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ksmbd/mgmt/user_config.c</a></td><td class='right'>69</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ksmbd/mgmt/user_session.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ksmbd/mgmt/user_session.c</a></td><td class='right'>369</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 3.3%;'/><td class='none' style='width: 96.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ksmbd/smb2pdu.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ksmbd/smb2pdu.h</a></td><td class='right'>1708</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 15.4%;'/><td class='none' style='width: 84.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ksmbd/smb_common.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ksmbd/smb_common.h</a></td><td class='right'>534</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 4.8%;'/><td class='none' style='width: 95.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ksmbd/smbacl.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ksmbd/smbacl.h</a></td><td class='right'>237</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 2.1%;'/><td class='none' style='width: 97.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ksmbd/smbstatus.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ksmbd/smbstatus.h</a></td><td class='right'>1822</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 16.4%;'/><td class='none' style='width: 83.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ksmbd/transport_rdma.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ksmbd/transport_rdma.c</a></td><td class='right'>2074</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 18.6%;'/><td class='none' style='width: 81.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ksmbd/transport_rdma.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ksmbd/transport_rdma.h</a></td><td class='right'>63</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/libfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/libfs.c</a></td><td class='right'>1321</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 9.6%;'/><td class='rem' style='width: 2.3%;'/><td class='none' style='width: 88.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/lockd/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/Makefile</a></td><td class='right'>11</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/lockd/clnt4xdr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/clnt4xdr.c</a></td><td class='right'>23</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/lockd/clntlock.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/clntlock.c</a></td><td class='right'>66</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/lockd/clntproc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/clntproc.c</a></td><td class='right'>108</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/lockd/clntxdr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/clntxdr.c</a></td><td class='right'>19</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/lockd/host.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/host.c</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/lockd/mon.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/mon.c</a></td><td class='right'>5</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/lockd/netlink.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/netlink.c</a></td><td class='right'>45</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/lockd/netlink.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/netlink.h</a></td><td class='right'>20</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/lockd/netns.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/netns.h</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/lockd/svc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/svc.c</a></td><td class='right'>451</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.8%;'/><td class='rem' style='width: 2.2%;'/><td class='none' style='width: 95.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/lockd/svc4proc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/svc4proc.c</a></td><td class='right'>59</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/lockd/svclock.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/svclock.c</a></td><td class='right'>174</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/lockd/svcproc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/svcproc.c</a></td><td class='right'>51</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/lockd/svcshare.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/svcshare.c</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/lockd/svcsubs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/svcsubs.c</a></td><td class='right'>49</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/lockd/trace.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/trace.c</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/lockd/trace.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/trace.h</a></td><td class='right'>106</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/lockd/xdr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/xdr.c</a></td><td class='right'>14</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/lockd/xdr4.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/xdr4.c</a></td><td class='right'>46</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/locks.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/locks.c</a></td><td class='right'>1292</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 6.7%;'/><td class='rem' style='width: 4.9%;'/><td class='none' style='width: 88.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/mbcache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/mbcache.c</a></td><td class='right'>162</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 98.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/minix/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/minix/Kconfig</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/minix/bitmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/minix/bitmap.c</a></td><td class='right'>20</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/minix/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/minix/dir.c</a></td><td class='right'>225</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 1.1%;'/><td class='none' style='width: 98.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/minix/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/minix/file.c</a></td><td class='right'>10</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/minix/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/minix/inode.c</a></td><td class='right'>141</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/minix/itree_common.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/minix/itree_common.c</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/minix/minix.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/minix/minix.h</a></td><td class='right'>50</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/minix/namei.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/minix/namei.c</a></td><td class='right'>188</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.9%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 98.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/mnt_idmapping.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/mnt_idmapping.c</a></td><td class='right'>387</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.5%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 96.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/mount.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/mount.h</a></td><td class='right'>163</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 98.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/mpage.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/mpage.c</a></td><td class='right'>427</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.6%;'/><td class='rem' style='width: 2.2%;'/><td class='none' style='width: 96.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/namei.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/namei.c</a></td><td class='right'>3202</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 20.2%;'/><td class='rem' style='width: 8.5%;'/><td class='none' style='width: 71.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/namespace.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/namespace.c</a></td><td class='right'>4242</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 26.7%;'/><td class='rem' style='width: 11.4%;'/><td class='none' style='width: 61.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/netfs/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/Kconfig</a></td><td class='right'>37</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/netfs/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/Makefile</a></td><td class='right'>35</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/netfs/buffered_read.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/buffered_read.c</a></td><td class='right'>834</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.5%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 92.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/netfs/buffered_write.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/buffered_write.c</a></td><td class='right'>569</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 94.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/netfs/direct_read.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/direct_read.c</a></td><td class='right'>272</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/netfs/direct_write.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/direct_write.c</a></td><td class='right'>186</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/netfs/fscache_cache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/fscache_cache.c</a></td><td class='right'>429</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 96.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/netfs/fscache_cookie.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/fscache_cookie.c</a></td><td class='right'>1184</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 10.6%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 89.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/netfs/fscache_internal.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/fscache_internal.h</a></td><td class='right'>14</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/netfs/fscache_io.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/fscache_io.c</a></td><td class='right'>290</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.6%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/netfs/fscache_main.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/fscache_main.c</a></td><td class='right'>109</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/netfs/fscache_proc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/fscache_proc.c</a></td><td class='right'>47</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/netfs/fscache_stats.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/fscache_stats.c</a></td><td class='right'>103</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/netfs/fscache_volume.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/fscache_volume.c</a></td><td class='right'>533</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 95.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/netfs/internal.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/internal.h</a></td><td class='right'>442</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 96.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/netfs/iterator.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/iterator.c</a></td><td class='right'>250</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/netfs/locking.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/locking.c</a></td><td class='right'>205</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/netfs/main.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/main.c</a></td><td class='right'>176</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.6%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/netfs/misc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/misc.c</a></td><td class='right'>546</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 95.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/netfs/objects.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/objects.c</a></td><td class='right'>256</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/netfs/read_collect.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/read_collect.c</a></td><td class='right'>585</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 94.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/netfs/read_helper.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/read_helper.c</a></td><td class='right'>1209</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 10.9%;'/><td class='none' style='width: 89.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/netfs/read_pgpriv2.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/read_pgpriv2.c</a></td><td class='right'>232</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/netfs/read_retry.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/read_retry.c</a></td><td class='right'>293</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.6%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/netfs/read_single.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/read_single.c</a></td><td class='right'>195</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/netfs/rolling_buffer.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/rolling_buffer.c</a></td><td class='right'>222</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/netfs/stats.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/stats.c</a></td><td class='right'>74</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/netfs/write_collect.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/write_collect.c</a></td><td class='right'>531</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 95.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/netfs/write_issue.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/write_issue.c</a></td><td class='right'>926</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 8.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 91.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/netfs/write_retry.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/write_retry.c</a></td><td class='right'>230</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/Kconfig</a></td><td class='right'>20</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/Makefile</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/blocklayout/blocklayout.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/blocklayout/blocklayout.c</a></td><td class='right'>94</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/blocklayout/blocklayout.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/blocklayout/blocklayout.h</a></td><td class='right'>11</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/blocklayout/dev.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/blocklayout/dev.c</a></td><td class='right'>220</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 98.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/blocklayout/extent_tree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/blocklayout/extent_tree.c</a></td><td class='right'>104</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/blocklayout/rpc_pipefs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/blocklayout/rpc_pipefs.c</a></td><td class='right'>56</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/callback.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/callback.c</a></td><td class='right'>171</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 1.2%;'/><td class='none' style='width: 98.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/callback.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/callback.h</a></td><td class='right'>31</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/callback_proc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/callback_proc.c</a></td><td class='right'>112</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/callback_xdr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/callback_xdr.c</a></td><td class='right'>89</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/client.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/client.c</a></td><td class='right'>250</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.7%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 97.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/delegation.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/delegation.c</a></td><td class='right'>338</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.1%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 97.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/delegation.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/delegation.h</a></td><td class='right'>50</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/dir.c</a></td><td class='right'>1328</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.6%;'/><td class='rem' style='width: 4.3%;'/><td class='none' style='width: 88.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/direct.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/direct.c</a></td><td class='right'>384</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.2%;'/><td class='rem' style='width: 1.2%;'/><td class='none' style='width: 96.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/dns_resolve.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/dns_resolve.c</a></td><td class='right'>19</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/dns_resolve.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/dns_resolve.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/export.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/export.c</a></td><td class='right'>30</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/file.c</a></td><td class='right'>466</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.5%;'/><td class='rem' style='width: 1.7%;'/><td class='none' style='width: 95.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/filelayout/filelayout.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/filelayout/filelayout.c</a></td><td class='right'>62</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/filelayout/filelayout.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/filelayout/filelayout.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/filelayout/filelayoutdev.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/filelayout/filelayoutdev.c</a></td><td class='right'>22</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/flexfilelayout/flexfilelayout.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/flexfilelayout/flexfilelayout.c</a></td><td class='right'>1202</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.7%;'/><td class='rem' style='width: 3.1%;'/><td class='none' style='width: 89.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/flexfilelayout/flexfilelayout.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/flexfilelayout/flexfilelayout.h</a></td><td class='right'>67</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/flexfilelayout/flexfilelayoutdev.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/flexfilelayout/flexfilelayoutdev.c</a></td><td class='right'>139</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/fs_context.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/fs_context.c</a></td><td class='right'>266</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.1%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 97.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/nfs/fscache-index.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/fscache-index.c</a></td><td class='right'>140</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.3%;'/><td class='none' style='width: 98.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/fscache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/fscache.c</a></td><td class='right'>591</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.1%;'/><td class='rem' style='width: 3.3%;'/><td class='none' style='width: 94.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/fscache.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/fscache.h</a></td><td class='right'>266</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 1.4%;'/><td class='none' style='width: 97.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/getroot.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/getroot.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/inode.c</a></td><td class='right'>664</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.5%;'/><td class='rem' style='width: 1.4%;'/><td class='none' style='width: 94.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/internal.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/internal.h</a></td><td class='right'>328</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.3%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 97.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/io.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/io.c</a></td><td class='right'>55</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/iostat.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/iostat.h</a></td><td class='right'>26</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/nfs/localio.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/localio.c</a></td><td class='right'>1072</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 9.6%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 90.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/mount_clnt.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/mount_clnt.c</a></td><td class='right'>75</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/namespace.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/namespace.c</a></td><td class='right'>27</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/netns.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/netns.h</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs.h</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfs2super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs2super.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfs2xdr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs2xdr.c</a></td><td class='right'>75</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfs3_fs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs3_fs.h</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfs3acl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs3acl.c</a></td><td class='right'>22</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfs3client.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs3client.c</a></td><td class='right'>34</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfs3proc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs3proc.c</a></td><td class='right'>110</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfs3super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs3super.c</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfs3xdr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs3xdr.c</a></td><td class='right'>140</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 98.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfs42.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs42.h</a></td><td class='right'>9</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfs42proc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs42proc.c</a></td><td class='right'>364</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.7%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 96.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfs42xattr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs42xattr.c</a></td><td class='right'>150</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfs42xdr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs42xdr.c</a></td><td class='right'>956</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.2%;'/><td class='rem' style='width: 3.4%;'/><td class='none' style='width: 91.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfs4_fs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4_fs.h</a></td><td class='right'>36</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfs4client.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4client.c</a></td><td class='right'>242</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 97.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfs4file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4file.c</a></td><td class='right'>80</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfs4getroot.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4getroot.c</a></td><td class='right'>14</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfs4idmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4idmap.c</a></td><td class='right'>71</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfs4namespace.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4namespace.c</a></td><td class='right'>38</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfs4proc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4proc.c</a></td><td class='right'>1440</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 9.4%;'/><td class='rem' style='width: 3.5%;'/><td class='none' style='width: 87.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfs4renewd.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4renewd.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfs4session.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4session.h</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfs4state.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4state.c</a></td><td class='right'>222</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.4%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfs4super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4super.c</a></td><td class='right'>37</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfs4sysctl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4sysctl.c</a></td><td class='right'>24</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfs4trace.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4trace.c</a></td><td class='right'>11</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfs4trace.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4trace.h</a></td><td class='right'>497</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.9%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 95.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfs4xdr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4xdr.c</a></td><td class='right'>491</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.6%;'/><td class='rem' style='width: 1.8%;'/><td class='none' style='width: 95.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfsroot.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfsroot.c</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/nfstrace.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfstrace.h</a></td><td class='right'>708</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.5%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 93.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/pagelist.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/pagelist.c</a></td><td class='right'>384</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.9%;'/><td class='rem' style='width: 1.6%;'/><td class='none' style='width: 96.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/pnfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/pnfs.c</a></td><td class='right'>460</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.8%;'/><td class='rem' style='width: 1.3%;'/><td class='none' style='width: 95.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/pnfs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/pnfs.h</a></td><td class='right'>77</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/pnfs_dev.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/pnfs_dev.c</a></td><td class='right'>5</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/pnfs_nfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/pnfs_nfs.c</a></td><td class='right'>197</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 98.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/proc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/proc.c</a></td><td class='right'>33</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/read.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/read.c</a></td><td class='right'>261</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 1.1%;'/><td class='none' style='width: 97.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/super.c</a></td><td class='right'>186</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/symlink.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/symlink.c</a></td><td class='right'>40</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/sysctl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/sysctl.c</a></td><td class='right'>23</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/sysfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/sysfs.c</a></td><td class='right'>355</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.8%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 96.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/sysfs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/sysfs.h</a></td><td class='right'>10</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/unlink.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/unlink.c</a></td><td class='right'>25</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs/write.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/write.c</a></td><td class='right'>1005</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.3%;'/><td class='rem' style='width: 4.7%;'/><td class='none' style='width: 91.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs_common/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs_common/Makefile</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/nfs_common/common.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs_common/common.c</a></td><td class='right'>201</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs_common/grace.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs_common/grace.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/nfs_common/localio_trace.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs_common/localio_trace.c</a></td><td class='right'>10</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/nfs_common/localio_trace.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs_common/localio_trace.h</a></td><td class='right'>56</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs_common/nfs_ssc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs_common/nfs_ssc.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfs_common/nfsacl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs_common/nfsacl.c</a></td><td class='right'>9</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/nfs_common/nfslocalio.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs_common/nfslocalio.c</a></td><td class='right'>373</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 96.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/Kconfig</a></td><td class='right'>63</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/Makefile</a></td><td class='right'>27</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/acl.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/acl.h</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/auth.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/auth.c</a></td><td class='right'>21</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/auth.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/auth.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/blocklayout.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/blocklayout.c</a></td><td class='right'>208</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.3%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/blocklayoutxdr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/blocklayoutxdr.c</a></td><td class='right'>221</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.3%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 98.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/blocklayoutxdr.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/blocklayoutxdr.h</a></td><td class='right'>28</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/cache.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/cache.h</a></td><td class='right'>12</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/nfsd/debugfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/debugfs.c</a></td><td class='right'>143</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/export.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/export.c</a></td><td class='right'>270</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.9%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 97.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/export.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/export.h</a></td><td class='right'>23</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/nfsd/fault_inject.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/fault_inject.c</a></td><td class='right'>142</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.3%;'/><td class='none' style='width: 98.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/filecache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/filecache.c</a></td><td class='right'>1441</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 8.0%;'/><td class='rem' style='width: 5.0%;'/><td class='none' style='width: 87.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/filecache.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/filecache.h</a></td><td class='right'>44</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/flexfilelayout.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/flexfilelayout.c</a></td><td class='right'>15</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/flexfilelayoutxdr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/flexfilelayoutxdr.c</a></td><td class='right'>18</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/flexfilelayoutxdr.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/flexfilelayoutxdr.h</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/nfsd/localio.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/localio.c</a></td><td class='right'>217</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/lockd.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/lockd.c</a></td><td class='right'>28</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/nfsd/netlink.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/netlink.c</a></td><td class='right'>114</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/nfsd/netlink.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/netlink.h</a></td><td class='right'>32</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/netns.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/netns.h</a></td><td class='right'>87</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/nfs2acl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfs2acl.c</a></td><td class='right'>60</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/nfs3acl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfs3acl.c</a></td><td class='right'>54</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/nfs3proc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfs3proc.c</a></td><td class='right'>389</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.3%;'/><td class='rem' style='width: 1.2%;'/><td class='none' style='width: 96.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/nfs3xdr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfs3xdr.c</a></td><td class='right'>107</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/nfs4acl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfs4acl.c</a></td><td class='right'>86</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/nfs4callback.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfs4callback.c</a></td><td class='right'>778</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.3%;'/><td class='rem' style='width: 1.7%;'/><td class='none' style='width: 93.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/nfs4idmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfs4idmap.c</a></td><td class='right'>30</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/nfs4layouts.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfs4layouts.c</a></td><td class='right'>123</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/nfs4proc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfs4proc.c</a></td><td class='right'>1567</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 9.2%;'/><td class='rem' style='width: 4.9%;'/><td class='none' style='width: 85.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/nfs4recover.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfs4recover.c</a></td><td class='right'>496</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.7%;'/><td class='rem' style='width: 2.8%;'/><td class='none' style='width: 95.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/nfs4state.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfs4state.c</a></td><td class='right'>3504</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 23.6%;'/><td class='rem' style='width: 7.9%;'/><td class='none' style='width: 68.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/nfs4xdr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfs4xdr.c</a></td><td class='right'>4371</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 22.2%;'/><td class='rem' style='width: 17.1%;'/><td class='none' style='width: 60.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/nfsd/nfs4xdr_gen.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfs4xdr_gen.c</a></td><td class='right'>256</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/nfsd/nfs4xdr_gen.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfs4xdr_gen.h</a></td><td class='right'>25</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/nfscache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfscache.c</a></td><td class='right'>402</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.9%;'/><td class='rem' style='width: 1.7%;'/><td class='none' style='width: 96.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/nfsctl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfsctl.c</a></td><td class='right'>1347</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 9.3%;'/><td class='rem' style='width: 2.8%;'/><td class='none' style='width: 87.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/nfsd.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfsd.h</a></td><td class='right'>161</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/nfsfh.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfsfh.c</a></td><td class='right'>426</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.9%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 96.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/nfsfh.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfsfh.h</a></td><td class='right'>192</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 1.1%;'/><td class='none' style='width: 98.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/nfsproc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfsproc.c</a></td><td class='right'>268</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 1.4%;'/><td class='none' style='width: 97.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/nfssvc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfssvc.c</a></td><td class='right'>738</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.9%;'/><td class='rem' style='width: 3.7%;'/><td class='none' style='width: 93.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/nfsxdr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfsxdr.c</a></td><td class='right'>19</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/pnfs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/pnfs.h</a></td><td class='right'>19</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/state.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/state.h</a></td><td class='right'>273</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.0%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 97.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/stats.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/stats.c</a></td><td class='right'>102</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/stats.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/stats.h</a></td><td class='right'>86</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/trace.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/trace.h</a></td><td class='right'>1943</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 15.9%;'/><td class='rem' style='width: 1.6%;'/><td class='none' style='width: 82.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/vfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/vfs.c</a></td><td class='right'>1882</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 10.6%;'/><td class='rem' style='width: 6.4%;'/><td class='none' style='width: 83.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/vfs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/vfs.h</a></td><td class='right'>126</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/xdr.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/xdr.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/xdr3.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/xdr3.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/xdr4.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/xdr4.h</a></td><td class='right'>345</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.4%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 96.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nfsd/xdr4cb.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/xdr4cb.h</a></td><td class='right'>33</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/Kconfig</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/alloc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/alloc.c</a></td><td class='right'>276</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.7%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 97.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/alloc.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/alloc.h</a></td><td class='right'>12</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/bmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/bmap.c</a></td><td class='right'>155</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/bmap.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/bmap.h</a></td><td class='right'>20</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/btnode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/btnode.c</a></td><td class='right'>199</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.3%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/btnode.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/btnode.h</a></td><td class='right'>5</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/btree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/btree.c</a></td><td class='right'>130</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/btree.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/btree.h</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/cpfile.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/cpfile.c</a></td><td class='right'>715</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.9%;'/><td class='rem' style='width: 2.5%;'/><td class='none' style='width: 93.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/cpfile.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/cpfile.h</a></td><td class='right'>10</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/dat.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/dat.c</a></td><td class='right'>213</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.1%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 98.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/dir.c</a></td><td class='right'>382</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.7%;'/><td class='rem' style='width: 1.8%;'/><td class='none' style='width: 96.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/direct.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/direct.c</a></td><td class='right'>13</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/file.c</a></td><td class='right'>46</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/gcinode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/gcinode.c</a></td><td class='right'>55</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/ifile.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/ifile.c</a></td><td class='right'>71</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/ifile.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/ifile.h</a></td><td class='right'>12</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/inode.c</a></td><td class='right'>413</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.4%;'/><td class='rem' style='width: 1.3%;'/><td class='none' style='width: 96.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/ioctl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/ioctl.c</a></td><td class='right'>423</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.1%;'/><td class='rem' style='width: 1.7%;'/><td class='none' style='width: 96.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/mdt.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/mdt.c</a></td><td class='right'>254</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.3%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 97.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/mdt.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/mdt.h</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/namei.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/namei.c</a></td><td class='right'>143</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/nilfs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/nilfs.h</a></td><td class='right'>91</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/page.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/page.c</a></td><td class='right'>426</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.0%;'/><td class='rem' style='width: 1.9%;'/><td class='none' style='width: 96.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/page.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/page.h</a></td><td class='right'>30</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/recovery.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/recovery.c</a></td><td class='right'>148</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 98.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/segbuf.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/segbuf.c</a></td><td class='right'>98</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/segment.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/segment.c</a></td><td class='right'>841</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.1%;'/><td class='rem' style='width: 3.4%;'/><td class='none' style='width: 92.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/segment.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/segment.h</a></td><td class='right'>11</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/sufile.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/sufile.c</a></td><td class='right'>388</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.0%;'/><td class='rem' style='width: 1.5%;'/><td class='none' style='width: 96.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/sufile.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/sufile.h</a></td><td class='right'>22</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/super.c</a></td><td class='right'>528</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.1%;'/><td class='rem' style='width: 2.6%;'/><td class='none' style='width: 95.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/sysfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/sysfs.c</a></td><td class='right'>66</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/sysfs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/sysfs.h</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/the_nilfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/the_nilfs.c</a></td><td class='right'>207</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.5%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 98.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nilfs2/the_nilfs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nilfs2/the_nilfs.h</a></td><td class='right'>16</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/Kconfig</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/Makefile</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/mac-celtic.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/mac-celtic.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/mac-centeuro.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/mac-centeuro.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/mac-croatian.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/mac-croatian.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/mac-cyrillic.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/mac-cyrillic.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/mac-gaelic.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/mac-gaelic.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/mac-greek.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/mac-greek.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/mac-iceland.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/mac-iceland.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/mac-inuit.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/mac-inuit.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/mac-roman.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/mac-roman.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/mac-romanian.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/mac-romanian.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/mac-turkish.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/mac-turkish.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_ascii.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_ascii.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_base.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_base.c</a></td><td class='right'>32</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_cp1250.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_cp1250.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_cp1251.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_cp1251.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_cp1255.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_cp1255.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_cp437.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_cp437.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_cp737.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_cp737.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_cp775.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_cp775.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_cp850.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_cp850.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_cp852.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_cp852.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_cp855.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_cp855.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_cp857.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_cp857.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_cp860.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_cp860.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_cp861.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_cp861.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_cp862.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_cp862.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_cp863.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_cp863.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_cp864.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_cp864.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_cp865.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_cp865.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_cp866.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_cp866.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_cp869.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_cp869.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_cp874.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_cp874.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_cp932.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_cp932.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_cp936.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_cp936.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_cp949.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_cp949.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_cp950.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_cp950.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_euc-jp.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_euc-jp.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_iso8859-1.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_iso8859-1.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_iso8859-13.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_iso8859-13.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_iso8859-14.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_iso8859-14.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_iso8859-15.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_iso8859-15.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_iso8859-2.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_iso8859-2.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_iso8859-3.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_iso8859-3.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_iso8859-4.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_iso8859-4.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_iso8859-5.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_iso8859-5.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_iso8859-6.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_iso8859-6.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_iso8859-7.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_iso8859-7.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_iso8859-9.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_iso8859-9.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_koi8-r.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_koi8-r.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_koi8-ru.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_koi8-ru.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_koi8-u.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_koi8-u.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_ucs2_data.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_ucs2_data.h</a></td><td class='right'>15</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_ucs2_utils.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_ucs2_utils.c</a> (renamed from fs/ksmbd/uniupr.h)</td><td class='right'>157</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 1.2%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_ucs2_utils.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_ucs2_utils.h</a> (renamed from fs/ksmbd/unicode.h)</td><td class='right'>90</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nls/nls_utf8.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nls/nls_utf8.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/no-block.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/no-block.c</a></td><td class='right'>19</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/notify/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/notify/Kconfig</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/notify/dnotify/dnotify.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/notify/dnotify/dnotify.c</a></td><td class='right'>63</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/notify/fanotify/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/notify/fanotify/Kconfig</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/notify/fanotify/fanotify.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/notify/fanotify/fanotify.c</a></td><td class='right'>369</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.3%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 96.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/notify/fanotify/fanotify.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/notify/fanotify/fanotify.h</a></td><td class='right'>228</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.8%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 98.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/notify/fanotify/fanotify_user.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/notify/fanotify/fanotify_user.c</a></td><td class='right'>1217</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.8%;'/><td class='rem' style='width: 3.1%;'/><td class='none' style='width: 89.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/notify/fdinfo.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/notify/fdinfo.c</a></td><td class='right'>62</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/notify/fsnotify.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/notify/fsnotify.c</a></td><td class='right'>436</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.9%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 96.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/notify/fsnotify.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/notify/fsnotify.h</a></td><td class='right'>54</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/notify/group.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/notify/group.c</a></td><td class='right'>23</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/notify/inotify/inotify.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/notify/inotify/inotify.h</a></td><td class='right'>19</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/notify/inotify/inotify_fsnotify.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/notify/inotify/inotify_fsnotify.c</a></td><td class='right'>17</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/notify/inotify/inotify_user.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/notify/inotify/inotify_user.c</a></td><td class='right'>111</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/notify/mark.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/notify/mark.c</a></td><td class='right'>383</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.3%;'/><td class='rem' style='width: 1.1%;'/><td class='none' style='width: 96.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/nsfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nsfs.c</a></td><td class='right'>638</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.6%;'/><td class='rem' style='width: 1.2%;'/><td class='none' style='width: 94.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/Kconfig</a></td><td class='right'>79</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/Makefile</a></td><td class='right'>15</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/aops.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/aops.c</a></td><td class='right'>1760</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 15.8%;'/><td class='none' style='width: 84.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/aops.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/aops.h</a></td><td class='right'>93</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/attrib.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/attrib.c</a></td><td class='right'>2600</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 23.4%;'/><td class='none' style='width: 76.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/attrib.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/attrib.h</a></td><td class='right'>102</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/bitmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/bitmap.c</a></td><td class='right'>179</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.6%;'/><td class='none' style='width: 98.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/bitmap.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/bitmap.h</a></td><td class='right'>104</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/collate.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/collate.c</a></td><td class='right'>110</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/collate.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/collate.h</a></td><td class='right'>36</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/compress.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/compress.c</a></td><td class='right'>950</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 8.5%;'/><td class='none' style='width: 91.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/debug.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/debug.c</a></td><td class='right'>159</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.4%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/debug.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/debug.h</a></td><td class='right'>57</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/dir.c</a></td><td class='right'>1538</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 13.8%;'/><td class='none' style='width: 86.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/dir.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/dir.h</a></td><td class='right'>34</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/endian.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/endian.h</a></td><td class='right'>79</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/file.c</a></td><td class='right'>2011</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 18.1%;'/><td class='none' style='width: 81.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/index.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/index.c</a></td><td class='right'>440</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 4.0%;'/><td class='none' style='width: 96.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/index.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/index.h</a></td><td class='right'>134</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.2%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/inode.c</a></td><td class='right'>3089</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 27.8%;'/><td class='none' style='width: 72.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/inode.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/inode.h</a></td><td class='right'>310</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 2.8%;'/><td class='none' style='width: 97.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/layout.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/layout.h</a></td><td class='right'>2421</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 21.8%;'/><td class='none' style='width: 78.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/lcnalloc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/lcnalloc.c</a></td><td class='right'>1000</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 9.0%;'/><td class='none' style='width: 91.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/lcnalloc.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/lcnalloc.h</a></td><td class='right'>131</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.2%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/logfile.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/logfile.c</a></td><td class='right'>849</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 7.6%;'/><td class='none' style='width: 92.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/logfile.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/logfile.h</a></td><td class='right'>295</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 2.7%;'/><td class='none' style='width: 97.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/malloc.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/malloc.h</a></td><td class='right'>77</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/mft.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/mft.c</a></td><td class='right'>2906</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 26.1%;'/><td class='none' style='width: 73.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/mft.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/mft.h</a></td><td class='right'>110</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/mst.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/mst.c</a></td><td class='right'>189</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.7%;'/><td class='none' style='width: 98.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/namei.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/namei.c</a></td><td class='right'>391</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 3.5%;'/><td class='none' style='width: 96.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/ntfs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/ntfs.h</a></td><td class='right'>150</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.3%;'/><td class='none' style='width: 98.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/quota.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/quota.c</a></td><td class='right'>103</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/quota.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/quota.h</a></td><td class='right'>21</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/runlist.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/runlist.c</a></td><td class='right'>1893</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 17.0%;'/><td class='none' style='width: 83.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/runlist.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/runlist.h</a></td><td class='right'>88</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/super.c</a></td><td class='right'>3193</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 28.7%;'/><td class='none' style='width: 71.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/sysctl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/sysctl.c</a></td><td class='right'>69</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/sysctl.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/sysctl.h</a></td><td class='right'>27</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/time.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/time.h</a></td><td class='right'>89</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/types.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/types.h</a></td><td class='right'>55</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/unistr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/unistr.c</a></td><td class='right'>384</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 3.5%;'/><td class='none' style='width: 96.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/upcase.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/upcase.c</a></td><td class='right'>73</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/usnjrnl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/usnjrnl.c</a></td><td class='right'>70</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/usnjrnl.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/usnjrnl.h</a></td><td class='right'>191</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.7%;'/><td class='none' style='width: 98.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/ntfs/volume.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs/volume.h</a></td><td class='right'>164</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.5%;'/><td class='none' style='width: 98.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ntfs3/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs3/Kconfig</a></td><td class='right'>11</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ntfs3/attrib.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs3/attrib.c</a></td><td class='right'>1228</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.9%;'/><td class='rem' style='width: 3.2%;'/><td class='none' style='width: 89.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ntfs3/attrlist.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs3/attrlist.c</a></td><td class='right'>86</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ntfs3/bitfunc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs3/bitfunc.c</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ntfs3/bitmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs3/bitmap.c</a></td><td class='right'>274</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.5%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 97.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ntfs3/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs3/dir.c</a></td><td class='right'>108</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ntfs3/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs3/file.c</a></td><td class='right'>921</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.2%;'/><td class='rem' style='width: 3.1%;'/><td class='none' style='width: 91.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ntfs3/frecord.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs3/frecord.c</a></td><td class='right'>727</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.2%;'/><td class='rem' style='width: 3.3%;'/><td class='none' style='width: 93.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ntfs3/fslog.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs3/fslog.c</a></td><td class='right'>498</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.3%;'/><td class='rem' style='width: 2.1%;'/><td class='none' style='width: 95.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ntfs3/fsntfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs3/fsntfs.c</a></td><td class='right'>660</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.7%;'/><td class='rem' style='width: 2.2%;'/><td class='none' style='width: 94.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ntfs3/index.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs3/index.c</a></td><td class='right'>290</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.9%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 97.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ntfs3/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs3/inode.c</a></td><td class='right'>774</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.2%;'/><td class='rem' style='width: 2.8%;'/><td class='none' style='width: 93.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ntfs3/lib/decompress_common.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs3/lib/decompress_common.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ntfs3/lib/lzx_decompress.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs3/lib/lzx_decompress.c</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ntfs3/lznt.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs3/lznt.c</a></td><td class='right'>13</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ntfs3/namei.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs3/namei.c</a></td><td class='right'>256</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.8%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 97.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ntfs3/ntfs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs3/ntfs.h</a></td><td class='right'>150</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ntfs3/ntfs_fs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs3/ntfs_fs.h</a></td><td class='right'>276</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.4%;'/><td class='rem' style='width: 1.1%;'/><td class='none' style='width: 97.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ntfs3/record.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs3/record.c</a></td><td class='right'>230</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.3%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 97.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ntfs3/run.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs3/run.c</a></td><td class='right'>209</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.4%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ntfs3/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs3/super.c</a></td><td class='right'>1074</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.0%;'/><td class='rem' style='width: 2.7%;'/><td class='none' style='width: 90.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ntfs3/upcase.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs3/upcase.c</a></td><td class='right'>12</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ntfs3/xattr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ntfs3/xattr.c</a></td><td class='right'>371</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.0%;'/><td class='rem' style='width: 1.4%;'/><td class='none' style='width: 96.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/Kconfig</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/acl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/acl.c</a></td><td class='right'>12</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/acl.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/acl.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/alloc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/alloc.c</a></td><td class='right'>192</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 98.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/alloc.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/alloc.h</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/aops.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/aops.c</a></td><td class='right'>499</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.2%;'/><td class='rem' style='width: 2.3%;'/><td class='none' style='width: 95.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/aops.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/aops.h</a></td><td class='right'>19</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/buffer_head_io.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/buffer_head_io.c</a></td><td class='right'>16</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/cluster/heartbeat.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/cluster/heartbeat.c</a></td><td class='right'>217</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 98.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/cluster/heartbeat.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/cluster/heartbeat.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/cluster/masklog.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/cluster/masklog.c</a></td><td class='right'>11</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/cluster/masklog.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/cluster/masklog.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/cluster/netdebug.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/cluster/netdebug.c</a></td><td class='right'>42</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/cluster/nodemanager.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/cluster/nodemanager.c</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/cluster/quorum.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/cluster/quorum.c</a></td><td class='right'>34</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/cluster/tcp.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/cluster/tcp.c</a></td><td class='right'>78</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/dcache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/dcache.c</a></td><td class='right'>21</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/dir.c</a></td><td class='right'>168</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/dlm/dlmapi.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/dlm/dlmapi.h</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/dlm/dlmcommon.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/dlm/dlmcommon.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/dlm/dlmdebug.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/dlm/dlmdebug.c</a></td><td class='right'>74</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/dlm/dlmdomain.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/dlm/dlmdomain.c</a></td><td class='right'>38</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/dlm/dlmmaster.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/dlm/dlmmaster.c</a></td><td class='right'>71</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/dlm/dlmrecovery.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/dlm/dlmrecovery.c</a></td><td class='right'>20</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/dlm/dlmthread.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/dlm/dlmthread.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/dlm/dlmunlock.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/dlm/dlmunlock.c</a></td><td class='right'>21</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/dlmfs/dlmfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/dlmfs/dlmfs.c</a></td><td class='right'>83</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/dlmfs/userdlm.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/dlmfs/userdlm.c</a></td><td class='right'>17</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/dlmglue.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/dlmglue.c</a></td><td class='right'>105</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/dlmglue.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/dlmglue.h</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/export.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/export.c</a></td><td class='right'>12</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/extent_map.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/extent_map.c</a></td><td class='right'>28</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/file.c</a></td><td class='right'>200</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/file.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/file.h</a></td><td class='right'>7</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/filecheck.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/filecheck.c</a></td><td class='right'>5</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/heartbeat.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/heartbeat.c</a></td><td class='right'>27</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/inode.c</a></td><td class='right'>221</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.5%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/inode.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/inode.h</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/ioctl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/ioctl.c</a></td><td class='right'>69</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/ioctl.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/ioctl.h</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/journal.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/journal.c</a></td><td class='right'>385</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.1%;'/><td class='rem' style='width: 1.3%;'/><td class='none' style='width: 96.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/journal.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/journal.h</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/localalloc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/localalloc.c</a></td><td class='right'>38</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/locks.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/locks.c</a></td><td class='right'>13</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/mmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/mmap.c</a></td><td class='right'>27</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/mmap.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/mmap.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/move_extents.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/move_extents.c</a></td><td class='right'>94</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/namei.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/namei.c</a></td><td class='right'>123</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/ocfs2.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/ocfs2.h</a></td><td class='right'>57</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/ocfs2_fs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/ocfs2_fs.h</a></td><td class='right'>43</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/ocfs2_ioctl.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/ocfs2_ioctl.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/ocfs2_lockid.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/ocfs2_lockid.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/ocfs2_trace.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/ocfs2_trace.h</a></td><td class='right'>89</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/quota.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/quota.h</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/quota_global.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/quota_global.c</a></td><td class='right'>63</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/quota_local.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/quota_local.c</a></td><td class='right'>48</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/refcounttree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/refcounttree.c</a></td><td class='right'>162</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 98.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/reservations.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/reservations.c</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/reservations.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/reservations.h</a></td><td class='right'>13</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/resize.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/resize.c</a></td><td class='right'>10</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/slot_map.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/slot_map.c</a></td><td class='right'>48</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/stack_o2cb.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/stack_o2cb.c</a></td><td class='right'>10</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/stack_user.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/stack_user.c</a></td><td class='right'>56</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/stackglue.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/stackglue.c</a></td><td class='right'>54</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/stackglue.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/stackglue.h</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/suballoc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/suballoc.c</a></td><td class='right'>180</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.3%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 98.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/suballoc.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/suballoc.h</a></td><td class='right'>9</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/super.c</a></td><td class='right'>884</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.8%;'/><td class='rem' style='width: 4.1%;'/><td class='none' style='width: 92.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/symlink.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/symlink.c</a></td><td class='right'>19</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/sysfile.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/sysfile.c</a></td><td class='right'>12</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/xattr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/xattr.c</a></td><td class='right'>132</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ocfs2/xattr.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ocfs2/xattr.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/omfs/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/omfs/Kconfig</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/omfs/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/omfs/dir.c</a></td><td class='right'>14</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/omfs/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/omfs/file.c</a></td><td class='right'>48</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/omfs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/omfs/inode.c</a></td><td class='right'>196</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 98.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/omfs/omfs_fs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/omfs/omfs_fs.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/open.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/open.c</a></td><td class='right'>738</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.3%;'/><td class='rem' style='width: 2.3%;'/><td class='none' style='width: 93.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/openpromfs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/openpromfs/inode.c</a></td><td class='right'>20</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/orangefs/acl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/orangefs/acl.c</a></td><td class='right'>49</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/orangefs/dcache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/orangefs/dcache.c</a></td><td class='right'>24</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/orangefs/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/orangefs/dir.c</a></td><td class='right'>34</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/orangefs/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/orangefs/file.c</a></td><td class='right'>43</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/orangefs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/orangefs/inode.c</a></td><td class='right'>490</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.2%;'/><td class='rem' style='width: 2.2%;'/><td class='none' style='width: 95.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/orangefs/namei.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/orangefs/namei.c</a></td><td class='right'>54</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/orangefs/orangefs-bufmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/orangefs/orangefs-bufmap.c</a></td><td class='right'>36</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/orangefs/orangefs-bufmap.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/orangefs/orangefs-bufmap.h</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/orangefs/orangefs-cache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/orangefs/orangefs-cache.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/orangefs/orangefs-debug.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/orangefs/orangefs-debug.h</a></td><td class='right'>43</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/orangefs/orangefs-debugfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/orangefs/orangefs-debugfs.c</a></td><td class='right'>111</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/orangefs/orangefs-kernel.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/orangefs/orangefs-kernel.h</a></td><td class='right'>41</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/orangefs/orangefs-mod.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/orangefs/orangefs-mod.c</a></td><td class='right'>11</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/orangefs/orangefs-sysfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/orangefs/orangefs-sysfs.c</a></td><td class='right'>134</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/orangefs/orangefs-utils.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/orangefs/orangefs-utils.c</a></td><td class='right'>28</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/orangefs/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/orangefs/super.c</a></td><td class='right'>211</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.9%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 98.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/orangefs/xattr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/orangefs/xattr.c</a></td><td class='right'>18</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/overlayfs/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/overlayfs/Kconfig</a></td><td class='right'>12</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/overlayfs/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/overlayfs/Makefile</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/overlayfs/copy_up.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/overlayfs/copy_up.c</a></td><td class='right'>671</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.9%;'/><td class='rem' style='width: 2.1%;'/><td class='none' style='width: 94.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/overlayfs/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/overlayfs/dir.c</a></td><td class='right'>972</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.1%;'/><td class='rem' style='width: 3.6%;'/><td class='none' style='width: 91.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/overlayfs/export.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/overlayfs/export.c</a></td><td class='right'>165</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 98.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/overlayfs/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/overlayfs/file.c</a></td><td class='right'>660</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.8%;'/><td class='rem' style='width: 3.2%;'/><td class='none' style='width: 94.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/overlayfs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/overlayfs/inode.c</a></td><td class='right'>545</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.9%;'/><td class='rem' style='width: 2.0%;'/><td class='none' style='width: 95.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/overlayfs/namei.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/overlayfs/namei.c</a></td><td class='right'>786</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.8%;'/><td class='rem' style='width: 2.2%;'/><td class='none' style='width: 92.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/overlayfs/overlayfs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/overlayfs/overlayfs.h</a></td><td class='right'>637</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.4%;'/><td class='rem' style='width: 1.4%;'/><td class='none' style='width: 94.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/overlayfs/ovl_entry.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/overlayfs/ovl_entry.h</a></td><td class='right'>108</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/overlayfs/params.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/overlayfs/params.c</a></td><td class='right'>1081</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 9.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 90.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/overlayfs/params.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/overlayfs/params.h</a></td><td class='right'>44</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/overlayfs/readdir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/overlayfs/readdir.c</a></td><td class='right'>455</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.5%;'/><td class='rem' style='width: 1.6%;'/><td class='none' style='width: 95.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/overlayfs/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/overlayfs/super.c</a></td><td class='right'>1527</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.2%;'/><td class='rem' style='width: 9.5%;'/><td class='none' style='width: 86.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/overlayfs/util.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/overlayfs/util.c</a></td><td class='right'>722</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.4%;'/><td class='rem' style='width: 1.1%;'/><td class='none' style='width: 93.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/overlayfs/xattrs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/overlayfs/xattrs.c</a></td><td class='right'>261</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/pidfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/pidfs.c</a></td><td class='right'>1104</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 9.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 90.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/pipe.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/pipe.c</a></td><td class='right'>520</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.8%;'/><td class='rem' style='width: 1.9%;'/><td class='none' style='width: 95.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/pnode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/pnode.c</a></td><td class='right'>785</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.9%;'/><td class='rem' style='width: 3.1%;'/><td class='none' style='width: 92.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/pnode.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/pnode.h</a></td><td class='right'>35</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/posix_acl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/posix_acl.c</a></td><td class='right'>644</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.2%;'/><td class='rem' style='width: 1.6%;'/><td class='none' style='width: 94.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/Kconfig</a></td><td class='right'>22</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/Makefile</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/array.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/array.c</a></td><td class='right'>107</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/base.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/base.c</a></td><td class='right'>482</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.8%;'/><td class='rem' style='width: 1.5%;'/><td class='none' style='width: 95.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/bootconfig.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/bootconfig.c</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/cmdline.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/cmdline.c</a></td><td class='right'>7</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/consoles.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/consoles.c</a></td><td class='right'>28</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/cpuinfo.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/cpuinfo.c</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/devices.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/devices.c</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/fd.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/fd.c</a></td><td class='right'>104</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/fd.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/fd.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/generic.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/generic.c</a></td><td class='right'>85</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/inode.c</a></td><td class='right'>117</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/internal.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/internal.h</a></td><td class='right'>144</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 98.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/interrupts.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/interrupts.c</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/kcore.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/kcore.c</a></td><td class='right'>243</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.3%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 97.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/kmsg.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/kmsg.c</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/loadavg.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/loadavg.c</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/meminfo.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/meminfo.c</a></td><td class='right'>30</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/namespaces.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/namespaces.c</a></td><td class='right'>11</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/nommu.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/nommu.c</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/page.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/page.c</a></td><td class='right'>291</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.1%;'/><td class='rem' style='width: 1.5%;'/><td class='none' style='width: 97.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/proc_net.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/proc_net.c</a></td><td class='right'>45</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/proc_sysctl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/proc_sysctl.c</a></td><td class='right'>761</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.8%;'/><td class='rem' style='width: 4.0%;'/><td class='none' style='width: 93.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/proc_tty.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/proc_tty.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/root.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/root.c</a></td><td class='right'>137</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/self.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/self.c</a></td><td class='right'>12</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/softirqs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/softirqs.c</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/stat.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/stat.c</a></td><td class='right'>30</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/task_mmu.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/task_mmu.c</a></td><td class='right'>2094</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 15.8%;'/><td class='rem' style='width: 3.0%;'/><td class='none' style='width: 81.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/task_nommu.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/task_nommu.c</a></td><td class='right'>122</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/thread_self.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/thread_self.c</a></td><td class='right'>13</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/uptime.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/uptime.c</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/version.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/version.c</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc/vmcore.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc/vmcore.c</a></td><td class='right'>557</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.1%;'/><td class='rem' style='width: 1.9%;'/><td class='none' style='width: 95.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/proc_namespace.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/proc_namespace.c</a></td><td class='right'>41</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/pstore/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/pstore/Kconfig</a></td><td class='right'>102</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/pstore/blk.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/pstore/blk.c</a></td><td class='right'>12</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/pstore/ftrace.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/pstore/ftrace.c</a></td><td class='right'>46</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/pstore/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/pstore/inode.c</a></td><td class='right'>234</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.1%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 97.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/pstore/internal.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/pstore/internal.h</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/pstore/platform.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/pstore/platform.c</a></td><td class='right'>460</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.7%;'/><td class='rem' style='width: 2.4%;'/><td class='none' style='width: 95.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/pstore/pmsg.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/pstore/pmsg.c</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/pstore/ram.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/pstore/ram.c</a></td><td class='right'>79</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/pstore/ram_core.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/pstore/ram_core.c</a></td><td class='right'>45</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/pstore/ram_internal.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/pstore/ram_internal.h</a></td><td class='right'>98</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/pstore/zone.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/pstore/zone.c</a></td><td class='right'>43</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/qnx4/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/qnx4/Kconfig</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/qnx4/README?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/qnx4/README</a></td><td class='right'>9</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/qnx4/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/qnx4/dir.c</a></td><td class='right'>52</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/qnx4/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/qnx4/inode.c</a></td><td class='right'>70</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/qnx4/namei.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/qnx4/namei.c</a></td><td class='right'>29</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/qnx4/qnx4.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/qnx4/qnx4.h</a></td><td class='right'>60</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/qnx6/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/qnx6/Kconfig</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/qnx6/README?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/qnx6/README</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/qnx6/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/qnx6/dir.c</a></td><td class='right'>88</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/qnx6/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/qnx6/inode.c</a></td><td class='right'>181</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.9%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 98.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/qnx6/namei.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/qnx6/namei.c</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/qnx6/qnx6.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/qnx6/qnx6.h</a></td><td class='right'>9</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/quota/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/quota/Kconfig</a></td><td class='right'>18</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/quota/dquot.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/quota/dquot.c</a></td><td class='right'>612</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.0%;'/><td class='rem' style='width: 2.5%;'/><td class='none' style='width: 94.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/quota/quota.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/quota/quota.c</a></td><td class='right'>23</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/quota/quota_tree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/quota/quota_tree.c</a></td><td class='right'>225</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.5%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/quota/quota_v1.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/quota/quota_v1.c</a></td><td class='right'>11</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/quota/quota_v2.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/quota/quota_v2.c</a></td><td class='right'>46</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ramfs/file-mmu.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ramfs/file-mmu.c</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ramfs/file-nommu.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ramfs/file-nommu.c</a></td><td class='right'>74</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ramfs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ramfs/inode.c</a></td><td class='right'>76</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/read_write.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/read_write.c</a></td><td class='right'>871</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.6%;'/><td class='rem' style='width: 3.3%;'/><td class='none' style='width: 92.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/readdir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/readdir.c</a></td><td class='right'>235</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 97.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/Kconfig</a></td><td class='right'>85</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/Makefile</a></td><td class='right'>30</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/README?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/README</a></td><td class='right'>161</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.4%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/acl.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/acl.h</a></td><td class='right'>78</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/bitmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/bitmap.c</a></td><td class='right'>1476</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 13.3%;'/><td class='none' style='width: 86.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/dir.c</a></td><td class='right'>346</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 3.1%;'/><td class='none' style='width: 96.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/do_balan.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/do_balan.c</a></td><td class='right'>1900</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 17.1%;'/><td class='none' style='width: 82.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/file.c</a></td><td class='right'>263</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 2.4%;'/><td class='none' style='width: 97.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/fix_node.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/fix_node.c</a></td><td class='right'>2821</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 25.4%;'/><td class='none' style='width: 74.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/hashes.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/hashes.c</a></td><td class='right'>177</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.6%;'/><td class='none' style='width: 98.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/ibalance.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/ibalance.c</a></td><td class='right'>1161</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 10.4%;'/><td class='none' style='width: 89.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/inode.c</a></td><td class='right'>3439</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 30.9%;'/><td class='none' style='width: 69.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/ioctl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/ioctl.c</a></td><td class='right'>221</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 2.0%;'/><td class='none' style='width: 98.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/item_ops.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/item_ops.c</a></td><td class='right'>744</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 6.7%;'/><td class='none' style='width: 93.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/journal.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/journal.c</a></td><td class='right'>4402</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 39.6%;'/><td class='none' style='width: 60.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/lbalance.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/lbalance.c</a></td><td class='right'>1426</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 12.8%;'/><td class='none' style='width: 87.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/lock.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/lock.c</a></td><td class='right'>101</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/namei.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/namei.c</a></td><td class='right'>1688</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 15.2%;'/><td class='none' style='width: 84.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/objectid.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/objectid.c</a></td><td class='right'>216</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.9%;'/><td class='none' style='width: 98.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/prints.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/prints.c</a></td><td class='right'>792</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 7.1%;'/><td class='none' style='width: 92.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/procfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/procfs.c</a></td><td class='right'>490</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 4.4%;'/><td class='none' style='width: 95.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/reiserfs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/reiserfs.h</a></td><td class='right'>3415</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 30.7%;'/><td class='none' style='width: 69.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/resize.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/resize.c</a></td><td class='right'>230</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 2.1%;'/><td class='none' style='width: 97.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/stree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/stree.c</a></td><td class='right'>2281</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 20.5%;'/><td class='none' style='width: 79.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/super.c</a></td><td class='right'>2650</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 23.8%;'/><td class='none' style='width: 76.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/tail_conversion.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/tail_conversion.c</a></td><td class='right'>318</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 2.9%;'/><td class='none' style='width: 97.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/xattr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/xattr.c</a></td><td class='right'>1044</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 9.4%;'/><td class='none' style='width: 90.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/xattr.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/xattr.h</a></td><td class='right'>117</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.1%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/xattr_acl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/xattr_acl.c</a></td><td class='right'>408</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 3.7%;'/><td class='none' style='width: 96.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/xattr_security.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/xattr_security.c</a></td><td class='right'>109</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/xattr_trusted.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/xattr_trusted.c</a></td><td class='right'>46</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/reiserfs/xattr_user.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/reiserfs/xattr_user.c</a></td><td class='right'>43</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/remap_range.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/remap_range.c</a></td><td class='right'>235</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 1.1%;'/><td class='none' style='width: 97.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/resctrl/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/resctrl/Kconfig</a></td><td class='right'>39</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/resctrl/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/resctrl/Makefile</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/resctrl/ctrlmondata.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/resctrl/ctrlmondata.c</a></td><td class='right'>959</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 8.6%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 91.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/resctrl/internal.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/resctrl/internal.h</a></td><td class='right'>495</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 95.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/resctrl/monitor.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/resctrl/monitor.c</a></td><td class='right'>1811</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 16.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 83.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/resctrl/monitor_trace.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/resctrl/monitor_trace.h</a></td><td class='right'>33</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/resctrl/pseudo_lock.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/resctrl/pseudo_lock.c</a></td><td class='right'>1099</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 9.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 90.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/resctrl/rdtgroup.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/resctrl/rdtgroup.c</a></td><td class='right'>4584</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 41.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 58.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/romfs/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/romfs/Kconfig</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/romfs/mmap-nommu.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/romfs/mmap-nommu.c</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/romfs/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/romfs/super.c</a></td><td class='right'>51</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/select.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/select.c</a></td><td class='right'>158</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/seq_file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/seq_file.c</a></td><td class='right'>53</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/signalfd.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/signalfd.c</a></td><td class='right'>72</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/Kconfig</a></td><td class='right'>11</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/Makefile</a></td><td class='right'>5</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/Kconfig</a> (renamed from fs/cifs/Kconfig)</td><td class='right'>89</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/Makefile</a> (renamed from fs/cifs/Makefile)</td><td class='right'>17</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/asn1.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/asn1.c</a> (renamed from fs/cifs/asn1.c)</td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/client/cached_dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/cached_dir.c</a></td><td class='right'>862</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 92.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/client/cached_dir.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/cached_dir.h</a></td><td class='right'>98</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/cifs_debug.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/cifs_debug.c</a> (renamed from fs/cifs/cifs_debug.c)</td><td class='right'>610</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.0%;'/><td class='rem' style='width: 1.5%;'/><td class='none' style='width: 94.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/cifs_debug.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/cifs_debug.h</a> (renamed from fs/cifs/cifs_debug.h)</td><td class='right'>24</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/cifs_fs_sb.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/cifs_fs_sb.h</a> (renamed from fs/cifs/cifs_fs_sb.h)</td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/cifs_ioctl.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/cifs_ioctl.h</a> (renamed from fs/cifs/cifs_ioctl.h)</td><td class='right'>18</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/cifs_spnego.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/cifs_spnego.c</a> (renamed from fs/cifs/cifs_spnego.c)</td><td class='right'>80</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/cifs_spnego.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/cifs_spnego.h</a> (renamed from fs/cifs/cifs_spnego.h)</td><td class='right'>7</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/cifs_spnego_negtokeninit.asn1?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/cifs_spnego_negtokeninit.asn1</a> (renamed from fs/cifs/cifs_spnego_negtokeninit.asn1)</td><td class='right'>0</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/cifs_swn.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/cifs_swn.c</a> (renamed from fs/cifs/cifs_swn.c)</td><td class='right'>57</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/cifs_swn.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/cifs_swn.h</a> (renamed from fs/cifs/cifs_swn.h)</td><td class='right'>0</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/cifs_unicode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/cifs_unicode.c</a> (renamed from fs/cifs/cifs_unicode.c)</td><td class='right'>21</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/client/cifs_unicode.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/cifs_unicode.h</a></td><td class='right'>73</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/cifsacl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/cifsacl.c</a> (renamed from fs/cifs/cifsacl.c)</td><td class='right'>539</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.2%;'/><td class='rem' style='width: 1.6%;'/><td class='none' style='width: 95.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/cifsacl.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/cifsacl.h</a> (renamed from fs/cifs/cifsacl.h)</td><td class='right'>101</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/client/cifsencrypt.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/cifsencrypt.c</a></td><td class='right'>660</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 94.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/cifsfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/cifsfs.c</a> (renamed from fs/cifs/cifsfs.c)</td><td class='right'>804</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.4%;'/><td class='rem' style='width: 1.9%;'/><td class='none' style='width: 92.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/cifsfs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/cifsfs.h</a> (renamed from fs/cifs/cifsfs.h)</td><td class='right'>46</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/cifsglob.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/cifsglob.h</a> (renamed from fs/cifs/cifsglob.h)</td><td class='right'>1193</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.0%;'/><td class='rem' style='width: 3.7%;'/><td class='none' style='width: 89.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/cifspdu.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/cifspdu.h</a> (renamed from fs/cifs/cifspdu.h)</td><td class='right'>809</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.3%;'/><td class='rem' style='width: 4.9%;'/><td class='none' style='width: 92.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/cifsproto.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/cifsproto.h</a> (renamed from fs/cifs/cifsproto.h)</td><td class='right'>567</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.7%;'/><td class='rem' style='width: 1.4%;'/><td class='none' style='width: 94.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/cifsroot.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/cifsroot.c</a> (renamed from fs/cifs/cifsroot.c)</td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/cifssmb.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/cifssmb.c</a> (renamed from fs/cifs/cifssmb.c)</td><td class='right'>2708</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 12.2%;'/><td class='rem' style='width: 12.2%;'/><td class='none' style='width: 75.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/client/cifstransport.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/cifstransport.c</a></td><td class='right'>263</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/client/compress.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/compress.c</a></td><td class='right'>372</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 96.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/client/compress.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/compress.h</a></td><td class='right'>75</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/client/compress/lz77.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/compress/lz77.c</a></td><td class='right'>235</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/client/compress/lz77.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/compress/lz77.h</a></td><td class='right'>15</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/connect.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/connect.c</a> (renamed from fs/cifs/connect.c)</td><td class='right'>3203</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 16.4%;'/><td class='rem' style='width: 12.4%;'/><td class='none' style='width: 71.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/client/dfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/dfs.c</a></td><td class='right'>467</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 95.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/client/dfs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/dfs.h</a></td><td class='right'>198</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/dfs_cache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/dfs_cache.c</a> (renamed from fs/cifs/dfs_cache.c)</td><td class='right'>936</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.9%;'/><td class='rem' style='width: 5.5%;'/><td class='none' style='width: 91.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/dfs_cache.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/dfs_cache.h</a> (renamed from fs/cifs/dfs_cache.h)</td><td class='right'>28</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/dir.c</a> (renamed from fs/cifs/dir.c)</td><td class='right'>250</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.6%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 97.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/client/dns_resolve.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/dns_resolve.c</a></td><td class='right'>96</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/client/dns_resolve.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/dns_resolve.h</a></td><td class='right'>37</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/export.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/export.c</a> (renamed from fs/cifs/export.c)</td><td class='right'>11</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/client/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/file.c</a></td><td class='right'>3357</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 30.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 69.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/fs_context.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/fs_context.c</a> (renamed from fs/cifs/fs_context.c)</td><td class='right'>761</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.8%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 93.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/fs_context.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/fs_context.h</a> (renamed from fs/cifs/fs_context.h)</td><td class='right'>158</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/client/fscache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/fscache.c</a></td><td class='right'>172</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.5%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/client/fscache.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/fscache.h</a></td><td class='right'>101</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/inode.c</a> (renamed from fs/cifs/inode.c)</td><td class='right'>1481</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 8.8%;'/><td class='rem' style='width: 4.5%;'/><td class='none' style='width: 86.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/ioctl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/ioctl.c</a> (renamed from fs/cifs/ioctl.c)</td><td class='right'>151</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.1%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/link.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/link.c</a> (renamed from fs/cifs/link.c)</td><td class='right'>319</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.1%;'/><td class='rem' style='width: 1.8%;'/><td class='none' style='width: 97.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/misc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/misc.c</a> (renamed from fs/cifs/misc.c)</td><td class='right'>774</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.5%;'/><td class='rem' style='width: 3.4%;'/><td class='none' style='width: 93.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/client/namespace.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/namespace.c</a></td><td class='right'>297</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/netlink.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/netlink.c</a> (renamed from fs/cifs/netlink.c)</td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/netlink.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/netlink.h</a> (renamed from fs/cifs/netlink.h)</td><td class='right'>0</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/netmisc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/netmisc.c</a> (renamed from fs/cifs/netmisc.c)</td><td class='right'>34</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/nterr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/nterr.c</a> (renamed from fs/cifs/nterr.c)</td><td class='right'>9</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/nterr.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/nterr.h</a> (renamed from fs/cifs/nterr.h)</td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/ntlmssp.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/ntlmssp.h</a> (renamed from fs/cifs/ntlmssp.h)</td><td class='right'>52</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/readdir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/readdir.c</a> (renamed from fs/cifs/readdir.c)</td><td class='right'>472</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.9%;'/><td class='rem' style='width: 1.4%;'/><td class='none' style='width: 95.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/client/reparse.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/reparse.c</a></td><td class='right'>1273</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 11.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 88.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/client/reparse.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/reparse.h</a></td><td class='right'>140</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/rfc1002pdu.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/rfc1002pdu.h</a> (renamed from fs/cifs/rfc1002pdu.h)</td><td class='right'>14</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/sess.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/sess.c</a> (renamed from fs/cifs/sess.c)</td><td class='right'>1220</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.9%;'/><td class='rem' style='width: 3.1%;'/><td class='none' style='width: 89.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/smb1ops.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/smb1ops.c</a> (renamed from fs/cifs/smb1ops.c)</td><td class='right'>809</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.0%;'/><td class='rem' style='width: 2.3%;'/><td class='none' style='width: 92.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/smb2file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/smb2file.c</a> (renamed from fs/cifs/smb2file.c)</td><td class='right'>202</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.6%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 98.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/smb2glob.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/smb2glob.h</a> (renamed from fs/cifs/smb2glob.h)</td><td class='right'>40</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/client/smb2inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/smb2inode.c</a></td><td class='right'>1647</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 14.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 85.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/smb2maperror.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/smb2maperror.c</a> (renamed from fs/cifs/smb2maperror.c)</td><td class='right'>60</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/smb2misc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/smb2misc.c</a> (renamed from fs/cifs/smb2misc.c)</td><td class='right'>327</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.5%;'/><td class='rem' style='width: 1.4%;'/><td class='none' style='width: 97.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/smb2ops.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/smb2ops.c</a> (renamed from fs/cifs/smb2ops.c)</td><td class='right'>3554</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 15.9%;'/><td class='rem' style='width: 16.1%;'/><td class='none' style='width: 68.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/smb2pdu.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/smb2pdu.c</a> (renamed from fs/cifs/smb2pdu.c)</td><td class='right'>2409</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 14.3%;'/><td class='rem' style='width: 7.3%;'/><td class='none' style='width: 78.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/client/smb2pdu.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/smb2pdu.h</a></td><td class='right'>340</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 96.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/smb2proto.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/smb2proto.h</a> (renamed from fs/cifs/smb2proto.h)</td><td class='right'>147</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/smb2transport.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/smb2transport.c</a> (renamed from fs/cifs/smb2transport.c)</td><td class='right'>452</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.8%;'/><td class='rem' style='width: 2.2%;'/><td class='none' style='width: 95.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/client/smbdirect.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/smbdirect.c</a></td><td class='right'>3033</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 27.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 72.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/client/smbdirect.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/smbdirect.h</a></td><td class='right'>76</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/smbencrypt.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/smbencrypt.c</a> (renamed from fs/cifs/smbencrypt.c)</td><td class='right'>9</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/smberr.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/smberr.h</a> (renamed from fs/cifs/smberr.h)</td><td class='right'>0</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/trace.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/trace.c</a> (renamed from fs/cifs/trace.c)</td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/client/trace.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/trace.h</a></td><td class='right'>1819</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 16.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 83.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/transport.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/transport.c</a> (renamed from fs/cifs/transport.c)</td><td class='right'>1130</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.6%;'/><td class='rem' style='width: 6.5%;'/><td class='none' style='width: 89.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/unc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/unc.c</a> (renamed from fs/cifs/unc.c)</td><td class='right'>0</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/winucase.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/winucase.c</a> (renamed from fs/cifs/winucase.c)</td><td class='right'>0</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/client/xattr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/client/xattr.c</a> (renamed from fs/cifs/xattr.c)</td><td class='right'>128</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/common/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/common/Makefile</a> (renamed from fs/smbfs_common/Makefile)</td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/common/cifs_md4.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/common/cifs_md4.c</a> (renamed from fs/smbfs_common/cifs_md4.c)</td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/common/fscc.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/common/fscc.h</a></td><td class='right'>174</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.6%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/common/md4.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/common/md4.h</a> (renamed from fs/smbfs_common/md4.h)</td><td class='right'>0</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/common/smb2pdu.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/common/smb2pdu.h</a></td><td class='right'>2158</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 19.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 80.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/common/smb2status.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/common/smb2status.h</a> (renamed from fs/cifs/smb2status.h)</td><td class='right'>9</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/common/smbacl.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/common/smbacl.h</a></td><td class='right'>122</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/common/smbdirect/smbdirect.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/common/smbdirect/smbdirect.h</a></td><td class='right'>44</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/common/smbdirect/smbdirect_pdu.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/common/smbdirect/smbdirect_pdu.h</a></td><td class='right'>55</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/common/smbdirect/smbdirect_socket.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/common/smbdirect/smbdirect_socket.h</a></td><td class='right'>547</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 95.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/common/smbfsctl.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/common/smbfsctl.h</a> (renamed from fs/smbfs_common/smbfsctl.h)</td><td class='right'>22</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/common/smbglob.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/common/smbglob.h</a></td><td class='right'>71</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/Kconfig</a> (renamed from fs/ksmbd/Kconfig)</td><td class='right'>23</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/Makefile</a> (renamed from fs/ksmbd/Makefile)</td><td class='right'>0</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/asn1.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/asn1.c</a> (renamed from fs/ksmbd/asn1.c)</td><td class='right'>178</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 1.3%;'/><td class='none' style='width: 98.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/asn1.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/asn1.h</a> (renamed from fs/ksmbd/asn1.h)</td><td class='right'>0</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/auth.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/auth.c</a> (renamed from fs/ksmbd/auth.c)</td><td class='right'>593</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.7%;'/><td class='rem' style='width: 3.6%;'/><td class='none' style='width: 94.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/auth.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/auth.h</a> (renamed from fs/ksmbd/auth.h)</td><td class='right'>28</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/connection.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/connection.c</a> (renamed from fs/ksmbd/connection.c)</td><td class='right'>299</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.8%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 97.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/server/connection.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/connection.h</a></td><td class='right'>259</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/crypto_ctx.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/crypto_ctx.c</a> (renamed from fs/ksmbd/crypto_ctx.c)</td><td class='right'>38</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/crypto_ctx.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/crypto_ctx.h</a> (renamed from fs/ksmbd/crypto_ctx.h)</td><td class='right'>19</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/glob.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/glob.h</a> (renamed from fs/ksmbd/glob.h)</td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/ksmbd_netlink.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/ksmbd_netlink.h</a> (renamed from fs/ksmbd/ksmbd_netlink.h)</td><td class='right'>80</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/ksmbd_spnego_negtokeninit.asn1?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/ksmbd_spnego_negtokeninit.asn1</a> (renamed from fs/ksmbd/ksmbd_spnego_negtokeninit.asn1)</td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/ksmbd_spnego_negtokentarg.asn1?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/ksmbd_spnego_negtokentarg.asn1</a> (renamed from fs/ksmbd/ksmbd_spnego_negtokentarg.asn1)</td><td class='right'>7</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/server/ksmbd_work.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/ksmbd_work.c</a></td><td class='right'>174</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.6%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/ksmbd_work.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/ksmbd_work.h</a> (renamed from fs/ksmbd/ksmbd_work.h)</td><td class='right'>41</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/mgmt/ksmbd_ida.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/mgmt/ksmbd_ida.c</a> (renamed from fs/ksmbd/mgmt/ksmbd_ida.c)</td><td class='right'>22</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/mgmt/ksmbd_ida.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/mgmt/ksmbd_ida.h</a> (renamed from fs/ksmbd/mgmt/ksmbd_ida.h)</td><td class='right'>0</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/mgmt/share_config.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/mgmt/share_config.c</a> (renamed from fs/ksmbd/mgmt/share_config.c)</td><td class='right'>90</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/mgmt/share_config.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/mgmt/share_config.h</a> (renamed from fs/ksmbd/mgmt/share_config.h)</td><td class='right'>40</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/mgmt/tree_connect.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/mgmt/tree_connect.c</a> (renamed from fs/ksmbd/mgmt/tree_connect.c)</td><td class='right'>83</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/mgmt/tree_connect.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/mgmt/tree_connect.h</a> (renamed from fs/ksmbd/mgmt/tree_connect.h)</td><td class='right'>16</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/server/mgmt/user_config.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/mgmt/user_config.c</a></td><td class='right'>108</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/mgmt/user_config.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/mgmt/user_config.h</a> (renamed from fs/ksmbd/mgmt/user_config.h)</td><td class='right'>7</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/server/mgmt/user_session.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/mgmt/user_session.c</a></td><td class='right'>492</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 95.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/mgmt/user_session.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/mgmt/user_session.h</a> (renamed from fs/ksmbd/mgmt/user_session.h)</td><td class='right'>28</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/misc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/misc.c</a> (renamed from fs/ksmbd/misc.c)</td><td class='right'>105</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/misc.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/misc.h</a> (renamed from fs/ksmbd/misc.h)</td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/ndr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/ndr.c</a> (renamed from fs/ksmbd/ndr.c)</td><td class='right'>30</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/ndr.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/ndr.h</a> (renamed from fs/ksmbd/ndr.h)</td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/nterr.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/nterr.h</a> (renamed from fs/ksmbd/nterr.h)</td><td class='right'>0</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/ntlmssp.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/ntlmssp.h</a> (renamed from fs/ksmbd/ntlmssp.h)</td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/oplock.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/oplock.c</a> (renamed from fs/ksmbd/oplock.c)</td><td class='right'>567</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.2%;'/><td class='rem' style='width: 1.9%;'/><td class='none' style='width: 94.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/oplock.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/oplock.h</a> (renamed from fs/ksmbd/oplock.h)</td><td class='right'>26</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/server.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/server.c</a> (renamed from fs/ksmbd/server.c)</td><td class='right'>134</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/server.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/server.h</a> (renamed from fs/ksmbd/server.h)</td><td class='right'>5</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/smb2misc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/smb2misc.c</a> (renamed from fs/ksmbd/smb2misc.c)</td><td class='right'>156</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/smb2ops.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/smb2ops.c</a> (renamed from fs/ksmbd/smb2ops.c)</td><td class='right'>87</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/smb2pdu.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/smb2pdu.c</a> (renamed from fs/ksmbd/smb2pdu.c)</td><td class='right'>3930</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 20.4%;'/><td class='rem' style='width: 15.0%;'/><td class='none' style='width: 64.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/server/smb2pdu.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/smb2pdu.h</a></td><td class='right'>405</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.6%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 96.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/smb_common.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/smb_common.c</a> (renamed from fs/ksmbd/smb_common.c)</td><td class='right'>261</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.8%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 97.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/server/smb_common.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/smb_common.h</a></td><td class='right'>206</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/smbacl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/smbacl.c</a> (renamed from fs/ksmbd/smbacl.c)</td><td class='right'>358</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.0%;'/><td class='rem' style='width: 1.2%;'/><td class='none' style='width: 96.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/server/smbacl.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/smbacl.h</a></td><td class='right'>129</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/smbfsctl.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/smbfsctl.h</a> (renamed from fs/ksmbd/smbfsctl.h)</td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/transport_ipc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/transport_ipc.c</a> (renamed from fs/ksmbd/transport_ipc.c)</td><td class='right'>188</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.4%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 98.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/transport_ipc.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/transport_ipc.h</a> (renamed from fs/ksmbd/transport_ipc.h)</td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/server/transport_rdma.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/transport_rdma.c</a></td><td class='right'>2718</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 24.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 75.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/server/transport_rdma.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/transport_rdma.h</a></td><td class='right'>30</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/transport_tcp.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/transport_tcp.c</a> (renamed from fs/ksmbd/transport_tcp.c)</td><td class='right'>317</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.7%;'/><td class='rem' style='width: 1.1%;'/><td class='none' style='width: 97.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/transport_tcp.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/transport_tcp.h</a> (renamed from fs/ksmbd/transport_tcp.h)</td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/unicode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/unicode.c</a> (renamed from fs/ksmbd/unicode.c)</td><td class='right'>200</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/smb/server/unicode.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/unicode.h</a></td><td class='right'>41</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/vfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/vfs.c</a> (renamed from fs/ksmbd/vfs.c)</td><td class='right'>1032</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.7%;'/><td class='rem' style='width: 4.6%;'/><td class='none' style='width: 90.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/vfs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/vfs.h</a> (renamed from fs/ksmbd/vfs.h)</td><td class='right'>126</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/vfs_cache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/vfs_cache.c</a> (renamed from fs/ksmbd/vfs_cache.c)</td><td class='right'>518</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.0%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 95.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/vfs_cache.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/vfs_cache.h</a> (renamed from fs/ksmbd/vfs_cache.h)</td><td class='right'>48</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/smb/server/xattr.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smb/server/xattr.h</a> (renamed from fs/ksmbd/xattr.h)</td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/smbfs_common/arc4.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smbfs_common/arc4.h</a></td><td class='right'>23</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/smbfs_common/cifs_arc4.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smbfs_common/cifs_arc4.c</a></td><td class='right'>87</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/smbfs_common/smb2pdu.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/smbfs_common/smb2pdu.h</a></td><td class='right'>989</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 8.9%;'/><td class='none' style='width: 91.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/splice.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/splice.c</a></td><td class='right'>875</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.2%;'/><td class='rem' style='width: 2.7%;'/><td class='none' style='width: 92.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/Kconfig</a></td><td class='right'>78</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/Makefile</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/block.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/block.c</a></td><td class='right'>197</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.6%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 98.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/cache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/cache.c</a></td><td class='right'>12</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/decompressor.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/decompressor.c</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/decompressor.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/decompressor.h</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/decompressor_multi.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/decompressor_multi.c</a></td><td class='right'>20</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/decompressor_multi_percpu.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/decompressor_multi_percpu.c</a></td><td class='right'>28</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/decompressor_single.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/decompressor_single.c</a></td><td class='right'>15</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/export.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/export.c</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/file.c</a></td><td class='right'>411</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.1%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 96.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/file_cache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/file_cache.c</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/file_direct.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/file_direct.c</a></td><td class='right'>118</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/inode.c</a></td><td class='right'>59</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/lz4_wrapper.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/lz4_wrapper.c</a></td><td class='right'>7</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/lzo_wrapper.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/lzo_wrapper.c</a></td><td class='right'>7</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/namei.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/namei.c</a></td><td class='right'>14</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/page_actor.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/page_actor.c</a></td><td class='right'>61</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/page_actor.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/page_actor.h</a></td><td class='right'>68</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/squashfs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/squashfs.h</a></td><td class='right'>39</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/squashfs_fs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/squashfs_fs.h</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/squashfs_fs_i.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/squashfs_fs_i.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/squashfs_fs_sb.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/squashfs_fs_sb.h</a></td><td class='right'>7</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/super.c</a></td><td class='right'>147</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 98.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/symlink.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/symlink.c</a></td><td class='right'>38</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/xattr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/xattr.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/xattr.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/xattr.h</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/xattr_id.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/xattr_id.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/xz_wrapper.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/xz_wrapper.c</a></td><td class='right'>11</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/zlib_wrapper.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/zlib_wrapper.c</a></td><td class='right'>12</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/squashfs/zstd_wrapper.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/squashfs/zstd_wrapper.c</a></td><td class='right'>28</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/stack.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/stack.c</a></td><td class='right'>10</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/stat.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/stat.c</a></td><td class='right'>399</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.6%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 96.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/statfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/statfs.c</a></td><td class='right'>16</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/super.c</a></td><td class='right'>1673</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 9.8%;'/><td class='rem' style='width: 5.3%;'/><td class='none' style='width: 85.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/sync.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/sync.c</a></td><td class='right'>79</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/sysctls.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/sysctls.c</a></td><td class='right'>37</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/sysfs/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/sysfs/dir.c</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/sysfs/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/sysfs/file.c</a></td><td class='right'>93</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/sysfs/group.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/sysfs/group.c</a></td><td class='right'>114</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/sysfs/mount.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/sysfs/mount.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/sysfs/sysfs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/sysfs/sysfs.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/sysv/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/sysv/Kconfig</a></td><td class='right'>37</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/sysv/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/sysv/Makefile</a></td><td class='right'>9</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/sysv/balloc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/sysv/balloc.c</a></td><td class='right'>240</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 2.2%;'/><td class='none' style='width: 97.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/sysv/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/sysv/dir.c</a></td><td class='right'>368</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 3.3%;'/><td class='none' style='width: 96.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/sysv/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/sysv/file.c</a></td><td class='right'>59</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/sysv/ialloc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/sysv/ialloc.c</a></td><td class='right'>235</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 2.1%;'/><td class='none' style='width: 97.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/sysv/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/sysv/inode.c</a></td><td class='right'>357</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 3.2%;'/><td class='none' style='width: 96.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/sysv/itree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/sysv/itree.c</a></td><td class='right'>504</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 4.5%;'/><td class='none' style='width: 95.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/sysv/namei.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/sysv/namei.c</a></td><td class='right'>278</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 2.5%;'/><td class='none' style='width: 97.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/sysv/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/sysv/super.c</a></td><td class='right'>592</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 5.3%;'/><td class='none' style='width: 94.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/sysv/sysv.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/sysv/sysv.h</a></td><td class='right'>245</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 2.2%;'/><td class='none' style='width: 97.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/tests/binfmt_elf_kunit.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/tests/binfmt_elf_kunit.c</a></td><td class='right'>64</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/tests/exec_kunit.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/tests/exec_kunit.c</a></td><td class='right'>141</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/timerfd.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/timerfd.c</a></td><td class='right'>88</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/tracefs/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/tracefs/Makefile</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/tracefs/event_inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/tracefs/event_inode.c</a></td><td class='right'>914</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 8.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 91.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/tracefs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/tracefs/inode.c</a></td><td class='right'>576</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.8%;'/><td class='rem' style='width: 1.4%;'/><td class='none' style='width: 94.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/tracefs/internal.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/tracefs/internal.h</a></td><td class='right'>79</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ubifs/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/Makefile</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ubifs/auth.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/auth.c</a></td><td class='right'>24</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ubifs/budget.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/budget.c</a></td><td class='right'>16</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ubifs/commit.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/commit.c</a></td><td class='right'>13</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ubifs/compress.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/compress.c</a></td><td class='right'>246</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.6%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 97.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ubifs/crypto.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/crypto.c</a></td><td class='right'>18</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ubifs/debug.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/debug.c</a></td><td class='right'>60</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ubifs/debug.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/debug.h</a></td><td class='right'>7</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ubifs/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/dir.c</a></td><td class='right'>501</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.8%;'/><td class='rem' style='width: 1.8%;'/><td class='none' style='width: 95.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ubifs/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/file.c</a></td><td class='right'>689</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.0%;'/><td class='rem' style='width: 3.2%;'/><td class='none' style='width: 93.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ubifs/find.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/find.c</a></td><td class='right'>40</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ubifs/gc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/gc.c</a></td><td class='right'>19</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ubifs/io.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/io.c</a></td><td class='right'>77</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ubifs/ioctl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/ioctl.c</a></td><td class='right'>16</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ubifs/journal.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/journal.c</a></td><td class='right'>312</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.2%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 97.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ubifs/lprops.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/lprops.c</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ubifs/lpt.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/lpt.c</a></td><td class='right'>13</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ubifs/lpt_commit.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/lpt_commit.c</a></td><td class='right'>20</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ubifs/master.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/master.c</a></td><td class='right'>5</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ubifs/orphan.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/orphan.c</a></td><td class='right'>157</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 1.2%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ubifs/recovery.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/recovery.c</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ubifs/replay.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/replay.c</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ubifs/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/super.c</a></td><td class='right'>504</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.4%;'/><td class='rem' style='width: 2.1%;'/><td class='none' style='width: 95.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/ubifs/sysfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/sysfs.c</a></td><td class='right'>156</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ubifs/tnc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/tnc.c</a></td><td class='right'>164</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.9%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ubifs/tnc_commit.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/tnc_commit.c</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ubifs/tnc_misc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/tnc_misc.c</a></td><td class='right'>31</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ubifs/ubifs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/ubifs.h</a></td><td class='right'>104</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ubifs/xattr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ubifs/xattr.c</a></td><td class='right'>61</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/udf/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/udf/Kconfig</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/udf/balloc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/udf/balloc.c</a></td><td class='right'>149</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/udf/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/udf/dir.c</a></td><td class='right'>198</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 1.1%;'/><td class='none' style='width: 98.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/udf/directory.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/udf/directory.c</a></td><td class='right'>594</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.0%;'/><td class='rem' style='width: 1.3%;'/><td class='none' style='width: 94.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/udf/ecma_167.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/udf/ecma_167.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/udf/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/udf/file.c</a></td><td class='right'>192</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 1.1%;'/><td class='none' style='width: 98.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/udf/ialloc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/udf/ialloc.c</a></td><td class='right'>45</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/udf/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/udf/inode.c</a></td><td class='right'>964</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.7%;'/><td class='rem' style='width: 4.0%;'/><td class='none' style='width: 91.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/udf/lowlevel.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/udf/lowlevel.c</a></td><td class='right'>13</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/udf/misc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/udf/misc.c</a></td><td class='right'>24</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/udf/namei.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/udf/namei.c</a></td><td class='right'>1183</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.9%;'/><td class='rem' style='width: 6.7%;'/><td class='none' style='width: 89.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/udf/partition.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/udf/partition.c</a></td><td class='right'>21</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/udf/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/udf/super.c</a></td><td class='right'>686</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.2%;'/><td class='rem' style='width: 3.0%;'/><td class='none' style='width: 93.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/udf/symlink.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/udf/symlink.c</a></td><td class='right'>65</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/udf/truncate.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/udf/truncate.c</a></td><td class='right'>97</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/udf/udf_i.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/udf/udf_i.h</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/udf/udf_sb.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/udf/udf_sb.h</a></td><td class='right'>12</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/udf/udfdecl.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/udf/udfdecl.h</a></td><td class='right'>72</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/udf/udftime.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/udf/udftime.c</a></td><td class='right'>29</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/udf/unicode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/udf/unicode.c</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ufs/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ufs/Kconfig</a></td><td class='right'>1</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ufs/balloc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ufs/balloc.c</a></td><td class='right'>137</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ufs/cylinder.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ufs/cylinder.c</a></td><td class='right'>31</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ufs/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ufs/dir.c</a></td><td class='right'>298</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.4%;'/><td class='rem' style='width: 1.3%;'/><td class='none' style='width: 97.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ufs/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ufs/file.c</a></td><td class='right'>5</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ufs/ialloc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ufs/ialloc.c</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ufs/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ufs/inode.c</a></td><td class='right'>312</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.3%;'/><td class='rem' style='width: 1.5%;'/><td class='none' style='width: 97.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ufs/namei.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ufs/namei.c</a></td><td class='right'>90</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ufs/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ufs/super.c</a></td><td class='right'>363</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.4%;'/><td class='rem' style='width: 1.8%;'/><td class='none' style='width: 96.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ufs/ufs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ufs/ufs.h</a></td><td class='right'>39</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ufs/ufs_fs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ufs/ufs_fs.h</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ufs/util.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ufs/util.c</a></td><td class='right'>91</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/ufs/util.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ufs/util.h</a></td><td class='right'>83</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/unicode/.gitignore?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/unicode/.gitignore</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/unicode/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/unicode/Kconfig</a></td><td class='right'>12</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/unicode/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/unicode/Makefile</a></td><td class='right'>35</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/unicode/README.utf8data?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/unicode/README.utf8data</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/unicode/mkutf8data.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/unicode/mkutf8data.c</a></td><td class='right'>27</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/unicode/tests/.kunitconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/unicode/tests/.kunitconfig</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/unicode/tests/utf8_kunit.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/unicode/tests/utf8_kunit.c</a> (renamed from fs/unicode/utf8-selftest.c)</td><td class='right'>187</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 98.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/unicode/utf8-core.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/unicode/utf8-core.c</a></td><td class='right'>136</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/unicode/utf8-norm.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/unicode/utf8-norm.c</a></td><td class='right'>262</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 2.1%;'/><td class='none' style='width: 97.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='mov'><a href='/cgit/linux-arm.git/diff/fs/unicode/utf8data.c_shipped?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/unicode/utf8data.c_shipped</a> (renamed from fs/unicode/utf8data.h_shipped)</td><td class='right'>23</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/unicode/utf8n.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/unicode/utf8n.h</a></td><td class='right'>81</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/userfaultfd.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/userfaultfd.c</a></td><td class='right'>1048</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.2%;'/><td class='rem' style='width: 4.2%;'/><td class='none' style='width: 90.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/utimes.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/utimes.c</a></td><td class='right'>19</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/vboxsf/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/vboxsf/Kconfig</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/vboxsf/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/vboxsf/dir.c</a></td><td class='right'>45</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/vboxsf/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/vboxsf/file.c</a></td><td class='right'>110</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/vboxsf/shfl_hostintf.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/vboxsf/shfl_hostintf.h</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/vboxsf/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/vboxsf/super.c</a></td><td class='right'>36</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/vboxsf/utils.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/vboxsf/utils.c</a></td><td class='right'>29</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/vboxsf/vboxsf_wrappers.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/vboxsf/vboxsf_wrappers.c</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/vboxsf/vfsmod.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/vboxsf/vfsmod.h</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/verity/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/verity/Kconfig</a></td><td class='right'>47</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/verity/enable.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/verity/enable.c</a></td><td class='right'>324</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.4%;'/><td class='rem' style='width: 1.5%;'/><td class='none' style='width: 97.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/verity/fsverity_private.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/verity/fsverity_private.h</a></td><td class='right'>109</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/verity/hash_algs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/verity/hash_algs.c</a></td><td class='right'>306</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 2.0%;'/><td class='none' style='width: 97.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/verity/init.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/verity/init.c</a></td><td class='right'>52</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/verity/measure.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/verity/measure.c</a></td><td class='right'>129</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/verity/open.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/verity/open.c</a></td><td class='right'>260</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 1.2%;'/><td class='none' style='width: 97.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/verity/read_metadata.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/verity/read_metadata.c</a></td><td class='right'>16</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/verity/signature.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/verity/signature.c</a></td><td class='right'>108</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/verity/verify.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/verity/verify.c</a></td><td class='right'>518</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.1%;'/><td class='rem' style='width: 1.6%;'/><td class='none' style='width: 95.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xattr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xattr.c</a></td><td class='right'>1112</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.0%;'/><td class='rem' style='width: 3.0%;'/><td class='none' style='width: 90.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/Kconfig?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/Kconfig</a></td><td class='right'>99</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/Makefile</a></td><td class='right'>104</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.9%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/xfs/kmem.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/kmem.c</a></td><td class='right'>31</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/xfs/kmem.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/kmem.h</a></td><td class='right'>83</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_ag.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_ag.c</a></td><td class='right'>502</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.2%;'/><td class='rem' style='width: 2.3%;'/><td class='none' style='width: 95.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_ag.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_ag.h</a></td><td class='right'>330</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.3%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 97.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_ag_resv.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_ag_resv.c</a></td><td class='right'>56</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_ag_resv.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_ag_resv.h</a></td><td class='right'>21</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_alloc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_alloc.c</a></td><td class='right'>2017</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 11.9%;'/><td class='rem' style='width: 6.3%;'/><td class='none' style='width: 81.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_alloc.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_alloc.h</a></td><td class='right'>183</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 98.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_alloc_btree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_alloc_btree.c</a></td><td class='right'>357</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.5%;'/><td class='rem' style='width: 1.7%;'/><td class='none' style='width: 96.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_alloc_btree.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_alloc_btree.h</a></td><td class='right'>13</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_attr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_attr.c</a></td><td class='right'>1852</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.9%;'/><td class='rem' style='width: 8.7%;'/><td class='none' style='width: 83.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_attr.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_attr.h</a></td><td class='right'>229</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.7%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 97.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_attr_leaf.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_attr_leaf.c</a></td><td class='right'>547</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.6%;'/><td class='rem' style='width: 2.3%;'/><td class='none' style='width: 95.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_attr_leaf.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_attr_leaf.h</a></td><td class='right'>17</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_attr_remote.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_attr_remote.c</a></td><td class='right'>188</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 98.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_attr_remote.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_attr_remote.h</a></td><td class='right'>14</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_attr_sf.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_attr_sf.h</a></td><td class='right'>25</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_bmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_bmap.c</a></td><td class='right'>2511</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 11.3%;'/><td class='rem' style='width: 11.3%;'/><td class='none' style='width: 77.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_bmap.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_bmap.h</a></td><td class='right'>127</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_bmap_btree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_bmap_btree.c</a></td><td class='right'>434</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.7%;'/><td class='rem' style='width: 1.2%;'/><td class='none' style='width: 96.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_bmap_btree.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_bmap_btree.h</a></td><td class='right'>216</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.4%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_btree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_btree.c</a></td><td class='right'>1931</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 11.6%;'/><td class='rem' style='width: 5.8%;'/><td class='none' style='width: 82.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_btree.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_btree.h</a></td><td class='right'>505</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.8%;'/><td class='rem' style='width: 1.8%;'/><td class='none' style='width: 95.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_btree_mem.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_btree_mem.c</a></td><td class='right'>346</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 96.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_btree_mem.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_btree_mem.h</a></td><td class='right'>75</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_btree_staging.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_btree_staging.c</a></td><td class='right'>228</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 1.3%;'/><td class='none' style='width: 98.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_btree_staging.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_btree_staging.h</a></td><td class='right'>43</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_da_btree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_da_btree.c</a></td><td class='right'>350</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.5%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 96.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_da_btree.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_da_btree.h</a></td><td class='right'>50</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_da_format.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_da_format.h</a></td><td class='right'>163</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 98.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_defer.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_defer.c</a></td><td class='right'>576</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.3%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 94.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_defer.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_defer.h</a></td><td class='right'>73</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_dir2.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_dir2.c</a></td><td class='right'>1045</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.7%;'/><td class='rem' style='width: 1.7%;'/><td class='none' style='width: 90.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_dir2.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_dir2.h</a></td><td class='right'>125</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_dir2_block.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_dir2_block.c</a></td><td class='right'>62</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_dir2_data.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_dir2_data.c</a></td><td class='right'>52</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_dir2_leaf.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_dir2_leaf.c</a></td><td class='right'>112</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_dir2_node.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_dir2_node.c</a></td><td class='right'>51</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_dir2_priv.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_dir2_priv.h</a></td><td class='right'>30</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_dir2_sf.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_dir2_sf.c</a></td><td class='right'>117</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_dquot_buf.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_dquot_buf.c</a></td><td class='right'>190</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_errortag.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_errortag.h</a></td><td class='right'>130</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_exchmaps.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_exchmaps.c</a></td><td class='right'>1237</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 11.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 88.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_exchmaps.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_exchmaps.h</a></td><td class='right'>124</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_format.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_format.h</a></td><td class='right'>562</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.7%;'/><td class='rem' style='width: 1.3%;'/><td class='none' style='width: 94.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_fs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_fs.h</a></td><td class='right'>348</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.7%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 96.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_group.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_group.c</a></td><td class='right'>230</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_group.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_group.h</a></td><td class='right'>192</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_health.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_health.h</a></td><td class='right'>182</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.3%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 98.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_ialloc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_ialloc.c</a></td><td class='right'>971</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.3%;'/><td class='rem' style='width: 3.4%;'/><td class='none' style='width: 91.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_ialloc.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_ialloc.h</a></td><td class='right'>45</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_ialloc_btree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_ialloc_btree.c</a></td><td class='right'>273</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 1.2%;'/><td class='none' style='width: 97.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_ialloc_btree.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_ialloc_btree.h</a></td><td class='right'>22</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_iext_tree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_iext_tree.c</a></td><td class='right'>79</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_inode_buf.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_inode_buf.c</a></td><td class='right'>372</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.9%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 96.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_inode_buf.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_inode_buf.h</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_inode_fork.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_inode_fork.c</a></td><td class='right'>447</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.1%;'/><td class='rem' style='width: 1.9%;'/><td class='none' style='width: 96.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_inode_fork.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_inode_fork.h</a></td><td class='right'>131</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_inode_util.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_inode_util.c</a></td><td class='right'>741</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 6.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 93.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_inode_util.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_inode_util.h</a></td><td class='right'>62</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_log_format.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_log_format.h</a></td><td class='right'>412</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.8%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 96.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_log_recover.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_log_recover.h</a></td><td class='right'>62</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_log_rlimit.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_log_rlimit.c</a></td><td class='right'>125</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_metadir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_metadir.c</a></td><td class='right'>485</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 95.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_metadir.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_metadir.h</a></td><td class='right'>47</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_metafile.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_metafile.c</a></td><td class='right'>322</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_metafile.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_metafile.h</a></td><td class='right'>44</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_ondisk.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_ondisk.h</a></td><td class='right'>306</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_parent.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_parent.c</a></td><td class='right'>379</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 96.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_parent.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_parent.h</a></td><td class='right'>110</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_quota_defs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_quota_defs.h</a></td><td class='right'>97</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_refcount.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_refcount.c</a></td><td class='right'>1087</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 6.9%;'/><td class='rem' style='width: 2.9%;'/><td class='none' style='width: 90.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_refcount.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_refcount.h</a></td><td class='right'>103</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_refcount_btree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_refcount_btree.c</a></td><td class='right'>180</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 98.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_refcount_btree.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_refcount_btree.h</a></td><td class='right'>5</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_rmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_rmap.c</a></td><td class='right'>1198</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 6.9%;'/><td class='rem' style='width: 3.8%;'/><td class='none' style='width: 89.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_rmap.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_rmap.h</a></td><td class='right'>105</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_rmap_btree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_rmap_btree.c</a></td><td class='right'>405</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.6%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 96.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_rmap_btree.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_rmap_btree.h</a></td><td class='right'>11</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_rtbitmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_rtbitmap.c</a></td><td class='right'>1293</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.6%;'/><td class='rem' style='width: 4.0%;'/><td class='none' style='width: 88.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_rtbitmap.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_rtbitmap.h</a></td><td class='right'>453</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 95.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_rtgroup.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_rtgroup.c</a></td><td class='right'>750</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 6.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 93.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_rtgroup.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_rtgroup.h</a></td><td class='right'>376</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 96.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_rtrefcount_btree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_rtrefcount_btree.c</a></td><td class='right'>757</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 6.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 93.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_rtrefcount_btree.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_rtrefcount_btree.h</a></td><td class='right'>189</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_rtrmap_btree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_rtrmap_btree.c</a></td><td class='right'>1033</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 9.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 90.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_rtrmap_btree.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_rtrmap_btree.h</a></td><td class='right'>212</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_sb.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_sb.c</a></td><td class='right'>647</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.1%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 94.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_sb.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_sb.h</a></td><td class='right'>16</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_shared.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_shared.h</a></td><td class='right'>130</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.9%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_symlink_remote.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_symlink_remote.c</a></td><td class='right'>223</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.9%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 98.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_symlink_remote.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_symlink_remote.h</a></td><td class='right'>28</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_trans_inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_trans_inode.c</a></td><td class='right'>129</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 1.0%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_trans_resv.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_trans_resv.c</a></td><td class='right'>878</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 6.7%;'/><td class='rem' style='width: 1.1%;'/><td class='none' style='width: 92.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_trans_resv.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_trans_resv.h</a></td><td class='right'>41</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_trans_space.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_trans_space.c</a></td><td class='right'>121</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_trans_space.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_trans_space.h</a></td><td class='right'>42</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_types.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_types.c</a></td><td class='right'>119</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_types.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_types.h</a></td><td class='right'>155</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_zones.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_zones.c</a></td><td class='right'>187</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/libxfs/xfs_zones.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/libxfs/xfs_zones.h</a></td><td class='right'>42</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/xfs/mrlock.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/mrlock.h</a></td><td class='right'>78</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/agb_bitmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/agb_bitmap.c</a></td><td class='right'>103</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/agb_bitmap.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/agb_bitmap.h</a></td><td class='right'>73</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/agheader.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/agheader.c</a></td><td class='right'>307</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.0%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 97.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/agheader_repair.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/agheader_repair.c</a></td><td class='right'>1224</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 9.4%;'/><td class='rem' style='width: 1.6%;'/><td class='none' style='width: 89.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/agino_bitmap.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/agino_bitmap.h</a></td><td class='right'>49</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/alloc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/alloc.c</a></td><td class='right'>120</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/alloc_repair.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/alloc_repair.c</a></td><td class='right'>934</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 8.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 91.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/attr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/attr.c</a></td><td class='right'>456</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.8%;'/><td class='rem' style='width: 1.3%;'/><td class='none' style='width: 95.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/attr.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/attr.h</a></td><td class='right'>67</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/attr_repair.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/attr_repair.c</a></td><td class='right'>1663</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 14.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 85.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/attr_repair.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/attr_repair.h</a></td><td class='right'>15</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/bitmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/bitmap.c</a></td><td class='right'>720</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.4%;'/><td class='rem' style='width: 2.0%;'/><td class='none' style='width: 93.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/bitmap.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/bitmap.h</a></td><td class='right'>76</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/bmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/bmap.c</a></td><td class='right'>756</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.3%;'/><td class='rem' style='width: 1.5%;'/><td class='none' style='width: 93.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/bmap_repair.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/bmap_repair.c</a></td><td class='right'>996</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 9.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 91.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/btree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/btree.c</a></td><td class='right'>176</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/btree.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/btree.h</a></td><td class='right'>18</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/common.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/common.c</a></td><td class='right'>1163</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 9.0%;'/><td class='rem' style='width: 1.4%;'/><td class='none' style='width: 89.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/common.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/common.h</a></td><td class='right'>223</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.6%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 98.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/cow_repair.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/cow_repair.c</a></td><td class='right'>757</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 6.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 93.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/dab_bitmap.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/dab_bitmap.h</a></td><td class='right'>37</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/dabtree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/dabtree.c</a></td><td class='right'>37</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/dabtree.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/dabtree.h</a></td><td class='right'>9</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/dir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/dir.c</a></td><td class='right'>658</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.4%;'/><td class='rem' style='width: 1.5%;'/><td class='none' style='width: 94.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/dir_repair.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/dir_repair.c</a></td><td class='right'>1964</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 17.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 82.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/dirtree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/dirtree.c</a></td><td class='right'>1009</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 9.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 90.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/dirtree.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/dirtree.h</a></td><td class='right'>168</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.5%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/dirtree_repair.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/dirtree_repair.c</a></td><td class='right'>821</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 92.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/dqiterate.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/dqiterate.c</a></td><td class='right'>211</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/findparent.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/findparent.c</a></td><td class='right'>470</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 95.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/findparent.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/findparent.h</a></td><td class='right'>56</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/fsb_bitmap.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/fsb_bitmap.h</a></td><td class='right'>37</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/fscounters.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/fscounters.c</a></td><td class='right'>343</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.6%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 96.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/fscounters.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/fscounters.h</a></td><td class='right'>21</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/fscounters_repair.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/fscounters_repair.c</a></td><td class='right'>85</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/health.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/health.c</a></td><td class='right'>226</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.5%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/health.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/health.h</a></td><td class='right'>13</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/ialloc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/ialloc.c</a></td><td class='right'>375</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.3%;'/><td class='rem' style='width: 1.1%;'/><td class='none' style='width: 96.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/ialloc_repair.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/ialloc_repair.c</a></td><td class='right'>877</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 92.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/ino_bitmap.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/ino_bitmap.h</a></td><td class='right'>37</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/inode.c</a></td><td class='right'>339</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.6%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 97.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/inode_repair.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/inode_repair.c</a></td><td class='right'>2090</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 18.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 81.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/iscan.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/iscan.c</a></td><td class='right'>826</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 92.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/iscan.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/iscan.h</a></td><td class='right'>100</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/listxattr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/listxattr.c</a></td><td class='right'>320</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/listxattr.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/listxattr.h</a></td><td class='right'>19</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/metapath.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/metapath.c</a></td><td class='right'>677</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 6.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 93.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/newbt.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/newbt.c</a></td><td class='right'>613</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.5%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 94.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/newbt.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/newbt.h</a></td><td class='right'>76</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/nlinks.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/nlinks.c</a></td><td class='right'>1073</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 9.6%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 90.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/nlinks.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/nlinks.h</a></td><td class='right'>109</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/nlinks_repair.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/nlinks_repair.c</a></td><td class='right'>349</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 96.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/off_bitmap.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/off_bitmap.h</a></td><td class='right'>37</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/orphanage.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/orphanage.c</a></td><td class='right'>626</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.6%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 94.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/orphanage.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/orphanage.h</a></td><td class='right'>86</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/parent.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/parent.c</a></td><td class='right'>998</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.3%;'/><td class='rem' style='width: 1.7%;'/><td class='none' style='width: 91.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/parent_repair.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/parent_repair.c</a></td><td class='right'>1633</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 14.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 85.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/quota.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/quota.c</a></td><td class='right'>149</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.1%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 98.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/quota.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/quota.h</a></td><td class='right'>36</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/quota_repair.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/quota_repair.c</a></td><td class='right'>566</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 94.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/quotacheck.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/quotacheck.c</a></td><td class='right'>867</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 92.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/quotacheck.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/quotacheck.h</a></td><td class='right'>76</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/quotacheck_repair.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/quotacheck_repair.c</a></td><td class='right'>248</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/rcbag.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/rcbag.c</a></td><td class='right'>307</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/rcbag.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/rcbag.h</a></td><td class='right'>28</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/rcbag_btree.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/rcbag_btree.c</a></td><td class='right'>352</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 96.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/rcbag_btree.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/rcbag_btree.h</a></td><td class='right'>81</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/readdir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/readdir.c</a></td><td class='right'>421</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 96.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/readdir.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/readdir.h</a></td><td class='right'>22</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/reap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/reap.c</a></td><td class='right'>1695</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 15.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 84.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/reap.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/reap.h</a></td><td class='right'>47</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/refcount.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/refcount.c</a></td><td class='right'>279</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.9%;'/><td class='rem' style='width: 0.6%;'/><td class='none' style='width: 97.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/refcount_repair.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/refcount_repair.c</a></td><td class='right'>750</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 6.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 93.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/repair.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/repair.c</a></td><td class='right'>1130</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.1%;'/><td class='rem' style='width: 3.1%;'/><td class='none' style='width: 89.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/repair.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/repair.h</a></td><td class='right'>219</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.8%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 98.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/rgb_bitmap.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/rgb_bitmap.h</a></td><td class='right'>37</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/rgsuper.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/rgsuper.c</a></td><td class='right'>88</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/rmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/rmap.c</a></td><td class='right'>579</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.5%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 94.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/rmap_repair.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/rmap_repair.c</a></td><td class='right'>1737</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 15.6%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 84.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/rtb_bitmap.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/rtb_bitmap.h</a></td><td class='right'>37</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/rtbitmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/rtbitmap.c</a></td><td class='right'>271</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.7%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 97.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/rtbitmap.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/rtbitmap.h</a></td><td class='right'>77</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/rtbitmap_repair.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/rtbitmap_repair.c</a></td><td class='right'>635</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 94.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/rtrefcount.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/rtrefcount.c</a></td><td class='right'>661</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 94.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/rtrefcount_repair.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/rtrefcount_repair.c</a></td><td class='right'>761</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 6.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 93.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/rtrmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/rtrmap.c</a></td><td class='right'>323</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/rtrmap_repair.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/rtrmap_repair.c</a></td><td class='right'>981</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 8.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 91.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/rtsummary.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/rtsummary.c</a></td><td class='right'>373</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 96.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/rtsummary.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/rtsummary.h</a></td><td class='right'>37</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/rtsummary_repair.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/rtsummary_repair.c</a></td><td class='right'>186</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/scrub.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/scrub.c</a></td><td class='right'>621</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.7%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 94.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/scrub.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/scrub.h</a></td><td class='right'>251</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.9%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 97.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/stats.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/stats.c</a></td><td class='right'>415</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 96.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/stats.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/stats.h</a></td><td class='right'>59</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/symlink.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/symlink.c</a></td><td class='right'>50</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/symlink_repair.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/symlink_repair.c</a></td><td class='right'>510</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.6%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 95.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/tempexch.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/tempexch.h</a></td><td class='right'>22</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/tempfile.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/tempfile.c</a></td><td class='right'>980</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 8.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 91.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/tempfile.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/tempfile.h</a></td><td class='right'>51</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/trace.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/trace.c</a></td><td class='right'>31</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/trace.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/trace.h</a></td><td class='right'>3242</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 27.9%;'/><td class='rem' style='width: 1.2%;'/><td class='none' style='width: 70.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/xfarray.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/xfarray.c</a></td><td class='right'>1073</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 9.6%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 90.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/xfarray.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/xfarray.h</a></td><td class='right'>193</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.7%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/xfblob.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/xfblob.c</a></td><td class='right'>168</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.5%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/xfblob.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/xfblob.h</a></td><td class='right'>50</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/xfile.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/xfile.c</a></td><td class='right'>324</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/xfile.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/xfile.h</a></td><td class='right'>35</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/scrub/xfs_scrub.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/scrub/xfs_scrub.h</a></td><td class='right'>12</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs.h</a></td><td class='right'>4</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_acl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_acl.c</a></td><td class='right'>31</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_acl.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_acl.h</a></td><td class='right'>10</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_aops.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_aops.c</a></td><td class='right'>529</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.5%;'/><td class='rem' style='width: 1.3%;'/><td class='none' style='width: 95.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_aops.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_aops.h</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_attr_inactive.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_attr_inactive.c</a></td><td class='right'>33</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_attr_item.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_attr_item.c</a></td><td class='right'>1257</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 11.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 88.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_attr_item.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_attr_item.h</a></td><td class='right'>64</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_attr_list.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_attr_list.c</a></td><td class='right'>162</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_bio_io.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_bio_io.c</a></td><td class='right'>71</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_bmap_item.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_bmap_item.c</a></td><td class='right'>499</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.4%;'/><td class='rem' style='width: 2.1%;'/><td class='none' style='width: 95.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_bmap_item.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_bmap_item.h</a></td><td class='right'>7</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_bmap_util.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_bmap_util.c</a></td><td class='right'>497</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.8%;'/><td class='rem' style='width: 2.7%;'/><td class='none' style='width: 95.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_bmap_util.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_bmap_util.h</a></td><td class='right'>18</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_buf.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_buf.c</a></td><td class='right'>1899</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.6%;'/><td class='rem' style='width: 9.4%;'/><td class='none' style='width: 82.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_buf.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_buf.h</a></td><td class='right'>152</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_buf_item.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_buf_item.c</a></td><td class='right'>549</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.7%;'/><td class='rem' style='width: 2.3%;'/><td class='none' style='width: 95.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_buf_item.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_buf_item.h</a></td><td class='right'>37</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_buf_item_recover.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_buf_item_recover.c</a></td><td class='right'>286</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.3%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 97.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_buf_mem.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_buf_mem.c</a></td><td class='right'>247</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_buf_mem.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_buf_mem.h</a></td><td class='right'>32</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_dahash_test.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_dahash_test.c</a></td><td class='right'>673</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 6.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 94.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_dahash_test.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_dahash_test.h</a></td><td class='right'>12</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_dir2_readdir.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_dir2_readdir.c</a></td><td class='right'>75</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_discard.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_discard.c</a></td><td class='right'>849</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 6.9%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 92.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_discard.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_discard.h</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_dquot.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_dquot.c</a></td><td class='right'>635</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.4%;'/><td class='rem' style='width: 2.3%;'/><td class='none' style='width: 94.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_dquot.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_dquot.h</a></td><td class='right'>66</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_dquot_item.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_dquot_item.c</a></td><td class='right'>72</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_dquot_item.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_dquot_item.h</a></td><td class='right'>7</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_dquot_item_recover.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_dquot_item_recover.c</a></td><td class='right'>41</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_drain.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_drain.c</a></td><td class='right'>152</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_drain.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_drain.h</a></td><td class='right'>87</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_error.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_error.c</a></td><td class='right'>251</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 1.6%;'/><td class='none' style='width: 97.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_error.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_error.h</a></td><td class='right'>92</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_exchmaps_item.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_exchmaps_item.c</a></td><td class='right'>614</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.5%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 94.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_exchmaps_item.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_exchmaps_item.h</a></td><td class='right'>64</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_exchrange.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_exchrange.c</a></td><td class='right'>923</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 8.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 91.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_exchrange.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_exchrange.h</a></td><td class='right'>52</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_export.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_export.c</a></td><td class='right'>18</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_export.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_export.h</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_extent_busy.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_extent_busy.c</a></td><td class='right'>340</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.0%;'/><td class='rem' style='width: 1.1%;'/><td class='none' style='width: 96.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_extent_busy.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_extent_busy.h</a></td><td class='right'>83</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_extfree_item.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_extfree_item.c</a></td><td class='right'>820</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.9%;'/><td class='rem' style='width: 2.5%;'/><td class='none' style='width: 92.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_extfree_item.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_extfree_item.h</a></td><td class='right'>29</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_file.c</a></td><td class='right'>1479</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 8.9%;'/><td class='rem' style='width: 4.4%;'/><td class='none' style='width: 86.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_file.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_file.h</a></td><td class='right'>15</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_filestream.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_filestream.c</a></td><td class='right'>448</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.0%;'/><td class='rem' style='width: 2.0%;'/><td class='none' style='width: 96.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_filestream.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_filestream.h</a></td><td class='right'>6</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_fsmap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_fsmap.c</a></td><td class='right'>1089</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 6.9%;'/><td class='rem' style='width: 2.9%;'/><td class='none' style='width: 90.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_fsmap.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_fsmap.h</a></td><td class='right'>19</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_fsops.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_fsops.c</a></td><td class='right'>285</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 1.4%;'/><td class='none' style='width: 97.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_fsops.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_fsops.h</a></td><td class='right'>15</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_globals.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_globals.c</a></td><td class='right'>20</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_handle.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_handle.c</a></td><td class='right'>922</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 8.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 91.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_handle.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_handle.h</a></td><td class='right'>33</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_health.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_health.c</a></td><td class='right'>367</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.5%;'/><td class='rem' style='width: 0.8%;'/><td class='none' style='width: 96.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_hooks.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_hooks.c</a></td><td class='right'>52</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.5%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_hooks.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_hooks.h</a></td><td class='right'>65</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_icache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_icache.c</a></td><td class='right'>621</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.3%;'/><td class='rem' style='width: 2.3%;'/><td class='none' style='width: 94.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_icache.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_icache.h</a></td><td class='right'>21</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_icreate_item.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_icreate_item.c</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_inode.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_inode.c</a></td><td class='right'>2890</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 9.6%;'/><td class='rem' style='width: 16.3%;'/><td class='none' style='width: 74.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_inode.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_inode.h</a></td><td class='right'>323</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.2%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 97.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_inode_item.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_inode_item.c</a></td><td class='right'>537</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.0%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 95.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_inode_item.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_inode_item.h</a></td><td class='right'>16</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_inode_item_recover.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_inode_item_recover.c</a></td><td class='right'>273</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.7%;'/><td class='rem' style='width: 0.7%;'/><td class='none' style='width: 97.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_ioctl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_ioctl.c</a></td><td class='right'>1316</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.3%;'/><td class='rem' style='width: 9.5%;'/><td class='none' style='width: 88.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_ioctl.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_ioctl.h</a></td><td class='right'>39</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_ioctl32.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_ioctl32.c</a></td><td class='right'>34</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_ioctl32.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_ioctl32.h</a></td><td class='right'>24</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_iomap.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_iomap.c</a></td><td class='right'>1410</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 10.8%;'/><td class='rem' style='width: 1.9%;'/><td class='none' style='width: 87.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_iomap.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_iomap.h</a></td><td class='right'>19</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_iops.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_iops.c</a></td><td class='right'>574</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.0%;'/><td class='rem' style='width: 2.2%;'/><td class='none' style='width: 94.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_iops.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_iops.h</a></td><td class='right'>16</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_itable.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_itable.c</a></td><td class='right'>127</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_itable.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_itable.h</a></td><td class='right'>12</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_iunlink_item.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_iunlink_item.c</a></td><td class='right'>177</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.6%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_iunlink_item.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_iunlink_item.h</a></td><td class='right'>27</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_iwalk.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_iwalk.c</a></td><td class='right'>176</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 98.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_iwalk.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_iwalk.h</a></td><td class='right'>9</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_linux.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_linux.h</a></td><td class='right'>48</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_log.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_log.c</a></td><td class='right'>1916</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 6.6%;'/><td class='rem' style='width: 10.6%;'/><td class='none' style='width: 82.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_log.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_log.h</a></td><td class='right'>138</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_log_cil.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_log_cil.c</a></td><td class='right'>1160</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.3%;'/><td class='rem' style='width: 3.1%;'/><td class='none' style='width: 89.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_log_priv.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_log_priv.h</a></td><td class='right'>284</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.5%;'/><td class='rem' style='width: 1.1%;'/><td class='none' style='width: 97.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_log_recover.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_log_recover.c</a></td><td class='right'>820</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.7%;'/><td class='rem' style='width: 3.6%;'/><td class='none' style='width: 92.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_message.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_message.c</a></td><td class='right'>97</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_message.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_message.h</a></td><td class='right'>66</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_mount.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_mount.c</a></td><td class='right'>699</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.5%;'/><td class='rem' style='width: 1.8%;'/><td class='none' style='width: 93.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_mount.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_mount.h</a></td><td class='right'>432</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.4%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 96.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_mru_cache.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_mru_cache.c</a></td><td class='right'>51</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_notify_failure.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_notify_failure.c</a></td><td class='right'>386</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.5%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 96.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_notify_failure.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_notify_failure.h</a></td><td class='right'>11</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='del'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_ondisk.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_ondisk.h</a></td><td class='right'>177</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 1.6%;'/><td class='none' style='width: 98.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_pnfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_pnfs.c</a></td><td class='right'>54</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_qm.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_qm.c</a></td><td class='right'>810</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.6%;'/><td class='rem' style='width: 2.7%;'/><td class='none' style='width: 92.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_qm.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_qm.h</a></td><td class='right'>31</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_qm_bhv.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_qm_bhv.c</a></td><td class='right'>119</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.8%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_qm_syscalls.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_qm_syscalls.c</a></td><td class='right'>82</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_quota.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_quota.h</a></td><td class='right'>83</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_quotaops.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_quotaops.c</a></td><td class='right'>65</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_refcount_item.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_refcount_item.c</a></td><td class='right'>695</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 3.8%;'/><td class='rem' style='width: 2.4%;'/><td class='none' style='width: 93.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_refcount_item.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_refcount_item.h</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_reflink.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_reflink.c</a></td><td class='right'>828</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 5.5%;'/><td class='rem' style='width: 2.0%;'/><td class='none' style='width: 92.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_reflink.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_reflink.h</a></td><td class='right'>34</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_rmap_item.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_rmap_item.c</a></td><td class='right'>753</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.2%;'/><td class='rem' style='width: 2.6%;'/><td class='none' style='width: 93.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_rmap_item.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_rmap_item.h</a></td><td class='right'>7</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_rtalloc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_rtalloc.c</a></td><td class='right'>2677</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 15.7%;'/><td class='rem' style='width: 8.4%;'/><td class='none' style='width: 75.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_rtalloc.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_rtalloc.h</a></td><td class='right'>129</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.9%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_stats.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_stats.c</a></td><td class='right'>18</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_stats.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_stats.h</a></td><td class='right'>5</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_super.c</a></td><td class='right'>1262</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.4%;'/><td class='rem' style='width: 3.9%;'/><td class='none' style='width: 88.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_super.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_super.h</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_symlink.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_symlink.c</a></td><td class='right'>312</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.7%;'/><td class='rem' style='width: 2.1%;'/><td class='none' style='width: 97.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_symlink.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_symlink.h</a></td><td class='right'>3</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_sysctl.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_sysctl.c</a></td><td class='right'>59</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.5%;'/><td class='none' style='width: 99.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_sysctl.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_sysctl.h</a></td><td class='right'>8</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_sysfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_sysfs.c</a></td><td class='right'>261</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.9%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 97.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_sysfs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_sysfs.h</a></td><td class='right'>20</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_trace.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_trace.c</a></td><td class='right'>17</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_trace.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_trace.h</a></td><td class='right'>3086</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 21.7%;'/><td class='rem' style='width: 6.0%;'/><td class='none' style='width: 72.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_trans.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_trans.c</a></td><td class='right'>840</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 4.8%;'/><td class='rem' style='width: 2.8%;'/><td class='none' style='width: 92.5%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_trans.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_trans.h</a></td><td class='right'>91</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.4%;'/><td class='rem' style='width: 0.4%;'/><td class='none' style='width: 99.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_trans_ail.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_trans_ail.c</a></td><td class='right'>328</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.6%;'/><td class='rem' style='width: 1.3%;'/><td class='none' style='width: 97.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_trans_buf.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_trans_buf.c</a></td><td class='right'>75</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_trans_dquot.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_trans_dquot.c</a></td><td class='right'>256</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.1%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 97.7%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_trans_priv.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_trans_priv.h</a></td><td class='right'>74</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.3%;'/><td class='rem' style='width: 0.3%;'/><td class='none' style='width: 99.3%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_xattr.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_xattr.c</a></td><td class='right'>153</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.3%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 98.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_xattr.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_xattr.h</a></td><td class='right'>14</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_zone_alloc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_zone_alloc.c</a></td><td class='right'>1328</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 11.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 88.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_zone_alloc.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_zone_alloc.h</a></td><td class='right'>70</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.6%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.4%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_zone_gc.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_zone_gc.c</a></td><td class='right'>1214</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 10.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 89.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_zone_info.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_zone_info.c</a></td><td class='right'>105</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.9%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 99.1%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_zone_priv.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_zone_priv.h</a></td><td class='right'>122</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.1%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/xfs/xfs_zone_space_resv.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/xfs/xfs_zone_space_resv.c</a></td><td class='right'>262</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 2.4%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 97.6%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/zonefs/Makefile?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/zonefs/Makefile</a></td><td class='right'>2</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.0%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 100.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/zonefs/file.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/zonefs/file.c</a></td><td class='right'>873</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.8%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 92.2%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/zonefs/super.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/zonefs/super.c</a></td><td class='right'>2005</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 7.6%;'/><td class='rem' style='width: 10.4%;'/><td class='none' style='width: 82.0%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='add'><a href='/cgit/linux-arm.git/diff/fs/zonefs/sysfs.c?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/zonefs/sysfs.c</a></td><td class='right'>135</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.2%;'/><td class='rem' style='width: 0.0%;'/><td class='none' style='width: 98.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/zonefs/trace.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/zonefs/trace.h</a></td><td class='right'>22</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 0.1%;'/><td class='rem' style='width: 0.1%;'/><td class='none' style='width: 99.8%;'/></tr></table></td></tr>
<tr><td class='mode'>-rw-r--r--</td><td class='upd'><a href='/cgit/linux-arm.git/diff/fs/zonefs/zonefs.h?id2=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/zonefs/zonefs.h</a></td><td class='right'>124</td><td class='graph'><table summary='file diffstat' width='100%'><tr><td class='add' style='width: 1.0%;'/><td class='rem' style='width: 0.2%;'/><td class='none' style='width: 98.9%;'/></tr></table></td></tr>
</table><div class='diffstat-summary'>2163 files changed, 428567 insertions, 321798 deletions</div><table summary='diff' class='diff'><tr><td><div class='head'>diff --git a/fs/9p/Kconfig b/fs/9p/Kconfig<br/>index d7bc93447c85..0c63df574ee7 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/9p/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/9p/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/9p/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/9p/Kconfig</a></div><div class='hunk'>@@ -1,7 +1,7 @@</div><div class='ctx'> # SPDX-License-Identifier: GPL-2.0-only</div><div class='ctx'> config 9P_FS</div><div class='ctx'> 	tristate "Plan 9 Resource Sharing Support (9P2000)"</div><div class='del'>-	depends on INET &amp;&amp; NET_9P</div><div class='add'>+	depends on NET_9P</div><div class='ctx'> 	select NETFS_SUPPORT</div><div class='ctx'> 	help</div><div class='ctx'> 	  If you say Y here, you will get experimental support for</div><div class='head'>diff --git a/fs/9p/acl.c b/fs/9p/acl.c<br/>index 4dac4a0dc5f4..633da5e37299 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/9p/acl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/9p/acl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/9p/acl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/9p/acl.c</a></div><div class='hunk'>@@ -6,6 +6,7 @@</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/module.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/fs_struct.h&gt;</div><div class='ctx'> #include &lt;net/9p/9p.h&gt;</div><div class='ctx'> #include &lt;net/9p/client.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='hunk'>@@ -17,34 +18,64 @@</div><div class='ctx'> #include "v9fs_vfs.h"</div><div class='ctx'> #include "fid.h"</div><div class='ctx'> </div><div class='del'>-static struct posix_acl *__v9fs_get_acl(struct p9_fid *fid, char *name)</div><div class='add'>+static struct posix_acl *v9fs_fid_get_acl(struct p9_fid *fid, const char *name)</div><div class='ctx'> {</div><div class='ctx'> 	ssize_t size;</div><div class='ctx'> 	void *value = NULL;</div><div class='ctx'> 	struct posix_acl *acl = NULL;</div><div class='ctx'> </div><div class='ctx'> 	size = v9fs_fid_xattr_get(fid, name, NULL, 0);</div><div class='del'>-	if (size &gt; 0) {</div><div class='del'>-		value = kzalloc(size, GFP_NOFS);</div><div class='del'>-		if (!value)</div><div class='del'>-			return ERR_PTR(-ENOMEM);</div><div class='del'>-		size = v9fs_fid_xattr_get(fid, name, value, size);</div><div class='del'>-		if (size &gt; 0) {</div><div class='del'>-			acl = posix_acl_from_xattr(&amp;init_user_ns, value, size);</div><div class='del'>-			if (IS_ERR(acl))</div><div class='del'>-				goto err_out;</div><div class='del'>-		}</div><div class='del'>-	} else if (size == -ENODATA || size == 0 ||</div><div class='del'>-		   size == -ENOSYS || size == -EOPNOTSUPP) {</div><div class='del'>-		acl = NULL;</div><div class='del'>-	} else</div><div class='del'>-		acl = ERR_PTR(-EIO);</div><div class='del'>-</div><div class='del'>-err_out:</div><div class='add'>+	if (size &lt; 0)</div><div class='add'>+		return ERR_PTR(size);</div><div class='add'>+	if (size == 0)</div><div class='add'>+		return ERR_PTR(-ENODATA);</div><div class='add'>+</div><div class='add'>+	value = kzalloc(size, GFP_NOFS);</div><div class='add'>+	if (!value)</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+</div><div class='add'>+	size = v9fs_fid_xattr_get(fid, name, value, size);</div><div class='add'>+	if (size &lt; 0)</div><div class='add'>+		acl = ERR_PTR(size);</div><div class='add'>+	else if (size == 0)</div><div class='add'>+		acl = ERR_PTR(-ENODATA);</div><div class='add'>+	else</div><div class='add'>+		acl = posix_acl_from_xattr(&amp;init_user_ns, value, size);</div><div class='ctx'> 	kfree(value);</div><div class='ctx'> 	return acl;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static struct posix_acl *v9fs_acl_get(struct dentry *dentry, const char *name)</div><div class='add'>+{</div><div class='add'>+	struct p9_fid *fid;</div><div class='add'>+	struct posix_acl *acl = NULL;</div><div class='add'>+</div><div class='add'>+	fid = v9fs_fid_lookup(dentry);</div><div class='add'>+	if (IS_ERR(fid))</div><div class='add'>+		return ERR_CAST(fid);</div><div class='add'>+</div><div class='add'>+	acl = v9fs_fid_get_acl(fid, name);</div><div class='add'>+	p9_fid_put(fid);</div><div class='add'>+	return acl;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct posix_acl *__v9fs_get_acl(struct p9_fid *fid, const char *name)</div><div class='add'>+{</div><div class='add'>+	int retval;</div><div class='add'>+	struct posix_acl *acl = NULL;</div><div class='add'>+</div><div class='add'>+	acl = v9fs_fid_get_acl(fid, name);</div><div class='add'>+	if (!IS_ERR(acl))</div><div class='add'>+		return acl;</div><div class='add'>+</div><div class='add'>+	retval = PTR_ERR(acl);</div><div class='add'>+	if (retval == -ENODATA || retval == -ENOSYS || retval == -EOPNOTSUPP)</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	/* map everything else to -EIO */</div><div class='add'>+	return ERR_PTR(-EIO);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> int v9fs_get_acl(struct inode *inode, struct p9_fid *fid)</div><div class='ctx'> {</div><div class='ctx'> 	int retval = 0;</div><div class='hunk'>@@ -89,7 +120,7 @@ static struct posix_acl *v9fs_get_cached_acl(struct inode *inode, int type)</div><div class='ctx'> 	return acl;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct posix_acl *v9fs_iop_get_acl(struct inode *inode, int type, bool rcu)</div><div class='add'>+struct posix_acl *v9fs_iop_get_inode_acl(struct inode *inode, int type, bool rcu)</div><div class='ctx'> {</div><div class='ctx'> 	struct v9fs_session_info *v9ses;</div><div class='ctx'> </div><div class='hunk'>@@ -109,6 +140,112 @@ struct posix_acl *v9fs_iop_get_acl(struct inode *inode, int type, bool rcu)</div><div class='ctx'> </div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+struct posix_acl *v9fs_iop_get_acl(struct mnt_idmap *idmap,</div><div class='add'>+				   struct dentry *dentry, int type)</div><div class='add'>+{</div><div class='add'>+	struct v9fs_session_info *v9ses;</div><div class='add'>+</div><div class='add'>+	v9ses = v9fs_dentry2v9ses(dentry);</div><div class='add'>+	/* We allow set/get/list of acl when access=client is not specified. */</div><div class='add'>+	if ((v9ses-&gt;flags &amp; V9FS_ACCESS_MASK) != V9FS_ACCESS_CLIENT)</div><div class='add'>+		return v9fs_acl_get(dentry, posix_acl_xattr_name(type));</div><div class='add'>+	return v9fs_get_cached_acl(d_inode(dentry), type);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int v9fs_iop_set_acl(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='add'>+		     struct posix_acl *acl, int type)</div><div class='add'>+{</div><div class='add'>+	int retval;</div><div class='add'>+	size_t size = 0;</div><div class='add'>+	void *value = NULL;</div><div class='add'>+	const char *acl_name;</div><div class='add'>+	struct v9fs_session_info *v9ses;</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='add'>+</div><div class='add'>+	if (acl) {</div><div class='add'>+		retval = posix_acl_valid(inode-&gt;i_sb-&gt;s_user_ns, acl);</div><div class='add'>+		if (retval)</div><div class='add'>+			goto err_out;</div><div class='add'>+</div><div class='add'>+		size = posix_acl_xattr_size(acl-&gt;a_count);</div><div class='add'>+</div><div class='add'>+		value = kzalloc(size, GFP_NOFS);</div><div class='add'>+		if (!value) {</div><div class='add'>+			retval = -ENOMEM;</div><div class='add'>+			goto err_out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		retval = posix_acl_to_xattr(&amp;init_user_ns, acl, value, size);</div><div class='add'>+		if (retval &lt; 0)</div><div class='add'>+			goto err_out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * set the attribute on the remote. Without even looking at the</div><div class='add'>+	 * xattr value. We leave it to the server to validate</div><div class='add'>+	 */</div><div class='add'>+	acl_name = posix_acl_xattr_name(type);</div><div class='add'>+	v9ses = v9fs_dentry2v9ses(dentry);</div><div class='add'>+	if ((v9ses-&gt;flags &amp; V9FS_ACCESS_MASK) != V9FS_ACCESS_CLIENT) {</div><div class='add'>+		retval = v9fs_xattr_set(dentry, acl_name, value, size, 0);</div><div class='add'>+		goto err_out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (S_ISLNK(inode-&gt;i_mode)) {</div><div class='add'>+		retval = -EOPNOTSUPP;</div><div class='add'>+		goto err_out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!inode_owner_or_capable(&amp;nop_mnt_idmap, inode)) {</div><div class='add'>+		retval = -EPERM;</div><div class='add'>+		goto err_out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	switch (type) {</div><div class='add'>+	case ACL_TYPE_ACCESS:</div><div class='add'>+		if (acl) {</div><div class='add'>+			struct iattr iattr = {};</div><div class='add'>+			struct posix_acl *acl_mode = acl;</div><div class='add'>+</div><div class='add'>+			retval = posix_acl_update_mode(&amp;nop_mnt_idmap, inode,</div><div class='add'>+						       &amp;iattr.ia_mode,</div><div class='add'>+						       &amp;acl_mode);</div><div class='add'>+			if (retval)</div><div class='add'>+				goto err_out;</div><div class='add'>+			if (!acl_mode) {</div><div class='add'>+				/*</div><div class='add'>+				 * ACL can be represented by the mode bits.</div><div class='add'>+				 * So don't update ACL below.</div><div class='add'>+				 */</div><div class='add'>+				kfree(value);</div><div class='add'>+				value = NULL;</div><div class='add'>+				size = 0;</div><div class='add'>+			}</div><div class='add'>+			iattr.ia_valid = ATTR_MODE;</div><div class='add'>+			/*</div><div class='add'>+			 * FIXME should we update ctime ?</div><div class='add'>+			 * What is the following setxattr update the mode ?</div><div class='add'>+			 */</div><div class='add'>+			v9fs_vfs_setattr_dotl(&amp;nop_mnt_idmap, dentry, &amp;iattr);</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='add'>+	case ACL_TYPE_DEFAULT:</div><div class='add'>+		if (!S_ISDIR(inode-&gt;i_mode)) {</div><div class='add'>+			retval = acl ? -EINVAL : 0;</div><div class='add'>+			goto err_out;</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	retval = v9fs_xattr_set(dentry, acl_name, value, size, 0);</div><div class='add'>+	if (!retval)</div><div class='add'>+		set_cached_acl(inode, type, acl);</div><div class='add'>+</div><div class='add'>+err_out:</div><div class='add'>+	kfree(value);</div><div class='add'>+	return retval;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int v9fs_set_acl(struct p9_fid *fid, int type, struct posix_acl *acl)</div><div class='ctx'> {</div><div class='ctx'> 	int retval;</div><div class='hunk'>@@ -207,124 +344,3 @@ int v9fs_acl_mode(struct inode *dir, umode_t *modep,</div><div class='ctx'> 	*modep  = mode;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='del'>-</div><div class='del'>-static int v9fs_xattr_get_acl(const struct xattr_handler *handler,</div><div class='del'>-			      struct dentry *dentry, struct inode *inode,</div><div class='del'>-			      const char *name, void *buffer, size_t size)</div><div class='del'>-{</div><div class='del'>-	struct v9fs_session_info *v9ses;</div><div class='del'>-	struct posix_acl *acl;</div><div class='del'>-	int error;</div><div class='del'>-</div><div class='del'>-	v9ses = v9fs_dentry2v9ses(dentry);</div><div class='del'>-	/*</div><div class='del'>-	 * We allow set/get/list of acl when access=client is not specified</div><div class='del'>-	 */</div><div class='del'>-	if ((v9ses-&gt;flags &amp; V9FS_ACCESS_MASK) != V9FS_ACCESS_CLIENT)</div><div class='del'>-		return v9fs_xattr_get(dentry, handler-&gt;name, buffer, size);</div><div class='del'>-</div><div class='del'>-	acl = v9fs_get_cached_acl(inode, handler-&gt;flags);</div><div class='del'>-	if (IS_ERR(acl))</div><div class='del'>-		return PTR_ERR(acl);</div><div class='del'>-	if (acl == NULL)</div><div class='del'>-		return -ENODATA;</div><div class='del'>-	error = posix_acl_to_xattr(&amp;init_user_ns, acl, buffer, size);</div><div class='del'>-	posix_acl_release(acl);</div><div class='del'>-</div><div class='del'>-	return error;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int v9fs_xattr_set_acl(const struct xattr_handler *handler,</div><div class='del'>-			      struct user_namespace *mnt_userns,</div><div class='del'>-			      struct dentry *dentry, struct inode *inode,</div><div class='del'>-			      const char *name, const void *value,</div><div class='del'>-			      size_t size, int flags)</div><div class='del'>-{</div><div class='del'>-	int retval;</div><div class='del'>-	struct posix_acl *acl;</div><div class='del'>-	struct v9fs_session_info *v9ses;</div><div class='del'>-</div><div class='del'>-	v9ses = v9fs_dentry2v9ses(dentry);</div><div class='del'>-	/*</div><div class='del'>-	 * set the attribute on the remote. Without even looking at the</div><div class='del'>-	 * xattr value. We leave it to the server to validate</div><div class='del'>-	 */</div><div class='del'>-	if ((v9ses-&gt;flags &amp; V9FS_ACCESS_MASK) != V9FS_ACCESS_CLIENT)</div><div class='del'>-		return v9fs_xattr_set(dentry, handler-&gt;name, value, size,</div><div class='del'>-				      flags);</div><div class='del'>-</div><div class='del'>-	if (S_ISLNK(inode-&gt;i_mode))</div><div class='del'>-		return -EOPNOTSUPP;</div><div class='del'>-	if (!inode_owner_or_capable(&amp;init_user_ns, inode))</div><div class='del'>-		return -EPERM;</div><div class='del'>-	if (value) {</div><div class='del'>-		/* update the cached acl value */</div><div class='del'>-		acl = posix_acl_from_xattr(&amp;init_user_ns, value, size);</div><div class='del'>-		if (IS_ERR(acl))</div><div class='del'>-			return PTR_ERR(acl);</div><div class='del'>-		else if (acl) {</div><div class='del'>-			retval = posix_acl_valid(inode-&gt;i_sb-&gt;s_user_ns, acl);</div><div class='del'>-			if (retval)</div><div class='del'>-				goto err_out;</div><div class='del'>-		}</div><div class='del'>-	} else</div><div class='del'>-		acl = NULL;</div><div class='del'>-</div><div class='del'>-	switch (handler-&gt;flags) {</div><div class='del'>-	case ACL_TYPE_ACCESS:</div><div class='del'>-		if (acl) {</div><div class='del'>-			struct iattr iattr = { 0 };</div><div class='del'>-			struct posix_acl *old_acl = acl;</div><div class='del'>-</div><div class='del'>-			retval = posix_acl_update_mode(&amp;init_user_ns, inode,</div><div class='del'>-						       &amp;iattr.ia_mode, &amp;acl);</div><div class='del'>-			if (retval)</div><div class='del'>-				goto err_out;</div><div class='del'>-			if (!acl) {</div><div class='del'>-				/*</div><div class='del'>-				 * ACL can be represented</div><div class='del'>-				 * by the mode bits. So don't</div><div class='del'>-				 * update ACL.</div><div class='del'>-				 */</div><div class='del'>-				posix_acl_release(old_acl);</div><div class='del'>-				value = NULL;</div><div class='del'>-				size = 0;</div><div class='del'>-			}</div><div class='del'>-			iattr.ia_valid = ATTR_MODE;</div><div class='del'>-			/* FIXME should we update ctime ?</div><div class='del'>-			 * What is the following setxattr update the</div><div class='del'>-			 * mode ?</div><div class='del'>-			 */</div><div class='del'>-			v9fs_vfs_setattr_dotl(&amp;init_user_ns, dentry, &amp;iattr);</div><div class='del'>-		}</div><div class='del'>-		break;</div><div class='del'>-	case ACL_TYPE_DEFAULT:</div><div class='del'>-		if (!S_ISDIR(inode-&gt;i_mode)) {</div><div class='del'>-			retval = acl ? -EINVAL : 0;</div><div class='del'>-			goto err_out;</div><div class='del'>-		}</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		BUG();</div><div class='del'>-	}</div><div class='del'>-	retval = v9fs_xattr_set(dentry, handler-&gt;name, value, size, flags);</div><div class='del'>-	if (!retval)</div><div class='del'>-		set_cached_acl(inode, handler-&gt;flags, acl);</div><div class='del'>-err_out:</div><div class='del'>-	posix_acl_release(acl);</div><div class='del'>-	return retval;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-const struct xattr_handler v9fs_xattr_acl_access_handler = {</div><div class='del'>-	.name	= XATTR_NAME_POSIX_ACL_ACCESS,</div><div class='del'>-	.flags	= ACL_TYPE_ACCESS,</div><div class='del'>-	.get	= v9fs_xattr_get_acl,</div><div class='del'>-	.set	= v9fs_xattr_set_acl,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-const struct xattr_handler v9fs_xattr_acl_default_handler = {</div><div class='del'>-	.name	= XATTR_NAME_POSIX_ACL_DEFAULT,</div><div class='del'>-	.flags	= ACL_TYPE_DEFAULT,</div><div class='del'>-	.get	= v9fs_xattr_get_acl,</div><div class='del'>-	.set	= v9fs_xattr_set_acl,</div><div class='del'>-};</div><div class='head'>diff --git a/fs/9p/acl.h b/fs/9p/acl.h<br/>index ce5175d463dd..333cfcc281da 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/9p/acl.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/9p/acl.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/9p/acl.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/9p/acl.h</a></div><div class='hunk'>@@ -8,8 +8,12 @@</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_9P_FS_POSIX_ACL</div><div class='ctx'> int v9fs_get_acl(struct inode *inode, struct p9_fid *fid);</div><div class='del'>-struct posix_acl *v9fs_iop_get_acl(struct inode *inode, int type,</div><div class='add'>+struct posix_acl *v9fs_iop_get_inode_acl(struct inode *inode, int type,</div><div class='ctx'> 				   bool rcu);</div><div class='add'>+struct posix_acl *v9fs_iop_get_acl(struct mnt_idmap *idmap,</div><div class='add'>+					  struct dentry *dentry, int type);</div><div class='add'>+int v9fs_iop_set_acl(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='add'>+		     struct posix_acl *acl, int type);</div><div class='ctx'> int v9fs_acl_chmod(struct inode *inode, struct p9_fid *fid);</div><div class='ctx'> int v9fs_set_create_acl(struct inode *inode, struct p9_fid *fid,</div><div class='ctx'> 			struct posix_acl *dacl, struct posix_acl *acl);</div><div class='hunk'>@@ -17,7 +21,9 @@ int v9fs_acl_mode(struct inode *dir, umode_t *modep,</div><div class='ctx'> 		  struct posix_acl **dpacl, struct posix_acl **pacl);</div><div class='ctx'> void v9fs_put_acl(struct posix_acl *dacl, struct posix_acl *acl);</div><div class='ctx'> #else</div><div class='add'>+#define v9fs_iop_get_inode_acl	NULL</div><div class='ctx'> #define v9fs_iop_get_acl NULL</div><div class='add'>+#define v9fs_iop_set_acl NULL</div><div class='ctx'> static inline int v9fs_get_acl(struct inode *inode, struct p9_fid *fid)</div><div class='ctx'> {</div><div class='ctx'> 	return 0;</div><div class='head'>diff --git a/fs/9p/cache.c b/fs/9p/cache.c<br/>index f2ba131cede1..12c0ae29f185 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/9p/cache.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/9p/cache.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/9p/cache.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/9p/cache.c</a></div><div class='hunk'>@@ -16,186 +16,61 @@</div><div class='ctx'> #include "v9fs.h"</div><div class='ctx'> #include "cache.h"</div><div class='ctx'> </div><div class='del'>-#define CACHETAG_LEN  11</div><div class='del'>-</div><div class='del'>-struct fscache_netfs v9fs_cache_netfs = {</div><div class='del'>-	.name		= "9p",</div><div class='del'>-	.version	= 0,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * v9fs_random_cachetag - Generate a random tag to be associated</div><div class='del'>- *			  with a new cache session.</div><div class='del'>- *</div><div class='del'>- * The value of jiffies is used for a fairly randomly cache tag.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-static</div><div class='del'>-int v9fs_random_cachetag(struct v9fs_session_info *v9ses)</div><div class='add'>+int v9fs_cache_session_get_cookie(struct v9fs_session_info *v9ses,</div><div class='add'>+				  const char *dev_name)</div><div class='ctx'> {</div><div class='del'>-	v9ses-&gt;cachetag = kmalloc(CACHETAG_LEN, GFP_KERNEL);</div><div class='del'>-	if (!v9ses-&gt;cachetag)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	struct fscache_volume *vcookie;</div><div class='add'>+	char *name, *p;</div><div class='ctx'> </div><div class='del'>-	return scnprintf(v9ses-&gt;cachetag, CACHETAG_LEN, "%lu", jiffies);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-const struct fscache_cookie_def v9fs_cache_session_index_def = {</div><div class='del'>-	.name		= "9P.session",</div><div class='del'>-	.type		= FSCACHE_COOKIE_TYPE_INDEX,</div><div class='del'>-};</div><div class='add'>+	name = kasprintf(GFP_KERNEL, "9p,%s,%s",</div><div class='add'>+			 dev_name, v9ses-&gt;cachetag ?: v9ses-&gt;aname);</div><div class='add'>+	if (!name)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-void v9fs_cache_session_get_cookie(struct v9fs_session_info *v9ses)</div><div class='del'>-{</div><div class='del'>-	/* If no cache session tag was specified, we generate a random one. */</div><div class='del'>-	if (!v9ses-&gt;cachetag) {</div><div class='del'>-		if (v9fs_random_cachetag(v9ses) &lt; 0) {</div><div class='del'>-			v9ses-&gt;fscache = NULL;</div><div class='del'>-			kfree(v9ses-&gt;cachetag);</div><div class='del'>-			v9ses-&gt;cachetag = NULL;</div><div class='del'>-			return;</div><div class='add'>+	for (p = name; *p; p++)</div><div class='add'>+		if (*p == '/')</div><div class='add'>+			*p = ';';</div><div class='add'>+</div><div class='add'>+	vcookie = fscache_acquire_volume(name, NULL, NULL, 0);</div><div class='add'>+	p9_debug(P9_DEBUG_FSC, "session %p get volume %p (%s)\n",</div><div class='add'>+		 v9ses, vcookie, name);</div><div class='add'>+	if (IS_ERR(vcookie)) {</div><div class='add'>+		if (vcookie != ERR_PTR(-EBUSY)) {</div><div class='add'>+			kfree(name);</div><div class='add'>+			return PTR_ERR(vcookie);</div><div class='ctx'> 		}</div><div class='add'>+		pr_err("Cache volume key already in use (%s)\n", name);</div><div class='add'>+		vcookie = NULL;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	v9ses-&gt;fscache = fscache_acquire_cookie(v9fs_cache_netfs.primary_index,</div><div class='del'>-						&amp;v9fs_cache_session_index_def,</div><div class='del'>-						v9ses-&gt;cachetag,</div><div class='del'>-						strlen(v9ses-&gt;cachetag),</div><div class='del'>-						NULL, 0,</div><div class='del'>-						v9ses, 0, true);</div><div class='del'>-	p9_debug(P9_DEBUG_FSC, "session %p get cookie %p\n",</div><div class='del'>-		 v9ses, v9ses-&gt;fscache);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void v9fs_cache_session_put_cookie(struct v9fs_session_info *v9ses)</div><div class='del'>-{</div><div class='del'>-	p9_debug(P9_DEBUG_FSC, "session %p put cookie %p\n",</div><div class='del'>-		 v9ses, v9ses-&gt;fscache);</div><div class='del'>-	fscache_relinquish_cookie(v9ses-&gt;fscache, NULL, false);</div><div class='del'>-	v9ses-&gt;fscache = NULL;</div><div class='add'>+	v9ses-&gt;fscache = vcookie;</div><div class='add'>+	kfree(name);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static enum</div><div class='del'>-fscache_checkaux v9fs_cache_inode_check_aux(void *cookie_netfs_data,</div><div class='del'>-					    const void *buffer,</div><div class='del'>-					    uint16_t buflen,</div><div class='del'>-					    loff_t object_size)</div><div class='del'>-{</div><div class='del'>-	const struct v9fs_inode *v9inode = cookie_netfs_data;</div><div class='del'>-</div><div class='del'>-	if (buflen != sizeof(v9inode-&gt;qid.version))</div><div class='del'>-		return FSCACHE_CHECKAUX_OBSOLETE;</div><div class='del'>-</div><div class='del'>-	if (memcmp(buffer, &amp;v9inode-&gt;qid.version,</div><div class='del'>-		   sizeof(v9inode-&gt;qid.version)))</div><div class='del'>-		return FSCACHE_CHECKAUX_OBSOLETE;</div><div class='del'>-</div><div class='del'>-	return FSCACHE_CHECKAUX_OKAY;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-const struct fscache_cookie_def v9fs_cache_inode_index_def = {</div><div class='del'>-	.name		= "9p.inode",</div><div class='del'>-	.type		= FSCACHE_COOKIE_TYPE_DATAFILE,</div><div class='del'>-	.check_aux	= v9fs_cache_inode_check_aux,</div><div class='del'>-};</div><div class='del'>-</div><div class='ctx'> void v9fs_cache_inode_get_cookie(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct v9fs_inode *v9inode;</div><div class='add'>+	struct v9fs_inode *v9inode = V9FS_I(inode);</div><div class='ctx'> 	struct v9fs_session_info *v9ses;</div><div class='add'>+	__le32 version;</div><div class='add'>+	__le64 path;</div><div class='ctx'> </div><div class='ctx'> 	if (!S_ISREG(inode-&gt;i_mode))</div><div class='ctx'> 		return;</div><div class='del'>-</div><div class='del'>-	v9inode = V9FS_I(inode);</div><div class='del'>-	if (v9inode-&gt;fscache)</div><div class='add'>+	if (WARN_ON(v9fs_inode_cookie(v9inode)))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='add'>+	version = cpu_to_le32(v9inode-&gt;qid.version);</div><div class='add'>+	path = cpu_to_le64(v9inode-&gt;qid.path);</div><div class='ctx'> 	v9ses = v9fs_inode2v9ses(inode);</div><div class='del'>-	v9inode-&gt;fscache = fscache_acquire_cookie(v9ses-&gt;fscache,</div><div class='del'>-						  &amp;v9fs_cache_inode_index_def,</div><div class='del'>-						  &amp;v9inode-&gt;qid.path,</div><div class='del'>-						  sizeof(v9inode-&gt;qid.path),</div><div class='del'>-						  &amp;v9inode-&gt;qid.version,</div><div class='del'>-						  sizeof(v9inode-&gt;qid.version),</div><div class='del'>-						  v9inode,</div><div class='del'>-						  i_size_read(&amp;v9inode-&gt;vfs_inode),</div><div class='del'>-						  true);</div><div class='add'>+	v9inode-&gt;netfs.cache =</div><div class='add'>+		fscache_acquire_cookie(v9fs_session_cache(v9ses),</div><div class='add'>+				       0,</div><div class='add'>+				       &amp;path, sizeof(path),</div><div class='add'>+				       &amp;version, sizeof(version),</div><div class='add'>+				       i_size_read(&amp;v9inode-&gt;netfs.inode));</div><div class='add'>+	if (v9inode-&gt;netfs.cache)</div><div class='add'>+		mapping_set_release_always(inode-&gt;i_mapping);</div><div class='ctx'> </div><div class='ctx'> 	p9_debug(P9_DEBUG_FSC, "inode %p get cookie %p\n",</div><div class='del'>-		 inode, v9inode-&gt;fscache);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void v9fs_cache_inode_put_cookie(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	struct v9fs_inode *v9inode = V9FS_I(inode);</div><div class='del'>-</div><div class='del'>-	if (!v9inode-&gt;fscache)</div><div class='del'>-		return;</div><div class='del'>-	p9_debug(P9_DEBUG_FSC, "inode %p put cookie %p\n",</div><div class='del'>-		 inode, v9inode-&gt;fscache);</div><div class='del'>-</div><div class='del'>-	fscache_relinquish_cookie(v9inode-&gt;fscache, &amp;v9inode-&gt;qid.version,</div><div class='del'>-				  false);</div><div class='del'>-	v9inode-&gt;fscache = NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void v9fs_cache_inode_flush_cookie(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	struct v9fs_inode *v9inode = V9FS_I(inode);</div><div class='del'>-</div><div class='del'>-	if (!v9inode-&gt;fscache)</div><div class='del'>-		return;</div><div class='del'>-	p9_debug(P9_DEBUG_FSC, "inode %p flush cookie %p\n",</div><div class='del'>-		 inode, v9inode-&gt;fscache);</div><div class='del'>-</div><div class='del'>-	fscache_relinquish_cookie(v9inode-&gt;fscache, NULL, true);</div><div class='del'>-	v9inode-&gt;fscache = NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void v9fs_cache_inode_set_cookie(struct inode *inode, struct file *filp)</div><div class='del'>-{</div><div class='del'>-	struct v9fs_inode *v9inode = V9FS_I(inode);</div><div class='del'>-</div><div class='del'>-	if (!v9inode-&gt;fscache)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;v9inode-&gt;fscache_lock);</div><div class='del'>-</div><div class='del'>-	if ((filp-&gt;f_flags &amp; O_ACCMODE) != O_RDONLY)</div><div class='del'>-		v9fs_cache_inode_flush_cookie(inode);</div><div class='del'>-	else</div><div class='del'>-		v9fs_cache_inode_get_cookie(inode);</div><div class='del'>-</div><div class='del'>-	mutex_unlock(&amp;v9inode-&gt;fscache_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void v9fs_cache_inode_reset_cookie(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	struct v9fs_inode *v9inode = V9FS_I(inode);</div><div class='del'>-	struct v9fs_session_info *v9ses;</div><div class='del'>-	struct fscache_cookie *old;</div><div class='del'>-</div><div class='del'>-	if (!v9inode-&gt;fscache)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	old = v9inode-&gt;fscache;</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;v9inode-&gt;fscache_lock);</div><div class='del'>-	fscache_relinquish_cookie(v9inode-&gt;fscache, NULL, true);</div><div class='del'>-</div><div class='del'>-	v9ses = v9fs_inode2v9ses(inode);</div><div class='del'>-	v9inode-&gt;fscache = fscache_acquire_cookie(v9ses-&gt;fscache,</div><div class='del'>-						  &amp;v9fs_cache_inode_index_def,</div><div class='del'>-						  &amp;v9inode-&gt;qid.path,</div><div class='del'>-						  sizeof(v9inode-&gt;qid.path),</div><div class='del'>-						  &amp;v9inode-&gt;qid.version,</div><div class='del'>-						  sizeof(v9inode-&gt;qid.version),</div><div class='del'>-						  v9inode,</div><div class='del'>-						  i_size_read(&amp;v9inode-&gt;vfs_inode),</div><div class='del'>-						  true);</div><div class='del'>-	p9_debug(P9_DEBUG_FSC, "inode %p revalidating cookie old %p new %p\n",</div><div class='del'>-		 inode, old, v9inode-&gt;fscache);</div><div class='del'>-</div><div class='del'>-	mutex_unlock(&amp;v9inode-&gt;fscache_lock);</div><div class='add'>+		 inode, v9fs_inode_cookie(v9inode));</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/9p/cache.h b/fs/9p/cache.h<br/>index 7480b4b49fea..ee1b6b06a2fd 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/9p/cache.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/9p/cache.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/9p/cache.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/9p/cache.h</a></div><div class='hunk'>@@ -7,26 +7,14 @@</div><div class='ctx'> </div><div class='ctx'> #ifndef _9P_CACHE_H</div><div class='ctx'> #define _9P_CACHE_H</div><div class='del'>-#define FSCACHE_USE_NEW_IO_API</div><div class='del'>-#include &lt;linux/fscache.h&gt;</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_9P_FSCACHE</div><div class='add'>+#include &lt;linux/fscache.h&gt;</div><div class='ctx'> </div><div class='del'>-extern struct fscache_netfs v9fs_cache_netfs;</div><div class='del'>-extern const struct fscache_cookie_def v9fs_cache_session_index_def;</div><div class='del'>-extern const struct fscache_cookie_def v9fs_cache_inode_index_def;</div><div class='del'>-</div><div class='del'>-extern void v9fs_cache_session_get_cookie(struct v9fs_session_info *v9ses);</div><div class='del'>-extern void v9fs_cache_session_put_cookie(struct v9fs_session_info *v9ses);</div><div class='add'>+extern int v9fs_cache_session_get_cookie(struct v9fs_session_info *v9ses,</div><div class='add'>+					  const char *dev_name);</div><div class='ctx'> </div><div class='ctx'> extern void v9fs_cache_inode_get_cookie(struct inode *inode);</div><div class='del'>-extern void v9fs_cache_inode_put_cookie(struct inode *inode);</div><div class='del'>-extern void v9fs_cache_inode_flush_cookie(struct inode *inode);</div><div class='del'>-extern void v9fs_cache_inode_set_cookie(struct inode *inode, struct file *filp);</div><div class='del'>-extern void v9fs_cache_inode_reset_cookie(struct inode *inode);</div><div class='del'>-</div><div class='del'>-extern int __v9fs_cache_register(void);</div><div class='del'>-extern void __v9fs_cache_unregister(void);</div><div class='ctx'> </div><div class='ctx'> #else /* CONFIG_9P_FSCACHE */</div><div class='ctx'> </div><div class='hunk'>@@ -34,13 +22,5 @@ static inline void v9fs_cache_inode_get_cookie(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void v9fs_cache_inode_put_cookie(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void v9fs_cache_inode_set_cookie(struct inode *inode, struct file *file)</div><div class='del'>-{</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> #endif /* CONFIG_9P_FSCACHE */</div><div class='ctx'> #endif /* _9P_CACHE_H */</div><div class='head'>diff --git a/fs/9p/fid.c b/fs/9p/fid.c<br/>index 6aab046c98e2..f84412290a30 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/9p/fid.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/9p/fid.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/9p/fid.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/9p/fid.c</a></div><div class='hunk'>@@ -11,7 +11,6 @@</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='del'>-#include &lt;linux/idr.h&gt;</div><div class='ctx'> #include &lt;net/9p/9p.h&gt;</div><div class='ctx'> #include &lt;net/9p/client.h&gt;</div><div class='ctx'> </div><div class='hunk'>@@ -28,24 +27,38 @@ static inline void __add_fid(struct dentry *dentry, struct p9_fid *fid)</div><div class='ctx'> /**</div><div class='ctx'>  * v9fs_fid_add - add a fid to a dentry</div><div class='ctx'>  * @dentry: dentry that the fid is being added to</div><div class='del'>- * @fid: fid to add</div><div class='add'>+ * @pfid: fid to add, NULLed out</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='del'>-void v9fs_fid_add(struct dentry *dentry, struct p9_fid *fid)</div><div class='add'>+void v9fs_fid_add(struct dentry *dentry, struct p9_fid **pfid)</div><div class='ctx'> {</div><div class='add'>+	struct p9_fid *fid = *pfid;</div><div class='add'>+</div><div class='ctx'> 	spin_lock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 	__add_fid(dentry, fid);</div><div class='ctx'> 	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='add'>+</div><div class='add'>+	*pfid = NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool v9fs_is_writeable(int mode)</div><div class='add'>+{</div><div class='add'>+	if (mode &amp; (P9_OWRITE|P9_ORDWR))</div><div class='add'>+		return true;</div><div class='add'>+	else</div><div class='add'>+		return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * v9fs_fid_find_inode - search for an open fid off of the inode list</div><div class='ctx'>  * @inode: return a fid pointing to a specific inode</div><div class='add'>+ * @want_writeable: only consider fids which are writeable</div><div class='ctx'>  * @uid: return a fid belonging to the specified user</div><div class='add'>+ * @any: ignore uid as a selection criteria</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='del'>-</div><div class='del'>-static struct p9_fid *v9fs_fid_find_inode(struct inode *inode, kuid_t uid)</div><div class='add'>+struct p9_fid *v9fs_fid_find_inode(struct inode *inode, bool want_writeable,</div><div class='add'>+	kuid_t uid, bool any)</div><div class='ctx'> {</div><div class='ctx'> 	struct hlist_head *h;</div><div class='ctx'> 	struct p9_fid *fid, *ret = NULL;</div><div class='hunk'>@@ -55,8 +68,13 @@ static struct p9_fid *v9fs_fid_find_inode(struct inode *inode, kuid_t uid)</div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	h = (struct hlist_head *)&amp;inode-&gt;i_private;</div><div class='ctx'> 	hlist_for_each_entry(fid, h, ilist) {</div><div class='del'>-		if (uid_eq(fid-&gt;uid, uid)) {</div><div class='del'>-			refcount_inc(&amp;fid-&gt;count);</div><div class='add'>+		if (any || uid_eq(fid-&gt;uid, uid)) {</div><div class='add'>+			if (want_writeable &amp;&amp; !v9fs_is_writeable(fid-&gt;mode)) {</div><div class='add'>+				p9_debug(P9_DEBUG_VFS, " mode: %x not writeable?\n",</div><div class='add'>+							fid-&gt;mode);</div><div class='add'>+				continue;</div><div class='add'>+			}</div><div class='add'>+			p9_fid_get(fid);</div><div class='ctx'> 			ret = fid;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -68,15 +86,19 @@ static struct p9_fid *v9fs_fid_find_inode(struct inode *inode, kuid_t uid)</div><div class='ctx'> /**</div><div class='ctx'>  * v9fs_open_fid_add - add an open fid to an inode</div><div class='ctx'>  * @inode: inode that the fid is being added to</div><div class='del'>- * @fid: fid to add</div><div class='add'>+ * @pfid: fid to add, NULLed out</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-void v9fs_open_fid_add(struct inode *inode, struct p9_fid *fid)</div><div class='add'>+void v9fs_open_fid_add(struct inode *inode, struct p9_fid **pfid)</div><div class='ctx'> {</div><div class='add'>+	struct p9_fid *fid = *pfid;</div><div class='add'>+</div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	hlist_add_head(&amp;fid-&gt;ilist, (struct hlist_head *)&amp;inode-&gt;i_private);</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+</div><div class='add'>+	*pfid = NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> </div><div class='hunk'>@@ -96,24 +118,22 @@ static struct p9_fid *v9fs_fid_find(struct dentry *dentry, kuid_t uid, int any)</div><div class='ctx'> 		 dentry, dentry, from_kuid(&amp;init_user_ns, uid),</div><div class='ctx'> 		 any);</div><div class='ctx'> 	ret = NULL;</div><div class='del'>-</div><div class='del'>-	if (d_inode(dentry))</div><div class='del'>-		ret = v9fs_fid_find_inode(d_inode(dentry), uid);</div><div class='del'>-</div><div class='ctx'> 	/* we'll recheck under lock if there's anything to look in */</div><div class='del'>-	if (!ret &amp;&amp; dentry-&gt;d_fsdata) {</div><div class='add'>+	if (dentry-&gt;d_fsdata) {</div><div class='ctx'> 		struct hlist_head *h = (struct hlist_head *)&amp;dentry-&gt;d_fsdata;</div><div class='ctx'> </div><div class='ctx'> 		spin_lock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 		hlist_for_each_entry(fid, h, dlist) {</div><div class='ctx'> 			if (any || uid_eq(fid-&gt;uid, uid)) {</div><div class='ctx'> 				ret = fid;</div><div class='del'>-				refcount_inc(&amp;ret-&gt;count);</div><div class='add'>+				p9_fid_get(ret);</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 		spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 	}</div><div class='add'>+	if (!ret &amp;&amp; dentry-&gt;d_inode)</div><div class='add'>+		ret = v9fs_fid_find_inode(dentry-&gt;d_inode, false, uid, any);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -151,9 +171,9 @@ static struct p9_fid *v9fs_fid_lookup_with_uid(struct dentry *dentry,</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *ds;</div><div class='ctx'> 	const unsigned char **wnames, *uname;</div><div class='del'>-	int i, n, l, clone, access;</div><div class='add'>+	int i, n, l, access;</div><div class='ctx'> 	struct v9fs_session_info *v9ses;</div><div class='del'>-	struct p9_fid *fid, *old_fid = NULL;</div><div class='add'>+	struct p9_fid *fid, *root_fid, *old_fid;</div><div class='ctx'> </div><div class='ctx'> 	v9ses = v9fs_dentry2v9ses(dentry);</div><div class='ctx'> 	access = v9ses-&gt;flags &amp; V9FS_ACCESS_MASK;</div><div class='hunk'>@@ -170,17 +190,17 @@ static struct p9_fid *v9fs_fid_lookup_with_uid(struct dentry *dentry,</div><div class='ctx'> 	fid = v9fs_fid_find(ds, uid, any);</div><div class='ctx'> 	if (fid) {</div><div class='ctx'> 		/* Found the parent fid do a lookup with that */</div><div class='del'>-		struct p9_fid *ofid = fid;</div><div class='add'>+		old_fid = fid;</div><div class='ctx'> </div><div class='del'>-		fid = p9_client_walk(ofid, 1, &amp;dentry-&gt;d_name.name, 1);</div><div class='del'>-		p9_client_clunk(ofid);</div><div class='add'>+		fid = p9_client_walk(old_fid, 1, &amp;dentry-&gt;d_name.name, 1);</div><div class='add'>+		p9_fid_put(old_fid);</div><div class='ctx'> 		goto fid_out;</div><div class='ctx'> 	}</div><div class='ctx'> 	up_read(&amp;v9ses-&gt;rename_sem);</div><div class='ctx'> </div><div class='ctx'> 	/* start from the root and try to do a lookup */</div><div class='del'>-	fid = v9fs_fid_find(dentry-&gt;d_sb-&gt;s_root, uid, any);</div><div class='del'>-	if (!fid) {</div><div class='add'>+	root_fid = v9fs_fid_find(dentry-&gt;d_sb-&gt;s_root, uid, any);</div><div class='add'>+	if (!root_fid) {</div><div class='ctx'> 		/* the user is not attached to the fs yet */</div><div class='ctx'> 		if (access == V9FS_ACCESS_SINGLE)</div><div class='ctx'> 			return ERR_PTR(-EPERM);</div><div class='hunk'>@@ -195,13 +215,13 @@ static struct p9_fid *v9fs_fid_lookup_with_uid(struct dentry *dentry,</div><div class='ctx'> 		if (IS_ERR(fid))</div><div class='ctx'> 			return fid;</div><div class='ctx'> </div><div class='del'>-		v9fs_fid_add(dentry-&gt;d_sb-&gt;s_root, fid);</div><div class='add'>+		root_fid = p9_fid_get(fid);</div><div class='add'>+		v9fs_fid_add(dentry-&gt;d_sb-&gt;s_root, &amp;fid);</div><div class='ctx'> 	}</div><div class='ctx'> 	/* If we are root ourself just return that */</div><div class='del'>-	if (dentry-&gt;d_sb-&gt;s_root == dentry) {</div><div class='del'>-		refcount_inc(&amp;fid-&gt;count);</div><div class='del'>-		return fid;</div><div class='del'>-	}</div><div class='add'>+	if (dentry-&gt;d_sb-&gt;s_root == dentry)</div><div class='add'>+		return root_fid;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Do a multipath walk with attached root.</div><div class='ctx'> 	 * When walking parent we need to make sure we</div><div class='hunk'>@@ -213,30 +233,27 @@ static struct p9_fid *v9fs_fid_lookup_with_uid(struct dentry *dentry,</div><div class='ctx'> 		fid = ERR_PTR(n);</div><div class='ctx'> 		goto err_out;</div><div class='ctx'> 	}</div><div class='del'>-	clone = 1;</div><div class='add'>+	fid = root_fid;</div><div class='add'>+	old_fid = root_fid;</div><div class='ctx'> 	i = 0;</div><div class='ctx'> 	while (i &lt; n) {</div><div class='ctx'> 		l = min(n - i, P9_MAXWELEM);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We need to hold rename lock when doing a multipath</div><div class='del'>-		 * walk to ensure none of the patch component change</div><div class='add'>+		 * walk to ensure none of the path components change</div><div class='ctx'> 		 */</div><div class='del'>-		fid = p9_client_walk(fid, l, &amp;wnames[i], clone);</div><div class='add'>+		fid = p9_client_walk(old_fid, l, &amp;wnames[i],</div><div class='add'>+				     old_fid == root_fid /* clone */);</div><div class='add'>+		/* non-cloning walk will return the same fid */</div><div class='add'>+		if (fid != old_fid) {</div><div class='add'>+			p9_fid_put(old_fid);</div><div class='add'>+			old_fid = fid;</div><div class='add'>+		}</div><div class='ctx'> 		if (IS_ERR(fid)) {</div><div class='del'>-			if (old_fid) {</div><div class='del'>-				/*</div><div class='del'>-				 * If we fail, clunk fid which are mapping</div><div class='del'>-				 * to path component and not the last component</div><div class='del'>-				 * of the path.</div><div class='del'>-				 */</div><div class='del'>-				p9_client_clunk(old_fid);</div><div class='del'>-			}</div><div class='ctx'> 			kfree(wnames);</div><div class='ctx'> 			goto err_out;</div><div class='ctx'> 		}</div><div class='del'>-		old_fid = fid;</div><div class='ctx'> 		i += l;</div><div class='del'>-		clone = 0;</div><div class='ctx'> 	}</div><div class='ctx'> 	kfree(wnames);</div><div class='ctx'> fid_out:</div><div class='hunk'>@@ -244,11 +261,11 @@ fid_out:</div><div class='ctx'> 		spin_lock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 		if (d_unhashed(dentry)) {</div><div class='ctx'> 			spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='del'>-			p9_client_clunk(fid);</div><div class='add'>+			p9_fid_put(fid);</div><div class='ctx'> 			fid = ERR_PTR(-ENOENT);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			__add_fid(dentry, fid);</div><div class='del'>-			refcount_inc(&amp;fid-&gt;count);</div><div class='add'>+			p9_fid_get(fid);</div><div class='ctx'> 			spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -296,28 +313,3 @@ struct p9_fid *v9fs_fid_lookup(struct dentry *dentry)</div><div class='ctx'> 	return v9fs_fid_lookup_with_uid(dentry, uid, any);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct p9_fid *v9fs_writeback_fid(struct dentry *dentry)</div><div class='del'>-{</div><div class='del'>-	int err;</div><div class='del'>-	struct p9_fid *fid, *ofid;</div><div class='del'>-</div><div class='del'>-	ofid = v9fs_fid_lookup_with_uid(dentry, GLOBAL_ROOT_UID, 0);</div><div class='del'>-	fid = clone_fid(ofid);</div><div class='del'>-	if (IS_ERR(fid))</div><div class='del'>-		goto error_out;</div><div class='del'>-	p9_client_clunk(ofid);</div><div class='del'>-	/*</div><div class='del'>-	 * writeback fid will only be used to write back the</div><div class='del'>-	 * dirty pages. We always request for the open fid in read-write</div><div class='del'>-	 * mode so that a partial page write which result in page</div><div class='del'>-	 * read can work.</div><div class='del'>-	 */</div><div class='del'>-	err = p9_client_open(fid, O_RDWR);</div><div class='del'>-	if (err &lt; 0) {</div><div class='del'>-		p9_client_clunk(fid);</div><div class='del'>-		fid = ERR_PTR(err);</div><div class='del'>-		goto error_out;</div><div class='del'>-	}</div><div class='del'>-error_out:</div><div class='del'>-	return fid;</div><div class='del'>-}</div><div class='head'>diff --git a/fs/9p/fid.h b/fs/9p/fid.h<br/>index f7f33509e169..0d6138bee2a3 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/9p/fid.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/9p/fid.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/9p/fid.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/9p/fid.h</a></div><div class='hunk'>@@ -7,15 +7,17 @@</div><div class='ctx'> #ifndef FS_9P_FID_H</div><div class='ctx'> #define FS_9P_FID_H</div><div class='ctx'> #include &lt;linux/list.h&gt;</div><div class='add'>+#include "v9fs.h"</div><div class='ctx'> </div><div class='add'>+struct p9_fid *v9fs_fid_find_inode(struct inode *inode, bool want_writeable,</div><div class='add'>+	kuid_t uid, bool any);</div><div class='ctx'> struct p9_fid *v9fs_fid_lookup(struct dentry *dentry);</div><div class='ctx'> static inline struct p9_fid *v9fs_parent_fid(struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	return v9fs_fid_lookup(dentry-&gt;d_parent);</div><div class='ctx'> }</div><div class='del'>-void v9fs_fid_add(struct dentry *dentry, struct p9_fid *fid);</div><div class='del'>-struct p9_fid *v9fs_writeback_fid(struct dentry *dentry);</div><div class='del'>-void v9fs_open_fid_add(struct inode *inode, struct p9_fid *fid);</div><div class='add'>+void v9fs_fid_add(struct dentry *dentry, struct p9_fid **fid);</div><div class='add'>+void v9fs_open_fid_add(struct inode *inode, struct p9_fid **fid);</div><div class='ctx'> static inline struct p9_fid *clone_fid(struct p9_fid *fid)</div><div class='ctx'> {</div><div class='ctx'> 	return IS_ERR(fid) ? fid :  p9_client_walk(fid, 0, NULL, 1);</div><div class='hunk'>@@ -29,7 +31,31 @@ static inline struct p9_fid *v9fs_fid_clone(struct dentry *dentry)</div><div class='ctx'> 		return fid;</div><div class='ctx'> </div><div class='ctx'> 	nfid = clone_fid(fid);</div><div class='del'>-	p9_client_clunk(fid);</div><div class='add'>+	p9_fid_put(fid);</div><div class='ctx'> 	return nfid;</div><div class='ctx'> }</div><div class='add'>+/**</div><div class='add'>+ * v9fs_fid_addmodes - add cache flags to fid mode (for client use only)</div><div class='add'>+ * @fid: fid to augment</div><div class='add'>+ * @s_flags: session info mount flags</div><div class='add'>+ * @s_cache: session info cache flags</div><div class='add'>+ * @f_flags: unix open flags</div><div class='add'>+ *</div><div class='add'>+ * make sure mode reflects flags of underlying mounts</div><div class='add'>+ * also qid.version == 0 reflects a synthetic or legacy file system</div><div class='add'>+ * NOTE: these are set after open so only reflect 9p client not</div><div class='add'>+ * underlying file system on server.</div><div class='add'>+ */</div><div class='add'>+static inline void v9fs_fid_add_modes(struct p9_fid *fid, unsigned int s_flags,</div><div class='add'>+	unsigned int s_cache, unsigned int f_flags)</div><div class='add'>+{</div><div class='add'>+	if ((!s_cache) ||</div><div class='add'>+	   ((fid-&gt;qid.version == 0) &amp;&amp; !(s_flags &amp; V9FS_IGNORE_QV)) ||</div><div class='add'>+	   (s_flags &amp; V9FS_DIRECT_IO) || (f_flags &amp; O_DIRECT)) {</div><div class='add'>+		fid-&gt;mode |= P9L_DIRECT; /* no read or write cache */</div><div class='add'>+	} else if ((!(s_cache &amp; CACHE_WRITEBACK)) ||</div><div class='add'>+				(f_flags &amp; O_DSYNC) || (s_flags &amp; V9FS_SYNC)) {</div><div class='add'>+		fid-&gt;mode |= P9L_NOWRITECACHE;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/9p/v9fs.c b/fs/9p/v9fs.c<br/>index e32dd5f7721b..057487efaaeb 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/9p/v9fs.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/9p/v9fs.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/9p/v9fs.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/9p/v9fs.c</a></div><div class='hunk'>@@ -13,8 +13,8 @@</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='ctx'> #include &lt;linux/cred.h&gt;</div><div class='del'>-#include &lt;linux/parser.h&gt;</div><div class='del'>-#include &lt;linux/idr.h&gt;</div><div class='add'>+#include &lt;linux/fs_parser.h&gt;</div><div class='add'>+#include &lt;linux/fs_context.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/seq_file.h&gt;</div><div class='ctx'> #include &lt;net/9p/9p.h&gt;</div><div class='hunk'>@@ -34,46 +34,85 @@ struct kmem_cache *v9fs_inode_cache;</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> enum {</div><div class='add'>+	/* Mount-point source, we need to handle this explicitly because</div><div class='add'>+	 * the code below accepts unknown args and the vfs layer only handles</div><div class='add'>+	 * source if we rejected it as EINVAL */</div><div class='add'>+	Opt_source,</div><div class='ctx'> 	/* Options that take integer arguments */</div><div class='ctx'> 	Opt_debug, Opt_dfltuid, Opt_dfltgid, Opt_afid,</div><div class='ctx'> 	/* String options */</div><div class='ctx'> 	Opt_uname, Opt_remotename, Opt_cache, Opt_cachetag,</div><div class='ctx'> 	/* Options that take no arguments */</div><div class='del'>-	Opt_nodevmap,</div><div class='del'>-	/* Cache options */</div><div class='del'>-	Opt_cache_loose, Opt_fscache, Opt_mmap,</div><div class='add'>+	Opt_nodevmap, Opt_noxattr, Opt_directio, Opt_ignoreqv,</div><div class='ctx'> 	/* Access options */</div><div class='ctx'> 	Opt_access, Opt_posixacl,</div><div class='ctx'> 	/* Lock timeout option */</div><div class='ctx'> 	Opt_locktimeout,</div><div class='del'>-	/* Error token */</div><div class='del'>-	Opt_err</div><div class='add'>+</div><div class='add'>+	/* Client options */</div><div class='add'>+	Opt_msize, Opt_trans, Opt_legacy, Opt_version,</div><div class='add'>+</div><div class='add'>+	/* fd transport options */</div><div class='add'>+	/* Options that take integer arguments */</div><div class='add'>+	Opt_rfdno, Opt_wfdno,</div><div class='add'>+	/* Options that take no arguments */</div><div class='add'>+</div><div class='add'>+	/* rdma transport options */</div><div class='add'>+	/* Options that take integer arguments */</div><div class='add'>+	Opt_rq_depth, Opt_sq_depth, Opt_timeout,</div><div class='add'>+</div><div class='add'>+	/* Options for both fd and rdma transports */</div><div class='add'>+	Opt_port, Opt_privport,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static const match_table_t tokens = {</div><div class='del'>-	{Opt_debug, "debug=%x"},</div><div class='del'>-	{Opt_dfltuid, "dfltuid=%u"},</div><div class='del'>-	{Opt_dfltgid, "dfltgid=%u"},</div><div class='del'>-	{Opt_afid, "afid=%u"},</div><div class='del'>-	{Opt_uname, "uname=%s"},</div><div class='del'>-	{Opt_remotename, "aname=%s"},</div><div class='del'>-	{Opt_nodevmap, "nodevmap"},</div><div class='del'>-	{Opt_cache, "cache=%s"},</div><div class='del'>-	{Opt_cache_loose, "loose"},</div><div class='del'>-	{Opt_fscache, "fscache"},</div><div class='del'>-	{Opt_mmap, "mmap"},</div><div class='del'>-	{Opt_cachetag, "cachetag=%s"},</div><div class='del'>-	{Opt_access, "access=%s"},</div><div class='del'>-	{Opt_posixacl, "posixacl"},</div><div class='del'>-	{Opt_locktimeout, "locktimeout=%u"},</div><div class='del'>-	{Opt_err, NULL}</div><div class='add'>+static const struct constant_table p9_versions[] = {</div><div class='add'>+	{ "9p2000",	p9_proto_legacy },</div><div class='add'>+	{ "9p2000.u",	p9_proto_2000u },</div><div class='add'>+	{ "9p2000.L",	p9_proto_2000L },</div><div class='add'>+	{}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static const char *const v9fs_cache_modes[nr__p9_cache_modes] = {</div><div class='del'>-	[CACHE_NONE]	= "none",</div><div class='del'>-	[CACHE_MMAP]	= "mmap",</div><div class='del'>-	[CACHE_LOOSE]	= "loose",</div><div class='del'>-	[CACHE_FSCACHE]	= "fscache",</div><div class='add'>+/*</div><div class='add'>+ * This structure contains all parameters used for the core code,</div><div class='add'>+ * the client, and all the transports.</div><div class='add'>+ */</div><div class='add'>+const struct fs_parameter_spec v9fs_param_spec[] = {</div><div class='add'>+	fsparam_string	("source",	Opt_source),</div><div class='add'>+	fsparam_u32hex	("debug",	Opt_debug),</div><div class='add'>+	fsparam_uid	("dfltuid",	Opt_dfltuid),</div><div class='add'>+	fsparam_gid	("dfltgid",	Opt_dfltgid),</div><div class='add'>+	fsparam_u32	("afid",	Opt_afid),</div><div class='add'>+	fsparam_string	("uname",	Opt_uname),</div><div class='add'>+	fsparam_string	("aname",	Opt_remotename),</div><div class='add'>+	fsparam_flag	("nodevmap",	Opt_nodevmap),</div><div class='add'>+	fsparam_flag	("noxattr",	Opt_noxattr),</div><div class='add'>+	fsparam_flag	("directio",	Opt_directio),</div><div class='add'>+	fsparam_flag	("ignoreqv",	Opt_ignoreqv),</div><div class='add'>+	fsparam_string	("cache",	Opt_cache),</div><div class='add'>+	fsparam_string	("cachetag",	Opt_cachetag),</div><div class='add'>+	fsparam_string	("access",	Opt_access),</div><div class='add'>+	fsparam_flag	("posixacl",	Opt_posixacl),</div><div class='add'>+	fsparam_u32	("locktimeout",	Opt_locktimeout),</div><div class='add'>+</div><div class='add'>+	/* client options */</div><div class='add'>+	fsparam_u32	("msize",	Opt_msize),</div><div class='add'>+	fsparam_flag	("noextend",	Opt_legacy),</div><div class='add'>+	fsparam_string	("trans",	Opt_trans),</div><div class='add'>+	fsparam_enum	("version",	Opt_version, p9_versions),</div><div class='add'>+</div><div class='add'>+	/* fd transport options */</div><div class='add'>+	fsparam_u32	("rfdno",	Opt_rfdno),</div><div class='add'>+	fsparam_u32	("wfdno",	Opt_wfdno),</div><div class='add'>+</div><div class='add'>+	/* rdma transport options */</div><div class='add'>+	fsparam_u32	("sq",		Opt_sq_depth),</div><div class='add'>+	fsparam_u32	("rq",		Opt_rq_depth),</div><div class='add'>+	fsparam_u32	("timeout",	Opt_timeout),</div><div class='add'>+</div><div class='add'>+	/* fd and rdma transprt options */</div><div class='add'>+	fsparam_u32	("port",	Opt_port),</div><div class='add'>+	fsparam_flag	("privport",	Opt_privport),</div><div class='add'>+	{}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /* Interpret mount options for cache mode */</div><div class='hunk'>@@ -82,19 +121,24 @@ static int get_cache_mode(char *s)</div><div class='ctx'> 	int version = -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	if (!strcmp(s, "loose")) {</div><div class='del'>-		version = CACHE_LOOSE;</div><div class='add'>+		version = CACHE_SC_LOOSE;</div><div class='ctx'> 		p9_debug(P9_DEBUG_9P, "Cache mode: loose\n");</div><div class='ctx'> 	} else if (!strcmp(s, "fscache")) {</div><div class='del'>-		version = CACHE_FSCACHE;</div><div class='add'>+		version = CACHE_SC_FSCACHE;</div><div class='ctx'> 		p9_debug(P9_DEBUG_9P, "Cache mode: fscache\n");</div><div class='ctx'> 	} else if (!strcmp(s, "mmap")) {</div><div class='del'>-		version = CACHE_MMAP;</div><div class='add'>+		version = CACHE_SC_MMAP;</div><div class='ctx'> 		p9_debug(P9_DEBUG_9P, "Cache mode: mmap\n");</div><div class='add'>+	} else if (!strcmp(s, "readahead")) {</div><div class='add'>+		version = CACHE_SC_READAHEAD;</div><div class='add'>+		p9_debug(P9_DEBUG_9P, "Cache mode: readahead\n");</div><div class='ctx'> 	} else if (!strcmp(s, "none")) {</div><div class='del'>-		version = CACHE_NONE;</div><div class='add'>+		version = CACHE_SC_NONE;</div><div class='ctx'> 		p9_debug(P9_DEBUG_9P, "Cache mode: none\n");</div><div class='del'>-	} else</div><div class='del'>-		pr_info("Unknown Cache mode %s\n", s);</div><div class='add'>+	} else if (kstrtoint(s, 0, &amp;version) != 0) {</div><div class='add'>+		version = -EINVAL;</div><div class='add'>+		pr_info("Unknown Cache mode or invalid value %s\n", s);</div><div class='add'>+	}</div><div class='ctx'> 	return version;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -106,7 +150,7 @@ int v9fs_show_options(struct seq_file *m, struct dentry *root)</div><div class='ctx'> 	struct v9fs_session_info *v9ses = root-&gt;d_sb-&gt;s_fs_info;</div><div class='ctx'> </div><div class='ctx'> 	if (v9ses-&gt;debug)</div><div class='del'>-		seq_printf(m, ",debug=%x", v9ses-&gt;debug);</div><div class='add'>+		seq_printf(m, ",debug=%#x", v9ses-&gt;debug);</div><div class='ctx'> 	if (!uid_eq(v9ses-&gt;dfltuid, V9FS_DEFUID))</div><div class='ctx'> 		seq_printf(m, ",dfltuid=%u",</div><div class='ctx'> 			   from_kuid_munged(&amp;init_user_ns, v9ses-&gt;dfltuid));</div><div class='hunk'>@@ -122,9 +166,9 @@ int v9fs_show_options(struct seq_file *m, struct dentry *root)</div><div class='ctx'> 	if (v9ses-&gt;nodev)</div><div class='ctx'> 		seq_puts(m, ",nodevmap");</div><div class='ctx'> 	if (v9ses-&gt;cache)</div><div class='del'>-		seq_printf(m, ",%s", v9fs_cache_modes[v9ses-&gt;cache]);</div><div class='add'>+		seq_printf(m, ",cache=%#x", v9ses-&gt;cache);</div><div class='ctx'> #ifdef CONFIG_9P_FSCACHE</div><div class='del'>-	if (v9ses-&gt;cachetag &amp;&amp; v9ses-&gt;cache == CACHE_FSCACHE)</div><div class='add'>+	if (v9ses-&gt;cachetag &amp;&amp; (v9ses-&gt;cache &amp; CACHE_FSCACHE))</div><div class='ctx'> 		seq_printf(m, ",cachetag=%s", v9ses-&gt;cachetag);</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='hunk'>@@ -144,274 +188,268 @@ int v9fs_show_options(struct seq_file *m, struct dentry *root)</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (v9ses-&gt;flags &amp; V9FS_IGNORE_QV)</div><div class='add'>+		seq_puts(m, ",ignoreqv");</div><div class='add'>+	if (v9ses-&gt;flags &amp; V9FS_DIRECT_IO)</div><div class='add'>+		seq_puts(m, ",directio");</div><div class='ctx'> 	if (v9ses-&gt;flags &amp; V9FS_POSIX_ACL)</div><div class='ctx'> 		seq_puts(m, ",posixacl");</div><div class='ctx'> </div><div class='add'>+	if (v9ses-&gt;flags &amp; V9FS_NO_XATTR)</div><div class='add'>+		seq_puts(m, ",noxattr");</div><div class='add'>+</div><div class='ctx'> 	return p9_show_client_options(m, v9ses-&gt;clnt);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * v9fs_parse_options - parse mount options into session structure</div><div class='del'>- * @v9ses: existing v9fs session information</div><div class='del'>- * @opts: The mount option string</div><div class='add'>+ * v9fs_parse_param - parse a mount option into the filesystem context</div><div class='add'>+ * @fc: the filesystem context</div><div class='add'>+ * @param: the parameter to parse</div><div class='ctx'>  *</div><div class='ctx'>  * Return 0 upon success, -ERRNO upon failure.</div><div class='ctx'>  */</div><div class='del'>-</div><div class='del'>-static int v9fs_parse_options(struct v9fs_session_info *v9ses, char *opts)</div><div class='add'>+int v9fs_parse_param(struct fs_context *fc, struct fs_parameter *param)</div><div class='ctx'> {</div><div class='del'>-	char *options, *tmp_options;</div><div class='del'>-	substring_t args[MAX_OPT_ARGS];</div><div class='del'>-	char *p;</div><div class='del'>-	int option = 0;</div><div class='add'>+	struct v9fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct fs_parse_result result;</div><div class='ctx'> 	char *s;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	/* setup defaults */</div><div class='del'>-	v9ses-&gt;afid = ~0;</div><div class='del'>-	v9ses-&gt;debug = 0;</div><div class='del'>-	v9ses-&gt;cache = CACHE_NONE;</div><div class='del'>-#ifdef CONFIG_9P_FSCACHE</div><div class='del'>-	v9ses-&gt;cachetag = NULL;</div><div class='del'>-#endif</div><div class='del'>-	v9ses-&gt;session_lock_timeout = P9_LOCK_TIMEOUT;</div><div class='del'>-</div><div class='del'>-	if (!opts)</div><div class='del'>-		return 0;</div><div class='add'>+	int r;</div><div class='add'>+	int opt;</div><div class='add'>+	struct p9_client_opts	*clnt = &amp;ctx-&gt;client_opts;</div><div class='add'>+	struct p9_fd_opts	*fd_opts = &amp;ctx-&gt;fd_opts;</div><div class='add'>+	struct p9_rdma_opts	*rdma_opts = &amp;ctx-&gt;rdma_opts;</div><div class='add'>+	struct p9_session_opts	*session_opts = &amp;ctx-&gt;session_opts;</div><div class='add'>+</div><div class='add'>+	opt = fs_parse(fc, v9fs_param_spec, param, &amp;result);</div><div class='add'>+	if (opt &lt; 0) {</div><div class='add'>+		/*</div><div class='add'>+		 * We might like to report bad mount options here, but</div><div class='add'>+		 * traditionally 9p has ignored unknown mount options</div><div class='add'>+		 */</div><div class='add'>+		if (opt == -ENOPARAM)</div><div class='add'>+			return 0;</div><div class='ctx'> </div><div class='del'>-	tmp_options = kstrdup(opts, GFP_KERNEL);</div><div class='del'>-	if (!tmp_options) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto fail_option_alloc;</div><div class='add'>+		return opt;</div><div class='ctx'> 	}</div><div class='del'>-	options = tmp_options;</div><div class='del'>-</div><div class='del'>-	while ((p = strsep(&amp;options, ",")) != NULL) {</div><div class='del'>-		int token, r;</div><div class='del'>-</div><div class='del'>-		if (!*p)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		token = match_token(p, tokens, args);</div><div class='del'>-		switch (token) {</div><div class='del'>-		case Opt_debug:</div><div class='del'>-			r = match_int(&amp;args[0], &amp;option);</div><div class='del'>-			if (r &lt; 0) {</div><div class='del'>-				p9_debug(P9_DEBUG_ERROR,</div><div class='del'>-					 "integer field, but no integer?\n");</div><div class='del'>-				ret = r;</div><div class='del'>-			} else {</div><div class='del'>-				v9ses-&gt;debug = option;</div><div class='add'>+</div><div class='add'>+	switch (opt) {</div><div class='add'>+	case Opt_source:</div><div class='add'>+		if (fc-&gt;source) {</div><div class='add'>+			pr_info("p9: multiple sources not supported\n");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		fc-&gt;source = param-&gt;string;</div><div class='add'>+		param-&gt;string = NULL;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_debug:</div><div class='add'>+		session_opts-&gt;debug = result.uint_32;</div><div class='ctx'> #ifdef CONFIG_NET_9P_DEBUG</div><div class='del'>-				p9_debug_level = option;</div><div class='add'>+		p9_debug_level = result.uint_32;</div><div class='ctx'> #endif</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		case Opt_dfltuid:</div><div class='del'>-			r = match_int(&amp;args[0], &amp;option);</div><div class='del'>-			if (r &lt; 0) {</div><div class='del'>-				p9_debug(P9_DEBUG_ERROR,</div><div class='del'>-					 "integer field, but no integer?\n");</div><div class='del'>-				ret = r;</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='del'>-			v9ses-&gt;dfltuid = make_kuid(current_user_ns(), option);</div><div class='del'>-			if (!uid_valid(v9ses-&gt;dfltuid)) {</div><div class='del'>-				p9_debug(P9_DEBUG_ERROR,</div><div class='del'>-					 "uid field, but not a uid?\n");</div><div class='del'>-				ret = -EINVAL;</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		case Opt_dfltgid:</div><div class='del'>-			r = match_int(&amp;args[0], &amp;option);</div><div class='del'>-			if (r &lt; 0) {</div><div class='del'>-				p9_debug(P9_DEBUG_ERROR,</div><div class='del'>-					 "integer field, but no integer?\n");</div><div class='del'>-				ret = r;</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='del'>-			v9ses-&gt;dfltgid = make_kgid(current_user_ns(), option);</div><div class='del'>-			if (!gid_valid(v9ses-&gt;dfltgid)) {</div><div class='del'>-				p9_debug(P9_DEBUG_ERROR,</div><div class='del'>-					 "gid field, but not a gid?\n");</div><div class='del'>-				ret = -EINVAL;</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		case Opt_afid:</div><div class='del'>-			r = match_int(&amp;args[0], &amp;option);</div><div class='del'>-			if (r &lt; 0) {</div><div class='del'>-				p9_debug(P9_DEBUG_ERROR,</div><div class='del'>-					 "integer field, but no integer?\n");</div><div class='del'>-				ret = r;</div><div class='del'>-			} else {</div><div class='del'>-				v9ses-&gt;afid = option;</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		case Opt_uname:</div><div class='del'>-			kfree(v9ses-&gt;uname);</div><div class='del'>-			v9ses-&gt;uname = match_strdup(&amp;args[0]);</div><div class='del'>-			if (!v9ses-&gt;uname) {</div><div class='del'>-				ret = -ENOMEM;</div><div class='del'>-				goto free_and_return;</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		case Opt_remotename:</div><div class='del'>-			kfree(v9ses-&gt;aname);</div><div class='del'>-			v9ses-&gt;aname = match_strdup(&amp;args[0]);</div><div class='del'>-			if (!v9ses-&gt;aname) {</div><div class='del'>-				ret = -ENOMEM;</div><div class='del'>-				goto free_and_return;</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		case Opt_nodevmap:</div><div class='del'>-			v9ses-&gt;nodev = 1;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_cache_loose:</div><div class='del'>-			v9ses-&gt;cache = CACHE_LOOSE;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_fscache:</div><div class='del'>-			v9ses-&gt;cache = CACHE_FSCACHE;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_mmap:</div><div class='del'>-			v9ses-&gt;cache = CACHE_MMAP;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_cachetag:</div><div class='add'>+		break;</div><div class='add'>+</div><div class='add'>+	case Opt_dfltuid:</div><div class='add'>+		session_opts-&gt;dfltuid = result.uid;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_dfltgid:</div><div class='add'>+		session_opts-&gt;dfltgid = result.gid;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_afid:</div><div class='add'>+		session_opts-&gt;afid = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_uname:</div><div class='add'>+		kfree(session_opts-&gt;uname);</div><div class='add'>+		session_opts-&gt;uname = param-&gt;string;</div><div class='add'>+		param-&gt;string = NULL;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_remotename:</div><div class='add'>+		kfree(session_opts-&gt;aname);</div><div class='add'>+		session_opts-&gt;aname = param-&gt;string;</div><div class='add'>+		param-&gt;string = NULL;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_nodevmap:</div><div class='add'>+		session_opts-&gt;nodev = 1;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_noxattr:</div><div class='add'>+		session_opts-&gt;flags |= V9FS_NO_XATTR;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_directio:</div><div class='add'>+		session_opts-&gt;flags |= V9FS_DIRECT_IO;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_ignoreqv:</div><div class='add'>+		session_opts-&gt;flags |= V9FS_IGNORE_QV;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_cachetag:</div><div class='ctx'> #ifdef CONFIG_9P_FSCACHE</div><div class='del'>-			kfree(v9ses-&gt;cachetag);</div><div class='del'>-			v9ses-&gt;cachetag = match_strdup(&amp;args[0]);</div><div class='del'>-			if (!v9ses-&gt;cachetag) {</div><div class='del'>-				ret = -ENOMEM;</div><div class='del'>-				goto free_and_return;</div><div class='del'>-			}</div><div class='add'>+		kfree(session_opts-&gt;cachetag);</div><div class='add'>+		session_opts-&gt;cachetag = param-&gt;string;</div><div class='add'>+		param-&gt;string = NULL;</div><div class='ctx'> #endif</div><div class='del'>-			break;</div><div class='del'>-		case Opt_cache:</div><div class='del'>-			s = match_strdup(&amp;args[0]);</div><div class='del'>-			if (!s) {</div><div class='del'>-				ret = -ENOMEM;</div><div class='del'>-				p9_debug(P9_DEBUG_ERROR,</div><div class='del'>-					 "problem allocating copy of cache arg\n");</div><div class='del'>-				goto free_and_return;</div><div class='del'>-			}</div><div class='del'>-			r = get_cache_mode(s);</div><div class='del'>-			if (r &lt; 0)</div><div class='del'>-				ret = r;</div><div class='del'>-			else</div><div class='del'>-				v9ses-&gt;cache = r;</div><div class='del'>-</div><div class='del'>-			kfree(s);</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		case Opt_access:</div><div class='del'>-			s = match_strdup(&amp;args[0]);</div><div class='del'>-			if (!s) {</div><div class='del'>-				ret = -ENOMEM;</div><div class='del'>-				p9_debug(P9_DEBUG_ERROR,</div><div class='del'>-					 "problem allocating copy of access arg\n");</div><div class='del'>-				goto free_and_return;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_cache:</div><div class='add'>+		r = get_cache_mode(param-&gt;string);</div><div class='add'>+		if (r &lt; 0)</div><div class='add'>+			return r;</div><div class='add'>+		session_opts-&gt;cache = r;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_access:</div><div class='add'>+		s = param-&gt;string;</div><div class='add'>+		session_opts-&gt;flags &amp;= ~V9FS_ACCESS_MASK;</div><div class='add'>+		if (strcmp(s, "user") == 0) {</div><div class='add'>+			session_opts-&gt;flags |= V9FS_ACCESS_USER;</div><div class='add'>+		} else if (strcmp(s, "any") == 0) {</div><div class='add'>+			session_opts-&gt;flags |= V9FS_ACCESS_ANY;</div><div class='add'>+		} else if (strcmp(s, "client") == 0) {</div><div class='add'>+			session_opts-&gt;flags |= V9FS_ACCESS_CLIENT;</div><div class='add'>+		} else {</div><div class='add'>+			uid_t uid;</div><div class='add'>+</div><div class='add'>+			session_opts-&gt;flags |= V9FS_ACCESS_SINGLE;</div><div class='add'>+			r = kstrtouint(s, 10, &amp;uid);</div><div class='add'>+			if (r) {</div><div class='add'>+				pr_info("Unknown access argument %s: %d\n",</div><div class='add'>+					param-&gt;string, r);</div><div class='add'>+				return r;</div><div class='ctx'> 			}</div><div class='del'>-</div><div class='del'>-			v9ses-&gt;flags &amp;= ~V9FS_ACCESS_MASK;</div><div class='del'>-			if (strcmp(s, "user") == 0)</div><div class='del'>-				v9ses-&gt;flags |= V9FS_ACCESS_USER;</div><div class='del'>-			else if (strcmp(s, "any") == 0)</div><div class='del'>-				v9ses-&gt;flags |= V9FS_ACCESS_ANY;</div><div class='del'>-			else if (strcmp(s, "client") == 0) {</div><div class='del'>-				v9ses-&gt;flags |= V9FS_ACCESS_CLIENT;</div><div class='del'>-			} else {</div><div class='del'>-				uid_t uid;</div><div class='del'>-</div><div class='del'>-				v9ses-&gt;flags |= V9FS_ACCESS_SINGLE;</div><div class='del'>-				r = kstrtouint(s, 10, &amp;uid);</div><div class='del'>-				if (r) {</div><div class='del'>-					ret = r;</div><div class='del'>-					pr_info("Unknown access argument %s: %d\n",</div><div class='del'>-						s, r);</div><div class='del'>-					kfree(s);</div><div class='del'>-					continue;</div><div class='del'>-				}</div><div class='del'>-				v9ses-&gt;uid = make_kuid(current_user_ns(), uid);</div><div class='del'>-				if (!uid_valid(v9ses-&gt;uid)) {</div><div class='del'>-					ret = -EINVAL;</div><div class='del'>-					pr_info("Unknown uid %s\n", s);</div><div class='del'>-				}</div><div class='add'>+			session_opts-&gt;uid = make_kuid(current_user_ns(), uid);</div><div class='add'>+			if (!uid_valid(session_opts-&gt;uid)) {</div><div class='add'>+				pr_info("Unknown uid %s\n", s);</div><div class='add'>+				return -EINVAL;</div><div class='ctx'> 			}</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='ctx'> </div><div class='del'>-			kfree(s);</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		case Opt_posixacl:</div><div class='add'>+	case Opt_posixacl:</div><div class='ctx'> #ifdef CONFIG_9P_FS_POSIX_ACL</div><div class='del'>-			v9ses-&gt;flags |= V9FS_POSIX_ACL;</div><div class='add'>+		session_opts-&gt;flags |= V9FS_POSIX_ACL;</div><div class='ctx'> #else</div><div class='del'>-			p9_debug(P9_DEBUG_ERROR,</div><div class='del'>-				 "Not defined CONFIG_9P_FS_POSIX_ACL. Ignoring posixacl option\n");</div><div class='add'>+		p9_debug(P9_DEBUG_ERROR,</div><div class='add'>+			 "Not defined CONFIG_9P_FS_POSIX_ACL. Ignoring posixacl option\n");</div><div class='ctx'> #endif</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		case Opt_locktimeout:</div><div class='del'>-			r = match_int(&amp;args[0], &amp;option);</div><div class='del'>-			if (r &lt; 0) {</div><div class='del'>-				p9_debug(P9_DEBUG_ERROR,</div><div class='del'>-					 "integer field, but no integer?\n");</div><div class='del'>-				ret = r;</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='del'>-			if (option &lt; 1) {</div><div class='del'>-				p9_debug(P9_DEBUG_ERROR,</div><div class='del'>-					 "locktimeout must be a greater than zero integer.\n");</div><div class='del'>-				ret = -EINVAL;</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='del'>-			v9ses-&gt;session_lock_timeout = (long)option * HZ;</div><div class='del'>-			break;</div><div class='add'>+		break;</div><div class='ctx'> </div><div class='del'>-		default:</div><div class='del'>-			continue;</div><div class='add'>+	case Opt_locktimeout:</div><div class='add'>+		if (result.uint_32 &lt; 1) {</div><div class='add'>+			p9_debug(P9_DEBUG_ERROR,</div><div class='add'>+				 "locktimeout must be a greater than zero integer.\n");</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 		}</div><div class='add'>+		session_opts-&gt;session_lock_timeout = (long)result.uint_32 * HZ;</div><div class='add'>+		break;</div><div class='add'>+</div><div class='add'>+	/* Options for client */</div><div class='add'>+	case Opt_msize:</div><div class='add'>+		if (result.uint_32 &lt; 4096) {</div><div class='add'>+			p9_debug(P9_DEBUG_ERROR, "msize should be at least 4k\n");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		if (result.uint_32 &gt; INT_MAX) {</div><div class='add'>+			p9_debug(P9_DEBUG_ERROR, "msize too big\n");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		clnt-&gt;msize = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_trans:</div><div class='add'>+		v9fs_put_trans(clnt-&gt;trans_mod);</div><div class='add'>+		clnt-&gt;trans_mod = v9fs_get_trans_by_name(param-&gt;string);</div><div class='add'>+		if (!clnt-&gt;trans_mod) {</div><div class='add'>+			pr_info("Could not find request transport: %s\n",</div><div class='add'>+				param-&gt;string);</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='add'>+	case Opt_legacy:</div><div class='add'>+		clnt-&gt;proto_version = p9_proto_legacy;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_version:</div><div class='add'>+		clnt-&gt;proto_version = result.uint_32;</div><div class='add'>+		p9_debug(P9_DEBUG_9P, "Protocol version: %s\n", param-&gt;string);</div><div class='add'>+		break;</div><div class='add'>+	/* Options for fd transport */</div><div class='add'>+	case Opt_rfdno:</div><div class='add'>+		fd_opts-&gt;rfd = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_wfdno:</div><div class='add'>+		fd_opts-&gt;wfd = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	/* Options for rdma transport */</div><div class='add'>+	case Opt_sq_depth:</div><div class='add'>+		rdma_opts-&gt;sq_depth = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_rq_depth:</div><div class='add'>+		rdma_opts-&gt;rq_depth = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_timeout:</div><div class='add'>+		rdma_opts-&gt;timeout = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	/* Options for both fd and rdma transports */</div><div class='add'>+	case Opt_port:</div><div class='add'>+		fd_opts-&gt;port = result.uint_32;</div><div class='add'>+		rdma_opts-&gt;port = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_privport:</div><div class='add'>+		fd_opts-&gt;privport = true;</div><div class='add'>+		rdma_opts-&gt;port = true;</div><div class='add'>+		break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-free_and_return:</div><div class='del'>-	kfree(tmp_options);</div><div class='del'>-fail_option_alloc:</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void v9fs_apply_options(struct v9fs_session_info *v9ses,</div><div class='add'>+		  struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct v9fs_context	*ctx = fc-&gt;fs_private;</div><div class='add'>+</div><div class='add'>+	v9ses-&gt;debug = ctx-&gt;session_opts.debug;</div><div class='add'>+	v9ses-&gt;dfltuid = ctx-&gt;session_opts.dfltuid;</div><div class='add'>+	v9ses-&gt;dfltgid = ctx-&gt;session_opts.dfltgid;</div><div class='add'>+	v9ses-&gt;afid = ctx-&gt;session_opts.afid;</div><div class='add'>+	v9ses-&gt;uname = ctx-&gt;session_opts.uname;</div><div class='add'>+	ctx-&gt;session_opts.uname = NULL;</div><div class='add'>+	v9ses-&gt;aname = ctx-&gt;session_opts.aname;</div><div class='add'>+	ctx-&gt;session_opts.aname = NULL;</div><div class='add'>+	v9ses-&gt;nodev = ctx-&gt;session_opts.nodev;</div><div class='add'>+	/*</div><div class='add'>+	 * Note that we must |= flags here as session_init already</div><div class='add'>+	 * set basic flags. This adds in flags from parsed options.</div><div class='add'>+	 */</div><div class='add'>+	v9ses-&gt;flags |= ctx-&gt;session_opts.flags;</div><div class='add'>+#ifdef CONFIG_9P_FSCACHE</div><div class='add'>+	v9ses-&gt;cachetag = ctx-&gt;session_opts.cachetag;</div><div class='add'>+	ctx-&gt;session_opts.cachetag = NULL;</div><div class='add'>+#endif</div><div class='add'>+	v9ses-&gt;cache = ctx-&gt;session_opts.cache;</div><div class='add'>+	v9ses-&gt;uid = ctx-&gt;session_opts.uid;</div><div class='add'>+	v9ses-&gt;session_lock_timeout = ctx-&gt;session_opts.session_lock_timeout;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * v9fs_session_init - initialize session</div><div class='ctx'>  * @v9ses: session information structure</div><div class='del'>- * @dev_name: device being mounted</div><div class='del'>- * @data: options</div><div class='add'>+ * @fc: the filesystem mount context</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> struct p9_fid *v9fs_session_init(struct v9fs_session_info *v9ses,</div><div class='del'>-		  const char *dev_name, char *data)</div><div class='add'>+		  struct fs_context *fc)</div><div class='ctx'> {</div><div class='ctx'> 	struct p9_fid *fid;</div><div class='ctx'> 	int rc = -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	v9ses-&gt;uname = kstrdup(V9FS_DEFUSER, GFP_KERNEL);</div><div class='del'>-	if (!v9ses-&gt;uname)</div><div class='del'>-		goto err_names;</div><div class='del'>-</div><div class='del'>-	v9ses-&gt;aname = kstrdup(V9FS_DEFANAME, GFP_KERNEL);</div><div class='del'>-	if (!v9ses-&gt;aname)</div><div class='del'>-		goto err_names;</div><div class='ctx'> 	init_rwsem(&amp;v9ses-&gt;rename_sem);</div><div class='ctx'> </div><div class='del'>-	v9ses-&gt;uid = INVALID_UID;</div><div class='del'>-	v9ses-&gt;dfltuid = V9FS_DEFUID;</div><div class='del'>-	v9ses-&gt;dfltgid = V9FS_DEFGID;</div><div class='del'>-</div><div class='del'>-	v9ses-&gt;clnt = p9_client_create(dev_name, data);</div><div class='add'>+	v9ses-&gt;clnt = p9_client_create(fc);</div><div class='ctx'> 	if (IS_ERR(v9ses-&gt;clnt)) {</div><div class='ctx'> 		rc = PTR_ERR(v9ses-&gt;clnt);</div><div class='ctx'> 		p9_debug(P9_DEBUG_ERROR, "problem initializing 9p client\n");</div><div class='ctx'> 		goto err_names;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Initialize flags on the real v9ses. v9fs_apply_options below</div><div class='add'>+	 * will |= the additional flags from parsed options.</div><div class='add'>+	 */</div><div class='ctx'> 	v9ses-&gt;flags = V9FS_ACCESS_USER;</div><div class='ctx'> </div><div class='ctx'> 	if (p9_is_proto_dotl(v9ses-&gt;clnt)) {</div><div class='hunk'>@@ -421,9 +459,7 @@ struct p9_fid *v9fs_session_init(struct v9fs_session_info *v9ses,</div><div class='ctx'> 		v9ses-&gt;flags |= V9FS_PROTO_2000U;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	rc = v9fs_parse_options(v9ses, data);</div><div class='del'>-	if (rc &lt; 0)</div><div class='del'>-		goto err_clnt;</div><div class='add'>+	v9fs_apply_options(v9ses, fc);</div><div class='ctx'> </div><div class='ctx'> 	v9ses-&gt;maxdata = v9ses-&gt;clnt-&gt;msize - P9_IOHDRSZ;</div><div class='ctx'> </div><div class='hunk'>@@ -436,8 +472,7 @@ struct p9_fid *v9fs_session_init(struct v9fs_session_info *v9ses,</div><div class='ctx'> 		v9ses-&gt;flags &amp;= ~V9FS_ACCESS_MASK;</div><div class='ctx'> 		v9ses-&gt;flags |= V9FS_ACCESS_USER;</div><div class='ctx'> 	}</div><div class='del'>-	/*FIXME !! */</div><div class='del'>-	/* for legacy mode, fall back to V9FS_ACCESS_ANY */</div><div class='add'>+	/* FIXME: for legacy mode, fall back to V9FS_ACCESS_ANY */</div><div class='ctx'> 	if (!(v9fs_proto_dotu(v9ses) || v9fs_proto_dotl(v9ses)) &amp;&amp;</div><div class='ctx'> 		((v9ses-&gt;flags&amp;V9FS_ACCESS_MASK) == V9FS_ACCESS_USER)) {</div><div class='ctx'> </div><div class='hunk'>@@ -448,7 +483,7 @@ struct p9_fid *v9fs_session_init(struct v9fs_session_info *v9ses,</div><div class='ctx'> 	if (!v9fs_proto_dotl(v9ses) ||</div><div class='ctx'> 		!((v9ses-&gt;flags &amp; V9FS_ACCESS_MASK) == V9FS_ACCESS_CLIENT)) {</div><div class='ctx'> 		/*</div><div class='del'>-		 * We support ACL checks on clinet only if the protocol is</div><div class='add'>+		 * We support ACL checks on client only if the protocol is</div><div class='ctx'> 		 * 9P2000.L and access is V9FS_ACCESS_CLIENT.</div><div class='ctx'> 		 */</div><div class='ctx'> 		v9ses-&gt;flags &amp;= ~V9FS_ACL_MASK;</div><div class='hunk'>@@ -469,7 +504,11 @@ struct p9_fid *v9fs_session_init(struct v9fs_session_info *v9ses,</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_9P_FSCACHE</div><div class='ctx'> 	/* register the session for caching */</div><div class='del'>-	v9fs_cache_session_get_cookie(v9ses);</div><div class='add'>+	if (v9ses-&gt;cache &amp; CACHE_FSCACHE) {</div><div class='add'>+		rc = v9fs_cache_session_get_cookie(v9ses, fc-&gt;source);</div><div class='add'>+		if (rc &lt; 0)</div><div class='add'>+			goto err_clnt;</div><div class='add'>+	}</div><div class='ctx'> #endif</div><div class='ctx'> 	spin_lock(&amp;v9fs_sessionlist_lock);</div><div class='ctx'> 	list_add(&amp;v9ses-&gt;slist, &amp;v9fs_sessionlist);</div><div class='hunk'>@@ -502,8 +541,7 @@ void v9fs_session_close(struct v9fs_session_info *v9ses)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_9P_FSCACHE</div><div class='del'>-	if (v9ses-&gt;fscache)</div><div class='del'>-		v9fs_cache_session_put_cookie(v9ses);</div><div class='add'>+	fscache_relinquish_volume(v9fs_session_cache(v9ses), NULL, false);</div><div class='ctx'> 	kfree(v9ses-&gt;cachetag);</div><div class='ctx'> #endif</div><div class='ctx'> 	kfree(v9ses-&gt;uname);</div><div class='hunk'>@@ -540,8 +578,6 @@ void v9fs_session_begin_cancel(struct v9fs_session_info *v9ses)</div><div class='ctx'> 	p9_client_begin_disconnect(v9ses-&gt;clnt);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-extern int v9fs_error_init(void);</div><div class='del'>-</div><div class='ctx'> static struct kobject *v9fs_kobj;</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_9P_FSCACHE</div><div class='hunk'>@@ -558,7 +594,7 @@ static ssize_t caches_show(struct kobject *kobj,</div><div class='ctx'> 	spin_lock(&amp;v9fs_sessionlist_lock);</div><div class='ctx'> 	list_for_each_entry(v9ses, &amp;v9fs_sessionlist, slist) {</div><div class='ctx'> 		if (v9ses-&gt;cachetag) {</div><div class='del'>-			n = snprintf(buf, limit, "%s\n", v9ses-&gt;cachetag);</div><div class='add'>+			n = snprintf(buf + count, limit, "%s\n", v9ses-&gt;cachetag);</div><div class='ctx'> 			if (n &lt; 0) {</div><div class='ctx'> 				count = n;</div><div class='ctx'> 				break;</div><div class='hunk'>@@ -594,13 +630,16 @@ static const struct attribute_group v9fs_attr_group = {</div><div class='ctx'> </div><div class='ctx'> static int __init v9fs_sysfs_init(void)</div><div class='ctx'> {</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='ctx'> 	v9fs_kobj = kobject_create_and_add("9p", fs_kobj);</div><div class='ctx'> 	if (!v9fs_kobj)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	if (sysfs_create_group(v9fs_kobj, &amp;v9fs_attr_group)) {</div><div class='add'>+	ret = sysfs_create_group(v9fs_kobj, &amp;v9fs_attr_group);</div><div class='add'>+	if (ret) {</div><div class='ctx'> 		kobject_put(v9fs_kobj);</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -620,11 +659,9 @@ static void v9fs_sysfs_cleanup(void)</div><div class='ctx'> static void v9fs_inode_init_once(void *foo)</div><div class='ctx'> {</div><div class='ctx'> 	struct v9fs_inode *v9inode = (struct v9fs_inode *)foo;</div><div class='del'>-#ifdef CONFIG_9P_FSCACHE</div><div class='del'>-	v9inode-&gt;fscache = NULL;</div><div class='del'>-#endif</div><div class='add'>+</div><div class='ctx'> 	memset(&amp;v9inode-&gt;qid, 0, sizeof(v9inode-&gt;qid));</div><div class='del'>-	inode_init_once(&amp;v9inode-&gt;vfs_inode);</div><div class='add'>+	inode_init_once(&amp;v9inode-&gt;netfs.inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -636,7 +673,7 @@ static int v9fs_init_inode_cache(void)</div><div class='ctx'> 	v9fs_inode_cache = kmem_cache_create("v9fs_inode_cache",</div><div class='ctx'> 					  sizeof(struct v9fs_inode),</div><div class='ctx'> 					  0, (SLAB_RECLAIM_ACCOUNT|</div><div class='del'>-					      SLAB_MEM_SPREAD|SLAB_ACCOUNT),</div><div class='add'>+					      SLAB_ACCOUNT),</div><div class='ctx'> 					  v9fs_inode_init_once);</div><div class='ctx'> 	if (!v9fs_inode_cache)</div><div class='ctx'> 		return -ENOMEM;</div><div class='hunk'>@@ -658,29 +695,6 @@ static void v9fs_destroy_inode_cache(void)</div><div class='ctx'> 	kmem_cache_destroy(v9fs_inode_cache);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int v9fs_cache_register(void)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ret = v9fs_init_inode_cache();</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		return ret;</div><div class='del'>-#ifdef CONFIG_9P_FSCACHE</div><div class='del'>-	ret = fscache_register_netfs(&amp;v9fs_cache_netfs);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		v9fs_destroy_inode_cache();</div><div class='del'>-#endif</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void v9fs_cache_unregister(void)</div><div class='del'>-{</div><div class='del'>-	v9fs_destroy_inode_cache();</div><div class='del'>-#ifdef CONFIG_9P_FSCACHE</div><div class='del'>-	fscache_unregister_netfs(&amp;v9fs_cache_netfs);</div><div class='del'>-#endif</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /**</div><div class='ctx'>  * init_v9fs - Initialize module</div><div class='ctx'>  *</div><div class='hunk'>@@ -691,9 +705,9 @@ static int __init init_v9fs(void)</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	pr_info("Installing v9fs 9p2000 file system support\n");</div><div class='del'>-	/* TODO: Setup list of registered trasnport modules */</div><div class='add'>+	/* TODO: Setup list of registered transport modules */</div><div class='ctx'> </div><div class='del'>-	err = v9fs_cache_register();</div><div class='add'>+	err = v9fs_init_inode_cache();</div><div class='ctx'> 	if (err &lt; 0) {</div><div class='ctx'> 		pr_err("Failed to register v9fs for caching\n");</div><div class='ctx'> 		return err;</div><div class='hunk'>@@ -716,7 +730,7 @@ out_sysfs_cleanup:</div><div class='ctx'> 	v9fs_sysfs_cleanup();</div><div class='ctx'> </div><div class='ctx'> out_cache:</div><div class='del'>-	v9fs_cache_unregister();</div><div class='add'>+	v9fs_destroy_inode_cache();</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='hunk'>@@ -729,7 +743,7 @@ out_cache:</div><div class='ctx'> static void __exit exit_v9fs(void)</div><div class='ctx'> {</div><div class='ctx'> 	v9fs_sysfs_cleanup();</div><div class='del'>-	v9fs_cache_unregister();</div><div class='add'>+	v9fs_destroy_inode_cache();</div><div class='ctx'> 	unregister_filesystem(&amp;v9fs_fs_type);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -739,4 +753,5 @@ module_exit(exit_v9fs)</div><div class='ctx'> MODULE_AUTHOR("Latchesar Ionkov &lt;lucho@ionkov.net&gt;");</div><div class='ctx'> MODULE_AUTHOR("Eric Van Hensbergen &lt;ericvh@gmail.com&gt;");</div><div class='ctx'> MODULE_AUTHOR("Ron Minnich &lt;rminnich@lanl.gov&gt;");</div><div class='add'>+MODULE_DESCRIPTION("9P Client File System");</div><div class='ctx'> MODULE_LICENSE("GPL");</div><div class='head'>diff --git a/fs/9p/v9fs.h b/fs/9p/v9fs.h<br/>index 1647a8e63671..6a12445d3858 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/9p/v9fs.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/9p/v9fs.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/9p/v9fs.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/9p/v9fs.h</a></div><div class='hunk'>@@ -9,6 +9,10 @@</div><div class='ctx'> #define FS_9P_V9FS_H</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/backing-dev.h&gt;</div><div class='add'>+#include &lt;linux/netfs.h&gt;</div><div class='add'>+#include &lt;linux/fs_parser.h&gt;</div><div class='add'>+#include &lt;net/9p/client.h&gt;</div><div class='add'>+#include &lt;net/9p/transport.h&gt;</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * enum p9_session_flags - option flags for each 9P session</div><div class='hunk'>@@ -30,29 +34,54 @@</div><div class='ctx'> #define V9FS_ACL_MASK V9FS_POSIX_ACL</div><div class='ctx'> </div><div class='ctx'> enum p9_session_flags {</div><div class='del'>-	V9FS_PROTO_2000U	= 0x01,</div><div class='del'>-	V9FS_PROTO_2000L	= 0x02,</div><div class='del'>-	V9FS_ACCESS_SINGLE	= 0x04,</div><div class='del'>-	V9FS_ACCESS_USER	= 0x08,</div><div class='del'>-	V9FS_ACCESS_CLIENT	= 0x10,</div><div class='del'>-	V9FS_POSIX_ACL		= 0x20</div><div class='add'>+	V9FS_PROTO_2000U    = 0x01,</div><div class='add'>+	V9FS_PROTO_2000L    = 0x02,</div><div class='add'>+	V9FS_ACCESS_SINGLE  = 0x04,</div><div class='add'>+	V9FS_ACCESS_USER    = 0x08,</div><div class='add'>+	V9FS_ACCESS_CLIENT  = 0x10,</div><div class='add'>+	V9FS_POSIX_ACL      = 0x20,</div><div class='add'>+	V9FS_NO_XATTR       = 0x40,</div><div class='add'>+	V9FS_IGNORE_QV      = 0x80, /* ignore qid.version for cache hints */</div><div class='add'>+	V9FS_DIRECT_IO      = 0x100,</div><div class='add'>+	V9FS_SYNC           = 0x200</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/* possible values of -&gt;cache */</div><div class='ctx'> /**</div><div class='del'>- * enum p9_cache_modes - user specified cache preferences</div><div class='del'>- * @CACHE_NONE: do not cache data, dentries, or directory contents (default)</div><div class='del'>- * @CACHE_LOOSE: cache data, dentries, and directory contents w/no consistency</div><div class='add'>+ * enum p9_cache_shortcuts - human readable cache preferences</div><div class='add'>+ * @CACHE_SC_NONE: disable all caches</div><div class='add'>+ * @CACHE_SC_READAHEAD: only provide caching for readahead</div><div class='add'>+ * @CACHE_SC_MMAP: provide caching to enable mmap</div><div class='add'>+ * @CACHE_SC_LOOSE: non-coherent caching for files and meta data</div><div class='add'>+ * @CACHE_SC_FSCACHE: persistent non-coherent caching for files and meta-data</div><div class='ctx'>  *</div><div class='del'>- * eventually support loose, tight, time, session, default always none</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-enum p9_cache_modes {</div><div class='del'>-	CACHE_NONE,</div><div class='del'>-	CACHE_MMAP,</div><div class='del'>-	CACHE_LOOSE,</div><div class='del'>-	CACHE_FSCACHE,</div><div class='del'>-	nr__p9_cache_modes</div><div class='add'>+enum p9_cache_shortcuts {</div><div class='add'>+	CACHE_SC_NONE       = 0b00000000,</div><div class='add'>+	CACHE_SC_READAHEAD  = 0b00000001,</div><div class='add'>+	CACHE_SC_MMAP       = 0b00000101,</div><div class='add'>+	CACHE_SC_LOOSE      = 0b00001111,</div><div class='add'>+	CACHE_SC_FSCACHE    = 0b10001111,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * enum p9_cache_bits - possible values of -&gt;cache</div><div class='add'>+ * @CACHE_NONE: caches disabled</div><div class='add'>+ * @CACHE_FILE: file caching (open to close)</div><div class='add'>+ * @CACHE_META: meta-data and directory caching</div><div class='add'>+ * @CACHE_WRITEBACK: write-back caching for files</div><div class='add'>+ * @CACHE_LOOSE: don't check cache consistency</div><div class='add'>+ * @CACHE_FSCACHE: local persistent caches</div><div class='add'>+ *</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+enum p9_cache_bits {</div><div class='add'>+	CACHE_NONE          = 0b00000000,</div><div class='add'>+	CACHE_FILE          = 0b00000001,</div><div class='add'>+	CACHE_META          = 0b00000010,</div><div class='add'>+	CACHE_WRITEBACK     = 0b00000100,</div><div class='add'>+	CACHE_LOOSE         = 0b00001000,</div><div class='add'>+	CACHE_FSCACHE       = 0b10000000,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -61,7 +90,7 @@ enum p9_cache_modes {</div><div class='ctx'>  * @nodev: set to 1 to disable device mapping</div><div class='ctx'>  * @debug: debug level</div><div class='ctx'>  * @afid: authentication handle</div><div class='del'>- * @cache: cache mode of type &amp;p9_cache_modes</div><div class='add'>+ * @cache: cache mode of type &amp;p9_cache_bits</div><div class='ctx'>  * @cachetag: the tag of the cache associated with this session</div><div class='ctx'>  * @fscache: session cookie associated with FS-Cache</div><div class='ctx'>  * @uname: string user name to mount hierarchy as</div><div class='hunk'>@@ -82,14 +111,14 @@ enum p9_cache_modes {</div><div class='ctx'> </div><div class='ctx'> struct v9fs_session_info {</div><div class='ctx'> 	/* options */</div><div class='del'>-	unsigned char flags;</div><div class='add'>+	unsigned int flags;</div><div class='ctx'> 	unsigned char nodev;</div><div class='ctx'> 	unsigned short debug;</div><div class='ctx'> 	unsigned int afid;</div><div class='ctx'> 	unsigned int cache;</div><div class='ctx'> #ifdef CONFIG_9P_FSCACHE</div><div class='ctx'> 	char *cachetag;</div><div class='del'>-	struct fscache_cookie *fscache;</div><div class='add'>+	struct fscache_volume *fscache;</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> 	char *uname;		/* user name to mount as */</div><div class='hunk'>@@ -108,35 +137,42 @@ struct v9fs_session_info {</div><div class='ctx'> #define V9FS_INO_INVALID_ATTR 0x01</div><div class='ctx'> </div><div class='ctx'> struct v9fs_inode {</div><div class='del'>-#ifdef CONFIG_9P_FSCACHE</div><div class='del'>-	struct mutex fscache_lock;</div><div class='del'>-	struct fscache_cookie *fscache;</div><div class='del'>-#endif</div><div class='add'>+	struct netfs_inode netfs; /* Netfslib context and vfs inode */</div><div class='ctx'> 	struct p9_qid qid;</div><div class='ctx'> 	unsigned int cache_validity;</div><div class='del'>-	struct p9_fid *writeback_fid;</div><div class='ctx'> 	struct mutex v_mutex;</div><div class='del'>-	struct inode vfs_inode;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static inline struct v9fs_inode *V9FS_I(const struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	return container_of(inode, struct v9fs_inode, vfs_inode);</div><div class='add'>+	return container_of(inode, struct v9fs_inode, netfs.inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline struct fscache_cookie *v9fs_inode_cookie(struct v9fs_inode *v9inode)</div><div class='ctx'> {</div><div class='ctx'> #ifdef CONFIG_9P_FSCACHE</div><div class='del'>-	return v9inode-&gt;fscache;</div><div class='add'>+	return netfs_i_cookie(&amp;v9inode-&gt;netfs);</div><div class='ctx'> #else</div><div class='ctx'> 	return NULL;</div><div class='ctx'> #endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline struct fscache_volume *v9fs_session_cache(struct v9fs_session_info *v9ses)</div><div class='add'>+{</div><div class='add'>+#ifdef CONFIG_9P_FSCACHE</div><div class='add'>+	return v9ses-&gt;fscache;</div><div class='add'>+#else</div><div class='add'>+	return NULL;</div><div class='add'>+#endif</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+extern const struct fs_parameter_spec v9fs_param_spec[];</div><div class='add'>+</div><div class='add'>+extern int v9fs_parse_param(struct fs_context *fc, struct fs_parameter *param);</div><div class='ctx'> extern int v9fs_show_options(struct seq_file *m, struct dentry *root);</div><div class='ctx'> </div><div class='ctx'> struct p9_fid *v9fs_session_init(struct v9fs_session_info *v9ses,</div><div class='del'>-				 const char *dev_name, char *data);</div><div class='add'>+				 struct fs_context *fc);</div><div class='ctx'> extern void v9fs_session_close(struct v9fs_session_info *v9ses);</div><div class='ctx'> extern void v9fs_session_cancel(struct v9fs_session_info *v9ses);</div><div class='ctx'> extern void v9fs_session_begin_cancel(struct v9fs_session_info *v9ses);</div><div class='hunk'>@@ -144,7 +180,7 @@ extern struct dentry *v9fs_vfs_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 				      unsigned int flags);</div><div class='ctx'> extern int v9fs_vfs_unlink(struct inode *i, struct dentry *d);</div><div class='ctx'> extern int v9fs_vfs_rmdir(struct inode *i, struct dentry *d);</div><div class='del'>-extern int v9fs_vfs_rename(struct user_namespace *mnt_userns,</div><div class='add'>+extern int v9fs_vfs_rename(struct mnt_idmap *idmap,</div><div class='ctx'> 			   struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> 			   struct inode *new_dir, struct dentry *new_dentry,</div><div class='ctx'> 			   unsigned int flags);</div><div class='hunk'>@@ -154,6 +190,7 @@ extern struct inode *v9fs_inode_from_fid(struct v9fs_session_info *v9ses,</div><div class='ctx'> extern const struct inode_operations v9fs_dir_inode_operations_dotl;</div><div class='ctx'> extern const struct inode_operations v9fs_file_inode_operations_dotl;</div><div class='ctx'> extern const struct inode_operations v9fs_symlink_inode_operations_dotl;</div><div class='add'>+extern const struct netfs_request_ops v9fs_req_ops;</div><div class='ctx'> extern struct inode *v9fs_inode_from_fid_dotl(struct v9fs_session_info *v9ses,</div><div class='ctx'> 					      struct p9_fid *fid,</div><div class='ctx'> 					      struct super_block *sb, int new);</div><div class='hunk'>@@ -170,7 +207,7 @@ static inline struct v9fs_session_info *v9fs_inode2v9ses(struct inode *inode)</div><div class='ctx'> 	return inode-&gt;i_sb-&gt;s_fs_info;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline struct v9fs_session_info *v9fs_dentry2v9ses(struct dentry *dentry)</div><div class='add'>+static inline struct v9fs_session_info *v9fs_dentry2v9ses(const struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	return dentry-&gt;d_sb-&gt;s_fs_info;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/9p/v9fs_vfs.h b/fs/9p/v9fs_vfs.h<br/>index bc417da7e9c1..d3aefbec4de6 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/9p/v9fs_vfs.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/9p/v9fs_vfs.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/9p/v9fs_vfs.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/9p/v9fs_vfs.h</a></div><div class='hunk'>@@ -36,31 +36,30 @@ extern const struct file_operations v9fs_dir_operations;</div><div class='ctx'> extern const struct file_operations v9fs_dir_operations_dotl;</div><div class='ctx'> extern const struct dentry_operations v9fs_dentry_operations;</div><div class='ctx'> extern const struct dentry_operations v9fs_cached_dentry_operations;</div><div class='del'>-extern const struct file_operations v9fs_cached_file_operations;</div><div class='del'>-extern const struct file_operations v9fs_cached_file_operations_dotl;</div><div class='del'>-extern const struct file_operations v9fs_mmap_file_operations;</div><div class='del'>-extern const struct file_operations v9fs_mmap_file_operations_dotl;</div><div class='ctx'> extern struct kmem_cache *v9fs_inode_cache;</div><div class='ctx'> </div><div class='ctx'> struct inode *v9fs_alloc_inode(struct super_block *sb);</div><div class='ctx'> void v9fs_free_inode(struct inode *inode);</div><div class='del'>-struct inode *v9fs_get_inode(struct super_block *sb, umode_t mode,</div><div class='del'>-			     dev_t rdev);</div><div class='add'>+void v9fs_set_netfs_context(struct inode *inode);</div><div class='ctx'> int v9fs_init_inode(struct v9fs_session_info *v9ses,</div><div class='ctx'> 		    struct inode *inode, umode_t mode, dev_t rdev);</div><div class='ctx'> void v9fs_evict_inode(struct inode *inode);</div><div class='del'>-ino_t v9fs_qid2ino(struct p9_qid *qid);</div><div class='add'>+#if (BITS_PER_LONG == 32)</div><div class='add'>+#define QID2INO(q) ((ino_t) (((q)-&gt;path+2) ^ (((q)-&gt;path) &gt;&gt; 32)))</div><div class='add'>+#else</div><div class='add'>+#define QID2INO(q) ((ino_t) ((q)-&gt;path+2))</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> void v9fs_stat2inode(struct p9_wstat *stat, struct inode *inode,</div><div class='ctx'> 		      struct super_block *sb, unsigned int flags);</div><div class='ctx'> void v9fs_stat2inode_dotl(struct p9_stat_dotl *stat, struct inode *inode,</div><div class='ctx'> 			   unsigned int flags);</div><div class='ctx'> int v9fs_dir_release(struct inode *inode, struct file *filp);</div><div class='ctx'> int v9fs_file_open(struct inode *inode, struct file *file);</div><div class='del'>-void v9fs_inode2stat(struct inode *inode, struct p9_wstat *stat);</div><div class='ctx'> int v9fs_uflags2omode(int uflags, int extended);</div><div class='ctx'> </div><div class='ctx'> void v9fs_blank_wstat(struct p9_wstat *wstat);</div><div class='del'>-int v9fs_vfs_setattr_dotl(struct user_namespace *mnt_userns,</div><div class='add'>+int v9fs_vfs_setattr_dotl(struct mnt_idmap *idmap,</div><div class='ctx'> 			  struct dentry *dentry, struct iattr *iattr);</div><div class='ctx'> int v9fs_file_fsync_dotl(struct file *filp, loff_t start, loff_t end,</div><div class='ctx'> 			 int datasync);</div><div class='head'>diff --git a/fs/9p/vfs_addr.c b/fs/9p/vfs_addr.c<br/>index fac918ccb305..862164181bac 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/9p/vfs_addr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/9p/vfs_addr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/9p/vfs_addr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/9p/vfs_addr.c</a></div><div class='hunk'>@@ -12,335 +12,158 @@</div><div class='ctx'> #include &lt;linux/file.h&gt;</div><div class='ctx'> #include &lt;linux/stat.h&gt;</div><div class='ctx'> #include &lt;linux/string.h&gt;</div><div class='del'>-#include &lt;linux/inet.h&gt;</div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='del'>-#include &lt;linux/idr.h&gt;</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='add'>+#include &lt;linux/swap.h&gt;</div><div class='ctx'> #include &lt;linux/uio.h&gt;</div><div class='ctx'> #include &lt;linux/netfs.h&gt;</div><div class='ctx'> #include &lt;net/9p/9p.h&gt;</div><div class='ctx'> #include &lt;net/9p/client.h&gt;</div><div class='add'>+#include &lt;trace/events/netfs.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "v9fs.h"</div><div class='ctx'> #include "v9fs_vfs.h"</div><div class='ctx'> #include "cache.h"</div><div class='ctx'> #include "fid.h"</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * v9fs_req_issue_op - Issue a read from 9P</div><div class='del'>- * @subreq: The read to make</div><div class='add'>+/*</div><div class='add'>+ * Writeback calls this when it finds a folio that needs uploading.  This isn't</div><div class='add'>+ * called if writeback only has copy-to-cache to deal with.</div><div class='ctx'>  */</div><div class='del'>-static void v9fs_req_issue_op(struct netfs_read_subrequest *subreq)</div><div class='add'>+static void v9fs_begin_writeback(struct netfs_io_request *wreq)</div><div class='ctx'> {</div><div class='del'>-	struct netfs_read_request *rreq = subreq-&gt;rreq;</div><div class='del'>-	struct p9_fid *fid = rreq-&gt;netfs_priv;</div><div class='del'>-	struct iov_iter to;</div><div class='del'>-	loff_t pos = subreq-&gt;start + subreq-&gt;transferred;</div><div class='del'>-	size_t len = subreq-&gt;len   - subreq-&gt;transferred;</div><div class='del'>-	int total, err;</div><div class='add'>+	struct p9_fid *fid;</div><div class='ctx'> </div><div class='del'>-	iov_iter_xarray(&amp;to, READ, &amp;rreq-&gt;mapping-&gt;i_pages, pos, len);</div><div class='add'>+	fid = v9fs_fid_find_inode(wreq-&gt;inode, true, INVALID_UID, true);</div><div class='add'>+	if (!fid) {</div><div class='add'>+		WARN_ONCE(1, "folio expected an open fid inode-&gt;i_ino=%lx\n",</div><div class='add'>+			  wreq-&gt;inode-&gt;i_ino);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	total = p9_client_read(fid, pos, &amp;to, &amp;err);</div><div class='del'>-	netfs_subreq_terminated(subreq, err ?: total, false);</div><div class='add'>+	wreq-&gt;wsize = fid-&gt;clnt-&gt;msize - P9_IOHDRSZ;</div><div class='add'>+	if (fid-&gt;iounit)</div><div class='add'>+		wreq-&gt;wsize = min(wreq-&gt;wsize, fid-&gt;iounit);</div><div class='add'>+	wreq-&gt;netfs_priv = fid;</div><div class='add'>+	wreq-&gt;io_streams[0].avail = true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * v9fs_init_rreq - Initialise a read request</div><div class='del'>- * @rreq: The read request</div><div class='del'>- * @file: The file being read from</div><div class='add'>+/*</div><div class='add'>+ * Issue a subrequest to write to the server.</div><div class='ctx'>  */</div><div class='del'>-static void v9fs_init_rreq(struct netfs_read_request *rreq, struct file *file)</div><div class='add'>+static void v9fs_issue_write(struct netfs_io_subrequest *subreq)</div><div class='ctx'> {</div><div class='del'>-	struct p9_fid *fid = file-&gt;private_data;</div><div class='add'>+	struct p9_fid *fid = subreq-&gt;rreq-&gt;netfs_priv;</div><div class='add'>+	int err, len;</div><div class='ctx'> </div><div class='del'>-	refcount_inc(&amp;fid-&gt;count);</div><div class='del'>-	rreq-&gt;netfs_priv = fid;</div><div class='add'>+	len = p9_client_write(fid, subreq-&gt;start, &amp;subreq-&gt;io_iter, &amp;err);</div><div class='add'>+	if (len &gt; 0)</div><div class='add'>+		__set_bit(NETFS_SREQ_MADE_PROGRESS, &amp;subreq-&gt;flags);</div><div class='add'>+	netfs_write_subrequest_terminated(subreq, len ?: err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * v9fs_req_cleanup - Cleanup request initialized by v9fs_init_rreq</div><div class='del'>- * @mapping: unused mapping of request to cleanup</div><div class='del'>- * @priv: private data to cleanup, a fid, guaranted non-null.</div><div class='add'>+ * v9fs_issue_read - Issue a read from 9P</div><div class='add'>+ * @subreq: The read to make</div><div class='ctx'>  */</div><div class='del'>-static void v9fs_req_cleanup(struct address_space *mapping, void *priv)</div><div class='add'>+static void v9fs_issue_read(struct netfs_io_subrequest *subreq)</div><div class='ctx'> {</div><div class='del'>-	struct p9_fid *fid = priv;</div><div class='del'>-</div><div class='del'>-	p9_client_clunk(fid);</div><div class='del'>-}</div><div class='add'>+	struct netfs_io_request *rreq = subreq-&gt;rreq;</div><div class='add'>+	struct p9_fid *fid = rreq-&gt;netfs_priv;</div><div class='add'>+	unsigned long long pos = subreq-&gt;start + subreq-&gt;transferred;</div><div class='add'>+	int total, err;</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * v9fs_is_cache_enabled - Determine if caching is enabled for an inode</div><div class='del'>- * @inode: The inode to check</div><div class='del'>- */</div><div class='del'>-static bool v9fs_is_cache_enabled(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	struct fscache_cookie *cookie = v9fs_inode_cookie(V9FS_I(inode));</div><div class='add'>+	total = p9_client_read(fid, pos, &amp;subreq-&gt;io_iter, &amp;err);</div><div class='add'>+</div><div class='add'>+	/* if we just extended the file size, any portion not in</div><div class='add'>+	 * cache won't be on server and is zeroes */</div><div class='add'>+	if (subreq-&gt;rreq-&gt;origin != NETFS_UNBUFFERED_READ &amp;&amp;</div><div class='add'>+	    subreq-&gt;rreq-&gt;origin != NETFS_DIO_READ)</div><div class='add'>+		__set_bit(NETFS_SREQ_CLEAR_TAIL, &amp;subreq-&gt;flags);</div><div class='add'>+	if (pos + total &gt;= i_size_read(rreq-&gt;inode))</div><div class='add'>+		__set_bit(NETFS_SREQ_HIT_EOF, &amp;subreq-&gt;flags);</div><div class='add'>+	if (!err &amp;&amp; total) {</div><div class='add'>+		subreq-&gt;transferred += total;</div><div class='add'>+		__set_bit(NETFS_SREQ_MADE_PROGRESS, &amp;subreq-&gt;flags);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	return fscache_cookie_enabled(cookie) &amp;&amp; !hlist_empty(&amp;cookie-&gt;backing_objects);</div><div class='add'>+	subreq-&gt;error = err;</div><div class='add'>+	netfs_read_subreq_terminated(subreq);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * v9fs_begin_cache_operation - Begin a cache operation for a read</div><div class='add'>+ * v9fs_init_request - Initialise a request</div><div class='ctx'>  * @rreq: The read request</div><div class='add'>+ * @file: The file being read from</div><div class='ctx'>  */</div><div class='del'>-static int v9fs_begin_cache_operation(struct netfs_read_request *rreq)</div><div class='del'>-{</div><div class='del'>-	struct fscache_cookie *cookie = v9fs_inode_cookie(V9FS_I(rreq-&gt;inode));</div><div class='del'>-</div><div class='del'>-	return fscache_begin_read_operation(rreq, cookie);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static const struct netfs_read_request_ops v9fs_req_ops = {</div><div class='del'>-	.init_rreq		= v9fs_init_rreq,</div><div class='del'>-	.is_cache_enabled	= v9fs_is_cache_enabled,</div><div class='del'>-	.begin_cache_operation	= v9fs_begin_cache_operation,</div><div class='del'>-	.issue_op		= v9fs_req_issue_op,</div><div class='del'>-	.cleanup		= v9fs_req_cleanup,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * v9fs_vfs_readpage - read an entire page in from 9P</div><div class='del'>- * @file: file being read</div><div class='del'>- * @page: structure to page</div><div class='del'>- *</div><div class='del'>- */</div><div class='del'>-static int v9fs_vfs_readpage(struct file *file, struct page *page)</div><div class='del'>-{</div><div class='del'>-	struct folio *folio = page_folio(page);</div><div class='del'>-</div><div class='del'>-	return netfs_readpage(file, folio, &amp;v9fs_req_ops, NULL);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * v9fs_vfs_readahead - read a set of pages from 9P</div><div class='del'>- * @ractl: The readahead parameters</div><div class='del'>- */</div><div class='del'>-static void v9fs_vfs_readahead(struct readahead_control *ractl)</div><div class='del'>-{</div><div class='del'>-	netfs_readahead(ractl, &amp;v9fs_req_ops, NULL);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * v9fs_release_page - release the private state associated with a page</div><div class='del'>- * @page: The page to be released</div><div class='del'>- * @gfp: The caller's allocation restrictions</div><div class='del'>- *</div><div class='del'>- * Returns 1 if the page can be released, false otherwise.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-static int v9fs_release_page(struct page *page, gfp_t gfp)</div><div class='add'>+static int v9fs_init_request(struct netfs_io_request *rreq, struct file *file)</div><div class='ctx'> {</div><div class='del'>-	struct folio *folio = page_folio(page);</div><div class='del'>-</div><div class='del'>-	if (folio_test_private(folio))</div><div class='del'>-		return 0;</div><div class='del'>-#ifdef CONFIG_9P_FSCACHE</div><div class='del'>-	if (folio_test_fscache(folio)) {</div><div class='del'>-		if (!(gfp &amp; __GFP_DIRECT_RECLAIM) || !(gfp &amp; __GFP_FS))</div><div class='del'>-			return 0;</div><div class='del'>-		folio_wait_fscache(folio);</div><div class='add'>+	struct p9_fid *fid;</div><div class='add'>+	bool writing = (rreq-&gt;origin == NETFS_READ_FOR_WRITE ||</div><div class='add'>+			rreq-&gt;origin == NETFS_WRITETHROUGH ||</div><div class='add'>+			rreq-&gt;origin == NETFS_UNBUFFERED_WRITE ||</div><div class='add'>+			rreq-&gt;origin == NETFS_DIO_WRITE);</div><div class='add'>+</div><div class='add'>+	if (rreq-&gt;origin == NETFS_WRITEBACK)</div><div class='add'>+		return 0; /* We don't get the write handle until we find we</div><div class='add'>+			   * have actually dirty data and not just</div><div class='add'>+			   * copy-to-cache data.</div><div class='add'>+			   */</div><div class='add'>+</div><div class='add'>+	if (file) {</div><div class='add'>+		fid = file-&gt;private_data;</div><div class='add'>+		if (!fid)</div><div class='add'>+			goto no_fid;</div><div class='add'>+		p9_fid_get(fid);</div><div class='add'>+	} else {</div><div class='add'>+		fid = v9fs_fid_find_inode(rreq-&gt;inode, writing, INVALID_UID, true);</div><div class='add'>+		if (!fid)</div><div class='add'>+			goto no_fid;</div><div class='ctx'> 	}</div><div class='del'>-#endif</div><div class='del'>-	return 1;</div><div class='del'>-}</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * v9fs_invalidate_page - Invalidate a page completely or partially</div><div class='del'>- * @page: The page to be invalidated</div><div class='del'>- * @offset: offset of the invalidated region</div><div class='del'>- * @length: length of the invalidated region</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-static void v9fs_invalidate_page(struct page *page, unsigned int offset,</div><div class='del'>-				 unsigned int length)</div><div class='del'>-{</div><div class='del'>-	struct folio *folio = page_folio(page);</div><div class='del'>-</div><div class='del'>-	folio_wait_fscache(folio);</div><div class='del'>-}</div><div class='add'>+	rreq-&gt;wsize = fid-&gt;clnt-&gt;msize - P9_IOHDRSZ;</div><div class='add'>+	if (fid-&gt;iounit)</div><div class='add'>+		rreq-&gt;wsize = min(rreq-&gt;wsize, fid-&gt;iounit);</div><div class='ctx'> </div><div class='del'>-static int v9fs_vfs_write_folio_locked(struct folio *folio)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = folio_inode(folio);</div><div class='del'>-	struct v9fs_inode *v9inode = V9FS_I(inode);</div><div class='del'>-	loff_t start = folio_pos(folio);</div><div class='del'>-	loff_t i_size = i_size_read(inode);</div><div class='del'>-	struct iov_iter from;</div><div class='del'>-	size_t len = folio_size(folio);</div><div class='del'>-	int err;</div><div class='del'>-</div><div class='del'>-	if (start &gt;= i_size)</div><div class='del'>-		return 0; /* Simultaneous truncation occurred */</div><div class='del'>-</div><div class='del'>-	len = min_t(loff_t, i_size - start, len);</div><div class='del'>-</div><div class='del'>-	iov_iter_xarray(&amp;from, WRITE, &amp;folio_mapping(folio)-&gt;i_pages, start, len);</div><div class='del'>-</div><div class='del'>-	/* We should have writeback_fid always set */</div><div class='del'>-	BUG_ON(!v9inode-&gt;writeback_fid);</div><div class='del'>-</div><div class='del'>-	folio_start_writeback(folio);</div><div class='del'>-</div><div class='del'>-	p9_client_write(v9inode-&gt;writeback_fid, start, &amp;from, &amp;err);</div><div class='del'>-</div><div class='del'>-	folio_end_writeback(folio);</div><div class='del'>-	return err;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int v9fs_vfs_writepage(struct page *page, struct writeback_control *wbc)</div><div class='del'>-{</div><div class='del'>-	struct folio *folio = page_folio(page);</div><div class='del'>-	int retval;</div><div class='del'>-</div><div class='del'>-	p9_debug(P9_DEBUG_VFS, "folio %p\n", folio);</div><div class='del'>-</div><div class='del'>-	retval = v9fs_vfs_write_folio_locked(folio);</div><div class='del'>-	if (retval &lt; 0) {</div><div class='del'>-		if (retval == -EAGAIN) {</div><div class='del'>-			folio_redirty_for_writepage(wbc, folio);</div><div class='del'>-			retval = 0;</div><div class='del'>-		} else {</div><div class='del'>-			mapping_set_error(folio_mapping(folio), retval);</div><div class='del'>-		}</div><div class='del'>-	} else</div><div class='del'>-		retval = 0;</div><div class='add'>+	/* we might need to read from a fid that was opened write-only</div><div class='add'>+	 * for read-modify-write of page cache, use the writeback fid</div><div class='add'>+	 * for that */</div><div class='add'>+	WARN_ON(rreq-&gt;origin == NETFS_READ_FOR_WRITE &amp;&amp; !(fid-&gt;mode &amp; P9_ORDWR));</div><div class='add'>+	rreq-&gt;netfs_priv = fid;</div><div class='add'>+	return 0;</div><div class='ctx'> </div><div class='del'>-	folio_unlock(folio);</div><div class='del'>-	return retval;</div><div class='add'>+no_fid:</div><div class='add'>+	WARN_ONCE(1, "folio expected an open fid inode-&gt;i_ino=%lx\n",</div><div class='add'>+		  rreq-&gt;inode-&gt;i_ino);</div><div class='add'>+	return -EINVAL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * v9fs_launder_page - Writeback a dirty page</div><div class='del'>- * @page: The page to be cleaned up</div><div class='del'>- *</div><div class='del'>- * Returns 0 on success.</div><div class='add'>+ * v9fs_free_request - Cleanup request initialized by v9fs_init_rreq</div><div class='add'>+ * @rreq: The I/O request to clean up</div><div class='ctx'>  */</div><div class='del'>-</div><div class='del'>-static int v9fs_launder_page(struct page *page)</div><div class='add'>+static void v9fs_free_request(struct netfs_io_request *rreq)</div><div class='ctx'> {</div><div class='del'>-	struct folio *folio = page_folio(page);</div><div class='del'>-	int retval;</div><div class='del'>-</div><div class='del'>-	if (folio_clear_dirty_for_io(folio)) {</div><div class='del'>-		retval = v9fs_vfs_write_folio_locked(folio);</div><div class='del'>-		if (retval)</div><div class='del'>-			return retval;</div><div class='del'>-	}</div><div class='del'>-	folio_wait_fscache(folio);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * v9fs_direct_IO - 9P address space operation for direct I/O</div><div class='del'>- * @iocb: target I/O control block</div><div class='del'>- * @iter: The data/buffer to use</div><div class='del'>- *</div><div class='del'>- * The presence of v9fs_direct_IO() in the address space ops vector</div><div class='del'>- * allowes open() O_DIRECT flags which would have failed otherwise.</div><div class='del'>- *</div><div class='del'>- * In the non-cached mode, we shunt off direct read and write requests before</div><div class='del'>- * the VFS gets them, so this method should never be called.</div><div class='del'>- *</div><div class='del'>- * Direct IO is not 'yet' supported in the cached mode. Hence when</div><div class='del'>- * this routine is called through generic_file_aio_read(), the read/write fails</div><div class='del'>- * with an error.</div><div class='del'>- *</div><div class='del'>- */</div><div class='del'>-static ssize_t</div><div class='del'>-v9fs_direct_IO(struct kiocb *iocb, struct iov_iter *iter)</div><div class='del'>-{</div><div class='del'>-	struct file *file = iocb-&gt;ki_filp;</div><div class='del'>-	loff_t pos = iocb-&gt;ki_pos;</div><div class='del'>-	ssize_t n;</div><div class='del'>-	int err = 0;</div><div class='del'>-</div><div class='del'>-	if (iov_iter_rw(iter) == WRITE) {</div><div class='del'>-		n = p9_client_write(file-&gt;private_data, pos, iter, &amp;err);</div><div class='del'>-		if (n) {</div><div class='del'>-			struct inode *inode = file_inode(file);</div><div class='del'>-			loff_t i_size = i_size_read(inode);</div><div class='del'>-</div><div class='del'>-			if (pos + n &gt; i_size)</div><div class='del'>-				inode_add_bytes(inode, pos + n - i_size);</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-		n = p9_client_read(file-&gt;private_data, pos, iter, &amp;err);</div><div class='del'>-	}</div><div class='del'>-	return n ? n : err;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int v9fs_write_begin(struct file *filp, struct address_space *mapping,</div><div class='del'>-			    loff_t pos, unsigned int len, unsigned int flags,</div><div class='del'>-			    struct page **subpagep, void **fsdata)</div><div class='del'>-{</div><div class='del'>-	int retval;</div><div class='del'>-	struct folio *folio;</div><div class='del'>-	struct v9fs_inode *v9inode = V9FS_I(mapping-&gt;host);</div><div class='del'>-</div><div class='del'>-	p9_debug(P9_DEBUG_VFS, "filp %p, mapping %p\n", filp, mapping);</div><div class='del'>-</div><div class='del'>-	BUG_ON(!v9inode-&gt;writeback_fid);</div><div class='del'>-</div><div class='del'>-	/* Prefetch area to be written into the cache if we're caching this</div><div class='del'>-	 * file.  We need to do this before we get a lock on the page in case</div><div class='del'>-	 * there's more than one writer competing for the same cache block.</div><div class='del'>-	 */</div><div class='del'>-	retval = netfs_write_begin(filp, mapping, pos, len, flags, &amp;folio, fsdata,</div><div class='del'>-				   &amp;v9fs_req_ops, NULL);</div><div class='del'>-	if (retval &lt; 0)</div><div class='del'>-		return retval;</div><div class='del'>-</div><div class='del'>-	*subpagep = &amp;folio-&gt;page;</div><div class='del'>-	return retval;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int v9fs_write_end(struct file *filp, struct address_space *mapping,</div><div class='del'>-			  loff_t pos, unsigned int len, unsigned int copied,</div><div class='del'>-			  struct page *subpage, void *fsdata)</div><div class='del'>-{</div><div class='del'>-	loff_t last_pos = pos + copied;</div><div class='del'>-	struct folio *folio = page_folio(subpage);</div><div class='del'>-	struct inode *inode = mapping-&gt;host;</div><div class='del'>-</div><div class='del'>-	p9_debug(P9_DEBUG_VFS, "filp %p, mapping %p\n", filp, mapping);</div><div class='del'>-</div><div class='del'>-	if (!folio_test_uptodate(folio)) {</div><div class='del'>-		if (unlikely(copied &lt; len)) {</div><div class='del'>-			copied = 0;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		folio_mark_uptodate(folio);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * No need to use i_size_read() here, the i_size</div><div class='del'>-	 * cannot change under us because we hold the i_mutex.</div><div class='del'>-	 */</div><div class='del'>-	if (last_pos &gt; inode-&gt;i_size) {</div><div class='del'>-		inode_add_bytes(inode, last_pos - inode-&gt;i_size);</div><div class='del'>-		i_size_write(inode, last_pos);</div><div class='del'>-	}</div><div class='del'>-	folio_mark_dirty(folio);</div><div class='del'>-out:</div><div class='del'>-	folio_unlock(folio);</div><div class='del'>-	folio_put(folio);</div><div class='add'>+	struct p9_fid *fid = rreq-&gt;netfs_priv;</div><div class='ctx'> </div><div class='del'>-	return copied;</div><div class='add'>+	p9_fid_put(fid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+const struct netfs_request_ops v9fs_req_ops = {</div><div class='add'>+	.init_request		= v9fs_init_request,</div><div class='add'>+	.free_request		= v9fs_free_request,</div><div class='add'>+	.issue_read		= v9fs_issue_read,</div><div class='add'>+	.begin_writeback	= v9fs_begin_writeback,</div><div class='add'>+	.issue_write		= v9fs_issue_write,</div><div class='add'>+};</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations v9fs_addr_operations = {</div><div class='del'>-	.readpage = v9fs_vfs_readpage,</div><div class='del'>-	.readahead = v9fs_vfs_readahead,</div><div class='del'>-	.set_page_dirty = __set_page_dirty_nobuffers,</div><div class='del'>-	.writepage = v9fs_vfs_writepage,</div><div class='del'>-	.write_begin = v9fs_write_begin,</div><div class='del'>-	.write_end = v9fs_write_end,</div><div class='del'>-	.releasepage = v9fs_release_page,</div><div class='del'>-	.invalidatepage = v9fs_invalidate_page,</div><div class='del'>-	.launder_page = v9fs_launder_page,</div><div class='del'>-	.direct_IO = v9fs_direct_IO,</div><div class='add'>+	.read_folio		= netfs_read_folio,</div><div class='add'>+	.readahead		= netfs_readahead,</div><div class='add'>+	.dirty_folio		= netfs_dirty_folio,</div><div class='add'>+	.release_folio		= netfs_release_folio,</div><div class='add'>+	.invalidate_folio	= netfs_invalidate_folio,</div><div class='add'>+	.direct_IO		= noop_direct_IO,</div><div class='add'>+	.writepages		= netfs_writepages,</div><div class='add'>+	.migrate_folio		= filemap_migrate_folio,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/9p/vfs_dentry.c b/fs/9p/vfs_dentry.c<br/>index 1c609e99d280..c5bf74d547e8 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/9p/vfs_dentry.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/9p/vfs_dentry.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/9p/vfs_dentry.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/9p/vfs_dentry.c</a></div><div class='hunk'>@@ -13,9 +13,7 @@</div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='ctx'> #include &lt;linux/stat.h&gt;</div><div class='ctx'> #include &lt;linux/string.h&gt;</div><div class='del'>-#include &lt;linux/inet.h&gt;</div><div class='ctx'> #include &lt;linux/namei.h&gt;</div><div class='del'>-#include &lt;linux/idr.h&gt;</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;net/9p/9p.h&gt;</div><div class='hunk'>@@ -50,15 +48,20 @@ static int v9fs_cached_dentry_delete(const struct dentry *dentry)</div><div class='ctx'> static void v9fs_dentry_release(struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	struct hlist_node *p, *n;</div><div class='add'>+	struct hlist_head head;</div><div class='ctx'> </div><div class='ctx'> 	p9_debug(P9_DEBUG_VFS, " dentry: %pd (%p)\n",</div><div class='ctx'> 		 dentry, dentry);</div><div class='del'>-	hlist_for_each_safe(p, n, (struct hlist_head *)&amp;dentry-&gt;d_fsdata)</div><div class='del'>-		p9_client_clunk(hlist_entry(p, struct p9_fid, dlist));</div><div class='del'>-	dentry-&gt;d_fsdata = NULL;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;dentry-&gt;d_lock);</div><div class='add'>+	hlist_move_list((struct hlist_head *)&amp;dentry-&gt;d_fsdata, &amp;head);</div><div class='add'>+	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='add'>+</div><div class='add'>+	hlist_for_each_safe(p, n, &amp;head)</div><div class='add'>+		p9_fid_put(hlist_entry(p, struct p9_fid, dlist));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int v9fs_lookup_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='add'>+static int __v9fs_lookup_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct p9_fid *fid;</div><div class='ctx'> 	struct inode *inode;</div><div class='hunk'>@@ -77,33 +80,72 @@ static int v9fs_lookup_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='ctx'> 		struct v9fs_session_info *v9ses;</div><div class='ctx'> </div><div class='ctx'> 		fid = v9fs_fid_lookup(dentry);</div><div class='del'>-		if (IS_ERR(fid))</div><div class='add'>+		if (IS_ERR(fid)) {</div><div class='add'>+			p9_debug(</div><div class='add'>+				P9_DEBUG_VFS,</div><div class='add'>+				"v9fs_fid_lookup: dentry = %pd (%p), got error %pe\n",</div><div class='add'>+				dentry, dentry, fid);</div><div class='ctx'> 			return PTR_ERR(fid);</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		v9ses = v9fs_inode2v9ses(inode);</div><div class='ctx'> 		if (v9fs_proto_dotl(v9ses))</div><div class='ctx'> 			retval = v9fs_refresh_inode_dotl(fid, inode);</div><div class='ctx'> 		else</div><div class='ctx'> 			retval = v9fs_refresh_inode(fid, inode);</div><div class='del'>-		p9_client_clunk(fid);</div><div class='add'>+		p9_fid_put(fid);</div><div class='ctx'> </div><div class='del'>-		if (retval == -ENOENT)</div><div class='add'>+		if (retval == -ENOENT) {</div><div class='add'>+			p9_debug(P9_DEBUG_VFS, "dentry: %pd (%p) invalidated due to ENOENT\n",</div><div class='add'>+				 dentry, dentry);</div><div class='add'>+			return 0;</div><div class='add'>+		}</div><div class='add'>+		if (v9inode-&gt;cache_validity &amp; V9FS_INO_INVALID_ATTR) {</div><div class='add'>+			p9_debug(P9_DEBUG_VFS, "dentry: %pd (%p) invalidated due to type change\n",</div><div class='add'>+				 dentry, dentry);</div><div class='ctx'> 			return 0;</div><div class='del'>-		if (retval &lt; 0)</div><div class='add'>+		}</div><div class='add'>+		if (retval &lt; 0) {</div><div class='add'>+			p9_debug(P9_DEBUG_VFS,</div><div class='add'>+				"refresh inode: dentry = %pd (%p), got error %pe\n",</div><div class='add'>+				dentry, dentry, ERR_PTR(retval));</div><div class='ctx'> 			return retval;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> out_valid:</div><div class='add'>+	p9_debug(P9_DEBUG_VFS, "dentry: %pd (%p) is valid\n", dentry, dentry);</div><div class='ctx'> 	return 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int v9fs_lookup_revalidate(struct inode *dir, const struct qstr *name,</div><div class='add'>+				  struct dentry *dentry, unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	return __v9fs_lookup_revalidate(dentry, flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool v9fs_dentry_unalias_trylock(const struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	struct v9fs_session_info *v9ses = v9fs_dentry2v9ses(dentry);</div><div class='add'>+	return down_write_trylock(&amp;v9ses-&gt;rename_sem);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void v9fs_dentry_unalias_unlock(const struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	struct v9fs_session_info *v9ses = v9fs_dentry2v9ses(dentry);</div><div class='add'>+	up_write(&amp;v9ses-&gt;rename_sem);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> const struct dentry_operations v9fs_cached_dentry_operations = {</div><div class='ctx'> 	.d_revalidate = v9fs_lookup_revalidate,</div><div class='del'>-	.d_weak_revalidate = v9fs_lookup_revalidate,</div><div class='add'>+	.d_weak_revalidate = __v9fs_lookup_revalidate,</div><div class='ctx'> 	.d_delete = v9fs_cached_dentry_delete,</div><div class='ctx'> 	.d_release = v9fs_dentry_release,</div><div class='add'>+	.d_unalias_trylock = v9fs_dentry_unalias_trylock,</div><div class='add'>+	.d_unalias_unlock = v9fs_dentry_unalias_unlock,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct dentry_operations v9fs_dentry_operations = {</div><div class='del'>-	.d_delete = always_delete_dentry,</div><div class='ctx'> 	.d_release = v9fs_dentry_release,</div><div class='add'>+	.d_unalias_trylock = v9fs_dentry_unalias_trylock,</div><div class='add'>+	.d_unalias_unlock = v9fs_dentry_unalias_unlock,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/9p/vfs_dir.c b/fs/9p/vfs_dir.c<br/>index 8c854d8cb0cd..e0d34e4e9076 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/9p/vfs_dir.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/9p/vfs_dir.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/9p/vfs_dir.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/9p/vfs_dir.c</a></div><div class='hunk'>@@ -13,10 +13,9 @@</div><div class='ctx'> #include &lt;linux/stat.h&gt;</div><div class='ctx'> #include &lt;linux/string.h&gt;</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='del'>-#include &lt;linux/inet.h&gt;</div><div class='del'>-#include &lt;linux/idr.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/uio.h&gt;</div><div class='add'>+#include &lt;linux/fscache.h&gt;</div><div class='ctx'> #include &lt;net/9p/9p.h&gt;</div><div class='ctx'> #include &lt;net/9p/client.h&gt;</div><div class='ctx'> </div><div class='hunk'>@@ -108,7 +107,7 @@ static int v9fs_dir_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 			struct iov_iter to;</div><div class='ctx'> 			int n;</div><div class='ctx'> </div><div class='del'>-			iov_iter_kvec(&amp;to, READ, &amp;kvec, 1, buflen);</div><div class='add'>+			iov_iter_kvec(&amp;to, ITER_DEST, &amp;kvec, 1, buflen);</div><div class='ctx'> 			n = p9_client_read(file-&gt;private_data, ctx-&gt;pos, &amp;to,</div><div class='ctx'> 					   &amp;err);</div><div class='ctx'> 			if (err)</div><div class='hunk'>@@ -128,7 +127,7 @@ static int v9fs_dir_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			over = !dir_emit(ctx, st.name, strlen(st.name),</div><div class='del'>-					 v9fs_qid2ino(&amp;st.qid), dt_type(&amp;st));</div><div class='add'>+					QID2INO(&amp;st.qid), dt_type(&amp;st));</div><div class='ctx'> 			p9stat_free(&amp;st);</div><div class='ctx'> 			if (over)</div><div class='ctx'> 				return 0;</div><div class='hunk'>@@ -185,7 +184,7 @@ static int v9fs_dir_readdir_dotl(struct file *file, struct dir_context *ctx)</div><div class='ctx'> </div><div class='ctx'> 			if (!dir_emit(ctx, curdirent.d_name,</div><div class='ctx'> 				      strlen(curdirent.d_name),</div><div class='del'>-				      v9fs_qid2ino(&amp;curdirent.qid),</div><div class='add'>+				      QID2INO(&amp;curdirent.qid),</div><div class='ctx'> 				      curdirent.d_type))</div><div class='ctx'> 				return 0;</div><div class='ctx'> </div><div class='hunk'>@@ -197,26 +196,44 @@ static int v9fs_dir_readdir_dotl(struct file *file, struct dir_context *ctx)</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * v9fs_dir_release - close a directory</div><div class='del'>- * @inode: inode of the directory</div><div class='del'>- * @filp: file pointer to a directory</div><div class='add'>+ * v9fs_dir_release - close a directory or a file</div><div class='add'>+ * @inode: inode of the directory or file</div><div class='add'>+ * @filp: file pointer to a directory or file</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> int v9fs_dir_release(struct inode *inode, struct file *filp)</div><div class='ctx'> {</div><div class='add'>+	struct v9fs_inode *v9inode = V9FS_I(inode);</div><div class='ctx'> 	struct p9_fid *fid;</div><div class='add'>+	__le32 version;</div><div class='add'>+	loff_t i_size;</div><div class='add'>+	int retval = 0, put_err;</div><div class='ctx'> </div><div class='ctx'> 	fid = filp-&gt;private_data;</div><div class='ctx'> 	p9_debug(P9_DEBUG_VFS, "inode: %p filp: %p fid: %d\n",</div><div class='ctx'> 		 inode, filp, fid ? fid-&gt;fid : -1);</div><div class='add'>+</div><div class='ctx'> 	if (fid) {</div><div class='add'>+		if ((S_ISREG(inode-&gt;i_mode)) &amp;&amp; (filp-&gt;f_mode &amp; FMODE_WRITE))</div><div class='add'>+			retval = filemap_fdatawrite(inode-&gt;i_mapping);</div><div class='add'>+</div><div class='ctx'> 		spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 		hlist_del(&amp;fid-&gt;ilist);</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='del'>-		p9_client_clunk(fid);</div><div class='add'>+		put_err = p9_fid_put(fid);</div><div class='add'>+		retval = retval &lt; 0 ? retval : put_err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if ((filp-&gt;f_mode &amp; FMODE_WRITE)) {</div><div class='add'>+		version = cpu_to_le32(v9inode-&gt;qid.version);</div><div class='add'>+		i_size = i_size_read(inode);</div><div class='add'>+		fscache_unuse_cookie(v9fs_inode_cookie(v9inode),</div><div class='add'>+				     &amp;version, &amp;i_size);</div><div class='add'>+	} else {</div><div class='add'>+		fscache_unuse_cookie(v9fs_inode_cookie(v9inode), NULL, NULL);</div><div class='ctx'> 	}</div><div class='del'>-	return 0;</div><div class='add'>+	return retval;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct file_operations v9fs_dir_operations = {</div><div class='head'>diff --git a/fs/9p/vfs_file.c b/fs/9p/vfs_file.c<br/>index 612e297f3763..6f3880208587 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/9p/vfs_file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/9p/vfs_file.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/9p/vfs_file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/9p/vfs_file.c</a></div><div class='hunk'>@@ -9,16 +9,15 @@</div><div class='ctx'> #include &lt;linux/module.h&gt;</div><div class='ctx'> #include &lt;linux/errno.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/filelock.h&gt;</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='ctx'> #include &lt;linux/file.h&gt;</div><div class='ctx'> #include &lt;linux/stat.h&gt;</div><div class='ctx'> #include &lt;linux/string.h&gt;</div><div class='del'>-#include &lt;linux/inet.h&gt;</div><div class='ctx'> #include &lt;linux/list.h&gt;</div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='ctx'> #include &lt;linux/utsname.h&gt;</div><div class='ctx'> #include &lt;linux/uaccess.h&gt;</div><div class='del'>-#include &lt;linux/idr.h&gt;</div><div class='ctx'> #include &lt;linux/uio.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;net/9p/9p.h&gt;</div><div class='hunk'>@@ -29,7 +28,6 @@</div><div class='ctx'> #include "fid.h"</div><div class='ctx'> #include "cache.h"</div><div class='ctx'> </div><div class='del'>-static const struct vm_operations_struct v9fs_file_vm_ops;</div><div class='ctx'> static const struct vm_operations_struct v9fs_mmap_file_vm_ops;</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -42,64 +40,60 @@ static const struct vm_operations_struct v9fs_mmap_file_vm_ops;</div><div class='ctx'> int v9fs_file_open(struct inode *inode, struct file *file)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='del'>-	struct v9fs_inode *v9inode;</div><div class='ctx'> 	struct v9fs_session_info *v9ses;</div><div class='del'>-	struct p9_fid *fid, *writeback_fid;</div><div class='add'>+	struct p9_fid *fid;</div><div class='ctx'> 	int omode;</div><div class='add'>+	int o_append;</div><div class='ctx'> </div><div class='ctx'> 	p9_debug(P9_DEBUG_VFS, "inode: %p file: %p\n", inode, file);</div><div class='del'>-	v9inode = V9FS_I(inode);</div><div class='ctx'> 	v9ses = v9fs_inode2v9ses(inode);</div><div class='del'>-	if (v9fs_proto_dotl(v9ses))</div><div class='add'>+	if (v9fs_proto_dotl(v9ses)) {</div><div class='ctx'> 		omode = v9fs_open_to_dotl_flags(file-&gt;f_flags);</div><div class='del'>-	else</div><div class='add'>+		o_append = P9_DOTL_APPEND;</div><div class='add'>+	} else {</div><div class='ctx'> 		omode = v9fs_uflags2omode(file-&gt;f_flags,</div><div class='ctx'> 					v9fs_proto_dotu(v9ses));</div><div class='add'>+		o_append = P9_OAPPEND;</div><div class='add'>+	}</div><div class='ctx'> 	fid = file-&gt;private_data;</div><div class='ctx'> 	if (!fid) {</div><div class='ctx'> 		fid = v9fs_fid_clone(file_dentry(file));</div><div class='ctx'> 		if (IS_ERR(fid))</div><div class='ctx'> 			return PTR_ERR(fid);</div><div class='ctx'> </div><div class='del'>-		err = p9_client_open(fid, omode);</div><div class='add'>+		if ((v9ses-&gt;cache &amp; CACHE_WRITEBACK) &amp;&amp; (omode &amp; P9_OWRITE)) {</div><div class='add'>+			int writeback_omode = (omode &amp; ~(P9_OWRITE | o_append)) | P9_ORDWR;</div><div class='add'>+</div><div class='add'>+			p9_debug(P9_DEBUG_CACHE, "write-only file with writeback enabled, try opening O_RDWR\n");</div><div class='add'>+</div><div class='add'>+			err = p9_client_open(fid, writeback_omode);</div><div class='add'>+			if (err &lt; 0) {</div><div class='add'>+				p9_debug(P9_DEBUG_CACHE, "could not open O_RDWR, disabling caches\n");</div><div class='add'>+				err = p9_client_open(fid, omode);</div><div class='add'>+				fid-&gt;mode |= P9L_DIRECT;</div><div class='add'>+			}</div><div class='add'>+		} else {</div><div class='add'>+			err = p9_client_open(fid, omode);</div><div class='add'>+		}</div><div class='ctx'> 		if (err &lt; 0) {</div><div class='del'>-			p9_client_clunk(fid);</div><div class='add'>+			p9_fid_put(fid);</div><div class='ctx'> 			return err;</div><div class='ctx'> 		}</div><div class='ctx'> 		if ((file-&gt;f_flags &amp; O_APPEND) &amp;&amp;</div><div class='ctx'> 			(!v9fs_proto_dotu(v9ses) &amp;&amp; !v9fs_proto_dotl(v9ses)))</div><div class='ctx'> 			generic_file_llseek(file, 0, SEEK_END);</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	file-&gt;private_data = fid;</div><div class='del'>-	mutex_lock(&amp;v9inode-&gt;v_mutex);</div><div class='del'>-	if ((v9ses-&gt;cache == CACHE_LOOSE || v9ses-&gt;cache == CACHE_FSCACHE) &amp;&amp;</div><div class='del'>-	    !v9inode-&gt;writeback_fid &amp;&amp;</div><div class='del'>-	    ((file-&gt;f_flags &amp; O_ACCMODE) != O_RDONLY)) {</div><div class='del'>-		/*</div><div class='del'>-		 * clone a fid and add it to writeback_fid</div><div class='del'>-		 * we do it during open time instead of</div><div class='del'>-		 * page dirty time via write_begin/page_mkwrite</div><div class='del'>-		 * because we want write after unlink usecase</div><div class='del'>-		 * to work.</div><div class='del'>-		 */</div><div class='del'>-		writeback_fid = v9fs_writeback_fid(file_dentry(file));</div><div class='del'>-		if (IS_ERR(writeback_fid)) {</div><div class='del'>-			err = PTR_ERR(writeback_fid);</div><div class='del'>-			mutex_unlock(&amp;v9inode-&gt;v_mutex);</div><div class='del'>-			goto out_error;</div><div class='del'>-		}</div><div class='del'>-		v9inode-&gt;writeback_fid = (void *) writeback_fid;</div><div class='add'>+		file-&gt;private_data = fid;</div><div class='ctx'> 	}</div><div class='del'>-	mutex_unlock(&amp;v9inode-&gt;v_mutex);</div><div class='del'>-	if (v9ses-&gt;cache == CACHE_LOOSE || v9ses-&gt;cache == CACHE_FSCACHE)</div><div class='del'>-		v9fs_cache_inode_set_cookie(inode, file);</div><div class='del'>-	v9fs_open_fid_add(inode, fid);</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_9P_FSCACHE</div><div class='add'>+	if (v9ses-&gt;cache &amp; CACHE_FSCACHE)</div><div class='add'>+		fscache_use_cookie(v9fs_inode_cookie(V9FS_I(inode)),</div><div class='add'>+				   file-&gt;f_mode &amp; FMODE_WRITE);</div><div class='add'>+#endif</div><div class='add'>+	v9fs_fid_add_modes(fid, v9ses-&gt;flags, v9ses-&gt;cache, file-&gt;f_flags);</div><div class='add'>+	v9fs_open_fid_add(inode, &amp;fid);</div><div class='ctx'> 	return 0;</div><div class='del'>-out_error:</div><div class='del'>-	p9_client_clunk(file-&gt;private_data);</div><div class='del'>-	file-&gt;private_data = NULL;</div><div class='del'>-	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -114,17 +108,16 @@ out_error:</div><div class='ctx'> </div><div class='ctx'> static int v9fs_file_lock(struct file *filp, int cmd, struct file_lock *fl)</div><div class='ctx'> {</div><div class='del'>-	int res = 0;</div><div class='ctx'> 	struct inode *inode = file_inode(filp);</div><div class='ctx'> </div><div class='ctx'> 	p9_debug(P9_DEBUG_VFS, "filp: %p lock: %p\n", filp, fl);</div><div class='ctx'> </div><div class='del'>-	if ((IS_SETLK(cmd) || IS_SETLKW(cmd)) &amp;&amp; fl-&gt;fl_type != F_UNLCK) {</div><div class='add'>+	if ((IS_SETLK(cmd) || IS_SETLKW(cmd)) &amp;&amp; fl-&gt;c.flc_type != F_UNLCK) {</div><div class='ctx'> 		filemap_write_and_wait(inode-&gt;i_mapping);</div><div class='ctx'> 		invalidate_mapping_pages(&amp;inode-&gt;i_data, 0, -1);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return res;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int v9fs_file_do_lock(struct file *filp, int cmd, struct file_lock *fl)</div><div class='hunk'>@@ -133,14 +126,12 @@ static int v9fs_file_do_lock(struct file *filp, int cmd, struct file_lock *fl)</div><div class='ctx'> 	struct p9_fid *fid;</div><div class='ctx'> 	uint8_t status = P9_LOCK_ERROR;</div><div class='ctx'> 	int res = 0;</div><div class='del'>-	unsigned char fl_type;</div><div class='ctx'> 	struct v9fs_session_info *v9ses;</div><div class='ctx'> </div><div class='ctx'> 	fid = filp-&gt;private_data;</div><div class='ctx'> 	BUG_ON(fid == NULL);</div><div class='ctx'> </div><div class='del'>-	if ((fl-&gt;fl_flags &amp; FL_POSIX) != FL_POSIX)</div><div class='del'>-		BUG();</div><div class='add'>+	BUG_ON((fl-&gt;c.flc_flags &amp; FL_POSIX) != FL_POSIX);</div><div class='ctx'> </div><div class='ctx'> 	res = locks_lock_file_wait(filp, fl);</div><div class='ctx'> 	if (res &lt; 0)</div><div class='hunk'>@@ -149,7 +140,7 @@ static int v9fs_file_do_lock(struct file *filp, int cmd, struct file_lock *fl)</div><div class='ctx'> 	/* convert posix lock to p9 tlock args */</div><div class='ctx'> 	memset(&amp;flock, 0, sizeof(flock));</div><div class='ctx'> 	/* map the lock type */</div><div class='del'>-	switch (fl-&gt;fl_type) {</div><div class='add'>+	switch (fl-&gt;c.flc_type) {</div><div class='ctx'> 	case F_RDLCK:</div><div class='ctx'> 		flock.type = P9_LOCK_TYPE_RDLCK;</div><div class='ctx'> 		break;</div><div class='hunk'>@@ -165,7 +156,7 @@ static int v9fs_file_do_lock(struct file *filp, int cmd, struct file_lock *fl)</div><div class='ctx'> 		flock.length = 0;</div><div class='ctx'> 	else</div><div class='ctx'> 		flock.length = fl-&gt;fl_end - fl-&gt;fl_start + 1;</div><div class='del'>-	flock.proc_id = fl-&gt;fl_pid;</div><div class='add'>+	flock.proc_id = fl-&gt;c.flc_pid;</div><div class='ctx'> 	flock.client_id = fid-&gt;clnt-&gt;name;</div><div class='ctx'> 	if (IS_SETLKW(cmd))</div><div class='ctx'> 		flock.flags = P9_LOCK_FLAGS_BLOCK;</div><div class='hunk'>@@ -220,12 +211,13 @@ out_unlock:</div><div class='ctx'> 	 * incase server returned error for lock request, revert</div><div class='ctx'> 	 * it locally</div><div class='ctx'> 	 */</div><div class='del'>-	if (res &lt; 0 &amp;&amp; fl-&gt;fl_type != F_UNLCK) {</div><div class='del'>-		fl_type = fl-&gt;fl_type;</div><div class='del'>-		fl-&gt;fl_type = F_UNLCK;</div><div class='add'>+	if (res &lt; 0 &amp;&amp; fl-&gt;c.flc_type != F_UNLCK) {</div><div class='add'>+		unsigned char type = fl-&gt;c.flc_type;</div><div class='add'>+</div><div class='add'>+		fl-&gt;c.flc_type = F_UNLCK;</div><div class='ctx'> 		/* Even if this fails we want to return the remote error */</div><div class='ctx'> 		locks_lock_file_wait(filp, fl);</div><div class='del'>-		fl-&gt;fl_type = fl_type;</div><div class='add'>+		fl-&gt;c.flc_type = type;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (flock.client_id != fid-&gt;clnt-&gt;name)</div><div class='ctx'> 		kfree(flock.client_id);</div><div class='hunk'>@@ -247,7 +239,7 @@ static int v9fs_file_getlock(struct file *filp, struct file_lock *fl)</div><div class='ctx'> 	 * if we have a conflicting lock locally, no need to validate</div><div class='ctx'> 	 * with server</div><div class='ctx'> 	 */</div><div class='del'>-	if (fl-&gt;fl_type != F_UNLCK)</div><div class='add'>+	if (fl-&gt;c.flc_type != F_UNLCK)</div><div class='ctx'> 		return res;</div><div class='ctx'> </div><div class='ctx'> 	/* convert posix lock to p9 tgetlock args */</div><div class='hunk'>@@ -258,7 +250,7 @@ static int v9fs_file_getlock(struct file *filp, struct file_lock *fl)</div><div class='ctx'> 		glock.length = 0;</div><div class='ctx'> 	else</div><div class='ctx'> 		glock.length = fl-&gt;fl_end - fl-&gt;fl_start + 1;</div><div class='del'>-	glock.proc_id = fl-&gt;fl_pid;</div><div class='add'>+	glock.proc_id = fl-&gt;c.flc_pid;</div><div class='ctx'> 	glock.client_id = fid-&gt;clnt-&gt;name;</div><div class='ctx'> </div><div class='ctx'> 	res = p9_client_getlock_dotl(fid, &amp;glock);</div><div class='hunk'>@@ -267,13 +259,13 @@ static int v9fs_file_getlock(struct file *filp, struct file_lock *fl)</div><div class='ctx'> 	/* map 9p lock type to os lock type */</div><div class='ctx'> 	switch (glock.type) {</div><div class='ctx'> 	case P9_LOCK_TYPE_RDLCK:</div><div class='del'>-		fl-&gt;fl_type = F_RDLCK;</div><div class='add'>+		fl-&gt;c.flc_type = F_RDLCK;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case P9_LOCK_TYPE_WRLCK:</div><div class='del'>-		fl-&gt;fl_type = F_WRLCK;</div><div class='add'>+		fl-&gt;c.flc_type = F_WRLCK;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case P9_LOCK_TYPE_UNLCK:</div><div class='del'>-		fl-&gt;fl_type = F_UNLCK;</div><div class='add'>+		fl-&gt;c.flc_type = F_UNLCK;</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (glock.type != P9_LOCK_TYPE_UNLCK) {</div><div class='hunk'>@@ -282,7 +274,7 @@ static int v9fs_file_getlock(struct file *filp, struct file_lock *fl)</div><div class='ctx'> 			fl-&gt;fl_end = OFFSET_MAX;</div><div class='ctx'> 		else</div><div class='ctx'> 			fl-&gt;fl_end = glock.start + glock.length - 1;</div><div class='del'>-		fl-&gt;fl_pid = -glock.proc_id;</div><div class='add'>+		fl-&gt;c.flc_pid = -glock.proc_id;</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='ctx'> 	if (glock.client_id != fid-&gt;clnt-&gt;name)</div><div class='hunk'>@@ -306,7 +298,7 @@ static int v9fs_file_lock_dotl(struct file *filp, int cmd, struct file_lock *fl)</div><div class='ctx'> 	p9_debug(P9_DEBUG_VFS, "filp: %p cmd:%d lock: %p name: %pD\n",</div><div class='ctx'> 		 filp, cmd, fl, filp);</div><div class='ctx'> </div><div class='del'>-	if ((IS_SETLK(cmd) || IS_SETLKW(cmd)) &amp;&amp; fl-&gt;fl_type != F_UNLCK) {</div><div class='add'>+	if ((IS_SETLK(cmd) || IS_SETLKW(cmd)) &amp;&amp; fl-&gt;c.flc_type != F_UNLCK) {</div><div class='ctx'> 		filemap_write_and_wait(inode-&gt;i_mapping);</div><div class='ctx'> 		invalidate_mapping_pages(&amp;inode-&gt;i_data, 0, -1);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -337,16 +329,16 @@ static int v9fs_file_flock_dotl(struct file *filp, int cmd,</div><div class='ctx'> 	p9_debug(P9_DEBUG_VFS, "filp: %p cmd:%d lock: %p name: %pD\n",</div><div class='ctx'> 		 filp, cmd, fl, filp);</div><div class='ctx'> </div><div class='del'>-	if (!(fl-&gt;fl_flags &amp; FL_FLOCK))</div><div class='add'>+	if (!(fl-&gt;c.flc_flags &amp; FL_FLOCK))</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> </div><div class='del'>-	if ((IS_SETLK(cmd) || IS_SETLKW(cmd)) &amp;&amp; fl-&gt;fl_type != F_UNLCK) {</div><div class='add'>+	if ((IS_SETLK(cmd) || IS_SETLKW(cmd)) &amp;&amp; fl-&gt;c.flc_type != F_UNLCK) {</div><div class='ctx'> 		filemap_write_and_wait(inode-&gt;i_mapping);</div><div class='ctx'> 		invalidate_mapping_pages(&amp;inode-&gt;i_data, 0, -1);</div><div class='ctx'> 	}</div><div class='ctx'> 	/* Convert flock to posix lock */</div><div class='del'>-	fl-&gt;fl_flags |= FL_POSIX;</div><div class='del'>-	fl-&gt;fl_flags ^= FL_FLOCK;</div><div class='add'>+	fl-&gt;c.flc_flags |= FL_POSIX;</div><div class='add'>+	fl-&gt;c.flc_flags ^= FL_FLOCK;</div><div class='ctx'> </div><div class='ctx'> 	if (IS_SETLK(cmd) | IS_SETLKW(cmd))</div><div class='ctx'> 		ret = v9fs_file_do_lock(filp, cmd, fl);</div><div class='hunk'>@@ -366,20 +358,37 @@ static ssize_t</div><div class='ctx'> v9fs_file_read_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='ctx'> {</div><div class='ctx'> 	struct p9_fid *fid = iocb-&gt;ki_filp-&gt;private_data;</div><div class='del'>-	int ret, err = 0;</div><div class='ctx'> </div><div class='del'>-	p9_debug(P9_DEBUG_VFS, "count %zu offset %lld\n",</div><div class='del'>-		 iov_iter_count(to), iocb-&gt;ki_pos);</div><div class='add'>+	p9_debug(P9_DEBUG_VFS, "fid %d count %zu offset %lld\n",</div><div class='add'>+		 fid-&gt;fid, iov_iter_count(to), iocb-&gt;ki_pos);</div><div class='ctx'> </div><div class='del'>-	if (iocb-&gt;ki_filp-&gt;f_flags &amp; O_NONBLOCK)</div><div class='del'>-		ret = p9_client_read_once(fid, iocb-&gt;ki_pos, to, &amp;err);</div><div class='del'>-	else</div><div class='del'>-		ret = p9_client_read(fid, iocb-&gt;ki_pos, to, &amp;err);</div><div class='del'>-	if (!ret)</div><div class='del'>-		return err;</div><div class='add'>+	if (fid-&gt;mode &amp; P9L_DIRECT)</div><div class='add'>+		return netfs_unbuffered_read_iter(iocb, to);</div><div class='ctx'> </div><div class='del'>-	iocb-&gt;ki_pos += ret;</div><div class='del'>-	return ret;</div><div class='add'>+	p9_debug(P9_DEBUG_VFS, "(cached)\n");</div><div class='add'>+	return netfs_file_read_iter(iocb, to);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * v9fs_file_splice_read - splice-read from a file</div><div class='add'>+ * @in: The 9p file to read from</div><div class='add'>+ * @ppos: Where to find/update the file position</div><div class='add'>+ * @pipe: The pipe to splice into</div><div class='add'>+ * @len: The maximum amount of data to splice</div><div class='add'>+ * @flags: SPLICE_F_* flags</div><div class='add'>+ */</div><div class='add'>+static ssize_t v9fs_file_splice_read(struct file *in, loff_t *ppos,</div><div class='add'>+				     struct pipe_inode_info *pipe,</div><div class='add'>+				     size_t len, unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	struct p9_fid *fid = in-&gt;private_data;</div><div class='add'>+</div><div class='add'>+	p9_debug(P9_DEBUG_VFS, "fid %d count %zu offset %lld\n",</div><div class='add'>+		 fid-&gt;fid, len, *ppos);</div><div class='add'>+</div><div class='add'>+	if (fid-&gt;mode &amp; P9L_DIRECT)</div><div class='add'>+		return copy_splice_read(in, ppos, pipe, len, flags);</div><div class='add'>+	return filemap_splice_read(in, ppos, pipe, len, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -392,39 +401,15 @@ static ssize_t</div><div class='ctx'> v9fs_file_write_iter(struct kiocb *iocb, struct iov_iter *from)</div><div class='ctx'> {</div><div class='ctx'> 	struct file *file = iocb-&gt;ki_filp;</div><div class='del'>-	ssize_t retval;</div><div class='del'>-	loff_t origin;</div><div class='del'>-	int err = 0;</div><div class='add'>+	struct p9_fid *fid = file-&gt;private_data;</div><div class='ctx'> </div><div class='del'>-	retval = generic_write_checks(iocb, from);</div><div class='del'>-	if (retval &lt;= 0)</div><div class='del'>-		return retval;</div><div class='add'>+	p9_debug(P9_DEBUG_VFS, "fid %d\n", fid-&gt;fid);</div><div class='ctx'> </div><div class='del'>-	origin = iocb-&gt;ki_pos;</div><div class='del'>-	retval = p9_client_write(file-&gt;private_data, iocb-&gt;ki_pos, from, &amp;err);</div><div class='del'>-	if (retval &gt; 0) {</div><div class='del'>-		struct inode *inode = file_inode(file);</div><div class='del'>-		loff_t i_size;</div><div class='del'>-		unsigned long pg_start, pg_end;</div><div class='del'>-</div><div class='del'>-		pg_start = origin &gt;&gt; PAGE_SHIFT;</div><div class='del'>-		pg_end = (origin + retval - 1) &gt;&gt; PAGE_SHIFT;</div><div class='del'>-		if (inode-&gt;i_mapping &amp;&amp; inode-&gt;i_mapping-&gt;nrpages)</div><div class='del'>-			invalidate_inode_pages2_range(inode-&gt;i_mapping,</div><div class='del'>-						      pg_start, pg_end);</div><div class='del'>-		iocb-&gt;ki_pos += retval;</div><div class='del'>-		i_size = i_size_read(inode);</div><div class='del'>-		if (iocb-&gt;ki_pos &gt; i_size) {</div><div class='del'>-			inode_add_bytes(inode, iocb-&gt;ki_pos - i_size);</div><div class='del'>-			/*</div><div class='del'>-			 * Need to serialize against i_size_write() in</div><div class='del'>-			 * v9fs_stat2inode()</div><div class='del'>-			 */</div><div class='del'>-			v9fs_i_size_write(inode, iocb-&gt;ki_pos);</div><div class='del'>-		}</div><div class='del'>-		return retval;</div><div class='del'>-	}</div><div class='del'>-	return err;</div><div class='add'>+	if (fid-&gt;mode &amp; (P9L_DIRECT | P9L_NOWRITECACHE))</div><div class='add'>+		return netfs_unbuffered_write_iter(iocb, from);</div><div class='add'>+</div><div class='add'>+	p9_debug(P9_DEBUG_CACHE, "(cached)\n");</div><div class='add'>+	return netfs_file_write_iter(iocb, from);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int v9fs_file_fsync(struct file *filp, loff_t start, loff_t end,</div><div class='hunk'>@@ -474,52 +459,23 @@ int v9fs_file_fsync_dotl(struct file *filp, loff_t start, loff_t end,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-v9fs_file_mmap(struct file *filp, struct vm_area_struct *vma)</div><div class='add'>+v9fs_file_mmap_prepare(struct vm_area_desc *desc)</div><div class='ctx'> {</div><div class='ctx'> 	int retval;</div><div class='add'>+	struct file *filp = desc-&gt;file;</div><div class='add'>+	struct inode *inode = file_inode(filp);</div><div class='add'>+	struct v9fs_session_info *v9ses = v9fs_inode2v9ses(inode);</div><div class='ctx'> </div><div class='add'>+	p9_debug(P9_DEBUG_MMAP, "filp :%p\n", filp);</div><div class='ctx'> </div><div class='del'>-	retval = generic_file_mmap(filp, vma);</div><div class='del'>-	if (!retval)</div><div class='del'>-		vma-&gt;vm_ops = &amp;v9fs_file_vm_ops;</div><div class='del'>-</div><div class='del'>-	return retval;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-v9fs_mmap_file_mmap(struct file *filp, struct vm_area_struct *vma)</div><div class='del'>-{</div><div class='del'>-	int retval;</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	struct v9fs_inode *v9inode;</div><div class='del'>-	struct p9_fid *fid;</div><div class='del'>-</div><div class='del'>-	inode = file_inode(filp);</div><div class='del'>-	v9inode = V9FS_I(inode);</div><div class='del'>-	mutex_lock(&amp;v9inode-&gt;v_mutex);</div><div class='del'>-	if (!v9inode-&gt;writeback_fid &amp;&amp;</div><div class='del'>-	    (vma-&gt;vm_flags &amp; VM_SHARED) &amp;&amp;</div><div class='del'>-	    (vma-&gt;vm_flags &amp; VM_WRITE)) {</div><div class='del'>-		/*</div><div class='del'>-		 * clone a fid and add it to writeback_fid</div><div class='del'>-		 * we do it during mmap instead of</div><div class='del'>-		 * page dirty time via write_begin/page_mkwrite</div><div class='del'>-		 * because we want write after unlink usecase</div><div class='del'>-		 * to work.</div><div class='del'>-		 */</div><div class='del'>-		fid = v9fs_writeback_fid(file_dentry(filp));</div><div class='del'>-		if (IS_ERR(fid)) {</div><div class='del'>-			retval = PTR_ERR(fid);</div><div class='del'>-			mutex_unlock(&amp;v9inode-&gt;v_mutex);</div><div class='del'>-			return retval;</div><div class='del'>-		}</div><div class='del'>-		v9inode-&gt;writeback_fid = (void *) fid;</div><div class='add'>+	if (!(v9ses-&gt;cache &amp; CACHE_WRITEBACK)) {</div><div class='add'>+		p9_debug(P9_DEBUG_CACHE, "(read-only mmap mode)");</div><div class='add'>+		return generic_file_readonly_mmap_prepare(desc);</div><div class='ctx'> 	}</div><div class='del'>-	mutex_unlock(&amp;v9inode-&gt;v_mutex);</div><div class='ctx'> </div><div class='del'>-	retval = generic_file_mmap(filp, vma);</div><div class='add'>+	retval = generic_file_mmap_prepare(desc);</div><div class='ctx'> 	if (!retval)</div><div class='del'>-		vma-&gt;vm_ops = &amp;v9fs_mmap_file_vm_ops;</div><div class='add'>+		desc-&gt;vm_ops = &amp;v9fs_mmap_file_vm_ops;</div><div class='ctx'> </div><div class='ctx'> 	return retval;</div><div class='ctx'> }</div><div class='hunk'>@@ -527,100 +483,22 @@ v9fs_mmap_file_mmap(struct file *filp, struct vm_area_struct *vma)</div><div class='ctx'> static vm_fault_t</div><div class='ctx'> v9fs_vm_page_mkwrite(struct vm_fault *vmf)</div><div class='ctx'> {</div><div class='del'>-	struct v9fs_inode *v9inode;</div><div class='del'>-	struct folio *folio = page_folio(vmf-&gt;page);</div><div class='del'>-	struct file *filp = vmf-&gt;vma-&gt;vm_file;</div><div class='del'>-	struct inode *inode = file_inode(filp);</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-	p9_debug(P9_DEBUG_VFS, "folio %p fid %lx\n",</div><div class='del'>-		 folio, (unsigned long)filp-&gt;private_data);</div><div class='del'>-</div><div class='del'>-	v9inode = V9FS_I(inode);</div><div class='del'>-</div><div class='del'>-	/* Wait for the page to be written to the cache before we allow it to</div><div class='del'>-	 * be modified.  We then assume the entire page will need writing back.</div><div class='del'>-	 */</div><div class='del'>-#ifdef CONFIG_9P_FSCACHE</div><div class='del'>-	if (folio_test_fscache(folio) &amp;&amp;</div><div class='del'>-	    folio_wait_fscache_killable(folio) &lt; 0)</div><div class='del'>-		return VM_FAULT_NOPAGE;</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-	/* Update file times before taking page lock */</div><div class='del'>-	file_update_time(filp);</div><div class='del'>-</div><div class='del'>-	BUG_ON(!v9inode-&gt;writeback_fid);</div><div class='del'>-	if (folio_lock_killable(folio) &lt; 0)</div><div class='del'>-		return VM_FAULT_RETRY;</div><div class='del'>-	if (folio_mapping(folio) != inode-&gt;i_mapping)</div><div class='del'>-		goto out_unlock;</div><div class='del'>-	folio_wait_stable(folio);</div><div class='del'>-</div><div class='del'>-	return VM_FAULT_LOCKED;</div><div class='del'>-out_unlock:</div><div class='del'>-	folio_unlock(folio);</div><div class='del'>-	return VM_FAULT_NOPAGE;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * v9fs_mmap_file_read_iter - read from a file</div><div class='del'>- * @iocb: The operation parameters</div><div class='del'>- * @to: The buffer to read into</div><div class='del'>- *</div><div class='del'>- */</div><div class='del'>-static ssize_t</div><div class='del'>-v9fs_mmap_file_read_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='del'>-{</div><div class='del'>-	/* TODO: Check if there are dirty pages */</div><div class='del'>-	return v9fs_file_read_iter(iocb, to);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * v9fs_mmap_file_write_iter - write to a file</div><div class='del'>- * @iocb: The operation parameters</div><div class='del'>- * @from: The data to write</div><div class='del'>- *</div><div class='del'>- */</div><div class='del'>-static ssize_t</div><div class='del'>-v9fs_mmap_file_write_iter(struct kiocb *iocb, struct iov_iter *from)</div><div class='del'>-{</div><div class='del'>-	/*</div><div class='del'>-	 * TODO: invalidate mmaps on filp's inode between</div><div class='del'>-	 * offset and offset+count</div><div class='del'>-	 */</div><div class='del'>-	return v9fs_file_write_iter(iocb, from);</div><div class='add'>+	return netfs_page_mkwrite(vmf, NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void v9fs_mmap_vm_close(struct vm_area_struct *vma)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode;</div><div class='del'>-</div><div class='del'>-	struct writeback_control wbc = {</div><div class='del'>-		.nr_to_write = LONG_MAX,</div><div class='del'>-		.sync_mode = WB_SYNC_ALL,</div><div class='del'>-		.range_start = (loff_t)vma-&gt;vm_pgoff * PAGE_SIZE,</div><div class='del'>-		 /* absolute end, byte at end included */</div><div class='del'>-		.range_end = (loff_t)vma-&gt;vm_pgoff * PAGE_SIZE +</div><div class='del'>-			(vma-&gt;vm_end - vma-&gt;vm_start - 1),</div><div class='del'>-	};</div><div class='del'>-</div><div class='ctx'> 	if (!(vma-&gt;vm_flags &amp; VM_SHARED))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	p9_debug(P9_DEBUG_VFS, "9p VMA close, %p, flushing", vma);</div><div class='ctx'> </div><div class='del'>-	inode = file_inode(vma-&gt;vm_file);</div><div class='del'>-	filemap_fdatawrite_wbc(inode-&gt;i_mapping, &amp;wbc);</div><div class='add'>+	filemap_fdatawrite_range(file_inode(vma-&gt;vm_file)-&gt;i_mapping,</div><div class='add'>+			(loff_t)vma-&gt;vm_pgoff * PAGE_SIZE,</div><div class='add'>+			(loff_t)vma-&gt;vm_pgoff * PAGE_SIZE +</div><div class='add'>+				(vma-&gt;vm_end - vma-&gt;vm_start - 1));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-</div><div class='del'>-static const struct vm_operations_struct v9fs_file_vm_ops = {</div><div class='del'>-	.fault = filemap_fault,</div><div class='del'>-	.map_pages = filemap_map_pages,</div><div class='del'>-	.page_mkwrite = v9fs_vm_page_mkwrite,</div><div class='del'>-};</div><div class='del'>-</div><div class='ctx'> static const struct vm_operations_struct v9fs_mmap_file_vm_ops = {</div><div class='ctx'> 	.close = v9fs_mmap_vm_close,</div><div class='ctx'> 	.fault = filemap_fault,</div><div class='hunk'>@@ -628,34 +506,6 @@ static const struct vm_operations_struct v9fs_mmap_file_vm_ops = {</div><div class='ctx'> 	.page_mkwrite = v9fs_vm_page_mkwrite,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-</div><div class='del'>-const struct file_operations v9fs_cached_file_operations = {</div><div class='del'>-	.llseek = generic_file_llseek,</div><div class='del'>-	.read_iter = generic_file_read_iter,</div><div class='del'>-	.write_iter = generic_file_write_iter,</div><div class='del'>-	.open = v9fs_file_open,</div><div class='del'>-	.release = v9fs_dir_release,</div><div class='del'>-	.lock = v9fs_file_lock,</div><div class='del'>-	.mmap = v9fs_file_mmap,</div><div class='del'>-	.splice_read = generic_file_splice_read,</div><div class='del'>-	.splice_write = iter_file_splice_write,</div><div class='del'>-	.fsync = v9fs_file_fsync,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-const struct file_operations v9fs_cached_file_operations_dotl = {</div><div class='del'>-	.llseek = generic_file_llseek,</div><div class='del'>-	.read_iter = generic_file_read_iter,</div><div class='del'>-	.write_iter = generic_file_write_iter,</div><div class='del'>-	.open = v9fs_file_open,</div><div class='del'>-	.release = v9fs_dir_release,</div><div class='del'>-	.lock = v9fs_file_lock_dotl,</div><div class='del'>-	.flock = v9fs_file_flock_dotl,</div><div class='del'>-	.mmap = v9fs_file_mmap,</div><div class='del'>-	.splice_read = generic_file_splice_read,</div><div class='del'>-	.splice_write = iter_file_splice_write,</div><div class='del'>-	.fsync = v9fs_file_fsync_dotl,</div><div class='del'>-};</div><div class='del'>-</div><div class='ctx'> const struct file_operations v9fs_file_operations = {</div><div class='ctx'> 	.llseek = generic_file_llseek,</div><div class='ctx'> 	.read_iter = v9fs_file_read_iter,</div><div class='hunk'>@@ -663,10 +513,11 @@ const struct file_operations v9fs_file_operations = {</div><div class='ctx'> 	.open = v9fs_file_open,</div><div class='ctx'> 	.release = v9fs_dir_release,</div><div class='ctx'> 	.lock = v9fs_file_lock,</div><div class='del'>-	.mmap = generic_file_readonly_mmap,</div><div class='del'>-	.splice_read = generic_file_splice_read,</div><div class='add'>+	.mmap_prepare = generic_file_readonly_mmap_prepare,</div><div class='add'>+	.splice_read = v9fs_file_splice_read,</div><div class='ctx'> 	.splice_write = iter_file_splice_write,</div><div class='ctx'> 	.fsync = v9fs_file_fsync,</div><div class='add'>+	.setlease = simple_nosetlease,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct file_operations v9fs_file_operations_dotl = {</div><div class='hunk'>@@ -677,35 +528,9 @@ const struct file_operations v9fs_file_operations_dotl = {</div><div class='ctx'> 	.release = v9fs_dir_release,</div><div class='ctx'> 	.lock = v9fs_file_lock_dotl,</div><div class='ctx'> 	.flock = v9fs_file_flock_dotl,</div><div class='del'>-	.mmap = generic_file_readonly_mmap,</div><div class='del'>-	.splice_read = generic_file_splice_read,</div><div class='del'>-	.splice_write = iter_file_splice_write,</div><div class='del'>-	.fsync = v9fs_file_fsync_dotl,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-const struct file_operations v9fs_mmap_file_operations = {</div><div class='del'>-	.llseek = generic_file_llseek,</div><div class='del'>-	.read_iter = v9fs_mmap_file_read_iter,</div><div class='del'>-	.write_iter = v9fs_mmap_file_write_iter,</div><div class='del'>-	.open = v9fs_file_open,</div><div class='del'>-	.release = v9fs_dir_release,</div><div class='del'>-	.lock = v9fs_file_lock,</div><div class='del'>-	.mmap = v9fs_mmap_file_mmap,</div><div class='del'>-	.splice_read = generic_file_splice_read,</div><div class='del'>-	.splice_write = iter_file_splice_write,</div><div class='del'>-	.fsync = v9fs_file_fsync,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-const struct file_operations v9fs_mmap_file_operations_dotl = {</div><div class='del'>-	.llseek = generic_file_llseek,</div><div class='del'>-	.read_iter = v9fs_mmap_file_read_iter,</div><div class='del'>-	.write_iter = v9fs_mmap_file_write_iter,</div><div class='del'>-	.open = v9fs_file_open,</div><div class='del'>-	.release = v9fs_dir_release,</div><div class='del'>-	.lock = v9fs_file_lock_dotl,</div><div class='del'>-	.flock = v9fs_file_flock_dotl,</div><div class='del'>-	.mmap = v9fs_mmap_file_mmap,</div><div class='del'>-	.splice_read = generic_file_splice_read,</div><div class='add'>+	.mmap_prepare = v9fs_file_mmap_prepare,</div><div class='add'>+	.splice_read = v9fs_file_splice_read,</div><div class='ctx'> 	.splice_write = iter_file_splice_write,</div><div class='ctx'> 	.fsync = v9fs_file_fsync_dotl,</div><div class='add'>+	.setlease = simple_nosetlease,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/9p/vfs_inode.c b/fs/9p/vfs_inode.c<br/>index 328c338ff304..97abe65bf7c1 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/9p/vfs_inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/9p/vfs_inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/9p/vfs_inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/9p/vfs_inode.c</a></div><div class='hunk'>@@ -15,9 +15,7 @@</div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='ctx'> #include &lt;linux/stat.h&gt;</div><div class='ctx'> #include &lt;linux/string.h&gt;</div><div class='del'>-#include &lt;linux/inet.h&gt;</div><div class='ctx'> #include &lt;linux/namei.h&gt;</div><div class='del'>-#include &lt;linux/idr.h&gt;</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/xattr.h&gt;</div><div class='hunk'>@@ -85,7 +83,7 @@ static int p9mode2perm(struct v9fs_session_info *v9ses,</div><div class='ctx'> 	int res;</div><div class='ctx'> 	int mode = stat-&gt;mode;</div><div class='ctx'> </div><div class='del'>-	res = mode &amp; S_IALLUGO;</div><div class='add'>+	res = mode &amp; 0777; /* S_IRWXUGO */</div><div class='ctx'> 	if (v9fs_proto_dotu(v9ses)) {</div><div class='ctx'> 		if ((mode &amp; P9_DMSETUID) == P9_DMSETUID)</div><div class='ctx'> 			res |= S_ISUID;</div><div class='hunk'>@@ -165,7 +163,6 @@ int v9fs_uflags2omode(int uflags, int extended)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = 0;</div><div class='ctx'> 	switch (uflags&amp;3) {</div><div class='ctx'> 	default:</div><div class='ctx'> 	case O_RDONLY:</div><div class='hunk'>@@ -181,6 +178,9 @@ int v9fs_uflags2omode(int uflags, int extended)</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (uflags &amp; O_TRUNC)</div><div class='add'>+		ret |= P9_OTRUNC;</div><div class='add'>+</div><div class='ctx'> 	if (extended) {</div><div class='ctx'> 		if (uflags &amp; O_EXCL)</div><div class='ctx'> 			ret |= P9_OEXCL;</div><div class='hunk'>@@ -228,17 +228,12 @@ struct inode *v9fs_alloc_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct v9fs_inode *v9inode;</div><div class='ctx'> </div><div class='del'>-	v9inode = kmem_cache_alloc(v9fs_inode_cache, GFP_KERNEL);</div><div class='add'>+	v9inode = alloc_inode_sb(sb, v9fs_inode_cache, GFP_KERNEL);</div><div class='ctx'> 	if (!v9inode)</div><div class='ctx'> 		return NULL;</div><div class='del'>-#ifdef CONFIG_9P_FSCACHE</div><div class='del'>-	v9inode-&gt;fscache = NULL;</div><div class='del'>-	mutex_init(&amp;v9inode-&gt;fscache_lock);</div><div class='del'>-#endif</div><div class='del'>-	v9inode-&gt;writeback_fid = NULL;</div><div class='ctx'> 	v9inode-&gt;cache_validity = 0;</div><div class='ctx'> 	mutex_init(&amp;v9inode-&gt;v_mutex);</div><div class='del'>-	return &amp;v9inode-&gt;vfs_inode;</div><div class='add'>+	return &amp;v9inode-&gt;netfs.inode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -251,15 +246,24 @@ void v9fs_free_inode(struct inode *inode)</div><div class='ctx'> 	kmem_cache_free(v9fs_inode_cache, V9FS_I(inode));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Set parameters for the netfs library</div><div class='add'>+ */</div><div class='add'>+void v9fs_set_netfs_context(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct v9fs_inode *v9inode = V9FS_I(inode);</div><div class='add'>+	netfs_inode_init(&amp;v9inode-&gt;netfs, &amp;v9fs_req_ops, true);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> int v9fs_init_inode(struct v9fs_session_info *v9ses,</div><div class='ctx'> 		    struct inode *inode, umode_t mode, dev_t rdev)</div><div class='ctx'> {</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='del'>-	inode_init_owner(&amp;init_user_ns, inode, NULL, mode);</div><div class='add'>+	inode_init_owner(&amp;nop_mnt_idmap, inode, NULL, mode);</div><div class='ctx'> 	inode-&gt;i_blocks = 0;</div><div class='ctx'> 	inode-&gt;i_rdev = rdev;</div><div class='del'>-	inode-&gt;i_atime = inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	simple_inode_init_ts(inode);</div><div class='ctx'> 	inode-&gt;i_mapping-&gt;a_ops = &amp;v9fs_addr_operations;</div><div class='ctx'> 	inode-&gt;i_private = NULL;</div><div class='ctx'> </div><div class='hunk'>@@ -283,24 +287,10 @@ int v9fs_init_inode(struct v9fs_session_info *v9ses,</div><div class='ctx'> 	case S_IFREG:</div><div class='ctx'> 		if (v9fs_proto_dotl(v9ses)) {</div><div class='ctx'> 			inode-&gt;i_op = &amp;v9fs_file_inode_operations_dotl;</div><div class='del'>-			if (v9ses-&gt;cache == CACHE_LOOSE ||</div><div class='del'>-			    v9ses-&gt;cache == CACHE_FSCACHE)</div><div class='del'>-				inode-&gt;i_fop =</div><div class='del'>-					&amp;v9fs_cached_file_operations_dotl;</div><div class='del'>-			else if (v9ses-&gt;cache == CACHE_MMAP)</div><div class='del'>-				inode-&gt;i_fop = &amp;v9fs_mmap_file_operations_dotl;</div><div class='del'>-			else</div><div class='del'>-				inode-&gt;i_fop = &amp;v9fs_file_operations_dotl;</div><div class='add'>+			inode-&gt;i_fop = &amp;v9fs_file_operations_dotl;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			inode-&gt;i_op = &amp;v9fs_file_inode_operations;</div><div class='del'>-			if (v9ses-&gt;cache == CACHE_LOOSE ||</div><div class='del'>-			    v9ses-&gt;cache == CACHE_FSCACHE)</div><div class='del'>-				inode-&gt;i_fop =</div><div class='del'>-					&amp;v9fs_cached_file_operations;</div><div class='del'>-			else if (v9ses-&gt;cache == CACHE_MMAP)</div><div class='del'>-				inode-&gt;i_fop = &amp;v9fs_mmap_file_operations;</div><div class='del'>-			else</div><div class='del'>-				inode-&gt;i_fop = &amp;v9fs_file_operations;</div><div class='add'>+			inode-&gt;i_fop = &amp;v9fs_file_operations;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		break;</div><div class='hunk'>@@ -345,53 +335,31 @@ error:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * v9fs_get_inode - helper function to setup an inode</div><div class='del'>- * @sb: superblock</div><div class='del'>- * @mode: mode to setup inode with</div><div class='del'>- * @rdev: The device numbers to set</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-struct inode *v9fs_get_inode(struct super_block *sb, umode_t mode, dev_t rdev)</div><div class='del'>-{</div><div class='del'>-	int err;</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	struct v9fs_session_info *v9ses = sb-&gt;s_fs_info;</div><div class='del'>-</div><div class='del'>-	p9_debug(P9_DEBUG_VFS, "super block: %p mode: %ho\n", sb, mode);</div><div class='del'>-</div><div class='del'>-	inode = new_inode(sb);</div><div class='del'>-	if (!inode) {</div><div class='del'>-		pr_warn("%s (%d): Problem allocating inode\n",</div><div class='del'>-			__func__, task_pid_nr(current));</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='del'>-	}</div><div class='del'>-	err = v9fs_init_inode(v9ses, inode, mode, rdev);</div><div class='del'>-	if (err) {</div><div class='del'>-		iput(inode);</div><div class='del'>-		return ERR_PTR(err);</div><div class='del'>-	}</div><div class='del'>-	return inode;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='ctx'>  * v9fs_evict_inode - Remove an inode from the inode cache</div><div class='ctx'>  * @inode: inode to release</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='ctx'> void v9fs_evict_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct v9fs_inode *v9inode = V9FS_I(inode);</div><div class='add'>+	struct v9fs_inode __maybe_unused *v9inode = V9FS_I(inode);</div><div class='add'>+	__le32 __maybe_unused version;</div><div class='ctx'> </div><div class='del'>-	truncate_inode_pages_final(&amp;inode-&gt;i_data);</div><div class='del'>-	clear_inode(inode);</div><div class='del'>-	filemap_fdatawrite(&amp;inode-&gt;i_data);</div><div class='add'>+	if (!is_bad_inode(inode)) {</div><div class='add'>+		netfs_wait_for_outstanding_io(inode);</div><div class='add'>+		truncate_inode_pages_final(&amp;inode-&gt;i_data);</div><div class='ctx'> </div><div class='del'>-	v9fs_cache_inode_put_cookie(inode);</div><div class='del'>-	/* clunk the fid stashed in writeback_fid */</div><div class='del'>-	if (v9inode-&gt;writeback_fid) {</div><div class='del'>-		p9_client_clunk(v9inode-&gt;writeback_fid);</div><div class='del'>-		v9inode-&gt;writeback_fid = NULL;</div><div class='del'>-	}</div><div class='add'>+		version = cpu_to_le32(v9inode-&gt;qid.version);</div><div class='add'>+		netfs_clear_inode_writeback(inode, &amp;version);</div><div class='add'>+</div><div class='add'>+		clear_inode(inode);</div><div class='add'>+		filemap_fdatawrite(&amp;inode-&gt;i_data);</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_9P_FSCACHE</div><div class='add'>+		if (v9fs_inode_cookie(v9inode))</div><div class='add'>+			fscache_relinquish_cookie(v9fs_inode_cookie(v9inode), false);</div><div class='add'>+#endif</div><div class='add'>+	} else</div><div class='add'>+		clear_inode(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int v9fs_test_inode(struct inode *inode, void *data)</div><div class='hunk'>@@ -442,7 +410,6 @@ static struct inode *v9fs_qid_iget(struct super_block *sb,</div><div class='ctx'> 	dev_t rdev;</div><div class='ctx'> 	int retval;</div><div class='ctx'> 	umode_t umode;</div><div class='del'>-	unsigned long i_ino;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct v9fs_session_info *v9ses = sb-&gt;s_fs_info;</div><div class='ctx'> 	int (*test)(struct inode *inode, void *data);</div><div class='hunk'>@@ -452,24 +419,24 @@ static struct inode *v9fs_qid_iget(struct super_block *sb,</div><div class='ctx'> 	else</div><div class='ctx'> 		test = v9fs_test_inode;</div><div class='ctx'> </div><div class='del'>-	i_ino = v9fs_qid2ino(qid);</div><div class='del'>-	inode = iget5_locked(sb, i_ino, test, v9fs_set_inode, st);</div><div class='add'>+	inode = iget5_locked(sb, QID2INO(qid), test, v9fs_set_inode, st);</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='del'>-	if (!(inode-&gt;i_state &amp; I_NEW))</div><div class='add'>+	if (!(inode_state_read_once(inode) &amp; I_NEW))</div><div class='ctx'> 		return inode;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * initialize the inode with the stat info</div><div class='ctx'> 	 * FIXME!! we may need support for stale inodes</div><div class='ctx'> 	 * later.</div><div class='ctx'> 	 */</div><div class='del'>-	inode-&gt;i_ino = i_ino;</div><div class='add'>+	inode-&gt;i_ino = QID2INO(qid);</div><div class='ctx'> 	umode = p9mode2unixmode(v9ses, st, &amp;rdev);</div><div class='ctx'> 	retval = v9fs_init_inode(v9ses, inode, umode, rdev);</div><div class='ctx'> 	if (retval)</div><div class='ctx'> 		goto error;</div><div class='ctx'> </div><div class='ctx'> 	v9fs_stat2inode(st, inode, sb, 0);</div><div class='add'>+	v9fs_set_netfs_context(inode);</div><div class='ctx'> 	v9fs_cache_inode_get_cookie(inode);</div><div class='ctx'> 	unlock_new_inode(inode);</div><div class='ctx'> 	return inode;</div><div class='hunk'>@@ -558,7 +525,7 @@ static int v9fs_remove(struct inode *dir, struct dentry *dentry, int flags)</div><div class='ctx'> 	if (v9fs_proto_dotl(v9ses))</div><div class='ctx'> 		retval = p9_client_unlinkat(dfid, dentry-&gt;d_name.name,</div><div class='ctx'> 					    v9fs_at_to_dotl_flags(flags));</div><div class='del'>-	p9_client_clunk(dfid);</div><div class='add'>+	p9_fid_put(dfid);</div><div class='ctx'> 	if (retval == -EOPNOTSUPP) {</div><div class='ctx'> 		/* Try the one based on path */</div><div class='ctx'> 		v9fid = v9fs_fid_clone(dentry);</div><div class='hunk'>@@ -608,7 +575,6 @@ v9fs_create(struct v9fs_session_info *v9ses, struct inode *dir,</div><div class='ctx'> </div><div class='ctx'> 	p9_debug(P9_DEBUG_VFS, "name %pd\n", dentry);</div><div class='ctx'> </div><div class='del'>-	err = 0;</div><div class='ctx'> 	name = dentry-&gt;d_name.name;</div><div class='ctx'> 	dfid = v9fs_parent_fid(dentry);</div><div class='ctx'> 	if (IS_ERR(dfid)) {</div><div class='hunk'>@@ -622,14 +588,12 @@ v9fs_create(struct v9fs_session_info *v9ses, struct inode *dir,</div><div class='ctx'> 	if (IS_ERR(ofid)) {</div><div class='ctx'> 		err = PTR_ERR(ofid);</div><div class='ctx'> 		p9_debug(P9_DEBUG_VFS, "p9_client_walk failed %d\n", err);</div><div class='del'>-		p9_client_clunk(dfid);</div><div class='del'>-		return ERR_PTR(err);</div><div class='add'>+		goto error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	err = p9_client_fcreate(ofid, name, perm, mode, extension);</div><div class='ctx'> 	if (err &lt; 0) {</div><div class='ctx'> 		p9_debug(P9_DEBUG_VFS, "p9_client_fcreate failed %d\n", err);</div><div class='del'>-		p9_client_clunk(dfid);</div><div class='ctx'> 		goto error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -640,8 +604,6 @@ v9fs_create(struct v9fs_session_info *v9ses, struct inode *dir,</div><div class='ctx'> 			err = PTR_ERR(fid);</div><div class='ctx'> 			p9_debug(P9_DEBUG_VFS,</div><div class='ctx'> 				   "p9_client_walk failed %d\n", err);</div><div class='del'>-			fid = NULL;</div><div class='del'>-			p9_client_clunk(dfid);</div><div class='ctx'> 			goto error;</div><div class='ctx'> 		}</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -652,27 +614,23 @@ v9fs_create(struct v9fs_session_info *v9ses, struct inode *dir,</div><div class='ctx'> 			err = PTR_ERR(inode);</div><div class='ctx'> 			p9_debug(P9_DEBUG_VFS,</div><div class='ctx'> 				   "inode creation failed %d\n", err);</div><div class='del'>-			p9_client_clunk(dfid);</div><div class='ctx'> 			goto error;</div><div class='ctx'> 		}</div><div class='del'>-		v9fs_fid_add(dentry, fid);</div><div class='add'>+		v9fs_fid_add(dentry, &amp;fid);</div><div class='ctx'> 		d_instantiate(dentry, inode);</div><div class='ctx'> 	}</div><div class='del'>-	p9_client_clunk(dfid);</div><div class='add'>+	p9_fid_put(dfid);</div><div class='ctx'> 	return ofid;</div><div class='ctx'> error:</div><div class='del'>-	if (ofid)</div><div class='del'>-		p9_client_clunk(ofid);</div><div class='del'>-</div><div class='del'>-	if (fid)</div><div class='del'>-		p9_client_clunk(fid);</div><div class='del'>-</div><div class='add'>+	p9_fid_put(dfid);</div><div class='add'>+	p9_fid_put(ofid);</div><div class='add'>+	p9_fid_put(fid);</div><div class='ctx'> 	return ERR_PTR(err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * v9fs_vfs_create - VFS hook to create a regular file</div><div class='del'>- * @mnt_userns: The user namespace of the mount</div><div class='add'>+ * @idmap: idmap of the mount</div><div class='ctx'>  * @dir: The parent directory</div><div class='ctx'>  * @dentry: The name of file to be created</div><div class='ctx'>  * @mode: The UNIX file mode to set</div><div class='hunk'>@@ -684,7 +642,7 @@ error:</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-v9fs_vfs_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+v9fs_vfs_create(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		struct dentry *dentry, umode_t mode, bool excl)</div><div class='ctx'> {</div><div class='ctx'> 	struct v9fs_session_info *v9ses = v9fs_inode2v9ses(dir);</div><div class='hunk'>@@ -697,22 +655,22 @@ v9fs_vfs_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 		return PTR_ERR(fid);</div><div class='ctx'> </div><div class='ctx'> 	v9fs_invalidate_inode_attr(dir);</div><div class='del'>-	p9_client_clunk(fid);</div><div class='add'>+	p9_fid_put(fid);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * v9fs_vfs_mkdir - VFS mkdir hook to create a directory</div><div class='del'>- * @mnt_userns: The user namespace of the mount</div><div class='add'>+ * @idmap: idmap of the mount</div><div class='ctx'>  * @dir:  inode that is being unlinked</div><div class='ctx'>  * @dentry: dentry that is being unlinked</div><div class='ctx'>  * @mode: mode for new directory</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static int v9fs_vfs_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-			  struct dentry *dentry, umode_t mode)</div><div class='add'>+static struct dentry *v9fs_vfs_mkdir(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+				     struct dentry *dentry, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='ctx'> 	u32 perm;</div><div class='hunk'>@@ -733,9 +691,8 @@ static int v9fs_vfs_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (fid)</div><div class='del'>-		p9_client_clunk(fid);</div><div class='del'>-</div><div class='del'>-	return err;</div><div class='add'>+		p9_fid_put(fid);</div><div class='add'>+	return ERR_PTR(err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -774,12 +731,12 @@ struct dentry *v9fs_vfs_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	 */</div><div class='ctx'> 	name = dentry-&gt;d_name.name;</div><div class='ctx'> 	fid = p9_client_walk(dfid, 1, &amp;name, 1);</div><div class='del'>-	p9_client_clunk(dfid);</div><div class='add'>+	p9_fid_put(dfid);</div><div class='ctx'> 	if (fid == ERR_PTR(-ENOENT))</div><div class='ctx'> 		inode = NULL;</div><div class='ctx'> 	else if (IS_ERR(fid))</div><div class='ctx'> 		inode = ERR_CAST(fid);</div><div class='del'>-	else if (v9ses-&gt;cache == CACHE_LOOSE || v9ses-&gt;cache == CACHE_FSCACHE)</div><div class='add'>+	else if (v9ses-&gt;cache &amp; (CACHE_META|CACHE_LOOSE))</div><div class='ctx'> 		inode = v9fs_get_inode_from_fid(v9ses, fid, dir-&gt;i_sb);</div><div class='ctx'> 	else</div><div class='ctx'> 		inode = v9fs_get_new_inode_from_fid(v9ses, fid, dir-&gt;i_sb);</div><div class='hunk'>@@ -793,11 +750,11 @@ struct dentry *v9fs_vfs_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	res = d_splice_alias(inode, dentry);</div><div class='ctx'> 	if (!IS_ERR(fid)) {</div><div class='ctx'> 		if (!res)</div><div class='del'>-			v9fs_fid_add(dentry, fid);</div><div class='add'>+			v9fs_fid_add(dentry, &amp;fid);</div><div class='ctx'> 		else if (!IS_ERR(res))</div><div class='del'>-			v9fs_fid_add(res, fid);</div><div class='add'>+			v9fs_fid_add(res, &amp;fid);</div><div class='ctx'> 		else</div><div class='del'>-			p9_client_clunk(fid);</div><div class='add'>+			p9_fid_put(fid);</div><div class='ctx'> 	}</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='hunk'>@@ -808,79 +765,56 @@ v9fs_vfs_atomic_open(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='ctx'> 	u32 perm;</div><div class='del'>-	struct v9fs_inode *v9inode;</div><div class='add'>+	struct v9fs_inode __maybe_unused *v9inode;</div><div class='ctx'> 	struct v9fs_session_info *v9ses;</div><div class='del'>-	struct p9_fid *fid, *inode_fid;</div><div class='del'>-	struct dentry *res = NULL;</div><div class='add'>+	struct p9_fid *fid;</div><div class='ctx'> 	struct inode *inode;</div><div class='add'>+	int p9_omode;</div><div class='ctx'> </div><div class='ctx'> 	if (d_in_lookup(dentry)) {</div><div class='del'>-		res = v9fs_vfs_lookup(dir, dentry, 0);</div><div class='del'>-		if (IS_ERR(res))</div><div class='del'>-			return PTR_ERR(res);</div><div class='del'>-</div><div class='del'>-		if (res)</div><div class='del'>-			dentry = res;</div><div class='add'>+		struct dentry *res = v9fs_vfs_lookup(dir, dentry, 0);</div><div class='add'>+		if (res || d_really_is_positive(dentry))</div><div class='add'>+			return finish_no_open(file, res);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Only creates */</div><div class='del'>-	if (!(flags &amp; O_CREAT) || d_really_is_positive(dentry))</div><div class='del'>-		return finish_no_open(file, res);</div><div class='del'>-</div><div class='del'>-	err = 0;</div><div class='add'>+	if (!(flags &amp; O_CREAT))</div><div class='add'>+		return finish_no_open(file, NULL);</div><div class='ctx'> </div><div class='ctx'> 	v9ses = v9fs_inode2v9ses(dir);</div><div class='ctx'> 	perm = unixmode2p9mode(v9ses, mode);</div><div class='del'>-	fid = v9fs_create(v9ses, dir, dentry, NULL, perm,</div><div class='del'>-				v9fs_uflags2omode(flags,</div><div class='del'>-						v9fs_proto_dotu(v9ses)));</div><div class='del'>-	if (IS_ERR(fid)) {</div><div class='del'>-		err = PTR_ERR(fid);</div><div class='del'>-		fid = NULL;</div><div class='del'>-		goto error;</div><div class='add'>+	p9_omode = v9fs_uflags2omode(flags, v9fs_proto_dotu(v9ses));</div><div class='add'>+</div><div class='add'>+	if ((v9ses-&gt;cache &amp; CACHE_WRITEBACK) &amp;&amp; (p9_omode &amp; P9_OWRITE)) {</div><div class='add'>+		p9_omode = (p9_omode &amp; ~(P9_OWRITE | P9_OAPPEND)) | P9_ORDWR;</div><div class='add'>+		p9_debug(P9_DEBUG_CACHE,</div><div class='add'>+			"write-only file with writeback enabled, creating w/ O_RDWR\n");</div><div class='ctx'> 	}</div><div class='add'>+	fid = v9fs_create(v9ses, dir, dentry, NULL, perm, p9_omode);</div><div class='add'>+	if (IS_ERR(fid))</div><div class='add'>+		return PTR_ERR(fid);</div><div class='ctx'> </div><div class='ctx'> 	v9fs_invalidate_inode_attr(dir);</div><div class='ctx'> 	inode = d_inode(dentry);</div><div class='ctx'> 	v9inode = V9FS_I(inode);</div><div class='del'>-	mutex_lock(&amp;v9inode-&gt;v_mutex);</div><div class='del'>-	if ((v9ses-&gt;cache == CACHE_LOOSE || v9ses-&gt;cache == CACHE_FSCACHE) &amp;&amp;</div><div class='del'>-	    !v9inode-&gt;writeback_fid &amp;&amp;</div><div class='del'>-	    ((flags &amp; O_ACCMODE) != O_RDONLY)) {</div><div class='del'>-		/*</div><div class='del'>-		 * clone a fid and add it to writeback_fid</div><div class='del'>-		 * we do it during open time instead of</div><div class='del'>-		 * page dirty time via write_begin/page_mkwrite</div><div class='del'>-		 * because we want write after unlink usecase</div><div class='del'>-		 * to work.</div><div class='del'>-		 */</div><div class='del'>-		inode_fid = v9fs_writeback_fid(dentry);</div><div class='del'>-		if (IS_ERR(inode_fid)) {</div><div class='del'>-			err = PTR_ERR(inode_fid);</div><div class='del'>-			mutex_unlock(&amp;v9inode-&gt;v_mutex);</div><div class='del'>-			goto error;</div><div class='del'>-		}</div><div class='del'>-		v9inode-&gt;writeback_fid = (void *) inode_fid;</div><div class='del'>-	}</div><div class='del'>-	mutex_unlock(&amp;v9inode-&gt;v_mutex);</div><div class='ctx'> 	err = finish_open(file, dentry, generic_file_open);</div><div class='del'>-	if (err)</div><div class='del'>-		goto error;</div><div class='add'>+	if (unlikely(err)) {</div><div class='add'>+		p9_fid_put(fid);</div><div class='add'>+		return err;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	file-&gt;private_data = fid;</div><div class='del'>-	if (v9ses-&gt;cache == CACHE_LOOSE || v9ses-&gt;cache == CACHE_FSCACHE)</div><div class='del'>-		v9fs_cache_inode_set_cookie(d_inode(dentry), file);</div><div class='del'>-	v9fs_open_fid_add(inode, fid);</div><div class='add'>+#ifdef CONFIG_9P_FSCACHE</div><div class='add'>+	if (v9ses-&gt;cache &amp; CACHE_FSCACHE)</div><div class='add'>+		fscache_use_cookie(v9fs_inode_cookie(v9inode),</div><div class='add'>+				   file-&gt;f_mode &amp; FMODE_WRITE);</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='del'>-	file-&gt;f_mode |= FMODE_CREATED;</div><div class='del'>-out:</div><div class='del'>-	dput(res);</div><div class='del'>-	return err;</div><div class='add'>+	v9fs_fid_add_modes(fid, v9ses-&gt;flags, v9ses-&gt;cache, file-&gt;f_flags);</div><div class='add'>+	v9fs_open_fid_add(inode, &amp;fid);</div><div class='ctx'> </div><div class='del'>-error:</div><div class='del'>-	if (fid)</div><div class='del'>-		p9_client_clunk(fid);</div><div class='del'>-	goto out;</div><div class='add'>+	file-&gt;f_mode |= FMODE_CREATED;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -909,7 +843,7 @@ int v9fs_vfs_rmdir(struct inode *i, struct dentry *d)</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * v9fs_vfs_rename - VFS hook to rename an inode</div><div class='del'>- * @mnt_userns: The user namespace of the mount</div><div class='add'>+ * @idmap: The idmap of the mount</div><div class='ctx'>  * @old_dir:  old dir inode</div><div class='ctx'>  * @old_dentry: old dentry</div><div class='ctx'>  * @new_dir: new dir inode</div><div class='hunk'>@@ -919,7 +853,7 @@ int v9fs_vfs_rmdir(struct inode *i, struct dentry *d)</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> int</div><div class='del'>-v9fs_vfs_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='add'>+v9fs_vfs_rename(struct mnt_idmap *idmap, struct inode *old_dir,</div><div class='ctx'> 		struct dentry *old_dentry, struct inode *new_dir,</div><div class='ctx'> 		struct dentry *new_dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='hunk'>@@ -927,16 +861,15 @@ v9fs_vfs_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> 	struct inode *old_inode;</div><div class='ctx'> 	struct inode *new_inode;</div><div class='ctx'> 	struct v9fs_session_info *v9ses;</div><div class='del'>-	struct p9_fid *oldfid, *dfid;</div><div class='del'>-	struct p9_fid *olddirfid;</div><div class='del'>-	struct p9_fid *newdirfid;</div><div class='add'>+	struct p9_fid *oldfid = NULL, *dfid = NULL;</div><div class='add'>+	struct p9_fid *olddirfid = NULL;</div><div class='add'>+	struct p9_fid *newdirfid = NULL;</div><div class='ctx'> 	struct p9_wstat wstat;</div><div class='ctx'> </div><div class='ctx'> 	if (flags)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	p9_debug(P9_DEBUG_VFS, "\n");</div><div class='del'>-	retval = 0;</div><div class='ctx'> 	old_inode = d_inode(old_dentry);</div><div class='ctx'> 	new_inode = d_inode(new_dentry);</div><div class='ctx'> 	v9ses = v9fs_inode2v9ses(old_inode);</div><div class='hunk'>@@ -946,21 +879,22 @@ v9fs_vfs_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> </div><div class='ctx'> 	dfid = v9fs_parent_fid(old_dentry);</div><div class='ctx'> 	olddirfid = clone_fid(dfid);</div><div class='del'>-	if (dfid &amp;&amp; !IS_ERR(dfid))</div><div class='del'>-		p9_client_clunk(dfid);</div><div class='add'>+	p9_fid_put(dfid);</div><div class='add'>+	dfid = NULL;</div><div class='ctx'> </div><div class='ctx'> 	if (IS_ERR(olddirfid)) {</div><div class='ctx'> 		retval = PTR_ERR(olddirfid);</div><div class='del'>-		goto done;</div><div class='add'>+		goto error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	dfid = v9fs_parent_fid(new_dentry);</div><div class='ctx'> 	newdirfid = clone_fid(dfid);</div><div class='del'>-	p9_client_clunk(dfid);</div><div class='add'>+	p9_fid_put(dfid);</div><div class='add'>+	dfid = NULL;</div><div class='ctx'> </div><div class='ctx'> 	if (IS_ERR(newdirfid)) {</div><div class='ctx'> 		retval = PTR_ERR(newdirfid);</div><div class='del'>-		goto clunk_olddir;</div><div class='add'>+		goto error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	down_write(&amp;v9ses-&gt;rename_sem);</div><div class='hunk'>@@ -971,7 +905,7 @@ v9fs_vfs_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> 			retval = p9_client_rename(oldfid, newdirfid,</div><div class='ctx'> 						  new_dentry-&gt;d_name.name);</div><div class='ctx'> 		if (retval != -EOPNOTSUPP)</div><div class='del'>-			goto clunk_newdir;</div><div class='add'>+			goto error_locked;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (old_dentry-&gt;d_parent != new_dentry-&gt;d_parent) {</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -980,14 +914,14 @@ v9fs_vfs_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> </div><div class='ctx'> 		p9_debug(P9_DEBUG_ERROR, "old dir and new dir are different\n");</div><div class='ctx'> 		retval = -EXDEV;</div><div class='del'>-		goto clunk_newdir;</div><div class='add'>+		goto error_locked;</div><div class='ctx'> 	}</div><div class='ctx'> 	v9fs_blank_wstat(&amp;wstat);</div><div class='ctx'> 	wstat.muid = v9ses-&gt;uname;</div><div class='ctx'> 	wstat.name = new_dentry-&gt;d_name.name;</div><div class='ctx'> 	retval = p9_client_wstat(oldfid, &amp;wstat);</div><div class='ctx'> </div><div class='del'>-clunk_newdir:</div><div class='add'>+error_locked:</div><div class='ctx'> 	if (!retval) {</div><div class='ctx'> 		if (new_inode) {</div><div class='ctx'> 			if (S_ISDIR(new_inode-&gt;i_mode))</div><div class='hunk'>@@ -1008,19 +942,17 @@ clunk_newdir:</div><div class='ctx'> 		d_move(old_dentry, new_dentry);</div><div class='ctx'> 	}</div><div class='ctx'> 	up_write(&amp;v9ses-&gt;rename_sem);</div><div class='del'>-	p9_client_clunk(newdirfid);</div><div class='ctx'> </div><div class='del'>-clunk_olddir:</div><div class='del'>-	p9_client_clunk(olddirfid);</div><div class='del'>-</div><div class='del'>-done:</div><div class='del'>-	p9_client_clunk(oldfid);</div><div class='add'>+error:</div><div class='add'>+	p9_fid_put(newdirfid);</div><div class='add'>+	p9_fid_put(olddirfid);</div><div class='add'>+	p9_fid_put(oldfid);</div><div class='ctx'> 	return retval;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * v9fs_vfs_getattr - retrieve file metadata</div><div class='del'>- * @mnt_userns: The user namespace of the mount</div><div class='add'>+ * @idmap: idmap of the mount</div><div class='ctx'>  * @path: Object to query</div><div class='ctx'>  * @stat: metadata structure to populate</div><div class='ctx'>  * @request_mask: Mask of STATX_xxx flags indicating the caller's interests</div><div class='hunk'>@@ -1029,31 +961,40 @@ done:</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-v9fs_vfs_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='add'>+v9fs_vfs_getattr(struct mnt_idmap *idmap, const struct path *path,</div><div class='ctx'> 		 struct kstat *stat, u32 request_mask, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dentry = path-&gt;dentry;</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	struct v9fs_session_info *v9ses;</div><div class='ctx'> 	struct p9_fid *fid;</div><div class='ctx'> 	struct p9_wstat *st;</div><div class='ctx'> </div><div class='ctx'> 	p9_debug(P9_DEBUG_VFS, "dentry: %p\n", dentry);</div><div class='ctx'> 	v9ses = v9fs_dentry2v9ses(dentry);</div><div class='del'>-	if (v9ses-&gt;cache == CACHE_LOOSE || v9ses-&gt;cache == CACHE_FSCACHE) {</div><div class='del'>-		generic_fillattr(&amp;init_user_ns, d_inode(dentry), stat);</div><div class='add'>+	if (v9ses-&gt;cache &amp; (CACHE_META|CACHE_LOOSE)) {</div><div class='add'>+		generic_fillattr(&amp;nop_mnt_idmap, request_mask, inode, stat);</div><div class='ctx'> 		return 0;</div><div class='add'>+	} else if (v9ses-&gt;cache &amp; CACHE_WRITEBACK) {</div><div class='add'>+		if (S_ISREG(inode-&gt;i_mode)) {</div><div class='add'>+			int retval = filemap_fdatawrite(inode-&gt;i_mapping);</div><div class='add'>+</div><div class='add'>+			if (retval)</div><div class='add'>+				p9_debug(P9_DEBUG_ERROR,</div><div class='add'>+				    "flushing writeback during getattr returned %d\n", retval);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> 	fid = v9fs_fid_lookup(dentry);</div><div class='ctx'> 	if (IS_ERR(fid))</div><div class='ctx'> 		return PTR_ERR(fid);</div><div class='ctx'> </div><div class='ctx'> 	st = p9_client_stat(fid);</div><div class='del'>-	p9_client_clunk(fid);</div><div class='add'>+	p9_fid_put(fid);</div><div class='ctx'> 	if (IS_ERR(st))</div><div class='ctx'> 		return PTR_ERR(st);</div><div class='ctx'> </div><div class='ctx'> 	v9fs_stat2inode(st, d_inode(dentry), dentry-&gt;d_sb, 0);</div><div class='del'>-	generic_fillattr(&amp;init_user_ns, d_inode(dentry), stat);</div><div class='add'>+	generic_fillattr(&amp;nop_mnt_idmap, request_mask, d_inode(dentry), stat);</div><div class='ctx'> </div><div class='ctx'> 	p9stat_free(st);</div><div class='ctx'> 	kfree(st);</div><div class='hunk'>@@ -1062,26 +1003,26 @@ v9fs_vfs_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * v9fs_vfs_setattr - set file metadata</div><div class='del'>- * @mnt_userns: The user namespace of the mount</div><div class='add'>+ * @idmap: idmap of the mount</div><div class='ctx'>  * @dentry: file whose metadata to set</div><div class='ctx'>  * @iattr: metadata assignment structure</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static int v9fs_vfs_setattr(struct user_namespace *mnt_userns,</div><div class='add'>+static int v9fs_vfs_setattr(struct mnt_idmap *idmap,</div><div class='ctx'> 			    struct dentry *dentry, struct iattr *iattr)</div><div class='ctx'> {</div><div class='ctx'> 	int retval, use_dentry = 0;</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	struct v9fs_session_info *v9ses;</div><div class='ctx'> 	struct p9_fid *fid = NULL;</div><div class='ctx'> 	struct p9_wstat wstat;</div><div class='ctx'> </div><div class='ctx'> 	p9_debug(P9_DEBUG_VFS, "\n");</div><div class='del'>-	retval = setattr_prepare(&amp;init_user_ns, dentry, iattr);</div><div class='add'>+	retval = setattr_prepare(&amp;nop_mnt_idmap, dentry, iattr);</div><div class='ctx'> 	if (retval)</div><div class='ctx'> 		return retval;</div><div class='ctx'> </div><div class='del'>-	retval = -EPERM;</div><div class='ctx'> 	v9ses = v9fs_dentry2v9ses(dentry);</div><div class='ctx'> 	if (iattr-&gt;ia_valid &amp; ATTR_FILE) {</div><div class='ctx'> 		fid = iattr-&gt;ia_file-&gt;private_data;</div><div class='hunk'>@@ -1116,25 +1057,39 @@ static int v9fs_vfs_setattr(struct user_namespace *mnt_userns,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Write all dirty data */</div><div class='del'>-	if (d_is_reg(dentry))</div><div class='del'>-		filemap_write_and_wait(d_inode(dentry)-&gt;i_mapping);</div><div class='add'>+	if (d_is_reg(dentry)) {</div><div class='add'>+		retval = filemap_fdatawrite(inode-&gt;i_mapping);</div><div class='add'>+		if (retval)</div><div class='add'>+			p9_debug(P9_DEBUG_ERROR,</div><div class='add'>+			    "flushing writeback during setattr returned %d\n", retval);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	retval = p9_client_wstat(fid, &amp;wstat);</div><div class='ctx'> </div><div class='ctx'> 	if (use_dentry)</div><div class='del'>-		p9_client_clunk(fid);</div><div class='add'>+		p9_fid_put(fid);</div><div class='ctx'> </div><div class='ctx'> 	if (retval &lt; 0)</div><div class='ctx'> 		return retval;</div><div class='ctx'> </div><div class='ctx'> 	if ((iattr-&gt;ia_valid &amp; ATTR_SIZE) &amp;&amp;</div><div class='del'>-	    iattr-&gt;ia_size != i_size_read(d_inode(dentry)))</div><div class='del'>-		truncate_setsize(d_inode(dentry), iattr-&gt;ia_size);</div><div class='add'>+		 iattr-&gt;ia_size != i_size_read(inode)) {</div><div class='add'>+		truncate_setsize(inode, iattr-&gt;ia_size);</div><div class='add'>+		netfs_resize_file(netfs_inode(inode), iattr-&gt;ia_size, true);</div><div class='ctx'> </div><div class='del'>-	v9fs_invalidate_inode_attr(d_inode(dentry));</div><div class='add'>+#ifdef CONFIG_9P_FSCACHE</div><div class='add'>+		if (v9ses-&gt;cache &amp; CACHE_FSCACHE) {</div><div class='add'>+			struct v9fs_inode *v9inode = V9FS_I(inode);</div><div class='ctx'> </div><div class='del'>-	setattr_copy(&amp;init_user_ns, d_inode(dentry), iattr);</div><div class='del'>-	mark_inode_dirty(d_inode(dentry));</div><div class='add'>+			fscache_resize_cookie(v9fs_inode_cookie(v9inode), iattr-&gt;ia_size);</div><div class='add'>+		}</div><div class='add'>+#endif</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	v9fs_invalidate_inode_attr(inode);</div><div class='add'>+</div><div class='add'>+	setattr_copy(&amp;nop_mnt_idmap, inode, iattr);</div><div class='add'>+	mark_inode_dirty(inode);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1155,11 +1110,9 @@ v9fs_stat2inode(struct p9_wstat *stat, struct inode *inode,</div><div class='ctx'> 	struct v9fs_session_info *v9ses = sb-&gt;s_fs_info;</div><div class='ctx'> 	struct v9fs_inode *v9inode = V9FS_I(inode);</div><div class='ctx'> </div><div class='del'>-	set_nlink(inode, 1);</div><div class='del'>-</div><div class='del'>-	inode-&gt;i_atime.tv_sec = stat-&gt;atime;</div><div class='del'>-	inode-&gt;i_mtime.tv_sec = stat-&gt;mtime;</div><div class='del'>-	inode-&gt;i_ctime.tv_sec = stat-&gt;mtime;</div><div class='add'>+	inode_set_atime(inode, stat-&gt;atime, 0);</div><div class='add'>+	inode_set_mtime(inode, stat-&gt;mtime, 0);</div><div class='add'>+	inode_set_ctime(inode, stat-&gt;mtime, 0);</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_uid = v9ses-&gt;dfltuid;</div><div class='ctx'> 	inode-&gt;i_gid = v9ses-&gt;dfltgid;</div><div class='hunk'>@@ -1188,6 +1141,7 @@ v9fs_stat2inode(struct p9_wstat *stat, struct inode *inode,</div><div class='ctx'> 	mode |= inode-&gt;i_mode &amp; ~S_IALLUGO;</div><div class='ctx'> 	inode-&gt;i_mode = mode;</div><div class='ctx'> </div><div class='add'>+	v9inode-&gt;netfs.remote_i_size = stat-&gt;length;</div><div class='ctx'> 	if (!(flags &amp; V9FS_STAT2INODE_KEEP_ISIZE))</div><div class='ctx'> 		v9fs_i_size_write(inode, stat-&gt;length);</div><div class='ctx'> 	/* not real number of blocks, but 512 byte ones ... */</div><div class='hunk'>@@ -1196,26 +1150,6 @@ v9fs_stat2inode(struct p9_wstat *stat, struct inode *inode,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * v9fs_qid2ino - convert qid into inode number</div><div class='del'>- * @qid: qid to hash</div><div class='del'>- *</div><div class='del'>- * BUG: potential for inode number collisions?</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-ino_t v9fs_qid2ino(struct p9_qid *qid)</div><div class='del'>-{</div><div class='del'>-	u64 path = qid-&gt;path + 2;</div><div class='del'>-	ino_t i = 0;</div><div class='del'>-</div><div class='del'>-	if (sizeof(ino_t) == sizeof(path))</div><div class='del'>-		memcpy(&amp;i, &amp;path, sizeof(ino_t));</div><div class='del'>-	else</div><div class='del'>-		i = (ino_t) (path ^ (path &gt;&gt; 32));</div><div class='del'>-</div><div class='del'>-	return i;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='ctx'>  * v9fs_vfs_get_link - follow a symlink path</div><div class='ctx'>  * @dentry: dentry for symlink</div><div class='ctx'>  * @inode: inode for symlink</div><div class='hunk'>@@ -1235,17 +1169,17 @@ static const char *v9fs_vfs_get_link(struct dentry *dentry,</div><div class='ctx'> 		return ERR_PTR(-ECHILD);</div><div class='ctx'> </div><div class='ctx'> 	v9ses = v9fs_dentry2v9ses(dentry);</div><div class='del'>-	fid = v9fs_fid_lookup(dentry);</div><div class='add'>+	if (!v9fs_proto_dotu(v9ses))</div><div class='add'>+		return ERR_PTR(-EBADF);</div><div class='add'>+</div><div class='ctx'> 	p9_debug(P9_DEBUG_VFS, "%pd\n", dentry);</div><div class='add'>+	fid = v9fs_fid_lookup(dentry);</div><div class='ctx'> </div><div class='ctx'> 	if (IS_ERR(fid))</div><div class='ctx'> 		return ERR_CAST(fid);</div><div class='ctx'> </div><div class='del'>-	if (!v9fs_proto_dotu(v9ses))</div><div class='del'>-		return ERR_PTR(-EBADF);</div><div class='del'>-</div><div class='ctx'> 	st = p9_client_stat(fid);</div><div class='del'>-	p9_client_clunk(fid);</div><div class='add'>+	p9_fid_put(fid);</div><div class='ctx'> 	if (IS_ERR(st))</div><div class='ctx'> 		return ERR_CAST(st);</div><div class='ctx'> </div><div class='hunk'>@@ -1292,13 +1226,13 @@ static int v9fs_vfs_mkspecial(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 		return PTR_ERR(fid);</div><div class='ctx'> </div><div class='ctx'> 	v9fs_invalidate_inode_attr(dir);</div><div class='del'>-	p9_client_clunk(fid);</div><div class='add'>+	p9_fid_put(fid);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * v9fs_vfs_symlink - helper function to create symlinks</div><div class='del'>- * @mnt_userns: The user namespace of the mount</div><div class='add'>+ * @idmap: idmap of the mount</div><div class='ctx'>  * @dir: directory inode containing symlink</div><div class='ctx'>  * @dentry: dentry for symlink</div><div class='ctx'>  * @symname: symlink data</div><div class='hunk'>@@ -1308,7 +1242,7 @@ static int v9fs_vfs_mkspecial(struct inode *dir, struct dentry *dentry,</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-v9fs_vfs_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+v9fs_vfs_symlink(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		 struct dentry *dentry, const char *symname)</div><div class='ctx'> {</div><div class='ctx'> 	p9_debug(P9_DEBUG_VFS, " %lu,%pd,%s\n",</div><div class='hunk'>@@ -1348,13 +1282,13 @@ v9fs_vfs_link(struct dentry *old_dentry, struct inode *dir,</div><div class='ctx'> 		v9fs_refresh_inode(oldfid, d_inode(old_dentry));</div><div class='ctx'> 		v9fs_invalidate_inode_attr(dir);</div><div class='ctx'> 	}</div><div class='del'>-	p9_client_clunk(oldfid);</div><div class='add'>+	p9_fid_put(oldfid);</div><div class='ctx'> 	return retval;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * v9fs_vfs_mknod - create a special file</div><div class='del'>- * @mnt_userns: The user namespace of the mount</div><div class='add'>+ * @idmap: idmap of the mount</div><div class='ctx'>  * @dir: inode destination for new link</div><div class='ctx'>  * @dentry: dentry for file</div><div class='ctx'>  * @mode: mode for creation</div><div class='hunk'>@@ -1363,7 +1297,7 @@ v9fs_vfs_link(struct dentry *old_dentry, struct inode *dir,</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-v9fs_vfs_mknod(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+v9fs_vfs_mknod(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 	       struct dentry *dentry, umode_t mode, dev_t rdev)</div><div class='ctx'> {</div><div class='ctx'> 	struct v9fs_session_info *v9ses = v9fs_inode2v9ses(dir);</div><div class='hunk'>@@ -1412,7 +1346,7 @@ int v9fs_refresh_inode(struct p9_fid *fid, struct inode *inode)</div><div class='ctx'> 	 * We don't want to refresh inode-&gt;i_size,</div><div class='ctx'> 	 * because we may have cached data</div><div class='ctx'> 	 */</div><div class='del'>-	flags = (v9ses-&gt;cache == CACHE_LOOSE || v9ses-&gt;cache == CACHE_FSCACHE) ?</div><div class='add'>+	flags = (v9ses-&gt;cache &amp; CACHE_LOOSE) ?</div><div class='ctx'> 		V9FS_STAT2INODE_KEEP_ISIZE : 0;</div><div class='ctx'> 	v9fs_stat2inode(st, inode, inode-&gt;i_sb, flags);</div><div class='ctx'> out:</div><div class='hunk'>@@ -1459,4 +1393,3 @@ static const struct inode_operations v9fs_symlink_inode_operations = {</div><div class='ctx'> 	.getattr = v9fs_vfs_getattr,</div><div class='ctx'> 	.setattr = v9fs_vfs_setattr,</div><div class='ctx'> };</div><div class='del'>-</div><div class='head'>diff --git a/fs/9p/vfs_inode_dotl.c b/fs/9p/vfs_inode_dotl.c<br/>index 7dee89ba32e7..643e759eacb2 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/9p/vfs_inode_dotl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/9p/vfs_inode_dotl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/9p/vfs_inode_dotl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/9p/vfs_inode_dotl.c</a></div><div class='hunk'>@@ -13,9 +13,7 @@</div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='ctx'> #include &lt;linux/stat.h&gt;</div><div class='ctx'> #include &lt;linux/string.h&gt;</div><div class='del'>-#include &lt;linux/inet.h&gt;</div><div class='ctx'> #include &lt;linux/namei.h&gt;</div><div class='del'>-#include &lt;linux/idr.h&gt;</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/xattr.h&gt;</div><div class='hunk'>@@ -31,7 +29,7 @@</div><div class='ctx'> #include "acl.h"</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-v9fs_vfs_mknod_dotl(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+v9fs_vfs_mknod_dotl(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		    struct dentry *dentry, umode_t omode, dev_t rdev);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -102,7 +100,6 @@ static struct inode *v9fs_qid_iget_dotl(struct super_block *sb,</div><div class='ctx'> 					int new)</div><div class='ctx'> {</div><div class='ctx'> 	int retval;</div><div class='del'>-	unsigned long i_ino;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct v9fs_session_info *v9ses = sb-&gt;s_fs_info;</div><div class='ctx'> 	int (*test)(struct inode *inode, void *data);</div><div class='hunk'>@@ -112,24 +109,24 @@ static struct inode *v9fs_qid_iget_dotl(struct super_block *sb,</div><div class='ctx'> 	else</div><div class='ctx'> 		test = v9fs_test_inode_dotl;</div><div class='ctx'> </div><div class='del'>-	i_ino = v9fs_qid2ino(qid);</div><div class='del'>-	inode = iget5_locked(sb, i_ino, test, v9fs_set_inode_dotl, st);</div><div class='add'>+	inode = iget5_locked(sb, QID2INO(qid), test, v9fs_set_inode_dotl, st);</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='del'>-	if (!(inode-&gt;i_state &amp; I_NEW))</div><div class='add'>+	if (!(inode_state_read_once(inode) &amp; I_NEW))</div><div class='ctx'> 		return inode;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * initialize the inode with the stat info</div><div class='ctx'> 	 * FIXME!! we may need support for stale inodes</div><div class='ctx'> 	 * later.</div><div class='ctx'> 	 */</div><div class='del'>-	inode-&gt;i_ino = i_ino;</div><div class='add'>+	inode-&gt;i_ino = QID2INO(qid);</div><div class='ctx'> 	retval = v9fs_init_inode(v9ses, inode,</div><div class='ctx'> 				 st-&gt;st_mode, new_decode_dev(st-&gt;st_rdev));</div><div class='ctx'> 	if (retval)</div><div class='ctx'> 		goto error;</div><div class='ctx'> </div><div class='ctx'> 	v9fs_stat2inode_dotl(st, inode, 0);</div><div class='add'>+	v9fs_set_netfs_context(inode);</div><div class='ctx'> 	v9fs_cache_inode_get_cookie(inode);</div><div class='ctx'> 	retval = v9fs_get_acl(inode, fid);</div><div class='ctx'> 	if (retval)</div><div class='hunk'>@@ -212,7 +209,7 @@ int v9fs_open_to_dotl_flags(int flags)</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * v9fs_vfs_create_dotl - VFS hook to create files for 9P2000.L protocol.</div><div class='del'>- * @mnt_userns: The user namespace of the mount</div><div class='add'>+ * @idmap: The user namespace of the mount</div><div class='ctx'>  * @dir: directory inode that is being created</div><div class='ctx'>  * @dentry:  dentry that is being deleted</div><div class='ctx'>  * @omode: create permissions</div><div class='hunk'>@@ -220,10 +217,10 @@ int v9fs_open_to_dotl_flags(int flags)</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='ctx'> static int</div><div class='del'>-v9fs_vfs_create_dotl(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+v9fs_vfs_create_dotl(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		     struct dentry *dentry, umode_t omode, bool excl)</div><div class='ctx'> {</div><div class='del'>-	return v9fs_vfs_mknod_dotl(mnt_userns, dir, dentry, omode, 0);</div><div class='add'>+	return v9fs_vfs_mknod_dotl(idmap, dir, dentry, omode, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='hunk'>@@ -233,28 +230,24 @@ v9fs_vfs_atomic_open_dotl(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> 	kgid_t gid;</div><div class='ctx'> 	umode_t mode;</div><div class='add'>+	int p9_omode = v9fs_open_to_dotl_flags(flags);</div><div class='ctx'> 	const unsigned char *name = NULL;</div><div class='ctx'> 	struct p9_qid qid;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct p9_fid *fid = NULL;</div><div class='del'>-	struct v9fs_inode *v9inode;</div><div class='del'>-	struct p9_fid *dfid, *ofid, *inode_fid;</div><div class='add'>+	struct p9_fid *dfid = NULL, *ofid = NULL;</div><div class='ctx'> 	struct v9fs_session_info *v9ses;</div><div class='ctx'> 	struct posix_acl *pacl = NULL, *dacl = NULL;</div><div class='del'>-	struct dentry *res = NULL;</div><div class='ctx'> </div><div class='ctx'> 	if (d_in_lookup(dentry)) {</div><div class='del'>-		res = v9fs_vfs_lookup(dir, dentry, 0);</div><div class='del'>-		if (IS_ERR(res))</div><div class='del'>-			return PTR_ERR(res);</div><div class='del'>-</div><div class='del'>-		if (res)</div><div class='del'>-			dentry = res;</div><div class='add'>+		struct dentry *res = v9fs_vfs_lookup(dir, dentry, 0);</div><div class='add'>+		if (res || d_really_is_positive(dentry))</div><div class='add'>+			return	finish_no_open(file, res);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Only creates */</div><div class='del'>-	if (!(flags &amp; O_CREAT) || d_really_is_positive(dentry))</div><div class='del'>-		return	finish_no_open(file, res);</div><div class='add'>+	if (!(flags &amp; O_CREAT))</div><div class='add'>+		return	finish_no_open(file, NULL);</div><div class='ctx'> </div><div class='ctx'> 	v9ses = v9fs_inode2v9ses(dir);</div><div class='ctx'> </div><div class='hunk'>@@ -283,96 +276,78 @@ v9fs_vfs_atomic_open_dotl(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	/* Update mode based on ACL value */</div><div class='ctx'> 	err = v9fs_acl_mode(dir, &amp;mode, &amp;dacl, &amp;pacl);</div><div class='ctx'> 	if (err) {</div><div class='del'>-		p9_debug(P9_DEBUG_VFS, "Failed to get acl values in creat %d\n",</div><div class='add'>+		p9_debug(P9_DEBUG_VFS, "Failed to get acl values in create %d\n",</div><div class='ctx'> 			 err);</div><div class='del'>-		goto error;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if ((v9ses-&gt;cache &amp; CACHE_WRITEBACK) &amp;&amp; (p9_omode &amp; P9_OWRITE)) {</div><div class='add'>+		p9_omode = (p9_omode &amp; ~(P9_OWRITE | P9_DOTL_APPEND)) | P9_ORDWR;</div><div class='add'>+		p9_debug(P9_DEBUG_CACHE,</div><div class='add'>+			"write-only file with writeback enabled, creating w/ O_RDWR\n");</div><div class='ctx'> 	}</div><div class='del'>-	err = p9_client_create_dotl(ofid, name, v9fs_open_to_dotl_flags(flags),</div><div class='del'>-				    mode, gid, &amp;qid);</div><div class='add'>+	err = p9_client_create_dotl(ofid, name, p9_omode, mode, gid, &amp;qid);</div><div class='ctx'> 	if (err &lt; 0) {</div><div class='del'>-		p9_debug(P9_DEBUG_VFS, "p9_client_open_dotl failed in creat %d\n",</div><div class='add'>+		p9_debug(P9_DEBUG_VFS, "p9_client_open_dotl failed in create %d\n",</div><div class='ctx'> 			 err);</div><div class='del'>-		goto error;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	v9fs_invalidate_inode_attr(dir);</div><div class='ctx'> </div><div class='ctx'> 	/* instantiate inode and assign the unopened fid to the dentry */</div><div class='ctx'> 	fid = p9_client_walk(dfid, 1, &amp;name, 1);</div><div class='del'>-	p9_client_clunk(dfid);</div><div class='ctx'> 	if (IS_ERR(fid)) {</div><div class='ctx'> 		err = PTR_ERR(fid);</div><div class='ctx'> 		p9_debug(P9_DEBUG_VFS, "p9_client_walk failed %d\n", err);</div><div class='del'>-		fid = NULL;</div><div class='del'>-		goto error;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	inode = v9fs_get_new_inode_from_fid(v9ses, fid, dir-&gt;i_sb);</div><div class='ctx'> 	if (IS_ERR(inode)) {</div><div class='ctx'> 		err = PTR_ERR(inode);</div><div class='ctx'> 		p9_debug(P9_DEBUG_VFS, "inode creation failed %d\n", err);</div><div class='del'>-		goto error;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	/* Now set the ACL based on the default value */</div><div class='ctx'> 	v9fs_set_create_acl(inode, fid, dacl, pacl);</div><div class='ctx'> </div><div class='del'>-	v9fs_fid_add(dentry, fid);</div><div class='add'>+	v9fs_fid_add(dentry, &amp;fid);</div><div class='ctx'> 	d_instantiate(dentry, inode);</div><div class='ctx'> </div><div class='del'>-	v9inode = V9FS_I(inode);</div><div class='del'>-	mutex_lock(&amp;v9inode-&gt;v_mutex);</div><div class='del'>-	if ((v9ses-&gt;cache == CACHE_LOOSE || v9ses-&gt;cache == CACHE_FSCACHE) &amp;&amp;</div><div class='del'>-	    !v9inode-&gt;writeback_fid &amp;&amp;</div><div class='del'>-	    ((flags &amp; O_ACCMODE) != O_RDONLY)) {</div><div class='del'>-		/*</div><div class='del'>-		 * clone a fid and add it to writeback_fid</div><div class='del'>-		 * we do it during open time instead of</div><div class='del'>-		 * page dirty time via write_begin/page_mkwrite</div><div class='del'>-		 * because we want write after unlink usecase</div><div class='del'>-		 * to work.</div><div class='del'>-		 */</div><div class='del'>-		inode_fid = v9fs_writeback_fid(dentry);</div><div class='del'>-		if (IS_ERR(inode_fid)) {</div><div class='del'>-			err = PTR_ERR(inode_fid);</div><div class='del'>-			mutex_unlock(&amp;v9inode-&gt;v_mutex);</div><div class='del'>-			goto err_clunk_old_fid;</div><div class='del'>-		}</div><div class='del'>-		v9inode-&gt;writeback_fid = (void *) inode_fid;</div><div class='del'>-	}</div><div class='del'>-	mutex_unlock(&amp;v9inode-&gt;v_mutex);</div><div class='ctx'> 	/* Since we are opening a file, assign the open fid to the file */</div><div class='ctx'> 	err = finish_open(file, dentry, generic_file_open);</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto err_clunk_old_fid;</div><div class='add'>+		goto out;</div><div class='ctx'> 	file-&gt;private_data = ofid;</div><div class='del'>-	if (v9ses-&gt;cache == CACHE_LOOSE || v9ses-&gt;cache == CACHE_FSCACHE)</div><div class='del'>-		v9fs_cache_inode_set_cookie(inode, file);</div><div class='del'>-	v9fs_open_fid_add(inode, ofid);</div><div class='add'>+#ifdef CONFIG_9P_FSCACHE</div><div class='add'>+	if (v9ses-&gt;cache &amp; CACHE_FSCACHE) {</div><div class='add'>+		struct v9fs_inode *v9inode = V9FS_I(inode);</div><div class='add'>+		fscache_use_cookie(v9fs_inode_cookie(v9inode),</div><div class='add'>+				   file-&gt;f_mode &amp; FMODE_WRITE);</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='add'>+	v9fs_fid_add_modes(ofid, v9ses-&gt;flags, v9ses-&gt;cache, flags);</div><div class='add'>+	v9fs_open_fid_add(inode, &amp;ofid);</div><div class='ctx'> 	file-&gt;f_mode |= FMODE_CREATED;</div><div class='ctx'> out:</div><div class='add'>+	p9_fid_put(dfid);</div><div class='add'>+	p9_fid_put(ofid);</div><div class='add'>+	p9_fid_put(fid);</div><div class='ctx'> 	v9fs_put_acl(dacl, pacl);</div><div class='del'>-	dput(res);</div><div class='ctx'> 	return err;</div><div class='del'>-</div><div class='del'>-error:</div><div class='del'>-	if (fid)</div><div class='del'>-		p9_client_clunk(fid);</div><div class='del'>-err_clunk_old_fid:</div><div class='del'>-	if (ofid)</div><div class='del'>-		p9_client_clunk(ofid);</div><div class='del'>-	goto out;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * v9fs_vfs_mkdir_dotl - VFS mkdir hook to create a directory</div><div class='del'>- * @mnt_userns: The user namespace of the mount</div><div class='add'>+ * @idmap: The idmap of the mount</div><div class='ctx'>  * @dir:  inode that is being unlinked</div><div class='ctx'>  * @dentry: dentry that is being unlinked</div><div class='ctx'>  * @omode: mode for new directory</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static int v9fs_vfs_mkdir_dotl(struct user_namespace *mnt_userns,</div><div class='del'>-			       struct inode *dir, struct dentry *dentry,</div><div class='del'>-			       umode_t omode)</div><div class='add'>+static struct dentry *v9fs_vfs_mkdir_dotl(struct mnt_idmap *idmap,</div><div class='add'>+					  struct inode *dir, struct dentry *dentry,</div><div class='add'>+					  umode_t omode)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='ctx'> 	struct v9fs_session_info *v9ses;</div><div class='hunk'>@@ -385,7 +360,6 @@ static int v9fs_vfs_mkdir_dotl(struct user_namespace *mnt_userns,</div><div class='ctx'> 	struct posix_acl *dacl = NULL, *pacl = NULL;</div><div class='ctx'> </div><div class='ctx'> 	p9_debug(P9_DEBUG_VFS, "name %pd\n", dentry);</div><div class='del'>-	err = 0;</div><div class='ctx'> 	v9ses = v9fs_inode2v9ses(dir);</div><div class='ctx'> </div><div class='ctx'> 	omode |= S_IFDIR;</div><div class='hunk'>@@ -396,7 +370,6 @@ static int v9fs_vfs_mkdir_dotl(struct user_namespace *mnt_userns,</div><div class='ctx'> 	if (IS_ERR(dfid)) {</div><div class='ctx'> 		err = PTR_ERR(dfid);</div><div class='ctx'> 		p9_debug(P9_DEBUG_VFS, "fid lookup failed %d\n", err);</div><div class='del'>-		dfid = NULL;</div><div class='ctx'> 		goto error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -418,63 +391,54 @@ static int v9fs_vfs_mkdir_dotl(struct user_namespace *mnt_userns,</div><div class='ctx'> 		err = PTR_ERR(fid);</div><div class='ctx'> 		p9_debug(P9_DEBUG_VFS, "p9_client_walk failed %d\n",</div><div class='ctx'> 			 err);</div><div class='del'>-		fid = NULL;</div><div class='ctx'> 		goto error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* instantiate inode and assign the unopened fid to the dentry */</div><div class='del'>-	if (v9ses-&gt;cache == CACHE_LOOSE || v9ses-&gt;cache == CACHE_FSCACHE) {</div><div class='del'>-		inode = v9fs_get_new_inode_from_fid(v9ses, fid, dir-&gt;i_sb);</div><div class='del'>-		if (IS_ERR(inode)) {</div><div class='del'>-			err = PTR_ERR(inode);</div><div class='del'>-			p9_debug(P9_DEBUG_VFS, "inode creation failed %d\n",</div><div class='del'>-				 err);</div><div class='del'>-			goto error;</div><div class='del'>-		}</div><div class='del'>-		v9fs_fid_add(dentry, fid);</div><div class='del'>-		v9fs_set_create_acl(inode, fid, dacl, pacl);</div><div class='del'>-		d_instantiate(dentry, inode);</div><div class='del'>-		fid = NULL;</div><div class='del'>-		err = 0;</div><div class='del'>-	} else {</div><div class='del'>-		/*</div><div class='del'>-		 * Not in cached mode. No need to populate</div><div class='del'>-		 * inode with stat. We need to get an inode</div><div class='del'>-		 * so that we can set the acl with dentry</div><div class='del'>-		 */</div><div class='del'>-		inode = v9fs_get_inode(dir-&gt;i_sb, mode, 0);</div><div class='del'>-		if (IS_ERR(inode)) {</div><div class='del'>-			err = PTR_ERR(inode);</div><div class='del'>-			goto error;</div><div class='del'>-		}</div><div class='del'>-		v9fs_set_create_acl(inode, fid, dacl, pacl);</div><div class='del'>-		d_instantiate(dentry, inode);</div><div class='add'>+	inode = v9fs_get_new_inode_from_fid(v9ses, fid, dir-&gt;i_sb);</div><div class='add'>+	if (IS_ERR(inode)) {</div><div class='add'>+		err = PTR_ERR(inode);</div><div class='add'>+		p9_debug(P9_DEBUG_VFS, "inode creation failed %d\n",</div><div class='add'>+			 err);</div><div class='add'>+		goto error;</div><div class='ctx'> 	}</div><div class='add'>+	v9fs_set_create_acl(inode, fid, dacl, pacl);</div><div class='add'>+	v9fs_fid_add(dentry, &amp;fid);</div><div class='add'>+	d_instantiate(dentry, inode);</div><div class='add'>+	err = 0;</div><div class='ctx'> 	inc_nlink(dir);</div><div class='ctx'> 	v9fs_invalidate_inode_attr(dir);</div><div class='ctx'> error:</div><div class='del'>-	if (fid)</div><div class='del'>-		p9_client_clunk(fid);</div><div class='add'>+	p9_fid_put(fid);</div><div class='ctx'> 	v9fs_put_acl(dacl, pacl);</div><div class='del'>-	p9_client_clunk(dfid);</div><div class='del'>-	return err;</div><div class='add'>+	p9_fid_put(dfid);</div><div class='add'>+	return ERR_PTR(err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-v9fs_vfs_getattr_dotl(struct user_namespace *mnt_userns,</div><div class='add'>+v9fs_vfs_getattr_dotl(struct mnt_idmap *idmap,</div><div class='ctx'> 		      const struct path *path, struct kstat *stat,</div><div class='ctx'> 		      u32 request_mask, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dentry = path-&gt;dentry;</div><div class='ctx'> 	struct v9fs_session_info *v9ses;</div><div class='ctx'> 	struct p9_fid *fid;</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	struct p9_stat_dotl *st;</div><div class='ctx'> </div><div class='ctx'> 	p9_debug(P9_DEBUG_VFS, "dentry: %p\n", dentry);</div><div class='ctx'> 	v9ses = v9fs_dentry2v9ses(dentry);</div><div class='del'>-	if (v9ses-&gt;cache == CACHE_LOOSE || v9ses-&gt;cache == CACHE_FSCACHE) {</div><div class='del'>-		generic_fillattr(&amp;init_user_ns, d_inode(dentry), stat);</div><div class='add'>+	if (v9ses-&gt;cache &amp; (CACHE_META|CACHE_LOOSE)) {</div><div class='add'>+		generic_fillattr(&amp;nop_mnt_idmap, request_mask, inode, stat);</div><div class='ctx'> 		return 0;</div><div class='add'>+	} else if (v9ses-&gt;cache) {</div><div class='add'>+		if (S_ISREG(inode-&gt;i_mode)) {</div><div class='add'>+			int retval = filemap_fdatawrite(inode-&gt;i_mapping);</div><div class='add'>+</div><div class='add'>+			if (retval)</div><div class='add'>+				p9_debug(P9_DEBUG_ERROR,</div><div class='add'>+				    "flushing writeback during getattr returned %d\n", retval);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> 	fid = v9fs_fid_lookup(dentry);</div><div class='ctx'> 	if (IS_ERR(fid))</div><div class='hunk'>@@ -485,12 +449,12 @@ v9fs_vfs_getattr_dotl(struct user_namespace *mnt_userns,</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='ctx'> 	st = p9_client_getattr_dotl(fid, P9_STATS_ALL);</div><div class='del'>-	p9_client_clunk(fid);</div><div class='add'>+	p9_fid_put(fid);</div><div class='ctx'> 	if (IS_ERR(st))</div><div class='ctx'> 		return PTR_ERR(st);</div><div class='ctx'> </div><div class='ctx'> 	v9fs_stat2inode_dotl(st, d_inode(dentry), 0);</div><div class='del'>-	generic_fillattr(&amp;init_user_ns, d_inode(dentry), stat);</div><div class='add'>+	generic_fillattr(&amp;nop_mnt_idmap, request_mask, d_inode(dentry), stat);</div><div class='ctx'> 	/* Change block size to what the server returned */</div><div class='ctx'> 	stat-&gt;blksize = st-&gt;st_blksize;</div><div class='ctx'> </div><div class='hunk'>@@ -540,35 +504,49 @@ static int v9fs_mapped_iattr_valid(int iattr_valid)</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * v9fs_vfs_setattr_dotl - set file metadata</div><div class='del'>- * @mnt_userns: The user namespace of the mount</div><div class='add'>+ * @idmap: idmap of the mount</div><div class='ctx'>  * @dentry: file whose metadata to set</div><div class='ctx'>  * @iattr: metadata assignment structure</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-int v9fs_vfs_setattr_dotl(struct user_namespace *mnt_userns,</div><div class='add'>+int v9fs_vfs_setattr_dotl(struct mnt_idmap *idmap,</div><div class='ctx'> 			  struct dentry *dentry, struct iattr *iattr)</div><div class='ctx'> {</div><div class='ctx'> 	int retval, use_dentry = 0;</div><div class='del'>-	struct p9_fid *fid = NULL;</div><div class='del'>-	struct p9_iattr_dotl p9attr;</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='add'>+	struct v9fs_session_info __maybe_unused *v9ses;</div><div class='add'>+	struct p9_fid *fid = NULL;</div><div class='add'>+	struct p9_iattr_dotl p9attr = {</div><div class='add'>+		.uid = INVALID_UID,</div><div class='add'>+		.gid = INVALID_GID,</div><div class='add'>+	};</div><div class='ctx'> </div><div class='ctx'> 	p9_debug(P9_DEBUG_VFS, "\n");</div><div class='ctx'> </div><div class='del'>-	retval = setattr_prepare(&amp;init_user_ns, dentry, iattr);</div><div class='add'>+	retval = setattr_prepare(&amp;nop_mnt_idmap, dentry, iattr);</div><div class='ctx'> 	if (retval)</div><div class='ctx'> 		return retval;</div><div class='ctx'> </div><div class='add'>+	v9ses = v9fs_dentry2v9ses(dentry);</div><div class='add'>+</div><div class='ctx'> 	p9attr.valid = v9fs_mapped_iattr_valid(iattr-&gt;ia_valid);</div><div class='del'>-	p9attr.mode = iattr-&gt;ia_mode;</div><div class='del'>-	p9attr.uid = iattr-&gt;ia_uid;</div><div class='del'>-	p9attr.gid = iattr-&gt;ia_gid;</div><div class='del'>-	p9attr.size = iattr-&gt;ia_size;</div><div class='del'>-	p9attr.atime_sec = iattr-&gt;ia_atime.tv_sec;</div><div class='del'>-	p9attr.atime_nsec = iattr-&gt;ia_atime.tv_nsec;</div><div class='del'>-	p9attr.mtime_sec = iattr-&gt;ia_mtime.tv_sec;</div><div class='del'>-	p9attr.mtime_nsec = iattr-&gt;ia_mtime.tv_nsec;</div><div class='add'>+	if (iattr-&gt;ia_valid &amp; ATTR_MODE)</div><div class='add'>+		p9attr.mode = iattr-&gt;ia_mode;</div><div class='add'>+	if (iattr-&gt;ia_valid &amp; ATTR_UID)</div><div class='add'>+		p9attr.uid = iattr-&gt;ia_uid;</div><div class='add'>+	if (iattr-&gt;ia_valid &amp; ATTR_GID)</div><div class='add'>+		p9attr.gid = iattr-&gt;ia_gid;</div><div class='add'>+	if (iattr-&gt;ia_valid &amp; ATTR_SIZE)</div><div class='add'>+		p9attr.size = iattr-&gt;ia_size;</div><div class='add'>+	if (iattr-&gt;ia_valid &amp; ATTR_ATIME_SET) {</div><div class='add'>+		p9attr.atime_sec = iattr-&gt;ia_atime.tv_sec;</div><div class='add'>+		p9attr.atime_nsec = iattr-&gt;ia_atime.tv_nsec;</div><div class='add'>+	}</div><div class='add'>+	if (iattr-&gt;ia_valid &amp; ATTR_MTIME_SET) {</div><div class='add'>+		p9attr.mtime_sec = iattr-&gt;ia_mtime.tv_sec;</div><div class='add'>+		p9attr.mtime_nsec = iattr-&gt;ia_mtime.tv_nsec;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (iattr-&gt;ia_valid &amp; ATTR_FILE) {</div><div class='ctx'> 		fid = iattr-&gt;ia_file-&gt;private_data;</div><div class='hunk'>@@ -582,34 +560,46 @@ int v9fs_vfs_setattr_dotl(struct user_namespace *mnt_userns,</div><div class='ctx'> 		return PTR_ERR(fid);</div><div class='ctx'> </div><div class='ctx'> 	/* Write all dirty data */</div><div class='del'>-	if (S_ISREG(inode-&gt;i_mode))</div><div class='del'>-		filemap_write_and_wait(inode-&gt;i_mapping);</div><div class='add'>+	if (S_ISREG(inode-&gt;i_mode)) {</div><div class='add'>+		retval = filemap_fdatawrite(inode-&gt;i_mapping);</div><div class='add'>+		if (retval &lt; 0)</div><div class='add'>+			p9_debug(P9_DEBUG_ERROR,</div><div class='add'>+			    "Flushing file prior to setattr failed: %d\n", retval);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	retval = p9_client_setattr(fid, &amp;p9attr);</div><div class='ctx'> 	if (retval &lt; 0) {</div><div class='ctx'> 		if (use_dentry)</div><div class='del'>-			p9_client_clunk(fid);</div><div class='add'>+			p9_fid_put(fid);</div><div class='ctx'> 		return retval;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if ((iattr-&gt;ia_valid &amp; ATTR_SIZE) &amp;&amp;</div><div class='del'>-	    iattr-&gt;ia_size != i_size_read(inode))</div><div class='add'>+	if ((iattr-&gt;ia_valid &amp; ATTR_SIZE) &amp;&amp; iattr-&gt;ia_size !=</div><div class='add'>+		 i_size_read(inode)) {</div><div class='ctx'> 		truncate_setsize(inode, iattr-&gt;ia_size);</div><div class='add'>+		netfs_resize_file(netfs_inode(inode), iattr-&gt;ia_size, true);</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_9P_FSCACHE</div><div class='add'>+		if (v9ses-&gt;cache &amp; CACHE_FSCACHE)</div><div class='add'>+			fscache_resize_cookie(v9fs_inode_cookie(V9FS_I(inode)),</div><div class='add'>+				iattr-&gt;ia_size);</div><div class='add'>+#endif</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	v9fs_invalidate_inode_attr(inode);</div><div class='del'>-	setattr_copy(&amp;init_user_ns, inode, iattr);</div><div class='add'>+	setattr_copy(&amp;nop_mnt_idmap, inode, iattr);</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='ctx'> 	if (iattr-&gt;ia_valid &amp; ATTR_MODE) {</div><div class='ctx'> 		/* We also want to update ACL when we update mode bits */</div><div class='ctx'> 		retval = v9fs_acl_chmod(inode, fid);</div><div class='ctx'> 		if (retval &lt; 0) {</div><div class='ctx'> 			if (use_dentry)</div><div class='del'>-				p9_client_clunk(fid);</div><div class='add'>+				p9_fid_put(fid);</div><div class='ctx'> 			return retval;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	if (use_dentry)</div><div class='del'>-		p9_client_clunk(fid);</div><div class='add'>+		p9_fid_put(fid);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -630,12 +620,12 @@ v9fs_stat2inode_dotl(struct p9_stat_dotl *stat, struct inode *inode,</div><div class='ctx'> 	struct v9fs_inode *v9inode = V9FS_I(inode);</div><div class='ctx'> </div><div class='ctx'> 	if ((stat-&gt;st_result_mask &amp; P9_STATS_BASIC) == P9_STATS_BASIC) {</div><div class='del'>-		inode-&gt;i_atime.tv_sec = stat-&gt;st_atime_sec;</div><div class='del'>-		inode-&gt;i_atime.tv_nsec = stat-&gt;st_atime_nsec;</div><div class='del'>-		inode-&gt;i_mtime.tv_sec = stat-&gt;st_mtime_sec;</div><div class='del'>-		inode-&gt;i_mtime.tv_nsec = stat-&gt;st_mtime_nsec;</div><div class='del'>-		inode-&gt;i_ctime.tv_sec = stat-&gt;st_ctime_sec;</div><div class='del'>-		inode-&gt;i_ctime.tv_nsec = stat-&gt;st_ctime_nsec;</div><div class='add'>+		inode_set_atime(inode, stat-&gt;st_atime_sec,</div><div class='add'>+				stat-&gt;st_atime_nsec);</div><div class='add'>+		inode_set_mtime(inode, stat-&gt;st_mtime_sec,</div><div class='add'>+				stat-&gt;st_mtime_nsec);</div><div class='add'>+		inode_set_ctime(inode, stat-&gt;st_ctime_sec,</div><div class='add'>+				stat-&gt;st_ctime_nsec);</div><div class='ctx'> 		inode-&gt;i_uid = stat-&gt;st_uid;</div><div class='ctx'> 		inode-&gt;i_gid = stat-&gt;st_gid;</div><div class='ctx'> 		set_nlink(inode, stat-&gt;st_nlink);</div><div class='hunk'>@@ -644,21 +634,22 @@ v9fs_stat2inode_dotl(struct p9_stat_dotl *stat, struct inode *inode,</div><div class='ctx'> 		mode |= inode-&gt;i_mode &amp; ~S_IALLUGO;</div><div class='ctx'> 		inode-&gt;i_mode = mode;</div><div class='ctx'> </div><div class='add'>+		v9inode-&gt;netfs.remote_i_size = stat-&gt;st_size;</div><div class='ctx'> 		if (!(flags &amp; V9FS_STAT2INODE_KEEP_ISIZE))</div><div class='ctx'> 			v9fs_i_size_write(inode, stat-&gt;st_size);</div><div class='ctx'> 		inode-&gt;i_blocks = stat-&gt;st_blocks;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		if (stat-&gt;st_result_mask &amp; P9_STATS_ATIME) {</div><div class='del'>-			inode-&gt;i_atime.tv_sec = stat-&gt;st_atime_sec;</div><div class='del'>-			inode-&gt;i_atime.tv_nsec = stat-&gt;st_atime_nsec;</div><div class='add'>+			inode_set_atime(inode, stat-&gt;st_atime_sec,</div><div class='add'>+					stat-&gt;st_atime_nsec);</div><div class='ctx'> 		}</div><div class='ctx'> 		if (stat-&gt;st_result_mask &amp; P9_STATS_MTIME) {</div><div class='del'>-			inode-&gt;i_mtime.tv_sec = stat-&gt;st_mtime_sec;</div><div class='del'>-			inode-&gt;i_mtime.tv_nsec = stat-&gt;st_mtime_nsec;</div><div class='add'>+			inode_set_mtime(inode, stat-&gt;st_mtime_sec,</div><div class='add'>+					stat-&gt;st_mtime_nsec);</div><div class='ctx'> 		}</div><div class='ctx'> 		if (stat-&gt;st_result_mask &amp; P9_STATS_CTIME) {</div><div class='del'>-			inode-&gt;i_ctime.tv_sec = stat-&gt;st_ctime_sec;</div><div class='del'>-			inode-&gt;i_ctime.tv_nsec = stat-&gt;st_ctime_nsec;</div><div class='add'>+			inode_set_ctime(inode, stat-&gt;st_ctime_sec,</div><div class='add'>+					stat-&gt;st_ctime_nsec);</div><div class='ctx'> 		}</div><div class='ctx'> 		if (stat-&gt;st_result_mask &amp; P9_STATS_UID)</div><div class='ctx'> 			inode-&gt;i_uid = stat-&gt;st_uid;</div><div class='hunk'>@@ -672,8 +663,10 @@ v9fs_stat2inode_dotl(struct p9_stat_dotl *stat, struct inode *inode,</div><div class='ctx'> 			inode-&gt;i_mode = mode;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (!(flags &amp; V9FS_STAT2INODE_KEEP_ISIZE) &amp;&amp;</div><div class='del'>-		    stat-&gt;st_result_mask &amp; P9_STATS_SIZE)</div><div class='add'>+		    stat-&gt;st_result_mask &amp; P9_STATS_SIZE) {</div><div class='add'>+			v9inode-&gt;netfs.remote_i_size = stat-&gt;st_size;</div><div class='ctx'> 			v9fs_i_size_write(inode, stat-&gt;st_size);</div><div class='add'>+		}</div><div class='ctx'> 		if (stat-&gt;st_result_mask &amp; P9_STATS_BLOCKS)</div><div class='ctx'> 			inode-&gt;i_blocks = stat-&gt;st_blocks;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -687,21 +680,18 @@ v9fs_stat2inode_dotl(struct p9_stat_dotl *stat, struct inode *inode,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-v9fs_vfs_symlink_dotl(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+v9fs_vfs_symlink_dotl(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		      struct dentry *dentry, const char *symname)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='ctx'> 	kgid_t gid;</div><div class='ctx'> 	const unsigned char *name;</div><div class='ctx'> 	struct p9_qid qid;</div><div class='del'>-	struct inode *inode;</div><div class='ctx'> 	struct p9_fid *dfid;</div><div class='ctx'> 	struct p9_fid *fid = NULL;</div><div class='del'>-	struct v9fs_session_info *v9ses;</div><div class='ctx'> </div><div class='ctx'> 	name = dentry-&gt;d_name.name;</div><div class='ctx'> 	p9_debug(P9_DEBUG_VFS, "%lu,%s,%s\n", dir-&gt;i_ino, name, symname);</div><div class='del'>-	v9ses = v9fs_inode2v9ses(dir);</div><div class='ctx'> </div><div class='ctx'> 	dfid = v9fs_parent_fid(dentry);</div><div class='ctx'> 	if (IS_ERR(dfid)) {</div><div class='hunk'>@@ -721,44 +711,10 @@ v9fs_vfs_symlink_dotl(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	v9fs_invalidate_inode_attr(dir);</div><div class='del'>-	if (v9ses-&gt;cache == CACHE_LOOSE || v9ses-&gt;cache == CACHE_FSCACHE) {</div><div class='del'>-		/* Now walk from the parent so we can get an unopened fid. */</div><div class='del'>-		fid = p9_client_walk(dfid, 1, &amp;name, 1);</div><div class='del'>-		if (IS_ERR(fid)) {</div><div class='del'>-			err = PTR_ERR(fid);</div><div class='del'>-			p9_debug(P9_DEBUG_VFS, "p9_client_walk failed %d\n",</div><div class='del'>-				 err);</div><div class='del'>-			fid = NULL;</div><div class='del'>-			goto error;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/* instantiate inode and assign the unopened fid to dentry */</div><div class='del'>-		inode = v9fs_get_new_inode_from_fid(v9ses, fid, dir-&gt;i_sb);</div><div class='del'>-		if (IS_ERR(inode)) {</div><div class='del'>-			err = PTR_ERR(inode);</div><div class='del'>-			p9_debug(P9_DEBUG_VFS, "inode creation failed %d\n",</div><div class='del'>-				 err);</div><div class='del'>-			goto error;</div><div class='del'>-		}</div><div class='del'>-		v9fs_fid_add(dentry, fid);</div><div class='del'>-		d_instantiate(dentry, inode);</div><div class='del'>-		fid = NULL;</div><div class='del'>-		err = 0;</div><div class='del'>-	} else {</div><div class='del'>-		/* Not in cached mode. No need to populate inode with stat */</div><div class='del'>-		inode = v9fs_get_inode(dir-&gt;i_sb, S_IFLNK, 0);</div><div class='del'>-		if (IS_ERR(inode)) {</div><div class='del'>-			err = PTR_ERR(inode);</div><div class='del'>-			goto error;</div><div class='del'>-		}</div><div class='del'>-		d_instantiate(dentry, inode);</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> error:</div><div class='del'>-	if (fid)</div><div class='del'>-		p9_client_clunk(fid);</div><div class='del'>-</div><div class='del'>-	p9_client_clunk(dfid);</div><div class='add'>+	p9_fid_put(fid);</div><div class='add'>+	p9_fid_put(dfid);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -788,21 +744,21 @@ v9fs_vfs_link_dotl(struct dentry *old_dentry, struct inode *dir,</div><div class='ctx'> </div><div class='ctx'> 	oldfid = v9fs_fid_lookup(old_dentry);</div><div class='ctx'> 	if (IS_ERR(oldfid)) {</div><div class='del'>-		p9_client_clunk(dfid);</div><div class='add'>+		p9_fid_put(dfid);</div><div class='ctx'> 		return PTR_ERR(oldfid);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	err = p9_client_link(dfid, oldfid, dentry-&gt;d_name.name);</div><div class='ctx'> </div><div class='del'>-	p9_client_clunk(dfid);</div><div class='del'>-	p9_client_clunk(oldfid);</div><div class='add'>+	p9_fid_put(dfid);</div><div class='add'>+	p9_fid_put(oldfid);</div><div class='ctx'> 	if (err &lt; 0) {</div><div class='ctx'> 		p9_debug(P9_DEBUG_VFS, "p9_client_link failed %d\n", err);</div><div class='ctx'> 		return err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	v9fs_invalidate_inode_attr(dir);</div><div class='del'>-	if (v9ses-&gt;cache == CACHE_LOOSE || v9ses-&gt;cache == CACHE_FSCACHE) {</div><div class='add'>+	if (v9ses-&gt;cache &amp; (CACHE_META|CACHE_LOOSE)) {</div><div class='ctx'> 		/* Get the latest stat info from server. */</div><div class='ctx'> 		struct p9_fid *fid;</div><div class='ctx'> </div><div class='hunk'>@@ -811,7 +767,7 @@ v9fs_vfs_link_dotl(struct dentry *old_dentry, struct inode *dir,</div><div class='ctx'> 			return PTR_ERR(fid);</div><div class='ctx'> </div><div class='ctx'> 		v9fs_refresh_inode_dotl(fid, d_inode(old_dentry));</div><div class='del'>-		p9_client_clunk(fid);</div><div class='add'>+		p9_fid_put(fid);</div><div class='ctx'> 	}</div><div class='ctx'> 	ihold(d_inode(old_dentry));</div><div class='ctx'> 	d_instantiate(dentry, d_inode(old_dentry));</div><div class='hunk'>@@ -821,7 +777,7 @@ v9fs_vfs_link_dotl(struct dentry *old_dentry, struct inode *dir,</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * v9fs_vfs_mknod_dotl - create a special file</div><div class='del'>- * @mnt_userns: The user namespace of the mount</div><div class='add'>+ * @idmap: The idmap of the mount</div><div class='ctx'>  * @dir: inode destination for new link</div><div class='ctx'>  * @dentry: dentry for file</div><div class='ctx'>  * @omode: mode for creation</div><div class='hunk'>@@ -829,7 +785,7 @@ v9fs_vfs_link_dotl(struct dentry *old_dentry, struct inode *dir,</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='ctx'> static int</div><div class='del'>-v9fs_vfs_mknod_dotl(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+v9fs_vfs_mknod_dotl(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		    struct dentry *dentry, umode_t omode, dev_t rdev)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='hunk'>@@ -851,7 +807,6 @@ v9fs_vfs_mknod_dotl(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	if (IS_ERR(dfid)) {</div><div class='ctx'> 		err = PTR_ERR(dfid);</div><div class='ctx'> 		p9_debug(P9_DEBUG_VFS, "fid lookup failed %d\n", err);</div><div class='del'>-		dfid = NULL;</div><div class='ctx'> 		goto error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -876,42 +831,23 @@ v9fs_vfs_mknod_dotl(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 		err = PTR_ERR(fid);</div><div class='ctx'> 		p9_debug(P9_DEBUG_VFS, "p9_client_walk failed %d\n",</div><div class='ctx'> 			 err);</div><div class='del'>-		fid = NULL;</div><div class='ctx'> 		goto error;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	/* instantiate inode and assign the unopened fid to the dentry */</div><div class='del'>-	if (v9ses-&gt;cache == CACHE_LOOSE || v9ses-&gt;cache == CACHE_FSCACHE) {</div><div class='del'>-		inode = v9fs_get_new_inode_from_fid(v9ses, fid, dir-&gt;i_sb);</div><div class='del'>-		if (IS_ERR(inode)) {</div><div class='del'>-			err = PTR_ERR(inode);</div><div class='del'>-			p9_debug(P9_DEBUG_VFS, "inode creation failed %d\n",</div><div class='del'>-				 err);</div><div class='del'>-			goto error;</div><div class='del'>-		}</div><div class='del'>-		v9fs_set_create_acl(inode, fid, dacl, pacl);</div><div class='del'>-		v9fs_fid_add(dentry, fid);</div><div class='del'>-		d_instantiate(dentry, inode);</div><div class='del'>-		fid = NULL;</div><div class='del'>-		err = 0;</div><div class='del'>-	} else {</div><div class='del'>-		/*</div><div class='del'>-		 * Not in cached mode. No need to populate inode with stat.</div><div class='del'>-		 * socket syscall returns a fd, so we need instantiate</div><div class='del'>-		 */</div><div class='del'>-		inode = v9fs_get_inode(dir-&gt;i_sb, mode, rdev);</div><div class='del'>-		if (IS_ERR(inode)) {</div><div class='del'>-			err = PTR_ERR(inode);</div><div class='del'>-			goto error;</div><div class='del'>-		}</div><div class='del'>-		v9fs_set_create_acl(inode, fid, dacl, pacl);</div><div class='del'>-		d_instantiate(dentry, inode);</div><div class='add'>+	inode = v9fs_get_new_inode_from_fid(v9ses, fid, dir-&gt;i_sb);</div><div class='add'>+	if (IS_ERR(inode)) {</div><div class='add'>+		err = PTR_ERR(inode);</div><div class='add'>+		p9_debug(P9_DEBUG_VFS, "inode creation failed %d\n",</div><div class='add'>+			 err);</div><div class='add'>+		goto error;</div><div class='ctx'> 	}</div><div class='add'>+	v9fs_set_create_acl(inode, fid, dacl, pacl);</div><div class='add'>+	v9fs_fid_add(dentry, &amp;fid);</div><div class='add'>+	d_instantiate(dentry, inode);</div><div class='add'>+	err = 0;</div><div class='ctx'> error:</div><div class='del'>-	if (fid)</div><div class='del'>-		p9_client_clunk(fid);</div><div class='add'>+	p9_fid_put(fid);</div><div class='ctx'> 	v9fs_put_acl(dacl, pacl);</div><div class='del'>-	p9_client_clunk(dfid);</div><div class='add'>+	p9_fid_put(dfid);</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='hunk'>@@ -941,7 +877,7 @@ v9fs_vfs_get_link_dotl(struct dentry *dentry,</div><div class='ctx'> 	if (IS_ERR(fid))</div><div class='ctx'> 		return ERR_CAST(fid);</div><div class='ctx'> 	retval = p9_client_readlink(fid, &amp;target);</div><div class='del'>-	p9_client_clunk(fid);</div><div class='add'>+	p9_fid_put(fid);</div><div class='ctx'> 	if (retval)</div><div class='ctx'> 		return ERR_PTR(retval);</div><div class='ctx'> 	set_delayed_call(done, kfree_link, target);</div><div class='hunk'>@@ -968,7 +904,7 @@ int v9fs_refresh_inode_dotl(struct p9_fid *fid, struct inode *inode)</div><div class='ctx'> 	 * We don't want to refresh inode-&gt;i_size,</div><div class='ctx'> 	 * because we may have cached data</div><div class='ctx'> 	 */</div><div class='del'>-	flags = (v9ses-&gt;cache == CACHE_LOOSE || v9ses-&gt;cache == CACHE_FSCACHE) ?</div><div class='add'>+	flags = (v9ses-&gt;cache &amp; CACHE_LOOSE) ?</div><div class='ctx'> 		V9FS_STAT2INODE_KEEP_ISIZE : 0;</div><div class='ctx'> 	v9fs_stat2inode_dotl(st, inode, flags);</div><div class='ctx'> out:</div><div class='hunk'>@@ -990,14 +926,18 @@ const struct inode_operations v9fs_dir_inode_operations_dotl = {</div><div class='ctx'> 	.getattr = v9fs_vfs_getattr_dotl,</div><div class='ctx'> 	.setattr = v9fs_vfs_setattr_dotl,</div><div class='ctx'> 	.listxattr = v9fs_listxattr,</div><div class='add'>+	.get_inode_acl = v9fs_iop_get_inode_acl,</div><div class='ctx'> 	.get_acl = v9fs_iop_get_acl,</div><div class='add'>+	.set_acl = v9fs_iop_set_acl,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct inode_operations v9fs_file_inode_operations_dotl = {</div><div class='ctx'> 	.getattr = v9fs_vfs_getattr_dotl,</div><div class='ctx'> 	.setattr = v9fs_vfs_setattr_dotl,</div><div class='ctx'> 	.listxattr = v9fs_listxattr,</div><div class='add'>+	.get_inode_acl = v9fs_iop_get_inode_acl,</div><div class='ctx'> 	.get_acl = v9fs_iop_get_acl,</div><div class='add'>+	.set_acl = v9fs_iop_set_acl,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct inode_operations v9fs_symlink_inode_operations_dotl = {</div><div class='head'>diff --git a/fs/9p/vfs_super.c b/fs/9p/vfs_super.c<br/>index b739e02f5ef7..315336de6f02 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/9p/vfs_super.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/9p/vfs_super.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/9p/vfs_super.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/9p/vfs_super.c</a></div><div class='hunk'>@@ -12,14 +12,14 @@</div><div class='ctx'> #include &lt;linux/file.h&gt;</div><div class='ctx'> #include &lt;linux/stat.h&gt;</div><div class='ctx'> #include &lt;linux/string.h&gt;</div><div class='del'>-#include &lt;linux/inet.h&gt;</div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='ctx'> #include &lt;linux/mount.h&gt;</div><div class='del'>-#include &lt;linux/idr.h&gt;</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/statfs.h&gt;</div><div class='ctx'> #include &lt;linux/magic.h&gt;</div><div class='add'>+#include &lt;linux/fscache.h&gt;</div><div class='add'>+#include &lt;linux/fs_context.h&gt;</div><div class='ctx'> #include &lt;net/9p/9p.h&gt;</div><div class='ctx'> #include &lt;net/9p/client.h&gt;</div><div class='ctx'> </div><div class='hunk'>@@ -31,32 +31,10 @@</div><div class='ctx'> </div><div class='ctx'> static const struct super_operations v9fs_super_ops, v9fs_super_ops_dotl;</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * v9fs_set_super - set the superblock</div><div class='del'>- * @s: super block</div><div class='del'>- * @data: file system specific data</div><div class='del'>- *</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-static int v9fs_set_super(struct super_block *s, void *data)</div><div class='del'>-{</div><div class='del'>-	s-&gt;s_fs_info = data;</div><div class='del'>-	return set_anon_super(s, data);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * v9fs_fill_super - populate superblock with info</div><div class='del'>- * @sb: superblock</div><div class='del'>- * @v9ses: session information</div><div class='del'>- * @flags: flags propagated from v9fs_mount()</div><div class='del'>- *</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-v9fs_fill_super(struct super_block *sb, struct v9fs_session_info *v9ses,</div><div class='del'>-		int flags)</div><div class='add'>+static int v9fs_fill_super(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='add'>+	struct v9fs_session_info *v9ses = v9ses = sb-&gt;s_fs_info;</div><div class='ctx'> </div><div class='ctx'> 	sb-&gt;s_maxbytes = MAX_LFS_FILESIZE;</div><div class='ctx'> 	sb-&gt;s_blocksize_bits = fls(v9ses-&gt;maxdata - 1);</div><div class='hunk'>@@ -64,7 +42,8 @@ v9fs_fill_super(struct super_block *sb, struct v9fs_session_info *v9ses,</div><div class='ctx'> 	sb-&gt;s_magic = V9FS_MAGIC;</div><div class='ctx'> 	if (v9fs_proto_dotl(v9ses)) {</div><div class='ctx'> 		sb-&gt;s_op = &amp;v9fs_super_ops_dotl;</div><div class='del'>-		sb-&gt;s_xattr = v9fs_xattr_handlers;</div><div class='add'>+		if (!(v9ses-&gt;flags &amp; V9FS_NO_XATTR))</div><div class='add'>+			sb-&gt;s_xattr = v9fs_xattr_handlers;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		sb-&gt;s_op = &amp;v9fs_super_ops;</div><div class='ctx'> 		sb-&gt;s_time_max = U32_MAX;</div><div class='hunk'>@@ -84,9 +63,7 @@ v9fs_fill_super(struct super_block *sb, struct v9fs_session_info *v9ses,</div><div class='ctx'> 		sb-&gt;s_bdi-&gt;io_pages = v9ses-&gt;maxdata &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	sb-&gt;s_flags |= SB_ACTIVE | SB_DIRSYNC;</div><div class='del'>-	if (!v9ses-&gt;cache)</div><div class='del'>-		sb-&gt;s_flags |= SB_SYNCHRONOUS;</div><div class='add'>+	sb-&gt;s_flags |= SB_ACTIVE;</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_9P_FS_POSIX_ACL</div><div class='ctx'> 	if ((v9ses-&gt;flags &amp; V9FS_ACL_MASK) == V9FS_POSIX_ACL)</div><div class='hunk'>@@ -97,22 +74,17 @@ v9fs_fill_super(struct super_block *sb, struct v9fs_session_info *v9ses,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * v9fs_mount - mount a superblock</div><div class='del'>- * @fs_type: file system type</div><div class='del'>- * @flags: mount flags</div><div class='del'>- * @dev_name: device name that was mounted</div><div class='del'>- * @data: mount options</div><div class='add'>+ * v9fs_get_tree - create the mountable root and superblock</div><div class='add'>+ * @fc: the filesystem context</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static struct dentry *v9fs_mount(struct file_system_type *fs_type, int flags,</div><div class='del'>-		       const char *dev_name, void *data)</div><div class='add'>+static int v9fs_get_tree(struct fs_context *fc)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = NULL;</div><div class='ctx'> 	struct inode *inode = NULL;</div><div class='ctx'> 	struct dentry *root = NULL;</div><div class='ctx'> 	struct v9fs_session_info *v9ses = NULL;</div><div class='del'>-	umode_t mode = 0777 | S_ISVTX;</div><div class='ctx'> 	struct p9_fid *fid;</div><div class='ctx'> 	int retval = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -120,29 +92,32 @@ static struct dentry *v9fs_mount(struct file_system_type *fs_type, int flags,</div><div class='ctx'> </div><div class='ctx'> 	v9ses = kzalloc(sizeof(struct v9fs_session_info), GFP_KERNEL);</div><div class='ctx'> 	if (!v9ses)</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	fid = v9fs_session_init(v9ses, dev_name, data);</div><div class='add'>+	fid = v9fs_session_init(v9ses, fc);</div><div class='ctx'> 	if (IS_ERR(fid)) {</div><div class='ctx'> 		retval = PTR_ERR(fid);</div><div class='ctx'> 		goto free_session;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	sb = sget(fs_type, NULL, v9fs_set_super, flags, v9ses);</div><div class='add'>+	fc-&gt;s_fs_info = v9ses;</div><div class='add'>+	sb = sget_fc(fc, NULL, set_anon_super_fc);</div><div class='ctx'> 	if (IS_ERR(sb)) {</div><div class='ctx'> 		retval = PTR_ERR(sb);</div><div class='ctx'> 		goto clunk_fid;</div><div class='ctx'> 	}</div><div class='del'>-	retval = v9fs_fill_super(sb, v9ses, flags);</div><div class='add'>+	retval = v9fs_fill_super(sb);</div><div class='ctx'> 	if (retval)</div><div class='ctx'> 		goto release_sb;</div><div class='ctx'> </div><div class='del'>-	if (v9ses-&gt;cache == CACHE_LOOSE || v9ses-&gt;cache == CACHE_FSCACHE)</div><div class='del'>-		sb-&gt;s_d_op = &amp;v9fs_cached_dentry_operations;</div><div class='del'>-	else</div><div class='del'>-		sb-&gt;s_d_op = &amp;v9fs_dentry_operations;</div><div class='add'>+	if (v9ses-&gt;cache &amp; (CACHE_META|CACHE_LOOSE)) {</div><div class='add'>+		set_default_d_op(sb, &amp;v9fs_cached_dentry_operations);</div><div class='add'>+	} else {</div><div class='add'>+		set_default_d_op(sb, &amp;v9fs_dentry_operations);</div><div class='add'>+		sb-&gt;s_d_flags |= DCACHE_DONTCACHE;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	inode = v9fs_get_inode(sb, S_IFDIR | mode, 0);</div><div class='add'>+	inode = v9fs_get_new_inode_from_fid(v9ses, fid, sb);</div><div class='ctx'> 	if (IS_ERR(inode)) {</div><div class='ctx'> 		retval = PTR_ERR(inode);</div><div class='ctx'> 		goto release_sb;</div><div class='hunk'>@@ -154,46 +129,21 @@ static struct dentry *v9fs_mount(struct file_system_type *fs_type, int flags,</div><div class='ctx'> 		goto release_sb;</div><div class='ctx'> 	}</div><div class='ctx'> 	sb-&gt;s_root = root;</div><div class='del'>-	if (v9fs_proto_dotl(v9ses)) {</div><div class='del'>-		struct p9_stat_dotl *st = NULL;</div><div class='del'>-</div><div class='del'>-		st = p9_client_getattr_dotl(fid, P9_STATS_BASIC);</div><div class='del'>-		if (IS_ERR(st)) {</div><div class='del'>-			retval = PTR_ERR(st);</div><div class='del'>-			goto release_sb;</div><div class='del'>-		}</div><div class='del'>-		d_inode(root)-&gt;i_ino = v9fs_qid2ino(&amp;st-&gt;qid);</div><div class='del'>-		v9fs_stat2inode_dotl(st, d_inode(root), 0);</div><div class='del'>-		kfree(st);</div><div class='del'>-	} else {</div><div class='del'>-		struct p9_wstat *st = NULL;</div><div class='del'>-</div><div class='del'>-		st = p9_client_stat(fid);</div><div class='del'>-		if (IS_ERR(st)) {</div><div class='del'>-			retval = PTR_ERR(st);</div><div class='del'>-			goto release_sb;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		d_inode(root)-&gt;i_ino = v9fs_qid2ino(&amp;st-&gt;qid);</div><div class='del'>-		v9fs_stat2inode(st, d_inode(root), sb, 0);</div><div class='del'>-</div><div class='del'>-		p9stat_free(st);</div><div class='del'>-		kfree(st);</div><div class='del'>-	}</div><div class='ctx'> 	retval = v9fs_get_acl(inode, fid);</div><div class='ctx'> 	if (retval)</div><div class='ctx'> 		goto release_sb;</div><div class='del'>-	v9fs_fid_add(root, fid);</div><div class='add'>+	v9fs_fid_add(root, &amp;fid);</div><div class='ctx'> </div><div class='ctx'> 	p9_debug(P9_DEBUG_VFS, " simple set mount, return 0\n");</div><div class='del'>-	return dget(sb-&gt;s_root);</div><div class='add'>+	fc-&gt;root = dget(sb-&gt;s_root);</div><div class='add'>+	return 0;</div><div class='ctx'> </div><div class='ctx'> clunk_fid:</div><div class='del'>-	p9_client_clunk(fid);</div><div class='add'>+	p9_fid_put(fid);</div><div class='ctx'> 	v9fs_session_close(v9ses);</div><div class='ctx'> free_session:</div><div class='ctx'> 	kfree(v9ses);</div><div class='del'>-	return ERR_PTR(retval);</div><div class='add'>+	return retval;</div><div class='ctx'> </div><div class='ctx'> release_sb:</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -202,9 +152,9 @@ release_sb:</div><div class='ctx'> 	 * attached the fid to dentry so it won't get clunked</div><div class='ctx'> 	 * automatically.</div><div class='ctx'> 	 */</div><div class='del'>-	p9_client_clunk(fid);</div><div class='add'>+	p9_fid_put(fid);</div><div class='ctx'> 	deactivate_locked_super(sb);</div><div class='del'>-	return ERR_PTR(retval);</div><div class='add'>+	return retval;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -269,7 +219,7 @@ static int v9fs_statfs(struct dentry *dentry, struct kstatfs *buf)</div><div class='ctx'> 	}</div><div class='ctx'> 	res = simple_statfs(dentry, buf);</div><div class='ctx'> done:</div><div class='del'>-	p9_client_clunk(fid);</div><div class='add'>+	p9_fid_put(fid);</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -278,8 +228,8 @@ static int v9fs_drop_inode(struct inode *inode)</div><div class='ctx'> 	struct v9fs_session_info *v9ses;</div><div class='ctx'> </div><div class='ctx'> 	v9ses = v9fs_inode2v9ses(inode);</div><div class='del'>-	if (v9ses-&gt;cache == CACHE_LOOSE || v9ses-&gt;cache == CACHE_FSCACHE)</div><div class='del'>-		return generic_drop_inode(inode);</div><div class='add'>+	if (v9ses-&gt;cache &amp; (CACHE_META|CACHE_LOOSE))</div><div class='add'>+		return inode_generic_drop(inode);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * in case of non cached mode always drop the</div><div class='ctx'> 	 * inode because we want the inode attribute</div><div class='hunk'>@@ -291,54 +241,28 @@ static int v9fs_drop_inode(struct inode *inode)</div><div class='ctx'> static int v9fs_write_inode(struct inode *inode,</div><div class='ctx'> 			    struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='del'>-	struct p9_wstat wstat;</div><div class='del'>-	struct v9fs_inode *v9inode;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * send an fsync request to server irrespective of</div><div class='ctx'> 	 * wbc-&gt;sync_mode.</div><div class='ctx'> 	 */</div><div class='ctx'> 	p9_debug(P9_DEBUG_VFS, "%s: inode %p\n", __func__, inode);</div><div class='del'>-	v9inode = V9FS_I(inode);</div><div class='del'>-	if (!v9inode-&gt;writeback_fid)</div><div class='del'>-		return 0;</div><div class='del'>-	v9fs_blank_wstat(&amp;wstat);</div><div class='del'>-</div><div class='del'>-	ret = p9_client_wstat(v9inode-&gt;writeback_fid, &amp;wstat);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		__mark_inode_dirty(inode, I_DIRTY_DATASYNC);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='add'>+	return netfs_unpin_writeback(inode, wbc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int v9fs_write_inode_dotl(struct inode *inode,</div><div class='ctx'> 				 struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='del'>-	struct v9fs_inode *v9inode;</div><div class='del'>-	/*</div><div class='del'>-	 * send an fsync request to server irrespective of</div><div class='del'>-	 * wbc-&gt;sync_mode.</div><div class='del'>-	 */</div><div class='del'>-	v9inode = V9FS_I(inode);</div><div class='del'>-	p9_debug(P9_DEBUG_VFS, "%s: inode %p, writeback_fid %p\n",</div><div class='del'>-		 __func__, inode, v9inode-&gt;writeback_fid);</div><div class='del'>-	if (!v9inode-&gt;writeback_fid)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	ret = p9_client_fsync(v9inode-&gt;writeback_fid, 0);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		__mark_inode_dirty(inode, I_DIRTY_DATASYNC);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='add'>+</div><div class='add'>+	p9_debug(P9_DEBUG_VFS, "%s: inode %p\n", __func__, inode);</div><div class='add'>+</div><div class='add'>+	return netfs_unpin_writeback(inode, wbc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct super_operations v9fs_super_ops = {</div><div class='ctx'> 	.alloc_inode = v9fs_alloc_inode,</div><div class='ctx'> 	.free_inode = v9fs_free_inode,</div><div class='ctx'> 	.statfs = simple_statfs,</div><div class='add'>+	.drop_inode = v9fs_drop_inode,</div><div class='ctx'> 	.evict_inode = v9fs_evict_inode,</div><div class='ctx'> 	.show_options = v9fs_show_options,</div><div class='ctx'> 	.umount_begin = v9fs_umount_begin,</div><div class='hunk'>@@ -356,11 +280,86 @@ static const struct super_operations v9fs_super_ops_dotl = {</div><div class='ctx'> 	.write_inode = v9fs_write_inode_dotl,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+static void v9fs_free_fc(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct v9fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+</div><div class='add'>+	if (!ctx)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/* These should be NULL by now but guard against leaks */</div><div class='add'>+	kfree(ctx-&gt;session_opts.uname);</div><div class='add'>+	kfree(ctx-&gt;session_opts.aname);</div><div class='add'>+#ifdef CONFIG_9P_FSCACHE</div><div class='add'>+	kfree(ctx-&gt;session_opts.cachetag);</div><div class='add'>+#endif</div><div class='add'>+	if (ctx-&gt;client_opts.trans_mod)</div><div class='add'>+		v9fs_put_trans(ctx-&gt;client_opts.trans_mod);</div><div class='add'>+	kfree(ctx);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct fs_context_operations v9fs_context_ops = {</div><div class='add'>+	.parse_param	= v9fs_parse_param,</div><div class='add'>+	.get_tree	= v9fs_get_tree,</div><div class='add'>+	.free		= v9fs_free_fc,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int v9fs_init_fs_context(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct v9fs_context	*ctx;</div><div class='add'>+</div><div class='add'>+	ctx = kzalloc(sizeof(*ctx), GFP_KERNEL);</div><div class='add'>+	if (!ctx)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	/* initialize core options */</div><div class='add'>+	ctx-&gt;session_opts.afid = ~0;</div><div class='add'>+	ctx-&gt;session_opts.cache = CACHE_NONE;</div><div class='add'>+	ctx-&gt;session_opts.session_lock_timeout = P9_LOCK_TIMEOUT;</div><div class='add'>+	ctx-&gt;session_opts.uname = kstrdup(V9FS_DEFUSER, GFP_KERNEL);</div><div class='add'>+	if (!ctx-&gt;session_opts.uname)</div><div class='add'>+		goto error;</div><div class='add'>+</div><div class='add'>+	ctx-&gt;session_opts.aname = kstrdup(V9FS_DEFANAME, GFP_KERNEL);</div><div class='add'>+	if (!ctx-&gt;session_opts.aname)</div><div class='add'>+		goto error;</div><div class='add'>+</div><div class='add'>+	ctx-&gt;session_opts.uid = INVALID_UID;</div><div class='add'>+	ctx-&gt;session_opts.dfltuid = V9FS_DEFUID;</div><div class='add'>+	ctx-&gt;session_opts.dfltgid = V9FS_DEFGID;</div><div class='add'>+</div><div class='add'>+	/* initialize client options */</div><div class='add'>+	ctx-&gt;client_opts.proto_version = p9_proto_2000L;</div><div class='add'>+	ctx-&gt;client_opts.msize = DEFAULT_MSIZE;</div><div class='add'>+</div><div class='add'>+	/* initialize fd transport options */</div><div class='add'>+	ctx-&gt;fd_opts.port = P9_FD_PORT;</div><div class='add'>+	ctx-&gt;fd_opts.rfd = ~0;</div><div class='add'>+	ctx-&gt;fd_opts.wfd = ~0;</div><div class='add'>+	ctx-&gt;fd_opts.privport = false;</div><div class='add'>+</div><div class='add'>+	/* initialize rdma transport options */</div><div class='add'>+	ctx-&gt;rdma_opts.port = P9_RDMA_PORT;</div><div class='add'>+	ctx-&gt;rdma_opts.sq_depth = P9_RDMA_SQ_DEPTH;</div><div class='add'>+	ctx-&gt;rdma_opts.rq_depth = P9_RDMA_RQ_DEPTH;</div><div class='add'>+	ctx-&gt;rdma_opts.timeout = P9_RDMA_TIMEOUT;</div><div class='add'>+	ctx-&gt;rdma_opts.privport = false;</div><div class='add'>+</div><div class='add'>+	fc-&gt;ops = &amp;v9fs_context_ops;</div><div class='add'>+	fc-&gt;fs_private = ctx;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+error:</div><div class='add'>+	fc-&gt;need_free = 1;</div><div class='add'>+	return -ENOMEM;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> struct file_system_type v9fs_fs_type = {</div><div class='ctx'> 	.name = "9p",</div><div class='del'>-	.mount = v9fs_mount,</div><div class='ctx'> 	.kill_sb = v9fs_kill_super,</div><div class='ctx'> 	.owner = THIS_MODULE,</div><div class='ctx'> 	.fs_flags = FS_RENAME_DOES_D_MOVE,</div><div class='add'>+	.init_fs_context = v9fs_init_fs_context,</div><div class='add'>+	.parameters = v9fs_param_spec,</div><div class='ctx'> };</div><div class='ctx'> MODULE_ALIAS_FS("9p");</div><div class='head'>diff --git a/fs/9p/xattr.c b/fs/9p/xattr.c<br/>index a824441b95a2..8604e3377ee7 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/9p/xattr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/9p/xattr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/9p/xattr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/9p/xattr.c</a></div><div class='hunk'>@@ -8,6 +8,7 @@</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='ctx'> #include &lt;linux/uio.h&gt;</div><div class='add'>+#include &lt;linux/posix_acl_xattr.h&gt;</div><div class='ctx'> #include &lt;net/9p/9p.h&gt;</div><div class='ctx'> #include &lt;net/9p/client.h&gt;</div><div class='ctx'> </div><div class='hunk'>@@ -24,7 +25,7 @@ ssize_t v9fs_fid_xattr_get(struct p9_fid *fid, const char *name,</div><div class='ctx'> 	struct iov_iter to;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	iov_iter_kvec(&amp;to, READ, &amp;kvec, 1, buffer_size);</div><div class='add'>+	iov_iter_kvec(&amp;to, ITER_DEST, &amp;kvec, 1, buffer_size);</div><div class='ctx'> </div><div class='ctx'> 	attr_fid = p9_client_xattrwalk(fid, name, &amp;attr_size);</div><div class='ctx'> 	if (IS_ERR(attr_fid)) {</div><div class='hunk'>@@ -34,17 +35,19 @@ ssize_t v9fs_fid_xattr_get(struct p9_fid *fid, const char *name,</div><div class='ctx'> 		return retval;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (attr_size &gt; buffer_size) {</div><div class='del'>-		if (!buffer_size) /* request to get the attr_size */</div><div class='del'>-			retval = attr_size;</div><div class='del'>-		else</div><div class='add'>+		if (buffer_size)</div><div class='ctx'> 			retval = -ERANGE;</div><div class='add'>+		else if (attr_size &gt; SSIZE_MAX)</div><div class='add'>+			retval = -EOVERFLOW;</div><div class='add'>+		else /* request to get the attr_size */</div><div class='add'>+			retval = attr_size;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		iov_iter_truncate(&amp;to, attr_size);</div><div class='ctx'> 		retval = p9_client_read(attr_fid, 0, &amp;to, &amp;err);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			retval = err;</div><div class='ctx'> 	}</div><div class='del'>-	p9_client_clunk(attr_fid);</div><div class='add'>+	p9_fid_put(attr_fid);</div><div class='ctx'> 	return retval;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -65,13 +68,13 @@ ssize_t v9fs_xattr_get(struct dentry *dentry, const char *name,</div><div class='ctx'> 	struct p9_fid *fid;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	p9_debug(P9_DEBUG_VFS, "name = %s value_len = %zu\n",</div><div class='add'>+	p9_debug(P9_DEBUG_VFS, "name = '%s' value_len = %zu\n",</div><div class='ctx'> 		 name, buffer_size);</div><div class='ctx'> 	fid = v9fs_fid_lookup(dentry);</div><div class='ctx'> 	if (IS_ERR(fid))</div><div class='ctx'> 		return PTR_ERR(fid);</div><div class='ctx'> 	ret = v9fs_fid_xattr_get(fid, name, buffer, buffer_size);</div><div class='del'>-	p9_client_clunk(fid);</div><div class='add'>+	p9_fid_put(fid);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -98,7 +101,7 @@ int v9fs_xattr_set(struct dentry *dentry, const char *name,</div><div class='ctx'> 	if (IS_ERR(fid))</div><div class='ctx'> 		return PTR_ERR(fid);</div><div class='ctx'> 	ret = v9fs_fid_xattr_set(fid, name, value, value_len, flags);</div><div class='del'>-	p9_client_clunk(fid);</div><div class='add'>+	p9_fid_put(fid);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -109,7 +112,7 @@ int v9fs_fid_xattr_set(struct p9_fid *fid, const char *name,</div><div class='ctx'> 	struct iov_iter from;</div><div class='ctx'> 	int retval, err;</div><div class='ctx'> </div><div class='del'>-	iov_iter_kvec(&amp;from, WRITE, &amp;kvec, 1, value_len);</div><div class='add'>+	iov_iter_kvec(&amp;from, ITER_SOURCE, &amp;kvec, 1, value_len);</div><div class='ctx'> </div><div class='ctx'> 	p9_debug(P9_DEBUG_VFS, "name = %s value_len = %zu flags = %d\n",</div><div class='ctx'> 		 name, value_len, flags);</div><div class='hunk'>@@ -128,7 +131,7 @@ int v9fs_fid_xattr_set(struct p9_fid *fid, const char *name,</div><div class='ctx'> 			 retval);</div><div class='ctx'> 	else</div><div class='ctx'> 		p9_client_write(fid, 0, &amp;from, &amp;retval);</div><div class='del'>-	err = p9_client_clunk(fid);</div><div class='add'>+	err = p9_fid_put(fid);</div><div class='ctx'> 	if (!retval &amp;&amp; err)</div><div class='ctx'> 		retval = err;</div><div class='ctx'> 	return retval;</div><div class='hunk'>@@ -136,7 +139,8 @@ int v9fs_fid_xattr_set(struct p9_fid *fid, const char *name,</div><div class='ctx'> </div><div class='ctx'> ssize_t v9fs_listxattr(struct dentry *dentry, char *buffer, size_t buffer_size)</div><div class='ctx'> {</div><div class='del'>-	return v9fs_xattr_get(dentry, NULL, buffer, buffer_size);</div><div class='add'>+	/* Txattrwalk with an empty string lists xattrs instead */</div><div class='add'>+	return v9fs_xattr_get(dentry, "", buffer, buffer_size);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int v9fs_xattr_handler_get(const struct xattr_handler *handler,</div><div class='hunk'>@@ -149,7 +153,7 @@ static int v9fs_xattr_handler_get(const struct xattr_handler *handler,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int v9fs_xattr_handler_set(const struct xattr_handler *handler,</div><div class='del'>-				  struct user_namespace *mnt_userns,</div><div class='add'>+				  struct mnt_idmap *idmap,</div><div class='ctx'> 				  struct dentry *dentry, struct inode *inode,</div><div class='ctx'> 				  const char *name, const void *value,</div><div class='ctx'> 				  size_t size, int flags)</div><div class='hunk'>@@ -159,33 +163,29 @@ static int v9fs_xattr_handler_set(const struct xattr_handler *handler,</div><div class='ctx'> 	return v9fs_xattr_set(dentry, full_name, value, size, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct xattr_handler v9fs_xattr_user_handler = {</div><div class='add'>+static const struct xattr_handler v9fs_xattr_user_handler = {</div><div class='ctx'> 	.prefix	= XATTR_USER_PREFIX,</div><div class='ctx'> 	.get	= v9fs_xattr_handler_get,</div><div class='ctx'> 	.set	= v9fs_xattr_handler_set,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static struct xattr_handler v9fs_xattr_trusted_handler = {</div><div class='add'>+static const struct xattr_handler v9fs_xattr_trusted_handler = {</div><div class='ctx'> 	.prefix	= XATTR_TRUSTED_PREFIX,</div><div class='ctx'> 	.get	= v9fs_xattr_handler_get,</div><div class='ctx'> 	.set	= v9fs_xattr_handler_set,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_9P_FS_SECURITY</div><div class='del'>-static struct xattr_handler v9fs_xattr_security_handler = {</div><div class='add'>+static const struct xattr_handler v9fs_xattr_security_handler = {</div><div class='ctx'> 	.prefix	= XATTR_SECURITY_PREFIX,</div><div class='ctx'> 	.get	= v9fs_xattr_handler_get,</div><div class='ctx'> 	.set	= v9fs_xattr_handler_set,</div><div class='ctx'> };</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-const struct xattr_handler *v9fs_xattr_handlers[] = {</div><div class='add'>+const struct xattr_handler * const v9fs_xattr_handlers[] = {</div><div class='ctx'> 	&amp;v9fs_xattr_user_handler,</div><div class='ctx'> 	&amp;v9fs_xattr_trusted_handler,</div><div class='del'>-#ifdef CONFIG_9P_FS_POSIX_ACL</div><div class='del'>-	&amp;v9fs_xattr_acl_access_handler,</div><div class='del'>-	&amp;v9fs_xattr_acl_default_handler,</div><div class='del'>-#endif</div><div class='ctx'> #ifdef CONFIG_9P_FS_SECURITY</div><div class='ctx'> 	&amp;v9fs_xattr_security_handler,</div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/9p/xattr.h b/fs/9p/xattr.h<br/>index 3e11fc3331eb..3ad5a802352a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/9p/xattr.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/9p/xattr.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/9p/xattr.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/9p/xattr.h</a></div><div class='hunk'>@@ -10,9 +10,7 @@</div><div class='ctx'> #include &lt;net/9p/9p.h&gt;</div><div class='ctx'> #include &lt;net/9p/client.h&gt;</div><div class='ctx'> </div><div class='del'>-extern const struct xattr_handler *v9fs_xattr_handlers[];</div><div class='del'>-extern const struct xattr_handler v9fs_xattr_acl_access_handler;</div><div class='del'>-extern const struct xattr_handler v9fs_xattr_acl_default_handler;</div><div class='add'>+extern const struct xattr_handler * const v9fs_xattr_handlers[];</div><div class='ctx'> </div><div class='ctx'> ssize_t v9fs_fid_xattr_get(struct p9_fid *fid, const char *name,</div><div class='ctx'> 			   void *buffer, size_t buffer_size);</div><div class='head'>diff --git a/fs/Kconfig b/fs/Kconfig<br/>index a6313a969bc5..0bfdaecaa877 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/Kconfig</a></div><div class='hunk'>@@ -15,11 +15,23 @@ config VALIDATE_FS_PARSER</div><div class='ctx'> 	  Enable this to perform validation of the parameter description for a</div><div class='ctx'> 	  filesystem when it is registered.</div><div class='ctx'> </div><div class='del'>-if BLOCK</div><div class='del'>-</div><div class='ctx'> config FS_IOMAP</div><div class='ctx'> 	bool</div><div class='ctx'> </div><div class='add'>+# Stackable filesystems</div><div class='add'>+config FS_STACK</div><div class='add'>+	bool</div><div class='add'>+</div><div class='add'>+config BUFFER_HEAD</div><div class='add'>+	bool</div><div class='add'>+</div><div class='add'>+# old blockdev_direct_IO implementation.  Use iomap for new code instead</div><div class='add'>+config LEGACY_DIRECT_IO</div><div class='add'>+	depends on BUFFER_HEAD</div><div class='add'>+	bool</div><div class='add'>+</div><div class='add'>+if BLOCK</div><div class='add'>+</div><div class='ctx'> source "fs/ext2/Kconfig"</div><div class='ctx'> source "fs/ext4/Kconfig"</div><div class='ctx'> source "fs/jbd2/Kconfig"</div><div class='hunk'>@@ -31,7 +43,6 @@ config FS_MBCACHE</div><div class='ctx'> 	default y if EXT4_FS=y</div><div class='ctx'> 	default m if EXT2_FS_XATTR || EXT4_FS</div><div class='ctx'> </div><div class='del'>-source "fs/reiserfs/Kconfig"</div><div class='ctx'> source "fs/jfs/Kconfig"</div><div class='ctx'> </div><div class='ctx'> source "fs/xfs/Kconfig"</div><div class='hunk'>@@ -42,11 +53,12 @@ source "fs/nilfs2/Kconfig"</div><div class='ctx'> source "fs/f2fs/Kconfig"</div><div class='ctx'> source "fs/zonefs/Kconfig"</div><div class='ctx'> </div><div class='add'>+endif # BLOCK</div><div class='add'>+</div><div class='ctx'> config FS_DAX</div><div class='ctx'> 	bool "File system based Direct Access (DAX) support"</div><div class='ctx'> 	depends on MMU</div><div class='del'>-	depends on !(ARM || MIPS || SPARC)</div><div class='del'>-	select DEV_PAGEMAP_OPS if (ZONE_DEVICE &amp;&amp; !FS_DAX_LIMITED)</div><div class='add'>+	depends on ZONE_DEVICE</div><div class='ctx'> 	select FS_IOMAP</div><div class='ctx'> 	select DAX</div><div class='ctx'> 	help</div><div class='hunk'>@@ -82,15 +94,6 @@ config FS_DAX_PMD</div><div class='ctx'> 	depends on ZONE_DEVICE</div><div class='ctx'> 	depends on TRANSPARENT_HUGEPAGE</div><div class='ctx'> </div><div class='del'>-# Selected by DAX drivers that do not expect filesystem DAX to support</div><div class='del'>-# get_user_pages() of DAX mappings. I.e. "limited" indicates no support</div><div class='del'>-# for fork() of processes with MAP_SHARED mappings or support for</div><div class='del'>-# direct-I/O to a DAX mapping.</div><div class='del'>-config FS_DAX_LIMITED</div><div class='del'>-	bool</div><div class='del'>-</div><div class='del'>-endif # BLOCK</div><div class='del'>-</div><div class='ctx'> # Posix ACL utility routines</div><div class='ctx'> #</div><div class='ctx'> # Note: Posix ACLs can be implemented without these helpers.  Never use</div><div class='hunk'>@@ -131,7 +134,6 @@ source "fs/overlayfs/Kconfig"</div><div class='ctx'> menu "Caches"</div><div class='ctx'> </div><div class='ctx'> source "fs/netfs/Kconfig"</div><div class='del'>-source "fs/fscache/Kconfig"</div><div class='ctx'> source "fs/cachefiles/Kconfig"</div><div class='ctx'> </div><div class='ctx'> endmenu</div><div class='hunk'>@@ -150,7 +152,6 @@ menu "DOS/FAT/EXFAT/NT Filesystems"</div><div class='ctx'> </div><div class='ctx'> source "fs/fat/Kconfig"</div><div class='ctx'> source "fs/exfat/Kconfig"</div><div class='del'>-source "fs/ntfs/Kconfig"</div><div class='ctx'> source "fs/ntfs3/Kconfig"</div><div class='ctx'> </div><div class='ctx'> endmenu</div><div class='hunk'>@@ -165,6 +166,7 @@ source "fs/sysfs/Kconfig"</div><div class='ctx'> config TMPFS</div><div class='ctx'> 	bool "Tmpfs virtual memory file system support (former shm fs)"</div><div class='ctx'> 	depends on SHMEM</div><div class='add'>+	select MEMFD_CREATE</div><div class='ctx'> 	help</div><div class='ctx'> 	  Tmpfs is a file system which keeps all files in virtual memory.</div><div class='ctx'> </div><div class='hunk'>@@ -201,8 +203,8 @@ config TMPFS_XATTR</div><div class='ctx'> 	  Extended attributes are name:value pairs associated with inodes by</div><div class='ctx'> 	  the kernel or by users (see the attr(5) manual page for details).</div><div class='ctx'> </div><div class='del'>-	  Currently this enables support for the trusted.* and</div><div class='del'>-	  security.* namespaces.</div><div class='add'>+	  This enables support for the trusted.*, security.* and user.*</div><div class='add'>+	  namespaces.</div><div class='ctx'> </div><div class='ctx'> 	  You need this for POSIX ACL support on tmpfs.</div><div class='ctx'> </div><div class='hunk'>@@ -229,12 +231,26 @@ config TMPFS_INODE64</div><div class='ctx'> </div><div class='ctx'> 	  If unsure, say N.</div><div class='ctx'> </div><div class='add'>+config TMPFS_QUOTA</div><div class='add'>+	bool "Tmpfs quota support"</div><div class='add'>+	depends on TMPFS</div><div class='add'>+	select QUOTA</div><div class='add'>+	help</div><div class='add'>+	  Quota support allows to set per user and group limits for tmpfs</div><div class='add'>+	  usage.  Say Y to enable quota support. Once enabled you can control</div><div class='add'>+	  user and group quota enforcement with quota, usrquota and grpquota</div><div class='add'>+	  mount options.</div><div class='add'>+</div><div class='add'>+	  If unsure, say N.</div><div class='add'>+</div><div class='ctx'> config ARCH_SUPPORTS_HUGETLBFS</div><div class='ctx'> 	def_bool n</div><div class='ctx'> </div><div class='del'>-config HUGETLBFS</div><div class='add'>+menuconfig HUGETLBFS</div><div class='ctx'> 	bool "HugeTLB file system support"</div><div class='del'>-	depends on X86 || IA64 || SPARC64 || ARCH_SUPPORTS_HUGETLBFS || BROKEN</div><div class='add'>+	depends on ARCH_SUPPORTS_HUGETLBFS</div><div class='add'>+	select MEMFD_CREATE</div><div class='add'>+	select PADATA if SMP</div><div class='ctx'> 	help</div><div class='ctx'> 	  hugetlbfs is a filesystem backing for HugeTLB pages, based on</div><div class='ctx'> 	  ramfs. For architectures that support it, say Y here and read</div><div class='hunk'>@@ -242,26 +258,30 @@ config HUGETLBFS</div><div class='ctx'> </div><div class='ctx'> 	  If unsure, say N.</div><div class='ctx'> </div><div class='add'>+if HUGETLBFS</div><div class='add'>+config HUGETLB_PAGE_OPTIMIZE_VMEMMAP_DEFAULT_ON</div><div class='add'>+	bool "HugeTLB Vmemmap Optimization (HVO) defaults to on"</div><div class='add'>+	default n</div><div class='add'>+	depends on HUGETLB_PAGE_OPTIMIZE_VMEMMAP</div><div class='add'>+	help</div><div class='add'>+	  The HugeTLB Vmemmap Optimization (HVO) defaults to off. Say Y here to</div><div class='add'>+	  enable HVO by default. It can be disabled via hugetlb_free_vmemmap=off</div><div class='add'>+	  (boot command line) or hugetlb_optimize_vmemmap (sysctl).</div><div class='add'>+endif # HUGETLBFS</div><div class='add'>+</div><div class='ctx'> config HUGETLB_PAGE</div><div class='ctx'> 	def_bool HUGETLBFS</div><div class='add'>+	select XARRAY_MULTI</div><div class='ctx'> </div><div class='del'>-config HUGETLB_PAGE_FREE_VMEMMAP</div><div class='add'>+config HUGETLB_PAGE_OPTIMIZE_VMEMMAP</div><div class='ctx'> 	def_bool HUGETLB_PAGE</div><div class='del'>-	depends on X86_64</div><div class='add'>+	depends on ARCH_WANT_OPTIMIZE_HUGETLB_VMEMMAP</div><div class='ctx'> 	depends on SPARSEMEM_VMEMMAP</div><div class='add'>+	select SPARSEMEM_VMEMMAP_PREINIT if ARCH_WANT_HUGETLB_VMEMMAP_PREINIT</div><div class='ctx'> </div><div class='del'>-config HUGETLB_PAGE_FREE_VMEMMAP_DEFAULT_ON</div><div class='del'>-	bool "Default freeing vmemmap pages of HugeTLB to on"</div><div class='del'>-	default n</div><div class='del'>-	depends on HUGETLB_PAGE_FREE_VMEMMAP</div><div class='del'>-	help</div><div class='del'>-	  When using HUGETLB_PAGE_FREE_VMEMMAP, the freeing unused vmemmap</div><div class='del'>-	  pages associated with each HugeTLB page is default off. Say Y here</div><div class='del'>-	  to enable freeing vmemmap pages of HugeTLB by default. It can then</div><div class='del'>-	  be disabled on the command line via hugetlb_free_vmemmap=off.</div><div class='del'>-</div><div class='del'>-config MEMFD_CREATE</div><div class='del'>-	def_bool TMPFS || HUGETLBFS</div><div class='add'>+config HUGETLB_PMD_PAGE_TABLE_SHARING</div><div class='add'>+	def_bool HUGETLB_PAGE</div><div class='add'>+	depends on ARCH_WANT_HUGE_PMD_SHARE &amp;&amp; SPLIT_PMD_PTLOCKS</div><div class='ctx'> </div><div class='ctx'> config ARCH_HAS_GIGANTIC_PAGE</div><div class='ctx'> 	bool</div><div class='hunk'>@@ -306,9 +326,9 @@ source "fs/omfs/Kconfig"</div><div class='ctx'> source "fs/hpfs/Kconfig"</div><div class='ctx'> source "fs/qnx4/Kconfig"</div><div class='ctx'> source "fs/qnx6/Kconfig"</div><div class='add'>+source "fs/resctrl/Kconfig"</div><div class='ctx'> source "fs/romfs/Kconfig"</div><div class='ctx'> source "fs/pstore/Kconfig"</div><div class='del'>-source "fs/sysv/Kconfig"</div><div class='ctx'> source "fs/ufs/Kconfig"</div><div class='ctx'> source "fs/erofs/Kconfig"</div><div class='ctx'> source "fs/vboxsf/Kconfig"</div><div class='hunk'>@@ -340,11 +360,12 @@ config GRACE_PERIOD</div><div class='ctx'> config LOCKD</div><div class='ctx'> 	tristate</div><div class='ctx'> 	depends on FILE_LOCKING</div><div class='add'>+	select CRC32</div><div class='ctx'> 	select GRACE_PERIOD</div><div class='ctx'> </div><div class='ctx'> config LOCKD_V4</div><div class='ctx'> 	bool</div><div class='del'>-	depends on NFSD_V3 || NFS_V3</div><div class='add'>+	depends on NFSD || NFS_V3</div><div class='ctx'> 	depends on FILE_LOCKING</div><div class='ctx'> 	default y</div><div class='ctx'> </div><div class='hunk'>@@ -357,6 +378,29 @@ config NFS_COMMON</div><div class='ctx'> 	depends on NFSD || NFS_FS || LOCKD</div><div class='ctx'> 	default y</div><div class='ctx'> </div><div class='add'>+config NFS_COMMON_LOCALIO_SUPPORT</div><div class='add'>+	tristate</div><div class='add'>+	depends on NFS_LOCALIO</div><div class='add'>+	default y if NFSD=y || NFS_FS=y</div><div class='add'>+	default m if NFSD=m &amp;&amp; NFS_FS=m</div><div class='add'>+	select SUNRPC</div><div class='add'>+</div><div class='add'>+config NFS_LOCALIO</div><div class='add'>+	bool "NFS client and server support for LOCALIO auxiliary protocol"</div><div class='add'>+	depends on NFSD &amp;&amp; NFS_FS</div><div class='add'>+	select NFS_COMMON_LOCALIO_SUPPORT</div><div class='add'>+	default n</div><div class='add'>+	help</div><div class='add'>+	  Some NFS servers support an auxiliary NFS LOCALIO protocol</div><div class='add'>+	  that is not an official part of the NFS protocol.</div><div class='add'>+</div><div class='add'>+	  This option enables support for the LOCALIO protocol in the</div><div class='add'>+	  kernel's NFS server and client. Enable this to permit local</div><div class='add'>+	  NFS clients to bypass the network when issuing reads and</div><div class='add'>+	  writes to the local NFS server.</div><div class='add'>+</div><div class='add'>+	  If unsure, say N.</div><div class='add'>+</div><div class='ctx'> config NFS_V4_2_SSC_HELPER</div><div class='ctx'> 	bool</div><div class='ctx'> 	default y if NFS_V4_2</div><div class='hunk'>@@ -364,14 +408,7 @@ config NFS_V4_2_SSC_HELPER</div><div class='ctx'> source "net/sunrpc/Kconfig"</div><div class='ctx'> source "fs/ceph/Kconfig"</div><div class='ctx'> </div><div class='del'>-source "fs/cifs/Kconfig"</div><div class='del'>-source "fs/ksmbd/Kconfig"</div><div class='del'>-</div><div class='del'>-config SMBFS_COMMON</div><div class='del'>-	tristate</div><div class='del'>-	default y if CIFS=y</div><div class='del'>-	default m if CIFS=m</div><div class='del'>-</div><div class='add'>+source "fs/smb/Kconfig"</div><div class='ctx'> source "fs/coda/Kconfig"</div><div class='ctx'> source "fs/afs/Kconfig"</div><div class='ctx'> source "fs/9p/Kconfig"</div><div class='head'>diff --git a/fs/Kconfig.binfmt b/fs/Kconfig.binfmt<br/>index 4d5ae61580aa..1949e25c7741 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/Kconfig.binfmt?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/Kconfig.binfmt</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/Kconfig.binfmt?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/Kconfig.binfmt</a></div><div class='hunk'>@@ -28,6 +28,16 @@ config BINFMT_ELF</div><div class='ctx'> 	  ld.so (check the file &lt;file:Documentation/Changes&gt; for location and</div><div class='ctx'> 	  latest version).</div><div class='ctx'> </div><div class='add'>+config BINFMT_ELF_KUNIT_TEST</div><div class='add'>+	bool "Build KUnit tests for ELF binary support" if !KUNIT_ALL_TESTS</div><div class='add'>+	depends on KUNIT=y &amp;&amp; BINFMT_ELF=y</div><div class='add'>+	default KUNIT_ALL_TESTS</div><div class='add'>+	help</div><div class='add'>+	  This builds the ELF loader KUnit tests, which try to gather</div><div class='add'>+	  prior bug fixes into a regression test collection. This is really</div><div class='add'>+	  only needed for debugging. Note that with CONFIG_COMPAT=y, the</div><div class='add'>+	  compat_binfmt_elf KUnit test is also created.</div><div class='add'>+</div><div class='ctx'> config COMPAT_BINFMT_ELF</div><div class='ctx'> 	def_bool y</div><div class='ctx'> 	depends on COMPAT &amp;&amp; BINFMT_ELF</div><div class='hunk'>@@ -36,6 +46,9 @@ config COMPAT_BINFMT_ELF</div><div class='ctx'> config ARCH_BINFMT_ELF_STATE</div><div class='ctx'> 	bool</div><div class='ctx'> </div><div class='add'>+config ARCH_BINFMT_ELF_EXTRA_PHDRS</div><div class='add'>+	bool</div><div class='add'>+</div><div class='ctx'> config ARCH_HAVE_ELF_PROT</div><div class='ctx'> 	bool</div><div class='ctx'> </div><div class='hunk'>@@ -45,7 +58,7 @@ config ARCH_USE_GNU_PROPERTY</div><div class='ctx'> config BINFMT_ELF_FDPIC</div><div class='ctx'> 	bool "Kernel support for FDPIC ELF binaries"</div><div class='ctx'> 	default y if !BINFMT_ELF</div><div class='del'>-	depends on (ARM || (SUPERH &amp;&amp; !MMU))</div><div class='add'>+	depends on ARM || ((M68K || RISCV || SUPERH || XTENSA) &amp;&amp; !MMU)</div><div class='ctx'> 	select ELFCORE</div><div class='ctx'> 	help</div><div class='ctx'> 	  ELF FDPIC binaries are based on ELF, but allow the individual load</div><div class='hunk'>@@ -129,45 +142,6 @@ config BINFMT_ZFLAT</div><div class='ctx'> 	help</div><div class='ctx'> 	  Support FLAT format compressed binaries</div><div class='ctx'> </div><div class='del'>-config BINFMT_SHARED_FLAT</div><div class='del'>-	bool "Enable shared FLAT support"</div><div class='del'>-	depends on BINFMT_FLAT</div><div class='del'>-	help</div><div class='del'>-	  Support FLAT shared libraries</div><div class='del'>-</div><div class='del'>-config HAVE_AOUT</div><div class='del'>-       def_bool n</div><div class='del'>-</div><div class='del'>-config BINFMT_AOUT</div><div class='del'>-	tristate "Kernel support for a.out and ECOFF binaries"</div><div class='del'>-	depends on HAVE_AOUT</div><div class='del'>-	help</div><div class='del'>-	  A.out (Assembler.OUTput) is a set of formats for libraries and</div><div class='del'>-	  executables used in the earliest versions of UNIX.  Linux used</div><div class='del'>-	  the a.out formats QMAGIC and ZMAGIC until they were replaced</div><div class='del'>-	  with the ELF format.</div><div class='del'>-</div><div class='del'>-	  The conversion to ELF started in 1995.  This option is primarily</div><div class='del'>-	  provided for historical interest and for the benefit of those</div><div class='del'>-	  who need to run binaries from that era.</div><div class='del'>-</div><div class='del'>-	  Most people should answer N here.  If you think you may have</div><div class='del'>-	  occasional use for this format, enable module support above</div><div class='del'>-	  and answer M here to compile this support as a module called</div><div class='del'>-	  binfmt_aout.</div><div class='del'>-</div><div class='del'>-	  If any crucial components of your system (such as /sbin/init</div><div class='del'>-	  or /lib/ld.so) are still in a.out format, you will have to</div><div class='del'>-	  say Y here.</div><div class='del'>-</div><div class='del'>-config OSF4_COMPAT</div><div class='del'>-	bool "OSF/1 v4 readv/writev compatibility"</div><div class='del'>-	depends on ALPHA &amp;&amp; BINFMT_AOUT</div><div class='del'>-	help</div><div class='del'>-	  Say Y if you are using OSF/1 binaries (like Netscape and Acrobat)</div><div class='del'>-	  with v4 shared libraries freely available from Compaq. If you're</div><div class='del'>-	  going to use shared libraries from Tru64 version 5.0 or later, say N.</div><div class='del'>-</div><div class='ctx'> config BINFMT_MISC</div><div class='ctx'> 	tristate "Kernel support for MISC binaries"</div><div class='ctx'> 	help</div><div class='hunk'>@@ -202,4 +176,21 @@ config COREDUMP</div><div class='ctx'> 	  certainly want to say Y here. Not necessary on systems that never</div><div class='ctx'> 	  need debugging or only ever run flawless code.</div><div class='ctx'> </div><div class='add'>+config EXEC_KUNIT_TEST</div><div class='add'>+	bool "Build execve tests" if !KUNIT_ALL_TESTS</div><div class='add'>+	depends on KUNIT=y</div><div class='add'>+	default KUNIT_ALL_TESTS</div><div class='add'>+	help</div><div class='add'>+	  This builds the exec KUnit tests, which tests boundary conditions</div><div class='add'>+	  of various aspects of the exec internals.</div><div class='add'>+</div><div class='add'>+config ARCH_HAS_ELF_CORE_EFLAGS</div><div class='add'>+	bool</div><div class='add'>+	depends on BINFMT_ELF &amp;&amp; ELF_CORE</div><div class='add'>+	default n</div><div class='add'>+	help</div><div class='add'>+	  Select this option if the architecture makes use of the e_flags</div><div class='add'>+	  field in the ELF header to store ABI or other architecture-specific</div><div class='add'>+	  information that should be preserved in core dumps.</div><div class='add'>+</div><div class='ctx'> endmenu</div><div class='head'>diff --git a/fs/Makefile b/fs/Makefile<br/>index 84c5e4cdfee5..a04274a3c854 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/Makefile?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/Makefile</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/Makefile?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/Makefile</a></div><div class='hunk'>@@ -6,6 +6,7 @@</div><div class='ctx'> # Rewritten to use lists instead of if-statements.</div><div class='ctx'> # </div><div class='ctx'> </div><div class='add'>+</div><div class='ctx'> obj-y :=	open.o read_write.o file_table.o super.o \</div><div class='ctx'> 		char_dev.o stat.o exec.o pipe.o namei.o fcntl.o \</div><div class='ctx'> 		ioctl.o readdir.o select.o dcache.o inode.o \</div><div class='hunk'>@@ -13,17 +14,13 @@ obj-y :=	open.o read_write.o file_table.o super.o \</div><div class='ctx'> 		seq_file.o xattr.o libfs.o fs-writeback.o \</div><div class='ctx'> 		pnode.o splice.o sync.o utimes.o d_path.o \</div><div class='ctx'> 		stack.o fs_struct.o statfs.o fs_pin.o nsfs.o \</div><div class='del'>-		fs_types.o fs_context.o fs_parser.o fsopen.o init.o \</div><div class='del'>-		kernel_read_file.o remap_range.o</div><div class='del'>-</div><div class='del'>-ifeq ($(CONFIG_BLOCK),y)</div><div class='del'>-obj-y +=	buffer.o direct-io.o mpage.o</div><div class='del'>-else</div><div class='del'>-obj-y +=	no-block.o</div><div class='del'>-endif</div><div class='del'>-</div><div class='del'>-obj-$(CONFIG_PROC_FS) += proc_namespace.o</div><div class='add'>+		fs_dirent.o fs_context.o fs_parser.o fsopen.o init.o \</div><div class='add'>+		kernel_read_file.o mnt_idmapping.o remap_range.o pidfs.o \</div><div class='add'>+		file_attr.o</div><div class='ctx'> </div><div class='add'>+obj-$(CONFIG_BUFFER_HEAD)	+= buffer.o mpage.o</div><div class='add'>+obj-$(CONFIG_PROC_FS)		+= proc_namespace.o</div><div class='add'>+obj-$(CONFIG_LEGACY_DIRECT_IO)	+= direct-io.o</div><div class='ctx'> obj-y				+= notify/</div><div class='ctx'> obj-$(CONFIG_EPOLL)		+= eventpoll.o</div><div class='ctx'> obj-y				+= anon_inodes.o</div><div class='hunk'>@@ -32,13 +29,10 @@ obj-$(CONFIG_TIMERFD)		+= timerfd.o</div><div class='ctx'> obj-$(CONFIG_EVENTFD)		+= eventfd.o</div><div class='ctx'> obj-$(CONFIG_USERFAULTFD)	+= userfaultfd.o</div><div class='ctx'> obj-$(CONFIG_AIO)               += aio.o</div><div class='del'>-obj-$(CONFIG_IO_URING)		+= io_uring.o</div><div class='del'>-obj-$(CONFIG_IO_WQ)		+= io-wq.o</div><div class='ctx'> obj-$(CONFIG_FS_DAX)		+= dax.o</div><div class='ctx'> obj-$(CONFIG_FS_ENCRYPTION)	+= crypto/</div><div class='ctx'> obj-$(CONFIG_FS_VERITY)		+= verity/</div><div class='ctx'> obj-$(CONFIG_FILE_LOCKING)      += locks.o</div><div class='del'>-obj-$(CONFIG_BINFMT_AOUT)	+= binfmt_aout.o</div><div class='ctx'> obj-$(CONFIG_BINFMT_MISC)	+= binfmt_misc.o</div><div class='ctx'> obj-$(CONFIG_BINFMT_SCRIPT)	+= binfmt_script.o</div><div class='ctx'> obj-$(CONFIG_BINFMT_ELF)	+= binfmt_elf.o</div><div class='hunk'>@@ -46,11 +40,12 @@ obj-$(CONFIG_COMPAT_BINFMT_ELF)	+= compat_binfmt_elf.o</div><div class='ctx'> obj-$(CONFIG_BINFMT_ELF_FDPIC)	+= binfmt_elf_fdpic.o</div><div class='ctx'> obj-$(CONFIG_BINFMT_FLAT)	+= binfmt_flat.o</div><div class='ctx'> </div><div class='add'>+obj-$(CONFIG_FS_STACK)		+= backing-file.o</div><div class='ctx'> obj-$(CONFIG_FS_MBCACHE)	+= mbcache.o</div><div class='ctx'> obj-$(CONFIG_FS_POSIX_ACL)	+= posix_acl.o</div><div class='ctx'> obj-$(CONFIG_NFS_COMMON)	+= nfs_common/</div><div class='ctx'> obj-$(CONFIG_COREDUMP)		+= coredump.o</div><div class='del'>-obj-$(CONFIG_SYSCTL)		+= drop_caches.o</div><div class='add'>+obj-$(CONFIG_SYSCTL)		+= drop_caches.o sysctls.o</div><div class='ctx'> </div><div class='ctx'> obj-$(CONFIG_FHANDLE)		+= fhandle.o</div><div class='ctx'> obj-y				+= iomap/</div><div class='hunk'>@@ -67,8 +62,6 @@ obj-$(CONFIG_DLM)		+= dlm/</div><div class='ctx'>  </div><div class='ctx'> # Do not add any filesystems before this line</div><div class='ctx'> obj-$(CONFIG_NETFS_SUPPORT)	+= netfs/</div><div class='del'>-obj-$(CONFIG_FSCACHE)		+= fscache/</div><div class='del'>-obj-$(CONFIG_REISERFS_FS)	+= reiserfs/</div><div class='ctx'> obj-$(CONFIG_EXT4_FS)		+= ext4/</div><div class='ctx'> # We place ext4 before ext2 so that clean ext3 root fs's do NOT mount using the</div><div class='ctx'> # ext2 driver, which doesn't know about journalling!  Explicitly request ext2</div><div class='hunk'>@@ -94,13 +87,9 @@ obj-$(CONFIG_EXPORTFS)		+= exportfs/</div><div class='ctx'> obj-$(CONFIG_NFSD)		+= nfsd/</div><div class='ctx'> obj-$(CONFIG_LOCKD)		+= lockd/</div><div class='ctx'> obj-$(CONFIG_NLS)		+= nls/</div><div class='del'>-obj-$(CONFIG_UNICODE)		+= unicode/</div><div class='del'>-obj-$(CONFIG_SYSV_FS)		+= sysv/</div><div class='del'>-obj-$(CONFIG_SMBFS_COMMON)	+= smbfs_common/</div><div class='del'>-obj-$(CONFIG_CIFS)		+= cifs/</div><div class='del'>-obj-$(CONFIG_SMB_SERVER)	+= ksmbd/</div><div class='add'>+obj-y				+= unicode/</div><div class='add'>+obj-$(CONFIG_SMBFS)		+= smb/</div><div class='ctx'> obj-$(CONFIG_HPFS_FS)		+= hpfs/</div><div class='del'>-obj-$(CONFIG_NTFS_FS)		+= ntfs/</div><div class='ctx'> obj-$(CONFIG_NTFS3_FS)		+= ntfs3/</div><div class='ctx'> obj-$(CONFIG_UFS_FS)		+= ufs/</div><div class='ctx'> obj-$(CONFIG_EFS_FS)		+= efs/</div><div class='hunk'>@@ -124,7 +113,7 @@ obj-$(CONFIG_9P_FS)		+= 9p/</div><div class='ctx'> obj-$(CONFIG_AFS_FS)		+= afs/</div><div class='ctx'> obj-$(CONFIG_NILFS2_FS)		+= nilfs2/</div><div class='ctx'> obj-$(CONFIG_BEFS_FS)		+= befs/</div><div class='del'>-obj-$(CONFIG_HOSTFS)		+= hostfs/</div><div class='add'>+obj-y				+= hostfs/</div><div class='ctx'> obj-$(CONFIG_CACHEFILES)	+= cachefiles/</div><div class='ctx'> obj-$(CONFIG_DEBUG_FS)		+= debugfs/</div><div class='ctx'> obj-$(CONFIG_TRACING)		+= tracefs/</div><div class='hunk'>@@ -138,3 +127,5 @@ obj-$(CONFIG_EFIVAR_FS)		+= efivarfs/</div><div class='ctx'> obj-$(CONFIG_EROFS_FS)		+= erofs/</div><div class='ctx'> obj-$(CONFIG_VBOXSF_FS)		+= vboxsf/</div><div class='ctx'> obj-$(CONFIG_ZONEFS_FS)		+= zonefs/</div><div class='add'>+obj-$(CONFIG_BPF_LSM)		+= bpf_fs_kfuncs.o</div><div class='add'>+obj-$(CONFIG_RESCTRL_FS)	+= resctrl/</div><div class='head'>diff --git a/fs/adfs/Kconfig b/fs/adfs/Kconfig<br/>index 44738fed6625..1b97058f0c4a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/adfs/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/adfs/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/adfs/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/adfs/Kconfig</a></div><div class='hunk'>@@ -2,6 +2,7 @@</div><div class='ctx'> config ADFS_FS</div><div class='ctx'> 	tristate "ADFS file system support"</div><div class='ctx'> 	depends on BLOCK</div><div class='add'>+	select BUFFER_HEAD</div><div class='ctx'> 	help</div><div class='ctx'> 	  The Acorn Disc Filing System is the standard file system of the</div><div class='ctx'> 	  RiscOS operating system which runs on Acorn's ARM-based Risc PC</div><div class='head'>diff --git a/fs/adfs/adfs.h b/fs/adfs/adfs.h<br/>index 06b7c92343ad..223f0283d20f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/adfs/adfs.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/adfs/adfs.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/adfs/adfs.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/adfs/adfs.h</a></div><div class='hunk'>@@ -144,7 +144,7 @@ struct adfs_discmap {</div><div class='ctx'> /* Inode stuff */</div><div class='ctx'> struct inode *adfs_iget(struct super_block *sb, struct object_info *obj);</div><div class='ctx'> int adfs_write_inode(struct inode *inode, struct writeback_control *wbc);</div><div class='del'>-int adfs_notify_change(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='add'>+int adfs_notify_change(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		       struct iattr *attr);</div><div class='ctx'> </div><div class='ctx'> /* map.c */</div><div class='head'>diff --git a/fs/adfs/dir_f.h b/fs/adfs/dir_f.h<br/>index a5393e6cf9f4..4e6c53d59ebd 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/adfs/dir_f.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/adfs/dir_f.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/adfs/dir_f.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/adfs/dir_f.h</a></div><div class='hunk'>@@ -58,9 +58,4 @@ struct adfs_newdirtail {</div><div class='ctx'> 	__u8 dircheckbyte;</div><div class='ctx'> } __attribute__((packed));</div><div class='ctx'> </div><div class='del'>-union adfs_dirtail {</div><div class='del'>-	struct adfs_olddirtail old;</div><div class='del'>-	struct adfs_newdirtail new;</div><div class='del'>-};</div><div class='del'>-</div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/adfs/file.c b/fs/adfs/file.c<br/>index 754afb14a6ff..cd13165fd904 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/adfs/file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/adfs/file.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/adfs/file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/adfs/file.c</a></div><div class='hunk'>@@ -25,10 +25,10 @@</div><div class='ctx'> const struct file_operations adfs_file_operations = {</div><div class='ctx'> 	.llseek		= generic_file_llseek,</div><div class='ctx'> 	.read_iter	= generic_file_read_iter,</div><div class='del'>-	.mmap		= generic_file_mmap,</div><div class='add'>+	.mmap_prepare	= generic_file_mmap_prepare,</div><div class='ctx'> 	.fsync		= generic_file_fsync,</div><div class='ctx'> 	.write_iter	= generic_file_write_iter,</div><div class='del'>-	.splice_read	= generic_file_splice_read,</div><div class='add'>+	.splice_read	= filemap_splice_read,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct inode_operations adfs_file_inode_operations = {</div><div class='head'>diff --git a/fs/adfs/inode.c b/fs/adfs/inode.c<br/>index adbb3a1edcbf..6830f8bc8d4e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/adfs/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/adfs/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/adfs/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/adfs/inode.c</a></div><div class='hunk'>@@ -5,6 +5,7 @@</div><div class='ctx'>  *  Copyright (C) 1997-1999 Russell King</div><div class='ctx'>  */</div><div class='ctx'> #include &lt;linux/buffer_head.h&gt;</div><div class='add'>+#include &lt;linux/mpage.h&gt;</div><div class='ctx'> #include &lt;linux/writeback.h&gt;</div><div class='ctx'> #include "adfs.h"</div><div class='ctx'> </div><div class='hunk'>@@ -33,14 +34,15 @@ abort_toobig:</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int adfs_writepage(struct page *page, struct writeback_control *wbc)</div><div class='add'>+static int adfs_writepages(struct address_space *mapping,</div><div class='add'>+		struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='del'>-	return block_write_full_page(page, adfs_get_block, wbc);</div><div class='add'>+	return mpage_writepages(mapping, wbc, adfs_get_block);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int adfs_readpage(struct file *file, struct page *page)</div><div class='add'>+static int adfs_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	return block_read_full_page(page, adfs_get_block);</div><div class='add'>+	return block_read_full_folio(folio, adfs_get_block);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void adfs_write_failed(struct address_space *mapping, loff_t to)</div><div class='hunk'>@@ -51,14 +53,14 @@ static void adfs_write_failed(struct address_space *mapping, loff_t to)</div><div class='ctx'> 		truncate_pagecache(inode, inode-&gt;i_size);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int adfs_write_begin(struct file *file, struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned flags,</div><div class='del'>-			struct page **pagep, void **fsdata)</div><div class='add'>+static int adfs_write_begin(const struct kiocb *iocb,</div><div class='add'>+			    struct address_space *mapping,</div><div class='add'>+			    loff_t pos, unsigned len,</div><div class='add'>+			    struct folio **foliop, void **fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	*pagep = NULL;</div><div class='del'>-	ret = cont_write_begin(file, mapping, pos, len, flags, pagep, fsdata,</div><div class='add'>+	ret = cont_write_begin(iocb, mapping, pos, len, foliop, fsdata,</div><div class='ctx'> 				adfs_get_block,</div><div class='ctx'> 				&amp;ADFS_I(mapping-&gt;host)-&gt;mmu_private);</div><div class='ctx'> 	if (unlikely(ret))</div><div class='hunk'>@@ -73,12 +75,14 @@ static sector_t _adfs_bmap(struct address_space *mapping, sector_t block)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct address_space_operations adfs_aops = {</div><div class='del'>-	.set_page_dirty	= __set_page_dirty_buffers,</div><div class='del'>-	.readpage	= adfs_readpage,</div><div class='del'>-	.writepage	= adfs_writepage,</div><div class='add'>+	.dirty_folio	= block_dirty_folio,</div><div class='add'>+	.invalidate_folio = block_invalidate_folio,</div><div class='add'>+	.read_folio	= adfs_read_folio,</div><div class='add'>+	.writepages	= adfs_writepages,</div><div class='ctx'> 	.write_begin	= adfs_write_begin,</div><div class='ctx'> 	.write_end	= generic_write_end,</div><div class='del'>-	.bmap		= _adfs_bmap</div><div class='add'>+	.migrate_folio	= buffer_migrate_folio,</div><div class='add'>+	.bmap		= _adfs_bmap,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -241,6 +245,7 @@ struct inode *</div><div class='ctx'> adfs_iget(struct super_block *sb, struct object_info *obj)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='add'>+	struct timespec64 ts;</div><div class='ctx'> </div><div class='ctx'> 	inode = new_inode(sb);</div><div class='ctx'> 	if (!inode)</div><div class='hunk'>@@ -267,9 +272,10 @@ adfs_iget(struct super_block *sb, struct object_info *obj)</div><div class='ctx'> 	ADFS_I(inode)-&gt;attr      = obj-&gt;attr;</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_mode	 = adfs_atts2mode(sb, inode);</div><div class='del'>-	adfs_adfs2unix_time(&amp;inode-&gt;i_mtime, inode);</div><div class='del'>-	inode-&gt;i_atime = inode-&gt;i_mtime;</div><div class='del'>-	inode-&gt;i_ctime = inode-&gt;i_mtime;</div><div class='add'>+	adfs_adfs2unix_time(&amp;ts, inode);</div><div class='add'>+	inode_set_atime_to_ts(inode, ts);</div><div class='add'>+	inode_set_mtime_to_ts(inode, ts);</div><div class='add'>+	inode_set_ctime_to_ts(inode, ts);</div><div class='ctx'> </div><div class='ctx'> 	if (S_ISDIR(inode-&gt;i_mode)) {</div><div class='ctx'> 		inode-&gt;i_op	= &amp;adfs_dir_inode_operations;</div><div class='hunk'>@@ -293,7 +299,7 @@ out:</div><div class='ctx'>  * later.</div><div class='ctx'>  */</div><div class='ctx'> int</div><div class='del'>-adfs_notify_change(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='add'>+adfs_notify_change(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		   struct iattr *attr)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='hunk'>@@ -301,7 +307,7 @@ adfs_notify_change(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 	unsigned int ia_valid = attr-&gt;ia_valid;</div><div class='ctx'> 	int error;</div><div class='ctx'> 	</div><div class='del'>-	error = setattr_prepare(&amp;init_user_ns, dentry, attr);</div><div class='add'>+	error = setattr_prepare(&amp;nop_mnt_idmap, dentry, attr);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * we can't change the UID or GID of any file -</div><div class='hunk'>@@ -320,7 +326,8 @@ adfs_notify_change(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> </div><div class='ctx'> 	if (ia_valid &amp; ATTR_MTIME &amp;&amp; adfs_inode_is_stamped(inode)) {</div><div class='ctx'> 		adfs_unix2adfs_time(inode, &amp;attr-&gt;ia_mtime);</div><div class='del'>-		adfs_adfs2unix_time(&amp;inode-&gt;i_mtime, inode);</div><div class='add'>+		adfs_adfs2unix_time(&amp;attr-&gt;ia_mtime, inode);</div><div class='add'>+		inode_set_mtime_to_ts(inode, attr-&gt;ia_mtime);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -328,9 +335,9 @@ adfs_notify_change(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 	 * have the ability to represent them in our filesystem?</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (ia_valid &amp; ATTR_ATIME)</div><div class='del'>-		inode-&gt;i_atime = attr-&gt;ia_atime;</div><div class='add'>+		inode_set_atime_to_ts(inode, attr-&gt;ia_atime);</div><div class='ctx'> 	if (ia_valid &amp; ATTR_CTIME)</div><div class='del'>-		inode-&gt;i_ctime = attr-&gt;ia_ctime;</div><div class='add'>+		inode_set_ctime_to_ts(inode, attr-&gt;ia_ctime);</div><div class='ctx'> 	if (ia_valid &amp; ATTR_MODE) {</div><div class='ctx'> 		ADFS_I(inode)-&gt;attr = adfs_mode2atts(sb, inode, attr-&gt;ia_mode);</div><div class='ctx'> 		inode-&gt;i_mode = adfs_atts2mode(sb, inode);</div><div class='hunk'>@@ -355,7 +362,6 @@ int adfs_write_inode(struct inode *inode, struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	struct object_info obj;</div><div class='del'>-	int ret;</div><div class='ctx'> </div><div class='ctx'> 	obj.indaddr	= ADFS_I(inode)-&gt;indaddr;</div><div class='ctx'> 	obj.name_len	= 0;</div><div class='hunk'>@@ -365,6 +371,5 @@ int adfs_write_inode(struct inode *inode, struct writeback_control *wbc)</div><div class='ctx'> 	obj.attr	= ADFS_I(inode)-&gt;attr;</div><div class='ctx'> 	obj.size	= inode-&gt;i_size;</div><div class='ctx'> </div><div class='del'>-	ret = adfs_dir_update(sb, &amp;obj, wbc-&gt;sync_mode == WB_SYNC_ALL);</div><div class='del'>-	return ret;</div><div class='add'>+	return adfs_dir_update(sb, &amp;obj, wbc-&gt;sync_mode == WB_SYNC_ALL);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/adfs/map.c b/fs/adfs/map.c<br/>index a81de80c45c1..a0ce272b4098 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/adfs/map.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/adfs/map.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/adfs/map.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/adfs/map.c</a></div><div class='hunk'>@@ -6,7 +6,7 @@</div><div class='ctx'>  */</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/statfs.h&gt;</div><div class='del'>-#include &lt;asm/unaligned.h&gt;</div><div class='add'>+#include &lt;linux/unaligned.h&gt;</div><div class='ctx'> #include "adfs.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='head'>diff --git a/fs/adfs/super.c b/fs/adfs/super.c<br/>index bdbd26e571ed..fdccdbbfc213 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/adfs/super.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/adfs/super.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/adfs/super.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/adfs/super.c</a></div><div class='hunk'>@@ -6,7 +6,8 @@</div><div class='ctx'>  */</div><div class='ctx'> #include &lt;linux/module.h&gt;</div><div class='ctx'> #include &lt;linux/init.h&gt;</div><div class='del'>-#include &lt;linux/parser.h&gt;</div><div class='add'>+#include &lt;linux/fs_parser.h&gt;</div><div class='add'>+#include &lt;linux/fs_context.h&gt;</div><div class='ctx'> #include &lt;linux/mount.h&gt;</div><div class='ctx'> #include &lt;linux/seq_file.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='hunk'>@@ -115,87 +116,61 @@ static int adfs_show_options(struct seq_file *seq, struct dentry *root)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-enum {Opt_uid, Opt_gid, Opt_ownmask, Opt_othmask, Opt_ftsuffix, Opt_err};</div><div class='add'>+enum {Opt_uid, Opt_gid, Opt_ownmask, Opt_othmask, Opt_ftsuffix};</div><div class='ctx'> </div><div class='del'>-static const match_table_t tokens = {</div><div class='del'>-	{Opt_uid, "uid=%u"},</div><div class='del'>-	{Opt_gid, "gid=%u"},</div><div class='del'>-	{Opt_ownmask, "ownmask=%o"},</div><div class='del'>-	{Opt_othmask, "othmask=%o"},</div><div class='del'>-	{Opt_ftsuffix, "ftsuffix=%u"},</div><div class='del'>-	{Opt_err, NULL}</div><div class='add'>+static const struct fs_parameter_spec adfs_param_spec[] = {</div><div class='add'>+	fsparam_uid	("uid",		Opt_uid),</div><div class='add'>+	fsparam_gid	("gid",		Opt_gid),</div><div class='add'>+	fsparam_u32oct	("ownmask",	Opt_ownmask),</div><div class='add'>+	fsparam_u32oct	("othmask",	Opt_othmask),</div><div class='add'>+	fsparam_u32	("ftsuffix",	Opt_ftsuffix),</div><div class='add'>+	{}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int parse_options(struct super_block *sb, struct adfs_sb_info *asb,</div><div class='del'>-			 char *options)</div><div class='add'>+static int adfs_parse_param(struct fs_context *fc, struct fs_parameter *param)</div><div class='ctx'> {</div><div class='del'>-	char *p;</div><div class='del'>-	int option;</div><div class='del'>-</div><div class='del'>-	if (!options)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	while ((p = strsep(&amp;options, ",")) != NULL) {</div><div class='del'>-		substring_t args[MAX_OPT_ARGS];</div><div class='del'>-		int token;</div><div class='del'>-		if (!*p)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		token = match_token(p, tokens, args);</div><div class='del'>-		switch (token) {</div><div class='del'>-		case Opt_uid:</div><div class='del'>-			if (match_int(args, &amp;option))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			asb-&gt;s_uid = make_kuid(current_user_ns(), option);</div><div class='del'>-			if (!uid_valid(asb-&gt;s_uid))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_gid:</div><div class='del'>-			if (match_int(args, &amp;option))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			asb-&gt;s_gid = make_kgid(current_user_ns(), option);</div><div class='del'>-			if (!gid_valid(asb-&gt;s_gid))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_ownmask:</div><div class='del'>-			if (match_octal(args, &amp;option))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			asb-&gt;s_owner_mask = option;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_othmask:</div><div class='del'>-			if (match_octal(args, &amp;option))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			asb-&gt;s_other_mask = option;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_ftsuffix:</div><div class='del'>-			if (match_int(args, &amp;option))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			asb-&gt;s_ftsuffix = option;</div><div class='del'>-			break;</div><div class='del'>-		default:</div><div class='del'>-			adfs_msg(sb, KERN_ERR,</div><div class='del'>-				 "unrecognised mount option \"%s\" or missing value",</div><div class='del'>-				 p);</div><div class='del'>-			return -EINVAL;</div><div class='del'>-		}</div><div class='add'>+	struct adfs_sb_info *asb = fc-&gt;s_fs_info;</div><div class='add'>+	struct fs_parse_result result;</div><div class='add'>+	int opt;</div><div class='add'>+</div><div class='add'>+	opt = fs_parse(fc, adfs_param_spec, param, &amp;result);</div><div class='add'>+	if (opt &lt; 0)</div><div class='add'>+		return opt;</div><div class='add'>+</div><div class='add'>+	switch (opt) {</div><div class='add'>+	case Opt_uid:</div><div class='add'>+		asb-&gt;s_uid = result.uid;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_gid:</div><div class='add'>+		asb-&gt;s_gid = result.gid;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_ownmask:</div><div class='add'>+		asb-&gt;s_owner_mask = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_othmask:</div><div class='add'>+		asb-&gt;s_other_mask = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_ftsuffix:</div><div class='add'>+		asb-&gt;s_ftsuffix = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int adfs_remount(struct super_block *sb, int *flags, char *data)</div><div class='add'>+static int adfs_reconfigure(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	struct adfs_sb_info temp_asb;</div><div class='del'>-	int ret;</div><div class='add'>+	struct adfs_sb_info *new_asb = fc-&gt;s_fs_info;</div><div class='add'>+	struct adfs_sb_info *asb = ADFS_SB(fc-&gt;root-&gt;d_sb);</div><div class='ctx'> </div><div class='del'>-	sync_filesystem(sb);</div><div class='del'>-	*flags |= ADFS_SB_FLAGS;</div><div class='add'>+	sync_filesystem(fc-&gt;root-&gt;d_sb);</div><div class='add'>+	fc-&gt;sb_flags |= ADFS_SB_FLAGS;</div><div class='ctx'> </div><div class='del'>-	temp_asb = *ADFS_SB(sb);</div><div class='del'>-	ret = parse_options(sb, &amp;temp_asb, data);</div><div class='del'>-	if (ret == 0)</div><div class='del'>-		*ADFS_SB(sb) = temp_asb;</div><div class='add'>+	/* Structure copy newly parsed options */</div><div class='add'>+	*asb = *new_asb;</div><div class='ctx'> </div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int adfs_statfs(struct dentry *dentry, struct kstatfs *buf)</div><div class='hunk'>@@ -220,7 +195,7 @@ static struct kmem_cache *adfs_inode_cachep;</div><div class='ctx'> static struct inode *adfs_alloc_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct adfs_inode_info *ei;</div><div class='del'>-	ei = kmem_cache_alloc(adfs_inode_cachep, GFP_KERNEL);</div><div class='add'>+	ei = alloc_inode_sb(sb, adfs_inode_cachep, GFP_KERNEL);</div><div class='ctx'> 	if (!ei)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	return &amp;ei-&gt;vfs_inode;</div><div class='hunk'>@@ -249,7 +224,7 @@ static int __init init_inodecache(void)</div><div class='ctx'> 	adfs_inode_cachep = kmem_cache_create("adfs_inode_cache",</div><div class='ctx'> 					     sizeof(struct adfs_inode_info),</div><div class='ctx'> 					     0, (SLAB_RECLAIM_ACCOUNT|</div><div class='del'>-						SLAB_MEM_SPREAD|SLAB_ACCOUNT),</div><div class='add'>+						SLAB_ACCOUNT),</div><div class='ctx'> 					     init_once);</div><div class='ctx'> 	if (adfs_inode_cachep == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='hunk'>@@ -273,7 +248,6 @@ static const struct super_operations adfs_sops = {</div><div class='ctx'> 	.write_inode	= adfs_write_inode,</div><div class='ctx'> 	.put_super	= adfs_put_super,</div><div class='ctx'> 	.statfs		= adfs_statfs,</div><div class='del'>-	.remount_fs	= adfs_remount,</div><div class='ctx'> 	.show_options	= adfs_show_options,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -361,34 +335,21 @@ static int adfs_validate_dr0(struct super_block *sb, struct buffer_head *bh,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int adfs_fill_super(struct super_block *sb, void *data, int silent)</div><div class='add'>+static int adfs_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> {</div><div class='ctx'> 	struct adfs_discrecord *dr;</div><div class='ctx'> 	struct object_info root_obj;</div><div class='del'>-	struct adfs_sb_info *asb;</div><div class='add'>+	struct adfs_sb_info *asb = sb-&gt;s_fs_info;</div><div class='ctx'> 	struct inode *root;</div><div class='ctx'> 	int ret = -EINVAL;</div><div class='add'>+	int silent = fc-&gt;sb_flags &amp; SB_SILENT;</div><div class='ctx'> </div><div class='ctx'> 	sb-&gt;s_flags |= ADFS_SB_FLAGS;</div><div class='ctx'> </div><div class='del'>-	asb = kzalloc(sizeof(*asb), GFP_KERNEL);</div><div class='del'>-	if (!asb)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='ctx'> 	sb-&gt;s_fs_info = asb;</div><div class='ctx'> 	sb-&gt;s_magic = ADFS_SUPER_MAGIC;</div><div class='ctx'> 	sb-&gt;s_time_gran = 10000000;</div><div class='ctx'> </div><div class='del'>-	/* set default options */</div><div class='del'>-	asb-&gt;s_uid = GLOBAL_ROOT_UID;</div><div class='del'>-	asb-&gt;s_gid = GLOBAL_ROOT_GID;</div><div class='del'>-	asb-&gt;s_owner_mask = ADFS_DEFAULT_OWNER_MASK;</div><div class='del'>-	asb-&gt;s_other_mask = ADFS_DEFAULT_OTHER_MASK;</div><div class='del'>-	asb-&gt;s_ftsuffix = 0;</div><div class='del'>-</div><div class='del'>-	if (parse_options(sb, asb, data))</div><div class='del'>-		goto error;</div><div class='del'>-</div><div class='ctx'> 	/* Try to probe the filesystem boot block */</div><div class='ctx'> 	ret = adfs_probe(sb, ADFS_DISCRECORD, 1, adfs_validate_bblk);</div><div class='ctx'> 	if (ret == -EILSEQ)</div><div class='hunk'>@@ -436,7 +397,7 @@ static int adfs_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 	if (asb-&gt;s_ftsuffix)</div><div class='ctx'> 		asb-&gt;s_namelen += 4;</div><div class='ctx'> </div><div class='del'>-	sb-&gt;s_d_op = &amp;adfs_dentry_operations;</div><div class='add'>+	set_default_d_op(sb, &amp;adfs_dentry_operations);</div><div class='ctx'> 	root = adfs_iget(sb, &amp;root_obj);</div><div class='ctx'> 	sb-&gt;s_root = d_make_root(root);</div><div class='ctx'> 	if (!sb-&gt;s_root) {</div><div class='hunk'>@@ -453,18 +414,61 @@ error:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct dentry *adfs_mount(struct file_system_type *fs_type,</div><div class='del'>-	int flags, const char *dev_name, void *data)</div><div class='add'>+static int adfs_get_tree(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	return get_tree_bdev(fc, adfs_fill_super);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void adfs_free_fc(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	return mount_bdev(fs_type, flags, dev_name, data, adfs_fill_super);</div><div class='add'>+	struct adfs_context *asb = fc-&gt;s_fs_info;</div><div class='add'>+</div><div class='add'>+	kfree(asb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct fs_context_operations adfs_context_ops = {</div><div class='add'>+	.parse_param	= adfs_parse_param,</div><div class='add'>+	.get_tree	= adfs_get_tree,</div><div class='add'>+	.reconfigure	= adfs_reconfigure,</div><div class='add'>+	.free		= adfs_free_fc,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int adfs_init_fs_context(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct adfs_sb_info *asb;</div><div class='add'>+</div><div class='add'>+	asb = kzalloc(sizeof(struct adfs_sb_info), GFP_KERNEL);</div><div class='add'>+	if (!asb)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	if (fc-&gt;purpose == FS_CONTEXT_FOR_RECONFIGURE) {</div><div class='add'>+		struct super_block *sb = fc-&gt;root-&gt;d_sb;</div><div class='add'>+		struct adfs_sb_info *old_asb = ADFS_SB(sb);</div><div class='add'>+</div><div class='add'>+		/* structure copy existing options before parsing */</div><div class='add'>+		*asb = *old_asb;</div><div class='add'>+	} else {</div><div class='add'>+		/* set default options */</div><div class='add'>+		asb-&gt;s_uid = GLOBAL_ROOT_UID;</div><div class='add'>+		asb-&gt;s_gid = GLOBAL_ROOT_GID;</div><div class='add'>+		asb-&gt;s_owner_mask = ADFS_DEFAULT_OWNER_MASK;</div><div class='add'>+		asb-&gt;s_other_mask = ADFS_DEFAULT_OTHER_MASK;</div><div class='add'>+		asb-&gt;s_ftsuffix = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	fc-&gt;ops = &amp;adfs_context_ops;</div><div class='add'>+	fc-&gt;s_fs_info = asb;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct file_system_type adfs_fs_type = {</div><div class='ctx'> 	.owner		= THIS_MODULE,</div><div class='ctx'> 	.name		= "adfs",</div><div class='del'>-	.mount		= adfs_mount,</div><div class='ctx'> 	.kill_sb	= kill_block_super,</div><div class='ctx'> 	.fs_flags	= FS_REQUIRES_DEV,</div><div class='add'>+	.init_fs_context = adfs_init_fs_context,</div><div class='add'>+	.parameters	= adfs_param_spec,</div><div class='ctx'> };</div><div class='ctx'> MODULE_ALIAS_FS("adfs");</div><div class='ctx'> </div><div class='hunk'>@@ -491,4 +495,5 @@ static void __exit exit_adfs_fs(void)</div><div class='ctx'> </div><div class='ctx'> module_init(init_adfs_fs)</div><div class='ctx'> module_exit(exit_adfs_fs)</div><div class='add'>+MODULE_DESCRIPTION("Acorn Disc Filing System");</div><div class='ctx'> MODULE_LICENSE("GPL");</div><div class='head'>diff --git a/fs/affs/Kconfig b/fs/affs/Kconfig<br/>index eb9d0ab850cb..1ae432d266c3 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/affs/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/affs/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/affs/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/affs/Kconfig</a></div><div class='hunk'>@@ -2,6 +2,8 @@</div><div class='ctx'> config AFFS_FS</div><div class='ctx'> 	tristate "Amiga FFS file system support"</div><div class='ctx'> 	depends on BLOCK</div><div class='add'>+	select BUFFER_HEAD</div><div class='add'>+	select LEGACY_DIRECT_IO</div><div class='ctx'> 	help</div><div class='ctx'> 	  The Fast File System (FFS) is the common file system used on hard</div><div class='ctx'> 	  disks by Amiga(tm) systems since AmigaOS Version 1.3 (34.20).  Say Y</div><div class='head'>diff --git a/fs/affs/affs.h b/fs/affs/affs.h<br/>index bfa89e131ead..ac4e9a02910b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/affs/affs.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/affs/affs.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/affs/affs.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/affs/affs.h</a></div><div class='hunk'>@@ -14,8 +14,6 @@</div><div class='ctx'> </div><div class='ctx'> /* Ugly macros make the code more pretty. */</div><div class='ctx'> </div><div class='del'>-#define GET_END_PTR(st,p,sz)		 ((st *)((char *)(p)+((sz)-sizeof(st))))</div><div class='del'>-#define AFFS_GET_HASHENTRY(data,hashkey) be32_to_cpu(((struct dir_front *)data)-&gt;hashtable[hashkey])</div><div class='ctx'> #define AFFS_BLOCK(sb, bh, blk)		(AFFS_HEAD(bh)-&gt;table[AFFS_SB(sb)-&gt;s_hashsize-1-(blk)])</div><div class='ctx'> </div><div class='ctx'> #define AFFS_HEAD(bh)		((struct affs_head *)(bh)-&gt;b_data)</div><div class='hunk'>@@ -105,6 +103,7 @@ struct affs_sb_info {</div><div class='ctx'> 	int work_queued;		/* non-zero delayed work is queued */</div><div class='ctx'> 	struct delayed_work sb_work;	/* superblock flush delayed work */</div><div class='ctx'> 	spinlock_t work_lock;		/* protects sb_work and work_queued */</div><div class='add'>+	struct rcu_head rcu;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> #define AFFS_MOUNT_SF_INTL		0x0001 /* International filesystem. */</div><div class='hunk'>@@ -167,17 +166,17 @@ extern const struct export_operations affs_export_ops;</div><div class='ctx'> extern int	affs_hash_name(struct super_block *sb, const u8 *name, unsigned int len);</div><div class='ctx'> extern struct dentry *affs_lookup(struct inode *dir, struct dentry *dentry, unsigned int);</div><div class='ctx'> extern int	affs_unlink(struct inode *dir, struct dentry *dentry);</div><div class='del'>-extern int	affs_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+extern int	affs_create(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 			struct dentry *dentry, umode_t mode, bool);</div><div class='del'>-extern int	affs_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+extern struct dentry *affs_mkdir(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 			struct dentry *dentry, umode_t mode);</div><div class='ctx'> extern int	affs_rmdir(struct inode *dir, struct dentry *dentry);</div><div class='ctx'> extern int	affs_link(struct dentry *olddentry, struct inode *dir,</div><div class='ctx'> 			  struct dentry *dentry);</div><div class='del'>-extern int	affs_symlink(struct user_namespace *mnt_userns,</div><div class='add'>+extern int	affs_symlink(struct mnt_idmap *idmap,</div><div class='ctx'> 			struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 			const char *symname);</div><div class='del'>-extern int	affs_rename2(struct user_namespace *mnt_userns,</div><div class='add'>+extern int	affs_rename2(struct mnt_idmap *idmap,</div><div class='ctx'> 			struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> 			struct inode *new_dir, struct dentry *new_dentry,</div><div class='ctx'> 			unsigned int flags);</div><div class='hunk'>@@ -185,7 +184,7 @@ extern int	affs_rename2(struct user_namespace *mnt_userns,</div><div class='ctx'> /* inode.c */</div><div class='ctx'> </div><div class='ctx'> extern struct inode		*affs_new_inode(struct inode *dir);</div><div class='del'>-extern int			 affs_notify_change(struct user_namespace *mnt_userns,</div><div class='add'>+extern int			 affs_notify_change(struct mnt_idmap *idmap,</div><div class='ctx'> 					struct dentry *dentry, struct iattr *attr);</div><div class='ctx'> extern void			 affs_evict_inode(struct inode *inode);</div><div class='ctx'> extern struct inode		*affs_iget(struct super_block *sb,</div><div class='head'>diff --git a/fs/affs/amigaffs.c b/fs/affs/amigaffs.c<br/>index 29f11e10a7c7..fd669daa4e7b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/affs/amigaffs.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/affs/amigaffs.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/affs/amigaffs.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/affs/amigaffs.c</a></div><div class='hunk'>@@ -60,7 +60,7 @@ affs_insert_hash(struct inode *dir, struct buffer_head *bh)</div><div class='ctx'> 	mark_buffer_dirty_inode(dir_bh, dir);</div><div class='ctx'> 	affs_brelse(dir_bh);</div><div class='ctx'> </div><div class='del'>-	dir-&gt;i_mtime = dir-&gt;i_ctime = current_time(dir);</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='ctx'> 	inode_inc_iversion(dir);</div><div class='ctx'> 	mark_inode_dirty(dir);</div><div class='ctx'> </div><div class='hunk'>@@ -114,7 +114,7 @@ affs_remove_hash(struct inode *dir, struct buffer_head *rem_bh)</div><div class='ctx'> </div><div class='ctx'> 	affs_brelse(bh);</div><div class='ctx'> </div><div class='del'>-	dir-&gt;i_mtime = dir-&gt;i_ctime = current_time(dir);</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='ctx'> 	inode_inc_iversion(dir);</div><div class='ctx'> 	mark_inode_dirty(dir);</div><div class='ctx'> </div><div class='hunk'>@@ -315,7 +315,7 @@ affs_remove_header(struct dentry *dentry)</div><div class='ctx'> 	else</div><div class='ctx'> 		clear_nlink(inode);</div><div class='ctx'> 	affs_unlock_link(inode);</div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='ctx'> </div><div class='ctx'> done:</div><div class='head'>diff --git a/fs/affs/amigaffs.h b/fs/affs/amigaffs.h<br/>index 81fb396d4dfa..da3217ab6adb 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/affs/amigaffs.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/affs/amigaffs.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/affs/amigaffs.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/affs/amigaffs.h</a></div><div class='hunk'>@@ -49,12 +49,13 @@ struct affs_short_date {</div><div class='ctx'> </div><div class='ctx'> struct affs_root_head {</div><div class='ctx'> 	__be32 ptype;</div><div class='add'>+	/* The following fields are not used, but kept as documentation. */</div><div class='ctx'> 	__be32 spare1;</div><div class='ctx'> 	__be32 spare2;</div><div class='ctx'> 	__be32 hash_size;</div><div class='ctx'> 	__be32 spare3;</div><div class='ctx'> 	__be32 checksum;</div><div class='del'>-	__be32 hashtable[1];</div><div class='add'>+	__be32 hashtable[];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct affs_root_tail {</div><div class='hunk'>@@ -80,7 +81,7 @@ struct affs_head {</div><div class='ctx'> 	__be32 spare1;</div><div class='ctx'> 	__be32 first_data;</div><div class='ctx'> 	__be32 checksum;</div><div class='del'>-	__be32 table[1];</div><div class='add'>+	__be32 table[];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct affs_tail {</div><div class='hunk'>@@ -108,7 +109,7 @@ struct slink_front</div><div class='ctx'> 	__be32 key;</div><div class='ctx'> 	__be32 spare1[3];</div><div class='ctx'> 	__be32 checksum;</div><div class='del'>-	u8 symname[1];	/* depends on block size */</div><div class='add'>+	u8 symname[];	/* depends on block size */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct affs_data_head</div><div class='hunk'>@@ -119,7 +120,7 @@ struct affs_data_head</div><div class='ctx'> 	__be32 size;</div><div class='ctx'> 	__be32 next;</div><div class='ctx'> 	__be32 checksum;</div><div class='del'>-	u8 data[1];	/* depends on block size */</div><div class='add'>+	u8 data[];	/* depends on block size */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /* Permission bits */</div><div class='head'>diff --git a/fs/affs/dir.c b/fs/affs/dir.c<br/>index b2bf7016e1b3..bd40d5f08810 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/affs/dir.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/affs/dir.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/affs/dir.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/affs/dir.c</a></div><div class='hunk'>@@ -17,13 +17,44 @@</div><div class='ctx'> #include &lt;linux/iversion.h&gt;</div><div class='ctx'> #include "affs.h"</div><div class='ctx'> </div><div class='add'>+struct affs_dir_data {</div><div class='add'>+	unsigned long ino;</div><div class='add'>+	u64 cookie;</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> static int affs_readdir(struct file *, struct dir_context *);</div><div class='ctx'> </div><div class='add'>+static loff_t affs_dir_llseek(struct file *file, loff_t offset, int whence)</div><div class='add'>+{</div><div class='add'>+	struct affs_dir_data *data = file-&gt;private_data;</div><div class='add'>+</div><div class='add'>+	return generic_llseek_cookie(file, offset, whence, &amp;data-&gt;cookie);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int affs_dir_open(struct inode *inode, struct file *file)</div><div class='add'>+{</div><div class='add'>+	struct affs_dir_data	*data;</div><div class='add'>+</div><div class='add'>+	data = kzalloc(sizeof(struct affs_dir_data), GFP_KERNEL);</div><div class='add'>+	if (!data)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	file-&gt;private_data = data;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int affs_dir_release(struct inode *inode, struct file *file)</div><div class='add'>+{</div><div class='add'>+	kfree(file-&gt;private_data);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> const struct file_operations affs_dir_operations = {</div><div class='add'>+	.open		= affs_dir_open,</div><div class='ctx'> 	.read		= generic_read_dir,</div><div class='del'>-	.llseek		= generic_file_llseek,</div><div class='add'>+	.llseek		= affs_dir_llseek,</div><div class='ctx'> 	.iterate_shared	= affs_readdir,</div><div class='ctx'> 	.fsync		= affs_file_fsync,</div><div class='add'>+	.release	= affs_dir_release,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -45,6 +76,7 @@ static int</div><div class='ctx'> affs_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode		*inode = file_inode(file);</div><div class='add'>+	struct affs_dir_data	*data = file-&gt;private_data;</div><div class='ctx'> 	struct super_block	*sb = inode-&gt;i_sb;</div><div class='ctx'> 	struct buffer_head	*dir_bh = NULL;</div><div class='ctx'> 	struct buffer_head	*fh_bh = NULL;</div><div class='hunk'>@@ -59,7 +91,7 @@ affs_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 	pr_debug("%s(ino=%lu,f_pos=%llx)\n", __func__, inode-&gt;i_ino, ctx-&gt;pos);</div><div class='ctx'> </div><div class='ctx'> 	if (ctx-&gt;pos &lt; 2) {</div><div class='del'>-		file-&gt;private_data = (void *)0;</div><div class='add'>+		data-&gt;ino = 0;</div><div class='ctx'> 		if (!dir_emit_dots(file, ctx))</div><div class='ctx'> 			return 0;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -80,8 +112,8 @@ affs_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 	/* If the directory hasn't changed since the last call to readdir(),</div><div class='ctx'> 	 * we can jump directly to where we left off.</div><div class='ctx'> 	 */</div><div class='del'>-	ino = (u32)(long)file-&gt;private_data;</div><div class='del'>-	if (ino &amp;&amp; inode_eq_iversion(inode, file-&gt;f_version)) {</div><div class='add'>+	ino = data-&gt;ino;</div><div class='add'>+	if (ino &amp;&amp; inode_eq_iversion(inode, data-&gt;cookie)) {</div><div class='ctx'> 		pr_debug("readdir() left off=%d\n", ino);</div><div class='ctx'> 		goto inside;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -131,8 +163,8 @@ inside:</div><div class='ctx'> 		} while (ino);</div><div class='ctx'> 	}</div><div class='ctx'> done:</div><div class='del'>-	file-&gt;f_version = inode_query_iversion(inode);</div><div class='del'>-	file-&gt;private_data = (void *)(long)ino;</div><div class='add'>+	data-&gt;cookie = inode_query_iversion(inode);</div><div class='add'>+	data-&gt;ino = ino;</div><div class='ctx'> 	affs_brelse(fh_bh);</div><div class='ctx'> </div><div class='ctx'> out_brelse_dir:</div><div class='head'>diff --git a/fs/affs/file.c b/fs/affs/file.c<br/>index 75ebd2b576ca..765c3443663e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/affs/file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/affs/file.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/affs/file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/affs/file.c</a></div><div class='hunk'>@@ -15,6 +15,7 @@</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/uio.h&gt;</div><div class='ctx'> #include &lt;linux/blkdev.h&gt;</div><div class='add'>+#include &lt;linux/mpage.h&gt;</div><div class='ctx'> #include "affs.h"</div><div class='ctx'> </div><div class='ctx'> static struct buffer_head *affs_get_extblock_slow(struct inode *inode, u32 ext);</div><div class='hunk'>@@ -370,14 +371,15 @@ err_alloc:</div><div class='ctx'> 	return -ENOSPC;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int affs_writepage(struct page *page, struct writeback_control *wbc)</div><div class='add'>+static int affs_writepages(struct address_space *mapping,</div><div class='add'>+			   struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='del'>-	return block_write_full_page(page, affs_get_block, wbc);</div><div class='add'>+	return mpage_writepages(mapping, wbc, affs_get_block);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int affs_readpage(struct file *file, struct page *page)</div><div class='add'>+static int affs_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	return block_read_full_page(page, affs_get_block);</div><div class='add'>+	return block_read_full_folio(folio, affs_get_block);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void affs_write_failed(struct address_space *mapping, loff_t to)</div><div class='hunk'>@@ -413,14 +415,14 @@ affs_direct_IO(struct kiocb *iocb, struct iov_iter *iter)</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int affs_write_begin(struct file *file, struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned flags,</div><div class='del'>-			struct page **pagep, void **fsdata)</div><div class='add'>+static int affs_write_begin(const struct kiocb *iocb,</div><div class='add'>+			    struct address_space *mapping,</div><div class='add'>+			    loff_t pos, unsigned len,</div><div class='add'>+			    struct folio **foliop, void **fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	*pagep = NULL;</div><div class='del'>-	ret = cont_write_begin(file, mapping, pos, len, flags, pagep, fsdata,</div><div class='add'>+	ret = cont_write_begin(iocb, mapping, pos, len, foliop, fsdata,</div><div class='ctx'> 				affs_get_block,</div><div class='ctx'> 				&amp;AFFS_I(mapping-&gt;host)-&gt;mmu_private);</div><div class='ctx'> 	if (unlikely(ret))</div><div class='hunk'>@@ -429,14 +431,15 @@ static int affs_write_begin(struct file *file, struct address_space *mapping,</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int affs_write_end(struct file *file, struct address_space *mapping,</div><div class='del'>-			  loff_t pos, unsigned int len, unsigned int copied,</div><div class='del'>-			  struct page *page, void *fsdata)</div><div class='add'>+static int affs_write_end(const struct kiocb *iocb,</div><div class='add'>+			  struct address_space *mapping, loff_t pos,</div><div class='add'>+			  unsigned int len, unsigned int copied,</div><div class='add'>+			  struct folio *folio, void *fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = generic_write_end(file, mapping, pos, len, copied, page, fsdata);</div><div class='add'>+	ret = generic_write_end(iocb, mapping, pos, len, copied, folio, fsdata);</div><div class='ctx'> </div><div class='ctx'> 	/* Clear Archived bit on file writes, as AmigaOS would do */</div><div class='ctx'> 	if (AFFS_I(inode)-&gt;i_protect &amp; FIBF_ARCHIVED) {</div><div class='hunk'>@@ -453,12 +456,14 @@ static sector_t _affs_bmap(struct address_space *mapping, sector_t block)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations affs_aops = {</div><div class='del'>-	.set_page_dirty	= __set_page_dirty_buffers,</div><div class='del'>-	.readpage = affs_readpage,</div><div class='del'>-	.writepage = affs_writepage,</div><div class='add'>+	.dirty_folio	= block_dirty_folio,</div><div class='add'>+	.invalidate_folio = block_invalidate_folio,</div><div class='add'>+	.read_folio = affs_read_folio,</div><div class='add'>+	.writepages = affs_writepages,</div><div class='ctx'> 	.write_begin = affs_write_begin,</div><div class='ctx'> 	.write_end = affs_write_end,</div><div class='ctx'> 	.direct_IO = affs_direct_IO,</div><div class='add'>+	.migrate_folio = buffer_migrate_folio,</div><div class='ctx'> 	.bmap = _affs_bmap</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -519,22 +524,20 @@ affs_getemptyblk_ino(struct inode *inode, int block)</div><div class='ctx'> 	return ERR_PTR(err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int</div><div class='del'>-affs_do_readpage_ofs(struct page *page, unsigned to, int create)</div><div class='add'>+static int affs_do_read_folio_ofs(struct folio *folio, size_t to, int create)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='del'>-	char *data;</div><div class='del'>-	unsigned pos = 0;</div><div class='del'>-	u32 bidx, boff, bsize;</div><div class='add'>+	size_t pos = 0;</div><div class='add'>+	size_t bidx, boff, bsize;</div><div class='ctx'> 	u32 tmp;</div><div class='ctx'> </div><div class='del'>-	pr_debug("%s(%lu, %ld, 0, %d)\n", __func__, inode-&gt;i_ino,</div><div class='del'>-		 page-&gt;index, to);</div><div class='del'>-	BUG_ON(to &gt; PAGE_SIZE);</div><div class='add'>+	pr_debug("%s(%lu, %ld, 0, %zu)\n", __func__, inode-&gt;i_ino,</div><div class='add'>+		 folio-&gt;index, to);</div><div class='add'>+	BUG_ON(to &gt; folio_size(folio));</div><div class='ctx'> 	bsize = AFFS_SB(sb)-&gt;s_data_blksize;</div><div class='del'>-	tmp = page-&gt;index &lt;&lt; PAGE_SHIFT;</div><div class='add'>+	tmp = folio_pos(folio);</div><div class='ctx'> 	bidx = tmp / bsize;</div><div class='ctx'> 	boff = tmp % bsize;</div><div class='ctx'> </div><div class='hunk'>@@ -544,15 +547,12 @@ affs_do_readpage_ofs(struct page *page, unsigned to, int create)</div><div class='ctx'> 			return PTR_ERR(bh);</div><div class='ctx'> 		tmp = min(bsize - boff, to - pos);</div><div class='ctx'> 		BUG_ON(pos + tmp &gt; to || tmp &gt; bsize);</div><div class='del'>-		data = kmap_atomic(page);</div><div class='del'>-		memcpy(data + pos, AFFS_DATA(bh) + boff, tmp);</div><div class='del'>-		kunmap_atomic(data);</div><div class='add'>+		memcpy_to_folio(folio, pos, AFFS_DATA(bh) + boff, tmp);</div><div class='ctx'> 		affs_brelse(bh);</div><div class='ctx'> 		bidx++;</div><div class='ctx'> 		pos += tmp;</div><div class='ctx'> 		boff = 0;</div><div class='ctx'> 	}</div><div class='del'>-	flush_dcache_page(page);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -598,7 +598,7 @@ affs_extent_file_ofs(struct inode *inode, u32 newsize)</div><div class='ctx'> 		BUG_ON(tmp &gt; bsize);</div><div class='ctx'> 		AFFS_DATA_HEAD(bh)-&gt;ptype = cpu_to_be32(T_DATA);</div><div class='ctx'> 		AFFS_DATA_HEAD(bh)-&gt;key = cpu_to_be32(inode-&gt;i_ino);</div><div class='del'>-		AFFS_DATA_HEAD(bh)-&gt;sequence = cpu_to_be32(bidx);</div><div class='add'>+		AFFS_DATA_HEAD(bh)-&gt;sequence = cpu_to_be32(bidx + 1);</div><div class='ctx'> 		AFFS_DATA_HEAD(bh)-&gt;size = cpu_to_be32(tmp);</div><div class='ctx'> 		affs_fix_checksum(sb, bh);</div><div class='ctx'> 		bh-&gt;b_state &amp;= ~(1UL &lt;&lt; BH_New);</div><div class='hunk'>@@ -627,33 +627,33 @@ out:</div><div class='ctx'> 	return PTR_ERR(bh);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int</div><div class='del'>-affs_readpage_ofs(struct file *file, struct page *page)</div><div class='add'>+static int affs_read_folio_ofs(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-	u32 to;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+	size_t to;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	pr_debug("%s(%lu, %ld)\n", __func__, inode-&gt;i_ino, page-&gt;index);</div><div class='del'>-	to = PAGE_SIZE;</div><div class='del'>-	if (((page-&gt;index + 1) &lt;&lt; PAGE_SHIFT) &gt; inode-&gt;i_size) {</div><div class='del'>-		to = inode-&gt;i_size &amp; ~PAGE_MASK;</div><div class='del'>-		memset(page_address(page) + to, 0, PAGE_SIZE - to);</div><div class='add'>+	pr_debug("%s(%lu, %ld)\n", __func__, inode-&gt;i_ino, folio-&gt;index);</div><div class='add'>+	to = folio_size(folio);</div><div class='add'>+	if (folio_pos(folio) + to &gt; inode-&gt;i_size) {</div><div class='add'>+		to = inode-&gt;i_size - folio_pos(folio);</div><div class='add'>+		folio_zero_segment(folio, to, folio_size(folio));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = affs_do_readpage_ofs(page, to, 0);</div><div class='add'>+	err = affs_do_read_folio_ofs(folio, to, 0);</div><div class='ctx'> 	if (!err)</div><div class='del'>-		SetPageUptodate(page);</div><div class='del'>-	unlock_page(page);</div><div class='add'>+		folio_mark_uptodate(folio);</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int affs_write_begin_ofs(struct file *file, struct address_space *mapping,</div><div class='del'>-				loff_t pos, unsigned len, unsigned flags,</div><div class='del'>-				struct page **pagep, void **fsdata)</div><div class='add'>+static int affs_write_begin_ofs(const struct kiocb *iocb,</div><div class='add'>+				struct address_space *mapping,</div><div class='add'>+				loff_t pos, unsigned len,</div><div class='add'>+				struct folio **foliop, void **fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	pgoff_t index;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -669,26 +669,28 @@ static int affs_write_begin_ofs(struct file *file, struct address_space *mapping</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	index = pos &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	page = grab_cache_page_write_begin(mapping, index, flags);</div><div class='del'>-	if (!page)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	*pagep = page;</div><div class='add'>+	folio = __filemap_get_folio(mapping, index, FGP_WRITEBEGIN,</div><div class='add'>+			mapping_gfp_mask(mapping));</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio);</div><div class='add'>+	*foliop = folio;</div><div class='ctx'> </div><div class='del'>-	if (PageUptodate(page))</div><div class='add'>+	if (folio_test_uptodate(folio))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/* XXX: inefficient but safe in the face of short writes */</div><div class='del'>-	err = affs_do_readpage_ofs(page, PAGE_SIZE, 1);</div><div class='add'>+	err = affs_do_read_folio_ofs(folio, folio_size(folio), 1);</div><div class='ctx'> 	if (err) {</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		put_page(page);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 	}</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int affs_write_end_ofs(struct file *file, struct address_space *mapping,</div><div class='del'>-				loff_t pos, unsigned len, unsigned copied,</div><div class='del'>-				struct page *page, void *fsdata)</div><div class='add'>+static int affs_write_end_ofs(const struct kiocb *iocb,</div><div class='add'>+			      struct address_space *mapping,</div><div class='add'>+			      loff_t pos, unsigned len, unsigned copied,</div><div class='add'>+			      struct folio *folio, void *fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='hunk'>@@ -703,18 +705,18 @@ static int affs_write_end_ofs(struct file *file, struct address_space *mapping,</div><div class='ctx'> 	to = from + len;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * XXX: not sure if this can handle short copies (len &lt; copied), but</div><div class='del'>-	 * we don't have to, because the page should always be uptodate here,</div><div class='add'>+	 * we don't have to, because the folio should always be uptodate here,</div><div class='ctx'> 	 * due to write_begin.</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='ctx'> 	pr_debug("%s(%lu, %llu, %llu)\n", __func__, inode-&gt;i_ino, pos,</div><div class='ctx'> 		 pos + len);</div><div class='ctx'> 	bsize = AFFS_SB(sb)-&gt;s_data_blksize;</div><div class='del'>-	data = page_address(page);</div><div class='add'>+	data = folio_address(folio);</div><div class='ctx'> </div><div class='ctx'> 	bh = NULL;</div><div class='ctx'> 	written = 0;</div><div class='del'>-	tmp = (page-&gt;index &lt;&lt; PAGE_SHIFT) + from;</div><div class='add'>+	tmp = (folio-&gt;index &lt;&lt; PAGE_SHIFT) + from;</div><div class='ctx'> 	bidx = tmp / bsize;</div><div class='ctx'> 	boff = tmp % bsize;</div><div class='ctx'> 	if (boff) {</div><div class='hunk'>@@ -726,7 +728,8 @@ static int affs_write_end_ofs(struct file *file, struct address_space *mapping,</div><div class='ctx'> 		tmp = min(bsize - boff, to - from);</div><div class='ctx'> 		BUG_ON(boff + tmp &gt; bsize || tmp &gt; bsize);</div><div class='ctx'> 		memcpy(AFFS_DATA(bh) + boff, data + from, tmp);</div><div class='del'>-		be32_add_cpu(&amp;AFFS_DATA_HEAD(bh)-&gt;size, tmp);</div><div class='add'>+		AFFS_DATA_HEAD(bh)-&gt;size = cpu_to_be32(</div><div class='add'>+			max(boff + tmp, be32_to_cpu(AFFS_DATA_HEAD(bh)-&gt;size)));</div><div class='ctx'> 		affs_fix_checksum(sb, bh);</div><div class='ctx'> 		mark_buffer_dirty_inode(bh, inode);</div><div class='ctx'> 		written += tmp;</div><div class='hunk'>@@ -748,7 +751,7 @@ static int affs_write_end_ofs(struct file *file, struct address_space *mapping,</div><div class='ctx'> 		if (buffer_new(bh)) {</div><div class='ctx'> 			AFFS_DATA_HEAD(bh)-&gt;ptype = cpu_to_be32(T_DATA);</div><div class='ctx'> 			AFFS_DATA_HEAD(bh)-&gt;key = cpu_to_be32(inode-&gt;i_ino);</div><div class='del'>-			AFFS_DATA_HEAD(bh)-&gt;sequence = cpu_to_be32(bidx);</div><div class='add'>+			AFFS_DATA_HEAD(bh)-&gt;sequence = cpu_to_be32(bidx + 1);</div><div class='ctx'> 			AFFS_DATA_HEAD(bh)-&gt;size = cpu_to_be32(bsize);</div><div class='ctx'> 			AFFS_DATA_HEAD(bh)-&gt;next = 0;</div><div class='ctx'> 			bh-&gt;b_state &amp;= ~(1UL &lt;&lt; BH_New);</div><div class='hunk'>@@ -782,7 +785,7 @@ static int affs_write_end_ofs(struct file *file, struct address_space *mapping,</div><div class='ctx'> 		if (buffer_new(bh)) {</div><div class='ctx'> 			AFFS_DATA_HEAD(bh)-&gt;ptype = cpu_to_be32(T_DATA);</div><div class='ctx'> 			AFFS_DATA_HEAD(bh)-&gt;key = cpu_to_be32(inode-&gt;i_ino);</div><div class='del'>-			AFFS_DATA_HEAD(bh)-&gt;sequence = cpu_to_be32(bidx);</div><div class='add'>+			AFFS_DATA_HEAD(bh)-&gt;sequence = cpu_to_be32(bidx + 1);</div><div class='ctx'> 			AFFS_DATA_HEAD(bh)-&gt;size = cpu_to_be32(tmp);</div><div class='ctx'> 			AFFS_DATA_HEAD(bh)-&gt;next = 0;</div><div class='ctx'> 			bh-&gt;b_state &amp;= ~(1UL &lt;&lt; BH_New);</div><div class='hunk'>@@ -806,11 +809,11 @@ static int affs_write_end_ofs(struct file *file, struct address_space *mapping,</div><div class='ctx'> 		from += tmp;</div><div class='ctx'> 		bidx++;</div><div class='ctx'> 	}</div><div class='del'>-	SetPageUptodate(page);</div><div class='add'>+	folio_mark_uptodate(folio);</div><div class='ctx'> </div><div class='ctx'> done:</div><div class='ctx'> 	affs_brelse(bh);</div><div class='del'>-	tmp = (page-&gt;index &lt;&lt; PAGE_SHIFT) + from;</div><div class='add'>+	tmp = (folio-&gt;index &lt;&lt; PAGE_SHIFT) + from;</div><div class='ctx'> 	if (tmp &gt; inode-&gt;i_size)</div><div class='ctx'> 		inode-&gt;i_size = AFFS_I(inode)-&gt;mmu_private = tmp;</div><div class='ctx'> </div><div class='hunk'>@@ -821,8 +824,8 @@ done:</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> err_first_bh:</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> </div><div class='ctx'> 	return written;</div><div class='ctx'> </div><div class='hunk'>@@ -834,11 +837,13 @@ err_bh:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations affs_aops_ofs = {</div><div class='del'>-	.set_page_dirty	= __set_page_dirty_buffers,</div><div class='del'>-	.readpage = affs_readpage_ofs,</div><div class='del'>-	//.writepage = affs_writepage_ofs,</div><div class='add'>+	.dirty_folio	= block_dirty_folio,</div><div class='add'>+	.invalidate_folio = block_invalidate_folio,</div><div class='add'>+	.read_folio = affs_read_folio_ofs,</div><div class='add'>+	//.writepages = affs_writepages_ofs,</div><div class='ctx'> 	.write_begin = affs_write_begin_ofs,</div><div class='del'>-	.write_end = affs_write_end_ofs</div><div class='add'>+	.write_end = affs_write_end_ofs,</div><div class='add'>+	.migrate_folio = filemap_migrate_folio,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /* Free any preallocated blocks. */</div><div class='hunk'>@@ -880,14 +885,14 @@ affs_truncate(struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> 	if (inode-&gt;i_size &gt; AFFS_I(inode)-&gt;mmu_private) {</div><div class='ctx'> 		struct address_space *mapping = inode-&gt;i_mapping;</div><div class='del'>-		struct page *page;</div><div class='del'>-		void *fsdata;</div><div class='add'>+		struct folio *folio;</div><div class='add'>+		void *fsdata = NULL;</div><div class='ctx'> 		loff_t isize = inode-&gt;i_size;</div><div class='ctx'> 		int res;</div><div class='ctx'> </div><div class='del'>-		res = mapping-&gt;a_ops-&gt;write_begin(NULL, mapping, isize, 0, 0, &amp;page, &amp;fsdata);</div><div class='add'>+		res = mapping-&gt;a_ops-&gt;write_begin(NULL, mapping, isize, 0, &amp;folio, &amp;fsdata);</div><div class='ctx'> 		if (!res)</div><div class='del'>-			res = mapping-&gt;a_ops-&gt;write_end(NULL, mapping, isize, 0, 0, page, fsdata);</div><div class='add'>+			res = mapping-&gt;a_ops-&gt;write_end(NULL, mapping, isize, 0, 0, folio, fsdata);</div><div class='ctx'> 		else</div><div class='ctx'> 			inode-&gt;i_size = AFFS_I(inode)-&gt;mmu_private;</div><div class='ctx'> 		mark_inode_dirty(inode);</div><div class='hunk'>@@ -998,11 +1003,11 @@ const struct file_operations affs_file_operations = {</div><div class='ctx'> 	.llseek		= generic_file_llseek,</div><div class='ctx'> 	.read_iter	= generic_file_read_iter,</div><div class='ctx'> 	.write_iter	= generic_file_write_iter,</div><div class='del'>-	.mmap		= generic_file_mmap,</div><div class='add'>+	.mmap_prepare	= generic_file_mmap_prepare,</div><div class='ctx'> 	.open		= affs_file_open,</div><div class='ctx'> 	.release	= affs_file_release,</div><div class='ctx'> 	.fsync		= affs_file_fsync,</div><div class='del'>-	.splice_read	= generic_file_splice_read,</div><div class='add'>+	.splice_read	= filemap_splice_read,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct inode_operations affs_file_inode_operations = {</div><div class='head'>diff --git a/fs/affs/inode.c b/fs/affs/inode.c<br/>index 2352a75bd9d6..0bfc7d151dcd 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/affs/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/affs/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/affs/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/affs/inode.c</a></div><div class='hunk'>@@ -29,7 +29,7 @@ struct inode *affs_iget(struct super_block *sb, unsigned long ino)</div><div class='ctx'> 	inode = iget_locked(sb, ino);</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='del'>-	if (!(inode-&gt;i_state &amp; I_NEW))</div><div class='add'>+	if (!(inode_state_read_once(inode) &amp; I_NEW))</div><div class='ctx'> 		return inode;</div><div class='ctx'> </div><div class='ctx'> 	pr_debug("affs_iget(%lu)\n", inode-&gt;i_ino);</div><div class='hunk'>@@ -149,13 +149,9 @@ struct inode *affs_iget(struct super_block *sb, unsigned long ino)</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_mtime.tv_sec = inode-&gt;i_atime.tv_sec = inode-&gt;i_ctime.tv_sec</div><div class='del'>-		       = (be32_to_cpu(tail-&gt;change.days) * 86400LL +</div><div class='del'>-		         be32_to_cpu(tail-&gt;change.mins) * 60 +</div><div class='del'>-			 be32_to_cpu(tail-&gt;change.ticks) / 50 +</div><div class='del'>-			 AFFS_EPOCH_DELTA) +</div><div class='del'>-			 sys_tz.tz_minuteswest * 60;</div><div class='del'>-	inode-&gt;i_mtime.tv_nsec = inode-&gt;i_ctime.tv_nsec = inode-&gt;i_atime.tv_nsec = 0;</div><div class='add'>+	inode_set_mtime(inode,</div><div class='add'>+			inode_set_atime(inode, inode_set_ctime(inode, (be32_to_cpu(tail-&gt;change.days) * 86400LL + be32_to_cpu(tail-&gt;change.mins) * 60 + be32_to_cpu(tail-&gt;change.ticks) / 50 + AFFS_EPOCH_DELTA) + sys_tz.tz_minuteswest * 60, 0).tv_sec, 0).tv_sec,</div><div class='add'>+			0);</div><div class='ctx'> 	affs_brelse(bh);</div><div class='ctx'> 	unlock_new_inode(inode);</div><div class='ctx'> 	return inode;</div><div class='hunk'>@@ -187,12 +183,13 @@ affs_write_inode(struct inode *inode, struct writeback_control *wbc)</div><div class='ctx'> 	}</div><div class='ctx'> 	tail = AFFS_TAIL(sb, bh);</div><div class='ctx'> 	if (tail-&gt;stype == cpu_to_be32(ST_ROOT)) {</div><div class='del'>-		affs_secs_to_datestamp(inode-&gt;i_mtime.tv_sec,</div><div class='add'>+		affs_secs_to_datestamp(inode_get_mtime_sec(inode),</div><div class='ctx'> 				       &amp;AFFS_ROOT_TAIL(sb, bh)-&gt;root_change);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		tail-&gt;protect = cpu_to_be32(AFFS_I(inode)-&gt;i_protect);</div><div class='ctx'> 		tail-&gt;size = cpu_to_be32(inode-&gt;i_size);</div><div class='del'>-		affs_secs_to_datestamp(inode-&gt;i_mtime.tv_sec, &amp;tail-&gt;change);</div><div class='add'>+		affs_secs_to_datestamp(inode_get_mtime_sec(inode),</div><div class='add'>+				       &amp;tail-&gt;change);</div><div class='ctx'> 		if (!(inode-&gt;i_ino == AFFS_SB(sb)-&gt;s_root_block)) {</div><div class='ctx'> 			uid = i_uid_read(inode);</div><div class='ctx'> 			gid = i_gid_read(inode);</div><div class='hunk'>@@ -216,7 +213,7 @@ affs_write_inode(struct inode *inode, struct writeback_control *wbc)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int</div><div class='del'>-affs_notify_change(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='add'>+affs_notify_change(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		   struct iattr *attr)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='hunk'>@@ -224,7 +221,7 @@ affs_notify_change(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> </div><div class='ctx'> 	pr_debug("notify_change(%lu,0x%x)\n", inode-&gt;i_ino, attr-&gt;ia_valid);</div><div class='ctx'> </div><div class='del'>-	error = setattr_prepare(&amp;init_user_ns, dentry, attr);</div><div class='add'>+	error = setattr_prepare(&amp;nop_mnt_idmap, dentry, attr);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -250,7 +247,7 @@ affs_notify_change(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 		affs_truncate(inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	setattr_copy(&amp;init_user_ns, inode, attr);</div><div class='add'>+	setattr_copy(&amp;nop_mnt_idmap, inode, attr);</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (attr-&gt;ia_valid &amp; ATTR_MODE)</div><div class='hunk'>@@ -314,7 +311,7 @@ affs_new_inode(struct inode *dir)</div><div class='ctx'> 	inode-&gt;i_gid     = current_fsgid();</div><div class='ctx'> 	inode-&gt;i_ino     = block;</div><div class='ctx'> 	set_nlink(inode, 1);</div><div class='del'>-	inode-&gt;i_mtime   = inode-&gt;i_atime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	simple_inode_init_ts(inode);</div><div class='ctx'> 	atomic_set(&amp;AFFS_I(inode)-&gt;i_opencnt, 0);</div><div class='ctx'> 	AFFS_I(inode)-&gt;i_blkcnt = 0;</div><div class='ctx'> 	AFFS_I(inode)-&gt;i_lc = NULL;</div><div class='head'>diff --git a/fs/affs/namei.c b/fs/affs/namei.c<br/>index bcab18956b4f..f883be50db12 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/affs/namei.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/affs/namei.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/affs/namei.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/affs/namei.c</a></div><div class='hunk'>@@ -43,7 +43,7 @@ affs_get_toupper(struct super_block *sb)</div><div class='ctx'>  * Note: the dentry argument is the parent dentry.</div><div class='ctx'>  */</div><div class='ctx'> static inline int</div><div class='del'>-__affs_hash_dentry(const struct dentry *dentry, struct qstr *qstr, toupper_t toupper, bool notruncate)</div><div class='add'>+__affs_hash_dentry(const struct dentry *dentry, struct qstr *qstr, toupper_t fn, bool notruncate)</div><div class='ctx'> {</div><div class='ctx'> 	const u8 *name = qstr-&gt;name;</div><div class='ctx'> 	unsigned long hash;</div><div class='hunk'>@@ -57,7 +57,7 @@ __affs_hash_dentry(const struct dentry *dentry, struct qstr *qstr, toupper_t tou</div><div class='ctx'> 	hash = init_name_hash(dentry);</div><div class='ctx'> 	len = min(qstr-&gt;len, AFFSNAMEMAX);</div><div class='ctx'> 	for (; len &gt; 0; name++, len--)</div><div class='del'>-		hash = partial_name_hash(toupper(*name), hash);</div><div class='add'>+		hash = partial_name_hash(fn(*name), hash);</div><div class='ctx'> 	qstr-&gt;hash = end_name_hash(hash);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -80,7 +80,7 @@ affs_intl_hash_dentry(const struct dentry *dentry, struct qstr *qstr)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int __affs_compare_dentry(unsigned int len,</div><div class='del'>-		const char *str, const struct qstr *name, toupper_t toupper,</div><div class='add'>+		const char *str, const struct qstr *name, toupper_t fn,</div><div class='ctx'> 		bool notruncate)</div><div class='ctx'> {</div><div class='ctx'> 	const u8 *aname = str;</div><div class='hunk'>@@ -106,7 +106,7 @@ static inline int __affs_compare_dentry(unsigned int len,</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='ctx'> 	for (; len &gt; 0; len--)</div><div class='del'>-		if (toupper(*aname++) != toupper(*bname++))</div><div class='add'>+		if (fn(*aname++) != fn(*bname++))</div><div class='ctx'> 			return 1;</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -135,7 +135,7 @@ affs_intl_compare_dentry(const struct dentry *dentry,</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> static inline int</div><div class='del'>-affs_match(struct dentry *dentry, const u8 *name2, toupper_t toupper)</div><div class='add'>+affs_match(struct dentry *dentry, const u8 *name2, toupper_t fn)</div><div class='ctx'> {</div><div class='ctx'> 	const u8 *name = dentry-&gt;d_name.name;</div><div class='ctx'> 	int len = dentry-&gt;d_name.len;</div><div class='hunk'>@@ -148,7 +148,7 @@ affs_match(struct dentry *dentry, const u8 *name2, toupper_t toupper)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	for (name2++; len &gt; 0; len--)</div><div class='del'>-		if (toupper(*name++) != toupper(*name2++))</div><div class='add'>+		if (fn(*name++) != fn(*name2++))</div><div class='ctx'> 			return 0;</div><div class='ctx'> 	return 1;</div><div class='ctx'> }</div><div class='hunk'>@@ -156,12 +156,12 @@ affs_match(struct dentry *dentry, const u8 *name2, toupper_t toupper)</div><div class='ctx'> int</div><div class='ctx'> affs_hash_name(struct super_block *sb, const u8 *name, unsigned int len)</div><div class='ctx'> {</div><div class='del'>-	toupper_t toupper = affs_get_toupper(sb);</div><div class='add'>+	toupper_t fn = affs_get_toupper(sb);</div><div class='ctx'> 	u32 hash;</div><div class='ctx'> </div><div class='ctx'> 	hash = len = min(len, AFFSNAMEMAX);</div><div class='ctx'> 	for (; len &gt; 0; len--)</div><div class='del'>-		hash = (hash * 13 + toupper(*name++)) &amp; 0x7ff;</div><div class='add'>+		hash = (hash * 13 + fn(*name++)) &amp; 0x7ff;</div><div class='ctx'> </div><div class='ctx'> 	return hash % AFFS_SB(sb)-&gt;s_hashsize;</div><div class='ctx'> }</div><div class='hunk'>@@ -171,7 +171,7 @@ affs_find_entry(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = dir-&gt;i_sb;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='del'>-	toupper_t toupper = affs_get_toupper(sb);</div><div class='add'>+	toupper_t fn = affs_get_toupper(sb);</div><div class='ctx'> 	u32 key;</div><div class='ctx'> </div><div class='ctx'> 	pr_debug("%s(\"%pd\")\n", __func__, dentry);</div><div class='hunk'>@@ -189,7 +189,7 @@ affs_find_entry(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 		bh = affs_bread(sb, key);</div><div class='ctx'> 		if (!bh)</div><div class='ctx'> 			return ERR_PTR(-EIO);</div><div class='del'>-		if (affs_match(dentry, AFFS_TAIL(sb, bh)-&gt;name, toupper))</div><div class='add'>+		if (affs_match(dentry, AFFS_TAIL(sb, bh)-&gt;name, fn))</div><div class='ctx'> 			return bh;</div><div class='ctx'> 		key = be32_to_cpu(AFFS_TAIL(sb, bh)-&gt;hash_chain);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -242,7 +242,7 @@ affs_unlink(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int</div><div class='del'>-affs_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+affs_create(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 	    struct dentry *dentry, umode_t mode, bool excl)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = dir-&gt;i_sb;</div><div class='hunk'>@@ -273,8 +273,8 @@ affs_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int</div><div class='del'>-affs_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+struct dentry *</div><div class='add'>+affs_mkdir(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 	   struct dentry *dentry, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode		*inode;</div><div class='hunk'>@@ -285,7 +285,7 @@ affs_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> </div><div class='ctx'> 	inode = affs_new_inode(dir);</div><div class='ctx'> 	if (!inode)</div><div class='del'>-		return -ENOSPC;</div><div class='add'>+		return ERR_PTR(-ENOSPC);</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_mode = S_IFDIR | mode;</div><div class='ctx'> 	affs_mode_to_prot(inode);</div><div class='hunk'>@@ -298,9 +298,9 @@ affs_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 		clear_nlink(inode);</div><div class='ctx'> 		mark_inode_dirty(inode);</div><div class='ctx'> 		iput(inode);</div><div class='del'>-		return error;</div><div class='add'>+		return ERR_PTR(error);</div><div class='ctx'> 	}</div><div class='del'>-	return 0;</div><div class='add'>+	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int</div><div class='hunk'>@@ -313,7 +313,7 @@ affs_rmdir(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int</div><div class='del'>-affs_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+affs_symlink(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 	     struct dentry *dentry, const char *symname)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block	*sb = dir-&gt;i_sb;</div><div class='hunk'>@@ -503,7 +503,7 @@ done:</div><div class='ctx'> 	return retval;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int affs_rename2(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='add'>+int affs_rename2(struct mnt_idmap *idmap, struct inode *old_dir,</div><div class='ctx'> 		 struct dentry *old_dentry, struct inode *new_dir,</div><div class='ctx'> 		 struct dentry *new_dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='hunk'>@@ -532,9 +532,6 @@ static struct dentry *affs_get_parent(struct dentry *child)</div><div class='ctx'> 	parent = affs_iget(child-&gt;d_sb,</div><div class='ctx'> 			   be32_to_cpu(AFFS_TAIL(child-&gt;d_sb, bh)-&gt;parent));</div><div class='ctx'> 	brelse(bh);</div><div class='del'>-	if (IS_ERR(parent))</div><div class='del'>-		return ERR_CAST(parent);</div><div class='del'>-</div><div class='ctx'> 	return d_obtain_alias(parent);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -568,6 +565,7 @@ static struct dentry *affs_fh_to_parent(struct super_block *sb, struct fid *fid,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct export_operations affs_export_ops = {</div><div class='add'>+	.encode_fh = generic_encode_ino32_fh,</div><div class='ctx'> 	.fh_to_dentry = affs_fh_to_dentry,</div><div class='ctx'> 	.fh_to_parent = affs_fh_to_parent,</div><div class='ctx'> 	.get_parent = affs_get_parent,</div><div class='head'>diff --git a/fs/affs/super.c b/fs/affs/super.c<br/>index c609005a9eaa..44f8aa883100 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/affs/super.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/affs/super.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/affs/super.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/affs/super.c</a></div><div class='hunk'>@@ -14,7 +14,8 @@</div><div class='ctx'> #include &lt;linux/module.h&gt;</div><div class='ctx'> #include &lt;linux/init.h&gt;</div><div class='ctx'> #include &lt;linux/statfs.h&gt;</div><div class='del'>-#include &lt;linux/parser.h&gt;</div><div class='add'>+#include &lt;linux/fs_parser.h&gt;</div><div class='add'>+#include &lt;linux/fs_context.h&gt;</div><div class='ctx'> #include &lt;linux/magic.h&gt;</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='ctx'> #include &lt;linux/cred.h&gt;</div><div class='hunk'>@@ -27,7 +28,6 @@</div><div class='ctx'> </div><div class='ctx'> static int affs_statfs(struct dentry *dentry, struct kstatfs *buf);</div><div class='ctx'> static int affs_show_options(struct seq_file *m, struct dentry *root);</div><div class='del'>-static int affs_remount (struct super_block *sb, int *flags, char *data);</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='ctx'> affs_commit_super(struct super_block *sb, int wait)</div><div class='hunk'>@@ -100,7 +100,7 @@ static struct inode *affs_alloc_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct affs_inode_info *i;</div><div class='ctx'> </div><div class='del'>-	i = kmem_cache_alloc(affs_inode_cachep, GFP_KERNEL);</div><div class='add'>+	i = alloc_inode_sb(sb, affs_inode_cachep, GFP_KERNEL);</div><div class='ctx'> 	if (!i)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='hunk'>@@ -130,8 +130,7 @@ static int __init init_inodecache(void)</div><div class='ctx'> {</div><div class='ctx'> 	affs_inode_cachep = kmem_cache_create("affs_inode_cache",</div><div class='ctx'> 					     sizeof(struct affs_inode_info),</div><div class='del'>-					     0, (SLAB_RECLAIM_ACCOUNT|</div><div class='del'>-						SLAB_MEM_SPREAD|SLAB_ACCOUNT),</div><div class='add'>+					     0, (SLAB_RECLAIM_ACCOUNT | SLAB_ACCOUNT),</div><div class='ctx'> 					     init_once);</div><div class='ctx'> 	if (affs_inode_cachep == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='hunk'>@@ -156,140 +155,114 @@ static const struct super_operations affs_sops = {</div><div class='ctx'> 	.put_super	= affs_put_super,</div><div class='ctx'> 	.sync_fs	= affs_sync_fs,</div><div class='ctx'> 	.statfs		= affs_statfs,</div><div class='del'>-	.remount_fs	= affs_remount,</div><div class='ctx'> 	.show_options	= affs_show_options,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> enum {</div><div class='ctx'> 	Opt_bs, Opt_mode, Opt_mufs, Opt_notruncate, Opt_prefix, Opt_protect,</div><div class='ctx'> 	Opt_reserved, Opt_root, Opt_setgid, Opt_setuid,</div><div class='del'>-	Opt_verbose, Opt_volume, Opt_ignore, Opt_err,</div><div class='add'>+	Opt_verbose, Opt_volume, Opt_ignore,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static const match_table_t tokens = {</div><div class='del'>-	{Opt_bs, "bs=%u"},</div><div class='del'>-	{Opt_mode, "mode=%o"},</div><div class='del'>-	{Opt_mufs, "mufs"},</div><div class='del'>-	{Opt_notruncate, "nofilenametruncate"},</div><div class='del'>-	{Opt_prefix, "prefix=%s"},</div><div class='del'>-	{Opt_protect, "protect"},</div><div class='del'>-	{Opt_reserved, "reserved=%u"},</div><div class='del'>-	{Opt_root, "root=%u"},</div><div class='del'>-	{Opt_setgid, "setgid=%u"},</div><div class='del'>-	{Opt_setuid, "setuid=%u"},</div><div class='del'>-	{Opt_verbose, "verbose"},</div><div class='del'>-	{Opt_volume, "volume=%s"},</div><div class='del'>-	{Opt_ignore, "grpquota"},</div><div class='del'>-	{Opt_ignore, "noquota"},</div><div class='del'>-	{Opt_ignore, "quota"},</div><div class='del'>-	{Opt_ignore, "usrquota"},</div><div class='del'>-	{Opt_err, NULL},</div><div class='add'>+struct affs_context {</div><div class='add'>+	kuid_t		uid;		/* uid to override */</div><div class='add'>+	kgid_t		gid;		/* gid to override */</div><div class='add'>+	unsigned int	mode;		/* mode to override */</div><div class='add'>+	unsigned int	reserved;	/* Number of reserved blocks */</div><div class='add'>+	int		root_block;	/* FFS root block number */</div><div class='add'>+	int		blocksize;	/* Initial device blksize */</div><div class='add'>+	char		*prefix;	/* Prefix for volumes and assigns */</div><div class='add'>+	char		volume[32];	/* Vol. prefix for absolute symlinks */</div><div class='add'>+	unsigned long	mount_flags;	/* Options */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int</div><div class='del'>-parse_options(char *options, kuid_t *uid, kgid_t *gid, int *mode, int *reserved, s32 *root,</div><div class='del'>-		int *blocksize, char **prefix, char *volume, unsigned long *mount_opts)</div><div class='add'>+static const struct fs_parameter_spec affs_param_spec[] = {</div><div class='add'>+	fsparam_u32	("bs",		Opt_bs),</div><div class='add'>+	fsparam_u32oct	("mode",	Opt_mode),</div><div class='add'>+	fsparam_flag	("mufs",	Opt_mufs),</div><div class='add'>+	fsparam_flag	("nofilenametruncate",	Opt_notruncate),</div><div class='add'>+	fsparam_string	("prefix",	Opt_prefix),</div><div class='add'>+	fsparam_flag	("protect",	Opt_protect),</div><div class='add'>+	fsparam_u32	("reserved",	Opt_reserved),</div><div class='add'>+	fsparam_u32	("root",	Opt_root),</div><div class='add'>+	fsparam_gid	("setgid",	Opt_setgid),</div><div class='add'>+	fsparam_uid	("setuid",	Opt_setuid),</div><div class='add'>+	fsparam_flag	("verbose",	Opt_verbose),</div><div class='add'>+	fsparam_string	("volume",	Opt_volume),</div><div class='add'>+	fsparam_flag	("grpquota",	Opt_ignore),</div><div class='add'>+	fsparam_flag	("noquota",	Opt_ignore),</div><div class='add'>+	fsparam_flag	("quota",	Opt_ignore),</div><div class='add'>+	fsparam_flag	("usrquota",	Opt_ignore),</div><div class='add'>+	{},</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int affs_parse_param(struct fs_context *fc, struct fs_parameter *param)</div><div class='ctx'> {</div><div class='del'>-	char *p;</div><div class='del'>-	substring_t args[MAX_OPT_ARGS];</div><div class='del'>-</div><div class='del'>-	/* Fill in defaults */</div><div class='del'>-</div><div class='del'>-	*uid        = current_uid();</div><div class='del'>-	*gid        = current_gid();</div><div class='del'>-	*reserved   = 2;</div><div class='del'>-	*root       = -1;</div><div class='del'>-	*blocksize  = -1;</div><div class='del'>-	volume[0]   = ':';</div><div class='del'>-	volume[1]   = 0;</div><div class='del'>-	*mount_opts = 0;</div><div class='del'>-	if (!options)</div><div class='del'>-		return 1;</div><div class='del'>-</div><div class='del'>-	while ((p = strsep(&amp;options, ",")) != NULL) {</div><div class='del'>-		int token, n, option;</div><div class='del'>-		if (!*p)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		token = match_token(p, tokens, args);</div><div class='del'>-		switch (token) {</div><div class='del'>-		case Opt_bs:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;n))</div><div class='del'>-				return 0;</div><div class='del'>-			if (n != 512 &amp;&amp; n != 1024 &amp;&amp; n != 2048</div><div class='del'>-			    &amp;&amp; n != 4096) {</div><div class='del'>-				pr_warn("Invalid blocksize (512, 1024, 2048, 4096 allowed)\n");</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			*blocksize = n;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_mode:</div><div class='del'>-			if (match_octal(&amp;args[0], &amp;option))</div><div class='del'>-				return 0;</div><div class='del'>-			*mode = option &amp; 0777;</div><div class='del'>-			affs_set_opt(*mount_opts, SF_SETMODE);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_mufs:</div><div class='del'>-			affs_set_opt(*mount_opts, SF_MUFS);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_notruncate:</div><div class='del'>-			affs_set_opt(*mount_opts, SF_NO_TRUNCATE);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_prefix:</div><div class='del'>-			kfree(*prefix);</div><div class='del'>-			*prefix = match_strdup(&amp;args[0]);</div><div class='del'>-			if (!*prefix)</div><div class='del'>-				return 0;</div><div class='del'>-			affs_set_opt(*mount_opts, SF_PREFIX);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_protect:</div><div class='del'>-			affs_set_opt(*mount_opts, SF_IMMUTABLE);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_reserved:</div><div class='del'>-			if (match_int(&amp;args[0], reserved))</div><div class='del'>-				return 0;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_root:</div><div class='del'>-			if (match_int(&amp;args[0], root))</div><div class='del'>-				return 0;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_setgid:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;option))</div><div class='del'>-				return 0;</div><div class='del'>-			*gid = make_kgid(current_user_ns(), option);</div><div class='del'>-			if (!gid_valid(*gid))</div><div class='del'>-				return 0;</div><div class='del'>-			affs_set_opt(*mount_opts, SF_SETGID);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_setuid:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;option))</div><div class='del'>-				return 0;</div><div class='del'>-			*uid = make_kuid(current_user_ns(), option);</div><div class='del'>-			if (!uid_valid(*uid))</div><div class='del'>-				return 0;</div><div class='del'>-			affs_set_opt(*mount_opts, SF_SETUID);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_verbose:</div><div class='del'>-			affs_set_opt(*mount_opts, SF_VERBOSE);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_volume: {</div><div class='del'>-			char *vol = match_strdup(&amp;args[0]);</div><div class='del'>-			if (!vol)</div><div class='del'>-				return 0;</div><div class='del'>-			strlcpy(volume, vol, 32);</div><div class='del'>-			kfree(vol);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		case Opt_ignore:</div><div class='del'>-		 	/* Silently ignore the quota options */</div><div class='del'>-			break;</div><div class='del'>-		default:</div><div class='del'>-			pr_warn("Unrecognized mount option \"%s\" or missing value\n",</div><div class='del'>-				p);</div><div class='del'>-			return 0;</div><div class='add'>+	struct affs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct fs_parse_result result;</div><div class='add'>+	int n;</div><div class='add'>+	int opt;</div><div class='add'>+</div><div class='add'>+	opt = fs_parse(fc, affs_param_spec, param, &amp;result);</div><div class='add'>+	if (opt &lt; 0)</div><div class='add'>+		return opt;</div><div class='add'>+</div><div class='add'>+	switch (opt) {</div><div class='add'>+	case Opt_bs:</div><div class='add'>+		n = result.uint_32;</div><div class='add'>+		if (n != 512 &amp;&amp; n != 1024 &amp;&amp; n != 2048</div><div class='add'>+		    &amp;&amp; n != 4096) {</div><div class='add'>+			pr_warn("Invalid blocksize (512, 1024, 2048, 4096 allowed)\n");</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 		}</div><div class='add'>+		ctx-&gt;blocksize = n;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_mode:</div><div class='add'>+		ctx-&gt;mode = result.uint_32 &amp; 0777;</div><div class='add'>+		affs_set_opt(ctx-&gt;mount_flags, SF_SETMODE);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_mufs:</div><div class='add'>+		affs_set_opt(ctx-&gt;mount_flags, SF_MUFS);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_notruncate:</div><div class='add'>+		affs_set_opt(ctx-&gt;mount_flags, SF_NO_TRUNCATE);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_prefix:</div><div class='add'>+		kfree(ctx-&gt;prefix);</div><div class='add'>+		ctx-&gt;prefix = param-&gt;string;</div><div class='add'>+		param-&gt;string = NULL;</div><div class='add'>+		affs_set_opt(ctx-&gt;mount_flags, SF_PREFIX);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_protect:</div><div class='add'>+		affs_set_opt(ctx-&gt;mount_flags, SF_IMMUTABLE);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_reserved:</div><div class='add'>+		ctx-&gt;reserved = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_root:</div><div class='add'>+		ctx-&gt;root_block = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_setgid:</div><div class='add'>+		ctx-&gt;gid = result.gid;</div><div class='add'>+		affs_set_opt(ctx-&gt;mount_flags, SF_SETGID);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_setuid:</div><div class='add'>+		ctx-&gt;uid = result.uid;</div><div class='add'>+		affs_set_opt(ctx-&gt;mount_flags, SF_SETUID);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_verbose:</div><div class='add'>+		affs_set_opt(ctx-&gt;mount_flags, SF_VERBOSE);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_volume:</div><div class='add'>+		strscpy(ctx-&gt;volume, param-&gt;string, 32);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_ignore:</div><div class='add'>+		/* Silently ignore the quota options */</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-	return 1;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int affs_show_options(struct seq_file *m, struct dentry *root)</div><div class='hunk'>@@ -330,27 +303,22 @@ static int affs_show_options(struct seq_file *m, struct dentry *root)</div><div class='ctx'>  * hopefully have the guts to do so. Until then: sorry for the mess.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static int affs_fill_super(struct super_block *sb, void *data, int silent)</div><div class='add'>+static int affs_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> {</div><div class='ctx'> 	struct affs_sb_info	*sbi;</div><div class='add'>+	struct affs_context	*ctx = fc-&gt;fs_private;</div><div class='ctx'> 	struct buffer_head	*root_bh = NULL;</div><div class='ctx'> 	struct buffer_head	*boot_bh;</div><div class='ctx'> 	struct inode		*root_inode = NULL;</div><div class='del'>-	s32			 root_block;</div><div class='add'>+	int			 silent = fc-&gt;sb_flags &amp; SB_SILENT;</div><div class='ctx'> 	int			 size, blocksize;</div><div class='ctx'> 	u32			 chksum;</div><div class='ctx'> 	int			 num_bm;</div><div class='ctx'> 	int			 i, j;</div><div class='del'>-	kuid_t			 uid;</div><div class='del'>-	kgid_t			 gid;</div><div class='del'>-	int			 reserved;</div><div class='del'>-	unsigned long		 mount_flags;</div><div class='ctx'> 	int			 tmp_flags;	/* fix remount prototype... */</div><div class='ctx'> 	u8			 sig[4];</div><div class='ctx'> 	int			 ret;</div><div class='ctx'> </div><div class='del'>-	pr_debug("read_super(%s)\n", data ? (const char *)data : "no options");</div><div class='del'>-</div><div class='ctx'> 	sb-&gt;s_magic             = AFFS_SUPER_MAGIC;</div><div class='ctx'> 	sb-&gt;s_op                = &amp;affs_sops;</div><div class='ctx'> 	sb-&gt;s_flags |= SB_NODIRATIME;</div><div class='hunk'>@@ -370,19 +338,16 @@ static int affs_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 	spin_lock_init(&amp;sbi-&gt;work_lock);</div><div class='ctx'> 	INIT_DELAYED_WORK(&amp;sbi-&gt;sb_work, flush_superblock);</div><div class='ctx'> </div><div class='del'>-	if (!parse_options(data,&amp;uid,&amp;gid,&amp;i,&amp;reserved,&amp;root_block,</div><div class='del'>-				&amp;blocksize,&amp;sbi-&gt;s_prefix,</div><div class='del'>-				sbi-&gt;s_volume, &amp;mount_flags)) {</div><div class='del'>-		pr_err("Error parsing options\n");</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-	/* N.B. after this point s_prefix must be released */</div><div class='add'>+	sbi-&gt;s_flags	= ctx-&gt;mount_flags;</div><div class='add'>+	sbi-&gt;s_mode	= ctx-&gt;mode;</div><div class='add'>+	sbi-&gt;s_uid	= ctx-&gt;uid;</div><div class='add'>+	sbi-&gt;s_gid	= ctx-&gt;gid;</div><div class='add'>+	sbi-&gt;s_reserved	= ctx-&gt;reserved;</div><div class='add'>+	sbi-&gt;s_prefix	= ctx-&gt;prefix;</div><div class='add'>+	ctx-&gt;prefix	= NULL;</div><div class='add'>+	memcpy(sbi-&gt;s_volume, ctx-&gt;volume, 32);</div><div class='ctx'> </div><div class='del'>-	sbi-&gt;s_flags   = mount_flags;</div><div class='del'>-	sbi-&gt;s_mode    = i;</div><div class='del'>-	sbi-&gt;s_uid     = uid;</div><div class='del'>-	sbi-&gt;s_gid     = gid;</div><div class='del'>-	sbi-&gt;s_reserved= reserved;</div><div class='add'>+	/* N.B. after this point s_prefix must be released */</div><div class='ctx'> </div><div class='ctx'> 	/* Get the size of the device in 512-byte blocks.</div><div class='ctx'> 	 * If we later see that the partition uses bigger</div><div class='hunk'>@@ -397,15 +362,16 @@ static int affs_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> </div><div class='ctx'> 	i = bdev_logical_block_size(sb-&gt;s_bdev);</div><div class='ctx'> 	j = PAGE_SIZE;</div><div class='add'>+	blocksize = ctx-&gt;blocksize;</div><div class='ctx'> 	if (blocksize &gt; 0) {</div><div class='ctx'> 		i = j = blocksize;</div><div class='ctx'> 		size = size / (blocksize / 512);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	for (blocksize = i; blocksize &lt;= j; blocksize &lt;&lt;= 1, size &gt;&gt;= 1) {</div><div class='del'>-		sbi-&gt;s_root_block = root_block;</div><div class='del'>-		if (root_block &lt; 0)</div><div class='del'>-			sbi-&gt;s_root_block = (reserved + size - 1) / 2;</div><div class='add'>+		sbi-&gt;s_root_block = ctx-&gt;root_block;</div><div class='add'>+		if (ctx-&gt;root_block &lt; 0)</div><div class='add'>+			sbi-&gt;s_root_block = (ctx-&gt;reserved + size - 1) / 2;</div><div class='ctx'> 		pr_debug("setting blocksize to %d\n", blocksize);</div><div class='ctx'> 		affs_set_blocksize(sb, blocksize);</div><div class='ctx'> 		sbi-&gt;s_partition_size = size;</div><div class='hunk'>@@ -425,7 +391,7 @@ static int affs_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 				"size=%d, reserved=%d\n",</div><div class='ctx'> 				sb-&gt;s_id,</div><div class='ctx'> 				sbi-&gt;s_root_block + num_bm,</div><div class='del'>-				blocksize, size, reserved);</div><div class='add'>+				ctx-&gt;blocksize, size, ctx-&gt;reserved);</div><div class='ctx'> 			root_bh = affs_bread(sb, sbi-&gt;s_root_block + num_bm);</div><div class='ctx'> 			if (!root_bh)</div><div class='ctx'> 				continue;</div><div class='hunk'>@@ -448,7 +414,7 @@ static int affs_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> got_root:</div><div class='ctx'> 	/* Keep super block in cache */</div><div class='ctx'> 	sbi-&gt;s_root_bh = root_bh;</div><div class='del'>-	root_block = sbi-&gt;s_root_block;</div><div class='add'>+	ctx-&gt;root_block = sbi-&gt;s_root_block;</div><div class='ctx'> </div><div class='ctx'> 	/* Find out which kind of FS we have */</div><div class='ctx'> 	boot_bh = sb_bread(sb, 0);</div><div class='hunk'>@@ -507,7 +473,7 @@ got_root:</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (affs_test_opt(mount_flags, SF_VERBOSE)) {</div><div class='add'>+	if (affs_test_opt(ctx-&gt;mount_flags, SF_VERBOSE)) {</div><div class='ctx'> 		u8 len = AFFS_ROOT_TAIL(sb, root_bh)-&gt;disk_name[0];</div><div class='ctx'> 		pr_notice("Mounting volume \"%.*s\": Type=%.3s\\%c, Blocksize=%d\n",</div><div class='ctx'> 			len &gt; 31 ? 31 : len,</div><div class='hunk'>@@ -529,14 +495,14 @@ got_root:</div><div class='ctx'> </div><div class='ctx'> 	/* set up enough so that it can read an inode */</div><div class='ctx'> </div><div class='del'>-	root_inode = affs_iget(sb, root_block);</div><div class='add'>+	root_inode = affs_iget(sb, ctx-&gt;root_block);</div><div class='ctx'> 	if (IS_ERR(root_inode))</div><div class='ctx'> 		return PTR_ERR(root_inode);</div><div class='ctx'> </div><div class='ctx'> 	if (affs_test_opt(AFFS_SB(sb)-&gt;s_flags, SF_INTL))</div><div class='del'>-		sb-&gt;s_d_op = &amp;affs_intl_dentry_operations;</div><div class='add'>+		set_default_d_op(sb, &amp;affs_intl_dentry_operations);</div><div class='ctx'> 	else</div><div class='del'>-		sb-&gt;s_d_op = &amp;affs_dentry_operations;</div><div class='add'>+		set_default_d_op(sb, &amp;affs_dentry_operations);</div><div class='ctx'> </div><div class='ctx'> 	sb-&gt;s_root = d_make_root(root_inode);</div><div class='ctx'> 	if (!sb-&gt;s_root) {</div><div class='hunk'>@@ -549,56 +515,43 @@ got_root:</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int</div><div class='del'>-affs_remount(struct super_block *sb, int *flags, char *data)</div><div class='add'>+static int affs_reconfigure(struct fs_context *fc)</div><div class='ctx'> {</div><div class='add'>+	struct super_block	*sb = fc-&gt;root-&gt;d_sb;</div><div class='add'>+	struct affs_context	*ctx = fc-&gt;fs_private;</div><div class='ctx'> 	struct affs_sb_info	*sbi = AFFS_SB(sb);</div><div class='del'>-	int			 blocksize;</div><div class='del'>-	kuid_t			 uid;</div><div class='del'>-	kgid_t			 gid;</div><div class='del'>-	int			 mode;</div><div class='del'>-	int			 reserved;</div><div class='del'>-	int			 root_block;</div><div class='del'>-	unsigned long		 mount_flags;</div><div class='ctx'> 	int			 res = 0;</div><div class='del'>-	char			 volume[32];</div><div class='del'>-	char			*prefix = NULL;</div><div class='del'>-</div><div class='del'>-	pr_debug("%s(flags=0x%x,opts=\"%s\")\n", __func__, *flags, data);</div><div class='ctx'> </div><div class='ctx'> 	sync_filesystem(sb);</div><div class='del'>-	*flags |= SB_NODIRATIME;</div><div class='del'>-</div><div class='del'>-	memcpy(volume, sbi-&gt;s_volume, 32);</div><div class='del'>-	if (!parse_options(data, &amp;uid, &amp;gid, &amp;mode, &amp;reserved, &amp;root_block,</div><div class='del'>-			   &amp;blocksize, &amp;prefix, volume,</div><div class='del'>-			   &amp;mount_flags)) {</div><div class='del'>-		kfree(prefix);</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='add'>+	fc-&gt;sb_flags |= SB_NODIRATIME;</div><div class='ctx'> </div><div class='ctx'> 	flush_delayed_work(&amp;sbi-&gt;sb_work);</div><div class='ctx'> </div><div class='del'>-	sbi-&gt;s_flags = mount_flags;</div><div class='del'>-	sbi-&gt;s_mode  = mode;</div><div class='del'>-	sbi-&gt;s_uid   = uid;</div><div class='del'>-	sbi-&gt;s_gid   = gid;</div><div class='add'>+	/*</div><div class='add'>+	 * NB: Historically, only mount_flags, mode, uid, gic, prefix,</div><div class='add'>+	 * and volume are accepted during remount.</div><div class='add'>+	 */</div><div class='add'>+	sbi-&gt;s_flags = ctx-&gt;mount_flags;</div><div class='add'>+	sbi-&gt;s_mode  = ctx-&gt;mode;</div><div class='add'>+	sbi-&gt;s_uid   = ctx-&gt;uid;</div><div class='add'>+	sbi-&gt;s_gid   = ctx-&gt;gid;</div><div class='ctx'> 	/* protect against readers */</div><div class='ctx'> 	spin_lock(&amp;sbi-&gt;symlink_lock);</div><div class='del'>-	if (prefix) {</div><div class='add'>+	if (ctx-&gt;prefix) {</div><div class='ctx'> 		kfree(sbi-&gt;s_prefix);</div><div class='del'>-		sbi-&gt;s_prefix = prefix;</div><div class='add'>+		sbi-&gt;s_prefix = ctx-&gt;prefix;</div><div class='add'>+		ctx-&gt;prefix = NULL;</div><div class='ctx'> 	}</div><div class='del'>-	memcpy(sbi-&gt;s_volume, volume, 32);</div><div class='add'>+	memcpy(sbi-&gt;s_volume, ctx-&gt;volume, 32);</div><div class='ctx'> 	spin_unlock(&amp;sbi-&gt;symlink_lock);</div><div class='ctx'> </div><div class='del'>-	if ((bool)(*flags &amp; SB_RDONLY) == sb_rdonly(sb))</div><div class='add'>+	if ((bool)(fc-&gt;sb_flags &amp; SB_RDONLY) == sb_rdonly(sb))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	if (*flags &amp; SB_RDONLY)</div><div class='add'>+	if (fc-&gt;sb_flags &amp; SB_RDONLY)</div><div class='ctx'> 		affs_free_bitmap(sb);</div><div class='ctx'> 	else</div><div class='del'>-		res = affs_init_bitmap(sb, flags);</div><div class='add'>+		res = affs_init_bitmap(sb, &amp;fc-&gt;sb_flags);</div><div class='ctx'> </div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='hunk'>@@ -625,10 +578,9 @@ affs_statfs(struct dentry *dentry, struct kstatfs *buf)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct dentry *affs_mount(struct file_system_type *fs_type,</div><div class='del'>-	int flags, const char *dev_name, void *data)</div><div class='add'>+static int affs_get_tree(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	return mount_bdev(fs_type, flags, dev_name, data, affs_fill_super);</div><div class='add'>+	return get_tree_bdev(fc, affs_fill_super);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void affs_kill_sb(struct super_block *sb)</div><div class='hunk'>@@ -640,16 +592,65 @@ static void affs_kill_sb(struct super_block *sb)</div><div class='ctx'> 		affs_brelse(sbi-&gt;s_root_bh);</div><div class='ctx'> 		kfree(sbi-&gt;s_prefix);</div><div class='ctx'> 		mutex_destroy(&amp;sbi-&gt;s_bmlock);</div><div class='del'>-		kfree(sbi);</div><div class='add'>+		kfree_rcu(sbi, rcu);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void affs_free_fc(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct affs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+</div><div class='add'>+	kfree(ctx-&gt;prefix);</div><div class='add'>+	kfree(ctx);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct fs_context_operations affs_context_ops = {</div><div class='add'>+	.parse_param	= affs_parse_param,</div><div class='add'>+	.get_tree	= affs_get_tree,</div><div class='add'>+	.reconfigure	= affs_reconfigure,</div><div class='add'>+	.free		= affs_free_fc,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int affs_init_fs_context(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct affs_context *ctx;</div><div class='add'>+</div><div class='add'>+	ctx = kzalloc(sizeof(struct affs_context), GFP_KERNEL);</div><div class='add'>+	if (!ctx)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	if (fc-&gt;purpose == FS_CONTEXT_FOR_RECONFIGURE) {</div><div class='add'>+		struct super_block *sb = fc-&gt;root-&gt;d_sb;</div><div class='add'>+		struct affs_sb_info *sbi = AFFS_SB(sb);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * NB: historically, no options other than volume were</div><div class='add'>+		 * preserved across a remount unless they were explicitly</div><div class='add'>+		 * passed in.</div><div class='add'>+		 */</div><div class='add'>+		memcpy(ctx-&gt;volume, sbi-&gt;s_volume, 32);</div><div class='add'>+	} else {</div><div class='add'>+		ctx-&gt;uid	= current_uid();</div><div class='add'>+		ctx-&gt;gid	= current_gid();</div><div class='add'>+		ctx-&gt;reserved	= 2;</div><div class='add'>+		ctx-&gt;root_block	= -1;</div><div class='add'>+		ctx-&gt;blocksize	= -1;</div><div class='add'>+		ctx-&gt;volume[0]	= ':';</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	fc-&gt;ops = &amp;affs_context_ops;</div><div class='add'>+	fc-&gt;fs_private = ctx;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static struct file_system_type affs_fs_type = {</div><div class='ctx'> 	.owner		= THIS_MODULE,</div><div class='ctx'> 	.name		= "affs",</div><div class='del'>-	.mount		= affs_mount,</div><div class='ctx'> 	.kill_sb	= affs_kill_sb,</div><div class='ctx'> 	.fs_flags	= FS_REQUIRES_DEV,</div><div class='add'>+	.init_fs_context = affs_init_fs_context,</div><div class='add'>+	.parameters	= affs_param_spec,</div><div class='ctx'> };</div><div class='ctx'> MODULE_ALIAS_FS("affs");</div><div class='ctx'> </div><div class='head'>diff --git a/fs/affs/symlink.c b/fs/affs/symlink.c<br/>index a7531b26e8f0..094aec8d17b8 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/affs/symlink.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/affs/symlink.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/affs/symlink.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/affs/symlink.c</a></div><div class='hunk'>@@ -11,11 +11,11 @@</div><div class='ctx'> </div><div class='ctx'> #include "affs.h"</div><div class='ctx'> </div><div class='del'>-static int affs_symlink_readpage(struct file *file, struct page *page)</div><div class='add'>+static int affs_symlink_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-	char *link = page_address(page);</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+	char *link = folio_address(folio);</div><div class='ctx'> 	struct slink_front *lf;</div><div class='ctx'> 	int			 i, j;</div><div class='ctx'> 	char			 c;</div><div class='hunk'>@@ -57,17 +57,16 @@ static int affs_symlink_readpage(struct file *file, struct page *page)</div><div class='ctx'> 	}</div><div class='ctx'> 	link[i] = '\0';</div><div class='ctx'> 	affs_brelse(bh);</div><div class='del'>-	SetPageUptodate(page);</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	folio_mark_uptodate(folio);</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> 	return 0;</div><div class='ctx'> fail:</div><div class='del'>-	SetPageError(page);</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> 	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations affs_symlink_aops = {</div><div class='del'>-	.readpage	= affs_symlink_readpage,</div><div class='add'>+	.read_folio	= affs_symlink_read_folio,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct inode_operations affs_symlink_inode_operations = {</div><div class='head'>diff --git a/fs/afs/Kconfig b/fs/afs/Kconfig<br/>index fc8ba9142f2f..682bd8ec2c10 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/Kconfig</a></div><div class='hunk'>@@ -5,6 +5,7 @@ config AFS_FS</div><div class='ctx'> 	select AF_RXRPC</div><div class='ctx'> 	select DNS_RESOLVER</div><div class='ctx'> 	select NETFS_SUPPORT</div><div class='add'>+	select CRYPTO_KRB5</div><div class='ctx'> 	help</div><div class='ctx'> 	  If you say Y here, you will get an experimental Andrew File System</div><div class='ctx'> 	  driver. It currently only supports unsecured read-only AFS access.</div><div class='head'>diff --git a/fs/afs/Makefile b/fs/afs/Makefile<br/>index 75c4e4043d1d..b49b8fe682f3 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/Makefile?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/Makefile</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/Makefile?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/Makefile</a></div><div class='hunk'>@@ -3,16 +3,16 @@</div><div class='ctx'> # Makefile for Red Hat Linux AFS client.</div><div class='ctx'> #</div><div class='ctx'> </div><div class='del'>-afs-cache-$(CONFIG_AFS_FSCACHE) := cache.o</div><div class='del'>-</div><div class='ctx'> kafs-y := \</div><div class='del'>-	$(afs-cache-y) \</div><div class='ctx'> 	addr_list.o \</div><div class='add'>+	addr_prefs.o \</div><div class='ctx'> 	callback.o \</div><div class='ctx'> 	cell.o \</div><div class='add'>+	cm_security.o \</div><div class='ctx'> 	cmservice.o \</div><div class='ctx'> 	dir.o \</div><div class='ctx'> 	dir_edit.o \</div><div class='add'>+	dir_search.o \</div><div class='ctx'> 	dir_silly.o \</div><div class='ctx'> 	dynroot.o \</div><div class='ctx'> 	file.o \</div><div class='hunk'>@@ -30,6 +30,7 @@ kafs-y := \</div><div class='ctx'> 	server.o \</div><div class='ctx'> 	server_list.o \</div><div class='ctx'> 	super.o \</div><div class='add'>+	validation.o \</div><div class='ctx'> 	vlclient.o \</div><div class='ctx'> 	vl_alias.o \</div><div class='ctx'> 	vl_list.o \</div><div class='head'>diff --git a/fs/afs/addr_list.c b/fs/afs/addr_list.c<br/>index de1ae0bead3b..e941da5b6dd9 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/addr_list.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/addr_list.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/addr_list.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/addr_list.c</a></div><div class='hunk'>@@ -13,26 +13,55 @@</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> #include "afs_fs.h"</div><div class='ctx'> </div><div class='add'>+static void afs_free_addrlist(struct rcu_head *rcu)</div><div class='add'>+{</div><div class='add'>+	struct afs_addr_list *alist = container_of(rcu, struct afs_addr_list, rcu);</div><div class='add'>+	unsigned int i;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; alist-&gt;nr_addrs; i++)</div><div class='add'>+		rxrpc_kernel_put_peer(alist-&gt;addrs[i].peer);</div><div class='add'>+	trace_afs_alist(alist-&gt;debug_id, refcount_read(&amp;alist-&gt;usage), afs_alist_trace_free);</div><div class='add'>+	kfree(alist);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Release an address list.</div><div class='ctx'>  */</div><div class='del'>-void afs_put_addrlist(struct afs_addr_list *alist)</div><div class='add'>+void afs_put_addrlist(struct afs_addr_list *alist, enum afs_alist_trace reason)</div><div class='ctx'> {</div><div class='del'>-	if (alist &amp;&amp; refcount_dec_and_test(&amp;alist-&gt;usage))</div><div class='del'>-		kfree_rcu(alist, rcu);</div><div class='add'>+	unsigned int debug_id;</div><div class='add'>+	bool dead;</div><div class='add'>+	int r;</div><div class='add'>+</div><div class='add'>+	if (!alist)</div><div class='add'>+		return;</div><div class='add'>+	debug_id = alist-&gt;debug_id;</div><div class='add'>+	dead = __refcount_dec_and_test(&amp;alist-&gt;usage, &amp;r);</div><div class='add'>+	trace_afs_alist(debug_id, r - 1, reason);</div><div class='add'>+	if (dead)</div><div class='add'>+		call_rcu(&amp;alist-&gt;rcu, afs_free_addrlist);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct afs_addr_list *afs_get_addrlist(struct afs_addr_list *alist, enum afs_alist_trace reason)</div><div class='add'>+{</div><div class='add'>+	int r;</div><div class='add'>+</div><div class='add'>+	if (alist) {</div><div class='add'>+		__refcount_inc(&amp;alist-&gt;usage, &amp;r);</div><div class='add'>+		trace_afs_alist(alist-&gt;debug_id, r + 1, reason);</div><div class='add'>+	}</div><div class='add'>+	return alist;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Allocate an address list.</div><div class='ctx'>  */</div><div class='del'>-struct afs_addr_list *afs_alloc_addrlist(unsigned int nr,</div><div class='del'>-					 unsigned short service,</div><div class='del'>-					 unsigned short port)</div><div class='add'>+struct afs_addr_list *afs_alloc_addrlist(unsigned int nr)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_addr_list *alist;</div><div class='del'>-	unsigned int i;</div><div class='add'>+	static atomic_t debug_id;</div><div class='ctx'> </div><div class='del'>-	_enter("%u,%u,%u", nr, service, port);</div><div class='add'>+	_enter("%u", nr);</div><div class='ctx'> </div><div class='ctx'> 	if (nr &gt; AFS_MAX_ADDRESSES)</div><div class='ctx'> 		nr = AFS_MAX_ADDRESSES;</div><div class='hunk'>@@ -43,17 +72,8 @@ struct afs_addr_list *afs_alloc_addrlist(unsigned int nr,</div><div class='ctx'> </div><div class='ctx'> 	refcount_set(&amp;alist-&gt;usage, 1);</div><div class='ctx'> 	alist-&gt;max_addrs = nr;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; nr; i++) {</div><div class='del'>-		struct sockaddr_rxrpc *srx = &amp;alist-&gt;addrs[i];</div><div class='del'>-		srx-&gt;srx_family			= AF_RXRPC;</div><div class='del'>-		srx-&gt;srx_service		= service;</div><div class='del'>-		srx-&gt;transport_type		= SOCK_DGRAM;</div><div class='del'>-		srx-&gt;transport_len		= sizeof(srx-&gt;transport.sin6);</div><div class='del'>-		srx-&gt;transport.sin6.sin6_family	= AF_INET6;</div><div class='del'>-		srx-&gt;transport.sin6.sin6_port	= htons(port);</div><div class='del'>-	}</div><div class='del'>-</div><div class='add'>+	alist-&gt;debug_id = atomic_inc_return(&amp;debug_id);</div><div class='add'>+	trace_afs_alist(alist-&gt;debug_id, 1, afs_alist_trace_alloc);</div><div class='ctx'> 	return alist;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -126,7 +146,7 @@ struct afs_vlserver_list *afs_parse_text_addrs(struct afs_net *net,</div><div class='ctx'> 	if (!vllist-&gt;servers[0].server)</div><div class='ctx'> 		goto error_vl;</div><div class='ctx'> </div><div class='del'>-	alist = afs_alloc_addrlist(nr, service, AFS_VL_PORT);</div><div class='add'>+	alist = afs_alloc_addrlist(nr);</div><div class='ctx'> 	if (!alist)</div><div class='ctx'> 		goto error;</div><div class='ctx'> </div><div class='hunk'>@@ -197,9 +217,11 @@ struct afs_vlserver_list *afs_parse_text_addrs(struct afs_net *net,</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (family == AF_INET)</div><div class='del'>-			afs_merge_fs_addr4(alist, x[0], xport);</div><div class='add'>+			ret = afs_merge_fs_addr4(net, alist, x[0], xport);</div><div class='ctx'> 		else</div><div class='del'>-			afs_merge_fs_addr6(alist, x, xport);</div><div class='add'>+			ret = afs_merge_fs_addr6(net, alist, x, xport);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto error;</div><div class='ctx'> </div><div class='ctx'> 	} while (p &lt; end);</div><div class='ctx'> </div><div class='hunk'>@@ -216,26 +238,13 @@ bad_address:</div><div class='ctx'> 	       problem, p - text, (int)len, (int)len, text);</div><div class='ctx'> 	ret = -EINVAL;</div><div class='ctx'> error:</div><div class='del'>-	afs_put_addrlist(alist);</div><div class='add'>+	afs_put_addrlist(alist, afs_alist_trace_put_parse_error);</div><div class='ctx'> error_vl:</div><div class='ctx'> 	afs_put_vlserverlist(net, vllist);</div><div class='ctx'> 	return ERR_PTR(ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Compare old and new address lists to see if there's been any change.</div><div class='del'>- * - How to do this in better than O(Nlog(N)) time?</div><div class='del'>- *   - We don't really want to sort the address list, but would rather take the</div><div class='del'>- *     list as we got it so as not to undo record rotation by the DNS server.</div><div class='del'>- */</div><div class='del'>-#if 0</div><div class='del'>-static int afs_cmp_addr_list(const struct afs_addr_list *a1,</div><div class='del'>-			     const struct afs_addr_list *a2)</div><div class='del'>-{</div><div class='del'>-}</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * Perform a DNS query for VL servers and build a up an address list.</div><div class='ctx'>  */</div><div class='ctx'> struct afs_vlserver_list *afs_dns_query(struct afs_cell *cell, time64_t *_expiry)</div><div class='hunk'>@@ -271,25 +280,33 @@ struct afs_vlserver_list *afs_dns_query(struct afs_cell *cell, time64_t *_expiry</div><div class='ctx'> /*</div><div class='ctx'>  * Merge an IPv4 entry into a fileserver address list.</div><div class='ctx'>  */</div><div class='del'>-void afs_merge_fs_addr4(struct afs_addr_list *alist, __be32 xdr, u16 port)</div><div class='add'>+int afs_merge_fs_addr4(struct afs_net *net, struct afs_addr_list *alist,</div><div class='add'>+		       __be32 xdr, u16 port)</div><div class='ctx'> {</div><div class='del'>-	struct sockaddr_rxrpc *srx;</div><div class='del'>-	u32 addr = ntohl(xdr);</div><div class='add'>+	struct sockaddr_rxrpc srx;</div><div class='add'>+	struct rxrpc_peer *peer;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='ctx'> 	if (alist-&gt;nr_addrs &gt;= alist-&gt;max_addrs)</div><div class='del'>-		return;</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; alist-&gt;nr_ipv4; i++) {</div><div class='del'>-		struct sockaddr_in *a = &amp;alist-&gt;addrs[i].transport.sin;</div><div class='del'>-		u32 a_addr = ntohl(a-&gt;sin_addr.s_addr);</div><div class='del'>-		u16 a_port = ntohs(a-&gt;sin_port);</div><div class='add'>+	srx.srx_family = AF_RXRPC;</div><div class='add'>+	srx.transport_type = SOCK_DGRAM;</div><div class='add'>+	srx.transport_len = sizeof(srx.transport.sin);</div><div class='add'>+	srx.transport.sin.sin_family = AF_INET;</div><div class='add'>+	srx.transport.sin.sin_port = htons(port);</div><div class='add'>+	srx.transport.sin.sin_addr.s_addr = xdr;</div><div class='ctx'> </div><div class='del'>-		if (addr == a_addr &amp;&amp; port == a_port)</div><div class='del'>-			return;</div><div class='del'>-		if (addr == a_addr &amp;&amp; port &lt; a_port)</div><div class='del'>-			break;</div><div class='del'>-		if (addr &lt; a_addr)</div><div class='add'>+	peer = rxrpc_kernel_lookup_peer(net-&gt;socket, &amp;srx, GFP_KERNEL);</div><div class='add'>+	if (!peer)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; alist-&gt;nr_ipv4; i++) {</div><div class='add'>+		if (peer == alist-&gt;addrs[i].peer) {</div><div class='add'>+			rxrpc_kernel_put_peer(peer);</div><div class='add'>+			return 0;</div><div class='add'>+		}</div><div class='add'>+		if (peer &lt;= alist-&gt;addrs[i].peer)</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -298,38 +315,42 @@ void afs_merge_fs_addr4(struct afs_addr_list *alist, __be32 xdr, u16 port)</div><div class='ctx'> 			alist-&gt;addrs + i,</div><div class='ctx'> 			sizeof(alist-&gt;addrs[0]) * (alist-&gt;nr_addrs - i));</div><div class='ctx'> </div><div class='del'>-	srx = &amp;alist-&gt;addrs[i];</div><div class='del'>-	srx-&gt;srx_family = AF_RXRPC;</div><div class='del'>-	srx-&gt;transport_type = SOCK_DGRAM;</div><div class='del'>-	srx-&gt;transport_len = sizeof(srx-&gt;transport.sin);</div><div class='del'>-	srx-&gt;transport.sin.sin_family = AF_INET;</div><div class='del'>-	srx-&gt;transport.sin.sin_port = htons(port);</div><div class='del'>-	srx-&gt;transport.sin.sin_addr.s_addr = xdr;</div><div class='add'>+	alist-&gt;addrs[i].peer = peer;</div><div class='ctx'> 	alist-&gt;nr_ipv4++;</div><div class='ctx'> 	alist-&gt;nr_addrs++;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Merge an IPv6 entry into a fileserver address list.</div><div class='ctx'>  */</div><div class='del'>-void afs_merge_fs_addr6(struct afs_addr_list *alist, __be32 *xdr, u16 port)</div><div class='add'>+int afs_merge_fs_addr6(struct afs_net *net, struct afs_addr_list *alist,</div><div class='add'>+		       __be32 *xdr, u16 port)</div><div class='ctx'> {</div><div class='del'>-	struct sockaddr_rxrpc *srx;</div><div class='del'>-	int i, diff;</div><div class='add'>+	struct sockaddr_rxrpc srx;</div><div class='add'>+	struct rxrpc_peer *peer;</div><div class='add'>+	int i;</div><div class='ctx'> </div><div class='ctx'> 	if (alist-&gt;nr_addrs &gt;= alist-&gt;max_addrs)</div><div class='del'>-		return;</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	for (i = alist-&gt;nr_ipv4; i &lt; alist-&gt;nr_addrs; i++) {</div><div class='del'>-		struct sockaddr_in6 *a = &amp;alist-&gt;addrs[i].transport.sin6;</div><div class='del'>-		u16 a_port = ntohs(a-&gt;sin6_port);</div><div class='add'>+	srx.srx_family = AF_RXRPC;</div><div class='add'>+	srx.transport_type = SOCK_DGRAM;</div><div class='add'>+	srx.transport_len = sizeof(srx.transport.sin6);</div><div class='add'>+	srx.transport.sin6.sin6_family = AF_INET6;</div><div class='add'>+	srx.transport.sin6.sin6_port = htons(port);</div><div class='add'>+	memcpy(&amp;srx.transport.sin6.sin6_addr, xdr, 16);</div><div class='ctx'> </div><div class='del'>-		diff = memcmp(xdr, &amp;a-&gt;sin6_addr, 16);</div><div class='del'>-		if (diff == 0 &amp;&amp; port == a_port)</div><div class='del'>-			return;</div><div class='del'>-		if (diff == 0 &amp;&amp; port &lt; a_port)</div><div class='del'>-			break;</div><div class='del'>-		if (diff &lt; 0)</div><div class='add'>+	peer = rxrpc_kernel_lookup_peer(net-&gt;socket, &amp;srx, GFP_KERNEL);</div><div class='add'>+	if (!peer)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	for (i = alist-&gt;nr_ipv4; i &lt; alist-&gt;nr_addrs; i++) {</div><div class='add'>+		if (peer == alist-&gt;addrs[i].peer) {</div><div class='add'>+			rxrpc_kernel_put_peer(peer);</div><div class='add'>+			return 0;</div><div class='add'>+		}</div><div class='add'>+		if (peer &lt;= alist-&gt;addrs[i].peer)</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -337,68 +358,57 @@ void afs_merge_fs_addr6(struct afs_addr_list *alist, __be32 *xdr, u16 port)</div><div class='ctx'> 		memmove(alist-&gt;addrs + i + 1,</div><div class='ctx'> 			alist-&gt;addrs + i,</div><div class='ctx'> 			sizeof(alist-&gt;addrs[0]) * (alist-&gt;nr_addrs - i));</div><div class='del'>-</div><div class='del'>-	srx = &amp;alist-&gt;addrs[i];</div><div class='del'>-	srx-&gt;srx_family = AF_RXRPC;</div><div class='del'>-	srx-&gt;transport_type = SOCK_DGRAM;</div><div class='del'>-	srx-&gt;transport_len = sizeof(srx-&gt;transport.sin6);</div><div class='del'>-	srx-&gt;transport.sin6.sin6_family = AF_INET6;</div><div class='del'>-	srx-&gt;transport.sin6.sin6_port = htons(port);</div><div class='del'>-	memcpy(&amp;srx-&gt;transport.sin6.sin6_addr, xdr, 16);</div><div class='add'>+	alist-&gt;addrs[i].peer = peer;</div><div class='ctx'> 	alist-&gt;nr_addrs++;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Get an address to try.</div><div class='add'>+ * Set the app data on the rxrpc peers an address list points to</div><div class='ctx'>  */</div><div class='del'>-bool afs_iterate_addresses(struct afs_addr_cursor *ac)</div><div class='add'>+void afs_set_peer_appdata(struct afs_server *server,</div><div class='add'>+			  struct afs_addr_list *old_alist,</div><div class='add'>+			  struct afs_addr_list *new_alist)</div><div class='ctx'> {</div><div class='del'>-	unsigned long set, failed;</div><div class='del'>-	int index;</div><div class='del'>-</div><div class='del'>-	if (!ac-&gt;alist)</div><div class='del'>-		return false;</div><div class='del'>-</div><div class='del'>-	set = ac-&gt;alist-&gt;responded;</div><div class='del'>-	failed = ac-&gt;alist-&gt;failed;</div><div class='del'>-	_enter("%lx-%lx-%lx,%d", set, failed, ac-&gt;tried, ac-&gt;index);</div><div class='del'>-</div><div class='del'>-	ac-&gt;nr_iterations++;</div><div class='del'>-</div><div class='del'>-	set &amp;= ~(failed | ac-&gt;tried);</div><div class='del'>-</div><div class='del'>-	if (!set)</div><div class='del'>-		return false;</div><div class='del'>-</div><div class='del'>-	index = READ_ONCE(ac-&gt;alist-&gt;preferred);</div><div class='del'>-	if (test_bit(index, &amp;set))</div><div class='del'>-		goto selected;</div><div class='add'>+	unsigned long data = (unsigned long)server;</div><div class='add'>+	int n = 0, o = 0;</div><div class='ctx'> </div><div class='del'>-	index = __ffs(set);</div><div class='del'>-</div><div class='del'>-selected:</div><div class='del'>-	ac-&gt;index = index;</div><div class='del'>-	set_bit(index, &amp;ac-&gt;tried);</div><div class='del'>-	ac-&gt;responded = false;</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='add'>+	if (!old_alist) {</div><div class='add'>+		/* New server.  Just set all. */</div><div class='add'>+		for (; n &lt; new_alist-&gt;nr_addrs; n++)</div><div class='add'>+			rxrpc_kernel_set_peer_data(new_alist-&gt;addrs[n].peer, data);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+	if (!new_alist) {</div><div class='add'>+		/* Dead server.  Just remove all. */</div><div class='add'>+		for (; o &lt; old_alist-&gt;nr_addrs; o++)</div><div class='add'>+			rxrpc_kernel_set_peer_data(old_alist-&gt;addrs[o].peer, 0);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Release an address list cursor.</div><div class='del'>- */</div><div class='del'>-int afs_end_cursor(struct afs_addr_cursor *ac)</div><div class='del'>-{</div><div class='del'>-	struct afs_addr_list *alist;</div><div class='add'>+	/* Walk through the two lists simultaneously, setting new peers and</div><div class='add'>+	 * clearing old ones.  The two lists are ordered by pointer to peer</div><div class='add'>+	 * record.</div><div class='add'>+	 */</div><div class='add'>+	while (n &lt; new_alist-&gt;nr_addrs &amp;&amp; o &lt; old_alist-&gt;nr_addrs) {</div><div class='add'>+		struct rxrpc_peer *pn = new_alist-&gt;addrs[n].peer;</div><div class='add'>+		struct rxrpc_peer *po = old_alist-&gt;addrs[o].peer;</div><div class='ctx'> </div><div class='del'>-	alist = ac-&gt;alist;</div><div class='del'>-	if (alist) {</div><div class='del'>-		if (ac-&gt;responded &amp;&amp;</div><div class='del'>-		    ac-&gt;index != alist-&gt;preferred &amp;&amp;</div><div class='del'>-		    test_bit(ac-&gt;alist-&gt;preferred, &amp;ac-&gt;tried))</div><div class='del'>-			WRITE_ONCE(alist-&gt;preferred, ac-&gt;index);</div><div class='del'>-		afs_put_addrlist(alist);</div><div class='del'>-		ac-&gt;alist = NULL;</div><div class='add'>+		if (pn == po)</div><div class='add'>+			continue;</div><div class='add'>+		if (pn &lt; po) {</div><div class='add'>+			rxrpc_kernel_set_peer_data(pn, data);</div><div class='add'>+			n++;</div><div class='add'>+		} else {</div><div class='add'>+			rxrpc_kernel_set_peer_data(po, 0);</div><div class='add'>+			o++;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return ac-&gt;error;</div><div class='add'>+	if (n &lt; new_alist-&gt;nr_addrs)</div><div class='add'>+		for (; n &lt; new_alist-&gt;nr_addrs; n++)</div><div class='add'>+			rxrpc_kernel_set_peer_data(new_alist-&gt;addrs[n].peer, data);</div><div class='add'>+	if (o &lt; old_alist-&gt;nr_addrs)</div><div class='add'>+		for (; o &lt; old_alist-&gt;nr_addrs; o++)</div><div class='add'>+			rxrpc_kernel_set_peer_data(old_alist-&gt;addrs[o].peer, 0);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/afs/addr_prefs.c b/fs/afs/addr_prefs.c<br/>new file mode 100644<br/>index 000000000000..133736412c3d<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/addr_prefs.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/addr_prefs.c</a></div><div class='hunk'>@@ -0,0 +1,533 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='add'>+/* Address preferences management</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2023 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#define pr_fmt(fmt) KBUILD_MODNAME ": addr_prefs: " fmt</div><div class='add'>+#include &lt;linux/slab.h&gt;</div><div class='add'>+#include &lt;linux/ctype.h&gt;</div><div class='add'>+#include &lt;linux/inet.h&gt;</div><div class='add'>+#include &lt;linux/seq_file.h&gt;</div><div class='add'>+#include &lt;keys/rxrpc-type.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+static inline struct afs_net *afs_seq2net_single(struct seq_file *m)</div><div class='add'>+{</div><div class='add'>+	return afs_net(seq_file_single_net(m));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Split a NUL-terminated string up to the first newline around spaces.  The</div><div class='add'>+ * source string will be modified to have NUL-terminations inserted.</div><div class='add'>+ */</div><div class='add'>+static int afs_split_string(char **pbuf, char *strv[], unsigned int maxstrv)</div><div class='add'>+{</div><div class='add'>+	unsigned int count = 0;</div><div class='add'>+	char *p = *pbuf;</div><div class='add'>+</div><div class='add'>+	maxstrv--; /* Allow for terminal NULL */</div><div class='add'>+	for (;;) {</div><div class='add'>+		/* Skip over spaces */</div><div class='add'>+		while (isspace(*p)) {</div><div class='add'>+			if (*p == '\n') {</div><div class='add'>+				p++;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+			p++;</div><div class='add'>+		}</div><div class='add'>+		if (!*p)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		/* Mark start of word */</div><div class='add'>+		if (count &gt;= maxstrv) {</div><div class='add'>+			pr_warn("Too many elements in string\n");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		strv[count++] = p;</div><div class='add'>+</div><div class='add'>+		/* Skip over word */</div><div class='add'>+		while (!isspace(*p) &amp;&amp; *p)</div><div class='add'>+			p++;</div><div class='add'>+		if (!*p)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		/* Mark end of word */</div><div class='add'>+		if (*p == '\n') {</div><div class='add'>+			*p++ = 0;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		*p++ = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	*pbuf = p;</div><div class='add'>+	strv[count] = NULL;</div><div class='add'>+	return count;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Parse an address with an optional subnet mask.</div><div class='add'>+ */</div><div class='add'>+static int afs_parse_address(char *p, struct afs_addr_preference *pref)</div><div class='add'>+{</div><div class='add'>+	const char *stop;</div><div class='add'>+	unsigned long mask, tmp;</div><div class='add'>+	char *end = p + strlen(p);</div><div class='add'>+	bool bracket = false;</div><div class='add'>+</div><div class='add'>+	if (*p == '[') {</div><div class='add'>+		p++;</div><div class='add'>+		bracket = true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+#if 0</div><div class='add'>+	if (*p == '[') {</div><div class='add'>+		p++;</div><div class='add'>+		q = memchr(p, ']', end - p);</div><div class='add'>+		if (!q) {</div><div class='add'>+			pr_warn("Can't find closing ']'\n");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		for (q = p; q &lt; end; q++)</div><div class='add'>+			if (*q == '/')</div><div class='add'>+				break;</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+	if (in4_pton(p, end - p, (u8 *)&amp;pref-&gt;ipv4_addr, -1, &amp;stop)) {</div><div class='add'>+		pref-&gt;family = AF_INET;</div><div class='add'>+		mask = 32;</div><div class='add'>+	} else if (in6_pton(p, end - p, (u8 *)&amp;pref-&gt;ipv6_addr, -1, &amp;stop)) {</div><div class='add'>+		pref-&gt;family = AF_INET6;</div><div class='add'>+		mask = 128;</div><div class='add'>+	} else {</div><div class='add'>+		pr_warn("Can't determine address family\n");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	p = (char *)stop;</div><div class='add'>+	if (bracket) {</div><div class='add'>+		if (*p != ']') {</div><div class='add'>+			pr_warn("Can't find closing ']'\n");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		p++;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (*p == '/') {</div><div class='add'>+		p++;</div><div class='add'>+		tmp = simple_strtoul(p, &amp;p, 10);</div><div class='add'>+		if (tmp &gt; mask) {</div><div class='add'>+			pr_warn("Subnet mask too large\n");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		if (tmp == 0) {</div><div class='add'>+			pr_warn("Subnet mask too small\n");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		mask = tmp;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (*p) {</div><div class='add'>+		pr_warn("Invalid address\n");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	pref-&gt;subnet_mask = mask;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+enum cmp_ret {</div><div class='add'>+	CONTINUE_SEARCH,</div><div class='add'>+	INSERT_HERE,</div><div class='add'>+	EXACT_MATCH,</div><div class='add'>+	SUBNET_MATCH,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * See if a candidate address matches a listed address.</div><div class='add'>+ */</div><div class='add'>+static enum cmp_ret afs_cmp_address_pref(const struct afs_addr_preference *a,</div><div class='add'>+					 const struct afs_addr_preference *b)</div><div class='add'>+{</div><div class='add'>+	int subnet = min(a-&gt;subnet_mask, b-&gt;subnet_mask);</div><div class='add'>+	const __be32 *pa, *pb;</div><div class='add'>+	u32 mask, na, nb;</div><div class='add'>+	int diff;</div><div class='add'>+</div><div class='add'>+	if (a-&gt;family != b-&gt;family)</div><div class='add'>+		return INSERT_HERE;</div><div class='add'>+</div><div class='add'>+	switch (a-&gt;family) {</div><div class='add'>+	case AF_INET6:</div><div class='add'>+		pa = a-&gt;ipv6_addr.s6_addr32;</div><div class='add'>+		pb = b-&gt;ipv6_addr.s6_addr32;</div><div class='add'>+		break;</div><div class='add'>+	case AF_INET:</div><div class='add'>+		pa = &amp;a-&gt;ipv4_addr.s_addr;</div><div class='add'>+		pb = &amp;b-&gt;ipv4_addr.s_addr;</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	while (subnet &gt; 32) {</div><div class='add'>+		diff = ntohl(*pa++) - ntohl(*pb++);</div><div class='add'>+		if (diff &lt; 0)</div><div class='add'>+			return INSERT_HERE; /* a&lt;b */</div><div class='add'>+		if (diff &gt; 0)</div><div class='add'>+			return CONTINUE_SEARCH; /* a&gt;b */</div><div class='add'>+		subnet -= 32;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (subnet == 0)</div><div class='add'>+		return EXACT_MATCH;</div><div class='add'>+</div><div class='add'>+	mask = 0xffffffffU &lt;&lt; (32 - subnet);</div><div class='add'>+	na = ntohl(*pa);</div><div class='add'>+	nb = ntohl(*pb);</div><div class='add'>+	diff = (na &amp; mask) - (nb &amp; mask);</div><div class='add'>+	//kdebug("diff %08x %08x %08x %d", na, nb, mask, diff);</div><div class='add'>+	if (diff &lt; 0)</div><div class='add'>+		return INSERT_HERE; /* a&lt;b */</div><div class='add'>+	if (diff &gt; 0)</div><div class='add'>+		return CONTINUE_SEARCH; /* a&gt;b */</div><div class='add'>+	if (a-&gt;subnet_mask == b-&gt;subnet_mask)</div><div class='add'>+		return EXACT_MATCH;</div><div class='add'>+	if (a-&gt;subnet_mask &gt; b-&gt;subnet_mask)</div><div class='add'>+		return SUBNET_MATCH; /* a binds tighter than b */</div><div class='add'>+	return CONTINUE_SEARCH; /* b binds tighter than a */</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Insert an address preference.</div><div class='add'>+ */</div><div class='add'>+static int afs_insert_address_pref(struct afs_addr_preference_list **_preflist,</div><div class='add'>+				   struct afs_addr_preference *pref,</div><div class='add'>+				   int index)</div><div class='add'>+{</div><div class='add'>+	struct afs_addr_preference_list *preflist = *_preflist, *old = preflist;</div><div class='add'>+	size_t size, max_prefs;</div><div class='add'>+</div><div class='add'>+	_enter("{%u/%u/%u},%u", preflist-&gt;ipv6_off, preflist-&gt;nr, preflist-&gt;max_prefs, index);</div><div class='add'>+</div><div class='add'>+	if (preflist-&gt;nr == 255)</div><div class='add'>+		return -ENOSPC;</div><div class='add'>+	if (preflist-&gt;nr &gt;= preflist-&gt;max_prefs) {</div><div class='add'>+		max_prefs = preflist-&gt;max_prefs + 1;</div><div class='add'>+		size = struct_size(preflist, prefs, max_prefs);</div><div class='add'>+		size = roundup_pow_of_two(size);</div><div class='add'>+		max_prefs = min_t(size_t, (size - sizeof(*preflist)) / sizeof(*pref), 255);</div><div class='add'>+		preflist = kmalloc(size, GFP_KERNEL);</div><div class='add'>+		if (!preflist)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+		*preflist = **_preflist;</div><div class='add'>+		preflist-&gt;max_prefs = max_prefs;</div><div class='add'>+		*_preflist = preflist;</div><div class='add'>+</div><div class='add'>+		if (index &lt; preflist-&gt;nr)</div><div class='add'>+			memcpy(preflist-&gt;prefs + index + 1, old-&gt;prefs + index,</div><div class='add'>+			       sizeof(*pref) * (preflist-&gt;nr - index));</div><div class='add'>+		if (index &gt; 0)</div><div class='add'>+			memcpy(preflist-&gt;prefs, old-&gt;prefs, sizeof(*pref) * index);</div><div class='add'>+	} else {</div><div class='add'>+		if (index &lt; preflist-&gt;nr)</div><div class='add'>+			memmove(preflist-&gt;prefs + index + 1, preflist-&gt;prefs + index,</div><div class='add'>+			       sizeof(*pref) * (preflist-&gt;nr - index));</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	preflist-&gt;prefs[index] = *pref;</div><div class='add'>+	preflist-&gt;nr++;</div><div class='add'>+	if (pref-&gt;family == AF_INET)</div><div class='add'>+		preflist-&gt;ipv6_off++;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Add an address preference.</div><div class='add'>+ *	echo "add &lt;proto&gt; &lt;IP&gt;[/&lt;mask&gt;] &lt;prior&gt;" &gt;/proc/fs/afs/addr_prefs</div><div class='add'>+ */</div><div class='add'>+static int afs_add_address_pref(struct afs_net *net, struct afs_addr_preference_list **_preflist,</div><div class='add'>+				int argc, char **argv)</div><div class='add'>+{</div><div class='add'>+	struct afs_addr_preference_list *preflist = *_preflist;</div><div class='add'>+	struct afs_addr_preference pref;</div><div class='add'>+	enum cmp_ret cmp;</div><div class='add'>+	int ret, i, stop;</div><div class='add'>+</div><div class='add'>+	if (argc != 3) {</div><div class='add'>+		pr_warn("Wrong number of params\n");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (strcmp(argv[0], "udp") != 0) {</div><div class='add'>+		pr_warn("Unsupported protocol\n");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = afs_parse_address(argv[1], &amp;pref);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	ret = kstrtou16(argv[2], 10, &amp;pref.prio);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		pr_warn("Invalid priority\n");</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (pref.family == AF_INET) {</div><div class='add'>+		i = 0;</div><div class='add'>+		stop = preflist-&gt;ipv6_off;</div><div class='add'>+	} else {</div><div class='add'>+		i = preflist-&gt;ipv6_off;</div><div class='add'>+		stop = preflist-&gt;nr;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for (; i &lt; stop; i++) {</div><div class='add'>+		cmp = afs_cmp_address_pref(&amp;pref, &amp;preflist-&gt;prefs[i]);</div><div class='add'>+		switch (cmp) {</div><div class='add'>+		case CONTINUE_SEARCH:</div><div class='add'>+			continue;</div><div class='add'>+		case INSERT_HERE:</div><div class='add'>+		case SUBNET_MATCH:</div><div class='add'>+			return afs_insert_address_pref(_preflist, &amp;pref, i);</div><div class='add'>+		case EXACT_MATCH:</div><div class='add'>+			preflist-&gt;prefs[i].prio = pref.prio;</div><div class='add'>+			return 0;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return afs_insert_address_pref(_preflist, &amp;pref, i);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Delete an address preference.</div><div class='add'>+ */</div><div class='add'>+static int afs_delete_address_pref(struct afs_addr_preference_list **_preflist,</div><div class='add'>+				   int index)</div><div class='add'>+{</div><div class='add'>+	struct afs_addr_preference_list *preflist = *_preflist;</div><div class='add'>+</div><div class='add'>+	_enter("{%u/%u/%u},%u", preflist-&gt;ipv6_off, preflist-&gt;nr, preflist-&gt;max_prefs, index);</div><div class='add'>+</div><div class='add'>+	if (preflist-&gt;nr == 0)</div><div class='add'>+		return -ENOENT;</div><div class='add'>+</div><div class='add'>+	if (index &lt; preflist-&gt;nr - 1)</div><div class='add'>+		memmove(preflist-&gt;prefs + index, preflist-&gt;prefs + index + 1,</div><div class='add'>+			sizeof(preflist-&gt;prefs[0]) * (preflist-&gt;nr - index - 1));</div><div class='add'>+</div><div class='add'>+	if (index &lt; preflist-&gt;ipv6_off)</div><div class='add'>+		preflist-&gt;ipv6_off--;</div><div class='add'>+	preflist-&gt;nr--;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Delete an address preference.</div><div class='add'>+ *	echo "del &lt;proto&gt; &lt;IP&gt;[/&lt;mask&gt;]" &gt;/proc/fs/afs/addr_prefs</div><div class='add'>+ */</div><div class='add'>+static int afs_del_address_pref(struct afs_net *net, struct afs_addr_preference_list **_preflist,</div><div class='add'>+				int argc, char **argv)</div><div class='add'>+{</div><div class='add'>+	struct afs_addr_preference_list *preflist = *_preflist;</div><div class='add'>+	struct afs_addr_preference pref;</div><div class='add'>+	enum cmp_ret cmp;</div><div class='add'>+	int ret, i, stop;</div><div class='add'>+</div><div class='add'>+	if (argc != 2) {</div><div class='add'>+		pr_warn("Wrong number of params\n");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (strcmp(argv[0], "udp") != 0) {</div><div class='add'>+		pr_warn("Unsupported protocol\n");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = afs_parse_address(argv[1], &amp;pref);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	if (pref.family == AF_INET) {</div><div class='add'>+		i = 0;</div><div class='add'>+		stop = preflist-&gt;ipv6_off;</div><div class='add'>+	} else {</div><div class='add'>+		i = preflist-&gt;ipv6_off;</div><div class='add'>+		stop = preflist-&gt;nr;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for (; i &lt; stop; i++) {</div><div class='add'>+		cmp = afs_cmp_address_pref(&amp;pref, &amp;preflist-&gt;prefs[i]);</div><div class='add'>+		switch (cmp) {</div><div class='add'>+		case CONTINUE_SEARCH:</div><div class='add'>+			continue;</div><div class='add'>+		case INSERT_HERE:</div><div class='add'>+		case SUBNET_MATCH:</div><div class='add'>+			return 0;</div><div class='add'>+		case EXACT_MATCH:</div><div class='add'>+			return afs_delete_address_pref(_preflist, i);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return -ENOANO;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Handle writes to /proc/fs/afs/addr_prefs</div><div class='add'>+ */</div><div class='add'>+int afs_proc_addr_prefs_write(struct file *file, char *buf, size_t size)</div><div class='add'>+{</div><div class='add'>+	struct afs_addr_preference_list *preflist, *old;</div><div class='add'>+	struct seq_file *m = file-&gt;private_data;</div><div class='add'>+	struct afs_net *net = afs_seq2net_single(m);</div><div class='add'>+	size_t psize;</div><div class='add'>+	char *argv[5];</div><div class='add'>+	int ret, argc, max_prefs;</div><div class='add'>+</div><div class='add'>+	inode_lock(file_inode(file));</div><div class='add'>+</div><div class='add'>+	/* Allocate a candidate new list and initialise it from the old. */</div><div class='add'>+	old = rcu_dereference_protected(net-&gt;address_prefs,</div><div class='add'>+					lockdep_is_held(&amp;file_inode(file)-&gt;i_rwsem));</div><div class='add'>+</div><div class='add'>+	if (old)</div><div class='add'>+		max_prefs = old-&gt;nr + 1;</div><div class='add'>+	else</div><div class='add'>+		max_prefs = 1;</div><div class='add'>+</div><div class='add'>+	psize = struct_size(old, prefs, max_prefs);</div><div class='add'>+	psize = roundup_pow_of_two(psize);</div><div class='add'>+	max_prefs = min_t(size_t, (psize - sizeof(*old)) / sizeof(old-&gt;prefs[0]), 255);</div><div class='add'>+</div><div class='add'>+	ret = -ENOMEM;</div><div class='add'>+	preflist = kmalloc(struct_size(preflist, prefs, max_prefs), GFP_KERNEL);</div><div class='add'>+	if (!preflist)</div><div class='add'>+		goto done;</div><div class='add'>+</div><div class='add'>+	if (old)</div><div class='add'>+		memcpy(preflist, old, struct_size(preflist, prefs, old-&gt;nr));</div><div class='add'>+	else</div><div class='add'>+		memset(preflist, 0, sizeof(*preflist));</div><div class='add'>+	preflist-&gt;max_prefs = max_prefs;</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		argc = afs_split_string(&amp;buf, argv, ARRAY_SIZE(argv));</div><div class='add'>+		if (argc &lt; 0) {</div><div class='add'>+			ret = argc;</div><div class='add'>+			goto done;</div><div class='add'>+		}</div><div class='add'>+		if (argc &lt; 2)</div><div class='add'>+			goto inval;</div><div class='add'>+</div><div class='add'>+		if (strcmp(argv[0], "add") == 0)</div><div class='add'>+			ret = afs_add_address_pref(net, &amp;preflist, argc - 1, argv + 1);</div><div class='add'>+		else if (strcmp(argv[0], "del") == 0)</div><div class='add'>+			ret = afs_del_address_pref(net, &amp;preflist, argc - 1, argv + 1);</div><div class='add'>+		else</div><div class='add'>+			goto inval;</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto done;</div><div class='add'>+	} while (*buf);</div><div class='add'>+</div><div class='add'>+	preflist-&gt;version++;</div><div class='add'>+	rcu_assign_pointer(net-&gt;address_prefs, preflist);</div><div class='add'>+	/* Store prefs before version */</div><div class='add'>+	smp_store_release(&amp;net-&gt;address_pref_version, preflist-&gt;version);</div><div class='add'>+	kfree_rcu(old, rcu);</div><div class='add'>+	preflist = NULL;</div><div class='add'>+	ret = 0;</div><div class='add'>+</div><div class='add'>+done:</div><div class='add'>+	kfree(preflist);</div><div class='add'>+	inode_unlock(file_inode(file));</div><div class='add'>+	_leave(" = %d", ret);</div><div class='add'>+	return ret;</div><div class='add'>+</div><div class='add'>+inval:</div><div class='add'>+	pr_warn("Invalid Command\n");</div><div class='add'>+	ret = -EINVAL;</div><div class='add'>+	goto done;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Mark the priorities on an address list if the address preferences table has</div><div class='add'>+ * changed.  The caller must hold the RCU read lock.</div><div class='add'>+ */</div><div class='add'>+void afs_get_address_preferences_rcu(struct afs_net *net, struct afs_addr_list *alist)</div><div class='add'>+{</div><div class='add'>+	const struct afs_addr_preference_list *preflist =</div><div class='add'>+		rcu_dereference(net-&gt;address_prefs);</div><div class='add'>+	const struct sockaddr_in6 *sin6;</div><div class='add'>+	const struct sockaddr_in *sin;</div><div class='add'>+	const struct sockaddr *sa;</div><div class='add'>+	struct afs_addr_preference test;</div><div class='add'>+	enum cmp_ret cmp;</div><div class='add'>+	int i, j;</div><div class='add'>+</div><div class='add'>+	if (!preflist || !preflist-&gt;nr || !alist-&gt;nr_addrs ||</div><div class='add'>+	    smp_load_acquire(&amp;alist-&gt;addr_pref_version) == preflist-&gt;version)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	test.family = AF_INET;</div><div class='add'>+	test.subnet_mask = 32;</div><div class='add'>+	test.prio = 0;</div><div class='add'>+	for (i = 0; i &lt; alist-&gt;nr_ipv4; i++) {</div><div class='add'>+		sa = rxrpc_kernel_remote_addr(alist-&gt;addrs[i].peer);</div><div class='add'>+		sin = (const struct sockaddr_in *)sa;</div><div class='add'>+		test.ipv4_addr = sin-&gt;sin_addr;</div><div class='add'>+		for (j = 0; j &lt; preflist-&gt;ipv6_off; j++) {</div><div class='add'>+			cmp = afs_cmp_address_pref(&amp;test, &amp;preflist-&gt;prefs[j]);</div><div class='add'>+			switch (cmp) {</div><div class='add'>+			case CONTINUE_SEARCH:</div><div class='add'>+				continue;</div><div class='add'>+			case INSERT_HERE:</div><div class='add'>+				break;</div><div class='add'>+			case EXACT_MATCH:</div><div class='add'>+			case SUBNET_MATCH:</div><div class='add'>+				WRITE_ONCE(alist-&gt;addrs[i].prio, preflist-&gt;prefs[j].prio);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	test.family = AF_INET6;</div><div class='add'>+	test.subnet_mask = 128;</div><div class='add'>+	test.prio = 0;</div><div class='add'>+	for (; i &lt; alist-&gt;nr_addrs; i++) {</div><div class='add'>+		sa = rxrpc_kernel_remote_addr(alist-&gt;addrs[i].peer);</div><div class='add'>+		sin6 = (const struct sockaddr_in6 *)sa;</div><div class='add'>+		test.ipv6_addr = sin6-&gt;sin6_addr;</div><div class='add'>+		for (j = preflist-&gt;ipv6_off; j &lt; preflist-&gt;nr; j++) {</div><div class='add'>+			cmp = afs_cmp_address_pref(&amp;test, &amp;preflist-&gt;prefs[j]);</div><div class='add'>+			switch (cmp) {</div><div class='add'>+			case CONTINUE_SEARCH:</div><div class='add'>+				continue;</div><div class='add'>+			case INSERT_HERE:</div><div class='add'>+				break;</div><div class='add'>+			case EXACT_MATCH:</div><div class='add'>+			case SUBNET_MATCH:</div><div class='add'>+				WRITE_ONCE(alist-&gt;addrs[i].prio, preflist-&gt;prefs[j].prio);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	smp_store_release(&amp;alist-&gt;addr_pref_version, preflist-&gt;version);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Mark the priorities on an address list if the address preferences table has</div><div class='add'>+ * changed.  Avoid taking the RCU read lock if we can.</div><div class='add'>+ */</div><div class='add'>+void afs_get_address_preferences(struct afs_net *net, struct afs_addr_list *alist)</div><div class='add'>+{</div><div class='add'>+	if (!net-&gt;address_prefs ||</div><div class='add'>+	    /* Load version before prefs */</div><div class='add'>+	    smp_load_acquire(&amp;net-&gt;address_pref_version) == alist-&gt;addr_pref_version)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	afs_get_address_preferences_rcu(net, alist);</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+}</div><div class='head'>diff --git a/fs/afs/afs.h b/fs/afs/afs.h<br/>index 432cb4b23961..ec3db00bd081 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/afs.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/afs.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/afs.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/afs.h</a></div><div class='hunk'>@@ -10,7 +10,7 @@</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/in.h&gt;</div><div class='ctx'> </div><div class='del'>-#define AFS_MAXCELLNAME		256  	/* Maximum length of a cell name */</div><div class='add'>+#define AFS_MAXCELLNAME		253  	/* Maximum length of a cell name (DNS limited) */</div><div class='ctx'> #define AFS_MAXVOLNAME		64  	/* Maximum length of a volume name */</div><div class='ctx'> #define AFS_MAXNSERVERS		8   	/* Maximum servers in a basic volume record */</div><div class='ctx'> #define AFS_NMAXNSERVERS	13  	/* Maximum servers in a N/U-class volume record */</div><div class='hunk'>@@ -19,8 +19,8 @@</div><div class='ctx'> #define AFSPATHMAX		1024	/* Maximum length of a pathname plus NUL */</div><div class='ctx'> #define AFSOPAQUEMAX		1024	/* Maximum length of an opaque field */</div><div class='ctx'> </div><div class='del'>-#define AFS_VL_MAX_LIFESPAN	(120 * HZ)</div><div class='del'>-#define AFS_PROBE_MAX_LIFESPAN	(30 * HZ)</div><div class='add'>+#define AFS_VL_MAX_LIFESPAN	120</div><div class='add'>+#define AFS_PROBE_MAX_LIFESPAN	30</div><div class='ctx'> </div><div class='ctx'> typedef u64			afs_volid_t;</div><div class='ctx'> typedef u64			afs_vnodeid_t;</div><div class='hunk'>@@ -165,7 +165,8 @@ struct afs_status_cb {</div><div class='ctx'>  * AFS volume synchronisation information</div><div class='ctx'>  */</div><div class='ctx'> struct afs_volsync {</div><div class='del'>-	time64_t		creation;	/* volume creation time */</div><div class='add'>+	time64_t		creation;	/* Volume creation time (or TIME64_MIN) */</div><div class='add'>+	time64_t		update;		/* Volume update time (or TIME64_MIN) */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='head'>diff --git a/fs/afs/afs_vl.h b/fs/afs/afs_vl.h<br/>index 9c65ffb8a523..b835e25a2c02 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/afs_vl.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/afs_vl.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/afs_vl.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/afs_vl.h</a></div><div class='hunk'>@@ -13,6 +13,7 @@</div><div class='ctx'> #define AFS_VL_PORT		7003	/* volume location service port */</div><div class='ctx'> #define VL_SERVICE		52	/* RxRPC service ID for the Volume Location service */</div><div class='ctx'> #define YFS_VL_SERVICE		2503	/* Service ID for AuriStor upgraded VL service */</div><div class='add'>+#define YFS_VL_MAXCELLNAME	256  	/* Maximum length of a cell name in YFS protocol */</div><div class='ctx'> </div><div class='ctx'> enum AFSVL_Operations {</div><div class='ctx'> 	VLGETENTRYBYID		= 503,	/* AFS Get VLDB entry by ID */</div><div class='hunk'>@@ -134,13 +135,4 @@ struct afs_uvldbentry__xdr {</div><div class='ctx'> 	__be32			spares9;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-struct afs_address_list {</div><div class='del'>-	refcount_t		usage;</div><div class='del'>-	unsigned int		version;</div><div class='del'>-	unsigned int		nr_addrs;</div><div class='del'>-	struct sockaddr_rxrpc	addrs[];</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-extern void afs_put_address_list(struct afs_address_list *alist);</div><div class='del'>-</div><div class='ctx'> #endif /* AFS_VL_H */</div><div class='head'>diff --git a/fs/afs/cache.c b/fs/afs/cache.c<br/>deleted file mode 100644<br/>index 037af93e3aba..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/cache.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/cache.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,68 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='del'>-/* AFS caching stuff</div><div class='del'>- *</div><div class='del'>- * Copyright (C) 2008 Red Hat, Inc. All Rights Reserved.</div><div class='del'>- * Written by David Howells (dhowells@redhat.com)</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#include &lt;linux/sched.h&gt;</div><div class='del'>-#include "internal.h"</div><div class='del'>-</div><div class='del'>-static enum fscache_checkaux afs_vnode_cache_check_aux(void *cookie_netfs_data,</div><div class='del'>-						       const void *buffer,</div><div class='del'>-						       uint16_t buflen,</div><div class='del'>-						       loff_t object_size);</div><div class='del'>-</div><div class='del'>-struct fscache_netfs afs_cache_netfs = {</div><div class='del'>-	.name			= "afs",</div><div class='del'>-	.version		= 2,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct fscache_cookie_def afs_cell_cache_index_def = {</div><div class='del'>-	.name		= "AFS.cell",</div><div class='del'>-	.type		= FSCACHE_COOKIE_TYPE_INDEX,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct fscache_cookie_def afs_volume_cache_index_def = {</div><div class='del'>-	.name		= "AFS.volume",</div><div class='del'>-	.type		= FSCACHE_COOKIE_TYPE_INDEX,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct fscache_cookie_def afs_vnode_cache_index_def = {</div><div class='del'>-	.name		= "AFS.vnode",</div><div class='del'>-	.type		= FSCACHE_COOKIE_TYPE_DATAFILE,</div><div class='del'>-	.check_aux	= afs_vnode_cache_check_aux,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * check that the auxiliary data indicates that the entry is still valid</div><div class='del'>- */</div><div class='del'>-static enum fscache_checkaux afs_vnode_cache_check_aux(void *cookie_netfs_data,</div><div class='del'>-						       const void *buffer,</div><div class='del'>-						       uint16_t buflen,</div><div class='del'>-						       loff_t object_size)</div><div class='del'>-{</div><div class='del'>-	struct afs_vnode *vnode = cookie_netfs_data;</div><div class='del'>-	struct afs_vnode_cache_aux aux;</div><div class='del'>-</div><div class='del'>-	_enter("{%llx,%x,%llx},%p,%u",</div><div class='del'>-	       vnode-&gt;fid.vnode, vnode-&gt;fid.unique, vnode-&gt;status.data_version,</div><div class='del'>-	       buffer, buflen);</div><div class='del'>-</div><div class='del'>-	memcpy(&amp;aux, buffer, sizeof(aux));</div><div class='del'>-</div><div class='del'>-	/* check the size of the data is what we're expecting */</div><div class='del'>-	if (buflen != sizeof(aux)) {</div><div class='del'>-		_leave(" = OBSOLETE [len %hx != %zx]", buflen, sizeof(aux));</div><div class='del'>-		return FSCACHE_CHECKAUX_OBSOLETE;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (vnode-&gt;status.data_version != aux.data_version) {</div><div class='del'>-		_leave(" = OBSOLETE [vers %llx != %llx]",</div><div class='del'>-		       aux.data_version, vnode-&gt;status.data_version);</div><div class='del'>-		return FSCACHE_CHECKAUX_OBSOLETE;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	_leave(" = SUCCESS");</div><div class='del'>-	return FSCACHE_CHECKAUX_OKAY;</div><div class='del'>-}</div><div class='head'>diff --git a/fs/afs/callback.c b/fs/afs/callback.c<br/>index 1b4d5809808d..894d2bad6b6c 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/callback.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/callback.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/callback.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/callback.c</a></div><div class='hunk'>@@ -30,25 +30,23 @@ void afs_invalidate_mmap_work(struct work_struct *work)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_vnode *vnode = container_of(work, struct afs_vnode, cb_work);</div><div class='ctx'> </div><div class='del'>-	unmap_mapping_pages(vnode-&gt;vfs_inode.i_mapping, 0, 0, false);</div><div class='add'>+	unmap_mapping_pages(vnode-&gt;netfs.inode.i_mapping, 0, 0, false);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void afs_server_init_callback_work(struct work_struct *work)</div><div class='add'>+static void afs_volume_init_callback(struct afs_volume *volume)</div><div class='ctx'> {</div><div class='del'>-	struct afs_server *server = container_of(work, struct afs_server, initcb_work);</div><div class='ctx'> 	struct afs_vnode *vnode;</div><div class='del'>-	struct afs_cell *cell = server-&gt;cell;</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;cell-&gt;fs_open_mmaps_lock);</div><div class='add'>+	down_read(&amp;volume-&gt;open_mmaps_lock);</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry(vnode, &amp;cell-&gt;fs_open_mmaps, cb_mmap_link) {</div><div class='del'>-		if (vnode-&gt;cb_server == server) {</div><div class='del'>-			clear_bit(AFS_VNODE_CB_PROMISED, &amp;vnode-&gt;flags);</div><div class='del'>-			queue_work(system_unbound_wq, &amp;vnode-&gt;cb_work);</div><div class='add'>+	list_for_each_entry(vnode, &amp;volume-&gt;open_mmaps, cb_mmap_link) {</div><div class='add'>+		if (vnode-&gt;cb_v_check != atomic_read(&amp;volume-&gt;cb_v_break)) {</div><div class='add'>+			afs_clear_cb_promise(vnode, afs_cb_promise_clear_vol_init_cb);</div><div class='add'>+			queue_work(system_dfl_wq, &amp;vnode-&gt;cb_work);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	up_read(&amp;cell-&gt;fs_open_mmaps_lock);</div><div class='add'>+	up_read(&amp;volume-&gt;open_mmaps_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -57,15 +55,20 @@ void afs_server_init_callback_work(struct work_struct *work)</div><div class='ctx'>  */</div><div class='ctx'> void afs_init_callback_state(struct afs_server *server)</div><div class='ctx'> {</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	do {</div><div class='del'>-		server-&gt;cb_s_break++;</div><div class='del'>-		atomic_inc(&amp;server-&gt;cell-&gt;fs_s_break);</div><div class='del'>-		if (!list_empty(&amp;server-&gt;cell-&gt;fs_open_mmaps))</div><div class='del'>-			queue_work(system_unbound_wq, &amp;server-&gt;initcb_work);</div><div class='add'>+	struct afs_server_entry *se;</div><div class='ctx'> </div><div class='del'>-	} while ((server = rcu_dereference(server-&gt;uuid_next)));</div><div class='del'>-	rcu_read_unlock();</div><div class='add'>+	down_read(&amp;server-&gt;cell-&gt;vs_lock);</div><div class='add'>+</div><div class='add'>+	list_for_each_entry(se, &amp;server-&gt;volumes, slink) {</div><div class='add'>+		se-&gt;cb_expires_at = AFS_NO_CB_PROMISE;</div><div class='add'>+		se-&gt;volume-&gt;cb_expires_at = AFS_NO_CB_PROMISE;</div><div class='add'>+		trace_afs_cb_v_break(se-&gt;volume-&gt;vid, atomic_read(&amp;se-&gt;volume-&gt;cb_v_break),</div><div class='add'>+				     afs_cb_break_for_s_reinit);</div><div class='add'>+		if (!list_empty(&amp;se-&gt;volume-&gt;open_mmaps))</div><div class='add'>+			afs_volume_init_callback(se-&gt;volume);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	up_read(&amp;server-&gt;cell-&gt;vs_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -76,9 +79,9 @@ void __afs_break_callback(struct afs_vnode *vnode, enum afs_cb_break_reason reas</div><div class='ctx'> 	_enter("");</div><div class='ctx'> </div><div class='ctx'> 	clear_bit(AFS_VNODE_NEW_CONTENT, &amp;vnode-&gt;flags);</div><div class='del'>-	if (test_and_clear_bit(AFS_VNODE_CB_PROMISED, &amp;vnode-&gt;flags)) {</div><div class='add'>+	if (afs_clear_cb_promise(vnode, afs_cb_promise_clear_cb_break)) {</div><div class='ctx'> 		vnode-&gt;cb_break++;</div><div class='del'>-		vnode-&gt;cb_v_break = vnode-&gt;volume-&gt;cb_v_break;</div><div class='add'>+		vnode-&gt;cb_v_check = atomic_read(&amp;vnode-&gt;volume-&gt;cb_v_break);</div><div class='ctx'> 		afs_clear_permits(vnode);</div><div class='ctx'> </div><div class='ctx'> 		if (vnode-&gt;lock_state == AFS_VNODE_LOCK_WAITING_FOR_CB)</div><div class='hunk'>@@ -87,7 +90,7 @@ void __afs_break_callback(struct afs_vnode *vnode, enum afs_cb_break_reason reas</div><div class='ctx'> 		if (reason != afs_cb_break_for_deleted &amp;&amp;</div><div class='ctx'> 		    vnode-&gt;status.type == AFS_FTYPE_FILE &amp;&amp;</div><div class='ctx'> 		    atomic_read(&amp;vnode-&gt;cb_nr_mmap))</div><div class='del'>-			queue_work(system_unbound_wq, &amp;vnode-&gt;cb_work);</div><div class='add'>+			queue_work(system_dfl_wq, &amp;vnode-&gt;cb_work);</div><div class='ctx'> </div><div class='ctx'> 		trace_afs_cb_break(&amp;vnode-&gt;fid, vnode-&gt;cb_break, reason, true);</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -110,13 +113,14 @@ static struct afs_volume *afs_lookup_volume_rcu(struct afs_cell *cell,</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_volume *volume = NULL;</div><div class='ctx'> 	struct rb_node *p;</div><div class='del'>-	int seq = 0;</div><div class='add'>+	int seq = 1;</div><div class='ctx'> </div><div class='del'>-	do {</div><div class='add'>+	for (;;) {</div><div class='ctx'> 		/* Unfortunately, rbtree walking doesn't give reliable results</div><div class='ctx'> 		 * under just the RCU read lock, so we have to check for</div><div class='ctx'> 		 * changes.</div><div class='ctx'> 		 */</div><div class='add'>+		seq++; /* 2 on the 1st/lockless path, otherwise odd */</div><div class='ctx'> 		read_seqbegin_or_lock(&amp;cell-&gt;volume_lock, &amp;seq);</div><div class='ctx'> </div><div class='ctx'> 		p = rcu_dereference_raw(cell-&gt;volumes.rb_node);</div><div class='hunk'>@@ -132,35 +136,63 @@ static struct afs_volume *afs_lookup_volume_rcu(struct afs_cell *cell,</div><div class='ctx'> 			volume = NULL;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-	} while (need_seqretry(&amp;cell-&gt;volume_lock, seq));</div><div class='add'>+		if (volume &amp;&amp; afs_try_get_volume(volume, afs_volume_trace_get_callback))</div><div class='add'>+			break;</div><div class='add'>+		if (!need_seqretry(&amp;cell-&gt;volume_lock, seq))</div><div class='add'>+			break;</div><div class='add'>+		seq |= 1; /* Want a lock next time */</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	done_seqretry(&amp;cell-&gt;volume_lock, seq);</div><div class='ctx'> 	return volume;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * Allow the fileserver to break callbacks at the volume-level.  This is</div><div class='add'>+ * typically done when, for example, a R/W volume is snapshotted to a R/O</div><div class='add'>+ * volume (the only way to change an R/O volume).  It may also, however, happen</div><div class='add'>+ * when a volserver takes control of a volume (offlining it, moving it, etc.).</div><div class='add'>+ *</div><div class='add'>+ * Every file in that volume will need to be reevaluated.</div><div class='add'>+ */</div><div class='add'>+static void afs_break_volume_callback(struct afs_server *server,</div><div class='add'>+				      struct afs_volume *volume)</div><div class='add'>+	__releases(RCU)</div><div class='add'>+{</div><div class='add'>+	struct afs_server_list *slist = rcu_dereference(volume-&gt;servers);</div><div class='add'>+	unsigned int i, cb_v_break;</div><div class='add'>+</div><div class='add'>+	write_lock(&amp;volume-&gt;cb_v_break_lock);</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; slist-&gt;nr_servers; i++)</div><div class='add'>+		if (slist-&gt;servers[i].server == server)</div><div class='add'>+			slist-&gt;servers[i].cb_expires_at = AFS_NO_CB_PROMISE;</div><div class='add'>+	volume-&gt;cb_expires_at = AFS_NO_CB_PROMISE;</div><div class='add'>+</div><div class='add'>+	cb_v_break = atomic_inc_return_release(&amp;volume-&gt;cb_v_break);</div><div class='add'>+	trace_afs_cb_v_break(volume-&gt;vid, cb_v_break, afs_cb_break_for_volume_callback);</div><div class='add'>+</div><div class='add'>+	write_unlock(&amp;volume-&gt;cb_v_break_lock);</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+</div><div class='add'>+	if (!list_empty(&amp;volume-&gt;open_mmaps))</div><div class='add'>+		afs_volume_init_callback(volume);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * allow the fileserver to explicitly break one callback</div><div class='ctx'>  * - happens when</div><div class='ctx'>  *   - the backing file is changed</div><div class='ctx'>  *   - a lock is released</div><div class='ctx'>  */</div><div class='del'>-static void afs_break_one_callback(struct afs_volume *volume,</div><div class='add'>+static void afs_break_one_callback(struct afs_server *server,</div><div class='add'>+				   struct afs_volume *volume,</div><div class='ctx'> 				   struct afs_fid *fid)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb;</div><div class='ctx'> 	struct afs_vnode *vnode;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> </div><div class='del'>-	if (fid-&gt;vnode == 0 &amp;&amp; fid-&gt;unique == 0) {</div><div class='del'>-		/* The callback break applies to an entire volume. */</div><div class='del'>-		write_lock(&amp;volume-&gt;cb_v_break_lock);</div><div class='del'>-		volume-&gt;cb_v_break++;</div><div class='del'>-		trace_afs_cb_break(fid, volume-&gt;cb_v_break,</div><div class='del'>-				   afs_cb_break_for_volume_callback, false);</div><div class='del'>-		write_unlock(&amp;volume-&gt;cb_v_break_lock);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	/* See if we can find a matching inode - even an I_NEW inode needs to</div><div class='ctx'> 	 * be marked as it can have its callback broken before we finish</div><div class='ctx'> 	 * setting up the local inode.</div><div class='hunk'>@@ -187,25 +219,35 @@ static void afs_break_some_callbacks(struct afs_server *server,</div><div class='ctx'> 	afs_volid_t vid = cbb-&gt;fid.vid;</div><div class='ctx'> 	size_t i;</div><div class='ctx'> </div><div class='add'>+	rcu_read_lock();</div><div class='ctx'> 	volume = afs_lookup_volume_rcu(server-&gt;cell, vid);</div><div class='add'>+	if (cbb-&gt;fid.vnode == 0 &amp;&amp; cbb-&gt;fid.unique == 0) {</div><div class='add'>+		afs_break_volume_callback(server, volume);</div><div class='add'>+		*_count -= 1;</div><div class='add'>+		if (*_count)</div><div class='add'>+			memmove(cbb, cbb + 1, sizeof(*cbb) * *_count);</div><div class='add'>+	} else {</div><div class='add'>+		/* TODO: Find all matching volumes if we couldn't match the server and</div><div class='add'>+		 * break them anyway.</div><div class='add'>+		 */</div><div class='ctx'> </div><div class='del'>-	/* TODO: Find all matching volumes if we couldn't match the server and</div><div class='del'>-	 * break them anyway.</div><div class='del'>-	 */</div><div class='del'>-</div><div class='del'>-	for (i = *_count; i &gt; 0; cbb++, i--) {</div><div class='del'>-		if (cbb-&gt;fid.vid == vid) {</div><div class='del'>-			_debug("- Fid { vl=%08llx n=%llu u=%u }",</div><div class='del'>-			       cbb-&gt;fid.vid,</div><div class='del'>-			       cbb-&gt;fid.vnode,</div><div class='del'>-			       cbb-&gt;fid.unique);</div><div class='del'>-			--*_count;</div><div class='del'>-			if (volume)</div><div class='del'>-				afs_break_one_callback(volume, &amp;cbb-&gt;fid);</div><div class='del'>-		} else {</div><div class='del'>-			*residue++ = *cbb;</div><div class='add'>+		for (i = *_count; i &gt; 0; cbb++, i--) {</div><div class='add'>+			if (cbb-&gt;fid.vid == vid) {</div><div class='add'>+				_debug("- Fid { vl=%08llx n=%llu u=%u }",</div><div class='add'>+				       cbb-&gt;fid.vid,</div><div class='add'>+				       cbb-&gt;fid.vnode,</div><div class='add'>+				       cbb-&gt;fid.unique);</div><div class='add'>+				--*_count;</div><div class='add'>+				if (volume)</div><div class='add'>+					afs_break_one_callback(server, volume, &amp;cbb-&gt;fid);</div><div class='add'>+			} else {</div><div class='add'>+				*residue++ = *cbb;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='add'>+		rcu_read_unlock();</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	afs_put_volume(volume, afs_volume_trace_put_callback);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -218,11 +260,6 @@ void afs_break_callbacks(struct afs_server *server, size_t count,</div><div class='ctx'> </div><div class='ctx'> 	ASSERT(server != NULL);</div><div class='ctx'> </div><div class='del'>-	rcu_read_lock();</div><div class='del'>-</div><div class='ctx'> 	while (count &gt; 0)</div><div class='ctx'> 		afs_break_some_callbacks(server, callbacks, &amp;count);</div><div class='del'>-</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-	return;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/afs/cell.c b/fs/afs/cell.c<br/>index d88407fb9bc0..71c10a05cebe 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/cell.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/cell.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/cell.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/cell.c</a></div><div class='hunk'>@@ -20,8 +20,9 @@ static unsigned __read_mostly afs_cell_min_ttl = 10 * 60;</div><div class='ctx'> static unsigned __read_mostly afs_cell_max_ttl = 24 * 60 * 60;</div><div class='ctx'> static atomic_t cell_debug_id;</div><div class='ctx'> </div><div class='del'>-static void afs_queue_cell_manager(struct afs_net *);</div><div class='del'>-static void afs_manage_cell_work(struct work_struct *);</div><div class='add'>+static void afs_cell_timer(struct timer_list *timer);</div><div class='add'>+static void afs_destroy_cell_work(struct work_struct *work);</div><div class='add'>+static void afs_manage_cell_work(struct work_struct *work);</div><div class='ctx'> </div><div class='ctx'> static void afs_dec_cells_outstanding(struct afs_net *net)</div><div class='ctx'> {</div><div class='hunk'>@@ -29,19 +30,11 @@ static void afs_dec_cells_outstanding(struct afs_net *net)</div><div class='ctx'> 		wake_up_var(&amp;net-&gt;cells_outstanding);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Set the cell timer to fire after a given delay, assuming it's not already</div><div class='del'>- * set for an earlier time.</div><div class='del'>- */</div><div class='del'>-static void afs_set_cell_timer(struct afs_net *net, time64_t delay)</div><div class='add'>+static void afs_set_cell_state(struct afs_cell *cell, enum afs_cell_state state)</div><div class='ctx'> {</div><div class='del'>-	if (net-&gt;live) {</div><div class='del'>-		atomic_inc(&amp;net-&gt;cells_outstanding);</div><div class='del'>-		if (timer_reduce(&amp;net-&gt;cells_timer, jiffies + delay * HZ))</div><div class='del'>-			afs_dec_cells_outstanding(net);</div><div class='del'>-	} else {</div><div class='del'>-		afs_queue_cell_manager(net);</div><div class='del'>-	}</div><div class='add'>+	smp_store_release(&amp;cell-&gt;state, state); /* Commit cell changes before state */</div><div class='add'>+	smp_wmb(); /* Set cell state before task state */</div><div class='add'>+	wake_up_var(&amp;cell-&gt;state);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -64,7 +57,8 @@ static struct afs_cell *afs_find_cell_locked(struct afs_net *net,</div><div class='ctx'> 		return ERR_PTR(-ENAMETOOLONG);</div><div class='ctx'> </div><div class='ctx'> 	if (!name) {</div><div class='del'>-		cell = net-&gt;ws_cell;</div><div class='add'>+		cell = rcu_dereference_protected(net-&gt;ws_cell,</div><div class='add'>+						 lockdep_is_held(&amp;net-&gt;cells_lock));</div><div class='ctx'> 		if (!cell)</div><div class='ctx'> 			return ERR_PTR(-EDESTADDRREQ);</div><div class='ctx'> 		goto found;</div><div class='hunk'>@@ -115,7 +109,7 @@ static struct afs_cell *afs_alloc_cell(struct afs_net *net,</div><div class='ctx'> 				       const char *name, unsigned int namelen,</div><div class='ctx'> 				       const char *addresses)</div><div class='ctx'> {</div><div class='del'>-	struct afs_vlserver_list *vllist;</div><div class='add'>+	struct afs_vlserver_list *vllist = NULL;</div><div class='ctx'> 	struct afs_cell *cell;</div><div class='ctx'> 	int i, ret;</div><div class='ctx'> </div><div class='hunk'>@@ -146,28 +140,37 @@ static struct afs_cell *afs_alloc_cell(struct afs_net *net,</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	cell-&gt;name = kmalloc(namelen + 1, GFP_KERNEL);</div><div class='add'>+	/* Allocate the cell name and the key name in one go. */</div><div class='add'>+	cell-&gt;name = kmalloc(1 + namelen + 1 +</div><div class='add'>+			     4 + namelen + 1, GFP_KERNEL);</div><div class='ctx'> 	if (!cell-&gt;name) {</div><div class='ctx'> 		kfree(cell);</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	cell-&gt;net = net;</div><div class='add'>+	cell-&gt;name[0] = '.';</div><div class='add'>+	cell-&gt;name++;</div><div class='ctx'> 	cell-&gt;name_len = namelen;</div><div class='ctx'> 	for (i = 0; i &lt; namelen; i++)</div><div class='ctx'> 		cell-&gt;name[i] = tolower(name[i]);</div><div class='del'>-	cell-&gt;name[i] = 0;</div><div class='add'>+	cell-&gt;name[i++] = 0;</div><div class='add'>+</div><div class='add'>+	cell-&gt;key_desc = cell-&gt;name + i;</div><div class='add'>+	memcpy(cell-&gt;key_desc, "afs@", 4);</div><div class='add'>+	memcpy(cell-&gt;key_desc + 4, cell-&gt;name, cell-&gt;name_len + 1);</div><div class='ctx'> </div><div class='del'>-	atomic_set(&amp;cell-&gt;ref, 1);</div><div class='add'>+	cell-&gt;net = net;</div><div class='add'>+	refcount_set(&amp;cell-&gt;ref, 1);</div><div class='ctx'> 	atomic_set(&amp;cell-&gt;active, 0);</div><div class='add'>+	INIT_WORK(&amp;cell-&gt;destroyer, afs_destroy_cell_work);</div><div class='ctx'> 	INIT_WORK(&amp;cell-&gt;manager, afs_manage_cell_work);</div><div class='add'>+	timer_setup(&amp;cell-&gt;management_timer, afs_cell_timer, 0);</div><div class='add'>+	init_rwsem(&amp;cell-&gt;vs_lock);</div><div class='ctx'> 	cell-&gt;volumes = RB_ROOT;</div><div class='ctx'> 	INIT_HLIST_HEAD(&amp;cell-&gt;proc_volumes);</div><div class='ctx'> 	seqlock_init(&amp;cell-&gt;volume_lock);</div><div class='ctx'> 	cell-&gt;fs_servers = RB_ROOT;</div><div class='del'>-	seqlock_init(&amp;cell-&gt;fs_lock);</div><div class='del'>-	INIT_LIST_HEAD(&amp;cell-&gt;fs_open_mmaps);</div><div class='del'>-	init_rwsem(&amp;cell-&gt;fs_open_mmaps_lock);</div><div class='add'>+	init_rwsem(&amp;cell-&gt;fs_lock);</div><div class='ctx'> 	rwlock_init(&amp;cell-&gt;vl_servers_lock);</div><div class='ctx'> 	cell-&gt;flags = (1 &lt;&lt; AFS_CELL_FL_CHECK_ALIAS);</div><div class='ctx'> </div><div class='hunk'>@@ -180,6 +183,7 @@ static struct afs_cell *afs_alloc_cell(struct afs_net *net,</div><div class='ctx'> 					      VL_SERVICE, AFS_VL_PORT);</div><div class='ctx'> 		if (IS_ERR(vllist)) {</div><div class='ctx'> 			ret = PTR_ERR(vllist);</div><div class='add'>+			vllist = NULL;</div><div class='ctx'> 			goto parse_failed;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -202,7 +206,13 @@ static struct afs_cell *afs_alloc_cell(struct afs_net *net,</div><div class='ctx'> 	cell-&gt;dns_status = vllist-&gt;status;</div><div class='ctx'> 	smp_store_release(&amp;cell-&gt;dns_lookup_count, 1); /* vs source/status */</div><div class='ctx'> 	atomic_inc(&amp;net-&gt;cells_outstanding);</div><div class='add'>+	ret = idr_alloc_cyclic(&amp;net-&gt;cells_dyn_ino, cell,</div><div class='add'>+			       2, INT_MAX / 2, GFP_KERNEL);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto error;</div><div class='add'>+	cell-&gt;dynroot_ino = ret;</div><div class='ctx'> 	cell-&gt;debug_id = atomic_inc_return(&amp;cell_debug_id);</div><div class='add'>+</div><div class='ctx'> 	trace_afs_cell(cell-&gt;debug_id, 1, 0, afs_cell_trace_alloc);</div><div class='ctx'> </div><div class='ctx'> 	_leave(" = %p", cell);</div><div class='hunk'>@@ -212,7 +222,8 @@ parse_failed:</div><div class='ctx'> 	if (ret == -EINVAL)</div><div class='ctx'> 		printk(KERN_ERR "kAFS: bad VL server IP address\n");</div><div class='ctx'> error:</div><div class='del'>-	kfree(cell-&gt;name);</div><div class='add'>+	afs_put_vlserverlist(cell-&gt;net, vllist);</div><div class='add'>+	kfree(cell-&gt;name - 1);</div><div class='ctx'> 	kfree(cell);</div><div class='ctx'> 	_leave(" = %d", ret);</div><div class='ctx'> 	return ERR_PTR(ret);</div><div class='hunk'>@@ -224,7 +235,8 @@ error:</div><div class='ctx'>  * @name:	The name of the cell.</div><div class='ctx'>  * @namesz:	The strlen of the cell name.</div><div class='ctx'>  * @vllist:	A colon/comma separated list of numeric IP addresses or NULL.</div><div class='del'>- * @excl:	T if an error should be given if the cell name already exists.</div><div class='add'>+ * @reason:	The reason we're doing the lookup</div><div class='add'>+ * @trace:	The reason to be logged if the lookup is successful.</div><div class='ctx'>  *</div><div class='ctx'>  * Look up a cell record by name and query the DNS for VL server addresses if</div><div class='ctx'>  * needed.  Note that that actual DNS query is punted off to the manager thread</div><div class='hunk'>@@ -233,19 +245,27 @@ error:</div><div class='ctx'>  */</div><div class='ctx'> struct afs_cell *afs_lookup_cell(struct afs_net *net,</div><div class='ctx'> 				 const char *name, unsigned int namesz,</div><div class='del'>-				 const char *vllist, bool excl)</div><div class='add'>+				 const char *vllist,</div><div class='add'>+				 enum afs_lookup_cell_for reason,</div><div class='add'>+				 enum afs_cell_trace trace)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_cell *cell, *candidate, *cursor;</div><div class='ctx'> 	struct rb_node *parent, **pp;</div><div class='ctx'> 	enum afs_cell_state state;</div><div class='ctx'> 	int ret, n;</div><div class='ctx'> </div><div class='del'>-	_enter("%s,%s", name, vllist);</div><div class='add'>+	_enter("%s,%s,%u", name, vllist, reason);</div><div class='ctx'> </div><div class='del'>-	if (!excl) {</div><div class='del'>-		cell = afs_find_cell(net, name, namesz, afs_cell_trace_use_lookup);</div><div class='del'>-		if (!IS_ERR(cell))</div><div class='add'>+	if (reason != AFS_LOOKUP_CELL_PRELOAD) {</div><div class='add'>+		cell = afs_find_cell(net, name, namesz, trace);</div><div class='add'>+		if (!IS_ERR(cell)) {</div><div class='add'>+			if (reason == AFS_LOOKUP_CELL_DYNROOT)</div><div class='add'>+				goto no_wait;</div><div class='add'>+			if (cell-&gt;state == AFS_CELL_SETTING_UP ||</div><div class='add'>+			    cell-&gt;state == AFS_CELL_UNLOOKED)</div><div class='add'>+				goto lookup_cell;</div><div class='ctx'> 			goto wait_for_cell;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Assume we're probably going to create a cell and preallocate and</div><div class='hunk'>@@ -286,29 +306,74 @@ struct afs_cell *afs_lookup_cell(struct afs_net *net,</div><div class='ctx'> </div><div class='ctx'> 	cell = candidate;</div><div class='ctx'> 	candidate = NULL;</div><div class='del'>-	atomic_set(&amp;cell-&gt;active, 2);</div><div class='del'>-	trace_afs_cell(cell-&gt;debug_id, atomic_read(&amp;cell-&gt;ref), 2, afs_cell_trace_insert);</div><div class='add'>+	afs_use_cell(cell, trace);</div><div class='ctx'> 	rb_link_node_rcu(&amp;cell-&gt;net_node, parent, pp);</div><div class='ctx'> 	rb_insert_color(&amp;cell-&gt;net_node, &amp;net-&gt;cells);</div><div class='ctx'> 	up_write(&amp;net-&gt;cells_lock);</div><div class='ctx'> </div><div class='del'>-	afs_queue_cell(cell, afs_cell_trace_get_queue_new);</div><div class='add'>+lookup_cell:</div><div class='add'>+	if (reason != AFS_LOOKUP_CELL_PRELOAD &amp;&amp;</div><div class='add'>+	    reason != AFS_LOOKUP_CELL_ROOTCELL) {</div><div class='add'>+		set_bit(AFS_CELL_FL_DO_LOOKUP, &amp;cell-&gt;flags);</div><div class='add'>+		afs_queue_cell(cell, afs_cell_trace_queue_new);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> wait_for_cell:</div><div class='del'>-	trace_afs_cell(cell-&gt;debug_id, atomic_read(&amp;cell-&gt;ref), atomic_read(&amp;cell-&gt;active),</div><div class='del'>-		       afs_cell_trace_wait);</div><div class='del'>-	_debug("wait_for_cell");</div><div class='del'>-	wait_var_event(&amp;cell-&gt;state,</div><div class='del'>-		       ({</div><div class='del'>-			       state = smp_load_acquire(&amp;cell-&gt;state); /* vs error */</div><div class='del'>-			       state == AFS_CELL_ACTIVE || state == AFS_CELL_REMOVED;</div><div class='del'>-		       }));</div><div class='add'>+	state = smp_load_acquire(&amp;cell-&gt;state); /* vs error */</div><div class='add'>+	switch (state) {</div><div class='add'>+	case AFS_CELL_ACTIVE:</div><div class='add'>+	case AFS_CELL_DEAD:</div><div class='add'>+		break;</div><div class='add'>+	case AFS_CELL_UNLOOKED:</div><div class='add'>+	default:</div><div class='add'>+		if (reason == AFS_LOOKUP_CELL_PRELOAD ||</div><div class='add'>+		    reason == AFS_LOOKUP_CELL_ROOTCELL)</div><div class='add'>+			break;</div><div class='add'>+		_debug("wait_for_cell");</div><div class='add'>+		afs_see_cell(cell, afs_cell_trace_wait);</div><div class='add'>+		wait_var_event(&amp;cell-&gt;state,</div><div class='add'>+			       ({</div><div class='add'>+				       state = smp_load_acquire(&amp;cell-&gt;state); /* vs error */</div><div class='add'>+				       state == AFS_CELL_ACTIVE || state == AFS_CELL_DEAD;</div><div class='add'>+			       }));</div><div class='add'>+		_debug("waited_for_cell %d %d", cell-&gt;state, cell-&gt;error);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='add'>+no_wait:</div><div class='ctx'> 	/* Check the state obtained from the wait check. */</div><div class='del'>-	if (state == AFS_CELL_REMOVED) {</div><div class='add'>+	state = smp_load_acquire(&amp;cell-&gt;state); /* vs error */</div><div class='add'>+	if (state == AFS_CELL_DEAD) {</div><div class='ctx'> 		ret = cell-&gt;error;</div><div class='ctx'> 		goto error;</div><div class='ctx'> 	}</div><div class='add'>+	if (state == AFS_CELL_ACTIVE) {</div><div class='add'>+		switch (cell-&gt;dns_status) {</div><div class='add'>+		case DNS_LOOKUP_NOT_DONE:</div><div class='add'>+			if (cell-&gt;dns_source == DNS_RECORD_FROM_CONFIG) {</div><div class='add'>+				ret = 0;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+			fallthrough;</div><div class='add'>+		default:</div><div class='add'>+			ret = -EIO;</div><div class='add'>+			goto error;</div><div class='add'>+		case DNS_LOOKUP_GOOD:</div><div class='add'>+		case DNS_LOOKUP_GOOD_WITH_BAD:</div><div class='add'>+			ret = 0;</div><div class='add'>+			break;</div><div class='add'>+		case DNS_LOOKUP_GOT_NOT_FOUND:</div><div class='add'>+			ret = -ENOENT;</div><div class='add'>+			goto error;</div><div class='add'>+		case DNS_LOOKUP_BAD:</div><div class='add'>+			ret = -EREMOTEIO;</div><div class='add'>+			goto error;</div><div class='add'>+		case DNS_LOOKUP_GOT_LOCAL_FAILURE:</div><div class='add'>+		case DNS_LOOKUP_GOT_TEMP_FAILURE:</div><div class='add'>+		case DNS_LOOKUP_GOT_NS_FAILURE:</div><div class='add'>+			ret = -EDESTADDRREQ;</div><div class='add'>+			goto error;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	_leave(" = %p [cell]", cell);</div><div class='ctx'> 	return cell;</div><div class='hunk'>@@ -316,10 +381,10 @@ wait_for_cell:</div><div class='ctx'> cell_already_exists:</div><div class='ctx'> 	_debug("cell exists");</div><div class='ctx'> 	cell = cursor;</div><div class='del'>-	if (excl) {</div><div class='add'>+	if (reason == AFS_LOOKUP_CELL_PRELOAD) {</div><div class='ctx'> 		ret = -EEXIST;</div><div class='ctx'> 	} else {</div><div class='del'>-		afs_use_cell(cursor, afs_cell_trace_use_lookup);</div><div class='add'>+		afs_use_cell(cursor, trace);</div><div class='ctx'> 		ret = 0;</div><div class='ctx'> 	}</div><div class='ctx'> 	up_write(&amp;net-&gt;cells_lock);</div><div class='hunk'>@@ -329,7 +394,7 @@ cell_already_exists:</div><div class='ctx'> 		goto wait_for_cell;</div><div class='ctx'> 	goto error_noput;</div><div class='ctx'> error:</div><div class='del'>-	afs_unuse_cell(net, cell, afs_cell_trace_unuse_lookup);</div><div class='add'>+	afs_unuse_cell(cell, afs_cell_trace_unuse_lookup_error);</div><div class='ctx'> error_noput:</div><div class='ctx'> 	_leave(" = %d [error]", ret);</div><div class='ctx'> 	return ERR_PTR(ret);</div><div class='hunk'>@@ -366,8 +431,18 @@ int afs_cell_init(struct afs_net *net, const char *rootcell)</div><div class='ctx'> 		len = cp - rootcell;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* allocate a cell record for the root cell */</div><div class='del'>-	new_root = afs_lookup_cell(net, rootcell, len, vllist, false);</div><div class='add'>+	if (len == 0 || !rootcell[0] || rootcell[0] == '.' || rootcell[len - 1] == '.')</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	if (memchr(rootcell, '/', len))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	cp = strstr(rootcell, "..");</div><div class='add'>+	if (cp &amp;&amp; cp &lt; rootcell + len)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	/* allocate a cell record for the root/workstation cell */</div><div class='add'>+	new_root = afs_lookup_cell(net, rootcell, len, vllist,</div><div class='add'>+				   AFS_LOOKUP_CELL_ROOTCELL,</div><div class='add'>+				   afs_cell_trace_use_lookup_ws);</div><div class='ctx'> 	if (IS_ERR(new_root)) {</div><div class='ctx'> 		_leave(" = %ld", PTR_ERR(new_root));</div><div class='ctx'> 		return PTR_ERR(new_root);</div><div class='hunk'>@@ -378,12 +453,11 @@ int afs_cell_init(struct afs_net *net, const char *rootcell)</div><div class='ctx'> </div><div class='ctx'> 	/* install the new cell */</div><div class='ctx'> 	down_write(&amp;net-&gt;cells_lock);</div><div class='del'>-	afs_see_cell(new_root, afs_cell_trace_see_ws);</div><div class='del'>-	old_root = net-&gt;ws_cell;</div><div class='del'>-	net-&gt;ws_cell = new_root;</div><div class='add'>+	old_root = rcu_replace_pointer(net-&gt;ws_cell, new_root,</div><div class='add'>+				       lockdep_is_held(&amp;net-&gt;cells_lock));</div><div class='ctx'> 	up_write(&amp;net-&gt;cells_lock);</div><div class='ctx'> </div><div class='del'>-	afs_unuse_cell(net, old_root, afs_cell_trace_unuse_ws);</div><div class='add'>+	afs_unuse_cell(old_root, afs_cell_trace_unuse_ws);</div><div class='ctx'> 	_leave(" = 0");</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -409,10 +483,12 @@ static int afs_update_cell(struct afs_cell *cell)</div><div class='ctx'> 		if (ret == -ENOMEM)</div><div class='ctx'> 			goto out_wake;</div><div class='ctx'> </div><div class='del'>-		ret = -ENOMEM;</div><div class='ctx'> 		vllist = afs_alloc_vlserver_list(0);</div><div class='del'>-		if (!vllist)</div><div class='add'>+		if (!vllist) {</div><div class='add'>+			if (ret &gt;= 0)</div><div class='add'>+				ret = -ENOMEM;</div><div class='ctx'> 			goto out_wake;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		switch (ret) {</div><div class='ctx'> 		case -ENODATA:</div><div class='hunk'>@@ -490,48 +566,33 @@ static void afs_cell_destroy(struct rcu_head *rcu)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_cell *cell = container_of(rcu, struct afs_cell, rcu);</div><div class='ctx'> 	struct afs_net *net = cell-&gt;net;</div><div class='del'>-	int u;</div><div class='add'>+	int r;</div><div class='ctx'> </div><div class='ctx'> 	_enter("%p{%s}", cell, cell-&gt;name);</div><div class='ctx'> </div><div class='del'>-	u = atomic_read(&amp;cell-&gt;ref);</div><div class='del'>-	ASSERTCMP(u, ==, 0);</div><div class='del'>-	trace_afs_cell(cell-&gt;debug_id, u, atomic_read(&amp;cell-&gt;active), afs_cell_trace_free);</div><div class='add'>+	r = refcount_read(&amp;cell-&gt;ref);</div><div class='add'>+	ASSERTCMP(r, ==, 0);</div><div class='add'>+	trace_afs_cell(cell-&gt;debug_id, r, atomic_read(&amp;cell-&gt;active), afs_cell_trace_free);</div><div class='ctx'> </div><div class='ctx'> 	afs_put_vlserverlist(net, rcu_access_pointer(cell-&gt;vl_servers));</div><div class='del'>-	afs_unuse_cell(net, cell-&gt;alias_of, afs_cell_trace_unuse_alias);</div><div class='add'>+	afs_unuse_cell(cell-&gt;alias_of, afs_cell_trace_unuse_alias);</div><div class='ctx'> 	key_put(cell-&gt;anonymous_key);</div><div class='del'>-	kfree(cell-&gt;name);</div><div class='add'>+	idr_remove(&amp;net-&gt;cells_dyn_ino, cell-&gt;dynroot_ino);</div><div class='add'>+	kfree(cell-&gt;name - 1);</div><div class='ctx'> 	kfree(cell);</div><div class='ctx'> </div><div class='ctx'> 	afs_dec_cells_outstanding(net);</div><div class='ctx'> 	_leave(" [destroyed]");</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Queue the cell manager.</div><div class='del'>- */</div><div class='del'>-static void afs_queue_cell_manager(struct afs_net *net)</div><div class='del'>-{</div><div class='del'>-	int outstanding = atomic_inc_return(&amp;net-&gt;cells_outstanding);</div><div class='del'>-</div><div class='del'>-	_enter("%d", outstanding);</div><div class='del'>-</div><div class='del'>-	if (!queue_work(afs_wq, &amp;net-&gt;cells_manager))</div><div class='del'>-		afs_dec_cells_outstanding(net);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Cell management timer.  We have an increment on cells_outstanding that we</div><div class='del'>- * need to pass along to the work item.</div><div class='del'>- */</div><div class='del'>-void afs_cells_timer(struct timer_list *timer)</div><div class='add'>+static void afs_destroy_cell_work(struct work_struct *work)</div><div class='ctx'> {</div><div class='del'>-	struct afs_net *net = container_of(timer, struct afs_net, cells_timer);</div><div class='add'>+	struct afs_cell *cell = container_of(work, struct afs_cell, destroyer);</div><div class='ctx'> </div><div class='del'>-	_enter("");</div><div class='del'>-	if (!queue_work(afs_wq, &amp;net-&gt;cells_manager))</div><div class='del'>-		afs_dec_cells_outstanding(net);</div><div class='add'>+	afs_see_cell(cell, afs_cell_trace_destroy);</div><div class='add'>+	timer_delete_sync(&amp;cell-&gt;management_timer);</div><div class='add'>+	cancel_work_sync(&amp;cell-&gt;manager);</div><div class='add'>+	call_rcu(&amp;cell-&gt;rcu, afs_cell_destroy);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -539,13 +600,10 @@ void afs_cells_timer(struct timer_list *timer)</div><div class='ctx'>  */</div><div class='ctx'> struct afs_cell *afs_get_cell(struct afs_cell *cell, enum afs_cell_trace reason)</div><div class='ctx'> {</div><div class='del'>-	int u;</div><div class='add'>+	int r;</div><div class='ctx'> </div><div class='del'>-	if (atomic_read(&amp;cell-&gt;ref) &lt;= 0)</div><div class='del'>-		BUG();</div><div class='del'>-</div><div class='del'>-	u = atomic_inc_return(&amp;cell-&gt;ref);</div><div class='del'>-	trace_afs_cell(cell-&gt;debug_id, u, atomic_read(&amp;cell-&gt;active), reason);</div><div class='add'>+	__refcount_inc(&amp;cell-&gt;ref, &amp;r);</div><div class='add'>+	trace_afs_cell(cell-&gt;debug_id, r + 1, atomic_read(&amp;cell-&gt;active), reason);</div><div class='ctx'> 	return cell;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -556,15 +614,17 @@ void afs_put_cell(struct afs_cell *cell, enum afs_cell_trace reason)</div><div class='ctx'> {</div><div class='ctx'> 	if (cell) {</div><div class='ctx'> 		unsigned int debug_id = cell-&gt;debug_id;</div><div class='del'>-		unsigned int u, a;</div><div class='add'>+		unsigned int a;</div><div class='add'>+		bool zero;</div><div class='add'>+		int r;</div><div class='ctx'> </div><div class='ctx'> 		a = atomic_read(&amp;cell-&gt;active);</div><div class='del'>-		u = atomic_dec_return(&amp;cell-&gt;ref);</div><div class='del'>-		trace_afs_cell(debug_id, u, a, reason);</div><div class='del'>-		if (u == 0) {</div><div class='add'>+		zero = __refcount_dec_and_test(&amp;cell-&gt;ref, &amp;r);</div><div class='add'>+		trace_afs_cell(debug_id, r - 1, a, reason);</div><div class='add'>+		if (zero) {</div><div class='ctx'> 			a = atomic_read(&amp;cell-&gt;active);</div><div class='ctx'> 			WARN(a != 0, "Cell active count %u &gt; 0\n", a);</div><div class='del'>-			call_rcu(&amp;cell-&gt;rcu, afs_cell_destroy);</div><div class='add'>+			WARN_ON(!queue_work(afs_wq, &amp;cell-&gt;destroyer));</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -574,14 +634,11 @@ void afs_put_cell(struct afs_cell *cell, enum afs_cell_trace reason)</div><div class='ctx'>  */</div><div class='ctx'> struct afs_cell *afs_use_cell(struct afs_cell *cell, enum afs_cell_trace reason)</div><div class='ctx'> {</div><div class='del'>-	int u, a;</div><div class='del'>-</div><div class='del'>-	if (atomic_read(&amp;cell-&gt;ref) &lt;= 0)</div><div class='del'>-		BUG();</div><div class='add'>+	int r, a;</div><div class='ctx'> </div><div class='del'>-	u = atomic_read(&amp;cell-&gt;ref);</div><div class='add'>+	__refcount_inc(&amp;cell-&gt;ref, &amp;r);</div><div class='ctx'> 	a = atomic_inc_return(&amp;cell-&gt;active);</div><div class='del'>-	trace_afs_cell(cell-&gt;debug_id, u, a, reason);</div><div class='add'>+	trace_afs_cell(cell-&gt;debug_id, r + 1, a, reason);</div><div class='ctx'> 	return cell;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -589,11 +646,12 @@ struct afs_cell *afs_use_cell(struct afs_cell *cell, enum afs_cell_trace reason)</div><div class='ctx'>  * Record a cell becoming less active.  When the active counter reaches 1, it</div><div class='ctx'>  * is scheduled for destruction, but may get reactivated.</div><div class='ctx'>  */</div><div class='del'>-void afs_unuse_cell(struct afs_net *net, struct afs_cell *cell, enum afs_cell_trace reason)</div><div class='add'>+void afs_unuse_cell(struct afs_cell *cell, enum afs_cell_trace reason)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int debug_id;</div><div class='ctx'> 	time64_t now, expire_delay;</div><div class='del'>-	int u, a;</div><div class='add'>+	bool zero;</div><div class='add'>+	int r, a;</div><div class='ctx'> </div><div class='ctx'> 	if (!cell)</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -607,13 +665,15 @@ void afs_unuse_cell(struct afs_net *net, struct afs_cell *cell, enum afs_cell_tr</div><div class='ctx'> 		expire_delay = afs_cell_gc_delay;</div><div class='ctx'> </div><div class='ctx'> 	debug_id = cell-&gt;debug_id;</div><div class='del'>-	u = atomic_read(&amp;cell-&gt;ref);</div><div class='ctx'> 	a = atomic_dec_return(&amp;cell-&gt;active);</div><div class='del'>-	trace_afs_cell(debug_id, u, a, reason);</div><div class='del'>-	WARN_ON(a == 0);</div><div class='del'>-	if (a == 1)</div><div class='add'>+	if (!a)</div><div class='ctx'> 		/* 'cell' may now be garbage collected. */</div><div class='del'>-		afs_set_cell_timer(net, expire_delay);</div><div class='add'>+		afs_set_cell_timer(cell, expire_delay);</div><div class='add'>+</div><div class='add'>+	zero = __refcount_dec_and_test(&amp;cell-&gt;ref, &amp;r);</div><div class='add'>+	trace_afs_cell(debug_id, r - 1, a, reason);</div><div class='add'>+	if (zero)</div><div class='add'>+		WARN_ON(!queue_work(afs_wq, &amp;cell-&gt;destroyer));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -621,11 +681,11 @@ void afs_unuse_cell(struct afs_net *net, struct afs_cell *cell, enum afs_cell_tr</div><div class='ctx'>  */</div><div class='ctx'> void afs_see_cell(struct afs_cell *cell, enum afs_cell_trace reason)</div><div class='ctx'> {</div><div class='del'>-	int u, a;</div><div class='add'>+	int r, a;</div><div class='ctx'> </div><div class='del'>-	u = atomic_read(&amp;cell-&gt;ref);</div><div class='add'>+	r = refcount_read(&amp;cell-&gt;ref);</div><div class='ctx'> 	a = atomic_read(&amp;cell-&gt;active);</div><div class='del'>-	trace_afs_cell(cell-&gt;debug_id, u, a, reason);</div><div class='add'>+	trace_afs_cell(cell-&gt;debug_id, r, a, reason);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -633,36 +693,27 @@ void afs_see_cell(struct afs_cell *cell, enum afs_cell_trace reason)</div><div class='ctx'>  */</div><div class='ctx'> void afs_queue_cell(struct afs_cell *cell, enum afs_cell_trace reason)</div><div class='ctx'> {</div><div class='del'>-	afs_get_cell(cell, reason);</div><div class='del'>-	if (!queue_work(afs_wq, &amp;cell-&gt;manager))</div><div class='del'>-		afs_put_cell(cell, afs_cell_trace_put_queue_fail);</div><div class='add'>+	queue_work(afs_wq, &amp;cell-&gt;manager);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Allocate a key to use as a placeholder for anonymous user security.</div><div class='add'>+ * Cell-specific management timer.</div><div class='ctx'>  */</div><div class='del'>-static int afs_alloc_anon_key(struct afs_cell *cell)</div><div class='add'>+static void afs_cell_timer(struct timer_list *timer)</div><div class='ctx'> {</div><div class='del'>-	struct key *key;</div><div class='del'>-	char keyname[4 + AFS_MAXCELLNAME + 1], *cp, *dp;</div><div class='del'>-</div><div class='del'>-	/* Create a key to represent an anonymous user. */</div><div class='del'>-	memcpy(keyname, "afs@", 4);</div><div class='del'>-	dp = keyname + 4;</div><div class='del'>-	cp = cell-&gt;name;</div><div class='del'>-	do {</div><div class='del'>-		*dp++ = tolower(*cp);</div><div class='del'>-	} while (*cp++);</div><div class='add'>+	struct afs_cell *cell = container_of(timer, struct afs_cell, management_timer);</div><div class='ctx'> </div><div class='del'>-	key = rxrpc_get_null_key(keyname);</div><div class='del'>-	if (IS_ERR(key))</div><div class='del'>-		return PTR_ERR(key);</div><div class='del'>-</div><div class='del'>-	cell-&gt;anonymous_key = key;</div><div class='add'>+	afs_see_cell(cell, afs_cell_trace_see_mgmt_timer);</div><div class='add'>+	if (refcount_read(&amp;cell-&gt;ref) &gt; 0 &amp;&amp; cell-&gt;net-&gt;live)</div><div class='add'>+		queue_work(afs_wq, &amp;cell-&gt;manager);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	_debug("anon key %p{%x}",</div><div class='del'>-	       cell-&gt;anonymous_key, key_serial(cell-&gt;anonymous_key));</div><div class='del'>-	return 0;</div><div class='add'>+/*</div><div class='add'>+ * Set/reduce the cell timer.</div><div class='add'>+ */</div><div class='add'>+void afs_set_cell_timer(struct afs_cell *cell, unsigned int delay_secs)</div><div class='add'>+{</div><div class='add'>+	timer_reduce(&amp;cell-&gt;management_timer, jiffies + delay_secs * HZ);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -674,19 +725,6 @@ static int afs_activate_cell(struct afs_net *net, struct afs_cell *cell)</div><div class='ctx'> 	struct afs_cell *pcell;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (!cell-&gt;anonymous_key) {</div><div class='del'>-		ret = afs_alloc_anon_key(cell);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_AFS_FSCACHE</div><div class='del'>-	cell-&gt;cache = fscache_acquire_cookie(afs_cache_netfs.primary_index,</div><div class='del'>-					     &amp;afs_cell_cache_index_def,</div><div class='del'>-					     cell-&gt;name, strlen(cell-&gt;name),</div><div class='del'>-					     NULL, 0,</div><div class='del'>-					     cell, 0, true);</div><div class='del'>-#endif</div><div class='ctx'> 	ret = afs_proc_cell_setup(cell);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -704,7 +742,6 @@ static int afs_activate_cell(struct afs_net *net, struct afs_cell *cell)</div><div class='ctx'> 	if (cell-&gt;proc_link.next)</div><div class='ctx'> 		cell-&gt;proc_link.next-&gt;pprev = &amp;cell-&gt;proc_link.next;</div><div class='ctx'> </div><div class='del'>-	afs_dynroot_mkdir(net, cell);</div><div class='ctx'> 	mutex_unlock(&amp;net-&gt;proc_cells_lock);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -719,247 +756,167 @@ static void afs_deactivate_cell(struct afs_net *net, struct afs_cell *cell)</div><div class='ctx'> 	afs_proc_cell_remove(cell);</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;net-&gt;proc_cells_lock);</div><div class='del'>-	hlist_del_rcu(&amp;cell-&gt;proc_link);</div><div class='del'>-	afs_dynroot_rmdir(net, cell);</div><div class='add'>+	if (!hlist_unhashed(&amp;cell-&gt;proc_link))</div><div class='add'>+		hlist_del_rcu(&amp;cell-&gt;proc_link);</div><div class='ctx'> 	mutex_unlock(&amp;net-&gt;proc_cells_lock);</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_AFS_FSCACHE</div><div class='del'>-	fscache_relinquish_cookie(cell-&gt;cache, NULL, false);</div><div class='del'>-	cell-&gt;cache = NULL;</div><div class='del'>-#endif</div><div class='del'>-</div><div class='ctx'> 	_leave("");</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool afs_has_cell_expired(struct afs_cell *cell, time64_t *_next_manage)</div><div class='add'>+{</div><div class='add'>+	const struct afs_vlserver_list *vllist;</div><div class='add'>+	time64_t expire_at = cell-&gt;last_inactive;</div><div class='add'>+	time64_t now = ktime_get_real_seconds();</div><div class='add'>+</div><div class='add'>+	if (atomic_read(&amp;cell-&gt;active))</div><div class='add'>+		return false;</div><div class='add'>+	if (!cell-&gt;net-&gt;live)</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	vllist = rcu_dereference_protected(cell-&gt;vl_servers, true);</div><div class='add'>+	if (vllist &amp;&amp; vllist-&gt;nr_servers &gt; 0)</div><div class='add'>+		expire_at += afs_cell_gc_delay;</div><div class='add'>+</div><div class='add'>+	if (expire_at &lt;= now)</div><div class='add'>+		return true;</div><div class='add'>+	if (expire_at &lt; *_next_manage)</div><div class='add'>+		*_next_manage = expire_at;</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Manage a cell record, initialising and destroying it, maintaining its DNS</div><div class='ctx'>  * records.</div><div class='ctx'>  */</div><div class='del'>-static void afs_manage_cell(struct afs_cell *cell)</div><div class='add'>+static bool afs_manage_cell(struct afs_cell *cell)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_net *net = cell-&gt;net;</div><div class='del'>-	int ret, active;</div><div class='add'>+	time64_t next_manage = TIME64_MAX;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	_enter("%s", cell-&gt;name);</div><div class='ctx'> </div><div class='del'>-again:</div><div class='ctx'> 	_debug("state %u", cell-&gt;state);</div><div class='ctx'> 	switch (cell-&gt;state) {</div><div class='del'>-	case AFS_CELL_INACTIVE:</div><div class='del'>-	case AFS_CELL_FAILED:</div><div class='del'>-		down_write(&amp;net-&gt;cells_lock);</div><div class='del'>-		active = 1;</div><div class='del'>-		if (atomic_try_cmpxchg_relaxed(&amp;cell-&gt;active, &amp;active, 0)) {</div><div class='del'>-			rb_erase(&amp;cell-&gt;net_node, &amp;net-&gt;cells);</div><div class='del'>-			trace_afs_cell(cell-&gt;debug_id, atomic_read(&amp;cell-&gt;ref), 0,</div><div class='del'>-				       afs_cell_trace_unuse_delete);</div><div class='del'>-			smp_store_release(&amp;cell-&gt;state, AFS_CELL_REMOVED);</div><div class='del'>-		}</div><div class='del'>-		up_write(&amp;net-&gt;cells_lock);</div><div class='del'>-		if (cell-&gt;state == AFS_CELL_REMOVED) {</div><div class='del'>-			wake_up_var(&amp;cell-&gt;state);</div><div class='del'>-			goto final_destruction;</div><div class='del'>-		}</div><div class='del'>-		if (cell-&gt;state == AFS_CELL_FAILED)</div><div class='del'>-			goto done;</div><div class='del'>-		smp_store_release(&amp;cell-&gt;state, AFS_CELL_UNSET);</div><div class='del'>-		wake_up_var(&amp;cell-&gt;state);</div><div class='del'>-		goto again;</div><div class='del'>-</div><div class='del'>-	case AFS_CELL_UNSET:</div><div class='del'>-		smp_store_release(&amp;cell-&gt;state, AFS_CELL_ACTIVATING);</div><div class='del'>-		wake_up_var(&amp;cell-&gt;state);</div><div class='del'>-		goto again;</div><div class='del'>-</div><div class='del'>-	case AFS_CELL_ACTIVATING:</div><div class='del'>-		ret = afs_activate_cell(net, cell);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			goto activation_failed;</div><div class='add'>+	case AFS_CELL_SETTING_UP:</div><div class='add'>+		goto set_up_cell;</div><div class='add'>+	case AFS_CELL_UNLOOKED:</div><div class='add'>+	case AFS_CELL_ACTIVE:</div><div class='add'>+		goto cell_is_active;</div><div class='add'>+	case AFS_CELL_REMOVING:</div><div class='add'>+		WARN_ON_ONCE(1);</div><div class='add'>+		return false;</div><div class='add'>+	case AFS_CELL_DEAD:</div><div class='add'>+		return false;</div><div class='add'>+	default:</div><div class='add'>+		_debug("bad state %u", cell-&gt;state);</div><div class='add'>+		WARN_ON_ONCE(1); /* Unhandled state */</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		smp_store_release(&amp;cell-&gt;state, AFS_CELL_ACTIVE);</div><div class='del'>-		wake_up_var(&amp;cell-&gt;state);</div><div class='del'>-		goto again;</div><div class='add'>+set_up_cell:</div><div class='add'>+	ret = afs_activate_cell(net, cell);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		cell-&gt;error = ret;</div><div class='add'>+		goto remove_cell;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	case AFS_CELL_ACTIVE:</div><div class='del'>-		if (atomic_read(&amp;cell-&gt;active) &gt; 1) {</div><div class='del'>-			if (test_and_clear_bit(AFS_CELL_FL_DO_LOOKUP, &amp;cell-&gt;flags)) {</div><div class='del'>-				ret = afs_update_cell(cell);</div><div class='del'>-				if (ret &lt; 0)</div><div class='del'>-					cell-&gt;error = ret;</div><div class='del'>-			}</div><div class='del'>-			goto done;</div><div class='del'>-		}</div><div class='del'>-		smp_store_release(&amp;cell-&gt;state, AFS_CELL_DEACTIVATING);</div><div class='del'>-		wake_up_var(&amp;cell-&gt;state);</div><div class='del'>-		goto again;</div><div class='add'>+	afs_set_cell_state(cell, AFS_CELL_UNLOOKED);</div><div class='ctx'> </div><div class='del'>-	case AFS_CELL_DEACTIVATING:</div><div class='del'>-		if (atomic_read(&amp;cell-&gt;active) &gt; 1)</div><div class='del'>-			goto reverse_deactivation;</div><div class='del'>-		afs_deactivate_cell(net, cell);</div><div class='del'>-		smp_store_release(&amp;cell-&gt;state, AFS_CELL_INACTIVE);</div><div class='del'>-		wake_up_var(&amp;cell-&gt;state);</div><div class='del'>-		goto again;</div><div class='add'>+cell_is_active:</div><div class='add'>+	if (afs_has_cell_expired(cell, &amp;next_manage))</div><div class='add'>+		goto remove_cell;</div><div class='ctx'> </div><div class='del'>-	case AFS_CELL_REMOVED:</div><div class='del'>-		goto done;</div><div class='add'>+	if (test_and_clear_bit(AFS_CELL_FL_DO_LOOKUP, &amp;cell-&gt;flags)) {</div><div class='add'>+		ret = afs_update_cell(cell);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			cell-&gt;error = ret;</div><div class='add'>+		if (cell-&gt;state == AFS_CELL_UNLOOKED)</div><div class='add'>+			afs_set_cell_state(cell, AFS_CELL_ACTIVE);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	default:</div><div class='del'>-		break;</div><div class='add'>+	if (next_manage &lt; TIME64_MAX &amp;&amp; cell-&gt;net-&gt;live) {</div><div class='add'>+		time64_t now = ktime_get_real_seconds();</div><div class='add'>+</div><div class='add'>+		if (next_manage - now &lt;= 0)</div><div class='add'>+			afs_queue_cell(cell, afs_cell_trace_queue_again);</div><div class='add'>+		else</div><div class='add'>+			afs_set_cell_timer(cell, next_manage - now);</div><div class='ctx'> 	}</div><div class='del'>-	_debug("bad state %u", cell-&gt;state);</div><div class='del'>-	BUG(); /* Unhandled state */</div><div class='add'>+	_leave(" [done %u]", cell-&gt;state);</div><div class='add'>+	return false;</div><div class='ctx'> </div><div class='del'>-activation_failed:</div><div class='del'>-	cell-&gt;error = ret;</div><div class='del'>-	afs_deactivate_cell(net, cell);</div><div class='add'>+remove_cell:</div><div class='add'>+	down_write(&amp;net-&gt;cells_lock);</div><div class='ctx'> </div><div class='del'>-	smp_store_release(&amp;cell-&gt;state, AFS_CELL_FAILED); /* vs error */</div><div class='del'>-	wake_up_var(&amp;cell-&gt;state);</div><div class='del'>-	goto again;</div><div class='add'>+	if (atomic_read(&amp;cell-&gt;active)) {</div><div class='add'>+		up_write(&amp;net-&gt;cells_lock);</div><div class='add'>+		goto cell_is_active;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-reverse_deactivation:</div><div class='del'>-	smp_store_release(&amp;cell-&gt;state, AFS_CELL_ACTIVE);</div><div class='del'>-	wake_up_var(&amp;cell-&gt;state);</div><div class='del'>-	_leave(" [deact-&gt;act]");</div><div class='del'>-	return;</div><div class='add'>+	/* Make sure that the expiring server records are going to see the fact</div><div class='add'>+	 * that the cell is caput.</div><div class='add'>+	 */</div><div class='add'>+	afs_set_cell_state(cell, AFS_CELL_REMOVING);</div><div class='ctx'> </div><div class='del'>-done:</div><div class='del'>-	_leave(" [done %u]", cell-&gt;state);</div><div class='del'>-	return;</div><div class='add'>+	afs_deactivate_cell(net, cell);</div><div class='add'>+	afs_purge_servers(cell);</div><div class='add'>+</div><div class='add'>+	rb_erase(&amp;cell-&gt;net_node, &amp;net-&gt;cells);</div><div class='add'>+	afs_see_cell(cell, afs_cell_trace_unuse_delete);</div><div class='add'>+	up_write(&amp;net-&gt;cells_lock);</div><div class='ctx'> </div><div class='del'>-final_destruction:</div><div class='ctx'> 	/* The root volume is pinning the cell */</div><div class='del'>-	afs_put_volume(cell-&gt;net, cell-&gt;root_volume, afs_volume_trace_put_cell_root);</div><div class='add'>+	afs_put_volume(cell-&gt;root_volume, afs_volume_trace_put_cell_root);</div><div class='ctx'> 	cell-&gt;root_volume = NULL;</div><div class='del'>-	afs_put_cell(cell, afs_cell_trace_put_destroy);</div><div class='add'>+</div><div class='add'>+	afs_set_cell_state(cell, AFS_CELL_DEAD);</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void afs_manage_cell_work(struct work_struct *work)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_cell *cell = container_of(work, struct afs_cell, manager);</div><div class='add'>+	bool final_put;</div><div class='ctx'> </div><div class='del'>-	afs_manage_cell(cell);</div><div class='del'>-	afs_put_cell(cell, afs_cell_trace_put_queue_work);</div><div class='add'>+	afs_see_cell(cell, afs_cell_trace_manage);</div><div class='add'>+	final_put = afs_manage_cell(cell);</div><div class='add'>+	afs_see_cell(cell, afs_cell_trace_managed);</div><div class='add'>+	if (final_put)</div><div class='add'>+		afs_put_cell(cell, afs_cell_trace_put_final);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Manage the records of cells known to a network namespace.  This includes</div><div class='del'>- * updating the DNS records and garbage collecting unused cells that were</div><div class='del'>- * automatically added.</div><div class='del'>- *</div><div class='del'>- * Note that constructed cell records may only be removed from net-&gt;cells by</div><div class='del'>- * this work item, so it is safe for this work item to stash a cursor pointing</div><div class='del'>- * into the tree and then return to caller (provided it skips cells that are</div><div class='del'>- * still under construction).</div><div class='del'>- *</div><div class='del'>- * Note also that we were given an increment on net-&gt;cells_outstanding by</div><div class='del'>- * whoever queued us that we need to deal with before returning.</div><div class='add'>+ * Purge in-memory cell database.</div><div class='ctx'>  */</div><div class='del'>-void afs_manage_cells(struct work_struct *work)</div><div class='add'>+void afs_cell_purge(struct afs_net *net)</div><div class='ctx'> {</div><div class='del'>-	struct afs_net *net = container_of(work, struct afs_net, cells_manager);</div><div class='add'>+	struct afs_cell *ws;</div><div class='ctx'> 	struct rb_node *cursor;</div><div class='del'>-	time64_t now = ktime_get_real_seconds(), next_manage = TIME64_MAX;</div><div class='del'>-	bool purging = !net-&gt;live;</div><div class='ctx'> </div><div class='ctx'> 	_enter("");</div><div class='ctx'> </div><div class='del'>-	/* Trawl the cell database looking for cells that have expired from</div><div class='del'>-	 * lack of use and cells whose DNS results have expired and dispatch</div><div class='del'>-	 * their managers.</div><div class='del'>-	 */</div><div class='del'>-	down_read(&amp;net-&gt;cells_lock);</div><div class='add'>+	down_write(&amp;net-&gt;cells_lock);</div><div class='add'>+	ws = rcu_replace_pointer(net-&gt;ws_cell, NULL,</div><div class='add'>+				 lockdep_is_held(&amp;net-&gt;cells_lock));</div><div class='add'>+	up_write(&amp;net-&gt;cells_lock);</div><div class='add'>+	afs_unuse_cell(ws, afs_cell_trace_unuse_ws);</div><div class='ctx'> </div><div class='add'>+	_debug("kick cells");</div><div class='add'>+	down_read(&amp;net-&gt;cells_lock);</div><div class='ctx'> 	for (cursor = rb_first(&amp;net-&gt;cells); cursor; cursor = rb_next(cursor)) {</div><div class='del'>-		struct afs_cell *cell =</div><div class='del'>-			rb_entry(cursor, struct afs_cell, net_node);</div><div class='del'>-		unsigned active;</div><div class='del'>-		bool sched_cell = false;</div><div class='del'>-</div><div class='del'>-		active = atomic_read(&amp;cell-&gt;active);</div><div class='del'>-		trace_afs_cell(cell-&gt;debug_id, atomic_read(&amp;cell-&gt;ref),</div><div class='del'>-			       active, afs_cell_trace_manage);</div><div class='del'>-</div><div class='del'>-		ASSERTCMP(active, &gt;=, 1);</div><div class='del'>-</div><div class='del'>-		if (purging) {</div><div class='del'>-			if (test_and_clear_bit(AFS_CELL_FL_NO_GC, &amp;cell-&gt;flags)) {</div><div class='del'>-				active = atomic_dec_return(&amp;cell-&gt;active);</div><div class='del'>-				trace_afs_cell(cell-&gt;debug_id, atomic_read(&amp;cell-&gt;ref),</div><div class='del'>-					       active, afs_cell_trace_unuse_pin);</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='add'>+		struct afs_cell *cell = rb_entry(cursor, struct afs_cell, net_node);</div><div class='ctx'> </div><div class='del'>-		if (active == 1) {</div><div class='del'>-			struct afs_vlserver_list *vllist;</div><div class='del'>-			time64_t expire_at = cell-&gt;last_inactive;</div><div class='del'>-</div><div class='del'>-			read_lock(&amp;cell-&gt;vl_servers_lock);</div><div class='del'>-			vllist = rcu_dereference_protected(</div><div class='del'>-				cell-&gt;vl_servers,</div><div class='del'>-				lockdep_is_held(&amp;cell-&gt;vl_servers_lock));</div><div class='del'>-			if (vllist-&gt;nr_servers &gt; 0)</div><div class='del'>-				expire_at += afs_cell_gc_delay;</div><div class='del'>-			read_unlock(&amp;cell-&gt;vl_servers_lock);</div><div class='del'>-			if (purging || expire_at &lt;= now)</div><div class='del'>-				sched_cell = true;</div><div class='del'>-			else if (expire_at &lt; next_manage)</div><div class='del'>-				next_manage = expire_at;</div><div class='del'>-		}</div><div class='add'>+		afs_see_cell(cell, afs_cell_trace_purge);</div><div class='ctx'> </div><div class='del'>-		if (!purging) {</div><div class='del'>-			if (test_bit(AFS_CELL_FL_DO_LOOKUP, &amp;cell-&gt;flags))</div><div class='del'>-				sched_cell = true;</div><div class='del'>-		}</div><div class='add'>+		if (test_and_clear_bit(AFS_CELL_FL_NO_GC, &amp;cell-&gt;flags))</div><div class='add'>+			afs_unuse_cell(cell, afs_cell_trace_unuse_pin);</div><div class='ctx'> </div><div class='del'>-		if (sched_cell)</div><div class='del'>-			afs_queue_cell(cell, afs_cell_trace_get_queue_manage);</div><div class='add'>+		afs_queue_cell(cell, afs_cell_trace_queue_purge);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='ctx'> 	up_read(&amp;net-&gt;cells_lock);</div><div class='ctx'> </div><div class='del'>-	/* Update the timer on the way out.  We have to pass an increment on</div><div class='del'>-	 * cells_outstanding in the namespace that we are in to the timer or</div><div class='del'>-	 * the work scheduler.</div><div class='del'>-	 */</div><div class='del'>-	if (!purging &amp;&amp; next_manage &lt; TIME64_MAX) {</div><div class='del'>-		now = ktime_get_real_seconds();</div><div class='del'>-</div><div class='del'>-		if (next_manage - now &lt;= 0) {</div><div class='del'>-			if (queue_work(afs_wq, &amp;net-&gt;cells_manager))</div><div class='del'>-				atomic_inc(&amp;net-&gt;cells_outstanding);</div><div class='del'>-		} else {</div><div class='del'>-			afs_set_cell_timer(net, next_manage - now);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	afs_dec_cells_outstanding(net);</div><div class='del'>-	_leave(" [%d]", atomic_read(&amp;net-&gt;cells_outstanding));</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Purge in-memory cell database.</div><div class='del'>- */</div><div class='del'>-void afs_cell_purge(struct afs_net *net)</div><div class='del'>-{</div><div class='del'>-	struct afs_cell *ws;</div><div class='del'>-</div><div class='del'>-	_enter("");</div><div class='del'>-</div><div class='del'>-	down_write(&amp;net-&gt;cells_lock);</div><div class='del'>-	ws = net-&gt;ws_cell;</div><div class='del'>-	net-&gt;ws_cell = NULL;</div><div class='del'>-	up_write(&amp;net-&gt;cells_lock);</div><div class='del'>-	afs_unuse_cell(net, ws, afs_cell_trace_unuse_ws);</div><div class='del'>-</div><div class='del'>-	_debug("del timer");</div><div class='del'>-	if (del_timer_sync(&amp;net-&gt;cells_timer))</div><div class='del'>-		atomic_dec(&amp;net-&gt;cells_outstanding);</div><div class='del'>-</div><div class='del'>-	_debug("kick mgr");</div><div class='del'>-	afs_queue_cell_manager(net);</div><div class='del'>-</div><div class='ctx'> 	_debug("wait");</div><div class='ctx'> 	wait_var_event(&amp;net-&gt;cells_outstanding,</div><div class='ctx'> 		       !atomic_read(&amp;net-&gt;cells_outstanding));</div><div class='head'>diff --git a/fs/afs/cm_security.c b/fs/afs/cm_security.c<br/>new file mode 100644<br/>index 000000000000..edcbd249d202<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/cm_security.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/cm_security.c</a></div><div class='hunk'>@@ -0,0 +1,340 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='add'>+/* Cache manager security.</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2025 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/slab.h&gt;</div><div class='add'>+#include &lt;crypto/krb5.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+#include "afs_cm.h"</div><div class='add'>+#include "afs_fs.h"</div><div class='add'>+#include "protocol_yfs.h"</div><div class='add'>+#define RXRPC_TRACE_ONLY_DEFINE_ENUMS</div><div class='add'>+#include &lt;trace/events/rxrpc.h&gt;</div><div class='add'>+</div><div class='add'>+#define RXGK_SERVER_ENC_TOKEN 1036U // 0x40c</div><div class='add'>+#define xdr_round_up(x) (round_up((x), sizeof(__be32)))</div><div class='add'>+#define xdr_len_object(x) (4 + round_up((x), sizeof(__be32)))</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_RXGK</div><div class='add'>+static int afs_create_yfs_cm_token(struct sk_buff *challenge,</div><div class='add'>+				   struct afs_server *server);</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Respond to an RxGK challenge, adding appdata.</div><div class='add'>+ */</div><div class='add'>+static int afs_respond_to_challenge(struct sk_buff *challenge)</div><div class='add'>+{</div><div class='add'>+#ifdef CONFIG_RXGK</div><div class='add'>+	struct krb5_buffer appdata = {};</div><div class='add'>+	struct afs_server *server;</div><div class='add'>+#endif</div><div class='add'>+	struct rxrpc_peer *peer;</div><div class='add'>+	unsigned long peer_data;</div><div class='add'>+	u16 service_id;</div><div class='add'>+	u8 security_index;</div><div class='add'>+</div><div class='add'>+	rxrpc_kernel_query_challenge(challenge, &amp;peer, &amp;peer_data,</div><div class='add'>+				     &amp;service_id, &amp;security_index);</div><div class='add'>+</div><div class='add'>+	_enter("%u,%u", service_id, security_index);</div><div class='add'>+</div><div class='add'>+	switch (service_id) {</div><div class='add'>+		/* We don't send CM_SERVICE RPCs, so don't expect a challenge</div><div class='add'>+		 * therefrom.</div><div class='add'>+		 */</div><div class='add'>+	case FS_SERVICE:</div><div class='add'>+	case VL_SERVICE:</div><div class='add'>+	case YFS_FS_SERVICE:</div><div class='add'>+	case YFS_VL_SERVICE:</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		pr_warn("Can't respond to unknown challenge %u:%u",</div><div class='add'>+			service_id, security_index);</div><div class='add'>+		return rxrpc_kernel_reject_challenge(challenge, RX_USER_ABORT, -EPROTO,</div><div class='add'>+						     afs_abort_unsupported_sec_class);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	switch (security_index) {</div><div class='add'>+#ifdef CONFIG_RXKAD</div><div class='add'>+	case RXRPC_SECURITY_RXKAD:</div><div class='add'>+		return rxkad_kernel_respond_to_challenge(challenge);</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_RXGK</div><div class='add'>+	case RXRPC_SECURITY_RXGK:</div><div class='add'>+		return rxgk_kernel_respond_to_challenge(challenge, &amp;appdata);</div><div class='add'>+</div><div class='add'>+	case RXRPC_SECURITY_YFS_RXGK:</div><div class='add'>+		switch (service_id) {</div><div class='add'>+		case FS_SERVICE:</div><div class='add'>+		case YFS_FS_SERVICE:</div><div class='add'>+			server = (struct afs_server *)peer_data;</div><div class='add'>+			if (!server-&gt;cm_rxgk_appdata.data) {</div><div class='add'>+				mutex_lock(&amp;server-&gt;cm_token_lock);</div><div class='add'>+				if (!server-&gt;cm_rxgk_appdata.data)</div><div class='add'>+					afs_create_yfs_cm_token(challenge, server);</div><div class='add'>+				mutex_unlock(&amp;server-&gt;cm_token_lock);</div><div class='add'>+			}</div><div class='add'>+			if (server-&gt;cm_rxgk_appdata.data)</div><div class='add'>+				appdata = server-&gt;cm_rxgk_appdata;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		return rxgk_kernel_respond_to_challenge(challenge, &amp;appdata);</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+	default:</div><div class='add'>+		return rxrpc_kernel_reject_challenge(challenge, RX_USER_ABORT, -EPROTO,</div><div class='add'>+						     afs_abort_unsupported_sec_class);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Process the OOB message queue, processing challenge packets.</div><div class='add'>+ */</div><div class='add'>+void afs_process_oob_queue(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct afs_net *net = container_of(work, struct afs_net, rx_oob_work);</div><div class='add'>+	struct sk_buff *oob;</div><div class='add'>+	enum rxrpc_oob_type type;</div><div class='add'>+</div><div class='add'>+	while ((oob = rxrpc_kernel_dequeue_oob(net-&gt;socket, &amp;type))) {</div><div class='add'>+		switch (type) {</div><div class='add'>+		case RXRPC_OOB_CHALLENGE:</div><div class='add'>+			afs_respond_to_challenge(oob);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		rxrpc_kernel_free_oob(oob);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_RXGK</div><div class='add'>+/*</div><div class='add'>+ * Create a securities keyring for the cache manager and attach a key to it for</div><div class='add'>+ * the RxGK tokens we want to use to secure the callback connection back from</div><div class='add'>+ * the fileserver.</div><div class='add'>+ */</div><div class='add'>+int afs_create_token_key(struct afs_net *net, struct socket *socket)</div><div class='add'>+{</div><div class='add'>+	const struct krb5_enctype *krb5;</div><div class='add'>+	struct key *ring;</div><div class='add'>+	key_ref_t key;</div><div class='add'>+	char K0[32], *desc;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ring = keyring_alloc("kafs",</div><div class='add'>+			     GLOBAL_ROOT_UID, GLOBAL_ROOT_GID, current_cred(),</div><div class='add'>+			     KEY_POS_SEARCH | KEY_POS_WRITE |</div><div class='add'>+			     KEY_USR_VIEW | KEY_USR_READ | KEY_USR_SEARCH,</div><div class='add'>+			     KEY_ALLOC_NOT_IN_QUOTA,</div><div class='add'>+			     NULL, NULL);</div><div class='add'>+	if (IS_ERR(ring))</div><div class='add'>+		return PTR_ERR(ring);</div><div class='add'>+</div><div class='add'>+	ret = rxrpc_sock_set_security_keyring(socket-&gt;sk, ring);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	ret = -ENOPKG;</div><div class='add'>+	krb5 = crypto_krb5_find_enctype(KRB5_ENCTYPE_AES128_CTS_HMAC_SHA1_96);</div><div class='add'>+	if (!krb5)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	if (WARN_ON_ONCE(krb5-&gt;key_len &gt; sizeof(K0)))</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	ret = -ENOMEM;</div><div class='add'>+	desc = kasprintf(GFP_KERNEL, "%u:%u:%u:%u",</div><div class='add'>+			 YFS_CM_SERVICE, RXRPC_SECURITY_YFS_RXGK, 1, krb5-&gt;etype);</div><div class='add'>+	if (!desc)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	wait_for_random_bytes();</div><div class='add'>+	get_random_bytes(K0, krb5-&gt;key_len);</div><div class='add'>+</div><div class='add'>+	key = key_create(make_key_ref(ring, true),</div><div class='add'>+			 "rxrpc_s", desc,</div><div class='add'>+			 K0, krb5-&gt;key_len,</div><div class='add'>+			 KEY_POS_VIEW | KEY_POS_READ | KEY_POS_SEARCH | KEY_USR_VIEW,</div><div class='add'>+			 KEY_ALLOC_NOT_IN_QUOTA);</div><div class='add'>+	kfree(desc);</div><div class='add'>+	if (IS_ERR(key)) {</div><div class='add'>+		ret = PTR_ERR(key);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	net-&gt;fs_cm_token_key = key_ref_to_ptr(key);</div><div class='add'>+	ret = 0;</div><div class='add'>+out:</div><div class='add'>+	key_put(ring);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Create an YFS RxGK GSS token to use as a ticket to the specified fileserver.</div><div class='add'>+ */</div><div class='add'>+static int afs_create_yfs_cm_token(struct sk_buff *challenge,</div><div class='add'>+				   struct afs_server *server)</div><div class='add'>+{</div><div class='add'>+	const struct krb5_enctype *conn_krb5, *token_krb5;</div><div class='add'>+	const struct krb5_buffer *token_key;</div><div class='add'>+	struct crypto_aead *aead;</div><div class='add'>+	struct scatterlist sg;</div><div class='add'>+	struct afs_net *net = server-&gt;cell-&gt;net;</div><div class='add'>+	const struct key *key = net-&gt;fs_cm_token_key;</div><div class='add'>+	size_t keysize, uuidsize, authsize, toksize, encsize, contsize, adatasize, offset;</div><div class='add'>+	__be32 caps[1] = {</div><div class='add'>+		[0] = htonl(AFS_CAP_ERROR_TRANSLATION),</div><div class='add'>+	};</div><div class='add'>+	__be32 *xdr;</div><div class='add'>+	void *appdata, *K0, *encbase;</div><div class='add'>+	u32 enctype;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (!key)</div><div class='add'>+		return -ENOKEY;</div><div class='add'>+</div><div class='add'>+	/* Assume that the fileserver is happy to use the same encoding type as</div><div class='add'>+	 * we were told to use by the token obtained by the user.</div><div class='add'>+	 */</div><div class='add'>+	enctype = rxgk_kernel_query_challenge(challenge);</div><div class='add'>+</div><div class='add'>+	conn_krb5 = crypto_krb5_find_enctype(enctype);</div><div class='add'>+	if (!conn_krb5)</div><div class='add'>+		return -ENOPKG;</div><div class='add'>+	token_krb5 = key-&gt;payload.data[0];</div><div class='add'>+	token_key = (const struct krb5_buffer *)&amp;key-&gt;payload.data[2];</div><div class='add'>+</div><div class='add'>+	/* struct rxgk_key {</div><div class='add'>+	 *	afs_uint32	enctype;</div><div class='add'>+	 *	opaque		key&lt;&gt;;</div><div class='add'>+	 * };</div><div class='add'>+	 */</div><div class='add'>+	keysize = 4 + xdr_len_object(conn_krb5-&gt;key_len);</div><div class='add'>+</div><div class='add'>+	/* struct RXGK_AuthName {</div><div class='add'>+	 *	afs_int32	kind;</div><div class='add'>+	 *	opaque		data&lt;AUTHDATAMAX&gt;;</div><div class='add'>+	 *	opaque		display&lt;AUTHPRINTABLEMAX&gt;;</div><div class='add'>+	 * };</div><div class='add'>+	 */</div><div class='add'>+	uuidsize = sizeof(server-&gt;uuid);</div><div class='add'>+	authsize = 4 + xdr_len_object(uuidsize) + xdr_len_object(0);</div><div class='add'>+</div><div class='add'>+	/* struct RXGK_Token {</div><div class='add'>+	 *	rxgk_key		K0;</div><div class='add'>+	 *	RXGK_Level		level;</div><div class='add'>+	 *	rxgkTime		starttime;</div><div class='add'>+	 *	afs_int32		lifetime;</div><div class='add'>+	 *	afs_int32		bytelife;</div><div class='add'>+	 *	rxgkTime		expirationtime;</div><div class='add'>+	 *	struct RXGK_AuthName	identities&lt;&gt;;</div><div class='add'>+	 * };</div><div class='add'>+	 */</div><div class='add'>+	toksize = keysize + 8 + 4 + 4 + 8 + xdr_len_object(authsize);</div><div class='add'>+</div><div class='add'>+	offset = 0;</div><div class='add'>+	encsize = crypto_krb5_how_much_buffer(token_krb5, KRB5_ENCRYPT_MODE, toksize, &amp;offset);</div><div class='add'>+</div><div class='add'>+	/* struct RXGK_TokenContainer {</div><div class='add'>+	 *	afs_int32	kvno;</div><div class='add'>+	 *	afs_int32	enctype;</div><div class='add'>+	 *	opaque		encrypted_token&lt;&gt;;</div><div class='add'>+	 * };</div><div class='add'>+	 */</div><div class='add'>+	contsize = 4 + 4 + xdr_len_object(encsize);</div><div class='add'>+</div><div class='add'>+	/* struct YFSAppData {</div><div class='add'>+	 *	opr_uuid	initiatorUuid;</div><div class='add'>+	 *	opr_uuid	acceptorUuid;</div><div class='add'>+	 *	Capabilities	caps;</div><div class='add'>+	 *	afs_int32	enctype;</div><div class='add'>+	 *	opaque		callbackKey&lt;&gt;;</div><div class='add'>+	 *	opaque		callbackToken&lt;&gt;;</div><div class='add'>+	 * };</div><div class='add'>+	 */</div><div class='add'>+	adatasize = 16 + 16 +</div><div class='add'>+		xdr_len_object(sizeof(caps)) +</div><div class='add'>+		4 +</div><div class='add'>+		xdr_len_object(conn_krb5-&gt;key_len) +</div><div class='add'>+		xdr_len_object(contsize);</div><div class='add'>+</div><div class='add'>+	ret = -ENOMEM;</div><div class='add'>+	appdata = kzalloc(adatasize, GFP_KERNEL);</div><div class='add'>+	if (!appdata)</div><div class='add'>+		goto out;</div><div class='add'>+	xdr = appdata;</div><div class='add'>+</div><div class='add'>+	memcpy(xdr, &amp;net-&gt;uuid, 16);		/* appdata.initiatorUuid */</div><div class='add'>+	xdr += 16 / 4;</div><div class='add'>+	memcpy(xdr, &amp;server-&gt;uuid, 16);		/* appdata.acceptorUuid */</div><div class='add'>+	xdr += 16 / 4;</div><div class='add'>+	*xdr++ = htonl(ARRAY_SIZE(caps));	/* appdata.caps.len */</div><div class='add'>+	memcpy(xdr, &amp;caps, sizeof(caps));	/* appdata.caps */</div><div class='add'>+	xdr += ARRAY_SIZE(caps);</div><div class='add'>+	*xdr++ = htonl(conn_krb5-&gt;etype);	/* appdata.enctype */</div><div class='add'>+</div><div class='add'>+	*xdr++ = htonl(conn_krb5-&gt;key_len);	/* appdata.callbackKey.len */</div><div class='add'>+	K0 = xdr;</div><div class='add'>+	get_random_bytes(K0, conn_krb5-&gt;key_len); /* appdata.callbackKey.data */</div><div class='add'>+	xdr += xdr_round_up(conn_krb5-&gt;key_len) / 4;</div><div class='add'>+</div><div class='add'>+	*xdr++ = htonl(contsize);		/* appdata.callbackToken.len */</div><div class='add'>+	*xdr++ = htonl(1);			/* cont.kvno */</div><div class='add'>+	*xdr++ = htonl(token_krb5-&gt;etype);	/* cont.enctype */</div><div class='add'>+	*xdr++ = htonl(encsize);		/* cont.encrypted_token.len */</div><div class='add'>+</div><div class='add'>+	encbase = xdr;</div><div class='add'>+	xdr += offset / 4;</div><div class='add'>+	*xdr++ = htonl(conn_krb5-&gt;etype);	/* token.K0.enctype */</div><div class='add'>+	*xdr++ = htonl(conn_krb5-&gt;key_len);	/* token.K0.key.len */</div><div class='add'>+	memcpy(xdr, K0, conn_krb5-&gt;key_len);	/* token.K0.key.data */</div><div class='add'>+	xdr += xdr_round_up(conn_krb5-&gt;key_len) / 4;</div><div class='add'>+</div><div class='add'>+	*xdr++ = htonl(RXRPC_SECURITY_ENCRYPT);	/* token.level */</div><div class='add'>+	*xdr++ = htonl(0);			/* token.starttime */</div><div class='add'>+	*xdr++ = htonl(0);			/* " */</div><div class='add'>+	*xdr++ = htonl(0);			/* token.lifetime */</div><div class='add'>+	*xdr++ = htonl(0);			/* token.bytelife */</div><div class='add'>+	*xdr++ = htonl(0);			/* token.expirationtime */</div><div class='add'>+	*xdr++ = htonl(0);			/* " */</div><div class='add'>+	*xdr++ = htonl(1);			/* token.identities.count */</div><div class='add'>+	*xdr++ = htonl(0);			/* token.identities[0].kind */</div><div class='add'>+	*xdr++ = htonl(uuidsize);		/* token.identities[0].data.len */</div><div class='add'>+	memcpy(xdr, &amp;server-&gt;uuid, uuidsize);</div><div class='add'>+	xdr += xdr_round_up(uuidsize) / 4;</div><div class='add'>+	*xdr++ = htonl(0);			/* token.identities[0].display.len */</div><div class='add'>+</div><div class='add'>+	xdr = encbase + xdr_round_up(encsize);</div><div class='add'>+</div><div class='add'>+	if ((unsigned long)xdr - (unsigned long)appdata != adatasize)</div><div class='add'>+		pr_err("Appdata size incorrect %lx != %zx\n",</div><div class='add'>+		       (unsigned long)xdr - (unsigned long)appdata, adatasize);</div><div class='add'>+</div><div class='add'>+	aead = crypto_krb5_prepare_encryption(token_krb5, token_key, RXGK_SERVER_ENC_TOKEN,</div><div class='add'>+					      GFP_KERNEL);</div><div class='add'>+	if (IS_ERR(aead)) {</div><div class='add'>+		ret = PTR_ERR(aead);</div><div class='add'>+		goto out_token;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	sg_init_one(&amp;sg, encbase, encsize);</div><div class='add'>+	ret = crypto_krb5_encrypt(token_krb5, aead, &amp;sg, 1, encsize, offset, toksize, false);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out_aead;</div><div class='add'>+</div><div class='add'>+	server-&gt;cm_rxgk_appdata.len  = adatasize;</div><div class='add'>+	server-&gt;cm_rxgk_appdata.data = appdata;</div><div class='add'>+	appdata = NULL;</div><div class='add'>+</div><div class='add'>+out_aead:</div><div class='add'>+	crypto_free_aead(aead);</div><div class='add'>+out_token:</div><div class='add'>+	kfree(appdata);</div><div class='add'>+out:</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+#endif /* CONFIG_RXGK */</div><div class='head'>diff --git a/fs/afs/cmservice.c b/fs/afs/cmservice.c<br/>index a3f5de28be79..1a906805a9e3 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/cmservice.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/cmservice.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/cmservice.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/cmservice.c</a></div><div class='hunk'>@@ -13,6 +13,8 @@</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> #include "afs_cm.h"</div><div class='ctx'> #include "protocol_yfs.h"</div><div class='add'>+#define RXRPC_TRACE_ONLY_DEFINE_ENUMS</div><div class='add'>+#include &lt;trace/events/rxrpc.h&gt;</div><div class='ctx'> </div><div class='ctx'> static int afs_deliver_cb_init_call_back_state(struct afs_call *);</div><div class='ctx'> static int afs_deliver_cb_init_call_back_state3(struct afs_call *);</div><div class='hunk'>@@ -137,48 +139,6 @@ bool afs_cm_incoming_call(struct afs_call *call)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Find the server record by peer address and record a probe to the cache</div><div class='del'>- * manager from a server.</div><div class='del'>- */</div><div class='del'>-static int afs_find_cm_server_by_peer(struct afs_call *call)</div><div class='del'>-{</div><div class='del'>-	struct sockaddr_rxrpc srx;</div><div class='del'>-	struct afs_server *server;</div><div class='del'>-</div><div class='del'>-	rxrpc_kernel_get_peer(call-&gt;net-&gt;socket, call-&gt;rxcall, &amp;srx);</div><div class='del'>-</div><div class='del'>-	server = afs_find_server(call-&gt;net, &amp;srx);</div><div class='del'>-	if (!server) {</div><div class='del'>-		trace_afs_cm_no_server(call, &amp;srx);</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	call-&gt;server = server;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Find the server record by server UUID and record a probe to the cache</div><div class='del'>- * manager from a server.</div><div class='del'>- */</div><div class='del'>-static int afs_find_cm_server_by_uuid(struct afs_call *call,</div><div class='del'>-				      struct afs_uuid *uuid)</div><div class='del'>-{</div><div class='del'>-	struct afs_server *server;</div><div class='del'>-</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	server = afs_find_server_by_uuid(call-&gt;net, call-&gt;request);</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-	if (!server) {</div><div class='del'>-		trace_afs_cm_no_server_u(call, call-&gt;request);</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	call-&gt;server = server;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * Clean up a cache manager call.</div><div class='ctx'>  */</div><div class='ctx'> static void afs_cm_destructor(struct afs_call *call)</div><div class='hunk'>@@ -191,7 +151,7 @@ static void afs_cm_destructor(struct afs_call *call)</div><div class='ctx'>  * Abort a service call from within an action function.</div><div class='ctx'>  */</div><div class='ctx'> static void afs_abort_service_call(struct afs_call *call, u32 abort_code, int error,</div><div class='del'>-				   const char *why)</div><div class='add'>+				   enum rxrpc_abort_reason why)</div><div class='ctx'> {</div><div class='ctx'> 	rxrpc_kernel_abort_call(call-&gt;net-&gt;socket, call-&gt;rxcall,</div><div class='ctx'> 				abort_code, error, why);</div><div class='hunk'>@@ -212,8 +172,8 @@ static void SRXAFSCB_CallBack(struct work_struct *work)</div><div class='ctx'> 	 * to maintain cache coherency.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (call-&gt;server) {</div><div class='del'>-		trace_afs_server(call-&gt;server,</div><div class='del'>-				 atomic_read(&amp;call-&gt;server-&gt;ref),</div><div class='add'>+		trace_afs_server(call-&gt;server-&gt;debug_id,</div><div class='add'>+				 refcount_read(&amp;call-&gt;server-&gt;ref),</div><div class='ctx'> 				 atomic_read(&amp;call-&gt;server-&gt;active),</div><div class='ctx'> 				 afs_server_trace_callback);</div><div class='ctx'> 		afs_break_callbacks(call-&gt;server, call-&gt;count, call-&gt;request);</div><div class='hunk'>@@ -298,7 +258,7 @@ static int afs_deliver_cb_callback(struct afs_call *call)</div><div class='ctx'> 		if (call-&gt;count2 != call-&gt;count &amp;&amp; call-&gt;count2 != 0)</div><div class='ctx'> 			return afs_protocol_error(call, afs_eproto_cb_count);</div><div class='ctx'> 		call-&gt;iter = &amp;call-&gt;def_iter;</div><div class='del'>-		iov_iter_discard(&amp;call-&gt;def_iter, READ, call-&gt;count2 * 3 * 4);</div><div class='add'>+		iov_iter_discard(&amp;call-&gt;def_iter, ITER_DEST, call-&gt;count2 * 3 * 4);</div><div class='ctx'> 		call-&gt;unmarshall++;</div><div class='ctx'> </div><div class='ctx'> 		fallthrough;</div><div class='hunk'>@@ -319,10 +279,7 @@ static int afs_deliver_cb_callback(struct afs_call *call)</div><div class='ctx'> </div><div class='ctx'> 	if (!afs_check_call_state(call, AFS_CALL_SV_REPLYING))</div><div class='ctx'> 		return afs_io_error(call, afs_io_error_cm_reply);</div><div class='del'>-</div><div class='del'>-	/* we'll need the file server record as that tells us which set of</div><div class='del'>-	 * vnodes to operate upon */</div><div class='del'>-	return afs_find_cm_server_by_peer(call);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -346,18 +303,10 @@ static void SRXAFSCB_InitCallBackState(struct work_struct *work)</div><div class='ctx'>  */</div><div class='ctx'> static int afs_deliver_cb_init_call_back_state(struct afs_call *call)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='ctx'> 	_enter("");</div><div class='ctx'> </div><div class='ctx'> 	afs_extract_discard(call, 0);</div><div class='del'>-	ret = afs_extract_data(call, false);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	/* we'll need the file server record as that tells us which set of</div><div class='del'>-	 * vnodes to operate upon */</div><div class='del'>-	return afs_find_cm_server_by_peer(call);</div><div class='add'>+	return afs_extract_data(call, false);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -370,8 +319,6 @@ static int afs_deliver_cb_init_call_back_state3(struct afs_call *call)</div><div class='ctx'> 	__be32 *b;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	_enter("");</div><div class='del'>-</div><div class='ctx'> 	_enter("{%u}", call-&gt;unmarshall);</div><div class='ctx'> </div><div class='ctx'> 	switch (call-&gt;unmarshall) {</div><div class='hunk'>@@ -418,9 +365,13 @@ static int afs_deliver_cb_init_call_back_state3(struct afs_call *call)</div><div class='ctx'> 	if (!afs_check_call_state(call, AFS_CALL_SV_REPLYING))</div><div class='ctx'> 		return afs_io_error(call, afs_io_error_cm_reply);</div><div class='ctx'> </div><div class='del'>-	/* we'll need the file server record as that tells us which set of</div><div class='del'>-	 * vnodes to operate upon */</div><div class='del'>-	return afs_find_cm_server_by_uuid(call, call-&gt;request);</div><div class='add'>+	if (memcmp(call-&gt;request, &amp;call-&gt;server-&gt;_uuid, sizeof(call-&gt;server-&gt;_uuid)) != 0) {</div><div class='add'>+		pr_notice("Callback UUID does not match fileserver UUID\n");</div><div class='add'>+		trace_afs_cm_no_server_u(call, call-&gt;request);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -452,7 +403,7 @@ static int afs_deliver_cb_probe(struct afs_call *call)</div><div class='ctx'> </div><div class='ctx'> 	if (!afs_check_call_state(call, AFS_CALL_SV_REPLYING))</div><div class='ctx'> 		return afs_io_error(call, afs_io_error_cm_reply);</div><div class='del'>-	return afs_find_cm_server_by_peer(call);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -469,7 +420,7 @@ static void SRXAFSCB_ProbeUuid(struct work_struct *work)</div><div class='ctx'> 	if (memcmp(r, &amp;call-&gt;net-&gt;uuid, sizeof(call-&gt;net-&gt;uuid)) == 0)</div><div class='ctx'> 		afs_send_empty_reply(call);</div><div class='ctx'> 	else</div><div class='del'>-		afs_abort_service_call(call, 1, 1, "K-1");</div><div class='add'>+		afs_abort_service_call(call, 1, 1, afs_abort_probeuuid_negative);</div><div class='ctx'> </div><div class='ctx'> 	afs_put_call(call);</div><div class='ctx'> 	_leave("");</div><div class='hunk'>@@ -530,7 +481,7 @@ static int afs_deliver_cb_probe_uuid(struct afs_call *call)</div><div class='ctx'> </div><div class='ctx'> 	if (!afs_check_call_state(call, AFS_CALL_SV_REPLYING))</div><div class='ctx'> 		return afs_io_error(call, afs_io_error_cm_reply);</div><div class='del'>-	return afs_find_cm_server_by_peer(call);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -590,7 +541,7 @@ static int afs_deliver_cb_tell_me_about_yourself(struct afs_call *call)</div><div class='ctx'> </div><div class='ctx'> 	if (!afs_check_call_state(call, AFS_CALL_SV_REPLYING))</div><div class='ctx'> 		return afs_io_error(call, afs_io_error_cm_reply);</div><div class='del'>-	return afs_find_cm_server_by_peer(call);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -664,9 +615,5 @@ static int afs_deliver_yfs_cb_callback(struct afs_call *call)</div><div class='ctx'> </div><div class='ctx'> 	if (!afs_check_call_state(call, AFS_CALL_SV_REPLYING))</div><div class='ctx'> 		return afs_io_error(call, afs_io_error_cm_reply);</div><div class='del'>-</div><div class='del'>-	/* We'll need the file server record as that tells us which set of</div><div class='del'>-	 * vnodes to operate upon.</div><div class='del'>-	 */</div><div class='del'>-	return afs_find_cm_server_by_peer(call);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/afs/dir.c b/fs/afs/dir.c<br/>index da9b4f8577a1..f4e9e12373ac 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/dir.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/dir.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/dir.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/dir.c</a></div><div class='hunk'>@@ -12,6 +12,8 @@</div><div class='ctx'> #include &lt;linux/swap.h&gt;</div><div class='ctx'> #include &lt;linux/ctype.h&gt;</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='add'>+#include &lt;linux/iversion.h&gt;</div><div class='add'>+#include &lt;linux/iov_iter.h&gt;</div><div class='ctx'> #include &lt;linux/task_io_accounting_ops.h&gt;</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> #include "afs_fs.h"</div><div class='hunk'>@@ -21,34 +23,27 @@ static struct dentry *afs_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 				 unsigned int flags);</div><div class='ctx'> static int afs_dir_open(struct inode *inode, struct file *file);</div><div class='ctx'> static int afs_readdir(struct file *file, struct dir_context *ctx);</div><div class='del'>-static int afs_d_revalidate(struct dentry *dentry, unsigned int flags);</div><div class='add'>+static int afs_d_revalidate(struct inode *dir, const struct qstr *name,</div><div class='add'>+			    struct dentry *dentry, unsigned int flags);</div><div class='ctx'> static int afs_d_delete(const struct dentry *dentry);</div><div class='ctx'> static void afs_d_iput(struct dentry *dentry, struct inode *inode);</div><div class='del'>-static int afs_lookup_one_filldir(struct dir_context *ctx, const char *name, int nlen,</div><div class='add'>+static bool afs_lookup_one_filldir(struct dir_context *ctx, const char *name, int nlen,</div><div class='ctx'> 				  loff_t fpos, u64 ino, unsigned dtype);</div><div class='del'>-static int afs_lookup_filldir(struct dir_context *ctx, const char *name, int nlen,</div><div class='add'>+static bool afs_lookup_filldir(struct dir_context *ctx, const char *name, int nlen,</div><div class='ctx'> 			      loff_t fpos, u64 ino, unsigned dtype);</div><div class='del'>-static int afs_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int afs_create(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		      struct dentry *dentry, umode_t mode, bool excl);</div><div class='del'>-static int afs_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-		     struct dentry *dentry, umode_t mode);</div><div class='add'>+static struct dentry *afs_mkdir(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+				struct dentry *dentry, umode_t mode);</div><div class='ctx'> static int afs_rmdir(struct inode *dir, struct dentry *dentry);</div><div class='ctx'> static int afs_unlink(struct inode *dir, struct dentry *dentry);</div><div class='ctx'> static int afs_link(struct dentry *from, struct inode *dir,</div><div class='ctx'> 		    struct dentry *dentry);</div><div class='del'>-static int afs_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int afs_symlink(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		       struct dentry *dentry, const char *content);</div><div class='del'>-static int afs_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='add'>+static int afs_rename(struct mnt_idmap *idmap, struct inode *old_dir,</div><div class='ctx'> 		      struct dentry *old_dentry, struct inode *new_dir,</div><div class='ctx'> 		      struct dentry *new_dentry, unsigned int flags);</div><div class='del'>-static int afs_dir_releasepage(struct page *page, gfp_t gfp_flags);</div><div class='del'>-static void afs_dir_invalidatepage(struct page *page, unsigned int offset,</div><div class='del'>-				   unsigned int length);</div><div class='del'>-</div><div class='del'>-static int afs_dir_set_page_dirty(struct page *page)</div><div class='del'>-{</div><div class='del'>-	BUG(); /* This should never happen. */</div><div class='del'>-}</div><div class='ctx'> </div><div class='ctx'> const struct file_operations afs_dir_file_operations = {</div><div class='ctx'> 	.open		= afs_dir_open,</div><div class='hunk'>@@ -73,9 +68,7 @@ const struct inode_operations afs_dir_inode_operations = {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations afs_dir_aops = {</div><div class='del'>-	.set_page_dirty	= afs_dir_set_page_dirty,</div><div class='del'>-	.releasepage	= afs_dir_releasepage,</div><div class='del'>-	.invalidatepage	= afs_dir_invalidatepage,</div><div class='add'>+	.writepages	= afs_single_writepages,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct dentry_operations afs_fs_dentry_operations = {</div><div class='hunk'>@@ -96,152 +89,124 @@ struct afs_lookup_one_cookie {</div><div class='ctx'> struct afs_lookup_cookie {</div><div class='ctx'> 	struct dir_context	ctx;</div><div class='ctx'> 	struct qstr		name;</div><div class='del'>-	bool			found;</div><div class='del'>-	bool			one_only;</div><div class='ctx'> 	unsigned short		nr_fids;</div><div class='ctx'> 	struct afs_fid		fids[50];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+static void afs_dir_unuse_cookie(struct afs_vnode *dvnode, int ret)</div><div class='add'>+{</div><div class='add'>+	if (ret == 0) {</div><div class='add'>+		struct afs_vnode_cache_aux aux;</div><div class='add'>+		loff_t i_size = i_size_read(&amp;dvnode-&gt;netfs.inode);</div><div class='add'>+</div><div class='add'>+		afs_set_cache_aux(dvnode, &amp;aux);</div><div class='add'>+		fscache_unuse_cookie(afs_vnode_cache(dvnode), &amp;aux, &amp;i_size);</div><div class='add'>+	} else {</div><div class='add'>+		fscache_unuse_cookie(afs_vnode_cache(dvnode), NULL, NULL);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='del'>- * Drop the refs that we're holding on the folios we were reading into.  We've</div><div class='del'>- * got refs on the first nr_pages pages.</div><div class='add'>+ * Iterate through a kmapped directory segment, dumping a summary of</div><div class='add'>+ * the contents.</div><div class='ctx'>  */</div><div class='del'>-static void afs_dir_read_cleanup(struct afs_read *req)</div><div class='add'>+static size_t afs_dir_dump_step(void *iter_base, size_t progress, size_t len,</div><div class='add'>+				void *priv, void *priv2)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *mapping = req-&gt;vnode-&gt;vfs_inode.i_mapping;</div><div class='del'>-	struct folio *folio;</div><div class='del'>-	pgoff_t last = req-&gt;nr_pages - 1;</div><div class='add'>+	do {</div><div class='add'>+		union afs_xdr_dir_block *block = iter_base;</div><div class='ctx'> </div><div class='del'>-	XA_STATE(xas, &amp;mapping-&gt;i_pages, 0);</div><div class='add'>+		pr_warn("[%05zx] %32phN\n", progress, block);</div><div class='add'>+		iter_base += AFS_DIR_BLOCK_SIZE;</div><div class='add'>+		progress += AFS_DIR_BLOCK_SIZE;</div><div class='add'>+		len -= AFS_DIR_BLOCK_SIZE;</div><div class='add'>+	} while (len &gt; 0);</div><div class='ctx'> </div><div class='del'>-	if (unlikely(!req-&gt;nr_pages))</div><div class='del'>-		return;</div><div class='add'>+	return len;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	xas_for_each(&amp;xas, folio, last) {</div><div class='del'>-		if (xas_retry(&amp;xas, folio))</div><div class='del'>-			continue;</div><div class='del'>-		BUG_ON(xa_is_value(folio));</div><div class='del'>-		ASSERTCMP(folio_file_mapping(folio), ==, mapping);</div><div class='add'>+/*</div><div class='add'>+ * Dump the contents of a directory.</div><div class='add'>+ */</div><div class='add'>+static void afs_dir_dump(struct afs_vnode *dvnode)</div><div class='add'>+{</div><div class='add'>+	struct iov_iter iter;</div><div class='add'>+	unsigned long long i_size = i_size_read(&amp;dvnode-&gt;netfs.inode);</div><div class='ctx'> </div><div class='del'>-		folio_put(folio);</div><div class='del'>-	}</div><div class='add'>+	pr_warn("DIR %llx:%llx is=%llx\n",</div><div class='add'>+		dvnode-&gt;fid.vid, dvnode-&gt;fid.vnode, i_size);</div><div class='ctx'> </div><div class='del'>-	rcu_read_unlock();</div><div class='add'>+	iov_iter_folio_queue(&amp;iter, ITER_SOURCE, dvnode-&gt;directory, 0, 0, i_size);</div><div class='add'>+	iterate_folioq(&amp;iter, iov_iter_count(&amp;iter), NULL, NULL,</div><div class='add'>+		       afs_dir_dump_step);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * check that a directory folio is valid</div><div class='ctx'>  */</div><div class='del'>-static bool afs_dir_check_folio(struct afs_vnode *dvnode, struct folio *folio,</div><div class='del'>-				loff_t i_size)</div><div class='add'>+static bool afs_dir_check_block(struct afs_vnode *dvnode, size_t progress,</div><div class='add'>+				union afs_xdr_dir_block *block)</div><div class='ctx'> {</div><div class='del'>-	union afs_xdr_dir_block *block;</div><div class='del'>-	size_t offset, size;</div><div class='del'>-	loff_t pos;</div><div class='add'>+	if (block-&gt;hdr.magic != AFS_DIR_MAGIC) {</div><div class='add'>+		pr_warn("%s(%lx): [%zx] bad magic %04x\n",</div><div class='add'>+		       __func__, dvnode-&gt;netfs.inode.i_ino,</div><div class='add'>+		       progress, ntohs(block-&gt;hdr.magic));</div><div class='add'>+		trace_afs_dir_check_failed(dvnode, progress);</div><div class='add'>+		trace_afs_file_error(dvnode, -EIO, afs_file_error_dir_bad_magic);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	/* Determine how many magic numbers there should be in this folio, but</div><div class='del'>-	 * we must take care because the directory may change size under us.</div><div class='add'>+	/* Make sure each block is NUL terminated so we can reasonably</div><div class='add'>+	 * use string functions on it.  The filenames in the folio</div><div class='add'>+	 * *should* be NUL-terminated anyway.</div><div class='ctx'> 	 */</div><div class='del'>-	pos = folio_pos(folio);</div><div class='del'>-	if (i_size &lt;= pos)</div><div class='del'>-		goto checked;</div><div class='del'>-</div><div class='del'>-	size = min_t(loff_t, folio_size(folio), i_size - pos);</div><div class='del'>-	for (offset = 0; offset &lt; size; offset += sizeof(*block)) {</div><div class='del'>-		block = kmap_local_folio(folio, offset);</div><div class='del'>-		if (block-&gt;hdr.magic != AFS_DIR_MAGIC) {</div><div class='del'>-			printk("kAFS: %s(%lx): [%llx] bad magic %zx/%zx is %04hx\n",</div><div class='del'>-			       __func__, dvnode-&gt;vfs_inode.i_ino,</div><div class='del'>-			       pos, offset, size, ntohs(block-&gt;hdr.magic));</div><div class='del'>-			trace_afs_dir_check_failed(dvnode, pos + offset, i_size);</div><div class='del'>-			kunmap_local(block);</div><div class='del'>-			trace_afs_file_error(dvnode, -EIO, afs_file_error_dir_bad_magic);</div><div class='del'>-			goto error;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/* Make sure each block is NUL terminated so we can reasonably</div><div class='del'>-		 * use string functions on it.  The filenames in the folio</div><div class='del'>-		 * *should* be NUL-terminated anyway.</div><div class='del'>-		 */</div><div class='del'>-		((u8 *)block)[AFS_DIR_BLOCK_SIZE - 1] = 0;</div><div class='del'>-</div><div class='del'>-		kunmap_local(block);</div><div class='del'>-	}</div><div class='del'>-checked:</div><div class='add'>+	((u8 *)block)[AFS_DIR_BLOCK_SIZE - 1] = 0;</div><div class='ctx'> 	afs_stat_v(dvnode, n_read_dir);</div><div class='ctx'> 	return true;</div><div class='del'>-</div><div class='del'>-error:</div><div class='del'>-	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Dump the contents of a directory.</div><div class='add'>+ * Iterate through a kmapped directory segment, checking the content.</div><div class='ctx'>  */</div><div class='del'>-static void afs_dir_dump(struct afs_vnode *dvnode, struct afs_read *req)</div><div class='add'>+static size_t afs_dir_check_step(void *iter_base, size_t progress, size_t len,</div><div class='add'>+				 void *priv, void *priv2)</div><div class='ctx'> {</div><div class='del'>-	union afs_xdr_dir_block *block;</div><div class='del'>-	struct address_space *mapping = dvnode-&gt;vfs_inode.i_mapping;</div><div class='del'>-	struct folio *folio;</div><div class='del'>-	pgoff_t last = req-&gt;nr_pages - 1;</div><div class='del'>-	size_t offset, size;</div><div class='del'>-</div><div class='del'>-	XA_STATE(xas, &amp;mapping-&gt;i_pages, 0);</div><div class='del'>-</div><div class='del'>-	pr_warn("DIR %llx:%llx f=%llx l=%llx al=%llx\n",</div><div class='del'>-		dvnode-&gt;fid.vid, dvnode-&gt;fid.vnode,</div><div class='del'>-		req-&gt;file_size, req-&gt;len, req-&gt;actual_len);</div><div class='del'>-	pr_warn("DIR %llx %x %zx %zx\n",</div><div class='del'>-		req-&gt;pos, req-&gt;nr_pages,</div><div class='del'>-		req-&gt;iter-&gt;iov_offset,  iov_iter_count(req-&gt;iter));</div><div class='del'>-</div><div class='del'>-	xas_for_each(&amp;xas, folio, last) {</div><div class='del'>-		if (xas_retry(&amp;xas, folio))</div><div class='del'>-			continue;</div><div class='add'>+	struct afs_vnode *dvnode = priv;</div><div class='ctx'> </div><div class='del'>-		BUG_ON(folio_file_mapping(folio) != mapping);</div><div class='add'>+	if (WARN_ON_ONCE(progress % AFS_DIR_BLOCK_SIZE ||</div><div class='add'>+			 len % AFS_DIR_BLOCK_SIZE))</div><div class='add'>+		return len;</div><div class='ctx'> </div><div class='del'>-		size = min_t(loff_t, folio_size(folio), req-&gt;actual_len - folio_pos(folio));</div><div class='del'>-		for (offset = 0; offset &lt; size; offset += sizeof(*block)) {</div><div class='del'>-			block = kmap_local_folio(folio, offset);</div><div class='del'>-			pr_warn("[%02lx] %32phN\n", folio_index(folio) + offset, block);</div><div class='del'>-			kunmap_local(block);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	do {</div><div class='add'>+		if (!afs_dir_check_block(dvnode, progress, iter_base))</div><div class='add'>+			break;</div><div class='add'>+		iter_base += AFS_DIR_BLOCK_SIZE;</div><div class='add'>+		len -= AFS_DIR_BLOCK_SIZE;</div><div class='add'>+	} while (len &gt; 0);</div><div class='add'>+</div><div class='add'>+	return len;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Check all the blocks in a directory.  All the folios are held pinned.</div><div class='add'>+ * Check all the blocks in a directory.</div><div class='ctx'>  */</div><div class='del'>-static int afs_dir_check(struct afs_vnode *dvnode, struct afs_read *req)</div><div class='add'>+static int afs_dir_check(struct afs_vnode *dvnode)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *mapping = dvnode-&gt;vfs_inode.i_mapping;</div><div class='del'>-	struct folio *folio;</div><div class='del'>-	pgoff_t last = req-&gt;nr_pages - 1;</div><div class='del'>-	int ret = 0;</div><div class='add'>+	struct iov_iter iter;</div><div class='add'>+	unsigned long long i_size = i_size_read(&amp;dvnode-&gt;netfs.inode);</div><div class='add'>+	size_t checked = 0;</div><div class='ctx'> </div><div class='del'>-	XA_STATE(xas, &amp;mapping-&gt;i_pages, 0);</div><div class='del'>-</div><div class='del'>-	if (unlikely(!req-&gt;nr_pages))</div><div class='add'>+	if (unlikely(!i_size))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	xas_for_each(&amp;xas, folio, last) {</div><div class='del'>-		if (xas_retry(&amp;xas, folio))</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		BUG_ON(folio_file_mapping(folio) != mapping);</div><div class='del'>-</div><div class='del'>-		if (!afs_dir_check_folio(dvnode, folio, req-&gt;actual_len)) {</div><div class='del'>-			afs_dir_dump(dvnode, req);</div><div class='del'>-			ret = -EIO;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='add'>+	iov_iter_folio_queue(&amp;iter, ITER_SOURCE, dvnode-&gt;directory, 0, 0, i_size);</div><div class='add'>+	checked = iterate_folioq(&amp;iter, iov_iter_count(&amp;iter), dvnode, NULL,</div><div class='add'>+				 afs_dir_check_step);</div><div class='add'>+	if (checked != i_size) {</div><div class='add'>+		afs_dir_dump(dvnode);</div><div class='add'>+		return -EIO;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -261,130 +226,140 @@ static int afs_dir_open(struct inode *inode, struct file *file)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Read the directory into the pagecache in one go, scrubbing the previous</div><div class='del'>- * contents.  The list of folios is returned, pinning them so that they don't</div><div class='del'>- * get reclaimed during the iteration.</div><div class='add'>+ * Read a file in a single download.</div><div class='ctx'>  */</div><div class='del'>-static struct afs_read *afs_read_dir(struct afs_vnode *dvnode, struct key *key)</div><div class='del'>-	__acquires(&amp;dvnode-&gt;validate_lock)</div><div class='add'>+static ssize_t afs_do_read_single(struct afs_vnode *dvnode, struct file *file)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *mapping = dvnode-&gt;vfs_inode.i_mapping;</div><div class='del'>-	struct afs_read *req;</div><div class='add'>+	struct iov_iter iter;</div><div class='add'>+	ssize_t ret;</div><div class='ctx'> 	loff_t i_size;</div><div class='del'>-	int nr_pages, i;</div><div class='del'>-	int ret;</div><div class='add'>+	bool is_dir = (S_ISDIR(dvnode-&gt;netfs.inode.i_mode) &amp;&amp;</div><div class='add'>+		       !test_bit(AFS_VNODE_MOUNTPOINT, &amp;dvnode-&gt;flags));</div><div class='add'>+</div><div class='add'>+	i_size = i_size_read(&amp;dvnode-&gt;netfs.inode);</div><div class='add'>+	if (is_dir) {</div><div class='add'>+		if (i_size &lt; AFS_DIR_BLOCK_SIZE)</div><div class='add'>+			return afs_bad(dvnode, afs_file_error_dir_small);</div><div class='add'>+		if (i_size &gt; AFS_DIR_BLOCK_SIZE * 1024) {</div><div class='add'>+			trace_afs_file_error(dvnode, -EFBIG, afs_file_error_dir_big);</div><div class='add'>+			return -EFBIG;</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		if (i_size &gt; AFSPATHMAX) {</div><div class='add'>+			trace_afs_file_error(dvnode, -EFBIG, afs_file_error_dir_big);</div><div class='add'>+			return -EFBIG;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	_enter("");</div><div class='add'>+	/* Expand the storage.  TODO: Shrink the storage too. */</div><div class='add'>+	if (dvnode-&gt;directory_size &lt; i_size) {</div><div class='add'>+		size_t cur_size = dvnode-&gt;directory_size;</div><div class='ctx'> </div><div class='del'>-	req = kzalloc(sizeof(*req), GFP_KERNEL);</div><div class='del'>-	if (!req)</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='add'>+		ret = netfs_alloc_folioq_buffer(NULL,</div><div class='add'>+						&amp;dvnode-&gt;directory, &amp;cur_size, i_size,</div><div class='add'>+						mapping_gfp_mask(dvnode-&gt;netfs.inode.i_mapping));</div><div class='add'>+		dvnode-&gt;directory_size = cur_size;</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	refcount_set(&amp;req-&gt;usage, 1);</div><div class='del'>-	req-&gt;vnode = dvnode;</div><div class='del'>-	req-&gt;key = key_get(key);</div><div class='del'>-	req-&gt;cleanup = afs_dir_read_cleanup;</div><div class='add'>+	iov_iter_folio_queue(&amp;iter, ITER_DEST, dvnode-&gt;directory, 0, 0, dvnode-&gt;directory_size);</div><div class='ctx'> </div><div class='del'>-expand:</div><div class='del'>-	i_size = i_size_read(&amp;dvnode-&gt;vfs_inode);</div><div class='del'>-	if (i_size &lt; 2048) {</div><div class='del'>-		ret = afs_bad(dvnode, afs_file_error_dir_small);</div><div class='del'>-		goto error;</div><div class='del'>-	}</div><div class='del'>-	if (i_size &gt; 2048 * 1024) {</div><div class='del'>-		trace_afs_file_error(dvnode, -EFBIG, afs_file_error_dir_big);</div><div class='del'>-		ret = -EFBIG;</div><div class='del'>-		goto error;</div><div class='add'>+	/* AFS requires us to perform the read of a directory synchronously as</div><div class='add'>+	 * a single unit to avoid issues with the directory contents being</div><div class='add'>+	 * changed between reads.</div><div class='add'>+	 */</div><div class='add'>+	ret = netfs_read_single(&amp;dvnode-&gt;netfs.inode, file, &amp;iter);</div><div class='add'>+	if (ret &gt;= 0) {</div><div class='add'>+		i_size = i_size_read(&amp;dvnode-&gt;netfs.inode);</div><div class='add'>+		if (i_size &gt; ret) {</div><div class='add'>+			/* The content has grown, so we need to expand the</div><div class='add'>+			 * buffer.</div><div class='add'>+			 */</div><div class='add'>+			ret = -ESTALE;</div><div class='add'>+		} else if (is_dir) {</div><div class='add'>+			int ret2 = afs_dir_check(dvnode);</div><div class='add'>+</div><div class='add'>+			if (ret2 &lt; 0)</div><div class='add'>+				ret = ret2;</div><div class='add'>+		} else if (i_size &lt; folioq_folio_size(dvnode-&gt;directory, 0)) {</div><div class='add'>+			/* NUL-terminate a symlink. */</div><div class='add'>+			char *symlink = kmap_local_folio(folioq_folio(dvnode-&gt;directory, 0), 0);</div><div class='add'>+</div><div class='add'>+			symlink[i_size] = 0;</div><div class='add'>+			kunmap_local(symlink);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	_enter("%llu", i_size);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	nr_pages = (i_size + PAGE_SIZE - 1) / PAGE_SIZE;</div><div class='add'>+ssize_t afs_read_single(struct afs_vnode *dvnode, struct file *file)</div><div class='add'>+{</div><div class='add'>+	ssize_t ret;</div><div class='ctx'> </div><div class='del'>-	req-&gt;actual_len = i_size; /* May change */</div><div class='del'>-	req-&gt;len = nr_pages * PAGE_SIZE; /* We can ask for more than there is */</div><div class='del'>-	req-&gt;data_version = dvnode-&gt;status.data_version; /* May change */</div><div class='del'>-	iov_iter_xarray(&amp;req-&gt;def_iter, READ, &amp;dvnode-&gt;vfs_inode.i_mapping-&gt;i_pages,</div><div class='del'>-			0, i_size);</div><div class='del'>-	req-&gt;iter = &amp;req-&gt;def_iter;</div><div class='add'>+	fscache_use_cookie(afs_vnode_cache(dvnode), false);</div><div class='add'>+	ret = afs_do_read_single(dvnode, file);</div><div class='add'>+	fscache_unuse_cookie(afs_vnode_cache(dvnode), NULL, NULL);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	/* Fill in any gaps that we might find where the memory reclaimer has</div><div class='del'>-	 * been at work and pin all the folios.  If there are any gaps, we will</div><div class='del'>-	 * need to reread the entire directory contents.</div><div class='del'>-	 */</div><div class='del'>-	i = req-&gt;nr_pages;</div><div class='del'>-	while (i &lt; nr_pages) {</div><div class='del'>-		struct folio *folio;</div><div class='del'>-</div><div class='del'>-		folio = filemap_get_folio(mapping, i);</div><div class='del'>-		if (!folio) {</div><div class='del'>-			if (test_and_clear_bit(AFS_VNODE_DIR_VALID, &amp;dvnode-&gt;flags))</div><div class='del'>-				afs_stat_v(dvnode, n_inval);</div><div class='del'>-</div><div class='del'>-			ret = -ENOMEM;</div><div class='del'>-			folio = __filemap_get_folio(mapping,</div><div class='del'>-						    i, FGP_LOCK | FGP_CREAT,</div><div class='del'>-						    mapping-&gt;gfp_mask);</div><div class='del'>-			if (!folio)</div><div class='del'>-				goto error;</div><div class='del'>-			folio_attach_private(folio, (void *)1);</div><div class='del'>-			folio_unlock(folio);</div><div class='del'>-		}</div><div class='add'>+/*</div><div class='add'>+ * Read the directory into a folio_queue buffer in one go, scrubbing the</div><div class='add'>+ * previous contents.  We return -ESTALE if the caller needs to call us again.</div><div class='add'>+ */</div><div class='add'>+ssize_t afs_read_dir(struct afs_vnode *dvnode, struct file *file)</div><div class='add'>+	__acquires(&amp;dvnode-&gt;validate_lock)</div><div class='add'>+{</div><div class='add'>+	ssize_t ret;</div><div class='add'>+	loff_t i_size;</div><div class='ctx'> </div><div class='del'>-		req-&gt;nr_pages += folio_nr_pages(folio);</div><div class='del'>-		i += folio_nr_pages(folio);</div><div class='del'>-	}</div><div class='add'>+	i_size = i_size_read(&amp;dvnode-&gt;netfs.inode);</div><div class='ctx'> </div><div class='del'>-	/* If we're going to reload, we need to lock all the pages to prevent</div><div class='del'>-	 * races.</div><div class='del'>-	 */</div><div class='ctx'> 	ret = -ERESTARTSYS;</div><div class='ctx'> 	if (down_read_killable(&amp;dvnode-&gt;validate_lock) &lt; 0)</div><div class='ctx'> 		goto error;</div><div class='ctx'> </div><div class='del'>-	if (test_bit(AFS_VNODE_DIR_VALID, &amp;dvnode-&gt;flags))</div><div class='del'>-		goto success;</div><div class='add'>+	/* We only need to reread the data if it became invalid - or if we</div><div class='add'>+	 * haven't read it yet.</div><div class='add'>+	 */</div><div class='add'>+	if (test_bit(AFS_VNODE_DIR_VALID, &amp;dvnode-&gt;flags) &amp;&amp;</div><div class='add'>+	    test_bit(AFS_VNODE_DIR_READ, &amp;dvnode-&gt;flags)) {</div><div class='add'>+		ret = i_size;</div><div class='add'>+		goto valid;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	up_read(&amp;dvnode-&gt;validate_lock);</div><div class='ctx'> 	if (down_write_killable(&amp;dvnode-&gt;validate_lock) &lt; 0)</div><div class='ctx'> 		goto error;</div><div class='ctx'> </div><div class='del'>-	if (!test_bit(AFS_VNODE_DIR_VALID, &amp;dvnode-&gt;flags)) {</div><div class='del'>-		trace_afs_reload_dir(dvnode);</div><div class='del'>-		ret = afs_fetch_data(dvnode, req);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			goto error_unlock;</div><div class='del'>-</div><div class='del'>-		task_io_account_read(PAGE_SIZE * req-&gt;nr_pages);</div><div class='add'>+	if (!test_bit(AFS_VNODE_DIR_VALID, &amp;dvnode-&gt;flags))</div><div class='add'>+		afs_invalidate_cache(dvnode, 0);</div><div class='ctx'> </div><div class='del'>-		if (req-&gt;len &lt; req-&gt;file_size) {</div><div class='del'>-			/* The content has grown, so we need to expand the</div><div class='del'>-			 * buffer.</div><div class='del'>-			 */</div><div class='del'>-			up_write(&amp;dvnode-&gt;validate_lock);</div><div class='del'>-			goto expand;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/* Validate the data we just read. */</div><div class='del'>-		ret = afs_dir_check(dvnode, req);</div><div class='add'>+	if (!test_bit(AFS_VNODE_DIR_VALID, &amp;dvnode-&gt;flags) ||</div><div class='add'>+	    !test_bit(AFS_VNODE_DIR_READ, &amp;dvnode-&gt;flags)) {</div><div class='add'>+		trace_afs_reload_dir(dvnode);</div><div class='add'>+		ret = afs_read_single(dvnode, file);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto error_unlock;</div><div class='ctx'> </div><div class='ctx'> 		// TODO: Trim excess pages</div><div class='ctx'> </div><div class='ctx'> 		set_bit(AFS_VNODE_DIR_VALID, &amp;dvnode-&gt;flags);</div><div class='add'>+		set_bit(AFS_VNODE_DIR_READ, &amp;dvnode-&gt;flags);</div><div class='add'>+	} else {</div><div class='add'>+		ret = i_size;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	downgrade_write(&amp;dvnode-&gt;validate_lock);</div><div class='del'>-success:</div><div class='del'>-	return req;</div><div class='add'>+valid:</div><div class='add'>+	return ret;</div><div class='ctx'> </div><div class='ctx'> error_unlock:</div><div class='ctx'> 	up_write(&amp;dvnode-&gt;validate_lock);</div><div class='ctx'> error:</div><div class='del'>-	afs_put_read(req);</div><div class='del'>-	_leave(" = %d", ret);</div><div class='del'>-	return ERR_PTR(ret);</div><div class='add'>+	_leave(" = %zd", ret);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -392,78 +367,71 @@ error:</div><div class='ctx'>  */</div><div class='ctx'> static int afs_dir_iterate_block(struct afs_vnode *dvnode,</div><div class='ctx'> 				 struct dir_context *ctx,</div><div class='del'>-				 union afs_xdr_dir_block *block,</div><div class='del'>-				 unsigned blkoff)</div><div class='add'>+				 union afs_xdr_dir_block *block)</div><div class='ctx'> {</div><div class='ctx'> 	union afs_xdr_dirent *dire;</div><div class='del'>-	unsigned offset, next, curr, nr_slots;</div><div class='add'>+	unsigned int blknum, base, hdr, pos, next, nr_slots;</div><div class='ctx'> 	size_t nlen;</div><div class='ctx'> 	int tmp;</div><div class='ctx'> </div><div class='del'>-	_enter("%llx,%x", ctx-&gt;pos, blkoff);</div><div class='add'>+	blknum	= ctx-&gt;pos / AFS_DIR_BLOCK_SIZE;</div><div class='add'>+	base	= blknum * AFS_DIR_SLOTS_PER_BLOCK;</div><div class='add'>+	hdr	= (blknum == 0 ? AFS_DIR_RESV_BLOCKS0 : AFS_DIR_RESV_BLOCKS);</div><div class='add'>+	pos	= DIV_ROUND_UP(ctx-&gt;pos, AFS_DIR_DIRENT_SIZE) - base;</div><div class='ctx'> </div><div class='del'>-	curr = (ctx-&gt;pos - blkoff) / sizeof(union afs_xdr_dirent);</div><div class='add'>+	_enter("%llx,%x", ctx-&gt;pos, blknum);</div><div class='ctx'> </div><div class='ctx'> 	/* walk through the block, an entry at a time */</div><div class='del'>-	for (offset = (blkoff == 0 ? AFS_DIR_RESV_BLOCKS0 : AFS_DIR_RESV_BLOCKS);</div><div class='del'>-	     offset &lt; AFS_DIR_SLOTS_PER_BLOCK;</div><div class='del'>-	     offset = next</div><div class='del'>-	     ) {</div><div class='add'>+	for (unsigned int slot = hdr; slot &lt; AFS_DIR_SLOTS_PER_BLOCK; slot = next) {</div><div class='ctx'> 		/* skip entries marked unused in the bitmap */</div><div class='del'>-		if (!(block-&gt;hdr.bitmap[offset / 8] &amp;</div><div class='del'>-		      (1 &lt;&lt; (offset % 8)))) {</div><div class='del'>-			_debug("ENT[%zu.%u]: unused",</div><div class='del'>-			       blkoff / sizeof(union afs_xdr_dir_block), offset);</div><div class='del'>-			next = offset + 1;</div><div class='del'>-			if (offset &gt;= curr)</div><div class='del'>-				ctx-&gt;pos = blkoff +</div><div class='del'>-					next * sizeof(union afs_xdr_dirent);</div><div class='add'>+		if (!(block-&gt;hdr.bitmap[slot / 8] &amp;</div><div class='add'>+		      (1 &lt;&lt; (slot % 8)))) {</div><div class='add'>+			_debug("ENT[%x]: Unused", base + slot);</div><div class='add'>+			next = slot + 1;</div><div class='add'>+			if (next &gt;= pos)</div><div class='add'>+				ctx-&gt;pos = (base + next) * sizeof(union afs_xdr_dirent);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* got a valid entry */</div><div class='del'>-		dire = &amp;block-&gt;dirents[offset];</div><div class='add'>+		dire = &amp;block-&gt;dirents[slot];</div><div class='ctx'> 		nlen = strnlen(dire-&gt;u.name,</div><div class='del'>-			       sizeof(*block) -</div><div class='del'>-			       offset * sizeof(union afs_xdr_dirent));</div><div class='add'>+			       (unsigned long)(block + 1) - (unsigned long)dire-&gt;u.name - 1);</div><div class='ctx'> 		if (nlen &gt; AFSNAMEMAX - 1) {</div><div class='del'>-			_debug("ENT[%zu]: name too long (len %u/%zu)",</div><div class='del'>-			       blkoff / sizeof(union afs_xdr_dir_block),</div><div class='del'>-			       offset, nlen);</div><div class='add'>+			_debug("ENT[%x]: Name too long (len %zx)",</div><div class='add'>+			       base + slot, nlen);</div><div class='ctx'> 			return afs_bad(dvnode, afs_file_error_dir_name_too_long);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		_debug("ENT[%zu.%u]: %s %zu \"%s\"",</div><div class='del'>-		       blkoff / sizeof(union afs_xdr_dir_block), offset,</div><div class='del'>-		       (offset &lt; curr ? "skip" : "fill"),</div><div class='add'>+		_debug("ENT[%x]: %s %zx \"%s\"",</div><div class='add'>+		       base + slot, (slot &lt; pos ? "skip" : "fill"),</div><div class='ctx'> 		       nlen, dire-&gt;u.name);</div><div class='ctx'> </div><div class='ctx'> 		nr_slots = afs_dir_calc_slots(nlen);</div><div class='del'>-		next = offset + nr_slots;</div><div class='add'>+		next = slot + nr_slots;</div><div class='ctx'> 		if (next &gt; AFS_DIR_SLOTS_PER_BLOCK) {</div><div class='del'>-			_debug("ENT[%zu.%u]:"</div><div class='del'>-			       " %u extends beyond end dir block"</div><div class='del'>-			       " (len %zu)",</div><div class='del'>-			       blkoff / sizeof(union afs_xdr_dir_block),</div><div class='del'>-			       offset, next, nlen);</div><div class='add'>+			_debug("ENT[%x]: extends beyond end dir block (len %zx)",</div><div class='add'>+			       base + slot, nlen);</div><div class='ctx'> 			return afs_bad(dvnode, afs_file_error_dir_over_end);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* Check that the name-extension dirents are all allocated */</div><div class='ctx'> 		for (tmp = 1; tmp &lt; nr_slots; tmp++) {</div><div class='del'>-			unsigned int ix = offset + tmp;</div><div class='del'>-			if (!(block-&gt;hdr.bitmap[ix / 8] &amp; (1 &lt;&lt; (ix % 8)))) {</div><div class='del'>-				_debug("ENT[%zu.u]:"</div><div class='del'>-				       " %u unmarked extension (%u/%u)",</div><div class='del'>-				       blkoff / sizeof(union afs_xdr_dir_block),</div><div class='del'>-				       offset, tmp, nr_slots);</div><div class='add'>+			unsigned int xslot = slot + tmp;</div><div class='add'>+</div><div class='add'>+			if (!(block-&gt;hdr.bitmap[xslot / 8] &amp; (1 &lt;&lt; (xslot % 8)))) {</div><div class='add'>+				_debug("ENT[%x]: Unmarked extension (%x/%x)",</div><div class='add'>+				       base + slot, tmp, nr_slots);</div><div class='ctx'> 				return afs_bad(dvnode, afs_file_error_dir_unmarked_ext);</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* skip if starts before the current position */</div><div class='del'>-		if (offset &lt; curr)</div><div class='add'>+		if (slot &lt; pos) {</div><div class='add'>+			if (next &gt; pos)</div><div class='add'>+				ctx-&gt;pos = (base + next) * sizeof(union afs_xdr_dirent);</div><div class='ctx'> 			continue;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		/* found the next entry */</div><div class='ctx'> 		if (!dir_emit(ctx, dire-&gt;u.name, nlen,</div><div class='hunk'>@@ -475,75 +443,110 @@ static int afs_dir_iterate_block(struct afs_vnode *dvnode,</div><div class='ctx'> 			return 0;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		ctx-&gt;pos = blkoff + next * sizeof(union afs_xdr_dirent);</div><div class='add'>+		ctx-&gt;pos = (base + next) * sizeof(union afs_xdr_dirent);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	_leave(" = 1 [more]");</div><div class='ctx'> 	return 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+struct afs_dir_iteration_ctx {</div><div class='add'>+	struct dir_context	*dir_ctx;</div><div class='add'>+	int			error;</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> /*</div><div class='del'>- * iterate through the data blob that lists the contents of an AFS directory</div><div class='add'>+ * Iterate through a kmapped directory segment.</div><div class='ctx'>  */</div><div class='del'>-static int afs_dir_iterate(struct inode *dir, struct dir_context *ctx,</div><div class='del'>-			   struct key *key, afs_dataversion_t *_dir_version)</div><div class='add'>+static size_t afs_dir_iterate_step(void *iter_base, size_t progress, size_t len,</div><div class='add'>+				   void *priv, void *priv2)</div><div class='ctx'> {</div><div class='del'>-	struct afs_vnode *dvnode = AFS_FS_I(dir);</div><div class='del'>-	union afs_xdr_dir_block *dblock;</div><div class='del'>-	struct afs_read *req;</div><div class='del'>-	struct folio *folio;</div><div class='del'>-	unsigned offset, size;</div><div class='add'>+	struct afs_dir_iteration_ctx *ctx = priv2;</div><div class='add'>+	struct afs_vnode *dvnode = priv;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	_enter("{%lu},%u,,", dir-&gt;i_ino, (unsigned)ctx-&gt;pos);</div><div class='del'>-</div><div class='del'>-	if (test_bit(AFS_VNODE_DELETED, &amp;AFS_FS_I(dir)-&gt;flags)) {</div><div class='del'>-		_leave(" = -ESTALE");</div><div class='del'>-		return -ESTALE;</div><div class='add'>+	if (WARN_ON_ONCE(progress % AFS_DIR_BLOCK_SIZE ||</div><div class='add'>+			 len % AFS_DIR_BLOCK_SIZE)) {</div><div class='add'>+		pr_err("Mis-iteration prog=%zx len=%zx\n",</div><div class='add'>+		       progress % AFS_DIR_BLOCK_SIZE,</div><div class='add'>+		       len % AFS_DIR_BLOCK_SIZE);</div><div class='add'>+		return len;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	req = afs_read_dir(dvnode, key);</div><div class='del'>-	if (IS_ERR(req))</div><div class='del'>-		return PTR_ERR(req);</div><div class='del'>-	*_dir_version = req-&gt;data_version;</div><div class='add'>+	do {</div><div class='add'>+		ret = afs_dir_iterate_block(dvnode, ctx-&gt;dir_ctx, iter_base);</div><div class='add'>+		if (ret != 1)</div><div class='add'>+			break;</div><div class='ctx'> </div><div class='del'>-	/* round the file position up to the next entry boundary */</div><div class='del'>-	ctx-&gt;pos += sizeof(union afs_xdr_dirent) - 1;</div><div class='del'>-	ctx-&gt;pos &amp;= ~(sizeof(union afs_xdr_dirent) - 1);</div><div class='add'>+		ctx-&gt;dir_ctx-&gt;pos = round_up(ctx-&gt;dir_ctx-&gt;pos, AFS_DIR_BLOCK_SIZE);</div><div class='add'>+		iter_base += AFS_DIR_BLOCK_SIZE;</div><div class='add'>+		len -= AFS_DIR_BLOCK_SIZE;</div><div class='add'>+	} while (len &gt; 0);</div><div class='ctx'> </div><div class='del'>-	/* walk through the blocks in sequence */</div><div class='del'>-	ret = 0;</div><div class='del'>-	while (ctx-&gt;pos &lt; req-&gt;actual_len) {</div><div class='del'>-		/* Fetch the appropriate folio from the directory and re-add it</div><div class='del'>-		 * to the LRU.  We have all the pages pinned with an extra ref.</div><div class='del'>-		 */</div><div class='del'>-		folio = __filemap_get_folio(dir-&gt;i_mapping, ctx-&gt;pos / PAGE_SIZE,</div><div class='del'>-					    FGP_ACCESSED, 0);</div><div class='del'>-		if (!folio) {</div><div class='del'>-			ret = afs_bad(dvnode, afs_file_error_dir_missing_page);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='add'>+	return len;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		offset = round_down(ctx-&gt;pos, sizeof(*dblock)) - folio_file_pos(folio);</div><div class='del'>-		size = min_t(loff_t, folio_size(folio),</div><div class='del'>-			     req-&gt;actual_len - folio_file_pos(folio));</div><div class='add'>+/*</div><div class='add'>+ * Iterate through the directory folios.</div><div class='add'>+ */</div><div class='add'>+static int afs_dir_iterate_contents(struct inode *dir, struct dir_context *dir_ctx)</div><div class='add'>+{</div><div class='add'>+	struct afs_dir_iteration_ctx ctx = { .dir_ctx = dir_ctx };</div><div class='add'>+	struct afs_vnode *dvnode = AFS_FS_I(dir);</div><div class='add'>+	struct iov_iter iter;</div><div class='add'>+	unsigned long long i_size = i_size_read(dir);</div><div class='ctx'> </div><div class='del'>-		do {</div><div class='del'>-			dblock = kmap_local_folio(folio, offset);</div><div class='del'>-			ret = afs_dir_iterate_block(dvnode, ctx, dblock,</div><div class='del'>-						    folio_file_pos(folio) + offset);</div><div class='del'>-			kunmap_local(dblock);</div><div class='del'>-			if (ret != 1)</div><div class='del'>-				goto out;</div><div class='add'>+	/* Round the file position up to the next entry boundary */</div><div class='add'>+	dir_ctx-&gt;pos = round_up(dir_ctx-&gt;pos, sizeof(union afs_xdr_dirent));</div><div class='ctx'> </div><div class='del'>-		} while (offset += sizeof(*dblock), offset &lt; size);</div><div class='add'>+	if (i_size &lt;= 0 || dir_ctx-&gt;pos &gt;= i_size)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-		ret = 0;</div><div class='del'>-	}</div><div class='add'>+	iov_iter_folio_queue(&amp;iter, ITER_SOURCE, dvnode-&gt;directory, 0, 0, i_size);</div><div class='add'>+	iov_iter_advance(&amp;iter, round_down(dir_ctx-&gt;pos, AFS_DIR_BLOCK_SIZE));</div><div class='add'>+</div><div class='add'>+	iterate_folioq(&amp;iter, iov_iter_count(&amp;iter), dvnode, &amp;ctx,</div><div class='add'>+		       afs_dir_iterate_step);</div><div class='add'>+</div><div class='add'>+	if (ctx.error == -ESTALE)</div><div class='add'>+		afs_invalidate_dir(dvnode, afs_dir_invalid_iter_stale);</div><div class='add'>+	return ctx.error;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * iterate through the data blob that lists the contents of an AFS directory</div><div class='add'>+ */</div><div class='add'>+static int afs_dir_iterate(struct inode *dir, struct dir_context *ctx,</div><div class='add'>+			   struct file *file, afs_dataversion_t *_dir_version)</div><div class='add'>+{</div><div class='add'>+	struct afs_vnode *dvnode = AFS_FS_I(dir);</div><div class='add'>+	int retry_limit = 100;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	_enter("{%lu},%llx,,", dir-&gt;i_ino, ctx-&gt;pos);</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		if (--retry_limit &lt; 0) {</div><div class='add'>+			pr_warn("afs_read_dir(): Too many retries\n");</div><div class='add'>+			ret = -ESTALE;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		ret = afs_read_dir(dvnode, file);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			if (ret != -ESTALE)</div><div class='add'>+				break;</div><div class='add'>+			if (test_bit(AFS_VNODE_DELETED, &amp;AFS_FS_I(dir)-&gt;flags)) {</div><div class='add'>+				ret = -ESTALE;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+		*_dir_version = inode_peek_iversion_raw(dir);</div><div class='add'>+</div><div class='add'>+		ret = afs_dir_iterate_contents(dir, ctx);</div><div class='add'>+		up_read(&amp;dvnode-&gt;validate_lock);</div><div class='add'>+	} while (ret == -ESTALE);</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	up_read(&amp;dvnode-&gt;validate_lock);</div><div class='del'>-	afs_put_read(req);</div><div class='ctx'> 	_leave(" = %d", ret);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -555,8 +558,7 @@ static int afs_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> {</div><div class='ctx'> 	afs_dataversion_t dir_version;</div><div class='ctx'> </div><div class='del'>-	return afs_dir_iterate(file_inode(file), ctx, afs_file_key(file),</div><div class='del'>-			       &amp;dir_version);</div><div class='add'>+	return afs_dir_iterate(file_inode(file), ctx, file, &amp;dir_version);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -564,7 +566,7 @@ static int afs_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'>  * - if afs_dir_iterate_block() spots this function, it'll pass the FID</div><div class='ctx'>  *   uniquifier through dtype</div><div class='ctx'>  */</div><div class='del'>-static int afs_lookup_one_filldir(struct dir_context *ctx, const char *name,</div><div class='add'>+static bool afs_lookup_one_filldir(struct dir_context *ctx, const char *name,</div><div class='ctx'> 				  int nlen, loff_t fpos, u64 ino, unsigned dtype)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_lookup_one_cookie *cookie =</div><div class='hunk'>@@ -580,38 +582,38 @@ static int afs_lookup_one_filldir(struct dir_context *ctx, const char *name,</div><div class='ctx'> </div><div class='ctx'> 	if (cookie-&gt;name.len != nlen ||</div><div class='ctx'> 	    memcmp(cookie-&gt;name.name, name, nlen) != 0) {</div><div class='del'>-		_leave(" = 0 [no]");</div><div class='del'>-		return 0;</div><div class='add'>+		_leave(" = true [keep looking]");</div><div class='add'>+		return true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	cookie-&gt;fid.vnode = ino;</div><div class='ctx'> 	cookie-&gt;fid.unique = dtype;</div><div class='ctx'> 	cookie-&gt;found = 1;</div><div class='ctx'> </div><div class='del'>-	_leave(" = -1 [found]");</div><div class='del'>-	return -1;</div><div class='add'>+	_leave(" = false [found]");</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Do a lookup of a single name in a directory</div><div class='ctx'>  * - just returns the FID the dentry name maps to if found</div><div class='ctx'>  */</div><div class='del'>-static int afs_do_lookup_one(struct inode *dir, struct dentry *dentry,</div><div class='del'>-			     struct afs_fid *fid, struct key *key,</div><div class='add'>+static int afs_do_lookup_one(struct inode *dir, const struct qstr *name,</div><div class='add'>+			     struct afs_fid *fid,</div><div class='ctx'> 			     afs_dataversion_t *_dir_version)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_super_info *as = dir-&gt;i_sb-&gt;s_fs_info;</div><div class='ctx'> 	struct afs_lookup_one_cookie cookie = {</div><div class='ctx'> 		.ctx.actor = afs_lookup_one_filldir,</div><div class='del'>-		.name = dentry-&gt;d_name,</div><div class='add'>+		.name = *name,</div><div class='ctx'> 		.fid.vid = as-&gt;volume-&gt;vid</div><div class='ctx'> 	};</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	_enter("{%lu},%p{%pd},", dir-&gt;i_ino, dentry, dentry);</div><div class='add'>+	_enter("{%lu},{%.*s},", dir-&gt;i_ino, name-&gt;len, name-&gt;name);</div><div class='ctx'> </div><div class='ctx'> 	/* search the directory */</div><div class='del'>-	ret = afs_dir_iterate(dir, &amp;cookie.ctx, key, _dir_version);</div><div class='add'>+	ret = afs_dir_iterate(dir, &amp;cookie.ctx, NULL, _dir_version);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='ctx'> 		_leave(" = %d [iter]", ret);</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -632,12 +634,11 @@ static int afs_do_lookup_one(struct inode *dir, struct dentry *dentry,</div><div class='ctx'>  * - if afs_dir_iterate_block() spots this function, it'll pass the FID</div><div class='ctx'>  *   uniquifier through dtype</div><div class='ctx'>  */</div><div class='del'>-static int afs_lookup_filldir(struct dir_context *ctx, const char *name,</div><div class='add'>+static bool afs_lookup_filldir(struct dir_context *ctx, const char *name,</div><div class='ctx'> 			      int nlen, loff_t fpos, u64 ino, unsigned dtype)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_lookup_cookie *cookie =</div><div class='ctx'> 		container_of(ctx, struct afs_lookup_cookie, ctx);</div><div class='del'>-	int ret;</div><div class='ctx'> </div><div class='ctx'> 	_enter("{%s,%u},%s,%u,,%llu,%u",</div><div class='ctx'> 	       cookie-&gt;name.name, cookie-&gt;name.len, name, nlen,</div><div class='hunk'>@@ -647,24 +648,13 @@ static int afs_lookup_filldir(struct dir_context *ctx, const char *name,</div><div class='ctx'> 	BUILD_BUG_ON(sizeof(union afs_xdr_dir_block) != 2048);</div><div class='ctx'> 	BUILD_BUG_ON(sizeof(union afs_xdr_dirent) != 32);</div><div class='ctx'> </div><div class='del'>-	if (cookie-&gt;found) {</div><div class='del'>-		if (cookie-&gt;nr_fids &lt; 50) {</div><div class='del'>-			cookie-&gt;fids[cookie-&gt;nr_fids].vnode	= ino;</div><div class='del'>-			cookie-&gt;fids[cookie-&gt;nr_fids].unique	= dtype;</div><div class='del'>-			cookie-&gt;nr_fids++;</div><div class='del'>-		}</div><div class='del'>-	} else if (cookie-&gt;name.len == nlen &amp;&amp;</div><div class='del'>-		   memcmp(cookie-&gt;name.name, name, nlen) == 0) {</div><div class='del'>-		cookie-&gt;fids[1].vnode	= ino;</div><div class='del'>-		cookie-&gt;fids[1].unique	= dtype;</div><div class='del'>-		cookie-&gt;found = 1;</div><div class='del'>-		if (cookie-&gt;one_only)</div><div class='del'>-			return -1;</div><div class='add'>+	if (cookie-&gt;nr_fids &lt; 50) {</div><div class='add'>+		cookie-&gt;fids[cookie-&gt;nr_fids].vnode	= ino;</div><div class='add'>+		cookie-&gt;fids[cookie-&gt;nr_fids].unique	= dtype;</div><div class='add'>+		cookie-&gt;nr_fids++;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = cookie-&gt;nr_fids &gt;= 50 ? -1 : 0;</div><div class='del'>-	_leave(" = %d", ret);</div><div class='del'>-	return ret;</div><div class='add'>+	return cookie-&gt;nr_fids &lt; 50;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -687,8 +677,9 @@ static void afs_do_lookup_success(struct afs_operation *op)</div><div class='ctx'> 			vp = &amp;op-&gt;file[0];</div><div class='ctx'> 			abort_code = vp-&gt;scb.status.abort_code;</div><div class='ctx'> 			if (abort_code != 0) {</div><div class='del'>-				op-&gt;ac.abort_code = abort_code;</div><div class='del'>-				op-&gt;error = afs_abort_to_error(abort_code);</div><div class='add'>+				op-&gt;call_abort_code = abort_code;</div><div class='add'>+				afs_op_set_error(op, afs_abort_to_error(abort_code));</div><div class='add'>+				op-&gt;cumul_error.abort_code = abort_code;</div><div class='ctx'> 			}</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='hunk'>@@ -701,6 +692,8 @@ static void afs_do_lookup_success(struct afs_operation *op)</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		if (vp-&gt;scb.status.abort_code)</div><div class='add'>+			trace_afs_bulkstat_error(op, &amp;vp-&gt;fid, i, vp-&gt;scb.status.abort_code);</div><div class='ctx'> 		if (!vp-&gt;scb.have_status &amp;&amp; !vp-&gt;scb.have_error)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='hunk'>@@ -778,8 +771,7 @@ static bool afs_server_supports_ibulk(struct afs_vnode *dvnode)</div><div class='ctx'>  * files in one go and create inodes for them.  The inode of the file we were</div><div class='ctx'>  * asked for is returned.</div><div class='ctx'>  */</div><div class='del'>-static struct inode *afs_do_lookup(struct inode *dir, struct dentry *dentry,</div><div class='del'>-				   struct key *key)</div><div class='add'>+static struct inode *afs_do_lookup(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_lookup_cookie *cookie;</div><div class='ctx'> 	struct afs_vnode_param *vp;</div><div class='hunk'>@@ -787,6 +779,7 @@ static struct inode *afs_do_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	struct afs_vnode *dvnode = AFS_FS_I(dir), *vnode;</div><div class='ctx'> 	struct inode *inode = NULL, *ti;</div><div class='ctx'> 	afs_dataversion_t data_version = READ_ONCE(dvnode-&gt;status.data_version);</div><div class='add'>+	bool supports_ibulk, isnew;</div><div class='ctx'> 	long ret;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='hunk'>@@ -800,22 +793,22 @@ static struct inode *afs_do_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 		cookie-&gt;fids[i].vid = dvnode-&gt;fid.vid;</div><div class='ctx'> 	cookie-&gt;ctx.actor = afs_lookup_filldir;</div><div class='ctx'> 	cookie-&gt;name = dentry-&gt;d_name;</div><div class='del'>-	cookie-&gt;nr_fids = 2; /* slot 0 is saved for the fid we actually want</div><div class='del'>-			      * and slot 1 for the directory */</div><div class='add'>+	cookie-&gt;nr_fids = 2; /* slot 1 is saved for the fid we actually want</div><div class='add'>+			      * and slot 0 for the directory */</div><div class='ctx'> </div><div class='del'>-	if (!afs_server_supports_ibulk(dvnode))</div><div class='del'>-		cookie-&gt;one_only = true;</div><div class='del'>-</div><div class='del'>-	/* search the directory */</div><div class='del'>-	ret = afs_dir_iterate(dir, &amp;cookie-&gt;ctx, key, &amp;data_version);</div><div class='add'>+	/* Search the directory for the named entry using the hash table... */</div><div class='add'>+	ret = afs_dir_search(dvnode, &amp;dentry-&gt;d_name, &amp;cookie-&gt;fids[1], &amp;data_version);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	dentry-&gt;d_fsdata = (void *)(unsigned long)data_version;</div><div class='add'>+	supports_ibulk = afs_server_supports_ibulk(dvnode);</div><div class='add'>+	if (supports_ibulk) {</div><div class='add'>+		/* ...then scan linearly from that point for entries to lookup-ahead. */</div><div class='add'>+		cookie-&gt;ctx.pos = (ret + 1) * AFS_DIR_DIRENT_SIZE;</div><div class='add'>+		afs_dir_iterate(dir, &amp;cookie-&gt;ctx, NULL, &amp;data_version);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	ret = -ENOENT;</div><div class='del'>-	if (!cookie-&gt;found)</div><div class='del'>-		goto out;</div><div class='add'>+	dentry-&gt;d_fsdata = (void *)(unsigned long)data_version;</div><div class='ctx'> </div><div class='ctx'> 	/* Check to see if we already have an inode for the primary fid. */</div><div class='ctx'> 	inode = ilookup5(dir-&gt;i_sb, cookie-&gt;fids[1].vnode,</div><div class='hunk'>@@ -840,13 +833,14 @@ static struct inode *afs_do_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	_debug("nr_files %u", op-&gt;nr_files);</div><div class='ctx'> </div><div class='ctx'> 	/* Need space for examining all the selected files */</div><div class='del'>-	op-&gt;error = -ENOMEM;</div><div class='ctx'> 	if (op-&gt;nr_files &gt; 2) {</div><div class='ctx'> 		op-&gt;more_files = kvcalloc(op-&gt;nr_files - 2,</div><div class='ctx'> 					  sizeof(struct afs_vnode_param),</div><div class='ctx'> 					  GFP_KERNEL);</div><div class='del'>-		if (!op-&gt;more_files)</div><div class='add'>+		if (!op-&gt;more_files) {</div><div class='add'>+			afs_op_nomem(op);</div><div class='ctx'> 			goto out_op;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		for (i = 2; i &lt; op-&gt;nr_files; i++) {</div><div class='ctx'> 			vp = &amp;op-&gt;more_files[i - 2];</div><div class='hunk'>@@ -856,7 +850,7 @@ static struct inode *afs_do_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 			 * callback counters.</div><div class='ctx'> 			 */</div><div class='ctx'> 			ti = ilookup5_nowait(dir-&gt;i_sb, vp-&gt;fid.vnode,</div><div class='del'>-					     afs_ilookup5_test_by_fid, &amp;vp-&gt;fid);</div><div class='add'>+					     afs_ilookup5_test_by_fid, &amp;vp-&gt;fid, &amp;isnew);</div><div class='ctx'> 			if (!IS_ERR_OR_NULL(ti)) {</div><div class='ctx'> 				vnode = AFS_FS_I(ti);</div><div class='ctx'> 				vp-&gt;dv_before = vnode-&gt;status.data_version;</div><div class='hunk'>@@ -872,14 +866,14 @@ static struct inode *afs_do_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	 * lookups contained therein are stored in the reply without aborting</div><div class='ctx'> 	 * the whole operation.</div><div class='ctx'> 	 */</div><div class='del'>-	op-&gt;error = -ENOTSUPP;</div><div class='del'>-	if (!cookie-&gt;one_only) {</div><div class='add'>+	afs_op_set_error(op, -ENOTSUPP);</div><div class='add'>+	if (supports_ibulk) {</div><div class='ctx'> 		op-&gt;ops = &amp;afs_inline_bulk_status_operation;</div><div class='ctx'> 		afs_begin_vnode_operation(op);</div><div class='ctx'> 		afs_wait_for_operation(op);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (op-&gt;error == -ENOTSUPP) {</div><div class='add'>+	if (afs_op_error(op) == -ENOTSUPP) {</div><div class='ctx'> 		/* We could try FS.BulkStatus next, but this aborts the entire</div><div class='ctx'> 		 * op if any of the lookups fails - so, for the moment, revert</div><div class='ctx'> 		 * to FS.FetchStatus for op-&gt;file[1].</div><div class='hunk'>@@ -889,12 +883,16 @@ static struct inode *afs_do_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 		afs_begin_vnode_operation(op);</div><div class='ctx'> 		afs_wait_for_operation(op);</div><div class='ctx'> 	}</div><div class='del'>-	inode = ERR_PTR(op-&gt;error);</div><div class='ctx'> </div><div class='ctx'> out_op:</div><div class='del'>-	if (op-&gt;error == 0) {</div><div class='del'>-		inode = &amp;op-&gt;file[1].vnode-&gt;vfs_inode;</div><div class='del'>-		op-&gt;file[1].vnode = NULL;</div><div class='add'>+	if (!afs_op_error(op)) {</div><div class='add'>+		if (op-&gt;file[1].scb.status.abort_code) {</div><div class='add'>+			afs_op_accumulate_error(op, -ECONNABORTED,</div><div class='add'>+						op-&gt;file[1].scb.status.abort_code);</div><div class='add'>+		} else {</div><div class='add'>+			inode = &amp;op-&gt;file[1].vnode-&gt;netfs.inode;</div><div class='add'>+			op-&gt;file[1].vnode = NULL;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (op-&gt;file[0].scb.have_status)</div><div class='hunk'>@@ -911,8 +909,7 @@ out:</div><div class='ctx'> /*</div><div class='ctx'>  * Look up an entry in a directory with @sys substitution.</div><div class='ctx'>  */</div><div class='del'>-static struct dentry *afs_lookup_atsys(struct inode *dir, struct dentry *dentry,</div><div class='del'>-				       struct key *key)</div><div class='add'>+static struct dentry *afs_lookup_atsys(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_sysnames *subs;</div><div class='ctx'> 	struct afs_net *net = afs_i2net(dir);</div><div class='hunk'>@@ -946,7 +943,7 @@ static struct dentry *afs_lookup_atsys(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		strcpy(p, name);</div><div class='del'>-		ret = lookup_one_len(buf, dentry-&gt;d_parent, len);</div><div class='add'>+		ret = lookup_noperm(&amp;QSTR(buf), dentry-&gt;d_parent);</div><div class='ctx'> 		if (IS_ERR(ret) || d_is_positive(ret))</div><div class='ctx'> 			goto out_s;</div><div class='ctx'> 		dput(ret);</div><div class='hunk'>@@ -960,7 +957,6 @@ out_s:</div><div class='ctx'> 	afs_put_sysnames(subs);</div><div class='ctx'> 	kfree(buf);</div><div class='ctx'> out_p:</div><div class='del'>-	key_put(key);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -974,7 +970,6 @@ static struct dentry *afs_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	struct afs_fid fid = {};</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct dentry *d;</div><div class='del'>-	struct key *key;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	_enter("{%llx:%llu},%p{%pd},",</div><div class='hunk'>@@ -992,15 +987,9 @@ static struct dentry *afs_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 		return ERR_PTR(-ESTALE);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	key = afs_request_key(dvnode-&gt;volume-&gt;cell);</div><div class='del'>-	if (IS_ERR(key)) {</div><div class='del'>-		_leave(" = %ld [key]", PTR_ERR(key));</div><div class='del'>-		return ERR_CAST(key);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = afs_validate(dvnode, key);</div><div class='add'>+	ret = afs_validate(dvnode, NULL);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='del'>-		key_put(key);</div><div class='add'>+		afs_dir_unuse_cookie(dvnode, ret);</div><div class='ctx'> 		_leave(" = %d [val]", ret);</div><div class='ctx'> 		return ERR_PTR(ret);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1010,15 +999,13 @@ static struct dentry *afs_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	    dentry-&gt;d_name.name[dentry-&gt;d_name.len - 3] == 's' &amp;&amp;</div><div class='ctx'> 	    dentry-&gt;d_name.name[dentry-&gt;d_name.len - 2] == 'y' &amp;&amp;</div><div class='ctx'> 	    dentry-&gt;d_name.name[dentry-&gt;d_name.len - 1] == 's')</div><div class='del'>-		return afs_lookup_atsys(dir, dentry, key);</div><div class='add'>+		return afs_lookup_atsys(dir, dentry);</div><div class='ctx'> </div><div class='ctx'> 	afs_stat_v(dvnode, n_lookup);</div><div class='del'>-	inode = afs_do_lookup(dir, dentry, key);</div><div class='del'>-	key_put(key);</div><div class='add'>+	inode = afs_do_lookup(dir, dentry);</div><div class='ctx'> 	if (inode == ERR_PTR(-ENOENT))</div><div class='del'>-		inode = afs_try_auto_mntpt(dentry, dir);</div><div class='del'>-</div><div class='del'>-	if (!IS_ERR_OR_NULL(inode))</div><div class='add'>+		inode = NULL;</div><div class='add'>+	else if (!IS_ERR_OR_NULL(inode))</div><div class='ctx'> 		fid = AFS_FS_I(inode)-&gt;fid;</div><div class='ctx'> </div><div class='ctx'> 	_debug("splice %p", dentry-&gt;d_inode);</div><div class='hunk'>@@ -1036,21 +1023,12 @@ static struct dentry *afs_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> /*</div><div class='ctx'>  * Check the validity of a dentry under RCU conditions.</div><div class='ctx'>  */</div><div class='del'>-static int afs_d_revalidate_rcu(struct dentry *dentry)</div><div class='add'>+static int afs_d_revalidate_rcu(struct afs_vnode *dvnode, struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	struct afs_vnode *dvnode;</div><div class='del'>-	struct dentry *parent;</div><div class='del'>-	struct inode *dir;</div><div class='ctx'> 	long dir_version, de_version;</div><div class='ctx'> </div><div class='ctx'> 	_enter("%p", dentry);</div><div class='ctx'> </div><div class='del'>-	/* Check the parent directory is still valid first. */</div><div class='del'>-	parent = READ_ONCE(dentry-&gt;d_parent);</div><div class='del'>-	dir = d_inode_rcu(parent);</div><div class='del'>-	if (!dir)</div><div class='del'>-		return -ECHILD;</div><div class='del'>-	dvnode = AFS_FS_I(dir);</div><div class='ctx'> 	if (test_bit(AFS_VNODE_DELETED, &amp;dvnode-&gt;flags))</div><div class='ctx'> 		return -ECHILD;</div><div class='ctx'> </div><div class='hunk'>@@ -1078,11 +1056,11 @@ static int afs_d_revalidate_rcu(struct dentry *dentry)</div><div class='ctx'>  * - NOTE! the hit can be a negative hit too, so we can't assume we have an</div><div class='ctx'>  *   inode</div><div class='ctx'>  */</div><div class='del'>-static int afs_d_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='add'>+static int afs_d_revalidate(struct inode *parent_dir, const struct qstr *name,</div><div class='add'>+			    struct dentry *dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='del'>-	struct afs_vnode *vnode, *dir;</div><div class='add'>+	struct afs_vnode *vnode, *dir = AFS_FS_I(parent_dir);</div><div class='ctx'> 	struct afs_fid fid;</div><div class='del'>-	struct dentry *parent;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct key *key;</div><div class='ctx'> 	afs_dataversion_t dir_version, invalid_before;</div><div class='hunk'>@@ -1090,7 +1068,7 @@ static int afs_d_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; LOOKUP_RCU)</div><div class='del'>-		return afs_d_revalidate_rcu(dentry);</div><div class='add'>+		return afs_d_revalidate_rcu(dir, dentry);</div><div class='ctx'> </div><div class='ctx'> 	if (d_really_is_positive(dentry)) {</div><div class='ctx'> 		vnode = AFS_FS_I(d_inode(dentry));</div><div class='hunk'>@@ -1105,12 +1083,12 @@ static int afs_d_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='ctx'> 	if (IS_ERR(key))</div><div class='ctx'> 		key = NULL;</div><div class='ctx'> </div><div class='del'>-	/* Hold the parent dentry so we can peer at it */</div><div class='del'>-	parent = dget_parent(dentry);</div><div class='del'>-	dir = AFS_FS_I(d_inode(parent));</div><div class='del'>-</div><div class='ctx'> 	/* validate the parent directory */</div><div class='del'>-	afs_validate(dir, key);</div><div class='add'>+	ret = afs_validate(dir, key);</div><div class='add'>+	if (ret == -ERESTARTSYS) {</div><div class='add'>+		key_put(key);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (test_bit(AFS_VNODE_DELETED, &amp;dir-&gt;flags)) {</div><div class='ctx'> 		_debug("%pd: parent dir deleted", dentry);</div><div class='hunk'>@@ -1135,7 +1113,7 @@ static int afs_d_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='ctx'> 	afs_stat_v(dir, n_reval);</div><div class='ctx'> </div><div class='ctx'> 	/* search the directory for this vnode */</div><div class='del'>-	ret = afs_do_lookup_one(&amp;dir-&gt;vfs_inode, dentry, &amp;fid, key, &amp;dir_version);</div><div class='add'>+	ret = afs_do_lookup_one(&amp;dir-&gt;netfs.inode, name, &amp;fid, &amp;dir_version);</div><div class='ctx'> 	switch (ret) {</div><div class='ctx'> 	case 0:</div><div class='ctx'> 		/* the filename maps to something */</div><div class='hunk'>@@ -1166,7 +1144,7 @@ static int afs_d_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='ctx'> 			_debug("%pd: file deleted (uq %u -&gt; %u I:%u)",</div><div class='ctx'> 			       dentry, fid.unique,</div><div class='ctx'> 			       vnode-&gt;fid.unique,</div><div class='del'>-			       vnode-&gt;vfs_inode.i_generation);</div><div class='add'>+			       vnode-&gt;netfs.inode.i_generation);</div><div class='ctx'> 			goto not_found;</div><div class='ctx'> 		}</div><div class='ctx'> 		goto out_valid;</div><div class='hunk'>@@ -1179,22 +1157,19 @@ static int afs_d_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='ctx'> 		goto out_valid;</div><div class='ctx'> </div><div class='ctx'> 	default:</div><div class='del'>-		_debug("failed to iterate dir %pd: %d",</div><div class='del'>-		       parent, ret);</div><div class='add'>+		_debug("failed to iterate parent %pd2: %d", dentry, ret);</div><div class='ctx'> 		goto not_found;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> out_valid:</div><div class='ctx'> 	dentry-&gt;d_fsdata = (void *)(unsigned long)dir_version;</div><div class='ctx'> out_valid_noupdate:</div><div class='del'>-	dput(parent);</div><div class='ctx'> 	key_put(key);</div><div class='ctx'> 	_leave(" = 1 [valid]");</div><div class='ctx'> 	return 1;</div><div class='ctx'> </div><div class='ctx'> not_found:</div><div class='ctx'> 	_debug("dropping dentry %pd2", dentry);</div><div class='del'>-	dput(parent);</div><div class='ctx'> 	key_put(key);</div><div class='ctx'> </div><div class='ctx'> 	_leave(" = 0 [bad]");</div><div class='hunk'>@@ -1249,9 +1224,10 @@ void afs_check_for_remote_deletion(struct afs_operation *op)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_vnode *vnode = op-&gt;file[0].vnode;</div><div class='ctx'> </div><div class='del'>-	switch (op-&gt;ac.abort_code) {</div><div class='add'>+	switch (afs_op_abort_code(op)) {</div><div class='ctx'> 	case VNOVNODE:</div><div class='ctx'> 		set_bit(AFS_VNODE_DELETED, &amp;vnode-&gt;flags);</div><div class='add'>+		clear_nlink(&amp;vnode-&gt;netfs.inode);</div><div class='ctx'> 		afs_break_callback(vnode, afs_cb_break_for_deleted);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -1261,26 +1237,31 @@ void afs_check_for_remote_deletion(struct afs_operation *op)</div><div class='ctx'>  */</div><div class='ctx'> static void afs_vnode_new_inode(struct afs_operation *op)</div><div class='ctx'> {</div><div class='add'>+	struct afs_vnode_param *dvp = &amp;op-&gt;file[0];</div><div class='ctx'> 	struct afs_vnode_param *vp = &amp;op-&gt;file[1];</div><div class='ctx'> 	struct afs_vnode *vnode;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> </div><div class='ctx'> 	_enter("");</div><div class='ctx'> </div><div class='del'>-	ASSERTCMP(op-&gt;error, ==, 0);</div><div class='add'>+	ASSERTCMP(afs_op_error(op), ==, 0);</div><div class='ctx'> </div><div class='ctx'> 	inode = afs_iget(op, vp);</div><div class='ctx'> 	if (IS_ERR(inode)) {</div><div class='ctx'> 		/* ENOMEM or EINTR at a really inconvenient time - just abandon</div><div class='ctx'> 		 * the new directory on the server.</div><div class='ctx'> 		 */</div><div class='del'>-		op-&gt;error = PTR_ERR(inode);</div><div class='add'>+		afs_op_accumulate_error(op, PTR_ERR(inode), 0);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	vnode = AFS_FS_I(inode);</div><div class='ctx'> 	set_bit(AFS_VNODE_NEW_CONTENT, &amp;vnode-&gt;flags);</div><div class='del'>-	if (!op-&gt;error)</div><div class='add'>+	if (S_ISDIR(inode-&gt;i_mode))</div><div class='add'>+		afs_mkdir_init_dir(vnode, dvp-&gt;vnode);</div><div class='add'>+	else if (S_ISLNK(inode-&gt;i_mode))</div><div class='add'>+		afs_init_new_symlink(vnode, op);</div><div class='add'>+	if (!afs_op_error(op))</div><div class='ctx'> 		afs_cache_permit(vnode, op-&gt;key, vnode-&gt;cb_break, &amp;vp-&gt;scb);</div><div class='ctx'> 	d_instantiate(op-&gt;dentry, inode);</div><div class='ctx'> }</div><div class='hunk'>@@ -1296,25 +1277,28 @@ static void afs_create_success(struct afs_operation *op)</div><div class='ctx'> </div><div class='ctx'> static void afs_create_edit_dir(struct afs_operation *op)</div><div class='ctx'> {</div><div class='add'>+	struct netfs_cache_resources cres = {};</div><div class='ctx'> 	struct afs_vnode_param *dvp = &amp;op-&gt;file[0];</div><div class='ctx'> 	struct afs_vnode_param *vp = &amp;op-&gt;file[1];</div><div class='ctx'> 	struct afs_vnode *dvnode = dvp-&gt;vnode;</div><div class='ctx'> </div><div class='ctx'> 	_enter("op=%08x", op-&gt;debug_id);</div><div class='ctx'> </div><div class='add'>+	fscache_begin_write_operation(&amp;cres, afs_vnode_cache(dvnode));</div><div class='ctx'> 	down_write(&amp;dvnode-&gt;validate_lock);</div><div class='ctx'> 	if (test_bit(AFS_VNODE_DIR_VALID, &amp;dvnode-&gt;flags) &amp;&amp;</div><div class='ctx'> 	    dvnode-&gt;status.data_version == dvp-&gt;dv_before + dvp-&gt;dv_delta)</div><div class='ctx'> 		afs_edit_dir_add(dvnode, &amp;op-&gt;dentry-&gt;d_name, &amp;vp-&gt;fid,</div><div class='ctx'> 				 op-&gt;create.reason);</div><div class='ctx'> 	up_write(&amp;dvnode-&gt;validate_lock);</div><div class='add'>+	fscache_end_operation(&amp;cres);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void afs_create_put(struct afs_operation *op)</div><div class='ctx'> {</div><div class='ctx'> 	_enter("op=%08x", op-&gt;debug_id);</div><div class='ctx'> </div><div class='del'>-	if (op-&gt;error)</div><div class='add'>+	if (afs_op_error(op))</div><div class='ctx'> 		d_drop(op-&gt;dentry);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1330,11 +1314,12 @@ static const struct afs_operation_ops afs_mkdir_operation = {</div><div class='ctx'> /*</div><div class='ctx'>  * create a directory on an AFS filesystem</div><div class='ctx'>  */</div><div class='del'>-static int afs_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-		     struct dentry *dentry, umode_t mode)</div><div class='add'>+static struct dentry *afs_mkdir(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+				struct dentry *dentry, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_operation *op;</div><div class='ctx'> 	struct afs_vnode *dvnode = AFS_FS_I(dir);</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	_enter("{%llx:%llu},{%pd},%ho",</div><div class='ctx'> 	       dvnode-&gt;fid.vid, dvnode-&gt;fid.vnode, dentry, mode);</div><div class='hunk'>@@ -1342,9 +1327,11 @@ static int afs_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	op = afs_alloc_operation(NULL, dvnode-&gt;volume);</div><div class='ctx'> 	if (IS_ERR(op)) {</div><div class='ctx'> 		d_drop(dentry);</div><div class='del'>-		return PTR_ERR(op);</div><div class='add'>+		return ERR_CAST(op);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	fscache_use_cookie(afs_vnode_cache(dvnode), true);</div><div class='add'>+</div><div class='ctx'> 	afs_op_set_vnode(op, 0, dvnode);</div><div class='ctx'> 	op-&gt;file[0].dv_delta = 1;</div><div class='ctx'> 	op-&gt;file[0].modification = true;</div><div class='hunk'>@@ -1352,8 +1339,11 @@ static int afs_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	op-&gt;dentry	= dentry;</div><div class='ctx'> 	op-&gt;create.mode	= S_IFDIR | mode;</div><div class='ctx'> 	op-&gt;create.reason = afs_edit_dir_for_mkdir;</div><div class='add'>+	op-&gt;mtime	= current_time(dir);</div><div class='ctx'> 	op-&gt;ops		= &amp;afs_mkdir_operation;</div><div class='del'>-	return afs_do_sync_operation(op);</div><div class='add'>+	ret = afs_do_sync_operation(op);</div><div class='add'>+	afs_dir_unuse_cookie(dvnode, ret);</div><div class='add'>+	return ERR_PTR(ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1364,10 +1354,10 @@ static void afs_dir_remove_subdir(struct dentry *dentry)</div><div class='ctx'> 	if (d_really_is_positive(dentry)) {</div><div class='ctx'> 		struct afs_vnode *vnode = AFS_FS_I(d_inode(dentry));</div><div class='ctx'> </div><div class='del'>-		clear_nlink(&amp;vnode-&gt;vfs_inode);</div><div class='add'>+		clear_nlink(&amp;vnode-&gt;netfs.inode);</div><div class='ctx'> 		set_bit(AFS_VNODE_DELETED, &amp;vnode-&gt;flags);</div><div class='del'>-		clear_bit(AFS_VNODE_CB_PROMISED, &amp;vnode-&gt;flags);</div><div class='del'>-		clear_bit(AFS_VNODE_DIR_VALID, &amp;vnode-&gt;flags);</div><div class='add'>+		afs_clear_cb_promise(vnode, afs_cb_promise_clear_rmdir);</div><div class='add'>+		afs_invalidate_dir(vnode, afs_dir_invalid_subdir_removed);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1381,18 +1371,21 @@ static void afs_rmdir_success(struct afs_operation *op)</div><div class='ctx'> </div><div class='ctx'> static void afs_rmdir_edit_dir(struct afs_operation *op)</div><div class='ctx'> {</div><div class='add'>+	struct netfs_cache_resources cres = {};</div><div class='ctx'> 	struct afs_vnode_param *dvp = &amp;op-&gt;file[0];</div><div class='ctx'> 	struct afs_vnode *dvnode = dvp-&gt;vnode;</div><div class='ctx'> </div><div class='ctx'> 	_enter("op=%08x", op-&gt;debug_id);</div><div class='ctx'> 	afs_dir_remove_subdir(op-&gt;dentry);</div><div class='ctx'> </div><div class='add'>+	fscache_begin_write_operation(&amp;cres, afs_vnode_cache(dvnode));</div><div class='ctx'> 	down_write(&amp;dvnode-&gt;validate_lock);</div><div class='ctx'> 	if (test_bit(AFS_VNODE_DIR_VALID, &amp;dvnode-&gt;flags) &amp;&amp;</div><div class='ctx'> 	    dvnode-&gt;status.data_version == dvp-&gt;dv_before + dvp-&gt;dv_delta)</div><div class='ctx'> 		afs_edit_dir_remove(dvnode, &amp;op-&gt;dentry-&gt;d_name,</div><div class='ctx'> 				    afs_edit_dir_for_rmdir);</div><div class='ctx'> 	up_write(&amp;dvnode-&gt;validate_lock);</div><div class='add'>+	fscache_end_operation(&amp;cres);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void afs_rmdir_put(struct afs_operation *op)</div><div class='hunk'>@@ -1427,6 +1420,8 @@ static int afs_rmdir(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	if (IS_ERR(op))</div><div class='ctx'> 		return PTR_ERR(op);</div><div class='ctx'> </div><div class='add'>+	fscache_use_cookie(afs_vnode_cache(dvnode), true);</div><div class='add'>+</div><div class='ctx'> 	afs_op_set_vnode(op, 0, dvnode);</div><div class='ctx'> 	op-&gt;file[0].dv_delta = 1;</div><div class='ctx'> 	op-&gt;file[0].modification = true;</div><div class='hunk'>@@ -1450,10 +1445,18 @@ static int afs_rmdir(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 		op-&gt;file[1].vnode = vnode;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return afs_do_sync_operation(op);</div><div class='add'>+	ret = afs_do_sync_operation(op);</div><div class='add'>+</div><div class='add'>+	/* Not all systems that can host afs servers have ENOTEMPTY. */</div><div class='add'>+	if (ret == -EEXIST)</div><div class='add'>+		ret = -ENOTEMPTY;</div><div class='add'>+out:</div><div class='add'>+	afs_dir_unuse_cookie(dvnode, ret);</div><div class='add'>+	return ret;</div><div class='ctx'> </div><div class='ctx'> error:</div><div class='del'>-	return afs_put_operation(op);</div><div class='add'>+	ret = afs_put_operation(op);</div><div class='add'>+	goto out;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1473,7 +1476,7 @@ static void afs_dir_remove_link(struct afs_operation *op)</div><div class='ctx'> 	struct dentry *dentry = op-&gt;dentry;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (op-&gt;error != 0 ||</div><div class='add'>+	if (afs_op_error(op) ||</div><div class='ctx'> 	    (op-&gt;file[1].scb.have_status &amp;&amp; op-&gt;file[1].scb.have_error))</div><div class='ctx'> 		return;</div><div class='ctx'> 	if (d_really_is_positive(dentry))</div><div class='hunk'>@@ -1483,8 +1486,8 @@ static void afs_dir_remove_link(struct afs_operation *op)</div><div class='ctx'> 		/* Already done */</div><div class='ctx'> 	} else if (test_bit(AFS_VNODE_DIR_VALID, &amp;dvnode-&gt;flags)) {</div><div class='ctx'> 		write_seqlock(&amp;vnode-&gt;cb_lock);</div><div class='del'>-		drop_nlink(&amp;vnode-&gt;vfs_inode);</div><div class='del'>-		if (vnode-&gt;vfs_inode.i_nlink == 0) {</div><div class='add'>+		drop_nlink(&amp;vnode-&gt;netfs.inode);</div><div class='add'>+		if (vnode-&gt;netfs.inode.i_nlink == 0) {</div><div class='ctx'> 			set_bit(AFS_VNODE_DELETED, &amp;vnode-&gt;flags);</div><div class='ctx'> 			__afs_break_callback(vnode, afs_cb_break_for_unlink);</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1497,10 +1500,10 @@ static void afs_dir_remove_link(struct afs_operation *op)</div><div class='ctx'> </div><div class='ctx'> 		ret = afs_validate(vnode, op-&gt;key);</div><div class='ctx'> 		if (ret != -ESTALE)</div><div class='del'>-			op-&gt;error = ret;</div><div class='add'>+			afs_op_set_error(op, ret);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	_debug("nlink %d [val %d]", vnode-&gt;vfs_inode.i_nlink, op-&gt;error);</div><div class='add'>+	_debug("nlink %d [val %d]", vnode-&gt;netfs.inode.i_nlink, afs_op_error(op));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void afs_unlink_success(struct afs_operation *op)</div><div class='hunk'>@@ -1516,22 +1519,25 @@ static void afs_unlink_success(struct afs_operation *op)</div><div class='ctx'> </div><div class='ctx'> static void afs_unlink_edit_dir(struct afs_operation *op)</div><div class='ctx'> {</div><div class='add'>+	struct netfs_cache_resources cres = {};</div><div class='ctx'> 	struct afs_vnode_param *dvp = &amp;op-&gt;file[0];</div><div class='ctx'> 	struct afs_vnode *dvnode = dvp-&gt;vnode;</div><div class='ctx'> </div><div class='ctx'> 	_enter("op=%08x", op-&gt;debug_id);</div><div class='add'>+	fscache_begin_write_operation(&amp;cres, afs_vnode_cache(dvnode));</div><div class='ctx'> 	down_write(&amp;dvnode-&gt;validate_lock);</div><div class='ctx'> 	if (test_bit(AFS_VNODE_DIR_VALID, &amp;dvnode-&gt;flags) &amp;&amp;</div><div class='ctx'> 	    dvnode-&gt;status.data_version == dvp-&gt;dv_before + dvp-&gt;dv_delta)</div><div class='ctx'> 		afs_edit_dir_remove(dvnode, &amp;op-&gt;dentry-&gt;d_name,</div><div class='ctx'> 				    afs_edit_dir_for_unlink);</div><div class='ctx'> 	up_write(&amp;dvnode-&gt;validate_lock);</div><div class='add'>+	fscache_end_operation(&amp;cres);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void afs_unlink_put(struct afs_operation *op)</div><div class='ctx'> {</div><div class='ctx'> 	_enter("op=%08x", op-&gt;debug_id);</div><div class='del'>-	if (op-&gt;unlink.need_rehash &amp;&amp; op-&gt;error &lt; 0 &amp;&amp; op-&gt;error != -ENOENT)</div><div class='add'>+	if (op-&gt;unlink.need_rehash &amp;&amp; afs_op_error(op) &lt; 0 &amp;&amp; afs_op_error(op) != -ENOENT)</div><div class='ctx'> 		d_rehash(op-&gt;dentry);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1564,6 +1570,8 @@ static int afs_unlink(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	if (IS_ERR(op))</div><div class='ctx'> 		return PTR_ERR(op);</div><div class='ctx'> </div><div class='add'>+	fscache_use_cookie(afs_vnode_cache(dvnode), true);</div><div class='add'>+</div><div class='ctx'> 	afs_op_set_vnode(op, 0, dvnode);</div><div class='ctx'> 	op-&gt;file[0].dv_delta = 1;</div><div class='ctx'> 	op-&gt;file[0].modification = true;</div><div class='hunk'>@@ -1572,7 +1580,7 @@ static int afs_unlink(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	/* Try to make sure we have a callback promise on the victim. */</div><div class='ctx'> 	ret = afs_validate(vnode, op-&gt;key);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='del'>-		op-&gt;error = ret;</div><div class='add'>+		afs_op_set_error(op, ret);</div><div class='ctx'> 		goto error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1581,7 +1589,7 @@ static int afs_unlink(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 		spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 		/* Start asynchronous writeout of the inode */</div><div class='ctx'> 		write_inode_now(d_inode(dentry), 0);</div><div class='del'>-		op-&gt;error = afs_sillyrename(dvnode, vnode, dentry, op-&gt;key);</div><div class='add'>+		afs_op_set_error(op, afs_sillyrename(dvnode, vnode, dentry, op-&gt;key));</div><div class='ctx'> 		goto error;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!d_unhashed(dentry)) {</div><div class='hunk'>@@ -1602,7 +1610,7 @@ static int afs_unlink(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	/* If there was a conflict with a third party, check the status of the</div><div class='ctx'> 	 * unlinked vnode.</div><div class='ctx'> 	 */</div><div class='del'>-	if (op-&gt;error == 0 &amp;&amp; (op-&gt;flags &amp; AFS_OPERATION_DIR_CONFLICT)) {</div><div class='add'>+	if (afs_op_error(op) == 0 &amp;&amp; (op-&gt;flags &amp; AFS_OPERATION_DIR_CONFLICT)) {</div><div class='ctx'> 		op-&gt;file[1].update_ctime = false;</div><div class='ctx'> 		op-&gt;fetch_status.which = 1;</div><div class='ctx'> 		op-&gt;ops = &amp;afs_fetch_status_operation;</div><div class='hunk'>@@ -1610,10 +1618,10 @@ static int afs_unlink(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 		afs_wait_for_operation(op);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return afs_put_operation(op);</div><div class='del'>-</div><div class='ctx'> error:</div><div class='del'>-	return afs_put_operation(op);</div><div class='add'>+	ret = afs_put_operation(op);</div><div class='add'>+	afs_dir_unuse_cookie(dvnode, ret);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct afs_operation_ops afs_create_operation = {</div><div class='hunk'>@@ -1628,7 +1636,7 @@ static const struct afs_operation_ops afs_create_operation = {</div><div class='ctx'> /*</div><div class='ctx'>  * create a regular file on an AFS filesystem</div><div class='ctx'>  */</div><div class='del'>-static int afs_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int afs_create(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		      struct dentry *dentry, umode_t mode, bool excl)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_operation *op;</div><div class='hunk'>@@ -1647,6 +1655,8 @@ static int afs_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 		goto error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	fscache_use_cookie(afs_vnode_cache(dvnode), true);</div><div class='add'>+</div><div class='ctx'> 	afs_op_set_vnode(op, 0, dvnode);</div><div class='ctx'> 	op-&gt;file[0].dv_delta = 1;</div><div class='ctx'> 	op-&gt;file[0].modification = true;</div><div class='hunk'>@@ -1655,8 +1665,11 @@ static int afs_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	op-&gt;dentry	= dentry;</div><div class='ctx'> 	op-&gt;create.mode	= S_IFREG | mode;</div><div class='ctx'> 	op-&gt;create.reason = afs_edit_dir_for_create;</div><div class='add'>+	op-&gt;mtime	= current_time(dir);</div><div class='ctx'> 	op-&gt;ops		= &amp;afs_create_operation;</div><div class='del'>-	return afs_do_sync_operation(op);</div><div class='add'>+	ret = afs_do_sync_operation(op);</div><div class='add'>+	afs_dir_unuse_cookie(dvnode, ret);</div><div class='add'>+	return ret;</div><div class='ctx'> </div><div class='ctx'> error:</div><div class='ctx'> 	d_drop(dentry);</div><div class='hunk'>@@ -1676,14 +1689,14 @@ static void afs_link_success(struct afs_operation *op)</div><div class='ctx'> 	afs_update_dentry_version(op, dvp, op-&gt;dentry);</div><div class='ctx'> 	if (op-&gt;dentry_2-&gt;d_parent == op-&gt;dentry-&gt;d_parent)</div><div class='ctx'> 		afs_update_dentry_version(op, dvp, op-&gt;dentry_2);</div><div class='del'>-	ihold(&amp;vp-&gt;vnode-&gt;vfs_inode);</div><div class='del'>-	d_instantiate(op-&gt;dentry, &amp;vp-&gt;vnode-&gt;vfs_inode);</div><div class='add'>+	ihold(&amp;vp-&gt;vnode-&gt;netfs.inode);</div><div class='add'>+	d_instantiate(op-&gt;dentry, &amp;vp-&gt;vnode-&gt;netfs.inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void afs_link_put(struct afs_operation *op)</div><div class='ctx'> {</div><div class='ctx'> 	_enter("op=%08x", op-&gt;debug_id);</div><div class='del'>-	if (op-&gt;error)</div><div class='add'>+	if (afs_op_error(op))</div><div class='ctx'> 		d_drop(op-&gt;dentry);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1721,6 +1734,8 @@ static int afs_link(struct dentry *from, struct inode *dir,</div><div class='ctx'> 		goto error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	fscache_use_cookie(afs_vnode_cache(dvnode), true);</div><div class='add'>+</div><div class='ctx'> 	ret = afs_validate(vnode, op-&gt;key);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto error_op;</div><div class='hunk'>@@ -1736,10 +1751,13 @@ static int afs_link(struct dentry *from, struct inode *dir,</div><div class='ctx'> 	op-&gt;dentry_2		= from;</div><div class='ctx'> 	op-&gt;ops			= &amp;afs_link_operation;</div><div class='ctx'> 	op-&gt;create.reason	= afs_edit_dir_for_link;</div><div class='del'>-	return afs_do_sync_operation(op);</div><div class='add'>+	ret = afs_do_sync_operation(op);</div><div class='add'>+	afs_dir_unuse_cookie(dvnode, ret);</div><div class='add'>+	return ret;</div><div class='ctx'> </div><div class='ctx'> error_op:</div><div class='ctx'> 	afs_put_operation(op);</div><div class='add'>+	afs_dir_unuse_cookie(dvnode, ret);</div><div class='ctx'> error:</div><div class='ctx'> 	d_drop(dentry);</div><div class='ctx'> 	_leave(" = %d", ret);</div><div class='hunk'>@@ -1758,7 +1776,7 @@ static const struct afs_operation_ops afs_symlink_operation = {</div><div class='ctx'> /*</div><div class='ctx'>  * create a symlink in an AFS filesystem</div><div class='ctx'>  */</div><div class='del'>-static int afs_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int afs_symlink(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		       struct dentry *dentry, const char *content)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_operation *op;</div><div class='hunk'>@@ -1783,6 +1801,8 @@ static int afs_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 		goto error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	fscache_use_cookie(afs_vnode_cache(dvnode), true);</div><div class='add'>+</div><div class='ctx'> 	afs_op_set_vnode(op, 0, dvnode);</div><div class='ctx'> 	op-&gt;file[0].dv_delta = 1;</div><div class='ctx'> </div><div class='hunk'>@@ -1790,7 +1810,10 @@ static int afs_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	op-&gt;ops			= &amp;afs_symlink_operation;</div><div class='ctx'> 	op-&gt;create.reason	= afs_edit_dir_for_symlink;</div><div class='ctx'> 	op-&gt;create.symlink	= content;</div><div class='del'>-	return afs_do_sync_operation(op);</div><div class='add'>+	op-&gt;mtime		= current_time(dir);</div><div class='add'>+	ret = afs_do_sync_operation(op);</div><div class='add'>+	afs_dir_unuse_cookie(dvnode, ret);</div><div class='add'>+	return ret;</div><div class='ctx'> </div><div class='ctx'> error:</div><div class='ctx'> 	d_drop(dentry);</div><div class='hunk'>@@ -1800,6 +1823,9 @@ error:</div><div class='ctx'> </div><div class='ctx'> static void afs_rename_success(struct afs_operation *op)</div><div class='ctx'> {</div><div class='add'>+	struct afs_vnode *vnode = op-&gt;more_files[0].vnode;</div><div class='add'>+	struct afs_vnode *new_vnode = op-&gt;more_files[1].vnode;</div><div class='add'>+</div><div class='ctx'> 	_enter("op=%08x", op-&gt;debug_id);</div><div class='ctx'> </div><div class='ctx'> 	op-&gt;ctime = op-&gt;file[0].scb.status.mtime_client;</div><div class='hunk'>@@ -1809,10 +1835,46 @@ static void afs_rename_success(struct afs_operation *op)</div><div class='ctx'> 		op-&gt;ctime = op-&gt;file[1].scb.status.mtime_client;</div><div class='ctx'> 		afs_vnode_commit_status(op, &amp;op-&gt;file[1]);</div><div class='ctx'> 	}</div><div class='add'>+	if (op-&gt;more_files[0].scb.have_status)</div><div class='add'>+		afs_vnode_commit_status(op, &amp;op-&gt;more_files[0]);</div><div class='add'>+	if (op-&gt;more_files[1].scb.have_status)</div><div class='add'>+		afs_vnode_commit_status(op, &amp;op-&gt;more_files[1]);</div><div class='add'>+</div><div class='add'>+	/* If we're moving a subdir between dirs, we need to update</div><div class='add'>+	 * its DV counter too as the ".." will be altered.</div><div class='add'>+	 */</div><div class='add'>+	if (op-&gt;file[0].vnode != op-&gt;file[1].vnode) {</div><div class='add'>+		if (S_ISDIR(vnode-&gt;netfs.inode.i_mode)) {</div><div class='add'>+			u64 new_dv;</div><div class='add'>+</div><div class='add'>+			write_seqlock(&amp;vnode-&gt;cb_lock);</div><div class='add'>+</div><div class='add'>+			new_dv = vnode-&gt;status.data_version + 1;</div><div class='add'>+			trace_afs_set_dv(vnode, new_dv);</div><div class='add'>+			vnode-&gt;status.data_version = new_dv;</div><div class='add'>+			inode_set_iversion_raw(&amp;vnode-&gt;netfs.inode, new_dv);</div><div class='add'>+</div><div class='add'>+			write_sequnlock(&amp;vnode-&gt;cb_lock);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if ((op-&gt;rename.rename_flags &amp; RENAME_EXCHANGE) &amp;&amp;</div><div class='add'>+		    S_ISDIR(new_vnode-&gt;netfs.inode.i_mode)) {</div><div class='add'>+			u64 new_dv;</div><div class='add'>+</div><div class='add'>+			write_seqlock(&amp;new_vnode-&gt;cb_lock);</div><div class='add'>+</div><div class='add'>+			new_dv = new_vnode-&gt;status.data_version + 1;</div><div class='add'>+			new_vnode-&gt;status.data_version = new_dv;</div><div class='add'>+			inode_set_iversion_raw(&amp;new_vnode-&gt;netfs.inode, new_dv);</div><div class='add'>+</div><div class='add'>+			write_sequnlock(&amp;new_vnode-&gt;cb_lock);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void afs_rename_edit_dir(struct afs_operation *op)</div><div class='ctx'> {</div><div class='add'>+	struct netfs_cache_resources orig_cres = {}, new_cres = {};</div><div class='ctx'> 	struct afs_vnode_param *orig_dvp = &amp;op-&gt;file[0];</div><div class='ctx'> 	struct afs_vnode_param *new_dvp = &amp;op-&gt;file[1];</div><div class='ctx'> 	struct afs_vnode *orig_dvnode = orig_dvp-&gt;vnode;</div><div class='hunk'>@@ -1829,6 +1891,10 @@ static void afs_rename_edit_dir(struct afs_operation *op)</div><div class='ctx'> 		op-&gt;rename.rehash = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	fscache_begin_write_operation(&amp;orig_cres, afs_vnode_cache(orig_dvnode));</div><div class='add'>+	if (new_dvnode != orig_dvnode)</div><div class='add'>+		fscache_begin_write_operation(&amp;new_cres, afs_vnode_cache(new_dvnode));</div><div class='add'>+</div><div class='ctx'> 	down_write(&amp;orig_dvnode-&gt;validate_lock);</div><div class='ctx'> 	if (test_bit(AFS_VNODE_DIR_VALID, &amp;orig_dvnode-&gt;flags) &amp;&amp;</div><div class='ctx'> 	    orig_dvnode-&gt;status.data_version == orig_dvp-&gt;dv_before + orig_dvp-&gt;dv_delta)</div><div class='hunk'>@@ -1850,6 +1916,12 @@ static void afs_rename_edit_dir(struct afs_operation *op)</div><div class='ctx'> 				 &amp;vnode-&gt;fid, afs_edit_dir_for_rename_2);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (S_ISDIR(vnode-&gt;netfs.inode.i_mode) &amp;&amp;</div><div class='add'>+	    new_dvnode != orig_dvnode &amp;&amp;</div><div class='add'>+	    test_bit(AFS_VNODE_DIR_VALID, &amp;vnode-&gt;flags))</div><div class='add'>+		afs_edit_dir_update(vnode, &amp;dotdot_name, new_dvnode,</div><div class='add'>+				    afs_edit_dir_for_rename_sub);</div><div class='add'>+</div><div class='ctx'> 	new_inode = d_inode(new_dentry);</div><div class='ctx'> 	if (new_inode) {</div><div class='ctx'> 		spin_lock(&amp;new_inode-&gt;i_lock);</div><div class='hunk'>@@ -1862,9 +1934,6 @@ static void afs_rename_edit_dir(struct afs_operation *op)</div><div class='ctx'> </div><div class='ctx'> 	/* Now we can update d_fsdata on the dentries to reflect their</div><div class='ctx'> 	 * new parent's data_version.</div><div class='del'>-	 *</div><div class='del'>-	 * Note that if we ever implement RENAME_EXCHANGE, we'll have</div><div class='del'>-	 * to update both dentries with opposing dir versions.</div><div class='ctx'> 	 */</div><div class='ctx'> 	afs_update_dentry_version(op, new_dvp, op-&gt;dentry);</div><div class='ctx'> 	afs_update_dentry_version(op, new_dvp, op-&gt;dentry_2);</div><div class='hunk'>@@ -1872,6 +1941,70 @@ static void afs_rename_edit_dir(struct afs_operation *op)</div><div class='ctx'> 	d_move(old_dentry, new_dentry);</div><div class='ctx'> </div><div class='ctx'> 	up_write(&amp;new_dvnode-&gt;validate_lock);</div><div class='add'>+	fscache_end_operation(&amp;orig_cres);</div><div class='add'>+	if (new_dvnode != orig_dvnode)</div><div class='add'>+		fscache_end_operation(&amp;new_cres);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void afs_rename_exchange_edit_dir(struct afs_operation *op)</div><div class='add'>+{</div><div class='add'>+	struct afs_vnode_param *orig_dvp = &amp;op-&gt;file[0];</div><div class='add'>+	struct afs_vnode_param *new_dvp = &amp;op-&gt;file[1];</div><div class='add'>+	struct afs_vnode *orig_dvnode = orig_dvp-&gt;vnode;</div><div class='add'>+	struct afs_vnode *new_dvnode = new_dvp-&gt;vnode;</div><div class='add'>+	struct afs_vnode *old_vnode = op-&gt;more_files[0].vnode;</div><div class='add'>+	struct afs_vnode *new_vnode = op-&gt;more_files[1].vnode;</div><div class='add'>+	struct dentry *old_dentry = op-&gt;dentry;</div><div class='add'>+	struct dentry *new_dentry = op-&gt;dentry_2;</div><div class='add'>+</div><div class='add'>+	_enter("op=%08x", op-&gt;debug_id);</div><div class='add'>+</div><div class='add'>+	if (new_dvnode == orig_dvnode) {</div><div class='add'>+		down_write(&amp;orig_dvnode-&gt;validate_lock);</div><div class='add'>+		if (test_bit(AFS_VNODE_DIR_VALID, &amp;orig_dvnode-&gt;flags) &amp;&amp;</div><div class='add'>+		    orig_dvnode-&gt;status.data_version == orig_dvp-&gt;dv_before + orig_dvp-&gt;dv_delta) {</div><div class='add'>+			afs_edit_dir_update(orig_dvnode, &amp;old_dentry-&gt;d_name,</div><div class='add'>+					    new_vnode, afs_edit_dir_for_rename_0);</div><div class='add'>+			afs_edit_dir_update(orig_dvnode, &amp;new_dentry-&gt;d_name,</div><div class='add'>+					    old_vnode, afs_edit_dir_for_rename_1);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		d_exchange(old_dentry, new_dentry);</div><div class='add'>+		up_write(&amp;orig_dvnode-&gt;validate_lock);</div><div class='add'>+	} else {</div><div class='add'>+		down_write(&amp;orig_dvnode-&gt;validate_lock);</div><div class='add'>+		if (test_bit(AFS_VNODE_DIR_VALID, &amp;orig_dvnode-&gt;flags) &amp;&amp;</div><div class='add'>+		    orig_dvnode-&gt;status.data_version == orig_dvp-&gt;dv_before + orig_dvp-&gt;dv_delta)</div><div class='add'>+			afs_edit_dir_update(orig_dvnode, &amp;old_dentry-&gt;d_name,</div><div class='add'>+					    new_vnode, afs_edit_dir_for_rename_0);</div><div class='add'>+</div><div class='add'>+		up_write(&amp;orig_dvnode-&gt;validate_lock);</div><div class='add'>+		down_write(&amp;new_dvnode-&gt;validate_lock);</div><div class='add'>+</div><div class='add'>+		if (test_bit(AFS_VNODE_DIR_VALID, &amp;new_dvnode-&gt;flags) &amp;&amp;</div><div class='add'>+		    new_dvnode-&gt;status.data_version == new_dvp-&gt;dv_before + new_dvp-&gt;dv_delta)</div><div class='add'>+			afs_edit_dir_update(new_dvnode, &amp;new_dentry-&gt;d_name,</div><div class='add'>+					    old_vnode, afs_edit_dir_for_rename_1);</div><div class='add'>+</div><div class='add'>+		if (S_ISDIR(old_vnode-&gt;netfs.inode.i_mode) &amp;&amp;</div><div class='add'>+		    test_bit(AFS_VNODE_DIR_VALID, &amp;old_vnode-&gt;flags))</div><div class='add'>+			afs_edit_dir_update(old_vnode, &amp;dotdot_name, new_dvnode,</div><div class='add'>+					    afs_edit_dir_for_rename_sub);</div><div class='add'>+</div><div class='add'>+		if (S_ISDIR(new_vnode-&gt;netfs.inode.i_mode) &amp;&amp;</div><div class='add'>+		    test_bit(AFS_VNODE_DIR_VALID, &amp;new_vnode-&gt;flags))</div><div class='add'>+			afs_edit_dir_update(new_vnode, &amp;dotdot_name, orig_dvnode,</div><div class='add'>+					    afs_edit_dir_for_rename_sub);</div><div class='add'>+</div><div class='add'>+		/* Now we can update d_fsdata on the dentries to reflect their</div><div class='add'>+		 * new parents' data_version.</div><div class='add'>+		 */</div><div class='add'>+		afs_update_dentry_version(op, new_dvp, old_dentry);</div><div class='add'>+		afs_update_dentry_version(op, orig_dvp, new_dentry);</div><div class='add'>+</div><div class='add'>+		d_exchange(old_dentry, new_dentry);</div><div class='add'>+		up_write(&amp;new_dvnode-&gt;validate_lock);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void afs_rename_put(struct afs_operation *op)</div><div class='hunk'>@@ -1880,7 +2013,7 @@ static void afs_rename_put(struct afs_operation *op)</div><div class='ctx'> 	if (op-&gt;rename.rehash)</div><div class='ctx'> 		d_rehash(op-&gt;rename.rehash);</div><div class='ctx'> 	dput(op-&gt;rename.tmp);</div><div class='del'>-	if (op-&gt;error)</div><div class='add'>+	if (afs_op_error(op))</div><div class='ctx'> 		d_rehash(op-&gt;dentry);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1892,18 +2025,44 @@ static const struct afs_operation_ops afs_rename_operation = {</div><div class='ctx'> 	.put		= afs_rename_put,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+#if 0 /* Autoswitched in yfs_fs_rename_replace(). */</div><div class='add'>+static const struct afs_operation_ops afs_rename_replace_operation = {</div><div class='add'>+	.issue_afs_rpc	= NULL,</div><div class='add'>+	.issue_yfs_rpc	= yfs_fs_rename_replace,</div><div class='add'>+	.success	= afs_rename_success,</div><div class='add'>+	.edit_dir	= afs_rename_edit_dir,</div><div class='add'>+	.put		= afs_rename_put,</div><div class='add'>+};</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+static const struct afs_operation_ops afs_rename_noreplace_operation = {</div><div class='add'>+	.issue_afs_rpc	= NULL,</div><div class='add'>+	.issue_yfs_rpc	= yfs_fs_rename_noreplace,</div><div class='add'>+	.success	= afs_rename_success,</div><div class='add'>+	.edit_dir	= afs_rename_edit_dir,</div><div class='add'>+	.put		= afs_rename_put,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct afs_operation_ops afs_rename_exchange_operation = {</div><div class='add'>+	.issue_afs_rpc	= NULL,</div><div class='add'>+	.issue_yfs_rpc	= yfs_fs_rename_exchange,</div><div class='add'>+	.success	= afs_rename_success,</div><div class='add'>+	.edit_dir	= afs_rename_exchange_edit_dir,</div><div class='add'>+	.put		= afs_rename_put,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * rename a file in an AFS filesystem and/or move it between directories</div><div class='ctx'>  */</div><div class='del'>-static int afs_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='add'>+static int afs_rename(struct mnt_idmap *idmap, struct inode *old_dir,</div><div class='ctx'> 		      struct dentry *old_dentry, struct inode *new_dir,</div><div class='ctx'> 		      struct dentry *new_dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_operation *op;</div><div class='del'>-	struct afs_vnode *orig_dvnode, *new_dvnode, *vnode;</div><div class='add'>+	struct afs_vnode *orig_dvnode, *new_dvnode, *vnode, *new_vnode = NULL;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (flags)</div><div class='add'>+	if (flags &amp; ~(RENAME_NOREPLACE | RENAME_EXCHANGE))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	/* Don't allow silly-rename files be moved around. */</div><div class='hunk'>@@ -1913,6 +2072,8 @@ static int afs_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> 	vnode = AFS_FS_I(d_inode(old_dentry));</div><div class='ctx'> 	orig_dvnode = AFS_FS_I(old_dir);</div><div class='ctx'> 	new_dvnode = AFS_FS_I(new_dir);</div><div class='add'>+	if (d_is_positive(new_dentry))</div><div class='add'>+		new_vnode = AFS_FS_I(d_inode(new_dentry));</div><div class='ctx'> </div><div class='ctx'> 	_enter("{%llx:%llu},{%llx:%llu},{%llx:%llu},{%pd}",</div><div class='ctx'> 	       orig_dvnode-&gt;fid.vid, orig_dvnode-&gt;fid.vnode,</div><div class='hunk'>@@ -1924,11 +2085,20 @@ static int afs_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> 	if (IS_ERR(op))</div><div class='ctx'> 		return PTR_ERR(op);</div><div class='ctx'> </div><div class='add'>+	fscache_use_cookie(afs_vnode_cache(orig_dvnode), true);</div><div class='add'>+	if (new_dvnode != orig_dvnode)</div><div class='add'>+		fscache_use_cookie(afs_vnode_cache(new_dvnode), true);</div><div class='add'>+</div><div class='ctx'> 	ret = afs_validate(vnode, op-&gt;key);</div><div class='del'>-	op-&gt;error = ret;</div><div class='add'>+	afs_op_set_error(op, ret);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto error;</div><div class='ctx'> </div><div class='add'>+	ret = -ENOMEM;</div><div class='add'>+	op-&gt;more_files = kvcalloc(2, sizeof(struct afs_vnode_param), GFP_KERNEL);</div><div class='add'>+	if (!op-&gt;more_files)</div><div class='add'>+		goto error;</div><div class='add'>+</div><div class='ctx'> 	afs_op_set_vnode(op, 0, orig_dvnode);</div><div class='ctx'> 	afs_op_set_vnode(op, 1, new_dvnode); /* May be same as orig_dvnode */</div><div class='ctx'> 	op-&gt;file[0].dv_delta = 1;</div><div class='hunk'>@@ -1937,46 +2107,63 @@ static int afs_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> 	op-&gt;file[1].modification = true;</div><div class='ctx'> 	op-&gt;file[0].update_ctime = true;</div><div class='ctx'> 	op-&gt;file[1].update_ctime = true;</div><div class='add'>+	op-&gt;more_files[0].vnode		= vnode;</div><div class='add'>+	op-&gt;more_files[0].speculative	= true;</div><div class='add'>+	op-&gt;more_files[1].vnode		= new_vnode;</div><div class='add'>+	op-&gt;more_files[1].speculative	= true;</div><div class='add'>+	op-&gt;nr_files = 4;</div><div class='ctx'> </div><div class='ctx'> 	op-&gt;dentry		= old_dentry;</div><div class='ctx'> 	op-&gt;dentry_2		= new_dentry;</div><div class='add'>+	op-&gt;rename.rename_flags	= flags;</div><div class='ctx'> 	op-&gt;rename.new_negative	= d_is_negative(new_dentry);</div><div class='del'>-	op-&gt;ops			= &amp;afs_rename_operation;</div><div class='ctx'> </div><div class='del'>-	/* For non-directories, check whether the target is busy and if so,</div><div class='del'>-	 * make a copy of the dentry and then do a silly-rename.  If the</div><div class='del'>-	 * silly-rename succeeds, the copied dentry is hashed and becomes the</div><div class='del'>-	 * new target.</div><div class='del'>-	 */</div><div class='del'>-	if (d_is_positive(new_dentry) &amp;&amp; !d_is_dir(new_dentry)) {</div><div class='del'>-		/* To prevent any new references to the target during the</div><div class='del'>-		 * rename, we unhash the dentry in advance.</div><div class='add'>+	if (flags &amp; RENAME_NOREPLACE) {</div><div class='add'>+		op-&gt;ops		= &amp;afs_rename_noreplace_operation;</div><div class='add'>+	} else if (flags &amp; RENAME_EXCHANGE) {</div><div class='add'>+		op-&gt;ops		= &amp;afs_rename_exchange_operation;</div><div class='add'>+		d_drop(new_dentry);</div><div class='add'>+	} else {</div><div class='add'>+		/* If we might displace the target, we might need to do silly</div><div class='add'>+		 * rename.</div><div class='ctx'> 		 */</div><div class='del'>-		if (!d_unhashed(new_dentry)) {</div><div class='del'>-			d_drop(new_dentry);</div><div class='del'>-			op-&gt;rename.rehash = new_dentry;</div><div class='del'>-		}</div><div class='add'>+		op-&gt;ops	= &amp;afs_rename_operation;</div><div class='ctx'> </div><div class='del'>-		if (d_count(new_dentry) &gt; 2) {</div><div class='del'>-			/* copy the target dentry's name */</div><div class='del'>-			op-&gt;rename.tmp = d_alloc(new_dentry-&gt;d_parent,</div><div class='del'>-						 &amp;new_dentry-&gt;d_name);</div><div class='del'>-			if (!op-&gt;rename.tmp) {</div><div class='del'>-				op-&gt;error = -ENOMEM;</div><div class='del'>-				goto error;</div><div class='add'>+		/* For non-directories, check whether the target is busy and if</div><div class='add'>+		 * so, make a copy of the dentry and then do a silly-rename.</div><div class='add'>+		 * If the silly-rename succeeds, the copied dentry is hashed</div><div class='add'>+		 * and becomes the new target.</div><div class='add'>+		 */</div><div class='add'>+		if (d_is_positive(new_dentry) &amp;&amp; !d_is_dir(new_dentry)) {</div><div class='add'>+			/* To prevent any new references to the target during</div><div class='add'>+			 * the rename, we unhash the dentry in advance.</div><div class='add'>+			 */</div><div class='add'>+			if (!d_unhashed(new_dentry)) {</div><div class='add'>+				d_drop(new_dentry);</div><div class='add'>+				op-&gt;rename.rehash = new_dentry;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			ret = afs_sillyrename(new_dvnode,</div><div class='del'>-					      AFS_FS_I(d_inode(new_dentry)),</div><div class='del'>-					      new_dentry, op-&gt;key);</div><div class='del'>-			if (ret) {</div><div class='del'>-				op-&gt;error = ret;</div><div class='del'>-				goto error;</div><div class='add'>+			if (d_count(new_dentry) &gt; 2) {</div><div class='add'>+				/* copy the target dentry's name */</div><div class='add'>+				op-&gt;rename.tmp = d_alloc(new_dentry-&gt;d_parent,</div><div class='add'>+							 &amp;new_dentry-&gt;d_name);</div><div class='add'>+				if (!op-&gt;rename.tmp) {</div><div class='add'>+					afs_op_nomem(op);</div><div class='add'>+					goto error;</div><div class='add'>+				}</div><div class='add'>+</div><div class='add'>+				ret = afs_sillyrename(new_dvnode,</div><div class='add'>+						      AFS_FS_I(d_inode(new_dentry)),</div><div class='add'>+						      new_dentry, op-&gt;key);</div><div class='add'>+				if (ret) {</div><div class='add'>+					afs_op_set_error(op, ret);</div><div class='add'>+					goto error;</div><div class='add'>+				}</div><div class='add'>+</div><div class='add'>+				op-&gt;dentry_2 = op-&gt;rename.tmp;</div><div class='add'>+				op-&gt;rename.rehash = NULL;</div><div class='add'>+				op-&gt;rename.new_negative = true;</div><div class='ctx'> 			}</div><div class='del'>-</div><div class='del'>-			op-&gt;dentry_2 = op-&gt;rename.tmp;</div><div class='del'>-			op-&gt;rename.rehash = NULL;</div><div class='del'>-			op-&gt;rename.new_negative = true;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1991,49 +2178,45 @@ static int afs_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> 	 */</div><div class='ctx'> 	d_drop(old_dentry);</div><div class='ctx'> </div><div class='del'>-	return afs_do_sync_operation(op);</div><div class='add'>+	ret = afs_do_sync_operation(op);</div><div class='add'>+	if (ret == -ENOTSUPP)</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+out:</div><div class='add'>+	afs_dir_unuse_cookie(orig_dvnode, ret);</div><div class='add'>+	if (new_dvnode != orig_dvnode)</div><div class='add'>+		afs_dir_unuse_cookie(new_dvnode, ret);</div><div class='add'>+	return ret;</div><div class='ctx'> </div><div class='ctx'> error:</div><div class='del'>-	return afs_put_operation(op);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Release a directory folio and clean up its private state if it's not busy</div><div class='del'>- * - return true if the folio can now be released, false if not</div><div class='del'>- */</div><div class='del'>-static int afs_dir_releasepage(struct page *subpage, gfp_t gfp_flags)</div><div class='del'>-{</div><div class='del'>-	struct folio *folio = page_folio(subpage);</div><div class='del'>-	struct afs_vnode *dvnode = AFS_FS_I(folio_inode(folio));</div><div class='del'>-</div><div class='del'>-	_enter("{{%llx:%llu}[%lu]}", dvnode-&gt;fid.vid, dvnode-&gt;fid.vnode, folio_index(folio));</div><div class='del'>-</div><div class='del'>-	folio_detach_private(folio);</div><div class='del'>-</div><div class='del'>-	/* The directory will need reloading. */</div><div class='del'>-	if (test_and_clear_bit(AFS_VNODE_DIR_VALID, &amp;dvnode-&gt;flags))</div><div class='del'>-		afs_stat_v(dvnode, n_relpg);</div><div class='del'>-	return true;</div><div class='add'>+	ret = afs_put_operation(op);</div><div class='add'>+	goto out;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Invalidate part or all of a folio.</div><div class='add'>+ * Write the file contents to the cache as a single blob.</div><div class='ctx'>  */</div><div class='del'>-static void afs_dir_invalidatepage(struct page *subpage, unsigned int offset,</div><div class='del'>-				   unsigned int length)</div><div class='add'>+int afs_single_writepages(struct address_space *mapping,</div><div class='add'>+			  struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='del'>-	struct folio *folio = page_folio(subpage);</div><div class='del'>-	struct afs_vnode *dvnode = AFS_FS_I(folio_inode(folio));</div><div class='del'>-</div><div class='del'>-	_enter("{%lu},%u,%u", folio_index(folio), offset, length);</div><div class='del'>-</div><div class='del'>-	BUG_ON(!folio_test_locked(folio));</div><div class='add'>+	struct afs_vnode *dvnode = AFS_FS_I(mapping-&gt;host);</div><div class='add'>+	struct iov_iter iter;</div><div class='add'>+	bool is_dir = (S_ISDIR(dvnode-&gt;netfs.inode.i_mode) &amp;&amp;</div><div class='add'>+		       !test_bit(AFS_VNODE_MOUNTPOINT, &amp;dvnode-&gt;flags));</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	/* The directory will need reloading. */</div><div class='del'>-	if (test_and_clear_bit(AFS_VNODE_DIR_VALID, &amp;dvnode-&gt;flags))</div><div class='del'>-		afs_stat_v(dvnode, n_inval);</div><div class='add'>+	/* Need to lock to prevent the folio queue and folios from being thrown</div><div class='add'>+	 * away.</div><div class='add'>+	 */</div><div class='add'>+	down_read(&amp;dvnode-&gt;validate_lock);</div><div class='add'>+</div><div class='add'>+	if (is_dir ?</div><div class='add'>+	    test_bit(AFS_VNODE_DIR_VALID, &amp;dvnode-&gt;flags) :</div><div class='add'>+	    atomic64_read(&amp;dvnode-&gt;cb_expires_at) != AFS_NO_CB_PROMISE) {</div><div class='add'>+		iov_iter_folio_queue(&amp;iter, ITER_SOURCE, dvnode-&gt;directory, 0, 0,</div><div class='add'>+				     i_size_read(&amp;dvnode-&gt;netfs.inode));</div><div class='add'>+		ret = netfs_writeback_single(mapping, wbc, &amp;iter);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	/* we clean up only if the entire folio is being invalidated */</div><div class='del'>-	if (offset == 0 &amp;&amp; length == folio_size(folio))</div><div class='del'>-		folio_detach_private(folio);</div><div class='add'>+	up_read(&amp;dvnode-&gt;validate_lock);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/afs/dir_edit.c b/fs/afs/dir_edit.c<br/>index d98e109ecee9..fd3aa9f97ce6 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/dir_edit.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/dir_edit.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/dir_edit.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/dir_edit.c</a></div><div class='hunk'>@@ -10,6 +10,7 @@</div><div class='ctx'> #include &lt;linux/namei.h&gt;</div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='ctx'> #include &lt;linux/iversion.h&gt;</div><div class='add'>+#include &lt;linux/folio_queue.h&gt;</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> #include "xdr_fs.h"</div><div class='ctx'> </div><div class='hunk'>@@ -105,31 +106,66 @@ static void afs_clear_contig_bits(union afs_xdr_dir_block *block,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Get a new directory folio.</div><div class='add'>+ * Get a specific block, extending the directory storage to cover it as needed.</div><div class='ctx'>  */</div><div class='del'>-static struct folio *afs_dir_get_folio(struct afs_vnode *vnode, pgoff_t index)</div><div class='add'>+static union afs_xdr_dir_block *afs_dir_get_block(struct afs_dir_iter *iter, size_t block)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *mapping = vnode-&gt;vfs_inode.i_mapping;</div><div class='add'>+	struct folio_queue *fq;</div><div class='add'>+	struct afs_vnode *dvnode = iter-&gt;dvnode;</div><div class='ctx'> 	struct folio *folio;</div><div class='add'>+	size_t blpos = block * AFS_DIR_BLOCK_SIZE;</div><div class='add'>+	size_t blend = (block + 1) * AFS_DIR_BLOCK_SIZE, fpos = iter-&gt;fpos;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (dvnode-&gt;directory_size &lt; blend) {</div><div class='add'>+		size_t cur_size = dvnode-&gt;directory_size;</div><div class='add'>+</div><div class='add'>+		ret = netfs_alloc_folioq_buffer(</div><div class='add'>+			NULL, &amp;dvnode-&gt;directory, &amp;cur_size, blend,</div><div class='add'>+			mapping_gfp_mask(dvnode-&gt;netfs.inode.i_mapping));</div><div class='add'>+		dvnode-&gt;directory_size = cur_size;</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto fail;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	folio = __filemap_get_folio(mapping, index,</div><div class='del'>-				    FGP_LOCK | FGP_ACCESSED | FGP_CREAT,</div><div class='del'>-				    mapping-&gt;gfp_mask);</div><div class='del'>-	if (!folio)</div><div class='del'>-		clear_bit(AFS_VNODE_DIR_VALID, &amp;vnode-&gt;flags);</div><div class='del'>-	else if (folio &amp;&amp; !folio_test_private(folio))</div><div class='del'>-		folio_attach_private(folio, (void *)1);</div><div class='add'>+	fq = iter-&gt;fq;</div><div class='add'>+	if (!fq)</div><div class='add'>+		fq = dvnode-&gt;directory;</div><div class='add'>+</div><div class='add'>+	/* Search the folio queue for the folio containing the block... */</div><div class='add'>+	for (; fq; fq = fq-&gt;next) {</div><div class='add'>+		for (int s = iter-&gt;fq_slot; s &lt; folioq_count(fq); s++) {</div><div class='add'>+			size_t fsize = folioq_folio_size(fq, s);</div><div class='add'>+</div><div class='add'>+			if (blend &lt;= fpos + fsize) {</div><div class='add'>+				/* ... and then return the mapped block. */</div><div class='add'>+				folio = folioq_folio(fq, s);</div><div class='add'>+				if (WARN_ON_ONCE(folio_pos(folio) != fpos))</div><div class='add'>+					goto fail;</div><div class='add'>+				iter-&gt;fq = fq;</div><div class='add'>+				iter-&gt;fq_slot = s;</div><div class='add'>+				iter-&gt;fpos = fpos;</div><div class='add'>+				return kmap_local_folio(folio, blpos - fpos);</div><div class='add'>+			}</div><div class='add'>+			fpos += fsize;</div><div class='add'>+		}</div><div class='add'>+		iter-&gt;fq_slot = 0;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	return folio;</div><div class='add'>+fail:</div><div class='add'>+	iter-&gt;fq = NULL;</div><div class='add'>+	iter-&gt;fq_slot = 0;</div><div class='add'>+	afs_invalidate_dir(dvnode, afs_dir_invalid_edit_get_block);</div><div class='add'>+	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Scan a directory block looking for a dirent of the right name.</div><div class='ctx'>  */</div><div class='del'>-static int afs_dir_scan_block(union afs_xdr_dir_block *block, struct qstr *name,</div><div class='add'>+static int afs_dir_scan_block(const union afs_xdr_dir_block *block, const struct qstr *name,</div><div class='ctx'> 			      unsigned int blocknum)</div><div class='ctx'> {</div><div class='del'>-	union afs_xdr_dirent *de;</div><div class='add'>+	const union afs_xdr_dirent *de;</div><div class='ctx'> 	u64 bitmap;</div><div class='ctx'> 	int d, len, n;</div><div class='ctx'> </div><div class='hunk'>@@ -203,36 +239,32 @@ static void afs_edit_init_block(union afs_xdr_dir_block *meta,</div><div class='ctx'>  * The caller must hold the inode locked.</div><div class='ctx'>  */</div><div class='ctx'> void afs_edit_dir_add(struct afs_vnode *vnode,</div><div class='del'>-		      struct qstr *name, struct afs_fid *new_fid,</div><div class='add'>+		      const struct qstr *name, struct afs_fid *new_fid,</div><div class='ctx'> 		      enum afs_edit_dir_reason why)</div><div class='ctx'> {</div><div class='ctx'> 	union afs_xdr_dir_block *meta, *block;</div><div class='ctx'> 	union afs_xdr_dirent *de;</div><div class='del'>-	struct folio *folio0, *folio;</div><div class='del'>-	unsigned int need_slots, nr_blocks, b;</div><div class='del'>-	pgoff_t index;</div><div class='add'>+	struct afs_dir_iter iter = { .dvnode = vnode };</div><div class='add'>+	unsigned int nr_blocks, b, entry;</div><div class='ctx'> 	loff_t i_size;</div><div class='ctx'> 	int slot;</div><div class='ctx'> </div><div class='ctx'> 	_enter(",,{%d,%s},", name-&gt;len, name-&gt;name);</div><div class='ctx'> </div><div class='del'>-	i_size = i_size_read(&amp;vnode-&gt;vfs_inode);</div><div class='add'>+	i_size = i_size_read(&amp;vnode-&gt;netfs.inode);</div><div class='ctx'> 	if (i_size &gt; AFS_DIR_BLOCK_SIZE * AFS_DIR_MAX_BLOCKS ||</div><div class='ctx'> 	    (i_size &amp; (AFS_DIR_BLOCK_SIZE - 1))) {</div><div class='del'>-		clear_bit(AFS_VNODE_DIR_VALID, &amp;vnode-&gt;flags);</div><div class='add'>+		afs_invalidate_dir(vnode, afs_dir_invalid_edit_add_bad_size);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	folio0 = afs_dir_get_folio(vnode, 0);</div><div class='del'>-	if (!folio0) {</div><div class='del'>-		_leave(" [fgp]");</div><div class='add'>+	meta = afs_dir_get_block(&amp;iter, 0);</div><div class='add'>+	if (!meta)</div><div class='ctx'> 		return;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	/* Work out how many slots we're going to need. */</div><div class='del'>-	need_slots = afs_dir_calc_slots(name-&gt;len);</div><div class='add'>+	iter.nr_slots = afs_dir_calc_slots(name-&gt;len);</div><div class='ctx'> </div><div class='del'>-	meta = kmap_local_folio(folio0, 0);</div><div class='ctx'> 	if (i_size == 0)</div><div class='ctx'> 		goto new_directory;</div><div class='ctx'> 	nr_blocks = i_size / AFS_DIR_BLOCK_SIZE;</div><div class='hunk'>@@ -244,22 +276,21 @@ void afs_edit_dir_add(struct afs_vnode *vnode,</div><div class='ctx'> 		/* If the directory extended into a new folio, then we need to</div><div class='ctx'> 		 * tack a new folio on the end.</div><div class='ctx'> 		 */</div><div class='del'>-		index = b / AFS_DIR_BLOCKS_PER_PAGE;</div><div class='ctx'> 		if (nr_blocks &gt;= AFS_DIR_MAX_BLOCKS)</div><div class='del'>-			goto error;</div><div class='del'>-		if (index &gt;= folio_nr_pages(folio0)) {</div><div class='del'>-			folio = afs_dir_get_folio(vnode, index);</div><div class='del'>-			if (!folio)</div><div class='del'>-				goto error;</div><div class='del'>-		} else {</div><div class='del'>-			folio = folio0;</div><div class='del'>-		}</div><div class='add'>+			goto error_too_many_blocks;</div><div class='ctx'> </div><div class='del'>-		block = kmap_local_folio(folio, b * AFS_DIR_BLOCK_SIZE - folio_file_pos(folio));</div><div class='add'>+		/* Lower dir blocks have a counter in the header we can check. */</div><div class='add'>+		if (b &lt; AFS_DIR_BLOCKS_WITH_CTR &amp;&amp;</div><div class='add'>+		    meta-&gt;meta.alloc_ctrs[b] &lt; iter.nr_slots)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		block = afs_dir_get_block(&amp;iter, b);</div><div class='add'>+		if (!block)</div><div class='add'>+			goto error;</div><div class='ctx'> </div><div class='ctx'> 		/* Abandon the edit if we got a callback break. */</div><div class='ctx'> 		if (!test_bit(AFS_VNODE_DIR_VALID, &amp;vnode-&gt;flags))</div><div class='del'>-			goto invalidated;</div><div class='add'>+			goto already_invalidated;</div><div class='ctx'> </div><div class='ctx'> 		_debug("block %u: %2u %3u %u",</div><div class='ctx'> 		       b,</div><div class='hunk'>@@ -274,31 +305,23 @@ void afs_edit_dir_add(struct afs_vnode *vnode,</div><div class='ctx'> 			afs_set_i_size(vnode, (b + 1) * AFS_DIR_BLOCK_SIZE);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		/* Only lower dir blocks have a counter in the header. */</div><div class='del'>-		if (b &gt;= AFS_DIR_BLOCKS_WITH_CTR ||</div><div class='del'>-		    meta-&gt;meta.alloc_ctrs[b] &gt;= need_slots) {</div><div class='del'>-			/* We need to try and find one or more consecutive</div><div class='del'>-			 * slots to hold the entry.</div><div class='del'>-			 */</div><div class='del'>-			slot = afs_find_contig_bits(block, need_slots);</div><div class='del'>-			if (slot &gt;= 0) {</div><div class='del'>-				_debug("slot %u", slot);</div><div class='del'>-				goto found_space;</div><div class='del'>-			}</div><div class='add'>+		/* We need to try and find one or more consecutive slots to</div><div class='add'>+		 * hold the entry.</div><div class='add'>+		 */</div><div class='add'>+		slot = afs_find_contig_bits(block, iter.nr_slots);</div><div class='add'>+		if (slot &gt;= 0) {</div><div class='add'>+			_debug("slot %u", slot);</div><div class='add'>+			goto found_space;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		kunmap_local(block);</div><div class='del'>-		if (folio != folio0) {</div><div class='del'>-			folio_unlock(folio);</div><div class='del'>-			folio_put(folio);</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* There are no spare slots of sufficient size, yet the operation</div><div class='ctx'> 	 * succeeded.  Download the directory again.</div><div class='ctx'> 	 */</div><div class='ctx'> 	trace_afs_edit_dir(vnode, why, afs_edit_dir_create_nospc, 0, 0, 0, 0, name-&gt;name);</div><div class='del'>-	clear_bit(AFS_VNODE_DIR_VALID, &amp;vnode-&gt;flags);</div><div class='add'>+	afs_invalidate_dir(vnode, afs_dir_invalid_edit_add_no_slots);</div><div class='ctx'> 	goto out_unmap;</div><div class='ctx'> </div><div class='ctx'> new_directory:</div><div class='hunk'>@@ -306,8 +329,7 @@ new_directory:</div><div class='ctx'> 	i_size = AFS_DIR_BLOCK_SIZE;</div><div class='ctx'> 	afs_set_i_size(vnode, i_size);</div><div class='ctx'> 	slot = AFS_DIR_RESV_BLOCKS0;</div><div class='del'>-	folio = folio0;</div><div class='del'>-	block = kmap_local_folio(folio, 0);</div><div class='add'>+	block = afs_dir_get_block(&amp;iter, 0);</div><div class='ctx'> 	nr_blocks = 1;</div><div class='ctx'> 	b = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -325,41 +347,39 @@ found_space:</div><div class='ctx'> 	de-&gt;u.name[name-&gt;len] = 0;</div><div class='ctx'> </div><div class='ctx'> 	/* Adjust the bitmap. */</div><div class='del'>-	afs_set_contig_bits(block, slot, need_slots);</div><div class='del'>-	kunmap_local(block);</div><div class='del'>-	if (folio != folio0) {</div><div class='del'>-		folio_unlock(folio);</div><div class='del'>-		folio_put(folio);</div><div class='del'>-	}</div><div class='add'>+	afs_set_contig_bits(block, slot, iter.nr_slots);</div><div class='ctx'> </div><div class='ctx'> 	/* Adjust the allocation counter. */</div><div class='ctx'> 	if (b &lt; AFS_DIR_BLOCKS_WITH_CTR)</div><div class='del'>-		meta-&gt;meta.alloc_ctrs[b] -= need_slots;</div><div class='add'>+		meta-&gt;meta.alloc_ctrs[b] -= iter.nr_slots;</div><div class='ctx'> </div><div class='del'>-	inode_inc_iversion_raw(&amp;vnode-&gt;vfs_inode);</div><div class='add'>+	/* Adjust the hash chain. */</div><div class='add'>+	entry = b * AFS_DIR_SLOTS_PER_BLOCK + slot;</div><div class='add'>+	iter.bucket = afs_dir_hash_name(name);</div><div class='add'>+	de-&gt;u.hash_next = meta-&gt;meta.hashtable[iter.bucket];</div><div class='add'>+	meta-&gt;meta.hashtable[iter.bucket] = htons(entry);</div><div class='add'>+	kunmap_local(block);</div><div class='add'>+</div><div class='add'>+	inode_inc_iversion_raw(&amp;vnode-&gt;netfs.inode);</div><div class='ctx'> 	afs_stat_v(vnode, n_dir_cr);</div><div class='ctx'> 	_debug("Insert %s in %u[%u]", name-&gt;name, b, slot);</div><div class='ctx'> </div><div class='add'>+	netfs_single_mark_inode_dirty(&amp;vnode-&gt;netfs.inode);</div><div class='add'>+</div><div class='ctx'> out_unmap:</div><div class='ctx'> 	kunmap_local(meta);</div><div class='del'>-	folio_unlock(folio0);</div><div class='del'>-	folio_put(folio0);</div><div class='ctx'> 	_leave("");</div><div class='ctx'> 	return;</div><div class='ctx'> </div><div class='del'>-invalidated:</div><div class='add'>+already_invalidated:</div><div class='ctx'> 	trace_afs_edit_dir(vnode, why, afs_edit_dir_create_inval, 0, 0, 0, 0, name-&gt;name);</div><div class='del'>-	clear_bit(AFS_VNODE_DIR_VALID, &amp;vnode-&gt;flags);</div><div class='ctx'> 	kunmap_local(block);</div><div class='del'>-	if (folio != folio0) {</div><div class='del'>-		folio_unlock(folio);</div><div class='del'>-		folio_put(folio);</div><div class='del'>-	}</div><div class='ctx'> 	goto out_unmap;</div><div class='ctx'> </div><div class='add'>+error_too_many_blocks:</div><div class='add'>+	afs_invalidate_dir(vnode, afs_dir_invalid_edit_add_too_many_blocks);</div><div class='ctx'> error:</div><div class='ctx'> 	trace_afs_edit_dir(vnode, why, afs_edit_dir_create_error, 0, 0, 0, 0, name-&gt;name);</div><div class='del'>-	clear_bit(AFS_VNODE_DIR_VALID, &amp;vnode-&gt;flags);</div><div class='ctx'> 	goto out_unmap;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -371,123 +391,258 @@ error:</div><div class='ctx'>  * The caller must hold the inode locked.</div><div class='ctx'>  */</div><div class='ctx'> void afs_edit_dir_remove(struct afs_vnode *vnode,</div><div class='del'>-			 struct qstr *name, enum afs_edit_dir_reason why)</div><div class='add'>+			 const struct qstr *name, enum afs_edit_dir_reason why)</div><div class='ctx'> {</div><div class='del'>-	union afs_xdr_dir_block *meta, *block;</div><div class='del'>-	union afs_xdr_dirent *de;</div><div class='del'>-	struct folio *folio0, *folio;</div><div class='del'>-	unsigned int need_slots, nr_blocks, b;</div><div class='del'>-	pgoff_t index;</div><div class='add'>+	union afs_xdr_dir_block *meta, *block, *pblock;</div><div class='add'>+	union afs_xdr_dirent *de, *pde;</div><div class='add'>+	struct afs_dir_iter iter = { .dvnode = vnode };</div><div class='add'>+	struct afs_fid fid;</div><div class='add'>+	unsigned int b, slot, entry;</div><div class='ctx'> 	loff_t i_size;</div><div class='del'>-	int slot;</div><div class='add'>+	__be16 next;</div><div class='add'>+	int found;</div><div class='ctx'> </div><div class='ctx'> 	_enter(",,{%d,%s},", name-&gt;len, name-&gt;name);</div><div class='ctx'> </div><div class='del'>-	i_size = i_size_read(&amp;vnode-&gt;vfs_inode);</div><div class='add'>+	i_size = i_size_read(&amp;vnode-&gt;netfs.inode);</div><div class='ctx'> 	if (i_size &lt; AFS_DIR_BLOCK_SIZE ||</div><div class='ctx'> 	    i_size &gt; AFS_DIR_BLOCK_SIZE * AFS_DIR_MAX_BLOCKS ||</div><div class='ctx'> 	    (i_size &amp; (AFS_DIR_BLOCK_SIZE - 1))) {</div><div class='del'>-		clear_bit(AFS_VNODE_DIR_VALID, &amp;vnode-&gt;flags);</div><div class='add'>+		afs_invalidate_dir(vnode, afs_dir_invalid_edit_rem_bad_size);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='del'>-	nr_blocks = i_size / AFS_DIR_BLOCK_SIZE;</div><div class='ctx'> </div><div class='del'>-	folio0 = afs_dir_get_folio(vnode, 0);</div><div class='del'>-	if (!folio0) {</div><div class='del'>-		_leave(" [fgp]");</div><div class='add'>+	if (!afs_dir_init_iter(&amp;iter, name))</div><div class='ctx'> 		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Work out how many slots we're going to discard. */</div><div class='del'>-	need_slots = afs_dir_calc_slots(name-&gt;len);</div><div class='del'>-</div><div class='del'>-	meta = kmap_local_folio(folio0, 0);</div><div class='del'>-</div><div class='del'>-	/* Find a block that has sufficient slots available.  Each folio</div><div class='del'>-	 * contains two or more directory blocks.</div><div class='del'>-	 */</div><div class='del'>-	for (b = 0; b &lt; nr_blocks; b++) {</div><div class='del'>-		index = b / AFS_DIR_BLOCKS_PER_PAGE;</div><div class='del'>-		if (index &gt;= folio_nr_pages(folio0)) {</div><div class='del'>-			folio = afs_dir_get_folio(vnode, index);</div><div class='del'>-			if (!folio)</div><div class='del'>-				goto error;</div><div class='del'>-		} else {</div><div class='del'>-			folio = folio0;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		block = kmap_local_folio(folio, b * AFS_DIR_BLOCK_SIZE - folio_file_pos(folio));</div><div class='del'>-</div><div class='del'>-		/* Abandon the edit if we got a callback break. */</div><div class='del'>-		if (!test_bit(AFS_VNODE_DIR_VALID, &amp;vnode-&gt;flags))</div><div class='del'>-			goto invalidated;</div><div class='ctx'> </div><div class='del'>-		if (b &gt; AFS_DIR_BLOCKS_WITH_CTR ||</div><div class='del'>-		    meta-&gt;meta.alloc_ctrs[b] &lt;= AFS_DIR_SLOTS_PER_BLOCK - 1 - need_slots) {</div><div class='del'>-			slot = afs_dir_scan_block(block, name, b);</div><div class='del'>-			if (slot &gt;= 0)</div><div class='del'>-				goto found_dirent;</div><div class='del'>-		}</div><div class='add'>+	meta = afs_dir_find_block(&amp;iter, 0);</div><div class='add'>+	if (!meta)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-		kunmap_local(block);</div><div class='del'>-		if (folio != folio0) {</div><div class='del'>-			folio_unlock(folio);</div><div class='del'>-			folio_put(folio);</div><div class='del'>-		}</div><div class='add'>+	/* Find the entry in the blob. */</div><div class='add'>+	found = afs_dir_search_bucket(&amp;iter, name, &amp;fid);</div><div class='add'>+	if (found &lt; 0) {</div><div class='add'>+		/* Didn't find the dirent to clobber.  Re-download. */</div><div class='add'>+		trace_afs_edit_dir(vnode, why, afs_edit_dir_delete_noent,</div><div class='add'>+				   0, 0, 0, 0, name-&gt;name);</div><div class='add'>+		afs_invalidate_dir(vnode, afs_dir_invalid_edit_rem_wrong_name);</div><div class='add'>+		goto out_unmap;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Didn't find the dirent to clobber.  Download the directory again. */</div><div class='del'>-	trace_afs_edit_dir(vnode, why, afs_edit_dir_delete_noent,</div><div class='del'>-			   0, 0, 0, 0, name-&gt;name);</div><div class='del'>-	clear_bit(AFS_VNODE_DIR_VALID, &amp;vnode-&gt;flags);</div><div class='del'>-	goto out_unmap;</div><div class='add'>+	entry = found;</div><div class='add'>+	b    = entry / AFS_DIR_SLOTS_PER_BLOCK;</div><div class='add'>+	slot = entry % AFS_DIR_SLOTS_PER_BLOCK;</div><div class='ctx'> </div><div class='del'>-found_dirent:</div><div class='add'>+	block = afs_dir_find_block(&amp;iter, b);</div><div class='add'>+	if (!block)</div><div class='add'>+		goto error;</div><div class='add'>+	if (!test_bit(AFS_VNODE_DIR_VALID, &amp;vnode-&gt;flags))</div><div class='add'>+		goto already_invalidated;</div><div class='add'>+</div><div class='add'>+	/* Check and clear the entry. */</div><div class='ctx'> 	de = &amp;block-&gt;dirents[slot];</div><div class='add'>+	if (de-&gt;u.valid != 1)</div><div class='add'>+		goto error_unmap;</div><div class='ctx'> </div><div class='ctx'> 	trace_afs_edit_dir(vnode, why, afs_edit_dir_delete, b, slot,</div><div class='ctx'> 			   ntohl(de-&gt;u.vnode), ntohl(de-&gt;u.unique),</div><div class='ctx'> 			   name-&gt;name);</div><div class='ctx'> </div><div class='del'>-	memset(de, 0, sizeof(*de) * need_slots);</div><div class='del'>-</div><div class='ctx'> 	/* Adjust the bitmap. */</div><div class='del'>-	afs_clear_contig_bits(block, slot, need_slots);</div><div class='del'>-	kunmap_local(block);</div><div class='del'>-	if (folio != folio0) {</div><div class='del'>-		folio_unlock(folio);</div><div class='del'>-		folio_put(folio);</div><div class='del'>-	}</div><div class='add'>+	afs_clear_contig_bits(block, slot, iter.nr_slots);</div><div class='ctx'> </div><div class='ctx'> 	/* Adjust the allocation counter. */</div><div class='ctx'> 	if (b &lt; AFS_DIR_BLOCKS_WITH_CTR)</div><div class='del'>-		meta-&gt;meta.alloc_ctrs[b] += need_slots;</div><div class='add'>+		meta-&gt;meta.alloc_ctrs[b] += iter.nr_slots;</div><div class='add'>+</div><div class='add'>+	/* Clear the constituent entries. */</div><div class='add'>+	next = de-&gt;u.hash_next;</div><div class='add'>+	memset(de, 0, sizeof(*de) * iter.nr_slots);</div><div class='add'>+	kunmap_local(block);</div><div class='add'>+</div><div class='add'>+	/* Adjust the hash chain: if iter-&gt;prev_entry is 0, the hashtable head</div><div class='add'>+	 * index is previous; otherwise it's slot number of the previous entry.</div><div class='add'>+	 */</div><div class='add'>+	if (!iter.prev_entry) {</div><div class='add'>+		__be16 prev_next = meta-&gt;meta.hashtable[iter.bucket];</div><div class='add'>+</div><div class='add'>+		if (unlikely(prev_next != htons(entry))) {</div><div class='add'>+			pr_warn("%llx:%llx:%x: not head of chain b=%x p=%x,%x e=%x %*s",</div><div class='add'>+				vnode-&gt;fid.vid, vnode-&gt;fid.vnode, vnode-&gt;fid.unique,</div><div class='add'>+				iter.bucket, iter.prev_entry, prev_next, entry,</div><div class='add'>+				name-&gt;len, name-&gt;name);</div><div class='add'>+			goto error;</div><div class='add'>+		}</div><div class='add'>+		meta-&gt;meta.hashtable[iter.bucket] = next;</div><div class='add'>+	} else {</div><div class='add'>+		unsigned int pb = iter.prev_entry / AFS_DIR_SLOTS_PER_BLOCK;</div><div class='add'>+		unsigned int ps = iter.prev_entry % AFS_DIR_SLOTS_PER_BLOCK;</div><div class='add'>+		__be16 prev_next;</div><div class='add'>+</div><div class='add'>+		pblock = afs_dir_find_block(&amp;iter, pb);</div><div class='add'>+		if (!pblock)</div><div class='add'>+			goto error;</div><div class='add'>+		pde = &amp;pblock-&gt;dirents[ps];</div><div class='add'>+		prev_next = pde-&gt;u.hash_next;</div><div class='add'>+		if (prev_next != htons(entry)) {</div><div class='add'>+			kunmap_local(pblock);</div><div class='add'>+			pr_warn("%llx:%llx:%x: not prev in chain b=%x p=%x,%x e=%x %*s",</div><div class='add'>+				vnode-&gt;fid.vid, vnode-&gt;fid.vnode, vnode-&gt;fid.unique,</div><div class='add'>+				iter.bucket, iter.prev_entry, prev_next, entry,</div><div class='add'>+				name-&gt;len, name-&gt;name);</div><div class='add'>+			goto error;</div><div class='add'>+		}</div><div class='add'>+		pde-&gt;u.hash_next = next;</div><div class='add'>+		kunmap_local(pblock);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	netfs_single_mark_inode_dirty(&amp;vnode-&gt;netfs.inode);</div><div class='ctx'> </div><div class='del'>-	inode_set_iversion_raw(&amp;vnode-&gt;vfs_inode, vnode-&gt;status.data_version);</div><div class='add'>+	inode_set_iversion_raw(&amp;vnode-&gt;netfs.inode, vnode-&gt;status.data_version);</div><div class='ctx'> 	afs_stat_v(vnode, n_dir_rm);</div><div class='ctx'> 	_debug("Remove %s from %u[%u]", name-&gt;name, b, slot);</div><div class='ctx'> </div><div class='ctx'> out_unmap:</div><div class='ctx'> 	kunmap_local(meta);</div><div class='del'>-	folio_unlock(folio0);</div><div class='del'>-	folio_put(folio0);</div><div class='ctx'> 	_leave("");</div><div class='ctx'> 	return;</div><div class='ctx'> </div><div class='del'>-invalidated:</div><div class='add'>+already_invalidated:</div><div class='add'>+	kunmap_local(block);</div><div class='ctx'> 	trace_afs_edit_dir(vnode, why, afs_edit_dir_delete_inval,</div><div class='ctx'> 			   0, 0, 0, 0, name-&gt;name);</div><div class='del'>-	clear_bit(AFS_VNODE_DIR_VALID, &amp;vnode-&gt;flags);</div><div class='del'>-	kunmap_local(block);</div><div class='del'>-	if (folio != folio0) {</div><div class='del'>-		folio_unlock(folio);</div><div class='del'>-		folio_put(folio);</div><div class='del'>-	}</div><div class='ctx'> 	goto out_unmap;</div><div class='ctx'> </div><div class='add'>+error_unmap:</div><div class='add'>+	kunmap_local(block);</div><div class='ctx'> error:</div><div class='ctx'> 	trace_afs_edit_dir(vnode, why, afs_edit_dir_delete_error,</div><div class='ctx'> 			   0, 0, 0, 0, name-&gt;name);</div><div class='del'>-	clear_bit(AFS_VNODE_DIR_VALID, &amp;vnode-&gt;flags);</div><div class='ctx'> 	goto out_unmap;</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Edit an entry in a directory to update the vnode it refers to.  This is also</div><div class='add'>+ * used to update the ".." entry in a directory.</div><div class='add'>+ */</div><div class='add'>+void afs_edit_dir_update(struct afs_vnode *vnode, const struct qstr *name,</div><div class='add'>+			 struct afs_vnode *new_dvnode, enum afs_edit_dir_reason why)</div><div class='add'>+{</div><div class='add'>+	union afs_xdr_dir_block *block;</div><div class='add'>+	union afs_xdr_dirent *de;</div><div class='add'>+	struct afs_dir_iter iter = { .dvnode = vnode };</div><div class='add'>+	unsigned int nr_blocks, b;</div><div class='add'>+	loff_t i_size;</div><div class='add'>+	int slot;</div><div class='add'>+</div><div class='add'>+	_enter("");</div><div class='add'>+</div><div class='add'>+	i_size = i_size_read(&amp;vnode-&gt;netfs.inode);</div><div class='add'>+	if (i_size &lt; AFS_DIR_BLOCK_SIZE) {</div><div class='add'>+		afs_invalidate_dir(vnode, afs_dir_invalid_edit_upd_bad_size);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	nr_blocks = i_size / AFS_DIR_BLOCK_SIZE;</div><div class='add'>+</div><div class='add'>+	/* Find a block that has sufficient slots available.  Each folio</div><div class='add'>+	 * contains two or more directory blocks.</div><div class='add'>+	 */</div><div class='add'>+	for (b = 0; b &lt; nr_blocks; b++) {</div><div class='add'>+		block = afs_dir_get_block(&amp;iter, b);</div><div class='add'>+		if (!block)</div><div class='add'>+			goto error;</div><div class='add'>+</div><div class='add'>+		/* Abandon the edit if we got a callback break. */</div><div class='add'>+		if (!test_bit(AFS_VNODE_DIR_VALID, &amp;vnode-&gt;flags))</div><div class='add'>+			goto already_invalidated;</div><div class='add'>+</div><div class='add'>+		slot = afs_dir_scan_block(block, name, b);</div><div class='add'>+		if (slot &gt;= 0)</div><div class='add'>+			goto found_dirent;</div><div class='add'>+</div><div class='add'>+		kunmap_local(block);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Didn't find the dirent to clobber.  Download the directory again. */</div><div class='add'>+	trace_afs_edit_dir(vnode, why, afs_edit_dir_update_nodd,</div><div class='add'>+			   0, 0, 0, 0, name-&gt;name);</div><div class='add'>+	afs_invalidate_dir(vnode, afs_dir_invalid_edit_upd_no_dd);</div><div class='add'>+	goto out;</div><div class='add'>+</div><div class='add'>+found_dirent:</div><div class='add'>+	de = &amp;block-&gt;dirents[slot];</div><div class='add'>+	de-&gt;u.vnode  = htonl(new_dvnode-&gt;fid.vnode);</div><div class='add'>+	de-&gt;u.unique = htonl(new_dvnode-&gt;fid.unique);</div><div class='add'>+</div><div class='add'>+	trace_afs_edit_dir(vnode, why, afs_edit_dir_update_dd, b, slot,</div><div class='add'>+			   ntohl(de-&gt;u.vnode), ntohl(de-&gt;u.unique), name-&gt;name);</div><div class='add'>+</div><div class='add'>+	kunmap_local(block);</div><div class='add'>+	netfs_single_mark_inode_dirty(&amp;vnode-&gt;netfs.inode);</div><div class='add'>+	inode_set_iversion_raw(&amp;vnode-&gt;netfs.inode, vnode-&gt;status.data_version);</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	_leave("");</div><div class='add'>+	return;</div><div class='add'>+</div><div class='add'>+already_invalidated:</div><div class='add'>+	kunmap_local(block);</div><div class='add'>+	trace_afs_edit_dir(vnode, why, afs_edit_dir_update_inval,</div><div class='add'>+			   0, 0, 0, 0, name-&gt;name);</div><div class='add'>+	goto out;</div><div class='add'>+</div><div class='add'>+error:</div><div class='add'>+	trace_afs_edit_dir(vnode, why, afs_edit_dir_update_error,</div><div class='add'>+			   0, 0, 0, 0, name-&gt;name);</div><div class='add'>+	goto out;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Initialise a new directory.  We need to fill in the "." and ".." entries.</div><div class='add'>+ */</div><div class='add'>+void afs_mkdir_init_dir(struct afs_vnode *dvnode, struct afs_vnode *parent_dvnode)</div><div class='add'>+{</div><div class='add'>+	union afs_xdr_dir_block *meta;</div><div class='add'>+	struct afs_dir_iter iter = { .dvnode = dvnode };</div><div class='add'>+	union afs_xdr_dirent *de;</div><div class='add'>+	unsigned int slot = AFS_DIR_RESV_BLOCKS0;</div><div class='add'>+	loff_t i_size;</div><div class='add'>+</div><div class='add'>+	i_size = i_size_read(&amp;dvnode-&gt;netfs.inode);</div><div class='add'>+	if (i_size != AFS_DIR_BLOCK_SIZE) {</div><div class='add'>+		afs_invalidate_dir(dvnode, afs_dir_invalid_edit_add_bad_size);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	meta = afs_dir_get_block(&amp;iter, 0);</div><div class='add'>+	if (!meta)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	afs_edit_init_block(meta, meta, 0);</div><div class='add'>+</div><div class='add'>+	de = &amp;meta-&gt;dirents[slot];</div><div class='add'>+	de-&gt;u.valid  = 1;</div><div class='add'>+	de-&gt;u.vnode  = htonl(dvnode-&gt;fid.vnode);</div><div class='add'>+	de-&gt;u.unique = htonl(dvnode-&gt;fid.unique);</div><div class='add'>+	memcpy(de-&gt;u.name, ".", 2);</div><div class='add'>+	trace_afs_edit_dir(dvnode, afs_edit_dir_for_mkdir, afs_edit_dir_mkdir, 0, slot,</div><div class='add'>+			   dvnode-&gt;fid.vnode, dvnode-&gt;fid.unique, ".");</div><div class='add'>+	slot++;</div><div class='add'>+</div><div class='add'>+	de = &amp;meta-&gt;dirents[slot];</div><div class='add'>+	de-&gt;u.valid  = 1;</div><div class='add'>+	de-&gt;u.vnode  = htonl(parent_dvnode-&gt;fid.vnode);</div><div class='add'>+	de-&gt;u.unique = htonl(parent_dvnode-&gt;fid.unique);</div><div class='add'>+	memcpy(de-&gt;u.name, "..", 3);</div><div class='add'>+	trace_afs_edit_dir(dvnode, afs_edit_dir_for_mkdir, afs_edit_dir_mkdir, 0, slot,</div><div class='add'>+			   parent_dvnode-&gt;fid.vnode, parent_dvnode-&gt;fid.unique, "..");</div><div class='add'>+</div><div class='add'>+	afs_set_contig_bits(meta, AFS_DIR_RESV_BLOCKS0, 2);</div><div class='add'>+	meta-&gt;meta.alloc_ctrs[0] -= 2;</div><div class='add'>+	kunmap_local(meta);</div><div class='add'>+</div><div class='add'>+	netfs_single_mark_inode_dirty(&amp;dvnode-&gt;netfs.inode);</div><div class='add'>+	set_bit(AFS_VNODE_DIR_VALID, &amp;dvnode-&gt;flags);</div><div class='add'>+	set_bit(AFS_VNODE_DIR_READ, &amp;dvnode-&gt;flags);</div><div class='add'>+}</div><div class='head'>diff --git a/fs/afs/dir_search.c b/fs/afs/dir_search.c<br/>new file mode 100644<br/>index 000000000000..d2516e55b5ed<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/dir_search.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/dir_search.c</a></div><div class='hunk'>@@ -0,0 +1,227 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='add'>+/* Search a directory's hash table.</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2024 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ *</div><div class='add'>+ * https://tools.ietf.org/html/draft-keiser-afs3-directory-object-00</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/kernel.h&gt;</div><div class='add'>+#include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/namei.h&gt;</div><div class='add'>+#include &lt;linux/iversion.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+#include "afs_fs.h"</div><div class='add'>+#include "xdr_fs.h"</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Calculate the name hash.</div><div class='add'>+ */</div><div class='add'>+unsigned int afs_dir_hash_name(const struct qstr *name)</div><div class='add'>+{</div><div class='add'>+	const unsigned char *p = name-&gt;name;</div><div class='add'>+	unsigned int hash = 0, i;</div><div class='add'>+	int bucket;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; name-&gt;len; i++)</div><div class='add'>+		hash = (hash * 173) + p[i];</div><div class='add'>+	bucket = hash &amp; (AFS_DIR_HASHTBL_SIZE - 1);</div><div class='add'>+	if (hash &gt; INT_MAX) {</div><div class='add'>+		bucket = AFS_DIR_HASHTBL_SIZE - bucket;</div><div class='add'>+		bucket &amp;= (AFS_DIR_HASHTBL_SIZE - 1);</div><div class='add'>+	}</div><div class='add'>+	return bucket;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Reset a directory iterator.</div><div class='add'>+ */</div><div class='add'>+static bool afs_dir_reset_iter(struct afs_dir_iter *iter)</div><div class='add'>+{</div><div class='add'>+	unsigned long long i_size = i_size_read(&amp;iter-&gt;dvnode-&gt;netfs.inode);</div><div class='add'>+	unsigned int nblocks;</div><div class='add'>+</div><div class='add'>+	/* Work out the maximum number of steps we can take. */</div><div class='add'>+	nblocks = umin(i_size / AFS_DIR_BLOCK_SIZE, AFS_DIR_MAX_BLOCKS);</div><div class='add'>+	if (!nblocks)</div><div class='add'>+		return false;</div><div class='add'>+	iter-&gt;loop_check = nblocks * (AFS_DIR_SLOTS_PER_BLOCK - AFS_DIR_RESV_BLOCKS);</div><div class='add'>+	iter-&gt;prev_entry = 0; /* Hash head is previous */</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Initialise a directory iterator for looking up a name.</div><div class='add'>+ */</div><div class='add'>+bool afs_dir_init_iter(struct afs_dir_iter *iter, const struct qstr *name)</div><div class='add'>+{</div><div class='add'>+	iter-&gt;nr_slots = afs_dir_calc_slots(name-&gt;len);</div><div class='add'>+	iter-&gt;bucket = afs_dir_hash_name(name);</div><div class='add'>+	return afs_dir_reset_iter(iter);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Get a specific block.</div><div class='add'>+ */</div><div class='add'>+union afs_xdr_dir_block *afs_dir_find_block(struct afs_dir_iter *iter, size_t block)</div><div class='add'>+{</div><div class='add'>+	struct folio_queue *fq = iter-&gt;fq;</div><div class='add'>+	struct afs_vnode *dvnode = iter-&gt;dvnode;</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	size_t blpos = block * AFS_DIR_BLOCK_SIZE;</div><div class='add'>+	size_t blend = (block + 1) * AFS_DIR_BLOCK_SIZE, fpos = iter-&gt;fpos;</div><div class='add'>+	int slot = iter-&gt;fq_slot;</div><div class='add'>+</div><div class='add'>+	_enter("%zx,%d", block, slot);</div><div class='add'>+</div><div class='add'>+	if (iter-&gt;block) {</div><div class='add'>+		kunmap_local(iter-&gt;block);</div><div class='add'>+		iter-&gt;block = NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (dvnode-&gt;directory_size &lt; blend)</div><div class='add'>+		goto fail;</div><div class='add'>+</div><div class='add'>+	if (!fq || blpos &lt; fpos) {</div><div class='add'>+		fq = dvnode-&gt;directory;</div><div class='add'>+		slot = 0;</div><div class='add'>+		fpos = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Search the folio queue for the folio containing the block... */</div><div class='add'>+	for (; fq; fq = fq-&gt;next) {</div><div class='add'>+		for (; slot &lt; folioq_count(fq); slot++) {</div><div class='add'>+			size_t fsize = folioq_folio_size(fq, slot);</div><div class='add'>+</div><div class='add'>+			if (blend &lt;= fpos + fsize) {</div><div class='add'>+				/* ... and then return the mapped block. */</div><div class='add'>+				folio = folioq_folio(fq, slot);</div><div class='add'>+				if (WARN_ON_ONCE(folio_pos(folio) != fpos))</div><div class='add'>+					goto fail;</div><div class='add'>+				iter-&gt;fq = fq;</div><div class='add'>+				iter-&gt;fq_slot = slot;</div><div class='add'>+				iter-&gt;fpos = fpos;</div><div class='add'>+				iter-&gt;block = kmap_local_folio(folio, blpos - fpos);</div><div class='add'>+				return iter-&gt;block;</div><div class='add'>+			}</div><div class='add'>+			fpos += fsize;</div><div class='add'>+		}</div><div class='add'>+		slot = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+fail:</div><div class='add'>+	iter-&gt;fq = NULL;</div><div class='add'>+	iter-&gt;fq_slot = 0;</div><div class='add'>+	afs_invalidate_dir(dvnode, afs_dir_invalid_edit_get_block);</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Search through a directory bucket.</div><div class='add'>+ */</div><div class='add'>+int afs_dir_search_bucket(struct afs_dir_iter *iter, const struct qstr *name,</div><div class='add'>+			  struct afs_fid *_fid)</div><div class='add'>+{</div><div class='add'>+	const union afs_xdr_dir_block *meta;</div><div class='add'>+	unsigned int entry;</div><div class='add'>+	int ret = -ESTALE;</div><div class='add'>+</div><div class='add'>+	meta = afs_dir_find_block(iter, 0);</div><div class='add'>+	if (!meta)</div><div class='add'>+		return -ESTALE;</div><div class='add'>+</div><div class='add'>+	entry = ntohs(meta-&gt;meta.hashtable[iter-&gt;bucket &amp; (AFS_DIR_HASHTBL_SIZE - 1)]);</div><div class='add'>+	_enter("%x,%x", iter-&gt;bucket, entry);</div><div class='add'>+</div><div class='add'>+	while (entry) {</div><div class='add'>+		const union afs_xdr_dir_block *block;</div><div class='add'>+		const union afs_xdr_dirent *dire;</div><div class='add'>+		unsigned int blnum = entry / AFS_DIR_SLOTS_PER_BLOCK;</div><div class='add'>+		unsigned int slot = entry % AFS_DIR_SLOTS_PER_BLOCK;</div><div class='add'>+		unsigned int resv = (blnum == 0 ? AFS_DIR_RESV_BLOCKS0 : AFS_DIR_RESV_BLOCKS);</div><div class='add'>+</div><div class='add'>+		_debug("search %x", entry);</div><div class='add'>+</div><div class='add'>+		if (slot &lt; resv) {</div><div class='add'>+			kdebug("slot out of range h=%x rs=%2x sl=%2x-%2x",</div><div class='add'>+			       iter-&gt;bucket, resv, slot, slot + iter-&gt;nr_slots - 1);</div><div class='add'>+			goto bad;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		block = afs_dir_find_block(iter, blnum);</div><div class='add'>+		if (!block)</div><div class='add'>+			goto bad;</div><div class='add'>+		dire = &amp;block-&gt;dirents[slot];</div><div class='add'>+</div><div class='add'>+		if (slot + iter-&gt;nr_slots &lt;= AFS_DIR_SLOTS_PER_BLOCK &amp;&amp;</div><div class='add'>+		    memcmp(dire-&gt;u.name, name-&gt;name, name-&gt;len) == 0 &amp;&amp;</div><div class='add'>+		    dire-&gt;u.name[name-&gt;len] == '\0') {</div><div class='add'>+			_fid-&gt;vnode  = ntohl(dire-&gt;u.vnode);</div><div class='add'>+			_fid-&gt;unique = ntohl(dire-&gt;u.unique);</div><div class='add'>+			ret = entry;</div><div class='add'>+			goto found;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		iter-&gt;prev_entry = entry;</div><div class='add'>+		entry = ntohs(dire-&gt;u.hash_next);</div><div class='add'>+		if (!--iter-&gt;loop_check) {</div><div class='add'>+			kdebug("dir chain loop h=%x", iter-&gt;bucket);</div><div class='add'>+			goto bad;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = -ENOENT;</div><div class='add'>+found:</div><div class='add'>+	if (iter-&gt;block) {</div><div class='add'>+		kunmap_local(iter-&gt;block);</div><div class='add'>+		iter-&gt;block = NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+bad:</div><div class='add'>+	if (ret == -ESTALE)</div><div class='add'>+		afs_invalidate_dir(iter-&gt;dvnode, afs_dir_invalid_iter_stale);</div><div class='add'>+	_leave(" = %d", ret);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Search the appropriate hash chain in the contents of an AFS directory.</div><div class='add'>+ */</div><div class='add'>+int afs_dir_search(struct afs_vnode *dvnode, const struct qstr *name,</div><div class='add'>+		   struct afs_fid *_fid, afs_dataversion_t *_dir_version)</div><div class='add'>+{</div><div class='add'>+	struct afs_dir_iter iter = { .dvnode = dvnode, };</div><div class='add'>+	int ret, retry_limit = 3;</div><div class='add'>+</div><div class='add'>+	_enter("{%lu},,,", dvnode-&gt;netfs.inode.i_ino);</div><div class='add'>+</div><div class='add'>+	if (!afs_dir_init_iter(&amp;iter, name))</div><div class='add'>+		return -ENOENT;</div><div class='add'>+	do {</div><div class='add'>+		if (--retry_limit &lt; 0) {</div><div class='add'>+			pr_warn("afs_read_dir(): Too many retries\n");</div><div class='add'>+			ret = -ESTALE;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		ret = afs_read_dir(dvnode, NULL);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			if (ret != -ESTALE)</div><div class='add'>+				break;</div><div class='add'>+			if (test_bit(AFS_VNODE_DELETED, &amp;dvnode-&gt;flags)) {</div><div class='add'>+				ret = -ESTALE;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+		*_dir_version = inode_peek_iversion_raw(&amp;dvnode-&gt;netfs.inode);</div><div class='add'>+</div><div class='add'>+		ret = afs_dir_search_bucket(&amp;iter, name, _fid);</div><div class='add'>+		up_read(&amp;dvnode-&gt;validate_lock);</div><div class='add'>+		if (ret == -ESTALE)</div><div class='add'>+			afs_dir_reset_iter(&amp;iter);</div><div class='add'>+	} while (ret == -ESTALE);</div><div class='add'>+</div><div class='add'>+	_leave(" = %d", ret);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/afs/dir_silly.c b/fs/afs/dir_silly.c<br/>index 45cfd50a9521..014495d4b868 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/dir_silly.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/dir_silly.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/dir_silly.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/dir_silly.c</a></div><div class='hunk'>@@ -69,6 +69,12 @@ static int afs_do_silly_rename(struct afs_vnode *dvnode, struct afs_vnode *vnode</div><div class='ctx'> 	if (IS_ERR(op))</div><div class='ctx'> 		return PTR_ERR(op);</div><div class='ctx'> </div><div class='add'>+	op-&gt;more_files = kvcalloc(2, sizeof(struct afs_vnode_param), GFP_KERNEL);</div><div class='add'>+	if (!op-&gt;more_files) {</div><div class='add'>+		afs_put_operation(op);</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	afs_op_set_vnode(op, 0, dvnode);</div><div class='ctx'> 	afs_op_set_vnode(op, 1, dvnode);</div><div class='ctx'> 	op-&gt;file[0].dv_delta = 1;</div><div class='hunk'>@@ -77,6 +83,11 @@ static int afs_do_silly_rename(struct afs_vnode *dvnode, struct afs_vnode *vnode</div><div class='ctx'> 	op-&gt;file[1].modification = true;</div><div class='ctx'> 	op-&gt;file[0].update_ctime = true;</div><div class='ctx'> 	op-&gt;file[1].update_ctime = true;</div><div class='add'>+	op-&gt;more_files[0].vnode		= AFS_FS_I(d_inode(old));</div><div class='add'>+	op-&gt;more_files[0].speculative	= true;</div><div class='add'>+	op-&gt;more_files[1].vnode		= AFS_FS_I(d_inode(new));</div><div class='add'>+	op-&gt;more_files[1].speculative	= true;</div><div class='add'>+	op-&gt;nr_files = 4;</div><div class='ctx'> </div><div class='ctx'> 	op-&gt;dentry		= old;</div><div class='ctx'> 	op-&gt;dentry_2		= new;</div><div class='hunk'>@@ -113,16 +124,14 @@ int afs_sillyrename(struct afs_vnode *dvnode, struct afs_vnode *vnode,</div><div class='ctx'> </div><div class='ctx'> 	sdentry = NULL;</div><div class='ctx'> 	do {</div><div class='del'>-		int slen;</div><div class='del'>-</div><div class='ctx'> 		dput(sdentry);</div><div class='ctx'> 		sillycounter++;</div><div class='ctx'> </div><div class='ctx'> 		/* Create a silly name.  Note that the ".__afs" prefix is</div><div class='ctx'> 		 * understood by the salvager and must not be changed.</div><div class='ctx'> 		 */</div><div class='del'>-		slen = scnprintf(silly, sizeof(silly), ".__afs%04X", sillycounter);</div><div class='del'>-		sdentry = lookup_one_len(silly, dentry-&gt;d_parent, slen);</div><div class='add'>+		scnprintf(silly, sizeof(silly), ".__afs%04X", sillycounter);</div><div class='add'>+		sdentry = lookup_noperm(&amp;QSTR(silly), dentry-&gt;d_parent);</div><div class='ctx'> </div><div class='ctx'> 		/* N.B. Better to return EBUSY here ... it could be dangerous</div><div class='ctx'> 		 * to delete the file while it's in use.</div><div class='hunk'>@@ -131,7 +140,7 @@ int afs_sillyrename(struct afs_vnode *dvnode, struct afs_vnode *vnode,</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	} while (!d_is_negative(sdentry));</div><div class='ctx'> </div><div class='del'>-	ihold(&amp;vnode-&gt;vfs_inode);</div><div class='add'>+	ihold(&amp;vnode-&gt;netfs.inode);</div><div class='ctx'> </div><div class='ctx'> 	ret = afs_do_silly_rename(dvnode, vnode, dentry, sdentry, key);</div><div class='ctx'> 	switch (ret) {</div><div class='hunk'>@@ -148,7 +157,7 @@ int afs_sillyrename(struct afs_vnode *dvnode, struct afs_vnode *vnode,</div><div class='ctx'> 		d_drop(sdentry);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	iput(&amp;vnode-&gt;vfs_inode);</div><div class='add'>+	iput(&amp;vnode-&gt;netfs.inode);</div><div class='ctx'> 	dput(sdentry);</div><div class='ctx'> out:</div><div class='ctx'> 	_leave(" = %d", ret);</div><div class='hunk'>@@ -218,7 +227,7 @@ static int afs_do_silly_unlink(struct afs_vnode *dvnode, struct afs_vnode *vnode</div><div class='ctx'> 	/* If there was a conflict with a third party, check the status of the</div><div class='ctx'> 	 * unlinked vnode.</div><div class='ctx'> 	 */</div><div class='del'>-	if (op-&gt;error == 0 &amp;&amp; (op-&gt;flags &amp; AFS_OPERATION_DIR_CONFLICT)) {</div><div class='add'>+	if (op-&gt;cumul_error.error == 0 &amp;&amp; (op-&gt;flags &amp; AFS_OPERATION_DIR_CONFLICT)) {</div><div class='ctx'> 		op-&gt;file[1].update_ctime = false;</div><div class='ctx'> 		op-&gt;fetch_status.which = 1;</div><div class='ctx'> 		op-&gt;ops = &amp;afs_fetch_status_operation;</div><div class='head'>diff --git a/fs/afs/dynroot.c b/fs/afs/dynroot.c<br/>index db832cc931c8..aa56e8951e03 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/dynroot.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/dynroot.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/dynroot.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/dynroot.c</a></div><div class='hunk'>@@ -10,16 +10,19 @@</div><div class='ctx'> #include &lt;linux/dns_resolver.h&gt;</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> </div><div class='del'>-static atomic_t afs_autocell_ino;</div><div class='add'>+#define AFS_MIN_DYNROOT_CELL_INO 4 /* Allow for ., .., @cell, .@cell */</div><div class='add'>+#define AFS_MAX_DYNROOT_CELL_INO ((unsigned int)INT_MAX)</div><div class='add'>+</div><div class='add'>+static struct dentry *afs_lookup_atcell(struct inode *dir, struct dentry *dentry, ino_t ino);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * iget5() comparator for inode created by autocell operations</div><div class='del'>- *</div><div class='del'>- * These pseudo inodes don't match anything.</div><div class='ctx'>  */</div><div class='ctx'> static int afs_iget5_pseudo_test(struct inode *inode, void *opaque)</div><div class='ctx'> {</div><div class='del'>-	return 0;</div><div class='add'>+	struct afs_fid *fid = opaque;</div><div class='add'>+</div><div class='add'>+	return inode-&gt;i_ino == fid-&gt;vnode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -39,28 +42,16 @@ static int afs_iget5_pseudo_set(struct inode *inode, void *opaque)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Create an inode for a dynamic root directory or an autocell dynamic</div><div class='del'>- * automount dir.</div><div class='add'>+ * Create an inode for an autocell dynamic automount dir.</div><div class='ctx'>  */</div><div class='del'>-struct inode *afs_iget_pseudo_dir(struct super_block *sb, bool root)</div><div class='add'>+static struct inode *afs_iget_pseudo_dir(struct super_block *sb, ino_t ino)</div><div class='ctx'> {</div><div class='del'>-	struct afs_super_info *as = AFS_FS_S(sb);</div><div class='ctx'> 	struct afs_vnode *vnode;</div><div class='ctx'> 	struct inode *inode;</div><div class='del'>-	struct afs_fid fid = {};</div><div class='add'>+	struct afs_fid fid = { .vnode = ino, .unique = 1, };</div><div class='ctx'> </div><div class='ctx'> 	_enter("");</div><div class='ctx'> </div><div class='del'>-	if (as-&gt;volume)</div><div class='del'>-		fid.vid = as-&gt;volume-&gt;vid;</div><div class='del'>-	if (root) {</div><div class='del'>-		fid.vnode = 1;</div><div class='del'>-		fid.unique = 1;</div><div class='del'>-	} else {</div><div class='del'>-		fid.vnode = atomic_inc_return(&amp;afs_autocell_ino);</div><div class='del'>-		fid.unique = 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	inode = iget5_locked(sb, fid.vnode,</div><div class='ctx'> 			     afs_iget5_pseudo_test, afs_iget5_pseudo_set, &amp;fid);</div><div class='ctx'> 	if (!inode) {</div><div class='hunk'>@@ -73,148 +64,76 @@ struct inode *afs_iget_pseudo_dir(struct super_block *sb, bool root)</div><div class='ctx'> </div><div class='ctx'> 	vnode = AFS_FS_I(inode);</div><div class='ctx'> </div><div class='del'>-	/* there shouldn't be an existing inode */</div><div class='del'>-	BUG_ON(!(inode-&gt;i_state &amp; I_NEW));</div><div class='del'>-</div><div class='del'>-	inode-&gt;i_size		= 0;</div><div class='del'>-	inode-&gt;i_mode		= S_IFDIR | S_IRUGO | S_IXUGO;</div><div class='del'>-	if (root) {</div><div class='del'>-		inode-&gt;i_op	= &amp;afs_dynroot_inode_operations;</div><div class='del'>-		inode-&gt;i_fop	= &amp;simple_dir_operations;</div><div class='del'>-	} else {</div><div class='del'>-		inode-&gt;i_op	= &amp;afs_autocell_inode_operations;</div><div class='del'>-	}</div><div class='del'>-	set_nlink(inode, 2);</div><div class='del'>-	inode-&gt;i_uid		= GLOBAL_ROOT_UID;</div><div class='del'>-	inode-&gt;i_gid		= GLOBAL_ROOT_GID;</div><div class='del'>-	inode-&gt;i_ctime = inode-&gt;i_atime = inode-&gt;i_mtime = current_time(inode);</div><div class='del'>-	inode-&gt;i_blocks		= 0;</div><div class='del'>-	inode-&gt;i_generation	= 0;</div><div class='del'>-</div><div class='del'>-	set_bit(AFS_VNODE_PSEUDODIR, &amp;vnode-&gt;flags);</div><div class='del'>-	if (!root) {</div><div class='add'>+	if (inode_state_read_once(inode) &amp; I_NEW) {</div><div class='add'>+		netfs_inode_init(&amp;vnode-&gt;netfs, NULL, false);</div><div class='add'>+		simple_inode_init_ts(inode);</div><div class='add'>+		set_nlink(inode, 2);</div><div class='add'>+		inode-&gt;i_size		= 0;</div><div class='add'>+		inode-&gt;i_mode		= S_IFDIR | 0555;</div><div class='add'>+		inode-&gt;i_op		= &amp;afs_autocell_inode_operations;</div><div class='add'>+		inode-&gt;i_uid		= GLOBAL_ROOT_UID;</div><div class='add'>+		inode-&gt;i_gid		= GLOBAL_ROOT_GID;</div><div class='add'>+		inode-&gt;i_blocks		= 0;</div><div class='add'>+		inode-&gt;i_generation	= 0;</div><div class='add'>+		inode-&gt;i_flags		|= S_AUTOMOUNT | S_NOATIME;</div><div class='add'>+</div><div class='add'>+		set_bit(AFS_VNODE_PSEUDODIR, &amp;vnode-&gt;flags);</div><div class='ctx'> 		set_bit(AFS_VNODE_MOUNTPOINT, &amp;vnode-&gt;flags);</div><div class='del'>-		inode-&gt;i_flags |= S_AUTOMOUNT;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_flags |= S_NOATIME;</div><div class='del'>-	unlock_new_inode(inode);</div><div class='add'>+		unlock_new_inode(inode);</div><div class='add'>+	}</div><div class='ctx'> 	_leave(" = %p", inode);</div><div class='ctx'> 	return inode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Probe to see if a cell may exist.  This prevents positive dentries from</div><div class='del'>- * being created unnecessarily.</div><div class='add'>+ * Try to automount the mountpoint with pseudo directory, if the autocell</div><div class='add'>+ * option is set.</div><div class='ctx'>  */</div><div class='del'>-static int afs_probe_cell_name(struct dentry *dentry)</div><div class='add'>+static struct dentry *afs_dynroot_lookup_cell(struct inode *dir, struct dentry *dentry,</div><div class='add'>+					      unsigned int flags)</div><div class='ctx'> {</div><div class='del'>-	struct afs_cell *cell;</div><div class='add'>+	struct afs_cell *cell = NULL;</div><div class='ctx'> 	struct afs_net *net = afs_d2net(dentry);</div><div class='add'>+	struct inode *inode = NULL;</div><div class='ctx'> 	const char *name = dentry-&gt;d_name.name;</div><div class='ctx'> 	size_t len = dentry-&gt;d_name.len;</div><div class='del'>-	int ret;</div><div class='add'>+	bool dotted = false;</div><div class='add'>+	int ret = -ENOENT;</div><div class='ctx'> </div><div class='ctx'> 	/* Names prefixed with a dot are R/W mounts. */</div><div class='ctx'> 	if (name[0] == '.') {</div><div class='del'>-		if (len == 1)</div><div class='del'>-			return -EINVAL;</div><div class='ctx'> 		name++;</div><div class='ctx'> 		len--;</div><div class='add'>+		dotted = true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	cell = afs_find_cell(net, name, len, afs_cell_trace_use_probe);</div><div class='del'>-	if (!IS_ERR(cell)) {</div><div class='del'>-		afs_unuse_cell(net, cell, afs_cell_trace_unuse_probe);</div><div class='del'>-		return 0;</div><div class='add'>+	cell = afs_lookup_cell(net, name, len, NULL,</div><div class='add'>+			       AFS_LOOKUP_CELL_DYNROOT,</div><div class='add'>+			       afs_cell_trace_use_lookup_dynroot);</div><div class='add'>+	if (IS_ERR(cell)) {</div><div class='add'>+		ret = PTR_ERR(cell);</div><div class='add'>+		goto out_no_cell;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = dns_query(net-&gt;net, "afsdb", name, len, "srv=1",</div><div class='del'>-			NULL, NULL, false);</div><div class='del'>-	if (ret == -ENODATA)</div><div class='del'>-		ret = -EDESTADDRREQ;</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Try to auto mount the mountpoint with pseudo directory, if the autocell</div><div class='del'>- * operation is setted.</div><div class='del'>- */</div><div class='del'>-struct inode *afs_try_auto_mntpt(struct dentry *dentry, struct inode *dir)</div><div class='del'>-{</div><div class='del'>-	struct afs_vnode *vnode = AFS_FS_I(dir);</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	int ret = -ENOENT;</div><div class='del'>-</div><div class='del'>-	_enter("%p{%pd}, {%llx:%llu}",</div><div class='del'>-	       dentry, dentry, vnode-&gt;fid.vid, vnode-&gt;fid.vnode);</div><div class='del'>-</div><div class='del'>-	if (!test_bit(AFS_VNODE_AUTOCELL, &amp;vnode-&gt;flags))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	ret = afs_probe_cell_name(dentry);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	inode = afs_iget_pseudo_dir(dir-&gt;i_sb, false);</div><div class='add'>+	inode = afs_iget_pseudo_dir(dir-&gt;i_sb, cell-&gt;dynroot_ino * 2 + dotted);</div><div class='ctx'> 	if (IS_ERR(inode)) {</div><div class='ctx'> 		ret = PTR_ERR(inode);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	_leave("= %p", inode);</div><div class='del'>-	return inode;</div><div class='add'>+	dentry-&gt;d_fsdata = cell;</div><div class='add'>+	return d_splice_alias(inode, dentry);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	_leave("= %d", ret);</div><div class='add'>+	afs_unuse_cell(cell, afs_cell_trace_unuse_lookup_dynroot);</div><div class='add'>+out_no_cell:</div><div class='add'>+	if (!inode)</div><div class='add'>+		return d_splice_alias(inode, dentry);</div><div class='ctx'> 	return ret == -ENOENT ? NULL : ERR_PTR(ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Look up @cell in a dynroot directory.  This is a substitution for the</div><div class='del'>- * local cell name for the net namespace.</div><div class='del'>- */</div><div class='del'>-static struct dentry *afs_lookup_atcell(struct dentry *dentry)</div><div class='del'>-{</div><div class='del'>-	struct afs_cell *cell;</div><div class='del'>-	struct afs_net *net = afs_d2net(dentry);</div><div class='del'>-	struct dentry *ret;</div><div class='del'>-	char *name;</div><div class='del'>-	int len;</div><div class='del'>-</div><div class='del'>-	if (!net-&gt;ws_cell)</div><div class='del'>-		return ERR_PTR(-ENOENT);</div><div class='del'>-</div><div class='del'>-	ret = ERR_PTR(-ENOMEM);</div><div class='del'>-	name = kmalloc(AFS_MAXCELLNAME + 1, GFP_KERNEL);</div><div class='del'>-	if (!name)</div><div class='del'>-		goto out_p;</div><div class='del'>-</div><div class='del'>-	down_read(&amp;net-&gt;cells_lock);</div><div class='del'>-	cell = net-&gt;ws_cell;</div><div class='del'>-	if (cell) {</div><div class='del'>-		len = cell-&gt;name_len;</div><div class='del'>-		memcpy(name, cell-&gt;name, len + 1);</div><div class='del'>-	}</div><div class='del'>-	up_read(&amp;net-&gt;cells_lock);</div><div class='del'>-</div><div class='del'>-	ret = ERR_PTR(-ENOENT);</div><div class='del'>-	if (!cell)</div><div class='del'>-		goto out_n;</div><div class='del'>-</div><div class='del'>-	ret = lookup_one_len(name, dentry-&gt;d_parent, len);</div><div class='del'>-</div><div class='del'>-	/* We don't want to d_add() the @cell dentry here as we don't want to</div><div class='del'>-	 * the cached dentry to hide changes to the local cell name.</div><div class='del'>-	 */</div><div class='del'>-</div><div class='del'>-out_n:</div><div class='del'>-	kfree(name);</div><div class='del'>-out_p:</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * Look up an entry in a dynroot directory.</div><div class='ctx'>  */</div><div class='ctx'> static struct dentry *afs_dynroot_lookup(struct inode *dir, struct dentry *dentry,</div><div class='hunk'>@@ -222,8 +141,6 @@ static struct dentry *afs_dynroot_lookup(struct inode *dir, struct dentry *dentr</div><div class='ctx'> {</div><div class='ctx'> 	_enter("%pd", dentry);</div><div class='ctx'> </div><div class='del'>-	ASSERTCMP(d_inode(dentry), ==, NULL);</div><div class='del'>-</div><div class='ctx'> 	if (flags &amp; LOOKUP_CREATE)</div><div class='ctx'> 		return ERR_PTR(-EOPNOTSUPP);</div><div class='ctx'> </div><div class='hunk'>@@ -234,160 +151,256 @@ static struct dentry *afs_dynroot_lookup(struct inode *dir, struct dentry *dentr</div><div class='ctx'> </div><div class='ctx'> 	if (dentry-&gt;d_name.len == 5 &amp;&amp;</div><div class='ctx'> 	    memcmp(dentry-&gt;d_name.name, "@cell", 5) == 0)</div><div class='del'>-		return afs_lookup_atcell(dentry);</div><div class='add'>+		return afs_lookup_atcell(dir, dentry, 2);</div><div class='add'>+</div><div class='add'>+	if (dentry-&gt;d_name.len == 6 &amp;&amp;</div><div class='add'>+	    memcmp(dentry-&gt;d_name.name, ".@cell", 6) == 0)</div><div class='add'>+		return afs_lookup_atcell(dir, dentry, 3);</div><div class='ctx'> </div><div class='del'>-	return d_splice_alias(afs_try_auto_mntpt(dentry, dir), dentry);</div><div class='add'>+	return afs_dynroot_lookup_cell(dir, dentry, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct inode_operations afs_dynroot_inode_operations = {</div><div class='ctx'> 	.lookup		= afs_dynroot_lookup,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Dirs in the dynamic root don't need revalidation.</div><div class='del'>- */</div><div class='del'>-static int afs_dynroot_d_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='add'>+static void afs_dynroot_d_release(struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	return 1;</div><div class='add'>+	struct afs_cell *cell = dentry-&gt;d_fsdata;</div><div class='add'>+</div><div class='add'>+	afs_unuse_cell(cell, afs_cell_trace_unuse_dynroot_mntpt);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Allow the VFS to enquire as to whether a dentry should be unhashed (mustn't</div><div class='del'>- * sleep)</div><div class='del'>- * - called from dput() when d_count is going to 0.</div><div class='del'>- * - return 1 to request dentry be unhashed, 0 otherwise</div><div class='add'>+ * Keep @cell symlink dentries around, but only keep cell autodirs when they're</div><div class='add'>+ * being used.</div><div class='ctx'>  */</div><div class='del'>-static int afs_dynroot_d_delete(const struct dentry *dentry)</div><div class='add'>+static int afs_dynroot_delete_dentry(const struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	return d_really_is_positive(dentry);</div><div class='add'>+	const struct qstr *name = &amp;dentry-&gt;d_name;</div><div class='add'>+</div><div class='add'>+	if (name-&gt;len == 5 &amp;&amp; memcmp(name-&gt;name, "@cell", 5) == 0)</div><div class='add'>+		return 0;</div><div class='add'>+	if (name-&gt;len == 6 &amp;&amp; memcmp(name-&gt;name, ".@cell", 6) == 0)</div><div class='add'>+		return 0;</div><div class='add'>+	return 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct dentry_operations afs_dynroot_dentry_operations = {</div><div class='del'>-	.d_revalidate	= afs_dynroot_d_revalidate,</div><div class='del'>-	.d_delete	= afs_dynroot_d_delete,</div><div class='del'>-	.d_release	= afs_d_release,</div><div class='add'>+	.d_delete	= afs_dynroot_delete_dentry,</div><div class='add'>+	.d_release	= afs_dynroot_d_release,</div><div class='ctx'> 	.d_automount	= afs_d_automount,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+static void afs_atcell_delayed_put_cell(void *arg)</div><div class='add'>+{</div><div class='add'>+	struct afs_cell *cell = arg;</div><div class='add'>+</div><div class='add'>+	afs_put_cell(cell, afs_cell_trace_put_atcell);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='del'>- * Create a manually added cell mount directory.</div><div class='del'>- * - The caller must hold net-&gt;proc_cells_lock</div><div class='add'>+ * Read @cell or .@cell symlinks.</div><div class='ctx'>  */</div><div class='del'>-int afs_dynroot_mkdir(struct afs_net *net, struct afs_cell *cell)</div><div class='add'>+static const char *afs_atcell_get_link(struct dentry *dentry, struct inode *inode,</div><div class='add'>+				       struct delayed_call *done)</div><div class='ctx'> {</div><div class='del'>-	struct super_block *sb = net-&gt;dynroot_sb;</div><div class='del'>-	struct dentry *root, *subdir;</div><div class='del'>-	int ret;</div><div class='add'>+	struct afs_vnode *vnode = AFS_FS_I(inode);</div><div class='add'>+	struct afs_cell *cell;</div><div class='add'>+	struct afs_net *net = afs_i2net(inode);</div><div class='add'>+	const char *name;</div><div class='add'>+	bool dotted = vnode-&gt;fid.vnode == 3;</div><div class='ctx'> </div><div class='del'>-	if (!sb || atomic_read(&amp;sb-&gt;s_active) == 0)</div><div class='del'>-		return 0;</div><div class='add'>+	if (!rcu_access_pointer(net-&gt;ws_cell))</div><div class='add'>+		return ERR_PTR(-ENOENT);</div><div class='ctx'> </div><div class='del'>-	/* Let the -&gt;lookup op do the creation */</div><div class='del'>-	root = sb-&gt;s_root;</div><div class='del'>-	inode_lock(root-&gt;d_inode);</div><div class='del'>-	subdir = lookup_one_len(cell-&gt;name, root, cell-&gt;name_len);</div><div class='del'>-	if (IS_ERR(subdir)) {</div><div class='del'>-		ret = PTR_ERR(subdir);</div><div class='del'>-		goto unlock;</div><div class='add'>+	if (!dentry) {</div><div class='add'>+		/* We're in RCU-pathwalk. */</div><div class='add'>+		cell = rcu_dereference(net-&gt;ws_cell);</div><div class='add'>+		if (dotted)</div><div class='add'>+			name = cell-&gt;name - 1;</div><div class='add'>+		else</div><div class='add'>+			name = cell-&gt;name;</div><div class='add'>+		/* Shouldn't need to set a delayed call. */</div><div class='add'>+		return name;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Note that we're retaining an extra ref on the dentry */</div><div class='del'>-	subdir-&gt;d_fsdata = (void *)1UL;</div><div class='del'>-	ret = 0;</div><div class='del'>-unlock:</div><div class='del'>-	inode_unlock(root-&gt;d_inode);</div><div class='del'>-	return ret;</div><div class='add'>+	down_read(&amp;net-&gt;cells_lock);</div><div class='add'>+</div><div class='add'>+	cell = rcu_dereference_protected(net-&gt;ws_cell, lockdep_is_held(&amp;net-&gt;cells_lock));</div><div class='add'>+	if (dotted)</div><div class='add'>+		name = cell-&gt;name - 1;</div><div class='add'>+	else</div><div class='add'>+		name = cell-&gt;name;</div><div class='add'>+	afs_get_cell(cell, afs_cell_trace_get_atcell);</div><div class='add'>+	set_delayed_call(done, afs_atcell_delayed_put_cell, cell);</div><div class='add'>+</div><div class='add'>+	up_read(&amp;net-&gt;cells_lock);</div><div class='add'>+	return name;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static const struct inode_operations afs_atcell_inode_operations = {</div><div class='add'>+	.get_link	= afs_atcell_get_link,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> /*</div><div class='del'>- * Remove a manually added cell mount directory.</div><div class='del'>- * - The caller must hold net-&gt;proc_cells_lock</div><div class='add'>+ * Create an inode for the @cell or .@cell symlinks.</div><div class='ctx'>  */</div><div class='del'>-void afs_dynroot_rmdir(struct afs_net *net, struct afs_cell *cell)</div><div class='add'>+static struct dentry *afs_lookup_atcell(struct inode *dir, struct dentry *dentry, ino_t ino)</div><div class='ctx'> {</div><div class='del'>-	struct super_block *sb = net-&gt;dynroot_sb;</div><div class='del'>-	struct dentry *root, *subdir;</div><div class='add'>+	struct afs_vnode *vnode;</div><div class='add'>+	struct inode *inode;</div><div class='add'>+	struct afs_fid fid = { .vnode = ino, .unique = 1, };</div><div class='ctx'> </div><div class='del'>-	if (!sb || atomic_read(&amp;sb-&gt;s_active) == 0)</div><div class='del'>-		return;</div><div class='add'>+	inode = iget5_locked(dir-&gt;i_sb, fid.vnode,</div><div class='add'>+			     afs_iget5_pseudo_test, afs_iget5_pseudo_set, &amp;fid);</div><div class='add'>+	if (!inode)</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='del'>-	root = sb-&gt;s_root;</div><div class='del'>-	inode_lock(root-&gt;d_inode);</div><div class='add'>+	vnode = AFS_FS_I(inode);</div><div class='ctx'> </div><div class='del'>-	/* Don't want to trigger a lookup call, which will re-add the cell */</div><div class='del'>-	subdir = try_lookup_one_len(cell-&gt;name, root, cell-&gt;name_len);</div><div class='del'>-	if (IS_ERR_OR_NULL(subdir)) {</div><div class='del'>-		_debug("lookup %ld", PTR_ERR(subdir));</div><div class='del'>-		goto no_dentry;</div><div class='add'>+	if (inode_state_read_once(inode) &amp; I_NEW) {</div><div class='add'>+		netfs_inode_init(&amp;vnode-&gt;netfs, NULL, false);</div><div class='add'>+		simple_inode_init_ts(inode);</div><div class='add'>+		set_nlink(inode, 1);</div><div class='add'>+		inode-&gt;i_size		= 0;</div><div class='add'>+		inode-&gt;i_mode		= S_IFLNK | 0555;</div><div class='add'>+		inode-&gt;i_op		= &amp;afs_atcell_inode_operations;</div><div class='add'>+		inode-&gt;i_uid		= GLOBAL_ROOT_UID;</div><div class='add'>+		inode-&gt;i_gid		= GLOBAL_ROOT_GID;</div><div class='add'>+		inode-&gt;i_blocks		= 0;</div><div class='add'>+		inode-&gt;i_generation	= 0;</div><div class='add'>+		inode-&gt;i_flags		|= S_NOATIME;</div><div class='add'>+</div><div class='add'>+		unlock_new_inode(inode);</div><div class='ctx'> 	}</div><div class='add'>+	return d_splice_alias(inode, dentry);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Transcribe the cell database into readdir content under the RCU read lock.</div><div class='add'>+ * Each cell produces two entries, one prefixed with a dot and one not.</div><div class='add'>+ */</div><div class='add'>+static int afs_dynroot_readdir_cells(struct afs_net *net, struct dir_context *ctx)</div><div class='add'>+{</div><div class='add'>+	const struct afs_cell *cell;</div><div class='add'>+	loff_t newpos;</div><div class='add'>+</div><div class='add'>+	_enter("%llu", ctx-&gt;pos);</div><div class='add'>+</div><div class='add'>+	for (;;) {</div><div class='add'>+		unsigned int ix = ctx-&gt;pos &gt;&gt; 1;</div><div class='add'>+</div><div class='add'>+		cell = idr_get_next(&amp;net-&gt;cells_dyn_ino, &amp;ix);</div><div class='add'>+		if (!cell)</div><div class='add'>+			return 0;</div><div class='add'>+		if (READ_ONCE(cell-&gt;state) == AFS_CELL_REMOVING ||</div><div class='add'>+		    READ_ONCE(cell-&gt;state) == AFS_CELL_DEAD) {</div><div class='add'>+			ctx-&gt;pos += 2;</div><div class='add'>+			ctx-&gt;pos &amp;= ~1;</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	_debug("rmdir %pd %u", subdir, d_count(subdir));</div><div class='add'>+		newpos = ix &lt;&lt; 1;</div><div class='add'>+		if (newpos &gt; ctx-&gt;pos)</div><div class='add'>+			ctx-&gt;pos = newpos;</div><div class='ctx'> </div><div class='del'>-	if (subdir-&gt;d_fsdata) {</div><div class='del'>-		_debug("unpin %u", d_count(subdir));</div><div class='del'>-		subdir-&gt;d_fsdata = NULL;</div><div class='del'>-		dput(subdir);</div><div class='add'>+		_debug("pos %llu -&gt; cell %u", ctx-&gt;pos, cell-&gt;dynroot_ino);</div><div class='add'>+</div><div class='add'>+		if ((ctx-&gt;pos &amp; 1) == 0) {</div><div class='add'>+			if (!dir_emit(ctx, cell-&gt;name, cell-&gt;name_len,</div><div class='add'>+				      cell-&gt;dynroot_ino, DT_DIR))</div><div class='add'>+				return 0;</div><div class='add'>+			ctx-&gt;pos++;</div><div class='add'>+		}</div><div class='add'>+		if ((ctx-&gt;pos &amp; 1) == 1) {</div><div class='add'>+			if (!dir_emit(ctx, cell-&gt;name - 1, cell-&gt;name_len + 1,</div><div class='add'>+				      cell-&gt;dynroot_ino + 1, DT_DIR))</div><div class='add'>+				return 0;</div><div class='add'>+			ctx-&gt;pos++;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='del'>-	dput(subdir);</div><div class='del'>-no_dentry:</div><div class='del'>-	inode_unlock(root-&gt;d_inode);</div><div class='del'>-	_leave("");</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Populate a newly created dynamic root with cell names.</div><div class='add'>+ * Read the AFS dynamic root directory.  This produces a list of cellnames,</div><div class='add'>+ * dotted and undotted, along with @cell and .@cell links if configured.</div><div class='ctx'>  */</div><div class='del'>-int afs_dynroot_populate(struct super_block *sb)</div><div class='add'>+static int afs_dynroot_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> {</div><div class='del'>-	struct afs_cell *cell;</div><div class='del'>-	struct afs_net *net = afs_sb2net(sb);</div><div class='del'>-	int ret;</div><div class='add'>+	struct afs_net *net = afs_d2net(file-&gt;f_path.dentry);</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;net-&gt;proc_cells_lock);</div><div class='add'>+	if (!dir_emit_dots(file, ctx))</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	net-&gt;dynroot_sb = sb;</div><div class='del'>-	hlist_for_each_entry(cell, &amp;net-&gt;proc_cells, proc_link) {</div><div class='del'>-		ret = afs_dynroot_mkdir(net, cell);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			goto error;</div><div class='add'>+	if (ctx-&gt;pos == 2) {</div><div class='add'>+		if (rcu_access_pointer(net-&gt;ws_cell) &amp;&amp;</div><div class='add'>+		    !dir_emit(ctx, "@cell", 5, 2, DT_LNK))</div><div class='add'>+			return 0;</div><div class='add'>+		ctx-&gt;pos = 3;</div><div class='add'>+	}</div><div class='add'>+	if (ctx-&gt;pos == 3) {</div><div class='add'>+		if (rcu_access_pointer(net-&gt;ws_cell) &amp;&amp;</div><div class='add'>+		    !dir_emit(ctx, ".@cell", 6, 3, DT_LNK))</div><div class='add'>+			return 0;</div><div class='add'>+		ctx-&gt;pos = 4;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = 0;</div><div class='del'>-out:</div><div class='del'>-	mutex_unlock(&amp;net-&gt;proc_cells_lock);</div><div class='add'>+	if ((unsigned long long)ctx-&gt;pos &lt;= AFS_MAX_DYNROOT_CELL_INO) {</div><div class='add'>+		down_read(&amp;net-&gt;cells_lock);</div><div class='add'>+		ret = afs_dynroot_readdir_cells(net, ctx);</div><div class='add'>+		up_read(&amp;net-&gt;cells_lock);</div><div class='add'>+	}</div><div class='ctx'> 	return ret;</div><div class='del'>-</div><div class='del'>-error:</div><div class='del'>-	net-&gt;dynroot_sb = NULL;</div><div class='del'>-	goto out;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static const struct file_operations afs_dynroot_file_operations = {</div><div class='add'>+	.llseek		= generic_file_llseek,</div><div class='add'>+	.read		= generic_read_dir,</div><div class='add'>+	.iterate_shared	= afs_dynroot_readdir,</div><div class='add'>+	.fsync		= noop_fsync,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> /*</div><div class='del'>- * When a dynamic root that's in the process of being destroyed, depopulate it</div><div class='del'>- * of pinned directories.</div><div class='add'>+ * Create an inode for a dynamic root directory.</div><div class='ctx'>  */</div><div class='del'>-void afs_dynroot_depopulate(struct super_block *sb)</div><div class='add'>+struct inode *afs_dynroot_iget_root(struct super_block *sb)</div><div class='ctx'> {</div><div class='del'>-	struct afs_net *net = afs_sb2net(sb);</div><div class='del'>-	struct dentry *root = sb-&gt;s_root, *subdir, *tmp;</div><div class='del'>-</div><div class='del'>-	/* Prevent more subdirs from being created */</div><div class='del'>-	mutex_lock(&amp;net-&gt;proc_cells_lock);</div><div class='del'>-	if (net-&gt;dynroot_sb == sb)</div><div class='del'>-		net-&gt;dynroot_sb = NULL;</div><div class='del'>-	mutex_unlock(&amp;net-&gt;proc_cells_lock);</div><div class='del'>-</div><div class='del'>-	if (root) {</div><div class='del'>-		inode_lock(root-&gt;d_inode);</div><div class='del'>-</div><div class='del'>-		/* Remove all the pins for dirs created for manually added cells */</div><div class='del'>-		list_for_each_entry_safe(subdir, tmp, &amp;root-&gt;d_subdirs, d_child) {</div><div class='del'>-			if (subdir-&gt;d_fsdata) {</div><div class='del'>-				subdir-&gt;d_fsdata = NULL;</div><div class='del'>-				dput(subdir);</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='add'>+	struct afs_super_info *as = AFS_FS_S(sb);</div><div class='add'>+	struct afs_vnode *vnode;</div><div class='add'>+	struct inode *inode;</div><div class='add'>+	struct afs_fid fid = { .vid = 0, .vnode = 1, .unique = 1,};</div><div class='add'>+</div><div class='add'>+	if (as-&gt;volume)</div><div class='add'>+		fid.vid = as-&gt;volume-&gt;vid;</div><div class='add'>+</div><div class='add'>+	inode = iget5_locked(sb, fid.vnode,</div><div class='add'>+			     afs_iget5_pseudo_test, afs_iget5_pseudo_set, &amp;fid);</div><div class='add'>+	if (!inode)</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+</div><div class='add'>+	vnode = AFS_FS_I(inode);</div><div class='ctx'> </div><div class='del'>-		inode_unlock(root-&gt;d_inode);</div><div class='add'>+	/* there shouldn't be an existing inode */</div><div class='add'>+	if (inode_state_read_once(inode) &amp; I_NEW) {</div><div class='add'>+		netfs_inode_init(&amp;vnode-&gt;netfs, NULL, false);</div><div class='add'>+		simple_inode_init_ts(inode);</div><div class='add'>+		set_nlink(inode, 2);</div><div class='add'>+		inode-&gt;i_size		= 0;</div><div class='add'>+		inode-&gt;i_mode		= S_IFDIR | 0555;</div><div class='add'>+		inode-&gt;i_op		= &amp;afs_dynroot_inode_operations;</div><div class='add'>+		inode-&gt;i_fop		= &amp;afs_dynroot_file_operations;</div><div class='add'>+		inode-&gt;i_uid		= GLOBAL_ROOT_UID;</div><div class='add'>+		inode-&gt;i_gid		= GLOBAL_ROOT_GID;</div><div class='add'>+		inode-&gt;i_blocks		= 0;</div><div class='add'>+		inode-&gt;i_generation	= 0;</div><div class='add'>+		inode-&gt;i_flags		|= S_NOATIME;</div><div class='add'>+</div><div class='add'>+		set_bit(AFS_VNODE_PSEUDODIR, &amp;vnode-&gt;flags);</div><div class='add'>+		unlock_new_inode(inode);</div><div class='ctx'> 	}</div><div class='add'>+	_leave(" = %p", inode);</div><div class='add'>+	return inode;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/afs/file.c b/fs/afs/file.c<br/>index cb6ad61eec3b..f66a92294284 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/file.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/file.c</a></div><div class='hunk'>@@ -14,18 +14,17 @@</div><div class='ctx'> #include &lt;linux/gfp.h&gt;</div><div class='ctx'> #include &lt;linux/task_io_accounting_ops.h&gt;</div><div class='ctx'> #include &lt;linux/mm.h&gt;</div><div class='add'>+#include &lt;linux/swap.h&gt;</div><div class='ctx'> #include &lt;linux/netfs.h&gt;</div><div class='add'>+#include &lt;trace/events/netfs.h&gt;</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> </div><div class='del'>-static int afs_file_mmap(struct file *file, struct vm_area_struct *vma);</div><div class='del'>-static int afs_readpage(struct file *file, struct page *page);</div><div class='del'>-static int afs_symlink_readpage(struct file *file, struct page *page);</div><div class='del'>-static void afs_invalidatepage(struct page *page, unsigned int offset,</div><div class='del'>-			       unsigned int length);</div><div class='del'>-static int afs_releasepage(struct page *page, gfp_t gfp_flags);</div><div class='add'>+static int afs_file_mmap_prepare(struct vm_area_desc *desc);</div><div class='ctx'> </div><div class='del'>-static void afs_readahead(struct readahead_control *ractl);</div><div class='ctx'> static ssize_t afs_file_read_iter(struct kiocb *iocb, struct iov_iter *iter);</div><div class='add'>+static ssize_t afs_file_splice_read(struct file *in, loff_t *ppos,</div><div class='add'>+				    struct pipe_inode_info *pipe,</div><div class='add'>+				    size_t len, unsigned int flags);</div><div class='ctx'> static void afs_vm_open(struct vm_area_struct *area);</div><div class='ctx'> static void afs_vm_close(struct vm_area_struct *area);</div><div class='ctx'> static vm_fault_t afs_vm_map_pages(struct vm_fault *vmf, pgoff_t start_pgoff, pgoff_t end_pgoff);</div><div class='hunk'>@@ -35,9 +34,9 @@ const struct file_operations afs_file_operations = {</div><div class='ctx'> 	.release	= afs_release,</div><div class='ctx'> 	.llseek		= generic_file_llseek,</div><div class='ctx'> 	.read_iter	= afs_file_read_iter,</div><div class='del'>-	.write_iter	= afs_file_write,</div><div class='del'>-	.mmap		= afs_file_mmap,</div><div class='del'>-	.splice_read	= generic_file_splice_read,</div><div class='add'>+	.write_iter	= netfs_file_write_iter,</div><div class='add'>+	.mmap_prepare	= afs_file_mmap_prepare,</div><div class='add'>+	.splice_read	= afs_file_splice_read,</div><div class='ctx'> 	.splice_write	= iter_file_splice_write,</div><div class='ctx'> 	.fsync		= afs_fsync,</div><div class='ctx'> 	.lock		= afs_lock,</div><div class='hunk'>@@ -51,24 +50,16 @@ const struct inode_operations afs_file_inode_operations = {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations afs_file_aops = {</div><div class='del'>-	.readpage	= afs_readpage,</div><div class='del'>-	.readahead	= afs_readahead,</div><div class='del'>-	.set_page_dirty	= afs_set_page_dirty,</div><div class='del'>-	.launder_page	= afs_launder_page,</div><div class='del'>-	.releasepage	= afs_releasepage,</div><div class='del'>-	.invalidatepage	= afs_invalidatepage,</div><div class='del'>-	.write_begin	= afs_write_begin,</div><div class='del'>-	.write_end	= afs_write_end,</div><div class='del'>-	.writepage	= afs_writepage,</div><div class='add'>+	.direct_IO	= noop_direct_IO,</div><div class='add'>+	.read_folio	= netfs_read_folio,</div><div class='add'>+	.readahead	= netfs_readahead,</div><div class='add'>+	.dirty_folio	= netfs_dirty_folio,</div><div class='add'>+	.release_folio	= netfs_release_folio,</div><div class='add'>+	.invalidate_folio = netfs_invalidate_folio,</div><div class='add'>+	.migrate_folio	= filemap_migrate_folio,</div><div class='ctx'> 	.writepages	= afs_writepages,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-const struct address_space_operations afs_symlink_aops = {</div><div class='del'>-	.readpage	= afs_symlink_readpage,</div><div class='del'>-	.releasepage	= afs_releasepage,</div><div class='del'>-	.invalidatepage	= afs_invalidatepage,</div><div class='del'>-};</div><div class='del'>-</div><div class='ctx'> static const struct vm_operations_struct afs_vm_ops = {</div><div class='ctx'> 	.open		= afs_vm_open,</div><div class='ctx'> 	.close		= afs_vm_close,</div><div class='hunk'>@@ -158,7 +149,9 @@ int afs_open(struct inode *inode, struct file *file)</div><div class='ctx'> </div><div class='ctx'> 	if (file-&gt;f_flags &amp; O_TRUNC)</div><div class='ctx'> 		set_bit(AFS_VNODE_NEW_CONTENT, &amp;vnode-&gt;flags);</div><div class='del'>-	</div><div class='add'>+</div><div class='add'>+	fscache_use_cookie(afs_vnode_cache(vnode), file-&gt;f_mode &amp; FMODE_WRITE);</div><div class='add'>+</div><div class='ctx'> 	file-&gt;private_data = af;</div><div class='ctx'> 	_leave(" = 0");</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -177,8 +170,10 @@ error:</div><div class='ctx'>  */</div><div class='ctx'> int afs_release(struct inode *inode, struct file *file)</div><div class='ctx'> {</div><div class='add'>+	struct afs_vnode_cache_aux aux;</div><div class='ctx'> 	struct afs_vnode *vnode = AFS_FS_I(inode);</div><div class='ctx'> 	struct afs_file *af = file-&gt;private_data;</div><div class='add'>+	loff_t i_size;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	_enter("{%llx:%llu},", vnode-&gt;fid.vid, vnode-&gt;fid.vnode);</div><div class='hunk'>@@ -189,6 +184,15 @@ int afs_release(struct inode *inode, struct file *file)</div><div class='ctx'> 	file-&gt;private_data = NULL;</div><div class='ctx'> 	if (af-&gt;wb)</div><div class='ctx'> 		afs_put_wb_key(af-&gt;wb);</div><div class='add'>+</div><div class='add'>+	if ((file-&gt;f_mode &amp; FMODE_WRITE)) {</div><div class='add'>+		i_size = i_size_read(&amp;vnode-&gt;netfs.inode);</div><div class='add'>+		afs_set_cache_aux(vnode, &amp;aux);</div><div class='add'>+		fscache_unuse_cookie(afs_vnode_cache(vnode), &amp;aux, &amp;i_size);</div><div class='add'>+	} else {</div><div class='add'>+		fscache_unuse_cookie(afs_vnode_cache(vnode), NULL, NULL);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	key_put(af-&gt;key);</div><div class='ctx'> 	kfree(af);</div><div class='ctx'> 	afs_prune_wb_keys(vnode);</div><div class='hunk'>@@ -196,50 +200,12 @@ int afs_release(struct inode *inode, struct file *file)</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Allocate a new read record.</div><div class='del'>- */</div><div class='del'>-struct afs_read *afs_alloc_read(gfp_t gfp)</div><div class='del'>-{</div><div class='del'>-	struct afs_read *req;</div><div class='del'>-</div><div class='del'>-	req = kzalloc(sizeof(struct afs_read), gfp);</div><div class='del'>-	if (req)</div><div class='del'>-		refcount_set(&amp;req-&gt;usage, 1);</div><div class='del'>-</div><div class='del'>-	return req;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Dispose of a ref to a read record.</div><div class='del'>- */</div><div class='del'>-void afs_put_read(struct afs_read *req)</div><div class='del'>-{</div><div class='del'>-	if (refcount_dec_and_test(&amp;req-&gt;usage)) {</div><div class='del'>-		if (req-&gt;cleanup)</div><div class='del'>-			req-&gt;cleanup(req);</div><div class='del'>-		key_put(req-&gt;key);</div><div class='del'>-		kfree(req);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static void afs_fetch_data_notify(struct afs_operation *op)</div><div class='ctx'> {</div><div class='del'>-	struct afs_read *req = op-&gt;fetch.req;</div><div class='del'>-	struct netfs_read_subrequest *subreq = req-&gt;subreq;</div><div class='del'>-	int error = op-&gt;error;</div><div class='del'>-</div><div class='del'>-	if (error == -ECONNABORTED)</div><div class='del'>-		error = afs_abort_to_error(op-&gt;ac.abort_code);</div><div class='del'>-	req-&gt;error = error;</div><div class='del'>-</div><div class='del'>-	if (subreq) {</div><div class='del'>-		__set_bit(NETFS_SREQ_CLEAR_TAIL, &amp;subreq-&gt;flags);</div><div class='del'>-		netfs_subreq_terminated(subreq, error ?: req-&gt;actual_len, false);</div><div class='del'>-		req-&gt;subreq = NULL;</div><div class='del'>-	} else if (req-&gt;done) {</div><div class='del'>-		req-&gt;done(req);</div><div class='del'>-	}</div><div class='add'>+	struct netfs_io_subrequest *subreq = op-&gt;fetch.subreq;</div><div class='add'>+</div><div class='add'>+	subreq-&gt;error = afs_op_error(op);</div><div class='add'>+	netfs_read_subreq_terminated(subreq);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void afs_fetch_data_success(struct afs_operation *op)</div><div class='hunk'>@@ -249,305 +215,293 @@ static void afs_fetch_data_success(struct afs_operation *op)</div><div class='ctx'> 	_enter("op=%08x", op-&gt;debug_id);</div><div class='ctx'> 	afs_vnode_commit_status(op, &amp;op-&gt;file[0]);</div><div class='ctx'> 	afs_stat_v(vnode, n_fetches);</div><div class='del'>-	atomic_long_add(op-&gt;fetch.req-&gt;actual_len, &amp;op-&gt;net-&gt;n_fetch_bytes);</div><div class='add'>+	atomic_long_add(op-&gt;fetch.subreq-&gt;transferred, &amp;op-&gt;net-&gt;n_fetch_bytes);</div><div class='ctx'> 	afs_fetch_data_notify(op);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void afs_fetch_data_put(struct afs_operation *op)</div><div class='add'>+static void afs_fetch_data_aborted(struct afs_operation *op)</div><div class='ctx'> {</div><div class='del'>-	op-&gt;fetch.req-&gt;error = op-&gt;error;</div><div class='del'>-	afs_put_read(op-&gt;fetch.req);</div><div class='add'>+	afs_check_for_remote_deletion(op);</div><div class='add'>+	afs_fetch_data_notify(op);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static const struct afs_operation_ops afs_fetch_data_operation = {</div><div class='add'>+const struct afs_operation_ops afs_fetch_data_operation = {</div><div class='ctx'> 	.issue_afs_rpc	= afs_fs_fetch_data,</div><div class='ctx'> 	.issue_yfs_rpc	= yfs_fs_fetch_data,</div><div class='ctx'> 	.success	= afs_fetch_data_success,</div><div class='del'>-	.aborted	= afs_check_for_remote_deletion,</div><div class='add'>+	.aborted	= afs_fetch_data_aborted,</div><div class='ctx'> 	.failed		= afs_fetch_data_notify,</div><div class='del'>-	.put		= afs_fetch_data_put,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Fetch file data from the volume.</div><div class='del'>- */</div><div class='del'>-int afs_fetch_data(struct afs_vnode *vnode, struct afs_read *req)</div><div class='del'>-{</div><div class='del'>-	struct afs_operation *op;</div><div class='del'>-</div><div class='del'>-	_enter("%s{%llx:%llu.%u},%x,,,",</div><div class='del'>-	       vnode-&gt;volume-&gt;name,</div><div class='del'>-	       vnode-&gt;fid.vid,</div><div class='del'>-	       vnode-&gt;fid.vnode,</div><div class='del'>-	       vnode-&gt;fid.unique,</div><div class='del'>-	       key_serial(req-&gt;key));</div><div class='del'>-</div><div class='del'>-	op = afs_alloc_operation(req-&gt;key, vnode-&gt;volume);</div><div class='del'>-	if (IS_ERR(op)) {</div><div class='del'>-		if (req-&gt;subreq)</div><div class='del'>-			netfs_subreq_terminated(req-&gt;subreq, PTR_ERR(op), false);</div><div class='del'>-		return PTR_ERR(op);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	afs_op_set_vnode(op, 0, vnode);</div><div class='del'>-</div><div class='del'>-	op-&gt;fetch.req	= afs_get_read(req);</div><div class='del'>-	op-&gt;ops		= &amp;afs_fetch_data_operation;</div><div class='del'>-	return afs_do_sync_operation(op);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void afs_req_issue_op(struct netfs_read_subrequest *subreq)</div><div class='add'>+static void afs_issue_read_call(struct afs_operation *op)</div><div class='ctx'> {</div><div class='del'>-	struct afs_vnode *vnode = AFS_FS_I(subreq-&gt;rreq-&gt;inode);</div><div class='del'>-	struct afs_read *fsreq;</div><div class='del'>-</div><div class='del'>-	fsreq = afs_alloc_read(GFP_NOFS);</div><div class='del'>-	if (!fsreq)</div><div class='del'>-		return netfs_subreq_terminated(subreq, -ENOMEM, false);</div><div class='del'>-</div><div class='del'>-	fsreq-&gt;subreq	= subreq;</div><div class='del'>-	fsreq-&gt;pos	= subreq-&gt;start + subreq-&gt;transferred;</div><div class='del'>-	fsreq-&gt;len	= subreq-&gt;len   - subreq-&gt;transferred;</div><div class='del'>-	fsreq-&gt;key	= key_get(subreq-&gt;rreq-&gt;netfs_priv);</div><div class='del'>-	fsreq-&gt;vnode	= vnode;</div><div class='del'>-	fsreq-&gt;iter	= &amp;fsreq-&gt;def_iter;</div><div class='del'>-</div><div class='del'>-	iov_iter_xarray(&amp;fsreq-&gt;def_iter, READ,</div><div class='del'>-			&amp;fsreq-&gt;vnode-&gt;vfs_inode.i_mapping-&gt;i_pages,</div><div class='del'>-			fsreq-&gt;pos, fsreq-&gt;len);</div><div class='del'>-</div><div class='del'>-	afs_fetch_data(fsreq-&gt;vnode, fsreq);</div><div class='del'>-	afs_put_read(fsreq);</div><div class='add'>+	op-&gt;call_responded = false;</div><div class='add'>+	op-&gt;call_error = 0;</div><div class='add'>+	op-&gt;call_abort_code = 0;</div><div class='add'>+	if (test_bit(AFS_SERVER_FL_IS_YFS, &amp;op-&gt;server-&gt;flags))</div><div class='add'>+		yfs_fs_fetch_data(op);</div><div class='add'>+	else</div><div class='add'>+		afs_fs_fetch_data(op);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int afs_symlink_readpage(struct file *file, struct page *page)</div><div class='add'>+static void afs_end_read(struct afs_operation *op)</div><div class='ctx'> {</div><div class='del'>-	struct afs_vnode *vnode = AFS_FS_I(page-&gt;mapping-&gt;host);</div><div class='del'>-	struct afs_read *fsreq;</div><div class='del'>-	struct folio *folio = page_folio(page);</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	fsreq = afs_alloc_read(GFP_NOFS);</div><div class='del'>-	if (!fsreq)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	fsreq-&gt;pos	= folio_pos(folio);</div><div class='del'>-	fsreq-&gt;len	= folio_size(folio);</div><div class='del'>-	fsreq-&gt;vnode	= vnode;</div><div class='del'>-	fsreq-&gt;iter	= &amp;fsreq-&gt;def_iter;</div><div class='del'>-	iov_iter_xarray(&amp;fsreq-&gt;def_iter, READ, &amp;page-&gt;mapping-&gt;i_pages,</div><div class='del'>-			fsreq-&gt;pos, fsreq-&gt;len);</div><div class='add'>+	if (op-&gt;call_responded &amp;&amp; op-&gt;server)</div><div class='add'>+		set_bit(AFS_SERVER_FL_RESPONDING, &amp;op-&gt;server-&gt;flags);</div><div class='ctx'> </div><div class='del'>-	ret = afs_fetch_data(fsreq-&gt;vnode, fsreq);</div><div class='del'>-	if (ret == 0)</div><div class='del'>-		SetPageUptodate(page);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='add'>+	if (!afs_op_error(op))</div><div class='add'>+		afs_fetch_data_success(op);</div><div class='add'>+	else if (op-&gt;cumul_error.aborted)</div><div class='add'>+		afs_fetch_data_aborted(op);</div><div class='add'>+	else</div><div class='add'>+		afs_fetch_data_notify(op);</div><div class='ctx'> </div><div class='del'>-static void afs_init_rreq(struct netfs_read_request *rreq, struct file *file)</div><div class='del'>-{</div><div class='del'>-	rreq-&gt;netfs_priv = key_get(afs_file_key(file));</div><div class='add'>+	afs_end_vnode_operation(op);</div><div class='add'>+	afs_put_operation(op);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool afs_is_cache_enabled(struct inode *inode)</div><div class='add'>+/*</div><div class='add'>+ * Perform I/O processing on an asynchronous call.  The work item carries a ref</div><div class='add'>+ * to the call struct that we either need to release or to pass on.</div><div class='add'>+ */</div><div class='add'>+static void afs_read_receive(struct afs_call *call)</div><div class='ctx'> {</div><div class='del'>-	struct fscache_cookie *cookie = afs_vnode_cache(AFS_FS_I(inode));</div><div class='add'>+	struct afs_operation *op = call-&gt;op;</div><div class='add'>+	enum afs_call_state state;</div><div class='ctx'> </div><div class='del'>-	return fscache_cookie_enabled(cookie) &amp;&amp; !hlist_empty(&amp;cookie-&gt;backing_objects);</div><div class='del'>-}</div><div class='add'>+	_enter("");</div><div class='ctx'> </div><div class='del'>-static int afs_begin_cache_operation(struct netfs_read_request *rreq)</div><div class='del'>-{</div><div class='del'>-	struct afs_vnode *vnode = AFS_FS_I(rreq-&gt;inode);</div><div class='add'>+	state = READ_ONCE(call-&gt;state);</div><div class='add'>+	if (state == AFS_CALL_COMPLETE)</div><div class='add'>+		return;</div><div class='add'>+	trace_afs_read_recv(op, call);</div><div class='ctx'> </div><div class='del'>-	return fscache_begin_read_operation(rreq, afs_vnode_cache(vnode));</div><div class='del'>-}</div><div class='add'>+	while (state &lt; AFS_CALL_COMPLETE &amp;&amp; READ_ONCE(call-&gt;need_attention)) {</div><div class='add'>+		WRITE_ONCE(call-&gt;need_attention, false);</div><div class='add'>+		afs_deliver_to_call(call);</div><div class='add'>+		state = READ_ONCE(call-&gt;state);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-static int afs_check_write_begin(struct file *file, loff_t pos, unsigned len,</div><div class='del'>-				 struct folio *folio, void **_fsdata)</div><div class='del'>-{</div><div class='del'>-	struct afs_vnode *vnode = AFS_FS_I(file_inode(file));</div><div class='add'>+	if (state &lt; AFS_CALL_COMPLETE) {</div><div class='add'>+		netfs_read_subreq_progress(op-&gt;fetch.subreq);</div><div class='add'>+		if (rxrpc_kernel_check_life(call-&gt;net-&gt;socket, call-&gt;rxcall))</div><div class='add'>+			return;</div><div class='add'>+		/* rxrpc terminated the call. */</div><div class='add'>+		afs_set_call_complete(call, call-&gt;error, call-&gt;abort_code);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	return test_bit(AFS_VNODE_DELETED, &amp;vnode-&gt;flags) ? -ESTALE : 0;</div><div class='del'>-}</div><div class='add'>+	op-&gt;call_abort_code	= call-&gt;abort_code;</div><div class='add'>+	op-&gt;call_error		= call-&gt;error;</div><div class='add'>+	op-&gt;call_responded	= call-&gt;responded;</div><div class='add'>+	op-&gt;call		= NULL;</div><div class='add'>+	call-&gt;op		= NULL;</div><div class='add'>+	afs_put_call(call);</div><div class='add'>+</div><div class='add'>+	/* If the call failed, then we need to crank the server rotation</div><div class='add'>+	 * handle and try the next.</div><div class='add'>+	 */</div><div class='add'>+	if (afs_select_fileserver(op)) {</div><div class='add'>+		afs_issue_read_call(op);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-static void afs_priv_cleanup(struct address_space *mapping, void *netfs_priv)</div><div class='del'>-{</div><div class='del'>-	key_put(netfs_priv);</div><div class='add'>+	afs_end_read(op);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-const struct netfs_read_request_ops afs_req_ops = {</div><div class='del'>-	.init_rreq		= afs_init_rreq,</div><div class='del'>-	.is_cache_enabled	= afs_is_cache_enabled,</div><div class='del'>-	.begin_cache_operation	= afs_begin_cache_operation,</div><div class='del'>-	.check_write_begin	= afs_check_write_begin,</div><div class='del'>-	.issue_op		= afs_req_issue_op,</div><div class='del'>-	.cleanup		= afs_priv_cleanup,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static int afs_readpage(struct file *file, struct page *page)</div><div class='add'>+void afs_fetch_data_async_rx(struct work_struct *work)</div><div class='ctx'> {</div><div class='del'>-	struct folio *folio = page_folio(page);</div><div class='add'>+	struct afs_call *call = container_of(work, struct afs_call, async_work);</div><div class='ctx'> </div><div class='del'>-	return netfs_readpage(file, folio, &amp;afs_req_ops, NULL);</div><div class='add'>+	afs_read_receive(call);</div><div class='add'>+	afs_put_call(call);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void afs_readahead(struct readahead_control *ractl)</div><div class='add'>+void afs_fetch_data_immediate_cancel(struct afs_call *call)</div><div class='ctx'> {</div><div class='del'>-	netfs_readahead(ractl, &amp;afs_req_ops, NULL);</div><div class='add'>+	if (call-&gt;async) {</div><div class='add'>+		afs_get_call(call, afs_call_trace_wake);</div><div class='add'>+		if (!queue_work(afs_async_calls, &amp;call-&gt;async_work))</div><div class='add'>+			afs_deferred_put_call(call);</div><div class='add'>+		flush_work(&amp;call-&gt;async_work);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Adjust the dirty region of the page on truncation or full invalidation,</div><div class='del'>- * getting rid of the markers altogether if the region is entirely invalidated.</div><div class='add'>+ * Fetch file data from the volume.</div><div class='ctx'>  */</div><div class='del'>-static void afs_invalidate_dirty(struct folio *folio, unsigned int offset,</div><div class='del'>-				 unsigned int length)</div><div class='add'>+static void afs_issue_read(struct netfs_io_subrequest *subreq)</div><div class='ctx'> {</div><div class='del'>-	struct afs_vnode *vnode = AFS_FS_I(folio_inode(folio));</div><div class='del'>-	unsigned long priv;</div><div class='del'>-	unsigned int f, t, end = offset + length;</div><div class='del'>-</div><div class='del'>-	priv = (unsigned long)folio_get_private(folio);</div><div class='add'>+	struct afs_operation *op;</div><div class='add'>+	struct afs_vnode *vnode = AFS_FS_I(subreq-&gt;rreq-&gt;inode);</div><div class='add'>+	struct key *key = subreq-&gt;rreq-&gt;netfs_priv;</div><div class='ctx'> </div><div class='del'>-	/* we clean up only if the entire page is being invalidated */</div><div class='del'>-	if (offset == 0 &amp;&amp; length == folio_size(folio))</div><div class='del'>-		goto full_invalidate;</div><div class='add'>+	_enter("%s{%llx:%llu.%u},%x,,,",</div><div class='add'>+	       vnode-&gt;volume-&gt;name,</div><div class='add'>+	       vnode-&gt;fid.vid,</div><div class='add'>+	       vnode-&gt;fid.vnode,</div><div class='add'>+	       vnode-&gt;fid.unique,</div><div class='add'>+	       key_serial(key));</div><div class='ctx'> </div><div class='del'>-	 /* If the page was dirtied by page_mkwrite(), the PTE stays writable</div><div class='del'>-	  * and we don't get another notification to tell us to expand it</div><div class='del'>-	  * again.</div><div class='del'>-	  */</div><div class='del'>-	if (afs_is_folio_dirty_mmapped(priv))</div><div class='add'>+	op = afs_alloc_operation(key, vnode-&gt;volume);</div><div class='add'>+	if (IS_ERR(op)) {</div><div class='add'>+		subreq-&gt;error = PTR_ERR(op);</div><div class='add'>+		netfs_read_subreq_terminated(subreq);</div><div class='ctx'> 		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	/* We may need to shorten the dirty region */</div><div class='del'>-	f = afs_folio_dirty_from(folio, priv);</div><div class='del'>-	t = afs_folio_dirty_to(folio, priv);</div><div class='add'>+	afs_op_set_vnode(op, 0, vnode);</div><div class='ctx'> </div><div class='del'>-	if (t &lt;= offset || f &gt;= end)</div><div class='del'>-		return; /* Doesn't overlap */</div><div class='add'>+	op-&gt;fetch.subreq = subreq;</div><div class='add'>+	op-&gt;ops		= &amp;afs_fetch_data_operation;</div><div class='ctx'> </div><div class='del'>-	if (f &lt; offset &amp;&amp; t &gt; end)</div><div class='del'>-		return; /* Splits the dirty region - just absorb it */</div><div class='add'>+	trace_netfs_sreq(subreq, netfs_sreq_trace_submit);</div><div class='ctx'> </div><div class='del'>-	if (f &gt;= offset &amp;&amp; t &lt;= end)</div><div class='del'>-		goto undirty;</div><div class='add'>+	if (subreq-&gt;rreq-&gt;origin == NETFS_READAHEAD ||</div><div class='add'>+	    subreq-&gt;rreq-&gt;iocb) {</div><div class='add'>+		op-&gt;flags |= AFS_OPERATION_ASYNC;</div><div class='ctx'> </div><div class='del'>-	if (f &lt; offset)</div><div class='del'>-		t = offset;</div><div class='del'>-	else</div><div class='del'>-		f = end;</div><div class='del'>-	if (f == t)</div><div class='del'>-		goto undirty;</div><div class='del'>-</div><div class='del'>-	priv = afs_folio_dirty(folio, f, t);</div><div class='del'>-	folio_change_private(folio, (void *)priv);</div><div class='del'>-	trace_afs_folio_dirty(vnode, tracepoint_string("trunc"), folio);</div><div class='del'>-	return;</div><div class='del'>-</div><div class='del'>-undirty:</div><div class='del'>-	trace_afs_folio_dirty(vnode, tracepoint_string("undirty"), folio);</div><div class='del'>-	folio_clear_dirty_for_io(folio);</div><div class='del'>-full_invalidate:</div><div class='del'>-	trace_afs_folio_dirty(vnode, tracepoint_string("inval"), folio);</div><div class='del'>-	folio_detach_private(folio);</div><div class='add'>+		if (!afs_begin_vnode_operation(op)) {</div><div class='add'>+			subreq-&gt;error = afs_put_operation(op);</div><div class='add'>+			netfs_read_subreq_terminated(subreq);</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (!afs_select_fileserver(op)) {</div><div class='add'>+			afs_end_read(op);</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		afs_issue_read_call(op);</div><div class='add'>+	} else {</div><div class='add'>+		afs_do_sync_operation(op);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * invalidate part or all of a page</div><div class='del'>- * - release a page and clean up its private data if offset is 0 (indicating</div><div class='del'>- *   the entire page)</div><div class='del'>- */</div><div class='del'>-static void afs_invalidatepage(struct page *page, unsigned int offset,</div><div class='del'>-			       unsigned int length)</div><div class='add'>+static int afs_init_request(struct netfs_io_request *rreq, struct file *file)</div><div class='ctx'> {</div><div class='del'>-	struct folio *folio = page_folio(page);</div><div class='add'>+	struct afs_vnode *vnode = AFS_FS_I(rreq-&gt;inode);</div><div class='ctx'> </div><div class='del'>-	_enter("{%lu},%u,%u", folio_index(folio), offset, length);</div><div class='add'>+	if (file)</div><div class='add'>+		rreq-&gt;netfs_priv = key_get(afs_file_key(file));</div><div class='add'>+	rreq-&gt;rsize = 256 * 1024;</div><div class='add'>+	rreq-&gt;wsize = 256 * 1024 * 1024;</div><div class='add'>+</div><div class='add'>+	switch (rreq-&gt;origin) {</div><div class='add'>+	case NETFS_READ_SINGLE:</div><div class='add'>+		if (!file) {</div><div class='add'>+			struct key *key = afs_request_key(vnode-&gt;volume-&gt;cell);</div><div class='add'>+</div><div class='add'>+			if (IS_ERR(key))</div><div class='add'>+				return PTR_ERR(key);</div><div class='add'>+			rreq-&gt;netfs_priv = key;</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='add'>+	case NETFS_WRITEBACK:</div><div class='add'>+	case NETFS_WRITETHROUGH:</div><div class='add'>+	case NETFS_UNBUFFERED_WRITE:</div><div class='add'>+	case NETFS_DIO_WRITE:</div><div class='add'>+		if (S_ISREG(rreq-&gt;inode-&gt;i_mode))</div><div class='add'>+			rreq-&gt;io_streams[0].avail = true;</div><div class='add'>+		break;</div><div class='add'>+	case NETFS_WRITEBACK_SINGLE:</div><div class='add'>+	default:</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	BUG_ON(!PageLocked(page));</div><div class='add'>+static int afs_check_write_begin(struct file *file, loff_t pos, unsigned len,</div><div class='add'>+				 struct folio **foliop, void **_fsdata)</div><div class='add'>+{</div><div class='add'>+	struct afs_vnode *vnode = AFS_FS_I(file_inode(file));</div><div class='ctx'> </div><div class='del'>-	if (PagePrivate(page))</div><div class='del'>-		afs_invalidate_dirty(folio, offset, length);</div><div class='add'>+	return test_bit(AFS_VNODE_DELETED, &amp;vnode-&gt;flags) ? -ESTALE : 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	folio_wait_fscache(folio);</div><div class='del'>-	_leave("");</div><div class='add'>+static void afs_free_request(struct netfs_io_request *rreq)</div><div class='add'>+{</div><div class='add'>+	key_put(rreq-&gt;netfs_priv);</div><div class='add'>+	afs_put_wb_key(rreq-&gt;netfs_priv2);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * release a page and clean up its private state if it's not busy</div><div class='del'>- * - return true if the page can now be released, false if not</div><div class='del'>- */</div><div class='del'>-static int afs_releasepage(struct page *page, gfp_t gfp_flags)</div><div class='add'>+static void afs_update_i_size(struct inode *inode, loff_t new_i_size)</div><div class='ctx'> {</div><div class='del'>-	struct folio *folio = page_folio(page);</div><div class='del'>-	struct afs_vnode *vnode = AFS_FS_I(folio_inode(folio));</div><div class='del'>-</div><div class='del'>-	_enter("{{%llx:%llu}[%lu],%lx},%x",</div><div class='del'>-	       vnode-&gt;fid.vid, vnode-&gt;fid.vnode, folio_index(folio), folio-&gt;flags,</div><div class='del'>-	       gfp_flags);</div><div class='del'>-</div><div class='del'>-	/* deny if page is being written to the cache and the caller hasn't</div><div class='del'>-	 * elected to wait */</div><div class='del'>-#ifdef CONFIG_AFS_FSCACHE</div><div class='del'>-	if (folio_test_fscache(folio)) {</div><div class='del'>-		if (!(gfp_flags &amp; __GFP_DIRECT_RECLAIM) || !(gfp_flags &amp; __GFP_FS))</div><div class='del'>-			return false;</div><div class='del'>-		folio_wait_fscache(folio);</div><div class='del'>-	}</div><div class='del'>-#endif</div><div class='add'>+	struct afs_vnode *vnode = AFS_FS_I(inode);</div><div class='add'>+	loff_t i_size;</div><div class='ctx'> </div><div class='del'>-	if (folio_test_private(folio)) {</div><div class='del'>-		trace_afs_folio_dirty(vnode, tracepoint_string("rel"), folio);</div><div class='del'>-		folio_detach_private(folio);</div><div class='add'>+	write_seqlock(&amp;vnode-&gt;cb_lock);</div><div class='add'>+	i_size = i_size_read(&amp;vnode-&gt;netfs.inode);</div><div class='add'>+	if (new_i_size &gt; i_size) {</div><div class='add'>+		i_size_write(&amp;vnode-&gt;netfs.inode, new_i_size);</div><div class='add'>+		inode_set_bytes(&amp;vnode-&gt;netfs.inode, new_i_size);</div><div class='ctx'> 	}</div><div class='add'>+	write_sequnlock(&amp;vnode-&gt;cb_lock);</div><div class='add'>+	fscache_update_cookie(afs_vnode_cache(vnode), NULL, &amp;new_i_size);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	/* Indicate that the folio can be released */</div><div class='del'>-	_leave(" = T");</div><div class='del'>-	return true;</div><div class='add'>+static void afs_netfs_invalidate_cache(struct netfs_io_request *wreq)</div><div class='add'>+{</div><div class='add'>+	struct afs_vnode *vnode = AFS_FS_I(wreq-&gt;inode);</div><div class='add'>+</div><div class='add'>+	afs_invalidate_cache(vnode, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+const struct netfs_request_ops afs_req_ops = {</div><div class='add'>+	.init_request		= afs_init_request,</div><div class='add'>+	.free_request		= afs_free_request,</div><div class='add'>+	.check_write_begin	= afs_check_write_begin,</div><div class='add'>+	.issue_read		= afs_issue_read,</div><div class='add'>+	.update_i_size		= afs_update_i_size,</div><div class='add'>+	.invalidate_cache	= afs_netfs_invalidate_cache,</div><div class='add'>+	.begin_writeback	= afs_begin_writeback,</div><div class='add'>+	.prepare_write		= afs_prepare_write,</div><div class='add'>+	.issue_write		= afs_issue_write,</div><div class='add'>+	.retry_request		= afs_retry_request,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> static void afs_add_open_mmap(struct afs_vnode *vnode)</div><div class='ctx'> {</div><div class='ctx'> 	if (atomic_inc_return(&amp;vnode-&gt;cb_nr_mmap) == 1) {</div><div class='del'>-		down_write(&amp;vnode-&gt;volume-&gt;cell-&gt;fs_open_mmaps_lock);</div><div class='add'>+		down_write(&amp;vnode-&gt;volume-&gt;open_mmaps_lock);</div><div class='ctx'> </div><div class='del'>-		list_add_tail(&amp;vnode-&gt;cb_mmap_link,</div><div class='del'>-			      &amp;vnode-&gt;volume-&gt;cell-&gt;fs_open_mmaps);</div><div class='add'>+		if (list_empty(&amp;vnode-&gt;cb_mmap_link))</div><div class='add'>+			list_add_tail(&amp;vnode-&gt;cb_mmap_link, &amp;vnode-&gt;volume-&gt;open_mmaps);</div><div class='ctx'> </div><div class='del'>-		up_write(&amp;vnode-&gt;volume-&gt;cell-&gt;fs_open_mmaps_lock);</div><div class='add'>+		up_write(&amp;vnode-&gt;volume-&gt;open_mmaps_lock);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void afs_drop_open_mmap(struct afs_vnode *vnode)</div><div class='ctx'> {</div><div class='del'>-	if (!atomic_dec_and_test(&amp;vnode-&gt;cb_nr_mmap))</div><div class='add'>+	if (atomic_add_unless(&amp;vnode-&gt;cb_nr_mmap, -1, 1))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;vnode-&gt;volume-&gt;cell-&gt;fs_open_mmaps_lock);</div><div class='add'>+	down_write(&amp;vnode-&gt;volume-&gt;open_mmaps_lock);</div><div class='ctx'> </div><div class='del'>-	if (atomic_read(&amp;vnode-&gt;cb_nr_mmap) == 0)</div><div class='add'>+	read_seqlock_excl(&amp;vnode-&gt;cb_lock);</div><div class='add'>+	// the only place where -&gt;cb_nr_mmap may hit 0</div><div class='add'>+	// see __afs_break_callback() for the other side...</div><div class='add'>+	if (atomic_dec_and_test(&amp;vnode-&gt;cb_nr_mmap))</div><div class='ctx'> 		list_del_init(&amp;vnode-&gt;cb_mmap_link);</div><div class='add'>+	read_sequnlock_excl(&amp;vnode-&gt;cb_lock);</div><div class='ctx'> </div><div class='del'>-	up_write(&amp;vnode-&gt;volume-&gt;cell-&gt;fs_open_mmaps_lock);</div><div class='add'>+	up_write(&amp;vnode-&gt;volume-&gt;open_mmaps_lock);</div><div class='ctx'> 	flush_work(&amp;vnode-&gt;cb_work);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Handle setting up a memory mapping on an AFS file.</div><div class='ctx'>  */</div><div class='del'>-static int afs_file_mmap(struct file *file, struct vm_area_struct *vma)</div><div class='add'>+static int afs_file_mmap_prepare(struct vm_area_desc *desc)</div><div class='ctx'> {</div><div class='del'>-	struct afs_vnode *vnode = AFS_FS_I(file_inode(file));</div><div class='add'>+	struct afs_vnode *vnode = AFS_FS_I(file_inode(desc-&gt;file));</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	afs_add_open_mmap(vnode);</div><div class='ctx'> </div><div class='del'>-	ret = generic_file_mmap(file, vma);</div><div class='add'>+	ret = generic_file_mmap_prepare(desc);</div><div class='ctx'> 	if (ret == 0)</div><div class='del'>-		vma-&gt;vm_ops = &amp;afs_vm_ops;</div><div class='add'>+		desc-&gt;vm_ops = &amp;afs_vm_ops;</div><div class='ctx'> 	else</div><div class='ctx'> 		afs_drop_open_mmap(vnode);</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -566,31 +520,47 @@ static void afs_vm_close(struct vm_area_struct *vma)</div><div class='ctx'> static vm_fault_t afs_vm_map_pages(struct vm_fault *vmf, pgoff_t start_pgoff, pgoff_t end_pgoff)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_vnode *vnode = AFS_FS_I(file_inode(vmf-&gt;vma-&gt;vm_file));</div><div class='del'>-	struct afs_file *af = vmf-&gt;vma-&gt;vm_file-&gt;private_data;</div><div class='ctx'> </div><div class='del'>-	switch (afs_validate(vnode, af-&gt;key)) {</div><div class='del'>-	case 0:</div><div class='add'>+	if (afs_check_validity(vnode))</div><div class='ctx'> 		return filemap_map_pages(vmf, start_pgoff, end_pgoff);</div><div class='del'>-	case -ENOMEM:</div><div class='del'>-		return VM_FAULT_OOM;</div><div class='del'>-	case -EINTR:</div><div class='del'>-	case -ERESTARTSYS:</div><div class='del'>-		return VM_FAULT_RETRY;</div><div class='del'>-	case -ESTALE:</div><div class='del'>-	default:</div><div class='del'>-		return VM_FAULT_SIGBUS;</div><div class='del'>-	}</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t afs_file_read_iter(struct kiocb *iocb, struct iov_iter *iter)</div><div class='ctx'> {</div><div class='del'>-	struct afs_vnode *vnode = AFS_FS_I(file_inode(iocb-&gt;ki_filp));</div><div class='add'>+	struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='add'>+	struct afs_vnode *vnode = AFS_FS_I(inode);</div><div class='ctx'> 	struct afs_file *af = iocb-&gt;ki_filp-&gt;private_data;</div><div class='del'>-	int ret;</div><div class='add'>+	ssize_t ret;</div><div class='ctx'> </div><div class='del'>-	ret = afs_validate(vnode, af-&gt;key);</div><div class='add'>+	if (iocb-&gt;ki_flags &amp; IOCB_DIRECT)</div><div class='add'>+		return netfs_unbuffered_read_iter(iocb, iter);</div><div class='add'>+</div><div class='add'>+	ret = netfs_start_io_read(inode);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='add'>+	ret = afs_validate(vnode, af-&gt;key);</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		ret = filemap_read(iocb, iter, 0);</div><div class='add'>+	netfs_end_io_read(inode);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	return generic_file_read_iter(iocb, iter);</div><div class='add'>+static ssize_t afs_file_splice_read(struct file *in, loff_t *ppos,</div><div class='add'>+				    struct pipe_inode_info *pipe,</div><div class='add'>+				    size_t len, unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file_inode(in);</div><div class='add'>+	struct afs_vnode *vnode = AFS_FS_I(inode);</div><div class='add'>+	struct afs_file *af = in-&gt;private_data;</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	ret = netfs_start_io_read(inode);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+	ret = afs_validate(vnode, af-&gt;key);</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		ret = filemap_splice_read(in, ppos, pipe, len, flags);</div><div class='add'>+	netfs_end_io_read(inode);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/afs/flock.c b/fs/afs/flock.c<br/>index c4210a3964d8..f0e96a35093f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/flock.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/flock.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/flock.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/flock.c</a></div><div class='hunk'>@@ -76,7 +76,7 @@ void afs_lock_op_done(struct afs_call *call)</div><div class='ctx'> 	if (call-&gt;error == 0) {</div><div class='ctx'> 		spin_lock(&amp;vnode-&gt;lock);</div><div class='ctx'> 		trace_afs_flock_ev(vnode, NULL, afs_flock_timestamp, 0);</div><div class='del'>-		vnode-&gt;locked_at = call-&gt;reply_time;</div><div class='add'>+		vnode-&gt;locked_at = call-&gt;issue_time;</div><div class='ctx'> 		afs_schedule_lock_extension(vnode);</div><div class='ctx'> 		spin_unlock(&amp;vnode-&gt;lock);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -93,13 +93,13 @@ static void afs_grant_locks(struct afs_vnode *vnode)</div><div class='ctx'> 	bool exclusive = (vnode-&gt;lock_type == AFS_LOCK_WRITE);</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry_safe(p, _p, &amp;vnode-&gt;pending_locks, fl_u.afs.link) {</div><div class='del'>-		if (!exclusive &amp;&amp; p-&gt;fl_type == F_WRLCK)</div><div class='add'>+		if (!exclusive &amp;&amp; lock_is_write(p))</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		list_move_tail(&amp;p-&gt;fl_u.afs.link, &amp;vnode-&gt;granted_locks);</div><div class='ctx'> 		p-&gt;fl_u.afs.state = AFS_LOCK_GRANTED;</div><div class='ctx'> 		trace_afs_flock_op(vnode, p, afs_flock_op_grant);</div><div class='del'>-		wake_up(&amp;p-&gt;fl_wait);</div><div class='add'>+		locks_wake_up(p);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -112,25 +112,24 @@ static void afs_next_locker(struct afs_vnode *vnode, int error)</div><div class='ctx'> {</div><div class='ctx'> 	struct file_lock *p, *_p, *next = NULL;</div><div class='ctx'> 	struct key *key = vnode-&gt;lock_key;</div><div class='del'>-	unsigned int fl_type = F_RDLCK;</div><div class='add'>+	unsigned int type = F_RDLCK;</div><div class='ctx'> </div><div class='ctx'> 	_enter("");</div><div class='ctx'> </div><div class='ctx'> 	if (vnode-&gt;lock_type == AFS_LOCK_WRITE)</div><div class='del'>-		fl_type = F_WRLCK;</div><div class='add'>+		type = F_WRLCK;</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry_safe(p, _p, &amp;vnode-&gt;pending_locks, fl_u.afs.link) {</div><div class='ctx'> 		if (error &amp;&amp;</div><div class='del'>-		    p-&gt;fl_type == fl_type &amp;&amp;</div><div class='del'>-		    afs_file_key(p-&gt;fl_file) == key) {</div><div class='add'>+		    p-&gt;c.flc_type == type &amp;&amp;</div><div class='add'>+		    afs_file_key(p-&gt;c.flc_file) == key) {</div><div class='ctx'> 			list_del_init(&amp;p-&gt;fl_u.afs.link);</div><div class='ctx'> 			p-&gt;fl_u.afs.state = error;</div><div class='del'>-			wake_up(&amp;p-&gt;fl_wait);</div><div class='add'>+			locks_wake_up(p);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* Select the next locker to hand off to. */</div><div class='del'>-		if (next &amp;&amp;</div><div class='del'>-		    (next-&gt;fl_type == F_WRLCK || p-&gt;fl_type == F_RDLCK))</div><div class='add'>+		if (next &amp;&amp; (lock_is_write(next) || lock_is_read(p)))</div><div class='ctx'> 			continue;</div><div class='ctx'> 		next = p;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -142,7 +141,7 @@ static void afs_next_locker(struct afs_vnode *vnode, int error)</div><div class='ctx'> 		afs_set_lock_state(vnode, AFS_VNODE_LOCK_SETTING);</div><div class='ctx'> 		next-&gt;fl_u.afs.state = AFS_LOCK_YOUR_TRY;</div><div class='ctx'> 		trace_afs_flock_op(vnode, next, afs_flock_op_wake);</div><div class='del'>-		wake_up(&amp;next-&gt;fl_wait);</div><div class='add'>+		locks_wake_up(next);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		afs_set_lock_state(vnode, AFS_VNODE_LOCK_NONE);</div><div class='ctx'> 		trace_afs_flock_ev(vnode, NULL, afs_flock_no_lockers, 0);</div><div class='hunk'>@@ -166,7 +165,7 @@ static void afs_kill_lockers_enoent(struct afs_vnode *vnode)</div><div class='ctx'> 			       struct file_lock, fl_u.afs.link);</div><div class='ctx'> 		list_del_init(&amp;p-&gt;fl_u.afs.link);</div><div class='ctx'> 		p-&gt;fl_u.afs.state = -ENOENT;</div><div class='del'>-		wake_up(&amp;p-&gt;fl_wait);</div><div class='add'>+		locks_wake_up(p);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	key_put(vnode-&gt;lock_key);</div><div class='hunk'>@@ -451,7 +450,7 @@ static int afs_do_setlk_check(struct afs_vnode *vnode, struct key *key,</div><div class='ctx'>  */</div><div class='ctx'> static int afs_do_setlk(struct file *file, struct file_lock *fl)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = locks_inode(file);</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='ctx'> 	struct afs_vnode *vnode = AFS_FS_I(inode);</div><div class='ctx'> 	enum afs_flock_mode mode = AFS_FS_S(inode-&gt;i_sb)-&gt;flock_mode;</div><div class='ctx'> 	afs_lock_type_t type;</div><div class='hunk'>@@ -464,14 +463,14 @@ static int afs_do_setlk(struct file *file, struct file_lock *fl)</div><div class='ctx'> </div><div class='ctx'> 	_enter("{%llx:%llu},%llu-%llu,%u,%u",</div><div class='ctx'> 	       vnode-&gt;fid.vid, vnode-&gt;fid.vnode,</div><div class='del'>-	       fl-&gt;fl_start, fl-&gt;fl_end, fl-&gt;fl_type, mode);</div><div class='add'>+	       fl-&gt;fl_start, fl-&gt;fl_end, fl-&gt;c.flc_type, mode);</div><div class='ctx'> </div><div class='ctx'> 	fl-&gt;fl_ops = &amp;afs_lock_ops;</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;fl-&gt;fl_u.afs.link);</div><div class='ctx'> 	fl-&gt;fl_u.afs.state = AFS_LOCK_PENDING;</div><div class='ctx'> </div><div class='ctx'> 	partial = (fl-&gt;fl_start != 0 || fl-&gt;fl_end != OFFSET_MAX);</div><div class='del'>-	type = (fl-&gt;fl_type == F_RDLCK) ? AFS_LOCK_READ : AFS_LOCK_WRITE;</div><div class='add'>+	type = lock_is_read(fl) ? AFS_LOCK_READ : AFS_LOCK_WRITE;</div><div class='ctx'> 	if (mode == afs_flock_mode_write &amp;&amp; partial)</div><div class='ctx'> 		type = AFS_LOCK_WRITE;</div><div class='ctx'> </div><div class='hunk'>@@ -524,7 +523,7 @@ static int afs_do_setlk(struct file *file, struct file_lock *fl)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (vnode-&gt;lock_state == AFS_VNODE_LOCK_NONE &amp;&amp;</div><div class='del'>-	    !(fl-&gt;fl_flags &amp; FL_SLEEP)) {</div><div class='add'>+	    !(fl-&gt;c.flc_flags &amp; FL_SLEEP)) {</div><div class='ctx'> 		ret = -EAGAIN;</div><div class='ctx'> 		if (type == AFS_LOCK_READ) {</div><div class='ctx'> 			if (vnode-&gt;status.lock_count == -1)</div><div class='hunk'>@@ -621,7 +620,7 @@ skip_server_lock:</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> lock_is_contended:</div><div class='del'>-	if (!(fl-&gt;fl_flags &amp; FL_SLEEP)) {</div><div class='add'>+	if (!(fl-&gt;c.flc_flags &amp; FL_SLEEP)) {</div><div class='ctx'> 		list_del_init(&amp;fl-&gt;fl_u.afs.link);</div><div class='ctx'> 		afs_next_locker(vnode, 0);</div><div class='ctx'> 		ret = -EAGAIN;</div><div class='hunk'>@@ -641,7 +640,7 @@ need_to_wait:</div><div class='ctx'> 	spin_unlock(&amp;vnode-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	trace_afs_flock_ev(vnode, fl, afs_flock_waiting, 0);</div><div class='del'>-	ret = wait_event_interruptible(fl-&gt;fl_wait,</div><div class='add'>+	ret = wait_event_interruptible(fl-&gt;c.flc_wait,</div><div class='ctx'> 				       fl-&gt;fl_u.afs.state != AFS_LOCK_PENDING);</div><div class='ctx'> 	trace_afs_flock_ev(vnode, fl, afs_flock_waited, ret);</div><div class='ctx'> </div><div class='hunk'>@@ -701,10 +700,11 @@ error:</div><div class='ctx'>  */</div><div class='ctx'> static int afs_do_unlk(struct file *file, struct file_lock *fl)</div><div class='ctx'> {</div><div class='del'>-	struct afs_vnode *vnode = AFS_FS_I(locks_inode(file));</div><div class='add'>+	struct afs_vnode *vnode = AFS_FS_I(file_inode(file));</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	_enter("{%llx:%llu},%u", vnode-&gt;fid.vid, vnode-&gt;fid.vnode, fl-&gt;fl_type);</div><div class='add'>+	_enter("{%llx:%llu},%u", vnode-&gt;fid.vid, vnode-&gt;fid.vnode,</div><div class='add'>+	       fl-&gt;c.flc_type);</div><div class='ctx'> </div><div class='ctx'> 	trace_afs_flock_op(vnode, fl, afs_flock_op_unlock);</div><div class='ctx'> </div><div class='hunk'>@@ -721,7 +721,7 @@ static int afs_do_unlk(struct file *file, struct file_lock *fl)</div><div class='ctx'>  */</div><div class='ctx'> static int afs_do_getlk(struct file *file, struct file_lock *fl)</div><div class='ctx'> {</div><div class='del'>-	struct afs_vnode *vnode = AFS_FS_I(locks_inode(file));</div><div class='add'>+	struct afs_vnode *vnode = AFS_FS_I(file_inode(file));</div><div class='ctx'> 	struct key *key = afs_file_key(file);</div><div class='ctx'> 	int ret, lock_count;</div><div class='ctx'> </div><div class='hunk'>@@ -730,11 +730,11 @@ static int afs_do_getlk(struct file *file, struct file_lock *fl)</div><div class='ctx'> 	if (vnode-&gt;lock_state == AFS_VNODE_LOCK_DELETED)</div><div class='ctx'> 		return -ENOENT;</div><div class='ctx'> </div><div class='del'>-	fl-&gt;fl_type = F_UNLCK;</div><div class='add'>+	fl-&gt;c.flc_type = F_UNLCK;</div><div class='ctx'> </div><div class='ctx'> 	/* check local lock records first */</div><div class='ctx'> 	posix_test_lock(file, fl);</div><div class='del'>-	if (fl-&gt;fl_type == F_UNLCK) {</div><div class='add'>+	if (lock_is_unlock(fl)) {</div><div class='ctx'> 		/* no local locks; consult the server */</div><div class='ctx'> 		ret = afs_fetch_status(vnode, key, false, NULL);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='hunk'>@@ -743,18 +743,18 @@ static int afs_do_getlk(struct file *file, struct file_lock *fl)</div><div class='ctx'> 		lock_count = READ_ONCE(vnode-&gt;status.lock_count);</div><div class='ctx'> 		if (lock_count != 0) {</div><div class='ctx'> 			if (lock_count &gt; 0)</div><div class='del'>-				fl-&gt;fl_type = F_RDLCK;</div><div class='add'>+				fl-&gt;c.flc_type = F_RDLCK;</div><div class='ctx'> 			else</div><div class='del'>-				fl-&gt;fl_type = F_WRLCK;</div><div class='add'>+				fl-&gt;c.flc_type = F_WRLCK;</div><div class='ctx'> 			fl-&gt;fl_start = 0;</div><div class='ctx'> 			fl-&gt;fl_end = OFFSET_MAX;</div><div class='del'>-			fl-&gt;fl_pid = 0;</div><div class='add'>+			fl-&gt;c.flc_pid = 0;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = 0;</div><div class='ctx'> error:</div><div class='del'>-	_leave(" = %d [%hd]", ret, fl-&gt;fl_type);</div><div class='add'>+	_leave(" = %d [%hd]", ret, fl-&gt;c.flc_type);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -763,13 +763,13 @@ error:</div><div class='ctx'>  */</div><div class='ctx'> int afs_lock(struct file *file, int cmd, struct file_lock *fl)</div><div class='ctx'> {</div><div class='del'>-	struct afs_vnode *vnode = AFS_FS_I(locks_inode(file));</div><div class='add'>+	struct afs_vnode *vnode = AFS_FS_I(file_inode(file));</div><div class='ctx'> 	enum afs_flock_operation op;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	_enter("{%llx:%llu},%d,{t=%x,fl=%x,r=%Ld:%Ld}",</div><div class='ctx'> 	       vnode-&gt;fid.vid, vnode-&gt;fid.vnode, cmd,</div><div class='del'>-	       fl-&gt;fl_type, fl-&gt;fl_flags,</div><div class='add'>+	       fl-&gt;c.flc_type, fl-&gt;c.flc_flags,</div><div class='ctx'> 	       (long long) fl-&gt;fl_start, (long long) fl-&gt;fl_end);</div><div class='ctx'> </div><div class='ctx'> 	if (IS_GETLK(cmd))</div><div class='hunk'>@@ -778,7 +778,7 @@ int afs_lock(struct file *file, int cmd, struct file_lock *fl)</div><div class='ctx'> 	fl-&gt;fl_u.afs.debug_id = atomic_inc_return(&amp;afs_file_lock_debug_id);</div><div class='ctx'> 	trace_afs_flock_op(vnode, fl, afs_flock_op_lock);</div><div class='ctx'> </div><div class='del'>-	if (fl-&gt;fl_type == F_UNLCK)</div><div class='add'>+	if (lock_is_unlock(fl))</div><div class='ctx'> 		ret = afs_do_unlk(file, fl);</div><div class='ctx'> 	else</div><div class='ctx'> 		ret = afs_do_setlk(file, fl);</div><div class='hunk'>@@ -798,13 +798,13 @@ int afs_lock(struct file *file, int cmd, struct file_lock *fl)</div><div class='ctx'>  */</div><div class='ctx'> int afs_flock(struct file *file, int cmd, struct file_lock *fl)</div><div class='ctx'> {</div><div class='del'>-	struct afs_vnode *vnode = AFS_FS_I(locks_inode(file));</div><div class='add'>+	struct afs_vnode *vnode = AFS_FS_I(file_inode(file));</div><div class='ctx'> 	enum afs_flock_operation op;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	_enter("{%llx:%llu},%d,{t=%x,fl=%x}",</div><div class='ctx'> 	       vnode-&gt;fid.vid, vnode-&gt;fid.vnode, cmd,</div><div class='del'>-	       fl-&gt;fl_type, fl-&gt;fl_flags);</div><div class='add'>+	       fl-&gt;c.flc_type, fl-&gt;c.flc_flags);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * No BSD flocks over NFS allowed.</div><div class='hunk'>@@ -813,14 +813,14 @@ int afs_flock(struct file *file, int cmd, struct file_lock *fl)</div><div class='ctx'> 	 * Not sure whether that would be unique, though, or whether</div><div class='ctx'> 	 * that would break in other places.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!(fl-&gt;fl_flags &amp; FL_FLOCK))</div><div class='add'>+	if (!(fl-&gt;c.flc_flags &amp; FL_FLOCK))</div><div class='ctx'> 		return -ENOLCK;</div><div class='ctx'> </div><div class='ctx'> 	fl-&gt;fl_u.afs.debug_id = atomic_inc_return(&amp;afs_file_lock_debug_id);</div><div class='ctx'> 	trace_afs_flock_op(vnode, fl, afs_flock_op_flock);</div><div class='ctx'> </div><div class='ctx'> 	/* we're simulating flock() locks using posix locks on the server */</div><div class='del'>-	if (fl-&gt;fl_type == F_UNLCK)</div><div class='add'>+	if (lock_is_unlock(fl))</div><div class='ctx'> 		ret = afs_do_unlk(file, fl);</div><div class='ctx'> 	else</div><div class='ctx'> 		ret = afs_do_setlk(file, fl);</div><div class='hunk'>@@ -843,7 +843,7 @@ int afs_flock(struct file *file, int cmd, struct file_lock *fl)</div><div class='ctx'>  */</div><div class='ctx'> static void afs_fl_copy_lock(struct file_lock *new, struct file_lock *fl)</div><div class='ctx'> {</div><div class='del'>-	struct afs_vnode *vnode = AFS_FS_I(locks_inode(fl-&gt;fl_file));</div><div class='add'>+	struct afs_vnode *vnode = AFS_FS_I(file_inode(fl-&gt;c.flc_file));</div><div class='ctx'> </div><div class='ctx'> 	_enter("");</div><div class='ctx'> </div><div class='hunk'>@@ -861,7 +861,7 @@ static void afs_fl_copy_lock(struct file_lock *new, struct file_lock *fl)</div><div class='ctx'>  */</div><div class='ctx'> static void afs_fl_release_private(struct file_lock *fl)</div><div class='ctx'> {</div><div class='del'>-	struct afs_vnode *vnode = AFS_FS_I(locks_inode(fl-&gt;fl_file));</div><div class='add'>+	struct afs_vnode *vnode = AFS_FS_I(file_inode(fl-&gt;c.flc_file));</div><div class='ctx'> </div><div class='ctx'> 	_enter("");</div><div class='ctx'> </div><div class='head'>diff --git a/fs/afs/fs_operation.c b/fs/afs/fs_operation.c<br/>index d222dfbe976b..8418813ee043 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/fs_operation.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/fs_operation.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/fs_operation.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/fs_operation.c</a></div><div class='hunk'>@@ -35,18 +35,119 @@ struct afs_operation *afs_alloc_operation(struct key *key, struct afs_volume *vo</div><div class='ctx'> 		key_get(key);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	op-&gt;key		= key;</div><div class='del'>-	op-&gt;volume	= afs_get_volume(volume, afs_volume_trace_get_new_op);</div><div class='del'>-	op-&gt;net		= volume-&gt;cell-&gt;net;</div><div class='del'>-	op-&gt;cb_v_break	= volume-&gt;cb_v_break;</div><div class='del'>-	op-&gt;debug_id	= atomic_inc_return(&amp;afs_operation_debug_counter);</div><div class='del'>-	op-&gt;error	= -EDESTADDRREQ;</div><div class='del'>-	op-&gt;ac.error	= SHRT_MAX;</div><div class='add'>+	op-&gt;key			= key;</div><div class='add'>+	op-&gt;volume		= afs_get_volume(volume, afs_volume_trace_get_new_op);</div><div class='add'>+	op-&gt;net			= volume-&gt;cell-&gt;net;</div><div class='add'>+	op-&gt;cb_v_break		= atomic_read(&amp;volume-&gt;cb_v_break);</div><div class='add'>+	op-&gt;pre_volsync.creation = volume-&gt;creation_time;</div><div class='add'>+	op-&gt;pre_volsync.update	= volume-&gt;update_time;</div><div class='add'>+	op-&gt;debug_id		= atomic_inc_return(&amp;afs_operation_debug_counter);</div><div class='add'>+	op-&gt;nr_iterations	= -1;</div><div class='add'>+	afs_op_set_error(op, -EDESTADDRREQ);</div><div class='ctx'> </div><div class='ctx'> 	_leave(" = [op=%08x]", op-&gt;debug_id);</div><div class='ctx'> 	return op;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+struct afs_io_locker {</div><div class='add'>+	struct list_head	link;</div><div class='add'>+	struct task_struct	*task;</div><div class='add'>+	unsigned long		have_lock;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Unlock the I/O lock on a vnode.</div><div class='add'>+ */</div><div class='add'>+static void afs_unlock_for_io(struct afs_vnode *vnode)</div><div class='add'>+{</div><div class='add'>+	struct afs_io_locker *locker;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;vnode-&gt;lock);</div><div class='add'>+	locker = list_first_entry_or_null(&amp;vnode-&gt;io_lock_waiters,</div><div class='add'>+					  struct afs_io_locker, link);</div><div class='add'>+	if (locker) {</div><div class='add'>+		list_del(&amp;locker-&gt;link);</div><div class='add'>+		smp_store_release(&amp;locker-&gt;have_lock, 1); /* The unlock barrier. */</div><div class='add'>+		smp_mb__after_atomic(); /* Store have_lock before task state */</div><div class='add'>+		wake_up_process(locker-&gt;task);</div><div class='add'>+	} else {</div><div class='add'>+		clear_bit(AFS_VNODE_IO_LOCK, &amp;vnode-&gt;flags);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;vnode-&gt;lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Lock the I/O lock on a vnode uninterruptibly.  We can't use an ordinary</div><div class='add'>+ * mutex as lockdep will complain if we unlock it in the wrong thread.</div><div class='add'>+ */</div><div class='add'>+static void afs_lock_for_io(struct afs_vnode *vnode)</div><div class='add'>+{</div><div class='add'>+	struct afs_io_locker myself = { .task = current, };</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;vnode-&gt;lock);</div><div class='add'>+</div><div class='add'>+	if (!test_and_set_bit(AFS_VNODE_IO_LOCK, &amp;vnode-&gt;flags)) {</div><div class='add'>+		spin_unlock(&amp;vnode-&gt;lock);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	list_add_tail(&amp;myself.link, &amp;vnode-&gt;io_lock_waiters);</div><div class='add'>+	spin_unlock(&amp;vnode-&gt;lock);</div><div class='add'>+</div><div class='add'>+	for (;;) {</div><div class='add'>+		set_current_state(TASK_UNINTERRUPTIBLE);</div><div class='add'>+		if (smp_load_acquire(&amp;myself.have_lock)) /* The lock barrier */</div><div class='add'>+			break;</div><div class='add'>+		schedule();</div><div class='add'>+	}</div><div class='add'>+	__set_current_state(TASK_RUNNING);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Lock the I/O lock on a vnode interruptibly.  We can't use an ordinary mutex</div><div class='add'>+ * as lockdep will complain if we unlock it in the wrong thread.</div><div class='add'>+ */</div><div class='add'>+static int afs_lock_for_io_interruptible(struct afs_vnode *vnode)</div><div class='add'>+{</div><div class='add'>+	struct afs_io_locker myself = { .task = current, };</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;vnode-&gt;lock);</div><div class='add'>+</div><div class='add'>+	if (!test_and_set_bit(AFS_VNODE_IO_LOCK, &amp;vnode-&gt;flags)) {</div><div class='add'>+		spin_unlock(&amp;vnode-&gt;lock);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	list_add_tail(&amp;myself.link, &amp;vnode-&gt;io_lock_waiters);</div><div class='add'>+	spin_unlock(&amp;vnode-&gt;lock);</div><div class='add'>+</div><div class='add'>+	for (;;) {</div><div class='add'>+		set_current_state(TASK_INTERRUPTIBLE);</div><div class='add'>+		if (smp_load_acquire(&amp;myself.have_lock) || /* The lock barrier */</div><div class='add'>+		    signal_pending(current))</div><div class='add'>+			break;</div><div class='add'>+		schedule();</div><div class='add'>+	}</div><div class='add'>+	__set_current_state(TASK_RUNNING);</div><div class='add'>+</div><div class='add'>+	/* If we got a signal, try to transfer the lock onto the next</div><div class='add'>+	 * waiter.</div><div class='add'>+	 */</div><div class='add'>+	if (unlikely(signal_pending(current))) {</div><div class='add'>+		spin_lock(&amp;vnode-&gt;lock);</div><div class='add'>+		if (myself.have_lock) {</div><div class='add'>+			spin_unlock(&amp;vnode-&gt;lock);</div><div class='add'>+			afs_unlock_for_io(vnode);</div><div class='add'>+		} else {</div><div class='add'>+			list_del(&amp;myself.link);</div><div class='add'>+			spin_unlock(&amp;vnode-&gt;lock);</div><div class='add'>+		}</div><div class='add'>+		ret = -ERESTARTSYS;</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Lock the vnode(s) being operated upon.</div><div class='ctx'>  */</div><div class='hunk'>@@ -58,7 +159,7 @@ static bool afs_get_io_locks(struct afs_operation *op)</div><div class='ctx'> 	_enter("");</div><div class='ctx'> </div><div class='ctx'> 	if (op-&gt;flags &amp; AFS_OPERATION_UNINTR) {</div><div class='del'>-		mutex_lock(&amp;vnode-&gt;io_lock);</div><div class='add'>+		afs_lock_for_io(vnode);</div><div class='ctx'> 		op-&gt;flags |= AFS_OPERATION_LOCK_0;</div><div class='ctx'> 		_leave(" = t [1]");</div><div class='ctx'> 		return true;</div><div class='hunk'>@@ -70,8 +171,8 @@ static bool afs_get_io_locks(struct afs_operation *op)</div><div class='ctx'> 	if (vnode2 &gt; vnode)</div><div class='ctx'> 		swap(vnode, vnode2);</div><div class='ctx'> </div><div class='del'>-	if (mutex_lock_interruptible(&amp;vnode-&gt;io_lock) &lt; 0) {</div><div class='del'>-		op-&gt;error = -ERESTARTSYS;</div><div class='add'>+	if (afs_lock_for_io_interruptible(vnode) &lt; 0) {</div><div class='add'>+		afs_op_set_error(op, -ERESTARTSYS);</div><div class='ctx'> 		op-&gt;flags |= AFS_OPERATION_STOP;</div><div class='ctx'> 		_leave(" = f [I 0]");</div><div class='ctx'> 		return false;</div><div class='hunk'>@@ -79,10 +180,10 @@ static bool afs_get_io_locks(struct afs_operation *op)</div><div class='ctx'> 	op-&gt;flags |= AFS_OPERATION_LOCK_0;</div><div class='ctx'> </div><div class='ctx'> 	if (vnode2) {</div><div class='del'>-		if (mutex_lock_interruptible_nested(&amp;vnode2-&gt;io_lock, 1) &lt; 0) {</div><div class='del'>-			op-&gt;error = -ERESTARTSYS;</div><div class='add'>+		if (afs_lock_for_io_interruptible(vnode2) &lt; 0) {</div><div class='add'>+			afs_op_set_error(op, -ERESTARTSYS);</div><div class='ctx'> 			op-&gt;flags |= AFS_OPERATION_STOP;</div><div class='del'>-			mutex_unlock(&amp;vnode-&gt;io_lock);</div><div class='add'>+			afs_unlock_for_io(vnode);</div><div class='ctx'> 			op-&gt;flags &amp;= ~AFS_OPERATION_LOCK_0;</div><div class='ctx'> 			_leave(" = f [I 1]");</div><div class='ctx'> 			return false;</div><div class='hunk'>@@ -102,9 +203,9 @@ static void afs_drop_io_locks(struct afs_operation *op)</div><div class='ctx'> 	_enter("");</div><div class='ctx'> </div><div class='ctx'> 	if (op-&gt;flags &amp; AFS_OPERATION_LOCK_1)</div><div class='del'>-		mutex_unlock(&amp;vnode2-&gt;io_lock);</div><div class='add'>+		afs_unlock_for_io(vnode2);</div><div class='ctx'> 	if (op-&gt;flags &amp; AFS_OPERATION_LOCK_0)</div><div class='del'>-		mutex_unlock(&amp;vnode-&gt;io_lock);</div><div class='add'>+		afs_unlock_for_io(vnode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void afs_prepare_vnode(struct afs_operation *op, struct afs_vnode_param *vp,</div><div class='hunk'>@@ -147,7 +248,7 @@ bool afs_begin_vnode_operation(struct afs_operation *op)</div><div class='ctx'> </div><div class='ctx'> 	afs_prepare_vnode(op, &amp;op-&gt;file[0], 0);</div><div class='ctx'> 	afs_prepare_vnode(op, &amp;op-&gt;file[1], 1);</div><div class='del'>-	op-&gt;cb_v_break = op-&gt;volume-&gt;cb_v_break;</div><div class='add'>+	op-&gt;cb_v_break = atomic_read(&amp;op-&gt;volume-&gt;cb_v_break);</div><div class='ctx'> 	_leave(" = true");</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='hunk'>@@ -155,20 +256,20 @@ bool afs_begin_vnode_operation(struct afs_operation *op)</div><div class='ctx'> /*</div><div class='ctx'>  * Tidy up a filesystem cursor and unlock the vnode.</div><div class='ctx'>  */</div><div class='del'>-static void afs_end_vnode_operation(struct afs_operation *op)</div><div class='add'>+void afs_end_vnode_operation(struct afs_operation *op)</div><div class='ctx'> {</div><div class='ctx'> 	_enter("");</div><div class='ctx'> </div><div class='del'>-	if (op-&gt;error == -EDESTADDRREQ ||</div><div class='del'>-	    op-&gt;error == -EADDRNOTAVAIL ||</div><div class='del'>-	    op-&gt;error == -ENETUNREACH ||</div><div class='del'>-	    op-&gt;error == -EHOSTUNREACH)</div><div class='add'>+	switch (afs_op_error(op)) {</div><div class='add'>+	case -EDESTADDRREQ:</div><div class='add'>+	case -EADDRNOTAVAIL:</div><div class='add'>+	case -ENETUNREACH:</div><div class='add'>+	case -EHOSTUNREACH:</div><div class='ctx'> 		afs_dump_edestaddrreq(op);</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	afs_drop_io_locks(op);</div><div class='del'>-</div><div class='del'>-	if (op-&gt;error == -ECONNABORTED)</div><div class='del'>-		op-&gt;error = afs_abort_to_error(op-&gt;ac.abort_code);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -179,37 +280,43 @@ void afs_wait_for_operation(struct afs_operation *op)</div><div class='ctx'> 	_enter("");</div><div class='ctx'> </div><div class='ctx'> 	while (afs_select_fileserver(op)) {</div><div class='del'>-		op-&gt;cb_s_break = op-&gt;server-&gt;cb_s_break;</div><div class='add'>+		op-&gt;call_responded = false;</div><div class='add'>+		op-&gt;call_error = 0;</div><div class='add'>+		op-&gt;call_abort_code = 0;</div><div class='ctx'> 		if (test_bit(AFS_SERVER_FL_IS_YFS, &amp;op-&gt;server-&gt;flags) &amp;&amp;</div><div class='ctx'> 		    op-&gt;ops-&gt;issue_yfs_rpc)</div><div class='ctx'> 			op-&gt;ops-&gt;issue_yfs_rpc(op);</div><div class='ctx'> 		else if (op-&gt;ops-&gt;issue_afs_rpc)</div><div class='ctx'> 			op-&gt;ops-&gt;issue_afs_rpc(op);</div><div class='ctx'> 		else</div><div class='del'>-			op-&gt;ac.error = -ENOTSUPP;</div><div class='del'>-</div><div class='del'>-		if (op-&gt;call)</div><div class='del'>-			op-&gt;error = afs_wait_for_call_to_complete(op-&gt;call, &amp;op-&gt;ac);</div><div class='add'>+			op-&gt;call_error = -ENOTSUPP;</div><div class='add'>+</div><div class='add'>+		if (op-&gt;call) {</div><div class='add'>+			afs_wait_for_call_to_complete(op-&gt;call);</div><div class='add'>+			op-&gt;call_abort_code = op-&gt;call-&gt;abort_code;</div><div class='add'>+			op-&gt;call_error = op-&gt;call-&gt;error;</div><div class='add'>+			op-&gt;call_responded = op-&gt;call-&gt;responded;</div><div class='add'>+			afs_put_call(op-&gt;call);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	switch (op-&gt;error) {</div><div class='del'>-	case 0:</div><div class='add'>+	if (op-&gt;call_responded &amp;&amp; op-&gt;server)</div><div class='add'>+		set_bit(AFS_SERVER_FL_RESPONDING, &amp;op-&gt;server-&gt;flags);</div><div class='add'>+</div><div class='add'>+	if (!afs_op_error(op)) {</div><div class='ctx'> 		_debug("success");</div><div class='ctx'> 		op-&gt;ops-&gt;success(op);</div><div class='del'>-		break;</div><div class='del'>-	case -ECONNABORTED:</div><div class='add'>+	} else if (op-&gt;cumul_error.aborted) {</div><div class='ctx'> 		if (op-&gt;ops-&gt;aborted)</div><div class='ctx'> 			op-&gt;ops-&gt;aborted(op);</div><div class='del'>-		fallthrough;</div><div class='del'>-	default:</div><div class='add'>+	} else {</div><div class='ctx'> 		if (op-&gt;ops-&gt;failed)</div><div class='ctx'> 			op-&gt;ops-&gt;failed(op);</div><div class='del'>-		break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	afs_end_vnode_operation(op);</div><div class='ctx'> </div><div class='del'>-	if (op-&gt;error == 0 &amp;&amp; op-&gt;ops-&gt;edit_dir) {</div><div class='add'>+	if (!afs_op_error(op) &amp;&amp; op-&gt;ops-&gt;edit_dir) {</div><div class='ctx'> 		_debug("edit_dir");</div><div class='ctx'> 		op-&gt;ops-&gt;edit_dir(op);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -221,7 +328,8 @@ void afs_wait_for_operation(struct afs_operation *op)</div><div class='ctx'>  */</div><div class='ctx'> int afs_put_operation(struct afs_operation *op)</div><div class='ctx'> {</div><div class='del'>-	int i, ret = op-&gt;error;</div><div class='add'>+	struct afs_addr_list *alist;</div><div class='add'>+	int i, ret = afs_op_error(op);</div><div class='ctx'> </div><div class='ctx'> 	_enter("op=%08x,%d", op-&gt;debug_id, ret);</div><div class='ctx'> </div><div class='hunk'>@@ -232,20 +340,30 @@ int afs_put_operation(struct afs_operation *op)</div><div class='ctx'> 	if (op-&gt;file[1].modification &amp;&amp; op-&gt;file[1].vnode != op-&gt;file[0].vnode)</div><div class='ctx'> 		clear_bit(AFS_VNODE_MODIFYING, &amp;op-&gt;file[1].vnode-&gt;flags);</div><div class='ctx'> 	if (op-&gt;file[0].put_vnode)</div><div class='del'>-		iput(&amp;op-&gt;file[0].vnode-&gt;vfs_inode);</div><div class='add'>+		iput(&amp;op-&gt;file[0].vnode-&gt;netfs.inode);</div><div class='ctx'> 	if (op-&gt;file[1].put_vnode)</div><div class='del'>-		iput(&amp;op-&gt;file[1].vnode-&gt;vfs_inode);</div><div class='add'>+		iput(&amp;op-&gt;file[1].vnode-&gt;netfs.inode);</div><div class='ctx'> </div><div class='ctx'> 	if (op-&gt;more_files) {</div><div class='ctx'> 		for (i = 0; i &lt; op-&gt;nr_files - 2; i++)</div><div class='ctx'> 			if (op-&gt;more_files[i].put_vnode)</div><div class='del'>-				iput(&amp;op-&gt;more_files[i].vnode-&gt;vfs_inode);</div><div class='add'>+				iput(&amp;op-&gt;more_files[i].vnode-&gt;netfs.inode);</div><div class='ctx'> 		kfree(op-&gt;more_files);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	afs_end_cursor(&amp;op-&gt;ac);</div><div class='add'>+	if (op-&gt;estate) {</div><div class='add'>+		alist = op-&gt;estate-&gt;addresses;</div><div class='add'>+		if (alist) {</div><div class='add'>+			if (op-&gt;call_responded &amp;&amp;</div><div class='add'>+			    op-&gt;addr_index != alist-&gt;preferred &amp;&amp;</div><div class='add'>+			    test_bit(alist-&gt;preferred, &amp;op-&gt;addr_tried))</div><div class='add'>+				WRITE_ONCE(alist-&gt;preferred, op-&gt;addr_index);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	afs_clear_server_states(op);</div><div class='ctx'> 	afs_put_serverlist(op-&gt;net, op-&gt;server_list);</div><div class='del'>-	afs_put_volume(op-&gt;net, op-&gt;volume, afs_volume_trace_put_put_op);</div><div class='add'>+	afs_put_volume(op-&gt;volume, afs_volume_trace_put_put_op);</div><div class='ctx'> 	key_put(op-&gt;key);</div><div class='ctx'> 	kfree(op);</div><div class='ctx'> 	return ret;</div><div class='head'>diff --git a/fs/afs/fs_probe.c b/fs/afs/fs_probe.c<br/>index c0031a3ab42f..e0030ac74ea0 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/fs_probe.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/fs_probe.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/fs_probe.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/fs_probe.c</a></div><div class='hunk'>@@ -15,6 +15,42 @@</div><div class='ctx'> static unsigned int afs_fs_probe_fast_poll_interval = 30 * HZ;</div><div class='ctx'> static unsigned int afs_fs_probe_slow_poll_interval = 5 * 60 * HZ;</div><div class='ctx'> </div><div class='add'>+struct afs_endpoint_state *afs_get_endpoint_state(struct afs_endpoint_state *estate,</div><div class='add'>+						  enum afs_estate_trace where)</div><div class='add'>+{</div><div class='add'>+	if (estate) {</div><div class='add'>+		int r;</div><div class='add'>+</div><div class='add'>+		__refcount_inc(&amp;estate-&gt;ref, &amp;r);</div><div class='add'>+		trace_afs_estate(estate-&gt;server_id, estate-&gt;probe_seq, r, where);</div><div class='add'>+	}</div><div class='add'>+	return estate;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void afs_endpoint_state_rcu(struct rcu_head *rcu)</div><div class='add'>+{</div><div class='add'>+	struct afs_endpoint_state *estate = container_of(rcu, struct afs_endpoint_state, rcu);</div><div class='add'>+</div><div class='add'>+	trace_afs_estate(estate-&gt;server_id, estate-&gt;probe_seq, refcount_read(&amp;estate-&gt;ref),</div><div class='add'>+			 afs_estate_trace_free);</div><div class='add'>+	afs_put_addrlist(estate-&gt;addresses, afs_alist_trace_put_estate);</div><div class='add'>+	kfree(estate);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void afs_put_endpoint_state(struct afs_endpoint_state *estate, enum afs_estate_trace where)</div><div class='add'>+{</div><div class='add'>+	if (estate) {</div><div class='add'>+		unsigned int server_id = estate-&gt;server_id, probe_seq = estate-&gt;probe_seq;</div><div class='add'>+		bool dead;</div><div class='add'>+		int r;</div><div class='add'>+</div><div class='add'>+		dead = __refcount_dec_and_test(&amp;estate-&gt;ref, &amp;r);</div><div class='add'>+		trace_afs_estate(server_id, probe_seq, r, where);</div><div class='add'>+		if (dead)</div><div class='add'>+			call_rcu(&amp;estate-&gt;rcu, afs_endpoint_state_rcu);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Start the probe polling timer.  We have to supply it with an inc on the</div><div class='ctx'>  * outstanding server count.</div><div class='hunk'>@@ -38,9 +74,10 @@ static void afs_schedule_fs_probe(struct afs_net *net,</div><div class='ctx'> /*</div><div class='ctx'>  * Handle the completion of a set of probes.</div><div class='ctx'>  */</div><div class='del'>-static void afs_finished_fs_probe(struct afs_net *net, struct afs_server *server)</div><div class='add'>+static void afs_finished_fs_probe(struct afs_net *net, struct afs_server *server,</div><div class='add'>+				  struct afs_endpoint_state *estate)</div><div class='ctx'> {</div><div class='del'>-	bool responded = server-&gt;probe.responded;</div><div class='add'>+	bool responded = test_bit(AFS_ESTATE_RESPONDED, &amp;estate-&gt;flags);</div><div class='ctx'> </div><div class='ctx'> 	write_seqlock(&amp;net-&gt;fs_lock);</div><div class='ctx'> 	if (responded) {</div><div class='hunk'>@@ -50,6 +87,7 @@ static void afs_finished_fs_probe(struct afs_net *net, struct afs_server *server</div><div class='ctx'> 		clear_bit(AFS_SERVER_FL_RESPONDING, &amp;server-&gt;flags);</div><div class='ctx'> 		list_add_tail(&amp;server-&gt;probe_link, &amp;net-&gt;fs_probe_fast);</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> 	write_sequnlock(&amp;net-&gt;fs_lock);</div><div class='ctx'> </div><div class='ctx'> 	afs_schedule_fs_probe(net, server, !responded);</div><div class='hunk'>@@ -58,12 +96,13 @@ static void afs_finished_fs_probe(struct afs_net *net, struct afs_server *server</div><div class='ctx'> /*</div><div class='ctx'>  * Handle the completion of a probe.</div><div class='ctx'>  */</div><div class='del'>-static void afs_done_one_fs_probe(struct afs_net *net, struct afs_server *server)</div><div class='add'>+static void afs_done_one_fs_probe(struct afs_net *net, struct afs_server *server,</div><div class='add'>+				  struct afs_endpoint_state *estate)</div><div class='ctx'> {</div><div class='ctx'> 	_enter("");</div><div class='ctx'> </div><div class='del'>-	if (atomic_dec_and_test(&amp;server-&gt;probe_outstanding))</div><div class='del'>-		afs_finished_fs_probe(net, server);</div><div class='add'>+	if (atomic_dec_and_test(&amp;estate-&gt;nr_probing))</div><div class='add'>+		afs_finished_fs_probe(net, server, estate);</div><div class='ctx'> </div><div class='ctx'> 	wake_up_all(&amp;server-&gt;probe_wq);</div><div class='ctx'> }</div><div class='hunk'>@@ -74,24 +113,22 @@ static void afs_done_one_fs_probe(struct afs_net *net, struct afs_server *server</div><div class='ctx'>  */</div><div class='ctx'> static void afs_fs_probe_not_done(struct afs_net *net,</div><div class='ctx'> 				  struct afs_server *server,</div><div class='del'>-				  struct afs_addr_cursor *ac)</div><div class='add'>+				  struct afs_endpoint_state *estate,</div><div class='add'>+				  int index)</div><div class='ctx'> {</div><div class='del'>-	struct afs_addr_list *alist = ac-&gt;alist;</div><div class='del'>-	unsigned int index = ac-&gt;index;</div><div class='del'>-</div><div class='ctx'> 	_enter("");</div><div class='ctx'> </div><div class='ctx'> 	trace_afs_io_error(0, -ENOMEM, afs_io_error_fs_probe_fail);</div><div class='ctx'> 	spin_lock(&amp;server-&gt;probe_lock);</div><div class='ctx'> </div><div class='del'>-	server-&gt;probe.local_failure = true;</div><div class='del'>-	if (server-&gt;probe.error == 0)</div><div class='del'>-		server-&gt;probe.error = -ENOMEM;</div><div class='add'>+	set_bit(AFS_ESTATE_LOCAL_FAILURE, &amp;estate-&gt;flags);</div><div class='add'>+	if (estate-&gt;error == 0)</div><div class='add'>+		estate-&gt;error = -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	set_bit(index, &amp;alist-&gt;failed);</div><div class='add'>+	set_bit(index, &amp;estate-&gt;failed_set);</div><div class='ctx'> </div><div class='ctx'> 	spin_unlock(&amp;server-&gt;probe_lock);</div><div class='del'>-	return afs_done_one_fs_probe(net, server);</div><div class='add'>+	return afs_done_one_fs_probe(net, server, estate);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -100,30 +137,34 @@ static void afs_fs_probe_not_done(struct afs_net *net,</div><div class='ctx'>  */</div><div class='ctx'> void afs_fileserver_probe_result(struct afs_call *call)</div><div class='ctx'> {</div><div class='del'>-	struct afs_addr_list *alist = call-&gt;alist;</div><div class='add'>+	struct afs_endpoint_state *estate = call-&gt;probe;</div><div class='add'>+	struct afs_addr_list *alist = estate-&gt;addresses;</div><div class='add'>+	struct afs_address *addr = &amp;alist-&gt;addrs[call-&gt;probe_index];</div><div class='ctx'> 	struct afs_server *server = call-&gt;server;</div><div class='del'>-	unsigned int index = call-&gt;addr_ix;</div><div class='del'>-	unsigned int rtt_us = 0, cap0;</div><div class='add'>+	unsigned int index = call-&gt;probe_index;</div><div class='add'>+	unsigned int rtt_us = -1, cap0;</div><div class='ctx'> 	int ret = call-&gt;error;</div><div class='ctx'> </div><div class='ctx'> 	_enter("%pU,%u", &amp;server-&gt;uuid, index);</div><div class='ctx'> </div><div class='add'>+	WRITE_ONCE(addr-&gt;last_error, ret);</div><div class='add'>+</div><div class='ctx'> 	spin_lock(&amp;server-&gt;probe_lock);</div><div class='ctx'> </div><div class='ctx'> 	switch (ret) {</div><div class='ctx'> 	case 0:</div><div class='del'>-		server-&gt;probe.error = 0;</div><div class='add'>+		estate-&gt;error = 0;</div><div class='ctx'> 		goto responded;</div><div class='ctx'> 	case -ECONNABORTED:</div><div class='del'>-		if (!server-&gt;probe.responded) {</div><div class='del'>-			server-&gt;probe.abort_code = call-&gt;abort_code;</div><div class='del'>-			server-&gt;probe.error = ret;</div><div class='add'>+		if (!test_bit(AFS_ESTATE_RESPONDED, &amp;estate-&gt;flags)) {</div><div class='add'>+			estate-&gt;abort_code = call-&gt;abort_code;</div><div class='add'>+			estate-&gt;error = ret;</div><div class='ctx'> 		}</div><div class='ctx'> 		goto responded;</div><div class='ctx'> 	case -ENOMEM:</div><div class='ctx'> 	case -ENONET:</div><div class='del'>-		clear_bit(index, &amp;alist-&gt;responded);</div><div class='del'>-		server-&gt;probe.local_failure = true;</div><div class='add'>+		clear_bit(index, &amp;estate-&gt;responsive_set);</div><div class='add'>+		set_bit(AFS_ESTATE_LOCAL_FAILURE, &amp;estate-&gt;flags);</div><div class='ctx'> 		trace_afs_io_error(call-&gt;debug_id, ret, afs_io_error_fs_probe_fail);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	case -ECONNRESET: /* Responded, but call expired. */</div><div class='hunk'>@@ -136,29 +177,29 @@ void afs_fileserver_probe_result(struct afs_call *call)</div><div class='ctx'> 	case -ETIMEDOUT:</div><div class='ctx'> 	case -ETIME:</div><div class='ctx'> 	default:</div><div class='del'>-		clear_bit(index, &amp;alist-&gt;responded);</div><div class='del'>-		set_bit(index, &amp;alist-&gt;failed);</div><div class='del'>-		if (!server-&gt;probe.responded &amp;&amp;</div><div class='del'>-		    (server-&gt;probe.error == 0 ||</div><div class='del'>-		     server-&gt;probe.error == -ETIMEDOUT ||</div><div class='del'>-		     server-&gt;probe.error == -ETIME))</div><div class='del'>-			server-&gt;probe.error = ret;</div><div class='add'>+		clear_bit(index, &amp;estate-&gt;responsive_set);</div><div class='add'>+		set_bit(index, &amp;estate-&gt;failed_set);</div><div class='add'>+		if (!test_bit(AFS_ESTATE_RESPONDED, &amp;estate-&gt;flags) &amp;&amp;</div><div class='add'>+		    (estate-&gt;error == 0 ||</div><div class='add'>+		     estate-&gt;error == -ETIMEDOUT ||</div><div class='add'>+		     estate-&gt;error == -ETIME))</div><div class='add'>+			estate-&gt;error = ret;</div><div class='ctx'> 		trace_afs_io_error(call-&gt;debug_id, ret, afs_io_error_fs_probe_fail);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> responded:</div><div class='del'>-	clear_bit(index, &amp;alist-&gt;failed);</div><div class='add'>+	clear_bit(index, &amp;estate-&gt;failed_set);</div><div class='ctx'> </div><div class='ctx'> 	if (call-&gt;service_id == YFS_FS_SERVICE) {</div><div class='del'>-		server-&gt;probe.is_yfs = true;</div><div class='add'>+		set_bit(AFS_ESTATE_IS_YFS, &amp;estate-&gt;flags);</div><div class='ctx'> 		set_bit(AFS_SERVER_FL_IS_YFS, &amp;server-&gt;flags);</div><div class='del'>-		alist-&gt;addrs[index].srx_service = call-&gt;service_id;</div><div class='add'>+		server-&gt;service_id = call-&gt;service_id;</div><div class='ctx'> 	} else {</div><div class='del'>-		server-&gt;probe.not_yfs = true;</div><div class='del'>-		if (!server-&gt;probe.is_yfs) {</div><div class='add'>+		set_bit(AFS_ESTATE_NOT_YFS, &amp;estate-&gt;flags);</div><div class='add'>+		if (!test_bit(AFS_ESTATE_IS_YFS, &amp;estate-&gt;flags)) {</div><div class='ctx'> 			clear_bit(AFS_SERVER_FL_IS_YFS, &amp;server-&gt;flags);</div><div class='del'>-			alist-&gt;addrs[index].srx_service = call-&gt;service_id;</div><div class='add'>+			server-&gt;service_id = call-&gt;service_id;</div><div class='ctx'> 		}</div><div class='ctx'> 		cap0 = ntohl(call-&gt;tmp);</div><div class='ctx'> 		if (cap0 &amp; AFS3_VICED_CAPABILITY_64BITFILES)</div><div class='hunk'>@@ -167,116 +208,148 @@ responded:</div><div class='ctx'> 			clear_bit(AFS_SERVER_FL_HAS_FS64, &amp;server-&gt;flags);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (rxrpc_kernel_get_srtt(call-&gt;net-&gt;socket, call-&gt;rxcall, &amp;rtt_us) &amp;&amp;</div><div class='del'>-	    rtt_us &lt; server-&gt;probe.rtt) {</div><div class='del'>-		server-&gt;probe.rtt = rtt_us;</div><div class='add'>+	rtt_us = rxrpc_kernel_get_srtt(addr-&gt;peer);</div><div class='add'>+	if (rtt_us &lt; estate-&gt;rtt) {</div><div class='add'>+		estate-&gt;rtt = rtt_us;</div><div class='ctx'> 		server-&gt;rtt = rtt_us;</div><div class='ctx'> 		alist-&gt;preferred = index;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	smp_wmb(); /* Set rtt before responded. */</div><div class='del'>-	server-&gt;probe.responded = true;</div><div class='del'>-	set_bit(index, &amp;alist-&gt;responded);</div><div class='add'>+	set_bit(AFS_ESTATE_RESPONDED, &amp;estate-&gt;flags);</div><div class='add'>+	set_bit(index, &amp;estate-&gt;responsive_set);</div><div class='ctx'> 	set_bit(AFS_SERVER_FL_RESPONDING, &amp;server-&gt;flags);</div><div class='ctx'> out:</div><div class='ctx'> 	spin_unlock(&amp;server-&gt;probe_lock);</div><div class='ctx'> </div><div class='del'>-	_debug("probe %pU [%u] %pISpc rtt=%u ret=%d",</div><div class='del'>-	       &amp;server-&gt;uuid, index, &amp;alist-&gt;addrs[index].transport,</div><div class='add'>+	trace_afs_fs_probe(server, false, estate, index, call-&gt;error, call-&gt;abort_code, rtt_us);</div><div class='add'>+	_debug("probe[%x] %pU [%u] %pISpc rtt=%d ret=%d",</div><div class='add'>+	       estate-&gt;probe_seq, &amp;server-&gt;uuid, index,</div><div class='add'>+	       rxrpc_kernel_remote_addr(alist-&gt;addrs[index].peer),</div><div class='ctx'> 	       rtt_us, ret);</div><div class='ctx'> </div><div class='del'>-	return afs_done_one_fs_probe(call-&gt;net, server);</div><div class='add'>+	return afs_done_one_fs_probe(call-&gt;net, server, estate);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Probe one or all of a fileserver's addresses to find out the best route and</div><div class='del'>- * to query its capabilities.</div><div class='add'>+ * Probe all of a fileserver's addresses to find out the best route and to</div><div class='add'>+ * query its capabilities.</div><div class='ctx'>  */</div><div class='del'>-void afs_fs_probe_fileserver(struct afs_net *net, struct afs_server *server,</div><div class='del'>-			     struct key *key, bool all)</div><div class='add'>+int afs_fs_probe_fileserver(struct afs_net *net, struct afs_server *server,</div><div class='add'>+			    struct afs_addr_list *new_alist, struct key *key)</div><div class='ctx'> {</div><div class='del'>-	struct afs_addr_cursor ac = {</div><div class='del'>-		.index = 0,</div><div class='del'>-	};</div><div class='add'>+	struct afs_endpoint_state *estate, *old;</div><div class='add'>+	struct afs_addr_list *old_alist = NULL, *alist;</div><div class='add'>+	unsigned long unprobed;</div><div class='ctx'> </div><div class='ctx'> 	_enter("%pU", &amp;server-&gt;uuid);</div><div class='ctx'> </div><div class='del'>-	read_lock(&amp;server-&gt;fs_lock);</div><div class='del'>-	ac.alist = rcu_dereference_protected(server-&gt;addresses,</div><div class='del'>-					     lockdep_is_held(&amp;server-&gt;fs_lock));</div><div class='del'>-	afs_get_addrlist(ac.alist);</div><div class='del'>-	read_unlock(&amp;server-&gt;fs_lock);</div><div class='add'>+	estate = kzalloc(sizeof(*estate), GFP_KERNEL);</div><div class='add'>+	if (!estate)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	refcount_set(&amp;estate-&gt;ref, 2);</div><div class='add'>+	estate-&gt;server_id = server-&gt;debug_id;</div><div class='add'>+	estate-&gt;rtt = UINT_MAX;</div><div class='add'>+</div><div class='add'>+	write_lock(&amp;server-&gt;fs_lock);</div><div class='add'>+</div><div class='add'>+	old = rcu_dereference_protected(server-&gt;endpoint_state,</div><div class='add'>+					lockdep_is_held(&amp;server-&gt;fs_lock));</div><div class='add'>+	if (old) {</div><div class='add'>+		estate-&gt;responsive_set = old-&gt;responsive_set;</div><div class='add'>+		if (!new_alist)</div><div class='add'>+			new_alist = old-&gt;addresses;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (old_alist != new_alist)</div><div class='add'>+		afs_set_peer_appdata(server, old_alist, new_alist);</div><div class='add'>+</div><div class='add'>+	estate-&gt;addresses = afs_get_addrlist(new_alist, afs_alist_trace_get_estate);</div><div class='add'>+	alist = estate-&gt;addresses;</div><div class='add'>+	estate-&gt;probe_seq = ++server-&gt;probe_counter;</div><div class='add'>+	atomic_set(&amp;estate-&gt;nr_probing, alist-&gt;nr_addrs);</div><div class='add'>+</div><div class='add'>+	if (new_alist)</div><div class='add'>+		server-&gt;addr_version = new_alist-&gt;version;</div><div class='add'>+	rcu_assign_pointer(server-&gt;endpoint_state, estate);</div><div class='add'>+	write_unlock(&amp;server-&gt;fs_lock);</div><div class='add'>+	if (old)</div><div class='add'>+		set_bit(AFS_ESTATE_SUPERSEDED, &amp;old-&gt;flags);</div><div class='add'>+</div><div class='add'>+	trace_afs_estate(estate-&gt;server_id, estate-&gt;probe_seq, refcount_read(&amp;estate-&gt;ref),</div><div class='add'>+			 afs_estate_trace_alloc_probe);</div><div class='add'>+</div><div class='add'>+	afs_get_address_preferences(net, new_alist);</div><div class='ctx'> </div><div class='ctx'> 	server-&gt;probed_at = jiffies;</div><div class='del'>-	atomic_set(&amp;server-&gt;probe_outstanding, all ? ac.alist-&gt;nr_addrs : 1);</div><div class='del'>-	memset(&amp;server-&gt;probe, 0, sizeof(server-&gt;probe));</div><div class='del'>-	server-&gt;probe.rtt = UINT_MAX;</div><div class='del'>-</div><div class='del'>-	ac.index = ac.alist-&gt;preferred;</div><div class='del'>-	if (ac.index &lt; 0 || ac.index &gt;= ac.alist-&gt;nr_addrs)</div><div class='del'>-		all = true;</div><div class='del'>-</div><div class='del'>-	if (all) {</div><div class='del'>-		for (ac.index = 0; ac.index &lt; ac.alist-&gt;nr_addrs; ac.index++)</div><div class='del'>-			if (!afs_fs_get_capabilities(net, server, &amp;ac, key))</div><div class='del'>-				afs_fs_probe_not_done(net, server, &amp;ac);</div><div class='del'>-	} else {</div><div class='del'>-		if (!afs_fs_get_capabilities(net, server, &amp;ac, key))</div><div class='del'>-			afs_fs_probe_not_done(net, server, &amp;ac);</div><div class='add'>+	unprobed = (1UL &lt;&lt; alist-&gt;nr_addrs) - 1;</div><div class='add'>+	while (unprobed) {</div><div class='add'>+		unsigned int index = 0, i;</div><div class='add'>+		int best_prio = -1;</div><div class='add'>+</div><div class='add'>+		for (i = 0; i &lt; alist-&gt;nr_addrs; i++) {</div><div class='add'>+			if (test_bit(i, &amp;unprobed) &amp;&amp;</div><div class='add'>+			    alist-&gt;addrs[i].prio &gt; best_prio) {</div><div class='add'>+				index = i;</div><div class='add'>+				best_prio = alist-&gt;addrs[i].prio;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+		__clear_bit(index, &amp;unprobed);</div><div class='add'>+</div><div class='add'>+		trace_afs_fs_probe(server, true, estate, index, 0, 0, 0);</div><div class='add'>+		if (!afs_fs_get_capabilities(net, server, estate, index, key))</div><div class='add'>+			afs_fs_probe_not_done(net, server, estate, index);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	afs_put_addrlist(ac.alist);</div><div class='add'>+	afs_put_endpoint_state(old, afs_estate_trace_put_probe);</div><div class='add'>+	afs_put_endpoint_state(estate, afs_estate_trace_put_probe);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Wait for the first as-yet untried fileserver to respond.</div><div class='add'>+ * Wait for the first as-yet untried fileserver to respond, for the probe state</div><div class='add'>+ * to be superseded or for all probes to finish.</div><div class='ctx'>  */</div><div class='del'>-int afs_wait_for_fs_probes(struct afs_server_list *slist, unsigned long untried)</div><div class='add'>+int afs_wait_for_fs_probes(struct afs_operation *op, struct afs_server_state *states, bool intr)</div><div class='ctx'> {</div><div class='del'>-	struct wait_queue_entry *waits;</div><div class='del'>-	struct afs_server *server;</div><div class='del'>-	unsigned int rtt = UINT_MAX, rtt_s;</div><div class='del'>-	bool have_responders = false;</div><div class='del'>-	int pref = -1, i;</div><div class='add'>+	struct afs_endpoint_state *estate;</div><div class='add'>+	struct afs_server_list *slist = op-&gt;server_list;</div><div class='add'>+	bool still_probing = true;</div><div class='add'>+	int ret = 0, i;</div><div class='ctx'> </div><div class='del'>-	_enter("%u,%lx", slist-&gt;nr_servers, untried);</div><div class='add'>+	_enter("%u", slist-&gt;nr_servers);</div><div class='ctx'> </div><div class='del'>-	/* Only wait for servers that have a probe outstanding. */</div><div class='ctx'> 	for (i = 0; i &lt; slist-&gt;nr_servers; i++) {</div><div class='del'>-		if (test_bit(i, &amp;untried)) {</div><div class='del'>-			server = slist-&gt;servers[i].server;</div><div class='del'>-			if (!atomic_read(&amp;server-&gt;probe_outstanding))</div><div class='del'>-				__clear_bit(i, &amp;untried);</div><div class='del'>-			if (server-&gt;probe.responded)</div><div class='del'>-				have_responders = true;</div><div class='del'>-		}</div><div class='add'>+		estate = states[i].endpoint_state;</div><div class='add'>+		if (test_bit(AFS_ESTATE_SUPERSEDED, &amp;estate-&gt;flags))</div><div class='add'>+			return 2;</div><div class='add'>+		if (atomic_read(&amp;estate-&gt;nr_probing))</div><div class='add'>+			still_probing = true;</div><div class='add'>+		if (estate-&gt;responsive_set &amp; states[i].untried_addrs)</div><div class='add'>+			return 1;</div><div class='ctx'> 	}</div><div class='del'>-	if (have_responders || !untried)</div><div class='add'>+	if (!still_probing)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	waits = kmalloc(array_size(slist-&gt;nr_servers, sizeof(*waits)), GFP_KERNEL);</div><div class='del'>-	if (!waits)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; slist-&gt;nr_servers; i++) {</div><div class='del'>-		if (test_bit(i, &amp;untried)) {</div><div class='del'>-			server = slist-&gt;servers[i].server;</div><div class='del'>-			init_waitqueue_entry(&amp;waits[i], current);</div><div class='del'>-			add_wait_queue(&amp;server-&gt;probe_wq, &amp;waits[i]);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	for (i = 0; i &lt; slist-&gt;nr_servers; i++)</div><div class='add'>+		add_wait_queue(&amp;slist-&gt;servers[i].server-&gt;probe_wq, &amp;states[i].probe_waiter);</div><div class='ctx'> </div><div class='ctx'> 	for (;;) {</div><div class='del'>-		bool still_probing = false;</div><div class='add'>+		still_probing = false;</div><div class='ctx'> </div><div class='del'>-		set_current_state(TASK_INTERRUPTIBLE);</div><div class='add'>+		set_current_state(intr ? TASK_INTERRUPTIBLE : TASK_UNINTERRUPTIBLE);</div><div class='ctx'> 		for (i = 0; i &lt; slist-&gt;nr_servers; i++) {</div><div class='del'>-			if (test_bit(i, &amp;untried)) {</div><div class='del'>-				server = slist-&gt;servers[i].server;</div><div class='del'>-				if (server-&gt;probe.responded)</div><div class='del'>-					goto stop;</div><div class='del'>-				if (atomic_read(&amp;server-&gt;probe_outstanding))</div><div class='del'>-					still_probing = true;</div><div class='add'>+			estate = states[i].endpoint_state;</div><div class='add'>+			if (test_bit(AFS_ESTATE_SUPERSEDED, &amp;estate-&gt;flags)) {</div><div class='add'>+				ret = 2;</div><div class='add'>+				goto stop;</div><div class='add'>+			}</div><div class='add'>+			if (atomic_read(&amp;estate-&gt;nr_probing))</div><div class='add'>+				still_probing = true;</div><div class='add'>+			if (estate-&gt;responsive_set &amp; states[i].untried_addrs) {</div><div class='add'>+				ret = 1;</div><div class='add'>+				goto stop;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -288,28 +361,12 @@ int afs_wait_for_fs_probes(struct afs_server_list *slist, unsigned long untried)</div><div class='ctx'> stop:</div><div class='ctx'> 	set_current_state(TASK_RUNNING);</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; slist-&gt;nr_servers; i++) {</div><div class='del'>-		if (test_bit(i, &amp;untried)) {</div><div class='del'>-			server = slist-&gt;servers[i].server;</div><div class='del'>-			rtt_s = READ_ONCE(server-&gt;rtt);</div><div class='del'>-			if (test_bit(AFS_SERVER_FL_RESPONDING, &amp;server-&gt;flags) &amp;&amp;</div><div class='del'>-			    rtt_s &lt; rtt) {</div><div class='del'>-				pref = i;</div><div class='del'>-				rtt = rtt_s;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			remove_wait_queue(&amp;server-&gt;probe_wq, &amp;waits[i]);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	kfree(waits);</div><div class='del'>-</div><div class='del'>-	if (pref == -1 &amp;&amp; signal_pending(current))</div><div class='del'>-		return -ERESTARTSYS;</div><div class='add'>+	for (i = 0; i &lt; slist-&gt;nr_servers; i++)</div><div class='add'>+		remove_wait_queue(&amp;slist-&gt;servers[i].server-&gt;probe_wq, &amp;states[i].probe_waiter);</div><div class='ctx'> </div><div class='del'>-	if (pref &gt;= 0)</div><div class='del'>-		slist-&gt;preferred = pref;</div><div class='del'>-	return 0;</div><div class='add'>+	if (!ret &amp;&amp; signal_pending(current))</div><div class='add'>+		ret = -ERESTARTSYS;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -327,7 +384,7 @@ void afs_fs_probe_timer(struct timer_list *timer)</div><div class='ctx'> /*</div><div class='ctx'>  * Dispatch a probe to a server.</div><div class='ctx'>  */</div><div class='del'>-static void afs_dispatch_fs_probe(struct afs_net *net, struct afs_server *server, bool all)</div><div class='add'>+static void afs_dispatch_fs_probe(struct afs_net *net, struct afs_server *server)</div><div class='ctx'> 	__releases(&amp;net-&gt;fs_lock)</div><div class='ctx'> {</div><div class='ctx'> 	struct key *key = NULL;</div><div class='hunk'>@@ -340,7 +397,7 @@ static void afs_dispatch_fs_probe(struct afs_net *net, struct afs_server *server</div><div class='ctx'> 	afs_get_server(server, afs_server_trace_get_probe);</div><div class='ctx'> 	write_sequnlock(&amp;net-&gt;fs_lock);</div><div class='ctx'> </div><div class='del'>-	afs_fs_probe_fileserver(net, server, key, all);</div><div class='add'>+	afs_fs_probe_fileserver(net, server, NULL, key);</div><div class='ctx'> 	afs_put_server(net, server, afs_server_trace_put_probe);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -352,7 +409,7 @@ void afs_probe_fileserver(struct afs_net *net, struct afs_server *server)</div><div class='ctx'> {</div><div class='ctx'> 	write_seqlock(&amp;net-&gt;fs_lock);</div><div class='ctx'> 	if (!list_empty(&amp;server-&gt;probe_link))</div><div class='del'>-		return afs_dispatch_fs_probe(net, server, true);</div><div class='add'>+		return afs_dispatch_fs_probe(net, server);</div><div class='ctx'> 	write_sequnlock(&amp;net-&gt;fs_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -366,12 +423,15 @@ void afs_fs_probe_dispatcher(struct work_struct *work)</div><div class='ctx'> 	unsigned long nowj, timer_at, poll_at;</div><div class='ctx'> 	bool first_pass = true, set_timer = false;</div><div class='ctx'> </div><div class='del'>-	if (!net-&gt;live)</div><div class='add'>+	if (!net-&gt;live) {</div><div class='add'>+		afs_dec_servers_outstanding(net);</div><div class='ctx'> 		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	_enter("");</div><div class='ctx'> </div><div class='ctx'> 	if (list_empty(&amp;net-&gt;fs_probe_fast) &amp;&amp; list_empty(&amp;net-&gt;fs_probe_slow)) {</div><div class='add'>+		afs_dec_servers_outstanding(net);</div><div class='ctx'> 		_leave(" [none]");</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -409,7 +469,7 @@ again:</div><div class='ctx'> 		_debug("probe %pU", &amp;server-&gt;uuid);</div><div class='ctx'> </div><div class='ctx'> 	if (server &amp;&amp; (first_pass || !need_resched())) {</div><div class='del'>-		afs_dispatch_fs_probe(net, server, server == fast);</div><div class='add'>+		afs_dispatch_fs_probe(net, server);</div><div class='ctx'> 		first_pass = false;</div><div class='ctx'> 		goto again;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -433,12 +493,13 @@ again:</div><div class='ctx'> /*</div><div class='ctx'>  * Wait for a probe on a particular fileserver to complete for 2s.</div><div class='ctx'>  */</div><div class='del'>-int afs_wait_for_one_fs_probe(struct afs_server *server, bool is_intr)</div><div class='add'>+int afs_wait_for_one_fs_probe(struct afs_server *server, struct afs_endpoint_state *estate,</div><div class='add'>+			      unsigned long exclude, bool is_intr)</div><div class='ctx'> {</div><div class='ctx'> 	struct wait_queue_entry wait;</div><div class='ctx'> 	unsigned long timo = 2 * HZ;</div><div class='ctx'> </div><div class='del'>-	if (atomic_read(&amp;server-&gt;probe_outstanding) == 0)</div><div class='add'>+	if (atomic_read(&amp;estate-&gt;nr_probing) == 0)</div><div class='ctx'> 		goto dont_wait;</div><div class='ctx'> </div><div class='ctx'> 	init_wait_entry(&amp;wait, 0);</div><div class='hunk'>@@ -446,8 +507,9 @@ int afs_wait_for_one_fs_probe(struct afs_server *server, bool is_intr)</div><div class='ctx'> 		prepare_to_wait_event(&amp;server-&gt;probe_wq, &amp;wait,</div><div class='ctx'> 				      is_intr ? TASK_INTERRUPTIBLE : TASK_UNINTERRUPTIBLE);</div><div class='ctx'> 		if (timo == 0 ||</div><div class='del'>-		    server-&gt;probe.responded ||</div><div class='del'>-		    atomic_read(&amp;server-&gt;probe_outstanding) == 0 ||</div><div class='add'>+		    test_bit(AFS_ESTATE_SUPERSEDED, &amp;estate-&gt;flags) ||</div><div class='add'>+		    (estate-&gt;responsive_set &amp; ~exclude) ||</div><div class='add'>+		    atomic_read(&amp;estate-&gt;nr_probing) == 0 ||</div><div class='ctx'> 		    (is_intr &amp;&amp; signal_pending(current)))</div><div class='ctx'> 			break;</div><div class='ctx'> 		timo = schedule_timeout(timo);</div><div class='hunk'>@@ -456,8 +518,10 @@ int afs_wait_for_one_fs_probe(struct afs_server *server, bool is_intr)</div><div class='ctx'> 	finish_wait(&amp;server-&gt;probe_wq, &amp;wait);</div><div class='ctx'> </div><div class='ctx'> dont_wait:</div><div class='del'>-	if (server-&gt;probe.responded)</div><div class='add'>+	if (test_bit(AFS_ESTATE_SUPERSEDED, &amp;estate-&gt;flags))</div><div class='ctx'> 		return 0;</div><div class='add'>+	if (estate-&gt;responsive_set &amp; ~exclude)</div><div class='add'>+		return 1;</div><div class='ctx'> 	if (is_intr &amp;&amp; signal_pending(current))</div><div class='ctx'> 		return -ERESTARTSYS;</div><div class='ctx'> 	if (timo == 0)</div><div class='hunk'>@@ -470,6 +534,6 @@ dont_wait:</div><div class='ctx'>  */</div><div class='ctx'> void afs_fs_probe_cleanup(struct afs_net *net)</div><div class='ctx'> {</div><div class='del'>-	if (del_timer_sync(&amp;net-&gt;fs_probe_timer))</div><div class='add'>+	if (timer_delete_sync(&amp;net-&gt;fs_probe_timer))</div><div class='ctx'> 		afs_dec_servers_outstanding(net);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/afs/fsclient.c b/fs/afs/fsclient.c<br/>index 4943413d9c5f..bc9556991d7c 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/fsclient.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/fsclient.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/fsclient.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/fsclient.c</a></div><div class='hunk'>@@ -131,7 +131,7 @@ bad:</div><div class='ctx'> </div><div class='ctx'> static time64_t xdr_decode_expiry(struct afs_call *call, u32 expiry)</div><div class='ctx'> {</div><div class='del'>-	return ktime_divns(call-&gt;reply_time, NSEC_PER_SEC) + expiry;</div><div class='add'>+	return ktime_divns(call-&gt;issue_time, NSEC_PER_SEC) + expiry;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void xdr_decode_AFSCallBack(const __be32 **_bp,</div><div class='hunk'>@@ -290,6 +290,7 @@ void afs_fs_fetch_status(struct afs_operation *op)</div><div class='ctx'> 	bp[2] = htonl(vp-&gt;fid.vnode);</div><div class='ctx'> 	bp[3] = htonl(vp-&gt;fid.unique);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call(call, &amp;vp-&gt;fid);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -300,18 +301,19 @@ void afs_fs_fetch_status(struct afs_operation *op)</div><div class='ctx'> static int afs_deliver_fs_fetch_data(struct afs_call *call)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_operation *op = call-&gt;op;</div><div class='add'>+	struct netfs_io_subrequest *subreq = op-&gt;fetch.subreq;</div><div class='ctx'> 	struct afs_vnode_param *vp = &amp;op-&gt;file[0];</div><div class='del'>-	struct afs_read *req = op-&gt;fetch.req;</div><div class='ctx'> 	const __be32 *bp;</div><div class='add'>+	size_t count_before;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	_enter("{%u,%zu,%zu/%llu}",</div><div class='ctx'> 	       call-&gt;unmarshall, call-&gt;iov_len, iov_iter_count(call-&gt;iter),</div><div class='del'>-	       req-&gt;actual_len);</div><div class='add'>+	       call-&gt;remaining);</div><div class='ctx'> </div><div class='ctx'> 	switch (call-&gt;unmarshall) {</div><div class='ctx'> 	case 0:</div><div class='del'>-		req-&gt;actual_len = 0;</div><div class='add'>+		call-&gt;remaining = 0;</div><div class='ctx'> 		call-&gt;unmarshall++;</div><div class='ctx'> 		if (call-&gt;operation_ID == FSFETCHDATA64) {</div><div class='ctx'> 			afs_extract_to_tmp64(call);</div><div class='hunk'>@@ -321,8 +323,8 @@ static int afs_deliver_fs_fetch_data(struct afs_call *call)</div><div class='ctx'> 		}</div><div class='ctx'> 		fallthrough;</div><div class='ctx'> </div><div class='del'>-		/* Extract the returned data length into</div><div class='del'>-		 * -&gt;actual_len.  This may indicate more or less data than was</div><div class='add'>+		/* Extract the returned data length into -&gt;remaining.</div><div class='add'>+		 * This may indicate more or less data than was</div><div class='ctx'> 		 * requested will be returned.</div><div class='ctx'> 		 */</div><div class='ctx'> 	case 1:</div><div class='hunk'>@@ -331,38 +333,40 @@ static int afs_deliver_fs_fetch_data(struct afs_call *call)</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			return ret;</div><div class='ctx'> </div><div class='del'>-		req-&gt;actual_len = be64_to_cpu(call-&gt;tmp64);</div><div class='del'>-		_debug("DATA length: %llu", req-&gt;actual_len);</div><div class='add'>+		call-&gt;remaining = be64_to_cpu(call-&gt;tmp64);</div><div class='add'>+		_debug("DATA length: %llu", call-&gt;remaining);</div><div class='ctx'> </div><div class='del'>-		if (req-&gt;actual_len == 0)</div><div class='add'>+		if (call-&gt;remaining == 0)</div><div class='ctx'> 			goto no_more_data;</div><div class='ctx'> </div><div class='del'>-		call-&gt;iter = req-&gt;iter;</div><div class='del'>-		call-&gt;iov_len = min(req-&gt;actual_len, req-&gt;len);</div><div class='add'>+		call-&gt;iter = &amp;subreq-&gt;io_iter;</div><div class='add'>+		call-&gt;iov_len = umin(call-&gt;remaining, subreq-&gt;len - subreq-&gt;transferred);</div><div class='ctx'> 		call-&gt;unmarshall++;</div><div class='ctx'> 		fallthrough;</div><div class='ctx'> </div><div class='ctx'> 		/* extract the returned data */</div><div class='ctx'> 	case 2:</div><div class='del'>-		_debug("extract data %zu/%llu",</div><div class='del'>-		       iov_iter_count(call-&gt;iter), req-&gt;actual_len);</div><div class='add'>+		count_before = call-&gt;iov_len;</div><div class='add'>+		_debug("extract data %zu/%llu", count_before, call-&gt;remaining);</div><div class='ctx'> </div><div class='ctx'> 		ret = afs_extract_data(call, true);</div><div class='add'>+		subreq-&gt;transferred += count_before - call-&gt;iov_len;</div><div class='add'>+		call-&gt;remaining -= count_before - call-&gt;iov_len;</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			return ret;</div><div class='ctx'> </div><div class='ctx'> 		call-&gt;iter = &amp;call-&gt;def_iter;</div><div class='del'>-		if (req-&gt;actual_len &lt;= req-&gt;len)</div><div class='add'>+		if (call-&gt;remaining)</div><div class='ctx'> 			goto no_more_data;</div><div class='ctx'> </div><div class='ctx'> 		/* Discard any excess data the server gave us */</div><div class='del'>-		afs_extract_discard(call, req-&gt;actual_len - req-&gt;len);</div><div class='add'>+		afs_extract_discard(call, call-&gt;remaining);</div><div class='ctx'> 		call-&gt;unmarshall = 3;</div><div class='ctx'> 		fallthrough;</div><div class='ctx'> </div><div class='ctx'> 	case 3:</div><div class='ctx'> 		_debug("extract discard %zu/%llu",</div><div class='del'>-		       iov_iter_count(call-&gt;iter), req-&gt;actual_len - req-&gt;len);</div><div class='add'>+		       iov_iter_count(call-&gt;iter), call-&gt;remaining);</div><div class='ctx'> </div><div class='ctx'> 		ret = afs_extract_data(call, true);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='hunk'>@@ -384,8 +388,8 @@ static int afs_deliver_fs_fetch_data(struct afs_call *call)</div><div class='ctx'> 		xdr_decode_AFSCallBack(&amp;bp, call, &amp;vp-&gt;scb);</div><div class='ctx'> 		xdr_decode_AFSVolSync(&amp;bp, &amp;op-&gt;volsync);</div><div class='ctx'> </div><div class='del'>-		req-&gt;data_version = vp-&gt;scb.status.data_version;</div><div class='del'>-		req-&gt;file_size = vp-&gt;scb.status.size;</div><div class='add'>+		if (subreq-&gt;start + subreq-&gt;transferred &gt;= vp-&gt;scb.status.size)</div><div class='add'>+			__set_bit(NETFS_SREQ_HIT_EOF, &amp;subreq-&gt;flags);</div><div class='ctx'> </div><div class='ctx'> 		call-&gt;unmarshall++;</div><div class='ctx'> 		fallthrough;</div><div class='hunk'>@@ -404,14 +408,18 @@ static int afs_deliver_fs_fetch_data(struct afs_call *call)</div><div class='ctx'> static const struct afs_call_type afs_RXFSFetchData = {</div><div class='ctx'> 	.name		= "FS.FetchData",</div><div class='ctx'> 	.op		= afs_FS_FetchData,</div><div class='add'>+	.async_rx	= afs_fetch_data_async_rx,</div><div class='ctx'> 	.deliver	= afs_deliver_fs_fetch_data,</div><div class='add'>+	.immediate_cancel = afs_fetch_data_immediate_cancel,</div><div class='ctx'> 	.destructor	= afs_flat_call_destructor,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct afs_call_type afs_RXFSFetchData64 = {</div><div class='ctx'> 	.name		= "FS.FetchData64",</div><div class='ctx'> 	.op		= afs_FS_FetchData64,</div><div class='add'>+	.async_rx	= afs_fetch_data_async_rx,</div><div class='ctx'> 	.deliver	= afs_deliver_fs_fetch_data,</div><div class='add'>+	.immediate_cancel = afs_fetch_data_immediate_cancel,</div><div class='ctx'> 	.destructor	= afs_flat_call_destructor,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -420,8 +428,8 @@ static const struct afs_call_type afs_RXFSFetchData64 = {</div><div class='ctx'>  */</div><div class='ctx'> static void afs_fs_fetch_data64(struct afs_operation *op)</div><div class='ctx'> {</div><div class='add'>+	struct netfs_io_subrequest *subreq = op-&gt;fetch.subreq;</div><div class='ctx'> 	struct afs_vnode_param *vp = &amp;op-&gt;file[0];</div><div class='del'>-	struct afs_read *req = op-&gt;fetch.req;</div><div class='ctx'> 	struct afs_call *call;</div><div class='ctx'> 	__be32 *bp;</div><div class='ctx'> </div><div class='hunk'>@@ -431,17 +439,21 @@ static void afs_fs_fetch_data64(struct afs_operation *op)</div><div class='ctx'> 	if (!call)</div><div class='ctx'> 		return afs_op_nomem(op);</div><div class='ctx'> </div><div class='add'>+	if (op-&gt;flags &amp; AFS_OPERATION_ASYNC)</div><div class='add'>+		call-&gt;async = true;</div><div class='add'>+</div><div class='ctx'> 	/* marshall the parameters */</div><div class='ctx'> 	bp = call-&gt;request;</div><div class='ctx'> 	bp[0] = htonl(FSFETCHDATA64);</div><div class='ctx'> 	bp[1] = htonl(vp-&gt;fid.vid);</div><div class='ctx'> 	bp[2] = htonl(vp-&gt;fid.vnode);</div><div class='ctx'> 	bp[3] = htonl(vp-&gt;fid.unique);</div><div class='del'>-	bp[4] = htonl(upper_32_bits(req-&gt;pos));</div><div class='del'>-	bp[5] = htonl(lower_32_bits(req-&gt;pos));</div><div class='add'>+	bp[4] = htonl(upper_32_bits(subreq-&gt;start + subreq-&gt;transferred));</div><div class='add'>+	bp[5] = htonl(lower_32_bits(subreq-&gt;start + subreq-&gt;transferred));</div><div class='ctx'> 	bp[6] = 0;</div><div class='del'>-	bp[7] = htonl(lower_32_bits(req-&gt;len));</div><div class='add'>+	bp[7] = htonl(lower_32_bits(subreq-&gt;len   - subreq-&gt;transferred));</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call(call, &amp;vp-&gt;fid);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -451,9 +463,9 @@ static void afs_fs_fetch_data64(struct afs_operation *op)</div><div class='ctx'>  */</div><div class='ctx'> void afs_fs_fetch_data(struct afs_operation *op)</div><div class='ctx'> {</div><div class='add'>+	struct netfs_io_subrequest *subreq = op-&gt;fetch.subreq;</div><div class='ctx'> 	struct afs_vnode_param *vp = &amp;op-&gt;file[0];</div><div class='ctx'> 	struct afs_call *call;</div><div class='del'>-	struct afs_read *req = op-&gt;fetch.req;</div><div class='ctx'> 	__be32 *bp;</div><div class='ctx'> </div><div class='ctx'> 	if (test_bit(AFS_SERVER_FL_HAS_FS64, &amp;op-&gt;server-&gt;flags))</div><div class='hunk'>@@ -465,17 +477,16 @@ void afs_fs_fetch_data(struct afs_operation *op)</div><div class='ctx'> 	if (!call)</div><div class='ctx'> 		return afs_op_nomem(op);</div><div class='ctx'> </div><div class='del'>-	req-&gt;call_debug_id = call-&gt;debug_id;</div><div class='del'>-</div><div class='ctx'> 	/* marshall the parameters */</div><div class='ctx'> 	bp = call-&gt;request;</div><div class='ctx'> 	bp[0] = htonl(FSFETCHDATA);</div><div class='ctx'> 	bp[1] = htonl(vp-&gt;fid.vid);</div><div class='ctx'> 	bp[2] = htonl(vp-&gt;fid.vnode);</div><div class='ctx'> 	bp[3] = htonl(vp-&gt;fid.unique);</div><div class='del'>-	bp[4] = htonl(lower_32_bits(req-&gt;pos));</div><div class='del'>-	bp[5] = htonl(lower_32_bits(req-&gt;len));</div><div class='add'>+	bp[4] = htonl(lower_32_bits(subreq-&gt;start + subreq-&gt;transferred));</div><div class='add'>+	bp[5] = htonl(lower_32_bits(subreq-&gt;len   + subreq-&gt;transferred));</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call(call, &amp;vp-&gt;fid);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -559,6 +570,7 @@ void afs_fs_create_file(struct afs_operation *op)</div><div class='ctx'> 	*bp++ = htonl(op-&gt;create.mode &amp; S_IALLUGO); /* unix mode */</div><div class='ctx'> 	*bp++ = 0; /* segment size */</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = dvp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call1(call, &amp;dvp-&gt;fid, name);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -612,6 +624,7 @@ void afs_fs_make_dir(struct afs_operation *op)</div><div class='ctx'> 	*bp++ = htonl(op-&gt;create.mode &amp; S_IALLUGO); /* unix mode */</div><div class='ctx'> 	*bp++ = 0; /* segment size */</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = dvp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call1(call, &amp;dvp-&gt;fid, name);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -685,6 +698,7 @@ void afs_fs_remove_file(struct afs_operation *op)</div><div class='ctx'> 		bp = (void *) bp + padsz;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = dvp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call1(call, &amp;dvp-&gt;fid, name);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -732,6 +746,7 @@ void afs_fs_remove_dir(struct afs_operation *op)</div><div class='ctx'> 		bp = (void *) bp + padsz;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = dvp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call1(call, &amp;dvp-&gt;fid, name);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -812,6 +827,7 @@ void afs_fs_link(struct afs_operation *op)</div><div class='ctx'> 	*bp++ = htonl(vp-&gt;fid.vnode);</div><div class='ctx'> 	*bp++ = htonl(vp-&gt;fid.unique);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call1(call, &amp;vp-&gt;fid, name);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -907,6 +923,7 @@ void afs_fs_symlink(struct afs_operation *op)</div><div class='ctx'> 	*bp++ = htonl(S_IRWXUGO); /* unix mode */</div><div class='ctx'> 	*bp++ = 0; /* segment size */</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = dvp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call1(call, &amp;dvp-&gt;fid, name);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -1003,6 +1020,7 @@ void afs_fs_rename(struct afs_operation *op)</div><div class='ctx'> 		bp = (void *) bp + n_padsz;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = orig_dvp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call2(call, &amp;orig_dvp-&gt;fid, orig_name, new_name);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -1090,6 +1108,7 @@ static void afs_fs_store_data64(struct afs_operation *op)</div><div class='ctx'> 	*bp++ = htonl(upper_32_bits(op-&gt;store.i_size));</div><div class='ctx'> 	*bp++ = htonl(lower_32_bits(op-&gt;store.i_size));</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call(call, &amp;vp-&gt;fid);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -1140,6 +1159,7 @@ void afs_fs_store_data(struct afs_operation *op)</div><div class='ctx'> 	*bp++ = htonl(lower_32_bits(op-&gt;store.size));</div><div class='ctx'> 	*bp++ = htonl(lower_32_bits(op-&gt;store.i_size));</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call(call, &amp;vp-&gt;fid);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -1206,6 +1226,7 @@ static void afs_fs_setattr_size64(struct afs_operation *op)</div><div class='ctx'> 	*bp++ = htonl(upper_32_bits(attr-&gt;ia_size));	/* new file length */</div><div class='ctx'> 	*bp++ = htonl(lower_32_bits(attr-&gt;ia_size));</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call(call, &amp;vp-&gt;fid);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -1247,6 +1268,7 @@ static void afs_fs_setattr_size(struct afs_operation *op)</div><div class='ctx'> 	*bp++ = 0;				/* size of write */</div><div class='ctx'> 	*bp++ = htonl(attr-&gt;ia_size);		/* new file length */</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call(call, &amp;vp-&gt;fid);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -1283,6 +1305,7 @@ void afs_fs_setattr(struct afs_operation *op)</div><div class='ctx'> </div><div class='ctx'> 	xdr_encode_AFS_StoreStatus(&amp;bp, op-&gt;setattr.attr);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call(call, &amp;vp-&gt;fid);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -1446,6 +1469,7 @@ void afs_fs_get_volume_status(struct afs_operation *op)</div><div class='ctx'> 	bp[0] = htonl(FSGETVOLUMESTATUS);</div><div class='ctx'> 	bp[1] = htonl(vp-&gt;fid.vid);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call(call, &amp;vp-&gt;fid);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -1528,6 +1552,7 @@ void afs_fs_set_lock(struct afs_operation *op)</div><div class='ctx'> 	*bp++ = htonl(vp-&gt;fid.unique);</div><div class='ctx'> 	*bp++ = htonl(op-&gt;lock.type);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_calli(call, &amp;vp-&gt;fid, op-&gt;lock.type);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -1554,6 +1579,7 @@ void afs_fs_extend_lock(struct afs_operation *op)</div><div class='ctx'> 	*bp++ = htonl(vp-&gt;fid.vnode);</div><div class='ctx'> 	*bp++ = htonl(vp-&gt;fid.unique);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call(call, &amp;vp-&gt;fid);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -1580,6 +1606,7 @@ void afs_fs_release_lock(struct afs_operation *op)</div><div class='ctx'> 	*bp++ = htonl(vp-&gt;fid.vnode);</div><div class='ctx'> 	*bp++ = htonl(vp-&gt;fid.unique);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call(call, &amp;vp-&gt;fid);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -1605,13 +1632,12 @@ static const struct afs_call_type afs_RXFSGiveUpAllCallBacks = {</div><div class='ctx'> /*</div><div class='ctx'>  * Flush all the callbacks we have on a server.</div><div class='ctx'>  */</div><div class='del'>-int afs_fs_give_up_all_callbacks(struct afs_net *net,</div><div class='del'>-				 struct afs_server *server,</div><div class='del'>-				 struct afs_addr_cursor *ac,</div><div class='del'>-				 struct key *key)</div><div class='add'>+int afs_fs_give_up_all_callbacks(struct afs_net *net, struct afs_server *server,</div><div class='add'>+				 struct afs_address *addr, struct key *key)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_call *call;</div><div class='ctx'> 	__be32 *bp;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	_enter("");</div><div class='ctx'> </div><div class='hunk'>@@ -1619,15 +1645,22 @@ int afs_fs_give_up_all_callbacks(struct afs_net *net,</div><div class='ctx'> 	if (!call)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	call-&gt;key = key;</div><div class='add'>+	call-&gt;key	= key;</div><div class='add'>+	call-&gt;peer	= rxrpc_kernel_get_peer(addr-&gt;peer);</div><div class='add'>+	call-&gt;service_id = server-&gt;service_id;</div><div class='ctx'> </div><div class='ctx'> 	/* marshall the parameters */</div><div class='ctx'> 	bp = call-&gt;request;</div><div class='ctx'> 	*bp++ = htonl(FSGIVEUPALLCALLBACKS);</div><div class='ctx'> </div><div class='del'>-	call-&gt;server = afs_use_server(server, afs_server_trace_give_up_cb);</div><div class='del'>-	afs_make_call(ac, call, GFP_NOFS);</div><div class='del'>-	return afs_wait_for_call_to_complete(call, ac);</div><div class='add'>+	call-&gt;server = afs_use_server(server, false, afs_server_trace_use_give_up_cb);</div><div class='add'>+	afs_make_call(call, GFP_NOFS);</div><div class='add'>+	afs_wait_for_call_to_complete(call);</div><div class='add'>+	ret = call-&gt;error;</div><div class='add'>+	if (call-&gt;responded)</div><div class='add'>+		set_bit(AFS_SERVER_FL_RESPONDING, &amp;server-&gt;flags);</div><div class='add'>+	afs_put_call(call);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1689,6 +1722,12 @@ static int afs_deliver_fs_get_capabilities(struct afs_call *call)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void afs_fs_get_capabilities_destructor(struct afs_call *call)</div><div class='add'>+{</div><div class='add'>+	afs_put_endpoint_state(call-&gt;probe, afs_estate_trace_put_getcaps);</div><div class='add'>+	afs_flat_call_destructor(call);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * FS.GetCapabilities operation type</div><div class='ctx'>  */</div><div class='hunk'>@@ -1697,7 +1736,8 @@ static const struct afs_call_type afs_RXFSGetCapabilities = {</div><div class='ctx'> 	.op		= afs_FS_GetCapabilities,</div><div class='ctx'> 	.deliver	= afs_deliver_fs_get_capabilities,</div><div class='ctx'> 	.done		= afs_fileserver_probe_result,</div><div class='del'>-	.destructor	= afs_flat_call_destructor,</div><div class='add'>+	.immediate_cancel = afs_fileserver_probe_result,</div><div class='add'>+	.destructor	= afs_fs_get_capabilities_destructor,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1707,7 +1747,8 @@ static const struct afs_call_type afs_RXFSGetCapabilities = {</div><div class='ctx'>  * -&gt;done() - otherwise we return false to indicate we didn't even try.</div><div class='ctx'>  */</div><div class='ctx'> bool afs_fs_get_capabilities(struct afs_net *net, struct afs_server *server,</div><div class='del'>-			     struct afs_addr_cursor *ac, struct key *key)</div><div class='add'>+			     struct afs_endpoint_state *estate, unsigned int addr_index,</div><div class='add'>+			     struct key *key)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_call *call;</div><div class='ctx'> 	__be32 *bp;</div><div class='hunk'>@@ -1718,10 +1759,14 @@ bool afs_fs_get_capabilities(struct afs_net *net, struct afs_server *server,</div><div class='ctx'> 	if (!call)</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	call-&gt;key = key;</div><div class='del'>-	call-&gt;server = afs_use_server(server, afs_server_trace_get_caps);</div><div class='del'>-	call-&gt;upgrade = true;</div><div class='del'>-	call-&gt;async = true;</div><div class='add'>+	call-&gt;key	= key;</div><div class='add'>+	call-&gt;server	= afs_use_server(server, false, afs_server_trace_use_get_caps);</div><div class='add'>+	call-&gt;peer	= rxrpc_kernel_get_peer(estate-&gt;addresses-&gt;addrs[addr_index].peer);</div><div class='add'>+	call-&gt;probe	= afs_get_endpoint_state(estate, afs_estate_trace_get_getcaps);</div><div class='add'>+	call-&gt;probe_index = addr_index;</div><div class='add'>+	call-&gt;service_id = server-&gt;service_id;</div><div class='add'>+	call-&gt;upgrade	= true;</div><div class='add'>+	call-&gt;async	= true;</div><div class='ctx'> 	call-&gt;max_lifespan = AFS_PROBE_MAX_LIFESPAN;</div><div class='ctx'> </div><div class='ctx'> 	/* marshall the parameters */</div><div class='hunk'>@@ -1729,7 +1774,7 @@ bool afs_fs_get_capabilities(struct afs_net *net, struct afs_server *server,</div><div class='ctx'> 	*bp++ = htonl(FSGETCAPABILITIES);</div><div class='ctx'> </div><div class='ctx'> 	trace_afs_make_fs_call(call, NULL);</div><div class='del'>-	afs_make_call(ac, call, GFP_NOFS);</div><div class='add'>+	afs_make_call(call, GFP_NOFS);</div><div class='ctx'> 	afs_put_call(call);</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='hunk'>@@ -1853,7 +1898,10 @@ static int afs_deliver_fs_inline_bulk_status(struct afs_call *call)</div><div class='ctx'> 			return ret;</div><div class='ctx'> </div><div class='ctx'> 		bp = call-&gt;buffer;</div><div class='del'>-		xdr_decode_AFSVolSync(&amp;bp, &amp;op-&gt;volsync);</div><div class='add'>+		/* Unfortunately, prior to OpenAFS-1.6, volsync here is filled</div><div class='add'>+		 * with rubbish.</div><div class='add'>+		 */</div><div class='add'>+		xdr_decode_AFSVolSync(&amp;bp, NULL);</div><div class='ctx'> </div><div class='ctx'> 		call-&gt;unmarshall++;</div><div class='ctx'> 		fallthrough;</div><div class='hunk'>@@ -1899,7 +1947,7 @@ void afs_fs_inline_bulk_status(struct afs_operation *op)</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='ctx'> 	if (test_bit(AFS_SERVER_FL_NO_IBULK, &amp;op-&gt;server-&gt;flags)) {</div><div class='del'>-		op-&gt;error = -ENOTSUPP;</div><div class='add'>+		afs_op_set_error(op, -ENOTSUPP);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1928,6 +1976,7 @@ void afs_fs_inline_bulk_status(struct afs_operation *op)</div><div class='ctx'> 		*bp++ = htonl(op-&gt;more_files[i].fid.unique);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call(call, &amp;vp-&gt;fid);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -2033,6 +2082,7 @@ void afs_fs_fetch_acl(struct afs_operation *op)</div><div class='ctx'> 	bp[2] = htonl(vp-&gt;fid.vnode);</div><div class='ctx'> 	bp[3] = htonl(vp-&gt;fid.unique);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call(call, &amp;vp-&gt;fid);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_KERNEL);</div><div class='ctx'> }</div><div class='hunk'>@@ -2078,6 +2128,7 @@ void afs_fs_store_acl(struct afs_operation *op)</div><div class='ctx'> 	if (acl-&gt;size != size)</div><div class='ctx'> 		memset((void *)&amp;bp[5] + acl-&gt;size, 0, size - acl-&gt;size);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call(call, &amp;vp-&gt;fid);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_KERNEL);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/afs/inode.c b/fs/afs/inode.c<br/>index 16906eb592d9..dde1857fcabb 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/inode.c</a></div><div class='hunk'>@@ -25,8 +25,94 @@</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> #include "afs_fs.h"</div><div class='ctx'> </div><div class='add'>+void afs_init_new_symlink(struct afs_vnode *vnode, struct afs_operation *op)</div><div class='add'>+{</div><div class='add'>+	size_t size = strlen(op-&gt;create.symlink) + 1;</div><div class='add'>+	size_t dsize = 0;</div><div class='add'>+	char *p;</div><div class='add'>+</div><div class='add'>+	if (netfs_alloc_folioq_buffer(NULL, &amp;vnode-&gt;directory, &amp;dsize, size,</div><div class='add'>+				      mapping_gfp_mask(vnode-&gt;netfs.inode.i_mapping)) &lt; 0)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	vnode-&gt;directory_size = dsize;</div><div class='add'>+	p = kmap_local_folio(folioq_folio(vnode-&gt;directory, 0), 0);</div><div class='add'>+	memcpy(p, op-&gt;create.symlink, size);</div><div class='add'>+	kunmap_local(p);</div><div class='add'>+	set_bit(AFS_VNODE_DIR_READ, &amp;vnode-&gt;flags);</div><div class='add'>+	netfs_single_mark_inode_dirty(&amp;vnode-&gt;netfs.inode);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void afs_put_link(void *arg)</div><div class='add'>+{</div><div class='add'>+	struct folio *folio = virt_to_folio(arg);</div><div class='add'>+</div><div class='add'>+	kunmap_local(arg);</div><div class='add'>+	folio_put(folio);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+const char *afs_get_link(struct dentry *dentry, struct inode *inode,</div><div class='add'>+			 struct delayed_call *callback)</div><div class='add'>+{</div><div class='add'>+	struct afs_vnode *vnode = AFS_FS_I(inode);</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	char *content;</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	if (!dentry) {</div><div class='add'>+		/* RCU pathwalk. */</div><div class='add'>+		if (!test_bit(AFS_VNODE_DIR_READ, &amp;vnode-&gt;flags) || !afs_check_validity(vnode))</div><div class='add'>+			return ERR_PTR(-ECHILD);</div><div class='add'>+		goto good;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (test_bit(AFS_VNODE_DIR_READ, &amp;vnode-&gt;flags))</div><div class='add'>+		goto fetch;</div><div class='add'>+</div><div class='add'>+	ret = afs_validate(vnode, NULL);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ERR_PTR(ret);</div><div class='add'>+</div><div class='add'>+	if (!test_and_clear_bit(AFS_VNODE_ZAP_DATA, &amp;vnode-&gt;flags) &amp;&amp;</div><div class='add'>+	    test_bit(AFS_VNODE_DIR_READ, &amp;vnode-&gt;flags))</div><div class='add'>+		goto good;</div><div class='add'>+</div><div class='add'>+fetch:</div><div class='add'>+	ret = afs_read_single(vnode, NULL);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ERR_PTR(ret);</div><div class='add'>+	set_bit(AFS_VNODE_DIR_READ, &amp;vnode-&gt;flags);</div><div class='add'>+</div><div class='add'>+good:</div><div class='add'>+	folio = folioq_folio(vnode-&gt;directory, 0);</div><div class='add'>+	folio_get(folio);</div><div class='add'>+	content = kmap_local_folio(folio, 0);</div><div class='add'>+	set_delayed_call(callback, afs_put_link, content);</div><div class='add'>+	return content;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int afs_readlink(struct dentry *dentry, char __user *buffer, int buflen)</div><div class='add'>+{</div><div class='add'>+	DEFINE_DELAYED_CALL(done);</div><div class='add'>+	const char *content;</div><div class='add'>+	int len;</div><div class='add'>+</div><div class='add'>+	content = afs_get_link(dentry, d_inode(dentry), &amp;done);</div><div class='add'>+	if (IS_ERR(content)) {</div><div class='add'>+		do_delayed_call(&amp;done);</div><div class='add'>+		return PTR_ERR(content);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	len = umin(strlen(content), buflen);</div><div class='add'>+	if (copy_to_user(buffer, content, len))</div><div class='add'>+		len = -EFAULT;</div><div class='add'>+	do_delayed_call(&amp;done);</div><div class='add'>+	return len;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static const struct inode_operations afs_symlink_inode_operations = {</div><div class='del'>-	.get_link	= page_get_link,</div><div class='add'>+	.get_link	= afs_get_link,</div><div class='add'>+	.readlink	= afs_readlink,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static noinline void dump_vnode(struct afs_vnode *vnode, struct afs_vnode *parent_vnode)</div><div class='hunk'>@@ -54,6 +140,14 @@ static noinline void dump_vnode(struct afs_vnode *vnode, struct afs_vnode *paren</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * Set parameters for the netfs library</div><div class='add'>+ */</div><div class='add'>+static void afs_set_netfs_context(struct afs_vnode *vnode)</div><div class='add'>+{</div><div class='add'>+	netfs_inode_init(&amp;vnode-&gt;netfs, &amp;afs_req_ops, true);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * Initialise an inode from the vnode status.</div><div class='ctx'>  */</div><div class='ctx'> static int afs_inode_init_from_status(struct afs_operation *op,</div><div class='hunk'>@@ -77,18 +171,17 @@ static int afs_inode_init_from_status(struct afs_operation *op,</div><div class='ctx'> </div><div class='ctx'> 	write_seqlock(&amp;vnode-&gt;cb_lock);</div><div class='ctx'> </div><div class='del'>-	vnode-&gt;cb_v_break = op-&gt;cb_v_break;</div><div class='del'>-	vnode-&gt;cb_s_break = op-&gt;cb_s_break;</div><div class='add'>+	vnode-&gt;cb_v_check = op-&gt;cb_v_break;</div><div class='ctx'> 	vnode-&gt;status = *status;</div><div class='ctx'> </div><div class='ctx'> 	t = status-&gt;mtime_client;</div><div class='del'>-	inode-&gt;i_ctime = t;</div><div class='del'>-	inode-&gt;i_mtime = t;</div><div class='del'>-	inode-&gt;i_atime = t;</div><div class='add'>+	inode_set_ctime_to_ts(inode, t);</div><div class='add'>+	inode_set_mtime_to_ts(inode, t);</div><div class='add'>+	inode_set_atime_to_ts(inode, t);</div><div class='ctx'> 	inode-&gt;i_flags |= S_NOATIME;</div><div class='ctx'> 	inode-&gt;i_uid = make_kuid(&amp;init_user_ns, status-&gt;owner);</div><div class='ctx'> 	inode-&gt;i_gid = make_kgid(&amp;init_user_ns, status-&gt;group);</div><div class='del'>-	set_nlink(&amp;vnode-&gt;vfs_inode, status-&gt;nlink);</div><div class='add'>+	set_nlink(&amp;vnode-&gt;netfs.inode, status-&gt;nlink);</div><div class='ctx'> </div><div class='ctx'> 	switch (status-&gt;type) {</div><div class='ctx'> 	case AFS_FTYPE_FILE:</div><div class='hunk'>@@ -96,12 +189,16 @@ static int afs_inode_init_from_status(struct afs_operation *op,</div><div class='ctx'> 		inode-&gt;i_op	= &amp;afs_file_inode_operations;</div><div class='ctx'> 		inode-&gt;i_fop	= &amp;afs_file_operations;</div><div class='ctx'> 		inode-&gt;i_mapping-&gt;a_ops	= &amp;afs_file_aops;</div><div class='add'>+		mapping_set_large_folios(inode-&gt;i_mapping);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case AFS_FTYPE_DIR:</div><div class='ctx'> 		inode-&gt;i_mode	= S_IFDIR |  (status-&gt;mode &amp; S_IALLUGO);</div><div class='ctx'> 		inode-&gt;i_op	= &amp;afs_dir_inode_operations;</div><div class='ctx'> 		inode-&gt;i_fop	= &amp;afs_dir_file_operations;</div><div class='ctx'> 		inode-&gt;i_mapping-&gt;a_ops	= &amp;afs_dir_aops;</div><div class='add'>+		__set_bit(NETFS_ICTX_SINGLE_NO_UPLOAD, &amp;vnode-&gt;netfs.flags);</div><div class='add'>+		/* Assume locally cached directory data will be valid. */</div><div class='add'>+		__set_bit(AFS_VNODE_DIR_VALID, &amp;vnode-&gt;flags);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case AFS_FTYPE_SYMLINK:</div><div class='ctx'> 		/* Symlinks with a mode of 0644 are actually mountpoints. */</div><div class='hunk'>@@ -113,13 +210,13 @@ static int afs_inode_init_from_status(struct afs_operation *op,</div><div class='ctx'> 			inode-&gt;i_mode	= S_IFDIR | 0555;</div><div class='ctx'> 			inode-&gt;i_op	= &amp;afs_mntpt_inode_operations;</div><div class='ctx'> 			inode-&gt;i_fop	= &amp;afs_mntpt_file_operations;</div><div class='del'>-			inode-&gt;i_mapping-&gt;a_ops	= &amp;afs_symlink_aops;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			inode-&gt;i_mode	= S_IFLNK | status-&gt;mode;</div><div class='ctx'> 			inode-&gt;i_op	= &amp;afs_symlink_inode_operations;</div><div class='del'>-			inode-&gt;i_mapping-&gt;a_ops	= &amp;afs_symlink_aops;</div><div class='ctx'> 		}</div><div class='add'>+		inode-&gt;i_mapping-&gt;a_ops	= &amp;afs_dir_aops;</div><div class='ctx'> 		inode_nohighmem(inode);</div><div class='add'>+		mapping_set_release_always(inode-&gt;i_mapping);</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		dump_vnode(vnode, op-&gt;file[0].vnode != vnode ? op-&gt;file[0].vnode : NULL);</div><div class='hunk'>@@ -128,18 +225,20 @@ static int afs_inode_init_from_status(struct afs_operation *op,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	afs_set_i_size(vnode, status-&gt;size);</div><div class='add'>+	afs_set_netfs_context(vnode);</div><div class='ctx'> </div><div class='ctx'> 	vnode-&gt;invalid_before	= status-&gt;data_version;</div><div class='del'>-	inode_set_iversion_raw(&amp;vnode-&gt;vfs_inode, status-&gt;data_version);</div><div class='add'>+	trace_afs_set_dv(vnode, status-&gt;data_version);</div><div class='add'>+	inode_set_iversion_raw(&amp;vnode-&gt;netfs.inode, status-&gt;data_version);</div><div class='ctx'> </div><div class='ctx'> 	if (!vp-&gt;scb.have_cb) {</div><div class='ctx'> 		/* it's a symlink we just created (the fileserver</div><div class='ctx'> 		 * didn't give us a callback) */</div><div class='del'>-		vnode-&gt;cb_expires_at = ktime_get_real_seconds();</div><div class='add'>+		afs_clear_cb_promise(vnode, afs_cb_promise_set_new_symlink);</div><div class='ctx'> 	} else {</div><div class='del'>-		vnode-&gt;cb_expires_at = vp-&gt;scb.callback.expires_at;</div><div class='ctx'> 		vnode-&gt;cb_server = op-&gt;server;</div><div class='del'>-		set_bit(AFS_VNODE_CB_PROMISED, &amp;vnode-&gt;flags);</div><div class='add'>+		afs_set_cb_promise(vnode, vp-&gt;scb.callback.expires_at,</div><div class='add'>+				   afs_cb_promise_set_new_inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	write_sequnlock(&amp;vnode-&gt;cb_lock);</div><div class='hunk'>@@ -154,9 +253,10 @@ static void afs_apply_status(struct afs_operation *op,</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_file_status *status = &amp;vp-&gt;scb.status;</div><div class='ctx'> 	struct afs_vnode *vnode = vp-&gt;vnode;</div><div class='del'>-	struct inode *inode = &amp;vnode-&gt;vfs_inode;</div><div class='add'>+	struct inode *inode = &amp;vnode-&gt;netfs.inode;</div><div class='ctx'> 	struct timespec64 t;</div><div class='ctx'> 	umode_t mode;</div><div class='add'>+	bool unexpected_jump = false;</div><div class='ctx'> 	bool data_changed = false;</div><div class='ctx'> 	bool change_size = vp-&gt;set_size;</div><div class='ctx'> </div><div class='hunk'>@@ -193,17 +293,23 @@ static void afs_apply_status(struct afs_operation *op,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	t = status-&gt;mtime_client;</div><div class='del'>-	inode-&gt;i_mtime = t;</div><div class='add'>+	inode_set_mtime_to_ts(inode, t);</div><div class='ctx'> 	if (vp-&gt;update_ctime)</div><div class='del'>-		inode-&gt;i_ctime = op-&gt;ctime;</div><div class='add'>+		inode_set_ctime_to_ts(inode, op-&gt;ctime);</div><div class='ctx'> </div><div class='del'>-	if (vnode-&gt;status.data_version != status-&gt;data_version)</div><div class='add'>+	if (vnode-&gt;status.data_version != status-&gt;data_version) {</div><div class='add'>+		trace_afs_set_dv(vnode, status-&gt;data_version);</div><div class='ctx'> 		data_changed = true;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	vnode-&gt;status = *status;</div><div class='ctx'> </div><div class='ctx'> 	if (vp-&gt;dv_before + vp-&gt;dv_delta != status-&gt;data_version) {</div><div class='del'>-		if (test_bit(AFS_VNODE_CB_PROMISED, &amp;vnode-&gt;flags))</div><div class='add'>+		trace_afs_dv_mismatch(vnode, vp-&gt;dv_before, vp-&gt;dv_delta,</div><div class='add'>+				      status-&gt;data_version);</div><div class='add'>+</div><div class='add'>+		if (vnode-&gt;cb_ro_snapshot == atomic_read(&amp;vnode-&gt;volume-&gt;cb_ro_snapshot) &amp;&amp;</div><div class='add'>+		    atomic64_read(&amp;vnode-&gt;cb_expires_at) != AFS_NO_CB_PROMISE)</div><div class='ctx'> 			pr_warn("kAFS: vnode modified {%llx:%llu} %llx-&gt;%llx %s (op=%x)\n",</div><div class='ctx'> 				vnode-&gt;fid.vid, vnode-&gt;fid.vnode,</div><div class='ctx'> 				(unsigned long long)vp-&gt;dv_before + vp-&gt;dv_delta,</div><div class='hunk'>@@ -212,13 +318,13 @@ static void afs_apply_status(struct afs_operation *op,</div><div class='ctx'> 				op-&gt;debug_id);</div><div class='ctx'> </div><div class='ctx'> 		vnode-&gt;invalid_before = status-&gt;data_version;</div><div class='del'>-		if (vnode-&gt;status.type == AFS_FTYPE_DIR) {</div><div class='del'>-			if (test_and_clear_bit(AFS_VNODE_DIR_VALID, &amp;vnode-&gt;flags))</div><div class='del'>-				afs_stat_v(vnode, n_inval);</div><div class='del'>-		} else {</div><div class='add'>+		if (vnode-&gt;status.type == AFS_FTYPE_DIR)</div><div class='add'>+			afs_invalidate_dir(vnode, afs_dir_invalid_dv_mismatch);</div><div class='add'>+		else</div><div class='ctx'> 			set_bit(AFS_VNODE_ZAP_DATA, &amp;vnode-&gt;flags);</div><div class='del'>-		}</div><div class='ctx'> 		change_size = true;</div><div class='add'>+		data_changed = true;</div><div class='add'>+		unexpected_jump = true;</div><div class='ctx'> 	} else if (vnode-&gt;status.type == AFS_FTYPE_DIR) {</div><div class='ctx'> 		/* Expected directory change is handled elsewhere so</div><div class='ctx'> 		 * that we can locally edit the directory and save on a</div><div class='hunk'>@@ -237,11 +343,16 @@ static void afs_apply_status(struct afs_operation *op,</div><div class='ctx'> 		 * idea of what the size should be that's not the same as</div><div class='ctx'> 		 * what's on the server.</div><div class='ctx'> 		 */</div><div class='del'>-		if (change_size) {</div><div class='add'>+		vnode-&gt;netfs.remote_i_size = status-&gt;size;</div><div class='add'>+		if (change_size || status-&gt;size &gt; i_size_read(inode)) {</div><div class='ctx'> 			afs_set_i_size(vnode, status-&gt;size);</div><div class='del'>-			inode-&gt;i_ctime = t;</div><div class='del'>-			inode-&gt;i_atime = t;</div><div class='add'>+			if (unexpected_jump)</div><div class='add'>+				vnode-&gt;netfs.zero_point = status-&gt;size;</div><div class='add'>+			inode_set_ctime_to_ts(inode, t);</div><div class='add'>+			inode_set_atime_to_ts(inode, t);</div><div class='ctx'> 		}</div><div class='add'>+		if (op-&gt;ops == &amp;afs_fetch_data_operation)</div><div class='add'>+			op-&gt;fetch.subreq-&gt;rreq-&gt;i_size = status-&gt;size;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -255,9 +366,9 @@ static void afs_apply_callback(struct afs_operation *op,</div><div class='ctx'> 	struct afs_vnode *vnode = vp-&gt;vnode;</div><div class='ctx'> </div><div class='ctx'> 	if (!afs_cb_is_broken(vp-&gt;cb_break_before, vnode)) {</div><div class='del'>-		vnode-&gt;cb_expires_at	= cb-&gt;expires_at;</div><div class='del'>-		vnode-&gt;cb_server	= op-&gt;server;</div><div class='del'>-		set_bit(AFS_VNODE_CB_PROMISED, &amp;vnode-&gt;flags);</div><div class='add'>+		if (op-&gt;volume-&gt;type == AFSVL_RWVOL)</div><div class='add'>+			vnode-&gt;cb_server = op-&gt;server;</div><div class='add'>+		afs_set_cb_promise(vnode, cb-&gt;expires_at, afs_cb_promise_set_apply_cb);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -279,7 +390,7 @@ void afs_vnode_commit_status(struct afs_operation *op, struct afs_vnode_param *v</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (vp-&gt;scb.status.abort_code == VNOVNODE) {</div><div class='ctx'> 			set_bit(AFS_VNODE_DELETED, &amp;vnode-&gt;flags);</div><div class='del'>-			clear_nlink(&amp;vnode-&gt;vfs_inode);</div><div class='add'>+			clear_nlink(&amp;vnode-&gt;netfs.inode);</div><div class='ctx'> 			__afs_break_callback(vnode, afs_cb_break_for_deleted);</div><div class='ctx'> 			op-&gt;flags &amp;= ~AFS_OPERATION_DIR_CONFLICT;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -296,8 +407,8 @@ void afs_vnode_commit_status(struct afs_operation *op, struct afs_vnode_param *v</div><div class='ctx'> 		if (vp-&gt;scb.have_cb)</div><div class='ctx'> 			afs_apply_callback(op, vp);</div><div class='ctx'> 	} else if (vp-&gt;op_unlinked &amp;&amp; !(op-&gt;flags &amp; AFS_OPERATION_DIR_CONFLICT)) {</div><div class='del'>-		drop_nlink(&amp;vnode-&gt;vfs_inode);</div><div class='del'>-		if (vnode-&gt;vfs_inode.i_nlink == 0) {</div><div class='add'>+		drop_nlink(&amp;vnode-&gt;netfs.inode);</div><div class='add'>+		if (vnode-&gt;netfs.inode.i_nlink == 0) {</div><div class='ctx'> 			set_bit(AFS_VNODE_DELETED, &amp;vnode-&gt;flags);</div><div class='ctx'> 			__afs_break_callback(vnode, afs_cb_break_for_deleted);</div><div class='ctx'> 		}</div><div class='hunk'>@@ -316,9 +427,9 @@ static void afs_fetch_status_success(struct afs_operation *op)</div><div class='ctx'> 	struct afs_vnode *vnode = vp-&gt;vnode;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (vnode-&gt;vfs_inode.i_state &amp; I_NEW) {</div><div class='add'>+	if (inode_state_read_once(&amp;vnode-&gt;netfs.inode) &amp; I_NEW) {</div><div class='ctx'> 		ret = afs_inode_init_from_status(op, vp, vnode);</div><div class='del'>-		op-&gt;error = ret;</div><div class='add'>+		afs_op_set_error(op, ret);</div><div class='ctx'> 		if (ret == 0)</div><div class='ctx'> 			afs_cache_permit(vnode, op-&gt;key, vp-&gt;cb_break_before, &amp;vp-&gt;scb);</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -413,28 +524,33 @@ static void afs_get_inode_cache(struct afs_vnode *vnode)</div><div class='ctx'> {</div><div class='ctx'> #ifdef CONFIG_AFS_FSCACHE</div><div class='ctx'> 	struct {</div><div class='del'>-		u32 vnode_id;</div><div class='del'>-		u32 unique;</div><div class='del'>-		u32 vnode_id_ext[2];	/* Allow for a 96-bit key */</div><div class='add'>+		__be32 vnode_id;</div><div class='add'>+		__be32 unique;</div><div class='add'>+		__be32 vnode_id_ext[2];	/* Allow for a 96-bit key */</div><div class='ctx'> 	} __packed key;</div><div class='ctx'> 	struct afs_vnode_cache_aux aux;</div><div class='ctx'> </div><div class='del'>-	if (vnode-&gt;status.type != AFS_FTYPE_FILE) {</div><div class='del'>-		vnode-&gt;cache = NULL;</div><div class='add'>+	if (vnode-&gt;status.type != AFS_FTYPE_FILE &amp;&amp;</div><div class='add'>+	    vnode-&gt;status.type != AFS_FTYPE_DIR &amp;&amp;</div><div class='add'>+	    vnode-&gt;status.type != AFS_FTYPE_SYMLINK) {</div><div class='add'>+		vnode-&gt;netfs.cache = NULL;</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	key.vnode_id		= vnode-&gt;fid.vnode;</div><div class='del'>-	key.unique		= vnode-&gt;fid.unique;</div><div class='del'>-	key.vnode_id_ext[0]	= vnode-&gt;fid.vnode &gt;&gt; 32;</div><div class='del'>-	key.vnode_id_ext[1]	= vnode-&gt;fid.vnode_hi;</div><div class='del'>-	aux.data_version	= vnode-&gt;status.data_version;</div><div class='del'>-</div><div class='del'>-	vnode-&gt;cache = fscache_acquire_cookie(vnode-&gt;volume-&gt;cache,</div><div class='del'>-					      &amp;afs_vnode_cache_index_def,</div><div class='del'>-					      &amp;key, sizeof(key),</div><div class='del'>-					      &amp;aux, sizeof(aux),</div><div class='del'>-					      vnode, vnode-&gt;status.size, true);</div><div class='add'>+	key.vnode_id		= htonl(vnode-&gt;fid.vnode);</div><div class='add'>+	key.unique		= htonl(vnode-&gt;fid.unique);</div><div class='add'>+	key.vnode_id_ext[0]	= htonl(vnode-&gt;fid.vnode &gt;&gt; 32);</div><div class='add'>+	key.vnode_id_ext[1]	= htonl(vnode-&gt;fid.vnode_hi);</div><div class='add'>+	afs_set_cache_aux(vnode, &amp;aux);</div><div class='add'>+</div><div class='add'>+	afs_vnode_set_cache(vnode,</div><div class='add'>+			    fscache_acquire_cookie(</div><div class='add'>+				    vnode-&gt;volume-&gt;cache,</div><div class='add'>+				    vnode-&gt;status.type == AFS_FTYPE_FILE ?</div><div class='add'>+				    0 : FSCACHE_ADV_SINGLE_CHUNK,</div><div class='add'>+				    &amp;key, sizeof(key),</div><div class='add'>+				    &amp;aux, sizeof(aux),</div><div class='add'>+				    i_size_read(&amp;vnode-&gt;netfs.inode)));</div><div class='ctx'> #endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -444,7 +560,7 @@ static void afs_get_inode_cache(struct afs_vnode *vnode)</div><div class='ctx'> struct inode *afs_iget(struct afs_operation *op, struct afs_vnode_param *vp)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_vnode_param *dvp = &amp;op-&gt;file[0];</div><div class='del'>-	struct super_block *sb = dvp-&gt;vnode-&gt;vfs_inode.i_sb;</div><div class='add'>+	struct super_block *sb = dvp-&gt;vnode-&gt;netfs.inode.i_sb;</div><div class='ctx'> 	struct afs_vnode *vnode;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -463,7 +579,7 @@ struct inode *afs_iget(struct afs_operation *op, struct afs_vnode_param *vp)</div><div class='ctx'> 	       inode, vnode-&gt;fid.vid, vnode-&gt;fid.vnode, vnode-&gt;fid.unique);</div><div class='ctx'> </div><div class='ctx'> 	/* deal with an existing inode */</div><div class='del'>-	if (!(inode-&gt;i_state &amp; I_NEW)) {</div><div class='add'>+	if (!(inode_state_read_once(inode) &amp; I_NEW)) {</div><div class='ctx'> 		_leave(" = %p", inode);</div><div class='ctx'> 		return inode;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -493,7 +609,7 @@ static int afs_iget5_set_root(struct inode *inode, void *opaque)</div><div class='ctx'> 	struct afs_vnode *vnode = AFS_FS_I(inode);</div><div class='ctx'> </div><div class='ctx'> 	vnode-&gt;volume		= as-&gt;volume;</div><div class='del'>-	vnode-&gt;fid.vid		= as-&gt;volume-&gt;vid,</div><div class='add'>+	vnode-&gt;fid.vid		= as-&gt;volume-&gt;vid;</div><div class='ctx'> 	vnode-&gt;fid.vnode	= 1;</div><div class='ctx'> 	vnode-&gt;fid.unique	= 1;</div><div class='ctx'> 	inode-&gt;i_ino		= 1;</div><div class='hunk'>@@ -523,10 +639,11 @@ struct inode *afs_root_iget(struct super_block *sb, struct key *key)</div><div class='ctx'> </div><div class='ctx'> 	_debug("GOT ROOT INODE %p { vl=%llx }", inode, as-&gt;volume-&gt;vid);</div><div class='ctx'> </div><div class='del'>-	BUG_ON(!(inode-&gt;i_state &amp; I_NEW));</div><div class='add'>+	BUG_ON(!(inode_state_read_once(inode) &amp; I_NEW));</div><div class='ctx'> </div><div class='ctx'> 	vnode = AFS_FS_I(inode);</div><div class='del'>-	vnode-&gt;cb_v_break = as-&gt;volume-&gt;cb_v_break,</div><div class='add'>+	vnode-&gt;cb_v_check = atomic_read(&amp;as-&gt;volume-&gt;cb_v_break);</div><div class='add'>+	afs_set_netfs_context(vnode);</div><div class='ctx'> </div><div class='ctx'> 	op = afs_alloc_operation(key, as-&gt;volume);</div><div class='ctx'> 	if (IS_ERR(op)) {</div><div class='hunk'>@@ -556,191 +673,45 @@ error:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * mark the data attached to an inode as obsolete due to a write on the server</div><div class='del'>- * - might also want to ditch all the outstanding writes and dirty pages</div><div class='del'>- */</div><div class='del'>-static void afs_zap_data(struct afs_vnode *vnode)</div><div class='del'>-{</div><div class='del'>-	_enter("{%llx:%llu}", vnode-&gt;fid.vid, vnode-&gt;fid.vnode);</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_AFS_FSCACHE</div><div class='del'>-	fscache_invalidate(vnode-&gt;cache);</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-	/* nuke all the non-dirty pages that aren't locked, mapped or being</div><div class='del'>-	 * written back in a regular file and completely discard the pages in a</div><div class='del'>-	 * directory or symlink */</div><div class='del'>-	if (S_ISREG(vnode-&gt;vfs_inode.i_mode))</div><div class='del'>-		invalidate_remote_inode(&amp;vnode-&gt;vfs_inode);</div><div class='del'>-	else</div><div class='del'>-		invalidate_inode_pages2(vnode-&gt;vfs_inode.i_mapping);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Check to see if we have a server currently serving this volume and that it</div><div class='del'>- * hasn't been reinitialised or dropped from the list.</div><div class='del'>- */</div><div class='del'>-static bool afs_check_server_good(struct afs_vnode *vnode)</div><div class='del'>-{</div><div class='del'>-	struct afs_server_list *slist;</div><div class='del'>-	struct afs_server *server;</div><div class='del'>-	bool good;</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	if (vnode-&gt;cb_fs_s_break == atomic_read(&amp;vnode-&gt;volume-&gt;cell-&gt;fs_s_break))</div><div class='del'>-		return true;</div><div class='del'>-</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-</div><div class='del'>-	slist = rcu_dereference(vnode-&gt;volume-&gt;servers);</div><div class='del'>-	for (i = 0; i &lt; slist-&gt;nr_servers; i++) {</div><div class='del'>-		server = slist-&gt;servers[i].server;</div><div class='del'>-		if (server == vnode-&gt;cb_server) {</div><div class='del'>-			good = (vnode-&gt;cb_s_break == server-&gt;cb_s_break);</div><div class='del'>-			rcu_read_unlock();</div><div class='del'>-			return good;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Check the validity of a vnode/inode.</div><div class='del'>- */</div><div class='del'>-bool afs_check_validity(struct afs_vnode *vnode)</div><div class='del'>-{</div><div class='del'>-	enum afs_cb_break_reason need_clear = afs_cb_break_no_break;</div><div class='del'>-	time64_t now = ktime_get_real_seconds();</div><div class='del'>-	unsigned int cb_break;</div><div class='del'>-	int seq = 0;</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		read_seqbegin_or_lock(&amp;vnode-&gt;cb_lock, &amp;seq);</div><div class='del'>-		cb_break = vnode-&gt;cb_break;</div><div class='del'>-</div><div class='del'>-		if (test_bit(AFS_VNODE_CB_PROMISED, &amp;vnode-&gt;flags)) {</div><div class='del'>-			if (vnode-&gt;cb_v_break != vnode-&gt;volume-&gt;cb_v_break)</div><div class='del'>-				need_clear = afs_cb_break_for_v_break;</div><div class='del'>-			else if (!afs_check_server_good(vnode))</div><div class='del'>-				need_clear = afs_cb_break_for_s_reinit;</div><div class='del'>-			else if (test_bit(AFS_VNODE_ZAP_DATA, &amp;vnode-&gt;flags))</div><div class='del'>-				need_clear = afs_cb_break_for_zap;</div><div class='del'>-			else if (vnode-&gt;cb_expires_at - 10 &lt;= now)</div><div class='del'>-				need_clear = afs_cb_break_for_lapsed;</div><div class='del'>-		} else if (test_bit(AFS_VNODE_DELETED, &amp;vnode-&gt;flags)) {</div><div class='del'>-			;</div><div class='del'>-		} else {</div><div class='del'>-			need_clear = afs_cb_break_no_promise;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-	} while (need_seqretry(&amp;vnode-&gt;cb_lock, seq));</div><div class='del'>-</div><div class='del'>-	done_seqretry(&amp;vnode-&gt;cb_lock, seq);</div><div class='del'>-</div><div class='del'>-	if (need_clear == afs_cb_break_no_break)</div><div class='del'>-		return true;</div><div class='del'>-</div><div class='del'>-	write_seqlock(&amp;vnode-&gt;cb_lock);</div><div class='del'>-	if (need_clear == afs_cb_break_no_promise)</div><div class='del'>-		vnode-&gt;cb_v_break = vnode-&gt;volume-&gt;cb_v_break;</div><div class='del'>-	else if (cb_break == vnode-&gt;cb_break)</div><div class='del'>-		__afs_break_callback(vnode, need_clear);</div><div class='del'>-	else</div><div class='del'>-		trace_afs_cb_miss(&amp;vnode-&gt;fid, need_clear);</div><div class='del'>-	write_sequnlock(&amp;vnode-&gt;cb_lock);</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * validate a vnode/inode</div><div class='del'>- * - there are several things we need to check</div><div class='del'>- *   - parent dir data changes (rm, rmdir, rename, mkdir, create, link,</div><div class='del'>- *     symlink)</div><div class='del'>- *   - parent dir metadata changed (security changes)</div><div class='del'>- *   - dentry data changed (write, truncate)</div><div class='del'>- *   - dentry metadata changed (security changes)</div><div class='del'>- */</div><div class='del'>-int afs_validate(struct afs_vnode *vnode, struct key *key)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	_enter("{v={%llx:%llu} fl=%lx},%x",</div><div class='del'>-	       vnode-&gt;fid.vid, vnode-&gt;fid.vnode, vnode-&gt;flags,</div><div class='del'>-	       key_serial(key));</div><div class='del'>-</div><div class='del'>-	if (unlikely(test_bit(AFS_VNODE_DELETED, &amp;vnode-&gt;flags))) {</div><div class='del'>-		if (vnode-&gt;vfs_inode.i_nlink)</div><div class='del'>-			clear_nlink(&amp;vnode-&gt;vfs_inode);</div><div class='del'>-		goto valid;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (test_bit(AFS_VNODE_CB_PROMISED, &amp;vnode-&gt;flags) &amp;&amp;</div><div class='del'>-	    afs_check_validity(vnode))</div><div class='del'>-		goto valid;</div><div class='del'>-</div><div class='del'>-	down_write(&amp;vnode-&gt;validate_lock);</div><div class='del'>-</div><div class='del'>-	/* if the promise has expired, we need to check the server again to get</div><div class='del'>-	 * a new promise - note that if the (parent) directory's metadata was</div><div class='del'>-	 * changed then the security may be different and we may no longer have</div><div class='del'>-	 * access */</div><div class='del'>-	if (!test_bit(AFS_VNODE_CB_PROMISED, &amp;vnode-&gt;flags)) {</div><div class='del'>-		_debug("not promised");</div><div class='del'>-		ret = afs_fetch_status(vnode, key, false, NULL);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			if (ret == -ENOENT) {</div><div class='del'>-				set_bit(AFS_VNODE_DELETED, &amp;vnode-&gt;flags);</div><div class='del'>-				ret = -ESTALE;</div><div class='del'>-			}</div><div class='del'>-			goto error_unlock;</div><div class='del'>-		}</div><div class='del'>-		_debug("new promise [fl=%lx]", vnode-&gt;flags);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (test_bit(AFS_VNODE_DELETED, &amp;vnode-&gt;flags)) {</div><div class='del'>-		_debug("file already deleted");</div><div class='del'>-		ret = -ESTALE;</div><div class='del'>-		goto error_unlock;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* if the vnode's data version number changed then its contents are</div><div class='del'>-	 * different */</div><div class='del'>-	if (test_and_clear_bit(AFS_VNODE_ZAP_DATA, &amp;vnode-&gt;flags))</div><div class='del'>-		afs_zap_data(vnode);</div><div class='del'>-	up_write(&amp;vnode-&gt;validate_lock);</div><div class='del'>-valid:</div><div class='del'>-	_leave(" = 0");</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-error_unlock:</div><div class='del'>-	up_write(&amp;vnode-&gt;validate_lock);</div><div class='del'>-	_leave(" = %d", ret);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * read the attributes of an inode</div><div class='ctx'>  */</div><div class='del'>-int afs_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='add'>+int afs_getattr(struct mnt_idmap *idmap, const struct path *path,</div><div class='ctx'> 		struct kstat *stat, u32 request_mask, unsigned int query_flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(path-&gt;dentry);</div><div class='ctx'> 	struct afs_vnode *vnode = AFS_FS_I(inode);</div><div class='del'>-	int seq = 0;</div><div class='add'>+	struct key *key;</div><div class='add'>+	int ret, seq;</div><div class='ctx'> </div><div class='ctx'> 	_enter("{ ino=%lu v=%u }", inode-&gt;i_ino, inode-&gt;i_generation);</div><div class='ctx'> </div><div class='add'>+	if (vnode-&gt;volume &amp;&amp;</div><div class='add'>+	    !(query_flags &amp; AT_STATX_DONT_SYNC) &amp;&amp;</div><div class='add'>+	    atomic64_read(&amp;vnode-&gt;cb_expires_at) == AFS_NO_CB_PROMISE) {</div><div class='add'>+		key = afs_request_key(vnode-&gt;volume-&gt;cell);</div><div class='add'>+		if (IS_ERR(key))</div><div class='add'>+			return PTR_ERR(key);</div><div class='add'>+		ret = afs_validate(vnode, key);</div><div class='add'>+		key_put(key);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	do {</div><div class='del'>-		read_seqbegin_or_lock(&amp;vnode-&gt;cb_lock, &amp;seq);</div><div class='del'>-		generic_fillattr(&amp;init_user_ns, inode, stat);</div><div class='add'>+		seq = read_seqbegin(&amp;vnode-&gt;cb_lock);</div><div class='add'>+		generic_fillattr(&amp;nop_mnt_idmap, request_mask, inode, stat);</div><div class='ctx'> 		if (test_bit(AFS_VNODE_SILLY_DELETED, &amp;vnode-&gt;flags) &amp;&amp;</div><div class='ctx'> 		    stat-&gt;nlink &gt; 0)</div><div class='ctx'> 			stat-&gt;nlink -= 1;</div><div class='del'>-	} while (need_seqretry(&amp;vnode-&gt;cb_lock, seq));</div><div class='ctx'> </div><div class='del'>-	done_seqretry(&amp;vnode-&gt;cb_lock, seq);</div><div class='add'>+		/* Lie about the size of directories.  We maintain a locally</div><div class='add'>+		 * edited copy and may make different allocation decisions on</div><div class='add'>+		 * it, but we need to give userspace the server's size.</div><div class='add'>+		 */</div><div class='add'>+		if (S_ISDIR(inode-&gt;i_mode))</div><div class='add'>+			stat-&gt;size = vnode-&gt;netfs.remote_i_size;</div><div class='add'>+	} while (read_seqretry(&amp;vnode-&gt;cb_lock, seq));</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -752,9 +723,9 @@ int afs_drop_inode(struct inode *inode)</div><div class='ctx'> 	_enter("");</div><div class='ctx'> </div><div class='ctx'> 	if (test_bit(AFS_VNODE_PSEUDODIR, &amp;AFS_FS_I(inode)-&gt;flags))</div><div class='del'>-		return generic_delete_inode(inode);</div><div class='add'>+		return inode_just_drop(inode);</div><div class='ctx'> 	else</div><div class='del'>-		return generic_drop_inode(inode);</div><div class='add'>+		return inode_generic_drop(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -762,9 +733,9 @@ int afs_drop_inode(struct inode *inode)</div><div class='ctx'>  */</div><div class='ctx'> void afs_evict_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct afs_vnode *vnode;</div><div class='del'>-</div><div class='del'>-	vnode = AFS_FS_I(inode);</div><div class='add'>+	struct afs_vnode_cache_aux aux;</div><div class='add'>+	struct afs_super_info *sbi = AFS_FS_S(inode-&gt;i_sb);</div><div class='add'>+	struct afs_vnode *vnode = AFS_FS_I(inode);</div><div class='ctx'> </div><div class='ctx'> 	_enter("{%llx:%llu.%d}",</div><div class='ctx'> 	       vnode-&gt;fid.vid,</div><div class='hunk'>@@ -775,7 +746,25 @@ void afs_evict_inode(struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> 	ASSERTCMP(inode-&gt;i_ino, ==, vnode-&gt;fid.vnode);</div><div class='ctx'> </div><div class='add'>+	if ((S_ISDIR(inode-&gt;i_mode) ||</div><div class='add'>+	     S_ISLNK(inode-&gt;i_mode)) &amp;&amp;</div><div class='add'>+	    (inode_state_read_once(inode) &amp; I_DIRTY) &amp;&amp;</div><div class='add'>+	    !sbi-&gt;dyn_root) {</div><div class='add'>+		struct writeback_control wbc = {</div><div class='add'>+			.sync_mode = WB_SYNC_ALL,</div><div class='add'>+			.for_sync = true,</div><div class='add'>+			.range_end = LLONG_MAX,</div><div class='add'>+		};</div><div class='add'>+</div><div class='add'>+		afs_single_writepages(inode-&gt;i_mapping, &amp;wbc);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	netfs_wait_for_outstanding_io(inode);</div><div class='ctx'> 	truncate_inode_pages_final(&amp;inode-&gt;i_data);</div><div class='add'>+	netfs_free_folioq_buffer(vnode-&gt;directory);</div><div class='add'>+</div><div class='add'>+	afs_set_cache_aux(vnode, &amp;aux);</div><div class='add'>+	netfs_clear_inode_writeback(inode, &amp;aux);</div><div class='ctx'> 	clear_inode(inode);</div><div class='ctx'> </div><div class='ctx'> 	while (!list_empty(&amp;vnode-&gt;wb_keys)) {</div><div class='hunk'>@@ -785,16 +774,8 @@ void afs_evict_inode(struct inode *inode)</div><div class='ctx'> 		afs_put_wb_key(wbk);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_AFS_FSCACHE</div><div class='del'>-	{</div><div class='del'>-		struct afs_vnode_cache_aux aux;</div><div class='del'>-</div><div class='del'>-		aux.data_version = vnode-&gt;status.data_version;</div><div class='del'>-		fscache_relinquish_cookie(vnode-&gt;cache, &amp;aux,</div><div class='del'>-					  test_bit(AFS_VNODE_DELETED, &amp;vnode-&gt;flags));</div><div class='del'>-		vnode-&gt;cache = NULL;</div><div class='del'>-	}</div><div class='del'>-#endif</div><div class='add'>+	fscache_relinquish_cookie(afs_vnode_cache(vnode),</div><div class='add'>+				  test_bit(AFS_VNODE_DELETED, &amp;vnode-&gt;flags));</div><div class='ctx'> </div><div class='ctx'> 	afs_prune_wb_keys(vnode);</div><div class='ctx'> 	afs_put_permits(rcu_access_pointer(vnode-&gt;permit_cache));</div><div class='hunk'>@@ -808,7 +789,7 @@ void afs_evict_inode(struct inode *inode)</div><div class='ctx'> static void afs_setattr_success(struct afs_operation *op)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_vnode_param *vp = &amp;op-&gt;file[0];</div><div class='del'>-	struct inode *inode = &amp;vp-&gt;vnode-&gt;vfs_inode;</div><div class='add'>+	struct inode *inode = &amp;vp-&gt;vnode-&gt;netfs.inode;</div><div class='ctx'> 	loff_t old_i_size = i_size_read(inode);</div><div class='ctx'> </div><div class='ctx'> 	op-&gt;setattr.old_i_size = old_i_size;</div><div class='hunk'>@@ -825,14 +806,22 @@ static void afs_setattr_success(struct afs_operation *op)</div><div class='ctx'> static void afs_setattr_edit_file(struct afs_operation *op)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_vnode_param *vp = &amp;op-&gt;file[0];</div><div class='del'>-	struct inode *inode = &amp;vp-&gt;vnode-&gt;vfs_inode;</div><div class='add'>+	struct afs_vnode *vnode = vp-&gt;vnode;</div><div class='add'>+	struct inode *inode = &amp;vnode-&gt;netfs.inode;</div><div class='ctx'> </div><div class='ctx'> 	if (op-&gt;setattr.attr-&gt;ia_valid &amp; ATTR_SIZE) {</div><div class='ctx'> 		loff_t size = op-&gt;setattr.attr-&gt;ia_size;</div><div class='del'>-		loff_t i_size = op-&gt;setattr.old_i_size;</div><div class='add'>+		loff_t old = op-&gt;setattr.old_i_size;</div><div class='add'>+</div><div class='add'>+		/* Note: inode-&gt;i_size was updated by afs_apply_status() inside</div><div class='add'>+		 * the I/O and callback locks.</div><div class='add'>+		 */</div><div class='ctx'> </div><div class='del'>-		if (size &lt; i_size)</div><div class='add'>+		if (size != old) {</div><div class='ctx'> 			truncate_pagecache(inode, size);</div><div class='add'>+			netfs_resize_file(&amp;vnode-&gt;netfs, size, true);</div><div class='add'>+			fscache_resize_cookie(afs_vnode_cache(vnode), size);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -846,43 +835,70 @@ static const struct afs_operation_ops afs_setattr_operation = {</div><div class='ctx'> /*</div><div class='ctx'>  * set the attributes of an inode</div><div class='ctx'>  */</div><div class='del'>-int afs_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='add'>+int afs_setattr(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		struct iattr *attr)</div><div class='ctx'> {</div><div class='add'>+	const unsigned int supported =</div><div class='add'>+		ATTR_SIZE | ATTR_MODE | ATTR_UID | ATTR_GID |</div><div class='add'>+		ATTR_MTIME | ATTR_MTIME_SET | ATTR_TIMES_SET | ATTR_TOUCH;</div><div class='ctx'> 	struct afs_operation *op;</div><div class='ctx'> 	struct afs_vnode *vnode = AFS_FS_I(d_inode(dentry));</div><div class='add'>+	struct inode *inode = &amp;vnode-&gt;netfs.inode;</div><div class='add'>+	loff_t i_size;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	_enter("{%llx:%llu},{n=%pd},%x",</div><div class='ctx'> 	       vnode-&gt;fid.vid, vnode-&gt;fid.vnode, dentry,</div><div class='ctx'> 	       attr-&gt;ia_valid);</div><div class='ctx'> </div><div class='del'>-	if (!(attr-&gt;ia_valid &amp; (ATTR_SIZE | ATTR_MODE | ATTR_UID | ATTR_GID |</div><div class='del'>-				ATTR_MTIME | ATTR_MTIME_SET | ATTR_TIMES_SET |</div><div class='del'>-				ATTR_TOUCH))) {</div><div class='add'>+	if (!(attr-&gt;ia_valid &amp; supported)) {</div><div class='ctx'> 		_leave(" = 0 [unsupported]");</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	i_size = i_size_read(inode);</div><div class='ctx'> 	if (attr-&gt;ia_valid &amp; ATTR_SIZE) {</div><div class='del'>-		if (!S_ISREG(vnode-&gt;vfs_inode.i_mode))</div><div class='add'>+		if (!S_ISREG(inode-&gt;i_mode))</div><div class='ctx'> 			return -EISDIR;</div><div class='ctx'> </div><div class='del'>-		ret = inode_newsize_ok(&amp;vnode-&gt;vfs_inode, attr-&gt;ia_size);</div><div class='add'>+		ret = inode_newsize_ok(inode, attr-&gt;ia_size);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='ctx'> </div><div class='del'>-		if (attr-&gt;ia_size == i_size_read(&amp;vnode-&gt;vfs_inode))</div><div class='add'>+		if (attr-&gt;ia_size == i_size)</div><div class='ctx'> 			attr-&gt;ia_valid &amp;= ~ATTR_SIZE;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* flush any dirty data outstanding on a regular file */</div><div class='del'>-	if (S_ISREG(vnode-&gt;vfs_inode.i_mode))</div><div class='del'>-		filemap_write_and_wait(vnode-&gt;vfs_inode.i_mapping);</div><div class='add'>+	fscache_use_cookie(afs_vnode_cache(vnode), true);</div><div class='ctx'> </div><div class='ctx'> 	/* Prevent any new writebacks from starting whilst we do this. */</div><div class='ctx'> 	down_write(&amp;vnode-&gt;validate_lock);</div><div class='ctx'> </div><div class='add'>+	if ((attr-&gt;ia_valid &amp; ATTR_SIZE) &amp;&amp; S_ISREG(inode-&gt;i_mode)) {</div><div class='add'>+		loff_t size = attr-&gt;ia_size;</div><div class='add'>+</div><div class='add'>+		/* Wait for any outstanding writes to the server to complete */</div><div class='add'>+		loff_t from = min(size, i_size);</div><div class='add'>+		loff_t to = max(size, i_size);</div><div class='add'>+		ret = filemap_fdatawait_range(inode-&gt;i_mapping, from, to);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out_unlock;</div><div class='add'>+</div><div class='add'>+		/* Don't talk to the server if we're just shortening in-memory</div><div class='add'>+		 * writes that haven't gone to the server yet.</div><div class='add'>+		 */</div><div class='add'>+		if (!(attr-&gt;ia_valid &amp; (supported &amp; ~ATTR_SIZE &amp; ~ATTR_MTIME)) &amp;&amp;</div><div class='add'>+		    attr-&gt;ia_size &lt; i_size &amp;&amp;</div><div class='add'>+		    attr-&gt;ia_size &gt; vnode-&gt;netfs.remote_i_size) {</div><div class='add'>+			truncate_setsize(inode, attr-&gt;ia_size);</div><div class='add'>+			netfs_resize_file(&amp;vnode-&gt;netfs, size, false);</div><div class='add'>+			fscache_resize_cookie(afs_vnode_cache(vnode),</div><div class='add'>+					      attr-&gt;ia_size);</div><div class='add'>+			ret = 0;</div><div class='add'>+			goto out_unlock;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	op = afs_alloc_operation(((attr-&gt;ia_valid &amp; ATTR_FILE) ?</div><div class='ctx'> 				  afs_file_key(attr-&gt;ia_file) : NULL),</div><div class='ctx'> 				 vnode-&gt;volume);</div><div class='hunk'>@@ -907,6 +923,7 @@ int afs_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> </div><div class='ctx'> out_unlock:</div><div class='ctx'> 	up_write(&amp;vnode-&gt;validate_lock);</div><div class='add'>+	fscache_unuse_cookie(afs_vnode_cache(vnode), NULL, NULL);</div><div class='ctx'> 	_leave(" = %d", ret);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/afs/internal.h b/fs/afs/internal.h<br/>index aa4c0d6c9780..009064b8d661 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/internal.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/internal.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/internal.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/internal.h</a></div><div class='hunk'>@@ -9,17 +9,18 @@</div><div class='ctx'> #include &lt;linux/kernel.h&gt;</div><div class='ctx'> #include &lt;linux/ktime.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/filelock.h&gt;</div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='ctx'> #include &lt;linux/rxrpc.h&gt;</div><div class='ctx'> #include &lt;linux/key.h&gt;</div><div class='ctx'> #include &lt;linux/workqueue.h&gt;</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='del'>-#define FSCACHE_USE_NEW_IO_API</div><div class='ctx'> #include &lt;linux/fscache.h&gt;</div><div class='ctx'> #include &lt;linux/backing-dev.h&gt;</div><div class='ctx'> #include &lt;linux/uuid.h&gt;</div><div class='ctx'> #include &lt;linux/mm_types.h&gt;</div><div class='ctx'> #include &lt;linux/dns_resolver.h&gt;</div><div class='add'>+#include &lt;crypto/krb5.h&gt;</div><div class='ctx'> #include &lt;net/net_namespace.h&gt;</div><div class='ctx'> #include &lt;net/netns/generic.h&gt;</div><div class='ctx'> #include &lt;net/sock.h&gt;</div><div class='hunk'>@@ -33,6 +34,7 @@</div><div class='ctx'> struct pagevec;</div><div class='ctx'> struct afs_call;</div><div class='ctx'> struct afs_vnode;</div><div class='add'>+struct afs_server_probe;</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Partial file-locking emulation mode.  (The problem being that AFS3 only</div><div class='hunk'>@@ -73,21 +75,51 @@ enum afs_call_state {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * Address preferences.</div><div class='add'>+ */</div><div class='add'>+struct afs_addr_preference {</div><div class='add'>+	union {</div><div class='add'>+		struct in_addr	ipv4_addr;	/* AF_INET address to compare against */</div><div class='add'>+		struct in6_addr	ipv6_addr;	/* AF_INET6 address to compare against */</div><div class='add'>+	};</div><div class='add'>+	sa_family_t		family;		/* Which address to use */</div><div class='add'>+	u16			prio;		/* Priority */</div><div class='add'>+	u8			subnet_mask;	/* How many bits to compare */</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct afs_addr_preference_list {</div><div class='add'>+	struct rcu_head		rcu;</div><div class='add'>+	u16			version;	/* Incremented when prefs list changes */</div><div class='add'>+	u8			ipv6_off;	/* Offset of IPv6 addresses */</div><div class='add'>+	u8			nr;		/* Number of addresses in total */</div><div class='add'>+	u8			max_prefs;	/* Number of prefs allocated */</div><div class='add'>+	struct afs_addr_preference prefs[] __counted_by(max_prefs);</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct afs_address {</div><div class='add'>+	struct rxrpc_peer	*peer;</div><div class='add'>+	short			last_error;	/* Last error from this address */</div><div class='add'>+	u16			prio;		/* Address priority */</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * List of server addresses.</div><div class='ctx'>  */</div><div class='ctx'> struct afs_addr_list {</div><div class='ctx'> 	struct rcu_head		rcu;</div><div class='ctx'> 	refcount_t		usage;</div><div class='ctx'> 	u32			version;	/* Version */</div><div class='add'>+	unsigned int		debug_id;</div><div class='add'>+	unsigned int		addr_pref_version; /* Version of address preference list */</div><div class='ctx'> 	unsigned char		max_addrs;</div><div class='ctx'> 	unsigned char		nr_addrs;</div><div class='ctx'> 	unsigned char		preferred;	/* Preferred address */</div><div class='ctx'> 	unsigned char		nr_ipv4;	/* Number of IPv4 addresses */</div><div class='ctx'> 	enum dns_record_source	source:8;</div><div class='ctx'> 	enum dns_lookup_status	status:8;</div><div class='del'>-	unsigned long		failed;		/* Mask of addrs that failed locally/ICMP */</div><div class='add'>+	unsigned long		probe_failed;	/* Mask of addrs that failed locally/ICMP */</div><div class='ctx'> 	unsigned long		responded;	/* Mask of addrs that responded */</div><div class='del'>-	struct sockaddr_rxrpc	addrs[];</div><div class='add'>+	struct afs_address	addrs[] __counted_by(max_addrs);</div><div class='ctx'> #define AFS_MAX_ADDRESSES ((unsigned int)(sizeof(unsigned long) * 8))</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -96,11 +128,12 @@ struct afs_addr_list {</div><div class='ctx'>  */</div><div class='ctx'> struct afs_call {</div><div class='ctx'> 	const struct afs_call_type *type;	/* type of call */</div><div class='del'>-	struct afs_addr_list	*alist;		/* Address is alist[addr_ix] */</div><div class='ctx'> 	wait_queue_head_t	waitq;		/* processes awaiting completion */</div><div class='ctx'> 	struct work_struct	async_work;	/* async I/O processor */</div><div class='ctx'> 	struct work_struct	work;		/* actual work processor */</div><div class='add'>+	struct work_struct	free_work;	/* Deferred free processor */</div><div class='ctx'> 	struct rxrpc_call	*rxcall;	/* RxRPC call handle */</div><div class='add'>+	struct rxrpc_peer	*peer;		/* Remote endpoint */</div><div class='ctx'> 	struct key		*key;		/* security for this call */</div><div class='ctx'> 	struct afs_net		*net;		/* The network namespace */</div><div class='ctx'> 	struct afs_server	*server;	/* The fileserver record if fs op (pins ref) */</div><div class='hunk'>@@ -116,33 +149,38 @@ struct afs_call {</div><div class='ctx'> 	};</div><div class='ctx'> 	void			*buffer;	/* reply receive buffer */</div><div class='ctx'> 	union {</div><div class='del'>-		long			ret0;	/* Value to reply with instead of 0 */</div><div class='add'>+		struct afs_endpoint_state *probe;</div><div class='add'>+		struct afs_addr_list	*vl_probe;</div><div class='ctx'> 		struct afs_addr_list	*ret_alist;</div><div class='ctx'> 		struct afs_vldb_entry	*ret_vldb;</div><div class='ctx'> 		char			*ret_str;</div><div class='ctx'> 	};</div><div class='add'>+	struct afs_fid		fid;		/* Primary vnode ID (or all zeroes) */</div><div class='add'>+	unsigned char		probe_index;	/* Address in -&gt;probe_alist */</div><div class='ctx'> 	struct afs_operation	*op;</div><div class='ctx'> 	unsigned int		server_index;</div><div class='del'>-	atomic_t		usage;</div><div class='add'>+	refcount_t		ref;</div><div class='ctx'> 	enum afs_call_state	state;</div><div class='ctx'> 	spinlock_t		state_lock;</div><div class='ctx'> 	int			error;		/* error code */</div><div class='ctx'> 	u32			abort_code;	/* Remote abort ID or 0 */</div><div class='del'>-	unsigned int		max_lifespan;	/* Maximum lifespan to set if not 0 */</div><div class='add'>+	unsigned long long	remaining;	/* How much is left to receive */</div><div class='add'>+	unsigned int		max_lifespan;	/* Maximum lifespan in secs to set if not 0 */</div><div class='ctx'> 	unsigned		request_size;	/* size of request data */</div><div class='ctx'> 	unsigned		reply_max;	/* maximum size of reply */</div><div class='ctx'> 	unsigned		count2;		/* count used in unmarshalling */</div><div class='ctx'> 	unsigned char		unmarshall;	/* unmarshalling phase */</div><div class='del'>-	unsigned char		addr_ix;	/* Address in -&gt;alist */</div><div class='ctx'> 	bool			drop_ref;	/* T if need to drop ref for incoming call */</div><div class='ctx'> 	bool			need_attention;	/* T if RxRPC poked us */</div><div class='ctx'> 	bool			async;		/* T if asynchronous */</div><div class='ctx'> 	bool			upgrade;	/* T to request service upgrade */</div><div class='del'>-	bool			have_reply_time; /* T if have got reply_time */</div><div class='ctx'> 	bool			intr;		/* T if interruptible */</div><div class='ctx'> 	bool			unmarshalling_error; /* T if an unmarshalling error occurred */</div><div class='add'>+	bool			responded;	/* Got a response from the call (may be abort) */</div><div class='add'>+	u8			security_ix;	/* Security class */</div><div class='ctx'> 	u16			service_id;	/* Actual service ID (after upgrade) */</div><div class='ctx'> 	unsigned int		debug_id;	/* Trace ID */</div><div class='add'>+	u32			enctype;	/* Security encoding type */</div><div class='ctx'> 	u32			operation_ID;	/* operation ID for an incoming call */</div><div class='ctx'> 	u32			count;		/* count for use in unmarshalling */</div><div class='ctx'> 	union {					/* place to extract temporary data */</div><div class='hunk'>@@ -152,7 +190,7 @@ struct afs_call {</div><div class='ctx'> 		} __attribute__((packed));</div><div class='ctx'> 		__be64		tmp64;</div><div class='ctx'> 	};</div><div class='del'>-	ktime_t			reply_time;	/* Time of first reply packet */</div><div class='add'>+	ktime_t			issue_time;	/* Time of issue of operation */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct afs_call_type {</div><div class='hunk'>@@ -167,11 +205,17 @@ struct afs_call_type {</div><div class='ctx'> 	/* clean up a call */</div><div class='ctx'> 	void (*destructor)(struct afs_call *call);</div><div class='ctx'> </div><div class='add'>+	/* Async receive processing function */</div><div class='add'>+	void (*async_rx)(struct work_struct *work);</div><div class='add'>+</div><div class='ctx'> 	/* Work function */</div><div class='ctx'> 	void (*work)(struct work_struct *work);</div><div class='ctx'> </div><div class='ctx'> 	/* Call done function (gets called immediately on success or failure) */</div><div class='ctx'> 	void (*done)(struct afs_call *call);</div><div class='add'>+</div><div class='add'>+	/* Handle a call being immediately cancelled. */</div><div class='add'>+	void (*immediate_cancel)(struct afs_call *call);</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -199,28 +243,6 @@ static inline struct key *afs_file_key(struct file *file)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Record of an outstanding read operation on a vnode.</div><div class='del'>- */</div><div class='del'>-struct afs_read {</div><div class='del'>-	loff_t			pos;		/* Where to start reading */</div><div class='del'>-	loff_t			len;		/* How much we're asking for */</div><div class='del'>-	loff_t			actual_len;	/* How much we're actually getting */</div><div class='del'>-	loff_t			file_size;	/* File size returned by server */</div><div class='del'>-	struct key		*key;		/* The key to use to reissue the read */</div><div class='del'>-	struct afs_vnode	*vnode;		/* The file being read into. */</div><div class='del'>-	struct netfs_read_subrequest *subreq;	/* Fscache helper read request this belongs to */</div><div class='del'>-	afs_dataversion_t	data_version;	/* Version number returned by server */</div><div class='del'>-	refcount_t		usage;</div><div class='del'>-	unsigned int		call_debug_id;</div><div class='del'>-	unsigned int		nr_pages;</div><div class='del'>-	int			error;</div><div class='del'>-	void (*done)(struct afs_read *);</div><div class='del'>-	void (*cleanup)(struct afs_read *);</div><div class='del'>-	struct iov_iter		*iter;		/* Iterator representing the buffer */</div><div class='del'>-	struct iov_iter		def_iter;	/* Default iterator */</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * AFS superblock private data</div><div class='ctx'>  * - there's one superblock per volume</div><div class='ctx'>  */</div><div class='hunk'>@@ -262,15 +284,15 @@ struct afs_net {</div><div class='ctx'> 	struct socket		*socket;</div><div class='ctx'> 	struct afs_call		*spare_incoming_call;</div><div class='ctx'> 	struct work_struct	charge_preallocation_work;</div><div class='add'>+	struct work_struct	rx_oob_work;</div><div class='ctx'> 	struct mutex		socket_mutex;</div><div class='ctx'> 	atomic_t		nr_outstanding_calls;</div><div class='ctx'> 	atomic_t		nr_superblocks;</div><div class='ctx'> </div><div class='ctx'> 	/* Cell database */</div><div class='ctx'> 	struct rb_root		cells;</div><div class='del'>-	struct afs_cell		*ws_cell;</div><div class='del'>-	struct work_struct	cells_manager;</div><div class='del'>-	struct timer_list	cells_timer;</div><div class='add'>+	struct idr		cells_dyn_ino;	/* cell-&gt;dynroot_ino mapping */</div><div class='add'>+	struct afs_cell __rcu	*ws_cell;</div><div class='ctx'> 	atomic_t		cells_outstanding;</div><div class='ctx'> 	struct rw_semaphore	cells_lock;</div><div class='ctx'> 	struct mutex		cells_alias_lock;</div><div class='hunk'>@@ -282,19 +304,12 @@ struct afs_net {</div><div class='ctx'> 	 * cell, but in practice, people create aliases and subsets and there's</div><div class='ctx'> 	 * no easy way to distinguish them.</div><div class='ctx'> 	 */</div><div class='del'>-	seqlock_t		fs_lock;	/* For fs_servers, fs_probe_*, fs_proc */</div><div class='del'>-	struct rb_root		fs_servers;	/* afs_server (by server UUID or address) */</div><div class='add'>+	seqlock_t		fs_lock;	/* For fs_probe_*, fs_proc */</div><div class='ctx'> 	struct list_head	fs_probe_fast;	/* List of afs_server to probe at 30s intervals */</div><div class='ctx'> 	struct list_head	fs_probe_slow;	/* List of afs_server to probe at 5m intervals */</div><div class='ctx'> 	struct hlist_head	fs_proc;	/* procfs servers list */</div><div class='ctx'> </div><div class='del'>-	struct hlist_head	fs_addresses4;	/* afs_server (by lowest IPv4 addr) */</div><div class='del'>-	struct hlist_head	fs_addresses6;	/* afs_server (by lowest IPv6 addr) */</div><div class='del'>-	seqlock_t		fs_addr_lock;	/* For fs_addresses[46] */</div><div class='del'>-</div><div class='del'>-	struct work_struct	fs_manager;</div><div class='del'>-	struct timer_list	fs_timer;</div><div class='del'>-</div><div class='add'>+	struct key		*fs_cm_token_key; /* Key for creating CM tokens */</div><div class='ctx'> 	struct work_struct	fs_prober;</div><div class='ctx'> 	struct timer_list	fs_probe_timer;</div><div class='ctx'> 	atomic_t		servers_outstanding;</div><div class='hunk'>@@ -307,12 +322,14 @@ struct afs_net {</div><div class='ctx'> 	struct proc_dir_entry	*proc_afs;	/* /proc/net/afs directory */</div><div class='ctx'> 	struct afs_sysnames	*sysnames;</div><div class='ctx'> 	rwlock_t		sysnames_lock;</div><div class='add'>+	struct afs_addr_preference_list __rcu *address_prefs;</div><div class='add'>+	u16			address_pref_version;</div><div class='ctx'> </div><div class='ctx'> 	/* Statistics counters */</div><div class='ctx'> 	atomic_t		n_lookup;	/* Number of lookups done */</div><div class='ctx'> 	atomic_t		n_reval;	/* Number of dentries needing revalidation */</div><div class='ctx'> 	atomic_t		n_inval;	/* Number of invalidations by the server */</div><div class='del'>-	atomic_t		n_relpg;	/* Number of invalidations by releasepage */</div><div class='add'>+	atomic_t		n_relpg;	/* Number of invalidations by release_folio */</div><div class='ctx'> 	atomic_t		n_read_dir;	/* Number of directory pages read */</div><div class='ctx'> 	atomic_t		n_dir_cr;	/* Number of directory entry creation edits */</div><div class='ctx'> 	atomic_t		n_dir_rm;	/* Number of directory entry removal edits */</div><div class='hunk'>@@ -325,13 +342,11 @@ struct afs_net {</div><div class='ctx'> extern const char afs_init_sysname[];</div><div class='ctx'> </div><div class='ctx'> enum afs_cell_state {</div><div class='del'>-	AFS_CELL_UNSET,</div><div class='del'>-	AFS_CELL_ACTIVATING,</div><div class='add'>+	AFS_CELL_SETTING_UP,</div><div class='add'>+	AFS_CELL_UNLOOKED,</div><div class='ctx'> 	AFS_CELL_ACTIVE,</div><div class='del'>-	AFS_CELL_DEACTIVATING,</div><div class='del'>-	AFS_CELL_INACTIVE,</div><div class='del'>-	AFS_CELL_FAILED,</div><div class='del'>-	AFS_CELL_REMOVED,</div><div class='add'>+	AFS_CELL_REMOVING,</div><div class='add'>+	AFS_CELL_DEAD,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -362,14 +377,13 @@ struct afs_cell {</div><div class='ctx'> 	struct afs_cell		*alias_of;	/* The cell this is an alias of */</div><div class='ctx'> 	struct afs_volume	*root_volume;	/* The root.cell volume if there is one */</div><div class='ctx'> 	struct key		*anonymous_key;	/* anonymous user key for this cell */</div><div class='add'>+	struct work_struct	destroyer;	/* Destroyer for cell */</div><div class='ctx'> 	struct work_struct	manager;	/* Manager for init/deinit/dns */</div><div class='add'>+	struct timer_list	management_timer; /* General management timer */</div><div class='ctx'> 	struct hlist_node	proc_link;	/* /proc cell list link */</div><div class='del'>-#ifdef CONFIG_AFS_FSCACHE</div><div class='del'>-	struct fscache_cookie	*cache;		/* caching cookie */</div><div class='del'>-#endif</div><div class='ctx'> 	time64_t		dns_expiry;	/* Time AFSDB/SRV record expires */</div><div class='ctx'> 	time64_t		last_inactive;	/* Time of last drop of usage count */</div><div class='del'>-	atomic_t		ref;		/* Struct refcount */</div><div class='add'>+	refcount_t		ref;		/* Struct refcount */</div><div class='ctx'> 	atomic_t		active;		/* Active usage counter */</div><div class='ctx'> 	unsigned long		flags;</div><div class='ctx'> #define AFS_CELL_FL_NO_GC	0		/* The cell was added manually, don't auto-gc */</div><div class='hunk'>@@ -381,18 +395,17 @@ struct afs_cell {</div><div class='ctx'> 	enum dns_lookup_status	dns_status:8;	/* Latest status of data from lookup */</div><div class='ctx'> 	unsigned int		dns_lookup_count; /* Counter of DNS lookups */</div><div class='ctx'> 	unsigned int		debug_id;</div><div class='add'>+	unsigned int		dynroot_ino;	/* Inode numbers for dynroot (a pair) */</div><div class='ctx'> </div><div class='ctx'> 	/* The volumes belonging to this cell */</div><div class='add'>+	struct rw_semaphore	vs_lock;	/* Lock for server-&gt;volumes */</div><div class='ctx'> 	struct rb_root		volumes;	/* Tree of volumes on this server */</div><div class='ctx'> 	struct hlist_head	proc_volumes;	/* procfs volume list */</div><div class='ctx'> 	seqlock_t		volume_lock;	/* For volumes */</div><div class='ctx'> </div><div class='ctx'> 	/* Active fileserver interaction state. */</div><div class='ctx'> 	struct rb_root		fs_servers;	/* afs_server (by server UUID) */</div><div class='del'>-	seqlock_t		fs_lock;	/* For fs_servers  */</div><div class='del'>-	struct rw_semaphore	fs_open_mmaps_lock;</div><div class='del'>-	struct list_head	fs_open_mmaps;	/* List of vnodes that are mmapped */</div><div class='del'>-	atomic_t		fs_s_break;	/* Counter of CB.InitCallBackState messages */</div><div class='add'>+	struct rw_semaphore	fs_lock;	/* For fs_servers  */</div><div class='ctx'> </div><div class='ctx'> 	/* VL server list. */</div><div class='ctx'> 	rwlock_t		vl_servers_lock; /* Lock on vl_servers */</div><div class='hunk'>@@ -400,6 +413,7 @@ struct afs_cell {</div><div class='ctx'> </div><div class='ctx'> 	u8			name_len;	/* Length of name */</div><div class='ctx'> 	char			*name;		/* Cell name, case-flattened and NUL-padded */</div><div class='add'>+	char			*key_desc;	/* Authentication key description */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -414,15 +428,16 @@ struct afs_vlserver {</div><div class='ctx'> #define AFS_VLSERVER_FL_IS_YFS	2		/* Server is YFS not AFS */</div><div class='ctx'> #define AFS_VLSERVER_FL_RESPONDING 3		/* VL server is responding */</div><div class='ctx'> 	rwlock_t		lock;		/* Lock on addresses */</div><div class='del'>-	atomic_t		usage;</div><div class='add'>+	refcount_t		ref;</div><div class='ctx'> 	unsigned int		rtt;		/* Server's current RTT in uS */</div><div class='add'>+	unsigned int		debug_id;</div><div class='ctx'> </div><div class='ctx'> 	/* Probe state */</div><div class='ctx'> 	wait_queue_head_t	probe_wq;</div><div class='ctx'> 	atomic_t		probe_outstanding;</div><div class='ctx'> 	spinlock_t		probe_lock;</div><div class='ctx'> 	struct {</div><div class='del'>-		unsigned int	rtt;		/* RTT in uS */</div><div class='add'>+		unsigned int	rtt;		/* Best RTT in uS (or UINT_MAX) */</div><div class='ctx'> 		u32		abort_code;</div><div class='ctx'> 		short		error;</div><div class='ctx'> 		unsigned short	flags;</div><div class='hunk'>@@ -432,6 +447,7 @@ struct afs_vlserver {</div><div class='ctx'> #define AFS_VLSERVER_PROBE_LOCAL_FAILURE	0x08 /* A local failure prevented a probe */</div><div class='ctx'> 	} probe;</div><div class='ctx'> </div><div class='add'>+	u16			service_id;	/* Service ID we're using */</div><div class='ctx'> 	u16			port;</div><div class='ctx'> 	u16			name_len;	/* Length of name */</div><div class='ctx'> 	char			name[];		/* Server name, case-flattened */</div><div class='hunk'>@@ -450,7 +466,7 @@ struct afs_vlserver_entry {</div><div class='ctx'> </div><div class='ctx'> struct afs_vlserver_list {</div><div class='ctx'> 	struct rcu_head		rcu;</div><div class='del'>-	atomic_t		usage;</div><div class='add'>+	refcount_t		ref;</div><div class='ctx'> 	u8			nr_servers;</div><div class='ctx'> 	u8			index;		/* Server currently in use */</div><div class='ctx'> 	u8			preferred;	/* Preferred server */</div><div class='hunk'>@@ -481,6 +497,7 @@ struct afs_vldb_entry {</div><div class='ctx'> #define AFS_VOL_VTM_RW	0x01 /* R/W version of the volume is available (on this server) */</div><div class='ctx'> #define AFS_VOL_VTM_RO	0x02 /* R/O version of the volume is available (on this server) */</div><div class='ctx'> #define AFS_VOL_VTM_BAK	0x04 /* backup version of the volume is available (on this server) */</div><div class='add'>+	u8			vlsf_flags[AFS_NMAXNSERVERS];</div><div class='ctx'> 	short			error;</div><div class='ctx'> 	u8			nr_servers;	/* Number of server records */</div><div class='ctx'> 	u8			name_len;</div><div class='hunk'>@@ -488,6 +505,32 @@ struct afs_vldb_entry {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * Fileserver endpoint state.  The records the addresses of a fileserver's</div><div class='add'>+ * endpoints and the state and result of a round of probing on them.  This</div><div class='add'>+ * allows the rotation algorithm to access those results without them being</div><div class='add'>+ * erased by a subsequent round of probing.</div><div class='add'>+ */</div><div class='add'>+struct afs_endpoint_state {</div><div class='add'>+	struct rcu_head		rcu;</div><div class='add'>+	struct afs_addr_list	*addresses;	/* The addresses being probed */</div><div class='add'>+	unsigned long		responsive_set;	/* Bitset of responsive endpoints */</div><div class='add'>+	unsigned long		failed_set;	/* Bitset of endpoints we failed to probe */</div><div class='add'>+	refcount_t		ref;</div><div class='add'>+	unsigned int		server_id;	/* Debug ID of server */</div><div class='add'>+	unsigned int		probe_seq;	/* Probe sequence (from server::probe_counter) */</div><div class='add'>+	atomic_t		nr_probing;	/* Number of outstanding probes */</div><div class='add'>+	unsigned int		rtt;		/* Best RTT in uS (or UINT_MAX) */</div><div class='add'>+	s32			abort_code;</div><div class='add'>+	short			error;</div><div class='add'>+	unsigned long		flags;</div><div class='add'>+#define AFS_ESTATE_RESPONDED	0		/* Set if the server responded */</div><div class='add'>+#define AFS_ESTATE_SUPERSEDED	1		/* Set if this record has been superseded */</div><div class='add'>+#define AFS_ESTATE_IS_YFS	2		/* Set if probe upgraded to YFS */</div><div class='add'>+#define AFS_ESTATE_NOT_YFS	3		/* Set if probe didn't upgrade to YFS */</div><div class='add'>+#define AFS_ESTATE_LOCAL_FAILURE 4		/* Set if there was a local failure (eg. ENOMEM) */</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * Record of fileserver with which we're actively communicating.</div><div class='ctx'>  */</div><div class='ctx'> struct afs_server {</div><div class='hunk'>@@ -497,70 +540,76 @@ struct afs_server {</div><div class='ctx'> 		struct afs_uuid	_uuid;</div><div class='ctx'> 	};</div><div class='ctx'> </div><div class='del'>-	struct afs_addr_list	__rcu *addresses;</div><div class='ctx'> 	struct afs_cell		*cell;		/* Cell to which belongs (pins ref) */</div><div class='del'>-	struct rb_node		uuid_rb;	/* Link in net-&gt;fs_servers */</div><div class='del'>-	struct afs_server __rcu	*uuid_next;	/* Next server with same UUID */</div><div class='del'>-	struct afs_server	*uuid_prev;	/* Previous server with same UUID */</div><div class='del'>-	struct list_head	probe_link;	/* Link in net-&gt;fs_probe_list */</div><div class='del'>-	struct hlist_node	addr4_link;	/* Link in net-&gt;fs_addresses4 */</div><div class='del'>-	struct hlist_node	addr6_link;	/* Link in net-&gt;fs_addresses6 */</div><div class='add'>+	struct rb_node		uuid_rb;	/* Link in cell-&gt;fs_servers */</div><div class='add'>+	struct list_head	probe_link;	/* Link in net-&gt;fs_probe_* */</div><div class='ctx'> 	struct hlist_node	proc_link;	/* Link in net-&gt;fs_proc */</div><div class='del'>-	struct work_struct	initcb_work;	/* Work for CB.InitCallBackState* */</div><div class='del'>-	struct afs_server	*gc_next;	/* Next server in manager's list */</div><div class='add'>+	struct list_head	volumes;	/* RCU list of afs_server_entry objects */</div><div class='add'>+	struct work_struct	destroyer;	/* Work item to try and destroy a server */</div><div class='add'>+	struct timer_list	timer;		/* Management timer */</div><div class='add'>+	struct mutex		cm_token_lock;	/* Lock governing creation of appdata */</div><div class='add'>+	struct krb5_buffer	cm_rxgk_appdata; /* Appdata to be included in RESPONSE packet */</div><div class='ctx'> 	time64_t		unuse_time;	/* Time at which last unused */</div><div class='ctx'> 	unsigned long		flags;</div><div class='ctx'> #define AFS_SERVER_FL_RESPONDING 0		/* The server is responding */</div><div class='ctx'> #define AFS_SERVER_FL_UPDATING	1</div><div class='ctx'> #define AFS_SERVER_FL_NEEDS_UPDATE 2		/* Fileserver address list is out of date */</div><div class='del'>-#define AFS_SERVER_FL_NOT_READY	4		/* The record is not ready for use */</div><div class='del'>-#define AFS_SERVER_FL_NOT_FOUND	5		/* VL server says no such server */</div><div class='del'>-#define AFS_SERVER_FL_VL_FAIL	6		/* Failed to access VL server */</div><div class='add'>+#define AFS_SERVER_FL_UNCREATED	3		/* The record needs creating */</div><div class='add'>+#define AFS_SERVER_FL_CREATING	4		/* The record is being created */</div><div class='add'>+#define AFS_SERVER_FL_EXPIRED	5		/* The record has expired */</div><div class='add'>+#define AFS_SERVER_FL_NOT_FOUND	6		/* VL server says no such server */</div><div class='add'>+#define AFS_SERVER_FL_VL_FAIL	7		/* Failed to access VL server */</div><div class='ctx'> #define AFS_SERVER_FL_MAY_HAVE_CB 8		/* May have callbacks on this fileserver */</div><div class='ctx'> #define AFS_SERVER_FL_IS_YFS	16		/* Server is YFS not AFS */</div><div class='ctx'> #define AFS_SERVER_FL_NO_IBULK	17		/* Fileserver doesn't support FS.InlineBulkStatus */</div><div class='ctx'> #define AFS_SERVER_FL_NO_RM2	18		/* Fileserver doesn't support YFS.RemoveFile2 */</div><div class='ctx'> #define AFS_SERVER_FL_HAS_FS64	19		/* Fileserver supports FS.{Fetch,Store}Data64 */</div><div class='del'>-	atomic_t		ref;		/* Object refcount */</div><div class='add'>+#define AFS_SERVER_FL_NO_RENAME2 20		/* YFS Fileserver doesn't support enhanced rename */</div><div class='add'>+	refcount_t		ref;		/* Object refcount */</div><div class='ctx'> 	atomic_t		active;		/* Active user count */</div><div class='ctx'> 	u32			addr_version;	/* Address list version */</div><div class='add'>+	u16			service_id;	/* Service ID we're using. */</div><div class='add'>+	short			create_error;	/* Creation error */</div><div class='ctx'> 	unsigned int		rtt;		/* Server's current RTT in uS */</div><div class='ctx'> 	unsigned int		debug_id;	/* Debugging ID for traces */</div><div class='ctx'> </div><div class='ctx'> 	/* file service access */</div><div class='ctx'> 	rwlock_t		fs_lock;	/* access lock */</div><div class='ctx'> </div><div class='del'>-	/* callback promise management */</div><div class='del'>-	unsigned		cb_s_break;	/* Break-everything counter. */</div><div class='del'>-</div><div class='ctx'> 	/* Probe state */</div><div class='add'>+	struct afs_endpoint_state __rcu *endpoint_state; /* Latest endpoint/probe state */</div><div class='ctx'> 	unsigned long		probed_at;	/* Time last probe was dispatched (jiffies) */</div><div class='ctx'> 	wait_queue_head_t	probe_wq;</div><div class='del'>-	atomic_t		probe_outstanding;</div><div class='add'>+	unsigned int		probe_counter;	/* Number of probes issued */</div><div class='ctx'> 	spinlock_t		probe_lock;</div><div class='del'>-	struct {</div><div class='del'>-		unsigned int	rtt;		/* RTT in uS */</div><div class='del'>-		u32		abort_code;</div><div class='del'>-		short		error;</div><div class='del'>-		bool		responded:1;</div><div class='del'>-		bool		is_yfs:1;</div><div class='del'>-		bool		not_yfs:1;</div><div class='del'>-		bool		local_failure:1;</div><div class='del'>-	} probe;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+enum afs_ro_replicating {</div><div class='add'>+	AFS_RO_NOT_REPLICATING,			/* Not doing replication */</div><div class='add'>+	AFS_RO_REPLICATING_USE_OLD,		/* Replicating; use old version */</div><div class='add'>+	AFS_RO_REPLICATING_USE_NEW,		/* Replicating; switch to new version */</div><div class='add'>+} __mode(byte);</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Replaceable volume server list.</div><div class='ctx'>  */</div><div class='ctx'> struct afs_server_entry {</div><div class='ctx'> 	struct afs_server	*server;</div><div class='add'>+	struct afs_volume	*volume;</div><div class='add'>+	struct list_head	slink;		/* Link in server-&gt;volumes */</div><div class='add'>+	time64_t		cb_expires_at;	/* Time at which volume-level callback expires */</div><div class='add'>+	unsigned long		flags;</div><div class='add'>+#define AFS_SE_EXCLUDED		0		/* Set if server is to be excluded in rotation */</div><div class='add'>+#define AFS_SE_VOLUME_OFFLINE	1		/* Set if volume offline notice given */</div><div class='add'>+#define AFS_SE_VOLUME_BUSY	2		/* Set if volume busy notice given */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct afs_server_list {</div><div class='del'>-	afs_volid_t		vids[AFS_MAXTYPES]; /* Volume IDs */</div><div class='add'>+	struct rcu_head		rcu;</div><div class='ctx'> 	refcount_t		usage;</div><div class='add'>+	bool			attached;	/* T if attached to servers */</div><div class='add'>+	enum afs_ro_replicating	ro_replicating;	/* RW-&gt;RO update (probably) in progress */</div><div class='ctx'> 	unsigned char		nr_servers;</div><div class='del'>-	unsigned char		preferred;	/* Preferred server */</div><div class='ctx'> 	unsigned short		vnovol_mask;	/* Servers to be skipped due to VNOVOL */</div><div class='ctx'> 	unsigned int		seq;		/* Set to -&gt;servers_seq when installed */</div><div class='ctx'> 	rwlock_t		lock;</div><div class='hunk'>@@ -571,33 +620,46 @@ struct afs_server_list {</div><div class='ctx'>  * Live AFS volume management.</div><div class='ctx'>  */</div><div class='ctx'> struct afs_volume {</div><div class='del'>-	union {</div><div class='del'>-		struct rcu_head	rcu;</div><div class='del'>-		afs_volid_t	vid;		/* volume ID */</div><div class='del'>-	};</div><div class='del'>-	atomic_t		usage;</div><div class='add'>+	struct rcu_head	rcu;</div><div class='add'>+	afs_volid_t		vid;		/* The volume ID of this volume */</div><div class='add'>+	afs_volid_t		vids[AFS_MAXTYPES]; /* All associated volume IDs */</div><div class='add'>+	refcount_t		ref;</div><div class='add'>+	unsigned int		debug_id;	/* Debugging ID for traces */</div><div class='ctx'> 	time64_t		update_at;	/* Time at which to next update */</div><div class='ctx'> 	struct afs_cell		*cell;		/* Cell to which belongs (pins ref) */</div><div class='ctx'> 	struct rb_node		cell_node;	/* Link in cell-&gt;volumes */</div><div class='ctx'> 	struct hlist_node	proc_link;	/* Link in cell-&gt;proc_volumes */</div><div class='ctx'> 	struct super_block __rcu *sb;		/* Superblock on which inodes reside */</div><div class='add'>+	struct work_struct	destructor;	/* Deferred destructor */</div><div class='ctx'> 	unsigned long		flags;</div><div class='ctx'> #define AFS_VOLUME_NEEDS_UPDATE	0	/* - T if an update needs performing */</div><div class='ctx'> #define AFS_VOLUME_UPDATING	1	/* - T if an update is in progress */</div><div class='ctx'> #define AFS_VOLUME_WAIT		2	/* - T if users must wait for update */</div><div class='ctx'> #define AFS_VOLUME_DELETED	3	/* - T if volume appears deleted */</div><div class='del'>-#define AFS_VOLUME_OFFLINE	4	/* - T if volume offline notice given */</div><div class='del'>-#define AFS_VOLUME_BUSY		5	/* - T if volume busy notice given */</div><div class='del'>-#define AFS_VOLUME_MAYBE_NO_IBULK 6	/* - T if some servers don't have InlineBulkStatus */</div><div class='add'>+#define AFS_VOLUME_MAYBE_NO_IBULK 4	/* - T if some servers don't have InlineBulkStatus */</div><div class='add'>+#define AFS_VOLUME_RM_TREE	5	/* - Set if volume removed from cell-&gt;volumes */</div><div class='ctx'> #ifdef CONFIG_AFS_FSCACHE</div><div class='del'>-	struct fscache_cookie	*cache;		/* caching cookie */</div><div class='add'>+	struct fscache_volume	*cache;		/* Caching cookie */</div><div class='ctx'> #endif</div><div class='ctx'> 	struct afs_server_list __rcu *servers;	/* List of servers on which volume resides */</div><div class='ctx'> 	rwlock_t		servers_lock;	/* Lock for -&gt;servers */</div><div class='ctx'> 	unsigned int		servers_seq;	/* Incremented each time -&gt;servers changes */</div><div class='ctx'> </div><div class='del'>-	unsigned		cb_v_break;	/* Break-everything counter. */</div><div class='add'>+	/* RO release tracking */</div><div class='add'>+	struct mutex		volsync_lock;	/* Time/state evaluation lock */</div><div class='add'>+	time64_t		creation_time;	/* Volume creation time (or TIME64_MIN) */</div><div class='add'>+	time64_t		update_time;	/* Volume update time (or TIME64_MIN) */</div><div class='add'>+</div><div class='add'>+	/* Callback management */</div><div class='add'>+	struct mutex		cb_check_lock;	/* Lock to control race to check after v_break */</div><div class='add'>+	time64_t		cb_expires_at;	/* Earliest volume callback expiry time */</div><div class='add'>+	atomic_t		cb_ro_snapshot;	/* RO volume update-from-snapshot counter */</div><div class='add'>+	atomic_t		cb_v_break;	/* Volume-break event counter. */</div><div class='add'>+	atomic_t		cb_v_check;	/* Volume-break has-been-checked counter. */</div><div class='add'>+	atomic_t		cb_scrub;	/* Scrub-all-data event counter. */</div><div class='ctx'> 	rwlock_t		cb_v_break_lock;</div><div class='add'>+	struct rw_semaphore	open_mmaps_lock;</div><div class='add'>+	struct list_head	open_mmaps;	/* List of vnodes that are mmapped */</div><div class='ctx'> </div><div class='ctx'> 	afs_voltype_t		type;		/* type of volume */</div><div class='ctx'> 	char			type_force;	/* force volume type (suppress R/O -&gt; R/W) */</div><div class='hunk'>@@ -623,35 +685,32 @@ enum afs_lock_state {</div><div class='ctx'>  * leak from one inode to another.</div><div class='ctx'>  */</div><div class='ctx'> struct afs_vnode {</div><div class='del'>-	struct inode		vfs_inode;	/* the VFS's inode record */</div><div class='del'>-</div><div class='add'>+	struct netfs_inode	netfs;		/* Netfslib context and vfs inode */</div><div class='ctx'> 	struct afs_volume	*volume;	/* volume on which vnode resides */</div><div class='ctx'> 	struct afs_fid		fid;		/* the file identifier for this inode */</div><div class='ctx'> 	struct afs_file_status	status;		/* AFS status info for this file */</div><div class='ctx'> 	afs_dataversion_t	invalid_before;	/* Child dentries are invalid before this */</div><div class='del'>-#ifdef CONFIG_AFS_FSCACHE</div><div class='del'>-	struct fscache_cookie	*cache;		/* caching cookie */</div><div class='del'>-#endif</div><div class='ctx'> 	struct afs_permits __rcu *permit_cache;	/* cache of permits so far obtained */</div><div class='del'>-	struct mutex		io_lock;	/* Lock for serialising I/O on this mutex */</div><div class='add'>+	struct list_head	io_lock_waiters; /* Threads waiting for the I/O lock */</div><div class='ctx'> 	struct rw_semaphore	validate_lock;	/* lock for validating this vnode */</div><div class='ctx'> 	struct rw_semaphore	rmdir_lock;	/* Lock for rmdir vs sillyrename */</div><div class='ctx'> 	struct key		*silly_key;	/* Silly rename key */</div><div class='ctx'> 	spinlock_t		wb_lock;	/* lock for wb_keys */</div><div class='ctx'> 	spinlock_t		lock;		/* waitqueue/flags lock */</div><div class='ctx'> 	unsigned long		flags;</div><div class='del'>-#define AFS_VNODE_CB_PROMISED	0		/* Set if vnode has a callback promise */</div><div class='add'>+#define AFS_VNODE_IO_LOCK	0		/* Set if the I/O serialisation lock is held */</div><div class='ctx'> #define AFS_VNODE_UNSET		1		/* set if vnode attributes not yet set */</div><div class='ctx'> #define AFS_VNODE_DIR_VALID	2		/* Set if dir contents are valid */</div><div class='ctx'> #define AFS_VNODE_ZAP_DATA	3		/* set if vnode's data should be invalidated */</div><div class='ctx'> #define AFS_VNODE_DELETED	4		/* set if vnode deleted on server */</div><div class='ctx'> #define AFS_VNODE_MOUNTPOINT	5		/* set if vnode is a mountpoint symlink */</div><div class='del'>-#define AFS_VNODE_AUTOCELL	6		/* set if Vnode is an auto mount point */</div><div class='ctx'> #define AFS_VNODE_PSEUDODIR	7 		/* set if Vnode is a pseudo directory */</div><div class='ctx'> #define AFS_VNODE_NEW_CONTENT	8		/* Set if file has new content (create/trunc-0) */</div><div class='ctx'> #define AFS_VNODE_SILLY_DELETED	9		/* Set if file has been silly-deleted */</div><div class='ctx'> #define AFS_VNODE_MODIFYING	10		/* Set if we're performing a modification op */</div><div class='add'>+#define AFS_VNODE_DIR_READ	11		/* Set if we've read a dir's contents */</div><div class='ctx'> </div><div class='add'>+	struct folio_queue	*directory;	/* Directory contents */</div><div class='ctx'> 	struct list_head	wb_keys;	/* List of keys available for writeback */</div><div class='ctx'> 	struct list_head	pending_locks;	/* locks waiting to be granted */</div><div class='ctx'> 	struct list_head	granted_locks;	/* locks granted on this file */</div><div class='hunk'>@@ -660,30 +719,42 @@ struct afs_vnode {</div><div class='ctx'> 	ktime_t			locked_at;	/* Time at which lock obtained */</div><div class='ctx'> 	enum afs_lock_state	lock_state : 8;</div><div class='ctx'> 	afs_lock_type_t		lock_type : 8;</div><div class='add'>+	unsigned int		directory_size;	/* Amount of space in -&gt;directory */</div><div class='ctx'> </div><div class='ctx'> 	/* outstanding callback notification on this file */</div><div class='ctx'> 	struct work_struct	cb_work;	/* Work for mmap'd files */</div><div class='ctx'> 	struct list_head	cb_mmap_link;	/* Link in cell-&gt;fs_open_mmaps */</div><div class='ctx'> 	void			*cb_server;	/* Server with callback/filelock */</div><div class='ctx'> 	atomic_t		cb_nr_mmap;	/* Number of mmaps */</div><div class='del'>-	unsigned int		cb_fs_s_break;	/* Mass server break counter (cell-&gt;fs_s_break) */</div><div class='del'>-	unsigned int		cb_s_break;	/* Mass break counter on -&gt;server */</div><div class='del'>-	unsigned int		cb_v_break;	/* Mass break counter on -&gt;volume */</div><div class='add'>+	unsigned int		cb_ro_snapshot;	/* RO volume release counter on -&gt;volume */</div><div class='add'>+	unsigned int		cb_scrub;	/* Scrub counter on -&gt;volume */</div><div class='ctx'> 	unsigned int		cb_break;	/* Break counter on vnode */</div><div class='add'>+	unsigned int		cb_v_check;	/* Break check counter on -&gt;volume */</div><div class='ctx'> 	seqlock_t		cb_lock;	/* Lock for -&gt;cb_server, -&gt;status, -&gt;cb_*break */</div><div class='ctx'> </div><div class='del'>-	time64_t		cb_expires_at;	/* time at which callback expires */</div><div class='add'>+	atomic64_t		cb_expires_at;	/* time at which callback expires */</div><div class='add'>+#define AFS_NO_CB_PROMISE TIME64_MIN</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static inline struct fscache_cookie *afs_vnode_cache(struct afs_vnode *vnode)</div><div class='ctx'> {</div><div class='ctx'> #ifdef CONFIG_AFS_FSCACHE</div><div class='del'>-	return vnode-&gt;cache;</div><div class='add'>+	return netfs_i_cookie(&amp;vnode-&gt;netfs);</div><div class='ctx'> #else</div><div class='ctx'> 	return NULL;</div><div class='ctx'> #endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline void afs_vnode_set_cache(struct afs_vnode *vnode,</div><div class='add'>+				       struct fscache_cookie *cookie)</div><div class='add'>+{</div><div class='add'>+#ifdef CONFIG_AFS_FSCACHE</div><div class='add'>+	vnode-&gt;netfs.cache = cookie;</div><div class='add'>+	if (cookie)</div><div class='add'>+		mapping_set_release_always(vnode-&gt;netfs.inode.i_mapping);</div><div class='add'>+#endif</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * cached security record for one user's attempt to access a vnode</div><div class='ctx'>  */</div><div class='hunk'>@@ -703,47 +774,56 @@ struct afs_permits {</div><div class='ctx'> 	refcount_t		usage;</div><div class='ctx'> 	unsigned short		nr_permits;	/* Number of records */</div><div class='ctx'> 	bool			invalidated;	/* Invalidated due to key change */</div><div class='del'>-	struct afs_permit	permits[];	/* List of permits sorted by key pointer */</div><div class='add'>+	struct afs_permit	permits[] __counted_by(nr_permits);	/* List of permits sorted by key pointer */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Error prioritisation and accumulation.</div><div class='ctx'>  */</div><div class='ctx'> struct afs_error {</div><div class='del'>-	short	error;			/* Accumulated error */</div><div class='add'>+	s32	abort_code;		/* Cumulative abort code */</div><div class='add'>+	short	error;			/* Cumulative error */</div><div class='ctx'> 	bool	responded;		/* T if server responded */</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Cursor for iterating over a server's address list.</div><div class='del'>- */</div><div class='del'>-struct afs_addr_cursor {</div><div class='del'>-	struct afs_addr_list	*alist;		/* Current address list (pins ref) */</div><div class='del'>-	unsigned long		tried;		/* Tried addresses */</div><div class='del'>-	signed char		index;		/* Current address */</div><div class='del'>-	bool			responded;	/* T if the current address responded */</div><div class='del'>-	unsigned short		nr_iterations;	/* Number of address iterations */</div><div class='del'>-	short			error;</div><div class='del'>-	u32			abort_code;</div><div class='add'>+	bool	aborted;		/* T if -&gt;error is from an abort */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Cursor for iterating over a set of volume location servers.</div><div class='ctx'>  */</div><div class='ctx'> struct afs_vl_cursor {</div><div class='del'>-	struct afs_addr_cursor	ac;</div><div class='ctx'> 	struct afs_cell		*cell;		/* The cell we're querying */</div><div class='ctx'> 	struct afs_vlserver_list *server_list;	/* Current server list (pins ref) */</div><div class='ctx'> 	struct afs_vlserver	*server;	/* Server on which this resides */</div><div class='add'>+	struct afs_addr_list	*alist;		/* Current address list (pins ref) */</div><div class='ctx'> 	struct key		*key;		/* Key for the server */</div><div class='del'>-	unsigned long		untried;	/* Bitmask of untried servers */</div><div class='del'>-	short			index;		/* Current server */</div><div class='del'>-	short			error;</div><div class='add'>+	unsigned long		untried_servers; /* Bitmask of untried servers */</div><div class='add'>+	unsigned long		addr_tried;	/* Tried addresses */</div><div class='add'>+	struct afs_error	cumul_error;	/* Cumulative error */</div><div class='add'>+	unsigned int		debug_id;</div><div class='add'>+	s32			call_abort_code;</div><div class='add'>+	short			call_error;	/* Error from single call */</div><div class='add'>+	short			server_index;	/* Current server */</div><div class='add'>+	signed char		addr_index;	/* Current address */</div><div class='ctx'> 	unsigned short		flags;</div><div class='ctx'> #define AFS_VL_CURSOR_STOP	0x0001		/* Set to cease iteration */</div><div class='ctx'> #define AFS_VL_CURSOR_RETRY	0x0002		/* Set to do a retry */</div><div class='ctx'> #define AFS_VL_CURSOR_RETRIED	0x0004		/* Set if started a retry */</div><div class='del'>-	unsigned short		nr_iterations;	/* Number of server iterations */</div><div class='add'>+	short			nr_iterations;	/* Number of server iterations */</div><div class='add'>+	bool			call_responded;	/* T if the current address responded */</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Fileserver state tracking for an operation.  An array of these is kept,</div><div class='add'>+ * indexed by server index.</div><div class='add'>+ */</div><div class='add'>+struct afs_server_state {</div><div class='add'>+	/* Tracking of fileserver probe state.  Other operations may interfere</div><div class='add'>+	 * by probing a fileserver when accessing other volumes.</div><div class='add'>+	 */</div><div class='add'>+	unsigned int		probe_seq;</div><div class='add'>+	unsigned long		untried_addrs;	/* Addresses we haven't tried yet */</div><div class='add'>+	struct wait_queue_entry	probe_waiter;</div><div class='add'>+	struct afs_endpoint_state *endpoint_state; /* Endpoint state being monitored */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -764,7 +844,7 @@ struct afs_vnode_param {</div><div class='ctx'> 	struct afs_fid		fid;		/* Fid to access */</div><div class='ctx'> 	struct afs_status_cb	scb;		/* Returned status and callback promise */</div><div class='ctx'> 	afs_dataversion_t	dv_before;	/* Data version before the call */</div><div class='del'>-	unsigned int		cb_break_before; /* cb_break + cb_s_break before the call */</div><div class='add'>+	unsigned int		cb_break_before; /* cb_break before the call */</div><div class='ctx'> 	u8			dv_delta;	/* Expected change in data version */</div><div class='ctx'> 	bool			put_vnode:1;	/* T if we have a ref on the vnode */</div><div class='ctx'> 	bool			need_io_lock:1;	/* T if we need the I/O lock on this */</div><div class='hunk'>@@ -789,17 +869,17 @@ struct afs_operation {</div><div class='ctx'> 	struct afs_volume	*volume;	/* Volume being accessed */</div><div class='ctx'> 	struct afs_vnode_param	file[2];</div><div class='ctx'> 	struct afs_vnode_param	*more_files;</div><div class='del'>-	struct afs_volsync	volsync;</div><div class='add'>+	struct afs_volsync	pre_volsync;	/* Volsync before op */</div><div class='add'>+	struct afs_volsync	volsync;	/* Volsync returned by op */</div><div class='ctx'> 	struct dentry		*dentry;	/* Dentry to be altered */</div><div class='ctx'> 	struct dentry		*dentry_2;	/* Second dentry to be altered */</div><div class='ctx'> 	struct timespec64	mtime;		/* Modification time to record */</div><div class='ctx'> 	struct timespec64	ctime;		/* Change time to set */</div><div class='add'>+	struct afs_error	cumul_error;	/* Cumulative error */</div><div class='ctx'> 	short			nr_files;	/* Number of entries in file[], more_files */</div><div class='del'>-	short			error;</div><div class='ctx'> 	unsigned int		debug_id;</div><div class='ctx'> </div><div class='ctx'> 	unsigned int		cb_v_break;	/* Volume break counter before op */</div><div class='del'>-	unsigned int		cb_s_break;	/* Server break counter before op */</div><div class='ctx'> </div><div class='ctx'> 	union {</div><div class='ctx'> 		struct {</div><div class='hunk'>@@ -814,12 +894,13 @@ struct afs_operation {</div><div class='ctx'> 			bool	need_rehash;</div><div class='ctx'> 		} unlink;</div><div class='ctx'> 		struct {</div><div class='del'>-			struct dentry *rehash;</div><div class='del'>-			struct dentry *tmp;</div><div class='del'>-			bool	new_negative;</div><div class='add'>+			struct dentry	*rehash;</div><div class='add'>+			struct dentry	*tmp;</div><div class='add'>+			unsigned int	rename_flags;</div><div class='add'>+			bool		new_negative;</div><div class='ctx'> 		} rename;</div><div class='ctx'> 		struct {</div><div class='del'>-			struct afs_read *req;</div><div class='add'>+			struct netfs_io_subrequest *subreq;</div><div class='ctx'> 		} fetch;</div><div class='ctx'> 		struct {</div><div class='ctx'> 			afs_lock_type_t type;</div><div class='hunk'>@@ -829,7 +910,6 @@ struct afs_operation {</div><div class='ctx'> 			loff_t	pos;</div><div class='ctx'> 			loff_t	size;</div><div class='ctx'> 			loff_t	i_size;</div><div class='del'>-			bool	laundering;	/* Laundering page, PG_writeback not set */</div><div class='ctx'> 		} store;</div><div class='ctx'> 		struct {</div><div class='ctx'> 			struct iattr	*attr;</div><div class='hunk'>@@ -844,13 +924,19 @@ struct afs_operation {</div><div class='ctx'> 	};</div><div class='ctx'> </div><div class='ctx'> 	/* Fileserver iteration state */</div><div class='del'>-	struct afs_addr_cursor	ac;</div><div class='ctx'> 	struct afs_server_list	*server_list;	/* Current server list (pins ref) */</div><div class='ctx'> 	struct afs_server	*server;	/* Server we're using (ref pinned by server_list) */</div><div class='add'>+	struct afs_endpoint_state *estate;	/* Current endpoint state (doesn't pin ref) */</div><div class='add'>+	struct afs_server_state	*server_states;	/* States of the servers involved */</div><div class='ctx'> 	struct afs_call		*call;</div><div class='del'>-	unsigned long		untried;	/* Bitmask of untried servers */</div><div class='del'>-	short			index;		/* Current server */</div><div class='del'>-	unsigned short		nr_iterations;	/* Number of server iterations */</div><div class='add'>+	unsigned long		untried_servers; /* Bitmask of untried servers */</div><div class='add'>+	unsigned long		addr_tried;	/* Tried addresses */</div><div class='add'>+	s32			call_abort_code; /* Abort code from single call */</div><div class='add'>+	short			call_error;	/* Error from single call */</div><div class='add'>+	short			server_index;	/* Current server */</div><div class='add'>+	short			nr_iterations;	/* Number of server iterations */</div><div class='add'>+	signed char		addr_index;	/* Current address */</div><div class='add'>+	bool			call_responded;	/* T if the current address responded */</div><div class='ctx'> </div><div class='ctx'> 	unsigned int		flags;</div><div class='ctx'> #define AFS_OPERATION_STOP		0x0001	/* Set to cease iteration */</div><div class='hunk'>@@ -866,70 +952,45 @@ struct afs_operation {</div><div class='ctx'> #define AFS_OPERATION_TRIED_ALL		0x0400	/* Set if we've tried all the fileservers */</div><div class='ctx'> #define AFS_OPERATION_RETRY_SERVER	0x0800	/* Set if we should retry the current server */</div><div class='ctx'> #define AFS_OPERATION_DIR_CONFLICT	0x1000	/* Set if we detected a 3rd-party dir change */</div><div class='add'>+#define AFS_OPERATION_ASYNC		0x2000	/* Set if should run asynchronously */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Cache auxiliary data.</div><div class='ctx'>  */</div><div class='ctx'> struct afs_vnode_cache_aux {</div><div class='del'>-	u64			data_version;</div><div class='add'>+	__be64			data_version;</div><div class='ctx'> } __packed;</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * We use folio-&gt;private to hold the amount of the folio that we've written to,</div><div class='del'>- * splitting the field into two parts.  However, we need to represent a range</div><div class='del'>- * 0...FOLIO_SIZE, so we reduce the resolution if the size of the folio</div><div class='del'>- * exceeds what we can encode.</div><div class='del'>- */</div><div class='del'>-#ifdef CONFIG_64BIT</div><div class='del'>-#define __AFS_FOLIO_PRIV_MASK		0x7fffffffUL</div><div class='del'>-#define __AFS_FOLIO_PRIV_SHIFT		32</div><div class='del'>-#define __AFS_FOLIO_PRIV_MMAPPED	0x80000000UL</div><div class='del'>-#else</div><div class='del'>-#define __AFS_FOLIO_PRIV_MASK		0x7fffUL</div><div class='del'>-#define __AFS_FOLIO_PRIV_SHIFT		16</div><div class='del'>-#define __AFS_FOLIO_PRIV_MMAPPED	0x8000UL</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-static inline unsigned int afs_folio_dirty_resolution(struct folio *folio)</div><div class='del'>-{</div><div class='del'>-	int shift = folio_shift(folio) - (__AFS_FOLIO_PRIV_SHIFT - 1);</div><div class='del'>-	return (shift &gt; 0) ? shift : 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline size_t afs_folio_dirty_from(struct folio *folio, unsigned long priv)</div><div class='add'>+static inline void afs_set_cache_aux(struct afs_vnode *vnode,</div><div class='add'>+				     struct afs_vnode_cache_aux *aux)</div><div class='ctx'> {</div><div class='del'>-	unsigned long x = priv &amp; __AFS_FOLIO_PRIV_MASK;</div><div class='del'>-</div><div class='del'>-	/* The lower bound is inclusive */</div><div class='del'>-	return x &lt;&lt; afs_folio_dirty_resolution(folio);</div><div class='add'>+	aux-&gt;data_version = cpu_to_be64(vnode-&gt;status.data_version);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline size_t afs_folio_dirty_to(struct folio *folio, unsigned long priv)</div><div class='add'>+static inline void afs_invalidate_cache(struct afs_vnode *vnode, unsigned int flags)</div><div class='ctx'> {</div><div class='del'>-	unsigned long x = (priv &gt;&gt; __AFS_FOLIO_PRIV_SHIFT) &amp; __AFS_FOLIO_PRIV_MASK;</div><div class='add'>+	struct afs_vnode_cache_aux aux;</div><div class='ctx'> </div><div class='del'>-	/* The upper bound is immediately beyond the region */</div><div class='del'>-	return (x + 1) &lt;&lt; afs_folio_dirty_resolution(folio);</div><div class='add'>+	afs_set_cache_aux(vnode, &amp;aux);</div><div class='add'>+	fscache_invalidate(afs_vnode_cache(vnode), &amp;aux,</div><div class='add'>+			   i_size_read(&amp;vnode-&gt;netfs.inode), flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline unsigned long afs_folio_dirty(struct folio *folio, size_t from, size_t to)</div><div class='del'>-{</div><div class='del'>-	unsigned int res = afs_folio_dirty_resolution(folio);</div><div class='del'>-	from &gt;&gt;= res;</div><div class='del'>-	to = (to - 1) &gt;&gt; res;</div><div class='del'>-	return (to &lt;&lt; __AFS_FOLIO_PRIV_SHIFT) | from;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline unsigned long afs_folio_dirty_mmapped(unsigned long priv)</div><div class='del'>-{</div><div class='del'>-	return priv | __AFS_FOLIO_PRIV_MMAPPED;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline bool afs_is_folio_dirty_mmapped(unsigned long priv)</div><div class='del'>-{</div><div class='del'>-	return priv &amp; __AFS_FOLIO_PRIV_MMAPPED;</div><div class='del'>-}</div><div class='add'>+/*</div><div class='add'>+ * Directory iteration management.</div><div class='add'>+ */</div><div class='add'>+struct afs_dir_iter {</div><div class='add'>+	struct afs_vnode	*dvnode;</div><div class='add'>+	union afs_xdr_dir_block *block;</div><div class='add'>+	struct folio_queue	*fq;</div><div class='add'>+	unsigned int		fpos;</div><div class='add'>+	int			fq_slot;</div><div class='add'>+	unsigned int		loop_check;</div><div class='add'>+	u8			nr_slots;</div><div class='add'>+	u8			bucket;</div><div class='add'>+	unsigned int		prev_entry;</div><div class='add'>+};</div><div class='ctx'> </div><div class='ctx'> #include &lt;trace/events/afs.h&gt;</div><div class='ctx'> </div><div class='hunk'>@@ -937,45 +998,35 @@ static inline bool afs_is_folio_dirty_mmapped(unsigned long priv)</div><div class='ctx'> /*</div><div class='ctx'>  * addr_list.c</div><div class='ctx'>  */</div><div class='del'>-static inline struct afs_addr_list *afs_get_addrlist(struct afs_addr_list *alist)</div><div class='del'>-{</div><div class='del'>-	if (alist)</div><div class='del'>-		refcount_inc(&amp;alist-&gt;usage);</div><div class='del'>-	return alist;</div><div class='del'>-}</div><div class='del'>-extern struct afs_addr_list *afs_alloc_addrlist(unsigned int,</div><div class='del'>-						unsigned short,</div><div class='del'>-						unsigned short);</div><div class='del'>-extern void afs_put_addrlist(struct afs_addr_list *);</div><div class='add'>+struct afs_addr_list *afs_get_addrlist(struct afs_addr_list *alist, enum afs_alist_trace reason);</div><div class='add'>+extern struct afs_addr_list *afs_alloc_addrlist(unsigned int nr);</div><div class='add'>+extern void afs_put_addrlist(struct afs_addr_list *alist, enum afs_alist_trace reason);</div><div class='ctx'> extern struct afs_vlserver_list *afs_parse_text_addrs(struct afs_net *,</div><div class='ctx'> 						      const char *, size_t, char,</div><div class='ctx'> 						      unsigned short, unsigned short);</div><div class='add'>+bool afs_addr_list_same(const struct afs_addr_list *a,</div><div class='add'>+			const struct afs_addr_list *b);</div><div class='ctx'> extern struct afs_vlserver_list *afs_dns_query(struct afs_cell *, time64_t *);</div><div class='del'>-extern bool afs_iterate_addresses(struct afs_addr_cursor *);</div><div class='del'>-extern int afs_end_cursor(struct afs_addr_cursor *);</div><div class='ctx'> </div><div class='del'>-extern void afs_merge_fs_addr4(struct afs_addr_list *, __be32, u16);</div><div class='del'>-extern void afs_merge_fs_addr6(struct afs_addr_list *, __be32 *, u16);</div><div class='add'>+extern int afs_merge_fs_addr4(struct afs_net *net, struct afs_addr_list *addr,</div><div class='add'>+			      __be32 xdr, u16 port);</div><div class='add'>+extern int afs_merge_fs_addr6(struct afs_net *net, struct afs_addr_list *addr,</div><div class='add'>+			      __be32 *xdr, u16 port);</div><div class='add'>+void afs_set_peer_appdata(struct afs_server *server,</div><div class='add'>+			  struct afs_addr_list *old_alist,</div><div class='add'>+			  struct afs_addr_list *new_alist);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * cache.c</div><div class='add'>+ * addr_prefs.c</div><div class='ctx'>  */</div><div class='del'>-#ifdef CONFIG_AFS_FSCACHE</div><div class='del'>-extern struct fscache_netfs afs_cache_netfs;</div><div class='del'>-extern struct fscache_cookie_def afs_cell_cache_index_def;</div><div class='del'>-extern struct fscache_cookie_def afs_volume_cache_index_def;</div><div class='del'>-extern struct fscache_cookie_def afs_vnode_cache_index_def;</div><div class='del'>-#else</div><div class='del'>-#define afs_cell_cache_index_def	(*(struct fscache_cookie_def *) NULL)</div><div class='del'>-#define afs_volume_cache_index_def	(*(struct fscache_cookie_def *) NULL)</div><div class='del'>-#define afs_vnode_cache_index_def	(*(struct fscache_cookie_def *) NULL)</div><div class='del'>-#endif</div><div class='add'>+int afs_proc_addr_prefs_write(struct file *file, char *buf, size_t size);</div><div class='add'>+void afs_get_address_preferences_rcu(struct afs_net *net, struct afs_addr_list *alist);</div><div class='add'>+void afs_get_address_preferences(struct afs_net *net, struct afs_addr_list *alist);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * callback.c</div><div class='ctx'>  */</div><div class='ctx'> extern void afs_invalidate_mmap_work(struct work_struct *);</div><div class='del'>-extern void afs_server_init_callback_work(struct work_struct *work);</div><div class='ctx'> extern void afs_init_callback_state(struct afs_server *);</div><div class='ctx'> extern void __afs_break_callback(struct afs_vnode *, enum afs_cb_break_reason);</div><div class='ctx'> extern void afs_break_callback(struct afs_vnode *, enum afs_cb_break_reason);</div><div class='hunk'>@@ -983,13 +1034,15 @@ extern void afs_break_callbacks(struct afs_server *, size_t, struct afs_callback</div><div class='ctx'> </div><div class='ctx'> static inline unsigned int afs_calc_vnode_cb_break(struct afs_vnode *vnode)</div><div class='ctx'> {</div><div class='del'>-	return vnode-&gt;cb_break + vnode-&gt;cb_v_break;</div><div class='add'>+	return vnode-&gt;cb_break + vnode-&gt;cb_ro_snapshot + vnode-&gt;cb_scrub;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline bool afs_cb_is_broken(unsigned int cb_break,</div><div class='ctx'> 				    const struct afs_vnode *vnode)</div><div class='ctx'> {</div><div class='del'>-	return cb_break != (vnode-&gt;cb_break + vnode-&gt;volume-&gt;cb_v_break);</div><div class='add'>+	return cb_break != (vnode-&gt;cb_break +</div><div class='add'>+			    atomic_read(&amp;vnode-&gt;volume-&gt;cb_ro_snapshot) +</div><div class='add'>+			    atomic_read(&amp;vnode-&gt;volume-&gt;cb_scrub));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -998,16 +1051,26 @@ static inline bool afs_cb_is_broken(unsigned int cb_break,</div><div class='ctx'> extern int afs_cell_init(struct afs_net *, const char *);</div><div class='ctx'> extern struct afs_cell *afs_find_cell(struct afs_net *, const char *, unsigned,</div><div class='ctx'> 				      enum afs_cell_trace);</div><div class='del'>-extern struct afs_cell *afs_lookup_cell(struct afs_net *, const char *, unsigned,</div><div class='del'>-					const char *, bool);</div><div class='add'>+enum afs_lookup_cell_for {</div><div class='add'>+	AFS_LOOKUP_CELL_DYNROOT,</div><div class='add'>+	AFS_LOOKUP_CELL_MOUNTPOINT,</div><div class='add'>+	AFS_LOOKUP_CELL_DIRECT_MOUNT,</div><div class='add'>+	AFS_LOOKUP_CELL_PRELOAD,</div><div class='add'>+	AFS_LOOKUP_CELL_ROOTCELL,</div><div class='add'>+	AFS_LOOKUP_CELL_ALIAS_CHECK,</div><div class='add'>+};</div><div class='add'>+struct afs_cell *afs_lookup_cell(struct afs_net *net,</div><div class='add'>+				 const char *name, unsigned int namesz,</div><div class='add'>+				 const char *vllist,</div><div class='add'>+				 enum afs_lookup_cell_for reason,</div><div class='add'>+				 enum afs_cell_trace trace);</div><div class='ctx'> extern struct afs_cell *afs_use_cell(struct afs_cell *, enum afs_cell_trace);</div><div class='del'>-extern void afs_unuse_cell(struct afs_net *, struct afs_cell *, enum afs_cell_trace);</div><div class='add'>+void afs_unuse_cell(struct afs_cell *cell, enum afs_cell_trace reason);</div><div class='ctx'> extern struct afs_cell *afs_get_cell(struct afs_cell *, enum afs_cell_trace);</div><div class='ctx'> extern void afs_see_cell(struct afs_cell *, enum afs_cell_trace);</div><div class='ctx'> extern void afs_put_cell(struct afs_cell *, enum afs_cell_trace);</div><div class='ctx'> extern void afs_queue_cell(struct afs_cell *, enum afs_cell_trace);</div><div class='del'>-extern void afs_manage_cells(struct work_struct *);</div><div class='del'>-extern void afs_cells_timer(struct timer_list *);</div><div class='add'>+void afs_set_cell_timer(struct afs_cell *cell, unsigned int delay_secs);</div><div class='ctx'> extern void __net_exit afs_cell_purge(struct afs_net *);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1016,6 +1079,19 @@ extern void __net_exit afs_cell_purge(struct afs_net *);</div><div class='ctx'> extern bool afs_cm_incoming_call(struct afs_call *);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * cm_security.c</div><div class='add'>+ */</div><div class='add'>+void afs_process_oob_queue(struct work_struct *work);</div><div class='add'>+#ifdef CONFIG_RXGK</div><div class='add'>+int afs_create_token_key(struct afs_net *net, struct socket *socket);</div><div class='add'>+#else</div><div class='add'>+static inline int afs_create_token_key(struct afs_net *net, struct socket *socket)</div><div class='add'>+{</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * dir.c</div><div class='ctx'>  */</div><div class='ctx'> extern const struct file_operations afs_dir_file_operations;</div><div class='hunk'>@@ -1023,15 +1099,34 @@ extern const struct inode_operations afs_dir_inode_operations;</div><div class='ctx'> extern const struct address_space_operations afs_dir_aops;</div><div class='ctx'> extern const struct dentry_operations afs_fs_dentry_operations;</div><div class='ctx'> </div><div class='add'>+ssize_t afs_read_single(struct afs_vnode *dvnode, struct file *file);</div><div class='add'>+ssize_t afs_read_dir(struct afs_vnode *dvnode, struct file *file)</div><div class='add'>+	__acquires(&amp;dvnode-&gt;validate_lock);</div><div class='ctx'> extern void afs_d_release(struct dentry *);</div><div class='ctx'> extern void afs_check_for_remote_deletion(struct afs_operation *);</div><div class='add'>+int afs_single_writepages(struct address_space *mapping,</div><div class='add'>+			  struct writeback_control *wbc);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * dir_edit.c</div><div class='ctx'>  */</div><div class='del'>-extern void afs_edit_dir_add(struct afs_vnode *, struct qstr *, struct afs_fid *,</div><div class='add'>+extern void afs_edit_dir_add(struct afs_vnode *, const struct qstr *, struct afs_fid *,</div><div class='ctx'> 			     enum afs_edit_dir_reason);</div><div class='del'>-extern void afs_edit_dir_remove(struct afs_vnode *, struct qstr *, enum afs_edit_dir_reason);</div><div class='add'>+extern void afs_edit_dir_remove(struct afs_vnode *, const struct qstr *, enum afs_edit_dir_reason);</div><div class='add'>+void afs_edit_dir_update(struct afs_vnode *vnode, const struct qstr *name,</div><div class='add'>+			 struct afs_vnode *new_dvnode, enum afs_edit_dir_reason why);</div><div class='add'>+void afs_mkdir_init_dir(struct afs_vnode *dvnode, struct afs_vnode *parent_vnode);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * dir_search.c</div><div class='add'>+ */</div><div class='add'>+unsigned int afs_dir_hash_name(const struct qstr *name);</div><div class='add'>+bool afs_dir_init_iter(struct afs_dir_iter *iter, const struct qstr *name);</div><div class='add'>+union afs_xdr_dir_block *afs_dir_find_block(struct afs_dir_iter *iter, size_t block);</div><div class='add'>+int afs_dir_search_bucket(struct afs_dir_iter *iter, const struct qstr *name,</div><div class='add'>+			  struct afs_fid *_fid);</div><div class='add'>+int afs_dir_search(struct afs_vnode *dvnode, const struct qstr *name,</div><div class='add'>+		   struct afs_fid *_fid, afs_dataversion_t *_dir_version);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * dir_silly.c</div><div class='hunk'>@@ -1046,34 +1141,23 @@ extern int afs_silly_iput(struct dentry *, struct inode *);</div><div class='ctx'> extern const struct inode_operations afs_dynroot_inode_operations;</div><div class='ctx'> extern const struct dentry_operations afs_dynroot_dentry_operations;</div><div class='ctx'> </div><div class='del'>-extern struct inode *afs_try_auto_mntpt(struct dentry *, struct inode *);</div><div class='del'>-extern int afs_dynroot_mkdir(struct afs_net *, struct afs_cell *);</div><div class='del'>-extern void afs_dynroot_rmdir(struct afs_net *, struct afs_cell *);</div><div class='del'>-extern int afs_dynroot_populate(struct super_block *);</div><div class='del'>-extern void afs_dynroot_depopulate(struct super_block *);</div><div class='add'>+struct inode *afs_dynroot_iget_root(struct super_block *sb);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * file.c</div><div class='ctx'>  */</div><div class='ctx'> extern const struct address_space_operations afs_file_aops;</div><div class='del'>-extern const struct address_space_operations afs_symlink_aops;</div><div class='ctx'> extern const struct inode_operations afs_file_inode_operations;</div><div class='ctx'> extern const struct file_operations afs_file_operations;</div><div class='del'>-extern const struct netfs_read_request_ops afs_req_ops;</div><div class='add'>+extern const struct afs_operation_ops afs_fetch_data_operation;</div><div class='add'>+extern const struct netfs_request_ops afs_req_ops;</div><div class='ctx'> </div><div class='ctx'> extern int afs_cache_wb_key(struct afs_vnode *, struct afs_file *);</div><div class='ctx'> extern void afs_put_wb_key(struct afs_wb_key *);</div><div class='ctx'> extern int afs_open(struct inode *, struct file *);</div><div class='ctx'> extern int afs_release(struct inode *, struct file *);</div><div class='del'>-extern int afs_fetch_data(struct afs_vnode *, struct afs_read *);</div><div class='del'>-extern struct afs_read *afs_alloc_read(gfp_t);</div><div class='del'>-extern void afs_put_read(struct afs_read *);</div><div class='del'>-</div><div class='del'>-static inline struct afs_read *afs_get_read(struct afs_read *req)</div><div class='del'>-{</div><div class='del'>-	refcount_inc(&amp;req-&gt;usage);</div><div class='del'>-	return req;</div><div class='del'>-}</div><div class='add'>+void afs_fetch_data_async_rx(struct work_struct *work);</div><div class='add'>+void afs_fetch_data_immediate_cancel(struct afs_call *call);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * flock.c</div><div class='hunk'>@@ -1104,15 +1188,16 @@ extern void afs_fs_get_volume_status(struct afs_operation *);</div><div class='ctx'> extern void afs_fs_set_lock(struct afs_operation *);</div><div class='ctx'> extern void afs_fs_extend_lock(struct afs_operation *);</div><div class='ctx'> extern void afs_fs_release_lock(struct afs_operation *);</div><div class='del'>-extern int afs_fs_give_up_all_callbacks(struct afs_net *, struct afs_server *,</div><div class='del'>-					struct afs_addr_cursor *, struct key *);</div><div class='del'>-extern bool afs_fs_get_capabilities(struct afs_net *, struct afs_server *,</div><div class='del'>-				    struct afs_addr_cursor *, struct key *);</div><div class='add'>+int afs_fs_give_up_all_callbacks(struct afs_net *net, struct afs_server *server,</div><div class='add'>+				 struct afs_address *addr, struct key *key);</div><div class='add'>+bool afs_fs_get_capabilities(struct afs_net *net, struct afs_server *server,</div><div class='add'>+			     struct afs_endpoint_state *estate, unsigned int addr_index,</div><div class='add'>+			     struct key *key);</div><div class='ctx'> extern void afs_fs_inline_bulk_status(struct afs_operation *);</div><div class='ctx'> </div><div class='ctx'> struct afs_acl {</div><div class='ctx'> 	u32	size;</div><div class='del'>-	u8	data[];</div><div class='add'>+	u8	data[] __counted_by(size);</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> extern void afs_fs_fetch_acl(struct afs_operation *);</div><div class='hunk'>@@ -1124,14 +1209,10 @@ extern void afs_fs_store_acl(struct afs_operation *);</div><div class='ctx'> extern struct afs_operation *afs_alloc_operation(struct key *, struct afs_volume *);</div><div class='ctx'> extern int afs_put_operation(struct afs_operation *);</div><div class='ctx'> extern bool afs_begin_vnode_operation(struct afs_operation *);</div><div class='add'>+extern void afs_end_vnode_operation(struct afs_operation *op);</div><div class='ctx'> extern void afs_wait_for_operation(struct afs_operation *);</div><div class='ctx'> extern int afs_do_sync_operation(struct afs_operation *);</div><div class='ctx'> </div><div class='del'>-static inline void afs_op_nomem(struct afs_operation *op)</div><div class='del'>-{</div><div class='del'>-	op-&gt;error = -ENOMEM;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static inline void afs_op_set_vnode(struct afs_operation *op, unsigned int n,</div><div class='ctx'> 				    struct afs_vnode *vnode)</div><div class='ctx'> {</div><div class='hunk'>@@ -1148,12 +1229,17 @@ static inline void afs_op_set_fid(struct afs_operation *op, unsigned int n,</div><div class='ctx'> /*</div><div class='ctx'>  * fs_probe.c</div><div class='ctx'>  */</div><div class='add'>+struct afs_endpoint_state *afs_get_endpoint_state(struct afs_endpoint_state *estate,</div><div class='add'>+						  enum afs_estate_trace where);</div><div class='add'>+void afs_put_endpoint_state(struct afs_endpoint_state *estate, enum afs_estate_trace where);</div><div class='ctx'> extern void afs_fileserver_probe_result(struct afs_call *);</div><div class='del'>-extern void afs_fs_probe_fileserver(struct afs_net *, struct afs_server *, struct key *, bool);</div><div class='del'>-extern int afs_wait_for_fs_probes(struct afs_server_list *, unsigned long);</div><div class='add'>+int afs_fs_probe_fileserver(struct afs_net *net, struct afs_server *server,</div><div class='add'>+			    struct afs_addr_list *new_alist, struct key *key);</div><div class='add'>+int afs_wait_for_fs_probes(struct afs_operation *op, struct afs_server_state *states, bool intr);</div><div class='ctx'> extern void afs_probe_fileserver(struct afs_net *, struct afs_server *);</div><div class='ctx'> extern void afs_fs_probe_dispatcher(struct work_struct *);</div><div class='del'>-extern int afs_wait_for_one_fs_probe(struct afs_server *, bool);</div><div class='add'>+int afs_wait_for_one_fs_probe(struct afs_server *server, struct afs_endpoint_state *estate,</div><div class='add'>+			      unsigned long exclude, bool is_intr);</div><div class='ctx'> extern void afs_fs_probe_cleanup(struct afs_net *);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1161,17 +1247,18 @@ extern void afs_fs_probe_cleanup(struct afs_net *);</div><div class='ctx'>  */</div><div class='ctx'> extern const struct afs_operation_ops afs_fetch_status_operation;</div><div class='ctx'> </div><div class='add'>+void afs_init_new_symlink(struct afs_vnode *vnode, struct afs_operation *op);</div><div class='add'>+const char *afs_get_link(struct dentry *dentry, struct inode *inode,</div><div class='add'>+			 struct delayed_call *callback);</div><div class='add'>+int afs_readlink(struct dentry *dentry, char __user *buffer, int buflen);</div><div class='ctx'> extern void afs_vnode_commit_status(struct afs_operation *, struct afs_vnode_param *);</div><div class='ctx'> extern int afs_fetch_status(struct afs_vnode *, struct key *, bool, afs_access_t *);</div><div class='ctx'> extern int afs_ilookup5_test_by_fid(struct inode *, void *);</div><div class='del'>-extern struct inode *afs_iget_pseudo_dir(struct super_block *, bool);</div><div class='ctx'> extern struct inode *afs_iget(struct afs_operation *, struct afs_vnode_param *);</div><div class='ctx'> extern struct inode *afs_root_iget(struct super_block *, struct key *);</div><div class='del'>-extern bool afs_check_validity(struct afs_vnode *);</div><div class='del'>-extern int afs_validate(struct afs_vnode *, struct key *);</div><div class='del'>-extern int afs_getattr(struct user_namespace *mnt_userns, const struct path *,</div><div class='add'>+extern int afs_getattr(struct mnt_idmap *idmap, const struct path *,</div><div class='ctx'> 		       struct kstat *, u32, unsigned int);</div><div class='del'>-extern int afs_setattr(struct user_namespace *mnt_userns, struct dentry *, struct iattr *);</div><div class='add'>+extern int afs_setattr(struct mnt_idmap *idmap, struct dentry *, struct iattr *);</div><div class='ctx'> extern void afs_evict_inode(struct inode *);</div><div class='ctx'> extern int afs_drop_inode(struct inode *);</div><div class='ctx'> </div><div class='hunk'>@@ -1203,7 +1290,7 @@ static inline struct afs_net *afs_i2net(struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> static inline struct afs_net *afs_v2net(struct afs_vnode *vnode)</div><div class='ctx'> {</div><div class='del'>-	return afs_i2net(&amp;vnode-&gt;vfs_inode);</div><div class='add'>+	return afs_i2net(&amp;vnode-&gt;netfs.inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline struct afs_net *afs_sock2net(struct sock *sk)</div><div class='hunk'>@@ -1224,6 +1311,31 @@ static inline void __afs_stat(atomic_t *s)</div><div class='ctx'> extern int afs_abort_to_error(u32);</div><div class='ctx'> extern void afs_prioritise_error(struct afs_error *, int, u32);</div><div class='ctx'> </div><div class='add'>+static inline void afs_op_nomem(struct afs_operation *op)</div><div class='add'>+{</div><div class='add'>+	op-&gt;cumul_error.error = -ENOMEM;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int afs_op_error(const struct afs_operation *op)</div><div class='add'>+{</div><div class='add'>+	return op-&gt;cumul_error.error;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline s32 afs_op_abort_code(const struct afs_operation *op)</div><div class='add'>+{</div><div class='add'>+	return op-&gt;cumul_error.abort_code;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int afs_op_set_error(struct afs_operation *op, int error)</div><div class='add'>+{</div><div class='add'>+	return op-&gt;cumul_error.error = error;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void afs_op_accumulate_error(struct afs_operation *op, int error, s32 abort_code)</div><div class='add'>+{</div><div class='add'>+	afs_prioritise_error(&amp;op-&gt;cumul_error, error, abort_code);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * mntpt.c</div><div class='ctx'>  */</div><div class='hunk'>@@ -1254,6 +1366,7 @@ static inline void afs_put_sysnames(struct afs_sysnames *sysnames) {}</div><div class='ctx'> /*</div><div class='ctx'>  * rotate.c</div><div class='ctx'>  */</div><div class='add'>+void afs_clear_server_states(struct afs_operation *op);</div><div class='ctx'> extern bool afs_select_fileserver(struct afs_operation *);</div><div class='ctx'> extern void afs_dump_edestaddrreq(const struct afs_operation *);</div><div class='ctx'> </div><div class='hunk'>@@ -1266,8 +1379,10 @@ extern int __net_init afs_open_socket(struct afs_net *);</div><div class='ctx'> extern void __net_exit afs_close_socket(struct afs_net *);</div><div class='ctx'> extern void afs_charge_preallocation(struct work_struct *);</div><div class='ctx'> extern void afs_put_call(struct afs_call *);</div><div class='del'>-extern void afs_make_call(struct afs_addr_cursor *, struct afs_call *, gfp_t);</div><div class='del'>-extern long afs_wait_for_call_to_complete(struct afs_call *, struct afs_addr_cursor *);</div><div class='add'>+void afs_deferred_put_call(struct afs_call *call);</div><div class='add'>+void afs_make_call(struct afs_call *call, gfp_t gfp);</div><div class='add'>+void afs_deliver_to_call(struct afs_call *call);</div><div class='add'>+void afs_wait_for_call_to_complete(struct afs_call *call);</div><div class='ctx'> extern struct afs_call *afs_alloc_flat_call(struct afs_net *,</div><div class='ctx'> 					    const struct afs_call_type *,</div><div class='ctx'> 					    size_t, size_t);</div><div class='hunk'>@@ -1277,15 +1392,41 @@ extern void afs_send_simple_reply(struct afs_call *, const void *, size_t);</div><div class='ctx'> extern int afs_extract_data(struct afs_call *, bool);</div><div class='ctx'> extern int afs_protocol_error(struct afs_call *, enum afs_eproto_cause);</div><div class='ctx'> </div><div class='add'>+static inline struct afs_call *afs_get_call(struct afs_call *call,</div><div class='add'>+					    enum afs_call_trace why)</div><div class='add'>+{</div><div class='add'>+	int r;</div><div class='add'>+</div><div class='add'>+	__refcount_inc(&amp;call-&gt;ref, &amp;r);</div><div class='add'>+</div><div class='add'>+	trace_afs_call(call-&gt;debug_id, why, r + 1,</div><div class='add'>+		       atomic_read(&amp;call-&gt;net-&gt;nr_outstanding_calls),</div><div class='add'>+		       __builtin_return_address(0));</div><div class='add'>+	return call;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void afs_see_call(struct afs_call *call, enum afs_call_trace why)</div><div class='add'>+{</div><div class='add'>+	int r = refcount_read(&amp;call-&gt;ref);</div><div class='add'>+</div><div class='add'>+	trace_afs_call(call-&gt;debug_id, why, r,</div><div class='add'>+		       atomic_read(&amp;call-&gt;net-&gt;nr_outstanding_calls),</div><div class='add'>+		       __builtin_return_address(0));</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline void afs_make_op_call(struct afs_operation *op, struct afs_call *call,</div><div class='ctx'> 				    gfp_t gfp)</div><div class='ctx'> {</div><div class='del'>-	op-&gt;call = call;</div><div class='del'>-	op-&gt;type = call-&gt;type;</div><div class='del'>-	call-&gt;op = op;</div><div class='del'>-	call-&gt;key = op-&gt;key;</div><div class='del'>-	call-&gt;intr = !(op-&gt;flags &amp; AFS_OPERATION_UNINTR);</div><div class='del'>-	afs_make_call(&amp;op-&gt;ac, call, gfp);</div><div class='add'>+	struct afs_addr_list *alist = op-&gt;estate-&gt;addresses;</div><div class='add'>+</div><div class='add'>+	op-&gt;call	= call;</div><div class='add'>+	op-&gt;type	= call-&gt;type;</div><div class='add'>+	call-&gt;op	= op;</div><div class='add'>+	call-&gt;key	= op-&gt;key;</div><div class='add'>+	call-&gt;intr	= !(op-&gt;flags &amp; AFS_OPERATION_UNINTR);</div><div class='add'>+	call-&gt;peer	= rxrpc_kernel_get_peer(alist-&gt;addrs[op-&gt;addr_index].peer);</div><div class='add'>+	call-&gt;service_id = op-&gt;server-&gt;service_id;</div><div class='add'>+	afs_make_call(call, gfp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void afs_extract_begin(struct afs_call *call, void *buf, size_t size)</div><div class='hunk'>@@ -1293,7 +1434,7 @@ static inline void afs_extract_begin(struct afs_call *call, void *buf, size_t si</div><div class='ctx'> 	call-&gt;iov_len = size;</div><div class='ctx'> 	call-&gt;kvec[0].iov_base = buf;</div><div class='ctx'> 	call-&gt;kvec[0].iov_len = size;</div><div class='del'>-	iov_iter_kvec(&amp;call-&gt;def_iter, READ, call-&gt;kvec, 1, size);</div><div class='add'>+	iov_iter_kvec(&amp;call-&gt;def_iter, ITER_DEST, call-&gt;kvec, 1, size);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void afs_extract_to_tmp(struct afs_call *call)</div><div class='hunk'>@@ -1311,7 +1452,7 @@ static inline void afs_extract_to_tmp64(struct afs_call *call)</div><div class='ctx'> static inline void afs_extract_discard(struct afs_call *call, size_t size)</div><div class='ctx'> {</div><div class='ctx'> 	call-&gt;iov_len = size;</div><div class='del'>-	iov_iter_discard(&amp;call-&gt;def_iter, READ, size);</div><div class='add'>+	iov_iter_discard(&amp;call-&gt;def_iter, ITER_DEST, size);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void afs_extract_to_buf(struct afs_call *call, size_t size)</div><div class='hunk'>@@ -1383,11 +1524,10 @@ extern void afs_put_permits(struct afs_permits *);</div><div class='ctx'> extern void afs_clear_permits(struct afs_vnode *);</div><div class='ctx'> extern void afs_cache_permit(struct afs_vnode *, struct key *, unsigned int,</div><div class='ctx'> 			     struct afs_status_cb *);</div><div class='del'>-extern void afs_zap_permits(struct rcu_head *);</div><div class='ctx'> extern struct key *afs_request_key(struct afs_cell *);</div><div class='ctx'> extern struct key *afs_request_key_rcu(struct afs_cell *);</div><div class='ctx'> extern int afs_check_permit(struct afs_vnode *, struct key *, afs_access_t *);</div><div class='del'>-extern int afs_permission(struct user_namespace *, struct inode *, int);</div><div class='add'>+extern int afs_permission(struct mnt_idmap *, struct inode *, int);</div><div class='ctx'> extern void __exit afs_clean_up_permit_cache(void);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1395,20 +1535,29 @@ extern void __exit afs_clean_up_permit_cache(void);</div><div class='ctx'>  */</div><div class='ctx'> extern spinlock_t afs_server_peer_lock;</div><div class='ctx'> </div><div class='del'>-extern struct afs_server *afs_find_server(struct afs_net *,</div><div class='del'>-					  const struct sockaddr_rxrpc *);</div><div class='del'>-extern struct afs_server *afs_find_server_by_uuid(struct afs_net *, const uuid_t *);</div><div class='add'>+struct afs_server *afs_find_server(const struct rxrpc_peer *peer);</div><div class='ctx'> extern struct afs_server *afs_lookup_server(struct afs_cell *, struct key *, const uuid_t *, u32);</div><div class='ctx'> extern struct afs_server *afs_get_server(struct afs_server *, enum afs_server_trace);</div><div class='del'>-extern struct afs_server *afs_use_server(struct afs_server *, enum afs_server_trace);</div><div class='del'>-extern void afs_unuse_server(struct afs_net *, struct afs_server *, enum afs_server_trace);</div><div class='del'>-extern void afs_unuse_server_notime(struct afs_net *, struct afs_server *, enum afs_server_trace);</div><div class='add'>+struct afs_server *afs_use_server(struct afs_server *server, bool activate,</div><div class='add'>+				  enum afs_server_trace reason);</div><div class='add'>+void afs_unuse_server(struct afs_net *net, struct afs_server *server,</div><div class='add'>+		      enum afs_server_trace reason);</div><div class='add'>+void afs_unuse_server_notime(struct afs_net *net, struct afs_server *server,</div><div class='add'>+			     enum afs_server_trace reason);</div><div class='ctx'> extern void afs_put_server(struct afs_net *, struct afs_server *, enum afs_server_trace);</div><div class='del'>-extern void afs_manage_servers(struct work_struct *);</div><div class='del'>-extern void afs_servers_timer(struct timer_list *);</div><div class='add'>+void afs_purge_servers(struct afs_cell *cell);</div><div class='ctx'> extern void afs_fs_probe_timer(struct timer_list *);</div><div class='del'>-extern void __net_exit afs_purge_servers(struct afs_net *);</div><div class='del'>-extern bool afs_check_server_record(struct afs_operation *, struct afs_server *);</div><div class='add'>+void __net_exit afs_wait_for_servers(struct afs_net *net);</div><div class='add'>+bool afs_check_server_record(struct afs_operation *op, struct afs_server *server, struct key *key);</div><div class='add'>+</div><div class='add'>+static inline void afs_see_server(struct afs_server *server, enum afs_server_trace trace)</div><div class='add'>+{</div><div class='add'>+	int r = refcount_read(&amp;server-&gt;ref);</div><div class='add'>+	int a = atomic_read(&amp;server-&gt;active);</div><div class='add'>+</div><div class='add'>+	trace_afs_server(server-&gt;debug_id, r, a, trace);</div><div class='add'>+</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> static inline void afs_inc_servers_outstanding(struct afs_net *net)</div><div class='ctx'> {</div><div class='hunk'>@@ -1436,10 +1585,14 @@ static inline struct afs_server_list *afs_get_serverlist(struct afs_server_list</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> extern void afs_put_serverlist(struct afs_net *, struct afs_server_list *);</div><div class='del'>-extern struct afs_server_list *afs_alloc_server_list(struct afs_cell *, struct key *,</div><div class='del'>-						     struct afs_vldb_entry *,</div><div class='del'>-						     u8);</div><div class='add'>+struct afs_server_list *afs_alloc_server_list(struct afs_volume *volume,</div><div class='add'>+					      struct key *key,</div><div class='add'>+					      struct afs_vldb_entry *vldb);</div><div class='ctx'> extern bool afs_annotate_server_list(struct afs_server_list *, struct afs_server_list *);</div><div class='add'>+void afs_attach_volume_to_servers(struct afs_volume *volume, struct afs_server_list *slist);</div><div class='add'>+void afs_reattach_volume_to_servers(struct afs_volume *volume, struct afs_server_list *slist,</div><div class='add'>+				    struct afs_server_list *old);</div><div class='add'>+void afs_detach_volume_from_servers(struct afs_volume *volume, struct afs_server_list *slist);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * super.c</div><div class='hunk'>@@ -1448,13 +1601,24 @@ extern int __init afs_fs_init(void);</div><div class='ctx'> extern void afs_fs_exit(void);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * validation.c</div><div class='add'>+ */</div><div class='add'>+bool afs_check_validity(const struct afs_vnode *vnode);</div><div class='add'>+int afs_update_volume_state(struct afs_operation *op);</div><div class='add'>+int afs_validate(struct afs_vnode *vnode, struct key *key);</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * vlclient.c</div><div class='ctx'>  */</div><div class='ctx'> extern struct afs_vldb_entry *afs_vl_get_entry_by_name_u(struct afs_vl_cursor *,</div><div class='ctx'> 							 const char *, int);</div><div class='ctx'> extern struct afs_addr_list *afs_vl_get_addrs_u(struct afs_vl_cursor *, const uuid_t *);</div><div class='del'>-extern struct afs_call *afs_vl_get_capabilities(struct afs_net *, struct afs_addr_cursor *,</div><div class='del'>-						struct key *, struct afs_vlserver *, unsigned int);</div><div class='add'>+struct afs_call *afs_vl_get_capabilities(struct afs_net *net,</div><div class='add'>+					 struct afs_addr_list *alist,</div><div class='add'>+					 unsigned int addr_index,</div><div class='add'>+					 struct key *key,</div><div class='add'>+					 struct afs_vlserver *server,</div><div class='add'>+					 unsigned int server_index);</div><div class='ctx'> extern struct afs_addr_list *afs_yfsvl_get_endpoints(struct afs_vl_cursor *, const uuid_t *);</div><div class='ctx'> extern char *afs_yfsvl_get_cell_name(struct afs_vl_cursor *);</div><div class='ctx'> </div><div class='hunk'>@@ -1484,14 +1648,14 @@ extern int afs_end_vlserver_operation(struct afs_vl_cursor *);</div><div class='ctx'>  */</div><div class='ctx'> static inline struct afs_vlserver *afs_get_vlserver(struct afs_vlserver *vlserver)</div><div class='ctx'> {</div><div class='del'>-	atomic_inc(&amp;vlserver-&gt;usage);</div><div class='add'>+	refcount_inc(&amp;vlserver-&gt;ref);</div><div class='ctx'> 	return vlserver;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline struct afs_vlserver_list *afs_get_vlserverlist(struct afs_vlserver_list *vllist)</div><div class='ctx'> {</div><div class='ctx'> 	if (vllist)</div><div class='del'>-		atomic_inc(&amp;vllist-&gt;usage);</div><div class='add'>+		refcount_inc(&amp;vllist-&gt;ref);</div><div class='ctx'> 	return vllist;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1506,34 +1670,29 @@ extern struct afs_vlserver_list *afs_extract_vlserver_list(struct afs_cell *,</div><div class='ctx'>  * volume.c</div><div class='ctx'>  */</div><div class='ctx'> extern struct afs_volume *afs_create_volume(struct afs_fs_context *);</div><div class='del'>-extern void afs_activate_volume(struct afs_volume *);</div><div class='add'>+extern int afs_activate_volume(struct afs_volume *);</div><div class='ctx'> extern void afs_deactivate_volume(struct afs_volume *);</div><div class='add'>+bool afs_try_get_volume(struct afs_volume *volume, enum afs_volume_trace reason);</div><div class='ctx'> extern struct afs_volume *afs_get_volume(struct afs_volume *, enum afs_volume_trace);</div><div class='del'>-extern void afs_put_volume(struct afs_net *, struct afs_volume *, enum afs_volume_trace);</div><div class='add'>+void afs_put_volume(struct afs_volume *volume, enum afs_volume_trace reason);</div><div class='ctx'> extern int afs_check_volume_status(struct afs_volume *, struct afs_operation *);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * write.c</div><div class='ctx'>  */</div><div class='del'>-extern int afs_set_page_dirty(struct page *);</div><div class='del'>-extern int afs_write_begin(struct file *file, struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned flags,</div><div class='del'>-			struct page **pagep, void **fsdata);</div><div class='del'>-extern int afs_write_end(struct file *file, struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned copied,</div><div class='del'>-			struct page *page, void *fsdata);</div><div class='del'>-extern int afs_writepage(struct page *, struct writeback_control *);</div><div class='add'>+void afs_prepare_write(struct netfs_io_subrequest *subreq);</div><div class='add'>+void afs_issue_write(struct netfs_io_subrequest *subreq);</div><div class='add'>+void afs_begin_writeback(struct netfs_io_request *wreq);</div><div class='add'>+void afs_retry_request(struct netfs_io_request *wreq, struct netfs_io_stream *stream);</div><div class='ctx'> extern int afs_writepages(struct address_space *, struct writeback_control *);</div><div class='del'>-extern ssize_t afs_file_write(struct kiocb *, struct iov_iter *);</div><div class='ctx'> extern int afs_fsync(struct file *, loff_t, loff_t, int);</div><div class='ctx'> extern vm_fault_t afs_page_mkwrite(struct vm_fault *vmf);</div><div class='ctx'> extern void afs_prune_wb_keys(struct afs_vnode *);</div><div class='del'>-extern int afs_launder_page(struct page *);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * xattr.c</div><div class='ctx'>  */</div><div class='del'>-extern const struct xattr_handler *afs_xattr_handlers[];</div><div class='add'>+extern const struct xattr_handler * const afs_xattr_handlers[];</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * yfsclient.c</div><div class='hunk'>@@ -1547,6 +1706,9 @@ extern void yfs_fs_remove_dir(struct afs_operation *);</div><div class='ctx'> extern void yfs_fs_link(struct afs_operation *);</div><div class='ctx'> extern void yfs_fs_symlink(struct afs_operation *);</div><div class='ctx'> extern void yfs_fs_rename(struct afs_operation *);</div><div class='add'>+void yfs_fs_rename_replace(struct afs_operation *op);</div><div class='add'>+void yfs_fs_rename_noreplace(struct afs_operation *op);</div><div class='add'>+void yfs_fs_rename_exchange(struct afs_operation *op);</div><div class='ctx'> extern void yfs_fs_store_data(struct afs_operation *);</div><div class='ctx'> extern void yfs_fs_setattr(struct afs_operation *);</div><div class='ctx'> extern void yfs_fs_get_volume_status(struct afs_operation *);</div><div class='hunk'>@@ -1575,12 +1737,12 @@ extern void yfs_fs_store_opaque_acl2(struct afs_operation *);</div><div class='ctx'>  */</div><div class='ctx'> static inline struct afs_vnode *AFS_FS_I(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	return container_of(inode, struct afs_vnode, vfs_inode);</div><div class='add'>+	return container_of(inode, struct afs_vnode, netfs.inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline struct inode *AFS_VNODE_TO_I(struct afs_vnode *vnode)</div><div class='ctx'> {</div><div class='del'>-	return &amp;vnode-&gt;vfs_inode;</div><div class='add'>+	return &amp;vnode-&gt;netfs.inode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1592,7 +1754,7 @@ static inline void afs_update_dentry_version(struct afs_operation *op,</div><div class='ctx'> 					     struct afs_vnode_param *dir_vp,</div><div class='ctx'> 					     struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	if (!op-&gt;error)</div><div class='add'>+	if (!op-&gt;cumul_error.error)</div><div class='ctx'> 		dentry-&gt;d_fsdata =</div><div class='ctx'> 			(void *)(unsigned long)dir_vp-&gt;scb.status.data_version;</div><div class='ctx'> }</div><div class='hunk'>@@ -1603,8 +1765,8 @@ static inline void afs_update_dentry_version(struct afs_operation *op,</div><div class='ctx'>  */</div><div class='ctx'> static inline void afs_set_i_size(struct afs_vnode *vnode, u64 size)</div><div class='ctx'> {</div><div class='del'>-	i_size_write(&amp;vnode-&gt;vfs_inode, size);</div><div class='del'>-	vnode-&gt;vfs_inode.i_blocks = ((size + 1023) &gt;&gt; 10) &lt;&lt; 1;</div><div class='add'>+	i_size_write(&amp;vnode-&gt;netfs.inode, size);</div><div class='add'>+	vnode-&gt;netfs.inode.i_blocks = ((size + 1023) &gt;&gt; 10) &lt;&lt; 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1631,6 +1793,38 @@ static inline int afs_bad(struct afs_vnode *vnode, enum afs_file_error where)</div><div class='ctx'> 	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Set the callback promise on a vnode.</div><div class='add'>+ */</div><div class='add'>+static inline void afs_set_cb_promise(struct afs_vnode *vnode, time64_t expires_at,</div><div class='add'>+				      enum afs_cb_promise_trace trace)</div><div class='add'>+{</div><div class='add'>+	atomic64_set(&amp;vnode-&gt;cb_expires_at, expires_at);</div><div class='add'>+	trace_afs_cb_promise(vnode, trace);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Clear the callback promise on a vnode, returning true if it was promised.</div><div class='add'>+ */</div><div class='add'>+static inline bool afs_clear_cb_promise(struct afs_vnode *vnode,</div><div class='add'>+					enum afs_cb_promise_trace trace)</div><div class='add'>+{</div><div class='add'>+	trace_afs_cb_promise(vnode, trace);</div><div class='add'>+	return atomic64_xchg(&amp;vnode-&gt;cb_expires_at, AFS_NO_CB_PROMISE) != AFS_NO_CB_PROMISE;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Mark a directory as being invalid.</div><div class='add'>+ */</div><div class='add'>+static inline void afs_invalidate_dir(struct afs_vnode *dvnode,</div><div class='add'>+				      enum afs_dir_invalid_trace trace)</div><div class='add'>+{</div><div class='add'>+	if (test_and_clear_bit(AFS_VNODE_DIR_VALID, &amp;dvnode-&gt;flags)) {</div><div class='add'>+		trace_afs_dir_invalid(dvnode, trace);</div><div class='add'>+		afs_stat_v(dvnode, n_inval);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*****************************************************************************/</div><div class='ctx'> /*</div><div class='ctx'>  * debug tracing</div><div class='head'>diff --git a/fs/afs/main.c b/fs/afs/main.c<br/>index 179004b15566..e6bb8237db98 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/main.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/main.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/main.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/main.c</a></div><div class='hunk'>@@ -41,8 +41,6 @@ const char afs_init_sysname[] = "arm_linux26";</div><div class='ctx'> const char afs_init_sysname[] = "aarch64_linux26";</div><div class='ctx'> #elif defined(CONFIG_X86_32)</div><div class='ctx'> const char afs_init_sysname[] = "i386_linux26";</div><div class='del'>-#elif defined(CONFIG_IA64)</div><div class='del'>-const char afs_init_sysname[] = "ia64_linux26";</div><div class='ctx'> #elif defined(CONFIG_PPC64)</div><div class='ctx'> const char afs_init_sysname[] = "ppc64_linux26";</div><div class='ctx'> #elif defined(CONFIG_PPC32)</div><div class='hunk'>@@ -75,29 +73,21 @@ static int __net_init afs_net_init(struct net *net_ns)</div><div class='ctx'> 	generate_random_uuid((unsigned char *)&amp;net-&gt;uuid);</div><div class='ctx'> </div><div class='ctx'> 	INIT_WORK(&amp;net-&gt;charge_preallocation_work, afs_charge_preallocation);</div><div class='add'>+	INIT_WORK(&amp;net-&gt;rx_oob_work, afs_process_oob_queue);</div><div class='ctx'> 	mutex_init(&amp;net-&gt;socket_mutex);</div><div class='ctx'> </div><div class='ctx'> 	net-&gt;cells = RB_ROOT;</div><div class='add'>+	idr_init(&amp;net-&gt;cells_dyn_ino);</div><div class='ctx'> 	init_rwsem(&amp;net-&gt;cells_lock);</div><div class='del'>-	INIT_WORK(&amp;net-&gt;cells_manager, afs_manage_cells);</div><div class='del'>-	timer_setup(&amp;net-&gt;cells_timer, afs_cells_timer, 0);</div><div class='del'>-</div><div class='ctx'> 	mutex_init(&amp;net-&gt;cells_alias_lock);</div><div class='ctx'> 	mutex_init(&amp;net-&gt;proc_cells_lock);</div><div class='ctx'> 	INIT_HLIST_HEAD(&amp;net-&gt;proc_cells);</div><div class='ctx'> </div><div class='ctx'> 	seqlock_init(&amp;net-&gt;fs_lock);</div><div class='del'>-	net-&gt;fs_servers = RB_ROOT;</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;net-&gt;fs_probe_fast);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;net-&gt;fs_probe_slow);</div><div class='ctx'> 	INIT_HLIST_HEAD(&amp;net-&gt;fs_proc);</div><div class='ctx'> </div><div class='del'>-	INIT_HLIST_HEAD(&amp;net-&gt;fs_addresses4);</div><div class='del'>-	INIT_HLIST_HEAD(&amp;net-&gt;fs_addresses6);</div><div class='del'>-	seqlock_init(&amp;net-&gt;fs_addr_lock);</div><div class='del'>-</div><div class='del'>-	INIT_WORK(&amp;net-&gt;fs_manager, afs_manage_servers);</div><div class='del'>-	timer_setup(&amp;net-&gt;fs_timer, afs_servers_timer, 0);</div><div class='ctx'> 	INIT_WORK(&amp;net-&gt;fs_prober, afs_fs_probe_dispatcher);</div><div class='ctx'> 	timer_setup(&amp;net-&gt;fs_probe_timer, afs_fs_probe_timer, 0);</div><div class='ctx'> 	atomic_set(&amp;net-&gt;servers_outstanding, 1);</div><div class='hunk'>@@ -133,13 +123,14 @@ error_open_socket:</div><div class='ctx'> 	net-&gt;live = false;</div><div class='ctx'> 	afs_fs_probe_cleanup(net);</div><div class='ctx'> 	afs_cell_purge(net);</div><div class='del'>-	afs_purge_servers(net);</div><div class='add'>+	afs_wait_for_servers(net);</div><div class='ctx'> error_cell_init:</div><div class='ctx'> 	net-&gt;live = false;</div><div class='ctx'> 	afs_proc_cleanup(net);</div><div class='ctx'> error_proc:</div><div class='ctx'> 	afs_put_sysnames(net-&gt;sysnames);</div><div class='ctx'> error_sysnames:</div><div class='add'>+	idr_destroy(&amp;net-&gt;cells_dyn_ino);</div><div class='ctx'> 	net-&gt;live = false;</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -154,10 +145,12 @@ static void __net_exit afs_net_exit(struct net *net_ns)</div><div class='ctx'> 	net-&gt;live = false;</div><div class='ctx'> 	afs_fs_probe_cleanup(net);</div><div class='ctx'> 	afs_cell_purge(net);</div><div class='del'>-	afs_purge_servers(net);</div><div class='add'>+	afs_wait_for_servers(net);</div><div class='ctx'> 	afs_close_socket(net);</div><div class='ctx'> 	afs_proc_cleanup(net);</div><div class='ctx'> 	afs_put_sysnames(net-&gt;sysnames);</div><div class='add'>+	idr_destroy(&amp;net-&gt;cells_dyn_ino);</div><div class='add'>+	kfree_rcu(rcu_access_pointer(net-&gt;address_prefs), rcu);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct pernet_operations afs_net_ops = {</div><div class='hunk'>@@ -176,23 +169,16 @@ static int __init afs_init(void)</div><div class='ctx'> </div><div class='ctx'> 	printk(KERN_INFO "kAFS: Red Hat AFS client v0.1 registering.\n");</div><div class='ctx'> </div><div class='del'>-	afs_wq = alloc_workqueue("afs", 0, 0);</div><div class='add'>+	afs_wq = alloc_workqueue("afs", WQ_PERCPU, 0);</div><div class='ctx'> 	if (!afs_wq)</div><div class='ctx'> 		goto error_afs_wq;</div><div class='del'>-	afs_async_calls = alloc_workqueue("kafsd", WQ_MEM_RECLAIM, 0);</div><div class='add'>+	afs_async_calls = alloc_workqueue("kafsd", WQ_MEM_RECLAIM | WQ_UNBOUND, 0);</div><div class='ctx'> 	if (!afs_async_calls)</div><div class='ctx'> 		goto error_async;</div><div class='del'>-	afs_lock_manager = alloc_workqueue("kafs_lockd", WQ_MEM_RECLAIM, 0);</div><div class='add'>+	afs_lock_manager = alloc_workqueue("kafs_lockd", WQ_MEM_RECLAIM | WQ_PERCPU, 0);</div><div class='ctx'> 	if (!afs_lock_manager)</div><div class='ctx'> 		goto error_lockmgr;</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_AFS_FSCACHE</div><div class='del'>-	/* we want to be able to cache */</div><div class='del'>-	ret = fscache_register_netfs(&amp;afs_cache_netfs);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto error_cache;</div><div class='del'>-#endif</div><div class='del'>-</div><div class='ctx'> 	ret = register_pernet_device(&amp;afs_net_ops);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto error_net;</div><div class='hunk'>@@ -215,10 +201,6 @@ error_proc:</div><div class='ctx'> error_fs:</div><div class='ctx'> 	unregister_pernet_device(&amp;afs_net_ops);</div><div class='ctx'> error_net:</div><div class='del'>-#ifdef CONFIG_AFS_FSCACHE</div><div class='del'>-	fscache_unregister_netfs(&amp;afs_cache_netfs);</div><div class='del'>-error_cache:</div><div class='del'>-#endif</div><div class='ctx'> 	destroy_workqueue(afs_lock_manager);</div><div class='ctx'> error_lockmgr:</div><div class='ctx'> 	destroy_workqueue(afs_async_calls);</div><div class='hunk'>@@ -245,9 +227,6 @@ static void __exit afs_exit(void)</div><div class='ctx'> 	proc_remove(afs_proc_symlink);</div><div class='ctx'> 	afs_fs_exit();</div><div class='ctx'> 	unregister_pernet_device(&amp;afs_net_ops);</div><div class='del'>-#ifdef CONFIG_AFS_FSCACHE</div><div class='del'>-	fscache_unregister_netfs(&amp;afs_cache_netfs);</div><div class='del'>-#endif</div><div class='ctx'> 	destroy_workqueue(afs_lock_manager);</div><div class='ctx'> 	destroy_workqueue(afs_async_calls);</div><div class='ctx'> 	destroy_workqueue(afs_wq);</div><div class='head'>diff --git a/fs/afs/misc.c b/fs/afs/misc.c<br/>index 1d1a8debe472..c8a7f266080d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/misc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/misc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/misc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/misc.c</a></div><div class='hunk'>@@ -8,6 +8,7 @@</div><div class='ctx'> #include &lt;linux/kernel.h&gt;</div><div class='ctx'> #include &lt;linux/module.h&gt;</div><div class='ctx'> #include &lt;linux/errno.h&gt;</div><div class='add'>+#include &lt;crypto/krb5.h&gt;</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> #include "afs_fs.h"</div><div class='ctx'> #include "protocol_uae.h"</div><div class='hunk'>@@ -69,6 +70,7 @@ int afs_abort_to_error(u32 abort_code)</div><div class='ctx'> 		/* Unified AFS error table */</div><div class='ctx'> 	case UAEPERM:			return -EPERM;</div><div class='ctx'> 	case UAENOENT:			return -ENOENT;</div><div class='add'>+	case UAEAGAIN:			return -EAGAIN;</div><div class='ctx'> 	case UAEACCES:			return -EACCES;</div><div class='ctx'> 	case UAEBUSY:			return -EBUSY;</div><div class='ctx'> 	case UAEEXIST:			return -EEXIST;</div><div class='hunk'>@@ -102,7 +104,34 @@ int afs_abort_to_error(u32 abort_code)</div><div class='ctx'> 	case RXKADDATALEN:	return -EKEYREJECTED;</div><div class='ctx'> 	case RXKADILLEGALLEVEL:	return -EKEYREJECTED;</div><div class='ctx'> </div><div class='add'>+	case RXGK_INCONSISTENCY:	return -EPROTO;</div><div class='add'>+	case RXGK_PACKETSHORT:		return -EPROTO;</div><div class='add'>+	case RXGK_BADCHALLENGE:		return -EPROTO;</div><div class='add'>+	case RXGK_SEALEDINCON:		return -EKEYREJECTED;</div><div class='add'>+	case RXGK_NOTAUTH:		return -EKEYREJECTED;</div><div class='add'>+	case RXGK_EXPIRED:		return -EKEYEXPIRED;</div><div class='add'>+	case RXGK_BADLEVEL:		return -EKEYREJECTED;</div><div class='add'>+	case RXGK_BADKEYNO:		return -EKEYREJECTED;</div><div class='add'>+	case RXGK_NOTRXGK:		return -EKEYREJECTED;</div><div class='add'>+	case RXGK_UNSUPPORTED:		return -EKEYREJECTED;</div><div class='add'>+	case RXGK_GSSERROR:		return -EKEYREJECTED;</div><div class='add'>+#ifdef RXGK_BADETYPE</div><div class='add'>+	case RXGK_BADETYPE:		return -ENOPKG;</div><div class='add'>+#endif</div><div class='add'>+#ifdef RXGK_BADTOKEN</div><div class='add'>+	case RXGK_BADTOKEN:		return -EKEYREJECTED;</div><div class='add'>+#endif</div><div class='add'>+#ifdef RXGK_BADETYPE</div><div class='add'>+	case RXGK_DATALEN:		return -EPROTO;</div><div class='add'>+#endif</div><div class='add'>+#ifdef RXGK_BADQOP</div><div class='add'>+	case RXGK_BADQOP:		return -EKEYREJECTED;</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+	case KRB5_PROG_KEYTYPE_NOSUPP:	return -ENOPKG;</div><div class='add'>+</div><div class='ctx'> 	case RXGEN_OPCODE:	return -ENOTSUPP;</div><div class='add'>+	case RX_INVALID_OPERATION:	return -ENOTSUPP;</div><div class='ctx'> </div><div class='ctx'> 	default:		return -EREMOTEIO;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -115,6 +144,8 @@ void afs_prioritise_error(struct afs_error *e, int error, u32 abort_code)</div><div class='ctx'> {</div><div class='ctx'> 	switch (error) {</div><div class='ctx'> 	case 0:</div><div class='add'>+		e-&gt;aborted = false;</div><div class='add'>+		e-&gt;error = 0;</div><div class='ctx'> 		return;</div><div class='ctx'> 	default:</div><div class='ctx'> 		if (e-&gt;error == -ETIMEDOUT ||</div><div class='hunk'>@@ -160,11 +191,18 @@ void afs_prioritise_error(struct afs_error *e, int error, u32 abort_code)</div><div class='ctx'> 		if (e-&gt;responded)</div><div class='ctx'> 			return;</div><div class='ctx'> 		e-&gt;error = error;</div><div class='add'>+		e-&gt;aborted = false;</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	case -ECONNABORTED:</div><div class='del'>-		e-&gt;responded = true;</div><div class='ctx'> 		e-&gt;error = afs_abort_to_error(abort_code);</div><div class='add'>+		e-&gt;aborted = true;</div><div class='add'>+		e-&gt;responded = true;</div><div class='add'>+		return;</div><div class='add'>+	case -ENETRESET: /* Responded, but we seem to have changed address */</div><div class='add'>+		e-&gt;aborted = false;</div><div class='add'>+		e-&gt;responded = true;</div><div class='add'>+		e-&gt;error = error;</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/afs/mntpt.c b/fs/afs/mntpt.c<br/>index bbb2c210d139..57c204a3c04e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/mntpt.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/mntpt.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/mntpt.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/mntpt.c</a></div><div class='hunk'>@@ -30,7 +30,7 @@ const struct file_operations afs_mntpt_file_operations = {</div><div class='ctx'> </div><div class='ctx'> const struct inode_operations afs_mntpt_inode_operations = {</div><div class='ctx'> 	.lookup		= afs_mntpt_lookup,</div><div class='del'>-	.readlink	= page_readlink,</div><div class='add'>+	.readlink	= afs_readlink,</div><div class='ctx'> 	.getattr	= afs_getattr,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -87,7 +87,7 @@ static int afs_mntpt_set_params(struct fs_context *fc, struct dentry *mntpt)</div><div class='ctx'> 		ctx-&gt;force = true;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (ctx-&gt;cell) {</div><div class='del'>-		afs_unuse_cell(ctx-&gt;net, ctx-&gt;cell, afs_cell_trace_unuse_mntpt);</div><div class='add'>+		afs_unuse_cell(ctx-&gt;cell, afs_cell_trace_unuse_mntpt);</div><div class='ctx'> 		ctx-&gt;cell = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (test_bit(AFS_VNODE_PSEUDODIR, &amp;vnode-&gt;flags)) {</div><div class='hunk'>@@ -107,7 +107,9 @@ static int afs_mntpt_set_params(struct fs_context *fc, struct dentry *mntpt)</div><div class='ctx'> 		if (size &gt; AFS_MAXCELLNAME)</div><div class='ctx'> 			return -ENAMETOOLONG;</div><div class='ctx'> </div><div class='del'>-		cell = afs_lookup_cell(ctx-&gt;net, p, size, NULL, false);</div><div class='add'>+		cell = afs_lookup_cell(ctx-&gt;net, p, size, NULL,</div><div class='add'>+				       AFS_LOOKUP_CELL_MOUNTPOINT,</div><div class='add'>+				       afs_cell_trace_use_lookup_mntpt);</div><div class='ctx'> 		if (IS_ERR(cell)) {</div><div class='ctx'> 			pr_err("kAFS: unable to lookup cell '%pd'\n", mntpt);</div><div class='ctx'> 			return PTR_ERR(cell);</div><div class='hunk'>@@ -118,9 +120,9 @@ static int afs_mntpt_set_params(struct fs_context *fc, struct dentry *mntpt)</div><div class='ctx'> 		ctx-&gt;volnamesz = sizeof(afs_root_volume) - 1;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		/* read the contents of the AFS special symlink */</div><div class='del'>-		struct page *page;</div><div class='add'>+		DEFINE_DELAYED_CALL(cleanup);</div><div class='add'>+		const char *content;</div><div class='ctx'> 		loff_t size = i_size_read(d_inode(mntpt));</div><div class='del'>-		char *buf;</div><div class='ctx'> </div><div class='ctx'> 		if (src_as-&gt;cell)</div><div class='ctx'> 			ctx-&gt;cell = afs_use_cell(src_as-&gt;cell, afs_cell_trace_use_mntpt);</div><div class='hunk'>@@ -128,24 +130,24 @@ static int afs_mntpt_set_params(struct fs_context *fc, struct dentry *mntpt)</div><div class='ctx'> 		if (size &lt; 2 || size &gt; PAGE_SIZE - 1)</div><div class='ctx'> 			return -EINVAL;</div><div class='ctx'> </div><div class='del'>-		page = read_mapping_page(d_inode(mntpt)-&gt;i_mapping, 0, NULL);</div><div class='del'>-		if (IS_ERR(page))</div><div class='del'>-			return PTR_ERR(page);</div><div class='del'>-</div><div class='del'>-		if (PageError(page)) {</div><div class='del'>-			ret = afs_bad(AFS_FS_I(d_inode(mntpt)), afs_file_error_mntpt);</div><div class='del'>-			put_page(page);</div><div class='del'>-			return ret;</div><div class='add'>+		content = afs_get_link(mntpt, d_inode(mntpt), &amp;cleanup);</div><div class='add'>+		if (IS_ERR(content)) {</div><div class='add'>+			do_delayed_call(&amp;cleanup);</div><div class='add'>+			return PTR_ERR(content);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		buf = kmap(page);</div><div class='ctx'> 		ret = -EINVAL;</div><div class='del'>-		if (buf[size - 1] == '.')</div><div class='del'>-			ret = vfs_parse_fs_string(fc, "source", buf, size - 1);</div><div class='del'>-		kunmap(page);</div><div class='del'>-		put_page(page);</div><div class='add'>+		if (content[size - 1] == '.')</div><div class='add'>+			ret = vfs_parse_fs_qstr(fc, "source",</div><div class='add'>+						&amp;QSTR_LEN(content, size - 1));</div><div class='add'>+		do_delayed_call(&amp;cleanup);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			return ret;</div><div class='add'>+</div><div class='add'>+		/* Don't cross a backup volume mountpoint from a backup volume */</div><div class='add'>+		if (src_as-&gt;volume &amp;&amp; src_as-&gt;volume-&gt;type == AFSVL_BACKVOL &amp;&amp;</div><div class='add'>+		    ctx-&gt;type == AFSVL_BACKVOL)</div><div class='add'>+			return -ENODEV;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -189,7 +191,6 @@ struct vfsmount *afs_d_automount(struct path *path)</div><div class='ctx'> 	if (IS_ERR(newmnt))</div><div class='ctx'> 		return newmnt;</div><div class='ctx'> </div><div class='del'>-	mntget(newmnt); /* prevent immediate expiration */</div><div class='ctx'> 	mnt_set_expiry(newmnt, &amp;afs_vfsmounts);</div><div class='ctx'> 	queue_delayed_work(afs_wq, &amp;afs_mntpt_expiry_timer,</div><div class='ctx'> 			   afs_mntpt_expiry_timeout * HZ);</div><div class='head'>diff --git a/fs/afs/proc.c b/fs/afs/proc.c<br/>index 065a28bfa3f1..44520549b509 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/proc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/proc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/proc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/proc.c</a></div><div class='hunk'>@@ -47,7 +47,7 @@ static int afs_proc_cells_show(struct seq_file *m, void *v)</div><div class='ctx'> </div><div class='ctx'> 	/* display one cell per line on subsequent lines */</div><div class='ctx'> 	seq_printf(m, "%3u %3u %6lld %2u %2u %s\n",</div><div class='del'>-		   atomic_read(&amp;cell-&gt;ref),</div><div class='add'>+		   refcount_read(&amp;cell-&gt;ref),</div><div class='ctx'> 		   atomic_read(&amp;cell-&gt;active),</div><div class='ctx'> 		   cell-&gt;dns_expiry - ktime_get_real_seconds(),</div><div class='ctx'> 		   vllist ? vllist-&gt;nr_servers : 0,</div><div class='hunk'>@@ -122,14 +122,16 @@ static int afs_proc_cells_write(struct file *file, char *buf, size_t size)</div><div class='ctx'> 	if (strcmp(buf, "add") == 0) {</div><div class='ctx'> 		struct afs_cell *cell;</div><div class='ctx'> </div><div class='del'>-		cell = afs_lookup_cell(net, name, strlen(name), args, true);</div><div class='add'>+		cell = afs_lookup_cell(net, name, strlen(name), args,</div><div class='add'>+				       AFS_LOOKUP_CELL_PRELOAD,</div><div class='add'>+				       afs_cell_trace_use_lookup_add);</div><div class='ctx'> 		if (IS_ERR(cell)) {</div><div class='ctx'> 			ret = PTR_ERR(cell);</div><div class='ctx'> 			goto done;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (test_and_set_bit(AFS_CELL_FL_NO_GC, &amp;cell-&gt;flags))</div><div class='del'>-			afs_unuse_cell(net, cell, afs_cell_trace_unuse_no_pin);</div><div class='add'>+			afs_unuse_cell(cell, afs_cell_trace_unuse_no_pin);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		goto inval;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -147,6 +149,56 @@ inval:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * Display the list of addr_prefs known to the namespace.</div><div class='add'>+ */</div><div class='add'>+static int afs_proc_addr_prefs_show(struct seq_file *m, void *v)</div><div class='add'>+{</div><div class='add'>+	struct afs_addr_preference_list *preflist;</div><div class='add'>+	struct afs_addr_preference *pref;</div><div class='add'>+	struct afs_net *net = afs_seq2net_single(m);</div><div class='add'>+	union {</div><div class='add'>+		struct sockaddr_in sin;</div><div class='add'>+		struct sockaddr_in6 sin6;</div><div class='add'>+	} addr;</div><div class='add'>+	unsigned int i;</div><div class='add'>+	char buf[44]; /* Maximum ipv6 + max subnet is 43 */</div><div class='add'>+</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	preflist = rcu_dereference(net-&gt;address_prefs);</div><div class='add'>+</div><div class='add'>+	if (!preflist) {</div><div class='add'>+		seq_puts(m, "NO PREFS\n");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	seq_printf(m, "PROT SUBNET                                      PRIOR (v=%u n=%u/%u/%u)\n",</div><div class='add'>+		   preflist-&gt;version, preflist-&gt;ipv6_off, preflist-&gt;nr, preflist-&gt;max_prefs);</div><div class='add'>+</div><div class='add'>+	memset(&amp;addr, 0, sizeof(addr));</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; preflist-&gt;nr; i++) {</div><div class='add'>+		pref = &amp;preflist-&gt;prefs[i];</div><div class='add'>+</div><div class='add'>+		addr.sin.sin_family = pref-&gt;family;</div><div class='add'>+		if (pref-&gt;family == AF_INET) {</div><div class='add'>+			memcpy(&amp;addr.sin.sin_addr, &amp;pref-&gt;ipv4_addr,</div><div class='add'>+			       sizeof(addr.sin.sin_addr));</div><div class='add'>+			snprintf(buf, sizeof(buf), "%pISc/%u", &amp;addr.sin, pref-&gt;subnet_mask);</div><div class='add'>+			seq_printf(m, "UDP  %-43.43s %5u\n", buf, pref-&gt;prio);</div><div class='add'>+		} else {</div><div class='add'>+			memcpy(&amp;addr.sin6.sin6_addr, &amp;pref-&gt;ipv6_addr,</div><div class='add'>+			       sizeof(addr.sin6.sin6_addr));</div><div class='add'>+			snprintf(buf, sizeof(buf), "%pISc/%u", &amp;addr.sin6, pref-&gt;subnet_mask);</div><div class='add'>+			seq_printf(m, "UDP  %-43.43s %5u\n", buf, pref-&gt;prio);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * Display the name of the current workstation cell.</div><div class='ctx'>  */</div><div class='ctx'> static int afs_proc_rootcell_show(struct seq_file *m, void *v)</div><div class='hunk'>@@ -156,7 +208,7 @@ static int afs_proc_rootcell_show(struct seq_file *m, void *v)</div><div class='ctx'> </div><div class='ctx'> 	net = afs_seq2net_single(m);</div><div class='ctx'> 	down_read(&amp;net-&gt;cells_lock);</div><div class='del'>-	cell = net-&gt;ws_cell;</div><div class='add'>+	cell = rcu_dereference_protected(net-&gt;ws_cell, lockdep_is_held(&amp;net-&gt;cells_lock));</div><div class='ctx'> 	if (cell)</div><div class='ctx'> 		seq_printf(m, "%s\n", cell-&gt;name);</div><div class='ctx'> 	up_read(&amp;net-&gt;cells_lock);</div><div class='hunk'>@@ -190,7 +242,13 @@ static int afs_proc_rootcell_write(struct file *file, char *buf, size_t size)</div><div class='ctx'> 	/* determine command to perform */</div><div class='ctx'> 	_debug("rootcell=%s", buf);</div><div class='ctx'> </div><div class='del'>-	ret = afs_cell_init(net, buf);</div><div class='add'>+	ret = -EEXIST;</div><div class='add'>+	inode_lock(file_inode(file));</div><div class='add'>+	if (!rcu_access_pointer(net-&gt;ws_cell))</div><div class='add'>+		ret = afs_cell_init(net, buf);</div><div class='add'>+	else</div><div class='add'>+		printk("busy\n");</div><div class='add'>+	inode_unlock(file_inode(file));</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	_leave(" = %d", ret);</div><div class='hunk'>@@ -217,7 +275,7 @@ static int afs_proc_cell_volumes_show(struct seq_file *m, void *v)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	seq_printf(m, "%3d %08llx %s %s\n",</div><div class='del'>-		   atomic_read(&amp;vol-&gt;usage), vol-&gt;vid,</div><div class='add'>+		   refcount_read(&amp;vol-&gt;ref), vol-&gt;vid,</div><div class='ctx'> 		   afs_vol_types[vol-&gt;type],</div><div class='ctx'> 		   vol-&gt;name);</div><div class='ctx'> </div><div class='hunk'>@@ -227,7 +285,7 @@ static int afs_proc_cell_volumes_show(struct seq_file *m, void *v)</div><div class='ctx'> static void *afs_proc_cell_volumes_start(struct seq_file *m, loff_t *_pos)</div><div class='ctx'> 	__acquires(cell-&gt;proc_lock)</div><div class='ctx'> {</div><div class='del'>-	struct afs_cell *cell = PDE_DATA(file_inode(m-&gt;file));</div><div class='add'>+	struct afs_cell *cell = pde_data(file_inode(m-&gt;file));</div><div class='ctx'> </div><div class='ctx'> 	rcu_read_lock();</div><div class='ctx'> 	return seq_hlist_start_head_rcu(&amp;cell-&gt;proc_volumes, *_pos);</div><div class='hunk'>@@ -236,7 +294,7 @@ static void *afs_proc_cell_volumes_start(struct seq_file *m, loff_t *_pos)</div><div class='ctx'> static void *afs_proc_cell_volumes_next(struct seq_file *m, void *v,</div><div class='ctx'> 					loff_t *_pos)</div><div class='ctx'> {</div><div class='del'>-	struct afs_cell *cell = PDE_DATA(file_inode(m-&gt;file));</div><div class='add'>+	struct afs_cell *cell = pde_data(file_inode(m-&gt;file));</div><div class='ctx'> </div><div class='ctx'> 	return seq_hlist_next_rcu(v, &amp;cell-&gt;proc_volumes, _pos);</div><div class='ctx'> }</div><div class='hunk'>@@ -307,7 +365,7 @@ static int afs_proc_cell_vlservers_show(struct seq_file *m, void *v)</div><div class='ctx'> 		for (i = 0; i &lt; alist-&gt;nr_addrs; i++)</div><div class='ctx'> 			seq_printf(m, " %c %pISpc\n",</div><div class='ctx'> 				   alist-&gt;preferred == i ? '&gt;' : '-',</div><div class='del'>-				   &amp;alist-&gt;addrs[i].transport);</div><div class='add'>+				   rxrpc_kernel_remote_addr(alist-&gt;addrs[i].peer));</div><div class='ctx'> 	}</div><div class='ctx'> 	seq_printf(m, " info: fl=%lx rtt=%d\n", vlserver-&gt;flags, vlserver-&gt;rtt);</div><div class='ctx'> 	seq_printf(m, " probe: fl=%x e=%d ac=%d out=%d\n",</div><div class='hunk'>@@ -322,7 +380,7 @@ static void *afs_proc_cell_vlservers_start(struct seq_file *m, loff_t *_pos)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_vl_seq_net_private *priv = m-&gt;private;</div><div class='ctx'> 	struct afs_vlserver_list *vllist;</div><div class='del'>-	struct afs_cell *cell = PDE_DATA(file_inode(m-&gt;file));</div><div class='add'>+	struct afs_cell *cell = pde_data(file_inode(m-&gt;file));</div><div class='ctx'> 	loff_t pos = *_pos;</div><div class='ctx'> </div><div class='ctx'> 	rcu_read_lock();</div><div class='hunk'>@@ -375,32 +433,51 @@ static const struct seq_operations afs_proc_cell_vlservers_ops = {</div><div class='ctx'>  */</div><div class='ctx'> static int afs_proc_servers_show(struct seq_file *m, void *v)</div><div class='ctx'> {</div><div class='del'>-	struct afs_server *server;</div><div class='add'>+	struct afs_endpoint_state *estate;</div><div class='ctx'> 	struct afs_addr_list *alist;</div><div class='add'>+	struct afs_server *server;</div><div class='add'>+	unsigned long failed;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='ctx'> 	if (v == SEQ_START_TOKEN) {</div><div class='del'>-		seq_puts(m, "UUID                                 REF ACT\n");</div><div class='add'>+		seq_puts(m, "UUID                                 REF ACT CELL\n");</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	server = list_entry(v, struct afs_server, proc_link);</div><div class='del'>-	alist = rcu_dereference(server-&gt;addresses);</div><div class='del'>-	seq_printf(m, "%pU %3d %3d\n",</div><div class='add'>+	seq_printf(m, "%pU %3d %3d %s\n",</div><div class='ctx'> 		   &amp;server-&gt;uuid,</div><div class='del'>-		   atomic_read(&amp;server-&gt;ref),</div><div class='del'>-		   atomic_read(&amp;server-&gt;active));</div><div class='del'>-	seq_printf(m, "  - info: fl=%lx rtt=%u brk=%x\n",</div><div class='del'>-		   server-&gt;flags, server-&gt;rtt, server-&gt;cb_s_break);</div><div class='del'>-	seq_printf(m, "  - probe: last=%d out=%d\n",</div><div class='del'>-		   (int)(jiffies - server-&gt;probed_at) / HZ,</div><div class='del'>-		   atomic_read(&amp;server-&gt;probe_outstanding));</div><div class='del'>-	seq_printf(m, "  - ALIST v=%u rsp=%lx f=%lx\n",</div><div class='del'>-		   alist-&gt;version, alist-&gt;responded, alist-&gt;failed);</div><div class='del'>-	for (i = 0; i &lt; alist-&gt;nr_addrs; i++)</div><div class='del'>-		seq_printf(m, "    [%x] %pISpc%s\n",</div><div class='del'>-			   i, &amp;alist-&gt;addrs[i].transport,</div><div class='del'>-			   alist-&gt;preferred == i ? "*" : "");</div><div class='add'>+		   refcount_read(&amp;server-&gt;ref),</div><div class='add'>+		   atomic_read(&amp;server-&gt;active),</div><div class='add'>+		   server-&gt;cell-&gt;name);</div><div class='add'>+	seq_printf(m, "  - info: fl=%lx rtt=%u\n",</div><div class='add'>+		   server-&gt;flags, server-&gt;rtt);</div><div class='add'>+	seq_printf(m, "  - probe: last=%d\n",</div><div class='add'>+		   (int)(jiffies - server-&gt;probed_at) / HZ);</div><div class='add'>+</div><div class='add'>+	estate = rcu_dereference(server-&gt;endpoint_state);</div><div class='add'>+	if (!estate)</div><div class='add'>+		goto out;</div><div class='add'>+	failed = estate-&gt;failed_set;</div><div class='add'>+	seq_printf(m, "  - ESTATE pq=%x np=%u rsp=%lx f=%lx\n",</div><div class='add'>+		   estate-&gt;probe_seq, atomic_read(&amp;estate-&gt;nr_probing),</div><div class='add'>+		   estate-&gt;responsive_set, estate-&gt;failed_set);</div><div class='add'>+</div><div class='add'>+	alist = estate-&gt;addresses;</div><div class='add'>+	seq_printf(m, "  - ALIST v=%u ap=%u\n",</div><div class='add'>+		   alist-&gt;version, alist-&gt;addr_pref_version);</div><div class='add'>+	for (i = 0; i &lt; alist-&gt;nr_addrs; i++) {</div><div class='add'>+		const struct afs_address *addr = &amp;alist-&gt;addrs[i];</div><div class='add'>+</div><div class='add'>+		seq_printf(m, "    [%x] %pISpc%s rtt=%d err=%d p=%u\n",</div><div class='add'>+			   i, rxrpc_kernel_remote_addr(addr-&gt;peer),</div><div class='add'>+			   alist-&gt;preferred == i ? "*" :</div><div class='add'>+			   test_bit(i, &amp;failed) ? "!" : "",</div><div class='add'>+			   rxrpc_kernel_get_srtt(addr-&gt;peer),</div><div class='add'>+			   addr-&gt;last_error, addr-&gt;prio);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+out:</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -681,7 +758,11 @@ int afs_proc_init(struct afs_net *net)</div><div class='ctx'> 					&amp;afs_proc_sysname_ops,</div><div class='ctx'> 					afs_proc_sysname_write,</div><div class='ctx'> 					sizeof(struct seq_net_private),</div><div class='del'>-					NULL))</div><div class='add'>+					NULL) ||</div><div class='add'>+	    !proc_create_net_single_write("addr_prefs", 0644, p,</div><div class='add'>+					  afs_proc_addr_prefs_show,</div><div class='add'>+					  afs_proc_addr_prefs_write,</div><div class='add'>+					  NULL))</div><div class='ctx'> 		goto error_tree;</div><div class='ctx'> </div><div class='ctx'> 	net-&gt;proc_afs = p;</div><div class='head'>diff --git a/fs/afs/protocol_yfs.h b/fs/afs/protocol_yfs.h<br/>index e4cd89c44c46..b2f06c1917c2 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/protocol_yfs.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/protocol_yfs.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/protocol_yfs.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/protocol_yfs.h</a></div><div class='hunk'>@@ -50,6 +50,9 @@ enum YFS_FS_Operations {</div><div class='ctx'> 	YFSREMOVEACL		= 64171,</div><div class='ctx'> 	YFSREMOVEFILE2		= 64173,</div><div class='ctx'> 	YFSSTOREOPAQUEACL2	= 64174,</div><div class='add'>+	YFSRENAME_REPLACE	= 64176,</div><div class='add'>+	YFSRENAME_NOREPLACE	= 64177,</div><div class='add'>+	YFSRENAME_EXCHANGE	= 64187,</div><div class='ctx'> 	YFSINLINEBULKSTATUS	= 64536, /* YFS Fetch multiple file statuses with errors */</div><div class='ctx'> 	YFSFETCHDATA64		= 64537, /* YFS Fetch file data */</div><div class='ctx'> 	YFSSTOREDATA64		= 64538, /* YFS Store file data */</div><div class='head'>diff --git a/fs/afs/rotate.c b/fs/afs/rotate.c<br/>index 79e1a5f6701b..6a4e7da10fc4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/rotate.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/rotate.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/rotate.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/rotate.c</a></div><div class='hunk'>@@ -13,6 +13,19 @@</div><div class='ctx'> #include &lt;linux/sched/signal.h&gt;</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> #include "afs_fs.h"</div><div class='add'>+#include "protocol_uae.h"</div><div class='add'>+</div><div class='add'>+void afs_clear_server_states(struct afs_operation *op)</div><div class='add'>+{</div><div class='add'>+	unsigned int i;</div><div class='add'>+</div><div class='add'>+	if (op-&gt;server_states) {</div><div class='add'>+		for (i = 0; i &lt; op-&gt;server_list-&gt;nr_servers; i++)</div><div class='add'>+			afs_put_endpoint_state(op-&gt;server_states[i].endpoint_state,</div><div class='add'>+					       afs_estate_trace_put_server_state);</div><div class='add'>+		kfree(op-&gt;server_states);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Begin iteration through a server list, starting with the vnode's last used</div><div class='hunk'>@@ -25,14 +38,41 @@ static bool afs_start_fs_iteration(struct afs_operation *op,</div><div class='ctx'> 	void *cb_server;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='add'>+	trace_afs_rotate(op, afs_rotate_trace_start, 0);</div><div class='add'>+</div><div class='ctx'> 	read_lock(&amp;op-&gt;volume-&gt;servers_lock);</div><div class='ctx'> 	op-&gt;server_list = afs_get_serverlist(</div><div class='ctx'> 		rcu_dereference_protected(op-&gt;volume-&gt;servers,</div><div class='ctx'> 					  lockdep_is_held(&amp;op-&gt;volume-&gt;servers_lock)));</div><div class='ctx'> 	read_unlock(&amp;op-&gt;volume-&gt;servers_lock);</div><div class='ctx'> </div><div class='del'>-	op-&gt;untried = (1UL &lt;&lt; op-&gt;server_list-&gt;nr_servers) - 1;</div><div class='del'>-	op-&gt;index = READ_ONCE(op-&gt;server_list-&gt;preferred);</div><div class='add'>+	op-&gt;server_states = kcalloc(op-&gt;server_list-&gt;nr_servers, sizeof(op-&gt;server_states[0]),</div><div class='add'>+				    GFP_KERNEL);</div><div class='add'>+	if (!op-&gt;server_states) {</div><div class='add'>+		afs_op_nomem(op);</div><div class='add'>+		trace_afs_rotate(op, afs_rotate_trace_nomem, 0);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	for (i = 0; i &lt; op-&gt;server_list-&gt;nr_servers; i++) {</div><div class='add'>+		struct afs_endpoint_state *estate;</div><div class='add'>+		struct afs_server_state *s = &amp;op-&gt;server_states[i];</div><div class='add'>+</div><div class='add'>+		server = op-&gt;server_list-&gt;servers[i].server;</div><div class='add'>+		estate = rcu_dereference(server-&gt;endpoint_state);</div><div class='add'>+		s-&gt;endpoint_state = afs_get_endpoint_state(estate,</div><div class='add'>+							   afs_estate_trace_get_server_state);</div><div class='add'>+		s-&gt;probe_seq = estate-&gt;probe_seq;</div><div class='add'>+		s-&gt;untried_addrs = (1UL &lt;&lt; estate-&gt;addresses-&gt;nr_addrs) - 1;</div><div class='add'>+		init_waitqueue_entry(&amp;s-&gt;probe_waiter, current);</div><div class='add'>+		afs_get_address_preferences(op-&gt;net, estate-&gt;addresses);</div><div class='add'>+	}</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+</div><div class='add'>+</div><div class='add'>+	op-&gt;untried_servers = (1UL &lt;&lt; op-&gt;server_list-&gt;nr_servers) - 1;</div><div class='add'>+	op-&gt;server_index = -1;</div><div class='ctx'> </div><div class='ctx'> 	cb_server = vnode-&gt;cb_server;</div><div class='ctx'> 	if (cb_server) {</div><div class='hunk'>@@ -40,7 +80,7 @@ static bool afs_start_fs_iteration(struct afs_operation *op,</div><div class='ctx'> 		for (i = 0; i &lt; op-&gt;server_list-&gt;nr_servers; i++) {</div><div class='ctx'> 			server = op-&gt;server_list-&gt;servers[i].server;</div><div class='ctx'> 			if (server == cb_server) {</div><div class='del'>-				op-&gt;index = i;</div><div class='add'>+				op-&gt;server_index = i;</div><div class='ctx'> 				goto found_interest;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='hunk'>@@ -50,7 +90,8 @@ static bool afs_start_fs_iteration(struct afs_operation *op,</div><div class='ctx'> 		 * and have to return an error.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (op-&gt;flags &amp; AFS_OPERATION_CUR_ONLY) {</div><div class='del'>-			op-&gt;error = -ESTALE;</div><div class='add'>+			afs_op_set_error(op, -ESTALE);</div><div class='add'>+			trace_afs_rotate(op, afs_rotate_trace_stale_lock, 0);</div><div class='ctx'> 			return false;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -58,7 +99,7 @@ static bool afs_start_fs_iteration(struct afs_operation *op,</div><div class='ctx'> 		write_seqlock(&amp;vnode-&gt;cb_lock);</div><div class='ctx'> 		ASSERTCMP(cb_server, ==, vnode-&gt;cb_server);</div><div class='ctx'> 		vnode-&gt;cb_server = NULL;</div><div class='del'>-		if (test_and_clear_bit(AFS_VNODE_CB_PROMISED, &amp;vnode-&gt;flags))</div><div class='add'>+		if (afs_clear_cb_promise(vnode, afs_cb_promise_clear_rotate_server))</div><div class='ctx'> 			vnode-&gt;cb_break++;</div><div class='ctx'> 		write_sequnlock(&amp;vnode-&gt;cb_lock);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -70,7 +111,7 @@ found_interest:</div><div class='ctx'> /*</div><div class='ctx'>  * Post volume busy note.</div><div class='ctx'>  */</div><div class='del'>-static void afs_busy(struct afs_volume *volume, u32 abort_code)</div><div class='add'>+static void afs_busy(struct afs_operation *op, u32 abort_code)</div><div class='ctx'> {</div><div class='ctx'> 	const char *m;</div><div class='ctx'> </div><div class='hunk'>@@ -81,7 +122,8 @@ static void afs_busy(struct afs_volume *volume, u32 abort_code)</div><div class='ctx'> 	default:		m = "busy";		break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	pr_notice("kAFS: Volume %llu '%s' is %s\n", volume-&gt;vid, volume-&gt;name, m);</div><div class='add'>+	pr_notice("kAFS: Volume %llu '%s' on server %pU is %s\n",</div><div class='add'>+		  op-&gt;volume-&gt;vid, op-&gt;volume-&gt;name, &amp;op-&gt;server-&gt;uuid, m);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -89,10 +131,11 @@ static void afs_busy(struct afs_volume *volume, u32 abort_code)</div><div class='ctx'>  */</div><div class='ctx'> static bool afs_sleep_and_retry(struct afs_operation *op)</div><div class='ctx'> {</div><div class='add'>+	trace_afs_rotate(op, afs_rotate_trace_busy_sleep, 0);</div><div class='ctx'> 	if (!(op-&gt;flags &amp; AFS_OPERATION_UNINTR)) {</div><div class='ctx'> 		msleep_interruptible(1000);</div><div class='ctx'> 		if (signal_pending(current)) {</div><div class='del'>-			op-&gt;error = -ERESTARTSYS;</div><div class='add'>+			afs_op_set_error(op, -ERESTARTSYS);</div><div class='ctx'> 			return false;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -111,62 +154,105 @@ bool afs_select_fileserver(struct afs_operation *op)</div><div class='ctx'> 	struct afs_addr_list *alist;</div><div class='ctx'> 	struct afs_server *server;</div><div class='ctx'> 	struct afs_vnode *vnode = op-&gt;file[0].vnode;</div><div class='del'>-	struct afs_error e;</div><div class='del'>-	u32 rtt;</div><div class='del'>-	int error = op-&gt;ac.error, i;</div><div class='add'>+	unsigned long set, failed;</div><div class='add'>+	s32 abort_code = op-&gt;call_abort_code;</div><div class='add'>+	int best_prio = 0;</div><div class='add'>+	int error = op-&gt;call_error, addr_index, i, j;</div><div class='ctx'> </div><div class='del'>-	_enter("%lx[%d],%lx[%d],%d,%d",</div><div class='del'>-	       op-&gt;untried, op-&gt;index,</div><div class='del'>-	       op-&gt;ac.tried, op-&gt;ac.index,</div><div class='del'>-	       error, op-&gt;ac.abort_code);</div><div class='add'>+	op-&gt;nr_iterations++;</div><div class='add'>+</div><div class='add'>+	_enter("OP=%x+%x,%llx,%u{%lx},%u{%lx},%d,%d",</div><div class='add'>+	       op-&gt;debug_id, op-&gt;nr_iterations, op-&gt;volume-&gt;vid,</div><div class='add'>+	       op-&gt;server_index, op-&gt;untried_servers,</div><div class='add'>+	       op-&gt;addr_index, op-&gt;addr_tried,</div><div class='add'>+	       error, abort_code);</div><div class='ctx'> </div><div class='ctx'> 	if (op-&gt;flags &amp; AFS_OPERATION_STOP) {</div><div class='add'>+		trace_afs_rotate(op, afs_rotate_trace_stopped, 0);</div><div class='ctx'> 		_leave(" = f [stopped]");</div><div class='ctx'> 		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	op-&gt;nr_iterations++;</div><div class='del'>-</div><div class='del'>-	/* Evaluate the result of the previous operation, if there was one. */</div><div class='del'>-	switch (error) {</div><div class='del'>-	case SHRT_MAX:</div><div class='add'>+	if (op-&gt;nr_iterations == 0)</div><div class='ctx'> 		goto start;</div><div class='ctx'> </div><div class='add'>+	WRITE_ONCE(op-&gt;estate-&gt;addresses-&gt;addrs[op-&gt;addr_index].last_error, error);</div><div class='add'>+	trace_afs_rotate(op, afs_rotate_trace_iter, op-&gt;call_error);</div><div class='add'>+</div><div class='add'>+	/* Evaluate the result of the previous operation, if there was one. */</div><div class='add'>+	switch (op-&gt;call_error) {</div><div class='ctx'> 	case 0:</div><div class='add'>+		clear_bit(AFS_SE_VOLUME_OFFLINE,</div><div class='add'>+			  &amp;op-&gt;server_list-&gt;servers[op-&gt;server_index].flags);</div><div class='add'>+		clear_bit(AFS_SE_VOLUME_BUSY,</div><div class='add'>+			  &amp;op-&gt;server_list-&gt;servers[op-&gt;server_index].flags);</div><div class='add'>+		op-&gt;cumul_error.responded = true;</div><div class='add'>+</div><div class='add'>+		/* We succeeded, but we may need to redo the op from another</div><div class='add'>+		 * server if we're looking at a set of RO volumes where some of</div><div class='add'>+		 * the servers have not yet been brought up to date lest we</div><div class='add'>+		 * regress the data.  We only switch to the new version once</div><div class='add'>+		 * &gt;=50% of the servers are updated.</div><div class='add'>+		 */</div><div class='add'>+		error = afs_update_volume_state(op);</div><div class='add'>+		if (error != 0) {</div><div class='add'>+			if (error == 1) {</div><div class='add'>+				afs_sleep_and_retry(op);</div><div class='add'>+				goto restart_from_beginning;</div><div class='add'>+			}</div><div class='add'>+			afs_op_set_error(op, error);</div><div class='add'>+			goto failed;</div><div class='add'>+		}</div><div class='add'>+		fallthrough;</div><div class='ctx'> 	default:</div><div class='ctx'> 		/* Success or local failure.  Stop. */</div><div class='del'>-		op-&gt;error = error;</div><div class='add'>+		afs_op_set_error(op, error);</div><div class='ctx'> 		op-&gt;flags |= AFS_OPERATION_STOP;</div><div class='add'>+		trace_afs_rotate(op, afs_rotate_trace_stop, error);</div><div class='ctx'> 		_leave(" = f [okay/local %d]", error);</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='ctx'> 	case -ECONNABORTED:</div><div class='ctx'> 		/* The far side rejected the operation on some grounds.  This</div><div class='ctx'> 		 * might involve the server being busy or the volume having been moved.</div><div class='add'>+		 *</div><div class='add'>+		 * Note that various V* errors should not be sent to a cache manager</div><div class='add'>+		 * by a fileserver as they should be translated to more modern UAE*</div><div class='add'>+		 * errors instead.  IBM AFS and OpenAFS fileservers, however, do leak</div><div class='add'>+		 * these abort codes.</div><div class='ctx'> 		 */</div><div class='del'>-		switch (op-&gt;ac.abort_code) {</div><div class='add'>+		trace_afs_rotate(op, afs_rotate_trace_aborted, abort_code);</div><div class='add'>+		op-&gt;cumul_error.responded = true;</div><div class='add'>+		switch (abort_code) {</div><div class='ctx'> 		case VNOVOL:</div><div class='ctx'> 			/* This fileserver doesn't know about the volume.</div><div class='ctx'> 			 * - May indicate that the VL is wrong - retry once and compare</div><div class='ctx'> 			 *   the results.</div><div class='ctx'> 			 * - May indicate that the fileserver couldn't attach to the vol.</div><div class='add'>+			 * - The volume might have been temporarily removed so that it can</div><div class='add'>+			 *   be replaced by a volume restore.  "vos" might have ended one</div><div class='add'>+			 *   transaction and has yet to create the next.</div><div class='add'>+			 * - The volume might not be blessed or might not be in-service</div><div class='add'>+			 *   (administrative action).</div><div class='ctx'> 			 */</div><div class='ctx'> 			if (op-&gt;flags &amp; AFS_OPERATION_VNOVOL) {</div><div class='del'>-				op-&gt;error = -EREMOTEIO;</div><div class='add'>+				afs_op_accumulate_error(op, -EREMOTEIO, abort_code);</div><div class='ctx'> 				goto next_server;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			write_lock(&amp;op-&gt;volume-&gt;servers_lock);</div><div class='del'>-			op-&gt;server_list-&gt;vnovol_mask |= 1 &lt;&lt; op-&gt;index;</div><div class='add'>+			op-&gt;server_list-&gt;vnovol_mask |= 1 &lt;&lt; op-&gt;server_index;</div><div class='ctx'> 			write_unlock(&amp;op-&gt;volume-&gt;servers_lock);</div><div class='ctx'> </div><div class='ctx'> 			set_bit(AFS_VOLUME_NEEDS_UPDATE, &amp;op-&gt;volume-&gt;flags);</div><div class='ctx'> 			error = afs_check_volume_status(op-&gt;volume, op);</div><div class='del'>-			if (error &lt; 0)</div><div class='del'>-				goto failed_set_error;</div><div class='add'>+			if (error &lt; 0) {</div><div class='add'>+				afs_op_set_error(op, error);</div><div class='add'>+				goto failed;</div><div class='add'>+			}</div><div class='ctx'> </div><div class='ctx'> 			if (test_bit(AFS_VOLUME_DELETED, &amp;op-&gt;volume-&gt;flags)) {</div><div class='del'>-				op-&gt;error = -ENOMEDIUM;</div><div class='add'>+				afs_op_set_error(op, -ENOMEDIUM);</div><div class='ctx'> 				goto failed;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='hunk'>@@ -174,7 +260,7 @@ bool afs_select_fileserver(struct afs_operation *op)</div><div class='ctx'> 			 * it's the fileserver having trouble.</div><div class='ctx'> 			 */</div><div class='ctx'> 			if (rcu_access_pointer(op-&gt;volume-&gt;servers) == op-&gt;server_list) {</div><div class='del'>-				op-&gt;error = -EREMOTEIO;</div><div class='add'>+				afs_op_accumulate_error(op, -EREMOTEIO, abort_code);</div><div class='ctx'> 				goto next_server;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='hunk'>@@ -183,50 +269,99 @@ bool afs_select_fileserver(struct afs_operation *op)</div><div class='ctx'> 			_leave(" = t [vnovol]");</div><div class='ctx'> 			return true;</div><div class='ctx'> </div><div class='del'>-		case VSALVAGE: /* TODO: Should this return an error or iterate? */</div><div class='ctx'> 		case VVOLEXISTS:</div><div class='del'>-		case VNOSERVICE:</div><div class='ctx'> 		case VONLINE:</div><div class='del'>-		case VDISKFULL:</div><div class='del'>-		case VOVERQUOTA:</div><div class='del'>-			op-&gt;error = afs_abort_to_error(op-&gt;ac.abort_code);</div><div class='add'>+			/* These should not be returned from the fileserver. */</div><div class='add'>+			pr_warn("Fileserver returned unexpected abort %d\n",</div><div class='add'>+				abort_code);</div><div class='add'>+			afs_op_accumulate_error(op, -EREMOTEIO, abort_code);</div><div class='ctx'> 			goto next_server;</div><div class='ctx'> </div><div class='add'>+		case VNOSERVICE:</div><div class='add'>+			/* Prior to AFS 3.2 VNOSERVICE was returned from the fileserver</div><div class='add'>+			 * if the volume was neither in-service nor administratively</div><div class='add'>+			 * blessed.  All usage was replaced by VNOVOL because AFS 3.1 and</div><div class='add'>+			 * earlier cache managers did not handle VNOSERVICE and assumed</div><div class='add'>+			 * it was the client OSes errno 105.</div><div class='add'>+			 *</div><div class='add'>+			 * Starting with OpenAFS 1.4.8 VNOSERVICE was repurposed as the</div><div class='add'>+			 * fileserver idle dead time error which was sent in place of</div><div class='add'>+			 * RX_CALL_TIMEOUT (-3).  The error was intended to be sent if the</div><div class='add'>+			 * fileserver took too long to send a reply to the client.</div><div class='add'>+			 * RX_CALL_TIMEOUT would have caused the cache manager to mark the</div><div class='add'>+			 * server down whereas VNOSERVICE since AFS 3.2 would cause cache</div><div class='add'>+			 * manager to temporarily (up to 15 minutes) mark the volume</div><div class='add'>+			 * instance as unusable.</div><div class='add'>+			 *</div><div class='add'>+			 * The idle dead logic resulted in cache inconsistency since a</div><div class='add'>+			 * state changing call that the cache manager assumed was dead</div><div class='add'>+			 * could still be processed to completion by the fileserver.  This</div><div class='add'>+			 * logic was removed in OpenAFS 1.8.0 and VNOSERVICE is no longer</div><div class='add'>+			 * returned.  However, many 1.4.8 through 1.6.24 fileservers are</div><div class='add'>+			 * still in existence.</div><div class='add'>+			 *</div><div class='add'>+			 * AuriStorFS fileservers have never returned VNOSERVICE.</div><div class='add'>+			 *</div><div class='add'>+			 * VNOSERVICE should be treated as an alias for RX_CALL_TIMEOUT.</div><div class='add'>+			 */</div><div class='add'>+		case RX_CALL_TIMEOUT:</div><div class='add'>+			afs_op_accumulate_error(op, -ETIMEDOUT, abort_code);</div><div class='add'>+			goto next_server;</div><div class='add'>+</div><div class='add'>+		case VSALVAGING: /* This error should not be leaked to cache managers</div><div class='add'>+				  * but is from OpenAFS demand attach fileservers.</div><div class='add'>+				  * It should be treated as an alias for VOFFLINE.</div><div class='add'>+				  */</div><div class='add'>+		case VSALVAGE: /* VSALVAGE should be treated as a synonym of VOFFLINE */</div><div class='ctx'> 		case VOFFLINE:</div><div class='del'>-			if (!test_and_set_bit(AFS_VOLUME_OFFLINE, &amp;op-&gt;volume-&gt;flags)) {</div><div class='del'>-				afs_busy(op-&gt;volume, op-&gt;ac.abort_code);</div><div class='del'>-				clear_bit(AFS_VOLUME_BUSY, &amp;op-&gt;volume-&gt;flags);</div><div class='add'>+			/* The volume is in use by the volserver or another volume utility</div><div class='add'>+			 * for an operation that might alter the contents.  The volume is</div><div class='add'>+			 * expected to come back but it might take a long time (could be</div><div class='add'>+			 * days).</div><div class='add'>+			 */</div><div class='add'>+			if (!test_and_set_bit(AFS_SE_VOLUME_OFFLINE,</div><div class='add'>+					      &amp;op-&gt;server_list-&gt;servers[op-&gt;server_index].flags)) {</div><div class='add'>+				afs_busy(op, abort_code);</div><div class='add'>+				clear_bit(AFS_SE_VOLUME_BUSY,</div><div class='add'>+					  &amp;op-&gt;server_list-&gt;servers[op-&gt;server_index].flags);</div><div class='ctx'> 			}</div><div class='ctx'> 			if (op-&gt;flags &amp; AFS_OPERATION_NO_VSLEEP) {</div><div class='del'>-				op-&gt;error = -EADV;</div><div class='del'>-				goto failed;</div><div class='del'>-			}</div><div class='del'>-			if (op-&gt;flags &amp; AFS_OPERATION_CUR_ONLY) {</div><div class='del'>-				op-&gt;error = -ESTALE;</div><div class='add'>+				afs_op_set_error(op, -EADV);</div><div class='ctx'> 				goto failed;</div><div class='ctx'> 			}</div><div class='ctx'> 			goto busy;</div><div class='ctx'> </div><div class='del'>-		case VSALVAGING:</div><div class='del'>-		case VRESTARTING:</div><div class='add'>+		case VRESTARTING: /* The fileserver is either shutting down or starting up. */</div><div class='ctx'> 		case VBUSY:</div><div class='del'>-			/* Retry after going round all the servers unless we</div><div class='del'>-			 * have a file lock we need to maintain.</div><div class='add'>+			/* The volume is in use by the volserver or another volume</div><div class='add'>+			 * utility for an operation that is not expected to alter the</div><div class='add'>+			 * contents of the volume.  VBUSY does not need to be returned</div><div class='add'>+			 * for a ROVOL or BACKVOL bound to an ITBusy volserver</div><div class='add'>+			 * transaction.  The fileserver is permitted to continue serving</div><div class='add'>+			 * content from ROVOLs and BACKVOLs during an ITBusy transaction</div><div class='add'>+			 * because the content will not change.  However, many fileserver</div><div class='add'>+			 * releases do return VBUSY for ROVOL and BACKVOL instances under</div><div class='add'>+			 * many circumstances.</div><div class='add'>+			 *</div><div class='add'>+			 * Retry after going round all the servers unless we have a file</div><div class='add'>+			 * lock we need to maintain.</div><div class='ctx'> 			 */</div><div class='ctx'> 			if (op-&gt;flags &amp; AFS_OPERATION_NO_VSLEEP) {</div><div class='del'>-				op-&gt;error = -EBUSY;</div><div class='add'>+				afs_op_set_error(op, -EBUSY);</div><div class='ctx'> 				goto failed;</div><div class='ctx'> 			}</div><div class='del'>-			if (!test_and_set_bit(AFS_VOLUME_BUSY, &amp;op-&gt;volume-&gt;flags)) {</div><div class='del'>-				afs_busy(op-&gt;volume, op-&gt;ac.abort_code);</div><div class='del'>-				clear_bit(AFS_VOLUME_OFFLINE, &amp;op-&gt;volume-&gt;flags);</div><div class='add'>+			if (!test_and_set_bit(AFS_SE_VOLUME_BUSY,</div><div class='add'>+					      &amp;op-&gt;server_list-&gt;servers[op-&gt;server_index].flags)) {</div><div class='add'>+				afs_busy(op, abort_code);</div><div class='add'>+				clear_bit(AFS_SE_VOLUME_OFFLINE,</div><div class='add'>+					  &amp;op-&gt;server_list-&gt;servers[op-&gt;server_index].flags);</div><div class='ctx'> 			}</div><div class='ctx'> 		busy:</div><div class='ctx'> 			if (op-&gt;flags &amp; AFS_OPERATION_CUR_ONLY) {</div><div class='ctx'> 				if (!afs_sleep_and_retry(op))</div><div class='ctx'> 					goto failed;</div><div class='ctx'> </div><div class='del'>-				 /* Retry with same server &amp; address */</div><div class='add'>+				/* Retry with same server &amp; address */</div><div class='ctx'> 				_leave(" = t [vbusy]");</div><div class='ctx'> 				return true;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -243,7 +378,7 @@ bool afs_select_fileserver(struct afs_operation *op)</div><div class='ctx'> 			 * honour, just in case someone sets up a loop.</div><div class='ctx'> 			 */</div><div class='ctx'> 			if (op-&gt;flags &amp; AFS_OPERATION_VMOVED) {</div><div class='del'>-				op-&gt;error = -EREMOTEIO;</div><div class='add'>+				afs_op_set_error(op, -EREMOTEIO);</div><div class='ctx'> 				goto failed;</div><div class='ctx'> 			}</div><div class='ctx'> 			op-&gt;flags |= AFS_OPERATION_VMOVED;</div><div class='hunk'>@@ -251,8 +386,10 @@ bool afs_select_fileserver(struct afs_operation *op)</div><div class='ctx'> 			set_bit(AFS_VOLUME_WAIT, &amp;op-&gt;volume-&gt;flags);</div><div class='ctx'> 			set_bit(AFS_VOLUME_NEEDS_UPDATE, &amp;op-&gt;volume-&gt;flags);</div><div class='ctx'> 			error = afs_check_volume_status(op-&gt;volume, op);</div><div class='del'>-			if (error &lt; 0)</div><div class='del'>-				goto failed_set_error;</div><div class='add'>+			if (error &lt; 0) {</div><div class='add'>+				afs_op_set_error(op, error);</div><div class='add'>+				goto failed;</div><div class='add'>+			}</div><div class='ctx'> </div><div class='ctx'> 			/* If the server list didn't change, then the VLDB is</div><div class='ctx'> 			 * out of sync with the fileservers.  This is hopefully</div><div class='hunk'>@@ -264,22 +401,60 @@ bool afs_select_fileserver(struct afs_operation *op)</div><div class='ctx'> 			 * TODO: Retry a few times with sleeps.</div><div class='ctx'> 			 */</div><div class='ctx'> 			if (rcu_access_pointer(op-&gt;volume-&gt;servers) == op-&gt;server_list) {</div><div class='del'>-				op-&gt;error = -ENOMEDIUM;</div><div class='add'>+				afs_op_accumulate_error(op, -ENOMEDIUM, abort_code);</div><div class='ctx'> 				goto failed;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			goto restart_from_beginning;</div><div class='ctx'> </div><div class='add'>+		case UAEIO:</div><div class='add'>+		case VIO:</div><div class='add'>+			afs_op_accumulate_error(op, -EREMOTEIO, abort_code);</div><div class='add'>+			if (op-&gt;volume-&gt;type != AFSVL_RWVOL)</div><div class='add'>+				goto next_server;</div><div class='add'>+			goto failed;</div><div class='add'>+</div><div class='add'>+		case VDISKFULL:</div><div class='add'>+		case UAENOSPC:</div><div class='add'>+			/* The partition is full.  Only applies to RWVOLs.</div><div class='add'>+			 * Translate locally and return ENOSPC.</div><div class='add'>+			 * No replicas to failover to.</div><div class='add'>+			 */</div><div class='add'>+			afs_op_set_error(op, -ENOSPC);</div><div class='add'>+			goto failed_but_online;</div><div class='add'>+</div><div class='add'>+		case VOVERQUOTA:</div><div class='add'>+		case UAEDQUOT:</div><div class='add'>+			/* Volume is full.  Only applies to RWVOLs.</div><div class='add'>+			 * Translate locally and return EDQUOT.</div><div class='add'>+			 * No replicas to failover to.</div><div class='add'>+			 */</div><div class='add'>+			afs_op_set_error(op, -EDQUOT);</div><div class='add'>+			goto failed_but_online;</div><div class='add'>+</div><div class='add'>+		case RX_INVALID_OPERATION:</div><div class='add'>+		case RXGEN_OPCODE:</div><div class='add'>+			/* Handle downgrading to an older operation. */</div><div class='add'>+			afs_op_set_error(op, -ENOTSUPP);</div><div class='add'>+			if (op-&gt;flags &amp; AFS_OPERATION_DOWNGRADE) {</div><div class='add'>+				op-&gt;flags &amp;= ~AFS_OPERATION_DOWNGRADE;</div><div class='add'>+				goto go_again;</div><div class='add'>+			}</div><div class='add'>+			goto failed_but_online;</div><div class='add'>+</div><div class='ctx'> 		default:</div><div class='del'>-			clear_bit(AFS_VOLUME_OFFLINE, &amp;op-&gt;volume-&gt;flags);</div><div class='del'>-			clear_bit(AFS_VOLUME_BUSY, &amp;op-&gt;volume-&gt;flags);</div><div class='del'>-			op-&gt;error = afs_abort_to_error(op-&gt;ac.abort_code);</div><div class='add'>+			afs_op_accumulate_error(op, error, abort_code);</div><div class='add'>+		failed_but_online:</div><div class='add'>+			clear_bit(AFS_SE_VOLUME_OFFLINE,</div><div class='add'>+				  &amp;op-&gt;server_list-&gt;servers[op-&gt;server_index].flags);</div><div class='add'>+			clear_bit(AFS_SE_VOLUME_BUSY,</div><div class='add'>+				  &amp;op-&gt;server_list-&gt;servers[op-&gt;server_index].flags);</div><div class='ctx'> 			goto failed;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 	case -ETIMEDOUT:</div><div class='ctx'> 	case -ETIME:</div><div class='del'>-		if (op-&gt;error != -EDESTADDRREQ)</div><div class='add'>+		if (afs_op_error(op) != -EDESTADDRREQ)</div><div class='ctx'> 			goto iterate_address;</div><div class='ctx'> 		fallthrough;</div><div class='ctx'> 	case -ERFKILL:</div><div class='hunk'>@@ -289,29 +464,40 @@ bool afs_select_fileserver(struct afs_operation *op)</div><div class='ctx'> 	case -EHOSTDOWN:</div><div class='ctx'> 	case -ECONNREFUSED:</div><div class='ctx'> 		_debug("no conn");</div><div class='del'>-		op-&gt;error = error;</div><div class='add'>+		afs_op_accumulate_error(op, error, 0);</div><div class='ctx'> 		goto iterate_address;</div><div class='ctx'> </div><div class='add'>+	case -ENETRESET:</div><div class='add'>+		pr_warn("kAFS: Peer reset %s (op=%x)\n",</div><div class='add'>+			op-&gt;type ? op-&gt;type-&gt;name : "???", op-&gt;debug_id);</div><div class='add'>+		fallthrough;</div><div class='ctx'> 	case -ECONNRESET:</div><div class='ctx'> 		_debug("call reset");</div><div class='del'>-		op-&gt;error = error;</div><div class='add'>+		afs_op_set_error(op, error);</div><div class='ctx'> 		goto failed;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> restart_from_beginning:</div><div class='add'>+	trace_afs_rotate(op, afs_rotate_trace_restart, 0);</div><div class='ctx'> 	_debug("restart");</div><div class='del'>-	afs_end_cursor(&amp;op-&gt;ac);</div><div class='add'>+	op-&gt;estate = NULL;</div><div class='ctx'> 	op-&gt;server = NULL;</div><div class='add'>+	afs_clear_server_states(op);</div><div class='add'>+	op-&gt;server_states = NULL;</div><div class='ctx'> 	afs_put_serverlist(op-&gt;net, op-&gt;server_list);</div><div class='ctx'> 	op-&gt;server_list = NULL;</div><div class='ctx'> start:</div><div class='ctx'> 	_debug("start");</div><div class='add'>+	ASSERTCMP(op-&gt;estate, ==, NULL);</div><div class='ctx'> 	/* See if we need to do an update of the volume record.  Note that the</div><div class='ctx'> 	 * volume may have moved or even have been deleted.</div><div class='ctx'> 	 */</div><div class='ctx'> 	error = afs_check_volume_status(op-&gt;volume, op);</div><div class='del'>-	if (error &lt; 0)</div><div class='del'>-		goto failed_set_error;</div><div class='add'>+	trace_afs_rotate(op, afs_rotate_trace_check_vol_status, error);</div><div class='add'>+	if (error &lt; 0) {</div><div class='add'>+		afs_op_set_error(op, error);</div><div class='add'>+		goto failed;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (!afs_start_fs_iteration(op, vnode))</div><div class='ctx'> 		goto failed;</div><div class='hunk'>@@ -319,52 +505,85 @@ start:</div><div class='ctx'> 	_debug("__ VOL %llx __", op-&gt;volume-&gt;vid);</div><div class='ctx'> </div><div class='ctx'> pick_server:</div><div class='del'>-	_debug("pick [%lx]", op-&gt;untried);</div><div class='add'>+	_debug("pick [%lx]", op-&gt;untried_servers);</div><div class='add'>+	ASSERTCMP(op-&gt;estate, ==, NULL);</div><div class='ctx'> </div><div class='del'>-	error = afs_wait_for_fs_probes(op-&gt;server_list, op-&gt;untried);</div><div class='del'>-	if (error &lt; 0)</div><div class='del'>-		goto failed_set_error;</div><div class='add'>+	error = afs_wait_for_fs_probes(op, op-&gt;server_states,</div><div class='add'>+				       !(op-&gt;flags &amp; AFS_OPERATION_UNINTR));</div><div class='add'>+	switch (error) {</div><div class='add'>+	case 0: /* No untried responsive servers and no outstanding probes */</div><div class='add'>+		trace_afs_rotate(op, afs_rotate_trace_probe_none, 0);</div><div class='add'>+		goto no_more_servers;</div><div class='add'>+	case 1: /* Got a response */</div><div class='add'>+		trace_afs_rotate(op, afs_rotate_trace_probe_response, 0);</div><div class='add'>+		break;</div><div class='add'>+	case 2: /* Probe data superseded */</div><div class='add'>+		trace_afs_rotate(op, afs_rotate_trace_probe_superseded, 0);</div><div class='add'>+		goto restart_from_beginning;</div><div class='add'>+	default:</div><div class='add'>+		trace_afs_rotate(op, afs_rotate_trace_probe_error, error);</div><div class='add'>+		afs_op_set_error(op, error);</div><div class='add'>+		goto failed;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	/* Pick the untried server with the lowest RTT.  If we have outstanding</div><div class='del'>-	 * callbacks, we stick with the server we're already using if we can.</div><div class='add'>+	/* Pick the untried server with the highest priority untried endpoint.</div><div class='add'>+	 * If we have outstanding callbacks, we stick with the server we're</div><div class='add'>+	 * already using if we can.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (op-&gt;server) {</div><div class='del'>-		_debug("server %u", op-&gt;index);</div><div class='del'>-		if (test_bit(op-&gt;index, &amp;op-&gt;untried))</div><div class='add'>+		_debug("server %u", op-&gt;server_index);</div><div class='add'>+		if (test_bit(op-&gt;server_index, &amp;op-&gt;untried_servers))</div><div class='ctx'> 			goto selected_server;</div><div class='ctx'> 		op-&gt;server = NULL;</div><div class='ctx'> 		_debug("no server");</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	op-&gt;index = -1;</div><div class='del'>-	rtt = U32_MAX;</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	op-&gt;server_index = -1;</div><div class='add'>+	best_prio = -1;</div><div class='ctx'> 	for (i = 0; i &lt; op-&gt;server_list-&gt;nr_servers; i++) {</div><div class='del'>-		struct afs_server *s = op-&gt;server_list-&gt;servers[i].server;</div><div class='add'>+		struct afs_endpoint_state *es;</div><div class='add'>+		struct afs_server_entry *se = &amp;op-&gt;server_list-&gt;servers[i];</div><div class='add'>+		struct afs_addr_list *sal;</div><div class='add'>+		struct afs_server *s = se-&gt;server;</div><div class='ctx'> </div><div class='del'>-		if (!test_bit(i, &amp;op-&gt;untried) ||</div><div class='add'>+		if (!test_bit(i, &amp;op-&gt;untried_servers) ||</div><div class='add'>+		    test_bit(AFS_SE_EXCLUDED, &amp;se-&gt;flags) ||</div><div class='ctx'> 		    !test_bit(AFS_SERVER_FL_RESPONDING, &amp;s-&gt;flags))</div><div class='ctx'> 			continue;</div><div class='del'>-		if (s-&gt;probe.rtt &lt; rtt) {</div><div class='del'>-			op-&gt;index = i;</div><div class='del'>-			rtt = s-&gt;probe.rtt;</div><div class='add'>+		es = op-&gt;server_states[i].endpoint_state;</div><div class='add'>+		sal = es-&gt;addresses;</div><div class='add'>+</div><div class='add'>+		afs_get_address_preferences_rcu(op-&gt;net, sal);</div><div class='add'>+		for (j = 0; j &lt; sal-&gt;nr_addrs; j++) {</div><div class='add'>+			if (es-&gt;failed_set &amp; (1 &lt;&lt; j))</div><div class='add'>+				continue;</div><div class='add'>+			if (!sal-&gt;addrs[j].peer)</div><div class='add'>+				continue;</div><div class='add'>+			if (sal-&gt;addrs[j].prio &gt; best_prio) {</div><div class='add'>+				op-&gt;server_index = i;</div><div class='add'>+				best_prio = sal-&gt;addrs[j].prio;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='add'>+	rcu_read_unlock();</div><div class='ctx'> </div><div class='del'>-	if (op-&gt;index == -1)</div><div class='add'>+	if (op-&gt;server_index == -1)</div><div class='ctx'> 		goto no_more_servers;</div><div class='ctx'> </div><div class='ctx'> selected_server:</div><div class='del'>-	_debug("use %d", op-&gt;index);</div><div class='del'>-	__clear_bit(op-&gt;index, &amp;op-&gt;untried);</div><div class='add'>+	trace_afs_rotate(op, afs_rotate_trace_selected_server, best_prio);</div><div class='add'>+	_debug("use %d prio %u", op-&gt;server_index, best_prio);</div><div class='add'>+	__clear_bit(op-&gt;server_index, &amp;op-&gt;untried_servers);</div><div class='ctx'> </div><div class='ctx'> 	/* We're starting on a different fileserver from the list.  We need to</div><div class='ctx'> 	 * check it, create a callback intercept, find its address list and</div><div class='ctx'> 	 * probe its capabilities before we use it.</div><div class='ctx'> 	 */</div><div class='del'>-	ASSERTCMP(op-&gt;ac.alist, ==, NULL);</div><div class='del'>-	server = op-&gt;server_list-&gt;servers[op-&gt;index].server;</div><div class='add'>+	ASSERTCMP(op-&gt;estate, ==, NULL);</div><div class='add'>+	server = op-&gt;server_list-&gt;servers[op-&gt;server_index].server;</div><div class='ctx'> </div><div class='del'>-	if (!afs_check_server_record(op, server))</div><div class='add'>+	if (!afs_check_server_record(op, server, op-&gt;key))</div><div class='ctx'> 		goto failed;</div><div class='ctx'> </div><div class='ctx'> 	_debug("USING SERVER: %pU", &amp;server-&gt;uuid);</div><div class='hunk'>@@ -373,58 +592,81 @@ selected_server:</div><div class='ctx'> 	op-&gt;server = server;</div><div class='ctx'> 	if (vnode-&gt;cb_server != server) {</div><div class='ctx'> 		vnode-&gt;cb_server = server;</div><div class='del'>-		vnode-&gt;cb_s_break = server-&gt;cb_s_break;</div><div class='del'>-		vnode-&gt;cb_fs_s_break = atomic_read(&amp;server-&gt;cell-&gt;fs_s_break);</div><div class='del'>-		vnode-&gt;cb_v_break = vnode-&gt;volume-&gt;cb_v_break;</div><div class='del'>-		clear_bit(AFS_VNODE_CB_PROMISED, &amp;vnode-&gt;flags);</div><div class='add'>+		vnode-&gt;cb_v_check = atomic_read(&amp;vnode-&gt;volume-&gt;cb_v_break);</div><div class='add'>+		afs_clear_cb_promise(vnode, afs_cb_promise_clear_server_change);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	read_lock(&amp;server-&gt;fs_lock);</div><div class='del'>-	alist = rcu_dereference_protected(server-&gt;addresses,</div><div class='del'>-					  lockdep_is_held(&amp;server-&gt;fs_lock));</div><div class='del'>-	afs_get_addrlist(alist);</div><div class='del'>-	read_unlock(&amp;server-&gt;fs_lock);</div><div class='del'>-</div><div class='ctx'> retry_server:</div><div class='del'>-	memset(&amp;op-&gt;ac, 0, sizeof(op-&gt;ac));</div><div class='del'>-</div><div class='del'>-	if (!op-&gt;ac.alist)</div><div class='del'>-		op-&gt;ac.alist = alist;</div><div class='del'>-	else</div><div class='del'>-		afs_put_addrlist(alist);</div><div class='del'>-</div><div class='del'>-	op-&gt;ac.index = -1;</div><div class='add'>+	op-&gt;addr_tried = 0;</div><div class='add'>+	op-&gt;addr_index = -1;</div><div class='ctx'> </div><div class='ctx'> iterate_address:</div><div class='del'>-	ASSERT(op-&gt;ac.alist);</div><div class='ctx'> 	/* Iterate over the current server's address list to try and find an</div><div class='ctx'> 	 * address on which it will respond to us.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!afs_iterate_addresses(&amp;op-&gt;ac))</div><div class='del'>-		goto out_of_addresses;</div><div class='add'>+	op-&gt;estate = op-&gt;server_states[op-&gt;server_index].endpoint_state;</div><div class='add'>+	set = READ_ONCE(op-&gt;estate-&gt;responsive_set);</div><div class='add'>+	failed = READ_ONCE(op-&gt;estate-&gt;failed_set);</div><div class='add'>+	_debug("iterate ES=%x rs=%lx fs=%lx", op-&gt;estate-&gt;probe_seq, set, failed);</div><div class='add'>+	set &amp;= ~(failed | op-&gt;addr_tried);</div><div class='add'>+	trace_afs_rotate(op, afs_rotate_trace_iterate_addr, set);</div><div class='add'>+	if (!set)</div><div class='add'>+		goto wait_for_more_probe_results;</div><div class='add'>+</div><div class='add'>+	alist = op-&gt;estate-&gt;addresses;</div><div class='add'>+	best_prio = -1;</div><div class='add'>+	addr_index = 0;</div><div class='add'>+	for (i = 0; i &lt; alist-&gt;nr_addrs; i++) {</div><div class='add'>+		if (!(set &amp; (1 &lt;&lt; i)))</div><div class='add'>+			continue;</div><div class='add'>+		if (alist-&gt;addrs[i].prio &gt; best_prio) {</div><div class='add'>+			addr_index = i;</div><div class='add'>+			best_prio = alist-&gt;addrs[i].prio;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	_debug("address [%u] %u/%u %pISp",</div><div class='del'>-	       op-&gt;index, op-&gt;ac.index, op-&gt;ac.alist-&gt;nr_addrs,</div><div class='del'>-	       &amp;op-&gt;ac.alist-&gt;addrs[op-&gt;ac.index].transport);</div><div class='add'>+	alist-&gt;preferred = addr_index;</div><div class='add'>+</div><div class='add'>+	op-&gt;addr_index = addr_index;</div><div class='add'>+	set_bit(addr_index, &amp;op-&gt;addr_tried);</div><div class='ctx'> </div><div class='add'>+	_debug("address [%u] %u/%u %pISp",</div><div class='add'>+	       op-&gt;server_index, addr_index, alist-&gt;nr_addrs,</div><div class='add'>+	       rxrpc_kernel_remote_addr(alist-&gt;addrs[op-&gt;addr_index].peer));</div><div class='add'>+go_again:</div><div class='add'>+	op-&gt;volsync.creation = TIME64_MIN;</div><div class='add'>+	op-&gt;volsync.update = TIME64_MIN;</div><div class='add'>+	op-&gt;call_responded = false;</div><div class='ctx'> 	_leave(" = t");</div><div class='ctx'> 	return true;</div><div class='ctx'> </div><div class='del'>-out_of_addresses:</div><div class='add'>+wait_for_more_probe_results:</div><div class='add'>+	error = afs_wait_for_one_fs_probe(op-&gt;server, op-&gt;estate, op-&gt;addr_tried,</div><div class='add'>+					  !(op-&gt;flags &amp; AFS_OPERATION_UNINTR));</div><div class='add'>+	if (error == 1)</div><div class='add'>+		goto iterate_address;</div><div class='add'>+	if (!error)</div><div class='add'>+		goto restart_from_beginning;</div><div class='add'>+</div><div class='ctx'> 	/* We've now had a failure to respond on all of a server's addresses -</div><div class='ctx'> 	 * immediately probe them again and consider retrying the server.</div><div class='ctx'> 	 */</div><div class='add'>+	trace_afs_rotate(op, afs_rotate_trace_probe_fileserver, 0);</div><div class='ctx'> 	afs_probe_fileserver(op-&gt;net, op-&gt;server);</div><div class='ctx'> 	if (op-&gt;flags &amp; AFS_OPERATION_RETRY_SERVER) {</div><div class='del'>-		alist = op-&gt;ac.alist;</div><div class='del'>-		error = afs_wait_for_one_fs_probe(</div><div class='del'>-			op-&gt;server, !(op-&gt;flags &amp; AFS_OPERATION_UNINTR));</div><div class='add'>+		error = afs_wait_for_one_fs_probe(op-&gt;server, op-&gt;estate, op-&gt;addr_tried,</div><div class='add'>+						  !(op-&gt;flags &amp; AFS_OPERATION_UNINTR));</div><div class='ctx'> 		switch (error) {</div><div class='del'>-		case 0:</div><div class='add'>+		case 1:</div><div class='ctx'> 			op-&gt;flags &amp;= ~AFS_OPERATION_RETRY_SERVER;</div><div class='add'>+			trace_afs_rotate(op, afs_rotate_trace_retry_server, 1);</div><div class='ctx'> 			goto retry_server;</div><div class='add'>+		case 0:</div><div class='add'>+			trace_afs_rotate(op, afs_rotate_trace_retry_server, 0);</div><div class='add'>+			goto restart_from_beginning;</div><div class='ctx'> 		case -ERESTARTSYS:</div><div class='del'>-			goto failed_set_error;</div><div class='add'>+			afs_op_set_error(op, error);</div><div class='add'>+			goto failed;</div><div class='ctx'> 		case -ETIME:</div><div class='ctx'> 		case -EDESTADDRREQ:</div><div class='ctx'> 			goto next_server;</div><div class='hunk'>@@ -432,34 +674,38 @@ out_of_addresses:</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> next_server:</div><div class='add'>+	trace_afs_rotate(op, afs_rotate_trace_next_server, 0);</div><div class='ctx'> 	_debug("next");</div><div class='del'>-	afs_end_cursor(&amp;op-&gt;ac);</div><div class='add'>+	op-&gt;estate = NULL;</div><div class='ctx'> 	goto pick_server;</div><div class='ctx'> </div><div class='ctx'> no_more_servers:</div><div class='ctx'> 	/* That's all the servers poked to no good effect.  Try again if some</div><div class='ctx'> 	 * of them were busy.</div><div class='ctx'> 	 */</div><div class='del'>-	if (op-&gt;flags &amp; AFS_OPERATION_VBUSY)</div><div class='add'>+	trace_afs_rotate(op, afs_rotate_trace_no_more_servers, 0);</div><div class='add'>+	if (op-&gt;flags &amp; AFS_OPERATION_VBUSY) {</div><div class='add'>+		afs_sleep_and_retry(op);</div><div class='add'>+		op-&gt;flags &amp;= ~AFS_OPERATION_VBUSY;</div><div class='ctx'> 		goto restart_from_beginning;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	e.error = -EDESTADDRREQ;</div><div class='del'>-	e.responded = false;</div><div class='add'>+	rcu_read_lock();</div><div class='ctx'> 	for (i = 0; i &lt; op-&gt;server_list-&gt;nr_servers; i++) {</div><div class='del'>-		struct afs_server *s = op-&gt;server_list-&gt;servers[i].server;</div><div class='add'>+		struct afs_endpoint_state *estate;</div><div class='ctx'> </div><div class='del'>-		afs_prioritise_error(&amp;e, READ_ONCE(s-&gt;probe.error),</div><div class='del'>-				     s-&gt;probe.abort_code);</div><div class='add'>+		estate = op-&gt;server_states[i].endpoint_state;</div><div class='add'>+		error = READ_ONCE(estate-&gt;error);</div><div class='add'>+		if (error &lt; 0)</div><div class='add'>+			afs_op_accumulate_error(op, error, estate-&gt;abort_code);</div><div class='ctx'> 	}</div><div class='add'>+	rcu_read_unlock();</div><div class='ctx'> </div><div class='del'>-	error = e.error;</div><div class='del'>-</div><div class='del'>-failed_set_error:</div><div class='del'>-	op-&gt;error = error;</div><div class='ctx'> failed:</div><div class='add'>+	trace_afs_rotate(op, afs_rotate_trace_failed, 0);</div><div class='ctx'> 	op-&gt;flags |= AFS_OPERATION_STOP;</div><div class='del'>-	afs_end_cursor(&amp;op-&gt;ac);</div><div class='del'>-	_leave(" = f [failed %d]", op-&gt;error);</div><div class='add'>+	op-&gt;estate = NULL;</div><div class='add'>+	_leave(" = f [failed %d]", afs_op_error(op));</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -478,37 +724,40 @@ void afs_dump_edestaddrreq(const struct afs_operation *op)</div><div class='ctx'> 	rcu_read_lock();</div><div class='ctx'> </div><div class='ctx'> 	pr_notice("EDESTADDR occurred\n");</div><div class='del'>-	pr_notice("FC: cbb=%x cbb2=%x fl=%x err=%hd\n",</div><div class='add'>+	pr_notice("OP: cbb=%x cbb2=%x fl=%x err=%hd\n",</div><div class='ctx'> 		  op-&gt;file[0].cb_break_before,</div><div class='del'>-		  op-&gt;file[1].cb_break_before, op-&gt;flags, op-&gt;error);</div><div class='del'>-	pr_notice("FC: ut=%lx ix=%d ni=%u\n",</div><div class='del'>-		  op-&gt;untried, op-&gt;index, op-&gt;nr_iterations);</div><div class='add'>+		  op-&gt;file[1].cb_break_before, op-&gt;flags, op-&gt;cumul_error.error);</div><div class='add'>+	pr_notice("OP: ut=%lx ix=%d ni=%u\n",</div><div class='add'>+		  op-&gt;untried_servers, op-&gt;server_index, op-&gt;nr_iterations);</div><div class='add'>+	pr_notice("OP: call  er=%d ac=%d r=%u\n",</div><div class='add'>+		  op-&gt;call_error, op-&gt;call_abort_code, op-&gt;call_responded);</div><div class='ctx'> </div><div class='ctx'> 	if (op-&gt;server_list) {</div><div class='ctx'> 		const struct afs_server_list *sl = op-&gt;server_list;</div><div class='del'>-		pr_notice("FC: SL nr=%u pr=%u vnov=%hx\n",</div><div class='del'>-			  sl-&gt;nr_servers, sl-&gt;preferred, sl-&gt;vnovol_mask);</div><div class='add'>+</div><div class='add'>+		pr_notice("FC: SL nr=%u vnov=%hx\n",</div><div class='add'>+			  sl-&gt;nr_servers, sl-&gt;vnovol_mask);</div><div class='ctx'> 		for (i = 0; i &lt; sl-&gt;nr_servers; i++) {</div><div class='ctx'> 			const struct afs_server *s = sl-&gt;servers[i].server;</div><div class='add'>+			const struct afs_endpoint_state *e =</div><div class='add'>+				rcu_dereference(s-&gt;endpoint_state);</div><div class='add'>+			const struct afs_addr_list *a = e-&gt;addresses;</div><div class='add'>+</div><div class='ctx'> 			pr_notice("FC: server fl=%lx av=%u %pU\n",</div><div class='ctx'> 				  s-&gt;flags, s-&gt;addr_version, &amp;s-&gt;uuid);</div><div class='del'>-			if (s-&gt;addresses) {</div><div class='del'>-				const struct afs_addr_list *a =</div><div class='del'>-					rcu_dereference(s-&gt;addresses);</div><div class='add'>+			pr_notice("FC:  - pq=%x R=%lx F=%lx\n",</div><div class='add'>+				  e-&gt;probe_seq, e-&gt;responsive_set, e-&gt;failed_set);</div><div class='add'>+			if (a) {</div><div class='ctx'> 				pr_notice("FC:  - av=%u nr=%u/%u/%u pr=%u\n",</div><div class='ctx'> 					  a-&gt;version,</div><div class='ctx'> 					  a-&gt;nr_ipv4, a-&gt;nr_addrs, a-&gt;max_addrs,</div><div class='ctx'> 					  a-&gt;preferred);</div><div class='del'>-				pr_notice("FC:  - R=%lx F=%lx\n",</div><div class='del'>-					  a-&gt;responded, a-&gt;failed);</div><div class='del'>-				if (a == op-&gt;ac.alist)</div><div class='add'>+				if (a == e-&gt;addresses)</div><div class='ctx'> 					pr_notice("FC:  - current\n");</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	pr_notice("AC: t=%lx ax=%u ac=%d er=%d r=%u ni=%u\n",</div><div class='del'>-		  op-&gt;ac.tried, op-&gt;ac.index, op-&gt;ac.abort_code, op-&gt;ac.error,</div><div class='del'>-		  op-&gt;ac.responded, op-&gt;ac.nr_iterations);</div><div class='add'>+	pr_notice("AC: t=%lx ax=%d\n", op-&gt;addr_tried, op-&gt;addr_index);</div><div class='ctx'> 	rcu_read_unlock();</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/afs/rxrpc.c b/fs/afs/rxrpc.c<br/>index 23a1a92d64bb..bf0e4ea0aafd 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/rxrpc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/rxrpc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/rxrpc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/rxrpc.c</a></div><div class='hunk'>@@ -13,16 +13,28 @@</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> #include "afs_cm.h"</div><div class='ctx'> #include "protocol_yfs.h"</div><div class='add'>+#define RXRPC_TRACE_ONLY_DEFINE_ENUMS</div><div class='add'>+#include &lt;trace/events/rxrpc.h&gt;</div><div class='ctx'> </div><div class='ctx'> struct workqueue_struct *afs_async_calls;</div><div class='ctx'> </div><div class='add'>+static void afs_deferred_free_worker(struct work_struct *work);</div><div class='ctx'> static void afs_wake_up_call_waiter(struct sock *, struct rxrpc_call *, unsigned long);</div><div class='ctx'> static void afs_wake_up_async_call(struct sock *, struct rxrpc_call *, unsigned long);</div><div class='ctx'> static void afs_process_async_call(struct work_struct *);</div><div class='ctx'> static void afs_rx_new_call(struct sock *, struct rxrpc_call *, unsigned long);</div><div class='ctx'> static void afs_rx_discard_new_call(struct rxrpc_call *, unsigned long);</div><div class='add'>+static void afs_rx_attach(struct rxrpc_call *rxcall, unsigned long user_call_ID);</div><div class='add'>+static void afs_rx_notify_oob(struct sock *sk, struct sk_buff *oob);</div><div class='ctx'> static int afs_deliver_cm_op_id(struct afs_call *);</div><div class='ctx'> </div><div class='add'>+static const struct rxrpc_kernel_ops afs_rxrpc_callback_ops = {</div><div class='add'>+	.notify_new_call	= afs_rx_new_call,</div><div class='add'>+	.discard_new_call	= afs_rx_discard_new_call,</div><div class='add'>+	.user_attach_call	= afs_rx_attach,</div><div class='add'>+	.notify_oob		= afs_rx_notify_oob,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> /* asynchronous incoming call initial processing */</div><div class='ctx'> static const struct afs_call_type afs_RXCMxxxx = {</div><div class='ctx'> 	.name		= "CB.xxxx",</div><div class='hunk'>@@ -46,6 +58,7 @@ int afs_open_socket(struct afs_net *net)</div><div class='ctx'> 		goto error_1;</div><div class='ctx'> </div><div class='ctx'> 	socket-&gt;sk-&gt;sk_allocation = GFP_NOFS;</div><div class='add'>+	socket-&gt;sk-&gt;sk_user_data = net;</div><div class='ctx'> </div><div class='ctx'> 	/* bind the callback manager's address to make this a server socket */</div><div class='ctx'> 	memset(&amp;srx, 0, sizeof(srx));</div><div class='hunk'>@@ -61,16 +74,24 @@ int afs_open_socket(struct afs_net *net)</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto error_2;</div><div class='ctx'> </div><div class='del'>-	ret = kernel_bind(socket, (struct sockaddr *) &amp;srx, sizeof(srx));</div><div class='add'>+	ret = rxrpc_sock_set_manage_response(socket-&gt;sk, true);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto error_2;</div><div class='add'>+</div><div class='add'>+	ret = afs_create_token_key(net, socket);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		pr_err("Couldn't create RxGK CM key: %d\n", ret);</div><div class='add'>+</div><div class='add'>+	ret = kernel_bind(socket, (struct sockaddr_unsized *) &amp;srx, sizeof(srx));</div><div class='ctx'> 	if (ret == -EADDRINUSE) {</div><div class='ctx'> 		srx.transport.sin6.sin6_port = 0;</div><div class='del'>-		ret = kernel_bind(socket, (struct sockaddr *) &amp;srx, sizeof(srx));</div><div class='add'>+		ret = kernel_bind(socket, (struct sockaddr_unsized *) &amp;srx, sizeof(srx));</div><div class='ctx'> 	}</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto error_2;</div><div class='ctx'> </div><div class='ctx'> 	srx.srx_service = YFS_CM_SERVICE;</div><div class='del'>-	ret = kernel_bind(socket, (struct sockaddr *) &amp;srx, sizeof(srx));</div><div class='add'>+	ret = kernel_bind(socket, (struct sockaddr_unsized *) &amp;srx, sizeof(srx));</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto error_2;</div><div class='ctx'> </div><div class='hunk'>@@ -81,8 +102,7 @@ int afs_open_socket(struct afs_net *net)</div><div class='ctx'> 	 * it sends back to us.</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='del'>-	rxrpc_kernel_new_call_notification(socket, afs_rx_new_call,</div><div class='del'>-					   afs_rx_discard_new_call);</div><div class='add'>+	rxrpc_kernel_set_notifications(socket, &amp;afs_rxrpc_callback_ops);</div><div class='ctx'> </div><div class='ctx'> 	ret = kernel_listen(socket, INT_MAX);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='hunk'>@@ -122,7 +142,9 @@ void afs_close_socket(struct afs_net *net)</div><div class='ctx'> </div><div class='ctx'> 	kernel_sock_shutdown(net-&gt;socket, SHUT_RDWR);</div><div class='ctx'> 	flush_workqueue(afs_async_calls);</div><div class='add'>+	net-&gt;socket-&gt;sk-&gt;sk_user_data = NULL;</div><div class='ctx'> 	sock_release(net-&gt;socket);</div><div class='add'>+	key_put(net-&gt;fs_cm_token_key);</div><div class='ctx'> </div><div class='ctx'> 	_debug("dework");</div><div class='ctx'> 	_leave("");</div><div class='hunk'>@@ -145,65 +167,92 @@ static struct afs_call *afs_alloc_call(struct afs_net *net,</div><div class='ctx'> 	call-&gt;type = type;</div><div class='ctx'> 	call-&gt;net = net;</div><div class='ctx'> 	call-&gt;debug_id = atomic_inc_return(&amp;rxrpc_debug_id);</div><div class='del'>-	atomic_set(&amp;call-&gt;usage, 1);</div><div class='del'>-	INIT_WORK(&amp;call-&gt;async_work, afs_process_async_call);</div><div class='add'>+	refcount_set(&amp;call-&gt;ref, 1);</div><div class='add'>+	INIT_WORK(&amp;call-&gt;async_work, type-&gt;async_rx ?: afs_process_async_call);</div><div class='add'>+	INIT_WORK(&amp;call-&gt;work, call-&gt;type-&gt;work);</div><div class='add'>+	INIT_WORK(&amp;call-&gt;free_work, afs_deferred_free_worker);</div><div class='ctx'> 	init_waitqueue_head(&amp;call-&gt;waitq);</div><div class='ctx'> 	spin_lock_init(&amp;call-&gt;state_lock);</div><div class='ctx'> 	call-&gt;iter = &amp;call-&gt;def_iter;</div><div class='ctx'> </div><div class='ctx'> 	o = atomic_inc_return(&amp;net-&gt;nr_outstanding_calls);</div><div class='del'>-	trace_afs_call(call, afs_call_trace_alloc, 1, o,</div><div class='add'>+	trace_afs_call(call-&gt;debug_id, afs_call_trace_alloc, 1, o,</div><div class='ctx'> 		       __builtin_return_address(0));</div><div class='ctx'> 	return call;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void afs_free_call(struct afs_call *call)</div><div class='add'>+{</div><div class='add'>+	struct afs_net *net = call-&gt;net;</div><div class='add'>+	int o;</div><div class='add'>+</div><div class='add'>+	ASSERT(!work_pending(&amp;call-&gt;async_work));</div><div class='add'>+</div><div class='add'>+	rxrpc_kernel_put_peer(call-&gt;peer);</div><div class='add'>+</div><div class='add'>+	if (call-&gt;rxcall) {</div><div class='add'>+		rxrpc_kernel_shutdown_call(net-&gt;socket, call-&gt;rxcall);</div><div class='add'>+		rxrpc_kernel_put_call(net-&gt;socket, call-&gt;rxcall);</div><div class='add'>+		call-&gt;rxcall = NULL;</div><div class='add'>+	}</div><div class='add'>+	if (call-&gt;type-&gt;destructor)</div><div class='add'>+		call-&gt;type-&gt;destructor(call);</div><div class='add'>+</div><div class='add'>+	afs_unuse_server_notime(call-&gt;net, call-&gt;server, afs_server_trace_unuse_call);</div><div class='add'>+	kfree(call-&gt;request);</div><div class='add'>+</div><div class='add'>+	o = atomic_read(&amp;net-&gt;nr_outstanding_calls);</div><div class='add'>+	trace_afs_call(call-&gt;debug_id, afs_call_trace_free, 0, o,</div><div class='add'>+		       __builtin_return_address(0));</div><div class='add'>+	kfree(call);</div><div class='add'>+</div><div class='add'>+	o = atomic_dec_return(&amp;net-&gt;nr_outstanding_calls);</div><div class='add'>+	if (o == 0)</div><div class='add'>+		wake_up_var(&amp;net-&gt;nr_outstanding_calls);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Dispose of a reference on a call.</div><div class='ctx'>  */</div><div class='ctx'> void afs_put_call(struct afs_call *call)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_net *net = call-&gt;net;</div><div class='del'>-	int n = atomic_dec_return(&amp;call-&gt;usage);</div><div class='del'>-	int o = atomic_read(&amp;net-&gt;nr_outstanding_calls);</div><div class='add'>+	unsigned int debug_id = call-&gt;debug_id;</div><div class='add'>+	bool zero;</div><div class='add'>+	int r, o;</div><div class='ctx'> </div><div class='del'>-	trace_afs_call(call, afs_call_trace_put, n, o,</div><div class='add'>+	zero = __refcount_dec_and_test(&amp;call-&gt;ref, &amp;r);</div><div class='add'>+	o = atomic_read(&amp;net-&gt;nr_outstanding_calls);</div><div class='add'>+	trace_afs_call(debug_id, afs_call_trace_put, r - 1, o,</div><div class='ctx'> 		       __builtin_return_address(0));</div><div class='add'>+	if (zero)</div><div class='add'>+		afs_free_call(call);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	ASSERTCMP(n, &gt;=, 0);</div><div class='del'>-	if (n == 0) {</div><div class='del'>-		ASSERT(!work_pending(&amp;call-&gt;async_work));</div><div class='del'>-		ASSERT(call-&gt;type-&gt;name != NULL);</div><div class='del'>-</div><div class='del'>-		if (call-&gt;rxcall) {</div><div class='del'>-			rxrpc_kernel_end_call(net-&gt;socket, call-&gt;rxcall);</div><div class='del'>-			call-&gt;rxcall = NULL;</div><div class='del'>-		}</div><div class='del'>-		if (call-&gt;type-&gt;destructor)</div><div class='del'>-			call-&gt;type-&gt;destructor(call);</div><div class='del'>-</div><div class='del'>-		afs_unuse_server_notime(call-&gt;net, call-&gt;server, afs_server_trace_put_call);</div><div class='del'>-		afs_put_addrlist(call-&gt;alist);</div><div class='del'>-		kfree(call-&gt;request);</div><div class='del'>-</div><div class='del'>-		trace_afs_call(call, afs_call_trace_free, 0, o,</div><div class='del'>-			       __builtin_return_address(0));</div><div class='del'>-		kfree(call);</div><div class='add'>+static void afs_deferred_free_worker(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct afs_call *call = container_of(work, struct afs_call, free_work);</div><div class='ctx'> </div><div class='del'>-		o = atomic_dec_return(&amp;net-&gt;nr_outstanding_calls);</div><div class='del'>-		if (o == 0)</div><div class='del'>-			wake_up_var(&amp;net-&gt;nr_outstanding_calls);</div><div class='del'>-	}</div><div class='add'>+	afs_free_call(call);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct afs_call *afs_get_call(struct afs_call *call,</div><div class='del'>-				     enum afs_call_trace why)</div><div class='add'>+/*</div><div class='add'>+ * Dispose of a reference on a call, deferring the cleanup to a workqueue</div><div class='add'>+ * to avoid lock recursion.</div><div class='add'>+ */</div><div class='add'>+void afs_deferred_put_call(struct afs_call *call)</div><div class='ctx'> {</div><div class='del'>-	int u = atomic_inc_return(&amp;call-&gt;usage);</div><div class='add'>+	struct afs_net *net = call-&gt;net;</div><div class='add'>+	unsigned int debug_id = call-&gt;debug_id;</div><div class='add'>+	bool zero;</div><div class='add'>+	int r, o;</div><div class='ctx'> </div><div class='del'>-	trace_afs_call(call, why, u,</div><div class='del'>-		       atomic_read(&amp;call-&gt;net-&gt;nr_outstanding_calls),</div><div class='add'>+	zero = __refcount_dec_and_test(&amp;call-&gt;ref, &amp;r);</div><div class='add'>+	o = atomic_read(&amp;net-&gt;nr_outstanding_calls);</div><div class='add'>+	trace_afs_call(debug_id, afs_call_trace_put, r - 1, o,</div><div class='ctx'> 		       __builtin_return_address(0));</div><div class='del'>-	return call;</div><div class='add'>+	if (zero)</div><div class='add'>+		schedule_work(&amp;call-&gt;free_work);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -212,8 +261,6 @@ static struct afs_call *afs_get_call(struct afs_call *call,</div><div class='ctx'> static void afs_queue_call_work(struct afs_call *call)</div><div class='ctx'> {</div><div class='ctx'> 	if (call-&gt;type-&gt;work) {</div><div class='del'>-		INIT_WORK(&amp;call-&gt;work, call-&gt;type-&gt;work);</div><div class='del'>-</div><div class='ctx'> 		afs_get_call(call, afs_call_trace_work);</div><div class='ctx'> 		if (!queue_work(afs_wq, &amp;call-&gt;work))</div><div class='ctx'> 			afs_put_call(call);</div><div class='hunk'>@@ -287,9 +334,8 @@ static void afs_notify_end_request_tx(struct sock *sock,</div><div class='ctx'>  * Initiate a call and synchronously queue up the parameters for dispatch.  Any</div><div class='ctx'>  * error is stored into the call struct, which the caller must check for.</div><div class='ctx'>  */</div><div class='del'>-void afs_make_call(struct afs_addr_cursor *ac, struct afs_call *call, gfp_t gfp)</div><div class='add'>+void afs_make_call(struct afs_call *call, gfp_t gfp)</div><div class='ctx'> {</div><div class='del'>-	struct sockaddr_rxrpc *srx = &amp;ac-&gt;alist-&gt;addrs[ac-&gt;index];</div><div class='ctx'> 	struct rxrpc_call *rxcall;</div><div class='ctx'> 	struct msghdr msg;</div><div class='ctx'> 	struct kvec iov[1];</div><div class='hunk'>@@ -297,7 +343,7 @@ void afs_make_call(struct afs_addr_cursor *ac, struct afs_call *call, gfp_t gfp)</div><div class='ctx'> 	s64 tx_total_len;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	_enter(",{%pISp},", &amp;srx-&gt;transport);</div><div class='add'>+	_enter(",{%pISp+%u},", rxrpc_kernel_remote_addr(call-&gt;peer), call-&gt;service_id);</div><div class='ctx'> </div><div class='ctx'> 	ASSERT(call-&gt;type != NULL);</div><div class='ctx'> 	ASSERT(call-&gt;type-&gt;name != NULL);</div><div class='hunk'>@@ -306,8 +352,7 @@ void afs_make_call(struct afs_addr_cursor *ac, struct afs_call *call, gfp_t gfp)</div><div class='ctx'> 	       call, call-&gt;type-&gt;name, key_serial(call-&gt;key),</div><div class='ctx'> 	       atomic_read(&amp;call-&gt;net-&gt;nr_outstanding_calls));</div><div class='ctx'> </div><div class='del'>-	call-&gt;addr_ix = ac-&gt;index;</div><div class='del'>-	call-&gt;alist = afs_get_addrlist(ac-&gt;alist);</div><div class='add'>+	trace_afs_make_call(call);</div><div class='ctx'> </div><div class='ctx'> 	/* Work out the length we're going to transmit.  This is awkward for</div><div class='ctx'> 	 * calls such as FS.StoreData where there's an extra injection of data</div><div class='hunk'>@@ -326,12 +371,15 @@ void afs_make_call(struct afs_addr_cursor *ac, struct afs_call *call, gfp_t gfp)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* create a call */</div><div class='del'>-	rxcall = rxrpc_kernel_begin_call(call-&gt;net-&gt;socket, srx, call-&gt;key,</div><div class='add'>+	rxcall = rxrpc_kernel_begin_call(call-&gt;net-&gt;socket, call-&gt;peer, call-&gt;key,</div><div class='ctx'> 					 (unsigned long)call,</div><div class='del'>-					 tx_total_len, gfp,</div><div class='add'>+					 tx_total_len,</div><div class='add'>+					 call-&gt;max_lifespan,</div><div class='add'>+					 gfp,</div><div class='ctx'> 					 (call-&gt;async ?</div><div class='ctx'> 					  afs_wake_up_async_call :</div><div class='ctx'> 					  afs_wake_up_call_waiter),</div><div class='add'>+					 call-&gt;service_id,</div><div class='ctx'> 					 call-&gt;upgrade,</div><div class='ctx'> 					 (call-&gt;intr ? RXRPC_PREINTERRUPTIBLE :</div><div class='ctx'> 					  RXRPC_UNINTERRUPTIBLE),</div><div class='hunk'>@@ -343,10 +391,7 @@ void afs_make_call(struct afs_addr_cursor *ac, struct afs_call *call, gfp_t gfp)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	call-&gt;rxcall = rxcall;</div><div class='del'>-</div><div class='del'>-	if (call-&gt;max_lifespan)</div><div class='del'>-		rxrpc_kernel_set_max_life(call-&gt;net-&gt;socket, rxcall,</div><div class='del'>-					  call-&gt;max_lifespan);</div><div class='add'>+	call-&gt;issue_time = ktime_get_real();</div><div class='ctx'> </div><div class='ctx'> 	/* send the request */</div><div class='ctx'> 	iov[0].iov_base	= call-&gt;request;</div><div class='hunk'>@@ -354,7 +399,7 @@ void afs_make_call(struct afs_addr_cursor *ac, struct afs_call *call, gfp_t gfp)</div><div class='ctx'> </div><div class='ctx'> 	msg.msg_name		= NULL;</div><div class='ctx'> 	msg.msg_namelen		= 0;</div><div class='del'>-	iov_iter_kvec(&amp;msg.msg_iter, WRITE, iov, 1, call-&gt;request_size);</div><div class='add'>+	iov_iter_kvec(&amp;msg.msg_iter, ITER_SOURCE, iov, 1, call-&gt;request_size);</div><div class='ctx'> 	msg.msg_control		= NULL;</div><div class='ctx'> 	msg.msg_controllen	= 0;</div><div class='ctx'> 	msg.msg_flags		= MSG_WAITALL | (call-&gt;write_iter ? MSG_MORE : 0);</div><div class='hunk'>@@ -384,45 +429,50 @@ void afs_make_call(struct afs_addr_cursor *ac, struct afs_call *call, gfp_t gfp)</div><div class='ctx'> 	/* Note that at this point, we may have received the reply or an abort</div><div class='ctx'> 	 * - and an asynchronous call may already have completed.</div><div class='ctx'> 	 *</div><div class='del'>-	 * afs_wait_for_call_to_complete(call, ac)</div><div class='add'>+	 * afs_wait_for_call_to_complete(call)</div><div class='ctx'> 	 * must be called to synchronously clean up.</div><div class='ctx'> 	 */</div><div class='ctx'> 	return;</div><div class='ctx'> </div><div class='ctx'> error_do_abort:</div><div class='del'>-	if (ret != -ECONNABORTED) {</div><div class='add'>+	if (ret != -ECONNABORTED)</div><div class='ctx'> 		rxrpc_kernel_abort_call(call-&gt;net-&gt;socket, rxcall,</div><div class='del'>-					RX_USER_ABORT, ret, "KSD");</div><div class='del'>-	} else {</div><div class='add'>+					RX_USER_ABORT, ret,</div><div class='add'>+					afs_abort_send_data_error);</div><div class='add'>+	if (call-&gt;async) {</div><div class='add'>+		afs_see_call(call, afs_call_trace_async_abort);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (ret == -ECONNABORTED) {</div><div class='ctx'> 		len = 0;</div><div class='del'>-		iov_iter_kvec(&amp;msg.msg_iter, READ, NULL, 0, 0);</div><div class='add'>+		iov_iter_kvec(&amp;msg.msg_iter, ITER_DEST, NULL, 0, 0);</div><div class='ctx'> 		rxrpc_kernel_recv_data(call-&gt;net-&gt;socket, rxcall,</div><div class='ctx'> 				       &amp;msg.msg_iter, &amp;len, false,</div><div class='ctx'> 				       &amp;call-&gt;abort_code, &amp;call-&gt;service_id);</div><div class='del'>-		ac-&gt;abort_code = call-&gt;abort_code;</div><div class='del'>-		ac-&gt;responded = true;</div><div class='add'>+		call-&gt;responded = true;</div><div class='ctx'> 	}</div><div class='ctx'> 	call-&gt;error = ret;</div><div class='ctx'> 	trace_afs_call_done(call);</div><div class='ctx'> error_kill_call:</div><div class='del'>-	if (call-&gt;type-&gt;done)</div><div class='del'>-		call-&gt;type-&gt;done(call);</div><div class='add'>+	if (call-&gt;async)</div><div class='add'>+		afs_see_call(call, afs_call_trace_async_kill);</div><div class='add'>+	if (call-&gt;type-&gt;immediate_cancel)</div><div class='add'>+		call-&gt;type-&gt;immediate_cancel(call);</div><div class='ctx'> </div><div class='ctx'> 	/* We need to dispose of the extra ref we grabbed for an async call.</div><div class='ctx'> 	 * The call, however, might be queued on afs_async_calls and we need to</div><div class='ctx'> 	 * make sure we don't get any more notifications that might requeue it.</div><div class='ctx'> 	 */</div><div class='del'>-	if (call-&gt;rxcall) {</div><div class='del'>-		rxrpc_kernel_end_call(call-&gt;net-&gt;socket, call-&gt;rxcall);</div><div class='del'>-		call-&gt;rxcall = NULL;</div><div class='del'>-	}</div><div class='add'>+	if (call-&gt;rxcall)</div><div class='add'>+		rxrpc_kernel_shutdown_call(call-&gt;net-&gt;socket, call-&gt;rxcall);</div><div class='ctx'> 	if (call-&gt;async) {</div><div class='ctx'> 		if (cancel_work_sync(&amp;call-&gt;async_work))</div><div class='ctx'> 			afs_put_call(call);</div><div class='del'>-		afs_put_call(call);</div><div class='add'>+		afs_set_call_complete(call, ret, 0);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ac-&gt;error = ret;</div><div class='add'>+	call-&gt;error = ret;</div><div class='ctx'> 	call-&gt;state = AFS_CALL_COMPLETE;</div><div class='ctx'> 	_leave(" = %d", ret);</div><div class='ctx'> }</div><div class='hunk'>@@ -456,14 +506,14 @@ static void afs_log_error(struct afs_call *call, s32 remote_abort)</div><div class='ctx'> 		max = m + 1;</div><div class='ctx'> 		pr_notice("kAFS: Peer reported %s failure on %s [%pISp]\n",</div><div class='ctx'> 			  msg, call-&gt;type-&gt;name,</div><div class='del'>-			  &amp;call-&gt;alist-&gt;addrs[call-&gt;addr_ix].transport);</div><div class='add'>+			  rxrpc_kernel_remote_addr(call-&gt;peer));</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * deliver messages to a call</div><div class='ctx'>  */</div><div class='del'>-static void afs_deliver_to_call(struct afs_call *call)</div><div class='add'>+void afs_deliver_to_call(struct afs_call *call)</div><div class='ctx'> {</div><div class='ctx'> 	enum afs_call_state state;</div><div class='ctx'> 	size_t len;</div><div class='hunk'>@@ -480,7 +530,7 @@ static void afs_deliver_to_call(struct afs_call *call)</div><div class='ctx'> 	       ) {</div><div class='ctx'> 		if (state == AFS_CALL_SV_AWAIT_ACK) {</div><div class='ctx'> 			len = 0;</div><div class='del'>-			iov_iter_kvec(&amp;call-&gt;def_iter, READ, NULL, 0, 0);</div><div class='add'>+			iov_iter_kvec(&amp;call-&gt;def_iter, ITER_DEST, NULL, 0, 0);</div><div class='ctx'> 			ret = rxrpc_kernel_recv_data(call-&gt;net-&gt;socket,</div><div class='ctx'> 						     call-&gt;rxcall, &amp;call-&gt;def_iter,</div><div class='ctx'> 						     &amp;len, false, &amp;remote_abort,</div><div class='hunk'>@@ -497,18 +547,13 @@ static void afs_deliver_to_call(struct afs_call *call)</div><div class='ctx'> 			return;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (!call-&gt;have_reply_time &amp;&amp;</div><div class='del'>-		    rxrpc_kernel_get_reply_time(call-&gt;net-&gt;socket,</div><div class='del'>-						call-&gt;rxcall,</div><div class='del'>-						&amp;call-&gt;reply_time))</div><div class='del'>-			call-&gt;have_reply_time = true;</div><div class='del'>-</div><div class='ctx'> 		ret = call-&gt;type-&gt;deliver(call);</div><div class='ctx'> 		state = READ_ONCE(call-&gt;state);</div><div class='ctx'> 		if (ret == 0 &amp;&amp; call-&gt;unmarshalling_error)</div><div class='ctx'> 			ret = -EBADMSG;</div><div class='ctx'> 		switch (ret) {</div><div class='ctx'> 		case 0:</div><div class='add'>+			call-&gt;responded = true;</div><div class='ctx'> 			afs_queue_call_work(call);</div><div class='ctx'> 			if (state == AFS_CALL_CL_PROC_REPLY) {</div><div class='ctx'> 				if (call-&gt;op)</div><div class='hunk'>@@ -523,12 +568,15 @@ static void afs_deliver_to_call(struct afs_call *call)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		case -ECONNABORTED:</div><div class='ctx'> 			ASSERTCMP(state, ==, AFS_CALL_COMPLETE);</div><div class='add'>+			call-&gt;responded = true;</div><div class='ctx'> 			afs_log_error(call, call-&gt;abort_code);</div><div class='ctx'> 			goto done;</div><div class='ctx'> 		case -ENOTSUPP:</div><div class='add'>+			call-&gt;responded = true;</div><div class='ctx'> 			abort_code = RXGEN_OPCODE;</div><div class='ctx'> 			rxrpc_kernel_abort_call(call-&gt;net-&gt;socket, call-&gt;rxcall,</div><div class='del'>-						abort_code, ret, "KIV");</div><div class='add'>+						abort_code, ret,</div><div class='add'>+						afs_abort_op_not_supported);</div><div class='ctx'> 			goto local_abort;</div><div class='ctx'> 		case -EIO:</div><div class='ctx'> 			pr_err("kAFS: Call %u in bad state %u\n",</div><div class='hunk'>@@ -537,16 +585,20 @@ static void afs_deliver_to_call(struct afs_call *call)</div><div class='ctx'> 		case -ENODATA:</div><div class='ctx'> 		case -EBADMSG:</div><div class='ctx'> 		case -EMSGSIZE:</div><div class='add'>+		case -ENOMEM:</div><div class='add'>+		case -EFAULT:</div><div class='ctx'> 			abort_code = RXGEN_CC_UNMARSHAL;</div><div class='ctx'> 			if (state != AFS_CALL_CL_AWAIT_REPLY)</div><div class='ctx'> 				abort_code = RXGEN_SS_UNMARSHAL;</div><div class='ctx'> 			rxrpc_kernel_abort_call(call-&gt;net-&gt;socket, call-&gt;rxcall,</div><div class='del'>-						abort_code, ret, "KUM");</div><div class='add'>+						abort_code, ret,</div><div class='add'>+						afs_abort_unmarshal_error);</div><div class='ctx'> 			goto local_abort;</div><div class='ctx'> 		default:</div><div class='del'>-			abort_code = RX_USER_ABORT;</div><div class='add'>+			abort_code = RX_CALL_DEAD;</div><div class='ctx'> 			rxrpc_kernel_abort_call(call-&gt;net-&gt;socket, call-&gt;rxcall,</div><div class='del'>-						abort_code, ret, "KER");</div><div class='add'>+						abort_code, ret,</div><div class='add'>+						afs_abort_general_error);</div><div class='ctx'> 			goto local_abort;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -562,55 +614,50 @@ local_abort:</div><div class='ctx'> 	abort_code = 0;</div><div class='ctx'> call_complete:</div><div class='ctx'> 	afs_set_call_complete(call, ret, remote_abort);</div><div class='del'>-	state = AFS_CALL_COMPLETE;</div><div class='ctx'> 	goto done;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Wait synchronously for a call to complete and clean up the call struct.</div><div class='add'>+ * Wait synchronously for a call to complete.</div><div class='ctx'>  */</div><div class='del'>-long afs_wait_for_call_to_complete(struct afs_call *call,</div><div class='del'>-				   struct afs_addr_cursor *ac)</div><div class='add'>+void afs_wait_for_call_to_complete(struct afs_call *call)</div><div class='ctx'> {</div><div class='del'>-	long ret;</div><div class='ctx'> 	bool rxrpc_complete = false;</div><div class='ctx'> </div><div class='del'>-	DECLARE_WAITQUEUE(myself, current);</div><div class='del'>-</div><div class='ctx'> 	_enter("");</div><div class='ctx'> </div><div class='del'>-	ret = call-&gt;error;</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+	if (!afs_check_call_state(call, AFS_CALL_COMPLETE)) {</div><div class='add'>+		DECLARE_WAITQUEUE(myself, current);</div><div class='add'>+</div><div class='add'>+		add_wait_queue(&amp;call-&gt;waitq, &amp;myself);</div><div class='add'>+		for (;;) {</div><div class='add'>+			set_current_state(TASK_UNINTERRUPTIBLE);</div><div class='add'>+</div><div class='add'>+			/* deliver any messages that are in the queue */</div><div class='add'>+			if (!afs_check_call_state(call, AFS_CALL_COMPLETE) &amp;&amp;</div><div class='add'>+			    call-&gt;need_attention) {</div><div class='add'>+				call-&gt;need_attention = false;</div><div class='add'>+				__set_current_state(TASK_RUNNING);</div><div class='add'>+				afs_deliver_to_call(call);</div><div class='add'>+				continue;</div><div class='add'>+			}</div><div class='ctx'> </div><div class='del'>-	add_wait_queue(&amp;call-&gt;waitq, &amp;myself);</div><div class='del'>-	for (;;) {</div><div class='del'>-		set_current_state(TASK_UNINTERRUPTIBLE);</div><div class='del'>-</div><div class='del'>-		/* deliver any messages that are in the queue */</div><div class='del'>-		if (!afs_check_call_state(call, AFS_CALL_COMPLETE) &amp;&amp;</div><div class='del'>-		    call-&gt;need_attention) {</div><div class='del'>-			call-&gt;need_attention = false;</div><div class='del'>-			__set_current_state(TASK_RUNNING);</div><div class='del'>-			afs_deliver_to_call(call);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='add'>+			if (afs_check_call_state(call, AFS_CALL_COMPLETE))</div><div class='add'>+				break;</div><div class='ctx'> </div><div class='del'>-		if (afs_check_call_state(call, AFS_CALL_COMPLETE))</div><div class='del'>-			break;</div><div class='add'>+			if (!rxrpc_kernel_check_life(call-&gt;net-&gt;socket, call-&gt;rxcall)) {</div><div class='add'>+				/* rxrpc terminated the call. */</div><div class='add'>+				rxrpc_complete = true;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='ctx'> </div><div class='del'>-		if (!rxrpc_kernel_check_life(call-&gt;net-&gt;socket, call-&gt;rxcall)) {</div><div class='del'>-			/* rxrpc terminated the call. */</div><div class='del'>-			rxrpc_complete = true;</div><div class='del'>-			break;</div><div class='add'>+			schedule();</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		schedule();</div><div class='add'>+		remove_wait_queue(&amp;call-&gt;waitq, &amp;myself);</div><div class='add'>+		__set_current_state(TASK_RUNNING);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	remove_wait_queue(&amp;call-&gt;waitq, &amp;myself);</div><div class='del'>-	__set_current_state(TASK_RUNNING);</div><div class='del'>-</div><div class='ctx'> 	if (!afs_check_call_state(call, AFS_CALL_COMPLETE)) {</div><div class='ctx'> 		if (rxrpc_complete) {</div><div class='ctx'> 			afs_set_call_complete(call, call-&gt;error, call-&gt;abort_code);</div><div class='hunk'>@@ -618,33 +665,11 @@ long afs_wait_for_call_to_complete(struct afs_call *call,</div><div class='ctx'> 			/* Kill off the call if it's still live. */</div><div class='ctx'> 			_debug("call interrupted");</div><div class='ctx'> 			if (rxrpc_kernel_abort_call(call-&gt;net-&gt;socket, call-&gt;rxcall,</div><div class='del'>-						    RX_USER_ABORT, -EINTR, "KWI"))</div><div class='add'>+						    RX_USER_ABORT, -EINTR,</div><div class='add'>+						    afs_abort_interrupted))</div><div class='ctx'> 				afs_set_call_complete(call, -EINTR, 0);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	spin_lock_bh(&amp;call-&gt;state_lock);</div><div class='del'>-	ac-&gt;abort_code = call-&gt;abort_code;</div><div class='del'>-	ac-&gt;error = call-&gt;error;</div><div class='del'>-	spin_unlock_bh(&amp;call-&gt;state_lock);</div><div class='del'>-</div><div class='del'>-	ret = ac-&gt;error;</div><div class='del'>-	switch (ret) {</div><div class='del'>-	case 0:</div><div class='del'>-		ret = call-&gt;ret0;</div><div class='del'>-		call-&gt;ret0 = 0;</div><div class='del'>-</div><div class='del'>-		fallthrough;</div><div class='del'>-	case -ECONNABORTED:</div><div class='del'>-		ac-&gt;responded = true;</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	_debug("call complete");</div><div class='del'>-	afs_put_call(call);</div><div class='del'>-	_leave(" = %p", (void *)ret);</div><div class='del'>-	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -660,25 +685,25 @@ static void afs_wake_up_call_waiter(struct sock *sk, struct rxrpc_call *rxcall,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * wake up an asynchronous call</div><div class='add'>+ * Wake up an asynchronous call.  The caller is holding the call notify</div><div class='add'>+ * spinlock around this, so we can't call afs_put_call().</div><div class='ctx'>  */</div><div class='ctx'> static void afs_wake_up_async_call(struct sock *sk, struct rxrpc_call *rxcall,</div><div class='ctx'> 				   unsigned long call_user_ID)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_call *call = (struct afs_call *)call_user_ID;</div><div class='del'>-	int u;</div><div class='add'>+	int r;</div><div class='ctx'> </div><div class='ctx'> 	trace_afs_notify_call(rxcall, call);</div><div class='ctx'> 	call-&gt;need_attention = true;</div><div class='ctx'> </div><div class='del'>-	u = atomic_fetch_add_unless(&amp;call-&gt;usage, 1, 0);</div><div class='del'>-	if (u != 0) {</div><div class='del'>-		trace_afs_call(call, afs_call_trace_wake, u + 1,</div><div class='add'>+	if (__refcount_inc_not_zero(&amp;call-&gt;ref, &amp;r)) {</div><div class='add'>+		trace_afs_call(call-&gt;debug_id, afs_call_trace_wake, r + 1,</div><div class='ctx'> 			       atomic_read(&amp;call-&gt;net-&gt;nr_outstanding_calls),</div><div class='ctx'> 			       __builtin_return_address(0));</div><div class='ctx'> </div><div class='ctx'> 		if (!queue_work(afs_async_calls, &amp;call-&gt;async_work))</div><div class='del'>-			afs_put_call(call);</div><div class='add'>+			afs_deferred_put_call(call);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -732,7 +757,6 @@ void afs_charge_preallocation(struct work_struct *work)</div><div class='ctx'> </div><div class='ctx'> 		if (rxrpc_kernel_charge_accept(net-&gt;socket,</div><div class='ctx'> 					       afs_wake_up_async_call,</div><div class='del'>-					       afs_rx_attach,</div><div class='ctx'> 					       (unsigned long)call,</div><div class='ctx'> 					       GFP_KERNEL,</div><div class='ctx'> 					       call-&gt;debug_id) &lt; 0)</div><div class='hunk'>@@ -760,8 +784,14 @@ static void afs_rx_discard_new_call(struct rxrpc_call *rxcall,</div><div class='ctx'> static void afs_rx_new_call(struct sock *sk, struct rxrpc_call *rxcall,</div><div class='ctx'> 			    unsigned long user_call_ID)</div><div class='ctx'> {</div><div class='add'>+	struct afs_call *call = (struct afs_call *)user_call_ID;</div><div class='ctx'> 	struct afs_net *net = afs_sock2net(sk);</div><div class='ctx'> </div><div class='add'>+	call-&gt;peer = rxrpc_kernel_get_call_peer(sk-&gt;sk_socket, call-&gt;rxcall);</div><div class='add'>+	call-&gt;server = afs_find_server(call-&gt;peer);</div><div class='add'>+	if (!call-&gt;server)</div><div class='add'>+		trace_afs_cm_no_server(call, rxrpc_kernel_remote_srx(call-&gt;peer));</div><div class='add'>+</div><div class='ctx'> 	queue_work(afs_wq, &amp;net-&gt;charge_preallocation_work);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -788,9 +818,14 @@ static int afs_deliver_cm_op_id(struct afs_call *call)</div><div class='ctx'> 	if (!afs_cm_incoming_call(call))</div><div class='ctx'> 		return -ENOTSUPP;</div><div class='ctx'> </div><div class='add'>+	call-&gt;security_ix = rxrpc_kernel_query_call_security(call-&gt;rxcall,</div><div class='add'>+							     &amp;call-&gt;service_id,</div><div class='add'>+							     &amp;call-&gt;enctype);</div><div class='add'>+</div><div class='ctx'> 	trace_afs_cb_call(call);</div><div class='add'>+	call-&gt;work.func = call-&gt;type-&gt;work;</div><div class='ctx'> </div><div class='del'>-	/* pass responsibility for the remainer of this message off to the</div><div class='add'>+	/* pass responsibility for the remainder of this message off to the</div><div class='ctx'> 	 * cache manager op */</div><div class='ctx'> 	return call-&gt;type-&gt;deliver(call);</div><div class='ctx'> }</div><div class='hunk'>@@ -822,7 +857,7 @@ void afs_send_empty_reply(struct afs_call *call)</div><div class='ctx'> </div><div class='ctx'> 	msg.msg_name		= NULL;</div><div class='ctx'> 	msg.msg_namelen		= 0;</div><div class='del'>-	iov_iter_kvec(&amp;msg.msg_iter, WRITE, NULL, 0, 0);</div><div class='add'>+	iov_iter_kvec(&amp;msg.msg_iter, ITER_SOURCE, NULL, 0, 0);</div><div class='ctx'> 	msg.msg_control		= NULL;</div><div class='ctx'> 	msg.msg_controllen	= 0;</div><div class='ctx'> 	msg.msg_flags		= 0;</div><div class='hunk'>@@ -836,7 +871,8 @@ void afs_send_empty_reply(struct afs_call *call)</div><div class='ctx'> 	case -ENOMEM:</div><div class='ctx'> 		_debug("oom");</div><div class='ctx'> 		rxrpc_kernel_abort_call(net-&gt;socket, call-&gt;rxcall,</div><div class='del'>-					RX_USER_ABORT, -ENOMEM, "KOO");</div><div class='add'>+					RXGEN_SS_MARSHAL, -ENOMEM,</div><div class='add'>+					afs_abort_oom);</div><div class='ctx'> 		fallthrough;</div><div class='ctx'> 	default:</div><div class='ctx'> 		_leave(" [error]");</div><div class='hunk'>@@ -862,7 +898,7 @@ void afs_send_simple_reply(struct afs_call *call, const void *buf, size_t len)</div><div class='ctx'> 	iov[0].iov_len		= len;</div><div class='ctx'> 	msg.msg_name		= NULL;</div><div class='ctx'> 	msg.msg_namelen		= 0;</div><div class='del'>-	iov_iter_kvec(&amp;msg.msg_iter, WRITE, iov, 1, len);</div><div class='add'>+	iov_iter_kvec(&amp;msg.msg_iter, ITER_SOURCE, iov, 1, len);</div><div class='ctx'> 	msg.msg_control		= NULL;</div><div class='ctx'> 	msg.msg_controllen	= 0;</div><div class='ctx'> 	msg.msg_flags		= 0;</div><div class='hunk'>@@ -878,7 +914,8 @@ void afs_send_simple_reply(struct afs_call *call, const void *buf, size_t len)</div><div class='ctx'> 	if (n == -ENOMEM) {</div><div class='ctx'> 		_debug("oom");</div><div class='ctx'> 		rxrpc_kernel_abort_call(net-&gt;socket, call-&gt;rxcall,</div><div class='del'>-					RX_USER_ABORT, -ENOMEM, "KOO");</div><div class='add'>+					RXGEN_SS_MARSHAL, -ENOMEM,</div><div class='add'>+					afs_abort_oom);</div><div class='ctx'> 	}</div><div class='ctx'> 	_leave(" [error]");</div><div class='ctx'> }</div><div class='hunk'>@@ -900,6 +937,7 @@ int afs_extract_data(struct afs_call *call, bool want_more)</div><div class='ctx'> 	ret = rxrpc_kernel_recv_data(net-&gt;socket, call-&gt;rxcall, iter,</div><div class='ctx'> 				     &amp;call-&gt;iov_len, want_more, &amp;remote_abort,</div><div class='ctx'> 				     &amp;call-&gt;service_id);</div><div class='add'>+	trace_afs_receive_data(call, call-&gt;iter, want_more, ret);</div><div class='ctx'> 	if (ret == 0 || ret == -EAGAIN)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='hunk'>@@ -936,3 +974,13 @@ noinline int afs_protocol_error(struct afs_call *call,</div><div class='ctx'> 		call-&gt;unmarshalling_error = true;</div><div class='ctx'> 	return -EBADMSG;</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Wake up OOB notification processing.</div><div class='add'>+ */</div><div class='add'>+static void afs_rx_notify_oob(struct sock *sk, struct sk_buff *oob)</div><div class='add'>+{</div><div class='add'>+	struct afs_net *net = sk-&gt;sk_user_data;</div><div class='add'>+</div><div class='add'>+	schedule_work(&amp;net-&gt;rx_oob_work);</div><div class='add'>+}</div><div class='head'>diff --git a/fs/afs/security.c b/fs/afs/security.c<br/>index 3c7a8fc4f93f..55ddce94af03 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/security.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/security.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/security.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/security.c</a></div><div class='hunk'>@@ -16,6 +16,31 @@</div><div class='ctx'> </div><div class='ctx'> static DEFINE_HASHTABLE(afs_permits_cache, 10);</div><div class='ctx'> static DEFINE_SPINLOCK(afs_permits_lock);</div><div class='add'>+static DEFINE_MUTEX(afs_key_lock);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Allocate a key to use as a placeholder for anonymous user security.</div><div class='add'>+ */</div><div class='add'>+static int afs_alloc_anon_key(struct afs_cell *cell)</div><div class='add'>+{</div><div class='add'>+	struct key *key;</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;afs_key_lock);</div><div class='add'>+	key = cell-&gt;anonymous_key;</div><div class='add'>+	if (!key) {</div><div class='add'>+		key = rxrpc_get_null_key(cell-&gt;key_desc);</div><div class='add'>+		if (!IS_ERR(key))</div><div class='add'>+			cell-&gt;anonymous_key = key;</div><div class='add'>+	}</div><div class='add'>+	mutex_unlock(&amp;afs_key_lock);</div><div class='add'>+</div><div class='add'>+	if (IS_ERR(key))</div><div class='add'>+		return PTR_ERR(key);</div><div class='add'>+</div><div class='add'>+	_debug("anon key %p{%x}",</div><div class='add'>+	       cell-&gt;anonymous_key, key_serial(cell-&gt;anonymous_key));</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * get a key</div><div class='hunk'>@@ -23,11 +48,12 @@ static DEFINE_SPINLOCK(afs_permits_lock);</div><div class='ctx'> struct key *afs_request_key(struct afs_cell *cell)</div><div class='ctx'> {</div><div class='ctx'> 	struct key *key;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	_enter("{%x}", key_serial(cell-&gt;anonymous_key));</div><div class='add'>+	_enter("{%s}", cell-&gt;key_desc);</div><div class='ctx'> </div><div class='del'>-	_debug("key %s", cell-&gt;anonymous_key-&gt;description);</div><div class='del'>-	key = request_key_net(&amp;key_type_rxrpc, cell-&gt;anonymous_key-&gt;description,</div><div class='add'>+	_debug("key %s", cell-&gt;key_desc);</div><div class='add'>+	key = request_key_net(&amp;key_type_rxrpc, cell-&gt;key_desc,</div><div class='ctx'> 			      cell-&gt;net-&gt;net, NULL);</div><div class='ctx'> 	if (IS_ERR(key)) {</div><div class='ctx'> 		if (PTR_ERR(key) != -ENOKEY) {</div><div class='hunk'>@@ -35,6 +61,12 @@ struct key *afs_request_key(struct afs_cell *cell)</div><div class='ctx'> 			return key;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		if (!cell-&gt;anonymous_key) {</div><div class='add'>+			ret = afs_alloc_anon_key(cell);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				return ERR_PTR(ret);</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		/* act as anonymous user */</div><div class='ctx'> 		_leave(" = {%x} [anon]", key_serial(cell-&gt;anonymous_key));</div><div class='ctx'> 		return key_get(cell-&gt;anonymous_key);</div><div class='hunk'>@@ -52,11 +84,10 @@ struct key *afs_request_key_rcu(struct afs_cell *cell)</div><div class='ctx'> {</div><div class='ctx'> 	struct key *key;</div><div class='ctx'> </div><div class='del'>-	_enter("{%x}", key_serial(cell-&gt;anonymous_key));</div><div class='add'>+	_enter("{%s}", cell-&gt;key_desc);</div><div class='ctx'> </div><div class='del'>-	_debug("key %s", cell-&gt;anonymous_key-&gt;description);</div><div class='del'>-	key = request_key_net_rcu(&amp;key_type_rxrpc,</div><div class='del'>-				  cell-&gt;anonymous_key-&gt;description,</div><div class='add'>+	_debug("key %s", cell-&gt;key_desc);</div><div class='add'>+	key = request_key_net_rcu(&amp;key_type_rxrpc, cell-&gt;key_desc,</div><div class='ctx'> 				  cell-&gt;net-&gt;net);</div><div class='ctx'> 	if (IS_ERR(key)) {</div><div class='ctx'> 		if (PTR_ERR(key) != -ENOKEY) {</div><div class='hunk'>@@ -65,6 +96,8 @@ struct key *afs_request_key_rcu(struct afs_cell *cell)</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* act as anonymous user */</div><div class='add'>+		if (!cell-&gt;anonymous_key)</div><div class='add'>+			return NULL; /* Need to allocate */</div><div class='ctx'> 		_leave(" = {%x} [anon]", key_serial(cell-&gt;anonymous_key));</div><div class='ctx'> 		return key_get(cell-&gt;anonymous_key);</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -219,8 +252,7 @@ void afs_cache_permit(struct afs_vnode *vnode, struct key *key,</div><div class='ctx'> 	 * yet.</div><div class='ctx'> 	 */</div><div class='ctx'> 	size++;</div><div class='del'>-	new = kzalloc(sizeof(struct afs_permits) +</div><div class='del'>-		      sizeof(struct afs_permit) * size, GFP_NOFS);</div><div class='add'>+	new = kzalloc(struct_size(new, permits, size), GFP_NOFS);</div><div class='ctx'> 	if (!new)</div><div class='ctx'> 		goto out_put;</div><div class='ctx'> </div><div class='hunk'>@@ -396,7 +428,7 @@ int afs_check_permit(struct afs_vnode *vnode, struct key *key,</div><div class='ctx'>  * - AFS ACLs are attached to directories only, and a file is controlled by its</div><div class='ctx'>  *   parent directory's ACL</div><div class='ctx'>  */</div><div class='del'>-int afs_permission(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='add'>+int afs_permission(struct mnt_idmap *idmap, struct inode *inode,</div><div class='ctx'> 		   int mask)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_vnode *vnode = AFS_FS_I(inode);</div><div class='hunk'>@@ -409,7 +441,7 @@ int afs_permission(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 	if (mask &amp; MAY_NOT_BLOCK) {</div><div class='ctx'> 		key = afs_request_key_rcu(vnode-&gt;volume-&gt;cell);</div><div class='del'>-		if (IS_ERR(key))</div><div class='add'>+		if (IS_ERR_OR_NULL(key))</div><div class='ctx'> 			return -ECHILD;</div><div class='ctx'> </div><div class='ctx'> 		ret = -ECHILD;</div><div class='head'>diff --git a/fs/afs/server.c b/fs/afs/server.c<br/>index 6e5b9a19b234..c4428ebddb1d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/server.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/server.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/server.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/server.c</a></div><div class='hunk'>@@ -14,210 +14,103 @@</div><div class='ctx'> static unsigned afs_server_gc_delay = 10;	/* Server record timeout in seconds */</div><div class='ctx'> static atomic_t afs_server_debug_id;</div><div class='ctx'> </div><div class='del'>-static struct afs_server *afs_maybe_use_server(struct afs_server *,</div><div class='del'>-					       enum afs_server_trace);</div><div class='ctx'> static void __afs_put_server(struct afs_net *, struct afs_server *);</div><div class='add'>+static void afs_server_timer(struct timer_list *timer);</div><div class='add'>+static void afs_server_destroyer(struct work_struct *work);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Find a server by one of its addresses.</div><div class='ctx'>  */</div><div class='del'>-struct afs_server *afs_find_server(struct afs_net *net,</div><div class='del'>-				   const struct sockaddr_rxrpc *srx)</div><div class='add'>+struct afs_server *afs_find_server(const struct rxrpc_peer *peer)</div><div class='ctx'> {</div><div class='del'>-	const struct afs_addr_list *alist;</div><div class='del'>-	struct afs_server *server = NULL;</div><div class='del'>-	unsigned int i;</div><div class='del'>-	int seq = 0, diff;</div><div class='add'>+	struct afs_server *server = (struct afs_server *)rxrpc_kernel_get_peer_data(peer);</div><div class='ctx'> </div><div class='del'>-	rcu_read_lock();</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		if (server)</div><div class='del'>-			afs_unuse_server_notime(net, server, afs_server_trace_put_find_rsq);</div><div class='del'>-		server = NULL;</div><div class='del'>-		read_seqbegin_or_lock(&amp;net-&gt;fs_addr_lock, &amp;seq);</div><div class='del'>-</div><div class='del'>-		if (srx-&gt;transport.family == AF_INET6) {</div><div class='del'>-			const struct sockaddr_in6 *a = &amp;srx-&gt;transport.sin6, *b;</div><div class='del'>-			hlist_for_each_entry_rcu(server, &amp;net-&gt;fs_addresses6, addr6_link) {</div><div class='del'>-				alist = rcu_dereference(server-&gt;addresses);</div><div class='del'>-				for (i = alist-&gt;nr_ipv4; i &lt; alist-&gt;nr_addrs; i++) {</div><div class='del'>-					b = &amp;alist-&gt;addrs[i].transport.sin6;</div><div class='del'>-					diff = ((u16 __force)a-&gt;sin6_port -</div><div class='del'>-						(u16 __force)b-&gt;sin6_port);</div><div class='del'>-					if (diff == 0)</div><div class='del'>-						diff = memcmp(&amp;a-&gt;sin6_addr,</div><div class='del'>-							      &amp;b-&gt;sin6_addr,</div><div class='del'>-							      sizeof(struct in6_addr));</div><div class='del'>-					if (diff == 0)</div><div class='del'>-						goto found;</div><div class='del'>-				}</div><div class='del'>-			}</div><div class='del'>-		} else {</div><div class='del'>-			const struct sockaddr_in *a = &amp;srx-&gt;transport.sin, *b;</div><div class='del'>-			hlist_for_each_entry_rcu(server, &amp;net-&gt;fs_addresses4, addr4_link) {</div><div class='del'>-				alist = rcu_dereference(server-&gt;addresses);</div><div class='del'>-				for (i = 0; i &lt; alist-&gt;nr_ipv4; i++) {</div><div class='del'>-					b = &amp;alist-&gt;addrs[i].transport.sin;</div><div class='del'>-					diff = ((u16 __force)a-&gt;sin_port -</div><div class='del'>-						(u16 __force)b-&gt;sin_port);</div><div class='del'>-					if (diff == 0)</div><div class='del'>-						diff = ((u32 __force)a-&gt;sin_addr.s_addr -</div><div class='del'>-							(u32 __force)b-&gt;sin_addr.s_addr);</div><div class='del'>-					if (diff == 0)</div><div class='del'>-						goto found;</div><div class='del'>-				}</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		server = NULL;</div><div class='del'>-		continue;</div><div class='del'>-	found:</div><div class='del'>-		server = afs_maybe_use_server(server, afs_server_trace_get_by_addr);</div><div class='del'>-</div><div class='del'>-	} while (need_seqretry(&amp;net-&gt;fs_addr_lock, seq));</div><div class='del'>-</div><div class='del'>-	done_seqretry(&amp;net-&gt;fs_addr_lock, seq);</div><div class='del'>-</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-	return server;</div><div class='add'>+	if (!server)</div><div class='add'>+		return NULL;</div><div class='add'>+	return afs_use_server(server, false, afs_server_trace_use_cm_call);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Look up a server by its UUID and mark it active.</div><div class='add'>+ * Look up a server by its UUID and mark it active.  The caller must hold</div><div class='add'>+ * cell-&gt;fs_lock.</div><div class='ctx'>  */</div><div class='del'>-struct afs_server *afs_find_server_by_uuid(struct afs_net *net, const uuid_t *uuid)</div><div class='add'>+static struct afs_server *afs_find_server_by_uuid(struct afs_cell *cell, const uuid_t *uuid)</div><div class='ctx'> {</div><div class='del'>-	struct afs_server *server = NULL;</div><div class='add'>+	struct afs_server *server;</div><div class='ctx'> 	struct rb_node *p;</div><div class='del'>-	int diff, seq = 0;</div><div class='add'>+	int diff;</div><div class='ctx'> </div><div class='ctx'> 	_enter("%pU", uuid);</div><div class='ctx'> </div><div class='del'>-	do {</div><div class='del'>-		/* Unfortunately, rbtree walking doesn't give reliable results</div><div class='del'>-		 * under just the RCU read lock, so we have to check for</div><div class='del'>-		 * changes.</div><div class='del'>-		 */</div><div class='del'>-		if (server)</div><div class='del'>-			afs_unuse_server(net, server, afs_server_trace_put_uuid_rsq);</div><div class='del'>-		server = NULL;</div><div class='del'>-</div><div class='del'>-		read_seqbegin_or_lock(&amp;net-&gt;fs_lock, &amp;seq);</div><div class='del'>-</div><div class='del'>-		p = net-&gt;fs_servers.rb_node;</div><div class='del'>-		while (p) {</div><div class='del'>-			server = rb_entry(p, struct afs_server, uuid_rb);</div><div class='del'>-</div><div class='del'>-			diff = memcmp(uuid, &amp;server-&gt;uuid, sizeof(*uuid));</div><div class='del'>-			if (diff &lt; 0) {</div><div class='del'>-				p = p-&gt;rb_left;</div><div class='del'>-			} else if (diff &gt; 0) {</div><div class='del'>-				p = p-&gt;rb_right;</div><div class='del'>-			} else {</div><div class='del'>-				afs_use_server(server, afs_server_trace_get_by_uuid);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='add'>+	p = cell-&gt;fs_servers.rb_node;</div><div class='add'>+	while (p) {</div><div class='add'>+		server = rb_entry(p, struct afs_server, uuid_rb);</div><div class='ctx'> </div><div class='del'>-			server = NULL;</div><div class='add'>+		diff = memcmp(uuid, &amp;server-&gt;uuid, sizeof(*uuid));</div><div class='add'>+		if (diff &lt; 0) {</div><div class='add'>+			p = p-&gt;rb_left;</div><div class='add'>+		} else if (diff &gt; 0) {</div><div class='add'>+			p = p-&gt;rb_right;</div><div class='add'>+		} else {</div><div class='add'>+			if (test_bit(AFS_SERVER_FL_UNCREATED, &amp;server-&gt;flags))</div><div class='add'>+				return NULL; /* Need a write lock */</div><div class='add'>+			afs_use_server(server, true, afs_server_trace_use_by_uuid);</div><div class='add'>+			return server;</div><div class='ctx'> 		}</div><div class='del'>-	} while (need_seqretry(&amp;net-&gt;fs_lock, seq));</div><div class='del'>-</div><div class='del'>-	done_seqretry(&amp;net-&gt;fs_lock, seq);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	_leave(" = %p", server);</div><div class='del'>-	return server;</div><div class='add'>+	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Install a server record in the namespace tree.  If there's a clash, we stick</div><div class='del'>- * it into a list anchored on whichever afs_server struct is actually in the</div><div class='del'>- * tree.</div><div class='add'>+ * Install a server record in the cell tree.  The caller must hold an exclusive</div><div class='add'>+ * lock on cell-&gt;fs_lock.</div><div class='ctx'>  */</div><div class='ctx'> static struct afs_server *afs_install_server(struct afs_cell *cell,</div><div class='del'>-					     struct afs_server *candidate)</div><div class='add'>+					     struct afs_server **candidate)</div><div class='ctx'> {</div><div class='del'>-	const struct afs_addr_list *alist;</div><div class='del'>-	struct afs_server *server, *next;</div><div class='add'>+	struct afs_server *server;</div><div class='ctx'> 	struct afs_net *net = cell-&gt;net;</div><div class='ctx'> 	struct rb_node **pp, *p;</div><div class='ctx'> 	int diff;</div><div class='ctx'> </div><div class='ctx'> 	_enter("%p", candidate);</div><div class='ctx'> </div><div class='del'>-	write_seqlock(&amp;net-&gt;fs_lock);</div><div class='del'>-</div><div class='ctx'> 	/* Firstly install the server in the UUID lookup tree */</div><div class='del'>-	pp = &amp;net-&gt;fs_servers.rb_node;</div><div class='add'>+	pp = &amp;cell-&gt;fs_servers.rb_node;</div><div class='ctx'> 	p = NULL;</div><div class='ctx'> 	while (*pp) {</div><div class='ctx'> 		p = *pp;</div><div class='ctx'> 		_debug("- consider %p", p);</div><div class='ctx'> 		server = rb_entry(p, struct afs_server, uuid_rb);</div><div class='del'>-		diff = memcmp(&amp;candidate-&gt;uuid, &amp;server-&gt;uuid, sizeof(uuid_t));</div><div class='del'>-		if (diff &lt; 0) {</div><div class='add'>+		diff = memcmp(&amp;(*candidate)-&gt;uuid, &amp;server-&gt;uuid, sizeof(uuid_t));</div><div class='add'>+		if (diff &lt; 0)</div><div class='ctx'> 			pp = &amp;(*pp)-&gt;rb_left;</div><div class='del'>-		} else if (diff &gt; 0) {</div><div class='add'>+		else if (diff &gt; 0)</div><div class='ctx'> 			pp = &amp;(*pp)-&gt;rb_right;</div><div class='del'>-		} else {</div><div class='del'>-			if (server-&gt;cell == cell)</div><div class='del'>-				goto exists;</div><div class='del'>-</div><div class='del'>-			/* We have the same UUID representing servers in</div><div class='del'>-			 * different cells.  Append the new server to the list.</div><div class='del'>-			 */</div><div class='del'>-			for (;;) {</div><div class='del'>-				next = rcu_dereference_protected(</div><div class='del'>-					server-&gt;uuid_next,</div><div class='del'>-					lockdep_is_held(&amp;net-&gt;fs_lock.lock));</div><div class='del'>-				if (!next)</div><div class='del'>-					break;</div><div class='del'>-				server = next;</div><div class='del'>-			}</div><div class='del'>-			rcu_assign_pointer(server-&gt;uuid_next, candidate);</div><div class='del'>-			candidate-&gt;uuid_prev = server;</div><div class='del'>-			server = candidate;</div><div class='del'>-			goto added_dup;</div><div class='del'>-		}</div><div class='add'>+		else</div><div class='add'>+			goto exists;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	server = candidate;</div><div class='add'>+	server = *candidate;</div><div class='add'>+	*candidate = NULL;</div><div class='ctx'> 	rb_link_node(&amp;server-&gt;uuid_rb, p, pp);</div><div class='del'>-	rb_insert_color(&amp;server-&gt;uuid_rb, &amp;net-&gt;fs_servers);</div><div class='add'>+	rb_insert_color(&amp;server-&gt;uuid_rb, &amp;cell-&gt;fs_servers);</div><div class='add'>+	write_seqlock(&amp;net-&gt;fs_lock);</div><div class='ctx'> 	hlist_add_head_rcu(&amp;server-&gt;proc_link, &amp;net-&gt;fs_proc);</div><div class='add'>+	write_sequnlock(&amp;net-&gt;fs_lock);</div><div class='ctx'> </div><div class='del'>-added_dup:</div><div class='del'>-	write_seqlock(&amp;net-&gt;fs_addr_lock);</div><div class='del'>-	alist = rcu_dereference_protected(server-&gt;addresses,</div><div class='del'>-					  lockdep_is_held(&amp;net-&gt;fs_addr_lock.lock));</div><div class='del'>-</div><div class='del'>-	/* Secondly, if the server has any IPv4 and/or IPv6 addresses, install</div><div class='del'>-	 * it in the IPv4 and/or IPv6 reverse-map lists.</div><div class='del'>-	 *</div><div class='del'>-	 * TODO: For speed we want to use something other than a flat list</div><div class='del'>-	 * here; even sorting the list in terms of lowest address would help a</div><div class='del'>-	 * bit, but anything we might want to do gets messy and memory</div><div class='del'>-	 * intensive.</div><div class='del'>-	 */</div><div class='del'>-	if (alist-&gt;nr_ipv4 &gt; 0)</div><div class='del'>-		hlist_add_head_rcu(&amp;server-&gt;addr4_link, &amp;net-&gt;fs_addresses4);</div><div class='del'>-	if (alist-&gt;nr_addrs &gt; alist-&gt;nr_ipv4)</div><div class='del'>-		hlist_add_head_rcu(&amp;server-&gt;addr6_link, &amp;net-&gt;fs_addresses6);</div><div class='del'>-</div><div class='del'>-	write_sequnlock(&amp;net-&gt;fs_addr_lock);</div><div class='add'>+	afs_get_cell(cell, afs_cell_trace_get_server);</div><div class='ctx'> </div><div class='ctx'> exists:</div><div class='del'>-	afs_get_server(server, afs_server_trace_get_install);</div><div class='del'>-	write_sequnlock(&amp;net-&gt;fs_lock);</div><div class='add'>+	afs_use_server(server, true, afs_server_trace_use_install);</div><div class='ctx'> 	return server;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Allocate a new server record and mark it active.</div><div class='add'>+ * Allocate a new server record and mark it as active but uncreated.</div><div class='ctx'>  */</div><div class='del'>-static struct afs_server *afs_alloc_server(struct afs_cell *cell,</div><div class='del'>-					   const uuid_t *uuid,</div><div class='del'>-					   struct afs_addr_list *alist)</div><div class='add'>+static struct afs_server *afs_alloc_server(struct afs_cell *cell, const uuid_t *uuid)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_server *server;</div><div class='ctx'> 	struct afs_net *net = cell-&gt;net;</div><div class='hunk'>@@ -226,49 +119,50 @@ static struct afs_server *afs_alloc_server(struct afs_cell *cell,</div><div class='ctx'> </div><div class='ctx'> 	server = kzalloc(sizeof(struct afs_server), GFP_KERNEL);</div><div class='ctx'> 	if (!server)</div><div class='del'>-		goto enomem;</div><div class='add'>+		return NULL;</div><div class='ctx'> </div><div class='del'>-	atomic_set(&amp;server-&gt;ref, 1);</div><div class='del'>-	atomic_set(&amp;server-&gt;active, 1);</div><div class='add'>+	refcount_set(&amp;server-&gt;ref, 1);</div><div class='add'>+	atomic_set(&amp;server-&gt;active, 0);</div><div class='add'>+	__set_bit(AFS_SERVER_FL_UNCREATED, &amp;server-&gt;flags);</div><div class='ctx'> 	server-&gt;debug_id = atomic_inc_return(&amp;afs_server_debug_id);</div><div class='del'>-	RCU_INIT_POINTER(server-&gt;addresses, alist);</div><div class='del'>-	server-&gt;addr_version = alist-&gt;version;</div><div class='ctx'> 	server-&gt;uuid = *uuid;</div><div class='ctx'> 	rwlock_init(&amp;server-&gt;fs_lock);</div><div class='del'>-	INIT_WORK(&amp;server-&gt;initcb_work, afs_server_init_callback_work);</div><div class='add'>+	INIT_WORK(&amp;server-&gt;destroyer, &amp;afs_server_destroyer);</div><div class='add'>+	timer_setup(&amp;server-&gt;timer, afs_server_timer, 0);</div><div class='add'>+	INIT_LIST_HEAD(&amp;server-&gt;volumes);</div><div class='ctx'> 	init_waitqueue_head(&amp;server-&gt;probe_wq);</div><div class='add'>+	mutex_init(&amp;server-&gt;cm_token_lock);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;server-&gt;probe_link);</div><div class='add'>+	INIT_HLIST_NODE(&amp;server-&gt;proc_link);</div><div class='ctx'> 	spin_lock_init(&amp;server-&gt;probe_lock);</div><div class='ctx'> 	server-&gt;cell = cell;</div><div class='ctx'> 	server-&gt;rtt = UINT_MAX;</div><div class='add'>+	server-&gt;service_id = FS_SERVICE;</div><div class='add'>+	server-&gt;probe_counter = 1;</div><div class='add'>+	server-&gt;probed_at = jiffies - LONG_MAX / 2;</div><div class='ctx'> </div><div class='ctx'> 	afs_inc_servers_outstanding(net);</div><div class='del'>-	trace_afs_server(server, 1, 1, afs_server_trace_alloc);</div><div class='ctx'> 	_leave(" = %p", server);</div><div class='ctx'> 	return server;</div><div class='del'>-</div><div class='del'>-enomem:</div><div class='del'>-	_leave(" = NULL [nomem]");</div><div class='del'>-	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Look up an address record for a server</div><div class='ctx'>  */</div><div class='del'>-static struct afs_addr_list *afs_vl_lookup_addrs(struct afs_cell *cell,</div><div class='del'>-						 struct key *key, const uuid_t *uuid)</div><div class='add'>+static struct afs_addr_list *afs_vl_lookup_addrs(struct afs_server *server,</div><div class='add'>+						 struct key *key)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_vl_cursor vc;</div><div class='ctx'> 	struct afs_addr_list *alist = NULL;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	ret = -ERESTARTSYS;</div><div class='del'>-	if (afs_begin_vlserver_operation(&amp;vc, cell, key)) {</div><div class='add'>+	if (afs_begin_vlserver_operation(&amp;vc, server-&gt;cell, key)) {</div><div class='ctx'> 		while (afs_select_vlserver(&amp;vc)) {</div><div class='ctx'> 			if (test_bit(AFS_VLSERVER_FL_IS_YFS, &amp;vc.server-&gt;flags))</div><div class='del'>-				alist = afs_yfsvl_get_endpoints(&amp;vc, uuid);</div><div class='add'>+				alist = afs_yfsvl_get_endpoints(&amp;vc, &amp;server-&gt;uuid);</div><div class='ctx'> 			else</div><div class='del'>-				alist = afs_vl_get_addrs_u(&amp;vc, uuid);</div><div class='add'>+				alist = afs_vl_get_addrs_u(&amp;vc, &amp;server-&gt;uuid);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		ret = afs_end_vlserver_operation(&amp;vc);</div><div class='hunk'>@@ -278,72 +172,122 @@ static struct afs_addr_list *afs_vl_lookup_addrs(struct afs_cell *cell,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Get or create a fileserver record.</div><div class='add'>+ * Get or create a fileserver record and return it with an active-use count on</div><div class='add'>+ * it.</div><div class='ctx'>  */</div><div class='ctx'> struct afs_server *afs_lookup_server(struct afs_cell *cell, struct key *key,</div><div class='ctx'> 				     const uuid_t *uuid, u32 addr_version)</div><div class='ctx'> {</div><div class='del'>-	struct afs_addr_list *alist;</div><div class='del'>-	struct afs_server *server, *candidate;</div><div class='add'>+	struct afs_addr_list *alist = NULL;</div><div class='add'>+	struct afs_server *server, *candidate = NULL;</div><div class='add'>+	bool creating = false;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	_enter("%p,%pU", cell-&gt;net, uuid);</div><div class='ctx'> </div><div class='del'>-	server = afs_find_server_by_uuid(cell-&gt;net, uuid);</div><div class='add'>+	down_read(&amp;cell-&gt;fs_lock);</div><div class='add'>+	server = afs_find_server_by_uuid(cell, uuid);</div><div class='add'>+	/* Won't see servers marked uncreated. */</div><div class='add'>+	up_read(&amp;cell-&gt;fs_lock);</div><div class='add'>+</div><div class='ctx'> 	if (server) {</div><div class='add'>+		timer_delete_sync(&amp;server-&gt;timer);</div><div class='add'>+		if (test_bit(AFS_SERVER_FL_CREATING, &amp;server-&gt;flags))</div><div class='add'>+			goto wait_for_creation;</div><div class='ctx'> 		if (server-&gt;addr_version != addr_version)</div><div class='ctx'> 			set_bit(AFS_SERVER_FL_NEEDS_UPDATE, &amp;server-&gt;flags);</div><div class='ctx'> 		return server;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	alist = afs_vl_lookup_addrs(cell, key, uuid);</div><div class='del'>-	if (IS_ERR(alist))</div><div class='del'>-		return ERR_CAST(alist);</div><div class='del'>-</div><div class='del'>-	candidate = afs_alloc_server(cell, uuid, alist);</div><div class='add'>+	candidate = afs_alloc_server(cell, uuid);</div><div class='ctx'> 	if (!candidate) {</div><div class='del'>-		afs_put_addrlist(alist);</div><div class='add'>+		afs_put_addrlist(alist, afs_alist_trace_put_server_oom);</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	server = afs_install_server(cell, candidate);</div><div class='del'>-	if (server != candidate) {</div><div class='del'>-		afs_put_addrlist(alist);</div><div class='add'>+	down_write(&amp;cell-&gt;fs_lock);</div><div class='add'>+	server = afs_install_server(cell, &amp;candidate);</div><div class='add'>+	if (test_bit(AFS_SERVER_FL_CREATING, &amp;server-&gt;flags)) {</div><div class='add'>+		/* We need to wait for creation to complete. */</div><div class='add'>+		up_write(&amp;cell-&gt;fs_lock);</div><div class='add'>+		goto wait_for_creation;</div><div class='add'>+	}</div><div class='add'>+	if (test_bit(AFS_SERVER_FL_UNCREATED, &amp;server-&gt;flags)) {</div><div class='add'>+		set_bit(AFS_SERVER_FL_CREATING, &amp;server-&gt;flags);</div><div class='add'>+		clear_bit(AFS_SERVER_FL_UNCREATED, &amp;server-&gt;flags);</div><div class='add'>+		creating = true;</div><div class='add'>+	}</div><div class='add'>+	up_write(&amp;cell-&gt;fs_lock);</div><div class='add'>+	timer_delete_sync(&amp;server-&gt;timer);</div><div class='add'>+</div><div class='add'>+	/* If we get to create the server, we look up the addresses and then</div><div class='add'>+	 * immediately dispatch an asynchronous probe to each interface on the</div><div class='add'>+	 * fileserver.  This will make sure the repeat-probing service is</div><div class='add'>+	 * started.</div><div class='add'>+	 */</div><div class='add'>+	if (creating) {</div><div class='add'>+		alist = afs_vl_lookup_addrs(server, key);</div><div class='add'>+		if (IS_ERR(alist)) {</div><div class='add'>+			ret = PTR_ERR(alist);</div><div class='add'>+			goto create_failed;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		ret = afs_fs_probe_fileserver(cell-&gt;net, server, alist, key);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto create_failed;</div><div class='add'>+</div><div class='add'>+		clear_and_wake_up_bit(AFS_SERVER_FL_CREATING, &amp;server-&gt;flags);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	afs_put_addrlist(alist, afs_alist_trace_put_server_create);</div><div class='add'>+	if (candidate) {</div><div class='add'>+		kfree(rcu_access_pointer(server-&gt;endpoint_state));</div><div class='ctx'> 		kfree(candidate);</div><div class='del'>-	} else {</div><div class='del'>-		/* Immediately dispatch an asynchronous probe to each interface</div><div class='del'>-		 * on the fileserver.  This will make sure the repeat-probing</div><div class='del'>-		 * service is started.</div><div class='del'>-		 */</div><div class='del'>-		afs_fs_probe_fileserver(cell-&gt;net, server, key, true);</div><div class='add'>+		afs_dec_servers_outstanding(cell-&gt;net);</div><div class='add'>+	}</div><div class='add'>+	return server ?: ERR_PTR(ret);</div><div class='add'>+</div><div class='add'>+wait_for_creation:</div><div class='add'>+	afs_see_server(server, afs_server_trace_wait_create);</div><div class='add'>+	wait_on_bit(&amp;server-&gt;flags, AFS_SERVER_FL_CREATING, TASK_UNINTERRUPTIBLE);</div><div class='add'>+	if (test_bit_acquire(AFS_SERVER_FL_UNCREATED, &amp;server-&gt;flags)) {</div><div class='add'>+		/* Barrier: read flag before error */</div><div class='add'>+		ret = READ_ONCE(server-&gt;create_error);</div><div class='add'>+		afs_put_server(cell-&gt;net, server, afs_server_trace_unuse_create_fail);</div><div class='add'>+		server = NULL;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return server;</div><div class='del'>-}</div><div class='add'>+	ret = 0;</div><div class='add'>+	goto out;</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Set the server timer to fire after a given delay, assuming it's not already</div><div class='del'>- * set for an earlier time.</div><div class='del'>- */</div><div class='del'>-static void afs_set_server_timer(struct afs_net *net, time64_t delay)</div><div class='del'>-{</div><div class='del'>-	if (net-&gt;live) {</div><div class='del'>-		afs_inc_servers_outstanding(net);</div><div class='del'>-		if (timer_reduce(&amp;net-&gt;fs_timer, jiffies + delay * HZ))</div><div class='del'>-			afs_dec_servers_outstanding(net);</div><div class='add'>+create_failed:</div><div class='add'>+	down_write(&amp;cell-&gt;fs_lock);</div><div class='add'>+</div><div class='add'>+	WRITE_ONCE(server-&gt;create_error, ret);</div><div class='add'>+	smp_wmb(); /* Barrier: set error before flag. */</div><div class='add'>+	set_bit(AFS_SERVER_FL_UNCREATED, &amp;server-&gt;flags);</div><div class='add'>+</div><div class='add'>+	clear_and_wake_up_bit(AFS_SERVER_FL_CREATING, &amp;server-&gt;flags);</div><div class='add'>+</div><div class='add'>+	if (test_bit(AFS_SERVER_FL_UNCREATED, &amp;server-&gt;flags)) {</div><div class='add'>+		clear_bit(AFS_SERVER_FL_UNCREATED, &amp;server-&gt;flags);</div><div class='add'>+		creating = true;</div><div class='ctx'> 	}</div><div class='add'>+	afs_unuse_server(cell-&gt;net, server, afs_server_trace_unuse_create_fail);</div><div class='add'>+	server = NULL;</div><div class='add'>+</div><div class='add'>+	up_write(&amp;cell-&gt;fs_lock);</div><div class='add'>+	goto out;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Server management timer.  We have an increment on fs_outstanding that we</div><div class='del'>- * need to pass along to the work item.</div><div class='add'>+ * Set/reduce a server's timer.</div><div class='ctx'>  */</div><div class='del'>-void afs_servers_timer(struct timer_list *timer)</div><div class='add'>+static void afs_set_server_timer(struct afs_server *server, unsigned int delay_secs)</div><div class='ctx'> {</div><div class='del'>-	struct afs_net *net = container_of(timer, struct afs_net, fs_timer);</div><div class='del'>-</div><div class='del'>-	_enter("");</div><div class='del'>-	if (!queue_work(afs_wq, &amp;net-&gt;fs_manager))</div><div class='del'>-		afs_dec_servers_outstanding(net);</div><div class='add'>+	mod_timer(&amp;server-&gt;timer, jiffies + delay_secs * HZ);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -352,38 +296,32 @@ void afs_servers_timer(struct timer_list *timer)</div><div class='ctx'> struct afs_server *afs_get_server(struct afs_server *server,</div><div class='ctx'> 				  enum afs_server_trace reason)</div><div class='ctx'> {</div><div class='del'>-	unsigned int u = atomic_inc_return(&amp;server-&gt;ref);</div><div class='add'>+	unsigned int a;</div><div class='add'>+	int r;</div><div class='ctx'> </div><div class='del'>-	trace_afs_server(server, u, atomic_read(&amp;server-&gt;active), reason);</div><div class='add'>+	__refcount_inc(&amp;server-&gt;ref, &amp;r);</div><div class='add'>+	a = atomic_read(&amp;server-&gt;active);</div><div class='add'>+	trace_afs_server(server-&gt;debug_id, r + 1, a, reason);</div><div class='ctx'> 	return server;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Try to get a reference on a server object.</div><div class='add'>+ * Get an active count on a server object and maybe remove from the inactive</div><div class='add'>+ * list.</div><div class='ctx'>  */</div><div class='del'>-static struct afs_server *afs_maybe_use_server(struct afs_server *server,</div><div class='del'>-					       enum afs_server_trace reason)</div><div class='add'>+struct afs_server *afs_use_server(struct afs_server *server, bool activate,</div><div class='add'>+				  enum afs_server_trace reason)</div><div class='ctx'> {</div><div class='del'>-	unsigned int r = atomic_fetch_add_unless(&amp;server-&gt;ref, 1, 0);</div><div class='ctx'> 	unsigned int a;</div><div class='add'>+	int r;</div><div class='ctx'> </div><div class='del'>-	if (r == 0)</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='add'>+	__refcount_inc(&amp;server-&gt;ref, &amp;r);</div><div class='ctx'> 	a = atomic_inc_return(&amp;server-&gt;active);</div><div class='del'>-	trace_afs_server(server, r, a, reason);</div><div class='del'>-	return server;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Get an active count on a server object.</div><div class='del'>- */</div><div class='del'>-struct afs_server *afs_use_server(struct afs_server *server, enum afs_server_trace reason)</div><div class='del'>-{</div><div class='del'>-	unsigned int r = atomic_inc_return(&amp;server-&gt;ref);</div><div class='del'>-	unsigned int a = atomic_inc_return(&amp;server-&gt;active);</div><div class='add'>+	if (a == 1 &amp;&amp; activate &amp;&amp;</div><div class='add'>+	    !test_bit(AFS_SERVER_FL_EXPIRED, &amp;server-&gt;flags))</div><div class='add'>+		timer_delete(&amp;server-&gt;timer);</div><div class='ctx'> </div><div class='del'>-	trace_afs_server(server, r, a, reason);</div><div class='add'>+	trace_afs_server(server-&gt;debug_id, r + 1, a, reason);</div><div class='ctx'> 	return server;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -393,14 +331,18 @@ struct afs_server *afs_use_server(struct afs_server *server, enum afs_server_tra</div><div class='ctx'> void afs_put_server(struct afs_net *net, struct afs_server *server,</div><div class='ctx'> 		    enum afs_server_trace reason)</div><div class='ctx'> {</div><div class='del'>-	unsigned int usage;</div><div class='add'>+	unsigned int a, debug_id;</div><div class='add'>+	bool zero;</div><div class='add'>+	int r;</div><div class='ctx'> </div><div class='ctx'> 	if (!server)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	usage = atomic_dec_return(&amp;server-&gt;ref);</div><div class='del'>-	trace_afs_server(server, usage, atomic_read(&amp;server-&gt;active), reason);</div><div class='del'>-	if (unlikely(usage == 0))</div><div class='add'>+	debug_id = server-&gt;debug_id;</div><div class='add'>+	a = atomic_read(&amp;server-&gt;active);</div><div class='add'>+	zero = __refcount_dec_and_test(&amp;server-&gt;ref, &amp;r);</div><div class='add'>+	trace_afs_server(debug_id, r - 1, a, reason);</div><div class='add'>+	if (unlikely(zero))</div><div class='ctx'> 		__afs_put_server(net, server);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -411,13 +353,16 @@ void afs_put_server(struct afs_net *net, struct afs_server *server,</div><div class='ctx'> void afs_unuse_server_notime(struct afs_net *net, struct afs_server *server,</div><div class='ctx'> 			     enum afs_server_trace reason)</div><div class='ctx'> {</div><div class='del'>-	if (server) {</div><div class='del'>-		unsigned int active = atomic_dec_return(&amp;server-&gt;active);</div><div class='add'>+	if (!server)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-		if (active == 0)</div><div class='del'>-			afs_set_server_timer(net, afs_server_gc_delay);</div><div class='del'>-		afs_put_server(net, server, reason);</div><div class='add'>+	if (atomic_dec_and_test(&amp;server-&gt;active)) {</div><div class='add'>+		if (test_bit(AFS_SERVER_FL_EXPIRED, &amp;server-&gt;flags) ||</div><div class='add'>+		    READ_ONCE(server-&gt;cell-&gt;state) &gt;= AFS_CELL_REMOVING)</div><div class='add'>+			schedule_work(&amp;server-&gt;destroyer);</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	afs_put_server(net, server, reason);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -426,19 +371,34 @@ void afs_unuse_server_notime(struct afs_net *net, struct afs_server *server,</div><div class='ctx'> void afs_unuse_server(struct afs_net *net, struct afs_server *server,</div><div class='ctx'> 		      enum afs_server_trace reason)</div><div class='ctx'> {</div><div class='del'>-	if (server) {</div><div class='del'>-		server-&gt;unuse_time = ktime_get_real_seconds();</div><div class='del'>-		afs_unuse_server_notime(net, server, reason);</div><div class='add'>+	if (!server)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (atomic_dec_and_test(&amp;server-&gt;active)) {</div><div class='add'>+		if (!test_bit(AFS_SERVER_FL_EXPIRED, &amp;server-&gt;flags) &amp;&amp;</div><div class='add'>+		    READ_ONCE(server-&gt;cell-&gt;state) &lt; AFS_CELL_REMOVING) {</div><div class='add'>+			time64_t unuse_time = ktime_get_real_seconds();</div><div class='add'>+</div><div class='add'>+			server-&gt;unuse_time = unuse_time;</div><div class='add'>+			afs_set_server_timer(server, afs_server_gc_delay);</div><div class='add'>+		} else {</div><div class='add'>+			schedule_work(&amp;server-&gt;destroyer);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	afs_put_server(net, server, reason);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void afs_server_rcu(struct rcu_head *rcu)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_server *server = container_of(rcu, struct afs_server, rcu);</div><div class='ctx'> </div><div class='del'>-	trace_afs_server(server, atomic_read(&amp;server-&gt;ref),</div><div class='add'>+	trace_afs_server(server-&gt;debug_id, refcount_read(&amp;server-&gt;ref),</div><div class='ctx'> 			 atomic_read(&amp;server-&gt;active), afs_server_trace_free);</div><div class='del'>-	afs_put_addrlist(rcu_access_pointer(server-&gt;addresses));</div><div class='add'>+	afs_put_endpoint_state(rcu_access_pointer(server-&gt;endpoint_state),</div><div class='add'>+			       afs_estate_trace_put_server);</div><div class='add'>+	afs_put_cell(server-&gt;cell, afs_cell_trace_put_server);</div><div class='add'>+	kfree(server-&gt;cm_rxgk_appdata.data);</div><div class='ctx'> 	kfree(server);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -450,173 +410,126 @@ static void __afs_put_server(struct afs_net *net, struct afs_server *server)</div><div class='ctx'> </div><div class='ctx'> static void afs_give_up_callbacks(struct afs_net *net, struct afs_server *server)</div><div class='ctx'> {</div><div class='del'>-	struct afs_addr_list *alist = rcu_access_pointer(server-&gt;addresses);</div><div class='del'>-	struct afs_addr_cursor ac = {</div><div class='del'>-		.alist	= alist,</div><div class='del'>-		.index	= alist-&gt;preferred,</div><div class='del'>-		.error	= 0,</div><div class='del'>-	};</div><div class='del'>-</div><div class='del'>-	afs_fs_give_up_all_callbacks(net, server, &amp;ac, NULL);</div><div class='add'>+	struct afs_endpoint_state *estate = rcu_access_pointer(server-&gt;endpoint_state);</div><div class='add'>+	struct afs_addr_list *alist = estate-&gt;addresses;</div><div class='add'>+</div><div class='add'>+	afs_fs_give_up_all_callbacks(net, server, &amp;alist-&gt;addrs[alist-&gt;preferred], NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * destroy a dead server</div><div class='add'>+ * Check to see if the server record has expired.</div><div class='ctx'>  */</div><div class='del'>-static void afs_destroy_server(struct afs_net *net, struct afs_server *server)</div><div class='add'>+static bool afs_has_server_expired(const struct afs_server *server)</div><div class='ctx'> {</div><div class='del'>-	if (test_bit(AFS_SERVER_FL_MAY_HAVE_CB, &amp;server-&gt;flags))</div><div class='del'>-		afs_give_up_callbacks(net, server);</div><div class='add'>+	time64_t expires_at;</div><div class='ctx'> </div><div class='del'>-	flush_work(&amp;server-&gt;initcb_work);</div><div class='del'>-	afs_put_server(net, server, afs_server_trace_destroy);</div><div class='add'>+	if (atomic_read(&amp;server-&gt;active))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	if (server-&gt;cell-&gt;net-&gt;live ||</div><div class='add'>+	    server-&gt;cell-&gt;state &gt;= AFS_CELL_REMOVING) {</div><div class='add'>+		trace_afs_server(server-&gt;debug_id, refcount_read(&amp;server-&gt;ref),</div><div class='add'>+				 0, afs_server_trace_purging);</div><div class='add'>+		return true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	expires_at = server-&gt;unuse_time;</div><div class='add'>+	if (!test_bit(AFS_SERVER_FL_VL_FAIL, &amp;server-&gt;flags) &amp;&amp;</div><div class='add'>+	    !test_bit(AFS_SERVER_FL_NOT_FOUND, &amp;server-&gt;flags))</div><div class='add'>+		expires_at += afs_server_gc_delay;</div><div class='add'>+</div><div class='add'>+	return ktime_get_real_seconds() &gt; expires_at;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Garbage collect any expired servers.</div><div class='add'>+ * Remove a server record from it's parent cell's database.</div><div class='ctx'>  */</div><div class='del'>-static void afs_gc_servers(struct afs_net *net, struct afs_server *gc_list)</div><div class='add'>+static bool afs_remove_server_from_cell(struct afs_server *server)</div><div class='ctx'> {</div><div class='del'>-	struct afs_server *server, *next, *prev;</div><div class='del'>-	int active;</div><div class='del'>-</div><div class='del'>-	while ((server = gc_list)) {</div><div class='del'>-		gc_list = server-&gt;gc_next;</div><div class='del'>-</div><div class='del'>-		write_seqlock(&amp;net-&gt;fs_lock);</div><div class='del'>-</div><div class='del'>-		active = atomic_read(&amp;server-&gt;active);</div><div class='del'>-		if (active == 0) {</div><div class='del'>-			trace_afs_server(server, atomic_read(&amp;server-&gt;ref),</div><div class='del'>-					 active, afs_server_trace_gc);</div><div class='del'>-			next = rcu_dereference_protected(</div><div class='del'>-				server-&gt;uuid_next, lockdep_is_held(&amp;net-&gt;fs_lock.lock));</div><div class='del'>-			prev = server-&gt;uuid_prev;</div><div class='del'>-			if (!prev) {</div><div class='del'>-				/* The one at the front is in the tree */</div><div class='del'>-				if (!next) {</div><div class='del'>-					rb_erase(&amp;server-&gt;uuid_rb, &amp;net-&gt;fs_servers);</div><div class='del'>-				} else {</div><div class='del'>-					rb_replace_node_rcu(&amp;server-&gt;uuid_rb,</div><div class='del'>-							    &amp;next-&gt;uuid_rb,</div><div class='del'>-							    &amp;net-&gt;fs_servers);</div><div class='del'>-					next-&gt;uuid_prev = NULL;</div><div class='del'>-				}</div><div class='del'>-			} else {</div><div class='del'>-				/* This server is not at the front */</div><div class='del'>-				rcu_assign_pointer(prev-&gt;uuid_next, next);</div><div class='del'>-				if (next)</div><div class='del'>-					next-&gt;uuid_prev = prev;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			list_del(&amp;server-&gt;probe_link);</div><div class='del'>-			hlist_del_rcu(&amp;server-&gt;proc_link);</div><div class='del'>-			if (!hlist_unhashed(&amp;server-&gt;addr4_link))</div><div class='del'>-				hlist_del_rcu(&amp;server-&gt;addr4_link);</div><div class='del'>-			if (!hlist_unhashed(&amp;server-&gt;addr6_link))</div><div class='del'>-				hlist_del_rcu(&amp;server-&gt;addr6_link);</div><div class='del'>-		}</div><div class='del'>-		write_sequnlock(&amp;net-&gt;fs_lock);</div><div class='add'>+	struct afs_cell *cell = server-&gt;cell;</div><div class='ctx'> </div><div class='del'>-		if (active == 0)</div><div class='del'>-			afs_destroy_server(net, server);</div><div class='add'>+	down_write(&amp;cell-&gt;fs_lock);</div><div class='add'>+</div><div class='add'>+	if (!afs_has_server_expired(server)) {</div><div class='add'>+		up_write(&amp;cell-&gt;fs_lock);</div><div class='add'>+		return false;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	set_bit(AFS_SERVER_FL_EXPIRED, &amp;server-&gt;flags);</div><div class='add'>+	_debug("expire %pU %u", &amp;server-&gt;uuid, atomic_read(&amp;server-&gt;active));</div><div class='add'>+	afs_see_server(server, afs_server_trace_see_expired);</div><div class='add'>+	rb_erase(&amp;server-&gt;uuid_rb, &amp;cell-&gt;fs_servers);</div><div class='add'>+	up_write(&amp;cell-&gt;fs_lock);</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Manage the records of servers known to be within a network namespace.  This</div><div class='del'>- * includes garbage collecting unused servers.</div><div class='del'>- *</div><div class='del'>- * Note also that we were given an increment on net-&gt;servers_outstanding by</div><div class='del'>- * whoever queued us that we need to deal with before returning.</div><div class='del'>- */</div><div class='del'>-void afs_manage_servers(struct work_struct *work)</div><div class='add'>+static void afs_server_destroyer(struct work_struct *work)</div><div class='ctx'> {</div><div class='del'>-	struct afs_net *net = container_of(work, struct afs_net, fs_manager);</div><div class='del'>-	struct afs_server *gc_list = NULL;</div><div class='del'>-	struct rb_node *cursor;</div><div class='del'>-	time64_t now = ktime_get_real_seconds(), next_manage = TIME64_MAX;</div><div class='del'>-	bool purging = !net-&gt;live;</div><div class='add'>+	struct afs_endpoint_state *estate;</div><div class='add'>+	struct afs_server *server = container_of(work, struct afs_server, destroyer);</div><div class='add'>+	struct afs_net *net = server-&gt;cell-&gt;net;</div><div class='ctx'> </div><div class='del'>-	_enter("");</div><div class='add'>+	afs_see_server(server, afs_server_trace_see_destroyer);</div><div class='ctx'> </div><div class='del'>-	/* Trawl the server list looking for servers that have expired from</div><div class='del'>-	 * lack of use.</div><div class='del'>-	 */</div><div class='del'>-	read_seqlock_excl(&amp;net-&gt;fs_lock);</div><div class='del'>-</div><div class='del'>-	for (cursor = rb_first(&amp;net-&gt;fs_servers); cursor; cursor = rb_next(cursor)) {</div><div class='del'>-		struct afs_server *server =</div><div class='del'>-			rb_entry(cursor, struct afs_server, uuid_rb);</div><div class='del'>-		int active = atomic_read(&amp;server-&gt;active);</div><div class='add'>+	if (test_bit(AFS_SERVER_FL_EXPIRED, &amp;server-&gt;flags))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-		_debug("manage %pU %u", &amp;server-&gt;uuid, active);</div><div class='add'>+	if (!afs_remove_server_from_cell(server))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-		if (purging) {</div><div class='del'>-			trace_afs_server(server, atomic_read(&amp;server-&gt;ref),</div><div class='del'>-					 active, afs_server_trace_purging);</div><div class='del'>-			if (active != 0)</div><div class='del'>-				pr_notice("Can't purge s=%08x\n", server-&gt;debug_id);</div><div class='del'>-		}</div><div class='add'>+	timer_shutdown_sync(&amp;server-&gt;timer);</div><div class='add'>+	cancel_work(&amp;server-&gt;destroyer);</div><div class='ctx'> </div><div class='del'>-		if (active == 0) {</div><div class='del'>-			time64_t expire_at = server-&gt;unuse_time;</div><div class='del'>-</div><div class='del'>-			if (!test_bit(AFS_SERVER_FL_VL_FAIL, &amp;server-&gt;flags) &amp;&amp;</div><div class='del'>-			    !test_bit(AFS_SERVER_FL_NOT_FOUND, &amp;server-&gt;flags))</div><div class='del'>-				expire_at += afs_server_gc_delay;</div><div class='del'>-			if (purging || expire_at &lt;= now) {</div><div class='del'>-				server-&gt;gc_next = gc_list;</div><div class='del'>-				gc_list = server;</div><div class='del'>-			} else if (expire_at &lt; next_manage) {</div><div class='del'>-				next_manage = expire_at;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	if (test_bit(AFS_SERVER_FL_MAY_HAVE_CB, &amp;server-&gt;flags))</div><div class='add'>+		afs_give_up_callbacks(net, server);</div><div class='ctx'> </div><div class='del'>-	read_sequnlock_excl(&amp;net-&gt;fs_lock);</div><div class='add'>+	/* Unbind the rxrpc_peer records from the server. */</div><div class='add'>+	estate = rcu_access_pointer(server-&gt;endpoint_state);</div><div class='add'>+	if (estate)</div><div class='add'>+		afs_set_peer_appdata(server, estate-&gt;addresses, NULL);</div><div class='ctx'> </div><div class='del'>-	/* Update the timer on the way out.  We have to pass an increment on</div><div class='del'>-	 * servers_outstanding in the namespace that we are in to the timer or</div><div class='del'>-	 * the work scheduler.</div><div class='del'>-	 */</div><div class='del'>-	if (!purging &amp;&amp; next_manage &lt; TIME64_MAX) {</div><div class='del'>-		now = ktime_get_real_seconds();</div><div class='add'>+	write_seqlock(&amp;net-&gt;fs_lock);</div><div class='add'>+	list_del_init(&amp;server-&gt;probe_link);</div><div class='add'>+	if (!hlist_unhashed(&amp;server-&gt;proc_link))</div><div class='add'>+		hlist_del_rcu(&amp;server-&gt;proc_link);</div><div class='add'>+	write_sequnlock(&amp;net-&gt;fs_lock);</div><div class='ctx'> </div><div class='del'>-		if (next_manage - now &lt;= 0) {</div><div class='del'>-			if (queue_work(afs_wq, &amp;net-&gt;fs_manager))</div><div class='del'>-				afs_inc_servers_outstanding(net);</div><div class='del'>-		} else {</div><div class='del'>-			afs_set_server_timer(net, next_manage - now);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	afs_put_server(net, server, afs_server_trace_destroy);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	afs_gc_servers(net, gc_list);</div><div class='add'>+static void afs_server_timer(struct timer_list *timer)</div><div class='add'>+{</div><div class='add'>+	struct afs_server *server = container_of(timer, struct afs_server, timer);</div><div class='ctx'> </div><div class='del'>-	afs_dec_servers_outstanding(net);</div><div class='del'>-	_leave(" [%d]", atomic_read(&amp;net-&gt;servers_outstanding));</div><div class='add'>+	afs_see_server(server, afs_server_trace_see_timer);</div><div class='add'>+	if (!test_bit(AFS_SERVER_FL_EXPIRED, &amp;server-&gt;flags))</div><div class='add'>+		schedule_work(&amp;server-&gt;destroyer);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void afs_queue_server_manager(struct afs_net *net)</div><div class='add'>+/*</div><div class='add'>+ * Wake up all the servers in a cell so that they can purge themselves.</div><div class='add'>+ */</div><div class='add'>+void afs_purge_servers(struct afs_cell *cell)</div><div class='ctx'> {</div><div class='del'>-	afs_inc_servers_outstanding(net);</div><div class='del'>-	if (!queue_work(afs_wq, &amp;net-&gt;fs_manager))</div><div class='del'>-		afs_dec_servers_outstanding(net);</div><div class='add'>+	struct afs_server *server;</div><div class='add'>+	struct rb_node *rb;</div><div class='add'>+</div><div class='add'>+	down_read(&amp;cell-&gt;fs_lock);</div><div class='add'>+	for (rb = rb_first(&amp;cell-&gt;fs_servers); rb; rb = rb_next(rb)) {</div><div class='add'>+		server = rb_entry(rb, struct afs_server, uuid_rb);</div><div class='add'>+		afs_see_server(server, afs_server_trace_see_purge);</div><div class='add'>+		schedule_work(&amp;server-&gt;destroyer);</div><div class='add'>+	}</div><div class='add'>+	up_read(&amp;cell-&gt;fs_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Purge list of servers.</div><div class='add'>+ * Wait for outstanding servers.</div><div class='ctx'>  */</div><div class='del'>-void afs_purge_servers(struct afs_net *net)</div><div class='add'>+void afs_wait_for_servers(struct afs_net *net)</div><div class='ctx'> {</div><div class='ctx'> 	_enter("");</div><div class='ctx'> </div><div class='del'>-	if (del_timer_sync(&amp;net-&gt;fs_timer))</div><div class='del'>-		afs_dec_servers_outstanding(net);</div><div class='del'>-</div><div class='del'>-	afs_queue_server_manager(net);</div><div class='del'>-</div><div class='del'>-	_debug("wait");</div><div class='ctx'> 	atomic_dec(&amp;net-&gt;servers_outstanding);</div><div class='ctx'> 	wait_var_event(&amp;net-&gt;servers_outstanding,</div><div class='ctx'> 		       !atomic_read(&amp;net-&gt;servers_outstanding));</div><div class='hunk'>@@ -627,40 +540,42 @@ void afs_purge_servers(struct afs_net *net)</div><div class='ctx'>  * Get an update for a server's address list.</div><div class='ctx'>  */</div><div class='ctx'> static noinline bool afs_update_server_record(struct afs_operation *op,</div><div class='del'>-					      struct afs_server *server)</div><div class='add'>+					      struct afs_server *server,</div><div class='add'>+					      struct key *key)</div><div class='ctx'> {</div><div class='del'>-	struct afs_addr_list *alist, *discard;</div><div class='add'>+	struct afs_endpoint_state *estate;</div><div class='add'>+	struct afs_addr_list *alist;</div><div class='add'>+	bool has_addrs;</div><div class='ctx'> </div><div class='ctx'> 	_enter("");</div><div class='ctx'> </div><div class='del'>-	trace_afs_server(server, atomic_read(&amp;server-&gt;ref), atomic_read(&amp;server-&gt;active),</div><div class='add'>+	trace_afs_server(server-&gt;debug_id, refcount_read(&amp;server-&gt;ref),</div><div class='add'>+			 atomic_read(&amp;server-&gt;active),</div><div class='ctx'> 			 afs_server_trace_update);</div><div class='ctx'> </div><div class='del'>-	alist = afs_vl_lookup_addrs(op-&gt;volume-&gt;cell, op-&gt;key, &amp;server-&gt;uuid);</div><div class='add'>+	alist = afs_vl_lookup_addrs(server, op-&gt;key);</div><div class='ctx'> 	if (IS_ERR(alist)) {</div><div class='add'>+		rcu_read_lock();</div><div class='add'>+		estate = rcu_dereference(server-&gt;endpoint_state);</div><div class='add'>+		has_addrs = estate-&gt;addresses;</div><div class='add'>+		rcu_read_unlock();</div><div class='add'>+</div><div class='ctx'> 		if ((PTR_ERR(alist) == -ERESTARTSYS ||</div><div class='ctx'> 		     PTR_ERR(alist) == -EINTR) &amp;&amp;</div><div class='ctx'> 		    (op-&gt;flags &amp; AFS_OPERATION_UNINTR) &amp;&amp;</div><div class='del'>-		    server-&gt;addresses) {</div><div class='add'>+		    has_addrs) {</div><div class='ctx'> 			_leave(" = t [intr]");</div><div class='ctx'> 			return true;</div><div class='ctx'> 		}</div><div class='del'>-		op-&gt;error = PTR_ERR(alist);</div><div class='del'>-		_leave(" = f [%d]", op-&gt;error);</div><div class='add'>+		afs_op_set_error(op, PTR_ERR(alist));</div><div class='add'>+		_leave(" = f [%d]", afs_op_error(op));</div><div class='ctx'> 		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	discard = alist;</div><div class='del'>-	if (server-&gt;addr_version != alist-&gt;version) {</div><div class='del'>-		write_lock(&amp;server-&gt;fs_lock);</div><div class='del'>-		discard = rcu_dereference_protected(server-&gt;addresses,</div><div class='del'>-						    lockdep_is_held(&amp;server-&gt;fs_lock));</div><div class='del'>-		rcu_assign_pointer(server-&gt;addresses, alist);</div><div class='del'>-		server-&gt;addr_version = alist-&gt;version;</div><div class='del'>-		write_unlock(&amp;server-&gt;fs_lock);</div><div class='del'>-	}</div><div class='add'>+	if (server-&gt;addr_version != alist-&gt;version)</div><div class='add'>+		afs_fs_probe_fileserver(op-&gt;net, server, alist, key);</div><div class='ctx'> </div><div class='del'>-	afs_put_addrlist(discard);</div><div class='add'>+	afs_put_addrlist(alist, afs_alist_trace_put_server_update);</div><div class='ctx'> 	_leave(" = t");</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='hunk'>@@ -668,7 +583,8 @@ static noinline bool afs_update_server_record(struct afs_operation *op,</div><div class='ctx'> /*</div><div class='ctx'>  * See if a server's address list needs updating.</div><div class='ctx'>  */</div><div class='del'>-bool afs_check_server_record(struct afs_operation *op, struct afs_server *server)</div><div class='add'>+bool afs_check_server_record(struct afs_operation *op, struct afs_server *server,</div><div class='add'>+			     struct key *key)</div><div class='ctx'> {</div><div class='ctx'> 	bool success;</div><div class='ctx'> 	int ret, retries = 0;</div><div class='hunk'>@@ -688,7 +604,7 @@ retry:</div><div class='ctx'> update:</div><div class='ctx'> 	if (!test_and_set_bit_lock(AFS_SERVER_FL_UPDATING, &amp;server-&gt;flags)) {</div><div class='ctx'> 		clear_bit(AFS_SERVER_FL_NEEDS_UPDATE, &amp;server-&gt;flags);</div><div class='del'>-		success = afs_update_server_record(op, server);</div><div class='add'>+		success = afs_update_server_record(op, server, key);</div><div class='ctx'> 		clear_bit_unlock(AFS_SERVER_FL_UPDATING, &amp;server-&gt;flags);</div><div class='ctx'> 		wake_up_bit(&amp;server-&gt;flags, AFS_SERVER_FL_UPDATING);</div><div class='ctx'> 		_leave(" = %d", success);</div><div class='hunk'>@@ -700,7 +616,7 @@ wait:</div><div class='ctx'> 			  (op-&gt;flags &amp; AFS_OPERATION_UNINTR) ?</div><div class='ctx'> 			  TASK_UNINTERRUPTIBLE : TASK_INTERRUPTIBLE);</div><div class='ctx'> 	if (ret == -ERESTARTSYS) {</div><div class='del'>-		op-&gt;error = ret;</div><div class='add'>+		afs_op_set_error(op, ret);</div><div class='ctx'> 		_leave(" = f [intr]");</div><div class='ctx'> 		return false;</div><div class='ctx'> 	}</div><div class='head'>diff --git a/fs/afs/server_list.c b/fs/afs/server_list.c<br/>index ed9056703505..20d5474837df 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/server_list.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/server_list.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/server_list.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/server_list.c</a></div><div class='hunk'>@@ -16,43 +16,70 @@ void afs_put_serverlist(struct afs_net *net, struct afs_server_list *slist)</div><div class='ctx'> 	if (slist &amp;&amp; refcount_dec_and_test(&amp;slist-&gt;usage)) {</div><div class='ctx'> 		for (i = 0; i &lt; slist-&gt;nr_servers; i++)</div><div class='ctx'> 			afs_unuse_server(net, slist-&gt;servers[i].server,</div><div class='del'>-					 afs_server_trace_put_slist);</div><div class='del'>-		kfree(slist);</div><div class='add'>+					 afs_server_trace_unuse_slist);</div><div class='add'>+		kfree_rcu(slist, rcu);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Build a server list from a VLDB record.</div><div class='ctx'>  */</div><div class='del'>-struct afs_server_list *afs_alloc_server_list(struct afs_cell *cell,</div><div class='add'>+struct afs_server_list *afs_alloc_server_list(struct afs_volume *volume,</div><div class='ctx'> 					      struct key *key,</div><div class='del'>-					      struct afs_vldb_entry *vldb,</div><div class='del'>-					      u8 type_mask)</div><div class='add'>+					      struct afs_vldb_entry *vldb)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_server_list *slist;</div><div class='ctx'> 	struct afs_server *server;</div><div class='del'>-	int ret = -ENOMEM, nr_servers = 0, i, j;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; vldb-&gt;nr_servers; i++)</div><div class='del'>-		if (vldb-&gt;fs_mask[i] &amp; type_mask)</div><div class='del'>-			nr_servers++;</div><div class='add'>+	unsigned int type_mask = 1 &lt;&lt; volume-&gt;type;</div><div class='add'>+	bool use_newrepsites = false;</div><div class='add'>+	int ret = -ENOMEM, nr_servers = 0, newrep = 0, i, j, usable = 0;</div><div class='add'>+</div><div class='add'>+	/* Work out if we're going to restrict to NEWREPSITE-marked servers or</div><div class='add'>+	 * not.  If at least one site is marked as NEWREPSITE, then it's likely</div><div class='add'>+	 * that "vos release" is busy updating RO sites.  We cut over from one</div><div class='add'>+	 * to the other when &gt;=50% of the sites have been updated.  Sites that</div><div class='add'>+	 * are in the process of being updated are marked DONTUSE.</div><div class='add'>+	 */</div><div class='add'>+	for (i = 0; i &lt; vldb-&gt;nr_servers; i++) {</div><div class='add'>+		if (!(vldb-&gt;fs_mask[i] &amp; type_mask))</div><div class='add'>+			continue;</div><div class='add'>+		nr_servers++;</div><div class='add'>+		if (vldb-&gt;vlsf_flags[i] &amp; AFS_VLSF_DONTUSE)</div><div class='add'>+			continue;</div><div class='add'>+		usable++;</div><div class='add'>+		if (vldb-&gt;vlsf_flags[i] &amp; AFS_VLSF_NEWREPSITE)</div><div class='add'>+			newrep++;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	slist = kzalloc(struct_size(slist, servers, nr_servers), GFP_KERNEL);</div><div class='ctx'> 	if (!slist)</div><div class='ctx'> 		goto error;</div><div class='ctx'> </div><div class='add'>+	if (newrep) {</div><div class='add'>+		if (newrep &lt; usable / 2) {</div><div class='add'>+			slist-&gt;ro_replicating = AFS_RO_REPLICATING_USE_OLD;</div><div class='add'>+		} else {</div><div class='add'>+			slist-&gt;ro_replicating = AFS_RO_REPLICATING_USE_NEW;</div><div class='add'>+			use_newrepsites = true;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	refcount_set(&amp;slist-&gt;usage, 1);</div><div class='ctx'> 	rwlock_init(&amp;slist-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; AFS_MAXTYPES; i++)</div><div class='del'>-		slist-&gt;vids[i] = vldb-&gt;vid[i];</div><div class='del'>-</div><div class='ctx'> 	/* Make sure a records exists for each server in the list. */</div><div class='ctx'> 	for (i = 0; i &lt; vldb-&gt;nr_servers; i++) {</div><div class='add'>+		unsigned long se_flags = 0;</div><div class='add'>+		bool newrepsite = vldb-&gt;vlsf_flags[i] &amp; AFS_VLSF_NEWREPSITE;</div><div class='add'>+</div><div class='ctx'> 		if (!(vldb-&gt;fs_mask[i] &amp; type_mask))</div><div class='ctx'> 			continue;</div><div class='add'>+		if (vldb-&gt;vlsf_flags[i] &amp; AFS_VLSF_DONTUSE)</div><div class='add'>+			__set_bit(AFS_SE_EXCLUDED, &amp;se_flags);</div><div class='add'>+		if (newrep &amp;&amp; (newrepsite ^ use_newrepsites))</div><div class='add'>+			__set_bit(AFS_SE_EXCLUDED, &amp;se_flags);</div><div class='ctx'> </div><div class='del'>-		server = afs_lookup_server(cell, key, &amp;vldb-&gt;fs_server[i],</div><div class='add'>+		server = afs_lookup_server(volume-&gt;cell, key, &amp;vldb-&gt;fs_server[i],</div><div class='ctx'> 					   vldb-&gt;addr_version[i]);</div><div class='ctx'> 		if (IS_ERR(server)) {</div><div class='ctx'> 			ret = PTR_ERR(server);</div><div class='hunk'>@@ -70,8 +97,8 @@ struct afs_server_list *afs_alloc_server_list(struct afs_cell *cell,</div><div class='ctx'> 				break;</div><div class='ctx'> 		if (j &lt; slist-&gt;nr_servers) {</div><div class='ctx'> 			if (slist-&gt;servers[j].server == server) {</div><div class='del'>-				afs_put_server(cell-&gt;net, server,</div><div class='del'>-					       afs_server_trace_put_slist_isort);</div><div class='add'>+				afs_unuse_server_notime(volume-&gt;cell-&gt;net, server,</div><div class='add'>+							afs_server_trace_unuse_slist_isort);</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='hunk'>@@ -81,6 +108,9 @@ struct afs_server_list *afs_alloc_server_list(struct afs_cell *cell,</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		slist-&gt;servers[j].server = server;</div><div class='add'>+		slist-&gt;servers[j].volume = volume;</div><div class='add'>+		slist-&gt;servers[j].flags = se_flags;</div><div class='add'>+		slist-&gt;servers[j].cb_expires_at = AFS_NO_CB_PROMISE;</div><div class='ctx'> 		slist-&gt;nr_servers++;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -92,7 +122,7 @@ struct afs_server_list *afs_alloc_server_list(struct afs_cell *cell,</div><div class='ctx'> 	return slist;</div><div class='ctx'> </div><div class='ctx'> error_2:</div><div class='del'>-	afs_put_serverlist(cell-&gt;net, slist);</div><div class='add'>+	afs_put_serverlist(volume-&gt;cell-&gt;net, slist);</div><div class='ctx'> error:</div><div class='ctx'> 	return ERR_PTR(ret);</div><div class='ctx'> }</div><div class='hunk'>@@ -103,27 +133,117 @@ error:</div><div class='ctx'> bool afs_annotate_server_list(struct afs_server_list *new,</div><div class='ctx'> 			      struct afs_server_list *old)</div><div class='ctx'> {</div><div class='del'>-	struct afs_server *cur;</div><div class='del'>-	int i, j;</div><div class='add'>+	unsigned long mask = 1UL &lt;&lt; AFS_SE_EXCLUDED;</div><div class='add'>+	int i;</div><div class='ctx'> </div><div class='del'>-	if (old-&gt;nr_servers != new-&gt;nr_servers)</div><div class='add'>+	if (old-&gt;nr_servers != new-&gt;nr_servers ||</div><div class='add'>+	    old-&gt;ro_replicating != new-&gt;ro_replicating)</div><div class='ctx'> 		goto changed;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; old-&gt;nr_servers; i++)</div><div class='add'>+	for (i = 0; i &lt; old-&gt;nr_servers; i++) {</div><div class='ctx'> 		if (old-&gt;servers[i].server != new-&gt;servers[i].server)</div><div class='ctx'> 			goto changed;</div><div class='del'>-</div><div class='add'>+		if ((old-&gt;servers[i].flags &amp; mask) != (new-&gt;servers[i].flags &amp; mask))</div><div class='add'>+			goto changed;</div><div class='add'>+	}</div><div class='ctx'> 	return false;</div><div class='del'>-</div><div class='ctx'> changed:</div><div class='del'>-	/* Maintain the same preferred server as before if possible. */</div><div class='del'>-	cur = old-&gt;servers[old-&gt;preferred].server;</div><div class='del'>-	for (j = 0; j &lt; new-&gt;nr_servers; j++) {</div><div class='del'>-		if (new-&gt;servers[j].server == cur) {</div><div class='del'>-			new-&gt;preferred = j;</div><div class='del'>-			break;</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Attach a volume to the servers it is going to use.</div><div class='add'>+ */</div><div class='add'>+void afs_attach_volume_to_servers(struct afs_volume *volume, struct afs_server_list *slist)</div><div class='add'>+{</div><div class='add'>+	struct afs_server_entry *se, *pe;</div><div class='add'>+	struct afs_server *server;</div><div class='add'>+	struct list_head *p;</div><div class='add'>+	unsigned int i;</div><div class='add'>+</div><div class='add'>+	down_write(&amp;volume-&gt;cell-&gt;vs_lock);</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; slist-&gt;nr_servers; i++) {</div><div class='add'>+		se = &amp;slist-&gt;servers[i];</div><div class='add'>+		server = se-&gt;server;</div><div class='add'>+</div><div class='add'>+		list_for_each(p, &amp;server-&gt;volumes) {</div><div class='add'>+			pe = list_entry(p, struct afs_server_entry, slink);</div><div class='add'>+			if (volume-&gt;vid &lt;= pe-&gt;volume-&gt;vid)</div><div class='add'>+				break;</div><div class='ctx'> 		}</div><div class='add'>+		list_add_tail(&amp;se-&gt;slink, p);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return true;</div><div class='add'>+	slist-&gt;attached = true;</div><div class='add'>+	up_write(&amp;volume-&gt;cell-&gt;vs_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Reattach a volume to the servers it is going to use when server list is</div><div class='add'>+ * replaced.  We try to switch the attachment points to avoid rewalking the</div><div class='add'>+ * lists.</div><div class='add'>+ */</div><div class='add'>+void afs_reattach_volume_to_servers(struct afs_volume *volume, struct afs_server_list *new,</div><div class='add'>+				    struct afs_server_list *old)</div><div class='add'>+{</div><div class='add'>+	unsigned int n = 0, o = 0;</div><div class='add'>+</div><div class='add'>+	down_write(&amp;volume-&gt;cell-&gt;vs_lock);</div><div class='add'>+</div><div class='add'>+	while (n &lt; new-&gt;nr_servers || o &lt; old-&gt;nr_servers) {</div><div class='add'>+		struct afs_server_entry *pn = n &lt; new-&gt;nr_servers ? &amp;new-&gt;servers[n] : NULL;</div><div class='add'>+		struct afs_server_entry *po = o &lt; old-&gt;nr_servers ? &amp;old-&gt;servers[o] : NULL;</div><div class='add'>+		struct afs_server_entry *s;</div><div class='add'>+		struct list_head *p;</div><div class='add'>+		int diff;</div><div class='add'>+</div><div class='add'>+		if (pn &amp;&amp; po &amp;&amp; pn-&gt;server == po-&gt;server) {</div><div class='add'>+			pn-&gt;cb_expires_at = po-&gt;cb_expires_at;</div><div class='add'>+			list_replace(&amp;po-&gt;slink, &amp;pn-&gt;slink);</div><div class='add'>+			n++;</div><div class='add'>+			o++;</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (pn &amp;&amp; po)</div><div class='add'>+			diff = memcmp(&amp;pn-&gt;server-&gt;uuid, &amp;po-&gt;server-&gt;uuid,</div><div class='add'>+				      sizeof(pn-&gt;server-&gt;uuid));</div><div class='add'>+		else</div><div class='add'>+			diff = pn ? -1 : 1;</div><div class='add'>+</div><div class='add'>+		if (diff &lt; 0) {</div><div class='add'>+			list_for_each(p, &amp;pn-&gt;server-&gt;volumes) {</div><div class='add'>+				s = list_entry(p, struct afs_server_entry, slink);</div><div class='add'>+				if (volume-&gt;vid &lt;= s-&gt;volume-&gt;vid)</div><div class='add'>+					break;</div><div class='add'>+			}</div><div class='add'>+			list_add_tail(&amp;pn-&gt;slink, p);</div><div class='add'>+			n++;</div><div class='add'>+		} else {</div><div class='add'>+			list_del(&amp;po-&gt;slink);</div><div class='add'>+			o++;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	up_write(&amp;volume-&gt;cell-&gt;vs_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Detach a volume from the servers it has been using.</div><div class='add'>+ */</div><div class='add'>+void afs_detach_volume_from_servers(struct afs_volume *volume, struct afs_server_list *slist)</div><div class='add'>+{</div><div class='add'>+	unsigned int i;</div><div class='add'>+</div><div class='add'>+	if (!slist-&gt;attached)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	down_write(&amp;volume-&gt;cell-&gt;vs_lock);</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; slist-&gt;nr_servers; i++)</div><div class='add'>+		list_del(&amp;slist-&gt;servers[i].slink);</div><div class='add'>+</div><div class='add'>+	slist-&gt;attached = false;</div><div class='add'>+	up_write(&amp;volume-&gt;cell-&gt;vs_lock);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/afs/super.c b/fs/afs/super.c<br/>index d110def8aa8e..d672b7ab57ae 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/super.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/super.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/super.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/super.c</a></div><div class='hunk'>@@ -55,6 +55,7 @@ int afs_net_id;</div><div class='ctx'> static const struct super_operations afs_super_ops = {</div><div class='ctx'> 	.statfs		= afs_statfs,</div><div class='ctx'> 	.alloc_inode	= afs_alloc_inode,</div><div class='add'>+	.write_inode	= netfs_unpin_writeback,</div><div class='ctx'> 	.drop_inode	= afs_drop_inode,</div><div class='ctx'> 	.destroy_inode	= afs_destroy_inode,</div><div class='ctx'> 	.free_inode	= afs_free_inode,</div><div class='hunk'>@@ -193,8 +194,6 @@ static int afs_show_options(struct seq_file *m, struct dentry *root)</div><div class='ctx'> </div><div class='ctx'> 	if (as-&gt;dyn_root)</div><div class='ctx'> 		seq_puts(m, ",dyn");</div><div class='del'>-	if (test_bit(AFS_VNODE_AUTOCELL, &amp;AFS_FS_I(d_inode(root))-&gt;flags))</div><div class='del'>-		seq_puts(m, ",autocell");</div><div class='ctx'> 	switch (as-&gt;flock_mode) {</div><div class='ctx'> 	case afs_flock_mode_unset:	break;</div><div class='ctx'> 	case afs_flock_mode_local:	p = "local";	break;</div><div class='hunk'>@@ -291,13 +290,14 @@ static int afs_parse_source(struct fs_context *fc, struct fs_parameter *param)</div><div class='ctx'> 	/* lookup the cell record */</div><div class='ctx'> 	if (cellname) {</div><div class='ctx'> 		cell = afs_lookup_cell(ctx-&gt;net, cellname, cellnamesz,</div><div class='del'>-				       NULL, false);</div><div class='add'>+				       NULL, AFS_LOOKUP_CELL_DIRECT_MOUNT,</div><div class='add'>+				       afs_cell_trace_use_lookup_mount);</div><div class='ctx'> 		if (IS_ERR(cell)) {</div><div class='ctx'> 			pr_err("kAFS: unable to lookup cell '%*.*s'\n",</div><div class='ctx'> 			       cellnamesz, cellnamesz, cellname ?: "");</div><div class='ctx'> 			return PTR_ERR(cell);</div><div class='ctx'> 		}</div><div class='del'>-		afs_unuse_cell(ctx-&gt;net, ctx-&gt;cell, afs_cell_trace_unuse_parse);</div><div class='add'>+		afs_unuse_cell(ctx-&gt;cell, afs_cell_trace_unuse_parse);</div><div class='ctx'> 		afs_see_cell(cell, afs_cell_trace_see_source);</div><div class='ctx'> 		ctx-&gt;cell = cell;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -380,8 +380,7 @@ static int afs_validate_fc(struct fs_context *fc)</div><div class='ctx'> 		ctx-&gt;key = key;</div><div class='ctx'> </div><div class='ctx'> 		if (ctx-&gt;volume) {</div><div class='del'>-			afs_put_volume(ctx-&gt;net, ctx-&gt;volume,</div><div class='del'>-				       afs_volume_trace_put_validate_fc);</div><div class='add'>+			afs_put_volume(ctx-&gt;volume, afs_volume_trace_put_validate_fc);</div><div class='ctx'> 			ctx-&gt;volume = NULL;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -395,7 +394,7 @@ static int afs_validate_fc(struct fs_context *fc)</div><div class='ctx'> 				ctx-&gt;key = NULL;</div><div class='ctx'> 				cell = afs_use_cell(ctx-&gt;cell-&gt;alias_of,</div><div class='ctx'> 						    afs_cell_trace_use_fc_alias);</div><div class='del'>-				afs_unuse_cell(ctx-&gt;net, ctx-&gt;cell, afs_cell_trace_unuse_fc);</div><div class='add'>+				afs_unuse_cell(ctx-&gt;cell, afs_cell_trace_unuse_fc);</div><div class='ctx'> 				ctx-&gt;cell = cell;</div><div class='ctx'> 				goto reget_key;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -406,6 +405,10 @@ static int afs_validate_fc(struct fs_context *fc)</div><div class='ctx'> 			return PTR_ERR(volume);</div><div class='ctx'> </div><div class='ctx'> 		ctx-&gt;volume = volume;</div><div class='add'>+		if (volume-&gt;type != AFSVL_RWVOL) {</div><div class='add'>+			ctx-&gt;flock_mode = afs_flock_mode_local;</div><div class='add'>+			fc-&gt;sb_flags |= SB_RDONLY;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -464,7 +467,7 @@ static int afs_fill_super(struct super_block *sb, struct afs_fs_context *ctx)</div><div class='ctx'> </div><div class='ctx'> 	/* allocate the root inode and dentry */</div><div class='ctx'> 	if (as-&gt;dyn_root) {</div><div class='del'>-		inode = afs_iget_pseudo_dir(sb, true);</div><div class='add'>+		inode = afs_dynroot_iget_root(sb);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		sprintf(sb-&gt;s_id, "%llu", as-&gt;volume-&gt;vid);</div><div class='ctx'> 		afs_activate_volume(as-&gt;volume);</div><div class='hunk'>@@ -474,21 +477,15 @@ static int afs_fill_super(struct super_block *sb, struct afs_fs_context *ctx)</div><div class='ctx'> 	if (IS_ERR(inode))</div><div class='ctx'> 		return PTR_ERR(inode);</div><div class='ctx'> </div><div class='del'>-	if (ctx-&gt;autocell || as-&gt;dyn_root)</div><div class='del'>-		set_bit(AFS_VNODE_AUTOCELL, &amp;AFS_FS_I(inode)-&gt;flags);</div><div class='del'>-</div><div class='ctx'> 	ret = -ENOMEM;</div><div class='ctx'> 	sb-&gt;s_root = d_make_root(inode);</div><div class='ctx'> 	if (!sb-&gt;s_root)</div><div class='ctx'> 		goto error;</div><div class='ctx'> </div><div class='ctx'> 	if (as-&gt;dyn_root) {</div><div class='del'>-		sb-&gt;s_d_op = &amp;afs_dynroot_dentry_operations;</div><div class='del'>-		ret = afs_dynroot_populate(sb);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			goto error;</div><div class='add'>+		set_default_d_op(sb, &amp;afs_dynroot_dentry_operations);</div><div class='ctx'> 	} else {</div><div class='del'>-		sb-&gt;s_d_op = &amp;afs_fs_dentry_operations;</div><div class='add'>+		set_default_d_op(sb, &amp;afs_fs_dentry_operations);</div><div class='ctx'> 		rcu_assign_pointer(as-&gt;volume-&gt;sb, sb);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -523,9 +520,8 @@ static struct afs_super_info *afs_alloc_sbi(struct fs_context *fc)</div><div class='ctx'> static void afs_destroy_sbi(struct afs_super_info *as)</div><div class='ctx'> {</div><div class='ctx'> 	if (as) {</div><div class='del'>-		struct afs_net *net = afs_net(as-&gt;net_ns);</div><div class='del'>-		afs_put_volume(net, as-&gt;volume, afs_volume_trace_put_destroy_sbi);</div><div class='del'>-		afs_unuse_cell(net, as-&gt;cell, afs_cell_trace_unuse_sbi);</div><div class='add'>+		afs_put_volume(as-&gt;volume, afs_volume_trace_put_destroy_sbi);</div><div class='add'>+		afs_unuse_cell(as-&gt;cell, afs_cell_trace_unuse_sbi);</div><div class='ctx'> 		put_net(as-&gt;net_ns);</div><div class='ctx'> 		kfree(as);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -535,9 +531,6 @@ static void afs_kill_super(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_super_info *as = AFS_FS_S(sb);</div><div class='ctx'> </div><div class='del'>-	if (as-&gt;dyn_root)</div><div class='del'>-		afs_dynroot_depopulate(sb);</div><div class='del'>-</div><div class='ctx'> 	/* Clear the callback interests (which will do ilookup5) before</div><div class='ctx'> 	 * deactivating the superblock.</div><div class='ctx'> 	 */</div><div class='hunk'>@@ -610,8 +603,8 @@ static void afs_free_fc(struct fs_context *fc)</div><div class='ctx'> 	struct afs_fs_context *ctx = fc-&gt;fs_private;</div><div class='ctx'> </div><div class='ctx'> 	afs_destroy_sbi(fc-&gt;s_fs_info);</div><div class='del'>-	afs_put_volume(ctx-&gt;net, ctx-&gt;volume, afs_volume_trace_put_free_fc);</div><div class='del'>-	afs_unuse_cell(ctx-&gt;net, ctx-&gt;cell, afs_cell_trace_unuse_fc);</div><div class='add'>+	afs_put_volume(ctx-&gt;volume, afs_volume_trace_put_free_fc);</div><div class='add'>+	afs_unuse_cell(ctx-&gt;cell, afs_cell_trace_unuse_fc);</div><div class='ctx'> 	key_put(ctx-&gt;key);</div><div class='ctx'> 	kfree(ctx);</div><div class='ctx'> }</div><div class='hunk'>@@ -658,8 +651,8 @@ static void afs_i_init_once(void *_vnode)</div><div class='ctx'> 	struct afs_vnode *vnode = _vnode;</div><div class='ctx'> </div><div class='ctx'> 	memset(vnode, 0, sizeof(*vnode));</div><div class='del'>-	inode_init_once(&amp;vnode-&gt;vfs_inode);</div><div class='del'>-	mutex_init(&amp;vnode-&gt;io_lock);</div><div class='add'>+	inode_init_once(&amp;vnode-&gt;netfs.inode);</div><div class='add'>+	INIT_LIST_HEAD(&amp;vnode-&gt;io_lock_waiters);</div><div class='ctx'> 	init_rwsem(&amp;vnode-&gt;validate_lock);</div><div class='ctx'> 	spin_lock_init(&amp;vnode-&gt;wb_lock);</div><div class='ctx'> 	spin_lock_init(&amp;vnode-&gt;lock);</div><div class='hunk'>@@ -667,6 +660,7 @@ static void afs_i_init_once(void *_vnode)</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;vnode-&gt;pending_locks);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;vnode-&gt;granted_locks);</div><div class='ctx'> 	INIT_DELAYED_WORK(&amp;vnode-&gt;lock_work, afs_lock_work);</div><div class='add'>+	INIT_LIST_HEAD(&amp;vnode-&gt;cb_mmap_link);</div><div class='ctx'> 	seqlock_init(&amp;vnode-&gt;cb_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -677,7 +671,7 @@ static struct inode *afs_alloc_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_vnode *vnode;</div><div class='ctx'> </div><div class='del'>-	vnode = kmem_cache_alloc(afs_inode_cachep, GFP_KERNEL);</div><div class='add'>+	vnode = alloc_inode_sb(sb, afs_inode_cachep, GFP_KERNEL);</div><div class='ctx'> 	if (!vnode)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='hunk'>@@ -686,13 +680,13 @@ static struct inode *afs_alloc_inode(struct super_block *sb)</div><div class='ctx'> 	/* Reset anything that shouldn't leak from one inode to the next. */</div><div class='ctx'> 	memset(&amp;vnode-&gt;fid, 0, sizeof(vnode-&gt;fid));</div><div class='ctx'> 	memset(&amp;vnode-&gt;status, 0, sizeof(vnode-&gt;status));</div><div class='add'>+	afs_vnode_set_cache(vnode, NULL);</div><div class='ctx'> </div><div class='ctx'> 	vnode-&gt;volume		= NULL;</div><div class='ctx'> 	vnode-&gt;lock_key		= NULL;</div><div class='ctx'> 	vnode-&gt;permit_cache	= NULL;</div><div class='del'>-#ifdef CONFIG_AFS_FSCACHE</div><div class='del'>-	vnode-&gt;cache		= NULL;</div><div class='del'>-#endif</div><div class='add'>+	vnode-&gt;directory	= NULL;</div><div class='add'>+	vnode-&gt;directory_size	= 0;</div><div class='ctx'> </div><div class='ctx'> 	vnode-&gt;flags		= 1 &lt;&lt; AFS_VNODE_UNSET;</div><div class='ctx'> 	vnode-&gt;lock_state	= AFS_VNODE_LOCK_NONE;</div><div class='hunk'>@@ -700,8 +694,8 @@ static struct inode *afs_alloc_inode(struct super_block *sb)</div><div class='ctx'> 	init_rwsem(&amp;vnode-&gt;rmdir_lock);</div><div class='ctx'> 	INIT_WORK(&amp;vnode-&gt;cb_work, afs_invalidate_mmap_work);</div><div class='ctx'> </div><div class='del'>-	_leave(" = %p", &amp;vnode-&gt;vfs_inode);</div><div class='del'>-	return &amp;vnode-&gt;vfs_inode;</div><div class='add'>+	_leave(" = %p", &amp;vnode-&gt;netfs.inode);</div><div class='add'>+	return &amp;vnode-&gt;netfs.inode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void afs_free_inode(struct inode *inode)</div><div class='head'>diff --git a/fs/afs/validation.c b/fs/afs/validation.c<br/>new file mode 100644<br/>index 000000000000..0ba8336c9025<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/validation.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/validation.c</a></div><div class='hunk'>@@ -0,0 +1,484 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='add'>+/* vnode and volume validity verification.</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2023 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/kernel.h&gt;</div><div class='add'>+#include &lt;linux/module.h&gt;</div><div class='add'>+#include &lt;linux/sched.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Data validation is managed through a number of mechanisms from the server:</div><div class='add'>+ *</div><div class='add'>+ *  (1) On first contact with a server (such as if it has just been rebooted),</div><div class='add'>+ *      the server sends us a CB.InitCallBackState* request.</div><div class='add'>+ *</div><div class='add'>+ *  (2) On a RW volume, in response to certain vnode (inode)-accessing RPC</div><div class='add'>+ *      calls, the server maintains a time-limited per-vnode promise that it</div><div class='add'>+ *      will send us a CB.CallBack request if a third party alters the vnodes</div><div class='add'>+ *      accessed.</div><div class='add'>+ *</div><div class='add'>+ *      Note that a vnode-level callbacks may also be sent for other reasons,</div><div class='add'>+ *      such as filelock release.</div><div class='add'>+ *</div><div class='add'>+ *  (3) On a RO (or Backup) volume, in response to certain vnode-accessing RPC</div><div class='add'>+ *      calls, each server maintains a time-limited per-volume promise that it</div><div class='add'>+ *      will send us a CB.CallBack request if the RO volume is updated to a</div><div class='add'>+ *      snapshot of the RW volume ("vos release").  This is an atomic event</div><div class='add'>+ *      that cuts over all instances of the RO volume across multiple servers</div><div class='add'>+ *      simultaneously.</div><div class='add'>+ *</div><div class='add'>+ *	Note that a volume-level callbacks may also be sent for other reasons,</div><div class='add'>+ *	such as the volumeserver taking over control of the volume from the</div><div class='add'>+ *	fileserver.</div><div class='add'>+ *</div><div class='add'>+ *	Note also that each server maintains an independent time limit on an</div><div class='add'>+ *	independent callback.</div><div class='add'>+ *</div><div class='add'>+ *  (4) Certain RPC calls include a volume information record "VolSync" in</div><div class='add'>+ *      their reply.  This contains a creation date for the volume that should</div><div class='add'>+ *      remain unchanged for a RW volume (but will be changed if the volume is</div><div class='add'>+ *      restored from backup) or will be bumped to the time of snapshotting</div><div class='add'>+ *      when a RO volume is released.</div><div class='add'>+ *</div><div class='add'>+ * In order to track this events, the following are provided:</div><div class='add'>+ *</div><div class='add'>+ *	-&gt;cb_v_break.  A counter of events that might mean that the contents of</div><div class='add'>+ *	a volume have been altered since we last checked a vnode.</div><div class='add'>+ *</div><div class='add'>+ *	-&gt;cb_v_check.  A counter of the number of events that we've sent a</div><div class='add'>+ *	query to the server for.  Everything's up to date if this equals</div><div class='add'>+ *	cb_v_break.</div><div class='add'>+ *</div><div class='add'>+ *	-&gt;cb_scrub.  A counter of the number of regression events for which we</div><div class='add'>+ *	have to completely wipe the cache.</div><div class='add'>+ *</div><div class='add'>+ *	-&gt;cb_ro_snapshot.  A counter of the number of times that we've</div><div class='add'>+ *      recognised that a RO volume has been updated.</div><div class='add'>+ *</div><div class='add'>+ *	-&gt;cb_break.  A counter of events that might mean that the contents of a</div><div class='add'>+ *      vnode have been altered.</div><div class='add'>+ *</div><div class='add'>+ *	-&gt;cb_expires_at.  The time at which the callback promise expires or</div><div class='add'>+ *      AFS_NO_CB_PROMISE if we have no promise.</div><div class='add'>+ *</div><div class='add'>+ * The way we manage things is:</div><div class='add'>+ *</div><div class='add'>+ *  (1) When a volume-level CB.CallBack occurs, we increment -&gt;cb_v_break on</div><div class='add'>+ *      the volume and reset -&gt;cb_expires_at (ie. set AFS_NO_CB_PROMISE) on the</div><div class='add'>+ *      volume and volume's server record.</div><div class='add'>+ *</div><div class='add'>+ *  (2) When a CB.InitCallBackState occurs, we treat this as a volume-level</div><div class='add'>+ *	callback break on all the volumes that have been using that volume</div><div class='add'>+ *	(ie. increment -&gt;cb_v_break and reset -&gt;cb_expires_at).</div><div class='add'>+ *</div><div class='add'>+ *  (3) When a vnode-level CB.CallBack occurs, we increment -&gt;cb_break on the</div><div class='add'>+ *	vnode and reset its -&gt;cb_expires_at.  If the vnode is mmapped, we also</div><div class='add'>+ *	dispatch a work item to unmap all PTEs to the vnode's pagecache to</div><div class='add'>+ *	force reentry to the filesystem for revalidation.</div><div class='add'>+ *</div><div class='add'>+ *  (4) When entering the filesystem, we call afs_validate() to check the</div><div class='add'>+ *	validity of a vnode.  This first checks to see if -&gt;cb_v_check and</div><div class='add'>+ *	-&gt;cb_v_break match, and if they don't, we lock volume-&gt;cb_check_lock</div><div class='add'>+ *	exclusively and perform an FS.FetchStatus on the vnode.</div><div class='add'>+ *</div><div class='add'>+ *	After checking the volume, we check the vnode.  If there's a mismatch</div><div class='add'>+ *	between the volume counters and the vnode's mirrors of those counters,</div><div class='add'>+ *	we lock vnode-&gt;validate_lock and issue an FS.FetchStatus on the vnode.</div><div class='add'>+ *</div><div class='add'>+ *  (5) When the reply from FS.FetchStatus arrives, the VolSync record is</div><div class='add'>+ *      parsed:</div><div class='add'>+ *</div><div class='add'>+ *	(A) If the Creation timestamp has changed on a RW volume or regressed</div><div class='add'>+ *	    on a RO volume, we try to increment -&gt;cb_scrub; if it advances on a</div><div class='add'>+ *	    RO volume, we assume "vos release" happened and try to increment</div><div class='add'>+ *	    -&gt;cb_ro_snapshot.</div><div class='add'>+ *</div><div class='add'>+ *      (B) If the Update timestamp has regressed, we try to increment</div><div class='add'>+ *	    -&gt;cb_scrub.</div><div class='add'>+ *</div><div class='add'>+ *      Note that in both of these cases, we only do the increment if we can</div><div class='add'>+ *      cmpxchg the value of the timestamp from the value we noted before the</div><div class='add'>+ *      op.  This tries to prevent parallel ops from fighting one another.</div><div class='add'>+ *</div><div class='add'>+ *	volume-&gt;cb_v_check is then set to -&gt;cb_v_break.</div><div class='add'>+ *</div><div class='add'>+ *  (6) The AFSCallBack record included in the FS.FetchStatus reply is also</div><div class='add'>+ *	parsed and used to set the promise in -&gt;cb_expires_at for the vnode,</div><div class='add'>+ *	the volume and the volume's server record.</div><div class='add'>+ *</div><div class='add'>+ *  (7) If -&gt;cb_scrub is seen to have advanced, we invalidate the pagecache for</div><div class='add'>+ *      the vnode.</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Check the validity of a vnode/inode and its parent volume.</div><div class='add'>+ */</div><div class='add'>+bool afs_check_validity(const struct afs_vnode *vnode)</div><div class='add'>+{</div><div class='add'>+	const struct afs_volume *volume = vnode-&gt;volume;</div><div class='add'>+	enum afs_vnode_invalid_trace trace = afs_vnode_valid_trace;</div><div class='add'>+	time64_t cb_expires_at = atomic64_read(&amp;vnode-&gt;cb_expires_at);</div><div class='add'>+	time64_t deadline = ktime_get_real_seconds() + 10;</div><div class='add'>+</div><div class='add'>+	if (test_bit(AFS_VNODE_DELETED, &amp;vnode-&gt;flags))</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	if (atomic_read(&amp;volume-&gt;cb_v_check) != atomic_read(&amp;volume-&gt;cb_v_break))</div><div class='add'>+		trace = afs_vnode_invalid_trace_cb_v_break;</div><div class='add'>+	else if (cb_expires_at == AFS_NO_CB_PROMISE)</div><div class='add'>+		trace = afs_vnode_invalid_trace_no_cb_promise;</div><div class='add'>+	else if (cb_expires_at &lt;= deadline)</div><div class='add'>+		trace = afs_vnode_invalid_trace_expired;</div><div class='add'>+	else if (volume-&gt;cb_expires_at &lt;= deadline)</div><div class='add'>+		trace = afs_vnode_invalid_trace_vol_expired;</div><div class='add'>+	else if (vnode-&gt;cb_ro_snapshot != atomic_read(&amp;volume-&gt;cb_ro_snapshot))</div><div class='add'>+		trace = afs_vnode_invalid_trace_cb_ro_snapshot;</div><div class='add'>+	else if (vnode-&gt;cb_scrub != atomic_read(&amp;volume-&gt;cb_scrub))</div><div class='add'>+		trace = afs_vnode_invalid_trace_cb_scrub;</div><div class='add'>+	else if (test_bit(AFS_VNODE_ZAP_DATA, &amp;vnode-&gt;flags))</div><div class='add'>+		trace = afs_vnode_invalid_trace_zap_data;</div><div class='add'>+	else</div><div class='add'>+		return true;</div><div class='add'>+	trace_afs_vnode_invalid(vnode, trace);</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * See if the server we've just talked to is currently excluded.</div><div class='add'>+ */</div><div class='add'>+static bool __afs_is_server_excluded(struct afs_operation *op, struct afs_volume *volume)</div><div class='add'>+{</div><div class='add'>+	const struct afs_server_entry *se;</div><div class='add'>+	const struct afs_server_list *slist;</div><div class='add'>+	bool is_excluded = true;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+</div><div class='add'>+	slist = rcu_dereference(volume-&gt;servers);</div><div class='add'>+	for (i = 0; i &lt; slist-&gt;nr_servers; i++) {</div><div class='add'>+		se = &amp;slist-&gt;servers[i];</div><div class='add'>+		if (op-&gt;server == se-&gt;server) {</div><div class='add'>+			is_excluded = test_bit(AFS_SE_EXCLUDED, &amp;se-&gt;flags);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+	return is_excluded;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Update the volume's server list when the creation time changes and see if</div><div class='add'>+ * the server we've just talked to is currently excluded.</div><div class='add'>+ */</div><div class='add'>+static int afs_is_server_excluded(struct afs_operation *op, struct afs_volume *volume)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (__afs_is_server_excluded(op, volume))</div><div class='add'>+		return 1;</div><div class='add'>+</div><div class='add'>+	set_bit(AFS_VOLUME_NEEDS_UPDATE, &amp;volume-&gt;flags);</div><div class='add'>+	ret = afs_check_volume_status(op-&gt;volume, op);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	return __afs_is_server_excluded(op, volume);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Handle a change to the volume creation time in the VolSync record.</div><div class='add'>+ */</div><div class='add'>+static int afs_update_volume_creation_time(struct afs_operation *op, struct afs_volume *volume)</div><div class='add'>+{</div><div class='add'>+	unsigned int snap;</div><div class='add'>+	time64_t cur = volume-&gt;creation_time;</div><div class='add'>+	time64_t old = op-&gt;pre_volsync.creation;</div><div class='add'>+	time64_t new = op-&gt;volsync.creation;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	_enter("%llx,%llx,%llx-&gt;%llx", volume-&gt;vid, cur, old, new);</div><div class='add'>+</div><div class='add'>+	if (cur == TIME64_MIN) {</div><div class='add'>+		volume-&gt;creation_time = new;</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (new == cur)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/* Try to advance the creation timestamp from what we had before the</div><div class='add'>+	 * operation to what we got back from the server.  This should</div><div class='add'>+	 * hopefully ensure that in a race between multiple operations only one</div><div class='add'>+	 * of them will do this.</div><div class='add'>+	 */</div><div class='add'>+	if (cur != old)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/* If the creation time changes in an unexpected way, we need to scrub</div><div class='add'>+	 * our caches.  For a RW vol, this will only change if the volume is</div><div class='add'>+	 * restored from a backup; for a RO/Backup vol, this will advance when</div><div class='add'>+	 * the volume is updated to a new snapshot (eg. "vos release").</div><div class='add'>+	 */</div><div class='add'>+	if (volume-&gt;type == AFSVL_RWVOL)</div><div class='add'>+		goto regressed;</div><div class='add'>+	if (volume-&gt;type == AFSVL_BACKVOL) {</div><div class='add'>+		if (new &lt; old)</div><div class='add'>+			goto regressed;</div><div class='add'>+		goto advance;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* We have an RO volume, we need to query the VL server and look at the</div><div class='add'>+	 * server flags to see if RW-&gt;RO replication is in progress.</div><div class='add'>+	 */</div><div class='add'>+	ret = afs_is_server_excluded(op, volume);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+	if (ret &gt; 0) {</div><div class='add'>+		snap = atomic_read(&amp;volume-&gt;cb_ro_snapshot);</div><div class='add'>+		trace_afs_cb_v_break(volume-&gt;vid, snap, afs_cb_break_volume_excluded);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+advance:</div><div class='add'>+	snap = atomic_inc_return(&amp;volume-&gt;cb_ro_snapshot);</div><div class='add'>+	trace_afs_cb_v_break(volume-&gt;vid, snap, afs_cb_break_for_vos_release);</div><div class='add'>+	volume-&gt;creation_time = new;</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+regressed:</div><div class='add'>+	atomic_inc(&amp;volume-&gt;cb_scrub);</div><div class='add'>+	trace_afs_cb_v_break(volume-&gt;vid, 0, afs_cb_break_for_creation_regress);</div><div class='add'>+	volume-&gt;creation_time = new;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Handle a change to the volume update time in the VolSync record.</div><div class='add'>+ */</div><div class='add'>+static void afs_update_volume_update_time(struct afs_operation *op, struct afs_volume *volume)</div><div class='add'>+{</div><div class='add'>+	enum afs_cb_break_reason reason = afs_cb_break_no_break;</div><div class='add'>+	time64_t cur = volume-&gt;update_time;</div><div class='add'>+	time64_t old = op-&gt;pre_volsync.update;</div><div class='add'>+	time64_t new = op-&gt;volsync.update;</div><div class='add'>+</div><div class='add'>+	_enter("%llx,%llx,%llx-&gt;%llx", volume-&gt;vid, cur, old, new);</div><div class='add'>+</div><div class='add'>+	if (cur == TIME64_MIN) {</div><div class='add'>+		volume-&gt;update_time = new;</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (new == cur)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/* If the volume update time changes in an unexpected way, we need to</div><div class='add'>+	 * scrub our caches.  For a RW vol, this will advance on every</div><div class='add'>+	 * modification op; for a RO/Backup vol, this will advance when the</div><div class='add'>+	 * volume is updated to a new snapshot (eg. "vos release").</div><div class='add'>+	 */</div><div class='add'>+	if (new &lt; old)</div><div class='add'>+		reason = afs_cb_break_for_update_regress;</div><div class='add'>+</div><div class='add'>+	/* Try to advance the update timestamp from what we had before the</div><div class='add'>+	 * operation to what we got back from the server.  This should</div><div class='add'>+	 * hopefully ensure that in a race between multiple operations only one</div><div class='add'>+	 * of them will do this.</div><div class='add'>+	 */</div><div class='add'>+	if (cur == old) {</div><div class='add'>+		if (reason == afs_cb_break_for_update_regress) {</div><div class='add'>+			atomic_inc(&amp;volume-&gt;cb_scrub);</div><div class='add'>+			trace_afs_cb_v_break(volume-&gt;vid, 0, reason);</div><div class='add'>+		}</div><div class='add'>+		volume-&gt;update_time = new;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int afs_update_volume_times(struct afs_operation *op, struct afs_volume *volume)</div><div class='add'>+{</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	if (likely(op-&gt;volsync.creation == volume-&gt;creation_time &amp;&amp;</div><div class='add'>+		   op-&gt;volsync.update == volume-&gt;update_time))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;volume-&gt;volsync_lock);</div><div class='add'>+	if (op-&gt;volsync.creation != volume-&gt;creation_time) {</div><div class='add'>+		ret = afs_update_volume_creation_time(op, volume);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='add'>+	if (op-&gt;volsync.update != volume-&gt;update_time)</div><div class='add'>+		afs_update_volume_update_time(op, volume);</div><div class='add'>+out:</div><div class='add'>+	mutex_unlock(&amp;volume-&gt;volsync_lock);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Update the state of a volume, including recording the expiration time of the</div><div class='add'>+ * callback promise.  Returns 1 to redo the operation from the start.</div><div class='add'>+ */</div><div class='add'>+int afs_update_volume_state(struct afs_operation *op)</div><div class='add'>+{</div><div class='add'>+	struct afs_server_list *slist = op-&gt;server_list;</div><div class='add'>+	struct afs_server_entry *se = &amp;slist-&gt;servers[op-&gt;server_index];</div><div class='add'>+	struct afs_callback *cb = &amp;op-&gt;file[0].scb.callback;</div><div class='add'>+	struct afs_volume *volume = op-&gt;volume;</div><div class='add'>+	unsigned int cb_v_break = atomic_read(&amp;volume-&gt;cb_v_break);</div><div class='add'>+	unsigned int cb_v_check = atomic_read(&amp;volume-&gt;cb_v_check);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	_enter("%llx", op-&gt;volume-&gt;vid);</div><div class='add'>+</div><div class='add'>+	if (op-&gt;volsync.creation != TIME64_MIN || op-&gt;volsync.update != TIME64_MIN) {</div><div class='add'>+		ret = afs_update_volume_times(op, volume);</div><div class='add'>+		if (ret != 0) {</div><div class='add'>+			_leave(" = %d", ret);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (op-&gt;cb_v_break == cb_v_break &amp;&amp;</div><div class='add'>+	    (op-&gt;file[0].scb.have_cb || op-&gt;file[1].scb.have_cb)) {</div><div class='add'>+		time64_t expires_at = cb-&gt;expires_at;</div><div class='add'>+</div><div class='add'>+		if (!op-&gt;file[0].scb.have_cb)</div><div class='add'>+			expires_at = op-&gt;file[1].scb.callback.expires_at;</div><div class='add'>+</div><div class='add'>+		se-&gt;cb_expires_at = expires_at;</div><div class='add'>+		volume-&gt;cb_expires_at = expires_at;</div><div class='add'>+	}</div><div class='add'>+	if (cb_v_check &lt; op-&gt;cb_v_break)</div><div class='add'>+		atomic_cmpxchg(&amp;volume-&gt;cb_v_check, cb_v_check, op-&gt;cb_v_break);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * mark the data attached to an inode as obsolete due to a write on the server</div><div class='add'>+ * - might also want to ditch all the outstanding writes and dirty pages</div><div class='add'>+ */</div><div class='add'>+static void afs_zap_data(struct afs_vnode *vnode)</div><div class='add'>+{</div><div class='add'>+	_enter("{%llx:%llu}", vnode-&gt;fid.vid, vnode-&gt;fid.vnode);</div><div class='add'>+</div><div class='add'>+	afs_invalidate_cache(vnode, 0);</div><div class='add'>+</div><div class='add'>+	/* nuke all the non-dirty pages that aren't locked, mapped or being</div><div class='add'>+	 * written back in a regular file and completely discard the pages in a</div><div class='add'>+	 * directory or symlink */</div><div class='add'>+	if (S_ISREG(vnode-&gt;netfs.inode.i_mode))</div><div class='add'>+		filemap_invalidate_inode(&amp;vnode-&gt;netfs.inode, true, 0, LLONG_MAX);</div><div class='add'>+	else</div><div class='add'>+		filemap_invalidate_inode(&amp;vnode-&gt;netfs.inode, false, 0, LLONG_MAX);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * validate a vnode/inode</div><div class='add'>+ * - there are several things we need to check</div><div class='add'>+ *   - parent dir data changes (rm, rmdir, rename, mkdir, create, link,</div><div class='add'>+ *     symlink)</div><div class='add'>+ *   - parent dir metadata changed (security changes)</div><div class='add'>+ *   - dentry data changed (write, truncate)</div><div class='add'>+ *   - dentry metadata changed (security changes)</div><div class='add'>+ */</div><div class='add'>+int afs_validate(struct afs_vnode *vnode, struct key *key)</div><div class='add'>+{</div><div class='add'>+	struct afs_volume *volume = vnode-&gt;volume;</div><div class='add'>+	unsigned int cb_ro_snapshot, cb_scrub;</div><div class='add'>+	time64_t deadline = ktime_get_real_seconds() + 10;</div><div class='add'>+	bool zap = false, locked_vol = false;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	_enter("{v={%llx:%llu} fl=%lx},%x",</div><div class='add'>+	       vnode-&gt;fid.vid, vnode-&gt;fid.vnode, vnode-&gt;flags,</div><div class='add'>+	       key_serial(key));</div><div class='add'>+</div><div class='add'>+	if (afs_check_validity(vnode))</div><div class='add'>+		return test_bit(AFS_VNODE_DELETED, &amp;vnode-&gt;flags) ? -ESTALE : 0;</div><div class='add'>+</div><div class='add'>+	ret = down_write_killable(&amp;vnode-&gt;validate_lock);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto error;</div><div class='add'>+</div><div class='add'>+	if (test_bit(AFS_VNODE_DELETED, &amp;vnode-&gt;flags)) {</div><div class='add'>+		ret = -ESTALE;</div><div class='add'>+		goto error_unlock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Validate a volume after the v_break has changed or the volume</div><div class='add'>+	 * callback expired.  We only want to do this once per volume per</div><div class='add'>+	 * v_break change.  The actual work will be done when parsing the</div><div class='add'>+	 * status fetch reply.</div><div class='add'>+	 */</div><div class='add'>+	if (volume-&gt;cb_expires_at &lt;= deadline ||</div><div class='add'>+	    atomic_read(&amp;volume-&gt;cb_v_check) != atomic_read(&amp;volume-&gt;cb_v_break)) {</div><div class='add'>+		ret = mutex_lock_interruptible(&amp;volume-&gt;cb_check_lock);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto error_unlock;</div><div class='add'>+		locked_vol = true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	cb_ro_snapshot = atomic_read(&amp;volume-&gt;cb_ro_snapshot);</div><div class='add'>+	cb_scrub = atomic_read(&amp;volume-&gt;cb_scrub);</div><div class='add'>+	if (vnode-&gt;cb_ro_snapshot != cb_ro_snapshot ||</div><div class='add'>+	    vnode-&gt;cb_scrub	  != cb_scrub)</div><div class='add'>+		unmap_mapping_pages(vnode-&gt;netfs.inode.i_mapping, 0, 0, false);</div><div class='add'>+</div><div class='add'>+	if (vnode-&gt;cb_ro_snapshot != cb_ro_snapshot ||</div><div class='add'>+	    vnode-&gt;cb_scrub	  != cb_scrub ||</div><div class='add'>+	    volume-&gt;cb_expires_at &lt;= deadline ||</div><div class='add'>+	    atomic_read(&amp;volume-&gt;cb_v_check) != atomic_read(&amp;volume-&gt;cb_v_break) ||</div><div class='add'>+	    atomic64_read(&amp;vnode-&gt;cb_expires_at) &lt;= deadline</div><div class='add'>+	    ) {</div><div class='add'>+		ret = afs_fetch_status(vnode, key, false, NULL);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			if (ret == -ENOENT) {</div><div class='add'>+				set_bit(AFS_VNODE_DELETED, &amp;vnode-&gt;flags);</div><div class='add'>+				ret = -ESTALE;</div><div class='add'>+			}</div><div class='add'>+			goto error_unlock;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		_debug("new promise [fl=%lx]", vnode-&gt;flags);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* We can drop the volume lock now as. */</div><div class='add'>+	if (locked_vol) {</div><div class='add'>+		mutex_unlock(&amp;volume-&gt;cb_check_lock);</div><div class='add'>+		locked_vol = false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	cb_ro_snapshot = atomic_read(&amp;volume-&gt;cb_ro_snapshot);</div><div class='add'>+	cb_scrub = atomic_read(&amp;volume-&gt;cb_scrub);</div><div class='add'>+	_debug("vnode inval %x==%x %x==%x",</div><div class='add'>+	       vnode-&gt;cb_ro_snapshot, cb_ro_snapshot,</div><div class='add'>+	       vnode-&gt;cb_scrub, cb_scrub);</div><div class='add'>+	if (vnode-&gt;cb_scrub != cb_scrub)</div><div class='add'>+		zap = true;</div><div class='add'>+	vnode-&gt;cb_ro_snapshot = cb_ro_snapshot;</div><div class='add'>+	vnode-&gt;cb_scrub = cb_scrub;</div><div class='add'>+</div><div class='add'>+	/* if the vnode's data version number changed then its contents are</div><div class='add'>+	 * different */</div><div class='add'>+	zap |= test_and_clear_bit(AFS_VNODE_ZAP_DATA, &amp;vnode-&gt;flags);</div><div class='add'>+	if (zap)</div><div class='add'>+		afs_zap_data(vnode);</div><div class='add'>+	up_write(&amp;vnode-&gt;validate_lock);</div><div class='add'>+	_leave(" = 0");</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+error_unlock:</div><div class='add'>+	if (locked_vol)</div><div class='add'>+		mutex_unlock(&amp;volume-&gt;cb_check_lock);</div><div class='add'>+	up_write(&amp;vnode-&gt;validate_lock);</div><div class='add'>+error:</div><div class='add'>+	_leave(" = %d", ret);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/afs/vl_alias.c b/fs/afs/vl_alias.c<br/>index f04a80e4f5c3..fc9676abd252 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/vl_alias.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/vl_alias.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/vl_alias.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/vl_alias.c</a></div><div class='hunk'>@@ -33,55 +33,6 @@ static struct afs_volume *afs_sample_volume(struct afs_cell *cell, struct key *k</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Compare two addresses.</div><div class='del'>- */</div><div class='del'>-static int afs_compare_addrs(const struct sockaddr_rxrpc *srx_a,</div><div class='del'>-			     const struct sockaddr_rxrpc *srx_b)</div><div class='del'>-{</div><div class='del'>-	short port_a, port_b;</div><div class='del'>-	int addr_a, addr_b, diff;</div><div class='del'>-</div><div class='del'>-	diff = (short)srx_a-&gt;transport_type - (short)srx_b-&gt;transport_type;</div><div class='del'>-	if (diff)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	switch (srx_a-&gt;transport_type) {</div><div class='del'>-	case AF_INET: {</div><div class='del'>-		const struct sockaddr_in *a = &amp;srx_a-&gt;transport.sin;</div><div class='del'>-		const struct sockaddr_in *b = &amp;srx_b-&gt;transport.sin;</div><div class='del'>-		addr_a = ntohl(a-&gt;sin_addr.s_addr);</div><div class='del'>-		addr_b = ntohl(b-&gt;sin_addr.s_addr);</div><div class='del'>-		diff = addr_a - addr_b;</div><div class='del'>-		if (diff == 0) {</div><div class='del'>-			port_a = ntohs(a-&gt;sin_port);</div><div class='del'>-			port_b = ntohs(b-&gt;sin_port);</div><div class='del'>-			diff = port_a - port_b;</div><div class='del'>-		}</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	case AF_INET6: {</div><div class='del'>-		const struct sockaddr_in6 *a = &amp;srx_a-&gt;transport.sin6;</div><div class='del'>-		const struct sockaddr_in6 *b = &amp;srx_b-&gt;transport.sin6;</div><div class='del'>-		diff = memcmp(&amp;a-&gt;sin6_addr, &amp;b-&gt;sin6_addr, 16);</div><div class='del'>-		if (diff == 0) {</div><div class='del'>-			port_a = ntohs(a-&gt;sin6_port);</div><div class='del'>-			port_b = ntohs(b-&gt;sin6_port);</div><div class='del'>-			diff = port_a - port_b;</div><div class='del'>-		}</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	default:</div><div class='del'>-		WARN_ON(1);</div><div class='del'>-		diff = 1;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	return diff;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * Compare the address lists of a pair of fileservers.</div><div class='ctx'>  */</div><div class='ctx'> static int afs_compare_fs_alists(const struct afs_server *server_a,</div><div class='hunk'>@@ -90,13 +41,13 @@ static int afs_compare_fs_alists(const struct afs_server *server_a,</div><div class='ctx'> 	const struct afs_addr_list *la, *lb;</div><div class='ctx'> 	int a = 0, b = 0, addr_matches = 0;</div><div class='ctx'> </div><div class='del'>-	la = rcu_dereference(server_a-&gt;addresses);</div><div class='del'>-	lb = rcu_dereference(server_b-&gt;addresses);</div><div class='add'>+	la = rcu_dereference(server_a-&gt;endpoint_state)-&gt;addresses;</div><div class='add'>+	lb = rcu_dereference(server_b-&gt;endpoint_state)-&gt;addresses;</div><div class='ctx'> </div><div class='ctx'> 	while (a &lt; la-&gt;nr_addrs &amp;&amp; b &lt; lb-&gt;nr_addrs) {</div><div class='del'>-		const struct sockaddr_rxrpc *srx_a = &amp;la-&gt;addrs[a];</div><div class='del'>-		const struct sockaddr_rxrpc *srx_b = &amp;lb-&gt;addrs[b];</div><div class='del'>-		int diff = afs_compare_addrs(srx_a, srx_b);</div><div class='add'>+		unsigned long pa = (unsigned long)la-&gt;addrs[a].peer;</div><div class='add'>+		unsigned long pb = (unsigned long)lb-&gt;addrs[b].peer;</div><div class='add'>+		long diff = pa - pb;</div><div class='ctx'> </div><div class='ctx'> 		if (diff &lt; 0) {</div><div class='ctx'> 			a++;</div><div class='hunk'>@@ -126,7 +77,7 @@ static int afs_compare_volume_slists(const struct afs_volume *vol_a,</div><div class='ctx'> 	lb = rcu_dereference(vol_b-&gt;servers);</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; AFS_MAXTYPES; i++)</div><div class='del'>-		if (la-&gt;vids[i] != lb-&gt;vids[i])</div><div class='add'>+		if (vol_a-&gt;vids[i] != vol_b-&gt;vids[i])</div><div class='ctx'> 			return 0;</div><div class='ctx'> </div><div class='ctx'> 	while (a &lt; la-&gt;nr_servers &amp;&amp; b &lt; lb-&gt;nr_servers) {</div><div class='hunk'>@@ -205,7 +156,7 @@ static int afs_query_for_alias_one(struct afs_cell *cell, struct key *key,</div><div class='ctx'> 	/* And see if it's in the new cell. */</div><div class='ctx'> 	volume = afs_sample_volume(cell, key, pvol-&gt;name, pvol-&gt;name_len);</div><div class='ctx'> 	if (IS_ERR(volume)) {</div><div class='del'>-		afs_put_volume(cell-&gt;net, pvol, afs_volume_trace_put_query_alias);</div><div class='add'>+		afs_put_volume(pvol, afs_volume_trace_put_query_alias);</div><div class='ctx'> 		if (PTR_ERR(volume) != -ENOMEDIUM)</div><div class='ctx'> 			return PTR_ERR(volume);</div><div class='ctx'> 		/* That volume is not in the new cell, so not an alias */</div><div class='hunk'>@@ -223,8 +174,8 @@ static int afs_query_for_alias_one(struct afs_cell *cell, struct key *key,</div><div class='ctx'> 		rcu_read_unlock();</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	afs_put_volume(cell-&gt;net, volume, afs_volume_trace_put_query_alias);</div><div class='del'>-	afs_put_volume(cell-&gt;net, pvol, afs_volume_trace_put_query_alias);</div><div class='add'>+	afs_put_volume(volume, afs_volume_trace_put_query_alias);</div><div class='add'>+	afs_put_volume(pvol, afs_volume_trace_put_query_alias);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -254,11 +205,11 @@ static int afs_query_for_alias(struct afs_cell *cell, struct key *key)</div><div class='ctx'> 			goto is_alias;</div><div class='ctx'> </div><div class='ctx'> 		if (mutex_lock_interruptible(&amp;cell-&gt;net-&gt;proc_cells_lock) &lt; 0) {</div><div class='del'>-			afs_unuse_cell(cell-&gt;net, p, afs_cell_trace_unuse_check_alias);</div><div class='add'>+			afs_unuse_cell(p, afs_cell_trace_unuse_check_alias);</div><div class='ctx'> 			return -ERESTARTSYS;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		afs_unuse_cell(cell-&gt;net, p, afs_cell_trace_unuse_check_alias);</div><div class='add'>+		afs_unuse_cell(p, afs_cell_trace_unuse_check_alias);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	mutex_unlock(&amp;cell-&gt;net-&gt;proc_cells_lock);</div><div class='hunk'>@@ -285,7 +236,7 @@ static char *afs_vl_get_cell_name(struct afs_cell *cell, struct key *key)</div><div class='ctx'> </div><div class='ctx'> 	while (afs_select_vlserver(&amp;vc)) {</div><div class='ctx'> 		if (!test_bit(AFS_VLSERVER_FL_IS_YFS, &amp;vc.server-&gt;flags)) {</div><div class='del'>-			vc.ac.error = -EOPNOTSUPP;</div><div class='add'>+			vc.call_error = -EOPNOTSUPP;</div><div class='ctx'> 			skipped = true;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -302,6 +253,7 @@ static char *afs_vl_get_cell_name(struct afs_cell *cell, struct key *key)</div><div class='ctx'> static int yfs_check_canonical_cell_name(struct afs_cell *cell, struct key *key)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_cell *master;</div><div class='add'>+	size_t name_len;</div><div class='ctx'> 	char *cell_name;</div><div class='ctx'> </div><div class='ctx'> 	cell_name = afs_vl_get_cell_name(cell, key);</div><div class='hunk'>@@ -313,8 +265,13 @@ static int yfs_check_canonical_cell_name(struct afs_cell *cell, struct key *key)</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	master = afs_lookup_cell(cell-&gt;net, cell_name, strlen(cell_name),</div><div class='del'>-				 NULL, false);</div><div class='add'>+	name_len = strlen(cell_name);</div><div class='add'>+	if (!name_len || name_len &gt; AFS_MAXCELLNAME)</div><div class='add'>+		master = ERR_PTR(-EOPNOTSUPP);</div><div class='add'>+	else</div><div class='add'>+		master = afs_lookup_cell(cell-&gt;net, cell_name, name_len, NULL,</div><div class='add'>+					 AFS_LOOKUP_CELL_ALIAS_CHECK,</div><div class='add'>+					 afs_cell_trace_use_lookup_canonical);</div><div class='ctx'> 	kfree(cell_name);</div><div class='ctx'> 	if (IS_ERR(master))</div><div class='ctx'> 		return PTR_ERR(master);</div><div class='head'>diff --git a/fs/afs/vl_list.c b/fs/afs/vl_list.c<br/>index 38b2ba1d9ec0..9b1c20daac53 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/vl_list.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/vl_list.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/vl_list.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/vl_list.c</a></div><div class='hunk'>@@ -13,16 +13,19 @@ struct afs_vlserver *afs_alloc_vlserver(const char *name, size_t name_len,</div><div class='ctx'> 					unsigned short port)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_vlserver *vlserver;</div><div class='add'>+	static atomic_t debug_ids;</div><div class='ctx'> </div><div class='ctx'> 	vlserver = kzalloc(struct_size(vlserver, name, name_len + 1),</div><div class='ctx'> 			   GFP_KERNEL);</div><div class='ctx'> 	if (vlserver) {</div><div class='del'>-		atomic_set(&amp;vlserver-&gt;usage, 1);</div><div class='add'>+		refcount_set(&amp;vlserver-&gt;ref, 1);</div><div class='ctx'> 		rwlock_init(&amp;vlserver-&gt;lock);</div><div class='ctx'> 		init_waitqueue_head(&amp;vlserver-&gt;probe_wq);</div><div class='ctx'> 		spin_lock_init(&amp;vlserver-&gt;probe_lock);</div><div class='add'>+		vlserver-&gt;debug_id = atomic_inc_return(&amp;debug_ids);</div><div class='ctx'> 		vlserver-&gt;rtt = UINT_MAX;</div><div class='ctx'> 		vlserver-&gt;name_len = name_len;</div><div class='add'>+		vlserver-&gt;service_id = VL_SERVICE;</div><div class='ctx'> 		vlserver-&gt;port = port;</div><div class='ctx'> 		memcpy(vlserver-&gt;name, name, name_len);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -33,19 +36,16 @@ static void afs_vlserver_rcu(struct rcu_head *rcu)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_vlserver *vlserver = container_of(rcu, struct afs_vlserver, rcu);</div><div class='ctx'> </div><div class='del'>-	afs_put_addrlist(rcu_access_pointer(vlserver-&gt;addresses));</div><div class='add'>+	afs_put_addrlist(rcu_access_pointer(vlserver-&gt;addresses),</div><div class='add'>+			 afs_alist_trace_put_vlserver);</div><div class='ctx'> 	kfree_rcu(vlserver, rcu);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void afs_put_vlserver(struct afs_net *net, struct afs_vlserver *vlserver)</div><div class='ctx'> {</div><div class='del'>-	if (vlserver) {</div><div class='del'>-		unsigned int u = atomic_dec_return(&amp;vlserver-&gt;usage);</div><div class='del'>-		//_debug("VL PUT %p{%u}", vlserver, u);</div><div class='del'>-</div><div class='del'>-		if (u == 0)</div><div class='del'>-			call_rcu(&amp;vlserver-&gt;rcu, afs_vlserver_rcu);</div><div class='del'>-	}</div><div class='add'>+	if (vlserver &amp;&amp;</div><div class='add'>+	    refcount_dec_and_test(&amp;vlserver-&gt;ref))</div><div class='add'>+		call_rcu(&amp;vlserver-&gt;rcu, afs_vlserver_rcu);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct afs_vlserver_list *afs_alloc_vlserver_list(unsigned int nr_servers)</div><div class='hunk'>@@ -54,7 +54,7 @@ struct afs_vlserver_list *afs_alloc_vlserver_list(unsigned int nr_servers)</div><div class='ctx'> </div><div class='ctx'> 	vllist = kzalloc(struct_size(vllist, servers, nr_servers), GFP_KERNEL);</div><div class='ctx'> 	if (vllist) {</div><div class='del'>-		atomic_set(&amp;vllist-&gt;usage, 1);</div><div class='add'>+		refcount_set(&amp;vllist-&gt;ref, 1);</div><div class='ctx'> 		rwlock_init(&amp;vllist-&gt;lock);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -64,10 +64,7 @@ struct afs_vlserver_list *afs_alloc_vlserver_list(unsigned int nr_servers)</div><div class='ctx'> void afs_put_vlserverlist(struct afs_net *net, struct afs_vlserver_list *vllist)</div><div class='ctx'> {</div><div class='ctx'> 	if (vllist) {</div><div class='del'>-		unsigned int u = atomic_dec_return(&amp;vllist-&gt;usage);</div><div class='del'>-</div><div class='del'>-		//_debug("VLLS PUT %p{%u}", vllist, u);</div><div class='del'>-		if (u == 0) {</div><div class='add'>+		if (refcount_dec_and_test(&amp;vllist-&gt;ref)) {</div><div class='ctx'> 			int i;</div><div class='ctx'> </div><div class='ctx'> 			for (i = 0; i &lt; vllist-&gt;nr_servers; i++) {</div><div class='hunk'>@@ -90,14 +87,15 @@ static u16 afs_extract_le16(const u8 **_b)</div><div class='ctx'> /*</div><div class='ctx'>  * Build a VL server address list from a DNS queried server list.</div><div class='ctx'>  */</div><div class='del'>-static struct afs_addr_list *afs_extract_vl_addrs(const u8 **_b, const u8 *end,</div><div class='add'>+static struct afs_addr_list *afs_extract_vl_addrs(struct afs_net *net,</div><div class='add'>+						  const u8 **_b, const u8 *end,</div><div class='ctx'> 						  u8 nr_addrs, u16 port)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_addr_list *alist;</div><div class='ctx'> 	const u8 *b = *_b;</div><div class='ctx'> 	int ret = -EINVAL;</div><div class='ctx'> </div><div class='del'>-	alist = afs_alloc_addrlist(nr_addrs, VL_SERVICE, port);</div><div class='add'>+	alist = afs_alloc_addrlist(nr_addrs);</div><div class='ctx'> 	if (!alist)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> 	if (nr_addrs == 0)</div><div class='hunk'>@@ -116,7 +114,9 @@ static struct afs_addr_list *afs_extract_vl_addrs(const u8 **_b, const u8 *end,</div><div class='ctx'> 				goto error;</div><div class='ctx'> 			}</div><div class='ctx'> 			memcpy(x, b, 4);</div><div class='del'>-			afs_merge_fs_addr4(alist, x[0], port);</div><div class='add'>+			ret = afs_merge_fs_addr4(net, alist, x[0], port);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				goto error;</div><div class='ctx'> 			b += 4;</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='hunk'>@@ -126,7 +126,9 @@ static struct afs_addr_list *afs_extract_vl_addrs(const u8 **_b, const u8 *end,</div><div class='ctx'> 				goto error;</div><div class='ctx'> 			}</div><div class='ctx'> 			memcpy(x, b, 16);</div><div class='del'>-			afs_merge_fs_addr6(alist, x, port);</div><div class='add'>+			ret = afs_merge_fs_addr6(net, alist, x, port);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				goto error;</div><div class='ctx'> 			b += 16;</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='hunk'>@@ -147,7 +149,7 @@ static struct afs_addr_list *afs_extract_vl_addrs(const u8 **_b, const u8 *end,</div><div class='ctx'> </div><div class='ctx'> error:</div><div class='ctx'> 	*_b = b;</div><div class='del'>-	afs_put_addrlist(alist);</div><div class='add'>+	afs_put_addrlist(alist, afs_alist_trace_put_parse_error);</div><div class='ctx'> 	return ERR_PTR(ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -254,7 +256,7 @@ struct afs_vlserver_list *afs_extract_vlserver_list(struct afs_cell *cell,</div><div class='ctx'> 		/* Extract the addresses - note that we can't skip this as we</div><div class='ctx'> 		 * have to advance the payload pointer.</div><div class='ctx'> 		 */</div><div class='del'>-		addrs = afs_extract_vl_addrs(&amp;b, end, bs.nr_addrs, bs.port);</div><div class='add'>+		addrs = afs_extract_vl_addrs(cell-&gt;net, &amp;b, end, bs.nr_addrs, bs.port);</div><div class='ctx'> 		if (IS_ERR(addrs)) {</div><div class='ctx'> 			ret = PTR_ERR(addrs);</div><div class='ctx'> 			goto error_2;</div><div class='hunk'>@@ -262,7 +264,7 @@ struct afs_vlserver_list *afs_extract_vlserver_list(struct afs_cell *cell,</div><div class='ctx'> </div><div class='ctx'> 		if (vllist-&gt;nr_servers &gt;= nr_servers) {</div><div class='ctx'> 			_debug("skip %u &gt;= %u", vllist-&gt;nr_servers, nr_servers);</div><div class='del'>-			afs_put_addrlist(addrs);</div><div class='add'>+			afs_put_addrlist(addrs, afs_alist_trace_put_parse_empty);</div><div class='ctx'> 			afs_put_vlserver(cell-&gt;net, server);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -271,7 +273,7 @@ struct afs_vlserver_list *afs_extract_vlserver_list(struct afs_cell *cell,</div><div class='ctx'> 		addrs-&gt;status = bs.status;</div><div class='ctx'> </div><div class='ctx'> 		if (addrs-&gt;nr_addrs == 0) {</div><div class='del'>-			afs_put_addrlist(addrs);</div><div class='add'>+			afs_put_addrlist(addrs, afs_alist_trace_put_parse_empty);</div><div class='ctx'> 			if (!rcu_access_pointer(server-&gt;addresses)) {</div><div class='ctx'> 				afs_put_vlserver(cell-&gt;net, server);</div><div class='ctx'> 				continue;</div><div class='hunk'>@@ -283,7 +285,7 @@ struct afs_vlserver_list *afs_extract_vlserver_list(struct afs_cell *cell,</div><div class='ctx'> 			old = rcu_replace_pointer(server-&gt;addresses, old,</div><div class='ctx'> 						  lockdep_is_held(&amp;server-&gt;lock));</div><div class='ctx'> 			write_unlock(&amp;server-&gt;lock);</div><div class='del'>-			afs_put_addrlist(old);</div><div class='add'>+			afs_put_addrlist(old, afs_alist_trace_put_vlserver_old);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> </div><div class='head'>diff --git a/fs/afs/vl_probe.c b/fs/afs/vl_probe.c<br/>index d1c7068b4346..3d2e0c925460 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/vl_probe.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/vl_probe.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/vl_probe.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/vl_probe.c</a></div><div class='hunk'>@@ -46,11 +46,12 @@ static void afs_done_one_vl_probe(struct afs_vlserver *server, bool wake_up)</div><div class='ctx'>  */</div><div class='ctx'> void afs_vlserver_probe_result(struct afs_call *call)</div><div class='ctx'> {</div><div class='del'>-	struct afs_addr_list *alist = call-&gt;alist;</div><div class='add'>+	struct afs_addr_list *alist = call-&gt;vl_probe;</div><div class='ctx'> 	struct afs_vlserver *server = call-&gt;vlserver;</div><div class='add'>+	struct afs_address *addr = &amp;alist-&gt;addrs[call-&gt;probe_index];</div><div class='ctx'> 	unsigned int server_index = call-&gt;server_index;</div><div class='ctx'> 	unsigned int rtt_us = 0;</div><div class='del'>-	unsigned int index = call-&gt;addr_ix;</div><div class='add'>+	unsigned int index = call-&gt;probe_index;</div><div class='ctx'> 	bool have_result = false;</div><div class='ctx'> 	int ret = call-&gt;error;</div><div class='ctx'> </div><div class='hunk'>@@ -89,7 +90,7 @@ void afs_vlserver_probe_result(struct afs_call *call)</div><div class='ctx'> 	case -ETIME:</div><div class='ctx'> 	default:</div><div class='ctx'> 		clear_bit(index, &amp;alist-&gt;responded);</div><div class='del'>-		set_bit(index, &amp;alist-&gt;failed);</div><div class='add'>+		set_bit(index, &amp;alist-&gt;probe_failed);</div><div class='ctx'> 		if (!(server-&gt;probe.flags &amp; AFS_VLSERVER_PROBE_RESPONDED) &amp;&amp;</div><div class='ctx'> 		    (server-&gt;probe.error == 0 ||</div><div class='ctx'> 		     server-&gt;probe.error == -ETIMEDOUT ||</div><div class='hunk'>@@ -101,22 +102,22 @@ void afs_vlserver_probe_result(struct afs_call *call)</div><div class='ctx'> </div><div class='ctx'> responded:</div><div class='ctx'> 	set_bit(index, &amp;alist-&gt;responded);</div><div class='del'>-	clear_bit(index, &amp;alist-&gt;failed);</div><div class='add'>+	clear_bit(index, &amp;alist-&gt;probe_failed);</div><div class='ctx'> </div><div class='ctx'> 	if (call-&gt;service_id == YFS_VL_SERVICE) {</div><div class='ctx'> 		server-&gt;probe.flags |= AFS_VLSERVER_PROBE_IS_YFS;</div><div class='ctx'> 		set_bit(AFS_VLSERVER_FL_IS_YFS, &amp;server-&gt;flags);</div><div class='del'>-		alist-&gt;addrs[index].srx_service = call-&gt;service_id;</div><div class='add'>+		server-&gt;service_id = call-&gt;service_id;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		server-&gt;probe.flags |= AFS_VLSERVER_PROBE_NOT_YFS;</div><div class='ctx'> 		if (!(server-&gt;probe.flags &amp; AFS_VLSERVER_PROBE_IS_YFS)) {</div><div class='ctx'> 			clear_bit(AFS_VLSERVER_FL_IS_YFS, &amp;server-&gt;flags);</div><div class='del'>-			alist-&gt;addrs[index].srx_service = call-&gt;service_id;</div><div class='add'>+			server-&gt;service_id = call-&gt;service_id;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (rxrpc_kernel_get_srtt(call-&gt;net-&gt;socket, call-&gt;rxcall, &amp;rtt_us) &amp;&amp;</div><div class='del'>-	    rtt_us &lt; server-&gt;probe.rtt) {</div><div class='add'>+	rtt_us = rxrpc_kernel_get_srtt(addr-&gt;peer);</div><div class='add'>+	if (rtt_us &lt; server-&gt;probe.rtt) {</div><div class='ctx'> 		server-&gt;probe.rtt = rtt_us;</div><div class='ctx'> 		server-&gt;rtt = rtt_us;</div><div class='ctx'> 		alist-&gt;preferred = index;</div><div class='hunk'>@@ -130,8 +131,10 @@ responded:</div><div class='ctx'> out:</div><div class='ctx'> 	spin_unlock(&amp;server-&gt;probe_lock);</div><div class='ctx'> </div><div class='del'>-	_debug("probe [%u][%u] %pISpc rtt=%u ret=%d",</div><div class='del'>-	       server_index, index, &amp;alist-&gt;addrs[index].transport, rtt_us, ret);</div><div class='add'>+	trace_afs_vl_probe(server, false, alist, index, call-&gt;error, call-&gt;abort_code, rtt_us);</div><div class='add'>+	_debug("probe [%u][%u] %pISpc rtt=%d ret=%d",</div><div class='add'>+	       server_index, index, rxrpc_kernel_remote_addr(addr-&gt;peer),</div><div class='add'>+	       rtt_us, ret);</div><div class='ctx'> </div><div class='ctx'> 	afs_done_one_vl_probe(server, have_result);</div><div class='ctx'> }</div><div class='hunk'>@@ -146,35 +149,52 @@ static bool afs_do_probe_vlserver(struct afs_net *net,</div><div class='ctx'> 				  unsigned int server_index,</div><div class='ctx'> 				  struct afs_error *_e)</div><div class='ctx'> {</div><div class='del'>-	struct afs_addr_cursor ac = {</div><div class='del'>-		.index = 0,</div><div class='del'>-	};</div><div class='add'>+	struct afs_addr_list *alist;</div><div class='ctx'> 	struct afs_call *call;</div><div class='add'>+	unsigned long unprobed;</div><div class='add'>+	unsigned int index, i;</div><div class='ctx'> 	bool in_progress = false;</div><div class='add'>+	int best_prio;</div><div class='ctx'> </div><div class='ctx'> 	_enter("%s", server-&gt;name);</div><div class='ctx'> </div><div class='ctx'> 	read_lock(&amp;server-&gt;lock);</div><div class='del'>-	ac.alist = rcu_dereference_protected(server-&gt;addresses,</div><div class='del'>-					     lockdep_is_held(&amp;server-&gt;lock));</div><div class='add'>+	alist = rcu_dereference_protected(server-&gt;addresses,</div><div class='add'>+					  lockdep_is_held(&amp;server-&gt;lock));</div><div class='add'>+	afs_get_addrlist(alist, afs_alist_trace_get_vlprobe);</div><div class='ctx'> 	read_unlock(&amp;server-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	atomic_set(&amp;server-&gt;probe_outstanding, ac.alist-&gt;nr_addrs);</div><div class='add'>+	atomic_set(&amp;server-&gt;probe_outstanding, alist-&gt;nr_addrs);</div><div class='ctx'> 	memset(&amp;server-&gt;probe, 0, sizeof(server-&gt;probe));</div><div class='ctx'> 	server-&gt;probe.rtt = UINT_MAX;</div><div class='ctx'> </div><div class='del'>-	for (ac.index = 0; ac.index &lt; ac.alist-&gt;nr_addrs; ac.index++) {</div><div class='del'>-		call = afs_vl_get_capabilities(net, &amp;ac, key, server,</div><div class='add'>+	unprobed = (1UL &lt;&lt; alist-&gt;nr_addrs) - 1;</div><div class='add'>+	while (unprobed) {</div><div class='add'>+		best_prio = -1;</div><div class='add'>+		index = 0;</div><div class='add'>+		for (i = 0; i &lt; alist-&gt;nr_addrs; i++) {</div><div class='add'>+			if (test_bit(i, &amp;unprobed) &amp;&amp;</div><div class='add'>+			    alist-&gt;addrs[i].prio &gt; best_prio) {</div><div class='add'>+				index = i;</div><div class='add'>+				best_prio = alist-&gt;addrs[i].prio;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+		__clear_bit(index, &amp;unprobed);</div><div class='add'>+</div><div class='add'>+		trace_afs_vl_probe(server, true, alist, index, 0, 0, 0);</div><div class='add'>+		call = afs_vl_get_capabilities(net, alist, index, key, server,</div><div class='ctx'> 					       server_index);</div><div class='ctx'> 		if (!IS_ERR(call)) {</div><div class='add'>+			afs_prioritise_error(_e, call-&gt;error, call-&gt;abort_code);</div><div class='ctx'> 			afs_put_call(call);</div><div class='ctx'> 			in_progress = true;</div><div class='ctx'> 		} else {</div><div class='del'>-			afs_prioritise_error(_e, PTR_ERR(call), ac.abort_code);</div><div class='add'>+			afs_prioritise_error(_e, PTR_ERR(call), 0);</div><div class='ctx'> 			afs_done_one_vl_probe(server, false);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	afs_put_addrlist(alist, afs_alist_trace_put_vlprobe);</div><div class='ctx'> 	return in_progress;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -185,12 +205,10 @@ int afs_send_vl_probes(struct afs_net *net, struct key *key,</div><div class='ctx'> 		       struct afs_vlserver_list *vllist)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_vlserver *server;</div><div class='del'>-	struct afs_error e;</div><div class='add'>+	struct afs_error e = {};</div><div class='ctx'> 	bool in_progress = false;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	e.error = 0;</div><div class='del'>-	e.responded = false;</div><div class='ctx'> 	for (i = 0; i &lt; vllist-&gt;nr_servers; i++) {</div><div class='ctx'> 		server = vllist-&gt;servers[i].server;</div><div class='ctx'> 		if (test_bit(AFS_VLSERVER_FL_PROBED, &amp;server-&gt;flags))</div><div class='head'>diff --git a/fs/afs/vl_rotate.c b/fs/afs/vl_rotate.c<br/>index 488e58490b16..6ad9688d8f4b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/vl_rotate.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/vl_rotate.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/vl_rotate.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/vl_rotate.c</a></div><div class='hunk'>@@ -17,18 +17,21 @@</div><div class='ctx'> bool afs_begin_vlserver_operation(struct afs_vl_cursor *vc, struct afs_cell *cell,</div><div class='ctx'> 				  struct key *key)</div><div class='ctx'> {</div><div class='add'>+	static atomic_t debug_ids;</div><div class='add'>+</div><div class='ctx'> 	memset(vc, 0, sizeof(*vc));</div><div class='ctx'> 	vc-&gt;cell = cell;</div><div class='ctx'> 	vc-&gt;key = key;</div><div class='del'>-	vc-&gt;error = -EDESTADDRREQ;</div><div class='del'>-	vc-&gt;ac.error = SHRT_MAX;</div><div class='add'>+	vc-&gt;cumul_error.error = -EDESTADDRREQ;</div><div class='add'>+	vc-&gt;nr_iterations = -1;</div><div class='ctx'> </div><div class='ctx'> 	if (signal_pending(current)) {</div><div class='del'>-		vc-&gt;error = -EINTR;</div><div class='add'>+		vc-&gt;cumul_error.error = -EINTR;</div><div class='ctx'> 		vc-&gt;flags |= AFS_VL_CURSOR_STOP;</div><div class='ctx'> 		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	vc-&gt;debug_id = atomic_inc_return(&amp;debug_ids);</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -45,21 +48,27 @@ static bool afs_start_vl_iteration(struct afs_vl_cursor *vc)</div><div class='ctx'> 	    cell-&gt;dns_expiry &lt;= ktime_get_real_seconds()) {</div><div class='ctx'> 		dns_lookup_count = smp_load_acquire(&amp;cell-&gt;dns_lookup_count);</div><div class='ctx'> 		set_bit(AFS_CELL_FL_DO_LOOKUP, &amp;cell-&gt;flags);</div><div class='del'>-		afs_queue_cell(cell, afs_cell_trace_get_queue_dns);</div><div class='add'>+		afs_queue_cell(cell, afs_cell_trace_queue_dns);</div><div class='ctx'> </div><div class='ctx'> 		if (cell-&gt;dns_source == DNS_RECORD_UNAVAILABLE) {</div><div class='ctx'> 			if (wait_var_event_interruptible(</div><div class='ctx'> 				    &amp;cell-&gt;dns_lookup_count,</div><div class='ctx'> 				    smp_load_acquire(&amp;cell-&gt;dns_lookup_count)</div><div class='ctx'> 				    != dns_lookup_count) &lt; 0) {</div><div class='del'>-				vc-&gt;error = -ERESTARTSYS;</div><div class='add'>+				vc-&gt;cumul_error.error = -ERESTARTSYS;</div><div class='ctx'> 				return false;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* Status load is ordered after lookup counter load */</div><div class='add'>+		if (cell-&gt;dns_status == DNS_LOOKUP_GOT_NOT_FOUND) {</div><div class='add'>+			pr_warn("No record of cell %s\n", cell-&gt;name);</div><div class='add'>+			vc-&gt;cumul_error.error = -ENOENT;</div><div class='add'>+			return false;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		if (cell-&gt;dns_source == DNS_RECORD_UNAVAILABLE) {</div><div class='del'>-			vc-&gt;error = -EDESTADDRREQ;</div><div class='add'>+			vc-&gt;cumul_error.error = -EDESTADDRREQ;</div><div class='ctx'> 			return false;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -72,8 +81,8 @@ static bool afs_start_vl_iteration(struct afs_vl_cursor *vc)</div><div class='ctx'> 	if (!vc-&gt;server_list-&gt;nr_servers)</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	vc-&gt;untried = (1UL &lt;&lt; vc-&gt;server_list-&gt;nr_servers) - 1;</div><div class='del'>-	vc-&gt;index = -1;</div><div class='add'>+	vc-&gt;untried_servers = (1UL &lt;&lt; vc-&gt;server_list-&gt;nr_servers) - 1;</div><div class='add'>+	vc-&gt;server_index = -1;</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -83,54 +92,57 @@ static bool afs_start_vl_iteration(struct afs_vl_cursor *vc)</div><div class='ctx'>  */</div><div class='ctx'> bool afs_select_vlserver(struct afs_vl_cursor *vc)</div><div class='ctx'> {</div><div class='del'>-	struct afs_addr_list *alist;</div><div class='add'>+	struct afs_addr_list *alist = vc-&gt;alist;</div><div class='ctx'> 	struct afs_vlserver *vlserver;</div><div class='del'>-	struct afs_error e;</div><div class='del'>-	u32 rtt;</div><div class='del'>-	int error = vc-&gt;ac.error, i;</div><div class='add'>+	unsigned long set, failed;</div><div class='add'>+	unsigned int rtt;</div><div class='add'>+	s32 abort_code = vc-&gt;call_abort_code;</div><div class='add'>+	int error = vc-&gt;call_error, i;</div><div class='ctx'> </div><div class='del'>-	_enter("%lx[%d],%lx[%d],%d,%d",</div><div class='del'>-	       vc-&gt;untried, vc-&gt;index,</div><div class='del'>-	       vc-&gt;ac.tried, vc-&gt;ac.index,</div><div class='del'>-	       error, vc-&gt;ac.abort_code);</div><div class='add'>+	vc-&gt;nr_iterations++;</div><div class='add'>+</div><div class='add'>+	_enter("VC=%x+%x,%d{%lx},%d{%lx},%d,%d",</div><div class='add'>+	       vc-&gt;debug_id, vc-&gt;nr_iterations, vc-&gt;server_index, vc-&gt;untried_servers,</div><div class='add'>+	       vc-&gt;addr_index, vc-&gt;addr_tried,</div><div class='add'>+	       error, abort_code);</div><div class='ctx'> </div><div class='ctx'> 	if (vc-&gt;flags &amp; AFS_VL_CURSOR_STOP) {</div><div class='ctx'> 		_leave(" = f [stopped]");</div><div class='ctx'> 		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	vc-&gt;nr_iterations++;</div><div class='add'>+	if (vc-&gt;nr_iterations == 0)</div><div class='add'>+		goto start;</div><div class='add'>+</div><div class='add'>+	WRITE_ONCE(alist-&gt;addrs[vc-&gt;addr_index].last_error, error);</div><div class='ctx'> </div><div class='ctx'> 	/* Evaluate the result of the previous operation, if there was one. */</div><div class='ctx'> 	switch (error) {</div><div class='del'>-	case SHRT_MAX:</div><div class='del'>-		goto start;</div><div class='del'>-</div><div class='ctx'> 	default:</div><div class='ctx'> 	case 0:</div><div class='ctx'> 		/* Success or local failure.  Stop. */</div><div class='del'>-		vc-&gt;error = error;</div><div class='add'>+		vc-&gt;cumul_error.error = error;</div><div class='ctx'> 		vc-&gt;flags |= AFS_VL_CURSOR_STOP;</div><div class='del'>-		_leave(" = f [okay/local %d]", vc-&gt;ac.error);</div><div class='add'>+		_leave(" = f [okay/local %d]", vc-&gt;cumul_error.error);</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='ctx'> 	case -ECONNABORTED:</div><div class='ctx'> 		/* The far side rejected the operation on some grounds.  This</div><div class='ctx'> 		 * might involve the server being busy or the volume having been moved.</div><div class='ctx'> 		 */</div><div class='del'>-		switch (vc-&gt;ac.abort_code) {</div><div class='add'>+		switch (abort_code) {</div><div class='ctx'> 		case AFSVL_IO:</div><div class='ctx'> 		case AFSVL_BADVOLOPER:</div><div class='ctx'> 		case AFSVL_NOMEM:</div><div class='ctx'> 			/* The server went weird. */</div><div class='del'>-			vc-&gt;error = -EREMOTEIO;</div><div class='add'>+			afs_prioritise_error(&amp;vc-&gt;cumul_error, -EREMOTEIO, abort_code);</div><div class='ctx'> 			//write_lock(&amp;vc-&gt;cell-&gt;vl_servers_lock);</div><div class='del'>-			//vc-&gt;server_list-&gt;weird_mask |= 1 &lt;&lt; vc-&gt;index;</div><div class='add'>+			//vc-&gt;server_list-&gt;weird_mask |= 1 &lt;&lt; vc-&gt;server_index;</div><div class='ctx'> 			//write_unlock(&amp;vc-&gt;cell-&gt;vl_servers_lock);</div><div class='ctx'> 			goto next_server;</div><div class='ctx'> </div><div class='ctx'> 		default:</div><div class='del'>-			vc-&gt;error = afs_abort_to_error(vc-&gt;ac.abort_code);</div><div class='add'>+			afs_prioritise_error(&amp;vc-&gt;cumul_error, error, abort_code);</div><div class='ctx'> 			goto failed;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -143,12 +155,12 @@ bool afs_select_vlserver(struct afs_vl_cursor *vc)</div><div class='ctx'> 	case -ETIMEDOUT:</div><div class='ctx'> 	case -ETIME:</div><div class='ctx'> 		_debug("no conn %d", error);</div><div class='del'>-		vc-&gt;error = error;</div><div class='add'>+		afs_prioritise_error(&amp;vc-&gt;cumul_error, error, 0);</div><div class='ctx'> 		goto iterate_address;</div><div class='ctx'> </div><div class='ctx'> 	case -ECONNRESET:</div><div class='ctx'> 		_debug("call reset");</div><div class='del'>-		vc-&gt;error = error;</div><div class='add'>+		afs_prioritise_error(&amp;vc-&gt;cumul_error, error, 0);</div><div class='ctx'> 		vc-&gt;flags |= AFS_VL_CURSOR_RETRY;</div><div class='ctx'> 		goto next_server;</div><div class='ctx'> </div><div class='hunk'>@@ -159,7 +171,13 @@ bool afs_select_vlserver(struct afs_vl_cursor *vc)</div><div class='ctx'> </div><div class='ctx'> restart_from_beginning:</div><div class='ctx'> 	_debug("restart");</div><div class='del'>-	afs_end_cursor(&amp;vc-&gt;ac);</div><div class='add'>+	if (vc-&gt;call_responded &amp;&amp;</div><div class='add'>+	    vc-&gt;addr_index != vc-&gt;alist-&gt;preferred &amp;&amp;</div><div class='add'>+	    test_bit(alist-&gt;preferred, &amp;vc-&gt;addr_tried))</div><div class='add'>+		WRITE_ONCE(alist-&gt;preferred, vc-&gt;addr_index);</div><div class='add'>+	afs_put_addrlist(alist, afs_alist_trace_put_vlrotate_restart);</div><div class='add'>+	alist = vc-&gt;alist = NULL;</div><div class='add'>+</div><div class='ctx'> 	afs_put_vlserverlist(vc-&gt;cell-&gt;net, vc-&gt;server_list);</div><div class='ctx'> 	vc-&gt;server_list = NULL;</div><div class='ctx'> 	if (vc-&gt;flags &amp; AFS_VL_CURSOR_RETRIED)</div><div class='hunk'>@@ -167,53 +185,58 @@ restart_from_beginning:</div><div class='ctx'> 	vc-&gt;flags |= AFS_VL_CURSOR_RETRIED;</div><div class='ctx'> start:</div><div class='ctx'> 	_debug("start");</div><div class='add'>+	ASSERTCMP(alist, ==, NULL);</div><div class='ctx'> </div><div class='ctx'> 	if (!afs_start_vl_iteration(vc))</div><div class='ctx'> 		goto failed;</div><div class='ctx'> </div><div class='ctx'> 	error = afs_send_vl_probes(vc-&gt;cell-&gt;net, vc-&gt;key, vc-&gt;server_list);</div><div class='del'>-	if (error &lt; 0)</div><div class='del'>-		goto failed_set_error;</div><div class='add'>+	if (error &lt; 0) {</div><div class='add'>+		afs_prioritise_error(&amp;vc-&gt;cumul_error, error, 0);</div><div class='add'>+		goto failed;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> pick_server:</div><div class='del'>-	_debug("pick [%lx]", vc-&gt;untried);</div><div class='add'>+	_debug("pick [%lx]", vc-&gt;untried_servers);</div><div class='add'>+	ASSERTCMP(alist, ==, NULL);</div><div class='ctx'> </div><div class='del'>-	error = afs_wait_for_vl_probes(vc-&gt;server_list, vc-&gt;untried);</div><div class='del'>-	if (error &lt; 0)</div><div class='del'>-		goto failed_set_error;</div><div class='add'>+	error = afs_wait_for_vl_probes(vc-&gt;server_list, vc-&gt;untried_servers);</div><div class='add'>+	if (error &lt; 0) {</div><div class='add'>+		afs_prioritise_error(&amp;vc-&gt;cumul_error, error, 0);</div><div class='add'>+		goto failed;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* Pick the untried server with the lowest RTT. */</div><div class='del'>-	vc-&gt;index = vc-&gt;server_list-&gt;preferred;</div><div class='del'>-	if (test_bit(vc-&gt;index, &amp;vc-&gt;untried))</div><div class='add'>+	vc-&gt;server_index = vc-&gt;server_list-&gt;preferred;</div><div class='add'>+	if (test_bit(vc-&gt;server_index, &amp;vc-&gt;untried_servers))</div><div class='ctx'> 		goto selected_server;</div><div class='ctx'> </div><div class='del'>-	vc-&gt;index = -1;</div><div class='del'>-	rtt = U32_MAX;</div><div class='add'>+	vc-&gt;server_index = -1;</div><div class='add'>+	rtt = UINT_MAX;</div><div class='ctx'> 	for (i = 0; i &lt; vc-&gt;server_list-&gt;nr_servers; i++) {</div><div class='ctx'> 		struct afs_vlserver *s = vc-&gt;server_list-&gt;servers[i].server;</div><div class='ctx'> </div><div class='del'>-		if (!test_bit(i, &amp;vc-&gt;untried) ||</div><div class='add'>+		if (!test_bit(i, &amp;vc-&gt;untried_servers) ||</div><div class='ctx'> 		    !test_bit(AFS_VLSERVER_FL_RESPONDING, &amp;s-&gt;flags))</div><div class='ctx'> 			continue;</div><div class='del'>-		if (s-&gt;probe.rtt &lt; rtt) {</div><div class='del'>-			vc-&gt;index = i;</div><div class='add'>+		if (s-&gt;probe.rtt &lt;= rtt) {</div><div class='add'>+			vc-&gt;server_index = i;</div><div class='ctx'> 			rtt = s-&gt;probe.rtt;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (vc-&gt;index == -1)</div><div class='add'>+	if (vc-&gt;server_index == -1)</div><div class='ctx'> 		goto no_more_servers;</div><div class='ctx'> </div><div class='ctx'> selected_server:</div><div class='del'>-	_debug("use %d", vc-&gt;index);</div><div class='del'>-	__clear_bit(vc-&gt;index, &amp;vc-&gt;untried);</div><div class='add'>+	_debug("use %d", vc-&gt;server_index);</div><div class='add'>+	__clear_bit(vc-&gt;server_index, &amp;vc-&gt;untried_servers);</div><div class='ctx'> </div><div class='ctx'> 	/* We're starting on a different vlserver from the list.  We need to</div><div class='ctx'> 	 * check it, find its address list and probe its capabilities before we</div><div class='ctx'> 	 * use it.</div><div class='ctx'> 	 */</div><div class='del'>-	ASSERTCMP(vc-&gt;ac.alist, ==, NULL);</div><div class='del'>-	vlserver = vc-&gt;server_list-&gt;servers[vc-&gt;index].server;</div><div class='add'>+	vlserver = vc-&gt;server_list-&gt;servers[vc-&gt;server_index].server;</div><div class='ctx'> 	vc-&gt;server = vlserver;</div><div class='ctx'> </div><div class='ctx'> 	_debug("USING VLSERVER: %s", vlserver-&gt;name);</div><div class='hunk'>@@ -221,34 +244,48 @@ selected_server:</div><div class='ctx'> 	read_lock(&amp;vlserver-&gt;lock);</div><div class='ctx'> 	alist = rcu_dereference_protected(vlserver-&gt;addresses,</div><div class='ctx'> 					  lockdep_is_held(&amp;vlserver-&gt;lock));</div><div class='del'>-	afs_get_addrlist(alist);</div><div class='add'>+	vc-&gt;alist = afs_get_addrlist(alist, afs_alist_trace_get_vlrotate_set);</div><div class='ctx'> 	read_unlock(&amp;vlserver-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	memset(&amp;vc-&gt;ac, 0, sizeof(vc-&gt;ac));</div><div class='del'>-</div><div class='del'>-	if (!vc-&gt;ac.alist)</div><div class='del'>-		vc-&gt;ac.alist = alist;</div><div class='del'>-	else</div><div class='del'>-		afs_put_addrlist(alist);</div><div class='del'>-</div><div class='del'>-	vc-&gt;ac.index = -1;</div><div class='add'>+	vc-&gt;addr_tried = 0;</div><div class='add'>+	vc-&gt;addr_index = -1;</div><div class='ctx'> </div><div class='ctx'> iterate_address:</div><div class='del'>-	ASSERT(vc-&gt;ac.alist);</div><div class='ctx'> 	/* Iterate over the current server's address list to try and find an</div><div class='ctx'> 	 * address on which it will respond to us.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!afs_iterate_addresses(&amp;vc-&gt;ac))</div><div class='add'>+	set = READ_ONCE(alist-&gt;responded);</div><div class='add'>+	failed = READ_ONCE(alist-&gt;probe_failed);</div><div class='add'>+	vc-&gt;addr_index = READ_ONCE(alist-&gt;preferred);</div><div class='add'>+</div><div class='add'>+	_debug("%lx-%lx-%lx,%d", set, failed, vc-&gt;addr_tried, vc-&gt;addr_index);</div><div class='add'>+</div><div class='add'>+	set &amp;= ~(failed | vc-&gt;addr_tried);</div><div class='add'>+</div><div class='add'>+	if (!set)</div><div class='ctx'> 		goto next_server;</div><div class='ctx'> </div><div class='del'>-	_debug("VL address %d/%d", vc-&gt;ac.index, vc-&gt;ac.alist-&gt;nr_addrs);</div><div class='add'>+	if (!test_bit(vc-&gt;addr_index, &amp;set))</div><div class='add'>+		vc-&gt;addr_index = __ffs(set);</div><div class='add'>+</div><div class='add'>+	set_bit(vc-&gt;addr_index, &amp;vc-&gt;addr_tried);</div><div class='add'>+	vc-&gt;alist = alist;</div><div class='ctx'> </div><div class='del'>-	_leave(" = t %pISpc", &amp;vc-&gt;ac.alist-&gt;addrs[vc-&gt;ac.index].transport);</div><div class='add'>+	_debug("VL address %d/%d", vc-&gt;addr_index, alist-&gt;nr_addrs);</div><div class='add'>+</div><div class='add'>+	vc-&gt;call_responded = false;</div><div class='add'>+	_leave(" = t %pISpc", rxrpc_kernel_remote_addr(alist-&gt;addrs[vc-&gt;addr_index].peer));</div><div class='ctx'> 	return true;</div><div class='ctx'> </div><div class='ctx'> next_server:</div><div class='ctx'> 	_debug("next");</div><div class='del'>-	afs_end_cursor(&amp;vc-&gt;ac);</div><div class='add'>+	ASSERT(alist);</div><div class='add'>+	if (vc-&gt;call_responded &amp;&amp;</div><div class='add'>+	    vc-&gt;addr_index != alist-&gt;preferred &amp;&amp;</div><div class='add'>+	    test_bit(alist-&gt;preferred, &amp;vc-&gt;addr_tried))</div><div class='add'>+		WRITE_ONCE(alist-&gt;preferred, vc-&gt;addr_index);</div><div class='add'>+	afs_put_addrlist(alist, afs_alist_trace_put_vlrotate_next);</div><div class='add'>+	alist = vc-&gt;alist = NULL;</div><div class='ctx'> 	goto pick_server;</div><div class='ctx'> </div><div class='ctx'> no_more_servers:</div><div class='hunk'>@@ -258,25 +295,26 @@ no_more_servers:</div><div class='ctx'> 	if (vc-&gt;flags &amp; AFS_VL_CURSOR_RETRY)</div><div class='ctx'> 		goto restart_from_beginning;</div><div class='ctx'> </div><div class='del'>-	e.error = -EDESTADDRREQ;</div><div class='del'>-	e.responded = false;</div><div class='ctx'> 	for (i = 0; i &lt; vc-&gt;server_list-&gt;nr_servers; i++) {</div><div class='ctx'> 		struct afs_vlserver *s = vc-&gt;server_list-&gt;servers[i].server;</div><div class='ctx'> </div><div class='ctx'> 		if (test_bit(AFS_VLSERVER_FL_RESPONDING, &amp;s-&gt;flags))</div><div class='del'>-			e.responded = true;</div><div class='del'>-		afs_prioritise_error(&amp;e, READ_ONCE(s-&gt;probe.error),</div><div class='add'>+			vc-&gt;cumul_error.responded = true;</div><div class='add'>+		afs_prioritise_error(&amp;vc-&gt;cumul_error, READ_ONCE(s-&gt;probe.error),</div><div class='ctx'> 				     s-&gt;probe.abort_code);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	error = e.error;</div><div class='del'>-</div><div class='del'>-failed_set_error:</div><div class='del'>-	vc-&gt;error = error;</div><div class='ctx'> failed:</div><div class='add'>+	if (alist) {</div><div class='add'>+		if (vc-&gt;call_responded &amp;&amp;</div><div class='add'>+		    vc-&gt;addr_index != alist-&gt;preferred &amp;&amp;</div><div class='add'>+		    test_bit(alist-&gt;preferred, &amp;vc-&gt;addr_tried))</div><div class='add'>+			WRITE_ONCE(alist-&gt;preferred, vc-&gt;addr_index);</div><div class='add'>+		afs_put_addrlist(alist, afs_alist_trace_put_vlrotate_fail);</div><div class='add'>+		alist = vc-&gt;alist = NULL;</div><div class='add'>+	}</div><div class='ctx'> 	vc-&gt;flags |= AFS_VL_CURSOR_STOP;</div><div class='del'>-	afs_end_cursor(&amp;vc-&gt;ac);</div><div class='del'>-	_leave(" = f [failed %d]", vc-&gt;error);</div><div class='add'>+	_leave(" = f [failed %d]", vc-&gt;cumul_error.error);</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -285,6 +323,7 @@ failed:</div><div class='ctx'>  */</div><div class='ctx'> static void afs_vl_dump_edestaddrreq(const struct afs_vl_cursor *vc)</div><div class='ctx'> {</div><div class='add'>+	struct afs_cell *cell = vc-&gt;cell;</div><div class='ctx'> 	static int count;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='hunk'>@@ -294,8 +333,14 @@ static void afs_vl_dump_edestaddrreq(const struct afs_vl_cursor *vc)</div><div class='ctx'> </div><div class='ctx'> 	rcu_read_lock();</div><div class='ctx'> 	pr_notice("EDESTADDR occurred\n");</div><div class='add'>+	pr_notice("CELL: %s err=%d\n", cell-&gt;name, cell-&gt;error);</div><div class='add'>+	pr_notice("DNS: src=%u st=%u lc=%x\n",</div><div class='add'>+		  cell-&gt;dns_source, cell-&gt;dns_status, cell-&gt;dns_lookup_count);</div><div class='ctx'> 	pr_notice("VC: ut=%lx ix=%u ni=%hu fl=%hx err=%hd\n",</div><div class='del'>-		  vc-&gt;untried, vc-&gt;index, vc-&gt;nr_iterations, vc-&gt;flags, vc-&gt;error);</div><div class='add'>+		  vc-&gt;untried_servers, vc-&gt;server_index, vc-&gt;nr_iterations,</div><div class='add'>+		  vc-&gt;flags, vc-&gt;cumul_error.error);</div><div class='add'>+	pr_notice("VC: call  er=%d ac=%d r=%u\n",</div><div class='add'>+		  vc-&gt;call_error, vc-&gt;call_abort_code, vc-&gt;call_responded);</div><div class='ctx'> </div><div class='ctx'> 	if (vc-&gt;server_list) {</div><div class='ctx'> 		const struct afs_vlserver_list *sl = vc-&gt;server_list;</div><div class='hunk'>@@ -312,16 +357,14 @@ static void afs_vl_dump_edestaddrreq(const struct afs_vl_cursor *vc)</div><div class='ctx'> 					  a-&gt;nr_ipv4, a-&gt;nr_addrs, a-&gt;max_addrs,</div><div class='ctx'> 					  a-&gt;preferred);</div><div class='ctx'> 				pr_notice("VC:  - R=%lx F=%lx\n",</div><div class='del'>-					  a-&gt;responded, a-&gt;failed);</div><div class='del'>-				if (a == vc-&gt;ac.alist)</div><div class='add'>+					  a-&gt;responded, a-&gt;probe_failed);</div><div class='add'>+				if (a == vc-&gt;alist)</div><div class='ctx'> 					pr_notice("VC:  - current\n");</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	pr_notice("AC: t=%lx ax=%u ac=%d er=%d r=%u ni=%u\n",</div><div class='del'>-		  vc-&gt;ac.tried, vc-&gt;ac.index, vc-&gt;ac.abort_code, vc-&gt;ac.error,</div><div class='del'>-		  vc-&gt;ac.responded, vc-&gt;ac.nr_iterations);</div><div class='add'>+	pr_notice("AC: t=%lx ax=%u\n", vc-&gt;addr_tried, vc-&gt;addr_index);</div><div class='ctx'> 	rcu_read_unlock();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -332,17 +375,25 @@ int afs_end_vlserver_operation(struct afs_vl_cursor *vc)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_net *net = vc-&gt;cell-&gt;net;</div><div class='ctx'> </div><div class='del'>-	if (vc-&gt;error == -EDESTADDRREQ ||</div><div class='del'>-	    vc-&gt;error == -EADDRNOTAVAIL ||</div><div class='del'>-	    vc-&gt;error == -ENETUNREACH ||</div><div class='del'>-	    vc-&gt;error == -EHOSTUNREACH)</div><div class='add'>+	_enter("VC=%x+%x", vc-&gt;debug_id, vc-&gt;nr_iterations);</div><div class='add'>+</div><div class='add'>+	switch (vc-&gt;cumul_error.error) {</div><div class='add'>+	case -EDESTADDRREQ:</div><div class='add'>+	case -EADDRNOTAVAIL:</div><div class='add'>+	case -ENETUNREACH:</div><div class='add'>+	case -EHOSTUNREACH:</div><div class='ctx'> 		afs_vl_dump_edestaddrreq(vc);</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	afs_end_cursor(&amp;vc-&gt;ac);</div><div class='add'>+	if (vc-&gt;alist) {</div><div class='add'>+		if (vc-&gt;call_responded &amp;&amp;</div><div class='add'>+		    vc-&gt;addr_index != vc-&gt;alist-&gt;preferred &amp;&amp;</div><div class='add'>+		    test_bit(vc-&gt;alist-&gt;preferred, &amp;vc-&gt;addr_tried))</div><div class='add'>+			WRITE_ONCE(vc-&gt;alist-&gt;preferred, vc-&gt;addr_index);</div><div class='add'>+		afs_put_addrlist(vc-&gt;alist, afs_alist_trace_put_vlrotate_end);</div><div class='add'>+		vc-&gt;alist = NULL;</div><div class='add'>+	}</div><div class='ctx'> 	afs_put_vlserverlist(net, vc-&gt;server_list);</div><div class='del'>-</div><div class='del'>-	if (vc-&gt;error == -ECONNABORTED)</div><div class='del'>-		vc-&gt;error = afs_abort_to_error(vc-&gt;ac.abort_code);</div><div class='del'>-</div><div class='del'>-	return vc-&gt;error;</div><div class='add'>+	return vc-&gt;cumul_error.error;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/afs/vlclient.c b/fs/afs/vlclient.c<br/>index 00fca3c66ba6..3a23c0b08eb6 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/vlclient.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/vlclient.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/vlclient.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/vlclient.c</a></div><div class='hunk'>@@ -18,8 +18,7 @@ static int afs_deliver_vl_get_entry_by_name_u(struct afs_call *call)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_uvldbentry__xdr *uvldb;</div><div class='ctx'> 	struct afs_vldb_entry *entry;</div><div class='del'>-	bool new_only = false;</div><div class='del'>-	u32 tmp, nr_servers, vlflags;</div><div class='add'>+	u32 nr_servers, vlflags;</div><div class='ctx'> 	int i, ret;</div><div class='ctx'> </div><div class='ctx'> 	_enter("");</div><div class='hunk'>@@ -41,27 +40,14 @@ static int afs_deliver_vl_get_entry_by_name_u(struct afs_call *call)</div><div class='ctx'> 	entry-&gt;name[i] = 0;</div><div class='ctx'> 	entry-&gt;name_len = strlen(entry-&gt;name);</div><div class='ctx'> </div><div class='del'>-	/* If there is a new replication site that we can use, ignore all the</div><div class='del'>-	 * sites that aren't marked as new.</div><div class='del'>-	 */</div><div class='del'>-	for (i = 0; i &lt; nr_servers; i++) {</div><div class='del'>-		tmp = ntohl(uvldb-&gt;serverFlags[i]);</div><div class='del'>-		if (!(tmp &amp; AFS_VLSF_DONTUSE) &amp;&amp;</div><div class='del'>-		    (tmp &amp; AFS_VLSF_NEWREPSITE))</div><div class='del'>-			new_only = true;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	vlflags = ntohl(uvldb-&gt;flags);</div><div class='ctx'> 	for (i = 0; i &lt; nr_servers; i++) {</div><div class='ctx'> 		struct afs_uuid__xdr *xdr;</div><div class='ctx'> 		struct afs_uuid *uuid;</div><div class='add'>+		u32 tmp = ntohl(uvldb-&gt;serverFlags[i]);</div><div class='ctx'> 		int j;</div><div class='ctx'> 		int n = entry-&gt;nr_servers;</div><div class='ctx'> </div><div class='del'>-		tmp = ntohl(uvldb-&gt;serverFlags[i]);</div><div class='del'>-		if (tmp &amp; AFS_VLSF_DONTUSE ||</div><div class='del'>-		    (new_only &amp;&amp; !(tmp &amp; AFS_VLSF_NEWREPSITE)))</div><div class='del'>-			continue;</div><div class='ctx'> 		if (tmp &amp; AFS_VLSF_RWVOL) {</div><div class='ctx'> 			entry-&gt;fs_mask[n] |= AFS_VOL_VTM_RW;</div><div class='ctx'> 			if (vlflags &amp; AFS_VLF_BACKEXISTS)</div><div class='hunk'>@@ -82,6 +68,7 @@ static int afs_deliver_vl_get_entry_by_name_u(struct afs_call *call)</div><div class='ctx'> 		for (j = 0; j &lt; 6; j++)</div><div class='ctx'> 			uuid-&gt;node[j] = (u8)ntohl(xdr-&gt;node[j]);</div><div class='ctx'> </div><div class='add'>+		entry-&gt;vlsf_flags[n] = tmp;</div><div class='ctx'> 		entry-&gt;addr_version[n] = ntohl(uvldb-&gt;serverUnique[i]);</div><div class='ctx'> 		entry-&gt;nr_servers++;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -106,12 +93,6 @@ static int afs_deliver_vl_get_entry_by_name_u(struct afs_call *call)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void afs_destroy_vl_get_entry_by_name_u(struct afs_call *call)</div><div class='del'>-{</div><div class='del'>-	kfree(call-&gt;ret_vldb);</div><div class='del'>-	afs_flat_call_destructor(call);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * VL.GetEntryByNameU operation type.</div><div class='ctx'>  */</div><div class='hunk'>@@ -119,7 +100,7 @@ static const struct afs_call_type afs_RXVLGetEntryByNameU = {</div><div class='ctx'> 	.name		= "VL.GetEntryByNameU",</div><div class='ctx'> 	.op		= afs_VL_GetEntryByNameU,</div><div class='ctx'> 	.deliver	= afs_deliver_vl_get_entry_by_name_u,</div><div class='del'>-	.destructor	= afs_destroy_vl_get_entry_by_name_u,</div><div class='add'>+	.destructor	= afs_flat_call_destructor,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -155,6 +136,8 @@ struct afs_vldb_entry *afs_vl_get_entry_by_name_u(struct afs_vl_cursor *vc,</div><div class='ctx'> 	call-&gt;key = vc-&gt;key;</div><div class='ctx'> 	call-&gt;ret_vldb = entry;</div><div class='ctx'> 	call-&gt;max_lifespan = AFS_VL_MAX_LIFESPAN;</div><div class='add'>+	call-&gt;peer = rxrpc_kernel_get_peer(vc-&gt;alist-&gt;addrs[vc-&gt;addr_index].peer);</div><div class='add'>+	call-&gt;service_id = vc-&gt;server-&gt;service_id;</div><div class='ctx'> </div><div class='ctx'> 	/* Marshall the parameters */</div><div class='ctx'> 	bp = call-&gt;request;</div><div class='hunk'>@@ -165,8 +148,17 @@ struct afs_vldb_entry *afs_vl_get_entry_by_name_u(struct afs_vl_cursor *vc,</div><div class='ctx'> 		memset((void *)bp + volnamesz, 0, padsz);</div><div class='ctx'> </div><div class='ctx'> 	trace_afs_make_vl_call(call);</div><div class='del'>-	afs_make_call(&amp;vc-&gt;ac, call, GFP_KERNEL);</div><div class='del'>-	return (struct afs_vldb_entry *)afs_wait_for_call_to_complete(call, &amp;vc-&gt;ac);</div><div class='add'>+	afs_make_call(call, GFP_KERNEL);</div><div class='add'>+	afs_wait_for_call_to_complete(call);</div><div class='add'>+	vc-&gt;call_abort_code	= call-&gt;abort_code;</div><div class='add'>+	vc-&gt;call_error		= call-&gt;error;</div><div class='add'>+	vc-&gt;call_responded	= call-&gt;responded;</div><div class='add'>+	afs_put_call(call);</div><div class='add'>+	if (vc-&gt;call_error) {</div><div class='add'>+		kfree(entry);</div><div class='add'>+		return ERR_PTR(vc-&gt;call_error);</div><div class='add'>+	}</div><div class='add'>+	return entry;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -208,7 +200,7 @@ static int afs_deliver_vl_get_addrs_u(struct afs_call *call)</div><div class='ctx'> 		count		= ntohl(*bp);</div><div class='ctx'> </div><div class='ctx'> 		nentries = min(nentries, count);</div><div class='del'>-		alist = afs_alloc_addrlist(nentries, FS_SERVICE, AFS_FS_PORT);</div><div class='add'>+		alist = afs_alloc_addrlist(nentries);</div><div class='ctx'> 		if (!alist)</div><div class='ctx'> 			return -ENOMEM;</div><div class='ctx'> 		alist-&gt;version = uniquifier;</div><div class='hunk'>@@ -230,9 +222,13 @@ static int afs_deliver_vl_get_addrs_u(struct afs_call *call)</div><div class='ctx'> 		alist = call-&gt;ret_alist;</div><div class='ctx'> 		bp = call-&gt;buffer;</div><div class='ctx'> 		count = min(call-&gt;count, 4U);</div><div class='del'>-		for (i = 0; i &lt; count; i++)</div><div class='del'>-			if (alist-&gt;nr_addrs &lt; call-&gt;count2)</div><div class='del'>-				afs_merge_fs_addr4(alist, *bp++, AFS_FS_PORT);</div><div class='add'>+		for (i = 0; i &lt; count; i++) {</div><div class='add'>+			if (alist-&gt;nr_addrs &lt; call-&gt;count2) {</div><div class='add'>+				ret = afs_merge_fs_addr4(call-&gt;net, alist, *bp++, AFS_FS_PORT);</div><div class='add'>+				if (ret &lt; 0)</div><div class='add'>+					return ret;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		call-&gt;count -= count;</div><div class='ctx'> 		if (call-&gt;count &gt; 0)</div><div class='hunk'>@@ -245,12 +241,6 @@ static int afs_deliver_vl_get_addrs_u(struct afs_call *call)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void afs_vl_get_addrs_u_destructor(struct afs_call *call)</div><div class='del'>-{</div><div class='del'>-	afs_put_addrlist(call-&gt;ret_alist);</div><div class='del'>-	return afs_flat_call_destructor(call);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * VL.GetAddrsU operation type.</div><div class='ctx'>  */</div><div class='hunk'>@@ -258,7 +248,7 @@ static const struct afs_call_type afs_RXVLGetAddrsU = {</div><div class='ctx'> 	.name		= "VL.GetAddrsU",</div><div class='ctx'> 	.op		= afs_VL_GetAddrsU,</div><div class='ctx'> 	.deliver	= afs_deliver_vl_get_addrs_u,</div><div class='del'>-	.destructor	= afs_vl_get_addrs_u_destructor,</div><div class='add'>+	.destructor	= afs_flat_call_destructor,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -269,6 +259,7 @@ struct afs_addr_list *afs_vl_get_addrs_u(struct afs_vl_cursor *vc,</div><div class='ctx'> 					 const uuid_t *uuid)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_ListAddrByAttributes__xdr *r;</div><div class='add'>+	struct afs_addr_list *alist;</div><div class='ctx'> 	const struct afs_uuid *u = (const struct afs_uuid *)uuid;</div><div class='ctx'> 	struct afs_call *call;</div><div class='ctx'> 	struct afs_net *net = vc-&gt;cell-&gt;net;</div><div class='hunk'>@@ -286,6 +277,8 @@ struct afs_addr_list *afs_vl_get_addrs_u(struct afs_vl_cursor *vc,</div><div class='ctx'> 	call-&gt;key = vc-&gt;key;</div><div class='ctx'> 	call-&gt;ret_alist = NULL;</div><div class='ctx'> 	call-&gt;max_lifespan = AFS_VL_MAX_LIFESPAN;</div><div class='add'>+	call-&gt;peer = rxrpc_kernel_get_peer(vc-&gt;alist-&gt;addrs[vc-&gt;addr_index].peer);</div><div class='add'>+	call-&gt;service_id = vc-&gt;server-&gt;service_id;</div><div class='ctx'> </div><div class='ctx'> 	/* Marshall the parameters */</div><div class='ctx'> 	bp = call-&gt;request;</div><div class='hunk'>@@ -304,8 +297,18 @@ struct afs_addr_list *afs_vl_get_addrs_u(struct afs_vl_cursor *vc,</div><div class='ctx'> 		r-&gt;uuid.node[i] = htonl(u-&gt;node[i]);</div><div class='ctx'> </div><div class='ctx'> 	trace_afs_make_vl_call(call);</div><div class='del'>-	afs_make_call(&amp;vc-&gt;ac, call, GFP_KERNEL);</div><div class='del'>-	return (struct afs_addr_list *)afs_wait_for_call_to_complete(call, &amp;vc-&gt;ac);</div><div class='add'>+	afs_make_call(call, GFP_KERNEL);</div><div class='add'>+	afs_wait_for_call_to_complete(call);</div><div class='add'>+	vc-&gt;call_abort_code	= call-&gt;abort_code;</div><div class='add'>+	vc-&gt;call_error		= call-&gt;error;</div><div class='add'>+	vc-&gt;call_responded	= call-&gt;responded;</div><div class='add'>+	alist			= call-&gt;ret_alist;</div><div class='add'>+	afs_put_call(call);</div><div class='add'>+	if (vc-&gt;call_error) {</div><div class='add'>+		afs_put_addrlist(alist, afs_alist_trace_put_getaddru);</div><div class='add'>+		return ERR_PTR(vc-&gt;call_error);</div><div class='add'>+	}</div><div class='add'>+	return alist;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -355,6 +358,7 @@ static int afs_deliver_vl_get_capabilities(struct afs_call *call)</div><div class='ctx'> </div><div class='ctx'> static void afs_destroy_vl_get_capabilities(struct afs_call *call)</div><div class='ctx'> {</div><div class='add'>+	afs_put_addrlist(call-&gt;vl_probe, afs_alist_trace_put_vlgetcaps);</div><div class='ctx'> 	afs_put_vlserver(call-&gt;net, call-&gt;vlserver);</div><div class='ctx'> 	afs_flat_call_destructor(call);</div><div class='ctx'> }</div><div class='hunk'>@@ -366,6 +370,7 @@ static const struct afs_call_type afs_RXVLGetCapabilities = {</div><div class='ctx'> 	.name		= "VL.GetCapabilities",</div><div class='ctx'> 	.op		= afs_VL_GetCapabilities,</div><div class='ctx'> 	.deliver	= afs_deliver_vl_get_capabilities,</div><div class='add'>+	.immediate_cancel = afs_vlserver_probe_result,</div><div class='ctx'> 	.done		= afs_vlserver_probe_result,</div><div class='ctx'> 	.destructor	= afs_destroy_vl_get_capabilities,</div><div class='ctx'> };</div><div class='hunk'>@@ -378,7 +383,8 @@ static const struct afs_call_type afs_RXVLGetCapabilities = {</div><div class='ctx'>  * other end supports.</div><div class='ctx'>  */</div><div class='ctx'> struct afs_call *afs_vl_get_capabilities(struct afs_net *net,</div><div class='del'>-					 struct afs_addr_cursor *ac,</div><div class='add'>+					 struct afs_addr_list *alist,</div><div class='add'>+					 unsigned int addr_index,</div><div class='ctx'> 					 struct key *key,</div><div class='ctx'> 					 struct afs_vlserver *server,</div><div class='ctx'> 					 unsigned int server_index)</div><div class='hunk'>@@ -395,6 +401,10 @@ struct afs_call *afs_vl_get_capabilities(struct afs_net *net,</div><div class='ctx'> 	call-&gt;key = key;</div><div class='ctx'> 	call-&gt;vlserver = afs_get_vlserver(server);</div><div class='ctx'> 	call-&gt;server_index = server_index;</div><div class='add'>+	call-&gt;peer = rxrpc_kernel_get_peer(alist-&gt;addrs[addr_index].peer);</div><div class='add'>+	call-&gt;vl_probe = afs_get_addrlist(alist, afs_alist_trace_get_vlgetcaps);</div><div class='add'>+	call-&gt;probe_index = addr_index;</div><div class='add'>+	call-&gt;service_id = server-&gt;service_id;</div><div class='ctx'> 	call-&gt;upgrade = true;</div><div class='ctx'> 	call-&gt;async = true;</div><div class='ctx'> 	call-&gt;max_lifespan = AFS_PROBE_MAX_LIFESPAN;</div><div class='hunk'>@@ -405,7 +415,7 @@ struct afs_call *afs_vl_get_capabilities(struct afs_net *net,</div><div class='ctx'> </div><div class='ctx'> 	/* Can't take a ref on server */</div><div class='ctx'> 	trace_afs_make_vl_call(call);</div><div class='del'>-	afs_make_call(ac, call, GFP_KERNEL);</div><div class='add'>+	afs_make_call(call, GFP_KERNEL);</div><div class='ctx'> 	return call;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -450,7 +460,7 @@ static int afs_deliver_yfsvl_get_endpoints(struct afs_call *call)</div><div class='ctx'> 		if (call-&gt;count &gt; YFS_MAXENDPOINTS)</div><div class='ctx'> 			return afs_protocol_error(call, afs_eproto_yvl_fsendpt_num);</div><div class='ctx'> </div><div class='del'>-		alist = afs_alloc_addrlist(call-&gt;count, FS_SERVICE, AFS_FS_PORT);</div><div class='add'>+		alist = afs_alloc_addrlist(call-&gt;count);</div><div class='ctx'> 		if (!alist)</div><div class='ctx'> 			return -ENOMEM;</div><div class='ctx'> 		alist-&gt;version = uniquifier;</div><div class='hunk'>@@ -488,14 +498,18 @@ static int afs_deliver_yfsvl_get_endpoints(struct afs_call *call)</div><div class='ctx'> 			if (ntohl(bp[0]) != sizeof(__be32) * 2)</div><div class='ctx'> 				return afs_protocol_error(</div><div class='ctx'> 					call, afs_eproto_yvl_fsendpt4_len);</div><div class='del'>-			afs_merge_fs_addr4(alist, bp[1], ntohl(bp[2]));</div><div class='add'>+			ret = afs_merge_fs_addr4(call-&gt;net, alist, bp[1], ntohl(bp[2]));</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				return ret;</div><div class='ctx'> 			bp += 3;</div><div class='ctx'> 			break;</div><div class='ctx'> 		case YFS_ENDPOINT_IPV6:</div><div class='ctx'> 			if (ntohl(bp[0]) != sizeof(__be32) * 5)</div><div class='ctx'> 				return afs_protocol_error(</div><div class='ctx'> 					call, afs_eproto_yvl_fsendpt6_len);</div><div class='del'>-			afs_merge_fs_addr6(alist, bp + 1, ntohl(bp[5]));</div><div class='add'>+			ret = afs_merge_fs_addr6(call-&gt;net, alist, bp + 1, ntohl(bp[5]));</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				return ret;</div><div class='ctx'> 			bp += 6;</div><div class='ctx'> 			break;</div><div class='ctx'> 		default:</div><div class='hunk'>@@ -610,7 +624,7 @@ static const struct afs_call_type afs_YFSVLGetEndpoints = {</div><div class='ctx'> 	.name		= "YFSVL.GetEndpoints",</div><div class='ctx'> 	.op		= afs_YFSVL_GetEndpoints,</div><div class='ctx'> 	.deliver	= afs_deliver_yfsvl_get_endpoints,</div><div class='del'>-	.destructor	= afs_vl_get_addrs_u_destructor,</div><div class='add'>+	.destructor	= afs_flat_call_destructor,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -620,6 +634,7 @@ static const struct afs_call_type afs_YFSVLGetEndpoints = {</div><div class='ctx'> struct afs_addr_list *afs_yfsvl_get_endpoints(struct afs_vl_cursor *vc,</div><div class='ctx'> 					      const uuid_t *uuid)</div><div class='ctx'> {</div><div class='add'>+	struct afs_addr_list *alist;</div><div class='ctx'> 	struct afs_call *call;</div><div class='ctx'> 	struct afs_net *net = vc-&gt;cell-&gt;net;</div><div class='ctx'> 	__be32 *bp;</div><div class='hunk'>@@ -635,6 +650,8 @@ struct afs_addr_list *afs_yfsvl_get_endpoints(struct afs_vl_cursor *vc,</div><div class='ctx'> 	call-&gt;key = vc-&gt;key;</div><div class='ctx'> 	call-&gt;ret_alist = NULL;</div><div class='ctx'> 	call-&gt;max_lifespan = AFS_VL_MAX_LIFESPAN;</div><div class='add'>+	call-&gt;peer = rxrpc_kernel_get_peer(vc-&gt;alist-&gt;addrs[vc-&gt;addr_index].peer);</div><div class='add'>+	call-&gt;service_id = vc-&gt;server-&gt;service_id;</div><div class='ctx'> </div><div class='ctx'> 	/* Marshall the parameters */</div><div class='ctx'> 	bp = call-&gt;request;</div><div class='hunk'>@@ -643,8 +660,18 @@ struct afs_addr_list *afs_yfsvl_get_endpoints(struct afs_vl_cursor *vc,</div><div class='ctx'> 	memcpy(bp, uuid, sizeof(*uuid)); /* Type opr_uuid */</div><div class='ctx'> </div><div class='ctx'> 	trace_afs_make_vl_call(call);</div><div class='del'>-	afs_make_call(&amp;vc-&gt;ac, call, GFP_KERNEL);</div><div class='del'>-	return (struct afs_addr_list *)afs_wait_for_call_to_complete(call, &amp;vc-&gt;ac);</div><div class='add'>+	afs_make_call(call, GFP_KERNEL);</div><div class='add'>+	afs_wait_for_call_to_complete(call);</div><div class='add'>+	vc-&gt;call_abort_code	= call-&gt;abort_code;</div><div class='add'>+	vc-&gt;call_error		= call-&gt;error;</div><div class='add'>+	vc-&gt;call_responded	= call-&gt;responded;</div><div class='add'>+	alist			= call-&gt;ret_alist;</div><div class='add'>+	afs_put_call(call);</div><div class='add'>+	if (vc-&gt;call_error) {</div><div class='add'>+		afs_put_addrlist(alist, afs_alist_trace_put_getaddru);</div><div class='add'>+		return ERR_PTR(vc-&gt;call_error);</div><div class='add'>+	}</div><div class='add'>+	return alist;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -671,7 +698,7 @@ static int afs_deliver_yfsvl_get_cell_name(struct afs_call *call)</div><div class='ctx'> 			return ret;</div><div class='ctx'> </div><div class='ctx'> 		namesz = ntohl(call-&gt;tmp);</div><div class='del'>-		if (namesz &gt; AFS_MAXCELLNAME)</div><div class='add'>+		if (namesz &gt; YFS_VL_MAXCELLNAME)</div><div class='ctx'> 			return afs_protocol_error(call, afs_eproto_cellname_len);</div><div class='ctx'> 		paddedsz = (namesz + 3) &amp; ~3;</div><div class='ctx'> 		call-&gt;count = namesz;</div><div class='hunk'>@@ -709,12 +736,6 @@ static int afs_deliver_yfsvl_get_cell_name(struct afs_call *call)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void afs_destroy_yfsvl_get_cell_name(struct afs_call *call)</div><div class='del'>-{</div><div class='del'>-	kfree(call-&gt;ret_str);</div><div class='del'>-	afs_flat_call_destructor(call);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * VL.GetCapabilities operation type</div><div class='ctx'>  */</div><div class='hunk'>@@ -722,7 +743,7 @@ static const struct afs_call_type afs_YFSVLGetCellName = {</div><div class='ctx'> 	.name		= "YFSVL.GetCellName",</div><div class='ctx'> 	.op		= afs_YFSVL_GetCellName,</div><div class='ctx'> 	.deliver	= afs_deliver_yfsvl_get_cell_name,</div><div class='del'>-	.destructor	= afs_destroy_yfsvl_get_cell_name,</div><div class='add'>+	.destructor	= afs_flat_call_destructor,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -737,6 +758,7 @@ char *afs_yfsvl_get_cell_name(struct afs_vl_cursor *vc)</div><div class='ctx'> 	struct afs_call *call;</div><div class='ctx'> 	struct afs_net *net = vc-&gt;cell-&gt;net;</div><div class='ctx'> 	__be32 *bp;</div><div class='add'>+	char *cellname;</div><div class='ctx'> </div><div class='ctx'> 	_enter("");</div><div class='ctx'> </div><div class='hunk'>@@ -747,6 +769,8 @@ char *afs_yfsvl_get_cell_name(struct afs_vl_cursor *vc)</div><div class='ctx'> 	call-&gt;key = vc-&gt;key;</div><div class='ctx'> 	call-&gt;ret_str = NULL;</div><div class='ctx'> 	call-&gt;max_lifespan = AFS_VL_MAX_LIFESPAN;</div><div class='add'>+	call-&gt;peer = rxrpc_kernel_get_peer(vc-&gt;alist-&gt;addrs[vc-&gt;addr_index].peer);</div><div class='add'>+	call-&gt;service_id = vc-&gt;server-&gt;service_id;</div><div class='ctx'> </div><div class='ctx'> 	/* marshall the parameters */</div><div class='ctx'> 	bp = call-&gt;request;</div><div class='hunk'>@@ -754,6 +778,16 @@ char *afs_yfsvl_get_cell_name(struct afs_vl_cursor *vc)</div><div class='ctx'> </div><div class='ctx'> 	/* Can't take a ref on server */</div><div class='ctx'> 	trace_afs_make_vl_call(call);</div><div class='del'>-	afs_make_call(&amp;vc-&gt;ac, call, GFP_KERNEL);</div><div class='del'>-	return (char *)afs_wait_for_call_to_complete(call, &amp;vc-&gt;ac);</div><div class='add'>+	afs_make_call(call, GFP_KERNEL);</div><div class='add'>+	afs_wait_for_call_to_complete(call);</div><div class='add'>+	vc-&gt;call_abort_code	= call-&gt;abort_code;</div><div class='add'>+	vc-&gt;call_error		= call-&gt;error;</div><div class='add'>+	vc-&gt;call_responded	= call-&gt;responded;</div><div class='add'>+	cellname		= call-&gt;ret_str;</div><div class='add'>+	afs_put_call(call);</div><div class='add'>+	if (vc-&gt;call_error) {</div><div class='add'>+		kfree(cellname);</div><div class='add'>+		return ERR_PTR(vc-&gt;call_error);</div><div class='add'>+	}</div><div class='add'>+	return cellname;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/afs/volume.c b/fs/afs/volume.c<br/>index f84194b791d3..0efff3d25133 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/volume.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/volume.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/volume.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/volume.c</a></div><div class='hunk'>@@ -9,8 +9,10 @@</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> </div><div class='del'>-unsigned __read_mostly afs_volume_gc_delay = 10;</div><div class='del'>-unsigned __read_mostly afs_volume_record_life = 60 * 60;</div><div class='add'>+static unsigned __read_mostly afs_volume_record_life = 60 * 60;</div><div class='add'>+static atomic_t afs_volume_debug_id;</div><div class='add'>+</div><div class='add'>+static void afs_destroy_volume(struct work_struct *work);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Insert a volume into a cell.  If there's an existing volume record, that is</div><div class='hunk'>@@ -33,8 +35,13 @@ static struct afs_volume *afs_insert_volume_into_cell(struct afs_cell *cell,</div><div class='ctx'> 		} else if (p-&gt;vid &gt; volume-&gt;vid) {</div><div class='ctx'> 			pp = &amp;(*pp)-&gt;rb_right;</div><div class='ctx'> 		} else {</div><div class='del'>-			volume = afs_get_volume(p, afs_volume_trace_get_cell_insert);</div><div class='del'>-			goto found;</div><div class='add'>+			if (afs_try_get_volume(p, afs_volume_trace_get_cell_insert)) {</div><div class='add'>+				volume = p;</div><div class='add'>+				goto found;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			set_bit(AFS_VOLUME_RM_TREE, &amp;volume-&gt;flags);</div><div class='add'>+			rb_replace_node_rcu(&amp;p-&gt;cell_node, &amp;volume-&gt;cell_node, &amp;cell-&gt;volumes);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -53,11 +60,12 @@ static void afs_remove_volume_from_cell(struct afs_volume *volume)</div><div class='ctx'> 	struct afs_cell *cell = volume-&gt;cell;</div><div class='ctx'> </div><div class='ctx'> 	if (!hlist_unhashed(&amp;volume-&gt;proc_link)) {</div><div class='del'>-		trace_afs_volume(volume-&gt;vid, atomic_read(&amp;volume-&gt;usage),</div><div class='add'>+		trace_afs_volume(volume-&gt;debug_id, volume-&gt;vid, refcount_read(&amp;volume-&gt;ref),</div><div class='ctx'> 				 afs_volume_trace_remove);</div><div class='ctx'> 		write_seqlock(&amp;cell-&gt;volume_lock);</div><div class='ctx'> 		hlist_del_rcu(&amp;volume-&gt;proc_link);</div><div class='del'>-		rb_erase(&amp;volume-&gt;cell_node, &amp;cell-&gt;volumes);</div><div class='add'>+		if (!test_and_set_bit(AFS_VOLUME_RM_TREE, &amp;volume-&gt;flags))</div><div class='add'>+			rb_erase(&amp;volume-&gt;cell_node, &amp;cell-&gt;volumes);</div><div class='ctx'> 		write_sequnlock(&amp;cell-&gt;volume_lock);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -67,42 +75,49 @@ static void afs_remove_volume_from_cell(struct afs_volume *volume)</div><div class='ctx'>  */</div><div class='ctx'> static struct afs_volume *afs_alloc_volume(struct afs_fs_context *params,</div><div class='ctx'> 					   struct afs_vldb_entry *vldb,</div><div class='del'>-					   unsigned long type_mask)</div><div class='add'>+					   struct afs_server_list **_slist)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_server_list *slist;</div><div class='ctx'> 	struct afs_volume *volume;</div><div class='del'>-	int ret = -ENOMEM, nr_servers = 0, i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; vldb-&gt;nr_servers; i++)</div><div class='del'>-		if (vldb-&gt;fs_mask[i] &amp; type_mask)</div><div class='del'>-			nr_servers++;</div><div class='add'>+	int ret = -ENOMEM, i;</div><div class='ctx'> </div><div class='ctx'> 	volume = kzalloc(sizeof(struct afs_volume), GFP_KERNEL);</div><div class='ctx'> 	if (!volume)</div><div class='ctx'> 		goto error_0;</div><div class='ctx'> </div><div class='add'>+	volume-&gt;debug_id	= atomic_inc_return(&amp;afs_volume_debug_id);</div><div class='ctx'> 	volume-&gt;vid		= vldb-&gt;vid[params-&gt;type];</div><div class='ctx'> 	volume-&gt;update_at	= ktime_get_real_seconds() + afs_volume_record_life;</div><div class='ctx'> 	volume-&gt;cell		= afs_get_cell(params-&gt;cell, afs_cell_trace_get_vol);</div><div class='ctx'> 	volume-&gt;type		= params-&gt;type;</div><div class='ctx'> 	volume-&gt;type_force	= params-&gt;force;</div><div class='ctx'> 	volume-&gt;name_len	= vldb-&gt;name_len;</div><div class='add'>+	volume-&gt;creation_time	= TIME64_MIN;</div><div class='add'>+	volume-&gt;update_time	= TIME64_MIN;</div><div class='ctx'> </div><div class='del'>-	atomic_set(&amp;volume-&gt;usage, 1);</div><div class='add'>+	refcount_set(&amp;volume-&gt;ref, 1);</div><div class='ctx'> 	INIT_HLIST_NODE(&amp;volume-&gt;proc_link);</div><div class='add'>+	INIT_WORK(&amp;volume-&gt;destructor, afs_destroy_volume);</div><div class='ctx'> 	rwlock_init(&amp;volume-&gt;servers_lock);</div><div class='add'>+	mutex_init(&amp;volume-&gt;volsync_lock);</div><div class='add'>+	mutex_init(&amp;volume-&gt;cb_check_lock);</div><div class='ctx'> 	rwlock_init(&amp;volume-&gt;cb_v_break_lock);</div><div class='add'>+	INIT_LIST_HEAD(&amp;volume-&gt;open_mmaps);</div><div class='add'>+	init_rwsem(&amp;volume-&gt;open_mmaps_lock);</div><div class='ctx'> 	memcpy(volume-&gt;name, vldb-&gt;name, vldb-&gt;name_len + 1);</div><div class='ctx'> </div><div class='del'>-	slist = afs_alloc_server_list(params-&gt;cell, params-&gt;key, vldb, type_mask);</div><div class='add'>+	for (i = 0; i &lt; AFS_MAXTYPES; i++)</div><div class='add'>+		volume-&gt;vids[i] = vldb-&gt;vid[i];</div><div class='add'>+</div><div class='add'>+	slist = afs_alloc_server_list(volume, params-&gt;key, vldb);</div><div class='ctx'> 	if (IS_ERR(slist)) {</div><div class='ctx'> 		ret = PTR_ERR(slist);</div><div class='ctx'> 		goto error_1;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	refcount_set(&amp;slist-&gt;usage, 1);</div><div class='add'>+	*_slist = slist;</div><div class='ctx'> 	rcu_assign_pointer(volume-&gt;servers, slist);</div><div class='del'>-	trace_afs_volume(volume-&gt;vid, 1, afs_volume_trace_alloc);</div><div class='add'>+	trace_afs_volume(volume-&gt;debug_id, volume-&gt;vid, 1, afs_volume_trace_alloc);</div><div class='ctx'> 	return volume;</div><div class='ctx'> </div><div class='ctx'> error_1:</div><div class='hunk'>@@ -116,18 +131,20 @@ error_0:</div><div class='ctx'>  * Look up or allocate a volume record.</div><div class='ctx'>  */</div><div class='ctx'> static struct afs_volume *afs_lookup_volume(struct afs_fs_context *params,</div><div class='del'>-					    struct afs_vldb_entry *vldb,</div><div class='del'>-					    unsigned long type_mask)</div><div class='add'>+					    struct afs_vldb_entry *vldb)</div><div class='ctx'> {</div><div class='add'>+	struct afs_server_list *slist;</div><div class='ctx'> 	struct afs_volume *candidate, *volume;</div><div class='ctx'> </div><div class='del'>-	candidate = afs_alloc_volume(params, vldb, type_mask);</div><div class='add'>+	candidate = afs_alloc_volume(params, vldb, &amp;slist);</div><div class='ctx'> 	if (IS_ERR(candidate))</div><div class='ctx'> 		return candidate;</div><div class='ctx'> </div><div class='ctx'> 	volume = afs_insert_volume_into_cell(params-&gt;cell, candidate);</div><div class='del'>-	if (volume != candidate)</div><div class='del'>-		afs_put_volume(params-&gt;net, candidate, afs_volume_trace_put_cell_dup);</div><div class='add'>+	if (volume == candidate)</div><div class='add'>+		afs_attach_volume_to_servers(volume, slist);</div><div class='add'>+	else</div><div class='add'>+		afs_put_volume(candidate, afs_volume_trace_put_cell_dup);</div><div class='ctx'> 	return volume;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -207,8 +224,7 @@ struct afs_volume *afs_create_volume(struct afs_fs_context *params)</div><div class='ctx'> 		goto error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	type_mask = 1UL &lt;&lt; params-&gt;type;</div><div class='del'>-	volume = afs_lookup_volume(params, vldb, type_mask);</div><div class='add'>+	volume = afs_lookup_volume(params, vldb);</div><div class='ctx'> </div><div class='ctx'> error:</div><div class='ctx'> 	kfree(vldb);</div><div class='hunk'>@@ -218,18 +234,22 @@ error:</div><div class='ctx'> /*</div><div class='ctx'>  * Destroy a volume record</div><div class='ctx'>  */</div><div class='del'>-static void afs_destroy_volume(struct afs_net *net, struct afs_volume *volume)</div><div class='add'>+static void afs_destroy_volume(struct work_struct *work)</div><div class='ctx'> {</div><div class='add'>+	struct afs_volume *volume = container_of(work, struct afs_volume, destructor);</div><div class='add'>+	struct afs_server_list *slist = rcu_access_pointer(volume-&gt;servers);</div><div class='add'>+</div><div class='ctx'> 	_enter("%p", volume);</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_AFS_FSCACHE</div><div class='ctx'> 	ASSERTCMP(volume-&gt;cache, ==, NULL);</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='add'>+	afs_detach_volume_from_servers(volume, slist);</div><div class='ctx'> 	afs_remove_volume_from_cell(volume);</div><div class='del'>-	afs_put_serverlist(net, rcu_access_pointer(volume-&gt;servers));</div><div class='add'>+	afs_put_serverlist(volume-&gt;cell-&gt;net, slist);</div><div class='ctx'> 	afs_put_cell(volume-&gt;cell, afs_cell_trace_put_vol);</div><div class='del'>-	trace_afs_volume(volume-&gt;vid, atomic_read(&amp;volume-&gt;usage),</div><div class='add'>+	trace_afs_volume(volume-&gt;debug_id, volume-&gt;vid, refcount_read(&amp;volume-&gt;ref),</div><div class='ctx'> 			 afs_volume_trace_free);</div><div class='ctx'> 	kfree_rcu(volume, rcu);</div><div class='ctx'> </div><div class='hunk'>@@ -237,14 +257,30 @@ static void afs_destroy_volume(struct afs_net *net, struct afs_volume *volume)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * Try to get a reference on a volume record.</div><div class='add'>+ */</div><div class='add'>+bool afs_try_get_volume(struct afs_volume *volume, enum afs_volume_trace reason)</div><div class='add'>+{</div><div class='add'>+	int r;</div><div class='add'>+</div><div class='add'>+	if (__refcount_inc_not_zero(&amp;volume-&gt;ref, &amp;r)) {</div><div class='add'>+		trace_afs_volume(volume-&gt;debug_id, volume-&gt;vid, r + 1, reason);</div><div class='add'>+		return true;</div><div class='add'>+	}</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * Get a reference on a volume record.</div><div class='ctx'>  */</div><div class='ctx'> struct afs_volume *afs_get_volume(struct afs_volume *volume,</div><div class='ctx'> 				  enum afs_volume_trace reason)</div><div class='ctx'> {</div><div class='ctx'> 	if (volume) {</div><div class='del'>-		int u = atomic_inc_return(&amp;volume-&gt;usage);</div><div class='del'>-		trace_afs_volume(volume-&gt;vid, u, reason);</div><div class='add'>+		int r;</div><div class='add'>+</div><div class='add'>+		__refcount_inc(&amp;volume-&gt;ref, &amp;r);</div><div class='add'>+		trace_afs_volume(volume-&gt;debug_id, volume-&gt;vid, r + 1, reason);</div><div class='ctx'> 	}</div><div class='ctx'> 	return volume;</div><div class='ctx'> }</div><div class='hunk'>@@ -253,30 +289,48 @@ struct afs_volume *afs_get_volume(struct afs_volume *volume,</div><div class='ctx'> /*</div><div class='ctx'>  * Drop a reference on a volume record.</div><div class='ctx'>  */</div><div class='del'>-void afs_put_volume(struct afs_net *net, struct afs_volume *volume,</div><div class='del'>-		    enum afs_volume_trace reason)</div><div class='add'>+void afs_put_volume(struct afs_volume *volume, enum afs_volume_trace reason)</div><div class='ctx'> {</div><div class='ctx'> 	if (volume) {</div><div class='add'>+		unsigned int debug_id = volume-&gt;debug_id;</div><div class='ctx'> 		afs_volid_t vid = volume-&gt;vid;</div><div class='del'>-		int u = atomic_dec_return(&amp;volume-&gt;usage);</div><div class='del'>-		trace_afs_volume(vid, u, reason);</div><div class='del'>-		if (u == 0)</div><div class='del'>-			afs_destroy_volume(net, volume);</div><div class='add'>+		bool zero;</div><div class='add'>+		int r;</div><div class='add'>+</div><div class='add'>+		zero = __refcount_dec_and_test(&amp;volume-&gt;ref, &amp;r);</div><div class='add'>+		trace_afs_volume(debug_id, vid, r - 1, reason);</div><div class='add'>+		if (zero)</div><div class='add'>+			schedule_work(&amp;volume-&gt;destructor);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Activate a volume.</div><div class='ctx'>  */</div><div class='del'>-void afs_activate_volume(struct afs_volume *volume)</div><div class='add'>+int afs_activate_volume(struct afs_volume *volume)</div><div class='ctx'> {</div><div class='ctx'> #ifdef CONFIG_AFS_FSCACHE</div><div class='del'>-	volume-&gt;cache = fscache_acquire_cookie(volume-&gt;cell-&gt;cache,</div><div class='del'>-					       &amp;afs_volume_cache_index_def,</div><div class='del'>-					       &amp;volume-&gt;vid, sizeof(volume-&gt;vid),</div><div class='del'>-					       NULL, 0,</div><div class='del'>-					       volume, 0, true);</div><div class='add'>+	struct fscache_volume *vcookie;</div><div class='add'>+	char *name;</div><div class='add'>+</div><div class='add'>+	name = kasprintf(GFP_KERNEL, "afs,%s,%llx",</div><div class='add'>+			 volume-&gt;cell-&gt;name, volume-&gt;vid);</div><div class='add'>+	if (!name)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	vcookie = fscache_acquire_volume(name, NULL, NULL, 0);</div><div class='add'>+	if (IS_ERR(vcookie)) {</div><div class='add'>+		if (vcookie != ERR_PTR(-EBUSY)) {</div><div class='add'>+			kfree(name);</div><div class='add'>+			return PTR_ERR(vcookie);</div><div class='add'>+		}</div><div class='add'>+		pr_err("AFS: Cache volume key already in use (%s)\n", name);</div><div class='add'>+		vcookie = NULL;</div><div class='add'>+	}</div><div class='add'>+	volume-&gt;cache = vcookie;</div><div class='add'>+	kfree(name);</div><div class='ctx'> #endif</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -287,7 +341,7 @@ void afs_deactivate_volume(struct afs_volume *volume)</div><div class='ctx'> 	_enter("%s", volume-&gt;name);</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_AFS_FSCACHE</div><div class='del'>-	fscache_relinquish_cookie(volume-&gt;cache, NULL,</div><div class='add'>+	fscache_relinquish_volume(volume-&gt;cache, NULL,</div><div class='ctx'> 				  test_bit(AFS_VOLUME_DELETED, &amp;volume-&gt;flags));</div><div class='ctx'> 	volume-&gt;cache = NULL;</div><div class='ctx'> #endif</div><div class='hunk'>@@ -302,7 +356,7 @@ static int afs_update_volume_status(struct afs_volume *volume, struct key *key)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_server_list *new, *old, *discard;</div><div class='ctx'> 	struct afs_vldb_entry *vldb;</div><div class='del'>-	char idbuf[16];</div><div class='add'>+	char idbuf[24];</div><div class='ctx'> 	int ret, idsz;</div><div class='ctx'> </div><div class='ctx'> 	_enter("");</div><div class='hunk'>@@ -310,7 +364,7 @@ static int afs_update_volume_status(struct afs_volume *volume, struct key *key)</div><div class='ctx'> 	/* We look up an ID by passing it as a decimal string in the</div><div class='ctx'> 	 * operation's name parameter.</div><div class='ctx'> 	 */</div><div class='del'>-	idsz = sprintf(idbuf, "%llu", volume-&gt;vid);</div><div class='add'>+	idsz = snprintf(idbuf, sizeof(idbuf), "%llu", volume-&gt;vid);</div><div class='ctx'> </div><div class='ctx'> 	vldb = afs_vl_lookup_vldb(volume-&gt;cell, key, idbuf, idsz);</div><div class='ctx'> 	if (IS_ERR(vldb)) {</div><div class='hunk'>@@ -327,8 +381,7 @@ static int afs_update_volume_status(struct afs_volume *volume, struct key *key)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* See if the volume's server list got updated. */</div><div class='del'>-	new = afs_alloc_server_list(volume-&gt;cell, key,</div><div class='del'>-				    vldb, (1 &lt;&lt; volume-&gt;type));</div><div class='add'>+	new = afs_alloc_server_list(volume, key, vldb);</div><div class='ctx'> 	if (IS_ERR(new)) {</div><div class='ctx'> 		ret = PTR_ERR(new);</div><div class='ctx'> 		goto error_vldb;</div><div class='hunk'>@@ -347,11 +400,17 @@ static int afs_update_volume_status(struct afs_volume *volume, struct key *key)</div><div class='ctx'> 		discard = old;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	volume-&gt;update_at = ktime_get_real_seconds() + afs_volume_record_life;</div><div class='add'>+	/* Check more often if replication is ongoing. */</div><div class='add'>+	if (new-&gt;ro_replicating)</div><div class='add'>+		volume-&gt;update_at = ktime_get_real_seconds() + 10 * 60;</div><div class='add'>+	else</div><div class='add'>+		volume-&gt;update_at = ktime_get_real_seconds() + afs_volume_record_life;</div><div class='ctx'> 	write_unlock(&amp;volume-&gt;servers_lock);</div><div class='del'>-	ret = 0;</div><div class='ctx'> </div><div class='add'>+	if (discard == old)</div><div class='add'>+		afs_reattach_volume_to_servers(volume, new, old);</div><div class='ctx'> 	afs_put_serverlist(volume-&gt;cell-&gt;net, discard);</div><div class='add'>+	ret = 0;</div><div class='ctx'> error_vldb:</div><div class='ctx'> 	kfree(vldb);</div><div class='ctx'> error:</div><div class='head'>diff --git a/fs/afs/write.c b/fs/afs/write.c<br/>index ca4909baf5e6..93ad86ff3345 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/write.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/write.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/write.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/write.c</a></div><div class='hunk'>@@ -12,306 +12,56 @@</div><div class='ctx'> #include &lt;linux/writeback.h&gt;</div><div class='ctx'> #include &lt;linux/pagevec.h&gt;</div><div class='ctx'> #include &lt;linux/netfs.h&gt;</div><div class='del'>-#include &lt;linux/fscache.h&gt;</div><div class='add'>+#include &lt;trace/events/netfs.h&gt;</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * mark a page as having been made dirty and thus needing writeback</div><div class='del'>- */</div><div class='del'>-int afs_set_page_dirty(struct page *page)</div><div class='del'>-{</div><div class='del'>-	_enter("");</div><div class='del'>-	return __set_page_dirty_nobuffers(page);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * prepare to perform part of a write to a page</div><div class='del'>- */</div><div class='del'>-int afs_write_begin(struct file *file, struct address_space *mapping,</div><div class='del'>-		    loff_t pos, unsigned len, unsigned flags,</div><div class='del'>-		    struct page **_page, void **fsdata)</div><div class='del'>-{</div><div class='del'>-	struct afs_vnode *vnode = AFS_FS_I(file_inode(file));</div><div class='del'>-	struct folio *folio;</div><div class='del'>-	unsigned long priv;</div><div class='del'>-	unsigned f, from;</div><div class='del'>-	unsigned t, to;</div><div class='del'>-	pgoff_t index;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	_enter("{%llx:%llu},%llx,%x",</div><div class='del'>-	       vnode-&gt;fid.vid, vnode-&gt;fid.vnode, pos, len);</div><div class='del'>-</div><div class='del'>-	/* Prefetch area to be written into the cache if we're caching this</div><div class='del'>-	 * file.  We need to do this before we get a lock on the page in case</div><div class='del'>-	 * there's more than one writer competing for the same cache block.</div><div class='del'>-	 */</div><div class='del'>-	ret = netfs_write_begin(file, mapping, pos, len, flags, &amp;folio, fsdata,</div><div class='del'>-				&amp;afs_req_ops, NULL);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	index = folio_index(folio);</div><div class='del'>-	from = pos - index * PAGE_SIZE;</div><div class='del'>-	to = from + len;</div><div class='del'>-</div><div class='del'>-try_again:</div><div class='del'>-	/* See if this page is already partially written in a way that we can</div><div class='del'>-	 * merge the new write with.</div><div class='del'>-	 */</div><div class='del'>-	if (folio_test_private(folio)) {</div><div class='del'>-		priv = (unsigned long)folio_get_private(folio);</div><div class='del'>-		f = afs_folio_dirty_from(folio, priv);</div><div class='del'>-		t = afs_folio_dirty_to(folio, priv);</div><div class='del'>-		ASSERTCMP(f, &lt;=, t);</div><div class='del'>-</div><div class='del'>-		if (folio_test_writeback(folio)) {</div><div class='del'>-			trace_afs_folio_dirty(vnode, tracepoint_string("alrdy"), folio);</div><div class='del'>-			goto flush_conflicting_write;</div><div class='del'>-		}</div><div class='del'>-		/* If the file is being filled locally, allow inter-write</div><div class='del'>-		 * spaces to be merged into writes.  If it's not, only write</div><div class='del'>-		 * back what the user gives us.</div><div class='del'>-		 */</div><div class='del'>-		if (!test_bit(AFS_VNODE_NEW_CONTENT, &amp;vnode-&gt;flags) &amp;&amp;</div><div class='del'>-		    (to &lt; f || from &gt; t))</div><div class='del'>-			goto flush_conflicting_write;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	*_page = &amp;folio-&gt;page;</div><div class='del'>-	_leave(" = 0");</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-	/* The previous write and this write aren't adjacent or overlapping, so</div><div class='del'>-	 * flush the page out.</div><div class='del'>-	 */</div><div class='del'>-flush_conflicting_write:</div><div class='del'>-	_debug("flush conflict");</div><div class='del'>-	ret = folio_write_one(folio);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto error;</div><div class='del'>-</div><div class='del'>-	ret = folio_lock_killable(folio);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto error;</div><div class='del'>-	goto try_again;</div><div class='del'>-</div><div class='del'>-error:</div><div class='del'>-	folio_put(folio);</div><div class='del'>-	_leave(" = %d", ret);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * finalise part of a write to a page</div><div class='del'>- */</div><div class='del'>-int afs_write_end(struct file *file, struct address_space *mapping,</div><div class='del'>-		  loff_t pos, unsigned len, unsigned copied,</div><div class='del'>-		  struct page *subpage, void *fsdata)</div><div class='del'>-{</div><div class='del'>-	struct folio *folio = page_folio(subpage);</div><div class='del'>-	struct afs_vnode *vnode = AFS_FS_I(file_inode(file));</div><div class='del'>-	unsigned long priv;</div><div class='del'>-	unsigned int f, from = offset_in_folio(folio, pos);</div><div class='del'>-	unsigned int t, to = from + copied;</div><div class='del'>-	loff_t i_size, maybe_i_size;</div><div class='del'>-</div><div class='del'>-	_enter("{%llx:%llu},{%lx}",</div><div class='del'>-	       vnode-&gt;fid.vid, vnode-&gt;fid.vnode, folio_index(folio));</div><div class='del'>-</div><div class='del'>-	if (!folio_test_uptodate(folio)) {</div><div class='del'>-		if (copied &lt; len) {</div><div class='del'>-			copied = 0;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		folio_mark_uptodate(folio);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (copied == 0)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	maybe_i_size = pos + copied;</div><div class='del'>-</div><div class='del'>-	i_size = i_size_read(&amp;vnode-&gt;vfs_inode);</div><div class='del'>-	if (maybe_i_size &gt; i_size) {</div><div class='del'>-		write_seqlock(&amp;vnode-&gt;cb_lock);</div><div class='del'>-		i_size = i_size_read(&amp;vnode-&gt;vfs_inode);</div><div class='del'>-		if (maybe_i_size &gt; i_size)</div><div class='del'>-			afs_set_i_size(vnode, maybe_i_size);</div><div class='del'>-		write_sequnlock(&amp;vnode-&gt;cb_lock);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (folio_test_private(folio)) {</div><div class='del'>-		priv = (unsigned long)folio_get_private(folio);</div><div class='del'>-		f = afs_folio_dirty_from(folio, priv);</div><div class='del'>-		t = afs_folio_dirty_to(folio, priv);</div><div class='del'>-		if (from &lt; f)</div><div class='del'>-			f = from;</div><div class='del'>-		if (to &gt; t)</div><div class='del'>-			t = to;</div><div class='del'>-		priv = afs_folio_dirty(folio, f, t);</div><div class='del'>-		folio_change_private(folio, (void *)priv);</div><div class='del'>-		trace_afs_folio_dirty(vnode, tracepoint_string("dirty+"), folio);</div><div class='del'>-	} else {</div><div class='del'>-		priv = afs_folio_dirty(folio, from, to);</div><div class='del'>-		folio_attach_private(folio, (void *)priv);</div><div class='del'>-		trace_afs_folio_dirty(vnode, tracepoint_string("dirty"), folio);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (folio_mark_dirty(folio))</div><div class='del'>-		_debug("dirtied %lx", folio_index(folio));</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	folio_unlock(folio);</div><div class='del'>-	folio_put(folio);</div><div class='del'>-	return copied;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * kill all the pages in the given range</div><div class='del'>- */</div><div class='del'>-static void afs_kill_pages(struct address_space *mapping,</div><div class='del'>-			   loff_t start, loff_t len)</div><div class='del'>-{</div><div class='del'>-	struct afs_vnode *vnode = AFS_FS_I(mapping-&gt;host);</div><div class='del'>-	struct folio *folio;</div><div class='del'>-	pgoff_t index = start / PAGE_SIZE;</div><div class='del'>-	pgoff_t last = (start + len - 1) / PAGE_SIZE, next;</div><div class='del'>-</div><div class='del'>-	_enter("{%llx:%llu},%llx @%llx",</div><div class='del'>-	       vnode-&gt;fid.vid, vnode-&gt;fid.vnode, len, start);</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		_debug("kill %lx (to %lx)", index, last);</div><div class='del'>-</div><div class='del'>-		folio = filemap_get_folio(mapping, index);</div><div class='del'>-		if (!folio) {</div><div class='del'>-			next = index + 1;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		next = folio_next_index(folio);</div><div class='del'>-</div><div class='del'>-		folio_clear_uptodate(folio);</div><div class='del'>-		folio_end_writeback(folio);</div><div class='del'>-		folio_lock(folio);</div><div class='del'>-		generic_error_remove_page(mapping, &amp;folio-&gt;page);</div><div class='del'>-		folio_unlock(folio);</div><div class='del'>-		folio_put(folio);</div><div class='del'>-</div><div class='del'>-	} while (index = next, index &lt;= last);</div><div class='del'>-</div><div class='del'>-	_leave("");</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Redirty all the pages in a given range.</div><div class='del'>- */</div><div class='del'>-static void afs_redirty_pages(struct writeback_control *wbc,</div><div class='del'>-			      struct address_space *mapping,</div><div class='del'>-			      loff_t start, loff_t len)</div><div class='del'>-{</div><div class='del'>-	struct afs_vnode *vnode = AFS_FS_I(mapping-&gt;host);</div><div class='del'>-	struct folio *folio;</div><div class='del'>-	pgoff_t index = start / PAGE_SIZE;</div><div class='del'>-	pgoff_t last = (start + len - 1) / PAGE_SIZE, next;</div><div class='del'>-</div><div class='del'>-	_enter("{%llx:%llu},%llx @%llx",</div><div class='del'>-	       vnode-&gt;fid.vid, vnode-&gt;fid.vnode, len, start);</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		_debug("redirty %llx @%llx", len, start);</div><div class='del'>-</div><div class='del'>-		folio = filemap_get_folio(mapping, index);</div><div class='del'>-		if (!folio) {</div><div class='del'>-			next = index + 1;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		next = index + folio_nr_pages(folio);</div><div class='del'>-		folio_redirty_for_writepage(wbc, folio);</div><div class='del'>-		folio_end_writeback(folio);</div><div class='del'>-		folio_put(folio);</div><div class='del'>-	} while (index = next, index &lt;= last);</div><div class='del'>-</div><div class='del'>-	_leave("");</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * completion of write to server</div><div class='ctx'>  */</div><div class='ctx'> static void afs_pages_written_back(struct afs_vnode *vnode, loff_t start, unsigned int len)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *mapping = vnode-&gt;vfs_inode.i_mapping;</div><div class='del'>-	struct folio *folio;</div><div class='del'>-	pgoff_t end;</div><div class='del'>-</div><div class='del'>-	XA_STATE(xas, &amp;mapping-&gt;i_pages, start / PAGE_SIZE);</div><div class='del'>-</div><div class='ctx'> 	_enter("{%llx:%llu},{%x @%llx}",</div><div class='ctx'> 	       vnode-&gt;fid.vid, vnode-&gt;fid.vnode, len, start);</div><div class='ctx'> </div><div class='del'>-	rcu_read_lock();</div><div class='del'>-</div><div class='del'>-	end = (start + len - 1) / PAGE_SIZE;</div><div class='del'>-	xas_for_each(&amp;xas, folio, end) {</div><div class='del'>-		if (!folio_test_writeback(folio)) {</div><div class='del'>-			kdebug("bad %x @%llx page %lx %lx",</div><div class='del'>-			       len, start, folio_index(folio), end);</div><div class='del'>-			ASSERT(folio_test_writeback(folio));</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		trace_afs_folio_dirty(vnode, tracepoint_string("clear"), folio);</div><div class='del'>-		folio_detach_private(folio);</div><div class='del'>-		folio_end_writeback(folio);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-</div><div class='ctx'> 	afs_prune_wb_keys(vnode);</div><div class='ctx'> 	_leave("");</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Find a key to use for the writeback.  We cached the keys used to author the</div><div class='del'>- * writes on the vnode.  *_wbk will contain the last writeback key used or NULL</div><div class='del'>- * and we need to start from there if it's set.</div><div class='add'>+ * writes on the vnode.  wreq-&gt;netfs_priv2 will contain the last writeback key</div><div class='add'>+ * record used or NULL and we need to start from there if it's set.</div><div class='add'>+ * wreq-&gt;netfs_priv will be set to the key itself or NULL.</div><div class='ctx'>  */</div><div class='del'>-static int afs_get_writeback_key(struct afs_vnode *vnode,</div><div class='del'>-				 struct afs_wb_key **_wbk)</div><div class='add'>+static void afs_get_writeback_key(struct netfs_io_request *wreq)</div><div class='ctx'> {</div><div class='del'>-	struct afs_wb_key *wbk = NULL;</div><div class='del'>-	struct list_head *p;</div><div class='del'>-	int ret = -ENOKEY, ret2;</div><div class='add'>+	struct afs_wb_key *wbk, *old = wreq-&gt;netfs_priv2;</div><div class='add'>+	struct afs_vnode *vnode = AFS_FS_I(wreq-&gt;inode);</div><div class='add'>+</div><div class='add'>+	key_put(wreq-&gt;netfs_priv);</div><div class='add'>+	wreq-&gt;netfs_priv = NULL;</div><div class='add'>+	wreq-&gt;netfs_priv2 = NULL;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;vnode-&gt;wb_lock);</div><div class='del'>-	if (*_wbk)</div><div class='del'>-		p = (*_wbk)-&gt;vnode_link.next;</div><div class='add'>+	if (old)</div><div class='add'>+		wbk = list_next_entry(old, vnode_link);</div><div class='ctx'> 	else</div><div class='del'>-		p = vnode-&gt;wb_keys.next;</div><div class='add'>+		wbk = list_first_entry(&amp;vnode-&gt;wb_keys, struct afs_wb_key, vnode_link);</div><div class='ctx'> </div><div class='del'>-	while (p != &amp;vnode-&gt;wb_keys) {</div><div class='del'>-		wbk = list_entry(p, struct afs_wb_key, vnode_link);</div><div class='add'>+	list_for_each_entry_from(wbk, &amp;vnode-&gt;wb_keys, vnode_link) {</div><div class='ctx'> 		_debug("wbk %u", key_serial(wbk-&gt;key));</div><div class='del'>-		ret2 = key_validate(wbk-&gt;key);</div><div class='del'>-		if (ret2 == 0) {</div><div class='add'>+		if (key_validate(wbk-&gt;key) == 0) {</div><div class='ctx'> 			refcount_inc(&amp;wbk-&gt;usage);</div><div class='add'>+			wreq-&gt;netfs_priv = key_get(wbk-&gt;key);</div><div class='add'>+			wreq-&gt;netfs_priv2 = wbk;</div><div class='ctx'> 			_debug("USE WB KEY %u", key_serial(wbk-&gt;key));</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-</div><div class='del'>-		wbk = NULL;</div><div class='del'>-		if (ret == -ENOKEY)</div><div class='del'>-			ret = ret2;</div><div class='del'>-		p = p-&gt;next;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	spin_unlock(&amp;vnode-&gt;wb_lock);</div><div class='del'>-	if (*_wbk)</div><div class='del'>-		afs_put_wb_key(*_wbk);</div><div class='del'>-	*_wbk = wbk;</div><div class='del'>-	return 0;</div><div class='add'>+</div><div class='add'>+	afs_put_wb_key(old);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void afs_store_data_success(struct afs_operation *op)</div><div class='hunk'>@@ -320,9 +70,8 @@ static void afs_store_data_success(struct afs_operation *op)</div><div class='ctx'> </div><div class='ctx'> 	op-&gt;ctime = op-&gt;file[0].scb.status.mtime_client;</div><div class='ctx'> 	afs_vnode_commit_status(op, &amp;op-&gt;file[0]);</div><div class='del'>-	if (op-&gt;error == 0) {</div><div class='del'>-		if (!op-&gt;store.laundering)</div><div class='del'>-			afs_pages_written_back(vnode, op-&gt;store.pos, op-&gt;store.size);</div><div class='add'>+	if (!afs_op_error(op)) {</div><div class='add'>+		afs_pages_written_back(vnode, op-&gt;store.pos, op-&gt;store.size);</div><div class='ctx'> 		afs_stat_v(vnode, n_stores);</div><div class='ctx'> 		atomic_long_add(op-&gt;store.size, &amp;afs_v2net(vnode)-&gt;n_store_bytes);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -335,424 +84,153 @@ static const struct afs_operation_ops afs_store_data_operation = {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * write to a file</div><div class='add'>+ * Prepare a subrequest to write to the server.  This sets the max_len</div><div class='add'>+ * parameter.</div><div class='add'>+ */</div><div class='add'>+void afs_prepare_write(struct netfs_io_subrequest *subreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_stream *stream = &amp;subreq-&gt;rreq-&gt;io_streams[subreq-&gt;stream_nr];</div><div class='add'>+</div><div class='add'>+	//if (test_bit(NETFS_SREQ_RETRYING, &amp;subreq-&gt;flags))</div><div class='add'>+	//	subreq-&gt;max_len = 512 * 1024;</div><div class='add'>+	//else</div><div class='add'>+	stream-&gt;sreq_max_len = 256 * 1024 * 1024;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Issue a subrequest to write to the server.</div><div class='ctx'>  */</div><div class='del'>-static int afs_store_data(struct afs_vnode *vnode, struct iov_iter *iter, loff_t pos,</div><div class='del'>-			  bool laundering)</div><div class='add'>+static void afs_issue_write_worker(struct work_struct *work)</div><div class='ctx'> {</div><div class='add'>+	struct netfs_io_subrequest *subreq = container_of(work, struct netfs_io_subrequest, work);</div><div class='add'>+	struct netfs_io_request *wreq = subreq-&gt;rreq;</div><div class='ctx'> 	struct afs_operation *op;</div><div class='del'>-	struct afs_wb_key *wbk = NULL;</div><div class='del'>-	loff_t size = iov_iter_count(iter), i_size;</div><div class='add'>+	struct afs_vnode *vnode = AFS_FS_I(wreq-&gt;inode);</div><div class='add'>+	unsigned long long pos = subreq-&gt;start + subreq-&gt;transferred;</div><div class='add'>+	size_t len = subreq-&gt;len - subreq-&gt;transferred;</div><div class='ctx'> 	int ret = -ENOKEY;</div><div class='ctx'> </div><div class='del'>-	_enter("%s{%llx:%llu.%u},%llx,%llx",</div><div class='add'>+	_enter("R=%x[%x],%s{%llx:%llu.%u},%llx,%zx",</div><div class='add'>+	       wreq-&gt;debug_id, subreq-&gt;debug_index,</div><div class='ctx'> 	       vnode-&gt;volume-&gt;name,</div><div class='ctx'> 	       vnode-&gt;fid.vid,</div><div class='ctx'> 	       vnode-&gt;fid.vnode,</div><div class='ctx'> 	       vnode-&gt;fid.unique,</div><div class='del'>-	       size, pos);</div><div class='add'>+	       pos, len);</div><div class='ctx'> </div><div class='del'>-	ret = afs_get_writeback_key(vnode, &amp;wbk);</div><div class='del'>-	if (ret) {</div><div class='del'>-		_leave(" = %d [no keys]", ret);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='add'>+#if 0 // Error injection</div><div class='add'>+	if (subreq-&gt;debug_index == 3)</div><div class='add'>+		return netfs_write_subrequest_terminated(subreq, -ENOANO);</div><div class='ctx'> </div><div class='del'>-	op = afs_alloc_operation(wbk-&gt;key, vnode-&gt;volume);</div><div class='del'>-	if (IS_ERR(op)) {</div><div class='del'>-		afs_put_wb_key(wbk);</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	if (!subreq-&gt;retry_count) {</div><div class='add'>+		set_bit(NETFS_SREQ_NEED_RETRY, &amp;subreq-&gt;flags);</div><div class='add'>+		return netfs_write_subrequest_terminated(subreq, -EAGAIN);</div><div class='ctx'> 	}</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='del'>-	i_size = i_size_read(&amp;vnode-&gt;vfs_inode);</div><div class='add'>+	op = afs_alloc_operation(wreq-&gt;netfs_priv, vnode-&gt;volume);</div><div class='add'>+	if (IS_ERR(op))</div><div class='add'>+		return netfs_write_subrequest_terminated(subreq, -EAGAIN);</div><div class='ctx'> </div><div class='ctx'> 	afs_op_set_vnode(op, 0, vnode);</div><div class='del'>-	op-&gt;file[0].dv_delta = 1;</div><div class='add'>+	op-&gt;file[0].dv_delta	= 1;</div><div class='ctx'> 	op-&gt;file[0].modification = true;</div><div class='del'>-	op-&gt;store.write_iter = iter;</div><div class='del'>-	op-&gt;store.pos = pos;</div><div class='del'>-	op-&gt;store.size = size;</div><div class='del'>-	op-&gt;store.i_size = max(pos + size, i_size);</div><div class='del'>-	op-&gt;store.laundering = laundering;</div><div class='del'>-	op-&gt;mtime = vnode-&gt;vfs_inode.i_mtime;</div><div class='del'>-	op-&gt;flags |= AFS_OPERATION_UNINTR;</div><div class='del'>-	op-&gt;ops = &amp;afs_store_data_operation;</div><div class='del'>-</div><div class='del'>-try_next_key:</div><div class='add'>+	op-&gt;store.pos		= pos;</div><div class='add'>+	op-&gt;store.size		= len;</div><div class='add'>+	op-&gt;flags		|= AFS_OPERATION_UNINTR;</div><div class='add'>+	op-&gt;ops			= &amp;afs_store_data_operation;</div><div class='add'>+</div><div class='ctx'> 	afs_begin_vnode_operation(op);</div><div class='del'>-	afs_wait_for_operation(op);</div><div class='ctx'> </div><div class='del'>-	switch (op-&gt;error) {</div><div class='add'>+	op-&gt;store.write_iter	= &amp;subreq-&gt;io_iter;</div><div class='add'>+	op-&gt;store.i_size	= umax(pos + len, vnode-&gt;netfs.remote_i_size);</div><div class='add'>+	op-&gt;mtime		= inode_get_mtime(&amp;vnode-&gt;netfs.inode);</div><div class='add'>+</div><div class='add'>+	afs_wait_for_operation(op);</div><div class='add'>+	ret = afs_put_operation(op);</div><div class='add'>+	switch (ret) {</div><div class='add'>+	case 0:</div><div class='add'>+		__set_bit(NETFS_SREQ_MADE_PROGRESS, &amp;subreq-&gt;flags);</div><div class='add'>+		break;</div><div class='ctx'> 	case -EACCES:</div><div class='ctx'> 	case -EPERM:</div><div class='ctx'> 	case -ENOKEY:</div><div class='ctx'> 	case -EKEYEXPIRED:</div><div class='ctx'> 	case -EKEYREJECTED:</div><div class='ctx'> 	case -EKEYREVOKED:</div><div class='del'>-		_debug("next");</div><div class='del'>-</div><div class='del'>-		ret = afs_get_writeback_key(vnode, &amp;wbk);</div><div class='del'>-		if (ret == 0) {</div><div class='del'>-			key_put(op-&gt;key);</div><div class='del'>-			op-&gt;key = key_get(wbk-&gt;key);</div><div class='del'>-			goto try_next_key;</div><div class='del'>-		}</div><div class='add'>+		/* If there are more keys we can try, use the retry algorithm</div><div class='add'>+		 * to rotate the keys.</div><div class='add'>+		 */</div><div class='add'>+		if (wreq-&gt;netfs_priv2)</div><div class='add'>+			set_bit(NETFS_SREQ_NEED_RETRY, &amp;subreq-&gt;flags);</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	afs_put_wb_key(wbk);</div><div class='del'>-	_leave(" = %d", op-&gt;error);</div><div class='del'>-	return afs_put_operation(op);</div><div class='add'>+	netfs_write_subrequest_terminated(subreq, ret &lt; 0 ? ret : subreq-&gt;len);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void afs_issue_write(struct netfs_io_subrequest *subreq)</div><div class='add'>+{</div><div class='add'>+	subreq-&gt;work.func = afs_issue_write_worker;</div><div class='add'>+	if (!queue_work(system_dfl_wq, &amp;subreq-&gt;work))</div><div class='add'>+		WARN_ON_ONCE(1);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Extend the region to be written back to include subsequent contiguously</div><div class='del'>- * dirty pages if possible, but don't sleep while doing so.</div><div class='del'>- *</div><div class='del'>- * If this page holds new content, then we can include filler zeros in the</div><div class='del'>- * writeback.</div><div class='add'>+ * Writeback calls this when it finds a folio that needs uploading.  This isn't</div><div class='add'>+ * called if writeback only has copy-to-cache to deal with.</div><div class='ctx'>  */</div><div class='del'>-static void afs_extend_writeback(struct address_space *mapping,</div><div class='del'>-				 struct afs_vnode *vnode,</div><div class='del'>-				 long *_count,</div><div class='del'>-				 loff_t start,</div><div class='del'>-				 loff_t max_len,</div><div class='del'>-				 bool new_content,</div><div class='del'>-				 unsigned int *_len)</div><div class='add'>+void afs_begin_writeback(struct netfs_io_request *wreq)</div><div class='ctx'> {</div><div class='del'>-	struct pagevec pvec;</div><div class='del'>-	struct folio *folio;</div><div class='del'>-	unsigned long priv;</div><div class='del'>-	unsigned int psize, filler = 0;</div><div class='del'>-	unsigned int f, t;</div><div class='del'>-	loff_t len = *_len;</div><div class='del'>-	pgoff_t index = (start + len) / PAGE_SIZE;</div><div class='del'>-	bool stop = true;</div><div class='del'>-	unsigned int i;</div><div class='del'>-</div><div class='del'>-	XA_STATE(xas, &amp;mapping-&gt;i_pages, index);</div><div class='del'>-	pagevec_init(&amp;pvec);</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		/* Firstly, we gather up a batch of contiguous dirty pages</div><div class='del'>-		 * under the RCU read lock - but we can't clear the dirty flags</div><div class='del'>-		 * there if any of those pages are mapped.</div><div class='del'>-		 */</div><div class='del'>-		rcu_read_lock();</div><div class='del'>-</div><div class='del'>-		xas_for_each(&amp;xas, folio, ULONG_MAX) {</div><div class='del'>-			stop = true;</div><div class='del'>-			if (xas_retry(&amp;xas, folio))</div><div class='del'>-				continue;</div><div class='del'>-			if (xa_is_value(folio))</div><div class='del'>-				break;</div><div class='del'>-			if (folio_index(folio) != index)</div><div class='del'>-				break;</div><div class='del'>-</div><div class='del'>-			if (!folio_try_get_rcu(folio)) {</div><div class='del'>-				xas_reset(&amp;xas);</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			/* Has the page moved or been split? */</div><div class='del'>-			if (unlikely(folio != xas_reload(&amp;xas))) {</div><div class='del'>-				folio_put(folio);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			if (!folio_trylock(folio)) {</div><div class='del'>-				folio_put(folio);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			if (!folio_test_dirty(folio) || folio_test_writeback(folio)) {</div><div class='del'>-				folio_unlock(folio);</div><div class='del'>-				folio_put(folio);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			psize = folio_size(folio);</div><div class='del'>-			priv = (unsigned long)folio_get_private(folio);</div><div class='del'>-			f = afs_folio_dirty_from(folio, priv);</div><div class='del'>-			t = afs_folio_dirty_to(folio, priv);</div><div class='del'>-			if (f != 0 &amp;&amp; !new_content) {</div><div class='del'>-				folio_unlock(folio);</div><div class='del'>-				folio_put(folio);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			len += filler + t;</div><div class='del'>-			filler = psize - t;</div><div class='del'>-			if (len &gt;= max_len || *_count &lt;= 0)</div><div class='del'>-				stop = true;</div><div class='del'>-			else if (t == psize || new_content)</div><div class='del'>-				stop = false;</div><div class='del'>-</div><div class='del'>-			index += folio_nr_pages(folio);</div><div class='del'>-			if (!pagevec_add(&amp;pvec, &amp;folio-&gt;page))</div><div class='del'>-				break;</div><div class='del'>-			if (stop)</div><div class='del'>-				break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (!stop)</div><div class='del'>-			xas_pause(&amp;xas);</div><div class='del'>-		rcu_read_unlock();</div><div class='del'>-</div><div class='del'>-		/* Now, if we obtained any pages, we can shift them to being</div><div class='del'>-		 * writable and mark them for caching.</div><div class='del'>-		 */</div><div class='del'>-		if (!pagevec_count(&amp;pvec))</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		for (i = 0; i &lt; pagevec_count(&amp;pvec); i++) {</div><div class='del'>-			folio = page_folio(pvec.pages[i]);</div><div class='del'>-			trace_afs_folio_dirty(vnode, tracepoint_string("store+"), folio);</div><div class='del'>-</div><div class='del'>-			if (!folio_clear_dirty_for_io(folio))</div><div class='del'>-				BUG();</div><div class='del'>-			if (folio_start_writeback(folio))</div><div class='del'>-				BUG();</div><div class='del'>-</div><div class='del'>-			*_count -= folio_nr_pages(folio);</div><div class='del'>-			folio_unlock(folio);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		pagevec_release(&amp;pvec);</div><div class='del'>-		cond_resched();</div><div class='del'>-	} while (!stop);</div><div class='del'>-</div><div class='del'>-	*_len = len;</div><div class='add'>+	if (S_ISREG(wreq-&gt;inode-&gt;i_mode))</div><div class='add'>+		afs_get_writeback_key(wreq);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Synchronously write back the locked page and any subsequent non-locked dirty</div><div class='del'>- * pages.</div><div class='add'>+ * Prepare to retry the writes in request.  Use this to try rotating the</div><div class='add'>+ * available writeback keys.</div><div class='ctx'>  */</div><div class='del'>-static ssize_t afs_write_back_from_locked_folio(struct address_space *mapping,</div><div class='del'>-						struct writeback_control *wbc,</div><div class='del'>-						struct folio *folio,</div><div class='del'>-						loff_t start, loff_t end)</div><div class='add'>+void afs_retry_request(struct netfs_io_request *wreq, struct netfs_io_stream *stream)</div><div class='ctx'> {</div><div class='del'>-	struct afs_vnode *vnode = AFS_FS_I(mapping-&gt;host);</div><div class='del'>-	struct iov_iter iter;</div><div class='del'>-	unsigned long priv;</div><div class='del'>-	unsigned int offset, to, len, max_len;</div><div class='del'>-	loff_t i_size = i_size_read(&amp;vnode-&gt;vfs_inode);</div><div class='del'>-	bool new_content = test_bit(AFS_VNODE_NEW_CONTENT, &amp;vnode-&gt;flags);</div><div class='del'>-	long count = wbc-&gt;nr_to_write;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	_enter(",%lx,%llx-%llx", folio_index(folio), start, end);</div><div class='del'>-</div><div class='del'>-	if (folio_start_writeback(folio))</div><div class='del'>-		BUG();</div><div class='del'>-</div><div class='del'>-	count -= folio_nr_pages(folio);</div><div class='del'>-</div><div class='del'>-	/* Find all consecutive lockable dirty pages that have contiguous</div><div class='del'>-	 * written regions, stopping when we find a page that is not</div><div class='del'>-	 * immediately lockable, is not dirty or is missing, or we reach the</div><div class='del'>-	 * end of the range.</div><div class='del'>-	 */</div><div class='del'>-	priv = (unsigned long)folio_get_private(folio);</div><div class='del'>-	offset = afs_folio_dirty_from(folio, priv);</div><div class='del'>-	to = afs_folio_dirty_to(folio, priv);</div><div class='del'>-	trace_afs_folio_dirty(vnode, tracepoint_string("store"), folio);</div><div class='del'>-</div><div class='del'>-	len = to - offset;</div><div class='del'>-	start += offset;</div><div class='del'>-	if (start &lt; i_size) {</div><div class='del'>-		/* Trim the write to the EOF; the extra data is ignored.  Also</div><div class='del'>-		 * put an upper limit on the size of a single storedata op.</div><div class='del'>-		 */</div><div class='del'>-		max_len = 65536 * 4096;</div><div class='del'>-		max_len = min_t(unsigned long long, max_len, end - start + 1);</div><div class='del'>-		max_len = min_t(unsigned long long, max_len, i_size - start);</div><div class='del'>-</div><div class='del'>-		if (len &lt; max_len &amp;&amp;</div><div class='del'>-		    (to == folio_size(folio) || new_content))</div><div class='del'>-			afs_extend_writeback(mapping, vnode, &amp;count,</div><div class='del'>-					     start, max_len, new_content, &amp;len);</div><div class='del'>-		len = min_t(loff_t, len, max_len);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* We now have a contiguous set of dirty pages, each with writeback</div><div class='del'>-	 * set; the first page is still locked at this point, but all the rest</div><div class='del'>-	 * have been unlocked.</div><div class='del'>-	 */</div><div class='del'>-	folio_unlock(folio);</div><div class='del'>-</div><div class='del'>-	if (start &lt; i_size) {</div><div class='del'>-		_debug("write back %x @%llx [%llx]", len, start, i_size);</div><div class='del'>-</div><div class='del'>-		iov_iter_xarray(&amp;iter, WRITE, &amp;mapping-&gt;i_pages, start, len);</div><div class='del'>-		ret = afs_store_data(vnode, &amp;iter, start, false);</div><div class='del'>-	} else {</div><div class='del'>-		_debug("write discard %x @%llx [%llx]", len, start, i_size);</div><div class='del'>-</div><div class='del'>-		/* The dirty region was entirely beyond the EOF. */</div><div class='del'>-		afs_pages_written_back(vnode, start, len);</div><div class='del'>-		ret = 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	switch (ret) {</div><div class='del'>-	case 0:</div><div class='del'>-		wbc-&gt;nr_to_write = count;</div><div class='del'>-		ret = len;</div><div class='add'>+	struct netfs_io_subrequest *subreq =</div><div class='add'>+		list_first_entry(&amp;stream-&gt;subrequests,</div><div class='add'>+				 struct netfs_io_subrequest, rreq_link);</div><div class='add'>+</div><div class='add'>+	switch (wreq-&gt;origin) {</div><div class='add'>+	case NETFS_READAHEAD:</div><div class='add'>+	case NETFS_READPAGE:</div><div class='add'>+	case NETFS_READ_GAPS:</div><div class='add'>+	case NETFS_READ_SINGLE:</div><div class='add'>+	case NETFS_READ_FOR_WRITE:</div><div class='add'>+	case NETFS_UNBUFFERED_READ:</div><div class='add'>+	case NETFS_DIO_READ:</div><div class='add'>+		return;</div><div class='add'>+	default:</div><div class='ctx'> 		break;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	default:</div><div class='del'>-		pr_notice("kAFS: Unexpected error from FS.StoreData %d\n", ret);</div><div class='del'>-		fallthrough;</div><div class='add'>+	switch (subreq-&gt;error) {</div><div class='ctx'> 	case -EACCES:</div><div class='ctx'> 	case -EPERM:</div><div class='ctx'> 	case -ENOKEY:</div><div class='ctx'> 	case -EKEYEXPIRED:</div><div class='ctx'> 	case -EKEYREJECTED:</div><div class='ctx'> 	case -EKEYREVOKED:</div><div class='del'>-		afs_redirty_pages(wbc, mapping, start, len);</div><div class='del'>-		mapping_set_error(mapping, ret);</div><div class='del'>-		break;</div><div class='del'>-</div><div class='del'>-	case -EDQUOT:</div><div class='del'>-	case -ENOSPC:</div><div class='del'>-		afs_redirty_pages(wbc, mapping, start, len);</div><div class='del'>-		mapping_set_error(mapping, -ENOSPC);</div><div class='del'>-		break;</div><div class='del'>-</div><div class='del'>-	case -EROFS:</div><div class='del'>-	case -EIO:</div><div class='del'>-	case -EREMOTEIO:</div><div class='del'>-	case -EFBIG:</div><div class='del'>-	case -ENOENT:</div><div class='del'>-	case -ENOMEDIUM:</div><div class='del'>-	case -ENXIO:</div><div class='del'>-		trace_afs_file_error(vnode, ret, afs_file_error_writeback_fail);</div><div class='del'>-		afs_kill_pages(mapping, start, len);</div><div class='del'>-		mapping_set_error(mapping, ret);</div><div class='add'>+		afs_get_writeback_key(wreq);</div><div class='add'>+		if (!wreq-&gt;netfs_priv)</div><div class='add'>+			stream-&gt;failed = true;</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	_leave(" = %d", ret);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * write a page back to the server</div><div class='del'>- * - the caller locked the page for us</div><div class='del'>- */</div><div class='del'>-int afs_writepage(struct page *subpage, struct writeback_control *wbc)</div><div class='del'>-{</div><div class='del'>-	struct folio *folio = page_folio(subpage);</div><div class='del'>-	ssize_t ret;</div><div class='del'>-	loff_t start;</div><div class='del'>-</div><div class='del'>-	_enter("{%lx},", folio_index(folio));</div><div class='del'>-</div><div class='del'>-	start = folio_index(folio) * PAGE_SIZE;</div><div class='del'>-	ret = afs_write_back_from_locked_folio(folio_mapping(folio), wbc,</div><div class='del'>-					       folio, start, LLONG_MAX - start);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		_leave(" = %zd", ret);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	_leave(" = 0");</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * write a region of pages back to the server</div><div class='del'>- */</div><div class='del'>-static int afs_writepages_region(struct address_space *mapping,</div><div class='del'>-				 struct writeback_control *wbc,</div><div class='del'>-				 loff_t start, loff_t end, loff_t *_next)</div><div class='del'>-{</div><div class='del'>-	struct folio *folio;</div><div class='del'>-	struct page *head_page;</div><div class='del'>-	ssize_t ret;</div><div class='del'>-	int n;</div><div class='del'>-</div><div class='del'>-	_enter("%llx,%llx,", start, end);</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		pgoff_t index = start / PAGE_SIZE;</div><div class='del'>-</div><div class='del'>-		n = find_get_pages_range_tag(mapping, &amp;index, end / PAGE_SIZE,</div><div class='del'>-					     PAGECACHE_TAG_DIRTY, 1, &amp;head_page);</div><div class='del'>-		if (!n)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		folio = page_folio(head_page);</div><div class='del'>-		start = folio_pos(folio); /* May regress with THPs */</div><div class='del'>-</div><div class='del'>-		_debug("wback %lx", folio_index(folio));</div><div class='del'>-</div><div class='del'>-		/* At this point we hold neither the i_pages lock nor the</div><div class='del'>-		 * page lock: the page may be truncated or invalidated</div><div class='del'>-		 * (changing page-&gt;mapping to NULL), or even swizzled</div><div class='del'>-		 * back from swapper_space to tmpfs file mapping</div><div class='del'>-		 */</div><div class='del'>-		if (wbc-&gt;sync_mode != WB_SYNC_NONE) {</div><div class='del'>-			ret = folio_lock_killable(folio);</div><div class='del'>-			if (ret &lt; 0) {</div><div class='del'>-				folio_put(folio);</div><div class='del'>-				return ret;</div><div class='del'>-			}</div><div class='del'>-		} else {</div><div class='del'>-			if (!folio_trylock(folio)) {</div><div class='del'>-				folio_put(folio);</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (folio_mapping(folio) != mapping ||</div><div class='del'>-		    !folio_test_dirty(folio)) {</div><div class='del'>-			start += folio_size(folio);</div><div class='del'>-			folio_unlock(folio);</div><div class='del'>-			folio_put(folio);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (folio_test_writeback(folio)) {</div><div class='del'>-			folio_unlock(folio);</div><div class='del'>-			if (wbc-&gt;sync_mode != WB_SYNC_NONE)</div><div class='del'>-				folio_wait_writeback(folio);</div><div class='del'>-			folio_put(folio);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (!folio_clear_dirty_for_io(folio))</div><div class='del'>-			BUG();</div><div class='del'>-		ret = afs_write_back_from_locked_folio(mapping, wbc, folio, start, end);</div><div class='del'>-		folio_put(folio);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			_leave(" = %zd", ret);</div><div class='del'>-			return ret;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		start += ret;</div><div class='del'>-</div><div class='del'>-		cond_resched();</div><div class='del'>-	} while (wbc-&gt;nr_to_write &gt; 0);</div><div class='del'>-</div><div class='del'>-	*_next = start;</div><div class='del'>-	_leave(" = 0 [%llx]", *_next);</div><div class='del'>-	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * write some of the pending data back to the server</div><div class='ctx'>  */</div><div class='del'>-int afs_writepages(struct address_space *mapping,</div><div class='del'>-		   struct writeback_control *wbc)</div><div class='add'>+int afs_writepages(struct address_space *mapping, struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_vnode *vnode = AFS_FS_I(mapping-&gt;host);</div><div class='del'>-	loff_t start, next;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	_enter("");</div><div class='del'>-</div><div class='ctx'> 	/* We have to be careful as we can end up racing with setattr()</div><div class='ctx'> 	 * truncating the pagecache since the caller doesn't take a lock here</div><div class='ctx'> 	 * to prevent it.</div><div class='hunk'>@@ -762,66 +240,12 @@ int afs_writepages(struct address_space *mapping,</div><div class='ctx'> 	else if (!down_read_trylock(&amp;vnode-&gt;validate_lock))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	if (wbc-&gt;range_cyclic) {</div><div class='del'>-		start = mapping-&gt;writeback_index * PAGE_SIZE;</div><div class='del'>-		ret = afs_writepages_region(mapping, wbc, start, LLONG_MAX, &amp;next);</div><div class='del'>-		if (ret == 0) {</div><div class='del'>-			mapping-&gt;writeback_index = next / PAGE_SIZE;</div><div class='del'>-			if (start &gt; 0 &amp;&amp; wbc-&gt;nr_to_write &gt; 0) {</div><div class='del'>-				ret = afs_writepages_region(mapping, wbc, 0,</div><div class='del'>-							    start, &amp;next);</div><div class='del'>-				if (ret == 0)</div><div class='del'>-					mapping-&gt;writeback_index =</div><div class='del'>-						next / PAGE_SIZE;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-	} else if (wbc-&gt;range_start == 0 &amp;&amp; wbc-&gt;range_end == LLONG_MAX) {</div><div class='del'>-		ret = afs_writepages_region(mapping, wbc, 0, LLONG_MAX, &amp;next);</div><div class='del'>-		if (wbc-&gt;nr_to_write &gt; 0 &amp;&amp; ret == 0)</div><div class='del'>-			mapping-&gt;writeback_index = next / PAGE_SIZE;</div><div class='del'>-	} else {</div><div class='del'>-		ret = afs_writepages_region(mapping, wbc,</div><div class='del'>-					    wbc-&gt;range_start, wbc-&gt;range_end, &amp;next);</div><div class='del'>-	}</div><div class='del'>-</div><div class='add'>+	ret = netfs_writepages(mapping, wbc);</div><div class='ctx'> 	up_read(&amp;vnode-&gt;validate_lock);</div><div class='del'>-	_leave(" = %d", ret);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * write to an AFS file</div><div class='del'>- */</div><div class='del'>-ssize_t afs_file_write(struct kiocb *iocb, struct iov_iter *from)</div><div class='del'>-{</div><div class='del'>-	struct afs_vnode *vnode = AFS_FS_I(file_inode(iocb-&gt;ki_filp));</div><div class='del'>-	struct afs_file *af = iocb-&gt;ki_filp-&gt;private_data;</div><div class='del'>-	ssize_t result;</div><div class='del'>-	size_t count = iov_iter_count(from);</div><div class='del'>-</div><div class='del'>-	_enter("{%llx:%llu},{%zu},",</div><div class='del'>-	       vnode-&gt;fid.vid, vnode-&gt;fid.vnode, count);</div><div class='del'>-</div><div class='del'>-	if (IS_SWAPFILE(&amp;vnode-&gt;vfs_inode)) {</div><div class='del'>-		printk(KERN_INFO</div><div class='del'>-		       "AFS: Attempt to write to active swap file!\n");</div><div class='del'>-		return -EBUSY;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!count)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	result = afs_validate(vnode, af-&gt;key);</div><div class='del'>-	if (result &lt; 0)</div><div class='del'>-		return result;</div><div class='del'>-</div><div class='del'>-	result = generic_file_write_iter(iocb, from);</div><div class='del'>-</div><div class='del'>-	_leave(" = %zd", result);</div><div class='del'>-	return result;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * flush any dirty pages for this process, and check for write errors.</div><div class='ctx'>  * - the return status from this call provides a reliable indication of</div><div class='ctx'>  *   whether any write errors occurred for this process.</div><div class='hunk'>@@ -849,59 +273,11 @@ int afs_fsync(struct file *file, loff_t start, loff_t end, int datasync)</div><div class='ctx'>  */</div><div class='ctx'> vm_fault_t afs_page_mkwrite(struct vm_fault *vmf)</div><div class='ctx'> {</div><div class='del'>-	struct folio *folio = page_folio(vmf-&gt;page);</div><div class='ctx'> 	struct file *file = vmf-&gt;vma-&gt;vm_file;</div><div class='del'>-	struct inode *inode = file_inode(file);</div><div class='del'>-	struct afs_vnode *vnode = AFS_FS_I(inode);</div><div class='del'>-	struct afs_file *af = file-&gt;private_data;</div><div class='del'>-	unsigned long priv;</div><div class='del'>-	vm_fault_t ret = VM_FAULT_RETRY;</div><div class='del'>-</div><div class='del'>-	_enter("{{%llx:%llu}},{%lx}", vnode-&gt;fid.vid, vnode-&gt;fid.vnode, folio_index(folio));</div><div class='del'>-</div><div class='del'>-	afs_validate(vnode, af-&gt;key);</div><div class='del'>-</div><div class='del'>-	sb_start_pagefault(inode-&gt;i_sb);</div><div class='del'>-</div><div class='del'>-	/* Wait for the page to be written to the cache before we allow it to</div><div class='del'>-	 * be modified.  We then assume the entire page will need writing back.</div><div class='del'>-	 */</div><div class='del'>-#ifdef CONFIG_AFS_FSCACHE</div><div class='del'>-	if (folio_test_fscache(folio) &amp;&amp;</div><div class='del'>-	    folio_wait_fscache_killable(folio) &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-	if (folio_wait_writeback_killable(folio))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	if (folio_lock_killable(folio) &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	/* We mustn't change folio-&gt;private until writeback is complete as that</div><div class='del'>-	 * details the portion of the page we need to write back and we might</div><div class='del'>-	 * need to redirty the page if there's a problem.</div><div class='del'>-	 */</div><div class='del'>-	if (folio_wait_writeback_killable(folio) &lt; 0) {</div><div class='del'>-		folio_unlock(folio);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	priv = afs_folio_dirty(folio, 0, folio_size(folio));</div><div class='del'>-	priv = afs_folio_dirty_mmapped(priv);</div><div class='del'>-	if (folio_test_private(folio)) {</div><div class='del'>-		folio_change_private(folio, (void *)priv);</div><div class='del'>-		trace_afs_folio_dirty(vnode, tracepoint_string("mkwrite+"), folio);</div><div class='del'>-	} else {</div><div class='del'>-		folio_attach_private(folio, (void *)priv);</div><div class='del'>-		trace_afs_folio_dirty(vnode, tracepoint_string("mkwrite"), folio);</div><div class='del'>-	}</div><div class='del'>-	file_update_time(file);</div><div class='del'>-</div><div class='del'>-	ret = VM_FAULT_LOCKED;</div><div class='del'>-out:</div><div class='del'>-	sb_end_pagefault(inode-&gt;i_sb);</div><div class='del'>-	return ret;</div><div class='add'>+	if (afs_validate(AFS_FS_I(file_inode(file)), afs_file_key(file)) &lt; 0)</div><div class='add'>+		return VM_FAULT_SIGBUS;</div><div class='add'>+	return netfs_page_mkwrite(vmf, NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -915,8 +291,8 @@ void afs_prune_wb_keys(struct afs_vnode *vnode)</div><div class='ctx'> 	/* Discard unused keys */</div><div class='ctx'> 	spin_lock(&amp;vnode-&gt;wb_lock);</div><div class='ctx'> </div><div class='del'>-	if (!mapping_tagged(&amp;vnode-&gt;vfs_inode.i_data, PAGECACHE_TAG_WRITEBACK) &amp;&amp;</div><div class='del'>-	    !mapping_tagged(&amp;vnode-&gt;vfs_inode.i_data, PAGECACHE_TAG_DIRTY)) {</div><div class='add'>+	if (!mapping_tagged(&amp;vnode-&gt;netfs.inode.i_data, PAGECACHE_TAG_WRITEBACK) &amp;&amp;</div><div class='add'>+	    !mapping_tagged(&amp;vnode-&gt;netfs.inode.i_data, PAGECACHE_TAG_DIRTY)) {</div><div class='ctx'> 		list_for_each_entry_safe(wbk, tmp, &amp;vnode-&gt;wb_keys, vnode_link) {</div><div class='ctx'> 			if (refcount_read(&amp;wbk-&gt;usage) == 1)</div><div class='ctx'> 				list_move(&amp;wbk-&gt;vnode_link, &amp;graveyard);</div><div class='hunk'>@@ -931,42 +307,3 @@ void afs_prune_wb_keys(struct afs_vnode *vnode)</div><div class='ctx'> 		afs_put_wb_key(wbk);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Clean up a page during invalidation.</div><div class='del'>- */</div><div class='del'>-int afs_launder_page(struct page *subpage)</div><div class='del'>-{</div><div class='del'>-	struct folio *folio = page_folio(subpage);</div><div class='del'>-	struct afs_vnode *vnode = AFS_FS_I(folio_inode(folio));</div><div class='del'>-	struct iov_iter iter;</div><div class='del'>-	struct bio_vec bv[1];</div><div class='del'>-	unsigned long priv;</div><div class='del'>-	unsigned int f, t;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	_enter("{%lx}", folio_index(folio));</div><div class='del'>-</div><div class='del'>-	priv = (unsigned long)folio_get_private(folio);</div><div class='del'>-	if (folio_clear_dirty_for_io(folio)) {</div><div class='del'>-		f = 0;</div><div class='del'>-		t = folio_size(folio);</div><div class='del'>-		if (folio_test_private(folio)) {</div><div class='del'>-			f = afs_folio_dirty_from(folio, priv);</div><div class='del'>-			t = afs_folio_dirty_to(folio, priv);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		bv[0].bv_page = &amp;folio-&gt;page;</div><div class='del'>-		bv[0].bv_offset = f;</div><div class='del'>-		bv[0].bv_len = t - f;</div><div class='del'>-		iov_iter_bvec(&amp;iter, WRITE, bv, 1, bv[0].bv_len);</div><div class='del'>-</div><div class='del'>-		trace_afs_folio_dirty(vnode, tracepoint_string("launder"), folio);</div><div class='del'>-		ret = afs_store_data(vnode, &amp;iter, folio_pos(folio) + f, true);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	trace_afs_folio_dirty(vnode, tracepoint_string("laundered"), folio);</div><div class='del'>-	folio_detach_private(folio);</div><div class='del'>-	folio_wait_fscache(folio);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='head'>diff --git a/fs/afs/xattr.c b/fs/afs/xattr.c<br/>index 7751b0b3f81d..e19f396aa370 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/xattr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/xattr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/xattr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/xattr.c</a></div><div class='hunk'>@@ -75,7 +75,7 @@ static bool afs_make_acl(struct afs_operation *op,</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_acl *acl;</div><div class='ctx'> </div><div class='del'>-	acl = kmalloc(sizeof(*acl) + size, GFP_KERNEL);</div><div class='add'>+	acl = kmalloc(struct_size(acl, data, size), GFP_KERNEL);</div><div class='ctx'> 	if (!acl) {</div><div class='ctx'> 		afs_op_nomem(op);</div><div class='ctx'> 		return false;</div><div class='hunk'>@@ -97,7 +97,7 @@ static const struct afs_operation_ops afs_store_acl_operation = {</div><div class='ctx'>  * Set a file's AFS3 ACL.</div><div class='ctx'>  */</div><div class='ctx'> static int afs_xattr_set_acl(const struct xattr_handler *handler,</div><div class='del'>-			     struct user_namespace *mnt_userns,</div><div class='add'>+			     struct mnt_idmap *idmap,</div><div class='ctx'>                              struct dentry *dentry,</div><div class='ctx'>                              struct inode *inode, const char *name,</div><div class='ctx'>                              const void *buffer, size_t size, int flags)</div><div class='hunk'>@@ -228,7 +228,7 @@ static const struct afs_operation_ops yfs_store_opaque_acl2_operation = {</div><div class='ctx'>  * Set a file's YFS ACL.</div><div class='ctx'>  */</div><div class='ctx'> static int afs_xattr_set_yfs(const struct xattr_handler *handler,</div><div class='del'>-			     struct user_namespace *mnt_userns,</div><div class='add'>+			     struct mnt_idmap *idmap,</div><div class='ctx'>                              struct dentry *dentry,</div><div class='ctx'>                              struct inode *inode, const char *name,</div><div class='ctx'>                              const void *buffer, size_t size, int flags)</div><div class='hunk'>@@ -353,7 +353,7 @@ static const struct xattr_handler afs_xattr_afs_volume_handler = {</div><div class='ctx'> 	.get	= afs_xattr_get_volume,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-const struct xattr_handler *afs_xattr_handlers[] = {</div><div class='add'>+const struct xattr_handler * const afs_xattr_handlers[] = {</div><div class='ctx'> 	&amp;afs_xattr_afs_acl_handler,</div><div class='ctx'> 	&amp;afs_xattr_afs_cell_handler,</div><div class='ctx'> 	&amp;afs_xattr_afs_fid_handler,</div><div class='head'>diff --git a/fs/afs/xdr_fs.h b/fs/afs/xdr_fs.h<br/>index 8ca868164507..cc5f143d21a3 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/xdr_fs.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/xdr_fs.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/xdr_fs.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/xdr_fs.h</a></div><div class='hunk'>@@ -88,7 +88,7 @@ union afs_xdr_dir_block {</div><div class='ctx'> </div><div class='ctx'> 	struct {</div><div class='ctx'> 		struct afs_xdr_dir_hdr	hdr;</div><div class='del'>-		u8			alloc_ctrs[AFS_DIR_MAX_BLOCKS];</div><div class='add'>+		u8			alloc_ctrs[AFS_DIR_BLOCKS_WITH_CTR];</div><div class='ctx'> 		__be16			hashtable[AFS_DIR_HASHTBL_SIZE];</div><div class='ctx'> 	} meta;</div><div class='ctx'> </div><div class='head'>diff --git a/fs/afs/yfsclient.c b/fs/afs/yfsclient.c<br/>index fdc7d675b4b0..febf13a49f0b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/afs/yfsclient.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/afs/yfsclient.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/afs/yfsclient.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/afs/yfsclient.c</a></div><div class='hunk'>@@ -232,8 +232,7 @@ static void xdr_decode_YFSCallBack(const __be32 **_bp,</div><div class='ctx'> 	struct afs_callback *cb = &amp;scb-&gt;callback;</div><div class='ctx'> 	ktime_t cb_expiry;</div><div class='ctx'> </div><div class='del'>-	cb_expiry = call-&gt;reply_time;</div><div class='del'>-	cb_expiry = ktime_add(cb_expiry, xdr_to_u64(x-&gt;expiration_time) * 100);</div><div class='add'>+	cb_expiry = ktime_add(call-&gt;issue_time, xdr_to_u64(x-&gt;expiration_time) * 100);</div><div class='ctx'> 	cb-&gt;expires_at	= ktime_divns(cb_expiry, NSEC_PER_SEC);</div><div class='ctx'> 	scb-&gt;have_cb	= true;</div><div class='ctx'> 	*_bp += xdr_size(x);</div><div class='hunk'>@@ -246,12 +245,15 @@ static void xdr_decode_YFSVolSync(const __be32 **_bp,</div><div class='ctx'> 				  struct afs_volsync *volsync)</div><div class='ctx'> {</div><div class='ctx'> 	struct yfs_xdr_YFSVolSync *x = (void *)*_bp;</div><div class='del'>-	u64 creation;</div><div class='add'>+	u64 creation, update;</div><div class='ctx'> </div><div class='ctx'> 	if (volsync) {</div><div class='ctx'> 		creation = xdr_to_u64(x-&gt;vol_creation_date);</div><div class='ctx'> 		do_div(creation, 10 * 1000 * 1000);</div><div class='ctx'> 		volsync-&gt;creation = creation;</div><div class='add'>+		update = xdr_to_u64(x-&gt;vol_update_date);</div><div class='add'>+		do_div(update, 10 * 1000 * 1000);</div><div class='add'>+		volsync-&gt;update = update;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	*_bp += xdr_size(x);</div><div class='hunk'>@@ -350,18 +352,19 @@ static int yfs_deliver_status_and_volsync(struct afs_call *call)</div><div class='ctx'> static int yfs_deliver_fs_fetch_data64(struct afs_call *call)</div><div class='ctx'> {</div><div class='ctx'> 	struct afs_operation *op = call-&gt;op;</div><div class='add'>+	struct netfs_io_subrequest *subreq = op-&gt;fetch.subreq;</div><div class='ctx'> 	struct afs_vnode_param *vp = &amp;op-&gt;file[0];</div><div class='del'>-	struct afs_read *req = op-&gt;fetch.req;</div><div class='ctx'> 	const __be32 *bp;</div><div class='add'>+	size_t count_before;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	_enter("{%u,%zu, %zu/%llu}",</div><div class='ctx'> 	       call-&gt;unmarshall, call-&gt;iov_len, iov_iter_count(call-&gt;iter),</div><div class='del'>-	       req-&gt;actual_len);</div><div class='add'>+	       call-&gt;remaining);</div><div class='ctx'> </div><div class='ctx'> 	switch (call-&gt;unmarshall) {</div><div class='ctx'> 	case 0:</div><div class='del'>-		req-&gt;actual_len = 0;</div><div class='add'>+		call-&gt;remaining = 0;</div><div class='ctx'> 		afs_extract_to_tmp64(call);</div><div class='ctx'> 		call-&gt;unmarshall++;</div><div class='ctx'> 		fallthrough;</div><div class='hunk'>@@ -376,38 +379,39 @@ static int yfs_deliver_fs_fetch_data64(struct afs_call *call)</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			return ret;</div><div class='ctx'> </div><div class='del'>-		req-&gt;actual_len = be64_to_cpu(call-&gt;tmp64);</div><div class='del'>-		_debug("DATA length: %llu", req-&gt;actual_len);</div><div class='add'>+		call-&gt;remaining = be64_to_cpu(call-&gt;tmp64);</div><div class='add'>+		_debug("DATA length: %llu", call-&gt;remaining);</div><div class='ctx'> </div><div class='del'>-		if (req-&gt;actual_len == 0)</div><div class='add'>+		if (call-&gt;remaining == 0)</div><div class='ctx'> 			goto no_more_data;</div><div class='ctx'> </div><div class='del'>-		call-&gt;iter = req-&gt;iter;</div><div class='del'>-		call-&gt;iov_len = min(req-&gt;actual_len, req-&gt;len);</div><div class='add'>+		call-&gt;iter = &amp;subreq-&gt;io_iter;</div><div class='add'>+		call-&gt;iov_len = min(call-&gt;remaining, subreq-&gt;len - subreq-&gt;transferred);</div><div class='ctx'> 		call-&gt;unmarshall++;</div><div class='ctx'> 		fallthrough;</div><div class='ctx'> </div><div class='ctx'> 		/* extract the returned data */</div><div class='ctx'> 	case 2:</div><div class='del'>-		_debug("extract data %zu/%llu",</div><div class='del'>-		       iov_iter_count(call-&gt;iter), req-&gt;actual_len);</div><div class='add'>+		count_before = call-&gt;iov_len;</div><div class='add'>+		_debug("extract data %zu/%llu", count_before, call-&gt;remaining);</div><div class='ctx'> </div><div class='ctx'> 		ret = afs_extract_data(call, true);</div><div class='add'>+		subreq-&gt;transferred += count_before - call-&gt;iov_len;</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			return ret;</div><div class='ctx'> </div><div class='ctx'> 		call-&gt;iter = &amp;call-&gt;def_iter;</div><div class='del'>-		if (req-&gt;actual_len &lt;= req-&gt;len)</div><div class='add'>+		if (call-&gt;remaining)</div><div class='ctx'> 			goto no_more_data;</div><div class='ctx'> </div><div class='ctx'> 		/* Discard any excess data the server gave us */</div><div class='del'>-		afs_extract_discard(call, req-&gt;actual_len - req-&gt;len);</div><div class='add'>+		afs_extract_discard(call, call-&gt;remaining);</div><div class='ctx'> 		call-&gt;unmarshall = 3;</div><div class='ctx'> 		fallthrough;</div><div class='ctx'> </div><div class='ctx'> 	case 3:</div><div class='ctx'> 		_debug("extract discard %zu/%llu",</div><div class='del'>-		       iov_iter_count(call-&gt;iter), req-&gt;actual_len - req-&gt;len);</div><div class='add'>+		       iov_iter_count(call-&gt;iter), call-&gt;remaining);</div><div class='ctx'> </div><div class='ctx'> 		ret = afs_extract_data(call, true);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='hunk'>@@ -432,8 +436,8 @@ static int yfs_deliver_fs_fetch_data64(struct afs_call *call)</div><div class='ctx'> 		xdr_decode_YFSCallBack(&amp;bp, call, &amp;vp-&gt;scb);</div><div class='ctx'> 		xdr_decode_YFSVolSync(&amp;bp, &amp;op-&gt;volsync);</div><div class='ctx'> </div><div class='del'>-		req-&gt;data_version = vp-&gt;scb.status.data_version;</div><div class='del'>-		req-&gt;file_size = vp-&gt;scb.status.size;</div><div class='add'>+		if (subreq-&gt;start + subreq-&gt;transferred &gt;= vp-&gt;scb.status.size)</div><div class='add'>+			__set_bit(NETFS_SREQ_HIT_EOF, &amp;subreq-&gt;flags);</div><div class='ctx'> </div><div class='ctx'> 		call-&gt;unmarshall++;</div><div class='ctx'> 		fallthrough;</div><div class='hunk'>@@ -452,7 +456,9 @@ static int yfs_deliver_fs_fetch_data64(struct afs_call *call)</div><div class='ctx'> static const struct afs_call_type yfs_RXYFSFetchData64 = {</div><div class='ctx'> 	.name		= "YFS.FetchData64",</div><div class='ctx'> 	.op		= yfs_FS_FetchData64,</div><div class='add'>+	.async_rx	= afs_fetch_data_async_rx,</div><div class='ctx'> 	.deliver	= yfs_deliver_fs_fetch_data64,</div><div class='add'>+	.immediate_cancel = afs_fetch_data_immediate_cancel,</div><div class='ctx'> 	.destructor	= afs_flat_call_destructor,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -461,14 +467,15 @@ static const struct afs_call_type yfs_RXYFSFetchData64 = {</div><div class='ctx'>  */</div><div class='ctx'> void yfs_fs_fetch_data(struct afs_operation *op)</div><div class='ctx'> {</div><div class='add'>+	struct netfs_io_subrequest *subreq = op-&gt;fetch.subreq;</div><div class='ctx'> 	struct afs_vnode_param *vp = &amp;op-&gt;file[0];</div><div class='del'>-	struct afs_read *req = op-&gt;fetch.req;</div><div class='ctx'> 	struct afs_call *call;</div><div class='ctx'> 	__be32 *bp;</div><div class='ctx'> </div><div class='del'>-	_enter(",%x,{%llx:%llu},%llx,%llx",</div><div class='add'>+	_enter(",%x,{%llx:%llu},%llx,%zx",</div><div class='ctx'> 	       key_serial(op-&gt;key), vp-&gt;fid.vid, vp-&gt;fid.vnode,</div><div class='del'>-	       req-&gt;pos, req-&gt;len);</div><div class='add'>+	       subreq-&gt;start + subreq-&gt;transferred,</div><div class='add'>+	       subreq-&gt;len   - subreq-&gt;transferred);</div><div class='ctx'> </div><div class='ctx'> 	call = afs_alloc_flat_call(op-&gt;net, &amp;yfs_RXYFSFetchData64,</div><div class='ctx'> 				   sizeof(__be32) * 2 +</div><div class='hunk'>@@ -480,17 +487,19 @@ void yfs_fs_fetch_data(struct afs_operation *op)</div><div class='ctx'> 	if (!call)</div><div class='ctx'> 		return afs_op_nomem(op);</div><div class='ctx'> </div><div class='del'>-	req-&gt;call_debug_id = call-&gt;debug_id;</div><div class='add'>+	if (op-&gt;flags &amp; AFS_OPERATION_ASYNC)</div><div class='add'>+		call-&gt;async = true;</div><div class='ctx'> </div><div class='ctx'> 	/* marshall the parameters */</div><div class='ctx'> 	bp = call-&gt;request;</div><div class='ctx'> 	bp = xdr_encode_u32(bp, YFSFETCHDATA64);</div><div class='ctx'> 	bp = xdr_encode_u32(bp, 0); /* RPC flags */</div><div class='ctx'> 	bp = xdr_encode_YFSFid(bp, &amp;vp-&gt;fid);</div><div class='del'>-	bp = xdr_encode_u64(bp, req-&gt;pos);</div><div class='del'>-	bp = xdr_encode_u64(bp, req-&gt;len);</div><div class='add'>+	bp = xdr_encode_u64(bp, subreq-&gt;start + subreq-&gt;transferred);</div><div class='add'>+	bp = xdr_encode_u64(bp, subreq-&gt;len   - subreq-&gt;transferred);</div><div class='ctx'> 	yfs_check_req(call, bp);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call(call, &amp;vp-&gt;fid);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -573,6 +582,7 @@ void yfs_fs_create_file(struct afs_operation *op)</div><div class='ctx'> 	bp = xdr_encode_u32(bp, yfs_LockNone); /* ViceLockType */</div><div class='ctx'> 	yfs_check_req(call, bp);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = dvp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call1(call, &amp;dvp-&gt;fid, name);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -621,6 +631,7 @@ void yfs_fs_make_dir(struct afs_operation *op)</div><div class='ctx'> 	bp = xdr_encode_YFSStoreStatus(bp, &amp;op-&gt;create.mode, &amp;op-&gt;mtime);</div><div class='ctx'> 	yfs_check_req(call, bp);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = dvp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call1(call, &amp;dvp-&gt;fid, name);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -656,8 +667,9 @@ static int yfs_deliver_fs_remove_file2(struct afs_call *call)</div><div class='ctx'> static void yfs_done_fs_remove_file2(struct afs_call *call)</div><div class='ctx'> {</div><div class='ctx'> 	if (call-&gt;error == -ECONNABORTED &amp;&amp;</div><div class='del'>-	    call-&gt;abort_code == RX_INVALID_OPERATION) {</div><div class='del'>-		set_bit(AFS_SERVER_FL_NO_RM2, &amp;call-&gt;server-&gt;flags);</div><div class='add'>+	    (call-&gt;abort_code == RX_INVALID_OPERATION ||</div><div class='add'>+	     call-&gt;abort_code == RXGEN_OPCODE)) {</div><div class='add'>+		set_bit(AFS_SERVER_FL_NO_RM2, &amp;call-&gt;op-&gt;server-&gt;flags);</div><div class='ctx'> 		call-&gt;op-&gt;flags |= AFS_OPERATION_DOWNGRADE;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -705,6 +717,7 @@ void yfs_fs_remove_file2(struct afs_operation *op)</div><div class='ctx'> 	bp = xdr_encode_name(bp, name);</div><div class='ctx'> 	yfs_check_req(call, bp);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = dvp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call1(call, &amp;dvp-&gt;fid, name);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -774,6 +787,7 @@ void yfs_fs_remove_file(struct afs_operation *op)</div><div class='ctx'> 	bp = xdr_encode_name(bp, name);</div><div class='ctx'> 	yfs_check_req(call, bp);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = dvp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call1(call, &amp;dvp-&gt;fid, name);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -815,6 +829,7 @@ void yfs_fs_remove_dir(struct afs_operation *op)</div><div class='ctx'> 	bp = xdr_encode_name(bp, name);</div><div class='ctx'> 	yfs_check_req(call, bp);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = dvp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call1(call, &amp;dvp-&gt;fid, name);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -888,6 +903,7 @@ void yfs_fs_link(struct afs_operation *op)</div><div class='ctx'> 	bp = xdr_encode_YFSFid(bp, &amp;vp-&gt;fid);</div><div class='ctx'> 	yfs_check_req(call, bp);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call1(call, &amp;vp-&gt;fid, name);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -969,6 +985,7 @@ void yfs_fs_symlink(struct afs_operation *op)</div><div class='ctx'> 	bp = xdr_encode_YFSStoreStatus(bp, &amp;mode, &amp;op-&gt;mtime);</div><div class='ctx'> 	yfs_check_req(call, bp);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = dvp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call1(call, &amp;dvp-&gt;fid, name);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -1025,6 +1042,9 @@ void yfs_fs_rename(struct afs_operation *op)</div><div class='ctx'> </div><div class='ctx'> 	_enter("");</div><div class='ctx'> </div><div class='add'>+	if (!test_bit(AFS_SERVER_FL_NO_RENAME2, &amp;op-&gt;server-&gt;flags))</div><div class='add'>+		return yfs_fs_rename_replace(op);</div><div class='add'>+</div><div class='ctx'> 	call = afs_alloc_flat_call(op-&gt;net, &amp;yfs_RXYFSRename,</div><div class='ctx'> 				   sizeof(__be32) +</div><div class='ctx'> 				   sizeof(struct yfs_xdr_RPCFlags) +</div><div class='hunk'>@@ -1048,6 +1068,253 @@ void yfs_fs_rename(struct afs_operation *op)</div><div class='ctx'> 	bp = xdr_encode_name(bp, new_name);</div><div class='ctx'> 	yfs_check_req(call, bp);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = orig_dvp-&gt;fid;</div><div class='add'>+	trace_afs_make_fs_call2(call, &amp;orig_dvp-&gt;fid, orig_name, new_name);</div><div class='add'>+	afs_make_op_call(op, call, GFP_NOFS);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Deliver reply data to a YFS.Rename_NoReplace operation.  This does not</div><div class='add'>+ * return the status of a displaced target inode as there cannot be one.</div><div class='add'>+ */</div><div class='add'>+static int yfs_deliver_fs_rename_1(struct afs_call *call)</div><div class='add'>+{</div><div class='add'>+	struct afs_operation *op = call-&gt;op;</div><div class='add'>+	struct afs_vnode_param *orig_dvp = &amp;op-&gt;file[0];</div><div class='add'>+	struct afs_vnode_param *new_dvp = &amp;op-&gt;file[1];</div><div class='add'>+	struct afs_vnode_param *old_vp = &amp;op-&gt;more_files[0];</div><div class='add'>+	const __be32 *bp;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	_enter("{%u}", call-&gt;unmarshall);</div><div class='add'>+</div><div class='add'>+	ret = afs_transfer_reply(call);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	bp = call-&gt;buffer;</div><div class='add'>+	/* If the two dirs are the same, we have two copies of the same status</div><div class='add'>+	 * report, so we just decode it twice.</div><div class='add'>+	 */</div><div class='add'>+	xdr_decode_YFSFetchStatus(&amp;bp, call, &amp;orig_dvp-&gt;scb);</div><div class='add'>+	xdr_decode_YFSFid(&amp;bp, &amp;old_vp-&gt;fid);</div><div class='add'>+	xdr_decode_YFSFetchStatus(&amp;bp, call, &amp;old_vp-&gt;scb);</div><div class='add'>+	xdr_decode_YFSFetchStatus(&amp;bp, call, &amp;new_dvp-&gt;scb);</div><div class='add'>+	xdr_decode_YFSVolSync(&amp;bp, &amp;op-&gt;volsync);</div><div class='add'>+	_leave(" = 0 [done]");</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Deliver reply data to a YFS.Rename_Replace or a YFS.Rename_Exchange</div><div class='add'>+ * operation.  These return the status of the displaced target inode if there</div><div class='add'>+ * was one.</div><div class='add'>+ */</div><div class='add'>+static int yfs_deliver_fs_rename_2(struct afs_call *call)</div><div class='add'>+{</div><div class='add'>+	struct afs_operation *op = call-&gt;op;</div><div class='add'>+	struct afs_vnode_param *orig_dvp = &amp;op-&gt;file[0];</div><div class='add'>+	struct afs_vnode_param *new_dvp = &amp;op-&gt;file[1];</div><div class='add'>+	struct afs_vnode_param *old_vp = &amp;op-&gt;more_files[0];</div><div class='add'>+	struct afs_vnode_param *new_vp = &amp;op-&gt;more_files[1];</div><div class='add'>+	const __be32 *bp;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	_enter("{%u}", call-&gt;unmarshall);</div><div class='add'>+</div><div class='add'>+	ret = afs_transfer_reply(call);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	bp = call-&gt;buffer;</div><div class='add'>+	/* If the two dirs are the same, we have two copies of the same status</div><div class='add'>+	 * report, so we just decode it twice.</div><div class='add'>+	 */</div><div class='add'>+	xdr_decode_YFSFetchStatus(&amp;bp, call, &amp;orig_dvp-&gt;scb);</div><div class='add'>+	xdr_decode_YFSFid(&amp;bp, &amp;old_vp-&gt;fid);</div><div class='add'>+	xdr_decode_YFSFetchStatus(&amp;bp, call, &amp;old_vp-&gt;scb);</div><div class='add'>+	xdr_decode_YFSFetchStatus(&amp;bp, call, &amp;new_dvp-&gt;scb);</div><div class='add'>+	xdr_decode_YFSFid(&amp;bp, &amp;new_vp-&gt;fid);</div><div class='add'>+	xdr_decode_YFSFetchStatus(&amp;bp, call, &amp;new_vp-&gt;scb);</div><div class='add'>+	xdr_decode_YFSVolSync(&amp;bp, &amp;op-&gt;volsync);</div><div class='add'>+	_leave(" = 0 [done]");</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void yfs_done_fs_rename_replace(struct afs_call *call)</div><div class='add'>+{</div><div class='add'>+	if (call-&gt;error == -ECONNABORTED &amp;&amp;</div><div class='add'>+	    (call-&gt;abort_code == RX_INVALID_OPERATION ||</div><div class='add'>+	     call-&gt;abort_code == RXGEN_OPCODE)) {</div><div class='add'>+		set_bit(AFS_SERVER_FL_NO_RENAME2, &amp;call-&gt;op-&gt;server-&gt;flags);</div><div class='add'>+		call-&gt;op-&gt;flags |= AFS_OPERATION_DOWNGRADE;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * YFS.Rename_Replace operation type</div><div class='add'>+ */</div><div class='add'>+static const struct afs_call_type yfs_RXYFSRename_Replace = {</div><div class='add'>+	.name		= "FS.Rename_Replace",</div><div class='add'>+	.op		= yfs_FS_Rename_Replace,</div><div class='add'>+	.deliver	= yfs_deliver_fs_rename_2,</div><div class='add'>+	.done		= yfs_done_fs_rename_replace,</div><div class='add'>+	.destructor	= afs_flat_call_destructor,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * YFS.Rename_NoReplace operation type</div><div class='add'>+ */</div><div class='add'>+static const struct afs_call_type yfs_RXYFSRename_NoReplace = {</div><div class='add'>+	.name		= "FS.Rename_NoReplace",</div><div class='add'>+	.op		= yfs_FS_Rename_NoReplace,</div><div class='add'>+	.deliver	= yfs_deliver_fs_rename_1,</div><div class='add'>+	.destructor	= afs_flat_call_destructor,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * YFS.Rename_Exchange operation type</div><div class='add'>+ */</div><div class='add'>+static const struct afs_call_type yfs_RXYFSRename_Exchange = {</div><div class='add'>+	.name		= "FS.Rename_Exchange",</div><div class='add'>+	.op		= yfs_FS_Rename_Exchange,</div><div class='add'>+	.deliver	= yfs_deliver_fs_rename_2,</div><div class='add'>+	.destructor	= afs_flat_call_destructor,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Rename a file or directory, replacing the target if it exists.  The status</div><div class='add'>+ * of a displaced target is returned.</div><div class='add'>+ */</div><div class='add'>+void yfs_fs_rename_replace(struct afs_operation *op)</div><div class='add'>+{</div><div class='add'>+	struct afs_vnode_param *orig_dvp = &amp;op-&gt;file[0];</div><div class='add'>+	struct afs_vnode_param *new_dvp = &amp;op-&gt;file[1];</div><div class='add'>+	const struct qstr *orig_name = &amp;op-&gt;dentry-&gt;d_name;</div><div class='add'>+	const struct qstr *new_name = &amp;op-&gt;dentry_2-&gt;d_name;</div><div class='add'>+	struct afs_call *call;</div><div class='add'>+	__be32 *bp;</div><div class='add'>+</div><div class='add'>+	_enter("");</div><div class='add'>+</div><div class='add'>+	call = afs_alloc_flat_call(op-&gt;net, &amp;yfs_RXYFSRename_Replace,</div><div class='add'>+				   sizeof(__be32) +</div><div class='add'>+				   sizeof(struct yfs_xdr_RPCFlags) +</div><div class='add'>+				   sizeof(struct yfs_xdr_YFSFid) +</div><div class='add'>+				   xdr_strlen(orig_name-&gt;len) +</div><div class='add'>+				   sizeof(struct yfs_xdr_YFSFid) +</div><div class='add'>+				   xdr_strlen(new_name-&gt;len),</div><div class='add'>+				   sizeof(struct yfs_xdr_YFSFetchStatus) +</div><div class='add'>+				   sizeof(struct yfs_xdr_YFSFid) +</div><div class='add'>+				   sizeof(struct yfs_xdr_YFSFetchStatus) +</div><div class='add'>+				   sizeof(struct yfs_xdr_YFSFetchStatus) +</div><div class='add'>+				   sizeof(struct yfs_xdr_YFSFid) +</div><div class='add'>+				   sizeof(struct yfs_xdr_YFSFetchStatus) +</div><div class='add'>+				   sizeof(struct yfs_xdr_YFSVolSync));</div><div class='add'>+	if (!call)</div><div class='add'>+		return afs_op_nomem(op);</div><div class='add'>+</div><div class='add'>+	/* Marshall the parameters. */</div><div class='add'>+	bp = call-&gt;request;</div><div class='add'>+	bp = xdr_encode_u32(bp, YFSRENAME_REPLACE);</div><div class='add'>+	bp = xdr_encode_u32(bp, 0); /* RPC flags */</div><div class='add'>+	bp = xdr_encode_YFSFid(bp, &amp;orig_dvp-&gt;fid);</div><div class='add'>+	bp = xdr_encode_name(bp, orig_name);</div><div class='add'>+	bp = xdr_encode_YFSFid(bp, &amp;new_dvp-&gt;fid);</div><div class='add'>+	bp = xdr_encode_name(bp, new_name);</div><div class='add'>+	yfs_check_req(call, bp);</div><div class='add'>+</div><div class='add'>+	call-&gt;fid = orig_dvp-&gt;fid;</div><div class='add'>+	trace_afs_make_fs_call2(call, &amp;orig_dvp-&gt;fid, orig_name, new_name);</div><div class='add'>+	afs_make_op_call(op, call, GFP_NOFS);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Rename a file or directory, failing if the target dirent exists.</div><div class='add'>+ */</div><div class='add'>+void yfs_fs_rename_noreplace(struct afs_operation *op)</div><div class='add'>+{</div><div class='add'>+	struct afs_vnode_param *orig_dvp = &amp;op-&gt;file[0];</div><div class='add'>+	struct afs_vnode_param *new_dvp = &amp;op-&gt;file[1];</div><div class='add'>+	const struct qstr *orig_name = &amp;op-&gt;dentry-&gt;d_name;</div><div class='add'>+	const struct qstr *new_name = &amp;op-&gt;dentry_2-&gt;d_name;</div><div class='add'>+	struct afs_call *call;</div><div class='add'>+	__be32 *bp;</div><div class='add'>+</div><div class='add'>+	_enter("");</div><div class='add'>+</div><div class='add'>+	call = afs_alloc_flat_call(op-&gt;net, &amp;yfs_RXYFSRename_NoReplace,</div><div class='add'>+				   sizeof(__be32) +</div><div class='add'>+				   sizeof(struct yfs_xdr_RPCFlags) +</div><div class='add'>+				   sizeof(struct yfs_xdr_YFSFid) +</div><div class='add'>+				   xdr_strlen(orig_name-&gt;len) +</div><div class='add'>+				   sizeof(struct yfs_xdr_YFSFid) +</div><div class='add'>+				   xdr_strlen(new_name-&gt;len),</div><div class='add'>+				   sizeof(struct yfs_xdr_YFSFetchStatus) +</div><div class='add'>+				   sizeof(struct yfs_xdr_YFSFid) +</div><div class='add'>+				   sizeof(struct yfs_xdr_YFSFetchStatus) +</div><div class='add'>+				   sizeof(struct yfs_xdr_YFSFetchStatus) +</div><div class='add'>+				   sizeof(struct yfs_xdr_YFSVolSync));</div><div class='add'>+	if (!call)</div><div class='add'>+		return afs_op_nomem(op);</div><div class='add'>+</div><div class='add'>+	/* Marshall the parameters. */</div><div class='add'>+	bp = call-&gt;request;</div><div class='add'>+	bp = xdr_encode_u32(bp, YFSRENAME_NOREPLACE);</div><div class='add'>+	bp = xdr_encode_u32(bp, 0); /* RPC flags */</div><div class='add'>+	bp = xdr_encode_YFSFid(bp, &amp;orig_dvp-&gt;fid);</div><div class='add'>+	bp = xdr_encode_name(bp, orig_name);</div><div class='add'>+	bp = xdr_encode_YFSFid(bp, &amp;new_dvp-&gt;fid);</div><div class='add'>+	bp = xdr_encode_name(bp, new_name);</div><div class='add'>+	yfs_check_req(call, bp);</div><div class='add'>+</div><div class='add'>+	call-&gt;fid = orig_dvp-&gt;fid;</div><div class='add'>+	trace_afs_make_fs_call2(call, &amp;orig_dvp-&gt;fid, orig_name, new_name);</div><div class='add'>+	afs_make_op_call(op, call, GFP_NOFS);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Exchange a pair of files directories.</div><div class='add'>+ */</div><div class='add'>+void yfs_fs_rename_exchange(struct afs_operation *op)</div><div class='add'>+{</div><div class='add'>+	struct afs_vnode_param *orig_dvp = &amp;op-&gt;file[0];</div><div class='add'>+	struct afs_vnode_param *new_dvp = &amp;op-&gt;file[1];</div><div class='add'>+	const struct qstr *orig_name = &amp;op-&gt;dentry-&gt;d_name;</div><div class='add'>+	const struct qstr *new_name = &amp;op-&gt;dentry_2-&gt;d_name;</div><div class='add'>+	struct afs_call *call;</div><div class='add'>+	__be32 *bp;</div><div class='add'>+</div><div class='add'>+	_enter("");</div><div class='add'>+</div><div class='add'>+	call = afs_alloc_flat_call(op-&gt;net, &amp;yfs_RXYFSRename_Exchange,</div><div class='add'>+				   sizeof(__be32) +</div><div class='add'>+				   sizeof(struct yfs_xdr_RPCFlags) +</div><div class='add'>+				   sizeof(struct yfs_xdr_YFSFid) +</div><div class='add'>+				   xdr_strlen(orig_name-&gt;len) +</div><div class='add'>+				   sizeof(struct yfs_xdr_YFSFid) +</div><div class='add'>+				   xdr_strlen(new_name-&gt;len),</div><div class='add'>+				   sizeof(struct yfs_xdr_YFSFetchStatus) +</div><div class='add'>+				   sizeof(struct yfs_xdr_YFSFid) +</div><div class='add'>+				   sizeof(struct yfs_xdr_YFSFetchStatus) +</div><div class='add'>+				   sizeof(struct yfs_xdr_YFSFetchStatus) +</div><div class='add'>+				   sizeof(struct yfs_xdr_YFSFid) +</div><div class='add'>+				   sizeof(struct yfs_xdr_YFSFetchStatus) +</div><div class='add'>+				   sizeof(struct yfs_xdr_YFSVolSync));</div><div class='add'>+	if (!call)</div><div class='add'>+		return afs_op_nomem(op);</div><div class='add'>+</div><div class='add'>+	/* Marshall the parameters. */</div><div class='add'>+	bp = call-&gt;request;</div><div class='add'>+	bp = xdr_encode_u32(bp, YFSRENAME_EXCHANGE);</div><div class='add'>+	bp = xdr_encode_u32(bp, 0); /* RPC flags */</div><div class='add'>+	bp = xdr_encode_YFSFid(bp, &amp;orig_dvp-&gt;fid);</div><div class='add'>+	bp = xdr_encode_name(bp, orig_name);</div><div class='add'>+	bp = xdr_encode_YFSFid(bp, &amp;new_dvp-&gt;fid);</div><div class='add'>+	bp = xdr_encode_name(bp, new_name);</div><div class='add'>+	yfs_check_req(call, bp);</div><div class='add'>+</div><div class='add'>+	call-&gt;fid = orig_dvp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call2(call, &amp;orig_dvp-&gt;fid, orig_name, new_name);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -1103,6 +1370,7 @@ void yfs_fs_store_data(struct afs_operation *op)</div><div class='ctx'> 	bp = xdr_encode_u64(bp, op-&gt;store.i_size);</div><div class='ctx'> 	yfs_check_req(call, bp);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call(call, &amp;vp-&gt;fid);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -1159,6 +1427,7 @@ static void yfs_fs_setattr_size(struct afs_operation *op)</div><div class='ctx'> 	bp = xdr_encode_u64(bp, attr-&gt;ia_size);	/* new file length */</div><div class='ctx'> 	yfs_check_req(call, bp);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call(call, &amp;vp-&gt;fid);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -1197,6 +1466,7 @@ void yfs_fs_setattr(struct afs_operation *op)</div><div class='ctx'> 	bp = xdr_encode_YFS_StoreStatus(bp, attr);</div><div class='ctx'> 	yfs_check_req(call, bp);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call(call, &amp;vp-&gt;fid);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -1367,6 +1637,7 @@ void yfs_fs_get_volume_status(struct afs_operation *op)</div><div class='ctx'> 	bp = xdr_encode_u64(bp, vp-&gt;fid.vid);</div><div class='ctx'> 	yfs_check_req(call, bp);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call(call, &amp;vp-&gt;fid);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -1431,6 +1702,7 @@ void yfs_fs_set_lock(struct afs_operation *op)</div><div class='ctx'> 	bp = xdr_encode_u32(bp, op-&gt;lock.type);</div><div class='ctx'> 	yfs_check_req(call, bp);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_calli(call, &amp;vp-&gt;fid, op-&gt;lock.type);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -1461,6 +1733,7 @@ void yfs_fs_extend_lock(struct afs_operation *op)</div><div class='ctx'> 	bp = xdr_encode_YFSFid(bp, &amp;vp-&gt;fid);</div><div class='ctx'> 	yfs_check_req(call, bp);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call(call, &amp;vp-&gt;fid);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -1491,6 +1764,7 @@ void yfs_fs_release_lock(struct afs_operation *op)</div><div class='ctx'> 	bp = xdr_encode_YFSFid(bp, &amp;vp-&gt;fid);</div><div class='ctx'> 	yfs_check_req(call, bp);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call(call, &amp;vp-&gt;fid);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -1557,6 +1831,7 @@ void yfs_fs_fetch_status(struct afs_operation *op)</div><div class='ctx'> 	bp = xdr_encode_YFSFid(bp, &amp;vp-&gt;fid);</div><div class='ctx'> 	yfs_check_req(call, bp);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call(call, &amp;vp-&gt;fid);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -1737,6 +2012,7 @@ void yfs_fs_inline_bulk_status(struct afs_operation *op)</div><div class='ctx'> 		bp = xdr_encode_YFSFid(bp, &amp;op-&gt;more_files[i].fid);</div><div class='ctx'> 	yfs_check_req(call, bp);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call(call, &amp;vp-&gt;fid);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_NOFS);</div><div class='ctx'> }</div><div class='hunk'>@@ -1899,6 +2175,7 @@ void yfs_fs_fetch_opaque_acl(struct afs_operation *op)</div><div class='ctx'> 	bp = xdr_encode_YFSFid(bp, &amp;vp-&gt;fid);</div><div class='ctx'> 	yfs_check_req(call, bp);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call(call, &amp;vp-&gt;fid);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_KERNEL);</div><div class='ctx'> }</div><div class='hunk'>@@ -1949,6 +2226,7 @@ void yfs_fs_store_opaque_acl2(struct afs_operation *op)</div><div class='ctx'> 	bp += size / sizeof(__be32);</div><div class='ctx'> 	yfs_check_req(call, bp);</div><div class='ctx'> </div><div class='add'>+	call-&gt;fid = vp-&gt;fid;</div><div class='ctx'> 	trace_afs_make_fs_call(call, &amp;vp-&gt;fid);</div><div class='ctx'> 	afs_make_op_call(op, call, GFP_KERNEL);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/aio.c b/fs/aio.c<br/>index 9c81cf611d65..0a23a8c0717f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/aio.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/aio.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/aio.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/aio.c</a></div><div class='hunk'>@@ -80,7 +80,7 @@ struct aio_ring {</div><div class='ctx'> struct kioctx_table {</div><div class='ctx'> 	struct rcu_head		rcu;</div><div class='ctx'> 	unsigned		nr;</div><div class='del'>-	struct kioctx __rcu	*table[];</div><div class='add'>+	struct kioctx __rcu	*table[] __counted_by(nr);</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct kioctx_cpu {</div><div class='hunk'>@@ -100,7 +100,7 @@ struct kioctx {</div><div class='ctx'> </div><div class='ctx'> 	unsigned long		user_id;</div><div class='ctx'> </div><div class='del'>-	struct __percpu kioctx_cpu *cpu;</div><div class='add'>+	struct kioctx_cpu __percpu *cpu;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * For percpu reqs_available, number of slots we move to/from global</div><div class='hunk'>@@ -122,7 +122,7 @@ struct kioctx {</div><div class='ctx'> 	unsigned long		mmap_base;</div><div class='ctx'> 	unsigned long		mmap_size;</div><div class='ctx'> </div><div class='del'>-	struct page		**ring_pages;</div><div class='add'>+	struct folio		**ring_folios;</div><div class='ctx'> 	long			nr_pages;</div><div class='ctx'> </div><div class='ctx'> 	struct rcu_work		free_rwork;	/* see free_ioctx() */</div><div class='hunk'>@@ -160,7 +160,7 @@ struct kioctx {</div><div class='ctx'> 		spinlock_t	completion_lock;</div><div class='ctx'> 	} ____cacheline_aligned_in_smp;</div><div class='ctx'> </div><div class='del'>-	struct page		*internal_pages[AIO_RING_PAGES];</div><div class='add'>+	struct folio		*internal_folios[AIO_RING_PAGES];</div><div class='ctx'> 	struct file		*aio_ring_file;</div><div class='ctx'> </div><div class='ctx'> 	unsigned		id;</div><div class='hunk'>@@ -181,8 +181,9 @@ struct poll_iocb {</div><div class='ctx'> 	struct file		*file;</div><div class='ctx'> 	struct wait_queue_head	*head;</div><div class='ctx'> 	__poll_t		events;</div><div class='del'>-	bool			done;</div><div class='ctx'> 	bool			cancelled;</div><div class='add'>+	bool			work_scheduled;</div><div class='add'>+	bool			work_need_resched;</div><div class='ctx'> 	struct wait_queue_entry	wait;</div><div class='ctx'> 	struct work_struct	work;</div><div class='ctx'> };</div><div class='hunk'>@@ -219,9 +220,34 @@ struct aio_kiocb {</div><div class='ctx'> </div><div class='ctx'> /*------ sysctl variables----*/</div><div class='ctx'> static DEFINE_SPINLOCK(aio_nr_lock);</div><div class='del'>-unsigned long aio_nr;		/* current system wide number of aio requests */</div><div class='del'>-unsigned long aio_max_nr = 0x10000; /* system wide maximum number of aio requests */</div><div class='add'>+static unsigned long aio_nr;		/* current system wide number of aio requests */</div><div class='add'>+static unsigned long aio_max_nr = 0x10000; /* system wide maximum number of aio requests */</div><div class='ctx'> /*----end sysctl variables---*/</div><div class='add'>+#ifdef CONFIG_SYSCTL</div><div class='add'>+static const struct ctl_table aio_sysctls[] = {</div><div class='add'>+	{</div><div class='add'>+		.procname	= "aio-nr",</div><div class='add'>+		.data		= &amp;aio_nr,</div><div class='add'>+		.maxlen		= sizeof(aio_nr),</div><div class='add'>+		.mode		= 0444,</div><div class='add'>+		.proc_handler	= proc_doulongvec_minmax,</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+		.procname	= "aio-max-nr",</div><div class='add'>+		.data		= &amp;aio_max_nr,</div><div class='add'>+		.maxlen		= sizeof(aio_max_nr),</div><div class='add'>+		.mode		= 0644,</div><div class='add'>+		.proc_handler	= proc_doulongvec_minmax,</div><div class='add'>+	},</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static void __init aio_sysctl_init(void)</div><div class='add'>+{</div><div class='add'>+	register_sysctl_init("fs", aio_sysctls);</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+#define aio_sysctl_init() do { } while (0)</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='ctx'> static struct kmem_cache	*kiocb_cachep;</div><div class='ctx'> static struct kmem_cache	*kioctx_cachep;</div><div class='hunk'>@@ -239,7 +265,7 @@ static struct file *aio_private_file(struct kioctx *ctx, loff_t nr_pages)</div><div class='ctx'> 		return ERR_CAST(inode);</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_mapping-&gt;a_ops = &amp;aio_ctx_aops;</div><div class='del'>-	inode-&gt;i_mapping-&gt;private_data = ctx;</div><div class='add'>+	inode-&gt;i_mapping-&gt;i_private_data = ctx;</div><div class='ctx'> 	inode-&gt;i_size = PAGE_SIZE * nr_pages;</div><div class='ctx'> </div><div class='ctx'> 	file = alloc_file_pseudo(inode, aio_mnt, "[aio]",</div><div class='hunk'>@@ -274,6 +300,7 @@ static int __init aio_setup(void)</div><div class='ctx'> </div><div class='ctx'> 	kiocb_cachep = KMEM_CACHE(aio_kiocb, SLAB_HWCACHE_ALIGN|SLAB_PANIC);</div><div class='ctx'> 	kioctx_cachep = KMEM_CACHE(kioctx,SLAB_HWCACHE_ALIGN|SLAB_PANIC);</div><div class='add'>+	aio_sysctl_init();</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> __initcall(aio_setup);</div><div class='hunk'>@@ -288,10 +315,10 @@ static void put_aio_ring_file(struct kioctx *ctx)</div><div class='ctx'> </div><div class='ctx'> 		/* Prevent further access to the kioctx from migratepages */</div><div class='ctx'> 		i_mapping = aio_ring_file-&gt;f_mapping;</div><div class='del'>-		spin_lock(&amp;i_mapping-&gt;private_lock);</div><div class='del'>-		i_mapping-&gt;private_data = NULL;</div><div class='add'>+		spin_lock(&amp;i_mapping-&gt;i_private_lock);</div><div class='add'>+		i_mapping-&gt;i_private_data = NULL;</div><div class='ctx'> 		ctx-&gt;aio_ring_file = NULL;</div><div class='del'>-		spin_unlock(&amp;i_mapping-&gt;private_lock);</div><div class='add'>+		spin_unlock(&amp;i_mapping-&gt;i_private_lock);</div><div class='ctx'> </div><div class='ctx'> 		fput(aio_ring_file);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -307,19 +334,20 @@ static void aio_free_ring(struct kioctx *ctx)</div><div class='ctx'> 	put_aio_ring_file(ctx);</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; ctx-&gt;nr_pages; i++) {</div><div class='del'>-		struct page *page;</div><div class='del'>-		pr_debug("pid(%d) [%d] page-&gt;count=%d\n", current-&gt;pid, i,</div><div class='del'>-				page_count(ctx-&gt;ring_pages[i]));</div><div class='del'>-		page = ctx-&gt;ring_pages[i];</div><div class='del'>-		if (!page)</div><div class='add'>+		struct folio *folio = ctx-&gt;ring_folios[i];</div><div class='add'>+</div><div class='add'>+		if (!folio)</div><div class='ctx'> 			continue;</div><div class='del'>-		ctx-&gt;ring_pages[i] = NULL;</div><div class='del'>-		put_page(page);</div><div class='add'>+</div><div class='add'>+		pr_debug("pid(%d) [%d] folio-&gt;count=%d\n", current-&gt;pid, i,</div><div class='add'>+			 folio_ref_count(folio));</div><div class='add'>+		ctx-&gt;ring_folios[i] = NULL;</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (ctx-&gt;ring_pages &amp;&amp; ctx-&gt;ring_pages != ctx-&gt;internal_pages) {</div><div class='del'>-		kfree(ctx-&gt;ring_pages);</div><div class='del'>-		ctx-&gt;ring_pages = NULL;</div><div class='add'>+	if (ctx-&gt;ring_folios &amp;&amp; ctx-&gt;ring_folios != ctx-&gt;internal_folios) {</div><div class='add'>+		kfree(ctx-&gt;ring_folios);</div><div class='add'>+		ctx-&gt;ring_folios = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -333,6 +361,9 @@ static int aio_ring_mremap(struct vm_area_struct *vma)</div><div class='ctx'> 	spin_lock(&amp;mm-&gt;ioctx_lock);</div><div class='ctx'> 	rcu_read_lock();</div><div class='ctx'> 	table = rcu_dereference(mm-&gt;ioctx_table);</div><div class='add'>+	if (!table)</div><div class='add'>+		goto out_unlock;</div><div class='add'>+</div><div class='ctx'> 	for (i = 0; i &lt; table-&gt;nr; i++) {</div><div class='ctx'> 		struct kioctx *ctx;</div><div class='ctx'> </div><div class='hunk'>@@ -346,6 +377,7 @@ static int aio_ring_mremap(struct vm_area_struct *vma)</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+out_unlock:</div><div class='ctx'> 	rcu_read_unlock();</div><div class='ctx'> 	spin_unlock(&amp;mm-&gt;ioctx_lock);</div><div class='ctx'> 	return res;</div><div class='hunk'>@@ -360,39 +392,29 @@ static const struct vm_operations_struct aio_ring_vm_ops = {</div><div class='ctx'> #endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int aio_ring_mmap(struct file *file, struct vm_area_struct *vma)</div><div class='add'>+static int aio_ring_mmap_prepare(struct vm_area_desc *desc)</div><div class='ctx'> {</div><div class='del'>-	vma-&gt;vm_flags |= VM_DONTEXPAND;</div><div class='del'>-	vma-&gt;vm_ops = &amp;aio_ring_vm_ops;</div><div class='add'>+	desc-&gt;vm_flags |= VM_DONTEXPAND;</div><div class='add'>+	desc-&gt;vm_ops = &amp;aio_ring_vm_ops;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct file_operations aio_ring_fops = {</div><div class='del'>-	.mmap = aio_ring_mmap,</div><div class='add'>+	.mmap_prepare = aio_ring_mmap_prepare,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> #if IS_ENABLED(CONFIG_MIGRATION)</div><div class='del'>-static int aio_migratepage(struct address_space *mapping, struct page *new,</div><div class='del'>-			struct page *old, enum migrate_mode mode)</div><div class='add'>+static int aio_migrate_folio(struct address_space *mapping, struct folio *dst,</div><div class='add'>+			struct folio *src, enum migrate_mode mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct kioctx *ctx;</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> 	pgoff_t idx;</div><div class='del'>-	int rc;</div><div class='add'>+	int rc = 0;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * We cannot support the _NO_COPY case here, because copy needs to</div><div class='del'>-	 * happen under the ctx-&gt;completion_lock. That does not work with the</div><div class='del'>-	 * migration workflow of MIGRATE_SYNC_NO_COPY.</div><div class='del'>-	 */</div><div class='del'>-	if (mode == MIGRATE_SYNC_NO_COPY)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	rc = 0;</div><div class='del'>-</div><div class='del'>-	/* mapping-&gt;private_lock here protects against the kioctx teardown.  */</div><div class='del'>-	spin_lock(&amp;mapping-&gt;private_lock);</div><div class='del'>-	ctx = mapping-&gt;private_data;</div><div class='add'>+	/* mapping-&gt;i_private_lock here protects against the kioctx teardown.  */</div><div class='add'>+	spin_lock(&amp;mapping-&gt;i_private_lock);</div><div class='add'>+	ctx = mapping-&gt;i_private_data;</div><div class='ctx'> 	if (!ctx) {</div><div class='ctx'> 		rc = -EINVAL;</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -407,10 +429,10 @@ static int aio_migratepage(struct address_space *mapping, struct page *new,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	idx = old-&gt;index;</div><div class='add'>+	idx = src-&gt;index;</div><div class='ctx'> 	if (idx &lt; (pgoff_t)ctx-&gt;nr_pages) {</div><div class='del'>-		/* Make sure the old page hasn't already been changed */</div><div class='del'>-		if (ctx-&gt;ring_pages[idx] != old)</div><div class='add'>+		/* Make sure the old folio hasn't already been changed */</div><div class='add'>+		if (ctx-&gt;ring_folios[idx] != src)</div><div class='ctx'> 			rc = -EAGAIN;</div><div class='ctx'> 	} else</div><div class='ctx'> 		rc = -EINVAL;</div><div class='hunk'>@@ -419,41 +441,42 @@ static int aio_migratepage(struct address_space *mapping, struct page *new,</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='ctx'> 	/* Writeback must be complete */</div><div class='del'>-	BUG_ON(PageWriteback(old));</div><div class='del'>-	get_page(new);</div><div class='add'>+	BUG_ON(folio_test_writeback(src));</div><div class='add'>+	folio_get(dst);</div><div class='ctx'> </div><div class='del'>-	rc = migrate_page_move_mapping(mapping, new, old, 1);</div><div class='del'>-	if (rc != MIGRATEPAGE_SUCCESS) {</div><div class='del'>-		put_page(new);</div><div class='add'>+	rc = folio_migrate_mapping(mapping, dst, src, 1);</div><div class='add'>+	if (rc) {</div><div class='add'>+		folio_put(dst);</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Take completion_lock to prevent other writes to the ring buffer</div><div class='del'>-	 * while the old page is copied to the new.  This prevents new</div><div class='add'>+	 * while the old folio is copied to the new.  This prevents new</div><div class='ctx'> 	 * events from being lost.</div><div class='ctx'> 	 */</div><div class='ctx'> 	spin_lock_irqsave(&amp;ctx-&gt;completion_lock, flags);</div><div class='del'>-	migrate_page_copy(new, old);</div><div class='del'>-	BUG_ON(ctx-&gt;ring_pages[idx] != old);</div><div class='del'>-	ctx-&gt;ring_pages[idx] = new;</div><div class='add'>+	folio_copy(dst, src);</div><div class='add'>+	folio_migrate_flags(dst, src);</div><div class='add'>+	BUG_ON(ctx-&gt;ring_folios[idx] != src);</div><div class='add'>+	ctx-&gt;ring_folios[idx] = dst;</div><div class='ctx'> 	spin_unlock_irqrestore(&amp;ctx-&gt;completion_lock, flags);</div><div class='ctx'> </div><div class='del'>-	/* The old page is no longer accessible. */</div><div class='del'>-	put_page(old);</div><div class='add'>+	/* The old folio is no longer accessible. */</div><div class='add'>+	folio_put(src);</div><div class='ctx'> </div><div class='ctx'> out_unlock:</div><div class='ctx'> 	mutex_unlock(&amp;ctx-&gt;ring_lock);</div><div class='ctx'> out:</div><div class='del'>-	spin_unlock(&amp;mapping-&gt;private_lock);</div><div class='add'>+	spin_unlock(&amp;mapping-&gt;i_private_lock);</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='add'>+#else</div><div class='add'>+#define aio_migrate_folio NULL</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> static const struct address_space_operations aio_ctx_aops = {</div><div class='del'>-	.set_page_dirty = __set_page_dirty_no_writeback,</div><div class='del'>-#if IS_ENABLED(CONFIG_MIGRATION)</div><div class='del'>-	.migratepage	= aio_migratepage,</div><div class='del'>-#endif</div><div class='add'>+	.dirty_folio	= noop_dirty_folio,</div><div class='add'>+	.migrate_folio	= aio_migrate_folio,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static int aio_setup_ring(struct kioctx *ctx, unsigned int nr_events)</div><div class='hunk'>@@ -485,28 +508,30 @@ static int aio_setup_ring(struct kioctx *ctx, unsigned int nr_events)</div><div class='ctx'> 	nr_events = (PAGE_SIZE * nr_pages - sizeof(struct aio_ring))</div><div class='ctx'> 			/ sizeof(struct io_event);</div><div class='ctx'> </div><div class='del'>-	ctx-&gt;ring_pages = ctx-&gt;internal_pages;</div><div class='add'>+	ctx-&gt;ring_folios = ctx-&gt;internal_folios;</div><div class='ctx'> 	if (nr_pages &gt; AIO_RING_PAGES) {</div><div class='del'>-		ctx-&gt;ring_pages = kcalloc(nr_pages, sizeof(struct page *),</div><div class='del'>-					  GFP_KERNEL);</div><div class='del'>-		if (!ctx-&gt;ring_pages) {</div><div class='add'>+		ctx-&gt;ring_folios = kcalloc(nr_pages, sizeof(struct folio *),</div><div class='add'>+					   GFP_KERNEL);</div><div class='add'>+		if (!ctx-&gt;ring_folios) {</div><div class='ctx'> 			put_aio_ring_file(ctx);</div><div class='ctx'> 			return -ENOMEM;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; nr_pages; i++) {</div><div class='del'>-		struct page *page;</div><div class='del'>-		page = find_or_create_page(file-&gt;f_mapping,</div><div class='del'>-					   i, GFP_HIGHUSER | __GFP_ZERO);</div><div class='del'>-		if (!page)</div><div class='add'>+		struct folio *folio;</div><div class='add'>+</div><div class='add'>+		folio = __filemap_get_folio(file-&gt;f_mapping, i,</div><div class='add'>+					    FGP_LOCK | FGP_ACCESSED | FGP_CREAT,</div><div class='add'>+					    GFP_USER | __GFP_ZERO);</div><div class='add'>+		if (IS_ERR(folio))</div><div class='ctx'> 			break;</div><div class='del'>-		pr_debug("pid(%d) page[%d]-&gt;count=%d\n",</div><div class='del'>-			 current-&gt;pid, i, page_count(page));</div><div class='del'>-		SetPageUptodate(page);</div><div class='del'>-		unlock_page(page);</div><div class='ctx'> </div><div class='del'>-		ctx-&gt;ring_pages[i] = page;</div><div class='add'>+		pr_debug("pid(%d) [%d] folio-&gt;count=%d\n", current-&gt;pid, i,</div><div class='add'>+			 folio_ref_count(folio));</div><div class='add'>+		folio_end_read(folio, true);</div><div class='add'>+</div><div class='add'>+		ctx-&gt;ring_folios[i] = folio;</div><div class='ctx'> 	}</div><div class='ctx'> 	ctx-&gt;nr_pages = i;</div><div class='ctx'> </div><div class='hunk'>@@ -526,7 +551,7 @@ static int aio_setup_ring(struct kioctx *ctx, unsigned int nr_events)</div><div class='ctx'> </div><div class='ctx'> 	ctx-&gt;mmap_base = do_mmap(ctx-&gt;aio_ring_file, 0, ctx-&gt;mmap_size,</div><div class='ctx'> 				 PROT_READ | PROT_WRITE,</div><div class='del'>-				 MAP_SHARED, 0, &amp;unused, NULL);</div><div class='add'>+				 MAP_SHARED, 0, 0, &amp;unused, NULL);</div><div class='ctx'> 	mmap_write_unlock(mm);</div><div class='ctx'> 	if (IS_ERR((void *)ctx-&gt;mmap_base)) {</div><div class='ctx'> 		ctx-&gt;mmap_size = 0;</div><div class='hunk'>@@ -539,7 +564,7 @@ static int aio_setup_ring(struct kioctx *ctx, unsigned int nr_events)</div><div class='ctx'> 	ctx-&gt;user_id = ctx-&gt;mmap_base;</div><div class='ctx'> 	ctx-&gt;nr_events = nr_events; /* trusted copy */</div><div class='ctx'> </div><div class='del'>-	ring = kmap_atomic(ctx-&gt;ring_pages[0]);</div><div class='add'>+	ring = folio_address(ctx-&gt;ring_folios[0]);</div><div class='ctx'> 	ring-&gt;nr = nr_events;	/* user copy */</div><div class='ctx'> 	ring-&gt;id = ~0U;</div><div class='ctx'> 	ring-&gt;head = ring-&gt;tail = 0;</div><div class='hunk'>@@ -547,8 +572,7 @@ static int aio_setup_ring(struct kioctx *ctx, unsigned int nr_events)</div><div class='ctx'> 	ring-&gt;compat_features = AIO_RING_COMPAT_FEATURES;</div><div class='ctx'> 	ring-&gt;incompat_features = AIO_RING_INCOMPAT_FEATURES;</div><div class='ctx'> 	ring-&gt;header_length = sizeof(struct aio_ring);</div><div class='del'>-	kunmap_atomic(ring);</div><div class='del'>-	flush_dcache_page(ctx-&gt;ring_pages[0]);</div><div class='add'>+	flush_dcache_folio(ctx-&gt;ring_folios[0]);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -559,13 +583,24 @@ static int aio_setup_ring(struct kioctx *ctx, unsigned int nr_events)</div><div class='ctx'> </div><div class='ctx'> void kiocb_set_cancel_fn(struct kiocb *iocb, kiocb_cancel_fn *cancel)</div><div class='ctx'> {</div><div class='del'>-	struct aio_kiocb *req = container_of(iocb, struct aio_kiocb, rw);</div><div class='del'>-	struct kioctx *ctx = req-&gt;ki_ctx;</div><div class='add'>+	struct aio_kiocb *req;</div><div class='add'>+	struct kioctx *ctx;</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * kiocb didn't come from aio or is neither a read nor a write, hence</div><div class='add'>+	 * ignore it.</div><div class='add'>+	 */</div><div class='add'>+	if (!(iocb-&gt;ki_flags &amp; IOCB_AIO_RW))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	req = container_of(iocb, struct aio_kiocb, rw);</div><div class='add'>+</div><div class='ctx'> 	if (WARN_ON_ONCE(!list_empty(&amp;req-&gt;ki_list)))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='add'>+	ctx = req-&gt;ki_ctx;</div><div class='add'>+</div><div class='ctx'> 	spin_lock_irqsave(&amp;ctx-&gt;ctx_lock, flags);</div><div class='ctx'> 	list_add_tail(&amp;req-&gt;ki_list, &amp;ctx-&gt;active_reqs);</div><div class='ctx'> 	req-&gt;ki_cancel = cancel;</div><div class='hunk'>@@ -601,7 +636,7 @@ static void free_ioctx_reqs(struct percpu_ref *ref)</div><div class='ctx'> </div><div class='ctx'> 	/* Synchronize against RCU protected table-&gt;table[] dereferences */</div><div class='ctx'> 	INIT_RCU_WORK(&amp;ctx-&gt;free_rwork, free_ioctx);</div><div class='del'>-	queue_rcu_work(system_wq, &amp;ctx-&gt;free_rwork);</div><div class='add'>+	queue_rcu_work(system_percpu_wq, &amp;ctx-&gt;free_rwork);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -648,11 +683,10 @@ static int ioctx_add_table(struct kioctx *ctx, struct mm_struct *mm)</div><div class='ctx'> </div><div class='ctx'> 					/* While kioctx setup is in progress,</div><div class='ctx'> 					 * we are protected from page migration</div><div class='del'>-					 * changes ring_pages by -&gt;ring_lock.</div><div class='add'>+					 * changes ring_folios by -&gt;ring_lock.</div><div class='ctx'> 					 */</div><div class='del'>-					ring = kmap_atomic(ctx-&gt;ring_pages[0]);</div><div class='add'>+					ring = folio_address(ctx-&gt;ring_folios[0]);</div><div class='ctx'> 					ring-&gt;id = ctx-&gt;id;</div><div class='del'>-					kunmap_atomic(ring);</div><div class='ctx'> 					return 0;</div><div class='ctx'> 				}</div><div class='ctx'> </div><div class='hunk'>@@ -923,16 +957,13 @@ static bool __get_reqs_available(struct kioctx *ctx)</div><div class='ctx'> 	local_irq_save(flags);</div><div class='ctx'> 	kcpu = this_cpu_ptr(ctx-&gt;cpu);</div><div class='ctx'> 	if (!kcpu-&gt;reqs_available) {</div><div class='del'>-		int old, avail = atomic_read(&amp;ctx-&gt;reqs_available);</div><div class='add'>+		int avail = atomic_read(&amp;ctx-&gt;reqs_available);</div><div class='ctx'> </div><div class='ctx'> 		do {</div><div class='ctx'> 			if (avail &lt; ctx-&gt;req_batch)</div><div class='ctx'> 				goto out;</div><div class='del'>-</div><div class='del'>-			old = avail;</div><div class='del'>-			avail = atomic_cmpxchg(&amp;ctx-&gt;reqs_available,</div><div class='del'>-					       avail, avail - ctx-&gt;req_batch);</div><div class='del'>-		} while (avail != old);</div><div class='add'>+		} while (!atomic_try_cmpxchg(&amp;ctx-&gt;reqs_available,</div><div class='add'>+					     &amp;avail, avail - ctx-&gt;req_batch));</div><div class='ctx'> </div><div class='ctx'> 		kcpu-&gt;reqs_available += ctx-&gt;req_batch;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -996,9 +1027,8 @@ static void user_refill_reqs_available(struct kioctx *ctx)</div><div class='ctx'> 		 * against ctx-&gt;completed_events below will make sure we do the</div><div class='ctx'> 		 * safe/right thing.</div><div class='ctx'> 		 */</div><div class='del'>-		ring = kmap_atomic(ctx-&gt;ring_pages[0]);</div><div class='add'>+		ring = folio_address(ctx-&gt;ring_folios[0]);</div><div class='ctx'> 		head = ring-&gt;head;</div><div class='del'>-		kunmap_atomic(ring);</div><div class='ctx'> </div><div class='ctx'> 		refill_reqs_available(ctx, head, ctx-&gt;tail);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1080,6 +1110,11 @@ static inline void iocb_destroy(struct aio_kiocb *iocb)</div><div class='ctx'> 	kmem_cache_free(kiocb_cachep, iocb);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+struct aio_waiter {</div><div class='add'>+	struct wait_queue_entry	w;</div><div class='add'>+	size_t			min_nr;</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> /* aio_complete</div><div class='ctx'>  *	Called when the io request on the given iocb is complete.</div><div class='ctx'>  */</div><div class='hunk'>@@ -1088,7 +1123,7 @@ static void aio_complete(struct aio_kiocb *iocb)</div><div class='ctx'> 	struct kioctx	*ctx = iocb-&gt;ki_ctx;</div><div class='ctx'> 	struct aio_ring	*ring;</div><div class='ctx'> 	struct io_event	*ev_page, *event;</div><div class='del'>-	unsigned tail, pos, head;</div><div class='add'>+	unsigned tail, pos, head, avail;</div><div class='ctx'> 	unsigned long	flags;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1104,13 +1139,12 @@ static void aio_complete(struct aio_kiocb *iocb)</div><div class='ctx'> 	if (++tail &gt;= ctx-&gt;nr_events)</div><div class='ctx'> 		tail = 0;</div><div class='ctx'> </div><div class='del'>-	ev_page = kmap_atomic(ctx-&gt;ring_pages[pos / AIO_EVENTS_PER_PAGE]);</div><div class='add'>+	ev_page = folio_address(ctx-&gt;ring_folios[pos / AIO_EVENTS_PER_PAGE]);</div><div class='ctx'> 	event = ev_page + pos % AIO_EVENTS_PER_PAGE;</div><div class='ctx'> </div><div class='ctx'> 	*event = iocb-&gt;ki_res;</div><div class='ctx'> </div><div class='del'>-	kunmap_atomic(ev_page);</div><div class='del'>-	flush_dcache_page(ctx-&gt;ring_pages[pos / AIO_EVENTS_PER_PAGE]);</div><div class='add'>+	flush_dcache_folio(ctx-&gt;ring_folios[pos / AIO_EVENTS_PER_PAGE]);</div><div class='ctx'> </div><div class='ctx'> 	pr_debug("%p[%u]: %p: %p %Lx %Lx %Lx\n", ctx, tail, iocb,</div><div class='ctx'> 		 (void __user *)(unsigned long)iocb-&gt;ki_res.obj,</div><div class='hunk'>@@ -1123,15 +1157,18 @@ static void aio_complete(struct aio_kiocb *iocb)</div><div class='ctx'> </div><div class='ctx'> 	ctx-&gt;tail = tail;</div><div class='ctx'> </div><div class='del'>-	ring = kmap_atomic(ctx-&gt;ring_pages[0]);</div><div class='add'>+	ring = folio_address(ctx-&gt;ring_folios[0]);</div><div class='ctx'> 	head = ring-&gt;head;</div><div class='ctx'> 	ring-&gt;tail = tail;</div><div class='del'>-	kunmap_atomic(ring);</div><div class='del'>-	flush_dcache_page(ctx-&gt;ring_pages[0]);</div><div class='add'>+	flush_dcache_folio(ctx-&gt;ring_folios[0]);</div><div class='ctx'> </div><div class='ctx'> 	ctx-&gt;completed_events++;</div><div class='ctx'> 	if (ctx-&gt;completed_events &gt; 1)</div><div class='ctx'> 		refill_reqs_available(ctx, head, tail);</div><div class='add'>+</div><div class='add'>+	avail = tail &gt; head</div><div class='add'>+		? tail - head</div><div class='add'>+		: tail + ctx-&gt;nr_events - head;</div><div class='ctx'> 	spin_unlock_irqrestore(&amp;ctx-&gt;completion_lock, flags);</div><div class='ctx'> </div><div class='ctx'> 	pr_debug("added to ring %p at [%u]\n", iocb, tail);</div><div class='hunk'>@@ -1142,7 +1179,7 @@ static void aio_complete(struct aio_kiocb *iocb)</div><div class='ctx'> 	 * from IRQ context.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (iocb-&gt;ki_eventfd)</div><div class='del'>-		eventfd_signal(iocb-&gt;ki_eventfd, 1);</div><div class='add'>+		eventfd_signal(iocb-&gt;ki_eventfd);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We have to order our ring_info tail store above and test</div><div class='hunk'>@@ -1152,8 +1189,18 @@ static void aio_complete(struct aio_kiocb *iocb)</div><div class='ctx'> 	 */</div><div class='ctx'> 	smp_mb();</div><div class='ctx'> </div><div class='del'>-	if (waitqueue_active(&amp;ctx-&gt;wait))</div><div class='del'>-		wake_up(&amp;ctx-&gt;wait);</div><div class='add'>+	if (waitqueue_active(&amp;ctx-&gt;wait)) {</div><div class='add'>+		struct aio_waiter *curr, *next;</div><div class='add'>+		unsigned long flags;</div><div class='add'>+</div><div class='add'>+		spin_lock_irqsave(&amp;ctx-&gt;wait.lock, flags);</div><div class='add'>+		list_for_each_entry_safe(curr, next, &amp;ctx-&gt;wait.head, w.entry)</div><div class='add'>+			if (avail &gt;= curr-&gt;min_nr) {</div><div class='add'>+				wake_up_process(curr-&gt;w.private);</div><div class='add'>+				list_del_init_careful(&amp;curr-&gt;w.entry);</div><div class='add'>+			}</div><div class='add'>+		spin_unlock_irqrestore(&amp;ctx-&gt;wait.lock, flags);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void iocb_put(struct aio_kiocb *iocb)</div><div class='hunk'>@@ -1185,11 +1232,10 @@ static long aio_read_events_ring(struct kioctx *ctx,</div><div class='ctx'> 	sched_annotate_sleep();</div><div class='ctx'> 	mutex_lock(&amp;ctx-&gt;ring_lock);</div><div class='ctx'> </div><div class='del'>-	/* Access to -&gt;ring_pages here is protected by ctx-&gt;ring_lock. */</div><div class='del'>-	ring = kmap_atomic(ctx-&gt;ring_pages[0]);</div><div class='add'>+	/* Access to -&gt;ring_folios here is protected by ctx-&gt;ring_lock. */</div><div class='add'>+	ring = folio_address(ctx-&gt;ring_folios[0]);</div><div class='ctx'> 	head = ring-&gt;head;</div><div class='ctx'> 	tail = ring-&gt;tail;</div><div class='del'>-	kunmap_atomic(ring);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Ensure that once we've read the current tail pointer, that</div><div class='hunk'>@@ -1208,23 +1254,22 @@ static long aio_read_events_ring(struct kioctx *ctx,</div><div class='ctx'> 	while (ret &lt; nr) {</div><div class='ctx'> 		long avail;</div><div class='ctx'> 		struct io_event *ev;</div><div class='del'>-		struct page *page;</div><div class='add'>+		struct folio *folio;</div><div class='ctx'> </div><div class='ctx'> 		avail = (head &lt;= tail ?  tail : ctx-&gt;nr_events) - head;</div><div class='ctx'> 		if (head == tail)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='ctx'> 		pos = head + AIO_EVENTS_OFFSET;</div><div class='del'>-		page = ctx-&gt;ring_pages[pos / AIO_EVENTS_PER_PAGE];</div><div class='add'>+		folio = ctx-&gt;ring_folios[pos / AIO_EVENTS_PER_PAGE];</div><div class='ctx'> 		pos %= AIO_EVENTS_PER_PAGE;</div><div class='ctx'> </div><div class='ctx'> 		avail = min(avail, nr - ret);</div><div class='ctx'> 		avail = min_t(long, avail, AIO_EVENTS_PER_PAGE - pos);</div><div class='ctx'> </div><div class='del'>-		ev = kmap(page);</div><div class='add'>+		ev = folio_address(folio);</div><div class='ctx'> 		copy_ret = copy_to_user(event + ret, ev + pos,</div><div class='ctx'> 					sizeof(*ev) * avail);</div><div class='del'>-		kunmap(page);</div><div class='ctx'> </div><div class='ctx'> 		if (unlikely(copy_ret)) {</div><div class='ctx'> 			ret = -EFAULT;</div><div class='hunk'>@@ -1236,10 +1281,9 @@ static long aio_read_events_ring(struct kioctx *ctx,</div><div class='ctx'> 		head %= ctx-&gt;nr_events;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ring = kmap_atomic(ctx-&gt;ring_pages[0]);</div><div class='add'>+	ring = folio_address(ctx-&gt;ring_folios[0]);</div><div class='ctx'> 	ring-&gt;head = head;</div><div class='del'>-	kunmap_atomic(ring);</div><div class='del'>-	flush_dcache_page(ctx-&gt;ring_pages[0]);</div><div class='add'>+	flush_dcache_folio(ctx-&gt;ring_folios[0]);</div><div class='ctx'> </div><div class='ctx'> 	pr_debug("%li  h%u t%u\n", ret, head, tail);</div><div class='ctx'> out:</div><div class='hunk'>@@ -1269,7 +1313,9 @@ static long read_events(struct kioctx *ctx, long min_nr, long nr,</div><div class='ctx'> 			struct io_event __user *event,</div><div class='ctx'> 			ktime_t until)</div><div class='ctx'> {</div><div class='del'>-	long ret = 0;</div><div class='add'>+	struct hrtimer_sleeper	t;</div><div class='add'>+	struct aio_waiter	w;</div><div class='add'>+	long ret = 0, ret2 = 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Note that aio_read_events() is being called as the conditional - i.e.</div><div class='hunk'>@@ -1285,12 +1331,38 @@ static long read_events(struct kioctx *ctx, long min_nr, long nr,</div><div class='ctx'> 	 * the ringbuffer empty. So in practice we should be ok, but it's</div><div class='ctx'> 	 * something to be aware of when touching this code.</div><div class='ctx'> 	 */</div><div class='del'>-	if (until == 0)</div><div class='del'>-		aio_read_events(ctx, min_nr, nr, event, &amp;ret);</div><div class='del'>-	else</div><div class='del'>-		wait_event_interruptible_hrtimeout(ctx-&gt;wait,</div><div class='del'>-				aio_read_events(ctx, min_nr, nr, event, &amp;ret),</div><div class='del'>-				until);</div><div class='add'>+	aio_read_events(ctx, min_nr, nr, event, &amp;ret);</div><div class='add'>+	if (until == 0 || ret &lt; 0 || ret &gt;= min_nr)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	hrtimer_setup_sleeper_on_stack(&amp;t, CLOCK_MONOTONIC, HRTIMER_MODE_REL);</div><div class='add'>+	if (until != KTIME_MAX) {</div><div class='add'>+		hrtimer_set_expires_range_ns(&amp;t.timer, until, current-&gt;timer_slack_ns);</div><div class='add'>+		hrtimer_sleeper_start_expires(&amp;t, HRTIMER_MODE_REL);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	init_wait(&amp;w.w);</div><div class='add'>+</div><div class='add'>+	while (1) {</div><div class='add'>+		unsigned long nr_got = ret;</div><div class='add'>+</div><div class='add'>+		w.min_nr = min_nr - ret;</div><div class='add'>+</div><div class='add'>+		ret2 = prepare_to_wait_event(&amp;ctx-&gt;wait, &amp;w.w, TASK_INTERRUPTIBLE);</div><div class='add'>+		if (!ret2 &amp;&amp; !t.task)</div><div class='add'>+			ret2 = -ETIME;</div><div class='add'>+</div><div class='add'>+		if (aio_read_events(ctx, min_nr, nr, event, &amp;ret) || ret2)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		if (nr_got == ret)</div><div class='add'>+			schedule();</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	finish_wait(&amp;ctx-&gt;wait, &amp;w.w);</div><div class='add'>+	hrtimer_cancel(&amp;t.timer);</div><div class='add'>+	destroy_hrtimer_on_stack(&amp;t.timer);</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1426,13 +1498,8 @@ static void aio_complete_rw(struct kiocb *kiocb, long res)</div><div class='ctx'> 	if (kiocb-&gt;ki_flags &amp; IOCB_WRITE) {</div><div class='ctx'> 		struct inode *inode = file_inode(kiocb-&gt;ki_filp);</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * Tell lockdep we inherited freeze protection from submission</div><div class='del'>-		 * thread.</div><div class='del'>-		 */</div><div class='ctx'> 		if (S_ISREG(inode-&gt;i_mode))</div><div class='del'>-			__sb_writers_acquired(inode-&gt;i_sb, SB_FREEZE_WRITE);</div><div class='del'>-		file_end_write(kiocb-&gt;ki_filp);</div><div class='add'>+			kiocb_end_write(kiocb);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	iocb-&gt;ki_res.res = res;</div><div class='hunk'>@@ -1440,17 +1507,17 @@ static void aio_complete_rw(struct kiocb *kiocb, long res)</div><div class='ctx'> 	iocb_put(iocb);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int aio_prep_rw(struct kiocb *req, const struct iocb *iocb)</div><div class='add'>+static int aio_prep_rw(struct kiocb *req, const struct iocb *iocb, int rw_type)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='add'>+	req-&gt;ki_write_stream = 0;</div><div class='ctx'> 	req-&gt;ki_complete = aio_complete_rw;</div><div class='ctx'> 	req-&gt;private = NULL;</div><div class='ctx'> 	req-&gt;ki_pos = iocb-&gt;aio_offset;</div><div class='del'>-	req-&gt;ki_flags = iocb_flags(req-&gt;ki_filp);</div><div class='add'>+	req-&gt;ki_flags = req-&gt;ki_filp-&gt;f_iocb_flags | IOCB_AIO_RW;</div><div class='ctx'> 	if (iocb-&gt;aio_flags &amp; IOCB_FLAG_RESFD)</div><div class='ctx'> 		req-&gt;ki_flags |= IOCB_EVENTFD;</div><div class='del'>-	req-&gt;ki_hint = ki_hint_validate(file_write_hint(req-&gt;ki_filp));</div><div class='ctx'> 	if (iocb-&gt;aio_flags &amp; IOCB_FLAG_IOPRIO) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * If the IOCB_FLAG_IOPRIO flag of aio_flags is set, then</div><div class='hunk'>@@ -1467,7 +1534,7 @@ static int aio_prep_rw(struct kiocb *req, const struct iocb *iocb)</div><div class='ctx'> 	} else</div><div class='ctx'> 		req-&gt;ki_ioprio = get_current_ioprio();</div><div class='ctx'> </div><div class='del'>-	ret = kiocb_set_rw_flags(req, iocb-&gt;aio_rw_flags);</div><div class='add'>+	ret = kiocb_set_rw_flags(req, iocb-&gt;aio_rw_flags, rw_type);</div><div class='ctx'> 	if (unlikely(ret))</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='hunk'>@@ -1483,7 +1550,7 @@ static ssize_t aio_setup_rw(int rw, const struct iocb *iocb,</div><div class='ctx'> 	size_t len = iocb-&gt;aio_nbytes;</div><div class='ctx'> </div><div class='ctx'> 	if (!vectored) {</div><div class='del'>-		ssize_t ret = import_single_range(rw, buf, len, *iovec, iter);</div><div class='add'>+		ssize_t ret = import_ubuf(rw, buf, len, iter);</div><div class='ctx'> 		*iovec = NULL;</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1519,22 +1586,21 @@ static int aio_read(struct kiocb *req, const struct iocb *iocb,</div><div class='ctx'> 	struct file *file;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = aio_prep_rw(req, iocb);</div><div class='add'>+	ret = aio_prep_rw(req, iocb, READ);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	file = req-&gt;ki_filp;</div><div class='ctx'> 	if (unlikely(!(file-&gt;f_mode &amp; FMODE_READ)))</div><div class='ctx'> 		return -EBADF;</div><div class='del'>-	ret = -EINVAL;</div><div class='ctx'> 	if (unlikely(!file-&gt;f_op-&gt;read_iter))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	ret = aio_setup_rw(READ, iocb, &amp;iovec, vectored, compat, &amp;iter);</div><div class='add'>+	ret = aio_setup_rw(ITER_DEST, iocb, &amp;iovec, vectored, compat, &amp;iter);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	ret = rw_verify_area(READ, file, &amp;req-&gt;ki_pos, iov_iter_count(&amp;iter));</div><div class='ctx'> 	if (!ret)</div><div class='del'>-		aio_rw_done(req, call_read_iter(file, req, &amp;iter));</div><div class='add'>+		aio_rw_done(req, file-&gt;f_op-&gt;read_iter(req, &amp;iter));</div><div class='ctx'> 	kfree(iovec);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -1547,7 +1613,7 @@ static int aio_write(struct kiocb *req, const struct iocb *iocb,</div><div class='ctx'> 	struct file *file;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = aio_prep_rw(req, iocb);</div><div class='add'>+	ret = aio_prep_rw(req, iocb, WRITE);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	file = req-&gt;ki_filp;</div><div class='hunk'>@@ -1557,24 +1623,15 @@ static int aio_write(struct kiocb *req, const struct iocb *iocb,</div><div class='ctx'> 	if (unlikely(!file-&gt;f_op-&gt;write_iter))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	ret = aio_setup_rw(WRITE, iocb, &amp;iovec, vectored, compat, &amp;iter);</div><div class='add'>+	ret = aio_setup_rw(ITER_SOURCE, iocb, &amp;iovec, vectored, compat, &amp;iter);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	ret = rw_verify_area(WRITE, file, &amp;req-&gt;ki_pos, iov_iter_count(&amp;iter));</div><div class='ctx'> 	if (!ret) {</div><div class='del'>-		/*</div><div class='del'>-		 * Open-code file_start_write here to grab freeze protection,</div><div class='del'>-		 * which will be released by another thread in</div><div class='del'>-		 * aio_complete_rw().  Fool lockdep by telling it the lock got</div><div class='del'>-		 * released so that it doesn't complain about the held lock when</div><div class='del'>-		 * we return to userspace.</div><div class='del'>-		 */</div><div class='del'>-		if (S_ISREG(file_inode(file)-&gt;i_mode)) {</div><div class='del'>-			sb_start_write(file_inode(file)-&gt;i_sb);</div><div class='del'>-			__sb_writers_release(file_inode(file)-&gt;i_sb, SB_FREEZE_WRITE);</div><div class='del'>-		}</div><div class='add'>+		if (S_ISREG(file_inode(file)-&gt;i_mode))</div><div class='add'>+			kiocb_start_write(req);</div><div class='ctx'> 		req-&gt;ki_flags |= IOCB_WRITE;</div><div class='del'>-		aio_rw_done(req, call_write_iter(file, req, &amp;iter));</div><div class='add'>+		aio_rw_done(req, file-&gt;f_op-&gt;write_iter(req, &amp;iter));</div><div class='ctx'> 	}</div><div class='ctx'> 	kfree(iovec);</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -1583,10 +1640,10 @@ static int aio_write(struct kiocb *req, const struct iocb *iocb,</div><div class='ctx'> static void aio_fsync_work(struct work_struct *work)</div><div class='ctx'> {</div><div class='ctx'> 	struct aio_kiocb *iocb = container_of(work, struct aio_kiocb, fsync.work);</div><div class='del'>-	const struct cred *old_cred = override_creds(iocb-&gt;fsync.creds);</div><div class='ctx'> </div><div class='del'>-	iocb-&gt;ki_res.res = vfs_fsync(iocb-&gt;fsync.file, iocb-&gt;fsync.datasync);</div><div class='del'>-	revert_creds(old_cred);</div><div class='add'>+	scoped_with_creds(iocb-&gt;fsync.creds)</div><div class='add'>+		iocb-&gt;ki_res.res = vfs_fsync(iocb-&gt;fsync.file, iocb-&gt;fsync.datasync);</div><div class='add'>+</div><div class='ctx'> 	put_cred(iocb-&gt;fsync.creds);</div><div class='ctx'> 	iocb_put(iocb);</div><div class='ctx'> }</div><div class='hunk'>@@ -1619,6 +1676,51 @@ static void aio_poll_put_work(struct work_struct *work)</div><div class='ctx'> 	iocb_put(iocb);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Safely lock the waitqueue which the request is on, synchronizing with the</div><div class='add'>+ * case where the -&gt;poll() provider decides to free its waitqueue early.</div><div class='add'>+ *</div><div class='add'>+ * Returns true on success, meaning that req-&gt;head-&gt;lock was locked, req-&gt;wait</div><div class='add'>+ * is on req-&gt;head, and an RCU read lock was taken.  Returns false if the</div><div class='add'>+ * request was already removed from its waitqueue (which might no longer exist).</div><div class='add'>+ */</div><div class='add'>+static bool poll_iocb_lock_wq(struct poll_iocb *req)</div><div class='add'>+{</div><div class='add'>+	wait_queue_head_t *head;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * While we hold the waitqueue lock and the waitqueue is nonempty,</div><div class='add'>+	 * wake_up_pollfree() will wait for us.  However, taking the waitqueue</div><div class='add'>+	 * lock in the first place can race with the waitqueue being freed.</div><div class='add'>+	 *</div><div class='add'>+	 * We solve this as eventpoll does: by taking advantage of the fact that</div><div class='add'>+	 * all users of wake_up_pollfree() will RCU-delay the actual free.  If</div><div class='add'>+	 * we enter rcu_read_lock() and see that the pointer to the queue is</div><div class='add'>+	 * non-NULL, we can then lock it without the memory being freed out from</div><div class='add'>+	 * under us, then check whether the request is still on the queue.</div><div class='add'>+	 *</div><div class='add'>+	 * Keep holding rcu_read_lock() as long as we hold the queue lock, in</div><div class='add'>+	 * case the caller deletes the entry from the queue, leaving it empty.</div><div class='add'>+	 * In that case, only RCU prevents the queue memory from being freed.</div><div class='add'>+	 */</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	head = smp_load_acquire(&amp;req-&gt;head);</div><div class='add'>+	if (head) {</div><div class='add'>+		spin_lock(&amp;head-&gt;lock);</div><div class='add'>+		if (!list_empty(&amp;req-&gt;wait.entry))</div><div class='add'>+			return true;</div><div class='add'>+		spin_unlock(&amp;head-&gt;lock);</div><div class='add'>+	}</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void poll_iocb_unlock_wq(struct poll_iocb *req)</div><div class='add'>+{</div><div class='add'>+	spin_unlock(&amp;req-&gt;head-&gt;lock);</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void aio_poll_complete_work(struct work_struct *work)</div><div class='ctx'> {</div><div class='ctx'> 	struct poll_iocb *req = container_of(work, struct poll_iocb, work);</div><div class='hunk'>@@ -1638,14 +1740,27 @@ static void aio_poll_complete_work(struct work_struct *work)</div><div class='ctx'> 	 * avoid further branches in the fast path.</div><div class='ctx'> 	 */</div><div class='ctx'> 	spin_lock_irq(&amp;ctx-&gt;ctx_lock);</div><div class='del'>-	if (!mask &amp;&amp; !READ_ONCE(req-&gt;cancelled)) {</div><div class='del'>-		add_wait_queue(req-&gt;head, &amp;req-&gt;wait);</div><div class='del'>-		spin_unlock_irq(&amp;ctx-&gt;ctx_lock);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='add'>+	if (poll_iocb_lock_wq(req)) {</div><div class='add'>+		if (!mask &amp;&amp; !READ_ONCE(req-&gt;cancelled)) {</div><div class='add'>+			/*</div><div class='add'>+			 * The request isn't actually ready to be completed yet.</div><div class='add'>+			 * Reschedule completion if another wakeup came in.</div><div class='add'>+			 */</div><div class='add'>+			if (req-&gt;work_need_resched) {</div><div class='add'>+				schedule_work(&amp;req-&gt;work);</div><div class='add'>+				req-&gt;work_need_resched = false;</div><div class='add'>+			} else {</div><div class='add'>+				req-&gt;work_scheduled = false;</div><div class='add'>+			}</div><div class='add'>+			poll_iocb_unlock_wq(req);</div><div class='add'>+			spin_unlock_irq(&amp;ctx-&gt;ctx_lock);</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+		list_del_init(&amp;req-&gt;wait.entry);</div><div class='add'>+		poll_iocb_unlock_wq(req);</div><div class='add'>+	} /* else, POLLFREE has freed the waitqueue, so we must complete */</div><div class='ctx'> 	list_del_init(&amp;iocb-&gt;ki_list);</div><div class='ctx'> 	iocb-&gt;ki_res.res = mangle_poll(mask);</div><div class='del'>-	req-&gt;done = true;</div><div class='ctx'> 	spin_unlock_irq(&amp;ctx-&gt;ctx_lock);</div><div class='ctx'> </div><div class='ctx'> 	iocb_put(iocb);</div><div class='hunk'>@@ -1657,13 +1772,14 @@ static int aio_poll_cancel(struct kiocb *iocb)</div><div class='ctx'> 	struct aio_kiocb *aiocb = container_of(iocb, struct aio_kiocb, rw);</div><div class='ctx'> 	struct poll_iocb *req = &amp;aiocb-&gt;poll;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;req-&gt;head-&gt;lock);</div><div class='del'>-	WRITE_ONCE(req-&gt;cancelled, true);</div><div class='del'>-	if (!list_empty(&amp;req-&gt;wait.entry)) {</div><div class='del'>-		list_del_init(&amp;req-&gt;wait.entry);</div><div class='del'>-		schedule_work(&amp;aiocb-&gt;poll.work);</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;req-&gt;head-&gt;lock);</div><div class='add'>+	if (poll_iocb_lock_wq(req)) {</div><div class='add'>+		WRITE_ONCE(req-&gt;cancelled, true);</div><div class='add'>+		if (!req-&gt;work_scheduled) {</div><div class='add'>+			schedule_work(&amp;aiocb-&gt;poll.work);</div><div class='add'>+			req-&gt;work_scheduled = true;</div><div class='add'>+		}</div><div class='add'>+		poll_iocb_unlock_wq(req);</div><div class='add'>+	} /* else, the request was force-cancelled by POLLFREE already */</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -1680,21 +1796,27 @@ static int aio_poll_wake(struct wait_queue_entry *wait, unsigned mode, int sync,</div><div class='ctx'> 	if (mask &amp;&amp; !(mask &amp; req-&gt;events))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	list_del_init(&amp;req-&gt;wait.entry);</div><div class='del'>-</div><div class='del'>-	if (mask &amp;&amp; spin_trylock_irqsave(&amp;iocb-&gt;ki_ctx-&gt;ctx_lock, flags)) {</div><div class='add'>+	/*</div><div class='add'>+	 * Complete the request inline if possible.  This requires that three</div><div class='add'>+	 * conditions be met:</div><div class='add'>+	 *   1. An event mask must have been passed.  If a plain wakeup was done</div><div class='add'>+	 *	instead, then mask == 0 and we have to call vfs_poll() to get</div><div class='add'>+	 *	the events, so inline completion isn't possible.</div><div class='add'>+	 *   2. The completion work must not have already been scheduled.</div><div class='add'>+	 *   3. ctx_lock must not be busy.  We have to use trylock because we</div><div class='add'>+	 *	already hold the waitqueue lock, so this inverts the normal</div><div class='add'>+	 *	locking order.  Use irqsave/irqrestore because not all</div><div class='add'>+	 *	filesystems (e.g. fuse) call this function with IRQs disabled,</div><div class='add'>+	 *	yet IRQs have to be disabled before ctx_lock is obtained.</div><div class='add'>+	 */</div><div class='add'>+	if (mask &amp;&amp; !req-&gt;work_scheduled &amp;&amp;</div><div class='add'>+	    spin_trylock_irqsave(&amp;iocb-&gt;ki_ctx-&gt;ctx_lock, flags)) {</div><div class='ctx'> 		struct kioctx *ctx = iocb-&gt;ki_ctx;</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * Try to complete the iocb inline if we can. Use</div><div class='del'>-		 * irqsave/irqrestore because not all filesystems (e.g. fuse)</div><div class='del'>-		 * call this function with IRQs disabled and because IRQs</div><div class='del'>-		 * have to be disabled before ctx_lock is obtained.</div><div class='del'>-		 */</div><div class='add'>+		list_del_init(&amp;req-&gt;wait.entry);</div><div class='ctx'> 		list_del(&amp;iocb-&gt;ki_list);</div><div class='ctx'> 		iocb-&gt;ki_res.res = mangle_poll(mask);</div><div class='del'>-		req-&gt;done = true;</div><div class='del'>-		if (iocb-&gt;ki_eventfd &amp;&amp; eventfd_signal_allowed()) {</div><div class='add'>+		if (iocb-&gt;ki_eventfd &amp;&amp; !eventfd_signal_allowed()) {</div><div class='ctx'> 			iocb = NULL;</div><div class='ctx'> 			INIT_WORK(&amp;req-&gt;work, aio_poll_put_work);</div><div class='ctx'> 			schedule_work(&amp;req-&gt;work);</div><div class='hunk'>@@ -1703,7 +1825,43 @@ static int aio_poll_wake(struct wait_queue_entry *wait, unsigned mode, int sync,</div><div class='ctx'> 		if (iocb)</div><div class='ctx'> 			iocb_put(iocb);</div><div class='ctx'> 	} else {</div><div class='del'>-		schedule_work(&amp;req-&gt;work);</div><div class='add'>+		/*</div><div class='add'>+		 * Schedule the completion work if needed.  If it was already</div><div class='add'>+		 * scheduled, record that another wakeup came in.</div><div class='add'>+		 *</div><div class='add'>+		 * Don't remove the request from the waitqueue here, as it might</div><div class='add'>+		 * not actually be complete yet (we won't know until vfs_poll()</div><div class='add'>+		 * is called), and we must not miss any wakeups.  POLLFREE is an</div><div class='add'>+		 * exception to this; see below.</div><div class='add'>+		 */</div><div class='add'>+		if (req-&gt;work_scheduled) {</div><div class='add'>+			req-&gt;work_need_resched = true;</div><div class='add'>+		} else {</div><div class='add'>+			schedule_work(&amp;req-&gt;work);</div><div class='add'>+			req-&gt;work_scheduled = true;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * If the waitqueue is being freed early but we can't complete</div><div class='add'>+		 * the request inline, we have to tear down the request as best</div><div class='add'>+		 * we can.  That means immediately removing the request from its</div><div class='add'>+		 * waitqueue and preventing all further accesses to the</div><div class='add'>+		 * waitqueue via the request.  We also need to schedule the</div><div class='add'>+		 * completion work (done above).  Also mark the request as</div><div class='add'>+		 * cancelled, to potentially skip an unneeded call to -&gt;poll().</div><div class='add'>+		 */</div><div class='add'>+		if (mask &amp; POLLFREE) {</div><div class='add'>+			WRITE_ONCE(req-&gt;cancelled, true);</div><div class='add'>+			list_del_init(&amp;req-&gt;wait.entry);</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * Careful: this *must* be the last step, since as soon</div><div class='add'>+			 * as req-&gt;head is NULL'ed out, the request can be</div><div class='add'>+			 * completed and freed, since aio_poll_complete_work()</div><div class='add'>+			 * will no longer need to take the waitqueue lock.</div><div class='add'>+			 */</div><div class='add'>+			smp_store_release(&amp;req-&gt;head, NULL);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> 	return 1;</div><div class='ctx'> }</div><div class='hunk'>@@ -1711,6 +1869,7 @@ static int aio_poll_wake(struct wait_queue_entry *wait, unsigned mode, int sync,</div><div class='ctx'> struct aio_poll_table {</div><div class='ctx'> 	struct poll_table_struct	pt;</div><div class='ctx'> 	struct aio_kiocb		*iocb;</div><div class='add'>+	bool				queued;</div><div class='ctx'> 	int				error;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -1721,11 +1880,12 @@ aio_poll_queue_proc(struct file *file, struct wait_queue_head *head,</div><div class='ctx'> 	struct aio_poll_table *pt = container_of(p, struct aio_poll_table, pt);</div><div class='ctx'> </div><div class='ctx'> 	/* multiple wait queues per file are not supported */</div><div class='del'>-	if (unlikely(pt-&gt;iocb-&gt;poll.head)) {</div><div class='add'>+	if (unlikely(pt-&gt;queued)) {</div><div class='ctx'> 		pt-&gt;error = -EINVAL;</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	pt-&gt;queued = true;</div><div class='ctx'> 	pt-&gt;error = 0;</div><div class='ctx'> 	pt-&gt;iocb-&gt;poll.head = head;</div><div class='ctx'> 	add_wait_queue(head, &amp;pt-&gt;iocb-&gt;poll.wait);</div><div class='hunk'>@@ -1750,12 +1910,14 @@ static int aio_poll(struct aio_kiocb *aiocb, const struct iocb *iocb)</div><div class='ctx'> 	req-&gt;events = demangle_poll(iocb-&gt;aio_buf) | EPOLLERR | EPOLLHUP;</div><div class='ctx'> </div><div class='ctx'> 	req-&gt;head = NULL;</div><div class='del'>-	req-&gt;done = false;</div><div class='ctx'> 	req-&gt;cancelled = false;</div><div class='add'>+	req-&gt;work_scheduled = false;</div><div class='add'>+	req-&gt;work_need_resched = false;</div><div class='ctx'> </div><div class='ctx'> 	apt.pt._qproc = aio_poll_queue_proc;</div><div class='ctx'> 	apt.pt._key = req-&gt;events;</div><div class='ctx'> 	apt.iocb = aiocb;</div><div class='add'>+	apt.queued = false;</div><div class='ctx'> 	apt.error = -EINVAL; /* same as no support for IOCB_CMD_POLL */</div><div class='ctx'> </div><div class='ctx'> 	/* initialized the list so that we can do list_empty checks */</div><div class='hunk'>@@ -1764,23 +1926,35 @@ static int aio_poll(struct aio_kiocb *aiocb, const struct iocb *iocb)</div><div class='ctx'> </div><div class='ctx'> 	mask = vfs_poll(req-&gt;file, &amp;apt.pt) &amp; req-&gt;events;</div><div class='ctx'> 	spin_lock_irq(&amp;ctx-&gt;ctx_lock);</div><div class='del'>-	if (likely(req-&gt;head)) {</div><div class='del'>-		spin_lock(&amp;req-&gt;head-&gt;lock);</div><div class='del'>-		if (unlikely(list_empty(&amp;req-&gt;wait.entry))) {</div><div class='del'>-			if (apt.error)</div><div class='add'>+	if (likely(apt.queued)) {</div><div class='add'>+		bool on_queue = poll_iocb_lock_wq(req);</div><div class='add'>+</div><div class='add'>+		if (!on_queue || req-&gt;work_scheduled) {</div><div class='add'>+			/*</div><div class='add'>+			 * aio_poll_wake() already either scheduled the async</div><div class='add'>+			 * completion work, or completed the request inline.</div><div class='add'>+			 */</div><div class='add'>+			if (apt.error) /* unsupported case: multiple queues */</div><div class='ctx'> 				cancel = true;</div><div class='ctx'> 			apt.error = 0;</div><div class='ctx'> 			mask = 0;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (mask || apt.error) {</div><div class='add'>+			/* Steal to complete synchronously. */</div><div class='ctx'> 			list_del_init(&amp;req-&gt;wait.entry);</div><div class='ctx'> 		} else if (cancel) {</div><div class='add'>+			/* Cancel if possible (may be too late though). */</div><div class='ctx'> 			WRITE_ONCE(req-&gt;cancelled, true);</div><div class='del'>-		} else if (!req-&gt;done) { /* actually waiting for an event */</div><div class='add'>+		} else if (on_queue) {</div><div class='add'>+			/*</div><div class='add'>+			 * Actually waiting for an event, so add the request to</div><div class='add'>+			 * active_reqs so that it can be cancelled if needed.</div><div class='add'>+			 */</div><div class='ctx'> 			list_add_tail(&amp;aiocb-&gt;ki_list, &amp;ctx-&gt;active_reqs);</div><div class='ctx'> 			aiocb-&gt;ki_cancel = aio_poll_cancel;</div><div class='ctx'> 		}</div><div class='del'>-		spin_unlock(&amp;req-&gt;head-&gt;lock);</div><div class='add'>+		if (on_queue)</div><div class='add'>+			poll_iocb_unlock_wq(req);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (mask) { /* no async, we'd stolen it */</div><div class='ctx'> 		aiocb-&gt;ki_res.res = mangle_poll(mask);</div><div class='hunk'>@@ -2018,7 +2192,6 @@ SYSCALL_DEFINE3(io_cancel, aio_context_t, ctx_id, struct iocb __user *, iocb,</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock_irq(&amp;ctx-&gt;ctx_lock);</div><div class='del'>-	/* TODO: use a hash or array, this sucks. */</div><div class='ctx'> 	list_for_each_entry(kiocb, &amp;ctx-&gt;active_reqs, ki_list) {</div><div class='ctx'> 		if (kiocb-&gt;ki_res.obj == obj) {</div><div class='ctx'> 			ret = kiocb-&gt;ki_cancel(&amp;kiocb-&gt;rw);</div><div class='head'>diff --git a/fs/anon_inodes.c b/fs/anon_inodes.c<br/>index e0c3e33c4177..b8381c7fb636 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/anon_inodes.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/anon_inodes.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/anon_inodes.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/anon_inodes.c</a></div><div class='hunk'>@@ -24,15 +24,56 @@</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/uaccess.h&gt;</div><div class='ctx'> </div><div class='del'>-static struct vfsmount *anon_inode_mnt __read_mostly;</div><div class='del'>-static struct inode *anon_inode_inode;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+static struct vfsmount *anon_inode_mnt __ro_after_init;</div><div class='add'>+static struct inode *anon_inode_inode __ro_after_init;</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * User space expects anonymous inodes to have no file type in st_mode.</div><div class='add'>+ *</div><div class='add'>+ * In particular, 'lsof' has this legacy logic:</div><div class='add'>+ *</div><div class='add'>+ *	type = s-&gt;st_mode &amp; S_IFMT;</div><div class='add'>+ *	switch (type) {</div><div class='add'>+ *	  ...</div><div class='add'>+ *	case 0:</div><div class='add'>+ *		if (!strcmp(p, "anon_inode"))</div><div class='add'>+ *			Lf-&gt;ntype = Ntype = N_ANON_INODE;</div><div class='add'>+ *</div><div class='add'>+ * to detect our old anon_inode logic.</div><div class='add'>+ *</div><div class='add'>+ * Rather than mess with our internal sane inode data, just fix it</div><div class='add'>+ * up here in getattr() by masking off the format bits.</div><div class='add'>+ */</div><div class='add'>+int anon_inode_getattr(struct mnt_idmap *idmap, const struct path *path,</div><div class='add'>+		       struct kstat *stat, u32 request_mask,</div><div class='add'>+		       unsigned int query_flags)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = d_inode(path-&gt;dentry);</div><div class='add'>+</div><div class='add'>+	generic_fillattr(&amp;nop_mnt_idmap, request_mask, inode, stat);</div><div class='add'>+	stat-&gt;mode &amp;= ~S_IFMT;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int anon_inode_setattr(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='add'>+		       struct iattr *attr)</div><div class='add'>+{</div><div class='add'>+	return -EOPNOTSUPP;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct inode_operations anon_inode_operations = {</div><div class='add'>+	.getattr = anon_inode_getattr,</div><div class='add'>+	.setattr = anon_inode_setattr,</div><div class='add'>+};</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * anon_inodefs_dname() is called from d_path().</div><div class='ctx'>  */</div><div class='ctx'> static char *anon_inodefs_dname(struct dentry *dentry, char *buffer, int buflen)</div><div class='ctx'> {</div><div class='del'>-	return dynamic_dname(dentry, buffer, buflen, "anon_inode:%s",</div><div class='add'>+	return dynamic_dname(buffer, buflen, "anon_inode:%s",</div><div class='ctx'> 				dentry-&gt;d_name.name);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -45,6 +86,8 @@ static int anon_inodefs_init_fs_context(struct fs_context *fc)</div><div class='ctx'> 	struct pseudo_fs_context *ctx = init_pseudo(fc, ANON_INODE_FS_MAGIC);</div><div class='ctx'> 	if (!ctx)</div><div class='ctx'> 		return -ENOMEM;</div><div class='add'>+	fc-&gt;s_iflags |= SB_I_NOEXEC;</div><div class='add'>+	fc-&gt;s_iflags |= SB_I_NODEV;</div><div class='ctx'> 	ctx-&gt;dops = &amp;anon_inodefs_dentry_operations;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -55,31 +98,44 @@ static struct file_system_type anon_inode_fs_type = {</div><div class='ctx'> 	.kill_sb	= kill_anon_super,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static struct inode *anon_inode_make_secure_inode(</div><div class='del'>-	const char *name,</div><div class='del'>-	const struct inode *context_inode)</div><div class='add'>+/**</div><div class='add'>+ * anon_inode_make_secure_inode - allocate an anonymous inode with security context</div><div class='add'>+ * @sb:		[in]	Superblock to allocate from</div><div class='add'>+ * @name:	[in]	Name of the class of the newfile (e.g., "secretmem")</div><div class='add'>+ * @context_inode:</div><div class='add'>+ *		[in]	Optional parent inode for security inheritance</div><div class='add'>+ *</div><div class='add'>+ * The function ensures proper security initialization through the LSM hook</div><div class='add'>+ * security_inode_init_security_anon().</div><div class='add'>+ *</div><div class='add'>+ * Return:	Pointer to new inode on success, ERR_PTR on failure.</div><div class='add'>+ */</div><div class='add'>+struct inode *anon_inode_make_secure_inode(struct super_block *sb, const char *name,</div><div class='add'>+					   const struct inode *context_inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='del'>-	const struct qstr qname = QSTR_INIT(name, strlen(name));</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	inode = alloc_anon_inode(anon_inode_mnt-&gt;mnt_sb);</div><div class='add'>+	inode = alloc_anon_inode(sb);</div><div class='ctx'> 	if (IS_ERR(inode))</div><div class='ctx'> 		return inode;</div><div class='ctx'> 	inode-&gt;i_flags &amp;= ~S_PRIVATE;</div><div class='del'>-	error =	security_inode_init_security_anon(inode, &amp;qname, context_inode);</div><div class='add'>+	inode-&gt;i_op = &amp;anon_inode_operations;</div><div class='add'>+	error =	security_inode_init_security_anon(inode, &amp;QSTR(name),</div><div class='add'>+						  context_inode);</div><div class='ctx'> 	if (error) {</div><div class='ctx'> 		iput(inode);</div><div class='ctx'> 		return ERR_PTR(error);</div><div class='ctx'> 	}</div><div class='ctx'> 	return inode;</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL_FOR_MODULES(anon_inode_make_secure_inode, "kvm");</div><div class='ctx'> </div><div class='ctx'> static struct file *__anon_inode_getfile(const char *name,</div><div class='ctx'> 					 const struct file_operations *fops,</div><div class='ctx'> 					 void *priv, int flags,</div><div class='ctx'> 					 const struct inode *context_inode,</div><div class='del'>-					 bool secure)</div><div class='add'>+					 bool make_inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct file *file;</div><div class='hunk'>@@ -87,8 +143,9 @@ static struct file *__anon_inode_getfile(const char *name,</div><div class='ctx'> 	if (fops-&gt;owner &amp;&amp; !try_module_get(fops-&gt;owner))</div><div class='ctx'> 		return ERR_PTR(-ENOENT);</div><div class='ctx'> </div><div class='del'>-	if (secure) {</div><div class='del'>-		inode =	anon_inode_make_secure_inode(name, context_inode);</div><div class='add'>+	if (make_inode) {</div><div class='add'>+		inode =	anon_inode_make_secure_inode(anon_inode_mnt-&gt;mnt_sb,</div><div class='add'>+						     name, context_inode);</div><div class='ctx'> 		if (IS_ERR(inode)) {</div><div class='ctx'> 			file = ERR_CAST(inode);</div><div class='ctx'> 			goto err;</div><div class='hunk'>@@ -149,13 +206,42 @@ struct file *anon_inode_getfile(const char *name,</div><div class='ctx'> EXPORT_SYMBOL_GPL(anon_inode_getfile);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * anon_inode_getfile_secure - Like anon_inode_getfile(), but creates a new</div><div class='add'>+ * anon_inode_getfile_fmode - creates a new file instance by hooking it up to an</div><div class='add'>+ *                      anonymous inode, and a dentry that describe the "class"</div><div class='add'>+ *                      of the file</div><div class='add'>+ *</div><div class='add'>+ * @name:    [in]    name of the "class" of the new file</div><div class='add'>+ * @fops:    [in]    file operations for the new file</div><div class='add'>+ * @priv:    [in]    private data for the new file (will be file's private_data)</div><div class='add'>+ * @flags:   [in]    flags</div><div class='add'>+ * @f_mode:  [in]    fmode</div><div class='add'>+ *</div><div class='add'>+ * Creates a new file by hooking it on a single inode. This is useful for files</div><div class='add'>+ * that do not need to have a full-fledged inode in order to operate correctly.</div><div class='add'>+ * All the files created with anon_inode_getfile() will share a single inode,</div><div class='add'>+ * hence saving memory and avoiding code duplication for the file/inode/dentry</div><div class='add'>+ * setup. Allows setting the fmode. Returns the newly created file* or an error</div><div class='add'>+ * pointer.</div><div class='add'>+ */</div><div class='add'>+struct file *anon_inode_getfile_fmode(const char *name,</div><div class='add'>+				const struct file_operations *fops,</div><div class='add'>+				void *priv, int flags, fmode_t f_mode)</div><div class='add'>+{</div><div class='add'>+	struct file *file;</div><div class='add'>+</div><div class='add'>+	file = __anon_inode_getfile(name, fops, priv, flags, NULL, false);</div><div class='add'>+	if (!IS_ERR(file))</div><div class='add'>+		file-&gt;f_mode |= f_mode;</div><div class='add'>+</div><div class='add'>+	return file;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(anon_inode_getfile_fmode);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * anon_inode_create_getfile - Like anon_inode_getfile(), but creates a new</div><div class='ctx'>  *                             !S_PRIVATE anon inode rather than reuse the</div><div class='ctx'>  *                             singleton anon inode and calls the</div><div class='del'>- *                             inode_init_security_anon() LSM hook.  This</div><div class='del'>- *                             allows for both the inode to have its own</div><div class='del'>- *                             security context and for the LSM to enforce</div><div class='del'>- *                             policy on the inode's creation.</div><div class='add'>+ *                             inode_init_security_anon() LSM hook.</div><div class='ctx'>  *</div><div class='ctx'>  * @name:    [in]    name of the "class" of the new file</div><div class='ctx'>  * @fops:    [in]    file operations for the new file</div><div class='hunk'>@@ -164,11 +250,21 @@ EXPORT_SYMBOL_GPL(anon_inode_getfile);</div><div class='ctx'>  * @context_inode:</div><div class='ctx'>  *           [in]    the logical relationship with the new inode (optional)</div><div class='ctx'>  *</div><div class='add'>+ * Create a new anonymous inode and file pair.  This can be done for two</div><div class='add'>+ * reasons:</div><div class='add'>+ *</div><div class='add'>+ * - for the inode to have its own security context, so that LSMs can enforce</div><div class='add'>+ *   policy on the inode's creation;</div><div class='add'>+ *</div><div class='add'>+ * - if the caller needs a unique inode, for example in order to customize</div><div class='add'>+ *   the size returned by fstat()</div><div class='add'>+ *</div><div class='ctx'>  * The LSM may use @context_inode in inode_init_security_anon(), but a</div><div class='del'>- * reference to it is not held.  Returns the newly created file* or an error</div><div class='del'>- * pointer.  See the anon_inode_getfile() documentation for more information.</div><div class='add'>+ * reference to it is not held.</div><div class='add'>+ *</div><div class='add'>+ * Returns the newly created file* or an error pointer.</div><div class='ctx'>  */</div><div class='del'>-struct file *anon_inode_getfile_secure(const char *name,</div><div class='add'>+struct file *anon_inode_create_getfile(const char *name,</div><div class='ctx'> 				       const struct file_operations *fops,</div><div class='ctx'> 				       void *priv, int flags,</div><div class='ctx'> 				       const struct inode *context_inode)</div><div class='hunk'>@@ -176,34 +272,16 @@ struct file *anon_inode_getfile_secure(const char *name,</div><div class='ctx'> 	return __anon_inode_getfile(name, fops, priv, flags,</div><div class='ctx'> 				    context_inode, true);</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL_GPL(anon_inode_create_getfile);</div><div class='ctx'> </div><div class='ctx'> static int __anon_inode_getfd(const char *name,</div><div class='ctx'> 			      const struct file_operations *fops,</div><div class='ctx'> 			      void *priv, int flags,</div><div class='ctx'> 			      const struct inode *context_inode,</div><div class='del'>-			      bool secure)</div><div class='add'>+			      bool make_inode)</div><div class='ctx'> {</div><div class='del'>-	int error, fd;</div><div class='del'>-	struct file *file;</div><div class='del'>-</div><div class='del'>-	error = get_unused_fd_flags(flags);</div><div class='del'>-	if (error &lt; 0)</div><div class='del'>-		return error;</div><div class='del'>-	fd = error;</div><div class='del'>-</div><div class='del'>-	file = __anon_inode_getfile(name, fops, priv, flags, context_inode,</div><div class='del'>-				    secure);</div><div class='del'>-	if (IS_ERR(file)) {</div><div class='del'>-		error = PTR_ERR(file);</div><div class='del'>-		goto err_put_unused_fd;</div><div class='del'>-	}</div><div class='del'>-	fd_install(fd, file);</div><div class='del'>-</div><div class='del'>-	return fd;</div><div class='del'>-</div><div class='del'>-err_put_unused_fd:</div><div class='del'>-	put_unused_fd(fd);</div><div class='del'>-	return error;</div><div class='add'>+	return FD_ADD(flags, __anon_inode_getfile(name, fops, priv, flags,</div><div class='add'>+						  context_inode, make_inode));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -231,10 +309,9 @@ int anon_inode_getfd(const char *name, const struct file_operations *fops,</div><div class='ctx'> EXPORT_SYMBOL_GPL(anon_inode_getfd);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * anon_inode_getfd_secure - Like anon_inode_getfd(), but creates a new</div><div class='add'>+ * anon_inode_create_getfd - Like anon_inode_getfd(), but creates a new</div><div class='ctx'>  * !S_PRIVATE anon inode rather than reuse the singleton anon inode, and calls</div><div class='del'>- * the inode_init_security_anon() LSM hook. This allows the inode to have its</div><div class='del'>- * own security context and for a LSM to reject creation of the inode.</div><div class='add'>+ * the inode_init_security_anon() LSM hook.</div><div class='ctx'>  *</div><div class='ctx'>  * @name:    [in]    name of the "class" of the new file</div><div class='ctx'>  * @fops:    [in]    file operations for the new file</div><div class='hunk'>@@ -243,16 +320,27 @@ EXPORT_SYMBOL_GPL(anon_inode_getfd);</div><div class='ctx'>  * @context_inode:</div><div class='ctx'>  *           [in]    the logical relationship with the new inode (optional)</div><div class='ctx'>  *</div><div class='add'>+ * Create a new anonymous inode and file pair.  This can be done for two</div><div class='add'>+ * reasons:</div><div class='add'>+ *</div><div class='add'>+ * - for the inode to have its own security context, so that LSMs can enforce</div><div class='add'>+ *   policy on the inode's creation;</div><div class='add'>+ *</div><div class='add'>+ * - if the caller needs a unique inode, for example in order to customize</div><div class='add'>+ *   the size returned by fstat()</div><div class='add'>+ *</div><div class='ctx'>  * The LSM may use @context_inode in inode_init_security_anon(), but a</div><div class='ctx'>  * reference to it is not held.</div><div class='add'>+ *</div><div class='add'>+ * Returns a newly created file descriptor or an error code.</div><div class='ctx'>  */</div><div class='del'>-int anon_inode_getfd_secure(const char *name, const struct file_operations *fops,</div><div class='add'>+int anon_inode_create_getfd(const char *name, const struct file_operations *fops,</div><div class='ctx'> 			    void *priv, int flags,</div><div class='ctx'> 			    const struct inode *context_inode)</div><div class='ctx'> {</div><div class='ctx'> 	return __anon_inode_getfd(name, fops, priv, flags, context_inode, true);</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL_GPL(anon_inode_getfd_secure);</div><div class='add'>+</div><div class='ctx'> </div><div class='ctx'> static int __init anon_inode_init(void)</div><div class='ctx'> {</div><div class='hunk'>@@ -263,6 +351,7 @@ static int __init anon_inode_init(void)</div><div class='ctx'> 	anon_inode_inode = alloc_anon_inode(anon_inode_mnt-&gt;mnt_sb);</div><div class='ctx'> 	if (IS_ERR(anon_inode_inode))</div><div class='ctx'> 		panic("anon_inode_init() inode allocation failed (%ld)\n", PTR_ERR(anon_inode_inode));</div><div class='add'>+	anon_inode_inode-&gt;i_op = &amp;anon_inode_operations;</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/attr.c b/fs/attr.c<br/>index 473d21b3a86d..b9ec6b47bab2 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/attr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/attr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/attr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/attr.c</a></div><div class='hunk'>@@ -14,32 +14,93 @@</div><div class='ctx'> #include &lt;linux/capability.h&gt;</div><div class='ctx'> #include &lt;linux/fsnotify.h&gt;</div><div class='ctx'> #include &lt;linux/fcntl.h&gt;</div><div class='add'>+#include &lt;linux/filelock.h&gt;</div><div class='ctx'> #include &lt;linux/security.h&gt;</div><div class='del'>-#include &lt;linux/evm.h&gt;</div><div class='del'>-#include &lt;linux/ima.h&gt;</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * setattr_should_drop_sgid - determine whether the setgid bit needs to be</div><div class='add'>+ *                            removed</div><div class='add'>+ * @idmap:	idmap of the mount @inode was found from</div><div class='add'>+ * @inode:	inode to check</div><div class='add'>+ *</div><div class='add'>+ * This function determines whether the setgid bit needs to be removed.</div><div class='add'>+ * We retain backwards compatibility and require setgid bit to be removed</div><div class='add'>+ * unconditionally if S_IXGRP is set. Otherwise we have the exact same</div><div class='add'>+ * requirements as setattr_prepare() and setattr_copy().</div><div class='add'>+ *</div><div class='add'>+ * Return: ATTR_KILL_SGID if setgid bit needs to be removed, 0 otherwise.</div><div class='add'>+ */</div><div class='add'>+int setattr_should_drop_sgid(struct mnt_idmap *idmap,</div><div class='add'>+			     const struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	umode_t mode = inode-&gt;i_mode;</div><div class='add'>+</div><div class='add'>+	if (!(mode &amp; S_ISGID))</div><div class='add'>+		return 0;</div><div class='add'>+	if (mode &amp; S_IXGRP)</div><div class='add'>+		return ATTR_KILL_SGID;</div><div class='add'>+	if (!in_group_or_capable(idmap, inode, i_gid_into_vfsgid(idmap, inode)))</div><div class='add'>+		return ATTR_KILL_SGID;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(setattr_should_drop_sgid);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * setattr_should_drop_suidgid - determine whether the set{g,u}id bit needs to</div><div class='add'>+ *                               be dropped</div><div class='add'>+ * @idmap:	idmap of the mount @inode was found from</div><div class='add'>+ * @inode:	inode to check</div><div class='add'>+ *</div><div class='add'>+ * This function determines whether the set{g,u}id bits need to be removed.</div><div class='add'>+ * If the setuid bit needs to be removed ATTR_KILL_SUID is returned. If the</div><div class='add'>+ * setgid bit needs to be removed ATTR_KILL_SGID is returned. If both</div><div class='add'>+ * set{g,u}id bits need to be removed the corresponding mask of both flags is</div><div class='add'>+ * returned.</div><div class='add'>+ *</div><div class='add'>+ * Return: A mask of ATTR_KILL_S{G,U}ID indicating which - if any - setid bits</div><div class='add'>+ * to remove, 0 otherwise.</div><div class='add'>+ */</div><div class='add'>+int setattr_should_drop_suidgid(struct mnt_idmap *idmap,</div><div class='add'>+				struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	umode_t mode = inode-&gt;i_mode;</div><div class='add'>+	int kill = 0;</div><div class='add'>+</div><div class='add'>+	/* suid always must be killed */</div><div class='add'>+	if (unlikely(mode &amp; S_ISUID))</div><div class='add'>+		kill = ATTR_KILL_SUID;</div><div class='add'>+</div><div class='add'>+	kill |= setattr_should_drop_sgid(idmap, inode);</div><div class='add'>+</div><div class='add'>+	if (unlikely(kill &amp;&amp; !capable(CAP_FSETID) &amp;&amp; S_ISREG(mode)))</div><div class='add'>+		return kill;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(setattr_should_drop_suidgid);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * chown_ok - verify permissions to chown inode</div><div class='del'>- * @mnt_userns:	user namespace of the mount @inode was found from</div><div class='add'>+ * @idmap:	idmap of the mount @inode was found from</div><div class='ctx'>  * @inode:	inode to check permissions on</div><div class='del'>- * @uid:	uid to chown @inode to</div><div class='add'>+ * @ia_vfsuid:	uid to chown @inode to</div><div class='ctx'>  *</div><div class='del'>- * If the inode has been found through an idmapped mount the user namespace of</div><div class='del'>- * the vfsmount must be passed through @mnt_userns. This function will then</div><div class='del'>- * take care to map the inode according to @mnt_userns before checking</div><div class='add'>+ * If the inode has been found through an idmapped mount the idmap of</div><div class='add'>+ * the vfsmount must be passed through @idmap. This function will then</div><div class='add'>+ * take care to map the inode according to @idmap before checking</div><div class='ctx'>  * permissions. On non-idmapped mounts or if permission checking is to be</div><div class='del'>- * performed on the raw inode simply passs init_user_ns.</div><div class='add'>+ * performed on the raw inode simply pass @nop_mnt_idmap.</div><div class='ctx'>  */</div><div class='del'>-static bool chown_ok(struct user_namespace *mnt_userns,</div><div class='del'>-		     const struct inode *inode,</div><div class='del'>-		     kuid_t uid)</div><div class='add'>+static bool chown_ok(struct mnt_idmap *idmap,</div><div class='add'>+		     const struct inode *inode, vfsuid_t ia_vfsuid)</div><div class='ctx'> {</div><div class='del'>-	kuid_t kuid = i_uid_into_mnt(mnt_userns, inode);</div><div class='del'>-	if (uid_eq(current_fsuid(), kuid) &amp;&amp; uid_eq(uid, kuid))</div><div class='add'>+	vfsuid_t vfsuid = i_uid_into_vfsuid(idmap, inode);</div><div class='add'>+	if (vfsuid_eq_kuid(vfsuid, current_fsuid()) &amp;&amp;</div><div class='add'>+	    vfsuid_eq(ia_vfsuid, vfsuid))</div><div class='ctx'> 		return true;</div><div class='del'>-	if (capable_wrt_inode_uidgid(mnt_userns, inode, CAP_CHOWN))</div><div class='add'>+	if (capable_wrt_inode_uidgid(idmap, inode, CAP_CHOWN))</div><div class='ctx'> 		return true;</div><div class='del'>-	if (uid_eq(kuid, INVALID_UID) &amp;&amp;</div><div class='add'>+	if (!vfsuid_valid(vfsuid) &amp;&amp;</div><div class='ctx'> 	    ns_capable(inode-&gt;i_sb-&gt;s_user_ns, CAP_CHOWN))</div><div class='ctx'> 		return true;</div><div class='ctx'> 	return false;</div><div class='hunk'>@@ -47,26 +108,30 @@ static bool chown_ok(struct user_namespace *mnt_userns,</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * chgrp_ok - verify permissions to chgrp inode</div><div class='del'>- * @mnt_userns:	user namespace of the mount @inode was found from</div><div class='add'>+ * @idmap:	idmap of the mount @inode was found from</div><div class='ctx'>  * @inode:	inode to check permissions on</div><div class='del'>- * @gid:	gid to chown @inode to</div><div class='add'>+ * @ia_vfsgid:	gid to chown @inode to</div><div class='ctx'>  *</div><div class='del'>- * If the inode has been found through an idmapped mount the user namespace of</div><div class='del'>- * the vfsmount must be passed through @mnt_userns. This function will then</div><div class='del'>- * take care to map the inode according to @mnt_userns before checking</div><div class='add'>+ * If the inode has been found through an idmapped mount the idmap of</div><div class='add'>+ * the vfsmount must be passed through @idmap. This function will then</div><div class='add'>+ * take care to map the inode according to @idmap before checking</div><div class='ctx'>  * permissions. On non-idmapped mounts or if permission checking is to be</div><div class='del'>- * performed on the raw inode simply passs init_user_ns.</div><div class='add'>+ * performed on the raw inode simply pass @nop_mnt_idmap.</div><div class='ctx'>  */</div><div class='del'>-static bool chgrp_ok(struct user_namespace *mnt_userns,</div><div class='del'>-		     const struct inode *inode, kgid_t gid)</div><div class='add'>+static bool chgrp_ok(struct mnt_idmap *idmap,</div><div class='add'>+		     const struct inode *inode, vfsgid_t ia_vfsgid)</div><div class='ctx'> {</div><div class='del'>-	kgid_t kgid = i_gid_into_mnt(mnt_userns, inode);</div><div class='del'>-	if (uid_eq(current_fsuid(), i_uid_into_mnt(mnt_userns, inode)) &amp;&amp;</div><div class='del'>-	    (in_group_p(gid) || gid_eq(gid, kgid)))</div><div class='del'>-		return true;</div><div class='del'>-	if (capable_wrt_inode_uidgid(mnt_userns, inode, CAP_CHOWN))</div><div class='add'>+	vfsgid_t vfsgid = i_gid_into_vfsgid(idmap, inode);</div><div class='add'>+	vfsuid_t vfsuid = i_uid_into_vfsuid(idmap, inode);</div><div class='add'>+	if (vfsuid_eq_kuid(vfsuid, current_fsuid())) {</div><div class='add'>+		if (vfsgid_eq(ia_vfsgid, vfsgid))</div><div class='add'>+			return true;</div><div class='add'>+		if (vfsgid_in_group_p(ia_vfsgid))</div><div class='add'>+			return true;</div><div class='add'>+	}</div><div class='add'>+	if (capable_wrt_inode_uidgid(idmap, inode, CAP_CHOWN))</div><div class='ctx'> 		return true;</div><div class='del'>-	if (gid_eq(kgid, INVALID_GID) &amp;&amp;</div><div class='add'>+	if (!vfsgid_valid(vfsgid) &amp;&amp;</div><div class='ctx'> 	    ns_capable(inode-&gt;i_sb-&gt;s_user_ns, CAP_CHOWN))</div><div class='ctx'> 		return true;</div><div class='ctx'> 	return false;</div><div class='hunk'>@@ -74,7 +139,7 @@ static bool chgrp_ok(struct user_namespace *mnt_userns,</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * setattr_prepare - check if attribute changes to a dentry are allowed</div><div class='del'>- * @mnt_userns:	user namespace of the mount the inode was found from</div><div class='add'>+ * @idmap:	idmap of the mount the inode was found from</div><div class='ctx'>  * @dentry:	dentry to check</div><div class='ctx'>  * @attr:	attributes to change</div><div class='ctx'>  *</div><div class='hunk'>@@ -84,16 +149,16 @@ static bool chgrp_ok(struct user_namespace *mnt_userns,</div><div class='ctx'>  * SGID bit from mode if user is not allowed to set it. Also file capabilities</div><div class='ctx'>  * and IMA extended attributes are cleared if ATTR_KILL_PRIV is set.</div><div class='ctx'>  *</div><div class='del'>- * If the inode has been found through an idmapped mount the user namespace of</div><div class='del'>- * the vfsmount must be passed through @mnt_userns. This function will then</div><div class='del'>- * take care to map the inode according to @mnt_userns before checking</div><div class='add'>+ * If the inode has been found through an idmapped mount the idmap of</div><div class='add'>+ * the vfsmount must be passed through @idmap. This function will then</div><div class='add'>+ * take care to map the inode according to @idmap before checking</div><div class='ctx'>  * permissions. On non-idmapped mounts or if permission checking is to be</div><div class='del'>- * performed on the raw inode simply passs init_user_ns.</div><div class='add'>+ * performed on the raw inode simply pass @nop_mnt_idmap.</div><div class='ctx'>  *</div><div class='ctx'>  * Should be called as the first thing in -&gt;setattr implementations,</div><div class='ctx'>  * possibly after taking additional locks.</div><div class='ctx'>  */</div><div class='del'>-int setattr_prepare(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='add'>+int setattr_prepare(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		    struct iattr *attr)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='hunk'>@@ -114,27 +179,35 @@ int setattr_prepare(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 		goto kill_priv;</div><div class='ctx'> </div><div class='ctx'> 	/* Make sure a caller can chown. */</div><div class='del'>-	if ((ia_valid &amp; ATTR_UID) &amp;&amp; !chown_ok(mnt_userns, inode, attr-&gt;ia_uid))</div><div class='add'>+	if ((ia_valid &amp; ATTR_UID) &amp;&amp;</div><div class='add'>+	    !chown_ok(idmap, inode, attr-&gt;ia_vfsuid))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='ctx'> 	/* Make sure caller can chgrp. */</div><div class='del'>-	if ((ia_valid &amp; ATTR_GID) &amp;&amp; !chgrp_ok(mnt_userns, inode, attr-&gt;ia_gid))</div><div class='add'>+	if ((ia_valid &amp; ATTR_GID) &amp;&amp;</div><div class='add'>+	    !chgrp_ok(idmap, inode, attr-&gt;ia_vfsgid))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='ctx'> 	/* Make sure a caller can chmod. */</div><div class='ctx'> 	if (ia_valid &amp; ATTR_MODE) {</div><div class='del'>-		if (!inode_owner_or_capable(mnt_userns, inode))</div><div class='add'>+		vfsgid_t vfsgid;</div><div class='add'>+</div><div class='add'>+		if (!inode_owner_or_capable(idmap, inode))</div><div class='ctx'> 			return -EPERM;</div><div class='add'>+</div><div class='add'>+		if (ia_valid &amp; ATTR_GID)</div><div class='add'>+			vfsgid = attr-&gt;ia_vfsgid;</div><div class='add'>+		else</div><div class='add'>+			vfsgid = i_gid_into_vfsgid(idmap, inode);</div><div class='add'>+</div><div class='ctx'> 		/* Also check the setgid bit! */</div><div class='del'>-               if (!in_group_p((ia_valid &amp; ATTR_GID) ? attr-&gt;ia_gid :</div><div class='del'>-                                i_gid_into_mnt(mnt_userns, inode)) &amp;&amp;</div><div class='del'>-                    !capable_wrt_inode_uidgid(mnt_userns, inode, CAP_FSETID))</div><div class='add'>+		if (!in_group_or_capable(idmap, inode, vfsgid))</div><div class='ctx'> 			attr-&gt;ia_mode &amp;= ~S_ISGID;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Check for setting the inode time. */</div><div class='ctx'> 	if (ia_valid &amp; (ATTR_MTIME_SET | ATTR_ATIME_SET | ATTR_TIMES_SET)) {</div><div class='del'>-		if (!inode_owner_or_capable(mnt_userns, inode))</div><div class='add'>+		if (!inode_owner_or_capable(idmap, inode))</div><div class='ctx'> 			return -EPERM;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -143,7 +216,7 @@ kill_priv:</div><div class='ctx'> 	if (ia_valid &amp; ATTR_KILL_PRIV) {</div><div class='ctx'> 		int error;</div><div class='ctx'> </div><div class='del'>-		error = security_inode_killpriv(mnt_userns, dentry);</div><div class='add'>+		error = security_inode_killpriv(idmap, dentry);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			return error;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -157,7 +230,7 @@ EXPORT_SYMBOL(setattr_prepare);</div><div class='ctx'>  * @inode:	the inode to be truncated</div><div class='ctx'>  * @offset:	the new size to assign to the inode</div><div class='ctx'>  *</div><div class='del'>- * inode_newsize_ok must be called with i_mutex held.</div><div class='add'>+ * inode_newsize_ok must be called with i_rwsem held exclusively.</div><div class='ctx'>  *</div><div class='ctx'>  * inode_newsize_ok will check filesystem limits and ulimits to check that the</div><div class='ctx'>  * new inode size is within limits. inode_newsize_ok will also send SIGXFSZ</div><div class='hunk'>@@ -170,6 +243,8 @@ EXPORT_SYMBOL(setattr_prepare);</div><div class='ctx'>  */</div><div class='ctx'> int inode_newsize_ok(const struct inode *inode, loff_t offset)</div><div class='ctx'> {</div><div class='add'>+	if (offset &lt; 0)</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	if (inode-&gt;i_size &lt; offset) {</div><div class='ctx'> 		unsigned long limit;</div><div class='ctx'> </div><div class='hunk'>@@ -197,59 +272,94 @@ out_big:</div><div class='ctx'> EXPORT_SYMBOL(inode_newsize_ok);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='add'>+ * setattr_copy_mgtime - update timestamps for mgtime inodes</div><div class='add'>+ * @inode: inode timestamps to be updated</div><div class='add'>+ * @attr: attrs for the update</div><div class='add'>+ *</div><div class='add'>+ * With multigrain timestamps, take more care to prevent races when</div><div class='add'>+ * updating the ctime. Always update the ctime to the very latest using</div><div class='add'>+ * the standard mechanism, and use that to populate the atime and mtime</div><div class='add'>+ * appropriately (unless those are being set to specific values).</div><div class='add'>+ */</div><div class='add'>+static void setattr_copy_mgtime(struct inode *inode, const struct iattr *attr)</div><div class='add'>+{</div><div class='add'>+	unsigned int ia_valid = attr-&gt;ia_valid;</div><div class='add'>+	struct timespec64 now;</div><div class='add'>+</div><div class='add'>+	if (ia_valid &amp; ATTR_CTIME_SET)</div><div class='add'>+		now = inode_set_ctime_deleg(inode, attr-&gt;ia_ctime);</div><div class='add'>+	else if (ia_valid &amp; ATTR_CTIME)</div><div class='add'>+		now = inode_set_ctime_current(inode);</div><div class='add'>+	else</div><div class='add'>+		now = current_time(inode);</div><div class='add'>+</div><div class='add'>+	if (ia_valid &amp; ATTR_ATIME_SET)</div><div class='add'>+		inode_set_atime_to_ts(inode, attr-&gt;ia_atime);</div><div class='add'>+	else if (ia_valid &amp; ATTR_ATIME)</div><div class='add'>+		inode_set_atime_to_ts(inode, now);</div><div class='add'>+</div><div class='add'>+	if (ia_valid &amp; ATTR_MTIME_SET)</div><div class='add'>+		inode_set_mtime_to_ts(inode, attr-&gt;ia_mtime);</div><div class='add'>+	else if (ia_valid &amp; ATTR_MTIME)</div><div class='add'>+		inode_set_mtime_to_ts(inode, now);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='ctx'>  * setattr_copy - copy simple metadata updates into the generic inode</div><div class='del'>- * @mnt_userns:	user namespace of the mount the inode was found from</div><div class='add'>+ * @idmap:	idmap of the mount the inode was found from</div><div class='ctx'>  * @inode:	the inode to be updated</div><div class='ctx'>  * @attr:	the new attributes</div><div class='ctx'>  *</div><div class='del'>- * setattr_copy must be called with i_mutex held.</div><div class='add'>+ * setattr_copy must be called with i_rwsem held exclusively.</div><div class='ctx'>  *</div><div class='ctx'>  * setattr_copy updates the inode's metadata with that specified</div><div class='del'>- * in attr on idmapped mounts. If file ownership is changed setattr_copy</div><div class='del'>- * doesn't map ia_uid and ia_gid. It will asssume the caller has already</div><div class='del'>- * provided the intended values. Necessary permission checks to determine</div><div class='add'>+ * in attr on idmapped mounts. Necessary permission checks to determine</div><div class='ctx'>  * whether or not the S_ISGID property needs to be removed are performed with</div><div class='ctx'>  * the correct idmapped mount permission helpers.</div><div class='ctx'>  * Noticeably missing is inode size update, which is more complex</div><div class='ctx'>  * as it requires pagecache updates.</div><div class='ctx'>  *</div><div class='del'>- * If the inode has been found through an idmapped mount the user namespace of</div><div class='del'>- * the vfsmount must be passed through @mnt_userns. This function will then</div><div class='del'>- * take care to map the inode according to @mnt_userns before checking</div><div class='add'>+ * If the inode has been found through an idmapped mount the idmap of</div><div class='add'>+ * the vfsmount must be passed through @idmap. This function will then</div><div class='add'>+ * take care to map the inode according to @idmap before checking</div><div class='ctx'>  * permissions. On non-idmapped mounts or if permission checking is to be</div><div class='del'>- * performed on the raw inode simply passs init_user_ns.</div><div class='add'>+ * performed on the raw inode simply pass @nop_mnt_idmap.</div><div class='ctx'>  *</div><div class='ctx'>  * The inode is not marked as dirty after this operation. The rationale is</div><div class='ctx'>  * that for "simple" filesystems, the struct inode is the inode storage.</div><div class='ctx'>  * The caller is free to mark the inode dirty afterwards if needed.</div><div class='ctx'>  */</div><div class='del'>-void setattr_copy(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='add'>+void setattr_copy(struct mnt_idmap *idmap, struct inode *inode,</div><div class='ctx'> 		  const struct iattr *attr)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int ia_valid = attr-&gt;ia_valid;</div><div class='ctx'> </div><div class='del'>-	if (ia_valid &amp; ATTR_UID)</div><div class='del'>-		inode-&gt;i_uid = attr-&gt;ia_uid;</div><div class='del'>-	if (ia_valid &amp; ATTR_GID)</div><div class='del'>-		inode-&gt;i_gid = attr-&gt;ia_gid;</div><div class='del'>-	if (ia_valid &amp; ATTR_ATIME)</div><div class='del'>-		inode-&gt;i_atime = attr-&gt;ia_atime;</div><div class='del'>-	if (ia_valid &amp; ATTR_MTIME)</div><div class='del'>-		inode-&gt;i_mtime = attr-&gt;ia_mtime;</div><div class='del'>-	if (ia_valid &amp; ATTR_CTIME)</div><div class='del'>-		inode-&gt;i_ctime = attr-&gt;ia_ctime;</div><div class='add'>+	i_uid_update(idmap, attr, inode);</div><div class='add'>+	i_gid_update(idmap, attr, inode);</div><div class='ctx'> 	if (ia_valid &amp; ATTR_MODE) {</div><div class='ctx'> 		umode_t mode = attr-&gt;ia_mode;</div><div class='del'>-		kgid_t kgid = i_gid_into_mnt(mnt_userns, inode);</div><div class='del'>-		if (!in_group_p(kgid) &amp;&amp;</div><div class='del'>-		    !capable_wrt_inode_uidgid(mnt_userns, inode, CAP_FSETID))</div><div class='add'>+		if (!in_group_or_capable(idmap, inode,</div><div class='add'>+					 i_gid_into_vfsgid(idmap, inode)))</div><div class='ctx'> 			mode &amp;= ~S_ISGID;</div><div class='ctx'> 		inode-&gt;i_mode = mode;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	if (is_mgtime(inode))</div><div class='add'>+		return setattr_copy_mgtime(inode, attr);</div><div class='add'>+</div><div class='add'>+	if (ia_valid &amp; ATTR_ATIME)</div><div class='add'>+		inode_set_atime_to_ts(inode, attr-&gt;ia_atime);</div><div class='add'>+	if (ia_valid &amp; ATTR_MTIME)</div><div class='add'>+		inode_set_mtime_to_ts(inode, attr-&gt;ia_mtime);</div><div class='add'>+</div><div class='add'>+	if (ia_valid &amp; ATTR_CTIME_SET)</div><div class='add'>+		inode_set_ctime_deleg(inode, attr-&gt;ia_ctime);</div><div class='add'>+	else if (ia_valid &amp; ATTR_CTIME)</div><div class='add'>+		inode_set_ctime_to_ts(inode, attr-&gt;ia_ctime);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(setattr_copy);</div><div class='ctx'> </div><div class='del'>-int may_setattr(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='add'>+int may_setattr(struct mnt_idmap *idmap, struct inode *inode,</div><div class='ctx'> 		unsigned int ia_valid)</div><div class='ctx'> {</div><div class='ctx'> 	int error;</div><div class='hunk'>@@ -267,8 +377,8 @@ int may_setattr(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='ctx'> 		if (IS_IMMUTABLE(inode))</div><div class='ctx'> 			return -EPERM;</div><div class='ctx'> </div><div class='del'>-		if (!inode_owner_or_capable(mnt_userns, inode)) {</div><div class='del'>-			error = inode_permission(mnt_userns, inode, MAY_WRITE);</div><div class='add'>+		if (!inode_owner_or_capable(idmap, inode)) {</div><div class='add'>+			error = inode_permission(idmap, inode, MAY_WRITE);</div><div class='ctx'> 			if (error)</div><div class='ctx'> 				return error;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -278,22 +388,19 @@ int may_setattr(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='ctx'> EXPORT_SYMBOL(may_setattr);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * notify_change - modify attributes of a filesytem object</div><div class='del'>- * @mnt_userns:	user namespace of the mount the inode was found from</div><div class='add'>+ * notify_change - modify attributes of a filesystem object</div><div class='add'>+ * @idmap:	idmap of the mount the inode was found from</div><div class='ctx'>  * @dentry:	object affected</div><div class='ctx'>  * @attr:	new attributes</div><div class='ctx'>  * @delegated_inode: returns inode, if the inode is delegated</div><div class='ctx'>  *</div><div class='del'>- * The caller must hold the i_mutex on the affected object.</div><div class='add'>+ * The caller must hold the i_rwsem exclusively on the affected object.</div><div class='ctx'>  *</div><div class='ctx'>  * If notify_change discovers a delegation in need of breaking,</div><div class='ctx'>  * it will return -EWOULDBLOCK and return a reference to the inode in</div><div class='ctx'>  * delegated_inode.  The caller should then break the delegation and</div><div class='ctx'>  * retry.  Because breaking a delegation may take a long time, the</div><div class='del'>- * caller should drop the i_mutex before doing so.</div><div class='del'>- *</div><div class='del'>- * If file ownership is changed notify_change() doesn't map ia_uid and</div><div class='del'>- * ia_gid. It will asssume the caller has already provided the intended values.</div><div class='add'>+ * caller should drop the i_rwsem before doing so.</div><div class='ctx'>  *</div><div class='ctx'>  * Alternatively, a caller may pass NULL for delegated_inode.  This may</div><div class='ctx'>  * be appropriate for callers that expect the underlying filesystem not</div><div class='hunk'>@@ -301,14 +408,14 @@ EXPORT_SYMBOL(may_setattr);</div><div class='ctx'>  * the file open for write, as there can be no conflicting delegation in</div><div class='ctx'>  * that case.</div><div class='ctx'>  *</div><div class='del'>- * If the inode has been found through an idmapped mount the user namespace of</div><div class='del'>- * the vfsmount must be passed through @mnt_userns. This function will then</div><div class='del'>- * take care to map the inode according to @mnt_userns before checking</div><div class='add'>+ * If the inode has been found through an idmapped mount the idmap of</div><div class='add'>+ * the vfsmount must be passed through @idmap. This function will then</div><div class='add'>+ * take care to map the inode according to @idmap before checking</div><div class='ctx'>  * permissions. On non-idmapped mounts or if permission checking is to be</div><div class='del'>- * performed on the raw inode simply passs init_user_ns.</div><div class='add'>+ * performed on the raw inode simply pass @nop_mnt_idmap.</div><div class='ctx'>  */</div><div class='del'>-int notify_change(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='del'>-		  struct iattr *attr, struct inode **delegated_inode)</div><div class='add'>+int notify_change(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='add'>+		  struct iattr *attr, struct delegated_inode *delegated_inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = dentry-&gt;d_inode;</div><div class='ctx'> 	umode_t mode = inode-&gt;i_mode;</div><div class='hunk'>@@ -318,28 +425,47 @@ int notify_change(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> </div><div class='ctx'> 	WARN_ON_ONCE(!inode_is_locked(inode));</div><div class='ctx'> </div><div class='del'>-	error = may_setattr(mnt_userns, inode, ia_valid);</div><div class='add'>+	error = may_setattr(idmap, inode, ia_valid);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='ctx'> 	if ((ia_valid &amp; ATTR_MODE)) {</div><div class='del'>-		umode_t amode = attr-&gt;ia_mode;</div><div class='del'>-		/* Flag setting protected by i_mutex */</div><div class='del'>-		if (is_sxid(amode))</div><div class='add'>+		/*</div><div class='add'>+		 * Don't allow changing the mode of symlinks:</div><div class='add'>+		 *</div><div class='add'>+		 * (1) The vfs doesn't take the mode of symlinks into account</div><div class='add'>+		 *     during permission checking.</div><div class='add'>+		 * (2) This has never worked correctly. Most major filesystems</div><div class='add'>+		 *     did return EOPNOTSUPP due to interactions with POSIX ACLs</div><div class='add'>+		 *     but did still updated the mode of the symlink.</div><div class='add'>+		 *     This inconsistency led system call wrapper providers such</div><div class='add'>+		 *     as libc to block changing the mode of symlinks with</div><div class='add'>+		 *     EOPNOTSUPP already.</div><div class='add'>+		 * (3) To even do this in the first place one would have to use</div><div class='add'>+		 *     specific file descriptors and quite some effort.</div><div class='add'>+		 */</div><div class='add'>+		if (S_ISLNK(inode-&gt;i_mode))</div><div class='add'>+			return -EOPNOTSUPP;</div><div class='add'>+</div><div class='add'>+		/* Flag setting protected by i_rwsem */</div><div class='add'>+		if (is_sxid(attr-&gt;ia_mode))</div><div class='ctx'> 			inode-&gt;i_flags &amp;= ~S_NOSEC;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	now = current_time(inode);</div><div class='ctx'> </div><div class='del'>-	attr-&gt;ia_ctime = now;</div><div class='del'>-	if (!(ia_valid &amp; ATTR_ATIME_SET))</div><div class='del'>-		attr-&gt;ia_atime = now;</div><div class='del'>-	else</div><div class='add'>+	if (ia_valid &amp; ATTR_ATIME_SET)</div><div class='ctx'> 		attr-&gt;ia_atime = timestamp_truncate(attr-&gt;ia_atime, inode);</div><div class='del'>-	if (!(ia_valid &amp; ATTR_MTIME_SET))</div><div class='del'>-		attr-&gt;ia_mtime = now;</div><div class='ctx'> 	else</div><div class='add'>+		attr-&gt;ia_atime = now;</div><div class='add'>+	if (ia_valid &amp; ATTR_CTIME_SET)</div><div class='add'>+		attr-&gt;ia_ctime = timestamp_truncate(attr-&gt;ia_ctime, inode);</div><div class='add'>+	else</div><div class='add'>+		attr-&gt;ia_ctime = now;</div><div class='add'>+	if (ia_valid &amp; ATTR_MTIME_SET)</div><div class='ctx'> 		attr-&gt;ia_mtime = timestamp_truncate(attr-&gt;ia_mtime, inode);</div><div class='add'>+	else</div><div class='add'>+		attr-&gt;ia_mtime = now;</div><div class='ctx'> </div><div class='ctx'> 	if (ia_valid &amp; ATTR_KILL_PRIV) {</div><div class='ctx'> 		error = security_inode_need_killpriv(dentry);</div><div class='hunk'>@@ -367,7 +493,7 @@ int notify_change(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	if (ia_valid &amp; ATTR_KILL_SGID) {</div><div class='del'>-		if ((mode &amp; (S_ISGID | S_IXGRP)) == (S_ISGID | S_IXGRP)) {</div><div class='add'>+		if (mode &amp; S_ISGID) {</div><div class='ctx'> 			if (!(ia_valid &amp; ATTR_MODE)) {</div><div class='ctx'> 				ia_valid = attr-&gt;ia_valid |= ATTR_MODE;</div><div class='ctx'> 				attr-&gt;ia_mode = inode-&gt;i_mode;</div><div class='hunk'>@@ -383,38 +509,47 @@ int notify_change(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 	 * namespace of the superblock.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (ia_valid &amp; ATTR_UID &amp;&amp;</div><div class='del'>-	    !kuid_has_mapping(inode-&gt;i_sb-&gt;s_user_ns, attr-&gt;ia_uid))</div><div class='add'>+	    !vfsuid_has_fsmapping(idmap, inode-&gt;i_sb-&gt;s_user_ns,</div><div class='add'>+				  attr-&gt;ia_vfsuid))</div><div class='ctx'> 		return -EOVERFLOW;</div><div class='ctx'> 	if (ia_valid &amp; ATTR_GID &amp;&amp;</div><div class='del'>-	    !kgid_has_mapping(inode-&gt;i_sb-&gt;s_user_ns, attr-&gt;ia_gid))</div><div class='add'>+	    !vfsgid_has_fsmapping(idmap, inode-&gt;i_sb-&gt;s_user_ns,</div><div class='add'>+				  attr-&gt;ia_vfsgid))</div><div class='ctx'> 		return -EOVERFLOW;</div><div class='ctx'> </div><div class='ctx'> 	/* Don't allow modifications of files with invalid uids or</div><div class='ctx'> 	 * gids unless those uids &amp; gids are being made valid.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (!(ia_valid &amp; ATTR_UID) &amp;&amp;</div><div class='del'>-	    !uid_valid(i_uid_into_mnt(mnt_userns, inode)))</div><div class='add'>+	    !vfsuid_valid(i_uid_into_vfsuid(idmap, inode)))</div><div class='ctx'> 		return -EOVERFLOW;</div><div class='ctx'> 	if (!(ia_valid &amp; ATTR_GID) &amp;&amp;</div><div class='del'>-	    !gid_valid(i_gid_into_mnt(mnt_userns, inode)))</div><div class='add'>+	    !vfsgid_valid(i_gid_into_vfsgid(idmap, inode)))</div><div class='ctx'> 		return -EOVERFLOW;</div><div class='ctx'> </div><div class='del'>-	error = security_inode_setattr(dentry, attr);</div><div class='del'>-	if (error)</div><div class='del'>-		return error;</div><div class='del'>-	error = try_break_deleg(inode, delegated_inode);</div><div class='add'>+	error = security_inode_setattr(idmap, dentry, attr);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * If ATTR_DELEG is set, then these attributes are being set on</div><div class='add'>+	 * behalf of the holder of a write delegation. We want to avoid</div><div class='add'>+	 * breaking the delegation in this case.</div><div class='add'>+	 */</div><div class='add'>+	if (!(ia_valid &amp; ATTR_DELEG)) {</div><div class='add'>+		error = try_break_deleg(inode, delegated_inode);</div><div class='add'>+		if (error)</div><div class='add'>+			return error;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (inode-&gt;i_op-&gt;setattr)</div><div class='del'>-		error = inode-&gt;i_op-&gt;setattr(mnt_userns, dentry, attr);</div><div class='add'>+		error = inode-&gt;i_op-&gt;setattr(idmap, dentry, attr);</div><div class='ctx'> 	else</div><div class='del'>-		error = simple_setattr(mnt_userns, dentry, attr);</div><div class='add'>+		error = simple_setattr(idmap, dentry, attr);</div><div class='ctx'> </div><div class='ctx'> 	if (!error) {</div><div class='ctx'> 		fsnotify_change(dentry, ia_valid);</div><div class='del'>-		ima_inode_post_setattr(mnt_userns, dentry);</div><div class='del'>-		evm_inode_post_setattr(dentry, ia_valid);</div><div class='add'>+		security_inode_post_setattr(idmap, dentry, ia_valid);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return error;</div><div class='head'>diff --git a/fs/autofs/Kconfig b/fs/autofs/Kconfig<br/>index 3b3a6b1423c6..54c12d9484cb 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/autofs/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/autofs/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/autofs/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/autofs/Kconfig</a></div><div class='hunk'>@@ -1,18 +1,6 @@</div><div class='ctx'> # SPDX-License-Identifier: GPL-2.0-only</div><div class='del'>-config AUTOFS4_FS</div><div class='del'>-	tristate "Old Kconfig name for Kernel automounter support"</div><div class='del'>-	select AUTOFS_FS</div><div class='del'>-	help</div><div class='del'>-	   This name exists for people to just automatically pick up the</div><div class='del'>-	   new name of the autofs Kconfig option. All it does is select</div><div class='del'>-	   the new option name.</div><div class='del'>-</div><div class='del'>-	   It will go away in a release or two as people have</div><div class='del'>-	   transitioned to just plain AUTOFS_FS.</div><div class='del'>-</div><div class='ctx'> config AUTOFS_FS</div><div class='ctx'> 	tristate "Kernel automounter support (supports v3, v4 and v5)"</div><div class='del'>-	default n</div><div class='ctx'> 	help</div><div class='ctx'> 	   The automounter is a tool to automatically mount remote file systems</div><div class='ctx'> 	   on demand. This implementation is partially kernel-based to reduce</div><div class='head'>diff --git a/fs/autofs/autofs_i.h b/fs/autofs/autofs_i.h<br/>index 918826eaceea..4fd555528c5d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/autofs/autofs_i.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/autofs/autofs_i.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/autofs/autofs_i.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/autofs/autofs_i.h</a></div><div class='hunk'>@@ -16,6 +16,7 @@</div><div class='ctx'> #include &lt;linux/wait.h&gt;</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='ctx'> #include &lt;linux/sched/signal.h&gt;</div><div class='add'>+#include &lt;uapi/linux/mount.h&gt;</div><div class='ctx'> #include &lt;linux/mount.h&gt;</div><div class='ctx'> #include &lt;linux/namei.h&gt;</div><div class='ctx'> #include &lt;linux/uaccess.h&gt;</div><div class='hunk'>@@ -25,6 +26,11 @@</div><div class='ctx'> #include &lt;linux/completion.h&gt;</div><div class='ctx'> #include &lt;linux/file.h&gt;</div><div class='ctx'> #include &lt;linux/magic.h&gt;</div><div class='add'>+#include &lt;linux/fs_context.h&gt;</div><div class='add'>+#include &lt;linux/fs_parser.h&gt;</div><div class='add'>+#include "../mount.h"</div><div class='add'>+#include &lt;linux/ns_common.h&gt;</div><div class='add'>+</div><div class='ctx'> </div><div class='ctx'> /* This is the range of ioctl() numbers we claim as ours */</div><div class='ctx'> #define AUTOFS_IOC_FIRST     AUTOFS_IOC_READY</div><div class='hunk'>@@ -51,8 +57,6 @@ extern struct file_system_type autofs_fs_type;</div><div class='ctx'>  */</div><div class='ctx'> struct autofs_info {</div><div class='ctx'> 	struct dentry	*dentry;</div><div class='del'>-	struct inode	*inode;</div><div class='del'>-</div><div class='ctx'> 	int		flags;</div><div class='ctx'> </div><div class='ctx'> 	struct completion expire_complete;</div><div class='hunk'>@@ -62,6 +66,7 @@ struct autofs_info {</div><div class='ctx'> 	struct list_head expiring;</div><div class='ctx'> </div><div class='ctx'> 	struct autofs_sb_info *sbi;</div><div class='add'>+	unsigned long exp_timeout;</div><div class='ctx'> 	unsigned long last_used;</div><div class='ctx'> 	int count;</div><div class='ctx'> </div><div class='hunk'>@@ -81,6 +86,9 @@ struct autofs_info {</div><div class='ctx'> 					*/</div><div class='ctx'> #define AUTOFS_INF_PENDING	(1&lt;&lt;2) /* dentry pending mount */</div><div class='ctx'> </div><div class='add'>+#define AUTOFS_INF_EXPIRE_SET	(1&lt;&lt;3) /* per-dentry expire timeout set for</div><div class='add'>+					  this mount point.</div><div class='add'>+					*/</div><div class='ctx'> struct autofs_wait_queue {</div><div class='ctx'> 	wait_queue_head_t queue;</div><div class='ctx'> 	struct autofs_wait_queue *next;</div><div class='hunk'>@@ -110,6 +118,7 @@ struct autofs_sb_info {</div><div class='ctx'> 	int pipefd;</div><div class='ctx'> 	struct file *pipe;</div><div class='ctx'> 	struct pid *oz_pgrp;</div><div class='add'>+	u64 mnt_ns_id;</div><div class='ctx'> 	int version;</div><div class='ctx'> 	int sub_version;</div><div class='ctx'> 	int min_proto;</div><div class='hunk'>@@ -148,6 +157,11 @@ static inline int autofs_oz_mode(struct autofs_sb_info *sbi)</div><div class='ctx'> 		 task_pgrp(current) == sbi-&gt;oz_pgrp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline bool autofs_empty(struct autofs_info *ino)</div><div class='add'>+{</div><div class='add'>+	return ino-&gt;count &lt; 2;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> struct inode *autofs_get_inode(struct super_block *, umode_t);</div><div class='ctx'> void autofs_free_ino(struct autofs_info *);</div><div class='ctx'> </div><div class='hunk'>@@ -202,20 +216,36 @@ static inline void managed_dentry_clear_managed(struct dentry *dentry)</div><div class='ctx'> </div><div class='ctx'> /* Initializing function */</div><div class='ctx'> </div><div class='del'>-int autofs_fill_super(struct super_block *, void *, int);</div><div class='add'>+extern const struct fs_parameter_spec autofs_param_specs[];</div><div class='add'>+int autofs_init_fs_context(struct fs_context *fc);</div><div class='ctx'> struct autofs_info *autofs_new_ino(struct autofs_sb_info *);</div><div class='ctx'> void autofs_clean_ino(struct autofs_info *);</div><div class='ctx'> </div><div class='del'>-static inline int autofs_prepare_pipe(struct file *pipe)</div><div class='add'>+static inline int autofs_check_pipe(struct file *pipe)</div><div class='ctx'> {</div><div class='add'>+	if (pipe-&gt;f_mode &amp; FMODE_PATH)</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	if (!(pipe-&gt;f_mode &amp; FMODE_CAN_WRITE))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	if (!S_ISFIFO(file_inode(pipe)-&gt;i_mode))</div><div class='ctx'> 		return -EINVAL;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void autofs_set_packet_pipe_flags(struct file *pipe)</div><div class='add'>+{</div><div class='ctx'> 	/* We want a packet pipe */</div><div class='ctx'> 	pipe-&gt;f_flags |= O_DIRECT;</div><div class='ctx'> 	/* We don't expect -EAGAIN */</div><div class='ctx'> 	pipe-&gt;f_flags &amp;= ~O_NONBLOCK;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int autofs_prepare_pipe(struct file *pipe)</div><div class='add'>+{</div><div class='add'>+	int ret = autofs_check_pipe(pipe);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+	autofs_set_packet_pipe_flags(pipe);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/autofs/dev-ioctl.c b/fs/autofs/dev-ioctl.c<br/>index 5bf781ea6d67..6743b3b64217 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/autofs/dev-ioctl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/autofs/dev-ioctl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/autofs/dev-ioctl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/autofs/dev-ioctl.c</a></div><div class='hunk'>@@ -110,6 +110,7 @@ static inline void free_dev_ioctl(struct autofs_dev_ioctl *param)</div><div class='ctx'>  */</div><div class='ctx'> static int validate_dev_ioctl(int cmd, struct autofs_dev_ioctl *param)</div><div class='ctx'> {</div><div class='add'>+	unsigned int inr = _IOC_NR(cmd);</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	err = check_dev_ioctl_version(cmd, param);</div><div class='hunk'>@@ -128,15 +129,19 @@ static int validate_dev_ioctl(int cmd, struct autofs_dev_ioctl *param)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		/* Setting the per-dentry expire timeout requires a trailing</div><div class='add'>+		 * path component, ie. no '/', so invert the logic of the</div><div class='add'>+		 * check_name() return for AUTOFS_DEV_IOCTL_TIMEOUT_CMD.</div><div class='add'>+		 */</div><div class='ctx'> 		err = check_name(param-&gt;path);</div><div class='add'>+		if (inr == AUTOFS_DEV_IOCTL_TIMEOUT_CMD)</div><div class='add'>+			err = err ? 0 : -EINVAL;</div><div class='ctx'> 		if (err) {</div><div class='ctx'> 			pr_warn("invalid path supplied for cmd(0x%08x)\n",</div><div class='ctx'> 				cmd);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='del'>-		unsigned int inr = _IOC_NR(cmd);</div><div class='del'>-</div><div class='ctx'> 		if (inr == AUTOFS_DEV_IOCTL_OPENMOUNT_CMD ||</div><div class='ctx'> 		    inr == AUTOFS_DEV_IOCTL_REQUESTER_CMD ||</div><div class='ctx'> 		    inr == AUTOFS_DEV_IOCTL_ISMOUNTPOINT_CMD) {</div><div class='hunk'>@@ -226,32 +231,14 @@ static int test_by_type(const struct path *path, void *p)</div><div class='ctx'>  */</div><div class='ctx'> static int autofs_dev_ioctl_open_mountpoint(const char *name, dev_t devid)</div><div class='ctx'> {</div><div class='del'>-	int err, fd;</div><div class='del'>-</div><div class='del'>-	fd = get_unused_fd_flags(O_CLOEXEC);</div><div class='del'>-	if (likely(fd &gt;= 0)) {</div><div class='del'>-		struct file *filp;</div><div class='del'>-		struct path path;</div><div class='del'>-</div><div class='del'>-		err = find_autofs_mount(name, &amp;path, test_by_dev, &amp;devid);</div><div class='del'>-		if (err)</div><div class='del'>-			goto out;</div><div class='del'>-</div><div class='del'>-		filp = dentry_open(&amp;path, O_RDONLY, current_cred());</div><div class='del'>-		path_put(&amp;path);</div><div class='del'>-		if (IS_ERR(filp)) {</div><div class='del'>-			err = PTR_ERR(filp);</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		fd_install(fd, filp);</div><div class='del'>-	}</div><div class='add'>+	struct path path __free(path_put) = {};</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='del'>-	return fd;</div><div class='add'>+	err = find_autofs_mount(name, &amp;path, test_by_dev, &amp;devid);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	put_unused_fd(fd);</div><div class='del'>-	return err;</div><div class='add'>+	return FD_ADD(O_CLOEXEC, dentry_open(&amp;path, O_RDONLY, current_cred()));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Open a file descriptor on an autofs mount point */</div><div class='hunk'>@@ -376,6 +363,7 @@ static int autofs_dev_ioctl_setpipefd(struct file *fp,</div><div class='ctx'> 		swap(sbi-&gt;oz_pgrp, new_pid);</div><div class='ctx'> 		sbi-&gt;pipefd = pipefd;</div><div class='ctx'> 		sbi-&gt;pipe = pipe;</div><div class='add'>+		sbi-&gt;mnt_ns_id = to_ns_common(current-&gt;nsproxy-&gt;mnt_ns)-&gt;ns_id;</div><div class='ctx'> 		sbi-&gt;flags &amp;= ~AUTOFS_SBI_CATATONIC;</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='hunk'>@@ -396,16 +384,97 @@ static int autofs_dev_ioctl_catatonic(struct file *fp,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Set the autofs mount timeout */</div><div class='add'>+/*</div><div class='add'>+ * Set the autofs mount expire timeout.</div><div class='add'>+ *</div><div class='add'>+ * There are two places an expire timeout can be set, in the autofs</div><div class='add'>+ * super block info. (this is all that's needed for direct and offset</div><div class='add'>+ * mounts because there's a distinct mount corresponding to each of</div><div class='add'>+ * these) and per-dentry within within the dentry info. If a per-dentry</div><div class='add'>+ * timeout is set it will override the expire timeout set in the parent</div><div class='add'>+ * autofs super block info.</div><div class='add'>+ *</div><div class='add'>+ * If setting the autofs super block expire timeout the autofs_dev_ioctl</div><div class='add'>+ * size field will be equal to the autofs_dev_ioctl structure size. If</div><div class='add'>+ * setting the per-dentry expire timeout the mount point name is passed</div><div class='add'>+ * in the autofs_dev_ioctl path field and the size field updated to</div><div class='add'>+ * reflect this.</div><div class='add'>+ *</div><div class='add'>+ * Setting the autofs mount expire timeout sets the timeout in the super</div><div class='add'>+ * block info. struct. Setting the per-dentry timeout does a little more.</div><div class='add'>+ * If the timeout is equal to -1 the per-dentry timeout (and flag) is</div><div class='add'>+ * cleared which reverts to using the super block timeout, otherwise if</div><div class='add'>+ * timeout is 0 the timeout is set to this value and the flag is left</div><div class='add'>+ * set which disables expiration for the mount point, lastly the flag</div><div class='add'>+ * and the timeout are set enabling the dentry to use this timeout.</div><div class='add'>+ */</div><div class='ctx'> static int autofs_dev_ioctl_timeout(struct file *fp,</div><div class='ctx'> 				    struct autofs_sb_info *sbi,</div><div class='ctx'> 				    struct autofs_dev_ioctl *param)</div><div class='ctx'> {</div><div class='del'>-	unsigned long timeout;</div><div class='add'>+	unsigned long timeout = param-&gt;timeout.timeout;</div><div class='add'>+</div><div class='add'>+	/* If setting the expire timeout for an individual indirect</div><div class='add'>+	 * mount point dentry the mount trailing component path is</div><div class='add'>+	 * placed in param-&gt;path and param-&gt;size adjusted to account</div><div class='add'>+	 * for it otherwise param-&gt;size it is set to the structure</div><div class='add'>+	 * size.</div><div class='add'>+	 */</div><div class='add'>+	if (param-&gt;size == AUTOFS_DEV_IOCTL_SIZE) {</div><div class='add'>+		param-&gt;timeout.timeout = sbi-&gt;exp_timeout / HZ;</div><div class='add'>+		sbi-&gt;exp_timeout = timeout * HZ;</div><div class='add'>+	} else {</div><div class='add'>+		struct dentry *base = fp-&gt;f_path.dentry;</div><div class='add'>+		int path_len = param-&gt;size - AUTOFS_DEV_IOCTL_SIZE - 1;</div><div class='add'>+		struct dentry *dentry;</div><div class='add'>+		struct autofs_info *ino;</div><div class='add'>+</div><div class='add'>+		if (!autofs_type_indirect(sbi-&gt;type))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+</div><div class='add'>+		dentry = try_lookup_noperm(&amp;QSTR_LEN(param-&gt;path, path_len),</div><div class='add'>+					   base);</div><div class='add'>+		if (IS_ERR_OR_NULL(dentry))</div><div class='add'>+			return dentry ? PTR_ERR(dentry) : -ENOENT;</div><div class='add'>+		ino = autofs_dentry_ino(dentry);</div><div class='add'>+		if (!ino) {</div><div class='add'>+			dput(dentry);</div><div class='add'>+			return -ENOENT;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (ino-&gt;exp_timeout &amp;&amp; ino-&gt;flags &amp; AUTOFS_INF_EXPIRE_SET)</div><div class='add'>+			param-&gt;timeout.timeout = ino-&gt;exp_timeout / HZ;</div><div class='add'>+		else</div><div class='add'>+			param-&gt;timeout.timeout = sbi-&gt;exp_timeout / HZ;</div><div class='add'>+</div><div class='add'>+		if (timeout == -1) {</div><div class='add'>+			/* Revert to using the super block timeout */</div><div class='add'>+			ino-&gt;flags &amp;= ~AUTOFS_INF_EXPIRE_SET;</div><div class='add'>+			ino-&gt;exp_timeout = 0;</div><div class='add'>+		} else {</div><div class='add'>+			/* Set the dentry expire flag and timeout.</div><div class='add'>+			 *</div><div class='add'>+			 * If timeout is 0 it will prevent the expire</div><div class='add'>+			 * of this particular automount.</div><div class='add'>+			 */</div><div class='add'>+			ino-&gt;flags |= AUTOFS_INF_EXPIRE_SET;</div><div class='add'>+			ino-&gt;exp_timeout = timeout * HZ;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* An expire timeout greater than the superblock timeout</div><div class='add'>+		 * could be a problem at shutdown but the super block</div><div class='add'>+		 * timeout itself can change so all we can really do is</div><div class='add'>+		 * warn the user.</div><div class='add'>+		 */</div><div class='add'>+		if (ino-&gt;flags &amp; AUTOFS_INF_EXPIRE_SET &amp;&amp;</div><div class='add'>+		    ino-&gt;exp_timeout &gt; sbi-&gt;exp_timeout)</div><div class='add'>+			pr_warn("per-mount expire timeout is greater than "</div><div class='add'>+				"the parent autofs mount timeout which could "</div><div class='add'>+				"prevent shutdown\n");</div><div class='add'>+</div><div class='add'>+		dput(dentry);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	timeout = param-&gt;timeout.timeout;</div><div class='del'>-	param-&gt;timeout.timeout = sbi-&gt;exp_timeout / HZ;</div><div class='del'>-	sbi-&gt;exp_timeout = timeout * HZ;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/autofs/expire.c b/fs/autofs/expire.c<br/>index b3fefd6237c3..5c2d459e1e48 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/autofs/expire.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/autofs/expire.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/autofs/expire.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/autofs/expire.c</a></div><div class='hunk'>@@ -73,12 +73,9 @@ done:</div><div class='ctx'> /* p-&gt;d_lock held */</div><div class='ctx'> static struct dentry *positive_after(struct dentry *p, struct dentry *child)</div><div class='ctx'> {</div><div class='del'>-	if (child)</div><div class='del'>-		child = list_next_entry(child, d_child);</div><div class='del'>-	else</div><div class='del'>-		child = list_first_entry(&amp;p-&gt;d_subdirs, struct dentry, d_child);</div><div class='add'>+	child = child ? d_next_sibling(child) : d_first_child(p);</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry_from(child, &amp;p-&gt;d_subdirs, d_child) {</div><div class='add'>+	hlist_for_each_entry_from(child, d_sib) {</div><div class='ctx'> 		spin_lock_nested(&amp;child-&gt;d_lock, DENTRY_D_LOCK_NESTED);</div><div class='ctx'> 		if (simple_positive(child)) {</div><div class='ctx'> 			dget_dlock(child);</div><div class='hunk'>@@ -371,7 +368,7 @@ static struct dentry *should_expire(struct dentry *dentry,</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (simple_empty(dentry))</div><div class='add'>+	if (autofs_empty(ino))</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='ctx'> 	/* Case 2: tree mount, expire iff entire tree is not busy */</div><div class='hunk'>@@ -432,8 +429,6 @@ static struct dentry *autofs_expire_indirect(struct super_block *sb,</div><div class='ctx'> 	if (!root)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='del'>-	timeout = sbi-&gt;exp_timeout;</div><div class='del'>-</div><div class='ctx'> 	dentry = NULL;</div><div class='ctx'> 	while ((dentry = get_next_positive_subdir(dentry, root))) {</div><div class='ctx'> 		spin_lock(&amp;sbi-&gt;fs_lock);</div><div class='hunk'>@@ -444,6 +439,11 @@ static struct dentry *autofs_expire_indirect(struct super_block *sb,</div><div class='ctx'> 		}</div><div class='ctx'> 		spin_unlock(&amp;sbi-&gt;fs_lock);</div><div class='ctx'> </div><div class='add'>+		if (ino-&gt;flags &amp; AUTOFS_INF_EXPIRE_SET)</div><div class='add'>+			timeout = ino-&gt;exp_timeout;</div><div class='add'>+		else</div><div class='add'>+			timeout = sbi-&gt;exp_timeout;</div><div class='add'>+</div><div class='ctx'> 		expired = should_expire(dentry, mnt, timeout, how);</div><div class='ctx'> 		if (!expired)</div><div class='ctx'> 			continue;</div><div class='head'>diff --git a/fs/autofs/init.c b/fs/autofs/init.c<br/>index d3f55e874338..1d644a35ffa0 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/autofs/init.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/autofs/init.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/autofs/init.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/autofs/init.c</a></div><div class='hunk'>@@ -7,16 +7,11 @@</div><div class='ctx'> #include &lt;linux/init.h&gt;</div><div class='ctx'> #include "autofs_i.h"</div><div class='ctx'> </div><div class='del'>-static struct dentry *autofs_mount(struct file_system_type *fs_type,</div><div class='del'>-	int flags, const char *dev_name, void *data)</div><div class='del'>-{</div><div class='del'>-	return mount_nodev(fs_type, flags, data, autofs_fill_super);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> struct file_system_type autofs_fs_type = {</div><div class='ctx'> 	.owner		= THIS_MODULE,</div><div class='ctx'> 	.name		= "autofs",</div><div class='del'>-	.mount		= autofs_mount,</div><div class='add'>+	.init_fs_context = autofs_init_fs_context,</div><div class='add'>+	.parameters	= autofs_param_specs,</div><div class='ctx'> 	.kill_sb	= autofs_kill_sb,</div><div class='ctx'> };</div><div class='ctx'> MODULE_ALIAS_FS("autofs");</div><div class='hunk'>@@ -43,4 +38,5 @@ static void __exit exit_autofs_fs(void)</div><div class='ctx'> </div><div class='ctx'> module_init(init_autofs_fs)</div><div class='ctx'> module_exit(exit_autofs_fs)</div><div class='add'>+MODULE_DESCRIPTION("Kernel automounter support");</div><div class='ctx'> MODULE_LICENSE("GPL");</div><div class='head'>diff --git a/fs/autofs/inode.c b/fs/autofs/inode.c<br/>index 9edf243713eb..b932b1719dfc 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/autofs/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/autofs/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/autofs/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/autofs/inode.c</a></div><div class='hunk'>@@ -6,7 +6,6 @@</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/seq_file.h&gt;</div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='del'>-#include &lt;linux/parser.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "autofs_i.h"</div><div class='ctx'> </div><div class='hunk'>@@ -20,6 +19,8 @@ struct autofs_info *autofs_new_ino(struct autofs_sb_info *sbi)</div><div class='ctx'> 		INIT_LIST_HEAD(&amp;ino-&gt;expiring);</div><div class='ctx'> 		ino-&gt;last_used = jiffies;</div><div class='ctx'> 		ino-&gt;sbi = sbi;</div><div class='add'>+		ino-&gt;exp_timeout = -1;</div><div class='add'>+		ino-&gt;count = 1;</div><div class='ctx'> 	}</div><div class='ctx'> 	return ino;</div><div class='ctx'> }</div><div class='hunk'>@@ -28,6 +29,7 @@ void autofs_clean_ino(struct autofs_info *ino)</div><div class='ctx'> {</div><div class='ctx'> 	ino-&gt;uid = GLOBAL_ROOT_UID;</div><div class='ctx'> 	ino-&gt;gid = GLOBAL_ROOT_GID;</div><div class='add'>+	ino-&gt;exp_timeout = -1;</div><div class='ctx'> 	ino-&gt;last_used = jiffies;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -53,7 +55,7 @@ void autofs_kill_sb(struct super_block *sb)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	pr_debug("shutting down\n");</div><div class='del'>-	kill_litter_super(sb);</div><div class='add'>+	kill_anon_super(sb);</div><div class='ctx'> 	if (sbi)</div><div class='ctx'> 		kfree_rcu(sbi, rcu);</div><div class='ctx'> }</div><div class='hunk'>@@ -109,189 +111,171 @@ static const struct super_operations autofs_sops = {</div><div class='ctx'> 	.evict_inode	= autofs_evict_inode,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-enum {Opt_err, Opt_fd, Opt_uid, Opt_gid, Opt_pgrp, Opt_minproto, Opt_maxproto,</div><div class='del'>-	Opt_indirect, Opt_direct, Opt_offset, Opt_strictexpire,</div><div class='del'>-	Opt_ignore};</div><div class='del'>-</div><div class='del'>-static const match_table_t tokens = {</div><div class='del'>-	{Opt_fd, "fd=%u"},</div><div class='del'>-	{Opt_uid, "uid=%u"},</div><div class='del'>-	{Opt_gid, "gid=%u"},</div><div class='del'>-	{Opt_pgrp, "pgrp=%u"},</div><div class='del'>-	{Opt_minproto, "minproto=%u"},</div><div class='del'>-	{Opt_maxproto, "maxproto=%u"},</div><div class='del'>-	{Opt_indirect, "indirect"},</div><div class='del'>-	{Opt_direct, "direct"},</div><div class='del'>-	{Opt_offset, "offset"},</div><div class='del'>-	{Opt_strictexpire, "strictexpire"},</div><div class='del'>-	{Opt_ignore, "ignore"},</div><div class='del'>-	{Opt_err, NULL}</div><div class='add'>+enum {</div><div class='add'>+	Opt_direct,</div><div class='add'>+	Opt_fd,</div><div class='add'>+	Opt_gid,</div><div class='add'>+	Opt_ignore,</div><div class='add'>+	Opt_indirect,</div><div class='add'>+	Opt_maxproto,</div><div class='add'>+	Opt_minproto,</div><div class='add'>+	Opt_offset,</div><div class='add'>+	Opt_pgrp,</div><div class='add'>+	Opt_strictexpire,</div><div class='add'>+	Opt_uid,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int parse_options(char *options,</div><div class='del'>-			 struct inode *root, int *pgrp, bool *pgrp_set,</div><div class='del'>-			 struct autofs_sb_info *sbi)</div><div class='add'>+const struct fs_parameter_spec autofs_param_specs[] = {</div><div class='add'>+	fsparam_flag	("direct",		Opt_direct),</div><div class='add'>+	fsparam_fd	("fd",			Opt_fd),</div><div class='add'>+	fsparam_gid	("gid",			Opt_gid),</div><div class='add'>+	fsparam_flag	("ignore",		Opt_ignore),</div><div class='add'>+	fsparam_flag	("indirect",		Opt_indirect),</div><div class='add'>+	fsparam_u32	("maxproto",		Opt_maxproto),</div><div class='add'>+	fsparam_u32	("minproto",		Opt_minproto),</div><div class='add'>+	fsparam_flag	("offset",		Opt_offset),</div><div class='add'>+	fsparam_u32	("pgrp",		Opt_pgrp),</div><div class='add'>+	fsparam_flag	("strictexpire",	Opt_strictexpire),</div><div class='add'>+	fsparam_uid	("uid",			Opt_uid),</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct autofs_fs_context {</div><div class='add'>+	kuid_t	uid;</div><div class='add'>+	kgid_t	gid;</div><div class='add'>+	int	pgrp;</div><div class='add'>+	bool	pgrp_set;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Open the fd.  We do it here rather than in get_tree so that it's done in the</div><div class='add'>+ * context of the system call that passed the data and not the one that</div><div class='add'>+ * triggered the superblock creation, lest the fd gets reassigned.</div><div class='add'>+ */</div><div class='add'>+static int autofs_parse_fd(struct fs_context *fc, struct autofs_sb_info *sbi,</div><div class='add'>+			   struct fs_parameter *param,</div><div class='add'>+			   struct fs_parse_result *result)</div><div class='ctx'> {</div><div class='del'>-	char *p;</div><div class='del'>-	substring_t args[MAX_OPT_ARGS];</div><div class='del'>-	int option;</div><div class='del'>-	int pipefd = -1;</div><div class='del'>-	kuid_t uid;</div><div class='del'>-	kgid_t gid;</div><div class='add'>+	struct file *pipe;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	root-&gt;i_uid = current_uid();</div><div class='del'>-	root-&gt;i_gid = current_gid();</div><div class='add'>+	if (param-&gt;type == fs_value_is_file) {</div><div class='add'>+		/* came through the new api */</div><div class='add'>+		pipe = param-&gt;file;</div><div class='add'>+		param-&gt;file = NULL;</div><div class='add'>+	} else {</div><div class='add'>+		pipe = fget(result-&gt;uint_32);</div><div class='add'>+	}</div><div class='add'>+	if (!pipe) {</div><div class='add'>+		errorf(fc, "could not open pipe file descriptor");</div><div class='add'>+		return -EBADF;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	sbi-&gt;min_proto = AUTOFS_MIN_PROTO_VERSION;</div><div class='del'>-	sbi-&gt;max_proto = AUTOFS_MAX_PROTO_VERSION;</div><div class='add'>+	ret = autofs_check_pipe(pipe);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		errorf(fc, "Invalid/unusable pipe");</div><div class='add'>+		fput(pipe);</div><div class='add'>+		return -EBADF;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	sbi-&gt;pipefd = -1;</div><div class='add'>+	autofs_set_packet_pipe_flags(pipe);</div><div class='ctx'> </div><div class='del'>-	if (!options)</div><div class='del'>-		return 1;</div><div class='del'>-</div><div class='del'>-	while ((p = strsep(&amp;options, ",")) != NULL) {</div><div class='del'>-		int token;</div><div class='del'>-</div><div class='del'>-		if (!*p)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		token = match_token(p, tokens, args);</div><div class='del'>-		switch (token) {</div><div class='del'>-		case Opt_fd:</div><div class='del'>-			if (match_int(args, &amp;pipefd))</div><div class='del'>-				return 1;</div><div class='del'>-			sbi-&gt;pipefd = pipefd;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_uid:</div><div class='del'>-			if (match_int(args, &amp;option))</div><div class='del'>-				return 1;</div><div class='del'>-			uid = make_kuid(current_user_ns(), option);</div><div class='del'>-			if (!uid_valid(uid))</div><div class='del'>-				return 1;</div><div class='del'>-			root-&gt;i_uid = uid;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_gid:</div><div class='del'>-			if (match_int(args, &amp;option))</div><div class='del'>-				return 1;</div><div class='del'>-			gid = make_kgid(current_user_ns(), option);</div><div class='del'>-			if (!gid_valid(gid))</div><div class='del'>-				return 1;</div><div class='del'>-			root-&gt;i_gid = gid;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_pgrp:</div><div class='del'>-			if (match_int(args, &amp;option))</div><div class='del'>-				return 1;</div><div class='del'>-			*pgrp = option;</div><div class='del'>-			*pgrp_set = true;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_minproto:</div><div class='del'>-			if (match_int(args, &amp;option))</div><div class='del'>-				return 1;</div><div class='del'>-			sbi-&gt;min_proto = option;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_maxproto:</div><div class='del'>-			if (match_int(args, &amp;option))</div><div class='del'>-				return 1;</div><div class='del'>-			sbi-&gt;max_proto = option;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_indirect:</div><div class='del'>-			set_autofs_type_indirect(&amp;sbi-&gt;type);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_direct:</div><div class='del'>-			set_autofs_type_direct(&amp;sbi-&gt;type);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_offset:</div><div class='del'>-			set_autofs_type_offset(&amp;sbi-&gt;type);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_strictexpire:</div><div class='del'>-			sbi-&gt;flags |= AUTOFS_SBI_STRICTEXPIRE;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_ignore:</div><div class='del'>-			sbi-&gt;flags |= AUTOFS_SBI_IGNORE;</div><div class='del'>-			break;</div><div class='del'>-		default:</div><div class='del'>-			return 1;</div><div class='del'>-		}</div><div class='add'>+	if (sbi-&gt;pipe)</div><div class='add'>+		fput(sbi-&gt;pipe);</div><div class='add'>+</div><div class='add'>+	sbi-&gt;pipefd = result-&gt;uint_32;</div><div class='add'>+	sbi-&gt;pipe = pipe;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int autofs_parse_param(struct fs_context *fc, struct fs_parameter *param)</div><div class='add'>+{</div><div class='add'>+	struct autofs_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct autofs_sb_info *sbi = fc-&gt;s_fs_info;</div><div class='add'>+	struct fs_parse_result result;</div><div class='add'>+	int opt;</div><div class='add'>+</div><div class='add'>+	opt = fs_parse(fc, autofs_param_specs, param, &amp;result);</div><div class='add'>+	if (opt &lt; 0)</div><div class='add'>+		return opt;</div><div class='add'>+</div><div class='add'>+	switch (opt) {</div><div class='add'>+	case Opt_fd:</div><div class='add'>+		return autofs_parse_fd(fc, sbi, param, &amp;result);</div><div class='add'>+	case Opt_uid:</div><div class='add'>+		ctx-&gt;uid = result.uid;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_gid:</div><div class='add'>+		ctx-&gt;gid = result.gid;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_pgrp:</div><div class='add'>+		ctx-&gt;pgrp = result.uint_32;</div><div class='add'>+		ctx-&gt;pgrp_set = true;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_minproto:</div><div class='add'>+		sbi-&gt;min_proto = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_maxproto:</div><div class='add'>+		sbi-&gt;max_proto = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_indirect:</div><div class='add'>+		set_autofs_type_indirect(&amp;sbi-&gt;type);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_direct:</div><div class='add'>+		set_autofs_type_direct(&amp;sbi-&gt;type);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_offset:</div><div class='add'>+		set_autofs_type_offset(&amp;sbi-&gt;type);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_strictexpire:</div><div class='add'>+		sbi-&gt;flags |= AUTOFS_SBI_STRICTEXPIRE;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_ignore:</div><div class='add'>+		sbi-&gt;flags |= AUTOFS_SBI_IGNORE;</div><div class='ctx'> 	}</div><div class='del'>-	return (sbi-&gt;pipefd &lt; 0);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int autofs_fill_super(struct super_block *s, void *data, int silent)</div><div class='add'>+static struct autofs_sb_info *autofs_alloc_sbi(void)</div><div class='ctx'> {</div><div class='del'>-	struct inode *root_inode;</div><div class='del'>-	struct dentry *root;</div><div class='del'>-	struct file *pipe;</div><div class='ctx'> 	struct autofs_sb_info *sbi;</div><div class='del'>-	struct autofs_info *ino;</div><div class='del'>-	int pgrp = 0;</div><div class='del'>-	bool pgrp_set = false;</div><div class='del'>-	int ret = -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	sbi = kzalloc(sizeof(*sbi), GFP_KERNEL);</div><div class='ctx'> 	if (!sbi)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	pr_debug("starting up, sbi = %p\n", sbi);</div><div class='add'>+		return NULL;</div><div class='ctx'> </div><div class='del'>-	s-&gt;s_fs_info = sbi;</div><div class='ctx'> 	sbi-&gt;magic = AUTOFS_SBI_MAGIC;</div><div class='del'>-	sbi-&gt;pipefd = -1;</div><div class='del'>-	sbi-&gt;pipe = NULL;</div><div class='del'>-	sbi-&gt;exp_timeout = 0;</div><div class='del'>-	sbi-&gt;oz_pgrp = NULL;</div><div class='del'>-	sbi-&gt;sb = s;</div><div class='del'>-	sbi-&gt;version = 0;</div><div class='del'>-	sbi-&gt;sub_version = 0;</div><div class='ctx'> 	sbi-&gt;flags = AUTOFS_SBI_CATATONIC;</div><div class='add'>+	sbi-&gt;min_proto = AUTOFS_MIN_PROTO_VERSION;</div><div class='add'>+	sbi-&gt;max_proto = AUTOFS_MAX_PROTO_VERSION;</div><div class='add'>+	sbi-&gt;pipefd = -1;</div><div class='add'>+	sbi-&gt;mnt_ns_id = to_ns_common(current-&gt;nsproxy-&gt;mnt_ns)-&gt;ns_id;</div><div class='add'>+</div><div class='ctx'> 	set_autofs_type_indirect(&amp;sbi-&gt;type);</div><div class='del'>-	sbi-&gt;min_proto = 0;</div><div class='del'>-	sbi-&gt;max_proto = 0;</div><div class='ctx'> 	mutex_init(&amp;sbi-&gt;wq_mutex);</div><div class='ctx'> 	mutex_init(&amp;sbi-&gt;pipe_mutex);</div><div class='ctx'> 	spin_lock_init(&amp;sbi-&gt;fs_lock);</div><div class='del'>-	sbi-&gt;queues = NULL;</div><div class='ctx'> 	spin_lock_init(&amp;sbi-&gt;lookup_lock);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;sbi-&gt;active_list);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;sbi-&gt;expiring_list);</div><div class='del'>-	s-&gt;s_blocksize = 1024;</div><div class='del'>-	s-&gt;s_blocksize_bits = 10;</div><div class='del'>-	s-&gt;s_magic = AUTOFS_SUPER_MAGIC;</div><div class='del'>-	s-&gt;s_op = &amp;autofs_sops;</div><div class='del'>-	s-&gt;s_d_op = &amp;autofs_dentry_operations;</div><div class='del'>-	s-&gt;s_time_gran = 1;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Get the root inode and dentry, but defer checking for errors.</div><div class='del'>-	 */</div><div class='del'>-	ino = autofs_new_ino(sbi);</div><div class='del'>-	if (!ino) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto fail_free;</div><div class='del'>-	}</div><div class='del'>-	root_inode = autofs_get_inode(s, S_IFDIR | 0755);</div><div class='del'>-	root = d_make_root(root_inode);</div><div class='del'>-	if (!root) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto fail_ino;</div><div class='del'>-	}</div><div class='del'>-	pipe = NULL;</div><div class='del'>-</div><div class='del'>-	root-&gt;d_fsdata = ino;</div><div class='add'>+	return sbi;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	/* Can this call block? */</div><div class='del'>-	if (parse_options(data, root_inode, &amp;pgrp, &amp;pgrp_set, sbi)) {</div><div class='del'>-		pr_err("called with bogus options\n");</div><div class='del'>-		goto fail_dput;</div><div class='del'>-	}</div><div class='add'>+static int autofs_validate_protocol(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct autofs_sb_info *sbi = fc-&gt;s_fs_info;</div><div class='ctx'> </div><div class='ctx'> 	/* Test versions first */</div><div class='ctx'> 	if (sbi-&gt;max_proto &lt; AUTOFS_MIN_PROTO_VERSION ||</div><div class='ctx'> 	    sbi-&gt;min_proto &gt; AUTOFS_MAX_PROTO_VERSION) {</div><div class='del'>-		pr_err("kernel does not match daemon version "</div><div class='add'>+		errorf(fc, "kernel does not match daemon version "</div><div class='ctx'> 		       "daemon (%d, %d) kernel (%d, %d)\n",</div><div class='ctx'> 		       sbi-&gt;min_proto, sbi-&gt;max_proto,</div><div class='ctx'> 		       AUTOFS_MIN_PROTO_VERSION, AUTOFS_MAX_PROTO_VERSION);</div><div class='del'>-		goto fail_dput;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Establish highest kernel protocol version */</div><div class='hunk'>@@ -299,62 +283,148 @@ int autofs_fill_super(struct super_block *s, void *data, int silent)</div><div class='ctx'> 		sbi-&gt;version = AUTOFS_MAX_PROTO_VERSION;</div><div class='ctx'> 	else</div><div class='ctx'> 		sbi-&gt;version = sbi-&gt;max_proto;</div><div class='del'>-	sbi-&gt;sub_version = AUTOFS_PROTO_SUBVERSION;</div><div class='del'>-</div><div class='del'>-	if (pgrp_set) {</div><div class='del'>-		sbi-&gt;oz_pgrp = find_get_pid(pgrp);</div><div class='del'>-		if (!sbi-&gt;oz_pgrp) {</div><div class='del'>-			pr_err("could not find process group %d\n",</div><div class='del'>-				pgrp);</div><div class='del'>-			goto fail_dput;</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-		sbi-&gt;oz_pgrp = get_task_pid(current, PIDTYPE_PGID);</div><div class='add'>+</div><div class='add'>+	switch (sbi-&gt;version) {</div><div class='add'>+	case 4:</div><div class='add'>+		sbi-&gt;sub_version = 7;</div><div class='add'>+		break;</div><div class='add'>+	case 5:</div><div class='add'>+		sbi-&gt;sub_version = AUTOFS_PROTO_SUBVERSION;</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		sbi-&gt;sub_version = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (autofs_type_trigger(sbi-&gt;type))</div><div class='del'>-		__managed_dentry_set_managed(root);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='add'>+static int autofs_fill_super(struct super_block *s, struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct autofs_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct autofs_sb_info *sbi = s-&gt;s_fs_info;</div><div class='add'>+	struct inode *root_inode;</div><div class='add'>+	struct autofs_info *ino;</div><div class='add'>+</div><div class='add'>+	pr_debug("starting up, sbi = %p\n", sbi);</div><div class='add'>+</div><div class='add'>+	sbi-&gt;sb = s;</div><div class='add'>+	s-&gt;s_blocksize = 1024;</div><div class='add'>+	s-&gt;s_blocksize_bits = 10;</div><div class='add'>+	s-&gt;s_magic = AUTOFS_SUPER_MAGIC;</div><div class='add'>+	s-&gt;s_op = &amp;autofs_sops;</div><div class='add'>+	set_default_d_op(s, &amp;autofs_dentry_operations);</div><div class='add'>+	s-&gt;s_time_gran = 1;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Get the root inode and dentry, but defer checking for errors.</div><div class='add'>+	 */</div><div class='add'>+	ino = autofs_new_ino(sbi);</div><div class='add'>+	if (!ino)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	root_inode = autofs_get_inode(s, S_IFDIR | 0755);</div><div class='add'>+	if (!root_inode)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	root_inode-&gt;i_uid = ctx-&gt;uid;</div><div class='add'>+	root_inode-&gt;i_gid = ctx-&gt;gid;</div><div class='ctx'> 	root_inode-&gt;i_fop = &amp;autofs_root_operations;</div><div class='ctx'> 	root_inode-&gt;i_op = &amp;autofs_dir_inode_operations;</div><div class='ctx'> </div><div class='add'>+	s-&gt;s_root = d_make_root(root_inode);</div><div class='add'>+	if (unlikely(!s-&gt;s_root)) {</div><div class='add'>+		autofs_free_ino(ino);</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+	s-&gt;s_root-&gt;d_fsdata = ino;</div><div class='add'>+</div><div class='add'>+	if (ctx-&gt;pgrp_set) {</div><div class='add'>+		sbi-&gt;oz_pgrp = find_get_pid(ctx-&gt;pgrp);</div><div class='add'>+		if (!sbi-&gt;oz_pgrp)</div><div class='add'>+			return invalf(fc, "Could not find process group %d",</div><div class='add'>+				      ctx-&gt;pgrp);</div><div class='add'>+	} else</div><div class='add'>+		sbi-&gt;oz_pgrp = get_task_pid(current, PIDTYPE_PGID);</div><div class='add'>+</div><div class='add'>+	if (autofs_type_trigger(sbi-&gt;type))</div><div class='add'>+		/* s-&gt;s_root won't be contended so there's little to</div><div class='add'>+		 * be gained by not taking the d_lock when setting</div><div class='add'>+		 * d_flags, even when a lot mounts are being done.</div><div class='add'>+		 */</div><div class='add'>+		managed_dentry_set_managed(s-&gt;s_root);</div><div class='add'>+</div><div class='ctx'> 	pr_debug("pipe fd = %d, pgrp = %u\n",</div><div class='ctx'> 		 sbi-&gt;pipefd, pid_nr(sbi-&gt;oz_pgrp));</div><div class='del'>-	pipe = fget(sbi-&gt;pipefd);</div><div class='ctx'> </div><div class='del'>-	if (!pipe) {</div><div class='del'>-		pr_err("could not open pipe file descriptor\n");</div><div class='del'>-		goto fail_put_pid;</div><div class='del'>-	}</div><div class='del'>-	ret = autofs_prepare_pipe(pipe);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto fail_fput;</div><div class='del'>-	sbi-&gt;pipe = pipe;</div><div class='ctx'> 	sbi-&gt;flags &amp;= ~AUTOFS_SBI_CATATONIC;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Success! Install the root dentry now to indicate completion.</div><div class='del'>-	 */</div><div class='del'>-	s-&gt;s_root = root;</div><div class='add'>+/*</div><div class='add'>+ * Validate the parameters and then request a superblock.</div><div class='add'>+ */</div><div class='add'>+static int autofs_get_tree(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct autofs_sb_info *sbi = fc-&gt;s_fs_info;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = autofs_validate_protocol(fc);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	if (sbi-&gt;pipefd &lt; 0)</div><div class='add'>+		return invalf(fc, "No control pipe specified");</div><div class='add'>+</div><div class='add'>+	return get_tree_nodev(fc, autofs_fill_super);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void autofs_free_fc(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct autofs_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct autofs_sb_info *sbi = fc-&gt;s_fs_info;</div><div class='add'>+</div><div class='add'>+	if (sbi) {</div><div class='add'>+		if (sbi-&gt;pipe)</div><div class='add'>+			fput(sbi-&gt;pipe);</div><div class='add'>+		kfree(sbi);</div><div class='add'>+	}</div><div class='add'>+	kfree(ctx);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct fs_context_operations autofs_context_ops = {</div><div class='add'>+	.free		= autofs_free_fc,</div><div class='add'>+	.parse_param	= autofs_parse_param,</div><div class='add'>+	.get_tree	= autofs_get_tree,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Set up the filesystem mount context.</div><div class='add'>+ */</div><div class='add'>+int autofs_init_fs_context(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct autofs_fs_context *ctx;</div><div class='add'>+	struct autofs_sb_info *sbi;</div><div class='add'>+</div><div class='add'>+	ctx = kzalloc(sizeof(struct autofs_fs_context), GFP_KERNEL);</div><div class='add'>+	if (!ctx)</div><div class='add'>+		goto nomem;</div><div class='add'>+</div><div class='add'>+	ctx-&gt;uid = current_uid();</div><div class='add'>+	ctx-&gt;gid = current_gid();</div><div class='add'>+</div><div class='add'>+	sbi = autofs_alloc_sbi();</div><div class='add'>+	if (!sbi)</div><div class='add'>+		goto nomem_ctx;</div><div class='add'>+</div><div class='add'>+	fc-&gt;fs_private = ctx;</div><div class='add'>+	fc-&gt;s_fs_info = sbi;</div><div class='add'>+	fc-&gt;ops = &amp;autofs_context_ops;</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Failure ... clean up.</div><div class='del'>-	 */</div><div class='del'>-fail_fput:</div><div class='del'>-	pr_err("pipe file descriptor does not contain proper ops\n");</div><div class='del'>-	fput(pipe);</div><div class='del'>-fail_put_pid:</div><div class='del'>-	put_pid(sbi-&gt;oz_pgrp);</div><div class='del'>-fail_dput:</div><div class='del'>-	dput(root);</div><div class='del'>-	goto fail_free;</div><div class='del'>-fail_ino:</div><div class='del'>-	autofs_free_ino(ino);</div><div class='del'>-fail_free:</div><div class='del'>-	kfree(sbi);</div><div class='del'>-	s-&gt;s_fs_info = NULL;</div><div class='del'>-	return ret;</div><div class='add'>+nomem_ctx:</div><div class='add'>+	kfree(ctx);</div><div class='add'>+nomem:</div><div class='add'>+	return -ENOMEM;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct inode *autofs_get_inode(struct super_block *sb, umode_t mode)</div><div class='hunk'>@@ -369,7 +439,7 @@ struct inode *autofs_get_inode(struct super_block *sb, umode_t mode)</div><div class='ctx'> 		inode-&gt;i_uid = d_inode(sb-&gt;s_root)-&gt;i_uid;</div><div class='ctx'> 		inode-&gt;i_gid = d_inode(sb-&gt;s_root)-&gt;i_gid;</div><div class='ctx'> 	}</div><div class='del'>-	inode-&gt;i_atime = inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	simple_inode_init_ts(inode);</div><div class='ctx'> 	inode-&gt;i_ino = get_next_ino();</div><div class='ctx'> </div><div class='ctx'> 	if (S_ISDIR(mode)) {</div><div class='head'>diff --git a/fs/autofs/root.c b/fs/autofs/root.c<br/>index 91fe4548c256..2c31002b314a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/autofs/root.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/autofs/root.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/autofs/root.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/autofs/root.c</a></div><div class='hunk'>@@ -10,12 +10,13 @@</div><div class='ctx'> </div><div class='ctx'> #include "autofs_i.h"</div><div class='ctx'> </div><div class='del'>-static int autofs_dir_symlink(struct user_namespace *, struct inode *,</div><div class='add'>+static int autofs_dir_permission(struct mnt_idmap *, struct inode *, int);</div><div class='add'>+static int autofs_dir_symlink(struct mnt_idmap *, struct inode *,</div><div class='ctx'> 			      struct dentry *, const char *);</div><div class='ctx'> static int autofs_dir_unlink(struct inode *, struct dentry *);</div><div class='ctx'> static int autofs_dir_rmdir(struct inode *, struct dentry *);</div><div class='del'>-static int autofs_dir_mkdir(struct user_namespace *, struct inode *,</div><div class='del'>-			    struct dentry *, umode_t);</div><div class='add'>+static struct dentry *autofs_dir_mkdir(struct mnt_idmap *, struct inode *,</div><div class='add'>+				       struct dentry *, umode_t);</div><div class='ctx'> static long autofs_root_ioctl(struct file *, unsigned int, unsigned long);</div><div class='ctx'> #ifdef CONFIG_COMPAT</div><div class='ctx'> static long autofs_root_compat_ioctl(struct file *,</div><div class='hunk'>@@ -50,6 +51,7 @@ const struct file_operations autofs_dir_operations = {</div><div class='ctx'> </div><div class='ctx'> const struct inode_operations autofs_dir_inode_operations = {</div><div class='ctx'> 	.lookup		= autofs_lookup,</div><div class='add'>+	.permission	= autofs_dir_permission,</div><div class='ctx'> 	.unlink		= autofs_dir_unlink,</div><div class='ctx'> 	.symlink	= autofs_dir_symlink,</div><div class='ctx'> 	.mkdir		= autofs_dir_mkdir,</div><div class='hunk'>@@ -77,6 +79,7 @@ static int autofs_dir_open(struct inode *inode, struct file *file)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dentry = file-&gt;f_path.dentry;</div><div class='ctx'> 	struct autofs_sb_info *sbi = autofs_sbi(dentry-&gt;d_sb);</div><div class='add'>+	struct autofs_info *ino = autofs_dentry_ino(dentry);</div><div class='ctx'> </div><div class='ctx'> 	pr_debug("file=%p dentry=%p %pd\n", file, dentry, dentry);</div><div class='ctx'> </div><div class='hunk'>@@ -93,7 +96,7 @@ static int autofs_dir_open(struct inode *inode, struct file *file)</div><div class='ctx'> 	 * it.</div><div class='ctx'> 	 */</div><div class='ctx'> 	spin_lock(&amp;sbi-&gt;lookup_lock);</div><div class='del'>-	if (!path_is_mountpoint(&amp;file-&gt;f_path) &amp;&amp; simple_empty(dentry)) {</div><div class='add'>+	if (!path_is_mountpoint(&amp;file-&gt;f_path) &amp;&amp; autofs_empty(ino)) {</div><div class='ctx'> 		spin_unlock(&amp;sbi-&gt;lookup_lock);</div><div class='ctx'> 		return -ENOENT;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -288,9 +291,26 @@ static struct dentry *autofs_mountpoint_changed(struct path *path)</div><div class='ctx'> 	struct dentry *dentry = path-&gt;dentry;</div><div class='ctx'> 	struct autofs_sb_info *sbi = autofs_sbi(dentry-&gt;d_sb);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * If this is an indirect mount the dentry could have gone away</div><div class='del'>-	 * as a result of an expire and a new one created.</div><div class='add'>+	/* If this is an indirect mount the dentry could have gone away</div><div class='add'>+	 * and a new one created.</div><div class='add'>+	 *</div><div class='add'>+	 * This is unusual and I can't remember the case for which it</div><div class='add'>+	 * was originally added now. But an example of how this can</div><div class='add'>+	 * happen is an autofs indirect mount that has the "browse"</div><div class='add'>+	 * option set and also has the "symlink" option in the autofs</div><div class='add'>+	 * map entry. In this case the daemon will remove the browse</div><div class='add'>+	 * directory and create a symlink as the mount leaving the</div><div class='add'>+	 * struct path stale.</div><div class='add'>+	 *</div><div class='add'>+	 * Another not so obvious case is when a mount in an autofs</div><div class='add'>+	 * indirect mount that uses the "nobrowse" option is being</div><div class='add'>+	 * expired at the same time as a path walk. If the mount has</div><div class='add'>+	 * been umounted but the mount point directory seen before</div><div class='add'>+	 * becoming unhashed (during a lockless path walk) when a stat</div><div class='add'>+	 * family system call is made the mount won't be re-mounted as</div><div class='add'>+	 * it should. In this case the mount point that's been removed</div><div class='add'>+	 * (by the daemon) will be stale and the a new mount point</div><div class='add'>+	 * dentry created.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (autofs_type_indirect(sbi-&gt;type) &amp;&amp; d_unhashed(dentry)) {</div><div class='ctx'> 		struct dentry *parent = dentry-&gt;d_parent;</div><div class='hunk'>@@ -321,6 +341,14 @@ static struct vfsmount *autofs_d_automount(struct path *path)</div><div class='ctx'> 	if (autofs_oz_mode(sbi))</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='add'>+	/* Refuse to trigger mount if current namespace is not the owner</div><div class='add'>+	 * and the mount is propagation private.</div><div class='add'>+	 */</div><div class='add'>+	if (sbi-&gt;mnt_ns_id != to_ns_common(current-&gt;nsproxy-&gt;mnt_ns)-&gt;ns_id) {</div><div class='add'>+		if (vfsmount_to_propagation_flags(path-&gt;mnt) &amp; MS_PRIVATE)</div><div class='add'>+			return ERR_PTR(-EPERM);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If an expire request is pending everyone must wait.</div><div class='ctx'> 	 * If the expire fails we're still mounted so continue</div><div class='hunk'>@@ -362,7 +390,7 @@ static struct vfsmount *autofs_d_automount(struct path *path)</div><div class='ctx'> 		 * the mount never trigger mounts themselves (they have an</div><div class='ctx'> 		 * autofs trigger mount mounted on them). But v4 pseudo direct</div><div class='ctx'> 		 * mounts do need the leaves to trigger mounts. In this case</div><div class='del'>-		 * we have no choice but to use the list_empty() check and</div><div class='add'>+		 * we have no choice but to use the autofs_empty() check and</div><div class='ctx'> 		 * require user space behave.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (sbi-&gt;version &gt; 4) {</div><div class='hunk'>@@ -371,7 +399,7 @@ static struct vfsmount *autofs_d_automount(struct path *path)</div><div class='ctx'> 				goto done;</div><div class='ctx'> 			}</div><div class='ctx'> 		} else {</div><div class='del'>-			if (!simple_empty(dentry)) {</div><div class='add'>+			if (!autofs_empty(ino)) {</div><div class='ctx'> 				spin_unlock(&amp;sbi-&gt;fs_lock);</div><div class='ctx'> 				goto done;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -426,9 +454,8 @@ static int autofs_d_manage(const struct path *path, bool rcu_walk)</div><div class='ctx'> </div><div class='ctx'> 	if (rcu_walk) {</div><div class='ctx'> 		/* We don't need fs_lock in rcu_walk mode,</div><div class='del'>-		 * just testing 'AUTOFS_INFO_NO_RCU' is enough.</div><div class='del'>-		 * simple_empty() takes a spinlock, so leave it</div><div class='del'>-		 * to last.</div><div class='add'>+		 * just testing 'AUTOFS_INF_WANT_EXPIRE' is enough.</div><div class='add'>+		 *</div><div class='ctx'> 		 * We only return -EISDIR when certain this isn't</div><div class='ctx'> 		 * a mount-trap.</div><div class='ctx'> 		 */</div><div class='hunk'>@@ -441,9 +468,7 @@ static int autofs_d_manage(const struct path *path, bool rcu_walk)</div><div class='ctx'> 		inode = d_inode_rcu(dentry);</div><div class='ctx'> 		if (inode &amp;&amp; S_ISLNK(inode-&gt;i_mode))</div><div class='ctx'> 			return -EISDIR;</div><div class='del'>-		if (list_empty(&amp;dentry-&gt;d_subdirs))</div><div class='del'>-			return 0;</div><div class='del'>-		if (!simple_empty(dentry))</div><div class='add'>+		if (!autofs_empty(ino))</div><div class='ctx'> 			return -EISDIR;</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -463,7 +488,7 @@ static int autofs_d_manage(const struct path *path, bool rcu_walk)</div><div class='ctx'> 		 * we can avoid needless calls -&gt;d_automount() and avoid</div><div class='ctx'> 		 * an incorrect ELOOP error return.</div><div class='ctx'> 		 */</div><div class='del'>-		if ((!path_is_mountpoint(path) &amp;&amp; !simple_empty(dentry)) ||</div><div class='add'>+		if ((!path_is_mountpoint(path) &amp;&amp; !autofs_empty(ino)) ||</div><div class='ctx'> 		    (d_really_is_positive(dentry) &amp;&amp; d_is_symlink(dentry)))</div><div class='ctx'> 			status = -EISDIR;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -526,11 +551,30 @@ static struct dentry *autofs_lookup(struct inode *dir,</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int autofs_dir_symlink(struct user_namespace *mnt_userns,</div><div class='add'>+static int autofs_dir_permission(struct mnt_idmap *idmap,</div><div class='add'>+				 struct inode *inode, int mask)</div><div class='add'>+{</div><div class='add'>+	if (mask &amp; MAY_WRITE) {</div><div class='add'>+		struct autofs_sb_info *sbi = autofs_sbi(inode-&gt;i_sb);</div><div class='add'>+</div><div class='add'>+		if (!autofs_oz_mode(sbi))</div><div class='add'>+			return -EACCES;</div><div class='add'>+</div><div class='add'>+		/* autofs_oz_mode() needs to allow path walks when the</div><div class='add'>+		 * autofs mount is catatonic but the state of an autofs</div><div class='add'>+		 * file system needs to be preserved over restarts.</div><div class='add'>+		 */</div><div class='add'>+		if (sbi-&gt;flags &amp; AUTOFS_SBI_CATATONIC)</div><div class='add'>+			return -EACCES;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return generic_permission(idmap, inode, mask);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int autofs_dir_symlink(struct mnt_idmap *idmap,</div><div class='ctx'> 			      struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 			      const char *symname)</div><div class='ctx'> {</div><div class='del'>-	struct autofs_sb_info *sbi = autofs_sbi(dir-&gt;i_sb);</div><div class='ctx'> 	struct autofs_info *ino = autofs_dentry_ino(dentry);</div><div class='ctx'> 	struct autofs_info *p_ino;</div><div class='ctx'> 	struct inode *inode;</div><div class='hunk'>@@ -539,16 +583,6 @@ static int autofs_dir_symlink(struct user_namespace *mnt_userns,</div><div class='ctx'> </div><div class='ctx'> 	pr_debug("%s &lt;- %pd\n", symname, dentry);</div><div class='ctx'> </div><div class='del'>-	if (!autofs_oz_mode(sbi))</div><div class='del'>-		return -EACCES;</div><div class='del'>-</div><div class='del'>-	/* autofs_oz_mode() needs to allow path walks when the</div><div class='del'>-	 * autofs mount is catatonic but the state of an autofs</div><div class='del'>-	 * file system needs to be preserved over restarts.</div><div class='del'>-	 */</div><div class='del'>-	if (sbi-&gt;flags &amp; AUTOFS_SBI_CATATONIC)</div><div class='del'>-		return -EACCES;</div><div class='del'>-</div><div class='ctx'> 	BUG_ON(!ino);</div><div class='ctx'> </div><div class='ctx'> 	autofs_clean_ino(ino);</div><div class='hunk'>@@ -568,14 +602,12 @@ static int autofs_dir_symlink(struct user_namespace *mnt_userns,</div><div class='ctx'> 	}</div><div class='ctx'> 	inode-&gt;i_private = cp;</div><div class='ctx'> 	inode-&gt;i_size = size;</div><div class='del'>-	d_add(dentry, inode);</div><div class='ctx'> </div><div class='del'>-	dget(dentry);</div><div class='del'>-	ino-&gt;count++;</div><div class='add'>+	d_make_persistent(dentry, inode);</div><div class='ctx'> 	p_ino = autofs_dentry_ino(dentry-&gt;d_parent);</div><div class='ctx'> 	p_ino-&gt;count++;</div><div class='ctx'> </div><div class='del'>-	dir-&gt;i_mtime = current_time(dir);</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -598,28 +630,16 @@ static int autofs_dir_symlink(struct user_namespace *mnt_userns,</div><div class='ctx'> static int autofs_dir_unlink(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	struct autofs_sb_info *sbi = autofs_sbi(dir-&gt;i_sb);</div><div class='del'>-	struct autofs_info *ino = autofs_dentry_ino(dentry);</div><div class='ctx'> 	struct autofs_info *p_ino;</div><div class='ctx'> </div><div class='del'>-	if (!autofs_oz_mode(sbi))</div><div class='del'>-		return -EACCES;</div><div class='del'>-</div><div class='del'>-	/* autofs_oz_mode() needs to allow path walks when the</div><div class='del'>-	 * autofs mount is catatonic but the state of an autofs</div><div class='del'>-	 * file system needs to be preserved over restarts.</div><div class='del'>-	 */</div><div class='del'>-	if (sbi-&gt;flags &amp; AUTOFS_SBI_CATATONIC)</div><div class='del'>-		return -EACCES;</div><div class='del'>-</div><div class='del'>-	ino-&gt;count--;</div><div class='ctx'> 	p_ino = autofs_dentry_ino(dentry-&gt;d_parent);</div><div class='ctx'> 	p_ino-&gt;count--;</div><div class='del'>-	dput(ino-&gt;dentry);</div><div class='add'>+	d_make_discardable(dentry);</div><div class='ctx'> </div><div class='ctx'> 	d_inode(dentry)-&gt;i_size = 0;</div><div class='ctx'> 	clear_nlink(d_inode(dentry));</div><div class='ctx'> </div><div class='del'>-	dir-&gt;i_mtime = current_time(dir);</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;sbi-&gt;lookup_lock);</div><div class='ctx'> 	__autofs_add_expiring(dentry);</div><div class='hunk'>@@ -683,16 +703,6 @@ static int autofs_dir_rmdir(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> </div><div class='ctx'> 	pr_debug("dentry %p, removing %pd\n", dentry, dentry);</div><div class='ctx'> </div><div class='del'>-	if (!autofs_oz_mode(sbi))</div><div class='del'>-		return -EACCES;</div><div class='del'>-</div><div class='del'>-	/* autofs_oz_mode() needs to allow path walks when the</div><div class='del'>-	 * autofs mount is catatonic but the state of an autofs</div><div class='del'>-	 * file system needs to be preserved over restarts.</div><div class='del'>-	 */</div><div class='del'>-	if (sbi-&gt;flags &amp; AUTOFS_SBI_CATATONIC)</div><div class='del'>-		return -EACCES;</div><div class='del'>-</div><div class='ctx'> 	if (ino-&gt;count != 1)</div><div class='ctx'> 		return -ENOTEMPTY;</div><div class='ctx'> </div><div class='hunk'>@@ -704,10 +714,9 @@ static int autofs_dir_rmdir(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	if (sbi-&gt;version &lt; 5)</div><div class='ctx'> 		autofs_clear_leaf_automount_flags(dentry);</div><div class='ctx'> </div><div class='del'>-	ino-&gt;count--;</div><div class='ctx'> 	p_ino = autofs_dentry_ino(dentry-&gt;d_parent);</div><div class='ctx'> 	p_ino-&gt;count--;</div><div class='del'>-	dput(ino-&gt;dentry);</div><div class='add'>+	d_make_discardable(dentry);</div><div class='ctx'> 	d_inode(dentry)-&gt;i_size = 0;</div><div class='ctx'> 	clear_nlink(d_inode(dentry));</div><div class='ctx'> </div><div class='hunk'>@@ -717,25 +726,15 @@ static int autofs_dir_rmdir(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int autofs_dir_mkdir(struct user_namespace *mnt_userns,</div><div class='del'>-			    struct inode *dir, struct dentry *dentry,</div><div class='del'>-			    umode_t mode)</div><div class='add'>+static struct dentry *autofs_dir_mkdir(struct mnt_idmap *idmap,</div><div class='add'>+				       struct inode *dir, struct dentry *dentry,</div><div class='add'>+				       umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct autofs_sb_info *sbi = autofs_sbi(dir-&gt;i_sb);</div><div class='ctx'> 	struct autofs_info *ino = autofs_dentry_ino(dentry);</div><div class='ctx'> 	struct autofs_info *p_ino;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> </div><div class='del'>-	if (!autofs_oz_mode(sbi))</div><div class='del'>-		return -EACCES;</div><div class='del'>-</div><div class='del'>-	/* autofs_oz_mode() needs to allow path walks when the</div><div class='del'>-	 * autofs mount is catatonic but the state of an autofs</div><div class='del'>-	 * file system needs to be preserved over restarts.</div><div class='del'>-	 */</div><div class='del'>-	if (sbi-&gt;flags &amp; AUTOFS_SBI_CATATONIC)</div><div class='del'>-		return -EACCES;</div><div class='del'>-</div><div class='ctx'> 	pr_debug("dentry %p, creating %pd\n", dentry, dentry);</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(!ino);</div><div class='hunk'>@@ -746,20 +745,18 @@ static int autofs_dir_mkdir(struct user_namespace *mnt_userns,</div><div class='ctx'> </div><div class='ctx'> 	inode = autofs_get_inode(dir-&gt;i_sb, S_IFDIR | mode);</div><div class='ctx'> 	if (!inode)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	d_add(dentry, inode);</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='ctx'> 	if (sbi-&gt;version &lt; 5)</div><div class='ctx'> 		autofs_set_leaf_automount_flags(dentry);</div><div class='ctx'> </div><div class='del'>-	dget(dentry);</div><div class='del'>-	ino-&gt;count++;</div><div class='add'>+	d_make_persistent(dentry, inode);</div><div class='ctx'> 	p_ino = autofs_dentry_ino(dentry-&gt;d_parent);</div><div class='ctx'> 	p_ino-&gt;count++;</div><div class='ctx'> 	inc_nlink(dir);</div><div class='del'>-	dir-&gt;i_mtime = current_time(dir);</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Get/set timeout ioctl() operation */</div><div class='head'>diff --git a/fs/autofs/waitq.c b/fs/autofs/waitq.c<br/>index 54c1f8b8b075..33dd4660d82f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/autofs/waitq.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/autofs/waitq.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/autofs/waitq.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/autofs/waitq.c</a></div><div class='hunk'>@@ -32,8 +32,9 @@ void autofs_catatonic_mode(struct autofs_sb_info *sbi)</div><div class='ctx'> 		wq-&gt;status = -ENOENT; /* Magic is gone - report failure */</div><div class='ctx'> 		kfree(wq-&gt;name.name - wq-&gt;offset);</div><div class='ctx'> 		wq-&gt;name.name = NULL;</div><div class='del'>-		wq-&gt;wait_ctr--;</div><div class='del'>-		wake_up_interruptible(&amp;wq-&gt;queue);</div><div class='add'>+		wake_up(&amp;wq-&gt;queue);</div><div class='add'>+		if (!--wq-&gt;wait_ctr)</div><div class='add'>+			kfree(wq);</div><div class='ctx'> 		wq = nwq;</div><div class='ctx'> 	}</div><div class='ctx'> 	fput(sbi-&gt;pipe);	/* Close the pipe */</div><div class='head'>diff --git a/fs/backing-file.c b/fs/backing-file.c<br/>new file mode 100644<br/>index 000000000000..45da8600d564<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/backing-file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/backing-file.c</a></div><div class='hunk'>@@ -0,0 +1,357 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-only</div><div class='add'>+/*</div><div class='add'>+ * Common helpers for stackable filesystems and backing files.</div><div class='add'>+ *</div><div class='add'>+ * Forked from fs/overlayfs/file.c.</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2017 Red Hat, Inc.</div><div class='add'>+ * Copyright (C) 2023 CTERA Networks.</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/backing-file.h&gt;</div><div class='add'>+#include &lt;linux/splice.h&gt;</div><div class='add'>+#include &lt;linux/mm.h&gt;</div><div class='add'>+</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * backing_file_open - open a backing file for kernel internal use</div><div class='add'>+ * @user_path:	path that the user reuqested to open</div><div class='add'>+ * @flags:	open flags</div><div class='add'>+ * @real_path:	path of the backing file</div><div class='add'>+ * @cred:	credentials for open</div><div class='add'>+ *</div><div class='add'>+ * Open a backing file for a stackable filesystem (e.g., overlayfs).</div><div class='add'>+ * @user_path may be on the stackable filesystem and @real_path on the</div><div class='add'>+ * underlying filesystem.  In this case, we want to be able to return the</div><div class='add'>+ * @user_path of the stackable filesystem. This is done by embedding the</div><div class='add'>+ * returned file into a container structure that also stores the stacked</div><div class='add'>+ * file's path, which can be retrieved using backing_file_user_path().</div><div class='add'>+ */</div><div class='add'>+struct file *backing_file_open(const struct path *user_path, int flags,</div><div class='add'>+			       const struct path *real_path,</div><div class='add'>+			       const struct cred *cred)</div><div class='add'>+{</div><div class='add'>+	struct file *f;</div><div class='add'>+	int error;</div><div class='add'>+</div><div class='add'>+	f = alloc_empty_backing_file(flags, cred);</div><div class='add'>+	if (IS_ERR(f))</div><div class='add'>+		return f;</div><div class='add'>+</div><div class='add'>+	path_get(user_path);</div><div class='add'>+	backing_file_set_user_path(f, user_path);</div><div class='add'>+	error = vfs_open(real_path, f);</div><div class='add'>+	if (error) {</div><div class='add'>+		fput(f);</div><div class='add'>+		f = ERR_PTR(error);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return f;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(backing_file_open);</div><div class='add'>+</div><div class='add'>+struct file *backing_tmpfile_open(const struct path *user_path, int flags,</div><div class='add'>+				  const struct path *real_parentpath,</div><div class='add'>+				  umode_t mode, const struct cred *cred)</div><div class='add'>+{</div><div class='add'>+	struct mnt_idmap *real_idmap = mnt_idmap(real_parentpath-&gt;mnt);</div><div class='add'>+	struct file *f;</div><div class='add'>+	int error;</div><div class='add'>+</div><div class='add'>+	f = alloc_empty_backing_file(flags, cred);</div><div class='add'>+	if (IS_ERR(f))</div><div class='add'>+		return f;</div><div class='add'>+</div><div class='add'>+	path_get(user_path);</div><div class='add'>+	backing_file_set_user_path(f, user_path);</div><div class='add'>+	error = vfs_tmpfile(real_idmap, real_parentpath, f, mode);</div><div class='add'>+	if (error) {</div><div class='add'>+		fput(f);</div><div class='add'>+		f = ERR_PTR(error);</div><div class='add'>+	}</div><div class='add'>+	return f;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(backing_tmpfile_open);</div><div class='add'>+</div><div class='add'>+struct backing_aio {</div><div class='add'>+	struct kiocb iocb;</div><div class='add'>+	refcount_t ref;</div><div class='add'>+	struct kiocb *orig_iocb;</div><div class='add'>+	/* used for aio completion */</div><div class='add'>+	void (*end_write)(struct kiocb *iocb, ssize_t);</div><div class='add'>+	struct work_struct work;</div><div class='add'>+	long res;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static struct kmem_cache *backing_aio_cachep;</div><div class='add'>+</div><div class='add'>+#define BACKING_IOCB_MASK \</div><div class='add'>+	(IOCB_NOWAIT | IOCB_HIPRI | IOCB_DSYNC | IOCB_SYNC | IOCB_APPEND)</div><div class='add'>+</div><div class='add'>+static rwf_t iocb_to_rw_flags(int flags)</div><div class='add'>+{</div><div class='add'>+	return (__force rwf_t)(flags &amp; BACKING_IOCB_MASK);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void backing_aio_put(struct backing_aio *aio)</div><div class='add'>+{</div><div class='add'>+	if (refcount_dec_and_test(&amp;aio-&gt;ref)) {</div><div class='add'>+		fput(aio-&gt;iocb.ki_filp);</div><div class='add'>+		kmem_cache_free(backing_aio_cachep, aio);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void backing_aio_cleanup(struct backing_aio *aio, long res)</div><div class='add'>+{</div><div class='add'>+	struct kiocb *iocb = &amp;aio-&gt;iocb;</div><div class='add'>+	struct kiocb *orig_iocb = aio-&gt;orig_iocb;</div><div class='add'>+</div><div class='add'>+	orig_iocb-&gt;ki_pos = iocb-&gt;ki_pos;</div><div class='add'>+	if (aio-&gt;end_write)</div><div class='add'>+		aio-&gt;end_write(orig_iocb, res);</div><div class='add'>+</div><div class='add'>+	backing_aio_put(aio);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void backing_aio_rw_complete(struct kiocb *iocb, long res)</div><div class='add'>+{</div><div class='add'>+	struct backing_aio *aio = container_of(iocb, struct backing_aio, iocb);</div><div class='add'>+	struct kiocb *orig_iocb = aio-&gt;orig_iocb;</div><div class='add'>+</div><div class='add'>+	if (iocb-&gt;ki_flags &amp; IOCB_WRITE)</div><div class='add'>+		kiocb_end_write(iocb);</div><div class='add'>+</div><div class='add'>+	backing_aio_cleanup(aio, res);</div><div class='add'>+	orig_iocb-&gt;ki_complete(orig_iocb, res);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void backing_aio_complete_work(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct backing_aio *aio = container_of(work, struct backing_aio, work);</div><div class='add'>+</div><div class='add'>+	backing_aio_rw_complete(&amp;aio-&gt;iocb, aio-&gt;res);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void backing_aio_queue_completion(struct kiocb *iocb, long res)</div><div class='add'>+{</div><div class='add'>+	struct backing_aio *aio = container_of(iocb, struct backing_aio, iocb);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Punt to a work queue to serialize updates of mtime/size.</div><div class='add'>+	 */</div><div class='add'>+	aio-&gt;res = res;</div><div class='add'>+	INIT_WORK(&amp;aio-&gt;work, backing_aio_complete_work);</div><div class='add'>+	queue_work(file_inode(aio-&gt;orig_iocb-&gt;ki_filp)-&gt;i_sb-&gt;s_dio_done_wq,</div><div class='add'>+		   &amp;aio-&gt;work);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int backing_aio_init_wq(struct kiocb *iocb)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = file_inode(iocb-&gt;ki_filp)-&gt;i_sb;</div><div class='add'>+</div><div class='add'>+	if (sb-&gt;s_dio_done_wq)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	return sb_init_dio_done_wq(sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int do_backing_file_read_iter(struct file *file, struct iov_iter *iter,</div><div class='add'>+				     struct kiocb *iocb, int flags)</div><div class='add'>+{</div><div class='add'>+	struct backing_aio *aio = NULL;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (is_sync_kiocb(iocb)) {</div><div class='add'>+		rwf_t rwf = iocb_to_rw_flags(flags);</div><div class='add'>+</div><div class='add'>+		return vfs_iter_read(file, iter, &amp;iocb-&gt;ki_pos, rwf);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	aio = kmem_cache_zalloc(backing_aio_cachep, GFP_KERNEL);</div><div class='add'>+	if (!aio)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	aio-&gt;orig_iocb = iocb;</div><div class='add'>+	kiocb_clone(&amp;aio-&gt;iocb, iocb, get_file(file));</div><div class='add'>+	aio-&gt;iocb.ki_complete = backing_aio_rw_complete;</div><div class='add'>+	refcount_set(&amp;aio-&gt;ref, 2);</div><div class='add'>+	ret = vfs_iocb_iter_read(file, &amp;aio-&gt;iocb, iter);</div><div class='add'>+	backing_aio_put(aio);</div><div class='add'>+	if (ret != -EIOCBQUEUED)</div><div class='add'>+		backing_aio_cleanup(aio, ret);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+ssize_t backing_file_read_iter(struct file *file, struct iov_iter *iter,</div><div class='add'>+			       struct kiocb *iocb, int flags,</div><div class='add'>+			       struct backing_file_ctx *ctx)</div><div class='add'>+{</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	if (WARN_ON_ONCE(!(file-&gt;f_mode &amp; FMODE_BACKING)))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	if (!iov_iter_count(iter))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if (iocb-&gt;ki_flags &amp; IOCB_DIRECT &amp;&amp;</div><div class='add'>+	    !(file-&gt;f_mode &amp; FMODE_CAN_ODIRECT))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	scoped_with_creds(ctx-&gt;cred)</div><div class='add'>+		ret = do_backing_file_read_iter(file, iter, iocb, flags);</div><div class='add'>+</div><div class='add'>+	if (ctx-&gt;accessed)</div><div class='add'>+		ctx-&gt;accessed(iocb-&gt;ki_filp);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(backing_file_read_iter);</div><div class='add'>+</div><div class='add'>+static int do_backing_file_write_iter(struct file *file, struct iov_iter *iter,</div><div class='add'>+				      struct kiocb *iocb, int flags,</div><div class='add'>+				      void (*end_write)(struct kiocb *, ssize_t))</div><div class='add'>+{</div><div class='add'>+	struct backing_aio *aio;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (is_sync_kiocb(iocb)) {</div><div class='add'>+		rwf_t rwf = iocb_to_rw_flags(flags);</div><div class='add'>+</div><div class='add'>+		ret = vfs_iter_write(file, iter, &amp;iocb-&gt;ki_pos, rwf);</div><div class='add'>+		if (end_write)</div><div class='add'>+			end_write(iocb, ret);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = backing_aio_init_wq(iocb);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	aio = kmem_cache_zalloc(backing_aio_cachep, GFP_KERNEL);</div><div class='add'>+	if (!aio)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	aio-&gt;orig_iocb = iocb;</div><div class='add'>+	aio-&gt;end_write = end_write;</div><div class='add'>+	kiocb_clone(&amp;aio-&gt;iocb, iocb, get_file(file));</div><div class='add'>+	aio-&gt;iocb.ki_flags = flags;</div><div class='add'>+	aio-&gt;iocb.ki_complete = backing_aio_queue_completion;</div><div class='add'>+	refcount_set(&amp;aio-&gt;ref, 2);</div><div class='add'>+	ret = vfs_iocb_iter_write(file, &amp;aio-&gt;iocb, iter);</div><div class='add'>+	backing_aio_put(aio);</div><div class='add'>+	if (ret != -EIOCBQUEUED)</div><div class='add'>+		backing_aio_cleanup(aio, ret);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+ssize_t backing_file_write_iter(struct file *file, struct iov_iter *iter,</div><div class='add'>+				struct kiocb *iocb, int flags,</div><div class='add'>+				struct backing_file_ctx *ctx)</div><div class='add'>+{</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	if (WARN_ON_ONCE(!(file-&gt;f_mode &amp; FMODE_BACKING)))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	if (!iov_iter_count(iter))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	ret = file_remove_privs(iocb-&gt;ki_filp);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	if (iocb-&gt;ki_flags &amp; IOCB_DIRECT &amp;&amp;</div><div class='add'>+	    !(file-&gt;f_mode &amp; FMODE_CAN_ODIRECT))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	scoped_with_creds(ctx-&gt;cred)</div><div class='add'>+		return do_backing_file_write_iter(file, iter, iocb, flags, ctx-&gt;end_write);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(backing_file_write_iter);</div><div class='add'>+</div><div class='add'>+ssize_t backing_file_splice_read(struct file *in, struct kiocb *iocb,</div><div class='add'>+				 struct pipe_inode_info *pipe, size_t len,</div><div class='add'>+				 unsigned int flags,</div><div class='add'>+				 struct backing_file_ctx *ctx)</div><div class='add'>+{</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	if (WARN_ON_ONCE(!(in-&gt;f_mode &amp; FMODE_BACKING)))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	scoped_with_creds(ctx-&gt;cred)</div><div class='add'>+		ret = vfs_splice_read(in, &amp;iocb-&gt;ki_pos, pipe, len, flags);</div><div class='add'>+</div><div class='add'>+	if (ctx-&gt;accessed)</div><div class='add'>+		ctx-&gt;accessed(iocb-&gt;ki_filp);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(backing_file_splice_read);</div><div class='add'>+</div><div class='add'>+ssize_t backing_file_splice_write(struct pipe_inode_info *pipe,</div><div class='add'>+				  struct file *out, struct kiocb *iocb,</div><div class='add'>+				  size_t len, unsigned int flags,</div><div class='add'>+				  struct backing_file_ctx *ctx)</div><div class='add'>+{</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	if (WARN_ON_ONCE(!(out-&gt;f_mode &amp; FMODE_BACKING)))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	if (!out-&gt;f_op-&gt;splice_write)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	ret = file_remove_privs(iocb-&gt;ki_filp);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	scoped_with_creds(ctx-&gt;cred) {</div><div class='add'>+		file_start_write(out);</div><div class='add'>+		ret = out-&gt;f_op-&gt;splice_write(pipe, out, &amp;iocb-&gt;ki_pos, len, flags);</div><div class='add'>+		file_end_write(out);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (ctx-&gt;end_write)</div><div class='add'>+		ctx-&gt;end_write(iocb, ret);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(backing_file_splice_write);</div><div class='add'>+</div><div class='add'>+int backing_file_mmap(struct file *file, struct vm_area_struct *vma,</div><div class='add'>+		      struct backing_file_ctx *ctx)</div><div class='add'>+{</div><div class='add'>+	struct file *user_file = vma-&gt;vm_file;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (WARN_ON_ONCE(!(file-&gt;f_mode &amp; FMODE_BACKING)))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	if (!can_mmap_file(file))</div><div class='add'>+		return -ENODEV;</div><div class='add'>+</div><div class='add'>+	vma_set_file(vma, file);</div><div class='add'>+</div><div class='add'>+	scoped_with_creds(ctx-&gt;cred)</div><div class='add'>+		ret = vfs_mmap(vma-&gt;vm_file, vma);</div><div class='add'>+</div><div class='add'>+	if (ctx-&gt;accessed)</div><div class='add'>+		ctx-&gt;accessed(user_file);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(backing_file_mmap);</div><div class='add'>+</div><div class='add'>+static int __init backing_aio_init(void)</div><div class='add'>+{</div><div class='add'>+	backing_aio_cachep = KMEM_CACHE(backing_aio, SLAB_HWCACHE_ALIGN);</div><div class='add'>+	if (!backing_aio_cachep)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+fs_initcall(backing_aio_init);</div><div class='head'>diff --git a/fs/bad_inode.c b/fs/bad_inode.c<br/>index 12b8fdcc445b..0ef9bcb744dd 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/bad_inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/bad_inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/bad_inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/bad_inode.c</a></div><div class='hunk'>@@ -27,7 +27,7 @@ static const struct file_operations bad_file_ops =</div><div class='ctx'> 	.open		= bad_file_open,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int bad_inode_create(struct user_namespace *mnt_userns,</div><div class='add'>+static int bad_inode_create(struct mnt_idmap *idmap,</div><div class='ctx'> 			    struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 			    umode_t mode, bool excl)</div><div class='ctx'> {</div><div class='hunk'>@@ -51,17 +51,17 @@ static int bad_inode_unlink(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int bad_inode_symlink(struct user_namespace *mnt_userns,</div><div class='add'>+static int bad_inode_symlink(struct mnt_idmap *idmap,</div><div class='ctx'> 			     struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 			     const char *symname)</div><div class='ctx'> {</div><div class='ctx'> 	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int bad_inode_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-			   struct dentry *dentry, umode_t mode)</div><div class='add'>+static struct dentry *bad_inode_mkdir(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+				      struct dentry *dentry, umode_t mode)</div><div class='ctx'> {</div><div class='del'>-	return -EIO;</div><div class='add'>+	return ERR_PTR(-EIO);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int bad_inode_rmdir (struct inode *dir, struct dentry *dentry)</div><div class='hunk'>@@ -69,13 +69,13 @@ static int bad_inode_rmdir (struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int bad_inode_mknod(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int bad_inode_mknod(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 			   struct dentry *dentry, umode_t mode, dev_t rdev)</div><div class='ctx'> {</div><div class='ctx'> 	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int bad_inode_rename2(struct user_namespace *mnt_userns,</div><div class='add'>+static int bad_inode_rename2(struct mnt_idmap *idmap,</div><div class='ctx'> 			     struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> 			     struct inode *new_dir, struct dentry *new_dentry,</div><div class='ctx'> 			     unsigned int flags)</div><div class='hunk'>@@ -89,20 +89,20 @@ static int bad_inode_readlink(struct dentry *dentry, char __user *buffer,</div><div class='ctx'> 	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int bad_inode_permission(struct user_namespace *mnt_userns,</div><div class='add'>+static int bad_inode_permission(struct mnt_idmap *idmap,</div><div class='ctx'> 				struct inode *inode, int mask)</div><div class='ctx'> {</div><div class='ctx'> 	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int bad_inode_getattr(struct user_namespace *mnt_userns,</div><div class='add'>+static int bad_inode_getattr(struct mnt_idmap *idmap,</div><div class='ctx'> 			     const struct path *path, struct kstat *stat,</div><div class='ctx'> 			     u32 request_mask, unsigned int query_flags)</div><div class='ctx'> {</div><div class='ctx'> 	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int bad_inode_setattr(struct user_namespace *mnt_userns,</div><div class='add'>+static int bad_inode_setattr(struct mnt_idmap *idmap,</div><div class='ctx'> 			     struct dentry *direntry, struct iattr *attrs)</div><div class='ctx'> {</div><div class='ctx'> 	return -EIO;</div><div class='hunk'>@@ -133,8 +133,7 @@ static int bad_inode_fiemap(struct inode *inode,</div><div class='ctx'> 	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int bad_inode_update_time(struct inode *inode, struct timespec64 *time,</div><div class='del'>-				 int flags)</div><div class='add'>+static int bad_inode_update_time(struct inode *inode, int flags)</div><div class='ctx'> {</div><div class='ctx'> 	return -EIO;</div><div class='ctx'> }</div><div class='hunk'>@@ -146,15 +145,15 @@ static int bad_inode_atomic_open(struct inode *inode, struct dentry *dentry,</div><div class='ctx'> 	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int bad_inode_tmpfile(struct user_namespace *mnt_userns,</div><div class='del'>-			     struct inode *inode, struct dentry *dentry,</div><div class='add'>+static int bad_inode_tmpfile(struct mnt_idmap *idmap,</div><div class='add'>+			     struct inode *inode, struct file *file,</div><div class='ctx'> 			     umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int bad_inode_set_acl(struct user_namespace *mnt_userns,</div><div class='del'>-			     struct inode *inode, struct posix_acl *acl,</div><div class='add'>+static int bad_inode_set_acl(struct mnt_idmap *idmap,</div><div class='add'>+			     struct dentry *dentry, struct posix_acl *acl,</div><div class='ctx'> 			     int type)</div><div class='ctx'> {</div><div class='ctx'> 	return -EIO;</div><div class='hunk'>@@ -177,7 +176,7 @@ static const struct inode_operations bad_inode_ops =</div><div class='ctx'> 	.setattr	= bad_inode_setattr,</div><div class='ctx'> 	.listxattr	= bad_inode_listxattr,</div><div class='ctx'> 	.get_link	= bad_inode_get_link,</div><div class='del'>-	.get_acl	= bad_inode_get_acl,</div><div class='add'>+	.get_inode_acl	= bad_inode_get_acl,</div><div class='ctx'> 	.fiemap		= bad_inode_fiemap,</div><div class='ctx'> 	.update_time	= bad_inode_update_time,</div><div class='ctx'> 	.atomic_open	= bad_inode_atomic_open,</div><div class='hunk'>@@ -209,8 +208,7 @@ void make_bad_inode(struct inode *inode)</div><div class='ctx'> 	remove_inode_hash(inode);</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_mode = S_IFREG;</div><div class='del'>-	inode-&gt;i_atime = inode-&gt;i_mtime = inode-&gt;i_ctime =</div><div class='del'>-		current_time(inode);</div><div class='add'>+	simple_inode_init_ts(inode);</div><div class='ctx'> 	inode-&gt;i_op = &amp;bad_inode_ops;	</div><div class='ctx'> 	inode-&gt;i_opflags &amp;= ~IOP_XATTR;</div><div class='ctx'> 	inode-&gt;i_fop = &amp;bad_file_ops;	</div><div class='head'>diff --git a/fs/befs/Kconfig b/fs/befs/Kconfig<br/>index 9550b6462b81..5fcfc4024ffe 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/befs/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/befs/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/befs/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/befs/Kconfig</a></div><div class='hunk'>@@ -2,6 +2,7 @@</div><div class='ctx'> config BEFS_FS</div><div class='ctx'> 	tristate "BeOS file system (BeFS) support (read only)"</div><div class='ctx'> 	depends on BLOCK</div><div class='add'>+	select BUFFER_HEAD</div><div class='ctx'> 	select NLS</div><div class='ctx'> 	help</div><div class='ctx'> 	  The BeOS File System (BeFS) is the native file system of Be, Inc's</div><div class='head'>diff --git a/fs/befs/btree.c b/fs/befs/btree.c<br/>index 1b7e0f7128d6..53b36aa29978 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/befs/btree.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/befs/btree.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/befs/btree.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/befs/btree.c</a></div><div class='hunk'>@@ -500,7 +500,7 @@ befs_btree_read(struct super_block *sb, const befs_data_stream *ds,</div><div class='ctx'> 		goto error_alloc;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	strlcpy(keybuf, keystart, keylen + 1);</div><div class='add'>+	strscpy(keybuf, keystart, keylen + 1);</div><div class='ctx'> 	*value = fs64_to_cpu(sb, valarray[cur_key]);</div><div class='ctx'> 	*keysize = keylen;</div><div class='ctx'> </div><div class='head'>diff --git a/fs/befs/linuxvfs.c b/fs/befs/linuxvfs.c<br/>index c1ba13d19024..9fcfdd6b8189 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/befs/linuxvfs.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/befs/linuxvfs.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/befs/linuxvfs.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/befs/linuxvfs.c</a></div><div class='hunk'>@@ -11,12 +11,13 @@</div><div class='ctx'> #include &lt;linux/module.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/fs_context.h&gt;</div><div class='add'>+#include &lt;linux/fs_parser.h&gt;</div><div class='ctx'> #include &lt;linux/errno.h&gt;</div><div class='ctx'> #include &lt;linux/stat.h&gt;</div><div class='ctx'> #include &lt;linux/nls.h&gt;</div><div class='ctx'> #include &lt;linux/buffer_head.h&gt;</div><div class='ctx'> #include &lt;linux/vfs.h&gt;</div><div class='del'>-#include &lt;linux/parser.h&gt;</div><div class='ctx'> #include &lt;linux/namei.h&gt;</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='ctx'> #include &lt;linux/cred.h&gt;</div><div class='hunk'>@@ -40,7 +41,7 @@ MODULE_LICENSE("GPL");</div><div class='ctx'> </div><div class='ctx'> static int befs_readdir(struct file *, struct dir_context *);</div><div class='ctx'> static int befs_get_block(struct inode *, sector_t, struct buffer_head *, int);</div><div class='del'>-static int befs_readpage(struct file *file, struct page *page);</div><div class='add'>+static int befs_read_folio(struct file *file, struct folio *folio);</div><div class='ctx'> static sector_t befs_bmap(struct address_space *mapping, sector_t block);</div><div class='ctx'> static struct dentry *befs_lookup(struct inode *, struct dentry *,</div><div class='ctx'> 				  unsigned int);</div><div class='hunk'>@@ -48,28 +49,26 @@ static struct inode *befs_iget(struct super_block *, unsigned long);</div><div class='ctx'> static struct inode *befs_alloc_inode(struct super_block *sb);</div><div class='ctx'> static void befs_free_inode(struct inode *inode);</div><div class='ctx'> static void befs_destroy_inodecache(void);</div><div class='del'>-static int befs_symlink_readpage(struct file *, struct page *);</div><div class='add'>+static int befs_symlink_read_folio(struct file *, struct folio *);</div><div class='ctx'> static int befs_utf2nls(struct super_block *sb, const char *in, int in_len,</div><div class='ctx'> 			char **out, int *out_len);</div><div class='ctx'> static int befs_nls2utf(struct super_block *sb, const char *in, int in_len,</div><div class='ctx'> 			char **out, int *out_len);</div><div class='ctx'> static void befs_put_super(struct super_block *);</div><div class='del'>-static int befs_remount(struct super_block *, int *, char *);</div><div class='ctx'> static int befs_statfs(struct dentry *, struct kstatfs *);</div><div class='ctx'> static int befs_show_options(struct seq_file *, struct dentry *);</div><div class='del'>-static int parse_options(char *, struct befs_mount_options *);</div><div class='ctx'> static struct dentry *befs_fh_to_dentry(struct super_block *sb,</div><div class='ctx'> 				struct fid *fid, int fh_len, int fh_type);</div><div class='ctx'> static struct dentry *befs_fh_to_parent(struct super_block *sb,</div><div class='ctx'> 				struct fid *fid, int fh_len, int fh_type);</div><div class='ctx'> static struct dentry *befs_get_parent(struct dentry *child);</div><div class='add'>+static void befs_free_fc(struct fs_context *fc);</div><div class='ctx'> </div><div class='ctx'> static const struct super_operations befs_sops = {</div><div class='ctx'> 	.alloc_inode	= befs_alloc_inode,	/* allocate a new inode */</div><div class='ctx'> 	.free_inode	= befs_free_inode, /* deallocate an inode */</div><div class='ctx'> 	.put_super	= befs_put_super,	/* uninit super */</div><div class='ctx'> 	.statfs		= befs_statfs,	/* statfs */</div><div class='del'>-	.remount_fs	= befs_remount,</div><div class='ctx'> 	.show_options	= befs_show_options,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -87,31 +86,31 @@ static const struct inode_operations befs_dir_inode_operations = {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct address_space_operations befs_aops = {</div><div class='del'>-	.readpage	= befs_readpage,</div><div class='add'>+	.read_folio	= befs_read_folio,</div><div class='ctx'> 	.bmap		= befs_bmap,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct address_space_operations befs_symlink_aops = {</div><div class='del'>-	.readpage	= befs_symlink_readpage,</div><div class='add'>+	.read_folio	= befs_symlink_read_folio,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct export_operations befs_export_operations = {</div><div class='add'>+	.encode_fh	= generic_encode_ino32_fh,</div><div class='ctx'> 	.fh_to_dentry	= befs_fh_to_dentry,</div><div class='ctx'> 	.fh_to_parent	= befs_fh_to_parent,</div><div class='ctx'> 	.get_parent	= befs_get_parent,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Called by generic_file_read() to read a page of data</div><div class='add'>+ * Called by generic_file_read() to read a folio of data</div><div class='ctx'>  *</div><div class='ctx'>  * In turn, simply calls a generic block read function and</div><div class='ctx'>  * passes it the address of befs_get_block, for mapping file</div><div class='ctx'>  * positions to disk blocks.</div><div class='ctx'>  */</div><div class='del'>-static int</div><div class='del'>-befs_readpage(struct file *file, struct page *page)</div><div class='add'>+static int befs_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	return block_read_full_page(page, befs_get_block);</div><div class='add'>+	return block_read_full_folio(folio, befs_get_block);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static sector_t</div><div class='hunk'>@@ -277,7 +276,7 @@ befs_alloc_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct befs_inode_info *bi;</div><div class='ctx'> </div><div class='del'>-	bi = kmem_cache_alloc(befs_inode_cachep, GFP_KERNEL);</div><div class='add'>+	bi = alloc_inode_sb(sb, befs_inode_cachep, GFP_KERNEL);</div><div class='ctx'> 	if (!bi)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	return &amp;bi-&gt;vfs_inode;</div><div class='hunk'>@@ -308,7 +307,7 @@ static struct inode *befs_iget(struct super_block *sb, unsigned long ino)</div><div class='ctx'> 	inode = iget_locked(sb, ino);</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='del'>-	if (!(inode-&gt;i_state &amp; I_NEW))</div><div class='add'>+	if (!(inode_state_read_once(inode) &amp; I_NEW))</div><div class='ctx'> 		return inode;</div><div class='ctx'> </div><div class='ctx'> 	befs_ino = BEFS_I(inode);</div><div class='hunk'>@@ -361,11 +360,11 @@ static struct inode *befs_iget(struct super_block *sb, unsigned long ino)</div><div class='ctx'> 	 * for indexing purposes. (PFD, page 54)</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_mtime.tv_sec =</div><div class='del'>-	    fs64_to_cpu(sb, raw_inode-&gt;last_modified_time) &gt;&gt; 16;</div><div class='del'>-	inode-&gt;i_mtime.tv_nsec = 0;   /* lower 16 bits are not a time */</div><div class='del'>-	inode-&gt;i_ctime = inode-&gt;i_mtime;</div><div class='del'>-	inode-&gt;i_atime = inode-&gt;i_mtime;</div><div class='add'>+	inode_set_mtime(inode,</div><div class='add'>+			fs64_to_cpu(sb, raw_inode-&gt;last_modified_time) &gt;&gt; 16,</div><div class='add'>+			0);/* lower 16 bits are not a time */</div><div class='add'>+	inode_set_ctime_to_ts(inode, inode_get_mtime(inode));</div><div class='add'>+	inode_set_atime_to_ts(inode, inode_get_mtime(inode));</div><div class='ctx'> </div><div class='ctx'> 	befs_ino-&gt;i_inode_num = fsrun_to_cpu(sb, raw_inode-&gt;inode_num);</div><div class='ctx'> 	befs_ino-&gt;i_parent = fsrun_to_cpu(sb, raw_inode-&gt;parent);</div><div class='hunk'>@@ -375,7 +374,7 @@ static struct inode *befs_iget(struct super_block *sb, unsigned long ino)</div><div class='ctx'> 	if (S_ISLNK(inode-&gt;i_mode) &amp;&amp; !(befs_ino-&gt;i_flags &amp; BEFS_LONG_SYMLINK)){</div><div class='ctx'> 		inode-&gt;i_size = 0;</div><div class='ctx'> 		inode-&gt;i_blocks = befs_sb-&gt;block_size / VFS_BLOCK_SIZE;</div><div class='del'>-		strlcpy(befs_ino-&gt;i_data.symlink, raw_inode-&gt;data.symlink,</div><div class='add'>+		strscpy(befs_ino-&gt;i_data.symlink, raw_inode-&gt;data.symlink,</div><div class='ctx'> 			BEFS_SYMLINK_LEN);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		int num_blks;</div><div class='hunk'>@@ -435,8 +434,7 @@ befs_init_inodecache(void)</div><div class='ctx'> {</div><div class='ctx'> 	befs_inode_cachep = kmem_cache_create_usercopy("befs_inode_cache",</div><div class='ctx'> 				sizeof(struct befs_inode_info), 0,</div><div class='del'>-				(SLAB_RECLAIM_ACCOUNT|SLAB_MEM_SPREAD|</div><div class='del'>-					SLAB_ACCOUNT),</div><div class='add'>+				SLAB_RECLAIM_ACCOUNT | SLAB_ACCOUNT,</div><div class='ctx'> 				offsetof(struct befs_inode_info,</div><div class='ctx'> 					i_data.symlink),</div><div class='ctx'> 				sizeof_field(struct befs_inode_info,</div><div class='hunk'>@@ -468,14 +466,15 @@ befs_destroy_inodecache(void)</div><div class='ctx'>  * The data stream become link name. Unless the LONG_SYMLINK</div><div class='ctx'>  * flag is set.</div><div class='ctx'>  */</div><div class='del'>-static int befs_symlink_readpage(struct file *unused, struct page *page)</div><div class='add'>+static int befs_symlink_read_folio(struct file *unused, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	struct befs_inode_info *befs_ino = BEFS_I(inode);</div><div class='ctx'> 	befs_data_stream *data = &amp;befs_ino-&gt;i_data.ds;</div><div class='ctx'> 	befs_off_t len = data-&gt;size;</div><div class='del'>-	char *link = page_address(page);</div><div class='add'>+	char *link = folio_address(folio);</div><div class='add'>+	int err = -EIO;</div><div class='ctx'> </div><div class='ctx'> 	if (len == 0 || len &gt; PAGE_SIZE) {</div><div class='ctx'> 		befs_error(sb, "Long symlink with illegal length");</div><div class='hunk'>@@ -488,13 +487,10 @@ static int befs_symlink_readpage(struct file *unused, struct page *page)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='ctx'> 	link[len - 1] = '\0';</div><div class='del'>-	SetPageUptodate(page);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	return 0;</div><div class='add'>+	err = 0;</div><div class='ctx'> fail:</div><div class='del'>-	SetPageError(page);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	return -EIO;</div><div class='add'>+	folio_end_read(folio, err == 0);</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -671,99 +667,57 @@ static struct dentry *befs_get_parent(struct dentry *child)</div><div class='ctx'> </div><div class='ctx'> 	parent = befs_iget(child-&gt;d_sb,</div><div class='ctx'> 			   (unsigned long)befs_ino-&gt;i_parent.start);</div><div class='del'>-	if (IS_ERR(parent))</div><div class='del'>-		return ERR_CAST(parent);</div><div class='del'>-</div><div class='ctx'> 	return d_obtain_alias(parent);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> enum {</div><div class='del'>-	Opt_uid, Opt_gid, Opt_charset, Opt_debug, Opt_err,</div><div class='add'>+	Opt_uid, Opt_gid, Opt_charset, Opt_debug,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static const match_table_t befs_tokens = {</div><div class='del'>-	{Opt_uid, "uid=%d"},</div><div class='del'>-	{Opt_gid, "gid=%d"},</div><div class='del'>-	{Opt_charset, "iocharset=%s"},</div><div class='del'>-	{Opt_debug, "debug"},</div><div class='del'>-	{Opt_err, NULL}</div><div class='add'>+static const struct fs_parameter_spec befs_param_spec[] = {</div><div class='add'>+	fsparam_uid	("uid",		Opt_uid),</div><div class='add'>+	fsparam_gid	("gid",		Opt_gid),</div><div class='add'>+	fsparam_string	("iocharset",	Opt_charset),</div><div class='add'>+	fsparam_flag	("debug",	Opt_debug),</div><div class='add'>+	{}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-parse_options(char *options, struct befs_mount_options *opts)</div><div class='add'>+befs_parse_param(struct fs_context *fc, struct fs_parameter *param)</div><div class='ctx'> {</div><div class='del'>-	char *p;</div><div class='del'>-	substring_t args[MAX_OPT_ARGS];</div><div class='del'>-	int option;</div><div class='del'>-	kuid_t uid;</div><div class='del'>-	kgid_t gid;</div><div class='del'>-</div><div class='del'>-	/* Initialize options */</div><div class='del'>-	opts-&gt;uid = GLOBAL_ROOT_UID;</div><div class='del'>-	opts-&gt;gid = GLOBAL_ROOT_GID;</div><div class='del'>-	opts-&gt;use_uid = 0;</div><div class='del'>-	opts-&gt;use_gid = 0;</div><div class='del'>-	opts-&gt;iocharset = NULL;</div><div class='del'>-	opts-&gt;debug = 0;</div><div class='del'>-</div><div class='del'>-	if (!options)</div><div class='del'>-		return 1;</div><div class='del'>-</div><div class='del'>-	while ((p = strsep(&amp;options, ",")) != NULL) {</div><div class='del'>-		int token;</div><div class='del'>-</div><div class='del'>-		if (!*p)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		token = match_token(p, befs_tokens, args);</div><div class='del'>-		switch (token) {</div><div class='del'>-		case Opt_uid:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;option))</div><div class='del'>-				return 0;</div><div class='del'>-			uid = INVALID_UID;</div><div class='del'>-			if (option &gt;= 0)</div><div class='del'>-				uid = make_kuid(current_user_ns(), option);</div><div class='del'>-			if (!uid_valid(uid)) {</div><div class='del'>-				pr_err("Invalid uid %d, "</div><div class='del'>-				       "using default\n", option);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			opts-&gt;uid = uid;</div><div class='del'>-			opts-&gt;use_uid = 1;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_gid:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;option))</div><div class='del'>-				return 0;</div><div class='del'>-			gid = INVALID_GID;</div><div class='del'>-			if (option &gt;= 0)</div><div class='del'>-				gid = make_kgid(current_user_ns(), option);</div><div class='del'>-			if (!gid_valid(gid)) {</div><div class='del'>-				pr_err("Invalid gid %d, "</div><div class='del'>-				       "using default\n", option);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			opts-&gt;gid = gid;</div><div class='del'>-			opts-&gt;use_gid = 1;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_charset:</div><div class='del'>-			kfree(opts-&gt;iocharset);</div><div class='del'>-			opts-&gt;iocharset = match_strdup(&amp;args[0]);</div><div class='del'>-			if (!opts-&gt;iocharset) {</div><div class='del'>-				pr_err("allocation failure for "</div><div class='del'>-				       "iocharset string\n");</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		case Opt_debug:</div><div class='del'>-			opts-&gt;debug = 1;</div><div class='del'>-			break;</div><div class='del'>-		default:</div><div class='del'>-			pr_err("Unrecognized mount option \"%s\" "</div><div class='del'>-			       "or missing value\n", p);</div><div class='del'>-			return 0;</div><div class='del'>-		}</div><div class='add'>+	struct befs_mount_options *opts = fc-&gt;fs_private;</div><div class='add'>+	int token;</div><div class='add'>+	struct fs_parse_result result;</div><div class='add'>+</div><div class='add'>+	/* befs ignores all options on remount */</div><div class='add'>+	if (fc-&gt;purpose == FS_CONTEXT_FOR_RECONFIGURE)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	token = fs_parse(fc, befs_param_spec, param, &amp;result);</div><div class='add'>+	if (token &lt; 0)</div><div class='add'>+		return token;</div><div class='add'>+</div><div class='add'>+	switch (token) {</div><div class='add'>+	case Opt_uid:</div><div class='add'>+		opts-&gt;uid = result.uid;</div><div class='add'>+		opts-&gt;use_uid = 1;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_gid:</div><div class='add'>+		opts-&gt;gid = result.gid;</div><div class='add'>+		opts-&gt;use_gid = 1;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_charset:</div><div class='add'>+		kfree(opts-&gt;iocharset);</div><div class='add'>+		opts-&gt;iocharset = param-&gt;string;</div><div class='add'>+		param-&gt;string = NULL;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_debug:</div><div class='add'>+		opts-&gt;debug = 1;</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-	return 1;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int befs_show_options(struct seq_file *m, struct dentry *root)</div><div class='hunk'>@@ -799,6 +753,21 @@ befs_put_super(struct super_block *sb)</div><div class='ctx'> 	sb-&gt;s_fs_info = NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Copy the parsed options into the sbi mount_options member</div><div class='add'>+ */</div><div class='add'>+static void</div><div class='add'>+befs_set_options(struct befs_sb_info *sbi, struct befs_mount_options *opts)</div><div class='add'>+{</div><div class='add'>+	sbi-&gt;mount_opts.uid = opts-&gt;uid;</div><div class='add'>+	sbi-&gt;mount_opts.gid = opts-&gt;gid;</div><div class='add'>+	sbi-&gt;mount_opts.use_uid = opts-&gt;use_uid;</div><div class='add'>+	sbi-&gt;mount_opts.use_gid = opts-&gt;use_gid;</div><div class='add'>+	sbi-&gt;mount_opts.debug = opts-&gt;debug;</div><div class='add'>+	sbi-&gt;mount_opts.iocharset = opts-&gt;iocharset;</div><div class='add'>+	opts-&gt;iocharset = NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /* Allocate private field of the superblock, fill it.</div><div class='ctx'>  *</div><div class='ctx'>  * Finish filling the public superblock fields</div><div class='hunk'>@@ -806,7 +775,7 @@ befs_put_super(struct super_block *sb)</div><div class='ctx'>  * Load a set of NLS translations if needed.</div><div class='ctx'>  */</div><div class='ctx'> static int</div><div class='del'>-befs_fill_super(struct super_block *sb, void *data, int silent)</div><div class='add'>+befs_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> 	struct befs_sb_info *befs_sb;</div><div class='hunk'>@@ -816,6 +785,8 @@ befs_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 	const unsigned long sb_block = 0;</div><div class='ctx'> 	const off_t x86_sb_off = 512;</div><div class='ctx'> 	int blocksize;</div><div class='add'>+	struct befs_mount_options *parsed_opts = fc-&gt;fs_private;</div><div class='add'>+	int silent = fc-&gt;sb_flags &amp; SB_SILENT;</div><div class='ctx'> </div><div class='ctx'> 	sb-&gt;s_fs_info = kzalloc(sizeof(*befs_sb), GFP_KERNEL);</div><div class='ctx'> 	if (sb-&gt;s_fs_info == NULL)</div><div class='hunk'>@@ -823,11 +794,7 @@ befs_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> </div><div class='ctx'> 	befs_sb = BEFS_SB(sb);</div><div class='ctx'> </div><div class='del'>-	if (!parse_options((char *) data, &amp;befs_sb-&gt;mount_opts)) {</div><div class='del'>-		if (!silent)</div><div class='del'>-			befs_error(sb, "cannot parse mount options");</div><div class='del'>-		goto unacquire_priv_sbp;</div><div class='del'>-	}</div><div class='add'>+	befs_set_options(befs_sb, parsed_opts);</div><div class='ctx'> </div><div class='ctx'> 	befs_debug(sb, "---&gt; %s", __func__);</div><div class='ctx'> </div><div class='hunk'>@@ -940,10 +907,10 @@ unacquire_none:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-befs_remount(struct super_block *sb, int *flags, char *data)</div><div class='add'>+befs_reconfigure(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	sync_filesystem(sb);</div><div class='del'>-	if (!(*flags &amp; SB_RDONLY))</div><div class='add'>+	sync_filesystem(fc-&gt;root-&gt;d_sb);</div><div class='add'>+	if (!(fc-&gt;sb_flags &amp; SB_RDONLY))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -971,19 +938,51 @@ befs_statfs(struct dentry *dentry, struct kstatfs *buf)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct dentry *</div><div class='del'>-befs_mount(struct file_system_type *fs_type, int flags, const char *dev_name,</div><div class='del'>-	    void *data)</div><div class='add'>+static int befs_get_tree(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	return get_tree_bdev(fc, befs_fill_super);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct fs_context_operations befs_context_ops = {</div><div class='add'>+	.parse_param	= befs_parse_param,</div><div class='add'>+	.get_tree	= befs_get_tree,</div><div class='add'>+	.reconfigure	= befs_reconfigure,</div><div class='add'>+	.free		= befs_free_fc,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int befs_init_fs_context(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	return mount_bdev(fs_type, flags, dev_name, data, befs_fill_super);</div><div class='add'>+	struct befs_mount_options *opts;</div><div class='add'>+</div><div class='add'>+	opts = kzalloc(sizeof(*opts), GFP_KERNEL);</div><div class='add'>+	if (!opts)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	/* Initialize options */</div><div class='add'>+	opts-&gt;uid = GLOBAL_ROOT_UID;</div><div class='add'>+	opts-&gt;gid = GLOBAL_ROOT_GID;</div><div class='add'>+</div><div class='add'>+	fc-&gt;fs_private = opts;</div><div class='add'>+	fc-&gt;ops = &amp;befs_context_ops;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void befs_free_fc(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct befs_mount_options *opts = fc-&gt;fs_private;</div><div class='add'>+</div><div class='add'>+	kfree(opts-&gt;iocharset);</div><div class='add'>+	kfree(fc-&gt;fs_private);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct file_system_type befs_fs_type = {</div><div class='ctx'> 	.owner		= THIS_MODULE,</div><div class='ctx'> 	.name		= "befs",</div><div class='del'>-	.mount		= befs_mount,</div><div class='ctx'> 	.kill_sb	= kill_block_super,</div><div class='ctx'> 	.fs_flags	= FS_REQUIRES_DEV,</div><div class='add'>+	.init_fs_context = befs_init_fs_context,</div><div class='add'>+	.parameters	= befs_param_spec,</div><div class='ctx'> };</div><div class='ctx'> MODULE_ALIAS_FS("befs");</div><div class='ctx'> </div><div class='head'>diff --git a/fs/bfs/Kconfig b/fs/bfs/Kconfig<br/>index 3a757805b585..8e7ef866b62a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/bfs/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/bfs/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/bfs/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/bfs/Kconfig</a></div><div class='hunk'>@@ -2,6 +2,7 @@</div><div class='ctx'> config BFS_FS</div><div class='ctx'> 	tristate "BFS file system support"</div><div class='ctx'> 	depends on BLOCK</div><div class='add'>+	select BUFFER_HEAD</div><div class='ctx'> 	help</div><div class='ctx'> 	  Boot File System (BFS) is a file system used under SCO UnixWare to</div><div class='ctx'> 	  allow the bootloader access to the kernel image and other important</div><div class='head'>diff --git a/fs/bfs/dir.c b/fs/bfs/dir.c<br/>index 34d4f68f786b..c375e22c4c0c 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/bfs/dir.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/bfs/dir.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/bfs/dir.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/bfs/dir.c</a></div><div class='hunk'>@@ -75,7 +75,7 @@ const struct file_operations bfs_dir_operations = {</div><div class='ctx'> 	.llseek		= generic_file_llseek,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int bfs_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int bfs_create(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		      struct dentry *dentry, umode_t mode, bool excl)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='hunk'>@@ -96,8 +96,8 @@ static int bfs_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	}</div><div class='ctx'> 	set_bit(ino, info-&gt;si_imap);</div><div class='ctx'> 	info-&gt;si_freei--;</div><div class='del'>-	inode_init_owner(&amp;init_user_ns, inode, dir, mode);</div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_atime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_init_owner(&amp;nop_mnt_idmap, inode, dir, mode);</div><div class='add'>+	simple_inode_init_ts(inode);</div><div class='ctx'> 	inode-&gt;i_blocks = 0;</div><div class='ctx'> 	inode-&gt;i_op = &amp;bfs_file_inops;</div><div class='ctx'> 	inode-&gt;i_fop = &amp;bfs_file_operations;</div><div class='hunk'>@@ -158,7 +158,7 @@ static int bfs_link(struct dentry *old, struct inode *dir,</div><div class='ctx'> 		return err;</div><div class='ctx'> 	}</div><div class='ctx'> 	inc_nlink(inode);</div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='ctx'> 	ihold(inode);</div><div class='ctx'> 	d_instantiate(new, inode);</div><div class='hunk'>@@ -187,9 +187,9 @@ static int bfs_unlink(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	}</div><div class='ctx'> 	de-&gt;ino = 0;</div><div class='ctx'> 	mark_buffer_dirty_inode(bh, dir);</div><div class='del'>-	dir-&gt;i_ctime = dir-&gt;i_mtime = current_time(dir);</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='ctx'> 	mark_inode_dirty(dir);</div><div class='del'>-	inode-&gt;i_ctime = dir-&gt;i_ctime;</div><div class='add'>+	inode_set_ctime_to_ts(inode, inode_get_ctime(dir));</div><div class='ctx'> 	inode_dec_link_count(inode);</div><div class='ctx'> 	error = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -199,7 +199,7 @@ out_brelse:</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int bfs_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='add'>+static int bfs_rename(struct mnt_idmap *idmap, struct inode *old_dir,</div><div class='ctx'> 		      struct dentry *old_dentry, struct inode *new_dir,</div><div class='ctx'> 		      struct dentry *new_dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='hunk'>@@ -240,10 +240,10 @@ static int bfs_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> 			goto end_rename;</div><div class='ctx'> 	}</div><div class='ctx'> 	old_de-&gt;ino = 0;</div><div class='del'>-	old_dir-&gt;i_ctime = old_dir-&gt;i_mtime = current_time(old_dir);</div><div class='add'>+	inode_set_mtime_to_ts(old_dir, inode_set_ctime_current(old_dir));</div><div class='ctx'> 	mark_inode_dirty(old_dir);</div><div class='ctx'> 	if (new_inode) {</div><div class='del'>-		new_inode-&gt;i_ctime = current_time(new_inode);</div><div class='add'>+		inode_set_ctime_current(new_inode);</div><div class='ctx'> 		inode_dec_link_count(new_inode);</div><div class='ctx'> 	}</div><div class='ctx'> 	mark_buffer_dirty_inode(old_bh, old_dir);</div><div class='hunk'>@@ -275,11 +275,6 @@ static int bfs_add_entry(struct inode *dir, const struct qstr *child, int ino)</div><div class='ctx'> </div><div class='ctx'> 	dprintf("name=%s, namelen=%d\n", name, namelen);</div><div class='ctx'> </div><div class='del'>-	if (!namelen)</div><div class='del'>-		return -ENOENT;</div><div class='del'>-	if (namelen &gt; BFS_NAMELEN)</div><div class='del'>-		return -ENAMETOOLONG;</div><div class='del'>-</div><div class='ctx'> 	sblock = BFS_I(dir)-&gt;i_sblock;</div><div class='ctx'> 	eblock = BFS_I(dir)-&gt;i_eblock;</div><div class='ctx'> 	for (block = sblock; block &lt;= eblock; block++) {</div><div class='hunk'>@@ -292,9 +287,10 @@ static int bfs_add_entry(struct inode *dir, const struct qstr *child, int ino)</div><div class='ctx'> 				pos = (block - sblock) * BFS_BSIZE + off;</div><div class='ctx'> 				if (pos &gt;= dir-&gt;i_size) {</div><div class='ctx'> 					dir-&gt;i_size += BFS_DIRENT_SIZE;</div><div class='del'>-					dir-&gt;i_ctime = current_time(dir);</div><div class='add'>+					inode_set_ctime_current(dir);</div><div class='ctx'> 				}</div><div class='del'>-				dir-&gt;i_mtime = current_time(dir);</div><div class='add'>+				inode_set_mtime_to_ts(dir,</div><div class='add'>+						      inode_set_ctime_current(dir));</div><div class='ctx'> 				mark_inode_dirty(dir);</div><div class='ctx'> 				de-&gt;ino = cpu_to_le16((u16)ino);</div><div class='ctx'> 				for (i = 0; i &lt; BFS_NAMELEN; i++)</div><div class='head'>diff --git a/fs/bfs/file.c b/fs/bfs/file.c<br/>index 7f8544abf636..d33d6bde992b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/bfs/file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/bfs/file.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/bfs/file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/bfs/file.c</a></div><div class='hunk'>@@ -11,6 +11,7 @@</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/mpage.h&gt;</div><div class='ctx'> #include &lt;linux/buffer_head.h&gt;</div><div class='ctx'> #include "bfs.h"</div><div class='ctx'> </div><div class='hunk'>@@ -26,8 +27,8 @@ const struct file_operations bfs_file_operations = {</div><div class='ctx'> 	.llseek 	= generic_file_llseek,</div><div class='ctx'> 	.read_iter	= generic_file_read_iter,</div><div class='ctx'> 	.write_iter	= generic_file_write_iter,</div><div class='del'>-	.mmap		= generic_file_mmap,</div><div class='del'>-	.splice_read	= generic_file_splice_read,</div><div class='add'>+	.mmap_prepare	= generic_file_mmap_prepare,</div><div class='add'>+	.splice_read	= filemap_splice_read,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static int bfs_move_block(unsigned long from, unsigned long to,</div><div class='hunk'>@@ -150,14 +151,15 @@ out:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int bfs_writepage(struct page *page, struct writeback_control *wbc)</div><div class='add'>+static int bfs_writepages(struct address_space *mapping,</div><div class='add'>+		struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='del'>-	return block_write_full_page(page, bfs_get_block, wbc);</div><div class='add'>+	return mpage_writepages(mapping, wbc, bfs_get_block);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int bfs_readpage(struct file *file, struct page *page)</div><div class='add'>+static int bfs_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	return block_read_full_page(page, bfs_get_block);</div><div class='add'>+	return block_read_full_folio(folio, bfs_get_block);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void bfs_write_failed(struct address_space *mapping, loff_t to)</div><div class='hunk'>@@ -168,14 +170,14 @@ static void bfs_write_failed(struct address_space *mapping, loff_t to)</div><div class='ctx'> 		truncate_pagecache(inode, inode-&gt;i_size);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int bfs_write_begin(struct file *file, struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned flags,</div><div class='del'>-			struct page **pagep, void **fsdata)</div><div class='add'>+static int bfs_write_begin(const struct kiocb *iocb,</div><div class='add'>+			   struct address_space *mapping,</div><div class='add'>+			   loff_t pos, unsigned len,</div><div class='add'>+			   struct folio **foliop, void **fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = block_write_begin(mapping, pos, len, flags, pagep,</div><div class='del'>-				bfs_get_block);</div><div class='add'>+	ret = block_write_begin(mapping, pos, len, foliop, bfs_get_block);</div><div class='ctx'> 	if (unlikely(ret))</div><div class='ctx'> 		bfs_write_failed(mapping, pos + len);</div><div class='ctx'> </div><div class='hunk'>@@ -188,11 +190,13 @@ static sector_t bfs_bmap(struct address_space *mapping, sector_t block)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations bfs_aops = {</div><div class='del'>-	.set_page_dirty	= __set_page_dirty_buffers,</div><div class='del'>-	.readpage	= bfs_readpage,</div><div class='del'>-	.writepage	= bfs_writepage,</div><div class='add'>+	.dirty_folio	= block_dirty_folio,</div><div class='add'>+	.invalidate_folio = block_invalidate_folio,</div><div class='add'>+	.read_folio	= bfs_read_folio,</div><div class='add'>+	.writepages	= bfs_writepages,</div><div class='ctx'> 	.write_begin	= bfs_write_begin,</div><div class='ctx'> 	.write_end	= generic_write_end,</div><div class='add'>+	.migrate_folio	= buffer_migrate_folio,</div><div class='ctx'> 	.bmap		= bfs_bmap,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='head'>diff --git a/fs/bfs/inode.c b/fs/bfs/inode.c<br/>index fd691e4815c5..ce6f83234b67 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/bfs/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/bfs/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/bfs/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/bfs/inode.c</a></div><div class='hunk'>@@ -17,6 +17,7 @@</div><div class='ctx'> #include &lt;linux/writeback.h&gt;</div><div class='ctx'> #include &lt;linux/uio.h&gt;</div><div class='ctx'> #include &lt;linux/uaccess.h&gt;</div><div class='add'>+#include &lt;linux/fs_context.h&gt;</div><div class='ctx'> #include "bfs.h"</div><div class='ctx'> </div><div class='ctx'> MODULE_AUTHOR("Tigran Aivazian &lt;aivazian.tigran@gmail.com&gt;");</div><div class='hunk'>@@ -41,7 +42,7 @@ struct inode *bfs_iget(struct super_block *sb, unsigned long ino)</div><div class='ctx'> 	inode = iget_locked(sb, ino);</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='del'>-	if (!(inode-&gt;i_state &amp; I_NEW))</div><div class='add'>+	if (!(inode_state_read_once(inode) &amp; I_NEW))</div><div class='ctx'> 		return inode;</div><div class='ctx'> </div><div class='ctx'> 	if ((ino &lt; BFS_ROOT_INO) || (ino &gt; BFS_SB(inode-&gt;i_sb)-&gt;si_lasti)) {</div><div class='hunk'>@@ -60,7 +61,19 @@ struct inode *bfs_iget(struct super_block *sb, unsigned long ino)</div><div class='ctx'> 	off = (ino - BFS_ROOT_INO) % BFS_INODES_PER_BLOCK;</div><div class='ctx'> 	di = (struct bfs_inode *)bh-&gt;b_data + off;</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_mode = 0x0000FFFF &amp; le32_to_cpu(di-&gt;i_mode);</div><div class='add'>+	/*</div><div class='add'>+	 * https://martin.hinner.info/fs/bfs/bfs-structure.html explains that</div><div class='add'>+	 * BFS in SCO UnixWare environment used only lower 9 bits of di-&gt;i_mode</div><div class='add'>+	 * value. This means that, although bfs_write_inode() saves whole</div><div class='add'>+	 * inode-&gt;i_mode bits (which include S_IFMT bits and S_IS{UID,GID,VTX}</div><div class='add'>+	 * bits), middle 7 bits of di-&gt;i_mode value can be garbage when these</div><div class='add'>+	 * bits were not saved by bfs_write_inode().</div><div class='add'>+	 * Since we can't tell whether middle 7 bits are garbage, use only</div><div class='add'>+	 * lower 12 bits (i.e. tolerate S_IS{UID,GID,VTX} bits possibly being</div><div class='add'>+	 * garbage) and reconstruct S_IFMT bits for Linux environment from</div><div class='add'>+	 * di-&gt;i_vtype value.</div><div class='add'>+	 */</div><div class='add'>+	inode-&gt;i_mode = 0x00000FFF &amp; le32_to_cpu(di-&gt;i_mode);</div><div class='ctx'> 	if (le32_to_cpu(di-&gt;i_vtype) == BFS_VDIR) {</div><div class='ctx'> 		inode-&gt;i_mode |= S_IFDIR;</div><div class='ctx'> 		inode-&gt;i_op = &amp;bfs_dir_inops;</div><div class='hunk'>@@ -70,6 +83,11 @@ struct inode *bfs_iget(struct super_block *sb, unsigned long ino)</div><div class='ctx'> 		inode-&gt;i_op = &amp;bfs_file_inops;</div><div class='ctx'> 		inode-&gt;i_fop = &amp;bfs_file_operations;</div><div class='ctx'> 		inode-&gt;i_mapping-&gt;a_ops = &amp;bfs_aops;</div><div class='add'>+	} else {</div><div class='add'>+		brelse(bh);</div><div class='add'>+		printf("Unknown vtype=%u %s:%08lx\n",</div><div class='add'>+		       le32_to_cpu(di-&gt;i_vtype), inode-&gt;i_sb-&gt;s_id, ino);</div><div class='add'>+		goto error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	BFS_I(inode)-&gt;i_sblock =  le32_to_cpu(di-&gt;i_sblock);</div><div class='hunk'>@@ -80,12 +98,9 @@ struct inode *bfs_iget(struct super_block *sb, unsigned long ino)</div><div class='ctx'> 	set_nlink(inode, le32_to_cpu(di-&gt;i_nlink));</div><div class='ctx'> 	inode-&gt;i_size = BFS_FILESIZE(di);</div><div class='ctx'> 	inode-&gt;i_blocks = BFS_FILEBLOCKS(di);</div><div class='del'>-	inode-&gt;i_atime.tv_sec =  le32_to_cpu(di-&gt;i_atime);</div><div class='del'>-	inode-&gt;i_mtime.tv_sec =  le32_to_cpu(di-&gt;i_mtime);</div><div class='del'>-	inode-&gt;i_ctime.tv_sec =  le32_to_cpu(di-&gt;i_ctime);</div><div class='del'>-	inode-&gt;i_atime.tv_nsec = 0;</div><div class='del'>-	inode-&gt;i_mtime.tv_nsec = 0;</div><div class='del'>-	inode-&gt;i_ctime.tv_nsec = 0;</div><div class='add'>+	inode_set_atime(inode, le32_to_cpu(di-&gt;i_atime), 0);</div><div class='add'>+	inode_set_mtime(inode, le32_to_cpu(di-&gt;i_mtime), 0);</div><div class='add'>+	inode_set_ctime(inode, le32_to_cpu(di-&gt;i_ctime), 0);</div><div class='ctx'> </div><div class='ctx'> 	brelse(bh);</div><div class='ctx'> 	unlock_new_inode(inode);</div><div class='hunk'>@@ -141,9 +156,9 @@ static int bfs_write_inode(struct inode *inode, struct writeback_control *wbc)</div><div class='ctx'> 	di-&gt;i_uid = cpu_to_le32(i_uid_read(inode));</div><div class='ctx'> 	di-&gt;i_gid = cpu_to_le32(i_gid_read(inode));</div><div class='ctx'> 	di-&gt;i_nlink = cpu_to_le32(inode-&gt;i_nlink);</div><div class='del'>-	di-&gt;i_atime = cpu_to_le32(inode-&gt;i_atime.tv_sec);</div><div class='del'>-	di-&gt;i_mtime = cpu_to_le32(inode-&gt;i_mtime.tv_sec);</div><div class='del'>-	di-&gt;i_ctime = cpu_to_le32(inode-&gt;i_ctime.tv_sec);</div><div class='add'>+	di-&gt;i_atime = cpu_to_le32(inode_get_atime_sec(inode));</div><div class='add'>+	di-&gt;i_mtime = cpu_to_le32(inode_get_mtime_sec(inode));</div><div class='add'>+	di-&gt;i_ctime = cpu_to_le32(inode_get_ctime_sec(inode));</div><div class='ctx'> 	i_sblock = BFS_I(inode)-&gt;i_sblock;</div><div class='ctx'> 	di-&gt;i_sblock = cpu_to_le32(i_sblock);</div><div class='ctx'> 	di-&gt;i_eblock = cpu_to_le32(BFS_I(inode)-&gt;i_eblock);</div><div class='hunk'>@@ -239,7 +254,7 @@ static struct kmem_cache *bfs_inode_cachep;</div><div class='ctx'> static struct inode *bfs_alloc_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct bfs_inode_info *bi;</div><div class='del'>-	bi = kmem_cache_alloc(bfs_inode_cachep, GFP_KERNEL);</div><div class='add'>+	bi = alloc_inode_sb(sb, bfs_inode_cachep, GFP_KERNEL);</div><div class='ctx'> 	if (!bi)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	return &amp;bi-&gt;vfs_inode;</div><div class='hunk'>@@ -262,7 +277,7 @@ static int __init init_inodecache(void)</div><div class='ctx'> 	bfs_inode_cachep = kmem_cache_create("bfs_inode_cache",</div><div class='ctx'> 					     sizeof(struct bfs_inode_info),</div><div class='ctx'> 					     0, (SLAB_RECLAIM_ACCOUNT|</div><div class='del'>-						SLAB_MEM_SPREAD|SLAB_ACCOUNT),</div><div class='add'>+						SLAB_ACCOUNT),</div><div class='ctx'> 					     init_once);</div><div class='ctx'> 	if (bfs_inode_cachep == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='hunk'>@@ -308,7 +323,7 @@ void bfs_dump_imap(const char *prefix, struct super_block *s)</div><div class='ctx'> #endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int bfs_fill_super(struct super_block *s, void *data, int silent)</div><div class='add'>+static int bfs_fill_super(struct super_block *s, struct fs_context *fc)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *bh, *sbh;</div><div class='ctx'> 	struct bfs_super_block *bfs_sb;</div><div class='hunk'>@@ -317,6 +332,7 @@ static int bfs_fill_super(struct super_block *s, void *data, int silent)</div><div class='ctx'> 	struct bfs_sb_info *info;</div><div class='ctx'> 	int ret = -EINVAL;</div><div class='ctx'> 	unsigned long i_sblock, i_eblock, i_eoff, s_size;</div><div class='add'>+	int silent = fc-&gt;sb_flags &amp; SB_SILENT;</div><div class='ctx'> </div><div class='ctx'> 	info = kzalloc(sizeof(*info), GFP_KERNEL);</div><div class='ctx'> 	if (!info)</div><div class='hunk'>@@ -449,18 +465,28 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct dentry *bfs_mount(struct file_system_type *fs_type,</div><div class='del'>-	int flags, const char *dev_name, void *data)</div><div class='add'>+static int bfs_get_tree(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	return get_tree_bdev(fc, bfs_fill_super);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct fs_context_operations bfs_context_ops = {</div><div class='add'>+	.get_tree = bfs_get_tree,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int bfs_init_fs_context(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	return mount_bdev(fs_type, flags, dev_name, data, bfs_fill_super);</div><div class='add'>+	fc-&gt;ops = &amp;bfs_context_ops;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct file_system_type bfs_fs_type = {</div><div class='del'>-	.owner		= THIS_MODULE,</div><div class='del'>-	.name		= "bfs",</div><div class='del'>-	.mount		= bfs_mount,</div><div class='del'>-	.kill_sb	= kill_block_super,</div><div class='del'>-	.fs_flags	= FS_REQUIRES_DEV,</div><div class='add'>+	.owner			= THIS_MODULE,</div><div class='add'>+	.name			= "bfs",</div><div class='add'>+	.init_fs_context	= bfs_init_fs_context,</div><div class='add'>+	.kill_sb		= kill_block_super,</div><div class='add'>+	.fs_flags		= FS_REQUIRES_DEV,</div><div class='ctx'> };</div><div class='ctx'> MODULE_ALIAS_FS("bfs");</div><div class='ctx'> </div><div class='head'>diff --git a/fs/binfmt_aout.c b/fs/binfmt_aout.c<br/>deleted file mode 100644<br/>index 0dcfc691e7e2..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/binfmt_aout.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/binfmt_aout.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,342 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0-only</div><div class='del'>-/*</div><div class='del'>- *  linux/fs/binfmt_aout.c</div><div class='del'>- *</div><div class='del'>- *  Copyright (C) 1991, 1992, 1996  Linus Torvalds</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#include &lt;linux/module.h&gt;</div><div class='del'>-</div><div class='del'>-#include &lt;linux/time.h&gt;</div><div class='del'>-#include &lt;linux/kernel.h&gt;</div><div class='del'>-#include &lt;linux/mm.h&gt;</div><div class='del'>-#include &lt;linux/mman.h&gt;</div><div class='del'>-#include &lt;linux/a.out.h&gt;</div><div class='del'>-#include &lt;linux/errno.h&gt;</div><div class='del'>-#include &lt;linux/signal.h&gt;</div><div class='del'>-#include &lt;linux/string.h&gt;</div><div class='del'>-#include &lt;linux/fs.h&gt;</div><div class='del'>-#include &lt;linux/file.h&gt;</div><div class='del'>-#include &lt;linux/stat.h&gt;</div><div class='del'>-#include &lt;linux/fcntl.h&gt;</div><div class='del'>-#include &lt;linux/ptrace.h&gt;</div><div class='del'>-#include &lt;linux/user.h&gt;</div><div class='del'>-#include &lt;linux/binfmts.h&gt;</div><div class='del'>-#include &lt;linux/personality.h&gt;</div><div class='del'>-#include &lt;linux/init.h&gt;</div><div class='del'>-#include &lt;linux/coredump.h&gt;</div><div class='del'>-#include &lt;linux/slab.h&gt;</div><div class='del'>-#include &lt;linux/sched/task_stack.h&gt;</div><div class='del'>-</div><div class='del'>-#include &lt;linux/uaccess.h&gt;</div><div class='del'>-#include &lt;asm/cacheflush.h&gt;</div><div class='del'>-</div><div class='del'>-static int load_aout_binary(struct linux_binprm *);</div><div class='del'>-static int load_aout_library(struct file*);</div><div class='del'>-</div><div class='del'>-static struct linux_binfmt aout_format = {</div><div class='del'>-	.module		= THIS_MODULE,</div><div class='del'>-	.load_binary	= load_aout_binary,</div><div class='del'>-	.load_shlib	= load_aout_library,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-#define BAD_ADDR(x)	((unsigned long)(x) &gt;= TASK_SIZE)</div><div class='del'>-</div><div class='del'>-static int set_brk(unsigned long start, unsigned long end)</div><div class='del'>-{</div><div class='del'>-	start = PAGE_ALIGN(start);</div><div class='del'>-	end = PAGE_ALIGN(end);</div><div class='del'>-	if (end &gt; start)</div><div class='del'>-		return vm_brk(start, end - start);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * create_aout_tables() parses the env- and arg-strings in new user</div><div class='del'>- * memory and creates the pointer tables from them, and puts their</div><div class='del'>- * addresses on the "stack", returning the new stack pointer value.</div><div class='del'>- */</div><div class='del'>-static unsigned long __user *create_aout_tables(char __user *p, struct linux_binprm * bprm)</div><div class='del'>-{</div><div class='del'>-	char __user * __user *argv;</div><div class='del'>-	char __user * __user *envp;</div><div class='del'>-	unsigned long __user *sp;</div><div class='del'>-	int argc = bprm-&gt;argc;</div><div class='del'>-	int envc = bprm-&gt;envc;</div><div class='del'>-</div><div class='del'>-	sp = (void __user *)((-(unsigned long)sizeof(char *)) &amp; (unsigned long) p);</div><div class='del'>-#ifdef __alpha__</div><div class='del'>-/* whee.. test-programs are so much fun. */</div><div class='del'>-	put_user(0, --sp);</div><div class='del'>-	put_user(0, --sp);</div><div class='del'>-	if (bprm-&gt;loader) {</div><div class='del'>-		put_user(0, --sp);</div><div class='del'>-		put_user(1003, --sp);</div><div class='del'>-		put_user(bprm-&gt;loader, --sp);</div><div class='del'>-		put_user(1002, --sp);</div><div class='del'>-	}</div><div class='del'>-	put_user(bprm-&gt;exec, --sp);</div><div class='del'>-	put_user(1001, --sp);</div><div class='del'>-#endif</div><div class='del'>-	sp -= envc+1;</div><div class='del'>-	envp = (char __user * __user *) sp;</div><div class='del'>-	sp -= argc+1;</div><div class='del'>-	argv = (char __user * __user *) sp;</div><div class='del'>-#ifndef __alpha__</div><div class='del'>-	put_user((unsigned long) envp,--sp);</div><div class='del'>-	put_user((unsigned long) argv,--sp);</div><div class='del'>-#endif</div><div class='del'>-	put_user(argc,--sp);</div><div class='del'>-	current-&gt;mm-&gt;arg_start = (unsigned long) p;</div><div class='del'>-	while (argc--&gt;0) {</div><div class='del'>-		char c;</div><div class='del'>-		put_user(p,argv++);</div><div class='del'>-		do {</div><div class='del'>-			get_user(c,p++);</div><div class='del'>-		} while (c);</div><div class='del'>-	}</div><div class='del'>-	put_user(NULL,argv);</div><div class='del'>-	current-&gt;mm-&gt;arg_end = current-&gt;mm-&gt;env_start = (unsigned long) p;</div><div class='del'>-	while (envc--&gt;0) {</div><div class='del'>-		char c;</div><div class='del'>-		put_user(p,envp++);</div><div class='del'>-		do {</div><div class='del'>-			get_user(c,p++);</div><div class='del'>-		} while (c);</div><div class='del'>-	}</div><div class='del'>-	put_user(NULL,envp);</div><div class='del'>-	current-&gt;mm-&gt;env_end = (unsigned long) p;</div><div class='del'>-	return sp;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * These are the functions used to load a.out style executables and shared</div><div class='del'>- * libraries.  There is no binary dependent code anywhere else.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-static int load_aout_binary(struct linux_binprm * bprm)</div><div class='del'>-{</div><div class='del'>-	struct pt_regs *regs = current_pt_regs();</div><div class='del'>-	struct exec ex;</div><div class='del'>-	unsigned long error;</div><div class='del'>-	unsigned long fd_offset;</div><div class='del'>-	unsigned long rlim;</div><div class='del'>-	int retval;</div><div class='del'>-</div><div class='del'>-	ex = *((struct exec *) bprm-&gt;buf);		/* exec-header */</div><div class='del'>-	if ((N_MAGIC(ex) != ZMAGIC &amp;&amp; N_MAGIC(ex) != OMAGIC &amp;&amp;</div><div class='del'>-	     N_MAGIC(ex) != QMAGIC &amp;&amp; N_MAGIC(ex) != NMAGIC) ||</div><div class='del'>-	    N_TRSIZE(ex) || N_DRSIZE(ex) ||</div><div class='del'>-	    i_size_read(file_inode(bprm-&gt;file)) &lt; ex.a_text+ex.a_data+N_SYMSIZE(ex)+N_TXTOFF(ex)) {</div><div class='del'>-		return -ENOEXEC;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Requires a mmap handler. This prevents people from using a.out</div><div class='del'>-	 * as part of an exploit attack against /proc-related vulnerabilities.</div><div class='del'>-	 */</div><div class='del'>-	if (!bprm-&gt;file-&gt;f_op-&gt;mmap)</div><div class='del'>-		return -ENOEXEC;</div><div class='del'>-</div><div class='del'>-	fd_offset = N_TXTOFF(ex);</div><div class='del'>-</div><div class='del'>-	/* Check initial limits. This avoids letting people circumvent</div><div class='del'>-	 * size limits imposed on them by creating programs with large</div><div class='del'>-	 * arrays in the data or bss.</div><div class='del'>-	 */</div><div class='del'>-	rlim = rlimit(RLIMIT_DATA);</div><div class='del'>-	if (rlim &gt;= RLIM_INFINITY)</div><div class='del'>-		rlim = ~0;</div><div class='del'>-	if (ex.a_data + ex.a_bss &gt; rlim)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	/* Flush all traces of the currently running executable */</div><div class='del'>-	retval = begin_new_exec(bprm);</div><div class='del'>-	if (retval)</div><div class='del'>-		return retval;</div><div class='del'>-</div><div class='del'>-	/* OK, This is the point of no return */</div><div class='del'>-#ifdef __alpha__</div><div class='del'>-	SET_AOUT_PERSONALITY(bprm, ex);</div><div class='del'>-#else</div><div class='del'>-	set_personality(PER_LINUX);</div><div class='del'>-#endif</div><div class='del'>-	setup_new_exec(bprm);</div><div class='del'>-</div><div class='del'>-	current-&gt;mm-&gt;end_code = ex.a_text +</div><div class='del'>-		(current-&gt;mm-&gt;start_code = N_TXTADDR(ex));</div><div class='del'>-	current-&gt;mm-&gt;end_data = ex.a_data +</div><div class='del'>-		(current-&gt;mm-&gt;start_data = N_DATADDR(ex));</div><div class='del'>-	current-&gt;mm-&gt;brk = ex.a_bss +</div><div class='del'>-		(current-&gt;mm-&gt;start_brk = N_BSSADDR(ex));</div><div class='del'>-</div><div class='del'>-	retval = setup_arg_pages(bprm, STACK_TOP, EXSTACK_DEFAULT);</div><div class='del'>-	if (retval &lt; 0)</div><div class='del'>-		return retval;</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-	if (N_MAGIC(ex) == OMAGIC) {</div><div class='del'>-		unsigned long text_addr, map_size;</div><div class='del'>-		loff_t pos;</div><div class='del'>-</div><div class='del'>-		text_addr = N_TXTADDR(ex);</div><div class='del'>-</div><div class='del'>-#ifdef __alpha__</div><div class='del'>-		pos = fd_offset;</div><div class='del'>-		map_size = ex.a_text+ex.a_data + PAGE_SIZE - 1;</div><div class='del'>-#else</div><div class='del'>-		pos = 32;</div><div class='del'>-		map_size = ex.a_text+ex.a_data;</div><div class='del'>-#endif</div><div class='del'>-		error = vm_brk(text_addr &amp; PAGE_MASK, map_size);</div><div class='del'>-		if (error)</div><div class='del'>-			return error;</div><div class='del'>-</div><div class='del'>-		error = read_code(bprm-&gt;file, text_addr, pos,</div><div class='del'>-				  ex.a_text+ex.a_data);</div><div class='del'>-		if ((signed long)error &lt; 0)</div><div class='del'>-			return error;</div><div class='del'>-	} else {</div><div class='del'>-		if ((ex.a_text &amp; 0xfff || ex.a_data &amp; 0xfff) &amp;&amp;</div><div class='del'>-		    (N_MAGIC(ex) != NMAGIC) &amp;&amp; printk_ratelimit())</div><div class='del'>-		{</div><div class='del'>-			printk(KERN_NOTICE "executable not page aligned\n");</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if ((fd_offset &amp; ~PAGE_MASK) != 0 &amp;&amp; printk_ratelimit())</div><div class='del'>-		{</div><div class='del'>-			printk(KERN_WARNING </div><div class='del'>-			       "fd_offset is not page aligned. Please convert program: %pD\n",</div><div class='del'>-			       bprm-&gt;file);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (!bprm-&gt;file-&gt;f_op-&gt;mmap||((fd_offset &amp; ~PAGE_MASK) != 0)) {</div><div class='del'>-			error = vm_brk(N_TXTADDR(ex), ex.a_text+ex.a_data);</div><div class='del'>-			if (error)</div><div class='del'>-				return error;</div><div class='del'>-</div><div class='del'>-			read_code(bprm-&gt;file, N_TXTADDR(ex), fd_offset,</div><div class='del'>-				  ex.a_text + ex.a_data);</div><div class='del'>-			goto beyond_if;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		error = vm_mmap(bprm-&gt;file, N_TXTADDR(ex), ex.a_text,</div><div class='del'>-			PROT_READ | PROT_EXEC, MAP_FIXED | MAP_PRIVATE,</div><div class='del'>-			fd_offset);</div><div class='del'>-</div><div class='del'>-		if (error != N_TXTADDR(ex))</div><div class='del'>-			return error;</div><div class='del'>-</div><div class='del'>-		error = vm_mmap(bprm-&gt;file, N_DATADDR(ex), ex.a_data,</div><div class='del'>-				PROT_READ | PROT_WRITE | PROT_EXEC,</div><div class='del'>-				MAP_FIXED | MAP_PRIVATE,</div><div class='del'>-				fd_offset + ex.a_text);</div><div class='del'>-		if (error != N_DATADDR(ex))</div><div class='del'>-			return error;</div><div class='del'>-	}</div><div class='del'>-beyond_if:</div><div class='del'>-	set_binfmt(&amp;aout_format);</div><div class='del'>-</div><div class='del'>-	retval = set_brk(current-&gt;mm-&gt;start_brk, current-&gt;mm-&gt;brk);</div><div class='del'>-	if (retval &lt; 0)</div><div class='del'>-		return retval;</div><div class='del'>-</div><div class='del'>-	current-&gt;mm-&gt;start_stack =</div><div class='del'>-		(unsigned long) create_aout_tables((char __user *) bprm-&gt;p, bprm);</div><div class='del'>-#ifdef __alpha__</div><div class='del'>-	regs-&gt;gp = ex.a_gpvalue;</div><div class='del'>-#endif</div><div class='del'>-	finalize_exec(bprm);</div><div class='del'>-	start_thread(regs, ex.a_entry, current-&gt;mm-&gt;start_stack);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int load_aout_library(struct file *file)</div><div class='del'>-{</div><div class='del'>-	struct inode * inode;</div><div class='del'>-	unsigned long bss, start_addr, len;</div><div class='del'>-	unsigned long error;</div><div class='del'>-	int retval;</div><div class='del'>-	struct exec ex;</div><div class='del'>-	loff_t pos = 0;</div><div class='del'>-</div><div class='del'>-	inode = file_inode(file);</div><div class='del'>-</div><div class='del'>-	retval = -ENOEXEC;</div><div class='del'>-	error = kernel_read(file, &amp;ex, sizeof(ex), &amp;pos);</div><div class='del'>-	if (error != sizeof(ex))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	/* We come in here for the regular a.out style of shared libraries */</div><div class='del'>-	if ((N_MAGIC(ex) != ZMAGIC &amp;&amp; N_MAGIC(ex) != QMAGIC) || N_TRSIZE(ex) ||</div><div class='del'>-	    N_DRSIZE(ex) || ((ex.a_entry &amp; 0xfff) &amp;&amp; N_MAGIC(ex) == ZMAGIC) ||</div><div class='del'>-	    i_size_read(inode) &lt; ex.a_text+ex.a_data+N_SYMSIZE(ex)+N_TXTOFF(ex)) {</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Requires a mmap handler. This prevents people from using a.out</div><div class='del'>-	 * as part of an exploit attack against /proc-related vulnerabilities.</div><div class='del'>-	 */</div><div class='del'>-	if (!file-&gt;f_op-&gt;mmap)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	if (N_FLAGS(ex))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	/* For  QMAGIC, the starting address is 0x20 into the page.  We mask</div><div class='del'>-	   this off to get the starting address for the page */</div><div class='del'>-</div><div class='del'>-	start_addr =  ex.a_entry &amp; 0xfffff000;</div><div class='del'>-</div><div class='del'>-	if ((N_TXTOFF(ex) &amp; ~PAGE_MASK) != 0) {</div><div class='del'>-		if (printk_ratelimit())</div><div class='del'>-		{</div><div class='del'>-			printk(KERN_WARNING </div><div class='del'>-			       "N_TXTOFF is not page aligned. Please convert library: %pD\n",</div><div class='del'>-			       file);</div><div class='del'>-		}</div><div class='del'>-		retval = vm_brk(start_addr, ex.a_text + ex.a_data + ex.a_bss);</div><div class='del'>-		if (retval)</div><div class='del'>-			goto out;</div><div class='del'>-</div><div class='del'>-		read_code(file, start_addr, N_TXTOFF(ex),</div><div class='del'>-			  ex.a_text + ex.a_data);</div><div class='del'>-		retval = 0;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	/* Now use mmap to map the library into memory. */</div><div class='del'>-	error = vm_mmap(file, start_addr, ex.a_text + ex.a_data,</div><div class='del'>-			PROT_READ | PROT_WRITE | PROT_EXEC,</div><div class='del'>-			MAP_FIXED | MAP_PRIVATE,</div><div class='del'>-			N_TXTOFF(ex));</div><div class='del'>-	retval = error;</div><div class='del'>-	if (error != start_addr)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	len = PAGE_ALIGN(ex.a_text + ex.a_data);</div><div class='del'>-	bss = ex.a_text + ex.a_data + ex.a_bss;</div><div class='del'>-	if (bss &gt; len) {</div><div class='del'>-		retval = vm_brk(start_addr + len, bss - len);</div><div class='del'>-		if (retval)</div><div class='del'>-			goto out;</div><div class='del'>-	}</div><div class='del'>-	retval = 0;</div><div class='del'>-out:</div><div class='del'>-	return retval;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int __init init_aout_binfmt(void)</div><div class='del'>-{</div><div class='del'>-	register_binfmt(&amp;aout_format);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void __exit exit_aout_binfmt(void)</div><div class='del'>-{</div><div class='del'>-	unregister_binfmt(&amp;aout_format);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-core_initcall(init_aout_binfmt);</div><div class='del'>-module_exit(exit_aout_binfmt);</div><div class='del'>-MODULE_LICENSE("GPL");</div><div class='head'>diff --git a/fs/binfmt_elf.c b/fs/binfmt_elf.c<br/>index f8c7f26f1fbb..3eb734c192e9 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/binfmt_elf.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/binfmt_elf.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/binfmt_elf.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/binfmt_elf.c</a></div><div class='hunk'>@@ -46,6 +46,7 @@</div><div class='ctx'> #include &lt;linux/cred.h&gt;</div><div class='ctx'> #include &lt;linux/dax.h&gt;</div><div class='ctx'> #include &lt;linux/uaccess.h&gt;</div><div class='add'>+#include &lt;uapi/linux/rseq.h&gt;</div><div class='ctx'> #include &lt;asm/param.h&gt;</div><div class='ctx'> #include &lt;asm/page.h&gt;</div><div class='ctx'> </div><div class='hunk'>@@ -67,12 +68,6 @@</div><div class='ctx'> </div><div class='ctx'> static int load_elf_binary(struct linux_binprm *bprm);</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_USELIB</div><div class='del'>-static int load_elf_library(struct file *);</div><div class='del'>-#else</div><div class='del'>-#define load_elf_library NULL</div><div class='del'>-#endif</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * If we don't support core dumping, then supply a NULL so we</div><div class='ctx'>  * don't even try.</div><div class='hunk'>@@ -93,52 +88,49 @@ static int elf_core_dump(struct coredump_params *cprm);</div><div class='ctx'> #define ELF_CORE_EFLAGS	0</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-#define ELF_PAGESTART(_v) ((_v) &amp; ~(unsigned long)(ELF_MIN_ALIGN-1))</div><div class='add'>+#define ELF_PAGESTART(_v) ((_v) &amp; ~(int)(ELF_MIN_ALIGN-1))</div><div class='ctx'> #define ELF_PAGEOFFSET(_v) ((_v) &amp; (ELF_MIN_ALIGN-1))</div><div class='ctx'> #define ELF_PAGEALIGN(_v) (((_v) + ELF_MIN_ALIGN - 1) &amp; ~(ELF_MIN_ALIGN - 1))</div><div class='ctx'> </div><div class='ctx'> static struct linux_binfmt elf_format = {</div><div class='ctx'> 	.module		= THIS_MODULE,</div><div class='ctx'> 	.load_binary	= load_elf_binary,</div><div class='del'>-	.load_shlib	= load_elf_library,</div><div class='add'>+#ifdef CONFIG_COREDUMP</div><div class='ctx'> 	.core_dump	= elf_core_dump,</div><div class='ctx'> 	.min_coredump	= ELF_EXEC_PAGESIZE,</div><div class='add'>+#endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> #define BAD_ADDR(x) (unlikely((unsigned long)(x) &gt;= TASK_SIZE))</div><div class='ctx'> </div><div class='del'>-static int set_brk(unsigned long start, unsigned long end, int prot)</div><div class='add'>+static inline void elf_coredump_set_mm_eflags(struct mm_struct *mm, u32 flags)</div><div class='ctx'> {</div><div class='del'>-	start = ELF_PAGEALIGN(start);</div><div class='del'>-	end = ELF_PAGEALIGN(end);</div><div class='del'>-	if (end &gt; start) {</div><div class='del'>-		/*</div><div class='del'>-		 * Map the last of the bss segment.</div><div class='del'>-		 * If the header is requesting these pages to be</div><div class='del'>-		 * executable, honour that (ppc32 needs this).</div><div class='del'>-		 */</div><div class='del'>-		int error = vm_brk_flags(start, end - start,</div><div class='del'>-				prot &amp; PROT_EXEC ? VM_EXEC : 0);</div><div class='del'>-		if (error)</div><div class='del'>-			return error;</div><div class='del'>-	}</div><div class='del'>-	current-&gt;mm-&gt;start_brk = current-&gt;mm-&gt;brk = end;</div><div class='del'>-	return 0;</div><div class='add'>+#ifdef CONFIG_ARCH_HAS_ELF_CORE_EFLAGS</div><div class='add'>+	mm-&gt;saved_e_flags = flags;</div><div class='add'>+#endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* We need to explicitly zero any fractional pages</div><div class='del'>-   after the data section (i.e. bss).  This would</div><div class='del'>-   contain the junk from the file that should not</div><div class='del'>-   be in memory</div><div class='add'>+static inline u32 elf_coredump_get_mm_eflags(struct mm_struct *mm, u32 flags)</div><div class='add'>+{</div><div class='add'>+#ifdef CONFIG_ARCH_HAS_ELF_CORE_EFLAGS</div><div class='add'>+	flags = mm-&gt;saved_e_flags;</div><div class='add'>+#endif</div><div class='add'>+	return flags;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * We need to explicitly zero any trailing portion of the page that follows</div><div class='add'>+ * p_filesz when it ends before the page ends (e.g. bss), otherwise this</div><div class='add'>+ * memory will contain the junk from the file that should not be present.</div><div class='ctx'>  */</div><div class='del'>-static int padzero(unsigned long elf_bss)</div><div class='add'>+static int padzero(unsigned long address)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned long nbyte;</div><div class='ctx'> </div><div class='del'>-	nbyte = ELF_PAGEOFFSET(elf_bss);</div><div class='add'>+	nbyte = ELF_PAGEOFFSET(address);</div><div class='ctx'> 	if (nbyte) {</div><div class='ctx'> 		nbyte = ELF_MIN_ALIGN - nbyte;</div><div class='del'>-		if (clear_user((void __user *) elf_bss, nbyte))</div><div class='add'>+		if (clear_user((void __user *)address, nbyte))</div><div class='ctx'> 			return -EFAULT;</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -170,8 +162,8 @@ static int padzero(unsigned long elf_bss)</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='ctx'> create_elf_tables(struct linux_binprm *bprm, const struct elfhdr *exec,</div><div class='del'>-		unsigned long load_addr, unsigned long interp_load_addr,</div><div class='del'>-		unsigned long e_entry)</div><div class='add'>+		unsigned long interp_load_addr,</div><div class='add'>+		unsigned long e_entry, unsigned long phdr_addr)</div><div class='ctx'> {</div><div class='ctx'> 	struct mm_struct *mm = current-&gt;mm;</div><div class='ctx'> 	unsigned long p = bprm-&gt;p;</div><div class='hunk'>@@ -246,7 +238,7 @@ create_elf_tables(struct linux_binprm *bprm, const struct elfhdr *exec,</div><div class='ctx'> 	} while (0)</div><div class='ctx'> </div><div class='ctx'> #ifdef ARCH_DLINFO</div><div class='del'>-	/* </div><div class='add'>+	/*</div><div class='ctx'> 	 * ARCH_DLINFO must come first so PPC can do its special alignment of</div><div class='ctx'> 	 * AUXV.</div><div class='ctx'> 	 * update AT_VECTOR_SIZE_ARCH if the number of NEW_AUX_ENT() in</div><div class='hunk'>@@ -257,7 +249,7 @@ create_elf_tables(struct linux_binprm *bprm, const struct elfhdr *exec,</div><div class='ctx'> 	NEW_AUX_ENT(AT_HWCAP, ELF_HWCAP);</div><div class='ctx'> 	NEW_AUX_ENT(AT_PAGESZ, ELF_EXEC_PAGESIZE);</div><div class='ctx'> 	NEW_AUX_ENT(AT_CLKTCK, CLOCKS_PER_SEC);</div><div class='del'>-	NEW_AUX_ENT(AT_PHDR, load_addr + exec-&gt;e_phoff);</div><div class='add'>+	NEW_AUX_ENT(AT_PHDR, phdr_addr);</div><div class='ctx'> 	NEW_AUX_ENT(AT_PHENT, sizeof(struct elf_phdr));</div><div class='ctx'> 	NEW_AUX_ENT(AT_PHNUM, exec-&gt;e_phnum);</div><div class='ctx'> 	NEW_AUX_ENT(AT_BASE, interp_load_addr);</div><div class='hunk'>@@ -274,6 +266,12 @@ create_elf_tables(struct linux_binprm *bprm, const struct elfhdr *exec,</div><div class='ctx'> #ifdef ELF_HWCAP2</div><div class='ctx'> 	NEW_AUX_ENT(AT_HWCAP2, ELF_HWCAP2);</div><div class='ctx'> #endif</div><div class='add'>+#ifdef ELF_HWCAP3</div><div class='add'>+	NEW_AUX_ENT(AT_HWCAP3, ELF_HWCAP3);</div><div class='add'>+#endif</div><div class='add'>+#ifdef ELF_HWCAP4</div><div class='add'>+	NEW_AUX_ENT(AT_HWCAP4, ELF_HWCAP4);</div><div class='add'>+#endif</div><div class='ctx'> 	NEW_AUX_ENT(AT_EXECFN, bprm-&gt;exec);</div><div class='ctx'> 	if (k_platform) {</div><div class='ctx'> 		NEW_AUX_ENT(AT_PLATFORM,</div><div class='hunk'>@@ -286,6 +284,10 @@ create_elf_tables(struct linux_binprm *bprm, const struct elfhdr *exec,</div><div class='ctx'> 	if (bprm-&gt;have_execfd) {</div><div class='ctx'> 		NEW_AUX_ENT(AT_EXECFD, bprm-&gt;execfd);</div><div class='ctx'> 	}</div><div class='add'>+#ifdef CONFIG_RSEQ</div><div class='add'>+	NEW_AUX_ENT(AT_RSEQ_FEATURE_SIZE, offsetof(struct rseq, end));</div><div class='add'>+	NEW_AUX_ENT(AT_RSEQ_ALIGN, __alignof__(struct rseq));</div><div class='add'>+#endif</div><div class='ctx'> #undef NEW_AUX_ENT</div><div class='ctx'> 	/* AT_NULL is zero; clear the rest too */</div><div class='ctx'> 	memset(elf_info, 0, (char *)mm-&gt;saved_auxv +</div><div class='hunk'>@@ -313,10 +315,10 @@ create_elf_tables(struct linux_binprm *bprm, const struct elfhdr *exec,</div><div class='ctx'> 	 * Grow the stack manually; some architectures have a limit on how</div><div class='ctx'> 	 * far ahead a user-space access may be in order to grow the stack.</div><div class='ctx'> 	 */</div><div class='del'>-	if (mmap_read_lock_killable(mm))</div><div class='add'>+	if (mmap_write_lock_killable(mm))</div><div class='ctx'> 		return -EINTR;</div><div class='del'>-	vma = find_extend_vma(mm, bprm-&gt;p);</div><div class='del'>-	mmap_read_unlock(mm);</div><div class='add'>+	vma = find_extend_vma_locked(mm, bprm-&gt;p);</div><div class='add'>+	mmap_write_unlock(mm);</div><div class='ctx'> 	if (!vma)</div><div class='ctx'> 		return -EFAULT;</div><div class='ctx'> </div><div class='hunk'>@@ -360,6 +362,11 @@ create_elf_tables(struct linux_binprm *bprm, const struct elfhdr *exec,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Map "eppnt-&gt;p_filesz" bytes from "filep" offset "eppnt-&gt;p_offset"</div><div class='add'>+ * into memory at "addr". (Note that p_filesz is rounded up to the</div><div class='add'>+ * next page, so any extra bytes from the file must be wiped.)</div><div class='add'>+ */</div><div class='ctx'> static unsigned long elf_map(struct file *filep, unsigned long addr,</div><div class='ctx'> 		const struct elf_phdr *eppnt, int prot, int type,</div><div class='ctx'> 		unsigned long total_size)</div><div class='hunk'>@@ -399,22 +406,75 @@ static unsigned long elf_map(struct file *filep, unsigned long addr,</div><div class='ctx'> 	return(map_addr);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static unsigned long total_mapping_size(const struct elf_phdr *cmds, int nr)</div><div class='add'>+/*</div><div class='add'>+ * Map "eppnt-&gt;p_filesz" bytes from "filep" offset "eppnt-&gt;p_offset"</div><div class='add'>+ * into memory at "addr". Memory from "p_filesz" through "p_memsz"</div><div class='add'>+ * rounded up to the next page is zeroed.</div><div class='add'>+ */</div><div class='add'>+static unsigned long elf_load(struct file *filep, unsigned long addr,</div><div class='add'>+		const struct elf_phdr *eppnt, int prot, int type,</div><div class='add'>+		unsigned long total_size)</div><div class='ctx'> {</div><div class='del'>-	int i, first_idx = -1, last_idx = -1;</div><div class='add'>+	unsigned long zero_start, zero_end;</div><div class='add'>+	unsigned long map_addr;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; nr; i++) {</div><div class='del'>-		if (cmds[i].p_type == PT_LOAD) {</div><div class='del'>-			last_idx = i;</div><div class='del'>-			if (first_idx == -1)</div><div class='del'>-				first_idx = i;</div><div class='add'>+	if (eppnt-&gt;p_filesz) {</div><div class='add'>+		map_addr = elf_map(filep, addr, eppnt, prot, type, total_size);</div><div class='add'>+		if (BAD_ADDR(map_addr))</div><div class='add'>+			return map_addr;</div><div class='add'>+		if (eppnt-&gt;p_memsz &gt; eppnt-&gt;p_filesz) {</div><div class='add'>+			zero_start = map_addr + ELF_PAGEOFFSET(eppnt-&gt;p_vaddr) +</div><div class='add'>+				eppnt-&gt;p_filesz;</div><div class='add'>+			zero_end = map_addr + ELF_PAGEOFFSET(eppnt-&gt;p_vaddr) +</div><div class='add'>+				eppnt-&gt;p_memsz;</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * Zero the end of the last mapped page but ignore</div><div class='add'>+			 * any errors if the segment isn't writable.</div><div class='add'>+			 */</div><div class='add'>+			if (padzero(zero_start) &amp;&amp; (prot &amp; PROT_WRITE))</div><div class='add'>+				return -EFAULT;</div><div class='ctx'> 		}</div><div class='add'>+	} else {</div><div class='add'>+		map_addr = zero_start = ELF_PAGESTART(addr);</div><div class='add'>+		zero_end = zero_start + ELF_PAGEOFFSET(eppnt-&gt;p_vaddr) +</div><div class='add'>+			eppnt-&gt;p_memsz;</div><div class='ctx'> 	}</div><div class='del'>-	if (first_idx == -1)</div><div class='del'>-		return 0;</div><div class='add'>+	if (eppnt-&gt;p_memsz &gt; eppnt-&gt;p_filesz) {</div><div class='add'>+		/*</div><div class='add'>+		 * Map the last of the segment.</div><div class='add'>+		 * If the header is requesting these pages to be</div><div class='add'>+		 * executable, honour that (ppc32 needs this).</div><div class='add'>+		 */</div><div class='add'>+		int error;</div><div class='add'>+</div><div class='add'>+		zero_start = ELF_PAGEALIGN(zero_start);</div><div class='add'>+		zero_end = ELF_PAGEALIGN(zero_end);</div><div class='add'>+</div><div class='add'>+		error = vm_brk_flags(zero_start, zero_end - zero_start,</div><div class='add'>+				     prot &amp; PROT_EXEC ? VM_EXEC : 0);</div><div class='add'>+		if (error)</div><div class='add'>+			map_addr = error;</div><div class='add'>+	}</div><div class='add'>+	return map_addr;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+</div><div class='add'>+static unsigned long total_mapping_size(const struct elf_phdr *phdr, int nr)</div><div class='add'>+{</div><div class='add'>+	elf_addr_t min_addr = -1;</div><div class='add'>+	elf_addr_t max_addr = 0;</div><div class='add'>+	bool pt_load = false;</div><div class='add'>+	int i;</div><div class='ctx'> </div><div class='del'>-	return cmds[last_idx].p_vaddr + cmds[last_idx].p_memsz -</div><div class='del'>-				ELF_PAGESTART(cmds[first_idx].p_vaddr);</div><div class='add'>+	for (i = 0; i &lt; nr; i++) {</div><div class='add'>+		if (phdr[i].p_type == PT_LOAD) {</div><div class='add'>+			min_addr = min(min_addr, ELF_PAGESTART(phdr[i].p_vaddr));</div><div class='add'>+			max_addr = max(max_addr, phdr[i].p_vaddr + phdr[i].p_memsz);</div><div class='add'>+			pt_load = true;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	return pt_load ? (max_addr - min_addr) : 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int elf_read(struct file *file, void *buf, size_t len, loff_t pos)</div><div class='hunk'>@@ -455,13 +515,13 @@ static unsigned long maximum_alignment(struct elf_phdr *cmds, int nr)</div><div class='ctx'>  *</div><div class='ctx'>  * Loads ELF program headers from the binary file elf_file, which has the ELF</div><div class='ctx'>  * header pointed to by elf_ex, into a newly allocated array. The caller is</div><div class='del'>- * responsible for freeing the allocated data. Returns an ERR_PTR upon failure.</div><div class='add'>+ * responsible for freeing the allocated data. Returns NULL upon failure.</div><div class='ctx'>  */</div><div class='ctx'> static struct elf_phdr *load_elf_phdrs(const struct elfhdr *elf_ex,</div><div class='ctx'> 				       struct file *elf_file)</div><div class='ctx'> {</div><div class='ctx'> 	struct elf_phdr *elf_phdata = NULL;</div><div class='del'>-	int retval, err = -1;</div><div class='add'>+	int retval = -1;</div><div class='ctx'> 	unsigned int size;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -474,7 +534,7 @@ static struct elf_phdr *load_elf_phdrs(const struct elfhdr *elf_ex,</div><div class='ctx'> 	/* Sanity check the number of program headers... */</div><div class='ctx'> 	/* ...and their total size. */</div><div class='ctx'> 	size = sizeof(struct elf_phdr) * elf_ex-&gt;e_phnum;</div><div class='del'>-	if (size == 0 || size &gt; 65536 || size &gt; ELF_MIN_ALIGN)</div><div class='add'>+	if (size == 0 || size &gt; 65536)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	elf_phdata = kmalloc(size, GFP_KERNEL);</div><div class='hunk'>@@ -483,15 +543,9 @@ static struct elf_phdr *load_elf_phdrs(const struct elfhdr *elf_ex,</div><div class='ctx'> </div><div class='ctx'> 	/* Read in the program headers */</div><div class='ctx'> 	retval = elf_read(elf_file, elf_phdata, size, elf_ex-&gt;e_phoff);</div><div class='del'>-	if (retval &lt; 0) {</div><div class='del'>-		err = retval;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	/* Success! */</div><div class='del'>-	err = 0;</div><div class='ctx'> out:</div><div class='del'>-	if (err) {</div><div class='add'>+	if (retval) {</div><div class='ctx'> 		kfree(elf_phdata);</div><div class='ctx'> 		elf_phdata = NULL;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -596,8 +650,6 @@ static unsigned long load_elf_interp(struct elfhdr *interp_elf_ex,</div><div class='ctx'> 	struct elf_phdr *eppnt;</div><div class='ctx'> 	unsigned long load_addr = 0;</div><div class='ctx'> 	int load_addr_set = 0;</div><div class='del'>-	unsigned long last_bss = 0, elf_bss = 0;</div><div class='del'>-	int bss_prot = 0;</div><div class='ctx'> 	unsigned long error = ~0UL;</div><div class='ctx'> 	unsigned long total_size;</div><div class='ctx'> 	int i;</div><div class='hunk'>@@ -609,7 +661,7 @@ static unsigned long load_elf_interp(struct elfhdr *interp_elf_ex,</div><div class='ctx'> 	if (!elf_check_arch(interp_elf_ex) ||</div><div class='ctx'> 	    elf_check_fdpic(interp_elf_ex))</div><div class='ctx'> 		goto out;</div><div class='del'>-	if (!interpreter-&gt;f_op-&gt;mmap)</div><div class='add'>+	if (!can_mmap_file(interpreter))</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	total_size = total_mapping_size(interp_elf_phdata,</div><div class='hunk'>@@ -634,7 +686,7 @@ static unsigned long load_elf_interp(struct elfhdr *interp_elf_ex,</div><div class='ctx'> 			else if (no_base &amp;&amp; interp_elf_ex-&gt;e_type == ET_DYN)</div><div class='ctx'> 				load_addr = -vaddr;</div><div class='ctx'> </div><div class='del'>-			map_addr = elf_map(interpreter, load_addr + vaddr,</div><div class='add'>+			map_addr = elf_load(interpreter, load_addr + vaddr,</div><div class='ctx'> 					eppnt, elf_prot, elf_type, total_size);</div><div class='ctx'> 			total_size = 0;</div><div class='ctx'> 			error = map_addr;</div><div class='hunk'>@@ -660,51 +712,9 @@ static unsigned long load_elf_interp(struct elfhdr *interp_elf_ex,</div><div class='ctx'> 				error = -ENOMEM;</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='del'>-</div><div class='del'>-			/*</div><div class='del'>-			 * Find the end of the file mapping for this phdr, and</div><div class='del'>-			 * keep track of the largest address we see for this.</div><div class='del'>-			 */</div><div class='del'>-			k = load_addr + eppnt-&gt;p_vaddr + eppnt-&gt;p_filesz;</div><div class='del'>-			if (k &gt; elf_bss)</div><div class='del'>-				elf_bss = k;</div><div class='del'>-</div><div class='del'>-			/*</div><div class='del'>-			 * Do the same thing for the memory mapping - between</div><div class='del'>-			 * elf_bss and last_bss is the bss section.</div><div class='del'>-			 */</div><div class='del'>-			k = load_addr + eppnt-&gt;p_vaddr + eppnt-&gt;p_memsz;</div><div class='del'>-			if (k &gt; last_bss) {</div><div class='del'>-				last_bss = k;</div><div class='del'>-				bss_prot = elf_prot;</div><div class='del'>-			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Now fill out the bss section: first pad the last page from</div><div class='del'>-	 * the file up to the page boundary, and zero it from elf_bss</div><div class='del'>-	 * up to the end of the page.</div><div class='del'>-	 */</div><div class='del'>-	if (padzero(elf_bss)) {</div><div class='del'>-		error = -EFAULT;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	/*</div><div class='del'>-	 * Next, align both the file and mem bss up to the page size,</div><div class='del'>-	 * since this is where elf_bss was just zeroed up to, and where</div><div class='del'>-	 * last_bss will end after the vm_brk_flags() below.</div><div class='del'>-	 */</div><div class='del'>-	elf_bss = ELF_PAGEALIGN(elf_bss);</div><div class='del'>-	last_bss = ELF_PAGEALIGN(last_bss);</div><div class='del'>-	/* Finally, if there is still more bss to allocate, do it. */</div><div class='del'>-	if (last_bss &gt; elf_bss) {</div><div class='del'>-		error = vm_brk_flags(elf_bss, last_bss - elf_bss,</div><div class='del'>-				bss_prot &amp; PROT_EXEC ? VM_EXEC : 0);</div><div class='del'>-		if (error)</div><div class='del'>-			goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	error = load_addr;</div><div class='ctx'> out:</div><div class='ctx'> 	return error;</div><div class='hunk'>@@ -760,8 +770,7 @@ static int parse_elf_property(const char *data, size_t *off, size_t datasz,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #define NOTE_DATA_SZ SZ_1K</div><div class='del'>-#define GNU_PROPERTY_TYPE_0_NAME "GNU"</div><div class='del'>-#define NOTE_NAME_SZ (sizeof(GNU_PROPERTY_TYPE_0_NAME))</div><div class='add'>+#define NOTE_NAME_SZ (sizeof(NN_GNU_PROPERTY_TYPE_0))</div><div class='ctx'> </div><div class='ctx'> static int parse_elf_properties(struct file *f, const struct elf_phdr *phdr,</div><div class='ctx'> 				struct arch_elf_state *arch)</div><div class='hunk'>@@ -798,7 +807,7 @@ static int parse_elf_properties(struct file *f, const struct elf_phdr *phdr,</div><div class='ctx'> 	if (note.nhdr.n_type != NT_GNU_PROPERTY_TYPE_0 ||</div><div class='ctx'> 	    note.nhdr.n_namesz != NOTE_NAME_SZ ||</div><div class='ctx'> 	    strncmp(note.data + sizeof(note.nhdr),</div><div class='del'>-		    GNU_PROPERTY_TYPE_0_NAME, n - sizeof(note.nhdr)))</div><div class='add'>+		    NN_GNU_PROPERTY_TYPE_0, n - sizeof(note.nhdr)))</div><div class='ctx'> 		return -ENOEXEC;</div><div class='ctx'> </div><div class='ctx'> 	off = round_up(sizeof(note.nhdr) + NOTE_NAME_SZ,</div><div class='hunk'>@@ -823,13 +832,13 @@ static int parse_elf_properties(struct file *f, const struct elf_phdr *phdr,</div><div class='ctx'> static int load_elf_binary(struct linux_binprm *bprm)</div><div class='ctx'> {</div><div class='ctx'> 	struct file *interpreter = NULL; /* to shut gcc up */</div><div class='del'>- 	unsigned long load_addr = 0, load_bias = 0;</div><div class='del'>-	int load_addr_set = 0;</div><div class='add'>+	unsigned long load_bias = 0, phdr_addr = 0;</div><div class='add'>+	int first_pt_load = 1;</div><div class='ctx'> 	unsigned long error;</div><div class='ctx'> 	struct elf_phdr *elf_ppnt, *elf_phdata, *interp_elf_phdata = NULL;</div><div class='ctx'> 	struct elf_phdr *elf_property_phdata = NULL;</div><div class='del'>-	unsigned long elf_bss, elf_brk;</div><div class='del'>-	int bss_prot = 0;</div><div class='add'>+	unsigned long elf_brk;</div><div class='add'>+	bool brk_moved = false;</div><div class='ctx'> 	int retval, i;</div><div class='ctx'> 	unsigned long elf_entry;</div><div class='ctx'> 	unsigned long e_entry;</div><div class='hunk'>@@ -854,7 +863,7 @@ static int load_elf_binary(struct linux_binprm *bprm)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	if (elf_check_fdpic(elf_ex))</div><div class='ctx'> 		goto out;</div><div class='del'>-	if (!bprm-&gt;file-&gt;f_op-&gt;mmap)</div><div class='add'>+	if (!can_mmap_file(bprm-&gt;file))</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	elf_phdata = load_elf_phdrs(elf_ex, bprm-&gt;file);</div><div class='hunk'>@@ -910,7 +919,7 @@ static int load_elf_binary(struct linux_binprm *bprm)</div><div class='ctx'> 		interp_elf_ex = kmalloc(sizeof(*interp_elf_ex), GFP_KERNEL);</div><div class='ctx'> 		if (!interp_elf_ex) {</div><div class='ctx'> 			retval = -ENOMEM;</div><div class='del'>-			goto out_free_ph;</div><div class='add'>+			goto out_free_file;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* Get the exec headers */</div><div class='hunk'>@@ -1008,7 +1017,8 @@ out_free_interp:</div><div class='ctx'> 	if (elf_read_implies_exec(*elf_ex, executable_stack))</div><div class='ctx'> 		current-&gt;personality |= READ_IMPLIES_EXEC;</div><div class='ctx'> </div><div class='del'>-	if (!(current-&gt;personality &amp; ADDR_NO_RANDOMIZE) &amp;&amp; randomize_va_space)</div><div class='add'>+	const int snapshot_randomize_va_space = READ_ONCE(randomize_va_space);</div><div class='add'>+	if (!(current-&gt;personality &amp; ADDR_NO_RANDOMIZE) &amp;&amp; snapshot_randomize_va_space)</div><div class='ctx'> 		current-&gt;flags |= PF_RANDOMIZE;</div><div class='ctx'> </div><div class='ctx'> 	setup_new_exec(bprm);</div><div class='hunk'>@@ -1019,8 +1029,7 @@ out_free_interp:</div><div class='ctx'> 				 executable_stack);</div><div class='ctx'> 	if (retval &lt; 0)</div><div class='ctx'> 		goto out_free_dentry;</div><div class='del'>-	</div><div class='del'>-	elf_bss = 0;</div><div class='add'>+</div><div class='ctx'> 	elf_brk = 0;</div><div class='ctx'> </div><div class='ctx'> 	start_code = ~0UL;</div><div class='hunk'>@@ -1040,33 +1049,6 @@ out_free_interp:</div><div class='ctx'> 		if (elf_ppnt-&gt;p_type != PT_LOAD)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		if (unlikely (elf_brk &gt; elf_bss)) {</div><div class='del'>-			unsigned long nbyte;</div><div class='del'>-	            </div><div class='del'>-			/* There was a PT_LOAD segment with p_memsz &gt; p_filesz</div><div class='del'>-			   before this one. Map anonymous pages, if needed,</div><div class='del'>-			   and clear the area.  */</div><div class='del'>-			retval = set_brk(elf_bss + load_bias,</div><div class='del'>-					 elf_brk + load_bias,</div><div class='del'>-					 bss_prot);</div><div class='del'>-			if (retval)</div><div class='del'>-				goto out_free_dentry;</div><div class='del'>-			nbyte = ELF_PAGEOFFSET(elf_bss);</div><div class='del'>-			if (nbyte) {</div><div class='del'>-				nbyte = ELF_MIN_ALIGN - nbyte;</div><div class='del'>-				if (nbyte &gt; elf_brk - elf_bss)</div><div class='del'>-					nbyte = elf_brk - elf_bss;</div><div class='del'>-				if (clear_user((void __user *)elf_bss +</div><div class='del'>-							load_bias, nbyte)) {</div><div class='del'>-					/*</div><div class='del'>-					 * This bss-zeroing can fail if the ELF</div><div class='del'>-					 * file specifies odd protections. So</div><div class='del'>-					 * we don't check the return value</div><div class='del'>-					 */</div><div class='del'>-				}</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='ctx'> 		elf_prot = make_prot(elf_ppnt-&gt;p_flags, &amp;arch_state,</div><div class='ctx'> 				     !!interpreter, false);</div><div class='ctx'> </div><div class='hunk'>@@ -1074,12 +1056,12 @@ out_free_interp:</div><div class='ctx'> </div><div class='ctx'> 		vaddr = elf_ppnt-&gt;p_vaddr;</div><div class='ctx'> 		/*</div><div class='del'>-		 * The first time through the loop, load_addr_set is false:</div><div class='add'>+		 * The first time through the loop, first_pt_load is true:</div><div class='ctx'> 		 * layout will be calculated. Once set, use MAP_FIXED since</div><div class='ctx'> 		 * we know we've already safely mapped the entire region with</div><div class='ctx'> 		 * MAP_FIXED_NOREPLACE in the once-per-binary logic following.</div><div class='ctx'> 		 */</div><div class='del'>-		if (load_addr_set) {</div><div class='add'>+		if (!first_pt_load) {</div><div class='ctx'> 			elf_flags |= MAP_FIXED;</div><div class='ctx'> 		} else if (elf_ex-&gt;e_type == ET_EXEC) {</div><div class='ctx'> 			/*</div><div class='hunk'>@@ -1094,15 +1076,49 @@ out_free_interp:</div><div class='ctx'> 			 * Header for ET_DYN binaries to calculate the</div><div class='ctx'> 			 * randomization (load_bias) for all the LOAD</div><div class='ctx'> 			 * Program Headers.</div><div class='add'>+			 */</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * Calculate the entire size of the ELF mapping</div><div class='add'>+			 * (total_size), used for the initial mapping,</div><div class='add'>+			 * due to load_addr_set which is set to true later</div><div class='add'>+			 * once the initial mapping is performed.</div><div class='add'>+			 *</div><div class='add'>+			 * Note that this is only sensible when the LOAD</div><div class='add'>+			 * segments are contiguous (or overlapping). If</div><div class='add'>+			 * used for LOADs that are far apart, this would</div><div class='add'>+			 * cause the holes between LOADs to be mapped,</div><div class='add'>+			 * running the risk of having the mapping fail,</div><div class='add'>+			 * as it would be larger than the ELF file itself.</div><div class='add'>+			 *</div><div class='add'>+			 * As a result, only ET_DYN does this, since</div><div class='add'>+			 * some ET_EXEC (e.g. ia64) may have large virtual</div><div class='add'>+			 * memory holes between LOADs.</div><div class='add'>+			 *</div><div class='add'>+			 */</div><div class='add'>+			total_size = total_mapping_size(elf_phdata,</div><div class='add'>+							elf_ex-&gt;e_phnum);</div><div class='add'>+			if (!total_size) {</div><div class='add'>+				retval = -EINVAL;</div><div class='add'>+				goto out_free_dentry;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			/* Calculate any requested alignment. */</div><div class='add'>+			alignment = maximum_alignment(elf_phdata, elf_ex-&gt;e_phnum);</div><div class='add'>+</div><div class='add'>+			/**</div><div class='add'>+			 * DOC: PIE handling</div><div class='ctx'> 			 *</div><div class='del'>-			 * There are effectively two types of ET_DYN</div><div class='del'>-			 * binaries: programs (i.e. PIE: ET_DYN with INTERP)</div><div class='del'>-			 * and loaders (ET_DYN without INTERP, since they</div><div class='del'>-			 * _are_ the ELF interpreter). The loaders must</div><div class='del'>-			 * be loaded away from programs since the program</div><div class='del'>-			 * may otherwise collide with the loader (especially</div><div class='del'>-			 * for ET_EXEC which does not have a randomized</div><div class='del'>-			 * position). For example to handle invocations of</div><div class='add'>+			 * There are effectively two types of ET_DYN ELF</div><div class='add'>+			 * binaries: programs (i.e. PIE: ET_DYN with</div><div class='add'>+			 * PT_INTERP) and loaders (i.e. static PIE: ET_DYN</div><div class='add'>+			 * without PT_INTERP, usually the ELF interpreter</div><div class='add'>+			 * itself). Loaders must be loaded away from programs</div><div class='add'>+			 * since the program may otherwise collide with the</div><div class='add'>+			 * loader (especially for ET_EXEC which does not have</div><div class='add'>+			 * a randomized position).</div><div class='add'>+			 *</div><div class='add'>+			 * For example, to handle invocations of</div><div class='ctx'> 			 * "./ld.so someprog" to test out a new version of</div><div class='ctx'> 			 * the loader, the subsequent program that the</div><div class='ctx'> 			 * loader loads must avoid the loader itself, so</div><div class='hunk'>@@ -1115,17 +1131,49 @@ out_free_interp:</div><div class='ctx'> 			 * ELF_ET_DYN_BASE and loaders are loaded into the</div><div class='ctx'> 			 * independently randomized mmap region (0 load_bias</div><div class='ctx'> 			 * without MAP_FIXED nor MAP_FIXED_NOREPLACE).</div><div class='add'>+			 *</div><div class='add'>+			 * See below for "brk" handling details, which is</div><div class='add'>+			 * also affected by program vs loader and ASLR.</div><div class='ctx'> 			 */</div><div class='ctx'> 			if (interpreter) {</div><div class='add'>+				/* On ET_DYN with PT_INTERP, we do the ASLR. */</div><div class='ctx'> 				load_bias = ELF_ET_DYN_BASE;</div><div class='ctx'> 				if (current-&gt;flags &amp; PF_RANDOMIZE)</div><div class='ctx'> 					load_bias += arch_mmap_rnd();</div><div class='del'>-				alignment = maximum_alignment(elf_phdata, elf_ex-&gt;e_phnum);</div><div class='add'>+				/* Adjust alignment as requested. */</div><div class='ctx'> 				if (alignment)</div><div class='ctx'> 					load_bias &amp;= ~(alignment - 1);</div><div class='ctx'> 				elf_flags |= MAP_FIXED_NOREPLACE;</div><div class='del'>-			} else</div><div class='del'>-				load_bias = 0;</div><div class='add'>+			} else {</div><div class='add'>+				/*</div><div class='add'>+				 * For ET_DYN without PT_INTERP, we rely on</div><div class='add'>+				 * the architectures's (potentially ASLR) mmap</div><div class='add'>+				 * base address (via a load_bias of 0).</div><div class='add'>+				 *</div><div class='add'>+				 * When a large alignment is requested, we</div><div class='add'>+				 * must do the allocation at address "0" right</div><div class='add'>+				 * now to discover where things will load so</div><div class='add'>+				 * that we can adjust the resulting alignment.</div><div class='add'>+				 * In this case (load_bias != 0), we can use</div><div class='add'>+				 * MAP_FIXED_NOREPLACE to make sure the mapping</div><div class='add'>+				 * doesn't collide with anything.</div><div class='add'>+				 */</div><div class='add'>+				if (alignment &gt; ELF_MIN_ALIGN) {</div><div class='add'>+					load_bias = elf_load(bprm-&gt;file, 0, elf_ppnt,</div><div class='add'>+							     elf_prot, elf_flags, total_size);</div><div class='add'>+					if (BAD_ADDR(load_bias)) {</div><div class='add'>+						retval = IS_ERR_VALUE(load_bias) ?</div><div class='add'>+							 PTR_ERR((void*)load_bias) : -EINVAL;</div><div class='add'>+						goto out_free_dentry;</div><div class='add'>+					}</div><div class='add'>+					vm_munmap(load_bias, total_size);</div><div class='add'>+					/* Adjust alignment as requested. */</div><div class='add'>+					if (alignment)</div><div class='add'>+						load_bias &amp;= ~(alignment - 1);</div><div class='add'>+					elf_flags |= MAP_FIXED_NOREPLACE;</div><div class='add'>+				} else</div><div class='add'>+					load_bias = 0;</div><div class='add'>+			}</div><div class='ctx'> </div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Since load_bias is used for all subsequent loading</div><div class='hunk'>@@ -1137,38 +1185,33 @@ out_free_interp:</div><div class='ctx'> 			load_bias = ELF_PAGESTART(load_bias - vaddr);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * Calculate the entire size of the ELF mapping (total_size).</div><div class='del'>-		 * (Note that load_addr_set is set to true later once the</div><div class='del'>-		 * initial mapping is performed.)</div><div class='del'>-		 */</div><div class='del'>-		if (!load_addr_set) {</div><div class='del'>-			total_size = total_mapping_size(elf_phdata,</div><div class='del'>-							elf_ex-&gt;e_phnum);</div><div class='del'>-			if (!total_size) {</div><div class='del'>-				retval = -EINVAL;</div><div class='del'>-				goto out_free_dentry;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		error = elf_map(bprm-&gt;file, load_bias + vaddr, elf_ppnt,</div><div class='add'>+		error = elf_load(bprm-&gt;file, load_bias + vaddr, elf_ppnt,</div><div class='ctx'> 				elf_prot, elf_flags, total_size);</div><div class='ctx'> 		if (BAD_ADDR(error)) {</div><div class='del'>-			retval = IS_ERR((void *)error) ?</div><div class='add'>+			retval = IS_ERR_VALUE(error) ?</div><div class='ctx'> 				PTR_ERR((void*)error) : -EINVAL;</div><div class='ctx'> 			goto out_free_dentry;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (!load_addr_set) {</div><div class='del'>-			load_addr_set = 1;</div><div class='del'>-			load_addr = (elf_ppnt-&gt;p_vaddr - elf_ppnt-&gt;p_offset);</div><div class='add'>+		if (first_pt_load) {</div><div class='add'>+			first_pt_load = 0;</div><div class='ctx'> 			if (elf_ex-&gt;e_type == ET_DYN) {</div><div class='ctx'> 				load_bias += error -</div><div class='ctx'> 				             ELF_PAGESTART(load_bias + vaddr);</div><div class='del'>-				load_addr += load_bias;</div><div class='ctx'> 				reloc_func_desc = load_bias;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Figure out which segment in the file contains the Program</div><div class='add'>+		 * Header table, and map to the associated memory address.</div><div class='add'>+		 */</div><div class='add'>+		if (elf_ppnt-&gt;p_offset &lt;= elf_ex-&gt;e_phoff &amp;&amp;</div><div class='add'>+		    elf_ex-&gt;e_phoff &lt; elf_ppnt-&gt;p_offset + elf_ppnt-&gt;p_filesz) {</div><div class='add'>+			phdr_addr = elf_ex-&gt;e_phoff - elf_ppnt-&gt;p_offset +</div><div class='add'>+				    elf_ppnt-&gt;p_vaddr;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		k = elf_ppnt-&gt;p_vaddr;</div><div class='ctx'> 		if ((elf_ppnt-&gt;p_flags &amp; PF_X) &amp;&amp; k &lt; start_code)</div><div class='ctx'> 			start_code = k;</div><div class='hunk'>@@ -1190,46 +1233,29 @@ out_free_interp:</div><div class='ctx'> </div><div class='ctx'> 		k = elf_ppnt-&gt;p_vaddr + elf_ppnt-&gt;p_filesz;</div><div class='ctx'> </div><div class='del'>-		if (k &gt; elf_bss)</div><div class='del'>-			elf_bss = k;</div><div class='ctx'> 		if ((elf_ppnt-&gt;p_flags &amp; PF_X) &amp;&amp; end_code &lt; k)</div><div class='ctx'> 			end_code = k;</div><div class='ctx'> 		if (end_data &lt; k)</div><div class='ctx'> 			end_data = k;</div><div class='ctx'> 		k = elf_ppnt-&gt;p_vaddr + elf_ppnt-&gt;p_memsz;</div><div class='del'>-		if (k &gt; elf_brk) {</div><div class='del'>-			bss_prot = elf_prot;</div><div class='add'>+		if (k &gt; elf_brk)</div><div class='ctx'> 			elf_brk = k;</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	e_entry = elf_ex-&gt;e_entry + load_bias;</div><div class='del'>-	elf_bss += load_bias;</div><div class='add'>+	phdr_addr += load_bias;</div><div class='ctx'> 	elf_brk += load_bias;</div><div class='ctx'> 	start_code += load_bias;</div><div class='ctx'> 	end_code += load_bias;</div><div class='ctx'> 	start_data += load_bias;</div><div class='ctx'> 	end_data += load_bias;</div><div class='ctx'> </div><div class='del'>-	/* Calling set_brk effectively mmaps the pages that we need</div><div class='del'>-	 * for the bss and break sections.  We must do this before</div><div class='del'>-	 * mapping in the interpreter, to make sure it doesn't wind</div><div class='del'>-	 * up getting placed where the bss needs to go.</div><div class='del'>-	 */</div><div class='del'>-	retval = set_brk(elf_bss, elf_brk, bss_prot);</div><div class='del'>-	if (retval)</div><div class='del'>-		goto out_free_dentry;</div><div class='del'>-	if (likely(elf_bss != elf_brk) &amp;&amp; unlikely(padzero(elf_bss))) {</div><div class='del'>-		retval = -EFAULT; /* Nobody gets to see this, but.. */</div><div class='del'>-		goto out_free_dentry;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	if (interpreter) {</div><div class='ctx'> 		elf_entry = load_elf_interp(interp_elf_ex,</div><div class='ctx'> 					    interpreter,</div><div class='ctx'> 					    load_bias, interp_elf_phdata,</div><div class='ctx'> 					    &amp;arch_state);</div><div class='del'>-		if (!IS_ERR((void *)elf_entry)) {</div><div class='add'>+		if (!IS_ERR_VALUE(elf_entry)) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * load_elf_interp() returns relocation</div><div class='ctx'> 			 * adjustment</div><div class='hunk'>@@ -1238,13 +1264,13 @@ out_free_interp:</div><div class='ctx'> 			elf_entry += interp_elf_ex-&gt;e_entry;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (BAD_ADDR(elf_entry)) {</div><div class='del'>-			retval = IS_ERR((void *)elf_entry) ?</div><div class='add'>+			retval = IS_ERR_VALUE(elf_entry) ?</div><div class='ctx'> 					(int)elf_entry : -EINVAL;</div><div class='ctx'> 			goto out_free_dentry;</div><div class='ctx'> 		}</div><div class='ctx'> 		reloc_func_desc = interp_load_addr;</div><div class='ctx'> </div><div class='del'>-		allow_write_access(interpreter);</div><div class='add'>+		exe_file_allow_write_access(interpreter);</div><div class='ctx'> 		fput(interpreter);</div><div class='ctx'> </div><div class='ctx'> 		kfree(interp_elf_ex);</div><div class='hunk'>@@ -1267,8 +1293,8 @@ out_free_interp:</div><div class='ctx'> 		goto out;</div><div class='ctx'> #endif /* ARCH_HAS_SETUP_ADDITIONAL_PAGES */</div><div class='ctx'> </div><div class='del'>-	retval = create_elf_tables(bprm, elf_ex,</div><div class='del'>-			  load_addr, interp_load_addr, e_entry);</div><div class='add'>+	retval = create_elf_tables(bprm, elf_ex, interp_load_addr,</div><div class='add'>+				   e_entry, phdr_addr);</div><div class='ctx'> 	if (retval &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -1279,24 +1305,46 @@ out_free_interp:</div><div class='ctx'> 	mm-&gt;end_data = end_data;</div><div class='ctx'> 	mm-&gt;start_stack = bprm-&gt;p;</div><div class='ctx'> </div><div class='del'>-	if ((current-&gt;flags &amp; PF_RANDOMIZE) &amp;&amp; (randomize_va_space &gt; 1)) {</div><div class='add'>+	elf_coredump_set_mm_eflags(mm, elf_ex-&gt;e_flags);</div><div class='add'>+</div><div class='add'>+	/**</div><div class='add'>+	 * DOC: "brk" handling</div><div class='add'>+	 *</div><div class='add'>+	 * For architectures with ELF randomization, when executing a</div><div class='add'>+	 * loader directly (i.e. static PIE: ET_DYN without PT_INTERP),</div><div class='add'>+	 * move the brk area out of the mmap region and into the unused</div><div class='add'>+	 * ELF_ET_DYN_BASE region. Since "brk" grows up it may collide</div><div class='add'>+	 * early with the stack growing down or other regions being put</div><div class='add'>+	 * into the mmap region by the kernel (e.g. vdso).</div><div class='add'>+	 *</div><div class='add'>+	 * In the CONFIG_COMPAT_BRK case, though, everything is turned</div><div class='add'>+	 * off because we're not allowed to move the brk at all.</div><div class='add'>+	 */</div><div class='add'>+	if (!IS_ENABLED(CONFIG_COMPAT_BRK) &amp;&amp;</div><div class='add'>+	    IS_ENABLED(CONFIG_ARCH_HAS_ELF_RANDOMIZE) &amp;&amp;</div><div class='add'>+	    elf_ex-&gt;e_type == ET_DYN &amp;&amp; !interpreter) {</div><div class='add'>+		elf_brk = ELF_ET_DYN_BASE;</div><div class='add'>+		/* This counts as moving the brk, so let brk(2) know. */</div><div class='add'>+		brk_moved = true;</div><div class='add'>+	}</div><div class='add'>+	mm-&gt;start_brk = mm-&gt;brk = ELF_PAGEALIGN(elf_brk);</div><div class='add'>+</div><div class='add'>+	if ((current-&gt;flags &amp; PF_RANDOMIZE) &amp;&amp; snapshot_randomize_va_space &gt; 1) {</div><div class='ctx'> 		/*</div><div class='del'>-		 * For architectures with ELF randomization, when executing</div><div class='del'>-		 * a loader directly (i.e. no interpreter listed in ELF</div><div class='del'>-		 * headers), move the brk area out of the mmap region</div><div class='del'>-		 * (since it grows up, and may collide early with the stack</div><div class='del'>-		 * growing down), and into the unused ELF_ET_DYN_BASE region.</div><div class='add'>+		 * If we didn't move the brk to ELF_ET_DYN_BASE (above),</div><div class='add'>+		 * leave a gap between .bss and brk.</div><div class='ctx'> 		 */</div><div class='del'>-		if (IS_ENABLED(CONFIG_ARCH_HAS_ELF_RANDOMIZE) &amp;&amp;</div><div class='del'>-		    elf_ex-&gt;e_type == ET_DYN &amp;&amp; !interpreter) {</div><div class='del'>-			mm-&gt;brk = mm-&gt;start_brk = ELF_ET_DYN_BASE;</div><div class='del'>-		}</div><div class='add'>+		if (!brk_moved)</div><div class='add'>+			mm-&gt;brk = mm-&gt;start_brk = mm-&gt;brk + PAGE_SIZE;</div><div class='ctx'> </div><div class='ctx'> 		mm-&gt;brk = mm-&gt;start_brk = arch_randomize_brk(mm);</div><div class='add'>+		brk_moved = true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> #ifdef compat_brk_randomized</div><div class='add'>+	if (brk_moved)</div><div class='ctx'> 		current-&gt;brk_randomized = 1;</div><div class='ctx'> #endif</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	if (current-&gt;personality &amp; MMAP_PAGE_ZERO) {</div><div class='ctx'> 		/* Why this, you ask???  Well SVr4 maps page 0 as read-only,</div><div class='hunk'>@@ -1305,6 +1353,11 @@ out_free_interp:</div><div class='ctx'> 		   emulate the SVr4 behavior. Sigh. */</div><div class='ctx'> 		error = vm_mmap(NULL, 0, PAGE_SIZE, PROT_READ | PROT_EXEC,</div><div class='ctx'> 				MAP_FIXED | MAP_PRIVATE, 0);</div><div class='add'>+</div><div class='add'>+		retval = do_mseal(0, PAGE_SIZE, 0);</div><div class='add'>+		if (retval)</div><div class='add'>+			pr_warn_ratelimited("pid=%d, couldn't seal address 0, ret=%d.\n",</div><div class='add'>+					    task_pid_nr(current), retval);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	regs = current_pt_regs();</div><div class='hunk'>@@ -1332,7 +1385,8 @@ out:</div><div class='ctx'> out_free_dentry:</div><div class='ctx'> 	kfree(interp_elf_ex);</div><div class='ctx'> 	kfree(interp_elf_phdata);</div><div class='del'>-	allow_write_access(interpreter);</div><div class='add'>+out_free_file:</div><div class='add'>+	exe_file_allow_write_access(interpreter);</div><div class='ctx'> 	if (interpreter)</div><div class='ctx'> 		fput(interpreter);</div><div class='ctx'> out_free_ph:</div><div class='hunk'>@@ -1340,91 +1394,6 @@ out_free_ph:</div><div class='ctx'> 	goto out;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_USELIB</div><div class='del'>-/* This is really simpleminded and specialized - we are loading an</div><div class='del'>-   a.out library that is given an ELF header. */</div><div class='del'>-static int load_elf_library(struct file *file)</div><div class='del'>-{</div><div class='del'>-	struct elf_phdr *elf_phdata;</div><div class='del'>-	struct elf_phdr *eppnt;</div><div class='del'>-	unsigned long elf_bss, bss, len;</div><div class='del'>-	int retval, error, i, j;</div><div class='del'>-	struct elfhdr elf_ex;</div><div class='del'>-</div><div class='del'>-	error = -ENOEXEC;</div><div class='del'>-	retval = elf_read(file, &amp;elf_ex, sizeof(elf_ex), 0);</div><div class='del'>-	if (retval &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	if (memcmp(elf_ex.e_ident, ELFMAG, SELFMAG) != 0)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	/* First of all, some simple consistency checks */</div><div class='del'>-	if (elf_ex.e_type != ET_EXEC || elf_ex.e_phnum &gt; 2 ||</div><div class='del'>-	    !elf_check_arch(&amp;elf_ex) || !file-&gt;f_op-&gt;mmap)</div><div class='del'>-		goto out;</div><div class='del'>-	if (elf_check_fdpic(&amp;elf_ex))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	/* Now read in all of the header information */</div><div class='del'>-</div><div class='del'>-	j = sizeof(struct elf_phdr) * elf_ex.e_phnum;</div><div class='del'>-	/* j &lt; ELF_MIN_ALIGN because elf_ex.e_phnum &lt;= 2 */</div><div class='del'>-</div><div class='del'>-	error = -ENOMEM;</div><div class='del'>-	elf_phdata = kmalloc(j, GFP_KERNEL);</div><div class='del'>-	if (!elf_phdata)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	eppnt = elf_phdata;</div><div class='del'>-	error = -ENOEXEC;</div><div class='del'>-	retval = elf_read(file, eppnt, j, elf_ex.e_phoff);</div><div class='del'>-	if (retval &lt; 0)</div><div class='del'>-		goto out_free_ph;</div><div class='del'>-</div><div class='del'>-	for (j = 0, i = 0; i&lt;elf_ex.e_phnum; i++)</div><div class='del'>-		if ((eppnt + i)-&gt;p_type == PT_LOAD)</div><div class='del'>-			j++;</div><div class='del'>-	if (j != 1)</div><div class='del'>-		goto out_free_ph;</div><div class='del'>-</div><div class='del'>-	while (eppnt-&gt;p_type != PT_LOAD)</div><div class='del'>-		eppnt++;</div><div class='del'>-</div><div class='del'>-	/* Now use mmap to map the library into memory. */</div><div class='del'>-	error = vm_mmap(file,</div><div class='del'>-			ELF_PAGESTART(eppnt-&gt;p_vaddr),</div><div class='del'>-			(eppnt-&gt;p_filesz +</div><div class='del'>-			 ELF_PAGEOFFSET(eppnt-&gt;p_vaddr)),</div><div class='del'>-			PROT_READ | PROT_WRITE | PROT_EXEC,</div><div class='del'>-			MAP_FIXED_NOREPLACE | MAP_PRIVATE,</div><div class='del'>-			(eppnt-&gt;p_offset -</div><div class='del'>-			 ELF_PAGEOFFSET(eppnt-&gt;p_vaddr)));</div><div class='del'>-	if (error != ELF_PAGESTART(eppnt-&gt;p_vaddr))</div><div class='del'>-		goto out_free_ph;</div><div class='del'>-</div><div class='del'>-	elf_bss = eppnt-&gt;p_vaddr + eppnt-&gt;p_filesz;</div><div class='del'>-	if (padzero(elf_bss)) {</div><div class='del'>-		error = -EFAULT;</div><div class='del'>-		goto out_free_ph;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	len = ELF_PAGEALIGN(eppnt-&gt;p_filesz + eppnt-&gt;p_vaddr);</div><div class='del'>-	bss = ELF_PAGEALIGN(eppnt-&gt;p_memsz + eppnt-&gt;p_vaddr);</div><div class='del'>-	if (bss &gt; len) {</div><div class='del'>-		error = vm_brk(len, bss - len);</div><div class='del'>-		if (error)</div><div class='del'>-			goto out_free_ph;</div><div class='del'>-	}</div><div class='del'>-	error = 0;</div><div class='del'>-</div><div class='del'>-out_free_ph:</div><div class='del'>-	kfree(elf_phdata);</div><div class='del'>-out:</div><div class='del'>-	return error;</div><div class='del'>-}</div><div class='del'>-#endif /* #ifdef CONFIG_USELIB */</div><div class='del'>-</div><div class='ctx'> #ifdef CONFIG_ELF_CORE</div><div class='ctx'> /*</div><div class='ctx'>  * ELF core dumper</div><div class='hunk'>@@ -1495,11 +1464,11 @@ static void fill_elf_note_phdr(struct elf_phdr *phdr, int sz, loff_t offset)</div><div class='ctx'> 	phdr-&gt;p_filesz = sz;</div><div class='ctx'> 	phdr-&gt;p_memsz = 0;</div><div class='ctx'> 	phdr-&gt;p_flags = 0;</div><div class='del'>-	phdr-&gt;p_align = 0;</div><div class='add'>+	phdr-&gt;p_align = 4;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void fill_note(struct memelfnote *note, const char *name, int type, </div><div class='del'>-		unsigned int sz, void *data)</div><div class='add'>+static void __fill_note(struct memelfnote *note, const char *name, int type,</div><div class='add'>+			unsigned int sz, void *data)</div><div class='ctx'> {</div><div class='ctx'> 	note-&gt;name = name;</div><div class='ctx'> 	note-&gt;type = type;</div><div class='hunk'>@@ -1507,6 +1476,9 @@ static void fill_note(struct memelfnote *note, const char *name, int type,</div><div class='ctx'> 	note-&gt;data = data;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#define fill_note(note, type, sz, data) \</div><div class='add'>+	__fill_note(note, NN_ ## type, NT_ ## type, sz, data)</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * fill up all the fields in prstatus from the given task struct, except</div><div class='ctx'>  * registers which need to be filled up separately.</div><div class='hunk'>@@ -1585,7 +1557,7 @@ static int fill_psinfo(struct elf_prpsinfo *psinfo, struct task_struct *p,</div><div class='ctx'> 	SET_UID(psinfo-&gt;pr_uid, from_kuid_munged(cred-&gt;user_ns, cred-&gt;uid));</div><div class='ctx'> 	SET_GID(psinfo-&gt;pr_gid, from_kgid_munged(cred-&gt;user_ns, cred-&gt;gid));</div><div class='ctx'> 	rcu_read_unlock();</div><div class='del'>-	strncpy(psinfo-&gt;pr_fname, p-&gt;comm, sizeof(psinfo-&gt;pr_fname));</div><div class='add'>+	get_task_comm(psinfo-&gt;pr_fname, p);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -1597,17 +1569,16 @@ static void fill_auxv_note(struct memelfnote *note, struct mm_struct *mm)</div><div class='ctx'> 	do</div><div class='ctx'> 		i += 2;</div><div class='ctx'> 	while (auxv[i - 2] != AT_NULL);</div><div class='del'>-	fill_note(note, "CORE", NT_AUXV, i * sizeof(elf_addr_t), auxv);</div><div class='add'>+	fill_note(note, AUXV, i * sizeof(elf_addr_t), auxv);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void fill_siginfo_note(struct memelfnote *note, user_siginfo_t *csigdata,</div><div class='ctx'> 		const kernel_siginfo_t *siginfo)</div><div class='ctx'> {</div><div class='ctx'> 	copy_siginfo_to_external(csigdata, siginfo);</div><div class='del'>-	fill_note(note, "CORE", NT_SIGINFO, sizeof(*csigdata), csigdata);</div><div class='add'>+	fill_note(note, SIGINFO, sizeof(*csigdata), csigdata);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#define MAX_FILE_NOTE_SIZE (4*1024*1024)</div><div class='ctx'> /*</div><div class='ctx'>  * Format of NT_FILE note:</div><div class='ctx'>  *</div><div class='hunk'>@@ -1619,25 +1590,28 @@ static void fill_siginfo_note(struct memelfnote *note, user_siginfo_t *csigdata,</div><div class='ctx'>  *   long file_ofs</div><div class='ctx'>  * followed by COUNT filenames in ASCII: "FILE1" NUL "FILE2" NUL...</div><div class='ctx'>  */</div><div class='del'>-static int fill_files_note(struct memelfnote *note)</div><div class='add'>+static int fill_files_note(struct memelfnote *note, struct coredump_params *cprm)</div><div class='ctx'> {</div><div class='del'>-	struct mm_struct *mm = current-&gt;mm;</div><div class='del'>-	struct vm_area_struct *vma;</div><div class='ctx'> 	unsigned count, size, names_ofs, remaining, n;</div><div class='ctx'> 	user_long_t *data;</div><div class='ctx'> 	user_long_t *start_end_ofs;</div><div class='ctx'> 	char *name_base, *name_curpos;</div><div class='add'>+	int i;</div><div class='ctx'> </div><div class='ctx'> 	/* *Estimated* file count and total data size needed */</div><div class='del'>-	count = mm-&gt;map_count;</div><div class='add'>+	count = cprm-&gt;vma_count;</div><div class='ctx'> 	if (count &gt; UINT_MAX / 64)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	size = count * 64;</div><div class='ctx'> </div><div class='ctx'> 	names_ofs = (2 + 3 * count) * sizeof(data[0]);</div><div class='ctx'>  alloc:</div><div class='del'>-	if (size &gt;= MAX_FILE_NOTE_SIZE) /* paranoia check */</div><div class='add'>+	/* paranoia check */</div><div class='add'>+	if (size &gt;= core_file_note_size_limit) {</div><div class='add'>+		pr_warn_once("coredump Note size too large: %u (does kernel.core_file_note_size_limit sysctl need adjustment?\n",</div><div class='add'>+			      size);</div><div class='ctx'> 		return -EINVAL;</div><div class='add'>+	}</div><div class='ctx'> 	size = round_up(size, PAGE_SIZE);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * "size" can be 0 here legitimately.</div><div class='hunk'>@@ -1651,11 +1625,12 @@ static int fill_files_note(struct memelfnote *note)</div><div class='ctx'> 	name_base = name_curpos = ((char *)data) + names_ofs;</div><div class='ctx'> 	remaining = size - names_ofs;</div><div class='ctx'> 	count = 0;</div><div class='del'>-	for (vma = mm-&gt;mmap; vma != NULL; vma = vma-&gt;vm_next) {</div><div class='add'>+	for (i = 0; i &lt; cprm-&gt;vma_count; i++) {</div><div class='add'>+		struct core_vma_metadata *m = &amp;cprm-&gt;vma_meta[i];</div><div class='ctx'> 		struct file *file;</div><div class='ctx'> 		const char *filename;</div><div class='ctx'> </div><div class='del'>-		file = vma-&gt;vm_file;</div><div class='add'>+		file = m-&gt;file;</div><div class='ctx'> 		if (!file)</div><div class='ctx'> 			continue;</div><div class='ctx'> 		filename = file_path(file, name_curpos, remaining);</div><div class='hunk'>@@ -1675,9 +1650,9 @@ static int fill_files_note(struct memelfnote *note)</div><div class='ctx'> 		memmove(name_curpos, filename, n);</div><div class='ctx'> 		name_curpos += n;</div><div class='ctx'> </div><div class='del'>-		*start_end_ofs++ = vma-&gt;vm_start;</div><div class='del'>-		*start_end_ofs++ = vma-&gt;vm_end;</div><div class='del'>-		*start_end_ofs++ = vma-&gt;vm_pgoff;</div><div class='add'>+		*start_end_ofs++ = m-&gt;start;</div><div class='add'>+		*start_end_ofs++ = m-&gt;end;</div><div class='add'>+		*start_end_ofs++ = m-&gt;pgoff;</div><div class='ctx'> 		count++;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1688,7 +1663,7 @@ static int fill_files_note(struct memelfnote *note)</div><div class='ctx'> 	 * Count usually is less than mm-&gt;map_count,</div><div class='ctx'> 	 * we need to move filenames down.</div><div class='ctx'> 	 */</div><div class='del'>-	n = mm-&gt;map_count - count;</div><div class='add'>+	n = cprm-&gt;vma_count - count;</div><div class='ctx'> 	if (n != 0) {</div><div class='ctx'> 		unsigned shift_bytes = n * 3 * sizeof(data[0]);</div><div class='ctx'> 		memmove(name_base - shift_bytes, name_base,</div><div class='hunk'>@@ -1697,11 +1672,10 @@ static int fill_files_note(struct memelfnote *note)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	size = name_curpos - (char *)data;</div><div class='del'>-	fill_note(note, "CORE", NT_FILE, size, data);</div><div class='add'>+	fill_note(note, FILE, size, data);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#ifdef CORE_DUMP_USE_REGSET</div><div class='ctx'> #include &lt;linux/regset.h&gt;</div><div class='ctx'> </div><div class='ctx'> struct elf_thread_core_info {</div><div class='hunk'>@@ -1722,6 +1696,7 @@ struct elf_note_info {</div><div class='ctx'> 	int thread_notes;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+#ifdef CORE_DUMP_USE_REGSET</div><div class='ctx'> /*</div><div class='ctx'>  * When a regset has a writeback hook, we call it on each thread before</div><div class='ctx'>  * dumping user memory.  On register window machines, this makes sure the</div><div class='hunk'>@@ -1744,34 +1719,34 @@ static void do_thread_regset_writeback(struct task_struct *task,</div><div class='ctx'> </div><div class='ctx'> static int fill_thread_core_info(struct elf_thread_core_info *t,</div><div class='ctx'> 				 const struct user_regset_view *view,</div><div class='del'>-				 long signr, size_t *total)</div><div class='add'>+				 long signr, struct elf_note_info *info)</div><div class='ctx'> {</div><div class='del'>-	unsigned int i;</div><div class='add'>+	unsigned int note_iter, view_iter;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * NT_PRSTATUS is the one special case, because the regset data</div><div class='ctx'> 	 * goes into the pr_reg field inside the note contents, rather</div><div class='del'>-	 * than being the whole note contents.  We fill the reset in here.</div><div class='add'>+	 * than being the whole note contents.  We fill the regset in here.</div><div class='ctx'> 	 * We assume that regset 0 is NT_PRSTATUS.</div><div class='ctx'> 	 */</div><div class='ctx'> 	fill_prstatus(&amp;t-&gt;prstatus.common, t-&gt;task, signr);</div><div class='ctx'> 	regset_get(t-&gt;task, &amp;view-&gt;regsets[0],</div><div class='ctx'> 		   sizeof(t-&gt;prstatus.pr_reg), &amp;t-&gt;prstatus.pr_reg);</div><div class='ctx'> </div><div class='del'>-	fill_note(&amp;t-&gt;notes[0], "CORE", NT_PRSTATUS,</div><div class='del'>-		  PRSTATUS_SIZE, &amp;t-&gt;prstatus);</div><div class='del'>-	*total += notesize(&amp;t-&gt;notes[0]);</div><div class='add'>+	fill_note(&amp;t-&gt;notes[0], PRSTATUS, PRSTATUS_SIZE, &amp;t-&gt;prstatus);</div><div class='add'>+	info-&gt;size += notesize(&amp;t-&gt;notes[0]);</div><div class='ctx'> </div><div class='ctx'> 	do_thread_regset_writeback(t-&gt;task, &amp;view-&gt;regsets[0]);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Each other regset might generate a note too.  For each regset</div><div class='del'>-	 * that has no core_note_type or is inactive, we leave t-&gt;notes[i]</div><div class='del'>-	 * all zero and we'll know to skip writing it later.</div><div class='add'>+	 * that has no core_note_type or is inactive, skip it.</div><div class='ctx'> 	 */</div><div class='del'>-	for (i = 1; i &lt; view-&gt;n; ++i) {</div><div class='del'>-		const struct user_regset *regset = &amp;view-&gt;regsets[i];</div><div class='add'>+	note_iter = 1;</div><div class='add'>+	for (view_iter = 1; view_iter &lt; view-&gt;n; ++view_iter) {</div><div class='add'>+		const struct user_regset *regset = &amp;view-&gt;regsets[view_iter];</div><div class='ctx'> 		int note_type = regset-&gt;core_note_type;</div><div class='add'>+		const char *note_name = regset-&gt;core_note_name;</div><div class='ctx'> 		bool is_fpreg = note_type == NT_PRFPREG;</div><div class='ctx'> 		void *data;</div><div class='ctx'> 		int ret;</div><div class='hunk'>@@ -1786,45 +1761,82 @@ static int fill_thread_core_info(struct elf_thread_core_info *t,</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='add'>+		if (WARN_ON_ONCE(note_iter &gt;= info-&gt;thread_notes))</div><div class='add'>+			break;</div><div class='add'>+</div><div class='ctx'> 		if (is_fpreg)</div><div class='ctx'> 			SET_PR_FPVALID(&amp;t-&gt;prstatus);</div><div class='ctx'> </div><div class='del'>-		fill_note(&amp;t-&gt;notes[i], is_fpreg ? "CORE" : "LINUX",</div><div class='del'>-			  note_type, ret, data);</div><div class='add'>+		/* There should be a note name, but if not, guess: */</div><div class='add'>+		if (WARN_ON_ONCE(!note_name))</div><div class='add'>+			note_name = "LINUX";</div><div class='add'>+		else</div><div class='add'>+			/* Warn on non-legacy-compatible names, for now. */</div><div class='add'>+			WARN_ON_ONCE(strcmp(note_name,</div><div class='add'>+					    is_fpreg ? "CORE" : "LINUX"));</div><div class='add'>+</div><div class='add'>+		__fill_note(&amp;t-&gt;notes[note_iter], note_name, note_type,</div><div class='add'>+			    ret, data);</div><div class='ctx'> </div><div class='del'>-		*total += notesize(&amp;t-&gt;notes[i]);</div><div class='add'>+		info-&gt;size += notesize(&amp;t-&gt;notes[note_iter]);</div><div class='add'>+		note_iter++;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return 1;</div><div class='ctx'> }</div><div class='add'>+#else</div><div class='add'>+static int fill_thread_core_info(struct elf_thread_core_info *t,</div><div class='add'>+				 const struct user_regset_view *view,</div><div class='add'>+				 long signr, struct elf_note_info *info)</div><div class='add'>+{</div><div class='add'>+	struct task_struct *p = t-&gt;task;</div><div class='add'>+	elf_fpregset_t *fpu;</div><div class='add'>+</div><div class='add'>+	fill_prstatus(&amp;t-&gt;prstatus.common, p, signr);</div><div class='add'>+	elf_core_copy_task_regs(p, &amp;t-&gt;prstatus.pr_reg);</div><div class='add'>+</div><div class='add'>+	fill_note(&amp;t-&gt;notes[0], PRSTATUS, sizeof(t-&gt;prstatus), &amp;t-&gt;prstatus);</div><div class='add'>+	info-&gt;size += notesize(&amp;t-&gt;notes[0]);</div><div class='add'>+</div><div class='add'>+	fpu = kzalloc(sizeof(elf_fpregset_t), GFP_KERNEL);</div><div class='add'>+	if (!fpu || !elf_core_copy_task_fpregs(p, fpu)) {</div><div class='add'>+		kfree(fpu);</div><div class='add'>+		return 1;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	t-&gt;prstatus.pr_fpvalid = 1;</div><div class='add'>+	fill_note(&amp;t-&gt;notes[1], PRFPREG, sizeof(*fpu), fpu);</div><div class='add'>+	info-&gt;size += notesize(&amp;t-&gt;notes[1]);</div><div class='add'>+</div><div class='add'>+	return 1;</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='ctx'> static int fill_note_info(struct elfhdr *elf, int phdrs,</div><div class='ctx'> 			  struct elf_note_info *info,</div><div class='del'>-			  const kernel_siginfo_t *siginfo, struct pt_regs *regs)</div><div class='add'>+			  struct coredump_params *cprm)</div><div class='ctx'> {</div><div class='ctx'> 	struct task_struct *dump_task = current;</div><div class='del'>-	const struct user_regset_view *view = task_user_regset_view(dump_task);</div><div class='add'>+	const struct user_regset_view *view;</div><div class='ctx'> 	struct elf_thread_core_info *t;</div><div class='ctx'> 	struct elf_prpsinfo *psinfo;</div><div class='ctx'> 	struct core_thread *ct;</div><div class='del'>-	unsigned int i;</div><div class='del'>-</div><div class='del'>-	info-&gt;size = 0;</div><div class='del'>-	info-&gt;thread = NULL;</div><div class='add'>+	u16 machine;</div><div class='add'>+	u32 flags;</div><div class='ctx'> </div><div class='ctx'> 	psinfo = kmalloc(sizeof(*psinfo), GFP_KERNEL);</div><div class='del'>-	if (psinfo == NULL) {</div><div class='del'>-		info-&gt;psinfo.data = NULL; /* So we don't free this wrongly */</div><div class='add'>+	if (!psinfo)</div><div class='ctx'> 		return 0;</div><div class='del'>-	}</div><div class='add'>+	fill_note(&amp;info-&gt;psinfo, PRPSINFO, sizeof(*psinfo), psinfo);</div><div class='ctx'> </div><div class='del'>-	fill_note(&amp;info-&gt;psinfo, "CORE", NT_PRPSINFO, sizeof(*psinfo), psinfo);</div><div class='add'>+#ifdef CORE_DUMP_USE_REGSET</div><div class='add'>+	view = task_user_regset_view(dump_task);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Figure out how many notes we're going to need for each thread.</div><div class='ctx'> 	 */</div><div class='ctx'> 	info-&gt;thread_notes = 0;</div><div class='del'>-	for (i = 0; i &lt; view-&gt;n; ++i)</div><div class='add'>+	for (int i = 0; i &lt; view-&gt;n; ++i)</div><div class='ctx'> 		if (view-&gt;regsets[i].core_note_type != 0)</div><div class='ctx'> 			++info-&gt;thread_notes;</div><div class='ctx'> </div><div class='hunk'>@@ -1838,41 +1850,51 @@ static int fill_note_info(struct elfhdr *elf, int phdrs,</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	machine = view-&gt;e_machine;</div><div class='add'>+	flags = view-&gt;e_flags;</div><div class='add'>+#else</div><div class='add'>+	view = NULL;</div><div class='add'>+	info-&gt;thread_notes = 2;</div><div class='add'>+	machine = ELF_ARCH;</div><div class='add'>+	flags = ELF_CORE_EFLAGS;</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Override ELF e_flags with value taken from process,</div><div class='add'>+	 * if arch needs that.</div><div class='add'>+	 */</div><div class='add'>+	flags = elf_coredump_get_mm_eflags(dump_task-&gt;mm, flags);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Initialize the ELF file header.</div><div class='ctx'> 	 */</div><div class='del'>-	fill_elf_header(elf, phdrs,</div><div class='del'>-			view-&gt;e_machine, view-&gt;e_flags);</div><div class='add'>+	fill_elf_header(elf, phdrs, machine, flags);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Allocate a structure for each thread.</div><div class='ctx'> 	 */</div><div class='del'>-	for (ct = &amp;dump_task-&gt;signal-&gt;core_state-&gt;dumper; ct; ct = ct-&gt;next) {</div><div class='del'>-		t = kzalloc(offsetof(struct elf_thread_core_info,</div><div class='del'>-				     notes[info-&gt;thread_notes]),</div><div class='add'>+	info-&gt;thread = kzalloc(struct_size(info-&gt;thread, notes, info-&gt;thread_notes),</div><div class='add'>+			       GFP_KERNEL);</div><div class='add'>+	if (unlikely(!info-&gt;thread))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	info-&gt;thread-&gt;task = dump_task;</div><div class='add'>+	for (ct = dump_task-&gt;signal-&gt;core_state-&gt;dumper.next; ct; ct = ct-&gt;next) {</div><div class='add'>+		t = kzalloc(struct_size(t, notes, info-&gt;thread_notes),</div><div class='ctx'> 			    GFP_KERNEL);</div><div class='ctx'> 		if (unlikely(!t))</div><div class='ctx'> 			return 0;</div><div class='ctx'> </div><div class='ctx'> 		t-&gt;task = ct-&gt;task;</div><div class='del'>-		if (ct-&gt;task == dump_task || !info-&gt;thread) {</div><div class='del'>-			t-&gt;next = info-&gt;thread;</div><div class='del'>-			info-&gt;thread = t;</div><div class='del'>-		} else {</div><div class='del'>-			/*</div><div class='del'>-			 * Make sure to keep the original task at</div><div class='del'>-			 * the head of the list.</div><div class='del'>-			 */</div><div class='del'>-			t-&gt;next = info-&gt;thread-&gt;next;</div><div class='del'>-			info-&gt;thread-&gt;next = t;</div><div class='del'>-		}</div><div class='add'>+		t-&gt;next = info-&gt;thread-&gt;next;</div><div class='add'>+		info-&gt;thread-&gt;next = t;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Now fill in each thread's information.</div><div class='ctx'> 	 */</div><div class='ctx'> 	for (t = info-&gt;thread; t != NULL; t = t-&gt;next)</div><div class='del'>-		if (!fill_thread_core_info(t, view, siginfo-&gt;si_signo, &amp;info-&gt;size))</div><div class='add'>+		if (!fill_thread_core_info(t, view, cprm-&gt;siginfo-&gt;si_signo, info))</div><div class='ctx'> 			return 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1881,23 +1903,18 @@ static int fill_note_info(struct elfhdr *elf, int phdrs,</div><div class='ctx'> 	fill_psinfo(psinfo, dump_task-&gt;group_leader, dump_task-&gt;mm);</div><div class='ctx'> 	info-&gt;size += notesize(&amp;info-&gt;psinfo);</div><div class='ctx'> </div><div class='del'>-	fill_siginfo_note(&amp;info-&gt;signote, &amp;info-&gt;csigdata, siginfo);</div><div class='add'>+	fill_siginfo_note(&amp;info-&gt;signote, &amp;info-&gt;csigdata, cprm-&gt;siginfo);</div><div class='ctx'> 	info-&gt;size += notesize(&amp;info-&gt;signote);</div><div class='ctx'> </div><div class='ctx'> 	fill_auxv_note(&amp;info-&gt;auxv, current-&gt;mm);</div><div class='ctx'> 	info-&gt;size += notesize(&amp;info-&gt;auxv);</div><div class='ctx'> </div><div class='del'>-	if (fill_files_note(&amp;info-&gt;files) == 0)</div><div class='add'>+	if (fill_files_note(&amp;info-&gt;files, cprm) == 0)</div><div class='ctx'> 		info-&gt;size += notesize(&amp;info-&gt;files);</div><div class='ctx'> </div><div class='ctx'> 	return 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static size_t get_note_info_size(struct elf_note_info *info)</div><div class='del'>-{</div><div class='del'>-	return info-&gt;size;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Write all the notes for each thread.  When writing the first thread, the</div><div class='ctx'>  * process-wide notes are interleaved after the first thread-specific note.</div><div class='hunk'>@@ -1945,204 +1962,13 @@ static void free_note_info(struct elf_note_info *info)</div><div class='ctx'> 		threads = t-&gt;next;</div><div class='ctx'> 		WARN_ON(t-&gt;notes[0].data &amp;&amp; t-&gt;notes[0].data != &amp;t-&gt;prstatus);</div><div class='ctx'> 		for (i = 1; i &lt; info-&gt;thread_notes; ++i)</div><div class='del'>-			kfree(t-&gt;notes[i].data);</div><div class='add'>+			kvfree(t-&gt;notes[i].data);</div><div class='ctx'> 		kfree(t);</div><div class='ctx'> 	}</div><div class='ctx'> 	kfree(info-&gt;psinfo.data);</div><div class='ctx'> 	kvfree(info-&gt;files.data);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#else</div><div class='del'>-</div><div class='del'>-/* Here is the structure in which status of each thread is captured. */</div><div class='del'>-struct elf_thread_status</div><div class='del'>-{</div><div class='del'>-	struct list_head list;</div><div class='del'>-	struct elf_prstatus prstatus;	/* NT_PRSTATUS */</div><div class='del'>-	elf_fpregset_t fpu;		/* NT_PRFPREG */</div><div class='del'>-	struct task_struct *thread;</div><div class='del'>-	struct memelfnote notes[3];</div><div class='del'>-	int num_notes;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * In order to add the specific thread information for the elf file format,</div><div class='del'>- * we need to keep a linked list of every threads pr_status and then create</div><div class='del'>- * a single section for them in the final core file.</div><div class='del'>- */</div><div class='del'>-static int elf_dump_thread_status(long signr, struct elf_thread_status *t)</div><div class='del'>-{</div><div class='del'>-	int sz = 0;</div><div class='del'>-	struct task_struct *p = t-&gt;thread;</div><div class='del'>-	t-&gt;num_notes = 0;</div><div class='del'>-</div><div class='del'>-	fill_prstatus(&amp;t-&gt;prstatus.common, p, signr);</div><div class='del'>-	elf_core_copy_task_regs(p, &amp;t-&gt;prstatus.pr_reg);	</div><div class='del'>-	</div><div class='del'>-	fill_note(&amp;t-&gt;notes[0], "CORE", NT_PRSTATUS, sizeof(t-&gt;prstatus),</div><div class='del'>-		  &amp;(t-&gt;prstatus));</div><div class='del'>-	t-&gt;num_notes++;</div><div class='del'>-	sz += notesize(&amp;t-&gt;notes[0]);</div><div class='del'>-</div><div class='del'>-	if ((t-&gt;prstatus.pr_fpvalid = elf_core_copy_task_fpregs(p, NULL,</div><div class='del'>-								&amp;t-&gt;fpu))) {</div><div class='del'>-		fill_note(&amp;t-&gt;notes[1], "CORE", NT_PRFPREG, sizeof(t-&gt;fpu),</div><div class='del'>-			  &amp;(t-&gt;fpu));</div><div class='del'>-		t-&gt;num_notes++;</div><div class='del'>-		sz += notesize(&amp;t-&gt;notes[1]);</div><div class='del'>-	}</div><div class='del'>-	return sz;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct elf_note_info {</div><div class='del'>-	struct memelfnote *notes;</div><div class='del'>-	struct memelfnote *notes_files;</div><div class='del'>-	struct elf_prstatus *prstatus;	/* NT_PRSTATUS */</div><div class='del'>-	struct elf_prpsinfo *psinfo;	/* NT_PRPSINFO */</div><div class='del'>-	struct list_head thread_list;</div><div class='del'>-	elf_fpregset_t *fpu;</div><div class='del'>-	user_siginfo_t csigdata;</div><div class='del'>-	int thread_status_size;</div><div class='del'>-	int numnote;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static int elf_note_info_init(struct elf_note_info *info)</div><div class='del'>-{</div><div class='del'>-	memset(info, 0, sizeof(*info));</div><div class='del'>-	INIT_LIST_HEAD(&amp;info-&gt;thread_list);</div><div class='del'>-</div><div class='del'>-	/* Allocate space for ELF notes */</div><div class='del'>-	info-&gt;notes = kmalloc_array(8, sizeof(struct memelfnote), GFP_KERNEL);</div><div class='del'>-	if (!info-&gt;notes)</div><div class='del'>-		return 0;</div><div class='del'>-	info-&gt;psinfo = kmalloc(sizeof(*info-&gt;psinfo), GFP_KERNEL);</div><div class='del'>-	if (!info-&gt;psinfo)</div><div class='del'>-		return 0;</div><div class='del'>-	info-&gt;prstatus = kmalloc(sizeof(*info-&gt;prstatus), GFP_KERNEL);</div><div class='del'>-	if (!info-&gt;prstatus)</div><div class='del'>-		return 0;</div><div class='del'>-	info-&gt;fpu = kmalloc(sizeof(*info-&gt;fpu), GFP_KERNEL);</div><div class='del'>-	if (!info-&gt;fpu)</div><div class='del'>-		return 0;</div><div class='del'>-	return 1;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int fill_note_info(struct elfhdr *elf, int phdrs,</div><div class='del'>-			  struct elf_note_info *info,</div><div class='del'>-			  const kernel_siginfo_t *siginfo, struct pt_regs *regs)</div><div class='del'>-{</div><div class='del'>-	struct core_thread *ct;</div><div class='del'>-	struct elf_thread_status *ets;</div><div class='del'>-</div><div class='del'>-	if (!elf_note_info_init(info))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	for (ct = current-&gt;signal-&gt;core_state-&gt;dumper.next;</div><div class='del'>-					ct; ct = ct-&gt;next) {</div><div class='del'>-		ets = kzalloc(sizeof(*ets), GFP_KERNEL);</div><div class='del'>-		if (!ets)</div><div class='del'>-			return 0;</div><div class='del'>-</div><div class='del'>-		ets-&gt;thread = ct-&gt;task;</div><div class='del'>-		list_add(&amp;ets-&gt;list, &amp;info-&gt;thread_list);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(ets, &amp;info-&gt;thread_list, list) {</div><div class='del'>-		int sz;</div><div class='del'>-</div><div class='del'>-		sz = elf_dump_thread_status(siginfo-&gt;si_signo, ets);</div><div class='del'>-		info-&gt;thread_status_size += sz;</div><div class='del'>-	}</div><div class='del'>-	/* now collect the dump for the current */</div><div class='del'>-	memset(info-&gt;prstatus, 0, sizeof(*info-&gt;prstatus));</div><div class='del'>-	fill_prstatus(&amp;info-&gt;prstatus-&gt;common, current, siginfo-&gt;si_signo);</div><div class='del'>-	elf_core_copy_regs(&amp;info-&gt;prstatus-&gt;pr_reg, regs);</div><div class='del'>-</div><div class='del'>-	/* Set up header */</div><div class='del'>-	fill_elf_header(elf, phdrs, ELF_ARCH, ELF_CORE_EFLAGS);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Set up the notes in similar form to SVR4 core dumps made</div><div class='del'>-	 * with info from their /proc.</div><div class='del'>-	 */</div><div class='del'>-</div><div class='del'>-	fill_note(info-&gt;notes + 0, "CORE", NT_PRSTATUS,</div><div class='del'>-		  sizeof(*info-&gt;prstatus), info-&gt;prstatus);</div><div class='del'>-	fill_psinfo(info-&gt;psinfo, current-&gt;group_leader, current-&gt;mm);</div><div class='del'>-	fill_note(info-&gt;notes + 1, "CORE", NT_PRPSINFO,</div><div class='del'>-		  sizeof(*info-&gt;psinfo), info-&gt;psinfo);</div><div class='del'>-</div><div class='del'>-	fill_siginfo_note(info-&gt;notes + 2, &amp;info-&gt;csigdata, siginfo);</div><div class='del'>-	fill_auxv_note(info-&gt;notes + 3, current-&gt;mm);</div><div class='del'>-	info-&gt;numnote = 4;</div><div class='del'>-</div><div class='del'>-	if (fill_files_note(info-&gt;notes + info-&gt;numnote) == 0) {</div><div class='del'>-		info-&gt;notes_files = info-&gt;notes + info-&gt;numnote;</div><div class='del'>-		info-&gt;numnote++;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Try to dump the FPU. */</div><div class='del'>-	info-&gt;prstatus-&gt;pr_fpvalid = elf_core_copy_task_fpregs(current, regs,</div><div class='del'>-							       info-&gt;fpu);</div><div class='del'>-	if (info-&gt;prstatus-&gt;pr_fpvalid)</div><div class='del'>-		fill_note(info-&gt;notes + info-&gt;numnote++,</div><div class='del'>-			  "CORE", NT_PRFPREG, sizeof(*info-&gt;fpu), info-&gt;fpu);</div><div class='del'>-	return 1;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static size_t get_note_info_size(struct elf_note_info *info)</div><div class='del'>-{</div><div class='del'>-	int sz = 0;</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; info-&gt;numnote; i++)</div><div class='del'>-		sz += notesize(info-&gt;notes + i);</div><div class='del'>-</div><div class='del'>-	sz += info-&gt;thread_status_size;</div><div class='del'>-</div><div class='del'>-	return sz;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int write_note_info(struct elf_note_info *info,</div><div class='del'>-			   struct coredump_params *cprm)</div><div class='del'>-{</div><div class='del'>-	struct elf_thread_status *ets;</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; info-&gt;numnote; i++)</div><div class='del'>-		if (!writenote(info-&gt;notes + i, cprm))</div><div class='del'>-			return 0;</div><div class='del'>-</div><div class='del'>-	/* write out the thread status notes section */</div><div class='del'>-	list_for_each_entry(ets, &amp;info-&gt;thread_list, list) {</div><div class='del'>-		for (i = 0; i &lt; ets-&gt;num_notes; i++)</div><div class='del'>-			if (!writenote(&amp;ets-&gt;notes[i], cprm))</div><div class='del'>-				return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return 1;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void free_note_info(struct elf_note_info *info)</div><div class='del'>-{</div><div class='del'>-	while (!list_empty(&amp;info-&gt;thread_list)) {</div><div class='del'>-		struct list_head *tmp = info-&gt;thread_list.next;</div><div class='del'>-		list_del(tmp);</div><div class='del'>-		kfree(list_entry(tmp, struct elf_thread_status, list));</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Free data possibly allocated by fill_files_note(): */</div><div class='del'>-	if (info-&gt;notes_files)</div><div class='del'>-		kvfree(info-&gt;notes_files-&gt;data);</div><div class='del'>-</div><div class='del'>-	kfree(info-&gt;prstatus);</div><div class='del'>-	kfree(info-&gt;psinfo);</div><div class='del'>-	kfree(info-&gt;notes);</div><div class='del'>-	kfree(info-&gt;fpu);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#endif</div><div class='del'>-</div><div class='ctx'> static void fill_extnum_info(struct elfhdr *elf, struct elf_shdr *shdr4extnum,</div><div class='ctx'> 			     elf_addr_t e_shoff, int segs)</div><div class='ctx'> {</div><div class='hunk'>@@ -2169,8 +1995,7 @@ static void fill_extnum_info(struct elfhdr *elf, struct elf_shdr *shdr4extnum,</div><div class='ctx'> static int elf_core_dump(struct coredump_params *cprm)</div><div class='ctx'> {</div><div class='ctx'> 	int has_dumped = 0;</div><div class='del'>-	int vma_count, segs, i;</div><div class='del'>-	size_t vma_data_size;</div><div class='add'>+	int segs, i;</div><div class='ctx'> 	struct elfhdr elf;</div><div class='ctx'> 	loff_t offset = 0, dataoff;</div><div class='ctx'> 	struct elf_note_info info = { };</div><div class='hunk'>@@ -2178,16 +2003,12 @@ static int elf_core_dump(struct coredump_params *cprm)</div><div class='ctx'> 	struct elf_shdr *shdr4extnum = NULL;</div><div class='ctx'> 	Elf_Half e_phnum;</div><div class='ctx'> 	elf_addr_t e_shoff;</div><div class='del'>-	struct core_vma_metadata *vma_meta;</div><div class='del'>-</div><div class='del'>-	if (dump_vma_snapshot(cprm, &amp;vma_count, &amp;vma_meta, &amp;vma_data_size))</div><div class='del'>-		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The number of segs are recored into ELF header as 16bit value.</div><div class='ctx'> 	 * Please check DEFAULT_MAX_MAP_COUNT definition when you modify here.</div><div class='ctx'> 	 */</div><div class='del'>-	segs = vma_count + elf_core_extra_phdrs();</div><div class='add'>+	segs = cprm-&gt;vma_count + elf_core_extra_phdrs(cprm);</div><div class='ctx'> </div><div class='ctx'> 	/* for notes section */</div><div class='ctx'> 	segs++;</div><div class='hunk'>@@ -2201,19 +2022,19 @@ static int elf_core_dump(struct coredump_params *cprm)</div><div class='ctx'> 	 * Collect all the non-memory information about the process for the</div><div class='ctx'> 	 * notes.  This also sets up the file header.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!fill_note_info(&amp;elf, e_phnum, &amp;info, cprm-&gt;siginfo, cprm-&gt;regs))</div><div class='add'>+	if (!fill_note_info(&amp;elf, e_phnum, &amp;info, cprm))</div><div class='ctx'> 		goto end_coredump;</div><div class='ctx'> </div><div class='ctx'> 	has_dumped = 1;</div><div class='ctx'> </div><div class='del'>-	offset += sizeof(elf);				/* Elf header */</div><div class='add'>+	offset += sizeof(elf);				/* ELF header */</div><div class='ctx'> 	offset += segs * sizeof(struct elf_phdr);	/* Program headers */</div><div class='ctx'> </div><div class='ctx'> 	/* Write notes phdr entry */</div><div class='ctx'> 	{</div><div class='del'>-		size_t sz = get_note_info_size(&amp;info);</div><div class='add'>+		size_t sz = info.size;</div><div class='ctx'> </div><div class='del'>-		/* For cell spufs */</div><div class='add'>+		/* For cell spufs and x86 xstate */</div><div class='ctx'> 		sz += elf_coredump_extra_notes_size();</div><div class='ctx'> </div><div class='ctx'> 		phdr4note = kmalloc(sizeof(*phdr4note), GFP_KERNEL);</div><div class='hunk'>@@ -2226,8 +2047,8 @@ static int elf_core_dump(struct coredump_params *cprm)</div><div class='ctx'> </div><div class='ctx'> 	dataoff = offset = roundup(offset, ELF_EXEC_PAGESIZE);</div><div class='ctx'> </div><div class='del'>-	offset += vma_data_size;</div><div class='del'>-	offset += elf_core_extra_data_size();</div><div class='add'>+	offset += cprm-&gt;vma_data_size;</div><div class='add'>+	offset += elf_core_extra_data_size(cprm);</div><div class='ctx'> 	e_shoff = offset;</div><div class='ctx'> </div><div class='ctx'> 	if (e_phnum == PN_XNUM) {</div><div class='hunk'>@@ -2246,8 +2067,8 @@ static int elf_core_dump(struct coredump_params *cprm)</div><div class='ctx'> 		goto end_coredump;</div><div class='ctx'> </div><div class='ctx'> 	/* Write program headers for segments dump */</div><div class='del'>-	for (i = 0; i &lt; vma_count; i++) {</div><div class='del'>-		struct core_vma_metadata *meta = vma_meta + i;</div><div class='add'>+	for (i = 0; i &lt; cprm-&gt;vma_count; i++) {</div><div class='add'>+		struct core_vma_metadata *meta = cprm-&gt;vma_meta + i;</div><div class='ctx'> 		struct elf_phdr phdr;</div><div class='ctx'> </div><div class='ctx'> 		phdr.p_type = PT_LOAD;</div><div class='hunk'>@@ -2273,19 +2094,19 @@ static int elf_core_dump(struct coredump_params *cprm)</div><div class='ctx'> 	if (!elf_core_write_extra_phdrs(cprm, offset))</div><div class='ctx'> 		goto end_coredump;</div><div class='ctx'> </div><div class='del'>- 	/* write out the notes section */</div><div class='add'>+	/* write out the notes section */</div><div class='ctx'> 	if (!write_note_info(&amp;info, cprm))</div><div class='ctx'> 		goto end_coredump;</div><div class='ctx'> </div><div class='del'>-	/* For cell spufs */</div><div class='add'>+	/* For cell spufs and x86 xstate */</div><div class='ctx'> 	if (elf_coredump_extra_notes_write(cprm))</div><div class='ctx'> 		goto end_coredump;</div><div class='ctx'> </div><div class='ctx'> 	/* Align to page */</div><div class='ctx'> 	dump_skip_to(cprm, dataoff);</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; vma_count; i++) {</div><div class='del'>-		struct core_vma_metadata *meta = vma_meta + i;</div><div class='add'>+	for (i = 0; i &lt; cprm-&gt;vma_count; i++) {</div><div class='add'>+		struct core_vma_metadata *meta = cprm-&gt;vma_meta + i;</div><div class='ctx'> </div><div class='ctx'> 		if (!dump_user_range(cprm, meta-&gt;start, meta-&gt;dump_size))</div><div class='ctx'> 			goto end_coredump;</div><div class='hunk'>@@ -2302,7 +2123,6 @@ static int elf_core_dump(struct coredump_params *cprm)</div><div class='ctx'> end_coredump:</div><div class='ctx'> 	free_note_info(&amp;info);</div><div class='ctx'> 	kfree(shdr4extnum);</div><div class='del'>-	kvfree(vma_meta);</div><div class='ctx'> 	kfree(phdr4note);</div><div class='ctx'> 	return has_dumped;</div><div class='ctx'> }</div><div class='hunk'>@@ -2323,4 +2143,7 @@ static void __exit exit_elf_binfmt(void)</div><div class='ctx'> </div><div class='ctx'> core_initcall(init_elf_binfmt);</div><div class='ctx'> module_exit(exit_elf_binfmt);</div><div class='del'>-MODULE_LICENSE("GPL");</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BINFMT_ELF_KUNIT_TEST</div><div class='add'>+#include "tests/binfmt_elf_kunit.c"</div><div class='add'>+#endif</div><div class='head'>diff --git a/fs/binfmt_elf_fdpic.c b/fs/binfmt_elf_fdpic.c<br/>index c6f588dc4a9d..48fd2de3bca0 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/binfmt_elf_fdpic.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/binfmt_elf_fdpic.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/binfmt_elf_fdpic.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/binfmt_elf_fdpic.c</a></div><div class='hunk'>@@ -83,8 +83,8 @@ static struct linux_binfmt elf_fdpic_format = {</div><div class='ctx'> 	.load_binary	= load_elf_fdpic_binary,</div><div class='ctx'> #ifdef CONFIG_ELF_CORE</div><div class='ctx'> 	.core_dump	= elf_fdpic_core_dump,</div><div class='del'>-#endif</div><div class='ctx'> 	.min_coredump	= ELF_EXEC_PAGESIZE,</div><div class='add'>+#endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static int __init init_elf_fdpic_binfmt(void)</div><div class='hunk'>@@ -109,7 +109,7 @@ static int is_elf(struct elfhdr *hdr, struct file *file)</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	if (!elf_check_arch(hdr))</div><div class='ctx'> 		return 0;</div><div class='del'>-	if (!file-&gt;f_op-&gt;mmap)</div><div class='add'>+	if (!can_mmap_file(file))</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	return 1;</div><div class='ctx'> }</div><div class='hunk'>@@ -138,7 +138,7 @@ static int is_constdisp(struct elfhdr *hdr)</div><div class='ctx'> static int elf_fdpic_fetch_phdrs(struct elf_fdpic_params *params,</div><div class='ctx'> 				 struct file *file)</div><div class='ctx'> {</div><div class='del'>-	struct elf32_phdr *phdr;</div><div class='add'>+	struct elf_phdr *phdr;</div><div class='ctx'> 	unsigned long size;</div><div class='ctx'> 	int retval, loop;</div><div class='ctx'> 	loff_t pos = params-&gt;hdr.e_phoff;</div><div class='hunk'>@@ -320,7 +320,7 @@ static int load_elf_fdpic_binary(struct linux_binprm *bprm)</div><div class='ctx'> 	else</div><div class='ctx'> 		executable_stack = EXSTACK_DEFAULT;</div><div class='ctx'> </div><div class='del'>-	if (stack_size == 0) {</div><div class='add'>+	if (stack_size == 0 &amp;&amp; interp_params.flags &amp; ELF_FDPIC_FLAG_PRESENT) {</div><div class='ctx'> 		stack_size = interp_params.stack_size;</div><div class='ctx'> 		if (interp_params.flags &amp; ELF_FDPIC_FLAG_EXEC_STACK)</div><div class='ctx'> 			executable_stack = EXSTACK_ENABLE_X;</div><div class='hunk'>@@ -345,10 +345,9 @@ static int load_elf_fdpic_binary(struct linux_binprm *bprm)</div><div class='ctx'> 	/* there's now no turning back... the old userspace image is dead,</div><div class='ctx'> 	 * defunct, deceased, etc.</div><div class='ctx'> 	 */</div><div class='add'>+	SET_PERSONALITY(exec_params.hdr);</div><div class='ctx'> 	if (elf_check_fdpic(&amp;exec_params.hdr))</div><div class='del'>-		set_personality(PER_LINUX_FDPIC);</div><div class='del'>-	else</div><div class='del'>-		set_personality(PER_LINUX);</div><div class='add'>+		current-&gt;personality |= PER_LINUX_FDPIC;</div><div class='ctx'> 	if (elf_read_implies_exec(&amp;exec_params.hdr, executable_stack))</div><div class='ctx'> 		current-&gt;personality |= READ_IMPLIES_EXEC;</div><div class='ctx'> </div><div class='hunk'>@@ -395,7 +394,7 @@ static int load_elf_fdpic_binary(struct linux_binprm *bprm)</div><div class='ctx'> 			goto error;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		allow_write_access(interpreter);</div><div class='add'>+		exe_file_allow_write_access(interpreter);</div><div class='ctx'> 		fput(interpreter);</div><div class='ctx'> 		interpreter = NULL;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -434,8 +433,9 @@ static int load_elf_fdpic_binary(struct linux_binprm *bprm)</div><div class='ctx'> 	current-&gt;mm-&gt;start_stack = current-&gt;mm-&gt;start_brk + stack_size;</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-	if (create_elf_fdpic_tables(bprm, current-&gt;mm,</div><div class='del'>-				    &amp;exec_params, &amp;interp_params) &lt; 0)</div><div class='add'>+	retval = create_elf_fdpic_tables(bprm, current-&gt;mm, &amp;exec_params,</div><div class='add'>+					 &amp;interp_params);</div><div class='add'>+	if (retval &lt; 0)</div><div class='ctx'> 		goto error;</div><div class='ctx'> </div><div class='ctx'> 	kdebug("- start_code  %lx", current-&gt;mm-&gt;start_code);</div><div class='hunk'>@@ -467,7 +467,7 @@ static int load_elf_fdpic_binary(struct linux_binprm *bprm)</div><div class='ctx'> </div><div class='ctx'> error:</div><div class='ctx'> 	if (interpreter) {</div><div class='del'>-		allow_write_access(interpreter);</div><div class='add'>+		exe_file_allow_write_access(interpreter);</div><div class='ctx'> 		fput(interpreter);</div><div class='ctx'> 	}</div><div class='ctx'> 	kfree(interpreter_name);</div><div class='hunk'>@@ -505,8 +505,9 @@ static int create_elf_fdpic_tables(struct linux_binprm *bprm,</div><div class='ctx'> 	char *k_platform, *k_base_platform;</div><div class='ctx'> 	char __user *u_platform, *u_base_platform, *p;</div><div class='ctx'> 	int loop;</div><div class='del'>-	int nr;	/* reset for each csp adjustment */</div><div class='ctx'> 	unsigned long flags = 0;</div><div class='add'>+	int ei_index;</div><div class='add'>+	elf_addr_t *elf_info;</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_MMU</div><div class='ctx'> 	/* In some cases (e.g. Hyper-Threading), we want to avoid L1 evictions</div><div class='hunk'>@@ -559,8 +560,8 @@ static int create_elf_fdpic_tables(struct linux_binprm *bprm,</div><div class='ctx'> 	sp &amp;= ~7UL;</div><div class='ctx'> </div><div class='ctx'> 	/* stack the load map(s) */</div><div class='del'>-	len = sizeof(struct elf32_fdpic_loadmap);</div><div class='del'>-	len += sizeof(struct elf32_fdpic_loadseg) * exec_params-&gt;loadmap-&gt;nsegs;</div><div class='add'>+	len = sizeof(struct elf_fdpic_loadmap);</div><div class='add'>+	len += sizeof(struct elf_fdpic_loadseg) * exec_params-&gt;loadmap-&gt;nsegs;</div><div class='ctx'> 	sp = (sp - len) &amp; ~7UL;</div><div class='ctx'> 	exec_params-&gt;map_addr = sp;</div><div class='ctx'> </div><div class='hunk'>@@ -570,8 +571,8 @@ static int create_elf_fdpic_tables(struct linux_binprm *bprm,</div><div class='ctx'> 	current-&gt;mm-&gt;context.exec_fdpic_loadmap = (unsigned long) sp;</div><div class='ctx'> </div><div class='ctx'> 	if (interp_params-&gt;loadmap) {</div><div class='del'>-		len = sizeof(struct elf32_fdpic_loadmap);</div><div class='del'>-		len += sizeof(struct elf32_fdpic_loadseg) *</div><div class='add'>+		len = sizeof(struct elf_fdpic_loadmap);</div><div class='add'>+		len += sizeof(struct elf_fdpic_loadseg) *</div><div class='ctx'> 			interp_params-&gt;loadmap-&gt;nsegs;</div><div class='ctx'> 		sp = (sp - len) &amp; ~7UL;</div><div class='ctx'> 		interp_params-&gt;map_addr = sp;</div><div class='hunk'>@@ -591,6 +592,9 @@ static int create_elf_fdpic_tables(struct linux_binprm *bprm,</div><div class='ctx'> </div><div class='ctx'> 	if (bprm-&gt;have_execfd)</div><div class='ctx'> 		nitems++;</div><div class='add'>+#ifdef ELF_HWCAP2</div><div class='add'>+	nitems++;</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='ctx'> 	csp = sp;</div><div class='ctx'> 	sp -= nitems * 2 * sizeof(unsigned long);</div><div class='hunk'>@@ -601,48 +605,34 @@ static int create_elf_fdpic_tables(struct linux_binprm *bprm,</div><div class='ctx'> 	csp -= sp &amp; 15UL;</div><div class='ctx'> 	sp -= sp &amp; 15UL;</div><div class='ctx'> </div><div class='del'>-	/* put the ELF interpreter info on the stack */</div><div class='del'>-#define NEW_AUX_ENT(id, val)						\</div><div class='del'>-	do {								\</div><div class='del'>-		struct { unsigned long _id, _val; } __user *ent, v;	\</div><div class='del'>-									\</div><div class='del'>-		ent = (void __user *) csp;				\</div><div class='del'>-		v._id = (id);						\</div><div class='del'>-		v._val = (val);						\</div><div class='del'>-		if (copy_to_user(ent + nr, &amp;v, sizeof(v)))		\</div><div class='del'>-			return -EFAULT;					\</div><div class='del'>-		nr++;							\</div><div class='add'>+	/* Create the ELF interpreter info */</div><div class='add'>+	elf_info = (elf_addr_t *)mm-&gt;saved_auxv;</div><div class='add'>+	/* update AT_VECTOR_SIZE_BASE if the number of NEW_AUX_ENT() changes */</div><div class='add'>+#define NEW_AUX_ENT(id, val) \</div><div class='add'>+	do { \</div><div class='add'>+		*elf_info++ = id; \</div><div class='add'>+		*elf_info++ = val; \</div><div class='ctx'> 	} while (0)</div><div class='ctx'> </div><div class='del'>-	nr = 0;</div><div class='del'>-	csp -= 2 * sizeof(unsigned long);</div><div class='del'>-	NEW_AUX_ENT(AT_NULL, 0);</div><div class='del'>-	if (k_platform) {</div><div class='del'>-		nr = 0;</div><div class='del'>-		csp -= 2 * sizeof(unsigned long);</div><div class='del'>-		NEW_AUX_ENT(AT_PLATFORM,</div><div class='del'>-			    (elf_addr_t) (unsigned long) u_platform);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (k_base_platform) {</div><div class='del'>-		nr = 0;</div><div class='del'>-		csp -= 2 * sizeof(unsigned long);</div><div class='del'>-		NEW_AUX_ENT(AT_BASE_PLATFORM,</div><div class='del'>-			    (elf_addr_t) (unsigned long) u_base_platform);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (bprm-&gt;have_execfd) {</div><div class='del'>-		nr = 0;</div><div class='del'>-		csp -= 2 * sizeof(unsigned long);</div><div class='del'>-		NEW_AUX_ENT(AT_EXECFD, bprm-&gt;execfd);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	nr = 0;</div><div class='del'>-	csp -= DLINFO_ITEMS * 2 * sizeof(unsigned long);</div><div class='add'>+#ifdef ARCH_DLINFO</div><div class='add'>+	/*</div><div class='add'>+	 * ARCH_DLINFO must come first so PPC can do its special alignment of</div><div class='add'>+	 * AUXV.</div><div class='add'>+	 * update AT_VECTOR_SIZE_ARCH if the number of NEW_AUX_ENT() in</div><div class='add'>+	 * ARCH_DLINFO changes</div><div class='add'>+	 */</div><div class='add'>+	ARCH_DLINFO;</div><div class='add'>+#endif</div><div class='ctx'> 	NEW_AUX_ENT(AT_HWCAP,	ELF_HWCAP);</div><div class='ctx'> #ifdef ELF_HWCAP2</div><div class='ctx'> 	NEW_AUX_ENT(AT_HWCAP2,	ELF_HWCAP2);</div><div class='ctx'> #endif</div><div class='add'>+#ifdef ELF_HWCAP3</div><div class='add'>+	NEW_AUX_ENT(AT_HWCAP3,	ELF_HWCAP3);</div><div class='add'>+#endif</div><div class='add'>+#ifdef ELF_HWCAP4</div><div class='add'>+	NEW_AUX_ENT(AT_HWCAP4,	ELF_HWCAP4);</div><div class='add'>+#endif</div><div class='ctx'> 	NEW_AUX_ENT(AT_PAGESZ,	PAGE_SIZE);</div><div class='ctx'> 	NEW_AUX_ENT(AT_CLKTCK,	CLOCKS_PER_SEC);</div><div class='ctx'> 	NEW_AUX_ENT(AT_PHDR,	exec_params-&gt;ph_addr);</div><div class='hunk'>@@ -659,17 +649,29 @@ static int create_elf_fdpic_tables(struct linux_binprm *bprm,</div><div class='ctx'> 	NEW_AUX_ENT(AT_EGID,	(elf_addr_t) from_kgid_munged(cred-&gt;user_ns, cred-&gt;egid));</div><div class='ctx'> 	NEW_AUX_ENT(AT_SECURE,	bprm-&gt;secureexec);</div><div class='ctx'> 	NEW_AUX_ENT(AT_EXECFN,	bprm-&gt;exec);</div><div class='add'>+	if (k_platform)</div><div class='add'>+		NEW_AUX_ENT(AT_PLATFORM,</div><div class='add'>+			    (elf_addr_t)(unsigned long)u_platform);</div><div class='add'>+	if (k_base_platform)</div><div class='add'>+		NEW_AUX_ENT(AT_BASE_PLATFORM,</div><div class='add'>+			    (elf_addr_t)(unsigned long)u_base_platform);</div><div class='add'>+	if (bprm-&gt;have_execfd)</div><div class='add'>+		NEW_AUX_ENT(AT_EXECFD, bprm-&gt;execfd);</div><div class='add'>+#undef NEW_AUX_ENT</div><div class='add'>+	/* AT_NULL is zero; clear the rest too */</div><div class='add'>+	memset(elf_info, 0, (char *)mm-&gt;saved_auxv +</div><div class='add'>+	       sizeof(mm-&gt;saved_auxv) - (char *)elf_info);</div><div class='ctx'> </div><div class='del'>-#ifdef ARCH_DLINFO</div><div class='del'>-	nr = 0;</div><div class='del'>-	csp -= AT_VECTOR_SIZE_ARCH * 2 * sizeof(unsigned long);</div><div class='add'>+	/* And advance past the AT_NULL entry.  */</div><div class='add'>+	elf_info += 2;</div><div class='ctx'> </div><div class='del'>-	/* ARCH_DLINFO must come last so platform specific code can enforce</div><div class='del'>-	 * special alignment requirements on the AUXV if necessary (eg. PPC).</div><div class='del'>-	 */</div><div class='del'>-	ARCH_DLINFO;</div><div class='del'>-#endif</div><div class='del'>-#undef NEW_AUX_ENT</div><div class='add'>+	ei_index = elf_info - (elf_addr_t *)mm-&gt;saved_auxv;</div><div class='add'>+	csp -= ei_index * sizeof(elf_addr_t);</div><div class='add'>+</div><div class='add'>+	/* Put the elf_info on the stack in the right place.  */</div><div class='add'>+	if (copy_to_user((void __user *)csp, mm-&gt;saved_auxv,</div><div class='add'>+			 ei_index * sizeof(elf_addr_t)))</div><div class='add'>+		return -EFAULT;</div><div class='ctx'> </div><div class='ctx'> 	/* allocate room for argv[] and envv[] */</div><div class='ctx'> 	csp -= (bprm-&gt;envc + 1) * sizeof(elf_caddr_t);</div><div class='hunk'>@@ -739,15 +741,15 @@ static int elf_fdpic_map_file(struct elf_fdpic_params *params,</div><div class='ctx'> 			      struct mm_struct *mm,</div><div class='ctx'> 			      const char *what)</div><div class='ctx'> {</div><div class='del'>-	struct elf32_fdpic_loadmap *loadmap;</div><div class='add'>+	struct elf_fdpic_loadmap *loadmap;</div><div class='ctx'> #ifdef CONFIG_MMU</div><div class='del'>-	struct elf32_fdpic_loadseg *mseg;</div><div class='add'>+	struct elf_fdpic_loadseg *mseg;</div><div class='add'>+	unsigned long load_addr;</div><div class='ctx'> #endif</div><div class='del'>-	struct elf32_fdpic_loadseg *seg;</div><div class='del'>-	struct elf32_phdr *phdr;</div><div class='del'>-	unsigned long load_addr, stop;</div><div class='add'>+	struct elf_fdpic_loadseg *seg;</div><div class='add'>+	struct elf_phdr *phdr;</div><div class='ctx'> 	unsigned nloads, tmp;</div><div class='del'>-	size_t size;</div><div class='add'>+	unsigned long stop;</div><div class='ctx'> 	int loop, ret;</div><div class='ctx'> </div><div class='ctx'> 	/* allocate a load map table */</div><div class='hunk'>@@ -759,19 +761,15 @@ static int elf_fdpic_map_file(struct elf_fdpic_params *params,</div><div class='ctx'> 	if (nloads == 0)</div><div class='ctx'> 		return -ELIBBAD;</div><div class='ctx'> </div><div class='del'>-	size = sizeof(*loadmap) + nloads * sizeof(*seg);</div><div class='del'>-	loadmap = kzalloc(size, GFP_KERNEL);</div><div class='add'>+	loadmap = kzalloc(struct_size(loadmap, segs, nloads), GFP_KERNEL);</div><div class='ctx'> 	if (!loadmap)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	params-&gt;loadmap = loadmap;</div><div class='ctx'> </div><div class='del'>-	loadmap-&gt;version = ELF32_FDPIC_LOADMAP_VERSION;</div><div class='add'>+	loadmap-&gt;version = ELF_FDPIC_LOADMAP_VERSION;</div><div class='ctx'> 	loadmap-&gt;nsegs = nloads;</div><div class='ctx'> </div><div class='del'>-	load_addr = params-&gt;load_addr;</div><div class='del'>-	seg = loadmap-&gt;segs;</div><div class='del'>-</div><div class='ctx'> 	/* map the requested LOADs into the memory space */</div><div class='ctx'> 	switch (params-&gt;flags &amp; ELF_FDPIC_FLAG_ARRANGEMENT) {</div><div class='ctx'> 	case ELF_FDPIC_FLAG_CONSTDISP:</div><div class='hunk'>@@ -842,8 +840,8 @@ static int elf_fdpic_map_file(struct elf_fdpic_params *params,</div><div class='ctx'> 			if (phdr-&gt;p_vaddr &gt;= seg-&gt;p_vaddr &amp;&amp;</div><div class='ctx'> 			    phdr-&gt;p_vaddr + phdr-&gt;p_memsz &lt;=</div><div class='ctx'> 			    seg-&gt;p_vaddr + seg-&gt;p_memsz) {</div><div class='del'>-				Elf32_Dyn __user *dyn;</div><div class='del'>-				Elf32_Sword d_tag;</div><div class='add'>+				Elf_Dyn __user *dyn;</div><div class='add'>+				Elf_Sword d_tag;</div><div class='ctx'> </div><div class='ctx'> 				params-&gt;dynamic_addr =</div><div class='ctx'> 					(phdr-&gt;p_vaddr - seg-&gt;p_vaddr) +</div><div class='hunk'>@@ -853,11 +851,11 @@ static int elf_fdpic_map_file(struct elf_fdpic_params *params,</div><div class='ctx'> 				 * one item, and that the last item is a NULL</div><div class='ctx'> 				 * entry */</div><div class='ctx'> 				if (phdr-&gt;p_memsz == 0 ||</div><div class='del'>-				    phdr-&gt;p_memsz % sizeof(Elf32_Dyn) != 0)</div><div class='add'>+				    phdr-&gt;p_memsz % sizeof(Elf_Dyn) != 0)</div><div class='ctx'> 					goto dynamic_error;</div><div class='ctx'> </div><div class='del'>-				tmp = phdr-&gt;p_memsz / sizeof(Elf32_Dyn);</div><div class='del'>-				dyn = (Elf32_Dyn __user *)params-&gt;dynamic_addr;</div><div class='add'>+				tmp = phdr-&gt;p_memsz / sizeof(Elf_Dyn);</div><div class='add'>+				dyn = (Elf_Dyn __user *)params-&gt;dynamic_addr;</div><div class='ctx'> 				if (get_user(d_tag, &amp;dyn[tmp - 1].d_tag) ||</div><div class='ctx'> 				    d_tag != 0)</div><div class='ctx'> 					goto dynamic_error;</div><div class='hunk'>@@ -903,10 +901,12 @@ static int elf_fdpic_map_file(struct elf_fdpic_params *params,</div><div class='ctx'> 	kdebug("- DYNAMIC[]: %lx", params-&gt;dynamic_addr);</div><div class='ctx'> 	seg = loadmap-&gt;segs;</div><div class='ctx'> 	for (loop = 0; loop &lt; loadmap-&gt;nsegs; loop++, seg++)</div><div class='del'>-		kdebug("- LOAD[%d] : %08x-%08x [va=%x ms=%x]",</div><div class='add'>+		kdebug("- LOAD[%d] : %08llx-%08llx [va=%llx ms=%llx]",</div><div class='ctx'> 		       loop,</div><div class='del'>-		       seg-&gt;addr, seg-&gt;addr + seg-&gt;p_memsz - 1,</div><div class='del'>-		       seg-&gt;p_vaddr, seg-&gt;p_memsz);</div><div class='add'>+		       (unsigned long long) seg-&gt;addr,</div><div class='add'>+		       (unsigned long long) seg-&gt;addr + seg-&gt;p_memsz - 1,</div><div class='add'>+		       (unsigned long long) seg-&gt;p_vaddr,</div><div class='add'>+		       (unsigned long long) seg-&gt;p_memsz);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='hunk'>@@ -926,8 +926,8 @@ static int elf_fdpic_map_file_constdisp_on_uclinux(</div><div class='ctx'> 	struct file *file,</div><div class='ctx'> 	struct mm_struct *mm)</div><div class='ctx'> {</div><div class='del'>-	struct elf32_fdpic_loadseg *seg;</div><div class='del'>-	struct elf32_phdr *phdr;</div><div class='add'>+	struct elf_fdpic_loadseg *seg;</div><div class='add'>+	struct elf_phdr *phdr;</div><div class='ctx'> 	unsigned long load_addr, base = ULONG_MAX, top = 0, maddr = 0;</div><div class='ctx'> 	int loop, ret;</div><div class='ctx'> </div><div class='hunk'>@@ -1010,8 +1010,8 @@ static int elf_fdpic_map_file_by_direct_mmap(struct elf_fdpic_params *params,</div><div class='ctx'> 					     struct file *file,</div><div class='ctx'> 					     struct mm_struct *mm)</div><div class='ctx'> {</div><div class='del'>-	struct elf32_fdpic_loadseg *seg;</div><div class='del'>-	struct elf32_phdr *phdr;</div><div class='add'>+	struct elf_fdpic_loadseg *seg;</div><div class='add'>+	struct elf_phdr *phdr;</div><div class='ctx'> 	unsigned long load_addr, delta_vaddr;</div><div class='ctx'> 	int loop, dvset;</div><div class='ctx'> </div><div class='hunk'>@@ -1024,7 +1024,7 @@ static int elf_fdpic_map_file_by_direct_mmap(struct elf_fdpic_params *params,</div><div class='ctx'> 	/* deal with each load segment separately */</div><div class='ctx'> 	phdr = params-&gt;phdrs;</div><div class='ctx'> 	for (loop = 0; loop &lt; params-&gt;hdr.e_phnum; loop++, phdr++) {</div><div class='del'>-		unsigned long maddr, disp, excess, excess1;</div><div class='add'>+		unsigned long maddr, disp, excess;</div><div class='ctx'> 		int prot = 0, flags;</div><div class='ctx'> </div><div class='ctx'> 		if (phdr-&gt;p_type != PT_LOAD)</div><div class='hunk'>@@ -1085,9 +1085,10 @@ static int elf_fdpic_map_file_by_direct_mmap(struct elf_fdpic_params *params,</div><div class='ctx'> 		maddr = vm_mmap(file, maddr, phdr-&gt;p_memsz + disp, prot, flags,</div><div class='ctx'> 				phdr-&gt;p_offset - disp);</div><div class='ctx'> </div><div class='del'>-		kdebug("mmap[%d] &lt;file&gt; sz=%lx pr=%x fl=%x of=%lx --&gt; %08lx",</div><div class='del'>-		       loop, phdr-&gt;p_memsz + disp, prot, flags,</div><div class='del'>-		       phdr-&gt;p_offset - disp, maddr);</div><div class='add'>+		kdebug("mmap[%d] &lt;file&gt; sz=%llx pr=%x fl=%x of=%llx --&gt; %08lx",</div><div class='add'>+		       loop, (unsigned long long) phdr-&gt;p_memsz + disp,</div><div class='add'>+		       prot, flags, (unsigned long long) phdr-&gt;p_offset - disp,</div><div class='add'>+		       maddr);</div><div class='ctx'> </div><div class='ctx'> 		if (IS_ERR_VALUE(maddr))</div><div class='ctx'> 			return (int) maddr;</div><div class='hunk'>@@ -1119,9 +1120,10 @@ static int elf_fdpic_map_file_by_direct_mmap(struct elf_fdpic_params *params,</div><div class='ctx'> 		 *   extant in the file</div><div class='ctx'> 		 */</div><div class='ctx'> 		excess = phdr-&gt;p_memsz - phdr-&gt;p_filesz;</div><div class='del'>-		excess1 = PAGE_SIZE - ((maddr + phdr-&gt;p_filesz) &amp; ~PAGE_MASK);</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_MMU</div><div class='add'>+		unsigned long excess1</div><div class='add'>+			= PAGE_SIZE - ((maddr + phdr-&gt;p_filesz) &amp; ~PAGE_MASK);</div><div class='ctx'> 		if (excess &gt; excess1) {</div><div class='ctx'> 			unsigned long xaddr = maddr + phdr-&gt;p_filesz + excess1;</div><div class='ctx'> 			unsigned long xmaddr;</div><div class='hunk'>@@ -1149,8 +1151,9 @@ static int elf_fdpic_map_file_by_direct_mmap(struct elf_fdpic_params *params,</div><div class='ctx'> </div><div class='ctx'> #else</div><div class='ctx'> 		if (excess &gt; 0) {</div><div class='del'>-			kdebug("clear[%d] ad=%lx sz=%lx",</div><div class='del'>-			       loop, maddr + phdr-&gt;p_filesz, excess);</div><div class='add'>+			kdebug("clear[%d] ad=%llx sz=%lx", loop,</div><div class='add'>+			       (unsigned long long) maddr + phdr-&gt;p_filesz,</div><div class='add'>+			       excess);</div><div class='ctx'> 			if (clear_user((void *) maddr + phdr-&gt;p_filesz, excess))</div><div class='ctx'> 				return -EFAULT;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1268,12 +1271,12 @@ static inline void fill_elf_note_phdr(struct elf_phdr *phdr, int sz, loff_t offs</div><div class='ctx'> 	phdr-&gt;p_filesz = sz;</div><div class='ctx'> 	phdr-&gt;p_memsz = 0;</div><div class='ctx'> 	phdr-&gt;p_flags = 0;</div><div class='del'>-	phdr-&gt;p_align = 0;</div><div class='add'>+	phdr-&gt;p_align = 4;</div><div class='ctx'> 	return;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void fill_note(struct memelfnote *note, const char *name, int type,</div><div class='del'>-		unsigned int sz, void *data)</div><div class='add'>+static inline void __fill_note(struct memelfnote *note, const char *name, int type,</div><div class='add'>+			       unsigned int sz, void *data)</div><div class='ctx'> {</div><div class='ctx'> 	note-&gt;name = name;</div><div class='ctx'> 	note-&gt;type = type;</div><div class='hunk'>@@ -1282,6 +1285,9 @@ static inline void fill_note(struct memelfnote *note, const char *name, int type</div><div class='ctx'> 	return;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#define fill_note(note, type, sz, data) \</div><div class='add'>+	__fill_note(note, NN_ ## type, NT_ ## type, sz, data)</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * fill up all the fields in prstatus from the given task struct, except</div><div class='ctx'>  * registers which need to be filled up separately.</div><div class='hunk'>@@ -1359,7 +1365,7 @@ static int fill_psinfo(struct elf_prpsinfo *psinfo, struct task_struct *p,</div><div class='ctx'> 	SET_UID(psinfo-&gt;pr_uid, from_kuid_munged(cred-&gt;user_ns, cred-&gt;uid));</div><div class='ctx'> 	SET_GID(psinfo-&gt;pr_gid, from_kgid_munged(cred-&gt;user_ns, cred-&gt;gid));</div><div class='ctx'> 	rcu_read_unlock();</div><div class='del'>-	strncpy(psinfo-&gt;pr_fname, p-&gt;comm, sizeof(psinfo-&gt;pr_fname));</div><div class='add'>+	get_task_comm(psinfo-&gt;pr_fname, p);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -1395,8 +1401,7 @@ static struct elf_thread_status *elf_dump_thread_status(long signr, struct task_</div><div class='ctx'> 	regset_get(p, &amp;view-&gt;regsets[0],</div><div class='ctx'> 		   sizeof(t-&gt;prstatus.pr_reg), &amp;t-&gt;prstatus.pr_reg);</div><div class='ctx'> </div><div class='del'>-	fill_note(&amp;t-&gt;notes[0], "CORE", NT_PRSTATUS, sizeof(t-&gt;prstatus),</div><div class='del'>-		  &amp;t-&gt;prstatus);</div><div class='add'>+	fill_note(&amp;t-&gt;notes[0], PRSTATUS, sizeof(t-&gt;prstatus), &amp;t-&gt;prstatus);</div><div class='ctx'> 	t-&gt;num_notes++;</div><div class='ctx'> 	*sz += notesize(&amp;t-&gt;notes[0]);</div><div class='ctx'> </div><div class='hunk'>@@ -1413,8 +1418,7 @@ static struct elf_thread_status *elf_dump_thread_status(long signr, struct task_</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (t-&gt;prstatus.pr_fpvalid) {</div><div class='del'>-		fill_note(&amp;t-&gt;notes[1], "CORE", NT_PRFPREG, sizeof(t-&gt;fpu),</div><div class='del'>-			  &amp;t-&gt;fpu);</div><div class='add'>+		fill_note(&amp;t-&gt;notes[1], PRFPREG, sizeof(t-&gt;fpu), &amp;t-&gt;fpu);</div><div class='ctx'> 		t-&gt;num_notes++;</div><div class='ctx'> 		*sz += notesize(&amp;t-&gt;notes[1]);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1465,7 +1469,7 @@ static bool elf_fdpic_dump_segments(struct coredump_params *cprm,</div><div class='ctx'> static int elf_fdpic_core_dump(struct coredump_params *cprm)</div><div class='ctx'> {</div><div class='ctx'> 	int has_dumped = 0;</div><div class='del'>-	int vma_count, segs;</div><div class='add'>+	int segs;</div><div class='ctx'> 	int i;</div><div class='ctx'> 	struct elfhdr *elf = NULL;</div><div class='ctx'> 	loff_t offset = 0, dataoff;</div><div class='hunk'>@@ -1480,8 +1484,6 @@ static int elf_fdpic_core_dump(struct coredump_params *cprm)</div><div class='ctx'> 	elf_addr_t e_shoff;</div><div class='ctx'> 	struct core_thread *ct;</div><div class='ctx'> 	struct elf_thread_status *tmp;</div><div class='del'>-	struct core_vma_metadata *vma_meta = NULL;</div><div class='del'>-	size_t vma_data_size;</div><div class='ctx'> </div><div class='ctx'> 	/* alloc memory for large data structures: too large to be on stack */</div><div class='ctx'> 	elf = kmalloc(sizeof(*elf), GFP_KERNEL);</div><div class='hunk'>@@ -1491,9 +1493,6 @@ static int elf_fdpic_core_dump(struct coredump_params *cprm)</div><div class='ctx'> 	if (!psinfo)</div><div class='ctx'> 		goto end_coredump;</div><div class='ctx'> </div><div class='del'>-	if (dump_vma_snapshot(cprm, &amp;vma_count, &amp;vma_meta, &amp;vma_data_size))</div><div class='del'>-		goto end_coredump;</div><div class='del'>-</div><div class='ctx'> 	for (ct = current-&gt;signal-&gt;core_state-&gt;dumper.next;</div><div class='ctx'> 					ct; ct = ct-&gt;next) {</div><div class='ctx'> 		tmp = elf_dump_thread_status(cprm-&gt;siginfo-&gt;si_signo,</div><div class='hunk'>@@ -1513,7 +1512,7 @@ static int elf_fdpic_core_dump(struct coredump_params *cprm)</div><div class='ctx'> 	tmp-&gt;next = thread_list;</div><div class='ctx'> 	thread_list = tmp;</div><div class='ctx'> </div><div class='del'>-	segs = vma_count + elf_core_extra_phdrs();</div><div class='add'>+	segs = cprm-&gt;vma_count + elf_core_extra_phdrs(cprm);</div><div class='ctx'> </div><div class='ctx'> 	/* for notes section */</div><div class='ctx'> 	segs++;</div><div class='hunk'>@@ -1533,7 +1532,7 @@ static int elf_fdpic_core_dump(struct coredump_params *cprm)</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='ctx'> 	fill_psinfo(psinfo, current-&gt;group_leader, current-&gt;mm);</div><div class='del'>-	fill_note(&amp;psinfo_note, "CORE", NT_PRPSINFO, sizeof(*psinfo), psinfo);</div><div class='add'>+	fill_note(&amp;psinfo_note, PRPSINFO, sizeof(*psinfo), psinfo);</div><div class='ctx'> 	thread_status_size += notesize(&amp;psinfo_note);</div><div class='ctx'> </div><div class='ctx'> 	auxv = (elf_addr_t *) current-&gt;mm-&gt;saved_auxv;</div><div class='hunk'>@@ -1541,10 +1540,10 @@ static int elf_fdpic_core_dump(struct coredump_params *cprm)</div><div class='ctx'> 	do</div><div class='ctx'> 		i += 2;</div><div class='ctx'> 	while (auxv[i - 2] != AT_NULL);</div><div class='del'>-	fill_note(&amp;auxv_note, "CORE", NT_AUXV, i * sizeof(elf_addr_t), auxv);</div><div class='add'>+	fill_note(&amp;auxv_note, AUXV, i * sizeof(elf_addr_t), auxv);</div><div class='ctx'> 	thread_status_size += notesize(&amp;auxv_note);</div><div class='ctx'> </div><div class='del'>-	offset = sizeof(*elf);				/* Elf header */</div><div class='add'>+	offset = sizeof(*elf);				/* ELF header */</div><div class='ctx'> 	offset += segs * sizeof(struct elf_phdr);	/* Program headers */</div><div class='ctx'> </div><div class='ctx'> 	/* Write notes phdr entry */</div><div class='hunk'>@@ -1558,8 +1557,8 @@ static int elf_fdpic_core_dump(struct coredump_params *cprm)</div><div class='ctx'> 	/* Page-align dumped data */</div><div class='ctx'> 	dataoff = offset = roundup(offset, ELF_EXEC_PAGESIZE);</div><div class='ctx'> </div><div class='del'>-	offset += vma_data_size;</div><div class='del'>-	offset += elf_core_extra_data_size();</div><div class='add'>+	offset += cprm-&gt;vma_data_size;</div><div class='add'>+	offset += elf_core_extra_data_size(cprm);</div><div class='ctx'> 	e_shoff = offset;</div><div class='ctx'> </div><div class='ctx'> 	if (e_phnum == PN_XNUM) {</div><div class='hunk'>@@ -1578,8 +1577,8 @@ static int elf_fdpic_core_dump(struct coredump_params *cprm)</div><div class='ctx'> 		goto end_coredump;</div><div class='ctx'> </div><div class='ctx'> 	/* write program headers for segments dump */</div><div class='del'>-	for (i = 0; i &lt; vma_count; i++) {</div><div class='del'>-		struct core_vma_metadata *meta = vma_meta + i;</div><div class='add'>+	for (i = 0; i &lt; cprm-&gt;vma_count; i++) {</div><div class='add'>+		struct core_vma_metadata *meta = cprm-&gt;vma_meta + i;</div><div class='ctx'> 		struct elf_phdr phdr;</div><div class='ctx'> 		size_t sz;</div><div class='ctx'> </div><div class='hunk'>@@ -1608,7 +1607,7 @@ static int elf_fdpic_core_dump(struct coredump_params *cprm)</div><div class='ctx'> 	if (!elf_core_write_extra_phdrs(cprm, offset))</div><div class='ctx'> 		goto end_coredump;</div><div class='ctx'> </div><div class='del'>- 	/* write out the notes section */</div><div class='add'>+	/* write out the notes section */</div><div class='ctx'> 	if (!writenote(thread_list-&gt;notes, cprm))</div><div class='ctx'> 		goto end_coredump;</div><div class='ctx'> 	if (!writenote(&amp;psinfo_note, cprm))</div><div class='hunk'>@@ -1628,7 +1627,7 @@ static int elf_fdpic_core_dump(struct coredump_params *cprm)</div><div class='ctx'> </div><div class='ctx'> 	dump_skip_to(cprm, dataoff);</div><div class='ctx'> </div><div class='del'>-	if (!elf_fdpic_dump_segments(cprm, vma_meta, vma_count))</div><div class='add'>+	if (!elf_fdpic_dump_segments(cprm, cprm-&gt;vma_meta, cprm-&gt;vma_count))</div><div class='ctx'> 		goto end_coredump;</div><div class='ctx'> </div><div class='ctx'> 	if (!elf_core_write_extra_data(cprm))</div><div class='hunk'>@@ -1652,7 +1651,6 @@ end_coredump:</div><div class='ctx'> 		thread_list = thread_list-&gt;next;</div><div class='ctx'> 		kfree(tmp);</div><div class='ctx'> 	}</div><div class='del'>-	kvfree(vma_meta);</div><div class='ctx'> 	kfree(phdr4note);</div><div class='ctx'> 	kfree(elf);</div><div class='ctx'> 	kfree(psinfo);</div><div class='head'>diff --git a/fs/binfmt_flat.c b/fs/binfmt_flat.c<br/>index 5d776f80ee50..b5b5ca1a44f7 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/binfmt_flat.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/binfmt_flat.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/binfmt_flat.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/binfmt_flat.c</a></div><div class='hunk'>@@ -39,7 +39,7 @@</div><div class='ctx'> #include &lt;linux/vmalloc.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include &lt;asm/byteorder.h&gt;</div><div class='del'>-#include &lt;asm/unaligned.h&gt;</div><div class='add'>+#include &lt;linux/unaligned.h&gt;</div><div class='ctx'> #include &lt;asm/cacheflush.h&gt;</div><div class='ctx'> #include &lt;asm/page.h&gt;</div><div class='ctx'> #include &lt;asm/flat.h&gt;</div><div class='hunk'>@@ -68,16 +68,14 @@</div><div class='ctx'> #define RELOC_FAILED 0xff00ff01		/* Relocation incorrect somewhere */</div><div class='ctx'> #define UNLOADED_LIB 0x7ff000ff		/* Placeholder for unused library */</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_BINFMT_SHARED_FLAT</div><div class='del'>-#define	MAX_SHARED_LIBS			(4)</div><div class='del'>-#else</div><div class='del'>-#define	MAX_SHARED_LIBS			(1)</div><div class='del'>-#endif</div><div class='add'>+#define MAX_SHARED_LIBS			(1)</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_BINFMT_FLAT_NO_DATA_START_OFFSET</div><div class='ctx'> #define DATA_START_OFFSET_WORDS		(0)</div><div class='add'>+#define MAX_SHARED_LIBS_UPDATE		(0)</div><div class='ctx'> #else</div><div class='ctx'> #define DATA_START_OFFSET_WORDS		(MAX_SHARED_LIBS)</div><div class='add'>+#define MAX_SHARED_LIBS_UPDATE		(MAX_SHARED_LIBS)</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> struct lib_info {</div><div class='hunk'>@@ -92,32 +90,13 @@ struct lib_info {</div><div class='ctx'> 	} lib_list[MAX_SHARED_LIBS];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_BINFMT_SHARED_FLAT</div><div class='del'>-static int load_flat_shared_library(int id, struct lib_info *p);</div><div class='del'>-#endif</div><div class='del'>-</div><div class='ctx'> static int load_flat_binary(struct linux_binprm *);</div><div class='del'>-static int flat_core_dump(struct coredump_params *cprm);</div><div class='ctx'> </div><div class='ctx'> static struct linux_binfmt flat_format = {</div><div class='ctx'> 	.module		= THIS_MODULE,</div><div class='ctx'> 	.load_binary	= load_flat_binary,</div><div class='del'>-	.core_dump	= flat_core_dump,</div><div class='del'>-	.min_coredump	= PAGE_SIZE</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/****************************************************************************/</div><div class='del'>-/*</div><div class='del'>- * Routine writes a core dump image in the current directory.</div><div class='del'>- * Currently only a stub-function.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-static int flat_core_dump(struct coredump_params *cprm)</div><div class='del'>-{</div><div class='del'>-	pr_warn("Process %s:%d received signr %d and should have core dumped\n",</div><div class='del'>-		current-&gt;comm, current-&gt;pid, cprm-&gt;siginfo-&gt;si_signo);</div><div class='del'>-	return 1;</div><div class='del'>-}</div><div class='ctx'> </div><div class='ctx'> /****************************************************************************/</div><div class='ctx'> /*</div><div class='hunk'>@@ -322,51 +301,18 @@ out_free:</div><div class='ctx'> /****************************************************************************/</div><div class='ctx'> </div><div class='ctx'> static unsigned long</div><div class='del'>-calc_reloc(unsigned long r, struct lib_info *p, int curid, int internalp)</div><div class='add'>+calc_reloc(unsigned long r, struct lib_info *p)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned long addr;</div><div class='del'>-	int id;</div><div class='ctx'> 	unsigned long start_brk;</div><div class='ctx'> 	unsigned long start_data;</div><div class='ctx'> 	unsigned long text_len;</div><div class='ctx'> 	unsigned long start_code;</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_BINFMT_SHARED_FLAT</div><div class='del'>-	if (r == 0)</div><div class='del'>-		id = curid;	/* Relocs of 0 are always self referring */</div><div class='del'>-	else {</div><div class='del'>-		id = (r &gt;&gt; 24) &amp; 0xff;	/* Find ID for this reloc */</div><div class='del'>-		r &amp;= 0x00ffffff;	/* Trim ID off here */</div><div class='del'>-	}</div><div class='del'>-	if (id &gt;= MAX_SHARED_LIBS) {</div><div class='del'>-		pr_err("reference 0x%lx to shared library %d", r, id);</div><div class='del'>-		goto failed;</div><div class='del'>-	}</div><div class='del'>-	if (curid != id) {</div><div class='del'>-		if (internalp) {</div><div class='del'>-			pr_err("reloc address 0x%lx not in same module "</div><div class='del'>-			       "(%d != %d)", r, curid, id);</div><div class='del'>-			goto failed;</div><div class='del'>-		} else if (!p-&gt;lib_list[id].loaded &amp;&amp;</div><div class='del'>-			   load_flat_shared_library(id, p) &lt; 0) {</div><div class='del'>-			pr_err("failed to load library %d", id);</div><div class='del'>-			goto failed;</div><div class='del'>-		}</div><div class='del'>-		/* Check versioning information (i.e. time stamps) */</div><div class='del'>-		if (p-&gt;lib_list[id].build_date &amp;&amp; p-&gt;lib_list[curid].build_date &amp;&amp;</div><div class='del'>-				p-&gt;lib_list[curid].build_date &lt; p-&gt;lib_list[id].build_date) {</div><div class='del'>-			pr_err("library %d is younger than %d", id, curid);</div><div class='del'>-			goto failed;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-#else</div><div class='del'>-	id = 0;</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-	start_brk = p-&gt;lib_list[id].start_brk;</div><div class='del'>-	start_data = p-&gt;lib_list[id].start_data;</div><div class='del'>-	start_code = p-&gt;lib_list[id].start_code;</div><div class='del'>-	text_len = p-&gt;lib_list[id].text_len;</div><div class='add'>+	start_brk = p-&gt;lib_list[0].start_brk;</div><div class='add'>+	start_data = p-&gt;lib_list[0].start_data;</div><div class='add'>+	start_code = p-&gt;lib_list[0].start_code;</div><div class='add'>+	text_len = p-&gt;lib_list[0].text_len;</div><div class='ctx'> </div><div class='ctx'> 	if (r &gt; start_brk - start_data + text_len) {</div><div class='ctx'> 		pr_err("reloc outside program 0x%lx (0 - 0x%lx/0x%lx)",</div><div class='hunk'>@@ -433,8 +379,32 @@ static void old_reloc(unsigned long rl)</div><div class='ctx'> </div><div class='ctx'> /****************************************************************************/</div><div class='ctx'> </div><div class='add'>+static inline u32 __user *skip_got_header(u32 __user *rp)</div><div class='add'>+{</div><div class='add'>+	if (IS_ENABLED(CONFIG_RISCV)) {</div><div class='add'>+		/*</div><div class='add'>+		 * RISC-V has a 16 byte GOT PLT header for elf64-riscv</div><div class='add'>+		 * and 8 byte GOT PLT header for elf32-riscv.</div><div class='add'>+		 * Skip the whole GOT PLT header, since it is reserved</div><div class='add'>+		 * for the dynamic linker (ld.so).</div><div class='add'>+		 */</div><div class='add'>+		u32 rp_val0, rp_val1;</div><div class='add'>+</div><div class='add'>+		if (get_user(rp_val0, rp))</div><div class='add'>+			return rp;</div><div class='add'>+		if (get_user(rp_val1, rp + 1))</div><div class='add'>+			return rp;</div><div class='add'>+</div><div class='add'>+		if (rp_val0 == 0xffffffff &amp;&amp; rp_val1 == 0xffffffff)</div><div class='add'>+			rp += 4;</div><div class='add'>+		else if (rp_val0 == 0xffffffff)</div><div class='add'>+			rp += 2;</div><div class='add'>+	}</div><div class='add'>+	return rp;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int load_flat_file(struct linux_binprm *bprm,</div><div class='del'>-		struct lib_info *libinfo, int id, unsigned long *extra_stack)</div><div class='add'>+		struct lib_info *libinfo, unsigned long *extra_stack)</div><div class='ctx'> {</div><div class='ctx'> 	struct flat_hdr *hdr;</div><div class='ctx'> 	unsigned long textpos, datapos, realdatastart;</div><div class='hunk'>@@ -486,14 +456,6 @@ static int load_flat_file(struct linux_binprm *bprm,</div><div class='ctx'> 		goto err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Don't allow old format executables to use shared libraries */</div><div class='del'>-	if (rev == OLD_FLAT_VERSION &amp;&amp; id != 0) {</div><div class='del'>-		pr_err("shared libraries are not available before rev 0x%lx\n",</div><div class='del'>-		       FLAT_VERSION);</div><div class='del'>-		ret = -ENOEXEC;</div><div class='del'>-		goto err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * fix up the flags for the older format,  there were all kinds</div><div class='ctx'> 	 * of endian hacks,  this only works for the simple cases</div><div class='hunk'>@@ -516,7 +478,7 @@ static int load_flat_file(struct linux_binprm *bprm,</div><div class='ctx'> 	 * 28 bits (256 MB) is way more than reasonable in this case.</div><div class='ctx'> 	 * If some top bits are set we have probable binary corruption.</div><div class='ctx'> 	*/</div><div class='del'>-	if ((text_len | data_len | bss_len | stack_len | full_data) &gt;&gt; 28) {</div><div class='add'>+	if ((text_len | data_len | bss_len | stack_len | relocs | full_data) &gt;&gt; 28) {</div><div class='ctx'> 		pr_err("bad header\n");</div><div class='ctx'> 		ret = -ENOEXEC;</div><div class='ctx'> 		goto err;</div><div class='hunk'>@@ -544,15 +506,13 @@ static int load_flat_file(struct linux_binprm *bprm,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Flush all traces of the currently running executable */</div><div class='del'>-	if (id == 0) {</div><div class='del'>-		ret = begin_new_exec(bprm);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto err;</div><div class='add'>+	ret = begin_new_exec(bprm);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto err;</div><div class='ctx'> </div><div class='del'>-		/* OK, This is the point of no return */</div><div class='del'>-		set_personality(PER_LINUX_32BIT);</div><div class='del'>-		setup_new_exec(bprm);</div><div class='del'>-	}</div><div class='add'>+	/* OK, This is the point of no return */</div><div class='add'>+	set_personality(PER_LINUX_32BIT);</div><div class='add'>+	setup_new_exec(bprm);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * calculate the extra space we need to map in</div><div class='hunk'>@@ -732,42 +692,40 @@ static int load_flat_file(struct linux_binprm *bprm,</div><div class='ctx'> 	text_len -= sizeof(struct flat_hdr); /* the real code len */</div><div class='ctx'> </div><div class='ctx'> 	/* The main program needs a little extra setup in the task structure */</div><div class='del'>-	if (id == 0) {</div><div class='del'>-		current-&gt;mm-&gt;start_code = start_code;</div><div class='del'>-		current-&gt;mm-&gt;end_code = end_code;</div><div class='del'>-		current-&gt;mm-&gt;start_data = datapos;</div><div class='del'>-		current-&gt;mm-&gt;end_data = datapos + data_len;</div><div class='del'>-		/*</div><div class='del'>-		 * set up the brk stuff, uses any slack left in data/bss/stack</div><div class='del'>-		 * allocation.  We put the brk after the bss (between the bss</div><div class='del'>-		 * and stack) like other platforms.</div><div class='del'>-		 * Userspace code relies on the stack pointer starting out at</div><div class='del'>-		 * an address right at the end of a page.</div><div class='del'>-		 */</div><div class='del'>-		current-&gt;mm-&gt;start_brk = datapos + data_len + bss_len;</div><div class='del'>-		current-&gt;mm-&gt;brk = (current-&gt;mm-&gt;start_brk + 3) &amp; ~3;</div><div class='add'>+	current-&gt;mm-&gt;start_code = start_code;</div><div class='add'>+	current-&gt;mm-&gt;end_code = end_code;</div><div class='add'>+	current-&gt;mm-&gt;start_data = datapos;</div><div class='add'>+	current-&gt;mm-&gt;end_data = datapos + data_len;</div><div class='add'>+	/*</div><div class='add'>+	 * set up the brk stuff, uses any slack left in data/bss/stack</div><div class='add'>+	 * allocation.  We put the brk after the bss (between the bss</div><div class='add'>+	 * and stack) like other platforms.</div><div class='add'>+	 * Userspace code relies on the stack pointer starting out at</div><div class='add'>+	 * an address right at the end of a page.</div><div class='add'>+	 */</div><div class='add'>+	current-&gt;mm-&gt;start_brk = datapos + data_len + bss_len;</div><div class='add'>+	current-&gt;mm-&gt;brk = (current-&gt;mm-&gt;start_brk + 3) &amp; ~3;</div><div class='ctx'> #ifndef CONFIG_MMU</div><div class='del'>-		current-&gt;mm-&gt;context.end_brk = memp + memp_size - stack_len;</div><div class='add'>+	current-&gt;mm-&gt;context.end_brk = memp + memp_size - stack_len;</div><div class='ctx'> #endif</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; FLAT_FLAG_KTRACE) {</div><div class='ctx'> 		pr_info("Mapping is %lx, Entry point is %x, data_start is %x\n",</div><div class='ctx'> 			textpos, 0x00ffffff&amp;ntohl(hdr-&gt;entry), ntohl(hdr-&gt;data_start));</div><div class='ctx'> 		pr_info("%s %s: TEXT=%lx-%lx DATA=%lx-%lx BSS=%lx-%lx\n",</div><div class='del'>-			id ? "Lib" : "Load", bprm-&gt;filename,</div><div class='add'>+			"Load", bprm-&gt;filename,</div><div class='ctx'> 			start_code, end_code, datapos, datapos + data_len,</div><div class='ctx'> 			datapos + data_len, (datapos + data_len + bss_len + 3) &amp; ~3);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Store the current module values into the global library structure */</div><div class='del'>-	libinfo-&gt;lib_list[id].start_code = start_code;</div><div class='del'>-	libinfo-&gt;lib_list[id].start_data = datapos;</div><div class='del'>-	libinfo-&gt;lib_list[id].start_brk = datapos + data_len + bss_len;</div><div class='del'>-	libinfo-&gt;lib_list[id].text_len = text_len;</div><div class='del'>-	libinfo-&gt;lib_list[id].loaded = 1;</div><div class='del'>-	libinfo-&gt;lib_list[id].entry = (0x00ffffff &amp; ntohl(hdr-&gt;entry)) + textpos;</div><div class='del'>-	libinfo-&gt;lib_list[id].build_date = ntohl(hdr-&gt;build_date);</div><div class='add'>+	libinfo-&gt;lib_list[0].start_code = start_code;</div><div class='add'>+	libinfo-&gt;lib_list[0].start_data = datapos;</div><div class='add'>+	libinfo-&gt;lib_list[0].start_brk = datapos + data_len + bss_len;</div><div class='add'>+	libinfo-&gt;lib_list[0].text_len = text_len;</div><div class='add'>+	libinfo-&gt;lib_list[0].loaded = 1;</div><div class='add'>+	libinfo-&gt;lib_list[0].entry = (0x00ffffff &amp; ntohl(hdr-&gt;entry)) + textpos;</div><div class='add'>+	libinfo-&gt;lib_list[0].build_date = ntohl(hdr-&gt;build_date);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We just load the allocations into some temporary memory to</div><div class='hunk'>@@ -782,14 +740,15 @@ static int load_flat_file(struct linux_binprm *bprm,</div><div class='ctx'> 	 * image.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (flags &amp; FLAT_FLAG_GOTPIC) {</div><div class='del'>-		for (rp = (u32 __user *)datapos; ; rp++) {</div><div class='add'>+		rp = skip_got_header((u32 __user *) datapos);</div><div class='add'>+		for (; ; rp++) {</div><div class='ctx'> 			u32 addr, rp_val;</div><div class='ctx'> 			if (get_user(rp_val, rp))</div><div class='ctx'> 				return -EFAULT;</div><div class='ctx'> 			if (rp_val == 0xffffffff)</div><div class='ctx'> 				break;</div><div class='ctx'> 			if (rp_val) {</div><div class='del'>-				addr = calc_reloc(rp_val, libinfo, id, 0);</div><div class='add'>+				addr = calc_reloc(rp_val, libinfo);</div><div class='ctx'> 				if (addr == RELOC_FAILED) {</div><div class='ctx'> 					ret = -ENOEXEC;</div><div class='ctx'> 					goto err;</div><div class='hunk'>@@ -825,7 +784,7 @@ static int load_flat_file(struct linux_binprm *bprm,</div><div class='ctx'> 				return -EFAULT;</div><div class='ctx'> 			relval = ntohl(tmp);</div><div class='ctx'> 			addr = flat_get_relocate_addr(relval);</div><div class='del'>-			rp = (u32 __user *)calc_reloc(addr, libinfo, id, 1);</div><div class='add'>+			rp = (u32 __user *)calc_reloc(addr, libinfo);</div><div class='ctx'> 			if (rp == (u32 __user *)RELOC_FAILED) {</div><div class='ctx'> 				ret = -ENOEXEC;</div><div class='ctx'> 				goto err;</div><div class='hunk'>@@ -848,7 +807,7 @@ static int load_flat_file(struct linux_binprm *bprm,</div><div class='ctx'> 					 */</div><div class='ctx'> 					addr = ntohl((__force __be32)addr);</div><div class='ctx'> 				}</div><div class='del'>-				addr = calc_reloc(addr, libinfo, id, 0);</div><div class='add'>+				addr = calc_reloc(addr, libinfo);</div><div class='ctx'> 				if (addr == RELOC_FAILED) {</div><div class='ctx'> 					ret = -ENOEXEC;</div><div class='ctx'> 					goto err;</div><div class='hunk'>@@ -876,7 +835,7 @@ static int load_flat_file(struct linux_binprm *bprm,</div><div class='ctx'> 	/* zero the BSS,  BRK and stack areas */</div><div class='ctx'> 	if (clear_user((void __user *)(datapos + data_len), bss_len +</div><div class='ctx'> 		       (memp + memp_size - stack_len -		/* end brk */</div><div class='del'>-		       libinfo-&gt;lib_list[id].start_brk) +	/* start brk */</div><div class='add'>+		       libinfo-&gt;lib_list[0].start_brk) +	/* start brk */</div><div class='ctx'> 		       stack_len))</div><div class='ctx'> 		return -EFAULT;</div><div class='ctx'> </div><div class='hunk'>@@ -887,49 +846,6 @@ err:</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> /****************************************************************************/</div><div class='del'>-#ifdef CONFIG_BINFMT_SHARED_FLAT</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Load a shared library into memory.  The library gets its own data</div><div class='del'>- * segment (including bss) but not argv/argc/environ.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-static int load_flat_shared_library(int id, struct lib_info *libs)</div><div class='del'>-{</div><div class='del'>-	/*</div><div class='del'>-	 * This is a fake bprm struct; only the members "buf", "file" and</div><div class='del'>-	 * "filename" are actually used.</div><div class='del'>-	 */</div><div class='del'>-	struct linux_binprm bprm;</div><div class='del'>-	int res;</div><div class='del'>-	char buf[16];</div><div class='del'>-	loff_t pos = 0;</div><div class='del'>-</div><div class='del'>-	memset(&amp;bprm, 0, sizeof(bprm));</div><div class='del'>-</div><div class='del'>-	/* Create the file name */</div><div class='del'>-	sprintf(buf, "/lib/lib%d.so", id);</div><div class='del'>-</div><div class='del'>-	/* Open the file up */</div><div class='del'>-	bprm.filename = buf;</div><div class='del'>-	bprm.file = open_exec(bprm.filename);</div><div class='del'>-	res = PTR_ERR(bprm.file);</div><div class='del'>-	if (IS_ERR(bprm.file))</div><div class='del'>-		return res;</div><div class='del'>-</div><div class='del'>-	res = kernel_read(bprm.file, bprm.buf, BINPRM_BUF_SIZE, &amp;pos);</div><div class='del'>-</div><div class='del'>-	if (res &gt;= 0)</div><div class='del'>-		res = load_flat_file(&amp;bprm, libs, id, NULL);</div><div class='del'>-</div><div class='del'>-	allow_write_access(bprm.file);</div><div class='del'>-	fput(bprm.file);</div><div class='del'>-</div><div class='del'>-	return res;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#endif /* CONFIG_BINFMT_SHARED_FLAT */</div><div class='del'>-/****************************************************************************/</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * These are the functions used to load flat style executables and shared</div><div class='hunk'>@@ -961,12 +877,12 @@ static int load_flat_binary(struct linux_binprm *bprm)</div><div class='ctx'> 	stack_len += (bprm-&gt;envc + 1) * sizeof(char *);   /* the envp array */</div><div class='ctx'> 	stack_len = ALIGN(stack_len, FLAT_STACK_ALIGN);</div><div class='ctx'> </div><div class='del'>-	res = load_flat_file(bprm, &amp;libinfo, 0, &amp;stack_len);</div><div class='add'>+	res = load_flat_file(bprm, &amp;libinfo, &amp;stack_len);</div><div class='ctx'> 	if (res &lt; 0)</div><div class='ctx'> 		return res;</div><div class='ctx'> </div><div class='ctx'> 	/* Update data segment pointers for all libraries */</div><div class='del'>-	for (i = 0; i &lt; MAX_SHARED_LIBS; i++) {</div><div class='add'>+	for (i = 0; i &lt; MAX_SHARED_LIBS_UPDATE; i++) {</div><div class='ctx'> 		if (!libinfo.lib_list[i].loaded)</div><div class='ctx'> 			continue;</div><div class='ctx'> 		for (j = 0; j &lt; MAX_SHARED_LIBS; j++) {</div><div class='hunk'>@@ -1006,20 +922,6 @@ static int load_flat_binary(struct linux_binprm *bprm)</div><div class='ctx'> 	 */</div><div class='ctx'> 	start_addr = libinfo.lib_list[0].entry;</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_BINFMT_SHARED_FLAT</div><div class='del'>-	for (i = MAX_SHARED_LIBS-1; i &gt; 0; i--) {</div><div class='del'>-		if (libinfo.lib_list[i].loaded) {</div><div class='del'>-			/* Push previos first to call address */</div><div class='del'>-			unsigned long __user *sp;</div><div class='del'>-			current-&gt;mm-&gt;start_stack -= sizeof(unsigned long);</div><div class='del'>-			sp = (unsigned long __user *)current-&gt;mm-&gt;start_stack;</div><div class='del'>-			if (put_user(start_addr, sp))</div><div class='del'>-				return -EFAULT;</div><div class='del'>-			start_addr = libinfo.lib_list[i].entry;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-#endif</div><div class='del'>-</div><div class='ctx'> #ifdef FLAT_PLAT_INIT</div><div class='ctx'> 	FLAT_PLAT_INIT(regs);</div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/binfmt_misc.c b/fs/binfmt_misc.c<br/>index e1eae7ea823a..8cb1a94339b8 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/binfmt_misc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/binfmt_misc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/binfmt_misc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/binfmt_misc.c</a></div><div class='hunk'>@@ -40,14 +40,11 @@ enum {</div><div class='ctx'> 	VERBOSE_STATUS = 1 /* make it zero to save 400 bytes kernel memory */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static LIST_HEAD(entries);</div><div class='del'>-static int enabled = 1;</div><div class='del'>-</div><div class='ctx'> enum {Enabled, Magic};</div><div class='del'>-#define MISC_FMT_PRESERVE_ARGV0 (1 &lt;&lt; 31)</div><div class='del'>-#define MISC_FMT_OPEN_BINARY (1 &lt;&lt; 30)</div><div class='del'>-#define MISC_FMT_CREDENTIALS (1 &lt;&lt; 29)</div><div class='del'>-#define MISC_FMT_OPEN_FILE (1 &lt;&lt; 28)</div><div class='add'>+#define MISC_FMT_PRESERVE_ARGV0 (1UL &lt;&lt; 31)</div><div class='add'>+#define MISC_FMT_OPEN_BINARY (1UL &lt;&lt; 30)</div><div class='add'>+#define MISC_FMT_CREDENTIALS (1UL &lt;&lt; 29)</div><div class='add'>+#define MISC_FMT_OPEN_FILE (1UL &lt;&lt; 28)</div><div class='ctx'> </div><div class='ctx'> typedef struct {</div><div class='ctx'> 	struct list_head list;</div><div class='hunk'>@@ -60,12 +57,10 @@ typedef struct {</div><div class='ctx'> 	char *name;</div><div class='ctx'> 	struct dentry *dentry;</div><div class='ctx'> 	struct file *interp_file;</div><div class='add'>+	refcount_t users;		/* sync removal with load_misc_binary() */</div><div class='ctx'> } Node;</div><div class='ctx'> </div><div class='del'>-static DEFINE_RWLOCK(entries_lock);</div><div class='ctx'> static struct file_system_type bm_fs_type;</div><div class='del'>-static struct vfsmount *bm_mnt;</div><div class='del'>-static int entry_count;</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Max length of the register string.  Determined by:</div><div class='hunk'>@@ -82,19 +77,24 @@ static int entry_count;</div><div class='ctx'>  */</div><div class='ctx'> #define MAX_REGISTER_LENGTH 1920</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Check if we support the binfmt</div><div class='del'>- * if we do, return the node, else NULL</div><div class='del'>- * locking is done in load_misc_binary</div><div class='add'>+/**</div><div class='add'>+ * search_binfmt_handler - search for a binary handler for @bprm</div><div class='add'>+ * @misc: handle to binfmt_misc instance</div><div class='add'>+ * @bprm: binary for which we are looking for a handler</div><div class='add'>+ *</div><div class='add'>+ * Search for a binary type handler for @bprm in the list of registered binary</div><div class='add'>+ * type handlers.</div><div class='add'>+ *</div><div class='add'>+ * Return: binary type list entry on success, NULL on failure</div><div class='ctx'>  */</div><div class='del'>-static Node *check_file(struct linux_binprm *bprm)</div><div class='add'>+static Node *search_binfmt_handler(struct binfmt_misc *misc,</div><div class='add'>+				   struct linux_binprm *bprm)</div><div class='ctx'> {</div><div class='ctx'> 	char *p = strrchr(bprm-&gt;interp, '.');</div><div class='del'>-	struct list_head *l;</div><div class='add'>+	Node *e;</div><div class='ctx'> </div><div class='ctx'> 	/* Walk all the registered handlers. */</div><div class='del'>-	list_for_each(l, &amp;entries) {</div><div class='del'>-		Node *e = list_entry(l, Node, list);</div><div class='add'>+	list_for_each_entry(e, &amp;misc-&gt;entries, list) {</div><div class='ctx'> 		char *s;</div><div class='ctx'> 		int j;</div><div class='ctx'> </div><div class='hunk'>@@ -123,9 +123,79 @@ static Node *check_file(struct linux_binprm *bprm)</div><div class='ctx'> 		if (j == e-&gt;size)</div><div class='ctx'> 			return e;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * get_binfmt_handler - try to find a binary type handler</div><div class='add'>+ * @misc: handle to binfmt_misc instance</div><div class='add'>+ * @bprm: binary for which we are looking for a handler</div><div class='add'>+ *</div><div class='add'>+ * Try to find a binfmt handler for the binary type. If one is found take a</div><div class='add'>+ * reference to protect against removal via bm_{entry,status}_write().</div><div class='add'>+ *</div><div class='add'>+ * Return: binary type list entry on success, NULL on failure</div><div class='add'>+ */</div><div class='add'>+static Node *get_binfmt_handler(struct binfmt_misc *misc,</div><div class='add'>+				struct linux_binprm *bprm)</div><div class='add'>+{</div><div class='add'>+	Node *e;</div><div class='add'>+</div><div class='add'>+	read_lock(&amp;misc-&gt;entries_lock);</div><div class='add'>+	e = search_binfmt_handler(misc, bprm);</div><div class='add'>+	if (e)</div><div class='add'>+		refcount_inc(&amp;e-&gt;users);</div><div class='add'>+	read_unlock(&amp;misc-&gt;entries_lock);</div><div class='add'>+	return e;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * put_binfmt_handler - put binary handler node</div><div class='add'>+ * @e: node to put</div><div class='add'>+ *</div><div class='add'>+ * Free node syncing with load_misc_binary() and defer final free to</div><div class='add'>+ * load_misc_binary() in case it is using the binary type handler we were</div><div class='add'>+ * requested to remove.</div><div class='add'>+ */</div><div class='add'>+static void put_binfmt_handler(Node *e)</div><div class='add'>+{</div><div class='add'>+	if (refcount_dec_and_test(&amp;e-&gt;users)) {</div><div class='add'>+		if (e-&gt;flags &amp; MISC_FMT_OPEN_FILE)</div><div class='add'>+			filp_close(e-&gt;interp_file, NULL);</div><div class='add'>+		kfree(e);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * load_binfmt_misc - load the binfmt_misc of the caller's user namespace</div><div class='add'>+ *</div><div class='add'>+ * To be called in load_misc_binary() to load the relevant struct binfmt_misc.</div><div class='add'>+ * If a user namespace doesn't have its own binfmt_misc mount it can make use</div><div class='add'>+ * of its ancestor's binfmt_misc handlers. This mimicks the behavior of</div><div class='add'>+ * pre-namespaced binfmt_misc where all registered binfmt_misc handlers where</div><div class='add'>+ * available to all user and user namespaces on the system.</div><div class='add'>+ *</div><div class='add'>+ * Return: the binfmt_misc instance of the caller's user namespace</div><div class='add'>+ */</div><div class='add'>+static struct binfmt_misc *load_binfmt_misc(void)</div><div class='add'>+{</div><div class='add'>+	const struct user_namespace *user_ns;</div><div class='add'>+	struct binfmt_misc *misc;</div><div class='add'>+</div><div class='add'>+	user_ns = current_user_ns();</div><div class='add'>+	while (user_ns) {</div><div class='add'>+		/* Pairs with smp_store_release() in bm_fill_super(). */</div><div class='add'>+		misc = smp_load_acquire(&amp;user_ns-&gt;binfmt_misc);</div><div class='add'>+		if (misc)</div><div class='add'>+			return misc;</div><div class='add'>+</div><div class='add'>+		user_ns = user_ns-&gt;parent;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return &amp;init_binfmt_misc;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * the loader itself</div><div class='ctx'>  */</div><div class='hunk'>@@ -133,18 +203,14 @@ static int load_misc_binary(struct linux_binprm *bprm)</div><div class='ctx'> {</div><div class='ctx'> 	Node *fmt;</div><div class='ctx'> 	struct file *interp_file = NULL;</div><div class='del'>-	int retval;</div><div class='add'>+	int retval = -ENOEXEC;</div><div class='add'>+	struct binfmt_misc *misc;</div><div class='ctx'> </div><div class='del'>-	retval = -ENOEXEC;</div><div class='del'>-	if (!enabled)</div><div class='add'>+	misc = load_binfmt_misc();</div><div class='add'>+	if (!misc-&gt;enabled)</div><div class='ctx'> 		return retval;</div><div class='ctx'> </div><div class='del'>-	/* to keep locking time low, we copy the interpreter string */</div><div class='del'>-	read_lock(&amp;entries_lock);</div><div class='del'>-	fmt = check_file(bprm);</div><div class='del'>-	if (fmt)</div><div class='del'>-		dget(fmt-&gt;dentry);</div><div class='del'>-	read_unlock(&amp;entries_lock);</div><div class='add'>+	fmt = get_binfmt_handler(misc, bprm);</div><div class='ctx'> 	if (!fmt)</div><div class='ctx'> 		return retval;</div><div class='ctx'> </div><div class='hunk'>@@ -198,7 +264,16 @@ static int load_misc_binary(struct linux_binprm *bprm)</div><div class='ctx'> </div><div class='ctx'> 	retval = 0;</div><div class='ctx'> ret:</div><div class='del'>-	dput(fmt-&gt;dentry);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If we actually put the node here all concurrent calls to</div><div class='add'>+	 * load_misc_binary() will have finished. We also know</div><div class='add'>+	 * that for the refcount to be zero someone must have concurently</div><div class='add'>+	 * removed the binary type handler from the list and it's our job to</div><div class='add'>+	 * free it.</div><div class='add'>+	 */</div><div class='add'>+	put_binfmt_handler(fmt);</div><div class='add'>+</div><div class='ctx'> 	return retval;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -287,7 +362,7 @@ static Node *create_entry(const char __user *buffer, size_t count)</div><div class='ctx'> </div><div class='ctx'> 	err = -ENOMEM;</div><div class='ctx'> 	memsize = sizeof(Node) + count + 8;</div><div class='del'>-	e = kmalloc(memsize, GFP_KERNEL);</div><div class='add'>+	e = kmalloc(memsize, GFP_KERNEL_ACCOUNT);</div><div class='ctx'> 	if (!e)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -399,7 +474,7 @@ static Node *create_entry(const char __user *buffer, size_t count)</div><div class='ctx'> </div><div class='ctx'> 			if (e-&gt;mask) {</div><div class='ctx'> 				int i;</div><div class='del'>-				char *masked = kmalloc(e-&gt;size, GFP_KERNEL);</div><div class='add'>+				char *masked = kmalloc(e-&gt;size, GFP_KERNEL_ACCOUNT);</div><div class='ctx'> </div><div class='ctx'> 				print_hex_dump_bytes(</div><div class='ctx'> 					KBUILD_MODNAME ": register:  mask[decoded]: ",</div><div class='hunk'>@@ -547,36 +622,76 @@ static struct inode *bm_get_inode(struct super_block *sb, int mode)</div><div class='ctx'> 	if (inode) {</div><div class='ctx'> 		inode-&gt;i_ino = get_next_ino();</div><div class='ctx'> 		inode-&gt;i_mode = mode;</div><div class='del'>-		inode-&gt;i_atime = inode-&gt;i_mtime = inode-&gt;i_ctime =</div><div class='del'>-			current_time(inode);</div><div class='add'>+		simple_inode_init_ts(inode);</div><div class='ctx'> 	}</div><div class='ctx'> 	return inode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * i_binfmt_misc - retrieve struct binfmt_misc from a binfmt_misc inode</div><div class='add'>+ * @inode: inode of the relevant binfmt_misc instance</div><div class='add'>+ *</div><div class='add'>+ * This helper retrieves struct binfmt_misc from a binfmt_misc inode. This can</div><div class='add'>+ * be done without any memory barriers because we are guaranteed that</div><div class='add'>+ * user_ns-&gt;binfmt_misc is fully initialized. It was fully initialized when the</div><div class='add'>+ * binfmt_misc mount was first created.</div><div class='add'>+ *</div><div class='add'>+ * Return: struct binfmt_misc of the relevant binfmt_misc instance</div><div class='add'>+ */</div><div class='add'>+static struct binfmt_misc *i_binfmt_misc(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	return inode-&gt;i_sb-&gt;s_user_ns-&gt;binfmt_misc;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * bm_evict_inode - cleanup data associated with @inode</div><div class='add'>+ * @inode: inode to which the data is attached</div><div class='add'>+ *</div><div class='add'>+ * Cleanup the binary type handler data associated with @inode if a binary type</div><div class='add'>+ * entry is removed or the filesystem is unmounted and the super block is</div><div class='add'>+ * shutdown.</div><div class='add'>+ *</div><div class='add'>+ * If the -&gt;evict call was not caused by a super block shutdown but by a write</div><div class='add'>+ * to remove the entry or all entries via bm_{entry,status}_write() the entry</div><div class='add'>+ * will have already been removed from the list. We keep the list_empty() check</div><div class='add'>+ * to make that explicit.</div><div class='add'>+*/</div><div class='ctx'> static void bm_evict_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	Node *e = inode-&gt;i_private;</div><div class='ctx'> </div><div class='del'>-	if (e &amp;&amp; e-&gt;flags &amp; MISC_FMT_OPEN_FILE)</div><div class='del'>-		filp_close(e-&gt;interp_file, NULL);</div><div class='del'>-</div><div class='ctx'> 	clear_inode(inode);</div><div class='del'>-	kfree(e);</div><div class='add'>+</div><div class='add'>+	if (e) {</div><div class='add'>+		struct binfmt_misc *misc;</div><div class='add'>+</div><div class='add'>+		misc = i_binfmt_misc(inode);</div><div class='add'>+		write_lock(&amp;misc-&gt;entries_lock);</div><div class='add'>+		if (!list_empty(&amp;e-&gt;list))</div><div class='add'>+			list_del_init(&amp;e-&gt;list);</div><div class='add'>+		write_unlock(&amp;misc-&gt;entries_lock);</div><div class='add'>+		put_binfmt_handler(e);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void kill_node(Node *e)</div><div class='add'>+/**</div><div class='add'>+ * remove_binfmt_handler - remove a binary type handler</div><div class='add'>+ * @misc: handle to binfmt_misc instance</div><div class='add'>+ * @e: binary type handler to remove</div><div class='add'>+ *</div><div class='add'>+ * Remove a binary type handler from the list of binary type handlers and</div><div class='add'>+ * remove its associated dentry. This is called from</div><div class='add'>+ * binfmt_{entry,status}_write(). In the future, we might want to think about</div><div class='add'>+ * adding a proper -&gt;unlink() method to binfmt_misc instead of forcing caller's</div><div class='add'>+ * to use writes to files in order to delete binary type handlers. But it has</div><div class='add'>+ * worked for so long that it's not a pressing issue.</div><div class='add'>+ */</div><div class='add'>+static void remove_binfmt_handler(struct binfmt_misc *misc, Node *e)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *dentry;</div><div class='del'>-</div><div class='del'>-	write_lock(&amp;entries_lock);</div><div class='add'>+	write_lock(&amp;misc-&gt;entries_lock);</div><div class='ctx'> 	list_del_init(&amp;e-&gt;list);</div><div class='del'>-	write_unlock(&amp;entries_lock);</div><div class='del'>-</div><div class='del'>-	dentry = e-&gt;dentry;</div><div class='del'>-	drop_nlink(d_inode(dentry));</div><div class='del'>-	d_drop(dentry);</div><div class='del'>-	dput(dentry);</div><div class='del'>-	simple_release_fs(&amp;bm_mnt, &amp;entry_count);</div><div class='add'>+	write_unlock(&amp;misc-&gt;entries_lock);</div><div class='add'>+	locked_recursive_removal(e-&gt;dentry, NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* /&lt;entry&gt; */</div><div class='hunk'>@@ -603,8 +718,8 @@ bm_entry_read(struct file *file, char __user *buf, size_t nbytes, loff_t *ppos)</div><div class='ctx'> static ssize_t bm_entry_write(struct file *file, const char __user *buffer,</div><div class='ctx'> 				size_t count, loff_t *ppos)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *root;</div><div class='del'>-	Node *e = file_inode(file)-&gt;i_private;</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='add'>+	Node *e = inode-&gt;i_private;</div><div class='ctx'> 	int res = parse_command(buffer, count);</div><div class='ctx'> </div><div class='ctx'> 	switch (res) {</div><div class='hunk'>@@ -618,13 +733,22 @@ static ssize_t bm_entry_write(struct file *file, const char __user *buffer,</div><div class='ctx'> 		break;</div><div class='ctx'> 	case 3:</div><div class='ctx'> 		/* Delete this handler. */</div><div class='del'>-		root = file_inode(file)-&gt;i_sb-&gt;s_root;</div><div class='del'>-		inode_lock(d_inode(root));</div><div class='add'>+		inode = d_inode(inode-&gt;i_sb-&gt;s_root);</div><div class='add'>+		inode_lock_nested(inode, I_MUTEX_PARENT);</div><div class='ctx'> </div><div class='add'>+		/*</div><div class='add'>+		 * In order to add new element or remove elements from the list</div><div class='add'>+		 * via bm_{entry,register,status}_write() inode_lock() on the</div><div class='add'>+		 * root inode must be held.</div><div class='add'>+		 * The lock is exclusive ensuring that the list can't be</div><div class='add'>+		 * modified. Only load_misc_binary() can access but does so</div><div class='add'>+		 * read-only. So we only need to take the write lock when we</div><div class='add'>+		 * actually remove the entry from the list.</div><div class='add'>+		 */</div><div class='ctx'> 		if (!list_empty(&amp;e-&gt;list))</div><div class='del'>-			kill_node(e);</div><div class='add'>+			remove_binfmt_handler(i_binfmt_misc(inode), e);</div><div class='ctx'> </div><div class='del'>-		inode_unlock(d_inode(root));</div><div class='add'>+		inode_unlock(inode);</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		return res;</div><div class='hunk'>@@ -641,13 +765,41 @@ static const struct file_operations bm_entry_operations = {</div><div class='ctx'> </div><div class='ctx'> /* /register */</div><div class='ctx'> </div><div class='add'>+/* add to filesystem */</div><div class='add'>+static int add_entry(Node *e, struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct dentry *dentry = simple_start_creating(sb-&gt;s_root, e-&gt;name);</div><div class='add'>+	struct inode *inode;</div><div class='add'>+	struct binfmt_misc *misc;</div><div class='add'>+</div><div class='add'>+	if (IS_ERR(dentry))</div><div class='add'>+		return PTR_ERR(dentry);</div><div class='add'>+</div><div class='add'>+	inode = bm_get_inode(sb, S_IFREG | 0644);</div><div class='add'>+	if (unlikely(!inode)) {</div><div class='add'>+		simple_done_creating(dentry);</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	refcount_set(&amp;e-&gt;users, 1);</div><div class='add'>+	e-&gt;dentry = dentry;</div><div class='add'>+	inode-&gt;i_private = e;</div><div class='add'>+	inode-&gt;i_fop = &amp;bm_entry_operations;</div><div class='add'>+</div><div class='add'>+	d_make_persistent(dentry, inode);</div><div class='add'>+	misc = i_binfmt_misc(inode);</div><div class='add'>+	write_lock(&amp;misc-&gt;entries_lock);</div><div class='add'>+	list_add(&amp;e-&gt;list, &amp;misc-&gt;entries);</div><div class='add'>+	write_unlock(&amp;misc-&gt;entries_lock);</div><div class='add'>+	simple_done_creating(dentry);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static ssize_t bm_register_write(struct file *file, const char __user *buffer,</div><div class='ctx'> 			       size_t count, loff_t *ppos)</div><div class='ctx'> {</div><div class='ctx'> 	Node *e;</div><div class='del'>-	struct inode *inode;</div><div class='ctx'> 	struct super_block *sb = file_inode(file)-&gt;i_sb;</div><div class='del'>-	struct dentry *root = sb-&gt;s_root, *dentry;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> 	struct file *f = NULL;</div><div class='ctx'> </div><div class='hunk'>@@ -657,7 +809,15 @@ static ssize_t bm_register_write(struct file *file, const char __user *buffer,</div><div class='ctx'> 		return PTR_ERR(e);</div><div class='ctx'> </div><div class='ctx'> 	if (e-&gt;flags &amp; MISC_FMT_OPEN_FILE) {</div><div class='del'>-		f = open_exec(e-&gt;interpreter);</div><div class='add'>+		/*</div><div class='add'>+		 * Now that we support unprivileged binfmt_misc mounts make</div><div class='add'>+		 * sure we use the credentials that the register @file was</div><div class='add'>+		 * opened with to also open the interpreter. Before that this</div><div class='add'>+		 * didn't matter much as only a privileged process could open</div><div class='add'>+		 * the register file.</div><div class='add'>+		 */</div><div class='add'>+		scoped_with_creds(file-&gt;f_cred)</div><div class='add'>+			f = open_exec(e-&gt;interpreter);</div><div class='ctx'> 		if (IS_ERR(f)) {</div><div class='ctx'> 			pr_notice("register: failed to install interpreter file %s\n",</div><div class='ctx'> 				 e-&gt;interpreter);</div><div class='hunk'>@@ -667,47 +827,12 @@ static ssize_t bm_register_write(struct file *file, const char __user *buffer,</div><div class='ctx'> 		e-&gt;interp_file = f;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	inode_lock(d_inode(root));</div><div class='del'>-	dentry = lookup_one_len(e-&gt;name, root, strlen(e-&gt;name));</div><div class='del'>-	err = PTR_ERR(dentry);</div><div class='del'>-	if (IS_ERR(dentry))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	err = -EEXIST;</div><div class='del'>-	if (d_really_is_positive(dentry))</div><div class='del'>-		goto out2;</div><div class='del'>-</div><div class='del'>-	inode = bm_get_inode(sb, S_IFREG | 0644);</div><div class='del'>-</div><div class='del'>-	err = -ENOMEM;</div><div class='del'>-	if (!inode)</div><div class='del'>-		goto out2;</div><div class='del'>-</div><div class='del'>-	err = simple_pin_fs(&amp;bm_fs_type, &amp;bm_mnt, &amp;entry_count);</div><div class='del'>-	if (err) {</div><div class='del'>-		iput(inode);</div><div class='del'>-		inode = NULL;</div><div class='del'>-		goto out2;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	e-&gt;dentry = dget(dentry);</div><div class='del'>-	inode-&gt;i_private = e;</div><div class='del'>-	inode-&gt;i_fop = &amp;bm_entry_operations;</div><div class='del'>-</div><div class='del'>-	d_instantiate(dentry, inode);</div><div class='del'>-	write_lock(&amp;entries_lock);</div><div class='del'>-	list_add(&amp;e-&gt;list, &amp;entries);</div><div class='del'>-	write_unlock(&amp;entries_lock);</div><div class='del'>-</div><div class='del'>-	err = 0;</div><div class='del'>-out2:</div><div class='del'>-	dput(dentry);</div><div class='del'>-out:</div><div class='del'>-	inode_unlock(d_inode(root));</div><div class='del'>-</div><div class='add'>+	err = add_entry(e, sb);</div><div class='ctx'> 	if (err) {</div><div class='del'>-		if (f)</div><div class='add'>+		if (f) {</div><div class='add'>+			exe_file_allow_write_access(f);</div><div class='ctx'> 			filp_close(f, NULL);</div><div class='add'>+		}</div><div class='ctx'> 		kfree(e);</div><div class='ctx'> 		return err;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -724,35 +849,50 @@ static const struct file_operations bm_register_operations = {</div><div class='ctx'> static ssize_t</div><div class='ctx'> bm_status_read(struct file *file, char __user *buf, size_t nbytes, loff_t *ppos)</div><div class='ctx'> {</div><div class='del'>-	char *s = enabled ? "enabled\n" : "disabled\n";</div><div class='add'>+	struct binfmt_misc *misc;</div><div class='add'>+	char *s;</div><div class='ctx'> </div><div class='add'>+	misc = i_binfmt_misc(file_inode(file));</div><div class='add'>+	s = misc-&gt;enabled ? "enabled\n" : "disabled\n";</div><div class='ctx'> 	return simple_read_from_buffer(buf, nbytes, ppos, s, strlen(s));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t bm_status_write(struct file *file, const char __user *buffer,</div><div class='ctx'> 		size_t count, loff_t *ppos)</div><div class='ctx'> {</div><div class='add'>+	struct binfmt_misc *misc;</div><div class='ctx'> 	int res = parse_command(buffer, count);</div><div class='del'>-	struct dentry *root;</div><div class='add'>+	Node *e, *next;</div><div class='add'>+	struct inode *inode;</div><div class='ctx'> </div><div class='add'>+	misc = i_binfmt_misc(file_inode(file));</div><div class='ctx'> 	switch (res) {</div><div class='ctx'> 	case 1:</div><div class='ctx'> 		/* Disable all handlers. */</div><div class='del'>-		enabled = 0;</div><div class='add'>+		misc-&gt;enabled = false;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case 2:</div><div class='ctx'> 		/* Enable all handlers. */</div><div class='del'>-		enabled = 1;</div><div class='add'>+		misc-&gt;enabled = true;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case 3:</div><div class='ctx'> 		/* Delete all handlers. */</div><div class='del'>-		root = file_inode(file)-&gt;i_sb-&gt;s_root;</div><div class='del'>-		inode_lock(d_inode(root));</div><div class='add'>+		inode = d_inode(file_inode(file)-&gt;i_sb-&gt;s_root);</div><div class='add'>+		inode_lock_nested(inode, I_MUTEX_PARENT);</div><div class='ctx'> </div><div class='del'>-		while (!list_empty(&amp;entries))</div><div class='del'>-			kill_node(list_first_entry(&amp;entries, Node, list));</div><div class='add'>+		/*</div><div class='add'>+		 * In order to add new element or remove elements from the list</div><div class='add'>+		 * via bm_{entry,register,status}_write() inode_lock() on the</div><div class='add'>+		 * root inode must be held.</div><div class='add'>+		 * The lock is exclusive ensuring that the list can't be</div><div class='add'>+		 * modified. Only load_misc_binary() can access but does so</div><div class='add'>+		 * read-only. So we only need to take the write lock when we</div><div class='add'>+		 * actually remove the entry from the list.</div><div class='add'>+		 */</div><div class='add'>+		list_for_each_entry_safe(e, next, &amp;misc-&gt;entries, list)</div><div class='add'>+			remove_binfmt_handler(misc, e);</div><div class='ctx'> </div><div class='del'>-		inode_unlock(d_inode(root));</div><div class='add'>+		inode_unlock(inode);</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		return res;</div><div class='hunk'>@@ -769,32 +909,100 @@ static const struct file_operations bm_status_operations = {</div><div class='ctx'> </div><div class='ctx'> /* Superblock handling */</div><div class='ctx'> </div><div class='add'>+static void bm_put_super(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct user_namespace *user_ns = sb-&gt;s_fs_info;</div><div class='add'>+</div><div class='add'>+	sb-&gt;s_fs_info = NULL;</div><div class='add'>+	put_user_ns(user_ns);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static const struct super_operations s_ops = {</div><div class='ctx'> 	.statfs		= simple_statfs,</div><div class='ctx'> 	.evict_inode	= bm_evict_inode,</div><div class='add'>+	.put_super	= bm_put_super,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static int bm_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='add'>+	struct user_namespace *user_ns = sb-&gt;s_user_ns;</div><div class='add'>+	struct binfmt_misc *misc;</div><div class='ctx'> 	static const struct tree_descr bm_files[] = {</div><div class='ctx'> 		[2] = {"status", &amp;bm_status_operations, S_IWUSR|S_IRUGO},</div><div class='ctx'> 		[3] = {"register", &amp;bm_register_operations, S_IWUSR},</div><div class='ctx'> 		/* last one */ {""}</div><div class='ctx'> 	};</div><div class='ctx'> </div><div class='add'>+	if (WARN_ON(user_ns != current_user_ns()))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Lazily allocate a new binfmt_misc instance for this namespace, i.e.</div><div class='add'>+	 * do it here during the first mount of binfmt_misc. We don't need to</div><div class='add'>+	 * waste memory for every user namespace allocation. It's likely much</div><div class='add'>+	 * more common to not mount a separate binfmt_misc instance than it is</div><div class='add'>+	 * to mount one.</div><div class='add'>+	 *</div><div class='add'>+	 * While multiple superblocks can exist they are keyed by userns in</div><div class='add'>+	 * s_fs_info for binfmt_misc. Hence, the vfs guarantees that</div><div class='add'>+	 * bm_fill_super() is called exactly once whenever a binfmt_misc</div><div class='add'>+	 * superblock for a userns is created. This in turn lets us conclude</div><div class='add'>+	 * that when a binfmt_misc superblock is created for the first time for</div><div class='add'>+	 * a userns there's no one racing us. Therefore we don't need any</div><div class='add'>+	 * barriers when we dereference binfmt_misc.</div><div class='add'>+	 */</div><div class='add'>+	misc = user_ns-&gt;binfmt_misc;</div><div class='add'>+	if (!misc) {</div><div class='add'>+		/*</div><div class='add'>+		 * If it turns out that most user namespaces actually want to</div><div class='add'>+		 * register their own binary type handler and therefore all</div><div class='add'>+		 * create their own separate binfmt_misc mounts we should</div><div class='add'>+		 * consider turning this into a kmem cache.</div><div class='add'>+		 */</div><div class='add'>+		misc = kzalloc(sizeof(struct binfmt_misc), GFP_KERNEL);</div><div class='add'>+		if (!misc)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+</div><div class='add'>+		INIT_LIST_HEAD(&amp;misc-&gt;entries);</div><div class='add'>+		rwlock_init(&amp;misc-&gt;entries_lock);</div><div class='add'>+</div><div class='add'>+		/* Pairs with smp_load_acquire() in load_binfmt_misc(). */</div><div class='add'>+		smp_store_release(&amp;user_ns-&gt;binfmt_misc, misc);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * When the binfmt_misc superblock for this userns is shutdown</div><div class='add'>+	 * -&gt;enabled might have been set to false and we don't reinitialize</div><div class='add'>+	 * -&gt;enabled again in put_super() as someone might already be mounting</div><div class='add'>+	 * binfmt_misc again. It also would be pointless since by the time</div><div class='add'>+	 * -&gt;put_super() is called we know that the binary type list for this</div><div class='add'>+	 * bintfmt_misc mount is empty making load_misc_binary() return</div><div class='add'>+	 * -ENOEXEC independent of whether -&gt;enabled is true. Instead, if</div><div class='add'>+	 * someone mounts binfmt_misc for the first time or again we simply</div><div class='add'>+	 * reset -&gt;enabled to true.</div><div class='add'>+	 */</div><div class='add'>+	misc-&gt;enabled = true;</div><div class='add'>+</div><div class='ctx'> 	err = simple_fill_super(sb, BINFMTFS_MAGIC, bm_files);</div><div class='ctx'> 	if (!err)</div><div class='ctx'> 		sb-&gt;s_op = &amp;s_ops;</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void bm_free(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	if (fc-&gt;s_fs_info)</div><div class='add'>+		put_user_ns(fc-&gt;s_fs_info);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int bm_get_tree(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	return get_tree_single(fc, bm_fill_super);</div><div class='add'>+	return get_tree_keyed(fc, bm_fill_super, get_user_ns(fc-&gt;user_ns));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct fs_context_operations bm_context_ops = {</div><div class='add'>+	.free		= bm_free,</div><div class='ctx'> 	.get_tree	= bm_get_tree,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -813,7 +1021,8 @@ static struct file_system_type bm_fs_type = {</div><div class='ctx'> 	.owner		= THIS_MODULE,</div><div class='ctx'> 	.name		= "binfmt_misc",</div><div class='ctx'> 	.init_fs_context = bm_init_fs_context,</div><div class='del'>-	.kill_sb	= kill_litter_super,</div><div class='add'>+	.fs_flags	= FS_USERNS_MOUNT,</div><div class='add'>+	.kill_sb	= kill_anon_super,</div><div class='ctx'> };</div><div class='ctx'> MODULE_ALIAS_FS("binfmt_misc");</div><div class='ctx'> </div><div class='hunk'>@@ -833,4 +1042,5 @@ static void __exit exit_misc_binfmt(void)</div><div class='ctx'> </div><div class='ctx'> core_initcall(init_misc_binfmt);</div><div class='ctx'> module_exit(exit_misc_binfmt);</div><div class='add'>+MODULE_DESCRIPTION("Kernel support for miscellaneous binaries");</div><div class='ctx'> MODULE_LICENSE("GPL");</div><div class='head'>diff --git a/fs/binfmt_script.c b/fs/binfmt_script.c<br/>index 1b6625e95958..637daf6e4d45 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/binfmt_script.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/binfmt_script.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/binfmt_script.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/binfmt_script.c</a></div><div class='hunk'>@@ -155,4 +155,5 @@ static void __exit exit_script_binfmt(void)</div><div class='ctx'> </div><div class='ctx'> core_initcall(init_script_binfmt);</div><div class='ctx'> module_exit(exit_script_binfmt);</div><div class='add'>+MODULE_DESCRIPTION("Kernel support for scripts starting with #!");</div><div class='ctx'> MODULE_LICENSE("GPL");</div><div class='head'>diff --git a/fs/bpf_fs_kfuncs.c b/fs/bpf_fs_kfuncs.c<br/>new file mode 100644<br/>index 000000000000..5ace2511fec5<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/bpf_fs_kfuncs.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/bpf_fs_kfuncs.c</a></div><div class='hunk'>@@ -0,0 +1,422 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+/* Copyright (c) 2024 Google LLC. */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/bpf.h&gt;</div><div class='add'>+#include &lt;linux/bpf_lsm.h&gt;</div><div class='add'>+#include &lt;linux/btf.h&gt;</div><div class='add'>+#include &lt;linux/btf_ids.h&gt;</div><div class='add'>+#include &lt;linux/dcache.h&gt;</div><div class='add'>+#include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/fsnotify.h&gt;</div><div class='add'>+#include &lt;linux/file.h&gt;</div><div class='add'>+#include &lt;linux/kernfs.h&gt;</div><div class='add'>+#include &lt;linux/mm.h&gt;</div><div class='add'>+#include &lt;linux/xattr.h&gt;</div><div class='add'>+</div><div class='add'>+__bpf_kfunc_start_defs();</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * bpf_get_task_exe_file - get a reference on the exe_file struct file member of</div><div class='add'>+ *                         the mm_struct that is nested within the supplied</div><div class='add'>+ *                         task_struct</div><div class='add'>+ * @task: task_struct of which the nested mm_struct exe_file member to get a</div><div class='add'>+ * reference on</div><div class='add'>+ *</div><div class='add'>+ * Get a reference on the exe_file struct file member field of the mm_struct</div><div class='add'>+ * nested within the supplied *task*. The referenced file pointer acquired by</div><div class='add'>+ * this BPF kfunc must be released using bpf_put_file(). Failing to call</div><div class='add'>+ * bpf_put_file() on the returned referenced struct file pointer that has been</div><div class='add'>+ * acquired by this BPF kfunc will result in the BPF program being rejected by</div><div class='add'>+ * the BPF verifier.</div><div class='add'>+ *</div><div class='add'>+ * This BPF kfunc may only be called from BPF LSM programs.</div><div class='add'>+ *</div><div class='add'>+ * Internally, this BPF kfunc leans on get_task_exe_file(), such that calling</div><div class='add'>+ * bpf_get_task_exe_file() would be analogous to calling get_task_exe_file()</div><div class='add'>+ * directly in kernel context.</div><div class='add'>+ *</div><div class='add'>+ * Return: A referenced struct file pointer to the exe_file member of the</div><div class='add'>+ * mm_struct that is nested within the supplied *task*. On error, NULL is</div><div class='add'>+ * returned.</div><div class='add'>+ */</div><div class='add'>+__bpf_kfunc struct file *bpf_get_task_exe_file(struct task_struct *task)</div><div class='add'>+{</div><div class='add'>+	return get_task_exe_file(task);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * bpf_put_file - put a reference on the supplied file</div><div class='add'>+ * @file: file to put a reference on</div><div class='add'>+ *</div><div class='add'>+ * Put a reference on the supplied *file*. Only referenced file pointers may be</div><div class='add'>+ * passed to this BPF kfunc. Attempting to pass an unreferenced file pointer, or</div><div class='add'>+ * any other arbitrary pointer for that matter, will result in the BPF program</div><div class='add'>+ * being rejected by the BPF verifier.</div><div class='add'>+ *</div><div class='add'>+ * This BPF kfunc may only be called from BPF LSM programs.</div><div class='add'>+ */</div><div class='add'>+__bpf_kfunc void bpf_put_file(struct file *file)</div><div class='add'>+{</div><div class='add'>+	fput(file);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * bpf_path_d_path - resolve the pathname for the supplied path</div><div class='add'>+ * @path: path to resolve the pathname for</div><div class='add'>+ * @buf: buffer to return the resolved pathname in</div><div class='add'>+ * @buf__sz: length of the supplied buffer</div><div class='add'>+ *</div><div class='add'>+ * Resolve the pathname for the supplied *path* and store it in *buf*. This BPF</div><div class='add'>+ * kfunc is the safer variant of the legacy bpf_d_path() helper and should be</div><div class='add'>+ * used in place of bpf_d_path() whenever possible. It enforces KF_TRUSTED_ARGS</div><div class='add'>+ * semantics, meaning that the supplied *path* must itself hold a valid</div><div class='add'>+ * reference, or else the BPF program will be outright rejected by the BPF</div><div class='add'>+ * verifier.</div><div class='add'>+ *</div><div class='add'>+ * This BPF kfunc may only be called from BPF LSM programs.</div><div class='add'>+ *</div><div class='add'>+ * Return: A positive integer corresponding to the length of the resolved</div><div class='add'>+ * pathname in *buf*, including the NUL termination character. On error, a</div><div class='add'>+ * negative integer is returned.</div><div class='add'>+ */</div><div class='add'>+__bpf_kfunc int bpf_path_d_path(const struct path *path, char *buf, size_t buf__sz)</div><div class='add'>+{</div><div class='add'>+	int len;</div><div class='add'>+	char *ret;</div><div class='add'>+</div><div class='add'>+	if (!buf__sz)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	ret = d_path(path, buf, buf__sz);</div><div class='add'>+	if (IS_ERR(ret))</div><div class='add'>+		return PTR_ERR(ret);</div><div class='add'>+</div><div class='add'>+	len = buf + buf__sz - ret;</div><div class='add'>+	memmove(buf, ret, len);</div><div class='add'>+	return len;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool match_security_bpf_prefix(const char *name__str)</div><div class='add'>+{</div><div class='add'>+	return !strncmp(name__str, XATTR_NAME_BPF_LSM, XATTR_NAME_BPF_LSM_LEN);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int bpf_xattr_read_permission(const char *name, struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	if (WARN_ON(!inode))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	/* Allow reading xattr with user. and security.bpf. prefix */</div><div class='add'>+	if (strncmp(name, XATTR_USER_PREFIX, XATTR_USER_PREFIX_LEN) &amp;&amp;</div><div class='add'>+	    !match_security_bpf_prefix(name))</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	return inode_permission(&amp;nop_mnt_idmap, inode, MAY_READ);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * bpf_get_dentry_xattr - get xattr of a dentry</div><div class='add'>+ * @dentry: dentry to get xattr from</div><div class='add'>+ * @name__str: name of the xattr</div><div class='add'>+ * @value_p: output buffer of the xattr value</div><div class='add'>+ *</div><div class='add'>+ * Get xattr *name__str* of *dentry* and store the output in *value_ptr*.</div><div class='add'>+ *</div><div class='add'>+ * For security reasons, only *name__str* with prefixes "user." or</div><div class='add'>+ * "security.bpf." are allowed.</div><div class='add'>+ *</div><div class='add'>+ * Return: length of the xattr value on success, a negative value on error.</div><div class='add'>+ */</div><div class='add'>+__bpf_kfunc int bpf_get_dentry_xattr(struct dentry *dentry, const char *name__str,</div><div class='add'>+				     struct bpf_dynptr *value_p)</div><div class='add'>+{</div><div class='add'>+	struct bpf_dynptr_kern *value_ptr = (struct bpf_dynptr_kern *)value_p;</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='add'>+	u32 value_len;</div><div class='add'>+	void *value;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	value_len = __bpf_dynptr_size(value_ptr);</div><div class='add'>+	value = __bpf_dynptr_data_rw(value_ptr, value_len);</div><div class='add'>+	if (!value)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	ret = bpf_xattr_read_permission(name__str, inode);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+	return __vfs_getxattr(dentry, inode, name__str, value, value_len);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * bpf_get_file_xattr - get xattr of a file</div><div class='add'>+ * @file: file to get xattr from</div><div class='add'>+ * @name__str: name of the xattr</div><div class='add'>+ * @value_p: output buffer of the xattr value</div><div class='add'>+ *</div><div class='add'>+ * Get xattr *name__str* of *file* and store the output in *value_ptr*.</div><div class='add'>+ *</div><div class='add'>+ * For security reasons, only *name__str* with prefixes "user." or</div><div class='add'>+ * "security.bpf." are allowed.</div><div class='add'>+ *</div><div class='add'>+ * Return: length of the xattr value on success, a negative value on error.</div><div class='add'>+ */</div><div class='add'>+__bpf_kfunc int bpf_get_file_xattr(struct file *file, const char *name__str,</div><div class='add'>+				   struct bpf_dynptr *value_p)</div><div class='add'>+{</div><div class='add'>+	struct dentry *dentry;</div><div class='add'>+</div><div class='add'>+	dentry = file_dentry(file);</div><div class='add'>+	return bpf_get_dentry_xattr(dentry, name__str, value_p);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+__bpf_kfunc_end_defs();</div><div class='add'>+</div><div class='add'>+static int bpf_xattr_write_permission(const char *name, struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	if (WARN_ON(!inode))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	/* Only allow setting and removing security.bpf. xattrs */</div><div class='add'>+	if (!match_security_bpf_prefix(name))</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	return inode_permission(&amp;nop_mnt_idmap, inode, MAY_WRITE);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * bpf_set_dentry_xattr_locked - set a xattr of a dentry</div><div class='add'>+ * @dentry: dentry to get xattr from</div><div class='add'>+ * @name__str: name of the xattr</div><div class='add'>+ * @value_p: xattr value</div><div class='add'>+ * @flags: flags to pass into filesystem operations</div><div class='add'>+ *</div><div class='add'>+ * Set xattr *name__str* of *dentry* to the value in *value_ptr*.</div><div class='add'>+ *</div><div class='add'>+ * For security reasons, only *name__str* with prefix "security.bpf."</div><div class='add'>+ * is allowed.</div><div class='add'>+ *</div><div class='add'>+ * The caller already locked dentry-&gt;d_inode.</div><div class='add'>+ *</div><div class='add'>+ * Return: 0 on success, a negative value on error.</div><div class='add'>+ */</div><div class='add'>+int bpf_set_dentry_xattr_locked(struct dentry *dentry, const char *name__str,</div><div class='add'>+				const struct bpf_dynptr *value_p, int flags)</div><div class='add'>+{</div><div class='add'>+</div><div class='add'>+	struct bpf_dynptr_kern *value_ptr = (struct bpf_dynptr_kern *)value_p;</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='add'>+	const void *value;</div><div class='add'>+	u32 value_len;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	value_len = __bpf_dynptr_size(value_ptr);</div><div class='add'>+	value = __bpf_dynptr_data(value_ptr, value_len);</div><div class='add'>+	if (!value)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	ret = bpf_xattr_write_permission(name__str, inode);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	ret = __vfs_setxattr(&amp;nop_mnt_idmap, dentry, inode, name__str,</div><div class='add'>+			     value, value_len, flags);</div><div class='add'>+	if (!ret) {</div><div class='add'>+		fsnotify_xattr(dentry);</div><div class='add'>+</div><div class='add'>+		/* This xattr is set by BPF LSM, so we do not call</div><div class='add'>+		 * security_inode_post_setxattr. Otherwise, we would</div><div class='add'>+		 * risk deadlocks by calling back to the same kfunc.</div><div class='add'>+		 *</div><div class='add'>+		 * This is the same as security_inode_setsecurity().</div><div class='add'>+		 */</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * bpf_remove_dentry_xattr_locked - remove a xattr of a dentry</div><div class='add'>+ * @dentry: dentry to get xattr from</div><div class='add'>+ * @name__str: name of the xattr</div><div class='add'>+ *</div><div class='add'>+ * Rmove xattr *name__str* of *dentry*.</div><div class='add'>+ *</div><div class='add'>+ * For security reasons, only *name__str* with prefix "security.bpf."</div><div class='add'>+ * is allowed.</div><div class='add'>+ *</div><div class='add'>+ * The caller already locked dentry-&gt;d_inode.</div><div class='add'>+ *</div><div class='add'>+ * Return: 0 on success, a negative value on error.</div><div class='add'>+ */</div><div class='add'>+int bpf_remove_dentry_xattr_locked(struct dentry *dentry, const char *name__str)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = bpf_xattr_write_permission(name__str, inode);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	ret = __vfs_removexattr(&amp;nop_mnt_idmap, dentry, name__str);</div><div class='add'>+	if (!ret) {</div><div class='add'>+		fsnotify_xattr(dentry);</div><div class='add'>+</div><div class='add'>+		/* This xattr is removed by BPF LSM, so we do not call</div><div class='add'>+		 * security_inode_post_removexattr. Otherwise, we would</div><div class='add'>+		 * risk deadlocks by calling back to the same kfunc.</div><div class='add'>+		 */</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+__bpf_kfunc_start_defs();</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * bpf_set_dentry_xattr - set a xattr of a dentry</div><div class='add'>+ * @dentry: dentry to get xattr from</div><div class='add'>+ * @name__str: name of the xattr</div><div class='add'>+ * @value_p: xattr value</div><div class='add'>+ * @flags: flags to pass into filesystem operations</div><div class='add'>+ *</div><div class='add'>+ * Set xattr *name__str* of *dentry* to the value in *value_ptr*.</div><div class='add'>+ *</div><div class='add'>+ * For security reasons, only *name__str* with prefix "security.bpf."</div><div class='add'>+ * is allowed.</div><div class='add'>+ *</div><div class='add'>+ * The caller has not locked dentry-&gt;d_inode.</div><div class='add'>+ *</div><div class='add'>+ * Return: 0 on success, a negative value on error.</div><div class='add'>+ */</div><div class='add'>+__bpf_kfunc int bpf_set_dentry_xattr(struct dentry *dentry, const char *name__str,</div><div class='add'>+				     const struct bpf_dynptr *value_p, int flags)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	inode_lock(inode);</div><div class='add'>+	ret = bpf_set_dentry_xattr_locked(dentry, name__str, value_p, flags);</div><div class='add'>+	inode_unlock(inode);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * bpf_remove_dentry_xattr - remove a xattr of a dentry</div><div class='add'>+ * @dentry: dentry to get xattr from</div><div class='add'>+ * @name__str: name of the xattr</div><div class='add'>+ *</div><div class='add'>+ * Rmove xattr *name__str* of *dentry*.</div><div class='add'>+ *</div><div class='add'>+ * For security reasons, only *name__str* with prefix "security.bpf."</div><div class='add'>+ * is allowed.</div><div class='add'>+ *</div><div class='add'>+ * The caller has not locked dentry-&gt;d_inode.</div><div class='add'>+ *</div><div class='add'>+ * Return: 0 on success, a negative value on error.</div><div class='add'>+ */</div><div class='add'>+__bpf_kfunc int bpf_remove_dentry_xattr(struct dentry *dentry, const char *name__str)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	inode_lock(inode);</div><div class='add'>+	ret = bpf_remove_dentry_xattr_locked(dentry, name__str);</div><div class='add'>+	inode_unlock(inode);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_CGROUPS</div><div class='add'>+/**</div><div class='add'>+ * bpf_cgroup_read_xattr - read xattr of a cgroup's node in cgroupfs</div><div class='add'>+ * @cgroup: cgroup to get xattr from</div><div class='add'>+ * @name__str: name of the xattr</div><div class='add'>+ * @value_p: output buffer of the xattr value</div><div class='add'>+ *</div><div class='add'>+ * Get xattr *name__str* of *cgroup* and store the output in *value_ptr*.</div><div class='add'>+ *</div><div class='add'>+ * For security reasons, only *name__str* with prefix "user." is allowed.</div><div class='add'>+ *</div><div class='add'>+ * Return: length of the xattr value on success, a negative value on error.</div><div class='add'>+ */</div><div class='add'>+__bpf_kfunc int bpf_cgroup_read_xattr(struct cgroup *cgroup, const char *name__str,</div><div class='add'>+					struct bpf_dynptr *value_p)</div><div class='add'>+{</div><div class='add'>+	struct bpf_dynptr_kern *value_ptr = (struct bpf_dynptr_kern *)value_p;</div><div class='add'>+	u32 value_len;</div><div class='add'>+	void *value;</div><div class='add'>+</div><div class='add'>+	/* Only allow reading "user.*" xattrs */</div><div class='add'>+	if (strncmp(name__str, XATTR_USER_PREFIX, XATTR_USER_PREFIX_LEN))</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	value_len = __bpf_dynptr_size(value_ptr);</div><div class='add'>+	value = __bpf_dynptr_data_rw(value_ptr, value_len);</div><div class='add'>+	if (!value)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	return kernfs_xattr_get(cgroup-&gt;kn, name__str, value, value_len);</div><div class='add'>+}</div><div class='add'>+#endif /* CONFIG_CGROUPS */</div><div class='add'>+</div><div class='add'>+__bpf_kfunc_end_defs();</div><div class='add'>+</div><div class='add'>+BTF_KFUNCS_START(bpf_fs_kfunc_set_ids)</div><div class='add'>+BTF_ID_FLAGS(func, bpf_get_task_exe_file,</div><div class='add'>+	     KF_ACQUIRE | KF_TRUSTED_ARGS | KF_RET_NULL)</div><div class='add'>+BTF_ID_FLAGS(func, bpf_put_file, KF_RELEASE)</div><div class='add'>+BTF_ID_FLAGS(func, bpf_path_d_path, KF_TRUSTED_ARGS)</div><div class='add'>+BTF_ID_FLAGS(func, bpf_get_dentry_xattr, KF_SLEEPABLE | KF_TRUSTED_ARGS)</div><div class='add'>+BTF_ID_FLAGS(func, bpf_get_file_xattr, KF_SLEEPABLE | KF_TRUSTED_ARGS)</div><div class='add'>+BTF_ID_FLAGS(func, bpf_set_dentry_xattr, KF_SLEEPABLE | KF_TRUSTED_ARGS)</div><div class='add'>+BTF_ID_FLAGS(func, bpf_remove_dentry_xattr, KF_SLEEPABLE | KF_TRUSTED_ARGS)</div><div class='add'>+BTF_KFUNCS_END(bpf_fs_kfunc_set_ids)</div><div class='add'>+</div><div class='add'>+static int bpf_fs_kfuncs_filter(const struct bpf_prog *prog, u32 kfunc_id)</div><div class='add'>+{</div><div class='add'>+	if (!btf_id_set8_contains(&amp;bpf_fs_kfunc_set_ids, kfunc_id) ||</div><div class='add'>+	    prog-&gt;type == BPF_PROG_TYPE_LSM)</div><div class='add'>+		return 0;</div><div class='add'>+	return -EACCES;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* bpf_[set|remove]_dentry_xattr.* hooks have KF_TRUSTED_ARGS and</div><div class='add'>+ * KF_SLEEPABLE, so they are only available to sleepable hooks with</div><div class='add'>+ * dentry arguments.</div><div class='add'>+ *</div><div class='add'>+ * Setting and removing xattr requires exclusive lock on dentry-&gt;d_inode.</div><div class='add'>+ * Some hooks already locked d_inode, while some hooks have not locked</div><div class='add'>+ * d_inode. Therefore, we need different kfuncs for different hooks.</div><div class='add'>+ * Specifically, hooks in the following list (d_inode_locked_hooks)</div><div class='add'>+ * should call bpf_[set|remove]_dentry_xattr_locked; while other hooks</div><div class='add'>+ * should call bpf_[set|remove]_dentry_xattr.</div><div class='add'>+ */</div><div class='add'>+BTF_SET_START(d_inode_locked_hooks)</div><div class='add'>+BTF_ID(func, bpf_lsm_inode_post_removexattr)</div><div class='add'>+BTF_ID(func, bpf_lsm_inode_post_setattr)</div><div class='add'>+BTF_ID(func, bpf_lsm_inode_post_setxattr)</div><div class='add'>+BTF_ID(func, bpf_lsm_inode_removexattr)</div><div class='add'>+BTF_ID(func, bpf_lsm_inode_rmdir)</div><div class='add'>+BTF_ID(func, bpf_lsm_inode_setattr)</div><div class='add'>+BTF_ID(func, bpf_lsm_inode_setxattr)</div><div class='add'>+BTF_ID(func, bpf_lsm_inode_unlink)</div><div class='add'>+#ifdef CONFIG_SECURITY_PATH</div><div class='add'>+BTF_ID(func, bpf_lsm_path_unlink)</div><div class='add'>+BTF_ID(func, bpf_lsm_path_rmdir)</div><div class='add'>+#endif /* CONFIG_SECURITY_PATH */</div><div class='add'>+BTF_SET_END(d_inode_locked_hooks)</div><div class='add'>+</div><div class='add'>+bool bpf_lsm_has_d_inode_locked(const struct bpf_prog *prog)</div><div class='add'>+{</div><div class='add'>+	return btf_id_set_contains(&amp;d_inode_locked_hooks, prog-&gt;aux-&gt;attach_btf_id);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct btf_kfunc_id_set bpf_fs_kfunc_set = {</div><div class='add'>+	.owner = THIS_MODULE,</div><div class='add'>+	.set = &amp;bpf_fs_kfunc_set_ids,</div><div class='add'>+	.filter = bpf_fs_kfuncs_filter,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int __init bpf_fs_kfuncs_init(void)</div><div class='add'>+{</div><div class='add'>+	return register_btf_kfunc_id_set(BPF_PROG_TYPE_LSM, &amp;bpf_fs_kfunc_set);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+late_initcall(bpf_fs_kfuncs_init);</div><div class='head'>diff --git a/fs/btrfs/Kconfig b/fs/btrfs/Kconfig<br/>index 520a0f6a7d9e..4438637c8900 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/Kconfig</a></div><div class='hunk'>@@ -2,9 +2,10 @@</div><div class='ctx'> </div><div class='ctx'> config BTRFS_FS</div><div class='ctx'> 	tristate "Btrfs filesystem support"</div><div class='add'>+	select BLK_CGROUP_PUNT_BIO</div><div class='add'>+	select CRC32</div><div class='ctx'> 	select CRYPTO</div><div class='ctx'> 	select CRYPTO_CRC32C</div><div class='del'>-	select LIBCRC32C</div><div class='ctx'> 	select CRYPTO_XXHASH</div><div class='ctx'> 	select CRYPTO_SHA256</div><div class='ctx'> 	select CRYPTO_BLAKE2B</div><div class='hunk'>@@ -17,9 +18,7 @@ config BTRFS_FS</div><div class='ctx'> 	select FS_IOMAP</div><div class='ctx'> 	select RAID6_PQ</div><div class='ctx'> 	select XOR_BLOCKS</div><div class='del'>-	select SRCU</div><div class='del'>-	depends on !PPC_256K_PAGES	# powerpc</div><div class='del'>-	depends on !PAGE_SIZE_256KB	# hexagon</div><div class='add'>+	depends on PAGE_SIZE_LESS_THAN_256KB</div><div class='ctx'> </div><div class='ctx'> 	help</div><div class='ctx'> 	  Btrfs is a general purpose copy-on-write filesystem with extents,</div><div class='hunk'>@@ -32,7 +31,7 @@ config BTRFS_FS</div><div class='ctx'> 	  continue to be mountable and usable by newer kernels.</div><div class='ctx'> </div><div class='ctx'> 	  For more information, please see the web pages at</div><div class='del'>-	  http://btrfs.wiki.kernel.org.</div><div class='add'>+	  https://btrfs.readthedocs.io</div><div class='ctx'> </div><div class='ctx'> 	  To compile this file system support as a module, choose M here. The</div><div class='ctx'> 	  module will be called btrfs.</div><div class='hunk'>@@ -49,43 +48,28 @@ config BTRFS_FS_POSIX_ACL</div><div class='ctx'> </div><div class='ctx'> 	  If you don't know what Access Control Lists are, say N</div><div class='ctx'> </div><div class='del'>-config BTRFS_FS_CHECK_INTEGRITY</div><div class='del'>-	bool "Btrfs with integrity check tool compiled in (DANGEROUS)"</div><div class='del'>-	depends on BTRFS_FS</div><div class='del'>-	help</div><div class='del'>-	  Adds code that examines all block write requests (including</div><div class='del'>-	  writes of the super block). The goal is to verify that the</div><div class='del'>-	  state of the filesystem on disk is always consistent, i.e.,</div><div class='del'>-	  after a power-loss or kernel panic event the filesystem is</div><div class='del'>-	  in a consistent state.</div><div class='del'>-</div><div class='del'>-	  If the integrity check tool is included and activated in</div><div class='del'>-	  the mount options, plenty of kernel memory is used, and</div><div class='del'>-	  plenty of additional CPU cycles are spent. Enabling this</div><div class='del'>-	  functionality is not intended for normal use.</div><div class='del'>-</div><div class='del'>-	  In most cases, unless you are a btrfs developer who needs</div><div class='del'>-	  to verify the integrity of (super)-block write requests</div><div class='del'>-	  during the run of a regression test, say N</div><div class='del'>-</div><div class='ctx'> config BTRFS_FS_RUN_SANITY_TESTS</div><div class='ctx'> 	bool "Btrfs will run sanity tests upon loading"</div><div class='ctx'> 	depends on BTRFS_FS</div><div class='ctx'> 	help</div><div class='del'>-	  This will run some basic sanity tests on the free space cache</div><div class='del'>-	  code to make sure it is acting as it should.  These are mostly</div><div class='del'>-	  regression tests and are only really interesting to btrfs</div><div class='del'>-	  developers.</div><div class='add'>+	  This will run sanity tests for core functionality like free space,</div><div class='add'>+	  extent maps, extent io, extent buffers, inodes, qgroups and others,</div><div class='add'>+	  at module load time.  These are mostly regression tests and are only</div><div class='add'>+	  interesting to developers.</div><div class='ctx'> </div><div class='ctx'> 	  If unsure, say N.</div><div class='ctx'> </div><div class='ctx'> config BTRFS_DEBUG</div><div class='ctx'> 	bool "Btrfs debugging support"</div><div class='ctx'> 	depends on BTRFS_FS</div><div class='add'>+	select REF_TRACKER if STACKTRACE_SUPPORT</div><div class='ctx'> 	help</div><div class='del'>-	  Enable run-time debugging support for the btrfs filesystem. This may</div><div class='del'>-	  enable additional and expensive checks with negative impact on</div><div class='del'>-	  performance, or export extra information via sysfs.</div><div class='add'>+	  Enable run-time debugging support for the btrfs filesystem.</div><div class='add'>+</div><div class='add'>+	  Additional potentially expensive checks, debugging functionality or</div><div class='add'>+	  sysfs exported information is enabled, like leak checks of internal</div><div class='add'>+	  objects, optional forced space fragmentation and /sys/fs/btrfs/debug .</div><div class='add'>+	  This has negative impact on performance.</div><div class='ctx'> </div><div class='ctx'> 	  If unsure, say N.</div><div class='ctx'> </div><div class='hunk'>@@ -93,18 +77,44 @@ config BTRFS_ASSERT</div><div class='ctx'> 	bool "Btrfs assert support"</div><div class='ctx'> 	depends on BTRFS_FS</div><div class='ctx'> 	help</div><div class='del'>-	  Enable run-time assertion checking.  This will result in panics if</div><div class='del'>-	  any of the assertions trip.  This is meant for btrfs developers only.</div><div class='add'>+	  Enable run-time assertion checking. Additional safety checks are</div><div class='add'>+	  done, simple enough not to affect performance but verify invariants</div><div class='add'>+	  and assumptions of code to run properly. This may result in panics,</div><div class='add'>+	  and is meant for developers but can be enabled in general.</div><div class='ctx'> </div><div class='ctx'> 	  If unsure, say N.</div><div class='ctx'> </div><div class='del'>-config BTRFS_FS_REF_VERIFY</div><div class='del'>-	bool "Btrfs with the ref verify tool compiled in"</div><div class='add'>+config BTRFS_EXPERIMENTAL</div><div class='add'>+	bool "Btrfs experimental features"</div><div class='ctx'> 	depends on BTRFS_FS</div><div class='ctx'> 	default n</div><div class='ctx'> 	help</div><div class='del'>-	  Enable run-time extent reference verification instrumentation.  This</div><div class='del'>-	  is meant to be used by btrfs developers for tracking down extent</div><div class='del'>-	  reference problems or verifying they didn't break something.</div><div class='add'>+	  Enable experimental features.  These features may not be stable enough</div><div class='add'>+	  for end users.  This is meant for btrfs developers or users who wish</div><div class='add'>+	  to test the functionality and report problems.</div><div class='add'>+</div><div class='add'>+	  Current list:</div><div class='add'>+</div><div class='add'>+	  - COW fixup worker warning - last warning before removing the</div><div class='add'>+				       functionality catching out-of-band page</div><div class='add'>+				       dirtying, not necessary since 5.8</div><div class='add'>+</div><div class='add'>+	  - RAID mirror read policy - additional read policies for balancing</div><div class='add'>+				      reading from redundant block group</div><div class='add'>+				      profiles (currently: pid, round-robin,</div><div class='add'>+				      fixed devid)</div><div class='add'>+</div><div class='add'>+	  - send stream protocol v3 - fs-verity support</div><div class='add'>+</div><div class='add'>+	  - checksum offload mode - sysfs knob to affect when checksums are</div><div class='add'>+	                            calculated (at IO time, or in a thread)</div><div class='add'>+</div><div class='add'>+	  - raid-stripe-tree - additional mapping of extents to devices to</div><div class='add'>+			       support RAID1* profiles on zoned devices,</div><div class='add'>+			       RAID56 not yet supported</div><div class='add'>+</div><div class='add'>+	  - extent tree v2 - complex rework of extent tracking</div><div class='add'>+</div><div class='add'>+	  - large folio support</div><div class='ctx'> </div><div class='ctx'> 	  If unsure, say N.</div><div class='head'>diff --git a/fs/btrfs/Makefile b/fs/btrfs/Makefile<br/>index 3dcf9bcc2326..743d7677b175 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/Makefile?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/Makefile</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/Makefile?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/Makefile</a></div><div class='hunk'>@@ -11,34 +11,37 @@ condflags := \</div><div class='ctx'> 	$(call cc-option, -Wunused-but-set-variable)		\</div><div class='ctx'> 	$(call cc-option, -Wunused-const-variable)		\</div><div class='ctx'> 	$(call cc-option, -Wpacked-not-aligned)			\</div><div class='del'>-	$(call cc-option, -Wstringop-truncation)</div><div class='add'>+	$(call cc-option, -Wstringop-truncation)		\</div><div class='add'>+	$(call cc-option, -Wmaybe-uninitialized)</div><div class='ctx'> subdir-ccflags-y += $(condflags)</div><div class='ctx'> # The following turn off the warnings enabled by -Wextra</div><div class='ctx'> subdir-ccflags-y += -Wno-missing-field-initializers</div><div class='ctx'> subdir-ccflags-y += -Wno-sign-compare</div><div class='ctx'> subdir-ccflags-y += -Wno-type-limits</div><div class='add'>+subdir-ccflags-y += -Wno-shift-negative-value</div><div class='ctx'> </div><div class='ctx'> obj-$(CONFIG_BTRFS_FS) := btrfs.o</div><div class='ctx'> </div><div class='ctx'> btrfs-y += super.o ctree.o extent-tree.o print-tree.o root-tree.o dir-item.o \</div><div class='ctx'> 	   file-item.o inode-item.o disk-io.o \</div><div class='del'>-	   transaction.o inode.o file.o tree-defrag.o \</div><div class='del'>-	   extent_map.o sysfs.o struct-funcs.o xattr.o ordered-data.o \</div><div class='add'>+	   transaction.o inode.o file.o defrag.o \</div><div class='add'>+	   extent_map.o sysfs.o accessors.o xattr.o ordered-data.o \</div><div class='ctx'> 	   extent_io.o volumes.o async-thread.o ioctl.o locking.o orphan.o \</div><div class='ctx'> 	   export.o tree-log.o free-space-cache.o zlib.o lzo.o zstd.o \</div><div class='ctx'> 	   compression.o delayed-ref.o relocation.o delayed-inode.o scrub.o \</div><div class='del'>-	   reada.o backref.o ulist.o qgroup.o send.o dev-replace.o raid56.o \</div><div class='add'>+	   backref.o ulist.o qgroup.o send.o dev-replace.o raid56.o \</div><div class='ctx'> 	   uuid-tree.o props.o free-space-tree.o tree-checker.o space-info.o \</div><div class='ctx'> 	   block-rsv.o delalloc-space.o block-group.o discard.o reflink.o \</div><div class='del'>-	   subpage.o tree-mod-log.o</div><div class='add'>+	   subpage.o tree-mod-log.o extent-io-tree.o fs.o messages.o bio.o \</div><div class='add'>+	   lru_cache.o raid-stripe-tree.o fiemap.o direct-io.o</div><div class='ctx'> </div><div class='ctx'> btrfs-$(CONFIG_BTRFS_FS_POSIX_ACL) += acl.o</div><div class='del'>-btrfs-$(CONFIG_BTRFS_FS_CHECK_INTEGRITY) += check-integrity.o</div><div class='del'>-btrfs-$(CONFIG_BTRFS_FS_REF_VERIFY) += ref-verify.o</div><div class='add'>+btrfs-$(CONFIG_BTRFS_DEBUG) += ref-verify.o</div><div class='ctx'> btrfs-$(CONFIG_BLK_DEV_ZONED) += zoned.o</div><div class='ctx'> btrfs-$(CONFIG_FS_VERITY) += verity.o</div><div class='ctx'> </div><div class='ctx'> btrfs-$(CONFIG_BTRFS_FS_RUN_SANITY_TESTS) += tests/free-space-tests.o \</div><div class='ctx'> 	tests/extent-buffer-tests.o tests/btrfs-tests.o \</div><div class='ctx'> 	tests/extent-io-tests.o tests/inode-tests.o tests/qgroup-tests.o \</div><div class='del'>-	tests/free-space-tree-tests.o tests/extent-map-tests.o</div><div class='add'>+	tests/free-space-tree-tests.o tests/extent-map-tests.o \</div><div class='add'>+	tests/raid-stripe-tree-tests.o tests/delayed-refs-tests.o</div><div class='head'>diff --git a/fs/btrfs/accessors.c b/fs/btrfs/accessors.c<br/>new file mode 100644<br/>index 000000000000..1248aa2535d3<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/accessors.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/accessors.c</a></div><div class='hunk'>@@ -0,0 +1,125 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+/*</div><div class='add'>+ * Copyright (C) 2007 Oracle.  All rights reserved.</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/unaligned.h&gt;</div><div class='add'>+#include "messages.h"</div><div class='add'>+#include "extent_io.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+</div><div class='add'>+static void __cold report_setget_bounds(const struct extent_buffer *eb,</div><div class='add'>+					const void *ptr, unsigned off, int size)</div><div class='add'>+{</div><div class='add'>+	unsigned long member_offset = (unsigned long)ptr + off;</div><div class='add'>+</div><div class='add'>+	btrfs_warn(eb-&gt;fs_info,</div><div class='add'>+		   "bad eb member %s: ptr 0x%lx start %llu member offset %lu size %d",</div><div class='add'>+		   (member_offset &gt; eb-&gt;len ? "start" : "end"),</div><div class='add'>+		   (unsigned long)ptr, eb-&gt;start, member_offset, size);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Copy bytes from @src1 and @src2 to @dest. */</div><div class='add'>+static __always_inline void memcpy_split_src(char *dest, const char *src1,</div><div class='add'>+					     const char *src2, const size_t len1,</div><div class='add'>+					     const size_t total)</div><div class='add'>+{</div><div class='add'>+	memcpy(dest, src1, len1);</div><div class='add'>+	memcpy(dest + len1, src2, total - len1);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Macro templates that define helpers to read/write extent buffer data of a</div><div class='add'>+ * given size, that are also used via ctree.h for access to item members by</div><div class='add'>+ * specialized helpers.</div><div class='add'>+ *</div><div class='add'>+ * Generic helpers:</div><div class='add'>+ * - btrfs_set_8 (for 8/16/32/64)</div><div class='add'>+ * - btrfs_get_8 (for 8/16/32/64)</div><div class='add'>+ *</div><div class='add'>+ * The set/get functions handle data spanning two pages transparently, in case</div><div class='add'>+ * metadata block size is larger than page.  Every pointer to metadata items is</div><div class='add'>+ * an offset into the extent buffer page array, cast to a specific type.  This</div><div class='add'>+ * gives us all the type checking.</div><div class='add'>+ *</div><div class='add'>+ * The extent buffer pages stored in the array folios may not form a contiguous</div><div class='add'>+ * physical range, but the API functions assume the linear offset to the range</div><div class='add'>+ * from 0 to metadata node size.</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#define DEFINE_BTRFS_SETGET_BITS(bits)					\</div><div class='add'>+u##bits btrfs_get_##bits(const struct extent_buffer *eb,		\</div><div class='add'>+			 const void *ptr, unsigned long off)		\</div><div class='add'>+{									\</div><div class='add'>+	const unsigned long member_offset = (unsigned long)ptr + off;	\</div><div class='add'>+	const unsigned long idx = get_eb_folio_index(eb, member_offset);\</div><div class='add'>+	const unsigned long oif = get_eb_offset_in_folio(eb,		\</div><div class='add'>+							 member_offset);\</div><div class='add'>+	char *kaddr = folio_address(eb-&gt;folios[idx]) + oif;		\</div><div class='add'>+	const int part = eb-&gt;folio_size - oif;				\</div><div class='add'>+	u8 lebytes[sizeof(u##bits)];					\</div><div class='add'>+									\</div><div class='add'>+	if (unlikely(member_offset + sizeof(u##bits) &gt; eb-&gt;len)) {	\</div><div class='add'>+		report_setget_bounds(eb, ptr, off, sizeof(u##bits));	\</div><div class='add'>+		return 0;						\</div><div class='add'>+	}								\</div><div class='add'>+	if (INLINE_EXTENT_BUFFER_PAGES == 1 || sizeof(u##bits) == 1 ||	\</div><div class='add'>+	    likely(sizeof(u##bits) &lt;= part))				\</div><div class='add'>+		return get_unaligned_le##bits(kaddr);			\</div><div class='add'>+									\</div><div class='add'>+	if (sizeof(u##bits) == 2) {					\</div><div class='add'>+		lebytes[0] = *kaddr;					\</div><div class='add'>+		kaddr = folio_address(eb-&gt;folios[idx + 1]);		\</div><div class='add'>+		lebytes[1] = *kaddr;					\</div><div class='add'>+	} else {							\</div><div class='add'>+		memcpy_split_src(lebytes, kaddr,			\</div><div class='add'>+				 folio_address(eb-&gt;folios[idx + 1]),	\</div><div class='add'>+				 part, sizeof(u##bits));		\</div><div class='add'>+	}								\</div><div class='add'>+	return get_unaligned_le##bits(lebytes);				\</div><div class='add'>+}									\</div><div class='add'>+void btrfs_set_##bits(const struct extent_buffer *eb, void *ptr,	\</div><div class='add'>+		      unsigned long off, u##bits val)			\</div><div class='add'>+{									\</div><div class='add'>+	const unsigned long member_offset = (unsigned long)ptr + off;	\</div><div class='add'>+	const unsigned long idx = get_eb_folio_index(eb, member_offset);\</div><div class='add'>+	const unsigned long oif = get_eb_offset_in_folio(eb,		\</div><div class='add'>+							 member_offset);\</div><div class='add'>+	char *kaddr = folio_address(eb-&gt;folios[idx]) + oif;		\</div><div class='add'>+	const int part = eb-&gt;folio_size - oif;				\</div><div class='add'>+	u8 lebytes[sizeof(u##bits)];					\</div><div class='add'>+									\</div><div class='add'>+	if (unlikely(member_offset + sizeof(u##bits) &gt; eb-&gt;len)) {	\</div><div class='add'>+		report_setget_bounds(eb, ptr, off, sizeof(u##bits));	\</div><div class='add'>+		return;							\</div><div class='add'>+	}								\</div><div class='add'>+	if (INLINE_EXTENT_BUFFER_PAGES == 1 || sizeof(u##bits) == 1 ||	\</div><div class='add'>+	    likely(sizeof(u##bits) &lt;= part)) {				\</div><div class='add'>+		put_unaligned_le##bits(val, kaddr);			\</div><div class='add'>+		return;							\</div><div class='add'>+	}								\</div><div class='add'>+	put_unaligned_le##bits(val, lebytes);				\</div><div class='add'>+	if (sizeof(u##bits) == 2) {					\</div><div class='add'>+		*kaddr = lebytes[0];					\</div><div class='add'>+		kaddr = folio_address(eb-&gt;folios[idx + 1]);		\</div><div class='add'>+		*kaddr = lebytes[1];					\</div><div class='add'>+	} else {							\</div><div class='add'>+		memcpy(kaddr, lebytes, part);				\</div><div class='add'>+		kaddr = folio_address(eb-&gt;folios[idx + 1]);		\</div><div class='add'>+		memcpy(kaddr, lebytes + part, sizeof(u##bits) - part);	\</div><div class='add'>+	}								\</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+DEFINE_BTRFS_SETGET_BITS(8)</div><div class='add'>+DEFINE_BTRFS_SETGET_BITS(16)</div><div class='add'>+DEFINE_BTRFS_SETGET_BITS(32)</div><div class='add'>+DEFINE_BTRFS_SETGET_BITS(64)</div><div class='add'>+</div><div class='add'>+void btrfs_node_key(const struct extent_buffer *eb,</div><div class='add'>+		    struct btrfs_disk_key *disk_key, int nr)</div><div class='add'>+{</div><div class='add'>+	unsigned long ptr = btrfs_node_key_ptr_offset(eb, nr);</div><div class='add'>+	read_eb_member(eb, (struct btrfs_key_ptr *)ptr,</div><div class='add'>+		       struct btrfs_key_ptr, key, disk_key);</div><div class='add'>+}</div><div class='head'>diff --git a/fs/btrfs/accessors.h b/fs/btrfs/accessors.h<br/>new file mode 100644<br/>index 000000000000..78721412951c<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/accessors.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/accessors.h</a></div><div class='hunk'>@@ -0,0 +1,1020 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+</div><div class='add'>+#ifndef BTRFS_ACCESSORS_H</div><div class='add'>+#define BTRFS_ACCESSORS_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/unaligned.h&gt;</div><div class='add'>+#include &lt;linux/stddef.h&gt;</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+#include &lt;linux/align.h&gt;</div><div class='add'>+#include &lt;linux/build_bug.h&gt;</div><div class='add'>+#include &lt;linux/compiler.h&gt;</div><div class='add'>+#include &lt;linux/string.h&gt;</div><div class='add'>+#include &lt;linux/mm.h&gt;</div><div class='add'>+#include &lt;uapi/linux/btrfs_tree.h&gt;</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "extent_io.h"</div><div class='add'>+</div><div class='add'>+struct extent_buffer;</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Some macros to generate set/get functions for the struct fields.  This</div><div class='add'>+ * assumes there is a lefoo_to_cpu for every type, so lets make a simple one</div><div class='add'>+ * for u8:</div><div class='add'>+ */</div><div class='add'>+#define le8_to_cpu(v) (v)</div><div class='add'>+#define cpu_to_le8(v) (v)</div><div class='add'>+#define __le8 u8</div><div class='add'>+</div><div class='add'>+static inline u8 get_unaligned_le8(const void *p)</div><div class='add'>+{</div><div class='add'>+       return *(const u8 *)p;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void put_unaligned_le8(u8 val, void *p)</div><div class='add'>+{</div><div class='add'>+       *(u8 *)p = val;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define read_eb_member(eb, ptr, type, member, result) (\</div><div class='add'>+	read_extent_buffer(eb, (char *)(result),			\</div><div class='add'>+			   ((unsigned long)(ptr)) +			\</div><div class='add'>+			    offsetof(type, member),			\</div><div class='add'>+			    sizeof_field(type, member)))</div><div class='add'>+</div><div class='add'>+#define write_eb_member(eb, ptr, type, member, source) (		\</div><div class='add'>+	write_extent_buffer(eb, (const char *)(source),			\</div><div class='add'>+			   ((unsigned long)(ptr)) +			\</div><div class='add'>+			    offsetof(type, member),			\</div><div class='add'>+			    sizeof_field(type, member)))</div><div class='add'>+</div><div class='add'>+#define DECLARE_BTRFS_SETGET_BITS(bits)					\</div><div class='add'>+u##bits btrfs_get_##bits(const struct extent_buffer *eb,		\</div><div class='add'>+			 const void *ptr, unsigned long off);		\</div><div class='add'>+void btrfs_set_##bits(const struct extent_buffer *eb, void *ptr,	\</div><div class='add'>+		      unsigned long off, u##bits val);</div><div class='add'>+</div><div class='add'>+DECLARE_BTRFS_SETGET_BITS(8)</div><div class='add'>+DECLARE_BTRFS_SETGET_BITS(16)</div><div class='add'>+DECLARE_BTRFS_SETGET_BITS(32)</div><div class='add'>+DECLARE_BTRFS_SETGET_BITS(64)</div><div class='add'>+</div><div class='add'>+#define BTRFS_SETGET_FUNCS(name, type, member, bits)			\</div><div class='add'>+static inline u##bits btrfs_##name(const struct extent_buffer *eb,	\</div><div class='add'>+				   const type *s)			\</div><div class='add'>+{									\</div><div class='add'>+	static_assert(sizeof(u##bits) == sizeof_field(type, member));	\</div><div class='add'>+	return btrfs_get_##bits(eb, s, offsetof(type, member));		\</div><div class='add'>+}									\</div><div class='add'>+static inline void btrfs_set_##name(const struct extent_buffer *eb, type *s, \</div><div class='add'>+				    u##bits val)			\</div><div class='add'>+{									\</div><div class='add'>+	static_assert(sizeof(u##bits) == sizeof_field(type, member));	\</div><div class='add'>+	btrfs_set_##bits(eb, s, offsetof(type, member), val);		\</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define BTRFS_SETGET_HEADER_FUNCS(name, type, member, bits)		\</div><div class='add'>+static inline u##bits btrfs_##name(const struct extent_buffer *eb)	\</div><div class='add'>+{									\</div><div class='add'>+	const type *p = folio_address(eb-&gt;folios[0]) +			\</div><div class='add'>+			offset_in_page(eb-&gt;start);			\</div><div class='add'>+	return get_unaligned_le##bits(&amp;p-&gt;member);			\</div><div class='add'>+}									\</div><div class='add'>+static inline void btrfs_set_##name(const struct extent_buffer *eb,	\</div><div class='add'>+				    u##bits val)			\</div><div class='add'>+{									\</div><div class='add'>+	type *p = folio_address(eb-&gt;folios[0]) + offset_in_page(eb-&gt;start); \</div><div class='add'>+	put_unaligned_le##bits(val, &amp;p-&gt;member);			\</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define BTRFS_SETGET_STACK_FUNCS(name, type, member, bits)		\</div><div class='add'>+static inline u##bits btrfs_##name(const type *s)			\</div><div class='add'>+{									\</div><div class='add'>+	return get_unaligned_le##bits(&amp;s-&gt;member);			\</div><div class='add'>+}									\</div><div class='add'>+static inline void btrfs_set_##name(type *s, u##bits val)		\</div><div class='add'>+{									\</div><div class='add'>+	put_unaligned_le##bits(val, &amp;s-&gt;member);			\</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline u64 btrfs_device_total_bytes(const struct extent_buffer *eb,</div><div class='add'>+					   struct btrfs_dev_item *s)</div><div class='add'>+{</div><div class='add'>+	static_assert(sizeof(u64) == sizeof_field(struct btrfs_dev_item, total_bytes));</div><div class='add'>+	return btrfs_get_64(eb, s, offsetof(struct btrfs_dev_item, total_bytes));</div><div class='add'>+}</div><div class='add'>+static inline void btrfs_set_device_total_bytes(const struct extent_buffer *eb,</div><div class='add'>+						struct btrfs_dev_item *s,</div><div class='add'>+						u64 val)</div><div class='add'>+{</div><div class='add'>+	static_assert(sizeof(u64) == sizeof_field(struct btrfs_dev_item, total_bytes));</div><div class='add'>+	WARN_ON(!IS_ALIGNED(val, eb-&gt;fs_info-&gt;sectorsize));</div><div class='add'>+	btrfs_set_64(eb, s, offsetof(struct btrfs_dev_item, total_bytes), val);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+BTRFS_SETGET_FUNCS(device_type, struct btrfs_dev_item, type, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(device_bytes_used, struct btrfs_dev_item, bytes_used, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(device_io_align, struct btrfs_dev_item, io_align, 32);</div><div class='add'>+BTRFS_SETGET_FUNCS(device_io_width, struct btrfs_dev_item, io_width, 32);</div><div class='add'>+BTRFS_SETGET_FUNCS(device_start_offset, struct btrfs_dev_item, start_offset, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(device_sector_size, struct btrfs_dev_item, sector_size, 32);</div><div class='add'>+BTRFS_SETGET_FUNCS(device_id, struct btrfs_dev_item, devid, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(device_group, struct btrfs_dev_item, dev_group, 32);</div><div class='add'>+BTRFS_SETGET_FUNCS(device_seek_speed, struct btrfs_dev_item, seek_speed, 8);</div><div class='add'>+BTRFS_SETGET_FUNCS(device_bandwidth, struct btrfs_dev_item, bandwidth, 8);</div><div class='add'>+BTRFS_SETGET_FUNCS(device_generation, struct btrfs_dev_item, generation, 64);</div><div class='add'>+</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_device_type, struct btrfs_dev_item, type, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_device_total_bytes, struct btrfs_dev_item,</div><div class='add'>+			 total_bytes, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_device_bytes_used, struct btrfs_dev_item,</div><div class='add'>+			 bytes_used, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_device_io_align, struct btrfs_dev_item,</div><div class='add'>+			 io_align, 32);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_device_io_width, struct btrfs_dev_item,</div><div class='add'>+			 io_width, 32);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_device_sector_size, struct btrfs_dev_item,</div><div class='add'>+			 sector_size, 32);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_device_id, struct btrfs_dev_item, devid, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_device_group, struct btrfs_dev_item, dev_group, 32);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_device_seek_speed, struct btrfs_dev_item,</div><div class='add'>+			 seek_speed, 8);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_device_bandwidth, struct btrfs_dev_item,</div><div class='add'>+			 bandwidth, 8);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_device_generation, struct btrfs_dev_item,</div><div class='add'>+			 generation, 64);</div><div class='add'>+</div><div class='add'>+static inline unsigned long btrfs_device_uuid(struct btrfs_dev_item *d)</div><div class='add'>+{</div><div class='add'>+	return (unsigned long)d + offsetof(struct btrfs_dev_item, uuid);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline unsigned long btrfs_device_fsid(struct btrfs_dev_item *d)</div><div class='add'>+{</div><div class='add'>+	return (unsigned long)d + offsetof(struct btrfs_dev_item, fsid);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+BTRFS_SETGET_FUNCS(chunk_length, struct btrfs_chunk, length, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(chunk_owner, struct btrfs_chunk, owner, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(chunk_stripe_len, struct btrfs_chunk, stripe_len, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(chunk_io_align, struct btrfs_chunk, io_align, 32);</div><div class='add'>+BTRFS_SETGET_FUNCS(chunk_io_width, struct btrfs_chunk, io_width, 32);</div><div class='add'>+BTRFS_SETGET_FUNCS(chunk_sector_size, struct btrfs_chunk, sector_size, 32);</div><div class='add'>+BTRFS_SETGET_FUNCS(chunk_type, struct btrfs_chunk, type, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(chunk_num_stripes, struct btrfs_chunk, num_stripes, 16);</div><div class='add'>+BTRFS_SETGET_FUNCS(chunk_sub_stripes, struct btrfs_chunk, sub_stripes, 16);</div><div class='add'>+BTRFS_SETGET_FUNCS(stripe_devid, struct btrfs_stripe, devid, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(stripe_offset, struct btrfs_stripe, offset, 64);</div><div class='add'>+</div><div class='add'>+static inline char *btrfs_stripe_dev_uuid(struct btrfs_stripe *s)</div><div class='add'>+{</div><div class='add'>+	return (char *)s + offsetof(struct btrfs_stripe, dev_uuid);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_chunk_length, struct btrfs_chunk, length, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_chunk_owner, struct btrfs_chunk, owner, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_chunk_stripe_len, struct btrfs_chunk,</div><div class='add'>+			 stripe_len, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_chunk_io_align, struct btrfs_chunk, io_align, 32);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_chunk_io_width, struct btrfs_chunk, io_width, 32);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_chunk_sector_size, struct btrfs_chunk,</div><div class='add'>+			 sector_size, 32);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_chunk_type, struct btrfs_chunk, type, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_chunk_num_stripes, struct btrfs_chunk,</div><div class='add'>+			 num_stripes, 16);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_chunk_sub_stripes, struct btrfs_chunk,</div><div class='add'>+			 sub_stripes, 16);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_stripe_devid, struct btrfs_stripe, devid, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_stripe_offset, struct btrfs_stripe, offset, 64);</div><div class='add'>+</div><div class='add'>+static inline struct btrfs_stripe *btrfs_stripe_nr(struct btrfs_chunk *c, int nr)</div><div class='add'>+{</div><div class='add'>+	unsigned long offset = (unsigned long)c;</div><div class='add'>+</div><div class='add'>+	offset += offsetof(struct btrfs_chunk, stripe);</div><div class='add'>+	offset += nr * sizeof(struct btrfs_stripe);</div><div class='add'>+	return (struct btrfs_stripe *)offset;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline char *btrfs_stripe_dev_uuid_nr(struct btrfs_chunk *c, int nr)</div><div class='add'>+{</div><div class='add'>+	return btrfs_stripe_dev_uuid(btrfs_stripe_nr(c, nr));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline u64 btrfs_stripe_offset_nr(const struct extent_buffer *eb,</div><div class='add'>+					 struct btrfs_chunk *c, int nr)</div><div class='add'>+{</div><div class='add'>+	return btrfs_stripe_offset(eb, btrfs_stripe_nr(c, nr));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_set_stripe_offset_nr(struct extent_buffer *eb,</div><div class='add'>+					      struct btrfs_chunk *c, int nr,</div><div class='add'>+					      u64 val)</div><div class='add'>+{</div><div class='add'>+	btrfs_set_stripe_offset(eb, btrfs_stripe_nr(c, nr), val);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline u64 btrfs_stripe_devid_nr(const struct extent_buffer *eb,</div><div class='add'>+					 struct btrfs_chunk *c, int nr)</div><div class='add'>+{</div><div class='add'>+	return btrfs_stripe_devid(eb, btrfs_stripe_nr(c, nr));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_set_stripe_devid_nr(struct extent_buffer *eb,</div><div class='add'>+					     struct btrfs_chunk *c, int nr,</div><div class='add'>+					     u64 val)</div><div class='add'>+{</div><div class='add'>+	btrfs_set_stripe_devid(eb, btrfs_stripe_nr(c, nr), val);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* struct btrfs_block_group_item */</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_block_group_used, struct btrfs_block_group_item,</div><div class='add'>+			 used, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(block_group_used, struct btrfs_block_group_item, used, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_block_group_chunk_objectid,</div><div class='add'>+			struct btrfs_block_group_item, chunk_objectid, 64);</div><div class='add'>+</div><div class='add'>+BTRFS_SETGET_FUNCS(block_group_chunk_objectid,</div><div class='add'>+		   struct btrfs_block_group_item, chunk_objectid, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(block_group_flags, struct btrfs_block_group_item, flags, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_block_group_flags,</div><div class='add'>+			struct btrfs_block_group_item, flags, 64);</div><div class='add'>+</div><div class='add'>+/* struct btrfs_free_space_info */</div><div class='add'>+BTRFS_SETGET_FUNCS(free_space_extent_count, struct btrfs_free_space_info,</div><div class='add'>+		   extent_count, 32);</div><div class='add'>+BTRFS_SETGET_FUNCS(free_space_flags, struct btrfs_free_space_info, flags, 32);</div><div class='add'>+</div><div class='add'>+/* struct btrfs_inode_ref */</div><div class='add'>+BTRFS_SETGET_FUNCS(inode_ref_name_len, struct btrfs_inode_ref, name_len, 16);</div><div class='add'>+BTRFS_SETGET_FUNCS(inode_ref_index, struct btrfs_inode_ref, index, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_inode_ref_name_len, struct btrfs_inode_ref, name_len, 16);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_inode_ref_index, struct btrfs_inode_ref, index, 64);</div><div class='add'>+</div><div class='add'>+/* struct btrfs_inode_extref */</div><div class='add'>+BTRFS_SETGET_FUNCS(inode_extref_parent, struct btrfs_inode_extref,</div><div class='add'>+		   parent_objectid, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(inode_extref_name_len, struct btrfs_inode_extref,</div><div class='add'>+		   name_len, 16);</div><div class='add'>+BTRFS_SETGET_FUNCS(inode_extref_index, struct btrfs_inode_extref, index, 64);</div><div class='add'>+</div><div class='add'>+/* struct btrfs_inode_item */</div><div class='add'>+BTRFS_SETGET_FUNCS(inode_generation, struct btrfs_inode_item, generation, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(inode_sequence, struct btrfs_inode_item, sequence, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(inode_transid, struct btrfs_inode_item, transid, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(inode_size, struct btrfs_inode_item, size, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(inode_nbytes, struct btrfs_inode_item, nbytes, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(inode_block_group, struct btrfs_inode_item, block_group, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(inode_nlink, struct btrfs_inode_item, nlink, 32);</div><div class='add'>+BTRFS_SETGET_FUNCS(inode_uid, struct btrfs_inode_item, uid, 32);</div><div class='add'>+BTRFS_SETGET_FUNCS(inode_gid, struct btrfs_inode_item, gid, 32);</div><div class='add'>+BTRFS_SETGET_FUNCS(inode_mode, struct btrfs_inode_item, mode, 32);</div><div class='add'>+BTRFS_SETGET_FUNCS(inode_rdev, struct btrfs_inode_item, rdev, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(inode_flags, struct btrfs_inode_item, flags, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_inode_generation, struct btrfs_inode_item,</div><div class='add'>+			 generation, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_inode_sequence, struct btrfs_inode_item,</div><div class='add'>+			 sequence, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_inode_transid, struct btrfs_inode_item,</div><div class='add'>+			 transid, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_inode_size, struct btrfs_inode_item, size, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_inode_nbytes, struct btrfs_inode_item, nbytes, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_inode_block_group, struct btrfs_inode_item,</div><div class='add'>+			 block_group, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_inode_nlink, struct btrfs_inode_item, nlink, 32);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_inode_uid, struct btrfs_inode_item, uid, 32);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_inode_gid, struct btrfs_inode_item, gid, 32);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_inode_mode, struct btrfs_inode_item, mode, 32);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_inode_rdev, struct btrfs_inode_item, rdev, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_inode_flags, struct btrfs_inode_item, flags, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(timespec_sec, struct btrfs_timespec, sec, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(timespec_nsec, struct btrfs_timespec, nsec, 32);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_timespec_sec, struct btrfs_timespec, sec, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_timespec_nsec, struct btrfs_timespec, nsec, 32);</div><div class='add'>+</div><div class='add'>+BTRFS_SETGET_FUNCS(raid_stride_devid, struct btrfs_raid_stride, devid, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(raid_stride_physical, struct btrfs_raid_stride, physical, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_raid_stride_devid, struct btrfs_raid_stride, devid, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_raid_stride_physical, struct btrfs_raid_stride, physical, 64);</div><div class='add'>+</div><div class='add'>+/* struct btrfs_dev_extent */</div><div class='add'>+BTRFS_SETGET_FUNCS(dev_extent_chunk_tree, struct btrfs_dev_extent, chunk_tree, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(dev_extent_chunk_objectid, struct btrfs_dev_extent,</div><div class='add'>+		   chunk_objectid, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(dev_extent_chunk_offset, struct btrfs_dev_extent,</div><div class='add'>+		   chunk_offset, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(dev_extent_length, struct btrfs_dev_extent, length, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_dev_extent_chunk_tree, struct btrfs_dev_extent,</div><div class='add'>+			 chunk_tree, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_dev_extent_chunk_objectid, struct btrfs_dev_extent,</div><div class='add'>+			 chunk_objectid, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_dev_extent_chunk_offset, struct btrfs_dev_extent,</div><div class='add'>+			 chunk_offset, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_dev_extent_length, struct btrfs_dev_extent, length, 64);</div><div class='add'>+</div><div class='add'>+BTRFS_SETGET_FUNCS(extent_refs, struct btrfs_extent_item, refs, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(extent_generation, struct btrfs_extent_item, generation, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(extent_flags, struct btrfs_extent_item, flags, 64);</div><div class='add'>+</div><div class='add'>+BTRFS_SETGET_FUNCS(tree_block_level, struct btrfs_tree_block_info, level, 8);</div><div class='add'>+</div><div class='add'>+static inline void btrfs_tree_block_key(const struct extent_buffer *eb,</div><div class='add'>+					struct btrfs_tree_block_info *item,</div><div class='add'>+					struct btrfs_disk_key *key)</div><div class='add'>+{</div><div class='add'>+	read_eb_member(eb, item, struct btrfs_tree_block_info, key, key);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_set_tree_block_key(const struct extent_buffer *eb,</div><div class='add'>+					    struct btrfs_tree_block_info *item,</div><div class='add'>+					    const struct btrfs_disk_key *key)</div><div class='add'>+{</div><div class='add'>+	write_eb_member(eb, item, struct btrfs_tree_block_info, key, key);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+BTRFS_SETGET_FUNCS(extent_data_ref_root, struct btrfs_extent_data_ref, root, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(extent_data_ref_objectid, struct btrfs_extent_data_ref,</div><div class='add'>+		   objectid, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(extent_data_ref_offset, struct btrfs_extent_data_ref,</div><div class='add'>+		   offset, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(extent_data_ref_count, struct btrfs_extent_data_ref, count, 32);</div><div class='add'>+</div><div class='add'>+BTRFS_SETGET_FUNCS(shared_data_ref_count, struct btrfs_shared_data_ref, count, 32);</div><div class='add'>+</div><div class='add'>+BTRFS_SETGET_FUNCS(extent_owner_ref_root_id, struct btrfs_extent_owner_ref,</div><div class='add'>+		   root_id, 64);</div><div class='add'>+</div><div class='add'>+BTRFS_SETGET_FUNCS(extent_inline_ref_type, struct btrfs_extent_inline_ref,</div><div class='add'>+		   type, 8);</div><div class='add'>+BTRFS_SETGET_FUNCS(extent_inline_ref_offset, struct btrfs_extent_inline_ref,</div><div class='add'>+		   offset, 64);</div><div class='add'>+</div><div class='add'>+static inline u32 btrfs_extent_inline_ref_size(int type)</div><div class='add'>+{</div><div class='add'>+	if (type == BTRFS_TREE_BLOCK_REF_KEY ||</div><div class='add'>+	    type == BTRFS_SHARED_BLOCK_REF_KEY)</div><div class='add'>+		return sizeof(struct btrfs_extent_inline_ref);</div><div class='add'>+	if (type == BTRFS_SHARED_DATA_REF_KEY)</div><div class='add'>+		return sizeof(struct btrfs_shared_data_ref) +</div><div class='add'>+		       sizeof(struct btrfs_extent_inline_ref);</div><div class='add'>+	if (type == BTRFS_EXTENT_DATA_REF_KEY)</div><div class='add'>+		return sizeof(struct btrfs_extent_data_ref) +</div><div class='add'>+		       offsetof(struct btrfs_extent_inline_ref, offset);</div><div class='add'>+	if (type == BTRFS_EXTENT_OWNER_REF_KEY)</div><div class='add'>+		return sizeof(struct btrfs_extent_inline_ref);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* struct btrfs_node */</div><div class='add'>+BTRFS_SETGET_FUNCS(key_blockptr, struct btrfs_key_ptr, blockptr, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(key_generation, struct btrfs_key_ptr, generation, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_key_blockptr, struct btrfs_key_ptr, blockptr, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_key_generation, struct btrfs_key_ptr,</div><div class='add'>+			 generation, 64);</div><div class='add'>+</div><div class='add'>+static inline u64 btrfs_node_blockptr(const struct extent_buffer *eb, int nr)</div><div class='add'>+{</div><div class='add'>+	unsigned long ptr;</div><div class='add'>+</div><div class='add'>+	ptr = offsetof(struct btrfs_node, ptrs) +</div><div class='add'>+		sizeof(struct btrfs_key_ptr) * nr;</div><div class='add'>+	return btrfs_key_blockptr(eb, (struct btrfs_key_ptr *)ptr);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_set_node_blockptr(const struct extent_buffer *eb,</div><div class='add'>+					   int nr, u64 val)</div><div class='add'>+{</div><div class='add'>+	unsigned long ptr;</div><div class='add'>+</div><div class='add'>+	ptr = offsetof(struct btrfs_node, ptrs) +</div><div class='add'>+		sizeof(struct btrfs_key_ptr) * nr;</div><div class='add'>+	btrfs_set_key_blockptr(eb, (struct btrfs_key_ptr *)ptr, val);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline u64 btrfs_node_ptr_generation(const struct extent_buffer *eb, int nr)</div><div class='add'>+{</div><div class='add'>+	unsigned long ptr;</div><div class='add'>+</div><div class='add'>+	ptr = offsetof(struct btrfs_node, ptrs) +</div><div class='add'>+		sizeof(struct btrfs_key_ptr) * nr;</div><div class='add'>+	return btrfs_key_generation(eb, (struct btrfs_key_ptr *)ptr);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_set_node_ptr_generation(const struct extent_buffer *eb,</div><div class='add'>+						 int nr, u64 val)</div><div class='add'>+{</div><div class='add'>+	unsigned long ptr;</div><div class='add'>+</div><div class='add'>+	ptr = offsetof(struct btrfs_node, ptrs) +</div><div class='add'>+		sizeof(struct btrfs_key_ptr) * nr;</div><div class='add'>+	btrfs_set_key_generation(eb, (struct btrfs_key_ptr *)ptr, val);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline unsigned long btrfs_node_key_ptr_offset(const struct extent_buffer *eb, int nr)</div><div class='add'>+{</div><div class='add'>+	return offsetof(struct btrfs_node, ptrs) +</div><div class='add'>+		sizeof(struct btrfs_key_ptr) * nr;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_node_key(const struct extent_buffer *eb,</div><div class='add'>+		    struct btrfs_disk_key *disk_key, int nr);</div><div class='add'>+</div><div class='add'>+static inline void btrfs_set_node_key(const struct extent_buffer *eb,</div><div class='add'>+				      const struct btrfs_disk_key *disk_key, int nr)</div><div class='add'>+{</div><div class='add'>+	unsigned long ptr;</div><div class='add'>+</div><div class='add'>+	ptr = btrfs_node_key_ptr_offset(eb, nr);</div><div class='add'>+	write_eb_member(eb, (struct btrfs_key_ptr *)ptr,</div><div class='add'>+		        struct btrfs_key_ptr, key, disk_key);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* struct btrfs_item */</div><div class='add'>+BTRFS_SETGET_FUNCS(raw_item_offset, struct btrfs_item, offset, 32);</div><div class='add'>+BTRFS_SETGET_FUNCS(raw_item_size, struct btrfs_item, size, 32);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_item_offset, struct btrfs_item, offset, 32);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_item_size, struct btrfs_item, size, 32);</div><div class='add'>+</div><div class='add'>+static inline unsigned long btrfs_item_nr_offset(const struct extent_buffer *eb, int nr)</div><div class='add'>+{</div><div class='add'>+	return offsetof(struct btrfs_leaf, items) +</div><div class='add'>+		sizeof(struct btrfs_item) * nr;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline struct btrfs_item *btrfs_item_nr(const struct extent_buffer *eb, int nr)</div><div class='add'>+{</div><div class='add'>+	return (struct btrfs_item *)btrfs_item_nr_offset(eb, nr);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define BTRFS_ITEM_SETGET_FUNCS(member)						\</div><div class='add'>+static inline u32 btrfs_item_##member(const struct extent_buffer *eb, int slot)	\</div><div class='add'>+{										\</div><div class='add'>+	return btrfs_raw_item_##member(eb, btrfs_item_nr(eb, slot));		\</div><div class='add'>+}										\</div><div class='add'>+static inline void btrfs_set_item_##member(const struct extent_buffer *eb,	\</div><div class='add'>+					   int slot, u32 val)			\</div><div class='add'>+{										\</div><div class='add'>+	btrfs_set_raw_item_##member(eb, btrfs_item_nr(eb, slot), val);		\</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+BTRFS_ITEM_SETGET_FUNCS(offset)</div><div class='add'>+BTRFS_ITEM_SETGET_FUNCS(size);</div><div class='add'>+</div><div class='add'>+static inline u32 btrfs_item_data_end(const struct extent_buffer *eb, int nr)</div><div class='add'>+{</div><div class='add'>+	return btrfs_item_offset(eb, nr) + btrfs_item_size(eb, nr);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_item_key(const struct extent_buffer *eb,</div><div class='add'>+			   struct btrfs_disk_key *disk_key, int nr)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_item *item = btrfs_item_nr(eb, nr);</div><div class='add'>+</div><div class='add'>+	read_eb_member(eb, item, struct btrfs_item, key, disk_key);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_set_item_key(struct extent_buffer *eb,</div><div class='add'>+				      const struct btrfs_disk_key *disk_key, int nr)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_item *item = btrfs_item_nr(eb, nr);</div><div class='add'>+</div><div class='add'>+	write_eb_member(eb, item, struct btrfs_item, key, disk_key);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+BTRFS_SETGET_FUNCS(dir_log_end, struct btrfs_dir_log_item, end, 64);</div><div class='add'>+</div><div class='add'>+/* struct btrfs_root_ref */</div><div class='add'>+BTRFS_SETGET_FUNCS(root_ref_dirid, struct btrfs_root_ref, dirid, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(root_ref_sequence, struct btrfs_root_ref, sequence, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(root_ref_name_len, struct btrfs_root_ref, name_len, 16);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_root_ref_dirid, struct btrfs_root_ref, dirid, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_root_ref_sequence, struct btrfs_root_ref, sequence, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_root_ref_name_len, struct btrfs_root_ref, name_len, 16);</div><div class='add'>+</div><div class='add'>+/* struct btrfs_dir_item */</div><div class='add'>+BTRFS_SETGET_FUNCS(dir_data_len, struct btrfs_dir_item, data_len, 16);</div><div class='add'>+BTRFS_SETGET_FUNCS(dir_flags, struct btrfs_dir_item, type, 8);</div><div class='add'>+BTRFS_SETGET_FUNCS(dir_name_len, struct btrfs_dir_item, name_len, 16);</div><div class='add'>+BTRFS_SETGET_FUNCS(dir_transid, struct btrfs_dir_item, transid, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_dir_flags, struct btrfs_dir_item, type, 8);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_dir_data_len, struct btrfs_dir_item, data_len, 16);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_dir_name_len, struct btrfs_dir_item, name_len, 16);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_dir_transid, struct btrfs_dir_item, transid, 64);</div><div class='add'>+</div><div class='add'>+static inline u8 btrfs_dir_ftype(const struct extent_buffer *eb,</div><div class='add'>+				 const struct btrfs_dir_item *item)</div><div class='add'>+{</div><div class='add'>+	return btrfs_dir_flags_to_ftype(btrfs_dir_flags(eb, item));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline u8 btrfs_stack_dir_ftype(const struct btrfs_dir_item *item)</div><div class='add'>+{</div><div class='add'>+	return btrfs_dir_flags_to_ftype(btrfs_stack_dir_flags(item));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_dir_item_key(const struct extent_buffer *eb,</div><div class='add'>+				      const struct btrfs_dir_item *item,</div><div class='add'>+				      struct btrfs_disk_key *key)</div><div class='add'>+{</div><div class='add'>+	read_eb_member(eb, item, struct btrfs_dir_item, location, key);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_set_dir_item_key(struct extent_buffer *eb,</div><div class='add'>+					  struct btrfs_dir_item *item,</div><div class='add'>+					  const struct btrfs_disk_key *key)</div><div class='add'>+{</div><div class='add'>+	write_eb_member(eb, item, struct btrfs_dir_item, location, key);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+BTRFS_SETGET_FUNCS(free_space_entries, struct btrfs_free_space_header,</div><div class='add'>+		   num_entries, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(free_space_bitmaps, struct btrfs_free_space_header,</div><div class='add'>+		   num_bitmaps, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(free_space_generation, struct btrfs_free_space_header,</div><div class='add'>+		   generation, 64);</div><div class='add'>+</div><div class='add'>+static inline void btrfs_free_space_key(const struct extent_buffer *eb,</div><div class='add'>+					const struct btrfs_free_space_header *h,</div><div class='add'>+					struct btrfs_disk_key *key)</div><div class='add'>+{</div><div class='add'>+	read_eb_member(eb, h, struct btrfs_free_space_header, location, key);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_set_free_space_key(struct extent_buffer *eb,</div><div class='add'>+					    struct btrfs_free_space_header *h,</div><div class='add'>+					    const struct btrfs_disk_key *key)</div><div class='add'>+{</div><div class='add'>+	write_eb_member(eb, h, struct btrfs_free_space_header, location, key);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* struct btrfs_disk_key */</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(disk_key_objectid, struct btrfs_disk_key, objectid, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(disk_key_offset, struct btrfs_disk_key, offset, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(disk_key_type, struct btrfs_disk_key, type, 8);</div><div class='add'>+</div><div class='add'>+#ifdef __LITTLE_ENDIAN</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Optimized helpers for little-endian architectures where CPU and on-disk</div><div class='add'>+ * structures have the same endianness and we can skip conversions.</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+static inline void btrfs_disk_key_to_cpu(struct btrfs_key *cpu_key,</div><div class='add'>+					 const struct btrfs_disk_key *disk_key)</div><div class='add'>+{</div><div class='add'>+	memcpy(cpu_key, disk_key, sizeof(struct btrfs_key));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_cpu_key_to_disk(struct btrfs_disk_key *disk_key,</div><div class='add'>+					 const struct btrfs_key *cpu_key)</div><div class='add'>+{</div><div class='add'>+	memcpy(disk_key, cpu_key, sizeof(struct btrfs_key));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_node_key_to_cpu(const struct extent_buffer *eb,</div><div class='add'>+					 struct btrfs_key *cpu_key, int nr)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_disk_key *disk_key = (struct btrfs_disk_key *)cpu_key;</div><div class='add'>+</div><div class='add'>+	btrfs_node_key(eb, disk_key, nr);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_item_key_to_cpu(const struct extent_buffer *eb,</div><div class='add'>+					 struct btrfs_key *cpu_key, int nr)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_disk_key *disk_key = (struct btrfs_disk_key *)cpu_key;</div><div class='add'>+</div><div class='add'>+	btrfs_item_key(eb, disk_key, nr);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_dir_item_key_to_cpu(const struct extent_buffer *eb,</div><div class='add'>+					     const struct btrfs_dir_item *item,</div><div class='add'>+					     struct btrfs_key *cpu_key)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_disk_key *disk_key = (struct btrfs_disk_key *)cpu_key;</div><div class='add'>+</div><div class='add'>+	btrfs_dir_item_key(eb, item, disk_key);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#else</div><div class='add'>+</div><div class='add'>+static inline void btrfs_disk_key_to_cpu(struct btrfs_key *cpu,</div><div class='add'>+					 const struct btrfs_disk_key *disk)</div><div class='add'>+{</div><div class='add'>+	cpu-&gt;offset = le64_to_cpu(disk-&gt;offset);</div><div class='add'>+	cpu-&gt;type = disk-&gt;type;</div><div class='add'>+	cpu-&gt;objectid = le64_to_cpu(disk-&gt;objectid);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_cpu_key_to_disk(struct btrfs_disk_key *disk,</div><div class='add'>+					 const struct btrfs_key *cpu)</div><div class='add'>+{</div><div class='add'>+	disk-&gt;offset = cpu_to_le64(cpu-&gt;offset);</div><div class='add'>+	disk-&gt;type = cpu-&gt;type;</div><div class='add'>+	disk-&gt;objectid = cpu_to_le64(cpu-&gt;objectid);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_node_key_to_cpu(const struct extent_buffer *eb,</div><div class='add'>+					 struct btrfs_key *key, int nr)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_disk_key disk_key;</div><div class='add'>+</div><div class='add'>+	btrfs_node_key(eb, &amp;disk_key, nr);</div><div class='add'>+	btrfs_disk_key_to_cpu(key, &amp;disk_key);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_item_key_to_cpu(const struct extent_buffer *eb,</div><div class='add'>+					 struct btrfs_key *key, int nr)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_disk_key disk_key;</div><div class='add'>+</div><div class='add'>+	btrfs_item_key(eb, &amp;disk_key, nr);</div><div class='add'>+	btrfs_disk_key_to_cpu(key, &amp;disk_key);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_dir_item_key_to_cpu(const struct extent_buffer *eb,</div><div class='add'>+					     const struct btrfs_dir_item *item,</div><div class='add'>+					     struct btrfs_key *key)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_disk_key disk_key;</div><div class='add'>+</div><div class='add'>+	btrfs_dir_item_key(eb, item, &amp;disk_key);</div><div class='add'>+	btrfs_disk_key_to_cpu(key, &amp;disk_key);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+/* struct btrfs_header */</div><div class='add'>+BTRFS_SETGET_HEADER_FUNCS(header_bytenr, struct btrfs_header, bytenr, 64);</div><div class='add'>+BTRFS_SETGET_HEADER_FUNCS(header_generation, struct btrfs_header, generation, 64);</div><div class='add'>+BTRFS_SETGET_HEADER_FUNCS(header_owner, struct btrfs_header, owner, 64);</div><div class='add'>+BTRFS_SETGET_HEADER_FUNCS(header_nritems, struct btrfs_header, nritems, 32);</div><div class='add'>+BTRFS_SETGET_HEADER_FUNCS(header_flags, struct btrfs_header, flags, 64);</div><div class='add'>+BTRFS_SETGET_HEADER_FUNCS(header_level, struct btrfs_header, level, 8);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_header_generation, struct btrfs_header,</div><div class='add'>+			 generation, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_header_owner, struct btrfs_header, owner, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_header_nritems, struct btrfs_header, nritems, 32);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_header_bytenr, struct btrfs_header, bytenr, 64);</div><div class='add'>+</div><div class='add'>+static inline int btrfs_header_flag(const struct extent_buffer *eb, u64 flag)</div><div class='add'>+{</div><div class='add'>+	return (btrfs_header_flags(eb) &amp; flag) == flag;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_set_header_flag(struct extent_buffer *eb, u64 flag)</div><div class='add'>+{</div><div class='add'>+	u64 flags = btrfs_header_flags(eb);</div><div class='add'>+</div><div class='add'>+	btrfs_set_header_flags(eb, flags | flag);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_clear_header_flag(struct extent_buffer *eb, u64 flag)</div><div class='add'>+{</div><div class='add'>+	u64 flags = btrfs_header_flags(eb);</div><div class='add'>+</div><div class='add'>+	btrfs_set_header_flags(eb, flags &amp; ~flag);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int btrfs_header_backref_rev(const struct extent_buffer *eb)</div><div class='add'>+{</div><div class='add'>+	u64 flags = btrfs_header_flags(eb);</div><div class='add'>+</div><div class='add'>+	return flags &gt;&gt; BTRFS_BACKREF_REV_SHIFT;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_set_header_backref_rev(struct extent_buffer *eb, int rev)</div><div class='add'>+{</div><div class='add'>+	u64 flags = btrfs_header_flags(eb);</div><div class='add'>+</div><div class='add'>+	flags &amp;= ~BTRFS_BACKREF_REV_MASK;</div><div class='add'>+	flags |= (u64)rev &lt;&lt; BTRFS_BACKREF_REV_SHIFT;</div><div class='add'>+	btrfs_set_header_flags(eb, flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int btrfs_is_leaf(const struct extent_buffer *eb)</div><div class='add'>+{</div><div class='add'>+	return btrfs_header_level(eb) == 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* struct btrfs_root_item */</div><div class='add'>+BTRFS_SETGET_FUNCS(disk_root_generation, struct btrfs_root_item, generation, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(disk_root_refs, struct btrfs_root_item, refs, 32);</div><div class='add'>+BTRFS_SETGET_FUNCS(disk_root_bytenr, struct btrfs_root_item, bytenr, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(disk_root_level, struct btrfs_root_item, level, 8);</div><div class='add'>+</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(root_generation, struct btrfs_root_item, generation, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(root_bytenr, struct btrfs_root_item, bytenr, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(root_drop_level, struct btrfs_root_item, drop_level, 8);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(root_level, struct btrfs_root_item, level, 8);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(root_dirid, struct btrfs_root_item, root_dirid, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(root_refs, struct btrfs_root_item, refs, 32);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(root_flags, struct btrfs_root_item, flags, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(root_used, struct btrfs_root_item, bytes_used, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(root_limit, struct btrfs_root_item, byte_limit, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(root_last_snapshot, struct btrfs_root_item,</div><div class='add'>+			 last_snapshot, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(root_generation_v2, struct btrfs_root_item,</div><div class='add'>+			 generation_v2, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(root_ctransid, struct btrfs_root_item, ctransid, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(root_otransid, struct btrfs_root_item, otransid, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(root_stransid, struct btrfs_root_item, stransid, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(root_rtransid, struct btrfs_root_item, rtransid, 64);</div><div class='add'>+</div><div class='add'>+/* struct btrfs_root_backup */</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(backup_tree_root, struct btrfs_root_backup,</div><div class='add'>+		   tree_root, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(backup_tree_root_gen, struct btrfs_root_backup,</div><div class='add'>+		   tree_root_gen, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(backup_tree_root_level, struct btrfs_root_backup,</div><div class='add'>+		   tree_root_level, 8);</div><div class='add'>+</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(backup_chunk_root, struct btrfs_root_backup,</div><div class='add'>+		   chunk_root, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(backup_chunk_root_gen, struct btrfs_root_backup,</div><div class='add'>+		   chunk_root_gen, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(backup_chunk_root_level, struct btrfs_root_backup,</div><div class='add'>+		   chunk_root_level, 8);</div><div class='add'>+</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(backup_extent_root, struct btrfs_root_backup,</div><div class='add'>+		   extent_root, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(backup_extent_root_gen, struct btrfs_root_backup,</div><div class='add'>+		   extent_root_gen, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(backup_extent_root_level, struct btrfs_root_backup,</div><div class='add'>+		   extent_root_level, 8);</div><div class='add'>+</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(backup_fs_root, struct btrfs_root_backup,</div><div class='add'>+		   fs_root, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(backup_fs_root_gen, struct btrfs_root_backup,</div><div class='add'>+		   fs_root_gen, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(backup_fs_root_level, struct btrfs_root_backup,</div><div class='add'>+		   fs_root_level, 8);</div><div class='add'>+</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(backup_dev_root, struct btrfs_root_backup,</div><div class='add'>+		   dev_root, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(backup_dev_root_gen, struct btrfs_root_backup,</div><div class='add'>+		   dev_root_gen, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(backup_dev_root_level, struct btrfs_root_backup,</div><div class='add'>+		   dev_root_level, 8);</div><div class='add'>+</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(backup_csum_root, struct btrfs_root_backup,</div><div class='add'>+		   csum_root, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(backup_csum_root_gen, struct btrfs_root_backup,</div><div class='add'>+		   csum_root_gen, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(backup_csum_root_level, struct btrfs_root_backup,</div><div class='add'>+		   csum_root_level, 8);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(backup_total_bytes, struct btrfs_root_backup,</div><div class='add'>+		   total_bytes, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(backup_bytes_used, struct btrfs_root_backup,</div><div class='add'>+		   bytes_used, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(backup_num_devices, struct btrfs_root_backup,</div><div class='add'>+		   num_devices, 64);</div><div class='add'>+</div><div class='add'>+/* struct btrfs_balance_item */</div><div class='add'>+BTRFS_SETGET_FUNCS(balance_flags, struct btrfs_balance_item, flags, 64);</div><div class='add'>+</div><div class='add'>+static inline void btrfs_balance_data(const struct extent_buffer *eb,</div><div class='add'>+				      const struct btrfs_balance_item *bi,</div><div class='add'>+				      struct btrfs_disk_balance_args *ba)</div><div class='add'>+{</div><div class='add'>+	read_eb_member(eb, bi, struct btrfs_balance_item, data, ba);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_set_balance_data(struct extent_buffer *eb,</div><div class='add'>+					  struct btrfs_balance_item *bi,</div><div class='add'>+					  const struct btrfs_disk_balance_args *ba)</div><div class='add'>+{</div><div class='add'>+	write_eb_member(eb, bi, struct btrfs_balance_item, data, ba);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_balance_meta(const struct extent_buffer *eb,</div><div class='add'>+				      const struct btrfs_balance_item *bi,</div><div class='add'>+				      struct btrfs_disk_balance_args *ba)</div><div class='add'>+{</div><div class='add'>+	read_eb_member(eb, bi, struct btrfs_balance_item, meta, ba);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_set_balance_meta(struct extent_buffer *eb,</div><div class='add'>+					  struct btrfs_balance_item *bi,</div><div class='add'>+					  const struct btrfs_disk_balance_args *ba)</div><div class='add'>+{</div><div class='add'>+	write_eb_member(eb, bi, struct btrfs_balance_item, meta, ba);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_balance_sys(const struct extent_buffer *eb,</div><div class='add'>+				     const struct btrfs_balance_item *bi,</div><div class='add'>+				     struct btrfs_disk_balance_args *ba)</div><div class='add'>+{</div><div class='add'>+	read_eb_member(eb, bi, struct btrfs_balance_item, sys, ba);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_set_balance_sys(struct extent_buffer *eb,</div><div class='add'>+					 struct btrfs_balance_item *bi,</div><div class='add'>+					 const struct btrfs_disk_balance_args *ba)</div><div class='add'>+{</div><div class='add'>+	write_eb_member(eb, bi, struct btrfs_balance_item, sys, ba);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* struct btrfs_super_block */</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(super_bytenr, struct btrfs_super_block, bytenr, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(super_flags, struct btrfs_super_block, flags, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(super_generation, struct btrfs_super_block,</div><div class='add'>+			 generation, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(super_root, struct btrfs_super_block, root, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(super_sys_array_size,</div><div class='add'>+			 struct btrfs_super_block, sys_chunk_array_size, 32);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(super_chunk_root_generation,</div><div class='add'>+			 struct btrfs_super_block, chunk_root_generation, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(super_root_level, struct btrfs_super_block,</div><div class='add'>+			 root_level, 8);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(super_chunk_root, struct btrfs_super_block,</div><div class='add'>+			 chunk_root, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(super_chunk_root_level, struct btrfs_super_block,</div><div class='add'>+			 chunk_root_level, 8);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(super_log_root, struct btrfs_super_block, log_root, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(super_log_root_level, struct btrfs_super_block,</div><div class='add'>+			 log_root_level, 8);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(super_total_bytes, struct btrfs_super_block,</div><div class='add'>+			 total_bytes, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(super_bytes_used, struct btrfs_super_block,</div><div class='add'>+			 bytes_used, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(super_sectorsize, struct btrfs_super_block,</div><div class='add'>+			 sectorsize, 32);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(super_nodesize, struct btrfs_super_block,</div><div class='add'>+			 nodesize, 32);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(super_stripesize, struct btrfs_super_block,</div><div class='add'>+			 stripesize, 32);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(super_root_dir, struct btrfs_super_block,</div><div class='add'>+			 root_dir_objectid, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(super_num_devices, struct btrfs_super_block,</div><div class='add'>+			 num_devices, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(super_compat_flags, struct btrfs_super_block,</div><div class='add'>+			 compat_flags, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(super_compat_ro_flags, struct btrfs_super_block,</div><div class='add'>+			 compat_ro_flags, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(super_incompat_flags, struct btrfs_super_block,</div><div class='add'>+			 incompat_flags, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(super_csum_type, struct btrfs_super_block,</div><div class='add'>+			 csum_type, 16);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(super_cache_generation, struct btrfs_super_block,</div><div class='add'>+			 cache_generation, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(super_magic, struct btrfs_super_block, magic, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(super_uuid_tree_generation, struct btrfs_super_block,</div><div class='add'>+			 uuid_tree_generation, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(super_nr_global_roots, struct btrfs_super_block,</div><div class='add'>+			 nr_global_roots, 64);</div><div class='add'>+</div><div class='add'>+/* struct btrfs_file_extent_item */</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_file_extent_type, struct btrfs_file_extent_item,</div><div class='add'>+			 type, 8);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_file_extent_disk_bytenr,</div><div class='add'>+			 struct btrfs_file_extent_item, disk_bytenr, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_file_extent_offset,</div><div class='add'>+			 struct btrfs_file_extent_item, offset, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_file_extent_generation,</div><div class='add'>+			 struct btrfs_file_extent_item, generation, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_file_extent_num_bytes,</div><div class='add'>+			 struct btrfs_file_extent_item, num_bytes, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_file_extent_ram_bytes,</div><div class='add'>+			 struct btrfs_file_extent_item, ram_bytes, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_file_extent_disk_num_bytes,</div><div class='add'>+			 struct btrfs_file_extent_item, disk_num_bytes, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_file_extent_compression,</div><div class='add'>+			 struct btrfs_file_extent_item, compression, 8);</div><div class='add'>+</div><div class='add'>+</div><div class='add'>+BTRFS_SETGET_FUNCS(file_extent_type, struct btrfs_file_extent_item, type, 8);</div><div class='add'>+BTRFS_SETGET_FUNCS(file_extent_disk_bytenr, struct btrfs_file_extent_item,</div><div class='add'>+		   disk_bytenr, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(file_extent_generation, struct btrfs_file_extent_item,</div><div class='add'>+		   generation, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(file_extent_disk_num_bytes, struct btrfs_file_extent_item,</div><div class='add'>+		   disk_num_bytes, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(file_extent_offset, struct btrfs_file_extent_item,</div><div class='add'>+		  offset, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(file_extent_num_bytes, struct btrfs_file_extent_item,</div><div class='add'>+		   num_bytes, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(file_extent_ram_bytes, struct btrfs_file_extent_item,</div><div class='add'>+		   ram_bytes, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(file_extent_compression, struct btrfs_file_extent_item,</div><div class='add'>+		   compression, 8);</div><div class='add'>+BTRFS_SETGET_FUNCS(file_extent_encryption, struct btrfs_file_extent_item,</div><div class='add'>+		   encryption, 8);</div><div class='add'>+BTRFS_SETGET_FUNCS(file_extent_other_encoding, struct btrfs_file_extent_item,</div><div class='add'>+		   other_encoding, 16);</div><div class='add'>+</div><div class='add'>+/* btrfs_qgroup_status_item */</div><div class='add'>+BTRFS_SETGET_FUNCS(qgroup_status_generation, struct btrfs_qgroup_status_item,</div><div class='add'>+		   generation, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(qgroup_status_version, struct btrfs_qgroup_status_item,</div><div class='add'>+		   version, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(qgroup_status_flags, struct btrfs_qgroup_status_item,</div><div class='add'>+		   flags, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(qgroup_status_rescan, struct btrfs_qgroup_status_item,</div><div class='add'>+		   rescan, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(qgroup_status_enable_gen, struct btrfs_qgroup_status_item,</div><div class='add'>+		   enable_gen, 64);</div><div class='add'>+</div><div class='add'>+/* btrfs_qgroup_info_item */</div><div class='add'>+BTRFS_SETGET_FUNCS(qgroup_info_generation, struct btrfs_qgroup_info_item,</div><div class='add'>+		   generation, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(qgroup_info_rfer, struct btrfs_qgroup_info_item, rfer, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(qgroup_info_rfer_cmpr, struct btrfs_qgroup_info_item,</div><div class='add'>+		   rfer_cmpr, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(qgroup_info_excl, struct btrfs_qgroup_info_item, excl, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(qgroup_info_excl_cmpr, struct btrfs_qgroup_info_item,</div><div class='add'>+		   excl_cmpr, 64);</div><div class='add'>+</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_qgroup_info_generation,</div><div class='add'>+			 struct btrfs_qgroup_info_item, generation, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_qgroup_info_rfer, struct btrfs_qgroup_info_item,</div><div class='add'>+			 rfer, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_qgroup_info_rfer_cmpr,</div><div class='add'>+			 struct btrfs_qgroup_info_item, rfer_cmpr, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_qgroup_info_excl, struct btrfs_qgroup_info_item,</div><div class='add'>+			 excl, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_qgroup_info_excl_cmpr,</div><div class='add'>+			 struct btrfs_qgroup_info_item, excl_cmpr, 64);</div><div class='add'>+</div><div class='add'>+/* btrfs_qgroup_limit_item */</div><div class='add'>+BTRFS_SETGET_FUNCS(qgroup_limit_flags, struct btrfs_qgroup_limit_item, flags, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(qgroup_limit_max_rfer, struct btrfs_qgroup_limit_item,</div><div class='add'>+		   max_rfer, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(qgroup_limit_max_excl, struct btrfs_qgroup_limit_item,</div><div class='add'>+		   max_excl, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(qgroup_limit_rsv_rfer, struct btrfs_qgroup_limit_item,</div><div class='add'>+		   rsv_rfer, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(qgroup_limit_rsv_excl, struct btrfs_qgroup_limit_item,</div><div class='add'>+		   rsv_excl, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_qgroup_limit_flags,</div><div class='add'>+			 struct btrfs_qgroup_limit_item, flags, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_qgroup_limit_max_rfer,</div><div class='add'>+			 struct btrfs_qgroup_limit_item, max_rfer, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_qgroup_limit_max_excl,</div><div class='add'>+			 struct btrfs_qgroup_limit_item, max_excl, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_qgroup_limit_rsv_rfer,</div><div class='add'>+			 struct btrfs_qgroup_limit_item, rsv_rfer, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_qgroup_limit_rsv_excl,</div><div class='add'>+			 struct btrfs_qgroup_limit_item, rsv_excl, 64);</div><div class='add'>+</div><div class='add'>+/* btrfs_dev_replace_item */</div><div class='add'>+BTRFS_SETGET_FUNCS(dev_replace_src_devid,</div><div class='add'>+		   struct btrfs_dev_replace_item, src_devid, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(dev_replace_cont_reading_from_srcdev_mode,</div><div class='add'>+		   struct btrfs_dev_replace_item, cont_reading_from_srcdev_mode,</div><div class='add'>+		   64);</div><div class='add'>+BTRFS_SETGET_FUNCS(dev_replace_replace_state, struct btrfs_dev_replace_item,</div><div class='add'>+		   replace_state, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(dev_replace_time_started, struct btrfs_dev_replace_item,</div><div class='add'>+		   time_started, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(dev_replace_time_stopped, struct btrfs_dev_replace_item,</div><div class='add'>+		   time_stopped, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(dev_replace_num_write_errors, struct btrfs_dev_replace_item,</div><div class='add'>+		   num_write_errors, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(dev_replace_num_uncorrectable_read_errors,</div><div class='add'>+		   struct btrfs_dev_replace_item, num_uncorrectable_read_errors,</div><div class='add'>+		   64);</div><div class='add'>+BTRFS_SETGET_FUNCS(dev_replace_cursor_left, struct btrfs_dev_replace_item,</div><div class='add'>+		   cursor_left, 64);</div><div class='add'>+BTRFS_SETGET_FUNCS(dev_replace_cursor_right, struct btrfs_dev_replace_item,</div><div class='add'>+		   cursor_right, 64);</div><div class='add'>+</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_dev_replace_src_devid,</div><div class='add'>+			 struct btrfs_dev_replace_item, src_devid, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_dev_replace_cont_reading_from_srcdev_mode,</div><div class='add'>+			 struct btrfs_dev_replace_item,</div><div class='add'>+			 cont_reading_from_srcdev_mode, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_dev_replace_replace_state,</div><div class='add'>+			 struct btrfs_dev_replace_item, replace_state, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_dev_replace_time_started,</div><div class='add'>+			 struct btrfs_dev_replace_item, time_started, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_dev_replace_time_stopped,</div><div class='add'>+			 struct btrfs_dev_replace_item, time_stopped, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_dev_replace_num_write_errors,</div><div class='add'>+			 struct btrfs_dev_replace_item, num_write_errors, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_dev_replace_num_uncorrectable_read_errors,</div><div class='add'>+			 struct btrfs_dev_replace_item,</div><div class='add'>+			 num_uncorrectable_read_errors, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_dev_replace_cursor_left,</div><div class='add'>+			 struct btrfs_dev_replace_item, cursor_left, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_dev_replace_cursor_right,</div><div class='add'>+			 struct btrfs_dev_replace_item, cursor_right, 64);</div><div class='add'>+</div><div class='add'>+/* btrfs_verity_descriptor_item */</div><div class='add'>+BTRFS_SETGET_FUNCS(verity_descriptor_encryption, struct btrfs_verity_descriptor_item,</div><div class='add'>+		   encryption, 8);</div><div class='add'>+BTRFS_SETGET_FUNCS(verity_descriptor_size, struct btrfs_verity_descriptor_item,</div><div class='add'>+		   size, 64);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_verity_descriptor_encryption,</div><div class='add'>+			 struct btrfs_verity_descriptor_item, encryption, 8);</div><div class='add'>+BTRFS_SETGET_STACK_FUNCS(stack_verity_descriptor_size,</div><div class='add'>+			 struct btrfs_verity_descriptor_item, size, 64);</div><div class='add'>+</div><div class='add'>+/* Cast into the data area of the leaf. */</div><div class='add'>+#define btrfs_item_ptr(leaf, slot, type)				\</div><div class='add'>+	((type *)(btrfs_item_nr_offset(leaf, 0) + btrfs_item_offset(leaf, slot)))</div><div class='add'>+</div><div class='add'>+#define btrfs_item_ptr_offset(leaf, slot)				\</div><div class='add'>+	((unsigned long)(btrfs_item_nr_offset(leaf, 0) + btrfs_item_offset(leaf, slot)))</div><div class='add'>+</div><div class='add'>+#endif</div><div class='head'>diff --git a/fs/btrfs/acl.c b/fs/btrfs/acl.c<br/>index 0a0d0eccee4e..c336e2ab7f8a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/acl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/acl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/acl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/acl.c</a></div><div class='hunk'>@@ -11,16 +11,16 @@</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='ctx'> #include &lt;linux/sched/mm.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='del'>-</div><div class='ctx'> #include "ctree.h"</div><div class='del'>-#include "btrfs_inode.h"</div><div class='ctx'> #include "xattr.h"</div><div class='add'>+#include "acl.h"</div><div class='add'>+#include "misc.h"</div><div class='ctx'> </div><div class='ctx'> struct posix_acl *btrfs_get_acl(struct inode *inode, int type, bool rcu)</div><div class='ctx'> {</div><div class='ctx'> 	int size;</div><div class='ctx'> 	const char *name;</div><div class='del'>-	char *value = NULL;</div><div class='add'>+	char AUTO_KFREE(value);</div><div class='ctx'> 	struct posix_acl *acl;</div><div class='ctx'> </div><div class='ctx'> 	if (rcu)</div><div class='hunk'>@@ -50,18 +50,16 @@ struct posix_acl *btrfs_get_acl(struct inode *inode, int type, bool rcu)</div><div class='ctx'> 		acl = NULL;</div><div class='ctx'> 	else</div><div class='ctx'> 		acl = ERR_PTR(size);</div><div class='del'>-	kfree(value);</div><div class='ctx'> </div><div class='ctx'> 	return acl;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __btrfs_set_acl(struct btrfs_trans_handle *trans,</div><div class='del'>-			   struct user_namespace *mnt_userns,</div><div class='del'>-			   struct inode *inode, struct posix_acl *acl, int type)</div><div class='add'>+int __btrfs_set_acl(struct btrfs_trans_handle *trans, struct inode *inode,</div><div class='add'>+		    struct posix_acl *acl, int type)</div><div class='ctx'> {</div><div class='ctx'> 	int ret, size = 0;</div><div class='ctx'> 	const char *name;</div><div class='del'>-	char *value = NULL;</div><div class='add'>+	char AUTO_KFREE(value);</div><div class='ctx'> </div><div class='ctx'> 	switch (type) {</div><div class='ctx'> 	case ACL_TYPE_ACCESS:</div><div class='hunk'>@@ -87,76 +85,40 @@ static int __btrfs_set_acl(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		nofs_flag = memalloc_nofs_save();</div><div class='ctx'> 		value = kmalloc(size, GFP_KERNEL);</div><div class='ctx'> 		memalloc_nofs_restore(nofs_flag);</div><div class='del'>-		if (!value) {</div><div class='del'>-			ret = -ENOMEM;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+		if (!value)</div><div class='add'>+			return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 		ret = posix_acl_to_xattr(&amp;init_user_ns, acl, value, size);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (trans)</div><div class='ctx'> 		ret = btrfs_setxattr(trans, inode, name, value, size, 0);</div><div class='ctx'> 	else</div><div class='ctx'> 		ret = btrfs_setxattr_trans(inode, name, value, size, 0);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	kfree(value);</div><div class='del'>-</div><div class='del'>-	if (!ret)</div><div class='del'>-		set_cached_acl(inode, type, acl);</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='add'>+	set_cached_acl(inode, type, acl);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_set_acl(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='add'>+int btrfs_set_acl(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		  struct posix_acl *acl, int type)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	umode_t old_mode = inode-&gt;i_mode;</div><div class='ctx'> </div><div class='ctx'> 	if (type == ACL_TYPE_ACCESS &amp;&amp; acl) {</div><div class='del'>-		ret = posix_acl_update_mode(mnt_userns, inode,</div><div class='add'>+		ret = posix_acl_update_mode(idmap, inode,</div><div class='ctx'> 					    &amp;inode-&gt;i_mode, &amp;acl);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 	}</div><div class='del'>-	ret = __btrfs_set_acl(NULL, mnt_userns, inode, acl, type);</div><div class='add'>+	ret = __btrfs_set_acl(NULL, inode, acl, type);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		inode-&gt;i_mode = old_mode;</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='del'>-</div><div class='del'>-int btrfs_init_acl(struct btrfs_trans_handle *trans,</div><div class='del'>-		   struct inode *inode, struct inode *dir)</div><div class='del'>-{</div><div class='del'>-	struct posix_acl *default_acl, *acl;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	/* this happens with subvols */</div><div class='del'>-	if (!dir)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	ret = posix_acl_create(dir, &amp;inode-&gt;i_mode, &amp;default_acl, &amp;acl);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	if (default_acl) {</div><div class='del'>-		ret = __btrfs_set_acl(trans, &amp;init_user_ns, inode, default_acl,</div><div class='del'>-				      ACL_TYPE_DEFAULT);</div><div class='del'>-		posix_acl_release(default_acl);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (acl) {</div><div class='del'>-		if (!ret)</div><div class='del'>-			ret = __btrfs_set_acl(trans, &amp;init_user_ns, inode, acl,</div><div class='del'>-					      ACL_TYPE_ACCESS);</div><div class='del'>-		posix_acl_release(acl);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!default_acl &amp;&amp; !acl)</div><div class='del'>-		cache_no_acl(inode);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='head'>diff --git a/fs/btrfs/acl.h b/fs/btrfs/acl.h<br/>new file mode 100644<br/>index 000000000000..0458cd51ed48<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/acl.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/acl.h</a></div><div class='hunk'>@@ -0,0 +1,40 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+</div><div class='add'>+#ifndef BTRFS_ACL_H</div><div class='add'>+#define BTRFS_ACL_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+</div><div class='add'>+struct posix_acl;</div><div class='add'>+struct inode;</div><div class='add'>+struct btrfs_trans_handle;</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BTRFS_FS_POSIX_ACL</div><div class='add'>+</div><div class='add'>+struct mnt_idmap;</div><div class='add'>+struct dentry;</div><div class='add'>+</div><div class='add'>+struct posix_acl *btrfs_get_acl(struct inode *inode, int type, bool rcu);</div><div class='add'>+int btrfs_set_acl(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='add'>+		  struct posix_acl *acl, int type);</div><div class='add'>+int __btrfs_set_acl(struct btrfs_trans_handle *trans, struct inode *inode,</div><div class='add'>+		    struct posix_acl *acl, int type);</div><div class='add'>+</div><div class='add'>+#else</div><div class='add'>+</div><div class='add'>+#include &lt;linux/errno.h&gt;</div><div class='add'>+</div><div class='add'>+struct btrfs_trans_handle;</div><div class='add'>+</div><div class='add'>+#define btrfs_get_acl NULL</div><div class='add'>+#define btrfs_set_acl NULL</div><div class='add'>+static inline int __btrfs_set_acl(struct btrfs_trans_handle *trans,</div><div class='add'>+				  struct inode *inode, struct posix_acl *acl,</div><div class='add'>+				  int type)</div><div class='add'>+{</div><div class='add'>+	return -EOPNOTSUPP;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+#endif</div><div class='head'>diff --git a/fs/btrfs/async-thread.c b/fs/btrfs/async-thread.c<br/>index 309516e6a968..6c6f3bb58f4e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/async-thread.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/async-thread.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/async-thread.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/async-thread.c</a></div><div class='hunk'>@@ -9,19 +9,18 @@</div><div class='ctx'> #include &lt;linux/list.h&gt;</div><div class='ctx'> #include &lt;linux/spinlock.h&gt;</div><div class='ctx'> #include &lt;linux/freezer.h&gt;</div><div class='add'>+#include &lt;trace/events/btrfs.h&gt;</div><div class='ctx'> #include "async-thread.h"</div><div class='del'>-#include "ctree.h"</div><div class='ctx'> </div><div class='ctx'> enum {</div><div class='ctx'> 	WORK_DONE_BIT,</div><div class='ctx'> 	WORK_ORDER_DONE_BIT,</div><div class='del'>-	WORK_HIGH_PRIO_BIT,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> #define NO_THRESHOLD (-1)</div><div class='del'>-#define DFT_THRESHOLD (32)</div><div class='add'>+#define DEFAULT_THRESHOLD (32)</div><div class='ctx'> </div><div class='del'>-struct __btrfs_workqueue {</div><div class='add'>+struct btrfs_workqueue {</div><div class='ctx'> 	struct workqueue_struct *normal_wq;</div><div class='ctx'> </div><div class='ctx'> 	/* File system this workqueue services */</div><div class='hunk'>@@ -48,12 +47,7 @@ struct __btrfs_workqueue {</div><div class='ctx'> 	spinlock_t thres_lock;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-struct btrfs_workqueue {</div><div class='del'>-	struct __btrfs_workqueue *normal;</div><div class='del'>-	struct __btrfs_workqueue *high;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct btrfs_fs_info * __pure btrfs_workqueue_owner(const struct __btrfs_workqueue *wq)</div><div class='add'>+struct btrfs_fs_info * __pure btrfs_workqueue_owner(const struct btrfs_workqueue *wq)</div><div class='ctx'> {</div><div class='ctx'> 	return wq-&gt;fs_info;</div><div class='ctx'> }</div><div class='hunk'>@@ -66,33 +60,43 @@ struct btrfs_fs_info * __pure btrfs_work_owner(const struct btrfs_work *work)</div><div class='ctx'> bool btrfs_workqueue_normal_congested(const struct btrfs_workqueue *wq)</div><div class='ctx'> {</div><div class='ctx'> 	/*</div><div class='del'>-	 * We could compare wq-&gt;normal-&gt;pending with num_online_cpus()</div><div class='add'>+	 * We could compare wq-&gt;pending with num_online_cpus()</div><div class='ctx'> 	 * to support "thresh == NO_THRESHOLD" case, but it requires</div><div class='ctx'> 	 * moving up atomic_inc/dec in thresh_queue/exec_hook. Let's</div><div class='ctx'> 	 * postpone it until someone needs the support of that case.</div><div class='ctx'> 	 */</div><div class='del'>-	if (wq-&gt;normal-&gt;thresh == NO_THRESHOLD)</div><div class='add'>+	if (wq-&gt;thresh == NO_THRESHOLD)</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	return atomic_read(&amp;wq-&gt;normal-&gt;pending) &gt; wq-&gt;normal-&gt;thresh * 2;</div><div class='add'>+	return atomic_read(&amp;wq-&gt;pending) &gt; wq-&gt;thresh * 2;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct __btrfs_workqueue *</div><div class='del'>-__btrfs_alloc_workqueue(struct btrfs_fs_info *fs_info, const char *name,</div><div class='del'>-			unsigned int flags, int limit_active, int thresh)</div><div class='add'>+static void btrfs_init_workqueue(struct btrfs_workqueue *wq,</div><div class='add'>+				 struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	struct __btrfs_workqueue *ret = kzalloc(sizeof(*ret), GFP_KERNEL);</div><div class='add'>+	wq-&gt;fs_info = fs_info;</div><div class='add'>+	atomic_set(&amp;wq-&gt;pending, 0);</div><div class='add'>+	INIT_LIST_HEAD(&amp;wq-&gt;ordered_list);</div><div class='add'>+	spin_lock_init(&amp;wq-&gt;list_lock);</div><div class='add'>+	spin_lock_init(&amp;wq-&gt;thres_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct btrfs_workqueue *btrfs_alloc_workqueue(struct btrfs_fs_info *fs_info,</div><div class='add'>+					      const char *name, unsigned int flags,</div><div class='add'>+					      int limit_active, int thresh)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_workqueue *ret = kzalloc(sizeof(*ret), GFP_KERNEL);</div><div class='ctx'> </div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='del'>-	ret-&gt;fs_info = fs_info;</div><div class='add'>+	btrfs_init_workqueue(ret, fs_info);</div><div class='add'>+</div><div class='ctx'> 	ret-&gt;limit_active = limit_active;</div><div class='del'>-	atomic_set(&amp;ret-&gt;pending, 0);</div><div class='ctx'> 	if (thresh == 0)</div><div class='del'>-		thresh = DFT_THRESHOLD;</div><div class='add'>+		thresh = DEFAULT_THRESHOLD;</div><div class='ctx'> 	/* For low threshold, disabling threshold is a better choice */</div><div class='del'>-	if (thresh &lt; DFT_THRESHOLD) {</div><div class='add'>+	if (thresh &lt; DEFAULT_THRESHOLD) {</div><div class='ctx'> 		ret-&gt;current_active = limit_active;</div><div class='ctx'> 		ret-&gt;thresh = NO_THRESHOLD;</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -105,55 +109,41 @@ __btrfs_alloc_workqueue(struct btrfs_fs_info *fs_info, const char *name,</div><div class='ctx'> 		ret-&gt;thresh = thresh;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (flags &amp; WQ_HIGHPRI)</div><div class='del'>-		ret-&gt;normal_wq = alloc_workqueue("btrfs-%s-high", flags,</div><div class='del'>-						 ret-&gt;current_active, name);</div><div class='del'>-	else</div><div class='del'>-		ret-&gt;normal_wq = alloc_workqueue("btrfs-%s", flags,</div><div class='del'>-						 ret-&gt;current_active, name);</div><div class='add'>+	ret-&gt;normal_wq = alloc_workqueue("btrfs-%s", flags, ret-&gt;current_active,</div><div class='add'>+					 name);</div><div class='ctx'> 	if (!ret-&gt;normal_wq) {</div><div class='ctx'> 		kfree(ret);</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	INIT_LIST_HEAD(&amp;ret-&gt;ordered_list);</div><div class='del'>-	spin_lock_init(&amp;ret-&gt;list_lock);</div><div class='del'>-	spin_lock_init(&amp;ret-&gt;thres_lock);</div><div class='del'>-	trace_btrfs_workqueue_alloc(ret, name, flags &amp; WQ_HIGHPRI);</div><div class='add'>+	trace_btrfs_workqueue_alloc(ret, name);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void</div><div class='del'>-__btrfs_destroy_workqueue(struct __btrfs_workqueue *wq);</div><div class='del'>-</div><div class='del'>-struct btrfs_workqueue *btrfs_alloc_workqueue(struct btrfs_fs_info *fs_info,</div><div class='del'>-					      const char *name,</div><div class='del'>-					      unsigned int flags,</div><div class='del'>-					      int limit_active,</div><div class='del'>-					      int thresh)</div><div class='add'>+struct btrfs_workqueue *btrfs_alloc_ordered_workqueue(</div><div class='add'>+				struct btrfs_fs_info *fs_info, const char *name,</div><div class='add'>+				unsigned int flags)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_workqueue *ret = kzalloc(sizeof(*ret), GFP_KERNEL);</div><div class='add'>+	struct btrfs_workqueue *ret;</div><div class='ctx'> </div><div class='add'>+	ret = kzalloc(sizeof(*ret), GFP_KERNEL);</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='del'>-	ret-&gt;normal = __btrfs_alloc_workqueue(fs_info, name,</div><div class='del'>-					      flags &amp; ~WQ_HIGHPRI,</div><div class='del'>-					      limit_active, thresh);</div><div class='del'>-	if (!ret-&gt;normal) {</div><div class='add'>+	btrfs_init_workqueue(ret, fs_info);</div><div class='add'>+</div><div class='add'>+	/* Ordered workqueues don't allow @max_active adjustments. */</div><div class='add'>+	ret-&gt;limit_active = 1;</div><div class='add'>+	ret-&gt;current_active = 1;</div><div class='add'>+	ret-&gt;thresh = NO_THRESHOLD;</div><div class='add'>+</div><div class='add'>+	ret-&gt;normal_wq = alloc_ordered_workqueue("btrfs-%s", flags, name);</div><div class='add'>+	if (!ret-&gt;normal_wq) {</div><div class='ctx'> 		kfree(ret);</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (flags &amp; WQ_HIGHPRI) {</div><div class='del'>-		ret-&gt;high = __btrfs_alloc_workqueue(fs_info, name, flags,</div><div class='del'>-						    limit_active, thresh);</div><div class='del'>-		if (!ret-&gt;high) {</div><div class='del'>-			__btrfs_destroy_workqueue(ret-&gt;normal);</div><div class='del'>-			kfree(ret);</div><div class='del'>-			return NULL;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	trace_btrfs_workqueue_alloc(ret, name);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -162,7 +152,7 @@ struct btrfs_workqueue *btrfs_alloc_workqueue(struct btrfs_fs_info *fs_info,</div><div class='ctx'>  * This hook WILL be called in IRQ handler context,</div><div class='ctx'>  * so workqueue_set_max_active MUST NOT be called in this hook</div><div class='ctx'>  */</div><div class='del'>-static inline void thresh_queue_hook(struct __btrfs_workqueue *wq)</div><div class='add'>+static inline void thresh_queue_hook(struct btrfs_workqueue *wq)</div><div class='ctx'> {</div><div class='ctx'> 	if (wq-&gt;thresh == NO_THRESHOLD)</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -174,11 +164,11 @@ static inline void thresh_queue_hook(struct __btrfs_workqueue *wq)</div><div class='ctx'>  * This hook is called in kthread content.</div><div class='ctx'>  * So workqueue_set_max_active is called here.</div><div class='ctx'>  */</div><div class='del'>-static inline void thresh_exec_hook(struct __btrfs_workqueue *wq)</div><div class='add'>+static inline void thresh_exec_hook(struct btrfs_workqueue *wq)</div><div class='ctx'> {</div><div class='ctx'> 	int new_current_active;</div><div class='ctx'> 	long pending;</div><div class='del'>-	int need_change = 0;</div><div class='add'>+	bool need_change = false;</div><div class='ctx'> </div><div class='ctx'> 	if (wq-&gt;thresh == NO_THRESHOLD)</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -206,18 +196,17 @@ static inline void thresh_exec_hook(struct __btrfs_workqueue *wq)</div><div class='ctx'> 		new_current_active--;</div><div class='ctx'> 	new_current_active = clamp_val(new_current_active, 1, wq-&gt;limit_active);</div><div class='ctx'> 	if (new_current_active != wq-&gt;current_active)  {</div><div class='del'>-		need_change = 1;</div><div class='add'>+		need_change = true;</div><div class='ctx'> 		wq-&gt;current_active = new_current_active;</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='ctx'> 	spin_unlock(&amp;wq-&gt;thres_lock);</div><div class='ctx'> </div><div class='del'>-	if (need_change) {</div><div class='add'>+	if (need_change)</div><div class='ctx'> 		workqueue_set_max_active(wq-&gt;normal_wq, wq-&gt;current_active);</div><div class='del'>-	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void run_ordered_work(struct __btrfs_workqueue *wq,</div><div class='add'>+static void run_ordered_work(struct btrfs_workqueue *wq,</div><div class='ctx'> 			     struct btrfs_work *self)</div><div class='ctx'> {</div><div class='ctx'> 	struct list_head *list = &amp;wq-&gt;ordered_list;</div><div class='hunk'>@@ -230,10 +219,16 @@ static void run_ordered_work(struct __btrfs_workqueue *wq,</div><div class='ctx'> 		spin_lock_irqsave(lock, flags);</div><div class='ctx'> 		if (list_empty(list))</div><div class='ctx'> 			break;</div><div class='del'>-		work = list_entry(list-&gt;next, struct btrfs_work,</div><div class='del'>-				  ordered_list);</div><div class='add'>+		work = list_first_entry(list, struct btrfs_work, ordered_list);</div><div class='ctx'> 		if (!test_bit(WORK_DONE_BIT, &amp;work-&gt;flags))</div><div class='ctx'> 			break;</div><div class='add'>+		/*</div><div class='add'>+		 * Orders all subsequent loads after reading WORK_DONE_BIT,</div><div class='add'>+		 * paired with the smp_mb__before_atomic in btrfs_work_helper</div><div class='add'>+		 * this guarantees that the ordered function will see all</div><div class='add'>+		 * updates from ordinary work function.</div><div class='add'>+		 */</div><div class='add'>+		smp_rmb();</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * we are going to call the ordered done function, but</div><div class='hunk'>@@ -245,7 +240,7 @@ static void run_ordered_work(struct __btrfs_workqueue *wq,</div><div class='ctx'> 			break;</div><div class='ctx'> 		trace_btrfs_ordered_sched(work);</div><div class='ctx'> 		spin_unlock_irqrestore(lock, flags);</div><div class='del'>-		work-&gt;ordered_func(work);</div><div class='add'>+		work-&gt;ordered_func(work, false);</div><div class='ctx'> </div><div class='ctx'> 		/* now take the lock again and drop our item from the list */</div><div class='ctx'> 		spin_lock_irqsave(lock, flags);</div><div class='hunk'>@@ -280,7 +275,7 @@ static void run_ordered_work(struct __btrfs_workqueue *wq,</div><div class='ctx'> 			 * We don't want to call the ordered free functions with</div><div class='ctx'> 			 * the lock held.</div><div class='ctx'> 			 */</div><div class='del'>-			work-&gt;ordered_free(work);</div><div class='add'>+			work-&gt;ordered_func(work, true);</div><div class='ctx'> 			/* NB: work must not be dereferenced past this point. */</div><div class='ctx'> 			trace_btrfs_all_work_done(wq-&gt;fs_info, work);</div><div class='ctx'> 		}</div><div class='hunk'>@@ -288,7 +283,7 @@ static void run_ordered_work(struct __btrfs_workqueue *wq,</div><div class='ctx'> 	spin_unlock_irqrestore(lock, flags);</div><div class='ctx'> </div><div class='ctx'> 	if (free_self) {</div><div class='del'>-		self-&gt;ordered_free(self);</div><div class='add'>+		self-&gt;ordered_func(self, true);</div><div class='ctx'> 		/* NB: self must not be dereferenced past this point. */</div><div class='ctx'> 		trace_btrfs_all_work_done(wq-&gt;fs_info, self);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -298,25 +293,31 @@ static void btrfs_work_helper(struct work_struct *normal_work)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_work *work = container_of(normal_work, struct btrfs_work,</div><div class='ctx'> 					       normal_work);</div><div class='del'>-	struct __btrfs_workqueue *wq;</div><div class='del'>-	int need_order = 0;</div><div class='add'>+	struct btrfs_workqueue *wq = work-&gt;wq;</div><div class='add'>+	bool need_order = false;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We should not touch things inside work in the following cases:</div><div class='del'>-	 * 1) after work-&gt;func() if it has no ordered_free</div><div class='add'>+	 * 1) after work-&gt;func() if it has no ordered_func(..., true) to free</div><div class='ctx'> 	 *    Since the struct is freed in work-&gt;func().</div><div class='ctx'> 	 * 2) after setting WORK_DONE_BIT</div><div class='ctx'> 	 *    The work may be freed in other threads almost instantly.</div><div class='ctx'> 	 * So we save the needed things here.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (work-&gt;ordered_func)</div><div class='del'>-		need_order = 1;</div><div class='del'>-	wq = work-&gt;wq;</div><div class='add'>+		need_order = true;</div><div class='ctx'> </div><div class='ctx'> 	trace_btrfs_work_sched(work);</div><div class='ctx'> 	thresh_exec_hook(wq);</div><div class='ctx'> 	work-&gt;func(work);</div><div class='ctx'> 	if (need_order) {</div><div class='add'>+		/*</div><div class='add'>+		 * Ensures all memory accesses done in the work function are</div><div class='add'>+		 * ordered before setting the WORK_DONE_BIT. Ensuring the thread</div><div class='add'>+		 * which is going to executed the ordered work sees them.</div><div class='add'>+		 * Pairs with the smp_rmb in run_ordered_work.</div><div class='add'>+		 */</div><div class='add'>+		smp_mb__before_atomic();</div><div class='ctx'> 		set_bit(WORK_DONE_BIT, &amp;work-&gt;flags);</div><div class='ctx'> 		run_ordered_work(wq, work);</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -326,18 +327,16 @@ static void btrfs_work_helper(struct work_struct *normal_work)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_init_work(struct btrfs_work *work, btrfs_func_t func,</div><div class='del'>-		     btrfs_func_t ordered_func, btrfs_func_t ordered_free)</div><div class='add'>+		     btrfs_ordered_func_t ordered_func)</div><div class='ctx'> {</div><div class='ctx'> 	work-&gt;func = func;</div><div class='ctx'> 	work-&gt;ordered_func = ordered_func;</div><div class='del'>-	work-&gt;ordered_free = ordered_free;</div><div class='ctx'> 	INIT_WORK(&amp;work-&gt;normal_work, btrfs_work_helper);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;work-&gt;ordered_list);</div><div class='ctx'> 	work-&gt;flags = 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void __btrfs_queue_work(struct __btrfs_workqueue *wq,</div><div class='del'>-				      struct btrfs_work *work)</div><div class='add'>+void btrfs_queue_work(struct btrfs_workqueue *wq, struct btrfs_work *work)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> </div><div class='hunk'>@@ -352,54 +351,22 @@ static inline void __btrfs_queue_work(struct __btrfs_workqueue *wq,</div><div class='ctx'> 	queue_work(wq-&gt;normal_wq, &amp;work-&gt;normal_work);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_queue_work(struct btrfs_workqueue *wq,</div><div class='del'>-		      struct btrfs_work *work)</div><div class='del'>-{</div><div class='del'>-	struct __btrfs_workqueue *dest_wq;</div><div class='del'>-</div><div class='del'>-	if (test_bit(WORK_HIGH_PRIO_BIT, &amp;work-&gt;flags) &amp;&amp; wq-&gt;high)</div><div class='del'>-		dest_wq = wq-&gt;high;</div><div class='del'>-	else</div><div class='del'>-		dest_wq = wq-&gt;normal;</div><div class='del'>-	__btrfs_queue_work(dest_wq, work);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void</div><div class='del'>-__btrfs_destroy_workqueue(struct __btrfs_workqueue *wq)</div><div class='del'>-{</div><div class='del'>-	destroy_workqueue(wq-&gt;normal_wq);</div><div class='del'>-	trace_btrfs_workqueue_destroy(wq);</div><div class='del'>-	kfree(wq);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> void btrfs_destroy_workqueue(struct btrfs_workqueue *wq)</div><div class='ctx'> {</div><div class='ctx'> 	if (!wq)</div><div class='ctx'> 		return;</div><div class='del'>-	if (wq-&gt;high)</div><div class='del'>-		__btrfs_destroy_workqueue(wq-&gt;high);</div><div class='del'>-	__btrfs_destroy_workqueue(wq-&gt;normal);</div><div class='add'>+	destroy_workqueue(wq-&gt;normal_wq);</div><div class='add'>+	trace_btrfs_workqueue_destroy(wq);</div><div class='ctx'> 	kfree(wq);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_workqueue_set_max(struct btrfs_workqueue *wq, int limit_active)</div><div class='ctx'> {</div><div class='del'>-	if (!wq)</div><div class='del'>-		return;</div><div class='del'>-	wq-&gt;normal-&gt;limit_active = limit_active;</div><div class='del'>-	if (wq-&gt;high)</div><div class='del'>-		wq-&gt;high-&gt;limit_active = limit_active;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void btrfs_set_work_high_priority(struct btrfs_work *work)</div><div class='del'>-{</div><div class='del'>-	set_bit(WORK_HIGH_PRIO_BIT, &amp;work-&gt;flags);</div><div class='add'>+	if (wq)</div><div class='add'>+		wq-&gt;limit_active = limit_active;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_flush_workqueue(struct btrfs_workqueue *wq)</div><div class='ctx'> {</div><div class='del'>-	if (wq-&gt;high)</div><div class='del'>-		flush_workqueue(wq-&gt;high-&gt;normal_wq);</div><div class='del'>-</div><div class='del'>-	flush_workqueue(wq-&gt;normal-&gt;normal_wq);</div><div class='add'>+	flush_workqueue(wq-&gt;normal_wq);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/btrfs/async-thread.h b/fs/btrfs/async-thread.h<br/>index 3204daa51b95..04c2f3175828 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/async-thread.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/async-thread.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/async-thread.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/async-thread.h</a></div><div class='hunk'>@@ -7,25 +7,25 @@</div><div class='ctx'> #ifndef BTRFS_ASYNC_THREAD_H</div><div class='ctx'> #define BTRFS_ASYNC_THREAD_H</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/compiler_types.h&gt;</div><div class='ctx'> #include &lt;linux/workqueue.h&gt;</div><div class='add'>+#include &lt;linux/list.h&gt;</div><div class='ctx'> </div><div class='ctx'> struct btrfs_fs_info;</div><div class='ctx'> struct btrfs_workqueue;</div><div class='del'>-/* Internal use only */</div><div class='del'>-struct __btrfs_workqueue;</div><div class='ctx'> struct btrfs_work;</div><div class='add'>+</div><div class='ctx'> typedef void (*btrfs_func_t)(struct btrfs_work *arg);</div><div class='del'>-typedef void (*btrfs_work_func_t)(struct work_struct *arg);</div><div class='add'>+typedef void (*btrfs_ordered_func_t)(struct btrfs_work *arg, bool);</div><div class='ctx'> </div><div class='ctx'> struct btrfs_work {</div><div class='ctx'> 	btrfs_func_t func;</div><div class='del'>-	btrfs_func_t ordered_func;</div><div class='del'>-	btrfs_func_t ordered_free;</div><div class='add'>+	btrfs_ordered_func_t ordered_func;</div><div class='ctx'> </div><div class='ctx'> 	/* Don't touch things below */</div><div class='ctx'> 	struct work_struct normal_work;</div><div class='ctx'> 	struct list_head ordered_list;</div><div class='del'>-	struct __btrfs_workqueue *wq;</div><div class='add'>+	struct btrfs_workqueue *wq;</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -34,15 +34,17 @@ struct btrfs_workqueue *btrfs_alloc_workqueue(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 					      unsigned int flags,</div><div class='ctx'> 					      int limit_active,</div><div class='ctx'> 					      int thresh);</div><div class='add'>+struct btrfs_workqueue *btrfs_alloc_ordered_workqueue(</div><div class='add'>+				struct btrfs_fs_info *fs_info, const char *name,</div><div class='add'>+				unsigned int flags);</div><div class='ctx'> void btrfs_init_work(struct btrfs_work *work, btrfs_func_t func,</div><div class='del'>-		     btrfs_func_t ordered_func, btrfs_func_t ordered_free);</div><div class='add'>+		     btrfs_ordered_func_t ordered_func);</div><div class='ctx'> void btrfs_queue_work(struct btrfs_workqueue *wq,</div><div class='ctx'> 		      struct btrfs_work *work);</div><div class='ctx'> void btrfs_destroy_workqueue(struct btrfs_workqueue *wq);</div><div class='ctx'> void btrfs_workqueue_set_max(struct btrfs_workqueue *wq, int max);</div><div class='del'>-void btrfs_set_work_high_priority(struct btrfs_work *work);</div><div class='ctx'> struct btrfs_fs_info * __pure btrfs_work_owner(const struct btrfs_work *work);</div><div class='del'>-struct btrfs_fs_info * __pure btrfs_workqueue_owner(const struct __btrfs_workqueue *wq);</div><div class='add'>+struct btrfs_fs_info * __pure btrfs_workqueue_owner(const struct btrfs_workqueue *wq);</div><div class='ctx'> bool btrfs_workqueue_normal_congested(const struct btrfs_workqueue *wq);</div><div class='ctx'> void btrfs_flush_workqueue(struct btrfs_workqueue *wq);</div><div class='ctx'> </div><div class='head'>diff --git a/fs/btrfs/backref.c b/fs/btrfs/backref.c<br/>index f735b8798ba1..78da47a3d00e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/backref.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/backref.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/backref.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/backref.c</a></div><div class='hunk'>@@ -15,49 +15,77 @@</div><div class='ctx'> #include "locking.h"</div><div class='ctx'> #include "misc.h"</div><div class='ctx'> #include "tree-mod-log.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "extent-tree.h"</div><div class='add'>+#include "relocation.h"</div><div class='add'>+#include "tree-checker.h"</div><div class='ctx'> </div><div class='del'>-/* Just an arbitrary number so we can be sure this happened */</div><div class='del'>-#define BACKREF_FOUND_SHARED 6</div><div class='add'>+/* Just arbitrary numbers so we can be sure one of these happened. */</div><div class='add'>+#define BACKREF_FOUND_SHARED     6</div><div class='add'>+#define BACKREF_FOUND_NOT_SHARED 7</div><div class='ctx'> </div><div class='ctx'> struct extent_inode_elem {</div><div class='ctx'> 	u64 inum;</div><div class='ctx'> 	u64 offset;</div><div class='add'>+	u64 num_bytes;</div><div class='ctx'> 	struct extent_inode_elem *next;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int check_extent_in_eb(const struct btrfs_key *key,</div><div class='add'>+static int check_extent_in_eb(struct btrfs_backref_walk_ctx *ctx,</div><div class='add'>+			      const struct btrfs_key *key,</div><div class='ctx'> 			      const struct extent_buffer *eb,</div><div class='ctx'> 			      const struct btrfs_file_extent_item *fi,</div><div class='del'>-			      u64 extent_item_pos,</div><div class='del'>-			      struct extent_inode_elem **eie,</div><div class='del'>-			      bool ignore_offset)</div><div class='add'>+			      struct extent_inode_elem **eie)</div><div class='ctx'> {</div><div class='del'>-	u64 offset = 0;</div><div class='add'>+	const u64 data_len = btrfs_file_extent_num_bytes(eb, fi);</div><div class='add'>+	u64 offset = key-&gt;offset;</div><div class='ctx'> 	struct extent_inode_elem *e;</div><div class='add'>+	const u64 *root_ids;</div><div class='add'>+	int root_count;</div><div class='add'>+	bool cached;</div><div class='ctx'> </div><div class='del'>-	if (!ignore_offset &amp;&amp;</div><div class='add'>+	if (!ctx-&gt;ignore_extent_item_pos &amp;&amp;</div><div class='ctx'> 	    !btrfs_file_extent_compression(eb, fi) &amp;&amp;</div><div class='ctx'> 	    !btrfs_file_extent_encryption(eb, fi) &amp;&amp;</div><div class='ctx'> 	    !btrfs_file_extent_other_encoding(eb, fi)) {</div><div class='ctx'> 		u64 data_offset;</div><div class='del'>-		u64 data_len;</div><div class='ctx'> </div><div class='ctx'> 		data_offset = btrfs_file_extent_offset(eb, fi);</div><div class='del'>-		data_len = btrfs_file_extent_num_bytes(eb, fi);</div><div class='ctx'> </div><div class='del'>-		if (extent_item_pos &lt; data_offset ||</div><div class='del'>-		    extent_item_pos &gt;= data_offset + data_len)</div><div class='add'>+		if (ctx-&gt;extent_item_pos &lt; data_offset ||</div><div class='add'>+		    ctx-&gt;extent_item_pos &gt;= data_offset + data_len)</div><div class='ctx'> 			return 1;</div><div class='del'>-		offset = extent_item_pos - data_offset;</div><div class='add'>+		offset += ctx-&gt;extent_item_pos - data_offset;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (!ctx-&gt;indirect_ref_iterator || !ctx-&gt;cache_lookup)</div><div class='add'>+		goto add_inode_elem;</div><div class='add'>+</div><div class='add'>+	cached = ctx-&gt;cache_lookup(eb-&gt;start, ctx-&gt;user_ctx, &amp;root_ids,</div><div class='add'>+				   &amp;root_count);</div><div class='add'>+	if (!cached)</div><div class='add'>+		goto add_inode_elem;</div><div class='add'>+</div><div class='add'>+	for (int i = 0; i &lt; root_count; i++) {</div><div class='add'>+		int ret;</div><div class='add'>+</div><div class='add'>+		ret = ctx-&gt;indirect_ref_iterator(key-&gt;objectid, offset,</div><div class='add'>+						 data_len, root_ids[i],</div><div class='add'>+						 ctx-&gt;user_ctx);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+add_inode_elem:</div><div class='ctx'> 	e = kmalloc(sizeof(*e), GFP_NOFS);</div><div class='ctx'> 	if (!e)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	e-&gt;next = *eie;</div><div class='ctx'> 	e-&gt;inum = key-&gt;objectid;</div><div class='del'>-	e-&gt;offset = key-&gt;offset + offset;</div><div class='add'>+	e-&gt;offset = offset;</div><div class='add'>+	e-&gt;num_bytes = data_len;</div><div class='ctx'> 	*eie = e;</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -73,10 +101,9 @@ static void free_inode_elem_list(struct extent_inode_elem *eie)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int find_extent_in_eb(const struct extent_buffer *eb,</div><div class='del'>-			     u64 wanted_disk_byte, u64 extent_item_pos,</div><div class='del'>-			     struct extent_inode_elem **eie,</div><div class='del'>-			     bool ignore_offset)</div><div class='add'>+static int find_extent_in_eb(struct btrfs_backref_walk_ctx *ctx,</div><div class='add'>+			     const struct extent_buffer *eb,</div><div class='add'>+			     struct extent_inode_elem **eie)</div><div class='ctx'> {</div><div class='ctx'> 	u64 disk_byte;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='hunk'>@@ -102,11 +129,11 @@ static int find_extent_in_eb(const struct extent_buffer *eb,</div><div class='ctx'> 			continue;</div><div class='ctx'> 		/* don't skip BTRFS_FILE_EXTENT_PREALLOC, we can handle that */</div><div class='ctx'> 		disk_byte = btrfs_file_extent_disk_bytenr(eb, fi);</div><div class='del'>-		if (disk_byte != wanted_disk_byte)</div><div class='add'>+		if (disk_byte != ctx-&gt;bytenr)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		ret = check_extent_in_eb(&amp;key, eb, fi, extent_item_pos, eie, ignore_offset);</div><div class='del'>-		if (ret &lt; 0)</div><div class='add'>+		ret = check_extent_in_eb(ctx, &amp;key, eb, fi, eie);</div><div class='add'>+		if (ret == BTRFS_ITERATE_EXTENT_INODES_STOP || ret &lt; 0)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -135,9 +162,30 @@ struct preftrees {</div><div class='ctx'>  *  - decremented when a ref-&gt;count transitions to &lt;1</div><div class='ctx'>  */</div><div class='ctx'> struct share_check {</div><div class='del'>-	u64 root_objectid;</div><div class='add'>+	struct btrfs_backref_share_check_ctx *ctx;</div><div class='add'>+	struct btrfs_root *root;</div><div class='ctx'> 	u64 inum;</div><div class='add'>+	u64 data_bytenr;</div><div class='add'>+	u64 data_extent_gen;</div><div class='add'>+	/*</div><div class='add'>+	 * Counts number of inodes that refer to an extent (different inodes in</div><div class='add'>+	 * the same root or different roots) that we could find. The sharedness</div><div class='add'>+	 * check typically stops once this counter gets greater than 1, so it</div><div class='add'>+	 * may not reflect the total number of inodes.</div><div class='add'>+	 */</div><div class='ctx'> 	int share_count;</div><div class='add'>+	/*</div><div class='add'>+	 * The number of times we found our inode refers to the data extent we</div><div class='add'>+	 * are determining the sharedness. In other words, how many file extent</div><div class='add'>+	 * items we could find for our inode that point to our target data</div><div class='add'>+	 * extent. The value we get here after finishing the extent sharedness</div><div class='add'>+	 * check may be smaller than reality, but if it ends up being greater</div><div class='add'>+	 * than 1, then we know for sure the inode has multiple file extent</div><div class='add'>+	 * items that point to our inode, and we can safely assume it's useful</div><div class='add'>+	 * to cache the sharedness check result.</div><div class='add'>+	 */</div><div class='add'>+	int self_ref_count;</div><div class='add'>+	bool have_delayed_delete_refs;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static inline int extent_is_shared(struct share_check *sc)</div><div class='hunk'>@@ -150,10 +198,7 @@ static struct kmem_cache *btrfs_prelim_ref_cache;</div><div class='ctx'> int __init btrfs_prelim_ref_init(void)</div><div class='ctx'> {</div><div class='ctx'> 	btrfs_prelim_ref_cache = kmem_cache_create("btrfs_prelim_ref",</div><div class='del'>-					sizeof(struct prelim_ref),</div><div class='del'>-					0,</div><div class='del'>-					SLAB_MEM_SPREAD,</div><div class='del'>-					NULL);</div><div class='add'>+					sizeof(struct prelim_ref), 0, 0, NULL);</div><div class='ctx'> 	if (!btrfs_prelim_ref_cache)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -174,8 +219,8 @@ static void free_pref(struct prelim_ref *ref)</div><div class='ctx'>  * A -1 return indicates ref1 is a 'lower' block than ref2, while 1</div><div class='ctx'>  * indicates a 'higher' block.</div><div class='ctx'>  */</div><div class='del'>-static int prelim_ref_compare(struct prelim_ref *ref1,</div><div class='del'>-			      struct prelim_ref *ref2)</div><div class='add'>+static int prelim_ref_compare(const struct prelim_ref *ref1,</div><div class='add'>+			      const struct prelim_ref *ref2)</div><div class='ctx'> {</div><div class='ctx'> 	if (ref1-&gt;level &lt; ref2-&gt;level)</div><div class='ctx'> 		return -1;</div><div class='hunk'>@@ -205,8 +250,23 @@ static int prelim_ref_compare(struct prelim_ref *ref1,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int prelim_ref_rb_add_cmp(const struct rb_node *new,</div><div class='add'>+				 const struct rb_node *exist)</div><div class='add'>+{</div><div class='add'>+	const struct prelim_ref *ref_new =</div><div class='add'>+		rb_entry(new, struct prelim_ref, rbnode);</div><div class='add'>+	const struct prelim_ref *ref_exist =</div><div class='add'>+		rb_entry(exist, struct prelim_ref, rbnode);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * prelim_ref_compare() expects the first parameter as the existing one,</div><div class='add'>+	 * different from the rb_find_add_cached() order.</div><div class='add'>+	 */</div><div class='add'>+	return prelim_ref_compare(ref_exist, ref_new);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void update_share_count(struct share_check *sc, int oldcount,</div><div class='del'>-			       int newcount)</div><div class='add'>+			       int newcount, const struct prelim_ref *newref)</div><div class='ctx'> {</div><div class='ctx'> 	if ((!sc) || (oldcount == 0 &amp;&amp; newcount &lt; 1))</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -215,6 +275,11 @@ static void update_share_count(struct share_check *sc, int oldcount,</div><div class='ctx'> 		sc-&gt;share_count--;</div><div class='ctx'> 	else if (oldcount &lt; 1 &amp;&amp; newcount &gt; 0)</div><div class='ctx'> 		sc-&gt;share_count++;</div><div class='add'>+</div><div class='add'>+	if (newref-&gt;root_id == btrfs_root_id(sc-&gt;root) &amp;&amp;</div><div class='add'>+	    newref-&gt;wanted_disk_byte == sc-&gt;data_bytenr &amp;&amp;</div><div class='add'>+	    newref-&gt;key_for_search.objectid == sc-&gt;inum)</div><div class='add'>+		sc-&gt;self_ref_count += newref-&gt;count;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -228,55 +293,39 @@ static void prelim_ref_insert(const struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			      struct share_check *sc)</div><div class='ctx'> {</div><div class='ctx'> 	struct rb_root_cached *root;</div><div class='del'>-	struct rb_node **p;</div><div class='del'>-	struct rb_node *parent = NULL;</div><div class='del'>-	struct prelim_ref *ref;</div><div class='del'>-	int result;</div><div class='del'>-	bool leftmost = true;</div><div class='add'>+	struct rb_node *exist;</div><div class='ctx'> </div><div class='ctx'> 	root = &amp;preftree-&gt;root;</div><div class='del'>-	p = &amp;root-&gt;rb_root.rb_node;</div><div class='del'>-</div><div class='del'>-	while (*p) {</div><div class='del'>-		parent = *p;</div><div class='del'>-		ref = rb_entry(parent, struct prelim_ref, rbnode);</div><div class='del'>-		result = prelim_ref_compare(ref, newref);</div><div class='del'>-		if (result &lt; 0) {</div><div class='del'>-			p = &amp;(*p)-&gt;rb_left;</div><div class='del'>-		} else if (result &gt; 0) {</div><div class='del'>-			p = &amp;(*p)-&gt;rb_right;</div><div class='del'>-			leftmost = false;</div><div class='del'>-		} else {</div><div class='del'>-			/* Identical refs, merge them and free @newref */</div><div class='del'>-			struct extent_inode_elem *eie = ref-&gt;inode_list;</div><div class='add'>+	exist = rb_find_add_cached(&amp;newref-&gt;rbnode, root, prelim_ref_rb_add_cmp);</div><div class='add'>+	if (exist) {</div><div class='add'>+		struct prelim_ref *ref = rb_entry(exist, struct prelim_ref, rbnode);</div><div class='add'>+		/* Identical refs, merge them and free @newref */</div><div class='add'>+		struct extent_inode_elem *eie = ref-&gt;inode_list;</div><div class='ctx'> </div><div class='del'>-			while (eie &amp;&amp; eie-&gt;next)</div><div class='del'>-				eie = eie-&gt;next;</div><div class='add'>+		while (eie &amp;&amp; eie-&gt;next)</div><div class='add'>+			eie = eie-&gt;next;</div><div class='ctx'> </div><div class='del'>-			if (!eie)</div><div class='del'>-				ref-&gt;inode_list = newref-&gt;inode_list;</div><div class='del'>-			else</div><div class='del'>-				eie-&gt;next = newref-&gt;inode_list;</div><div class='del'>-			trace_btrfs_prelim_ref_merge(fs_info, ref, newref,</div><div class='del'>-						     preftree-&gt;count);</div><div class='del'>-			/*</div><div class='del'>-			 * A delayed ref can have newref-&gt;count &lt; 0.</div><div class='del'>-			 * The ref-&gt;count is updated to follow any</div><div class='del'>-			 * BTRFS_[ADD|DROP]_DELAYED_REF actions.</div><div class='del'>-			 */</div><div class='del'>-			update_share_count(sc, ref-&gt;count,</div><div class='del'>-					   ref-&gt;count + newref-&gt;count);</div><div class='del'>-			ref-&gt;count += newref-&gt;count;</div><div class='del'>-			free_pref(newref);</div><div class='del'>-			return;</div><div class='del'>-		}</div><div class='add'>+		if (!eie)</div><div class='add'>+			ref-&gt;inode_list = newref-&gt;inode_list;</div><div class='add'>+		else</div><div class='add'>+			eie-&gt;next = newref-&gt;inode_list;</div><div class='add'>+		trace_btrfs_prelim_ref_merge(fs_info, ref, newref,</div><div class='add'>+							preftree-&gt;count);</div><div class='add'>+		/*</div><div class='add'>+		 * A delayed ref can have newref-&gt;count &lt; 0.</div><div class='add'>+		 * The ref-&gt;count is updated to follow any</div><div class='add'>+		 * BTRFS_[ADD|DROP]_DELAYED_REF actions.</div><div class='add'>+		 */</div><div class='add'>+		update_share_count(sc, ref-&gt;count,</div><div class='add'>+					ref-&gt;count + newref-&gt;count, newref);</div><div class='add'>+		ref-&gt;count += newref-&gt;count;</div><div class='add'>+		free_pref(newref);</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	update_share_count(sc, 0, newref-&gt;count);</div><div class='add'>+	update_share_count(sc, 0, newref-&gt;count, newref);</div><div class='ctx'> 	preftree-&gt;count++;</div><div class='ctx'> 	trace_btrfs_prelim_ref_insert(fs_info, newref, NULL, preftree-&gt;count);</div><div class='del'>-	rb_link_node(&amp;newref-&gt;rbnode, parent, p);</div><div class='del'>-	rb_insert_color_cached(&amp;newref-&gt;rbnode, root, leftmost);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -288,8 +337,10 @@ static void prelim_release(struct preftree *preftree)</div><div class='ctx'> 	struct prelim_ref *ref, *next_ref;</div><div class='ctx'> </div><div class='ctx'> 	rbtree_postorder_for_each_entry_safe(ref, next_ref,</div><div class='del'>-					     &amp;preftree-&gt;root.rb_root, rbnode)</div><div class='add'>+					     &amp;preftree-&gt;root.rb_root, rbnode) {</div><div class='add'>+		free_inode_elem_list(ref-&gt;inode_list);</div><div class='ctx'> 		free_pref(ref);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	preftree-&gt;root = RB_ROOT_CACHED;</div><div class='ctx'> 	preftree-&gt;count = 0;</div><div class='hunk'>@@ -413,11 +464,11 @@ static int is_shared_data_backref(struct preftrees *preftrees, u64 bytenr)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int add_all_parents(struct btrfs_root *root, struct btrfs_path *path,</div><div class='add'>+static int add_all_parents(struct btrfs_backref_walk_ctx *ctx,</div><div class='add'>+			   struct btrfs_root *root, struct btrfs_path *path,</div><div class='ctx'> 			   struct ulist *parents,</div><div class='ctx'> 			   struct preftrees *preftrees, struct prelim_ref *ref,</div><div class='del'>-			   int level, u64 time_seq, const u64 *extent_item_pos,</div><div class='del'>-			   bool ignore_offset)</div><div class='add'>+			   int level)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int slot;</div><div class='hunk'>@@ -430,6 +481,7 @@ static int add_all_parents(struct btrfs_root *root, struct btrfs_path *path,</div><div class='ctx'> 	u64 wanted_disk_byte = ref-&gt;wanted_disk_byte;</div><div class='ctx'> 	u64 count = 0;</div><div class='ctx'> 	u64 data_offset;</div><div class='add'>+	u8 type;</div><div class='ctx'> </div><div class='ctx'> 	if (level != 0) {</div><div class='ctx'> 		eb = path-&gt;nodes[level];</div><div class='hunk'>@@ -453,10 +505,10 @@ static int add_all_parents(struct btrfs_root *root, struct btrfs_path *path,</div><div class='ctx'> 	if (path-&gt;slots[0] &gt;= btrfs_header_nritems(eb) ||</div><div class='ctx'> 	    is_shared_data_backref(preftrees, eb-&gt;start) ||</div><div class='ctx'> 	    ref-&gt;root_id != btrfs_header_owner(eb)) {</div><div class='del'>-		if (time_seq == BTRFS_SEQ_LAST)</div><div class='add'>+		if (ctx-&gt;time_seq == BTRFS_SEQ_LAST)</div><div class='ctx'> 			ret = btrfs_next_leaf(root, path);</div><div class='ctx'> 		else</div><div class='del'>-			ret = btrfs_next_old_leaf(root, path, time_seq);</div><div class='add'>+			ret = btrfs_next_old_leaf(root, path, ctx-&gt;time_seq);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	while (!ret &amp;&amp; count &lt; ref-&gt;count) {</div><div class='hunk'>@@ -477,13 +529,16 @@ static int add_all_parents(struct btrfs_root *root, struct btrfs_path *path,</div><div class='ctx'> 		if (slot == 0 &amp;&amp;</div><div class='ctx'> 		    (is_shared_data_backref(preftrees, eb-&gt;start) ||</div><div class='ctx'> 		     ref-&gt;root_id != btrfs_header_owner(eb))) {</div><div class='del'>-			if (time_seq == BTRFS_SEQ_LAST)</div><div class='add'>+			if (ctx-&gt;time_seq == BTRFS_SEQ_LAST)</div><div class='ctx'> 				ret = btrfs_next_leaf(root, path);</div><div class='ctx'> 			else</div><div class='del'>-				ret = btrfs_next_old_leaf(root, path, time_seq);</div><div class='add'>+				ret = btrfs_next_old_leaf(root, path, ctx-&gt;time_seq);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> 		fi = btrfs_item_ptr(eb, slot, struct btrfs_file_extent_item);</div><div class='add'>+		type = btrfs_file_extent_type(eb, fi);</div><div class='add'>+		if (type == BTRFS_FILE_EXTENT_INLINE)</div><div class='add'>+			goto next;</div><div class='ctx'> 		disk_byte = btrfs_file_extent_disk_bytenr(eb, fi);</div><div class='ctx'> 		data_offset = btrfs_file_extent_offset(eb, fi);</div><div class='ctx'> </div><div class='hunk'>@@ -494,11 +549,10 @@ static int add_all_parents(struct btrfs_root *root, struct btrfs_path *path,</div><div class='ctx'> 				count++;</div><div class='ctx'> 			else</div><div class='ctx'> 				goto next;</div><div class='del'>-			if (extent_item_pos) {</div><div class='del'>-				ret = check_extent_in_eb(&amp;key, eb, fi,</div><div class='del'>-						*extent_item_pos,</div><div class='del'>-						&amp;eie, ignore_offset);</div><div class='del'>-				if (ret &lt; 0)</div><div class='add'>+			if (!ctx-&gt;skip_inode_ref_list) {</div><div class='add'>+				ret = check_extent_in_eb(ctx, &amp;key, eb, fi, &amp;eie);</div><div class='add'>+				if (ret == BTRFS_ITERATE_EXTENT_INODES_STOP ||</div><div class='add'>+				    ret &lt; 0)</div><div class='ctx'> 					break;</div><div class='ctx'> 			}</div><div class='ctx'> 			if (ret &gt; 0)</div><div class='hunk'>@@ -507,7 +561,7 @@ static int add_all_parents(struct btrfs_root *root, struct btrfs_path *path,</div><div class='ctx'> 						  eie, (void **)&amp;old, GFP_NOFS);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='ctx'> 				break;</div><div class='del'>-			if (!ret &amp;&amp; extent_item_pos) {</div><div class='add'>+			if (!ret &amp;&amp; !ctx-&gt;skip_inode_ref_list) {</div><div class='ctx'> 				while (old-&gt;next)</div><div class='ctx'> 					old = old-&gt;next;</div><div class='ctx'> 				old-&gt;next = eie;</div><div class='hunk'>@@ -515,16 +569,17 @@ static int add_all_parents(struct btrfs_root *root, struct btrfs_path *path,</div><div class='ctx'> 			eie = NULL;</div><div class='ctx'> 		}</div><div class='ctx'> next:</div><div class='del'>-		if (time_seq == BTRFS_SEQ_LAST)</div><div class='add'>+		if (ctx-&gt;time_seq == BTRFS_SEQ_LAST)</div><div class='ctx'> 			ret = btrfs_next_item(root, path);</div><div class='ctx'> 		else</div><div class='del'>-			ret = btrfs_next_old_item(root, path, time_seq);</div><div class='add'>+			ret = btrfs_next_old_item(root, path, ctx-&gt;time_seq);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (ret &gt; 0)</div><div class='del'>-		ret = 0;</div><div class='del'>-	else if (ret &lt; 0)</div><div class='add'>+	if (ret == BTRFS_ITERATE_EXTENT_INODES_STOP || ret &lt; 0)</div><div class='ctx'> 		free_inode_elem_list(eie);</div><div class='add'>+	else if (ret &gt; 0)</div><div class='add'>+		ret = 0;</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -532,11 +587,10 @@ next:</div><div class='ctx'>  * resolve an indirect backref in the form (root_id, key, level)</div><div class='ctx'>  * to a logical address</div><div class='ctx'>  */</div><div class='del'>-static int resolve_indirect_ref(struct btrfs_fs_info *fs_info,</div><div class='del'>-				struct btrfs_path *path, u64 time_seq,</div><div class='add'>+static int resolve_indirect_ref(struct btrfs_backref_walk_ctx *ctx,</div><div class='add'>+				struct btrfs_path *path,</div><div class='ctx'> 				struct preftrees *preftrees,</div><div class='del'>-				struct prelim_ref *ref, struct ulist *parents,</div><div class='del'>-				const u64 *extent_item_pos, bool ignore_offset)</div><div class='add'>+				struct prelim_ref *ref, struct ulist *parents)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root;</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='hunk'>@@ -554,9 +608,9 @@ static int resolve_indirect_ref(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	 * here.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (path-&gt;search_commit_root)</div><div class='del'>-		root = btrfs_get_fs_root_commit_root(fs_info, path, ref-&gt;root_id);</div><div class='add'>+		root = btrfs_get_fs_root_commit_root(ctx-&gt;fs_info, path, ref-&gt;root_id);</div><div class='ctx'> 	else</div><div class='del'>-		root = btrfs_get_fs_root(fs_info, ref-&gt;root_id, false);</div><div class='add'>+		root = btrfs_get_fs_root(ctx-&gt;fs_info, ref-&gt;root_id, false);</div><div class='ctx'> 	if (IS_ERR(root)) {</div><div class='ctx'> 		ret = PTR_ERR(root);</div><div class='ctx'> 		goto out_free;</div><div class='hunk'>@@ -568,17 +622,17 @@ static int resolve_indirect_ref(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (btrfs_is_testing(fs_info)) {</div><div class='add'>+	if (btrfs_is_testing(ctx-&gt;fs_info)) {</div><div class='ctx'> 		ret = -ENOENT;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (path-&gt;search_commit_root)</div><div class='ctx'> 		root_level = btrfs_header_level(root-&gt;commit_root);</div><div class='del'>-	else if (time_seq == BTRFS_SEQ_LAST)</div><div class='add'>+	else if (ctx-&gt;time_seq == BTRFS_SEQ_LAST)</div><div class='ctx'> 		root_level = btrfs_header_level(root-&gt;node);</div><div class='ctx'> 	else</div><div class='del'>-		root_level = btrfs_old_root_level(root, time_seq);</div><div class='add'>+		root_level = btrfs_old_root_level(root, ctx-&gt;time_seq);</div><div class='ctx'> </div><div class='ctx'> 	if (root_level + 1 == level)</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -606,16 +660,15 @@ static int resolve_indirect_ref(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	    search_key.offset &gt;= LLONG_MAX)</div><div class='ctx'> 		search_key.offset = 0;</div><div class='ctx'> 	path-&gt;lowest_level = level;</div><div class='del'>-	if (time_seq == BTRFS_SEQ_LAST)</div><div class='add'>+	if (ctx-&gt;time_seq == BTRFS_SEQ_LAST)</div><div class='ctx'> 		ret = btrfs_search_slot(NULL, root, &amp;search_key, path, 0, 0);</div><div class='ctx'> 	else</div><div class='del'>-		ret = btrfs_search_old_slot(root, &amp;search_key, path, time_seq);</div><div class='add'>+		ret = btrfs_search_old_slot(root, &amp;search_key, path, ctx-&gt;time_seq);</div><div class='ctx'> </div><div class='del'>-	btrfs_debug(fs_info,</div><div class='del'>-		"search slot in root %llu (level %d, ref count %d) returned %d for key (%llu %u %llu)",</div><div class='del'>-		 ref-&gt;root_id, level, ref-&gt;count, ret,</div><div class='del'>-		 ref-&gt;key_for_search.objectid, ref-&gt;key_for_search.type,</div><div class='del'>-		 ref-&gt;key_for_search.offset);</div><div class='add'>+	btrfs_debug(ctx-&gt;fs_info,</div><div class='add'>+"search slot in root %llu (level %d, ref count %d) returned %d for key " BTRFS_KEY_FMT,</div><div class='add'>+		    ref-&gt;root_id, level, ref-&gt;count, ret,</div><div class='add'>+		    BTRFS_KEY_FMT_VALUE(&amp;ref-&gt;key_for_search));</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -629,8 +682,7 @@ static int resolve_indirect_ref(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		eb = path-&gt;nodes[level];</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = add_all_parents(root, path, parents, preftrees, ref, level,</div><div class='del'>-			      time_seq, extent_item_pos, ignore_offset);</div><div class='add'>+	ret = add_all_parents(ctx, root, path, parents, preftrees, ref, level);</div><div class='ctx'> out:</div><div class='ctx'> 	btrfs_put_root(root);</div><div class='ctx'> out_free:</div><div class='hunk'>@@ -647,6 +699,18 @@ unode_aux_to_inode_list(struct ulist_node *node)</div><div class='ctx'> 	return (struct extent_inode_elem *)(uintptr_t)node-&gt;aux;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void free_leaf_list(struct ulist *ulist)</div><div class='add'>+{</div><div class='add'>+	struct ulist_node *node;</div><div class='add'>+	struct ulist_iterator uiter;</div><div class='add'>+</div><div class='add'>+	ULIST_ITER_INIT(&amp;uiter);</div><div class='add'>+	while ((node = ulist_next(ulist, &amp;uiter)))</div><div class='add'>+		free_inode_elem_list(unode_aux_to_inode_list(node));</div><div class='add'>+</div><div class='add'>+	ulist_free(ulist);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * We maintain three separate rbtrees: one for direct refs, one for</div><div class='ctx'>  * indirect refs which have a key, and one for indirect refs which do not</div><div class='hunk'>@@ -663,13 +727,11 @@ unode_aux_to_inode_list(struct ulist_node *node)</div><div class='ctx'>  * rbtree as they are encountered. The new backrefs are subsequently</div><div class='ctx'>  * resolved as above.</div><div class='ctx'>  */</div><div class='del'>-static int resolve_indirect_refs(struct btrfs_fs_info *fs_info,</div><div class='del'>-				 struct btrfs_path *path, u64 time_seq,</div><div class='add'>+static int resolve_indirect_refs(struct btrfs_backref_walk_ctx *ctx,</div><div class='add'>+				 struct btrfs_path *path,</div><div class='ctx'> 				 struct preftrees *preftrees,</div><div class='del'>-				 const u64 *extent_item_pos,</div><div class='del'>-				 struct share_check *sc, bool ignore_offset)</div><div class='add'>+				 struct share_check *sc)</div><div class='ctx'> {</div><div class='del'>-	int err;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	struct ulist *parents;</div><div class='ctx'> 	struct ulist_node *node;</div><div class='hunk'>@@ -688,6 +750,7 @@ static int resolve_indirect_refs(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	 */</div><div class='ctx'> 	while ((rnode = rb_first_cached(&amp;preftrees-&gt;indirect.root))) {</div><div class='ctx'> 		struct prelim_ref *ref;</div><div class='add'>+		int ret2;</div><div class='ctx'> </div><div class='ctx'> 		ref = rb_entry(rnode, struct prelim_ref, rbnode);</div><div class='ctx'> 		if (WARN(ref-&gt;parent,</div><div class='hunk'>@@ -704,26 +767,23 @@ static int resolve_indirect_refs(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (sc &amp;&amp; sc-&gt;root_objectid &amp;&amp;</div><div class='del'>-		    ref-&gt;root_id != sc-&gt;root_objectid) {</div><div class='add'>+		if (sc &amp;&amp; ref-&gt;root_id != btrfs_root_id(sc-&gt;root)) {</div><div class='ctx'> 			free_pref(ref);</div><div class='ctx'> 			ret = BACKREF_FOUND_SHARED;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='del'>-		err = resolve_indirect_ref(fs_info, path, time_seq, preftrees,</div><div class='del'>-					   ref, parents, extent_item_pos,</div><div class='del'>-					   ignore_offset);</div><div class='add'>+		ret2 = resolve_indirect_ref(ctx, path, preftrees, ref, parents);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * we can only tolerate ENOENT,otherwise,we should catch error</div><div class='ctx'> 		 * and return directly.</div><div class='ctx'> 		 */</div><div class='del'>-		if (err == -ENOENT) {</div><div class='del'>-			prelim_ref_insert(fs_info, &amp;preftrees-&gt;direct, ref,</div><div class='add'>+		if (ret2 == -ENOENT) {</div><div class='add'>+			prelim_ref_insert(ctx-&gt;fs_info, &amp;preftrees-&gt;direct, ref,</div><div class='ctx'> 					  NULL);</div><div class='ctx'> 			continue;</div><div class='del'>-		} else if (err) {</div><div class='add'>+		} else if (ret2) {</div><div class='ctx'> 			free_pref(ref);</div><div class='del'>-			ret = err;</div><div class='add'>+			ret = ret2;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -747,7 +807,7 @@ static int resolve_indirect_refs(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			memcpy(new_ref, ref, sizeof(*ref));</div><div class='ctx'> 			new_ref-&gt;parent = node-&gt;val;</div><div class='ctx'> 			new_ref-&gt;inode_list = unode_aux_to_inode_list(node);</div><div class='del'>-			prelim_ref_insert(fs_info, &amp;preftrees-&gt;direct,</div><div class='add'>+			prelim_ref_insert(ctx-&gt;fs_info, &amp;preftrees-&gt;direct,</div><div class='ctx'> 					  new_ref, NULL);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -755,13 +815,17 @@ static int resolve_indirect_refs(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		 * Now it's a direct ref, put it in the direct tree. We must</div><div class='ctx'> 		 * do this last because the ref could be merged/freed here.</div><div class='ctx'> 		 */</div><div class='del'>-		prelim_ref_insert(fs_info, &amp;preftrees-&gt;direct, ref, NULL);</div><div class='add'>+		prelim_ref_insert(ctx-&gt;fs_info, &amp;preftrees-&gt;direct, ref, NULL);</div><div class='ctx'> </div><div class='ctx'> 		ulist_reinit(parents);</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='del'>-	ulist_free(parents);</div><div class='add'>+	/*</div><div class='add'>+	 * We may have inode lists attached to refs in the parents ulist, so we</div><div class='add'>+	 * must free them before freeing the ulist and its refs.</div><div class='add'>+	 */</div><div class='add'>+	free_leaf_list(parents);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -777,6 +841,8 @@ static int add_missing_keys(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	struct rb_node *node;</div><div class='ctx'> </div><div class='ctx'> 	while ((node = rb_first_cached(&amp;tree-&gt;root))) {</div><div class='add'>+		struct btrfs_tree_parent_check check = { 0 };</div><div class='add'>+</div><div class='ctx'> 		ref = rb_entry(node, struct prelim_ref, rbnode);</div><div class='ctx'> 		rb_erase_cached(node, &amp;tree-&gt;root);</div><div class='ctx'> </div><div class='hunk'>@@ -784,16 +850,20 @@ static int add_missing_keys(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		BUG_ON(ref-&gt;key_for_search.type);</div><div class='ctx'> 		BUG_ON(!ref-&gt;wanted_disk_byte);</div><div class='ctx'> </div><div class='del'>-		eb = read_tree_block(fs_info, ref-&gt;wanted_disk_byte,</div><div class='del'>-				     ref-&gt;root_id, 0, ref-&gt;level - 1, NULL);</div><div class='add'>+		check.level = ref-&gt;level - 1;</div><div class='add'>+		check.owner_root = ref-&gt;root_id;</div><div class='add'>+</div><div class='add'>+		eb = read_tree_block(fs_info, ref-&gt;wanted_disk_byte, &amp;check);</div><div class='ctx'> 		if (IS_ERR(eb)) {</div><div class='ctx'> 			free_pref(ref);</div><div class='ctx'> 			return PTR_ERR(eb);</div><div class='del'>-		} else if (!extent_buffer_uptodate(eb)) {</div><div class='add'>+		}</div><div class='add'>+		if (unlikely(!extent_buffer_uptodate(eb))) {</div><div class='ctx'> 			free_pref(ref);</div><div class='ctx'> 			free_extent_buffer(eb);</div><div class='ctx'> 			return -EIO;</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='ctx'> 		if (lock)</div><div class='ctx'> 			btrfs_tree_read_lock(eb);</div><div class='ctx'> 		if (btrfs_header_level(eb) == 0)</div><div class='hunk'>@@ -818,16 +888,11 @@ static int add_delayed_refs(const struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			    struct preftrees *preftrees, struct share_check *sc)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_delayed_ref_node *node;</div><div class='del'>-	struct btrfs_delayed_extent_op *extent_op = head-&gt;extent_op;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='del'>-	struct btrfs_key tmp_op_key;</div><div class='ctx'> 	struct rb_node *n;</div><div class='ctx'> 	int count;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	if (extent_op &amp;&amp; extent_op-&gt;update_key)</div><div class='del'>-		btrfs_disk_key_to_cpu(&amp;tmp_op_key, &amp;extent_op-&gt;key);</div><div class='del'>-</div><div class='ctx'> 	spin_lock(&amp;head-&gt;lock);</div><div class='ctx'> 	for (n = rb_first_cached(&amp;head-&gt;ref_tree); n; n = rb_next(n)) {</div><div class='ctx'> 		node = rb_entry(n, struct btrfs_delayed_ref_node,</div><div class='hunk'>@@ -852,56 +917,65 @@ static int add_delayed_refs(const struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		switch (node-&gt;type) {</div><div class='ctx'> 		case BTRFS_TREE_BLOCK_REF_KEY: {</div><div class='ctx'> 			/* NORMAL INDIRECT METADATA backref */</div><div class='del'>-			struct btrfs_delayed_tree_ref *ref;</div><div class='add'>+			struct btrfs_key *key_ptr = NULL;</div><div class='add'>+			/* The owner of a tree block ref is the level. */</div><div class='add'>+			int level = btrfs_delayed_ref_owner(node);</div><div class='ctx'> </div><div class='del'>-			ref = btrfs_delayed_node_to_tree_ref(node);</div><div class='del'>-			ret = add_indirect_ref(fs_info, preftrees, ref-&gt;root,</div><div class='del'>-					       &amp;tmp_op_key, ref-&gt;level + 1,</div><div class='del'>-					       node-&gt;bytenr, count, sc,</div><div class='del'>-					       GFP_ATOMIC);</div><div class='add'>+			if (head-&gt;extent_op &amp;&amp; head-&gt;extent_op-&gt;update_key) {</div><div class='add'>+				btrfs_disk_key_to_cpu(&amp;key, &amp;head-&gt;extent_op-&gt;key);</div><div class='add'>+				key_ptr = &amp;key;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			ret = add_indirect_ref(fs_info, preftrees, node-&gt;ref_root,</div><div class='add'>+					       key_ptr, level + 1, node-&gt;bytenr,</div><div class='add'>+					       count, sc, GFP_ATOMIC);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 		case BTRFS_SHARED_BLOCK_REF_KEY: {</div><div class='del'>-			/* SHARED DIRECT METADATA backref */</div><div class='del'>-			struct btrfs_delayed_tree_ref *ref;</div><div class='del'>-</div><div class='del'>-			ref = btrfs_delayed_node_to_tree_ref(node);</div><div class='add'>+			/*</div><div class='add'>+			 * SHARED DIRECT METADATA backref</div><div class='add'>+			 *</div><div class='add'>+			 * The owner of a tree block ref is the level.</div><div class='add'>+			 */</div><div class='add'>+			int level = btrfs_delayed_ref_owner(node);</div><div class='ctx'> </div><div class='del'>-			ret = add_direct_ref(fs_info, preftrees, ref-&gt;level + 1,</div><div class='del'>-					     ref-&gt;parent, node-&gt;bytenr, count,</div><div class='add'>+			ret = add_direct_ref(fs_info, preftrees, level + 1,</div><div class='add'>+					     node-&gt;parent, node-&gt;bytenr, count,</div><div class='ctx'> 					     sc, GFP_ATOMIC);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 		case BTRFS_EXTENT_DATA_REF_KEY: {</div><div class='ctx'> 			/* NORMAL INDIRECT DATA backref */</div><div class='del'>-			struct btrfs_delayed_data_ref *ref;</div><div class='del'>-			ref = btrfs_delayed_node_to_data_ref(node);</div><div class='del'>-</div><div class='del'>-			key.objectid = ref-&gt;objectid;</div><div class='add'>+			key.objectid = btrfs_delayed_ref_owner(node);</div><div class='ctx'> 			key.type = BTRFS_EXTENT_DATA_KEY;</div><div class='del'>-			key.offset = ref-&gt;offset;</div><div class='add'>+			key.offset = btrfs_delayed_ref_offset(node);</div><div class='ctx'> </div><div class='ctx'> 			/*</div><div class='del'>-			 * Found a inum that doesn't match our known inum, we</div><div class='del'>-			 * know it's shared.</div><div class='add'>+			 * If we have a share check context and a reference for</div><div class='add'>+			 * another inode, we can't exit immediately. This is</div><div class='add'>+			 * because even if this is a BTRFS_ADD_DELAYED_REF</div><div class='add'>+			 * reference we may find next a BTRFS_DROP_DELAYED_REF</div><div class='add'>+			 * which cancels out this ADD reference.</div><div class='add'>+			 *</div><div class='add'>+			 * If this is a DROP reference and there was no previous</div><div class='add'>+			 * ADD reference, then we need to signal that when we</div><div class='add'>+			 * process references from the extent tree (through</div><div class='add'>+			 * add_inline_refs() and add_keyed_refs()), we should</div><div class='add'>+			 * not exit early if we find a reference for another</div><div class='add'>+			 * inode, because one of the delayed DROP references</div><div class='add'>+			 * may cancel that reference in the extent tree.</div><div class='ctx'> 			 */</div><div class='del'>-			if (sc &amp;&amp; sc-&gt;inum &amp;&amp; ref-&gt;objectid != sc-&gt;inum) {</div><div class='del'>-				ret = BACKREF_FOUND_SHARED;</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='add'>+			if (sc &amp;&amp; count &lt; 0)</div><div class='add'>+				sc-&gt;have_delayed_delete_refs = true;</div><div class='ctx'> </div><div class='del'>-			ret = add_indirect_ref(fs_info, preftrees, ref-&gt;root,</div><div class='add'>+			ret = add_indirect_ref(fs_info, preftrees, node-&gt;ref_root,</div><div class='ctx'> 					       &amp;key, 0, node-&gt;bytenr, count, sc,</div><div class='ctx'> 					       GFP_ATOMIC);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 		case BTRFS_SHARED_DATA_REF_KEY: {</div><div class='ctx'> 			/* SHARED DIRECT FULL backref */</div><div class='del'>-			struct btrfs_delayed_data_ref *ref;</div><div class='del'>-</div><div class='del'>-			ref = btrfs_delayed_node_to_data_ref(node);</div><div class='del'>-</div><div class='del'>-			ret = add_direct_ref(fs_info, preftrees, 0, ref-&gt;parent,</div><div class='add'>+			ret = add_direct_ref(fs_info, preftrees, 0, node-&gt;parent,</div><div class='ctx'> 					     node-&gt;bytenr, count, sc,</div><div class='ctx'> 					     GFP_ATOMIC);</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -918,7 +992,7 @@ static int add_delayed_refs(const struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		ret = extent_is_shared(sc);</div><div class='del'>-out:</div><div class='add'>+</div><div class='ctx'> 	spin_unlock(&amp;head-&gt;lock);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -928,8 +1002,8 @@ out:</div><div class='ctx'>  *</div><div class='ctx'>  * Returns 0 on success, &lt;0 on error, or BACKREF_FOUND_SHARED.</div><div class='ctx'>  */</div><div class='del'>-static int add_inline_refs(const struct btrfs_fs_info *fs_info,</div><div class='del'>-			   struct btrfs_path *path, u64 bytenr,</div><div class='add'>+static int add_inline_refs(struct btrfs_backref_walk_ctx *ctx,</div><div class='add'>+			   struct btrfs_path *path,</div><div class='ctx'> 			   int *info_level, struct preftrees *preftrees,</div><div class='ctx'> 			   struct share_check *sc)</div><div class='ctx'> {</div><div class='hunk'>@@ -950,10 +1024,15 @@ static int add_inline_refs(const struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	slot = path-&gt;slots[0];</div><div class='ctx'> </div><div class='del'>-	item_size = btrfs_item_size_nr(leaf, slot);</div><div class='del'>-	BUG_ON(item_size &lt; sizeof(*ei));</div><div class='del'>-</div><div class='add'>+	item_size = btrfs_item_size(leaf, slot);</div><div class='ctx'> 	ei = btrfs_item_ptr(leaf, slot, struct btrfs_extent_item);</div><div class='add'>+</div><div class='add'>+	if (ctx-&gt;check_extent_item) {</div><div class='add'>+		ret = ctx-&gt;check_extent_item(ctx-&gt;bytenr, ei, leaf, ctx-&gt;user_ctx);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	flags = btrfs_extent_flags(leaf, ei);</div><div class='ctx'> 	btrfs_item_key_to_cpu(leaf, &amp;found_key, slot);</div><div class='ctx'> </div><div class='hunk'>@@ -982,16 +1061,16 @@ static int add_inline_refs(const struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		iref = (struct btrfs_extent_inline_ref *)ptr;</div><div class='ctx'> 		type = btrfs_get_extent_inline_ref_type(leaf, iref,</div><div class='ctx'> 							BTRFS_REF_TYPE_ANY);</div><div class='del'>-		if (type == BTRFS_REF_TYPE_INVALID)</div><div class='add'>+		if (unlikely(type == BTRFS_REF_TYPE_INVALID))</div><div class='ctx'> 			return -EUCLEAN;</div><div class='ctx'> </div><div class='ctx'> 		offset = btrfs_extent_inline_ref_offset(leaf, iref);</div><div class='ctx'> </div><div class='ctx'> 		switch (type) {</div><div class='ctx'> 		case BTRFS_SHARED_BLOCK_REF_KEY:</div><div class='del'>-			ret = add_direct_ref(fs_info, preftrees,</div><div class='add'>+			ret = add_direct_ref(ctx-&gt;fs_info, preftrees,</div><div class='ctx'> 					     *info_level + 1, offset,</div><div class='del'>-					     bytenr, 1, NULL, GFP_NOFS);</div><div class='add'>+					     ctx-&gt;bytenr, 1, NULL, GFP_NOFS);</div><div class='ctx'> 			break;</div><div class='ctx'> 		case BTRFS_SHARED_DATA_REF_KEY: {</div><div class='ctx'> 			struct btrfs_shared_data_ref *sdref;</div><div class='hunk'>@@ -1000,14 +1079,14 @@ static int add_inline_refs(const struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			sdref = (struct btrfs_shared_data_ref *)(iref + 1);</div><div class='ctx'> 			count = btrfs_shared_data_ref_count(leaf, sdref);</div><div class='ctx'> </div><div class='del'>-			ret = add_direct_ref(fs_info, preftrees, 0, offset,</div><div class='del'>-					     bytenr, count, sc, GFP_NOFS);</div><div class='add'>+			ret = add_direct_ref(ctx-&gt;fs_info, preftrees, 0, offset,</div><div class='add'>+					     ctx-&gt;bytenr, count, sc, GFP_NOFS);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 		case BTRFS_TREE_BLOCK_REF_KEY:</div><div class='del'>-			ret = add_indirect_ref(fs_info, preftrees, offset,</div><div class='add'>+			ret = add_indirect_ref(ctx-&gt;fs_info, preftrees, offset,</div><div class='ctx'> 					       NULL, *info_level + 1,</div><div class='del'>-					       bytenr, 1, NULL, GFP_NOFS);</div><div class='add'>+					       ctx-&gt;bytenr, 1, NULL, GFP_NOFS);</div><div class='ctx'> 			break;</div><div class='ctx'> 		case BTRFS_EXTENT_DATA_REF_KEY: {</div><div class='ctx'> 			struct btrfs_extent_data_ref *dref;</div><div class='hunk'>@@ -1021,18 +1100,25 @@ static int add_inline_refs(const struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			key.type = BTRFS_EXTENT_DATA_KEY;</div><div class='ctx'> 			key.offset = btrfs_extent_data_ref_offset(leaf, dref);</div><div class='ctx'> </div><div class='del'>-			if (sc &amp;&amp; sc-&gt;inum &amp;&amp; key.objectid != sc-&gt;inum) {</div><div class='add'>+			if (sc &amp;&amp; key.objectid != sc-&gt;inum &amp;&amp;</div><div class='add'>+			    !sc-&gt;have_delayed_delete_refs) {</div><div class='ctx'> 				ret = BACKREF_FOUND_SHARED;</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			root = btrfs_extent_data_ref_root(leaf, dref);</div><div class='ctx'> </div><div class='del'>-			ret = add_indirect_ref(fs_info, preftrees, root,</div><div class='del'>-					       &amp;key, 0, bytenr, count,</div><div class='del'>-					       sc, GFP_NOFS);</div><div class='add'>+			if (!ctx-&gt;skip_data_ref ||</div><div class='add'>+			    !ctx-&gt;skip_data_ref(root, key.objectid, key.offset,</div><div class='add'>+						ctx-&gt;user_ctx))</div><div class='add'>+				ret = add_indirect_ref(ctx-&gt;fs_info, preftrees,</div><div class='add'>+						       root, &amp;key, 0, ctx-&gt;bytenr,</div><div class='add'>+						       count, sc, GFP_NOFS);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='add'>+		case BTRFS_EXTENT_OWNER_REF_KEY:</div><div class='add'>+			ASSERT(btrfs_fs_incompat(ctx-&gt;fs_info, SIMPLE_QUOTA));</div><div class='add'>+			break;</div><div class='ctx'> 		default:</div><div class='ctx'> 			WARN_ON(1);</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1049,12 +1135,13 @@ static int add_inline_refs(const struct btrfs_fs_info *fs_info,</div><div class='ctx'>  *</div><div class='ctx'>  * Returns 0 on success, &lt;0 on error, or BACKREF_FOUND_SHARED.</div><div class='ctx'>  */</div><div class='del'>-static int add_keyed_refs(struct btrfs_fs_info *fs_info,</div><div class='del'>-			  struct btrfs_path *path, u64 bytenr,</div><div class='add'>+static int add_keyed_refs(struct btrfs_backref_walk_ctx *ctx,</div><div class='add'>+			  struct btrfs_root *extent_root,</div><div class='add'>+			  struct btrfs_path *path,</div><div class='ctx'> 			  int info_level, struct preftrees *preftrees,</div><div class='ctx'> 			  struct share_check *sc)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *extent_root = fs_info-&gt;extent_root;</div><div class='add'>+	struct btrfs_fs_info *fs_info = extent_root-&gt;fs_info;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int slot;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='hunk'>@@ -1073,7 +1160,7 @@ static int add_keyed_refs(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		leaf = path-&gt;nodes[0];</div><div class='ctx'> 		btrfs_item_key_to_cpu(leaf, &amp;key, slot);</div><div class='ctx'> </div><div class='del'>-		if (key.objectid != bytenr)</div><div class='add'>+		if (key.objectid != ctx-&gt;bytenr)</div><div class='ctx'> 			break;</div><div class='ctx'> 		if (key.type &lt; BTRFS_TREE_BLOCK_REF_KEY)</div><div class='ctx'> 			continue;</div><div class='hunk'>@@ -1085,7 +1172,7 @@ static int add_keyed_refs(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			/* SHARED DIRECT METADATA backref */</div><div class='ctx'> 			ret = add_direct_ref(fs_info, preftrees,</div><div class='ctx'> 					     info_level + 1, key.offset,</div><div class='del'>-					     bytenr, 1, NULL, GFP_NOFS);</div><div class='add'>+					     ctx-&gt;bytenr, 1, NULL, GFP_NOFS);</div><div class='ctx'> 			break;</div><div class='ctx'> 		case BTRFS_SHARED_DATA_REF_KEY: {</div><div class='ctx'> 			/* SHARED DIRECT FULL backref */</div><div class='hunk'>@@ -1096,14 +1183,14 @@ static int add_keyed_refs(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 					      struct btrfs_shared_data_ref);</div><div class='ctx'> 			count = btrfs_shared_data_ref_count(leaf, sdref);</div><div class='ctx'> 			ret = add_direct_ref(fs_info, preftrees, 0,</div><div class='del'>-					     key.offset, bytenr, count,</div><div class='add'>+					     key.offset, ctx-&gt;bytenr, count,</div><div class='ctx'> 					     sc, GFP_NOFS);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 		case BTRFS_TREE_BLOCK_REF_KEY:</div><div class='ctx'> 			/* NORMAL INDIRECT METADATA backref */</div><div class='ctx'> 			ret = add_indirect_ref(fs_info, preftrees, key.offset,</div><div class='del'>-					       NULL, info_level + 1, bytenr,</div><div class='add'>+					       NULL, info_level + 1, ctx-&gt;bytenr,</div><div class='ctx'> 					       1, NULL, GFP_NOFS);</div><div class='ctx'> 			break;</div><div class='ctx'> 		case BTRFS_EXTENT_DATA_REF_KEY: {</div><div class='hunk'>@@ -1120,15 +1207,20 @@ static int add_keyed_refs(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			key.type = BTRFS_EXTENT_DATA_KEY;</div><div class='ctx'> 			key.offset = btrfs_extent_data_ref_offset(leaf, dref);</div><div class='ctx'> </div><div class='del'>-			if (sc &amp;&amp; sc-&gt;inum &amp;&amp; key.objectid != sc-&gt;inum) {</div><div class='add'>+			if (sc &amp;&amp; key.objectid != sc-&gt;inum &amp;&amp;</div><div class='add'>+			    !sc-&gt;have_delayed_delete_refs) {</div><div class='ctx'> 				ret = BACKREF_FOUND_SHARED;</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			root = btrfs_extent_data_ref_root(leaf, dref);</div><div class='del'>-			ret = add_indirect_ref(fs_info, preftrees, root,</div><div class='del'>-					       &amp;key, 0, bytenr, count,</div><div class='del'>-					       sc, GFP_NOFS);</div><div class='add'>+</div><div class='add'>+			if (!ctx-&gt;skip_data_ref ||</div><div class='add'>+			    !ctx-&gt;skip_data_ref(root, key.objectid, key.offset,</div><div class='add'>+						ctx-&gt;user_ctx))</div><div class='add'>+				ret = add_indirect_ref(fs_info, preftrees, root,</div><div class='add'>+						       &amp;key, 0, ctx-&gt;bytenr,</div><div class='add'>+						       count, sc, GFP_NOFS);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 		default:</div><div class='hunk'>@@ -1143,33 +1235,149 @@ static int add_keyed_refs(struct btrfs_fs_info *fs_info,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * The caller has joined a transaction or is holding a read lock on the</div><div class='add'>+ * fs_info-&gt;commit_root_sem semaphore, so no need to worry about the root's last</div><div class='add'>+ * snapshot field changing while updating or checking the cache.</div><div class='add'>+ */</div><div class='add'>+static bool lookup_backref_shared_cache(struct btrfs_backref_share_check_ctx *ctx,</div><div class='add'>+					struct btrfs_root *root,</div><div class='add'>+					u64 bytenr, int level, bool *is_shared)</div><div class='add'>+{</div><div class='add'>+	const struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+	struct btrfs_backref_shared_cache_entry *entry;</div><div class='add'>+</div><div class='add'>+	if (!current-&gt;journal_info)</div><div class='add'>+		lockdep_assert_held(&amp;fs_info-&gt;commit_root_sem);</div><div class='add'>+</div><div class='add'>+	if (!ctx-&gt;use_path_cache)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	if (WARN_ON_ONCE(level &gt;= BTRFS_MAX_LEVEL))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Level -1 is used for the data extent, which is not reliable to cache</div><div class='add'>+	 * because its reference count can increase or decrease without us</div><div class='add'>+	 * realizing. We cache results only for extent buffers that lead from</div><div class='add'>+	 * the root node down to the leaf with the file extent item.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(level &gt;= 0);</div><div class='add'>+</div><div class='add'>+	entry = &amp;ctx-&gt;path_cache_entries[level];</div><div class='add'>+</div><div class='add'>+	/* Unused cache entry or being used for some other extent buffer. */</div><div class='add'>+	if (entry-&gt;bytenr != bytenr)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We cached a false result, but the last snapshot generation of the</div><div class='add'>+	 * root changed, so we now have a snapshot. Don't trust the result.</div><div class='add'>+	 */</div><div class='add'>+	if (!entry-&gt;is_shared &amp;&amp;</div><div class='add'>+	    entry-&gt;gen != btrfs_root_last_snapshot(&amp;root-&gt;root_item))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If we cached a true result and the last generation used for dropping</div><div class='add'>+	 * a root changed, we can not trust the result, because the dropped root</div><div class='add'>+	 * could be a snapshot sharing this extent buffer.</div><div class='add'>+	 */</div><div class='add'>+	if (entry-&gt;is_shared &amp;&amp;</div><div class='add'>+	    entry-&gt;gen != btrfs_get_last_root_drop_gen(fs_info))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	*is_shared = entry-&gt;is_shared;</div><div class='add'>+	/*</div><div class='add'>+	 * If the node at this level is shared, than all nodes below are also</div><div class='add'>+	 * shared. Currently some of the nodes below may be marked as not shared</div><div class='add'>+	 * because we have just switched from one leaf to another, and switched</div><div class='add'>+	 * also other nodes above the leaf and below the current level, so mark</div><div class='add'>+	 * them as shared.</div><div class='add'>+	 */</div><div class='add'>+	if (*is_shared) {</div><div class='add'>+		for (int i = 0; i &lt; level; i++) {</div><div class='add'>+			ctx-&gt;path_cache_entries[i].is_shared = true;</div><div class='add'>+			ctx-&gt;path_cache_entries[i].gen = entry-&gt;gen;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * The caller has joined a transaction or is holding a read lock on the</div><div class='add'>+ * fs_info-&gt;commit_root_sem semaphore, so no need to worry about the root's last</div><div class='add'>+ * snapshot field changing while updating or checking the cache.</div><div class='add'>+ */</div><div class='add'>+static void store_backref_shared_cache(struct btrfs_backref_share_check_ctx *ctx,</div><div class='add'>+				       struct btrfs_root *root,</div><div class='add'>+				       u64 bytenr, int level, bool is_shared)</div><div class='add'>+{</div><div class='add'>+	const struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+	struct btrfs_backref_shared_cache_entry *entry;</div><div class='add'>+	u64 gen;</div><div class='add'>+</div><div class='add'>+	if (!current-&gt;journal_info)</div><div class='add'>+		lockdep_assert_held(&amp;fs_info-&gt;commit_root_sem);</div><div class='add'>+</div><div class='add'>+	if (!ctx-&gt;use_path_cache)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (WARN_ON_ONCE(level &gt;= BTRFS_MAX_LEVEL))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Level -1 is used for the data extent, which is not reliable to cache</div><div class='add'>+	 * because its reference count can increase or decrease without us</div><div class='add'>+	 * realizing. We cache results only for extent buffers that lead from</div><div class='add'>+	 * the root node down to the leaf with the file extent item.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(level &gt;= 0);</div><div class='add'>+</div><div class='add'>+	if (is_shared)</div><div class='add'>+		gen = btrfs_get_last_root_drop_gen(fs_info);</div><div class='add'>+	else</div><div class='add'>+		gen = btrfs_root_last_snapshot(&amp;root-&gt;root_item);</div><div class='add'>+</div><div class='add'>+	entry = &amp;ctx-&gt;path_cache_entries[level];</div><div class='add'>+	entry-&gt;bytenr = bytenr;</div><div class='add'>+	entry-&gt;is_shared = is_shared;</div><div class='add'>+	entry-&gt;gen = gen;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If we found an extent buffer is shared, set the cache result for all</div><div class='add'>+	 * extent buffers below it to true. As nodes in the path are COWed,</div><div class='add'>+	 * their sharedness is moved to their children, and if a leaf is COWed,</div><div class='add'>+	 * then the sharedness of a data extent becomes direct, the refcount of</div><div class='add'>+	 * data extent is increased in the extent item at the extent tree.</div><div class='add'>+	 */</div><div class='add'>+	if (is_shared) {</div><div class='add'>+		for (int i = 0; i &lt; level; i++) {</div><div class='add'>+			entry = &amp;ctx-&gt;path_cache_entries[i];</div><div class='add'>+			entry-&gt;is_shared = is_shared;</div><div class='add'>+			entry-&gt;gen = gen;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * this adds all existing backrefs (inline backrefs, backrefs and delayed</div><div class='ctx'>  * refs) for the given bytenr to the refs list, merges duplicates and resolves</div><div class='ctx'>  * indirect refs to their parent bytenr.</div><div class='ctx'>  * When roots are found, they're added to the roots list</div><div class='ctx'>  *</div><div class='del'>- * If time_seq is set to BTRFS_SEQ_LAST, it will not search delayed_refs, and</div><div class='del'>- * behave much like trans == NULL case, the difference only lies in it will not</div><div class='del'>- * commit root.</div><div class='del'>- * The special case is for qgroup to search roots in commit_transaction().</div><div class='del'>- *</div><div class='del'>- * @sc - if !NULL, then immediately return BACKREF_FOUND_SHARED when a</div><div class='del'>- * shared extent is detected.</div><div class='add'>+ * @ctx:     Backref walking context object, must be not NULL.</div><div class='add'>+ * @sc:      If !NULL, then immediately return BACKREF_FOUND_SHARED when a</div><div class='add'>+ *           shared extent is detected.</div><div class='ctx'>  *</div><div class='ctx'>  * Otherwise this returns 0 for success and &lt;0 for an error.</div><div class='ctx'>  *</div><div class='del'>- * If ignore_offset is set to false, only extent refs whose offsets match</div><div class='del'>- * extent_item_pos are returned.  If true, every extent ref is returned</div><div class='del'>- * and extent_item_pos is ignored.</div><div class='del'>- *</div><div class='ctx'>  * FIXME some caching might speed things up</div><div class='ctx'>  */</div><div class='del'>-static int find_parent_nodes(struct btrfs_trans_handle *trans,</div><div class='del'>-			     struct btrfs_fs_info *fs_info, u64 bytenr,</div><div class='del'>-			     u64 time_seq, struct ulist *refs,</div><div class='del'>-			     struct ulist *roots, const u64 *extent_item_pos,</div><div class='del'>-			     struct share_check *sc, bool ignore_offset)</div><div class='add'>+static int find_parent_nodes(struct btrfs_backref_walk_ctx *ctx,</div><div class='add'>+			     struct share_check *sc)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_root *root = btrfs_extent_root(ctx-&gt;fs_info, ctx-&gt;bytenr);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_path *path;</div><div class='ctx'> 	struct btrfs_delayed_ref_root *delayed_refs = NULL;</div><div class='hunk'>@@ -1185,50 +1393,55 @@ static int find_parent_nodes(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		.indirect_missing_keys = PREFTREE_INIT</div><div class='ctx'> 	};</div><div class='ctx'> </div><div class='del'>-	key.objectid = bytenr;</div><div class='del'>-	key.offset = (u64)-1;</div><div class='del'>-	if (btrfs_fs_incompat(fs_info, SKINNY_METADATA))</div><div class='add'>+	/* Roots ulist is not needed when using a sharedness check context. */</div><div class='add'>+	if (sc)</div><div class='add'>+		ASSERT(ctx-&gt;roots == NULL);</div><div class='add'>+</div><div class='add'>+	key.objectid = ctx-&gt;bytenr;</div><div class='add'>+	if (btrfs_fs_incompat(ctx-&gt;fs_info, SKINNY_METADATA))</div><div class='ctx'> 		key.type = BTRFS_METADATA_ITEM_KEY;</div><div class='ctx'> 	else</div><div class='ctx'> 		key.type = BTRFS_EXTENT_ITEM_KEY;</div><div class='add'>+	key.offset = (u64)-1;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='del'>-	if (!trans) {</div><div class='del'>-		path-&gt;search_commit_root = 1;</div><div class='del'>-		path-&gt;skip_locking = 1;</div><div class='add'>+	if (!ctx-&gt;trans) {</div><div class='add'>+		path-&gt;search_commit_root = true;</div><div class='add'>+		path-&gt;skip_locking = true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (time_seq == BTRFS_SEQ_LAST)</div><div class='del'>-		path-&gt;skip_locking = 1;</div><div class='add'>+	if (ctx-&gt;time_seq == BTRFS_SEQ_LAST)</div><div class='add'>+		path-&gt;skip_locking = true;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * grab both a lock on the path and a lock on the delayed ref head.</div><div class='del'>-	 * We need both to get a consistent picture of how the refs look</div><div class='del'>-	 * at a specified point in time</div><div class='del'>-	 */</div><div class='ctx'> again:</div><div class='ctx'> 	head = NULL;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_search_slot(NULL, fs_info-&gt;extent_root, &amp;key, path, 0, 0);</div><div class='add'>+	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='del'>-	BUG_ON(ret == 0);</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_BTRFS_FS_RUN_SANITY_TESTS</div><div class='del'>-	if (trans &amp;&amp; likely(trans-&gt;type != __TRANS_DUMMY) &amp;&amp;</div><div class='del'>-	    time_seq != BTRFS_SEQ_LAST) {</div><div class='del'>-#else</div><div class='del'>-	if (trans &amp;&amp; time_seq != BTRFS_SEQ_LAST) {</div><div class='del'>-#endif</div><div class='add'>+	if (unlikely(ret == 0)) {</div><div class='add'>+		/*</div><div class='add'>+		 * Key with offset -1 found, there would have to exist an extent</div><div class='add'>+		 * item with such offset, but this is out of the valid range.</div><div class='add'>+		 */</div><div class='add'>+		ret = -EUCLEAN;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (ctx-&gt;trans &amp;&amp; likely(ctx-&gt;trans-&gt;type != __TRANS_DUMMY) &amp;&amp;</div><div class='add'>+	    ctx-&gt;time_seq != BTRFS_SEQ_LAST) {</div><div class='ctx'> 		/*</div><div class='del'>-		 * look if there are updates for this ref queued and lock the</div><div class='del'>-		 * head</div><div class='add'>+		 * We have a specific time_seq we care about and trans which</div><div class='add'>+		 * means we have the path lock, we need to grab the ref head and</div><div class='add'>+		 * lock it so we have a consistent view of the refs at the given</div><div class='add'>+		 * time.</div><div class='ctx'> 		 */</div><div class='del'>-		delayed_refs = &amp;trans-&gt;transaction-&gt;delayed_refs;</div><div class='add'>+		delayed_refs = &amp;ctx-&gt;trans-&gt;transaction-&gt;delayed_refs;</div><div class='ctx'> 		spin_lock(&amp;delayed_refs-&gt;lock);</div><div class='del'>-		head = btrfs_find_delayed_ref_head(delayed_refs, bytenr);</div><div class='add'>+		head = btrfs_find_delayed_ref_head(ctx-&gt;fs_info, delayed_refs,</div><div class='add'>+						   ctx-&gt;bytenr);</div><div class='ctx'> 		if (head) {</div><div class='ctx'> 			if (!mutex_trylock(&amp;head-&gt;mutex)) {</div><div class='ctx'> 				refcount_inc(&amp;head-&gt;refs);</div><div class='hunk'>@@ -1246,7 +1459,7 @@ again:</div><div class='ctx'> 				goto again;</div><div class='ctx'> 			}</div><div class='ctx'> 			spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='del'>-			ret = add_delayed_refs(fs_info, head, time_seq,</div><div class='add'>+			ret = add_delayed_refs(ctx-&gt;fs_info, head, ctx-&gt;time_seq,</div><div class='ctx'> 					       &amp;preftrees, sc);</div><div class='ctx'> 			mutex_unlock(&amp;head-&gt;mutex);</div><div class='ctx'> 			if (ret)</div><div class='hunk'>@@ -1264,30 +1477,96 @@ again:</div><div class='ctx'> 		leaf = path-&gt;nodes[0];</div><div class='ctx'> 		slot = path-&gt;slots[0];</div><div class='ctx'> 		btrfs_item_key_to_cpu(leaf, &amp;key, slot);</div><div class='del'>-		if (key.objectid == bytenr &amp;&amp;</div><div class='add'>+		if (key.objectid == ctx-&gt;bytenr &amp;&amp;</div><div class='ctx'> 		    (key.type == BTRFS_EXTENT_ITEM_KEY ||</div><div class='ctx'> 		     key.type == BTRFS_METADATA_ITEM_KEY)) {</div><div class='del'>-			ret = add_inline_refs(fs_info, path, bytenr,</div><div class='del'>-					      &amp;info_level, &amp;preftrees, sc);</div><div class='add'>+			ret = add_inline_refs(ctx, path, &amp;info_level,</div><div class='add'>+					      &amp;preftrees, sc);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				goto out;</div><div class='del'>-			ret = add_keyed_refs(fs_info, path, bytenr, info_level,</div><div class='add'>+			ret = add_keyed_refs(ctx, root, path, info_level,</div><div class='ctx'> 					     &amp;preftrees, sc);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * If we have a share context and we reached here, it means the extent</div><div class='add'>+	 * is not directly shared (no multiple reference items for it),</div><div class='add'>+	 * otherwise we would have exited earlier with a return value of</div><div class='add'>+	 * BACKREF_FOUND_SHARED after processing delayed references or while</div><div class='add'>+	 * processing inline or keyed references from the extent tree.</div><div class='add'>+	 * The extent may however be indirectly shared through shared subtrees</div><div class='add'>+	 * as a result from creating snapshots, so we determine below what is</div><div class='add'>+	 * its parent node, in case we are dealing with a metadata extent, or</div><div class='add'>+	 * what's the leaf (or leaves), from a fs tree, that has a file extent</div><div class='add'>+	 * item pointing to it in case we are dealing with a data extent.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(extent_is_shared(sc) == 0);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If we are here for a data extent and we have a share_check structure</div><div class='add'>+	 * it means the data extent is not directly shared (does not have</div><div class='add'>+	 * multiple reference items), so we have to check if a path in the fs</div><div class='add'>+	 * tree (going from the root node down to the leaf that has the file</div><div class='add'>+	 * extent item pointing to the data extent) is shared, that is, if any</div><div class='add'>+	 * of the extent buffers in the path is referenced by other trees.</div><div class='add'>+	 */</div><div class='add'>+	if (sc &amp;&amp; ctx-&gt;bytenr == sc-&gt;data_bytenr) {</div><div class='add'>+		/*</div><div class='add'>+		 * If our data extent is from a generation more recent than the</div><div class='add'>+		 * last generation used to snapshot the root, then we know that</div><div class='add'>+		 * it can not be shared through subtrees, so we can skip</div><div class='add'>+		 * resolving indirect references, there's no point in</div><div class='add'>+		 * determining the extent buffers for the path from the fs tree</div><div class='add'>+		 * root node down to the leaf that has the file extent item that</div><div class='add'>+		 * points to the data extent.</div><div class='add'>+		 */</div><div class='add'>+		if (sc-&gt;data_extent_gen &gt;</div><div class='add'>+		    btrfs_root_last_snapshot(&amp;sc-&gt;root-&gt;root_item)) {</div><div class='add'>+			ret = BACKREF_FOUND_NOT_SHARED;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * If we are only determining if a data extent is shared or not</div><div class='add'>+		 * and the corresponding file extent item is located in the same</div><div class='add'>+		 * leaf as the previous file extent item, we can skip resolving</div><div class='add'>+		 * indirect references for a data extent, since the fs tree path</div><div class='add'>+		 * is the same (same leaf, so same path). We skip as long as the</div><div class='add'>+		 * cached result for the leaf is valid and only if there's only</div><div class='add'>+		 * one file extent item pointing to the data extent, because in</div><div class='add'>+		 * the case of multiple file extent items, they may be located</div><div class='add'>+		 * in different leaves and therefore we have multiple paths.</div><div class='add'>+		 */</div><div class='add'>+		if (sc-&gt;ctx-&gt;curr_leaf_bytenr == sc-&gt;ctx-&gt;prev_leaf_bytenr &amp;&amp;</div><div class='add'>+		    sc-&gt;self_ref_count == 1) {</div><div class='add'>+			bool cached;</div><div class='add'>+			bool is_shared;</div><div class='add'>+</div><div class='add'>+			cached = lookup_backref_shared_cache(sc-&gt;ctx, sc-&gt;root,</div><div class='add'>+						     sc-&gt;ctx-&gt;curr_leaf_bytenr,</div><div class='add'>+						     0, &amp;is_shared);</div><div class='add'>+			if (cached) {</div><div class='add'>+				if (is_shared)</div><div class='add'>+					ret = BACKREF_FOUND_SHARED;</div><div class='add'>+				else</div><div class='add'>+					ret = BACKREF_FOUND_NOT_SHARED;</div><div class='add'>+				goto out;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='del'>-	ret = add_missing_keys(fs_info, &amp;preftrees, path-&gt;skip_locking == 0);</div><div class='add'>+	ret = add_missing_keys(ctx-&gt;fs_info, &amp;preftrees, !path-&gt;skip_locking);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	WARN_ON(!RB_EMPTY_ROOT(&amp;preftrees.indirect_missing_keys.root.rb_root));</div><div class='ctx'> </div><div class='del'>-	ret = resolve_indirect_refs(fs_info, path, time_seq, &amp;preftrees,</div><div class='del'>-				    extent_item_pos, sc, ignore_offset);</div><div class='add'>+	ret = resolve_indirect_refs(ctx, path, &amp;preftrees, sc);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -1314,29 +1593,27 @@ again:</div><div class='ctx'> 		 * e.g. different offsets would not be merged,</div><div class='ctx'> 		 * and would retain their original ref-&gt;count &lt; 0.</div><div class='ctx'> 		 */</div><div class='del'>-		if (roots &amp;&amp; ref-&gt;count &amp;&amp; ref-&gt;root_id &amp;&amp; ref-&gt;parent == 0) {</div><div class='del'>-			if (sc &amp;&amp; sc-&gt;root_objectid &amp;&amp;</div><div class='del'>-			    ref-&gt;root_id != sc-&gt;root_objectid) {</div><div class='del'>-				ret = BACKREF_FOUND_SHARED;</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-</div><div class='add'>+		if (ctx-&gt;roots &amp;&amp; ref-&gt;count &amp;&amp; ref-&gt;root_id &amp;&amp; ref-&gt;parent == 0) {</div><div class='ctx'> 			/* no parent == root of tree */</div><div class='del'>-			ret = ulist_add(roots, ref-&gt;root_id, 0, GFP_NOFS);</div><div class='add'>+			ret = ulist_add(ctx-&gt;roots, ref-&gt;root_id, 0, GFP_NOFS);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='ctx'> 				goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (ref-&gt;count &amp;&amp; ref-&gt;parent) {</div><div class='del'>-			if (extent_item_pos &amp;&amp; !ref-&gt;inode_list &amp;&amp;</div><div class='add'>+			if (!ctx-&gt;skip_inode_ref_list &amp;&amp; !ref-&gt;inode_list &amp;&amp;</div><div class='ctx'> 			    ref-&gt;level == 0) {</div><div class='add'>+				struct btrfs_tree_parent_check check = { 0 };</div><div class='ctx'> 				struct extent_buffer *eb;</div><div class='ctx'> </div><div class='del'>-				eb = read_tree_block(fs_info, ref-&gt;parent, 0,</div><div class='del'>-						     0, ref-&gt;level, NULL);</div><div class='add'>+				check.level = ref-&gt;level;</div><div class='add'>+</div><div class='add'>+				eb = read_tree_block(ctx-&gt;fs_info, ref-&gt;parent,</div><div class='add'>+						     &amp;check);</div><div class='ctx'> 				if (IS_ERR(eb)) {</div><div class='ctx'> 					ret = PTR_ERR(eb);</div><div class='ctx'> 					goto out;</div><div class='del'>-				} else if (!extent_buffer_uptodate(eb)) {</div><div class='add'>+				}</div><div class='add'>+				if (unlikely(!extent_buffer_uptodate(eb))) {</div><div class='ctx'> 					free_extent_buffer(eb);</div><div class='ctx'> 					ret = -EIO;</div><div class='ctx'> 					goto out;</div><div class='hunk'>@@ -1344,31 +1621,53 @@ again:</div><div class='ctx'> </div><div class='ctx'> 				if (!path-&gt;skip_locking)</div><div class='ctx'> 					btrfs_tree_read_lock(eb);</div><div class='del'>-				ret = find_extent_in_eb(eb, bytenr,</div><div class='del'>-							*extent_item_pos, &amp;eie, ignore_offset);</div><div class='add'>+				ret = find_extent_in_eb(ctx, eb, &amp;eie);</div><div class='ctx'> 				if (!path-&gt;skip_locking)</div><div class='ctx'> 					btrfs_tree_read_unlock(eb);</div><div class='ctx'> 				free_extent_buffer(eb);</div><div class='del'>-				if (ret &lt; 0)</div><div class='add'>+				if (ret == BTRFS_ITERATE_EXTENT_INODES_STOP ||</div><div class='add'>+				    ret &lt; 0)</div><div class='ctx'> 					goto out;</div><div class='ctx'> 				ref-&gt;inode_list = eie;</div><div class='add'>+				/*</div><div class='add'>+				 * We transferred the list ownership to the ref,</div><div class='add'>+				 * so set to NULL to avoid a double free in case</div><div class='add'>+				 * an error happens after this.</div><div class='add'>+				 */</div><div class='add'>+				eie = NULL;</div><div class='ctx'> 			}</div><div class='del'>-			ret = ulist_add_merge_ptr(refs, ref-&gt;parent,</div><div class='add'>+			ret = ulist_add_merge_ptr(ctx-&gt;refs, ref-&gt;parent,</div><div class='ctx'> 						  ref-&gt;inode_list,</div><div class='ctx'> 						  (void **)&amp;eie, GFP_NOFS);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='ctx'> 				goto out;</div><div class='del'>-			if (!ret &amp;&amp; extent_item_pos) {</div><div class='add'>+			if (!ret &amp;&amp; !ctx-&gt;skip_inode_ref_list) {</div><div class='ctx'> 				/*</div><div class='del'>-				 * we've recorded that parent, so we must extend</div><div class='del'>-				 * its inode list here</div><div class='add'>+				 * We've recorded that parent, so we must extend</div><div class='add'>+				 * its inode list here.</div><div class='add'>+				 *</div><div class='add'>+				 * However if there was corruption we may not</div><div class='add'>+				 * have found an eie, return an error in this</div><div class='add'>+				 * case.</div><div class='ctx'> 				 */</div><div class='del'>-				BUG_ON(!eie);</div><div class='add'>+				ASSERT(eie);</div><div class='add'>+				if (unlikely(!eie)) {</div><div class='add'>+					ret = -EUCLEAN;</div><div class='add'>+					goto out;</div><div class='add'>+				}</div><div class='ctx'> 				while (eie-&gt;next)</div><div class='ctx'> 					eie = eie-&gt;next;</div><div class='ctx'> 				eie-&gt;next = ref-&gt;inode_list;</div><div class='ctx'> 			}</div><div class='ctx'> 			eie = NULL;</div><div class='add'>+			/*</div><div class='add'>+			 * We have transferred the inode list ownership from</div><div class='add'>+			 * this ref to the ref we added to the 'refs' ulist.</div><div class='add'>+			 * So set this ref's inode list to NULL to avoid</div><div class='add'>+			 * use-after-free when our caller uses it or double</div><div class='add'>+			 * frees in case an error happens before we return.</div><div class='add'>+			 */</div><div class='add'>+			ref-&gt;inode_list = NULL;</div><div class='ctx'> 		}</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1380,52 +1679,36 @@ out:</div><div class='ctx'> 	prelim_release(&amp;preftrees.indirect);</div><div class='ctx'> 	prelim_release(&amp;preftrees.indirect_missing_keys);</div><div class='ctx'> </div><div class='del'>-	if (ret &lt; 0)</div><div class='add'>+	if (ret == BTRFS_ITERATE_EXTENT_INODES_STOP || ret &lt; 0)</div><div class='ctx'> 		free_inode_elem_list(eie);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void free_leaf_list(struct ulist *blocks)</div><div class='del'>-{</div><div class='del'>-	struct ulist_node *node = NULL;</div><div class='del'>-	struct extent_inode_elem *eie;</div><div class='del'>-	struct ulist_iterator uiter;</div><div class='del'>-</div><div class='del'>-	ULIST_ITER_INIT(&amp;uiter);</div><div class='del'>-	while ((node = ulist_next(blocks, &amp;uiter))) {</div><div class='del'>-		if (!node-&gt;aux)</div><div class='del'>-			continue;</div><div class='del'>-		eie = unode_aux_to_inode_list(node);</div><div class='del'>-		free_inode_elem_list(eie);</div><div class='del'>-		node-&gt;aux = 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ulist_free(blocks);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='del'>- * Finds all leafs with a reference to the specified combination of bytenr and</div><div class='del'>- * offset. key_list_head will point to a list of corresponding keys (caller must</div><div class='del'>- * free each list element). The leafs will be stored in the leafs ulist, which</div><div class='del'>- * must be freed with ulist_free.</div><div class='add'>+ * Finds all leaves with a reference to the specified combination of</div><div class='add'>+ * @ctx-&gt;bytenr and @ctx-&gt;extent_item_pos. The bytenr of the found leaves are</div><div class='add'>+ * added to the ulist at @ctx-&gt;refs, and that ulist is allocated by this</div><div class='add'>+ * function. The caller should free the ulist with free_leaf_list() if</div><div class='add'>+ * @ctx-&gt;ignore_extent_item_pos is false, otherwise a simple ulist_free() is</div><div class='add'>+ * enough.</div><div class='ctx'>  *</div><div class='del'>- * returns 0 on success, &lt;0 on error</div><div class='add'>+ * Returns 0 on success and &lt; 0 on error. On error @ctx-&gt;refs is not allocated.</div><div class='ctx'>  */</div><div class='del'>-int btrfs_find_all_leafs(struct btrfs_trans_handle *trans,</div><div class='del'>-			 struct btrfs_fs_info *fs_info, u64 bytenr,</div><div class='del'>-			 u64 time_seq, struct ulist **leafs,</div><div class='del'>-			 const u64 *extent_item_pos, bool ignore_offset)</div><div class='add'>+int btrfs_find_all_leafs(struct btrfs_backref_walk_ctx *ctx)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	*leafs = ulist_alloc(GFP_NOFS);</div><div class='del'>-	if (!*leafs)</div><div class='add'>+	ASSERT(ctx-&gt;refs == NULL);</div><div class='add'>+</div><div class='add'>+	ctx-&gt;refs = ulist_alloc(GFP_NOFS);</div><div class='add'>+	if (!ctx-&gt;refs)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	ret = find_parent_nodes(trans, fs_info, bytenr, time_seq,</div><div class='del'>-				*leafs, NULL, extent_item_pos, NULL, ignore_offset);</div><div class='del'>-	if (ret &lt; 0 &amp;&amp; ret != -ENOENT) {</div><div class='del'>-		free_leaf_list(*leafs);</div><div class='add'>+	ret = find_parent_nodes(ctx, NULL);</div><div class='add'>+	if (ret == BTRFS_ITERATE_EXTENT_INODES_STOP ||</div><div class='add'>+	    (ret &lt; 0 &amp;&amp; ret != -ENOENT)) {</div><div class='add'>+		free_leaf_list(ctx-&gt;refs);</div><div class='add'>+		ctx-&gt;refs = NULL;</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1433,7 +1716,7 @@ int btrfs_find_all_leafs(struct btrfs_trans_handle *trans,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * walk all backrefs for a given extent to find all roots that reference this</div><div class='add'>+ * Walk all backrefs for a given extent to find all roots that reference this</div><div class='ctx'>  * extent. Walking a backref means finding all extents that reference this</div><div class='ctx'>  * extent and in turn walk the backrefs of those, too. Naturally this is a</div><div class='ctx'>  * recursive process, but here it is implemented in an iterative fashion: We</div><div class='hunk'>@@ -1441,76 +1724,115 @@ int btrfs_find_all_leafs(struct btrfs_trans_handle *trans,</div><div class='ctx'>  * list. In turn, we find all referencing extents for those, further appending</div><div class='ctx'>  * to the list. The way we iterate the list allows adding more elements after</div><div class='ctx'>  * the current while iterating. The process stops when we reach the end of the</div><div class='del'>- * list. Found roots are added to the roots list.</div><div class='add'>+ * list.</div><div class='ctx'>  *</div><div class='del'>- * returns 0 on success, &lt; 0 on error.</div><div class='add'>+ * Found roots are added to @ctx-&gt;roots, which is allocated by this function if</div><div class='add'>+ * it points to NULL, in which case the caller is responsible for freeing it</div><div class='add'>+ * after it's not needed anymore.</div><div class='add'>+ * This function requires @ctx-&gt;refs to be NULL, as it uses it for allocating a</div><div class='add'>+ * ulist to do temporary work, and frees it before returning.</div><div class='add'>+ *</div><div class='add'>+ * Returns 0 on success, &lt; 0 on error.</div><div class='ctx'>  */</div><div class='del'>-static int btrfs_find_all_roots_safe(struct btrfs_trans_handle *trans,</div><div class='del'>-				     struct btrfs_fs_info *fs_info, u64 bytenr,</div><div class='del'>-				     u64 time_seq, struct ulist **roots,</div><div class='del'>-				     bool ignore_offset)</div><div class='add'>+static int btrfs_find_all_roots_safe(struct btrfs_backref_walk_ctx *ctx)</div><div class='ctx'> {</div><div class='del'>-	struct ulist *tmp;</div><div class='del'>-	struct ulist_node *node = NULL;</div><div class='add'>+	const u64 orig_bytenr = ctx-&gt;bytenr;</div><div class='add'>+	const bool orig_skip_inode_ref_list = ctx-&gt;skip_inode_ref_list;</div><div class='add'>+	bool roots_ulist_allocated = false;</div><div class='ctx'> 	struct ulist_iterator uiter;</div><div class='del'>-	int ret;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	tmp = ulist_alloc(GFP_NOFS);</div><div class='del'>-	if (!tmp)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	*roots = ulist_alloc(GFP_NOFS);</div><div class='del'>-	if (!*roots) {</div><div class='del'>-		ulist_free(tmp);</div><div class='add'>+	ASSERT(ctx-&gt;refs == NULL);</div><div class='add'>+</div><div class='add'>+	ctx-&gt;refs = ulist_alloc(GFP_NOFS);</div><div class='add'>+	if (!ctx-&gt;refs)</div><div class='ctx'> 		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	if (!ctx-&gt;roots) {</div><div class='add'>+		ctx-&gt;roots = ulist_alloc(GFP_NOFS);</div><div class='add'>+		if (!ctx-&gt;roots) {</div><div class='add'>+			ulist_free(ctx-&gt;refs);</div><div class='add'>+			ctx-&gt;refs = NULL;</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+		}</div><div class='add'>+		roots_ulist_allocated = true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	ctx-&gt;skip_inode_ref_list = true;</div><div class='add'>+</div><div class='ctx'> 	ULIST_ITER_INIT(&amp;uiter);</div><div class='ctx'> 	while (1) {</div><div class='del'>-		ret = find_parent_nodes(trans, fs_info, bytenr, time_seq,</div><div class='del'>-					tmp, *roots, NULL, NULL, ignore_offset);</div><div class='add'>+		struct ulist_node *node;</div><div class='add'>+</div><div class='add'>+		ret = find_parent_nodes(ctx, NULL);</div><div class='ctx'> 		if (ret &lt; 0 &amp;&amp; ret != -ENOENT) {</div><div class='del'>-			ulist_free(tmp);</div><div class='del'>-			ulist_free(*roots);</div><div class='del'>-			*roots = NULL;</div><div class='del'>-			return ret;</div><div class='add'>+			if (roots_ulist_allocated) {</div><div class='add'>+				ulist_free(ctx-&gt;roots);</div><div class='add'>+				ctx-&gt;roots = NULL;</div><div class='add'>+			}</div><div class='add'>+			break;</div><div class='ctx'> 		}</div><div class='del'>-		node = ulist_next(tmp, &amp;uiter);</div><div class='add'>+		ret = 0;</div><div class='add'>+		node = ulist_next(ctx-&gt;refs, &amp;uiter);</div><div class='ctx'> 		if (!node)</div><div class='ctx'> 			break;</div><div class='del'>-		bytenr = node-&gt;val;</div><div class='add'>+		ctx-&gt;bytenr = node-&gt;val;</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ulist_free(tmp);</div><div class='del'>-	return 0;</div><div class='add'>+	ulist_free(ctx-&gt;refs);</div><div class='add'>+	ctx-&gt;refs = NULL;</div><div class='add'>+	ctx-&gt;bytenr = orig_bytenr;</div><div class='add'>+	ctx-&gt;skip_inode_ref_list = orig_skip_inode_ref_list;</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_find_all_roots(struct btrfs_trans_handle *trans,</div><div class='del'>-			 struct btrfs_fs_info *fs_info, u64 bytenr,</div><div class='del'>-			 u64 time_seq, struct ulist **roots,</div><div class='add'>+int btrfs_find_all_roots(struct btrfs_backref_walk_ctx *ctx,</div><div class='ctx'> 			 bool skip_commit_root_sem)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (!trans &amp;&amp; !skip_commit_root_sem)</div><div class='del'>-		down_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='del'>-	ret = btrfs_find_all_roots_safe(trans, fs_info, bytenr,</div><div class='del'>-					time_seq, roots, false);</div><div class='del'>-	if (!trans &amp;&amp; !skip_commit_root_sem)</div><div class='del'>-		up_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='add'>+	if (!ctx-&gt;trans &amp;&amp; !skip_commit_root_sem)</div><div class='add'>+		down_read(&amp;ctx-&gt;fs_info-&gt;commit_root_sem);</div><div class='add'>+	ret = btrfs_find_all_roots_safe(ctx);</div><div class='add'>+	if (!ctx-&gt;trans &amp;&amp; !skip_commit_root_sem)</div><div class='add'>+		up_read(&amp;ctx-&gt;fs_info-&gt;commit_root_sem);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * Check if an extent is shared or not</div><div class='add'>+struct btrfs_backref_share_check_ctx *btrfs_alloc_backref_share_check_ctx(void)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_backref_share_check_ctx *ctx;</div><div class='add'>+</div><div class='add'>+	ctx = kzalloc(sizeof(*ctx), GFP_KERNEL);</div><div class='add'>+	if (!ctx)</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	ulist_init(&amp;ctx-&gt;refs);</div><div class='add'>+</div><div class='add'>+	return ctx;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_free_backref_share_ctx(struct btrfs_backref_share_check_ctx *ctx)</div><div class='add'>+{</div><div class='add'>+	if (!ctx)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	ulist_release(&amp;ctx-&gt;refs);</div><div class='add'>+	kfree(ctx);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Check if a data extent is shared or not.</div><div class='ctx'>  *</div><div class='del'>- * @root:   root inode belongs to</div><div class='del'>- * @inum:   inode number of the inode whose extent we are checking</div><div class='del'>- * @bytenr: logical bytenr of the extent we are checking</div><div class='del'>- * @roots:  list of roots this extent is shared among</div><div class='del'>- * @tmp:    temporary list used for iteration</div><div class='add'>+ * @inode:       The inode whose extent we are checking.</div><div class='add'>+ * @bytenr:      Logical bytenr of the extent we are checking.</div><div class='add'>+ * @extent_gen:  Generation of the extent (file extent item) or 0 if it is</div><div class='add'>+ *               not known.</div><div class='add'>+ * @ctx:         A backref sharedness check context.</div><div class='ctx'>  *</div><div class='del'>- * btrfs_check_shared uses the backref walking code but will short</div><div class='add'>+ * btrfs_is_data_extent_shared uses the backref walking code but will short</div><div class='ctx'>  * circuit as soon as it finds a root or inode that doesn't match the</div><div class='ctx'>  * one passed in. This provides a significant performance benefit for</div><div class='ctx'>  * callers (such as fiemap) which want to know whether the extent is</div><div class='hunk'>@@ -1521,9 +1843,12 @@ int btrfs_find_all_roots(struct btrfs_trans_handle *trans,</div><div class='ctx'>  *</div><div class='ctx'>  * Return: 0 if extent is not shared, 1 if it is shared, &lt; 0 on error.</div><div class='ctx'>  */</div><div class='del'>-int btrfs_check_shared(struct btrfs_root *root, u64 inum, u64 bytenr,</div><div class='del'>-		struct ulist *roots, struct ulist *tmp)</div><div class='add'>+int btrfs_is_data_extent_shared(struct btrfs_inode *inode, u64 bytenr,</div><div class='add'>+				u64 extent_gen,</div><div class='add'>+				struct btrfs_backref_share_check_ctx *ctx)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_backref_walk_ctx walk_ctx = { 0 };</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	struct ulist_iterator uiter;</div><div class='hunk'>@@ -1531,13 +1856,25 @@ int btrfs_check_shared(struct btrfs_root *root, u64 inum, u64 bytenr,</div><div class='ctx'> 	struct btrfs_seq_list elem = BTRFS_SEQ_LIST_INIT(elem);</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	struct share_check shared = {</div><div class='del'>-		.root_objectid = root-&gt;root_key.objectid,</div><div class='del'>-		.inum = inum,</div><div class='add'>+		.ctx = ctx,</div><div class='add'>+		.root = root,</div><div class='add'>+		.inum = btrfs_ino(inode),</div><div class='add'>+		.data_bytenr = bytenr,</div><div class='add'>+		.data_extent_gen = extent_gen,</div><div class='ctx'> 		.share_count = 0,</div><div class='add'>+		.self_ref_count = 0,</div><div class='add'>+		.have_delayed_delete_refs = false,</div><div class='ctx'> 	};</div><div class='add'>+	int level;</div><div class='add'>+	bool leaf_cached;</div><div class='add'>+	bool leaf_is_shared;</div><div class='add'>+</div><div class='add'>+	for (int i = 0; i &lt; BTRFS_BACKREF_CTX_PREV_EXTENTS_SIZE; i++) {</div><div class='add'>+		if (ctx-&gt;prev_extents_cache[i].bytenr == bytenr)</div><div class='add'>+			return ctx-&gt;prev_extents_cache[i].is_shared;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	ulist_init(roots);</div><div class='del'>-	ulist_init(tmp);</div><div class='add'>+	ulist_init(&amp;ctx-&gt;refs);</div><div class='ctx'> </div><div class='ctx'> 	trans = btrfs_join_transaction_nostart(root);</div><div class='ctx'> 	if (IS_ERR(trans)) {</div><div class='hunk'>@@ -1549,28 +1886,146 @@ int btrfs_check_shared(struct btrfs_root *root, u64 inum, u64 bytenr,</div><div class='ctx'> 		down_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		btrfs_get_tree_mod_seq(fs_info, &amp;elem);</div><div class='add'>+		walk_ctx.time_seq = elem.seq;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	ctx-&gt;use_path_cache = true;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We may have previously determined that the current leaf is shared.</div><div class='add'>+	 * If it is, then we have a data extent that is shared due to a shared</div><div class='add'>+	 * subtree (caused by snapshotting) and we don't need to check for data</div><div class='add'>+	 * backrefs. If the leaf is not shared, then we must do backref walking</div><div class='add'>+	 * to determine if the data extent is shared through reflinks.</div><div class='add'>+	 */</div><div class='add'>+	leaf_cached = lookup_backref_shared_cache(ctx, root,</div><div class='add'>+						  ctx-&gt;curr_leaf_bytenr, 0,</div><div class='add'>+						  &amp;leaf_is_shared);</div><div class='add'>+	if (leaf_cached &amp;&amp; leaf_is_shared) {</div><div class='add'>+		ret = 1;</div><div class='add'>+		goto out_trans;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	walk_ctx.skip_inode_ref_list = true;</div><div class='add'>+	walk_ctx.trans = trans;</div><div class='add'>+	walk_ctx.fs_info = fs_info;</div><div class='add'>+	walk_ctx.refs = &amp;ctx-&gt;refs;</div><div class='add'>+</div><div class='add'>+	/* -1 means we are in the bytenr of the data extent. */</div><div class='add'>+	level = -1;</div><div class='ctx'> 	ULIST_ITER_INIT(&amp;uiter);</div><div class='ctx'> 	while (1) {</div><div class='del'>-		ret = find_parent_nodes(trans, fs_info, bytenr, elem.seq, tmp,</div><div class='del'>-					roots, NULL, &amp;shared, false);</div><div class='del'>-		if (ret == BACKREF_FOUND_SHARED) {</div><div class='del'>-			/* this is the only condition under which we return 1 */</div><div class='del'>-			ret = 1;</div><div class='add'>+		const unsigned long prev_ref_count = ctx-&gt;refs.nnodes;</div><div class='add'>+</div><div class='add'>+		walk_ctx.bytenr = bytenr;</div><div class='add'>+		ret = find_parent_nodes(&amp;walk_ctx, &amp;shared);</div><div class='add'>+		if (ret == BACKREF_FOUND_SHARED ||</div><div class='add'>+		    ret == BACKREF_FOUND_NOT_SHARED) {</div><div class='add'>+			/* If shared must return 1, otherwise return 0. */</div><div class='add'>+			ret = (ret == BACKREF_FOUND_SHARED) ? 1 : 0;</div><div class='add'>+			if (level &gt;= 0)</div><div class='add'>+				store_backref_shared_cache(ctx, root, bytenr,</div><div class='add'>+							   level, ret == 1);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (ret &lt; 0 &amp;&amp; ret != -ENOENT)</div><div class='ctx'> 			break;</div><div class='ctx'> 		ret = 0;</div><div class='del'>-		node = ulist_next(tmp, &amp;uiter);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * More than one extent buffer (bytenr) may have been added to</div><div class='add'>+		 * the ctx-&gt;refs ulist, in which case we have to check multiple</div><div class='add'>+		 * tree paths in case the first one is not shared, so we can not</div><div class='add'>+		 * use the path cache which is made for a single path. Multiple</div><div class='add'>+		 * extent buffers at the current level happen when:</div><div class='add'>+		 *</div><div class='add'>+		 * 1) level -1, the data extent: If our data extent was not</div><div class='add'>+		 *    directly shared (without multiple reference items), then</div><div class='add'>+		 *    it might have a single reference item with a count &gt; 1 for</div><div class='add'>+		 *    the same offset, which means there are 2 (or more) file</div><div class='add'>+		 *    extent items that point to the data extent - this happens</div><div class='add'>+		 *    when a file extent item needs to be split and then one</div><div class='add'>+		 *    item gets moved to another leaf due to a b+tree leaf split</div><div class='add'>+		 *    when inserting some item. In this case the file extent</div><div class='add'>+		 *    items may be located in different leaves and therefore</div><div class='add'>+		 *    some of the leaves may be referenced through shared</div><div class='add'>+		 *    subtrees while others are not. Since our extent buffer</div><div class='add'>+		 *    cache only works for a single path (by far the most common</div><div class='add'>+		 *    case and simpler to deal with), we can not use it if we</div><div class='add'>+		 *    have multiple leaves (which implies multiple paths).</div><div class='add'>+		 *</div><div class='add'>+		 * 2) level &gt;= 0, a tree node/leaf: We can have a mix of direct</div><div class='add'>+		 *    and indirect references on a b+tree node/leaf, so we have</div><div class='add'>+		 *    to check multiple paths, and the extent buffer (the</div><div class='add'>+		 *    current bytenr) may be shared or not. One example is</div><div class='add'>+		 *    during relocation as we may get a shared tree block ref</div><div class='add'>+		 *    (direct ref) and a non-shared tree block ref (indirect</div><div class='add'>+		 *    ref) for the same node/leaf.</div><div class='add'>+		 */</div><div class='add'>+		if ((ctx-&gt;refs.nnodes - prev_ref_count) &gt; 1)</div><div class='add'>+			ctx-&gt;use_path_cache = false;</div><div class='add'>+</div><div class='add'>+		if (level &gt;= 0)</div><div class='add'>+			store_backref_shared_cache(ctx, root, bytenr,</div><div class='add'>+						   level, false);</div><div class='add'>+		node = ulist_next(&amp;ctx-&gt;refs, &amp;uiter);</div><div class='ctx'> 		if (!node)</div><div class='ctx'> 			break;</div><div class='ctx'> 		bytenr = node-&gt;val;</div><div class='add'>+		if (ctx-&gt;use_path_cache) {</div><div class='add'>+			bool is_shared;</div><div class='add'>+			bool cached;</div><div class='add'>+</div><div class='add'>+			level++;</div><div class='add'>+			cached = lookup_backref_shared_cache(ctx, root, bytenr,</div><div class='add'>+							     level, &amp;is_shared);</div><div class='add'>+			if (cached) {</div><div class='add'>+				ret = (is_shared ? 1 : 0);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='ctx'> 		shared.share_count = 0;</div><div class='add'>+		shared.have_delayed_delete_refs = false;</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * If the path cache is disabled, then it means at some tree level we</div><div class='add'>+	 * got multiple parents due to a mix of direct and indirect backrefs or</div><div class='add'>+	 * multiple leaves with file extent items pointing to the same data</div><div class='add'>+	 * extent. We have to invalidate the cache and cache only the sharedness</div><div class='add'>+	 * result for the levels where we got only one node/reference.</div><div class='add'>+	 */</div><div class='add'>+	if (!ctx-&gt;use_path_cache) {</div><div class='add'>+		int i = 0;</div><div class='add'>+</div><div class='add'>+		level--;</div><div class='add'>+		if (ret &gt;= 0 &amp;&amp; level &gt;= 0) {</div><div class='add'>+			bytenr = ctx-&gt;path_cache_entries[level].bytenr;</div><div class='add'>+			ctx-&gt;use_path_cache = true;</div><div class='add'>+			store_backref_shared_cache(ctx, root, bytenr, level, ret);</div><div class='add'>+			i = level + 1;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		for ( ; i &lt; BTRFS_MAX_LEVEL; i++)</div><div class='add'>+			ctx-&gt;path_cache_entries[i].bytenr = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Cache the sharedness result for the data extent if we know our inode</div><div class='add'>+	 * has more than 1 file extent item that refers to the data extent.</div><div class='add'>+	 */</div><div class='add'>+	if (ret &gt;= 0 &amp;&amp; shared.self_ref_count &gt; 1) {</div><div class='add'>+		int slot = ctx-&gt;prev_extents_cache_slot;</div><div class='add'>+</div><div class='add'>+		ctx-&gt;prev_extents_cache[slot].bytenr = shared.data_bytenr;</div><div class='add'>+		ctx-&gt;prev_extents_cache[slot].is_shared = (ret == 1);</div><div class='add'>+</div><div class='add'>+		slot = (slot + 1) % BTRFS_BACKREF_CTX_PREV_EXTENTS_SIZE;</div><div class='add'>+		ctx-&gt;prev_extents_cache_slot = slot;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+out_trans:</div><div class='ctx'> 	if (trans) {</div><div class='ctx'> 		btrfs_put_tree_mod_seq(fs_info, &amp;elem);</div><div class='ctx'> 		btrfs_end_transaction(trans);</div><div class='hunk'>@@ -1578,8 +2033,9 @@ int btrfs_check_shared(struct btrfs_root *root, u64 inum, u64 bytenr,</div><div class='ctx'> 		up_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='del'>-	ulist_release(roots);</div><div class='del'>-	ulist_release(tmp);</div><div class='add'>+	ulist_release(&amp;ctx-&gt;refs);</div><div class='add'>+	ctx-&gt;prev_leaf_bytenr = ctx-&gt;curr_leaf_bytenr;</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1740,26 +2196,33 @@ int extent_from_logical(struct btrfs_fs_info *fs_info, u64 logical,</div><div class='ctx'> 			struct btrfs_path *path, struct btrfs_key *found_key,</div><div class='ctx'> 			u64 *flags_ret)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_root *extent_root = btrfs_extent_root(fs_info, logical);</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	u64 flags;</div><div class='ctx'> 	u64 size = 0;</div><div class='del'>-	u32 item_size;</div><div class='ctx'> 	const struct extent_buffer *eb;</div><div class='ctx'> 	struct btrfs_extent_item *ei;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> </div><div class='add'>+	key.objectid = logical;</div><div class='ctx'> 	if (btrfs_fs_incompat(fs_info, SKINNY_METADATA))</div><div class='ctx'> 		key.type = BTRFS_METADATA_ITEM_KEY;</div><div class='ctx'> 	else</div><div class='ctx'> 		key.type = BTRFS_EXTENT_ITEM_KEY;</div><div class='del'>-	key.objectid = logical;</div><div class='ctx'> 	key.offset = (u64)-1;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_search_slot(NULL, fs_info-&gt;extent_root, &amp;key, path, 0, 0);</div><div class='add'>+	ret = btrfs_search_slot(NULL, extent_root, &amp;key, path, 0, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='add'>+	if (unlikely(ret == 0)) {</div><div class='add'>+		/*</div><div class='add'>+		 * Key with offset -1 found, there would have to exist an extent</div><div class='add'>+		 * item with such offset, but this is out of the valid range.</div><div class='add'>+		 */</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_previous_extent_item(fs_info-&gt;extent_root, path, 0);</div><div class='add'>+	ret = btrfs_previous_extent_item(extent_root, path, 0);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		if (ret &gt; 0)</div><div class='ctx'> 			ret = -ENOENT;</div><div class='hunk'>@@ -1779,8 +2242,6 @@ int extent_from_logical(struct btrfs_fs_info *fs_info, u64 logical,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	eb = path-&gt;nodes[0];</div><div class='del'>-	item_size = btrfs_item_size_nr(eb, path-&gt;slots[0]);</div><div class='del'>-	BUG_ON(item_size &lt; sizeof(*ei));</div><div class='ctx'> </div><div class='ctx'> 	ei = btrfs_item_ptr(eb, path-&gt;slots[0], struct btrfs_extent_item);</div><div class='ctx'> 	flags = btrfs_extent_flags(eb, ei);</div><div class='hunk'>@@ -1788,7 +2249,7 @@ int extent_from_logical(struct btrfs_fs_info *fs_info, u64 logical,</div><div class='ctx'> 	btrfs_debug(fs_info,</div><div class='ctx'> 		"logical %llu is at position %llu within the extent (%llu EXTENT_ITEM %llu) flags %#llx size %u",</div><div class='ctx'> 		 logical, logical - found_key-&gt;objectid, found_key-&gt;objectid,</div><div class='del'>-		 found_key-&gt;offset, flags, item_size);</div><div class='add'>+		 found_key-&gt;offset, flags, btrfs_item_size(eb, path-&gt;slots[0]));</div><div class='ctx'> </div><div class='ctx'> 	WARN_ON(!flags_ret);</div><div class='ctx'> 	if (flags_ret) {</div><div class='hunk'>@@ -1850,7 +2311,7 @@ static int get_extent_inline_ref(unsigned long *ptr,</div><div class='ctx'> 	*out_eiref = (struct btrfs_extent_inline_ref *)(*ptr);</div><div class='ctx'> 	*out_type = btrfs_get_extent_inline_ref_type(eb, *out_eiref,</div><div class='ctx'> 						     BTRFS_REF_TYPE_ANY);</div><div class='del'>-	if (*out_type == BTRFS_REF_TYPE_INVALID)</div><div class='add'>+	if (unlikely(*out_type == BTRFS_REF_TYPE_INVALID))</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> </div><div class='ctx'> 	*ptr += btrfs_extent_inline_ref_size(*out_type);</div><div class='hunk'>@@ -1925,7 +2386,7 @@ static int iterate_leaf_refs(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			    "ref for %llu resolved, key (%llu EXTEND_DATA %llu), root %llu",</div><div class='ctx'> 			    extent_item_objectid, eie-&gt;inum,</div><div class='ctx'> 			    eie-&gt;offset, root);</div><div class='del'>-		ret = iterate(eie-&gt;inum, eie-&gt;offset, root, ctx);</div><div class='add'>+		ret = iterate(eie-&gt;inum, eie-&gt;offset, eie-&gt;num_bytes, root, ctx);</div><div class='ctx'> 		if (ret) {</div><div class='ctx'> 			btrfs_debug(fs_info,</div><div class='ctx'> 				    "stopping iteration for %llu due to ret=%d",</div><div class='hunk'>@@ -1942,113 +2403,181 @@ static int iterate_leaf_refs(struct btrfs_fs_info *fs_info,</div><div class='ctx'>  * the given parameters.</div><div class='ctx'>  * when the iterator function returns a non-zero value, iteration stops.</div><div class='ctx'>  */</div><div class='del'>-int iterate_extent_inodes(struct btrfs_fs_info *fs_info,</div><div class='del'>-				u64 extent_item_objectid, u64 extent_item_pos,</div><div class='del'>-				int search_commit_root,</div><div class='del'>-				iterate_extent_inodes_t *iterate, void *ctx,</div><div class='del'>-				bool ignore_offset)</div><div class='add'>+int iterate_extent_inodes(struct btrfs_backref_walk_ctx *ctx,</div><div class='add'>+			  bool search_commit_root,</div><div class='add'>+			  iterate_extent_inodes_t *iterate, void *user_ctx)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='del'>-	struct btrfs_trans_handle *trans = NULL;</div><div class='del'>-	struct ulist *refs = NULL;</div><div class='del'>-	struct ulist *roots = NULL;</div><div class='del'>-	struct ulist_node *ref_node = NULL;</div><div class='del'>-	struct ulist_node *root_node = NULL;</div><div class='add'>+	struct ulist *refs;</div><div class='add'>+	struct ulist_node *ref_node;</div><div class='ctx'> 	struct btrfs_seq_list seq_elem = BTRFS_SEQ_LIST_INIT(seq_elem);</div><div class='ctx'> 	struct ulist_iterator ref_uiter;</div><div class='del'>-	struct ulist_iterator root_uiter;</div><div class='ctx'> </div><div class='del'>-	btrfs_debug(fs_info, "resolving all inodes for extent %llu",</div><div class='del'>-			extent_item_objectid);</div><div class='add'>+	btrfs_debug(ctx-&gt;fs_info, "resolving all inodes for extent %llu",</div><div class='add'>+		    ctx-&gt;bytenr);</div><div class='add'>+</div><div class='add'>+	ASSERT(ctx-&gt;trans == NULL);</div><div class='add'>+	ASSERT(ctx-&gt;roots == NULL);</div><div class='ctx'> </div><div class='ctx'> 	if (!search_commit_root) {</div><div class='del'>-		trans = btrfs_attach_transaction(fs_info-&gt;extent_root);</div><div class='add'>+		struct btrfs_trans_handle *trans;</div><div class='add'>+</div><div class='add'>+		trans = btrfs_attach_transaction(ctx-&gt;fs_info-&gt;tree_root);</div><div class='ctx'> 		if (IS_ERR(trans)) {</div><div class='ctx'> 			if (PTR_ERR(trans) != -ENOENT &amp;&amp;</div><div class='ctx'> 			    PTR_ERR(trans) != -EROFS)</div><div class='ctx'> 				return PTR_ERR(trans);</div><div class='ctx'> 			trans = NULL;</div><div class='ctx'> 		}</div><div class='add'>+		ctx-&gt;trans = trans;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (trans)</div><div class='del'>-		btrfs_get_tree_mod_seq(fs_info, &amp;seq_elem);</div><div class='del'>-	else</div><div class='del'>-		down_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='add'>+	if (ctx-&gt;trans) {</div><div class='add'>+		btrfs_get_tree_mod_seq(ctx-&gt;fs_info, &amp;seq_elem);</div><div class='add'>+		ctx-&gt;time_seq = seq_elem.seq;</div><div class='add'>+	} else {</div><div class='add'>+		down_read(&amp;ctx-&gt;fs_info-&gt;commit_root_sem);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_find_all_leafs(trans, fs_info, extent_item_objectid,</div><div class='del'>-				   seq_elem.seq, &amp;refs,</div><div class='del'>-				   &amp;extent_item_pos, ignore_offset);</div><div class='add'>+	ret = btrfs_find_all_leafs(ctx);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='add'>+	refs = ctx-&gt;refs;</div><div class='add'>+	ctx-&gt;refs = NULL;</div><div class='ctx'> </div><div class='ctx'> 	ULIST_ITER_INIT(&amp;ref_uiter);</div><div class='ctx'> 	while (!ret &amp;&amp; (ref_node = ulist_next(refs, &amp;ref_uiter))) {</div><div class='del'>-		ret = btrfs_find_all_roots_safe(trans, fs_info, ref_node-&gt;val,</div><div class='del'>-						seq_elem.seq, &amp;roots,</div><div class='del'>-						ignore_offset);</div><div class='add'>+		const u64 leaf_bytenr = ref_node-&gt;val;</div><div class='add'>+		struct ulist_node *root_node;</div><div class='add'>+		struct ulist_iterator root_uiter;</div><div class='add'>+		struct extent_inode_elem *inode_list;</div><div class='add'>+</div><div class='add'>+		inode_list = (struct extent_inode_elem *)(uintptr_t)ref_node-&gt;aux;</div><div class='add'>+</div><div class='add'>+		if (ctx-&gt;cache_lookup) {</div><div class='add'>+			const u64 *root_ids;</div><div class='add'>+			int root_count;</div><div class='add'>+			bool cached;</div><div class='add'>+</div><div class='add'>+			cached = ctx-&gt;cache_lookup(leaf_bytenr, ctx-&gt;user_ctx,</div><div class='add'>+						   &amp;root_ids, &amp;root_count);</div><div class='add'>+			if (cached) {</div><div class='add'>+				for (int i = 0; i &lt; root_count; i++) {</div><div class='add'>+					ret = iterate_leaf_refs(ctx-&gt;fs_info,</div><div class='add'>+								inode_list,</div><div class='add'>+								root_ids[i],</div><div class='add'>+								leaf_bytenr,</div><div class='add'>+								iterate,</div><div class='add'>+								user_ctx);</div><div class='add'>+					if (ret)</div><div class='add'>+						break;</div><div class='add'>+				}</div><div class='add'>+				continue;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (!ctx-&gt;roots) {</div><div class='add'>+			ctx-&gt;roots = ulist_alloc(GFP_NOFS);</div><div class='add'>+			if (!ctx-&gt;roots) {</div><div class='add'>+				ret = -ENOMEM;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		ctx-&gt;bytenr = leaf_bytenr;</div><div class='add'>+		ret = btrfs_find_all_roots_safe(ctx);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			break;</div><div class='add'>+</div><div class='add'>+		if (ctx-&gt;cache_store)</div><div class='add'>+			ctx-&gt;cache_store(leaf_bytenr, ctx-&gt;roots, ctx-&gt;user_ctx);</div><div class='add'>+</div><div class='ctx'> 		ULIST_ITER_INIT(&amp;root_uiter);</div><div class='del'>-		while (!ret &amp;&amp; (root_node = ulist_next(roots, &amp;root_uiter))) {</div><div class='del'>-			btrfs_debug(fs_info,</div><div class='add'>+		while (!ret &amp;&amp; (root_node = ulist_next(ctx-&gt;roots, &amp;root_uiter))) {</div><div class='add'>+			btrfs_debug(ctx-&gt;fs_info,</div><div class='ctx'> 				    "root %llu references leaf %llu, data list %#llx",</div><div class='ctx'> 				    root_node-&gt;val, ref_node-&gt;val,</div><div class='ctx'> 				    ref_node-&gt;aux);</div><div class='del'>-			ret = iterate_leaf_refs(fs_info,</div><div class='del'>-						(struct extent_inode_elem *)</div><div class='del'>-						(uintptr_t)ref_node-&gt;aux,</div><div class='del'>-						root_node-&gt;val,</div><div class='del'>-						extent_item_objectid,</div><div class='del'>-						iterate, ctx);</div><div class='add'>+			ret = iterate_leaf_refs(ctx-&gt;fs_info, inode_list,</div><div class='add'>+						root_node-&gt;val, ctx-&gt;bytenr,</div><div class='add'>+						iterate, user_ctx);</div><div class='ctx'> 		}</div><div class='del'>-		ulist_free(roots);</div><div class='add'>+		ulist_reinit(ctx-&gt;roots);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	free_leaf_list(refs);</div><div class='ctx'> out:</div><div class='del'>-	if (trans) {</div><div class='del'>-		btrfs_put_tree_mod_seq(fs_info, &amp;seq_elem);</div><div class='del'>-		btrfs_end_transaction(trans);</div><div class='add'>+	if (ctx-&gt;trans) {</div><div class='add'>+		btrfs_put_tree_mod_seq(ctx-&gt;fs_info, &amp;seq_elem);</div><div class='add'>+		btrfs_end_transaction(ctx-&gt;trans);</div><div class='add'>+		ctx-&gt;trans = NULL;</div><div class='ctx'> 	} else {</div><div class='del'>-		up_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='add'>+		up_read(&amp;ctx-&gt;fs_info-&gt;commit_root_sem);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	ulist_free(ctx-&gt;roots);</div><div class='add'>+	ctx-&gt;roots = NULL;</div><div class='add'>+</div><div class='add'>+	if (ret == BTRFS_ITERATE_EXTENT_INODES_STOP)</div><div class='add'>+		ret = 0;</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int build_ino_list(u64 inum, u64 offset, u64 num_bytes, u64 root, void *ctx)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_data_container *inodes = ctx;</div><div class='add'>+	const size_t c = 3 * sizeof(u64);</div><div class='add'>+</div><div class='add'>+	if (inodes-&gt;bytes_left &gt;= c) {</div><div class='add'>+		inodes-&gt;bytes_left -= c;</div><div class='add'>+		inodes-&gt;val[inodes-&gt;elem_cnt] = inum;</div><div class='add'>+		inodes-&gt;val[inodes-&gt;elem_cnt + 1] = offset;</div><div class='add'>+		inodes-&gt;val[inodes-&gt;elem_cnt + 2] = root;</div><div class='add'>+		inodes-&gt;elem_cnt += 3;</div><div class='add'>+	} else {</div><div class='add'>+		inodes-&gt;bytes_missing += c - inodes-&gt;bytes_left;</div><div class='add'>+		inodes-&gt;bytes_left = 0;</div><div class='add'>+		inodes-&gt;elem_missed += 3;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> int iterate_inodes_from_logical(u64 logical, struct btrfs_fs_info *fs_info,</div><div class='del'>-				struct btrfs_path *path,</div><div class='del'>-				iterate_extent_inodes_t *iterate, void *ctx,</div><div class='del'>-				bool ignore_offset)</div><div class='add'>+				void *ctx, bool ignore_offset)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_backref_walk_ctx walk_ctx = { 0 };</div><div class='ctx'> 	int ret;</div><div class='del'>-	u64 extent_item_pos;</div><div class='ctx'> 	u64 flags = 0;</div><div class='ctx'> 	struct btrfs_key found_key;</div><div class='del'>-	int search_commit_root = path-&gt;search_commit_root;</div><div class='add'>+	struct btrfs_path *path;</div><div class='add'>+</div><div class='add'>+	path = btrfs_alloc_path();</div><div class='add'>+	if (!path)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	ret = extent_from_logical(fs_info, logical, path, &amp;found_key, &amp;flags);</div><div class='del'>-	btrfs_release_path(path);</div><div class='add'>+	btrfs_free_path(path);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	if (flags &amp; BTRFS_EXTENT_FLAG_TREE_BLOCK)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	extent_item_pos = logical - found_key.objectid;</div><div class='del'>-	ret = iterate_extent_inodes(fs_info, found_key.objectid,</div><div class='del'>-					extent_item_pos, search_commit_root,</div><div class='del'>-					iterate, ctx, ignore_offset);</div><div class='add'>+	walk_ctx.bytenr = found_key.objectid;</div><div class='add'>+	if (ignore_offset)</div><div class='add'>+		walk_ctx.ignore_extent_item_pos = true;</div><div class='add'>+	else</div><div class='add'>+		walk_ctx.extent_item_pos = logical - found_key.objectid;</div><div class='add'>+	walk_ctx.fs_info = fs_info;</div><div class='ctx'> </div><div class='del'>-	return ret;</div><div class='add'>+	return iterate_extent_inodes(&amp;walk_ctx, false, build_ino_list, ctx);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-typedef int (iterate_irefs_t)(u64 parent, u32 name_len, unsigned long name_off,</div><div class='del'>-			      struct extent_buffer *eb, void *ctx);</div><div class='add'>+static int inode_to_path(u64 inum, u32 name_len, unsigned long name_off,</div><div class='add'>+			 struct extent_buffer *eb, struct inode_fs_paths *ipath);</div><div class='ctx'> </div><div class='del'>-static int iterate_inode_refs(u64 inum, struct btrfs_root *fs_root,</div><div class='del'>-			      struct btrfs_path *path,</div><div class='del'>-			      iterate_irefs_t *iterate, void *ctx)</div><div class='add'>+static int iterate_inode_refs(u64 inum, struct inode_fs_paths *ipath)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int slot;</div><div class='hunk'>@@ -2057,8 +2586,9 @@ static int iterate_inode_refs(u64 inum, struct btrfs_root *fs_root,</div><div class='ctx'> 	u32 name_len;</div><div class='ctx'> 	u64 parent = 0;</div><div class='ctx'> 	int found = 0;</div><div class='add'>+	struct btrfs_root *fs_root = ipath-&gt;fs_root;</div><div class='add'>+	struct btrfs_path *path = ipath-&gt;btrfs_path;</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='del'>-	struct btrfs_item *item;</div><div class='ctx'> 	struct btrfs_inode_ref *iref;</div><div class='ctx'> 	struct btrfs_key found_key;</div><div class='ctx'> </div><div class='hunk'>@@ -2084,18 +2614,17 @@ static int iterate_inode_refs(u64 inum, struct btrfs_root *fs_root,</div><div class='ctx'> 		}</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> </div><div class='del'>-		item = btrfs_item_nr(slot);</div><div class='ctx'> 		iref = btrfs_item_ptr(eb, slot, struct btrfs_inode_ref);</div><div class='ctx'> </div><div class='del'>-		for (cur = 0; cur &lt; btrfs_item_size(eb, item); cur += len) {</div><div class='add'>+		for (cur = 0; cur &lt; btrfs_item_size(eb, slot); cur += len) {</div><div class='ctx'> 			name_len = btrfs_inode_ref_name_len(eb, iref);</div><div class='ctx'> 			/* path must be released before calling iterate()! */</div><div class='ctx'> 			btrfs_debug(fs_root-&gt;fs_info,</div><div class='ctx'> 				"following ref at offset %u for inode %llu in tree %llu",</div><div class='ctx'> 				cur, found_key.objectid,</div><div class='del'>-				fs_root-&gt;root_key.objectid);</div><div class='del'>-			ret = iterate(parent, name_len,</div><div class='del'>-				      (unsigned long)(iref + 1), eb, ctx);</div><div class='add'>+				btrfs_root_id(fs_root));</div><div class='add'>+			ret = inode_to_path(parent, name_len,</div><div class='add'>+				      (unsigned long)(iref + 1), eb, ipath);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				break;</div><div class='ctx'> 			len = sizeof(*iref) + name_len;</div><div class='hunk'>@@ -2109,15 +2638,15 @@ static int iterate_inode_refs(u64 inum, struct btrfs_root *fs_root,</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int iterate_inode_extrefs(u64 inum, struct btrfs_root *fs_root,</div><div class='del'>-				 struct btrfs_path *path,</div><div class='del'>-				 iterate_irefs_t *iterate, void *ctx)</div><div class='add'>+static int iterate_inode_extrefs(u64 inum, struct inode_fs_paths *ipath)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int slot;</div><div class='ctx'> 	u64 offset = 0;</div><div class='ctx'> 	u64 parent;</div><div class='ctx'> 	int found = 0;</div><div class='add'>+	struct btrfs_root *fs_root = ipath-&gt;fs_root;</div><div class='add'>+	struct btrfs_path *path = ipath-&gt;btrfs_path;</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='ctx'> 	struct btrfs_inode_extref *extref;</div><div class='ctx'> 	u32 item_size;</div><div class='hunk'>@@ -2143,7 +2672,7 @@ static int iterate_inode_extrefs(u64 inum, struct btrfs_root *fs_root,</div><div class='ctx'> 		}</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> </div><div class='del'>-		item_size = btrfs_item_size_nr(eb, slot);</div><div class='add'>+		item_size = btrfs_item_size(eb, slot);</div><div class='ctx'> 		ptr = btrfs_item_ptr_offset(eb, slot);</div><div class='ctx'> 		cur_offset = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -2153,8 +2682,8 @@ static int iterate_inode_extrefs(u64 inum, struct btrfs_root *fs_root,</div><div class='ctx'> 			extref = (struct btrfs_inode_extref *)(ptr + cur_offset);</div><div class='ctx'> 			parent = btrfs_inode_extref_parent(eb, extref);</div><div class='ctx'> 			name_len = btrfs_inode_extref_name_len(eb, extref);</div><div class='del'>-			ret = iterate(parent, name_len,</div><div class='del'>-				      (unsigned long)&amp;extref-&gt;name, eb, ctx);</div><div class='add'>+			ret = inode_to_path(parent, name_len,</div><div class='add'>+				      (unsigned long)&amp;extref-&gt;name, eb, ipath);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				break;</div><div class='ctx'> </div><div class='hunk'>@@ -2171,34 +2700,13 @@ static int iterate_inode_extrefs(u64 inum, struct btrfs_root *fs_root,</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int iterate_irefs(u64 inum, struct btrfs_root *fs_root,</div><div class='del'>-			 struct btrfs_path *path, iterate_irefs_t *iterate,</div><div class='del'>-			 void *ctx)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-	int found_refs = 0;</div><div class='del'>-</div><div class='del'>-	ret = iterate_inode_refs(inum, fs_root, path, iterate, ctx);</div><div class='del'>-	if (!ret)</div><div class='del'>-		++found_refs;</div><div class='del'>-	else if (ret != -ENOENT)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	ret = iterate_inode_extrefs(inum, fs_root, path, iterate, ctx);</div><div class='del'>-	if (ret == -ENOENT &amp;&amp; found_refs)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * returns 0 if the path could be dumped (probably truncated)</div><div class='ctx'>  * returns &lt;0 in case of an error</div><div class='ctx'>  */</div><div class='ctx'> static int inode_to_path(u64 inum, u32 name_len, unsigned long name_off,</div><div class='del'>-			 struct extent_buffer *eb, void *ctx)</div><div class='add'>+			 struct extent_buffer *eb, struct inode_fs_paths *ipath)</div><div class='ctx'> {</div><div class='del'>-	struct inode_fs_paths *ipath = ctx;</div><div class='ctx'> 	char *fspath;</div><div class='ctx'> 	char *fspath_min;</div><div class='ctx'> 	int i = ipath-&gt;fspath-&gt;elem_cnt;</div><div class='hunk'>@@ -2239,8 +2747,20 @@ static int inode_to_path(u64 inum, u32 name_len, unsigned long name_off,</div><div class='ctx'>  */</div><div class='ctx'> int paths_from_inode(u64 inum, struct inode_fs_paths *ipath)</div><div class='ctx'> {</div><div class='del'>-	return iterate_irefs(inum, ipath-&gt;fs_root, ipath-&gt;btrfs_path,</div><div class='del'>-			     inode_to_path, ipath);</div><div class='add'>+	int ret;</div><div class='add'>+	int found_refs = 0;</div><div class='add'>+</div><div class='add'>+	ret = iterate_inode_refs(inum, ipath);</div><div class='add'>+	if (!ret)</div><div class='add'>+		++found_refs;</div><div class='add'>+	else if (ret != -ENOENT)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	ret = iterate_inode_extrefs(inum, ipath);</div><div class='add'>+	if (ret == -ENOENT &amp;&amp; found_refs)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct btrfs_data_container *init_data_container(u32 total_bytes)</div><div class='hunk'>@@ -2249,20 +2769,14 @@ struct btrfs_data_container *init_data_container(u32 total_bytes)</div><div class='ctx'> 	size_t alloc_bytes;</div><div class='ctx'> </div><div class='ctx'> 	alloc_bytes = max_t(size_t, total_bytes, sizeof(*data));</div><div class='del'>-	data = kvmalloc(alloc_bytes, GFP_KERNEL);</div><div class='add'>+	data = kvzalloc(alloc_bytes, GFP_KERNEL);</div><div class='ctx'> 	if (!data)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='del'>-	if (total_bytes &gt;= sizeof(*data)) {</div><div class='add'>+	if (total_bytes &gt;= sizeof(*data))</div><div class='ctx'> 		data-&gt;bytes_left = total_bytes - sizeof(*data);</div><div class='del'>-		data-&gt;bytes_missing = 0;</div><div class='del'>-	} else {</div><div class='add'>+	else</div><div class='ctx'> 		data-&gt;bytes_missing = sizeof(*data) - total_bytes;</div><div class='del'>-		data-&gt;bytes_left = 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	data-&gt;elem_cnt = 0;</div><div class='del'>-	data-&gt;elem_missed = 0;</div><div class='ctx'> </div><div class='ctx'> 	return data;</div><div class='ctx'> }</div><div class='hunk'>@@ -2271,7 +2785,7 @@ struct btrfs_data_container *init_data_container(u32 total_bytes)</div><div class='ctx'>  * allocates space to return multiple file system paths for an inode.</div><div class='ctx'>  * total_bytes to allocate are passed, note that space usable for actual path</div><div class='ctx'>  * information will be total_bytes - sizeof(struct inode_fs_paths).</div><div class='del'>- * the returned pointer must be freed with free_ipath() in the end.</div><div class='add'>+ * the returned pointer must be freed with __free_inode_fs_paths() in the end.</div><div class='ctx'>  */</div><div class='ctx'> struct inode_fs_paths *init_ipath(s32 total_bytes, struct btrfs_root *fs_root,</div><div class='ctx'> 					struct btrfs_path *path)</div><div class='hunk'>@@ -2296,20 +2810,11 @@ struct inode_fs_paths *init_ipath(s32 total_bytes, struct btrfs_root *fs_root,</div><div class='ctx'> 	return ifp;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void free_ipath(struct inode_fs_paths *ipath)</div><div class='del'>-{</div><div class='del'>-	if (!ipath)</div><div class='del'>-		return;</div><div class='del'>-	kvfree(ipath-&gt;fspath);</div><div class='del'>-	kfree(ipath);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct btrfs_backref_iter *btrfs_backref_iter_alloc(</div><div class='del'>-		struct btrfs_fs_info *fs_info, gfp_t gfp_flag)</div><div class='add'>+struct btrfs_backref_iter *btrfs_backref_iter_alloc(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_backref_iter *ret;</div><div class='ctx'> </div><div class='del'>-	ret = kzalloc(sizeof(*ret), gfp_flag);</div><div class='add'>+	ret = kzalloc(sizeof(*ret), GFP_NOFS);</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='hunk'>@@ -2320,16 +2825,27 @@ struct btrfs_backref_iter *btrfs_backref_iter_alloc(</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Current backref iterator only supports iteration in commit root */</div><div class='del'>-	ret-&gt;path-&gt;search_commit_root = 1;</div><div class='del'>-	ret-&gt;path-&gt;skip_locking = 1;</div><div class='add'>+	ret-&gt;path-&gt;search_commit_root = true;</div><div class='add'>+	ret-&gt;path-&gt;skip_locking = true;</div><div class='ctx'> 	ret-&gt;fs_info = fs_info;</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void btrfs_backref_iter_release(struct btrfs_backref_iter *iter)</div><div class='add'>+{</div><div class='add'>+	iter-&gt;bytenr = 0;</div><div class='add'>+	iter-&gt;item_ptr = 0;</div><div class='add'>+	iter-&gt;cur_ptr = 0;</div><div class='add'>+	iter-&gt;end_ptr = 0;</div><div class='add'>+	btrfs_release_path(iter-&gt;path);</div><div class='add'>+	memset(&amp;iter-&gt;cur_key, 0, sizeof(iter-&gt;cur_key));</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> int btrfs_backref_iter_start(struct btrfs_backref_iter *iter, u64 bytenr)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = iter-&gt;fs_info;</div><div class='add'>+	struct btrfs_root *extent_root = btrfs_extent_root(fs_info, bytenr);</div><div class='ctx'> 	struct btrfs_path *path = iter-&gt;path;</div><div class='ctx'> 	struct btrfs_extent_item *ei;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='hunk'>@@ -2340,15 +2856,19 @@ int btrfs_backref_iter_start(struct btrfs_backref_iter *iter, u64 bytenr)</div><div class='ctx'> 	key.offset = (u64)-1;</div><div class='ctx'> 	iter-&gt;bytenr = bytenr;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_search_slot(NULL, fs_info-&gt;extent_root, &amp;key, path, 0, 0);</div><div class='add'>+	ret = btrfs_search_slot(NULL, extent_root, &amp;key, path, 0, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='del'>-	if (ret == 0) {</div><div class='add'>+	if (unlikely(ret == 0)) {</div><div class='add'>+		/*</div><div class='add'>+		 * Key with offset -1 found, there would have to exist an extent</div><div class='add'>+		 * item with such offset, but this is out of the valid range.</div><div class='add'>+		 */</div><div class='ctx'> 		ret = -EUCLEAN;</div><div class='ctx'> 		goto release;</div><div class='ctx'> 	}</div><div class='del'>-	if (path-&gt;slots[0] == 0) {</div><div class='del'>-		WARN_ON(IS_ENABLED(CONFIG_BTRFS_DEBUG));</div><div class='add'>+	if (unlikely(path-&gt;slots[0] == 0)) {</div><div class='add'>+		DEBUG_WARN();</div><div class='ctx'> 		ret = -EUCLEAN;</div><div class='ctx'> 		goto release;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2364,7 +2884,7 @@ int btrfs_backref_iter_start(struct btrfs_backref_iter *iter, u64 bytenr)</div><div class='ctx'> 	iter-&gt;item_ptr = (u32)btrfs_item_ptr_offset(path-&gt;nodes[0],</div><div class='ctx'> 						    path-&gt;slots[0]);</div><div class='ctx'> 	iter-&gt;end_ptr = (u32)(iter-&gt;item_ptr +</div><div class='del'>-			btrfs_item_size_nr(path-&gt;nodes[0], path-&gt;slots[0]));</div><div class='add'>+			btrfs_item_size(path-&gt;nodes[0], path-&gt;slots[0]));</div><div class='ctx'> 	ei = btrfs_item_ptr(path-&gt;nodes[0], path-&gt;slots[0],</div><div class='ctx'> 			    struct btrfs_extent_item);</div><div class='ctx'> </div><div class='hunk'>@@ -2383,7 +2903,7 @@ int btrfs_backref_iter_start(struct btrfs_backref_iter *iter, u64 bytenr)</div><div class='ctx'> </div><div class='ctx'> 	/* If there is no inline backref, go search for keyed backref */</div><div class='ctx'> 	if (iter-&gt;cur_ptr &gt;= iter-&gt;end_ptr) {</div><div class='del'>-		ret = btrfs_next_item(fs_info-&gt;extent_root, path);</div><div class='add'>+		ret = btrfs_next_item(extent_root, path);</div><div class='ctx'> </div><div class='ctx'> 		/* No inline nor keyed ref */</div><div class='ctx'> 		if (ret &gt; 0) {</div><div class='hunk'>@@ -2404,7 +2924,7 @@ int btrfs_backref_iter_start(struct btrfs_backref_iter *iter, u64 bytenr)</div><div class='ctx'> 		iter-&gt;cur_ptr = (u32)btrfs_item_ptr_offset(path-&gt;nodes[0],</div><div class='ctx'> 							   path-&gt;slots[0]);</div><div class='ctx'> 		iter-&gt;item_ptr = iter-&gt;cur_ptr;</div><div class='del'>-		iter-&gt;end_ptr = (u32)(iter-&gt;item_ptr + btrfs_item_size_nr(</div><div class='add'>+		iter-&gt;end_ptr = (u32)(iter-&gt;item_ptr + btrfs_item_size(</div><div class='ctx'> 				      path-&gt;nodes[0], path-&gt;slots[0]));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -2414,6 +2934,14 @@ release:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool btrfs_backref_iter_is_inline_ref(struct btrfs_backref_iter *iter)</div><div class='add'>+{</div><div class='add'>+	if (iter-&gt;cur_key.type == BTRFS_EXTENT_ITEM_KEY ||</div><div class='add'>+	    iter-&gt;cur_key.type == BTRFS_METADATA_ITEM_KEY)</div><div class='add'>+		return true;</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Go to the next backref item of current bytenr, can be either inlined or</div><div class='ctx'>  * keyed.</div><div class='hunk'>@@ -2426,7 +2954,8 @@ release:</div><div class='ctx'>  */</div><div class='ctx'> int btrfs_backref_iter_next(struct btrfs_backref_iter *iter)</div><div class='ctx'> {</div><div class='del'>-	struct extent_buffer *eb = btrfs_backref_get_eb(iter);</div><div class='add'>+	struct extent_buffer *eb = iter-&gt;path-&gt;nodes[0];</div><div class='add'>+	struct btrfs_root *extent_root;</div><div class='ctx'> 	struct btrfs_path *path = iter-&gt;path;</div><div class='ctx'> 	struct btrfs_extent_inline_ref *iref;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -2457,7 +2986,8 @@ int btrfs_backref_iter_next(struct btrfs_backref_iter *iter)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* We're at keyed items, there is no inline item, go to the next one */</div><div class='del'>-	ret = btrfs_next_item(iter-&gt;fs_info-&gt;extent_root, iter-&gt;path);</div><div class='add'>+	extent_root = btrfs_extent_root(iter-&gt;fs_info, iter-&gt;bytenr);</div><div class='add'>+	ret = btrfs_next_item(extent_root, iter-&gt;path);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='hunk'>@@ -2469,22 +2999,19 @@ int btrfs_backref_iter_next(struct btrfs_backref_iter *iter)</div><div class='ctx'> 	iter-&gt;item_ptr = (u32)btrfs_item_ptr_offset(path-&gt;nodes[0],</div><div class='ctx'> 					path-&gt;slots[0]);</div><div class='ctx'> 	iter-&gt;cur_ptr = iter-&gt;item_ptr;</div><div class='del'>-	iter-&gt;end_ptr = iter-&gt;item_ptr + (u32)btrfs_item_size_nr(path-&gt;nodes[0],</div><div class='add'>+	iter-&gt;end_ptr = iter-&gt;item_ptr + (u32)btrfs_item_size(path-&gt;nodes[0],</div><div class='ctx'> 						path-&gt;slots[0]);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_backref_init_cache(struct btrfs_fs_info *fs_info,</div><div class='del'>-			      struct btrfs_backref_cache *cache, int is_reloc)</div><div class='add'>+			      struct btrfs_backref_cache *cache, bool is_reloc)</div><div class='ctx'> {</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='ctx'> 	cache-&gt;rb_root = RB_ROOT;</div><div class='ctx'> 	for (i = 0; i &lt; BTRFS_MAX_LEVEL; i++)</div><div class='ctx'> 		INIT_LIST_HEAD(&amp;cache-&gt;pending[i]);</div><div class='del'>-	INIT_LIST_HEAD(&amp;cache-&gt;changed);</div><div class='del'>-	INIT_LIST_HEAD(&amp;cache-&gt;detached);</div><div class='del'>-	INIT_LIST_HEAD(&amp;cache-&gt;leaves);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;cache-&gt;pending_edge);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;cache-&gt;useless_node);</div><div class='ctx'> 	cache-&gt;fs_info = fs_info;</div><div class='hunk'>@@ -2512,6 +3039,19 @@ struct btrfs_backref_node *btrfs_backref_alloc_node(</div><div class='ctx'> 	return node;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void btrfs_backref_free_node(struct btrfs_backref_cache *cache,</div><div class='add'>+			     struct btrfs_backref_node *node)</div><div class='add'>+{</div><div class='add'>+	if (node) {</div><div class='add'>+		ASSERT(list_empty(&amp;node-&gt;list));</div><div class='add'>+		ASSERT(list_empty(&amp;node-&gt;lower));</div><div class='add'>+		ASSERT(node-&gt;eb == NULL);</div><div class='add'>+		cache-&gt;nr_nodes--;</div><div class='add'>+		btrfs_put_root(node-&gt;root);</div><div class='add'>+		kfree(node);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> struct btrfs_backref_edge *btrfs_backref_alloc_edge(</div><div class='ctx'> 		struct btrfs_backref_cache *cache)</div><div class='ctx'> {</div><div class='hunk'>@@ -2523,6 +3063,52 @@ struct btrfs_backref_edge *btrfs_backref_alloc_edge(</div><div class='ctx'> 	return edge;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void btrfs_backref_free_edge(struct btrfs_backref_cache *cache,</div><div class='add'>+			     struct btrfs_backref_edge *edge)</div><div class='add'>+{</div><div class='add'>+	if (edge) {</div><div class='add'>+		cache-&gt;nr_edges--;</div><div class='add'>+		kfree(edge);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_backref_unlock_node_buffer(struct btrfs_backref_node *node)</div><div class='add'>+{</div><div class='add'>+	if (node-&gt;locked) {</div><div class='add'>+		btrfs_tree_unlock(node-&gt;eb);</div><div class='add'>+		node-&gt;locked = 0;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_backref_drop_node_buffer(struct btrfs_backref_node *node)</div><div class='add'>+{</div><div class='add'>+	if (node-&gt;eb) {</div><div class='add'>+		btrfs_backref_unlock_node_buffer(node);</div><div class='add'>+		free_extent_buffer(node-&gt;eb);</div><div class='add'>+		node-&gt;eb = NULL;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Drop the backref node from cache without cleaning up its children</div><div class='add'>+ * edges.</div><div class='add'>+ *</div><div class='add'>+ * This can only be called on node without parent edges.</div><div class='add'>+ * The children edges are still kept as is.</div><div class='add'>+ */</div><div class='add'>+void btrfs_backref_drop_node(struct btrfs_backref_cache *tree,</div><div class='add'>+			     struct btrfs_backref_node *node)</div><div class='add'>+{</div><div class='add'>+	ASSERT(list_empty(&amp;node-&gt;upper));</div><div class='add'>+</div><div class='add'>+	btrfs_backref_drop_node_buffer(node);</div><div class='add'>+	list_del_init(&amp;node-&gt;list);</div><div class='add'>+	list_del_init(&amp;node-&gt;lower);</div><div class='add'>+	if (!RB_EMPTY_NODE(&amp;node-&gt;rb_node))</div><div class='add'>+		rb_erase(&amp;node-&gt;rb_node, &amp;tree-&gt;rb_root);</div><div class='add'>+	btrfs_backref_free_node(tree, node);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Drop the backref node from cache, also cleaning up all its</div><div class='ctx'>  * upper edges and any uncached nodes in the path.</div><div class='hunk'>@@ -2533,29 +3119,17 @@ struct btrfs_backref_edge *btrfs_backref_alloc_edge(</div><div class='ctx'> void btrfs_backref_cleanup_node(struct btrfs_backref_cache *cache,</div><div class='ctx'> 				struct btrfs_backref_node *node)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_backref_node *upper;</div><div class='ctx'> 	struct btrfs_backref_edge *edge;</div><div class='ctx'> </div><div class='ctx'> 	if (!node)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(!node-&gt;lowest &amp;&amp; !node-&gt;detached);</div><div class='ctx'> 	while (!list_empty(&amp;node-&gt;upper)) {</div><div class='del'>-		edge = list_entry(node-&gt;upper.next, struct btrfs_backref_edge,</div><div class='del'>-				  list[LOWER]);</div><div class='del'>-		upper = edge-&gt;node[UPPER];</div><div class='add'>+		edge = list_first_entry(&amp;node-&gt;upper, struct btrfs_backref_edge,</div><div class='add'>+					list[LOWER]);</div><div class='ctx'> 		list_del(&amp;edge-&gt;list[LOWER]);</div><div class='ctx'> 		list_del(&amp;edge-&gt;list[UPPER]);</div><div class='ctx'> 		btrfs_backref_free_edge(cache, edge);</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Add the node to leaf node list if no other child block</div><div class='del'>-		 * cached.</div><div class='del'>-		 */</div><div class='del'>-		if (list_empty(&amp;upper-&gt;lower)) {</div><div class='del'>-			list_add_tail(&amp;upper-&gt;lower, &amp;cache-&gt;leaves);</div><div class='del'>-			upper-&gt;lowest = 1;</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	btrfs_backref_drop_node(cache, node);</div><div class='hunk'>@@ -2567,33 +3141,26 @@ void btrfs_backref_cleanup_node(struct btrfs_backref_cache *cache,</div><div class='ctx'> void btrfs_backref_release_cache(struct btrfs_backref_cache *cache)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_backref_node *node;</div><div class='del'>-	int i;</div><div class='ctx'> </div><div class='del'>-	while (!list_empty(&amp;cache-&gt;detached)) {</div><div class='del'>-		node = list_entry(cache-&gt;detached.next,</div><div class='del'>-				  struct btrfs_backref_node, list);</div><div class='add'>+	while ((node = rb_entry_safe(rb_first(&amp;cache-&gt;rb_root),</div><div class='add'>+				     struct btrfs_backref_node, rb_node)))</div><div class='ctx'> 		btrfs_backref_cleanup_node(cache, node);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	while (!list_empty(&amp;cache-&gt;leaves)) {</div><div class='del'>-		node = list_entry(cache-&gt;leaves.next,</div><div class='del'>-				  struct btrfs_backref_node, lower);</div><div class='del'>-		btrfs_backref_cleanup_node(cache, node);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	cache-&gt;last_trans = 0;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; BTRFS_MAX_LEVEL; i++)</div><div class='del'>-		ASSERT(list_empty(&amp;cache-&gt;pending[i]));</div><div class='ctx'> 	ASSERT(list_empty(&amp;cache-&gt;pending_edge));</div><div class='ctx'> 	ASSERT(list_empty(&amp;cache-&gt;useless_node));</div><div class='del'>-	ASSERT(list_empty(&amp;cache-&gt;changed));</div><div class='del'>-	ASSERT(list_empty(&amp;cache-&gt;detached));</div><div class='del'>-	ASSERT(RB_EMPTY_ROOT(&amp;cache-&gt;rb_root));</div><div class='ctx'> 	ASSERT(!cache-&gt;nr_nodes);</div><div class='ctx'> 	ASSERT(!cache-&gt;nr_edges);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void btrfs_backref_link_edge(struct btrfs_backref_edge *edge,</div><div class='add'>+				    struct btrfs_backref_node *lower,</div><div class='add'>+				    struct btrfs_backref_node *upper)</div><div class='add'>+{</div><div class='add'>+	ASSERT(upper &amp;&amp; lower &amp;&amp; upper-&gt;level == lower-&gt;level + 1);</div><div class='add'>+	edge-&gt;node[LOWER] = lower;</div><div class='add'>+	edge-&gt;node[UPPER] = upper;</div><div class='add'>+	list_add_tail(&amp;edge-&gt;list[LOWER], &amp;lower-&gt;upper);</div><div class='add'>+}</div><div class='ctx'> /*</div><div class='ctx'>  * Handle direct tree backref</div><div class='ctx'>  *</div><div class='hunk'>@@ -2662,7 +3229,7 @@ static int handle_direct_tree_backref(struct btrfs_backref_cache *cache,</div><div class='ctx'> 		ASSERT(upper-&gt;checked);</div><div class='ctx'> 		INIT_LIST_HEAD(&amp;edge-&gt;list[UPPER]);</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_backref_link_edge(edge, cur, upper, LINK_LOWER);</div><div class='add'>+	btrfs_backref_link_edge(edge, cur, upper);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2673,12 +3240,14 @@ static int handle_direct_tree_backref(struct btrfs_backref_cache *cache,</div><div class='ctx'>  * We still need to do a tree search to find out the parents. This is for</div><div class='ctx'>  * TREE_BLOCK_REF backref (keyed or inlined).</div><div class='ctx'>  *</div><div class='add'>+ * @trans:	Transaction handle.</div><div class='ctx'>  * @ref_key:	The same as @ref_key in  handle_direct_tree_backref()</div><div class='ctx'>  * @tree_key:	The first key of this tree block.</div><div class='ctx'>  * @path:	A clean (released) path, to avoid allocating path every time</div><div class='ctx'>  *		the function get called.</div><div class='ctx'>  */</div><div class='del'>-static int handle_indirect_tree_backref(struct btrfs_backref_cache *cache,</div><div class='add'>+static int handle_indirect_tree_backref(struct btrfs_trans_handle *trans,</div><div class='add'>+					struct btrfs_backref_cache *cache,</div><div class='ctx'> 					struct btrfs_path *path,</div><div class='ctx'> 					struct btrfs_key *ref_key,</div><div class='ctx'> 					struct btrfs_key *tree_key,</div><div class='hunk'>@@ -2698,8 +3267,12 @@ static int handle_indirect_tree_backref(struct btrfs_backref_cache *cache,</div><div class='ctx'> 	root = btrfs_get_fs_root(fs_info, ref_key-&gt;offset, false);</div><div class='ctx'> 	if (IS_ERR(root))</div><div class='ctx'> 		return PTR_ERR(root);</div><div class='del'>-	if (!test_bit(BTRFS_ROOT_SHAREABLE, &amp;root-&gt;state))</div><div class='del'>-		cur-&gt;cowonly = 1;</div><div class='add'>+</div><div class='add'>+	/* We shouldn't be using backref cache for non-shareable roots. */</div><div class='add'>+	if (unlikely(!test_bit(BTRFS_ROOT_SHAREABLE, &amp;root-&gt;state))) {</div><div class='add'>+		btrfs_put_root(root);</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (btrfs_root_level(&amp;root-&gt;root_item) == cur-&gt;level) {</div><div class='ctx'> 		/* Tree root */</div><div class='hunk'>@@ -2726,8 +3299,8 @@ static int handle_indirect_tree_backref(struct btrfs_backref_cache *cache,</div><div class='ctx'> 	level = cur-&gt;level + 1;</div><div class='ctx'> </div><div class='ctx'> 	/* Search the tree to find parent blocks referring to the block */</div><div class='del'>-	path-&gt;search_commit_root = 1;</div><div class='del'>-	path-&gt;skip_locking = 1;</div><div class='add'>+	path-&gt;search_commit_root = true;</div><div class='add'>+	path-&gt;skip_locking = true;</div><div class='ctx'> 	path-&gt;lowest_level = level;</div><div class='ctx'> 	ret = btrfs_search_slot(NULL, root, tree_key, path, 0, 0);</div><div class='ctx'> 	path-&gt;lowest_level = 0;</div><div class='hunk'>@@ -2741,9 +3314,9 @@ static int handle_indirect_tree_backref(struct btrfs_backref_cache *cache,</div><div class='ctx'> 	eb = path-&gt;nodes[level];</div><div class='ctx'> 	if (btrfs_node_blockptr(eb, path-&gt;slots[level]) != cur-&gt;bytenr) {</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='del'>-"couldn't find block (%llu) (level %d) in tree (%llu) with key (%llu %u %llu)",</div><div class='del'>-			  cur-&gt;bytenr, level - 1, root-&gt;root_key.objectid,</div><div class='del'>-			  tree_key-&gt;objectid, tree_key-&gt;type, tree_key-&gt;offset);</div><div class='add'>+"couldn't find block (%llu) (level %d) in tree (%llu) with key " BTRFS_KEY_FMT,</div><div class='add'>+			  cur-&gt;bytenr, level - 1, btrfs_root_id(root),</div><div class='add'>+			  BTRFS_KEY_FMT_VALUE(tree_key));</div><div class='ctx'> 		btrfs_put_root(root);</div><div class='ctx'> 		ret = -ENOENT;</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -2785,14 +3358,21 @@ static int handle_indirect_tree_backref(struct btrfs_backref_cache *cache,</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='ctx'> 			upper-&gt;owner = btrfs_header_owner(eb);</div><div class='del'>-			if (!test_bit(BTRFS_ROOT_SHAREABLE, &amp;root-&gt;state))</div><div class='del'>-				upper-&gt;cowonly = 1;</div><div class='add'>+</div><div class='add'>+			/* We shouldn't be using backref cache for non shareable roots. */</div><div class='add'>+			if (unlikely(!test_bit(BTRFS_ROOT_SHAREABLE, &amp;root-&gt;state))) {</div><div class='add'>+				btrfs_put_root(root);</div><div class='add'>+				btrfs_backref_free_edge(cache, edge);</div><div class='add'>+				btrfs_backref_free_node(cache, upper);</div><div class='add'>+				ret = -EUCLEAN;</div><div class='add'>+				goto out;</div><div class='add'>+			}</div><div class='ctx'> </div><div class='ctx'> 			/*</div><div class='ctx'> 			 * If we know the block isn't shared we can avoid</div><div class='ctx'> 			 * checking its backrefs.</div><div class='ctx'> 			 */</div><div class='del'>-			if (btrfs_block_can_be_shared(root, eb))</div><div class='add'>+			if (btrfs_block_can_be_shared(trans, root, eb))</div><div class='ctx'> 				upper-&gt;checked = 0;</div><div class='ctx'> 			else</div><div class='ctx'> 				upper-&gt;checked = 1;</div><div class='hunk'>@@ -2819,7 +3399,7 @@ static int handle_indirect_tree_backref(struct btrfs_backref_cache *cache,</div><div class='ctx'> 			if (!upper-&gt;owner)</div><div class='ctx'> 				upper-&gt;owner = btrfs_header_owner(eb);</div><div class='ctx'> 		}</div><div class='del'>-		btrfs_backref_link_edge(edge, lower, upper, LINK_LOWER);</div><div class='add'>+		btrfs_backref_link_edge(edge, lower, upper);</div><div class='ctx'> </div><div class='ctx'> 		if (rb_node) {</div><div class='ctx'> 			btrfs_put_root(root);</div><div class='hunk'>@@ -2840,17 +3420,18 @@ out:</div><div class='ctx'>  *	 links aren't yet bi-directional. Needs to finish such links.</div><div class='ctx'>  *	 Use btrfs_backref_finish_upper_links() to finish such linkage.</div><div class='ctx'>  *</div><div class='add'>+ * @trans:	Transaction handle.</div><div class='ctx'>  * @path:	Released path for indirect tree backref lookup</div><div class='ctx'>  * @iter:	Released backref iter for extent tree search</div><div class='ctx'>  * @node_key:	The first key of the tree block</div><div class='ctx'>  */</div><div class='del'>-int btrfs_backref_add_tree_node(struct btrfs_backref_cache *cache,</div><div class='add'>+int btrfs_backref_add_tree_node(struct btrfs_trans_handle *trans,</div><div class='add'>+				struct btrfs_backref_cache *cache,</div><div class='ctx'> 				struct btrfs_path *path,</div><div class='ctx'> 				struct btrfs_backref_iter *iter,</div><div class='ctx'> 				struct btrfs_key *node_key,</div><div class='ctx'> 				struct btrfs_backref_node *cur)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = cache-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_backref_edge *edge;</div><div class='ctx'> 	struct btrfs_backref_node *exist;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -2867,7 +3448,7 @@ int btrfs_backref_add_tree_node(struct btrfs_backref_cache *cache,</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		/* No extra backref? This means the tree block is corrupted */</div><div class='del'>-		if (ret &gt; 0) {</div><div class='add'>+		if (unlikely(ret &gt; 0)) {</div><div class='ctx'> 			ret = -EUCLEAN;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2879,8 +3460,8 @@ int btrfs_backref_add_tree_node(struct btrfs_backref_cache *cache,</div><div class='ctx'> 		 * type BTRFS_TREE_BLOCK_REF_KEY</div><div class='ctx'> 		 */</div><div class='ctx'> 		ASSERT(list_is_singular(&amp;cur-&gt;upper));</div><div class='del'>-		edge = list_entry(cur-&gt;upper.next, struct btrfs_backref_edge,</div><div class='del'>-				  list[LOWER]);</div><div class='add'>+		edge = list_first_entry(&amp;cur-&gt;upper, struct btrfs_backref_edge,</div><div class='add'>+					list[LOWER]);</div><div class='ctx'> 		ASSERT(list_empty(&amp;edge-&gt;list[UPPER]));</div><div class='ctx'> 		exist = edge-&gt;node[UPPER];</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -2899,7 +3480,7 @@ int btrfs_backref_add_tree_node(struct btrfs_backref_cache *cache,</div><div class='ctx'> 		int type;</div><div class='ctx'> </div><div class='ctx'> 		cond_resched();</div><div class='del'>-		eb = btrfs_backref_get_eb(iter);</div><div class='add'>+		eb = iter-&gt;path-&gt;nodes[0];</div><div class='ctx'> </div><div class='ctx'> 		key.objectid = iter-&gt;bytenr;</div><div class='ctx'> 		if (btrfs_backref_iter_is_inline_ref(iter)) {</div><div class='hunk'>@@ -2910,7 +3491,7 @@ int btrfs_backref_add_tree_node(struct btrfs_backref_cache *cache,</div><div class='ctx'> 				((unsigned long)iter-&gt;cur_ptr);</div><div class='ctx'> 			type = btrfs_get_extent_inline_ref_type(eb, iref,</div><div class='ctx'> 							BTRFS_REF_TYPE_BLOCK);</div><div class='del'>-			if (type == BTRFS_REF_TYPE_INVALID) {</div><div class='add'>+			if (unlikely(type == BTRFS_REF_TYPE_INVALID)) {</div><div class='ctx'> 				ret = -EUCLEAN;</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -2939,25 +3520,21 @@ int btrfs_backref_add_tree_node(struct btrfs_backref_cache *cache,</div><div class='ctx'> 			ret = handle_direct_tree_backref(cache, &amp;key, cur);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='ctx'> 				goto out;</div><div class='del'>-			continue;</div><div class='del'>-		} else if (unlikely(key.type == BTRFS_EXTENT_REF_V0_KEY)) {</div><div class='del'>-			ret = -EINVAL;</div><div class='del'>-			btrfs_print_v0_err(fs_info);</div><div class='del'>-			btrfs_handle_fs_error(fs_info, ret, NULL);</div><div class='del'>-			goto out;</div><div class='del'>-		} else if (key.type != BTRFS_TREE_BLOCK_REF_KEY) {</div><div class='del'>-			continue;</div><div class='add'>+		} else if (key.type == BTRFS_TREE_BLOCK_REF_KEY) {</div><div class='add'>+			/*</div><div class='add'>+			 * key.type == BTRFS_TREE_BLOCK_REF_KEY, inline ref</div><div class='add'>+			 * offset means the root objectid. We need to search</div><div class='add'>+			 * the tree to get its parent bytenr.</div><div class='add'>+			 */</div><div class='add'>+			ret = handle_indirect_tree_backref(trans, cache, path,</div><div class='add'>+							   &amp;key, node_key, cur);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				goto out;</div><div class='ctx'> 		}</div><div class='del'>-</div><div class='ctx'> 		/*</div><div class='del'>-		 * key.type == BTRFS_TREE_BLOCK_REF_KEY, inline ref offset</div><div class='del'>-		 * means the root objectid. We need to search the tree to get</div><div class='del'>-		 * its parent bytenr.</div><div class='add'>+		 * Unrecognized tree backref items (if it can pass tree-checker)</div><div class='add'>+		 * would be ignored.</div><div class='ctx'> 		 */</div><div class='del'>-		ret = handle_indirect_tree_backref(cache, path, &amp;key, node_key,</div><div class='del'>-						   cur);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	ret = 0;</div><div class='ctx'> 	cur-&gt;checked = 1;</div><div class='hunk'>@@ -2980,15 +3557,9 @@ int btrfs_backref_finish_upper_links(struct btrfs_backref_cache *cache,</div><div class='ctx'> </div><div class='ctx'> 	ASSERT(start-&gt;checked);</div><div class='ctx'> </div><div class='del'>-	/* Insert this node to cache if it's not COW-only */</div><div class='del'>-	if (!start-&gt;cowonly) {</div><div class='del'>-		rb_node = rb_simple_insert(&amp;cache-&gt;rb_root, start-&gt;bytenr,</div><div class='del'>-					   &amp;start-&gt;rb_node);</div><div class='del'>-		if (rb_node)</div><div class='del'>-			btrfs_backref_panic(cache-&gt;fs_info, start-&gt;bytenr,</div><div class='del'>-					    -EEXIST);</div><div class='del'>-		list_add_tail(&amp;start-&gt;lower, &amp;cache-&gt;leaves);</div><div class='del'>-	}</div><div class='add'>+	rb_node = rb_simple_insert(&amp;cache-&gt;rb_root, &amp;start-&gt;simple_node);</div><div class='add'>+	if (rb_node)</div><div class='add'>+		btrfs_backref_panic(cache-&gt;fs_info, start-&gt;bytenr, -EEXIST);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Use breadth first search to iterate all related edges.</div><div class='hunk'>@@ -3027,38 +3598,22 @@ int btrfs_backref_finish_upper_links(struct btrfs_backref_cache *cache,</div><div class='ctx'> 		 * parents have already been linked.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (!RB_EMPTY_NODE(&amp;upper-&gt;rb_node)) {</div><div class='del'>-			if (upper-&gt;lowest) {</div><div class='del'>-				list_del_init(&amp;upper-&gt;lower);</div><div class='del'>-				upper-&gt;lowest = 0;</div><div class='del'>-			}</div><div class='del'>-</div><div class='ctx'> 			list_add_tail(&amp;edge-&gt;list[UPPER], &amp;upper-&gt;lower);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* Sanity check, we shouldn't have any unchecked nodes */</div><div class='del'>-		if (!upper-&gt;checked) {</div><div class='del'>-			ASSERT(0);</div><div class='add'>+		if (unlikely(!upper-&gt;checked)) {</div><div class='add'>+			DEBUG_WARN("we should not have any unchecked nodes");</div><div class='ctx'> 			return -EUCLEAN;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		/* Sanity check, COW-only node has non-COW-only parent */</div><div class='del'>-		if (start-&gt;cowonly != upper-&gt;cowonly) {</div><div class='del'>-			ASSERT(0);</div><div class='add'>+		rb_node = rb_simple_insert(&amp;cache-&gt;rb_root, &amp;upper-&gt;simple_node);</div><div class='add'>+		if (unlikely(rb_node)) {</div><div class='add'>+			btrfs_backref_panic(cache-&gt;fs_info, upper-&gt;bytenr, -EEXIST);</div><div class='ctx'> 			return -EUCLEAN;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		/* Only cache non-COW-only (subvolume trees) tree blocks */</div><div class='del'>-		if (!upper-&gt;cowonly) {</div><div class='del'>-			rb_node = rb_simple_insert(&amp;cache-&gt;rb_root, upper-&gt;bytenr,</div><div class='del'>-						   &amp;upper-&gt;rb_node);</div><div class='del'>-			if (rb_node) {</div><div class='del'>-				btrfs_backref_panic(cache-&gt;fs_info,</div><div class='del'>-						upper-&gt;bytenr, -EEXIST);</div><div class='del'>-				return -EUCLEAN;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='ctx'> 		list_add_tail(&amp;edge-&gt;list[UPPER], &amp;upper-&gt;lower);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='head'>diff --git a/fs/btrfs/backref.h b/fs/btrfs/backref.h<br/>index ba454032dbe2..1d009b0f4c69 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/backref.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/backref.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/backref.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/backref.h</a></div><div class='hunk'>@@ -6,10 +6,146 @@</div><div class='ctx'> #ifndef BTRFS_BACKREF_H</div><div class='ctx'> #define BTRFS_BACKREF_H</div><div class='ctx'> </div><div class='del'>-#include &lt;linux/btrfs.h&gt;</div><div class='del'>-#include "ulist.h"</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+#include &lt;linux/rbtree.h&gt;</div><div class='add'>+#include &lt;linux/list.h&gt;</div><div class='add'>+#include &lt;linux/slab.h&gt;</div><div class='add'>+#include &lt;uapi/linux/btrfs.h&gt;</div><div class='add'>+#include &lt;uapi/linux/btrfs_tree.h&gt;</div><div class='add'>+#include "messages.h"</div><div class='add'>+#include "locking.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='ctx'> #include "extent_io.h"</div><div class='add'>+#include "ctree.h"</div><div class='add'>+</div><div class='add'>+struct extent_inode_elem;</div><div class='add'>+struct ulist;</div><div class='add'>+struct btrfs_extent_item;</div><div class='add'>+struct btrfs_trans_handle;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Used by implementations of iterate_extent_inodes_t (see definition below) to</div><div class='add'>+ * signal that backref iteration can stop immediately and no error happened.</div><div class='add'>+ * The value must be non-negative and must not be 0, 1 (which is a common return</div><div class='add'>+ * value from things like btrfs_search_slot() and used internally in the backref</div><div class='add'>+ * walking code) and different from BACKREF_FOUND_SHARED and</div><div class='add'>+ * BACKREF_FOUND_NOT_SHARED</div><div class='add'>+ */</div><div class='add'>+#define BTRFS_ITERATE_EXTENT_INODES_STOP 5</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Should return 0 if no errors happened and iteration of backrefs should</div><div class='add'>+ * continue. Can return BTRFS_ITERATE_EXTENT_INODES_STOP or any other non-zero</div><div class='add'>+ * value to immediately stop iteration and possibly signal an error back to</div><div class='add'>+ * the caller.</div><div class='add'>+ */</div><div class='add'>+typedef int (iterate_extent_inodes_t)(u64 inum, u64 offset, u64 num_bytes,</div><div class='add'>+				      u64 root, void *ctx);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Context and arguments for backref walking functions. Some of the fields are</div><div class='add'>+ * to be filled by the caller of such functions while other are filled by the</div><div class='add'>+ * functions themselves, as described below.</div><div class='add'>+ */</div><div class='add'>+struct btrfs_backref_walk_ctx {</div><div class='add'>+	/*</div><div class='add'>+	 * The address of the extent for which we are doing backref walking.</div><div class='add'>+	 * Can be either a data extent or a metadata extent.</div><div class='add'>+	 *</div><div class='add'>+	 * Must always be set by the top level caller.</div><div class='add'>+	 */</div><div class='add'>+	u64 bytenr;</div><div class='add'>+	/*</div><div class='add'>+	 * Offset relative to the target extent. This is only used for data</div><div class='add'>+	 * extents, and it's meaningful because we can have file extent items</div><div class='add'>+	 * that point only to a section of a data extent ("bookend" extents),</div><div class='add'>+	 * and we want to filter out any that don't point to a section of the</div><div class='add'>+	 * data extent containing the given offset.</div><div class='add'>+	 *</div><div class='add'>+	 * Must always be set by the top level caller.</div><div class='add'>+	 */</div><div class='add'>+	u64 extent_item_pos;</div><div class='add'>+	/*</div><div class='add'>+	 * If true and bytenr corresponds to a data extent, then references from</div><div class='add'>+	 * all file extent items that point to the data extent are considered,</div><div class='add'>+	 * @extent_item_pos is ignored.</div><div class='add'>+	 */</div><div class='add'>+	bool ignore_extent_item_pos;</div><div class='add'>+	/*</div><div class='add'>+	 * If true and bytenr corresponds to a data extent, then the inode list</div><div class='add'>+	 * (each member describing inode number, file offset and root) is not</div><div class='add'>+	 * added to each reference added to the @refs ulist.</div><div class='add'>+	 */</div><div class='add'>+	bool skip_inode_ref_list;</div><div class='add'>+	/* A valid transaction handle or NULL. */</div><div class='add'>+	struct btrfs_trans_handle *trans;</div><div class='add'>+	/*</div><div class='add'>+	 * The file system's info object, can not be NULL.</div><div class='add'>+	 *</div><div class='add'>+	 * Must always be set by the top level caller.</div><div class='add'>+	 */</div><div class='add'>+	struct btrfs_fs_info *fs_info;</div><div class='add'>+	/*</div><div class='add'>+	 * Time sequence acquired from btrfs_get_tree_mod_seq(), in case the</div><div class='add'>+	 * caller joined the tree mod log to get a consistent view of b+trees</div><div class='add'>+	 * while we do backref walking, or BTRFS_SEQ_LAST.</div><div class='add'>+	 * When using BTRFS_SEQ_LAST, delayed refs are not checked and it uses</div><div class='add'>+	 * commit roots when searching b+trees - this is a special case for</div><div class='add'>+	 * qgroups used during a transaction commit.</div><div class='add'>+	 */</div><div class='add'>+	u64 time_seq;</div><div class='add'>+	/*</div><div class='add'>+	 * Used to collect the bytenr of metadata extents that point to the</div><div class='add'>+	 * target extent.</div><div class='add'>+	 */</div><div class='add'>+	struct ulist *refs;</div><div class='add'>+	/*</div><div class='add'>+	 * List used to collect the IDs of the roots from which the target</div><div class='add'>+	 * extent is accessible. Can be NULL in case the caller does not care</div><div class='add'>+	 * about collecting root IDs.</div><div class='add'>+	 */</div><div class='add'>+	struct ulist *roots;</div><div class='add'>+	/*</div><div class='add'>+	 * Used by iterate_extent_inodes() and the main backref walk code</div><div class='add'>+	 * (find_parent_nodes()). Lookup and store functions for an optional</div><div class='add'>+	 * cache which maps the logical address (bytenr) of leaves to an array</div><div class='add'>+	 * of root IDs.</div><div class='add'>+	 */</div><div class='add'>+	bool (*cache_lookup)(u64 leaf_bytenr, void *user_ctx,</div><div class='add'>+			     const u64 **root_ids_ret, int *root_count_ret);</div><div class='add'>+	void (*cache_store)(u64 leaf_bytenr, const struct ulist *root_ids,</div><div class='add'>+			    void *user_ctx);</div><div class='add'>+	/*</div><div class='add'>+	 * If this is not NULL, then the backref walking code will call this</div><div class='add'>+	 * for each indirect data extent reference as soon as it finds one,</div><div class='add'>+	 * before collecting all the remaining backrefs and before resolving</div><div class='add'>+	 * indirect backrefs. This allows for the caller to terminate backref</div><div class='add'>+	 * walking as soon as it finds one backref that matches some specific</div><div class='add'>+	 * criteria. The @cache_lookup and @cache_store callbacks should not</div><div class='add'>+	 * be NULL in order to use this callback.</div><div class='add'>+	 */</div><div class='add'>+	iterate_extent_inodes_t *indirect_ref_iterator;</div><div class='add'>+	/*</div><div class='add'>+	 * If this is not NULL, then the backref walking code will call this for</div><div class='add'>+	 * each extent item it's meant to process before it actually starts</div><div class='add'>+	 * processing it. If this returns anything other than 0, then it stops</div><div class='add'>+	 * the backref walking code immediately.</div><div class='add'>+	 */</div><div class='add'>+	int (*check_extent_item)(u64 bytenr, const struct btrfs_extent_item *ei,</div><div class='add'>+				 const struct extent_buffer *leaf, void *user_ctx);</div><div class='add'>+	/*</div><div class='add'>+	 * If this is not NULL, then the backref walking code will call this for</div><div class='add'>+	 * each extent data ref it finds (BTRFS_EXTENT_DATA_REF_KEY keys) before</div><div class='add'>+	 * processing that data ref. If this callback return false, then it will</div><div class='add'>+	 * ignore this data ref and it will never resolve the indirect data ref,</div><div class='add'>+	 * saving time searching for leaves in a fs tree with file extent items</div><div class='add'>+	 * matching the data ref.</div><div class='add'>+	 */</div><div class='add'>+	bool (*skip_data_ref)(u64 root, u64 ino, u64 offset, void *user_ctx);</div><div class='add'>+	/* Context object to pass to the callbacks defined above. */</div><div class='add'>+	void *user_ctx;</div><div class='add'>+};</div><div class='ctx'> </div><div class='ctx'> struct inode_fs_paths {</div><div class='ctx'> 	struct btrfs_path		*btrfs_path;</div><div class='hunk'>@@ -17,8 +153,65 @@ struct inode_fs_paths {</div><div class='ctx'> 	struct btrfs_data_container	*fspath;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-typedef int (iterate_extent_inodes_t)(u64 inum, u64 offset, u64 root,</div><div class='del'>-		void *ctx);</div><div class='add'>+struct btrfs_backref_shared_cache_entry {</div><div class='add'>+	u64 bytenr;</div><div class='add'>+	u64 gen;</div><div class='add'>+	bool is_shared;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+#define BTRFS_BACKREF_CTX_PREV_EXTENTS_SIZE 8</div><div class='add'>+</div><div class='add'>+struct btrfs_backref_share_check_ctx {</div><div class='add'>+	/* Ulists used during backref walking. */</div><div class='add'>+	struct ulist refs;</div><div class='add'>+	/*</div><div class='add'>+	 * The current leaf the caller of btrfs_is_data_extent_shared() is at.</div><div class='add'>+	 * Typically the caller (at the moment only fiemap) tries to determine</div><div class='add'>+	 * the sharedness of data extents point by file extent items from entire</div><div class='add'>+	 * leaves.</div><div class='add'>+	 */</div><div class='add'>+	u64 curr_leaf_bytenr;</div><div class='add'>+	/*</div><div class='add'>+	 * The previous leaf the caller was at in the previous call to</div><div class='add'>+	 * btrfs_is_data_extent_shared(). This may be the same as the current</div><div class='add'>+	 * leaf. On the first call it must be 0.</div><div class='add'>+	 */</div><div class='add'>+	u64 prev_leaf_bytenr;</div><div class='add'>+	/*</div><div class='add'>+	 * A path from a root to a leaf that has a file extent item pointing to</div><div class='add'>+	 * a given data extent should never exceed the maximum b+tree height.</div><div class='add'>+	 */</div><div class='add'>+	struct btrfs_backref_shared_cache_entry path_cache_entries[BTRFS_MAX_LEVEL];</div><div class='add'>+	bool use_path_cache;</div><div class='add'>+	/*</div><div class='add'>+	 * Cache the sharedness result for the last few extents we have found,</div><div class='add'>+	 * but only for extents for which we have multiple file extent items</div><div class='add'>+	 * that point to them.</div><div class='add'>+	 * It's very common to have several file extent items that point to the</div><div class='add'>+	 * same extent (bytenr) but with different offsets and lengths. This</div><div class='add'>+	 * typically happens for COW writes, partial writes into prealloc</div><div class='add'>+	 * extents, NOCOW writes after snapshotting a root, hole punching or</div><div class='add'>+	 * reflinking within the same file (less common perhaps).</div><div class='add'>+	 * So keep a small cache with the lookup results for the extent pointed</div><div class='add'>+	 * by the last few file extent items. This cache is checked, with a</div><div class='add'>+	 * linear scan, whenever btrfs_is_data_extent_shared() is called, so</div><div class='add'>+	 * it must be small so that it does not negatively affect performance in</div><div class='add'>+	 * case we don't have multiple file extent items that point to the same</div><div class='add'>+	 * data extent.</div><div class='add'>+	 */</div><div class='add'>+	struct {</div><div class='add'>+		u64 bytenr;</div><div class='add'>+		bool is_shared;</div><div class='add'>+	} prev_extents_cache[BTRFS_BACKREF_CTX_PREV_EXTENTS_SIZE];</div><div class='add'>+	/*</div><div class='add'>+	 * The slot in the prev_extents_cache array that will be used for</div><div class='add'>+	 * storing the sharedness result of a new data extent.</div><div class='add'>+	 */</div><div class='add'>+	int prev_extents_cache_slot;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct btrfs_backref_share_check_ctx *btrfs_alloc_backref_share_check_ctx(void);</div><div class='add'>+void btrfs_free_backref_share_ctx(struct btrfs_backref_share_check_ctx *ctx);</div><div class='ctx'> </div><div class='ctx'> int extent_from_logical(struct btrfs_fs_info *fs_info, u64 logical,</div><div class='ctx'> 			struct btrfs_path *path, struct btrfs_key *found_key,</div><div class='hunk'>@@ -28,26 +221,17 @@ int tree_backref_for_extent(unsigned long *ptr, struct extent_buffer *eb,</div><div class='ctx'> 			    struct btrfs_key *key, struct btrfs_extent_item *ei,</div><div class='ctx'> 			    u32 item_size, u64 *out_root, u8 *out_level);</div><div class='ctx'> </div><div class='del'>-int iterate_extent_inodes(struct btrfs_fs_info *fs_info,</div><div class='del'>-				u64 extent_item_objectid,</div><div class='del'>-				u64 extent_offset, int search_commit_root,</div><div class='del'>-				iterate_extent_inodes_t *iterate, void *ctx,</div><div class='del'>-				bool ignore_offset);</div><div class='add'>+int iterate_extent_inodes(struct btrfs_backref_walk_ctx *ctx,</div><div class='add'>+			  bool search_commit_root,</div><div class='add'>+			  iterate_extent_inodes_t *iterate, void *user_ctx);</div><div class='ctx'> </div><div class='ctx'> int iterate_inodes_from_logical(u64 logical, struct btrfs_fs_info *fs_info,</div><div class='del'>-				struct btrfs_path *path,</div><div class='del'>-				iterate_extent_inodes_t *iterate, void *ctx,</div><div class='del'>-				bool ignore_offset);</div><div class='add'>+				void *ctx, bool ignore_offset);</div><div class='ctx'> </div><div class='ctx'> int paths_from_inode(u64 inum, struct inode_fs_paths *ipath);</div><div class='ctx'> </div><div class='del'>-int btrfs_find_all_leafs(struct btrfs_trans_handle *trans,</div><div class='del'>-			 struct btrfs_fs_info *fs_info, u64 bytenr,</div><div class='del'>-			 u64 time_seq, struct ulist **leafs,</div><div class='del'>-			 const u64 *extent_item_pos, bool ignore_offset);</div><div class='del'>-int btrfs_find_all_roots(struct btrfs_trans_handle *trans,</div><div class='del'>-			 struct btrfs_fs_info *fs_info, u64 bytenr,</div><div class='del'>-			 u64 time_seq, struct ulist **roots,</div><div class='add'>+int btrfs_find_all_leafs(struct btrfs_backref_walk_ctx *ctx);</div><div class='add'>+int btrfs_find_all_roots(struct btrfs_backref_walk_ctx *ctx,</div><div class='ctx'> 			 bool skip_commit_root_sem);</div><div class='ctx'> char *btrfs_ref_to_path(struct btrfs_root *fs_root, struct btrfs_path *path,</div><div class='ctx'> 			u32 name_len, unsigned long name_off,</div><div class='hunk'>@@ -57,14 +241,20 @@ char *btrfs_ref_to_path(struct btrfs_root *fs_root, struct btrfs_path *path,</div><div class='ctx'> struct btrfs_data_container *init_data_container(u32 total_bytes);</div><div class='ctx'> struct inode_fs_paths *init_ipath(s32 total_bytes, struct btrfs_root *fs_root,</div><div class='ctx'> 					struct btrfs_path *path);</div><div class='del'>-void free_ipath(struct inode_fs_paths *ipath);</div><div class='add'>+</div><div class='add'>+DEFINE_FREE(inode_fs_paths, struct inode_fs_paths *,</div><div class='add'>+	if (_T) {</div><div class='add'>+		kvfree(_T-&gt;fspath);</div><div class='add'>+		kfree(_T);</div><div class='add'>+	})</div><div class='ctx'> </div><div class='ctx'> int btrfs_find_one_extref(struct btrfs_root *root, u64 inode_objectid,</div><div class='ctx'> 			  u64 start_off, struct btrfs_path *path,</div><div class='ctx'> 			  struct btrfs_inode_extref **ret_extref,</div><div class='ctx'> 			  u64 *found_off);</div><div class='del'>-int btrfs_check_shared(struct btrfs_root *root, u64 inum, u64 bytenr,</div><div class='del'>-		struct ulist *roots, struct ulist *tmp_ulist);</div><div class='add'>+int btrfs_is_data_extent_shared(struct btrfs_inode *inode, u64 bytenr,</div><div class='add'>+				u64 extent_gen,</div><div class='add'>+				struct btrfs_backref_share_check_ctx *ctx);</div><div class='ctx'> </div><div class='ctx'> int __init btrfs_prelim_ref_init(void);</div><div class='ctx'> void __cold btrfs_prelim_ref_exit(void);</div><div class='hunk'>@@ -73,7 +263,7 @@ struct prelim_ref {</div><div class='ctx'> 	struct rb_node rbnode;</div><div class='ctx'> 	u64 root_id;</div><div class='ctx'> 	struct btrfs_key key_for_search;</div><div class='del'>-	int level;</div><div class='add'>+	u8 level;</div><div class='ctx'> 	int count;</div><div class='ctx'> 	struct extent_inode_elem *inode_list;</div><div class='ctx'> 	u64 parent;</div><div class='hunk'>@@ -95,24 +285,7 @@ struct btrfs_backref_iter {</div><div class='ctx'> 	u32 end_ptr;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-struct btrfs_backref_iter *btrfs_backref_iter_alloc(</div><div class='del'>-		struct btrfs_fs_info *fs_info, gfp_t gfp_flag);</div><div class='del'>-</div><div class='del'>-static inline void btrfs_backref_iter_free(struct btrfs_backref_iter *iter)</div><div class='del'>-{</div><div class='del'>-	if (!iter)</div><div class='del'>-		return;</div><div class='del'>-	btrfs_free_path(iter-&gt;path);</div><div class='del'>-	kfree(iter);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline struct extent_buffer *btrfs_backref_get_eb(</div><div class='del'>-		struct btrfs_backref_iter *iter)</div><div class='del'>-{</div><div class='del'>-	if (!iter)</div><div class='del'>-		return NULL;</div><div class='del'>-	return iter-&gt;path-&gt;nodes[0];</div><div class='del'>-}</div><div class='add'>+struct btrfs_backref_iter *btrfs_backref_iter_alloc(struct btrfs_fs_info *fs_info);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * For metadata with EXTENT_ITEM key (non-skinny) case, the first inline data</div><div class='hunk'>@@ -133,25 +306,6 @@ int btrfs_backref_iter_start(struct btrfs_backref_iter *iter, u64 bytenr);</div><div class='ctx'> </div><div class='ctx'> int btrfs_backref_iter_next(struct btrfs_backref_iter *iter);</div><div class='ctx'> </div><div class='del'>-static inline bool btrfs_backref_iter_is_inline_ref(</div><div class='del'>-		struct btrfs_backref_iter *iter)</div><div class='del'>-{</div><div class='del'>-	if (iter-&gt;cur_key.type == BTRFS_EXTENT_ITEM_KEY ||</div><div class='del'>-	    iter-&gt;cur_key.type == BTRFS_METADATA_ITEM_KEY)</div><div class='del'>-		return true;</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_backref_iter_release(struct btrfs_backref_iter *iter)</div><div class='del'>-{</div><div class='del'>-	iter-&gt;bytenr = 0;</div><div class='del'>-	iter-&gt;item_ptr = 0;</div><div class='del'>-	iter-&gt;cur_ptr = 0;</div><div class='del'>-	iter-&gt;end_ptr = 0;</div><div class='del'>-	btrfs_release_path(iter-&gt;path);</div><div class='del'>-	memset(&amp;iter-&gt;cur_key, 0, sizeof(iter-&gt;cur_key));</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Backref cache related structures</div><div class='ctx'>  *</div><div class='hunk'>@@ -163,11 +317,22 @@ static inline void btrfs_backref_iter_release(struct btrfs_backref_iter *iter)</div><div class='ctx'>  * Represent a tree block in the backref cache</div><div class='ctx'>  */</div><div class='ctx'> struct btrfs_backref_node {</div><div class='del'>-	struct {</div><div class='del'>-		struct rb_node rb_node;</div><div class='del'>-		u64 bytenr;</div><div class='del'>-	}; /* Use rb_simple_node for search/insert */</div><div class='add'>+	union{</div><div class='add'>+		/* Use rb_simple_node for search/insert */</div><div class='add'>+		struct {</div><div class='add'>+			struct rb_node rb_node;</div><div class='add'>+			u64 bytenr;</div><div class='add'>+		};</div><div class='ctx'> </div><div class='add'>+		struct rb_simple_node simple_node;</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This is a sanity check, whenever we COW a block we will update</div><div class='add'>+	 * new_bytenr with it's current location, and we will check this in</div><div class='add'>+	 * various places to validate that the cache makes sense, it shouldn't</div><div class='add'>+	 * be used for anything else.</div><div class='add'>+	 */</div><div class='ctx'> 	u64 new_bytenr;</div><div class='ctx'> 	/* Objectid of tree block owner, can be not uptodate */</div><div class='ctx'> 	u64 owner;</div><div class='hunk'>@@ -185,10 +350,6 @@ struct btrfs_backref_node {</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='ctx'> 	/* Level of the tree block */</div><div class='ctx'> 	unsigned int level:8;</div><div class='del'>-	/* Is the block in a non-shareable tree */</div><div class='del'>-	unsigned int cowonly:1;</div><div class='del'>-	/* 1 if no child node is in the cache */</div><div class='del'>-	unsigned int lowest:1;</div><div class='ctx'> 	/* Is the extent buffer locked */</div><div class='ctx'> 	unsigned int locked:1;</div><div class='ctx'> 	/* Has the block been processed */</div><div class='hunk'>@@ -241,12 +402,6 @@ struct btrfs_backref_cache {</div><div class='ctx'> 	 * level blocks may not reflect the new location</div><div class='ctx'> 	 */</div><div class='ctx'> 	struct list_head pending[BTRFS_MAX_LEVEL];</div><div class='del'>-	/* List of backref nodes with no child node */</div><div class='del'>-	struct list_head leaves;</div><div class='del'>-	/* List of blocks that have been COWed in current transaction */</div><div class='del'>-	struct list_head changed;</div><div class='del'>-	/* List of detached backref node. */</div><div class='del'>-	struct list_head detached;</div><div class='ctx'> </div><div class='ctx'> 	u64 last_trans;</div><div class='ctx'> </div><div class='hunk'>@@ -264,110 +419,43 @@ struct btrfs_backref_cache {</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Whether this cache is for relocation</div><div class='ctx'> 	 *</div><div class='del'>-	 * Reloction backref cache require more info for reloc root compared</div><div class='add'>+	 * Relocation backref cache require more info for reloc root compared</div><div class='ctx'> 	 * to generic backref cache.</div><div class='ctx'> 	 */</div><div class='del'>-	unsigned int is_reloc;</div><div class='add'>+	bool is_reloc;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> void btrfs_backref_init_cache(struct btrfs_fs_info *fs_info,</div><div class='del'>-			      struct btrfs_backref_cache *cache, int is_reloc);</div><div class='add'>+			      struct btrfs_backref_cache *cache, bool is_reloc);</div><div class='ctx'> struct btrfs_backref_node *btrfs_backref_alloc_node(</div><div class='ctx'> 		struct btrfs_backref_cache *cache, u64 bytenr, int level);</div><div class='ctx'> struct btrfs_backref_edge *btrfs_backref_alloc_edge(</div><div class='ctx'> 		struct btrfs_backref_cache *cache);</div><div class='ctx'> </div><div class='del'>-#define		LINK_LOWER	(1 &lt;&lt; 0)</div><div class='del'>-#define		LINK_UPPER	(1 &lt;&lt; 1)</div><div class='del'>-static inline void btrfs_backref_link_edge(struct btrfs_backref_edge *edge,</div><div class='del'>-					   struct btrfs_backref_node *lower,</div><div class='del'>-					   struct btrfs_backref_node *upper,</div><div class='del'>-					   int link_which)</div><div class='del'>-{</div><div class='del'>-	ASSERT(upper &amp;&amp; lower &amp;&amp; upper-&gt;level == lower-&gt;level + 1);</div><div class='del'>-	edge-&gt;node[LOWER] = lower;</div><div class='del'>-	edge-&gt;node[UPPER] = upper;</div><div class='del'>-	if (link_which &amp; LINK_LOWER)</div><div class='del'>-		list_add_tail(&amp;edge-&gt;list[LOWER], &amp;lower-&gt;upper);</div><div class='del'>-	if (link_which &amp; LINK_UPPER)</div><div class='del'>-		list_add_tail(&amp;edge-&gt;list[UPPER], &amp;upper-&gt;lower);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_backref_free_node(struct btrfs_backref_cache *cache,</div><div class='del'>-					   struct btrfs_backref_node *node)</div><div class='del'>-{</div><div class='del'>-	if (node) {</div><div class='del'>-		ASSERT(list_empty(&amp;node-&gt;list));</div><div class='del'>-		ASSERT(list_empty(&amp;node-&gt;lower));</div><div class='del'>-		ASSERT(node-&gt;eb == NULL);</div><div class='del'>-		cache-&gt;nr_nodes--;</div><div class='del'>-		btrfs_put_root(node-&gt;root);</div><div class='del'>-		kfree(node);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_backref_free_edge(struct btrfs_backref_cache *cache,</div><div class='del'>-					   struct btrfs_backref_edge *edge)</div><div class='del'>-{</div><div class='del'>-	if (edge) {</div><div class='del'>-		cache-&gt;nr_edges--;</div><div class='del'>-		kfree(edge);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_backref_unlock_node_buffer(</div><div class='del'>-		struct btrfs_backref_node *node)</div><div class='del'>-{</div><div class='del'>-	if (node-&gt;locked) {</div><div class='del'>-		btrfs_tree_unlock(node-&gt;eb);</div><div class='del'>-		node-&gt;locked = 0;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_backref_drop_node_buffer(</div><div class='del'>-		struct btrfs_backref_node *node)</div><div class='del'>-{</div><div class='del'>-	if (node-&gt;eb) {</div><div class='del'>-		btrfs_backref_unlock_node_buffer(node);</div><div class='del'>-		free_extent_buffer(node-&gt;eb);</div><div class='del'>-		node-&gt;eb = NULL;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Drop the backref node from cache without cleaning up its children</div><div class='del'>- * edges.</div><div class='del'>- *</div><div class='del'>- * This can only be called on node without parent edges.</div><div class='del'>- * The children edges are still kept as is.</div><div class='del'>- */</div><div class='del'>-static inline void btrfs_backref_drop_node(struct btrfs_backref_cache *tree,</div><div class='del'>-					   struct btrfs_backref_node *node)</div><div class='del'>-{</div><div class='del'>-	ASSERT(list_empty(&amp;node-&gt;upper));</div><div class='del'>-</div><div class='del'>-	btrfs_backref_drop_node_buffer(node);</div><div class='del'>-	list_del_init(&amp;node-&gt;list);</div><div class='del'>-	list_del_init(&amp;node-&gt;lower);</div><div class='del'>-	if (!RB_EMPTY_NODE(&amp;node-&gt;rb_node))</div><div class='del'>-		rb_erase(&amp;node-&gt;rb_node, &amp;tree-&gt;rb_root);</div><div class='del'>-	btrfs_backref_free_node(tree, node);</div><div class='del'>-}</div><div class='add'>+void btrfs_backref_free_node(struct btrfs_backref_cache *cache,</div><div class='add'>+			     struct btrfs_backref_node *node);</div><div class='add'>+void btrfs_backref_free_edge(struct btrfs_backref_cache *cache,</div><div class='add'>+			     struct btrfs_backref_edge *edge);</div><div class='add'>+void btrfs_backref_unlock_node_buffer(struct btrfs_backref_node *node);</div><div class='add'>+void btrfs_backref_drop_node_buffer(struct btrfs_backref_node *node);</div><div class='ctx'> </div><div class='ctx'> void btrfs_backref_cleanup_node(struct btrfs_backref_cache *cache,</div><div class='ctx'> 				struct btrfs_backref_node *node);</div><div class='add'>+void btrfs_backref_drop_node(struct btrfs_backref_cache *tree,</div><div class='add'>+			     struct btrfs_backref_node *node);</div><div class='ctx'> </div><div class='ctx'> void btrfs_backref_release_cache(struct btrfs_backref_cache *cache);</div><div class='ctx'> </div><div class='ctx'> static inline void btrfs_backref_panic(struct btrfs_fs_info *fs_info,</div><div class='del'>-				       u64 bytenr, int errno)</div><div class='add'>+				       u64 bytenr, int error)</div><div class='ctx'> {</div><div class='del'>-	btrfs_panic(fs_info, errno,</div><div class='add'>+	btrfs_panic(fs_info, error,</div><div class='ctx'> 		    "Inconsistency in backref cache found at offset %llu",</div><div class='ctx'> 		    bytenr);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_backref_add_tree_node(struct btrfs_backref_cache *cache,</div><div class='add'>+int btrfs_backref_add_tree_node(struct btrfs_trans_handle *trans,</div><div class='add'>+				struct btrfs_backref_cache *cache,</div><div class='ctx'> 				struct btrfs_path *path,</div><div class='ctx'> 				struct btrfs_backref_iter *iter,</div><div class='ctx'> 				struct btrfs_key *node_key,</div><div class='head'>diff --git a/fs/btrfs/bio.c b/fs/btrfs/bio.c<br/>new file mode 100644<br/>index 000000000000..fa1d321a2fb8<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/bio.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/bio.c</a></div><div class='hunk'>@@ -0,0 +1,1059 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+/*</div><div class='add'>+ * Copyright (C) 2007 Oracle.  All rights reserved.</div><div class='add'>+ * Copyright (C) 2022 Christoph Hellwig.</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/bio.h&gt;</div><div class='add'>+#include "bio.h"</div><div class='add'>+#include "ctree.h"</div><div class='add'>+#include "volumes.h"</div><div class='add'>+#include "raid56.h"</div><div class='add'>+#include "async-thread.h"</div><div class='add'>+#include "dev-replace.h"</div><div class='add'>+#include "zoned.h"</div><div class='add'>+#include "file-item.h"</div><div class='add'>+#include "raid-stripe-tree.h"</div><div class='add'>+</div><div class='add'>+static struct bio_set btrfs_bioset;</div><div class='add'>+static struct bio_set btrfs_clone_bioset;</div><div class='add'>+static struct bio_set btrfs_repair_bioset;</div><div class='add'>+static mempool_t btrfs_failed_bio_pool;</div><div class='add'>+</div><div class='add'>+struct btrfs_failed_bio {</div><div class='add'>+	struct btrfs_bio *bbio;</div><div class='add'>+	int num_copies;</div><div class='add'>+	atomic_t repair_count;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/* Is this a data path I/O that needs storage layer checksum and repair? */</div><div class='add'>+static inline bool is_data_bbio(const struct btrfs_bio *bbio)</div><div class='add'>+{</div><div class='add'>+	return bbio-&gt;inode &amp;&amp; is_data_inode(bbio-&gt;inode);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool bbio_has_ordered_extent(const struct btrfs_bio *bbio)</div><div class='add'>+{</div><div class='add'>+	return is_data_bbio(bbio) &amp;&amp; btrfs_op(&amp;bbio-&gt;bio) == BTRFS_MAP_WRITE;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Initialize a btrfs_bio structure.  This skips the embedded bio itself as it</div><div class='add'>+ * is already initialized by the block layer.</div><div class='add'>+ */</div><div class='add'>+void btrfs_bio_init(struct btrfs_bio *bbio, struct btrfs_inode *inode, u64 file_offset,</div><div class='add'>+		    btrfs_bio_end_io_t end_io, void *private)</div><div class='add'>+{</div><div class='add'>+	/* @inode parameter is mandatory. */</div><div class='add'>+	ASSERT(inode);</div><div class='add'>+</div><div class='add'>+	memset(bbio, 0, offsetof(struct btrfs_bio, bio));</div><div class='add'>+	bbio-&gt;inode = inode;</div><div class='add'>+	bbio-&gt;end_io = end_io;</div><div class='add'>+	bbio-&gt;private = private;</div><div class='add'>+	bbio-&gt;file_offset = file_offset;</div><div class='add'>+	atomic_set(&amp;bbio-&gt;pending_ios, 1);</div><div class='add'>+	WRITE_ONCE(bbio-&gt;status, BLK_STS_OK);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Allocate a btrfs_bio structure.  The btrfs_bio is the main I/O container for</div><div class='add'>+ * btrfs, and is used for all I/O submitted through btrfs_submit_bbio().</div><div class='add'>+ *</div><div class='add'>+ * Just like the underlying bio_alloc_bioset it will not fail as it is backed by</div><div class='add'>+ * a mempool.</div><div class='add'>+ */</div><div class='add'>+struct btrfs_bio *btrfs_bio_alloc(unsigned int nr_vecs, blk_opf_t opf,</div><div class='add'>+				  struct btrfs_inode *inode, u64 file_offset,</div><div class='add'>+				  btrfs_bio_end_io_t end_io, void *private)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_bio *bbio;</div><div class='add'>+	struct bio *bio;</div><div class='add'>+</div><div class='add'>+	bio = bio_alloc_bioset(NULL, nr_vecs, opf, GFP_NOFS, &amp;btrfs_bioset);</div><div class='add'>+	bbio = btrfs_bio(bio);</div><div class='add'>+	btrfs_bio_init(bbio, inode, file_offset, end_io, private);</div><div class='add'>+	return bbio;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct btrfs_bio *btrfs_split_bio(struct btrfs_fs_info *fs_info,</div><div class='add'>+					 struct btrfs_bio *orig_bbio,</div><div class='add'>+					 u64 map_length)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_bio *bbio;</div><div class='add'>+	struct bio *bio;</div><div class='add'>+</div><div class='add'>+	bio = bio_split(&amp;orig_bbio-&gt;bio, map_length &gt;&gt; SECTOR_SHIFT, GFP_NOFS,</div><div class='add'>+			&amp;btrfs_clone_bioset);</div><div class='add'>+	if (IS_ERR(bio))</div><div class='add'>+		return ERR_CAST(bio);</div><div class='add'>+</div><div class='add'>+	bbio = btrfs_bio(bio);</div><div class='add'>+	btrfs_bio_init(bbio, orig_bbio-&gt;inode, orig_bbio-&gt;file_offset, NULL, orig_bbio);</div><div class='add'>+	orig_bbio-&gt;file_offset += map_length;</div><div class='add'>+	if (bbio_has_ordered_extent(bbio)) {</div><div class='add'>+		refcount_inc(&amp;orig_bbio-&gt;ordered-&gt;refs);</div><div class='add'>+		bbio-&gt;ordered = orig_bbio-&gt;ordered;</div><div class='add'>+		bbio-&gt;orig_logical = orig_bbio-&gt;orig_logical;</div><div class='add'>+		orig_bbio-&gt;orig_logical += map_length;</div><div class='add'>+	}</div><div class='add'>+	bbio-&gt;csum_search_commit_root = orig_bbio-&gt;csum_search_commit_root;</div><div class='add'>+	atomic_inc(&amp;orig_bbio-&gt;pending_ios);</div><div class='add'>+	return bbio;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_bio_end_io(struct btrfs_bio *bbio, blk_status_t status)</div><div class='add'>+{</div><div class='add'>+	/* Make sure we're already in task context. */</div><div class='add'>+	ASSERT(in_task());</div><div class='add'>+</div><div class='add'>+	if (bbio-&gt;async_csum)</div><div class='add'>+		wait_for_completion(&amp;bbio-&gt;csum_done);</div><div class='add'>+</div><div class='add'>+	bbio-&gt;bio.bi_status = status;</div><div class='add'>+	if (bbio-&gt;bio.bi_pool == &amp;btrfs_clone_bioset) {</div><div class='add'>+		struct btrfs_bio *orig_bbio = bbio-&gt;private;</div><div class='add'>+</div><div class='add'>+		/* Free bio that was never submitted to the underlying device. */</div><div class='add'>+		if (bbio_has_ordered_extent(bbio))</div><div class='add'>+			btrfs_put_ordered_extent(bbio-&gt;ordered);</div><div class='add'>+		bio_put(&amp;bbio-&gt;bio);</div><div class='add'>+</div><div class='add'>+		bbio = orig_bbio;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * At this point, bbio always points to the original btrfs_bio. Save</div><div class='add'>+	 * the first error in it.</div><div class='add'>+	 */</div><div class='add'>+	if (status != BLK_STS_OK)</div><div class='add'>+		cmpxchg(&amp;bbio-&gt;status, BLK_STS_OK, status);</div><div class='add'>+</div><div class='add'>+	if (atomic_dec_and_test(&amp;bbio-&gt;pending_ios)) {</div><div class='add'>+		/* Load split bio's error which might be set above. */</div><div class='add'>+		if (status == BLK_STS_OK)</div><div class='add'>+			bbio-&gt;bio.bi_status = READ_ONCE(bbio-&gt;status);</div><div class='add'>+</div><div class='add'>+		if (bbio_has_ordered_extent(bbio)) {</div><div class='add'>+			struct btrfs_ordered_extent *ordered = bbio-&gt;ordered;</div><div class='add'>+</div><div class='add'>+			bbio-&gt;end_io(bbio);</div><div class='add'>+			btrfs_put_ordered_extent(ordered);</div><div class='add'>+		} else {</div><div class='add'>+			bbio-&gt;end_io(bbio);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int next_repair_mirror(const struct btrfs_failed_bio *fbio, int cur_mirror)</div><div class='add'>+{</div><div class='add'>+	if (cur_mirror == fbio-&gt;num_copies)</div><div class='add'>+		return cur_mirror + 1 - fbio-&gt;num_copies;</div><div class='add'>+	return cur_mirror + 1;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int prev_repair_mirror(const struct btrfs_failed_bio *fbio, int cur_mirror)</div><div class='add'>+{</div><div class='add'>+	if (cur_mirror == 1)</div><div class='add'>+		return fbio-&gt;num_copies;</div><div class='add'>+	return cur_mirror - 1;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void btrfs_repair_done(struct btrfs_failed_bio *fbio)</div><div class='add'>+{</div><div class='add'>+	if (atomic_dec_and_test(&amp;fbio-&gt;repair_count)) {</div><div class='add'>+		btrfs_bio_end_io(fbio-&gt;bbio, fbio-&gt;bbio-&gt;bio.bi_status);</div><div class='add'>+		mempool_free(fbio, &amp;btrfs_failed_bio_pool);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void btrfs_end_repair_bio(struct btrfs_bio *repair_bbio,</div><div class='add'>+				 struct btrfs_device *dev)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_failed_bio *fbio = repair_bbio-&gt;private;</div><div class='add'>+	struct btrfs_inode *inode = repair_bbio-&gt;inode;</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	/*</div><div class='add'>+	 * We can not move forward the saved_iter, as it will be later</div><div class='add'>+	 * utilized by repair_bbio again.</div><div class='add'>+	 */</div><div class='add'>+	struct bvec_iter saved_iter = repair_bbio-&gt;saved_iter;</div><div class='add'>+	const u32 step = min(fs_info-&gt;sectorsize, PAGE_SIZE);</div><div class='add'>+	const u64 logical = repair_bbio-&gt;saved_iter.bi_sector &lt;&lt; SECTOR_SHIFT;</div><div class='add'>+	const u32 nr_steps = repair_bbio-&gt;saved_iter.bi_size / step;</div><div class='add'>+	int mirror = repair_bbio-&gt;mirror_num;</div><div class='add'>+	phys_addr_t paddrs[BTRFS_MAX_BLOCKSIZE / PAGE_SIZE];</div><div class='add'>+	phys_addr_t paddr;</div><div class='add'>+	unsigned int slot = 0;</div><div class='add'>+</div><div class='add'>+	/* Repair bbio should be eaxctly one block sized. */</div><div class='add'>+	ASSERT(repair_bbio-&gt;saved_iter.bi_size == fs_info-&gt;sectorsize);</div><div class='add'>+</div><div class='add'>+	btrfs_bio_for_each_block(paddr, &amp;repair_bbio-&gt;bio, &amp;saved_iter, step) {</div><div class='add'>+		ASSERT(slot &lt; nr_steps);</div><div class='add'>+		paddrs[slot] = paddr;</div><div class='add'>+		slot++;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (repair_bbio-&gt;bio.bi_status ||</div><div class='add'>+	    !btrfs_data_csum_ok(repair_bbio, dev, 0, paddrs)) {</div><div class='add'>+		bio_reset(&amp;repair_bbio-&gt;bio, NULL, REQ_OP_READ);</div><div class='add'>+		repair_bbio-&gt;bio.bi_iter = repair_bbio-&gt;saved_iter;</div><div class='add'>+</div><div class='add'>+		mirror = next_repair_mirror(fbio, mirror);</div><div class='add'>+		if (mirror == fbio-&gt;bbio-&gt;mirror_num) {</div><div class='add'>+			btrfs_debug(fs_info, "no mirror left");</div><div class='add'>+			fbio-&gt;bbio-&gt;bio.bi_status = BLK_STS_IOERR;</div><div class='add'>+			goto done;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		btrfs_submit_bbio(repair_bbio, mirror);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		mirror = prev_repair_mirror(fbio, mirror);</div><div class='add'>+		btrfs_repair_io_failure(fs_info, btrfs_ino(inode),</div><div class='add'>+				  repair_bbio-&gt;file_offset, fs_info-&gt;sectorsize,</div><div class='add'>+				  logical, paddrs, step, mirror);</div><div class='add'>+	} while (mirror != fbio-&gt;bbio-&gt;mirror_num);</div><div class='add'>+</div><div class='add'>+done:</div><div class='add'>+	btrfs_repair_done(fbio);</div><div class='add'>+	bio_put(&amp;repair_bbio-&gt;bio);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Try to kick off a repair read to the next available mirror for a bad sector.</div><div class='add'>+ *</div><div class='add'>+ * This primarily tries to recover good data to serve the actual read request,</div><div class='add'>+ * but also tries to write the good data back to the bad mirror(s) when a</div><div class='add'>+ * read succeeded to restore the redundancy.</div><div class='add'>+ */</div><div class='add'>+static struct btrfs_failed_bio *repair_one_sector(struct btrfs_bio *failed_bbio,</div><div class='add'>+						  u32 bio_offset,</div><div class='add'>+						  phys_addr_t paddrs[],</div><div class='add'>+						  struct btrfs_failed_bio *fbio)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_inode *inode = failed_bbio-&gt;inode;</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	const u32 sectorsize = fs_info-&gt;sectorsize;</div><div class='add'>+	const u32 step = min(fs_info-&gt;sectorsize, PAGE_SIZE);</div><div class='add'>+	const u32 nr_steps = sectorsize / step;</div><div class='add'>+	/*</div><div class='add'>+	 * For bs &gt; ps cases, the saved_iter can be partially moved forward.</div><div class='add'>+	 * In that case we should round it down to the block boundary.</div><div class='add'>+	 */</div><div class='add'>+	const u64 logical = round_down(failed_bbio-&gt;saved_iter.bi_sector &lt;&lt; SECTOR_SHIFT,</div><div class='add'>+				       sectorsize);</div><div class='add'>+	struct btrfs_bio *repair_bbio;</div><div class='add'>+	struct bio *repair_bio;</div><div class='add'>+	int num_copies;</div><div class='add'>+	int mirror;</div><div class='add'>+</div><div class='add'>+	btrfs_debug(fs_info, "repair read error: read error at %llu",</div><div class='add'>+		    failed_bbio-&gt;file_offset + bio_offset);</div><div class='add'>+</div><div class='add'>+	num_copies = btrfs_num_copies(fs_info, logical, sectorsize);</div><div class='add'>+	if (num_copies == 1) {</div><div class='add'>+		btrfs_debug(fs_info, "no copy to repair from");</div><div class='add'>+		failed_bbio-&gt;bio.bi_status = BLK_STS_IOERR;</div><div class='add'>+		return fbio;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!fbio) {</div><div class='add'>+		fbio = mempool_alloc(&amp;btrfs_failed_bio_pool, GFP_NOFS);</div><div class='add'>+		fbio-&gt;bbio = failed_bbio;</div><div class='add'>+		fbio-&gt;num_copies = num_copies;</div><div class='add'>+		atomic_set(&amp;fbio-&gt;repair_count, 1);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	atomic_inc(&amp;fbio-&gt;repair_count);</div><div class='add'>+</div><div class='add'>+	repair_bio = bio_alloc_bioset(NULL, nr_steps, REQ_OP_READ, GFP_NOFS,</div><div class='add'>+				      &amp;btrfs_repair_bioset);</div><div class='add'>+	repair_bio-&gt;bi_iter.bi_sector = logical &gt;&gt; SECTOR_SHIFT;</div><div class='add'>+	for (int i = 0; i &lt; nr_steps; i++) {</div><div class='add'>+		int ret;</div><div class='add'>+</div><div class='add'>+		ASSERT(offset_in_page(paddrs[i]) + step &lt;= PAGE_SIZE);</div><div class='add'>+</div><div class='add'>+		ret = bio_add_page(repair_bio, phys_to_page(paddrs[i]), step,</div><div class='add'>+				   offset_in_page(paddrs[i]));</div><div class='add'>+		ASSERT(ret == step);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	repair_bbio = btrfs_bio(repair_bio);</div><div class='add'>+	btrfs_bio_init(repair_bbio, failed_bbio-&gt;inode, failed_bbio-&gt;file_offset + bio_offset,</div><div class='add'>+		       NULL, fbio);</div><div class='add'>+</div><div class='add'>+	mirror = next_repair_mirror(fbio, failed_bbio-&gt;mirror_num);</div><div class='add'>+	btrfs_debug(fs_info, "submitting repair read to mirror %d", mirror);</div><div class='add'>+	btrfs_submit_bbio(repair_bbio, mirror);</div><div class='add'>+	return fbio;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void btrfs_check_read_bio(struct btrfs_bio *bbio, struct btrfs_device *dev)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_inode *inode = bbio-&gt;inode;</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	const u32 sectorsize = fs_info-&gt;sectorsize;</div><div class='add'>+	const u32 step = min(sectorsize, PAGE_SIZE);</div><div class='add'>+	const u32 nr_steps = sectorsize / step;</div><div class='add'>+	struct bvec_iter *iter = &amp;bbio-&gt;saved_iter;</div><div class='add'>+	blk_status_t status = bbio-&gt;bio.bi_status;</div><div class='add'>+	struct btrfs_failed_bio *fbio = NULL;</div><div class='add'>+	phys_addr_t paddrs[BTRFS_MAX_BLOCKSIZE / PAGE_SIZE];</div><div class='add'>+	phys_addr_t paddr;</div><div class='add'>+	u32 offset = 0;</div><div class='add'>+</div><div class='add'>+	/* Read-repair requires the inode field to be set by the submitter. */</div><div class='add'>+	ASSERT(inode);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Hand off repair bios to the repair code as there is no upper level</div><div class='add'>+	 * submitter for them.</div><div class='add'>+	 */</div><div class='add'>+	if (bbio-&gt;bio.bi_pool == &amp;btrfs_repair_bioset) {</div><div class='add'>+		btrfs_end_repair_bio(bbio, dev);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Clear the I/O error. A failed repair will reset it. */</div><div class='add'>+	bbio-&gt;bio.bi_status = BLK_STS_OK;</div><div class='add'>+</div><div class='add'>+	btrfs_bio_for_each_block(paddr, &amp;bbio-&gt;bio, iter, step) {</div><div class='add'>+		paddrs[(offset / step) % nr_steps] = paddr;</div><div class='add'>+		offset += step;</div><div class='add'>+</div><div class='add'>+		if (IS_ALIGNED(offset, sectorsize)) {</div><div class='add'>+			if (status ||</div><div class='add'>+			    !btrfs_data_csum_ok(bbio, dev, offset - sectorsize, paddrs))</div><div class='add'>+				fbio = repair_one_sector(bbio, offset - sectorsize,</div><div class='add'>+							 paddrs, fbio);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	if (bbio-&gt;csum != bbio-&gt;csum_inline)</div><div class='add'>+		kvfree(bbio-&gt;csum);</div><div class='add'>+</div><div class='add'>+	if (fbio)</div><div class='add'>+		btrfs_repair_done(fbio);</div><div class='add'>+	else</div><div class='add'>+		btrfs_bio_end_io(bbio, bbio-&gt;bio.bi_status);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void btrfs_log_dev_io_error(const struct bio *bio, struct btrfs_device *dev)</div><div class='add'>+{</div><div class='add'>+	if (!dev || !dev-&gt;bdev)</div><div class='add'>+		return;</div><div class='add'>+	if (bio-&gt;bi_status != BLK_STS_IOERR &amp;&amp; bio-&gt;bi_status != BLK_STS_TARGET)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (btrfs_op(bio) == BTRFS_MAP_WRITE)</div><div class='add'>+		btrfs_dev_stat_inc_and_print(dev, BTRFS_DEV_STAT_WRITE_ERRS);</div><div class='add'>+	else if (!(bio-&gt;bi_opf &amp; REQ_RAHEAD))</div><div class='add'>+		btrfs_dev_stat_inc_and_print(dev, BTRFS_DEV_STAT_READ_ERRS);</div><div class='add'>+	if (bio-&gt;bi_opf &amp; REQ_PREFLUSH)</div><div class='add'>+		btrfs_dev_stat_inc_and_print(dev, BTRFS_DEV_STAT_FLUSH_ERRS);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct workqueue_struct *btrfs_end_io_wq(const struct btrfs_fs_info *fs_info,</div><div class='add'>+						const struct bio *bio)</div><div class='add'>+{</div><div class='add'>+	if (bio-&gt;bi_opf &amp; REQ_META)</div><div class='add'>+		return fs_info-&gt;endio_meta_workers;</div><div class='add'>+	return fs_info-&gt;endio_workers;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void simple_end_io_work(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_bio *bbio = container_of(work, struct btrfs_bio, end_io_work);</div><div class='add'>+	struct bio *bio = &amp;bbio-&gt;bio;</div><div class='add'>+</div><div class='add'>+	if (bio_op(bio) == REQ_OP_READ) {</div><div class='add'>+		/* Metadata reads are checked and repaired by the submitter. */</div><div class='add'>+		if (is_data_bbio(bbio))</div><div class='add'>+			return btrfs_check_read_bio(bbio, bbio-&gt;bio.bi_private);</div><div class='add'>+		return btrfs_bio_end_io(bbio, bbio-&gt;bio.bi_status);</div><div class='add'>+	}</div><div class='add'>+	if (bio_is_zone_append(bio) &amp;&amp; !bio-&gt;bi_status)</div><div class='add'>+		btrfs_record_physical_zoned(bbio);</div><div class='add'>+	btrfs_bio_end_io(bbio, bbio-&gt;bio.bi_status);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void btrfs_simple_end_io(struct bio *bio)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_bio *bbio = btrfs_bio(bio);</div><div class='add'>+	struct btrfs_device *dev = bio-&gt;bi_private;</div><div class='add'>+	struct btrfs_fs_info *fs_info = bbio-&gt;inode-&gt;root-&gt;fs_info;</div><div class='add'>+</div><div class='add'>+	btrfs_bio_counter_dec(fs_info);</div><div class='add'>+</div><div class='add'>+	if (bio-&gt;bi_status)</div><div class='add'>+		btrfs_log_dev_io_error(bio, dev);</div><div class='add'>+</div><div class='add'>+	INIT_WORK(&amp;bbio-&gt;end_io_work, simple_end_io_work);</div><div class='add'>+	queue_work(btrfs_end_io_wq(fs_info, bio), &amp;bbio-&gt;end_io_work);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void btrfs_raid56_end_io(struct bio *bio)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_io_context *bioc = bio-&gt;bi_private;</div><div class='add'>+	struct btrfs_bio *bbio = btrfs_bio(bio);</div><div class='add'>+</div><div class='add'>+	/* RAID56 endio is always handled in workqueue. */</div><div class='add'>+	ASSERT(in_task());</div><div class='add'>+</div><div class='add'>+	btrfs_bio_counter_dec(bioc-&gt;fs_info);</div><div class='add'>+	bbio-&gt;mirror_num = bioc-&gt;mirror_num;</div><div class='add'>+	if (bio_op(bio) == REQ_OP_READ &amp;&amp; is_data_bbio(bbio))</div><div class='add'>+		btrfs_check_read_bio(bbio, NULL);</div><div class='add'>+	else</div><div class='add'>+		btrfs_bio_end_io(bbio, bbio-&gt;bio.bi_status);</div><div class='add'>+</div><div class='add'>+	btrfs_put_bioc(bioc);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void orig_write_end_io_work(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_bio *bbio = container_of(work, struct btrfs_bio, end_io_work);</div><div class='add'>+	struct bio *bio = &amp;bbio-&gt;bio;</div><div class='add'>+	struct btrfs_io_stripe *stripe = bio-&gt;bi_private;</div><div class='add'>+	struct btrfs_io_context *bioc = stripe-&gt;bioc;</div><div class='add'>+</div><div class='add'>+	btrfs_bio_counter_dec(bioc-&gt;fs_info);</div><div class='add'>+</div><div class='add'>+	if (bio-&gt;bi_status) {</div><div class='add'>+		atomic_inc(&amp;bioc-&gt;error);</div><div class='add'>+		btrfs_log_dev_io_error(bio, stripe-&gt;dev);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Only send an error to the higher layers if it is beyond the tolerance</div><div class='add'>+	 * threshold.</div><div class='add'>+	 */</div><div class='add'>+	if (atomic_read(&amp;bioc-&gt;error) &gt; bioc-&gt;max_errors)</div><div class='add'>+		bio-&gt;bi_status = BLK_STS_IOERR;</div><div class='add'>+	else</div><div class='add'>+		bio-&gt;bi_status = BLK_STS_OK;</div><div class='add'>+</div><div class='add'>+	if (bio_is_zone_append(bio) &amp;&amp; !bio-&gt;bi_status)</div><div class='add'>+		stripe-&gt;physical = bio-&gt;bi_iter.bi_sector &lt;&lt; SECTOR_SHIFT;</div><div class='add'>+</div><div class='add'>+	btrfs_bio_end_io(bbio, bbio-&gt;bio.bi_status);</div><div class='add'>+	btrfs_put_bioc(bioc);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void btrfs_orig_write_end_io(struct bio *bio)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_bio *bbio = btrfs_bio(bio);</div><div class='add'>+</div><div class='add'>+	INIT_WORK(&amp;bbio-&gt;end_io_work, orig_write_end_io_work);</div><div class='add'>+	queue_work(btrfs_end_io_wq(bbio-&gt;inode-&gt;root-&gt;fs_info, bio), &amp;bbio-&gt;end_io_work);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void clone_write_end_io_work(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_bio *bbio = container_of(work, struct btrfs_bio, end_io_work);</div><div class='add'>+	struct bio *bio = &amp;bbio-&gt;bio;</div><div class='add'>+	struct btrfs_io_stripe *stripe = bio-&gt;bi_private;</div><div class='add'>+</div><div class='add'>+	if (bio-&gt;bi_status) {</div><div class='add'>+		atomic_inc(&amp;stripe-&gt;bioc-&gt;error);</div><div class='add'>+		btrfs_log_dev_io_error(bio, stripe-&gt;dev);</div><div class='add'>+	} else if (bio_is_zone_append(bio)) {</div><div class='add'>+		stripe-&gt;physical = bio-&gt;bi_iter.bi_sector &lt;&lt; SECTOR_SHIFT;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Pass on control to the original bio this one was cloned from */</div><div class='add'>+	bio_endio(stripe-&gt;bioc-&gt;orig_bio);</div><div class='add'>+	bio_put(bio);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void btrfs_clone_write_end_io(struct bio *bio)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_bio *bbio = btrfs_bio(bio);</div><div class='add'>+</div><div class='add'>+	INIT_WORK(&amp;bbio-&gt;end_io_work, clone_write_end_io_work);</div><div class='add'>+	queue_work(btrfs_end_io_wq(bbio-&gt;inode-&gt;root-&gt;fs_info, bio), &amp;bbio-&gt;end_io_work);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void btrfs_submit_dev_bio(struct btrfs_device *dev, struct bio *bio)</div><div class='add'>+{</div><div class='add'>+	if (!dev || !dev-&gt;bdev ||</div><div class='add'>+	    test_bit(BTRFS_DEV_STATE_MISSING, &amp;dev-&gt;dev_state) ||</div><div class='add'>+	    (btrfs_op(bio) == BTRFS_MAP_WRITE &amp;&amp;</div><div class='add'>+	     !test_bit(BTRFS_DEV_STATE_WRITEABLE, &amp;dev-&gt;dev_state))) {</div><div class='add'>+		bio_io_error(bio);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	bio_set_dev(bio, dev-&gt;bdev);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * For zone append writing, bi_sector must point the beginning of the</div><div class='add'>+	 * zone</div><div class='add'>+	 */</div><div class='add'>+	if (bio_op(bio) == REQ_OP_ZONE_APPEND) {</div><div class='add'>+		u64 physical = bio-&gt;bi_iter.bi_sector &lt;&lt; SECTOR_SHIFT;</div><div class='add'>+		u64 zone_start = round_down(physical, dev-&gt;fs_info-&gt;zone_size);</div><div class='add'>+</div><div class='add'>+		ASSERT(btrfs_dev_is_sequential(dev, physical));</div><div class='add'>+		bio-&gt;bi_iter.bi_sector = zone_start &gt;&gt; SECTOR_SHIFT;</div><div class='add'>+	}</div><div class='add'>+	btrfs_debug(dev-&gt;fs_info,</div><div class='add'>+	"%s: rw %d 0x%x, sector=%llu, dev=%lu (%s id %llu), size=%u",</div><div class='add'>+		__func__, bio_op(bio), bio-&gt;bi_opf, bio-&gt;bi_iter.bi_sector,</div><div class='add'>+		(unsigned long)dev-&gt;bdev-&gt;bd_dev, btrfs_dev_name(dev),</div><div class='add'>+		dev-&gt;devid, bio-&gt;bi_iter.bi_size);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Track reads if tracking is enabled; ignore I/O operations before the</div><div class='add'>+	 * filesystem is fully initialized.</div><div class='add'>+	 */</div><div class='add'>+	if (dev-&gt;fs_devices-&gt;collect_fs_stats &amp;&amp; bio_op(bio) == REQ_OP_READ &amp;&amp; dev-&gt;fs_info)</div><div class='add'>+		percpu_counter_add(&amp;dev-&gt;fs_info-&gt;stats_read_blocks,</div><div class='add'>+				   bio-&gt;bi_iter.bi_size &gt;&gt; dev-&gt;fs_info-&gt;sectorsize_bits);</div><div class='add'>+</div><div class='add'>+	if (bio-&gt;bi_opf &amp; REQ_BTRFS_CGROUP_PUNT)</div><div class='add'>+		blkcg_punt_bio_submit(bio);</div><div class='add'>+	else</div><div class='add'>+		submit_bio(bio);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void btrfs_submit_mirrored_bio(struct btrfs_io_context *bioc, int dev_nr)</div><div class='add'>+{</div><div class='add'>+	struct bio *orig_bio = bioc-&gt;orig_bio, *bio;</div><div class='add'>+	struct btrfs_bio *orig_bbio = btrfs_bio(orig_bio);</div><div class='add'>+</div><div class='add'>+	ASSERT(bio_op(orig_bio) != REQ_OP_READ);</div><div class='add'>+</div><div class='add'>+	/* Reuse the bio embedded into the btrfs_bio for the last mirror */</div><div class='add'>+	if (dev_nr == bioc-&gt;num_stripes - 1) {</div><div class='add'>+		bio = orig_bio;</div><div class='add'>+		bio-&gt;bi_end_io = btrfs_orig_write_end_io;</div><div class='add'>+	} else {</div><div class='add'>+		/* We need to use endio_work to run end_io in task context. */</div><div class='add'>+		bio = bio_alloc_clone(NULL, orig_bio, GFP_NOFS, &amp;btrfs_bioset);</div><div class='add'>+		bio_inc_remaining(orig_bio);</div><div class='add'>+		btrfs_bio_init(btrfs_bio(bio), orig_bbio-&gt;inode,</div><div class='add'>+			       orig_bbio-&gt;file_offset, NULL, NULL);</div><div class='add'>+		bio-&gt;bi_end_io = btrfs_clone_write_end_io;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	bio-&gt;bi_private = &amp;bioc-&gt;stripes[dev_nr];</div><div class='add'>+	bio-&gt;bi_iter.bi_sector = bioc-&gt;stripes[dev_nr].physical &gt;&gt; SECTOR_SHIFT;</div><div class='add'>+	bioc-&gt;stripes[dev_nr].bioc = bioc;</div><div class='add'>+	bioc-&gt;size = bio-&gt;bi_iter.bi_size;</div><div class='add'>+	btrfs_submit_dev_bio(bioc-&gt;stripes[dev_nr].dev, bio);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void btrfs_submit_bio(struct bio *bio, struct btrfs_io_context *bioc,</div><div class='add'>+			     struct btrfs_io_stripe *smap, int mirror_num)</div><div class='add'>+{</div><div class='add'>+	if (!bioc) {</div><div class='add'>+		/* Single mirror read/write fast path. */</div><div class='add'>+		btrfs_bio(bio)-&gt;mirror_num = mirror_num;</div><div class='add'>+		bio-&gt;bi_iter.bi_sector = smap-&gt;physical &gt;&gt; SECTOR_SHIFT;</div><div class='add'>+		if (bio_op(bio) != REQ_OP_READ)</div><div class='add'>+			btrfs_bio(bio)-&gt;orig_physical = smap-&gt;physical;</div><div class='add'>+		bio-&gt;bi_private = smap-&gt;dev;</div><div class='add'>+		bio-&gt;bi_end_io = btrfs_simple_end_io;</div><div class='add'>+		btrfs_submit_dev_bio(smap-&gt;dev, bio);</div><div class='add'>+	} else if (bioc-&gt;map_type &amp; BTRFS_BLOCK_GROUP_RAID56_MASK) {</div><div class='add'>+		/* Parity RAID write or read recovery. */</div><div class='add'>+		bio-&gt;bi_private = bioc;</div><div class='add'>+		bio-&gt;bi_end_io = btrfs_raid56_end_io;</div><div class='add'>+		if (bio_op(bio) == REQ_OP_READ)</div><div class='add'>+			raid56_parity_recover(bio, bioc, mirror_num);</div><div class='add'>+		else</div><div class='add'>+			raid56_parity_write(bio, bioc);</div><div class='add'>+	} else {</div><div class='add'>+		/* Write to multiple mirrors. */</div><div class='add'>+		int total_devs = bioc-&gt;num_stripes;</div><div class='add'>+</div><div class='add'>+		bioc-&gt;orig_bio = bio;</div><div class='add'>+		for (int dev_nr = 0; dev_nr &lt; total_devs; dev_nr++)</div><div class='add'>+			btrfs_submit_mirrored_bio(bioc, dev_nr);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int btrfs_bio_csum(struct btrfs_bio *bbio)</div><div class='add'>+{</div><div class='add'>+	if (bbio-&gt;bio.bi_opf &amp; REQ_META)</div><div class='add'>+		return btree_csum_one_bio(bbio);</div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+	return btrfs_csum_one_bio(bbio, true);</div><div class='add'>+#else</div><div class='add'>+	return btrfs_csum_one_bio(bbio, false);</div><div class='add'>+#endif</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Async submit bios are used to offload expensive checksumming onto the worker</div><div class='add'>+ * threads.</div><div class='add'>+ */</div><div class='add'>+struct async_submit_bio {</div><div class='add'>+	struct btrfs_bio *bbio;</div><div class='add'>+	struct btrfs_io_context *bioc;</div><div class='add'>+	struct btrfs_io_stripe smap;</div><div class='add'>+	int mirror_num;</div><div class='add'>+	struct btrfs_work work;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * In order to insert checksums into the metadata in large chunks, we wait</div><div class='add'>+ * until bio submission time.   All the pages in the bio are checksummed and</div><div class='add'>+ * sums are attached onto the ordered extent record.</div><div class='add'>+ *</div><div class='add'>+ * At IO completion time the csums attached on the ordered extent record are</div><div class='add'>+ * inserted into the btree.</div><div class='add'>+ */</div><div class='add'>+static void run_one_async_start(struct btrfs_work *work)</div><div class='add'>+{</div><div class='add'>+	struct async_submit_bio *async =</div><div class='add'>+		container_of(work, struct async_submit_bio, work);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_bio_csum(async-&gt;bbio);</div><div class='add'>+	if (ret)</div><div class='add'>+		async-&gt;bbio-&gt;bio.bi_status = errno_to_blk_status(ret);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * In order to insert checksums into the metadata in large chunks, we wait</div><div class='add'>+ * until bio submission time.   All the pages in the bio are checksummed and</div><div class='add'>+ * sums are attached onto the ordered extent record.</div><div class='add'>+ *</div><div class='add'>+ * At IO completion time the csums attached on the ordered extent record are</div><div class='add'>+ * inserted into the tree.</div><div class='add'>+ *</div><div class='add'>+ * If called with @do_free == true, then it will free the work struct.</div><div class='add'>+ */</div><div class='add'>+static void run_one_async_done(struct btrfs_work *work, bool do_free)</div><div class='add'>+{</div><div class='add'>+	struct async_submit_bio *async =</div><div class='add'>+		container_of(work, struct async_submit_bio, work);</div><div class='add'>+	struct bio *bio = &amp;async-&gt;bbio-&gt;bio;</div><div class='add'>+</div><div class='add'>+	if (do_free) {</div><div class='add'>+		kfree(container_of(work, struct async_submit_bio, work));</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* If an error occurred we just want to clean up the bio and move on. */</div><div class='add'>+	if (bio-&gt;bi_status) {</div><div class='add'>+		btrfs_bio_end_io(async-&gt;bbio, bio-&gt;bi_status);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * All of the bios that pass through here are from async helpers.</div><div class='add'>+	 * Use REQ_BTRFS_CGROUP_PUNT to issue them from the owning cgroup's</div><div class='add'>+	 * context.  This changes nothing when cgroups aren't in use.</div><div class='add'>+	 */</div><div class='add'>+	bio-&gt;bi_opf |= REQ_BTRFS_CGROUP_PUNT;</div><div class='add'>+	btrfs_submit_bio(bio, async-&gt;bioc, &amp;async-&gt;smap, async-&gt;mirror_num);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool should_async_write(struct btrfs_bio *bbio)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = bbio-&gt;inode-&gt;root-&gt;fs_info;</div><div class='add'>+	bool auto_csum_mode = true;</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+	struct btrfs_fs_devices *fs_devices = fs_info-&gt;fs_devices;</div><div class='add'>+	enum btrfs_offload_csum_mode csum_mode = READ_ONCE(fs_devices-&gt;offload_csum_mode);</div><div class='add'>+</div><div class='add'>+	if (csum_mode == BTRFS_OFFLOAD_CSUM_FORCE_ON)</div><div class='add'>+		return true;</div><div class='add'>+	/*</div><div class='add'>+	 * Write bios will calculate checksum and submit bio at the same time.</div><div class='add'>+	 * Unless explicitly required don't offload serial csum calculate and bio</div><div class='add'>+	 * submit into a workqueue.</div><div class='add'>+	 */</div><div class='add'>+	return false;</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+	/* Submit synchronously if the checksum implementation is fast. */</div><div class='add'>+	if (auto_csum_mode &amp;&amp; test_bit(BTRFS_FS_CSUM_IMPL_FAST, &amp;fs_info-&gt;flags))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Try to defer the submission to a workqueue to parallelize the</div><div class='add'>+	 * checksum calculation unless the I/O is issued synchronously.</div><div class='add'>+	 */</div><div class='add'>+	if (op_is_sync(bbio-&gt;bio.bi_opf))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/* Zoned devices require I/O to be submitted in order. */</div><div class='add'>+	if ((bbio-&gt;bio.bi_opf &amp; REQ_META) &amp;&amp; btrfs_is_zoned(fs_info))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Submit bio to an async queue.</div><div class='add'>+ *</div><div class='add'>+ * Return true if the work has been successfully submitted, else false.</div><div class='add'>+ */</div><div class='add'>+static bool btrfs_wq_submit_bio(struct btrfs_bio *bbio,</div><div class='add'>+				struct btrfs_io_context *bioc,</div><div class='add'>+				struct btrfs_io_stripe *smap, int mirror_num)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = bbio-&gt;inode-&gt;root-&gt;fs_info;</div><div class='add'>+	struct async_submit_bio *async;</div><div class='add'>+</div><div class='add'>+	async = kmalloc(sizeof(*async), GFP_NOFS);</div><div class='add'>+	if (!async)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	async-&gt;bbio = bbio;</div><div class='add'>+	async-&gt;bioc = bioc;</div><div class='add'>+	async-&gt;smap = *smap;</div><div class='add'>+	async-&gt;mirror_num = mirror_num;</div><div class='add'>+</div><div class='add'>+	btrfs_init_work(&amp;async-&gt;work, run_one_async_start, run_one_async_done);</div><div class='add'>+	btrfs_queue_work(fs_info-&gt;workers, &amp;async-&gt;work);</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static u64 btrfs_append_map_length(struct btrfs_bio *bbio, u64 map_length)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = bbio-&gt;inode-&gt;root-&gt;fs_info;</div><div class='add'>+	unsigned int nr_segs;</div><div class='add'>+	int sector_offset;</div><div class='add'>+</div><div class='add'>+	map_length = min(map_length, fs_info-&gt;max_zone_append_size);</div><div class='add'>+	sector_offset = bio_split_rw_at(&amp;bbio-&gt;bio, &amp;fs_info-&gt;limits,</div><div class='add'>+					&amp;nr_segs, map_length);</div><div class='add'>+	if (sector_offset) {</div><div class='add'>+		/*</div><div class='add'>+		 * bio_split_rw_at() could split at a size smaller than our</div><div class='add'>+		 * sectorsize and thus cause unaligned I/Os.  Fix that by</div><div class='add'>+		 * always rounding down to the nearest boundary.</div><div class='add'>+		 */</div><div class='add'>+		return ALIGN_DOWN(sector_offset &lt;&lt; SECTOR_SHIFT, fs_info-&gt;sectorsize);</div><div class='add'>+	}</div><div class='add'>+	return map_length;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool btrfs_submit_chunk(struct btrfs_bio *bbio, int mirror_num)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_inode *inode = bbio-&gt;inode;</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	struct bio *bio = &amp;bbio-&gt;bio;</div><div class='add'>+	u64 logical = bio-&gt;bi_iter.bi_sector &lt;&lt; SECTOR_SHIFT;</div><div class='add'>+	u64 length = bio-&gt;bi_iter.bi_size;</div><div class='add'>+	u64 map_length = length;</div><div class='add'>+	bool use_append = btrfs_use_zone_append(bbio);</div><div class='add'>+	struct btrfs_io_context *bioc = NULL;</div><div class='add'>+	struct btrfs_io_stripe smap;</div><div class='add'>+	blk_status_t status;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (bbio-&gt;is_scrub || btrfs_is_data_reloc_root(inode-&gt;root))</div><div class='add'>+		smap.rst_search_commit_root = true;</div><div class='add'>+	else</div><div class='add'>+		smap.rst_search_commit_root = false;</div><div class='add'>+</div><div class='add'>+	btrfs_bio_counter_inc_blocked(fs_info);</div><div class='add'>+	ret = btrfs_map_block(fs_info, btrfs_op(bio), logical, &amp;map_length,</div><div class='add'>+			      &amp;bioc, &amp;smap, &amp;mirror_num);</div><div class='add'>+	if (ret) {</div><div class='add'>+		status = errno_to_blk_status(ret);</div><div class='add'>+		btrfs_bio_counter_dec(fs_info);</div><div class='add'>+		goto end_bbio;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * For fscrypt writes we will get the encrypted bio after we've remapped</div><div class='add'>+	 * our bio to the physical disk location, so we need to save the</div><div class='add'>+	 * original bytenr so we know what we're checksumming.</div><div class='add'>+	 */</div><div class='add'>+	if (bio_op(bio) == REQ_OP_WRITE &amp;&amp; is_data_bbio(bbio))</div><div class='add'>+		bbio-&gt;orig_logical = logical;</div><div class='add'>+</div><div class='add'>+	map_length = min(map_length, length);</div><div class='add'>+	if (use_append)</div><div class='add'>+		map_length = btrfs_append_map_length(bbio, map_length);</div><div class='add'>+</div><div class='add'>+	if (map_length &lt; length) {</div><div class='add'>+		struct btrfs_bio *split;</div><div class='add'>+</div><div class='add'>+		split = btrfs_split_bio(fs_info, bbio, map_length);</div><div class='add'>+		if (IS_ERR(split)) {</div><div class='add'>+			status = errno_to_blk_status(PTR_ERR(split));</div><div class='add'>+			btrfs_bio_counter_dec(fs_info);</div><div class='add'>+			goto end_bbio;</div><div class='add'>+		}</div><div class='add'>+		bbio = split;</div><div class='add'>+		bio = &amp;bbio-&gt;bio;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Save the iter for the end_io handler and preload the checksums for</div><div class='add'>+	 * data reads.</div><div class='add'>+	 */</div><div class='add'>+	if (bio_op(bio) == REQ_OP_READ &amp;&amp; is_data_bbio(bbio)) {</div><div class='add'>+		bbio-&gt;saved_iter = bio-&gt;bi_iter;</div><div class='add'>+		ret = btrfs_lookup_bio_sums(bbio);</div><div class='add'>+		status = errno_to_blk_status(ret);</div><div class='add'>+		if (status)</div><div class='add'>+			goto fail;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (btrfs_op(bio) == BTRFS_MAP_WRITE) {</div><div class='add'>+		if (use_append) {</div><div class='add'>+			bio-&gt;bi_opf &amp;= ~REQ_OP_WRITE;</div><div class='add'>+			bio-&gt;bi_opf |= REQ_OP_ZONE_APPEND;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (is_data_bbio(bbio) &amp;&amp; bioc &amp;&amp; bioc-&gt;use_rst) {</div><div class='add'>+			/*</div><div class='add'>+			 * No locking for the list update, as we only add to</div><div class='add'>+			 * the list in the I/O submission path, and list</div><div class='add'>+			 * iteration only happens in the completion path, which</div><div class='add'>+			 * can't happen until after the last submission.</div><div class='add'>+			 */</div><div class='add'>+			btrfs_get_bioc(bioc);</div><div class='add'>+			list_add_tail(&amp;bioc-&gt;rst_ordered_entry, &amp;bbio-&gt;ordered-&gt;bioc_list);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Csum items for reloc roots have already been cloned at this</div><div class='add'>+		 * point, so they are handled as part of the no-checksum case.</div><div class='add'>+		 */</div><div class='add'>+		if (!(inode-&gt;flags &amp; BTRFS_INODE_NODATASUM) &amp;&amp;</div><div class='add'>+		    !test_bit(BTRFS_FS_STATE_NO_DATA_CSUMS, &amp;fs_info-&gt;fs_state) &amp;&amp;</div><div class='add'>+		    !btrfs_is_data_reloc_root(inode-&gt;root)) {</div><div class='add'>+			if (should_async_write(bbio) &amp;&amp;</div><div class='add'>+			    btrfs_wq_submit_bio(bbio, bioc, &amp;smap, mirror_num))</div><div class='add'>+				goto done;</div><div class='add'>+</div><div class='add'>+			ret = btrfs_bio_csum(bbio);</div><div class='add'>+			status = errno_to_blk_status(ret);</div><div class='add'>+			if (status)</div><div class='add'>+				goto fail;</div><div class='add'>+		} else if (use_append ||</div><div class='add'>+			   (btrfs_is_zoned(fs_info) &amp;&amp; inode &amp;&amp;</div><div class='add'>+			    inode-&gt;flags &amp; BTRFS_INODE_NODATASUM)) {</div><div class='add'>+			ret = btrfs_alloc_dummy_sum(bbio);</div><div class='add'>+			status = errno_to_blk_status(ret);</div><div class='add'>+			if (status)</div><div class='add'>+				goto fail;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	btrfs_submit_bio(bio, bioc, &amp;smap, mirror_num);</div><div class='add'>+done:</div><div class='add'>+	return map_length == length;</div><div class='add'>+</div><div class='add'>+fail:</div><div class='add'>+	btrfs_bio_counter_dec(fs_info);</div><div class='add'>+	/*</div><div class='add'>+	 * We have split the original bbio, now we have to end both the current</div><div class='add'>+	 * @bbio and remaining one, as the remaining one will never be submitted.</div><div class='add'>+	 */</div><div class='add'>+	if (map_length &lt; length) {</div><div class='add'>+		struct btrfs_bio *remaining = bbio-&gt;private;</div><div class='add'>+</div><div class='add'>+		ASSERT(bbio-&gt;bio.bi_pool == &amp;btrfs_clone_bioset);</div><div class='add'>+		ASSERT(remaining);</div><div class='add'>+</div><div class='add'>+		btrfs_bio_end_io(remaining, status);</div><div class='add'>+	}</div><div class='add'>+end_bbio:</div><div class='add'>+	btrfs_bio_end_io(bbio, status);</div><div class='add'>+	/* Do not submit another chunk */</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void assert_bbio_alignment(struct btrfs_bio *bbio)</div><div class='add'>+{</div><div class='add'>+#ifdef CONFIG_BTRFS_ASSERT</div><div class='add'>+	struct btrfs_fs_info *fs_info = bbio-&gt;inode-&gt;root-&gt;fs_info;</div><div class='add'>+	struct bio_vec bvec;</div><div class='add'>+	struct bvec_iter iter;</div><div class='add'>+	const u32 blocksize = fs_info-&gt;sectorsize;</div><div class='add'>+	const u32 alignment = min(blocksize, PAGE_SIZE);</div><div class='add'>+	const u64 logical = bbio-&gt;bio.bi_iter.bi_sector &lt;&lt; SECTOR_SHIFT;</div><div class='add'>+	const u32 length = bbio-&gt;bio.bi_iter.bi_size;</div><div class='add'>+</div><div class='add'>+	/* The logical and length should still be aligned to blocksize. */</div><div class='add'>+	ASSERT(IS_ALIGNED(logical, blocksize) &amp;&amp; IS_ALIGNED(length, blocksize) &amp;&amp;</div><div class='add'>+	       length != 0, "root=%llu inode=%llu logical=%llu length=%u",</div><div class='add'>+	       btrfs_root_id(bbio-&gt;inode-&gt;root),</div><div class='add'>+	       btrfs_ino(bbio-&gt;inode), logical, length);</div><div class='add'>+</div><div class='add'>+	bio_for_each_bvec(bvec, &amp;bbio-&gt;bio, iter)</div><div class='add'>+		ASSERT(IS_ALIGNED(bvec.bv_offset, alignment) &amp;&amp;</div><div class='add'>+		       IS_ALIGNED(bvec.bv_len, alignment),</div><div class='add'>+		"root=%llu inode=%llu logical=%llu length=%u index=%u bv_offset=%u bv_len=%u",</div><div class='add'>+		btrfs_root_id(bbio-&gt;inode-&gt;root),</div><div class='add'>+		btrfs_ino(bbio-&gt;inode), logical, length, iter.bi_idx,</div><div class='add'>+		bvec.bv_offset, bvec.bv_len);</div><div class='add'>+#endif</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_submit_bbio(struct btrfs_bio *bbio, int mirror_num)</div><div class='add'>+{</div><div class='add'>+	/* If bbio-&gt;inode is not populated, its file_offset must be 0. */</div><div class='add'>+	ASSERT(bbio-&gt;inode || bbio-&gt;file_offset == 0);</div><div class='add'>+</div><div class='add'>+	assert_bbio_alignment(bbio);</div><div class='add'>+</div><div class='add'>+	while (!btrfs_submit_chunk(bbio, mirror_num))</div><div class='add'>+		;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Submit a repair write.</div><div class='add'>+ *</div><div class='add'>+ * This bypasses btrfs_submit_bbio() deliberately, as that writes all copies in a</div><div class='add'>+ * RAID setup.  Here we only want to write the one bad copy, so we do the</div><div class='add'>+ * mapping ourselves and submit the bio directly.</div><div class='add'>+ *</div><div class='add'>+ * The I/O is issued synchronously to block the repair read completion from</div><div class='add'>+ * freeing the bio.</div><div class='add'>+ *</div><div class='add'>+ * @ino:	Offending inode number</div><div class='add'>+ * @fileoff:	File offset inside the inode</div><div class='add'>+ * @length:	Length of the repair write</div><div class='add'>+ * @logical:	Logical address of the range</div><div class='add'>+ * @paddrs:	Physical address array of the content</div><div class='add'>+ * @step:	Length of for each paddrs</div><div class='add'>+ * @mirror_num: Mirror number to write to. Must not be zero</div><div class='add'>+ */</div><div class='add'>+int btrfs_repair_io_failure(struct btrfs_fs_info *fs_info, u64 ino, u64 fileoff,</div><div class='add'>+			    u32 length, u64 logical, const phys_addr_t paddrs[],</div><div class='add'>+			    unsigned int step, int mirror_num)</div><div class='add'>+{</div><div class='add'>+	const u32 nr_steps = DIV_ROUND_UP_POW2(length, step);</div><div class='add'>+	struct btrfs_io_stripe smap = { 0 };</div><div class='add'>+	struct bio *bio = NULL;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	ASSERT(!(fs_info-&gt;sb-&gt;s_flags &amp; SB_RDONLY));</div><div class='add'>+	BUG_ON(!mirror_num);</div><div class='add'>+</div><div class='add'>+	/* Basic alignment checks. */</div><div class='add'>+	ASSERT(IS_ALIGNED(logical, fs_info-&gt;sectorsize));</div><div class='add'>+	ASSERT(IS_ALIGNED(length, fs_info-&gt;sectorsize));</div><div class='add'>+	ASSERT(IS_ALIGNED(fileoff, fs_info-&gt;sectorsize));</div><div class='add'>+	/* Either it's a single data or metadata block. */</div><div class='add'>+	ASSERT(length &lt;= BTRFS_MAX_BLOCKSIZE);</div><div class='add'>+	ASSERT(step &lt;= length);</div><div class='add'>+	ASSERT(is_power_of_2(step));</div><div class='add'>+</div><div class='add'>+	if (btrfs_repair_one_zone(fs_info, logical))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Avoid races with device replace and make sure our bioc has devices</div><div class='add'>+	 * associated to its stripes that don't go away while we are doing the</div><div class='add'>+	 * read repair operation.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_bio_counter_inc_blocked(fs_info);</div><div class='add'>+	ret = btrfs_map_repair_block(fs_info, &amp;smap, logical, length, mirror_num);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out_counter_dec;</div><div class='add'>+</div><div class='add'>+	if (unlikely(!smap.dev-&gt;bdev ||</div><div class='add'>+		     !test_bit(BTRFS_DEV_STATE_WRITEABLE, &amp;smap.dev-&gt;dev_state))) {</div><div class='add'>+		ret = -EIO;</div><div class='add'>+		goto out_counter_dec;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	bio = bio_alloc(smap.dev-&gt;bdev, nr_steps, REQ_OP_WRITE | REQ_SYNC, GFP_NOFS);</div><div class='add'>+	bio-&gt;bi_iter.bi_sector = smap.physical &gt;&gt; SECTOR_SHIFT;</div><div class='add'>+	for (int i = 0; i &lt; nr_steps; i++) {</div><div class='add'>+		ret = bio_add_page(bio, phys_to_page(paddrs[i]), step, offset_in_page(paddrs[i]));</div><div class='add'>+		/* We should have allocated enough slots to contain all the different pages. */</div><div class='add'>+		ASSERT(ret == step);</div><div class='add'>+	}</div><div class='add'>+	ret = submit_bio_wait(bio);</div><div class='add'>+	bio_put(bio);</div><div class='add'>+	if (ret) {</div><div class='add'>+		/* try to remap that extent elsewhere? */</div><div class='add'>+		btrfs_dev_stat_inc_and_print(smap.dev, BTRFS_DEV_STAT_WRITE_ERRS);</div><div class='add'>+		goto out_counter_dec;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	btrfs_info_rl(fs_info,</div><div class='add'>+		"read error corrected: ino %llu off %llu (dev %s sector %llu)",</div><div class='add'>+			     ino, fileoff, btrfs_dev_name(smap.dev),</div><div class='add'>+			     smap.physical &gt;&gt; SECTOR_SHIFT);</div><div class='add'>+	ret = 0;</div><div class='add'>+</div><div class='add'>+out_counter_dec:</div><div class='add'>+	btrfs_bio_counter_dec(fs_info);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Submit a btrfs_bio based repair write.</div><div class='add'>+ *</div><div class='add'>+ * If @dev_replace is true, the write would be submitted to dev-replace target.</div><div class='add'>+ */</div><div class='add'>+void btrfs_submit_repair_write(struct btrfs_bio *bbio, int mirror_num, bool dev_replace)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = bbio-&gt;inode-&gt;root-&gt;fs_info;</div><div class='add'>+	u64 logical = bbio-&gt;bio.bi_iter.bi_sector &lt;&lt; SECTOR_SHIFT;</div><div class='add'>+	u64 length = bbio-&gt;bio.bi_iter.bi_size;</div><div class='add'>+	struct btrfs_io_stripe smap = { 0 };</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ASSERT(mirror_num &gt; 0);</div><div class='add'>+	ASSERT(btrfs_op(&amp;bbio-&gt;bio) == BTRFS_MAP_WRITE);</div><div class='add'>+	ASSERT(!is_data_inode(bbio-&gt;inode));</div><div class='add'>+	ASSERT(bbio-&gt;is_scrub);</div><div class='add'>+</div><div class='add'>+	btrfs_bio_counter_inc_blocked(fs_info);</div><div class='add'>+	ret = btrfs_map_repair_block(fs_info, &amp;smap, logical, length, mirror_num);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto fail;</div><div class='add'>+</div><div class='add'>+	if (dev_replace) {</div><div class='add'>+		ASSERT(smap.dev == fs_info-&gt;dev_replace.srcdev);</div><div class='add'>+		smap.dev = fs_info-&gt;dev_replace.tgtdev;</div><div class='add'>+	}</div><div class='add'>+	btrfs_submit_bio(&amp;bbio-&gt;bio, NULL, &amp;smap, mirror_num);</div><div class='add'>+	return;</div><div class='add'>+</div><div class='add'>+fail:</div><div class='add'>+	btrfs_bio_counter_dec(fs_info);</div><div class='add'>+	btrfs_bio_end_io(bbio, errno_to_blk_status(ret));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int __init btrfs_bioset_init(void)</div><div class='add'>+{</div><div class='add'>+	if (bioset_init(&amp;btrfs_bioset, BIO_POOL_SIZE,</div><div class='add'>+			offsetof(struct btrfs_bio, bio),</div><div class='add'>+			BIOSET_NEED_BVECS))</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	if (bioset_init(&amp;btrfs_clone_bioset, BIO_POOL_SIZE,</div><div class='add'>+			offsetof(struct btrfs_bio, bio), 0))</div><div class='add'>+		goto out;</div><div class='add'>+	if (bioset_init(&amp;btrfs_repair_bioset, BIO_POOL_SIZE,</div><div class='add'>+			offsetof(struct btrfs_bio, bio),</div><div class='add'>+			BIOSET_NEED_BVECS))</div><div class='add'>+		goto out;</div><div class='add'>+	if (mempool_init_kmalloc_pool(&amp;btrfs_failed_bio_pool, BIO_POOL_SIZE,</div><div class='add'>+				      sizeof(struct btrfs_failed_bio)))</div><div class='add'>+		goto out;</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	btrfs_bioset_exit();</div><div class='add'>+	return -ENOMEM;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void __cold btrfs_bioset_exit(void)</div><div class='add'>+{</div><div class='add'>+	mempool_exit(&amp;btrfs_failed_bio_pool);</div><div class='add'>+	bioset_exit(&amp;btrfs_repair_bioset);</div><div class='add'>+	bioset_exit(&amp;btrfs_clone_bioset);</div><div class='add'>+	bioset_exit(&amp;btrfs_bioset);</div><div class='add'>+}</div><div class='head'>diff --git a/fs/btrfs/bio.h b/fs/btrfs/bio.h<br/>new file mode 100644<br/>index 000000000000..1be74209f0b8<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/bio.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/bio.h</a></div><div class='hunk'>@@ -0,0 +1,126 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+/*</div><div class='add'>+ * Copyright (C) 2007 Oracle.  All rights reserved.</div><div class='add'>+ * Copyright (C) 2022 Christoph Hellwig.</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#ifndef BTRFS_BIO_H</div><div class='add'>+#define BTRFS_BIO_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+#include &lt;linux/bio.h&gt;</div><div class='add'>+#include &lt;linux/workqueue.h&gt;</div><div class='add'>+#include "tree-checker.h"</div><div class='add'>+</div><div class='add'>+struct btrfs_bio;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+struct btrfs_inode;</div><div class='add'>+</div><div class='add'>+#define BTRFS_BIO_INLINE_CSUM_SIZE	64</div><div class='add'>+</div><div class='add'>+typedef void (*btrfs_bio_end_io_t)(struct btrfs_bio *bbio);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Highlevel btrfs I/O structure.  It is allocated by btrfs_bio_alloc and</div><div class='add'>+ * passed to btrfs_submit_bbio() for mapping to the physical devices.</div><div class='add'>+ */</div><div class='add'>+struct btrfs_bio {</div><div class='add'>+	/*</div><div class='add'>+	 * Inode and offset into it that this I/O operates on.</div><div class='add'>+	 *</div><div class='add'>+	 * If the inode is a data one, csum verification and read-repair</div><div class='add'>+	 * will be done automatically.</div><div class='add'>+	 * If the inode is a metadata one, everything is handled by the caller.</div><div class='add'>+	 */</div><div class='add'>+	struct btrfs_inode *inode;</div><div class='add'>+	u64 file_offset;</div><div class='add'>+</div><div class='add'>+	union {</div><div class='add'>+		/*</div><div class='add'>+		 * For data reads: checksumming and original I/O information.</div><div class='add'>+		 * (for internal use in the btrfs_submit_bbio() machinery only)</div><div class='add'>+		 */</div><div class='add'>+		struct {</div><div class='add'>+			u8 *csum;</div><div class='add'>+			u8 csum_inline[BTRFS_BIO_INLINE_CSUM_SIZE];</div><div class='add'>+			struct bvec_iter saved_iter;</div><div class='add'>+		};</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * For data writes:</div><div class='add'>+		 * - ordered extent covering the bio</div><div class='add'>+		 * - pointer to the checksums for this bio</div><div class='add'>+		 * - original physical address from the allocator</div><div class='add'>+		 *   (for zone append only)</div><div class='add'>+		 * - original logical address, used for checksumming fscrypt bios</div><div class='add'>+		 */</div><div class='add'>+		struct {</div><div class='add'>+			struct btrfs_ordered_extent *ordered;</div><div class='add'>+			struct btrfs_ordered_sum *sums;</div><div class='add'>+			struct work_struct csum_work;</div><div class='add'>+			struct completion csum_done;</div><div class='add'>+			struct bvec_iter csum_saved_iter;</div><div class='add'>+			u64 orig_physical;</div><div class='add'>+			u64 orig_logical;</div><div class='add'>+		};</div><div class='add'>+</div><div class='add'>+		/* For metadata reads: parentness verification. */</div><div class='add'>+		struct btrfs_tree_parent_check parent_check;</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+	/* End I/O information supplied to btrfs_bio_alloc */</div><div class='add'>+	btrfs_bio_end_io_t end_io;</div><div class='add'>+	void *private;</div><div class='add'>+</div><div class='add'>+	/* For internal use in read end I/O handling */</div><div class='add'>+	unsigned int mirror_num;</div><div class='add'>+	atomic_t pending_ios;</div><div class='add'>+	struct work_struct end_io_work;</div><div class='add'>+</div><div class='add'>+	/* Save the first error status of split bio. */</div><div class='add'>+	blk_status_t status;</div><div class='add'>+</div><div class='add'>+	/* Use the commit root to look up csums (data read bio only). */</div><div class='add'>+	bool csum_search_commit_root;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Since scrub will reuse btree inode, we need this flag to distinguish</div><div class='add'>+	 * scrub bios.</div><div class='add'>+	 */</div><div class='add'>+	bool is_scrub;</div><div class='add'>+</div><div class='add'>+	/* Whether the csum generation for data write is async. */</div><div class='add'>+	bool async_csum;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This member must come last, bio_alloc_bioset will allocate enough</div><div class='add'>+	 * bytes for entire btrfs_bio but relies on bio being last.</div><div class='add'>+	 */</div><div class='add'>+	struct bio bio;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static inline struct btrfs_bio *btrfs_bio(struct bio *bio)</div><div class='add'>+{</div><div class='add'>+	return container_of(bio, struct btrfs_bio, bio);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int __init btrfs_bioset_init(void);</div><div class='add'>+void __cold btrfs_bioset_exit(void);</div><div class='add'>+</div><div class='add'>+void btrfs_bio_init(struct btrfs_bio *bbio, struct btrfs_inode *inode, u64 file_offset,</div><div class='add'>+		    btrfs_bio_end_io_t end_io, void *private);</div><div class='add'>+struct btrfs_bio *btrfs_bio_alloc(unsigned int nr_vecs, blk_opf_t opf,</div><div class='add'>+				  struct btrfs_inode *inode, u64 file_offset,</div><div class='add'>+				  btrfs_bio_end_io_t end_io, void *private);</div><div class='add'>+void btrfs_bio_end_io(struct btrfs_bio *bbio, blk_status_t status);</div><div class='add'>+</div><div class='add'>+/* Submit using blkcg_punt_bio_submit. */</div><div class='add'>+#define REQ_BTRFS_CGROUP_PUNT			REQ_FS_PRIVATE</div><div class='add'>+</div><div class='add'>+void btrfs_submit_bbio(struct btrfs_bio *bbio, int mirror_num);</div><div class='add'>+void btrfs_submit_repair_write(struct btrfs_bio *bbio, int mirror_num, bool dev_replace);</div><div class='add'>+int btrfs_repair_io_failure(struct btrfs_fs_info *fs_info, u64 ino, u64 fileoff,</div><div class='add'>+			    u32 length, u64 logical, const phys_addr_t paddrs[],</div><div class='add'>+			    unsigned int step, int mirror_num);</div><div class='add'>+</div><div class='add'>+#endif</div><div class='head'>diff --git a/fs/btrfs/block-group.c b/fs/btrfs/block-group.c<br/>index 444e9c89ff3e..08b14449fabe 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/block-group.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/block-group.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/block-group.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/block-group.c</a></div><div class='hunk'>@@ -1,5 +1,6 @@</div><div class='ctx'> // SPDX-License-Identifier: GPL-2.0</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/sizes.h&gt;</div><div class='ctx'> #include &lt;linux/list_sort.h&gt;</div><div class='ctx'> #include "misc.h"</div><div class='ctx'> #include "ctree.h"</div><div class='hunk'>@@ -17,6 +18,34 @@</div><div class='ctx'> #include "discard.h"</div><div class='ctx'> #include "raid56.h"</div><div class='ctx'> #include "zoned.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "extent-tree.h"</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BTRFS_DEBUG</div><div class='add'>+int btrfs_should_fragment_free_space(const struct btrfs_block_group *block_group)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = block_group-&gt;fs_info;</div><div class='add'>+</div><div class='add'>+	return (btrfs_test_opt(fs_info, FRAGMENT_METADATA) &amp;&amp;</div><div class='add'>+		block_group-&gt;flags &amp; BTRFS_BLOCK_GROUP_METADATA) ||</div><div class='add'>+	       (btrfs_test_opt(fs_info, FRAGMENT_DATA) &amp;&amp;</div><div class='add'>+		block_group-&gt;flags &amp;  BTRFS_BLOCK_GROUP_DATA);</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+static inline bool has_unwritten_metadata(struct btrfs_block_group *block_group)</div><div class='add'>+{</div><div class='add'>+	/* The meta_write_pointer is available only on the zoned setup. */</div><div class='add'>+	if (!btrfs_is_zoned(block_group-&gt;fs_info))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	if (block_group-&gt;flags &amp; BTRFS_BLOCK_GROUP_DATA)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	return block_group-&gt;start + block_group-&gt;alloc_offset &gt;</div><div class='add'>+		block_group-&gt;meta_write_pointer;</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Return target flags in extended format or 0 if restripe for this chunk_type</div><div class='hunk'>@@ -24,9 +53,9 @@</div><div class='ctx'>  *</div><div class='ctx'>  * Should be called with balance_lock held</div><div class='ctx'>  */</div><div class='del'>-static u64 get_restripe_target(struct btrfs_fs_info *fs_info, u64 flags)</div><div class='add'>+static u64 get_restripe_target(const struct btrfs_fs_info *fs_info, u64 flags)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_balance_control *bctl = fs_info-&gt;balance_ctl;</div><div class='add'>+	const struct btrfs_balance_control *bctl = fs_info-&gt;balance_ctl;</div><div class='ctx'> 	u64 target = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (!bctl)</div><div class='hunk'>@@ -79,14 +108,21 @@ static u64 btrfs_reduce_alloc_profile(struct btrfs_fs_info *fs_info, u64 flags)</div><div class='ctx'> 	}</div><div class='ctx'> 	allowed &amp;= flags;</div><div class='ctx'> </div><div class='del'>-	if (allowed &amp; BTRFS_BLOCK_GROUP_RAID6)</div><div class='add'>+	/* Select the highest-redundancy RAID level. */</div><div class='add'>+	if (allowed &amp; BTRFS_BLOCK_GROUP_RAID1C4)</div><div class='add'>+		allowed = BTRFS_BLOCK_GROUP_RAID1C4;</div><div class='add'>+	else if (allowed &amp; BTRFS_BLOCK_GROUP_RAID6)</div><div class='ctx'> 		allowed = BTRFS_BLOCK_GROUP_RAID6;</div><div class='add'>+	else if (allowed &amp; BTRFS_BLOCK_GROUP_RAID1C3)</div><div class='add'>+		allowed = BTRFS_BLOCK_GROUP_RAID1C3;</div><div class='ctx'> 	else if (allowed &amp; BTRFS_BLOCK_GROUP_RAID5)</div><div class='ctx'> 		allowed = BTRFS_BLOCK_GROUP_RAID5;</div><div class='ctx'> 	else if (allowed &amp; BTRFS_BLOCK_GROUP_RAID10)</div><div class='ctx'> 		allowed = BTRFS_BLOCK_GROUP_RAID10;</div><div class='ctx'> 	else if (allowed &amp; BTRFS_BLOCK_GROUP_RAID1)</div><div class='ctx'> 		allowed = BTRFS_BLOCK_GROUP_RAID1;</div><div class='add'>+	else if (allowed &amp; BTRFS_BLOCK_GROUP_DUP)</div><div class='add'>+		allowed = BTRFS_BLOCK_GROUP_DUP;</div><div class='ctx'> 	else if (allowed &amp; BTRFS_BLOCK_GROUP_RAID0)</div><div class='ctx'> 		allowed = BTRFS_BLOCK_GROUP_RAID0;</div><div class='ctx'> </div><div class='hunk'>@@ -124,7 +160,16 @@ void btrfs_put_block_group(struct btrfs_block_group *cache)</div><div class='ctx'> {</div><div class='ctx'> 	if (refcount_dec_and_test(&amp;cache-&gt;refs)) {</div><div class='ctx'> 		WARN_ON(cache-&gt;pinned &gt; 0);</div><div class='del'>-		WARN_ON(cache-&gt;reserved &gt; 0);</div><div class='add'>+		/*</div><div class='add'>+		 * If there was a failure to cleanup a log tree, very likely due</div><div class='add'>+		 * to an IO failure on a writeback attempt of one or more of its</div><div class='add'>+		 * extent buffers, we could not do proper (and cheap) unaccounting</div><div class='add'>+		 * of their reserved space, so don't warn on reserved &gt; 0 in that</div><div class='add'>+		 * case.</div><div class='add'>+		 */</div><div class='add'>+		if (!(cache-&gt;flags &amp; BTRFS_BLOCK_GROUP_METADATA) ||</div><div class='add'>+		    !BTRFS_FS_LOG_CLEANUP_ERROR(cache-&gt;fs_info))</div><div class='add'>+			WARN_ON(cache-&gt;reserved &gt; 0);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * A block_group shouldn't be on the discard_list anymore.</div><div class='hunk'>@@ -135,59 +180,47 @@ void btrfs_put_block_group(struct btrfs_block_group *cache)</div><div class='ctx'> 			btrfs_discard_cancel_work(&amp;cache-&gt;fs_info-&gt;discard_ctl,</div><div class='ctx'> 						  cache);</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * If not empty, someone is still holding mutex of</div><div class='del'>-		 * full_stripe_lock, which can only be released by caller.</div><div class='del'>-		 * And it will definitely cause use-after-free when caller</div><div class='del'>-		 * tries to release full stripe lock.</div><div class='del'>-		 *</div><div class='del'>-		 * No better way to resolve, but only to warn.</div><div class='del'>-		 */</div><div class='del'>-		WARN_ON(!RB_EMPTY_ROOT(&amp;cache-&gt;full_stripe_locks_root.root));</div><div class='ctx'> 		kfree(cache-&gt;free_space_ctl);</div><div class='del'>-		kfree(cache-&gt;physical_map);</div><div class='add'>+		btrfs_free_chunk_map(cache-&gt;physical_map);</div><div class='ctx'> 		kfree(cache);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int btrfs_bg_start_cmp(const struct rb_node *new,</div><div class='add'>+			      const struct rb_node *exist)</div><div class='add'>+{</div><div class='add'>+	const struct btrfs_block_group *new_bg =</div><div class='add'>+		rb_entry(new, struct btrfs_block_group, cache_node);</div><div class='add'>+	const struct btrfs_block_group *exist_bg =</div><div class='add'>+		rb_entry(exist, struct btrfs_block_group, cache_node);</div><div class='add'>+</div><div class='add'>+	if (new_bg-&gt;start &lt; exist_bg-&gt;start)</div><div class='add'>+		return -1;</div><div class='add'>+	if (new_bg-&gt;start &gt; exist_bg-&gt;start)</div><div class='add'>+		return 1;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * This adds the block group to the fs_info rb tree for the block group cache</div><div class='ctx'>  */</div><div class='del'>-static int btrfs_add_block_group_cache(struct btrfs_fs_info *info,</div><div class='del'>-				       struct btrfs_block_group *block_group)</div><div class='add'>+static int btrfs_add_block_group_cache(struct btrfs_block_group *block_group)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node **p;</div><div class='del'>-	struct rb_node *parent = NULL;</div><div class='del'>-	struct btrfs_block_group *cache;</div><div class='add'>+	struct btrfs_fs_info *fs_info = block_group-&gt;fs_info;</div><div class='add'>+	struct rb_node *exist;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	ASSERT(block_group-&gt;length != 0);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;info-&gt;block_group_cache_lock);</div><div class='del'>-	p = &amp;info-&gt;block_group_cache_tree.rb_node;</div><div class='del'>-</div><div class='del'>-	while (*p) {</div><div class='del'>-		parent = *p;</div><div class='del'>-		cache = rb_entry(parent, struct btrfs_block_group, cache_node);</div><div class='del'>-		if (block_group-&gt;start &lt; cache-&gt;start) {</div><div class='del'>-			p = &amp;(*p)-&gt;rb_left;</div><div class='del'>-		} else if (block_group-&gt;start &gt; cache-&gt;start) {</div><div class='del'>-			p = &amp;(*p)-&gt;rb_right;</div><div class='del'>-		} else {</div><div class='del'>-			spin_unlock(&amp;info-&gt;block_group_cache_lock);</div><div class='del'>-			return -EEXIST;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rb_link_node(&amp;block_group-&gt;cache_node, parent, p);</div><div class='del'>-	rb_insert_color(&amp;block_group-&gt;cache_node,</div><div class='del'>-			&amp;info-&gt;block_group_cache_tree);</div><div class='del'>-</div><div class='del'>-	if (info-&gt;first_logical_byte &gt; block_group-&gt;start)</div><div class='del'>-		info-&gt;first_logical_byte = block_group-&gt;start;</div><div class='add'>+	write_lock(&amp;fs_info-&gt;block_group_cache_lock);</div><div class='ctx'> </div><div class='del'>-	spin_unlock(&amp;info-&gt;block_group_cache_lock);</div><div class='add'>+	exist = rb_find_add_cached(&amp;block_group-&gt;cache_node,</div><div class='add'>+			&amp;fs_info-&gt;block_group_cache_tree, btrfs_bg_start_cmp);</div><div class='add'>+	if (exist)</div><div class='add'>+		ret = -EEXIST;</div><div class='add'>+	write_unlock(&amp;fs_info-&gt;block_group_cache_lock);</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -201,8 +234,8 @@ static struct btrfs_block_group *block_group_cache_tree_search(</div><div class='ctx'> 	struct rb_node *n;</div><div class='ctx'> 	u64 end, start;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;info-&gt;block_group_cache_lock);</div><div class='del'>-	n = info-&gt;block_group_cache_tree.rb_node;</div><div class='add'>+	read_lock(&amp;info-&gt;block_group_cache_lock);</div><div class='add'>+	n = info-&gt;block_group_cache_tree.rb_root.rb_node;</div><div class='ctx'> </div><div class='ctx'> 	while (n) {</div><div class='ctx'> 		cache = rb_entry(n, struct btrfs_block_group, cache_node);</div><div class='hunk'>@@ -224,12 +257,9 @@ static struct btrfs_block_group *block_group_cache_tree_search(</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	if (ret) {</div><div class='add'>+	if (ret)</div><div class='ctx'> 		btrfs_get_block_group(ret);</div><div class='del'>-		if (bytenr == 0 &amp;&amp; info-&gt;first_logical_byte &gt; ret-&gt;start)</div><div class='del'>-			info-&gt;first_logical_byte = ret-&gt;start;</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;info-&gt;block_group_cache_lock);</div><div class='add'>+	read_unlock(&amp;info-&gt;block_group_cache_lock);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -258,15 +288,15 @@ struct btrfs_block_group *btrfs_next_block_group(</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = cache-&gt;fs_info;</div><div class='ctx'> 	struct rb_node *node;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;fs_info-&gt;block_group_cache_lock);</div><div class='add'>+	read_lock(&amp;fs_info-&gt;block_group_cache_lock);</div><div class='ctx'> </div><div class='ctx'> 	/* If our block group was removed, we need a full search. */</div><div class='ctx'> 	if (RB_EMPTY_NODE(&amp;cache-&gt;cache_node)) {</div><div class='ctx'> 		const u64 next_bytenr = cache-&gt;start + cache-&gt;length;</div><div class='ctx'> </div><div class='del'>-		spin_unlock(&amp;fs_info-&gt;block_group_cache_lock);</div><div class='add'>+		read_unlock(&amp;fs_info-&gt;block_group_cache_lock);</div><div class='ctx'> 		btrfs_put_block_group(cache);</div><div class='del'>-		cache = btrfs_lookup_first_block_group(fs_info, next_bytenr); return cache;</div><div class='add'>+		return btrfs_lookup_first_block_group(fs_info, next_bytenr);</div><div class='ctx'> 	}</div><div class='ctx'> 	node = rb_next(&amp;cache-&gt;cache_node);</div><div class='ctx'> 	btrfs_put_block_group(cache);</div><div class='hunk'>@@ -275,46 +305,68 @@ struct btrfs_block_group *btrfs_next_block_group(</div><div class='ctx'> 		btrfs_get_block_group(cache);</div><div class='ctx'> 	} else</div><div class='ctx'> 		cache = NULL;</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;block_group_cache_lock);</div><div class='add'>+	read_unlock(&amp;fs_info-&gt;block_group_cache_lock);</div><div class='ctx'> 	return cache;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-bool btrfs_inc_nocow_writers(struct btrfs_fs_info *fs_info, u64 bytenr)</div><div class='add'>+/*</div><div class='add'>+ * Check if we can do a NOCOW write for a given extent.</div><div class='add'>+ *</div><div class='add'>+ * @fs_info:       The filesystem information object.</div><div class='add'>+ * @bytenr:        Logical start address of the extent.</div><div class='add'>+ *</div><div class='add'>+ * Check if we can do a NOCOW write for the given extent, and increments the</div><div class='add'>+ * number of NOCOW writers in the block group that contains the extent, as long</div><div class='add'>+ * as the block group exists and it's currently not in read-only mode.</div><div class='add'>+ *</div><div class='add'>+ * Returns: A non-NULL block group pointer if we can do a NOCOW write, the caller</div><div class='add'>+ *          is responsible for calling btrfs_dec_nocow_writers() later.</div><div class='add'>+ *</div><div class='add'>+ *          Or NULL if we can not do a NOCOW write</div><div class='add'>+ */</div><div class='add'>+struct btrfs_block_group *btrfs_inc_nocow_writers(struct btrfs_fs_info *fs_info,</div><div class='add'>+						  u64 bytenr)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_block_group *bg;</div><div class='del'>-	bool ret = true;</div><div class='add'>+	bool can_nocow = true;</div><div class='ctx'> </div><div class='ctx'> 	bg = btrfs_lookup_block_group(fs_info, bytenr);</div><div class='ctx'> 	if (!bg)</div><div class='del'>-		return false;</div><div class='add'>+		return NULL;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;bg-&gt;lock);</div><div class='ctx'> 	if (bg-&gt;ro)</div><div class='del'>-		ret = false;</div><div class='add'>+		can_nocow = false;</div><div class='ctx'> 	else</div><div class='ctx'> 		atomic_inc(&amp;bg-&gt;nocow_writers);</div><div class='ctx'> 	spin_unlock(&amp;bg-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	/* No put on block group, done by btrfs_dec_nocow_writers */</div><div class='del'>-	if (!ret)</div><div class='add'>+	if (!can_nocow) {</div><div class='ctx'> 		btrfs_put_block_group(bg);</div><div class='add'>+		return NULL;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	return ret;</div><div class='add'>+	/* No put on block group, done by btrfs_dec_nocow_writers(). */</div><div class='add'>+	return bg;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_dec_nocow_writers(struct btrfs_fs_info *fs_info, u64 bytenr)</div><div class='add'>+/*</div><div class='add'>+ * Decrement the number of NOCOW writers in a block group.</div><div class='add'>+ *</div><div class='add'>+ * This is meant to be called after a previous call to btrfs_inc_nocow_writers(),</div><div class='add'>+ * and on the block group returned by that call. Typically this is called after</div><div class='add'>+ * creating an ordered extent for a NOCOW write, to prevent races with scrub and</div><div class='add'>+ * relocation.</div><div class='add'>+ *</div><div class='add'>+ * After this call, the caller should not use the block group anymore. It it wants</div><div class='add'>+ * to use it, then it should get a reference on it before calling this function.</div><div class='add'>+ */</div><div class='add'>+void btrfs_dec_nocow_writers(struct btrfs_block_group *bg)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_block_group *bg;</div><div class='del'>-</div><div class='del'>-	bg = btrfs_lookup_block_group(fs_info, bytenr);</div><div class='del'>-	ASSERT(bg);</div><div class='ctx'> 	if (atomic_dec_and_test(&amp;bg-&gt;nocow_writers))</div><div class='ctx'> 		wake_up_var(&amp;bg-&gt;nocow_writers);</div><div class='del'>-	/*</div><div class='del'>-	 * Once for our lookup and once for the lookup done by a previous call</div><div class='del'>-	 * to btrfs_inc_nocow_writers()</div><div class='del'>-	 */</div><div class='del'>-	btrfs_put_block_group(bg);</div><div class='add'>+</div><div class='add'>+	/* For the lookup done by a previous call to btrfs_inc_nocow_writers(). */</div><div class='ctx'> 	btrfs_put_block_group(bg);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -377,7 +429,7 @@ struct btrfs_caching_control *btrfs_get_caching_control(</div><div class='ctx'> 	return ctl;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_put_caching_control(struct btrfs_caching_control *ctl)</div><div class='add'>+static void btrfs_put_caching_control(struct btrfs_caching_control *ctl)</div><div class='ctx'> {</div><div class='ctx'> 	if (refcount_dec_and_test(&amp;ctl-&gt;count))</div><div class='ctx'> 		kfree(ctl);</div><div class='hunk'>@@ -400,50 +452,47 @@ void btrfs_wait_block_group_cache_progress(struct btrfs_block_group *cache,</div><div class='ctx'> 					   u64 num_bytes)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_caching_control *caching_ctl;</div><div class='add'>+	int progress;</div><div class='ctx'> </div><div class='ctx'> 	caching_ctl = btrfs_get_caching_control(cache);</div><div class='ctx'> 	if (!caching_ctl)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * We've already failed to allocate from this block group, so even if</div><div class='add'>+	 * there's enough space in the block group it isn't contiguous enough to</div><div class='add'>+	 * allow for an allocation, so wait for at least the next wakeup tick,</div><div class='add'>+	 * or for the thing to be done.</div><div class='add'>+	 */</div><div class='add'>+	progress = atomic_read(&amp;caching_ctl-&gt;progress);</div><div class='add'>+</div><div class='ctx'> 	wait_event(caching_ctl-&gt;wait, btrfs_block_group_done(cache) ||</div><div class='del'>-		   (cache-&gt;free_space_ctl-&gt;free_space &gt;= num_bytes));</div><div class='add'>+		   (progress != atomic_read(&amp;caching_ctl-&gt;progress) &amp;&amp;</div><div class='add'>+		    (cache-&gt;free_space_ctl-&gt;free_space &gt;= num_bytes)));</div><div class='ctx'> </div><div class='ctx'> 	btrfs_put_caching_control(caching_ctl);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_wait_block_group_cache_done(struct btrfs_block_group *cache)</div><div class='add'>+static int btrfs_caching_ctl_wait_done(struct btrfs_block_group *cache,</div><div class='add'>+				       struct btrfs_caching_control *caching_ctl)</div><div class='add'>+{</div><div class='add'>+	wait_event(caching_ctl-&gt;wait, btrfs_block_group_done(cache));</div><div class='add'>+	return cache-&gt;cached == BTRFS_CACHE_ERROR ? -EIO : 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int btrfs_wait_block_group_cache_done(struct btrfs_block_group *cache)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_caching_control *caching_ctl;</div><div class='del'>-	int ret = 0;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	caching_ctl = btrfs_get_caching_control(cache);</div><div class='ctx'> 	if (!caching_ctl)</div><div class='ctx'> 		return (cache-&gt;cached == BTRFS_CACHE_ERROR) ? -EIO : 0;</div><div class='del'>-</div><div class='del'>-	wait_event(caching_ctl-&gt;wait, btrfs_block_group_done(cache));</div><div class='del'>-	if (cache-&gt;cached == BTRFS_CACHE_ERROR)</div><div class='del'>-		ret = -EIO;</div><div class='add'>+	ret = btrfs_caching_ctl_wait_done(cache, caching_ctl);</div><div class='ctx'> 	btrfs_put_caching_control(caching_ctl);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool space_cache_v1_done(struct btrfs_block_group *cache)</div><div class='del'>-{</div><div class='del'>-	bool ret;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;cache-&gt;lock);</div><div class='del'>-	ret = cache-&gt;cached != BTRFS_CACHE_FAST;</div><div class='del'>-	spin_unlock(&amp;cache-&gt;lock);</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void btrfs_wait_space_cache_v1_finished(struct btrfs_block_group *cache,</div><div class='del'>-				struct btrfs_caching_control *caching_ctl)</div><div class='del'>-{</div><div class='del'>-	wait_event(caching_ctl-&gt;wait, space_cache_v1_done(cache));</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> #ifdef CONFIG_BTRFS_DEBUG</div><div class='ctx'> static void fragment_free_space(struct btrfs_block_group *block_group)</div><div class='ctx'> {</div><div class='hunk'>@@ -466,33 +515,44 @@ static void fragment_free_space(struct btrfs_block_group *block_group)</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * This is only called by btrfs_cache_block_group, since we could have freed</div><div class='del'>- * extents we need to check the pinned_extents for any extents that can't be</div><div class='del'>- * used yet since their free space will be released as soon as the transaction</div><div class='del'>- * commits.</div><div class='add'>+ * Add a free space range to the in memory free space cache of a block group.</div><div class='add'>+ * This checks if the range contains super block locations and any such</div><div class='add'>+ * locations are not added to the free space cache.</div><div class='add'>+ *</div><div class='add'>+ * @block_group:      The target block group.</div><div class='add'>+ * @start:            Start offset of the range.</div><div class='add'>+ * @end:              End offset of the range (exclusive).</div><div class='add'>+ * @total_added_ret:  Optional pointer to return the total amount of space</div><div class='add'>+ *                    added to the block group's free space cache.</div><div class='add'>+ *</div><div class='add'>+ * Returns 0 on success or &lt; 0 on error.</div><div class='ctx'>  */</div><div class='del'>-u64 add_new_free_space(struct btrfs_block_group *block_group, u64 start, u64 end)</div><div class='add'>+int btrfs_add_new_free_space(struct btrfs_block_group *block_group, u64 start,</div><div class='add'>+			     u64 end, u64 *total_added_ret)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *info = block_group-&gt;fs_info;</div><div class='del'>-	u64 extent_start, extent_end, size, total_added = 0;</div><div class='add'>+	u64 extent_start, extent_end, size;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='add'>+	if (total_added_ret)</div><div class='add'>+		*total_added_ret = 0;</div><div class='add'>+</div><div class='ctx'> 	while (start &lt; end) {</div><div class='del'>-		ret = find_first_extent_bit(&amp;info-&gt;excluded_extents, start,</div><div class='del'>-					    &amp;extent_start, &amp;extent_end,</div><div class='del'>-					    EXTENT_DIRTY | EXTENT_UPTODATE,</div><div class='del'>-					    NULL);</div><div class='del'>-		if (ret)</div><div class='add'>+		if (!btrfs_find_first_extent_bit(&amp;info-&gt;excluded_extents, start,</div><div class='add'>+						 &amp;extent_start, &amp;extent_end,</div><div class='add'>+						 EXTENT_DIRTY, NULL))</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='ctx'> 		if (extent_start &lt;= start) {</div><div class='ctx'> 			start = extent_end + 1;</div><div class='ctx'> 		} else if (extent_start &gt; start &amp;&amp; extent_start &lt; end) {</div><div class='ctx'> 			size = extent_start - start;</div><div class='del'>-			total_added += size;</div><div class='ctx'> 			ret = btrfs_add_free_space_async_trimmed(block_group,</div><div class='ctx'> 								 start, size);</div><div class='del'>-			BUG_ON(ret); /* -ENOMEM or logic error */</div><div class='add'>+			if (ret)</div><div class='add'>+				return ret;</div><div class='add'>+			if (total_added_ret)</div><div class='add'>+				*total_added_ret += size;</div><div class='ctx'> 			start = extent_end + 1;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -501,21 +561,159 @@ u64 add_new_free_space(struct btrfs_block_group *block_group, u64 start, u64 end</div><div class='ctx'> </div><div class='ctx'> 	if (start &lt; end) {</div><div class='ctx'> 		size = end - start;</div><div class='del'>-		total_added += size;</div><div class='ctx'> 		ret = btrfs_add_free_space_async_trimmed(block_group, start,</div><div class='ctx'> 							 size);</div><div class='del'>-		BUG_ON(ret); /* -ENOMEM or logic error */</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		if (total_added_ret)</div><div class='add'>+			*total_added_ret += size;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Get an arbitrary extent item index / max_index through the block group</div><div class='add'>+ *</div><div class='add'>+ * @block_group   the block group to sample from</div><div class='add'>+ * @index:        the integral step through the block group to grab from</div><div class='add'>+ * @max_index:    the granularity of the sampling</div><div class='add'>+ * @key:          return value parameter for the item we find</div><div class='add'>+ *</div><div class='add'>+ * Pre-conditions on indices:</div><div class='add'>+ * 0 &lt;= index &lt;= max_index</div><div class='add'>+ * 0 &lt; max_index</div><div class='add'>+ *</div><div class='add'>+ * Returns: 0 on success, 1 if the search didn't yield a useful item, negative</div><div class='add'>+ * error code on error.</div><div class='add'>+ */</div><div class='add'>+static int sample_block_group_extent_item(struct btrfs_caching_control *caching_ctl,</div><div class='add'>+					  struct btrfs_block_group *block_group,</div><div class='add'>+					  int index, int max_index,</div><div class='add'>+					  struct btrfs_key *found_key)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = block_group-&gt;fs_info;</div><div class='add'>+	struct btrfs_root *extent_root;</div><div class='add'>+	u64 search_offset;</div><div class='add'>+	u64 search_end = block_group-&gt;start + block_group-&gt;length;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='add'>+	struct btrfs_key search_key;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	ASSERT(index &gt;= 0);</div><div class='add'>+	ASSERT(index &lt;= max_index);</div><div class='add'>+	ASSERT(max_index &gt; 0);</div><div class='add'>+	lockdep_assert_held(&amp;caching_ctl-&gt;mutex);</div><div class='add'>+	lockdep_assert_held_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='add'>+</div><div class='add'>+	path = btrfs_alloc_path();</div><div class='add'>+	if (!path)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	extent_root = btrfs_extent_root(fs_info, max_t(u64, block_group-&gt;start,</div><div class='add'>+						       BTRFS_SUPER_INFO_OFFSET));</div><div class='add'>+</div><div class='add'>+	path-&gt;skip_locking = true;</div><div class='add'>+	path-&gt;search_commit_root = true;</div><div class='add'>+	path-&gt;reada = READA_FORWARD;</div><div class='add'>+</div><div class='add'>+	search_offset = index * div_u64(block_group-&gt;length, max_index);</div><div class='add'>+	search_key.objectid = block_group-&gt;start + search_offset;</div><div class='add'>+	search_key.type = BTRFS_EXTENT_ITEM_KEY;</div><div class='add'>+	search_key.offset = 0;</div><div class='add'>+</div><div class='add'>+	btrfs_for_each_slot(extent_root, &amp;search_key, found_key, path, ret) {</div><div class='add'>+		/* Success; sampled an extent item in the block group */</div><div class='add'>+		if (found_key-&gt;type == BTRFS_EXTENT_ITEM_KEY &amp;&amp;</div><div class='add'>+		    found_key-&gt;objectid &gt;= block_group-&gt;start &amp;&amp;</div><div class='add'>+		    found_key-&gt;objectid + found_key-&gt;offset &lt;= search_end)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		/* We can't possibly find a valid extent item anymore */</div><div class='add'>+		if (found_key-&gt;objectid &gt;= search_end) {</div><div class='add'>+			ret = 1;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return total_added;</div><div class='add'>+	lockdep_assert_held(&amp;caching_ctl-&gt;mutex);</div><div class='add'>+	lockdep_assert_held_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Best effort attempt to compute a block group's size class while caching it.</div><div class='add'>+ *</div><div class='add'>+ * @block_group: the block group we are caching</div><div class='add'>+ *</div><div class='add'>+ * We cannot infer the size class while adding free space extents, because that</div><div class='add'>+ * logic doesn't care about contiguous file extents (it doesn't differentiate</div><div class='add'>+ * between a 100M extent and 100 contiguous 1M extents). So we need to read the</div><div class='add'>+ * file extent items. Reading all of them is quite wasteful, because usually</div><div class='add'>+ * only a handful are enough to give a good answer. Therefore, we just grab 5 of</div><div class='add'>+ * them at even steps through the block group and pick the smallest size class</div><div class='add'>+ * we see. Since size class is best effort, and not guaranteed in general,</div><div class='add'>+ * inaccuracy is acceptable.</div><div class='add'>+ *</div><div class='add'>+ * To be more explicit about why this algorithm makes sense:</div><div class='add'>+ *</div><div class='add'>+ * If we are caching in a block group from disk, then there are three major cases</div><div class='add'>+ * to consider:</div><div class='add'>+ * 1. the block group is well behaved and all extents in it are the same size</div><div class='add'>+ *    class.</div><div class='add'>+ * 2. the block group is mostly one size class with rare exceptions for last</div><div class='add'>+ *    ditch allocations</div><div class='add'>+ * 3. the block group was populated before size classes and can have a totally</div><div class='add'>+ *    arbitrary mix of size classes.</div><div class='add'>+ *</div><div class='add'>+ * In case 1, looking at any extent in the block group will yield the correct</div><div class='add'>+ * result. For the mixed cases, taking the minimum size class seems like a good</div><div class='add'>+ * approximation, since gaps from frees will be usable to the size class. For</div><div class='add'>+ * 2., a small handful of file extents is likely to yield the right answer. For</div><div class='add'>+ * 3, we can either read every file extent, or admit that this is best effort</div><div class='add'>+ * anyway and try to stay fast.</div><div class='add'>+ *</div><div class='add'>+ * Returns: 0 on success, negative error code on error.</div><div class='add'>+ */</div><div class='add'>+static int load_block_group_size_class(struct btrfs_caching_control *caching_ctl,</div><div class='add'>+				       struct btrfs_block_group *block_group)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = block_group-&gt;fs_info;</div><div class='add'>+	struct btrfs_key key;</div><div class='add'>+	int i;</div><div class='add'>+	u64 min_size = block_group-&gt;length;</div><div class='add'>+	enum btrfs_block_group_size_class size_class = BTRFS_BG_SZ_NONE;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (!btrfs_block_group_should_use_size_class(block_group))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held(&amp;caching_ctl-&gt;mutex);</div><div class='add'>+	lockdep_assert_held_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='add'>+	for (i = 0; i &lt; 5; ++i) {</div><div class='add'>+		ret = sample_block_group_extent_item(caching_ctl, block_group, i, 5, &amp;key);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out;</div><div class='add'>+		if (ret &gt; 0)</div><div class='add'>+			continue;</div><div class='add'>+		min_size = min_t(u64, min_size, key.offset);</div><div class='add'>+		size_class = btrfs_calc_block_group_size_class(min_size);</div><div class='add'>+	}</div><div class='add'>+	if (size_class != BTRFS_BG_SZ_NONE) {</div><div class='add'>+		spin_lock(&amp;block_group-&gt;lock);</div><div class='add'>+		block_group-&gt;size_class = size_class;</div><div class='add'>+		spin_unlock(&amp;block_group-&gt;lock);</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int load_extent_tree_free(struct btrfs_caching_control *caching_ctl)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_block_group *block_group = caching_ctl-&gt;block_group;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = block_group-&gt;fs_info;</div><div class='del'>-	struct btrfs_root *extent_root = fs_info-&gt;extent_root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	struct btrfs_root *extent_root;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	u64 total_found = 0;</div><div class='hunk'>@@ -529,6 +727,7 @@ static int load_extent_tree_free(struct btrfs_caching_control *caching_ctl)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	last = max_t(u64, block_group-&gt;start, BTRFS_SUPER_INFO_OFFSET);</div><div class='add'>+	extent_root = btrfs_extent_root(fs_info, last);</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_BTRFS_DEBUG</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -545,13 +744,13 @@ static int load_extent_tree_free(struct btrfs_caching_control *caching_ctl)</div><div class='ctx'> 	 * root to add free space.  So we skip locking and search the commit</div><div class='ctx'> 	 * root, since its read-only</div><div class='ctx'> 	 */</div><div class='del'>-	path-&gt;skip_locking = 1;</div><div class='del'>-	path-&gt;search_commit_root = 1;</div><div class='add'>+	path-&gt;skip_locking = true;</div><div class='add'>+	path-&gt;search_commit_root = true;</div><div class='ctx'> 	path-&gt;reada = READA_FORWARD;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = last;</div><div class='del'>-	key.offset = 0;</div><div class='ctx'> 	key.type = BTRFS_EXTENT_ITEM_KEY;</div><div class='add'>+	key.offset = 0;</div><div class='ctx'> </div><div class='ctx'> next:</div><div class='ctx'> 	ret = btrfs_search_slot(NULL, extent_root, &amp;key, path, 0, 0);</div><div class='hunk'>@@ -576,8 +775,6 @@ next:</div><div class='ctx'> </div><div class='ctx'> 			if (need_resched() ||</div><div class='ctx'> 			    rwsem_is_contended(&amp;fs_info-&gt;commit_root_sem)) {</div><div class='del'>-				if (wakeup)</div><div class='del'>-					caching_ctl-&gt;progress = last;</div><div class='ctx'> 				btrfs_release_path(path);</div><div class='ctx'> 				up_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='ctx'> 				mutex_unlock(&amp;caching_ctl-&gt;mutex);</div><div class='hunk'>@@ -599,11 +796,8 @@ next:</div><div class='ctx'> </div><div class='ctx'> 		if (key.objectid &lt; last) {</div><div class='ctx'> 			key.objectid = last;</div><div class='del'>-			key.offset = 0;</div><div class='ctx'> 			key.type = BTRFS_EXTENT_ITEM_KEY;</div><div class='del'>-</div><div class='del'>-			if (wakeup)</div><div class='del'>-				caching_ctl-&gt;progress = last;</div><div class='add'>+			key.offset = 0;</div><div class='ctx'> 			btrfs_release_path(path);</div><div class='ctx'> 			goto next;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -618,8 +812,13 @@ next:</div><div class='ctx'> </div><div class='ctx'> 		if (key.type == BTRFS_EXTENT_ITEM_KEY ||</div><div class='ctx'> 		    key.type == BTRFS_METADATA_ITEM_KEY) {</div><div class='del'>-			total_found += add_new_free_space(block_group, last,</div><div class='del'>-							  key.objectid);</div><div class='add'>+			u64 space_added;</div><div class='add'>+</div><div class='add'>+			ret = btrfs_add_new_free_space(block_group, last,</div><div class='add'>+						       key.objectid, &amp;space_added);</div><div class='add'>+			if (ret)</div><div class='add'>+				goto out;</div><div class='add'>+			total_found += space_added;</div><div class='ctx'> 			if (key.type == BTRFS_METADATA_ITEM_KEY)</div><div class='ctx'> 				last = key.objectid +</div><div class='ctx'> 					fs_info-&gt;nodesize;</div><div class='hunk'>@@ -628,23 +827,28 @@ next:</div><div class='ctx'> </div><div class='ctx'> 			if (total_found &gt; CACHING_CTL_WAKE_UP) {</div><div class='ctx'> 				total_found = 0;</div><div class='del'>-				if (wakeup)</div><div class='add'>+				if (wakeup) {</div><div class='add'>+					atomic_inc(&amp;caching_ctl-&gt;progress);</div><div class='ctx'> 					wake_up(&amp;caching_ctl-&gt;wait);</div><div class='add'>+				}</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 		path-&gt;slots[0]++;</div><div class='ctx'> 	}</div><div class='del'>-	ret = 0;</div><div class='del'>-</div><div class='del'>-	total_found += add_new_free_space(block_group, last,</div><div class='del'>-				block_group-&gt;start + block_group-&gt;length);</div><div class='del'>-	caching_ctl-&gt;progress = (u64)-1;</div><div class='ctx'> </div><div class='add'>+	ret = btrfs_add_new_free_space(block_group, last,</div><div class='add'>+				       block_group-&gt;start + block_group-&gt;length,</div><div class='add'>+				       NULL);</div><div class='ctx'> out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline void btrfs_free_excluded_extents(const struct btrfs_block_group *bg)</div><div class='add'>+{</div><div class='add'>+	btrfs_clear_extent_bit(&amp;bg-&gt;fs_info-&gt;excluded_extents, bg-&gt;start,</div><div class='add'>+			       bg-&gt;start + bg-&gt;length - 1, EXTENT_DIRTY, NULL);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static noinline void caching_thread(struct btrfs_work *work)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_block_group *block_group;</div><div class='hunk'>@@ -659,6 +863,7 @@ static noinline void caching_thread(struct btrfs_work *work)</div><div class='ctx'> 	mutex_lock(&amp;caching_ctl-&gt;mutex);</div><div class='ctx'> 	down_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='ctx'> </div><div class='add'>+	load_block_group_size_class(caching_ctl, block_group);</div><div class='ctx'> 	if (btrfs_test_opt(fs_info, SPACE_CACHE)) {</div><div class='ctx'> 		ret = load_free_space_cache(block_group);</div><div class='ctx'> 		if (ret == 1) {</div><div class='hunk'>@@ -685,7 +890,7 @@ static noinline void caching_thread(struct btrfs_work *work)</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (btrfs_fs_compat_ro(fs_info, FREE_SPACE_TREE) &amp;&amp;</div><div class='ctx'> 	    !(test_bit(BTRFS_FS_FREE_SPACE_TREE_UNTRUSTED, &amp;fs_info-&gt;flags)))</div><div class='del'>-		ret = load_free_space_tree(caching_ctl);</div><div class='add'>+		ret = btrfs_load_free_space_tree(caching_ctl);</div><div class='ctx'> 	else</div><div class='ctx'> 		ret = load_extent_tree_free(caching_ctl);</div><div class='ctx'> done:</div><div class='hunk'>@@ -708,8 +913,6 @@ done:</div><div class='ctx'> 	}</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-	caching_ctl-&gt;progress = (u64)-1;</div><div class='del'>-</div><div class='ctx'> 	up_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='ctx'> 	btrfs_free_excluded_extents(block_group);</div><div class='ctx'> 	mutex_unlock(&amp;caching_ctl-&gt;mutex);</div><div class='hunk'>@@ -720,9 +923,8 @@ done:</div><div class='ctx'> 	btrfs_put_block_group(block_group);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_cache_block_group(struct btrfs_block_group *cache, int load_cache_only)</div><div class='add'>+int btrfs_cache_block_group(struct btrfs_block_group *cache, bool wait)</div><div class='ctx'> {</div><div class='del'>-	DEFINE_WAIT(wait);</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = cache-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_caching_control *caching_ctl = NULL;</div><div class='ctx'> 	int ret = 0;</div><div class='hunk'>@@ -739,9 +941,9 @@ int btrfs_cache_block_group(struct btrfs_block_group *cache, int load_cache_only</div><div class='ctx'> 	mutex_init(&amp;caching_ctl-&gt;mutex);</div><div class='ctx'> 	init_waitqueue_head(&amp;caching_ctl-&gt;wait);</div><div class='ctx'> 	caching_ctl-&gt;block_group = cache;</div><div class='del'>-	caching_ctl-&gt;progress = cache-&gt;start;</div><div class='ctx'> 	refcount_set(&amp;caching_ctl-&gt;count, 2);</div><div class='del'>-	btrfs_init_work(&amp;caching_ctl-&gt;work, caching_thread, NULL, NULL);</div><div class='add'>+	atomic_set(&amp;caching_ctl-&gt;progress, 0);</div><div class='add'>+	btrfs_init_work(&amp;caching_ctl-&gt;work, caching_thread, NULL);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;cache-&gt;lock);</div><div class='ctx'> 	if (cache-&gt;cached != BTRFS_CACHE_NO) {</div><div class='hunk'>@@ -755,24 +957,20 @@ int btrfs_cache_block_group(struct btrfs_block_group *cache, int load_cache_only</div><div class='ctx'> 	}</div><div class='ctx'> 	WARN_ON(cache-&gt;caching_ctl);</div><div class='ctx'> 	cache-&gt;caching_ctl = caching_ctl;</div><div class='del'>-	if (btrfs_test_opt(fs_info, SPACE_CACHE))</div><div class='del'>-		cache-&gt;cached = BTRFS_CACHE_FAST;</div><div class='del'>-	else</div><div class='del'>-		cache-&gt;cached = BTRFS_CACHE_STARTED;</div><div class='del'>-	cache-&gt;has_caching_ctl = 1;</div><div class='add'>+	cache-&gt;cached = BTRFS_CACHE_STARTED;</div><div class='ctx'> 	spin_unlock(&amp;cache-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;fs_info-&gt;block_group_cache_lock);</div><div class='add'>+	write_lock(&amp;fs_info-&gt;block_group_cache_lock);</div><div class='ctx'> 	refcount_inc(&amp;caching_ctl-&gt;count);</div><div class='ctx'> 	list_add_tail(&amp;caching_ctl-&gt;list, &amp;fs_info-&gt;caching_block_groups);</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;block_group_cache_lock);</div><div class='add'>+	write_unlock(&amp;fs_info-&gt;block_group_cache_lock);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_get_block_group(cache);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_queue_work(fs_info-&gt;caching_workers, &amp;caching_ctl-&gt;work);</div><div class='ctx'> out:</div><div class='del'>-	if (load_cache_only &amp;&amp; caching_ctl)</div><div class='del'>-		btrfs_wait_space_cache_v1_finished(cache, caching_ctl);</div><div class='add'>+	if (wait &amp;&amp; caching_ctl)</div><div class='add'>+		ret = btrfs_caching_ctl_wait_done(cache, caching_ctl);</div><div class='ctx'> 	if (caching_ctl)</div><div class='ctx'> 		btrfs_put_caching_control(caching_ctl);</div><div class='ctx'> </div><div class='hunk'>@@ -832,6 +1030,13 @@ static void clear_incompat_bg_bits(struct btrfs_fs_info *fs_info, u64 flags)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static struct btrfs_root *btrfs_block_group_root(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	if (btrfs_fs_compat_ro(fs_info, BLOCK_GROUP_TREE))</div><div class='add'>+		return fs_info-&gt;block_group_root;</div><div class='add'>+	return btrfs_extent_root(fs_info, 0);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int remove_block_group_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				   struct btrfs_path *path,</div><div class='ctx'> 				   struct btrfs_block_group *block_group)</div><div class='hunk'>@@ -841,7 +1046,7 @@ static int remove_block_group_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	root = fs_info-&gt;extent_root;</div><div class='add'>+	root = btrfs_block_group_root(fs_info);</div><div class='ctx'> 	key.objectid = block_group-&gt;start;</div><div class='ctx'> 	key.type = BTRFS_BLOCK_GROUP_ITEM_KEY;</div><div class='ctx'> 	key.offset = block_group-&gt;length;</div><div class='hunk'>@@ -857,10 +1062,10 @@ static int remove_block_group_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_remove_block_group(struct btrfs_trans_handle *trans,</div><div class='del'>-			     u64 group_start, struct extent_map *em)</div><div class='add'>+			     struct btrfs_chunk_map *map)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_block_group *block_group;</div><div class='ctx'> 	struct btrfs_free_cluster *cluster;</div><div class='ctx'> 	struct inode *inode;</div><div class='hunk'>@@ -869,11 +1074,13 @@ int btrfs_remove_block_group(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	int index;</div><div class='ctx'> 	int factor;</div><div class='ctx'> 	struct btrfs_caching_control *caching_ctl = NULL;</div><div class='del'>-	bool remove_em;</div><div class='add'>+	bool remove_map;</div><div class='ctx'> 	bool remove_rsv = false;</div><div class='ctx'> </div><div class='del'>-	block_group = btrfs_lookup_block_group(fs_info, group_start);</div><div class='del'>-	BUG_ON(!block_group);</div><div class='add'>+	block_group = btrfs_lookup_block_group(fs_info, map-&gt;start);</div><div class='add'>+	if (!block_group)</div><div class='add'>+		return -ENOENT;</div><div class='add'>+</div><div class='ctx'> 	BUG_ON(!block_group-&gt;ro);</div><div class='ctx'> </div><div class='ctx'> 	trace_btrfs_remove_block_group(block_group);</div><div class='hunk'>@@ -947,17 +1154,15 @@ int btrfs_remove_block_group(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;fs_info-&gt;block_group_cache_lock);</div><div class='del'>-	rb_erase(&amp;block_group-&gt;cache_node,</div><div class='del'>-		 &amp;fs_info-&gt;block_group_cache_tree);</div><div class='add'>+	write_lock(&amp;fs_info-&gt;block_group_cache_lock);</div><div class='add'>+	rb_erase_cached(&amp;block_group-&gt;cache_node,</div><div class='add'>+			&amp;fs_info-&gt;block_group_cache_tree);</div><div class='ctx'> 	RB_CLEAR_NODE(&amp;block_group-&gt;cache_node);</div><div class='ctx'> </div><div class='ctx'> 	/* Once for the block groups rbtree */</div><div class='ctx'> 	btrfs_put_block_group(block_group);</div><div class='ctx'> </div><div class='del'>-	if (fs_info-&gt;first_logical_byte == block_group-&gt;start)</div><div class='del'>-		fs_info-&gt;first_logical_byte = (u64)-1;</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;block_group_cache_lock);</div><div class='add'>+	write_unlock(&amp;fs_info-&gt;block_group_cache_lock);</div><div class='ctx'> </div><div class='ctx'> 	down_write(&amp;block_group-&gt;space_info-&gt;groups_sem);</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -977,32 +1182,31 @@ int btrfs_remove_block_group(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		kobject_put(kobj);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (block_group-&gt;has_caching_ctl)</div><div class='del'>-		caching_ctl = btrfs_get_caching_control(block_group);</div><div class='ctx'> 	if (block_group-&gt;cached == BTRFS_CACHE_STARTED)</div><div class='ctx'> 		btrfs_wait_block_group_cache_done(block_group);</div><div class='del'>-	if (block_group-&gt;has_caching_ctl) {</div><div class='del'>-		spin_lock(&amp;fs_info-&gt;block_group_cache_lock);</div><div class='del'>-		if (!caching_ctl) {</div><div class='del'>-			struct btrfs_caching_control *ctl;</div><div class='del'>-</div><div class='del'>-			list_for_each_entry(ctl,</div><div class='del'>-				    &amp;fs_info-&gt;caching_block_groups, list)</div><div class='del'>-				if (ctl-&gt;block_group == block_group) {</div><div class='del'>-					caching_ctl = ctl;</div><div class='del'>-					refcount_inc(&amp;caching_ctl-&gt;count);</div><div class='del'>-					break;</div><div class='del'>-				}</div><div class='del'>-		}</div><div class='del'>-		if (caching_ctl)</div><div class='del'>-			list_del_init(&amp;caching_ctl-&gt;list);</div><div class='del'>-		spin_unlock(&amp;fs_info-&gt;block_group_cache_lock);</div><div class='del'>-		if (caching_ctl) {</div><div class='del'>-			/* Once for the caching bgs list and once for us. */</div><div class='del'>-			btrfs_put_caching_control(caching_ctl);</div><div class='del'>-			btrfs_put_caching_control(caching_ctl);</div><div class='add'>+</div><div class='add'>+	write_lock(&amp;fs_info-&gt;block_group_cache_lock);</div><div class='add'>+	caching_ctl = btrfs_get_caching_control(block_group);</div><div class='add'>+	if (!caching_ctl) {</div><div class='add'>+		struct btrfs_caching_control *ctl;</div><div class='add'>+</div><div class='add'>+		list_for_each_entry(ctl, &amp;fs_info-&gt;caching_block_groups, list) {</div><div class='add'>+			if (ctl-&gt;block_group == block_group) {</div><div class='add'>+				caching_ctl = ctl;</div><div class='add'>+				refcount_inc(&amp;caching_ctl-&gt;count);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='add'>+	if (caching_ctl)</div><div class='add'>+		list_del_init(&amp;caching_ctl-&gt;list);</div><div class='add'>+	write_unlock(&amp;fs_info-&gt;block_group_cache_lock);</div><div class='add'>+</div><div class='add'>+	if (caching_ctl) {</div><div class='add'>+		/* Once for the caching bgs list and once for us. */</div><div class='add'>+		btrfs_put_caching_control(caching_ctl);</div><div class='add'>+		btrfs_put_caching_control(caching_ctl);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;trans-&gt;transaction-&gt;dirty_bgs_lock);</div><div class='ctx'> 	WARN_ON(!list_empty(&amp;block_group-&gt;dirty_list));</div><div class='hunk'>@@ -1027,8 +1231,8 @@ int btrfs_remove_block_group(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	block_group-&gt;space_info-&gt;total_bytes -= block_group-&gt;length;</div><div class='ctx'> 	block_group-&gt;space_info-&gt;bytes_readonly -=</div><div class='ctx'> 		(block_group-&gt;length - block_group-&gt;zone_unusable);</div><div class='del'>-	block_group-&gt;space_info-&gt;bytes_zone_unusable -=</div><div class='del'>-		block_group-&gt;zone_unusable;</div><div class='add'>+	btrfs_space_info_update_bytes_zone_unusable(block_group-&gt;space_info,</div><div class='add'>+						    -block_group-&gt;zone_unusable);</div><div class='ctx'> 	block_group-&gt;space_info-&gt;disk_total -= block_group-&gt;length * factor;</div><div class='ctx'> </div><div class='ctx'> 	spin_unlock(&amp;block_group-&gt;space_info-&gt;lock);</div><div class='hunk'>@@ -1044,7 +1248,7 @@ int btrfs_remove_block_group(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * another task to attempt to create another block group with the same</div><div class='ctx'> 	 * item key (and failing with -EEXIST and a transaction abort).</div><div class='ctx'> 	 */</div><div class='del'>-	ret = remove_block_group_free_space(trans, block_group);</div><div class='add'>+	ret = btrfs_remove_block_group_free_space(trans, block_group);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -1053,7 +1257,17 @@ int btrfs_remove_block_group(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;block_group-&gt;lock);</div><div class='del'>-	block_group-&gt;removed = 1;</div><div class='add'>+	/*</div><div class='add'>+	 * Hitting this WARN means we removed a block group with an unwritten</div><div class='add'>+	 * region. It will cause "unable to find chunk map for logical" errors.</div><div class='add'>+	 */</div><div class='add'>+	if (WARN_ON(has_unwritten_metadata(block_group)))</div><div class='add'>+		btrfs_warn(fs_info,</div><div class='add'>+			   "block group %llu is removed before metadata write out",</div><div class='add'>+			   block_group-&gt;start);</div><div class='add'>+</div><div class='add'>+	set_bit(BLOCK_GROUP_FLAG_REMOVED, &amp;block_group-&gt;runtime_flags);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * At this point trimming or scrub can't start on this block group,</div><div class='ctx'> 	 * because we removed the block group from the rbtree</div><div class='hunk'>@@ -1064,7 +1278,7 @@ int btrfs_remove_block_group(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * entries because we already removed them all when we called</div><div class='ctx'> 	 * btrfs_remove_free_space_cache().</div><div class='ctx'> 	 *</div><div class='del'>-	 * And we must not remove the extent map from the fs_info-&gt;mapping_tree</div><div class='add'>+	 * And we must not remove the chunk map from the fs_info-&gt;mapping_tree</div><div class='ctx'> 	 * to prevent the same logical address range and physical device space</div><div class='ctx'> 	 * ranges from being reused for a new block group. This is needed to</div><div class='ctx'> 	 * avoid races with trimming and scrub.</div><div class='hunk'>@@ -1080,41 +1294,30 @@ int btrfs_remove_block_group(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * in place until the extents have been discarded completely when</div><div class='ctx'> 	 * the transaction commit has completed.</div><div class='ctx'> 	 */</div><div class='del'>-	remove_em = (atomic_read(&amp;block_group-&gt;frozen) == 0);</div><div class='add'>+	remove_map = (atomic_read(&amp;block_group-&gt;frozen) == 0);</div><div class='ctx'> 	spin_unlock(&amp;block_group-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	if (remove_em) {</div><div class='del'>-		struct extent_map_tree *em_tree;</div><div class='del'>-</div><div class='del'>-		em_tree = &amp;fs_info-&gt;mapping_tree;</div><div class='del'>-		write_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-		remove_extent_mapping(em_tree, em);</div><div class='del'>-		write_unlock(&amp;em_tree-&gt;lock);</div><div class='del'>-		/* once for the tree */</div><div class='del'>-		free_extent_map(em);</div><div class='del'>-	}</div><div class='add'>+	if (remove_map)</div><div class='add'>+		btrfs_remove_chunk_map(fs_info, map);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	/* Once for the lookup reference */</div><div class='ctx'> 	btrfs_put_block_group(block_group);</div><div class='ctx'> 	if (remove_rsv)</div><div class='del'>-		btrfs_delayed_refs_rsv_release(fs_info, 1);</div><div class='del'>-	btrfs_free_path(path);</div><div class='add'>+		btrfs_dec_delayed_refs_rsv_bg_updates(fs_info);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct btrfs_trans_handle *btrfs_start_trans_remove_block_group(</div><div class='ctx'> 		struct btrfs_fs_info *fs_info, const u64 chunk_offset)</div><div class='ctx'> {</div><div class='del'>-	struct extent_map_tree *em_tree = &amp;fs_info-&gt;mapping_tree;</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	struct map_lookup *map;</div><div class='add'>+	struct btrfs_root *root = btrfs_block_group_root(fs_info);</div><div class='add'>+	struct btrfs_chunk_map *map;</div><div class='ctx'> 	unsigned int num_items;</div><div class='ctx'> </div><div class='del'>-	read_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	em = lookup_extent_mapping(em_tree, chunk_offset, 1);</div><div class='del'>-	read_unlock(&amp;em_tree-&gt;lock);</div><div class='del'>-	ASSERT(em &amp;&amp; em-&gt;start == chunk_offset);</div><div class='add'>+	map = btrfs_find_chunk_map(fs_info, chunk_offset, 1);</div><div class='add'>+	ASSERT(map != NULL);</div><div class='add'>+	ASSERT(map-&gt;start == chunk_offset);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We need to reserve 3 + N units from the metadata space info in order</div><div class='hunk'>@@ -1135,12 +1338,10 @@ struct btrfs_trans_handle *btrfs_start_trans_remove_block_group(</div><div class='ctx'> 	 * more device items and remove one chunk item), but this is done at</div><div class='ctx'> 	 * btrfs_remove_chunk() through a call to check_system_chunk().</div><div class='ctx'> 	 */</div><div class='del'>-	map = em-&gt;map_lookup;</div><div class='ctx'> 	num_items = 3 + map-&gt;num_stripes;</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_chunk_map(map);</div><div class='ctx'> </div><div class='del'>-	return btrfs_start_transaction_fallback_global_rsv(fs_info-&gt;extent_root,</div><div class='del'>-							   num_items);</div><div class='add'>+	return btrfs_start_transaction_fallback_global_rsv(root, num_items);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1156,7 +1357,7 @@ struct btrfs_trans_handle *btrfs_start_trans_remove_block_group(</div><div class='ctx'>  * data in this block group. That check should be done by relocation routine,</div><div class='ctx'>  * not this function.</div><div class='ctx'>  */</div><div class='del'>-static int inc_block_group_ro(struct btrfs_block_group *cache, int force)</div><div class='add'>+static int inc_block_group_ro(struct btrfs_block_group *cache, bool force)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_space_info *sinfo = cache-&gt;space_info;</div><div class='ctx'> 	u64 num_bytes;</div><div class='hunk'>@@ -1201,8 +1402,7 @@ static int inc_block_group_ro(struct btrfs_block_group *cache, int force)</div><div class='ctx'> 		 * BTRFS_RESERVE_NO_FLUSH to give ourselves the most amount of</div><div class='ctx'> 		 * leeway to allow us to mark this block group as read only.</div><div class='ctx'> 		 */</div><div class='del'>-		if (btrfs_can_overcommit(cache-&gt;fs_info, sinfo, num_bytes,</div><div class='del'>-					 BTRFS_RESERVE_NO_FLUSH))</div><div class='add'>+		if (btrfs_can_overcommit(sinfo, num_bytes, BTRFS_RESERVE_NO_FLUSH))</div><div class='ctx'> 			ret = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1211,7 +1411,7 @@ static int inc_block_group_ro(struct btrfs_block_group *cache, int force)</div><div class='ctx'> 		if (btrfs_is_zoned(cache-&gt;fs_info)) {</div><div class='ctx'> 			/* Migrate zone_unusable bytes to readonly */</div><div class='ctx'> 			sinfo-&gt;bytes_readonly += cache-&gt;zone_unusable;</div><div class='del'>-			sinfo-&gt;bytes_zone_unusable -= cache-&gt;zone_unusable;</div><div class='add'>+			btrfs_space_info_update_bytes_zone_unusable(sinfo, -cache-&gt;zone_unusable);</div><div class='ctx'> 			cache-&gt;zone_unusable = 0;</div><div class='ctx'> 		}</div><div class='ctx'> 		cache-&gt;ro++;</div><div class='hunk'>@@ -1223,24 +1423,23 @@ out:</div><div class='ctx'> 	if (ret == -ENOSPC &amp;&amp; btrfs_test_opt(cache-&gt;fs_info, ENOSPC_DEBUG)) {</div><div class='ctx'> 		btrfs_info(cache-&gt;fs_info,</div><div class='ctx'> 			"unable to make block group %llu ro", cache-&gt;start);</div><div class='del'>-		btrfs_dump_space_info(cache-&gt;fs_info, cache-&gt;space_info, 0, 0);</div><div class='add'>+		btrfs_dump_space_info(cache-&gt;space_info, 0, false);</div><div class='ctx'> 	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool clean_pinned_extents(struct btrfs_trans_handle *trans,</div><div class='del'>-				 struct btrfs_block_group *bg)</div><div class='add'>+				 const struct btrfs_block_group *bg)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = bg-&gt;fs_info;</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_transaction *prev_trans = NULL;</div><div class='ctx'> 	const u64 start = bg-&gt;start;</div><div class='ctx'> 	const u64 end = start + bg-&gt;length - 1;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;trans_lock);</div><div class='del'>-	if (trans-&gt;transaction-&gt;list.prev != &amp;fs_info-&gt;trans_list) {</div><div class='del'>-		prev_trans = list_last_entry(&amp;trans-&gt;transaction-&gt;list,</div><div class='del'>-					     struct btrfs_transaction, list);</div><div class='add'>+	if (!list_is_first(&amp;trans-&gt;transaction-&gt;list, &amp;fs_info-&gt;trans_list)) {</div><div class='add'>+		prev_trans = list_prev_entry(trans-&gt;transaction, list);</div><div class='ctx'> 		refcount_inc(&amp;prev_trans-&gt;use_count);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='hunk'>@@ -1253,18 +1452,18 @@ static bool clean_pinned_extents(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * group in pinned_extents before we were able to clear the whole block</div><div class='ctx'> 	 * group range from pinned_extents. This means that task can lookup for</div><div class='ctx'> 	 * the block group after we unpinned it from pinned_extents and removed</div><div class='del'>-	 * it, leading to a BUG_ON() at unpin_extent_range().</div><div class='add'>+	 * it, leading to an error at unpin_extent_range().</div><div class='ctx'> 	 */</div><div class='ctx'> 	mutex_lock(&amp;fs_info-&gt;unused_bg_unpin_mutex);</div><div class='ctx'> 	if (prev_trans) {</div><div class='del'>-		ret = clear_extent_bits(&amp;prev_trans-&gt;pinned_extents, start, end,</div><div class='del'>-					EXTENT_DIRTY);</div><div class='add'>+		ret = btrfs_clear_extent_bit(&amp;prev_trans-&gt;pinned_extents, start, end,</div><div class='add'>+					     EXTENT_DIRTY, NULL);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = clear_extent_bits(&amp;trans-&gt;transaction-&gt;pinned_extents, start, end,</div><div class='del'>-				EXTENT_DIRTY);</div><div class='add'>+	ret = btrfs_clear_extent_bit(&amp;trans-&gt;transaction-&gt;pinned_extents, start, end,</div><div class='add'>+				     EXTENT_DIRTY, NULL);</div><div class='ctx'> out:</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;unused_bg_unpin_mutex);</div><div class='ctx'> 	if (prev_trans)</div><div class='hunk'>@@ -1274,11 +1473,38 @@ out:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * Link the block_group to a list via bg_list.</div><div class='add'>+ *</div><div class='add'>+ * @bg:       The block_group to link to the list.</div><div class='add'>+ * @list:     The list to link it to.</div><div class='add'>+ *</div><div class='add'>+ * Use this rather than list_add_tail() directly to ensure proper respect</div><div class='add'>+ * to locking and refcounting.</div><div class='add'>+ *</div><div class='add'>+ * Returns: true if the bg was linked with a refcount bump and false otherwise.</div><div class='add'>+ */</div><div class='add'>+static bool btrfs_link_bg_list(struct btrfs_block_group *bg, struct list_head *list)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = bg-&gt;fs_info;</div><div class='add'>+	bool added = false;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='add'>+	if (list_empty(&amp;bg-&gt;bg_list)) {</div><div class='add'>+		btrfs_get_block_group(bg);</div><div class='add'>+		list_add_tail(&amp;bg-&gt;bg_list, list);</div><div class='add'>+		added = true;</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='add'>+	return added;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * Process the unused_bgs list and remove any that don't have any allocated</div><div class='ctx'>  * space inside of them.</div><div class='ctx'>  */</div><div class='ctx'> void btrfs_delete_unused_bgs(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='add'>+	LIST_HEAD(retry_list);</div><div class='ctx'> 	struct btrfs_block_group *block_group;</div><div class='ctx'> 	struct btrfs_space_info *space_info;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='hunk'>@@ -1288,6 +1514,9 @@ void btrfs_delete_unused_bgs(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	if (!test_bit(BTRFS_FS_OPEN, &amp;fs_info-&gt;flags))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='add'>+	if (btrfs_fs_closing(fs_info))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Long running balances can keep us blocked here for eternity, so</div><div class='ctx'> 	 * simply skip deletion if we're unable to get the mutex.</div><div class='hunk'>@@ -1297,6 +1526,7 @@ void btrfs_delete_unused_bgs(struct btrfs_fs_info *fs_info)</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='ctx'> 	while (!list_empty(&amp;fs_info-&gt;unused_bgs)) {</div><div class='add'>+		u64 used;</div><div class='ctx'> 		int trimming;</div><div class='ctx'> </div><div class='ctx'> 		block_group = list_first_entry(&amp;fs_info-&gt;unused_bgs,</div><div class='hunk'>@@ -1332,22 +1562,69 @@ void btrfs_delete_unused_bgs(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 			goto next;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		spin_lock(&amp;space_info-&gt;lock);</div><div class='ctx'> 		spin_lock(&amp;block_group-&gt;lock);</div><div class='del'>-		if (block_group-&gt;reserved || block_group-&gt;pinned ||</div><div class='del'>-		    block_group-&gt;used || block_group-&gt;ro ||</div><div class='add'>+		if (btrfs_is_block_group_used(block_group) || block_group-&gt;ro ||</div><div class='ctx'> 		    list_is_singular(&amp;block_group-&gt;list)) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * We want to bail if we made new allocations or have</div><div class='ctx'> 			 * outstanding allocations in this block group.  We do</div><div class='ctx'> 			 * the ro check in case balance is currently acting on</div><div class='ctx'> 			 * this block group.</div><div class='add'>+			 *</div><div class='add'>+			 * Also bail out if this is the only block group for its</div><div class='add'>+			 * type, because otherwise we would lose profile</div><div class='add'>+			 * information from fs_info-&gt;avail_*_alloc_bits and the</div><div class='add'>+			 * next block group of this type would be created with a</div><div class='add'>+			 * "single" profile (even if we're in a raid fs) because</div><div class='add'>+			 * fs_info-&gt;avail_*_alloc_bits would be 0.</div><div class='add'>+			 */</div><div class='add'>+			trace_btrfs_skip_unused_block_group(block_group);</div><div class='add'>+			spin_unlock(&amp;block_group-&gt;lock);</div><div class='add'>+			spin_unlock(&amp;space_info-&gt;lock);</div><div class='add'>+			up_write(&amp;space_info-&gt;groups_sem);</div><div class='add'>+			goto next;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * The block group may be unused but there may be space reserved</div><div class='add'>+		 * accounting with the existence of that block group, that is,</div><div class='add'>+		 * space_info-&gt;bytes_may_use was incremented by a task but no</div><div class='add'>+		 * space was yet allocated from the block group by the task.</div><div class='add'>+		 * That space may or may not be allocated, as we are generally</div><div class='add'>+		 * pessimistic about space reservation for metadata as well as</div><div class='add'>+		 * for data when using compression (as we reserve space based on</div><div class='add'>+		 * the worst case, when data can't be compressed, and before</div><div class='add'>+		 * actually attempting compression, before starting writeback).</div><div class='add'>+		 *</div><div class='add'>+		 * So check if the total space of the space_info minus the size</div><div class='add'>+		 * of this block group is less than the used space of the</div><div class='add'>+		 * space_info - if that's the case, then it means we have tasks</div><div class='add'>+		 * that might be relying on the block group in order to allocate</div><div class='add'>+		 * extents, and add back the block group to the unused list when</div><div class='add'>+		 * we finish, so that we retry later in case no tasks ended up</div><div class='add'>+		 * needing to allocate extents from the block group.</div><div class='add'>+		 */</div><div class='add'>+		used = btrfs_space_info_used(space_info, true);</div><div class='add'>+		if ((space_info-&gt;total_bytes - block_group-&gt;length &lt; used &amp;&amp;</div><div class='add'>+		     block_group-&gt;zone_unusable &lt; block_group-&gt;length) ||</div><div class='add'>+		    has_unwritten_metadata(block_group)) {</div><div class='add'>+			/*</div><div class='add'>+			 * Add a reference for the list, compensate for the ref</div><div class='add'>+			 * drop under the "next" label for the</div><div class='add'>+			 * fs_info-&gt;unused_bgs list.</div><div class='ctx'> 			 */</div><div class='add'>+			btrfs_link_bg_list(block_group, &amp;retry_list);</div><div class='add'>+</div><div class='ctx'> 			trace_btrfs_skip_unused_block_group(block_group);</div><div class='ctx'> 			spin_unlock(&amp;block_group-&gt;lock);</div><div class='add'>+			spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> 			up_write(&amp;space_info-&gt;groups_sem);</div><div class='ctx'> 			goto next;</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='ctx'> 		spin_unlock(&amp;block_group-&gt;lock);</div><div class='add'>+		spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 		/* We don't want to force the issue, only flip if it's ok. */</div><div class='ctx'> 		ret = inc_block_group_ro(block_group, 0);</div><div class='hunk'>@@ -1357,6 +1634,16 @@ void btrfs_delete_unused_bgs(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 			goto next;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		ret = btrfs_zone_finish(block_group);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			btrfs_dec_block_group_ro(block_group);</div><div class='add'>+			if (ret == -EAGAIN) {</div><div class='add'>+				btrfs_link_bg_list(block_group, &amp;retry_list);</div><div class='add'>+				ret = 0;</div><div class='add'>+			}</div><div class='add'>+			goto next;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Want to do this before we do anything else so we can recover</div><div class='ctx'> 		 * properly if we fail to join the transaction.</div><div class='hunk'>@@ -1399,8 +1686,7 @@ void btrfs_delete_unused_bgs(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 		spin_lock(&amp;space_info-&gt;lock);</div><div class='ctx'> 		spin_lock(&amp;block_group-&gt;lock);</div><div class='ctx'> </div><div class='del'>-		btrfs_space_info_update_bytes_pinned(fs_info, space_info,</div><div class='del'>-						     -block_group-&gt;pinned);</div><div class='add'>+		btrfs_space_info_update_bytes_pinned(space_info, -block_group-&gt;pinned);</div><div class='ctx'> 		space_info-&gt;bytes_readonly += block_group-&gt;pinned;</div><div class='ctx'> 		block_group-&gt;pinned = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -1463,12 +1749,16 @@ next:</div><div class='ctx'> 		btrfs_put_block_group(block_group);</div><div class='ctx'> 		spin_lock(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='ctx'> 	}</div><div class='add'>+	list_splice_tail(&amp;retry_list, &amp;fs_info-&gt;unused_bgs);</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;reclaim_bgs_lock);</div><div class='ctx'> 	return;</div><div class='ctx'> </div><div class='ctx'> flip_async:</div><div class='ctx'> 	btrfs_end_transaction(trans);</div><div class='add'>+	spin_lock(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='add'>+	list_splice_tail(&amp;retry_list, &amp;fs_info-&gt;unused_bgs);</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;reclaim_bgs_lock);</div><div class='ctx'> 	btrfs_put_block_group(block_group);</div><div class='ctx'> 	btrfs_discard_punt_unused_bgs_list(fs_info);</div><div class='hunk'>@@ -1483,6 +1773,10 @@ void btrfs_mark_bg_unused(struct btrfs_block_group *bg)</div><div class='ctx'> 		btrfs_get_block_group(bg);</div><div class='ctx'> 		trace_btrfs_add_unused_block_group(bg);</div><div class='ctx'> 		list_add_tail(&amp;bg-&gt;bg_list, &amp;fs_info-&gt;unused_bgs);</div><div class='add'>+	} else if (!test_bit(BLOCK_GROUP_FLAG_NEW, &amp;bg-&gt;runtime_flags)) {</div><div class='add'>+		/* Pull out the block group from the reclaim_bgs list. */</div><div class='add'>+		trace_btrfs_add_unused_block_group(bg);</div><div class='add'>+		list_move_tail(&amp;bg-&gt;bg_list, &amp;fs_info-&gt;unused_bgs);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='ctx'> }</div><div class='hunk'>@@ -1499,7 +1793,42 @@ static int reclaim_bgs_cmp(void *unused, const struct list_head *a,</div><div class='ctx'> 	bg1 = list_entry(a, struct btrfs_block_group, bg_list);</div><div class='ctx'> 	bg2 = list_entry(b, struct btrfs_block_group, bg_list);</div><div class='ctx'> </div><div class='del'>-	return bg1-&gt;used &gt; bg2-&gt;used;</div><div class='add'>+	/*</div><div class='add'>+	 * Some other task may be updating the -&gt;used field concurrently, but it</div><div class='add'>+	 * is not serious if we get a stale value or load/store tearing issues,</div><div class='add'>+	 * as sorting the list of block groups to reclaim is not critical and an</div><div class='add'>+	 * occasional imperfect order is ok. So silence KCSAN and avoid the</div><div class='add'>+	 * overhead of locking or any other synchronization.</div><div class='add'>+	 */</div><div class='add'>+	return data_race(bg1-&gt;used &gt; bg2-&gt;used);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool btrfs_should_reclaim(const struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	if (btrfs_is_zoned(fs_info))</div><div class='add'>+		return btrfs_zoned_should_reclaim(fs_info);</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool should_reclaim_block_group(const struct btrfs_block_group *bg, u64 bytes_freed)</div><div class='add'>+{</div><div class='add'>+	const int thresh_pct = btrfs_calc_reclaim_threshold(bg-&gt;space_info);</div><div class='add'>+	u64 thresh_bytes = mult_perc(bg-&gt;length, thresh_pct);</div><div class='add'>+	const u64 new_val = bg-&gt;used;</div><div class='add'>+	const u64 old_val = new_val + bytes_freed;</div><div class='add'>+</div><div class='add'>+	if (thresh_bytes == 0)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If we were below the threshold before don't reclaim, we are likely a</div><div class='add'>+	 * brand new block group and we don't want to relocate new block groups.</div><div class='add'>+	 */</div><div class='add'>+	if (old_val &lt; thresh_bytes)</div><div class='add'>+		return false;</div><div class='add'>+	if (new_val &gt;= thresh_bytes)</div><div class='add'>+		return false;</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_reclaim_bgs_work(struct work_struct *work)</div><div class='hunk'>@@ -1508,11 +1837,19 @@ void btrfs_reclaim_bgs_work(struct work_struct *work)</div><div class='ctx'> 		container_of(work, struct btrfs_fs_info, reclaim_bgs_work);</div><div class='ctx'> 	struct btrfs_block_group *bg;</div><div class='ctx'> 	struct btrfs_space_info *space_info;</div><div class='del'>-	LIST_HEAD(again_list);</div><div class='add'>+	LIST_HEAD(retry_list);</div><div class='ctx'> </div><div class='ctx'> 	if (!test_bit(BTRFS_FS_OPEN, &amp;fs_info-&gt;flags))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='add'>+	if (btrfs_fs_closing(fs_info))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (!btrfs_should_reclaim(fs_info))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	guard(super_write)(fs_info-&gt;sb);</div><div class='add'>+</div><div class='ctx'> 	if (!btrfs_exclop_start(fs_info, BTRFS_EXCLOP_BALANCE))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='hunk'>@@ -1533,7 +1870,8 @@ void btrfs_reclaim_bgs_work(struct work_struct *work)</div><div class='ctx'> 	 */</div><div class='ctx'> 	list_sort(NULL, &amp;fs_info-&gt;reclaim_bgs, reclaim_bgs_cmp);</div><div class='ctx'> 	while (!list_empty(&amp;fs_info-&gt;reclaim_bgs)) {</div><div class='del'>-		u64 zone_unusable;</div><div class='add'>+		u64 used;</div><div class='add'>+		u64 reserved;</div><div class='ctx'> 		int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 		bg = list_first_entry(&amp;fs_info-&gt;reclaim_bgs,</div><div class='hunk'>@@ -1547,6 +1885,7 @@ void btrfs_reclaim_bgs_work(struct work_struct *work)</div><div class='ctx'> 		/* Don't race with allocators so take the groups_sem */</div><div class='ctx'> 		down_write(&amp;space_info-&gt;groups_sem);</div><div class='ctx'> </div><div class='add'>+		spin_lock(&amp;space_info-&gt;lock);</div><div class='ctx'> 		spin_lock(&amp;bg-&gt;lock);</div><div class='ctx'> 		if (bg-&gt;reserved || bg-&gt;pinned || bg-&gt;ro) {</div><div class='ctx'> 			/*</div><div class='hunk'>@@ -1556,57 +1895,144 @@ void btrfs_reclaim_bgs_work(struct work_struct *work)</div><div class='ctx'> 			 * this block group.</div><div class='ctx'> 			 */</div><div class='ctx'> 			spin_unlock(&amp;bg-&gt;lock);</div><div class='add'>+			spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> 			up_write(&amp;space_info-&gt;groups_sem);</div><div class='ctx'> 			goto next;</div><div class='ctx'> 		}</div><div class='del'>-		spin_unlock(&amp;bg-&gt;lock);</div><div class='add'>+		if (bg-&gt;used == 0) {</div><div class='add'>+			/*</div><div class='add'>+			 * It is possible that we trigger relocation on a block</div><div class='add'>+			 * group as its extents are deleted and it first goes</div><div class='add'>+			 * below the threshold, then shortly after goes empty.</div><div class='add'>+			 *</div><div class='add'>+			 * In this case, relocating it does delete it, but has</div><div class='add'>+			 * some overhead in relocation specific metadata, looking</div><div class='add'>+			 * for the non-existent extents and running some extra</div><div class='add'>+			 * transactions, which we can avoid by using one of the</div><div class='add'>+			 * other mechanisms for dealing with empty block groups.</div><div class='add'>+			 */</div><div class='add'>+			if (!btrfs_test_opt(fs_info, DISCARD_ASYNC))</div><div class='add'>+				btrfs_mark_bg_unused(bg);</div><div class='add'>+			spin_unlock(&amp;bg-&gt;lock);</div><div class='add'>+			spin_unlock(&amp;space_info-&gt;lock);</div><div class='add'>+			up_write(&amp;space_info-&gt;groups_sem);</div><div class='add'>+			goto next;</div><div class='ctx'> </div><div class='del'>-		/* Get out fast, in case we're unmounting the filesystem */</div><div class='del'>-		if (btrfs_fs_closing(fs_info)) {</div><div class='add'>+		}</div><div class='add'>+		/*</div><div class='add'>+		 * The block group might no longer meet the reclaim condition by</div><div class='add'>+		 * the time we get around to reclaiming it, so to avoid</div><div class='add'>+		 * reclaiming overly full block_groups, skip reclaiming them.</div><div class='add'>+		 *</div><div class='add'>+		 * Since the decision making process also depends on the amount</div><div class='add'>+		 * being freed, pass in a fake giant value to skip that extra</div><div class='add'>+		 * check, which is more meaningful when adding to the list in</div><div class='add'>+		 * the first place.</div><div class='add'>+		 */</div><div class='add'>+		if (!should_reclaim_block_group(bg, bg-&gt;length)) {</div><div class='add'>+			spin_unlock(&amp;bg-&gt;lock);</div><div class='add'>+			spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> 			up_write(&amp;space_info-&gt;groups_sem);</div><div class='ctx'> 			goto next;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		spin_unlock(&amp;bg-&gt;lock);</div><div class='add'>+		spin_unlock(&amp;space_info-&gt;lock);</div><div class='add'>+</div><div class='ctx'> 		/*</div><div class='del'>-		 * Cache the zone_unusable value before turning the block group</div><div class='del'>-		 * to read only. As soon as the blog group is read only it's</div><div class='del'>-		 * zone_unusable value gets moved to the block group's read-only</div><div class='del'>-		 * bytes and isn't available for calculations anymore.</div><div class='add'>+		 * Get out fast, in case we're read-only or unmounting the</div><div class='add'>+		 * filesystem. It is OK to drop block groups from the list even</div><div class='add'>+		 * for the read-only case. As we did take the super write lock,</div><div class='add'>+		 * "mount -o remount,ro" won't happen and read-only filesystem</div><div class='add'>+		 * means it is forced read-only due to a fatal error. So, it</div><div class='add'>+		 * never gets back to read-write to let us reclaim again.</div><div class='ctx'> 		 */</div><div class='del'>-		zone_unusable = bg-&gt;zone_unusable;</div><div class='add'>+		if (btrfs_need_cleaner_sleep(fs_info)) {</div><div class='add'>+			up_write(&amp;space_info-&gt;groups_sem);</div><div class='add'>+			goto next;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		ret = inc_block_group_ro(bg, 0);</div><div class='ctx'> 		up_write(&amp;space_info-&gt;groups_sem);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto next;</div><div class='ctx'> </div><div class='del'>-		btrfs_info(fs_info,</div><div class='del'>-			"reclaiming chunk %llu with %llu%% used %llu%% unusable",</div><div class='del'>-				bg-&gt;start, div_u64(bg-&gt;used * 100, bg-&gt;length),</div><div class='del'>-				div64_u64(zone_unusable * 100, bg-&gt;length));</div><div class='add'>+		/*</div><div class='add'>+		 * The amount of bytes reclaimed corresponds to the sum of the</div><div class='add'>+		 * "used" and "reserved" counters. We have set the block group</div><div class='add'>+		 * to RO above, which prevents reservations from happening but</div><div class='add'>+		 * we may have existing reservations for which allocation has</div><div class='add'>+		 * not yet been done - btrfs_update_block_group() was not yet</div><div class='add'>+		 * called, which is where we will transfer a reserved extent's</div><div class='add'>+		 * size from the "reserved" counter to the "used" counter - this</div><div class='add'>+		 * happens when running delayed references. When we relocate the</div><div class='add'>+		 * chunk below, relocation first flushes delalloc, waits for</div><div class='add'>+		 * ordered extent completion (which is where we create delayed</div><div class='add'>+		 * references for data extents) and commits the current</div><div class='add'>+		 * transaction (which runs delayed references), and only after</div><div class='add'>+		 * it does the actual work to move extents out of the block</div><div class='add'>+		 * group. So the reported amount of reclaimed bytes is</div><div class='add'>+		 * effectively the sum of the 'used' and 'reserved' counters.</div><div class='add'>+		 */</div><div class='add'>+		spin_lock(&amp;bg-&gt;lock);</div><div class='add'>+		used = bg-&gt;used;</div><div class='add'>+		reserved = bg-&gt;reserved;</div><div class='add'>+		spin_unlock(&amp;bg-&gt;lock);</div><div class='add'>+</div><div class='ctx'> 		trace_btrfs_reclaim_block_group(bg);</div><div class='del'>-		ret = btrfs_relocate_chunk(fs_info, bg-&gt;start);</div><div class='del'>-		if (ret &amp;&amp; ret != -EAGAIN)</div><div class='add'>+		ret = btrfs_relocate_chunk(fs_info, bg-&gt;start, false);</div><div class='add'>+		if (ret) {</div><div class='add'>+			btrfs_dec_block_group_ro(bg);</div><div class='ctx'> 			btrfs_err(fs_info, "error relocating chunk %llu",</div><div class='ctx'> 				  bg-&gt;start);</div><div class='add'>+			used = 0;</div><div class='add'>+			reserved = 0;</div><div class='add'>+			spin_lock(&amp;space_info-&gt;lock);</div><div class='add'>+			space_info-&gt;reclaim_errors++;</div><div class='add'>+			if (READ_ONCE(space_info-&gt;periodic_reclaim))</div><div class='add'>+				space_info-&gt;periodic_reclaim_ready = false;</div><div class='add'>+			spin_unlock(&amp;space_info-&gt;lock);</div><div class='add'>+		}</div><div class='add'>+		spin_lock(&amp;space_info-&gt;lock);</div><div class='add'>+		space_info-&gt;reclaim_count++;</div><div class='add'>+		space_info-&gt;reclaim_bytes += used;</div><div class='add'>+		space_info-&gt;reclaim_bytes += reserved;</div><div class='add'>+		spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> next:</div><div class='add'>+		if (ret &amp;&amp; !READ_ONCE(space_info-&gt;periodic_reclaim))</div><div class='add'>+			btrfs_link_bg_list(bg, &amp;retry_list);</div><div class='add'>+		btrfs_put_block_group(bg);</div><div class='add'>+</div><div class='add'>+		mutex_unlock(&amp;fs_info-&gt;reclaim_bgs_lock);</div><div class='add'>+		/*</div><div class='add'>+		 * Reclaiming all the block groups in the list can take really</div><div class='add'>+		 * long.  Prioritize cleaning up unused block groups.</div><div class='add'>+		 */</div><div class='add'>+		btrfs_delete_unused_bgs(fs_info);</div><div class='add'>+		/*</div><div class='add'>+		 * If we are interrupted by a balance, we can just bail out. The</div><div class='add'>+		 * cleaner thread restart again if necessary.</div><div class='add'>+		 */</div><div class='add'>+		if (!mutex_trylock(&amp;fs_info-&gt;reclaim_bgs_lock))</div><div class='add'>+			goto end;</div><div class='ctx'> 		spin_lock(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='del'>-		if (ret == -EAGAIN &amp;&amp; list_empty(&amp;bg-&gt;bg_list))</div><div class='del'>-			list_add_tail(&amp;bg-&gt;bg_list, &amp;again_list);</div><div class='del'>-		else</div><div class='del'>-			btrfs_put_block_group(bg);</div><div class='ctx'> 	}</div><div class='del'>-	list_splice_tail(&amp;again_list, &amp;fs_info-&gt;reclaim_bgs);</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;reclaim_bgs_lock);</div><div class='add'>+end:</div><div class='add'>+	spin_lock(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='add'>+	list_splice_tail(&amp;retry_list, &amp;fs_info-&gt;reclaim_bgs);</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='ctx'> 	btrfs_exclop_finish(fs_info);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_reclaim_bgs(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='add'>+	btrfs_reclaim_sweep(fs_info);</div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='ctx'> 	if (!list_empty(&amp;fs_info-&gt;reclaim_bgs))</div><div class='del'>-		queue_work(system_unbound_wq, &amp;fs_info-&gt;reclaim_bgs_work);</div><div class='add'>+		queue_work(system_dfl_wq, &amp;fs_info-&gt;reclaim_bgs_work);</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1614,20 +2040,14 @@ void btrfs_mark_bg_to_reclaim(struct btrfs_block_group *bg)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = bg-&gt;fs_info;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='del'>-	if (list_empty(&amp;bg-&gt;bg_list)) {</div><div class='del'>-		btrfs_get_block_group(bg);</div><div class='add'>+	if (btrfs_link_bg_list(bg, &amp;fs_info-&gt;reclaim_bgs))</div><div class='ctx'> 		trace_btrfs_add_reclaim_block_group(bg);</div><div class='del'>-		list_add_tail(&amp;bg-&gt;bg_list, &amp;fs_info-&gt;reclaim_bgs);</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int read_bg_from_eb(struct btrfs_fs_info *fs_info, struct btrfs_key *key,</div><div class='del'>-			   struct btrfs_path *path)</div><div class='add'>+static int read_bg_from_eb(struct btrfs_fs_info *fs_info, const struct btrfs_key *key,</div><div class='add'>+			   const struct btrfs_path *path)</div><div class='ctx'> {</div><div class='del'>-	struct extent_map_tree *em_tree;</div><div class='del'>-	struct extent_map *em;</div><div class='add'>+	struct btrfs_chunk_map *map;</div><div class='ctx'> 	struct btrfs_block_group_item bg;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	int slot;</div><div class='hunk'>@@ -1637,23 +2057,20 @@ static int read_bg_from_eb(struct btrfs_fs_info *fs_info, struct btrfs_key *key,</div><div class='ctx'> 	slot = path-&gt;slots[0];</div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> </div><div class='del'>-	em_tree = &amp;fs_info-&gt;mapping_tree;</div><div class='del'>-	read_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	em = lookup_extent_mapping(em_tree, key-&gt;objectid, key-&gt;offset);</div><div class='del'>-	read_unlock(&amp;em_tree-&gt;lock);</div><div class='del'>-	if (!em) {</div><div class='add'>+	map = btrfs_find_chunk_map(fs_info, key-&gt;objectid, key-&gt;offset);</div><div class='add'>+	if (!map) {</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='ctx'> 			  "logical %llu len %llu found bg but no related chunk",</div><div class='ctx'> 			  key-&gt;objectid, key-&gt;offset);</div><div class='ctx'> 		return -ENOENT;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (em-&gt;start != key-&gt;objectid || em-&gt;len != key-&gt;offset) {</div><div class='add'>+	if (unlikely(map-&gt;start != key-&gt;objectid || map-&gt;chunk_len != key-&gt;offset)) {</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='ctx'> 			"block group %llu len %llu mismatch with chunk %llu len %llu",</div><div class='del'>-			key-&gt;objectid, key-&gt;offset, em-&gt;start, em-&gt;len);</div><div class='add'>+			  key-&gt;objectid, key-&gt;offset, map-&gt;start, map-&gt;chunk_len);</div><div class='ctx'> 		ret = -EUCLEAN;</div><div class='del'>-		goto out_free_em;</div><div class='add'>+		goto out_free_map;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	read_extent_buffer(leaf, &amp;bg, btrfs_item_ptr_offset(leaf, slot),</div><div class='hunk'>@@ -1661,55 +2078,33 @@ static int read_bg_from_eb(struct btrfs_fs_info *fs_info, struct btrfs_key *key,</div><div class='ctx'> 	flags = btrfs_stack_block_group_flags(&amp;bg) &amp;</div><div class='ctx'> 		BTRFS_BLOCK_GROUP_TYPE_MASK;</div><div class='ctx'> </div><div class='del'>-	if (flags != (em-&gt;map_lookup-&gt;type &amp; BTRFS_BLOCK_GROUP_TYPE_MASK)) {</div><div class='add'>+	if (unlikely(flags != (map-&gt;type &amp; BTRFS_BLOCK_GROUP_TYPE_MASK))) {</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='ctx'> "block group %llu len %llu type flags 0x%llx mismatch with chunk type flags 0x%llx",</div><div class='ctx'> 			  key-&gt;objectid, key-&gt;offset, flags,</div><div class='del'>-			  (BTRFS_BLOCK_GROUP_TYPE_MASK &amp; em-&gt;map_lookup-&gt;type));</div><div class='add'>+			  (BTRFS_BLOCK_GROUP_TYPE_MASK &amp; map-&gt;type));</div><div class='ctx'> 		ret = -EUCLEAN;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-out_free_em:</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+out_free_map:</div><div class='add'>+	btrfs_free_chunk_map(map);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int find_first_block_group(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				  struct btrfs_path *path,</div><div class='del'>-				  struct btrfs_key *key)</div><div class='add'>+				  const struct btrfs_key *key)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *root = fs_info-&gt;extent_root;</div><div class='add'>+	struct btrfs_root *root = btrfs_block_group_root(fs_info);</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct btrfs_key found_key;</div><div class='del'>-	struct extent_buffer *leaf;</div><div class='del'>-	int slot;</div><div class='del'>-</div><div class='del'>-	ret = btrfs_search_slot(NULL, root, key, path, 0, 0);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	while (1) {</div><div class='del'>-		slot = path-&gt;slots[0];</div><div class='del'>-		leaf = path-&gt;nodes[0];</div><div class='del'>-		if (slot &gt;= btrfs_header_nritems(leaf)) {</div><div class='del'>-			ret = btrfs_next_leaf(root, path);</div><div class='del'>-			if (ret == 0)</div><div class='del'>-				continue;</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto out;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		btrfs_item_key_to_cpu(leaf, &amp;found_key, slot);</div><div class='ctx'> </div><div class='add'>+	btrfs_for_each_slot(root, key, &amp;found_key, path, ret) {</div><div class='ctx'> 		if (found_key.objectid &gt;= key-&gt;objectid &amp;&amp;</div><div class='ctx'> 		    found_key.type == BTRFS_BLOCK_GROUP_ITEM_KEY) {</div><div class='del'>-			ret = read_bg_from_eb(fs_info, &amp;found_key, path);</div><div class='del'>-			break;</div><div class='add'>+			return read_bg_from_eb(fs_info, &amp;found_key, path);</div><div class='ctx'> 		}</div><div class='del'>-</div><div class='del'>-		path-&gt;slots[0]++;</div><div class='ctx'> 	}</div><div class='del'>-out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1728,12 +2123,11 @@ static void set_avail_alloc_bits(struct btrfs_fs_info *fs_info, u64 flags)</div><div class='ctx'> 	write_sequnlock(&amp;fs_info-&gt;profiles_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * Map a physical disk address to a list of logical addresses</div><div class='add'>+/*</div><div class='add'>+ * Map a physical disk address to a list of logical addresses.</div><div class='ctx'>  *</div><div class='ctx'>  * @fs_info:       the filesystem</div><div class='ctx'>  * @chunk_start:   logical address of block group</div><div class='del'>- * @bdev:	   physical device to resolve, can be NULL to indicate any device</div><div class='ctx'>  * @physical:	   physical address to map to logical addresses</div><div class='ctx'>  * @logical:	   return array of logical addresses which map to @physical</div><div class='ctx'>  * @naddrs:	   length of @logical</div><div class='hunk'>@@ -1744,11 +2138,9 @@ static void set_avail_alloc_bits(struct btrfs_fs_info *fs_info, u64 flags)</div><div class='ctx'>  * block copies.</div><div class='ctx'>  */</div><div class='ctx'> int btrfs_rmap_block(struct btrfs_fs_info *fs_info, u64 chunk_start,</div><div class='del'>-		     struct block_device *bdev, u64 physical, u64 **logical,</div><div class='del'>-		     int *naddrs, int *stripe_len)</div><div class='add'>+		     u64 physical, u64 **logical, int *naddrs, int *stripe_len)</div><div class='ctx'> {</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	struct map_lookup *map;</div><div class='add'>+	struct btrfs_chunk_map *map;</div><div class='ctx'> 	u64 *buf;</div><div class='ctx'> 	u64 bytenr;</div><div class='ctx'> 	u64 data_stripe_length;</div><div class='hunk'>@@ -1756,18 +2148,17 @@ int btrfs_rmap_block(struct btrfs_fs_info *fs_info, u64 chunk_start,</div><div class='ctx'> 	int i, nr = 0;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	em = btrfs_get_chunk_map(fs_info, chunk_start, 1);</div><div class='del'>-	if (IS_ERR(em))</div><div class='add'>+	map = btrfs_get_chunk_map(fs_info, chunk_start, 1);</div><div class='add'>+	if (IS_ERR(map))</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> </div><div class='del'>-	map = em-&gt;map_lookup;</div><div class='del'>-	data_stripe_length = em-&gt;orig_block_len;</div><div class='del'>-	io_stripe_size = map-&gt;stripe_len;</div><div class='del'>-	chunk_start = em-&gt;start;</div><div class='add'>+	data_stripe_length = map-&gt;stripe_size;</div><div class='add'>+	io_stripe_size = BTRFS_STRIPE_LEN;</div><div class='add'>+	chunk_start = map-&gt;start;</div><div class='ctx'> </div><div class='ctx'> 	/* For RAID5/6 adjust to a full IO stripe length */</div><div class='ctx'> 	if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID56_MASK)</div><div class='del'>-		io_stripe_size = map-&gt;stripe_len * nr_data_stripes(map);</div><div class='add'>+		io_stripe_size = btrfs_stripe_nr_to_offset(nr_data_stripes(map));</div><div class='ctx'> </div><div class='ctx'> 	buf = kcalloc(map-&gt;num_stripes, sizeof(u64), GFP_NOFS);</div><div class='ctx'> 	if (!buf) {</div><div class='hunk'>@@ -1777,32 +2168,28 @@ int btrfs_rmap_block(struct btrfs_fs_info *fs_info, u64 chunk_start,</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; map-&gt;num_stripes; i++) {</div><div class='ctx'> 		bool already_inserted = false;</div><div class='del'>-		u64 stripe_nr;</div><div class='del'>-		u64 offset;</div><div class='add'>+		u32 stripe_nr;</div><div class='add'>+		u32 offset;</div><div class='ctx'> 		int j;</div><div class='ctx'> </div><div class='ctx'> 		if (!in_range(physical, map-&gt;stripes[i].physical,</div><div class='ctx'> 			      data_stripe_length))</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		if (bdev &amp;&amp; map-&gt;stripes[i].dev-&gt;bdev != bdev)</div><div class='del'>-			continue;</div><div class='add'>+		stripe_nr = (physical - map-&gt;stripes[i].physical) &gt;&gt;</div><div class='add'>+			    BTRFS_STRIPE_LEN_SHIFT;</div><div class='add'>+		offset = (physical - map-&gt;stripes[i].physical) &amp;</div><div class='add'>+			 BTRFS_STRIPE_LEN_MASK;</div><div class='ctx'> </div><div class='del'>-		stripe_nr = physical - map-&gt;stripes[i].physical;</div><div class='del'>-		stripe_nr = div64_u64_rem(stripe_nr, map-&gt;stripe_len, &amp;offset);</div><div class='del'>-</div><div class='del'>-		if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID10) {</div><div class='del'>-			stripe_nr = stripe_nr * map-&gt;num_stripes + i;</div><div class='del'>-			stripe_nr = div_u64(stripe_nr, map-&gt;sub_stripes);</div><div class='del'>-		} else if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID0) {</div><div class='del'>-			stripe_nr = stripe_nr * map-&gt;num_stripes + i;</div><div class='del'>-		}</div><div class='add'>+		if (map-&gt;type &amp; (BTRFS_BLOCK_GROUP_RAID0 |</div><div class='add'>+				 BTRFS_BLOCK_GROUP_RAID10))</div><div class='add'>+			stripe_nr = div_u64(stripe_nr * map-&gt;num_stripes + i,</div><div class='add'>+					    map-&gt;sub_stripes);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * The remaining case would be for RAID56, multiply by</div><div class='ctx'> 		 * nr_data_stripes().  Alternatively, just use rmap_len below</div><div class='ctx'> 		 * instead of map-&gt;stripe_len</div><div class='ctx'> 		 */</div><div class='del'>-</div><div class='ctx'> 		bytenr = chunk_start + stripe_nr * io_stripe_size + offset;</div><div class='ctx'> </div><div class='ctx'> 		/* Ensure we don't add duplicate addresses */</div><div class='hunk'>@@ -1821,7 +2208,7 @@ int btrfs_rmap_block(struct btrfs_fs_info *fs_info, u64 chunk_start,</div><div class='ctx'> 	*naddrs = nr;</div><div class='ctx'> 	*stripe_len = io_stripe_size;</div><div class='ctx'> out:</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_chunk_map(map);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1837,21 +2224,23 @@ static int exclude_super_stripes(struct btrfs_block_group *cache)</div><div class='ctx'> 	if (cache-&gt;start &lt; BTRFS_SUPER_INFO_OFFSET) {</div><div class='ctx'> 		stripe_len = BTRFS_SUPER_INFO_OFFSET - cache-&gt;start;</div><div class='ctx'> 		cache-&gt;bytes_super += stripe_len;</div><div class='del'>-		ret = btrfs_add_excluded_extent(fs_info, cache-&gt;start,</div><div class='del'>-						stripe_len);</div><div class='add'>+		ret = btrfs_set_extent_bit(&amp;fs_info-&gt;excluded_extents, cache-&gt;start,</div><div class='add'>+					   cache-&gt;start + stripe_len - 1,</div><div class='add'>+					   EXTENT_DIRTY, NULL);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; BTRFS_SUPER_MIRROR_MAX; i++) {</div><div class='ctx'> 		bytenr = btrfs_sb_offset(i);</div><div class='del'>-		ret = btrfs_rmap_block(fs_info, cache-&gt;start, NULL,</div><div class='add'>+		ret = btrfs_rmap_block(fs_info, cache-&gt;start,</div><div class='ctx'> 				       bytenr, &amp;logical, &amp;nr, &amp;stripe_len);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='ctx'> </div><div class='ctx'> 		/* Shouldn't have super stripes in sequential zones */</div><div class='del'>-		if (zoned &amp;&amp; nr) {</div><div class='add'>+		if (unlikely(zoned &amp;&amp; nr)) {</div><div class='add'>+			kfree(logical);</div><div class='ctx'> 			btrfs_err(fs_info,</div><div class='ctx'> 			"zoned: block group %llu must not contain super block",</div><div class='ctx'> 				  cache-&gt;start);</div><div class='hunk'>@@ -1863,8 +2252,9 @@ static int exclude_super_stripes(struct btrfs_block_group *cache)</div><div class='ctx'> 				cache-&gt;start + cache-&gt;length - logical[nr]);</div><div class='ctx'> </div><div class='ctx'> 			cache-&gt;bytes_super += len;</div><div class='del'>-			ret = btrfs_add_excluded_extent(fs_info, logical[nr],</div><div class='del'>-							len);</div><div class='add'>+			ret = btrfs_set_extent_bit(&amp;fs_info-&gt;excluded_extents,</div><div class='add'>+						   logical[nr], logical[nr] + len - 1,</div><div class='add'>+						   EXTENT_DIRTY, NULL);</div><div class='ctx'> 			if (ret) {</div><div class='ctx'> 				kfree(logical);</div><div class='ctx'> 				return ret;</div><div class='hunk'>@@ -1876,16 +2266,6 @@ static int exclude_super_stripes(struct btrfs_block_group *cache)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void link_block_group(struct btrfs_block_group *cache)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_space_info *space_info = cache-&gt;space_info;</div><div class='del'>-	int index = btrfs_bg_flags_to_raid_index(cache-&gt;flags);</div><div class='del'>-</div><div class='del'>-	down_write(&amp;space_info-&gt;groups_sem);</div><div class='del'>-	list_add_tail(&amp;cache-&gt;list, &amp;space_info-&gt;block_groups[index]);</div><div class='del'>-	up_write(&amp;space_info-&gt;groups_sem);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static struct btrfs_block_group *btrfs_create_block_group_cache(</div><div class='ctx'> 		struct btrfs_fs_info *fs_info, u64 start)</div><div class='ctx'> {</div><div class='hunk'>@@ -1923,7 +2303,6 @@ static struct btrfs_block_group *btrfs_create_block_group_cache(</div><div class='ctx'> 	btrfs_init_free_space_ctl(cache, cache-&gt;free_space_ctl);</div><div class='ctx'> 	atomic_set(&amp;cache-&gt;frozen, 0);</div><div class='ctx'> 	mutex_init(&amp;cache-&gt;free_space_lock);</div><div class='del'>-	btrfs_init_full_stripe_locks_tree(&amp;cache-&gt;full_stripe_locks_root);</div><div class='ctx'> </div><div class='ctx'> 	return cache;</div><div class='ctx'> }</div><div class='hunk'>@@ -1934,49 +2313,47 @@ static struct btrfs_block_group *btrfs_create_block_group_cache(</div><div class='ctx'>  */</div><div class='ctx'> static int check_chunk_block_group_mappings(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	struct extent_map_tree *map_tree = &amp;fs_info-&gt;mapping_tree;</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	struct btrfs_block_group *bg;</div><div class='ctx'> 	u64 start = 0;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='del'>-		read_lock(&amp;map_tree-&gt;lock);</div><div class='add'>+		struct btrfs_chunk_map *map;</div><div class='add'>+		struct btrfs_block_group *bg;</div><div class='add'>+</div><div class='ctx'> 		/*</div><div class='del'>-		 * lookup_extent_mapping will return the first extent map</div><div class='del'>-		 * intersecting the range, so setting @len to 1 is enough to</div><div class='add'>+		 * btrfs_find_chunk_map() will return the first chunk map</div><div class='add'>+		 * intersecting the range, so setting @length to 1 is enough to</div><div class='ctx'> 		 * get the first chunk.</div><div class='ctx'> 		 */</div><div class='del'>-		em = lookup_extent_mapping(map_tree, start, 1);</div><div class='del'>-		read_unlock(&amp;map_tree-&gt;lock);</div><div class='del'>-		if (!em)</div><div class='add'>+		map = btrfs_find_chunk_map(fs_info, start, 1);</div><div class='add'>+		if (!map)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		bg = btrfs_lookup_block_group(fs_info, em-&gt;start);</div><div class='del'>-		if (!bg) {</div><div class='add'>+		bg = btrfs_lookup_block_group(fs_info, map-&gt;start);</div><div class='add'>+		if (unlikely(!bg)) {</div><div class='ctx'> 			btrfs_err(fs_info,</div><div class='ctx'> 	"chunk start=%llu len=%llu doesn't have corresponding block group",</div><div class='del'>-				     em-&gt;start, em-&gt;len);</div><div class='add'>+				     map-&gt;start, map-&gt;chunk_len);</div><div class='ctx'> 			ret = -EUCLEAN;</div><div class='del'>-			free_extent_map(em);</div><div class='add'>+			btrfs_free_chunk_map(map);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-		if (bg-&gt;start != em-&gt;start || bg-&gt;length != em-&gt;len ||</div><div class='del'>-		    (bg-&gt;flags &amp; BTRFS_BLOCK_GROUP_TYPE_MASK) !=</div><div class='del'>-		    (em-&gt;map_lookup-&gt;type &amp; BTRFS_BLOCK_GROUP_TYPE_MASK)) {</div><div class='add'>+		if (unlikely(bg-&gt;start != map-&gt;start || bg-&gt;length != map-&gt;chunk_len ||</div><div class='add'>+			     (bg-&gt;flags &amp; BTRFS_BLOCK_GROUP_TYPE_MASK) !=</div><div class='add'>+			     (map-&gt;type &amp; BTRFS_BLOCK_GROUP_TYPE_MASK))) {</div><div class='ctx'> 			btrfs_err(fs_info,</div><div class='ctx'> "chunk start=%llu len=%llu flags=0x%llx doesn't match block group start=%llu len=%llu flags=0x%llx",</div><div class='del'>-				em-&gt;start, em-&gt;len,</div><div class='del'>-				em-&gt;map_lookup-&gt;type &amp; BTRFS_BLOCK_GROUP_TYPE_MASK,</div><div class='add'>+				map-&gt;start, map-&gt;chunk_len,</div><div class='add'>+				map-&gt;type &amp; BTRFS_BLOCK_GROUP_TYPE_MASK,</div><div class='ctx'> 				bg-&gt;start, bg-&gt;length,</div><div class='ctx'> 				bg-&gt;flags &amp; BTRFS_BLOCK_GROUP_TYPE_MASK);</div><div class='ctx'> 			ret = -EUCLEAN;</div><div class='del'>-			free_extent_map(em);</div><div class='add'>+			btrfs_free_chunk_map(map);</div><div class='ctx'> 			btrfs_put_block_group(bg);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-		start = em-&gt;start + em-&gt;len;</div><div class='del'>-		free_extent_map(em);</div><div class='add'>+		start = map-&gt;start + map-&gt;chunk_len;</div><div class='add'>+		btrfs_free_chunk_map(map);</div><div class='ctx'> 		btrfs_put_block_group(bg);</div><div class='ctx'> 	}</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -1988,7 +2365,6 @@ static int read_one_block_group(struct btrfs_fs_info *info,</div><div class='ctx'> 				int need_clear)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_block_group *cache;</div><div class='del'>-	struct btrfs_space_info *space_info;</div><div class='ctx'> 	const bool mixed = btrfs_fs_incompat(info, MIXED_GROUPS);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -2000,9 +2376,12 @@ static int read_one_block_group(struct btrfs_fs_info *info,</div><div class='ctx'> </div><div class='ctx'> 	cache-&gt;length = key-&gt;offset;</div><div class='ctx'> 	cache-&gt;used = btrfs_stack_block_group_used(bgi);</div><div class='add'>+	cache-&gt;commit_used = cache-&gt;used;</div><div class='ctx'> 	cache-&gt;flags = btrfs_stack_block_group_flags(bgi);</div><div class='add'>+	cache-&gt;global_root_id = btrfs_stack_block_group_chunk_objectid(bgi);</div><div class='add'>+	cache-&gt;space_info = btrfs_find_space_info(info, cache-&gt;flags);</div><div class='ctx'> </div><div class='del'>-	set_free_space_tree_thresholds(cache);</div><div class='add'>+	btrfs_set_free_space_tree_thresholds(cache);</div><div class='ctx'> </div><div class='ctx'> 	if (need_clear) {</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -2063,30 +2442,25 @@ static int read_one_block_group(struct btrfs_fs_info *info,</div><div class='ctx'> 		/* Should not have any excluded extents. Just in case, though. */</div><div class='ctx'> 		btrfs_free_excluded_extents(cache);</div><div class='ctx'> 	} else if (cache-&gt;length == cache-&gt;used) {</div><div class='del'>-		cache-&gt;last_byte_to_unpin = (u64)-1;</div><div class='ctx'> 		cache-&gt;cached = BTRFS_CACHE_FINISHED;</div><div class='ctx'> 		btrfs_free_excluded_extents(cache);</div><div class='ctx'> 	} else if (cache-&gt;used == 0) {</div><div class='del'>-		cache-&gt;last_byte_to_unpin = (u64)-1;</div><div class='ctx'> 		cache-&gt;cached = BTRFS_CACHE_FINISHED;</div><div class='del'>-		add_new_free_space(cache, cache-&gt;start,</div><div class='del'>-				   cache-&gt;start + cache-&gt;length);</div><div class='add'>+		ret = btrfs_add_new_free_space(cache, cache-&gt;start,</div><div class='add'>+					       cache-&gt;start + cache-&gt;length, NULL);</div><div class='ctx'> 		btrfs_free_excluded_extents(cache);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_add_block_group_cache(info, cache);</div><div class='add'>+	ret = btrfs_add_block_group_cache(cache);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		btrfs_remove_free_space_cache(cache);</div><div class='ctx'> 		goto error;</div><div class='ctx'> 	}</div><div class='del'>-	trace_btrfs_add_block_group(info, cache, 0);</div><div class='del'>-	btrfs_update_space_info(info, cache-&gt;flags, cache-&gt;length,</div><div class='del'>-				cache-&gt;used, cache-&gt;bytes_super,</div><div class='del'>-				cache-&gt;zone_unusable, &amp;space_info);</div><div class='del'>-</div><div class='del'>-	cache-&gt;space_info = space_info;</div><div class='ctx'> </div><div class='del'>-	link_block_group(cache);</div><div class='add'>+	trace_btrfs_add_block_group(info, cache, 0);</div><div class='add'>+	btrfs_add_bg_to_space_info(info, cache);</div><div class='ctx'> </div><div class='ctx'> 	set_avail_alloc_bits(info, cache-&gt;flags);</div><div class='ctx'> 	if (btrfs_chunk_writeable(info, cache-&gt;start)) {</div><div class='hunk'>@@ -2109,32 +2483,28 @@ error:</div><div class='ctx'> </div><div class='ctx'> static int fill_dummy_bgs(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	struct extent_map_tree *em_tree = &amp;fs_info-&gt;mapping_tree;</div><div class='del'>-	struct btrfs_space_info *space_info;</div><div class='ctx'> 	struct rb_node *node;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	for (node = rb_first_cached(&amp;em_tree-&gt;map); node; node = rb_next(node)) {</div><div class='del'>-		struct extent_map *em;</div><div class='del'>-		struct map_lookup *map;</div><div class='add'>+	for (node = rb_first_cached(&amp;fs_info-&gt;mapping_tree); node; node = rb_next(node)) {</div><div class='add'>+		struct btrfs_chunk_map *map;</div><div class='ctx'> 		struct btrfs_block_group *bg;</div><div class='ctx'> </div><div class='del'>-		em = rb_entry(node, struct extent_map, rb_node);</div><div class='del'>-		map = em-&gt;map_lookup;</div><div class='del'>-		bg = btrfs_create_block_group_cache(fs_info, em-&gt;start);</div><div class='add'>+		map = rb_entry(node, struct btrfs_chunk_map, rb_node);</div><div class='add'>+		bg = btrfs_create_block_group_cache(fs_info, map-&gt;start);</div><div class='ctx'> 		if (!bg) {</div><div class='ctx'> 			ret = -ENOMEM;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* Fill dummy cache as FULL */</div><div class='del'>-		bg-&gt;length = em-&gt;len;</div><div class='add'>+		bg-&gt;length = map-&gt;chunk_len;</div><div class='ctx'> 		bg-&gt;flags = map-&gt;type;</div><div class='del'>-		bg-&gt;last_byte_to_unpin = (u64)-1;</div><div class='ctx'> 		bg-&gt;cached = BTRFS_CACHE_FINISHED;</div><div class='del'>-		bg-&gt;used = em-&gt;len;</div><div class='add'>+		bg-&gt;used = map-&gt;chunk_len;</div><div class='ctx'> 		bg-&gt;flags = map-&gt;type;</div><div class='del'>-		ret = btrfs_add_block_group_cache(fs_info, bg);</div><div class='add'>+		bg-&gt;space_info = btrfs_find_space_info(fs_info, bg-&gt;flags);</div><div class='add'>+		ret = btrfs_add_block_group_cache(bg);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We may have some valid block group cache added already, in</div><div class='ctx'> 		 * that case we skip to the next one.</div><div class='hunk'>@@ -2151,10 +2521,7 @@ static int fill_dummy_bgs(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		btrfs_update_space_info(fs_info, bg-&gt;flags, em-&gt;len, em-&gt;len,</div><div class='del'>-					0, 0, &amp;space_info);</div><div class='del'>-		bg-&gt;space_info = space_info;</div><div class='del'>-		link_block_group(bg);</div><div class='add'>+		btrfs_add_bg_to_space_info(fs_info, bg);</div><div class='ctx'> </div><div class='ctx'> 		set_avail_alloc_bits(fs_info, bg-&gt;flags);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2165,6 +2532,7 @@ static int fill_dummy_bgs(struct btrfs_fs_info *fs_info)</div><div class='ctx'> </div><div class='ctx'> int btrfs_read_block_groups(struct btrfs_fs_info *info)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_root *root = btrfs_block_group_root(info);</div><div class='ctx'> 	struct btrfs_path *path;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct btrfs_block_group *cache;</div><div class='hunk'>@@ -2173,12 +2541,21 @@ int btrfs_read_block_groups(struct btrfs_fs_info *info)</div><div class='ctx'> 	int need_clear = 0;</div><div class='ctx'> 	u64 cache_gen;</div><div class='ctx'> </div><div class='del'>-	if (!info-&gt;extent_root)</div><div class='add'>+	/*</div><div class='add'>+	 * Either no extent root (with ibadroots rescue option) or we have</div><div class='add'>+	 * unsupported RO options. The fs can never be mounted read-write, so no</div><div class='add'>+	 * need to waste time searching block group items.</div><div class='add'>+	 *</div><div class='add'>+	 * This also allows new extent tree related changes to be RO compat,</div><div class='add'>+	 * no need for a full incompat flag.</div><div class='add'>+	 */</div><div class='add'>+	if (!root || (btrfs_super_compat_ro_flags(info-&gt;super_copy) &amp;</div><div class='add'>+		      ~BTRFS_FEATURE_COMPAT_RO_SUPP))</div><div class='ctx'> 		return fill_dummy_bgs(info);</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = 0;</div><div class='del'>-	key.offset = 0;</div><div class='ctx'> 	key.type = BTRFS_BLOCK_GROUP_ITEM_KEY;</div><div class='add'>+	key.offset = 0;</div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='hunk'>@@ -2276,30 +2653,40 @@ static int insert_block_group_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_block_group_item bgi;</div><div class='del'>-	struct btrfs_root *root;</div><div class='add'>+	struct btrfs_root *root = btrfs_block_group_root(fs_info);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='add'>+	u64 old_commit_used;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;block_group-&gt;lock);</div><div class='ctx'> 	btrfs_set_stack_block_group_used(&amp;bgi, block_group-&gt;used);</div><div class='ctx'> 	btrfs_set_stack_block_group_chunk_objectid(&amp;bgi,</div><div class='del'>-				BTRFS_FIRST_CHUNK_TREE_OBJECTID);</div><div class='add'>+						   block_group-&gt;global_root_id);</div><div class='ctx'> 	btrfs_set_stack_block_group_flags(&amp;bgi, block_group-&gt;flags);</div><div class='add'>+	old_commit_used = block_group-&gt;commit_used;</div><div class='add'>+	block_group-&gt;commit_used = block_group-&gt;used;</div><div class='ctx'> 	key.objectid = block_group-&gt;start;</div><div class='ctx'> 	key.type = BTRFS_BLOCK_GROUP_ITEM_KEY;</div><div class='ctx'> 	key.offset = block_group-&gt;length;</div><div class='ctx'> 	spin_unlock(&amp;block_group-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	root = fs_info-&gt;extent_root;</div><div class='del'>-	return btrfs_insert_item(trans, root, &amp;key, &amp;bgi, sizeof(bgi));</div><div class='add'>+	ret = btrfs_insert_item(trans, root, &amp;key, &amp;bgi, sizeof(bgi));</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		spin_lock(&amp;block_group-&gt;lock);</div><div class='add'>+		block_group-&gt;commit_used = old_commit_used;</div><div class='add'>+		spin_unlock(&amp;block_group-&gt;lock);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int insert_dev_extent(struct btrfs_trans_handle *trans,</div><div class='del'>-			    struct btrfs_device *device, u64 chunk_offset,</div><div class='del'>-			    u64 start, u64 num_bytes)</div><div class='add'>+			     const struct btrfs_device *device, u64 chunk_offset,</div><div class='add'>+			     u64 start, u64 num_bytes)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = device-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_root *root = fs_info-&gt;dev_root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_dev_extent *extent;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='hunk'>@@ -2316,7 +2703,7 @@ static int insert_dev_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	key.offset = start;</div><div class='ctx'> 	ret = btrfs_insert_empty_item(trans, root, path, &amp;key, sizeof(*extent));</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	extent = btrfs_item_ptr(leaf, path-&gt;slots[0], struct btrfs_dev_extent);</div><div class='hunk'>@@ -2324,11 +2711,8 @@ static int insert_dev_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	btrfs_set_dev_extent_chunk_objectid(leaf, extent,</div><div class='ctx'> 					    BTRFS_FIRST_CHUNK_TREE_OBJECTID);</div><div class='ctx'> 	btrfs_set_dev_extent_chunk_offset(leaf, extent, chunk_offset);</div><div class='del'>-</div><div class='ctx'> 	btrfs_set_dev_extent_length(leaf, extent, num_bytes);</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2343,19 +2727,14 @@ static int insert_dev_extents(struct btrfs_trans_handle *trans,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_device *device;</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	struct map_lookup *map;</div><div class='add'>+	struct btrfs_chunk_map *map;</div><div class='ctx'> 	u64 dev_offset;</div><div class='del'>-	u64 stripe_size;</div><div class='ctx'> 	int i;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	em = btrfs_get_chunk_map(fs_info, chunk_offset, chunk_size);</div><div class='del'>-	if (IS_ERR(em))</div><div class='del'>-		return PTR_ERR(em);</div><div class='del'>-</div><div class='del'>-	map = em-&gt;map_lookup;</div><div class='del'>-	stripe_size = em-&gt;orig_block_len;</div><div class='add'>+	map = btrfs_get_chunk_map(fs_info, chunk_offset, chunk_size);</div><div class='add'>+	if (IS_ERR(map))</div><div class='add'>+		return PTR_ERR(map);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Take the device list mutex to prevent races with the final phase of</div><div class='hunk'>@@ -2372,13 +2751,13 @@ static int insert_dev_extents(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		dev_offset = map-&gt;stripes[i].physical;</div><div class='ctx'> </div><div class='ctx'> 		ret = insert_dev_extent(trans, device, chunk_offset, dev_offset,</div><div class='del'>-				       stripe_size);</div><div class='add'>+					map-&gt;stripe_size);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;fs_devices-&gt;device_list_mutex);</div><div class='ctx'> </div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_chunk_map(map);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2409,7 +2788,8 @@ void btrfs_create_pending_block_groups(struct btrfs_trans_handle *trans)</div><div class='ctx'> 		ret = insert_block_group_item(trans, block_group);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='del'>-		if (!block_group-&gt;chunk_item_inserted) {</div><div class='add'>+		if (!test_bit(BLOCK_GROUP_FLAG_CHUNK_ITEM_INSERTED,</div><div class='add'>+			      &amp;block_group-&gt;runtime_flags)) {</div><div class='ctx'> 			mutex_lock(&amp;fs_info-&gt;chunk_mutex);</div><div class='ctx'> 			ret = btrfs_chunk_alloc_add_chunk_item(trans, block_group);</div><div class='ctx'> 			mutex_unlock(&amp;fs_info-&gt;chunk_mutex);</div><div class='hunk'>@@ -2420,7 +2800,7 @@ void btrfs_create_pending_block_groups(struct btrfs_trans_handle *trans)</div><div class='ctx'> 					 block_group-&gt;length);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='del'>-		add_block_group_free_space(trans, block_group);</div><div class='add'>+		btrfs_add_block_group_free_space(trans, block_group);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * If we restriped during balance, we may have added a new raid</div><div class='hunk'>@@ -2433,15 +2813,72 @@ void btrfs_create_pending_block_groups(struct btrfs_trans_handle *trans)</div><div class='ctx'> </div><div class='ctx'> 		/* Already aborted the transaction if it failed. */</div><div class='ctx'> next:</div><div class='del'>-		btrfs_delayed_refs_rsv_release(fs_info, 1);</div><div class='add'>+		btrfs_dec_delayed_refs_rsv_bg_inserts(fs_info);</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='ctx'> 		list_del_init(&amp;block_group-&gt;bg_list);</div><div class='add'>+		clear_bit(BLOCK_GROUP_FLAG_NEW, &amp;block_group-&gt;runtime_flags);</div><div class='add'>+		btrfs_put_block_group(block_group);</div><div class='add'>+		spin_unlock(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * If the block group is still unused, add it to the list of</div><div class='add'>+		 * unused block groups. The block group may have been created in</div><div class='add'>+		 * order to satisfy a space reservation, in which case the</div><div class='add'>+		 * extent allocation only happens later. But often we don't</div><div class='add'>+		 * actually need to allocate space that we previously reserved,</div><div class='add'>+		 * so the block group may become unused for a long time. For</div><div class='add'>+		 * example for metadata we generally reserve space for a worst</div><div class='add'>+		 * possible scenario, but then don't end up allocating all that</div><div class='add'>+		 * space or none at all (due to no need to COW, extent buffers</div><div class='add'>+		 * were already COWed in the current transaction and still</div><div class='add'>+		 * unwritten, tree heights lower than the maximum possible</div><div class='add'>+		 * height, etc). For data we generally reserve the exact amount</div><div class='add'>+		 * of space we are going to allocate later, the exception is</div><div class='add'>+		 * when using compression, as we must reserve space based on the</div><div class='add'>+		 * uncompressed data size, because the compression is only done</div><div class='add'>+		 * when writeback triggered and we don't know how much space we</div><div class='add'>+		 * are actually going to need, so we reserve the uncompressed</div><div class='add'>+		 * size because the data may be incompressible in the worst case.</div><div class='add'>+		 */</div><div class='add'>+		if (ret == 0) {</div><div class='add'>+			bool used;</div><div class='add'>+</div><div class='add'>+			spin_lock(&amp;block_group-&gt;lock);</div><div class='add'>+			used = btrfs_is_block_group_used(block_group);</div><div class='add'>+			spin_unlock(&amp;block_group-&gt;lock);</div><div class='add'>+</div><div class='add'>+			if (!used)</div><div class='add'>+				btrfs_mark_bg_unused(block_group);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> 	btrfs_trans_release_chunk_metadata(trans);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * For extent tree v2 we use the block_group_item-&gt;chunk_offset to point at our</div><div class='add'>+ * global root id.  For v1 it's always set to BTRFS_FIRST_CHUNK_TREE_OBJECTID.</div><div class='add'>+ */</div><div class='add'>+static u64 calculate_global_root_id(const struct btrfs_fs_info *fs_info, u64 offset)</div><div class='add'>+{</div><div class='add'>+	u64 div = SZ_1G;</div><div class='add'>+	u64 index;</div><div class='add'>+</div><div class='add'>+	if (!btrfs_fs_incompat(fs_info, EXTENT_TREE_V2))</div><div class='add'>+		return BTRFS_FIRST_CHUNK_TREE_OBJECTID;</div><div class='add'>+</div><div class='add'>+	/* If we have a smaller fs index based on 128MiB. */</div><div class='add'>+	if (btrfs_super_total_bytes(fs_info-&gt;super_copy) &lt;= (SZ_1G * 10ULL))</div><div class='add'>+		div = SZ_128M;</div><div class='add'>+</div><div class='add'>+	offset = div64_u64(offset, div);</div><div class='add'>+	div64_u64_rem(offset, fs_info-&gt;nr_global_roots, &amp;index);</div><div class='add'>+	return index;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> struct btrfs_block_group *btrfs_make_block_group(struct btrfs_trans_handle *trans,</div><div class='del'>-						 u64 bytes_used, u64 type,</div><div class='del'>-						 u64 chunk_offset, u64 size)</div><div class='add'>+						 struct btrfs_space_info *space_info,</div><div class='add'>+						 u64 type, u64 chunk_offset, u64 size)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_block_group *cache;</div><div class='hunk'>@@ -2453,14 +2890,21 @@ struct btrfs_block_group *btrfs_make_block_group(struct btrfs_trans_handle *tran</div><div class='ctx'> 	if (!cache)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Mark it as new before adding it to the rbtree of block groups or any</div><div class='add'>+	 * list, so that no other task finds it and calls btrfs_mark_bg_unused()</div><div class='add'>+	 * before the new flag is set.</div><div class='add'>+	 */</div><div class='add'>+	set_bit(BLOCK_GROUP_FLAG_NEW, &amp;cache-&gt;runtime_flags);</div><div class='add'>+</div><div class='ctx'> 	cache-&gt;length = size;</div><div class='del'>-	set_free_space_tree_thresholds(cache);</div><div class='del'>-	cache-&gt;used = bytes_used;</div><div class='add'>+	btrfs_set_free_space_tree_thresholds(cache);</div><div class='ctx'> 	cache-&gt;flags = type;</div><div class='del'>-	cache-&gt;last_byte_to_unpin = (u64)-1;</div><div class='ctx'> 	cache-&gt;cached = BTRFS_CACHE_FINISHED;</div><div class='add'>+	cache-&gt;global_root_id = calculate_global_root_id(fs_info, cache-&gt;start);</div><div class='add'>+</div><div class='ctx'> 	if (btrfs_fs_compat_ro(fs_info, FREE_SPACE_TREE))</div><div class='del'>-		cache-&gt;needs_free_space = 1;</div><div class='add'>+		set_bit(BLOCK_GROUP_FLAG_NEEDS_FREE_SPACE, &amp;cache-&gt;runtime_flags);</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_load_block_group_zone_info(cache, true);</div><div class='ctx'> 	if (ret) {</div><div class='hunk'>@@ -2468,12 +2912,6 @@ struct btrfs_block_group *btrfs_make_block_group(struct btrfs_trans_handle *tran</div><div class='ctx'> 		return ERR_PTR(ret);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * New block group is likely to be used soon. Try to activate it now.</div><div class='del'>-	 * Failure is OK for now.</div><div class='del'>-	 */</div><div class='del'>-	btrfs_zone_activate(cache);</div><div class='del'>-</div><div class='ctx'> 	ret = exclude_super_stripes(cache);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		/* We may have excluded something, so call this just in case */</div><div class='hunk'>@@ -2482,27 +2920,22 @@ struct btrfs_block_group *btrfs_make_block_group(struct btrfs_trans_handle *tran</div><div class='ctx'> 		return ERR_PTR(ret);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	add_new_free_space(cache, chunk_offset, chunk_offset + size);</div><div class='del'>-</div><div class='add'>+	ret = btrfs_add_new_free_space(cache, chunk_offset, chunk_offset + size, NULL);</div><div class='ctx'> 	btrfs_free_excluded_extents(cache);</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_BTRFS_DEBUG</div><div class='del'>-	if (btrfs_should_fragment_free_space(cache)) {</div><div class='del'>-		u64 new_bytes_used = size - bytes_used;</div><div class='del'>-</div><div class='del'>-		bytes_used += new_bytes_used &gt;&gt; 1;</div><div class='del'>-		fragment_free_space(cache);</div><div class='add'>+	if (ret) {</div><div class='add'>+		btrfs_put_block_group(cache);</div><div class='add'>+		return ERR_PTR(ret);</div><div class='ctx'> 	}</div><div class='del'>-#endif</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Ensure the corresponding space_info object is created and</div><div class='ctx'> 	 * assigned to our block group. We want our bg to be added to the rbtree</div><div class='ctx'> 	 * with its -&gt;space_info set.</div><div class='ctx'> 	 */</div><div class='del'>-	cache-&gt;space_info = btrfs_find_space_info(fs_info, cache-&gt;flags);</div><div class='add'>+	cache-&gt;space_info = space_info;</div><div class='ctx'> 	ASSERT(cache-&gt;space_info);</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_add_block_group_cache(fs_info, cache);</div><div class='add'>+	ret = btrfs_add_block_group_cache(cache);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		btrfs_remove_free_space_cache(cache);</div><div class='ctx'> 		btrfs_put_block_group(cache);</div><div class='hunk'>@@ -2514,16 +2947,18 @@ struct btrfs_block_group *btrfs_make_block_group(struct btrfs_trans_handle *tran</div><div class='ctx'> 	 * the rbtree, update the space info's counters.</div><div class='ctx'> 	 */</div><div class='ctx'> 	trace_btrfs_add_block_group(fs_info, cache, 1);</div><div class='del'>-	btrfs_update_space_info(fs_info, cache-&gt;flags, size, bytes_used,</div><div class='del'>-				cache-&gt;bytes_super, cache-&gt;zone_unusable,</div><div class='del'>-				&amp;cache-&gt;space_info);</div><div class='add'>+	btrfs_add_bg_to_space_info(fs_info, cache);</div><div class='ctx'> 	btrfs_update_global_block_rsv(fs_info);</div><div class='ctx'> </div><div class='del'>-	link_block_group(cache);</div><div class='add'>+#ifdef CONFIG_BTRFS_DEBUG</div><div class='add'>+	if (btrfs_should_fragment_free_space(cache)) {</div><div class='add'>+		cache-&gt;space_info-&gt;bytes_used += size &gt;&gt; 1;</div><div class='add'>+		fragment_free_space(cache);</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='del'>-	list_add_tail(&amp;cache-&gt;bg_list, &amp;trans-&gt;new_bgs);</div><div class='del'>-	trans-&gt;delayed_ref_updates++;</div><div class='del'>-	btrfs_update_delayed_refs_rsv(trans);</div><div class='add'>+	btrfs_link_bg_list(cache, &amp;trans-&gt;new_bgs);</div><div class='add'>+	btrfs_inc_delayed_refs_rsv_bg_inserts(fs_info);</div><div class='ctx'> </div><div class='ctx'> 	set_avail_alloc_bits(fs_info, type);</div><div class='ctx'> 	return cache;</div><div class='hunk'>@@ -2542,13 +2977,28 @@ int btrfs_inc_block_group_ro(struct btrfs_block_group *cache,</div><div class='ctx'> 			     bool do_chunk_alloc)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = cache-&gt;fs_info;</div><div class='add'>+	struct btrfs_space_info *space_info = cache-&gt;space_info;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='add'>+	struct btrfs_root *root = btrfs_block_group_root(fs_info);</div><div class='ctx'> 	u64 alloc_flags;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	bool dirty_bg_running;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * This can only happen when we are doing read-only scrub on read-only</div><div class='add'>+	 * mount.</div><div class='add'>+	 * In that case we should not start a new transaction on read-only fs.</div><div class='add'>+	 * Thus here we skip all chunk allocations.</div><div class='add'>+	 */</div><div class='add'>+	if (sb_rdonly(fs_info-&gt;sb)) {</div><div class='add'>+		mutex_lock(&amp;fs_info-&gt;ro_block_group_mutex);</div><div class='add'>+		ret = inc_block_group_ro(cache, 0);</div><div class='add'>+		mutex_unlock(&amp;fs_info-&gt;ro_block_group_mutex);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	do {</div><div class='del'>-		trans = btrfs_join_transaction(fs_info-&gt;extent_root);</div><div class='add'>+		trans = btrfs_join_transaction(root);</div><div class='ctx'> 		if (IS_ERR(trans))</div><div class='ctx'> 			return PTR_ERR(trans);</div><div class='ctx'> </div><div class='hunk'>@@ -2580,7 +3030,7 @@ int btrfs_inc_block_group_ro(struct btrfs_block_group *cache,</div><div class='ctx'> 		 */</div><div class='ctx'> 		alloc_flags = btrfs_get_alloc_profile(fs_info, cache-&gt;flags);</div><div class='ctx'> 		if (alloc_flags != cache-&gt;flags) {</div><div class='del'>-			ret = btrfs_chunk_alloc(trans, alloc_flags,</div><div class='add'>+			ret = btrfs_chunk_alloc(trans, space_info, alloc_flags,</div><div class='ctx'> 						CHUNK_ALLOC_FORCE);</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * ENOSPC is allowed here, we may have enough space</div><div class='hunk'>@@ -2594,14 +3044,32 @@ int btrfs_inc_block_group_ro(struct btrfs_block_group *cache,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = inc_block_group_ro(cache, 0);</div><div class='del'>-	if (!do_chunk_alloc || ret == -ETXTBSY)</div><div class='del'>-		goto unlock_out;</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		goto out;</div><div class='del'>-	alloc_flags = btrfs_get_alloc_profile(fs_info, cache-&gt;space_info-&gt;flags);</div><div class='del'>-	ret = btrfs_chunk_alloc(trans, alloc_flags, CHUNK_ALLOC_FORCE);</div><div class='add'>+	if (ret == -ETXTBSY)</div><div class='add'>+		goto unlock_out;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Skip chunk allocation if the bg is SYSTEM, this is to avoid system</div><div class='add'>+	 * chunk allocation storm to exhaust the system chunk array.  Otherwise</div><div class='add'>+	 * we still want to try our best to mark the block group read-only.</div><div class='add'>+	 */</div><div class='add'>+	if (!do_chunk_alloc &amp;&amp; ret == -ENOSPC &amp;&amp;</div><div class='add'>+	    (cache-&gt;flags &amp; BTRFS_BLOCK_GROUP_SYSTEM))</div><div class='add'>+		goto unlock_out;</div><div class='add'>+</div><div class='add'>+	alloc_flags = btrfs_get_alloc_profile(fs_info, space_info-&gt;flags);</div><div class='add'>+	ret = btrfs_chunk_alloc(trans, space_info, alloc_flags, CHUNK_ALLOC_FORCE);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+	/*</div><div class='add'>+	 * We have allocated a new chunk. We also need to activate that chunk to</div><div class='add'>+	 * grant metadata tickets for zoned filesystem.</div><div class='add'>+	 */</div><div class='add'>+	ret = btrfs_zoned_activate_one_bg(space_info, true);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='add'>+</div><div class='ctx'> 	ret = inc_block_group_ro(cache, 0);</div><div class='ctx'> 	if (ret == -ETXTBSY)</div><div class='ctx'> 		goto unlock_out;</div><div class='hunk'>@@ -2632,9 +3100,10 @@ void btrfs_dec_block_group_ro(struct btrfs_block_group *cache)</div><div class='ctx'> 		if (btrfs_is_zoned(cache-&gt;fs_info)) {</div><div class='ctx'> 			/* Migrate zone_unusable bytes back */</div><div class='ctx'> 			cache-&gt;zone_unusable =</div><div class='del'>-				(cache-&gt;alloc_offset - cache-&gt;used) +</div><div class='add'>+				(cache-&gt;alloc_offset - cache-&gt;used - cache-&gt;pinned -</div><div class='add'>+				 cache-&gt;reserved) +</div><div class='ctx'> 				(cache-&gt;length - cache-&gt;zone_capacity);</div><div class='del'>-			sinfo-&gt;bytes_zone_unusable += cache-&gt;zone_unusable;</div><div class='add'>+			btrfs_space_info_update_bytes_zone_unusable(sinfo, cache-&gt;zone_unusable);</div><div class='ctx'> 			sinfo-&gt;bytes_readonly -= cache-&gt;zone_unusable;</div><div class='ctx'> 		}</div><div class='ctx'> 		num_bytes = cache-&gt;length - cache-&gt;reserved -</div><div class='hunk'>@@ -2653,11 +3122,30 @@ static int update_block_group_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	int ret;</div><div class='del'>-	struct btrfs_root *root = fs_info-&gt;extent_root;</div><div class='add'>+	struct btrfs_root *root = btrfs_block_group_root(fs_info);</div><div class='ctx'> 	unsigned long bi;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_block_group_item bgi;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='add'>+	u64 old_commit_used;</div><div class='add'>+	u64 used;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Block group items update can be triggered out of commit transaction</div><div class='add'>+	 * critical section, thus we need a consistent view of used bytes.</div><div class='add'>+	 * We cannot use cache-&gt;used directly outside of the spin lock, as it</div><div class='add'>+	 * may be changed.</div><div class='add'>+	 */</div><div class='add'>+	spin_lock(&amp;cache-&gt;lock);</div><div class='add'>+	old_commit_used = cache-&gt;commit_used;</div><div class='add'>+	used = cache-&gt;used;</div><div class='add'>+	/* No change in used bytes, can safely skip it. */</div><div class='add'>+	if (cache-&gt;commit_used == used) {</div><div class='add'>+		spin_unlock(&amp;cache-&gt;lock);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+	cache-&gt;commit_used = used;</div><div class='add'>+	spin_unlock(&amp;cache-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = cache-&gt;start;</div><div class='ctx'> 	key.type = BTRFS_BLOCK_GROUP_ITEM_KEY;</div><div class='hunk'>@@ -2672,14 +3160,27 @@ static int update_block_group_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	bi = btrfs_item_ptr_offset(leaf, path-&gt;slots[0]);</div><div class='del'>-	btrfs_set_stack_block_group_used(&amp;bgi, cache-&gt;used);</div><div class='add'>+	btrfs_set_stack_block_group_used(&amp;bgi, used);</div><div class='ctx'> 	btrfs_set_stack_block_group_chunk_objectid(&amp;bgi,</div><div class='del'>-			BTRFS_FIRST_CHUNK_TREE_OBJECTID);</div><div class='add'>+						   cache-&gt;global_root_id);</div><div class='ctx'> 	btrfs_set_stack_block_group_flags(&amp;bgi, cache-&gt;flags);</div><div class='ctx'> 	write_extent_buffer(leaf, &amp;bgi, bi, sizeof(bgi));</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> fail:</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='add'>+	/*</div><div class='add'>+	 * We didn't update the block group item, need to revert commit_used</div><div class='add'>+	 * unless the block group item didn't exist yet - this is to prevent a</div><div class='add'>+	 * race with a concurrent insertion of the block group item, with</div><div class='add'>+	 * insert_block_group_item(), that happened just after we attempted to</div><div class='add'>+	 * update. In that case we would reset commit_used to 0 just after the</div><div class='add'>+	 * insertion set it to a value greater than 0 - if the block group later</div><div class='add'>+	 * becomes with 0 used bytes, we would incorrectly skip its update.</div><div class='add'>+	 */</div><div class='add'>+	if (ret &lt; 0 &amp;&amp; ret != -ENOENT) {</div><div class='add'>+		spin_lock(&amp;cache-&gt;lock);</div><div class='add'>+		cache-&gt;commit_used = old_commit_used;</div><div class='add'>+		spin_unlock(&amp;cache-&gt;lock);</div><div class='add'>+	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> </div><div class='ctx'> }</div><div class='hunk'>@@ -2689,7 +3190,6 @@ static int cache_save_setup(struct btrfs_block_group *block_group,</div><div class='ctx'> 			    struct btrfs_path *path)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = block_group-&gt;fs_info;</div><div class='del'>-	struct btrfs_root *root = fs_info-&gt;tree_root;</div><div class='ctx'> 	struct inode *inode = NULL;</div><div class='ctx'> 	struct extent_changeset *data_reserved = NULL;</div><div class='ctx'> 	u64 alloc_hint = 0;</div><div class='hunk'>@@ -2741,8 +3241,8 @@ again:</div><div class='ctx'> 	 * time.</div><div class='ctx'> 	 */</div><div class='ctx'> 	BTRFS_I(inode)-&gt;generation = 0;</div><div class='del'>-	ret = btrfs_update_inode(trans, root, BTRFS_I(inode));</div><div class='del'>-	if (ret) {</div><div class='add'>+	ret = btrfs_update_inode(trans, BTRFS_I(inode));</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * So theoretically we could recover from this, simply set the</div><div class='ctx'> 		 * super cache generation to 0 so we know to invalidate the</div><div class='hunk'>@@ -2814,7 +3314,7 @@ again:</div><div class='ctx'> 	cache_size *= fs_info-&gt;sectorsize;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_check_data_free_space(BTRFS_I(inode), &amp;data_reserved, 0,</div><div class='del'>-					  cache_size);</div><div class='add'>+					  cache_size, false);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out_put;</div><div class='ctx'> </div><div class='hunk'>@@ -2854,7 +3354,7 @@ int btrfs_setup_space_cache(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_block_group *cache, *tmp;</div><div class='ctx'> 	struct btrfs_transaction *cur_trans = trans-&gt;transaction;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> </div><div class='ctx'> 	if (list_empty(&amp;cur_trans-&gt;dirty_bgs) ||</div><div class='ctx'> 	    !btrfs_test_opt(fs_info, SPACE_CACHE))</div><div class='hunk'>@@ -2871,7 +3371,6 @@ int btrfs_setup_space_cache(struct btrfs_trans_handle *trans)</div><div class='ctx'> 			cache_save_setup(cache, trans, path);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2894,10 +3393,9 @@ int btrfs_start_dirty_block_groups(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	struct btrfs_transaction *cur_trans = trans-&gt;transaction;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int should_put;</div><div class='del'>-	struct btrfs_path *path = NULL;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	LIST_HEAD(dirty);</div><div class='ctx'> 	struct list_head *io = &amp;cur_trans-&gt;io_bgs;</div><div class='del'>-	int num_started = 0;</div><div class='ctx'> 	int loops = 0;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;cur_trans-&gt;dirty_bgs_lock);</div><div class='hunk'>@@ -2963,7 +3461,6 @@ again:</div><div class='ctx'> 			cache-&gt;io_ctl.inode = NULL;</div><div class='ctx'> 			ret = btrfs_write_out_cache(trans, cache, path);</div><div class='ctx'> 			if (ret == 0 &amp;&amp; cache-&gt;io_ctl.inode) {</div><div class='del'>-				num_started++;</div><div class='ctx'> 				should_put = 0;</div><div class='ctx'> </div><div class='ctx'> 				/*</div><div class='hunk'>@@ -3010,7 +3507,7 @@ again:</div><div class='ctx'> 		if (should_put)</div><div class='ctx'> 			btrfs_put_block_group(cache);</div><div class='ctx'> 		if (drop_reserve)</div><div class='del'>-			btrfs_delayed_refs_rsv_release(fs_info, 1);</div><div class='add'>+			btrfs_dec_delayed_refs_rsv_bg_updates(fs_info);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Avoid blocking other tasks for too long. It might even save</div><div class='ctx'> 		 * us from writing caches for block groups that are going to be</div><div class='hunk'>@@ -3051,7 +3548,6 @@ out:</div><div class='ctx'> 		btrfs_cleanup_dirty_bgs(cur_trans, fs_info);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3062,9 +3558,8 @@ int btrfs_write_dirty_block_groups(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	struct btrfs_transaction *cur_trans = trans-&gt;transaction;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int should_put;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct list_head *io = &amp;cur_trans-&gt;io_bgs;</div><div class='del'>-	int num_started = 0;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='hunk'>@@ -3115,14 +3610,12 @@ int btrfs_write_dirty_block_groups(struct btrfs_trans_handle *trans)</div><div class='ctx'> 		cache_save_setup(cache, trans, path);</div><div class='ctx'> </div><div class='ctx'> 		if (!ret)</div><div class='del'>-			ret = btrfs_run_delayed_refs(trans,</div><div class='del'>-						     (unsigned long) -1);</div><div class='add'>+			ret = btrfs_run_delayed_refs(trans, U64_MAX);</div><div class='ctx'> </div><div class='ctx'> 		if (!ret &amp;&amp; cache-&gt;disk_cache_state == BTRFS_DC_SETUP) {</div><div class='ctx'> 			cache-&gt;io_ctl.inode = NULL;</div><div class='ctx'> 			ret = btrfs_write_out_cache(trans, cache, path);</div><div class='ctx'> 			if (ret == 0 &amp;&amp; cache-&gt;io_ctl.inode) {</div><div class='del'>-				num_started++;</div><div class='ctx'> 				should_put = 0;</div><div class='ctx'> 				list_add_tail(&amp;cache-&gt;io_list, io);</div><div class='ctx'> 			} else {</div><div class='hunk'>@@ -3152,15 +3645,17 @@ int btrfs_write_dirty_block_groups(struct btrfs_trans_handle *trans)</div><div class='ctx'> 				wait_event(cur_trans-&gt;writer_wait,</div><div class='ctx'> 				   atomic_read(&amp;cur_trans-&gt;num_writers) == 1);</div><div class='ctx'> 				ret = update_block_group_item(trans, path, cache);</div><div class='del'>-			}</div><div class='del'>-			if (ret)</div><div class='add'>+				if (ret)</div><div class='add'>+					btrfs_abort_transaction(trans, ret);</div><div class='add'>+			} else if (ret) {</div><div class='ctx'> 				btrfs_abort_transaction(trans, ret);</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* If its not on the io list, we need to put the block group */</div><div class='ctx'> 		if (should_put)</div><div class='ctx'> 			btrfs_put_block_group(cache);</div><div class='del'>-		btrfs_delayed_refs_rsv_release(fs_info, 1);</div><div class='add'>+		btrfs_dec_delayed_refs_rsv_bg_updates(fs_info);</div><div class='ctx'> 		spin_lock(&amp;cur_trans-&gt;dirty_bgs_lock);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;cur_trans-&gt;dirty_bgs_lock);</div><div class='hunk'>@@ -3177,7 +3672,6 @@ int btrfs_write_dirty_block_groups(struct btrfs_trans_handle *trans)</div><div class='ctx'> 		btrfs_put_block_group(cache);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3185,12 +3679,12 @@ int btrfs_update_block_group(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			     u64 bytenr, u64 num_bytes, bool alloc)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *info = trans-&gt;fs_info;</div><div class='del'>-	struct btrfs_block_group *cache = NULL;</div><div class='del'>-	u64 total = num_bytes;</div><div class='add'>+	struct btrfs_space_info *space_info;</div><div class='add'>+	struct btrfs_block_group *cache;</div><div class='ctx'> 	u64 old_val;</div><div class='del'>-	u64 byte_in_group;</div><div class='add'>+	bool reclaim = false;</div><div class='add'>+	bool bg_already_dirty = true;</div><div class='ctx'> 	int factor;</div><div class='del'>-	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	/* Block accounting for super block */</div><div class='ctx'> 	spin_lock(&amp;info-&gt;delalloc_root_lock);</div><div class='hunk'>@@ -3202,92 +3696,96 @@ int btrfs_update_block_group(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	btrfs_set_super_bytes_used(info-&gt;super_copy, old_val);</div><div class='ctx'> 	spin_unlock(&amp;info-&gt;delalloc_root_lock);</div><div class='ctx'> </div><div class='del'>-	while (total) {</div><div class='del'>-		cache = btrfs_lookup_block_group(info, bytenr);</div><div class='del'>-		if (!cache) {</div><div class='del'>-			ret = -ENOENT;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		factor = btrfs_bg_type_to_factor(cache-&gt;flags);</div><div class='add'>+	cache = btrfs_lookup_block_group(info, bytenr);</div><div class='add'>+	if (!cache)</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * If this block group has free space cache written out, we</div><div class='del'>-		 * need to make sure to load it if we are removing space.  This</div><div class='del'>-		 * is because we need the unpinning stage to actually add the</div><div class='del'>-		 * space back to the block group, otherwise we will leak space.</div><div class='del'>-		 */</div><div class='del'>-		if (!alloc &amp;&amp; !btrfs_block_group_done(cache))</div><div class='del'>-			btrfs_cache_block_group(cache, 1);</div><div class='add'>+	/* An extent can not span multiple block groups. */</div><div class='add'>+	ASSERT(bytenr + num_bytes &lt;= cache-&gt;start + cache-&gt;length);</div><div class='ctx'> </div><div class='del'>-		byte_in_group = bytenr - cache-&gt;start;</div><div class='del'>-		WARN_ON(byte_in_group &gt; cache-&gt;length);</div><div class='add'>+	space_info = cache-&gt;space_info;</div><div class='add'>+	factor = btrfs_bg_type_to_factor(cache-&gt;flags);</div><div class='ctx'> </div><div class='del'>-		spin_lock(&amp;cache-&gt;space_info-&gt;lock);</div><div class='del'>-		spin_lock(&amp;cache-&gt;lock);</div><div class='add'>+	/*</div><div class='add'>+	 * If this block group has free space cache written out, we need to make</div><div class='add'>+	 * sure to load it if we are removing space.  This is because we need</div><div class='add'>+	 * the unpinning stage to actually add the space back to the block group,</div><div class='add'>+	 * otherwise we will leak space.</div><div class='add'>+	 */</div><div class='add'>+	if (!alloc &amp;&amp; !btrfs_block_group_done(cache))</div><div class='add'>+		btrfs_cache_block_group(cache, true);</div><div class='ctx'> </div><div class='del'>-		if (btrfs_test_opt(info, SPACE_CACHE) &amp;&amp;</div><div class='del'>-		    cache-&gt;disk_cache_state &lt; BTRFS_DC_CLEAR)</div><div class='del'>-			cache-&gt;disk_cache_state = BTRFS_DC_CLEAR;</div><div class='add'>+	spin_lock(&amp;space_info-&gt;lock);</div><div class='add'>+	spin_lock(&amp;cache-&gt;lock);</div><div class='ctx'> </div><div class='del'>-		old_val = cache-&gt;used;</div><div class='del'>-		num_bytes = min(total, cache-&gt;length - byte_in_group);</div><div class='del'>-		if (alloc) {</div><div class='del'>-			old_val += num_bytes;</div><div class='del'>-			cache-&gt;used = old_val;</div><div class='del'>-			cache-&gt;reserved -= num_bytes;</div><div class='del'>-			cache-&gt;space_info-&gt;bytes_reserved -= num_bytes;</div><div class='del'>-			cache-&gt;space_info-&gt;bytes_used += num_bytes;</div><div class='del'>-			cache-&gt;space_info-&gt;disk_used += num_bytes * factor;</div><div class='del'>-			spin_unlock(&amp;cache-&gt;lock);</div><div class='del'>-			spin_unlock(&amp;cache-&gt;space_info-&gt;lock);</div><div class='del'>-		} else {</div><div class='del'>-			old_val -= num_bytes;</div><div class='del'>-			cache-&gt;used = old_val;</div><div class='del'>-			cache-&gt;pinned += num_bytes;</div><div class='del'>-			btrfs_space_info_update_bytes_pinned(info,</div><div class='del'>-					cache-&gt;space_info, num_bytes);</div><div class='del'>-			cache-&gt;space_info-&gt;bytes_used -= num_bytes;</div><div class='del'>-			cache-&gt;space_info-&gt;disk_used -= num_bytes * factor;</div><div class='del'>-			spin_unlock(&amp;cache-&gt;lock);</div><div class='del'>-			spin_unlock(&amp;cache-&gt;space_info-&gt;lock);</div><div class='del'>-</div><div class='del'>-			set_extent_dirty(&amp;trans-&gt;transaction-&gt;pinned_extents,</div><div class='del'>-					 bytenr, bytenr + num_bytes - 1,</div><div class='del'>-					 GFP_NOFS | __GFP_NOFAIL);</div><div class='del'>-		}</div><div class='add'>+	if (btrfs_test_opt(info, SPACE_CACHE) &amp;&amp;</div><div class='add'>+	    cache-&gt;disk_cache_state &lt; BTRFS_DC_CLEAR)</div><div class='add'>+		cache-&gt;disk_cache_state = BTRFS_DC_CLEAR;</div><div class='ctx'> </div><div class='del'>-		spin_lock(&amp;trans-&gt;transaction-&gt;dirty_bgs_lock);</div><div class='del'>-		if (list_empty(&amp;cache-&gt;dirty_list)) {</div><div class='del'>-			list_add_tail(&amp;cache-&gt;dirty_list,</div><div class='del'>-				      &amp;trans-&gt;transaction-&gt;dirty_bgs);</div><div class='del'>-			trans-&gt;delayed_ref_updates++;</div><div class='del'>-			btrfs_get_block_group(cache);</div><div class='del'>-		}</div><div class='del'>-		spin_unlock(&amp;trans-&gt;transaction-&gt;dirty_bgs_lock);</div><div class='add'>+	old_val = cache-&gt;used;</div><div class='add'>+	if (alloc) {</div><div class='add'>+		old_val += num_bytes;</div><div class='add'>+		cache-&gt;used = old_val;</div><div class='add'>+		cache-&gt;reserved -= num_bytes;</div><div class='add'>+		cache-&gt;reclaim_mark = 0;</div><div class='add'>+		space_info-&gt;bytes_reserved -= num_bytes;</div><div class='add'>+		space_info-&gt;bytes_used += num_bytes;</div><div class='add'>+		space_info-&gt;disk_used += num_bytes * factor;</div><div class='add'>+		if (READ_ONCE(space_info-&gt;periodic_reclaim))</div><div class='add'>+			btrfs_space_info_update_reclaimable(space_info, -num_bytes);</div><div class='add'>+		spin_unlock(&amp;cache-&gt;lock);</div><div class='add'>+		spin_unlock(&amp;space_info-&gt;lock);</div><div class='add'>+	} else {</div><div class='add'>+		old_val -= num_bytes;</div><div class='add'>+		cache-&gt;used = old_val;</div><div class='add'>+		cache-&gt;pinned += num_bytes;</div><div class='add'>+		btrfs_space_info_update_bytes_pinned(space_info, num_bytes);</div><div class='add'>+		space_info-&gt;bytes_used -= num_bytes;</div><div class='add'>+		space_info-&gt;disk_used -= num_bytes * factor;</div><div class='add'>+		if (READ_ONCE(space_info-&gt;periodic_reclaim))</div><div class='add'>+			btrfs_space_info_update_reclaimable(space_info, num_bytes);</div><div class='add'>+		else</div><div class='add'>+			reclaim = should_reclaim_block_group(cache, num_bytes);</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * No longer have used bytes in this block group, queue it for</div><div class='del'>-		 * deletion. We do this after adding the block group to the</div><div class='del'>-		 * dirty list to avoid races between cleaner kthread and space</div><div class='del'>-		 * cache writeout.</div><div class='del'>-		 */</div><div class='del'>-		if (!alloc &amp;&amp; old_val == 0) {</div><div class='del'>-			if (!btrfs_test_opt(info, DISCARD_ASYNC))</div><div class='del'>-				btrfs_mark_bg_unused(cache);</div><div class='del'>-		}</div><div class='add'>+		spin_unlock(&amp;cache-&gt;lock);</div><div class='add'>+		spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> </div><div class='del'>-		btrfs_put_block_group(cache);</div><div class='del'>-		total -= num_bytes;</div><div class='del'>-		bytenr += num_bytes;</div><div class='add'>+		btrfs_set_extent_bit(&amp;trans-&gt;transaction-&gt;pinned_extents, bytenr,</div><div class='add'>+				     bytenr + num_bytes - 1, EXTENT_DIRTY, NULL);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	spin_lock(&amp;trans-&gt;transaction-&gt;dirty_bgs_lock);</div><div class='add'>+	if (list_empty(&amp;cache-&gt;dirty_list)) {</div><div class='add'>+		list_add_tail(&amp;cache-&gt;dirty_list, &amp;trans-&gt;transaction-&gt;dirty_bgs);</div><div class='add'>+		bg_already_dirty = false;</div><div class='add'>+		btrfs_get_block_group(cache);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;trans-&gt;transaction-&gt;dirty_bgs_lock);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * No longer have used bytes in this block group, queue it for deletion.</div><div class='add'>+	 * We do this after adding the block group to the dirty list to avoid</div><div class='add'>+	 * races between cleaner kthread and space cache writeout.</div><div class='add'>+	 */</div><div class='add'>+	if (!alloc &amp;&amp; old_val == 0) {</div><div class='add'>+		if (!btrfs_test_opt(info, DISCARD_ASYNC))</div><div class='add'>+			btrfs_mark_bg_unused(cache);</div><div class='add'>+	} else if (!alloc &amp;&amp; reclaim) {</div><div class='add'>+		btrfs_mark_bg_to_reclaim(cache);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	btrfs_put_block_group(cache);</div><div class='add'>+</div><div class='ctx'> 	/* Modified block groups are accounted for in the delayed_refs_rsv. */</div><div class='del'>-	btrfs_update_delayed_refs_rsv(trans);</div><div class='del'>-	return ret;</div><div class='add'>+	if (!bg_already_dirty)</div><div class='add'>+		btrfs_inc_delayed_refs_rsv_bg_updates(info);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * btrfs_add_reserved_bytes - update the block_group and space info counters</div><div class='add'>+/*</div><div class='add'>+ * Update the block_group and space info counters.</div><div class='add'>+ *</div><div class='ctx'>  * @cache:	The cache we are manipulating</div><div class='ctx'>  * @ram_bytes:  The number of bytes of file content, and will be same to</div><div class='ctx'>  *              @num_bytes except for the compress path.</div><div class='hunk'>@@ -3299,66 +3797,89 @@ int btrfs_update_block_group(struct btrfs_trans_handle *trans,</div><div class='ctx'>  * reservation and return -EAGAIN, otherwise this function always succeeds.</div><div class='ctx'>  */</div><div class='ctx'> int btrfs_add_reserved_bytes(struct btrfs_block_group *cache,</div><div class='del'>-			     u64 ram_bytes, u64 num_bytes, int delalloc)</div><div class='add'>+			     u64 ram_bytes, u64 num_bytes, bool delalloc,</div><div class='add'>+			     bool force_wrong_size_class)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_space_info *space_info = cache-&gt;space_info;</div><div class='add'>+	enum btrfs_block_group_size_class size_class;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;space_info-&gt;lock);</div><div class='ctx'> 	spin_lock(&amp;cache-&gt;lock);</div><div class='ctx'> 	if (cache-&gt;ro) {</div><div class='ctx'> 		ret = -EAGAIN;</div><div class='del'>-	} else {</div><div class='del'>-		cache-&gt;reserved += num_bytes;</div><div class='del'>-		space_info-&gt;bytes_reserved += num_bytes;</div><div class='del'>-		trace_btrfs_space_reservation(cache-&gt;fs_info, "space_info",</div><div class='del'>-					      space_info-&gt;flags, num_bytes, 1);</div><div class='del'>-		btrfs_space_info_update_bytes_may_use(cache-&gt;fs_info,</div><div class='del'>-						      space_info, -ram_bytes);</div><div class='del'>-		if (delalloc)</div><div class='del'>-			cache-&gt;delalloc_bytes += num_bytes;</div><div class='add'>+		goto out_error;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * Compression can use less space than we reserved, so wake</div><div class='del'>-		 * tickets if that happens</div><div class='del'>-		 */</div><div class='del'>-		if (num_bytes &lt; ram_bytes)</div><div class='del'>-			btrfs_try_granting_tickets(cache-&gt;fs_info, space_info);</div><div class='add'>+	if (btrfs_block_group_should_use_size_class(cache)) {</div><div class='add'>+		size_class = btrfs_calc_block_group_size_class(num_bytes);</div><div class='add'>+		ret = btrfs_use_block_group_size_class(cache, size_class, force_wrong_size_class);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out_error;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	cache-&gt;reserved += num_bytes;</div><div class='add'>+	if (delalloc)</div><div class='add'>+		cache-&gt;delalloc_bytes += num_bytes;</div><div class='add'>+</div><div class='add'>+	trace_btrfs_space_reservation(cache-&gt;fs_info, "space_info",</div><div class='add'>+				      space_info-&gt;flags, num_bytes, 1);</div><div class='add'>+	spin_unlock(&amp;cache-&gt;lock);</div><div class='add'>+</div><div class='add'>+	space_info-&gt;bytes_reserved += num_bytes;</div><div class='add'>+	btrfs_space_info_update_bytes_may_use(space_info, -ram_bytes);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Compression can use less space than we reserved, so wake tickets if</div><div class='add'>+	 * that happens.</div><div class='add'>+	 */</div><div class='add'>+	if (num_bytes &lt; ram_bytes)</div><div class='add'>+		btrfs_try_granting_tickets(space_info);</div><div class='add'>+	spin_unlock(&amp;space_info-&gt;lock);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+out_error:</div><div class='ctx'> 	spin_unlock(&amp;cache-&gt;lock);</div><div class='ctx'> 	spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * btrfs_free_reserved_bytes - update the block_group and space info counters</div><div class='del'>- * @cache:      The cache we are manipulating</div><div class='del'>- * @num_bytes:  The number of bytes in question</div><div class='del'>- * @delalloc:   The blocks are allocated for the delalloc write</div><div class='add'>+/*</div><div class='add'>+ * Update the block_group and space info counters.</div><div class='add'>+ *</div><div class='add'>+ * @cache:       The cache we are manipulating.</div><div class='add'>+ * @num_bytes:   The number of bytes in question.</div><div class='add'>+ * @is_delalloc: Whether the blocks are allocated for a delalloc write.</div><div class='ctx'>  *</div><div class='ctx'>  * This is called by somebody who is freeing space that was never actually used</div><div class='ctx'>  * on disk.  For example if you reserve some space for a new leaf in transaction</div><div class='ctx'>  * A and before transaction A commits you free that leaf, you call this with</div><div class='ctx'>  * reserve set to 0 in order to clear the reservation.</div><div class='ctx'>  */</div><div class='del'>-void btrfs_free_reserved_bytes(struct btrfs_block_group *cache,</div><div class='del'>-			       u64 num_bytes, int delalloc)</div><div class='add'>+void btrfs_free_reserved_bytes(struct btrfs_block_group *cache, u64 num_bytes,</div><div class='add'>+			       bool is_delalloc)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_space_info *space_info = cache-&gt;space_info;</div><div class='add'>+	bool bg_ro;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;space_info-&gt;lock);</div><div class='ctx'> 	spin_lock(&amp;cache-&gt;lock);</div><div class='del'>-	if (cache-&gt;ro)</div><div class='del'>-		space_info-&gt;bytes_readonly += num_bytes;</div><div class='add'>+	bg_ro = cache-&gt;ro;</div><div class='ctx'> 	cache-&gt;reserved -= num_bytes;</div><div class='del'>-	space_info-&gt;bytes_reserved -= num_bytes;</div><div class='del'>-	space_info-&gt;max_extent_size = 0;</div><div class='del'>-</div><div class='del'>-	if (delalloc)</div><div class='add'>+	if (is_delalloc)</div><div class='ctx'> 		cache-&gt;delalloc_bytes -= num_bytes;</div><div class='ctx'> 	spin_unlock(&amp;cache-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	btrfs_try_granting_tickets(cache-&gt;fs_info, space_info);</div><div class='add'>+	if (bg_ro)</div><div class='add'>+		space_info-&gt;bytes_readonly += num_bytes;</div><div class='add'>+	else if (btrfs_is_zoned(cache-&gt;fs_info))</div><div class='add'>+		space_info-&gt;bytes_zone_unusable += num_bytes;</div><div class='add'>+</div><div class='add'>+	space_info-&gt;bytes_reserved -= num_bytes;</div><div class='add'>+	space_info-&gt;max_extent_size = 0;</div><div class='add'>+</div><div class='add'>+	btrfs_try_granting_tickets(space_info);</div><div class='ctx'> 	spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3373,14 +3894,14 @@ static void force_metadata_allocation(struct btrfs_fs_info *info)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int should_alloc_chunk(struct btrfs_fs_info *fs_info,</div><div class='del'>-			      struct btrfs_space_info *sinfo, int force)</div><div class='add'>+static bool should_alloc_chunk(const struct btrfs_fs_info *fs_info,</div><div class='add'>+			       const struct btrfs_space_info *sinfo, int force)</div><div class='ctx'> {</div><div class='ctx'> 	u64 bytes_used = btrfs_space_info_used(sinfo, false);</div><div class='ctx'> 	u64 thresh;</div><div class='ctx'> </div><div class='ctx'> 	if (force == CHUNK_ALLOC_FORCE)</div><div class='del'>-		return 1;</div><div class='add'>+		return true;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * in limited mode, we want to have some free space up to</div><div class='hunk'>@@ -3388,25 +3909,34 @@ static int should_alloc_chunk(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (force == CHUNK_ALLOC_LIMITED) {</div><div class='ctx'> 		thresh = btrfs_super_total_bytes(fs_info-&gt;super_copy);</div><div class='del'>-		thresh = max_t(u64, SZ_64M, div_factor_fine(thresh, 1));</div><div class='add'>+		thresh = max_t(u64, SZ_64M, mult_perc(thresh, 1));</div><div class='ctx'> </div><div class='ctx'> 		if (sinfo-&gt;total_bytes - bytes_used &lt; thresh)</div><div class='del'>-			return 1;</div><div class='add'>+			return true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (bytes_used + SZ_2M &lt; div_factor(sinfo-&gt;total_bytes, 8))</div><div class='del'>-		return 0;</div><div class='del'>-	return 1;</div><div class='add'>+	if (bytes_used + SZ_2M &lt; mult_perc(sinfo-&gt;total_bytes, 80))</div><div class='add'>+		return false;</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_force_chunk_alloc(struct btrfs_trans_handle *trans, u64 type)</div><div class='ctx'> {</div><div class='ctx'> 	u64 alloc_flags = btrfs_get_alloc_profile(trans-&gt;fs_info, type);</div><div class='add'>+	struct btrfs_space_info *space_info;</div><div class='ctx'> </div><div class='del'>-	return btrfs_chunk_alloc(trans, alloc_flags, CHUNK_ALLOC_FORCE);</div><div class='add'>+	space_info = btrfs_find_space_info(trans-&gt;fs_info, type);</div><div class='add'>+	if (!space_info) {</div><div class='add'>+		DEBUG_WARN();</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return btrfs_chunk_alloc(trans, space_info, alloc_flags, CHUNK_ALLOC_FORCE);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int do_chunk_alloc(struct btrfs_trans_handle *trans, u64 flags)</div><div class='add'>+static struct btrfs_block_group *do_chunk_alloc(struct btrfs_trans_handle *trans,</div><div class='add'>+						struct btrfs_space_info *space_info,</div><div class='add'>+						u64 flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_block_group *bg;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -3419,7 +3949,7 @@ static int do_chunk_alloc(struct btrfs_trans_handle *trans, u64 flags)</div><div class='ctx'> 	 */</div><div class='ctx'> 	check_system_chunk(trans, flags);</div><div class='ctx'> </div><div class='del'>-	bg = btrfs_create_chunk(trans, flags);</div><div class='add'>+	bg = btrfs_create_chunk(trans, space_info, flags);</div><div class='ctx'> 	if (IS_ERR(bg)) {</div><div class='ctx'> 		ret = PTR_ERR(bg);</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -3467,8 +3997,16 @@ static int do_chunk_alloc(struct btrfs_trans_handle *trans, u64 flags)</div><div class='ctx'> 	if (ret == -ENOSPC) {</div><div class='ctx'> 		const u64 sys_flags = btrfs_system_alloc_profile(trans-&gt;fs_info);</div><div class='ctx'> 		struct btrfs_block_group *sys_bg;</div><div class='add'>+		struct btrfs_space_info *sys_space_info;</div><div class='add'>+</div><div class='add'>+		sys_space_info = btrfs_find_space_info(trans-&gt;fs_info, sys_flags);</div><div class='add'>+		if (unlikely(!sys_space_info)) {</div><div class='add'>+			ret = -EINVAL;</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-		sys_bg = btrfs_create_chunk(trans, sys_flags);</div><div class='add'>+		sys_bg = btrfs_create_chunk(trans, sys_space_info, sys_flags);</div><div class='ctx'> 		if (IS_ERR(sys_bg)) {</div><div class='ctx'> 			ret = PTR_ERR(sys_bg);</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='hunk'>@@ -3476,24 +4014,28 @@ static int do_chunk_alloc(struct btrfs_trans_handle *trans, u64 flags)</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		ret = btrfs_chunk_alloc_add_chunk_item(trans, sys_bg);</div><div class='del'>-		if (ret) {</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		ret = btrfs_chunk_alloc_add_chunk_item(trans, bg);</div><div class='del'>-		if (ret) {</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='del'>-	} else if (ret) {</div><div class='add'>+	} else if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='ctx'> 	btrfs_trans_release_chunk_metadata(trans);</div><div class='ctx'> </div><div class='del'>-	return ret;</div><div class='add'>+	if (ret)</div><div class='add'>+		return ERR_PTR(ret);</div><div class='add'>+</div><div class='add'>+	btrfs_get_block_group(bg);</div><div class='add'>+	return bg;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -3595,6 +4137,8 @@ out:</div><div class='ctx'>  *</div><div class='ctx'>  * This function, btrfs_chunk_alloc(), belongs to phase 1.</div><div class='ctx'>  *</div><div class='add'>+ * @space_info: specify which space_info the new chunk should belong to.</div><div class='add'>+ *</div><div class='ctx'>  * If @force is CHUNK_ALLOC_FORCE:</div><div class='ctx'>  *    - return 1 if it successfully allocates a chunk,</div><div class='ctx'>  *    - return errors including -ENOSPC otherwise.</div><div class='hunk'>@@ -3603,15 +4147,22 @@ out:</div><div class='ctx'>  *    - return 1 if it successfully allocates a chunk,</div><div class='ctx'>  *    - return errors including -ENOSPC otherwise.</div><div class='ctx'>  */</div><div class='del'>-int btrfs_chunk_alloc(struct btrfs_trans_handle *trans, u64 flags,</div><div class='add'>+int btrfs_chunk_alloc(struct btrfs_trans_handle *trans,</div><div class='add'>+		      struct btrfs_space_info *space_info, u64 flags,</div><div class='ctx'> 		      enum btrfs_chunk_alloc_enum force)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='del'>-	struct btrfs_space_info *space_info;</div><div class='add'>+	struct btrfs_block_group *ret_bg;</div><div class='ctx'> 	bool wait_for_alloc = false;</div><div class='ctx'> 	bool should_alloc = false;</div><div class='add'>+	bool from_extent_allocation = false;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='add'>+	if (force == CHUNK_ALLOC_FORCE_FOR_EXTENT) {</div><div class='add'>+		from_extent_allocation = true;</div><div class='add'>+		force = CHUNK_ALLOC_FORCE;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/* Don't re-enter if we're already allocating a chunk */</div><div class='ctx'> 	if (trans-&gt;allocating_chunk)</div><div class='ctx'> 		return -ENOSPC;</div><div class='hunk'>@@ -3639,9 +4190,6 @@ int btrfs_chunk_alloc(struct btrfs_trans_handle *trans, u64 flags,</div><div class='ctx'> 	if (flags &amp; BTRFS_BLOCK_GROUP_SYSTEM)</div><div class='ctx'> 		return -ENOSPC;</div><div class='ctx'> </div><div class='del'>-	space_info = btrfs_find_space_info(fs_info, flags);</div><div class='del'>-	ASSERT(space_info);</div><div class='del'>-</div><div class='ctx'> 	do {</div><div class='ctx'> 		spin_lock(&amp;space_info-&gt;lock);</div><div class='ctx'> 		if (force &lt; space_info-&gt;force_alloc)</div><div class='hunk'>@@ -3649,11 +4197,11 @@ int btrfs_chunk_alloc(struct btrfs_trans_handle *trans, u64 flags,</div><div class='ctx'> 		should_alloc = should_alloc_chunk(fs_info, space_info, force);</div><div class='ctx'> 		if (space_info-&gt;full) {</div><div class='ctx'> 			/* No more free physical space */</div><div class='add'>+			spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> 			if (should_alloc)</div><div class='ctx'> 				ret = -ENOSPC;</div><div class='ctx'> 			else</div><div class='ctx'> 				ret = 0;</div><div class='del'>-			spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> 			return ret;</div><div class='ctx'> 		} else if (!should_alloc) {</div><div class='ctx'> 			spin_unlock(&amp;space_info-&gt;lock);</div><div class='hunk'>@@ -3665,15 +4213,16 @@ int btrfs_chunk_alloc(struct btrfs_trans_handle *trans, u64 flags,</div><div class='ctx'> 			 * recheck if we should continue with our allocation</div><div class='ctx'> 			 * attempt.</div><div class='ctx'> 			 */</div><div class='del'>-			wait_for_alloc = true;</div><div class='ctx'> 			spin_unlock(&amp;space_info-&gt;lock);</div><div class='add'>+			wait_for_alloc = true;</div><div class='add'>+			force = CHUNK_ALLOC_NO_FORCE;</div><div class='ctx'> 			mutex_lock(&amp;fs_info-&gt;chunk_mutex);</div><div class='ctx'> 			mutex_unlock(&amp;fs_info-&gt;chunk_mutex);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			/* Proceed with allocation */</div><div class='del'>-			space_info-&gt;chunk_alloc = 1;</div><div class='del'>-			wait_for_alloc = false;</div><div class='add'>+			space_info-&gt;chunk_alloc = true;</div><div class='ctx'> 			spin_unlock(&amp;space_info-&gt;lock);</div><div class='add'>+			wait_for_alloc = false;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		cond_resched();</div><div class='hunk'>@@ -3701,13 +4250,26 @@ int btrfs_chunk_alloc(struct btrfs_trans_handle *trans, u64 flags,</div><div class='ctx'> 			force_metadata_allocation(fs_info);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = do_chunk_alloc(trans, flags);</div><div class='add'>+	ret_bg = do_chunk_alloc(trans, space_info, flags);</div><div class='ctx'> 	trans-&gt;allocating_chunk = false;</div><div class='ctx'> </div><div class='add'>+	if (IS_ERR(ret_bg)) {</div><div class='add'>+		ret = PTR_ERR(ret_bg);</div><div class='add'>+	} else if (from_extent_allocation &amp;&amp; (flags &amp; BTRFS_BLOCK_GROUP_DATA)) {</div><div class='add'>+		/*</div><div class='add'>+		 * New block group is likely to be used soon. Try to activate</div><div class='add'>+		 * it now. Failure is OK for now.</div><div class='add'>+		 */</div><div class='add'>+		btrfs_zone_activate(ret_bg);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!ret)</div><div class='add'>+		btrfs_put_block_group(ret_bg);</div><div class='add'>+</div><div class='ctx'> 	spin_lock(&amp;space_info-&gt;lock);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='ctx'> 		if (ret == -ENOSPC)</div><div class='del'>-			space_info-&gt;full = 1;</div><div class='add'>+			space_info-&gt;full = true;</div><div class='ctx'> 		else</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -3717,14 +4279,14 @@ int btrfs_chunk_alloc(struct btrfs_trans_handle *trans, u64 flags,</div><div class='ctx'> </div><div class='ctx'> 	space_info-&gt;force_alloc = CHUNK_ALLOC_NO_FORCE;</div><div class='ctx'> out:</div><div class='del'>-	space_info-&gt;chunk_alloc = 0;</div><div class='add'>+	space_info-&gt;chunk_alloc = false;</div><div class='ctx'> 	spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;chunk_mutex);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static u64 get_profile_num_devs(struct btrfs_fs_info *fs_info, u64 type)</div><div class='add'>+static u64 get_profile_num_devs(const struct btrfs_fs_info *fs_info, u64 type)</div><div class='ctx'> {</div><div class='ctx'> 	u64 num_dev;</div><div class='ctx'> </div><div class='hunk'>@@ -3758,12 +4320,16 @@ static void reserve_chunk_space(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	if (left &lt; bytes &amp;&amp; btrfs_test_opt(fs_info, ENOSPC_DEBUG)) {</div><div class='ctx'> 		btrfs_info(fs_info, "left=%llu, need=%llu, flags=%llu",</div><div class='ctx'> 			   left, bytes, type);</div><div class='del'>-		btrfs_dump_space_info(fs_info, info, 0, 0);</div><div class='add'>+		btrfs_dump_space_info(info, 0, false);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (left &lt; bytes) {</div><div class='ctx'> 		u64 flags = btrfs_system_alloc_profile(fs_info);</div><div class='ctx'> 		struct btrfs_block_group *bg;</div><div class='add'>+		struct btrfs_space_info *space_info;</div><div class='add'>+</div><div class='add'>+		space_info = btrfs_find_space_info(fs_info, flags);</div><div class='add'>+		ASSERT(space_info);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Ignore failure to create system chunk. We might end up not</div><div class='hunk'>@@ -3771,11 +4337,19 @@ static void reserve_chunk_space(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		 * the paths we visit in the chunk tree (they were already COWed</div><div class='ctx'> 		 * or created in the current transaction for example).</div><div class='ctx'> 		 */</div><div class='del'>-		bg = btrfs_create_chunk(trans, flags);</div><div class='add'>+		bg = btrfs_create_chunk(trans, space_info, flags);</div><div class='ctx'> 		if (IS_ERR(bg)) {</div><div class='ctx'> 			ret = PTR_ERR(bg);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			/*</div><div class='add'>+			 * We have a new chunk. We also need to activate it for</div><div class='add'>+			 * zoned filesystem.</div><div class='add'>+			 */</div><div class='add'>+			ret = btrfs_zoned_activate_one_bg(info, true);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				return;</div><div class='add'>+</div><div class='add'>+			/*</div><div class='ctx'> 			 * If we fail to add the chunk item here, we end up</div><div class='ctx'> 			 * trying again at phase 2 of chunk allocation, at</div><div class='ctx'> 			 * btrfs_create_pending_block_groups(). So ignore</div><div class='hunk'>@@ -3790,7 +4364,7 @@ static void reserve_chunk_space(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!ret) {</div><div class='del'>-		ret = btrfs_block_rsv_add(fs_info-&gt;chunk_root,</div><div class='add'>+		ret = btrfs_block_rsv_add(fs_info,</div><div class='ctx'> 					  &amp;fs_info-&gt;chunk_block_rsv,</div><div class='ctx'> 					  bytes, BTRFS_RESERVE_NO_FLUSH);</div><div class='ctx'> 		if (!ret)</div><div class='hunk'>@@ -3850,36 +4424,62 @@ void btrfs_reserve_chunk_metadata(struct btrfs_trans_handle *trans,</div><div class='ctx'> void btrfs_put_block_group_cache(struct btrfs_fs_info *info)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_block_group *block_group;</div><div class='del'>-	u64 last = 0;</div><div class='ctx'> </div><div class='del'>-	while (1) {</div><div class='del'>-		struct inode *inode;</div><div class='add'>+	block_group = btrfs_lookup_first_block_group(info, 0);</div><div class='add'>+	while (block_group) {</div><div class='add'>+		btrfs_wait_block_group_cache_done(block_group);</div><div class='add'>+		spin_lock(&amp;block_group-&gt;lock);</div><div class='add'>+		if (test_and_clear_bit(BLOCK_GROUP_FLAG_IREF,</div><div class='add'>+				       &amp;block_group-&gt;runtime_flags)) {</div><div class='add'>+			struct btrfs_inode *inode = block_group-&gt;inode;</div><div class='ctx'> </div><div class='del'>-		block_group = btrfs_lookup_first_block_group(info, last);</div><div class='del'>-		while (block_group) {</div><div class='del'>-			btrfs_wait_block_group_cache_done(block_group);</div><div class='del'>-			spin_lock(&amp;block_group-&gt;lock);</div><div class='del'>-			if (block_group-&gt;iref)</div><div class='del'>-				break;</div><div class='add'>+			block_group-&gt;inode = NULL;</div><div class='add'>+			spin_unlock(&amp;block_group-&gt;lock);</div><div class='add'>+</div><div class='add'>+			ASSERT(block_group-&gt;io_ctl.inode == NULL);</div><div class='add'>+			iput(&amp;inode-&gt;vfs_inode);</div><div class='add'>+		} else {</div><div class='ctx'> 			spin_unlock(&amp;block_group-&gt;lock);</div><div class='del'>-			block_group = btrfs_next_block_group(block_group);</div><div class='ctx'> 		}</div><div class='del'>-		if (!block_group) {</div><div class='del'>-			if (last == 0)</div><div class='del'>-				break;</div><div class='del'>-			last = 0;</div><div class='del'>-			continue;</div><div class='add'>+		block_group = btrfs_next_block_group(block_group);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void check_removing_space_info(struct btrfs_space_info *space_info)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *info = space_info-&gt;fs_info;</div><div class='add'>+</div><div class='add'>+	if (space_info-&gt;subgroup_id == BTRFS_SUB_GROUP_PRIMARY) {</div><div class='add'>+		/* This is a top space_info, proceed with its children first. */</div><div class='add'>+		for (int i = 0; i &lt; BTRFS_SPACE_INFO_SUB_GROUP_MAX; i++) {</div><div class='add'>+			if (space_info-&gt;sub_group[i]) {</div><div class='add'>+				check_removing_space_info(space_info-&gt;sub_group[i]);</div><div class='add'>+				kfree(space_info-&gt;sub_group[i]);</div><div class='add'>+				space_info-&gt;sub_group[i] = NULL;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		inode = block_group-&gt;inode;</div><div class='del'>-		block_group-&gt;iref = 0;</div><div class='del'>-		block_group-&gt;inode = NULL;</div><div class='del'>-		spin_unlock(&amp;block_group-&gt;lock);</div><div class='del'>-		ASSERT(block_group-&gt;io_ctl.inode == NULL);</div><div class='del'>-		iput(inode);</div><div class='del'>-		last = block_group-&gt;start + block_group-&gt;length;</div><div class='del'>-		btrfs_put_block_group(block_group);</div><div class='add'>+	/*</div><div class='add'>+	 * Do not hide this behind enospc_debug, this is actually important and</div><div class='add'>+	 * indicates a real bug if this happens.</div><div class='add'>+	 */</div><div class='add'>+	if (WARN_ON(space_info-&gt;bytes_pinned &gt; 0 || space_info-&gt;bytes_may_use &gt; 0))</div><div class='add'>+		btrfs_dump_space_info(space_info, 0, false);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If there was a failure to cleanup a log tree, very likely due to an</div><div class='add'>+	 * IO failure on a writeback attempt of one or more of its extent</div><div class='add'>+	 * buffers, we could not do proper (and cheap) unaccounting of their</div><div class='add'>+	 * reserved space, so don't warn on bytes_reserved &gt; 0 in that case.</div><div class='add'>+	 */</div><div class='add'>+	if (!(space_info-&gt;flags &amp; BTRFS_BLOCK_GROUP_METADATA) ||</div><div class='add'>+	    !BTRFS_FS_LOG_CLEANUP_ERROR(info)) {</div><div class='add'>+		if (WARN_ON(space_info-&gt;bytes_reserved &gt; 0))</div><div class='add'>+			btrfs_dump_space_info(space_info, 0, false);</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	WARN_ON(space_info-&gt;reclaim_size &gt; 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -3894,14 +4494,25 @@ int btrfs_free_block_groups(struct btrfs_fs_info *info)</div><div class='ctx'> 	struct btrfs_caching_control *caching_ctl;</div><div class='ctx'> 	struct rb_node *n;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;info-&gt;block_group_cache_lock);</div><div class='add'>+	if (btrfs_is_zoned(info)) {</div><div class='add'>+		if (info-&gt;active_meta_bg) {</div><div class='add'>+			btrfs_put_block_group(info-&gt;active_meta_bg);</div><div class='add'>+			info-&gt;active_meta_bg = NULL;</div><div class='add'>+		}</div><div class='add'>+		if (info-&gt;active_system_bg) {</div><div class='add'>+			btrfs_put_block_group(info-&gt;active_system_bg);</div><div class='add'>+			info-&gt;active_system_bg = NULL;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	write_lock(&amp;info-&gt;block_group_cache_lock);</div><div class='ctx'> 	while (!list_empty(&amp;info-&gt;caching_block_groups)) {</div><div class='del'>-		caching_ctl = list_entry(info-&gt;caching_block_groups.next,</div><div class='del'>-					 struct btrfs_caching_control, list);</div><div class='add'>+		caching_ctl = list_first_entry(&amp;info-&gt;caching_block_groups,</div><div class='add'>+					       struct btrfs_caching_control, list);</div><div class='ctx'> 		list_del(&amp;caching_ctl-&gt;list);</div><div class='ctx'> 		btrfs_put_caching_control(caching_ctl);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;info-&gt;block_group_cache_lock);</div><div class='add'>+	write_unlock(&amp;info-&gt;block_group_cache_lock);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;info-&gt;unused_bgs_lock);</div><div class='ctx'> 	while (!list_empty(&amp;info-&gt;unused_bgs)) {</div><div class='hunk'>@@ -3911,9 +4522,7 @@ int btrfs_free_block_groups(struct btrfs_fs_info *info)</div><div class='ctx'> 		list_del_init(&amp;block_group-&gt;bg_list);</div><div class='ctx'> 		btrfs_put_block_group(block_group);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;info-&gt;unused_bgs_lock);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;info-&gt;unused_bgs_lock);</div><div class='ctx'> 	while (!list_empty(&amp;info-&gt;reclaim_bgs)) {</div><div class='ctx'> 		block_group = list_first_entry(&amp;info-&gt;reclaim_bgs,</div><div class='ctx'> 					       struct btrfs_block_group,</div><div class='hunk'>@@ -3933,14 +4542,14 @@ int btrfs_free_block_groups(struct btrfs_fs_info *info)</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;info-&gt;zone_active_bgs_lock);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;info-&gt;block_group_cache_lock);</div><div class='del'>-	while ((n = rb_last(&amp;info-&gt;block_group_cache_tree)) != NULL) {</div><div class='add'>+	write_lock(&amp;info-&gt;block_group_cache_lock);</div><div class='add'>+	while ((n = rb_last(&amp;info-&gt;block_group_cache_tree.rb_root)) != NULL) {</div><div class='ctx'> 		block_group = rb_entry(n, struct btrfs_block_group,</div><div class='ctx'> 				       cache_node);</div><div class='del'>-		rb_erase(&amp;block_group-&gt;cache_node,</div><div class='del'>-			 &amp;info-&gt;block_group_cache_tree);</div><div class='add'>+		rb_erase_cached(&amp;block_group-&gt;cache_node,</div><div class='add'>+				&amp;info-&gt;block_group_cache_tree);</div><div class='ctx'> 		RB_CLEAR_NODE(&amp;block_group-&gt;cache_node);</div><div class='del'>-		spin_unlock(&amp;info-&gt;block_group_cache_lock);</div><div class='add'>+		write_unlock(&amp;info-&gt;block_group_cache_lock);</div><div class='ctx'> </div><div class='ctx'> 		down_write(&amp;block_group-&gt;space_info-&gt;groups_sem);</div><div class='ctx'> 		list_del(&amp;block_group-&gt;list);</div><div class='hunk'>@@ -3963,26 +4572,17 @@ int btrfs_free_block_groups(struct btrfs_fs_info *info)</div><div class='ctx'> 		ASSERT(block_group-&gt;swap_extents == 0);</div><div class='ctx'> 		btrfs_put_block_group(block_group);</div><div class='ctx'> </div><div class='del'>-		spin_lock(&amp;info-&gt;block_group_cache_lock);</div><div class='add'>+		write_lock(&amp;info-&gt;block_group_cache_lock);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;info-&gt;block_group_cache_lock);</div><div class='add'>+	write_unlock(&amp;info-&gt;block_group_cache_lock);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_release_global_block_rsv(info);</div><div class='ctx'> </div><div class='ctx'> 	while (!list_empty(&amp;info-&gt;space_info)) {</div><div class='del'>-		space_info = list_entry(info-&gt;space_info.next,</div><div class='del'>-					struct btrfs_space_info,</div><div class='del'>-					list);</div><div class='add'>+		space_info = list_first_entry(&amp;info-&gt;space_info,</div><div class='add'>+					      struct btrfs_space_info, list);</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * Do not hide this behind enospc_debug, this is actually</div><div class='del'>-		 * important and indicates a real bug if this happens.</div><div class='del'>-		 */</div><div class='del'>-		if (WARN_ON(space_info-&gt;bytes_pinned &gt; 0 ||</div><div class='del'>-			    space_info-&gt;bytes_reserved &gt; 0 ||</div><div class='del'>-			    space_info-&gt;bytes_may_use &gt; 0))</div><div class='del'>-			btrfs_dump_space_info(info, space_info, 0, 0);</div><div class='del'>-		WARN_ON(space_info-&gt;reclaim_size &gt; 0);</div><div class='add'>+		check_removing_space_info(space_info);</div><div class='ctx'> 		list_del(&amp;space_info-&gt;list);</div><div class='ctx'> 		btrfs_sysfs_remove_space_info(space_info);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3997,34 +4597,31 @@ void btrfs_freeze_block_group(struct btrfs_block_group *cache)</div><div class='ctx'> void btrfs_unfreeze_block_group(struct btrfs_block_group *block_group)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = block_group-&gt;fs_info;</div><div class='del'>-	struct extent_map_tree *em_tree;</div><div class='del'>-	struct extent_map *em;</div><div class='ctx'> 	bool cleanup;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;block_group-&gt;lock);</div><div class='ctx'> 	cleanup = (atomic_dec_and_test(&amp;block_group-&gt;frozen) &amp;&amp;</div><div class='del'>-		   block_group-&gt;removed);</div><div class='add'>+		   test_bit(BLOCK_GROUP_FLAG_REMOVED, &amp;block_group-&gt;runtime_flags));</div><div class='ctx'> 	spin_unlock(&amp;block_group-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	if (cleanup) {</div><div class='del'>-		em_tree = &amp;fs_info-&gt;mapping_tree;</div><div class='del'>-		write_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-		em = lookup_extent_mapping(em_tree, block_group-&gt;start,</div><div class='del'>-					   1);</div><div class='del'>-		BUG_ON(!em); /* logic error, can't happen */</div><div class='del'>-		remove_extent_mapping(em_tree, em);</div><div class='del'>-		write_unlock(&amp;em_tree-&gt;lock);</div><div class='del'>-</div><div class='del'>-		/* once for us and once for the tree */</div><div class='del'>-		free_extent_map(em);</div><div class='del'>-		free_extent_map(em);</div><div class='add'>+		struct btrfs_chunk_map *map;</div><div class='add'>+</div><div class='add'>+		map = btrfs_find_chunk_map(fs_info, block_group-&gt;start, 1);</div><div class='add'>+		/* Logic error, can't happen. */</div><div class='add'>+		ASSERT(map);</div><div class='add'>+</div><div class='add'>+		btrfs_remove_chunk_map(fs_info, map);</div><div class='add'>+</div><div class='add'>+		/* Once for our lookup reference. */</div><div class='add'>+		btrfs_free_chunk_map(map);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We may have left one free space entry and other possible</div><div class='ctx'> 		 * tasks trimming this block group have left 1 entry each one.</div><div class='ctx'> 		 * Free them if any.</div><div class='ctx'> 		 */</div><div class='del'>-		__btrfs_remove_free_space_cache(block_group-&gt;free_space_ctl);</div><div class='add'>+		btrfs_remove_free_space_cache(block_group);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -4050,3 +4647,73 @@ void btrfs_dec_block_group_swap_extents(struct btrfs_block_group *bg, int amount</div><div class='ctx'> 	bg-&gt;swap_extents -= amount;</div><div class='ctx'> 	spin_unlock(&amp;bg-&gt;lock);</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+enum btrfs_block_group_size_class btrfs_calc_block_group_size_class(u64 size)</div><div class='add'>+{</div><div class='add'>+	if (size &lt;= SZ_128K)</div><div class='add'>+		return BTRFS_BG_SZ_SMALL;</div><div class='add'>+	if (size &lt;= SZ_8M)</div><div class='add'>+		return BTRFS_BG_SZ_MEDIUM;</div><div class='add'>+	return BTRFS_BG_SZ_LARGE;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Handle a block group allocating an extent in a size class</div><div class='add'>+ *</div><div class='add'>+ * @bg:				The block group we allocated in.</div><div class='add'>+ * @size_class:			The size class of the allocation.</div><div class='add'>+ * @force_wrong_size_class:	Whether we are desperate enough to allow</div><div class='add'>+ *				mismatched size classes.</div><div class='add'>+ *</div><div class='add'>+ * Returns: 0 if the size class was valid for this block_group, -EAGAIN in the</div><div class='add'>+ * case of a race that leads to the wrong size class without</div><div class='add'>+ * force_wrong_size_class set.</div><div class='add'>+ *</div><div class='add'>+ * find_free_extent will skip block groups with a mismatched size class until</div><div class='add'>+ * it really needs to avoid ENOSPC. In that case it will set</div><div class='add'>+ * force_wrong_size_class. However, if a block group is newly allocated and</div><div class='add'>+ * doesn't yet have a size class, then it is possible for two allocations of</div><div class='add'>+ * different sizes to race and both try to use it. The loser is caught here and</div><div class='add'>+ * has to retry.</div><div class='add'>+ */</div><div class='add'>+int btrfs_use_block_group_size_class(struct btrfs_block_group *bg,</div><div class='add'>+				     enum btrfs_block_group_size_class size_class,</div><div class='add'>+				     bool force_wrong_size_class)</div><div class='add'>+{</div><div class='add'>+	ASSERT(size_class != BTRFS_BG_SZ_NONE);</div><div class='add'>+</div><div class='add'>+	/* The new allocation is in the right size class, do nothing */</div><div class='add'>+	if (bg-&gt;size_class == size_class)</div><div class='add'>+		return 0;</div><div class='add'>+	/*</div><div class='add'>+	 * The new allocation is in a mismatched size class.</div><div class='add'>+	 * This means one of two things:</div><div class='add'>+	 *</div><div class='add'>+	 * 1. Two tasks in find_free_extent for different size_classes raced</div><div class='add'>+	 *    and hit the same empty block_group. Make the loser try again.</div><div class='add'>+	 * 2. A call to find_free_extent got desperate enough to set</div><div class='add'>+	 *    'force_wrong_slab'. Don't change the size_class, but allow the</div><div class='add'>+	 *    allocation.</div><div class='add'>+	 */</div><div class='add'>+	if (bg-&gt;size_class != BTRFS_BG_SZ_NONE) {</div><div class='add'>+		if (force_wrong_size_class)</div><div class='add'>+			return 0;</div><div class='add'>+		return -EAGAIN;</div><div class='add'>+	}</div><div class='add'>+	/*</div><div class='add'>+	 * The happy new block group case: the new allocation is the first</div><div class='add'>+	 * one in the block_group so we set size_class.</div><div class='add'>+	 */</div><div class='add'>+	bg-&gt;size_class = size_class;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool btrfs_block_group_should_use_size_class(const struct btrfs_block_group *bg)</div><div class='add'>+{</div><div class='add'>+	if (btrfs_is_zoned(bg-&gt;fs_info))</div><div class='add'>+		return false;</div><div class='add'>+	if (!btrfs_is_block_group_data_only(bg))</div><div class='add'>+		return false;</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/btrfs/block-group.h b/fs/btrfs/block-group.h<br/>index 5878b7ce3b78..5f933455118c 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/block-group.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/block-group.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/block-group.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/block-group.h</a></div><div class='hunk'>@@ -3,8 +3,23 @@</div><div class='ctx'> #ifndef BTRFS_BLOCK_GROUP_H</div><div class='ctx'> #define BTRFS_BLOCK_GROUP_H</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/atomic.h&gt;</div><div class='add'>+#include &lt;linux/mutex.h&gt;</div><div class='add'>+#include &lt;linux/list.h&gt;</div><div class='add'>+#include &lt;linux/spinlock.h&gt;</div><div class='add'>+#include &lt;linux/refcount.h&gt;</div><div class='add'>+#include &lt;linux/wait.h&gt;</div><div class='add'>+#include &lt;linux/sizes.h&gt;</div><div class='add'>+#include &lt;linux/rwsem.h&gt;</div><div class='add'>+#include &lt;linux/rbtree.h&gt;</div><div class='add'>+#include &lt;uapi/linux/btrfs_tree.h&gt;</div><div class='ctx'> #include "free-space-cache.h"</div><div class='ctx'> </div><div class='add'>+struct btrfs_chunk_map;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+struct btrfs_inode;</div><div class='add'>+struct btrfs_trans_handle;</div><div class='add'>+</div><div class='ctx'> enum btrfs_disk_cache_state {</div><div class='ctx'> 	BTRFS_DC_WRITTEN,</div><div class='ctx'> 	BTRFS_DC_ERROR,</div><div class='hunk'>@@ -12,6 +27,17 @@ enum btrfs_disk_cache_state {</div><div class='ctx'> 	BTRFS_DC_SETUP,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+enum btrfs_block_group_size_class {</div><div class='add'>+	/* Unset */</div><div class='add'>+	BTRFS_BG_SZ_NONE,</div><div class='add'>+	/* 0 &lt; size &lt;= 128K */</div><div class='add'>+	BTRFS_BG_SZ_SMALL,</div><div class='add'>+	/* 128K &lt; size &lt;= 8M */</div><div class='add'>+	BTRFS_BG_SZ_MEDIUM,</div><div class='add'>+	/* 8M &lt; size &lt; BG_LENGTH */</div><div class='add'>+	BTRFS_BG_SZ_LARGE,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * This describes the state of the block_group for async discard.  This is due</div><div class='ctx'>  * to the two pass nature of it where extent discarding is prioritized over</div><div class='hunk'>@@ -35,11 +61,44 @@ enum btrfs_discard_state {</div><div class='ctx'>  * the FS with empty chunks</div><div class='ctx'>  *</div><div class='ctx'>  * CHUNK_ALLOC_FORCE means it must try to allocate one</div><div class='add'>+ *</div><div class='add'>+ * CHUNK_ALLOC_FORCE_FOR_EXTENT like CHUNK_ALLOC_FORCE but called from</div><div class='add'>+ * find_free_extent() that also activates the zone</div><div class='ctx'>  */</div><div class='ctx'> enum btrfs_chunk_alloc_enum {</div><div class='ctx'> 	CHUNK_ALLOC_NO_FORCE,</div><div class='ctx'> 	CHUNK_ALLOC_LIMITED,</div><div class='ctx'> 	CHUNK_ALLOC_FORCE,</div><div class='add'>+	CHUNK_ALLOC_FORCE_FOR_EXTENT,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/* Block group flags set at runtime */</div><div class='add'>+enum btrfs_block_group_flags {</div><div class='add'>+	BLOCK_GROUP_FLAG_IREF,</div><div class='add'>+	BLOCK_GROUP_FLAG_REMOVED,</div><div class='add'>+	BLOCK_GROUP_FLAG_TO_COPY,</div><div class='add'>+	BLOCK_GROUP_FLAG_RELOCATING_REPAIR,</div><div class='add'>+	BLOCK_GROUP_FLAG_CHUNK_ITEM_INSERTED,</div><div class='add'>+	BLOCK_GROUP_FLAG_ZONE_IS_ACTIVE,</div><div class='add'>+	BLOCK_GROUP_FLAG_ZONED_DATA_RELOC,</div><div class='add'>+	/* Does the block group need to be added to the free space tree? */</div><div class='add'>+	BLOCK_GROUP_FLAG_NEEDS_FREE_SPACE,</div><div class='add'>+	/* Set after we add a new block group to the free space tree. */</div><div class='add'>+	BLOCK_GROUP_FLAG_FREE_SPACE_ADDED,</div><div class='add'>+	/* Indicate that the block group is placed on a sequential zone */</div><div class='add'>+	BLOCK_GROUP_FLAG_SEQUENTIAL_ZONE,</div><div class='add'>+	/*</div><div class='add'>+	 * Indicate that block group is in the list of new block groups of a</div><div class='add'>+	 * transaction.</div><div class='add'>+	 */</div><div class='add'>+	BLOCK_GROUP_FLAG_NEW,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+enum btrfs_caching_type {</div><div class='add'>+	BTRFS_CACHE_NO,</div><div class='add'>+	BTRFS_CACHE_STARTED,</div><div class='add'>+	BTRFS_CACHE_FINISHED,</div><div class='add'>+	BTRFS_CACHE_ERROR,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct btrfs_caching_control {</div><div class='hunk'>@@ -48,7 +107,8 @@ struct btrfs_caching_control {</div><div class='ctx'> 	wait_queue_head_t wait;</div><div class='ctx'> 	struct btrfs_work work;</div><div class='ctx'> 	struct btrfs_block_group *block_group;</div><div class='del'>-	u64 progress;</div><div class='add'>+	/* Track progress of caching during allocation. */</div><div class='add'>+	atomic_t progress;</div><div class='ctx'> 	refcount_t count;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -57,7 +117,7 @@ struct btrfs_caching_control {</div><div class='ctx'> </div><div class='ctx'> struct btrfs_block_group {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info;</div><div class='del'>-	struct inode *inode;</div><div class='add'>+	struct btrfs_inode *inode;</div><div class='ctx'> 	spinlock_t lock;</div><div class='ctx'> 	u64 start;</div><div class='ctx'> 	u64 length;</div><div class='hunk'>@@ -68,8 +128,15 @@ struct btrfs_block_group {</div><div class='ctx'> 	u64 bytes_super;</div><div class='ctx'> 	u64 flags;</div><div class='ctx'> 	u64 cache_generation;</div><div class='add'>+	u64 global_root_id;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='add'>+	 * The last committed used bytes of this block group, if the above @used</div><div class='add'>+	 * is still the same as @commit_used, we don't need to update block</div><div class='add'>+	 * group item of this block group.</div><div class='add'>+	 */</div><div class='add'>+	u64 commit_used;</div><div class='add'>+	/*</div><div class='ctx'> 	 * If the free space extent count exceeds this number, convert the block</div><div class='ctx'> 	 * group to bitmaps.</div><div class='ctx'> 	 */</div><div class='hunk'>@@ -90,22 +157,15 @@ struct btrfs_block_group {</div><div class='ctx'> </div><div class='ctx'> 	/* For raid56, this is a full stripe, without parity */</div><div class='ctx'> 	unsigned long full_stripe_len;</div><div class='add'>+	unsigned long runtime_flags;</div><div class='ctx'> </div><div class='ctx'> 	unsigned int ro;</div><div class='del'>-	unsigned int iref:1;</div><div class='del'>-	unsigned int has_caching_ctl:1;</div><div class='del'>-	unsigned int removed:1;</div><div class='del'>-	unsigned int to_copy:1;</div><div class='del'>-	unsigned int relocating_repair:1;</div><div class='del'>-	unsigned int chunk_item_inserted:1;</div><div class='del'>-	unsigned int zone_is_active:1;</div><div class='ctx'> </div><div class='ctx'> 	int disk_cache_state;</div><div class='ctx'> </div><div class='ctx'> 	/* Cache tracking stuff */</div><div class='ctx'> 	int cached;</div><div class='ctx'> 	struct btrfs_caching_control *caching_ctl;</div><div class='del'>-	u64 last_byte_to_unpin;</div><div class='ctx'> </div><div class='ctx'> 	struct btrfs_space_info *space_info;</div><div class='ctx'> </div><div class='hunk'>@@ -126,7 +186,14 @@ struct btrfs_block_group {</div><div class='ctx'> 	 */</div><div class='ctx'> 	struct list_head cluster_list;</div><div class='ctx'> </div><div class='del'>-	/* For delayed block group creation or deletion of empty block groups */</div><div class='add'>+	/*</div><div class='add'>+	 * Used for several lists:</div><div class='add'>+	 *</div><div class='add'>+	 * 1) struct btrfs_fs_info::unused_bgs</div><div class='add'>+	 * 2) struct btrfs_fs_info::reclaim_bgs</div><div class='add'>+	 * 3) struct btrfs_transaction::deleted_bgs</div><div class='add'>+	 * 4) struct btrfs_trans_handle::new_bgs</div><div class='add'>+	 */</div><div class='ctx'> 	struct list_head bg_list;</div><div class='ctx'> </div><div class='ctx'> 	/* For read-only block groups */</div><div class='hunk'>@@ -179,14 +246,10 @@ struct btrfs_block_group {</div><div class='ctx'> 	/* Lock for free space tree operations. */</div><div class='ctx'> 	struct mutex free_space_lock;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Does the block group need to be added to the free space tree?</div><div class='del'>-	 * Protected by free_space_lock.</div><div class='del'>-	 */</div><div class='del'>-	int needs_free_space;</div><div class='del'>-</div><div class='del'>-	/* Flag indicating this block group is placed on a sequential zone */</div><div class='del'>-	bool seq_zone;</div><div class='add'>+	/* Protected by @free_space_lock. */</div><div class='add'>+	bool using_free_space_bitmaps;</div><div class='add'>+	/* Protected by @free_space_lock. */</div><div class='add'>+	bool using_free_space_bitmaps_cached;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Number of extents in this block group used for swap files.</div><div class='hunk'>@@ -194,9 +257,6 @@ struct btrfs_block_group {</div><div class='ctx'> 	 */</div><div class='ctx'> 	int swap_extents;</div><div class='ctx'> </div><div class='del'>-	/* Record locked full stripes for RAID5/6 block group */</div><div class='del'>-	struct btrfs_full_stripe_locks_tree full_stripe_locks_root;</div><div class='del'>-</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Allocation offset for the block group to implement sequential</div><div class='ctx'> 	 * allocation. This is used only on a zoned filesystem.</div><div class='hunk'>@@ -205,17 +265,27 @@ struct btrfs_block_group {</div><div class='ctx'> 	u64 zone_unusable;</div><div class='ctx'> 	u64 zone_capacity;</div><div class='ctx'> 	u64 meta_write_pointer;</div><div class='del'>-	struct map_lookup *physical_map;</div><div class='add'>+	struct btrfs_chunk_map *physical_map;</div><div class='ctx'> 	struct list_head active_bg_list;</div><div class='add'>+	struct work_struct zone_finish_work;</div><div class='add'>+	struct extent_buffer *last_eb;</div><div class='add'>+	enum btrfs_block_group_size_class size_class;</div><div class='add'>+	u64 reclaim_mark;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static inline u64 btrfs_block_group_end(struct btrfs_block_group *block_group)</div><div class='add'>+static inline u64 btrfs_block_group_end(const struct btrfs_block_group *block_group)</div><div class='ctx'> {</div><div class='ctx'> 	return (block_group-&gt;start + block_group-&gt;length);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline bool btrfs_is_block_group_data_only(</div><div class='del'>-					struct btrfs_block_group *block_group)</div><div class='add'>+static inline bool btrfs_is_block_group_used(const struct btrfs_block_group *bg)</div><div class='add'>+{</div><div class='add'>+	lockdep_assert_held(&amp;bg-&gt;lock);</div><div class='add'>+</div><div class='add'>+	return (bg-&gt;used &gt; 0 || bg-&gt;reserved &gt; 0 || bg-&gt;pinned &gt; 0);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool btrfs_is_block_group_data_only(const struct btrfs_block_group *block_group)</div><div class='ctx'> {</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * In mixed mode the fragmentation is expected to be high, lowering the</div><div class='hunk'>@@ -226,16 +296,7 @@ static inline bool btrfs_is_block_group_data_only(</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_BTRFS_DEBUG</div><div class='del'>-static inline int btrfs_should_fragment_free_space(</div><div class='del'>-		struct btrfs_block_group *block_group)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = block_group-&gt;fs_info;</div><div class='del'>-</div><div class='del'>-	return (btrfs_test_opt(fs_info, FRAGMENT_METADATA) &amp;&amp;</div><div class='del'>-		block_group-&gt;flags &amp; BTRFS_BLOCK_GROUP_METADATA) ||</div><div class='del'>-	       (btrfs_test_opt(fs_info, FRAGMENT_DATA) &amp;&amp;</div><div class='del'>-		block_group-&gt;flags &amp;  BTRFS_BLOCK_GROUP_DATA);</div><div class='del'>-}</div><div class='add'>+int btrfs_should_fragment_free_space(const struct btrfs_block_group *block_group);</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> struct btrfs_block_group *btrfs_lookup_first_block_group(</div><div class='hunk'>@@ -249,24 +310,22 @@ void btrfs_put_block_group(struct btrfs_block_group *cache);</div><div class='ctx'> void btrfs_dec_block_group_reservations(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 					const u64 start);</div><div class='ctx'> void btrfs_wait_block_group_reservations(struct btrfs_block_group *bg);</div><div class='del'>-bool btrfs_inc_nocow_writers(struct btrfs_fs_info *fs_info, u64 bytenr);</div><div class='del'>-void btrfs_dec_nocow_writers(struct btrfs_fs_info *fs_info, u64 bytenr);</div><div class='add'>+struct btrfs_block_group *btrfs_inc_nocow_writers(struct btrfs_fs_info *fs_info,</div><div class='add'>+						  u64 bytenr);</div><div class='add'>+void btrfs_dec_nocow_writers(struct btrfs_block_group *bg);</div><div class='ctx'> void btrfs_wait_nocow_writers(struct btrfs_block_group *bg);</div><div class='ctx'> void btrfs_wait_block_group_cache_progress(struct btrfs_block_group *cache,</div><div class='ctx'> 				           u64 num_bytes);</div><div class='del'>-int btrfs_wait_block_group_cache_done(struct btrfs_block_group *cache);</div><div class='del'>-int btrfs_cache_block_group(struct btrfs_block_group *cache,</div><div class='del'>-			    int load_cache_only);</div><div class='del'>-void btrfs_put_caching_control(struct btrfs_caching_control *ctl);</div><div class='add'>+int btrfs_cache_block_group(struct btrfs_block_group *cache, bool wait);</div><div class='ctx'> struct btrfs_caching_control *btrfs_get_caching_control(</div><div class='ctx'> 		struct btrfs_block_group *cache);</div><div class='del'>-u64 add_new_free_space(struct btrfs_block_group *block_group,</div><div class='del'>-		       u64 start, u64 end);</div><div class='add'>+int btrfs_add_new_free_space(struct btrfs_block_group *block_group,</div><div class='add'>+			     u64 start, u64 end, u64 *total_added_ret);</div><div class='ctx'> struct btrfs_trans_handle *btrfs_start_trans_remove_block_group(</div><div class='ctx'> 				struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				const u64 chunk_offset);</div><div class='ctx'> int btrfs_remove_block_group(struct btrfs_trans_handle *trans,</div><div class='del'>-			     u64 group_start, struct extent_map *em);</div><div class='add'>+			     struct btrfs_chunk_map *map);</div><div class='ctx'> void btrfs_delete_unused_bgs(struct btrfs_fs_info *fs_info);</div><div class='ctx'> void btrfs_mark_bg_unused(struct btrfs_block_group *bg);</div><div class='ctx'> void btrfs_reclaim_bgs_work(struct work_struct *work);</div><div class='hunk'>@@ -274,8 +333,8 @@ void btrfs_reclaim_bgs(struct btrfs_fs_info *fs_info);</div><div class='ctx'> void btrfs_mark_bg_to_reclaim(struct btrfs_block_group *bg);</div><div class='ctx'> int btrfs_read_block_groups(struct btrfs_fs_info *info);</div><div class='ctx'> struct btrfs_block_group *btrfs_make_block_group(struct btrfs_trans_handle *trans,</div><div class='del'>-						 u64 bytes_used, u64 type,</div><div class='del'>-						 u64 chunk_offset, u64 size);</div><div class='add'>+						 struct btrfs_space_info *space_info,</div><div class='add'>+						 u64 type, u64 chunk_offset, u64 size);</div><div class='ctx'> void btrfs_create_pending_block_groups(struct btrfs_trans_handle *trans);</div><div class='ctx'> int btrfs_inc_block_group_ro(struct btrfs_block_group *cache,</div><div class='ctx'> 			     bool do_chunk_alloc);</div><div class='hunk'>@@ -286,10 +345,12 @@ int btrfs_setup_space_cache(struct btrfs_trans_handle *trans);</div><div class='ctx'> int btrfs_update_block_group(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			     u64 bytenr, u64 num_bytes, bool alloc);</div><div class='ctx'> int btrfs_add_reserved_bytes(struct btrfs_block_group *cache,</div><div class='del'>-			     u64 ram_bytes, u64 num_bytes, int delalloc);</div><div class='del'>-void btrfs_free_reserved_bytes(struct btrfs_block_group *cache,</div><div class='del'>-			       u64 num_bytes, int delalloc);</div><div class='del'>-int btrfs_chunk_alloc(struct btrfs_trans_handle *trans, u64 flags,</div><div class='add'>+			     u64 ram_bytes, u64 num_bytes, bool delalloc,</div><div class='add'>+			     bool force_wrong_size_class);</div><div class='add'>+void btrfs_free_reserved_bytes(struct btrfs_block_group *cache, u64 num_bytes,</div><div class='add'>+			       bool is_delalloc);</div><div class='add'>+int btrfs_chunk_alloc(struct btrfs_trans_handle *trans,</div><div class='add'>+		      struct btrfs_space_info *space_info, u64 flags,</div><div class='ctx'> 		      enum btrfs_chunk_alloc_enum force);</div><div class='ctx'> int btrfs_force_chunk_alloc(struct btrfs_trans_handle *trans, u64 type);</div><div class='ctx'> void check_system_chunk(struct btrfs_trans_handle *trans, const u64 type);</div><div class='hunk'>@@ -298,11 +359,8 @@ void btrfs_reserve_chunk_metadata(struct btrfs_trans_handle *trans,</div><div class='ctx'> u64 btrfs_get_alloc_profile(struct btrfs_fs_info *fs_info, u64 orig_flags);</div><div class='ctx'> void btrfs_put_block_group_cache(struct btrfs_fs_info *info);</div><div class='ctx'> int btrfs_free_block_groups(struct btrfs_fs_info *info);</div><div class='del'>-void btrfs_wait_space_cache_v1_finished(struct btrfs_block_group *cache,</div><div class='del'>-				struct btrfs_caching_control *caching_ctl);</div><div class='ctx'> int btrfs_rmap_block(struct btrfs_fs_info *fs_info, u64 chunk_start,</div><div class='del'>-		       struct block_device *bdev, u64 physical, u64 **logical,</div><div class='del'>-		       int *naddrs, int *stripe_len);</div><div class='add'>+		     u64 physical, u64 **logical, int *naddrs, int *stripe_len);</div><div class='ctx'> </div><div class='ctx'> static inline u64 btrfs_data_alloc_profile(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='hunk'>@@ -319,7 +377,7 @@ static inline u64 btrfs_system_alloc_profile(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	return btrfs_get_alloc_profile(fs_info, BTRFS_BLOCK_GROUP_SYSTEM);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int btrfs_block_group_done(struct btrfs_block_group *cache)</div><div class='add'>+static inline int btrfs_block_group_done(const struct btrfs_block_group *cache)</div><div class='ctx'> {</div><div class='ctx'> 	smp_mb();</div><div class='ctx'> 	return cache-&gt;cached == BTRFS_CACHE_FINISHED ||</div><div class='hunk'>@@ -332,4 +390,10 @@ void btrfs_unfreeze_block_group(struct btrfs_block_group *cache);</div><div class='ctx'> bool btrfs_inc_block_group_swap_extents(struct btrfs_block_group *bg);</div><div class='ctx'> void btrfs_dec_block_group_swap_extents(struct btrfs_block_group *bg, int amount);</div><div class='ctx'> </div><div class='add'>+enum btrfs_block_group_size_class btrfs_calc_block_group_size_class(u64 size);</div><div class='add'>+int btrfs_use_block_group_size_class(struct btrfs_block_group *bg,</div><div class='add'>+				     enum btrfs_block_group_size_class size_class,</div><div class='add'>+				     bool force_wrong_size_class);</div><div class='add'>+bool btrfs_block_group_should_use_size_class(const struct btrfs_block_group *bg);</div><div class='add'>+</div><div class='ctx'> #endif /* BTRFS_BLOCK_GROUP_H */</div><div class='head'>diff --git a/fs/btrfs/block-rsv.c b/fs/btrfs/block-rsv.c<br/>index 04a6226e0388..96cf7a162987 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/block-rsv.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/block-rsv.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/block-rsv.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/block-rsv.c</a></div><div class='hunk'>@@ -6,6 +6,8 @@</div><div class='ctx'> #include "space-info.h"</div><div class='ctx'> #include "transaction.h"</div><div class='ctx'> #include "block-group.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * HOW DO BLOCK RESERVES WORK</div><div class='hunk'>@@ -117,11 +119,12 @@ static u64 block_rsv_release_bytes(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	if (block_rsv-&gt;reserved &gt;= block_rsv-&gt;size) {</div><div class='ctx'> 		num_bytes = block_rsv-&gt;reserved - block_rsv-&gt;size;</div><div class='ctx'> 		block_rsv-&gt;reserved = block_rsv-&gt;size;</div><div class='del'>-		block_rsv-&gt;full = 1;</div><div class='add'>+		block_rsv-&gt;full = true;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		num_bytes = 0;</div><div class='ctx'> 	}</div><div class='del'>-	if (block_rsv-&gt;qgroup_rsv_reserved &gt;= block_rsv-&gt;qgroup_rsv_size) {</div><div class='add'>+	if (qgroup_to_release_ret &amp;&amp;</div><div class='add'>+	    block_rsv-&gt;qgroup_rsv_reserved &gt;= block_rsv-&gt;qgroup_rsv_size) {</div><div class='ctx'> 		qgroup_to_release = block_rsv-&gt;qgroup_rsv_reserved -</div><div class='ctx'> 				    block_rsv-&gt;qgroup_rsv_size;</div><div class='ctx'> 		block_rsv-&gt;qgroup_rsv_reserved = block_rsv-&gt;qgroup_rsv_size;</div><div class='hunk'>@@ -141,15 +144,13 @@ static u64 block_rsv_release_bytes(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				bytes_to_add = min(num_bytes, bytes_to_add);</div><div class='ctx'> 				dest-&gt;reserved += bytes_to_add;</div><div class='ctx'> 				if (dest-&gt;reserved &gt;= dest-&gt;size)</div><div class='del'>-					dest-&gt;full = 1;</div><div class='add'>+					dest-&gt;full = true;</div><div class='ctx'> 				num_bytes -= bytes_to_add;</div><div class='ctx'> 			}</div><div class='ctx'> 			spin_unlock(&amp;dest-&gt;lock);</div><div class='ctx'> 		}</div><div class='ctx'> 		if (num_bytes)</div><div class='del'>-			btrfs_space_info_free_bytes_may_use(fs_info,</div><div class='del'>-							    space_info,</div><div class='del'>-							    num_bytes);</div><div class='add'>+			btrfs_space_info_free_bytes_may_use(space_info, num_bytes);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (qgroup_to_release_ret)</div><div class='ctx'> 		*qgroup_to_release_ret = qgroup_to_release;</div><div class='hunk'>@@ -170,7 +171,7 @@ int btrfs_block_rsv_migrate(struct btrfs_block_rsv *src,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_init_block_rsv(struct btrfs_block_rsv *rsv, unsigned short type)</div><div class='add'>+void btrfs_init_block_rsv(struct btrfs_block_rsv *rsv, enum btrfs_rsv_type type)</div><div class='ctx'> {</div><div class='ctx'> 	memset(rsv, 0, sizeof(*rsv));</div><div class='ctx'> 	spin_lock_init(&amp;rsv-&gt;lock);</div><div class='hunk'>@@ -179,7 +180,7 @@ void btrfs_init_block_rsv(struct btrfs_block_rsv *rsv, unsigned short type)</div><div class='ctx'> </div><div class='ctx'> void btrfs_init_metadata_block_rsv(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				   struct btrfs_block_rsv *rsv,</div><div class='del'>-				   unsigned short type)</div><div class='add'>+				   enum btrfs_rsv_type type)</div><div class='ctx'> {</div><div class='ctx'> 	btrfs_init_block_rsv(rsv, type);</div><div class='ctx'> 	rsv-&gt;space_info = btrfs_find_space_info(fs_info,</div><div class='hunk'>@@ -187,7 +188,7 @@ void btrfs_init_metadata_block_rsv(struct btrfs_fs_info *fs_info,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct btrfs_block_rsv *btrfs_alloc_block_rsv(struct btrfs_fs_info *fs_info,</div><div class='del'>-					      unsigned short type)</div><div class='add'>+					      enum btrfs_rsv_type type)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_block_rsv *block_rsv;</div><div class='ctx'> </div><div class='hunk'>@@ -208,7 +209,7 @@ void btrfs_free_block_rsv(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	kfree(rsv);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_block_rsv_add(struct btrfs_root *root,</div><div class='add'>+int btrfs_block_rsv_add(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			struct btrfs_block_rsv *block_rsv, u64 num_bytes,</div><div class='ctx'> 			enum btrfs_reserve_flush_enum flush)</div><div class='ctx'> {</div><div class='hunk'>@@ -217,23 +218,20 @@ int btrfs_block_rsv_add(struct btrfs_root *root,</div><div class='ctx'> 	if (num_bytes == 0)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_reserve_metadata_bytes(root, block_rsv, num_bytes, flush);</div><div class='add'>+	ret = btrfs_reserve_metadata_bytes(block_rsv-&gt;space_info, num_bytes, flush);</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		btrfs_block_rsv_add_bytes(block_rsv, num_bytes, true);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_block_rsv_check(struct btrfs_block_rsv *block_rsv, int min_factor)</div><div class='add'>+int btrfs_block_rsv_check(struct btrfs_block_rsv *block_rsv, int min_percent)</div><div class='ctx'> {</div><div class='ctx'> 	u64 num_bytes = 0;</div><div class='ctx'> 	int ret = -ENOSPC;</div><div class='ctx'> </div><div class='del'>-	if (!block_rsv)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='ctx'> 	spin_lock(&amp;block_rsv-&gt;lock);</div><div class='del'>-	num_bytes = div_factor(block_rsv-&gt;size, min_factor);</div><div class='add'>+	num_bytes = mult_perc(block_rsv-&gt;size, min_percent);</div><div class='ctx'> 	if (block_rsv-&gt;reserved &gt;= num_bytes)</div><div class='ctx'> 		ret = 0;</div><div class='ctx'> 	spin_unlock(&amp;block_rsv-&gt;lock);</div><div class='hunk'>@@ -241,18 +239,16 @@ int btrfs_block_rsv_check(struct btrfs_block_rsv *block_rsv, int min_factor)</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_block_rsv_refill(struct btrfs_root *root,</div><div class='del'>-			   struct btrfs_block_rsv *block_rsv, u64 min_reserved,</div><div class='add'>+int btrfs_block_rsv_refill(struct btrfs_fs_info *fs_info,</div><div class='add'>+			   struct btrfs_block_rsv *block_rsv, u64 num_bytes,</div><div class='ctx'> 			   enum btrfs_reserve_flush_enum flush)</div><div class='ctx'> {</div><div class='del'>-	u64 num_bytes = 0;</div><div class='ctx'> 	int ret = -ENOSPC;</div><div class='ctx'> </div><div class='ctx'> 	if (!block_rsv)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;block_rsv-&gt;lock);</div><div class='del'>-	num_bytes = min_reserved;</div><div class='ctx'> 	if (block_rsv-&gt;reserved &gt;= num_bytes)</div><div class='ctx'> 		ret = 0;</div><div class='ctx'> 	else</div><div class='hunk'>@@ -262,7 +258,7 @@ int btrfs_block_rsv_refill(struct btrfs_root *root,</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_reserve_metadata_bytes(root, block_rsv, num_bytes, flush);</div><div class='add'>+	ret = btrfs_reserve_metadata_bytes(block_rsv-&gt;space_info, num_bytes, flush);</div><div class='ctx'> 	if (!ret) {</div><div class='ctx'> 		btrfs_block_rsv_add_bytes(block_rsv, num_bytes, false);</div><div class='ctx'> 		return 0;</div><div class='hunk'>@@ -280,12 +276,12 @@ u64 btrfs_block_rsv_release(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	struct btrfs_block_rsv *target = NULL;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * If we are the delayed_rsv then push to the global rsv, otherwise dump</div><div class='del'>-	 * into the delayed rsv if it is not full.</div><div class='add'>+	 * If we are a delayed block reserve then push to the global rsv,</div><div class='add'>+	 * otherwise dump into the global delayed reserve if it is not full.</div><div class='ctx'> 	 */</div><div class='del'>-	if (block_rsv == delayed_rsv)</div><div class='add'>+	if (block_rsv-&gt;type == BTRFS_BLOCK_RSV_DELOPS)</div><div class='ctx'> 		target = global_rsv;</div><div class='del'>-	else if (block_rsv != global_rsv &amp;&amp; !delayed_rsv-&gt;full)</div><div class='add'>+	else if (block_rsv != global_rsv &amp;&amp; !btrfs_block_rsv_full(delayed_rsv))</div><div class='ctx'> 		target = delayed_rsv;</div><div class='ctx'> </div><div class='ctx'> 	if (target &amp;&amp; block_rsv-&gt;space_info != target-&gt;space_info)</div><div class='hunk'>@@ -303,7 +299,7 @@ int btrfs_block_rsv_use_bytes(struct btrfs_block_rsv *block_rsv, u64 num_bytes)</div><div class='ctx'> 	if (block_rsv-&gt;reserved &gt;= num_bytes) {</div><div class='ctx'> 		block_rsv-&gt;reserved -= num_bytes;</div><div class='ctx'> 		if (block_rsv-&gt;reserved &lt; block_rsv-&gt;size)</div><div class='del'>-			block_rsv-&gt;full = 0;</div><div class='add'>+			block_rsv-&gt;full = false;</div><div class='ctx'> 		ret = 0;</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;block_rsv-&gt;lock);</div><div class='hunk'>@@ -318,70 +314,63 @@ void btrfs_block_rsv_add_bytes(struct btrfs_block_rsv *block_rsv,</div><div class='ctx'> 	if (update_size)</div><div class='ctx'> 		block_rsv-&gt;size += num_bytes;</div><div class='ctx'> 	else if (block_rsv-&gt;reserved &gt;= block_rsv-&gt;size)</div><div class='del'>-		block_rsv-&gt;full = 1;</div><div class='add'>+		block_rsv-&gt;full = true;</div><div class='ctx'> 	spin_unlock(&amp;block_rsv-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_cond_migrate_bytes(struct btrfs_fs_info *fs_info,</div><div class='del'>-			     struct btrfs_block_rsv *dest, u64 num_bytes,</div><div class='del'>-			     int min_factor)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_block_rsv *global_rsv = &amp;fs_info-&gt;global_block_rsv;</div><div class='del'>-	u64 min_bytes;</div><div class='del'>-</div><div class='del'>-	if (global_rsv-&gt;space_info != dest-&gt;space_info)</div><div class='del'>-		return -ENOSPC;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;global_rsv-&gt;lock);</div><div class='del'>-	min_bytes = div_factor(global_rsv-&gt;size, min_factor);</div><div class='del'>-	if (global_rsv-&gt;reserved &lt; min_bytes + num_bytes) {</div><div class='del'>-		spin_unlock(&amp;global_rsv-&gt;lock);</div><div class='del'>-		return -ENOSPC;</div><div class='del'>-	}</div><div class='del'>-	global_rsv-&gt;reserved -= num_bytes;</div><div class='del'>-	if (global_rsv-&gt;reserved &lt; global_rsv-&gt;size)</div><div class='del'>-		global_rsv-&gt;full = 0;</div><div class='del'>-	spin_unlock(&amp;global_rsv-&gt;lock);</div><div class='del'>-</div><div class='del'>-	btrfs_block_rsv_add_bytes(dest, num_bytes, true);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> void btrfs_update_global_block_rsv(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_block_rsv *block_rsv = &amp;fs_info-&gt;global_block_rsv;</div><div class='ctx'> 	struct btrfs_space_info *sinfo = block_rsv-&gt;space_info;</div><div class='del'>-	u64 num_bytes;</div><div class='del'>-	unsigned min_items;</div><div class='add'>+	struct btrfs_root *root, *tmp;</div><div class='add'>+	u64 num_bytes = btrfs_root_used(&amp;fs_info-&gt;tree_root-&gt;root_item);</div><div class='add'>+	unsigned int min_items = 1;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The global block rsv is based on the size of the extent tree, the</div><div class='ctx'> 	 * checksum tree and the root tree.  If the fs is empty we want to set</div><div class='ctx'> 	 * it to a minimal amount for safety.</div><div class='add'>+	 *</div><div class='add'>+	 * We also are going to need to modify the minimum of the tree root and</div><div class='add'>+	 * any global roots we could touch.</div><div class='ctx'> 	 */</div><div class='del'>-	num_bytes = btrfs_root_used(&amp;fs_info-&gt;extent_root-&gt;root_item) +</div><div class='del'>-		btrfs_root_used(&amp;fs_info-&gt;csum_root-&gt;root_item) +</div><div class='del'>-		btrfs_root_used(&amp;fs_info-&gt;tree_root-&gt;root_item);</div><div class='add'>+	read_lock(&amp;fs_info-&gt;global_root_lock);</div><div class='add'>+	rbtree_postorder_for_each_entry_safe(root, tmp, &amp;fs_info-&gt;global_root_tree,</div><div class='add'>+					     rb_node) {</div><div class='add'>+		if (btrfs_root_id(root) == BTRFS_EXTENT_TREE_OBJECTID ||</div><div class='add'>+		    btrfs_root_id(root) == BTRFS_CSUM_TREE_OBJECTID ||</div><div class='add'>+		    btrfs_root_id(root) == BTRFS_FREE_SPACE_TREE_OBJECTID) {</div><div class='add'>+			num_bytes += btrfs_root_used(&amp;root-&gt;root_item);</div><div class='add'>+			min_items++;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	read_unlock(&amp;fs_info-&gt;global_root_lock);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * We at a minimum are going to modify the csum root, the tree root, and</div><div class='del'>-	 * the extent root.</div><div class='del'>-	 */</div><div class='del'>-	min_items = 3;</div><div class='add'>+	if (btrfs_fs_compat_ro(fs_info, BLOCK_GROUP_TREE)) {</div><div class='add'>+		num_bytes += btrfs_root_used(&amp;fs_info-&gt;block_group_root-&gt;root_item);</div><div class='add'>+		min_items++;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (btrfs_fs_incompat(fs_info, RAID_STRIPE_TREE)) {</div><div class='add'>+		num_bytes += btrfs_root_used(&amp;fs_info-&gt;stripe_root-&gt;root_item);</div><div class='add'>+		min_items++;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * But we also want to reserve enough space so we can do the fallback</div><div class='del'>-	 * global reserve for an unlink, which is an additional 5 items (see the</div><div class='del'>-	 * comment in __unlink_start_trans for what we're modifying.)</div><div class='add'>+	 * global reserve for an unlink, which is an additional</div><div class='add'>+	 * BTRFS_UNLINK_METADATA_UNITS items.</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * But we also need space for the delayed ref updates from the unlink,</div><div class='del'>-	 * so its 10, 5 for the actual operation, and 5 for the delayed ref</div><div class='del'>-	 * updates.</div><div class='add'>+	 * so add BTRFS_UNLINK_METADATA_UNITS units for delayed refs, one for</div><div class='add'>+	 * each unlink metadata item.</div><div class='ctx'> 	 */</div><div class='del'>-	min_items += 10;</div><div class='add'>+	min_items += BTRFS_UNLINK_METADATA_UNITS;</div><div class='ctx'> </div><div class='ctx'> 	num_bytes = max_t(u64, num_bytes,</div><div class='del'>-			  btrfs_calc_insert_metadata_size(fs_info, min_items));</div><div class='add'>+			  btrfs_calc_insert_metadata_size(fs_info, min_items) +</div><div class='add'>+			  btrfs_calc_delayed_ref_bytes(fs_info,</div><div class='add'>+					       BTRFS_UNLINK_METADATA_UNITS));</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;sinfo-&gt;lock);</div><div class='ctx'> 	spin_lock(&amp;block_rsv-&gt;lock);</div><div class='hunk'>@@ -390,21 +379,16 @@ void btrfs_update_global_block_rsv(struct btrfs_fs_info *fs_info)</div><div class='ctx'> </div><div class='ctx'> 	if (block_rsv-&gt;reserved &lt; block_rsv-&gt;size) {</div><div class='ctx'> 		num_bytes = block_rsv-&gt;size - block_rsv-&gt;reserved;</div><div class='del'>-		btrfs_space_info_update_bytes_may_use(fs_info, sinfo,</div><div class='del'>-						      num_bytes);</div><div class='add'>+		btrfs_space_info_update_bytes_may_use(sinfo, num_bytes);</div><div class='ctx'> 		block_rsv-&gt;reserved = block_rsv-&gt;size;</div><div class='ctx'> 	} else if (block_rsv-&gt;reserved &gt; block_rsv-&gt;size) {</div><div class='ctx'> 		num_bytes = block_rsv-&gt;reserved - block_rsv-&gt;size;</div><div class='del'>-		btrfs_space_info_update_bytes_may_use(fs_info, sinfo,</div><div class='del'>-						      -num_bytes);</div><div class='add'>+		btrfs_space_info_update_bytes_may_use(sinfo, -num_bytes);</div><div class='ctx'> 		block_rsv-&gt;reserved = block_rsv-&gt;size;</div><div class='del'>-		btrfs_try_granting_tickets(fs_info, sinfo);</div><div class='add'>+		btrfs_try_granting_tickets(sinfo);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (block_rsv-&gt;reserved == block_rsv-&gt;size)</div><div class='del'>-		block_rsv-&gt;full = 1;</div><div class='del'>-	else</div><div class='del'>-		block_rsv-&gt;full = 0;</div><div class='add'>+	block_rsv-&gt;full = (block_rsv-&gt;reserved == block_rsv-&gt;size);</div><div class='ctx'> </div><div class='ctx'> 	if (block_rsv-&gt;size &gt;= sinfo-&gt;total_bytes)</div><div class='ctx'> 		sinfo-&gt;force_alloc = CHUNK_ALLOC_FORCE;</div><div class='hunk'>@@ -412,6 +396,35 @@ void btrfs_update_global_block_rsv(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	spin_unlock(&amp;sinfo-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void btrfs_init_root_block_rsv(struct btrfs_root *root)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+</div><div class='add'>+	switch (btrfs_root_id(root)) {</div><div class='add'>+	case BTRFS_CSUM_TREE_OBJECTID:</div><div class='add'>+	case BTRFS_EXTENT_TREE_OBJECTID:</div><div class='add'>+	case BTRFS_FREE_SPACE_TREE_OBJECTID:</div><div class='add'>+	case BTRFS_BLOCK_GROUP_TREE_OBJECTID:</div><div class='add'>+	case BTRFS_RAID_STRIPE_TREE_OBJECTID:</div><div class='add'>+		root-&gt;block_rsv = &amp;fs_info-&gt;delayed_refs_rsv;</div><div class='add'>+		break;</div><div class='add'>+	case BTRFS_ROOT_TREE_OBJECTID:</div><div class='add'>+	case BTRFS_DEV_TREE_OBJECTID:</div><div class='add'>+	case BTRFS_QUOTA_TREE_OBJECTID:</div><div class='add'>+		root-&gt;block_rsv = &amp;fs_info-&gt;global_block_rsv;</div><div class='add'>+		break;</div><div class='add'>+	case BTRFS_CHUNK_TREE_OBJECTID:</div><div class='add'>+		root-&gt;block_rsv = &amp;fs_info-&gt;chunk_block_rsv;</div><div class='add'>+		break;</div><div class='add'>+	case BTRFS_TREE_LOG_OBJECTID:</div><div class='add'>+		root-&gt;block_rsv = &amp;fs_info-&gt;treelog_rsv;</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		root-&gt;block_rsv = NULL;</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> void btrfs_init_global_block_rsv(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_space_info *space_info;</div><div class='hunk'>@@ -426,21 +439,13 @@ void btrfs_init_global_block_rsv(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	fs_info-&gt;delayed_block_rsv.space_info = space_info;</div><div class='ctx'> 	fs_info-&gt;delayed_refs_rsv.space_info = space_info;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Our various recovery options can leave us with NULL roots, so check</div><div class='del'>-	 * here and just bail before we go dereferencing NULLs everywhere.</div><div class='del'>-	 */</div><div class='del'>-	if (!fs_info-&gt;extent_root || !fs_info-&gt;csum_root ||</div><div class='del'>-	    !fs_info-&gt;dev_root || !fs_info-&gt;chunk_root || !fs_info-&gt;tree_root)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	fs_info-&gt;extent_root-&gt;block_rsv = &amp;fs_info-&gt;delayed_refs_rsv;</div><div class='del'>-	fs_info-&gt;csum_root-&gt;block_rsv = &amp;fs_info-&gt;delayed_refs_rsv;</div><div class='del'>-	fs_info-&gt;dev_root-&gt;block_rsv = &amp;fs_info-&gt;global_block_rsv;</div><div class='del'>-	fs_info-&gt;tree_root-&gt;block_rsv = &amp;fs_info-&gt;global_block_rsv;</div><div class='del'>-	if (fs_info-&gt;quota_root)</div><div class='del'>-		fs_info-&gt;quota_root-&gt;block_rsv = &amp;fs_info-&gt;global_block_rsv;</div><div class='del'>-	fs_info-&gt;chunk_root-&gt;block_rsv = &amp;fs_info-&gt;chunk_block_rsv;</div><div class='add'>+	/* The treelog_rsv uses a dedicated space_info on the zoned mode. */</div><div class='add'>+	if (!btrfs_is_zoned(fs_info)) {</div><div class='add'>+		fs_info-&gt;treelog_rsv.space_info = space_info;</div><div class='add'>+	} else {</div><div class='add'>+		ASSERT(space_info-&gt;sub_group[0]-&gt;subgroup_id == BTRFS_SUB_GROUP_TREELOG);</div><div class='add'>+		fs_info-&gt;treelog_rsv.space_info = space_info-&gt;sub_group[0];</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	btrfs_update_global_block_rsv(fs_info);</div><div class='ctx'> }</div><div class='hunk'>@@ -467,8 +472,8 @@ static struct btrfs_block_rsv *get_block_rsv(</div><div class='ctx'> 	struct btrfs_block_rsv *block_rsv = NULL;</div><div class='ctx'> </div><div class='ctx'> 	if (test_bit(BTRFS_ROOT_SHAREABLE, &amp;root-&gt;state) ||</div><div class='del'>-	    (root == fs_info-&gt;csum_root &amp;&amp; trans-&gt;adding_csums) ||</div><div class='del'>-	    (root == fs_info-&gt;uuid_root))</div><div class='add'>+	    (root == fs_info-&gt;uuid_root) ||</div><div class='add'>+	    (trans-&gt;adding_csums &amp;&amp; btrfs_root_id(root) == BTRFS_CSUM_TREE_OBJECTID))</div><div class='ctx'> 		block_rsv = trans-&gt;block_rsv;</div><div class='ctx'> </div><div class='ctx'> 	if (!block_rsv)</div><div class='hunk'>@@ -492,7 +497,7 @@ struct btrfs_block_rsv *btrfs_use_block_rsv(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	block_rsv = get_block_rsv(trans, root);</div><div class='ctx'> </div><div class='del'>-	if (unlikely(block_rsv-&gt;size == 0))</div><div class='add'>+	if (unlikely(btrfs_block_rsv_size(block_rsv) == 0))</div><div class='ctx'> 		goto try_reserve;</div><div class='ctx'> again:</div><div class='ctx'> 	ret = btrfs_block_rsv_use_bytes(block_rsv, blocksize);</div><div class='hunk'>@@ -523,7 +528,7 @@ again:</div><div class='ctx'> 				block_rsv-&gt;type, ret);</div><div class='ctx'> 	}</div><div class='ctx'> try_reserve:</div><div class='del'>-	ret = btrfs_reserve_metadata_bytes(root, block_rsv, blocksize,</div><div class='add'>+	ret = btrfs_reserve_metadata_bytes(block_rsv-&gt;space_info, blocksize,</div><div class='ctx'> 					   BTRFS_RESERVE_NO_FLUSH);</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		return block_rsv;</div><div class='hunk'>@@ -538,5 +543,36 @@ try_reserve:</div><div class='ctx'> 		if (!ret)</div><div class='ctx'> 			return global_rsv;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * All hope is lost, but of course our reservations are overly</div><div class='add'>+	 * pessimistic, so instead of possibly having an ENOSPC abort here, try</div><div class='add'>+	 * one last time to force a reservation if there's enough actual space</div><div class='add'>+	 * on disk to make the reservation.</div><div class='add'>+	 */</div><div class='add'>+	ret = btrfs_reserve_metadata_bytes(block_rsv-&gt;space_info, blocksize,</div><div class='add'>+					   BTRFS_RESERVE_FLUSH_EMERGENCY);</div><div class='add'>+	if (!ret)</div><div class='add'>+		return block_rsv;</div><div class='add'>+</div><div class='ctx'> 	return ERR_PTR(ret);</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+int btrfs_check_trunc_cache_free_space(const struct btrfs_fs_info *fs_info,</div><div class='add'>+				       struct btrfs_block_rsv *rsv)</div><div class='add'>+{</div><div class='add'>+	u64 needed_bytes;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	/* 1 for slack space, 1 for updating the inode */</div><div class='add'>+	needed_bytes = btrfs_calc_insert_metadata_size(fs_info, 1) +</div><div class='add'>+		btrfs_calc_metadata_size(fs_info, 1);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;rsv-&gt;lock);</div><div class='add'>+	if (rsv-&gt;reserved &lt; needed_bytes)</div><div class='add'>+		ret = -ENOSPC;</div><div class='add'>+	else</div><div class='add'>+		ret = 0;</div><div class='add'>+	spin_unlock(&amp;rsv-&gt;lock);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/btrfs/block-rsv.h b/fs/btrfs/block-rsv.h<br/>index 0b6ae5302837..79ae9d05cd91 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/block-rsv.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/block-rsv.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/block-rsv.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/block-rsv.h</a></div><div class='hunk'>@@ -3,19 +3,28 @@</div><div class='ctx'> #ifndef BTRFS_BLOCK_RSV_H</div><div class='ctx'> #define BTRFS_BLOCK_RSV_H</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+#include &lt;linux/compiler.h&gt;</div><div class='add'>+#include &lt;linux/spinlock.h&gt;</div><div class='add'>+</div><div class='ctx'> struct btrfs_trans_handle;</div><div class='add'>+struct btrfs_root;</div><div class='add'>+struct btrfs_space_info;</div><div class='add'>+struct btrfs_block_rsv;</div><div class='add'>+struct btrfs_fs_info;</div><div class='ctx'> enum btrfs_reserve_flush_enum;</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Types of block reserves</div><div class='ctx'>  */</div><div class='del'>-enum {</div><div class='add'>+enum btrfs_rsv_type {</div><div class='ctx'> 	BTRFS_BLOCK_RSV_GLOBAL,</div><div class='ctx'> 	BTRFS_BLOCK_RSV_DELALLOC,</div><div class='ctx'> 	BTRFS_BLOCK_RSV_TRANS,</div><div class='ctx'> 	BTRFS_BLOCK_RSV_CHUNK,</div><div class='ctx'> 	BTRFS_BLOCK_RSV_DELOPS,</div><div class='ctx'> 	BTRFS_BLOCK_RSV_DELREFS,</div><div class='add'>+	BTRFS_BLOCK_RSV_TREELOG,</div><div class='ctx'> 	BTRFS_BLOCK_RSV_EMPTY,</div><div class='ctx'> 	BTRFS_BLOCK_RSV_TEMP,</div><div class='ctx'> };</div><div class='hunk'>@@ -25,9 +34,10 @@ struct btrfs_block_rsv {</div><div class='ctx'> 	u64 reserved;</div><div class='ctx'> 	struct btrfs_space_info *space_info;</div><div class='ctx'> 	spinlock_t lock;</div><div class='del'>-	unsigned short full;</div><div class='del'>-	unsigned short type;</div><div class='del'>-	unsigned short failfast;</div><div class='add'>+	bool full;</div><div class='add'>+	bool failfast;</div><div class='add'>+	/* Block reserve type, one of BTRFS_BLOCK_RSV_* */</div><div class='add'>+	enum btrfs_rsv_type type:8;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Qgroup equivalent for @size @reserved</div><div class='hunk'>@@ -49,28 +59,26 @@ struct btrfs_block_rsv {</div><div class='ctx'> 	u64 qgroup_rsv_reserved;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-void btrfs_init_block_rsv(struct btrfs_block_rsv *rsv, unsigned short type);</div><div class='add'>+void btrfs_init_block_rsv(struct btrfs_block_rsv *rsv, enum btrfs_rsv_type type);</div><div class='add'>+void btrfs_init_root_block_rsv(struct btrfs_root *root);</div><div class='ctx'> struct btrfs_block_rsv *btrfs_alloc_block_rsv(struct btrfs_fs_info *fs_info,</div><div class='del'>-					      unsigned short type);</div><div class='add'>+					      enum btrfs_rsv_type type);</div><div class='ctx'> void btrfs_init_metadata_block_rsv(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				   struct btrfs_block_rsv *rsv,</div><div class='del'>-				   unsigned short type);</div><div class='add'>+				   enum btrfs_rsv_type type);</div><div class='ctx'> void btrfs_free_block_rsv(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			  struct btrfs_block_rsv *rsv);</div><div class='del'>-int btrfs_block_rsv_add(struct btrfs_root *root,</div><div class='add'>+int btrfs_block_rsv_add(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			struct btrfs_block_rsv *block_rsv, u64 num_bytes,</div><div class='ctx'> 			enum btrfs_reserve_flush_enum flush);</div><div class='del'>-int btrfs_block_rsv_check(struct btrfs_block_rsv *block_rsv, int min_factor);</div><div class='del'>-int btrfs_block_rsv_refill(struct btrfs_root *root,</div><div class='del'>-			   struct btrfs_block_rsv *block_rsv, u64 min_reserved,</div><div class='add'>+int btrfs_block_rsv_check(struct btrfs_block_rsv *block_rsv, int min_percent);</div><div class='add'>+int btrfs_block_rsv_refill(struct btrfs_fs_info *fs_info,</div><div class='add'>+			   struct btrfs_block_rsv *block_rsv, u64 num_bytes,</div><div class='ctx'> 			   enum btrfs_reserve_flush_enum flush);</div><div class='ctx'> int btrfs_block_rsv_migrate(struct btrfs_block_rsv *src_rsv,</div><div class='ctx'> 			    struct btrfs_block_rsv *dst_rsv, u64 num_bytes,</div><div class='ctx'> 			    bool update_size);</div><div class='ctx'> int btrfs_block_rsv_use_bytes(struct btrfs_block_rsv *block_rsv, u64 num_bytes);</div><div class='del'>-int btrfs_cond_migrate_bytes(struct btrfs_fs_info *fs_info,</div><div class='del'>-			     struct btrfs_block_rsv *dest, u64 num_bytes,</div><div class='del'>-			     int min_factor);</div><div class='ctx'> void btrfs_block_rsv_add_bytes(struct btrfs_block_rsv *block_rsv,</div><div class='ctx'> 			       u64 num_bytes, bool update_size);</div><div class='ctx'> u64 btrfs_block_rsv_release(struct btrfs_fs_info *fs_info,</div><div class='hunk'>@@ -82,6 +90,8 @@ void btrfs_release_global_block_rsv(struct btrfs_fs_info *fs_info);</div><div class='ctx'> struct btrfs_block_rsv *btrfs_use_block_rsv(struct btrfs_trans_handle *trans,</div><div class='ctx'> 					    struct btrfs_root *root,</div><div class='ctx'> 					    u32 blocksize);</div><div class='add'>+int btrfs_check_trunc_cache_free_space(const struct btrfs_fs_info *fs_info,</div><div class='add'>+				       struct btrfs_block_rsv *rsv);</div><div class='ctx'> static inline void btrfs_unuse_block_rsv(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 					 struct btrfs_block_rsv *block_rsv,</div><div class='ctx'> 					 u32 blocksize)</div><div class='hunk'>@@ -90,4 +100,45 @@ static inline void btrfs_unuse_block_rsv(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	btrfs_block_rsv_release(fs_info, block_rsv, 0, NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Fast path to check if the reserve is full, may be carefully used outside of</div><div class='add'>+ * locks.</div><div class='add'>+ */</div><div class='add'>+static inline bool btrfs_block_rsv_full(const struct btrfs_block_rsv *rsv)</div><div class='add'>+{</div><div class='add'>+	return data_race(rsv-&gt;full);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Get the reserved mount of a block reserve in a context where getting a stale</div><div class='add'>+ * value is acceptable, instead of accessing it directly and trigger data race</div><div class='add'>+ * warning from KCSAN.</div><div class='add'>+ */</div><div class='add'>+static inline u64 btrfs_block_rsv_reserved(struct btrfs_block_rsv *rsv)</div><div class='add'>+{</div><div class='add'>+	u64 ret;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;rsv-&gt;lock);</div><div class='add'>+	ret = rsv-&gt;reserved;</div><div class='add'>+	spin_unlock(&amp;rsv-&gt;lock);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Get the size of a block reserve in a context where getting a stale value is</div><div class='add'>+ * acceptable, instead of accessing it directly and trigger data race warning</div><div class='add'>+ * from KCSAN.</div><div class='add'>+ */</div><div class='add'>+static inline u64 btrfs_block_rsv_size(struct btrfs_block_rsv *rsv)</div><div class='add'>+{</div><div class='add'>+	u64 ret;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;rsv-&gt;lock);</div><div class='add'>+	ret = rsv-&gt;size;</div><div class='add'>+	spin_unlock(&amp;rsv-&gt;lock);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> #endif /* BTRFS_BLOCK_RSV_H */</div><div class='head'>diff --git a/fs/btrfs/btrfs_inode.h b/fs/btrfs/btrfs_inode.h<br/>index ab2a4a52e0bb..73602ee8de3f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/btrfs_inode.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/btrfs_inode.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/btrfs_inode.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/btrfs_inode.h</a></div><div class='hunk'>@@ -8,10 +8,37 @@</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/hash.h&gt;</div><div class='ctx'> #include &lt;linux/refcount.h&gt;</div><div class='add'>+#include &lt;linux/spinlock.h&gt;</div><div class='add'>+#include &lt;linux/mutex.h&gt;</div><div class='add'>+#include &lt;linux/rwsem.h&gt;</div><div class='add'>+#include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/mm.h&gt;</div><div class='add'>+#include &lt;linux/compiler.h&gt;</div><div class='add'>+#include &lt;linux/fscrypt.h&gt;</div><div class='add'>+#include &lt;linux/lockdep.h&gt;</div><div class='add'>+#include &lt;uapi/linux/btrfs_tree.h&gt;</div><div class='add'>+#include &lt;trace/events/btrfs.h&gt;</div><div class='add'>+#include "ctree.h"</div><div class='add'>+#include "block-rsv.h"</div><div class='ctx'> #include "extent_map.h"</div><div class='del'>-#include "extent_io.h"</div><div class='del'>-#include "ordered-data.h"</div><div class='del'>-#include "delayed-inode.h"</div><div class='add'>+#include "extent-io-tree.h"</div><div class='add'>+</div><div class='add'>+struct posix_acl;</div><div class='add'>+struct iov_iter;</div><div class='add'>+struct writeback_control;</div><div class='add'>+struct btrfs_root;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+struct btrfs_trans_handle;</div><div class='add'>+struct btrfs_bio;</div><div class='add'>+struct btrfs_file_extent;</div><div class='add'>+struct btrfs_delayed_node;</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Since we search a directory based on f_pos (struct dir_context::pos) we have</div><div class='add'>+ * to start at 2 since '.' and '..' have f_pos of 0 and 1 respectively, so</div><div class='add'>+ * everybody else has to start at 2 (see btrfs_real_readdir() and dir_emit_dots()).</div><div class='add'>+ */</div><div class='add'>+#define BTRFS_DIR_START_INDEX 2</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * ordered_data_close is set by truncate when a file that used</div><div class='hunk'>@@ -32,7 +59,6 @@ enum {</div><div class='ctx'> 	  */</div><div class='ctx'> 	BTRFS_INODE_NEEDS_FULL_SYNC,</div><div class='ctx'> 	BTRFS_INODE_COPY_EVERYTHING,</div><div class='del'>-	BTRFS_INODE_IN_DELALLOC_LIST,</div><div class='ctx'> 	BTRFS_INODE_HAS_PROPS,</div><div class='ctx'> 	BTRFS_INODE_SNAPSHOT_FLUSH,</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -58,6 +84,43 @@ enum {</div><div class='ctx'> 	 * on the same file.</div><div class='ctx'> 	 */</div><div class='ctx'> 	BTRFS_INODE_VERITY_IN_PROGRESS,</div><div class='add'>+	/* Set when this inode is a free space inode. */</div><div class='add'>+	BTRFS_INODE_FREE_SPACE_INODE,</div><div class='add'>+	/* Set when there are no capabilities in XATTs for the inode. */</div><div class='add'>+	BTRFS_INODE_NO_CAP_XATTR,</div><div class='add'>+	/*</div><div class='add'>+	 * Set if an error happened when doing a COW write before submitting a</div><div class='add'>+	 * bio or during writeback. Used for both buffered writes and direct IO</div><div class='add'>+	 * writes. This is to signal a fast fsync that it has to wait for</div><div class='add'>+	 * ordered extents to complete and therefore not log extent maps that</div><div class='add'>+	 * point to unwritten extents (when an ordered extent completes and it</div><div class='add'>+	 * has the BTRFS_ORDERED_IOERR flag set, it drops extent maps in its</div><div class='add'>+	 * range).</div><div class='add'>+	 */</div><div class='add'>+	BTRFS_INODE_COW_WRITE_ERROR,</div><div class='add'>+	/*</div><div class='add'>+	 * Indicate this is a directory that points to a subvolume for which</div><div class='add'>+	 * there is no root reference item. That's a case like the following:</div><div class='add'>+	 *</div><div class='add'>+	 *   $ btrfs subvolume create /mnt/parent</div><div class='add'>+	 *   $ btrfs subvolume create /mnt/parent/child</div><div class='add'>+	 *   $ btrfs subvolume snapshot /mnt/parent /mnt/snap</div><div class='add'>+	 *</div><div class='add'>+	 * If subvolume "parent" is root 256, subvolume "child" is root 257 and</div><div class='add'>+	 * snapshot "snap" is root 258, then there's no root reference item (key</div><div class='add'>+	 * BTRFS_ROOT_REF_KEY in the root tree) for the subvolume "child"</div><div class='add'>+	 * associated to root 258 (the snapshot) - there's only for the root</div><div class='add'>+	 * of the "parent" subvolume (root 256). In the chunk root we have a</div><div class='add'>+	 * (256 BTRFS_ROOT_REF_KEY 257) key but we don't have a</div><div class='add'>+	 * (258 BTRFS_ROOT_REF_KEY 257) key - the sames goes for backrefs, we</div><div class='add'>+	 * have a (257 BTRFS_ROOT_BACKREF_KEY 256) but we don't have a</div><div class='add'>+	 * (257 BTRFS_ROOT_BACKREF_KEY 258) key.</div><div class='add'>+	 *</div><div class='add'>+	 * So when opening the "child" dentry from the snapshot's directory,</div><div class='add'>+	 * we don't find a root ref item and we create a stub inode. This is</div><div class='add'>+	 * done at new_simple_dir(), called from btrfs_lookup_dentry().</div><div class='add'>+	 */</div><div class='add'>+	BTRFS_INODE_ROOT_STUB,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /* in memory btrfs inode */</div><div class='hunk'>@@ -65,16 +128,32 @@ struct btrfs_inode {</div><div class='ctx'> 	/* which subvolume this inode belongs to */</div><div class='ctx'> 	struct btrfs_root *root;</div><div class='ctx'> </div><div class='del'>-	/* key used to find this inode on disk.  This is used by the code</div><div class='del'>-	 * to read in roots of subvolumes</div><div class='add'>+#if BITS_PER_LONG == 32</div><div class='add'>+	/*</div><div class='add'>+	 * The objectid of the corresponding BTRFS_INODE_ITEM_KEY.</div><div class='add'>+	 * On 64 bits platforms we can get it from vfs_inode.i_ino, which is an</div><div class='add'>+	 * unsigned long and therefore 64 bits on such platforms.</div><div class='add'>+	 */</div><div class='add'>+	u64 objectid;</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+	/* Cached value of inode property 'compression'. */</div><div class='add'>+	u8 prop_compress;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Force compression on the file using the defrag ioctl, could be</div><div class='add'>+	 * different from prop_compress and takes precedence if set.</div><div class='ctx'> 	 */</div><div class='del'>-	struct btrfs_key location;</div><div class='add'>+	u8 defrag_compress;</div><div class='add'>+	s8 defrag_compress_level;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Lock for counters and all fields used to determine if the inode is in</div><div class='ctx'> 	 * the log or not (last_trans, last_sub_trans, last_log_commit,</div><div class='del'>-	 * logged_trans), to access/update new_delalloc_bytes and to update the</div><div class='del'>-	 * VFS' inode number of bytes used.</div><div class='add'>+	 * logged_trans), to access/update delalloc_bytes, new_delalloc_bytes,</div><div class='add'>+	 * defrag_bytes, disk_i_size, outstanding_extents, csum_bytes and to</div><div class='add'>+	 * update the VFS' inode number of bytes used.</div><div class='add'>+	 * Also protects setting struct file::private_data.</div><div class='ctx'> 	 */</div><div class='ctx'> 	spinlock_t lock;</div><div class='ctx'> </div><div class='hunk'>@@ -84,22 +163,29 @@ struct btrfs_inode {</div><div class='ctx'> 	/* the io_tree does range state (DIRTY, LOCKED etc) */</div><div class='ctx'> 	struct extent_io_tree io_tree;</div><div class='ctx'> </div><div class='del'>-	/* special utility tree used to record which mirrors have already been</div><div class='del'>-	 * tried when checksums fail for a given block</div><div class='del'>-	 */</div><div class='del'>-	struct extent_io_tree io_failure_tree;</div><div class='del'>-</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Keep track of where the inode has extent items mapped in order to</div><div class='del'>-	 * make sure the i_size adjustments are accurate</div><div class='add'>+	 * make sure the i_size adjustments are accurate. Not required when the</div><div class='add'>+	 * filesystem is NO_HOLES, the status can't be set while mounted as</div><div class='add'>+	 * it's a mkfs-time feature.</div><div class='ctx'> 	 */</div><div class='del'>-	struct extent_io_tree file_extent_tree;</div><div class='add'>+	struct extent_io_tree *file_extent_tree;</div><div class='ctx'> </div><div class='ctx'> 	/* held while logging the inode in tree-log.c */</div><div class='ctx'> 	struct mutex log_mutex;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Counters to keep track of the number of extent item's we may use due</div><div class='add'>+	 * to delalloc and such.  outstanding_extents is the number of extent</div><div class='add'>+	 * items we think we'll end up using, and reserved_extents is the number</div><div class='add'>+	 * of extent items we've reserved metadata for. Protected by 'lock'.</div><div class='add'>+	 */</div><div class='add'>+	unsigned outstanding_extents;</div><div class='add'>+</div><div class='ctx'> 	/* used to order data wrt metadata */</div><div class='del'>-	struct btrfs_ordered_inode_tree ordered_tree;</div><div class='add'>+	spinlock_t ordered_tree_lock;</div><div class='add'>+	struct rb_root ordered_tree;</div><div class='add'>+	struct rb_node *ordered_tree_last;</div><div class='ctx'> </div><div class='ctx'> 	/* list of all the delalloc inodes in the FS.  There are times we need</div><div class='ctx'> 	 * to write all the delalloc pages to disk, and this list is used</div><div class='hunk'>@@ -107,49 +193,49 @@ struct btrfs_inode {</div><div class='ctx'> 	 */</div><div class='ctx'> 	struct list_head delalloc_inodes;</div><div class='ctx'> </div><div class='del'>-	/* node for the red-black tree that links inodes in subvolume root */</div><div class='del'>-	struct rb_node rb_node;</div><div class='del'>-</div><div class='ctx'> 	unsigned long runtime_flags;</div><div class='ctx'> </div><div class='del'>-	/* Keep track of who's O_SYNC/fsyncing currently */</div><div class='del'>-	atomic_t sync_writers;</div><div class='del'>-</div><div class='ctx'> 	/* full 64 bit generation number, struct vfs_inode doesn't have a big</div><div class='ctx'> 	 * enough field for this.</div><div class='ctx'> 	 */</div><div class='ctx'> 	u64 generation;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * transid of the trans_handle that last modified this inode</div><div class='add'>+	 * ID of the transaction handle that last modified this inode.</div><div class='add'>+	 * Protected by 'lock'.</div><div class='ctx'> 	 */</div><div class='ctx'> 	u64 last_trans;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * transid that last logged this inode</div><div class='add'>+	 * ID of the transaction that last logged this inode.</div><div class='add'>+	 * Protected by 'lock'.</div><div class='ctx'> 	 */</div><div class='ctx'> 	u64 logged_trans;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * log transid when this inode was last modified</div><div class='add'>+	 * Log transaction ID when this inode was last modified.</div><div class='add'>+	 * Protected by 'lock'.</div><div class='ctx'> 	 */</div><div class='ctx'> 	int last_sub_trans;</div><div class='ctx'> </div><div class='del'>-	/* a local copy of root's last_log_commit */</div><div class='add'>+	/* A local copy of root's last_log_commit. Protected by 'lock'. */</div><div class='ctx'> 	int last_log_commit;</div><div class='ctx'> </div><div class='ctx'> 	union {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Total number of bytes pending delalloc, used by stat to</div><div class='ctx'> 		 * calculate the real block usage of the file. This is used</div><div class='del'>-		 * only for files.</div><div class='add'>+		 * only for files. Protected by 'lock'.</div><div class='ctx'> 		 */</div><div class='ctx'> 		u64 delalloc_bytes;</div><div class='ctx'> 		/*</div><div class='del'>-		 * The offset of the last dir item key that was logged.</div><div class='add'>+		 * The lowest possible index of the next dir index key which</div><div class='add'>+		 * points to an inode that needs to be logged.</div><div class='ctx'> 		 * This is used only for directories.</div><div class='add'>+		 * Use the helpers btrfs_get_first_dir_index_to_log() and</div><div class='add'>+		 * btrfs_set_first_dir_index_to_log() to access this field.</div><div class='ctx'> 		 */</div><div class='del'>-		u64 last_dir_item_offset;</div><div class='add'>+		u64 first_dir_index_to_log;</div><div class='ctx'> 	};</div><div class='ctx'> </div><div class='ctx'> 	union {</div><div class='hunk'>@@ -157,34 +243,53 @@ struct btrfs_inode {</div><div class='ctx'> 		 * Total number of bytes pending delalloc that fall within a file</div><div class='ctx'> 		 * range that is either a hole or beyond EOF (and no prealloc extent</div><div class='ctx'> 		 * exists in the range). This is always &lt;= delalloc_bytes and this</div><div class='del'>-		 * is used only for files.</div><div class='add'>+		 * is used only for files. Protected by 'lock'.</div><div class='ctx'> 		 */</div><div class='ctx'> 		u64 new_delalloc_bytes;</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * The offset of the last dir index key that was logged.</div><div class='del'>-		 * This is used only for directories.</div><div class='add'>+		 * This is used only for directories. Protected by 'log_mutex'.</div><div class='ctx'> 		 */</div><div class='ctx'> 		u64 last_dir_index_offset;</div><div class='ctx'> 	};</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * total number of bytes pending defrag, used by stat to check whether</div><div class='del'>-	 * it needs COW.</div><div class='del'>-	 */</div><div class='del'>-	u64 defrag_bytes;</div><div class='add'>+	union {</div><div class='add'>+		/*</div><div class='add'>+		 * Total number of bytes pending defrag, used by stat to check whether</div><div class='add'>+		 * it needs COW. Protected by 'lock'.</div><div class='add'>+		 * Used by inodes other than the data relocation inode.</div><div class='add'>+		 */</div><div class='add'>+		u64 defrag_bytes;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Logical address of the block group being relocated.</div><div class='add'>+		 * Used only by the data relocation inode.</div><div class='add'>+		 */</div><div class='add'>+		u64 reloc_block_group_start;</div><div class='add'>+	};</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * the size of the file stored in the metadata on disk.  data=ordered</div><div class='add'>+	 * The size of the file stored in the metadata on disk.  data=ordered</div><div class='ctx'> 	 * means the in-memory i_size might be larger than the size on disk</div><div class='del'>-	 * because not all the blocks are written yet.</div><div class='add'>+	 * because not all the blocks are written yet. Protected by 'lock'.</div><div class='ctx'> 	 */</div><div class='ctx'> 	u64 disk_i_size;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * if this is a directory then index_cnt is the counter for the index</div><div class='del'>-	 * number for new files that are created</div><div class='del'>-	 */</div><div class='del'>-	u64 index_cnt;</div><div class='add'>+	union {</div><div class='add'>+		/*</div><div class='add'>+		 * If this is a directory then index_cnt is the counter for the</div><div class='add'>+		 * index number for new files that are created. For an empty</div><div class='add'>+		 * directory, this must be initialized to BTRFS_DIR_START_INDEX.</div><div class='add'>+		 */</div><div class='add'>+		u64 index_cnt;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * If this is not a directory, this is the number of bytes</div><div class='add'>+		 * outstanding that are going to need csums. This is used in</div><div class='add'>+		 * ENOSPC accounting. Protected by 'lock'.</div><div class='add'>+		 */</div><div class='add'>+		u64 csum_bytes;</div><div class='add'>+	};</div><div class='ctx'> </div><div class='ctx'> 	/* Cache the directory index number to speed the dir/file remove */</div><div class='ctx'> 	u64 dir_index;</div><div class='hunk'>@@ -196,70 +301,69 @@ struct btrfs_inode {</div><div class='ctx'> 	 */</div><div class='ctx'> 	u64 last_unlink_trans;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * The id/generation of the last transaction where this inode was</div><div class='del'>-	 * either the source or the destination of a clone/dedupe operation.</div><div class='del'>-	 * Used when logging an inode to know if there are shared extents that</div><div class='del'>-	 * need special care when logging checksum items, to avoid duplicate</div><div class='del'>-	 * checksum items in a log (which can lead to a corruption where we end</div><div class='del'>-	 * up with missing checksum ranges after log replay).</div><div class='del'>-	 * Protected by the vfs inode lock.</div><div class='del'>-	 */</div><div class='del'>-	u64 last_reflink_trans;</div><div class='add'>+	union {</div><div class='add'>+		/*</div><div class='add'>+		 * The id/generation of the last transaction where this inode</div><div class='add'>+		 * was either the source or the destination of a clone/dedupe</div><div class='add'>+		 * operation. Used when logging an inode to know if there are</div><div class='add'>+		 * shared extents that need special care when logging checksum</div><div class='add'>+		 * items, to avoid duplicate checksum items in a log (which can</div><div class='add'>+		 * lead to a corruption where we end up with missing checksum</div><div class='add'>+		 * ranges after log replay). Protected by the VFS inode lock.</div><div class='add'>+		 * Used for regular files only.</div><div class='add'>+		 */</div><div class='add'>+		u64 last_reflink_trans;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Number of bytes outstanding that are going to need csums.  This is</div><div class='del'>-	 * used in ENOSPC accounting.</div><div class='del'>-	 */</div><div class='del'>-	u64 csum_bytes;</div><div class='add'>+		/*</div><div class='add'>+		 * In case this a root stub inode (BTRFS_INODE_ROOT_STUB flag set),</div><div class='add'>+		 * the ID of that root.</div><div class='add'>+		 */</div><div class='add'>+		u64 ref_root_id;</div><div class='add'>+	};</div><div class='ctx'> </div><div class='ctx'> 	/* Backwards incompatible flags, lower half of inode_item::flags  */</div><div class='ctx'> 	u32 flags;</div><div class='ctx'> 	/* Read-only compatibility flags, upper half of inode_item::flags */</div><div class='ctx'> 	u32 ro_flags;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Counters to keep track of the number of extent item's we may use due</div><div class='del'>-	 * to delalloc and such.  outstanding_extents is the number of extent</div><div class='del'>-	 * items we think we'll end up using, and reserved_extents is the number</div><div class='del'>-	 * of extent items we've reserved metadata for.</div><div class='del'>-	 */</div><div class='del'>-	unsigned outstanding_extents;</div><div class='del'>-</div><div class='ctx'> 	struct btrfs_block_rsv block_rsv;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Cached values of inode properties</div><div class='del'>-	 */</div><div class='del'>-	unsigned prop_compress;		/* per-file compression algorithm */</div><div class='del'>-	/*</div><div class='del'>-	 * Force compression on the file using the defrag ioctl, could be</div><div class='del'>-	 * different from prop_compress and takes precedence if set</div><div class='del'>-	 */</div><div class='del'>-	unsigned defrag_compress;</div><div class='del'>-</div><div class='ctx'> 	struct btrfs_delayed_node *delayed_node;</div><div class='ctx'> </div><div class='ctx'> 	/* File creation time. */</div><div class='del'>-	struct timespec64 i_otime;</div><div class='add'>+	u64 i_otime_sec;</div><div class='add'>+	u32 i_otime_nsec;</div><div class='ctx'> </div><div class='ctx'> 	/* Hook into fs_info-&gt;delayed_iputs */</div><div class='ctx'> 	struct list_head delayed_iput;</div><div class='ctx'> </div><div class='ctx'> 	struct rw_semaphore i_mmap_lock;</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_FS_VERITY</div><div class='add'>+	struct fsverity_info *i_verity_info;</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> 	struct inode vfs_inode;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static inline u32 btrfs_inode_sectorsize(const struct btrfs_inode *inode)</div><div class='add'>+static inline u64 btrfs_get_first_dir_index_to_log(const struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='del'>-	return inode-&gt;root-&gt;fs_info-&gt;sectorsize;</div><div class='add'>+	return READ_ONCE(inode-&gt;first_dir_index_to_log);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline struct btrfs_inode *BTRFS_I(const struct inode *inode)</div><div class='add'>+static inline void btrfs_set_first_dir_index_to_log(struct btrfs_inode *inode,</div><div class='add'>+						    u64 index)</div><div class='ctx'> {</div><div class='del'>-	return container_of(inode, struct btrfs_inode, vfs_inode);</div><div class='add'>+	WRITE_ONCE(inode-&gt;first_dir_index_to_log, index);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/* Type checked and const-preserving VFS inode -&gt; btrfs inode. */</div><div class='add'>+#define BTRFS_I(_inode)								\</div><div class='add'>+	_Generic(_inode,							\</div><div class='add'>+		 struct inode *: container_of(_inode, struct btrfs_inode, vfs_inode),	\</div><div class='add'>+		 const struct inode *: (const struct btrfs_inode *)container_of(	\</div><div class='add'>+					_inode, const struct btrfs_inode, vfs_inode))</div><div class='add'>+</div><div class='ctx'> static inline unsigned long btrfs_inode_hash(u64 objectid,</div><div class='ctx'> 					     const struct btrfs_root *root)</div><div class='ctx'> {</div><div class='hunk'>@@ -272,24 +376,44 @@ static inline unsigned long btrfs_inode_hash(u64 objectid,</div><div class='ctx'> 	return (unsigned long)h;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void btrfs_insert_inode_hash(struct inode *inode)</div><div class='add'>+#if BITS_PER_LONG == 32</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * On 32 bit systems the i_ino of struct inode is 32 bits (unsigned long), so</div><div class='add'>+ * we use the inode's location objectid which is a u64 to avoid truncation.</div><div class='add'>+ */</div><div class='add'>+static inline u64 btrfs_ino(const struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='del'>-	unsigned long h = btrfs_inode_hash(inode-&gt;i_ino, BTRFS_I(inode)-&gt;root);</div><div class='add'>+	u64 ino = inode-&gt;objectid;</div><div class='ctx'> </div><div class='del'>-	__insert_inode_hash(inode, h);</div><div class='add'>+	if (test_bit(BTRFS_INODE_ROOT_STUB, &amp;inode-&gt;runtime_flags))</div><div class='add'>+		ino = inode-&gt;vfs_inode.i_ino;</div><div class='add'>+	return ino;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#else</div><div class='add'>+</div><div class='ctx'> static inline u64 btrfs_ino(const struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='del'>-	u64 ino = inode-&gt;location.objectid;</div><div class='add'>+	return inode-&gt;vfs_inode.i_ino;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * !ino: btree_inode</div><div class='del'>-	 * type == BTRFS_ROOT_ITEM_KEY: subvol dir</div><div class='del'>-	 */</div><div class='del'>-	if (!ino || inode-&gt;location.type == BTRFS_ROOT_ITEM_KEY)</div><div class='del'>-		ino = inode-&gt;vfs_inode.i_ino;</div><div class='del'>-	return ino;</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+static inline void btrfs_get_inode_key(const struct btrfs_inode *inode,</div><div class='add'>+				       struct btrfs_key *key)</div><div class='add'>+{</div><div class='add'>+	key-&gt;objectid = btrfs_ino(inode);</div><div class='add'>+	key-&gt;type = BTRFS_INODE_ITEM_KEY;</div><div class='add'>+	key-&gt;offset = 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_set_inode_number(struct btrfs_inode *inode, u64 ino)</div><div class='add'>+{</div><div class='add'>+#if BITS_PER_LONG == 32</div><div class='add'>+	inode-&gt;objectid = ino;</div><div class='add'>+#endif</div><div class='add'>+	inode-&gt;vfs_inode.i_ino = ino;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void btrfs_i_size_write(struct btrfs_inode *inode, u64 size)</div><div class='hunk'>@@ -298,21 +422,14 @@ static inline void btrfs_i_size_write(struct btrfs_inode *inode, u64 size)</div><div class='ctx'> 	inode-&gt;disk_i_size = size;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline bool btrfs_is_free_space_inode(struct btrfs_inode *inode)</div><div class='add'>+static inline bool btrfs_is_free_space_inode(const struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *root = inode-&gt;root;</div><div class='del'>-</div><div class='del'>-	if (root == root-&gt;fs_info-&gt;tree_root &amp;&amp;</div><div class='del'>-	    btrfs_ino(inode) != BTRFS_BTREE_INODE_OBJECTID)</div><div class='del'>-		return true;</div><div class='del'>-	if (inode-&gt;location.objectid == BTRFS_FREE_INO_OBJECTID)</div><div class='del'>-		return true;</div><div class='del'>-	return false;</div><div class='add'>+	return test_bit(BTRFS_INODE_FREE_SPACE_INODE, &amp;inode-&gt;runtime_flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline bool is_data_inode(struct inode *inode)</div><div class='add'>+static inline bool is_data_inode(const struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='del'>-	return btrfs_ino(BTRFS_I(inode)) != BTRFS_BTREE_INODE_OBJECTID;</div><div class='add'>+	return btrfs_ino(inode) != BTRFS_BTREE_INODE_OBJECTID;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void btrfs_mod_outstanding_extents(struct btrfs_inode *inode,</div><div class='hunk'>@@ -323,7 +440,7 @@ static inline void btrfs_mod_outstanding_extents(struct btrfs_inode *inode,</div><div class='ctx'> 	if (btrfs_is_free_space_inode(inode))</div><div class='ctx'> 		return;</div><div class='ctx'> 	trace_btrfs_inode_mod_outstanding_extents(inode-&gt;root, btrfs_ino(inode),</div><div class='del'>-						  mod);</div><div class='add'>+						  mod, inode-&gt;outstanding_extents);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -341,6 +458,38 @@ static inline void btrfs_set_inode_last_sub_trans(struct btrfs_inode *inode)</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Should be called while holding the inode's VFS lock in exclusive mode, or</div><div class='add'>+ * while holding the inode's mmap lock (struct btrfs_inode::i_mmap_lock) in</div><div class='add'>+ * either shared or exclusive mode, or in a context where no one else can access</div><div class='add'>+ * the inode concurrently (during inode creation or when loading an inode from</div><div class='add'>+ * disk).</div><div class='add'>+ */</div><div class='add'>+static inline void btrfs_set_inode_full_sync(struct btrfs_inode *inode)</div><div class='add'>+{</div><div class='add'>+	set_bit(BTRFS_INODE_NEEDS_FULL_SYNC, &amp;inode-&gt;runtime_flags);</div><div class='add'>+	/*</div><div class='add'>+	 * The inode may have been part of a reflink operation in the last</div><div class='add'>+	 * transaction that modified it, and then a fsync has reset the</div><div class='add'>+	 * last_reflink_trans to avoid subsequent fsyncs in the same</div><div class='add'>+	 * transaction to do unnecessary work. So update last_reflink_trans</div><div class='add'>+	 * to the last_trans value (we have to be pessimistic and assume a</div><div class='add'>+	 * reflink happened).</div><div class='add'>+	 *</div><div class='add'>+	 * The -&gt;last_trans is protected by the inode's spinlock and we can</div><div class='add'>+	 * have a concurrent ordered extent completion update it. Also set</div><div class='add'>+	 * last_reflink_trans to -&gt;last_trans only if the former is less than</div><div class='add'>+	 * the later, because we can be called in a context where</div><div class='add'>+	 * last_reflink_trans was set to the current transaction generation</div><div class='add'>+	 * while -&gt;last_trans was not yet updated in the current transaction,</div><div class='add'>+	 * and therefore has a lower value.</div><div class='add'>+	 */</div><div class='add'>+	spin_lock(&amp;inode-&gt;lock);</div><div class='add'>+	if (inode-&gt;last_reflink_trans &lt; inode-&gt;last_trans)</div><div class='add'>+		inode-&gt;last_reflink_trans = inode-&gt;last_trans;</div><div class='add'>+	spin_unlock(&amp;inode-&gt;lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline bool btrfs_inode_in_log(struct btrfs_inode *inode, u64 generation)</div><div class='ctx'> {</div><div class='ctx'> 	bool ret = false;</div><div class='hunk'>@@ -348,80 +497,181 @@ static inline bool btrfs_inode_in_log(struct btrfs_inode *inode, u64 generation)</div><div class='ctx'> 	spin_lock(&amp;inode-&gt;lock);</div><div class='ctx'> 	if (inode-&gt;logged_trans == generation &amp;&amp;</div><div class='ctx'> 	    inode-&gt;last_sub_trans &lt;= inode-&gt;last_log_commit &amp;&amp;</div><div class='del'>-	    inode-&gt;last_sub_trans &lt;= inode-&gt;root-&gt;last_log_commit)</div><div class='add'>+	    inode-&gt;last_sub_trans &lt;= btrfs_get_root_last_log_commit(inode-&gt;root))</div><div class='ctx'> 		ret = true;</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;lock);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct btrfs_dio_private {</div><div class='del'>-	struct inode *inode;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Since DIO can use anonymous page, we cannot use page_offset() to</div><div class='del'>-	 * grab the file offset, thus need a dedicated member for file offset.</div><div class='del'>-	 */</div><div class='del'>-	u64 file_offset;</div><div class='del'>-	u64 disk_bytenr;</div><div class='del'>-	/* Used for bio::bi_size */</div><div class='del'>-	u32 bytes;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * References to this structure. There is one reference per in-flight</div><div class='del'>-	 * bio plus one while we're still setting up.</div><div class='del'>-	 */</div><div class='del'>-	refcount_t refs;</div><div class='del'>-</div><div class='del'>-	/* dio_bio came from fs/direct-io.c */</div><div class='del'>-	struct bio *dio_bio;</div><div class='del'>-</div><div class='del'>-	/* Array of checksums */</div><div class='del'>-	u8 csums[];</div><div class='del'>-};</div><div class='del'>-</div><div class='ctx'> /*</div><div class='del'>- * btrfs_inode_item stores flags in a u64, btrfs_inode stores them in two</div><div class='del'>- * separate u32s. These two functions convert between the two representations.</div><div class='add'>+ * Check if the inode has flags compatible with compression</div><div class='ctx'>  */</div><div class='del'>-static inline u64 btrfs_inode_combine_flags(u32 flags, u32 ro_flags)</div><div class='add'>+static inline bool btrfs_inode_can_compress(const struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='del'>-	return (flags | ((u64)ro_flags &lt;&lt; 32));</div><div class='add'>+	if (inode-&gt;flags &amp; BTRFS_INODE_NODATACOW ||</div><div class='add'>+	    inode-&gt;flags &amp; BTRFS_INODE_NODATASUM)</div><div class='add'>+		return false;</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void btrfs_inode_split_flags(u64 inode_item_flags,</div><div class='del'>-					   u32 *flags, u32 *ro_flags)</div><div class='add'>+static inline void btrfs_assert_inode_locked(struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='del'>-	*flags = (u32)inode_item_flags;</div><div class='del'>-	*ro_flags = (u32)(inode_item_flags &gt;&gt; 32);</div><div class='add'>+	/* Immediately trigger a crash if the inode is not locked. */</div><div class='add'>+	ASSERT(inode_is_locked(&amp;inode-&gt;vfs_inode));</div><div class='add'>+	/* Trigger a splat in dmesg if this task is not holding the lock. */</div><div class='add'>+	lockdep_assert_held(&amp;inode-&gt;vfs_inode.i_rwsem);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Array of bytes with variable length, hexadecimal format 0x1234 */</div><div class='del'>-#define CSUM_FMT				"0x%*phN"</div><div class='del'>-#define CSUM_FMT_VALUE(size, bytes)		size, bytes</div><div class='del'>-</div><div class='del'>-static inline void btrfs_print_data_csum_error(struct btrfs_inode *inode,</div><div class='del'>-		u64 logical_start, u8 *csum, u8 *csum_expected, int mirror_num)</div><div class='add'>+static inline void btrfs_update_inode_mapping_flags(struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *root = inode-&gt;root;</div><div class='del'>-	const u32 csum_size = root-&gt;fs_info-&gt;csum_size;</div><div class='del'>-</div><div class='del'>-	/* Output minus objectid, which is more meaningful */</div><div class='del'>-	if (root-&gt;root_key.objectid &gt;= BTRFS_LAST_FREE_OBJECTID)</div><div class='del'>-		btrfs_warn_rl(root-&gt;fs_info,</div><div class='del'>-"csum failed root %lld ino %lld off %llu csum " CSUM_FMT " expected csum " CSUM_FMT " mirror %d",</div><div class='del'>-			root-&gt;root_key.objectid, btrfs_ino(inode),</div><div class='del'>-			logical_start,</div><div class='del'>-			CSUM_FMT_VALUE(csum_size, csum),</div><div class='del'>-			CSUM_FMT_VALUE(csum_size, csum_expected),</div><div class='del'>-			mirror_num);</div><div class='add'>+	if (inode-&gt;flags &amp; BTRFS_INODE_NODATASUM)</div><div class='add'>+		mapping_clear_stable_writes(inode-&gt;vfs_inode.i_mapping);</div><div class='ctx'> 	else</div><div class='del'>-		btrfs_warn_rl(root-&gt;fs_info,</div><div class='del'>-"csum failed root %llu ino %llu off %llu csum " CSUM_FMT " expected csum " CSUM_FMT " mirror %d",</div><div class='del'>-			root-&gt;root_key.objectid, btrfs_ino(inode),</div><div class='del'>-			logical_start,</div><div class='del'>-			CSUM_FMT_VALUE(csum_size, csum),</div><div class='del'>-			CSUM_FMT_VALUE(csum_size, csum_expected),</div><div class='del'>-			mirror_num);</div><div class='add'>+		mapping_set_stable_writes(inode-&gt;vfs_inode.i_mapping);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_set_inode_mapping_order(struct btrfs_inode *inode)</div><div class='add'>+{</div><div class='add'>+	/* Metadata inode should not reach here. */</div><div class='add'>+	ASSERT(is_data_inode(inode));</div><div class='add'>+</div><div class='add'>+	/* We only allow BITS_PER_LONGS blocks for each bitmap. */</div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+	mapping_set_folio_order_range(inode-&gt;vfs_inode.i_mapping,</div><div class='add'>+				      inode-&gt;root-&gt;fs_info-&gt;block_min_order,</div><div class='add'>+				      inode-&gt;root-&gt;fs_info-&gt;block_max_order);</div><div class='add'>+#endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void btrfs_calculate_block_csum_folio(struct btrfs_fs_info *fs_info,</div><div class='add'>+				      const phys_addr_t paddr, u8 *dest);</div><div class='add'>+void btrfs_calculate_block_csum_pages(struct btrfs_fs_info *fs_info,</div><div class='add'>+				      const phys_addr_t paddrs[], u8 *dest);</div><div class='add'>+int btrfs_check_block_csum(struct btrfs_fs_info *fs_info, phys_addr_t paddr, u8 *csum,</div><div class='add'>+			   const u8 * const csum_expected);</div><div class='add'>+bool btrfs_data_csum_ok(struct btrfs_bio *bbio, struct btrfs_device *dev,</div><div class='add'>+			u32 bio_offset, const phys_addr_t paddrs[]);</div><div class='add'>+noinline int can_nocow_extent(struct btrfs_inode *inode, u64 offset, u64 *len,</div><div class='add'>+			      struct btrfs_file_extent *file_extent,</div><div class='add'>+			      bool nowait);</div><div class='add'>+</div><div class='add'>+void btrfs_del_delalloc_inode(struct btrfs_inode *inode);</div><div class='add'>+struct inode *btrfs_lookup_dentry(struct inode *dir, struct dentry *dentry);</div><div class='add'>+int btrfs_set_inode_index(struct btrfs_inode *dir, u64 *index);</div><div class='add'>+int btrfs_unlink_inode(struct btrfs_trans_handle *trans,</div><div class='add'>+		       struct btrfs_inode *dir, struct btrfs_inode *inode,</div><div class='add'>+		       const struct fscrypt_str *name);</div><div class='add'>+int btrfs_add_link(struct btrfs_trans_handle *trans,</div><div class='add'>+		   struct btrfs_inode *parent_inode, struct btrfs_inode *inode,</div><div class='add'>+		   const struct fscrypt_str *name, bool add_backref, u64 index);</div><div class='add'>+int btrfs_delete_subvolume(struct btrfs_inode *dir, struct dentry *dentry);</div><div class='add'>+int btrfs_truncate_block(struct btrfs_inode *inode, u64 offset, u64 start, u64 end);</div><div class='add'>+</div><div class='add'>+int btrfs_start_delalloc_snapshot(struct btrfs_root *root, bool in_reclaim_context);</div><div class='add'>+int btrfs_start_delalloc_roots(struct btrfs_fs_info *fs_info, long nr,</div><div class='add'>+			       bool in_reclaim_context);</div><div class='add'>+int btrfs_set_extent_delalloc(struct btrfs_inode *inode, u64 start, u64 end,</div><div class='add'>+			      unsigned int extra_bits,</div><div class='add'>+			      struct extent_state **cached_state);</div><div class='add'>+</div><div class='add'>+struct btrfs_new_inode_args {</div><div class='add'>+	/* Input */</div><div class='add'>+	struct inode *dir;</div><div class='add'>+	struct dentry *dentry;</div><div class='add'>+	struct inode *inode;</div><div class='add'>+	bool orphan;</div><div class='add'>+	bool subvol;</div><div class='add'>+</div><div class='add'>+	/* Output from btrfs_new_inode_prepare(), input to btrfs_create_new_inode(). */</div><div class='add'>+	struct posix_acl *default_acl;</div><div class='add'>+	struct posix_acl *acl;</div><div class='add'>+	struct fscrypt_name fname;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+int btrfs_new_inode_prepare(struct btrfs_new_inode_args *args,</div><div class='add'>+			    unsigned int *trans_num_items);</div><div class='add'>+int btrfs_create_new_inode(struct btrfs_trans_handle *trans,</div><div class='add'>+			   struct btrfs_new_inode_args *args);</div><div class='add'>+void btrfs_new_inode_args_destroy(struct btrfs_new_inode_args *args);</div><div class='add'>+struct inode *btrfs_new_subvol_inode(struct mnt_idmap *idmap,</div><div class='add'>+				     struct inode *dir);</div><div class='add'>+ void btrfs_set_delalloc_extent(struct btrfs_inode *inode, struct extent_state *state,</div><div class='add'>+			        u32 bits);</div><div class='add'>+void btrfs_clear_delalloc_extent(struct btrfs_inode *inode,</div><div class='add'>+				 struct extent_state *state, u32 bits);</div><div class='add'>+void btrfs_merge_delalloc_extent(struct btrfs_inode *inode, struct extent_state *new,</div><div class='add'>+				 struct extent_state *other);</div><div class='add'>+void btrfs_split_delalloc_extent(struct btrfs_inode *inode,</div><div class='add'>+				 struct extent_state *orig, u64 split);</div><div class='add'>+void btrfs_evict_inode(struct inode *inode);</div><div class='add'>+struct inode *btrfs_alloc_inode(struct super_block *sb);</div><div class='add'>+void btrfs_destroy_inode(struct inode *inode);</div><div class='add'>+void btrfs_free_inode(struct inode *inode);</div><div class='add'>+int btrfs_drop_inode(struct inode *inode);</div><div class='add'>+int __init btrfs_init_cachep(void);</div><div class='add'>+void __cold btrfs_destroy_cachep(void);</div><div class='add'>+struct btrfs_inode *btrfs_iget_path(u64 ino, struct btrfs_root *root,</div><div class='add'>+				    struct btrfs_path *path);</div><div class='add'>+struct btrfs_inode *btrfs_iget(u64 ino, struct btrfs_root *root);</div><div class='add'>+struct extent_map *btrfs_get_extent(struct btrfs_inode *inode,</div><div class='add'>+				    struct folio *folio, u64 start, u64 len);</div><div class='add'>+int btrfs_update_inode(struct btrfs_trans_handle *trans,</div><div class='add'>+		       struct btrfs_inode *inode);</div><div class='add'>+int btrfs_update_inode_fallback(struct btrfs_trans_handle *trans,</div><div class='add'>+				struct btrfs_inode *inode);</div><div class='add'>+int btrfs_orphan_add(struct btrfs_trans_handle *trans, struct btrfs_inode *inode);</div><div class='add'>+int btrfs_orphan_cleanup(struct btrfs_root *root);</div><div class='add'>+int btrfs_cont_expand(struct btrfs_inode *inode, loff_t oldsize, loff_t size);</div><div class='add'>+void btrfs_add_delayed_iput(struct btrfs_inode *inode);</div><div class='add'>+void btrfs_run_delayed_iputs(struct btrfs_fs_info *fs_info);</div><div class='add'>+int btrfs_wait_on_delayed_iputs(struct btrfs_fs_info *fs_info);</div><div class='add'>+int btrfs_prealloc_file_range(struct inode *inode, int mode,</div><div class='add'>+			      u64 start, u64 num_bytes, u64 min_size,</div><div class='add'>+			      loff_t actual_len, u64 *alloc_hint);</div><div class='add'>+int btrfs_prealloc_file_range_trans(struct inode *inode,</div><div class='add'>+				    struct btrfs_trans_handle *trans, int mode,</div><div class='add'>+				    u64 start, u64 num_bytes, u64 min_size,</div><div class='add'>+				    loff_t actual_len, u64 *alloc_hint);</div><div class='add'>+int btrfs_run_delalloc_range(struct btrfs_inode *inode, struct folio *locked_folio,</div><div class='add'>+			     u64 start, u64 end, struct writeback_control *wbc);</div><div class='add'>+int btrfs_writepage_cow_fixup(struct folio *folio);</div><div class='add'>+int btrfs_encoded_io_compression_from_extent(struct btrfs_fs_info *fs_info,</div><div class='add'>+					     int compress_type);</div><div class='add'>+int btrfs_encoded_read_regular_fill_pages(struct btrfs_inode *inode,</div><div class='add'>+					  u64 disk_bytenr, u64 disk_io_size,</div><div class='add'>+					  struct page **pages, void *uring_ctx);</div><div class='add'>+ssize_t btrfs_encoded_read(struct kiocb *iocb, struct iov_iter *iter,</div><div class='add'>+			   struct btrfs_ioctl_encoded_io_args *encoded,</div><div class='add'>+			   struct extent_state **cached_state,</div><div class='add'>+			   u64 *disk_bytenr, u64 *disk_io_size);</div><div class='add'>+ssize_t btrfs_encoded_read_regular(struct kiocb *iocb, struct iov_iter *iter,</div><div class='add'>+				   u64 start, u64 lockend,</div><div class='add'>+				   struct extent_state **cached_state,</div><div class='add'>+				   u64 disk_bytenr, u64 disk_io_size,</div><div class='add'>+				   size_t count, bool compressed, bool *unlocked);</div><div class='add'>+ssize_t btrfs_do_encoded_write(struct kiocb *iocb, struct iov_iter *from,</div><div class='add'>+			       const struct btrfs_ioctl_encoded_io_args *encoded);</div><div class='add'>+</div><div class='add'>+struct btrfs_inode *btrfs_find_first_inode(struct btrfs_root *root, u64 min_ino);</div><div class='add'>+</div><div class='add'>+extern const struct dentry_operations btrfs_dentry_operations;</div><div class='add'>+</div><div class='add'>+/* Inode locking type flags, by default the exclusive lock is taken. */</div><div class='add'>+enum btrfs_ilock_type {</div><div class='add'>+	ENUM_BIT(BTRFS_ILOCK_SHARED),</div><div class='add'>+	ENUM_BIT(BTRFS_ILOCK_TRY),</div><div class='add'>+	ENUM_BIT(BTRFS_ILOCK_MMAP),</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+int btrfs_inode_lock(struct btrfs_inode *inode, unsigned int ilock_flags);</div><div class='add'>+void btrfs_inode_unlock(struct btrfs_inode *inode, unsigned int ilock_flags);</div><div class='add'>+void btrfs_update_inode_bytes(struct btrfs_inode *inode, const u64 add_bytes,</div><div class='add'>+			      const u64 del_bytes);</div><div class='add'>+void btrfs_assert_inode_range_clean(struct btrfs_inode *inode, u64 start, u64 end);</div><div class='add'>+u64 btrfs_get_extent_allocation_hint(struct btrfs_inode *inode, u64 start,</div><div class='add'>+				     u64 num_bytes);</div><div class='add'>+struct extent_map *btrfs_create_io_em(struct btrfs_inode *inode, u64 start,</div><div class='add'>+				      const struct btrfs_file_extent *file_extent,</div><div class='add'>+				      int type);</div><div class='add'>+</div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/btrfs/check-integrity.c b/fs/btrfs/check-integrity.c<br/>deleted file mode 100644<br/>index 7e9f90fa0388..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/check-integrity.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/check-integrity.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,2875 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0</div><div class='del'>-/*</div><div class='del'>- * Copyright (C) STRATO AG 2011.  All rights reserved.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * This module can be used to catch cases when the btrfs kernel</div><div class='del'>- * code executes write requests to the disk that bring the file</div><div class='del'>- * system in an inconsistent state. In such a state, a power-loss</div><div class='del'>- * or kernel panic event would cause that the data on disk is</div><div class='del'>- * lost or at least damaged.</div><div class='del'>- *</div><div class='del'>- * Code is added that examines all block write requests during</div><div class='del'>- * runtime (including writes of the super block). Three rules</div><div class='del'>- * are verified and an error is printed on violation of the</div><div class='del'>- * rules:</div><div class='del'>- * 1. It is not allowed to write a disk block which is</div><div class='del'>- *    currently referenced by the super block (either directly</div><div class='del'>- *    or indirectly).</div><div class='del'>- * 2. When a super block is written, it is verified that all</div><div class='del'>- *    referenced (directly or indirectly) blocks fulfill the</div><div class='del'>- *    following requirements:</div><div class='del'>- *    2a. All referenced blocks have either been present when</div><div class='del'>- *        the file system was mounted, (i.e., they have been</div><div class='del'>- *        referenced by the super block) or they have been</div><div class='del'>- *        written since then and the write completion callback</div><div class='del'>- *        was called and no write error was indicated and a</div><div class='del'>- *        FLUSH request to the device where these blocks are</div><div class='del'>- *        located was received and completed.</div><div class='del'>- *    2b. All referenced blocks need to have a generation</div><div class='del'>- *        number which is equal to the parent's number.</div><div class='del'>- *</div><div class='del'>- * One issue that was found using this module was that the log</div><div class='del'>- * tree on disk became temporarily corrupted because disk blocks</div><div class='del'>- * that had been in use for the log tree had been freed and</div><div class='del'>- * reused too early, while being referenced by the written super</div><div class='del'>- * block.</div><div class='del'>- *</div><div class='del'>- * The search term in the kernel log that can be used to filter</div><div class='del'>- * on the existence of detected integrity issues is</div><div class='del'>- * "btrfs: attempt".</div><div class='del'>- *</div><div class='del'>- * The integrity check is enabled via mount options. These</div><div class='del'>- * mount options are only supported if the integrity check</div><div class='del'>- * tool is compiled by defining BTRFS_FS_CHECK_INTEGRITY.</div><div class='del'>- *</div><div class='del'>- * Example #1, apply integrity checks to all metadata:</div><div class='del'>- * mount /dev/sdb1 /mnt -o check_int</div><div class='del'>- *</div><div class='del'>- * Example #2, apply integrity checks to all metadata and</div><div class='del'>- * to data extents:</div><div class='del'>- * mount /dev/sdb1 /mnt -o check_int_data</div><div class='del'>- *</div><div class='del'>- * Example #3, apply integrity checks to all metadata and dump</div><div class='del'>- * the tree that the super block references to kernel messages</div><div class='del'>- * each time after a super block was written:</div><div class='del'>- * mount /dev/sdb1 /mnt -o check_int,check_int_print_mask=263</div><div class='del'>- *</div><div class='del'>- * If the integrity check tool is included and activated in</div><div class='del'>- * the mount options, plenty of kernel memory is used, and</div><div class='del'>- * plenty of additional CPU cycles are spent. Enabling this</div><div class='del'>- * functionality is not intended for normal use. In most</div><div class='del'>- * cases, unless you are a btrfs developer who needs to verify</div><div class='del'>- * the integrity of (super)-block write requests, do not</div><div class='del'>- * enable the config option BTRFS_FS_CHECK_INTEGRITY to</div><div class='del'>- * include and compile the integrity check tool.</div><div class='del'>- *</div><div class='del'>- * Expect millions of lines of information in the kernel log with an</div><div class='del'>- * enabled check_int_print_mask. Therefore set LOG_BUF_SHIFT in the</div><div class='del'>- * kernel config to at least 26 (which is 64MB). Usually the value is</div><div class='del'>- * limited to 21 (which is 2MB) in init/Kconfig. The file needs to be</div><div class='del'>- * changed like this before LOG_BUF_SHIFT can be set to a high value:</div><div class='del'>- * config LOG_BUF_SHIFT</div><div class='del'>- *       int "Kernel log buffer size (16 =&gt; 64KB, 17 =&gt; 128KB)"</div><div class='del'>- *       range 12 30</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#include &lt;linux/sched.h&gt;</div><div class='del'>-#include &lt;linux/slab.h&gt;</div><div class='del'>-#include &lt;linux/mutex.h&gt;</div><div class='del'>-#include &lt;linux/genhd.h&gt;</div><div class='del'>-#include &lt;linux/blkdev.h&gt;</div><div class='del'>-#include &lt;linux/mm.h&gt;</div><div class='del'>-#include &lt;linux/string.h&gt;</div><div class='del'>-#include &lt;crypto/hash.h&gt;</div><div class='del'>-#include "ctree.h"</div><div class='del'>-#include "disk-io.h"</div><div class='del'>-#include "transaction.h"</div><div class='del'>-#include "extent_io.h"</div><div class='del'>-#include "volumes.h"</div><div class='del'>-#include "print-tree.h"</div><div class='del'>-#include "locking.h"</div><div class='del'>-#include "check-integrity.h"</div><div class='del'>-#include "rcu-string.h"</div><div class='del'>-#include "compression.h"</div><div class='del'>-</div><div class='del'>-#define BTRFSIC_BLOCK_HASHTABLE_SIZE 0x10000</div><div class='del'>-#define BTRFSIC_BLOCK_LINK_HASHTABLE_SIZE 0x10000</div><div class='del'>-#define BTRFSIC_DEV2STATE_HASHTABLE_SIZE 0x100</div><div class='del'>-#define BTRFSIC_BLOCK_MAGIC_NUMBER 0x14491051</div><div class='del'>-#define BTRFSIC_BLOCK_LINK_MAGIC_NUMBER 0x11070807</div><div class='del'>-#define BTRFSIC_DEV2STATE_MAGIC_NUMBER 0x20111530</div><div class='del'>-#define BTRFSIC_BLOCK_STACK_FRAME_MAGIC_NUMBER 20111300</div><div class='del'>-#define BTRFSIC_TREE_DUMP_MAX_INDENT_LEVEL (200 - 6)	/* in characters,</div><div class='del'>-							 * excluding " [...]" */</div><div class='del'>-#define BTRFSIC_GENERATION_UNKNOWN ((u64)-1)</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * The definition of the bitmask fields for the print_mask.</div><div class='del'>- * They are specified with the mount option check_integrity_print_mask.</div><div class='del'>- */</div><div class='del'>-#define BTRFSIC_PRINT_MASK_SUPERBLOCK_WRITE			0x00000001</div><div class='del'>-#define BTRFSIC_PRINT_MASK_ROOT_CHUNK_LOG_TREE_LOCATION		0x00000002</div><div class='del'>-#define BTRFSIC_PRINT_MASK_TREE_AFTER_SB_WRITE			0x00000004</div><div class='del'>-#define BTRFSIC_PRINT_MASK_TREE_BEFORE_SB_WRITE			0x00000008</div><div class='del'>-#define BTRFSIC_PRINT_MASK_SUBMIT_BIO_BH			0x00000010</div><div class='del'>-#define BTRFSIC_PRINT_MASK_END_IO_BIO_BH			0x00000020</div><div class='del'>-#define BTRFSIC_PRINT_MASK_VERBOSE				0x00000040</div><div class='del'>-#define BTRFSIC_PRINT_MASK_VERY_VERBOSE				0x00000080</div><div class='del'>-#define BTRFSIC_PRINT_MASK_INITIAL_TREE				0x00000100</div><div class='del'>-#define BTRFSIC_PRINT_MASK_INITIAL_ALL_TREES			0x00000200</div><div class='del'>-#define BTRFSIC_PRINT_MASK_INITIAL_DATABASE			0x00000400</div><div class='del'>-#define BTRFSIC_PRINT_MASK_NUM_COPIES				0x00000800</div><div class='del'>-#define BTRFSIC_PRINT_MASK_TREE_WITH_ALL_MIRRORS		0x00001000</div><div class='del'>-#define BTRFSIC_PRINT_MASK_SUBMIT_BIO_BH_VERBOSE		0x00002000</div><div class='del'>-</div><div class='del'>-struct btrfsic_dev_state;</div><div class='del'>-struct btrfsic_state;</div><div class='del'>-</div><div class='del'>-struct btrfsic_block {</div><div class='del'>-	u32 magic_num;		/* only used for debug purposes */</div><div class='del'>-	unsigned int is_metadata:1;	/* if it is meta-data, not data-data */</div><div class='del'>-	unsigned int is_superblock:1;	/* if it is one of the superblocks */</div><div class='del'>-	unsigned int is_iodone:1;	/* if is done by lower subsystem */</div><div class='del'>-	unsigned int iodone_w_error:1;	/* error was indicated to endio */</div><div class='del'>-	unsigned int never_written:1;	/* block was added because it was</div><div class='del'>-					 * referenced, not because it was</div><div class='del'>-					 * written */</div><div class='del'>-	unsigned int mirror_num;	/* large enough to hold</div><div class='del'>-					 * BTRFS_SUPER_MIRROR_MAX */</div><div class='del'>-	struct btrfsic_dev_state *dev_state;</div><div class='del'>-	u64 dev_bytenr;		/* key, physical byte num on disk */</div><div class='del'>-	u64 logical_bytenr;	/* logical byte num on disk */</div><div class='del'>-	u64 generation;</div><div class='del'>-	struct btrfs_disk_key disk_key;	/* extra info to print in case of</div><div class='del'>-					 * issues, will not always be correct */</div><div class='del'>-	struct list_head collision_resolving_node;	/* list node */</div><div class='del'>-	struct list_head all_blocks_node;	/* list node */</div><div class='del'>-</div><div class='del'>-	/* the following two lists contain block_link items */</div><div class='del'>-	struct list_head ref_to_list;	/* list */</div><div class='del'>-	struct list_head ref_from_list;	/* list */</div><div class='del'>-	struct btrfsic_block *next_in_same_bio;</div><div class='del'>-	void *orig_bio_private;</div><div class='del'>-	bio_end_io_t *orig_bio_end_io;</div><div class='del'>-	int submit_bio_bh_rw;</div><div class='del'>-	u64 flush_gen; /* only valid if !never_written */</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Elements of this type are allocated dynamically and required because</div><div class='del'>- * each block object can refer to and can be ref from multiple blocks.</div><div class='del'>- * The key to lookup them in the hashtable is the dev_bytenr of</div><div class='del'>- * the block ref to plus the one from the block referred from.</div><div class='del'>- * The fact that they are searchable via a hashtable and that a</div><div class='del'>- * ref_cnt is maintained is not required for the btrfs integrity</div><div class='del'>- * check algorithm itself, it is only used to make the output more</div><div class='del'>- * beautiful in case that an error is detected (an error is defined</div><div class='del'>- * as a write operation to a block while that block is still referenced).</div><div class='del'>- */</div><div class='del'>-struct btrfsic_block_link {</div><div class='del'>-	u32 magic_num;		/* only used for debug purposes */</div><div class='del'>-	u32 ref_cnt;</div><div class='del'>-	struct list_head node_ref_to;	/* list node */</div><div class='del'>-	struct list_head node_ref_from;	/* list node */</div><div class='del'>-	struct list_head collision_resolving_node;	/* list node */</div><div class='del'>-	struct btrfsic_block *block_ref_to;</div><div class='del'>-	struct btrfsic_block *block_ref_from;</div><div class='del'>-	u64 parent_generation;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct btrfsic_dev_state {</div><div class='del'>-	u32 magic_num;		/* only used for debug purposes */</div><div class='del'>-	struct block_device *bdev;</div><div class='del'>-	struct btrfsic_state *state;</div><div class='del'>-	struct list_head collision_resolving_node;	/* list node */</div><div class='del'>-	struct btrfsic_block dummy_block_for_bio_bh_flush;</div><div class='del'>-	u64 last_flush_gen;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct btrfsic_block_hashtable {</div><div class='del'>-	struct list_head table[BTRFSIC_BLOCK_HASHTABLE_SIZE];</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct btrfsic_block_link_hashtable {</div><div class='del'>-	struct list_head table[BTRFSIC_BLOCK_LINK_HASHTABLE_SIZE];</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct btrfsic_dev_state_hashtable {</div><div class='del'>-	struct list_head table[BTRFSIC_DEV2STATE_HASHTABLE_SIZE];</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct btrfsic_block_data_ctx {</div><div class='del'>-	u64 start;		/* virtual bytenr */</div><div class='del'>-	u64 dev_bytenr;		/* physical bytenr on device */</div><div class='del'>-	u32 len;</div><div class='del'>-	struct btrfsic_dev_state *dev;</div><div class='del'>-	char **datav;</div><div class='del'>-	struct page **pagev;</div><div class='del'>-	void *mem_to_free;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/* This structure is used to implement recursion without occupying</div><div class='del'>- * any stack space, refer to btrfsic_process_metablock() */</div><div class='del'>-struct btrfsic_stack_frame {</div><div class='del'>-	u32 magic;</div><div class='del'>-	u32 nr;</div><div class='del'>-	int error;</div><div class='del'>-	int i;</div><div class='del'>-	int limit_nesting;</div><div class='del'>-	int num_copies;</div><div class='del'>-	int mirror_num;</div><div class='del'>-	struct btrfsic_block *block;</div><div class='del'>-	struct btrfsic_block_data_ctx *block_ctx;</div><div class='del'>-	struct btrfsic_block *next_block;</div><div class='del'>-	struct btrfsic_block_data_ctx next_block_ctx;</div><div class='del'>-	struct btrfs_header *hdr;</div><div class='del'>-	struct btrfsic_stack_frame *prev;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/* Some state per mounted filesystem */</div><div class='del'>-struct btrfsic_state {</div><div class='del'>-	u32 print_mask;</div><div class='del'>-	int include_extent_data;</div><div class='del'>-	struct list_head all_blocks_list;</div><div class='del'>-	struct btrfsic_block_hashtable block_hashtable;</div><div class='del'>-	struct btrfsic_block_link_hashtable block_link_hashtable;</div><div class='del'>-	struct btrfs_fs_info *fs_info;</div><div class='del'>-	u64 max_superblock_generation;</div><div class='del'>-	struct btrfsic_block *latest_superblock;</div><div class='del'>-	u32 metablock_size;</div><div class='del'>-	u32 datablock_size;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static int btrfsic_process_metablock(struct btrfsic_state *state,</div><div class='del'>-				     struct btrfsic_block *block,</div><div class='del'>-				     struct btrfsic_block_data_ctx *block_ctx,</div><div class='del'>-				     int limit_nesting, int force_iodone_flag);</div><div class='del'>-static void btrfsic_read_from_block_data(</div><div class='del'>-	struct btrfsic_block_data_ctx *block_ctx,</div><div class='del'>-	void *dst, u32 offset, size_t len);</div><div class='del'>-static int btrfsic_create_link_to_next_block(</div><div class='del'>-		struct btrfsic_state *state,</div><div class='del'>-		struct btrfsic_block *block,</div><div class='del'>-		struct btrfsic_block_data_ctx</div><div class='del'>-		*block_ctx, u64 next_bytenr,</div><div class='del'>-		int limit_nesting,</div><div class='del'>-		struct btrfsic_block_data_ctx *next_block_ctx,</div><div class='del'>-		struct btrfsic_block **next_blockp,</div><div class='del'>-		int force_iodone_flag,</div><div class='del'>-		int *num_copiesp, int *mirror_nump,</div><div class='del'>-		struct btrfs_disk_key *disk_key,</div><div class='del'>-		u64 parent_generation);</div><div class='del'>-static int btrfsic_handle_extent_data(struct btrfsic_state *state,</div><div class='del'>-				      struct btrfsic_block *block,</div><div class='del'>-				      struct btrfsic_block_data_ctx *block_ctx,</div><div class='del'>-				      u32 item_offset, int force_iodone_flag);</div><div class='del'>-static int btrfsic_map_block(struct btrfsic_state *state, u64 bytenr, u32 len,</div><div class='del'>-			     struct btrfsic_block_data_ctx *block_ctx_out,</div><div class='del'>-			     int mirror_num);</div><div class='del'>-static void btrfsic_release_block_ctx(struct btrfsic_block_data_ctx *block_ctx);</div><div class='del'>-static int btrfsic_read_block(struct btrfsic_state *state,</div><div class='del'>-			      struct btrfsic_block_data_ctx *block_ctx);</div><div class='del'>-static int btrfsic_process_written_superblock(</div><div class='del'>-		struct btrfsic_state *state,</div><div class='del'>-		struct btrfsic_block *const block,</div><div class='del'>-		struct btrfs_super_block *const super_hdr);</div><div class='del'>-static void btrfsic_bio_end_io(struct bio *bp);</div><div class='del'>-static int btrfsic_is_block_ref_by_superblock(const struct btrfsic_state *state,</div><div class='del'>-					      const struct btrfsic_block *block,</div><div class='del'>-					      int recursion_level);</div><div class='del'>-static int btrfsic_check_all_ref_blocks(struct btrfsic_state *state,</div><div class='del'>-					struct btrfsic_block *const block,</div><div class='del'>-					int recursion_level);</div><div class='del'>-static void btrfsic_print_add_link(const struct btrfsic_state *state,</div><div class='del'>-				   const struct btrfsic_block_link *l);</div><div class='del'>-static void btrfsic_print_rem_link(const struct btrfsic_state *state,</div><div class='del'>-				   const struct btrfsic_block_link *l);</div><div class='del'>-static char btrfsic_get_block_type(const struct btrfsic_state *state,</div><div class='del'>-				   const struct btrfsic_block *block);</div><div class='del'>-static void btrfsic_dump_tree(const struct btrfsic_state *state);</div><div class='del'>-static void btrfsic_dump_tree_sub(const struct btrfsic_state *state,</div><div class='del'>-				  const struct btrfsic_block *block,</div><div class='del'>-				  int indent_level);</div><div class='del'>-static struct btrfsic_block_link *btrfsic_block_link_lookup_or_add(</div><div class='del'>-		struct btrfsic_state *state,</div><div class='del'>-		struct btrfsic_block_data_ctx *next_block_ctx,</div><div class='del'>-		struct btrfsic_block *next_block,</div><div class='del'>-		struct btrfsic_block *from_block,</div><div class='del'>-		u64 parent_generation);</div><div class='del'>-static struct btrfsic_block *btrfsic_block_lookup_or_add(</div><div class='del'>-		struct btrfsic_state *state,</div><div class='del'>-		struct btrfsic_block_data_ctx *block_ctx,</div><div class='del'>-		const char *additional_string,</div><div class='del'>-		int is_metadata,</div><div class='del'>-		int is_iodone,</div><div class='del'>-		int never_written,</div><div class='del'>-		int mirror_num,</div><div class='del'>-		int *was_created);</div><div class='del'>-static int btrfsic_process_superblock_dev_mirror(</div><div class='del'>-		struct btrfsic_state *state,</div><div class='del'>-		struct btrfsic_dev_state *dev_state,</div><div class='del'>-		struct btrfs_device *device,</div><div class='del'>-		int superblock_mirror_num,</div><div class='del'>-		struct btrfsic_dev_state **selected_dev_state,</div><div class='del'>-		struct btrfs_super_block *selected_super);</div><div class='del'>-static struct btrfsic_dev_state *btrfsic_dev_state_lookup(dev_t dev);</div><div class='del'>-static void btrfsic_cmp_log_and_dev_bytenr(struct btrfsic_state *state,</div><div class='del'>-					   u64 bytenr,</div><div class='del'>-					   struct btrfsic_dev_state *dev_state,</div><div class='del'>-					   u64 dev_bytenr);</div><div class='del'>-</div><div class='del'>-static struct mutex btrfsic_mutex;</div><div class='del'>-static int btrfsic_is_initialized;</div><div class='del'>-static struct btrfsic_dev_state_hashtable btrfsic_dev_state_hashtable;</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-static void btrfsic_block_init(struct btrfsic_block *b)</div><div class='del'>-{</div><div class='del'>-	b-&gt;magic_num = BTRFSIC_BLOCK_MAGIC_NUMBER;</div><div class='del'>-	b-&gt;dev_state = NULL;</div><div class='del'>-	b-&gt;dev_bytenr = 0;</div><div class='del'>-	b-&gt;logical_bytenr = 0;</div><div class='del'>-	b-&gt;generation = BTRFSIC_GENERATION_UNKNOWN;</div><div class='del'>-	b-&gt;disk_key.objectid = 0;</div><div class='del'>-	b-&gt;disk_key.type = 0;</div><div class='del'>-	b-&gt;disk_key.offset = 0;</div><div class='del'>-	b-&gt;is_metadata = 0;</div><div class='del'>-	b-&gt;is_superblock = 0;</div><div class='del'>-	b-&gt;is_iodone = 0;</div><div class='del'>-	b-&gt;iodone_w_error = 0;</div><div class='del'>-	b-&gt;never_written = 0;</div><div class='del'>-	b-&gt;mirror_num = 0;</div><div class='del'>-	b-&gt;next_in_same_bio = NULL;</div><div class='del'>-	b-&gt;orig_bio_private = NULL;</div><div class='del'>-	b-&gt;orig_bio_end_io = NULL;</div><div class='del'>-	INIT_LIST_HEAD(&amp;b-&gt;collision_resolving_node);</div><div class='del'>-	INIT_LIST_HEAD(&amp;b-&gt;all_blocks_node);</div><div class='del'>-	INIT_LIST_HEAD(&amp;b-&gt;ref_to_list);</div><div class='del'>-	INIT_LIST_HEAD(&amp;b-&gt;ref_from_list);</div><div class='del'>-	b-&gt;submit_bio_bh_rw = 0;</div><div class='del'>-	b-&gt;flush_gen = 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct btrfsic_block *btrfsic_block_alloc(void)</div><div class='del'>-{</div><div class='del'>-	struct btrfsic_block *b;</div><div class='del'>-</div><div class='del'>-	b = kzalloc(sizeof(*b), GFP_NOFS);</div><div class='del'>-	if (NULL != b)</div><div class='del'>-		btrfsic_block_init(b);</div><div class='del'>-</div><div class='del'>-	return b;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfsic_block_free(struct btrfsic_block *b)</div><div class='del'>-{</div><div class='del'>-	BUG_ON(!(NULL == b || BTRFSIC_BLOCK_MAGIC_NUMBER == b-&gt;magic_num));</div><div class='del'>-	kfree(b);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfsic_block_link_init(struct btrfsic_block_link *l)</div><div class='del'>-{</div><div class='del'>-	l-&gt;magic_num = BTRFSIC_BLOCK_LINK_MAGIC_NUMBER;</div><div class='del'>-	l-&gt;ref_cnt = 1;</div><div class='del'>-	INIT_LIST_HEAD(&amp;l-&gt;node_ref_to);</div><div class='del'>-	INIT_LIST_HEAD(&amp;l-&gt;node_ref_from);</div><div class='del'>-	INIT_LIST_HEAD(&amp;l-&gt;collision_resolving_node);</div><div class='del'>-	l-&gt;block_ref_to = NULL;</div><div class='del'>-	l-&gt;block_ref_from = NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct btrfsic_block_link *btrfsic_block_link_alloc(void)</div><div class='del'>-{</div><div class='del'>-	struct btrfsic_block_link *l;</div><div class='del'>-</div><div class='del'>-	l = kzalloc(sizeof(*l), GFP_NOFS);</div><div class='del'>-	if (NULL != l)</div><div class='del'>-		btrfsic_block_link_init(l);</div><div class='del'>-</div><div class='del'>-	return l;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfsic_block_link_free(struct btrfsic_block_link *l)</div><div class='del'>-{</div><div class='del'>-	BUG_ON(!(NULL == l || BTRFSIC_BLOCK_LINK_MAGIC_NUMBER == l-&gt;magic_num));</div><div class='del'>-	kfree(l);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfsic_dev_state_init(struct btrfsic_dev_state *ds)</div><div class='del'>-{</div><div class='del'>-	ds-&gt;magic_num = BTRFSIC_DEV2STATE_MAGIC_NUMBER;</div><div class='del'>-	ds-&gt;bdev = NULL;</div><div class='del'>-	ds-&gt;state = NULL;</div><div class='del'>-	INIT_LIST_HEAD(&amp;ds-&gt;collision_resolving_node);</div><div class='del'>-	ds-&gt;last_flush_gen = 0;</div><div class='del'>-	btrfsic_block_init(&amp;ds-&gt;dummy_block_for_bio_bh_flush);</div><div class='del'>-	ds-&gt;dummy_block_for_bio_bh_flush.is_iodone = 1;</div><div class='del'>-	ds-&gt;dummy_block_for_bio_bh_flush.dev_state = ds;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct btrfsic_dev_state *btrfsic_dev_state_alloc(void)</div><div class='del'>-{</div><div class='del'>-	struct btrfsic_dev_state *ds;</div><div class='del'>-</div><div class='del'>-	ds = kzalloc(sizeof(*ds), GFP_NOFS);</div><div class='del'>-	if (NULL != ds)</div><div class='del'>-		btrfsic_dev_state_init(ds);</div><div class='del'>-</div><div class='del'>-	return ds;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfsic_dev_state_free(struct btrfsic_dev_state *ds)</div><div class='del'>-{</div><div class='del'>-	BUG_ON(!(NULL == ds ||</div><div class='del'>-		 BTRFSIC_DEV2STATE_MAGIC_NUMBER == ds-&gt;magic_num));</div><div class='del'>-	kfree(ds);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfsic_block_hashtable_init(struct btrfsic_block_hashtable *h)</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; BTRFSIC_BLOCK_HASHTABLE_SIZE; i++)</div><div class='del'>-		INIT_LIST_HEAD(h-&gt;table + i);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfsic_block_hashtable_add(struct btrfsic_block *b,</div><div class='del'>-					struct btrfsic_block_hashtable *h)</div><div class='del'>-{</div><div class='del'>-	const unsigned int hashval =</div><div class='del'>-	    (((unsigned int)(b-&gt;dev_bytenr &gt;&gt; 16)) ^</div><div class='del'>-	     ((unsigned int)((uintptr_t)b-&gt;dev_state-&gt;bdev))) &amp;</div><div class='del'>-	     (BTRFSIC_BLOCK_HASHTABLE_SIZE - 1);</div><div class='del'>-</div><div class='del'>-	list_add(&amp;b-&gt;collision_resolving_node, h-&gt;table + hashval);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfsic_block_hashtable_remove(struct btrfsic_block *b)</div><div class='del'>-{</div><div class='del'>-	list_del(&amp;b-&gt;collision_resolving_node);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct btrfsic_block *btrfsic_block_hashtable_lookup(</div><div class='del'>-		struct block_device *bdev,</div><div class='del'>-		u64 dev_bytenr,</div><div class='del'>-		struct btrfsic_block_hashtable *h)</div><div class='del'>-{</div><div class='del'>-	const unsigned int hashval =</div><div class='del'>-	    (((unsigned int)(dev_bytenr &gt;&gt; 16)) ^</div><div class='del'>-	     ((unsigned int)((uintptr_t)bdev))) &amp;</div><div class='del'>-	     (BTRFSIC_BLOCK_HASHTABLE_SIZE - 1);</div><div class='del'>-	struct btrfsic_block *b;</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(b, h-&gt;table + hashval, collision_resolving_node) {</div><div class='del'>-		if (b-&gt;dev_state-&gt;bdev == bdev &amp;&amp; b-&gt;dev_bytenr == dev_bytenr)</div><div class='del'>-			return b;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfsic_block_link_hashtable_init(</div><div class='del'>-		struct btrfsic_block_link_hashtable *h)</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; BTRFSIC_BLOCK_LINK_HASHTABLE_SIZE; i++)</div><div class='del'>-		INIT_LIST_HEAD(h-&gt;table + i);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfsic_block_link_hashtable_add(</div><div class='del'>-		struct btrfsic_block_link *l,</div><div class='del'>-		struct btrfsic_block_link_hashtable *h)</div><div class='del'>-{</div><div class='del'>-	const unsigned int hashval =</div><div class='del'>-	    (((unsigned int)(l-&gt;block_ref_to-&gt;dev_bytenr &gt;&gt; 16)) ^</div><div class='del'>-	     ((unsigned int)(l-&gt;block_ref_from-&gt;dev_bytenr &gt;&gt; 16)) ^</div><div class='del'>-	     ((unsigned int)((uintptr_t)l-&gt;block_ref_to-&gt;dev_state-&gt;bdev)) ^</div><div class='del'>-	     ((unsigned int)((uintptr_t)l-&gt;block_ref_from-&gt;dev_state-&gt;bdev)))</div><div class='del'>-	     &amp; (BTRFSIC_BLOCK_LINK_HASHTABLE_SIZE - 1);</div><div class='del'>-</div><div class='del'>-	BUG_ON(NULL == l-&gt;block_ref_to);</div><div class='del'>-	BUG_ON(NULL == l-&gt;block_ref_from);</div><div class='del'>-	list_add(&amp;l-&gt;collision_resolving_node, h-&gt;table + hashval);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfsic_block_link_hashtable_remove(struct btrfsic_block_link *l)</div><div class='del'>-{</div><div class='del'>-	list_del(&amp;l-&gt;collision_resolving_node);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct btrfsic_block_link *btrfsic_block_link_hashtable_lookup(</div><div class='del'>-		struct block_device *bdev_ref_to,</div><div class='del'>-		u64 dev_bytenr_ref_to,</div><div class='del'>-		struct block_device *bdev_ref_from,</div><div class='del'>-		u64 dev_bytenr_ref_from,</div><div class='del'>-		struct btrfsic_block_link_hashtable *h)</div><div class='del'>-{</div><div class='del'>-	const unsigned int hashval =</div><div class='del'>-	    (((unsigned int)(dev_bytenr_ref_to &gt;&gt; 16)) ^</div><div class='del'>-	     ((unsigned int)(dev_bytenr_ref_from &gt;&gt; 16)) ^</div><div class='del'>-	     ((unsigned int)((uintptr_t)bdev_ref_to)) ^</div><div class='del'>-	     ((unsigned int)((uintptr_t)bdev_ref_from))) &amp;</div><div class='del'>-	     (BTRFSIC_BLOCK_LINK_HASHTABLE_SIZE - 1);</div><div class='del'>-	struct btrfsic_block_link *l;</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(l, h-&gt;table + hashval, collision_resolving_node) {</div><div class='del'>-		BUG_ON(NULL == l-&gt;block_ref_to);</div><div class='del'>-		BUG_ON(NULL == l-&gt;block_ref_from);</div><div class='del'>-		if (l-&gt;block_ref_to-&gt;dev_state-&gt;bdev == bdev_ref_to &amp;&amp;</div><div class='del'>-		    l-&gt;block_ref_to-&gt;dev_bytenr == dev_bytenr_ref_to &amp;&amp;</div><div class='del'>-		    l-&gt;block_ref_from-&gt;dev_state-&gt;bdev == bdev_ref_from &amp;&amp;</div><div class='del'>-		    l-&gt;block_ref_from-&gt;dev_bytenr == dev_bytenr_ref_from)</div><div class='del'>-			return l;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfsic_dev_state_hashtable_init(</div><div class='del'>-		struct btrfsic_dev_state_hashtable *h)</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; BTRFSIC_DEV2STATE_HASHTABLE_SIZE; i++)</div><div class='del'>-		INIT_LIST_HEAD(h-&gt;table + i);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfsic_dev_state_hashtable_add(</div><div class='del'>-		struct btrfsic_dev_state *ds,</div><div class='del'>-		struct btrfsic_dev_state_hashtable *h)</div><div class='del'>-{</div><div class='del'>-	const unsigned int hashval =</div><div class='del'>-	    (((unsigned int)((uintptr_t)ds-&gt;bdev-&gt;bd_dev)) &amp;</div><div class='del'>-	     (BTRFSIC_DEV2STATE_HASHTABLE_SIZE - 1));</div><div class='del'>-</div><div class='del'>-	list_add(&amp;ds-&gt;collision_resolving_node, h-&gt;table + hashval);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfsic_dev_state_hashtable_remove(struct btrfsic_dev_state *ds)</div><div class='del'>-{</div><div class='del'>-	list_del(&amp;ds-&gt;collision_resolving_node);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct btrfsic_dev_state *btrfsic_dev_state_hashtable_lookup(dev_t dev,</div><div class='del'>-		struct btrfsic_dev_state_hashtable *h)</div><div class='del'>-{</div><div class='del'>-	const unsigned int hashval =</div><div class='del'>-		dev &amp; (BTRFSIC_DEV2STATE_HASHTABLE_SIZE - 1);</div><div class='del'>-	struct btrfsic_dev_state *ds;</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(ds, h-&gt;table + hashval, collision_resolving_node) {</div><div class='del'>-		if (ds-&gt;bdev-&gt;bd_dev == dev)</div><div class='del'>-			return ds;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int btrfsic_process_superblock(struct btrfsic_state *state,</div><div class='del'>-				      struct btrfs_fs_devices *fs_devices)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_super_block *selected_super;</div><div class='del'>-	struct list_head *dev_head = &amp;fs_devices-&gt;devices;</div><div class='del'>-	struct btrfs_device *device;</div><div class='del'>-	struct btrfsic_dev_state *selected_dev_state = NULL;</div><div class='del'>-	int ret = 0;</div><div class='del'>-	int pass;</div><div class='del'>-</div><div class='del'>-	selected_super = kzalloc(sizeof(*selected_super), GFP_NOFS);</div><div class='del'>-	if (!selected_super)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(device, dev_head, dev_list) {</div><div class='del'>-		int i;</div><div class='del'>-		struct btrfsic_dev_state *dev_state;</div><div class='del'>-</div><div class='del'>-		if (!device-&gt;bdev || !device-&gt;name)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		dev_state = btrfsic_dev_state_lookup(device-&gt;bdev-&gt;bd_dev);</div><div class='del'>-		BUG_ON(NULL == dev_state);</div><div class='del'>-		for (i = 0; i &lt; BTRFS_SUPER_MIRROR_MAX; i++) {</div><div class='del'>-			ret = btrfsic_process_superblock_dev_mirror(</div><div class='del'>-					state, dev_state, device, i,</div><div class='del'>-					&amp;selected_dev_state, selected_super);</div><div class='del'>-			if (0 != ret &amp;&amp; 0 == i) {</div><div class='del'>-				kfree(selected_super);</div><div class='del'>-				return ret;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (NULL == state-&gt;latest_superblock) {</div><div class='del'>-		pr_info("btrfsic: no superblock found!\n");</div><div class='del'>-		kfree(selected_super);</div><div class='del'>-		return -1;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	for (pass = 0; pass &lt; 3; pass++) {</div><div class='del'>-		int num_copies;</div><div class='del'>-		int mirror_num;</div><div class='del'>-		u64 next_bytenr;</div><div class='del'>-</div><div class='del'>-		switch (pass) {</div><div class='del'>-		case 0:</div><div class='del'>-			next_bytenr = btrfs_super_root(selected_super);</div><div class='del'>-			if (state-&gt;print_mask &amp;</div><div class='del'>-			    BTRFSIC_PRINT_MASK_ROOT_CHUNK_LOG_TREE_LOCATION)</div><div class='del'>-				pr_info("root@%llu\n", next_bytenr);</div><div class='del'>-			break;</div><div class='del'>-		case 1:</div><div class='del'>-			next_bytenr = btrfs_super_chunk_root(selected_super);</div><div class='del'>-			if (state-&gt;print_mask &amp;</div><div class='del'>-			    BTRFSIC_PRINT_MASK_ROOT_CHUNK_LOG_TREE_LOCATION)</div><div class='del'>-				pr_info("chunk@%llu\n", next_bytenr);</div><div class='del'>-			break;</div><div class='del'>-		case 2:</div><div class='del'>-			next_bytenr = btrfs_super_log_root(selected_super);</div><div class='del'>-			if (0 == next_bytenr)</div><div class='del'>-				continue;</div><div class='del'>-			if (state-&gt;print_mask &amp;</div><div class='del'>-			    BTRFSIC_PRINT_MASK_ROOT_CHUNK_LOG_TREE_LOCATION)</div><div class='del'>-				pr_info("log@%llu\n", next_bytenr);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		num_copies = btrfs_num_copies(state-&gt;fs_info, next_bytenr,</div><div class='del'>-					      state-&gt;metablock_size);</div><div class='del'>-		if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_NUM_COPIES)</div><div class='del'>-			pr_info("num_copies(log_bytenr=%llu) = %d\n",</div><div class='del'>-			       next_bytenr, num_copies);</div><div class='del'>-</div><div class='del'>-		for (mirror_num = 1; mirror_num &lt;= num_copies; mirror_num++) {</div><div class='del'>-			struct btrfsic_block *next_block;</div><div class='del'>-			struct btrfsic_block_data_ctx tmp_next_block_ctx;</div><div class='del'>-			struct btrfsic_block_link *l;</div><div class='del'>-</div><div class='del'>-			ret = btrfsic_map_block(state, next_bytenr,</div><div class='del'>-						state-&gt;metablock_size,</div><div class='del'>-						&amp;tmp_next_block_ctx,</div><div class='del'>-						mirror_num);</div><div class='del'>-			if (ret) {</div><div class='del'>-				pr_info("btrfsic: btrfsic_map_block(root @%llu, mirror %d) failed!\n",</div><div class='del'>-				       next_bytenr, mirror_num);</div><div class='del'>-				kfree(selected_super);</div><div class='del'>-				return -1;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			next_block = btrfsic_block_hashtable_lookup(</div><div class='del'>-					tmp_next_block_ctx.dev-&gt;bdev,</div><div class='del'>-					tmp_next_block_ctx.dev_bytenr,</div><div class='del'>-					&amp;state-&gt;block_hashtable);</div><div class='del'>-			BUG_ON(NULL == next_block);</div><div class='del'>-</div><div class='del'>-			l = btrfsic_block_link_hashtable_lookup(</div><div class='del'>-					tmp_next_block_ctx.dev-&gt;bdev,</div><div class='del'>-					tmp_next_block_ctx.dev_bytenr,</div><div class='del'>-					state-&gt;latest_superblock-&gt;dev_state-&gt;</div><div class='del'>-					bdev,</div><div class='del'>-					state-&gt;latest_superblock-&gt;dev_bytenr,</div><div class='del'>-					&amp;state-&gt;block_link_hashtable);</div><div class='del'>-			BUG_ON(NULL == l);</div><div class='del'>-</div><div class='del'>-			ret = btrfsic_read_block(state, &amp;tmp_next_block_ctx);</div><div class='del'>-			if (ret &lt; (int)PAGE_SIZE) {</div><div class='del'>-				pr_info("btrfsic: read @logical %llu failed!\n",</div><div class='del'>-				       tmp_next_block_ctx.start);</div><div class='del'>-				btrfsic_release_block_ctx(&amp;tmp_next_block_ctx);</div><div class='del'>-				kfree(selected_super);</div><div class='del'>-				return -1;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			ret = btrfsic_process_metablock(state,</div><div class='del'>-							next_block,</div><div class='del'>-							&amp;tmp_next_block_ctx,</div><div class='del'>-							BTRFS_MAX_LEVEL + 3, 1);</div><div class='del'>-			btrfsic_release_block_ctx(&amp;tmp_next_block_ctx);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	kfree(selected_super);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int btrfsic_process_superblock_dev_mirror(</div><div class='del'>-		struct btrfsic_state *state,</div><div class='del'>-		struct btrfsic_dev_state *dev_state,</div><div class='del'>-		struct btrfs_device *device,</div><div class='del'>-		int superblock_mirror_num,</div><div class='del'>-		struct btrfsic_dev_state **selected_dev_state,</div><div class='del'>-		struct btrfs_super_block *selected_super)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = state-&gt;fs_info;</div><div class='del'>-	struct btrfs_super_block *super_tmp;</div><div class='del'>-	u64 dev_bytenr;</div><div class='del'>-	struct btrfsic_block *superblock_tmp;</div><div class='del'>-	int pass;</div><div class='del'>-	struct block_device *const superblock_bdev = device-&gt;bdev;</div><div class='del'>-	struct page *page;</div><div class='del'>-	struct address_space *mapping = superblock_bdev-&gt;bd_inode-&gt;i_mapping;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	/* super block bytenr is always the unmapped device bytenr */</div><div class='del'>-	dev_bytenr = btrfs_sb_offset(superblock_mirror_num);</div><div class='del'>-	if (dev_bytenr + BTRFS_SUPER_INFO_SIZE &gt; device-&gt;commit_total_bytes)</div><div class='del'>-		return -1;</div><div class='del'>-</div><div class='del'>-	page = read_cache_page_gfp(mapping, dev_bytenr &gt;&gt; PAGE_SHIFT, GFP_NOFS);</div><div class='del'>-	if (IS_ERR(page))</div><div class='del'>-		return -1;</div><div class='del'>-</div><div class='del'>-	super_tmp = page_address(page);</div><div class='del'>-</div><div class='del'>-	if (btrfs_super_bytenr(super_tmp) != dev_bytenr ||</div><div class='del'>-	    btrfs_super_magic(super_tmp) != BTRFS_MAGIC ||</div><div class='del'>-	    memcmp(device-&gt;uuid, super_tmp-&gt;dev_item.uuid, BTRFS_UUID_SIZE) ||</div><div class='del'>-	    btrfs_super_nodesize(super_tmp) != state-&gt;metablock_size ||</div><div class='del'>-	    btrfs_super_sectorsize(super_tmp) != state-&gt;datablock_size) {</div><div class='del'>-		ret = 0;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	superblock_tmp =</div><div class='del'>-	    btrfsic_block_hashtable_lookup(superblock_bdev,</div><div class='del'>-					   dev_bytenr,</div><div class='del'>-					   &amp;state-&gt;block_hashtable);</div><div class='del'>-	if (NULL == superblock_tmp) {</div><div class='del'>-		superblock_tmp = btrfsic_block_alloc();</div><div class='del'>-		if (NULL == superblock_tmp) {</div><div class='del'>-			ret = -1;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		/* for superblock, only the dev_bytenr makes sense */</div><div class='del'>-		superblock_tmp-&gt;dev_bytenr = dev_bytenr;</div><div class='del'>-		superblock_tmp-&gt;dev_state = dev_state;</div><div class='del'>-		superblock_tmp-&gt;logical_bytenr = dev_bytenr;</div><div class='del'>-		superblock_tmp-&gt;generation = btrfs_super_generation(super_tmp);</div><div class='del'>-		superblock_tmp-&gt;is_metadata = 1;</div><div class='del'>-		superblock_tmp-&gt;is_superblock = 1;</div><div class='del'>-		superblock_tmp-&gt;is_iodone = 1;</div><div class='del'>-		superblock_tmp-&gt;never_written = 0;</div><div class='del'>-		superblock_tmp-&gt;mirror_num = 1 + superblock_mirror_num;</div><div class='del'>-		if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_SUPERBLOCK_WRITE)</div><div class='del'>-			btrfs_info_in_rcu(fs_info,</div><div class='del'>-			"new initial S-block (bdev %p, %s) @%llu (%pg/%llu/%d)",</div><div class='del'>-				     superblock_bdev,</div><div class='del'>-				     rcu_str_deref(device-&gt;name), dev_bytenr,</div><div class='del'>-				     dev_state-&gt;bdev, dev_bytenr,</div><div class='del'>-				     superblock_mirror_num);</div><div class='del'>-		list_add(&amp;superblock_tmp-&gt;all_blocks_node,</div><div class='del'>-			 &amp;state-&gt;all_blocks_list);</div><div class='del'>-		btrfsic_block_hashtable_add(superblock_tmp,</div><div class='del'>-					    &amp;state-&gt;block_hashtable);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* select the one with the highest generation field */</div><div class='del'>-	if (btrfs_super_generation(super_tmp) &gt;</div><div class='del'>-	    state-&gt;max_superblock_generation ||</div><div class='del'>-	    0 == state-&gt;max_superblock_generation) {</div><div class='del'>-		memcpy(selected_super, super_tmp, sizeof(*selected_super));</div><div class='del'>-		*selected_dev_state = dev_state;</div><div class='del'>-		state-&gt;max_superblock_generation =</div><div class='del'>-		    btrfs_super_generation(super_tmp);</div><div class='del'>-		state-&gt;latest_superblock = superblock_tmp;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	for (pass = 0; pass &lt; 3; pass++) {</div><div class='del'>-		u64 next_bytenr;</div><div class='del'>-		int num_copies;</div><div class='del'>-		int mirror_num;</div><div class='del'>-		const char *additional_string = NULL;</div><div class='del'>-		struct btrfs_disk_key tmp_disk_key;</div><div class='del'>-</div><div class='del'>-		tmp_disk_key.type = BTRFS_ROOT_ITEM_KEY;</div><div class='del'>-		tmp_disk_key.offset = 0;</div><div class='del'>-		switch (pass) {</div><div class='del'>-		case 0:</div><div class='del'>-			btrfs_set_disk_key_objectid(&amp;tmp_disk_key,</div><div class='del'>-						    BTRFS_ROOT_TREE_OBJECTID);</div><div class='del'>-			additional_string = "initial root ";</div><div class='del'>-			next_bytenr = btrfs_super_root(super_tmp);</div><div class='del'>-			break;</div><div class='del'>-		case 1:</div><div class='del'>-			btrfs_set_disk_key_objectid(&amp;tmp_disk_key,</div><div class='del'>-						    BTRFS_CHUNK_TREE_OBJECTID);</div><div class='del'>-			additional_string = "initial chunk ";</div><div class='del'>-			next_bytenr = btrfs_super_chunk_root(super_tmp);</div><div class='del'>-			break;</div><div class='del'>-		case 2:</div><div class='del'>-			btrfs_set_disk_key_objectid(&amp;tmp_disk_key,</div><div class='del'>-						    BTRFS_TREE_LOG_OBJECTID);</div><div class='del'>-			additional_string = "initial log ";</div><div class='del'>-			next_bytenr = btrfs_super_log_root(super_tmp);</div><div class='del'>-			if (0 == next_bytenr)</div><div class='del'>-				continue;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		num_copies = btrfs_num_copies(fs_info, next_bytenr,</div><div class='del'>-					      state-&gt;metablock_size);</div><div class='del'>-		if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_NUM_COPIES)</div><div class='del'>-			pr_info("num_copies(log_bytenr=%llu) = %d\n",</div><div class='del'>-			       next_bytenr, num_copies);</div><div class='del'>-		for (mirror_num = 1; mirror_num &lt;= num_copies; mirror_num++) {</div><div class='del'>-			struct btrfsic_block *next_block;</div><div class='del'>-			struct btrfsic_block_data_ctx tmp_next_block_ctx;</div><div class='del'>-			struct btrfsic_block_link *l;</div><div class='del'>-</div><div class='del'>-			if (btrfsic_map_block(state, next_bytenr,</div><div class='del'>-					      state-&gt;metablock_size,</div><div class='del'>-					      &amp;tmp_next_block_ctx,</div><div class='del'>-					      mirror_num)) {</div><div class='del'>-				pr_info("btrfsic: btrfsic_map_block(bytenr @%llu, mirror %d) failed!\n",</div><div class='del'>-				       next_bytenr, mirror_num);</div><div class='del'>-				ret = -1;</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			next_block = btrfsic_block_lookup_or_add(</div><div class='del'>-					state, &amp;tmp_next_block_ctx,</div><div class='del'>-					additional_string, 1, 1, 0,</div><div class='del'>-					mirror_num, NULL);</div><div class='del'>-			if (NULL == next_block) {</div><div class='del'>-				btrfsic_release_block_ctx(&amp;tmp_next_block_ctx);</div><div class='del'>-				ret = -1;</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			next_block-&gt;disk_key = tmp_disk_key;</div><div class='del'>-			next_block-&gt;generation = BTRFSIC_GENERATION_UNKNOWN;</div><div class='del'>-			l = btrfsic_block_link_lookup_or_add(</div><div class='del'>-					state, &amp;tmp_next_block_ctx,</div><div class='del'>-					next_block, superblock_tmp,</div><div class='del'>-					BTRFSIC_GENERATION_UNKNOWN);</div><div class='del'>-			btrfsic_release_block_ctx(&amp;tmp_next_block_ctx);</div><div class='del'>-			if (NULL == l) {</div><div class='del'>-				ret = -1;</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_INITIAL_ALL_TREES)</div><div class='del'>-		btrfsic_dump_tree_sub(state, superblock_tmp, 0);</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	put_page(page);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct btrfsic_stack_frame *btrfsic_stack_frame_alloc(void)</div><div class='del'>-{</div><div class='del'>-	struct btrfsic_stack_frame *sf;</div><div class='del'>-</div><div class='del'>-	sf = kzalloc(sizeof(*sf), GFP_NOFS);</div><div class='del'>-	if (sf)</div><div class='del'>-		sf-&gt;magic = BTRFSIC_BLOCK_STACK_FRAME_MAGIC_NUMBER;</div><div class='del'>-	return sf;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfsic_stack_frame_free(struct btrfsic_stack_frame *sf)</div><div class='del'>-{</div><div class='del'>-	BUG_ON(!(NULL == sf ||</div><div class='del'>-		 BTRFSIC_BLOCK_STACK_FRAME_MAGIC_NUMBER == sf-&gt;magic));</div><div class='del'>-	kfree(sf);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static noinline_for_stack int btrfsic_process_metablock(</div><div class='del'>-		struct btrfsic_state *state,</div><div class='del'>-		struct btrfsic_block *const first_block,</div><div class='del'>-		struct btrfsic_block_data_ctx *const first_block_ctx,</div><div class='del'>-		int first_limit_nesting, int force_iodone_flag)</div><div class='del'>-{</div><div class='del'>-	struct btrfsic_stack_frame initial_stack_frame = { 0 };</div><div class='del'>-	struct btrfsic_stack_frame *sf;</div><div class='del'>-	struct btrfsic_stack_frame *next_stack;</div><div class='del'>-	struct btrfs_header *const first_hdr =</div><div class='del'>-		(struct btrfs_header *)first_block_ctx-&gt;datav[0];</div><div class='del'>-</div><div class='del'>-	BUG_ON(!first_hdr);</div><div class='del'>-	sf = &amp;initial_stack_frame;</div><div class='del'>-	sf-&gt;error = 0;</div><div class='del'>-	sf-&gt;i = -1;</div><div class='del'>-	sf-&gt;limit_nesting = first_limit_nesting;</div><div class='del'>-	sf-&gt;block = first_block;</div><div class='del'>-	sf-&gt;block_ctx = first_block_ctx;</div><div class='del'>-	sf-&gt;next_block = NULL;</div><div class='del'>-	sf-&gt;hdr = first_hdr;</div><div class='del'>-	sf-&gt;prev = NULL;</div><div class='del'>-</div><div class='del'>-continue_with_new_stack_frame:</div><div class='del'>-	sf-&gt;block-&gt;generation = btrfs_stack_header_generation(sf-&gt;hdr);</div><div class='del'>-	if (0 == sf-&gt;hdr-&gt;level) {</div><div class='del'>-		struct btrfs_leaf *const leafhdr =</div><div class='del'>-		    (struct btrfs_leaf *)sf-&gt;hdr;</div><div class='del'>-</div><div class='del'>-		if (-1 == sf-&gt;i) {</div><div class='del'>-			sf-&gt;nr = btrfs_stack_header_nritems(&amp;leafhdr-&gt;header);</div><div class='del'>-</div><div class='del'>-			if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_VERBOSE)</div><div class='del'>-				pr_info("leaf %llu items %d generation %llu owner %llu\n",</div><div class='del'>-				       sf-&gt;block_ctx-&gt;start, sf-&gt;nr,</div><div class='del'>-				       btrfs_stack_header_generation(</div><div class='del'>-					       &amp;leafhdr-&gt;header),</div><div class='del'>-				       btrfs_stack_header_owner(</div><div class='del'>-					       &amp;leafhdr-&gt;header));</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-continue_with_current_leaf_stack_frame:</div><div class='del'>-		if (0 == sf-&gt;num_copies || sf-&gt;mirror_num &gt; sf-&gt;num_copies) {</div><div class='del'>-			sf-&gt;i++;</div><div class='del'>-			sf-&gt;num_copies = 0;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (sf-&gt;i &lt; sf-&gt;nr) {</div><div class='del'>-			struct btrfs_item disk_item;</div><div class='del'>-			u32 disk_item_offset =</div><div class='del'>-				(uintptr_t)(leafhdr-&gt;items + sf-&gt;i) -</div><div class='del'>-				(uintptr_t)leafhdr;</div><div class='del'>-			struct btrfs_disk_key *disk_key;</div><div class='del'>-			u8 type;</div><div class='del'>-			u32 item_offset;</div><div class='del'>-			u32 item_size;</div><div class='del'>-</div><div class='del'>-			if (disk_item_offset + sizeof(struct btrfs_item) &gt;</div><div class='del'>-			    sf-&gt;block_ctx-&gt;len) {</div><div class='del'>-leaf_item_out_of_bounce_error:</div><div class='del'>-				pr_info(</div><div class='del'>-		"btrfsic: leaf item out of bounce at logical %llu, dev %pg\n",</div><div class='del'>-				       sf-&gt;block_ctx-&gt;start,</div><div class='del'>-				       sf-&gt;block_ctx-&gt;dev-&gt;bdev);</div><div class='del'>-				goto one_stack_frame_backwards;</div><div class='del'>-			}</div><div class='del'>-			btrfsic_read_from_block_data(sf-&gt;block_ctx,</div><div class='del'>-						     &amp;disk_item,</div><div class='del'>-						     disk_item_offset,</div><div class='del'>-						     sizeof(struct btrfs_item));</div><div class='del'>-			item_offset = btrfs_stack_item_offset(&amp;disk_item);</div><div class='del'>-			item_size = btrfs_stack_item_size(&amp;disk_item);</div><div class='del'>-			disk_key = &amp;disk_item.key;</div><div class='del'>-			type = btrfs_disk_key_type(disk_key);</div><div class='del'>-</div><div class='del'>-			if (BTRFS_ROOT_ITEM_KEY == type) {</div><div class='del'>-				struct btrfs_root_item root_item;</div><div class='del'>-				u32 root_item_offset;</div><div class='del'>-				u64 next_bytenr;</div><div class='del'>-</div><div class='del'>-				root_item_offset = item_offset +</div><div class='del'>-					offsetof(struct btrfs_leaf, items);</div><div class='del'>-				if (root_item_offset + item_size &gt;</div><div class='del'>-				    sf-&gt;block_ctx-&gt;len)</div><div class='del'>-					goto leaf_item_out_of_bounce_error;</div><div class='del'>-				btrfsic_read_from_block_data(</div><div class='del'>-					sf-&gt;block_ctx, &amp;root_item,</div><div class='del'>-					root_item_offset,</div><div class='del'>-					item_size);</div><div class='del'>-				next_bytenr = btrfs_root_bytenr(&amp;root_item);</div><div class='del'>-</div><div class='del'>-				sf-&gt;error =</div><div class='del'>-				    btrfsic_create_link_to_next_block(</div><div class='del'>-						state,</div><div class='del'>-						sf-&gt;block,</div><div class='del'>-						sf-&gt;block_ctx,</div><div class='del'>-						next_bytenr,</div><div class='del'>-						sf-&gt;limit_nesting,</div><div class='del'>-						&amp;sf-&gt;next_block_ctx,</div><div class='del'>-						&amp;sf-&gt;next_block,</div><div class='del'>-						force_iodone_flag,</div><div class='del'>-						&amp;sf-&gt;num_copies,</div><div class='del'>-						&amp;sf-&gt;mirror_num,</div><div class='del'>-						disk_key,</div><div class='del'>-						btrfs_root_generation(</div><div class='del'>-						&amp;root_item));</div><div class='del'>-				if (sf-&gt;error)</div><div class='del'>-					goto one_stack_frame_backwards;</div><div class='del'>-</div><div class='del'>-				if (NULL != sf-&gt;next_block) {</div><div class='del'>-					struct btrfs_header *const next_hdr =</div><div class='del'>-					    (struct btrfs_header *)</div><div class='del'>-					    sf-&gt;next_block_ctx.datav[0];</div><div class='del'>-</div><div class='del'>-					next_stack =</div><div class='del'>-					    btrfsic_stack_frame_alloc();</div><div class='del'>-					if (NULL == next_stack) {</div><div class='del'>-						sf-&gt;error = -1;</div><div class='del'>-						btrfsic_release_block_ctx(</div><div class='del'>-								&amp;sf-&gt;</div><div class='del'>-								next_block_ctx);</div><div class='del'>-						goto one_stack_frame_backwards;</div><div class='del'>-					}</div><div class='del'>-</div><div class='del'>-					next_stack-&gt;i = -1;</div><div class='del'>-					next_stack-&gt;block = sf-&gt;next_block;</div><div class='del'>-					next_stack-&gt;block_ctx =</div><div class='del'>-					    &amp;sf-&gt;next_block_ctx;</div><div class='del'>-					next_stack-&gt;next_block = NULL;</div><div class='del'>-					next_stack-&gt;hdr = next_hdr;</div><div class='del'>-					next_stack-&gt;limit_nesting =</div><div class='del'>-					    sf-&gt;limit_nesting - 1;</div><div class='del'>-					next_stack-&gt;prev = sf;</div><div class='del'>-					sf = next_stack;</div><div class='del'>-					goto continue_with_new_stack_frame;</div><div class='del'>-				}</div><div class='del'>-			} else if (BTRFS_EXTENT_DATA_KEY == type &amp;&amp;</div><div class='del'>-				   state-&gt;include_extent_data) {</div><div class='del'>-				sf-&gt;error = btrfsic_handle_extent_data(</div><div class='del'>-						state,</div><div class='del'>-						sf-&gt;block,</div><div class='del'>-						sf-&gt;block_ctx,</div><div class='del'>-						item_offset,</div><div class='del'>-						force_iodone_flag);</div><div class='del'>-				if (sf-&gt;error)</div><div class='del'>-					goto one_stack_frame_backwards;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			goto continue_with_current_leaf_stack_frame;</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-		struct btrfs_node *const nodehdr = (struct btrfs_node *)sf-&gt;hdr;</div><div class='del'>-</div><div class='del'>-		if (-1 == sf-&gt;i) {</div><div class='del'>-			sf-&gt;nr = btrfs_stack_header_nritems(&amp;nodehdr-&gt;header);</div><div class='del'>-</div><div class='del'>-			if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_VERBOSE)</div><div class='del'>-				pr_info("node %llu level %d items %d generation %llu owner %llu\n",</div><div class='del'>-				       sf-&gt;block_ctx-&gt;start,</div><div class='del'>-				       nodehdr-&gt;header.level, sf-&gt;nr,</div><div class='del'>-				       btrfs_stack_header_generation(</div><div class='del'>-				       &amp;nodehdr-&gt;header),</div><div class='del'>-				       btrfs_stack_header_owner(</div><div class='del'>-				       &amp;nodehdr-&gt;header));</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-continue_with_current_node_stack_frame:</div><div class='del'>-		if (0 == sf-&gt;num_copies || sf-&gt;mirror_num &gt; sf-&gt;num_copies) {</div><div class='del'>-			sf-&gt;i++;</div><div class='del'>-			sf-&gt;num_copies = 0;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (sf-&gt;i &lt; sf-&gt;nr) {</div><div class='del'>-			struct btrfs_key_ptr key_ptr;</div><div class='del'>-			u32 key_ptr_offset;</div><div class='del'>-			u64 next_bytenr;</div><div class='del'>-</div><div class='del'>-			key_ptr_offset = (uintptr_t)(nodehdr-&gt;ptrs + sf-&gt;i) -</div><div class='del'>-					  (uintptr_t)nodehdr;</div><div class='del'>-			if (key_ptr_offset + sizeof(struct btrfs_key_ptr) &gt;</div><div class='del'>-			    sf-&gt;block_ctx-&gt;len) {</div><div class='del'>-				pr_info(</div><div class='del'>-		"btrfsic: node item out of bounce at logical %llu, dev %pg\n",</div><div class='del'>-				       sf-&gt;block_ctx-&gt;start,</div><div class='del'>-				       sf-&gt;block_ctx-&gt;dev-&gt;bdev);</div><div class='del'>-				goto one_stack_frame_backwards;</div><div class='del'>-			}</div><div class='del'>-			btrfsic_read_from_block_data(</div><div class='del'>-				sf-&gt;block_ctx, &amp;key_ptr, key_ptr_offset,</div><div class='del'>-				sizeof(struct btrfs_key_ptr));</div><div class='del'>-			next_bytenr = btrfs_stack_key_blockptr(&amp;key_ptr);</div><div class='del'>-</div><div class='del'>-			sf-&gt;error = btrfsic_create_link_to_next_block(</div><div class='del'>-					state,</div><div class='del'>-					sf-&gt;block,</div><div class='del'>-					sf-&gt;block_ctx,</div><div class='del'>-					next_bytenr,</div><div class='del'>-					sf-&gt;limit_nesting,</div><div class='del'>-					&amp;sf-&gt;next_block_ctx,</div><div class='del'>-					&amp;sf-&gt;next_block,</div><div class='del'>-					force_iodone_flag,</div><div class='del'>-					&amp;sf-&gt;num_copies,</div><div class='del'>-					&amp;sf-&gt;mirror_num,</div><div class='del'>-					&amp;key_ptr.key,</div><div class='del'>-					btrfs_stack_key_generation(&amp;key_ptr));</div><div class='del'>-			if (sf-&gt;error)</div><div class='del'>-				goto one_stack_frame_backwards;</div><div class='del'>-</div><div class='del'>-			if (NULL != sf-&gt;next_block) {</div><div class='del'>-				struct btrfs_header *const next_hdr =</div><div class='del'>-				    (struct btrfs_header *)</div><div class='del'>-				    sf-&gt;next_block_ctx.datav[0];</div><div class='del'>-</div><div class='del'>-				next_stack = btrfsic_stack_frame_alloc();</div><div class='del'>-				if (NULL == next_stack) {</div><div class='del'>-					sf-&gt;error = -1;</div><div class='del'>-					goto one_stack_frame_backwards;</div><div class='del'>-				}</div><div class='del'>-</div><div class='del'>-				next_stack-&gt;i = -1;</div><div class='del'>-				next_stack-&gt;block = sf-&gt;next_block;</div><div class='del'>-				next_stack-&gt;block_ctx = &amp;sf-&gt;next_block_ctx;</div><div class='del'>-				next_stack-&gt;next_block = NULL;</div><div class='del'>-				next_stack-&gt;hdr = next_hdr;</div><div class='del'>-				next_stack-&gt;limit_nesting =</div><div class='del'>-				    sf-&gt;limit_nesting - 1;</div><div class='del'>-				next_stack-&gt;prev = sf;</div><div class='del'>-				sf = next_stack;</div><div class='del'>-				goto continue_with_new_stack_frame;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			goto continue_with_current_node_stack_frame;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-one_stack_frame_backwards:</div><div class='del'>-	if (NULL != sf-&gt;prev) {</div><div class='del'>-		struct btrfsic_stack_frame *const prev = sf-&gt;prev;</div><div class='del'>-</div><div class='del'>-		/* the one for the initial block is freed in the caller */</div><div class='del'>-		btrfsic_release_block_ctx(sf-&gt;block_ctx);</div><div class='del'>-</div><div class='del'>-		if (sf-&gt;error) {</div><div class='del'>-			prev-&gt;error = sf-&gt;error;</div><div class='del'>-			btrfsic_stack_frame_free(sf);</div><div class='del'>-			sf = prev;</div><div class='del'>-			goto one_stack_frame_backwards;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		btrfsic_stack_frame_free(sf);</div><div class='del'>-		sf = prev;</div><div class='del'>-		goto continue_with_new_stack_frame;</div><div class='del'>-	} else {</div><div class='del'>-		BUG_ON(&amp;initial_stack_frame != sf);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return sf-&gt;error;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfsic_read_from_block_data(</div><div class='del'>-	struct btrfsic_block_data_ctx *block_ctx,</div><div class='del'>-	void *dstv, u32 offset, size_t len)</div><div class='del'>-{</div><div class='del'>-	size_t cur;</div><div class='del'>-	size_t pgoff;</div><div class='del'>-	char *kaddr;</div><div class='del'>-	char *dst = (char *)dstv;</div><div class='del'>-	size_t start_offset = offset_in_page(block_ctx-&gt;start);</div><div class='del'>-	unsigned long i = (start_offset + offset) &gt;&gt; PAGE_SHIFT;</div><div class='del'>-</div><div class='del'>-	WARN_ON(offset + len &gt; block_ctx-&gt;len);</div><div class='del'>-	pgoff = offset_in_page(start_offset + offset);</div><div class='del'>-</div><div class='del'>-	while (len &gt; 0) {</div><div class='del'>-		cur = min(len, ((size_t)PAGE_SIZE - pgoff));</div><div class='del'>-		BUG_ON(i &gt;= DIV_ROUND_UP(block_ctx-&gt;len, PAGE_SIZE));</div><div class='del'>-		kaddr = block_ctx-&gt;datav[i];</div><div class='del'>-		memcpy(dst, kaddr + pgoff, cur);</div><div class='del'>-</div><div class='del'>-		dst += cur;</div><div class='del'>-		len -= cur;</div><div class='del'>-		pgoff = 0;</div><div class='del'>-		i++;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int btrfsic_create_link_to_next_block(</div><div class='del'>-		struct btrfsic_state *state,</div><div class='del'>-		struct btrfsic_block *block,</div><div class='del'>-		struct btrfsic_block_data_ctx *block_ctx,</div><div class='del'>-		u64 next_bytenr,</div><div class='del'>-		int limit_nesting,</div><div class='del'>-		struct btrfsic_block_data_ctx *next_block_ctx,</div><div class='del'>-		struct btrfsic_block **next_blockp,</div><div class='del'>-		int force_iodone_flag,</div><div class='del'>-		int *num_copiesp, int *mirror_nump,</div><div class='del'>-		struct btrfs_disk_key *disk_key,</div><div class='del'>-		u64 parent_generation)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = state-&gt;fs_info;</div><div class='del'>-	struct btrfsic_block *next_block = NULL;</div><div class='del'>-	int ret;</div><div class='del'>-	struct btrfsic_block_link *l;</div><div class='del'>-	int did_alloc_block_link;</div><div class='del'>-	int block_was_created;</div><div class='del'>-</div><div class='del'>-	*next_blockp = NULL;</div><div class='del'>-	if (0 == *num_copiesp) {</div><div class='del'>-		*num_copiesp = btrfs_num_copies(fs_info, next_bytenr,</div><div class='del'>-						state-&gt;metablock_size);</div><div class='del'>-		if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_NUM_COPIES)</div><div class='del'>-			pr_info("num_copies(log_bytenr=%llu) = %d\n",</div><div class='del'>-			       next_bytenr, *num_copiesp);</div><div class='del'>-		*mirror_nump = 1;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (*mirror_nump &gt; *num_copiesp)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_VERBOSE)</div><div class='del'>-		pr_info("btrfsic_create_link_to_next_block(mirror_num=%d)\n",</div><div class='del'>-		       *mirror_nump);</div><div class='del'>-	ret = btrfsic_map_block(state, next_bytenr,</div><div class='del'>-				state-&gt;metablock_size,</div><div class='del'>-				next_block_ctx, *mirror_nump);</div><div class='del'>-	if (ret) {</div><div class='del'>-		pr_info("btrfsic: btrfsic_map_block(@%llu, mirror=%d) failed!\n",</div><div class='del'>-		       next_bytenr, *mirror_nump);</div><div class='del'>-		btrfsic_release_block_ctx(next_block_ctx);</div><div class='del'>-		*next_blockp = NULL;</div><div class='del'>-		return -1;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	next_block = btrfsic_block_lookup_or_add(state,</div><div class='del'>-						 next_block_ctx, "referenced ",</div><div class='del'>-						 1, force_iodone_flag,</div><div class='del'>-						 !force_iodone_flag,</div><div class='del'>-						 *mirror_nump,</div><div class='del'>-						 &amp;block_was_created);</div><div class='del'>-	if (NULL == next_block) {</div><div class='del'>-		btrfsic_release_block_ctx(next_block_ctx);</div><div class='del'>-		*next_blockp = NULL;</div><div class='del'>-		return -1;</div><div class='del'>-	}</div><div class='del'>-	if (block_was_created) {</div><div class='del'>-		l = NULL;</div><div class='del'>-		next_block-&gt;generation = BTRFSIC_GENERATION_UNKNOWN;</div><div class='del'>-	} else {</div><div class='del'>-		if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_VERBOSE) {</div><div class='del'>-			if (next_block-&gt;logical_bytenr != next_bytenr &amp;&amp;</div><div class='del'>-			    !(!next_block-&gt;is_metadata &amp;&amp;</div><div class='del'>-			      0 == next_block-&gt;logical_bytenr))</div><div class='del'>-				pr_info(</div><div class='del'>-"referenced block @%llu (%pg/%llu/%d) found in hash table, %c, bytenr mismatch (!= stored %llu)\n",</div><div class='del'>-				       next_bytenr, next_block_ctx-&gt;dev-&gt;bdev,</div><div class='del'>-				       next_block_ctx-&gt;dev_bytenr, *mirror_nump,</div><div class='del'>-				       btrfsic_get_block_type(state,</div><div class='del'>-							      next_block),</div><div class='del'>-				       next_block-&gt;logical_bytenr);</div><div class='del'>-			else</div><div class='del'>-				pr_info(</div><div class='del'>-		"referenced block @%llu (%pg/%llu/%d) found in hash table, %c\n",</div><div class='del'>-				       next_bytenr, next_block_ctx-&gt;dev-&gt;bdev,</div><div class='del'>-				       next_block_ctx-&gt;dev_bytenr, *mirror_nump,</div><div class='del'>-				       btrfsic_get_block_type(state,</div><div class='del'>-							      next_block));</div><div class='del'>-		}</div><div class='del'>-		next_block-&gt;logical_bytenr = next_bytenr;</div><div class='del'>-</div><div class='del'>-		next_block-&gt;mirror_num = *mirror_nump;</div><div class='del'>-		l = btrfsic_block_link_hashtable_lookup(</div><div class='del'>-				next_block_ctx-&gt;dev-&gt;bdev,</div><div class='del'>-				next_block_ctx-&gt;dev_bytenr,</div><div class='del'>-				block_ctx-&gt;dev-&gt;bdev,</div><div class='del'>-				block_ctx-&gt;dev_bytenr,</div><div class='del'>-				&amp;state-&gt;block_link_hashtable);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	next_block-&gt;disk_key = *disk_key;</div><div class='del'>-	if (NULL == l) {</div><div class='del'>-		l = btrfsic_block_link_alloc();</div><div class='del'>-		if (NULL == l) {</div><div class='del'>-			btrfsic_release_block_ctx(next_block_ctx);</div><div class='del'>-			*next_blockp = NULL;</div><div class='del'>-			return -1;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		did_alloc_block_link = 1;</div><div class='del'>-		l-&gt;block_ref_to = next_block;</div><div class='del'>-		l-&gt;block_ref_from = block;</div><div class='del'>-		l-&gt;ref_cnt = 1;</div><div class='del'>-		l-&gt;parent_generation = parent_generation;</div><div class='del'>-</div><div class='del'>-		if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_VERBOSE)</div><div class='del'>-			btrfsic_print_add_link(state, l);</div><div class='del'>-</div><div class='del'>-		list_add(&amp;l-&gt;node_ref_to, &amp;block-&gt;ref_to_list);</div><div class='del'>-		list_add(&amp;l-&gt;node_ref_from, &amp;next_block-&gt;ref_from_list);</div><div class='del'>-</div><div class='del'>-		btrfsic_block_link_hashtable_add(l,</div><div class='del'>-						 &amp;state-&gt;block_link_hashtable);</div><div class='del'>-	} else {</div><div class='del'>-		did_alloc_block_link = 0;</div><div class='del'>-		if (0 == limit_nesting) {</div><div class='del'>-			l-&gt;ref_cnt++;</div><div class='del'>-			l-&gt;parent_generation = parent_generation;</div><div class='del'>-			if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_VERBOSE)</div><div class='del'>-				btrfsic_print_add_link(state, l);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (limit_nesting &gt; 0 &amp;&amp; did_alloc_block_link) {</div><div class='del'>-		ret = btrfsic_read_block(state, next_block_ctx);</div><div class='del'>-		if (ret &lt; (int)next_block_ctx-&gt;len) {</div><div class='del'>-			pr_info("btrfsic: read block @logical %llu failed!\n",</div><div class='del'>-			       next_bytenr);</div><div class='del'>-			btrfsic_release_block_ctx(next_block_ctx);</div><div class='del'>-			*next_blockp = NULL;</div><div class='del'>-			return -1;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		*next_blockp = next_block;</div><div class='del'>-	} else {</div><div class='del'>-		*next_blockp = NULL;</div><div class='del'>-	}</div><div class='del'>-	(*mirror_nump)++;</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int btrfsic_handle_extent_data(</div><div class='del'>-		struct btrfsic_state *state,</div><div class='del'>-		struct btrfsic_block *block,</div><div class='del'>-		struct btrfsic_block_data_ctx *block_ctx,</div><div class='del'>-		u32 item_offset, int force_iodone_flag)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = state-&gt;fs_info;</div><div class='del'>-	struct btrfs_file_extent_item file_extent_item;</div><div class='del'>-	u64 file_extent_item_offset;</div><div class='del'>-	u64 next_bytenr;</div><div class='del'>-	u64 num_bytes;</div><div class='del'>-	u64 generation;</div><div class='del'>-	struct btrfsic_block_link *l;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	file_extent_item_offset = offsetof(struct btrfs_leaf, items) +</div><div class='del'>-				  item_offset;</div><div class='del'>-	if (file_extent_item_offset +</div><div class='del'>-	    offsetof(struct btrfs_file_extent_item, disk_num_bytes) &gt;</div><div class='del'>-	    block_ctx-&gt;len) {</div><div class='del'>-		pr_info("btrfsic: file item out of bounce at logical %llu, dev %pg\n",</div><div class='del'>-		       block_ctx-&gt;start, block_ctx-&gt;dev-&gt;bdev);</div><div class='del'>-		return -1;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	btrfsic_read_from_block_data(block_ctx, &amp;file_extent_item,</div><div class='del'>-		file_extent_item_offset,</div><div class='del'>-		offsetof(struct btrfs_file_extent_item, disk_num_bytes));</div><div class='del'>-	if (BTRFS_FILE_EXTENT_REG != file_extent_item.type ||</div><div class='del'>-	    btrfs_stack_file_extent_disk_bytenr(&amp;file_extent_item) == 0) {</div><div class='del'>-		if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_VERY_VERBOSE)</div><div class='del'>-			pr_info("extent_data: type %u, disk_bytenr = %llu\n",</div><div class='del'>-			       file_extent_item.type,</div><div class='del'>-			       btrfs_stack_file_extent_disk_bytenr(</div><div class='del'>-			       &amp;file_extent_item));</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (file_extent_item_offset + sizeof(struct btrfs_file_extent_item) &gt;</div><div class='del'>-	    block_ctx-&gt;len) {</div><div class='del'>-		pr_info("btrfsic: file item out of bounce at logical %llu, dev %pg\n",</div><div class='del'>-		       block_ctx-&gt;start, block_ctx-&gt;dev-&gt;bdev);</div><div class='del'>-		return -1;</div><div class='del'>-	}</div><div class='del'>-	btrfsic_read_from_block_data(block_ctx, &amp;file_extent_item,</div><div class='del'>-				     file_extent_item_offset,</div><div class='del'>-				     sizeof(struct btrfs_file_extent_item));</div><div class='del'>-	next_bytenr = btrfs_stack_file_extent_disk_bytenr(&amp;file_extent_item);</div><div class='del'>-	if (btrfs_stack_file_extent_compression(&amp;file_extent_item) ==</div><div class='del'>-	    BTRFS_COMPRESS_NONE) {</div><div class='del'>-		next_bytenr += btrfs_stack_file_extent_offset(&amp;file_extent_item);</div><div class='del'>-		num_bytes = btrfs_stack_file_extent_num_bytes(&amp;file_extent_item);</div><div class='del'>-	} else {</div><div class='del'>-		num_bytes = btrfs_stack_file_extent_disk_num_bytes(&amp;file_extent_item);</div><div class='del'>-	}</div><div class='del'>-	generation = btrfs_stack_file_extent_generation(&amp;file_extent_item);</div><div class='del'>-</div><div class='del'>-	if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_VERY_VERBOSE)</div><div class='del'>-		pr_info("extent_data: type %u, disk_bytenr = %llu, offset = %llu, num_bytes = %llu\n",</div><div class='del'>-		       file_extent_item.type,</div><div class='del'>-		       btrfs_stack_file_extent_disk_bytenr(&amp;file_extent_item),</div><div class='del'>-		       btrfs_stack_file_extent_offset(&amp;file_extent_item),</div><div class='del'>-		       num_bytes);</div><div class='del'>-	while (num_bytes &gt; 0) {</div><div class='del'>-		u32 chunk_len;</div><div class='del'>-		int num_copies;</div><div class='del'>-		int mirror_num;</div><div class='del'>-</div><div class='del'>-		if (num_bytes &gt; state-&gt;datablock_size)</div><div class='del'>-			chunk_len = state-&gt;datablock_size;</div><div class='del'>-		else</div><div class='del'>-			chunk_len = num_bytes;</div><div class='del'>-</div><div class='del'>-		num_copies = btrfs_num_copies(fs_info, next_bytenr,</div><div class='del'>-					      state-&gt;datablock_size);</div><div class='del'>-		if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_NUM_COPIES)</div><div class='del'>-			pr_info("num_copies(log_bytenr=%llu) = %d\n",</div><div class='del'>-			       next_bytenr, num_copies);</div><div class='del'>-		for (mirror_num = 1; mirror_num &lt;= num_copies; mirror_num++) {</div><div class='del'>-			struct btrfsic_block_data_ctx next_block_ctx;</div><div class='del'>-			struct btrfsic_block *next_block;</div><div class='del'>-			int block_was_created;</div><div class='del'>-</div><div class='del'>-			if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_VERBOSE)</div><div class='del'>-				pr_info("btrfsic_handle_extent_data(mirror_num=%d)\n",</div><div class='del'>-					mirror_num);</div><div class='del'>-			if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_VERY_VERBOSE)</div><div class='del'>-				pr_info("\tdisk_bytenr = %llu, num_bytes %u\n",</div><div class='del'>-				       next_bytenr, chunk_len);</div><div class='del'>-			ret = btrfsic_map_block(state, next_bytenr,</div><div class='del'>-						chunk_len, &amp;next_block_ctx,</div><div class='del'>-						mirror_num);</div><div class='del'>-			if (ret) {</div><div class='del'>-				pr_info("btrfsic: btrfsic_map_block(@%llu, mirror=%d) failed!\n",</div><div class='del'>-				       next_bytenr, mirror_num);</div><div class='del'>-				return -1;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			next_block = btrfsic_block_lookup_or_add(</div><div class='del'>-					state,</div><div class='del'>-					&amp;next_block_ctx,</div><div class='del'>-					"referenced ",</div><div class='del'>-					0,</div><div class='del'>-					force_iodone_flag,</div><div class='del'>-					!force_iodone_flag,</div><div class='del'>-					mirror_num,</div><div class='del'>-					&amp;block_was_created);</div><div class='del'>-			if (NULL == next_block) {</div><div class='del'>-				btrfsic_release_block_ctx(&amp;next_block_ctx);</div><div class='del'>-				return -1;</div><div class='del'>-			}</div><div class='del'>-			if (!block_was_created) {</div><div class='del'>-				if ((state-&gt;print_mask &amp;</div><div class='del'>-				     BTRFSIC_PRINT_MASK_VERBOSE) &amp;&amp;</div><div class='del'>-				    next_block-&gt;logical_bytenr != next_bytenr &amp;&amp;</div><div class='del'>-				    !(!next_block-&gt;is_metadata &amp;&amp;</div><div class='del'>-				      0 == next_block-&gt;logical_bytenr)) {</div><div class='del'>-					pr_info(</div><div class='del'>-"referenced block @%llu (%pg/%llu/%d) found in hash table, D, bytenr mismatch (!= stored %llu)\n",</div><div class='del'>-					       next_bytenr,</div><div class='del'>-					       next_block_ctx.dev-&gt;bdev,</div><div class='del'>-					       next_block_ctx.dev_bytenr,</div><div class='del'>-					       mirror_num,</div><div class='del'>-					       next_block-&gt;logical_bytenr);</div><div class='del'>-				}</div><div class='del'>-				next_block-&gt;logical_bytenr = next_bytenr;</div><div class='del'>-				next_block-&gt;mirror_num = mirror_num;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			l = btrfsic_block_link_lookup_or_add(state,</div><div class='del'>-							     &amp;next_block_ctx,</div><div class='del'>-							     next_block, block,</div><div class='del'>-							     generation);</div><div class='del'>-			btrfsic_release_block_ctx(&amp;next_block_ctx);</div><div class='del'>-			if (NULL == l)</div><div class='del'>-				return -1;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		next_bytenr += chunk_len;</div><div class='del'>-		num_bytes -= chunk_len;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int btrfsic_map_block(struct btrfsic_state *state, u64 bytenr, u32 len,</div><div class='del'>-			     struct btrfsic_block_data_ctx *block_ctx_out,</div><div class='del'>-			     int mirror_num)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = state-&gt;fs_info;</div><div class='del'>-	int ret;</div><div class='del'>-	u64 length;</div><div class='del'>-	struct btrfs_io_context *multi = NULL;</div><div class='del'>-	struct btrfs_device *device;</div><div class='del'>-</div><div class='del'>-	length = len;</div><div class='del'>-	ret = btrfs_map_block(fs_info, BTRFS_MAP_READ,</div><div class='del'>-			      bytenr, &amp;length, &amp;multi, mirror_num);</div><div class='del'>-</div><div class='del'>-	if (ret) {</div><div class='del'>-		block_ctx_out-&gt;start = 0;</div><div class='del'>-		block_ctx_out-&gt;dev_bytenr = 0;</div><div class='del'>-		block_ctx_out-&gt;len = 0;</div><div class='del'>-		block_ctx_out-&gt;dev = NULL;</div><div class='del'>-		block_ctx_out-&gt;datav = NULL;</div><div class='del'>-		block_ctx_out-&gt;pagev = NULL;</div><div class='del'>-		block_ctx_out-&gt;mem_to_free = NULL;</div><div class='del'>-</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	device = multi-&gt;stripes[0].dev;</div><div class='del'>-	if (test_bit(BTRFS_DEV_STATE_MISSING, &amp;device-&gt;dev_state) ||</div><div class='del'>-	    !device-&gt;bdev || !device-&gt;name)</div><div class='del'>-		block_ctx_out-&gt;dev = NULL;</div><div class='del'>-	else</div><div class='del'>-		block_ctx_out-&gt;dev = btrfsic_dev_state_lookup(</div><div class='del'>-							device-&gt;bdev-&gt;bd_dev);</div><div class='del'>-	block_ctx_out-&gt;dev_bytenr = multi-&gt;stripes[0].physical;</div><div class='del'>-	block_ctx_out-&gt;start = bytenr;</div><div class='del'>-	block_ctx_out-&gt;len = len;</div><div class='del'>-	block_ctx_out-&gt;datav = NULL;</div><div class='del'>-	block_ctx_out-&gt;pagev = NULL;</div><div class='del'>-	block_ctx_out-&gt;mem_to_free = NULL;</div><div class='del'>-</div><div class='del'>-	kfree(multi);</div><div class='del'>-	if (NULL == block_ctx_out-&gt;dev) {</div><div class='del'>-		ret = -ENXIO;</div><div class='del'>-		pr_info("btrfsic: error, cannot lookup dev (#1)!\n");</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfsic_release_block_ctx(struct btrfsic_block_data_ctx *block_ctx)</div><div class='del'>-{</div><div class='del'>-	if (block_ctx-&gt;mem_to_free) {</div><div class='del'>-		unsigned int num_pages;</div><div class='del'>-</div><div class='del'>-		BUG_ON(!block_ctx-&gt;datav);</div><div class='del'>-		BUG_ON(!block_ctx-&gt;pagev);</div><div class='del'>-		num_pages = (block_ctx-&gt;len + (u64)PAGE_SIZE - 1) &gt;&gt;</div><div class='del'>-			    PAGE_SHIFT;</div><div class='del'>-		/* Pages must be unmapped in reverse order */</div><div class='del'>-		while (num_pages &gt; 0) {</div><div class='del'>-			num_pages--;</div><div class='del'>-			if (block_ctx-&gt;datav[num_pages])</div><div class='del'>-				block_ctx-&gt;datav[num_pages] = NULL;</div><div class='del'>-			if (block_ctx-&gt;pagev[num_pages]) {</div><div class='del'>-				__free_page(block_ctx-&gt;pagev[num_pages]);</div><div class='del'>-				block_ctx-&gt;pagev[num_pages] = NULL;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		kfree(block_ctx-&gt;mem_to_free);</div><div class='del'>-		block_ctx-&gt;mem_to_free = NULL;</div><div class='del'>-		block_ctx-&gt;pagev = NULL;</div><div class='del'>-		block_ctx-&gt;datav = NULL;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int btrfsic_read_block(struct btrfsic_state *state,</div><div class='del'>-			      struct btrfsic_block_data_ctx *block_ctx)</div><div class='del'>-{</div><div class='del'>-	unsigned int num_pages;</div><div class='del'>-	unsigned int i;</div><div class='del'>-	size_t size;</div><div class='del'>-	u64 dev_bytenr;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	BUG_ON(block_ctx-&gt;datav);</div><div class='del'>-	BUG_ON(block_ctx-&gt;pagev);</div><div class='del'>-	BUG_ON(block_ctx-&gt;mem_to_free);</div><div class='del'>-	if (!PAGE_ALIGNED(block_ctx-&gt;dev_bytenr)) {</div><div class='del'>-		pr_info("btrfsic: read_block() with unaligned bytenr %llu\n",</div><div class='del'>-		       block_ctx-&gt;dev_bytenr);</div><div class='del'>-		return -1;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	num_pages = (block_ctx-&gt;len + (u64)PAGE_SIZE - 1) &gt;&gt;</div><div class='del'>-		    PAGE_SHIFT;</div><div class='del'>-	size = sizeof(*block_ctx-&gt;datav) + sizeof(*block_ctx-&gt;pagev);</div><div class='del'>-	block_ctx-&gt;mem_to_free = kcalloc(num_pages, size, GFP_NOFS);</div><div class='del'>-	if (!block_ctx-&gt;mem_to_free)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	block_ctx-&gt;datav = block_ctx-&gt;mem_to_free;</div><div class='del'>-	block_ctx-&gt;pagev = (struct page **)(block_ctx-&gt;datav + num_pages);</div><div class='del'>-	for (i = 0; i &lt; num_pages; i++) {</div><div class='del'>-		block_ctx-&gt;pagev[i] = alloc_page(GFP_NOFS);</div><div class='del'>-		if (!block_ctx-&gt;pagev[i])</div><div class='del'>-			return -1;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	dev_bytenr = block_ctx-&gt;dev_bytenr;</div><div class='del'>-	for (i = 0; i &lt; num_pages;) {</div><div class='del'>-		struct bio *bio;</div><div class='del'>-		unsigned int j;</div><div class='del'>-</div><div class='del'>-		bio = btrfs_bio_alloc(num_pages - i);</div><div class='del'>-		bio_set_dev(bio, block_ctx-&gt;dev-&gt;bdev);</div><div class='del'>-		bio-&gt;bi_iter.bi_sector = dev_bytenr &gt;&gt; 9;</div><div class='del'>-		bio-&gt;bi_opf = REQ_OP_READ;</div><div class='del'>-</div><div class='del'>-		for (j = i; j &lt; num_pages; j++) {</div><div class='del'>-			ret = bio_add_page(bio, block_ctx-&gt;pagev[j],</div><div class='del'>-					   PAGE_SIZE, 0);</div><div class='del'>-			if (PAGE_SIZE != ret)</div><div class='del'>-				break;</div><div class='del'>-		}</div><div class='del'>-		if (j == i) {</div><div class='del'>-			pr_info("btrfsic: error, failed to add a single page!\n");</div><div class='del'>-			return -1;</div><div class='del'>-		}</div><div class='del'>-		if (submit_bio_wait(bio)) {</div><div class='del'>-			pr_info("btrfsic: read error at logical %llu dev %pg!\n",</div><div class='del'>-			       block_ctx-&gt;start, block_ctx-&gt;dev-&gt;bdev);</div><div class='del'>-			bio_put(bio);</div><div class='del'>-			return -1;</div><div class='del'>-		}</div><div class='del'>-		bio_put(bio);</div><div class='del'>-		dev_bytenr += (j - i) * PAGE_SIZE;</div><div class='del'>-		i = j;</div><div class='del'>-	}</div><div class='del'>-	for (i = 0; i &lt; num_pages; i++)</div><div class='del'>-		block_ctx-&gt;datav[i] = page_address(block_ctx-&gt;pagev[i]);</div><div class='del'>-</div><div class='del'>-	return block_ctx-&gt;len;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfsic_dump_database(struct btrfsic_state *state)</div><div class='del'>-{</div><div class='del'>-	const struct btrfsic_block *b_all;</div><div class='del'>-</div><div class='del'>-	BUG_ON(NULL == state);</div><div class='del'>-</div><div class='del'>-	pr_info("all_blocks_list:\n");</div><div class='del'>-	list_for_each_entry(b_all, &amp;state-&gt;all_blocks_list, all_blocks_node) {</div><div class='del'>-		const struct btrfsic_block_link *l;</div><div class='del'>-</div><div class='del'>-		pr_info("%c-block @%llu (%pg/%llu/%d)\n",</div><div class='del'>-		       btrfsic_get_block_type(state, b_all),</div><div class='del'>-		       b_all-&gt;logical_bytenr, b_all-&gt;dev_state-&gt;bdev,</div><div class='del'>-		       b_all-&gt;dev_bytenr, b_all-&gt;mirror_num);</div><div class='del'>-</div><div class='del'>-		list_for_each_entry(l, &amp;b_all-&gt;ref_to_list, node_ref_to) {</div><div class='del'>-			pr_info(</div><div class='del'>-		" %c @%llu (%pg/%llu/%d) refers %u* to %c @%llu (%pg/%llu/%d)\n",</div><div class='del'>-			       btrfsic_get_block_type(state, b_all),</div><div class='del'>-			       b_all-&gt;logical_bytenr, b_all-&gt;dev_state-&gt;bdev,</div><div class='del'>-			       b_all-&gt;dev_bytenr, b_all-&gt;mirror_num,</div><div class='del'>-			       l-&gt;ref_cnt,</div><div class='del'>-			       btrfsic_get_block_type(state, l-&gt;block_ref_to),</div><div class='del'>-			       l-&gt;block_ref_to-&gt;logical_bytenr,</div><div class='del'>-			       l-&gt;block_ref_to-&gt;dev_state-&gt;bdev,</div><div class='del'>-			       l-&gt;block_ref_to-&gt;dev_bytenr,</div><div class='del'>-			       l-&gt;block_ref_to-&gt;mirror_num);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		list_for_each_entry(l, &amp;b_all-&gt;ref_from_list, node_ref_from) {</div><div class='del'>-			pr_info(</div><div class='del'>-		" %c @%llu (%pg/%llu/%d) is ref %u* from %c @%llu (%pg/%llu/%d)\n",</div><div class='del'>-			       btrfsic_get_block_type(state, b_all),</div><div class='del'>-			       b_all-&gt;logical_bytenr, b_all-&gt;dev_state-&gt;bdev,</div><div class='del'>-			       b_all-&gt;dev_bytenr, b_all-&gt;mirror_num,</div><div class='del'>-			       l-&gt;ref_cnt,</div><div class='del'>-			       btrfsic_get_block_type(state, l-&gt;block_ref_from),</div><div class='del'>-			       l-&gt;block_ref_from-&gt;logical_bytenr,</div><div class='del'>-			       l-&gt;block_ref_from-&gt;dev_state-&gt;bdev,</div><div class='del'>-			       l-&gt;block_ref_from-&gt;dev_bytenr,</div><div class='del'>-			       l-&gt;block_ref_from-&gt;mirror_num);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		pr_info("\n");</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Test whether the disk block contains a tree block (leaf or node)</div><div class='del'>- * (note that this test fails for the super block)</div><div class='del'>- */</div><div class='del'>-static noinline_for_stack int btrfsic_test_for_metadata(</div><div class='del'>-		struct btrfsic_state *state,</div><div class='del'>-		char **datav, unsigned int num_pages)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = state-&gt;fs_info;</div><div class='del'>-	SHASH_DESC_ON_STACK(shash, fs_info-&gt;csum_shash);</div><div class='del'>-	struct btrfs_header *h;</div><div class='del'>-	u8 csum[BTRFS_CSUM_SIZE];</div><div class='del'>-	unsigned int i;</div><div class='del'>-</div><div class='del'>-	if (num_pages * PAGE_SIZE &lt; state-&gt;metablock_size)</div><div class='del'>-		return 1; /* not metadata */</div><div class='del'>-	num_pages = state-&gt;metablock_size &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	h = (struct btrfs_header *)datav[0];</div><div class='del'>-</div><div class='del'>-	if (memcmp(h-&gt;fsid, fs_info-&gt;fs_devices-&gt;fsid, BTRFS_FSID_SIZE))</div><div class='del'>-		return 1;</div><div class='del'>-</div><div class='del'>-	shash-&gt;tfm = fs_info-&gt;csum_shash;</div><div class='del'>-	crypto_shash_init(shash);</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; num_pages; i++) {</div><div class='del'>-		u8 *data = i ? datav[i] : (datav[i] + BTRFS_CSUM_SIZE);</div><div class='del'>-		size_t sublen = i ? PAGE_SIZE :</div><div class='del'>-				    (PAGE_SIZE - BTRFS_CSUM_SIZE);</div><div class='del'>-</div><div class='del'>-		crypto_shash_update(shash, data, sublen);</div><div class='del'>-	}</div><div class='del'>-	crypto_shash_final(shash, csum);</div><div class='del'>-	if (memcmp(csum, h-&gt;csum, fs_info-&gt;csum_size))</div><div class='del'>-		return 1;</div><div class='del'>-</div><div class='del'>-	return 0; /* is metadata */</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfsic_process_written_block(struct btrfsic_dev_state *dev_state,</div><div class='del'>-					  u64 dev_bytenr, char **mapped_datav,</div><div class='del'>-					  unsigned int num_pages,</div><div class='del'>-					  struct bio *bio, int *bio_is_patched,</div><div class='del'>-					  int submit_bio_bh_rw)</div><div class='del'>-{</div><div class='del'>-	int is_metadata;</div><div class='del'>-	struct btrfsic_block *block;</div><div class='del'>-	struct btrfsic_block_data_ctx block_ctx;</div><div class='del'>-	int ret;</div><div class='del'>-	struct btrfsic_state *state = dev_state-&gt;state;</div><div class='del'>-	struct block_device *bdev = dev_state-&gt;bdev;</div><div class='del'>-	unsigned int processed_len;</div><div class='del'>-</div><div class='del'>-	if (NULL != bio_is_patched)</div><div class='del'>-		*bio_is_patched = 0;</div><div class='del'>-</div><div class='del'>-again:</div><div class='del'>-	if (num_pages == 0)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	processed_len = 0;</div><div class='del'>-	is_metadata = (0 == btrfsic_test_for_metadata(state, mapped_datav,</div><div class='del'>-						      num_pages));</div><div class='del'>-</div><div class='del'>-	block = btrfsic_block_hashtable_lookup(bdev, dev_bytenr,</div><div class='del'>-					       &amp;state-&gt;block_hashtable);</div><div class='del'>-	if (NULL != block) {</div><div class='del'>-		u64 bytenr = 0;</div><div class='del'>-		struct btrfsic_block_link *l, *tmp;</div><div class='del'>-</div><div class='del'>-		if (block-&gt;is_superblock) {</div><div class='del'>-			bytenr = btrfs_super_bytenr((struct btrfs_super_block *)</div><div class='del'>-						    mapped_datav[0]);</div><div class='del'>-			if (num_pages * PAGE_SIZE &lt;</div><div class='del'>-			    BTRFS_SUPER_INFO_SIZE) {</div><div class='del'>-				pr_info("btrfsic: cannot work with too short bios!\n");</div><div class='del'>-				return;</div><div class='del'>-			}</div><div class='del'>-			is_metadata = 1;</div><div class='del'>-			BUG_ON(!PAGE_ALIGNED(BTRFS_SUPER_INFO_SIZE));</div><div class='del'>-			processed_len = BTRFS_SUPER_INFO_SIZE;</div><div class='del'>-			if (state-&gt;print_mask &amp;</div><div class='del'>-			    BTRFSIC_PRINT_MASK_TREE_BEFORE_SB_WRITE) {</div><div class='del'>-				pr_info("[before new superblock is written]:\n");</div><div class='del'>-				btrfsic_dump_tree_sub(state, block, 0);</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-		if (is_metadata) {</div><div class='del'>-			if (!block-&gt;is_superblock) {</div><div class='del'>-				if (num_pages * PAGE_SIZE &lt;</div><div class='del'>-				    state-&gt;metablock_size) {</div><div class='del'>-					pr_info("btrfsic: cannot work with too short bios!\n");</div><div class='del'>-					return;</div><div class='del'>-				}</div><div class='del'>-				processed_len = state-&gt;metablock_size;</div><div class='del'>-				bytenr = btrfs_stack_header_bytenr(</div><div class='del'>-						(struct btrfs_header *)</div><div class='del'>-						mapped_datav[0]);</div><div class='del'>-				btrfsic_cmp_log_and_dev_bytenr(state, bytenr,</div><div class='del'>-							       dev_state,</div><div class='del'>-							       dev_bytenr);</div><div class='del'>-			}</div><div class='del'>-			if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_VERBOSE) {</div><div class='del'>-				if (block-&gt;logical_bytenr != bytenr &amp;&amp;</div><div class='del'>-				    !(!block-&gt;is_metadata &amp;&amp;</div><div class='del'>-				      block-&gt;logical_bytenr == 0))</div><div class='del'>-					pr_info(</div><div class='del'>-"written block @%llu (%pg/%llu/%d) found in hash table, %c, bytenr mismatch (!= stored %llu)\n",</div><div class='del'>-					       bytenr, dev_state-&gt;bdev,</div><div class='del'>-					       dev_bytenr,</div><div class='del'>-					       block-&gt;mirror_num,</div><div class='del'>-					       btrfsic_get_block_type(state,</div><div class='del'>-								      block),</div><div class='del'>-					       block-&gt;logical_bytenr);</div><div class='del'>-				else</div><div class='del'>-					pr_info(</div><div class='del'>-		"written block @%llu (%pg/%llu/%d) found in hash table, %c\n",</div><div class='del'>-					       bytenr, dev_state-&gt;bdev,</div><div class='del'>-					       dev_bytenr, block-&gt;mirror_num,</div><div class='del'>-					       btrfsic_get_block_type(state,</div><div class='del'>-								      block));</div><div class='del'>-			}</div><div class='del'>-			block-&gt;logical_bytenr = bytenr;</div><div class='del'>-		} else {</div><div class='del'>-			if (num_pages * PAGE_SIZE &lt;</div><div class='del'>-			    state-&gt;datablock_size) {</div><div class='del'>-				pr_info("btrfsic: cannot work with too short bios!\n");</div><div class='del'>-				return;</div><div class='del'>-			}</div><div class='del'>-			processed_len = state-&gt;datablock_size;</div><div class='del'>-			bytenr = block-&gt;logical_bytenr;</div><div class='del'>-			if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_VERBOSE)</div><div class='del'>-				pr_info(</div><div class='del'>-		"written block @%llu (%pg/%llu/%d) found in hash table, %c\n",</div><div class='del'>-				       bytenr, dev_state-&gt;bdev, dev_bytenr,</div><div class='del'>-				       block-&gt;mirror_num,</div><div class='del'>-				       btrfsic_get_block_type(state, block));</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_VERBOSE)</div><div class='del'>-			pr_info("ref_to_list: %cE, ref_from_list: %cE\n",</div><div class='del'>-			       list_empty(&amp;block-&gt;ref_to_list) ? ' ' : '!',</div><div class='del'>-			       list_empty(&amp;block-&gt;ref_from_list) ? ' ' : '!');</div><div class='del'>-		if (btrfsic_is_block_ref_by_superblock(state, block, 0)) {</div><div class='del'>-			pr_info(</div><div class='del'>-"btrfs: attempt to overwrite %c-block @%llu (%pg/%llu/%d), old(gen=%llu, objectid=%llu, type=%d, offset=%llu), new(gen=%llu), which is referenced by most recent superblock (superblockgen=%llu)!\n",</div><div class='del'>-			       btrfsic_get_block_type(state, block), bytenr,</div><div class='del'>-			       dev_state-&gt;bdev, dev_bytenr, block-&gt;mirror_num,</div><div class='del'>-			       block-&gt;generation,</div><div class='del'>-			       btrfs_disk_key_objectid(&amp;block-&gt;disk_key),</div><div class='del'>-			       block-&gt;disk_key.type,</div><div class='del'>-			       btrfs_disk_key_offset(&amp;block-&gt;disk_key),</div><div class='del'>-			       btrfs_stack_header_generation(</div><div class='del'>-				       (struct btrfs_header *) mapped_datav[0]),</div><div class='del'>-			       state-&gt;max_superblock_generation);</div><div class='del'>-			btrfsic_dump_tree(state);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (!block-&gt;is_iodone &amp;&amp; !block-&gt;never_written) {</div><div class='del'>-			pr_info(</div><div class='del'>-"btrfs: attempt to overwrite %c-block @%llu (%pg/%llu/%d), oldgen=%llu, newgen=%llu, which is not yet iodone!\n",</div><div class='del'>-			       btrfsic_get_block_type(state, block), bytenr,</div><div class='del'>-			       dev_state-&gt;bdev, dev_bytenr, block-&gt;mirror_num,</div><div class='del'>-			       block-&gt;generation,</div><div class='del'>-			       btrfs_stack_header_generation(</div><div class='del'>-				       (struct btrfs_header *)</div><div class='del'>-				       mapped_datav[0]));</div><div class='del'>-			/* it would not be safe to go on */</div><div class='del'>-			btrfsic_dump_tree(state);</div><div class='del'>-			goto continue_loop;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Clear all references of this block. Do not free</div><div class='del'>-		 * the block itself even if is not referenced anymore</div><div class='del'>-		 * because it still carries valuable information</div><div class='del'>-		 * like whether it was ever written and IO completed.</div><div class='del'>-		 */</div><div class='del'>-		list_for_each_entry_safe(l, tmp, &amp;block-&gt;ref_to_list,</div><div class='del'>-					 node_ref_to) {</div><div class='del'>-			if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_VERBOSE)</div><div class='del'>-				btrfsic_print_rem_link(state, l);</div><div class='del'>-			l-&gt;ref_cnt--;</div><div class='del'>-			if (0 == l-&gt;ref_cnt) {</div><div class='del'>-				list_del(&amp;l-&gt;node_ref_to);</div><div class='del'>-				list_del(&amp;l-&gt;node_ref_from);</div><div class='del'>-				btrfsic_block_link_hashtable_remove(l);</div><div class='del'>-				btrfsic_block_link_free(l);</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		block_ctx.dev = dev_state;</div><div class='del'>-		block_ctx.dev_bytenr = dev_bytenr;</div><div class='del'>-		block_ctx.start = bytenr;</div><div class='del'>-		block_ctx.len = processed_len;</div><div class='del'>-		block_ctx.pagev = NULL;</div><div class='del'>-		block_ctx.mem_to_free = NULL;</div><div class='del'>-		block_ctx.datav = mapped_datav;</div><div class='del'>-</div><div class='del'>-		if (is_metadata || state-&gt;include_extent_data) {</div><div class='del'>-			block-&gt;never_written = 0;</div><div class='del'>-			block-&gt;iodone_w_error = 0;</div><div class='del'>-			if (NULL != bio) {</div><div class='del'>-				block-&gt;is_iodone = 0;</div><div class='del'>-				BUG_ON(NULL == bio_is_patched);</div><div class='del'>-				if (!*bio_is_patched) {</div><div class='del'>-					block-&gt;orig_bio_private =</div><div class='del'>-					    bio-&gt;bi_private;</div><div class='del'>-					block-&gt;orig_bio_end_io =</div><div class='del'>-					    bio-&gt;bi_end_io;</div><div class='del'>-					block-&gt;next_in_same_bio = NULL;</div><div class='del'>-					bio-&gt;bi_private = block;</div><div class='del'>-					bio-&gt;bi_end_io = btrfsic_bio_end_io;</div><div class='del'>-					*bio_is_patched = 1;</div><div class='del'>-				} else {</div><div class='del'>-					struct btrfsic_block *chained_block =</div><div class='del'>-					    (struct btrfsic_block *)</div><div class='del'>-					    bio-&gt;bi_private;</div><div class='del'>-</div><div class='del'>-					BUG_ON(NULL == chained_block);</div><div class='del'>-					block-&gt;orig_bio_private =</div><div class='del'>-					    chained_block-&gt;orig_bio_private;</div><div class='del'>-					block-&gt;orig_bio_end_io =</div><div class='del'>-					    chained_block-&gt;orig_bio_end_io;</div><div class='del'>-					block-&gt;next_in_same_bio = chained_block;</div><div class='del'>-					bio-&gt;bi_private = block;</div><div class='del'>-				}</div><div class='del'>-			} else {</div><div class='del'>-				block-&gt;is_iodone = 1;</div><div class='del'>-				block-&gt;orig_bio_private = NULL;</div><div class='del'>-				block-&gt;orig_bio_end_io = NULL;</div><div class='del'>-				block-&gt;next_in_same_bio = NULL;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		block-&gt;flush_gen = dev_state-&gt;last_flush_gen + 1;</div><div class='del'>-		block-&gt;submit_bio_bh_rw = submit_bio_bh_rw;</div><div class='del'>-		if (is_metadata) {</div><div class='del'>-			block-&gt;logical_bytenr = bytenr;</div><div class='del'>-			block-&gt;is_metadata = 1;</div><div class='del'>-			if (block-&gt;is_superblock) {</div><div class='del'>-				BUG_ON(PAGE_SIZE !=</div><div class='del'>-				       BTRFS_SUPER_INFO_SIZE);</div><div class='del'>-				ret = btrfsic_process_written_superblock(</div><div class='del'>-						state,</div><div class='del'>-						block,</div><div class='del'>-						(struct btrfs_super_block *)</div><div class='del'>-						mapped_datav[0]);</div><div class='del'>-				if (state-&gt;print_mask &amp;</div><div class='del'>-				    BTRFSIC_PRINT_MASK_TREE_AFTER_SB_WRITE) {</div><div class='del'>-					pr_info("[after new superblock is written]:\n");</div><div class='del'>-					btrfsic_dump_tree_sub(state, block, 0);</div><div class='del'>-				}</div><div class='del'>-			} else {</div><div class='del'>-				block-&gt;mirror_num = 0;	/* unknown */</div><div class='del'>-				ret = btrfsic_process_metablock(</div><div class='del'>-						state,</div><div class='del'>-						block,</div><div class='del'>-						&amp;block_ctx,</div><div class='del'>-						0, 0);</div><div class='del'>-			}</div><div class='del'>-			if (ret)</div><div class='del'>-				pr_info("btrfsic: btrfsic_process_metablock(root @%llu) failed!\n",</div><div class='del'>-				       dev_bytenr);</div><div class='del'>-		} else {</div><div class='del'>-			block-&gt;is_metadata = 0;</div><div class='del'>-			block-&gt;mirror_num = 0;	/* unknown */</div><div class='del'>-			block-&gt;generation = BTRFSIC_GENERATION_UNKNOWN;</div><div class='del'>-			if (!state-&gt;include_extent_data</div><div class='del'>-			    &amp;&amp; list_empty(&amp;block-&gt;ref_from_list)) {</div><div class='del'>-				/*</div><div class='del'>-				 * disk block is overwritten with extent</div><div class='del'>-				 * data (not meta data) and we are configured</div><div class='del'>-				 * to not include extent data: take the</div><div class='del'>-				 * chance and free the block's memory</div><div class='del'>-				 */</div><div class='del'>-				btrfsic_block_hashtable_remove(block);</div><div class='del'>-				list_del(&amp;block-&gt;all_blocks_node);</div><div class='del'>-				btrfsic_block_free(block);</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-		btrfsic_release_block_ctx(&amp;block_ctx);</div><div class='del'>-	} else {</div><div class='del'>-		/* block has not been found in hash table */</div><div class='del'>-		u64 bytenr;</div><div class='del'>-</div><div class='del'>-		if (!is_metadata) {</div><div class='del'>-			processed_len = state-&gt;datablock_size;</div><div class='del'>-			if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_VERBOSE)</div><div class='del'>-				pr_info(</div><div class='del'>-			"written block (%pg/%llu/?) !found in hash table, D\n",</div><div class='del'>-				       dev_state-&gt;bdev, dev_bytenr);</div><div class='del'>-			if (!state-&gt;include_extent_data) {</div><div class='del'>-				/* ignore that written D block */</div><div class='del'>-				goto continue_loop;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			/* this is getting ugly for the</div><div class='del'>-			 * include_extent_data case... */</div><div class='del'>-			bytenr = 0;	/* unknown */</div><div class='del'>-		} else {</div><div class='del'>-			processed_len = state-&gt;metablock_size;</div><div class='del'>-			bytenr = btrfs_stack_header_bytenr(</div><div class='del'>-					(struct btrfs_header *)</div><div class='del'>-					mapped_datav[0]);</div><div class='del'>-			btrfsic_cmp_log_and_dev_bytenr(state, bytenr, dev_state,</div><div class='del'>-						       dev_bytenr);</div><div class='del'>-			if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_VERBOSE)</div><div class='del'>-				pr_info(</div><div class='del'>-			"written block @%llu (%pg/%llu/?) !found in hash table, M\n",</div><div class='del'>-				       bytenr, dev_state-&gt;bdev, dev_bytenr);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		block_ctx.dev = dev_state;</div><div class='del'>-		block_ctx.dev_bytenr = dev_bytenr;</div><div class='del'>-		block_ctx.start = bytenr;</div><div class='del'>-		block_ctx.len = processed_len;</div><div class='del'>-		block_ctx.pagev = NULL;</div><div class='del'>-		block_ctx.mem_to_free = NULL;</div><div class='del'>-		block_ctx.datav = mapped_datav;</div><div class='del'>-</div><div class='del'>-		block = btrfsic_block_alloc();</div><div class='del'>-		if (NULL == block) {</div><div class='del'>-			btrfsic_release_block_ctx(&amp;block_ctx);</div><div class='del'>-			goto continue_loop;</div><div class='del'>-		}</div><div class='del'>-		block-&gt;dev_state = dev_state;</div><div class='del'>-		block-&gt;dev_bytenr = dev_bytenr;</div><div class='del'>-		block-&gt;logical_bytenr = bytenr;</div><div class='del'>-		block-&gt;is_metadata = is_metadata;</div><div class='del'>-		block-&gt;never_written = 0;</div><div class='del'>-		block-&gt;iodone_w_error = 0;</div><div class='del'>-		block-&gt;mirror_num = 0;	/* unknown */</div><div class='del'>-		block-&gt;flush_gen = dev_state-&gt;last_flush_gen + 1;</div><div class='del'>-		block-&gt;submit_bio_bh_rw = submit_bio_bh_rw;</div><div class='del'>-		if (NULL != bio) {</div><div class='del'>-			block-&gt;is_iodone = 0;</div><div class='del'>-			BUG_ON(NULL == bio_is_patched);</div><div class='del'>-			if (!*bio_is_patched) {</div><div class='del'>-				block-&gt;orig_bio_private = bio-&gt;bi_private;</div><div class='del'>-				block-&gt;orig_bio_end_io = bio-&gt;bi_end_io;</div><div class='del'>-				block-&gt;next_in_same_bio = NULL;</div><div class='del'>-				bio-&gt;bi_private = block;</div><div class='del'>-				bio-&gt;bi_end_io = btrfsic_bio_end_io;</div><div class='del'>-				*bio_is_patched = 1;</div><div class='del'>-			} else {</div><div class='del'>-				struct btrfsic_block *chained_block =</div><div class='del'>-				    (struct btrfsic_block *)</div><div class='del'>-				    bio-&gt;bi_private;</div><div class='del'>-</div><div class='del'>-				BUG_ON(NULL == chained_block);</div><div class='del'>-				block-&gt;orig_bio_private =</div><div class='del'>-				    chained_block-&gt;orig_bio_private;</div><div class='del'>-				block-&gt;orig_bio_end_io =</div><div class='del'>-				    chained_block-&gt;orig_bio_end_io;</div><div class='del'>-				block-&gt;next_in_same_bio = chained_block;</div><div class='del'>-				bio-&gt;bi_private = block;</div><div class='del'>-			}</div><div class='del'>-		} else {</div><div class='del'>-			block-&gt;is_iodone = 1;</div><div class='del'>-			block-&gt;orig_bio_private = NULL;</div><div class='del'>-			block-&gt;orig_bio_end_io = NULL;</div><div class='del'>-			block-&gt;next_in_same_bio = NULL;</div><div class='del'>-		}</div><div class='del'>-		if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_VERBOSE)</div><div class='del'>-			pr_info("new written %c-block @%llu (%pg/%llu/%d)\n",</div><div class='del'>-			       is_metadata ? 'M' : 'D',</div><div class='del'>-			       block-&gt;logical_bytenr, block-&gt;dev_state-&gt;bdev,</div><div class='del'>-			       block-&gt;dev_bytenr, block-&gt;mirror_num);</div><div class='del'>-		list_add(&amp;block-&gt;all_blocks_node, &amp;state-&gt;all_blocks_list);</div><div class='del'>-		btrfsic_block_hashtable_add(block, &amp;state-&gt;block_hashtable);</div><div class='del'>-</div><div class='del'>-		if (is_metadata) {</div><div class='del'>-			ret = btrfsic_process_metablock(state, block,</div><div class='del'>-							&amp;block_ctx, 0, 0);</div><div class='del'>-			if (ret)</div><div class='del'>-				pr_info("btrfsic: process_metablock(root @%llu) failed!\n",</div><div class='del'>-				       dev_bytenr);</div><div class='del'>-		}</div><div class='del'>-		btrfsic_release_block_ctx(&amp;block_ctx);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-continue_loop:</div><div class='del'>-	BUG_ON(!processed_len);</div><div class='del'>-	dev_bytenr += processed_len;</div><div class='del'>-	mapped_datav += processed_len &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	num_pages -= processed_len &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	goto again;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfsic_bio_end_io(struct bio *bp)</div><div class='del'>-{</div><div class='del'>-	struct btrfsic_block *block = (struct btrfsic_block *)bp-&gt;bi_private;</div><div class='del'>-	int iodone_w_error;</div><div class='del'>-</div><div class='del'>-	/* mutex is not held! This is not save if IO is not yet completed</div><div class='del'>-	 * on umount */</div><div class='del'>-	iodone_w_error = 0;</div><div class='del'>-	if (bp-&gt;bi_status)</div><div class='del'>-		iodone_w_error = 1;</div><div class='del'>-</div><div class='del'>-	BUG_ON(NULL == block);</div><div class='del'>-	bp-&gt;bi_private = block-&gt;orig_bio_private;</div><div class='del'>-	bp-&gt;bi_end_io = block-&gt;orig_bio_end_io;</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		struct btrfsic_block *next_block;</div><div class='del'>-		struct btrfsic_dev_state *const dev_state = block-&gt;dev_state;</div><div class='del'>-</div><div class='del'>-		if ((dev_state-&gt;state-&gt;print_mask &amp;</div><div class='del'>-		     BTRFSIC_PRINT_MASK_END_IO_BIO_BH))</div><div class='del'>-			pr_info("bio_end_io(err=%d) for %c @%llu (%pg/%llu/%d)\n",</div><div class='del'>-			       bp-&gt;bi_status,</div><div class='del'>-			       btrfsic_get_block_type(dev_state-&gt;state, block),</div><div class='del'>-			       block-&gt;logical_bytenr, dev_state-&gt;bdev,</div><div class='del'>-			       block-&gt;dev_bytenr, block-&gt;mirror_num);</div><div class='del'>-		next_block = block-&gt;next_in_same_bio;</div><div class='del'>-		block-&gt;iodone_w_error = iodone_w_error;</div><div class='del'>-		if (block-&gt;submit_bio_bh_rw &amp; REQ_PREFLUSH) {</div><div class='del'>-			dev_state-&gt;last_flush_gen++;</div><div class='del'>-			if ((dev_state-&gt;state-&gt;print_mask &amp;</div><div class='del'>-			     BTRFSIC_PRINT_MASK_END_IO_BIO_BH))</div><div class='del'>-				pr_info("bio_end_io() new %pg flush_gen=%llu\n",</div><div class='del'>-				       dev_state-&gt;bdev,</div><div class='del'>-				       dev_state-&gt;last_flush_gen);</div><div class='del'>-		}</div><div class='del'>-		if (block-&gt;submit_bio_bh_rw &amp; REQ_FUA)</div><div class='del'>-			block-&gt;flush_gen = 0; /* FUA completed means block is</div><div class='del'>-					       * on disk */</div><div class='del'>-		block-&gt;is_iodone = 1; /* for FLUSH, this releases the block */</div><div class='del'>-		block = next_block;</div><div class='del'>-	} while (NULL != block);</div><div class='del'>-</div><div class='del'>-	bp-&gt;bi_end_io(bp);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int btrfsic_process_written_superblock(</div><div class='del'>-		struct btrfsic_state *state,</div><div class='del'>-		struct btrfsic_block *const superblock,</div><div class='del'>-		struct btrfs_super_block *const super_hdr)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = state-&gt;fs_info;</div><div class='del'>-	int pass;</div><div class='del'>-</div><div class='del'>-	superblock-&gt;generation = btrfs_super_generation(super_hdr);</div><div class='del'>-	if (!(superblock-&gt;generation &gt; state-&gt;max_superblock_generation ||</div><div class='del'>-	      0 == state-&gt;max_superblock_generation)) {</div><div class='del'>-		if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_SUPERBLOCK_WRITE)</div><div class='del'>-			pr_info(</div><div class='del'>-	"btrfsic: superblock @%llu (%pg/%llu/%d) with old gen %llu &lt;= %llu\n",</div><div class='del'>-			       superblock-&gt;logical_bytenr,</div><div class='del'>-			       superblock-&gt;dev_state-&gt;bdev,</div><div class='del'>-			       superblock-&gt;dev_bytenr, superblock-&gt;mirror_num,</div><div class='del'>-			       btrfs_super_generation(super_hdr),</div><div class='del'>-			       state-&gt;max_superblock_generation);</div><div class='del'>-	} else {</div><div class='del'>-		if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_SUPERBLOCK_WRITE)</div><div class='del'>-			pr_info(</div><div class='del'>-	"btrfsic: got new superblock @%llu (%pg/%llu/%d) with new gen %llu &gt; %llu\n",</div><div class='del'>-			       superblock-&gt;logical_bytenr,</div><div class='del'>-			       superblock-&gt;dev_state-&gt;bdev,</div><div class='del'>-			       superblock-&gt;dev_bytenr, superblock-&gt;mirror_num,</div><div class='del'>-			       btrfs_super_generation(super_hdr),</div><div class='del'>-			       state-&gt;max_superblock_generation);</div><div class='del'>-</div><div class='del'>-		state-&gt;max_superblock_generation =</div><div class='del'>-		    btrfs_super_generation(super_hdr);</div><div class='del'>-		state-&gt;latest_superblock = superblock;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	for (pass = 0; pass &lt; 3; pass++) {</div><div class='del'>-		int ret;</div><div class='del'>-		u64 next_bytenr;</div><div class='del'>-		struct btrfsic_block *next_block;</div><div class='del'>-		struct btrfsic_block_data_ctx tmp_next_block_ctx;</div><div class='del'>-		struct btrfsic_block_link *l;</div><div class='del'>-		int num_copies;</div><div class='del'>-		int mirror_num;</div><div class='del'>-		const char *additional_string = NULL;</div><div class='del'>-		struct btrfs_disk_key tmp_disk_key = {0};</div><div class='del'>-</div><div class='del'>-		btrfs_set_disk_key_objectid(&amp;tmp_disk_key,</div><div class='del'>-					    BTRFS_ROOT_ITEM_KEY);</div><div class='del'>-		btrfs_set_disk_key_objectid(&amp;tmp_disk_key, 0);</div><div class='del'>-</div><div class='del'>-		switch (pass) {</div><div class='del'>-		case 0:</div><div class='del'>-			btrfs_set_disk_key_objectid(&amp;tmp_disk_key,</div><div class='del'>-						    BTRFS_ROOT_TREE_OBJECTID);</div><div class='del'>-			additional_string = "root ";</div><div class='del'>-			next_bytenr = btrfs_super_root(super_hdr);</div><div class='del'>-			if (state-&gt;print_mask &amp;</div><div class='del'>-			    BTRFSIC_PRINT_MASK_ROOT_CHUNK_LOG_TREE_LOCATION)</div><div class='del'>-				pr_info("root@%llu\n", next_bytenr);</div><div class='del'>-			break;</div><div class='del'>-		case 1:</div><div class='del'>-			btrfs_set_disk_key_objectid(&amp;tmp_disk_key,</div><div class='del'>-						    BTRFS_CHUNK_TREE_OBJECTID);</div><div class='del'>-			additional_string = "chunk ";</div><div class='del'>-			next_bytenr = btrfs_super_chunk_root(super_hdr);</div><div class='del'>-			if (state-&gt;print_mask &amp;</div><div class='del'>-			    BTRFSIC_PRINT_MASK_ROOT_CHUNK_LOG_TREE_LOCATION)</div><div class='del'>-				pr_info("chunk@%llu\n", next_bytenr);</div><div class='del'>-			break;</div><div class='del'>-		case 2:</div><div class='del'>-			btrfs_set_disk_key_objectid(&amp;tmp_disk_key,</div><div class='del'>-						    BTRFS_TREE_LOG_OBJECTID);</div><div class='del'>-			additional_string = "log ";</div><div class='del'>-			next_bytenr = btrfs_super_log_root(super_hdr);</div><div class='del'>-			if (0 == next_bytenr)</div><div class='del'>-				continue;</div><div class='del'>-			if (state-&gt;print_mask &amp;</div><div class='del'>-			    BTRFSIC_PRINT_MASK_ROOT_CHUNK_LOG_TREE_LOCATION)</div><div class='del'>-				pr_info("log@%llu\n", next_bytenr);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		num_copies = btrfs_num_copies(fs_info, next_bytenr,</div><div class='del'>-					      BTRFS_SUPER_INFO_SIZE);</div><div class='del'>-		if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_NUM_COPIES)</div><div class='del'>-			pr_info("num_copies(log_bytenr=%llu) = %d\n",</div><div class='del'>-			       next_bytenr, num_copies);</div><div class='del'>-		for (mirror_num = 1; mirror_num &lt;= num_copies; mirror_num++) {</div><div class='del'>-			int was_created;</div><div class='del'>-</div><div class='del'>-			if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_VERBOSE)</div><div class='del'>-				pr_info("btrfsic_process_written_superblock(mirror_num=%d)\n", mirror_num);</div><div class='del'>-			ret = btrfsic_map_block(state, next_bytenr,</div><div class='del'>-						BTRFS_SUPER_INFO_SIZE,</div><div class='del'>-						&amp;tmp_next_block_ctx,</div><div class='del'>-						mirror_num);</div><div class='del'>-			if (ret) {</div><div class='del'>-				pr_info("btrfsic: btrfsic_map_block(@%llu, mirror=%d) failed!\n",</div><div class='del'>-				       next_bytenr, mirror_num);</div><div class='del'>-				return -1;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			next_block = btrfsic_block_lookup_or_add(</div><div class='del'>-					state,</div><div class='del'>-					&amp;tmp_next_block_ctx,</div><div class='del'>-					additional_string,</div><div class='del'>-					1, 0, 1,</div><div class='del'>-					mirror_num,</div><div class='del'>-					&amp;was_created);</div><div class='del'>-			if (NULL == next_block) {</div><div class='del'>-				btrfsic_release_block_ctx(&amp;tmp_next_block_ctx);</div><div class='del'>-				return -1;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			next_block-&gt;disk_key = tmp_disk_key;</div><div class='del'>-			if (was_created)</div><div class='del'>-				next_block-&gt;generation =</div><div class='del'>-				    BTRFSIC_GENERATION_UNKNOWN;</div><div class='del'>-			l = btrfsic_block_link_lookup_or_add(</div><div class='del'>-					state,</div><div class='del'>-					&amp;tmp_next_block_ctx,</div><div class='del'>-					next_block,</div><div class='del'>-					superblock,</div><div class='del'>-					BTRFSIC_GENERATION_UNKNOWN);</div><div class='del'>-			btrfsic_release_block_ctx(&amp;tmp_next_block_ctx);</div><div class='del'>-			if (NULL == l)</div><div class='del'>-				return -1;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (WARN_ON(-1 == btrfsic_check_all_ref_blocks(state, superblock, 0)))</div><div class='del'>-		btrfsic_dump_tree(state);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int btrfsic_check_all_ref_blocks(struct btrfsic_state *state,</div><div class='del'>-					struct btrfsic_block *const block,</div><div class='del'>-					int recursion_level)</div><div class='del'>-{</div><div class='del'>-	const struct btrfsic_block_link *l;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	if (recursion_level &gt;= 3 + BTRFS_MAX_LEVEL) {</div><div class='del'>-		/*</div><div class='del'>-		 * Note that this situation can happen and does not</div><div class='del'>-		 * indicate an error in regular cases. It happens</div><div class='del'>-		 * when disk blocks are freed and later reused.</div><div class='del'>-		 * The check-integrity module is not aware of any</div><div class='del'>-		 * block free operations, it just recognizes block</div><div class='del'>-		 * write operations. Therefore it keeps the linkage</div><div class='del'>-		 * information for a block until a block is</div><div class='del'>-		 * rewritten. This can temporarily cause incorrect</div><div class='del'>-		 * and even circular linkage information. This</div><div class='del'>-		 * causes no harm unless such blocks are referenced</div><div class='del'>-		 * by the most recent super block.</div><div class='del'>-		 */</div><div class='del'>-		if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_VERBOSE)</div><div class='del'>-			pr_info("btrfsic: abort cyclic linkage (case 1).\n");</div><div class='del'>-</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * This algorithm is recursive because the amount of used stack</div><div class='del'>-	 * space is very small and the max recursion depth is limited.</div><div class='del'>-	 */</div><div class='del'>-	list_for_each_entry(l, &amp;block-&gt;ref_to_list, node_ref_to) {</div><div class='del'>-		if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_VERBOSE)</div><div class='del'>-			pr_info(</div><div class='del'>-		"rl=%d, %c @%llu (%pg/%llu/%d) %u* refers to %c @%llu (%pg/%llu/%d)\n",</div><div class='del'>-			       recursion_level,</div><div class='del'>-			       btrfsic_get_block_type(state, block),</div><div class='del'>-			       block-&gt;logical_bytenr, block-&gt;dev_state-&gt;bdev,</div><div class='del'>-			       block-&gt;dev_bytenr, block-&gt;mirror_num,</div><div class='del'>-			       l-&gt;ref_cnt,</div><div class='del'>-			       btrfsic_get_block_type(state, l-&gt;block_ref_to),</div><div class='del'>-			       l-&gt;block_ref_to-&gt;logical_bytenr,</div><div class='del'>-			       l-&gt;block_ref_to-&gt;dev_state-&gt;bdev,</div><div class='del'>-			       l-&gt;block_ref_to-&gt;dev_bytenr,</div><div class='del'>-			       l-&gt;block_ref_to-&gt;mirror_num);</div><div class='del'>-		if (l-&gt;block_ref_to-&gt;never_written) {</div><div class='del'>-			pr_info(</div><div class='del'>-"btrfs: attempt to write superblock which references block %c @%llu (%pg/%llu/%d) which is never written!\n",</div><div class='del'>-			       btrfsic_get_block_type(state, l-&gt;block_ref_to),</div><div class='del'>-			       l-&gt;block_ref_to-&gt;logical_bytenr,</div><div class='del'>-			       l-&gt;block_ref_to-&gt;dev_state-&gt;bdev,</div><div class='del'>-			       l-&gt;block_ref_to-&gt;dev_bytenr,</div><div class='del'>-			       l-&gt;block_ref_to-&gt;mirror_num);</div><div class='del'>-			ret = -1;</div><div class='del'>-		} else if (!l-&gt;block_ref_to-&gt;is_iodone) {</div><div class='del'>-			pr_info(</div><div class='del'>-"btrfs: attempt to write superblock which references block %c @%llu (%pg/%llu/%d) which is not yet iodone!\n",</div><div class='del'>-			       btrfsic_get_block_type(state, l-&gt;block_ref_to),</div><div class='del'>-			       l-&gt;block_ref_to-&gt;logical_bytenr,</div><div class='del'>-			       l-&gt;block_ref_to-&gt;dev_state-&gt;bdev,</div><div class='del'>-			       l-&gt;block_ref_to-&gt;dev_bytenr,</div><div class='del'>-			       l-&gt;block_ref_to-&gt;mirror_num);</div><div class='del'>-			ret = -1;</div><div class='del'>-		} else if (l-&gt;block_ref_to-&gt;iodone_w_error) {</div><div class='del'>-			pr_info(</div><div class='del'>-"btrfs: attempt to write superblock which references block %c @%llu (%pg/%llu/%d) which has write error!\n",</div><div class='del'>-			       btrfsic_get_block_type(state, l-&gt;block_ref_to),</div><div class='del'>-			       l-&gt;block_ref_to-&gt;logical_bytenr,</div><div class='del'>-			       l-&gt;block_ref_to-&gt;dev_state-&gt;bdev,</div><div class='del'>-			       l-&gt;block_ref_to-&gt;dev_bytenr,</div><div class='del'>-			       l-&gt;block_ref_to-&gt;mirror_num);</div><div class='del'>-			ret = -1;</div><div class='del'>-		} else if (l-&gt;parent_generation !=</div><div class='del'>-			   l-&gt;block_ref_to-&gt;generation &amp;&amp;</div><div class='del'>-			   BTRFSIC_GENERATION_UNKNOWN !=</div><div class='del'>-			   l-&gt;parent_generation &amp;&amp;</div><div class='del'>-			   BTRFSIC_GENERATION_UNKNOWN !=</div><div class='del'>-			   l-&gt;block_ref_to-&gt;generation) {</div><div class='del'>-			pr_info(</div><div class='del'>-"btrfs: attempt to write superblock which references block %c @%llu (%pg/%llu/%d) with generation %llu != parent generation %llu!\n",</div><div class='del'>-			       btrfsic_get_block_type(state, l-&gt;block_ref_to),</div><div class='del'>-			       l-&gt;block_ref_to-&gt;logical_bytenr,</div><div class='del'>-			       l-&gt;block_ref_to-&gt;dev_state-&gt;bdev,</div><div class='del'>-			       l-&gt;block_ref_to-&gt;dev_bytenr,</div><div class='del'>-			       l-&gt;block_ref_to-&gt;mirror_num,</div><div class='del'>-			       l-&gt;block_ref_to-&gt;generation,</div><div class='del'>-			       l-&gt;parent_generation);</div><div class='del'>-			ret = -1;</div><div class='del'>-		} else if (l-&gt;block_ref_to-&gt;flush_gen &gt;</div><div class='del'>-			   l-&gt;block_ref_to-&gt;dev_state-&gt;last_flush_gen) {</div><div class='del'>-			pr_info(</div><div class='del'>-"btrfs: attempt to write superblock which references block %c @%llu (%pg/%llu/%d) which is not flushed out of disk's write cache (block flush_gen=%llu, dev-&gt;flush_gen=%llu)!\n",</div><div class='del'>-			       btrfsic_get_block_type(state, l-&gt;block_ref_to),</div><div class='del'>-			       l-&gt;block_ref_to-&gt;logical_bytenr,</div><div class='del'>-			       l-&gt;block_ref_to-&gt;dev_state-&gt;bdev,</div><div class='del'>-			       l-&gt;block_ref_to-&gt;dev_bytenr,</div><div class='del'>-			       l-&gt;block_ref_to-&gt;mirror_num, block-&gt;flush_gen,</div><div class='del'>-			       l-&gt;block_ref_to-&gt;dev_state-&gt;last_flush_gen);</div><div class='del'>-			ret = -1;</div><div class='del'>-		} else if (-1 == btrfsic_check_all_ref_blocks(state,</div><div class='del'>-							      l-&gt;block_ref_to,</div><div class='del'>-							      recursion_level +</div><div class='del'>-							      1)) {</div><div class='del'>-			ret = -1;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int btrfsic_is_block_ref_by_superblock(</div><div class='del'>-		const struct btrfsic_state *state,</div><div class='del'>-		const struct btrfsic_block *block,</div><div class='del'>-		int recursion_level)</div><div class='del'>-{</div><div class='del'>-	const struct btrfsic_block_link *l;</div><div class='del'>-</div><div class='del'>-	if (recursion_level &gt;= 3 + BTRFS_MAX_LEVEL) {</div><div class='del'>-		/* refer to comment at "abort cyclic linkage (case 1)" */</div><div class='del'>-		if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_VERBOSE)</div><div class='del'>-			pr_info("btrfsic: abort cyclic linkage (case 2).\n");</div><div class='del'>-</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * This algorithm is recursive because the amount of used stack space</div><div class='del'>-	 * is very small and the max recursion depth is limited.</div><div class='del'>-	 */</div><div class='del'>-	list_for_each_entry(l, &amp;block-&gt;ref_from_list, node_ref_from) {</div><div class='del'>-		if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_VERBOSE)</div><div class='del'>-			pr_info(</div><div class='del'>-	"rl=%d, %c @%llu (%pg/%llu/%d) is ref %u* from %c @%llu (%pg/%llu/%d)\n",</div><div class='del'>-			       recursion_level,</div><div class='del'>-			       btrfsic_get_block_type(state, block),</div><div class='del'>-			       block-&gt;logical_bytenr, block-&gt;dev_state-&gt;bdev,</div><div class='del'>-			       block-&gt;dev_bytenr, block-&gt;mirror_num,</div><div class='del'>-			       l-&gt;ref_cnt,</div><div class='del'>-			       btrfsic_get_block_type(state, l-&gt;block_ref_from),</div><div class='del'>-			       l-&gt;block_ref_from-&gt;logical_bytenr,</div><div class='del'>-			       l-&gt;block_ref_from-&gt;dev_state-&gt;bdev,</div><div class='del'>-			       l-&gt;block_ref_from-&gt;dev_bytenr,</div><div class='del'>-			       l-&gt;block_ref_from-&gt;mirror_num);</div><div class='del'>-		if (l-&gt;block_ref_from-&gt;is_superblock &amp;&amp;</div><div class='del'>-		    state-&gt;latest_superblock-&gt;dev_bytenr ==</div><div class='del'>-		    l-&gt;block_ref_from-&gt;dev_bytenr &amp;&amp;</div><div class='del'>-		    state-&gt;latest_superblock-&gt;dev_state-&gt;bdev ==</div><div class='del'>-		    l-&gt;block_ref_from-&gt;dev_state-&gt;bdev)</div><div class='del'>-			return 1;</div><div class='del'>-		else if (btrfsic_is_block_ref_by_superblock(state,</div><div class='del'>-							    l-&gt;block_ref_from,</div><div class='del'>-							    recursion_level +</div><div class='del'>-							    1))</div><div class='del'>-			return 1;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfsic_print_add_link(const struct btrfsic_state *state,</div><div class='del'>-				   const struct btrfsic_block_link *l)</div><div class='del'>-{</div><div class='del'>-	pr_info("add %u* link from %c @%llu (%pg/%llu/%d) to %c @%llu (%pg/%llu/%d)\n",</div><div class='del'>-	       l-&gt;ref_cnt,</div><div class='del'>-	       btrfsic_get_block_type(state, l-&gt;block_ref_from),</div><div class='del'>-	       l-&gt;block_ref_from-&gt;logical_bytenr,</div><div class='del'>-	       l-&gt;block_ref_from-&gt;dev_state-&gt;bdev,</div><div class='del'>-	       l-&gt;block_ref_from-&gt;dev_bytenr, l-&gt;block_ref_from-&gt;mirror_num,</div><div class='del'>-	       btrfsic_get_block_type(state, l-&gt;block_ref_to),</div><div class='del'>-	       l-&gt;block_ref_to-&gt;logical_bytenr,</div><div class='del'>-	       l-&gt;block_ref_to-&gt;dev_state-&gt;bdev, l-&gt;block_ref_to-&gt;dev_bytenr,</div><div class='del'>-	       l-&gt;block_ref_to-&gt;mirror_num);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfsic_print_rem_link(const struct btrfsic_state *state,</div><div class='del'>-				   const struct btrfsic_block_link *l)</div><div class='del'>-{</div><div class='del'>-	pr_info("rem %u* link from %c @%llu (%pg/%llu/%d) to %c @%llu (%pg/%llu/%d)\n",</div><div class='del'>-	       l-&gt;ref_cnt,</div><div class='del'>-	       btrfsic_get_block_type(state, l-&gt;block_ref_from),</div><div class='del'>-	       l-&gt;block_ref_from-&gt;logical_bytenr,</div><div class='del'>-	       l-&gt;block_ref_from-&gt;dev_state-&gt;bdev,</div><div class='del'>-	       l-&gt;block_ref_from-&gt;dev_bytenr, l-&gt;block_ref_from-&gt;mirror_num,</div><div class='del'>-	       btrfsic_get_block_type(state, l-&gt;block_ref_to),</div><div class='del'>-	       l-&gt;block_ref_to-&gt;logical_bytenr,</div><div class='del'>-	       l-&gt;block_ref_to-&gt;dev_state-&gt;bdev, l-&gt;block_ref_to-&gt;dev_bytenr,</div><div class='del'>-	       l-&gt;block_ref_to-&gt;mirror_num);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static char btrfsic_get_block_type(const struct btrfsic_state *state,</div><div class='del'>-				   const struct btrfsic_block *block)</div><div class='del'>-{</div><div class='del'>-	if (block-&gt;is_superblock &amp;&amp;</div><div class='del'>-	    state-&gt;latest_superblock-&gt;dev_bytenr == block-&gt;dev_bytenr &amp;&amp;</div><div class='del'>-	    state-&gt;latest_superblock-&gt;dev_state-&gt;bdev == block-&gt;dev_state-&gt;bdev)</div><div class='del'>-		return 'S';</div><div class='del'>-	else if (block-&gt;is_superblock)</div><div class='del'>-		return 's';</div><div class='del'>-	else if (block-&gt;is_metadata)</div><div class='del'>-		return 'M';</div><div class='del'>-	else</div><div class='del'>-		return 'D';</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfsic_dump_tree(const struct btrfsic_state *state)</div><div class='del'>-{</div><div class='del'>-	btrfsic_dump_tree_sub(state, state-&gt;latest_superblock, 0);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfsic_dump_tree_sub(const struct btrfsic_state *state,</div><div class='del'>-				  const struct btrfsic_block *block,</div><div class='del'>-				  int indent_level)</div><div class='del'>-{</div><div class='del'>-	const struct btrfsic_block_link *l;</div><div class='del'>-	int indent_add;</div><div class='del'>-	static char buf[80];</div><div class='del'>-	int cursor_position;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Should better fill an on-stack buffer with a complete line and</div><div class='del'>-	 * dump it at once when it is time to print a newline character.</div><div class='del'>-	 */</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * This algorithm is recursive because the amount of used stack space</div><div class='del'>-	 * is very small and the max recursion depth is limited.</div><div class='del'>-	 */</div><div class='del'>-	indent_add = sprintf(buf, "%c-%llu(%pg/%llu/%u)",</div><div class='del'>-			     btrfsic_get_block_type(state, block),</div><div class='del'>-			     block-&gt;logical_bytenr, block-&gt;dev_state-&gt;bdev,</div><div class='del'>-			     block-&gt;dev_bytenr, block-&gt;mirror_num);</div><div class='del'>-	if (indent_level + indent_add &gt; BTRFSIC_TREE_DUMP_MAX_INDENT_LEVEL) {</div><div class='del'>-		printk("[...]\n");</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-	printk(buf);</div><div class='del'>-	indent_level += indent_add;</div><div class='del'>-	if (list_empty(&amp;block-&gt;ref_to_list)) {</div><div class='del'>-		printk("\n");</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-	if (block-&gt;mirror_num &gt; 1 &amp;&amp;</div><div class='del'>-	    !(state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_TREE_WITH_ALL_MIRRORS)) {</div><div class='del'>-		printk(" [...]\n");</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	cursor_position = indent_level;</div><div class='del'>-	list_for_each_entry(l, &amp;block-&gt;ref_to_list, node_ref_to) {</div><div class='del'>-		while (cursor_position &lt; indent_level) {</div><div class='del'>-			printk(" ");</div><div class='del'>-			cursor_position++;</div><div class='del'>-		}</div><div class='del'>-		if (l-&gt;ref_cnt &gt; 1)</div><div class='del'>-			indent_add = sprintf(buf, " %d*--&gt; ", l-&gt;ref_cnt);</div><div class='del'>-		else</div><div class='del'>-			indent_add = sprintf(buf, " --&gt; ");</div><div class='del'>-		if (indent_level + indent_add &gt;</div><div class='del'>-		    BTRFSIC_TREE_DUMP_MAX_INDENT_LEVEL) {</div><div class='del'>-			printk("[...]\n");</div><div class='del'>-			cursor_position = 0;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		printk(buf);</div><div class='del'>-</div><div class='del'>-		btrfsic_dump_tree_sub(state, l-&gt;block_ref_to,</div><div class='del'>-				      indent_level + indent_add);</div><div class='del'>-		cursor_position = 0;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct btrfsic_block_link *btrfsic_block_link_lookup_or_add(</div><div class='del'>-		struct btrfsic_state *state,</div><div class='del'>-		struct btrfsic_block_data_ctx *next_block_ctx,</div><div class='del'>-		struct btrfsic_block *next_block,</div><div class='del'>-		struct btrfsic_block *from_block,</div><div class='del'>-		u64 parent_generation)</div><div class='del'>-{</div><div class='del'>-	struct btrfsic_block_link *l;</div><div class='del'>-</div><div class='del'>-	l = btrfsic_block_link_hashtable_lookup(next_block_ctx-&gt;dev-&gt;bdev,</div><div class='del'>-						next_block_ctx-&gt;dev_bytenr,</div><div class='del'>-						from_block-&gt;dev_state-&gt;bdev,</div><div class='del'>-						from_block-&gt;dev_bytenr,</div><div class='del'>-						&amp;state-&gt;block_link_hashtable);</div><div class='del'>-	if (NULL == l) {</div><div class='del'>-		l = btrfsic_block_link_alloc();</div><div class='del'>-		if (!l)</div><div class='del'>-			return NULL;</div><div class='del'>-</div><div class='del'>-		l-&gt;block_ref_to = next_block;</div><div class='del'>-		l-&gt;block_ref_from = from_block;</div><div class='del'>-		l-&gt;ref_cnt = 1;</div><div class='del'>-		l-&gt;parent_generation = parent_generation;</div><div class='del'>-</div><div class='del'>-		if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_VERBOSE)</div><div class='del'>-			btrfsic_print_add_link(state, l);</div><div class='del'>-</div><div class='del'>-		list_add(&amp;l-&gt;node_ref_to, &amp;from_block-&gt;ref_to_list);</div><div class='del'>-		list_add(&amp;l-&gt;node_ref_from, &amp;next_block-&gt;ref_from_list);</div><div class='del'>-</div><div class='del'>-		btrfsic_block_link_hashtable_add(l,</div><div class='del'>-						 &amp;state-&gt;block_link_hashtable);</div><div class='del'>-	} else {</div><div class='del'>-		l-&gt;ref_cnt++;</div><div class='del'>-		l-&gt;parent_generation = parent_generation;</div><div class='del'>-		if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_VERBOSE)</div><div class='del'>-			btrfsic_print_add_link(state, l);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return l;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct btrfsic_block *btrfsic_block_lookup_or_add(</div><div class='del'>-		struct btrfsic_state *state,</div><div class='del'>-		struct btrfsic_block_data_ctx *block_ctx,</div><div class='del'>-		const char *additional_string,</div><div class='del'>-		int is_metadata,</div><div class='del'>-		int is_iodone,</div><div class='del'>-		int never_written,</div><div class='del'>-		int mirror_num,</div><div class='del'>-		int *was_created)</div><div class='del'>-{</div><div class='del'>-	struct btrfsic_block *block;</div><div class='del'>-</div><div class='del'>-	block = btrfsic_block_hashtable_lookup(block_ctx-&gt;dev-&gt;bdev,</div><div class='del'>-					       block_ctx-&gt;dev_bytenr,</div><div class='del'>-					       &amp;state-&gt;block_hashtable);</div><div class='del'>-	if (NULL == block) {</div><div class='del'>-		struct btrfsic_dev_state *dev_state;</div><div class='del'>-</div><div class='del'>-		block = btrfsic_block_alloc();</div><div class='del'>-		if (!block)</div><div class='del'>-			return NULL;</div><div class='del'>-</div><div class='del'>-		dev_state = btrfsic_dev_state_lookup(block_ctx-&gt;dev-&gt;bdev-&gt;bd_dev);</div><div class='del'>-		if (NULL == dev_state) {</div><div class='del'>-			pr_info("btrfsic: error, lookup dev_state failed!\n");</div><div class='del'>-			btrfsic_block_free(block);</div><div class='del'>-			return NULL;</div><div class='del'>-		}</div><div class='del'>-		block-&gt;dev_state = dev_state;</div><div class='del'>-		block-&gt;dev_bytenr = block_ctx-&gt;dev_bytenr;</div><div class='del'>-		block-&gt;logical_bytenr = block_ctx-&gt;start;</div><div class='del'>-		block-&gt;is_metadata = is_metadata;</div><div class='del'>-		block-&gt;is_iodone = is_iodone;</div><div class='del'>-		block-&gt;never_written = never_written;</div><div class='del'>-		block-&gt;mirror_num = mirror_num;</div><div class='del'>-		if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_VERBOSE)</div><div class='del'>-			pr_info("New %s%c-block @%llu (%pg/%llu/%d)\n",</div><div class='del'>-			       additional_string,</div><div class='del'>-			       btrfsic_get_block_type(state, block),</div><div class='del'>-			       block-&gt;logical_bytenr, dev_state-&gt;bdev,</div><div class='del'>-			       block-&gt;dev_bytenr, mirror_num);</div><div class='del'>-		list_add(&amp;block-&gt;all_blocks_node, &amp;state-&gt;all_blocks_list);</div><div class='del'>-		btrfsic_block_hashtable_add(block, &amp;state-&gt;block_hashtable);</div><div class='del'>-		if (NULL != was_created)</div><div class='del'>-			*was_created = 1;</div><div class='del'>-	} else {</div><div class='del'>-		if (NULL != was_created)</div><div class='del'>-			*was_created = 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return block;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfsic_cmp_log_and_dev_bytenr(struct btrfsic_state *state,</div><div class='del'>-					   u64 bytenr,</div><div class='del'>-					   struct btrfsic_dev_state *dev_state,</div><div class='del'>-					   u64 dev_bytenr)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = state-&gt;fs_info;</div><div class='del'>-	struct btrfsic_block_data_ctx block_ctx;</div><div class='del'>-	int num_copies;</div><div class='del'>-	int mirror_num;</div><div class='del'>-	int match = 0;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	num_copies = btrfs_num_copies(fs_info, bytenr, state-&gt;metablock_size);</div><div class='del'>-</div><div class='del'>-	for (mirror_num = 1; mirror_num &lt;= num_copies; mirror_num++) {</div><div class='del'>-		ret = btrfsic_map_block(state, bytenr, state-&gt;metablock_size,</div><div class='del'>-					&amp;block_ctx, mirror_num);</div><div class='del'>-		if (ret) {</div><div class='del'>-			pr_info("btrfsic: btrfsic_map_block(logical @%llu, mirror %d) failed!\n",</div><div class='del'>-			       bytenr, mirror_num);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (dev_state-&gt;bdev == block_ctx.dev-&gt;bdev &amp;&amp;</div><div class='del'>-		    dev_bytenr == block_ctx.dev_bytenr) {</div><div class='del'>-			match++;</div><div class='del'>-			btrfsic_release_block_ctx(&amp;block_ctx);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		btrfsic_release_block_ctx(&amp;block_ctx);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (WARN_ON(!match)) {</div><div class='del'>-		pr_info(</div><div class='del'>-"btrfs: attempt to write M-block which contains logical bytenr that doesn't map to dev+physical bytenr of submit_bio, buffer-&gt;log_bytenr=%llu, submit_bio(bdev=%pg, phys_bytenr=%llu)!\n",</div><div class='del'>-		       bytenr, dev_state-&gt;bdev, dev_bytenr);</div><div class='del'>-		for (mirror_num = 1; mirror_num &lt;= num_copies; mirror_num++) {</div><div class='del'>-			ret = btrfsic_map_block(state, bytenr,</div><div class='del'>-						state-&gt;metablock_size,</div><div class='del'>-						&amp;block_ctx, mirror_num);</div><div class='del'>-			if (ret)</div><div class='del'>-				continue;</div><div class='del'>-</div><div class='del'>-			pr_info("read logical bytenr @%llu maps to (%pg/%llu/%d)\n",</div><div class='del'>-			       bytenr, block_ctx.dev-&gt;bdev,</div><div class='del'>-			       block_ctx.dev_bytenr, mirror_num);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct btrfsic_dev_state *btrfsic_dev_state_lookup(dev_t dev)</div><div class='del'>-{</div><div class='del'>-	return btrfsic_dev_state_hashtable_lookup(dev,</div><div class='del'>-						  &amp;btrfsic_dev_state_hashtable);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void __btrfsic_submit_bio(struct bio *bio)</div><div class='del'>-{</div><div class='del'>-	struct btrfsic_dev_state *dev_state;</div><div class='del'>-</div><div class='del'>-	if (!btrfsic_is_initialized)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;btrfsic_mutex);</div><div class='del'>-	/* since btrfsic_submit_bio() is also called before</div><div class='del'>-	 * btrfsic_mount(), this might return NULL */</div><div class='del'>-	dev_state = btrfsic_dev_state_lookup(bio-&gt;bi_bdev-&gt;bd_dev);</div><div class='del'>-	if (NULL != dev_state &amp;&amp;</div><div class='del'>-	    (bio_op(bio) == REQ_OP_WRITE) &amp;&amp; bio_has_data(bio)) {</div><div class='del'>-		int i = 0;</div><div class='del'>-		u64 dev_bytenr;</div><div class='del'>-		u64 cur_bytenr;</div><div class='del'>-		struct bio_vec bvec;</div><div class='del'>-		struct bvec_iter iter;</div><div class='del'>-		int bio_is_patched;</div><div class='del'>-		char **mapped_datav;</div><div class='del'>-		unsigned int segs = bio_segments(bio);</div><div class='del'>-</div><div class='del'>-		dev_bytenr = 512 * bio-&gt;bi_iter.bi_sector;</div><div class='del'>-		bio_is_patched = 0;</div><div class='del'>-		if (dev_state-&gt;state-&gt;print_mask &amp;</div><div class='del'>-		    BTRFSIC_PRINT_MASK_SUBMIT_BIO_BH)</div><div class='del'>-			pr_info("submit_bio(rw=%d,0x%x, bi_vcnt=%u, bi_sector=%llu (bytenr %llu), bi_bdev=%p)\n",</div><div class='del'>-			       bio_op(bio), bio-&gt;bi_opf, segs,</div><div class='del'>-			       bio-&gt;bi_iter.bi_sector, dev_bytenr, bio-&gt;bi_bdev);</div><div class='del'>-</div><div class='del'>-		mapped_datav = kmalloc_array(segs,</div><div class='del'>-					     sizeof(*mapped_datav), GFP_NOFS);</div><div class='del'>-		if (!mapped_datav)</div><div class='del'>-			goto leave;</div><div class='del'>-		cur_bytenr = dev_bytenr;</div><div class='del'>-</div><div class='del'>-		bio_for_each_segment(bvec, bio, iter) {</div><div class='del'>-			BUG_ON(bvec.bv_len != PAGE_SIZE);</div><div class='del'>-			mapped_datav[i] = page_address(bvec.bv_page);</div><div class='del'>-			i++;</div><div class='del'>-</div><div class='del'>-			if (dev_state-&gt;state-&gt;print_mask &amp;</div><div class='del'>-			    BTRFSIC_PRINT_MASK_SUBMIT_BIO_BH_VERBOSE)</div><div class='del'>-				pr_info("#%u: bytenr=%llu, len=%u, offset=%u\n",</div><div class='del'>-				       i, cur_bytenr, bvec.bv_len, bvec.bv_offset);</div><div class='del'>-			cur_bytenr += bvec.bv_len;</div><div class='del'>-		}</div><div class='del'>-		btrfsic_process_written_block(dev_state, dev_bytenr,</div><div class='del'>-					      mapped_datav, segs,</div><div class='del'>-					      bio, &amp;bio_is_patched,</div><div class='del'>-					      bio-&gt;bi_opf);</div><div class='del'>-		kfree(mapped_datav);</div><div class='del'>-	} else if (NULL != dev_state &amp;&amp; (bio-&gt;bi_opf &amp; REQ_PREFLUSH)) {</div><div class='del'>-		if (dev_state-&gt;state-&gt;print_mask &amp;</div><div class='del'>-		    BTRFSIC_PRINT_MASK_SUBMIT_BIO_BH)</div><div class='del'>-			pr_info("submit_bio(rw=%d,0x%x FLUSH, bdev=%p)\n",</div><div class='del'>-			       bio_op(bio), bio-&gt;bi_opf, bio-&gt;bi_bdev);</div><div class='del'>-		if (!dev_state-&gt;dummy_block_for_bio_bh_flush.is_iodone) {</div><div class='del'>-			if ((dev_state-&gt;state-&gt;print_mask &amp;</div><div class='del'>-			     (BTRFSIC_PRINT_MASK_SUBMIT_BIO_BH |</div><div class='del'>-			      BTRFSIC_PRINT_MASK_VERBOSE)))</div><div class='del'>-				pr_info(</div><div class='del'>-"btrfsic_submit_bio(%pg) with FLUSH but dummy block already in use (ignored)!\n",</div><div class='del'>-				       dev_state-&gt;bdev);</div><div class='del'>-		} else {</div><div class='del'>-			struct btrfsic_block *const block =</div><div class='del'>-				&amp;dev_state-&gt;dummy_block_for_bio_bh_flush;</div><div class='del'>-</div><div class='del'>-			block-&gt;is_iodone = 0;</div><div class='del'>-			block-&gt;never_written = 0;</div><div class='del'>-			block-&gt;iodone_w_error = 0;</div><div class='del'>-			block-&gt;flush_gen = dev_state-&gt;last_flush_gen + 1;</div><div class='del'>-			block-&gt;submit_bio_bh_rw = bio-&gt;bi_opf;</div><div class='del'>-			block-&gt;orig_bio_private = bio-&gt;bi_private;</div><div class='del'>-			block-&gt;orig_bio_end_io = bio-&gt;bi_end_io;</div><div class='del'>-			block-&gt;next_in_same_bio = NULL;</div><div class='del'>-			bio-&gt;bi_private = block;</div><div class='del'>-			bio-&gt;bi_end_io = btrfsic_bio_end_io;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-leave:</div><div class='del'>-	mutex_unlock(&amp;btrfsic_mutex);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void btrfsic_submit_bio(struct bio *bio)</div><div class='del'>-{</div><div class='del'>-	__btrfsic_submit_bio(bio);</div><div class='del'>-	submit_bio(bio);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int btrfsic_submit_bio_wait(struct bio *bio)</div><div class='del'>-{</div><div class='del'>-	__btrfsic_submit_bio(bio);</div><div class='del'>-	return submit_bio_wait(bio);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int btrfsic_mount(struct btrfs_fs_info *fs_info,</div><div class='del'>-		  struct btrfs_fs_devices *fs_devices,</div><div class='del'>-		  int including_extent_data, u32 print_mask)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-	struct btrfsic_state *state;</div><div class='del'>-	struct list_head *dev_head = &amp;fs_devices-&gt;devices;</div><div class='del'>-	struct btrfs_device *device;</div><div class='del'>-</div><div class='del'>-	if (!PAGE_ALIGNED(fs_info-&gt;nodesize)) {</div><div class='del'>-		pr_info("btrfsic: cannot handle nodesize %d not being a multiple of PAGE_SIZE %ld!\n",</div><div class='del'>-		       fs_info-&gt;nodesize, PAGE_SIZE);</div><div class='del'>-		return -1;</div><div class='del'>-	}</div><div class='del'>-	if (!PAGE_ALIGNED(fs_info-&gt;sectorsize)) {</div><div class='del'>-		pr_info("btrfsic: cannot handle sectorsize %d not being a multiple of PAGE_SIZE %ld!\n",</div><div class='del'>-		       fs_info-&gt;sectorsize, PAGE_SIZE);</div><div class='del'>-		return -1;</div><div class='del'>-	}</div><div class='del'>-	state = kvzalloc(sizeof(*state), GFP_KERNEL);</div><div class='del'>-	if (!state)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	if (!btrfsic_is_initialized) {</div><div class='del'>-		mutex_init(&amp;btrfsic_mutex);</div><div class='del'>-		btrfsic_dev_state_hashtable_init(&amp;btrfsic_dev_state_hashtable);</div><div class='del'>-		btrfsic_is_initialized = 1;</div><div class='del'>-	}</div><div class='del'>-	mutex_lock(&amp;btrfsic_mutex);</div><div class='del'>-	state-&gt;fs_info = fs_info;</div><div class='del'>-	state-&gt;print_mask = print_mask;</div><div class='del'>-	state-&gt;include_extent_data = including_extent_data;</div><div class='del'>-	state-&gt;metablock_size = fs_info-&gt;nodesize;</div><div class='del'>-	state-&gt;datablock_size = fs_info-&gt;sectorsize;</div><div class='del'>-	INIT_LIST_HEAD(&amp;state-&gt;all_blocks_list);</div><div class='del'>-	btrfsic_block_hashtable_init(&amp;state-&gt;block_hashtable);</div><div class='del'>-	btrfsic_block_link_hashtable_init(&amp;state-&gt;block_link_hashtable);</div><div class='del'>-	state-&gt;max_superblock_generation = 0;</div><div class='del'>-	state-&gt;latest_superblock = NULL;</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(device, dev_head, dev_list) {</div><div class='del'>-		struct btrfsic_dev_state *ds;</div><div class='del'>-</div><div class='del'>-		if (!device-&gt;bdev || !device-&gt;name)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		ds = btrfsic_dev_state_alloc();</div><div class='del'>-		if (NULL == ds) {</div><div class='del'>-			mutex_unlock(&amp;btrfsic_mutex);</div><div class='del'>-			return -ENOMEM;</div><div class='del'>-		}</div><div class='del'>-		ds-&gt;bdev = device-&gt;bdev;</div><div class='del'>-		ds-&gt;state = state;</div><div class='del'>-		btrfsic_dev_state_hashtable_add(ds,</div><div class='del'>-						&amp;btrfsic_dev_state_hashtable);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = btrfsic_process_superblock(state, fs_devices);</div><div class='del'>-	if (0 != ret) {</div><div class='del'>-		mutex_unlock(&amp;btrfsic_mutex);</div><div class='del'>-		btrfsic_unmount(fs_devices);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_INITIAL_DATABASE)</div><div class='del'>-		btrfsic_dump_database(state);</div><div class='del'>-	if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_INITIAL_TREE)</div><div class='del'>-		btrfsic_dump_tree(state);</div><div class='del'>-</div><div class='del'>-	mutex_unlock(&amp;btrfsic_mutex);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void btrfsic_unmount(struct btrfs_fs_devices *fs_devices)</div><div class='del'>-{</div><div class='del'>-	struct btrfsic_block *b_all, *tmp_all;</div><div class='del'>-	struct btrfsic_state *state;</div><div class='del'>-	struct list_head *dev_head = &amp;fs_devices-&gt;devices;</div><div class='del'>-	struct btrfs_device *device;</div><div class='del'>-</div><div class='del'>-	if (!btrfsic_is_initialized)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;btrfsic_mutex);</div><div class='del'>-</div><div class='del'>-	state = NULL;</div><div class='del'>-	list_for_each_entry(device, dev_head, dev_list) {</div><div class='del'>-		struct btrfsic_dev_state *ds;</div><div class='del'>-</div><div class='del'>-		if (!device-&gt;bdev || !device-&gt;name)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		ds = btrfsic_dev_state_hashtable_lookup(</div><div class='del'>-				device-&gt;bdev-&gt;bd_dev,</div><div class='del'>-				&amp;btrfsic_dev_state_hashtable);</div><div class='del'>-		if (NULL != ds) {</div><div class='del'>-			state = ds-&gt;state;</div><div class='del'>-			btrfsic_dev_state_hashtable_remove(ds);</div><div class='del'>-			btrfsic_dev_state_free(ds);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (NULL == state) {</div><div class='del'>-		pr_info("btrfsic: error, cannot find state information on umount!\n");</div><div class='del'>-		mutex_unlock(&amp;btrfsic_mutex);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Don't care about keeping the lists' state up to date,</div><div class='del'>-	 * just free all memory that was allocated dynamically.</div><div class='del'>-	 * Free the blocks and the block_links.</div><div class='del'>-	 */</div><div class='del'>-	list_for_each_entry_safe(b_all, tmp_all, &amp;state-&gt;all_blocks_list,</div><div class='del'>-				 all_blocks_node) {</div><div class='del'>-		struct btrfsic_block_link *l, *tmp;</div><div class='del'>-</div><div class='del'>-		list_for_each_entry_safe(l, tmp, &amp;b_all-&gt;ref_to_list,</div><div class='del'>-					 node_ref_to) {</div><div class='del'>-			if (state-&gt;print_mask &amp; BTRFSIC_PRINT_MASK_VERBOSE)</div><div class='del'>-				btrfsic_print_rem_link(state, l);</div><div class='del'>-</div><div class='del'>-			l-&gt;ref_cnt--;</div><div class='del'>-			if (0 == l-&gt;ref_cnt)</div><div class='del'>-				btrfsic_block_link_free(l);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (b_all-&gt;is_iodone || b_all-&gt;never_written)</div><div class='del'>-			btrfsic_block_free(b_all);</div><div class='del'>-		else</div><div class='del'>-			pr_info(</div><div class='del'>-"btrfs: attempt to free %c-block @%llu (%pg/%llu/%d) on umount which is not yet iodone!\n",</div><div class='del'>-			       btrfsic_get_block_type(state, b_all),</div><div class='del'>-			       b_all-&gt;logical_bytenr, b_all-&gt;dev_state-&gt;bdev,</div><div class='del'>-			       b_all-&gt;dev_bytenr, b_all-&gt;mirror_num);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	mutex_unlock(&amp;btrfsic_mutex);</div><div class='del'>-</div><div class='del'>-	kvfree(state);</div><div class='del'>-}</div><div class='head'>diff --git a/fs/btrfs/check-integrity.h b/fs/btrfs/check-integrity.h<br/>deleted file mode 100644<br/>index bcc730a06cb5..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/check-integrity.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/check-integrity.h</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,22 +0,0 @@</div><div class='del'>-/* SPDX-License-Identifier: GPL-2.0 */</div><div class='del'>-/*</div><div class='del'>- * Copyright (C) STRATO AG 2011.  All rights reserved.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#ifndef BTRFS_CHECK_INTEGRITY_H</div><div class='del'>-#define BTRFS_CHECK_INTEGRITY_H</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_BTRFS_FS_CHECK_INTEGRITY</div><div class='del'>-void btrfsic_submit_bio(struct bio *bio);</div><div class='del'>-int btrfsic_submit_bio_wait(struct bio *bio);</div><div class='del'>-#else</div><div class='del'>-#define btrfsic_submit_bio submit_bio</div><div class='del'>-#define btrfsic_submit_bio_wait submit_bio_wait</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-int btrfsic_mount(struct btrfs_fs_info *fs_info,</div><div class='del'>-		  struct btrfs_fs_devices *fs_devices,</div><div class='del'>-		  int including_extent_data, u32 print_mask);</div><div class='del'>-void btrfsic_unmount(struct btrfs_fs_devices *fs_devices);</div><div class='del'>-</div><div class='del'>-#endif</div><div class='head'>diff --git a/fs/btrfs/compression.c b/fs/btrfs/compression.c<br/>index 32da97c3c19d..6b3357287b42 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/compression.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/compression.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/compression.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/compression.c</a></div><div class='hunk'>@@ -8,6 +8,7 @@</div><div class='ctx'> #include &lt;linux/file.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='add'>+#include &lt;linux/pagevec.h&gt;</div><div class='ctx'> #include &lt;linux/highmem.h&gt;</div><div class='ctx'> #include &lt;linux/kthread.h&gt;</div><div class='ctx'> #include &lt;linux/time.h&gt;</div><div class='hunk'>@@ -15,22 +16,26 @@</div><div class='ctx'> #include &lt;linux/string.h&gt;</div><div class='ctx'> #include &lt;linux/backing-dev.h&gt;</div><div class='ctx'> #include &lt;linux/writeback.h&gt;</div><div class='add'>+#include &lt;linux/psi.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/sched/mm.h&gt;</div><div class='ctx'> #include &lt;linux/log2.h&gt;</div><div class='add'>+#include &lt;linux/shrinker.h&gt;</div><div class='ctx'> #include &lt;crypto/hash.h&gt;</div><div class='ctx'> #include "misc.h"</div><div class='ctx'> #include "ctree.h"</div><div class='del'>-#include "disk-io.h"</div><div class='del'>-#include "transaction.h"</div><div class='add'>+#include "fs.h"</div><div class='ctx'> #include "btrfs_inode.h"</div><div class='del'>-#include "volumes.h"</div><div class='add'>+#include "bio.h"</div><div class='ctx'> #include "ordered-data.h"</div><div class='ctx'> #include "compression.h"</div><div class='ctx'> #include "extent_io.h"</div><div class='ctx'> #include "extent_map.h"</div><div class='ctx'> #include "subpage.h"</div><div class='del'>-#include "zoned.h"</div><div class='add'>+#include "messages.h"</div><div class='add'>+#include "super.h"</div><div class='add'>+</div><div class='add'>+static struct bio_set btrfs_compressed_bioset;</div><div class='ctx'> </div><div class='ctx'> static const char* const btrfs_compress_types[] = { "", "zlib", "lzo", "zstd" };</div><div class='ctx'> </div><div class='hunk'>@@ -49,6 +54,23 @@ const char* btrfs_compress_type2str(enum btrfs_compression_type type)</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline struct compressed_bio *to_compressed_bio(struct btrfs_bio *bbio)</div><div class='add'>+{</div><div class='add'>+	return container_of(bbio, struct compressed_bio, bbio);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct compressed_bio *alloc_compressed_bio(struct btrfs_inode *inode,</div><div class='add'>+						   u64 start, blk_opf_t op,</div><div class='add'>+						   btrfs_bio_end_io_t end_io)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_bio *bbio;</div><div class='add'>+</div><div class='add'>+	bbio = btrfs_bio(bio_alloc_bioset(NULL, BTRFS_MAX_COMPRESSED_PAGES, op,</div><div class='add'>+					  GFP_NOFS, &amp;btrfs_compressed_bioset));</div><div class='add'>+	btrfs_bio_init(bbio, inode, start, end_io, NULL);</div><div class='add'>+	return to_compressed_bio(bbio);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> bool btrfs_compress_is_valid_type(const char *str, size_t len)</div><div class='ctx'> {</div><div class='ctx'> 	int i;</div><div class='hunk'>@@ -66,20 +88,20 @@ bool btrfs_compress_is_valid_type(const char *str, size_t len)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int compression_compress_pages(int type, struct list_head *ws,</div><div class='del'>-               struct address_space *mapping, u64 start, struct page **pages,</div><div class='del'>-               unsigned long *out_pages, unsigned long *total_in,</div><div class='del'>-               unsigned long *total_out)</div><div class='add'>+				      struct btrfs_inode *inode, u64 start,</div><div class='add'>+				      struct folio **folios, unsigned long *out_folios,</div><div class='add'>+				      unsigned long *total_in, unsigned long *total_out)</div><div class='ctx'> {</div><div class='ctx'> 	switch (type) {</div><div class='ctx'> 	case BTRFS_COMPRESS_ZLIB:</div><div class='del'>-		return zlib_compress_pages(ws, mapping, start, pages,</div><div class='del'>-				out_pages, total_in, total_out);</div><div class='add'>+		return zlib_compress_folios(ws, inode, start, folios,</div><div class='add'>+					    out_folios, total_in, total_out);</div><div class='ctx'> 	case BTRFS_COMPRESS_LZO:</div><div class='del'>-		return lzo_compress_pages(ws, mapping, start, pages,</div><div class='del'>-				out_pages, total_in, total_out);</div><div class='add'>+		return lzo_compress_folios(ws, inode, start, folios,</div><div class='add'>+					   out_folios, total_in, total_out);</div><div class='ctx'> 	case BTRFS_COMPRESS_ZSTD:</div><div class='del'>-		return zstd_compress_pages(ws, mapping, start, pages,</div><div class='del'>-				out_pages, total_in, total_out);</div><div class='add'>+		return zstd_compress_folios(ws, inode, start, folios,</div><div class='add'>+					    out_folios, total_in, total_out);</div><div class='ctx'> 	case BTRFS_COMPRESS_NONE:</div><div class='ctx'> 	default:</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -91,15 +113,15 @@ static int compression_compress_pages(int type, struct list_head *ws,</div><div class='ctx'> 		 * Not a big deal, just need to inform caller that we</div><div class='ctx'> 		 * haven't allocated any pages yet.</div><div class='ctx'> 		 */</div><div class='del'>-		*out_pages = 0;</div><div class='add'>+		*out_folios = 0;</div><div class='ctx'> 		return -E2BIG;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int compression_decompress_bio(int type, struct list_head *ws,</div><div class='del'>-		struct compressed_bio *cb)</div><div class='add'>+static int compression_decompress_bio(struct list_head *ws,</div><div class='add'>+				      struct compressed_bio *cb)</div><div class='ctx'> {</div><div class='del'>-	switch (type) {</div><div class='add'>+	switch (cb-&gt;compress_type) {</div><div class='ctx'> 	case BTRFS_COMPRESS_ZLIB: return zlib_decompress_bio(ws, cb);</div><div class='ctx'> 	case BTRFS_COMPRESS_LZO:  return lzo_decompress_bio(ws, cb);</div><div class='ctx'> 	case BTRFS_COMPRESS_ZSTD: return zstd_decompress_bio(ws, cb);</div><div class='hunk'>@@ -114,16 +136,16 @@ static int compression_decompress_bio(int type, struct list_head *ws,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int compression_decompress(int type, struct list_head *ws,</div><div class='del'>-               unsigned char *data_in, struct page *dest_page,</div><div class='del'>-               unsigned long start_byte, size_t srclen, size_t destlen)</div><div class='add'>+		const u8 *data_in, struct folio *dest_folio,</div><div class='add'>+		unsigned long dest_pgoff, size_t srclen, size_t destlen)</div><div class='ctx'> {</div><div class='ctx'> 	switch (type) {</div><div class='del'>-	case BTRFS_COMPRESS_ZLIB: return zlib_decompress(ws, data_in, dest_page,</div><div class='del'>-						start_byte, srclen, destlen);</div><div class='del'>-	case BTRFS_COMPRESS_LZO:  return lzo_decompress(ws, data_in, dest_page,</div><div class='del'>-						start_byte, srclen, destlen);</div><div class='del'>-	case BTRFS_COMPRESS_ZSTD: return zstd_decompress(ws, data_in, dest_page,</div><div class='del'>-						start_byte, srclen, destlen);</div><div class='add'>+	case BTRFS_COMPRESS_ZLIB: return zlib_decompress(ws, data_in, dest_folio,</div><div class='add'>+						dest_pgoff, srclen, destlen);</div><div class='add'>+	case BTRFS_COMPRESS_LZO:  return lzo_decompress(ws, data_in, dest_folio,</div><div class='add'>+						dest_pgoff, srclen, destlen);</div><div class='add'>+	case BTRFS_COMPRESS_ZSTD: return zstd_decompress(ws, data_in, dest_folio,</div><div class='add'>+						dest_pgoff, srclen, destlen);</div><div class='ctx'> 	case BTRFS_COMPRESS_NONE:</div><div class='ctx'> 	default:</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -134,271 +156,165 @@ static int compression_decompress(int type, struct list_head *ws,</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btrfs_decompress_bio(struct compressed_bio *cb);</div><div class='del'>-</div><div class='del'>-static inline int compressed_bio_size(struct btrfs_fs_info *fs_info,</div><div class='del'>-				      unsigned long disk_size)</div><div class='add'>+static void btrfs_free_compressed_folios(struct compressed_bio *cb)</div><div class='ctx'> {</div><div class='del'>-	return sizeof(struct compressed_bio) +</div><div class='del'>-		(DIV_ROUND_UP(disk_size, fs_info-&gt;sectorsize)) * fs_info-&gt;csum_size;</div><div class='add'>+	for (unsigned int i = 0; i &lt; cb-&gt;nr_folios; i++)</div><div class='add'>+		btrfs_free_compr_folio(cb-&gt;compressed_folios[i]);</div><div class='add'>+	kfree(cb-&gt;compressed_folios);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int check_compressed_csum(struct btrfs_inode *inode, struct bio *bio,</div><div class='del'>-				 u64 disk_start)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='del'>-	SHASH_DESC_ON_STACK(shash, fs_info-&gt;csum_shash);</div><div class='del'>-	const u32 csum_size = fs_info-&gt;csum_size;</div><div class='del'>-	const u32 sectorsize = fs_info-&gt;sectorsize;</div><div class='del'>-	struct page *page;</div><div class='del'>-	unsigned int i;</div><div class='del'>-	char *kaddr;</div><div class='del'>-	u8 csum[BTRFS_CSUM_SIZE];</div><div class='del'>-	struct compressed_bio *cb = bio-&gt;bi_private;</div><div class='del'>-	u8 *cb_sum = cb-&gt;sums;</div><div class='del'>-</div><div class='del'>-	if (!fs_info-&gt;csum_root || (inode-&gt;flags &amp; BTRFS_INODE_NODATASUM))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	shash-&gt;tfm = fs_info-&gt;csum_shash;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; cb-&gt;nr_pages; i++) {</div><div class='del'>-		u32 pg_offset;</div><div class='del'>-		u32 bytes_left = PAGE_SIZE;</div><div class='del'>-		page = cb-&gt;compressed_pages[i];</div><div class='del'>-</div><div class='del'>-		/* Determine the remaining bytes inside the page first */</div><div class='del'>-		if (i == cb-&gt;nr_pages - 1)</div><div class='del'>-			bytes_left = cb-&gt;compressed_len - i * PAGE_SIZE;</div><div class='del'>-</div><div class='del'>-		/* Hash through the page sector by sector */</div><div class='del'>-		for (pg_offset = 0; pg_offset &lt; bytes_left;</div><div class='del'>-		     pg_offset += sectorsize) {</div><div class='del'>-			kaddr = kmap_atomic(page);</div><div class='del'>-			crypto_shash_digest(shash, kaddr + pg_offset,</div><div class='del'>-					    sectorsize, csum);</div><div class='del'>-			kunmap_atomic(kaddr);</div><div class='del'>-</div><div class='del'>-			if (memcmp(&amp;csum, cb_sum, csum_size) != 0) {</div><div class='del'>-				btrfs_print_data_csum_error(inode, disk_start,</div><div class='del'>-						csum, cb_sum, cb-&gt;mirror_num);</div><div class='del'>-				if (btrfs_bio(bio)-&gt;device)</div><div class='del'>-					btrfs_dev_stat_inc_and_print(</div><div class='del'>-						btrfs_bio(bio)-&gt;device,</div><div class='del'>-						BTRFS_DEV_STAT_CORRUPTION_ERRS);</div><div class='del'>-				return -EIO;</div><div class='del'>-			}</div><div class='del'>-			cb_sum += csum_size;</div><div class='del'>-			disk_start += sectorsize;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='add'>+static int btrfs_decompress_bio(struct compressed_bio *cb);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Reduce bio and io accounting for a compressed_bio with its corresponding bio.</div><div class='del'>- *</div><div class='del'>- * Return true if there is no pending bio nor io.</div><div class='del'>- * Return false otherwise.</div><div class='add'>+ * Global cache of last unused pages for compression/decompression.</div><div class='ctx'>  */</div><div class='del'>-static bool dec_and_test_compressed_bio(struct compressed_bio *cb, struct bio *bio)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(cb-&gt;inode-&gt;i_sb);</div><div class='del'>-	unsigned int bi_size = 0;</div><div class='del'>-	bool last_io = false;</div><div class='del'>-	struct bio_vec *bvec;</div><div class='del'>-	struct bvec_iter_all iter_all;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * At endio time, bi_iter.bi_size doesn't represent the real bio size.</div><div class='del'>-	 * Thus here we have to iterate through all segments to grab correct</div><div class='del'>-	 * bio size.</div><div class='del'>-	 */</div><div class='del'>-	bio_for_each_segment_all(bvec, bio, iter_all)</div><div class='del'>-		bi_size += bvec-&gt;bv_len;</div><div class='add'>+static struct btrfs_compr_pool {</div><div class='add'>+	struct shrinker *shrinker;</div><div class='add'>+	spinlock_t lock;</div><div class='add'>+	struct list_head list;</div><div class='add'>+	int count;</div><div class='add'>+	int thresh;</div><div class='add'>+} compr_pool;</div><div class='ctx'> </div><div class='del'>-	if (bio-&gt;bi_status)</div><div class='del'>-		cb-&gt;errors = 1;</div><div class='add'>+static unsigned long btrfs_compr_pool_count(struct shrinker *sh, struct shrink_control *sc)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	ASSERT(bi_size &amp;&amp; bi_size &lt;= cb-&gt;compressed_len);</div><div class='del'>-	last_io = refcount_sub_and_test(bi_size &gt;&gt; fs_info-&gt;sectorsize_bits,</div><div class='del'>-					&amp;cb-&gt;pending_sectors);</div><div class='ctx'> 	/*</div><div class='del'>-	 * Here we must wake up the possible error handler after all other</div><div class='del'>-	 * operations on @cb finished, or we can race with</div><div class='del'>-	 * finish_compressed_bio_*() which may free @cb.</div><div class='add'>+	 * We must not read the values more than once if 'ret' gets expanded in</div><div class='add'>+	 * the return statement so we don't accidentally return a negative</div><div class='add'>+	 * number, even if the first condition finds it positive.</div><div class='ctx'> 	 */</div><div class='del'>-	wake_up_var(cb);</div><div class='add'>+	ret = READ_ONCE(compr_pool.count) - READ_ONCE(compr_pool.thresh);</div><div class='ctx'> </div><div class='del'>-	return last_io;</div><div class='add'>+	return ret &gt; 0 ? ret : 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void finish_compressed_bio_read(struct compressed_bio *cb, struct bio *bio)</div><div class='add'>+static unsigned long btrfs_compr_pool_scan(struct shrinker *sh, struct shrink_control *sc)</div><div class='ctx'> {</div><div class='del'>-	unsigned int index;</div><div class='del'>-	struct page *page;</div><div class='add'>+	LIST_HEAD(remove);</div><div class='add'>+	struct list_head *tmp, *next;</div><div class='add'>+	int freed;</div><div class='add'>+</div><div class='add'>+	if (compr_pool.count == 0)</div><div class='add'>+		return SHRINK_STOP;</div><div class='ctx'> </div><div class='del'>-	/* Release the compressed pages */</div><div class='del'>-	for (index = 0; index &lt; cb-&gt;nr_pages; index++) {</div><div class='del'>-		page = cb-&gt;compressed_pages[index];</div><div class='del'>-		page-&gt;mapping = NULL;</div><div class='add'>+	/* For now, just simply drain the whole list. */</div><div class='add'>+	spin_lock(&amp;compr_pool.lock);</div><div class='add'>+	list_splice_init(&amp;compr_pool.list, &amp;remove);</div><div class='add'>+	freed = compr_pool.count;</div><div class='add'>+	compr_pool.count = 0;</div><div class='add'>+	spin_unlock(&amp;compr_pool.lock);</div><div class='add'>+</div><div class='add'>+	list_for_each_safe(tmp, next, &amp;remove) {</div><div class='add'>+		struct page *page = list_entry(tmp, struct page, lru);</div><div class='add'>+</div><div class='add'>+		ASSERT(page_ref_count(page) == 1);</div><div class='ctx'> 		put_page(page);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Do io completion on the original bio */</div><div class='del'>-	if (cb-&gt;errors) {</div><div class='del'>-		bio_io_error(cb-&gt;orig_bio);</div><div class='del'>-	} else {</div><div class='del'>-		struct bio_vec *bvec;</div><div class='del'>-		struct bvec_iter_all iter_all;</div><div class='add'>+	return freed;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		ASSERT(bio);</div><div class='del'>-		ASSERT(!bio-&gt;bi_status);</div><div class='del'>-		/*</div><div class='del'>-		 * We have verified the checksum already, set page checked so</div><div class='del'>-		 * the end_io handlers know about it</div><div class='del'>-		 */</div><div class='del'>-		ASSERT(!bio_flagged(bio, BIO_CLONED));</div><div class='del'>-		bio_for_each_segment_all(bvec, cb-&gt;orig_bio, iter_all) {</div><div class='del'>-			u64 bvec_start = page_offset(bvec-&gt;bv_page) +</div><div class='del'>-					 bvec-&gt;bv_offset;</div><div class='del'>-</div><div class='del'>-			btrfs_page_set_checked(btrfs_sb(cb-&gt;inode-&gt;i_sb),</div><div class='del'>-					bvec-&gt;bv_page, bvec_start,</div><div class='del'>-					bvec-&gt;bv_len);</div><div class='del'>-		}</div><div class='add'>+/*</div><div class='add'>+ * Common wrappers for page allocation from compression wrappers</div><div class='add'>+ */</div><div class='add'>+struct folio *btrfs_alloc_compr_folio(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	struct folio *folio = NULL;</div><div class='add'>+</div><div class='add'>+	/* For bs &gt; ps cases, no cached folio pool for now. */</div><div class='add'>+	if (fs_info-&gt;block_min_order)</div><div class='add'>+		goto alloc;</div><div class='ctx'> </div><div class='del'>-		bio_endio(cb-&gt;orig_bio);</div><div class='add'>+	spin_lock(&amp;compr_pool.lock);</div><div class='add'>+	if (compr_pool.count &gt; 0) {</div><div class='add'>+		folio = list_first_entry(&amp;compr_pool.list, struct folio, lru);</div><div class='add'>+		list_del_init(&amp;folio-&gt;lru);</div><div class='add'>+		compr_pool.count--;</div><div class='ctx'> 	}</div><div class='add'>+	spin_unlock(&amp;compr_pool.lock);</div><div class='ctx'> </div><div class='del'>-	/* Finally free the cb struct */</div><div class='del'>-	kfree(cb-&gt;compressed_pages);</div><div class='del'>-	kfree(cb);</div><div class='add'>+	if (folio)</div><div class='add'>+		return folio;</div><div class='add'>+</div><div class='add'>+alloc:</div><div class='add'>+	return folio_alloc(GFP_NOFS, fs_info-&gt;block_min_order);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* when we finish reading compressed pages from the disk, we</div><div class='del'>- * decompress them and then run the bio end_io routines on the</div><div class='del'>- * decompressed pages (in the inode address space).</div><div class='del'>- *</div><div class='del'>- * This allows the checksumming and other IO error handling routines</div><div class='del'>- * to work normally</div><div class='del'>- *</div><div class='del'>- * The compressed pages are freed here, and it must be run</div><div class='del'>- * in process context</div><div class='del'>- */</div><div class='del'>-static void end_compressed_bio_read(struct bio *bio)</div><div class='add'>+void btrfs_free_compr_folio(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct compressed_bio *cb = bio-&gt;bi_private;</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	unsigned int mirror = btrfs_bio(bio)-&gt;mirror_num;</div><div class='del'>-	int ret = 0;</div><div class='add'>+	bool do_free = false;</div><div class='ctx'> </div><div class='del'>-	if (!dec_and_test_compressed_bio(cb, bio))</div><div class='del'>-		goto out;</div><div class='add'>+	/* The folio is from bs &gt; ps fs, no cached pool for now. */</div><div class='add'>+	if (folio_order(folio))</div><div class='add'>+		goto free;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Record the correct mirror_num in cb-&gt;orig_bio so that</div><div class='del'>-	 * read-repair can work properly.</div><div class='del'>-	 */</div><div class='del'>-	btrfs_bio(cb-&gt;orig_bio)-&gt;mirror_num = mirror;</div><div class='del'>-	cb-&gt;mirror_num = mirror;</div><div class='add'>+	spin_lock(&amp;compr_pool.lock);</div><div class='add'>+	if (compr_pool.count &gt; compr_pool.thresh) {</div><div class='add'>+		do_free = true;</div><div class='add'>+	} else {</div><div class='add'>+		list_add(&amp;folio-&gt;lru, &amp;compr_pool.list);</div><div class='add'>+		compr_pool.count++;</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;compr_pool.lock);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Some IO in this cb have failed, just skip checksum as there</div><div class='del'>-	 * is no way it could be correct.</div><div class='del'>-	 */</div><div class='del'>-	if (cb-&gt;errors == 1)</div><div class='del'>-		goto csum_failed;</div><div class='add'>+	if (!do_free)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	inode = cb-&gt;inode;</div><div class='del'>-	ret = check_compressed_csum(BTRFS_I(inode), bio,</div><div class='del'>-				    bio-&gt;bi_iter.bi_sector &lt;&lt; 9);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto csum_failed;</div><div class='add'>+free:</div><div class='add'>+	ASSERT(folio_ref_count(folio) == 1);</div><div class='add'>+	folio_put(folio);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	/* ok, we're the last bio for this extent, lets start</div><div class='del'>-	 * the decompression.</div><div class='del'>-	 */</div><div class='del'>-	ret = btrfs_decompress_bio(cb);</div><div class='add'>+static void end_bbio_compressed_read(struct btrfs_bio *bbio)</div><div class='add'>+{</div><div class='add'>+	struct compressed_bio *cb = to_compressed_bio(bbio);</div><div class='add'>+	blk_status_t status = bbio-&gt;bio.bi_status;</div><div class='ctx'> </div><div class='del'>-csum_failed:</div><div class='del'>-	if (ret)</div><div class='del'>-		cb-&gt;errors = 1;</div><div class='del'>-	finish_compressed_bio_read(cb, bio);</div><div class='del'>-out:</div><div class='del'>-	bio_put(bio);</div><div class='add'>+	if (!status)</div><div class='add'>+		status = errno_to_blk_status(btrfs_decompress_bio(cb));</div><div class='add'>+</div><div class='add'>+	btrfs_free_compressed_folios(cb);</div><div class='add'>+	btrfs_bio_end_io(cb-&gt;orig_bbio, status);</div><div class='add'>+	bio_put(&amp;bbio-&gt;bio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Clear the writeback bits on all of the file</div><div class='ctx'>  * pages for a compressed write</div><div class='ctx'>  */</div><div class='del'>-static noinline void end_compressed_writeback(struct inode *inode,</div><div class='del'>-					      const struct compressed_bio *cb)</div><div class='add'>+static noinline void end_compressed_writeback(const struct compressed_bio *cb)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	unsigned long index = cb-&gt;start &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	unsigned long end_index = (cb-&gt;start + cb-&gt;len - 1) &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	struct page *pages[16];</div><div class='del'>-	unsigned long nr_pages = end_index - index + 1;</div><div class='add'>+	struct inode *inode = &amp;cb-&gt;bbio.inode-&gt;vfs_inode;</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='add'>+	pgoff_t index = cb-&gt;start &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	const pgoff_t end_index = (cb-&gt;start + cb-&gt;len - 1) &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	struct folio_batch fbatch;</div><div class='ctx'> 	int i;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (cb-&gt;errors)</div><div class='del'>-		mapping_set_error(inode-&gt;i_mapping, -EIO);</div><div class='del'>-</div><div class='del'>-	while (nr_pages &gt; 0) {</div><div class='del'>-		ret = find_get_pages_contig(inode-&gt;i_mapping, index,</div><div class='del'>-				     min_t(unsigned long,</div><div class='del'>-				     nr_pages, ARRAY_SIZE(pages)), pages);</div><div class='del'>-		if (ret == 0) {</div><div class='del'>-			nr_pages -= 1;</div><div class='del'>-			index += 1;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-		for (i = 0; i &lt; ret; i++) {</div><div class='del'>-			if (cb-&gt;errors)</div><div class='del'>-				SetPageError(pages[i]);</div><div class='del'>-			btrfs_page_clamp_clear_writeback(fs_info, pages[i],</div><div class='del'>-							 cb-&gt;start, cb-&gt;len);</div><div class='del'>-			put_page(pages[i]);</div><div class='del'>-		}</div><div class='del'>-		nr_pages -= ret;</div><div class='del'>-		index += ret;</div><div class='del'>-	}</div><div class='del'>-	/* the inode may be gone now */</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void finish_compressed_bio_write(struct compressed_bio *cb)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = cb-&gt;inode;</div><div class='del'>-	unsigned int index;</div><div class='add'>+	ret = blk_status_to_errno(cb-&gt;bbio.bio.bi_status);</div><div class='add'>+	if (ret)</div><div class='add'>+		mapping_set_error(inode-&gt;i_mapping, ret);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Ok, we're the last bio for this extent, step one is to call back</div><div class='del'>-	 * into the FS and do all the end_io operations.</div><div class='del'>-	 */</div><div class='del'>-	btrfs_writepage_endio_finish_ordered(BTRFS_I(inode), NULL,</div><div class='del'>-			cb-&gt;start, cb-&gt;start + cb-&gt;len - 1,</div><div class='del'>-			!cb-&gt;errors);</div><div class='add'>+	folio_batch_init(&amp;fbatch);</div><div class='add'>+	while (index &lt;= end_index) {</div><div class='add'>+		ret = filemap_get_folios(inode-&gt;i_mapping, &amp;index, end_index,</div><div class='add'>+				&amp;fbatch);</div><div class='ctx'> </div><div class='del'>-	end_compressed_writeback(inode, cb);</div><div class='del'>-	/* Note, our inode could be gone now */</div><div class='add'>+		if (ret == 0)</div><div class='add'>+			return;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Release the compressed pages, these came from alloc_page and</div><div class='del'>-	 * are not attached to the inode at all</div><div class='del'>-	 */</div><div class='del'>-	for (index = 0; index &lt; cb-&gt;nr_pages; index++) {</div><div class='del'>-		struct page *page = cb-&gt;compressed_pages[index];</div><div class='add'>+		for (i = 0; i &lt; ret; i++) {</div><div class='add'>+			struct folio *folio = fbatch.folios[i];</div><div class='ctx'> </div><div class='del'>-		page-&gt;mapping = NULL;</div><div class='del'>-		put_page(page);</div><div class='add'>+			btrfs_folio_clamp_clear_writeback(fs_info, folio,</div><div class='add'>+							  cb-&gt;start, cb-&gt;len);</div><div class='add'>+		}</div><div class='add'>+		folio_batch_release(&amp;fbatch);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	/* Finally free the cb struct */</div><div class='del'>-	kfree(cb-&gt;compressed_pages);</div><div class='del'>-	kfree(cb);</div><div class='add'>+	/* the inode may be gone now */</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -408,86 +324,37 @@ static void finish_compressed_bio_write(struct compressed_bio *cb)</div><div class='ctx'>  * This also calls the writeback end hooks for the file pages so that metadata</div><div class='ctx'>  * and checksums can be updated in the file.</div><div class='ctx'>  */</div><div class='del'>-static void end_compressed_bio_write(struct bio *bio)</div><div class='add'>+static void end_bbio_compressed_write(struct btrfs_bio *bbio)</div><div class='ctx'> {</div><div class='del'>-	struct compressed_bio *cb = bio-&gt;bi_private;</div><div class='del'>-</div><div class='del'>-	if (!dec_and_test_compressed_bio(cb, bio))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	btrfs_record_physical_zoned(cb-&gt;inode, cb-&gt;start, bio);</div><div class='del'>-</div><div class='del'>-	finish_compressed_bio_write(cb);</div><div class='del'>-out:</div><div class='del'>-	bio_put(bio);</div><div class='del'>-}</div><div class='add'>+	struct compressed_bio *cb = to_compressed_bio(bbio);</div><div class='ctx'> </div><div class='del'>-static blk_status_t submit_compressed_bio(struct btrfs_fs_info *fs_info,</div><div class='del'>-					  struct compressed_bio *cb,</div><div class='del'>-					  struct bio *bio, int mirror_num)</div><div class='del'>-{</div><div class='del'>-	blk_status_t ret;</div><div class='add'>+	btrfs_finish_ordered_extent(cb-&gt;bbio.ordered, NULL, cb-&gt;start, cb-&gt;len,</div><div class='add'>+				    cb-&gt;bbio.bio.bi_status == BLK_STS_OK);</div><div class='ctx'> </div><div class='del'>-	ASSERT(bio-&gt;bi_iter.bi_size);</div><div class='del'>-	ret = btrfs_bio_wq_end_io(fs_info, bio, BTRFS_WQ_ENDIO_DATA);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-	ret = btrfs_map_bio(fs_info, bio, mirror_num);</div><div class='del'>-	return ret;</div><div class='add'>+	if (cb-&gt;writeback)</div><div class='add'>+		end_compressed_writeback(cb);</div><div class='add'>+	/* Note, our inode could be gone now. */</div><div class='add'>+	btrfs_free_compressed_folios(cb);</div><div class='add'>+	bio_put(&amp;cb-&gt;bbio.bio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Allocate a compressed_bio, which will be used to read/write on-disk</div><div class='del'>- * (aka, compressed) * data.</div><div class='del'>- *</div><div class='del'>- * @cb:                 The compressed_bio structure, which records all the needed</div><div class='del'>- *                      information to bind the compressed data to the uncompressed</div><div class='del'>- *                      page cache.</div><div class='del'>- * @disk_byten:         The logical bytenr where the compressed data will be read</div><div class='del'>- *                      from or written to.</div><div class='del'>- * @endio_func:         The endio function to call after the IO for compressed data</div><div class='del'>- *                      is finished.</div><div class='del'>- * @next_stripe_start:  Return value of logical bytenr of where next stripe starts.</div><div class='del'>- *                      Let the caller know to only fill the bio up to the stripe</div><div class='del'>- *                      boundary.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-static struct bio *alloc_compressed_bio(struct compressed_bio *cb, u64 disk_bytenr,</div><div class='del'>-					unsigned int opf, bio_end_io_t endio_func,</div><div class='del'>-					u64 *next_stripe_start)</div><div class='add'>+static void btrfs_add_compressed_bio_folios(struct compressed_bio *cb)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(cb-&gt;inode-&gt;i_sb);</div><div class='del'>-	struct btrfs_io_geometry geom;</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	struct bio *bio;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	bio = btrfs_bio_alloc(BIO_MAX_VECS);</div><div class='del'>-</div><div class='del'>-	bio-&gt;bi_iter.bi_sector = disk_bytenr &gt;&gt; SECTOR_SHIFT;</div><div class='del'>-	bio-&gt;bi_opf = opf;</div><div class='del'>-	bio-&gt;bi_private = cb;</div><div class='del'>-	bio-&gt;bi_end_io = endio_func;</div><div class='del'>-</div><div class='del'>-	em = btrfs_get_chunk_map(fs_info, disk_bytenr, fs_info-&gt;sectorsize);</div><div class='del'>-	if (IS_ERR(em)) {</div><div class='del'>-		bio_put(bio);</div><div class='del'>-		return ERR_CAST(em);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (bio_op(bio) == REQ_OP_ZONE_APPEND)</div><div class='del'>-		bio_set_dev(bio, em-&gt;map_lookup-&gt;stripes[0].dev-&gt;bdev);</div><div class='del'>-</div><div class='del'>-	ret = btrfs_get_io_geometry(fs_info, em, btrfs_op(bio), disk_bytenr, &amp;geom);</div><div class='del'>-	free_extent_map(em);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		bio_put(bio);</div><div class='del'>-		return ERR_PTR(ret);</div><div class='add'>+	struct bio *bio = &amp;cb-&gt;bbio.bio;</div><div class='add'>+	u32 offset = 0;</div><div class='add'>+	unsigned int findex = 0;</div><div class='add'>+</div><div class='add'>+	while (offset &lt; cb-&gt;compressed_len) {</div><div class='add'>+		struct folio *folio = cb-&gt;compressed_folios[findex];</div><div class='add'>+		u32 len = min_t(u32, cb-&gt;compressed_len - offset, folio_size(folio));</div><div class='add'>+		int ret;</div><div class='add'>+</div><div class='add'>+		/* Maximum compressed extent is smaller than bio size limit. */</div><div class='add'>+		ret = bio_add_folio(bio, folio, len, 0);</div><div class='add'>+		ASSERT(ret);</div><div class='add'>+		offset += len;</div><div class='add'>+		findex++;</div><div class='ctx'> 	}</div><div class='del'>-	*next_stripe_start = disk_bytenr + geom.len;</div><div class='del'>-</div><div class='del'>-	return bio;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -499,141 +366,33 @@ static struct bio *alloc_compressed_bio(struct compressed_bio *cb, u64 disk_byte</div><div class='ctx'>  * This also checksums the file bytes and gets things ready for</div><div class='ctx'>  * the end io hooks.</div><div class='ctx'>  */</div><div class='del'>-blk_status_t btrfs_submit_compressed_write(struct btrfs_inode *inode, u64 start,</div><div class='del'>-				 unsigned int len, u64 disk_start,</div><div class='del'>-				 unsigned int compressed_len,</div><div class='del'>-				 struct page **compressed_pages,</div><div class='del'>-				 unsigned int nr_pages,</div><div class='del'>-				 unsigned int write_flags,</div><div class='del'>-				 struct cgroup_subsys_state *blkcg_css)</div><div class='add'>+void btrfs_submit_compressed_write(struct btrfs_ordered_extent *ordered,</div><div class='add'>+				   struct folio **compressed_folios,</div><div class='add'>+				   unsigned int nr_folios,</div><div class='add'>+				   blk_opf_t write_flags,</div><div class='add'>+				   bool writeback)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_inode *inode = ordered-&gt;inode;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='del'>-	struct bio *bio = NULL;</div><div class='ctx'> 	struct compressed_bio *cb;</div><div class='del'>-	u64 cur_disk_bytenr = disk_start;</div><div class='del'>-	u64 next_stripe_start;</div><div class='del'>-	blk_status_t ret;</div><div class='del'>-	int skip_sum = inode-&gt;flags &amp; BTRFS_INODE_NODATASUM;</div><div class='del'>-	const bool use_append = btrfs_use_zone_append(inode, disk_start);</div><div class='del'>-	const unsigned int bio_op = use_append ? REQ_OP_ZONE_APPEND : REQ_OP_WRITE;</div><div class='del'>-</div><div class='del'>-	ASSERT(IS_ALIGNED(start, fs_info-&gt;sectorsize) &amp;&amp;</div><div class='del'>-	       IS_ALIGNED(len, fs_info-&gt;sectorsize));</div><div class='del'>-	cb = kmalloc(compressed_bio_size(fs_info, compressed_len), GFP_NOFS);</div><div class='del'>-	if (!cb)</div><div class='del'>-		return BLK_STS_RESOURCE;</div><div class='del'>-	refcount_set(&amp;cb-&gt;pending_sectors, compressed_len &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='del'>-	cb-&gt;errors = 0;</div><div class='del'>-	cb-&gt;inode = &amp;inode-&gt;vfs_inode;</div><div class='del'>-	cb-&gt;start = start;</div><div class='del'>-	cb-&gt;len = len;</div><div class='del'>-	cb-&gt;mirror_num = 0;</div><div class='del'>-	cb-&gt;compressed_pages = compressed_pages;</div><div class='del'>-	cb-&gt;compressed_len = compressed_len;</div><div class='del'>-	cb-&gt;orig_bio = NULL;</div><div class='del'>-	cb-&gt;nr_pages = nr_pages;</div><div class='del'>-</div><div class='del'>-	while (cur_disk_bytenr &lt; disk_start + compressed_len) {</div><div class='del'>-		u64 offset = cur_disk_bytenr - disk_start;</div><div class='del'>-		unsigned int index = offset &gt;&gt; PAGE_SHIFT;</div><div class='del'>-		unsigned int real_size;</div><div class='del'>-		unsigned int added;</div><div class='del'>-		struct page *page = compressed_pages[index];</div><div class='del'>-		bool submit = false;</div><div class='del'>-</div><div class='del'>-		/* Allocate new bio if submitted or not yet allocated */</div><div class='del'>-		if (!bio) {</div><div class='del'>-			bio = alloc_compressed_bio(cb, cur_disk_bytenr,</div><div class='del'>-				bio_op | write_flags, end_compressed_bio_write,</div><div class='del'>-				&amp;next_stripe_start);</div><div class='del'>-			if (IS_ERR(bio)) {</div><div class='del'>-				ret = errno_to_blk_status(PTR_ERR(bio));</div><div class='del'>-				bio = NULL;</div><div class='del'>-				goto finish_cb;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-		/*</div><div class='del'>-		 * We should never reach next_stripe_start start as we will</div><div class='del'>-		 * submit comp_bio when reach the boundary immediately.</div><div class='del'>-		 */</div><div class='del'>-		ASSERT(cur_disk_bytenr != next_stripe_start);</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * We have various limits on the real read size:</div><div class='del'>-		 * - stripe boundary</div><div class='del'>-		 * - page boundary</div><div class='del'>-		 * - compressed length boundary</div><div class='del'>-		 */</div><div class='del'>-		real_size = min_t(u64, U32_MAX, next_stripe_start - cur_disk_bytenr);</div><div class='del'>-		real_size = min_t(u64, real_size, PAGE_SIZE - offset_in_page(offset));</div><div class='del'>-		real_size = min_t(u64, real_size, compressed_len - offset);</div><div class='del'>-		ASSERT(IS_ALIGNED(real_size, fs_info-&gt;sectorsize));</div><div class='del'>-</div><div class='del'>-		if (use_append)</div><div class='del'>-			added = bio_add_zone_append_page(bio, page, real_size,</div><div class='del'>-					offset_in_page(offset));</div><div class='del'>-		else</div><div class='del'>-			added = bio_add_page(bio, page, real_size,</div><div class='del'>-					offset_in_page(offset));</div><div class='del'>-		/* Reached zoned boundary */</div><div class='del'>-		if (added == 0)</div><div class='del'>-			submit = true;</div><div class='del'>-</div><div class='del'>-		cur_disk_bytenr += added;</div><div class='del'>-		/* Reached stripe boundary */</div><div class='del'>-		if (cur_disk_bytenr == next_stripe_start)</div><div class='del'>-			submit = true;</div><div class='del'>-</div><div class='del'>-		/* Finished the range */</div><div class='del'>-		if (cur_disk_bytenr == disk_start + compressed_len)</div><div class='del'>-			submit = true;</div><div class='del'>-</div><div class='del'>-		if (submit) {</div><div class='del'>-			if (!skip_sum) {</div><div class='del'>-				ret = btrfs_csum_one_bio(inode, bio, start, 1);</div><div class='del'>-				if (ret)</div><div class='del'>-					goto finish_cb;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			ret = submit_compressed_bio(fs_info, cb, bio, 0);</div><div class='del'>-			if (ret)</div><div class='del'>-				goto finish_cb;</div><div class='del'>-			bio = NULL;</div><div class='del'>-		}</div><div class='del'>-		cond_resched();</div><div class='del'>-	}</div><div class='del'>-	if (blkcg_css)</div><div class='del'>-		kthread_associate_blkcg(NULL);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-finish_cb:</div><div class='del'>-	if (bio) {</div><div class='del'>-		bio-&gt;bi_status = ret;</div><div class='del'>-		bio_endio(bio);</div><div class='del'>-	}</div><div class='del'>-	/* Last byte of @cb is submitted, endio will free @cb */</div><div class='del'>-	if (cur_disk_bytenr == disk_start + compressed_len)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	wait_var_event(cb, refcount_read(&amp;cb-&gt;pending_sectors) ==</div><div class='del'>-			   (disk_start + compressed_len - cur_disk_bytenr) &gt;&gt;</div><div class='del'>-			   fs_info-&gt;sectorsize_bits);</div><div class='del'>-	/*</div><div class='del'>-	 * Even with previous bio ended, we should still have io not yet</div><div class='del'>-	 * submitted, thus need to finish manually.</div><div class='del'>-	 */</div><div class='del'>-	ASSERT(refcount_read(&amp;cb-&gt;pending_sectors));</div><div class='del'>-	/* Now we are the only one referring @cb, can finish it safely. */</div><div class='del'>-	finish_compressed_bio_write(cb);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static u64 bio_end_offset(struct bio *bio)</div><div class='del'>-{</div><div class='del'>-	struct bio_vec *last = bio_last_bvec_all(bio);</div><div class='del'>-</div><div class='del'>-	return page_offset(last-&gt;bv_page) + last-&gt;bv_len + last-&gt;bv_offset;</div><div class='add'>+	ASSERT(IS_ALIGNED(ordered-&gt;file_offset, fs_info-&gt;sectorsize));</div><div class='add'>+	ASSERT(IS_ALIGNED(ordered-&gt;num_bytes, fs_info-&gt;sectorsize));</div><div class='add'>+</div><div class='add'>+	cb = alloc_compressed_bio(inode, ordered-&gt;file_offset,</div><div class='add'>+				  REQ_OP_WRITE | write_flags,</div><div class='add'>+				  end_bbio_compressed_write);</div><div class='add'>+	cb-&gt;start = ordered-&gt;file_offset;</div><div class='add'>+	cb-&gt;len = ordered-&gt;num_bytes;</div><div class='add'>+	cb-&gt;compressed_folios = compressed_folios;</div><div class='add'>+	cb-&gt;compressed_len = ordered-&gt;disk_num_bytes;</div><div class='add'>+	cb-&gt;writeback = writeback;</div><div class='add'>+	cb-&gt;nr_folios = nr_folios;</div><div class='add'>+	cb-&gt;bbio.bio.bi_iter.bi_sector = ordered-&gt;disk_bytenr &gt;&gt; SECTOR_SHIFT;</div><div class='add'>+	cb-&gt;bbio.ordered = ordered;</div><div class='add'>+	btrfs_add_compressed_bio_folios(cb);</div><div class='add'>+</div><div class='add'>+	btrfs_submit_bbio(&amp;cb-&gt;bbio, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -649,14 +408,16 @@ static u64 bio_end_offset(struct bio *bio)</div><div class='ctx'>  */</div><div class='ctx'> static noinline int add_ra_bio_pages(struct inode *inode,</div><div class='ctx'> 				     u64 compressed_end,</div><div class='del'>-				     struct compressed_bio *cb)</div><div class='add'>+				     struct compressed_bio *cb,</div><div class='add'>+				     int *memstall, unsigned long *pflags)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	unsigned long end_index;</div><div class='del'>-	u64 cur = bio_end_offset(cb-&gt;orig_bio);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='add'>+	pgoff_t end_index;</div><div class='add'>+	struct bio *orig_bio = &amp;cb-&gt;orig_bbio-&gt;bio;</div><div class='add'>+	u64 cur = cb-&gt;orig_bbio-&gt;file_offset + orig_bio-&gt;bi_iter.bi_size;</div><div class='ctx'> 	u64 isize = i_size_read(inode);</div><div class='ctx'> 	int ret;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	struct extent_map *em;</div><div class='ctx'> 	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='ctx'> 	struct extent_map_tree *em_tree;</div><div class='hunk'>@@ -676,22 +437,30 @@ static noinline int add_ra_bio_pages(struct inode *inode,</div><div class='ctx'> 	 * This makes readahead less effective, so here disable readahead for</div><div class='ctx'> 	 * subpage for now, until full compressed write is supported.</div><div class='ctx'> 	 */</div><div class='del'>-	if (btrfs_sb(inode-&gt;i_sb)-&gt;sectorsize &lt; PAGE_SIZE)</div><div class='add'>+	if (fs_info-&gt;sectorsize &lt; PAGE_SIZE)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/* For bs &gt; ps cases, we don't support readahead for compressed folios for now. */</div><div class='add'>+	if (fs_info-&gt;block_min_order)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	end_index = (i_size_read(inode) - 1) &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> </div><div class='ctx'> 	while (cur &lt; compressed_end) {</div><div class='del'>-		u64 page_end;</div><div class='del'>-		u64 pg_index = cur &gt;&gt; PAGE_SHIFT;</div><div class='add'>+		pgoff_t page_end;</div><div class='add'>+		pgoff_t pg_index = cur &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> 		u32 add_size;</div><div class='ctx'> </div><div class='ctx'> 		if (pg_index &gt; end_index)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		page = xa_load(&amp;mapping-&gt;i_pages, pg_index);</div><div class='del'>-		if (page &amp;&amp; !xa_is_value(page)) {</div><div class='del'>-			sectors_missed += (PAGE_SIZE - offset_in_page(cur)) &gt;&gt;</div><div class='add'>+		folio = filemap_get_folio(mapping, pg_index);</div><div class='add'>+		if (!IS_ERR(folio)) {</div><div class='add'>+			u64 folio_sz = folio_size(folio);</div><div class='add'>+			u64 offset = offset_in_folio(folio, cur);</div><div class='add'>+</div><div class='add'>+			folio_put(folio);</div><div class='add'>+			sectors_missed += (folio_sz - offset) &gt;&gt;</div><div class='ctx'> 					  fs_info-&gt;sectorsize_bits;</div><div class='ctx'> </div><div class='ctx'> 			/* Beyond threshold, no need to continue */</div><div class='hunk'>@@ -702,33 +471,38 @@ static noinline int add_ra_bio_pages(struct inode *inode,</div><div class='ctx'> 			 * Jump to next page start as we already have page for</div><div class='ctx'> 			 * current offset.</div><div class='ctx'> 			 */</div><div class='del'>-			cur = (pg_index &lt;&lt; PAGE_SHIFT) + PAGE_SIZE;</div><div class='add'>+			cur += (folio_sz - offset);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		page = __page_cache_alloc(mapping_gfp_constraint(mapping,</div><div class='del'>-								 ~__GFP_FS));</div><div class='del'>-		if (!page)</div><div class='add'>+		folio = filemap_alloc_folio(mapping_gfp_constraint(mapping, ~__GFP_FS),</div><div class='add'>+					    0, NULL);</div><div class='add'>+		if (!folio)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		if (add_to_page_cache_lru(page, mapping, pg_index, GFP_NOFS)) {</div><div class='del'>-			put_page(page);</div><div class='add'>+		if (filemap_add_folio(mapping, folio, pg_index, GFP_NOFS)) {</div><div class='ctx'> 			/* There is already a page, skip to page end */</div><div class='del'>-			cur = (pg_index &lt;&lt; PAGE_SHIFT) + PAGE_SIZE;</div><div class='add'>+			cur += folio_size(folio);</div><div class='add'>+			folio_put(folio);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		ret = set_page_extent_mapped(page);</div><div class='add'>+		if (!*memstall &amp;&amp; folio_test_workingset(folio)) {</div><div class='add'>+			psi_memstall_enter(pflags);</div><div class='add'>+			*memstall = 1;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		ret = set_folio_extent_mapped(folio);</div><div class='ctx'> 		if (ret &lt; 0) {</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			put_page(page);</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+			folio_put(folio);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		page_end = (pg_index &lt;&lt; PAGE_SHIFT) + PAGE_SIZE - 1;</div><div class='del'>-		lock_extent(tree, cur, page_end);</div><div class='add'>+		page_end = (pg_index &lt;&lt; PAGE_SHIFT) + folio_size(folio) - 1;</div><div class='add'>+		btrfs_lock_extent(tree, cur, page_end, NULL);</div><div class='ctx'> 		read_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-		em = lookup_extent_mapping(em_tree, cur, page_end + 1 - cur);</div><div class='add'>+		em = btrfs_lookup_extent_mapping(em_tree, cur, page_end + 1 - cur);</div><div class='ctx'> 		read_unlock(&amp;em_tree-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='hunk'>@@ -737,33 +511,33 @@ static noinline int add_ra_bio_pages(struct inode *inode,</div><div class='ctx'> 		 * to this compressed extent on disk.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (!em || cur &lt; em-&gt;start ||</div><div class='del'>-		    (cur + fs_info-&gt;sectorsize &gt; extent_map_end(em)) ||</div><div class='del'>-		    (em-&gt;block_start &gt;&gt; 9) != cb-&gt;orig_bio-&gt;bi_iter.bi_sector) {</div><div class='del'>-			free_extent_map(em);</div><div class='del'>-			unlock_extent(tree, cur, page_end);</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			put_page(page);</div><div class='add'>+		    (cur + fs_info-&gt;sectorsize &gt; btrfs_extent_map_end(em)) ||</div><div class='add'>+		    (btrfs_extent_map_block_start(em) &gt;&gt; SECTOR_SHIFT) !=</div><div class='add'>+		    orig_bio-&gt;bi_iter.bi_sector) {</div><div class='add'>+			btrfs_free_extent_map(em);</div><div class='add'>+			btrfs_unlock_extent(tree, cur, page_end, NULL);</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+			folio_put(folio);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-		free_extent_map(em);</div><div class='add'>+		add_size = min(em-&gt;start + em-&gt;len, page_end + 1) - cur;</div><div class='add'>+		btrfs_free_extent_map(em);</div><div class='add'>+		btrfs_unlock_extent(tree, cur, page_end, NULL);</div><div class='ctx'> </div><div class='del'>-		if (page-&gt;index == end_index) {</div><div class='del'>-			size_t zero_offset = offset_in_page(isize);</div><div class='add'>+		if (folio_contains(folio, end_index)) {</div><div class='add'>+			size_t zero_offset = offset_in_folio(folio, isize);</div><div class='ctx'> </div><div class='ctx'> 			if (zero_offset) {</div><div class='ctx'> 				int zeros;</div><div class='del'>-				zeros = PAGE_SIZE - zero_offset;</div><div class='del'>-				memzero_page(page, zero_offset, zeros);</div><div class='del'>-				flush_dcache_page(page);</div><div class='add'>+				zeros = folio_size(folio) - zero_offset;</div><div class='add'>+				folio_zero_range(folio, zero_offset, zeros);</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		add_size = min(em-&gt;start + em-&gt;len, page_end + 1) - cur;</div><div class='del'>-		ret = bio_add_page(cb-&gt;orig_bio, page, add_size, offset_in_page(cur));</div><div class='del'>-		if (ret != add_size) {</div><div class='del'>-			unlock_extent(tree, cur, page_end);</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			put_page(page);</div><div class='add'>+		if (!bio_add_folio(orig_bio, folio, add_size,</div><div class='add'>+				   offset_in_folio(folio, cur))) {</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+			folio_put(folio);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -772,8 +546,8 @@ static noinline int add_ra_bio_pages(struct inode *inode,</div><div class='ctx'> 		 * subpage::readers and to unlock the page.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (fs_info-&gt;sectorsize &lt; PAGE_SIZE)</div><div class='del'>-			btrfs_subpage_start_reader(fs_info, page, cur, add_size);</div><div class='del'>-		put_page(page);</div><div class='add'>+			btrfs_folio_set_lock(fs_info, folio, cur, add_size);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 		cur += add_size;</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -790,187 +564,83 @@ static noinline int add_ra_bio_pages(struct inode *inode,</div><div class='ctx'>  * After the compressed pages are read, we copy the bytes into the</div><div class='ctx'>  * bio we were passed and then call the bio end_io calls</div><div class='ctx'>  */</div><div class='del'>-blk_status_t btrfs_submit_compressed_read(struct inode *inode, struct bio *bio,</div><div class='del'>-				 int mirror_num, unsigned long bio_flags)</div><div class='add'>+void btrfs_submit_compressed_read(struct btrfs_bio *bbio)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	struct extent_map_tree *em_tree;</div><div class='add'>+	struct btrfs_inode *inode = bbio-&gt;inode;</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	struct extent_map_tree *em_tree = &amp;inode-&gt;extent_tree;</div><div class='ctx'> 	struct compressed_bio *cb;</div><div class='ctx'> 	unsigned int compressed_len;</div><div class='del'>-	unsigned int nr_pages;</div><div class='del'>-	unsigned int pg_index;</div><div class='del'>-	struct bio *comp_bio = NULL;</div><div class='del'>-	const u64 disk_bytenr = bio-&gt;bi_iter.bi_sector &lt;&lt; SECTOR_SHIFT;</div><div class='del'>-	u64 cur_disk_byte = disk_bytenr;</div><div class='del'>-	u64 next_stripe_start;</div><div class='del'>-	u64 file_offset;</div><div class='add'>+	u64 file_offset = bbio-&gt;file_offset;</div><div class='ctx'> 	u64 em_len;</div><div class='ctx'> 	u64 em_start;</div><div class='ctx'> 	struct extent_map *em;</div><div class='del'>-	blk_status_t ret = BLK_STS_RESOURCE;</div><div class='del'>-	int faili = 0;</div><div class='del'>-	u8 *sums;</div><div class='del'>-</div><div class='del'>-	em_tree = &amp;BTRFS_I(inode)-&gt;extent_tree;</div><div class='del'>-</div><div class='del'>-	file_offset = bio_first_bvec_all(bio)-&gt;bv_offset +</div><div class='del'>-		      page_offset(bio_first_page_all(bio));</div><div class='add'>+	unsigned long pflags;</div><div class='add'>+	int memstall = 0;</div><div class='add'>+	blk_status_t status;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	/* we need the actual starting offset of this extent in the file */</div><div class='ctx'> 	read_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	em = lookup_extent_mapping(em_tree, file_offset, fs_info-&gt;sectorsize);</div><div class='add'>+	em = btrfs_lookup_extent_mapping(em_tree, file_offset, fs_info-&gt;sectorsize);</div><div class='ctx'> 	read_unlock(&amp;em_tree-&gt;lock);</div><div class='del'>-	if (!em)</div><div class='del'>-		return BLK_STS_IOERR;</div><div class='del'>-</div><div class='del'>-	ASSERT(em-&gt;compress_type != BTRFS_COMPRESS_NONE);</div><div class='del'>-	compressed_len = em-&gt;block_len;</div><div class='del'>-	cb = kmalloc(compressed_bio_size(fs_info, compressed_len), GFP_NOFS);</div><div class='del'>-	if (!cb)</div><div class='add'>+	if (!em) {</div><div class='add'>+		status = BLK_STS_IOERR;</div><div class='ctx'> 		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	refcount_set(&amp;cb-&gt;pending_sectors, compressed_len &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='del'>-	cb-&gt;errors = 0;</div><div class='del'>-	cb-&gt;inode = inode;</div><div class='del'>-	cb-&gt;mirror_num = mirror_num;</div><div class='del'>-	sums = cb-&gt;sums;</div><div class='add'>+	ASSERT(btrfs_extent_map_is_compressed(em));</div><div class='add'>+	compressed_len = em-&gt;disk_num_bytes;</div><div class='ctx'> </div><div class='del'>-	cb-&gt;start = em-&gt;orig_start;</div><div class='add'>+	cb = alloc_compressed_bio(inode, file_offset, REQ_OP_READ,</div><div class='add'>+				  end_bbio_compressed_read);</div><div class='add'>+</div><div class='add'>+	cb-&gt;start = em-&gt;start - em-&gt;offset;</div><div class='ctx'> 	em_len = em-&gt;len;</div><div class='ctx'> 	em_start = em-&gt;start;</div><div class='ctx'> </div><div class='del'>-	free_extent_map(em);</div><div class='del'>-	em = NULL;</div><div class='del'>-</div><div class='del'>-	cb-&gt;len = bio-&gt;bi_iter.bi_size;</div><div class='add'>+	cb-&gt;len = bbio-&gt;bio.bi_iter.bi_size;</div><div class='ctx'> 	cb-&gt;compressed_len = compressed_len;</div><div class='del'>-	cb-&gt;compress_type = extent_compress_type(bio_flags);</div><div class='del'>-	cb-&gt;orig_bio = bio;</div><div class='del'>-</div><div class='del'>-	nr_pages = DIV_ROUND_UP(compressed_len, PAGE_SIZE);</div><div class='del'>-	cb-&gt;compressed_pages = kcalloc(nr_pages, sizeof(struct page *),</div><div class='del'>-				       GFP_NOFS);</div><div class='del'>-	if (!cb-&gt;compressed_pages)</div><div class='del'>-		goto fail1;</div><div class='del'>-</div><div class='del'>-	for (pg_index = 0; pg_index &lt; nr_pages; pg_index++) {</div><div class='del'>-		cb-&gt;compressed_pages[pg_index] = alloc_page(GFP_NOFS);</div><div class='del'>-		if (!cb-&gt;compressed_pages[pg_index]) {</div><div class='del'>-			faili = pg_index - 1;</div><div class='del'>-			ret = BLK_STS_RESOURCE;</div><div class='del'>-			goto fail2;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	faili = nr_pages - 1;</div><div class='del'>-	cb-&gt;nr_pages = nr_pages;</div><div class='add'>+	cb-&gt;compress_type = btrfs_extent_map_compression(em);</div><div class='add'>+	cb-&gt;orig_bbio = bbio;</div><div class='add'>+	cb-&gt;bbio.csum_search_commit_root = bbio-&gt;csum_search_commit_root;</div><div class='ctx'> </div><div class='del'>-	add_ra_bio_pages(inode, em_start + em_len, cb);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='del'>-	/* include any pages we added in add_ra-bio_pages */</div><div class='del'>-	cb-&gt;len = bio-&gt;bi_iter.bi_size;</div><div class='del'>-</div><div class='del'>-	while (cur_disk_byte &lt; disk_bytenr + compressed_len) {</div><div class='del'>-		u64 offset = cur_disk_byte - disk_bytenr;</div><div class='del'>-		unsigned int index = offset &gt;&gt; PAGE_SHIFT;</div><div class='del'>-		unsigned int real_size;</div><div class='del'>-		unsigned int added;</div><div class='del'>-		struct page *page = cb-&gt;compressed_pages[index];</div><div class='del'>-		bool submit = false;</div><div class='del'>-</div><div class='del'>-		/* Allocate new bio if submitted or not yet allocated */</div><div class='del'>-		if (!comp_bio) {</div><div class='del'>-			comp_bio = alloc_compressed_bio(cb, cur_disk_byte,</div><div class='del'>-					REQ_OP_READ, end_compressed_bio_read,</div><div class='del'>-					&amp;next_stripe_start);</div><div class='del'>-			if (IS_ERR(comp_bio)) {</div><div class='del'>-				ret = errno_to_blk_status(PTR_ERR(comp_bio));</div><div class='del'>-				comp_bio = NULL;</div><div class='del'>-				goto finish_cb;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-		/*</div><div class='del'>-		 * We should never reach next_stripe_start start as we will</div><div class='del'>-		 * submit comp_bio when reach the boundary immediately.</div><div class='del'>-		 */</div><div class='del'>-		ASSERT(cur_disk_byte != next_stripe_start);</div><div class='del'>-		/*</div><div class='del'>-		 * We have various limit on the real read size:</div><div class='del'>-		 * - stripe boundary</div><div class='del'>-		 * - page boundary</div><div class='del'>-		 * - compressed length boundary</div><div class='del'>-		 */</div><div class='del'>-		real_size = min_t(u64, U32_MAX, next_stripe_start - cur_disk_byte);</div><div class='del'>-		real_size = min_t(u64, real_size, PAGE_SIZE - offset_in_page(offset));</div><div class='del'>-		real_size = min_t(u64, real_size, compressed_len - offset);</div><div class='del'>-		ASSERT(IS_ALIGNED(real_size, fs_info-&gt;sectorsize));</div><div class='del'>-</div><div class='del'>-		added = bio_add_page(comp_bio, page, real_size, offset_in_page(offset));</div><div class='del'>-		/*</div><div class='del'>-		 * Maximum compressed extent is smaller than bio size limit,</div><div class='del'>-		 * thus bio_add_page() should always success.</div><div class='del'>-		 */</div><div class='del'>-		ASSERT(added == real_size);</div><div class='del'>-		cur_disk_byte += added;</div><div class='del'>-</div><div class='del'>-		/* Reached stripe boundary, need to submit */</div><div class='del'>-		if (cur_disk_byte == next_stripe_start)</div><div class='del'>-			submit = true;</div><div class='del'>-</div><div class='del'>-		/* Has finished the range, need to submit */</div><div class='del'>-		if (cur_disk_byte == disk_bytenr + compressed_len)</div><div class='del'>-			submit = true;</div><div class='add'>+	cb-&gt;nr_folios = DIV_ROUND_UP(compressed_len, btrfs_min_folio_size(fs_info));</div><div class='add'>+	cb-&gt;compressed_folios = kcalloc(cb-&gt;nr_folios, sizeof(struct folio *), GFP_NOFS);</div><div class='add'>+	if (!cb-&gt;compressed_folios) {</div><div class='add'>+		status = BLK_STS_RESOURCE;</div><div class='add'>+		goto out_free_bio;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		if (submit) {</div><div class='del'>-			unsigned int nr_sectors;</div><div class='add'>+	ret = btrfs_alloc_folio_array(cb-&gt;nr_folios, fs_info-&gt;block_min_order,</div><div class='add'>+				      cb-&gt;compressed_folios);</div><div class='add'>+	if (ret) {</div><div class='add'>+		status = BLK_STS_RESOURCE;</div><div class='add'>+		goto out_free_compressed_pages;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-			ret = btrfs_lookup_bio_sums(inode, comp_bio, sums);</div><div class='del'>-			if (ret)</div><div class='del'>-				goto finish_cb;</div><div class='add'>+	add_ra_bio_pages(&amp;inode-&gt;vfs_inode, em_start + em_len, cb, &amp;memstall,</div><div class='add'>+			 &amp;pflags);</div><div class='ctx'> </div><div class='del'>-			nr_sectors = DIV_ROUND_UP(comp_bio-&gt;bi_iter.bi_size,</div><div class='del'>-						  fs_info-&gt;sectorsize);</div><div class='del'>-			sums += fs_info-&gt;csum_size * nr_sectors;</div><div class='add'>+	/* include any pages we added in add_ra-bio_pages */</div><div class='add'>+	cb-&gt;len = bbio-&gt;bio.bi_iter.bi_size;</div><div class='add'>+	cb-&gt;bbio.bio.bi_iter.bi_sector = bbio-&gt;bio.bi_iter.bi_sector;</div><div class='add'>+	btrfs_add_compressed_bio_folios(cb);</div><div class='ctx'> </div><div class='del'>-			ret = submit_compressed_bio(fs_info, cb, comp_bio, mirror_num);</div><div class='del'>-			if (ret)</div><div class='del'>-				goto finish_cb;</div><div class='del'>-			comp_bio = NULL;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='add'>+	if (memstall)</div><div class='add'>+		psi_memstall_leave(&amp;pflags);</div><div class='ctx'> </div><div class='del'>-fail2:</div><div class='del'>-	while (faili &gt;= 0) {</div><div class='del'>-		__free_page(cb-&gt;compressed_pages[faili]);</div><div class='del'>-		faili--;</div><div class='del'>-	}</div><div class='add'>+	btrfs_submit_bbio(&amp;cb-&gt;bbio, 0);</div><div class='add'>+	return;</div><div class='ctx'> </div><div class='del'>-	kfree(cb-&gt;compressed_pages);</div><div class='del'>-fail1:</div><div class='del'>-	kfree(cb);</div><div class='add'>+out_free_compressed_pages:</div><div class='add'>+	kfree(cb-&gt;compressed_folios);</div><div class='add'>+out_free_bio:</div><div class='add'>+	bio_put(&amp;cb-&gt;bbio.bio);</div><div class='ctx'> out:</div><div class='del'>-	free_extent_map(em);</div><div class='del'>-	return ret;</div><div class='del'>-finish_cb:</div><div class='del'>-	if (comp_bio) {</div><div class='del'>-		comp_bio-&gt;bi_status = ret;</div><div class='del'>-		bio_endio(comp_bio);</div><div class='del'>-	}</div><div class='del'>-	/* All bytes of @cb is submitted, endio will free @cb */</div><div class='del'>-	if (cur_disk_byte == disk_bytenr + compressed_len)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	wait_var_event(cb, refcount_read(&amp;cb-&gt;pending_sectors) ==</div><div class='del'>-			   (disk_bytenr + compressed_len - cur_disk_byte) &gt;&gt;</div><div class='del'>-			   fs_info-&gt;sectorsize_bits);</div><div class='del'>-	/*</div><div class='del'>-	 * Even with previous bio ended, we should still have io not yet</div><div class='del'>-	 * submitted, thus need to finish @cb manually.</div><div class='del'>-	 */</div><div class='del'>-	ASSERT(refcount_read(&amp;cb-&gt;pending_sectors));</div><div class='del'>-	/* Now we are the only one referring @cb, can finish it safely. */</div><div class='del'>-	finish_compressed_bio_read(cb, NULL);</div><div class='del'>-	return ret;</div><div class='add'>+	btrfs_bio_end_io(bbio, status);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1020,8 +690,6 @@ struct heuristic_ws {</div><div class='ctx'> 	struct list_head list;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static struct workspace_manager heuristic_wsm;</div><div class='del'>-</div><div class='ctx'> static void free_heuristic_ws(struct list_head *ws)</div><div class='ctx'> {</div><div class='ctx'> 	struct heuristic_ws *workspace;</div><div class='hunk'>@@ -1034,7 +702,7 @@ static void free_heuristic_ws(struct list_head *ws)</div><div class='ctx'> 	kfree(workspace);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct list_head *alloc_heuristic_ws(unsigned int level)</div><div class='add'>+static struct list_head *alloc_heuristic_ws(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	struct heuristic_ws *ws;</div><div class='ctx'> </div><div class='hunk'>@@ -1061,11 +729,9 @@ fail:</div><div class='ctx'> 	return ERR_PTR(-ENOMEM);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-const struct btrfs_compress_op btrfs_heuristic_compress = {</div><div class='del'>-	.workspace_manager = &amp;heuristic_wsm,</div><div class='del'>-};</div><div class='add'>+const struct btrfs_compress_levels btrfs_heuristic_compress = { 0 };</div><div class='ctx'> </div><div class='del'>-static const struct btrfs_compress_op * const btrfs_compress_op[] = {</div><div class='add'>+static const struct btrfs_compress_levels * const btrfs_compress_levels[] = {</div><div class='ctx'> 	/* The heuristic is represented as compression type 0 */</div><div class='ctx'> 	&amp;btrfs_heuristic_compress,</div><div class='ctx'> 	&amp;btrfs_zlib_compress,</div><div class='hunk'>@@ -1073,13 +739,13 @@ static const struct btrfs_compress_op * const btrfs_compress_op[] = {</div><div class='ctx'> 	&amp;btrfs_zstd_compress,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static struct list_head *alloc_workspace(int type, unsigned int level)</div><div class='add'>+static struct list_head *alloc_workspace(struct btrfs_fs_info *fs_info, int type, int level)</div><div class='ctx'> {</div><div class='ctx'> 	switch (type) {</div><div class='del'>-	case BTRFS_COMPRESS_NONE: return alloc_heuristic_ws(level);</div><div class='del'>-	case BTRFS_COMPRESS_ZLIB: return zlib_alloc_workspace(level);</div><div class='del'>-	case BTRFS_COMPRESS_LZO:  return lzo_alloc_workspace(level);</div><div class='del'>-	case BTRFS_COMPRESS_ZSTD: return zstd_alloc_workspace(level);</div><div class='add'>+	case BTRFS_COMPRESS_NONE: return alloc_heuristic_ws(fs_info);</div><div class='add'>+	case BTRFS_COMPRESS_ZLIB: return zlib_alloc_workspace(fs_info, level);</div><div class='add'>+	case BTRFS_COMPRESS_LZO:  return lzo_alloc_workspace(fs_info);</div><div class='add'>+	case BTRFS_COMPRESS_ZSTD: return zstd_alloc_workspace(fs_info, level);</div><div class='ctx'> 	default:</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * This can't happen, the type is validated several times</div><div class='hunk'>@@ -1105,44 +771,58 @@ static void free_workspace(int type, struct list_head *ws)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void btrfs_init_workspace_manager(int type)</div><div class='add'>+static int alloc_workspace_manager(struct btrfs_fs_info *fs_info,</div><div class='add'>+				   enum btrfs_compression_type type)</div><div class='ctx'> {</div><div class='del'>-	struct workspace_manager *wsm;</div><div class='add'>+	struct workspace_manager *gwsm;</div><div class='ctx'> 	struct list_head *workspace;</div><div class='ctx'> </div><div class='del'>-	wsm = btrfs_compress_op[type]-&gt;workspace_manager;</div><div class='del'>-	INIT_LIST_HEAD(&amp;wsm-&gt;idle_ws);</div><div class='del'>-	spin_lock_init(&amp;wsm-&gt;ws_lock);</div><div class='del'>-	atomic_set(&amp;wsm-&gt;total_ws, 0);</div><div class='del'>-	init_waitqueue_head(&amp;wsm-&gt;ws_wait);</div><div class='add'>+	ASSERT(fs_info-&gt;compr_wsm[type] == NULL);</div><div class='add'>+	gwsm = kzalloc(sizeof(*gwsm), GFP_KERNEL);</div><div class='add'>+	if (!gwsm)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	INIT_LIST_HEAD(&amp;gwsm-&gt;idle_ws);</div><div class='add'>+	spin_lock_init(&amp;gwsm-&gt;ws_lock);</div><div class='add'>+	atomic_set(&amp;gwsm-&gt;total_ws, 0);</div><div class='add'>+	init_waitqueue_head(&amp;gwsm-&gt;ws_wait);</div><div class='add'>+	fs_info-&gt;compr_wsm[type] = gwsm;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Preallocate one workspace for each compression type so we can</div><div class='ctx'> 	 * guarantee forward progress in the worst case</div><div class='ctx'> 	 */</div><div class='del'>-	workspace = alloc_workspace(type, 0);</div><div class='add'>+	workspace = alloc_workspace(fs_info, type, 0);</div><div class='ctx'> 	if (IS_ERR(workspace)) {</div><div class='del'>-		pr_warn(</div><div class='del'>-	"BTRFS: cannot preallocate compression workspace, will try later\n");</div><div class='add'>+		btrfs_warn(fs_info,</div><div class='add'>+	"cannot preallocate compression workspace for %s, will try later",</div><div class='add'>+			   btrfs_compress_type2str(type));</div><div class='ctx'> 	} else {</div><div class='del'>-		atomic_set(&amp;wsm-&gt;total_ws, 1);</div><div class='del'>-		wsm-&gt;free_ws = 1;</div><div class='del'>-		list_add(workspace, &amp;wsm-&gt;idle_ws);</div><div class='add'>+		atomic_set(&amp;gwsm-&gt;total_ws, 1);</div><div class='add'>+		gwsm-&gt;free_ws = 1;</div><div class='add'>+		list_add(workspace, &amp;gwsm-&gt;idle_ws);</div><div class='ctx'> 	}</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void btrfs_cleanup_workspace_manager(int type)</div><div class='add'>+static void free_workspace_manager(struct btrfs_fs_info *fs_info,</div><div class='add'>+				   enum btrfs_compression_type type)</div><div class='ctx'> {</div><div class='del'>-	struct workspace_manager *wsman;</div><div class='ctx'> 	struct list_head *ws;</div><div class='del'>-</div><div class='del'>-	wsman = btrfs_compress_op[type]-&gt;workspace_manager;</div><div class='del'>-	while (!list_empty(&amp;wsman-&gt;idle_ws)) {</div><div class='del'>-		ws = wsman-&gt;idle_ws.next;</div><div class='add'>+	struct workspace_manager *gwsm = fs_info-&gt;compr_wsm[type];</div><div class='add'>+</div><div class='add'>+	/* ZSTD uses its own workspace manager, should enter here. */</div><div class='add'>+	ASSERT(type != BTRFS_COMPRESS_ZSTD &amp;&amp; type &lt; BTRFS_NR_COMPRESS_TYPES);</div><div class='add'>+	if (!gwsm)</div><div class='add'>+		return;</div><div class='add'>+	fs_info-&gt;compr_wsm[type] = NULL;</div><div class='add'>+	while (!list_empty(&amp;gwsm-&gt;idle_ws)) {</div><div class='add'>+		ws = gwsm-&gt;idle_ws.next;</div><div class='ctx'> 		list_del(ws);</div><div class='ctx'> 		free_workspace(type, ws);</div><div class='del'>-		atomic_dec(&amp;wsman-&gt;total_ws);</div><div class='add'>+		atomic_dec(&amp;gwsm-&gt;total_ws);</div><div class='ctx'> 	}</div><div class='add'>+	kfree(gwsm);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1151,9 +831,9 @@ static void btrfs_cleanup_workspace_manager(int type)</div><div class='ctx'>  * Preallocation makes a forward progress guarantees and we do not return</div><div class='ctx'>  * errors.</div><div class='ctx'>  */</div><div class='del'>-struct list_head *btrfs_get_workspace(int type, unsigned int level)</div><div class='add'>+struct list_head *btrfs_get_workspace(struct btrfs_fs_info *fs_info, int type, int level)</div><div class='ctx'> {</div><div class='del'>-	struct workspace_manager *wsm;</div><div class='add'>+	struct workspace_manager *wsm = fs_info-&gt;compr_wsm[type];</div><div class='ctx'> 	struct list_head *workspace;</div><div class='ctx'> 	int cpus = num_online_cpus();</div><div class='ctx'> 	unsigned nofs_flag;</div><div class='hunk'>@@ -1163,7 +843,7 @@ struct list_head *btrfs_get_workspace(int type, unsigned int level)</div><div class='ctx'> 	wait_queue_head_t *ws_wait;</div><div class='ctx'> 	int *free_ws;</div><div class='ctx'> </div><div class='del'>-	wsm = btrfs_compress_op[type]-&gt;workspace_manager;</div><div class='add'>+	ASSERT(wsm);</div><div class='ctx'> 	idle_ws	 = &amp;wsm-&gt;idle_ws;</div><div class='ctx'> 	ws_lock	 = &amp;wsm-&gt;ws_lock;</div><div class='ctx'> 	total_ws = &amp;wsm-&gt;total_ws;</div><div class='hunk'>@@ -1199,7 +879,7 @@ again:</div><div class='ctx'> 	 * context of btrfs_compress_bio/btrfs_compress_pages</div><div class='ctx'> 	 */</div><div class='ctx'> 	nofs_flag = memalloc_nofs_save();</div><div class='del'>-	workspace = alloc_workspace(type, level);</div><div class='add'>+	workspace = alloc_workspace(fs_info, type, level);</div><div class='ctx'> 	memalloc_nofs_restore(nofs_flag);</div><div class='ctx'> </div><div class='ctx'> 	if (IS_ERR(workspace)) {</div><div class='hunk'>@@ -1221,22 +901,22 @@ again:</div><div class='ctx'> 					/* once per minute */ 60 * HZ,</div><div class='ctx'> 					/* no burst */ 1);</div><div class='ctx'> </div><div class='del'>-			if (__ratelimit(&amp;_rs)) {</div><div class='del'>-				pr_warn("BTRFS: no compression workspaces, low memory, retrying\n");</div><div class='del'>-			}</div><div class='add'>+			if (__ratelimit(&amp;_rs))</div><div class='add'>+				btrfs_warn(fs_info,</div><div class='add'>+				"no compression workspaces, low memory, retrying");</div><div class='ctx'> 		}</div><div class='ctx'> 		goto again;</div><div class='ctx'> 	}</div><div class='ctx'> 	return workspace;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct list_head *get_workspace(int type, int level)</div><div class='add'>+static struct list_head *get_workspace(struct btrfs_fs_info *fs_info, int type, int level)</div><div class='ctx'> {</div><div class='ctx'> 	switch (type) {</div><div class='del'>-	case BTRFS_COMPRESS_NONE: return btrfs_get_workspace(type, level);</div><div class='del'>-	case BTRFS_COMPRESS_ZLIB: return zlib_get_workspace(level);</div><div class='del'>-	case BTRFS_COMPRESS_LZO:  return btrfs_get_workspace(type, level);</div><div class='del'>-	case BTRFS_COMPRESS_ZSTD: return zstd_get_workspace(level);</div><div class='add'>+	case BTRFS_COMPRESS_NONE: return btrfs_get_workspace(fs_info, type, level);</div><div class='add'>+	case BTRFS_COMPRESS_ZLIB: return zlib_get_workspace(fs_info, level);</div><div class='add'>+	case BTRFS_COMPRESS_LZO:  return btrfs_get_workspace(fs_info, type, level);</div><div class='add'>+	case BTRFS_COMPRESS_ZSTD: return zstd_get_workspace(fs_info, level);</div><div class='ctx'> 	default:</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * This can't happen, the type is validated several times</div><div class='hunk'>@@ -1250,21 +930,21 @@ static struct list_head *get_workspace(int type, int level)</div><div class='ctx'>  * put a workspace struct back on the list or free it if we have enough</div><div class='ctx'>  * idle ones sitting around</div><div class='ctx'>  */</div><div class='del'>-void btrfs_put_workspace(int type, struct list_head *ws)</div><div class='add'>+void btrfs_put_workspace(struct btrfs_fs_info *fs_info, int type, struct list_head *ws)</div><div class='ctx'> {</div><div class='del'>-	struct workspace_manager *wsm;</div><div class='add'>+	struct workspace_manager *gwsm = fs_info-&gt;compr_wsm[type];</div><div class='ctx'> 	struct list_head *idle_ws;</div><div class='ctx'> 	spinlock_t *ws_lock;</div><div class='ctx'> 	atomic_t *total_ws;</div><div class='ctx'> 	wait_queue_head_t *ws_wait;</div><div class='ctx'> 	int *free_ws;</div><div class='ctx'> </div><div class='del'>-	wsm = btrfs_compress_op[type]-&gt;workspace_manager;</div><div class='del'>-	idle_ws	 = &amp;wsm-&gt;idle_ws;</div><div class='del'>-	ws_lock	 = &amp;wsm-&gt;ws_lock;</div><div class='del'>-	total_ws = &amp;wsm-&gt;total_ws;</div><div class='del'>-	ws_wait	 = &amp;wsm-&gt;ws_wait;</div><div class='del'>-	free_ws	 = &amp;wsm-&gt;free_ws;</div><div class='add'>+	ASSERT(gwsm);</div><div class='add'>+	idle_ws	 = &amp;gwsm-&gt;idle_ws;</div><div class='add'>+	ws_lock	 = &amp;gwsm-&gt;ws_lock;</div><div class='add'>+	total_ws = &amp;gwsm-&gt;total_ws;</div><div class='add'>+	ws_wait	 = &amp;gwsm-&gt;ws_wait;</div><div class='add'>+	free_ws	 = &amp;gwsm-&gt;free_ws;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(ws_lock);</div><div class='ctx'> 	if (*free_ws &lt;= num_online_cpus()) {</div><div class='hunk'>@@ -1281,13 +961,13 @@ wake:</div><div class='ctx'> 	cond_wake_up(ws_wait);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void put_workspace(int type, struct list_head *ws)</div><div class='add'>+static void put_workspace(struct btrfs_fs_info *fs_info, int type, struct list_head *ws)</div><div class='ctx'> {</div><div class='ctx'> 	switch (type) {</div><div class='del'>-	case BTRFS_COMPRESS_NONE: return btrfs_put_workspace(type, ws);</div><div class='del'>-	case BTRFS_COMPRESS_ZLIB: return btrfs_put_workspace(type, ws);</div><div class='del'>-	case BTRFS_COMPRESS_LZO:  return btrfs_put_workspace(type, ws);</div><div class='del'>-	case BTRFS_COMPRESS_ZSTD: return zstd_put_workspace(ws);</div><div class='add'>+	case BTRFS_COMPRESS_NONE: return btrfs_put_workspace(fs_info, type, ws);</div><div class='add'>+	case BTRFS_COMPRESS_ZLIB: return btrfs_put_workspace(fs_info, type, ws);</div><div class='add'>+	case BTRFS_COMPRESS_LZO:  return btrfs_put_workspace(fs_info, type, ws);</div><div class='add'>+	case BTRFS_COMPRESS_ZSTD: return zstd_put_workspace(fs_info, ws);</div><div class='ctx'> 	default:</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * This can't happen, the type is validated several times</div><div class='hunk'>@@ -1301,19 +981,52 @@ static void put_workspace(int type, struct list_head *ws)</div><div class='ctx'>  * Adjust @level according to the limits of the compression algorithm or</div><div class='ctx'>  * fallback to default</div><div class='ctx'>  */</div><div class='del'>-static unsigned int btrfs_compress_set_level(int type, unsigned level)</div><div class='add'>+static int btrfs_compress_set_level(unsigned int type, int level)</div><div class='ctx'> {</div><div class='del'>-	const struct btrfs_compress_op *ops = btrfs_compress_op[type];</div><div class='add'>+	const struct btrfs_compress_levels *levels = btrfs_compress_levels[type];</div><div class='ctx'> </div><div class='ctx'> 	if (level == 0)</div><div class='del'>-		level = ops-&gt;default_level;</div><div class='add'>+		level = levels-&gt;default_level;</div><div class='ctx'> 	else</div><div class='del'>-		level = min(level, ops-&gt;max_level);</div><div class='add'>+		level = clamp(level, levels-&gt;min_level, levels-&gt;max_level);</div><div class='ctx'> </div><div class='ctx'> 	return level;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * Check whether the @level is within the valid range for the given type.</div><div class='add'>+ */</div><div class='add'>+bool btrfs_compress_level_valid(unsigned int type, int level)</div><div class='add'>+{</div><div class='add'>+	const struct btrfs_compress_levels *levels = btrfs_compress_levels[type];</div><div class='add'>+</div><div class='add'>+	return levels-&gt;min_level &lt;= level &amp;&amp; level &lt;= levels-&gt;max_level;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Wrapper around find_get_page(), with extra error message. */</div><div class='add'>+int btrfs_compress_filemap_get_folio(struct address_space *mapping, u64 start,</div><div class='add'>+				     struct folio **in_folio_ret)</div><div class='add'>+{</div><div class='add'>+	struct folio *in_folio;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The compressed write path should have the folio locked already, thus</div><div class='add'>+	 * we only need to grab one reference.</div><div class='add'>+	 */</div><div class='add'>+	in_folio = filemap_get_folio(mapping, start &gt;&gt; PAGE_SHIFT);</div><div class='add'>+	if (IS_ERR(in_folio)) {</div><div class='add'>+		struct btrfs_inode *inode = BTRFS_I(mapping-&gt;host);</div><div class='add'>+</div><div class='add'>+		btrfs_crit(inode-&gt;root-&gt;fs_info,</div><div class='add'>+		"failed to get page cache, root %lld ino %llu file offset %llu",</div><div class='add'>+			   btrfs_root_id(inode-&gt;root), btrfs_ino(inode), start);</div><div class='add'>+		return -ENOENT;</div><div class='add'>+	}</div><div class='add'>+	*in_folio_ret = in_folio;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * Given an address space and start and length, compress the bytes into @pages</div><div class='ctx'>  * that are allocated on demand.</div><div class='ctx'>  *</div><div class='hunk'>@@ -1322,82 +1035,159 @@ static unsigned int btrfs_compress_set_level(int type, unsigned level)</div><div class='ctx'>  * - compression algo are 0-3</div><div class='ctx'>  * - the level are bits 4-7</div><div class='ctx'>  *</div><div class='del'>- * @out_pages is an in/out parameter, holds maximum number of pages to allocate</div><div class='del'>- * and returns number of actually allocated pages</div><div class='add'>+ * @out_folios is an in/out parameter, holds maximum number of folios to allocate</div><div class='add'>+ * and returns number of actually allocated folios</div><div class='ctx'>  *</div><div class='ctx'>  * @total_in is used to return the number of bytes actually read.  It</div><div class='ctx'>  * may be smaller than the input length if we had to exit early because we</div><div class='del'>- * ran out of room in the pages array or because we cross the</div><div class='add'>+ * ran out of room in the folios array or because we cross the</div><div class='ctx'>  * max_out threshold.</div><div class='ctx'>  *</div><div class='ctx'>  * @total_out is an in/out parameter, must be set to the input length and will</div><div class='ctx'>  * be also used to return the total number of compressed bytes</div><div class='ctx'>  */</div><div class='del'>-int btrfs_compress_pages(unsigned int type_level, struct address_space *mapping,</div><div class='del'>-			 u64 start, struct page **pages,</div><div class='del'>-			 unsigned long *out_pages,</div><div class='del'>-			 unsigned long *total_in,</div><div class='del'>-			 unsigned long *total_out)</div><div class='add'>+int btrfs_compress_folios(unsigned int type, int level, struct btrfs_inode *inode,</div><div class='add'>+			 u64 start, struct folio **folios, unsigned long *out_folios,</div><div class='add'>+			 unsigned long *total_in, unsigned long *total_out)</div><div class='ctx'> {</div><div class='del'>-	int type = btrfs_compress_type(type_level);</div><div class='del'>-	int level = btrfs_compress_level(type_level);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	const unsigned long orig_len = *total_out;</div><div class='ctx'> 	struct list_head *workspace;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	level = btrfs_compress_set_level(type, level);</div><div class='del'>-	workspace = get_workspace(type, level);</div><div class='del'>-	ret = compression_compress_pages(type, workspace, mapping, start, pages,</div><div class='del'>-					 out_pages, total_in, total_out);</div><div class='del'>-	put_workspace(type, workspace);</div><div class='add'>+	workspace = get_workspace(fs_info, type, level);</div><div class='add'>+	ret = compression_compress_pages(type, workspace, inode, start, folios,</div><div class='add'>+					 out_folios, total_in, total_out);</div><div class='add'>+	/* The total read-in bytes should be no larger than the input. */</div><div class='add'>+	ASSERT(*total_in &lt;= orig_len);</div><div class='add'>+	put_workspace(fs_info, type, workspace);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int btrfs_decompress_bio(struct compressed_bio *cb)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = cb_to_fs_info(cb);</div><div class='ctx'> 	struct list_head *workspace;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int type = cb-&gt;compress_type;</div><div class='ctx'> </div><div class='del'>-	workspace = get_workspace(type, 0);</div><div class='del'>-	ret = compression_decompress_bio(type, workspace, cb);</div><div class='del'>-	put_workspace(type, workspace);</div><div class='add'>+	workspace = get_workspace(fs_info, type, 0);</div><div class='add'>+	ret = compression_decompress_bio(workspace, cb);</div><div class='add'>+	put_workspace(fs_info, type, workspace);</div><div class='ctx'> </div><div class='add'>+	if (!ret)</div><div class='add'>+		zero_fill_bio(&amp;cb-&gt;orig_bbio-&gt;bio);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * a less complex decompression routine.  Our compressed data fits in a</div><div class='ctx'>  * single page, and we want to read a single page out of it.</div><div class='del'>- * start_byte tells us the offset into the compressed data we're interested in</div><div class='add'>+ * dest_pgoff tells us the offset into the destination folio where we write the</div><div class='add'>+ * decompressed data.</div><div class='ctx'>  */</div><div class='del'>-int btrfs_decompress(int type, unsigned char *data_in, struct page *dest_page,</div><div class='del'>-		     unsigned long start_byte, size_t srclen, size_t destlen)</div><div class='add'>+int btrfs_decompress(int type, const u8 *data_in, struct folio *dest_folio,</div><div class='add'>+		     unsigned long dest_pgoff, size_t srclen, size_t destlen)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = folio_to_fs_info(dest_folio);</div><div class='ctx'> 	struct list_head *workspace;</div><div class='add'>+	const u32 sectorsize = fs_info-&gt;sectorsize;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	workspace = get_workspace(type, 0);</div><div class='del'>-	ret = compression_decompress(type, workspace, data_in, dest_page,</div><div class='del'>-				     start_byte, srclen, destlen);</div><div class='del'>-	put_workspace(type, workspace);</div><div class='add'>+	/*</div><div class='add'>+	 * The full destination folio range should not exceed the folio size.</div><div class='add'>+	 * And the @destlen should not exceed sectorsize, as this is only called for</div><div class='add'>+	 * inline file extents, which should not exceed sectorsize.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(dest_pgoff + destlen &lt;= folio_size(dest_folio) &amp;&amp; destlen &lt;= sectorsize);</div><div class='add'>+</div><div class='add'>+	workspace = get_workspace(fs_info, type, 0);</div><div class='add'>+	ret = compression_decompress(type, workspace, data_in, dest_folio,</div><div class='add'>+				     dest_pgoff, srclen, destlen);</div><div class='add'>+	put_workspace(fs_info, type, workspace);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void __init btrfs_init_compress(void)</div><div class='add'>+int btrfs_alloc_compress_wsm(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	btrfs_init_workspace_manager(BTRFS_COMPRESS_NONE);</div><div class='del'>-	btrfs_init_workspace_manager(BTRFS_COMPRESS_ZLIB);</div><div class='del'>-	btrfs_init_workspace_manager(BTRFS_COMPRESS_LZO);</div><div class='del'>-	zstd_init_workspace_manager();</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = alloc_workspace_manager(fs_info, BTRFS_COMPRESS_NONE);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto error;</div><div class='add'>+	ret = alloc_workspace_manager(fs_info, BTRFS_COMPRESS_ZLIB);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto error;</div><div class='add'>+	ret = alloc_workspace_manager(fs_info, BTRFS_COMPRESS_LZO);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto error;</div><div class='add'>+	ret = zstd_alloc_workspace_manager(fs_info);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto error;</div><div class='add'>+	return 0;</div><div class='add'>+error:</div><div class='add'>+	btrfs_free_compress_wsm(fs_info);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_free_compress_wsm(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	free_workspace_manager(fs_info, BTRFS_COMPRESS_NONE);</div><div class='add'>+	free_workspace_manager(fs_info, BTRFS_COMPRESS_ZLIB);</div><div class='add'>+	free_workspace_manager(fs_info, BTRFS_COMPRESS_LZO);</div><div class='add'>+	zstd_free_workspace_manager(fs_info);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int __init btrfs_init_compress(void)</div><div class='add'>+{</div><div class='add'>+	if (bioset_init(&amp;btrfs_compressed_bioset, BIO_POOL_SIZE,</div><div class='add'>+			offsetof(struct compressed_bio, bbio.bio),</div><div class='add'>+			BIOSET_NEED_BVECS))</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	compr_pool.shrinker = shrinker_alloc(SHRINKER_NONSLAB, "btrfs-compr-pages");</div><div class='add'>+	if (!compr_pool.shrinker)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	spin_lock_init(&amp;compr_pool.lock);</div><div class='add'>+	INIT_LIST_HEAD(&amp;compr_pool.list);</div><div class='add'>+	compr_pool.count = 0;</div><div class='add'>+	/* 128K / 4K = 32, for 8 threads is 256 pages. */</div><div class='add'>+	compr_pool.thresh = BTRFS_MAX_COMPRESSED / PAGE_SIZE * 8;</div><div class='add'>+	compr_pool.shrinker-&gt;count_objects = btrfs_compr_pool_count;</div><div class='add'>+	compr_pool.shrinker-&gt;scan_objects = btrfs_compr_pool_scan;</div><div class='add'>+	compr_pool.shrinker-&gt;batch = 32;</div><div class='add'>+	compr_pool.shrinker-&gt;seeks = DEFAULT_SEEKS;</div><div class='add'>+	shrinker_register(compr_pool.shrinker);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void __cold btrfs_exit_compress(void)</div><div class='ctx'> {</div><div class='del'>-	btrfs_cleanup_workspace_manager(BTRFS_COMPRESS_NONE);</div><div class='del'>-	btrfs_cleanup_workspace_manager(BTRFS_COMPRESS_ZLIB);</div><div class='del'>-	btrfs_cleanup_workspace_manager(BTRFS_COMPRESS_LZO);</div><div class='del'>-	zstd_cleanup_workspace_manager();</div><div class='add'>+	/* For now scan drains all pages and does not touch the parameters. */</div><div class='add'>+	btrfs_compr_pool_scan(NULL, NULL);</div><div class='add'>+	shrinker_free(compr_pool.shrinker);</div><div class='add'>+</div><div class='add'>+	bioset_exit(&amp;btrfs_compressed_bioset);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * The bvec is a single page bvec from a bio that contains folios from a filemap.</div><div class='add'>+ *</div><div class='add'>+ * Since the folio may be a large one, and if the bv_page is not a head page of</div><div class='add'>+ * a large folio, then page-&gt;index is unreliable.</div><div class='add'>+ *</div><div class='add'>+ * Thus we need this helper to grab the proper file offset.</div><div class='add'>+ */</div><div class='add'>+static u64 file_offset_from_bvec(const struct bio_vec *bvec)</div><div class='add'>+{</div><div class='add'>+	const struct page *page = bvec-&gt;bv_page;</div><div class='add'>+	const struct folio *folio = page_folio(page);</div><div class='add'>+</div><div class='add'>+	return (page_pgoff(folio, page) &lt;&lt; PAGE_SHIFT) + bvec-&gt;bv_offset;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1433,7 +1223,7 @@ void __cold btrfs_exit_compress(void)</div><div class='ctx'> int btrfs_decompress_buf2page(const char *buf, u32 buf_len,</div><div class='ctx'> 			      struct compressed_bio *cb, u32 decompressed)</div><div class='ctx'> {</div><div class='del'>-	struct bio *orig_bio = cb-&gt;orig_bio;</div><div class='add'>+	struct bio *orig_bio = &amp;cb-&gt;orig_bbio-&gt;bio;</div><div class='ctx'> 	/* Offset inside the full decompressed extent */</div><div class='ctx'> 	u32 cur_offset;</div><div class='ctx'> </div><div class='hunk'>@@ -1445,13 +1235,14 @@ int btrfs_decompress_buf2page(const char *buf, u32 buf_len,</div><div class='ctx'> 		u32 copy_start;</div><div class='ctx'> 		/* Offset inside the full decompressed extent */</div><div class='ctx'> 		u32 bvec_offset;</div><div class='add'>+		void *kaddr;</div><div class='ctx'> </div><div class='ctx'> 		bvec = bio_iter_iovec(orig_bio, orig_bio-&gt;bi_iter);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * cb-&gt;start may underflow, but subtracting that value can still</div><div class='ctx'> 		 * give us correct offset inside the full decompressed extent.</div><div class='ctx'> 		 */</div><div class='del'>-		bvec_offset = page_offset(bvec.bv_page) + bvec.bv_offset - cb-&gt;start;</div><div class='add'>+		bvec_offset = file_offset_from_bvec(&amp;bvec) - cb-&gt;start;</div><div class='ctx'> </div><div class='ctx'> 		/* Haven't reached the bvec range, exit */</div><div class='ctx'> 		if (decompressed + buf_len &lt;= bvec_offset)</div><div class='hunk'>@@ -1467,11 +1258,12 @@ int btrfs_decompress_buf2page(const char *buf, u32 buf_len,</div><div class='ctx'> 		 * @buf + @buf_len.</div><div class='ctx'> 		 */</div><div class='ctx'> 		ASSERT(copy_start - decompressed &lt; buf_len);</div><div class='del'>-		memcpy_to_page(bvec.bv_page, bvec.bv_offset,</div><div class='del'>-			       buf + copy_start - decompressed, copy_len);</div><div class='del'>-		flush_dcache_page(bvec.bv_page);</div><div class='del'>-		cur_offset += copy_len;</div><div class='ctx'> </div><div class='add'>+		kaddr = bvec_kmap_local(&amp;bvec);</div><div class='add'>+		memcpy(kaddr, buf + copy_start - decompressed, copy_len);</div><div class='add'>+		kunmap_local(kaddr);</div><div class='add'>+</div><div class='add'>+		cur_offset += copy_len;</div><div class='ctx'> 		bio_advance(orig_bio, copy_len);</div><div class='ctx'> 		/* Finished the bio */</div><div class='ctx'> 		if (!orig_bio-&gt;bi_iter.bi_size)</div><div class='hunk'>@@ -1501,7 +1293,7 @@ int btrfs_decompress_buf2page(const char *buf, u32 buf_len,</div><div class='ctx'> #define ENTROPY_LVL_HIGH		(80)</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * For increasead precision in shannon_entropy calculation,</div><div class='add'>+ * For increased precision in shannon_entropy calculation,</div><div class='ctx'>  * let's do pow(n, M) to save more digits after comma:</div><div class='ctx'>  *</div><div class='ctx'>  * - maximum int bit length is 64</div><div class='hunk'>@@ -1727,7 +1519,7 @@ static void heuristic_collect_sample(struct inode *inode, u64 start, u64 end,</div><div class='ctx'> 				     struct heuristic_ws *ws)</div><div class='ctx'> {</div><div class='ctx'> 	struct page *page;</div><div class='del'>-	u64 index, index_end;</div><div class='add'>+	pgoff_t index, index_end;</div><div class='ctx'> 	u32 i, curr_sample_pos;</div><div class='ctx'> 	u8 *in_data;</div><div class='ctx'> </div><div class='hunk'>@@ -1747,7 +1539,7 @@ static void heuristic_collect_sample(struct inode *inode, u64 start, u64 end,</div><div class='ctx'> 	index_end = end &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> </div><div class='ctx'> 	/* Don't miss unaligned end */</div><div class='del'>-	if (!IS_ALIGNED(end, PAGE_SIZE))</div><div class='add'>+	if (!PAGE_ALIGNED(end))</div><div class='ctx'> 		index_end++;</div><div class='ctx'> </div><div class='ctx'> 	curr_sample_pos = 0;</div><div class='hunk'>@@ -1778,11 +1570,6 @@ static void heuristic_collect_sample(struct inode *inode, u64 start, u64 end,</div><div class='ctx'> /*</div><div class='ctx'>  * Compression heuristic.</div><div class='ctx'>  *</div><div class='del'>- * For now is's a naive and optimistic 'return true', we'll extend the logic to</div><div class='del'>- * quickly (compared to direct compression) detect data characteristics</div><div class='del'>- * (compressible/uncompressible) to avoid wasting CPU time on uncompressible</div><div class='del'>- * data.</div><div class='del'>- *</div><div class='ctx'>  * The following types of analysis can be performed:</div><div class='ctx'>  * - detect mostly zero data</div><div class='ctx'>  * - detect data with low "byte set" size (text, etc)</div><div class='hunk'>@@ -1790,9 +1577,10 @@ static void heuristic_collect_sample(struct inode *inode, u64 start, u64 end,</div><div class='ctx'>  *</div><div class='ctx'>  * Return non-zero if the compression should be done, 0 otherwise.</div><div class='ctx'>  */</div><div class='del'>-int btrfs_compress_heuristic(struct inode *inode, u64 start, u64 end)</div><div class='add'>+int btrfs_compress_heuristic(struct btrfs_inode *inode, u64 start, u64 end)</div><div class='ctx'> {</div><div class='del'>-	struct list_head *ws_list = get_workspace(0, 0);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	struct list_head *ws_list = get_workspace(fs_info, 0, 0);</div><div class='ctx'> 	struct heuristic_ws *ws;</div><div class='ctx'> 	u32 i;</div><div class='ctx'> 	u8 byte;</div><div class='hunk'>@@ -1800,7 +1588,7 @@ int btrfs_compress_heuristic(struct inode *inode, u64 start, u64 end)</div><div class='ctx'> </div><div class='ctx'> 	ws = list_entry(ws_list, struct heuristic_ws, list);</div><div class='ctx'> </div><div class='del'>-	heuristic_collect_sample(inode, start, end, ws);</div><div class='add'>+	heuristic_collect_sample(&amp;inode-&gt;vfs_inode, start, end, ws);</div><div class='ctx'> </div><div class='ctx'> 	if (sample_repeated_patterns(ws)) {</div><div class='ctx'> 		ret = 1;</div><div class='hunk'>@@ -1861,29 +1649,34 @@ int btrfs_compress_heuristic(struct inode *inode, u64 start, u64 end)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	put_workspace(0, ws_list);</div><div class='add'>+	put_workspace(fs_info, 0, ws_list);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Convert the compression suffix (eg. after "zlib" starting with ":") to</div><div class='del'>- * level, unrecognized string will set the default level</div><div class='add'>+ * Convert the compression suffix (eg. after "zlib" starting with ":") to level.</div><div class='add'>+ *</div><div class='add'>+ * If the resulting level exceeds the algo's supported levels, it will be clamped.</div><div class='add'>+ *</div><div class='add'>+ * Return &lt;0 if no valid string can be found.</div><div class='add'>+ * Return 0 if everything is fine.</div><div class='ctx'>  */</div><div class='del'>-unsigned int btrfs_compress_str2level(unsigned int type, const char *str)</div><div class='add'>+int btrfs_compress_str2level(unsigned int type, const char *str, int *level_ret)</div><div class='ctx'> {</div><div class='del'>-	unsigned int level = 0;</div><div class='add'>+	int level = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (!type)</div><div class='add'>+	if (!type) {</div><div class='add'>+		*level_ret = btrfs_compress_set_level(type, level);</div><div class='ctx'> 		return 0;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (str[0] == ':') {</div><div class='del'>-		ret = kstrtouint(str + 1, 10, &amp;level);</div><div class='add'>+		ret = kstrtoint(str + 1, 10, &amp;level);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			level = 0;</div><div class='add'>+			return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	level = btrfs_compress_set_level(type, level);</div><div class='del'>-</div><div class='del'>-	return level;</div><div class='add'>+	*level_ret = btrfs_compress_set_level(type, level);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/btrfs/compression.h b/fs/btrfs/compression.h<br/>index 56eef0821e3e..e0228017e861 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/compression.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/compression.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/compression.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/compression.h</a></div><div class='hunk'>@@ -7,8 +7,19 @@</div><div class='ctx'> #define BTRFS_COMPRESSION_H</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/sizes.h&gt;</div><div class='del'>-</div><div class='add'>+#include &lt;linux/mm.h&gt;</div><div class='add'>+#include &lt;linux/list.h&gt;</div><div class='add'>+#include &lt;linux/workqueue.h&gt;</div><div class='add'>+#include &lt;linux/wait.h&gt;</div><div class='add'>+#include &lt;linux/pagemap.h&gt;</div><div class='add'>+#include "bio.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "btrfs_inode.h"</div><div class='add'>+</div><div class='add'>+struct address_space;</div><div class='add'>+struct inode;</div><div class='ctx'> struct btrfs_inode;</div><div class='add'>+struct btrfs_ordered_extent;</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * We want to make sure that amount of RAM required to uncompress an extent is</div><div class='hunk'>@@ -22,23 +33,20 @@ struct btrfs_inode;</div><div class='ctx'> </div><div class='ctx'> /* Maximum length of compressed data stored on disk */</div><div class='ctx'> #define BTRFS_MAX_COMPRESSED		(SZ_128K)</div><div class='add'>+#define BTRFS_MAX_COMPRESSED_PAGES	(BTRFS_MAX_COMPRESSED / PAGE_SIZE)</div><div class='add'>+static_assert((BTRFS_MAX_COMPRESSED % PAGE_SIZE) == 0);</div><div class='add'>+</div><div class='ctx'> /* Maximum size of data before compression */</div><div class='ctx'> #define BTRFS_MAX_UNCOMPRESSED		(SZ_128K)</div><div class='ctx'> </div><div class='ctx'> #define	BTRFS_ZLIB_DEFAULT_LEVEL		3</div><div class='ctx'> </div><div class='ctx'> struct compressed_bio {</div><div class='del'>-	/* Number of sectors with unfinished IO (unsubmitted or unfinished) */</div><div class='del'>-	refcount_t pending_sectors;</div><div class='del'>-</div><div class='del'>-	/* Number of compressed pages in the array */</div><div class='del'>-	unsigned int nr_pages;</div><div class='add'>+	/* Number of compressed folios in the array. */</div><div class='add'>+	unsigned int nr_folios;</div><div class='ctx'> </div><div class='del'>-	/* the pages with the compressed data on them */</div><div class='del'>-	struct page **compressed_pages;</div><div class='del'>-</div><div class='del'>-	/* inode that owns this data */</div><div class='del'>-	struct inode *inode;</div><div class='add'>+	/* The folios with the compressed data on them. */</div><div class='add'>+	struct folio **compressed_folios;</div><div class='ctx'> </div><div class='ctx'> 	/* starting offset in the inode for our pages */</div><div class='ctx'> 	u64 start;</div><div class='hunk'>@@ -52,62 +60,55 @@ struct compressed_bio {</div><div class='ctx'> 	/* The compression algorithm for this bio */</div><div class='ctx'> 	u8 compress_type;</div><div class='ctx'> </div><div class='del'>-	/* IO errors */</div><div class='del'>-	u8 errors;</div><div class='del'>-	int mirror_num;</div><div class='add'>+	/* Whether this is a write for writeback. */</div><div class='add'>+	bool writeback;</div><div class='ctx'> </div><div class='del'>-	/* for reads, this is the bio we are copying the data into */</div><div class='del'>-	struct bio *orig_bio;</div><div class='add'>+	/* For reads, this is the bio we are copying the data into. */</div><div class='add'>+	struct btrfs_bio *orig_bbio;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * the start of a variable length array of checksums only</div><div class='del'>-	 * used by reads</div><div class='del'>-	 */</div><div class='del'>-	u8 sums[];</div><div class='add'>+	/* Must be last. */</div><div class='add'>+	struct btrfs_bio bbio;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static inline unsigned int btrfs_compress_type(unsigned int type_level)</div><div class='add'>+static inline struct btrfs_fs_info *cb_to_fs_info(const struct compressed_bio *cb)</div><div class='ctx'> {</div><div class='del'>-	return (type_level &amp; 0xF);</div><div class='add'>+	return cb-&gt;bbio.inode-&gt;root-&gt;fs_info;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline unsigned int btrfs_compress_level(unsigned int type_level)</div><div class='add'>+/* @range_end must be exclusive. */</div><div class='add'>+static inline u32 btrfs_calc_input_length(struct folio *folio, u64 range_end, u64 cur)</div><div class='ctx'> {</div><div class='del'>-	return ((type_level &amp; 0xF0) &gt;&gt; 4);</div><div class='add'>+	/* @cur must be inside the folio. */</div><div class='add'>+	ASSERT(folio_pos(folio) &lt;= cur);</div><div class='add'>+	ASSERT(cur &lt; folio_next_pos(folio));</div><div class='add'>+	return umin(range_end, folio_next_pos(folio)) - cur;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void __init btrfs_init_compress(void);</div><div class='add'>+int btrfs_alloc_compress_wsm(struct btrfs_fs_info *fs_info);</div><div class='add'>+void btrfs_free_compress_wsm(struct btrfs_fs_info *fs_info);</div><div class='add'>+</div><div class='add'>+int __init btrfs_init_compress(void);</div><div class='ctx'> void __cold btrfs_exit_compress(void);</div><div class='ctx'> </div><div class='del'>-int btrfs_compress_pages(unsigned int type_level, struct address_space *mapping,</div><div class='del'>-			 u64 start, struct page **pages,</div><div class='del'>-			 unsigned long *out_pages,</div><div class='del'>-			 unsigned long *total_in,</div><div class='del'>-			 unsigned long *total_out);</div><div class='del'>-int btrfs_decompress(int type, unsigned char *data_in, struct page *dest_page,</div><div class='del'>-		     unsigned long start_byte, size_t srclen, size_t destlen);</div><div class='add'>+bool btrfs_compress_level_valid(unsigned int type, int level);</div><div class='add'>+int btrfs_compress_folios(unsigned int type, int level, struct btrfs_inode *inode,</div><div class='add'>+			  u64 start, struct folio **folios, unsigned long *out_folios,</div><div class='add'>+			 unsigned long *total_in, unsigned long *total_out);</div><div class='add'>+int btrfs_decompress(int type, const u8 *data_in, struct folio *dest_folio,</div><div class='add'>+		     unsigned long dest_pgoff, size_t srclen, size_t destlen);</div><div class='ctx'> int btrfs_decompress_buf2page(const char *buf, u32 buf_len,</div><div class='ctx'> 			      struct compressed_bio *cb, u32 decompressed);</div><div class='ctx'> </div><div class='del'>-blk_status_t btrfs_submit_compressed_write(struct btrfs_inode *inode, u64 start,</div><div class='del'>-				  unsigned int len, u64 disk_start,</div><div class='del'>-				  unsigned int compressed_len,</div><div class='del'>-				  struct page **compressed_pages,</div><div class='del'>-				  unsigned int nr_pages,</div><div class='del'>-				  unsigned int write_flags,</div><div class='del'>-				  struct cgroup_subsys_state *blkcg_css);</div><div class='del'>-blk_status_t btrfs_submit_compressed_read(struct inode *inode, struct bio *bio,</div><div class='del'>-				 int mirror_num, unsigned long bio_flags);</div><div class='del'>-</div><div class='del'>-unsigned int btrfs_compress_str2level(unsigned int type, const char *str);</div><div class='del'>-</div><div class='del'>-enum btrfs_compression_type {</div><div class='del'>-	BTRFS_COMPRESS_NONE  = 0,</div><div class='del'>-	BTRFS_COMPRESS_ZLIB  = 1,</div><div class='del'>-	BTRFS_COMPRESS_LZO   = 2,</div><div class='del'>-	BTRFS_COMPRESS_ZSTD  = 3,</div><div class='del'>-	BTRFS_NR_COMPRESS_TYPES = 4,</div><div class='del'>-};</div><div class='add'>+void btrfs_submit_compressed_write(struct btrfs_ordered_extent *ordered,</div><div class='add'>+				   struct folio **compressed_folios,</div><div class='add'>+				   unsigned int nr_folios, blk_opf_t write_flags,</div><div class='add'>+				   bool writeback);</div><div class='add'>+void btrfs_submit_compressed_read(struct btrfs_bio *bbio);</div><div class='add'>+</div><div class='add'>+int btrfs_compress_str2level(unsigned int type, const char *str, int *level_ret);</div><div class='add'>+</div><div class='add'>+struct folio *btrfs_alloc_compr_folio(struct btrfs_fs_info *fs_info);</div><div class='add'>+void btrfs_free_compr_folio(struct folio *folio);</div><div class='ctx'> </div><div class='ctx'> struct workspace_manager {</div><div class='ctx'> 	struct list_head idle_ws;</div><div class='hunk'>@@ -120,62 +121,65 @@ struct workspace_manager {</div><div class='ctx'> 	wait_queue_head_t ws_wait;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-struct list_head *btrfs_get_workspace(int type, unsigned int level);</div><div class='del'>-void btrfs_put_workspace(int type, struct list_head *ws);</div><div class='add'>+struct list_head *btrfs_get_workspace(struct btrfs_fs_info *fs_info, int type, int level);</div><div class='add'>+void btrfs_put_workspace(struct btrfs_fs_info *fs_info, int type, struct list_head *ws);</div><div class='ctx'> </div><div class='del'>-struct btrfs_compress_op {</div><div class='del'>-	struct workspace_manager *workspace_manager;</div><div class='add'>+struct btrfs_compress_levels {</div><div class='ctx'> 	/* Maximum level supported by the compression algorithm */</div><div class='del'>-	unsigned int max_level;</div><div class='del'>-	unsigned int default_level;</div><div class='add'>+	int min_level;</div><div class='add'>+	int max_level;</div><div class='add'>+	int default_level;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /* The heuristic workspaces are managed via the 0th workspace manager */</div><div class='ctx'> #define BTRFS_NR_WORKSPACE_MANAGERS	BTRFS_NR_COMPRESS_TYPES</div><div class='ctx'> </div><div class='del'>-extern const struct btrfs_compress_op btrfs_heuristic_compress;</div><div class='del'>-extern const struct btrfs_compress_op btrfs_zlib_compress;</div><div class='del'>-extern const struct btrfs_compress_op btrfs_lzo_compress;</div><div class='del'>-extern const struct btrfs_compress_op btrfs_zstd_compress;</div><div class='add'>+extern const struct btrfs_compress_levels btrfs_heuristic_compress;</div><div class='add'>+extern const struct btrfs_compress_levels btrfs_zlib_compress;</div><div class='add'>+extern const struct btrfs_compress_levels btrfs_lzo_compress;</div><div class='add'>+extern const struct btrfs_compress_levels btrfs_zstd_compress;</div><div class='ctx'> </div><div class='ctx'> const char* btrfs_compress_type2str(enum btrfs_compression_type type);</div><div class='ctx'> bool btrfs_compress_is_valid_type(const char *str, size_t len);</div><div class='ctx'> </div><div class='del'>-int btrfs_compress_heuristic(struct inode *inode, u64 start, u64 end);</div><div class='add'>+int btrfs_compress_heuristic(struct btrfs_inode *inode, u64 start, u64 end);</div><div class='add'>+</div><div class='add'>+int btrfs_compress_filemap_get_folio(struct address_space *mapping, u64 start,</div><div class='add'>+				     struct folio **in_folio_ret);</div><div class='ctx'> </div><div class='del'>-int zlib_compress_pages(struct list_head *ws, struct address_space *mapping,</div><div class='del'>-		u64 start, struct page **pages, unsigned long *out_pages,</div><div class='add'>+int zlib_compress_folios(struct list_head *ws, struct btrfs_inode *inode,</div><div class='add'>+			 u64 start, struct folio **folios, unsigned long *out_folios,</div><div class='ctx'> 		unsigned long *total_in, unsigned long *total_out);</div><div class='ctx'> int zlib_decompress_bio(struct list_head *ws, struct compressed_bio *cb);</div><div class='del'>-int zlib_decompress(struct list_head *ws, unsigned char *data_in,</div><div class='del'>-		struct page *dest_page, unsigned long start_byte, size_t srclen,</div><div class='add'>+int zlib_decompress(struct list_head *ws, const u8 *data_in,</div><div class='add'>+		struct folio *dest_folio, unsigned long dest_pgoff, size_t srclen,</div><div class='ctx'> 		size_t destlen);</div><div class='del'>-struct list_head *zlib_alloc_workspace(unsigned int level);</div><div class='add'>+struct list_head *zlib_alloc_workspace(struct btrfs_fs_info *fs_info, unsigned int level);</div><div class='ctx'> void zlib_free_workspace(struct list_head *ws);</div><div class='del'>-struct list_head *zlib_get_workspace(unsigned int level);</div><div class='add'>+struct list_head *zlib_get_workspace(struct btrfs_fs_info *fs_info, unsigned int level);</div><div class='ctx'> </div><div class='del'>-int lzo_compress_pages(struct list_head *ws, struct address_space *mapping,</div><div class='del'>-		u64 start, struct page **pages, unsigned long *out_pages,</div><div class='add'>+int lzo_compress_folios(struct list_head *ws, struct btrfs_inode *inode,</div><div class='add'>+			u64 start, struct folio **folios, unsigned long *out_folios,</div><div class='ctx'> 		unsigned long *total_in, unsigned long *total_out);</div><div class='ctx'> int lzo_decompress_bio(struct list_head *ws, struct compressed_bio *cb);</div><div class='del'>-int lzo_decompress(struct list_head *ws, unsigned char *data_in,</div><div class='del'>-		struct page *dest_page, unsigned long start_byte, size_t srclen,</div><div class='add'>+int lzo_decompress(struct list_head *ws, const u8 *data_in,</div><div class='add'>+		struct folio *dest_folio, unsigned long dest_pgoff, size_t srclen,</div><div class='ctx'> 		size_t destlen);</div><div class='del'>-struct list_head *lzo_alloc_workspace(unsigned int level);</div><div class='add'>+struct list_head *lzo_alloc_workspace(struct btrfs_fs_info *fs_info);</div><div class='ctx'> void lzo_free_workspace(struct list_head *ws);</div><div class='ctx'> </div><div class='del'>-int zstd_compress_pages(struct list_head *ws, struct address_space *mapping,</div><div class='del'>-		u64 start, struct page **pages, unsigned long *out_pages,</div><div class='add'>+int zstd_compress_folios(struct list_head *ws, struct btrfs_inode *inode,</div><div class='add'>+			 u64 start, struct folio **folios, unsigned long *out_folios,</div><div class='ctx'> 		unsigned long *total_in, unsigned long *total_out);</div><div class='ctx'> int zstd_decompress_bio(struct list_head *ws, struct compressed_bio *cb);</div><div class='del'>-int zstd_decompress(struct list_head *ws, unsigned char *data_in,</div><div class='del'>-		struct page *dest_page, unsigned long start_byte, size_t srclen,</div><div class='add'>+int zstd_decompress(struct list_head *ws, const u8 *data_in,</div><div class='add'>+		struct folio *dest_folio, unsigned long dest_pgoff, size_t srclen,</div><div class='ctx'> 		size_t destlen);</div><div class='del'>-void zstd_init_workspace_manager(void);</div><div class='del'>-void zstd_cleanup_workspace_manager(void);</div><div class='del'>-struct list_head *zstd_alloc_workspace(unsigned int level);</div><div class='add'>+int zstd_alloc_workspace_manager(struct btrfs_fs_info *fs_info);</div><div class='add'>+void zstd_free_workspace_manager(struct btrfs_fs_info *fs_info);</div><div class='add'>+struct list_head *zstd_alloc_workspace(struct btrfs_fs_info *fs_info, int level);</div><div class='ctx'> void zstd_free_workspace(struct list_head *ws);</div><div class='del'>-struct list_head *zstd_get_workspace(unsigned int level);</div><div class='del'>-void zstd_put_workspace(struct list_head *ws);</div><div class='add'>+struct list_head *zstd_get_workspace(struct btrfs_fs_info *fs_info, int level);</div><div class='add'>+void zstd_put_workspace(struct btrfs_fs_info *fs_info, struct list_head *ws);</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/btrfs/ctree.c b/fs/btrfs/ctree.c<br/>index c3983bdaf4b8..a48b4befbee7 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/ctree.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/ctree.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/ctree.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/ctree.c</a></div><div class='hunk'>@@ -8,6 +8,7 @@</div><div class='ctx'> #include &lt;linux/rbtree.h&gt;</div><div class='ctx'> #include &lt;linux/mm.h&gt;</div><div class='ctx'> #include &lt;linux/error-injection.h&gt;</div><div class='add'>+#include "messages.h"</div><div class='ctx'> #include "ctree.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='ctx'> #include "transaction.h"</div><div class='hunk'>@@ -16,67 +17,128 @@</div><div class='ctx'> #include "volumes.h"</div><div class='ctx'> #include "qgroup.h"</div><div class='ctx'> #include "tree-mod-log.h"</div><div class='add'>+#include "tree-checker.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "extent-tree.h"</div><div class='add'>+#include "relocation.h"</div><div class='add'>+#include "file-item.h"</div><div class='add'>+</div><div class='add'>+static struct kmem_cache *btrfs_path_cachep;</div><div class='ctx'> </div><div class='ctx'> static int split_node(struct btrfs_trans_handle *trans, struct btrfs_root</div><div class='ctx'> 		      *root, struct btrfs_path *path, int level);</div><div class='ctx'> static int split_leaf(struct btrfs_trans_handle *trans, struct btrfs_root *root,</div><div class='ctx'> 		      const struct btrfs_key *ins_key, struct btrfs_path *path,</div><div class='del'>-		      int data_size, int extend);</div><div class='add'>+		      int data_size, bool extend);</div><div class='ctx'> static int push_node_left(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			  struct extent_buffer *dst,</div><div class='del'>-			  struct extent_buffer *src, int empty);</div><div class='add'>+			  struct extent_buffer *src, bool empty);</div><div class='ctx'> static int balance_node_right(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			      struct extent_buffer *dst_buf,</div><div class='ctx'> 			      struct extent_buffer *src_buf);</div><div class='del'>-static void del_ptr(struct btrfs_root *root, struct btrfs_path *path,</div><div class='del'>-		    int level, int slot);</div><div class='del'>-</div><div class='del'>-static const struct btrfs_csums {</div><div class='del'>-	u16		size;</div><div class='del'>-	const char	name[10];</div><div class='del'>-	const char	driver[12];</div><div class='del'>-} btrfs_csums[] = {</div><div class='del'>-	[BTRFS_CSUM_TYPE_CRC32] = { .size = 4, .name = "crc32c" },</div><div class='del'>-	[BTRFS_CSUM_TYPE_XXHASH] = { .size = 8, .name = "xxhash64" },</div><div class='del'>-	[BTRFS_CSUM_TYPE_SHA256] = { .size = 32, .name = "sha256" },</div><div class='del'>-	[BTRFS_CSUM_TYPE_BLAKE2] = { .size = 32, .name = "blake2b",</div><div class='del'>-				     .driver = "blake2b-256" },</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-int btrfs_super_csum_size(const struct btrfs_super_block *s)</div><div class='add'>+/*</div><div class='add'>+ * The leaf data grows from end-to-front in the node.  this returns the address</div><div class='add'>+ * of the start of the last item, which is the stop of the leaf data stack.</div><div class='add'>+ */</div><div class='add'>+static unsigned int leaf_data_end(const struct extent_buffer *leaf)</div><div class='ctx'> {</div><div class='del'>-	u16 t = btrfs_super_csum_type(s);</div><div class='del'>-	/*</div><div class='del'>-	 * csum type is validated at mount time</div><div class='del'>-	 */</div><div class='del'>-	return btrfs_csums[t].size;</div><div class='add'>+	u32 nr = btrfs_header_nritems(leaf);</div><div class='add'>+</div><div class='add'>+	if (nr == 0)</div><div class='add'>+		return BTRFS_LEAF_DATA_SIZE(leaf-&gt;fs_info);</div><div class='add'>+	return btrfs_item_offset(leaf, nr - 1);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-const char *btrfs_super_csum_name(u16 csum_type)</div><div class='add'>+/*</div><div class='add'>+ * Move data in a @leaf (using memmove, safe for overlapping ranges).</div><div class='add'>+ *</div><div class='add'>+ * @leaf:	leaf that we're doing a memmove on</div><div class='add'>+ * @dst_offset:	item data offset we're moving to</div><div class='add'>+ * @src_offset:	item data offset were' moving from</div><div class='add'>+ * @len:	length of the data we're moving</div><div class='add'>+ *</div><div class='add'>+ * Wrapper around memmove_extent_buffer() that takes into account the header on</div><div class='add'>+ * the leaf.  The btrfs_item offset's start directly after the header, so we</div><div class='add'>+ * have to adjust any offsets to account for the header in the leaf.  This</div><div class='add'>+ * handles that math to simplify the callers.</div><div class='add'>+ */</div><div class='add'>+static inline void memmove_leaf_data(const struct extent_buffer *leaf,</div><div class='add'>+				     unsigned long dst_offset,</div><div class='add'>+				     unsigned long src_offset,</div><div class='add'>+				     unsigned long len)</div><div class='ctx'> {</div><div class='del'>-	/* csum type is validated at mount time */</div><div class='del'>-	return btrfs_csums[csum_type].name;</div><div class='add'>+	memmove_extent_buffer(leaf, btrfs_item_nr_offset(leaf, 0) + dst_offset,</div><div class='add'>+			      btrfs_item_nr_offset(leaf, 0) + src_offset, len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Return driver name if defined, otherwise the name that's also a valid driver</div><div class='del'>- * name</div><div class='add'>+ * Copy item data from @src into @dst at the given @offset.</div><div class='add'>+ *</div><div class='add'>+ * @dst:	destination leaf that we're copying into</div><div class='add'>+ * @src:	source leaf that we're copying from</div><div class='add'>+ * @dst_offset:	item data offset we're copying to</div><div class='add'>+ * @src_offset:	item data offset were' copying from</div><div class='add'>+ * @len:	length of the data we're copying</div><div class='add'>+ *</div><div class='add'>+ * Wrapper around copy_extent_buffer() that takes into account the header on</div><div class='add'>+ * the leaf.  The btrfs_item offset's start directly after the header, so we</div><div class='add'>+ * have to adjust any offsets to account for the header in the leaf.  This</div><div class='add'>+ * handles that math to simplify the callers.</div><div class='ctx'>  */</div><div class='del'>-const char *btrfs_super_csum_driver(u16 csum_type)</div><div class='add'>+static inline void copy_leaf_data(const struct extent_buffer *dst,</div><div class='add'>+				  const struct extent_buffer *src,</div><div class='add'>+				  unsigned long dst_offset,</div><div class='add'>+				  unsigned long src_offset, unsigned long len)</div><div class='ctx'> {</div><div class='del'>-	/* csum type is validated at mount time */</div><div class='del'>-	return btrfs_csums[csum_type].driver[0] ?</div><div class='del'>-		btrfs_csums[csum_type].driver :</div><div class='del'>-		btrfs_csums[csum_type].name;</div><div class='add'>+	copy_extent_buffer(dst, src, btrfs_item_nr_offset(dst, 0) + dst_offset,</div><div class='add'>+			   btrfs_item_nr_offset(src, 0) + src_offset, len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-size_t __attribute_const__ btrfs_get_num_csums(void)</div><div class='add'>+/*</div><div class='add'>+ * Move items in a @leaf (using memmove).</div><div class='add'>+ *</div><div class='add'>+ * @dst:	destination leaf for the items</div><div class='add'>+ * @dst_item:	the item nr we're copying into</div><div class='add'>+ * @src_item:	the item nr we're copying from</div><div class='add'>+ * @nr_items:	the number of items to copy</div><div class='add'>+ *</div><div class='add'>+ * Wrapper around memmove_extent_buffer() that does the math to get the</div><div class='add'>+ * appropriate offsets into the leaf from the item numbers.</div><div class='add'>+ */</div><div class='add'>+static inline void memmove_leaf_items(const struct extent_buffer *leaf,</div><div class='add'>+				      int dst_item, int src_item, int nr_items)</div><div class='add'>+{</div><div class='add'>+	memmove_extent_buffer(leaf, btrfs_item_nr_offset(leaf, dst_item),</div><div class='add'>+			      btrfs_item_nr_offset(leaf, src_item),</div><div class='add'>+			      nr_items * sizeof(struct btrfs_item));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Copy items from @src into @dst at the given @offset.</div><div class='add'>+ *</div><div class='add'>+ * @dst:	destination leaf for the items</div><div class='add'>+ * @src:	source leaf for the items</div><div class='add'>+ * @dst_item:	the item nr we're copying into</div><div class='add'>+ * @src_item:	the item nr we're copying from</div><div class='add'>+ * @nr_items:	the number of items to copy</div><div class='add'>+ *</div><div class='add'>+ * Wrapper around copy_extent_buffer() that does the math to get the</div><div class='add'>+ * appropriate offsets into the leaf from the item numbers.</div><div class='add'>+ */</div><div class='add'>+static inline void copy_leaf_items(const struct extent_buffer *dst,</div><div class='add'>+				   const struct extent_buffer *src,</div><div class='add'>+				   int dst_item, int src_item, int nr_items)</div><div class='ctx'> {</div><div class='del'>-	return ARRAY_SIZE(btrfs_csums);</div><div class='add'>+	copy_extent_buffer(dst, src, btrfs_item_nr_offset(dst, dst_item),</div><div class='add'>+			      btrfs_item_nr_offset(src, src_item),</div><div class='add'>+			      nr_items * sizeof(struct btrfs_item));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct btrfs_path *btrfs_alloc_path(void)</div><div class='ctx'> {</div><div class='add'>+	might_sleep();</div><div class='add'>+</div><div class='ctx'> 	return kmem_cache_zalloc(btrfs_path_cachep, GFP_NOFS);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -136,7 +198,7 @@ struct extent_buffer *btrfs_root_node(struct btrfs_root *root)</div><div class='ctx'> 		 * the inc_not_zero dance and if it doesn't work then</div><div class='ctx'> 		 * synchronize_rcu and try again.</div><div class='ctx'> 		 */</div><div class='del'>-		if (atomic_inc_not_zero(&amp;eb-&gt;refs)) {</div><div class='add'>+		if (refcount_inc_not_zero(&amp;eb-&gt;refs)) {</div><div class='ctx'> 			rcu_read_unlock();</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -162,7 +224,7 @@ static void add_root_to_dirty_list(struct btrfs_root *root)</div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;trans_lock);</div><div class='ctx'> 	if (!test_and_set_bit(BTRFS_ROOT_DIRTY, &amp;root-&gt;state)) {</div><div class='ctx'> 		/* Want the extent tree to be the last on the list */</div><div class='del'>-		if (root-&gt;root_key.objectid == BTRFS_EXTENT_TREE_OBJECTID)</div><div class='add'>+		if (btrfs_root_id(root) == BTRFS_EXTENT_TREE_OBJECTID)</div><div class='ctx'> 			list_move_tail(&amp;root-&gt;dirty_list,</div><div class='ctx'> 				       &amp;fs_info-&gt;dirty_cowonly_roots);</div><div class='ctx'> 		else</div><div class='hunk'>@@ -187,11 +249,12 @@ int btrfs_copy_root(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int level;</div><div class='ctx'> 	struct btrfs_disk_key disk_key;</div><div class='add'>+	u64 reloc_src_root = 0;</div><div class='ctx'> </div><div class='ctx'> 	WARN_ON(test_bit(BTRFS_ROOT_SHAREABLE, &amp;root-&gt;state) &amp;&amp;</div><div class='ctx'> 		trans-&gt;transid != fs_info-&gt;running_transaction-&gt;transid);</div><div class='ctx'> 	WARN_ON(test_bit(BTRFS_ROOT_SHAREABLE, &amp;root-&gt;state) &amp;&amp;</div><div class='del'>-		trans-&gt;transid != root-&gt;last_trans);</div><div class='add'>+		trans-&gt;transid != btrfs_get_root_last_trans(root));</div><div class='ctx'> </div><div class='ctx'> 	level = btrfs_header_level(buf);</div><div class='ctx'> 	if (level == 0)</div><div class='hunk'>@@ -199,9 +262,11 @@ int btrfs_copy_root(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	else</div><div class='ctx'> 		btrfs_node_key(buf, &amp;disk_key, 0);</div><div class='ctx'> </div><div class='add'>+	if (new_root_objectid == BTRFS_TREE_RELOC_OBJECTID)</div><div class='add'>+		reloc_src_root = btrfs_header_owner(buf);</div><div class='ctx'> 	cow = btrfs_alloc_tree_block(trans, root, 0, new_root_objectid,</div><div class='ctx'> 				     &amp;disk_key, level, buf-&gt;start, 0,</div><div class='del'>-				     BTRFS_NESTING_NEW_ROOT);</div><div class='add'>+				     reloc_src_root, BTRFS_NESTING_NEW_ROOT);</div><div class='ctx'> 	if (IS_ERR(cow))</div><div class='ctx'> 		return PTR_ERR(cow);</div><div class='ctx'> </div><div class='hunk'>@@ -218,19 +283,30 @@ int btrfs_copy_root(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	write_extent_buffer_fsid(cow, fs_info-&gt;fs_devices-&gt;metadata_uuid);</div><div class='ctx'> </div><div class='del'>-	WARN_ON(btrfs_header_generation(buf) &gt; trans-&gt;transid);</div><div class='del'>-	if (new_root_objectid == BTRFS_TREE_RELOC_OBJECTID)</div><div class='add'>+	if (unlikely(btrfs_header_generation(buf) &gt; trans-&gt;transid)) {</div><div class='add'>+		btrfs_tree_unlock(cow);</div><div class='add'>+		free_extent_buffer(cow);</div><div class='add'>+		ret = -EUCLEAN;</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (new_root_objectid == BTRFS_TREE_RELOC_OBJECTID) {</div><div class='ctx'> 		ret = btrfs_inc_ref(trans, root, cow, 1);</div><div class='del'>-	else</div><div class='add'>+		if (unlikely(ret))</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+	} else {</div><div class='ctx'> 		ret = btrfs_inc_ref(trans, root, cow, 0);</div><div class='add'>+		if (unlikely(ret))</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+	}</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		btrfs_tree_unlock(cow);</div><div class='ctx'> 		free_extent_buffer(cow);</div><div class='del'>-		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_mark_buffer_dirty(cow);</div><div class='add'>+	btrfs_mark_buffer_dirty(trans, cow);</div><div class='ctx'> 	*cow_ret = cow;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -238,22 +314,41 @@ int btrfs_copy_root(struct btrfs_trans_handle *trans,</div><div class='ctx'> /*</div><div class='ctx'>  * check if the tree block can be shared by multiple trees</div><div class='ctx'>  */</div><div class='del'>-int btrfs_block_can_be_shared(struct btrfs_root *root,</div><div class='del'>-			      struct extent_buffer *buf)</div><div class='add'>+bool btrfs_block_can_be_shared(const struct btrfs_trans_handle *trans,</div><div class='add'>+			       const struct btrfs_root *root,</div><div class='add'>+			       const struct extent_buffer *buf)</div><div class='ctx'> {</div><div class='add'>+	const u64 buf_gen = btrfs_header_generation(buf);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Tree blocks not in shareable trees and tree roots are never shared.</div><div class='ctx'> 	 * If a block was allocated after the last snapshot and the block was</div><div class='ctx'> 	 * not allocated by tree relocation, we know the block is not shared.</div><div class='ctx'> 	 */</div><div class='del'>-	if (test_bit(BTRFS_ROOT_SHAREABLE, &amp;root-&gt;state) &amp;&amp;</div><div class='del'>-	    buf != root-&gt;node &amp;&amp; buf != root-&gt;commit_root &amp;&amp;</div><div class='del'>-	    (btrfs_header_generation(buf) &lt;=</div><div class='del'>-	     btrfs_root_last_snapshot(&amp;root-&gt;root_item) ||</div><div class='del'>-	     btrfs_header_flag(buf, BTRFS_HEADER_FLAG_RELOC)))</div><div class='del'>-		return 1;</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+	if (!test_bit(BTRFS_ROOT_SHAREABLE, &amp;root-&gt;state))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	if (buf == root-&gt;node)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	if (buf_gen &gt; btrfs_root_last_snapshot(&amp;root-&gt;root_item) &amp;&amp;</div><div class='add'>+	    !btrfs_header_flag(buf, BTRFS_HEADER_FLAG_RELOC))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	if (buf != root-&gt;commit_root)</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * An extent buffer that used to be the commit root may still be shared</div><div class='add'>+	 * because the tree height may have increased and it became a child of a</div><div class='add'>+	 * higher level root. This can happen when snapshotting a subvolume</div><div class='add'>+	 * created in the current transaction.</div><div class='add'>+	 */</div><div class='add'>+	if (buf_gen == trans-&gt;transid)</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static noinline int update_ref_for_cow(struct btrfs_trans_handle *trans,</div><div class='hunk'>@@ -266,7 +361,6 @@ static noinline int update_ref_for_cow(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	u64 refs;</div><div class='ctx'> 	u64 owner;</div><div class='ctx'> 	u64 flags;</div><div class='del'>-	u64 new_flags = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -286,20 +380,24 @@ static noinline int update_ref_for_cow(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * are only allowed for blocks use full backrefs.</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='del'>-	if (btrfs_block_can_be_shared(root, buf)) {</div><div class='add'>+	if (btrfs_block_can_be_shared(trans, root, buf)) {</div><div class='ctx'> 		ret = btrfs_lookup_extent_info(trans, fs_info, buf-&gt;start,</div><div class='ctx'> 					       btrfs_header_level(buf), 1,</div><div class='del'>-					       &amp;refs, &amp;flags);</div><div class='add'>+					       &amp;refs, &amp;flags, NULL);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='del'>-		if (refs == 0) {</div><div class='del'>-			ret = -EROFS;</div><div class='del'>-			btrfs_handle_fs_error(fs_info, ret, NULL);</div><div class='add'>+		if (unlikely(refs == 0)) {</div><div class='add'>+			btrfs_crit(fs_info,</div><div class='add'>+		"found 0 references for tree block at bytenr %llu level %d root %llu",</div><div class='add'>+				   buf-&gt;start, btrfs_header_level(buf),</div><div class='add'>+				   btrfs_root_id(root));</div><div class='add'>+			ret = -EUCLEAN;</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			return ret;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='ctx'> 		refs = 1;</div><div class='del'>-		if (root-&gt;root_key.objectid == BTRFS_TREE_RELOC_OBJECTID ||</div><div class='add'>+		if (btrfs_root_id(root) == BTRFS_TREE_RELOC_OBJECTID ||</div><div class='ctx'> 		    btrfs_header_backref_rev(buf) &lt; BTRFS_MIXED_BACKREF_REV)</div><div class='ctx'> 			flags = BTRFS_BLOCK_FLAG_FULL_BACKREF;</div><div class='ctx'> 		else</div><div class='hunk'>@@ -307,19 +405,26 @@ static noinline int update_ref_for_cow(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	owner = btrfs_header_owner(buf);</div><div class='del'>-	BUG_ON(owner == BTRFS_TREE_RELOC_OBJECTID &amp;&amp;</div><div class='del'>-	       !(flags &amp; BTRFS_BLOCK_FLAG_FULL_BACKREF));</div><div class='add'>+	if (unlikely(owner == BTRFS_TREE_RELOC_OBJECTID &amp;&amp;</div><div class='add'>+		     !(flags &amp; BTRFS_BLOCK_FLAG_FULL_BACKREF))) {</div><div class='add'>+		btrfs_crit(fs_info,</div><div class='add'>+"found tree block at bytenr %llu level %d root %llu refs %llu flags %llx without full backref flag set",</div><div class='add'>+			   buf-&gt;start, btrfs_header_level(buf),</div><div class='add'>+			   btrfs_root_id(root), refs, flags);</div><div class='add'>+		ret = -EUCLEAN;</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (refs &gt; 1) {</div><div class='del'>-		if ((owner == root-&gt;root_key.objectid ||</div><div class='del'>-		     root-&gt;root_key.objectid == BTRFS_TREE_RELOC_OBJECTID) &amp;&amp;</div><div class='add'>+		if ((owner == btrfs_root_id(root) ||</div><div class='add'>+		     btrfs_root_id(root) == BTRFS_TREE_RELOC_OBJECTID) &amp;&amp;</div><div class='ctx'> 		    !(flags &amp; BTRFS_BLOCK_FLAG_FULL_BACKREF)) {</div><div class='ctx'> 			ret = btrfs_inc_ref(trans, root, buf, 1);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				return ret;</div><div class='ctx'> </div><div class='del'>-			if (root-&gt;root_key.objectid ==</div><div class='del'>-			    BTRFS_TREE_RELOC_OBJECTID) {</div><div class='add'>+			if (btrfs_root_id(root) == BTRFS_TREE_RELOC_OBJECTID) {</div><div class='ctx'> 				ret = btrfs_dec_ref(trans, root, buf, 0);</div><div class='ctx'> 				if (ret)</div><div class='ctx'> 					return ret;</div><div class='hunk'>@@ -327,29 +432,22 @@ static noinline int update_ref_for_cow(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				if (ret)</div><div class='ctx'> 					return ret;</div><div class='ctx'> 			}</div><div class='del'>-			new_flags |= BTRFS_BLOCK_FLAG_FULL_BACKREF;</div><div class='add'>+			ret = btrfs_set_disk_extent_flags(trans, buf,</div><div class='add'>+						  BTRFS_BLOCK_FLAG_FULL_BACKREF);</div><div class='add'>+			if (ret)</div><div class='add'>+				return ret;</div><div class='ctx'> 		} else {</div><div class='ctx'> </div><div class='del'>-			if (root-&gt;root_key.objectid ==</div><div class='del'>-			    BTRFS_TREE_RELOC_OBJECTID)</div><div class='add'>+			if (btrfs_root_id(root) == BTRFS_TREE_RELOC_OBJECTID)</div><div class='ctx'> 				ret = btrfs_inc_ref(trans, root, cow, 1);</div><div class='ctx'> 			else</div><div class='ctx'> 				ret = btrfs_inc_ref(trans, root, cow, 0);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				return ret;</div><div class='ctx'> 		}</div><div class='del'>-		if (new_flags != 0) {</div><div class='del'>-			int level = btrfs_header_level(buf);</div><div class='del'>-</div><div class='del'>-			ret = btrfs_set_disk_extent_flags(trans, buf,</div><div class='del'>-							  new_flags, level, 0);</div><div class='del'>-			if (ret)</div><div class='del'>-				return ret;</div><div class='del'>-		}</div><div class='ctx'> 	} else {</div><div class='ctx'> 		if (flags &amp; BTRFS_BLOCK_FLAG_FULL_BACKREF) {</div><div class='del'>-			if (root-&gt;root_key.objectid ==</div><div class='del'>-			    BTRFS_TREE_RELOC_OBJECTID)</div><div class='add'>+			if (btrfs_root_id(root) == BTRFS_TREE_RELOC_OBJECTID)</div><div class='ctx'> 				ret = btrfs_inc_ref(trans, root, cow, 1);</div><div class='ctx'> 			else</div><div class='ctx'> 				ret = btrfs_inc_ref(trans, root, cow, 0);</div><div class='hunk'>@@ -359,7 +457,7 @@ static noinline int update_ref_for_cow(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				return ret;</div><div class='ctx'> 		}</div><div class='del'>-		btrfs_clean_tree_block(buf);</div><div class='add'>+		btrfs_clear_buffer_dirty(trans, buf);</div><div class='ctx'> 		*last_ref = 1;</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -377,13 +475,13 @@ static noinline int update_ref_for_cow(struct btrfs_trans_handle *trans,</div><div class='ctx'>  * bytes the allocator should try to find free next to the block it returns.</div><div class='ctx'>  * This is just a hint and may be ignored by the allocator.</div><div class='ctx'>  */</div><div class='del'>-static noinline int __btrfs_cow_block(struct btrfs_trans_handle *trans,</div><div class='del'>-			     struct btrfs_root *root,</div><div class='del'>-			     struct extent_buffer *buf,</div><div class='del'>-			     struct extent_buffer *parent, int parent_slot,</div><div class='del'>-			     struct extent_buffer **cow_ret,</div><div class='del'>-			     u64 search_start, u64 empty_size,</div><div class='del'>-			     enum btrfs_lock_nesting nest)</div><div class='add'>+int btrfs_force_cow_block(struct btrfs_trans_handle *trans,</div><div class='add'>+			  struct btrfs_root *root,</div><div class='add'>+			  struct extent_buffer *buf,</div><div class='add'>+			  struct extent_buffer *parent, int parent_slot,</div><div class='add'>+			  struct extent_buffer **cow_ret,</div><div class='add'>+			  u64 search_start, u64 empty_size,</div><div class='add'>+			  enum btrfs_lock_nesting nest)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_disk_key disk_key;</div><div class='hunk'>@@ -392,6 +490,7 @@ static noinline int __btrfs_cow_block(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	int last_ref = 0;</div><div class='ctx'> 	int unlock_orig = 0;</div><div class='ctx'> 	u64 parent_start = 0;</div><div class='add'>+	u64 reloc_src_root = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (*cow_ret == buf)</div><div class='ctx'> 		unlock_orig = 1;</div><div class='hunk'>@@ -401,7 +500,7 @@ static noinline int __btrfs_cow_block(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	WARN_ON(test_bit(BTRFS_ROOT_SHAREABLE, &amp;root-&gt;state) &amp;&amp;</div><div class='ctx'> 		trans-&gt;transid != fs_info-&gt;running_transaction-&gt;transid);</div><div class='ctx'> 	WARN_ON(test_bit(BTRFS_ROOT_SHAREABLE, &amp;root-&gt;state) &amp;&amp;</div><div class='del'>-		trans-&gt;transid != root-&gt;last_trans);</div><div class='add'>+		trans-&gt;transid != btrfs_get_root_last_trans(root));</div><div class='ctx'> </div><div class='ctx'> 	level = btrfs_header_level(buf);</div><div class='ctx'> </div><div class='hunk'>@@ -410,12 +509,14 @@ static noinline int __btrfs_cow_block(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	else</div><div class='ctx'> 		btrfs_node_key(buf, &amp;disk_key, 0);</div><div class='ctx'> </div><div class='del'>-	if ((root-&gt;root_key.objectid == BTRFS_TREE_RELOC_OBJECTID) &amp;&amp; parent)</div><div class='del'>-		parent_start = parent-&gt;start;</div><div class='del'>-</div><div class='add'>+	if (btrfs_root_id(root) == BTRFS_TREE_RELOC_OBJECTID) {</div><div class='add'>+		if (parent)</div><div class='add'>+			parent_start = parent-&gt;start;</div><div class='add'>+		reloc_src_root = btrfs_header_owner(buf);</div><div class='add'>+	}</div><div class='ctx'> 	cow = btrfs_alloc_tree_block(trans, root, parent_start,</div><div class='del'>-				     root-&gt;root_key.objectid, &amp;disk_key, level,</div><div class='del'>-				     search_start, empty_size, nest);</div><div class='add'>+				     btrfs_root_id(root), &amp;disk_key, level,</div><div class='add'>+				     search_start, empty_size, reloc_src_root, nest);</div><div class='ctx'> 	if (IS_ERR(cow))</div><div class='ctx'> 		return PTR_ERR(cow);</div><div class='ctx'> </div><div class='hunk'>@@ -427,84 +528,97 @@ static noinline int __btrfs_cow_block(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	btrfs_set_header_backref_rev(cow, BTRFS_MIXED_BACKREF_REV);</div><div class='ctx'> 	btrfs_clear_header_flag(cow, BTRFS_HEADER_FLAG_WRITTEN |</div><div class='ctx'> 				     BTRFS_HEADER_FLAG_RELOC);</div><div class='del'>-	if (root-&gt;root_key.objectid == BTRFS_TREE_RELOC_OBJECTID)</div><div class='add'>+	if (btrfs_root_id(root) == BTRFS_TREE_RELOC_OBJECTID)</div><div class='ctx'> 		btrfs_set_header_flag(cow, BTRFS_HEADER_FLAG_RELOC);</div><div class='ctx'> 	else</div><div class='del'>-		btrfs_set_header_owner(cow, root-&gt;root_key.objectid);</div><div class='add'>+		btrfs_set_header_owner(cow, btrfs_root_id(root));</div><div class='ctx'> </div><div class='ctx'> 	write_extent_buffer_fsid(cow, fs_info-&gt;fs_devices-&gt;metadata_uuid);</div><div class='ctx'> </div><div class='ctx'> 	ret = update_ref_for_cow(trans, root, buf, cow, &amp;last_ref);</div><div class='del'>-	if (ret) {</div><div class='del'>-		btrfs_tree_unlock(cow);</div><div class='del'>-		free_extent_buffer(cow);</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='del'>-		return ret;</div><div class='add'>+		goto error_unlock_cow;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (test_bit(BTRFS_ROOT_SHAREABLE, &amp;root-&gt;state)) {</div><div class='ctx'> 		ret = btrfs_reloc_cow_block(trans, root, buf, cow);</div><div class='del'>-		if (ret) {</div><div class='del'>-			btrfs_tree_unlock(cow);</div><div class='del'>-			free_extent_buffer(cow);</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='del'>-			return ret;</div><div class='add'>+			goto error_unlock_cow;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (buf == root-&gt;node) {</div><div class='ctx'> 		WARN_ON(parent &amp;&amp; parent != buf);</div><div class='del'>-		if (root-&gt;root_key.objectid == BTRFS_TREE_RELOC_OBJECTID ||</div><div class='add'>+		if (btrfs_root_id(root) == BTRFS_TREE_RELOC_OBJECTID ||</div><div class='ctx'> 		    btrfs_header_backref_rev(buf) &lt; BTRFS_MIXED_BACKREF_REV)</div><div class='ctx'> 			parent_start = buf-&gt;start;</div><div class='ctx'> </div><div class='del'>-		atomic_inc(&amp;cow-&gt;refs);</div><div class='ctx'> 		ret = btrfs_tree_mod_log_insert_root(root-&gt;node, cow, true);</div><div class='del'>-		BUG_ON(ret &lt; 0);</div><div class='add'>+		if (unlikely(ret &lt; 0)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			goto error_unlock_cow;</div><div class='add'>+		}</div><div class='add'>+		refcount_inc(&amp;cow-&gt;refs);</div><div class='ctx'> 		rcu_assign_pointer(root-&gt;node, cow);</div><div class='ctx'> </div><div class='del'>-		btrfs_free_tree_block(trans, root, buf, parent_start,</div><div class='del'>-				      last_ref);</div><div class='add'>+		ret = btrfs_free_tree_block(trans, btrfs_root_id(root), buf,</div><div class='add'>+					    parent_start, last_ref);</div><div class='ctx'> 		free_extent_buffer(buf);</div><div class='ctx'> 		add_root_to_dirty_list(root);</div><div class='add'>+		if (unlikely(ret &lt; 0)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			goto error_unlock_cow;</div><div class='add'>+		}</div><div class='ctx'> 	} else {</div><div class='ctx'> 		WARN_ON(trans-&gt;transid != btrfs_header_generation(parent));</div><div class='del'>-		btrfs_tree_mod_log_insert_key(parent, parent_slot,</div><div class='del'>-					      BTRFS_MOD_LOG_KEY_REPLACE, GFP_NOFS);</div><div class='add'>+		ret = btrfs_tree_mod_log_insert_key(parent, parent_slot,</div><div class='add'>+						    BTRFS_MOD_LOG_KEY_REPLACE);</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			goto error_unlock_cow;</div><div class='add'>+		}</div><div class='ctx'> 		btrfs_set_node_blockptr(parent, parent_slot,</div><div class='ctx'> 					cow-&gt;start);</div><div class='ctx'> 		btrfs_set_node_ptr_generation(parent, parent_slot,</div><div class='ctx'> 					      trans-&gt;transid);</div><div class='del'>-		btrfs_mark_buffer_dirty(parent);</div><div class='add'>+		btrfs_mark_buffer_dirty(trans, parent);</div><div class='ctx'> 		if (last_ref) {</div><div class='ctx'> 			ret = btrfs_tree_mod_log_free_eb(buf);</div><div class='del'>-			if (ret) {</div><div class='del'>-				btrfs_tree_unlock(cow);</div><div class='del'>-				free_extent_buffer(cow);</div><div class='add'>+			if (unlikely(ret)) {</div><div class='ctx'> 				btrfs_abort_transaction(trans, ret);</div><div class='del'>-				return ret;</div><div class='add'>+				goto error_unlock_cow;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		btrfs_free_tree_block(trans, root, buf, parent_start,</div><div class='del'>-				      last_ref);</div><div class='add'>+		ret = btrfs_free_tree_block(trans, btrfs_root_id(root), buf,</div><div class='add'>+					    parent_start, last_ref);</div><div class='add'>+		if (unlikely(ret &lt; 0)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			goto error_unlock_cow;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	trace_btrfs_cow_block(root, buf, cow);</div><div class='ctx'> 	if (unlock_orig)</div><div class='ctx'> 		btrfs_tree_unlock(buf);</div><div class='ctx'> 	free_extent_buffer_stale(buf);</div><div class='del'>-	btrfs_mark_buffer_dirty(cow);</div><div class='add'>+	btrfs_mark_buffer_dirty(trans, cow);</div><div class='ctx'> 	*cow_ret = cow;</div><div class='ctx'> 	return 0;</div><div class='add'>+</div><div class='add'>+error_unlock_cow:</div><div class='add'>+	btrfs_tree_unlock(cow);</div><div class='add'>+	free_extent_buffer(cow);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int should_cow_block(struct btrfs_trans_handle *trans,</div><div class='del'>-				   struct btrfs_root *root,</div><div class='del'>-				   struct extent_buffer *buf)</div><div class='add'>+static inline bool should_cow_block(const struct btrfs_trans_handle *trans,</div><div class='add'>+				    const struct btrfs_root *root,</div><div class='add'>+				    const struct extent_buffer *buf)</div><div class='ctx'> {</div><div class='ctx'> 	if (btrfs_is_testing(root-&gt;fs_info))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	/* Ensure we can see the FORCE_COW bit */</div><div class='del'>-	smp_mb__before_atomic();</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We do not need to cow a block if</div><div class='hunk'>@@ -517,21 +631,33 @@ static inline int should_cow_block(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 *    after we've finished copying src root, we must COW the shared</div><div class='ctx'> 	 *    block to ensure the metadata consistency.</div><div class='ctx'> 	 */</div><div class='del'>-	if (btrfs_header_generation(buf) == trans-&gt;transid &amp;&amp;</div><div class='del'>-	    !btrfs_header_flag(buf, BTRFS_HEADER_FLAG_WRITTEN) &amp;&amp;</div><div class='del'>-	    !(root-&gt;root_key.objectid != BTRFS_TREE_RELOC_OBJECTID &amp;&amp;</div><div class='del'>-	      btrfs_header_flag(buf, BTRFS_HEADER_FLAG_RELOC)) &amp;&amp;</div><div class='del'>-	    !test_bit(BTRFS_ROOT_FORCE_COW, &amp;root-&gt;state))</div><div class='del'>-		return 0;</div><div class='del'>-	return 1;</div><div class='add'>+</div><div class='add'>+	if (btrfs_header_generation(buf) != trans-&gt;transid)</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	if (btrfs_header_flag(buf, BTRFS_HEADER_FLAG_WRITTEN))</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	/* Ensure we can see the FORCE_COW bit. */</div><div class='add'>+	smp_mb__before_atomic();</div><div class='add'>+	if (test_bit(BTRFS_ROOT_FORCE_COW, &amp;root-&gt;state))</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	if (btrfs_root_id(root) == BTRFS_TREE_RELOC_OBJECTID)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	if (btrfs_header_flag(buf, BTRFS_HEADER_FLAG_RELOC))</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * cows a single block, see __btrfs_cow_block for the real work.</div><div class='add'>+ * COWs a single block, see btrfs_force_cow_block() for the real work.</div><div class='ctx'>  * This version of it has extra checks so that a block isn't COWed more than</div><div class='ctx'>  * once per transaction, as long as it hasn't been written yet</div><div class='ctx'>  */</div><div class='del'>-noinline int btrfs_cow_block(struct btrfs_trans_handle *trans,</div><div class='add'>+int btrfs_cow_block(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		    struct btrfs_root *root, struct extent_buffer *buf,</div><div class='ctx'> 		    struct extent_buffer *parent, int parent_slot,</div><div class='ctx'> 		    struct extent_buffer **cow_ret,</div><div class='hunk'>@@ -539,27 +665,38 @@ noinline int btrfs_cow_block(struct btrfs_trans_handle *trans,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	u64 search_start;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (test_bit(BTRFS_ROOT_DELETING, &amp;root-&gt;state))</div><div class='del'>-		btrfs_err(fs_info,</div><div class='del'>-			"COW'ing blocks on a fs root that's being dropped");</div><div class='ctx'> </div><div class='del'>-	if (trans-&gt;transaction != fs_info-&gt;running_transaction)</div><div class='del'>-		WARN(1, KERN_CRIT "trans %llu running %llu\n",</div><div class='del'>-		       trans-&gt;transid,</div><div class='del'>-		       fs_info-&gt;running_transaction-&gt;transid);</div><div class='add'>+	if (unlikely(test_bit(BTRFS_ROOT_DELETING, &amp;root-&gt;state))) {</div><div class='add'>+		btrfs_abort_transaction(trans, -EUCLEAN);</div><div class='add'>+		btrfs_crit(fs_info,</div><div class='add'>+		   "attempt to COW block %llu on root %llu that is being deleted",</div><div class='add'>+			   buf-&gt;start, btrfs_root_id(root));</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (trans-&gt;transid != fs_info-&gt;generation)</div><div class='del'>-		WARN(1, KERN_CRIT "trans %llu running %llu\n",</div><div class='del'>-		       trans-&gt;transid, fs_info-&gt;generation);</div><div class='add'>+	/*</div><div class='add'>+	 * COWing must happen through a running transaction, which always</div><div class='add'>+	 * matches the current fs generation (it's a transaction with a state</div><div class='add'>+	 * less than TRANS_STATE_UNBLOCKED). If it doesn't, then turn the fs</div><div class='add'>+	 * into error state to prevent the commit of any transaction.</div><div class='add'>+	 */</div><div class='add'>+	if (unlikely(trans-&gt;transaction != fs_info-&gt;running_transaction ||</div><div class='add'>+		     trans-&gt;transid != fs_info-&gt;generation)) {</div><div class='add'>+		btrfs_abort_transaction(trans, -EUCLEAN);</div><div class='add'>+		btrfs_crit(fs_info,</div><div class='add'>+"unexpected transaction when attempting to COW block %llu on root %llu, transaction %llu running transaction %llu fs generation %llu",</div><div class='add'>+			   buf-&gt;start, btrfs_root_id(root), trans-&gt;transid,</div><div class='add'>+			   fs_info-&gt;running_transaction-&gt;transid,</div><div class='add'>+			   fs_info-&gt;generation);</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (!should_cow_block(trans, root, buf)) {</div><div class='ctx'> 		*cow_ret = buf;</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	search_start = buf-&gt;start &amp; ~((u64)SZ_1G - 1);</div><div class='add'>+	search_start = round_down(buf-&gt;start, SZ_1G);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Before CoWing this block for later modification, check if it's</div><div class='hunk'>@@ -568,59 +705,12 @@ noinline int btrfs_cow_block(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * Also We don't care about the error, as it's handled internally.</div><div class='ctx'> 	 */</div><div class='ctx'> 	btrfs_qgroup_trace_subtree_after_cow(trans, root, buf);</div><div class='del'>-	ret = __btrfs_cow_block(trans, root, buf, parent,</div><div class='del'>-				 parent_slot, cow_ret, search_start, 0, nest);</div><div class='del'>-</div><div class='del'>-	trace_btrfs_cow_block(root, buf, *cow_ret);</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='add'>+	return btrfs_force_cow_block(trans, root, buf, parent, parent_slot,</div><div class='add'>+				     cow_ret, search_start, 0, nest);</div><div class='ctx'> }</div><div class='ctx'> ALLOW_ERROR_INJECTION(btrfs_cow_block, ERRNO);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * helper function for defrag to decide if two blocks pointed to by a</div><div class='del'>- * node are actually close by</div><div class='del'>- */</div><div class='del'>-static int close_blocks(u64 blocknr, u64 other, u32 blocksize)</div><div class='del'>-{</div><div class='del'>-	if (blocknr &lt; other &amp;&amp; other - (blocknr + blocksize) &lt; 32768)</div><div class='del'>-		return 1;</div><div class='del'>-	if (blocknr &gt; other &amp;&amp; blocknr - (other + blocksize) &lt; 32768)</div><div class='del'>-		return 1;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#ifdef __LITTLE_ENDIAN</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Compare two keys, on little-endian the disk order is same as CPU order and</div><div class='del'>- * we can avoid the conversion.</div><div class='del'>- */</div><div class='del'>-static int comp_keys(const struct btrfs_disk_key *disk_key,</div><div class='del'>-		     const struct btrfs_key *k2)</div><div class='del'>-{</div><div class='del'>-	const struct btrfs_key *k1 = (const struct btrfs_key *)disk_key;</div><div class='del'>-</div><div class='del'>-	return btrfs_comp_cpu_keys(k1, k2);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#else</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * compare two keys in a memcmp fashion</div><div class='del'>- */</div><div class='del'>-static int comp_keys(const struct btrfs_disk_key *disk,</div><div class='del'>-		     const struct btrfs_key *k2)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_key k1;</div><div class='del'>-</div><div class='del'>-	btrfs_disk_key_to_cpu(&amp;k1, disk);</div><div class='del'>-</div><div class='del'>-	return btrfs_comp_cpu_keys(&amp;k1, k2);</div><div class='del'>-}</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * same as comp_keys only with two btrfs_key's</div><div class='ctx'>  */</div><div class='ctx'> int __pure btrfs_comp_cpu_keys(const struct btrfs_key *k1, const struct btrfs_key *k2)</div><div class='hunk'>@@ -641,120 +731,52 @@ int __pure btrfs_comp_cpu_keys(const struct btrfs_key *k1, const struct btrfs_ke</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * this is used by the defrag code to go through all the</div><div class='del'>- * leaves pointed to by a node and reallocate them so that</div><div class='del'>- * disk order is close to key order</div><div class='del'>- */</div><div class='del'>-int btrfs_realloc_node(struct btrfs_trans_handle *trans,</div><div class='del'>-		       struct btrfs_root *root, struct extent_buffer *parent,</div><div class='del'>-		       int start_slot, u64 *last_ret,</div><div class='del'>-		       struct btrfs_key *progress)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='del'>-	struct extent_buffer *cur;</div><div class='del'>-	u64 blocknr;</div><div class='del'>-	u64 search_start = *last_ret;</div><div class='del'>-	u64 last_block = 0;</div><div class='del'>-	u64 other;</div><div class='del'>-	u32 parent_nritems;</div><div class='del'>-	int end_slot;</div><div class='del'>-	int i;</div><div class='del'>-	int err = 0;</div><div class='del'>-	u32 blocksize;</div><div class='del'>-	int progress_passed = 0;</div><div class='del'>-	struct btrfs_disk_key disk_key;</div><div class='del'>-</div><div class='del'>-	WARN_ON(trans-&gt;transaction != fs_info-&gt;running_transaction);</div><div class='del'>-	WARN_ON(trans-&gt;transid != fs_info-&gt;generation);</div><div class='del'>-</div><div class='del'>-	parent_nritems = btrfs_header_nritems(parent);</div><div class='del'>-	blocksize = fs_info-&gt;nodesize;</div><div class='del'>-	end_slot = parent_nritems - 1;</div><div class='del'>-</div><div class='del'>-	if (parent_nritems &lt;= 1)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	for (i = start_slot; i &lt;= end_slot; i++) {</div><div class='del'>-		int close = 1;</div><div class='del'>-</div><div class='del'>-		btrfs_node_key(parent, &amp;disk_key, i);</div><div class='del'>-		if (!progress_passed &amp;&amp; comp_keys(&amp;disk_key, progress) &lt; 0)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		progress_passed = 1;</div><div class='del'>-		blocknr = btrfs_node_blockptr(parent, i);</div><div class='del'>-		if (last_block == 0)</div><div class='del'>-			last_block = blocknr;</div><div class='del'>-</div><div class='del'>-		if (i &gt; 0) {</div><div class='del'>-			other = btrfs_node_blockptr(parent, i - 1);</div><div class='del'>-			close = close_blocks(blocknr, other, blocksize);</div><div class='del'>-		}</div><div class='del'>-		if (!close &amp;&amp; i &lt; end_slot) {</div><div class='del'>-			other = btrfs_node_blockptr(parent, i + 1);</div><div class='del'>-			close = close_blocks(blocknr, other, blocksize);</div><div class='del'>-		}</div><div class='del'>-		if (close) {</div><div class='del'>-			last_block = blocknr;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		cur = btrfs_read_node_slot(parent, i);</div><div class='del'>-		if (IS_ERR(cur))</div><div class='del'>-			return PTR_ERR(cur);</div><div class='del'>-		if (search_start == 0)</div><div class='del'>-			search_start = last_block;</div><div class='del'>-</div><div class='del'>-		btrfs_tree_lock(cur);</div><div class='del'>-		err = __btrfs_cow_block(trans, root, cur, parent, i,</div><div class='del'>-					&amp;cur, search_start,</div><div class='del'>-					min(16 * blocksize,</div><div class='del'>-					    (end_slot - i) * blocksize),</div><div class='del'>-					BTRFS_NESTING_COW);</div><div class='del'>-		if (err) {</div><div class='del'>-			btrfs_tree_unlock(cur);</div><div class='del'>-			free_extent_buffer(cur);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		search_start = cur-&gt;start;</div><div class='del'>-		last_block = cur-&gt;start;</div><div class='del'>-		*last_ret = search_start;</div><div class='del'>-		btrfs_tree_unlock(cur);</div><div class='del'>-		free_extent_buffer(cur);</div><div class='del'>-	}</div><div class='del'>-	return err;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * search for key in the extent_buffer.  The items start at offset p,</div><div class='del'>- * and they are item_size apart.</div><div class='add'>+ * Search for a key in the given extent_buffer.</div><div class='ctx'>  *</div><div class='del'>- * the slot in the array is returned via slot, and it points to</div><div class='del'>- * the place where you would insert key if it is not found in</div><div class='del'>- * the array.</div><div class='add'>+ * The lower boundary for the search is specified by the slot number @first_slot.</div><div class='add'>+ * Use a value of 0 to search over the whole extent buffer. Works for both</div><div class='add'>+ * leaves and nodes.</div><div class='ctx'>  *</div><div class='del'>- * Slot may point to total number of items if the key is bigger than</div><div class='del'>- * all of the keys</div><div class='add'>+ * The slot in the extent buffer is returned via @slot. If the key exists in the</div><div class='add'>+ * extent buffer, then @slot will point to the slot where the key is, otherwise</div><div class='add'>+ * it points to the slot where you would insert the key.</div><div class='add'>+ *</div><div class='add'>+ * Slot may point to the total number of items (i.e. one position beyond the last</div><div class='add'>+ * key) if the key is bigger than the last key in the extent buffer.</div><div class='ctx'>  */</div><div class='del'>-static noinline int generic_bin_search(struct extent_buffer *eb,</div><div class='del'>-				       unsigned long p, int item_size,</div><div class='del'>-				       const struct btrfs_key *key, int *slot)</div><div class='add'>+int btrfs_bin_search(const struct extent_buffer *eb, int first_slot,</div><div class='add'>+		     const struct btrfs_key *key, int *slot)</div><div class='ctx'> {</div><div class='del'>-	int low = 0;</div><div class='del'>-	int high = btrfs_header_nritems(eb);</div><div class='add'>+	unsigned long p;</div><div class='add'>+	int item_size;</div><div class='add'>+	/*</div><div class='add'>+	 * Use unsigned types for the low and high slots, so that we get a more</div><div class='add'>+	 * efficient division in the search loop below.</div><div class='add'>+	 */</div><div class='add'>+	u32 low = first_slot;</div><div class='add'>+	u32 high = btrfs_header_nritems(eb);</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	const int key_size = sizeof(struct btrfs_disk_key);</div><div class='ctx'> </div><div class='del'>-	if (low &gt; high) {</div><div class='add'>+	if (unlikely(low &gt; high)) {</div><div class='ctx'> 		btrfs_err(eb-&gt;fs_info,</div><div class='del'>-		 "%s: low (%d) &gt; high (%d) eb %llu owner %llu level %d",</div><div class='add'>+		 "%s: low (%u) &gt; high (%u) eb %llu owner %llu level %d",</div><div class='ctx'> 			  __func__, low, high, eb-&gt;start,</div><div class='ctx'> 			  btrfs_header_owner(eb), btrfs_header_level(eb));</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (btrfs_header_level(eb) == 0) {</div><div class='add'>+		p = offsetof(struct btrfs_leaf, items);</div><div class='add'>+		item_size = sizeof(struct btrfs_item);</div><div class='add'>+	} else {</div><div class='add'>+		p = offsetof(struct btrfs_node, ptrs);</div><div class='add'>+		item_size = sizeof(struct btrfs_key_ptr);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	while (low &lt; high) {</div><div class='del'>-		unsigned long oip;</div><div class='add'>+		const int unit_size = eb-&gt;folio_size;</div><div class='add'>+		unsigned long oil;</div><div class='ctx'> 		unsigned long offset;</div><div class='ctx'> 		struct btrfs_disk_key *tmp;</div><div class='ctx'> 		struct btrfs_disk_key unaligned;</div><div class='hunk'>@@ -762,20 +784,20 @@ static noinline int generic_bin_search(struct extent_buffer *eb,</div><div class='ctx'> </div><div class='ctx'> 		mid = (low + high) / 2;</div><div class='ctx'> 		offset = p + mid * item_size;</div><div class='del'>-		oip = offset_in_page(offset);</div><div class='add'>+		oil = get_eb_offset_in_folio(eb, offset);</div><div class='ctx'> </div><div class='del'>-		if (oip + key_size &lt;= PAGE_SIZE) {</div><div class='del'>-			const unsigned long idx = get_eb_page_index(offset);</div><div class='del'>-			char *kaddr = page_address(eb-&gt;pages[idx]);</div><div class='add'>+		if (oil + key_size &lt;= unit_size) {</div><div class='add'>+			const unsigned long idx = get_eb_folio_index(eb, offset);</div><div class='add'>+			char *kaddr = folio_address(eb-&gt;folios[idx]);</div><div class='ctx'> </div><div class='del'>-			oip = get_eb_offset_in_page(eb, offset);</div><div class='del'>-			tmp = (struct btrfs_disk_key *)(kaddr + oip);</div><div class='add'>+			oil = get_eb_offset_in_folio(eb, offset);</div><div class='add'>+			tmp = (struct btrfs_disk_key *)(kaddr + oil);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			read_extent_buffer(eb, &amp;unaligned, offset, key_size);</div><div class='ctx'> 			tmp = &amp;unaligned;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		ret = comp_keys(tmp, key);</div><div class='add'>+		ret = btrfs_comp_keys(tmp, key);</div><div class='ctx'> </div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			low = mid + 1;</div><div class='hunk'>@@ -790,36 +812,19 @@ static noinline int generic_bin_search(struct extent_buffer *eb,</div><div class='ctx'> 	return 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * simple bin_search frontend that does the right thing for</div><div class='del'>- * leaves vs nodes</div><div class='del'>- */</div><div class='del'>-int btrfs_bin_search(struct extent_buffer *eb, const struct btrfs_key *key,</div><div class='del'>-		     int *slot)</div><div class='del'>-{</div><div class='del'>-	if (btrfs_header_level(eb) == 0)</div><div class='del'>-		return generic_bin_search(eb,</div><div class='del'>-					  offsetof(struct btrfs_leaf, items),</div><div class='del'>-					  sizeof(struct btrfs_item), key, slot);</div><div class='del'>-	else</div><div class='del'>-		return generic_bin_search(eb,</div><div class='del'>-					  offsetof(struct btrfs_node, ptrs),</div><div class='del'>-					  sizeof(struct btrfs_key_ptr), key, slot);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void root_add_used(struct btrfs_root *root, u32 size)</div><div class='add'>+static void root_add_used_bytes(struct btrfs_root *root)</div><div class='ctx'> {</div><div class='ctx'> 	spin_lock(&amp;root-&gt;accounting_lock);</div><div class='ctx'> 	btrfs_set_root_used(&amp;root-&gt;root_item,</div><div class='del'>-			    btrfs_root_used(&amp;root-&gt;root_item) + size);</div><div class='add'>+		btrfs_root_used(&amp;root-&gt;root_item) + root-&gt;fs_info-&gt;nodesize);</div><div class='ctx'> 	spin_unlock(&amp;root-&gt;accounting_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void root_sub_used(struct btrfs_root *root, u32 size)</div><div class='add'>+static void root_sub_used_bytes(struct btrfs_root *root)</div><div class='ctx'> {</div><div class='ctx'> 	spin_lock(&amp;root-&gt;accounting_lock);</div><div class='ctx'> 	btrfs_set_root_used(&amp;root-&gt;root_item,</div><div class='del'>-			    btrfs_root_used(&amp;root-&gt;root_item) - size);</div><div class='add'>+		btrfs_root_used(&amp;root-&gt;root_item) - root-&gt;fs_info-&gt;nodesize);</div><div class='ctx'> 	spin_unlock(&amp;root-&gt;accounting_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -830,28 +835,102 @@ struct extent_buffer *btrfs_read_node_slot(struct extent_buffer *parent,</div><div class='ctx'> 					   int slot)</div><div class='ctx'> {</div><div class='ctx'> 	int level = btrfs_header_level(parent);</div><div class='add'>+	struct btrfs_tree_parent_check check = { 0 };</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='del'>-	struct btrfs_key first_key;</div><div class='ctx'> </div><div class='ctx'> 	if (slot &lt; 0 || slot &gt;= btrfs_header_nritems(parent))</div><div class='ctx'> 		return ERR_PTR(-ENOENT);</div><div class='ctx'> </div><div class='del'>-	BUG_ON(level == 0);</div><div class='add'>+	ASSERT(level);</div><div class='add'>+</div><div class='add'>+	check.level = level - 1;</div><div class='add'>+	check.transid = btrfs_node_ptr_generation(parent, slot);</div><div class='add'>+	check.owner_root = btrfs_header_owner(parent);</div><div class='add'>+	check.has_first_key = true;</div><div class='add'>+	btrfs_node_key_to_cpu(parent, &amp;check.first_key, slot);</div><div class='ctx'> </div><div class='del'>-	btrfs_node_key_to_cpu(parent, &amp;first_key, slot);</div><div class='ctx'> 	eb = read_tree_block(parent-&gt;fs_info, btrfs_node_blockptr(parent, slot),</div><div class='del'>-			     btrfs_header_owner(parent),</div><div class='del'>-			     btrfs_node_ptr_generation(parent, slot),</div><div class='del'>-			     level - 1, &amp;first_key);</div><div class='del'>-	if (!IS_ERR(eb) &amp;&amp; !extent_buffer_uptodate(eb)) {</div><div class='add'>+			     &amp;check);</div><div class='add'>+	if (IS_ERR(eb))</div><div class='add'>+		return eb;</div><div class='add'>+	if (unlikely(!extent_buffer_uptodate(eb))) {</div><div class='ctx'> 		free_extent_buffer(eb);</div><div class='del'>-		eb = ERR_PTR(-EIO);</div><div class='add'>+		return ERR_PTR(-EIO);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return eb;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * Promote a child node to become the new tree root.</div><div class='add'>+ *</div><div class='add'>+ * @trans:   Transaction handle</div><div class='add'>+ * @root:    Tree root structure to update</div><div class='add'>+ * @path:    Path holding nodes and locks</div><div class='add'>+ * @level:   Level of the parent (old root)</div><div class='add'>+ * @parent:  The parent (old root) with exactly one item</div><div class='add'>+ *</div><div class='add'>+ * This helper is called during rebalancing when the root node contains only</div><div class='add'>+ * a single item (nritems == 1).  We can reduce the tree height by promoting</div><div class='add'>+ * that child to become the new root and freeing the old root node.  The path</div><div class='add'>+ * locks and references are updated accordingly.</div><div class='add'>+ *</div><div class='add'>+ * Return: 0 on success, negative errno on failure.  The transaction is aborted</div><div class='add'>+ * on critical errors.</div><div class='add'>+ */</div><div class='add'>+static int promote_child_to_root(struct btrfs_trans_handle *trans,</div><div class='add'>+				 struct btrfs_root *root, struct btrfs_path *path,</div><div class='add'>+				 int level, struct extent_buffer *parent)</div><div class='add'>+{</div><div class='add'>+	struct extent_buffer *child;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ASSERT(btrfs_header_nritems(parent) == 1);</div><div class='add'>+</div><div class='add'>+	child = btrfs_read_node_slot(parent, 0);</div><div class='add'>+	if (IS_ERR(child))</div><div class='add'>+		return PTR_ERR(child);</div><div class='add'>+</div><div class='add'>+	btrfs_tree_lock(child);</div><div class='add'>+	ret = btrfs_cow_block(trans, root, child, parent, 0, &amp;child, BTRFS_NESTING_COW);</div><div class='add'>+	if (ret) {</div><div class='add'>+		btrfs_tree_unlock(child);</div><div class='add'>+		free_extent_buffer(child);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_tree_mod_log_insert_root(root-&gt;node, child, true);</div><div class='add'>+	if (unlikely(ret &lt; 0)) {</div><div class='add'>+		btrfs_tree_unlock(child);</div><div class='add'>+		free_extent_buffer(child);</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+	rcu_assign_pointer(root-&gt;node, child);</div><div class='add'>+</div><div class='add'>+	add_root_to_dirty_list(root);</div><div class='add'>+	btrfs_tree_unlock(child);</div><div class='add'>+</div><div class='add'>+	path-&gt;locks[level] = 0;</div><div class='add'>+	path-&gt;nodes[level] = NULL;</div><div class='add'>+	btrfs_clear_buffer_dirty(trans, parent);</div><div class='add'>+	btrfs_tree_unlock(parent);</div><div class='add'>+	/* Once for the path. */</div><div class='add'>+	free_extent_buffer(parent);</div><div class='add'>+</div><div class='add'>+	root_sub_used_bytes(root);</div><div class='add'>+	ret = btrfs_free_tree_block(trans, btrfs_root_id(root), parent, 0, 1);</div><div class='add'>+	/* Once for the root ptr. */</div><div class='add'>+	free_extent_buffer_stale(parent);</div><div class='add'>+	if (unlikely(ret &lt; 0)) {</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * node level balancing, used to make sure nodes are in proper order for</div><div class='ctx'>  * item deletion.  We balance from the top down, so we have to make sure</div><div class='ctx'>  * that a deletion won't leave an node completely empty later on.</div><div class='hunk'>@@ -890,79 +969,48 @@ static noinline int balance_level(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * by promoting the node below to a root</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (!parent) {</div><div class='del'>-		struct extent_buffer *child;</div><div class='del'>-</div><div class='ctx'> 		if (btrfs_header_nritems(mid) != 1)</div><div class='ctx'> 			return 0;</div><div class='ctx'> </div><div class='del'>-		/* promote the child to a root */</div><div class='del'>-		child = btrfs_read_node_slot(mid, 0);</div><div class='del'>-		if (IS_ERR(child)) {</div><div class='del'>-			ret = PTR_ERR(child);</div><div class='del'>-			btrfs_handle_fs_error(fs_info, ret, NULL);</div><div class='del'>-			goto enospc;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		btrfs_tree_lock(child);</div><div class='del'>-		ret = btrfs_cow_block(trans, root, child, mid, 0, &amp;child,</div><div class='del'>-				      BTRFS_NESTING_COW);</div><div class='del'>-		if (ret) {</div><div class='del'>-			btrfs_tree_unlock(child);</div><div class='del'>-			free_extent_buffer(child);</div><div class='del'>-			goto enospc;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		ret = btrfs_tree_mod_log_insert_root(root-&gt;node, child, true);</div><div class='del'>-		BUG_ON(ret &lt; 0);</div><div class='del'>-		rcu_assign_pointer(root-&gt;node, child);</div><div class='del'>-</div><div class='del'>-		add_root_to_dirty_list(root);</div><div class='del'>-		btrfs_tree_unlock(child);</div><div class='del'>-</div><div class='del'>-		path-&gt;locks[level] = 0;</div><div class='del'>-		path-&gt;nodes[level] = NULL;</div><div class='del'>-		btrfs_clean_tree_block(mid);</div><div class='del'>-		btrfs_tree_unlock(mid);</div><div class='del'>-		/* once for the path */</div><div class='del'>-		free_extent_buffer(mid);</div><div class='del'>-</div><div class='del'>-		root_sub_used(root, mid-&gt;len);</div><div class='del'>-		btrfs_free_tree_block(trans, root, mid, 0, 1);</div><div class='del'>-		/* once for the root ptr */</div><div class='del'>-		free_extent_buffer_stale(mid);</div><div class='del'>-		return 0;</div><div class='add'>+		return promote_child_to_root(trans, root, path, level, mid);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (btrfs_header_nritems(mid) &gt;</div><div class='ctx'> 	    BTRFS_NODEPTRS_PER_BLOCK(fs_info) / 4)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	left = btrfs_read_node_slot(parent, pslot - 1);</div><div class='del'>-	if (IS_ERR(left))</div><div class='del'>-		left = NULL;</div><div class='add'>+	if (pslot) {</div><div class='add'>+		left = btrfs_read_node_slot(parent, pslot - 1);</div><div class='add'>+		if (IS_ERR(left)) {</div><div class='add'>+			ret = PTR_ERR(left);</div><div class='add'>+			left = NULL;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	if (left) {</div><div class='del'>-		__btrfs_tree_lock(left, BTRFS_NESTING_LEFT);</div><div class='add'>+		btrfs_tree_lock_nested(left, BTRFS_NESTING_LEFT);</div><div class='ctx'> 		wret = btrfs_cow_block(trans, root, left,</div><div class='ctx'> 				       parent, pslot - 1, &amp;left,</div><div class='ctx'> 				       BTRFS_NESTING_LEFT_COW);</div><div class='ctx'> 		if (wret) {</div><div class='ctx'> 			ret = wret;</div><div class='del'>-			goto enospc;</div><div class='add'>+			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	right = btrfs_read_node_slot(parent, pslot + 1);</div><div class='del'>-	if (IS_ERR(right))</div><div class='del'>-		right = NULL;</div><div class='add'>+	if (pslot + 1 &lt; btrfs_header_nritems(parent)) {</div><div class='add'>+		right = btrfs_read_node_slot(parent, pslot + 1);</div><div class='add'>+		if (IS_ERR(right)) {</div><div class='add'>+			ret = PTR_ERR(right);</div><div class='add'>+			right = NULL;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	if (right) {</div><div class='del'>-		__btrfs_tree_lock(right, BTRFS_NESTING_RIGHT);</div><div class='add'>+		btrfs_tree_lock_nested(right, BTRFS_NESTING_RIGHT);</div><div class='ctx'> 		wret = btrfs_cow_block(trans, root, right,</div><div class='ctx'> 				       parent, pslot + 1, &amp;right,</div><div class='ctx'> 				       BTRFS_NESTING_RIGHT_COW);</div><div class='ctx'> 		if (wret) {</div><div class='ctx'> 			ret = wret;</div><div class='del'>-			goto enospc;</div><div class='add'>+			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -982,21 +1030,34 @@ static noinline int balance_level(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		if (wret &lt; 0 &amp;&amp; wret != -ENOSPC)</div><div class='ctx'> 			ret = wret;</div><div class='ctx'> 		if (btrfs_header_nritems(right) == 0) {</div><div class='del'>-			btrfs_clean_tree_block(right);</div><div class='add'>+			btrfs_clear_buffer_dirty(trans, right);</div><div class='ctx'> 			btrfs_tree_unlock(right);</div><div class='del'>-			del_ptr(root, path, level + 1, pslot + 1);</div><div class='del'>-			root_sub_used(root, right-&gt;len);</div><div class='del'>-			btrfs_free_tree_block(trans, root, right, 0, 1);</div><div class='add'>+			ret = btrfs_del_ptr(trans, root, path, level + 1, pslot + 1);</div><div class='add'>+			if (ret &lt; 0) {</div><div class='add'>+				free_extent_buffer_stale(right);</div><div class='add'>+				right = NULL;</div><div class='add'>+				goto out;</div><div class='add'>+			}</div><div class='add'>+			root_sub_used_bytes(root);</div><div class='add'>+			ret = btrfs_free_tree_block(trans, btrfs_root_id(root),</div><div class='add'>+						    right, 0, 1);</div><div class='ctx'> 			free_extent_buffer_stale(right);</div><div class='ctx'> 			right = NULL;</div><div class='add'>+			if (unlikely(ret &lt; 0)) {</div><div class='add'>+				btrfs_abort_transaction(trans, ret);</div><div class='add'>+				goto out;</div><div class='add'>+			}</div><div class='ctx'> 		} else {</div><div class='ctx'> 			struct btrfs_disk_key right_key;</div><div class='ctx'> 			btrfs_node_key(right, &amp;right_key, 0);</div><div class='ctx'> 			ret = btrfs_tree_mod_log_insert_key(parent, pslot + 1,</div><div class='del'>-					BTRFS_MOD_LOG_KEY_REPLACE, GFP_NOFS);</div><div class='del'>-			BUG_ON(ret &lt; 0);</div><div class='add'>+					BTRFS_MOD_LOG_KEY_REPLACE);</div><div class='add'>+			if (unlikely(ret &lt; 0)) {</div><div class='add'>+				btrfs_abort_transaction(trans, ret);</div><div class='add'>+				goto out;</div><div class='add'>+			}</div><div class='ctx'> 			btrfs_set_node_key(parent, &amp;right_key, pslot + 1);</div><div class='del'>-			btrfs_mark_buffer_dirty(parent);</div><div class='add'>+			btrfs_mark_buffer_dirty(trans, parent);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	if (btrfs_header_nritems(mid) == 1) {</div><div class='hunk'>@@ -1009,15 +1070,19 @@ static noinline int balance_level(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		 * otherwise we would have pulled some pointers from the</div><div class='ctx'> 		 * right</div><div class='ctx'> 		 */</div><div class='del'>-		if (!left) {</div><div class='del'>-			ret = -EROFS;</div><div class='del'>-			btrfs_handle_fs_error(fs_info, ret, NULL);</div><div class='del'>-			goto enospc;</div><div class='add'>+		if (unlikely(!left)) {</div><div class='add'>+			btrfs_crit(fs_info,</div><div class='add'>+"missing left child when middle child only has 1 item, parent bytenr %llu level %d mid bytenr %llu root %llu",</div><div class='add'>+				   parent-&gt;start, btrfs_header_level(parent),</div><div class='add'>+				   mid-&gt;start, btrfs_root_id(root));</div><div class='add'>+			ret = -EUCLEAN;</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 		wret = balance_node_right(trans, mid, left);</div><div class='ctx'> 		if (wret &lt; 0) {</div><div class='ctx'> 			ret = wret;</div><div class='del'>-			goto enospc;</div><div class='add'>+			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (wret == 1) {</div><div class='ctx'> 			wret = push_node_left(trans, left, mid, 1);</div><div class='hunk'>@@ -1027,32 +1092,45 @@ static noinline int balance_level(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		BUG_ON(wret == 1);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (btrfs_header_nritems(mid) == 0) {</div><div class='del'>-		btrfs_clean_tree_block(mid);</div><div class='add'>+		btrfs_clear_buffer_dirty(trans, mid);</div><div class='ctx'> 		btrfs_tree_unlock(mid);</div><div class='del'>-		del_ptr(root, path, level + 1, pslot);</div><div class='del'>-		root_sub_used(root, mid-&gt;len);</div><div class='del'>-		btrfs_free_tree_block(trans, root, mid, 0, 1);</div><div class='add'>+		ret = btrfs_del_ptr(trans, root, path, level + 1, pslot);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			free_extent_buffer_stale(mid);</div><div class='add'>+			mid = NULL;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		root_sub_used_bytes(root);</div><div class='add'>+		ret = btrfs_free_tree_block(trans, btrfs_root_id(root), mid, 0, 1);</div><div class='ctx'> 		free_extent_buffer_stale(mid);</div><div class='ctx'> 		mid = NULL;</div><div class='add'>+		if (unlikely(ret &lt; 0)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> 	} else {</div><div class='ctx'> 		/* update the parent key to reflect our changes */</div><div class='ctx'> 		struct btrfs_disk_key mid_key;</div><div class='ctx'> 		btrfs_node_key(mid, &amp;mid_key, 0);</div><div class='ctx'> 		ret = btrfs_tree_mod_log_insert_key(parent, pslot,</div><div class='del'>-				BTRFS_MOD_LOG_KEY_REPLACE, GFP_NOFS);</div><div class='del'>-		BUG_ON(ret &lt; 0);</div><div class='add'>+						    BTRFS_MOD_LOG_KEY_REPLACE);</div><div class='add'>+		if (unlikely(ret &lt; 0)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> 		btrfs_set_node_key(parent, &amp;mid_key, pslot);</div><div class='del'>-		btrfs_mark_buffer_dirty(parent);</div><div class='add'>+		btrfs_mark_buffer_dirty(trans, parent);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* update the path */</div><div class='ctx'> 	if (left) {</div><div class='ctx'> 		if (btrfs_header_nritems(left) &gt; orig_slot) {</div><div class='del'>-			atomic_inc(&amp;left-&gt;refs);</div><div class='ctx'> 			/* left was locked after cow */</div><div class='ctx'> 			path-&gt;nodes[level] = left;</div><div class='ctx'> 			path-&gt;slots[level + 1] -= 1;</div><div class='ctx'> 			path-&gt;slots[level] = orig_slot;</div><div class='add'>+			/* Left is now owned by path. */</div><div class='add'>+			left = NULL;</div><div class='ctx'> 			if (mid) {</div><div class='ctx'> 				btrfs_tree_unlock(mid);</div><div class='ctx'> 				free_extent_buffer(mid);</div><div class='hunk'>@@ -1066,14 +1144,13 @@ static noinline int balance_level(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	if (orig_ptr !=</div><div class='ctx'> 	    btrfs_node_blockptr(path-&gt;nodes[level], path-&gt;slots[level]))</div><div class='ctx'> 		BUG();</div><div class='del'>-enospc:</div><div class='add'>+out:</div><div class='ctx'> 	if (right) {</div><div class='ctx'> 		btrfs_tree_unlock(right);</div><div class='ctx'> 		free_extent_buffer(right);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (left) {</div><div class='del'>-		if (path-&gt;nodes[level] != left)</div><div class='del'>-			btrfs_tree_unlock(left);</div><div class='add'>+		btrfs_tree_unlock(left);</div><div class='ctx'> 		free_extent_buffer(left);</div><div class='ctx'> 	}</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -1111,15 +1188,15 @@ static noinline int push_nodes_for_insert(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	if (!parent)</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='del'>-	left = btrfs_read_node_slot(parent, pslot - 1);</div><div class='del'>-	if (IS_ERR(left))</div><div class='del'>-		left = NULL;</div><div class='del'>-</div><div class='ctx'> 	/* first, try to make some room in the middle buffer */</div><div class='del'>-	if (left) {</div><div class='add'>+	if (pslot) {</div><div class='ctx'> 		u32 left_nr;</div><div class='ctx'> </div><div class='del'>-		__btrfs_tree_lock(left, BTRFS_NESTING_LEFT);</div><div class='add'>+		left = btrfs_read_node_slot(parent, pslot - 1);</div><div class='add'>+		if (IS_ERR(left))</div><div class='add'>+			return PTR_ERR(left);</div><div class='add'>+</div><div class='add'>+		btrfs_tree_lock_nested(left, BTRFS_NESTING_LEFT);</div><div class='ctx'> </div><div class='ctx'> 		left_nr = btrfs_header_nritems(left);</div><div class='ctx'> 		if (left_nr &gt;= BTRFS_NODEPTRS_PER_BLOCK(fs_info) - 1) {</div><div class='hunk'>@@ -1141,10 +1218,15 @@ static noinline int push_nodes_for_insert(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			orig_slot += left_nr;</div><div class='ctx'> 			btrfs_node_key(mid, &amp;disk_key, 0);</div><div class='ctx'> 			ret = btrfs_tree_mod_log_insert_key(parent, pslot,</div><div class='del'>-					BTRFS_MOD_LOG_KEY_REPLACE, GFP_NOFS);</div><div class='del'>-			BUG_ON(ret &lt; 0);</div><div class='add'>+					BTRFS_MOD_LOG_KEY_REPLACE);</div><div class='add'>+			if (unlikely(ret &lt; 0)) {</div><div class='add'>+				btrfs_tree_unlock(left);</div><div class='add'>+				free_extent_buffer(left);</div><div class='add'>+				btrfs_abort_transaction(trans, ret);</div><div class='add'>+				return ret;</div><div class='add'>+			}</div><div class='ctx'> 			btrfs_set_node_key(parent, &amp;disk_key, pslot);</div><div class='del'>-			btrfs_mark_buffer_dirty(parent);</div><div class='add'>+			btrfs_mark_buffer_dirty(trans, parent);</div><div class='ctx'> 			if (btrfs_header_nritems(left) &gt; orig_slot) {</div><div class='ctx'> 				path-&gt;nodes[level] = left;</div><div class='ctx'> 				path-&gt;slots[level + 1] -= 1;</div><div class='hunk'>@@ -1163,17 +1245,18 @@ static noinline int push_nodes_for_insert(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		btrfs_tree_unlock(left);</div><div class='ctx'> 		free_extent_buffer(left);</div><div class='ctx'> 	}</div><div class='del'>-	right = btrfs_read_node_slot(parent, pslot + 1);</div><div class='del'>-	if (IS_ERR(right))</div><div class='del'>-		right = NULL;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * then try to empty the right most buffer into the middle</div><div class='ctx'> 	 */</div><div class='del'>-	if (right) {</div><div class='add'>+	if (pslot + 1 &lt; btrfs_header_nritems(parent)) {</div><div class='ctx'> 		u32 right_nr;</div><div class='ctx'> </div><div class='del'>-		__btrfs_tree_lock(right, BTRFS_NESTING_RIGHT);</div><div class='add'>+		right = btrfs_read_node_slot(parent, pslot + 1);</div><div class='add'>+		if (IS_ERR(right))</div><div class='add'>+			return PTR_ERR(right);</div><div class='add'>+</div><div class='add'>+		btrfs_tree_lock_nested(right, BTRFS_NESTING_RIGHT);</div><div class='ctx'> </div><div class='ctx'> 		right_nr = btrfs_header_nritems(right);</div><div class='ctx'> 		if (right_nr &gt;= BTRFS_NODEPTRS_PER_BLOCK(fs_info) - 1) {</div><div class='hunk'>@@ -1195,10 +1278,15 @@ static noinline int push_nodes_for_insert(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 			btrfs_node_key(right, &amp;disk_key, 0);</div><div class='ctx'> 			ret = btrfs_tree_mod_log_insert_key(parent, pslot + 1,</div><div class='del'>-					BTRFS_MOD_LOG_KEY_REPLACE, GFP_NOFS);</div><div class='del'>-			BUG_ON(ret &lt; 0);</div><div class='add'>+					BTRFS_MOD_LOG_KEY_REPLACE);</div><div class='add'>+			if (unlikely(ret &lt; 0)) {</div><div class='add'>+				btrfs_tree_unlock(right);</div><div class='add'>+				free_extent_buffer(right);</div><div class='add'>+				btrfs_abort_transaction(trans, ret);</div><div class='add'>+				return ret;</div><div class='add'>+			}</div><div class='ctx'> 			btrfs_set_node_key(parent, &amp;disk_key, pslot + 1);</div><div class='del'>-			btrfs_mark_buffer_dirty(parent);</div><div class='add'>+			btrfs_mark_buffer_dirty(trans, parent);</div><div class='ctx'> </div><div class='ctx'> 			if (btrfs_header_nritems(mid) &lt;= orig_slot) {</div><div class='ctx'> 				path-&gt;nodes[level] = right;</div><div class='hunk'>@@ -1224,7 +1312,7 @@ static noinline int push_nodes_for_insert(struct btrfs_trans_handle *trans,</div><div class='ctx'>  * to the block in 'slot', and triggering ra on them.</div><div class='ctx'>  */</div><div class='ctx'> static void reada_for_search(struct btrfs_fs_info *fs_info,</div><div class='del'>-			     struct btrfs_path *path,</div><div class='add'>+			     const struct btrfs_path *path,</div><div class='ctx'> 			     int level, int slot, u64 objectid)</div><div class='ctx'> {</div><div class='ctx'> 	struct extent_buffer *node;</div><div class='hunk'>@@ -1306,7 +1394,7 @@ static void reada_for_search(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline void reada_for_balance(struct btrfs_path *path, int level)</div><div class='add'>+static noinline void reada_for_balance(const struct btrfs_path *path, int level)</div><div class='ctx'> {</div><div class='ctx'> 	struct extent_buffer *parent;</div><div class='ctx'> 	int slot;</div><div class='hunk'>@@ -1345,33 +1433,34 @@ static noinline void unlock_up(struct btrfs_path *path, int level,</div><div class='ctx'> {</div><div class='ctx'> 	int i;</div><div class='ctx'> 	int skip_level = level;</div><div class='del'>-	int no_skips = 0;</div><div class='del'>-	struct extent_buffer *t;</div><div class='add'>+	bool check_skip = true;</div><div class='ctx'> </div><div class='ctx'> 	for (i = level; i &lt; BTRFS_MAX_LEVEL; i++) {</div><div class='ctx'> 		if (!path-&gt;nodes[i])</div><div class='ctx'> 			break;</div><div class='ctx'> 		if (!path-&gt;locks[i])</div><div class='ctx'> 			break;</div><div class='del'>-		if (!no_skips &amp;&amp; path-&gt;slots[i] == 0) {</div><div class='del'>-			skip_level = i + 1;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-		if (!no_skips &amp;&amp; path-&gt;keep_locks) {</div><div class='del'>-			u32 nritems;</div><div class='del'>-			t = path-&gt;nodes[i];</div><div class='del'>-			nritems = btrfs_header_nritems(t);</div><div class='del'>-			if (nritems &lt; 1 || path-&gt;slots[i] &gt;= nritems - 1) {</div><div class='add'>+</div><div class='add'>+		if (check_skip) {</div><div class='add'>+			if (path-&gt;slots[i] == 0) {</div><div class='ctx'> 				skip_level = i + 1;</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='add'>+</div><div class='add'>+			if (path-&gt;keep_locks) {</div><div class='add'>+				u32 nritems;</div><div class='add'>+</div><div class='add'>+				nritems = btrfs_header_nritems(path-&gt;nodes[i]);</div><div class='add'>+				if (nritems &lt; 1 || path-&gt;slots[i] &gt;= nritems - 1) {</div><div class='add'>+					skip_level = i + 1;</div><div class='add'>+					continue;</div><div class='add'>+				}</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='del'>-		if (skip_level &lt; i &amp;&amp; i &gt;= lowest_unlock)</div><div class='del'>-			no_skips = 1;</div><div class='ctx'> </div><div class='del'>-		t = path-&gt;nodes[i];</div><div class='ctx'> 		if (i &gt;= lowest_unlock &amp;&amp; i &gt; skip_level) {</div><div class='del'>-			btrfs_tree_unlock_rw(t, path-&gt;locks[i]);</div><div class='add'>+			btrfs_tree_unlock_rw(path-&gt;nodes[i], path-&gt;locks[i]);</div><div class='add'>+			check_skip = false;</div><div class='ctx'> 			path-&gt;locks[i] = 0;</div><div class='ctx'> 			if (write_lock_level &amp;&amp;</div><div class='ctx'> 			    i &gt; min_write_lock_level &amp;&amp;</div><div class='hunk'>@@ -1383,93 +1472,160 @@ static noinline void unlock_up(struct btrfs_path *path, int level,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * helper function for btrfs_search_slot.  The goal is to find a block</div><div class='del'>- * in cache without setting the path to blocking.  If we find the block</div><div class='del'>- * we return zero and the path is unchanged.</div><div class='add'>+ * Helper function for btrfs_search_slot() and other functions that do a search</div><div class='add'>+ * on a btree. The goal is to find a tree block in the cache (the radix tree at</div><div class='add'>+ * fs_info-&gt;buffer_radix), but if we can't find it, or it's not up to date, read</div><div class='add'>+ * its pages from disk.</div><div class='ctx'>  *</div><div class='del'>- * If we can't find the block, we set the path blocking and do some</div><div class='del'>- * reada.  -EAGAIN is returned and the search must be repeated.</div><div class='add'>+ * Returns -EAGAIN, with the path unlocked, if the caller needs to repeat the</div><div class='add'>+ * whole btree search, starting again from the current root node.</div><div class='ctx'>  */</div><div class='ctx'> static int</div><div class='ctx'> read_block_for_search(struct btrfs_root *root, struct btrfs_path *p,</div><div class='del'>-		      struct extent_buffer **eb_ret, int level, int slot,</div><div class='add'>+		      struct extent_buffer **eb_ret, int slot,</div><div class='ctx'> 		      const struct btrfs_key *key)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+	struct btrfs_tree_parent_check check = { 0 };</div><div class='ctx'> 	u64 blocknr;</div><div class='del'>-	u64 gen;</div><div class='del'>-	struct extent_buffer *tmp;</div><div class='del'>-	struct btrfs_key first_key;</div><div class='del'>-	int ret;</div><div class='add'>+	struct extent_buffer *tmp = NULL;</div><div class='add'>+	int ret = 0;</div><div class='add'>+	int ret2;</div><div class='ctx'> 	int parent_level;</div><div class='add'>+	bool read_tmp = false;</div><div class='add'>+	bool tmp_locked = false;</div><div class='add'>+	bool path_released = false;</div><div class='ctx'> </div><div class='ctx'> 	blocknr = btrfs_node_blockptr(*eb_ret, slot);</div><div class='del'>-	gen = btrfs_node_ptr_generation(*eb_ret, slot);</div><div class='ctx'> 	parent_level = btrfs_header_level(*eb_ret);</div><div class='del'>-	btrfs_node_key_to_cpu(*eb_ret, &amp;first_key, slot);</div><div class='add'>+	btrfs_node_key_to_cpu(*eb_ret, &amp;check.first_key, slot);</div><div class='add'>+	check.has_first_key = true;</div><div class='add'>+	check.level = parent_level - 1;</div><div class='add'>+	check.transid = btrfs_node_ptr_generation(*eb_ret, slot);</div><div class='add'>+	check.owner_root = btrfs_root_id(root);</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * If we need to read an extent buffer from disk and we are holding locks</div><div class='add'>+	 * on upper level nodes, we unlock all the upper nodes before reading the</div><div class='add'>+	 * extent buffer, and then return -EAGAIN to the caller as it needs to</div><div class='add'>+	 * restart the search. We don't release the lock on the current level</div><div class='add'>+	 * because we need to walk this node to figure out which blocks to read.</div><div class='add'>+	 */</div><div class='ctx'> 	tmp = find_extent_buffer(fs_info, blocknr);</div><div class='ctx'> 	if (tmp) {</div><div class='ctx'> 		if (p-&gt;reada == READA_FORWARD_ALWAYS)</div><div class='del'>-			reada_for_search(fs_info, p, level, slot, key-&gt;objectid);</div><div class='add'>+			reada_for_search(fs_info, p, parent_level, slot, key-&gt;objectid);</div><div class='ctx'> </div><div class='ctx'> 		/* first we do an atomic uptodate check */</div><div class='del'>-		if (btrfs_buffer_uptodate(tmp, gen, 1) &gt; 0) {</div><div class='add'>+		if (btrfs_buffer_uptodate(tmp, check.transid, true) &gt; 0) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Do extra check for first_key, eb can be stale due to</div><div class='ctx'> 			 * being cached, read from scrub, or have multiple</div><div class='ctx'> 			 * parents (shared tree blocks).</div><div class='ctx'> 			 */</div><div class='del'>-			if (btrfs_verify_level_key(tmp,</div><div class='del'>-					parent_level - 1, &amp;first_key, gen)) {</div><div class='del'>-				free_extent_buffer(tmp);</div><div class='del'>-				return -EUCLEAN;</div><div class='add'>+			if (unlikely(btrfs_verify_level_key(tmp, &amp;check))) {</div><div class='add'>+				ret = -EUCLEAN;</div><div class='add'>+				goto out;</div><div class='ctx'> 			}</div><div class='ctx'> 			*eb_ret = tmp;</div><div class='del'>-			return 0;</div><div class='add'>+			tmp = NULL;</div><div class='add'>+			ret = 0;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (p-&gt;nowait) {</div><div class='add'>+			ret = -EAGAIN;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (!p-&gt;skip_locking) {</div><div class='add'>+			btrfs_unlock_up_safe(p, parent_level + 1);</div><div class='add'>+			btrfs_maybe_reset_lockdep_class(root, tmp);</div><div class='add'>+			tmp_locked = true;</div><div class='add'>+			btrfs_tree_read_lock(tmp);</div><div class='add'>+			btrfs_release_path(p);</div><div class='add'>+			ret = -EAGAIN;</div><div class='add'>+			path_released = true;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		/* now we're allowed to do a blocking uptodate check */</div><div class='del'>-		ret = btrfs_read_buffer(tmp, gen, parent_level - 1, &amp;first_key);</div><div class='del'>-		if (!ret) {</div><div class='add'>+		/* Now we're allowed to do a blocking uptodate check. */</div><div class='add'>+		ret2 = btrfs_read_extent_buffer(tmp, &amp;check);</div><div class='add'>+		if (ret2) {</div><div class='add'>+			ret = ret2;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (ret == 0) {</div><div class='add'>+			ASSERT(!tmp_locked);</div><div class='ctx'> 			*eb_ret = tmp;</div><div class='del'>-			return 0;</div><div class='add'>+			tmp = NULL;</div><div class='ctx'> 		}</div><div class='del'>-		free_extent_buffer(tmp);</div><div class='del'>-		btrfs_release_path(p);</div><div class='del'>-		return -EIO;</div><div class='add'>+		goto out;</div><div class='add'>+	} else if (p-&gt;nowait) {</div><div class='add'>+		ret = -EAGAIN;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * reduce lock contention at high levels</div><div class='del'>-	 * of the btree by dropping locks before</div><div class='del'>-	 * we read.  Don't release the lock on the current</div><div class='del'>-	 * level because we need to walk this node to figure</div><div class='del'>-	 * out which blocks to read.</div><div class='del'>-	 */</div><div class='del'>-	btrfs_unlock_up_safe(p, level + 1);</div><div class='add'>+	if (!p-&gt;skip_locking) {</div><div class='add'>+		btrfs_unlock_up_safe(p, parent_level + 1);</div><div class='add'>+		ret = -EAGAIN;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (p-&gt;reada != READA_NONE)</div><div class='del'>-		reada_for_search(fs_info, p, level, slot, key-&gt;objectid);</div><div class='add'>+		reada_for_search(fs_info, p, parent_level, slot, key-&gt;objectid);</div><div class='ctx'> </div><div class='del'>-	ret = -EAGAIN;</div><div class='del'>-	tmp = read_tree_block(fs_info, blocknr, root-&gt;root_key.objectid,</div><div class='del'>-			      gen, parent_level - 1, &amp;first_key);</div><div class='del'>-	if (!IS_ERR(tmp)) {</div><div class='del'>-		/*</div><div class='del'>-		 * If the read above didn't mark this buffer up to date,</div><div class='del'>-		 * it will never end up being up to date.  Set ret to EIO now</div><div class='del'>-		 * and give up so that our caller doesn't loop forever</div><div class='del'>-		 * on our EAGAINs.</div><div class='del'>-		 */</div><div class='del'>-		if (!extent_buffer_uptodate(tmp))</div><div class='del'>-			ret = -EIO;</div><div class='del'>-		free_extent_buffer(tmp);</div><div class='del'>-	} else {</div><div class='add'>+	tmp = btrfs_find_create_tree_block(fs_info, blocknr, check.owner_root, check.level);</div><div class='add'>+	if (IS_ERR(tmp)) {</div><div class='ctx'> 		ret = PTR_ERR(tmp);</div><div class='add'>+		tmp = NULL;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='add'>+	read_tmp = true;</div><div class='add'>+</div><div class='add'>+	if (!p-&gt;skip_locking) {</div><div class='add'>+		ASSERT(ret == -EAGAIN);</div><div class='add'>+		btrfs_maybe_reset_lockdep_class(root, tmp);</div><div class='add'>+		tmp_locked = true;</div><div class='add'>+		btrfs_tree_read_lock(tmp);</div><div class='add'>+		btrfs_release_path(p);</div><div class='add'>+		path_released = true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Now we're allowed to do a blocking uptodate check. */</div><div class='add'>+	ret2 = btrfs_read_extent_buffer(tmp, &amp;check);</div><div class='add'>+	if (ret2) {</div><div class='add'>+		ret = ret2;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If the read above didn't mark this buffer up to date,</div><div class='add'>+	 * it will never end up being up to date.  Set ret to EIO now</div><div class='add'>+	 * and give up so that our caller doesn't loop forever</div><div class='add'>+	 * on our EAGAINs.</div><div class='add'>+	 */</div><div class='add'>+	if (unlikely(!extent_buffer_uptodate(tmp))) {</div><div class='add'>+		ret = -EIO;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (ret == 0) {</div><div class='add'>+		ASSERT(!tmp_locked);</div><div class='add'>+		*eb_ret = tmp;</div><div class='add'>+		tmp = NULL;</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='add'>+	if (tmp) {</div><div class='add'>+		if (tmp_locked)</div><div class='add'>+			btrfs_tree_read_unlock(tmp);</div><div class='add'>+		if (read_tmp &amp;&amp; ret &amp;&amp; ret != -EAGAIN)</div><div class='add'>+			free_extent_buffer_stale(tmp);</div><div class='add'>+		else</div><div class='add'>+			free_extent_buffer(tmp);</div><div class='add'>+	}</div><div class='add'>+	if (ret &amp;&amp; !path_released)</div><div class='add'>+		btrfs_release_path(p);</div><div class='ctx'> </div><div class='del'>-	btrfs_release_path(p);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1567,41 +1723,19 @@ static struct extent_buffer *btrfs_search_slot_get_root(struct btrfs_root *root,</div><div class='ctx'> 							struct btrfs_path *p,</div><div class='ctx'> 							int write_lock_level)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct extent_buffer *b;</div><div class='del'>-	int root_lock;</div><div class='add'>+	int root_lock = 0;</div><div class='ctx'> 	int level = 0;</div><div class='ctx'> </div><div class='del'>-	/* We try very hard to do read locks on the root */</div><div class='del'>-	root_lock = BTRFS_READ_LOCK;</div><div class='del'>-</div><div class='ctx'> 	if (p-&gt;search_commit_root) {</div><div class='del'>-		/*</div><div class='del'>-		 * The commit roots are read only so we always do read locks,</div><div class='del'>-		 * and we always must hold the commit_root_sem when doing</div><div class='del'>-		 * searches on them, the only exception is send where we don't</div><div class='del'>-		 * want to block transaction commits for a long time, so</div><div class='del'>-		 * we need to clone the commit root in order to avoid races</div><div class='del'>-		 * with transaction commits that create a snapshot of one of</div><div class='del'>-		 * the roots used by a send operation.</div><div class='del'>-		 */</div><div class='del'>-		if (p-&gt;need_commit_sem) {</div><div class='del'>-			down_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='del'>-			b = btrfs_clone_extent_buffer(root-&gt;commit_root);</div><div class='del'>-			up_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='del'>-			if (!b)</div><div class='del'>-				return ERR_PTR(-ENOMEM);</div><div class='del'>-</div><div class='del'>-		} else {</div><div class='del'>-			b = root-&gt;commit_root;</div><div class='del'>-			atomic_inc(&amp;b-&gt;refs);</div><div class='del'>-		}</div><div class='add'>+		b = root-&gt;commit_root;</div><div class='add'>+		refcount_inc(&amp;b-&gt;refs);</div><div class='ctx'> 		level = btrfs_header_level(b);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Ensure that all callers have set skip_locking when</div><div class='del'>-		 * p-&gt;search_commit_root = 1.</div><div class='add'>+		 * p-&gt;search_commit_root is true.</div><div class='ctx'> 		 */</div><div class='del'>-		ASSERT(p-&gt;skip_locking == 1);</div><div class='add'>+		ASSERT(p-&gt;skip_locking);</div><div class='ctx'> </div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1612,6 +1746,9 @@ static struct extent_buffer *btrfs_search_slot_get_root(struct btrfs_root *root,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/* We try very hard to do read locks on the root */</div><div class='add'>+	root_lock = BTRFS_READ_LOCK;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If the level is set to maximum, we can skip trying to get the read</div><div class='ctx'> 	 * lock.</div><div class='hunk'>@@ -1621,7 +1758,13 @@ static struct extent_buffer *btrfs_search_slot_get_root(struct btrfs_root *root,</div><div class='ctx'> 		 * We don't know the level of the root node until we actually</div><div class='ctx'> 		 * have it read locked</div><div class='ctx'> 		 */</div><div class='del'>-		b = btrfs_read_lock_root_node(root);</div><div class='add'>+		if (p-&gt;nowait) {</div><div class='add'>+			b = btrfs_try_read_lock_root_node(root);</div><div class='add'>+			if (IS_ERR(b))</div><div class='add'>+				return b;</div><div class='add'>+		} else {</div><div class='add'>+			b = btrfs_read_lock_root_node(root);</div><div class='add'>+		}</div><div class='ctx'> 		level = btrfs_header_level(b);</div><div class='ctx'> 		if (level &gt; write_lock_level)</div><div class='ctx'> 			goto out;</div><div class='hunk'>@@ -1638,6 +1781,17 @@ static struct extent_buffer *btrfs_search_slot_get_root(struct btrfs_root *root,</div><div class='ctx'> 	level = btrfs_header_level(b);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='add'>+	/*</div><div class='add'>+	 * The root may have failed to write out at some point, and thus is no</div><div class='add'>+	 * longer valid, return an error in this case.</div><div class='add'>+	 */</div><div class='add'>+	if (unlikely(!extent_buffer_uptodate(b))) {</div><div class='add'>+		if (root_lock)</div><div class='add'>+			btrfs_tree_unlock_rw(b, root_lock);</div><div class='add'>+		free_extent_buffer(b);</div><div class='add'>+		return ERR_PTR(-EIO);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	p-&gt;nodes[level] = b;</div><div class='ctx'> 	if (!p-&gt;skip_locking)</div><div class='ctx'> 		p-&gt;locks[level] = root_lock;</div><div class='hunk'>@@ -1647,10 +1801,194 @@ out:</div><div class='ctx'> 	return b;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Replace the extent buffer at the lowest level of the path with a cloned</div><div class='add'>+ * version. The purpose is to be able to use it safely, after releasing the</div><div class='add'>+ * commit root semaphore, even if relocation is happening in parallel, the</div><div class='add'>+ * transaction used for relocation is committed and the extent buffer is</div><div class='add'>+ * reallocated in the next transaction.</div><div class='add'>+ *</div><div class='add'>+ * This is used in a context where the caller does not prevent transaction</div><div class='add'>+ * commits from happening, either by holding a transaction handle or holding</div><div class='add'>+ * some lock, while it's doing searches through a commit root.</div><div class='add'>+ * At the moment it's only used for send operations.</div><div class='add'>+ */</div><div class='add'>+static int finish_need_commit_sem_search(struct btrfs_path *path)</div><div class='add'>+{</div><div class='add'>+	const int i = path-&gt;lowest_level;</div><div class='add'>+	const int slot = path-&gt;slots[i];</div><div class='add'>+	struct extent_buffer *lowest = path-&gt;nodes[i];</div><div class='add'>+	struct extent_buffer *clone;</div><div class='add'>+</div><div class='add'>+	ASSERT(path-&gt;need_commit_sem);</div><div class='add'>+</div><div class='add'>+	if (!lowest)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held_read(&amp;lowest-&gt;fs_info-&gt;commit_root_sem);</div><div class='add'>+</div><div class='add'>+	clone = btrfs_clone_extent_buffer(lowest);</div><div class='add'>+	if (!clone)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	btrfs_release_path(path);</div><div class='add'>+	path-&gt;nodes[i] = clone;</div><div class='add'>+	path-&gt;slots[i] = slot;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int search_for_key_slot(const struct extent_buffer *eb,</div><div class='add'>+				      int search_low_slot,</div><div class='add'>+				      const struct btrfs_key *key,</div><div class='add'>+				      int prev_cmp,</div><div class='add'>+				      int *slot)</div><div class='add'>+{</div><div class='add'>+	/*</div><div class='add'>+	 * If a previous call to btrfs_bin_search() on a parent node returned an</div><div class='add'>+	 * exact match (prev_cmp == 0), we can safely assume the target key will</div><div class='add'>+	 * always be at slot 0 on lower levels, since each key pointer</div><div class='add'>+	 * (struct btrfs_key_ptr) refers to the lowest key accessible from the</div><div class='add'>+	 * subtree it points to. Thus we can skip searching lower levels.</div><div class='add'>+	 */</div><div class='add'>+	if (prev_cmp == 0) {</div><div class='add'>+		*slot = 0;</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return btrfs_bin_search(eb, search_low_slot, key, slot);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int search_leaf(struct btrfs_trans_handle *trans,</div><div class='add'>+		       struct btrfs_root *root,</div><div class='add'>+		       const struct btrfs_key *key,</div><div class='add'>+		       struct btrfs_path *path,</div><div class='add'>+		       int ins_len,</div><div class='add'>+		       int prev_cmp)</div><div class='add'>+{</div><div class='add'>+	struct extent_buffer *leaf = path-&gt;nodes[0];</div><div class='add'>+	int leaf_free_space = -1;</div><div class='add'>+	int search_low_slot = 0;</div><div class='add'>+	int ret;</div><div class='add'>+	bool do_bin_search = true;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If we are doing an insertion, the leaf has enough free space and the</div><div class='add'>+	 * destination slot for the key is not slot 0, then we can unlock our</div><div class='add'>+	 * write lock on the parent, and any other upper nodes, before doing the</div><div class='add'>+	 * binary search on the leaf (with search_for_key_slot()), allowing other</div><div class='add'>+	 * tasks to lock the parent and any other upper nodes.</div><div class='add'>+	 */</div><div class='add'>+	if (ins_len &gt; 0) {</div><div class='add'>+		/*</div><div class='add'>+		 * Cache the leaf free space, since we will need it later and it</div><div class='add'>+		 * will not change until then.</div><div class='add'>+		 */</div><div class='add'>+		leaf_free_space = btrfs_leaf_free_space(leaf);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * !path-&gt;locks[1] means we have a single node tree, the leaf is</div><div class='add'>+		 * the root of the tree.</div><div class='add'>+		 */</div><div class='add'>+		if (path-&gt;locks[1] &amp;&amp; leaf_free_space &gt;= ins_len) {</div><div class='add'>+			struct btrfs_disk_key first_key;</div><div class='add'>+</div><div class='add'>+			ASSERT(btrfs_header_nritems(leaf) &gt; 0);</div><div class='add'>+			btrfs_item_key(leaf, &amp;first_key, 0);</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * Doing the extra comparison with the first key is cheap,</div><div class='add'>+			 * taking into account that the first key is very likely</div><div class='add'>+			 * already in a cache line because it immediately follows</div><div class='add'>+			 * the extent buffer's header and we have recently accessed</div><div class='add'>+			 * the header's level field.</div><div class='add'>+			 */</div><div class='add'>+			ret = btrfs_comp_keys(&amp;first_key, key);</div><div class='add'>+			if (ret &lt; 0) {</div><div class='add'>+				/*</div><div class='add'>+				 * The first key is smaller than the key we want</div><div class='add'>+				 * to insert, so we are safe to unlock all upper</div><div class='add'>+				 * nodes and we have to do the binary search.</div><div class='add'>+				 *</div><div class='add'>+				 * We do use btrfs_unlock_up_safe() and not</div><div class='add'>+				 * unlock_up() because the later does not unlock</div><div class='add'>+				 * nodes with a slot of 0 - we can safely unlock</div><div class='add'>+				 * any node even if its slot is 0 since in this</div><div class='add'>+				 * case the key does not end up at slot 0 of the</div><div class='add'>+				 * leaf and there's no need to split the leaf.</div><div class='add'>+				 */</div><div class='add'>+				btrfs_unlock_up_safe(path, 1);</div><div class='add'>+				search_low_slot = 1;</div><div class='add'>+			} else {</div><div class='add'>+				/*</div><div class='add'>+				 * The first key is &gt;= then the key we want to</div><div class='add'>+				 * insert, so we can skip the binary search as</div><div class='add'>+				 * the target key will be at slot 0.</div><div class='add'>+				 *</div><div class='add'>+				 * We can not unlock upper nodes when the key is</div><div class='add'>+				 * less than the first key, because we will need</div><div class='add'>+				 * to update the key at slot 0 of the parent node</div><div class='add'>+				 * and possibly of other upper nodes too.</div><div class='add'>+				 * If the key matches the first key, then we can</div><div class='add'>+				 * unlock all the upper nodes, using</div><div class='add'>+				 * btrfs_unlock_up_safe() instead of unlock_up()</div><div class='add'>+				 * as stated above.</div><div class='add'>+				 */</div><div class='add'>+				if (ret == 0)</div><div class='add'>+					btrfs_unlock_up_safe(path, 1);</div><div class='add'>+				/*</div><div class='add'>+				 * ret is already 0 or 1, matching the result of</div><div class='add'>+				 * a btrfs_bin_search() call, so there is no need</div><div class='add'>+				 * to adjust it.</div><div class='add'>+				 */</div><div class='add'>+				do_bin_search = false;</div><div class='add'>+				path-&gt;slots[0] = 0;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (do_bin_search) {</div><div class='add'>+		ret = search_for_key_slot(leaf, search_low_slot, key,</div><div class='add'>+					  prev_cmp, &amp;path-&gt;slots[0]);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (ins_len &gt; 0) {</div><div class='add'>+		/*</div><div class='add'>+		 * Item key already exists. In this case, if we are allowed to</div><div class='add'>+		 * insert the item (for example, in dir_item case, item key</div><div class='add'>+		 * collision is allowed), it will be merged with the original</div><div class='add'>+		 * item. Only the item size grows, no new btrfs item will be</div><div class='add'>+		 * added. If search_for_extension is not set, ins_len already</div><div class='add'>+		 * accounts the size btrfs_item, deduct it here so leaf space</div><div class='add'>+		 * check will be correct.</div><div class='add'>+		 */</div><div class='add'>+		if (ret == 0 &amp;&amp; !path-&gt;search_for_extension) {</div><div class='add'>+			ASSERT(ins_len &gt;= sizeof(struct btrfs_item));</div><div class='add'>+			ins_len -= sizeof(struct btrfs_item);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		ASSERT(leaf_free_space &gt;= 0);</div><div class='add'>+</div><div class='add'>+		if (leaf_free_space &lt; ins_len) {</div><div class='add'>+			int ret2;</div><div class='add'>+</div><div class='add'>+			ret2 = split_leaf(trans, root, key, path, ins_len, (ret == 0));</div><div class='add'>+			ASSERT(ret2 &lt;= 0);</div><div class='add'>+			if (WARN_ON(ret2 &gt; 0))</div><div class='add'>+				ret2 = -EUCLEAN;</div><div class='add'>+			if (ret2)</div><div class='add'>+				ret = ret2;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * btrfs_search_slot - look for a key in a tree and perform necessary</div><div class='del'>- * modifications to preserve tree invariants.</div><div class='add'>+ * Look for a key in a tree and perform necessary modifications to preserve</div><div class='add'>+ * tree invariants.</div><div class='ctx'>  *</div><div class='ctx'>  * @trans:	Handle of transaction, used when modifying the tree</div><div class='ctx'>  * @p:		Holds all btree nodes along the search path</div><div class='hunk'>@@ -1683,10 +2021,10 @@ int btrfs_search_slot(struct btrfs_trans_handle *trans, struct btrfs_root *root,</div><div class='ctx'> 		      const struct btrfs_key *key, struct btrfs_path *p,</div><div class='ctx'> 		      int ins_len, int cow)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info;</div><div class='ctx'> 	struct extent_buffer *b;</div><div class='ctx'> 	int slot;</div><div class='ctx'> 	int ret;</div><div class='del'>-	int err;</div><div class='ctx'> 	int level;</div><div class='ctx'> 	int lowest_unlock = 1;</div><div class='ctx'> 	/* everything at write_lock_level or lower must be write locked */</div><div class='hunk'>@@ -1695,11 +2033,24 @@ int btrfs_search_slot(struct btrfs_trans_handle *trans, struct btrfs_root *root,</div><div class='ctx'> 	int min_write_lock_level;</div><div class='ctx'> 	int prev_cmp;</div><div class='ctx'> </div><div class='add'>+	if (!root)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	fs_info = root-&gt;fs_info;</div><div class='add'>+	might_sleep();</div><div class='add'>+</div><div class='ctx'> 	lowest_level = p-&gt;lowest_level;</div><div class='ctx'> 	WARN_ON(lowest_level &amp;&amp; ins_len &gt; 0);</div><div class='ctx'> 	WARN_ON(p-&gt;nodes[0] != NULL);</div><div class='ctx'> 	BUG_ON(!cow &amp;&amp; ins_len);</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * For now only allow nowait for read only operations.  There's no</div><div class='add'>+	 * strict reason why we can't, we just only need it for reads so it's</div><div class='add'>+	 * only implemented for reads.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(!p-&gt;nowait || !cow);</div><div class='add'>+</div><div class='ctx'> 	if (ins_len &lt; 0) {</div><div class='ctx'> 		lowest_unlock = 2;</div><div class='ctx'> </div><div class='hunk'>@@ -1724,6 +2075,16 @@ int btrfs_search_slot(struct btrfs_trans_handle *trans, struct btrfs_root *root,</div><div class='ctx'> </div><div class='ctx'> 	min_write_lock_level = write_lock_level;</div><div class='ctx'> </div><div class='add'>+	if (p-&gt;need_commit_sem) {</div><div class='add'>+		ASSERT(p-&gt;search_commit_root);</div><div class='add'>+		if (p-&gt;nowait) {</div><div class='add'>+			if (!down_read_trylock(&amp;fs_info-&gt;commit_root_sem))</div><div class='add'>+				return -EAGAIN;</div><div class='add'>+		} else {</div><div class='add'>+			down_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> again:</div><div class='ctx'> 	prev_cmp = -1;</div><div class='ctx'> 	b = btrfs_search_slot_get_root(root, p, write_lock_level);</div><div class='hunk'>@@ -1734,6 +2095,7 @@ again:</div><div class='ctx'> </div><div class='ctx'> 	while (b) {</div><div class='ctx'> 		int dec = 0;</div><div class='add'>+		int ret2;</div><div class='ctx'> </div><div class='ctx'> 		level = btrfs_header_level(b);</div><div class='ctx'> </div><div class='hunk'>@@ -1762,25 +2124,20 @@ again:</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			if (last_level)</div><div class='del'>-				err = btrfs_cow_block(trans, root, b, NULL, 0,</div><div class='del'>-						      &amp;b,</div><div class='del'>-						      BTRFS_NESTING_COW);</div><div class='add'>+				ret2 = btrfs_cow_block(trans, root, b, NULL, 0,</div><div class='add'>+						       &amp;b, BTRFS_NESTING_COW);</div><div class='ctx'> 			else</div><div class='del'>-				err = btrfs_cow_block(trans, root, b,</div><div class='del'>-						      p-&gt;nodes[level + 1],</div><div class='del'>-						      p-&gt;slots[level + 1], &amp;b,</div><div class='del'>-						      BTRFS_NESTING_COW);</div><div class='del'>-			if (err) {</div><div class='del'>-				ret = err;</div><div class='add'>+				ret2 = btrfs_cow_block(trans, root, b,</div><div class='add'>+						       p-&gt;nodes[level + 1],</div><div class='add'>+						       p-&gt;slots[level + 1], &amp;b,</div><div class='add'>+						       BTRFS_NESTING_COW);</div><div class='add'>+			if (ret2) {</div><div class='add'>+				ret = ret2;</div><div class='ctx'> 				goto done;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> cow_done:</div><div class='ctx'> 		p-&gt;nodes[level] = b;</div><div class='del'>-		/*</div><div class='del'>-		 * Leave path with blocking locks to avoid massive</div><div class='del'>-		 * lock context switch, this is made on purpose.</div><div class='del'>-		 */</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * we have a lock on b and as long as we aren't changing</div><div class='hunk'>@@ -1802,73 +2159,33 @@ cow_done:</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * If btrfs_bin_search returns an exact match (prev_cmp == 0)</div><div class='del'>-		 * we can safely assume the target key will always be in slot 0</div><div class='del'>-		 * on lower levels due to the invariants BTRFS' btree provides,</div><div class='del'>-		 * namely that a btrfs_key_ptr entry always points to the</div><div class='del'>-		 * lowest key in the child node, thus we can skip searching</div><div class='del'>-		 * lower levels</div><div class='del'>-		 */</div><div class='del'>-		if (prev_cmp == 0) {</div><div class='del'>-			slot = 0;</div><div class='del'>-			ret = 0;</div><div class='del'>-		} else {</div><div class='del'>-			ret = btrfs_bin_search(b, key, &amp;slot);</div><div class='del'>-			prev_cmp = ret;</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto done;</div><div class='del'>-		}</div><div class='del'>-</div><div class='ctx'> 		if (level == 0) {</div><div class='del'>-			p-&gt;slots[level] = slot;</div><div class='del'>-			/*</div><div class='del'>-			 * Item key already exists. In this case, if we are</div><div class='del'>-			 * allowed to insert the item (for example, in dir_item</div><div class='del'>-			 * case, item key collision is allowed), it will be</div><div class='del'>-			 * merged with the original item. Only the item size</div><div class='del'>-			 * grows, no new btrfs item will be added. If</div><div class='del'>-			 * search_for_extension is not set, ins_len already</div><div class='del'>-			 * accounts the size btrfs_item, deduct it here so leaf</div><div class='del'>-			 * space check will be correct.</div><div class='del'>-			 */</div><div class='del'>-			if (ret == 0 &amp;&amp; ins_len &gt; 0 &amp;&amp; !p-&gt;search_for_extension) {</div><div class='del'>-				ASSERT(ins_len &gt;= sizeof(struct btrfs_item));</div><div class='del'>-				ins_len -= sizeof(struct btrfs_item);</div><div class='del'>-			}</div><div class='del'>-			if (ins_len &gt; 0 &amp;&amp;</div><div class='del'>-			    btrfs_leaf_free_space(b) &lt; ins_len) {</div><div class='del'>-				if (write_lock_level &lt; 1) {</div><div class='del'>-					write_lock_level = 1;</div><div class='del'>-					btrfs_release_path(p);</div><div class='del'>-					goto again;</div><div class='del'>-				}</div><div class='del'>-</div><div class='del'>-				err = split_leaf(trans, root, key,</div><div class='del'>-						 p, ins_len, ret == 0);</div><div class='add'>+			if (ins_len &gt; 0)</div><div class='add'>+				ASSERT(write_lock_level &gt;= 1);</div><div class='ctx'> </div><div class='del'>-				BUG_ON(err &gt; 0);</div><div class='del'>-				if (err) {</div><div class='del'>-					ret = err;</div><div class='del'>-					goto done;</div><div class='del'>-				}</div><div class='del'>-			}</div><div class='add'>+			ret = search_leaf(trans, root, key, p, ins_len, prev_cmp);</div><div class='ctx'> 			if (!p-&gt;search_for_split)</div><div class='ctx'> 				unlock_up(p, level, lowest_unlock,</div><div class='ctx'> 					  min_write_lock_level, NULL);</div><div class='ctx'> 			goto done;</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='add'>+		ret = search_for_key_slot(b, 0, key, prev_cmp, &amp;slot);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto done;</div><div class='add'>+		prev_cmp = ret;</div><div class='add'>+</div><div class='ctx'> 		if (ret &amp;&amp; slot &gt; 0) {</div><div class='ctx'> 			dec = 1;</div><div class='ctx'> 			slot--;</div><div class='ctx'> 		}</div><div class='ctx'> 		p-&gt;slots[level] = slot;</div><div class='del'>-		err = setup_nodes_for_search(trans, root, p, b, level, ins_len,</div><div class='del'>-					     &amp;write_lock_level);</div><div class='del'>-		if (err == -EAGAIN)</div><div class='add'>+		ret2 = setup_nodes_for_search(trans, root, p, b, level, ins_len,</div><div class='add'>+					      &amp;write_lock_level);</div><div class='add'>+		if (ret2 == -EAGAIN)</div><div class='ctx'> 			goto again;</div><div class='del'>-		if (err) {</div><div class='del'>-			ret = err;</div><div class='add'>+		if (ret2) {</div><div class='add'>+			ret = ret2;</div><div class='ctx'> 			goto done;</div><div class='ctx'> 		}</div><div class='ctx'> 		b = p-&gt;nodes[level];</div><div class='hunk'>@@ -1894,21 +2211,32 @@ cow_done:</div><div class='ctx'> 			goto done;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		err = read_block_for_search(root, p, &amp;b, level, slot, key);</div><div class='del'>-		if (err == -EAGAIN)</div><div class='add'>+		ret2 = read_block_for_search(root, p, &amp;b, slot, key);</div><div class='add'>+		if (ret2 == -EAGAIN &amp;&amp; !p-&gt;nowait)</div><div class='ctx'> 			goto again;</div><div class='del'>-		if (err) {</div><div class='del'>-			ret = err;</div><div class='add'>+		if (ret2) {</div><div class='add'>+			ret = ret2;</div><div class='ctx'> 			goto done;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (!p-&gt;skip_locking) {</div><div class='ctx'> 			level = btrfs_header_level(b);</div><div class='add'>+</div><div class='add'>+			btrfs_maybe_reset_lockdep_class(root, b);</div><div class='add'>+</div><div class='ctx'> 			if (level &lt;= write_lock_level) {</div><div class='ctx'> 				btrfs_tree_lock(b);</div><div class='ctx'> 				p-&gt;locks[level] = BTRFS_WRITE_LOCK;</div><div class='ctx'> 			} else {</div><div class='del'>-				btrfs_tree_read_lock(b);</div><div class='add'>+				if (p-&gt;nowait) {</div><div class='add'>+					if (!btrfs_try_tree_read_lock(b)) {</div><div class='add'>+						free_extent_buffer(b);</div><div class='add'>+						ret = -EAGAIN;</div><div class='add'>+						goto done;</div><div class='add'>+					}</div><div class='add'>+				} else {</div><div class='add'>+					btrfs_tree_read_lock(b);</div><div class='add'>+				}</div><div class='ctx'> 				p-&gt;locks[level] = BTRFS_READ_LOCK;</div><div class='ctx'> 			}</div><div class='ctx'> 			p-&gt;nodes[level] = b;</div><div class='hunk'>@@ -1918,6 +2246,16 @@ cow_done:</div><div class='ctx'> done:</div><div class='ctx'> 	if (ret &lt; 0 &amp;&amp; !p-&gt;skip_release_on_error)</div><div class='ctx'> 		btrfs_release_path(p);</div><div class='add'>+</div><div class='add'>+	if (p-&gt;need_commit_sem) {</div><div class='add'>+		int ret2;</div><div class='add'>+</div><div class='add'>+		ret2 = finish_need_commit_sem_search(p);</div><div class='add'>+		up_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='add'>+		if (ret2)</div><div class='add'>+			ret = ret2;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> ALLOW_ERROR_INJECTION(btrfs_search_slot, ERRNO);</div><div class='hunk'>@@ -1940,13 +2278,13 @@ int btrfs_search_old_slot(struct btrfs_root *root, const struct btrfs_key *key,</div><div class='ctx'> 	struct extent_buffer *b;</div><div class='ctx'> 	int slot;</div><div class='ctx'> 	int ret;</div><div class='del'>-	int err;</div><div class='ctx'> 	int level;</div><div class='ctx'> 	int lowest_unlock = 1;</div><div class='ctx'> 	u8 lowest_level = 0;</div><div class='ctx'> </div><div class='ctx'> 	lowest_level = p-&gt;lowest_level;</div><div class='ctx'> 	WARN_ON(p-&gt;nodes[0] != NULL);</div><div class='add'>+	ASSERT(!p-&gt;nowait);</div><div class='ctx'> </div><div class='ctx'> 	if (p-&gt;search_commit_root) {</div><div class='ctx'> 		BUG_ON(time_seq);</div><div class='hunk'>@@ -1955,7 +2293,7 @@ int btrfs_search_old_slot(struct btrfs_root *root, const struct btrfs_key *key,</div><div class='ctx'> </div><div class='ctx'> again:</div><div class='ctx'> 	b = btrfs_get_old_root(root, time_seq);</div><div class='del'>-	if (!b) {</div><div class='add'>+	if (unlikely(!b)) {</div><div class='ctx'> 		ret = -EIO;</div><div class='ctx'> 		goto done;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1964,6 +2302,7 @@ again:</div><div class='ctx'> </div><div class='ctx'> 	while (b) {</div><div class='ctx'> 		int dec = 0;</div><div class='add'>+		int ret2;</div><div class='ctx'> </div><div class='ctx'> 		level = btrfs_header_level(b);</div><div class='ctx'> 		p-&gt;nodes[level] = b;</div><div class='hunk'>@@ -1976,7 +2315,7 @@ again:</div><div class='ctx'> 		 */</div><div class='ctx'> 		btrfs_unlock_up_safe(p, level + 1);</div><div class='ctx'> </div><div class='del'>-		ret = btrfs_bin_search(b, key, &amp;slot);</div><div class='add'>+		ret = btrfs_bin_search(b, 0, key, &amp;slot);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto done;</div><div class='ctx'> </div><div class='hunk'>@@ -1999,17 +2338,17 @@ again:</div><div class='ctx'> 			goto done;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		err = read_block_for_search(root, p, &amp;b, level, slot, key);</div><div class='del'>-		if (err == -EAGAIN)</div><div class='add'>+		ret2 = read_block_for_search(root, p, &amp;b, slot, key);</div><div class='add'>+		if (ret2 == -EAGAIN &amp;&amp; !p-&gt;nowait)</div><div class='ctx'> 			goto again;</div><div class='del'>-		if (err) {</div><div class='del'>-			ret = err;</div><div class='add'>+		if (ret2) {</div><div class='add'>+			ret = ret2;</div><div class='ctx'> 			goto done;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		level = btrfs_header_level(b);</div><div class='ctx'> 		btrfs_tree_read_lock(b);</div><div class='del'>-		b = btrfs_tree_mod_log_rewind(fs_info, p, b, time_seq);</div><div class='add'>+		b = btrfs_tree_mod_log_rewind(fs_info, b, time_seq);</div><div class='ctx'> 		if (!b) {</div><div class='ctx'> 			ret = -ENOMEM;</div><div class='ctx'> 			goto done;</div><div class='hunk'>@@ -2026,6 +2365,87 @@ done:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * Search the tree again to find a leaf with smaller keys.</div><div class='add'>+ * Returns 0 if it found something.</div><div class='add'>+ * Returns 1 if there are no smaller keys.</div><div class='add'>+ * Returns &lt; 0 on error.</div><div class='add'>+ *</div><div class='add'>+ * This may release the path, and so you may lose any locks held at the</div><div class='add'>+ * time you call it.</div><div class='add'>+ */</div><div class='add'>+static int btrfs_prev_leaf(struct btrfs_root *root, struct btrfs_path *path)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_key key;</div><div class='add'>+	struct btrfs_key orig_key;</div><div class='add'>+	struct btrfs_disk_key found_key;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, 0);</div><div class='add'>+	orig_key = key;</div><div class='add'>+</div><div class='add'>+	if (key.offset &gt; 0) {</div><div class='add'>+		key.offset--;</div><div class='add'>+	} else if (key.type &gt; 0) {</div><div class='add'>+		key.type--;</div><div class='add'>+		key.offset = (u64)-1;</div><div class='add'>+	} else if (key.objectid &gt; 0) {</div><div class='add'>+		key.objectid--;</div><div class='add'>+		key.type = (u8)-1;</div><div class='add'>+		key.offset = (u64)-1;</div><div class='add'>+	} else {</div><div class='add'>+		return 1;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	btrfs_release_path(path);</div><div class='add'>+	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='add'>+	if (ret &lt;= 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Previous key not found. Even if we were at slot 0 of the leaf we had</div><div class='add'>+	 * before releasing the path and calling btrfs_search_slot(), we now may</div><div class='add'>+	 * be in a slot pointing to the same original key - this can happen if</div><div class='add'>+	 * after we released the path, one of more items were moved from a</div><div class='add'>+	 * sibling leaf into the front of the leaf we had due to an insertion</div><div class='add'>+	 * (see push_leaf_right()).</div><div class='add'>+	 * If we hit this case and our slot is &gt; 0 and just decrement the slot</div><div class='add'>+	 * so that the caller does not process the same key again, which may or</div><div class='add'>+	 * may not break the caller, depending on its logic.</div><div class='add'>+	 */</div><div class='add'>+	if (path-&gt;slots[0] &lt; btrfs_header_nritems(path-&gt;nodes[0])) {</div><div class='add'>+		btrfs_item_key(path-&gt;nodes[0], &amp;found_key, path-&gt;slots[0]);</div><div class='add'>+		ret = btrfs_comp_keys(&amp;found_key, &amp;orig_key);</div><div class='add'>+		if (ret == 0) {</div><div class='add'>+			if (path-&gt;slots[0] &gt; 0) {</div><div class='add'>+				path-&gt;slots[0]--;</div><div class='add'>+				return 0;</div><div class='add'>+			}</div><div class='add'>+			/*</div><div class='add'>+			 * At slot 0, same key as before, it means orig_key is</div><div class='add'>+			 * the lowest, leftmost, key in the tree. We're done.</div><div class='add'>+			 */</div><div class='add'>+			return 1;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	btrfs_item_key(path-&gt;nodes[0], &amp;found_key, 0);</div><div class='add'>+	ret = btrfs_comp_keys(&amp;found_key, &amp;key);</div><div class='add'>+	/*</div><div class='add'>+	 * We might have had an item with the previous key in the tree right</div><div class='add'>+	 * before we released our path. And after we released our path, that</div><div class='add'>+	 * item might have been pushed to the first slot (0) of the leaf we</div><div class='add'>+	 * were holding due to a tree balance. Alternatively, an item with the</div><div class='add'>+	 * previous key can exist as the only element of a leaf (big fat item).</div><div class='add'>+	 * Therefore account for these 2 cases, so that our callers (like</div><div class='add'>+	 * btrfs_previous_item) don't miss an existing item with a key matching</div><div class='add'>+	 * the previous key we computed above.</div><div class='add'>+	 */</div><div class='add'>+	if (ret &lt;= 0)</div><div class='add'>+		return 0;</div><div class='add'>+	return 1;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * helper to use instead of search slot if no exact match is needed but</div><div class='ctx'>  * instead the next or previous item should be returned.</div><div class='ctx'>  * When find_higher is true, the next higher item is returned, the next lower</div><div class='hunk'>@@ -2124,6 +2544,32 @@ int btrfs_search_backwards(struct btrfs_root *root, struct btrfs_key *key,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * Search for a valid slot for the given path.</div><div class='add'>+ *</div><div class='add'>+ * @root:	The root node of the tree.</div><div class='add'>+ * @key:	Will contain a valid item if found.</div><div class='add'>+ * @path:	The starting point to validate the slot.</div><div class='add'>+ *</div><div class='add'>+ * Return: 0  if the item is valid</div><div class='add'>+ *         1  if not found</div><div class='add'>+ *         &lt;0 if error.</div><div class='add'>+ */</div><div class='add'>+int btrfs_get_next_valid_item(struct btrfs_root *root, struct btrfs_key *key,</div><div class='add'>+			      struct btrfs_path *path)</div><div class='add'>+{</div><div class='add'>+	if (path-&gt;slots[0] &gt;= btrfs_header_nritems(path-&gt;nodes[0])) {</div><div class='add'>+		int ret;</div><div class='add'>+</div><div class='add'>+		ret = btrfs_next_leaf(root, path);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	btrfs_item_key_to_cpu(path-&gt;nodes[0], key, path-&gt;slots[0]);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * adjust the pointers going up the tree, starting at level</div><div class='ctx'>  * making sure the right key of each node is points to 'key'.</div><div class='ctx'>  * This is used after shifting pointers to the left, so it stops</div><div class='hunk'>@@ -2131,8 +2577,9 @@ int btrfs_search_backwards(struct btrfs_root *root, struct btrfs_key *key,</div><div class='ctx'>  * higher levels</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='del'>-static void fixup_low_keys(struct btrfs_path *path,</div><div class='del'>-			   struct btrfs_disk_key *key, int level)</div><div class='add'>+static void fixup_low_keys(struct btrfs_trans_handle *trans,</div><div class='add'>+			   const struct btrfs_path *path,</div><div class='add'>+			   const struct btrfs_disk_key *key, int level)</div><div class='ctx'> {</div><div class='ctx'> 	int i;</div><div class='ctx'> 	struct extent_buffer *t;</div><div class='hunk'>@@ -2145,10 +2592,10 @@ static void fixup_low_keys(struct btrfs_path *path,</div><div class='ctx'> 			break;</div><div class='ctx'> 		t = path-&gt;nodes[i];</div><div class='ctx'> 		ret = btrfs_tree_mod_log_insert_key(t, tslot,</div><div class='del'>-				BTRFS_MOD_LOG_KEY_REPLACE, GFP_ATOMIC);</div><div class='add'>+						    BTRFS_MOD_LOG_KEY_REPLACE);</div><div class='ctx'> 		BUG_ON(ret &lt; 0);</div><div class='ctx'> 		btrfs_set_node_key(t, key, tslot);</div><div class='del'>-		btrfs_mark_buffer_dirty(path-&gt;nodes[i]);</div><div class='add'>+		btrfs_mark_buffer_dirty(trans, path-&gt;nodes[i]);</div><div class='ctx'> 		if (tslot != 0)</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2160,10 +2607,11 @@ static void fixup_low_keys(struct btrfs_path *path,</div><div class='ctx'>  * This function isn't completely safe. It's the caller's responsibility</div><div class='ctx'>  * that the new key won't break the order</div><div class='ctx'>  */</div><div class='del'>-void btrfs_set_item_key_safe(struct btrfs_fs_info *fs_info,</div><div class='del'>-			     struct btrfs_path *path,</div><div class='add'>+void btrfs_set_item_key_safe(struct btrfs_trans_handle *trans,</div><div class='add'>+			     const struct btrfs_path *path,</div><div class='ctx'> 			     const struct btrfs_key *new_key)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_disk_key disk_key;</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='ctx'> 	int slot;</div><div class='hunk'>@@ -2172,38 +2620,36 @@ void btrfs_set_item_key_safe(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	slot = path-&gt;slots[0];</div><div class='ctx'> 	if (slot &gt; 0) {</div><div class='ctx'> 		btrfs_item_key(eb, &amp;disk_key, slot - 1);</div><div class='del'>-		if (unlikely(comp_keys(&amp;disk_key, new_key) &gt;= 0)) {</div><div class='add'>+		if (unlikely(btrfs_comp_keys(&amp;disk_key, new_key) &gt;= 0)) {</div><div class='add'>+			btrfs_print_leaf(eb);</div><div class='ctx'> 			btrfs_crit(fs_info,</div><div class='del'>-		"slot %u key (%llu %u %llu) new key (%llu %u %llu)",</div><div class='add'>+		"slot %u key " BTRFS_KEY_FMT " new key " BTRFS_KEY_FMT,</div><div class='ctx'> 				   slot, btrfs_disk_key_objectid(&amp;disk_key),</div><div class='ctx'> 				   btrfs_disk_key_type(&amp;disk_key),</div><div class='ctx'> 				   btrfs_disk_key_offset(&amp;disk_key),</div><div class='del'>-				   new_key-&gt;objectid, new_key-&gt;type,</div><div class='del'>-				   new_key-&gt;offset);</div><div class='del'>-			btrfs_print_leaf(eb);</div><div class='add'>+				   BTRFS_KEY_FMT_VALUE(new_key));</div><div class='ctx'> 			BUG();</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	if (slot &lt; btrfs_header_nritems(eb) - 1) {</div><div class='ctx'> 		btrfs_item_key(eb, &amp;disk_key, slot + 1);</div><div class='del'>-		if (unlikely(comp_keys(&amp;disk_key, new_key) &lt;= 0)) {</div><div class='add'>+		if (unlikely(btrfs_comp_keys(&amp;disk_key, new_key) &lt;= 0)) {</div><div class='add'>+			btrfs_print_leaf(eb);</div><div class='ctx'> 			btrfs_crit(fs_info,</div><div class='del'>-		"slot %u key (%llu %u %llu) new key (%llu %u %llu)",</div><div class='add'>+		"slot %u key " BTRFS_KEY_FMT " new key " BTRFS_KEY_FMT,</div><div class='ctx'> 				   slot, btrfs_disk_key_objectid(&amp;disk_key),</div><div class='ctx'> 				   btrfs_disk_key_type(&amp;disk_key),</div><div class='ctx'> 				   btrfs_disk_key_offset(&amp;disk_key),</div><div class='del'>-				   new_key-&gt;objectid, new_key-&gt;type,</div><div class='del'>-				   new_key-&gt;offset);</div><div class='del'>-			btrfs_print_leaf(eb);</div><div class='add'>+				   BTRFS_KEY_FMT_VALUE(new_key));</div><div class='ctx'> 			BUG();</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	btrfs_cpu_key_to_disk(&amp;disk_key, new_key);</div><div class='ctx'> 	btrfs_set_item_key(eb, &amp;disk_key, slot);</div><div class='del'>-	btrfs_mark_buffer_dirty(eb);</div><div class='add'>+	btrfs_mark_buffer_dirty(trans, eb);</div><div class='ctx'> 	if (slot == 0)</div><div class='del'>-		fixup_low_keys(path, &amp;disk_key, 1);</div><div class='add'>+		fixup_low_keys(trans, path, &amp;disk_key, 1);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2226,8 +2672,8 @@ void btrfs_set_item_key_safe(struct btrfs_fs_info *fs_info,</div><div class='ctx'>  * is correct, we only need to bother the last key of @left and the first</div><div class='ctx'>  * key of @right.</div><div class='ctx'>  */</div><div class='del'>-static bool check_sibling_keys(struct extent_buffer *left,</div><div class='del'>-			       struct extent_buffer *right)</div><div class='add'>+static bool check_sibling_keys(const struct extent_buffer *left,</div><div class='add'>+			       const struct extent_buffer *right)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_key left_last;</div><div class='ctx'> 	struct btrfs_key right_first;</div><div class='hunk'>@@ -2247,12 +2693,15 @@ static bool check_sibling_keys(struct extent_buffer *left,</div><div class='ctx'> 		btrfs_item_key_to_cpu(right, &amp;right_first, 0);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (btrfs_comp_cpu_keys(&amp;left_last, &amp;right_first) &gt;= 0) {</div><div class='add'>+	if (unlikely(btrfs_comp_cpu_keys(&amp;left_last, &amp;right_first) &gt;= 0)) {</div><div class='add'>+		btrfs_crit(left-&gt;fs_info, "left extent buffer:");</div><div class='add'>+		btrfs_print_tree(left, false);</div><div class='add'>+		btrfs_crit(left-&gt;fs_info, "right extent buffer:");</div><div class='add'>+		btrfs_print_tree(right, false);</div><div class='ctx'> 		btrfs_crit(left-&gt;fs_info,</div><div class='del'>-"bad key order, sibling blocks, left last (%llu %u %llu) right first (%llu %u %llu)",</div><div class='del'>-			   left_last.objectid, left_last.type,</div><div class='del'>-			   left_last.offset, right_first.objectid,</div><div class='del'>-			   right_first.type, right_first.offset);</div><div class='add'>+"bad key order, sibling blocks, left last " BTRFS_KEY_FMT " right first " BTRFS_KEY_FMT,</div><div class='add'>+			   BTRFS_KEY_FMT_VALUE(&amp;left_last),</div><div class='add'>+			   BTRFS_KEY_FMT_VALUE(&amp;right_first));</div><div class='ctx'> 		return true;</div><div class='ctx'> 	}</div><div class='ctx'> 	return false;</div><div class='hunk'>@@ -2267,7 +2716,7 @@ static bool check_sibling_keys(struct extent_buffer *left,</div><div class='ctx'>  */</div><div class='ctx'> static int push_node_left(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			  struct extent_buffer *dst,</div><div class='del'>-			  struct extent_buffer *src, int empty)</div><div class='add'>+			  struct extent_buffer *src, bool empty)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	int push_items = 0;</div><div class='hunk'>@@ -2303,35 +2752,35 @@ static int push_node_left(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		push_items = min(src_nritems - 8, push_items);</div><div class='ctx'> </div><div class='ctx'> 	/* dst is the left eb, src is the middle eb */</div><div class='del'>-	if (check_sibling_keys(dst, src)) {</div><div class='add'>+	if (unlikely(check_sibling_keys(dst, src))) {</div><div class='ctx'> 		ret = -EUCLEAN;</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> 	ret = btrfs_tree_mod_log_eb_copy(dst, src, dst_nritems, 0, push_items);</div><div class='del'>-	if (ret) {</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> 	copy_extent_buffer(dst, src,</div><div class='del'>-			   btrfs_node_key_ptr_offset(dst_nritems),</div><div class='del'>-			   btrfs_node_key_ptr_offset(0),</div><div class='add'>+			   btrfs_node_key_ptr_offset(dst, dst_nritems),</div><div class='add'>+			   btrfs_node_key_ptr_offset(src, 0),</div><div class='ctx'> 			   push_items * sizeof(struct btrfs_key_ptr));</div><div class='ctx'> </div><div class='ctx'> 	if (push_items &lt; src_nritems) {</div><div class='ctx'> 		/*</div><div class='del'>-		 * Don't call btrfs_tree_mod_log_insert_move() here, key removal</div><div class='del'>-		 * was already fully logged by btrfs_tree_mod_log_eb_copy() above.</div><div class='add'>+		 * btrfs_tree_mod_log_eb_copy handles logging the move, so we</div><div class='add'>+		 * don't need to do an explicit tree mod log operation for it.</div><div class='ctx'> 		 */</div><div class='del'>-		memmove_extent_buffer(src, btrfs_node_key_ptr_offset(0),</div><div class='del'>-				      btrfs_node_key_ptr_offset(push_items),</div><div class='add'>+		memmove_extent_buffer(src, btrfs_node_key_ptr_offset(src, 0),</div><div class='add'>+				      btrfs_node_key_ptr_offset(src, push_items),</div><div class='ctx'> 				      (src_nritems - push_items) *</div><div class='ctx'> 				      sizeof(struct btrfs_key_ptr));</div><div class='ctx'> 	}</div><div class='ctx'> 	btrfs_set_header_nritems(src, src_nritems - push_items);</div><div class='ctx'> 	btrfs_set_header_nritems(dst, dst_nritems + push_items);</div><div class='del'>-	btrfs_mark_buffer_dirty(src);</div><div class='del'>-	btrfs_mark_buffer_dirty(dst);</div><div class='add'>+	btrfs_mark_buffer_dirty(trans, src);</div><div class='add'>+	btrfs_mark_buffer_dirty(trans, dst);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -2377,34 +2826,37 @@ static int balance_node_right(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		push_items = max_push;</div><div class='ctx'> </div><div class='ctx'> 	/* dst is the right eb, src is the middle eb */</div><div class='del'>-	if (check_sibling_keys(src, dst)) {</div><div class='add'>+	if (unlikely(check_sibling_keys(src, dst))) {</div><div class='ctx'> 		ret = -EUCLEAN;</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='del'>-	ret = btrfs_tree_mod_log_insert_move(dst, push_items, 0, dst_nritems);</div><div class='del'>-	BUG_ON(ret &lt; 0);</div><div class='del'>-	memmove_extent_buffer(dst, btrfs_node_key_ptr_offset(push_items),</div><div class='del'>-				      btrfs_node_key_ptr_offset(0),</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * btrfs_tree_mod_log_eb_copy handles logging the move, so we don't</div><div class='add'>+	 * need to do an explicit tree mod log operation for it.</div><div class='add'>+	 */</div><div class='add'>+	memmove_extent_buffer(dst, btrfs_node_key_ptr_offset(dst, push_items),</div><div class='add'>+				      btrfs_node_key_ptr_offset(dst, 0),</div><div class='ctx'> 				      (dst_nritems) *</div><div class='ctx'> 				      sizeof(struct btrfs_key_ptr));</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_tree_mod_log_eb_copy(dst, src, 0, src_nritems - push_items,</div><div class='ctx'> 					 push_items);</div><div class='del'>-	if (ret) {</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> 	copy_extent_buffer(dst, src,</div><div class='del'>-			   btrfs_node_key_ptr_offset(0),</div><div class='del'>-			   btrfs_node_key_ptr_offset(src_nritems - push_items),</div><div class='add'>+			   btrfs_node_key_ptr_offset(dst, 0),</div><div class='add'>+			   btrfs_node_key_ptr_offset(src, src_nritems - push_items),</div><div class='ctx'> 			   push_items * sizeof(struct btrfs_key_ptr));</div><div class='ctx'> </div><div class='ctx'> 	btrfs_set_header_nritems(src, src_nritems - push_items);</div><div class='ctx'> 	btrfs_set_header_nritems(dst, dst_nritems + push_items);</div><div class='ctx'> </div><div class='del'>-	btrfs_mark_buffer_dirty(src);</div><div class='del'>-	btrfs_mark_buffer_dirty(dst);</div><div class='add'>+	btrfs_mark_buffer_dirty(trans, src);</div><div class='add'>+	btrfs_mark_buffer_dirty(trans, dst);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -2420,7 +2872,6 @@ static noinline int insert_new_root(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			   struct btrfs_root *root,</div><div class='ctx'> 			   struct btrfs_path *path, int level)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	u64 lower_gen;</div><div class='ctx'> 	struct extent_buffer *lower;</div><div class='ctx'> 	struct extent_buffer *c;</div><div class='hunk'>@@ -2437,13 +2888,13 @@ static noinline int insert_new_root(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	else</div><div class='ctx'> 		btrfs_node_key(lower, &amp;lower_key, 0);</div><div class='ctx'> </div><div class='del'>-	c = btrfs_alloc_tree_block(trans, root, 0, root-&gt;root_key.objectid,</div><div class='add'>+	c = btrfs_alloc_tree_block(trans, root, 0, btrfs_root_id(root),</div><div class='ctx'> 				   &amp;lower_key, level, root-&gt;node-&gt;start, 0,</div><div class='del'>-				   BTRFS_NESTING_NEW_ROOT);</div><div class='add'>+				   0, BTRFS_NESTING_NEW_ROOT);</div><div class='ctx'> 	if (IS_ERR(c))</div><div class='ctx'> 		return PTR_ERR(c);</div><div class='ctx'> </div><div class='del'>-	root_add_used(root, fs_info-&gt;nodesize);</div><div class='add'>+	root_add_used_bytes(root);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_set_header_nritems(c, 1);</div><div class='ctx'> 	btrfs_set_node_key(c, &amp;lower_key, 0);</div><div class='hunk'>@@ -2453,18 +2904,28 @@ static noinline int insert_new_root(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	btrfs_set_node_ptr_generation(c, 0, lower_gen);</div><div class='ctx'> </div><div class='del'>-	btrfs_mark_buffer_dirty(c);</div><div class='add'>+	btrfs_mark_buffer_dirty(trans, c);</div><div class='ctx'> </div><div class='ctx'> 	old = root-&gt;node;</div><div class='ctx'> 	ret = btrfs_tree_mod_log_insert_root(root-&gt;node, c, false);</div><div class='del'>-	BUG_ON(ret &lt; 0);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		int ret2;</div><div class='add'>+</div><div class='add'>+		btrfs_clear_buffer_dirty(trans, c);</div><div class='add'>+		ret2 = btrfs_free_tree_block(trans, btrfs_root_id(root), c, 0, 1);</div><div class='add'>+		if (unlikely(ret2 &lt; 0))</div><div class='add'>+			btrfs_abort_transaction(trans, ret2);</div><div class='add'>+		btrfs_tree_unlock(c);</div><div class='add'>+		free_extent_buffer(c);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='ctx'> 	rcu_assign_pointer(root-&gt;node, c);</div><div class='ctx'> </div><div class='ctx'> 	/* the super has an extra ref to root-&gt;node */</div><div class='ctx'> 	free_extent_buffer(old);</div><div class='ctx'> </div><div class='ctx'> 	add_root_to_dirty_list(root);</div><div class='del'>-	atomic_inc(&amp;c-&gt;refs);</div><div class='add'>+	refcount_inc(&amp;c-&gt;refs);</div><div class='ctx'> 	path-&gt;nodes[level] = c;</div><div class='ctx'> 	path-&gt;locks[level] = BTRFS_WRITE_LOCK;</div><div class='ctx'> 	path-&gt;slots[level] = 0;</div><div class='hunk'>@@ -2478,10 +2939,10 @@ static noinline int insert_new_root(struct btrfs_trans_handle *trans,</div><div class='ctx'>  * slot and level indicate where you want the key to go, and</div><div class='ctx'>  * blocknr is the block the key points to.</div><div class='ctx'>  */</div><div class='del'>-static void insert_ptr(struct btrfs_trans_handle *trans,</div><div class='del'>-		       struct btrfs_path *path,</div><div class='del'>-		       struct btrfs_disk_key *key, u64 bytenr,</div><div class='del'>-		       int slot, int level)</div><div class='add'>+static int insert_ptr(struct btrfs_trans_handle *trans,</div><div class='add'>+		      const struct btrfs_path *path,</div><div class='add'>+		      const struct btrfs_disk_key *key, u64 bytenr,</div><div class='add'>+		      int slot, int level)</div><div class='ctx'> {</div><div class='ctx'> 	struct extent_buffer *lower;</div><div class='ctx'> 	int nritems;</div><div class='hunk'>@@ -2497,24 +2958,32 @@ static void insert_ptr(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		if (level) {</div><div class='ctx'> 			ret = btrfs_tree_mod_log_insert_move(lower, slot + 1,</div><div class='ctx'> 					slot, nritems - slot);</div><div class='del'>-			BUG_ON(ret &lt; 0);</div><div class='add'>+			if (unlikely(ret &lt; 0)) {</div><div class='add'>+				btrfs_abort_transaction(trans, ret);</div><div class='add'>+				return ret;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> 		memmove_extent_buffer(lower,</div><div class='del'>-			      btrfs_node_key_ptr_offset(slot + 1),</div><div class='del'>-			      btrfs_node_key_ptr_offset(slot),</div><div class='add'>+			      btrfs_node_key_ptr_offset(lower, slot + 1),</div><div class='add'>+			      btrfs_node_key_ptr_offset(lower, slot),</div><div class='ctx'> 			      (nritems - slot) * sizeof(struct btrfs_key_ptr));</div><div class='ctx'> 	}</div><div class='ctx'> 	if (level) {</div><div class='ctx'> 		ret = btrfs_tree_mod_log_insert_key(lower, slot,</div><div class='del'>-					    BTRFS_MOD_LOG_KEY_ADD, GFP_NOFS);</div><div class='del'>-		BUG_ON(ret &lt; 0);</div><div class='add'>+						    BTRFS_MOD_LOG_KEY_ADD);</div><div class='add'>+		if (unlikely(ret &lt; 0)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> 	btrfs_set_node_key(lower, key, slot);</div><div class='ctx'> 	btrfs_set_node_blockptr(lower, slot, bytenr);</div><div class='ctx'> 	WARN_ON(trans-&gt;transid == 0);</div><div class='ctx'> 	btrfs_set_node_ptr_generation(lower, slot, trans-&gt;transid);</div><div class='ctx'> 	btrfs_set_header_nritems(lower, nritems + 1);</div><div class='del'>-	btrfs_mark_buffer_dirty(lower);</div><div class='add'>+	btrfs_mark_buffer_dirty(trans, lower);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2568,32 +3037,39 @@ static noinline int split_node(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	mid = (c_nritems + 1) / 2;</div><div class='ctx'> 	btrfs_node_key(c, &amp;disk_key, mid);</div><div class='ctx'> </div><div class='del'>-	split = btrfs_alloc_tree_block(trans, root, 0, root-&gt;root_key.objectid,</div><div class='add'>+	split = btrfs_alloc_tree_block(trans, root, 0, btrfs_root_id(root),</div><div class='ctx'> 				       &amp;disk_key, level, c-&gt;start, 0,</div><div class='del'>-				       BTRFS_NESTING_SPLIT);</div><div class='add'>+				       0, BTRFS_NESTING_SPLIT);</div><div class='ctx'> 	if (IS_ERR(split))</div><div class='ctx'> 		return PTR_ERR(split);</div><div class='ctx'> </div><div class='del'>-	root_add_used(root, fs_info-&gt;nodesize);</div><div class='add'>+	root_add_used_bytes(root);</div><div class='ctx'> 	ASSERT(btrfs_header_level(c) == level);</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_tree_mod_log_eb_copy(split, c, 0, mid, c_nritems - mid);</div><div class='del'>-	if (ret) {</div><div class='add'>+	if (unlikely(ret)) {</div><div class='add'>+		btrfs_tree_unlock(split);</div><div class='add'>+		free_extent_buffer(split);</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> 	copy_extent_buffer(split, c,</div><div class='del'>-			   btrfs_node_key_ptr_offset(0),</div><div class='del'>-			   btrfs_node_key_ptr_offset(mid),</div><div class='add'>+			   btrfs_node_key_ptr_offset(split, 0),</div><div class='add'>+			   btrfs_node_key_ptr_offset(c, mid),</div><div class='ctx'> 			   (c_nritems - mid) * sizeof(struct btrfs_key_ptr));</div><div class='ctx'> 	btrfs_set_header_nritems(split, c_nritems - mid);</div><div class='ctx'> 	btrfs_set_header_nritems(c, mid);</div><div class='ctx'> </div><div class='del'>-	btrfs_mark_buffer_dirty(c);</div><div class='del'>-	btrfs_mark_buffer_dirty(split);</div><div class='add'>+	btrfs_mark_buffer_dirty(trans, c);</div><div class='add'>+	btrfs_mark_buffer_dirty(trans, split);</div><div class='ctx'> </div><div class='del'>-	insert_ptr(trans, path, &amp;disk_key, split-&gt;start,</div><div class='del'>-		   path-&gt;slots[level + 1] + 1, level + 1);</div><div class='add'>+	ret = insert_ptr(trans, path, &amp;disk_key, split-&gt;start,</div><div class='add'>+			 path-&gt;slots[level + 1] + 1, level + 1);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		btrfs_tree_unlock(split);</div><div class='add'>+		free_extent_buffer(split);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (path-&gt;slots[level] &gt;= mid) {</div><div class='ctx'> 		path-&gt;slots[level] -= mid;</div><div class='hunk'>@@ -2613,21 +3089,16 @@ static noinline int split_node(struct btrfs_trans_handle *trans,</div><div class='ctx'>  * and nr indicate which items in the leaf to check.  This totals up the</div><div class='ctx'>  * space used both by the item structs and the item data</div><div class='ctx'>  */</div><div class='del'>-static int leaf_space_used(struct extent_buffer *l, int start, int nr)</div><div class='add'>+static int leaf_space_used(const struct extent_buffer *l, int start, int nr)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_item *start_item;</div><div class='del'>-	struct btrfs_item *end_item;</div><div class='ctx'> 	int data_len;</div><div class='ctx'> 	int nritems = btrfs_header_nritems(l);</div><div class='ctx'> 	int end = min(nritems, start + nr) - 1;</div><div class='ctx'> </div><div class='ctx'> 	if (!nr)</div><div class='ctx'> 		return 0;</div><div class='del'>-	start_item = btrfs_item_nr(start);</div><div class='del'>-	end_item = btrfs_item_nr(end);</div><div class='del'>-	data_len = btrfs_item_offset(l, start_item) +</div><div class='del'>-		   btrfs_item_size(l, start_item);</div><div class='del'>-	data_len = data_len - btrfs_item_offset(l, end_item);</div><div class='add'>+	data_len = btrfs_item_offset(l, start) + btrfs_item_size(l, start);</div><div class='add'>+	data_len = data_len - btrfs_item_offset(l, end);</div><div class='ctx'> 	data_len += sizeof(struct btrfs_item) * nr;</div><div class='ctx'> 	WARN_ON(data_len &lt; 0);</div><div class='ctx'> 	return data_len;</div><div class='hunk'>@@ -2638,14 +3109,14 @@ static int leaf_space_used(struct extent_buffer *l, int start, int nr)</div><div class='ctx'>  * the start of the leaf data.  IOW, how much room</div><div class='ctx'>  * the leaf has left for both items and data</div><div class='ctx'>  */</div><div class='del'>-noinline int btrfs_leaf_free_space(struct extent_buffer *leaf)</div><div class='add'>+int btrfs_leaf_free_space(const struct extent_buffer *leaf)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = leaf-&gt;fs_info;</div><div class='ctx'> 	int nritems = btrfs_header_nritems(leaf);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	ret = BTRFS_LEAF_DATA_SIZE(fs_info) - leaf_space_used(leaf, 0, nritems);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='add'>+	if (unlikely(ret &lt; 0)) {</div><div class='ctx'> 		btrfs_crit(fs_info,</div><div class='ctx'> 			   "leaf free space ret %d, leaf data size %lu, used %d nritems %d",</div><div class='ctx'> 			   ret,</div><div class='hunk'>@@ -2659,8 +3130,9 @@ noinline int btrfs_leaf_free_space(struct extent_buffer *leaf)</div><div class='ctx'>  * min slot controls the lowest index we're willing to push to the</div><div class='ctx'>  * right.  We'll push up to and including min_slot, but no lower</div><div class='ctx'>  */</div><div class='del'>-static noinline int __push_leaf_right(struct btrfs_path *path,</div><div class='del'>-				      int data_size, int empty,</div><div class='add'>+static noinline int __push_leaf_right(struct btrfs_trans_handle *trans,</div><div class='add'>+				      struct btrfs_path *path,</div><div class='add'>+				      int data_size, bool empty,</div><div class='ctx'> 				      struct extent_buffer *right,</div><div class='ctx'> 				      int free_space, u32 left_nritems,</div><div class='ctx'> 				      u32 min_slot)</div><div class='hunk'>@@ -2668,13 +3140,11 @@ static noinline int __push_leaf_right(struct btrfs_path *path,</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = right-&gt;fs_info;</div><div class='ctx'> 	struct extent_buffer *left = path-&gt;nodes[0];</div><div class='ctx'> 	struct extent_buffer *upper = path-&gt;nodes[1];</div><div class='del'>-	struct btrfs_map_token token;</div><div class='ctx'> 	struct btrfs_disk_key disk_key;</div><div class='ctx'> 	int slot;</div><div class='ctx'> 	u32 i;</div><div class='ctx'> 	int push_space = 0;</div><div class='ctx'> 	int push_items = 0;</div><div class='del'>-	struct btrfs_item *item;</div><div class='ctx'> 	u32 nr;</div><div class='ctx'> 	u32 right_nritems;</div><div class='ctx'> 	u32 data_end;</div><div class='hunk'>@@ -2691,8 +3161,6 @@ static noinline int __push_leaf_right(struct btrfs_path *path,</div><div class='ctx'> 	slot = path-&gt;slots[1];</div><div class='ctx'> 	i = left_nritems - 1;</div><div class='ctx'> 	while (i &gt;= nr) {</div><div class='del'>-		item = btrfs_item_nr(i);</div><div class='del'>-</div><div class='ctx'> 		if (!empty &amp;&amp; push_items &gt; 0) {</div><div class='ctx'> 			if (path-&gt;slots[0] &gt; i)</div><div class='ctx'> 				break;</div><div class='hunk'>@@ -2707,12 +3175,13 @@ static noinline int __push_leaf_right(struct btrfs_path *path,</div><div class='ctx'> 		if (path-&gt;slots[0] == i)</div><div class='ctx'> 			push_space += data_size;</div><div class='ctx'> </div><div class='del'>-		this_item_size = btrfs_item_size(left, item);</div><div class='del'>-		if (this_item_size + sizeof(*item) + push_space &gt; free_space)</div><div class='add'>+		this_item_size = btrfs_item_size(left, i);</div><div class='add'>+		if (this_item_size + sizeof(struct btrfs_item) +</div><div class='add'>+		    push_space &gt; free_space)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='ctx'> 		push_items++;</div><div class='del'>-		push_space += this_item_size + sizeof(*item);</div><div class='add'>+		push_space += this_item_size + sizeof(struct btrfs_item);</div><div class='ctx'> 		if (i == 0)</div><div class='ctx'> 			break;</div><div class='ctx'> 		i--;</div><div class='hunk'>@@ -2726,63 +3195,51 @@ static noinline int __push_leaf_right(struct btrfs_path *path,</div><div class='ctx'> 	/* push left to right */</div><div class='ctx'> 	right_nritems = btrfs_header_nritems(right);</div><div class='ctx'> </div><div class='del'>-	push_space = btrfs_item_end_nr(left, left_nritems - push_items);</div><div class='add'>+	push_space = btrfs_item_data_end(left, left_nritems - push_items);</div><div class='ctx'> 	push_space -= leaf_data_end(left);</div><div class='ctx'> </div><div class='ctx'> 	/* make room in the right data area */</div><div class='ctx'> 	data_end = leaf_data_end(right);</div><div class='del'>-	memmove_extent_buffer(right,</div><div class='del'>-			      BTRFS_LEAF_DATA_OFFSET + data_end - push_space,</div><div class='del'>-			      BTRFS_LEAF_DATA_OFFSET + data_end,</div><div class='del'>-			      BTRFS_LEAF_DATA_SIZE(fs_info) - data_end);</div><div class='add'>+	memmove_leaf_data(right, data_end - push_space, data_end,</div><div class='add'>+			  BTRFS_LEAF_DATA_SIZE(fs_info) - data_end);</div><div class='ctx'> </div><div class='ctx'> 	/* copy from the left data area */</div><div class='del'>-	copy_extent_buffer(right, left, BTRFS_LEAF_DATA_OFFSET +</div><div class='del'>-		     BTRFS_LEAF_DATA_SIZE(fs_info) - push_space,</div><div class='del'>-		     BTRFS_LEAF_DATA_OFFSET + leaf_data_end(left),</div><div class='del'>-		     push_space);</div><div class='add'>+	copy_leaf_data(right, left, BTRFS_LEAF_DATA_SIZE(fs_info) - push_space,</div><div class='add'>+		       leaf_data_end(left), push_space);</div><div class='ctx'> </div><div class='del'>-	memmove_extent_buffer(right, btrfs_item_nr_offset(push_items),</div><div class='del'>-			      btrfs_item_nr_offset(0),</div><div class='del'>-			      right_nritems * sizeof(struct btrfs_item));</div><div class='add'>+	memmove_leaf_items(right, push_items, 0, right_nritems);</div><div class='ctx'> </div><div class='ctx'> 	/* copy the items from left to right */</div><div class='del'>-	copy_extent_buffer(right, left, btrfs_item_nr_offset(0),</div><div class='del'>-		   btrfs_item_nr_offset(left_nritems - push_items),</div><div class='del'>-		   push_items * sizeof(struct btrfs_item));</div><div class='add'>+	copy_leaf_items(right, left, 0, left_nritems - push_items, push_items);</div><div class='ctx'> </div><div class='ctx'> 	/* update the item pointers */</div><div class='del'>-	btrfs_init_map_token(&amp;token, right);</div><div class='ctx'> 	right_nritems += push_items;</div><div class='ctx'> 	btrfs_set_header_nritems(right, right_nritems);</div><div class='ctx'> 	push_space = BTRFS_LEAF_DATA_SIZE(fs_info);</div><div class='ctx'> 	for (i = 0; i &lt; right_nritems; i++) {</div><div class='del'>-		item = btrfs_item_nr(i);</div><div class='del'>-		push_space -= btrfs_token_item_size(&amp;token, item);</div><div class='del'>-		btrfs_set_token_item_offset(&amp;token, item, push_space);</div><div class='add'>+		push_space -= btrfs_item_size(right, i);</div><div class='add'>+		btrfs_set_item_offset(right, i, push_space);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	left_nritems -= push_items;</div><div class='ctx'> 	btrfs_set_header_nritems(left, left_nritems);</div><div class='ctx'> </div><div class='ctx'> 	if (left_nritems)</div><div class='del'>-		btrfs_mark_buffer_dirty(left);</div><div class='add'>+		btrfs_mark_buffer_dirty(trans, left);</div><div class='ctx'> 	else</div><div class='del'>-		btrfs_clean_tree_block(left);</div><div class='add'>+		btrfs_clear_buffer_dirty(trans, left);</div><div class='ctx'> </div><div class='del'>-	btrfs_mark_buffer_dirty(right);</div><div class='add'>+	btrfs_mark_buffer_dirty(trans, right);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_item_key(right, &amp;disk_key, 0);</div><div class='ctx'> 	btrfs_set_node_key(upper, &amp;disk_key, slot + 1);</div><div class='del'>-	btrfs_mark_buffer_dirty(upper);</div><div class='add'>+	btrfs_mark_buffer_dirty(trans, upper);</div><div class='ctx'> </div><div class='ctx'> 	/* then fixup the leaf pointer in the path */</div><div class='ctx'> 	if (path-&gt;slots[0] &gt;= left_nritems) {</div><div class='ctx'> 		path-&gt;slots[0] -= left_nritems;</div><div class='del'>-		if (btrfs_header_nritems(path-&gt;nodes[0]) == 0)</div><div class='del'>-			btrfs_clean_tree_block(path-&gt;nodes[0]);</div><div class='del'>-		btrfs_tree_unlock(path-&gt;nodes[0]);</div><div class='del'>-		free_extent_buffer(path-&gt;nodes[0]);</div><div class='add'>+		btrfs_tree_unlock(left);</div><div class='add'>+		free_extent_buffer(left);</div><div class='ctx'> 		path-&gt;nodes[0] = right;</div><div class='ctx'> 		path-&gt;slots[1] += 1;</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -2810,7 +3267,7 @@ out_unlock:</div><div class='ctx'> static int push_leaf_right(struct btrfs_trans_handle *trans, struct btrfs_root</div><div class='ctx'> 			   *root, struct btrfs_path *path,</div><div class='ctx'> 			   int min_data_size, int data_size,</div><div class='del'>-			   int empty, u32 min_slot)</div><div class='add'>+			   bool empty, u32 min_slot)</div><div class='ctx'> {</div><div class='ctx'> 	struct extent_buffer *left = path-&gt;nodes[0];</div><div class='ctx'> 	struct extent_buffer *right;</div><div class='hunk'>@@ -2831,35 +3288,27 @@ static int push_leaf_right(struct btrfs_trans_handle *trans, struct btrfs_root</div><div class='ctx'> 	btrfs_assert_tree_write_locked(path-&gt;nodes[1]);</div><div class='ctx'> </div><div class='ctx'> 	right = btrfs_read_node_slot(upper, slot + 1);</div><div class='del'>-	/*</div><div class='del'>-	 * slot + 1 is not valid or we fail to read the right node,</div><div class='del'>-	 * no big deal, just return.</div><div class='del'>-	 */</div><div class='ctx'> 	if (IS_ERR(right))</div><div class='del'>-		return 1;</div><div class='add'>+		return PTR_ERR(right);</div><div class='ctx'> </div><div class='del'>-	__btrfs_tree_lock(right, BTRFS_NESTING_RIGHT);</div><div class='add'>+	btrfs_tree_lock_nested(right, BTRFS_NESTING_RIGHT);</div><div class='ctx'> </div><div class='ctx'> 	free_space = btrfs_leaf_free_space(right);</div><div class='ctx'> 	if (free_space &lt; data_size)</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='del'>-	/* cow and double check */</div><div class='ctx'> 	ret = btrfs_cow_block(trans, root, right, upper,</div><div class='ctx'> 			      slot + 1, &amp;right, BTRFS_NESTING_RIGHT_COW);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='del'>-	free_space = btrfs_leaf_free_space(right);</div><div class='del'>-	if (free_space &lt; data_size)</div><div class='del'>-		goto out_unlock;</div><div class='del'>-</div><div class='ctx'> 	left_nritems = btrfs_header_nritems(left);</div><div class='ctx'> 	if (left_nritems == 0)</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='del'>-	if (check_sibling_keys(left, right)) {</div><div class='add'>+	if (unlikely(check_sibling_keys(left, right))) {</div><div class='ctx'> 		ret = -EUCLEAN;</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		btrfs_tree_unlock(right);</div><div class='ctx'> 		free_extent_buffer(right);</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -2877,8 +3326,8 @@ static int push_leaf_right(struct btrfs_trans_handle *trans, struct btrfs_root</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return __push_leaf_right(path, min_data_size, empty,</div><div class='del'>-				right, free_space, left_nritems, min_slot);</div><div class='add'>+	return __push_leaf_right(trans, path, min_data_size, empty, right,</div><div class='add'>+				 free_space, left_nritems, min_slot);</div><div class='ctx'> out_unlock:</div><div class='ctx'> 	btrfs_tree_unlock(right);</div><div class='ctx'> 	free_extent_buffer(right);</div><div class='hunk'>@@ -2893,8 +3342,9 @@ out_unlock:</div><div class='ctx'>  * item at 'max_slot' won't be touched.  Use (u32)-1 to make us do all the</div><div class='ctx'>  * items</div><div class='ctx'>  */</div><div class='del'>-static noinline int __push_leaf_left(struct btrfs_path *path, int data_size,</div><div class='del'>-				     int empty, struct extent_buffer *left,</div><div class='add'>+static noinline int __push_leaf_left(struct btrfs_trans_handle *trans,</div><div class='add'>+				     struct btrfs_path *path, int data_size,</div><div class='add'>+				     bool empty, struct extent_buffer *left,</div><div class='ctx'> 				     int free_space, u32 right_nritems,</div><div class='ctx'> 				     u32 max_slot)</div><div class='ctx'> {</div><div class='hunk'>@@ -2904,13 +3354,11 @@ static noinline int __push_leaf_left(struct btrfs_path *path, int data_size,</div><div class='ctx'> 	int i;</div><div class='ctx'> 	int push_space = 0;</div><div class='ctx'> 	int push_items = 0;</div><div class='del'>-	struct btrfs_item *item;</div><div class='ctx'> 	u32 old_left_nritems;</div><div class='ctx'> 	u32 nr;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	u32 this_item_size;</div><div class='ctx'> 	u32 old_left_item_size;</div><div class='del'>-	struct btrfs_map_token token;</div><div class='ctx'> </div><div class='ctx'> 	if (empty)</div><div class='ctx'> 		nr = min(right_nritems, max_slot);</div><div class='hunk'>@@ -2918,8 +3366,6 @@ static noinline int __push_leaf_left(struct btrfs_path *path, int data_size,</div><div class='ctx'> 		nr = min(right_nritems - 1, max_slot);</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; nr; i++) {</div><div class='del'>-		item = btrfs_item_nr(i);</div><div class='del'>-</div><div class='ctx'> 		if (!empty &amp;&amp; push_items &gt; 0) {</div><div class='ctx'> 			if (path-&gt;slots[0] &lt; i)</div><div class='ctx'> 				break;</div><div class='hunk'>@@ -2934,12 +3380,13 @@ static noinline int __push_leaf_left(struct btrfs_path *path, int data_size,</div><div class='ctx'> 		if (path-&gt;slots[0] == i)</div><div class='ctx'> 			push_space += data_size;</div><div class='ctx'> </div><div class='del'>-		this_item_size = btrfs_item_size(right, item);</div><div class='del'>-		if (this_item_size + sizeof(*item) + push_space &gt; free_space)</div><div class='add'>+		this_item_size = btrfs_item_size(right, i);</div><div class='add'>+		if (this_item_size + sizeof(struct btrfs_item) + push_space &gt;</div><div class='add'>+		    free_space)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='ctx'> 		push_items++;</div><div class='del'>-		push_space += this_item_size + sizeof(*item);</div><div class='add'>+		push_space += this_item_size + sizeof(struct btrfs_item);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (push_items == 0) {</div><div class='hunk'>@@ -2949,79 +3396,68 @@ static noinline int __push_leaf_left(struct btrfs_path *path, int data_size,</div><div class='ctx'> 	WARN_ON(!empty &amp;&amp; push_items == btrfs_header_nritems(right));</div><div class='ctx'> </div><div class='ctx'> 	/* push data from right to left */</div><div class='del'>-	copy_extent_buffer(left, right,</div><div class='del'>-			   btrfs_item_nr_offset(btrfs_header_nritems(left)),</div><div class='del'>-			   btrfs_item_nr_offset(0),</div><div class='del'>-			   push_items * sizeof(struct btrfs_item));</div><div class='add'>+	copy_leaf_items(left, right, btrfs_header_nritems(left), 0, push_items);</div><div class='ctx'> </div><div class='ctx'> 	push_space = BTRFS_LEAF_DATA_SIZE(fs_info) -</div><div class='del'>-		     btrfs_item_offset_nr(right, push_items - 1);</div><div class='add'>+		     btrfs_item_offset(right, push_items - 1);</div><div class='ctx'> </div><div class='del'>-	copy_extent_buffer(left, right, BTRFS_LEAF_DATA_OFFSET +</div><div class='del'>-		     leaf_data_end(left) - push_space,</div><div class='del'>-		     BTRFS_LEAF_DATA_OFFSET +</div><div class='del'>-		     btrfs_item_offset_nr(right, push_items - 1),</div><div class='del'>-		     push_space);</div><div class='add'>+	copy_leaf_data(left, right, leaf_data_end(left) - push_space,</div><div class='add'>+		       btrfs_item_offset(right, push_items - 1), push_space);</div><div class='ctx'> 	old_left_nritems = btrfs_header_nritems(left);</div><div class='ctx'> 	BUG_ON(old_left_nritems &lt;= 0);</div><div class='ctx'> </div><div class='del'>-	btrfs_init_map_token(&amp;token, left);</div><div class='del'>-	old_left_item_size = btrfs_item_offset_nr(left, old_left_nritems - 1);</div><div class='add'>+	old_left_item_size = btrfs_item_offset(left, old_left_nritems - 1);</div><div class='ctx'> 	for (i = old_left_nritems; i &lt; old_left_nritems + push_items; i++) {</div><div class='ctx'> 		u32 ioff;</div><div class='ctx'> </div><div class='del'>-		item = btrfs_item_nr(i);</div><div class='del'>-</div><div class='del'>-		ioff = btrfs_token_item_offset(&amp;token, item);</div><div class='del'>-		btrfs_set_token_item_offset(&amp;token, item,</div><div class='add'>+		ioff = btrfs_item_offset(left, i);</div><div class='add'>+		btrfs_set_item_offset(left, i,</div><div class='ctx'> 		      ioff - (BTRFS_LEAF_DATA_SIZE(fs_info) - old_left_item_size));</div><div class='ctx'> 	}</div><div class='ctx'> 	btrfs_set_header_nritems(left, old_left_nritems + push_items);</div><div class='ctx'> </div><div class='ctx'> 	/* fixup right node */</div><div class='del'>-	if (push_items &gt; right_nritems)</div><div class='del'>-		WARN(1, KERN_CRIT "push items %d nr %u\n", push_items,</div><div class='del'>-		       right_nritems);</div><div class='add'>+	if (unlikely(push_items &gt; right_nritems)) {</div><div class='add'>+		ret = -EUCLEAN;</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		btrfs_crit(fs_info, "push items (%d) &gt; right leaf items (%u)",</div><div class='add'>+			   push_items, right_nritems);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (push_items &lt; right_nritems) {</div><div class='del'>-		push_space = btrfs_item_offset_nr(right, push_items - 1) -</div><div class='add'>+		push_space = btrfs_item_offset(right, push_items - 1) -</div><div class='ctx'> 						  leaf_data_end(right);</div><div class='del'>-		memmove_extent_buffer(right, BTRFS_LEAF_DATA_OFFSET +</div><div class='del'>-				      BTRFS_LEAF_DATA_SIZE(fs_info) - push_space,</div><div class='del'>-				      BTRFS_LEAF_DATA_OFFSET +</div><div class='del'>-				      leaf_data_end(right), push_space);</div><div class='add'>+		memmove_leaf_data(right,</div><div class='add'>+				  BTRFS_LEAF_DATA_SIZE(fs_info) - push_space,</div><div class='add'>+				  leaf_data_end(right), push_space);</div><div class='ctx'> </div><div class='del'>-		memmove_extent_buffer(right, btrfs_item_nr_offset(0),</div><div class='del'>-			      btrfs_item_nr_offset(push_items),</div><div class='del'>-			     (btrfs_header_nritems(right) - push_items) *</div><div class='del'>-			     sizeof(struct btrfs_item));</div><div class='add'>+		memmove_leaf_items(right, 0, push_items,</div><div class='add'>+				   btrfs_header_nritems(right) - push_items);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_init_map_token(&amp;token, right);</div><div class='ctx'> 	right_nritems -= push_items;</div><div class='ctx'> 	btrfs_set_header_nritems(right, right_nritems);</div><div class='ctx'> 	push_space = BTRFS_LEAF_DATA_SIZE(fs_info);</div><div class='ctx'> 	for (i = 0; i &lt; right_nritems; i++) {</div><div class='del'>-		item = btrfs_item_nr(i);</div><div class='del'>-</div><div class='del'>-		push_space = push_space - btrfs_token_item_size(&amp;token, item);</div><div class='del'>-		btrfs_set_token_item_offset(&amp;token, item, push_space);</div><div class='add'>+		push_space = push_space - btrfs_item_size(right, i);</div><div class='add'>+		btrfs_set_item_offset(right, i, push_space);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_mark_buffer_dirty(left);</div><div class='add'>+	btrfs_mark_buffer_dirty(trans, left);</div><div class='ctx'> 	if (right_nritems)</div><div class='del'>-		btrfs_mark_buffer_dirty(right);</div><div class='add'>+		btrfs_mark_buffer_dirty(trans, right);</div><div class='ctx'> 	else</div><div class='del'>-		btrfs_clean_tree_block(right);</div><div class='add'>+		btrfs_clear_buffer_dirty(trans, right);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_item_key(right, &amp;disk_key, 0);</div><div class='del'>-	fixup_low_keys(path, &amp;disk_key, 1);</div><div class='add'>+	fixup_low_keys(trans, path, &amp;disk_key, 1);</div><div class='ctx'> </div><div class='ctx'> 	/* then fixup the leaf pointer in the path */</div><div class='ctx'> 	if (path-&gt;slots[0] &lt; push_items) {</div><div class='ctx'> 		path-&gt;slots[0] += old_left_nritems;</div><div class='del'>-		btrfs_tree_unlock(path-&gt;nodes[0]);</div><div class='del'>-		free_extent_buffer(path-&gt;nodes[0]);</div><div class='add'>+		btrfs_tree_unlock(right);</div><div class='add'>+		free_extent_buffer(right);</div><div class='ctx'> 		path-&gt;nodes[0] = left;</div><div class='ctx'> 		path-&gt;slots[1] -= 1;</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -3069,14 +3505,10 @@ static int push_leaf_left(struct btrfs_trans_handle *trans, struct btrfs_root</div><div class='ctx'> 	btrfs_assert_tree_write_locked(path-&gt;nodes[1]);</div><div class='ctx'> </div><div class='ctx'> 	left = btrfs_read_node_slot(path-&gt;nodes[1], slot - 1);</div><div class='del'>-	/*</div><div class='del'>-	 * slot - 1 is not valid or we fail to read the left node,</div><div class='del'>-	 * no big deal, just return.</div><div class='del'>-	 */</div><div class='ctx'> 	if (IS_ERR(left))</div><div class='del'>-		return 1;</div><div class='add'>+		return PTR_ERR(left);</div><div class='ctx'> </div><div class='del'>-	__btrfs_tree_lock(left, BTRFS_NESTING_LEFT);</div><div class='add'>+	btrfs_tree_lock_nested(left, BTRFS_NESTING_LEFT);</div><div class='ctx'> </div><div class='ctx'> 	free_space = btrfs_leaf_free_space(left);</div><div class='ctx'> 	if (free_space &lt; data_size) {</div><div class='hunk'>@@ -3084,7 +3516,6 @@ static int push_leaf_left(struct btrfs_trans_handle *trans, struct btrfs_root</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* cow and double check */</div><div class='ctx'> 	ret = btrfs_cow_block(trans, root, left,</div><div class='ctx'> 			      path-&gt;nodes[1], slot - 1, &amp;left,</div><div class='ctx'> 			      BTRFS_NESTING_LEFT_COW);</div><div class='hunk'>@@ -3095,19 +3526,13 @@ static int push_leaf_left(struct btrfs_trans_handle *trans, struct btrfs_root</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	free_space = btrfs_leaf_free_space(left);</div><div class='del'>-	if (free_space &lt; data_size) {</div><div class='del'>-		ret = 1;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (check_sibling_keys(left, right)) {</div><div class='add'>+	if (unlikely(check_sibling_keys(left, right))) {</div><div class='ctx'> 		ret = -EUCLEAN;</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	return __push_leaf_left(path, min_data_size,</div><div class='del'>-			       empty, left, free_space, right_nritems,</div><div class='del'>-			       max_slot);</div><div class='add'>+	return __push_leaf_left(trans, path, min_data_size, empty, left,</div><div class='add'>+				free_space, right_nritems, max_slot);</div><div class='ctx'> out:</div><div class='ctx'> 	btrfs_tree_unlock(left);</div><div class='ctx'> 	free_extent_buffer(left);</div><div class='hunk'>@@ -3118,49 +3543,45 @@ out:</div><div class='ctx'>  * split the path's leaf in two, making sure there is at least data_size</div><div class='ctx'>  * available for the resulting leaf level of the path.</div><div class='ctx'>  */</div><div class='del'>-static noinline void copy_for_split(struct btrfs_trans_handle *trans,</div><div class='del'>-				    struct btrfs_path *path,</div><div class='del'>-				    struct extent_buffer *l,</div><div class='del'>-				    struct extent_buffer *right,</div><div class='del'>-				    int slot, int mid, int nritems)</div><div class='add'>+static noinline int copy_for_split(struct btrfs_trans_handle *trans,</div><div class='add'>+				   struct btrfs_path *path,</div><div class='add'>+				   struct extent_buffer *l,</div><div class='add'>+				   struct extent_buffer *right,</div><div class='add'>+				   int slot, int mid, int nritems)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	int data_copy_size;</div><div class='ctx'> 	int rt_data_off;</div><div class='ctx'> 	int i;</div><div class='add'>+	int ret;</div><div class='ctx'> 	struct btrfs_disk_key disk_key;</div><div class='del'>-	struct btrfs_map_token token;</div><div class='ctx'> </div><div class='ctx'> 	nritems = nritems - mid;</div><div class='ctx'> 	btrfs_set_header_nritems(right, nritems);</div><div class='del'>-	data_copy_size = btrfs_item_end_nr(l, mid) - leaf_data_end(l);</div><div class='add'>+	data_copy_size = btrfs_item_data_end(l, mid) - leaf_data_end(l);</div><div class='ctx'> </div><div class='del'>-	copy_extent_buffer(right, l, btrfs_item_nr_offset(0),</div><div class='del'>-			   btrfs_item_nr_offset(mid),</div><div class='del'>-			   nritems * sizeof(struct btrfs_item));</div><div class='add'>+	copy_leaf_items(right, l, 0, mid, nritems);</div><div class='ctx'> </div><div class='del'>-	copy_extent_buffer(right, l,</div><div class='del'>-		     BTRFS_LEAF_DATA_OFFSET + BTRFS_LEAF_DATA_SIZE(fs_info) -</div><div class='del'>-		     data_copy_size, BTRFS_LEAF_DATA_OFFSET +</div><div class='del'>-		     leaf_data_end(l), data_copy_size);</div><div class='add'>+	copy_leaf_data(right, l, BTRFS_LEAF_DATA_SIZE(fs_info) - data_copy_size,</div><div class='add'>+		       leaf_data_end(l), data_copy_size);</div><div class='ctx'> </div><div class='del'>-	rt_data_off = BTRFS_LEAF_DATA_SIZE(fs_info) - btrfs_item_end_nr(l, mid);</div><div class='add'>+	rt_data_off = BTRFS_LEAF_DATA_SIZE(fs_info) - btrfs_item_data_end(l, mid);</div><div class='ctx'> </div><div class='del'>-	btrfs_init_map_token(&amp;token, right);</div><div class='ctx'> 	for (i = 0; i &lt; nritems; i++) {</div><div class='del'>-		struct btrfs_item *item = btrfs_item_nr(i);</div><div class='ctx'> 		u32 ioff;</div><div class='ctx'> </div><div class='del'>-		ioff = btrfs_token_item_offset(&amp;token, item);</div><div class='del'>-		btrfs_set_token_item_offset(&amp;token, item, ioff + rt_data_off);</div><div class='add'>+		ioff = btrfs_item_offset(right, i);</div><div class='add'>+		btrfs_set_item_offset(right, i, ioff + rt_data_off);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	btrfs_set_header_nritems(l, mid);</div><div class='ctx'> 	btrfs_item_key(right, &amp;disk_key, 0);</div><div class='del'>-	insert_ptr(trans, path, &amp;disk_key, right-&gt;start, path-&gt;slots[1] + 1, 1);</div><div class='add'>+	ret = insert_ptr(trans, path, &amp;disk_key, right-&gt;start, path-&gt;slots[1] + 1, 1);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	btrfs_mark_buffer_dirty(right);</div><div class='del'>-	btrfs_mark_buffer_dirty(l);</div><div class='add'>+	btrfs_mark_buffer_dirty(trans, right);</div><div class='add'>+	btrfs_mark_buffer_dirty(trans, l);</div><div class='ctx'> 	BUG_ON(path-&gt;slots[0] != slot);</div><div class='ctx'> </div><div class='ctx'> 	if (mid &lt;= slot) {</div><div class='hunk'>@@ -3175,6 +3596,8 @@ static noinline void copy_for_split(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(path-&gt;slots[0] &lt; 0);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -3251,7 +3674,7 @@ static noinline int split_leaf(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			       struct btrfs_root *root,</div><div class='ctx'> 			       const struct btrfs_key *ins_key,</div><div class='ctx'> 			       struct btrfs_path *path, int data_size,</div><div class='del'>-			       int extend)</div><div class='add'>+			       bool extend)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_disk_key disk_key;</div><div class='ctx'> 	struct extent_buffer *l;</div><div class='hunk'>@@ -3268,7 +3691,7 @@ static noinline int split_leaf(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	l = path-&gt;nodes[0];</div><div class='ctx'> 	slot = path-&gt;slots[0];</div><div class='del'>-	if (extend &amp;&amp; data_size + btrfs_item_size_nr(l, slot) +</div><div class='add'>+	if (extend &amp;&amp; data_size + btrfs_item_size(l, slot) +</div><div class='ctx'> 	    sizeof(struct btrfs_item) &gt; BTRFS_LEAF_DATA_SIZE(fs_info))</div><div class='ctx'> 		return -EOVERFLOW;</div><div class='ctx'> </div><div class='hunk'>@@ -3361,20 +3784,25 @@ again:</div><div class='ctx'> 	 * BTRFS_NESTING_SPLIT_THE_SPLITTENING if we need to, but for now just</div><div class='ctx'> 	 * use BTRFS_NESTING_NEW_ROOT.</div><div class='ctx'> 	 */</div><div class='del'>-	right = btrfs_alloc_tree_block(trans, root, 0, root-&gt;root_key.objectid,</div><div class='del'>-				       &amp;disk_key, 0, l-&gt;start, 0,</div><div class='add'>+	right = btrfs_alloc_tree_block(trans, root, 0, btrfs_root_id(root),</div><div class='add'>+				       &amp;disk_key, 0, l-&gt;start, 0, 0,</div><div class='ctx'> 				       num_doubles ? BTRFS_NESTING_NEW_ROOT :</div><div class='ctx'> 				       BTRFS_NESTING_SPLIT);</div><div class='ctx'> 	if (IS_ERR(right))</div><div class='ctx'> 		return PTR_ERR(right);</div><div class='ctx'> </div><div class='del'>-	root_add_used(root, fs_info-&gt;nodesize);</div><div class='add'>+	root_add_used_bytes(root);</div><div class='ctx'> </div><div class='ctx'> 	if (split == 0) {</div><div class='ctx'> 		if (mid &lt;= slot) {</div><div class='ctx'> 			btrfs_set_header_nritems(right, 0);</div><div class='del'>-			insert_ptr(trans, path, &amp;disk_key,</div><div class='del'>-				   right-&gt;start, path-&gt;slots[1] + 1, 1);</div><div class='add'>+			ret = insert_ptr(trans, path, &amp;disk_key,</div><div class='add'>+					 right-&gt;start, path-&gt;slots[1] + 1, 1);</div><div class='add'>+			if (ret &lt; 0) {</div><div class='add'>+				btrfs_tree_unlock(right);</div><div class='add'>+				free_extent_buffer(right);</div><div class='add'>+				return ret;</div><div class='add'>+			}</div><div class='ctx'> 			btrfs_tree_unlock(path-&gt;nodes[0]);</div><div class='ctx'> 			free_extent_buffer(path-&gt;nodes[0]);</div><div class='ctx'> 			path-&gt;nodes[0] = right;</div><div class='hunk'>@@ -3382,14 +3810,19 @@ again:</div><div class='ctx'> 			path-&gt;slots[1] += 1;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			btrfs_set_header_nritems(right, 0);</div><div class='del'>-			insert_ptr(trans, path, &amp;disk_key,</div><div class='del'>-				   right-&gt;start, path-&gt;slots[1], 1);</div><div class='add'>+			ret = insert_ptr(trans, path, &amp;disk_key,</div><div class='add'>+					 right-&gt;start, path-&gt;slots[1], 1);</div><div class='add'>+			if (ret &lt; 0) {</div><div class='add'>+				btrfs_tree_unlock(right);</div><div class='add'>+				free_extent_buffer(right);</div><div class='add'>+				return ret;</div><div class='add'>+			}</div><div class='ctx'> 			btrfs_tree_unlock(path-&gt;nodes[0]);</div><div class='ctx'> 			free_extent_buffer(path-&gt;nodes[0]);</div><div class='ctx'> 			path-&gt;nodes[0] = right;</div><div class='ctx'> 			path-&gt;slots[0] = 0;</div><div class='ctx'> 			if (path-&gt;slots[1] == 0)</div><div class='del'>-				fixup_low_keys(path, &amp;disk_key, 1);</div><div class='add'>+				fixup_low_keys(trans, path, &amp;disk_key, 1);</div><div class='ctx'> 		}</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We create a new leaf 'right' for the required ins_len and</div><div class='hunk'>@@ -3399,7 +3832,12 @@ again:</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	copy_for_split(trans, path, l, right, slot, mid, nritems);</div><div class='add'>+	ret = copy_for_split(trans, path, l, right, slot, mid, nritems);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		btrfs_tree_unlock(right);</div><div class='add'>+		free_extent_buffer(right);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (split == 2) {</div><div class='ctx'> 		BUG_ON(num_doubles != 0);</div><div class='hunk'>@@ -3432,12 +3870,13 @@ static noinline int setup_leaf_for_split(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	btrfs_item_key_to_cpu(leaf, &amp;key, path-&gt;slots[0]);</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(key.type != BTRFS_EXTENT_DATA_KEY &amp;&amp;</div><div class='add'>+	       key.type != BTRFS_RAID_STRIPE_KEY &amp;&amp;</div><div class='ctx'> 	       key.type != BTRFS_EXTENT_CSUM_KEY);</div><div class='ctx'> </div><div class='ctx'> 	if (btrfs_leaf_free_space(leaf) &gt;= ins_len)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	item_size = btrfs_item_size_nr(leaf, path-&gt;slots[0]);</div><div class='add'>+	item_size = btrfs_item_size(leaf, path-&gt;slots[0]);</div><div class='ctx'> 	if (key.type == BTRFS_EXTENT_DATA_KEY) {</div><div class='ctx'> 		fi = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='ctx'> 				    struct btrfs_file_extent_item);</div><div class='hunk'>@@ -3445,10 +3884,10 @@ static noinline int setup_leaf_for_split(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	}</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='del'>-	path-&gt;keep_locks = 1;</div><div class='del'>-	path-&gt;search_for_split = 1;</div><div class='add'>+	path-&gt;keep_locks = true;</div><div class='add'>+	path-&gt;search_for_split = true;</div><div class='ctx'> 	ret = btrfs_search_slot(trans, root, &amp;key, path, 0, 1);</div><div class='del'>-	path-&gt;search_for_split = 0;</div><div class='add'>+	path-&gt;search_for_split = false;</div><div class='ctx'> 	if (ret &gt; 0)</div><div class='ctx'> 		ret = -EAGAIN;</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='hunk'>@@ -3457,7 +3896,7 @@ static noinline int setup_leaf_for_split(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	ret = -EAGAIN;</div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	/* if our item isn't there, return now */</div><div class='del'>-	if (item_size != btrfs_item_size_nr(leaf, path-&gt;slots[0]))</div><div class='add'>+	if (item_size != btrfs_item_size(leaf, path-&gt;slots[0]))</div><div class='ctx'> 		goto err;</div><div class='ctx'> </div><div class='ctx'> 	/* the leaf has  changed, it now has room.  return now */</div><div class='hunk'>@@ -3475,22 +3914,21 @@ static noinline int setup_leaf_for_split(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto err;</div><div class='ctx'> </div><div class='del'>-	path-&gt;keep_locks = 0;</div><div class='add'>+	path-&gt;keep_locks = false;</div><div class='ctx'> 	btrfs_unlock_up_safe(path, 1);</div><div class='ctx'> 	return 0;</div><div class='ctx'> err:</div><div class='del'>-	path-&gt;keep_locks = 0;</div><div class='add'>+	path-&gt;keep_locks = false;</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline int split_item(struct btrfs_path *path,</div><div class='add'>+static noinline int split_item(struct btrfs_trans_handle *trans,</div><div class='add'>+			       struct btrfs_path *path,</div><div class='ctx'> 			       const struct btrfs_key *new_key,</div><div class='ctx'> 			       unsigned long split_offset)</div><div class='ctx'> {</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='del'>-	struct btrfs_item *item;</div><div class='del'>-	struct btrfs_item *new_item;</div><div class='del'>-	int slot;</div><div class='add'>+	int orig_slot, slot;</div><div class='ctx'> 	char *buf;</div><div class='ctx'> 	u32 nritems;</div><div class='ctx'> 	u32 item_size;</div><div class='hunk'>@@ -3498,11 +3936,16 @@ static noinline int split_item(struct btrfs_path *path,</div><div class='ctx'> 	struct btrfs_disk_key disk_key;</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='del'>-	BUG_ON(btrfs_leaf_free_space(leaf) &lt; sizeof(struct btrfs_item));</div><div class='add'>+	/*</div><div class='add'>+	 * Shouldn't happen because the caller must have previously called</div><div class='add'>+	 * setup_leaf_for_split() to make room for the new item in the leaf.</div><div class='add'>+	 */</div><div class='add'>+	if (WARN_ON(btrfs_leaf_free_space(leaf) &lt; sizeof(struct btrfs_item)))</div><div class='add'>+		return -ENOSPC;</div><div class='ctx'> </div><div class='del'>-	item = btrfs_item_nr(path-&gt;slots[0]);</div><div class='del'>-	orig_offset = btrfs_item_offset(leaf, item);</div><div class='del'>-	item_size = btrfs_item_size(leaf, item);</div><div class='add'>+	orig_slot = path-&gt;slots[0];</div><div class='add'>+	orig_offset = btrfs_item_offset(leaf, path-&gt;slots[0]);</div><div class='add'>+	item_size = btrfs_item_size(leaf, path-&gt;slots[0]);</div><div class='ctx'> </div><div class='ctx'> 	buf = kmalloc(item_size, GFP_NOFS);</div><div class='ctx'> 	if (!buf)</div><div class='hunk'>@@ -3515,22 +3958,18 @@ static noinline int split_item(struct btrfs_path *path,</div><div class='ctx'> 	nritems = btrfs_header_nritems(leaf);</div><div class='ctx'> 	if (slot != nritems) {</div><div class='ctx'> 		/* shift the items */</div><div class='del'>-		memmove_extent_buffer(leaf, btrfs_item_nr_offset(slot + 1),</div><div class='del'>-				btrfs_item_nr_offset(slot),</div><div class='del'>-				(nritems - slot) * sizeof(struct btrfs_item));</div><div class='add'>+		memmove_leaf_items(leaf, slot + 1, slot, nritems - slot);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	btrfs_cpu_key_to_disk(&amp;disk_key, new_key);</div><div class='ctx'> 	btrfs_set_item_key(leaf, &amp;disk_key, slot);</div><div class='ctx'> </div><div class='del'>-	new_item = btrfs_item_nr(slot);</div><div class='del'>-</div><div class='del'>-	btrfs_set_item_offset(leaf, new_item, orig_offset);</div><div class='del'>-	btrfs_set_item_size(leaf, new_item, item_size - split_offset);</div><div class='add'>+	btrfs_set_item_offset(leaf, slot, orig_offset);</div><div class='add'>+	btrfs_set_item_size(leaf, slot, item_size - split_offset);</div><div class='ctx'> </div><div class='del'>-	btrfs_set_item_offset(leaf, item,</div><div class='del'>-			      orig_offset + item_size - split_offset);</div><div class='del'>-	btrfs_set_item_size(leaf, item, split_offset);</div><div class='add'>+	btrfs_set_item_offset(leaf, orig_slot,</div><div class='add'>+				 orig_offset + item_size - split_offset);</div><div class='add'>+	btrfs_set_item_size(leaf, orig_slot, split_offset);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_set_header_nritems(leaf, nritems + 1);</div><div class='ctx'> </div><div class='hunk'>@@ -3543,7 +3982,7 @@ static noinline int split_item(struct btrfs_path *path,</div><div class='ctx'> 	write_extent_buffer(leaf, buf + split_offset,</div><div class='ctx'> 			    btrfs_item_ptr_offset(leaf, slot),</div><div class='ctx'> 			    item_size - split_offset);</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='add'>+	btrfs_mark_buffer_dirty(trans, leaf);</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(btrfs_leaf_free_space(leaf) &lt; 0);</div><div class='ctx'> 	kfree(buf);</div><div class='hunk'>@@ -3577,7 +4016,7 @@ int btrfs_split_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	ret = split_item(path, new_key, split_offset);</div><div class='add'>+	ret = split_item(trans, path, new_key, split_offset);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3587,30 +4026,29 @@ int btrfs_split_item(struct btrfs_trans_handle *trans,</div><div class='ctx'>  * off the end of the item or if we shift the item to chop bytes off</div><div class='ctx'>  * the front.</div><div class='ctx'>  */</div><div class='del'>-void btrfs_truncate_item(struct btrfs_path *path, u32 new_size, int from_end)</div><div class='add'>+void btrfs_truncate_item(struct btrfs_trans_handle *trans,</div><div class='add'>+			 const struct btrfs_path *path, u32 new_size, int from_end)</div><div class='ctx'> {</div><div class='ctx'> 	int slot;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='del'>-	struct btrfs_item *item;</div><div class='ctx'> 	u32 nritems;</div><div class='ctx'> 	unsigned int data_end;</div><div class='ctx'> 	unsigned int old_data_start;</div><div class='ctx'> 	unsigned int old_size;</div><div class='ctx'> 	unsigned int size_diff;</div><div class='ctx'> 	int i;</div><div class='del'>-	struct btrfs_map_token token;</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	slot = path-&gt;slots[0];</div><div class='ctx'> </div><div class='del'>-	old_size = btrfs_item_size_nr(leaf, slot);</div><div class='add'>+	old_size = btrfs_item_size(leaf, slot);</div><div class='ctx'> 	if (old_size == new_size)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	nritems = btrfs_header_nritems(leaf);</div><div class='ctx'> 	data_end = leaf_data_end(leaf);</div><div class='ctx'> </div><div class='del'>-	old_data_start = btrfs_item_offset_nr(leaf, slot);</div><div class='add'>+	old_data_start = btrfs_item_offset(leaf, slot);</div><div class='ctx'> </div><div class='ctx'> 	size_diff = old_size - new_size;</div><div class='ctx'> </div><div class='hunk'>@@ -3621,20 +4059,17 @@ void btrfs_truncate_item(struct btrfs_path *path, u32 new_size, int from_end)</div><div class='ctx'> 	 * item0..itemN ... dataN.offset..dataN.size .. data0.size</div><div class='ctx'> 	 */</div><div class='ctx'> 	/* first correct the data pointers */</div><div class='del'>-	btrfs_init_map_token(&amp;token, leaf);</div><div class='ctx'> 	for (i = slot; i &lt; nritems; i++) {</div><div class='ctx'> 		u32 ioff;</div><div class='del'>-		item = btrfs_item_nr(i);</div><div class='ctx'> </div><div class='del'>-		ioff = btrfs_token_item_offset(&amp;token, item);</div><div class='del'>-		btrfs_set_token_item_offset(&amp;token, item, ioff + size_diff);</div><div class='add'>+		ioff = btrfs_item_offset(leaf, i);</div><div class='add'>+		btrfs_set_item_offset(leaf, i, ioff + size_diff);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* shift the data */</div><div class='ctx'> 	if (from_end) {</div><div class='del'>-		memmove_extent_buffer(leaf, BTRFS_LEAF_DATA_OFFSET +</div><div class='del'>-			      data_end + size_diff, BTRFS_LEAF_DATA_OFFSET +</div><div class='del'>-			      data_end, old_data_start + new_size - data_end);</div><div class='add'>+		memmove_leaf_data(leaf, data_end + size_diff, data_end,</div><div class='add'>+				  old_data_start + new_size - data_end);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		struct btrfs_disk_key disk_key;</div><div class='ctx'> 		u64 offset;</div><div class='hunk'>@@ -3659,22 +4094,20 @@ void btrfs_truncate_item(struct btrfs_path *path, u32 new_size, int from_end)</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		memmove_extent_buffer(leaf, BTRFS_LEAF_DATA_OFFSET +</div><div class='del'>-			      data_end + size_diff, BTRFS_LEAF_DATA_OFFSET +</div><div class='del'>-			      data_end, old_data_start - data_end);</div><div class='add'>+		memmove_leaf_data(leaf, data_end + size_diff, data_end,</div><div class='add'>+				  old_data_start - data_end);</div><div class='ctx'> </div><div class='ctx'> 		offset = btrfs_disk_key_offset(&amp;disk_key);</div><div class='ctx'> 		btrfs_set_disk_key_offset(&amp;disk_key, offset + size_diff);</div><div class='ctx'> 		btrfs_set_item_key(leaf, &amp;disk_key, slot);</div><div class='ctx'> 		if (slot == 0)</div><div class='del'>-			fixup_low_keys(path, &amp;disk_key, 1);</div><div class='add'>+			fixup_low_keys(trans, path, &amp;disk_key, 1);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	item = btrfs_item_nr(slot);</div><div class='del'>-	btrfs_set_item_size(leaf, item, new_size);</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='add'>+	btrfs_set_item_size(leaf, slot, new_size);</div><div class='add'>+	btrfs_mark_buffer_dirty(trans, leaf);</div><div class='ctx'> </div><div class='del'>-	if (btrfs_leaf_free_space(leaf) &lt; 0) {</div><div class='add'>+	if (unlikely(btrfs_leaf_free_space(leaf) &lt; 0)) {</div><div class='ctx'> 		btrfs_print_leaf(leaf);</div><div class='ctx'> 		BUG();</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3683,32 +4116,31 @@ void btrfs_truncate_item(struct btrfs_path *path, u32 new_size, int from_end)</div><div class='ctx'> /*</div><div class='ctx'>  * make the item pointed to by the path bigger, data_size is the added size.</div><div class='ctx'>  */</div><div class='del'>-void btrfs_extend_item(struct btrfs_path *path, u32 data_size)</div><div class='add'>+void btrfs_extend_item(struct btrfs_trans_handle *trans,</div><div class='add'>+		       const struct btrfs_path *path, u32 data_size)</div><div class='ctx'> {</div><div class='ctx'> 	int slot;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='del'>-	struct btrfs_item *item;</div><div class='ctx'> 	u32 nritems;</div><div class='ctx'> 	unsigned int data_end;</div><div class='ctx'> 	unsigned int old_data;</div><div class='ctx'> 	unsigned int old_size;</div><div class='ctx'> 	int i;</div><div class='del'>-	struct btrfs_map_token token;</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> </div><div class='ctx'> 	nritems = btrfs_header_nritems(leaf);</div><div class='ctx'> 	data_end = leaf_data_end(leaf);</div><div class='ctx'> </div><div class='del'>-	if (btrfs_leaf_free_space(leaf) &lt; data_size) {</div><div class='add'>+	if (unlikely(btrfs_leaf_free_space(leaf) &lt; data_size)) {</div><div class='ctx'> 		btrfs_print_leaf(leaf);</div><div class='ctx'> 		BUG();</div><div class='ctx'> 	}</div><div class='ctx'> 	slot = path-&gt;slots[0];</div><div class='del'>-	old_data = btrfs_item_end_nr(leaf, slot);</div><div class='add'>+	old_data = btrfs_item_data_end(leaf, slot);</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(slot &lt; 0);</div><div class='del'>-	if (slot &gt;= nritems) {</div><div class='add'>+	if (unlikely(slot &gt;= nritems)) {</div><div class='ctx'> 		btrfs_print_leaf(leaf);</div><div class='ctx'> 		btrfs_crit(leaf-&gt;fs_info, "slot %d too large, nritems %d",</div><div class='ctx'> 			   slot, nritems);</div><div class='hunk'>@@ -3719,53 +4151,49 @@ void btrfs_extend_item(struct btrfs_path *path, u32 data_size)</div><div class='ctx'> 	 * item0..itemN ... dataN.offset..dataN.size .. data0.size</div><div class='ctx'> 	 */</div><div class='ctx'> 	/* first correct the data pointers */</div><div class='del'>-	btrfs_init_map_token(&amp;token, leaf);</div><div class='ctx'> 	for (i = slot; i &lt; nritems; i++) {</div><div class='ctx'> 		u32 ioff;</div><div class='del'>-		item = btrfs_item_nr(i);</div><div class='ctx'> </div><div class='del'>-		ioff = btrfs_token_item_offset(&amp;token, item);</div><div class='del'>-		btrfs_set_token_item_offset(&amp;token, item, ioff - data_size);</div><div class='add'>+		ioff = btrfs_item_offset(leaf, i);</div><div class='add'>+		btrfs_set_item_offset(leaf, i, ioff - data_size);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* shift the data */</div><div class='del'>-	memmove_extent_buffer(leaf, BTRFS_LEAF_DATA_OFFSET +</div><div class='del'>-		      data_end - data_size, BTRFS_LEAF_DATA_OFFSET +</div><div class='del'>-		      data_end, old_data - data_end);</div><div class='add'>+	memmove_leaf_data(leaf, data_end - data_size, data_end,</div><div class='add'>+			  old_data - data_end);</div><div class='ctx'> </div><div class='del'>-	data_end = old_data;</div><div class='del'>-	old_size = btrfs_item_size_nr(leaf, slot);</div><div class='del'>-	item = btrfs_item_nr(slot);</div><div class='del'>-	btrfs_set_item_size(leaf, item, old_size + data_size);</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='add'>+	old_size = btrfs_item_size(leaf, slot);</div><div class='add'>+	btrfs_set_item_size(leaf, slot, old_size + data_size);</div><div class='add'>+	btrfs_mark_buffer_dirty(trans, leaf);</div><div class='ctx'> </div><div class='del'>-	if (btrfs_leaf_free_space(leaf) &lt; 0) {</div><div class='add'>+	if (unlikely(btrfs_leaf_free_space(leaf) &lt; 0)) {</div><div class='ctx'> 		btrfs_print_leaf(leaf);</div><div class='ctx'> 		BUG();</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * setup_items_for_insert - Helper called before inserting one or more items</div><div class='del'>- * to a leaf. Main purpose is to save stack depth by doing the bulk of the work</div><div class='del'>- * in a function that doesn't call btrfs_search_slot</div><div class='add'>+/*</div><div class='add'>+ * Make space in the node before inserting one or more items.</div><div class='ctx'>  *</div><div class='add'>+ * @trans:	transaction handle</div><div class='ctx'>  * @root:	root we are inserting items to</div><div class='ctx'>  * @path:	points to the leaf/slot where we are going to insert new items</div><div class='ctx'>  * @batch:      information about the batch of items to insert</div><div class='add'>+ *</div><div class='add'>+ * Main purpose is to save stack depth by doing the bulk of the work in a</div><div class='add'>+ * function that doesn't call btrfs_search_slot</div><div class='ctx'>  */</div><div class='del'>-static void setup_items_for_insert(struct btrfs_root *root, struct btrfs_path *path,</div><div class='add'>+static void setup_items_for_insert(struct btrfs_trans_handle *trans,</div><div class='add'>+				   struct btrfs_root *root, struct btrfs_path *path,</div><div class='ctx'> 				   const struct btrfs_item_batch *batch)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='del'>-	struct btrfs_item *item;</div><div class='ctx'> 	int i;</div><div class='ctx'> 	u32 nritems;</div><div class='ctx'> 	unsigned int data_end;</div><div class='ctx'> 	struct btrfs_disk_key disk_key;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	int slot;</div><div class='del'>-	struct btrfs_map_token token;</div><div class='ctx'> 	u32 total_size;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -3775,7 +4203,7 @@ static void setup_items_for_insert(struct btrfs_root *root, struct btrfs_path *p</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (path-&gt;slots[0] == 0) {</div><div class='ctx'> 		btrfs_cpu_key_to_disk(&amp;disk_key, &amp;batch-&gt;keys[0]);</div><div class='del'>-		fixup_low_keys(path, &amp;disk_key, 1);</div><div class='add'>+		fixup_low_keys(trans, path, &amp;disk_key, 1);</div><div class='ctx'> 	}</div><div class='ctx'> 	btrfs_unlock_up_safe(path, 1);</div><div class='ctx'> </div><div class='hunk'>@@ -3786,18 +4214,17 @@ static void setup_items_for_insert(struct btrfs_root *root, struct btrfs_path *p</div><div class='ctx'> 	data_end = leaf_data_end(leaf);</div><div class='ctx'> 	total_size = batch-&gt;total_data_size + (batch-&gt;nr * sizeof(struct btrfs_item));</div><div class='ctx'> </div><div class='del'>-	if (btrfs_leaf_free_space(leaf) &lt; total_size) {</div><div class='add'>+	if (unlikely(btrfs_leaf_free_space(leaf) &lt; total_size)) {</div><div class='ctx'> 		btrfs_print_leaf(leaf);</div><div class='ctx'> 		btrfs_crit(fs_info, "not enough freespace need %u have %d",</div><div class='ctx'> 			   total_size, btrfs_leaf_free_space(leaf));</div><div class='ctx'> 		BUG();</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_init_map_token(&amp;token, leaf);</div><div class='ctx'> 	if (slot != nritems) {</div><div class='del'>-		unsigned int old_data = btrfs_item_end_nr(leaf, slot);</div><div class='add'>+		unsigned int old_data = btrfs_item_data_end(leaf, slot);</div><div class='ctx'> </div><div class='del'>-		if (old_data &lt; data_end) {</div><div class='add'>+		if (unlikely(old_data &lt; data_end)) {</div><div class='ctx'> 			btrfs_print_leaf(leaf);</div><div class='ctx'> 			btrfs_crit(fs_info,</div><div class='ctx'> 		"item at slot %d with data offset %u beyond data end of leaf %u",</div><div class='hunk'>@@ -3811,21 +4238,16 @@ static void setup_items_for_insert(struct btrfs_root *root, struct btrfs_path *p</div><div class='ctx'> 		for (i = slot; i &lt; nritems; i++) {</div><div class='ctx'> 			u32 ioff;</div><div class='ctx'> </div><div class='del'>-			item = btrfs_item_nr(i);</div><div class='del'>-			ioff = btrfs_token_item_offset(&amp;token, item);</div><div class='del'>-			btrfs_set_token_item_offset(&amp;token, item,</div><div class='del'>-						    ioff - batch-&gt;total_data_size);</div><div class='add'>+			ioff = btrfs_item_offset(leaf, i);</div><div class='add'>+			btrfs_set_item_offset(leaf, i,</div><div class='add'>+						       ioff - batch-&gt;total_data_size);</div><div class='ctx'> 		}</div><div class='ctx'> 		/* shift the items */</div><div class='del'>-		memmove_extent_buffer(leaf, btrfs_item_nr_offset(slot + batch-&gt;nr),</div><div class='del'>-			      btrfs_item_nr_offset(slot),</div><div class='del'>-			      (nritems - slot) * sizeof(struct btrfs_item));</div><div class='add'>+		memmove_leaf_items(leaf, slot + batch-&gt;nr, slot, nritems - slot);</div><div class='ctx'> </div><div class='ctx'> 		/* shift the data */</div><div class='del'>-		memmove_extent_buffer(leaf, BTRFS_LEAF_DATA_OFFSET +</div><div class='del'>-				      data_end - batch-&gt;total_data_size,</div><div class='del'>-				      BTRFS_LEAF_DATA_OFFSET + data_end,</div><div class='del'>-				      old_data - data_end);</div><div class='add'>+		memmove_leaf_data(leaf, data_end - batch-&gt;total_data_size,</div><div class='add'>+				  data_end, old_data - data_end);</div><div class='ctx'> 		data_end = old_data;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -3833,16 +4255,15 @@ static void setup_items_for_insert(struct btrfs_root *root, struct btrfs_path *p</div><div class='ctx'> 	for (i = 0; i &lt; batch-&gt;nr; i++) {</div><div class='ctx'> 		btrfs_cpu_key_to_disk(&amp;disk_key, &amp;batch-&gt;keys[i]);</div><div class='ctx'> 		btrfs_set_item_key(leaf, &amp;disk_key, slot + i);</div><div class='del'>-		item = btrfs_item_nr(slot + i);</div><div class='ctx'> 		data_end -= batch-&gt;data_sizes[i];</div><div class='del'>-		btrfs_set_token_item_offset(&amp;token, item, data_end);</div><div class='del'>-		btrfs_set_token_item_size(&amp;token, item, batch-&gt;data_sizes[i]);</div><div class='add'>+		btrfs_set_item_offset(leaf, slot + i, data_end);</div><div class='add'>+		btrfs_set_item_size(leaf, slot + i, batch-&gt;data_sizes[i]);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	btrfs_set_header_nritems(leaf, nritems + batch-&gt;nr);</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='add'>+	btrfs_mark_buffer_dirty(trans, leaf);</div><div class='ctx'> </div><div class='del'>-	if (btrfs_leaf_free_space(leaf) &lt; 0) {</div><div class='add'>+	if (unlikely(btrfs_leaf_free_space(leaf) &lt; 0)) {</div><div class='ctx'> 		btrfs_print_leaf(leaf);</div><div class='ctx'> 		BUG();</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3851,12 +4272,14 @@ static void setup_items_for_insert(struct btrfs_root *root, struct btrfs_path *p</div><div class='ctx'> /*</div><div class='ctx'>  * Insert a new item into a leaf.</div><div class='ctx'>  *</div><div class='add'>+ * @trans:     Transaction handle.</div><div class='ctx'>  * @root:      The root of the btree.</div><div class='ctx'>  * @path:      A path pointing to the target leaf and slot.</div><div class='ctx'>  * @key:       The key of the new item.</div><div class='ctx'>  * @data_size: The size of the data associated with the new key.</div><div class='ctx'>  */</div><div class='del'>-void btrfs_setup_item_for_insert(struct btrfs_root *root,</div><div class='add'>+void btrfs_setup_item_for_insert(struct btrfs_trans_handle *trans,</div><div class='add'>+				 struct btrfs_root *root,</div><div class='ctx'> 				 struct btrfs_path *path,</div><div class='ctx'> 				 const struct btrfs_key *key,</div><div class='ctx'> 				 u32 data_size)</div><div class='hunk'>@@ -3868,12 +4291,16 @@ void btrfs_setup_item_for_insert(struct btrfs_root *root,</div><div class='ctx'> 	batch.total_data_size = data_size;</div><div class='ctx'> 	batch.nr = 1;</div><div class='ctx'> </div><div class='del'>-	setup_items_for_insert(root, path, &amp;batch);</div><div class='add'>+	setup_items_for_insert(trans, root, path, &amp;batch);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Given a key and some data, insert items into the tree.</div><div class='ctx'>  * This does all the path init required, making room in the tree if needed.</div><div class='add'>+ *</div><div class='add'>+ * Returns: 0        on success</div><div class='add'>+ *          -EEXIST  if the first key already exists</div><div class='add'>+ *          &lt; 0      on other errors</div><div class='ctx'>  */</div><div class='ctx'> int btrfs_insert_empty_items(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			    struct btrfs_root *root,</div><div class='hunk'>@@ -3894,7 +4321,7 @@ int btrfs_insert_empty_items(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	slot = path-&gt;slots[0];</div><div class='ctx'> 	BUG_ON(slot &lt; 0);</div><div class='ctx'> </div><div class='del'>-	setup_items_for_insert(root, path, batch);</div><div class='add'>+	setup_items_for_insert(trans, root, path, batch);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3907,7 +4334,7 @@ int btrfs_insert_item(struct btrfs_trans_handle *trans, struct btrfs_root *root,</div><div class='ctx'> 		      u32 data_size)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	unsigned long ptr;</div><div class='ctx'> </div><div class='hunk'>@@ -3919,9 +4346,8 @@ int btrfs_insert_item(struct btrfs_trans_handle *trans, struct btrfs_root *root,</div><div class='ctx'> 		leaf = path-&gt;nodes[0];</div><div class='ctx'> 		ptr = btrfs_item_ptr_offset(leaf, path-&gt;slots[0]);</div><div class='ctx'> 		write_extent_buffer(leaf, data, ptr, data_size);</div><div class='del'>-		btrfs_mark_buffer_dirty(leaf);</div><div class='add'>+		btrfs_mark_buffer_dirty(trans, leaf);</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3943,14 +4369,14 @@ int btrfs_duplicate_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	u32 item_size;</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='del'>-	item_size = btrfs_item_size_nr(leaf, path-&gt;slots[0]);</div><div class='add'>+	item_size = btrfs_item_size(leaf, path-&gt;slots[0]);</div><div class='ctx'> 	ret = setup_leaf_for_split(trans, root, path,</div><div class='ctx'> 				   item_size + sizeof(struct btrfs_item));</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='ctx'> 	path-&gt;slots[0]++;</div><div class='del'>-	btrfs_setup_item_for_insert(root, path, new_key, item_size);</div><div class='add'>+	btrfs_setup_item_for_insert(trans, root, path, new_key, item_size);</div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	memcpy_extent_buffer(leaf,</div><div class='ctx'> 			     btrfs_item_ptr_offset(leaf, path-&gt;slots[0]),</div><div class='hunk'>@@ -3964,9 +4390,11 @@ int btrfs_duplicate_item(struct btrfs_trans_handle *trans,</div><div class='ctx'>  *</div><div class='ctx'>  * the tree should have been previously balanced so the deletion does not</div><div class='ctx'>  * empty a node.</div><div class='add'>+ *</div><div class='add'>+ * This is exported for use inside btrfs-progs, don't un-export it.</div><div class='ctx'>  */</div><div class='del'>-static void del_ptr(struct btrfs_root *root, struct btrfs_path *path,</div><div class='del'>-		    int level, int slot)</div><div class='add'>+int btrfs_del_ptr(struct btrfs_trans_handle *trans, struct btrfs_root *root,</div><div class='add'>+		  struct btrfs_path *path, int level, int slot)</div><div class='ctx'> {</div><div class='ctx'> 	struct extent_buffer *parent = path-&gt;nodes[level];</div><div class='ctx'> 	u32 nritems;</div><div class='hunk'>@@ -3977,17 +4405,23 @@ static void del_ptr(struct btrfs_root *root, struct btrfs_path *path,</div><div class='ctx'> 		if (level) {</div><div class='ctx'> 			ret = btrfs_tree_mod_log_insert_move(parent, slot,</div><div class='ctx'> 					slot + 1, nritems - slot - 1);</div><div class='del'>-			BUG_ON(ret &lt; 0);</div><div class='add'>+			if (unlikely(ret &lt; 0)) {</div><div class='add'>+				btrfs_abort_transaction(trans, ret);</div><div class='add'>+				return ret;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> 		memmove_extent_buffer(parent,</div><div class='del'>-			      btrfs_node_key_ptr_offset(slot),</div><div class='del'>-			      btrfs_node_key_ptr_offset(slot + 1),</div><div class='add'>+			      btrfs_node_key_ptr_offset(parent, slot),</div><div class='add'>+			      btrfs_node_key_ptr_offset(parent, slot + 1),</div><div class='ctx'> 			      sizeof(struct btrfs_key_ptr) *</div><div class='ctx'> 			      (nritems - slot - 1));</div><div class='ctx'> 	} else if (level) {</div><div class='ctx'> 		ret = btrfs_tree_mod_log_insert_key(parent, slot,</div><div class='del'>-				BTRFS_MOD_LOG_KEY_REMOVE, GFP_NOFS);</div><div class='del'>-		BUG_ON(ret &lt; 0);</div><div class='add'>+						    BTRFS_MOD_LOG_KEY_REMOVE);</div><div class='add'>+		if (unlikely(ret &lt; 0)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	nritems--;</div><div class='hunk'>@@ -4000,9 +4434,10 @@ static void del_ptr(struct btrfs_root *root, struct btrfs_path *path,</div><div class='ctx'> 		struct btrfs_disk_key disk_key;</div><div class='ctx'> </div><div class='ctx'> 		btrfs_node_key(parent, &amp;disk_key, 0);</div><div class='del'>-		fixup_low_keys(path, &amp;disk_key, level + 1);</div><div class='add'>+		fixup_low_keys(trans, path, &amp;disk_key, level + 1);</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_mark_buffer_dirty(parent);</div><div class='add'>+	btrfs_mark_buffer_dirty(trans, parent);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -4015,13 +4450,17 @@ static void del_ptr(struct btrfs_root *root, struct btrfs_path *path,</div><div class='ctx'>  * The path must have already been setup for deleting the leaf, including</div><div class='ctx'>  * all the proper balancing.  path-&gt;nodes[1] must be locked.</div><div class='ctx'>  */</div><div class='del'>-static noinline void btrfs_del_leaf(struct btrfs_trans_handle *trans,</div><div class='del'>-				    struct btrfs_root *root,</div><div class='del'>-				    struct btrfs_path *path,</div><div class='del'>-				    struct extent_buffer *leaf)</div><div class='add'>+static noinline int btrfs_del_leaf(struct btrfs_trans_handle *trans,</div><div class='add'>+				   struct btrfs_root *root,</div><div class='add'>+				   struct btrfs_path *path,</div><div class='add'>+				   struct extent_buffer *leaf)</div><div class='ctx'> {</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='ctx'> 	WARN_ON(btrfs_header_generation(leaf) != trans-&gt;transid);</div><div class='del'>-	del_ptr(root, path, 1, path-&gt;slots[1]);</div><div class='add'>+	ret = btrfs_del_ptr(trans, root, path, 1, path-&gt;slots[1]);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * btrfs_free_extent is expensive, we want to make sure we</div><div class='hunk'>@@ -4029,11 +4468,15 @@ static noinline void btrfs_del_leaf(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 */</div><div class='ctx'> 	btrfs_unlock_up_safe(path, 0);</div><div class='ctx'> </div><div class='del'>-	root_sub_used(root, leaf-&gt;len);</div><div class='add'>+	root_sub_used_bytes(root);</div><div class='ctx'> </div><div class='del'>-	atomic_inc(&amp;leaf-&gt;refs);</div><div class='del'>-	btrfs_free_tree_block(trans, root, leaf, 0, 1);</div><div class='add'>+	refcount_inc(&amp;leaf-&gt;refs);</div><div class='add'>+	ret = btrfs_free_tree_block(trans, btrfs_root_id(root), leaf, 0, 1);</div><div class='ctx'> 	free_extent_buffer_stale(leaf);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> /*</div><div class='ctx'>  * delete the item at the leaf level in path.  If that empties</div><div class='hunk'>@@ -4044,55 +4487,44 @@ int btrfs_del_items(struct btrfs_trans_handle *trans, struct btrfs_root *root,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='del'>-	struct btrfs_item *item;</div><div class='del'>-	u32 last_off;</div><div class='del'>-	u32 dsize = 0;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int wret;</div><div class='del'>-	int i;</div><div class='ctx'> 	u32 nritems;</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='del'>-	last_off = btrfs_item_offset_nr(leaf, slot + nr - 1);</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; nr; i++)</div><div class='del'>-		dsize += btrfs_item_size_nr(leaf, slot + i);</div><div class='del'>-</div><div class='ctx'> 	nritems = btrfs_header_nritems(leaf);</div><div class='ctx'> </div><div class='ctx'> 	if (slot + nr != nritems) {</div><div class='del'>-		int data_end = leaf_data_end(leaf);</div><div class='del'>-		struct btrfs_map_token token;</div><div class='add'>+		const u32 last_off = btrfs_item_offset(leaf, slot + nr - 1);</div><div class='add'>+		const int data_end = leaf_data_end(leaf);</div><div class='add'>+		u32 dsize = 0;</div><div class='add'>+		int i;</div><div class='ctx'> </div><div class='del'>-		memmove_extent_buffer(leaf, BTRFS_LEAF_DATA_OFFSET +</div><div class='del'>-			      data_end + dsize,</div><div class='del'>-			      BTRFS_LEAF_DATA_OFFSET + data_end,</div><div class='del'>-			      last_off - data_end);</div><div class='add'>+		for (i = 0; i &lt; nr; i++)</div><div class='add'>+			dsize += btrfs_item_size(leaf, slot + i);</div><div class='add'>+</div><div class='add'>+		memmove_leaf_data(leaf, data_end + dsize, data_end,</div><div class='add'>+				  last_off - data_end);</div><div class='ctx'> </div><div class='del'>-		btrfs_init_map_token(&amp;token, leaf);</div><div class='ctx'> 		for (i = slot + nr; i &lt; nritems; i++) {</div><div class='ctx'> 			u32 ioff;</div><div class='ctx'> </div><div class='del'>-			item = btrfs_item_nr(i);</div><div class='del'>-			ioff = btrfs_token_item_offset(&amp;token, item);</div><div class='del'>-			btrfs_set_token_item_offset(&amp;token, item, ioff + dsize);</div><div class='add'>+			ioff = btrfs_item_offset(leaf, i);</div><div class='add'>+			btrfs_set_item_offset(leaf, i, ioff + dsize);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		memmove_extent_buffer(leaf, btrfs_item_nr_offset(slot),</div><div class='del'>-			      btrfs_item_nr_offset(slot + nr),</div><div class='del'>-			      sizeof(struct btrfs_item) *</div><div class='del'>-			      (nritems - slot - nr));</div><div class='add'>+		memmove_leaf_items(leaf, slot, slot + nr, nritems - slot - nr);</div><div class='ctx'> 	}</div><div class='ctx'> 	btrfs_set_header_nritems(leaf, nritems - nr);</div><div class='ctx'> 	nritems -= nr;</div><div class='ctx'> </div><div class='ctx'> 	/* delete the leaf if we've emptied it */</div><div class='ctx'> 	if (nritems == 0) {</div><div class='del'>-		if (leaf == root-&gt;node) {</div><div class='del'>-			btrfs_set_header_level(leaf, 0);</div><div class='del'>-		} else {</div><div class='del'>-			btrfs_clean_tree_block(leaf);</div><div class='del'>-			btrfs_del_leaf(trans, root, path, leaf);</div><div class='add'>+		if (leaf != root-&gt;node) {</div><div class='add'>+			btrfs_clear_buffer_dirty(trans, leaf);</div><div class='add'>+			ret = btrfs_del_leaf(trans, root, path, leaf);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				return ret;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='ctx'> 		int used = leaf_space_used(leaf, 0, nritems);</div><div class='hunk'>@@ -4100,36 +4532,63 @@ int btrfs_del_items(struct btrfs_trans_handle *trans, struct btrfs_root *root,</div><div class='ctx'> 			struct btrfs_disk_key disk_key;</div><div class='ctx'> </div><div class='ctx'> 			btrfs_item_key(leaf, &amp;disk_key, 0);</div><div class='del'>-			fixup_low_keys(path, &amp;disk_key, 1);</div><div class='add'>+			fixup_low_keys(trans, path, &amp;disk_key, 1);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		/* delete the leaf if it is mostly empty */</div><div class='add'>+		/*</div><div class='add'>+		 * Try to delete the leaf if it is mostly empty. We do this by</div><div class='add'>+		 * trying to move all its items into its left and right neighbours.</div><div class='add'>+		 * If we can't move all the items, then we don't delete it - it's</div><div class='add'>+		 * not ideal, but future insertions might fill the leaf with more</div><div class='add'>+		 * items, or items from other leaves might be moved later into our</div><div class='add'>+		 * leaf due to deletions on those leaves.</div><div class='add'>+		 */</div><div class='ctx'> 		if (used &lt; BTRFS_LEAF_DATA_SIZE(fs_info) / 3) {</div><div class='add'>+			u32 min_push_space;</div><div class='add'>+</div><div class='ctx'> 			/* push_leaf_left fixes the path.</div><div class='ctx'> 			 * make sure the path still points to our leaf</div><div class='del'>-			 * for possible call to del_ptr below</div><div class='add'>+			 * for possible call to btrfs_del_ptr below</div><div class='ctx'> 			 */</div><div class='ctx'> 			slot = path-&gt;slots[1];</div><div class='del'>-			atomic_inc(&amp;leaf-&gt;refs);</div><div class='del'>-</div><div class='del'>-			wret = push_leaf_left(trans, root, path, 1, 1,</div><div class='del'>-					      1, (u32)-1);</div><div class='add'>+			refcount_inc(&amp;leaf-&gt;refs);</div><div class='add'>+			/*</div><div class='add'>+			 * We want to be able to at least push one item to the</div><div class='add'>+			 * left neighbour leaf, and that's the first item.</div><div class='add'>+			 */</div><div class='add'>+			min_push_space = sizeof(struct btrfs_item) +</div><div class='add'>+				btrfs_item_size(leaf, 0);</div><div class='add'>+			wret = push_leaf_left(trans, root, path, 0,</div><div class='add'>+					      min_push_space, 1, (u32)-1);</div><div class='ctx'> 			if (wret &lt; 0 &amp;&amp; wret != -ENOSPC)</div><div class='ctx'> 				ret = wret;</div><div class='ctx'> </div><div class='ctx'> 			if (path-&gt;nodes[0] == leaf &amp;&amp;</div><div class='ctx'> 			    btrfs_header_nritems(leaf)) {</div><div class='del'>-				wret = push_leaf_right(trans, root, path, 1,</div><div class='del'>-						       1, 1, 0);</div><div class='add'>+				/*</div><div class='add'>+				 * If we were not able to push all items from our</div><div class='add'>+				 * leaf to its left neighbour, then attempt to</div><div class='add'>+				 * either push all the remaining items to the</div><div class='add'>+				 * right neighbour or none. There's no advantage</div><div class='add'>+				 * in pushing only some items, instead of all, as</div><div class='add'>+				 * it's pointless to end up with a leaf having</div><div class='add'>+				 * too few items while the neighbours can be full</div><div class='add'>+				 * or nearly full.</div><div class='add'>+				 */</div><div class='add'>+				nritems = btrfs_header_nritems(leaf);</div><div class='add'>+				min_push_space = leaf_space_used(leaf, 0, nritems);</div><div class='add'>+				wret = push_leaf_right(trans, root, path, 0,</div><div class='add'>+						       min_push_space, 1, 0);</div><div class='ctx'> 				if (wret &lt; 0 &amp;&amp; wret != -ENOSPC)</div><div class='ctx'> 					ret = wret;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			if (btrfs_header_nritems(leaf) == 0) {</div><div class='ctx'> 				path-&gt;slots[1] = slot;</div><div class='del'>-				btrfs_del_leaf(trans, root, path, leaf);</div><div class='add'>+				ret = btrfs_del_leaf(trans, root, path, leaf);</div><div class='ctx'> 				free_extent_buffer(leaf);</div><div class='del'>-				ret = 0;</div><div class='add'>+				if (ret &lt; 0)</div><div class='add'>+					return ret;</div><div class='ctx'> 			} else {</div><div class='ctx'> 				/* if we're still in the path, make sure</div><div class='ctx'> 				 * we're dirty.  Otherwise, one of the</div><div class='hunk'>@@ -4137,78 +4596,25 @@ int btrfs_del_items(struct btrfs_trans_handle *trans, struct btrfs_root *root,</div><div class='ctx'> 				 * dirtied this buffer</div><div class='ctx'> 				 */</div><div class='ctx'> 				if (path-&gt;nodes[0] == leaf)</div><div class='del'>-					btrfs_mark_buffer_dirty(leaf);</div><div class='add'>+					btrfs_mark_buffer_dirty(trans, leaf);</div><div class='ctx'> 				free_extent_buffer(leaf);</div><div class='ctx'> 			}</div><div class='ctx'> 		} else {</div><div class='del'>-			btrfs_mark_buffer_dirty(leaf);</div><div class='add'>+			btrfs_mark_buffer_dirty(trans, leaf);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * search the tree again to find a leaf with lesser keys</div><div class='del'>- * returns 0 if it found something or 1 if there are no lesser leaves.</div><div class='del'>- * returns &lt; 0 on io errors.</div><div class='del'>- *</div><div class='del'>- * This may release the path, and so you may lose any locks held at the</div><div class='del'>- * time you call it.</div><div class='del'>- */</div><div class='del'>-int btrfs_prev_leaf(struct btrfs_root *root, struct btrfs_path *path)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_key key;</div><div class='del'>-	struct btrfs_disk_key found_key;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, 0);</div><div class='del'>-</div><div class='del'>-	if (key.offset &gt; 0) {</div><div class='del'>-		key.offset--;</div><div class='del'>-	} else if (key.type &gt; 0) {</div><div class='del'>-		key.type--;</div><div class='del'>-		key.offset = (u64)-1;</div><div class='del'>-	} else if (key.objectid &gt; 0) {</div><div class='del'>-		key.objectid--;</div><div class='del'>-		key.type = (u8)-1;</div><div class='del'>-		key.offset = (u64)-1;</div><div class='del'>-	} else {</div><div class='del'>-		return 1;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	btrfs_release_path(path);</div><div class='del'>-	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		return ret;</div><div class='del'>-	btrfs_item_key(path-&gt;nodes[0], &amp;found_key, 0);</div><div class='del'>-	ret = comp_keys(&amp;found_key, &amp;key);</div><div class='del'>-	/*</div><div class='del'>-	 * We might have had an item with the previous key in the tree right</div><div class='del'>-	 * before we released our path. And after we released our path, that</div><div class='del'>-	 * item might have been pushed to the first slot (0) of the leaf we</div><div class='del'>-	 * were holding due to a tree balance. Alternatively, an item with the</div><div class='del'>-	 * previous key can exist as the only element of a leaf (big fat item).</div><div class='del'>-	 * Therefore account for these 2 cases, so that our callers (like</div><div class='del'>-	 * btrfs_previous_item) don't miss an existing item with a key matching</div><div class='del'>-	 * the previous key we computed above.</div><div class='del'>-	 */</div><div class='del'>-	if (ret &lt;= 0)</div><div class='del'>-		return 0;</div><div class='del'>-	return 1;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * A helper function to walk down the tree starting at min_key, and looking</div><div class='del'>- * for nodes or leaves that are have a minimum transaction id.</div><div class='add'>+ * for leaves that have a minimum transaction id.</div><div class='ctx'>  * This is used by the btree defrag code, and tree logging</div><div class='ctx'>  *</div><div class='ctx'>  * This does not cow, but it does stuff the starting key it finds back</div><div class='ctx'>  * into min_key, so you can call btrfs_search_slot with cow=1 on the</div><div class='ctx'>  * key and get a writable path.</div><div class='ctx'>  *</div><div class='del'>- * This honors path-&gt;lowest_level to prevent descent past a given level</div><div class='del'>- * of the tree.</div><div class='del'>- *</div><div class='ctx'>  * min_trans indicates the oldest transaction that you are interested</div><div class='ctx'>  * in walking through.  Any nodes or leaves older than min_trans are</div><div class='ctx'>  * skipped over (without reading them).</div><div class='hunk'>@@ -4221,15 +4627,16 @@ int btrfs_search_forward(struct btrfs_root *root, struct btrfs_key *min_key,</div><div class='ctx'> 			 u64 min_trans)</div><div class='ctx'> {</div><div class='ctx'> 	struct extent_buffer *cur;</div><div class='del'>-	struct btrfs_key found_key;</div><div class='ctx'> 	int slot;</div><div class='ctx'> 	int sret;</div><div class='ctx'> 	u32 nritems;</div><div class='ctx'> 	int level;</div><div class='ctx'> 	int ret = 1;</div><div class='del'>-	int keep_locks = path-&gt;keep_locks;</div><div class='add'>+	const bool keep_locks = path-&gt;keep_locks;</div><div class='ctx'> </div><div class='del'>-	path-&gt;keep_locks = 1;</div><div class='add'>+	ASSERT(!path-&gt;nowait);</div><div class='add'>+	ASSERT(path-&gt;lowest_level == 0);</div><div class='add'>+	path-&gt;keep_locks = true;</div><div class='ctx'> again:</div><div class='ctx'> 	cur = btrfs_read_lock_root_node(root);</div><div class='ctx'> 	level = btrfs_header_level(cur);</div><div class='hunk'>@@ -4244,19 +4651,20 @@ again:</div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		nritems = btrfs_header_nritems(cur);</div><div class='ctx'> 		level = btrfs_header_level(cur);</div><div class='del'>-		sret = btrfs_bin_search(cur, min_key, &amp;slot);</div><div class='add'>+		sret = btrfs_bin_search(cur, 0, min_key, &amp;slot);</div><div class='ctx'> 		if (sret &lt; 0) {</div><div class='ctx'> 			ret = sret;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		/* at the lowest level, we're done, setup the path and exit */</div><div class='del'>-		if (level == path-&gt;lowest_level) {</div><div class='add'>+		/* At level 0 we're done, setup the path and exit. */</div><div class='add'>+		if (level == 0) {</div><div class='ctx'> 			if (slot &gt;= nritems)</div><div class='ctx'> 				goto find_next_key;</div><div class='ctx'> 			ret = 0;</div><div class='ctx'> 			path-&gt;slots[level] = slot;</div><div class='del'>-			btrfs_item_key_to_cpu(cur, &amp;found_key, slot);</div><div class='add'>+			/* Save our key for returning back. */</div><div class='add'>+			btrfs_item_key_to_cpu(cur, min_key, slot);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (sret &amp;&amp; slot &gt; 0)</div><div class='hunk'>@@ -4280,8 +4688,8 @@ find_next_key:</div><div class='ctx'> 		 * we didn't find a candidate key in this node, walk forward</div><div class='ctx'> 		 * and find another one</div><div class='ctx'> 		 */</div><div class='add'>+		path-&gt;slots[level] = slot;</div><div class='ctx'> 		if (slot &gt;= nritems) {</div><div class='del'>-			path-&gt;slots[level] = slot;</div><div class='ctx'> 			sret = btrfs_find_next_key(root, path, min_key, level,</div><div class='ctx'> 						  min_trans);</div><div class='ctx'> 			if (sret == 0) {</div><div class='hunk'>@@ -4291,13 +4699,6 @@ find_next_key:</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		/* save our key for returning back */</div><div class='del'>-		btrfs_node_key_to_cpu(cur, &amp;found_key, slot);</div><div class='del'>-		path-&gt;slots[level] = slot;</div><div class='del'>-		if (level == path-&gt;lowest_level) {</div><div class='del'>-			ret = 0;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='ctx'> 		cur = btrfs_read_node_slot(cur, slot);</div><div class='ctx'> 		if (IS_ERR(cur)) {</div><div class='ctx'> 			ret = PTR_ERR(cur);</div><div class='hunk'>@@ -4312,10 +4713,8 @@ find_next_key:</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='ctx'> 	path-&gt;keep_locks = keep_locks;</div><div class='del'>-	if (ret == 0) {</div><div class='del'>-		btrfs_unlock_up_safe(path, path-&gt;lowest_level + 1);</div><div class='del'>-		memcpy(min_key, &amp;found_key, sizeof(found_key));</div><div class='del'>-	}</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		btrfs_unlock_up_safe(path, 1);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -4327,7 +4726,7 @@ out:</div><div class='ctx'>  * 0 is returned if another key is found, &lt; 0 if there are any errors</div><div class='ctx'>  * and 1 is returned if there are no higher keys in the tree</div><div class='ctx'>  *</div><div class='del'>- * path-&gt;keep_locks should be set to 1 on the search made before</div><div class='add'>+ * path-&gt;keep_locks should be set to true on the search made before</div><div class='ctx'>  * calling this function.</div><div class='ctx'>  */</div><div class='ctx'> int btrfs_find_next_key(struct btrfs_root *root, struct btrfs_path *path,</div><div class='hunk'>@@ -4402,11 +4801,20 @@ int btrfs_next_old_leaf(struct btrfs_root *root, struct btrfs_path *path,</div><div class='ctx'> 	int level;</div><div class='ctx'> 	struct extent_buffer *c;</div><div class='ctx'> 	struct extent_buffer *next;</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='add'>+	bool need_commit_sem = false;</div><div class='ctx'> 	u32 nritems;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * The nowait semantics are used only for write paths, where we don't</div><div class='add'>+	 * use the tree mod log and sequence numbers.</div><div class='add'>+	 */</div><div class='add'>+	if (time_seq)</div><div class='add'>+		ASSERT(!path-&gt;nowait);</div><div class='add'>+</div><div class='ctx'> 	nritems = btrfs_header_nritems(path-&gt;nodes[0]);</div><div class='ctx'> 	if (nritems == 0)</div><div class='ctx'> 		return 1;</div><div class='hunk'>@@ -4417,47 +4825,49 @@ again:</div><div class='ctx'> 	next = NULL;</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='del'>-	path-&gt;keep_locks = 1;</div><div class='add'>+	path-&gt;keep_locks = true;</div><div class='ctx'> </div><div class='del'>-	if (time_seq)</div><div class='add'>+	if (time_seq) {</div><div class='ctx'> 		ret = btrfs_search_old_slot(root, &amp;key, path, time_seq);</div><div class='del'>-	else</div><div class='add'>+	} else {</div><div class='add'>+		if (path-&gt;need_commit_sem) {</div><div class='add'>+			path-&gt;need_commit_sem = false;</div><div class='add'>+			need_commit_sem = true;</div><div class='add'>+			if (path-&gt;nowait) {</div><div class='add'>+				if (!down_read_trylock(&amp;fs_info-&gt;commit_root_sem)) {</div><div class='add'>+					ret = -EAGAIN;</div><div class='add'>+					goto done;</div><div class='add'>+				}</div><div class='add'>+			} else {</div><div class='add'>+				down_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='ctx'> 		ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='del'>-	path-&gt;keep_locks = 0;</div><div class='add'>+	}</div><div class='add'>+	path-&gt;keep_locks = false;</div><div class='ctx'> </div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		return ret;</div><div class='add'>+		goto done;</div><div class='ctx'> </div><div class='ctx'> 	nritems = btrfs_header_nritems(path-&gt;nodes[0]);</div><div class='ctx'> 	/*</div><div class='del'>-	 * by releasing the path above we dropped all our locks.  A balance</div><div class='del'>-	 * could have added more items next to the key that used to be</div><div class='del'>-	 * at the very end of the block.  So, check again here and</div><div class='del'>-	 * advance the path if there are now more items available.</div><div class='del'>-	 */</div><div class='del'>-	if (nritems &gt; 0 &amp;&amp; path-&gt;slots[0] &lt; nritems - 1) {</div><div class='del'>-		if (ret == 0)</div><div class='del'>-			path-&gt;slots[0]++;</div><div class='del'>-		ret = 0;</div><div class='del'>-		goto done;</div><div class='del'>-	}</div><div class='del'>-	/*</div><div class='del'>-	 * So the above check misses one case:</div><div class='del'>-	 * - after releasing the path above, someone has removed the item that</div><div class='del'>-	 *   used to be at the very end of the block, and balance between leafs</div><div class='del'>-	 *   gets another one with bigger key.offset to replace it.</div><div class='add'>+	 * By releasing the path above we dropped all our locks.  A balance</div><div class='add'>+	 * could have happened and</div><div class='ctx'> 	 *</div><div class='del'>-	 * This one should be returned as well, or we can get leaf corruption</div><div class='del'>-	 * later(esp. in __btrfs_drop_extents()).</div><div class='add'>+	 * 1. added more items after the previous last item</div><div class='add'>+	 * 2. deleted the previous last item</div><div class='ctx'> 	 *</div><div class='del'>-	 * And a bit more explanation about this check,</div><div class='del'>-	 * with ret &gt; 0, the key isn't found, the path points to the slot</div><div class='del'>-	 * where it should be inserted, so the path-&gt;slots[0] item must be the</div><div class='del'>-	 * bigger one.</div><div class='add'>+	 * So, check again here and advance the path if there are now more</div><div class='add'>+	 * items available.</div><div class='ctx'> 	 */</div><div class='del'>-	if (nritems &gt; 0 &amp;&amp; ret &gt; 0 &amp;&amp; path-&gt;slots[0] == nritems - 1) {</div><div class='del'>-		ret = 0;</div><div class='del'>-		goto done;</div><div class='add'>+	if (nritems &gt; 0 &amp;&amp; path-&gt;slots[0] &lt;= nritems - 1) {</div><div class='add'>+		if (ret == 0 &amp;&amp; path-&gt;slots[0] != nritems - 1) {</div><div class='add'>+			path-&gt;slots[0]++;</div><div class='add'>+			goto done;</div><div class='add'>+		} else if (ret &gt; 0) {</div><div class='add'>+			ret = 0;</div><div class='add'>+			goto done;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	while (level &lt; BTRFS_MAX_LEVEL) {</div><div class='hunk'>@@ -4493,9 +4903,8 @@ again:</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		next = c;</div><div class='del'>-		ret = read_block_for_search(root, path, &amp;next, level,</div><div class='del'>-					    slot, &amp;key);</div><div class='del'>-		if (ret == -EAGAIN)</div><div class='add'>+		ret = read_block_for_search(root, path, &amp;next, slot, &amp;key);</div><div class='add'>+		if (ret == -EAGAIN &amp;&amp; !path-&gt;nowait)</div><div class='ctx'> 			goto again;</div><div class='ctx'> </div><div class='ctx'> 		if (ret &lt; 0) {</div><div class='hunk'>@@ -4505,6 +4914,10 @@ again:</div><div class='ctx'> </div><div class='ctx'> 		if (!path-&gt;skip_locking) {</div><div class='ctx'> 			ret = btrfs_try_tree_read_lock(next);</div><div class='add'>+			if (!ret &amp;&amp; path-&gt;nowait) {</div><div class='add'>+				ret = -EAGAIN;</div><div class='add'>+				goto done;</div><div class='add'>+			}</div><div class='ctx'> 			if (!ret &amp;&amp; time_seq) {</div><div class='ctx'> 				/*</div><div class='ctx'> 				 * If we don't get the lock, we may be racing</div><div class='hunk'>@@ -4533,9 +4946,8 @@ again:</div><div class='ctx'> 		if (!level)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		ret = read_block_for_search(root, path, &amp;next, level,</div><div class='del'>-					    0, &amp;key);</div><div class='del'>-		if (ret == -EAGAIN)</div><div class='add'>+		ret = read_block_for_search(root, path, &amp;next, 0, &amp;key);</div><div class='add'>+		if (ret == -EAGAIN &amp;&amp; !path-&gt;nowait)</div><div class='ctx'> 			goto again;</div><div class='ctx'> </div><div class='ctx'> 		if (ret &lt; 0) {</div><div class='hunk'>@@ -4543,16 +4955,41 @@ again:</div><div class='ctx'> 			goto done;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (!path-&gt;skip_locking)</div><div class='del'>-			btrfs_tree_read_lock(next);</div><div class='add'>+		if (!path-&gt;skip_locking) {</div><div class='add'>+			if (path-&gt;nowait) {</div><div class='add'>+				if (!btrfs_try_tree_read_lock(next)) {</div><div class='add'>+					ret = -EAGAIN;</div><div class='add'>+					goto done;</div><div class='add'>+				}</div><div class='add'>+			} else {</div><div class='add'>+				btrfs_tree_read_lock(next);</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> 	ret = 0;</div><div class='ctx'> done:</div><div class='ctx'> 	unlock_up(path, 0, 1, 0, NULL);</div><div class='add'>+	if (need_commit_sem) {</div><div class='add'>+		int ret2;</div><div class='add'>+</div><div class='add'>+		path-&gt;need_commit_sem = true;</div><div class='add'>+		ret2 = finish_need_commit_sem_search(path);</div><div class='add'>+		up_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='add'>+		if (ret2)</div><div class='add'>+			ret = ret2;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+int btrfs_next_old_item(struct btrfs_root *root, struct btrfs_path *path, u64 time_seq)</div><div class='add'>+{</div><div class='add'>+	path-&gt;slots[0]++;</div><div class='add'>+	if (path-&gt;slots[0] &gt;= btrfs_header_nritems(path-&gt;nodes[0]))</div><div class='add'>+		return btrfs_next_old_leaf(root, path, time_seq);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * this uses btrfs_prev_leaf to walk backwards in the tree, and keeps</div><div class='ctx'>  * searching until it gets past min_objectid or finds an item of 'type'</div><div class='hunk'>@@ -4636,3 +5073,16 @@ int btrfs_previous_extent_item(struct btrfs_root *root,</div><div class='ctx'> 	}</div><div class='ctx'> 	return 1;</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+int __init btrfs_ctree_init(void)</div><div class='add'>+{</div><div class='add'>+	btrfs_path_cachep = KMEM_CACHE(btrfs_path, 0);</div><div class='add'>+	if (!btrfs_path_cachep)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void __cold btrfs_ctree_exit(void)</div><div class='add'>+{</div><div class='add'>+	kmem_cache_destroy(btrfs_path_cachep);</div><div class='add'>+}</div><div class='head'>diff --git a/fs/btrfs/ctree.h b/fs/btrfs/ctree.h<br/>index 7553e9dc5f93..692370fc07b2 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/ctree.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/ctree.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/ctree.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/ctree.h</a></div><div class='hunk'>@@ -6,350 +6,23 @@</div><div class='ctx'> #ifndef BTRFS_CTREE_H</div><div class='ctx'> #define BTRFS_CTREE_H</div><div class='ctx'> </div><div class='del'>-#include &lt;linux/mm.h&gt;</div><div class='del'>-#include &lt;linux/sched/signal.h&gt;</div><div class='del'>-#include &lt;linux/highmem.h&gt;</div><div class='del'>-#include &lt;linux/fs.h&gt;</div><div class='del'>-#include &lt;linux/rwsem.h&gt;</div><div class='del'>-#include &lt;linux/semaphore.h&gt;</div><div class='del'>-#include &lt;linux/completion.h&gt;</div><div class='del'>-#include &lt;linux/backing-dev.h&gt;</div><div class='add'>+#include &lt;linux/cleanup.h&gt;</div><div class='add'>+#include &lt;linux/spinlock.h&gt;</div><div class='add'>+#include &lt;linux/rbtree.h&gt;</div><div class='add'>+#include &lt;linux/mutex.h&gt;</div><div class='ctx'> #include &lt;linux/wait.h&gt;</div><div class='del'>-#include &lt;linux/slab.h&gt;</div><div class='del'>-#include &lt;trace/events/btrfs.h&gt;</div><div class='del'>-#include &lt;asm/unaligned.h&gt;</div><div class='del'>-#include &lt;linux/pagemap.h&gt;</div><div class='del'>-#include &lt;linux/btrfs.h&gt;</div><div class='del'>-#include &lt;linux/btrfs_tree.h&gt;</div><div class='del'>-#include &lt;linux/workqueue.h&gt;</div><div class='del'>-#include &lt;linux/security.h&gt;</div><div class='del'>-#include &lt;linux/sizes.h&gt;</div><div class='del'>-#include &lt;linux/dynamic_debug.h&gt;</div><div class='add'>+#include &lt;linux/list.h&gt;</div><div class='add'>+#include &lt;linux/atomic.h&gt;</div><div class='add'>+#include &lt;linux/xarray.h&gt;</div><div class='ctx'> #include &lt;linux/refcount.h&gt;</div><div class='del'>-#include &lt;linux/crc32c.h&gt;</div><div class='del'>-#include &lt;linux/iomap.h&gt;</div><div class='del'>-#include "extent-io-tree.h"</div><div class='del'>-#include "extent_io.h"</div><div class='del'>-#include "extent_map.h"</div><div class='del'>-#include "async-thread.h"</div><div class='del'>-#include "block-rsv.h"</div><div class='add'>+#include &lt;uapi/linux/btrfs_tree.h&gt;</div><div class='ctx'> #include "locking.h"</div><div class='add'>+#include "accessors.h"</div><div class='ctx'> </div><div class='add'>+struct extent_buffer;</div><div class='add'>+struct btrfs_block_rsv;</div><div class='ctx'> struct btrfs_trans_handle;</div><div class='del'>-struct btrfs_transaction;</div><div class='del'>-struct btrfs_pending_snapshot;</div><div class='del'>-struct btrfs_delayed_ref_root;</div><div class='del'>-struct btrfs_space_info;</div><div class='ctx'> struct btrfs_block_group;</div><div class='del'>-extern struct kmem_cache *btrfs_trans_handle_cachep;</div><div class='del'>-extern struct kmem_cache *btrfs_bit_radix_cachep;</div><div class='del'>-extern struct kmem_cache *btrfs_path_cachep;</div><div class='del'>-extern struct kmem_cache *btrfs_free_space_cachep;</div><div class='del'>-extern struct kmem_cache *btrfs_free_space_bitmap_cachep;</div><div class='del'>-struct btrfs_ordered_sum;</div><div class='del'>-struct btrfs_ref;</div><div class='del'>-struct btrfs_bio;</div><div class='del'>-</div><div class='del'>-#define BTRFS_MAGIC 0x4D5F53665248425FULL /* ascii _BHRfS_M, no null */</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Maximum number of mirrors that can be available for all profiles counting</div><div class='del'>- * the target device of dev-replace as one. During an active device replace</div><div class='del'>- * procedure, the target device of the copy operation is a mirror for the</div><div class='del'>- * filesystem data as well that can be used to read data in order to repair</div><div class='del'>- * read errors on other disks.</div><div class='del'>- *</div><div class='del'>- * Current value is derived from RAID1C4 with 4 copies.</div><div class='del'>- */</div><div class='del'>-#define BTRFS_MAX_MIRRORS (4 + 1)</div><div class='del'>-</div><div class='del'>-#define BTRFS_MAX_LEVEL 8</div><div class='del'>-</div><div class='del'>-#define BTRFS_OLDEST_GENERATION	0ULL</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * we can actually store much bigger names, but lets not confuse the rest</div><div class='del'>- * of linux</div><div class='del'>- */</div><div class='del'>-#define BTRFS_NAME_LEN 255</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Theoretical limit is larger, but we keep this down to a sane</div><div class='del'>- * value. That should limit greatly the possibility of collisions on</div><div class='del'>- * inode ref items.</div><div class='del'>- */</div><div class='del'>-#define BTRFS_LINK_MAX 65535U</div><div class='del'>-</div><div class='del'>-#define BTRFS_EMPTY_DIR_SIZE 0</div><div class='del'>-</div><div class='del'>-/* ioprio of readahead is set to idle */</div><div class='del'>-#define BTRFS_IOPRIO_READA (IOPRIO_PRIO_VALUE(IOPRIO_CLASS_IDLE, 0))</div><div class='del'>-</div><div class='del'>-#define BTRFS_DIRTY_METADATA_THRESH	SZ_32M</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Use large batch size to reduce overhead of metadata updates.  On the reader</div><div class='del'>- * side, we only read it when we are close to ENOSPC and the read overhead is</div><div class='del'>- * mostly related to the number of CPUs, so it is OK to use arbitrary large</div><div class='del'>- * value here.</div><div class='del'>- */</div><div class='del'>-#define BTRFS_TOTAL_BYTES_PINNED_BATCH	SZ_128M</div><div class='del'>-</div><div class='del'>-#define BTRFS_MAX_EXTENT_SIZE SZ_128M</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Deltas are an effective way to populate global statistics.  Give macro names</div><div class='del'>- * to make it clear what we're doing.  An example is discard_extents in</div><div class='del'>- * btrfs_free_space_ctl.</div><div class='del'>- */</div><div class='del'>-#define BTRFS_STAT_NR_ENTRIES	2</div><div class='del'>-#define BTRFS_STAT_CURR		0</div><div class='del'>-#define BTRFS_STAT_PREV		1</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Count how many BTRFS_MAX_EXTENT_SIZE cover the @size</div><div class='del'>- */</div><div class='del'>-static inline u32 count_max_extents(u64 size)</div><div class='del'>-{</div><div class='del'>-	return div_u64(size + BTRFS_MAX_EXTENT_SIZE - 1, BTRFS_MAX_EXTENT_SIZE);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline unsigned long btrfs_chunk_item_size(int num_stripes)</div><div class='del'>-{</div><div class='del'>-	BUG_ON(num_stripes == 0);</div><div class='del'>-	return sizeof(struct btrfs_chunk) +</div><div class='del'>-		sizeof(struct btrfs_stripe) * (num_stripes - 1);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Runtime (in-memory) states of filesystem</div><div class='del'>- */</div><div class='del'>-enum {</div><div class='del'>-	/* Global indicator of serious filesystem errors */</div><div class='del'>-	BTRFS_FS_STATE_ERROR,</div><div class='del'>-	/*</div><div class='del'>-	 * Filesystem is being remounted, allow to skip some operations, like</div><div class='del'>-	 * defrag</div><div class='del'>-	 */</div><div class='del'>-	BTRFS_FS_STATE_REMOUNTING,</div><div class='del'>-	/* Filesystem in RO mode */</div><div class='del'>-	BTRFS_FS_STATE_RO,</div><div class='del'>-	/* Track if a transaction abort has been reported on this filesystem */</div><div class='del'>-	BTRFS_FS_STATE_TRANS_ABORTED,</div><div class='del'>-	/*</div><div class='del'>-	 * Bio operations should be blocked on this filesystem because a source</div><div class='del'>-	 * or target device is being destroyed as part of a device replace</div><div class='del'>-	 */</div><div class='del'>-	BTRFS_FS_STATE_DEV_REPLACING,</div><div class='del'>-	/* The btrfs_fs_info created for self-tests */</div><div class='del'>-	BTRFS_FS_STATE_DUMMY_FS_INFO,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-#define BTRFS_BACKREF_REV_MAX		256</div><div class='del'>-#define BTRFS_BACKREF_REV_SHIFT		56</div><div class='del'>-#define BTRFS_BACKREF_REV_MASK		(((u64)BTRFS_BACKREF_REV_MAX - 1) &lt;&lt; \</div><div class='del'>-					 BTRFS_BACKREF_REV_SHIFT)</div><div class='del'>-</div><div class='del'>-#define BTRFS_OLD_BACKREF_REV		0</div><div class='del'>-#define BTRFS_MIXED_BACKREF_REV		1</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * every tree block (leaf or node) starts with this header.</div><div class='del'>- */</div><div class='del'>-struct btrfs_header {</div><div class='del'>-	/* these first four must match the super block */</div><div class='del'>-	u8 csum[BTRFS_CSUM_SIZE];</div><div class='del'>-	u8 fsid[BTRFS_FSID_SIZE]; /* FS specific uuid */</div><div class='del'>-	__le64 bytenr; /* which block this node is supposed to live in */</div><div class='del'>-	__le64 flags;</div><div class='del'>-</div><div class='del'>-	/* allowed to be different from the super from here on down */</div><div class='del'>-	u8 chunk_tree_uuid[BTRFS_UUID_SIZE];</div><div class='del'>-	__le64 generation;</div><div class='del'>-	__le64 owner;</div><div class='del'>-	__le32 nritems;</div><div class='del'>-	u8 level;</div><div class='del'>-} __attribute__ ((__packed__));</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * this is a very generous portion of the super block, giving us</div><div class='del'>- * room to translate 14 chunks with 3 stripes each.</div><div class='del'>- */</div><div class='del'>-#define BTRFS_SYSTEM_CHUNK_ARRAY_SIZE 2048</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * just in case we somehow lose the roots and are not able to mount,</div><div class='del'>- * we store an array of the roots from previous transactions</div><div class='del'>- * in the super.</div><div class='del'>- */</div><div class='del'>-#define BTRFS_NUM_BACKUP_ROOTS 4</div><div class='del'>-struct btrfs_root_backup {</div><div class='del'>-	__le64 tree_root;</div><div class='del'>-	__le64 tree_root_gen;</div><div class='del'>-</div><div class='del'>-	__le64 chunk_root;</div><div class='del'>-	__le64 chunk_root_gen;</div><div class='del'>-</div><div class='del'>-	__le64 extent_root;</div><div class='del'>-	__le64 extent_root_gen;</div><div class='del'>-</div><div class='del'>-	__le64 fs_root;</div><div class='del'>-	__le64 fs_root_gen;</div><div class='del'>-</div><div class='del'>-	__le64 dev_root;</div><div class='del'>-	__le64 dev_root_gen;</div><div class='del'>-</div><div class='del'>-	__le64 csum_root;</div><div class='del'>-	__le64 csum_root_gen;</div><div class='del'>-</div><div class='del'>-	__le64 total_bytes;</div><div class='del'>-	__le64 bytes_used;</div><div class='del'>-	__le64 num_devices;</div><div class='del'>-	/* future */</div><div class='del'>-	__le64 unused_64[4];</div><div class='del'>-</div><div class='del'>-	u8 tree_root_level;</div><div class='del'>-	u8 chunk_root_level;</div><div class='del'>-	u8 extent_root_level;</div><div class='del'>-	u8 fs_root_level;</div><div class='del'>-	u8 dev_root_level;</div><div class='del'>-	u8 csum_root_level;</div><div class='del'>-	/* future and to align */</div><div class='del'>-	u8 unused_8[10];</div><div class='del'>-} __attribute__ ((__packed__));</div><div class='del'>-</div><div class='del'>-#define BTRFS_SUPER_INFO_OFFSET			SZ_64K</div><div class='del'>-#define BTRFS_SUPER_INFO_SIZE			4096</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * the super block basically lists the main trees of the FS</div><div class='del'>- * it currently lacks any block count etc etc</div><div class='del'>- */</div><div class='del'>-struct btrfs_super_block {</div><div class='del'>-	/* the first 4 fields must match struct btrfs_header */</div><div class='del'>-	u8 csum[BTRFS_CSUM_SIZE];</div><div class='del'>-	/* FS specific UUID, visible to user */</div><div class='del'>-	u8 fsid[BTRFS_FSID_SIZE];</div><div class='del'>-	__le64 bytenr; /* this block number */</div><div class='del'>-	__le64 flags;</div><div class='del'>-</div><div class='del'>-	/* allowed to be different from the btrfs_header from here own down */</div><div class='del'>-	__le64 magic;</div><div class='del'>-	__le64 generation;</div><div class='del'>-	__le64 root;</div><div class='del'>-	__le64 chunk_root;</div><div class='del'>-	__le64 log_root;</div><div class='del'>-</div><div class='del'>-	/* this will help find the new super based on the log root */</div><div class='del'>-	__le64 log_root_transid;</div><div class='del'>-	__le64 total_bytes;</div><div class='del'>-	__le64 bytes_used;</div><div class='del'>-	__le64 root_dir_objectid;</div><div class='del'>-	__le64 num_devices;</div><div class='del'>-	__le32 sectorsize;</div><div class='del'>-	__le32 nodesize;</div><div class='del'>-	__le32 __unused_leafsize;</div><div class='del'>-	__le32 stripesize;</div><div class='del'>-	__le32 sys_chunk_array_size;</div><div class='del'>-	__le64 chunk_root_generation;</div><div class='del'>-	__le64 compat_flags;</div><div class='del'>-	__le64 compat_ro_flags;</div><div class='del'>-	__le64 incompat_flags;</div><div class='del'>-	__le16 csum_type;</div><div class='del'>-	u8 root_level;</div><div class='del'>-	u8 chunk_root_level;</div><div class='del'>-	u8 log_root_level;</div><div class='del'>-	struct btrfs_dev_item dev_item;</div><div class='del'>-</div><div class='del'>-	char label[BTRFS_LABEL_SIZE];</div><div class='del'>-</div><div class='del'>-	__le64 cache_generation;</div><div class='del'>-	__le64 uuid_tree_generation;</div><div class='del'>-</div><div class='del'>-	/* the UUID written into btree blocks */</div><div class='del'>-	u8 metadata_uuid[BTRFS_FSID_SIZE];</div><div class='del'>-</div><div class='del'>-	/* future expansion */</div><div class='del'>-	__le64 reserved[28];</div><div class='del'>-	u8 sys_chunk_array[BTRFS_SYSTEM_CHUNK_ARRAY_SIZE];</div><div class='del'>-	struct btrfs_root_backup super_roots[BTRFS_NUM_BACKUP_ROOTS];</div><div class='del'>-</div><div class='del'>-	/* Padded to 4096 bytes */</div><div class='del'>-	u8 padding[565];</div><div class='del'>-} __attribute__ ((__packed__));</div><div class='del'>-static_assert(sizeof(struct btrfs_super_block) == BTRFS_SUPER_INFO_SIZE);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Compat flags that we support.  If any incompat flags are set other than the</div><div class='del'>- * ones specified below then we will fail to mount</div><div class='del'>- */</div><div class='del'>-#define BTRFS_FEATURE_COMPAT_SUPP		0ULL</div><div class='del'>-#define BTRFS_FEATURE_COMPAT_SAFE_SET		0ULL</div><div class='del'>-#define BTRFS_FEATURE_COMPAT_SAFE_CLEAR		0ULL</div><div class='del'>-</div><div class='del'>-#define BTRFS_FEATURE_COMPAT_RO_SUPP			\</div><div class='del'>-	(BTRFS_FEATURE_COMPAT_RO_FREE_SPACE_TREE |	\</div><div class='del'>-	 BTRFS_FEATURE_COMPAT_RO_FREE_SPACE_TREE_VALID | \</div><div class='del'>-	 BTRFS_FEATURE_COMPAT_RO_VERITY)</div><div class='del'>-</div><div class='del'>-#define BTRFS_FEATURE_COMPAT_RO_SAFE_SET	0ULL</div><div class='del'>-#define BTRFS_FEATURE_COMPAT_RO_SAFE_CLEAR	0ULL</div><div class='del'>-</div><div class='del'>-#define BTRFS_FEATURE_INCOMPAT_SUPP			\</div><div class='del'>-	(BTRFS_FEATURE_INCOMPAT_MIXED_BACKREF |		\</div><div class='del'>-	 BTRFS_FEATURE_INCOMPAT_DEFAULT_SUBVOL |	\</div><div class='del'>-	 BTRFS_FEATURE_INCOMPAT_MIXED_GROUPS |		\</div><div class='del'>-	 BTRFS_FEATURE_INCOMPAT_BIG_METADATA |		\</div><div class='del'>-	 BTRFS_FEATURE_INCOMPAT_COMPRESS_LZO |		\</div><div class='del'>-	 BTRFS_FEATURE_INCOMPAT_COMPRESS_ZSTD |		\</div><div class='del'>-	 BTRFS_FEATURE_INCOMPAT_RAID56 |		\</div><div class='del'>-	 BTRFS_FEATURE_INCOMPAT_EXTENDED_IREF |		\</div><div class='del'>-	 BTRFS_FEATURE_INCOMPAT_SKINNY_METADATA |	\</div><div class='del'>-	 BTRFS_FEATURE_INCOMPAT_NO_HOLES	|	\</div><div class='del'>-	 BTRFS_FEATURE_INCOMPAT_METADATA_UUID	|	\</div><div class='del'>-	 BTRFS_FEATURE_INCOMPAT_RAID1C34	|	\</div><div class='del'>-	 BTRFS_FEATURE_INCOMPAT_ZONED)</div><div class='del'>-</div><div class='del'>-#define BTRFS_FEATURE_INCOMPAT_SAFE_SET			\</div><div class='del'>-	(BTRFS_FEATURE_INCOMPAT_EXTENDED_IREF)</div><div class='del'>-#define BTRFS_FEATURE_INCOMPAT_SAFE_CLEAR		0ULL</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * A leaf is full of items. offset and size tell us where to find</div><div class='del'>- * the item in the leaf (relative to the start of the data area)</div><div class='del'>- */</div><div class='del'>-struct btrfs_item {</div><div class='del'>-	struct btrfs_disk_key key;</div><div class='del'>-	__le32 offset;</div><div class='del'>-	__le32 size;</div><div class='del'>-} __attribute__ ((__packed__));</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * leaves have an item area and a data area:</div><div class='del'>- * [item0, item1....itemN] [free space] [dataN...data1, data0]</div><div class='del'>- *</div><div class='del'>- * The data is separate from the items to get the keys closer together</div><div class='del'>- * during searches.</div><div class='del'>- */</div><div class='del'>-struct btrfs_leaf {</div><div class='del'>-	struct btrfs_header header;</div><div class='del'>-	struct btrfs_item items[];</div><div class='del'>-} __attribute__ ((__packed__));</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * all non-leaf blocks are nodes, they hold only keys and pointers to</div><div class='del'>- * other blocks</div><div class='del'>- */</div><div class='del'>-struct btrfs_key_ptr {</div><div class='del'>-	struct btrfs_disk_key key;</div><div class='del'>-	__le64 blockptr;</div><div class='del'>-	__le64 generation;</div><div class='del'>-} __attribute__ ((__packed__));</div><div class='del'>-</div><div class='del'>-struct btrfs_node {</div><div class='del'>-	struct btrfs_header header;</div><div class='del'>-	struct btrfs_key_ptr ptrs[];</div><div class='del'>-} __attribute__ ((__packed__));</div><div class='ctx'> </div><div class='ctx'> /* Read ahead values for struct btrfs_path.reada */</div><div class='ctx'> enum {</div><div class='hunk'>@@ -386,675 +59,31 @@ struct btrfs_path {</div><div class='ctx'> 	/* if there is real range locking, this locks field will change */</div><div class='ctx'> 	u8 locks[BTRFS_MAX_LEVEL];</div><div class='ctx'> 	u8 reada;</div><div class='del'>-	/* keep some upper locks as we walk down */</div><div class='ctx'> 	u8 lowest_level;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * set by btrfs_split_item, tells search_slot to keep all locks</div><div class='ctx'> 	 * and to force calls to keep space in the nodes</div><div class='ctx'> 	 */</div><div class='del'>-	unsigned int search_for_split:1;</div><div class='del'>-	unsigned int keep_locks:1;</div><div class='del'>-	unsigned int skip_locking:1;</div><div class='del'>-	unsigned int search_commit_root:1;</div><div class='del'>-	unsigned int need_commit_sem:1;</div><div class='del'>-	unsigned int skip_release_on_error:1;</div><div class='add'>+	bool search_for_split:1;</div><div class='add'>+	/* Keep some upper locks as we walk down. */</div><div class='add'>+	bool keep_locks:1;</div><div class='add'>+	bool skip_locking:1;</div><div class='add'>+	bool search_commit_root:1;</div><div class='add'>+	bool need_commit_sem:1;</div><div class='add'>+	bool skip_release_on_error:1;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Indicate that new item (btrfs_search_slot) is extending already</div><div class='ctx'> 	 * existing item and ins_len contains only the data size and not item</div><div class='ctx'> 	 * header (ie. sizeof(struct btrfs_item) is not included).</div><div class='ctx'> 	 */</div><div class='del'>-	unsigned int search_for_extension:1;</div><div class='del'>-};</div><div class='del'>-#define BTRFS_MAX_EXTENT_ITEM_SIZE(r) ((BTRFS_LEAF_DATA_SIZE(r-&gt;fs_info) &gt;&gt; 4) - \</div><div class='del'>-					sizeof(struct btrfs_item))</div><div class='del'>-struct btrfs_dev_replace {</div><div class='del'>-	u64 replace_state;	/* see #define above */</div><div class='del'>-	time64_t time_started;	/* seconds since 1-Jan-1970 */</div><div class='del'>-	time64_t time_stopped;	/* seconds since 1-Jan-1970 */</div><div class='del'>-	atomic64_t num_write_errors;</div><div class='del'>-	atomic64_t num_uncorrectable_read_errors;</div><div class='del'>-</div><div class='del'>-	u64 cursor_left;</div><div class='del'>-	u64 committed_cursor_left;</div><div class='del'>-	u64 cursor_left_last_write_of_item;</div><div class='del'>-	u64 cursor_right;</div><div class='del'>-</div><div class='del'>-	u64 cont_reading_from_srcdev_mode;	/* see #define above */</div><div class='del'>-</div><div class='del'>-	int is_valid;</div><div class='del'>-	int item_needs_writeback;</div><div class='del'>-	struct btrfs_device *srcdev;</div><div class='del'>-	struct btrfs_device *tgtdev;</div><div class='del'>-</div><div class='del'>-	struct mutex lock_finishing_cancel_unmount;</div><div class='del'>-	struct rw_semaphore rwsem;</div><div class='del'>-</div><div class='del'>-	struct btrfs_scrub_progress scrub_progress;</div><div class='del'>-</div><div class='del'>-	struct percpu_counter bio_counter;</div><div class='del'>-	wait_queue_head_t replace_wait;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * free clusters are used to claim free space in relatively large chunks,</div><div class='del'>- * allowing us to do less seeky writes. They are used for all metadata</div><div class='del'>- * allocations. In ssd_spread mode they are also used for data allocations.</div><div class='del'>- */</div><div class='del'>-struct btrfs_free_cluster {</div><div class='del'>-	spinlock_t lock;</div><div class='del'>-	spinlock_t refill_lock;</div><div class='del'>-	struct rb_root root;</div><div class='del'>-</div><div class='del'>-	/* largest extent in this cluster */</div><div class='del'>-	u64 max_size;</div><div class='del'>-</div><div class='del'>-	/* first extent starting offset */</div><div class='del'>-	u64 window_start;</div><div class='del'>-</div><div class='del'>-	/* We did a full search and couldn't create a cluster */</div><div class='del'>-	bool fragmented;</div><div class='del'>-</div><div class='del'>-	struct btrfs_block_group *block_group;</div><div class='del'>-	/*</div><div class='del'>-	 * when a cluster is allocated from a block group, we put the</div><div class='del'>-	 * cluster onto a list in the block group so that it can</div><div class='del'>-	 * be freed before the block group is freed.</div><div class='del'>-	 */</div><div class='del'>-	struct list_head block_group_list;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-enum btrfs_caching_type {</div><div class='del'>-	BTRFS_CACHE_NO,</div><div class='del'>-	BTRFS_CACHE_STARTED,</div><div class='del'>-	BTRFS_CACHE_FAST,</div><div class='del'>-	BTRFS_CACHE_FINISHED,</div><div class='del'>-	BTRFS_CACHE_ERROR,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Tree to record all locked full stripes of a RAID5/6 block group</div><div class='del'>- */</div><div class='del'>-struct btrfs_full_stripe_locks_tree {</div><div class='del'>-	struct rb_root root;</div><div class='del'>-	struct mutex lock;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/* Discard control. */</div><div class='del'>-/*</div><div class='del'>- * Async discard uses multiple lists to differentiate the discard filter</div><div class='del'>- * parameters.  Index 0 is for completely free block groups where we need to</div><div class='del'>- * ensure the entire block group is trimmed without being lossy.  Indices</div><div class='del'>- * afterwards represent monotonically decreasing discard filter sizes to</div><div class='del'>- * prioritize what should be discarded next.</div><div class='del'>- */</div><div class='del'>-#define BTRFS_NR_DISCARD_LISTS		3</div><div class='del'>-#define BTRFS_DISCARD_INDEX_UNUSED	0</div><div class='del'>-#define BTRFS_DISCARD_INDEX_START	1</div><div class='del'>-</div><div class='del'>-struct btrfs_discard_ctl {</div><div class='del'>-	struct workqueue_struct *discard_workers;</div><div class='del'>-	struct delayed_work work;</div><div class='del'>-	spinlock_t lock;</div><div class='del'>-	struct btrfs_block_group *block_group;</div><div class='del'>-	struct list_head discard_list[BTRFS_NR_DISCARD_LISTS];</div><div class='del'>-	u64 prev_discard;</div><div class='del'>-	u64 prev_discard_time;</div><div class='del'>-	atomic_t discardable_extents;</div><div class='del'>-	atomic64_t discardable_bytes;</div><div class='del'>-	u64 max_discard_size;</div><div class='del'>-	u64 delay_ms;</div><div class='del'>-	u32 iops_limit;</div><div class='del'>-	u32 kbps_limit;</div><div class='del'>-	u64 discard_extent_bytes;</div><div class='del'>-	u64 discard_bitmap_bytes;</div><div class='del'>-	atomic64_t discard_bytes_saved;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-enum btrfs_orphan_cleanup_state {</div><div class='del'>-	ORPHAN_CLEANUP_STARTED	= 1,</div><div class='del'>-	ORPHAN_CLEANUP_DONE	= 2,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-void btrfs_init_async_reclaim_work(struct btrfs_fs_info *fs_info);</div><div class='del'>-</div><div class='del'>-/* fs_info */</div><div class='del'>-struct reloc_control;</div><div class='del'>-struct btrfs_device;</div><div class='del'>-struct btrfs_fs_devices;</div><div class='del'>-struct btrfs_balance_control;</div><div class='del'>-struct btrfs_delayed_root;</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Block group or device which contains an active swapfile. Used for preventing</div><div class='del'>- * unsafe operations while a swapfile is active.</div><div class='del'>- *</div><div class='del'>- * These are sorted on (ptr, inode) (note that a block group or device can</div><div class='del'>- * contain more than one swapfile). We compare the pointer values because we</div><div class='del'>- * don't actually care what the object is, we just need a quick check whether</div><div class='del'>- * the object exists in the rbtree.</div><div class='del'>- */</div><div class='del'>-struct btrfs_swapfile_pin {</div><div class='del'>-	struct rb_node node;</div><div class='del'>-	void *ptr;</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	/*</div><div class='del'>-	 * If true, ptr points to a struct btrfs_block_group. Otherwise, ptr</div><div class='del'>-	 * points to a struct btrfs_device.</div><div class='del'>-	 */</div><div class='del'>-	bool is_block_group;</div><div class='del'>-	/*</div><div class='del'>-	 * Only used when 'is_block_group' is true and it is the number of</div><div class='del'>-	 * extents used by a swapfile for this block group ('ptr' field).</div><div class='del'>-	 */</div><div class='del'>-	int bg_extent_count;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-bool btrfs_pinned_by_swapfile(struct btrfs_fs_info *fs_info, void *ptr);</div><div class='del'>-</div><div class='del'>-enum {</div><div class='del'>-	BTRFS_FS_BARRIER,</div><div class='del'>-	BTRFS_FS_CLOSING_START,</div><div class='del'>-	BTRFS_FS_CLOSING_DONE,</div><div class='del'>-	BTRFS_FS_LOG_RECOVERING,</div><div class='del'>-	BTRFS_FS_OPEN,</div><div class='del'>-	BTRFS_FS_QUOTA_ENABLED,</div><div class='del'>-	BTRFS_FS_UPDATE_UUID_TREE_GEN,</div><div class='del'>-	BTRFS_FS_CREATING_FREE_SPACE_TREE,</div><div class='del'>-	BTRFS_FS_BTREE_ERR,</div><div class='del'>-	BTRFS_FS_LOG1_ERR,</div><div class='del'>-	BTRFS_FS_LOG2_ERR,</div><div class='del'>-	BTRFS_FS_QUOTA_OVERRIDE,</div><div class='del'>-	/* Used to record internally whether fs has been frozen */</div><div class='del'>-	BTRFS_FS_FROZEN,</div><div class='del'>-	/*</div><div class='del'>-	 * Indicate that balance has been set up from the ioctl and is in the</div><div class='del'>-	 * main phase. The fs_info::balance_ctl is initialized.</div><div class='del'>-	 */</div><div class='del'>-	BTRFS_FS_BALANCE_RUNNING,</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Indicate that relocation of a chunk has started, it's set per chunk</div><div class='del'>-	 * and is toggled between chunks.</div><div class='del'>-	 * Set, tested and cleared while holding fs_info::send_reloc_lock.</div><div class='del'>-	 */</div><div class='del'>-	BTRFS_FS_RELOC_RUNNING,</div><div class='del'>-</div><div class='del'>-	/* Indicate that the cleaner thread is awake and doing something. */</div><div class='del'>-	BTRFS_FS_CLEANER_RUNNING,</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * The checksumming has an optimized version and is considered fast,</div><div class='del'>-	 * so we don't need to offload checksums to workqueues.</div><div class='del'>-	 */</div><div class='del'>-	BTRFS_FS_CSUM_IMPL_FAST,</div><div class='del'>-</div><div class='del'>-	/* Indicate that the discard workqueue can service discards. */</div><div class='del'>-	BTRFS_FS_DISCARD_RUNNING,</div><div class='del'>-</div><div class='del'>-	/* Indicate that we need to cleanup space cache v1 */</div><div class='del'>-	BTRFS_FS_CLEANUP_SPACE_CACHE_V1,</div><div class='del'>-</div><div class='del'>-	/* Indicate that we can't trust the free space tree for caching yet */</div><div class='del'>-	BTRFS_FS_FREE_SPACE_TREE_UNTRUSTED,</div><div class='del'>-</div><div class='del'>-	/* Indicate whether there are any tree modification log users */</div><div class='del'>-	BTRFS_FS_TREE_MOD_LOG_USERS,</div><div class='del'>-</div><div class='del'>-#if BITS_PER_LONG == 32</div><div class='del'>-	/* Indicate if we have error/warn message printed on 32bit systems */</div><div class='del'>-	BTRFS_FS_32BIT_ERROR,</div><div class='del'>-	BTRFS_FS_32BIT_WARN,</div><div class='del'>-#endif</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Exclusive operations (device replace, resize, device add/remove, balance)</div><div class='del'>- */</div><div class='del'>-enum btrfs_exclusive_operation {</div><div class='del'>-	BTRFS_EXCLOP_NONE,</div><div class='del'>-	BTRFS_EXCLOP_BALANCE,</div><div class='del'>-	BTRFS_EXCLOP_DEV_ADD,</div><div class='del'>-	BTRFS_EXCLOP_DEV_REMOVE,</div><div class='del'>-	BTRFS_EXCLOP_DEV_REPLACE,</div><div class='del'>-	BTRFS_EXCLOP_RESIZE,</div><div class='del'>-	BTRFS_EXCLOP_SWAP_ACTIVATE,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct btrfs_fs_info {</div><div class='del'>-	u8 chunk_tree_uuid[BTRFS_UUID_SIZE];</div><div class='del'>-	unsigned long flags;</div><div class='del'>-	struct btrfs_root *extent_root;</div><div class='del'>-	struct btrfs_root *tree_root;</div><div class='del'>-	struct btrfs_root *chunk_root;</div><div class='del'>-	struct btrfs_root *dev_root;</div><div class='del'>-	struct btrfs_root *fs_root;</div><div class='del'>-	struct btrfs_root *csum_root;</div><div class='del'>-	struct btrfs_root *quota_root;</div><div class='del'>-	struct btrfs_root *uuid_root;</div><div class='del'>-	struct btrfs_root *free_space_root;</div><div class='del'>-	struct btrfs_root *data_reloc_root;</div><div class='del'>-</div><div class='del'>-	/* the log root tree is a directory of all the other log roots */</div><div class='del'>-	struct btrfs_root *log_root_tree;</div><div class='del'>-</div><div class='del'>-	spinlock_t fs_roots_radix_lock;</div><div class='del'>-	struct radix_tree_root fs_roots_radix;</div><div class='del'>-</div><div class='del'>-	/* block group cache stuff */</div><div class='del'>-	spinlock_t block_group_cache_lock;</div><div class='del'>-	u64 first_logical_byte;</div><div class='del'>-	struct rb_root block_group_cache_tree;</div><div class='del'>-</div><div class='del'>-	/* keep track of unallocated space */</div><div class='del'>-	atomic64_t free_chunk_space;</div><div class='del'>-</div><div class='del'>-	/* Track ranges which are used by log trees blocks/logged data extents */</div><div class='del'>-	struct extent_io_tree excluded_extents;</div><div class='del'>-</div><div class='del'>-	/* logical-&gt;physical extent mapping */</div><div class='del'>-	struct extent_map_tree mapping_tree;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * block reservation for extent, checksum, root tree and</div><div class='del'>-	 * delayed dir index item</div><div class='del'>-	 */</div><div class='del'>-	struct btrfs_block_rsv global_block_rsv;</div><div class='del'>-	/* block reservation for metadata operations */</div><div class='del'>-	struct btrfs_block_rsv trans_block_rsv;</div><div class='del'>-	/* block reservation for chunk tree */</div><div class='del'>-	struct btrfs_block_rsv chunk_block_rsv;</div><div class='del'>-	/* block reservation for delayed operations */</div><div class='del'>-	struct btrfs_block_rsv delayed_block_rsv;</div><div class='del'>-	/* block reservation for delayed refs */</div><div class='del'>-	struct btrfs_block_rsv delayed_refs_rsv;</div><div class='del'>-</div><div class='del'>-	struct btrfs_block_rsv empty_block_rsv;</div><div class='del'>-</div><div class='del'>-	u64 generation;</div><div class='del'>-	u64 last_trans_committed;</div><div class='del'>-	u64 avg_delayed_ref_runtime;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * this is updated to the current trans every time a full commit</div><div class='del'>-	 * is required instead of the faster short fsync log commits</div><div class='del'>-	 */</div><div class='del'>-	u64 last_trans_log_full_commit;</div><div class='del'>-	unsigned long mount_opt;</div><div class='del'>-	/*</div><div class='del'>-	 * Track requests for actions that need to be done during transaction</div><div class='del'>-	 * commit (like for some mount options).</div><div class='del'>-	 */</div><div class='del'>-	unsigned long pending_changes;</div><div class='del'>-	unsigned long compress_type:4;</div><div class='del'>-	unsigned int compress_level;</div><div class='del'>-	u32 commit_interval;</div><div class='del'>-	/*</div><div class='del'>-	 * It is a suggestive number, the read side is safe even it gets a</div><div class='del'>-	 * wrong number because we will write out the data into a regular</div><div class='del'>-	 * extent. The write side(mount/remount) is under -&gt;s_umount lock,</div><div class='del'>-	 * so it is also safe.</div><div class='del'>-	 */</div><div class='del'>-	u64 max_inline;</div><div class='del'>-</div><div class='del'>-	struct btrfs_transaction *running_transaction;</div><div class='del'>-	wait_queue_head_t transaction_throttle;</div><div class='del'>-	wait_queue_head_t transaction_wait;</div><div class='del'>-	wait_queue_head_t transaction_blocked_wait;</div><div class='del'>-	wait_queue_head_t async_submit_wait;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Used to protect the incompat_flags, compat_flags, compat_ro_flags</div><div class='del'>-	 * when they are updated.</div><div class='del'>-	 *</div><div class='del'>-	 * Because we do not clear the flags for ever, so we needn't use</div><div class='del'>-	 * the lock on the read side.</div><div class='del'>-	 *</div><div class='del'>-	 * We also needn't use the lock when we mount the fs, because</div><div class='del'>-	 * there is no other task which will update the flag.</div><div class='del'>-	 */</div><div class='del'>-	spinlock_t super_lock;</div><div class='del'>-	struct btrfs_super_block *super_copy;</div><div class='del'>-	struct btrfs_super_block *super_for_commit;</div><div class='del'>-	struct super_block *sb;</div><div class='del'>-	struct inode *btree_inode;</div><div class='del'>-	struct mutex tree_log_mutex;</div><div class='del'>-	struct mutex transaction_kthread_mutex;</div><div class='del'>-	struct mutex cleaner_mutex;</div><div class='del'>-	struct mutex chunk_mutex;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * this is taken to make sure we don't set block groups ro after</div><div class='del'>-	 * the free space cache has been allocated on them</div><div class='del'>-	 */</div><div class='del'>-	struct mutex ro_block_group_mutex;</div><div class='del'>-</div><div class='del'>-	/* this is used during read/modify/write to make sure</div><div class='del'>-	 * no two ios are trying to mod the same stripe at the same</div><div class='del'>-	 * time</div><div class='del'>-	 */</div><div class='del'>-	struct btrfs_stripe_hash_table *stripe_hash_table;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * this protects the ordered operations list only while we are</div><div class='del'>-	 * processing all of the entries on it.  This way we make</div><div class='del'>-	 * sure the commit code doesn't find the list temporarily empty</div><div class='del'>-	 * because another function happens to be doing non-waiting preflush</div><div class='del'>-	 * before jumping into the main commit.</div><div class='del'>-	 */</div><div class='del'>-	struct mutex ordered_operations_mutex;</div><div class='del'>-</div><div class='del'>-	struct rw_semaphore commit_root_sem;</div><div class='del'>-</div><div class='del'>-	struct rw_semaphore cleanup_work_sem;</div><div class='del'>-</div><div class='del'>-	struct rw_semaphore subvol_sem;</div><div class='del'>-</div><div class='del'>-	spinlock_t trans_lock;</div><div class='del'>-	/*</div><div class='del'>-	 * the reloc mutex goes with the trans lock, it is taken</div><div class='del'>-	 * during commit to protect us from the relocation code</div><div class='del'>-	 */</div><div class='del'>-	struct mutex reloc_mutex;</div><div class='del'>-</div><div class='del'>-	struct list_head trans_list;</div><div class='del'>-	struct list_head dead_roots;</div><div class='del'>-	struct list_head caching_block_groups;</div><div class='del'>-</div><div class='del'>-	spinlock_t delayed_iput_lock;</div><div class='del'>-	struct list_head delayed_iputs;</div><div class='del'>-	atomic_t nr_delayed_iputs;</div><div class='del'>-	wait_queue_head_t delayed_iputs_wait;</div><div class='del'>-</div><div class='del'>-	atomic64_t tree_mod_seq;</div><div class='del'>-</div><div class='del'>-	/* this protects tree_mod_log and tree_mod_seq_list */</div><div class='del'>-	rwlock_t tree_mod_log_lock;</div><div class='del'>-	struct rb_root tree_mod_log;</div><div class='del'>-	struct list_head tree_mod_seq_list;</div><div class='del'>-</div><div class='del'>-	atomic_t async_delalloc_pages;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * this is used to protect the following list -- ordered_roots.</div><div class='del'>-	 */</div><div class='del'>-	spinlock_t ordered_root_lock;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * all fs/file tree roots in which there are data=ordered extents</div><div class='del'>-	 * pending writeback are added into this list.</div><div class='del'>-	 *</div><div class='del'>-	 * these can span multiple transactions and basically include</div><div class='del'>-	 * every dirty data page that isn't from nodatacow</div><div class='del'>-	 */</div><div class='del'>-	struct list_head ordered_roots;</div><div class='del'>-</div><div class='del'>-	struct mutex delalloc_root_mutex;</div><div class='del'>-	spinlock_t delalloc_root_lock;</div><div class='del'>-	/* all fs/file tree roots that have delalloc inodes. */</div><div class='del'>-	struct list_head delalloc_roots;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * there is a pool of worker threads for checksumming during writes</div><div class='del'>-	 * and a pool for checksumming after reads.  This is because readers</div><div class='del'>-	 * can run with FS locks held, and the writers may be waiting for</div><div class='del'>-	 * those locks.  We don't want ordering in the pending list to cause</div><div class='del'>-	 * deadlocks, and so the two are serviced separately.</div><div class='del'>-	 *</div><div class='del'>-	 * A third pool does submit_bio to avoid deadlocking with the other</div><div class='del'>-	 * two</div><div class='del'>-	 */</div><div class='del'>-	struct btrfs_workqueue *workers;</div><div class='del'>-	struct btrfs_workqueue *delalloc_workers;</div><div class='del'>-	struct btrfs_workqueue *flush_workers;</div><div class='del'>-	struct btrfs_workqueue *endio_workers;</div><div class='del'>-	struct btrfs_workqueue *endio_meta_workers;</div><div class='del'>-	struct btrfs_workqueue *endio_raid56_workers;</div><div class='del'>-	struct btrfs_workqueue *rmw_workers;</div><div class='del'>-	struct btrfs_workqueue *endio_meta_write_workers;</div><div class='del'>-	struct btrfs_workqueue *endio_write_workers;</div><div class='del'>-	struct btrfs_workqueue *endio_freespace_worker;</div><div class='del'>-	struct btrfs_workqueue *caching_workers;</div><div class='del'>-	struct btrfs_workqueue *readahead_workers;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * fixup workers take dirty pages that didn't properly go through</div><div class='del'>-	 * the cow mechanism and make them safe to write.  It happens</div><div class='del'>-	 * for the sys_munmap function call path</div><div class='del'>-	 */</div><div class='del'>-	struct btrfs_workqueue *fixup_workers;</div><div class='del'>-	struct btrfs_workqueue *delayed_workers;</div><div class='del'>-</div><div class='del'>-	struct task_struct *transaction_kthread;</div><div class='del'>-	struct task_struct *cleaner_kthread;</div><div class='del'>-	u32 thread_pool_size;</div><div class='del'>-</div><div class='del'>-	struct kobject *space_info_kobj;</div><div class='del'>-	struct kobject *qgroups_kobj;</div><div class='del'>-</div><div class='del'>-	/* used to keep from writing metadata until there is a nice batch */</div><div class='del'>-	struct percpu_counter dirty_metadata_bytes;</div><div class='del'>-	struct percpu_counter delalloc_bytes;</div><div class='del'>-	struct percpu_counter ordered_bytes;</div><div class='del'>-	s32 dirty_metadata_batch;</div><div class='del'>-	s32 delalloc_batch;</div><div class='del'>-</div><div class='del'>-	struct list_head dirty_cowonly_roots;</div><div class='del'>-</div><div class='del'>-	struct btrfs_fs_devices *fs_devices;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * The space_info list is effectively read only after initial</div><div class='del'>-	 * setup.  It is populated at mount time and cleaned up after</div><div class='del'>-	 * all block groups are removed.  RCU is used to protect it.</div><div class='del'>-	 */</div><div class='del'>-	struct list_head space_info;</div><div class='del'>-</div><div class='del'>-	struct btrfs_space_info *data_sinfo;</div><div class='del'>-</div><div class='del'>-	struct reloc_control *reloc_ctl;</div><div class='del'>-</div><div class='del'>-	/* data_alloc_cluster is only used in ssd_spread mode */</div><div class='del'>-	struct btrfs_free_cluster data_alloc_cluster;</div><div class='del'>-</div><div class='del'>-	/* all metadata allocations go through this cluster */</div><div class='del'>-	struct btrfs_free_cluster meta_alloc_cluster;</div><div class='del'>-</div><div class='del'>-	/* auto defrag inodes go here */</div><div class='del'>-	spinlock_t defrag_inodes_lock;</div><div class='del'>-	struct rb_root defrag_inodes;</div><div class='del'>-	atomic_t defrag_running;</div><div class='del'>-</div><div class='del'>-	/* Used to protect avail_{data, metadata, system}_alloc_bits */</div><div class='del'>-	seqlock_t profiles_lock;</div><div class='del'>-	/*</div><div class='del'>-	 * these three are in extended format (availability of single</div><div class='del'>-	 * chunks is denoted by BTRFS_AVAIL_ALLOC_BIT_SINGLE bit, other</div><div class='del'>-	 * types are denoted by corresponding BTRFS_BLOCK_GROUP_* bits)</div><div class='del'>-	 */</div><div class='del'>-	u64 avail_data_alloc_bits;</div><div class='del'>-	u64 avail_metadata_alloc_bits;</div><div class='del'>-	u64 avail_system_alloc_bits;</div><div class='del'>-</div><div class='del'>-	/* restriper state */</div><div class='del'>-	spinlock_t balance_lock;</div><div class='del'>-	struct mutex balance_mutex;</div><div class='del'>-	atomic_t balance_pause_req;</div><div class='del'>-	atomic_t balance_cancel_req;</div><div class='del'>-	struct btrfs_balance_control *balance_ctl;</div><div class='del'>-	wait_queue_head_t balance_wait_q;</div><div class='del'>-</div><div class='del'>-	/* Cancellation requests for chunk relocation */</div><div class='del'>-	atomic_t reloc_cancel_req;</div><div class='del'>-</div><div class='del'>-	u32 data_chunk_allocations;</div><div class='del'>-	u32 metadata_ratio;</div><div class='del'>-</div><div class='del'>-	void *bdev_holder;</div><div class='del'>-</div><div class='del'>-	/* private scrub information */</div><div class='del'>-	struct mutex scrub_lock;</div><div class='del'>-	atomic_t scrubs_running;</div><div class='del'>-	atomic_t scrub_pause_req;</div><div class='del'>-	atomic_t scrubs_paused;</div><div class='del'>-	atomic_t scrub_cancel_req;</div><div class='del'>-	wait_queue_head_t scrub_pause_wait;</div><div class='del'>-	/*</div><div class='del'>-	 * The worker pointers are NULL iff the refcount is 0, ie. scrub is not</div><div class='del'>-	 * running.</div><div class='del'>-	 */</div><div class='del'>-	refcount_t scrub_workers_refcnt;</div><div class='del'>-	struct btrfs_workqueue *scrub_workers;</div><div class='del'>-	struct btrfs_workqueue *scrub_wr_completion_workers;</div><div class='del'>-	struct btrfs_workqueue *scrub_parity_workers;</div><div class='del'>-	struct btrfs_subpage_info *subpage_info;</div><div class='del'>-</div><div class='del'>-	struct btrfs_discard_ctl discard_ctl;</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_BTRFS_FS_CHECK_INTEGRITY</div><div class='del'>-	u32 check_integrity_print_mask;</div><div class='del'>-#endif</div><div class='del'>-	/* is qgroup tracking in a consistent state? */</div><div class='del'>-	u64 qgroup_flags;</div><div class='del'>-</div><div class='del'>-	/* holds configuration and tracking. Protected by qgroup_lock */</div><div class='del'>-	struct rb_root qgroup_tree;</div><div class='del'>-	spinlock_t qgroup_lock;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * used to avoid frequently calling ulist_alloc()/ulist_free()</div><div class='del'>-	 * when doing qgroup accounting, it must be protected by qgroup_lock.</div><div class='del'>-	 */</div><div class='del'>-	struct ulist *qgroup_ulist;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Protect user change for quota operations. If a transaction is needed,</div><div class='del'>-	 * it must be started before locking this lock.</div><div class='del'>-	 */</div><div class='del'>-	struct mutex qgroup_ioctl_lock;</div><div class='del'>-</div><div class='del'>-	/* list of dirty qgroups to be written at next commit */</div><div class='del'>-	struct list_head dirty_qgroups;</div><div class='del'>-</div><div class='del'>-	/* used by qgroup for an efficient tree traversal */</div><div class='del'>-	u64 qgroup_seq;</div><div class='del'>-</div><div class='del'>-	/* qgroup rescan items */</div><div class='del'>-	struct mutex qgroup_rescan_lock; /* protects the progress item */</div><div class='del'>-	struct btrfs_key qgroup_rescan_progress;</div><div class='del'>-	struct btrfs_workqueue *qgroup_rescan_workers;</div><div class='del'>-	struct completion qgroup_rescan_completion;</div><div class='del'>-	struct btrfs_work qgroup_rescan_work;</div><div class='del'>-	bool qgroup_rescan_running;	/* protected by qgroup_rescan_lock */</div><div class='del'>-</div><div class='del'>-	/* filesystem state */</div><div class='del'>-	unsigned long fs_state;</div><div class='del'>-</div><div class='del'>-	struct btrfs_delayed_root *delayed_root;</div><div class='del'>-</div><div class='del'>-	/* readahead tree */</div><div class='del'>-	spinlock_t reada_lock;</div><div class='del'>-	struct radix_tree_root reada_tree;</div><div class='del'>-</div><div class='del'>-	/* readahead works cnt */</div><div class='del'>-	atomic_t reada_works_cnt;</div><div class='del'>-</div><div class='del'>-	/* Extent buffer radix tree */</div><div class='del'>-	spinlock_t buffer_lock;</div><div class='del'>-	/* Entries are eb-&gt;start / sectorsize */</div><div class='del'>-	struct radix_tree_root buffer_radix;</div><div class='del'>-</div><div class='del'>-	/* next backup root to be overwritten */</div><div class='del'>-	int backup_root_index;</div><div class='del'>-</div><div class='del'>-	/* device replace state */</div><div class='del'>-	struct btrfs_dev_replace dev_replace;</div><div class='del'>-</div><div class='del'>-	struct semaphore uuid_tree_rescan_sem;</div><div class='del'>-</div><div class='del'>-	/* Used to reclaim the metadata space in the background. */</div><div class='del'>-	struct work_struct async_reclaim_work;</div><div class='del'>-	struct work_struct async_data_reclaim_work;</div><div class='del'>-	struct work_struct preempt_reclaim_work;</div><div class='del'>-</div><div class='del'>-	/* Reclaim partially filled block groups in the background */</div><div class='del'>-	struct work_struct reclaim_bgs_work;</div><div class='del'>-	struct list_head reclaim_bgs;</div><div class='del'>-	int bg_reclaim_threshold;</div><div class='del'>-</div><div class='del'>-	spinlock_t unused_bgs_lock;</div><div class='del'>-	struct list_head unused_bgs;</div><div class='del'>-	struct mutex unused_bg_unpin_mutex;</div><div class='del'>-	/* Protect block groups that are going to be deleted */</div><div class='del'>-	struct mutex reclaim_bgs_lock;</div><div class='del'>-</div><div class='del'>-	/* Cached block sizes */</div><div class='del'>-	u32 nodesize;</div><div class='del'>-	u32 sectorsize;</div><div class='del'>-	/* ilog2 of sectorsize, use to avoid 64bit division */</div><div class='del'>-	u32 sectorsize_bits;</div><div class='del'>-	u32 csum_size;</div><div class='del'>-	u32 csums_per_leaf;</div><div class='del'>-	u32 stripesize;</div><div class='del'>-</div><div class='del'>-	/* Block groups and devices containing active swapfiles. */</div><div class='del'>-	spinlock_t swapfile_pins_lock;</div><div class='del'>-	struct rb_root swapfile_pins;</div><div class='del'>-</div><div class='del'>-	struct crypto_shash *csum_shash;</div><div class='del'>-</div><div class='del'>-	spinlock_t send_reloc_lock;</div><div class='del'>-	/*</div><div class='del'>-	 * Number of send operations in progress.</div><div class='del'>-	 * Updated while holding fs_info::send_reloc_lock.</div><div class='del'>-	 */</div><div class='del'>-	int send_in_progress;</div><div class='del'>-</div><div class='del'>-	/* Type of exclusive operation running, protected by super_lock */</div><div class='del'>-	enum btrfs_exclusive_operation exclusive_operation;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Zone size &gt; 0 when in ZONED mode, otherwise it's used for a check</div><div class='del'>-	 * if the mode is enabled</div><div class='del'>-	 */</div><div class='del'>-	union {</div><div class='del'>-		u64 zone_size;</div><div class='del'>-		u64 zoned;</div><div class='del'>-	};</div><div class='del'>-</div><div class='del'>-	struct mutex zoned_meta_io_lock;</div><div class='del'>-	spinlock_t treelog_bg_lock;</div><div class='del'>-	u64 treelog_bg;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Start of the dedicated data relocation block group, protected by</div><div class='del'>-	 * relocation_bg_lock.</div><div class='del'>-	 */</div><div class='del'>-	spinlock_t relocation_bg_lock;</div><div class='del'>-	u64 data_reloc_bg;</div><div class='del'>-</div><div class='del'>-	spinlock_t zone_active_bgs_lock;</div><div class='del'>-	struct list_head zone_active_bgs;</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_BTRFS_FS_REF_VERIFY</div><div class='del'>-	spinlock_t ref_verify_lock;</div><div class='del'>-	struct rb_root block_tree;</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_BTRFS_DEBUG</div><div class='del'>-	struct kobject *debug_kobj;</div><div class='del'>-	struct kobject *discard_debug_kobj;</div><div class='del'>-	struct list_head allocated_roots;</div><div class='del'>-</div><div class='del'>-	spinlock_t eb_leak_lock;</div><div class='del'>-	struct list_head allocated_ebs;</div><div class='del'>-#endif</div><div class='add'>+	bool search_for_extension:1;</div><div class='add'>+	/* Stop search if any locks need to be taken (for read) */</div><div class='add'>+	bool nowait:1;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static inline struct btrfs_fs_info *btrfs_sb(struct super_block *sb)</div><div class='del'>-{</div><div class='del'>-	return sb-&gt;s_fs_info;</div><div class='del'>-}</div><div class='add'>+#define BTRFS_PATH_AUTO_FREE(path_name)					\</div><div class='add'>+	struct btrfs_path *path_name __free(btrfs_free_path) = NULL</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * The state of btrfs root</div><div class='hunk'>@@ -1110,6 +139,12 @@ enum {</div><div class='ctx'> 	BTRFS_ROOT_HAS_LOG_TREE,</div><div class='ctx'> 	/* Qgroup flushing is in progress */</div><div class='ctx'> 	BTRFS_ROOT_QGROUP_FLUSHING,</div><div class='add'>+	/* We started the orphan cleanup for this root. */</div><div class='add'>+	BTRFS_ROOT_ORPHAN_CLEANUP,</div><div class='add'>+	/* This root has a drop operation that was started previously. */</div><div class='add'>+	BTRFS_ROOT_UNFINISHED_DROP,</div><div class='add'>+	/* This reloc root needs to have its buffers lockdep class reset. */</div><div class='add'>+	BTRFS_ROOT_RESET_LOCKDEP_CLASS,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1128,6 +163,8 @@ struct btrfs_qgroup_swapped_blocks {</div><div class='ctx'>  * and for the extent tree extent_root root.</div><div class='ctx'>  */</div><div class='ctx'> struct btrfs_root {</div><div class='add'>+	struct rb_node rb_node;</div><div class='add'>+</div><div class='ctx'> 	struct extent_buffer *node;</div><div class='ctx'> </div><div class='ctx'> 	struct extent_buffer *commit_root;</div><div class='hunk'>@@ -1154,17 +191,27 @@ struct btrfs_root {</div><div class='ctx'> 	atomic_t log_commit[2];</div><div class='ctx'> 	/* Used only for log trees of subvolumes, not for the log root tree */</div><div class='ctx'> 	atomic_t log_batch;</div><div class='add'>+	/*</div><div class='add'>+	 * Protected by the 'log_mutex' lock but can be read without holding</div><div class='add'>+	 * that lock to avoid unnecessary lock contention, in which case it</div><div class='add'>+	 * should be read using btrfs_get_root_log_transid() except if it's a</div><div class='add'>+	 * log tree in which case it can be directly accessed. Updates to this</div><div class='add'>+	 * field should always use btrfs_set_root_log_transid(), except for log</div><div class='add'>+	 * trees where the field can be updated directly.</div><div class='add'>+	 */</div><div class='ctx'> 	int log_transid;</div><div class='ctx'> 	/* No matter the commit succeeds or not*/</div><div class='ctx'> 	int log_transid_committed;</div><div class='del'>-	/* Just be updated when the commit succeeds. */</div><div class='add'>+	/*</div><div class='add'>+	 * Just be updated when the commit succeeds. Use</div><div class='add'>+	 * btrfs_get_root_last_log_commit() and btrfs_set_root_last_log_commit()</div><div class='add'>+	 * to access this field.</div><div class='add'>+	 */</div><div class='ctx'> 	int last_log_commit;</div><div class='ctx'> 	pid_t log_start_pid;</div><div class='ctx'> </div><div class='ctx'> 	u64 last_trans;</div><div class='ctx'> </div><div class='del'>-	u32 type;</div><div class='del'>-</div><div class='ctx'> 	u64 free_objectid;</div><div class='ctx'> </div><div class='ctx'> 	struct btrfs_key defrag_progress;</div><div class='hunk'>@@ -1175,20 +222,11 @@ struct btrfs_root {</div><div class='ctx'> </div><div class='ctx'> 	struct list_head root_list;</div><div class='ctx'> </div><div class='del'>-	spinlock_t log_extents_lock[2];</div><div class='del'>-	struct list_head logged_list[2];</div><div class='del'>-</div><div class='del'>-	int orphan_cleanup_state;</div><div class='del'>-</div><div class='del'>-	spinlock_t inode_lock;</div><div class='del'>-	/* red-black tree that keeps track of in-memory inodes */</div><div class='del'>-	struct rb_root inode_tree;</div><div class='add'>+	/* Xarray that keeps track of in-memory inodes. */</div><div class='add'>+	struct xarray inodes;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * radix tree that keeps track of delayed nodes of every inode,</div><div class='del'>-	 * protected by inode_lock</div><div class='del'>-	 */</div><div class='del'>-	struct radix_tree_root delayed_nodes_tree;</div><div class='add'>+	/* Xarray that keeps track of delayed nodes of every inode. */</div><div class='add'>+	struct xarray delayed_nodes;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * right now this just gets used so that a root has its own devid</div><div class='ctx'> 	 * for stat.  It may be used for more later</div><div class='hunk'>@@ -1264,6 +302,9 @@ struct btrfs_root {</div><div class='ctx'> 	/* Used only by log trees, when logging csum items */</div><div class='ctx'> 	struct extent_io_tree log_csum_range;</div><div class='ctx'> </div><div class='add'>+	/* Used in simple quotas, track root during relocation. */</div><div class='add'>+	u64 relocation_src_root;</div><div class='add'>+</div><div class='ctx'> #ifdef CONFIG_BTRFS_FS_RUN_SANITY_TESTS</div><div class='ctx'> 	u64 alloc_bytenr;</div><div class='ctx'> #endif</div><div class='hunk'>@@ -1273,6 +314,72 @@ struct btrfs_root {</div><div class='ctx'> #endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+static inline bool btrfs_root_readonly(const struct btrfs_root *root)</div><div class='add'>+{</div><div class='add'>+	/* Byte-swap the constant at compile time, root_item::flags is LE */</div><div class='add'>+	return (root-&gt;root_item.flags &amp; cpu_to_le64(BTRFS_ROOT_SUBVOL_RDONLY)) != 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool btrfs_root_dead(const struct btrfs_root *root)</div><div class='add'>+{</div><div class='add'>+	/* Byte-swap the constant at compile time, root_item::flags is LE */</div><div class='add'>+	return (root-&gt;root_item.flags &amp; cpu_to_le64(BTRFS_ROOT_SUBVOL_DEAD)) != 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline u64 btrfs_root_id(const struct btrfs_root *root)</div><div class='add'>+{</div><div class='add'>+	return root-&gt;root_key.objectid;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int btrfs_get_root_log_transid(const struct btrfs_root *root)</div><div class='add'>+{</div><div class='add'>+	return READ_ONCE(root-&gt;log_transid);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_set_root_log_transid(struct btrfs_root *root, int log_transid)</div><div class='add'>+{</div><div class='add'>+	WRITE_ONCE(root-&gt;log_transid, log_transid);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int btrfs_get_root_last_log_commit(const struct btrfs_root *root)</div><div class='add'>+{</div><div class='add'>+	return READ_ONCE(root-&gt;last_log_commit);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_set_root_last_log_commit(struct btrfs_root *root, int commit_id)</div><div class='add'>+{</div><div class='add'>+	WRITE_ONCE(root-&gt;last_log_commit, commit_id);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline u64 btrfs_get_root_last_trans(const struct btrfs_root *root)</div><div class='add'>+{</div><div class='add'>+	return READ_ONCE(root-&gt;last_trans);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_set_root_last_trans(struct btrfs_root *root, u64 transid)</div><div class='add'>+{</div><div class='add'>+	WRITE_ONCE(root-&gt;last_trans, transid);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Return the generation this root started with.</div><div class='add'>+ *</div><div class='add'>+ * Every normal root that is created with root-&gt;root_key.offset set to it's</div><div class='add'>+ * originating generation.  If it is a snapshot it is the generation when the</div><div class='add'>+ * snapshot was created.</div><div class='add'>+ *</div><div class='add'>+ * However for TREE_RELOC roots root_key.offset is the objectid of the owning</div><div class='add'>+ * tree root.  Thankfully we copy the root item of the owning tree root, which</div><div class='add'>+ * has it's last_snapshot set to what we would have root_key.offset set to, so</div><div class='add'>+ * return that if this is a TREE_RELOC root.</div><div class='add'>+ */</div><div class='add'>+static inline u64 btrfs_root_origin_generation(const struct btrfs_root *root)</div><div class='add'>+{</div><div class='add'>+	if (btrfs_root_id(root) == BTRFS_TREE_RELOC_OBJECTID)</div><div class='add'>+		return btrfs_root_last_snapshot(&amp;root-&gt;root_item);</div><div class='add'>+	return root-&gt;root_key.offset;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Structure that conveys information about an extent that is going to replace</div><div class='ctx'>  * all the extents in a file range.</div><div class='hunk'>@@ -1291,6 +398,8 @@ struct btrfs_replace_extent_info {</div><div class='ctx'> 	 * existing extent into a file range.</div><div class='ctx'> 	 */</div><div class='ctx'> 	bool is_new_extent;</div><div class='add'>+	/* Indicate if we should update the inode's mtime and ctime. */</div><div class='add'>+	bool update_times;</div><div class='ctx'> 	/* Meaningful only if is_new_extent is true. */</div><div class='ctx'> 	int qgroup_reserved;</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1362,17 +471,17 @@ struct btrfs_drop_extents_args {</div><div class='ctx'> </div><div class='ctx'> struct btrfs_file_private {</div><div class='ctx'> 	void *filldir_buf;</div><div class='add'>+	u64 last_index;</div><div class='add'>+	struct extent_state *llseek_cached_state;</div><div class='add'>+	/* Task that allocated this structure. */</div><div class='add'>+	struct task_struct *owner_task;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-</div><div class='ctx'> static inline u32 BTRFS_LEAF_DATA_SIZE(const struct btrfs_fs_info *info)</div><div class='ctx'> {</div><div class='del'>-</div><div class='ctx'> 	return info-&gt;nodesize - sizeof(struct btrfs_header);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#define BTRFS_LEAF_DATA_OFFSET		offsetof(struct btrfs_leaf, items)</div><div class='del'>-</div><div class='ctx'> static inline u32 BTRFS_MAX_ITEM_SIZE(const struct btrfs_fs_info *info)</div><div class='ctx'> {</div><div class='ctx'> 	return BTRFS_LEAF_DATA_SIZE(info) - sizeof(struct btrfs_item);</div><div class='hunk'>@@ -1383,1466 +492,55 @@ static inline u32 BTRFS_NODEPTRS_PER_BLOCK(const struct btrfs_fs_info *info)</div><div class='ctx'> 	return BTRFS_LEAF_DATA_SIZE(info) / sizeof(struct btrfs_key_ptr);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#define BTRFS_FILE_EXTENT_INLINE_DATA_START		\</div><div class='del'>-		(offsetof(struct btrfs_file_extent_item, disk_bytenr))</div><div class='del'>-static inline u32 BTRFS_MAX_INLINE_DATA_SIZE(const struct btrfs_fs_info *info)</div><div class='del'>-{</div><div class='del'>-	return BTRFS_MAX_ITEM_SIZE(info) -</div><div class='del'>-	       BTRFS_FILE_EXTENT_INLINE_DATA_START;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static inline u32 BTRFS_MAX_XATTR_SIZE(const struct btrfs_fs_info *info)</div><div class='ctx'> {</div><div class='ctx'> 	return BTRFS_MAX_ITEM_SIZE(info) - sizeof(struct btrfs_dir_item);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Flags for mount options.</div><div class='del'>- *</div><div class='del'>- * Note: don't forget to add new options to btrfs_show_options()</div><div class='del'>- */</div><div class='del'>-enum {</div><div class='del'>-	BTRFS_MOUNT_NODATASUM			= (1UL &lt;&lt; 0),</div><div class='del'>-	BTRFS_MOUNT_NODATACOW			= (1UL &lt;&lt; 1),</div><div class='del'>-	BTRFS_MOUNT_NOBARRIER			= (1UL &lt;&lt; 2),</div><div class='del'>-	BTRFS_MOUNT_SSD				= (1UL &lt;&lt; 3),</div><div class='del'>-	BTRFS_MOUNT_DEGRADED			= (1UL &lt;&lt; 4),</div><div class='del'>-	BTRFS_MOUNT_COMPRESS			= (1UL &lt;&lt; 5),</div><div class='del'>-	BTRFS_MOUNT_NOTREELOG   		= (1UL &lt;&lt; 6),</div><div class='del'>-	BTRFS_MOUNT_FLUSHONCOMMIT		= (1UL &lt;&lt; 7),</div><div class='del'>-	BTRFS_MOUNT_SSD_SPREAD			= (1UL &lt;&lt; 8),</div><div class='del'>-	BTRFS_MOUNT_NOSSD			= (1UL &lt;&lt; 9),</div><div class='del'>-	BTRFS_MOUNT_DISCARD_SYNC		= (1UL &lt;&lt; 10),</div><div class='del'>-	BTRFS_MOUNT_FORCE_COMPRESS      	= (1UL &lt;&lt; 11),</div><div class='del'>-	BTRFS_MOUNT_SPACE_CACHE			= (1UL &lt;&lt; 12),</div><div class='del'>-	BTRFS_MOUNT_CLEAR_CACHE			= (1UL &lt;&lt; 13),</div><div class='del'>-	BTRFS_MOUNT_USER_SUBVOL_RM_ALLOWED	= (1UL &lt;&lt; 14),</div><div class='del'>-	BTRFS_MOUNT_ENOSPC_DEBUG		= (1UL &lt;&lt; 15),</div><div class='del'>-	BTRFS_MOUNT_AUTO_DEFRAG			= (1UL &lt;&lt; 16),</div><div class='del'>-	BTRFS_MOUNT_USEBACKUPROOT		= (1UL &lt;&lt; 17),</div><div class='del'>-	BTRFS_MOUNT_SKIP_BALANCE		= (1UL &lt;&lt; 18),</div><div class='del'>-	BTRFS_MOUNT_CHECK_INTEGRITY		= (1UL &lt;&lt; 19),</div><div class='del'>-	BTRFS_MOUNT_CHECK_INTEGRITY_DATA	= (1UL &lt;&lt; 20),</div><div class='del'>-	BTRFS_MOUNT_PANIC_ON_FATAL_ERROR	= (1UL &lt;&lt; 21),</div><div class='del'>-	BTRFS_MOUNT_RESCAN_UUID_TREE		= (1UL &lt;&lt; 22),</div><div class='del'>-	BTRFS_MOUNT_FRAGMENT_DATA		= (1UL &lt;&lt; 23),</div><div class='del'>-	BTRFS_MOUNT_FRAGMENT_METADATA		= (1UL &lt;&lt; 24),</div><div class='del'>-	BTRFS_MOUNT_FREE_SPACE_TREE		= (1UL &lt;&lt; 25),</div><div class='del'>-	BTRFS_MOUNT_NOLOGREPLAY			= (1UL &lt;&lt; 26),</div><div class='del'>-	BTRFS_MOUNT_REF_VERIFY			= (1UL &lt;&lt; 27),</div><div class='del'>-	BTRFS_MOUNT_DISCARD_ASYNC		= (1UL &lt;&lt; 28),</div><div class='del'>-	BTRFS_MOUNT_IGNOREBADROOTS		= (1UL &lt;&lt; 29),</div><div class='del'>-	BTRFS_MOUNT_IGNOREDATACSUMS		= (1UL &lt;&lt; 30),</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-#define BTRFS_DEFAULT_COMMIT_INTERVAL	(30)</div><div class='del'>-#define BTRFS_DEFAULT_MAX_INLINE	(2048)</div><div class='del'>-</div><div class='del'>-#define btrfs_clear_opt(o, opt)		((o) &amp;= ~BTRFS_MOUNT_##opt)</div><div class='del'>-#define btrfs_set_opt(o, opt)		((o) |= BTRFS_MOUNT_##opt)</div><div class='del'>-#define btrfs_raw_test_opt(o, opt)	((o) &amp; BTRFS_MOUNT_##opt)</div><div class='del'>-#define btrfs_test_opt(fs_info, opt)	((fs_info)-&gt;mount_opt &amp; \</div><div class='del'>-					 BTRFS_MOUNT_##opt)</div><div class='del'>-</div><div class='del'>-#define btrfs_set_and_info(fs_info, opt, fmt, args...)			\</div><div class='del'>-do {									\</div><div class='del'>-	if (!btrfs_test_opt(fs_info, opt))				\</div><div class='del'>-		btrfs_info(fs_info, fmt, ##args);			\</div><div class='del'>-	btrfs_set_opt(fs_info-&gt;mount_opt, opt);				\</div><div class='del'>-} while (0)</div><div class='del'>-</div><div class='del'>-#define btrfs_clear_and_info(fs_info, opt, fmt, args...)		\</div><div class='del'>-do {									\</div><div class='del'>-	if (btrfs_test_opt(fs_info, opt))				\</div><div class='del'>-		btrfs_info(fs_info, fmt, ##args);			\</div><div class='del'>-	btrfs_clear_opt(fs_info-&gt;mount_opt, opt);			\</div><div class='del'>-} while (0)</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Requests for changes that need to be done during transaction commit.</div><div class='del'>- *</div><div class='del'>- * Internal mount options that are used for special handling of the real</div><div class='del'>- * mount options (eg. cannot be set during remount and have to be set during</div><div class='del'>- * transaction commit)</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#define BTRFS_PENDING_COMMIT			(0)</div><div class='del'>-</div><div class='del'>-#define btrfs_test_pending(info, opt)	\</div><div class='del'>-	test_bit(BTRFS_PENDING_##opt, &amp;(info)-&gt;pending_changes)</div><div class='del'>-#define btrfs_set_pending(info, opt)	\</div><div class='del'>-	set_bit(BTRFS_PENDING_##opt, &amp;(info)-&gt;pending_changes)</div><div class='del'>-#define btrfs_clear_pending(info, opt)	\</div><div class='del'>-	clear_bit(BTRFS_PENDING_##opt, &amp;(info)-&gt;pending_changes)</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Helpers for setting pending mount option changes.</div><div class='del'>- *</div><div class='del'>- * Expects corresponding macros</div><div class='del'>- * BTRFS_PENDING_SET_ and CLEAR_ + short mount option name</div><div class='del'>- */</div><div class='del'>-#define btrfs_set_pending_and_info(info, opt, fmt, args...)            \</div><div class='del'>-do {                                                                   \</div><div class='del'>-       if (!btrfs_raw_test_opt((info)-&gt;mount_opt, opt)) {              \</div><div class='del'>-               btrfs_info((info), fmt, ##args);                        \</div><div class='del'>-               btrfs_set_pending((info), SET_##opt);                   \</div><div class='del'>-               btrfs_clear_pending((info), CLEAR_##opt);               \</div><div class='del'>-       }                                                               \</div><div class='del'>-} while(0)</div><div class='del'>-</div><div class='del'>-#define btrfs_clear_pending_and_info(info, opt, fmt, args...)          \</div><div class='del'>-do {                                                                   \</div><div class='del'>-       if (btrfs_raw_test_opt((info)-&gt;mount_opt, opt)) {               \</div><div class='del'>-               btrfs_info((info), fmt, ##args);                        \</div><div class='del'>-               btrfs_set_pending((info), CLEAR_##opt);                 \</div><div class='del'>-               btrfs_clear_pending((info), SET_##opt);                 \</div><div class='del'>-       }                                                               \</div><div class='del'>-} while(0)</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Inode flags</div><div class='del'>- */</div><div class='del'>-#define BTRFS_INODE_NODATASUM		(1U &lt;&lt; 0)</div><div class='del'>-#define BTRFS_INODE_NODATACOW		(1U &lt;&lt; 1)</div><div class='del'>-#define BTRFS_INODE_READONLY		(1U &lt;&lt; 2)</div><div class='del'>-#define BTRFS_INODE_NOCOMPRESS		(1U &lt;&lt; 3)</div><div class='del'>-#define BTRFS_INODE_PREALLOC		(1U &lt;&lt; 4)</div><div class='del'>-#define BTRFS_INODE_SYNC		(1U &lt;&lt; 5)</div><div class='del'>-#define BTRFS_INODE_IMMUTABLE		(1U &lt;&lt; 6)</div><div class='del'>-#define BTRFS_INODE_APPEND		(1U &lt;&lt; 7)</div><div class='del'>-#define BTRFS_INODE_NODUMP		(1U &lt;&lt; 8)</div><div class='del'>-#define BTRFS_INODE_NOATIME		(1U &lt;&lt; 9)</div><div class='del'>-#define BTRFS_INODE_DIRSYNC		(1U &lt;&lt; 10)</div><div class='del'>-#define BTRFS_INODE_COMPRESS		(1U &lt;&lt; 11)</div><div class='del'>-</div><div class='del'>-#define BTRFS_INODE_ROOT_ITEM_INIT	(1U &lt;&lt; 31)</div><div class='del'>-</div><div class='del'>-#define BTRFS_INODE_FLAG_MASK						\</div><div class='del'>-	(BTRFS_INODE_NODATASUM |					\</div><div class='del'>-	 BTRFS_INODE_NODATACOW |					\</div><div class='del'>-	 BTRFS_INODE_READONLY |						\</div><div class='del'>-	 BTRFS_INODE_NOCOMPRESS |					\</div><div class='del'>-	 BTRFS_INODE_PREALLOC |						\</div><div class='del'>-	 BTRFS_INODE_SYNC |						\</div><div class='del'>-	 BTRFS_INODE_IMMUTABLE |					\</div><div class='del'>-	 BTRFS_INODE_APPEND |						\</div><div class='del'>-	 BTRFS_INODE_NODUMP |						\</div><div class='del'>-	 BTRFS_INODE_NOATIME |						\</div><div class='del'>-	 BTRFS_INODE_DIRSYNC |						\</div><div class='del'>-	 BTRFS_INODE_COMPRESS |						\</div><div class='del'>-	 BTRFS_INODE_ROOT_ITEM_INIT)</div><div class='del'>-</div><div class='del'>-#define BTRFS_INODE_RO_VERITY		(1U &lt;&lt; 0)</div><div class='del'>-</div><div class='del'>-#define BTRFS_INODE_RO_FLAG_MASK	(BTRFS_INODE_RO_VERITY)</div><div class='del'>-</div><div class='del'>-struct btrfs_map_token {</div><div class='del'>-	struct extent_buffer *eb;</div><div class='del'>-	char *kaddr;</div><div class='del'>-	unsigned long offset;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-#define BTRFS_BYTES_TO_BLKS(fs_info, bytes) \</div><div class='del'>-				((bytes) &gt;&gt; (fs_info)-&gt;sectorsize_bits)</div><div class='del'>-</div><div class='del'>-static inline void btrfs_init_map_token(struct btrfs_map_token *token,</div><div class='del'>-					struct extent_buffer *eb)</div><div class='del'>-{</div><div class='del'>-	token-&gt;eb = eb;</div><div class='del'>-	token-&gt;kaddr = page_address(eb-&gt;pages[0]);</div><div class='del'>-	token-&gt;offset = 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* some macros to generate set/get functions for the struct fields.  This</div><div class='del'>- * assumes there is a lefoo_to_cpu for every type, so lets make a simple</div><div class='del'>- * one for u8:</div><div class='del'>- */</div><div class='del'>-#define le8_to_cpu(v) (v)</div><div class='del'>-#define cpu_to_le8(v) (v)</div><div class='del'>-#define __le8 u8</div><div class='del'>-</div><div class='del'>-static inline u8 get_unaligned_le8(const void *p)</div><div class='del'>-{</div><div class='del'>-       return *(u8 *)p;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void put_unaligned_le8(u8 val, void *p)</div><div class='del'>-{</div><div class='del'>-       *(u8 *)p = val;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#define read_eb_member(eb, ptr, type, member, result) (\</div><div class='del'>-	read_extent_buffer(eb, (char *)(result),			\</div><div class='del'>-			   ((unsigned long)(ptr)) +			\</div><div class='del'>-			    offsetof(type, member),			\</div><div class='del'>-			   sizeof(((type *)0)-&gt;member)))</div><div class='del'>-</div><div class='del'>-#define write_eb_member(eb, ptr, type, member, result) (\</div><div class='del'>-	write_extent_buffer(eb, (char *)(result),			\</div><div class='del'>-			   ((unsigned long)(ptr)) +			\</div><div class='del'>-			    offsetof(type, member),			\</div><div class='del'>-			   sizeof(((type *)0)-&gt;member)))</div><div class='del'>-</div><div class='del'>-#define DECLARE_BTRFS_SETGET_BITS(bits)					\</div><div class='del'>-u##bits btrfs_get_token_##bits(struct btrfs_map_token *token,		\</div><div class='del'>-			       const void *ptr, unsigned long off);	\</div><div class='del'>-void btrfs_set_token_##bits(struct btrfs_map_token *token,		\</div><div class='del'>-			    const void *ptr, unsigned long off,		\</div><div class='del'>-			    u##bits val);				\</div><div class='del'>-u##bits btrfs_get_##bits(const struct extent_buffer *eb,		\</div><div class='del'>-			 const void *ptr, unsigned long off);		\</div><div class='del'>-void btrfs_set_##bits(const struct extent_buffer *eb, void *ptr,	\</div><div class='del'>-		      unsigned long off, u##bits val);</div><div class='del'>-</div><div class='del'>-DECLARE_BTRFS_SETGET_BITS(8)</div><div class='del'>-DECLARE_BTRFS_SETGET_BITS(16)</div><div class='del'>-DECLARE_BTRFS_SETGET_BITS(32)</div><div class='del'>-DECLARE_BTRFS_SETGET_BITS(64)</div><div class='del'>-</div><div class='del'>-#define BTRFS_SETGET_FUNCS(name, type, member, bits)			\</div><div class='del'>-static inline u##bits btrfs_##name(const struct extent_buffer *eb,	\</div><div class='del'>-				   const type *s)			\</div><div class='del'>-{									\</div><div class='del'>-	BUILD_BUG_ON(sizeof(u##bits) != sizeof(((type *)0))-&gt;member);	\</div><div class='del'>-	return btrfs_get_##bits(eb, s, offsetof(type, member));		\</div><div class='del'>-}									\</div><div class='del'>-static inline void btrfs_set_##name(const struct extent_buffer *eb, type *s, \</div><div class='del'>-				    u##bits val)			\</div><div class='del'>-{									\</div><div class='del'>-	BUILD_BUG_ON(sizeof(u##bits) != sizeof(((type *)0))-&gt;member);	\</div><div class='del'>-	btrfs_set_##bits(eb, s, offsetof(type, member), val);		\</div><div class='del'>-}									\</div><div class='del'>-static inline u##bits btrfs_token_##name(struct btrfs_map_token *token,	\</div><div class='del'>-					 const type *s)			\</div><div class='del'>-{									\</div><div class='del'>-	BUILD_BUG_ON(sizeof(u##bits) != sizeof(((type *)0))-&gt;member);	\</div><div class='del'>-	return btrfs_get_token_##bits(token, s, offsetof(type, member));\</div><div class='del'>-}									\</div><div class='del'>-static inline void btrfs_set_token_##name(struct btrfs_map_token *token,\</div><div class='del'>-					  type *s, u##bits val)		\</div><div class='del'>-{									\</div><div class='del'>-	BUILD_BUG_ON(sizeof(u##bits) != sizeof(((type *)0))-&gt;member);	\</div><div class='del'>-	btrfs_set_token_##bits(token, s, offsetof(type, member), val);	\</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#define BTRFS_SETGET_HEADER_FUNCS(name, type, member, bits)		\</div><div class='del'>-static inline u##bits btrfs_##name(const struct extent_buffer *eb)	\</div><div class='del'>-{									\</div><div class='del'>-	const type *p = page_address(eb-&gt;pages[0]) +			\</div><div class='del'>-			offset_in_page(eb-&gt;start);			\</div><div class='del'>-	return get_unaligned_le##bits(&amp;p-&gt;member);			\</div><div class='del'>-}									\</div><div class='del'>-static inline void btrfs_set_##name(const struct extent_buffer *eb,	\</div><div class='del'>-				    u##bits val)			\</div><div class='del'>-{									\</div><div class='del'>-	type *p = page_address(eb-&gt;pages[0]) + offset_in_page(eb-&gt;start); \</div><div class='del'>-	put_unaligned_le##bits(val, &amp;p-&gt;member);			\</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#define BTRFS_SETGET_STACK_FUNCS(name, type, member, bits)		\</div><div class='del'>-static inline u##bits btrfs_##name(const type *s)			\</div><div class='del'>-{									\</div><div class='del'>-	return get_unaligned_le##bits(&amp;s-&gt;member);			\</div><div class='del'>-}									\</div><div class='del'>-static inline void btrfs_set_##name(type *s, u##bits val)		\</div><div class='del'>-{									\</div><div class='del'>-	put_unaligned_le##bits(val, &amp;s-&gt;member);			\</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline u64 btrfs_device_total_bytes(const struct extent_buffer *eb,</div><div class='del'>-					   struct btrfs_dev_item *s)</div><div class='del'>-{</div><div class='del'>-	BUILD_BUG_ON(sizeof(u64) !=</div><div class='del'>-		     sizeof(((struct btrfs_dev_item *)0))-&gt;total_bytes);</div><div class='del'>-	return btrfs_get_64(eb, s, offsetof(struct btrfs_dev_item,</div><div class='del'>-					    total_bytes));</div><div class='del'>-}</div><div class='del'>-static inline void btrfs_set_device_total_bytes(const struct extent_buffer *eb,</div><div class='del'>-						struct btrfs_dev_item *s,</div><div class='del'>-						u64 val)</div><div class='del'>-{</div><div class='del'>-	BUILD_BUG_ON(sizeof(u64) !=</div><div class='del'>-		     sizeof(((struct btrfs_dev_item *)0))-&gt;total_bytes);</div><div class='del'>-	WARN_ON(!IS_ALIGNED(val, eb-&gt;fs_info-&gt;sectorsize));</div><div class='del'>-	btrfs_set_64(eb, s, offsetof(struct btrfs_dev_item, total_bytes), val);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-BTRFS_SETGET_FUNCS(device_type, struct btrfs_dev_item, type, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(device_bytes_used, struct btrfs_dev_item, bytes_used, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(device_io_align, struct btrfs_dev_item, io_align, 32);</div><div class='del'>-BTRFS_SETGET_FUNCS(device_io_width, struct btrfs_dev_item, io_width, 32);</div><div class='del'>-BTRFS_SETGET_FUNCS(device_start_offset, struct btrfs_dev_item,</div><div class='del'>-		   start_offset, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(device_sector_size, struct btrfs_dev_item, sector_size, 32);</div><div class='del'>-BTRFS_SETGET_FUNCS(device_id, struct btrfs_dev_item, devid, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(device_group, struct btrfs_dev_item, dev_group, 32);</div><div class='del'>-BTRFS_SETGET_FUNCS(device_seek_speed, struct btrfs_dev_item, seek_speed, 8);</div><div class='del'>-BTRFS_SETGET_FUNCS(device_bandwidth, struct btrfs_dev_item, bandwidth, 8);</div><div class='del'>-BTRFS_SETGET_FUNCS(device_generation, struct btrfs_dev_item, generation, 64);</div><div class='del'>-</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_device_type, struct btrfs_dev_item, type, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_device_total_bytes, struct btrfs_dev_item,</div><div class='del'>-			 total_bytes, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_device_bytes_used, struct btrfs_dev_item,</div><div class='del'>-			 bytes_used, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_device_io_align, struct btrfs_dev_item,</div><div class='del'>-			 io_align, 32);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_device_io_width, struct btrfs_dev_item,</div><div class='del'>-			 io_width, 32);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_device_sector_size, struct btrfs_dev_item,</div><div class='del'>-			 sector_size, 32);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_device_id, struct btrfs_dev_item, devid, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_device_group, struct btrfs_dev_item,</div><div class='del'>-			 dev_group, 32);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_device_seek_speed, struct btrfs_dev_item,</div><div class='del'>-			 seek_speed, 8);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_device_bandwidth, struct btrfs_dev_item,</div><div class='del'>-			 bandwidth, 8);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_device_generation, struct btrfs_dev_item,</div><div class='del'>-			 generation, 64);</div><div class='del'>-</div><div class='del'>-static inline unsigned long btrfs_device_uuid(struct btrfs_dev_item *d)</div><div class='del'>-{</div><div class='del'>-	return (unsigned long)d + offsetof(struct btrfs_dev_item, uuid);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline unsigned long btrfs_device_fsid(struct btrfs_dev_item *d)</div><div class='del'>-{</div><div class='del'>-	return (unsigned long)d + offsetof(struct btrfs_dev_item, fsid);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-BTRFS_SETGET_FUNCS(chunk_length, struct btrfs_chunk, length, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(chunk_owner, struct btrfs_chunk, owner, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(chunk_stripe_len, struct btrfs_chunk, stripe_len, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(chunk_io_align, struct btrfs_chunk, io_align, 32);</div><div class='del'>-BTRFS_SETGET_FUNCS(chunk_io_width, struct btrfs_chunk, io_width, 32);</div><div class='del'>-BTRFS_SETGET_FUNCS(chunk_sector_size, struct btrfs_chunk, sector_size, 32);</div><div class='del'>-BTRFS_SETGET_FUNCS(chunk_type, struct btrfs_chunk, type, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(chunk_num_stripes, struct btrfs_chunk, num_stripes, 16);</div><div class='del'>-BTRFS_SETGET_FUNCS(chunk_sub_stripes, struct btrfs_chunk, sub_stripes, 16);</div><div class='del'>-BTRFS_SETGET_FUNCS(stripe_devid, struct btrfs_stripe, devid, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(stripe_offset, struct btrfs_stripe, offset, 64);</div><div class='del'>-</div><div class='del'>-static inline char *btrfs_stripe_dev_uuid(struct btrfs_stripe *s)</div><div class='del'>-{</div><div class='del'>-	return (char *)s + offsetof(struct btrfs_stripe, dev_uuid);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_chunk_length, struct btrfs_chunk, length, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_chunk_owner, struct btrfs_chunk, owner, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_chunk_stripe_len, struct btrfs_chunk,</div><div class='del'>-			 stripe_len, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_chunk_io_align, struct btrfs_chunk,</div><div class='del'>-			 io_align, 32);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_chunk_io_width, struct btrfs_chunk,</div><div class='del'>-			 io_width, 32);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_chunk_sector_size, struct btrfs_chunk,</div><div class='del'>-			 sector_size, 32);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_chunk_type, struct btrfs_chunk, type, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_chunk_num_stripes, struct btrfs_chunk,</div><div class='del'>-			 num_stripes, 16);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_chunk_sub_stripes, struct btrfs_chunk,</div><div class='del'>-			 sub_stripes, 16);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_stripe_devid, struct btrfs_stripe, devid, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_stripe_offset, struct btrfs_stripe, offset, 64);</div><div class='del'>-</div><div class='del'>-static inline struct btrfs_stripe *btrfs_stripe_nr(struct btrfs_chunk *c,</div><div class='del'>-						   int nr)</div><div class='del'>-{</div><div class='del'>-	unsigned long offset = (unsigned long)c;</div><div class='del'>-	offset += offsetof(struct btrfs_chunk, stripe);</div><div class='del'>-	offset += nr * sizeof(struct btrfs_stripe);</div><div class='del'>-	return (struct btrfs_stripe *)offset;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline char *btrfs_stripe_dev_uuid_nr(struct btrfs_chunk *c, int nr)</div><div class='del'>-{</div><div class='del'>-	return btrfs_stripe_dev_uuid(btrfs_stripe_nr(c, nr));</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline u64 btrfs_stripe_offset_nr(const struct extent_buffer *eb,</div><div class='del'>-					 struct btrfs_chunk *c, int nr)</div><div class='del'>-{</div><div class='del'>-	return btrfs_stripe_offset(eb, btrfs_stripe_nr(c, nr));</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline u64 btrfs_stripe_devid_nr(const struct extent_buffer *eb,</div><div class='del'>-					 struct btrfs_chunk *c, int nr)</div><div class='del'>-{</div><div class='del'>-	return btrfs_stripe_devid(eb, btrfs_stripe_nr(c, nr));</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* struct btrfs_block_group_item */</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_block_group_used, struct btrfs_block_group_item,</div><div class='del'>-			 used, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(block_group_used, struct btrfs_block_group_item,</div><div class='del'>-			 used, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_block_group_chunk_objectid,</div><div class='del'>-			struct btrfs_block_group_item, chunk_objectid, 64);</div><div class='del'>-</div><div class='del'>-BTRFS_SETGET_FUNCS(block_group_chunk_objectid,</div><div class='del'>-		   struct btrfs_block_group_item, chunk_objectid, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(block_group_flags,</div><div class='del'>-		   struct btrfs_block_group_item, flags, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_block_group_flags,</div><div class='del'>-			struct btrfs_block_group_item, flags, 64);</div><div class='del'>-</div><div class='del'>-/* struct btrfs_free_space_info */</div><div class='del'>-BTRFS_SETGET_FUNCS(free_space_extent_count, struct btrfs_free_space_info,</div><div class='del'>-		   extent_count, 32);</div><div class='del'>-BTRFS_SETGET_FUNCS(free_space_flags, struct btrfs_free_space_info, flags, 32);</div><div class='del'>-</div><div class='del'>-/* struct btrfs_inode_ref */</div><div class='del'>-BTRFS_SETGET_FUNCS(inode_ref_name_len, struct btrfs_inode_ref, name_len, 16);</div><div class='del'>-BTRFS_SETGET_FUNCS(inode_ref_index, struct btrfs_inode_ref, index, 64);</div><div class='del'>-</div><div class='del'>-/* struct btrfs_inode_extref */</div><div class='del'>-BTRFS_SETGET_FUNCS(inode_extref_parent, struct btrfs_inode_extref,</div><div class='del'>-		   parent_objectid, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(inode_extref_name_len, struct btrfs_inode_extref,</div><div class='del'>-		   name_len, 16);</div><div class='del'>-BTRFS_SETGET_FUNCS(inode_extref_index, struct btrfs_inode_extref, index, 64);</div><div class='del'>-</div><div class='del'>-/* struct btrfs_inode_item */</div><div class='del'>-BTRFS_SETGET_FUNCS(inode_generation, struct btrfs_inode_item, generation, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(inode_sequence, struct btrfs_inode_item, sequence, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(inode_transid, struct btrfs_inode_item, transid, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(inode_size, struct btrfs_inode_item, size, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(inode_nbytes, struct btrfs_inode_item, nbytes, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(inode_block_group, struct btrfs_inode_item, block_group, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(inode_nlink, struct btrfs_inode_item, nlink, 32);</div><div class='del'>-BTRFS_SETGET_FUNCS(inode_uid, struct btrfs_inode_item, uid, 32);</div><div class='del'>-BTRFS_SETGET_FUNCS(inode_gid, struct btrfs_inode_item, gid, 32);</div><div class='del'>-BTRFS_SETGET_FUNCS(inode_mode, struct btrfs_inode_item, mode, 32);</div><div class='del'>-BTRFS_SETGET_FUNCS(inode_rdev, struct btrfs_inode_item, rdev, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(inode_flags, struct btrfs_inode_item, flags, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_inode_generation, struct btrfs_inode_item,</div><div class='del'>-			 generation, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_inode_sequence, struct btrfs_inode_item,</div><div class='del'>-			 sequence, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_inode_transid, struct btrfs_inode_item,</div><div class='del'>-			 transid, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_inode_size, struct btrfs_inode_item, size, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_inode_nbytes, struct btrfs_inode_item,</div><div class='del'>-			 nbytes, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_inode_block_group, struct btrfs_inode_item,</div><div class='del'>-			 block_group, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_inode_nlink, struct btrfs_inode_item, nlink, 32);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_inode_uid, struct btrfs_inode_item, uid, 32);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_inode_gid, struct btrfs_inode_item, gid, 32);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_inode_mode, struct btrfs_inode_item, mode, 32);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_inode_rdev, struct btrfs_inode_item, rdev, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_inode_flags, struct btrfs_inode_item, flags, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(timespec_sec, struct btrfs_timespec, sec, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(timespec_nsec, struct btrfs_timespec, nsec, 32);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_timespec_sec, struct btrfs_timespec, sec, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_timespec_nsec, struct btrfs_timespec, nsec, 32);</div><div class='del'>-</div><div class='del'>-/* struct btrfs_dev_extent */</div><div class='del'>-BTRFS_SETGET_FUNCS(dev_extent_chunk_tree, struct btrfs_dev_extent,</div><div class='del'>-		   chunk_tree, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(dev_extent_chunk_objectid, struct btrfs_dev_extent,</div><div class='del'>-		   chunk_objectid, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(dev_extent_chunk_offset, struct btrfs_dev_extent,</div><div class='del'>-		   chunk_offset, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(dev_extent_length, struct btrfs_dev_extent, length, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(extent_refs, struct btrfs_extent_item, refs, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(extent_generation, struct btrfs_extent_item,</div><div class='del'>-		   generation, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(extent_flags, struct btrfs_extent_item, flags, 64);</div><div class='del'>-</div><div class='del'>-BTRFS_SETGET_FUNCS(tree_block_level, struct btrfs_tree_block_info, level, 8);</div><div class='del'>-</div><div class='del'>-static inline void btrfs_tree_block_key(const struct extent_buffer *eb,</div><div class='del'>-					struct btrfs_tree_block_info *item,</div><div class='del'>-					struct btrfs_disk_key *key)</div><div class='del'>-{</div><div class='del'>-	read_eb_member(eb, item, struct btrfs_tree_block_info, key, key);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_set_tree_block_key(const struct extent_buffer *eb,</div><div class='del'>-					    struct btrfs_tree_block_info *item,</div><div class='del'>-					    struct btrfs_disk_key *key)</div><div class='del'>-{</div><div class='del'>-	write_eb_member(eb, item, struct btrfs_tree_block_info, key, key);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-BTRFS_SETGET_FUNCS(extent_data_ref_root, struct btrfs_extent_data_ref,</div><div class='del'>-		   root, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(extent_data_ref_objectid, struct btrfs_extent_data_ref,</div><div class='del'>-		   objectid, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(extent_data_ref_offset, struct btrfs_extent_data_ref,</div><div class='del'>-		   offset, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(extent_data_ref_count, struct btrfs_extent_data_ref,</div><div class='del'>-		   count, 32);</div><div class='del'>-</div><div class='del'>-BTRFS_SETGET_FUNCS(shared_data_ref_count, struct btrfs_shared_data_ref,</div><div class='del'>-		   count, 32);</div><div class='del'>-</div><div class='del'>-BTRFS_SETGET_FUNCS(extent_inline_ref_type, struct btrfs_extent_inline_ref,</div><div class='del'>-		   type, 8);</div><div class='del'>-BTRFS_SETGET_FUNCS(extent_inline_ref_offset, struct btrfs_extent_inline_ref,</div><div class='del'>-		   offset, 64);</div><div class='del'>-</div><div class='del'>-static inline u32 btrfs_extent_inline_ref_size(int type)</div><div class='del'>-{</div><div class='del'>-	if (type == BTRFS_TREE_BLOCK_REF_KEY ||</div><div class='del'>-	    type == BTRFS_SHARED_BLOCK_REF_KEY)</div><div class='del'>-		return sizeof(struct btrfs_extent_inline_ref);</div><div class='del'>-	if (type == BTRFS_SHARED_DATA_REF_KEY)</div><div class='del'>-		return sizeof(struct btrfs_shared_data_ref) +</div><div class='del'>-		       sizeof(struct btrfs_extent_inline_ref);</div><div class='del'>-	if (type == BTRFS_EXTENT_DATA_REF_KEY)</div><div class='del'>-		return sizeof(struct btrfs_extent_data_ref) +</div><div class='del'>-		       offsetof(struct btrfs_extent_inline_ref, offset);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* struct btrfs_node */</div><div class='del'>-BTRFS_SETGET_FUNCS(key_blockptr, struct btrfs_key_ptr, blockptr, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(key_generation, struct btrfs_key_ptr, generation, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_key_blockptr, struct btrfs_key_ptr,</div><div class='del'>-			 blockptr, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_key_generation, struct btrfs_key_ptr,</div><div class='del'>-			 generation, 64);</div><div class='del'>-</div><div class='del'>-static inline u64 btrfs_node_blockptr(const struct extent_buffer *eb, int nr)</div><div class='del'>-{</div><div class='del'>-	unsigned long ptr;</div><div class='del'>-	ptr = offsetof(struct btrfs_node, ptrs) +</div><div class='del'>-		sizeof(struct btrfs_key_ptr) * nr;</div><div class='del'>-	return btrfs_key_blockptr(eb, (struct btrfs_key_ptr *)ptr);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_set_node_blockptr(const struct extent_buffer *eb,</div><div class='del'>-					   int nr, u64 val)</div><div class='del'>-{</div><div class='del'>-	unsigned long ptr;</div><div class='del'>-	ptr = offsetof(struct btrfs_node, ptrs) +</div><div class='del'>-		sizeof(struct btrfs_key_ptr) * nr;</div><div class='del'>-	btrfs_set_key_blockptr(eb, (struct btrfs_key_ptr *)ptr, val);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline u64 btrfs_node_ptr_generation(const struct extent_buffer *eb, int nr)</div><div class='del'>-{</div><div class='del'>-	unsigned long ptr;</div><div class='del'>-	ptr = offsetof(struct btrfs_node, ptrs) +</div><div class='del'>-		sizeof(struct btrfs_key_ptr) * nr;</div><div class='del'>-	return btrfs_key_generation(eb, (struct btrfs_key_ptr *)ptr);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_set_node_ptr_generation(const struct extent_buffer *eb,</div><div class='del'>-						 int nr, u64 val)</div><div class='del'>-{</div><div class='del'>-	unsigned long ptr;</div><div class='del'>-	ptr = offsetof(struct btrfs_node, ptrs) +</div><div class='del'>-		sizeof(struct btrfs_key_ptr) * nr;</div><div class='del'>-	btrfs_set_key_generation(eb, (struct btrfs_key_ptr *)ptr, val);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline unsigned long btrfs_node_key_ptr_offset(int nr)</div><div class='del'>-{</div><div class='del'>-	return offsetof(struct btrfs_node, ptrs) +</div><div class='del'>-		sizeof(struct btrfs_key_ptr) * nr;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void btrfs_node_key(const struct extent_buffer *eb,</div><div class='del'>-		    struct btrfs_disk_key *disk_key, int nr);</div><div class='add'>+int __init btrfs_ctree_init(void);</div><div class='add'>+void __cold btrfs_ctree_exit(void);</div><div class='ctx'> </div><div class='del'>-static inline void btrfs_set_node_key(const struct extent_buffer *eb,</div><div class='del'>-				      struct btrfs_disk_key *disk_key, int nr)</div><div class='del'>-{</div><div class='del'>-	unsigned long ptr;</div><div class='del'>-	ptr = btrfs_node_key_ptr_offset(nr);</div><div class='del'>-	write_eb_member(eb, (struct btrfs_key_ptr *)ptr,</div><div class='del'>-		       struct btrfs_key_ptr, key, disk_key);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* struct btrfs_item */</div><div class='del'>-BTRFS_SETGET_FUNCS(item_offset, struct btrfs_item, offset, 32);</div><div class='del'>-BTRFS_SETGET_FUNCS(item_size, struct btrfs_item, size, 32);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_item_offset, struct btrfs_item, offset, 32);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_item_size, struct btrfs_item, size, 32);</div><div class='del'>-</div><div class='del'>-static inline unsigned long btrfs_item_nr_offset(int nr)</div><div class='del'>-{</div><div class='del'>-	return offsetof(struct btrfs_leaf, items) +</div><div class='del'>-		sizeof(struct btrfs_item) * nr;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline struct btrfs_item *btrfs_item_nr(int nr)</div><div class='del'>-{</div><div class='del'>-	return (struct btrfs_item *)btrfs_item_nr_offset(nr);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline u32 btrfs_item_end(const struct extent_buffer *eb,</div><div class='del'>-				 struct btrfs_item *item)</div><div class='del'>-{</div><div class='del'>-	return btrfs_item_offset(eb, item) + btrfs_item_size(eb, item);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline u32 btrfs_item_end_nr(const struct extent_buffer *eb, int nr)</div><div class='del'>-{</div><div class='del'>-	return btrfs_item_end(eb, btrfs_item_nr(nr));</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline u32 btrfs_item_offset_nr(const struct extent_buffer *eb, int nr)</div><div class='del'>-{</div><div class='del'>-	return btrfs_item_offset(eb, btrfs_item_nr(nr));</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline u32 btrfs_item_size_nr(const struct extent_buffer *eb, int nr)</div><div class='del'>-{</div><div class='del'>-	return btrfs_item_size(eb, btrfs_item_nr(nr));</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_item_key(const struct extent_buffer *eb,</div><div class='del'>-			   struct btrfs_disk_key *disk_key, int nr)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_item *item = btrfs_item_nr(nr);</div><div class='del'>-	read_eb_member(eb, item, struct btrfs_item, key, disk_key);</div><div class='del'>-}</div><div class='add'>+int btrfs_bin_search(const struct extent_buffer *eb, int first_slot,</div><div class='add'>+		     const struct btrfs_key *key, int *slot);</div><div class='ctx'> </div><div class='del'>-static inline void btrfs_set_item_key(struct extent_buffer *eb,</div><div class='del'>-			       struct btrfs_disk_key *disk_key, int nr)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_item *item = btrfs_item_nr(nr);</div><div class='del'>-	write_eb_member(eb, item, struct btrfs_item, key, disk_key);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-BTRFS_SETGET_FUNCS(dir_log_end, struct btrfs_dir_log_item, end, 64);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * struct btrfs_root_ref</div><div class='del'>- */</div><div class='del'>-BTRFS_SETGET_FUNCS(root_ref_dirid, struct btrfs_root_ref, dirid, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(root_ref_sequence, struct btrfs_root_ref, sequence, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(root_ref_name_len, struct btrfs_root_ref, name_len, 16);</div><div class='del'>-</div><div class='del'>-/* struct btrfs_dir_item */</div><div class='del'>-BTRFS_SETGET_FUNCS(dir_data_len, struct btrfs_dir_item, data_len, 16);</div><div class='del'>-BTRFS_SETGET_FUNCS(dir_type, struct btrfs_dir_item, type, 8);</div><div class='del'>-BTRFS_SETGET_FUNCS(dir_name_len, struct btrfs_dir_item, name_len, 16);</div><div class='del'>-BTRFS_SETGET_FUNCS(dir_transid, struct btrfs_dir_item, transid, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_dir_type, struct btrfs_dir_item, type, 8);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_dir_data_len, struct btrfs_dir_item,</div><div class='del'>-			 data_len, 16);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_dir_name_len, struct btrfs_dir_item,</div><div class='del'>-			 name_len, 16);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_dir_transid, struct btrfs_dir_item,</div><div class='del'>-			 transid, 64);</div><div class='del'>-</div><div class='del'>-static inline void btrfs_dir_item_key(const struct extent_buffer *eb,</div><div class='del'>-				      const struct btrfs_dir_item *item,</div><div class='del'>-				      struct btrfs_disk_key *key)</div><div class='del'>-{</div><div class='del'>-	read_eb_member(eb, item, struct btrfs_dir_item, location, key);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_set_dir_item_key(struct extent_buffer *eb,</div><div class='del'>-					  struct btrfs_dir_item *item,</div><div class='del'>-					  const struct btrfs_disk_key *key)</div><div class='del'>-{</div><div class='del'>-	write_eb_member(eb, item, struct btrfs_dir_item, location, key);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-BTRFS_SETGET_FUNCS(free_space_entries, struct btrfs_free_space_header,</div><div class='del'>-		   num_entries, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(free_space_bitmaps, struct btrfs_free_space_header,</div><div class='del'>-		   num_bitmaps, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(free_space_generation, struct btrfs_free_space_header,</div><div class='del'>-		   generation, 64);</div><div class='del'>-</div><div class='del'>-static inline void btrfs_free_space_key(const struct extent_buffer *eb,</div><div class='del'>-					const struct btrfs_free_space_header *h,</div><div class='del'>-					struct btrfs_disk_key *key)</div><div class='del'>-{</div><div class='del'>-	read_eb_member(eb, h, struct btrfs_free_space_header, location, key);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_set_free_space_key(struct extent_buffer *eb,</div><div class='del'>-					    struct btrfs_free_space_header *h,</div><div class='del'>-					    const struct btrfs_disk_key *key)</div><div class='del'>-{</div><div class='del'>-	write_eb_member(eb, h, struct btrfs_free_space_header, location, key);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* struct btrfs_disk_key */</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(disk_key_objectid, struct btrfs_disk_key,</div><div class='del'>-			 objectid, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(disk_key_offset, struct btrfs_disk_key, offset, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(disk_key_type, struct btrfs_disk_key, type, 8);</div><div class='add'>+int __pure btrfs_comp_cpu_keys(const struct btrfs_key *k1, const struct btrfs_key *k2);</div><div class='ctx'> </div><div class='ctx'> #ifdef __LITTLE_ENDIAN</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Optimized helpers for little-endian architectures where CPU and on-disk</div><div class='del'>- * structures have the same endianness and we can skip conversions.</div><div class='add'>+ * Compare two keys, on little-endian the disk order is same as CPU order and</div><div class='add'>+ * we can avoid the conversion.</div><div class='ctx'>  */</div><div class='del'>-</div><div class='del'>-static inline void btrfs_disk_key_to_cpu(struct btrfs_key *cpu_key,</div><div class='del'>-					 const struct btrfs_disk_key *disk_key)</div><div class='del'>-{</div><div class='del'>-	memcpy(cpu_key, disk_key, sizeof(struct btrfs_key));</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_cpu_key_to_disk(struct btrfs_disk_key *disk_key,</div><div class='del'>-					 const struct btrfs_key *cpu_key)</div><div class='add'>+static inline int btrfs_comp_keys(const struct btrfs_disk_key *disk_key,</div><div class='add'>+				  const struct btrfs_key *k2)</div><div class='ctx'> {</div><div class='del'>-	memcpy(disk_key, cpu_key, sizeof(struct btrfs_key));</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_node_key_to_cpu(const struct extent_buffer *eb,</div><div class='del'>-					 struct btrfs_key *cpu_key, int nr)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_disk_key *disk_key = (struct btrfs_disk_key *)cpu_key;</div><div class='del'>-</div><div class='del'>-	btrfs_node_key(eb, disk_key, nr);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_item_key_to_cpu(const struct extent_buffer *eb,</div><div class='del'>-					 struct btrfs_key *cpu_key, int nr)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_disk_key *disk_key = (struct btrfs_disk_key *)cpu_key;</div><div class='del'>-</div><div class='del'>-	btrfs_item_key(eb, disk_key, nr);</div><div class='del'>-}</div><div class='add'>+	const struct btrfs_key *k1 = (const struct btrfs_key *)disk_key;</div><div class='ctx'> </div><div class='del'>-static inline void btrfs_dir_item_key_to_cpu(const struct extent_buffer *eb,</div><div class='del'>-					     const struct btrfs_dir_item *item,</div><div class='del'>-					     struct btrfs_key *cpu_key)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_disk_key *disk_key = (struct btrfs_disk_key *)cpu_key;</div><div class='del'>-</div><div class='del'>-	btrfs_dir_item_key(eb, item, disk_key);</div><div class='add'>+	return btrfs_comp_cpu_keys(k1, k2);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #else</div><div class='ctx'> </div><div class='del'>-static inline void btrfs_disk_key_to_cpu(struct btrfs_key *cpu,</div><div class='del'>-					 const struct btrfs_disk_key *disk)</div><div class='del'>-{</div><div class='del'>-	cpu-&gt;offset = le64_to_cpu(disk-&gt;offset);</div><div class='del'>-	cpu-&gt;type = disk-&gt;type;</div><div class='del'>-	cpu-&gt;objectid = le64_to_cpu(disk-&gt;objectid);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_cpu_key_to_disk(struct btrfs_disk_key *disk,</div><div class='del'>-					 const struct btrfs_key *cpu)</div><div class='del'>-{</div><div class='del'>-	disk-&gt;offset = cpu_to_le64(cpu-&gt;offset);</div><div class='del'>-	disk-&gt;type = cpu-&gt;type;</div><div class='del'>-	disk-&gt;objectid = cpu_to_le64(cpu-&gt;objectid);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_node_key_to_cpu(const struct extent_buffer *eb,</div><div class='del'>-					 struct btrfs_key *key, int nr)</div><div class='add'>+/* Compare two keys in a memcmp fashion. */</div><div class='add'>+static inline int btrfs_comp_keys(const struct btrfs_disk_key *disk,</div><div class='add'>+				  const struct btrfs_key *k2)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_disk_key disk_key;</div><div class='del'>-	btrfs_node_key(eb, &amp;disk_key, nr);</div><div class='del'>-	btrfs_disk_key_to_cpu(key, &amp;disk_key);</div><div class='del'>-}</div><div class='add'>+	struct btrfs_key k1;</div><div class='ctx'> </div><div class='del'>-static inline void btrfs_item_key_to_cpu(const struct extent_buffer *eb,</div><div class='del'>-					 struct btrfs_key *key, int nr)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_disk_key disk_key;</div><div class='del'>-	btrfs_item_key(eb, &amp;disk_key, nr);</div><div class='del'>-	btrfs_disk_key_to_cpu(key, &amp;disk_key);</div><div class='del'>-}</div><div class='add'>+	btrfs_disk_key_to_cpu(&amp;k1, disk);</div><div class='ctx'> </div><div class='del'>-static inline void btrfs_dir_item_key_to_cpu(const struct extent_buffer *eb,</div><div class='del'>-					     const struct btrfs_dir_item *item,</div><div class='del'>-					     struct btrfs_key *key)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_disk_key disk_key;</div><div class='del'>-	btrfs_dir_item_key(eb, item, &amp;disk_key);</div><div class='del'>-	btrfs_disk_key_to_cpu(key, &amp;disk_key);</div><div class='add'>+	return btrfs_comp_cpu_keys(&amp;k1, k2);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-/* struct btrfs_header */</div><div class='del'>-BTRFS_SETGET_HEADER_FUNCS(header_bytenr, struct btrfs_header, bytenr, 64);</div><div class='del'>-BTRFS_SETGET_HEADER_FUNCS(header_generation, struct btrfs_header,</div><div class='del'>-			  generation, 64);</div><div class='del'>-BTRFS_SETGET_HEADER_FUNCS(header_owner, struct btrfs_header, owner, 64);</div><div class='del'>-BTRFS_SETGET_HEADER_FUNCS(header_nritems, struct btrfs_header, nritems, 32);</div><div class='del'>-BTRFS_SETGET_HEADER_FUNCS(header_flags, struct btrfs_header, flags, 64);</div><div class='del'>-BTRFS_SETGET_HEADER_FUNCS(header_level, struct btrfs_header, level, 8);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_header_generation, struct btrfs_header,</div><div class='del'>-			 generation, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_header_owner, struct btrfs_header, owner, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_header_nritems, struct btrfs_header,</div><div class='del'>-			 nritems, 32);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_header_bytenr, struct btrfs_header, bytenr, 64);</div><div class='del'>-</div><div class='del'>-static inline int btrfs_header_flag(const struct extent_buffer *eb, u64 flag)</div><div class='del'>-{</div><div class='del'>-	return (btrfs_header_flags(eb) &amp; flag) == flag;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_set_header_flag(struct extent_buffer *eb, u64 flag)</div><div class='del'>-{</div><div class='del'>-	u64 flags = btrfs_header_flags(eb);</div><div class='del'>-	btrfs_set_header_flags(eb, flags | flag);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_clear_header_flag(struct extent_buffer *eb, u64 flag)</div><div class='del'>-{</div><div class='del'>-	u64 flags = btrfs_header_flags(eb);</div><div class='del'>-	btrfs_set_header_flags(eb, flags &amp; ~flag);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline int btrfs_header_backref_rev(const struct extent_buffer *eb)</div><div class='del'>-{</div><div class='del'>-	u64 flags = btrfs_header_flags(eb);</div><div class='del'>-	return flags &gt;&gt; BTRFS_BACKREF_REV_SHIFT;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_set_header_backref_rev(struct extent_buffer *eb,</div><div class='del'>-						int rev)</div><div class='del'>-{</div><div class='del'>-	u64 flags = btrfs_header_flags(eb);</div><div class='del'>-	flags &amp;= ~BTRFS_BACKREF_REV_MASK;</div><div class='del'>-	flags |= (u64)rev &lt;&lt; BTRFS_BACKREF_REV_SHIFT;</div><div class='del'>-	btrfs_set_header_flags(eb, flags);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline int btrfs_is_leaf(const struct extent_buffer *eb)</div><div class='del'>-{</div><div class='del'>-	return btrfs_header_level(eb) == 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* struct btrfs_root_item */</div><div class='del'>-BTRFS_SETGET_FUNCS(disk_root_generation, struct btrfs_root_item,</div><div class='del'>-		   generation, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(disk_root_refs, struct btrfs_root_item, refs, 32);</div><div class='del'>-BTRFS_SETGET_FUNCS(disk_root_bytenr, struct btrfs_root_item, bytenr, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(disk_root_level, struct btrfs_root_item, level, 8);</div><div class='del'>-</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(root_generation, struct btrfs_root_item,</div><div class='del'>-			 generation, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(root_bytenr, struct btrfs_root_item, bytenr, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(root_drop_level, struct btrfs_root_item, drop_level, 8);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(root_level, struct btrfs_root_item, level, 8);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(root_dirid, struct btrfs_root_item, root_dirid, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(root_refs, struct btrfs_root_item, refs, 32);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(root_flags, struct btrfs_root_item, flags, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(root_used, struct btrfs_root_item, bytes_used, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(root_limit, struct btrfs_root_item, byte_limit, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(root_last_snapshot, struct btrfs_root_item,</div><div class='del'>-			 last_snapshot, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(root_generation_v2, struct btrfs_root_item,</div><div class='del'>-			 generation_v2, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(root_ctransid, struct btrfs_root_item,</div><div class='del'>-			 ctransid, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(root_otransid, struct btrfs_root_item,</div><div class='del'>-			 otransid, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(root_stransid, struct btrfs_root_item,</div><div class='del'>-			 stransid, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(root_rtransid, struct btrfs_root_item,</div><div class='del'>-			 rtransid, 64);</div><div class='del'>-</div><div class='del'>-static inline bool btrfs_root_readonly(const struct btrfs_root *root)</div><div class='del'>-{</div><div class='del'>-	/* Byte-swap the constant at compile time, root_item::flags is LE */</div><div class='del'>-	return (root-&gt;root_item.flags &amp; cpu_to_le64(BTRFS_ROOT_SUBVOL_RDONLY)) != 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline bool btrfs_root_dead(const struct btrfs_root *root)</div><div class='del'>-{</div><div class='del'>-	/* Byte-swap the constant at compile time, root_item::flags is LE */</div><div class='del'>-	return (root-&gt;root_item.flags &amp; cpu_to_le64(BTRFS_ROOT_SUBVOL_DEAD)) != 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* struct btrfs_root_backup */</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(backup_tree_root, struct btrfs_root_backup,</div><div class='del'>-		   tree_root, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(backup_tree_root_gen, struct btrfs_root_backup,</div><div class='del'>-		   tree_root_gen, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(backup_tree_root_level, struct btrfs_root_backup,</div><div class='del'>-		   tree_root_level, 8);</div><div class='del'>-</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(backup_chunk_root, struct btrfs_root_backup,</div><div class='del'>-		   chunk_root, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(backup_chunk_root_gen, struct btrfs_root_backup,</div><div class='del'>-		   chunk_root_gen, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(backup_chunk_root_level, struct btrfs_root_backup,</div><div class='del'>-		   chunk_root_level, 8);</div><div class='del'>-</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(backup_extent_root, struct btrfs_root_backup,</div><div class='del'>-		   extent_root, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(backup_extent_root_gen, struct btrfs_root_backup,</div><div class='del'>-		   extent_root_gen, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(backup_extent_root_level, struct btrfs_root_backup,</div><div class='del'>-		   extent_root_level, 8);</div><div class='del'>-</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(backup_fs_root, struct btrfs_root_backup,</div><div class='del'>-		   fs_root, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(backup_fs_root_gen, struct btrfs_root_backup,</div><div class='del'>-		   fs_root_gen, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(backup_fs_root_level, struct btrfs_root_backup,</div><div class='del'>-		   fs_root_level, 8);</div><div class='del'>-</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(backup_dev_root, struct btrfs_root_backup,</div><div class='del'>-		   dev_root, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(backup_dev_root_gen, struct btrfs_root_backup,</div><div class='del'>-		   dev_root_gen, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(backup_dev_root_level, struct btrfs_root_backup,</div><div class='del'>-		   dev_root_level, 8);</div><div class='del'>-</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(backup_csum_root, struct btrfs_root_backup,</div><div class='del'>-		   csum_root, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(backup_csum_root_gen, struct btrfs_root_backup,</div><div class='del'>-		   csum_root_gen, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(backup_csum_root_level, struct btrfs_root_backup,</div><div class='del'>-		   csum_root_level, 8);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(backup_total_bytes, struct btrfs_root_backup,</div><div class='del'>-		   total_bytes, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(backup_bytes_used, struct btrfs_root_backup,</div><div class='del'>-		   bytes_used, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(backup_num_devices, struct btrfs_root_backup,</div><div class='del'>-		   num_devices, 64);</div><div class='del'>-</div><div class='del'>-/* struct btrfs_balance_item */</div><div class='del'>-BTRFS_SETGET_FUNCS(balance_flags, struct btrfs_balance_item, flags, 64);</div><div class='del'>-</div><div class='del'>-static inline void btrfs_balance_data(const struct extent_buffer *eb,</div><div class='del'>-				      const struct btrfs_balance_item *bi,</div><div class='del'>-				      struct btrfs_disk_balance_args *ba)</div><div class='del'>-{</div><div class='del'>-	read_eb_member(eb, bi, struct btrfs_balance_item, data, ba);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_set_balance_data(struct extent_buffer *eb,</div><div class='del'>-				  struct btrfs_balance_item *bi,</div><div class='del'>-				  const struct btrfs_disk_balance_args *ba)</div><div class='del'>-{</div><div class='del'>-	write_eb_member(eb, bi, struct btrfs_balance_item, data, ba);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_balance_meta(const struct extent_buffer *eb,</div><div class='del'>-				      const struct btrfs_balance_item *bi,</div><div class='del'>-				      struct btrfs_disk_balance_args *ba)</div><div class='del'>-{</div><div class='del'>-	read_eb_member(eb, bi, struct btrfs_balance_item, meta, ba);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_set_balance_meta(struct extent_buffer *eb,</div><div class='del'>-				  struct btrfs_balance_item *bi,</div><div class='del'>-				  const struct btrfs_disk_balance_args *ba)</div><div class='del'>-{</div><div class='del'>-	write_eb_member(eb, bi, struct btrfs_balance_item, meta, ba);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_balance_sys(const struct extent_buffer *eb,</div><div class='del'>-				     const struct btrfs_balance_item *bi,</div><div class='del'>-				     struct btrfs_disk_balance_args *ba)</div><div class='del'>-{</div><div class='del'>-	read_eb_member(eb, bi, struct btrfs_balance_item, sys, ba);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_set_balance_sys(struct extent_buffer *eb,</div><div class='del'>-				 struct btrfs_balance_item *bi,</div><div class='del'>-				 const struct btrfs_disk_balance_args *ba)</div><div class='del'>-{</div><div class='del'>-	write_eb_member(eb, bi, struct btrfs_balance_item, sys, ba);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void</div><div class='del'>-btrfs_disk_balance_args_to_cpu(struct btrfs_balance_args *cpu,</div><div class='del'>-			       const struct btrfs_disk_balance_args *disk)</div><div class='del'>-{</div><div class='del'>-	memset(cpu, 0, sizeof(*cpu));</div><div class='del'>-</div><div class='del'>-	cpu-&gt;profiles = le64_to_cpu(disk-&gt;profiles);</div><div class='del'>-	cpu-&gt;usage = le64_to_cpu(disk-&gt;usage);</div><div class='del'>-	cpu-&gt;devid = le64_to_cpu(disk-&gt;devid);</div><div class='del'>-	cpu-&gt;pstart = le64_to_cpu(disk-&gt;pstart);</div><div class='del'>-	cpu-&gt;pend = le64_to_cpu(disk-&gt;pend);</div><div class='del'>-	cpu-&gt;vstart = le64_to_cpu(disk-&gt;vstart);</div><div class='del'>-	cpu-&gt;vend = le64_to_cpu(disk-&gt;vend);</div><div class='del'>-	cpu-&gt;target = le64_to_cpu(disk-&gt;target);</div><div class='del'>-	cpu-&gt;flags = le64_to_cpu(disk-&gt;flags);</div><div class='del'>-	cpu-&gt;limit = le64_to_cpu(disk-&gt;limit);</div><div class='del'>-	cpu-&gt;stripes_min = le32_to_cpu(disk-&gt;stripes_min);</div><div class='del'>-	cpu-&gt;stripes_max = le32_to_cpu(disk-&gt;stripes_max);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void</div><div class='del'>-btrfs_cpu_balance_args_to_disk(struct btrfs_disk_balance_args *disk,</div><div class='del'>-			       const struct btrfs_balance_args *cpu)</div><div class='del'>-{</div><div class='del'>-	memset(disk, 0, sizeof(*disk));</div><div class='del'>-</div><div class='del'>-	disk-&gt;profiles = cpu_to_le64(cpu-&gt;profiles);</div><div class='del'>-	disk-&gt;usage = cpu_to_le64(cpu-&gt;usage);</div><div class='del'>-	disk-&gt;devid = cpu_to_le64(cpu-&gt;devid);</div><div class='del'>-	disk-&gt;pstart = cpu_to_le64(cpu-&gt;pstart);</div><div class='del'>-	disk-&gt;pend = cpu_to_le64(cpu-&gt;pend);</div><div class='del'>-	disk-&gt;vstart = cpu_to_le64(cpu-&gt;vstart);</div><div class='del'>-	disk-&gt;vend = cpu_to_le64(cpu-&gt;vend);</div><div class='del'>-	disk-&gt;target = cpu_to_le64(cpu-&gt;target);</div><div class='del'>-	disk-&gt;flags = cpu_to_le64(cpu-&gt;flags);</div><div class='del'>-	disk-&gt;limit = cpu_to_le64(cpu-&gt;limit);</div><div class='del'>-	disk-&gt;stripes_min = cpu_to_le32(cpu-&gt;stripes_min);</div><div class='del'>-	disk-&gt;stripes_max = cpu_to_le32(cpu-&gt;stripes_max);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* struct btrfs_super_block */</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(super_bytenr, struct btrfs_super_block, bytenr, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(super_flags, struct btrfs_super_block, flags, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(super_generation, struct btrfs_super_block,</div><div class='del'>-			 generation, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(super_root, struct btrfs_super_block, root, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(super_sys_array_size,</div><div class='del'>-			 struct btrfs_super_block, sys_chunk_array_size, 32);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(super_chunk_root_generation,</div><div class='del'>-			 struct btrfs_super_block, chunk_root_generation, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(super_root_level, struct btrfs_super_block,</div><div class='del'>-			 root_level, 8);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(super_chunk_root, struct btrfs_super_block,</div><div class='del'>-			 chunk_root, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(super_chunk_root_level, struct btrfs_super_block,</div><div class='del'>-			 chunk_root_level, 8);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(super_log_root, struct btrfs_super_block,</div><div class='del'>-			 log_root, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(super_log_root_transid, struct btrfs_super_block,</div><div class='del'>-			 log_root_transid, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(super_log_root_level, struct btrfs_super_block,</div><div class='del'>-			 log_root_level, 8);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(super_total_bytes, struct btrfs_super_block,</div><div class='del'>-			 total_bytes, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(super_bytes_used, struct btrfs_super_block,</div><div class='del'>-			 bytes_used, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(super_sectorsize, struct btrfs_super_block,</div><div class='del'>-			 sectorsize, 32);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(super_nodesize, struct btrfs_super_block,</div><div class='del'>-			 nodesize, 32);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(super_stripesize, struct btrfs_super_block,</div><div class='del'>-			 stripesize, 32);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(super_root_dir, struct btrfs_super_block,</div><div class='del'>-			 root_dir_objectid, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(super_num_devices, struct btrfs_super_block,</div><div class='del'>-			 num_devices, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(super_compat_flags, struct btrfs_super_block,</div><div class='del'>-			 compat_flags, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(super_compat_ro_flags, struct btrfs_super_block,</div><div class='del'>-			 compat_ro_flags, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(super_incompat_flags, struct btrfs_super_block,</div><div class='del'>-			 incompat_flags, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(super_csum_type, struct btrfs_super_block,</div><div class='del'>-			 csum_type, 16);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(super_cache_generation, struct btrfs_super_block,</div><div class='del'>-			 cache_generation, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(super_magic, struct btrfs_super_block, magic, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(super_uuid_tree_generation, struct btrfs_super_block,</div><div class='del'>-			 uuid_tree_generation, 64);</div><div class='del'>-</div><div class='del'>-int btrfs_super_csum_size(const struct btrfs_super_block *s);</div><div class='del'>-const char *btrfs_super_csum_name(u16 csum_type);</div><div class='del'>-const char *btrfs_super_csum_driver(u16 csum_type);</div><div class='del'>-size_t __attribute_const__ btrfs_get_num_csums(void);</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * The leaf data grows from end-to-front in the node.</div><div class='del'>- * this returns the address of the start of the last item,</div><div class='del'>- * which is the stop of the leaf data stack</div><div class='del'>- */</div><div class='del'>-static inline unsigned int leaf_data_end(const struct extent_buffer *leaf)</div><div class='del'>-{</div><div class='del'>-	u32 nr = btrfs_header_nritems(leaf);</div><div class='del'>-</div><div class='del'>-	if (nr == 0)</div><div class='del'>-		return BTRFS_LEAF_DATA_SIZE(leaf-&gt;fs_info);</div><div class='del'>-	return btrfs_item_offset_nr(leaf, nr - 1);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* struct btrfs_file_extent_item */</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_file_extent_type, struct btrfs_file_extent_item,</div><div class='del'>-			 type, 8);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_file_extent_disk_bytenr,</div><div class='del'>-			 struct btrfs_file_extent_item, disk_bytenr, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_file_extent_offset,</div><div class='del'>-			 struct btrfs_file_extent_item, offset, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_file_extent_generation,</div><div class='del'>-			 struct btrfs_file_extent_item, generation, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_file_extent_num_bytes,</div><div class='del'>-			 struct btrfs_file_extent_item, num_bytes, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_file_extent_ram_bytes,</div><div class='del'>-			 struct btrfs_file_extent_item, ram_bytes, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_file_extent_disk_num_bytes,</div><div class='del'>-			 struct btrfs_file_extent_item, disk_num_bytes, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_file_extent_compression,</div><div class='del'>-			 struct btrfs_file_extent_item, compression, 8);</div><div class='del'>-</div><div class='del'>-static inline unsigned long</div><div class='del'>-btrfs_file_extent_inline_start(const struct btrfs_file_extent_item *e)</div><div class='del'>-{</div><div class='del'>-	return (unsigned long)e + BTRFS_FILE_EXTENT_INLINE_DATA_START;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline u32 btrfs_file_extent_calc_inline_size(u32 datasize)</div><div class='del'>-{</div><div class='del'>-	return BTRFS_FILE_EXTENT_INLINE_DATA_START + datasize;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-BTRFS_SETGET_FUNCS(file_extent_type, struct btrfs_file_extent_item, type, 8);</div><div class='del'>-BTRFS_SETGET_FUNCS(file_extent_disk_bytenr, struct btrfs_file_extent_item,</div><div class='del'>-		   disk_bytenr, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(file_extent_generation, struct btrfs_file_extent_item,</div><div class='del'>-		   generation, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(file_extent_disk_num_bytes, struct btrfs_file_extent_item,</div><div class='del'>-		   disk_num_bytes, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(file_extent_offset, struct btrfs_file_extent_item,</div><div class='del'>-		  offset, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(file_extent_num_bytes, struct btrfs_file_extent_item,</div><div class='del'>-		   num_bytes, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(file_extent_ram_bytes, struct btrfs_file_extent_item,</div><div class='del'>-		   ram_bytes, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(file_extent_compression, struct btrfs_file_extent_item,</div><div class='del'>-		   compression, 8);</div><div class='del'>-BTRFS_SETGET_FUNCS(file_extent_encryption, struct btrfs_file_extent_item,</div><div class='del'>-		   encryption, 8);</div><div class='del'>-BTRFS_SETGET_FUNCS(file_extent_other_encoding, struct btrfs_file_extent_item,</div><div class='del'>-		   other_encoding, 16);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * this returns the number of bytes used by the item on disk, minus the</div><div class='del'>- * size of any extent headers.  If a file is compressed on disk, this is</div><div class='del'>- * the compressed size</div><div class='del'>- */</div><div class='del'>-static inline u32 btrfs_file_extent_inline_item_len(</div><div class='del'>-						const struct extent_buffer *eb,</div><div class='del'>-						struct btrfs_item *e)</div><div class='del'>-{</div><div class='del'>-	return btrfs_item_size(eb, e) - BTRFS_FILE_EXTENT_INLINE_DATA_START;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* btrfs_qgroup_status_item */</div><div class='del'>-BTRFS_SETGET_FUNCS(qgroup_status_generation, struct btrfs_qgroup_status_item,</div><div class='del'>-		   generation, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(qgroup_status_version, struct btrfs_qgroup_status_item,</div><div class='del'>-		   version, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(qgroup_status_flags, struct btrfs_qgroup_status_item,</div><div class='del'>-		   flags, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(qgroup_status_rescan, struct btrfs_qgroup_status_item,</div><div class='del'>-		   rescan, 64);</div><div class='del'>-</div><div class='del'>-/* btrfs_qgroup_info_item */</div><div class='del'>-BTRFS_SETGET_FUNCS(qgroup_info_generation, struct btrfs_qgroup_info_item,</div><div class='del'>-		   generation, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(qgroup_info_rfer, struct btrfs_qgroup_info_item, rfer, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(qgroup_info_rfer_cmpr, struct btrfs_qgroup_info_item,</div><div class='del'>-		   rfer_cmpr, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(qgroup_info_excl, struct btrfs_qgroup_info_item, excl, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(qgroup_info_excl_cmpr, struct btrfs_qgroup_info_item,</div><div class='del'>-		   excl_cmpr, 64);</div><div class='del'>-</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_qgroup_info_generation,</div><div class='del'>-			 struct btrfs_qgroup_info_item, generation, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_qgroup_info_rfer, struct btrfs_qgroup_info_item,</div><div class='del'>-			 rfer, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_qgroup_info_rfer_cmpr,</div><div class='del'>-			 struct btrfs_qgroup_info_item, rfer_cmpr, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_qgroup_info_excl, struct btrfs_qgroup_info_item,</div><div class='del'>-			 excl, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_qgroup_info_excl_cmpr,</div><div class='del'>-			 struct btrfs_qgroup_info_item, excl_cmpr, 64);</div><div class='del'>-</div><div class='del'>-/* btrfs_qgroup_limit_item */</div><div class='del'>-BTRFS_SETGET_FUNCS(qgroup_limit_flags, struct btrfs_qgroup_limit_item,</div><div class='del'>-		   flags, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(qgroup_limit_max_rfer, struct btrfs_qgroup_limit_item,</div><div class='del'>-		   max_rfer, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(qgroup_limit_max_excl, struct btrfs_qgroup_limit_item,</div><div class='del'>-		   max_excl, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(qgroup_limit_rsv_rfer, struct btrfs_qgroup_limit_item,</div><div class='del'>-		   rsv_rfer, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(qgroup_limit_rsv_excl, struct btrfs_qgroup_limit_item,</div><div class='del'>-		   rsv_excl, 64);</div><div class='del'>-</div><div class='del'>-/* btrfs_dev_replace_item */</div><div class='del'>-BTRFS_SETGET_FUNCS(dev_replace_src_devid,</div><div class='del'>-		   struct btrfs_dev_replace_item, src_devid, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(dev_replace_cont_reading_from_srcdev_mode,</div><div class='del'>-		   struct btrfs_dev_replace_item, cont_reading_from_srcdev_mode,</div><div class='del'>-		   64);</div><div class='del'>-BTRFS_SETGET_FUNCS(dev_replace_replace_state, struct btrfs_dev_replace_item,</div><div class='del'>-		   replace_state, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(dev_replace_time_started, struct btrfs_dev_replace_item,</div><div class='del'>-		   time_started, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(dev_replace_time_stopped, struct btrfs_dev_replace_item,</div><div class='del'>-		   time_stopped, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(dev_replace_num_write_errors, struct btrfs_dev_replace_item,</div><div class='del'>-		   num_write_errors, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(dev_replace_num_uncorrectable_read_errors,</div><div class='del'>-		   struct btrfs_dev_replace_item, num_uncorrectable_read_errors,</div><div class='del'>-		   64);</div><div class='del'>-BTRFS_SETGET_FUNCS(dev_replace_cursor_left, struct btrfs_dev_replace_item,</div><div class='del'>-		   cursor_left, 64);</div><div class='del'>-BTRFS_SETGET_FUNCS(dev_replace_cursor_right, struct btrfs_dev_replace_item,</div><div class='del'>-		   cursor_right, 64);</div><div class='del'>-</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_dev_replace_src_devid,</div><div class='del'>-			 struct btrfs_dev_replace_item, src_devid, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_dev_replace_cont_reading_from_srcdev_mode,</div><div class='del'>-			 struct btrfs_dev_replace_item,</div><div class='del'>-			 cont_reading_from_srcdev_mode, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_dev_replace_replace_state,</div><div class='del'>-			 struct btrfs_dev_replace_item, replace_state, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_dev_replace_time_started,</div><div class='del'>-			 struct btrfs_dev_replace_item, time_started, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_dev_replace_time_stopped,</div><div class='del'>-			 struct btrfs_dev_replace_item, time_stopped, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_dev_replace_num_write_errors,</div><div class='del'>-			 struct btrfs_dev_replace_item, num_write_errors, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_dev_replace_num_uncorrectable_read_errors,</div><div class='del'>-			 struct btrfs_dev_replace_item,</div><div class='del'>-			 num_uncorrectable_read_errors, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_dev_replace_cursor_left,</div><div class='del'>-			 struct btrfs_dev_replace_item, cursor_left, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_dev_replace_cursor_right,</div><div class='del'>-			 struct btrfs_dev_replace_item, cursor_right, 64);</div><div class='del'>-</div><div class='del'>-/* helper function to cast into the data area of the leaf. */</div><div class='del'>-#define btrfs_item_ptr(leaf, slot, type) \</div><div class='del'>-	((type *)(BTRFS_LEAF_DATA_OFFSET + \</div><div class='del'>-	btrfs_item_offset_nr(leaf, slot)))</div><div class='del'>-</div><div class='del'>-#define btrfs_item_ptr_offset(leaf, slot) \</div><div class='del'>-	((unsigned long)(BTRFS_LEAF_DATA_OFFSET + \</div><div class='del'>-	btrfs_item_offset_nr(leaf, slot)))</div><div class='del'>-</div><div class='del'>-static inline u32 btrfs_crc32c(u32 crc, const void *address, unsigned length)</div><div class='del'>-{</div><div class='del'>-	return crc32c(crc, address, length);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_crc32c_final(u32 crc, u8 *result)</div><div class='del'>-{</div><div class='del'>-	put_unaligned_le32(~crc, result);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline u64 btrfs_name_hash(const char *name, int len)</div><div class='del'>-{</div><div class='del'>-       return crc32c((u32)~1, name, len);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Figure the key offset of an extended inode ref</div><div class='del'>- */</div><div class='del'>-static inline u64 btrfs_extref_hash(u64 parent_objectid, const char *name,</div><div class='del'>-                                   int len)</div><div class='del'>-{</div><div class='del'>-       return (u64) crc32c(parent_objectid, name, len);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline gfp_t btrfs_alloc_write_mask(struct address_space *mapping)</div><div class='del'>-{</div><div class='del'>-	return mapping_gfp_constraint(mapping, ~__GFP_FS);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* extent-tree.c */</div><div class='del'>-</div><div class='del'>-enum btrfs_inline_ref_type {</div><div class='del'>-	BTRFS_REF_TYPE_INVALID,</div><div class='del'>-	BTRFS_REF_TYPE_BLOCK,</div><div class='del'>-	BTRFS_REF_TYPE_DATA,</div><div class='del'>-	BTRFS_REF_TYPE_ANY,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-int btrfs_get_extent_inline_ref_type(const struct extent_buffer *eb,</div><div class='del'>-				     struct btrfs_extent_inline_ref *iref,</div><div class='del'>-				     enum btrfs_inline_ref_type is_data);</div><div class='del'>-u64 hash_extent_data_ref(u64 root_objectid, u64 owner, u64 offset);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Take the number of bytes to be checksummmed and figure out how many leaves</div><div class='del'>- * it would require to store the csums for that many bytes.</div><div class='del'>- */</div><div class='del'>-static inline u64 btrfs_csum_bytes_to_leaves(</div><div class='del'>-			const struct btrfs_fs_info *fs_info, u64 csum_bytes)</div><div class='del'>-{</div><div class='del'>-	const u64 num_csums = csum_bytes &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='del'>-</div><div class='del'>-	return DIV_ROUND_UP_ULL(num_csums, fs_info-&gt;csums_per_leaf);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Use this if we would be adding new items, as we could split nodes as we cow</div><div class='del'>- * down the tree.</div><div class='del'>- */</div><div class='del'>-static inline u64 btrfs_calc_insert_metadata_size(struct btrfs_fs_info *fs_info,</div><div class='del'>-						  unsigned num_items)</div><div class='del'>-{</div><div class='del'>-	return (u64)fs_info-&gt;nodesize * BTRFS_MAX_LEVEL * 2 * num_items;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Doing a truncate or a modification won't result in new nodes or leaves, just</div><div class='del'>- * what we need for COW.</div><div class='del'>- */</div><div class='del'>-static inline u64 btrfs_calc_metadata_size(struct btrfs_fs_info *fs_info,</div><div class='del'>-						 unsigned num_items)</div><div class='del'>-{</div><div class='del'>-	return (u64)fs_info-&gt;nodesize * BTRFS_MAX_LEVEL * num_items;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int btrfs_add_excluded_extent(struct btrfs_fs_info *fs_info,</div><div class='del'>-			      u64 start, u64 num_bytes);</div><div class='del'>-void btrfs_free_excluded_extents(struct btrfs_block_group *cache);</div><div class='del'>-int btrfs_run_delayed_refs(struct btrfs_trans_handle *trans,</div><div class='del'>-			   unsigned long count);</div><div class='del'>-void btrfs_cleanup_ref_head_accounting(struct btrfs_fs_info *fs_info,</div><div class='del'>-				  struct btrfs_delayed_ref_root *delayed_refs,</div><div class='del'>-				  struct btrfs_delayed_ref_head *head);</div><div class='del'>-int btrfs_lookup_data_extent(struct btrfs_fs_info *fs_info, u64 start, u64 len);</div><div class='del'>-int btrfs_lookup_extent_info(struct btrfs_trans_handle *trans,</div><div class='del'>-			     struct btrfs_fs_info *fs_info, u64 bytenr,</div><div class='del'>-			     u64 offset, int metadata, u64 *refs, u64 *flags);</div><div class='del'>-int btrfs_pin_extent(struct btrfs_trans_handle *trans, u64 bytenr, u64 num,</div><div class='del'>-		     int reserved);</div><div class='del'>-int btrfs_pin_extent_for_log_replay(struct btrfs_trans_handle *trans,</div><div class='del'>-				    u64 bytenr, u64 num_bytes);</div><div class='del'>-int btrfs_exclude_logged_extents(struct extent_buffer *eb);</div><div class='del'>-int btrfs_cross_ref_exist(struct btrfs_root *root,</div><div class='del'>-			  u64 objectid, u64 offset, u64 bytenr, bool strict);</div><div class='del'>-struct extent_buffer *btrfs_alloc_tree_block(struct btrfs_trans_handle *trans,</div><div class='del'>-					     struct btrfs_root *root,</div><div class='del'>-					     u64 parent, u64 root_objectid,</div><div class='del'>-					     const struct btrfs_disk_key *key,</div><div class='del'>-					     int level, u64 hint,</div><div class='del'>-					     u64 empty_size,</div><div class='del'>-					     enum btrfs_lock_nesting nest);</div><div class='del'>-void btrfs_free_tree_block(struct btrfs_trans_handle *trans,</div><div class='del'>-			   struct btrfs_root *root,</div><div class='del'>-			   struct extent_buffer *buf,</div><div class='del'>-			   u64 parent, int last_ref);</div><div class='del'>-int btrfs_alloc_reserved_file_extent(struct btrfs_trans_handle *trans,</div><div class='del'>-				     struct btrfs_root *root, u64 owner,</div><div class='del'>-				     u64 offset, u64 ram_bytes,</div><div class='del'>-				     struct btrfs_key *ins);</div><div class='del'>-int btrfs_alloc_logged_file_extent(struct btrfs_trans_handle *trans,</div><div class='del'>-				   u64 root_objectid, u64 owner, u64 offset,</div><div class='del'>-				   struct btrfs_key *ins);</div><div class='del'>-int btrfs_reserve_extent(struct btrfs_root *root, u64 ram_bytes, u64 num_bytes,</div><div class='del'>-			 u64 min_alloc_size, u64 empty_size, u64 hint_byte,</div><div class='del'>-			 struct btrfs_key *ins, int is_data, int delalloc);</div><div class='del'>-int btrfs_inc_ref(struct btrfs_trans_handle *trans, struct btrfs_root *root,</div><div class='del'>-		  struct extent_buffer *buf, int full_backref);</div><div class='del'>-int btrfs_dec_ref(struct btrfs_trans_handle *trans, struct btrfs_root *root,</div><div class='del'>-		  struct extent_buffer *buf, int full_backref);</div><div class='del'>-int btrfs_set_disk_extent_flags(struct btrfs_trans_handle *trans,</div><div class='del'>-				struct extent_buffer *eb, u64 flags,</div><div class='del'>-				int level, int is_data);</div><div class='del'>-int btrfs_free_extent(struct btrfs_trans_handle *trans, struct btrfs_ref *ref);</div><div class='del'>-</div><div class='del'>-int btrfs_free_reserved_extent(struct btrfs_fs_info *fs_info,</div><div class='del'>-			       u64 start, u64 len, int delalloc);</div><div class='del'>-int btrfs_pin_reserved_extent(struct btrfs_trans_handle *trans, u64 start,</div><div class='del'>-			      u64 len);</div><div class='del'>-int btrfs_finish_extent_commit(struct btrfs_trans_handle *trans);</div><div class='del'>-int btrfs_inc_extent_ref(struct btrfs_trans_handle *trans,</div><div class='del'>-			 struct btrfs_ref *generic_ref);</div><div class='del'>-</div><div class='del'>-void btrfs_clear_space_info_full(struct btrfs_fs_info *info);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Different levels for to flush space when doing space reservations.</div><div class='del'>- *</div><div class='del'>- * The higher the level, the more methods we try to reclaim space.</div><div class='del'>- */</div><div class='del'>-enum btrfs_reserve_flush_enum {</div><div class='del'>-	/* If we are in the transaction, we can't flush anything.*/</div><div class='del'>-	BTRFS_RESERVE_NO_FLUSH,</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Flush space by:</div><div class='del'>-	 * - Running delayed inode items</div><div class='del'>-	 * - Allocating a new chunk</div><div class='del'>-	 */</div><div class='del'>-	BTRFS_RESERVE_FLUSH_LIMIT,</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Flush space by:</div><div class='del'>-	 * - Running delayed inode items</div><div class='del'>-	 * - Running delayed refs</div><div class='del'>-	 * - Running delalloc and waiting for ordered extents</div><div class='del'>-	 * - Allocating a new chunk</div><div class='del'>-	 */</div><div class='del'>-	BTRFS_RESERVE_FLUSH_EVICT,</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Flush space by above mentioned methods and by:</div><div class='del'>-	 * - Running delayed iputs</div><div class='del'>-	 * - Committing transaction</div><div class='del'>-	 *</div><div class='del'>-	 * Can be interrupted by a fatal signal.</div><div class='del'>-	 */</div><div class='del'>-	BTRFS_RESERVE_FLUSH_DATA,</div><div class='del'>-	BTRFS_RESERVE_FLUSH_FREE_SPACE_INODE,</div><div class='del'>-	BTRFS_RESERVE_FLUSH_ALL,</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Pretty much the same as FLUSH_ALL, but can also steal space from</div><div class='del'>-	 * global rsv.</div><div class='del'>-	 *</div><div class='del'>-	 * Can be interrupted by a fatal signal.</div><div class='del'>-	 */</div><div class='del'>-	BTRFS_RESERVE_FLUSH_ALL_STEAL,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-enum btrfs_flush_state {</div><div class='del'>-	FLUSH_DELAYED_ITEMS_NR	=	1,</div><div class='del'>-	FLUSH_DELAYED_ITEMS	=	2,</div><div class='del'>-	FLUSH_DELAYED_REFS_NR	=	3,</div><div class='del'>-	FLUSH_DELAYED_REFS	=	4,</div><div class='del'>-	FLUSH_DELALLOC		=	5,</div><div class='del'>-	FLUSH_DELALLOC_WAIT	=	6,</div><div class='del'>-	FLUSH_DELALLOC_FULL	=	7,</div><div class='del'>-	ALLOC_CHUNK		=	8,</div><div class='del'>-	ALLOC_CHUNK_FORCE	=	9,</div><div class='del'>-	RUN_DELAYED_IPUTS	=	10,</div><div class='del'>-	COMMIT_TRANS		=	11,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-int btrfs_subvolume_reserve_metadata(struct btrfs_root *root,</div><div class='del'>-				     struct btrfs_block_rsv *rsv,</div><div class='del'>-				     int nitems, bool use_global_rsv);</div><div class='del'>-void btrfs_subvolume_release_metadata(struct btrfs_root *root,</div><div class='del'>-				      struct btrfs_block_rsv *rsv);</div><div class='del'>-void btrfs_delalloc_release_extents(struct btrfs_inode *inode, u64 num_bytes);</div><div class='del'>-</div><div class='del'>-int btrfs_delalloc_reserve_metadata(struct btrfs_inode *inode, u64 num_bytes);</div><div class='del'>-u64 btrfs_account_ro_block_groups_free_space(struct btrfs_space_info *sinfo);</div><div class='del'>-int btrfs_error_unpin_extent_range(struct btrfs_fs_info *fs_info,</div><div class='del'>-				   u64 start, u64 end);</div><div class='del'>-int btrfs_discard_extent(struct btrfs_fs_info *fs_info, u64 bytenr,</div><div class='del'>-			 u64 num_bytes, u64 *actual_bytes);</div><div class='del'>-int btrfs_trim_fs(struct btrfs_fs_info *fs_info, struct fstrim_range *range);</div><div class='del'>-</div><div class='del'>-int btrfs_init_space_info(struct btrfs_fs_info *fs_info);</div><div class='del'>-int btrfs_delayed_refs_qgroup_accounting(struct btrfs_trans_handle *trans,</div><div class='del'>-					 struct btrfs_fs_info *fs_info);</div><div class='del'>-int btrfs_start_write_no_snapshotting(struct btrfs_root *root);</div><div class='del'>-void btrfs_end_write_no_snapshotting(struct btrfs_root *root);</div><div class='del'>-void btrfs_wait_for_snapshot_creation(struct btrfs_root *root);</div><div class='del'>-</div><div class='del'>-/* ctree.c */</div><div class='del'>-int btrfs_bin_search(struct extent_buffer *eb, const struct btrfs_key *key,</div><div class='del'>-		     int *slot);</div><div class='del'>-int __pure btrfs_comp_cpu_keys(const struct btrfs_key *k1, const struct btrfs_key *k2);</div><div class='ctx'> int btrfs_previous_item(struct btrfs_root *root,</div><div class='ctx'> 			struct btrfs_path *path, u64 min_objectid,</div><div class='ctx'> 			int type);</div><div class='ctx'> int btrfs_previous_extent_item(struct btrfs_root *root,</div><div class='ctx'> 			struct btrfs_path *path, u64 min_objectid);</div><div class='del'>-void btrfs_set_item_key_safe(struct btrfs_fs_info *fs_info,</div><div class='del'>-			     struct btrfs_path *path,</div><div class='add'>+void btrfs_set_item_key_safe(struct btrfs_trans_handle *trans,</div><div class='add'>+			     const struct btrfs_path *path,</div><div class='ctx'> 			     const struct btrfs_key *new_key);</div><div class='ctx'> struct extent_buffer *btrfs_root_node(struct btrfs_root *root);</div><div class='ctx'> int btrfs_find_next_key(struct btrfs_root *root, struct btrfs_path *path,</div><div class='hunk'>@@ -2859,14 +557,26 @@ int btrfs_cow_block(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		    struct extent_buffer *parent, int parent_slot,</div><div class='ctx'> 		    struct extent_buffer **cow_ret,</div><div class='ctx'> 		    enum btrfs_lock_nesting nest);</div><div class='add'>+int btrfs_force_cow_block(struct btrfs_trans_handle *trans,</div><div class='add'>+			  struct btrfs_root *root,</div><div class='add'>+			  struct extent_buffer *buf,</div><div class='add'>+			  struct extent_buffer *parent, int parent_slot,</div><div class='add'>+			  struct extent_buffer **cow_ret,</div><div class='add'>+			  u64 search_start, u64 empty_size,</div><div class='add'>+			  enum btrfs_lock_nesting nest);</div><div class='ctx'> int btrfs_copy_root(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		      struct btrfs_root *root,</div><div class='ctx'> 		      struct extent_buffer *buf,</div><div class='ctx'> 		      struct extent_buffer **cow_ret, u64 new_root_objectid);</div><div class='del'>-int btrfs_block_can_be_shared(struct btrfs_root *root,</div><div class='del'>-			      struct extent_buffer *buf);</div><div class='del'>-void btrfs_extend_item(struct btrfs_path *path, u32 data_size);</div><div class='del'>-void btrfs_truncate_item(struct btrfs_path *path, u32 new_size, int from_end);</div><div class='add'>+bool btrfs_block_can_be_shared(const struct btrfs_trans_handle *trans,</div><div class='add'>+			       const struct btrfs_root *root,</div><div class='add'>+			       const struct extent_buffer *buf);</div><div class='add'>+int btrfs_del_ptr(struct btrfs_trans_handle *trans, struct btrfs_root *root,</div><div class='add'>+		  struct btrfs_path *path, int level, int slot);</div><div class='add'>+void btrfs_extend_item(struct btrfs_trans_handle *trans,</div><div class='add'>+		       const struct btrfs_path *path, u32 data_size);</div><div class='add'>+void btrfs_truncate_item(struct btrfs_trans_handle *trans,</div><div class='add'>+			 const struct btrfs_path *path, u32 new_size, int from_end);</div><div class='ctx'> int btrfs_split_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		     struct btrfs_root *root,</div><div class='ctx'> 		     struct btrfs_path *path,</div><div class='hunk'>@@ -2887,13 +597,10 @@ int btrfs_search_slot_for_read(struct btrfs_root *root,</div><div class='ctx'> 			       const struct btrfs_key *key,</div><div class='ctx'> 			       struct btrfs_path *p, int find_higher,</div><div class='ctx'> 			       int return_any);</div><div class='del'>-int btrfs_realloc_node(struct btrfs_trans_handle *trans,</div><div class='del'>-		       struct btrfs_root *root, struct extent_buffer *parent,</div><div class='del'>-		       int start_slot, u64 *last_ret,</div><div class='del'>-		       struct btrfs_key *progress);</div><div class='ctx'> void btrfs_release_path(struct btrfs_path *p);</div><div class='ctx'> struct btrfs_path *btrfs_alloc_path(void);</div><div class='ctx'> void btrfs_free_path(struct btrfs_path *p);</div><div class='add'>+DEFINE_FREE(btrfs_free_path, struct btrfs_path *, btrfs_free_path(_T))</div><div class='ctx'> </div><div class='ctx'> int btrfs_del_items(struct btrfs_trans_handle *trans, struct btrfs_root *root,</div><div class='ctx'> 		   struct btrfs_path *path, int slot, int nr);</div><div class='hunk'>@@ -2930,7 +637,8 @@ struct btrfs_item_batch {</div><div class='ctx'> 	int nr;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-void btrfs_setup_item_for_insert(struct btrfs_root *root,</div><div class='add'>+void btrfs_setup_item_for_insert(struct btrfs_trans_handle *trans,</div><div class='add'>+				 struct btrfs_root *root,</div><div class='ctx'> 				 struct btrfs_path *path,</div><div class='ctx'> 				 const struct btrfs_key *key,</div><div class='ctx'> 				 u32 data_size);</div><div class='hunk'>@@ -2957,21 +665,42 @@ static inline int btrfs_insert_empty_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	return btrfs_insert_empty_items(trans, root, path, &amp;batch);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_prev_leaf(struct btrfs_root *root, struct btrfs_path *path);</div><div class='ctx'> int btrfs_next_old_leaf(struct btrfs_root *root, struct btrfs_path *path,</div><div class='ctx'> 			u64 time_seq);</div><div class='ctx'> </div><div class='ctx'> int btrfs_search_backwards(struct btrfs_root *root, struct btrfs_key *key,</div><div class='ctx'> 			   struct btrfs_path *path);</div><div class='ctx'> </div><div class='del'>-static inline int btrfs_next_old_item(struct btrfs_root *root,</div><div class='del'>-				      struct btrfs_path *p, u64 time_seq)</div><div class='del'>-{</div><div class='del'>-	++p-&gt;slots[0];</div><div class='del'>-	if (p-&gt;slots[0] &gt;= btrfs_header_nritems(p-&gt;nodes[0]))</div><div class='del'>-		return btrfs_next_old_leaf(root, p, time_seq);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='add'>+int btrfs_get_next_valid_item(struct btrfs_root *root, struct btrfs_key *key,</div><div class='add'>+			      struct btrfs_path *path);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Search in @root for a given @key, and store the slot found in @found_key.</div><div class='add'>+ *</div><div class='add'>+ * @root:	The root node of the tree.</div><div class='add'>+ * @key:	The key we are looking for.</div><div class='add'>+ * @found_key:	Will hold the found item.</div><div class='add'>+ * @path:	Holds the current slot/leaf.</div><div class='add'>+ * @iter_ret:	Contains the value returned from btrfs_search_slot or</div><div class='add'>+ * 		btrfs_get_next_valid_item, whichever was executed last.</div><div class='add'>+ *</div><div class='add'>+ * The @iter_ret is an output variable that will contain the return value of</div><div class='add'>+ * btrfs_search_slot, if it encountered an error, or the value returned from</div><div class='add'>+ * btrfs_get_next_valid_item otherwise. That return value can be 0, if a valid</div><div class='add'>+ * slot was found, 1 if there were no more leaves, and &lt;0 if there was an error.</div><div class='add'>+ *</div><div class='add'>+ * It's recommended to use a separate variable for iter_ret and then use it to</div><div class='add'>+ * set the function return value so there's no confusion of the 0/1/errno</div><div class='add'>+ * values stemming from btrfs_search_slot.</div><div class='add'>+ */</div><div class='add'>+#define btrfs_for_each_slot(root, key, found_key, path, iter_ret)		\</div><div class='add'>+	for (iter_ret = btrfs_search_slot(NULL, (root), (key), (path), 0, 0);	\</div><div class='add'>+		(iter_ret) &gt;= 0 &amp;&amp;						\</div><div class='add'>+		(iter_ret = btrfs_get_next_valid_item((root), (found_key), (path))) == 0; \</div><div class='add'>+		(path)-&gt;slots[0]++						\</div><div class='add'>+	)</div><div class='add'>+</div><div class='add'>+int btrfs_next_old_item(struct btrfs_root *root, struct btrfs_path *path, u64 time_seq);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Search the tree again to find a leaf with greater keys.</div><div class='hunk'>@@ -2988,911 +717,20 @@ static inline int btrfs_next_item(struct btrfs_root *root, struct btrfs_path *p)</div><div class='ctx'> {</div><div class='ctx'> 	return btrfs_next_old_item(root, p, 0);</div><div class='ctx'> }</div><div class='del'>-int btrfs_leaf_free_space(struct extent_buffer *leaf);</div><div class='del'>-int __must_check btrfs_drop_snapshot(struct btrfs_root *root, int update_ref,</div><div class='del'>-				     int for_reloc);</div><div class='del'>-int btrfs_drop_subtree(struct btrfs_trans_handle *trans,</div><div class='del'>-			struct btrfs_root *root,</div><div class='del'>-			struct extent_buffer *node,</div><div class='del'>-			struct extent_buffer *parent);</div><div class='del'>-static inline int btrfs_fs_closing(struct btrfs_fs_info *fs_info)</div><div class='del'>-{</div><div class='del'>-	/*</div><div class='del'>-	 * Do it this way so we only ever do one test_bit in the normal case.</div><div class='del'>-	 */</div><div class='del'>-	if (test_bit(BTRFS_FS_CLOSING_START, &amp;fs_info-&gt;flags)) {</div><div class='del'>-		if (test_bit(BTRFS_FS_CLOSING_DONE, &amp;fs_info-&gt;flags))</div><div class='del'>-			return 2;</div><div class='del'>-		return 1;</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * If we remount the fs to be R/O or umount the fs, the cleaner needn't do</div><div class='del'>- * anything except sleeping. This function is used to check the status of</div><div class='del'>- * the fs.</div><div class='del'>- * We check for BTRFS_FS_STATE_RO to avoid races with a concurrent remount,</div><div class='del'>- * since setting and checking for SB_RDONLY in the superblock's flags is not</div><div class='del'>- * atomic.</div><div class='del'>- */</div><div class='del'>-static inline int btrfs_need_cleaner_sleep(struct btrfs_fs_info *fs_info)</div><div class='del'>-{</div><div class='del'>-	return test_bit(BTRFS_FS_STATE_RO, &amp;fs_info-&gt;fs_state) ||</div><div class='del'>-		btrfs_fs_closing(fs_info);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_set_sb_rdonly(struct super_block *sb)</div><div class='del'>-{</div><div class='del'>-	sb-&gt;s_flags |= SB_RDONLY;</div><div class='del'>-	set_bit(BTRFS_FS_STATE_RO, &amp;btrfs_sb(sb)-&gt;fs_state);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_clear_sb_rdonly(struct super_block *sb)</div><div class='del'>-{</div><div class='del'>-	sb-&gt;s_flags &amp;= ~SB_RDONLY;</div><div class='del'>-	clear_bit(BTRFS_FS_STATE_RO, &amp;btrfs_sb(sb)-&gt;fs_state);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* root-item.c */</div><div class='del'>-int btrfs_add_root_ref(struct btrfs_trans_handle *trans, u64 root_id,</div><div class='del'>-		       u64 ref_id, u64 dirid, u64 sequence, const char *name,</div><div class='del'>-		       int name_len);</div><div class='del'>-int btrfs_del_root_ref(struct btrfs_trans_handle *trans, u64 root_id,</div><div class='del'>-		       u64 ref_id, u64 dirid, u64 *sequence, const char *name,</div><div class='del'>-		       int name_len);</div><div class='del'>-int btrfs_del_root(struct btrfs_trans_handle *trans,</div><div class='del'>-		   const struct btrfs_key *key);</div><div class='del'>-int btrfs_insert_root(struct btrfs_trans_handle *trans, struct btrfs_root *root,</div><div class='del'>-		      const struct btrfs_key *key,</div><div class='del'>-		      struct btrfs_root_item *item);</div><div class='del'>-int __must_check btrfs_update_root(struct btrfs_trans_handle *trans,</div><div class='del'>-				   struct btrfs_root *root,</div><div class='del'>-				   struct btrfs_key *key,</div><div class='del'>-				   struct btrfs_root_item *item);</div><div class='del'>-int btrfs_find_root(struct btrfs_root *root, const struct btrfs_key *search_key,</div><div class='del'>-		    struct btrfs_path *path, struct btrfs_root_item *root_item,</div><div class='del'>-		    struct btrfs_key *root_key);</div><div class='del'>-int btrfs_find_orphan_roots(struct btrfs_fs_info *fs_info);</div><div class='del'>-void btrfs_set_root_node(struct btrfs_root_item *item,</div><div class='del'>-			 struct extent_buffer *node);</div><div class='del'>-void btrfs_check_and_init_root_item(struct btrfs_root_item *item);</div><div class='del'>-void btrfs_update_root_times(struct btrfs_trans_handle *trans,</div><div class='del'>-			     struct btrfs_root *root);</div><div class='del'>-</div><div class='del'>-/* uuid-tree.c */</div><div class='del'>-int btrfs_uuid_tree_add(struct btrfs_trans_handle *trans, u8 *uuid, u8 type,</div><div class='del'>-			u64 subid);</div><div class='del'>-int btrfs_uuid_tree_remove(struct btrfs_trans_handle *trans, u8 *uuid, u8 type,</div><div class='del'>-			u64 subid);</div><div class='del'>-int btrfs_uuid_tree_iterate(struct btrfs_fs_info *fs_info);</div><div class='del'>-</div><div class='del'>-/* dir-item.c */</div><div class='del'>-int btrfs_check_dir_item_collision(struct btrfs_root *root, u64 dir,</div><div class='del'>-			  const char *name, int name_len);</div><div class='del'>-int btrfs_insert_dir_item(struct btrfs_trans_handle *trans, const char *name,</div><div class='del'>-			  int name_len, struct btrfs_inode *dir,</div><div class='del'>-			  struct btrfs_key *location, u8 type, u64 index);</div><div class='del'>-struct btrfs_dir_item *btrfs_lookup_dir_item(struct btrfs_trans_handle *trans,</div><div class='del'>-					     struct btrfs_root *root,</div><div class='del'>-					     struct btrfs_path *path, u64 dir,</div><div class='del'>-					     const char *name, int name_len,</div><div class='del'>-					     int mod);</div><div class='del'>-struct btrfs_dir_item *</div><div class='del'>-btrfs_lookup_dir_index_item(struct btrfs_trans_handle *trans,</div><div class='del'>-			    struct btrfs_root *root,</div><div class='del'>-			    struct btrfs_path *path, u64 dir,</div><div class='del'>-			    u64 index, const char *name, int name_len,</div><div class='del'>-			    int mod);</div><div class='del'>-struct btrfs_dir_item *</div><div class='del'>-btrfs_search_dir_index_item(struct btrfs_root *root,</div><div class='del'>-			    struct btrfs_path *path, u64 dirid,</div><div class='del'>-			    const char *name, int name_len);</div><div class='del'>-int btrfs_delete_one_dir_name(struct btrfs_trans_handle *trans,</div><div class='del'>-			      struct btrfs_root *root,</div><div class='del'>-			      struct btrfs_path *path,</div><div class='del'>-			      struct btrfs_dir_item *di);</div><div class='del'>-int btrfs_insert_xattr_item(struct btrfs_trans_handle *trans,</div><div class='del'>-			    struct btrfs_root *root,</div><div class='del'>-			    struct btrfs_path *path, u64 objectid,</div><div class='del'>-			    const char *name, u16 name_len,</div><div class='del'>-			    const void *data, u16 data_len);</div><div class='del'>-struct btrfs_dir_item *btrfs_lookup_xattr(struct btrfs_trans_handle *trans,</div><div class='del'>-					  struct btrfs_root *root,</div><div class='del'>-					  struct btrfs_path *path, u64 dir,</div><div class='del'>-					  const char *name, u16 name_len,</div><div class='del'>-					  int mod);</div><div class='del'>-struct btrfs_dir_item *btrfs_match_dir_item_name(struct btrfs_fs_info *fs_info,</div><div class='del'>-						 struct btrfs_path *path,</div><div class='del'>-						 const char *name,</div><div class='del'>-						 int name_len);</div><div class='del'>-</div><div class='del'>-/* orphan.c */</div><div class='del'>-int btrfs_insert_orphan_item(struct btrfs_trans_handle *trans,</div><div class='del'>-			     struct btrfs_root *root, u64 offset);</div><div class='del'>-int btrfs_del_orphan_item(struct btrfs_trans_handle *trans,</div><div class='del'>-			  struct btrfs_root *root, u64 offset);</div><div class='del'>-int btrfs_find_orphan_item(struct btrfs_root *root, u64 offset);</div><div class='del'>-</div><div class='del'>-/* inode-item.c */</div><div class='del'>-int btrfs_insert_inode_ref(struct btrfs_trans_handle *trans,</div><div class='del'>-			   struct btrfs_root *root,</div><div class='del'>-			   const char *name, int name_len,</div><div class='del'>-			   u64 inode_objectid, u64 ref_objectid, u64 index);</div><div class='del'>-int btrfs_del_inode_ref(struct btrfs_trans_handle *trans,</div><div class='del'>-			   struct btrfs_root *root,</div><div class='del'>-			   const char *name, int name_len,</div><div class='del'>-			   u64 inode_objectid, u64 ref_objectid, u64 *index);</div><div class='del'>-int btrfs_insert_empty_inode(struct btrfs_trans_handle *trans,</div><div class='del'>-			     struct btrfs_root *root,</div><div class='del'>-			     struct btrfs_path *path, u64 objectid);</div><div class='del'>-int btrfs_lookup_inode(struct btrfs_trans_handle *trans, struct btrfs_root</div><div class='del'>-		       *root, struct btrfs_path *path,</div><div class='del'>-		       struct btrfs_key *location, int mod);</div><div class='del'>-</div><div class='del'>-struct btrfs_inode_extref *</div><div class='del'>-btrfs_lookup_inode_extref(struct btrfs_trans_handle *trans,</div><div class='del'>-			  struct btrfs_root *root,</div><div class='del'>-			  struct btrfs_path *path,</div><div class='del'>-			  const char *name, int name_len,</div><div class='del'>-			  u64 inode_objectid, u64 ref_objectid, int ins_len,</div><div class='del'>-			  int cow);</div><div class='del'>-</div><div class='del'>-struct btrfs_inode_ref *btrfs_find_name_in_backref(struct extent_buffer *leaf,</div><div class='del'>-						   int slot, const char *name,</div><div class='del'>-						   int name_len);</div><div class='del'>-struct btrfs_inode_extref *btrfs_find_name_in_ext_backref(</div><div class='del'>-		struct extent_buffer *leaf, int slot, u64 ref_objectid,</div><div class='del'>-		const char *name, int name_len);</div><div class='del'>-/* file-item.c */</div><div class='del'>-struct btrfs_dio_private;</div><div class='del'>-int btrfs_del_csums(struct btrfs_trans_handle *trans,</div><div class='del'>-		    struct btrfs_root *root, u64 bytenr, u64 len);</div><div class='del'>-blk_status_t btrfs_lookup_bio_sums(struct inode *inode, struct bio *bio, u8 *dst);</div><div class='del'>-int btrfs_insert_file_extent(struct btrfs_trans_handle *trans,</div><div class='del'>-			     struct btrfs_root *root,</div><div class='del'>-			     u64 objectid, u64 pos,</div><div class='del'>-			     u64 disk_offset, u64 disk_num_bytes,</div><div class='del'>-			     u64 num_bytes, u64 offset, u64 ram_bytes,</div><div class='del'>-			     u8 compression, u8 encryption, u16 other_encoding);</div><div class='del'>-int btrfs_lookup_file_extent(struct btrfs_trans_handle *trans,</div><div class='del'>-			     struct btrfs_root *root,</div><div class='del'>-			     struct btrfs_path *path, u64 objectid,</div><div class='del'>-			     u64 bytenr, int mod);</div><div class='del'>-int btrfs_csum_file_blocks(struct btrfs_trans_handle *trans,</div><div class='del'>-			   struct btrfs_root *root,</div><div class='del'>-			   struct btrfs_ordered_sum *sums);</div><div class='del'>-blk_status_t btrfs_csum_one_bio(struct btrfs_inode *inode, struct bio *bio,</div><div class='del'>-				u64 file_start, int contig);</div><div class='del'>-int btrfs_lookup_csums_range(struct btrfs_root *root, u64 start, u64 end,</div><div class='del'>-			     struct list_head *list, int search_commit);</div><div class='del'>-void btrfs_extent_item_to_extent_map(struct btrfs_inode *inode,</div><div class='del'>-				     const struct btrfs_path *path,</div><div class='del'>-				     struct btrfs_file_extent_item *fi,</div><div class='del'>-				     const bool new_inline,</div><div class='del'>-				     struct extent_map *em);</div><div class='del'>-int btrfs_inode_clear_file_extent_range(struct btrfs_inode *inode, u64 start,</div><div class='del'>-					u64 len);</div><div class='del'>-int btrfs_inode_set_file_extent_range(struct btrfs_inode *inode, u64 start,</div><div class='del'>-				      u64 len);</div><div class='del'>-void btrfs_inode_safe_disk_i_size_write(struct btrfs_inode *inode, u64 new_i_size);</div><div class='del'>-u64 btrfs_file_extent_end(const struct btrfs_path *path);</div><div class='del'>-</div><div class='del'>-/* inode.c */</div><div class='del'>-blk_status_t btrfs_submit_data_bio(struct inode *inode, struct bio *bio,</div><div class='del'>-				   int mirror_num, unsigned long bio_flags);</div><div class='del'>-unsigned int btrfs_verify_data_csum(struct btrfs_bio *bbio,</div><div class='del'>-				    u32 bio_offset, struct page *page,</div><div class='del'>-				    u64 start, u64 end);</div><div class='del'>-struct extent_map *btrfs_get_extent_fiemap(struct btrfs_inode *inode,</div><div class='del'>-					   u64 start, u64 len);</div><div class='del'>-noinline int can_nocow_extent(struct inode *inode, u64 offset, u64 *len,</div><div class='del'>-			      u64 *orig_start, u64 *orig_block_len,</div><div class='del'>-			      u64 *ram_bytes, bool strict);</div><div class='del'>-</div><div class='del'>-void __btrfs_del_delalloc_inode(struct btrfs_root *root,</div><div class='del'>-				struct btrfs_inode *inode);</div><div class='del'>-struct inode *btrfs_lookup_dentry(struct inode *dir, struct dentry *dentry);</div><div class='del'>-int btrfs_set_inode_index(struct btrfs_inode *dir, u64 *index);</div><div class='del'>-int btrfs_unlink_inode(struct btrfs_trans_handle *trans,</div><div class='del'>-		       struct btrfs_inode *dir, struct btrfs_inode *inode,</div><div class='del'>-		       const char *name, int name_len);</div><div class='del'>-int btrfs_add_link(struct btrfs_trans_handle *trans,</div><div class='del'>-		   struct btrfs_inode *parent_inode, struct btrfs_inode *inode,</div><div class='del'>-		   const char *name, int name_len, int add_backref, u64 index);</div><div class='del'>-int btrfs_delete_subvolume(struct inode *dir, struct dentry *dentry);</div><div class='del'>-int btrfs_truncate_block(struct btrfs_inode *inode, loff_t from, loff_t len,</div><div class='del'>-			 int front);</div><div class='del'>-int btrfs_truncate_inode_items(struct btrfs_trans_handle *trans,</div><div class='del'>-			       struct btrfs_root *root,</div><div class='del'>-			       struct btrfs_inode *inode, u64 new_size,</div><div class='del'>-			       u32 min_type, u64 *extents_found);</div><div class='del'>-</div><div class='del'>-int btrfs_start_delalloc_snapshot(struct btrfs_root *root, bool in_reclaim_context);</div><div class='del'>-int btrfs_start_delalloc_roots(struct btrfs_fs_info *fs_info, long nr,</div><div class='del'>-			       bool in_reclaim_context);</div><div class='del'>-int btrfs_set_extent_delalloc(struct btrfs_inode *inode, u64 start, u64 end,</div><div class='del'>-			      unsigned int extra_bits,</div><div class='del'>-			      struct extent_state **cached_state);</div><div class='del'>-int btrfs_create_subvol_root(struct btrfs_trans_handle *trans,</div><div class='del'>-			     struct btrfs_root *new_root,</div><div class='del'>-			     struct btrfs_root *parent_root,</div><div class='del'>-			     struct user_namespace *mnt_userns);</div><div class='del'>- void btrfs_set_delalloc_extent(struct inode *inode, struct extent_state *state,</div><div class='del'>-			       unsigned *bits);</div><div class='del'>-void btrfs_clear_delalloc_extent(struct inode *inode,</div><div class='del'>-				 struct extent_state *state, unsigned *bits);</div><div class='del'>-void btrfs_merge_delalloc_extent(struct inode *inode, struct extent_state *new,</div><div class='del'>-				 struct extent_state *other);</div><div class='del'>-void btrfs_split_delalloc_extent(struct inode *inode,</div><div class='del'>-				 struct extent_state *orig, u64 split);</div><div class='del'>-void btrfs_set_range_writeback(struct btrfs_inode *inode, u64 start, u64 end);</div><div class='del'>-vm_fault_t btrfs_page_mkwrite(struct vm_fault *vmf);</div><div class='del'>-int btrfs_readpage(struct file *file, struct page *page);</div><div class='del'>-void btrfs_evict_inode(struct inode *inode);</div><div class='del'>-int btrfs_write_inode(struct inode *inode, struct writeback_control *wbc);</div><div class='del'>-struct inode *btrfs_alloc_inode(struct super_block *sb);</div><div class='del'>-void btrfs_destroy_inode(struct inode *inode);</div><div class='del'>-void btrfs_free_inode(struct inode *inode);</div><div class='del'>-int btrfs_drop_inode(struct inode *inode);</div><div class='del'>-int __init btrfs_init_cachep(void);</div><div class='del'>-void __cold btrfs_destroy_cachep(void);</div><div class='del'>-struct inode *btrfs_iget_path(struct super_block *s, u64 ino,</div><div class='del'>-			      struct btrfs_root *root, struct btrfs_path *path);</div><div class='del'>-struct inode *btrfs_iget(struct super_block *s, u64 ino, struct btrfs_root *root);</div><div class='del'>-struct extent_map *btrfs_get_extent(struct btrfs_inode *inode,</div><div class='del'>-				    struct page *page, size_t pg_offset,</div><div class='del'>-				    u64 start, u64 end);</div><div class='del'>-int btrfs_update_inode(struct btrfs_trans_handle *trans,</div><div class='del'>-		       struct btrfs_root *root, struct btrfs_inode *inode);</div><div class='del'>-int btrfs_update_inode_fallback(struct btrfs_trans_handle *trans,</div><div class='del'>-				struct btrfs_root *root, struct btrfs_inode *inode);</div><div class='del'>-int btrfs_orphan_add(struct btrfs_trans_handle *trans,</div><div class='del'>-		struct btrfs_inode *inode);</div><div class='del'>-int btrfs_orphan_cleanup(struct btrfs_root *root);</div><div class='del'>-int btrfs_cont_expand(struct btrfs_inode *inode, loff_t oldsize, loff_t size);</div><div class='del'>-void btrfs_add_delayed_iput(struct inode *inode);</div><div class='del'>-void btrfs_run_delayed_iputs(struct btrfs_fs_info *fs_info);</div><div class='del'>-int btrfs_wait_on_delayed_iputs(struct btrfs_fs_info *fs_info);</div><div class='del'>-int btrfs_prealloc_file_range(struct inode *inode, int mode,</div><div class='del'>-			      u64 start, u64 num_bytes, u64 min_size,</div><div class='del'>-			      loff_t actual_len, u64 *alloc_hint);</div><div class='del'>-int btrfs_prealloc_file_range_trans(struct inode *inode,</div><div class='del'>-				    struct btrfs_trans_handle *trans, int mode,</div><div class='del'>-				    u64 start, u64 num_bytes, u64 min_size,</div><div class='del'>-				    loff_t actual_len, u64 *alloc_hint);</div><div class='del'>-int btrfs_run_delalloc_range(struct btrfs_inode *inode, struct page *locked_page,</div><div class='del'>-		u64 start, u64 end, int *page_started, unsigned long *nr_written,</div><div class='del'>-		struct writeback_control *wbc);</div><div class='del'>-int btrfs_writepage_cow_fixup(struct page *page);</div><div class='del'>-void btrfs_writepage_endio_finish_ordered(struct btrfs_inode *inode,</div><div class='del'>-					  struct page *page, u64 start,</div><div class='del'>-					  u64 end, bool uptodate);</div><div class='del'>-extern const struct dentry_operations btrfs_dentry_operations;</div><div class='del'>-extern const struct iomap_ops btrfs_dio_iomap_ops;</div><div class='del'>-extern const struct iomap_dio_ops btrfs_dio_ops;</div><div class='del'>-</div><div class='del'>-/* Inode locking type flags, by default the exclusive lock is taken */</div><div class='del'>-#define BTRFS_ILOCK_SHARED	(1U &lt;&lt; 0)</div><div class='del'>-#define BTRFS_ILOCK_TRY 	(1U &lt;&lt; 1)</div><div class='del'>-#define BTRFS_ILOCK_MMAP	(1U &lt;&lt; 2)</div><div class='del'>-</div><div class='del'>-int btrfs_inode_lock(struct inode *inode, unsigned int ilock_flags);</div><div class='del'>-void btrfs_inode_unlock(struct inode *inode, unsigned int ilock_flags);</div><div class='del'>-void btrfs_update_inode_bytes(struct btrfs_inode *inode,</div><div class='del'>-			      const u64 add_bytes,</div><div class='del'>-			      const u64 del_bytes);</div><div class='del'>-</div><div class='del'>-/* ioctl.c */</div><div class='del'>-long btrfs_ioctl(struct file *file, unsigned int cmd, unsigned long arg);</div><div class='del'>-long btrfs_compat_ioctl(struct file *file, unsigned int cmd, unsigned long arg);</div><div class='del'>-int btrfs_fileattr_get(struct dentry *dentry, struct fileattr *fa);</div><div class='del'>-int btrfs_fileattr_set(struct user_namespace *mnt_userns,</div><div class='del'>-		       struct dentry *dentry, struct fileattr *fa);</div><div class='del'>-int btrfs_ioctl_get_supported_features(void __user *arg);</div><div class='del'>-void btrfs_sync_inode_flags_to_i_flags(struct inode *inode);</div><div class='del'>-int __pure btrfs_is_empty_uuid(u8 *uuid);</div><div class='del'>-int btrfs_defrag_file(struct inode *inode, struct file_ra_state *ra,</div><div class='del'>-		      struct btrfs_ioctl_defrag_range_args *range,</div><div class='del'>-		      u64 newer_than, unsigned long max_to_defrag);</div><div class='del'>-void btrfs_get_block_group_info(struct list_head *groups_list,</div><div class='del'>-				struct btrfs_ioctl_space_info *space);</div><div class='del'>-void btrfs_update_ioctl_balance_args(struct btrfs_fs_info *fs_info,</div><div class='del'>-			       struct btrfs_ioctl_balance_args *bargs);</div><div class='del'>-bool btrfs_exclop_start(struct btrfs_fs_info *fs_info,</div><div class='del'>-			enum btrfs_exclusive_operation type);</div><div class='del'>-bool btrfs_exclop_start_try_lock(struct btrfs_fs_info *fs_info,</div><div class='del'>-				 enum btrfs_exclusive_operation type);</div><div class='del'>-void btrfs_exclop_start_unlock(struct btrfs_fs_info *fs_info);</div><div class='del'>-void btrfs_exclop_finish(struct btrfs_fs_info *fs_info);</div><div class='del'>-</div><div class='del'>-/* file.c */</div><div class='del'>-int __init btrfs_auto_defrag_init(void);</div><div class='del'>-void __cold btrfs_auto_defrag_exit(void);</div><div class='del'>-int btrfs_add_inode_defrag(struct btrfs_trans_handle *trans,</div><div class='del'>-			   struct btrfs_inode *inode);</div><div class='del'>-int btrfs_run_defrag_inodes(struct btrfs_fs_info *fs_info);</div><div class='del'>-void btrfs_cleanup_defrag_inodes(struct btrfs_fs_info *fs_info);</div><div class='del'>-int btrfs_sync_file(struct file *file, loff_t start, loff_t end, int datasync);</div><div class='del'>-void btrfs_drop_extent_cache(struct btrfs_inode *inode, u64 start, u64 end,</div><div class='del'>-			     int skip_pinned);</div><div class='del'>-extern const struct file_operations btrfs_file_operations;</div><div class='del'>-int btrfs_drop_extents(struct btrfs_trans_handle *trans,</div><div class='del'>-		       struct btrfs_root *root, struct btrfs_inode *inode,</div><div class='del'>-		       struct btrfs_drop_extents_args *args);</div><div class='del'>-int btrfs_replace_file_extents(struct btrfs_inode *inode,</div><div class='del'>-			   struct btrfs_path *path, const u64 start,</div><div class='del'>-			   const u64 end,</div><div class='del'>-			   struct btrfs_replace_extent_info *extent_info,</div><div class='del'>-			   struct btrfs_trans_handle **trans_out);</div><div class='del'>-int btrfs_mark_extent_written(struct btrfs_trans_handle *trans,</div><div class='del'>-			      struct btrfs_inode *inode, u64 start, u64 end);</div><div class='del'>-int btrfs_release_file(struct inode *inode, struct file *file);</div><div class='del'>-int btrfs_dirty_pages(struct btrfs_inode *inode, struct page **pages,</div><div class='del'>-		      size_t num_pages, loff_t pos, size_t write_bytes,</div><div class='del'>-		      struct extent_state **cached, bool noreserve);</div><div class='del'>-int btrfs_fdatawrite_range(struct inode *inode, loff_t start, loff_t end);</div><div class='del'>-int btrfs_check_nocow_lock(struct btrfs_inode *inode, loff_t pos,</div><div class='del'>-			   size_t *write_bytes);</div><div class='del'>-void btrfs_check_nocow_unlock(struct btrfs_inode *inode);</div><div class='del'>-</div><div class='del'>-/* tree-defrag.c */</div><div class='del'>-int btrfs_defrag_leaves(struct btrfs_trans_handle *trans,</div><div class='del'>-			struct btrfs_root *root);</div><div class='del'>-</div><div class='del'>-/* super.c */</div><div class='del'>-int btrfs_parse_options(struct btrfs_fs_info *info, char *options,</div><div class='del'>-			unsigned long new_flags);</div><div class='del'>-int btrfs_sync_fs(struct super_block *sb, int wait);</div><div class='del'>-char *btrfs_get_subvol_name_from_objectid(struct btrfs_fs_info *fs_info,</div><div class='del'>-					  u64 subvol_objectid);</div><div class='del'>-</div><div class='del'>-static inline __printf(2, 3) __cold</div><div class='del'>-void btrfs_no_printk(const struct btrfs_fs_info *fs_info, const char *fmt, ...)</div><div class='del'>-{</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_PRINTK</div><div class='del'>-__printf(2, 3)</div><div class='del'>-__cold</div><div class='del'>-void btrfs_printk(const struct btrfs_fs_info *fs_info, const char *fmt, ...);</div><div class='del'>-#else</div><div class='del'>-#define btrfs_printk(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_no_printk(fs_info, fmt, ##args)</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-#define btrfs_emerg(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk(fs_info, KERN_EMERG fmt, ##args)</div><div class='del'>-#define btrfs_alert(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk(fs_info, KERN_ALERT fmt, ##args)</div><div class='del'>-#define btrfs_crit(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk(fs_info, KERN_CRIT fmt, ##args)</div><div class='del'>-#define btrfs_err(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk(fs_info, KERN_ERR fmt, ##args)</div><div class='del'>-#define btrfs_warn(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk(fs_info, KERN_WARNING fmt, ##args)</div><div class='del'>-#define btrfs_notice(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk(fs_info, KERN_NOTICE fmt, ##args)</div><div class='del'>-#define btrfs_info(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk(fs_info, KERN_INFO fmt, ##args)</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Wrappers that use printk_in_rcu</div><div class='del'>- */</div><div class='del'>-#define btrfs_emerg_in_rcu(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk_in_rcu(fs_info, KERN_EMERG fmt, ##args)</div><div class='del'>-#define btrfs_alert_in_rcu(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk_in_rcu(fs_info, KERN_ALERT fmt, ##args)</div><div class='del'>-#define btrfs_crit_in_rcu(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk_in_rcu(fs_info, KERN_CRIT fmt, ##args)</div><div class='del'>-#define btrfs_err_in_rcu(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk_in_rcu(fs_info, KERN_ERR fmt, ##args)</div><div class='del'>-#define btrfs_warn_in_rcu(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk_in_rcu(fs_info, KERN_WARNING fmt, ##args)</div><div class='del'>-#define btrfs_notice_in_rcu(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk_in_rcu(fs_info, KERN_NOTICE fmt, ##args)</div><div class='del'>-#define btrfs_info_in_rcu(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk_in_rcu(fs_info, KERN_INFO fmt, ##args)</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Wrappers that use a ratelimited printk_in_rcu</div><div class='del'>- */</div><div class='del'>-#define btrfs_emerg_rl_in_rcu(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk_rl_in_rcu(fs_info, KERN_EMERG fmt, ##args)</div><div class='del'>-#define btrfs_alert_rl_in_rcu(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk_rl_in_rcu(fs_info, KERN_ALERT fmt, ##args)</div><div class='del'>-#define btrfs_crit_rl_in_rcu(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk_rl_in_rcu(fs_info, KERN_CRIT fmt, ##args)</div><div class='del'>-#define btrfs_err_rl_in_rcu(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk_rl_in_rcu(fs_info, KERN_ERR fmt, ##args)</div><div class='del'>-#define btrfs_warn_rl_in_rcu(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk_rl_in_rcu(fs_info, KERN_WARNING fmt, ##args)</div><div class='del'>-#define btrfs_notice_rl_in_rcu(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk_rl_in_rcu(fs_info, KERN_NOTICE fmt, ##args)</div><div class='del'>-#define btrfs_info_rl_in_rcu(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk_rl_in_rcu(fs_info, KERN_INFO fmt, ##args)</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Wrappers that use a ratelimited printk</div><div class='del'>- */</div><div class='del'>-#define btrfs_emerg_rl(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk_ratelimited(fs_info, KERN_EMERG fmt, ##args)</div><div class='del'>-#define btrfs_alert_rl(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk_ratelimited(fs_info, KERN_ALERT fmt, ##args)</div><div class='del'>-#define btrfs_crit_rl(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk_ratelimited(fs_info, KERN_CRIT fmt, ##args)</div><div class='del'>-#define btrfs_err_rl(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk_ratelimited(fs_info, KERN_ERR fmt, ##args)</div><div class='del'>-#define btrfs_warn_rl(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk_ratelimited(fs_info, KERN_WARNING fmt, ##args)</div><div class='del'>-#define btrfs_notice_rl(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk_ratelimited(fs_info, KERN_NOTICE fmt, ##args)</div><div class='del'>-#define btrfs_info_rl(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk_ratelimited(fs_info, KERN_INFO fmt, ##args)</div><div class='del'>-</div><div class='del'>-#if defined(CONFIG_DYNAMIC_DEBUG)</div><div class='del'>-#define btrfs_debug(fs_info, fmt, args...)				\</div><div class='del'>-	_dynamic_func_call_no_desc(fmt, btrfs_printk,			\</div><div class='del'>-				   fs_info, KERN_DEBUG fmt, ##args)</div><div class='del'>-#define btrfs_debug_in_rcu(fs_info, fmt, args...)			\</div><div class='del'>-	_dynamic_func_call_no_desc(fmt, btrfs_printk_in_rcu,		\</div><div class='del'>-				   fs_info, KERN_DEBUG fmt, ##args)</div><div class='del'>-#define btrfs_debug_rl_in_rcu(fs_info, fmt, args...)			\</div><div class='del'>-	_dynamic_func_call_no_desc(fmt, btrfs_printk_rl_in_rcu,		\</div><div class='del'>-				   fs_info, KERN_DEBUG fmt, ##args)</div><div class='del'>-#define btrfs_debug_rl(fs_info, fmt, args...)				\</div><div class='del'>-	_dynamic_func_call_no_desc(fmt, btrfs_printk_ratelimited,	\</div><div class='del'>-				   fs_info, KERN_DEBUG fmt, ##args)</div><div class='del'>-#elif defined(DEBUG)</div><div class='del'>-#define btrfs_debug(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk(fs_info, KERN_DEBUG fmt, ##args)</div><div class='del'>-#define btrfs_debug_in_rcu(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk_in_rcu(fs_info, KERN_DEBUG fmt, ##args)</div><div class='del'>-#define btrfs_debug_rl_in_rcu(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk_rl_in_rcu(fs_info, KERN_DEBUG fmt, ##args)</div><div class='del'>-#define btrfs_debug_rl(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_printk_ratelimited(fs_info, KERN_DEBUG fmt, ##args)</div><div class='del'>-#else</div><div class='del'>-#define btrfs_debug(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_no_printk(fs_info, KERN_DEBUG fmt, ##args)</div><div class='del'>-#define btrfs_debug_in_rcu(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_no_printk_in_rcu(fs_info, KERN_DEBUG fmt, ##args)</div><div class='del'>-#define btrfs_debug_rl_in_rcu(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_no_printk_in_rcu(fs_info, KERN_DEBUG fmt, ##args)</div><div class='del'>-#define btrfs_debug_rl(fs_info, fmt, args...) \</div><div class='del'>-	btrfs_no_printk(fs_info, KERN_DEBUG fmt, ##args)</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-#define btrfs_printk_in_rcu(fs_info, fmt, args...)	\</div><div class='del'>-do {							\</div><div class='del'>-	rcu_read_lock();				\</div><div class='del'>-	btrfs_printk(fs_info, fmt, ##args);		\</div><div class='del'>-	rcu_read_unlock();				\</div><div class='del'>-} while (0)</div><div class='del'>-</div><div class='del'>-#define btrfs_no_printk_in_rcu(fs_info, fmt, args...)	\</div><div class='del'>-do {							\</div><div class='del'>-	rcu_read_lock();				\</div><div class='del'>-	btrfs_no_printk(fs_info, fmt, ##args);		\</div><div class='del'>-	rcu_read_unlock();				\</div><div class='del'>-} while (0)</div><div class='del'>-</div><div class='del'>-#define btrfs_printk_ratelimited(fs_info, fmt, args...)		\</div><div class='del'>-do {								\</div><div class='del'>-	static DEFINE_RATELIMIT_STATE(_rs,			\</div><div class='del'>-		DEFAULT_RATELIMIT_INTERVAL,			\</div><div class='del'>-		DEFAULT_RATELIMIT_BURST);       		\</div><div class='del'>-	if (__ratelimit(&amp;_rs))					\</div><div class='del'>-		btrfs_printk(fs_info, fmt, ##args);		\</div><div class='del'>-} while (0)</div><div class='del'>-</div><div class='del'>-#define btrfs_printk_rl_in_rcu(fs_info, fmt, args...)		\</div><div class='del'>-do {								\</div><div class='del'>-	rcu_read_lock();					\</div><div class='del'>-	btrfs_printk_ratelimited(fs_info, fmt, ##args);		\</div><div class='del'>-	rcu_read_unlock();					\</div><div class='del'>-} while (0)</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_BTRFS_ASSERT</div><div class='del'>-__cold __noreturn</div><div class='del'>-static inline void assertfail(const char *expr, const char *file, int line)</div><div class='del'>-{</div><div class='del'>-	pr_err("assertion failed: %s, in %s:%d\n", expr, file, line);</div><div class='del'>-	BUG();</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#define ASSERT(expr)						\</div><div class='del'>-	(likely(expr) ? (void)0 : assertfail(#expr, __FILE__, __LINE__))</div><div class='del'>-</div><div class='del'>-#else</div><div class='del'>-static inline void assertfail(const char *expr, const char* file, int line) { }</div><div class='del'>-#define ASSERT(expr)	(void)(expr)</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-#if BITS_PER_LONG == 32</div><div class='del'>-#define BTRFS_32BIT_MAX_FILE_SIZE (((u64)ULONG_MAX + 1) &lt;&lt; PAGE_SHIFT)</div><div class='del'>-/*</div><div class='del'>- * The warning threshold is 5/8th of the MAX_LFS_FILESIZE that limits the logical</div><div class='del'>- * addresses of extents.</div><div class='del'>- *</div><div class='del'>- * For 4K page size it's about 10T, for 64K it's 160T.</div><div class='del'>- */</div><div class='del'>-#define BTRFS_32BIT_EARLY_WARN_THRESHOLD (BTRFS_32BIT_MAX_FILE_SIZE * 5 / 8)</div><div class='del'>-void btrfs_warn_32bit_limit(struct btrfs_fs_info *fs_info);</div><div class='del'>-void btrfs_err_32bit_limit(struct btrfs_fs_info *fs_info);</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Get the correct offset inside the page of extent buffer.</div><div class='del'>- *</div><div class='del'>- * @eb:		target extent buffer</div><div class='del'>- * @start:	offset inside the extent buffer</div><div class='del'>- *</div><div class='del'>- * Will handle both sectorsize == PAGE_SIZE and sectorsize &lt; PAGE_SIZE cases.</div><div class='del'>- */</div><div class='del'>-static inline size_t get_eb_offset_in_page(const struct extent_buffer *eb,</div><div class='del'>-					   unsigned long offset)</div><div class='del'>-{</div><div class='del'>-	/*</div><div class='del'>-	 * For sectorsize == PAGE_SIZE case, eb-&gt;start will always be aligned</div><div class='del'>-	 * to PAGE_SIZE, thus adding it won't cause any difference.</div><div class='del'>-	 *</div><div class='del'>-	 * For sectorsize &lt; PAGE_SIZE, we must only read the data that belongs</div><div class='del'>-	 * to the eb, thus we have to take the eb-&gt;start into consideration.</div><div class='del'>-	 */</div><div class='del'>-	return offset_in_page(offset + eb-&gt;start);</div><div class='del'>-}</div><div class='add'>+int btrfs_leaf_free_space(const struct extent_buffer *leaf);</div><div class='ctx'> </div><div class='del'>-static inline unsigned long get_eb_page_index(unsigned long offset)</div><div class='add'>+static inline bool btrfs_is_fstree(u64 rootid)</div><div class='ctx'> {</div><div class='del'>-	/*</div><div class='del'>-	 * For sectorsize == PAGE_SIZE case, plain &gt;&gt; PAGE_SHIFT is enough.</div><div class='del'>-	 *</div><div class='del'>-	 * For sectorsize &lt; PAGE_SIZE case, we only support 64K PAGE_SIZE,</div><div class='del'>-	 * and have ensured that all tree blocks are contained in one page,</div><div class='del'>-	 * thus we always get index == 0.</div><div class='del'>-	 */</div><div class='del'>-	return offset &gt;&gt; PAGE_SHIFT;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Use that for functions that are conditionally exported for sanity tests but</div><div class='del'>- * otherwise static</div><div class='del'>- */</div><div class='del'>-#ifndef CONFIG_BTRFS_FS_RUN_SANITY_TESTS</div><div class='del'>-#define EXPORT_FOR_TESTS static</div><div class='del'>-#else</div><div class='del'>-#define EXPORT_FOR_TESTS</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-__cold</div><div class='del'>-static inline void btrfs_print_v0_err(struct btrfs_fs_info *fs_info)</div><div class='del'>-{</div><div class='del'>-	btrfs_err(fs_info,</div><div class='del'>-"Unsupported V0 extent filesystem detected. Aborting. Please re-create your filesystem with a newer kernel");</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-__printf(5, 6)</div><div class='del'>-__cold</div><div class='del'>-void __btrfs_handle_fs_error(struct btrfs_fs_info *fs_info, const char *function,</div><div class='del'>-		     unsigned int line, int errno, const char *fmt, ...);</div><div class='add'>+	if (rootid == BTRFS_FS_TREE_OBJECTID)</div><div class='add'>+		return true;</div><div class='ctx'> </div><div class='del'>-const char * __attribute_const__ btrfs_decode_error(int errno);</div><div class='add'>+	if ((s64)rootid &lt; (s64)BTRFS_FIRST_FREE_OBJECTID)</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-__cold</div><div class='del'>-void __btrfs_abort_transaction(struct btrfs_trans_handle *trans,</div><div class='del'>-			       const char *function,</div><div class='del'>-			       unsigned int line, int errno);</div><div class='add'>+	if (btrfs_qgroup_level(rootid) != 0)</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Call btrfs_abort_transaction as early as possible when an error condition is</div><div class='del'>- * detected, that way the exact line number is reported.</div><div class='del'>- */</div><div class='del'>-#define btrfs_abort_transaction(trans, errno)		\</div><div class='del'>-do {								\</div><div class='del'>-	/* Report first abort since mount */			\</div><div class='del'>-	if (!test_and_set_bit(BTRFS_FS_STATE_TRANS_ABORTED,	\</div><div class='del'>-			&amp;((trans)-&gt;fs_info-&gt;fs_state))) {	\</div><div class='del'>-		if ((errno) != -EIO &amp;&amp; (errno) != -EROFS) {		\</div><div class='del'>-			WARN(1, KERN_DEBUG				\</div><div class='del'>-			"BTRFS: Transaction aborted (error %d)\n",	\</div><div class='del'>-			(errno));					\</div><div class='del'>-		} else {						\</div><div class='del'>-			btrfs_debug((trans)-&gt;fs_info,			\</div><div class='del'>-				    "Transaction aborted (error %d)", \</div><div class='del'>-				  (errno));			\</div><div class='del'>-		}						\</div><div class='del'>-	}							\</div><div class='del'>-	__btrfs_abort_transaction((trans), __func__,		\</div><div class='del'>-				  __LINE__, (errno));		\</div><div class='del'>-} while (0)</div><div class='del'>-</div><div class='del'>-#define btrfs_handle_fs_error(fs_info, errno, fmt, args...)		\</div><div class='del'>-do {								\</div><div class='del'>-	__btrfs_handle_fs_error((fs_info), __func__, __LINE__,	\</div><div class='del'>-			  (errno), fmt, ##args);		\</div><div class='del'>-} while (0)</div><div class='del'>-</div><div class='del'>-#define BTRFS_FS_ERROR(fs_info)	(unlikely(test_bit(BTRFS_FS_STATE_ERROR, \</div><div class='del'>-						   &amp;(fs_info)-&gt;fs_state)))</div><div class='del'>-</div><div class='del'>-__printf(5, 6)</div><div class='del'>-__cold</div><div class='del'>-void __btrfs_panic(struct btrfs_fs_info *fs_info, const char *function,</div><div class='del'>-		   unsigned int line, int errno, const char *fmt, ...);</div><div class='del'>-/*</div><div class='del'>- * If BTRFS_MOUNT_PANIC_ON_FATAL_ERROR is in mount_opt, __btrfs_panic</div><div class='del'>- * will panic().  Otherwise we BUG() here.</div><div class='del'>- */</div><div class='del'>-#define btrfs_panic(fs_info, errno, fmt, args...)			\</div><div class='del'>-do {									\</div><div class='del'>-	__btrfs_panic(fs_info, __func__, __LINE__, errno, fmt, ##args);	\</div><div class='del'>-	BUG();								\</div><div class='del'>-} while (0)</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-/* compatibility and incompatibility defines */</div><div class='del'>-</div><div class='del'>-#define btrfs_set_fs_incompat(__fs_info, opt) \</div><div class='del'>-	__btrfs_set_fs_incompat((__fs_info), BTRFS_FEATURE_INCOMPAT_##opt, \</div><div class='del'>-				#opt)</div><div class='del'>-</div><div class='del'>-static inline void __btrfs_set_fs_incompat(struct btrfs_fs_info *fs_info,</div><div class='del'>-					   u64 flag, const char* name)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_super_block *disk_super;</div><div class='del'>-	u64 features;</div><div class='del'>-</div><div class='del'>-	disk_super = fs_info-&gt;super_copy;</div><div class='del'>-	features = btrfs_super_incompat_flags(disk_super);</div><div class='del'>-	if (!(features &amp; flag)) {</div><div class='del'>-		spin_lock(&amp;fs_info-&gt;super_lock);</div><div class='del'>-		features = btrfs_super_incompat_flags(disk_super);</div><div class='del'>-		if (!(features &amp; flag)) {</div><div class='del'>-			features |= flag;</div><div class='del'>-			btrfs_set_super_incompat_flags(disk_super, features);</div><div class='del'>-			btrfs_info(fs_info,</div><div class='del'>-				"setting incompat feature flag for %s (0x%llx)",</div><div class='del'>-				name, flag);</div><div class='del'>-		}</div><div class='del'>-		spin_unlock(&amp;fs_info-&gt;super_lock);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#define btrfs_clear_fs_incompat(__fs_info, opt) \</div><div class='del'>-	__btrfs_clear_fs_incompat((__fs_info), BTRFS_FEATURE_INCOMPAT_##opt, \</div><div class='del'>-				  #opt)</div><div class='del'>-</div><div class='del'>-static inline void __btrfs_clear_fs_incompat(struct btrfs_fs_info *fs_info,</div><div class='del'>-					     u64 flag, const char* name)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_super_block *disk_super;</div><div class='del'>-	u64 features;</div><div class='del'>-</div><div class='del'>-	disk_super = fs_info-&gt;super_copy;</div><div class='del'>-	features = btrfs_super_incompat_flags(disk_super);</div><div class='del'>-	if (features &amp; flag) {</div><div class='del'>-		spin_lock(&amp;fs_info-&gt;super_lock);</div><div class='del'>-		features = btrfs_super_incompat_flags(disk_super);</div><div class='del'>-		if (features &amp; flag) {</div><div class='del'>-			features &amp;= ~flag;</div><div class='del'>-			btrfs_set_super_incompat_flags(disk_super, features);</div><div class='del'>-			btrfs_info(fs_info,</div><div class='del'>-				"clearing incompat feature flag for %s (0x%llx)",</div><div class='del'>-				name, flag);</div><div class='del'>-		}</div><div class='del'>-		spin_unlock(&amp;fs_info-&gt;super_lock);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#define btrfs_fs_incompat(fs_info, opt) \</div><div class='del'>-	__btrfs_fs_incompat((fs_info), BTRFS_FEATURE_INCOMPAT_##opt)</div><div class='del'>-</div><div class='del'>-static inline bool __btrfs_fs_incompat(struct btrfs_fs_info *fs_info, u64 flag)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_super_block *disk_super;</div><div class='del'>-	disk_super = fs_info-&gt;super_copy;</div><div class='del'>-	return !!(btrfs_super_incompat_flags(disk_super) &amp; flag);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#define btrfs_set_fs_compat_ro(__fs_info, opt) \</div><div class='del'>-	__btrfs_set_fs_compat_ro((__fs_info), BTRFS_FEATURE_COMPAT_RO_##opt, \</div><div class='del'>-				 #opt)</div><div class='del'>-</div><div class='del'>-static inline void __btrfs_set_fs_compat_ro(struct btrfs_fs_info *fs_info,</div><div class='del'>-					    u64 flag, const char *name)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_super_block *disk_super;</div><div class='del'>-	u64 features;</div><div class='del'>-</div><div class='del'>-	disk_super = fs_info-&gt;super_copy;</div><div class='del'>-	features = btrfs_super_compat_ro_flags(disk_super);</div><div class='del'>-	if (!(features &amp; flag)) {</div><div class='del'>-		spin_lock(&amp;fs_info-&gt;super_lock);</div><div class='del'>-		features = btrfs_super_compat_ro_flags(disk_super);</div><div class='del'>-		if (!(features &amp; flag)) {</div><div class='del'>-			features |= flag;</div><div class='del'>-			btrfs_set_super_compat_ro_flags(disk_super, features);</div><div class='del'>-			btrfs_info(fs_info,</div><div class='del'>-				"setting compat-ro feature flag for %s (0x%llx)",</div><div class='del'>-				name, flag);</div><div class='del'>-		}</div><div class='del'>-		spin_unlock(&amp;fs_info-&gt;super_lock);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#define btrfs_clear_fs_compat_ro(__fs_info, opt) \</div><div class='del'>-	__btrfs_clear_fs_compat_ro((__fs_info), BTRFS_FEATURE_COMPAT_RO_##opt, \</div><div class='del'>-				   #opt)</div><div class='del'>-</div><div class='del'>-static inline void __btrfs_clear_fs_compat_ro(struct btrfs_fs_info *fs_info,</div><div class='del'>-					      u64 flag, const char *name)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_super_block *disk_super;</div><div class='del'>-	u64 features;</div><div class='del'>-</div><div class='del'>-	disk_super = fs_info-&gt;super_copy;</div><div class='del'>-	features = btrfs_super_compat_ro_flags(disk_super);</div><div class='del'>-	if (features &amp; flag) {</div><div class='del'>-		spin_lock(&amp;fs_info-&gt;super_lock);</div><div class='del'>-		features = btrfs_super_compat_ro_flags(disk_super);</div><div class='del'>-		if (features &amp; flag) {</div><div class='del'>-			features &amp;= ~flag;</div><div class='del'>-			btrfs_set_super_compat_ro_flags(disk_super, features);</div><div class='del'>-			btrfs_info(fs_info,</div><div class='del'>-				"clearing compat-ro feature flag for %s (0x%llx)",</div><div class='del'>-				name, flag);</div><div class='del'>-		}</div><div class='del'>-		spin_unlock(&amp;fs_info-&gt;super_lock);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#define btrfs_fs_compat_ro(fs_info, opt) \</div><div class='del'>-	__btrfs_fs_compat_ro((fs_info), BTRFS_FEATURE_COMPAT_RO_##opt)</div><div class='del'>-</div><div class='del'>-static inline int __btrfs_fs_compat_ro(struct btrfs_fs_info *fs_info, u64 flag)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_super_block *disk_super;</div><div class='del'>-	disk_super = fs_info-&gt;super_copy;</div><div class='del'>-	return !!(btrfs_super_compat_ro_flags(disk_super) &amp; flag);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* acl.c */</div><div class='del'>-#ifdef CONFIG_BTRFS_FS_POSIX_ACL</div><div class='del'>-struct posix_acl *btrfs_get_acl(struct inode *inode, int type, bool rcu);</div><div class='del'>-int btrfs_set_acl(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='del'>-		  struct posix_acl *acl, int type);</div><div class='del'>-int btrfs_init_acl(struct btrfs_trans_handle *trans,</div><div class='del'>-		   struct inode *inode, struct inode *dir);</div><div class='del'>-#else</div><div class='del'>-#define btrfs_get_acl NULL</div><div class='del'>-#define btrfs_set_acl NULL</div><div class='del'>-static inline int btrfs_init_acl(struct btrfs_trans_handle *trans,</div><div class='del'>-				 struct inode *inode, struct inode *dir)</div><div class='del'>-{</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-/* relocation.c */</div><div class='del'>-int btrfs_relocate_block_group(struct btrfs_fs_info *fs_info, u64 group_start);</div><div class='del'>-int btrfs_init_reloc_root(struct btrfs_trans_handle *trans,</div><div class='del'>-			  struct btrfs_root *root);</div><div class='del'>-int btrfs_update_reloc_root(struct btrfs_trans_handle *trans,</div><div class='del'>-			    struct btrfs_root *root);</div><div class='del'>-int btrfs_recover_relocation(struct btrfs_root *root);</div><div class='del'>-int btrfs_reloc_clone_csums(struct btrfs_inode *inode, u64 file_pos, u64 len);</div><div class='del'>-int btrfs_reloc_cow_block(struct btrfs_trans_handle *trans,</div><div class='del'>-			  struct btrfs_root *root, struct extent_buffer *buf,</div><div class='del'>-			  struct extent_buffer *cow);</div><div class='del'>-void btrfs_reloc_pre_snapshot(struct btrfs_pending_snapshot *pending,</div><div class='del'>-			      u64 *bytes_to_reserve);</div><div class='del'>-int btrfs_reloc_post_snapshot(struct btrfs_trans_handle *trans,</div><div class='del'>-			      struct btrfs_pending_snapshot *pending);</div><div class='del'>-int btrfs_should_cancel_balance(struct btrfs_fs_info *fs_info);</div><div class='del'>-struct btrfs_root *find_reloc_root(struct btrfs_fs_info *fs_info,</div><div class='del'>-				   u64 bytenr);</div><div class='del'>-int btrfs_should_ignore_reloc_root(struct btrfs_root *root);</div><div class='del'>-</div><div class='del'>-/* scrub.c */</div><div class='del'>-int btrfs_scrub_dev(struct btrfs_fs_info *fs_info, u64 devid, u64 start,</div><div class='del'>-		    u64 end, struct btrfs_scrub_progress *progress,</div><div class='del'>-		    int readonly, int is_dev_replace);</div><div class='del'>-void btrfs_scrub_pause(struct btrfs_fs_info *fs_info);</div><div class='del'>-void btrfs_scrub_continue(struct btrfs_fs_info *fs_info);</div><div class='del'>-int btrfs_scrub_cancel(struct btrfs_fs_info *info);</div><div class='del'>-int btrfs_scrub_cancel_dev(struct btrfs_device *dev);</div><div class='del'>-int btrfs_scrub_progress(struct btrfs_fs_info *fs_info, u64 devid,</div><div class='del'>-			 struct btrfs_scrub_progress *progress);</div><div class='del'>-static inline void btrfs_init_full_stripe_locks_tree(</div><div class='del'>-			struct btrfs_full_stripe_locks_tree *locks_root)</div><div class='del'>-{</div><div class='del'>-	locks_root-&gt;root = RB_ROOT;</div><div class='del'>-	mutex_init(&amp;locks_root-&gt;lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* dev-replace.c */</div><div class='del'>-void btrfs_bio_counter_inc_blocked(struct btrfs_fs_info *fs_info);</div><div class='del'>-void btrfs_bio_counter_inc_noblocked(struct btrfs_fs_info *fs_info);</div><div class='del'>-void btrfs_bio_counter_sub(struct btrfs_fs_info *fs_info, s64 amount);</div><div class='del'>-</div><div class='del'>-static inline void btrfs_bio_counter_dec(struct btrfs_fs_info *fs_info)</div><div class='del'>-{</div><div class='del'>-	btrfs_bio_counter_sub(fs_info, 1);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* reada.c */</div><div class='del'>-struct reada_control {</div><div class='del'>-	struct btrfs_fs_info	*fs_info;		/* tree to prefetch */</div><div class='del'>-	struct btrfs_key	key_start;</div><div class='del'>-	struct btrfs_key	key_end;	/* exclusive */</div><div class='del'>-	atomic_t		elems;</div><div class='del'>-	struct kref		refcnt;</div><div class='del'>-	wait_queue_head_t	wait;</div><div class='del'>-};</div><div class='del'>-struct reada_control *btrfs_reada_add(struct btrfs_root *root,</div><div class='del'>-			      struct btrfs_key *start, struct btrfs_key *end);</div><div class='del'>-int btrfs_reada_wait(void *handle);</div><div class='del'>-void btrfs_reada_detach(void *handle);</div><div class='del'>-int btree_readahead_hook(struct extent_buffer *eb, int err);</div><div class='del'>-void btrfs_reada_remove_dev(struct btrfs_device *dev);</div><div class='del'>-void btrfs_reada_undo_remove_dev(struct btrfs_device *dev);</div><div class='del'>-</div><div class='del'>-static inline int is_fstree(u64 rootid)</div><div class='del'>-{</div><div class='del'>-	if (rootid == BTRFS_FS_TREE_OBJECTID ||</div><div class='del'>-	    ((s64)rootid &gt;= (s64)BTRFS_FIRST_FREE_OBJECTID &amp;&amp;</div><div class='del'>-	      !btrfs_qgroup_level(rootid)))</div><div class='del'>-		return 1;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline int btrfs_defrag_cancelled(struct btrfs_fs_info *fs_info)</div><div class='del'>-{</div><div class='del'>-	return signal_pending(current);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* verity.c */</div><div class='del'>-#ifdef CONFIG_FS_VERITY</div><div class='del'>-</div><div class='del'>-extern const struct fsverity_operations btrfs_verityops;</div><div class='del'>-int btrfs_drop_verity_items(struct btrfs_inode *inode);</div><div class='del'>-</div><div class='del'>-BTRFS_SETGET_FUNCS(verity_descriptor_encryption, struct btrfs_verity_descriptor_item,</div><div class='del'>-		   encryption, 8);</div><div class='del'>-BTRFS_SETGET_FUNCS(verity_descriptor_size, struct btrfs_verity_descriptor_item,</div><div class='del'>-		   size, 64);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_verity_descriptor_encryption,</div><div class='del'>-			 struct btrfs_verity_descriptor_item, encryption, 8);</div><div class='del'>-BTRFS_SETGET_STACK_FUNCS(stack_verity_descriptor_size,</div><div class='del'>-			 struct btrfs_verity_descriptor_item, size, 64);</div><div class='del'>-</div><div class='del'>-#else</div><div class='del'>-</div><div class='del'>-static inline int btrfs_drop_verity_items(struct btrfs_inode *inode)</div><div class='del'>-{</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-/* Sanity test specific functions */</div><div class='del'>-#ifdef CONFIG_BTRFS_FS_RUN_SANITY_TESTS</div><div class='del'>-void btrfs_test_destroy_inode(struct inode *inode);</div><div class='del'>-static inline int btrfs_is_testing(struct btrfs_fs_info *fs_info)</div><div class='del'>-{</div><div class='del'>-	return test_bit(BTRFS_FS_STATE_DUMMY_FS_INFO, &amp;fs_info-&gt;fs_state);</div><div class='del'>-}</div><div class='del'>-#else</div><div class='del'>-static inline int btrfs_is_testing(struct btrfs_fs_info *fs_info)</div><div class='del'>-{</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-static inline bool btrfs_is_zoned(const struct btrfs_fs_info *fs_info)</div><div class='del'>-{</div><div class='del'>-	return fs_info-&gt;zoned != 0;</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline bool btrfs_is_data_reloc_root(const struct btrfs_root *root)</div><div class='hunk'>@@ -3900,14 +738,4 @@ static inline bool btrfs_is_data_reloc_root(const struct btrfs_root *root)</div><div class='ctx'> 	return root-&gt;root_key.objectid == BTRFS_DATA_RELOC_TREE_OBJECTID;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * We use page status Private2 to indicate there is an ordered extent with</div><div class='del'>- * unfinished IO.</div><div class='del'>- *</div><div class='del'>- * Rename the Private2 accessors to Ordered, to improve readability.</div><div class='del'>- */</div><div class='del'>-#define PageOrdered(page)		PagePrivate2(page)</div><div class='del'>-#define SetPageOrdered(page)		SetPagePrivate2(page)</div><div class='del'>-#define ClearPageOrdered(page)		ClearPagePrivate2(page)</div><div class='del'>-</div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/btrfs/defrag.c b/fs/btrfs/defrag.c<br/>new file mode 100644<br/>index 000000000000..b81e224d4a27<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/defrag.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/defrag.c</a></div><div class='hunk'>@@ -0,0 +1,1519 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+/*</div><div class='add'>+ * Copyright (C) 2007 Oracle.  All rights reserved.</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/sched.h&gt;</div><div class='add'>+#include "ctree.h"</div><div class='add'>+#include "disk-io.h"</div><div class='add'>+#include "transaction.h"</div><div class='add'>+#include "locking.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "messages.h"</div><div class='add'>+#include "delalloc-space.h"</div><div class='add'>+#include "subpage.h"</div><div class='add'>+#include "defrag.h"</div><div class='add'>+#include "file-item.h"</div><div class='add'>+#include "super.h"</div><div class='add'>+#include "compression.h"</div><div class='add'>+</div><div class='add'>+static struct kmem_cache *btrfs_inode_defrag_cachep;</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * When auto defrag is enabled we queue up these defrag structs to remember</div><div class='add'>+ * which inodes need defragging passes.</div><div class='add'>+ */</div><div class='add'>+struct inode_defrag {</div><div class='add'>+	struct rb_node rb_node;</div><div class='add'>+	/* Inode number */</div><div class='add'>+	u64 ino;</div><div class='add'>+	/*</div><div class='add'>+	 * Transid where the defrag was added, we search for extents newer than</div><div class='add'>+	 * this.</div><div class='add'>+	 */</div><div class='add'>+	u64 transid;</div><div class='add'>+</div><div class='add'>+	/* Root objectid */</div><div class='add'>+	u64 root;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The extent size threshold for autodefrag.</div><div class='add'>+	 *</div><div class='add'>+	 * This value is different for compressed/non-compressed extents, thus</div><div class='add'>+	 * needs to be passed from higher layer.</div><div class='add'>+	 * (aka, inode_should_defrag())</div><div class='add'>+	 */</div><div class='add'>+	u32 extent_thresh;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int compare_inode_defrag(const struct inode_defrag *defrag1,</div><div class='add'>+				const struct inode_defrag *defrag2)</div><div class='add'>+{</div><div class='add'>+	if (defrag1-&gt;root &gt; defrag2-&gt;root)</div><div class='add'>+		return 1;</div><div class='add'>+	else if (defrag1-&gt;root &lt; defrag2-&gt;root)</div><div class='add'>+		return -1;</div><div class='add'>+	else if (defrag1-&gt;ino &gt; defrag2-&gt;ino)</div><div class='add'>+		return 1;</div><div class='add'>+	else if (defrag1-&gt;ino &lt; defrag2-&gt;ino)</div><div class='add'>+		return -1;</div><div class='add'>+	else</div><div class='add'>+		return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int inode_defrag_cmp(struct rb_node *new, const struct rb_node *existing)</div><div class='add'>+{</div><div class='add'>+	const struct inode_defrag *new_defrag = rb_entry(new, struct inode_defrag, rb_node);</div><div class='add'>+	const struct inode_defrag *existing_defrag = rb_entry(existing, struct inode_defrag, rb_node);</div><div class='add'>+</div><div class='add'>+	return compare_inode_defrag(new_defrag, existing_defrag);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Insert a record for an inode into the defrag tree.  The lock must be held</div><div class='add'>+ * already.</div><div class='add'>+ *</div><div class='add'>+ * If you're inserting a record for an older transid than an existing record,</div><div class='add'>+ * the transid already in the tree is lowered.</div><div class='add'>+ */</div><div class='add'>+static int btrfs_insert_inode_defrag(struct btrfs_inode *inode,</div><div class='add'>+				     struct inode_defrag *defrag)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	struct rb_node *node;</div><div class='add'>+</div><div class='add'>+	node = rb_find_add(&amp;defrag-&gt;rb_node, &amp;fs_info-&gt;defrag_inodes, inode_defrag_cmp);</div><div class='add'>+	if (node) {</div><div class='add'>+		struct inode_defrag *entry;</div><div class='add'>+</div><div class='add'>+		entry = rb_entry(node, struct inode_defrag, rb_node);</div><div class='add'>+		/*</div><div class='add'>+		 * If we're reinserting an entry for an old defrag run, make</div><div class='add'>+		 * sure to lower the transid of our existing record.</div><div class='add'>+		 */</div><div class='add'>+		if (defrag-&gt;transid &lt; entry-&gt;transid)</div><div class='add'>+			entry-&gt;transid = defrag-&gt;transid;</div><div class='add'>+		entry-&gt;extent_thresh = min(defrag-&gt;extent_thresh, entry-&gt;extent_thresh);</div><div class='add'>+		return -EEXIST;</div><div class='add'>+	}</div><div class='add'>+	set_bit(BTRFS_INODE_IN_DEFRAG, &amp;inode-&gt;runtime_flags);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool need_auto_defrag(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	if (!btrfs_test_opt(fs_info, AUTO_DEFRAG))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	if (btrfs_fs_closing(fs_info))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Insert a defrag record for this inode if auto defrag is enabled. No errors</div><div class='add'>+ * returned as they're not considered fatal.</div><div class='add'>+ */</div><div class='add'>+void btrfs_add_inode_defrag(struct btrfs_inode *inode, u32 extent_thresh)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+	struct inode_defrag *defrag;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (!need_auto_defrag(fs_info))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (test_bit(BTRFS_INODE_IN_DEFRAG, &amp;inode-&gt;runtime_flags))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	defrag = kmem_cache_zalloc(btrfs_inode_defrag_cachep, GFP_NOFS);</div><div class='add'>+	if (!defrag)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	defrag-&gt;ino = btrfs_ino(inode);</div><div class='add'>+	defrag-&gt;transid = btrfs_get_root_last_trans(root);</div><div class='add'>+	defrag-&gt;root = btrfs_root_id(root);</div><div class='add'>+	defrag-&gt;extent_thresh = extent_thresh;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fs_info-&gt;defrag_inodes_lock);</div><div class='add'>+	if (!test_bit(BTRFS_INODE_IN_DEFRAG, &amp;inode-&gt;runtime_flags)) {</div><div class='add'>+		/*</div><div class='add'>+		 * If we set IN_DEFRAG flag and evict the inode from memory,</div><div class='add'>+		 * and then re-read this inode, this new inode doesn't have</div><div class='add'>+		 * IN_DEFRAG flag. At the case, we may find the existed defrag.</div><div class='add'>+		 */</div><div class='add'>+		ret = btrfs_insert_inode_defrag(inode, defrag);</div><div class='add'>+		if (ret)</div><div class='add'>+			kmem_cache_free(btrfs_inode_defrag_cachep, defrag);</div><div class='add'>+	} else {</div><div class='add'>+		kmem_cache_free(btrfs_inode_defrag_cachep, defrag);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;defrag_inodes_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Pick the defraggable inode that we want, if it doesn't exist, we will get the</div><div class='add'>+ * next one.</div><div class='add'>+ */</div><div class='add'>+static struct inode_defrag *btrfs_pick_defrag_inode(</div><div class='add'>+			struct btrfs_fs_info *fs_info, u64 root, u64 ino)</div><div class='add'>+{</div><div class='add'>+	struct inode_defrag *entry = NULL;</div><div class='add'>+	struct inode_defrag tmp;</div><div class='add'>+	struct rb_node *p;</div><div class='add'>+	struct rb_node *parent = NULL;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	tmp.ino = ino;</div><div class='add'>+	tmp.root = root;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fs_info-&gt;defrag_inodes_lock);</div><div class='add'>+	p = fs_info-&gt;defrag_inodes.rb_node;</div><div class='add'>+	while (p) {</div><div class='add'>+		parent = p;</div><div class='add'>+		entry = rb_entry(parent, struct inode_defrag, rb_node);</div><div class='add'>+</div><div class='add'>+		ret = compare_inode_defrag(&amp;tmp, entry);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			p = parent-&gt;rb_left;</div><div class='add'>+		else if (ret &gt; 0)</div><div class='add'>+			p = parent-&gt;rb_right;</div><div class='add'>+		else</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (parent &amp;&amp; compare_inode_defrag(&amp;tmp, entry) &gt; 0) {</div><div class='add'>+		parent = rb_next(parent);</div><div class='add'>+		entry = rb_entry_safe(parent, struct inode_defrag, rb_node);</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='add'>+	if (entry)</div><div class='add'>+		rb_erase(parent, &amp;fs_info-&gt;defrag_inodes);</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;defrag_inodes_lock);</div><div class='add'>+	return entry;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_cleanup_defrag_inodes(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	struct inode_defrag *defrag, *next;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fs_info-&gt;defrag_inodes_lock);</div><div class='add'>+</div><div class='add'>+	rbtree_postorder_for_each_entry_safe(defrag, next,</div><div class='add'>+					     &amp;fs_info-&gt;defrag_inodes, rb_node)</div><div class='add'>+		kmem_cache_free(btrfs_inode_defrag_cachep, defrag);</div><div class='add'>+</div><div class='add'>+	fs_info-&gt;defrag_inodes = RB_ROOT;</div><div class='add'>+</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;defrag_inodes_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define BTRFS_DEFRAG_BATCH	1024</div><div class='add'>+</div><div class='add'>+static int btrfs_run_defrag_inode(struct btrfs_fs_info *fs_info,</div><div class='add'>+				  struct inode_defrag *defrag,</div><div class='add'>+				  struct file_ra_state *ra)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_root *inode_root;</div><div class='add'>+	struct btrfs_inode *inode;</div><div class='add'>+	struct btrfs_ioctl_defrag_range_args range;</div><div class='add'>+	int ret = 0;</div><div class='add'>+	u64 cur = 0;</div><div class='add'>+</div><div class='add'>+again:</div><div class='add'>+	if (test_bit(BTRFS_FS_STATE_REMOUNTING, &amp;fs_info-&gt;fs_state))</div><div class='add'>+		goto cleanup;</div><div class='add'>+	if (!need_auto_defrag(fs_info))</div><div class='add'>+		goto cleanup;</div><div class='add'>+</div><div class='add'>+	/* Get the inode */</div><div class='add'>+	inode_root = btrfs_get_fs_root(fs_info, defrag-&gt;root, true);</div><div class='add'>+	if (IS_ERR(inode_root)) {</div><div class='add'>+		ret = PTR_ERR(inode_root);</div><div class='add'>+		goto cleanup;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	inode = btrfs_iget(defrag-&gt;ino, inode_root);</div><div class='add'>+	btrfs_put_root(inode_root);</div><div class='add'>+	if (IS_ERR(inode)) {</div><div class='add'>+		ret = PTR_ERR(inode);</div><div class='add'>+		goto cleanup;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (cur &gt;= i_size_read(&amp;inode-&gt;vfs_inode)) {</div><div class='add'>+		iput(&amp;inode-&gt;vfs_inode);</div><div class='add'>+		goto cleanup;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Do a chunk of defrag */</div><div class='add'>+	clear_bit(BTRFS_INODE_IN_DEFRAG, &amp;inode-&gt;runtime_flags);</div><div class='add'>+	memset(&amp;range, 0, sizeof(range));</div><div class='add'>+	range.len = (u64)-1;</div><div class='add'>+	range.start = cur;</div><div class='add'>+	range.extent_thresh = defrag-&gt;extent_thresh;</div><div class='add'>+	file_ra_state_init(ra, inode-&gt;vfs_inode.i_mapping);</div><div class='add'>+</div><div class='add'>+	scoped_guard(super_write, fs_info-&gt;sb)</div><div class='add'>+		ret = btrfs_defrag_file(inode, ra, &amp;range,</div><div class='add'>+					defrag-&gt;transid, BTRFS_DEFRAG_BATCH);</div><div class='add'>+	iput(&amp;inode-&gt;vfs_inode);</div><div class='add'>+</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto cleanup;</div><div class='add'>+</div><div class='add'>+	cur = max(cur + fs_info-&gt;sectorsize, range.start);</div><div class='add'>+	goto again;</div><div class='add'>+</div><div class='add'>+cleanup:</div><div class='add'>+	kmem_cache_free(btrfs_inode_defrag_cachep, defrag);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Run through the list of inodes in the FS that need defragging.</div><div class='add'>+ */</div><div class='add'>+int btrfs_run_defrag_inodes(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	struct inode_defrag *defrag;</div><div class='add'>+	u64 first_ino = 0;</div><div class='add'>+	u64 root_objectid = 0;</div><div class='add'>+</div><div class='add'>+	atomic_inc(&amp;fs_info-&gt;defrag_running);</div><div class='add'>+	while (1) {</div><div class='add'>+		struct file_ra_state ra = { 0 };</div><div class='add'>+</div><div class='add'>+		/* Pause the auto defragger. */</div><div class='add'>+		if (test_bit(BTRFS_FS_STATE_REMOUNTING, &amp;fs_info-&gt;fs_state))</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		if (!need_auto_defrag(fs_info))</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		/* find an inode to defrag */</div><div class='add'>+		defrag = btrfs_pick_defrag_inode(fs_info, root_objectid, first_ino);</div><div class='add'>+		if (!defrag) {</div><div class='add'>+			if (root_objectid || first_ino) {</div><div class='add'>+				root_objectid = 0;</div><div class='add'>+				first_ino = 0;</div><div class='add'>+				continue;</div><div class='add'>+			} else {</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		first_ino = defrag-&gt;ino + 1;</div><div class='add'>+		root_objectid = defrag-&gt;root;</div><div class='add'>+</div><div class='add'>+		btrfs_run_defrag_inode(fs_info, defrag, &amp;ra);</div><div class='add'>+	}</div><div class='add'>+	atomic_dec(&amp;fs_info-&gt;defrag_running);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * During unmount, we use the transaction_wait queue to wait for the</div><div class='add'>+	 * defragger to stop.</div><div class='add'>+	 */</div><div class='add'>+	wake_up(&amp;fs_info-&gt;transaction_wait);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Check if two blocks addresses are close, used by defrag.</div><div class='add'>+ */</div><div class='add'>+static bool close_blocks(u64 blocknr, u64 other, u32 blocksize)</div><div class='add'>+{</div><div class='add'>+	if (blocknr &lt; other &amp;&amp; other - (blocknr + blocksize) &lt; SZ_32K)</div><div class='add'>+		return true;</div><div class='add'>+	if (blocknr &gt; other &amp;&amp; blocknr - (other + blocksize) &lt; SZ_32K)</div><div class='add'>+		return true;</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Go through all the leaves pointed to by a node and reallocate them so that</div><div class='add'>+ * disk order is close to key order.</div><div class='add'>+ */</div><div class='add'>+static int btrfs_realloc_node(struct btrfs_trans_handle *trans,</div><div class='add'>+			      struct btrfs_root *root,</div><div class='add'>+			      struct extent_buffer *parent,</div><div class='add'>+			      int start_slot, u64 *last_ret,</div><div class='add'>+			      struct btrfs_key *progress)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+	const u32 blocksize = fs_info-&gt;nodesize;</div><div class='add'>+	const int end_slot = btrfs_header_nritems(parent) - 1;</div><div class='add'>+	u64 search_start = *last_ret;</div><div class='add'>+	u64 last_block = 0;</div><div class='add'>+	int ret = 0;</div><div class='add'>+	bool progress_passed = false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * COWing must happen through a running transaction, which always</div><div class='add'>+	 * matches the current fs generation (it's a transaction with a state</div><div class='add'>+	 * less than TRANS_STATE_UNBLOCKED). If it doesn't, then turn the fs</div><div class='add'>+	 * into error state to prevent the commit of any transaction.</div><div class='add'>+	 */</div><div class='add'>+	if (unlikely(trans-&gt;transaction != fs_info-&gt;running_transaction ||</div><div class='add'>+		     trans-&gt;transid != fs_info-&gt;generation)) {</div><div class='add'>+		btrfs_abort_transaction(trans, -EUCLEAN);</div><div class='add'>+		btrfs_crit(fs_info,</div><div class='add'>+"unexpected transaction when attempting to reallocate parent %llu for root %llu, transaction %llu running transaction %llu fs generation %llu",</div><div class='add'>+			   parent-&gt;start, btrfs_root_id(root), trans-&gt;transid,</div><div class='add'>+			   fs_info-&gt;running_transaction-&gt;transid,</div><div class='add'>+			   fs_info-&gt;generation);</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (btrfs_header_nritems(parent) &lt;= 1)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	for (int i = start_slot; i &lt;= end_slot; i++) {</div><div class='add'>+		struct extent_buffer *cur;</div><div class='add'>+		struct btrfs_disk_key disk_key;</div><div class='add'>+		u64 blocknr;</div><div class='add'>+		u64 other;</div><div class='add'>+		bool close = true;</div><div class='add'>+</div><div class='add'>+		btrfs_node_key(parent, &amp;disk_key, i);</div><div class='add'>+		if (!progress_passed &amp;&amp; btrfs_comp_keys(&amp;disk_key, progress) &lt; 0)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		progress_passed = true;</div><div class='add'>+		blocknr = btrfs_node_blockptr(parent, i);</div><div class='add'>+		if (last_block == 0)</div><div class='add'>+			last_block = blocknr;</div><div class='add'>+</div><div class='add'>+		if (i &gt; 0) {</div><div class='add'>+			other = btrfs_node_blockptr(parent, i - 1);</div><div class='add'>+			close = close_blocks(blocknr, other, blocksize);</div><div class='add'>+		}</div><div class='add'>+		if (!close &amp;&amp; i &lt; end_slot) {</div><div class='add'>+			other = btrfs_node_blockptr(parent, i + 1);</div><div class='add'>+			close = close_blocks(blocknr, other, blocksize);</div><div class='add'>+		}</div><div class='add'>+		if (close) {</div><div class='add'>+			last_block = blocknr;</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		cur = btrfs_read_node_slot(parent, i);</div><div class='add'>+		if (IS_ERR(cur))</div><div class='add'>+			return PTR_ERR(cur);</div><div class='add'>+		if (search_start == 0)</div><div class='add'>+			search_start = last_block;</div><div class='add'>+</div><div class='add'>+		btrfs_tree_lock(cur);</div><div class='add'>+		ret = btrfs_force_cow_block(trans, root, cur, parent, i,</div><div class='add'>+					    &amp;cur, search_start,</div><div class='add'>+					    min(16 * blocksize,</div><div class='add'>+						(end_slot - i) * blocksize),</div><div class='add'>+					    BTRFS_NESTING_COW);</div><div class='add'>+		if (ret) {</div><div class='add'>+			btrfs_tree_unlock(cur);</div><div class='add'>+			free_extent_buffer(cur);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		search_start = cur-&gt;start;</div><div class='add'>+		last_block = cur-&gt;start;</div><div class='add'>+		*last_ret = search_start;</div><div class='add'>+		btrfs_tree_unlock(cur);</div><div class='add'>+		free_extent_buffer(cur);</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Defrag all the leaves in a given btree.</div><div class='add'>+ * Read all the leaves and try to get key order to</div><div class='add'>+ * better reflect disk order</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+static int btrfs_defrag_leaves(struct btrfs_trans_handle *trans,</div><div class='add'>+			       struct btrfs_root *root)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_path *path = NULL;</div><div class='add'>+	struct btrfs_key key;</div><div class='add'>+	int ret = 0;</div><div class='add'>+	int wret;</div><div class='add'>+	int level;</div><div class='add'>+	int next_key_ret = 0;</div><div class='add'>+	u64 last_ret = 0;</div><div class='add'>+</div><div class='add'>+	if (!test_bit(BTRFS_ROOT_SHAREABLE, &amp;root-&gt;state))</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	path = btrfs_alloc_path();</div><div class='add'>+	if (!path) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	level = btrfs_header_level(root-&gt;node);</div><div class='add'>+</div><div class='add'>+	if (level == 0)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	if (root-&gt;defrag_progress.objectid == 0) {</div><div class='add'>+		struct extent_buffer *root_node;</div><div class='add'>+		u32 nritems;</div><div class='add'>+</div><div class='add'>+		root_node = btrfs_lock_root_node(root);</div><div class='add'>+		nritems = btrfs_header_nritems(root_node);</div><div class='add'>+		root-&gt;defrag_max.objectid = 0;</div><div class='add'>+		/* from above we know this is not a leaf */</div><div class='add'>+		btrfs_node_key_to_cpu(root_node, &amp;root-&gt;defrag_max,</div><div class='add'>+				      nritems - 1);</div><div class='add'>+		btrfs_tree_unlock(root_node);</div><div class='add'>+		free_extent_buffer(root_node);</div><div class='add'>+		memset(&amp;key, 0, sizeof(key));</div><div class='add'>+	} else {</div><div class='add'>+		memcpy(&amp;key, &amp;root-&gt;defrag_progress, sizeof(key));</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	path-&gt;keep_locks = true;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_search_forward(root, &amp;key, path, BTRFS_OLDEST_GENERATION);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+	if (ret &gt; 0) {</div><div class='add'>+		ret = 0;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	btrfs_release_path(path);</div><div class='add'>+	/*</div><div class='add'>+	 * We don't need a lock on a leaf. btrfs_realloc_node() will lock all</div><div class='add'>+	 * leafs from path-&gt;nodes[1], so set lowest_level to 1 to avoid later</div><div class='add'>+	 * a deadlock (attempting to write lock an already write locked leaf).</div><div class='add'>+	 */</div><div class='add'>+	path-&gt;lowest_level = 1;</div><div class='add'>+	wret = btrfs_search_slot(trans, root, &amp;key, path, 0, 1);</div><div class='add'>+</div><div class='add'>+	if (wret &lt; 0) {</div><div class='add'>+		ret = wret;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	if (!path-&gt;nodes[1]) {</div><div class='add'>+		ret = 0;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	/*</div><div class='add'>+	 * The node at level 1 must always be locked when our path has</div><div class='add'>+	 * keep_locks set and lowest_level is 1, regardless of the value of</div><div class='add'>+	 * path-&gt;slots[1].</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(path-&gt;locks[1] != 0);</div><div class='add'>+	ret = btrfs_realloc_node(trans, root,</div><div class='add'>+				 path-&gt;nodes[1], 0,</div><div class='add'>+				 &amp;last_ret,</div><div class='add'>+				 &amp;root-&gt;defrag_progress);</div><div class='add'>+	if (ret) {</div><div class='add'>+		WARN_ON(ret == -EAGAIN);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	/*</div><div class='add'>+	 * Now that we reallocated the node we can find the next key. Note that</div><div class='add'>+	 * btrfs_find_next_key() can release our path and do another search</div><div class='add'>+	 * without COWing, this is because even with path-&gt;keep_locks == true,</div><div class='add'>+	 * btrfs_search_slot() / ctree.c:unlock_up() does not keeps a lock on a</div><div class='add'>+	 * node when path-&gt;slots[node_level - 1] does not point to the last</div><div class='add'>+	 * item or a slot beyond the last item (ctree.c:unlock_up()). Therefore</div><div class='add'>+	 * we search for the next key after reallocating our node.</div><div class='add'>+	 */</div><div class='add'>+	path-&gt;slots[1] = btrfs_header_nritems(path-&gt;nodes[1]);</div><div class='add'>+	next_key_ret = btrfs_find_next_key(root, path, &amp;key, 1,</div><div class='add'>+					   BTRFS_OLDEST_GENERATION);</div><div class='add'>+	if (next_key_ret == 0) {</div><div class='add'>+		memcpy(&amp;root-&gt;defrag_progress, &amp;key, sizeof(key));</div><div class='add'>+		ret = -EAGAIN;</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='add'>+	btrfs_free_path(path);</div><div class='add'>+	if (ret == -EAGAIN) {</div><div class='add'>+		if (root-&gt;defrag_max.objectid &gt; root-&gt;defrag_progress.objectid)</div><div class='add'>+			goto done;</div><div class='add'>+		if (root-&gt;defrag_max.type &gt; root-&gt;defrag_progress.type)</div><div class='add'>+			goto done;</div><div class='add'>+		if (root-&gt;defrag_max.offset &gt; root-&gt;defrag_progress.offset)</div><div class='add'>+			goto done;</div><div class='add'>+		ret = 0;</div><div class='add'>+	}</div><div class='add'>+done:</div><div class='add'>+	if (ret != -EAGAIN)</div><div class='add'>+		memset(&amp;root-&gt;defrag_progress, 0,</div><div class='add'>+		       sizeof(root-&gt;defrag_progress));</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Defrag a given btree.  Every leaf in the btree is read and defragmented.</div><div class='add'>+ */</div><div class='add'>+int btrfs_defrag_root(struct btrfs_root *root)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (test_and_set_bit(BTRFS_ROOT_DEFRAG_RUNNING, &amp;root-&gt;state))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	while (1) {</div><div class='add'>+		struct btrfs_trans_handle *trans;</div><div class='add'>+</div><div class='add'>+		trans = btrfs_start_transaction(root, 0);</div><div class='add'>+		if (IS_ERR(trans)) {</div><div class='add'>+			ret = PTR_ERR(trans);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		ret = btrfs_defrag_leaves(trans, root);</div><div class='add'>+</div><div class='add'>+		btrfs_end_transaction(trans);</div><div class='add'>+		btrfs_btree_balance_dirty(fs_info);</div><div class='add'>+		cond_resched();</div><div class='add'>+</div><div class='add'>+		if (btrfs_fs_closing(fs_info) || ret != -EAGAIN)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		if (btrfs_defrag_cancelled(fs_info)) {</div><div class='add'>+			btrfs_debug(fs_info, "defrag_root cancelled");</div><div class='add'>+			ret = -EAGAIN;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	clear_bit(BTRFS_ROOT_DEFRAG_RUNNING, &amp;root-&gt;state);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Defrag specific helper to get an extent map.</div><div class='add'>+ *</div><div class='add'>+ * Differences between this and btrfs_get_extent() are:</div><div class='add'>+ *</div><div class='add'>+ * - No extent_map will be added to inode-&gt;extent_tree</div><div class='add'>+ *   To reduce memory usage in the long run.</div><div class='add'>+ *</div><div class='add'>+ * - Extra optimization to skip file extents older than @newer_than</div><div class='add'>+ *   By using btrfs_search_forward() we can skip entire file ranges that</div><div class='add'>+ *   have extents created in past transactions, because btrfs_search_forward()</div><div class='add'>+ *   will not visit leaves and nodes with a generation smaller than given</div><div class='add'>+ *   minimal generation threshold (@newer_than).</div><div class='add'>+ *</div><div class='add'>+ * Return valid em if we find a file extent matching the requirement.</div><div class='add'>+ * Return NULL if we can not find a file extent matching the requirement.</div><div class='add'>+ *</div><div class='add'>+ * Return ERR_PTR() for error.</div><div class='add'>+ */</div><div class='add'>+static struct extent_map *defrag_get_extent(struct btrfs_inode *inode,</div><div class='add'>+					    u64 start, u64 newer_than)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	struct btrfs_file_extent_item *fi;</div><div class='add'>+	struct btrfs_path path = { 0 };</div><div class='add'>+	struct extent_map *em;</div><div class='add'>+	struct btrfs_key key;</div><div class='add'>+	u64 ino = btrfs_ino(inode);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	em = btrfs_alloc_extent_map();</div><div class='add'>+	if (!em) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	key.objectid = ino;</div><div class='add'>+	key.type = BTRFS_EXTENT_DATA_KEY;</div><div class='add'>+	key.offset = start;</div><div class='add'>+</div><div class='add'>+	if (newer_than) {</div><div class='add'>+		ret = btrfs_search_forward(root, &amp;key, &amp;path, newer_than);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto err;</div><div class='add'>+		/* Can't find anything newer */</div><div class='add'>+		if (ret &gt; 0)</div><div class='add'>+			goto not_found;</div><div class='add'>+	} else {</div><div class='add'>+		ret = btrfs_search_slot(NULL, root, &amp;key, &amp;path, 0, 0);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto err;</div><div class='add'>+	}</div><div class='add'>+	if (path.slots[0] &gt;= btrfs_header_nritems(path.nodes[0])) {</div><div class='add'>+		/*</div><div class='add'>+		 * If btrfs_search_slot() makes path to point beyond nritems,</div><div class='add'>+		 * we should not have an empty leaf, as this inode must at</div><div class='add'>+		 * least have its INODE_ITEM.</div><div class='add'>+		 */</div><div class='add'>+		ASSERT(btrfs_header_nritems(path.nodes[0]));</div><div class='add'>+		path.slots[0] = btrfs_header_nritems(path.nodes[0]) - 1;</div><div class='add'>+	}</div><div class='add'>+	btrfs_item_key_to_cpu(path.nodes[0], &amp;key, path.slots[0]);</div><div class='add'>+	/* Perfect match, no need to go one slot back */</div><div class='add'>+	if (key.objectid == ino &amp;&amp; key.type == BTRFS_EXTENT_DATA_KEY &amp;&amp;</div><div class='add'>+	    key.offset == start)</div><div class='add'>+		goto iterate;</div><div class='add'>+</div><div class='add'>+	/* We didn't find a perfect match, needs to go one slot back */</div><div class='add'>+	if (path.slots[0] &gt; 0) {</div><div class='add'>+		btrfs_item_key_to_cpu(path.nodes[0], &amp;key, path.slots[0]);</div><div class='add'>+		if (key.objectid == ino &amp;&amp; key.type == BTRFS_EXTENT_DATA_KEY)</div><div class='add'>+			path.slots[0]--;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+iterate:</div><div class='add'>+	/* Iterate through the path to find a file extent covering @start */</div><div class='add'>+	while (true) {</div><div class='add'>+		u64 extent_end;</div><div class='add'>+</div><div class='add'>+		if (path.slots[0] &gt;= btrfs_header_nritems(path.nodes[0]))</div><div class='add'>+			goto next;</div><div class='add'>+</div><div class='add'>+		btrfs_item_key_to_cpu(path.nodes[0], &amp;key, path.slots[0]);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * We may go one slot back to INODE_REF/XATTR item, then</div><div class='add'>+		 * need to go forward until we reach an EXTENT_DATA.</div><div class='add'>+		 * But we should still has the correct ino as key.objectid.</div><div class='add'>+		 */</div><div class='add'>+		if (WARN_ON(key.objectid &lt; ino) || key.type &lt; BTRFS_EXTENT_DATA_KEY)</div><div class='add'>+			goto next;</div><div class='add'>+</div><div class='add'>+		/* It's beyond our target range, definitely not extent found */</div><div class='add'>+		if (key.objectid &gt; ino || key.type &gt; BTRFS_EXTENT_DATA_KEY)</div><div class='add'>+			goto not_found;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 *	|	|&lt;- File extent -&gt;|</div><div class='add'>+		 *	\- start</div><div class='add'>+		 *</div><div class='add'>+		 * This means there is a hole between start and key.offset.</div><div class='add'>+		 */</div><div class='add'>+		if (key.offset &gt; start) {</div><div class='add'>+			em-&gt;start = start;</div><div class='add'>+			em-&gt;disk_bytenr = EXTENT_MAP_HOLE;</div><div class='add'>+			em-&gt;disk_num_bytes = 0;</div><div class='add'>+			em-&gt;ram_bytes = 0;</div><div class='add'>+			em-&gt;offset = 0;</div><div class='add'>+			em-&gt;len = key.offset - start;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		fi = btrfs_item_ptr(path.nodes[0], path.slots[0],</div><div class='add'>+				    struct btrfs_file_extent_item);</div><div class='add'>+		extent_end = btrfs_file_extent_end(&amp;path);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 *	|&lt;- file extent -&gt;|	|</div><div class='add'>+		 *				\- start</div><div class='add'>+		 *</div><div class='add'>+		 * We haven't reached start, search next slot.</div><div class='add'>+		 */</div><div class='add'>+		if (extent_end &lt;= start)</div><div class='add'>+			goto next;</div><div class='add'>+</div><div class='add'>+		/* Now this extent covers @start, convert it to em */</div><div class='add'>+		btrfs_extent_item_to_extent_map(inode, &amp;path, fi, em);</div><div class='add'>+		break;</div><div class='add'>+next:</div><div class='add'>+		ret = btrfs_next_item(root, &amp;path);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto err;</div><div class='add'>+		if (ret &gt; 0)</div><div class='add'>+			goto not_found;</div><div class='add'>+	}</div><div class='add'>+	btrfs_release_path(&amp;path);</div><div class='add'>+	return em;</div><div class='add'>+</div><div class='add'>+not_found:</div><div class='add'>+	btrfs_release_path(&amp;path);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='add'>+	return NULL;</div><div class='add'>+</div><div class='add'>+err:</div><div class='add'>+	btrfs_release_path(&amp;path);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='add'>+	return ERR_PTR(ret);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct extent_map *defrag_lookup_extent(struct inode *inode, u64 start,</div><div class='add'>+					       u64 newer_than, bool locked)</div><div class='add'>+{</div><div class='add'>+	struct extent_map_tree *em_tree = &amp;BTRFS_I(inode)-&gt;extent_tree;</div><div class='add'>+	struct extent_io_tree *io_tree = &amp;BTRFS_I(inode)-&gt;io_tree;</div><div class='add'>+	struct extent_map *em;</div><div class='add'>+	const u32 sectorsize = BTRFS_I(inode)-&gt;root-&gt;fs_info-&gt;sectorsize;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Hopefully we have this extent in the tree already, try without the</div><div class='add'>+	 * full extent lock.</div><div class='add'>+	 */</div><div class='add'>+	read_lock(&amp;em_tree-&gt;lock);</div><div class='add'>+	em = btrfs_lookup_extent_mapping(em_tree, start, sectorsize);</div><div class='add'>+	read_unlock(&amp;em_tree-&gt;lock);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We can get a merged extent, in that case, we need to re-search</div><div class='add'>+	 * tree to get the original em for defrag.</div><div class='add'>+	 *</div><div class='add'>+	 * This is because even if we have adjacent extents that are contiguous</div><div class='add'>+	 * and compatible (same type and flags), we still want to defrag them</div><div class='add'>+	 * so that we use less metadata (extent items in the extent tree and</div><div class='add'>+	 * file extent items in the inode's subvolume tree).</div><div class='add'>+	 */</div><div class='add'>+	if (em &amp;&amp; (em-&gt;flags &amp; EXTENT_FLAG_MERGED)) {</div><div class='add'>+		btrfs_free_extent_map(em);</div><div class='add'>+		em = NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!em) {</div><div class='add'>+		struct extent_state *cached = NULL;</div><div class='add'>+		u64 end = start + sectorsize - 1;</div><div class='add'>+</div><div class='add'>+		/* Get the big lock and read metadata off disk. */</div><div class='add'>+		if (!locked)</div><div class='add'>+			btrfs_lock_extent(io_tree, start, end, &amp;cached);</div><div class='add'>+		em = defrag_get_extent(BTRFS_I(inode), start, newer_than);</div><div class='add'>+		if (!locked)</div><div class='add'>+			btrfs_unlock_extent(io_tree, start, end, &amp;cached);</div><div class='add'>+</div><div class='add'>+		if (IS_ERR(em))</div><div class='add'>+			return NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return em;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static u32 get_extent_max_capacity(const struct btrfs_fs_info *fs_info,</div><div class='add'>+				   const struct extent_map *em)</div><div class='add'>+{</div><div class='add'>+	if (btrfs_extent_map_is_compressed(em))</div><div class='add'>+		return BTRFS_MAX_COMPRESSED;</div><div class='add'>+	return fs_info-&gt;max_extent_size;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool defrag_check_next_extent(struct inode *inode, struct extent_map *em,</div><div class='add'>+				     u32 extent_thresh, u64 newer_than, bool locked)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='add'>+	struct extent_map *next;</div><div class='add'>+	bool ret = false;</div><div class='add'>+</div><div class='add'>+	/* This is the last extent */</div><div class='add'>+	if (em-&gt;start + em-&gt;len &gt;= i_size_read(inode))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Here we need to pass @newer_then when checking the next extent, or</div><div class='add'>+	 * we will hit a case we mark current extent for defrag, but the next</div><div class='add'>+	 * one will not be a target.</div><div class='add'>+	 * This will just cause extra IO without really reducing the fragments.</div><div class='add'>+	 */</div><div class='add'>+	next = defrag_lookup_extent(inode, em-&gt;start + em-&gt;len, newer_than, locked);</div><div class='add'>+	/* No more em or hole */</div><div class='add'>+	if (!next || next-&gt;disk_bytenr &gt;= EXTENT_MAP_LAST_BYTE)</div><div class='add'>+		goto out;</div><div class='add'>+	if (next-&gt;flags &amp; EXTENT_FLAG_PREALLOC)</div><div class='add'>+		goto out;</div><div class='add'>+	/*</div><div class='add'>+	 * If the next extent is at its max capacity, defragging current extent</div><div class='add'>+	 * makes no sense, as the total number of extents won't change.</div><div class='add'>+	 */</div><div class='add'>+	if (next-&gt;len &gt;= get_extent_max_capacity(fs_info, em))</div><div class='add'>+		goto out;</div><div class='add'>+	/* Skip older extent */</div><div class='add'>+	if (next-&gt;generation &lt; newer_than)</div><div class='add'>+		goto out;</div><div class='add'>+	/* Also check extent size */</div><div class='add'>+	if (next-&gt;len &gt;= extent_thresh)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	ret = true;</div><div class='add'>+out:</div><div class='add'>+	btrfs_free_extent_map(next);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Prepare one page to be defragged.</div><div class='add'>+ *</div><div class='add'>+ * This will ensure:</div><div class='add'>+ *</div><div class='add'>+ * - Returned page is locked and has been set up properly.</div><div class='add'>+ * - No ordered extent exists in the page.</div><div class='add'>+ * - The page is uptodate.</div><div class='add'>+ *</div><div class='add'>+ * NOTE: Caller should also wait for page writeback after the cluster is</div><div class='add'>+ * prepared, here we don't do writeback wait for each page.</div><div class='add'>+ */</div><div class='add'>+static struct folio *defrag_prepare_one_folio(struct btrfs_inode *inode, pgoff_t index)</div><div class='add'>+{</div><div class='add'>+	struct address_space *mapping = inode-&gt;vfs_inode.i_mapping;</div><div class='add'>+	gfp_t mask = btrfs_alloc_write_mask(mapping);</div><div class='add'>+	u64 lock_start;</div><div class='add'>+	u64 lock_end;</div><div class='add'>+	struct extent_state *cached_state = NULL;</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+again:</div><div class='add'>+	/* TODO: Add order fgp order flags when large folios are fully enabled. */</div><div class='add'>+	folio = __filemap_get_folio(mapping, index,</div><div class='add'>+				    FGP_LOCK | FGP_ACCESSED | FGP_CREAT, mask);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return folio;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Since we can defragment files opened read-only, we can encounter</div><div class='add'>+	 * transparent huge pages here (see CONFIG_READ_ONLY_THP_FOR_FS).</div><div class='add'>+	 *</div><div class='add'>+	 * The IO for such large folios is not fully tested, thus return</div><div class='add'>+	 * an error to reject such folios unless it's an experimental build.</div><div class='add'>+	 *</div><div class='add'>+	 * Filesystem transparent huge pages are typically only used for</div><div class='add'>+	 * executables that explicitly enable them, so this isn't very</div><div class='add'>+	 * restrictive.</div><div class='add'>+	 */</div><div class='add'>+	if (!IS_ENABLED(CONFIG_BTRFS_EXPERIMENTAL) &amp;&amp; folio_test_large(folio)) {</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='add'>+		return ERR_PTR(-ETXTBSY);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = set_folio_extent_mapped(folio);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='add'>+		return ERR_PTR(ret);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	lock_start = folio_pos(folio);</div><div class='add'>+	lock_end = folio_next_pos(folio) - 1;</div><div class='add'>+	/* Wait for any existing ordered extent in the range */</div><div class='add'>+	while (1) {</div><div class='add'>+		struct btrfs_ordered_extent *ordered;</div><div class='add'>+</div><div class='add'>+		btrfs_lock_extent(&amp;inode-&gt;io_tree, lock_start, lock_end, &amp;cached_state);</div><div class='add'>+		ordered = btrfs_lookup_ordered_range(inode, lock_start, folio_size(folio));</div><div class='add'>+		btrfs_unlock_extent(&amp;inode-&gt;io_tree, lock_start, lock_end, &amp;cached_state);</div><div class='add'>+		if (!ordered)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		btrfs_start_ordered_extent(ordered);</div><div class='add'>+		btrfs_put_ordered_extent(ordered);</div><div class='add'>+		folio_lock(folio);</div><div class='add'>+		/*</div><div class='add'>+		 * We unlocked the folio above, so we need check if it was</div><div class='add'>+		 * released or not.</div><div class='add'>+		 */</div><div class='add'>+		if (folio-&gt;mapping != mapping || !folio-&gt;private) {</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+			folio_put(folio);</div><div class='add'>+			goto again;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Now the page range has no ordered extent any more.  Read the page to</div><div class='add'>+	 * make it uptodate.</div><div class='add'>+	 */</div><div class='add'>+	if (!folio_test_uptodate(folio)) {</div><div class='add'>+		btrfs_read_folio(NULL, folio);</div><div class='add'>+		folio_lock(folio);</div><div class='add'>+		if (folio-&gt;mapping != mapping || !folio-&gt;private) {</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+			folio_put(folio);</div><div class='add'>+			goto again;</div><div class='add'>+		}</div><div class='add'>+		if (unlikely(!folio_test_uptodate(folio))) {</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+			folio_put(folio);</div><div class='add'>+			return ERR_PTR(-EIO);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	return folio;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct defrag_target_range {</div><div class='add'>+	struct list_head list;</div><div class='add'>+	u64 start;</div><div class='add'>+	u64 len;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Collect all valid target extents.</div><div class='add'>+ *</div><div class='add'>+ * @start:	   file offset to lookup</div><div class='add'>+ * @len:	   length to lookup</div><div class='add'>+ * @extent_thresh: file extent size threshold, any extent size &gt;= this value</div><div class='add'>+ *		   will be ignored</div><div class='add'>+ * @newer_than:    only defrag extents newer than this value</div><div class='add'>+ * @do_compress:   whether the defrag is doing compression or no-compression</div><div class='add'>+ *		   if true, @extent_thresh will be ignored and all regular</div><div class='add'>+ *		   file extents meeting @newer_than will be targets.</div><div class='add'>+ * @locked:	   if the range has already held extent lock</div><div class='add'>+ * @target_list:   list of targets file extents</div><div class='add'>+ */</div><div class='add'>+static int defrag_collect_targets(struct btrfs_inode *inode,</div><div class='add'>+				  u64 start, u64 len, u32 extent_thresh,</div><div class='add'>+				  u64 newer_than, bool do_compress,</div><div class='add'>+				  bool locked, struct list_head *target_list,</div><div class='add'>+				  u64 *last_scanned_ret)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	bool last_is_target = false;</div><div class='add'>+	u64 cur = start;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	while (cur &lt; start + len) {</div><div class='add'>+		struct extent_map *em;</div><div class='add'>+		struct defrag_target_range *new;</div><div class='add'>+		bool next_mergeable = true;</div><div class='add'>+		u64 range_len;</div><div class='add'>+</div><div class='add'>+		last_is_target = false;</div><div class='add'>+		em = defrag_lookup_extent(&amp;inode-&gt;vfs_inode, cur, newer_than, locked);</div><div class='add'>+		if (!em)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * If the file extent is an inlined one, we may still want to</div><div class='add'>+		 * defrag it (fallthrough) if it will cause a regular extent.</div><div class='add'>+		 * This is for users who want to convert inline extents to</div><div class='add'>+		 * regular ones through max_inline= mount option.</div><div class='add'>+		 */</div><div class='add'>+		if (em-&gt;disk_bytenr == EXTENT_MAP_INLINE &amp;&amp;</div><div class='add'>+		    em-&gt;len &lt;= inode-&gt;root-&gt;fs_info-&gt;max_inline)</div><div class='add'>+			goto next;</div><div class='add'>+</div><div class='add'>+		/* Skip holes and preallocated extents. */</div><div class='add'>+		if (em-&gt;disk_bytenr == EXTENT_MAP_HOLE ||</div><div class='add'>+		    (em-&gt;flags &amp; EXTENT_FLAG_PREALLOC))</div><div class='add'>+			goto next;</div><div class='add'>+</div><div class='add'>+		/* Skip older extent */</div><div class='add'>+		if (em-&gt;generation &lt; newer_than)</div><div class='add'>+			goto next;</div><div class='add'>+</div><div class='add'>+		/* This em is under writeback, no need to defrag */</div><div class='add'>+		if (em-&gt;generation == (u64)-1)</div><div class='add'>+			goto next;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Our start offset might be in the middle of an existing extent</div><div class='add'>+		 * map, so take that into account.</div><div class='add'>+		 */</div><div class='add'>+		range_len = em-&gt;len - (cur - em-&gt;start);</div><div class='add'>+		/*</div><div class='add'>+		 * If this range of the extent map is already flagged for delalloc,</div><div class='add'>+		 * skip it, because:</div><div class='add'>+		 *</div><div class='add'>+		 * 1) We could deadlock later, when trying to reserve space for</div><div class='add'>+		 *    delalloc, because in case we can't immediately reserve space</div><div class='add'>+		 *    the flusher can start delalloc and wait for the respective</div><div class='add'>+		 *    ordered extents to complete. The deadlock would happen</div><div class='add'>+		 *    because we do the space reservation while holding the range</div><div class='add'>+		 *    locked, and starting writeback, or finishing an ordered</div><div class='add'>+		 *    extent, requires locking the range;</div><div class='add'>+		 *</div><div class='add'>+		 * 2) If there's delalloc there, it means there's dirty pages for</div><div class='add'>+		 *    which writeback has not started yet (we clean the delalloc</div><div class='add'>+		 *    flag when starting writeback and after creating an ordered</div><div class='add'>+		 *    extent). If we mark pages in an adjacent range for defrag,</div><div class='add'>+		 *    then we will have a larger contiguous range for delalloc,</div><div class='add'>+		 *    very likely resulting in a larger extent after writeback is</div><div class='add'>+		 *    triggered (except in a case of free space fragmentation).</div><div class='add'>+		 */</div><div class='add'>+		if (btrfs_test_range_bit_exists(&amp;inode-&gt;io_tree, cur, cur + range_len - 1,</div><div class='add'>+						EXTENT_DELALLOC))</div><div class='add'>+			goto next;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * For do_compress case, we want to compress all valid file</div><div class='add'>+		 * extents, thus no @extent_thresh or mergeable check.</div><div class='add'>+		 */</div><div class='add'>+		if (do_compress)</div><div class='add'>+			goto add;</div><div class='add'>+</div><div class='add'>+		/* Skip too large extent */</div><div class='add'>+		if (em-&gt;len &gt;= extent_thresh)</div><div class='add'>+			goto next;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Skip extents already at its max capacity, this is mostly for</div><div class='add'>+		 * compressed extents, which max cap is only 128K.</div><div class='add'>+		 */</div><div class='add'>+		if (em-&gt;len &gt;= get_extent_max_capacity(fs_info, em))</div><div class='add'>+			goto next;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Normally there are no more extents after an inline one, thus</div><div class='add'>+		 * @next_mergeable will normally be false and not defragged.</div><div class='add'>+		 * So if an inline extent passed all above checks, just add it</div><div class='add'>+		 * for defrag, and be converted to regular extents.</div><div class='add'>+		 */</div><div class='add'>+		if (em-&gt;disk_bytenr == EXTENT_MAP_INLINE)</div><div class='add'>+			goto add;</div><div class='add'>+</div><div class='add'>+		next_mergeable = defrag_check_next_extent(&amp;inode-&gt;vfs_inode, em,</div><div class='add'>+						extent_thresh, newer_than, locked);</div><div class='add'>+		if (!next_mergeable) {</div><div class='add'>+			struct defrag_target_range *last;</div><div class='add'>+</div><div class='add'>+			/* Empty target list, no way to merge with last entry */</div><div class='add'>+			if (list_empty(target_list))</div><div class='add'>+				goto next;</div><div class='add'>+			last = list_last_entry(target_list,</div><div class='add'>+					       struct defrag_target_range, list);</div><div class='add'>+			/* Not mergeable with last entry */</div><div class='add'>+			if (last-&gt;start + last-&gt;len != cur)</div><div class='add'>+				goto next;</div><div class='add'>+</div><div class='add'>+			/* Mergeable, fall through to add it to @target_list. */</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+add:</div><div class='add'>+		last_is_target = true;</div><div class='add'>+		range_len = min(btrfs_extent_map_end(em), start + len) - cur;</div><div class='add'>+		/*</div><div class='add'>+		 * This one is a good target, check if it can be merged into</div><div class='add'>+		 * last range of the target list.</div><div class='add'>+		 */</div><div class='add'>+		if (!list_empty(target_list)) {</div><div class='add'>+			struct defrag_target_range *last;</div><div class='add'>+</div><div class='add'>+			last = list_last_entry(target_list,</div><div class='add'>+					       struct defrag_target_range, list);</div><div class='add'>+			ASSERT(last-&gt;start + last-&gt;len &lt;= cur);</div><div class='add'>+			if (last-&gt;start + last-&gt;len == cur) {</div><div class='add'>+				/* Mergeable, enlarge the last entry */</div><div class='add'>+				last-&gt;len += range_len;</div><div class='add'>+				goto next;</div><div class='add'>+			}</div><div class='add'>+			/* Fall through to allocate a new entry */</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* Allocate new defrag_target_range */</div><div class='add'>+		new = kmalloc(sizeof(*new), GFP_NOFS);</div><div class='add'>+		if (!new) {</div><div class='add'>+			btrfs_free_extent_map(em);</div><div class='add'>+			ret = -ENOMEM;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		new-&gt;start = cur;</div><div class='add'>+		new-&gt;len = range_len;</div><div class='add'>+		list_add_tail(&amp;new-&gt;list, target_list);</div><div class='add'>+</div><div class='add'>+next:</div><div class='add'>+		cur = btrfs_extent_map_end(em);</div><div class='add'>+		btrfs_free_extent_map(em);</div><div class='add'>+	}</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		struct defrag_target_range *entry;</div><div class='add'>+		struct defrag_target_range *tmp;</div><div class='add'>+</div><div class='add'>+		list_for_each_entry_safe(entry, tmp, target_list, list) {</div><div class='add'>+			list_del_init(&amp;entry-&gt;list);</div><div class='add'>+			kfree(entry);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	if (!ret &amp;&amp; last_scanned_ret) {</div><div class='add'>+		/*</div><div class='add'>+		 * If the last extent is not a target, the caller can skip to</div><div class='add'>+		 * the end of that extent.</div><div class='add'>+		 * Otherwise, we can only go the end of the specified range.</div><div class='add'>+		 */</div><div class='add'>+		if (!last_is_target)</div><div class='add'>+			*last_scanned_ret = max(cur, *last_scanned_ret);</div><div class='add'>+		else</div><div class='add'>+			*last_scanned_ret = max(start + len, *last_scanned_ret);</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define CLUSTER_SIZE	(SZ_256K)</div><div class='add'>+static_assert(PAGE_ALIGNED(CLUSTER_SIZE));</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Defrag one contiguous target range.</div><div class='add'>+ *</div><div class='add'>+ * @inode:	target inode</div><div class='add'>+ * @target:	target range to defrag</div><div class='add'>+ * @pages:	locked pages covering the defrag range</div><div class='add'>+ * @nr_pages:	number of locked pages</div><div class='add'>+ *</div><div class='add'>+ * Caller should ensure:</div><div class='add'>+ *</div><div class='add'>+ * - Pages are prepared</div><div class='add'>+ *   Pages should be locked, no ordered extent in the pages range,</div><div class='add'>+ *   no writeback.</div><div class='add'>+ *</div><div class='add'>+ * - Extent bits are locked</div><div class='add'>+ */</div><div class='add'>+static int defrag_one_locked_target(struct btrfs_inode *inode,</div><div class='add'>+				    struct defrag_target_range *target,</div><div class='add'>+				    struct folio **folios, int nr_pages,</div><div class='add'>+				    struct extent_state **cached_state)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	struct extent_changeset *data_reserved = NULL;</div><div class='add'>+	const u64 start = target-&gt;start;</div><div class='add'>+	const u64 len = target-&gt;len;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_delalloc_reserve_space(inode, &amp;data_reserved, start, len);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+	btrfs_clear_extent_bit(&amp;inode-&gt;io_tree, start, start + len - 1,</div><div class='add'>+			       EXTENT_DELALLOC | EXTENT_DO_ACCOUNTING |</div><div class='add'>+			       EXTENT_DEFRAG, cached_state);</div><div class='add'>+	btrfs_set_extent_bit(&amp;inode-&gt;io_tree, start, start + len - 1,</div><div class='add'>+			     EXTENT_DELALLOC | EXTENT_DEFRAG, cached_state);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Update the page status.</div><div class='add'>+	 * Due to possible large folios, we have to check all folios one by one.</div><div class='add'>+	 */</div><div class='add'>+	for (int i = 0; i &lt; nr_pages &amp;&amp; folios[i]; i++) {</div><div class='add'>+		struct folio *folio = folios[i];</div><div class='add'>+</div><div class='add'>+		if (!folio)</div><div class='add'>+			break;</div><div class='add'>+		if (start &gt;= folio_next_pos(folio) ||</div><div class='add'>+		    start + len &lt;= folio_pos(folio))</div><div class='add'>+			continue;</div><div class='add'>+		btrfs_folio_clamp_clear_checked(fs_info, folio, start, len);</div><div class='add'>+		btrfs_folio_clamp_set_dirty(fs_info, folio, start, len);</div><div class='add'>+	}</div><div class='add'>+	btrfs_delalloc_release_extents(inode, len);</div><div class='add'>+	extent_changeset_free(data_reserved);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int defrag_one_range(struct btrfs_inode *inode, u64 start, u32 len,</div><div class='add'>+			    u32 extent_thresh, u64 newer_than, bool do_compress,</div><div class='add'>+			    u64 *last_scanned_ret)</div><div class='add'>+{</div><div class='add'>+	struct extent_state *cached_state = NULL;</div><div class='add'>+	struct defrag_target_range *entry;</div><div class='add'>+	struct defrag_target_range *tmp;</div><div class='add'>+	LIST_HEAD(target_list);</div><div class='add'>+	struct folio **folios;</div><div class='add'>+	const u32 sectorsize = inode-&gt;root-&gt;fs_info-&gt;sectorsize;</div><div class='add'>+	u64 cur = start;</div><div class='add'>+	const unsigned int nr_pages = ((start + len - 1) &gt;&gt; PAGE_SHIFT) -</div><div class='add'>+				      (start &gt;&gt; PAGE_SHIFT) + 1;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	ASSERT(nr_pages &lt;= CLUSTER_SIZE / PAGE_SIZE);</div><div class='add'>+	ASSERT(IS_ALIGNED(start, sectorsize) &amp;&amp; IS_ALIGNED(len, sectorsize));</div><div class='add'>+</div><div class='add'>+	folios = kcalloc(nr_pages, sizeof(struct folio *), GFP_NOFS);</div><div class='add'>+	if (!folios)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	/* Prepare all pages */</div><div class='add'>+	for (int i = 0; cur &lt; start + len &amp;&amp; i &lt; nr_pages; i++) {</div><div class='add'>+		folios[i] = defrag_prepare_one_folio(inode, cur &gt;&gt; PAGE_SHIFT);</div><div class='add'>+		if (IS_ERR(folios[i])) {</div><div class='add'>+			ret = PTR_ERR(folios[i]);</div><div class='add'>+			folios[i] = NULL;</div><div class='add'>+			goto free_folios;</div><div class='add'>+		}</div><div class='add'>+		cur = folio_next_pos(folios[i]);</div><div class='add'>+	}</div><div class='add'>+	for (int i = 0; i &lt; nr_pages; i++) {</div><div class='add'>+		if (!folios[i])</div><div class='add'>+			break;</div><div class='add'>+		folio_wait_writeback(folios[i]);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* We should get at least one folio. */</div><div class='add'>+	ASSERT(folios[0]);</div><div class='add'>+	/* Lock the pages range */</div><div class='add'>+	btrfs_lock_extent(&amp;inode-&gt;io_tree, folio_pos(folios[0]), cur - 1, &amp;cached_state);</div><div class='add'>+	/*</div><div class='add'>+	 * Now we have a consistent view about the extent map, re-check</div><div class='add'>+	 * which range really needs to be defragged.</div><div class='add'>+	 *</div><div class='add'>+	 * And this time we have extent locked already, pass @locked = true</div><div class='add'>+	 * so that we won't relock the extent range and cause deadlock.</div><div class='add'>+	 */</div><div class='add'>+	ret = defrag_collect_targets(inode, start, len, extent_thresh,</div><div class='add'>+				     newer_than, do_compress, true,</div><div class='add'>+				     &amp;target_list, last_scanned_ret);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto unlock_extent;</div><div class='add'>+</div><div class='add'>+	list_for_each_entry(entry, &amp;target_list, list) {</div><div class='add'>+		ret = defrag_one_locked_target(inode, entry, folios, nr_pages,</div><div class='add'>+					       &amp;cached_state);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	list_for_each_entry_safe(entry, tmp, &amp;target_list, list) {</div><div class='add'>+		list_del_init(&amp;entry-&gt;list);</div><div class='add'>+		kfree(entry);</div><div class='add'>+	}</div><div class='add'>+unlock_extent:</div><div class='add'>+	btrfs_unlock_extent(&amp;inode-&gt;io_tree, folio_pos(folios[0]), cur - 1, &amp;cached_state);</div><div class='add'>+free_folios:</div><div class='add'>+	for (int i = 0; i &lt; nr_pages; i++) {</div><div class='add'>+		if (!folios[i])</div><div class='add'>+			break;</div><div class='add'>+		folio_unlock(folios[i]);</div><div class='add'>+		folio_put(folios[i]);</div><div class='add'>+	}</div><div class='add'>+	kfree(folios);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int defrag_one_cluster(struct btrfs_inode *inode,</div><div class='add'>+			      struct file_ra_state *ra,</div><div class='add'>+			      u64 start, u32 len, u32 extent_thresh,</div><div class='add'>+			      u64 newer_than, bool do_compress,</div><div class='add'>+			      unsigned long *sectors_defragged,</div><div class='add'>+			      unsigned long max_sectors,</div><div class='add'>+			      u64 *last_scanned_ret)</div><div class='add'>+{</div><div class='add'>+	const u32 sectorsize = inode-&gt;root-&gt;fs_info-&gt;sectorsize;</div><div class='add'>+	struct defrag_target_range *entry;</div><div class='add'>+	struct defrag_target_range *tmp;</div><div class='add'>+	LIST_HEAD(target_list);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = defrag_collect_targets(inode, start, len, extent_thresh,</div><div class='add'>+				     newer_than, do_compress, false,</div><div class='add'>+				     &amp;target_list, NULL);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	list_for_each_entry(entry, &amp;target_list, list) {</div><div class='add'>+		u32 range_len = entry-&gt;len;</div><div class='add'>+</div><div class='add'>+		/* Reached or beyond the limit */</div><div class='add'>+		if (max_sectors &amp;&amp; *sectors_defragged &gt;= max_sectors) {</div><div class='add'>+			ret = 1;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (max_sectors)</div><div class='add'>+			range_len = min_t(u32, range_len,</div><div class='add'>+				(max_sectors - *sectors_defragged) * sectorsize);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * If defrag_one_range() has updated last_scanned_ret,</div><div class='add'>+		 * our range may already be invalid (e.g. hole punched).</div><div class='add'>+		 * Skip if our range is before last_scanned_ret, as there is</div><div class='add'>+		 * no need to defrag the range anymore.</div><div class='add'>+		 */</div><div class='add'>+		if (entry-&gt;start + range_len &lt;= *last_scanned_ret)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		page_cache_sync_readahead(inode-&gt;vfs_inode.i_mapping,</div><div class='add'>+				ra, NULL, entry-&gt;start &gt;&gt; PAGE_SHIFT,</div><div class='add'>+				((entry-&gt;start + range_len - 1) &gt;&gt; PAGE_SHIFT) -</div><div class='add'>+				(entry-&gt;start &gt;&gt; PAGE_SHIFT) + 1);</div><div class='add'>+		/*</div><div class='add'>+		 * Here we may not defrag any range if holes are punched before</div><div class='add'>+		 * we locked the pages.</div><div class='add'>+		 * But that's fine, it only affects the @sectors_defragged</div><div class='add'>+		 * accounting.</div><div class='add'>+		 */</div><div class='add'>+		ret = defrag_one_range(inode, entry-&gt;start, range_len,</div><div class='add'>+				       extent_thresh, newer_than, do_compress,</div><div class='add'>+				       last_scanned_ret);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			break;</div><div class='add'>+		*sectors_defragged += range_len &gt;&gt;</div><div class='add'>+				      inode-&gt;root-&gt;fs_info-&gt;sectorsize_bits;</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='add'>+	list_for_each_entry_safe(entry, tmp, &amp;target_list, list) {</div><div class='add'>+		list_del_init(&amp;entry-&gt;list);</div><div class='add'>+		kfree(entry);</div><div class='add'>+	}</div><div class='add'>+	if (ret &gt;= 0)</div><div class='add'>+		*last_scanned_ret = max(*last_scanned_ret, start + len);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Entry point to file defragmentation.</div><div class='add'>+ *</div><div class='add'>+ * @inode:	   inode to be defragged</div><div class='add'>+ * @ra:		   readahead state</div><div class='add'>+ * @range:	   defrag options including range and flags</div><div class='add'>+ * @newer_than:	   minimum transid to defrag</div><div class='add'>+ * @max_to_defrag: max number of sectors to be defragged, if 0, the whole inode</div><div class='add'>+ *		   will be defragged.</div><div class='add'>+ *</div><div class='add'>+ * Return &lt;0 for error.</div><div class='add'>+ * Return &gt;=0 for the number of sectors defragged, and range-&gt;start will be updated</div><div class='add'>+ * to indicate the file offset where next defrag should be started at.</div><div class='add'>+ * (Mostly for autodefrag, which sets @max_to_defrag thus we may exit early without</div><div class='add'>+ *  defragging all the range).</div><div class='add'>+ */</div><div class='add'>+int btrfs_defrag_file(struct btrfs_inode *inode, struct file_ra_state *ra,</div><div class='add'>+		      struct btrfs_ioctl_defrag_range_args *range,</div><div class='add'>+		      u64 newer_than, unsigned long max_to_defrag)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	unsigned long sectors_defragged = 0;</div><div class='add'>+	u64 isize = i_size_read(&amp;inode-&gt;vfs_inode);</div><div class='add'>+	u64 cur;</div><div class='add'>+	u64 last_byte;</div><div class='add'>+	bool do_compress = (range-&gt;flags &amp; BTRFS_DEFRAG_RANGE_COMPRESS);</div><div class='add'>+	bool no_compress = (range-&gt;flags &amp; BTRFS_DEFRAG_RANGE_NOCOMPRESS);</div><div class='add'>+	int compress_type = BTRFS_COMPRESS_ZLIB;</div><div class='add'>+	int compress_level = 0;</div><div class='add'>+	int ret = 0;</div><div class='add'>+	u32 extent_thresh = range-&gt;extent_thresh;</div><div class='add'>+	pgoff_t start_index;</div><div class='add'>+</div><div class='add'>+	ASSERT(ra);</div><div class='add'>+</div><div class='add'>+	if (isize == 0)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if (range-&gt;start &gt;= isize)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	if (do_compress) {</div><div class='add'>+		if (range-&gt;flags &amp; BTRFS_DEFRAG_RANGE_COMPRESS_LEVEL) {</div><div class='add'>+			if (range-&gt;compress.type &gt;= BTRFS_NR_COMPRESS_TYPES)</div><div class='add'>+				return -EINVAL;</div><div class='add'>+			if (range-&gt;compress.type) {</div><div class='add'>+				compress_type  = range-&gt;compress.type;</div><div class='add'>+				compress_level = range-&gt;compress.level;</div><div class='add'>+				if (!btrfs_compress_level_valid(compress_type, compress_level))</div><div class='add'>+					return -EINVAL;</div><div class='add'>+			}</div><div class='add'>+		} else {</div><div class='add'>+			if (range-&gt;compress_type &gt;= BTRFS_NR_COMPRESS_TYPES)</div><div class='add'>+				return -EINVAL;</div><div class='add'>+			if (range-&gt;compress_type)</div><div class='add'>+				compress_type = range-&gt;compress_type;</div><div class='add'>+		}</div><div class='add'>+	} else if (range-&gt;flags &amp; BTRFS_DEFRAG_RANGE_NOCOMPRESS) {</div><div class='add'>+		compress_type = BTRFS_DEFRAG_DONT_COMPRESS;</div><div class='add'>+		compress_level = 1;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (extent_thresh == 0)</div><div class='add'>+		extent_thresh = SZ_256K;</div><div class='add'>+</div><div class='add'>+	if (range-&gt;start + range-&gt;len &gt; range-&gt;start) {</div><div class='add'>+		/* Got a specific range */</div><div class='add'>+		last_byte = min(isize, range-&gt;start + range-&gt;len);</div><div class='add'>+	} else {</div><div class='add'>+		/* Defrag until file end */</div><div class='add'>+		last_byte = isize;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Align the range */</div><div class='add'>+	cur = round_down(range-&gt;start, fs_info-&gt;sectorsize);</div><div class='add'>+	last_byte = round_up(last_byte, fs_info-&gt;sectorsize) - 1;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Make writeback start from the beginning of the range, so that the</div><div class='add'>+	 * defrag range can be written sequentially.</div><div class='add'>+	 */</div><div class='add'>+	start_index = cur &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	if (start_index &lt; inode-&gt;vfs_inode.i_mapping-&gt;writeback_index)</div><div class='add'>+		inode-&gt;vfs_inode.i_mapping-&gt;writeback_index = start_index;</div><div class='add'>+</div><div class='add'>+	while (cur &lt; last_byte) {</div><div class='add'>+		const unsigned long prev_sectors_defragged = sectors_defragged;</div><div class='add'>+		u64 last_scanned = cur;</div><div class='add'>+		u64 cluster_end;</div><div class='add'>+</div><div class='add'>+		if (btrfs_defrag_cancelled(fs_info)) {</div><div class='add'>+			ret = -EAGAIN;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* We want the cluster end at page boundary when possible */</div><div class='add'>+		cluster_end = (((cur &gt;&gt; PAGE_SHIFT) +</div><div class='add'>+			       (SZ_256K &gt;&gt; PAGE_SHIFT)) &lt;&lt; PAGE_SHIFT) - 1;</div><div class='add'>+		cluster_end = min(cluster_end, last_byte);</div><div class='add'>+</div><div class='add'>+		btrfs_inode_lock(inode, 0);</div><div class='add'>+		if (IS_SWAPFILE(&amp;inode-&gt;vfs_inode)) {</div><div class='add'>+			ret = -ETXTBSY;</div><div class='add'>+			btrfs_inode_unlock(inode, 0);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		if (!(inode-&gt;vfs_inode.i_sb-&gt;s_flags &amp; SB_ACTIVE)) {</div><div class='add'>+			btrfs_inode_unlock(inode, 0);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		if (do_compress || no_compress) {</div><div class='add'>+			inode-&gt;defrag_compress = compress_type;</div><div class='add'>+			inode-&gt;defrag_compress_level = compress_level;</div><div class='add'>+		}</div><div class='add'>+		ret = defrag_one_cluster(inode, ra, cur,</div><div class='add'>+				cluster_end + 1 - cur, extent_thresh,</div><div class='add'>+				newer_than, do_compress || no_compress,</div><div class='add'>+				&amp;sectors_defragged,</div><div class='add'>+				max_to_defrag, &amp;last_scanned);</div><div class='add'>+</div><div class='add'>+		if (sectors_defragged &gt; prev_sectors_defragged)</div><div class='add'>+			balance_dirty_pages_ratelimited(inode-&gt;vfs_inode.i_mapping);</div><div class='add'>+</div><div class='add'>+		btrfs_inode_unlock(inode, 0);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			break;</div><div class='add'>+		cur = max(cluster_end + 1, last_scanned);</div><div class='add'>+		if (ret &gt; 0) {</div><div class='add'>+			ret = 0;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		cond_resched();</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Update range.start for autodefrag, this will indicate where to start</div><div class='add'>+	 * in next run.</div><div class='add'>+	 */</div><div class='add'>+	range-&gt;start = cur;</div><div class='add'>+	if (sectors_defragged) {</div><div class='add'>+		/*</div><div class='add'>+		 * We have defragged some sectors, for compression case they</div><div class='add'>+		 * need to be written back immediately.</div><div class='add'>+		 */</div><div class='add'>+		if (range-&gt;flags &amp; BTRFS_DEFRAG_RANGE_START_IO) {</div><div class='add'>+			filemap_flush(inode-&gt;vfs_inode.i_mapping);</div><div class='add'>+			if (test_bit(BTRFS_INODE_HAS_ASYNC_EXTENT,</div><div class='add'>+				     &amp;inode-&gt;runtime_flags))</div><div class='add'>+				filemap_flush(inode-&gt;vfs_inode.i_mapping);</div><div class='add'>+		}</div><div class='add'>+		if (range-&gt;compress_type == BTRFS_COMPRESS_LZO)</div><div class='add'>+			btrfs_set_fs_incompat(fs_info, COMPRESS_LZO);</div><div class='add'>+		else if (range-&gt;compress_type == BTRFS_COMPRESS_ZSTD)</div><div class='add'>+			btrfs_set_fs_incompat(fs_info, COMPRESS_ZSTD);</div><div class='add'>+		ret = sectors_defragged;</div><div class='add'>+	}</div><div class='add'>+	if (do_compress || no_compress) {</div><div class='add'>+		btrfs_inode_lock(inode, 0);</div><div class='add'>+		inode-&gt;defrag_compress = BTRFS_COMPRESS_NONE;</div><div class='add'>+		btrfs_inode_unlock(inode, 0);</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void __cold btrfs_auto_defrag_exit(void)</div><div class='add'>+{</div><div class='add'>+	kmem_cache_destroy(btrfs_inode_defrag_cachep);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int __init btrfs_auto_defrag_init(void)</div><div class='add'>+{</div><div class='add'>+	btrfs_inode_defrag_cachep = kmem_cache_create("btrfs_inode_defrag",</div><div class='add'>+					sizeof(struct inode_defrag), 0, 0, NULL);</div><div class='add'>+	if (!btrfs_inode_defrag_cachep)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/btrfs/defrag.h b/fs/btrfs/defrag.h<br/>new file mode 100644<br/>index 000000000000..a7f917a38dbf<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/defrag.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/defrag.h</a></div><div class='hunk'>@@ -0,0 +1,31 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+</div><div class='add'>+#ifndef BTRFS_DEFRAG_H</div><div class='add'>+#define BTRFS_DEFRAG_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+#include &lt;linux/compiler_types.h&gt;</div><div class='add'>+</div><div class='add'>+struct file_ra_state;</div><div class='add'>+struct btrfs_inode;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+struct btrfs_root;</div><div class='add'>+struct btrfs_trans_handle;</div><div class='add'>+struct btrfs_ioctl_defrag_range_args;</div><div class='add'>+</div><div class='add'>+int btrfs_defrag_file(struct btrfs_inode *inode, struct file_ra_state *ra,</div><div class='add'>+		      struct btrfs_ioctl_defrag_range_args *range,</div><div class='add'>+		      u64 newer_than, unsigned long max_to_defrag);</div><div class='add'>+int __init btrfs_auto_defrag_init(void);</div><div class='add'>+void __cold btrfs_auto_defrag_exit(void);</div><div class='add'>+void btrfs_add_inode_defrag(struct btrfs_inode *inode, u32 extent_thresh);</div><div class='add'>+int btrfs_run_defrag_inodes(struct btrfs_fs_info *fs_info);</div><div class='add'>+void btrfs_cleanup_defrag_inodes(struct btrfs_fs_info *fs_info);</div><div class='add'>+int btrfs_defrag_root(struct btrfs_root *root);</div><div class='add'>+</div><div class='add'>+static inline int btrfs_defrag_cancelled(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	return signal_pending(current);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#endif</div><div class='head'>diff --git a/fs/btrfs/delalloc-space.c b/fs/btrfs/delalloc-space.c<br/>index 2059d1504149..0970799d0aa4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/delalloc-space.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/delalloc-space.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/delalloc-space.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/delalloc-space.c</a></div><div class='hunk'>@@ -1,13 +1,13 @@</div><div class='ctx'> // SPDX-License-Identifier: GPL-2.0</div><div class='ctx'> </div><div class='add'>+#include "messages.h"</div><div class='ctx'> #include "ctree.h"</div><div class='ctx'> #include "delalloc-space.h"</div><div class='ctx'> #include "block-rsv.h"</div><div class='ctx'> #include "btrfs_inode.h"</div><div class='ctx'> #include "space-info.h"</div><div class='del'>-#include "transaction.h"</div><div class='ctx'> #include "qgroup.h"</div><div class='del'>-#include "block-group.h"</div><div class='add'>+#include "fs.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * HOW DOES THIS WORK</div><div class='hunk'>@@ -111,7 +111,19 @@</div><div class='ctx'>  *  making error handling and cleanup easier.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-int btrfs_alloc_data_chunk_ondemand(struct btrfs_inode *inode, u64 bytes)</div><div class='add'>+static inline struct btrfs_space_info *data_sinfo_for_inode(const struct btrfs_inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+</div><div class='add'>+	if (btrfs_is_zoned(fs_info) &amp;&amp; btrfs_is_data_reloc_root(inode-&gt;root)) {</div><div class='add'>+		ASSERT(fs_info-&gt;data_sinfo-&gt;sub_group[0]-&gt;subgroup_id ==</div><div class='add'>+		       BTRFS_SUB_GROUP_DATA_RELOC);</div><div class='add'>+		return fs_info-&gt;data_sinfo-&gt;sub_group[0];</div><div class='add'>+	}</div><div class='add'>+	return fs_info-&gt;data_sinfo;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_alloc_data_chunk_ondemand(const struct btrfs_inode *inode, u64 bytes)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='hunk'>@@ -123,13 +135,15 @@ int btrfs_alloc_data_chunk_ondemand(struct btrfs_inode *inode, u64 bytes)</div><div class='ctx'> 	if (btrfs_is_free_space_inode(inode))</div><div class='ctx'> 		flush = BTRFS_RESERVE_FLUSH_FREE_SPACE_INODE;</div><div class='ctx'> </div><div class='del'>-	return btrfs_reserve_data_bytes(fs_info, bytes, flush);</div><div class='add'>+	return btrfs_reserve_data_bytes(data_sinfo_for_inode(inode), bytes, flush);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_check_data_free_space(struct btrfs_inode *inode,</div><div class='del'>-			struct extent_changeset **reserved, u64 start, u64 len)</div><div class='add'>+				struct extent_changeset **reserved, u64 start,</div><div class='add'>+				u64 len, bool noflush)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	enum btrfs_reserve_flush_enum flush = BTRFS_RESERVE_FLUSH_DATA;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	/* align the range */</div><div class='hunk'>@@ -137,16 +151,24 @@ int btrfs_check_data_free_space(struct btrfs_inode *inode,</div><div class='ctx'> 	      round_down(start, fs_info-&gt;sectorsize);</div><div class='ctx'> 	start = round_down(start, fs_info-&gt;sectorsize);</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_alloc_data_chunk_ondemand(inode, len);</div><div class='add'>+	if (noflush)</div><div class='add'>+		flush = BTRFS_RESERVE_NO_FLUSH;</div><div class='add'>+	else if (btrfs_is_free_space_inode(inode))</div><div class='add'>+		flush = BTRFS_RESERVE_FLUSH_FREE_SPACE_INODE;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_reserve_data_bytes(data_sinfo_for_inode(inode), len, flush);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='ctx'> 	/* Use new btrfs_qgroup_reserve_data to reserve precious data space. */</div><div class='ctx'> 	ret = btrfs_qgroup_reserve_data(inode, reserved, start, len);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		btrfs_free_reserved_data_space_noquota(fs_info, len);</div><div class='del'>-	else</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		btrfs_free_reserved_data_space_noquota(inode, len);</div><div class='add'>+		extent_changeset_free(*reserved);</div><div class='add'>+		*reserved = NULL;</div><div class='add'>+	} else {</div><div class='ctx'> 		ret = 0;</div><div class='add'>+	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -158,15 +180,13 @@ int btrfs_check_data_free_space(struct btrfs_inode *inode,</div><div class='ctx'>  * which we can't sleep and is sure it won't affect qgroup reserved space.</div><div class='ctx'>  * Like clear_bit_hook().</div><div class='ctx'>  */</div><div class='del'>-void btrfs_free_reserved_data_space_noquota(struct btrfs_fs_info *fs_info,</div><div class='del'>-					    u64 len)</div><div class='add'>+void btrfs_free_reserved_data_space_noquota(struct btrfs_inode *inode, u64 len)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_space_info *data_sinfo;</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='ctx'> </div><div class='ctx'> 	ASSERT(IS_ALIGNED(len, fs_info-&gt;sectorsize));</div><div class='ctx'> </div><div class='del'>-	data_sinfo = fs_info-&gt;data_sinfo;</div><div class='del'>-	btrfs_space_info_free_bytes_may_use(fs_info, data_sinfo, len);</div><div class='add'>+	btrfs_space_info_free_bytes_may_use(data_sinfo_for_inode(inode), len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -186,12 +206,12 @@ void btrfs_free_reserved_data_space(struct btrfs_inode *inode,</div><div class='ctx'> 	      round_down(start, fs_info-&gt;sectorsize);</div><div class='ctx'> 	start = round_down(start, fs_info-&gt;sectorsize);</div><div class='ctx'> </div><div class='del'>-	btrfs_free_reserved_data_space_noquota(fs_info, len);</div><div class='del'>-	btrfs_qgroup_free_data(inode, reserved, start, len);</div><div class='add'>+	btrfs_free_reserved_data_space_noquota(inode, len);</div><div class='add'>+	btrfs_qgroup_free_data(inode, reserved, start, len, NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * Release any excessive reservation</div><div class='add'>+/*</div><div class='add'>+ * Release any excessive reservations for an inode.</div><div class='ctx'>  *</div><div class='ctx'>  * @inode:       the inode we need to release from</div><div class='ctx'>  * @qgroup_free: free or convert qgroup meta. Unlike normal operation, qgroup</div><div class='hunk'>@@ -233,7 +253,6 @@ static void btrfs_calculate_inode_block_rsv_size(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	struct btrfs_block_rsv *block_rsv = &amp;inode-&gt;block_rsv;</div><div class='ctx'> 	u64 reserve_size = 0;</div><div class='ctx'> 	u64 qgroup_rsv_size = 0;</div><div class='del'>-	u64 csum_leaves;</div><div class='ctx'> 	unsigned outstanding_extents;</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;inode-&gt;lock);</div><div class='hunk'>@@ -248,10 +267,12 @@ static void btrfs_calculate_inode_block_rsv_size(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 						outstanding_extents);</div><div class='ctx'> 		reserve_size += btrfs_calc_metadata_size(fs_info, 1);</div><div class='ctx'> 	}</div><div class='del'>-	csum_leaves = btrfs_csum_bytes_to_leaves(fs_info,</div><div class='del'>-						 inode-&gt;csum_bytes);</div><div class='del'>-	reserve_size += btrfs_calc_insert_metadata_size(fs_info,</div><div class='del'>-							csum_leaves);</div><div class='add'>+	if (!(inode-&gt;flags &amp; BTRFS_INODE_NODATASUM)) {</div><div class='add'>+		u64 csum_leaves;</div><div class='add'>+</div><div class='add'>+		csum_leaves = btrfs_csum_bytes_to_leaves(fs_info, inode-&gt;csum_bytes);</div><div class='add'>+		reserve_size += btrfs_calc_insert_metadata_size(fs_info, csum_leaves);</div><div class='add'>+	}</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * For qgroup rsv, the calculation is very simple:</div><div class='ctx'> 	 * account one nodesize for each outstanding extent</div><div class='hunk'>@@ -266,14 +287,20 @@ static void btrfs_calculate_inode_block_rsv_size(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	spin_unlock(&amp;block_rsv-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void calc_inode_reservations(struct btrfs_fs_info *fs_info,</div><div class='del'>-				    u64 num_bytes, u64 *meta_reserve,</div><div class='del'>-				    u64 *qgroup_reserve)</div><div class='add'>+static void calc_inode_reservations(struct btrfs_inode *inode,</div><div class='add'>+				    u64 num_bytes, u64 disk_num_bytes,</div><div class='add'>+				    u64 *meta_reserve, u64 *qgroup_reserve)</div><div class='ctx'> {</div><div class='del'>-	u64 nr_extents = count_max_extents(num_bytes);</div><div class='del'>-	u64 csum_leaves = btrfs_csum_bytes_to_leaves(fs_info, num_bytes);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	u64 nr_extents = count_max_extents(fs_info, num_bytes);</div><div class='add'>+	u64 csum_leaves;</div><div class='ctx'> 	u64 inode_update = btrfs_calc_metadata_size(fs_info, 1);</div><div class='ctx'> </div><div class='add'>+	if (inode-&gt;flags &amp; BTRFS_INODE_NODATASUM)</div><div class='add'>+		csum_leaves = 0;</div><div class='add'>+	else</div><div class='add'>+		csum_leaves = btrfs_csum_bytes_to_leaves(fs_info, disk_num_bytes);</div><div class='add'>+</div><div class='ctx'> 	*meta_reserve = btrfs_calc_insert_metadata_size(fs_info,</div><div class='ctx'> 						nr_extents + csum_leaves);</div><div class='ctx'> </div><div class='hunk'>@@ -285,7 +312,8 @@ static void calc_inode_reservations(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	*qgroup_reserve = nr_extents * fs_info-&gt;nodesize;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_delalloc_reserve_metadata(struct btrfs_inode *inode, u64 num_bytes)</div><div class='add'>+int btrfs_delalloc_reserve_metadata(struct btrfs_inode *inode, u64 num_bytes,</div><div class='add'>+				    u64 disk_num_bytes, bool noflush)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='hunk'>@@ -304,17 +332,15 @@ int btrfs_delalloc_reserve_metadata(struct btrfs_inode *inode, u64 num_bytes)</div><div class='ctx'> 	 * If we have a transaction open (can happen if we call truncate_block</div><div class='ctx'> 	 * from truncate), then we need FLUSH_LIMIT so we don't deadlock.</div><div class='ctx'> 	 */</div><div class='del'>-	if (btrfs_is_free_space_inode(inode)) {</div><div class='add'>+	if (noflush || btrfs_is_free_space_inode(inode)) {</div><div class='ctx'> 		flush = BTRFS_RESERVE_NO_FLUSH;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		if (current-&gt;journal_info)</div><div class='ctx'> 			flush = BTRFS_RESERVE_FLUSH_LIMIT;</div><div class='del'>-</div><div class='del'>-		if (btrfs_transaction_in_commit(fs_info))</div><div class='del'>-			schedule_timeout(1);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	num_bytes = ALIGN(num_bytes, fs_info-&gt;sectorsize);</div><div class='add'>+	disk_num_bytes = ALIGN(disk_num_bytes, fs_info-&gt;sectorsize);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We always want to do it this way, every other way is wrong and ends</div><div class='hunk'>@@ -326,12 +352,14 @@ int btrfs_delalloc_reserve_metadata(struct btrfs_inode *inode, u64 num_bytes)</div><div class='ctx'> 	 * everything out and try again, which is bad.  This way we just</div><div class='ctx'> 	 * over-reserve slightly, and clean up the mess when we are done.</div><div class='ctx'> 	 */</div><div class='del'>-	calc_inode_reservations(fs_info, num_bytes, &amp;meta_reserve,</div><div class='del'>-				&amp;qgroup_reserve);</div><div class='del'>-	ret = btrfs_qgroup_reserve_meta_prealloc(root, qgroup_reserve, true);</div><div class='add'>+	calc_inode_reservations(inode, num_bytes, disk_num_bytes,</div><div class='add'>+				&amp;meta_reserve, &amp;qgroup_reserve);</div><div class='add'>+	ret = btrfs_qgroup_reserve_meta_prealloc(root, qgroup_reserve, true,</div><div class='add'>+						 noflush);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='del'>-	ret = btrfs_reserve_metadata_bytes(root, block_rsv, meta_reserve, flush);</div><div class='add'>+	ret = btrfs_reserve_metadata_bytes(block_rsv-&gt;space_info, meta_reserve,</div><div class='add'>+					   flush);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		btrfs_qgroup_free_meta_prealloc(root, qgroup_reserve);</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -343,10 +371,11 @@ int btrfs_delalloc_reserve_metadata(struct btrfs_inode *inode, u64 num_bytes)</div><div class='ctx'> 	 * racing with an ordered completion or some such that would think it</div><div class='ctx'> 	 * needs to free the reservation we just made.</div><div class='ctx'> 	 */</div><div class='add'>+	nr_extents = count_max_extents(fs_info, num_bytes);</div><div class='ctx'> 	spin_lock(&amp;inode-&gt;lock);</div><div class='del'>-	nr_extents = count_max_extents(num_bytes);</div><div class='ctx'> 	btrfs_mod_outstanding_extents(inode, nr_extents);</div><div class='del'>-	inode-&gt;csum_bytes += num_bytes;</div><div class='add'>+	if (!(inode-&gt;flags &amp; BTRFS_INODE_NODATASUM))</div><div class='add'>+		inode-&gt;csum_bytes += disk_num_bytes;</div><div class='ctx'> 	btrfs_calculate_inode_block_rsv_size(fs_info, inode);</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;lock);</div><div class='ctx'> </div><div class='hunk'>@@ -362,12 +391,12 @@ int btrfs_delalloc_reserve_metadata(struct btrfs_inode *inode, u64 num_bytes)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * Release a metadata reservation for an inode</div><div class='add'>+/*</div><div class='add'>+ * Release a metadata reservation for an inode.</div><div class='ctx'>  *</div><div class='del'>- * @inode: the inode to release the reservation for.</div><div class='del'>- * @num_bytes: the number of bytes we are releasing.</div><div class='del'>- * @qgroup_free: free qgroup reservation or convert it to per-trans reservation</div><div class='add'>+ * @inode:        the inode to release the reservation for.</div><div class='add'>+ * @num_bytes:    the number of bytes we are releasing.</div><div class='add'>+ * @qgroup_free:  free qgroup reservation or convert it to per-trans reservation</div><div class='ctx'>  *</div><div class='ctx'>  * This will release the metadata reservation for an inode.  This can be called</div><div class='ctx'>  * once we complete IO for a given set of bytes to release their metadata</div><div class='hunk'>@@ -380,7 +409,8 @@ void btrfs_delalloc_release_metadata(struct btrfs_inode *inode, u64 num_bytes,</div><div class='ctx'> </div><div class='ctx'> 	num_bytes = ALIGN(num_bytes, fs_info-&gt;sectorsize);</div><div class='ctx'> 	spin_lock(&amp;inode-&gt;lock);</div><div class='del'>-	inode-&gt;csum_bytes -= num_bytes;</div><div class='add'>+	if (!(inode-&gt;flags &amp; BTRFS_INODE_NODATASUM))</div><div class='add'>+		inode-&gt;csum_bytes -= num_bytes;</div><div class='ctx'> 	btrfs_calculate_inode_block_rsv_size(fs_info, inode);</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;lock);</div><div class='ctx'> </div><div class='hunk'>@@ -390,10 +420,11 @@ void btrfs_delalloc_release_metadata(struct btrfs_inode *inode, u64 num_bytes,</div><div class='ctx'> 	btrfs_inode_rsv_release(inode, qgroup_free);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * btrfs_delalloc_release_extents - release our outstanding_extents</div><div class='del'>- * @inode: the inode to balance the reservation for.</div><div class='del'>- * @num_bytes: the number of bytes we originally reserved with</div><div class='add'>+/*</div><div class='add'>+ * Release our outstanding_extents for an inode.</div><div class='add'>+ *</div><div class='add'>+ * @inode:      the inode to balance the reservation for.</div><div class='add'>+ * @num_bytes:  the number of bytes we originally reserved with</div><div class='ctx'>  *</div><div class='ctx'>  * When we reserve space we increase outstanding_extents for the extents we may</div><div class='ctx'>  * add.  Once we've set the range as delalloc or created our ordered extents we</div><div class='hunk'>@@ -407,7 +438,7 @@ void btrfs_delalloc_release_extents(struct btrfs_inode *inode, u64 num_bytes)</div><div class='ctx'> 	unsigned num_extents;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;inode-&gt;lock);</div><div class='del'>-	num_extents = count_max_extents(num_bytes);</div><div class='add'>+	num_extents = count_max_extents(fs_info, num_bytes);</div><div class='ctx'> 	btrfs_mod_outstanding_extents(inode, -num_extents);</div><div class='ctx'> 	btrfs_calculate_inode_block_rsv_size(fs_info, inode);</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;lock);</div><div class='hunk'>@@ -418,46 +449,72 @@ void btrfs_delalloc_release_extents(struct btrfs_inode *inode, u64 num_bytes)</div><div class='ctx'> 	btrfs_inode_rsv_release(inode, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * btrfs_delalloc_reserve_space - reserve data and metadata space for</div><div class='del'>- * delalloc</div><div class='del'>- * @inode: inode we're writing to</div><div class='del'>- * @start: start range we are writing to</div><div class='del'>- * @len: how long the range we are writing to</div><div class='del'>- * @reserved: mandatory parameter, record actually reserved qgroup ranges of</div><div class='del'>- * 	      current reservation.</div><div class='add'>+/* Shrink a previously reserved extent to a new length. */</div><div class='add'>+void btrfs_delalloc_shrink_extents(struct btrfs_inode *inode, u64 reserved_len, u64 new_len)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	const u32 reserved_num_extents = count_max_extents(fs_info, reserved_len);</div><div class='add'>+	const u32 new_num_extents = count_max_extents(fs_info, new_len);</div><div class='add'>+	const int diff_num_extents = new_num_extents - reserved_num_extents;</div><div class='add'>+</div><div class='add'>+	ASSERT(new_len &lt;= reserved_len);</div><div class='add'>+	if (new_num_extents == reserved_num_extents)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;inode-&gt;lock);</div><div class='add'>+	btrfs_mod_outstanding_extents(inode, diff_num_extents);</div><div class='add'>+	btrfs_calculate_inode_block_rsv_size(fs_info, inode);</div><div class='add'>+	spin_unlock(&amp;inode-&gt;lock);</div><div class='add'>+</div><div class='add'>+	if (btrfs_is_testing(fs_info))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	btrfs_inode_rsv_release(inode, true);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Reserve data and metadata space for delalloc</div><div class='add'>+ *</div><div class='add'>+ * @inode:     inode we're writing to</div><div class='add'>+ * @start:     start range we are writing to</div><div class='add'>+ * @len:       how long the range we are writing to</div><div class='add'>+ * @reserved:  mandatory parameter, record actually reserved qgroup ranges of</div><div class='add'>+ * 	       current reservation.</div><div class='ctx'>  *</div><div class='ctx'>  * This will do the following things</div><div class='ctx'>  *</div><div class='del'>- * - reserve space in data space info for num bytes</div><div class='del'>- *   and reserve precious corresponding qgroup space</div><div class='add'>+ * - reserve space in data space info for num bytes and reserve precious</div><div class='add'>+ *   corresponding qgroup space</div><div class='ctx'>  *   (Done in check_data_free_space)</div><div class='ctx'>  *</div><div class='ctx'>  * - reserve space for metadata space, based on the number of outstanding</div><div class='del'>- *   extents and how much csums will be needed</div><div class='del'>- *   also reserve metadata space in a per root over-reserve method.</div><div class='add'>+ *   extents and how much csums will be needed also reserve metadata space in a</div><div class='add'>+ *   per root over-reserve method.</div><div class='ctx'>  * - add to the inodes-&gt;delalloc_bytes</div><div class='ctx'>  * - add it to the fs_info's delalloc inodes list.</div><div class='ctx'>  *   (Above 3 all done in delalloc_reserve_metadata)</div><div class='ctx'>  *</div><div class='ctx'>  * Return 0 for success</div><div class='del'>- * Return &lt;0 for error(-ENOSPC or -EQUOT)</div><div class='add'>+ * Return &lt;0 for error(-ENOSPC or -EDQUOT)</div><div class='ctx'>  */</div><div class='ctx'> int btrfs_delalloc_reserve_space(struct btrfs_inode *inode,</div><div class='ctx'> 			struct extent_changeset **reserved, u64 start, u64 len)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_check_data_free_space(inode, reserved, start, len);</div><div class='add'>+	ret = btrfs_check_data_free_space(inode, reserved, start, len, false);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='del'>-	ret = btrfs_delalloc_reserve_metadata(inode, len);</div><div class='del'>-	if (ret &lt; 0)</div><div class='add'>+	ret = btrfs_delalloc_reserve_metadata(inode, len, len, false);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='ctx'> 		btrfs_free_reserved_data_space(inode, *reserved, start, len);</div><div class='add'>+		extent_changeset_free(*reserved);</div><div class='add'>+		*reserved = NULL;</div><div class='add'>+	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='add'>+/*</div><div class='ctx'>  * Release data and metadata space for delalloc</div><div class='ctx'>  *</div><div class='ctx'>  * @inode:       inode we're releasing space for</div><div class='hunk'>@@ -466,10 +523,10 @@ int btrfs_delalloc_reserve_space(struct btrfs_inode *inode,</div><div class='ctx'>  * @len:         length of the space already reserved</div><div class='ctx'>  * @qgroup_free: should qgroup reserved-space also be freed</div><div class='ctx'>  *</div><div class='del'>- * This function will release the metadata space that was not used and will</div><div class='del'>- * decrement -&gt;delalloc_bytes and remove it from the fs_info delalloc_inodes</div><div class='del'>- * list if there are no delalloc bytes left.</div><div class='del'>- * Also it will handle the qgroup reserved space.</div><div class='add'>+ * Release the metadata space that was not used and will decrement</div><div class='add'>+ * -&gt;delalloc_bytes and remove it from the fs_info-&gt;delalloc_inodes list if</div><div class='add'>+ * there are no delalloc bytes left.  Also it will handle the qgroup reserved</div><div class='add'>+ * space.</div><div class='ctx'>  */</div><div class='ctx'> void btrfs_delalloc_release_space(struct btrfs_inode *inode,</div><div class='ctx'> 				  struct extent_changeset *reserved,</div><div class='head'>diff --git a/fs/btrfs/delalloc-space.h b/fs/btrfs/delalloc-space.h<br/>index 28bf5c3ef430..6119c0d3f883 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/delalloc-space.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/delalloc-space.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/delalloc-space.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/delalloc-space.h</a></div><div class='hunk'>@@ -3,21 +3,29 @@</div><div class='ctx'> #ifndef BTRFS_DELALLOC_SPACE_H</div><div class='ctx'> #define BTRFS_DELALLOC_SPACE_H</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+</div><div class='ctx'> struct extent_changeset;</div><div class='add'>+struct btrfs_inode;</div><div class='add'>+struct btrfs_fs_info;</div><div class='ctx'> </div><div class='del'>-int btrfs_alloc_data_chunk_ondemand(struct btrfs_inode *inode, u64 bytes);</div><div class='add'>+int btrfs_alloc_data_chunk_ondemand(const struct btrfs_inode *inode, u64 bytes);</div><div class='ctx'> int btrfs_check_data_free_space(struct btrfs_inode *inode,</div><div class='del'>-			struct extent_changeset **reserved, u64 start, u64 len);</div><div class='add'>+			struct extent_changeset **reserved, u64 start, u64 len,</div><div class='add'>+			bool noflush);</div><div class='ctx'> void btrfs_free_reserved_data_space(struct btrfs_inode *inode,</div><div class='ctx'> 			struct extent_changeset *reserved, u64 start, u64 len);</div><div class='ctx'> void btrfs_delalloc_release_space(struct btrfs_inode *inode,</div><div class='ctx'> 				  struct extent_changeset *reserved,</div><div class='ctx'> 				  u64 start, u64 len, bool qgroup_free);</div><div class='del'>-void btrfs_free_reserved_data_space_noquota(struct btrfs_fs_info *fs_info,</div><div class='del'>-					    u64 len);</div><div class='add'>+void btrfs_free_reserved_data_space_noquota(struct btrfs_inode *inode, u64 len);</div><div class='ctx'> void btrfs_delalloc_release_metadata(struct btrfs_inode *inode, u64 num_bytes,</div><div class='ctx'> 				     bool qgroup_free);</div><div class='ctx'> int btrfs_delalloc_reserve_space(struct btrfs_inode *inode,</div><div class='ctx'> 			struct extent_changeset **reserved, u64 start, u64 len);</div><div class='add'>+int btrfs_delalloc_reserve_metadata(struct btrfs_inode *inode, u64 num_bytes,</div><div class='add'>+				    u64 disk_num_bytes, bool noflush);</div><div class='add'>+void btrfs_delalloc_release_extents(struct btrfs_inode *inode, u64 num_bytes);</div><div class='add'>+void btrfs_delalloc_shrink_extents(struct btrfs_inode *inode, u64 reserved_len, u64 new_len);</div><div class='ctx'> </div><div class='ctx'> #endif /* BTRFS_DELALLOC_SPACE_H */</div><div class='head'>diff --git a/fs/btrfs/delayed-inode.c b/fs/btrfs/delayed-inode.c<br/>index e164766dcc38..ce6e9f8812e0 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/delayed-inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/delayed-inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/delayed-inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/delayed-inode.c</a></div><div class='hunk'>@@ -6,13 +6,19 @@</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/iversion.h&gt;</div><div class='add'>+#include "ctree.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "messages.h"</div><div class='ctx'> #include "misc.h"</div><div class='ctx'> #include "delayed-inode.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='ctx'> #include "transaction.h"</div><div class='del'>-#include "ctree.h"</div><div class='ctx'> #include "qgroup.h"</div><div class='ctx'> #include "locking.h"</div><div class='add'>+#include "inode-item.h"</div><div class='add'>+#include "space-info.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "file-item.h"</div><div class='ctx'> </div><div class='ctx'> #define BTRFS_DELAYED_WRITEBACK		512</div><div class='ctx'> #define BTRFS_DELAYED_BACKGROUND	128</div><div class='hunk'>@@ -22,11 +28,7 @@ static struct kmem_cache *delayed_node_cache;</div><div class='ctx'> </div><div class='ctx'> int __init btrfs_delayed_inode_init(void)</div><div class='ctx'> {</div><div class='del'>-	delayed_node_cache = kmem_cache_create("btrfs_delayed_node",</div><div class='del'>-					sizeof(struct btrfs_delayed_node),</div><div class='del'>-					0,</div><div class='del'>-					SLAB_MEM_SPREAD,</div><div class='del'>-					NULL);</div><div class='add'>+	delayed_node_cache = KMEM_CACHE(btrfs_delayed_node, 0);</div><div class='ctx'> 	if (!delayed_node_cache)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -37,6 +39,17 @@ void __cold btrfs_delayed_inode_exit(void)</div><div class='ctx'> 	kmem_cache_destroy(delayed_node_cache);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void btrfs_init_delayed_root(struct btrfs_delayed_root *delayed_root)</div><div class='add'>+{</div><div class='add'>+	atomic_set(&amp;delayed_root-&gt;items, 0);</div><div class='add'>+	atomic_set(&amp;delayed_root-&gt;items_seq, 0);</div><div class='add'>+	delayed_root-&gt;nodes = 0;</div><div class='add'>+	spin_lock_init(&amp;delayed_root-&gt;lock);</div><div class='add'>+	init_waitqueue_head(&amp;delayed_root-&gt;wait);</div><div class='add'>+	INIT_LIST_HEAD(&amp;delayed_root-&gt;node_list);</div><div class='add'>+	INIT_LIST_HEAD(&amp;delayed_root-&gt;prepare_list);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline void btrfs_init_delayed_node(</div><div class='ctx'> 				struct btrfs_delayed_node *delayed_node,</div><div class='ctx'> 				struct btrfs_root *root, u64 inode_id)</div><div class='hunk'>@@ -44,6 +57,7 @@ static inline void btrfs_init_delayed_node(</div><div class='ctx'> 	delayed_node-&gt;root = root;</div><div class='ctx'> 	delayed_node-&gt;inode_id = inode_id;</div><div class='ctx'> 	refcount_set(&amp;delayed_node-&gt;refs, 0);</div><div class='add'>+	btrfs_delayed_node_ref_tracker_dir_init(delayed_node);</div><div class='ctx'> 	delayed_node-&gt;ins_root = RB_ROOT_CACHED;</div><div class='ctx'> 	delayed_node-&gt;del_root = RB_ROOT_CACHED;</div><div class='ctx'> 	mutex_init(&amp;delayed_node-&gt;mutex);</div><div class='hunk'>@@ -51,20 +65,9 @@ static inline void btrfs_init_delayed_node(</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;delayed_node-&gt;p_list);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int btrfs_is_continuous_delayed_item(</div><div class='del'>-					struct btrfs_delayed_item *item1,</div><div class='del'>-					struct btrfs_delayed_item *item2)</div><div class='del'>-{</div><div class='del'>-	if (item1-&gt;key.type == BTRFS_DIR_INDEX_KEY &amp;&amp;</div><div class='del'>-	    item1-&gt;key.objectid == item2-&gt;key.objectid &amp;&amp;</div><div class='del'>-	    item1-&gt;key.type == item2-&gt;key.type &amp;&amp;</div><div class='del'>-	    item1-&gt;key.offset + 1 == item2-&gt;key.offset)</div><div class='del'>-		return 1;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static struct btrfs_delayed_node *btrfs_get_delayed_node(</div><div class='del'>-		struct btrfs_inode *btrfs_inode)</div><div class='add'>+		struct btrfs_inode *btrfs_inode,</div><div class='add'>+		struct btrfs_ref_tracker *tracker)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root = btrfs_inode-&gt;root;</div><div class='ctx'> 	u64 ino = btrfs_ino(btrfs_inode);</div><div class='hunk'>@@ -73,25 +76,27 @@ static struct btrfs_delayed_node *btrfs_get_delayed_node(</div><div class='ctx'> 	node = READ_ONCE(btrfs_inode-&gt;delayed_node);</div><div class='ctx'> 	if (node) {</div><div class='ctx'> 		refcount_inc(&amp;node-&gt;refs);</div><div class='add'>+		btrfs_delayed_node_ref_tracker_alloc(node, tracker, GFP_NOFS);</div><div class='ctx'> 		return node;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;root-&gt;inode_lock);</div><div class='del'>-	node = radix_tree_lookup(&amp;root-&gt;delayed_nodes_tree, ino);</div><div class='add'>+	xa_lock(&amp;root-&gt;delayed_nodes);</div><div class='add'>+	node = xa_load(&amp;root-&gt;delayed_nodes, ino);</div><div class='ctx'> </div><div class='ctx'> 	if (node) {</div><div class='ctx'> 		if (btrfs_inode-&gt;delayed_node) {</div><div class='ctx'> 			refcount_inc(&amp;node-&gt;refs);	/* can be accessed */</div><div class='add'>+			btrfs_delayed_node_ref_tracker_alloc(node, tracker, GFP_ATOMIC);</div><div class='ctx'> 			BUG_ON(btrfs_inode-&gt;delayed_node != node);</div><div class='del'>-			spin_unlock(&amp;root-&gt;inode_lock);</div><div class='add'>+			xa_unlock(&amp;root-&gt;delayed_nodes);</div><div class='ctx'> 			return node;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * It's possible that we're racing into the middle of removing</div><div class='del'>-		 * this node from the radix tree.  In this case, the refcount</div><div class='add'>+		 * this node from the xarray.  In this case, the refcount</div><div class='ctx'> 		 * was zero and it should never go back to one.  Just return</div><div class='del'>-		 * NULL like it was never in the radix at all; our release</div><div class='add'>+		 * NULL like it was never in the xarray at all; our release</div><div class='ctx'> 		 * function is in the process of removing it.</div><div class='ctx'> 		 *</div><div class='ctx'> 		 * Some implementations of refcount_inc refuse to bump the</div><div class='hunk'>@@ -99,36 +104,46 @@ static struct btrfs_delayed_node *btrfs_get_delayed_node(</div><div class='ctx'> 		 * here, refcount_inc() may decide to just WARN_ONCE() instead</div><div class='ctx'> 		 * of actually bumping the refcount.</div><div class='ctx'> 		 *</div><div class='del'>-		 * If this node is properly in the radix, we want to bump the</div><div class='add'>+		 * If this node is properly in the xarray, we want to bump the</div><div class='ctx'> 		 * refcount twice, once for the inode and once for this get</div><div class='ctx'> 		 * operation.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (refcount_inc_not_zero(&amp;node-&gt;refs)) {</div><div class='ctx'> 			refcount_inc(&amp;node-&gt;refs);</div><div class='add'>+			btrfs_delayed_node_ref_tracker_alloc(node, tracker, GFP_ATOMIC);</div><div class='add'>+			btrfs_delayed_node_ref_tracker_alloc(node, &amp;node-&gt;inode_cache_tracker,</div><div class='add'>+							     GFP_ATOMIC);</div><div class='ctx'> 			btrfs_inode-&gt;delayed_node = node;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			node = NULL;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		spin_unlock(&amp;root-&gt;inode_lock);</div><div class='add'>+		xa_unlock(&amp;root-&gt;delayed_nodes);</div><div class='ctx'> 		return node;</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;root-&gt;inode_lock);</div><div class='add'>+	xa_unlock(&amp;root-&gt;delayed_nodes);</div><div class='ctx'> </div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Will return either the node or PTR_ERR(-ENOMEM) */</div><div class='add'>+/*</div><div class='add'>+ * Look up an existing delayed node associated with @btrfs_inode or create a new</div><div class='add'>+ * one and insert it to the delayed nodes of the root.</div><div class='add'>+ *</div><div class='add'>+ * Return the delayed node, or error pointer on failure.</div><div class='add'>+ */</div><div class='ctx'> static struct btrfs_delayed_node *btrfs_get_or_create_delayed_node(</div><div class='del'>-		struct btrfs_inode *btrfs_inode)</div><div class='add'>+		struct btrfs_inode *btrfs_inode,</div><div class='add'>+		struct btrfs_ref_tracker *tracker)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_delayed_node *node;</div><div class='ctx'> 	struct btrfs_root *root = btrfs_inode-&gt;root;</div><div class='ctx'> 	u64 ino = btrfs_ino(btrfs_inode);</div><div class='ctx'> 	int ret;</div><div class='add'>+	void *ptr;</div><div class='ctx'> </div><div class='ctx'> again:</div><div class='del'>-	node = btrfs_get_delayed_node(btrfs_inode);</div><div class='add'>+	node = btrfs_get_delayed_node(btrfs_inode, tracker);</div><div class='ctx'> 	if (node)</div><div class='ctx'> 		return node;</div><div class='ctx'> </div><div class='hunk'>@@ -137,26 +152,35 @@ again:</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> 	btrfs_init_delayed_node(node, root, ino);</div><div class='ctx'> </div><div class='del'>-	/* cached in the btrfs inode and can be accessed */</div><div class='del'>-	refcount_set(&amp;node-&gt;refs, 2);</div><div class='del'>-</div><div class='del'>-	ret = radix_tree_preload(GFP_NOFS);</div><div class='del'>-	if (ret) {</div><div class='add'>+	/* Allocate and reserve the slot, from now it can return a NULL from xa_load(). */</div><div class='add'>+	ret = xa_reserve(&amp;root-&gt;delayed_nodes, ino, GFP_NOFS);</div><div class='add'>+	if (ret == -ENOMEM) {</div><div class='add'>+		btrfs_delayed_node_ref_tracker_dir_exit(node);</div><div class='ctx'> 		kmem_cache_free(delayed_node_cache, node);</div><div class='del'>-		return ERR_PTR(ret);</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;root-&gt;inode_lock);</div><div class='del'>-	ret = radix_tree_insert(&amp;root-&gt;delayed_nodes_tree, ino, node);</div><div class='del'>-	if (ret == -EEXIST) {</div><div class='del'>-		spin_unlock(&amp;root-&gt;inode_lock);</div><div class='add'>+	xa_lock(&amp;root-&gt;delayed_nodes);</div><div class='add'>+	ptr = xa_load(&amp;root-&gt;delayed_nodes, ino);</div><div class='add'>+	if (ptr) {</div><div class='add'>+		/* Somebody inserted it, go back and read it. */</div><div class='add'>+		xa_unlock(&amp;root-&gt;delayed_nodes);</div><div class='add'>+		btrfs_delayed_node_ref_tracker_dir_exit(node);</div><div class='ctx'> 		kmem_cache_free(delayed_node_cache, node);</div><div class='del'>-		radix_tree_preload_end();</div><div class='add'>+		node = NULL;</div><div class='ctx'> 		goto again;</div><div class='ctx'> 	}</div><div class='add'>+	ptr = __xa_store(&amp;root-&gt;delayed_nodes, ino, node, GFP_ATOMIC);</div><div class='add'>+	ASSERT(xa_err(ptr) != -EINVAL);</div><div class='add'>+	ASSERT(xa_err(ptr) != -ENOMEM);</div><div class='add'>+	ASSERT(ptr == NULL);</div><div class='add'>+</div><div class='add'>+	/* Cached in the inode and can be accessed. */</div><div class='add'>+	refcount_set(&amp;node-&gt;refs, 2);</div><div class='add'>+	btrfs_delayed_node_ref_tracker_alloc(node, tracker, GFP_ATOMIC);</div><div class='add'>+	btrfs_delayed_node_ref_tracker_alloc(node, &amp;node-&gt;inode_cache_tracker, GFP_ATOMIC);</div><div class='add'>+</div><div class='ctx'> 	btrfs_inode-&gt;delayed_node = node;</div><div class='del'>-	spin_unlock(&amp;root-&gt;inode_lock);</div><div class='del'>-	radix_tree_preload_end();</div><div class='add'>+	xa_unlock(&amp;root-&gt;delayed_nodes);</div><div class='ctx'> </div><div class='ctx'> 	return node;</div><div class='ctx'> }</div><div class='hunk'>@@ -180,6 +204,8 @@ static void btrfs_queue_delayed_node(struct btrfs_delayed_root *root,</div><div class='ctx'> 		list_add_tail(&amp;node-&gt;n_list, &amp;root-&gt;node_list);</div><div class='ctx'> 		list_add_tail(&amp;node-&gt;p_list, &amp;root-&gt;prepare_list);</div><div class='ctx'> 		refcount_inc(&amp;node-&gt;refs);	/* inserted into list */</div><div class='add'>+		btrfs_delayed_node_ref_tracker_alloc(node, &amp;node-&gt;node_list_tracker,</div><div class='add'>+						     GFP_ATOMIC);</div><div class='ctx'> 		root-&gt;nodes++;</div><div class='ctx'> 		set_bit(BTRFS_DELAYED_NODE_IN_LIST, &amp;node-&gt;flags);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -193,6 +219,7 @@ static void btrfs_dequeue_delayed_node(struct btrfs_delayed_root *root,</div><div class='ctx'> 	spin_lock(&amp;root-&gt;lock);</div><div class='ctx'> 	if (test_bit(BTRFS_DELAYED_NODE_IN_LIST, &amp;node-&gt;flags)) {</div><div class='ctx'> 		root-&gt;nodes--;</div><div class='add'>+		btrfs_delayed_node_ref_tracker_free(node, &amp;node-&gt;node_list_tracker);</div><div class='ctx'> 		refcount_dec(&amp;node-&gt;refs);	/* not in the list */</div><div class='ctx'> 		list_del_init(&amp;node-&gt;n_list);</div><div class='ctx'> 		if (!list_empty(&amp;node-&gt;p_list))</div><div class='hunk'>@@ -203,26 +230,26 @@ static void btrfs_dequeue_delayed_node(struct btrfs_delayed_root *root,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct btrfs_delayed_node *btrfs_first_delayed_node(</div><div class='del'>-			struct btrfs_delayed_root *delayed_root)</div><div class='add'>+			struct btrfs_delayed_root *delayed_root,</div><div class='add'>+			struct btrfs_ref_tracker *tracker)</div><div class='ctx'> {</div><div class='del'>-	struct list_head *p;</div><div class='del'>-	struct btrfs_delayed_node *node = NULL;</div><div class='add'>+	struct btrfs_delayed_node *node;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;delayed_root-&gt;lock);</div><div class='del'>-	if (list_empty(&amp;delayed_root-&gt;node_list))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	p = delayed_root-&gt;node_list.next;</div><div class='del'>-	node = list_entry(p, struct btrfs_delayed_node, n_list);</div><div class='del'>-	refcount_inc(&amp;node-&gt;refs);</div><div class='del'>-out:</div><div class='add'>+	node = list_first_entry_or_null(&amp;delayed_root-&gt;node_list,</div><div class='add'>+					struct btrfs_delayed_node, n_list);</div><div class='add'>+	if (node) {</div><div class='add'>+		refcount_inc(&amp;node-&gt;refs);</div><div class='add'>+		btrfs_delayed_node_ref_tracker_alloc(node, tracker, GFP_ATOMIC);</div><div class='add'>+	}</div><div class='ctx'> 	spin_unlock(&amp;delayed_root-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	return node;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct btrfs_delayed_node *btrfs_next_delayed_node(</div><div class='del'>-						struct btrfs_delayed_node *node)</div><div class='add'>+						struct btrfs_delayed_node *node,</div><div class='add'>+						struct btrfs_ref_tracker *tracker)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_delayed_root *delayed_root;</div><div class='ctx'> 	struct list_head *p;</div><div class='hunk'>@@ -242,6 +269,7 @@ static struct btrfs_delayed_node *btrfs_next_delayed_node(</div><div class='ctx'> </div><div class='ctx'> 	next = list_entry(p, struct btrfs_delayed_node, n_list);</div><div class='ctx'> 	refcount_inc(&amp;next-&gt;refs);</div><div class='add'>+	btrfs_delayed_node_ref_tracker_alloc(next, tracker, GFP_ATOMIC);</div><div class='ctx'> out:</div><div class='ctx'> 	spin_unlock(&amp;delayed_root-&gt;lock);</div><div class='ctx'> </div><div class='hunk'>@@ -250,7 +278,7 @@ out:</div><div class='ctx'> </div><div class='ctx'> static void __btrfs_release_delayed_node(</div><div class='ctx'> 				struct btrfs_delayed_node *delayed_node,</div><div class='del'>-				int mod)</div><div class='add'>+				int mod, struct btrfs_ref_tracker *tracker)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_delayed_root *delayed_root;</div><div class='ctx'> </div><div class='hunk'>@@ -266,201 +294,139 @@ static void __btrfs_release_delayed_node(</div><div class='ctx'> 		btrfs_dequeue_delayed_node(delayed_root, delayed_node);</div><div class='ctx'> 	mutex_unlock(&amp;delayed_node-&gt;mutex);</div><div class='ctx'> </div><div class='add'>+	btrfs_delayed_node_ref_tracker_free(delayed_node, tracker);</div><div class='ctx'> 	if (refcount_dec_and_test(&amp;delayed_node-&gt;refs)) {</div><div class='ctx'> 		struct btrfs_root *root = delayed_node-&gt;root;</div><div class='ctx'> </div><div class='del'>-		spin_lock(&amp;root-&gt;inode_lock);</div><div class='add'>+		xa_erase(&amp;root-&gt;delayed_nodes, delayed_node-&gt;inode_id);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Once our refcount goes to zero, nobody is allowed to bump it</div><div class='ctx'> 		 * back up.  We can delete it now.</div><div class='ctx'> 		 */</div><div class='ctx'> 		ASSERT(refcount_read(&amp;delayed_node-&gt;refs) == 0);</div><div class='del'>-		radix_tree_delete(&amp;root-&gt;delayed_nodes_tree,</div><div class='del'>-				  delayed_node-&gt;inode_id);</div><div class='del'>-		spin_unlock(&amp;root-&gt;inode_lock);</div><div class='add'>+		btrfs_delayed_node_ref_tracker_dir_exit(delayed_node);</div><div class='ctx'> 		kmem_cache_free(delayed_node_cache, delayed_node);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void btrfs_release_delayed_node(struct btrfs_delayed_node *node)</div><div class='add'>+static inline void btrfs_release_delayed_node(struct btrfs_delayed_node *node,</div><div class='add'>+					      struct btrfs_ref_tracker *tracker)</div><div class='ctx'> {</div><div class='del'>-	__btrfs_release_delayed_node(node, 0);</div><div class='add'>+	__btrfs_release_delayed_node(node, 0, tracker);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct btrfs_delayed_node *btrfs_first_prepared_delayed_node(</div><div class='del'>-					struct btrfs_delayed_root *delayed_root)</div><div class='add'>+					struct btrfs_delayed_root *delayed_root,</div><div class='add'>+					struct btrfs_ref_tracker *tracker)</div><div class='ctx'> {</div><div class='del'>-	struct list_head *p;</div><div class='del'>-	struct btrfs_delayed_node *node = NULL;</div><div class='add'>+	struct btrfs_delayed_node *node;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;delayed_root-&gt;lock);</div><div class='del'>-	if (list_empty(&amp;delayed_root-&gt;prepare_list))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	p = delayed_root-&gt;prepare_list.next;</div><div class='del'>-	list_del_init(p);</div><div class='del'>-	node = list_entry(p, struct btrfs_delayed_node, p_list);</div><div class='del'>-	refcount_inc(&amp;node-&gt;refs);</div><div class='del'>-out:</div><div class='add'>+	node = list_first_entry_or_null(&amp;delayed_root-&gt;prepare_list,</div><div class='add'>+					struct btrfs_delayed_node, p_list);</div><div class='add'>+	if (node) {</div><div class='add'>+		list_del_init(&amp;node-&gt;p_list);</div><div class='add'>+		refcount_inc(&amp;node-&gt;refs);</div><div class='add'>+		btrfs_delayed_node_ref_tracker_alloc(node, tracker, GFP_ATOMIC);</div><div class='add'>+	}</div><div class='ctx'> 	spin_unlock(&amp;delayed_root-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	return node;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void btrfs_release_prepared_delayed_node(</div><div class='del'>-					struct btrfs_delayed_node *node)</div><div class='add'>+					struct btrfs_delayed_node *node,</div><div class='add'>+					struct btrfs_ref_tracker *tracker)</div><div class='ctx'> {</div><div class='del'>-	__btrfs_release_delayed_node(node, 1);</div><div class='add'>+	__btrfs_release_delayed_node(node, 1, tracker);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct btrfs_delayed_item *btrfs_alloc_delayed_item(u32 data_len)</div><div class='add'>+static struct btrfs_delayed_item *btrfs_alloc_delayed_item(u16 data_len,</div><div class='add'>+					   struct btrfs_delayed_node *node,</div><div class='add'>+					   enum btrfs_delayed_item_type type)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_delayed_item *item;</div><div class='del'>-	item = kmalloc(sizeof(*item) + data_len, GFP_NOFS);</div><div class='add'>+</div><div class='add'>+	item = kmalloc(struct_size(item, data, data_len), GFP_NOFS);</div><div class='ctx'> 	if (item) {</div><div class='ctx'> 		item-&gt;data_len = data_len;</div><div class='del'>-		item-&gt;ins_or_del = 0;</div><div class='add'>+		item-&gt;type = type;</div><div class='ctx'> 		item-&gt;bytes_reserved = 0;</div><div class='del'>-		item-&gt;delayed_node = NULL;</div><div class='add'>+		item-&gt;delayed_node = node;</div><div class='add'>+		RB_CLEAR_NODE(&amp;item-&gt;rb_node);</div><div class='add'>+		INIT_LIST_HEAD(&amp;item-&gt;log_list);</div><div class='add'>+		item-&gt;logged = false;</div><div class='ctx'> 		refcount_set(&amp;item-&gt;refs, 1);</div><div class='ctx'> 	}</div><div class='ctx'> 	return item;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int delayed_item_index_cmp(const void *key, const struct rb_node *node)</div><div class='add'>+{</div><div class='add'>+	const u64 *index = key;</div><div class='add'>+	const struct btrfs_delayed_item *delayed_item = rb_entry(node,</div><div class='add'>+						 struct btrfs_delayed_item, rb_node);</div><div class='add'>+</div><div class='add'>+	if (delayed_item-&gt;index &lt; *index)</div><div class='add'>+		return 1;</div><div class='add'>+	else if (delayed_item-&gt;index &gt; *index)</div><div class='add'>+		return -1;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='del'>- * __btrfs_lookup_delayed_item - look up the delayed item by key</div><div class='add'>+ * Look up the delayed item by key.</div><div class='add'>+ *</div><div class='ctx'>  * @delayed_node: pointer to the delayed node</div><div class='del'>- * @key:	  the key to look up</div><div class='del'>- * @prev:	  used to store the prev item if the right item isn't found</div><div class='del'>- * @next:	  used to store the next item if the right item isn't found</div><div class='add'>+ * @index:	  the dir index value to lookup (offset of a dir index key)</div><div class='ctx'>  *</div><div class='ctx'>  * Note: if we don't find the right item, we will return the prev item and</div><div class='ctx'>  * the next item.</div><div class='ctx'>  */</div><div class='ctx'> static struct btrfs_delayed_item *__btrfs_lookup_delayed_item(</div><div class='ctx'> 				struct rb_root *root,</div><div class='del'>-				struct btrfs_key *key,</div><div class='del'>-				struct btrfs_delayed_item **prev,</div><div class='del'>-				struct btrfs_delayed_item **next)</div><div class='add'>+				u64 index)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node *node, *prev_node = NULL;</div><div class='del'>-	struct btrfs_delayed_item *delayed_item = NULL;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	node = root-&gt;rb_node;</div><div class='add'>+	struct rb_node *node;</div><div class='ctx'> </div><div class='del'>-	while (node) {</div><div class='del'>-		delayed_item = rb_entry(node, struct btrfs_delayed_item,</div><div class='del'>-					rb_node);</div><div class='del'>-		prev_node = node;</div><div class='del'>-		ret = btrfs_comp_cpu_keys(&amp;delayed_item-&gt;key, key);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			node = node-&gt;rb_right;</div><div class='del'>-		else if (ret &gt; 0)</div><div class='del'>-			node = node-&gt;rb_left;</div><div class='del'>-		else</div><div class='del'>-			return delayed_item;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (prev) {</div><div class='del'>-		if (!prev_node)</div><div class='del'>-			*prev = NULL;</div><div class='del'>-		else if (ret &lt; 0)</div><div class='del'>-			*prev = delayed_item;</div><div class='del'>-		else if ((node = rb_prev(prev_node)) != NULL) {</div><div class='del'>-			*prev = rb_entry(node, struct btrfs_delayed_item,</div><div class='del'>-					 rb_node);</div><div class='del'>-		} else</div><div class='del'>-			*prev = NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (next) {</div><div class='del'>-		if (!prev_node)</div><div class='del'>-			*next = NULL;</div><div class='del'>-		else if (ret &gt; 0)</div><div class='del'>-			*next = delayed_item;</div><div class='del'>-		else if ((node = rb_next(prev_node)) != NULL) {</div><div class='del'>-			*next = rb_entry(node, struct btrfs_delayed_item,</div><div class='del'>-					 rb_node);</div><div class='del'>-		} else</div><div class='del'>-			*next = NULL;</div><div class='del'>-	}</div><div class='del'>-	return NULL;</div><div class='add'>+	node = rb_find(&amp;index, root, delayed_item_index_cmp);</div><div class='add'>+	return rb_entry_safe(node, struct btrfs_delayed_item, rb_node);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct btrfs_delayed_item *__btrfs_lookup_delayed_insertion_item(</div><div class='del'>-					struct btrfs_delayed_node *delayed_node,</div><div class='del'>-					struct btrfs_key *key)</div><div class='add'>+static int btrfs_delayed_item_cmp(const struct rb_node *new,</div><div class='add'>+				  const struct rb_node *exist)</div><div class='ctx'> {</div><div class='del'>-	return __btrfs_lookup_delayed_item(&amp;delayed_node-&gt;ins_root.rb_root, key,</div><div class='del'>-					   NULL, NULL);</div><div class='add'>+	const struct btrfs_delayed_item *new_item =</div><div class='add'>+		rb_entry(new, struct btrfs_delayed_item, rb_node);</div><div class='add'>+</div><div class='add'>+	return delayed_item_index_cmp(&amp;new_item-&gt;index, exist);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int __btrfs_add_delayed_item(struct btrfs_delayed_node *delayed_node,</div><div class='del'>-				    struct btrfs_delayed_item *ins,</div><div class='del'>-				    int action)</div><div class='add'>+				    struct btrfs_delayed_item *ins)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node **p, *node;</div><div class='del'>-	struct rb_node *parent_node = NULL;</div><div class='ctx'> 	struct rb_root_cached *root;</div><div class='del'>-	struct btrfs_delayed_item *item;</div><div class='del'>-	int cmp;</div><div class='del'>-	bool leftmost = true;</div><div class='add'>+	struct rb_node *exist;</div><div class='ctx'> </div><div class='del'>-	if (action == BTRFS_DELAYED_INSERTION_ITEM)</div><div class='add'>+	if (ins-&gt;type == BTRFS_DELAYED_INSERTION_ITEM)</div><div class='ctx'> 		root = &amp;delayed_node-&gt;ins_root;</div><div class='del'>-	else if (action == BTRFS_DELAYED_DELETION_ITEM)</div><div class='del'>-		root = &amp;delayed_node-&gt;del_root;</div><div class='ctx'> 	else</div><div class='del'>-		BUG();</div><div class='del'>-	p = &amp;root-&gt;rb_root.rb_node;</div><div class='del'>-	node = &amp;ins-&gt;rb_node;</div><div class='del'>-</div><div class='del'>-	while (*p) {</div><div class='del'>-		parent_node = *p;</div><div class='del'>-		item = rb_entry(parent_node, struct btrfs_delayed_item,</div><div class='del'>-				 rb_node);</div><div class='del'>-</div><div class='del'>-		cmp = btrfs_comp_cpu_keys(&amp;item-&gt;key, &amp;ins-&gt;key);</div><div class='del'>-		if (cmp &lt; 0) {</div><div class='del'>-			p = &amp;(*p)-&gt;rb_right;</div><div class='del'>-			leftmost = false;</div><div class='del'>-		} else if (cmp &gt; 0) {</div><div class='del'>-			p = &amp;(*p)-&gt;rb_left;</div><div class='del'>-		} else {</div><div class='del'>-			return -EEXIST;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+		root = &amp;delayed_node-&gt;del_root;</div><div class='ctx'> </div><div class='del'>-	rb_link_node(node, parent_node, p);</div><div class='del'>-	rb_insert_color_cached(node, root, leftmost);</div><div class='del'>-	ins-&gt;delayed_node = delayed_node;</div><div class='del'>-	ins-&gt;ins_or_del = action;</div><div class='add'>+	exist = rb_find_add_cached(&amp;ins-&gt;rb_node, root, btrfs_delayed_item_cmp);</div><div class='add'>+	if (exist)</div><div class='add'>+		return -EEXIST;</div><div class='ctx'> </div><div class='del'>-	if (ins-&gt;key.type == BTRFS_DIR_INDEX_KEY &amp;&amp;</div><div class='del'>-	    action == BTRFS_DELAYED_INSERTION_ITEM &amp;&amp;</div><div class='del'>-	    ins-&gt;key.offset &gt;= delayed_node-&gt;index_cnt)</div><div class='del'>-			delayed_node-&gt;index_cnt = ins-&gt;key.offset + 1;</div><div class='add'>+	if (ins-&gt;type == BTRFS_DELAYED_INSERTION_ITEM &amp;&amp;</div><div class='add'>+	    ins-&gt;index &gt;= delayed_node-&gt;index_cnt)</div><div class='add'>+		delayed_node-&gt;index_cnt = ins-&gt;index + 1;</div><div class='ctx'> </div><div class='ctx'> 	delayed_node-&gt;count++;</div><div class='ctx'> 	atomic_inc(&amp;delayed_node-&gt;root-&gt;fs_info-&gt;delayed_root-&gt;items);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __btrfs_add_delayed_insertion_item(struct btrfs_delayed_node *node,</div><div class='del'>-					      struct btrfs_delayed_item *item)</div><div class='del'>-{</div><div class='del'>-	return __btrfs_add_delayed_item(node, item,</div><div class='del'>-					BTRFS_DELAYED_INSERTION_ITEM);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int __btrfs_add_delayed_deletion_item(struct btrfs_delayed_node *node,</div><div class='del'>-					     struct btrfs_delayed_item *item)</div><div class='del'>-{</div><div class='del'>-	return __btrfs_add_delayed_item(node, item,</div><div class='del'>-					BTRFS_DELAYED_DELETION_ITEM);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static void finish_one_item(struct btrfs_delayed_root *delayed_root)</div><div class='ctx'> {</div><div class='ctx'> 	int seq = atomic_inc_return(&amp;delayed_root-&gt;items_seq);</div><div class='hunk'>@@ -473,25 +439,27 @@ static void finish_one_item(struct btrfs_delayed_root *delayed_root)</div><div class='ctx'> </div><div class='ctx'> static void __btrfs_remove_delayed_item(struct btrfs_delayed_item *delayed_item)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_delayed_node *delayed_node = delayed_item-&gt;delayed_node;</div><div class='ctx'> 	struct rb_root_cached *root;</div><div class='ctx'> 	struct btrfs_delayed_root *delayed_root;</div><div class='ctx'> </div><div class='del'>-	/* Not associated with any delayed_node */</div><div class='del'>-	if (!delayed_item-&gt;delayed_node)</div><div class='add'>+	/* Not inserted, ignore it. */</div><div class='add'>+	if (RB_EMPTY_NODE(&amp;delayed_item-&gt;rb_node))</div><div class='ctx'> 		return;</div><div class='del'>-	delayed_root = delayed_item-&gt;delayed_node-&gt;root-&gt;fs_info-&gt;delayed_root;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(!delayed_root);</div><div class='del'>-	BUG_ON(delayed_item-&gt;ins_or_del != BTRFS_DELAYED_DELETION_ITEM &amp;&amp;</div><div class='del'>-	       delayed_item-&gt;ins_or_del != BTRFS_DELAYED_INSERTION_ITEM);</div><div class='add'>+	/* If it's in a rbtree, then we need to have delayed node locked. */</div><div class='add'>+	lockdep_assert_held(&amp;delayed_node-&gt;mutex);</div><div class='ctx'> </div><div class='del'>-	if (delayed_item-&gt;ins_or_del == BTRFS_DELAYED_INSERTION_ITEM)</div><div class='del'>-		root = &amp;delayed_item-&gt;delayed_node-&gt;ins_root;</div><div class='add'>+	delayed_root = delayed_node-&gt;root-&gt;fs_info-&gt;delayed_root;</div><div class='add'>+</div><div class='add'>+	if (delayed_item-&gt;type == BTRFS_DELAYED_INSERTION_ITEM)</div><div class='add'>+		root = &amp;delayed_node-&gt;ins_root;</div><div class='ctx'> 	else</div><div class='del'>-		root = &amp;delayed_item-&gt;delayed_node-&gt;del_root;</div><div class='add'>+		root = &amp;delayed_node-&gt;del_root;</div><div class='ctx'> </div><div class='ctx'> 	rb_erase_cached(&amp;delayed_item-&gt;rb_node, root);</div><div class='del'>-	delayed_item-&gt;delayed_node-&gt;count--;</div><div class='add'>+	RB_CLEAR_NODE(&amp;delayed_item-&gt;rb_node);</div><div class='add'>+	delayed_node-&gt;count--;</div><div class='ctx'> </div><div class='ctx'> 	finish_one_item(delayed_root);</div><div class='ctx'> }</div><div class='hunk'>@@ -508,49 +476,33 @@ static void btrfs_release_delayed_item(struct btrfs_delayed_item *item)</div><div class='ctx'> static struct btrfs_delayed_item *__btrfs_first_delayed_insertion_item(</div><div class='ctx'> 					struct btrfs_delayed_node *delayed_node)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node *p;</div><div class='del'>-	struct btrfs_delayed_item *item = NULL;</div><div class='del'>-</div><div class='del'>-	p = rb_first_cached(&amp;delayed_node-&gt;ins_root);</div><div class='del'>-	if (p)</div><div class='del'>-		item = rb_entry(p, struct btrfs_delayed_item, rb_node);</div><div class='add'>+	struct rb_node *p = rb_first_cached(&amp;delayed_node-&gt;ins_root);</div><div class='ctx'> </div><div class='del'>-	return item;</div><div class='add'>+	return rb_entry_safe(p, struct btrfs_delayed_item, rb_node);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct btrfs_delayed_item *__btrfs_first_delayed_deletion_item(</div><div class='ctx'> 					struct btrfs_delayed_node *delayed_node)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node *p;</div><div class='del'>-	struct btrfs_delayed_item *item = NULL;</div><div class='add'>+	struct rb_node *p = rb_first_cached(&amp;delayed_node-&gt;del_root);</div><div class='ctx'> </div><div class='del'>-	p = rb_first_cached(&amp;delayed_node-&gt;del_root);</div><div class='del'>-	if (p)</div><div class='del'>-		item = rb_entry(p, struct btrfs_delayed_item, rb_node);</div><div class='del'>-</div><div class='del'>-	return item;</div><div class='add'>+	return rb_entry_safe(p, struct btrfs_delayed_item, rb_node);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct btrfs_delayed_item *__btrfs_next_delayed_item(</div><div class='ctx'> 						struct btrfs_delayed_item *item)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node *p;</div><div class='del'>-	struct btrfs_delayed_item *next = NULL;</div><div class='del'>-</div><div class='del'>-	p = rb_next(&amp;item-&gt;rb_node);</div><div class='del'>-	if (p)</div><div class='del'>-		next = rb_entry(p, struct btrfs_delayed_item, rb_node);</div><div class='add'>+	struct rb_node *p = rb_next(&amp;item-&gt;rb_node);</div><div class='ctx'> </div><div class='del'>-	return next;</div><div class='add'>+	return rb_entry_safe(p, struct btrfs_delayed_item, rb_node);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int btrfs_delayed_item_reserve_metadata(struct btrfs_trans_handle *trans,</div><div class='del'>-					       struct btrfs_root *root,</div><div class='ctx'> 					       struct btrfs_delayed_item *item)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_block_rsv *src_rsv;</div><div class='ctx'> 	struct btrfs_block_rsv *dst_rsv;</div><div class='del'>-	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	u64 num_bytes;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -570,9 +522,15 @@ static int btrfs_delayed_item_reserve_metadata(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	ret = btrfs_block_rsv_migrate(src_rsv, dst_rsv, num_bytes, true);</div><div class='ctx'> 	if (!ret) {</div><div class='ctx'> 		trace_btrfs_space_reservation(fs_info, "delayed_item",</div><div class='del'>-					      item-&gt;key.objectid,</div><div class='add'>+					      item-&gt;delayed_node-&gt;inode_id,</div><div class='ctx'> 					      num_bytes, 1);</div><div class='del'>-		item-&gt;bytes_reserved = num_bytes;</div><div class='add'>+		/*</div><div class='add'>+		 * For insertions we track reserved metadata space by accounting</div><div class='add'>+		 * for the number of leaves that will be used, based on the delayed</div><div class='add'>+		 * node's curr_index_batch_size and index_item_leaves fields.</div><div class='add'>+		 */</div><div class='add'>+		if (item-&gt;type == BTRFS_DELAYED_DELETION_ITEM)</div><div class='add'>+			item-&gt;bytes_reserved = num_bytes;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -593,11 +551,26 @@ static void btrfs_delayed_item_release_metadata(struct btrfs_root *root,</div><div class='ctx'> 	 * to release/reserve qgroup space.</div><div class='ctx'> 	 */</div><div class='ctx'> 	trace_btrfs_space_reservation(fs_info, "delayed_item",</div><div class='del'>-				      item-&gt;key.objectid, item-&gt;bytes_reserved,</div><div class='del'>-				      0);</div><div class='add'>+				      item-&gt;delayed_node-&gt;inode_id,</div><div class='add'>+				      item-&gt;bytes_reserved, 0);</div><div class='ctx'> 	btrfs_block_rsv_release(fs_info, rsv, item-&gt;bytes_reserved, NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void btrfs_delayed_item_release_leaves(struct btrfs_delayed_node *node,</div><div class='add'>+					      unsigned int num_leaves)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = node-&gt;root-&gt;fs_info;</div><div class='add'>+	const u64 bytes = btrfs_calc_insert_metadata_size(fs_info, num_leaves);</div><div class='add'>+</div><div class='add'>+	/* There are no space reservations during log replay, bail out. */</div><div class='add'>+	if (test_bit(BTRFS_FS_LOG_RECOVERING, &amp;fs_info-&gt;flags))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	trace_btrfs_space_reservation(fs_info, "delayed_item", node-&gt;inode_id,</div><div class='add'>+				      bytes, 0);</div><div class='add'>+	btrfs_block_rsv_release(fs_info, &amp;fs_info-&gt;delayed_block_rsv, bytes, NULL);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int btrfs_delayed_inode_reserve_metadata(</div><div class='ctx'> 					struct btrfs_trans_handle *trans,</div><div class='ctx'> 					struct btrfs_root *root,</div><div class='hunk'>@@ -629,7 +602,7 @@ static int btrfs_delayed_inode_reserve_metadata(</div><div class='ctx'> 					  BTRFS_QGROUP_RSV_META_PREALLOC, true);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			return ret;</div><div class='del'>-		ret = btrfs_block_rsv_add(root, dst_rsv, num_bytes,</div><div class='add'>+		ret = btrfs_block_rsv_add(fs_info, dst_rsv, num_bytes,</div><div class='ctx'> 					  BTRFS_RESERVE_NO_FLUSH);</div><div class='ctx'> 		/* NO_FLUSH could only fail with -ENOSPC */</div><div class='ctx'> 		ASSERT(ret == 0 || ret == -ENOSPC);</div><div class='hunk'>@@ -671,36 +644,78 @@ static void btrfs_delayed_inode_release_metadata(struct btrfs_fs_info *fs_info,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Insert a single delayed item or a batch of delayed items that have consecutive</div><div class='del'>- * keys if they exist.</div><div class='add'>+ * Insert a single delayed item or a batch of delayed items, as many as possible</div><div class='add'>+ * that fit in a leaf. The delayed items (dir index keys) are sorted by their key</div><div class='add'>+ * in the rbtree, and if there's a gap between two consecutive dir index items,</div><div class='add'>+ * then it means at some point we had delayed dir indexes to add but they got</div><div class='add'>+ * removed (by btrfs_delete_delayed_dir_index()) before we attempted to flush them</div><div class='add'>+ * into the subvolume tree. Dir index keys also have their offsets coming from a</div><div class='add'>+ * monotonically increasing counter, so we can't get new keys with an offset that</div><div class='add'>+ * fits within a gap between delayed dir index items.</div><div class='ctx'>  */</div><div class='ctx'> static int btrfs_insert_delayed_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				     struct btrfs_root *root,</div><div class='ctx'> 				     struct btrfs_path *path,</div><div class='ctx'> 				     struct btrfs_delayed_item *first_item)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+	struct btrfs_delayed_node *node = first_item-&gt;delayed_node;</div><div class='ctx'> 	LIST_HEAD(item_list);</div><div class='ctx'> 	struct btrfs_delayed_item *curr;</div><div class='ctx'> 	struct btrfs_delayed_item *next;</div><div class='del'>-	const int max_size = BTRFS_LEAF_DATA_SIZE(root-&gt;fs_info);</div><div class='add'>+	const int max_size = BTRFS_LEAF_DATA_SIZE(fs_info);</div><div class='ctx'> 	struct btrfs_item_batch batch;</div><div class='add'>+	struct btrfs_key first_key;</div><div class='add'>+	const u32 first_data_size = first_item-&gt;data_len;</div><div class='ctx'> 	int total_size;</div><div class='del'>-	char *ins_data = NULL;</div><div class='add'>+	char AUTO_KFREE(ins_data);</div><div class='ctx'> 	int ret;</div><div class='add'>+	bool continuous_keys_only = false;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held(&amp;node-&gt;mutex);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * During normal operation the delayed index offset is continuously</div><div class='add'>+	 * increasing, so we can batch insert all items as there will not be any</div><div class='add'>+	 * overlapping keys in the tree.</div><div class='add'>+	 *</div><div class='add'>+	 * The exception to this is log replay, where we may have interleaved</div><div class='add'>+	 * offsets in the tree, so our batch needs to be continuous keys only in</div><div class='add'>+	 * order to ensure we do not end up with out of order items in our leaf.</div><div class='add'>+	 */</div><div class='add'>+	if (test_bit(BTRFS_FS_LOG_RECOVERING, &amp;fs_info-&gt;flags))</div><div class='add'>+		continuous_keys_only = true;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * For delayed items to insert, we track reserved metadata bytes based</div><div class='add'>+	 * on the number of leaves that we will use.</div><div class='add'>+	 * See btrfs_insert_delayed_dir_index() and</div><div class='add'>+	 * btrfs_delayed_item_reserve_metadata()).</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(first_item-&gt;bytes_reserved == 0);</div><div class='ctx'> </div><div class='ctx'> 	list_add_tail(&amp;first_item-&gt;tree_list, &amp;item_list);</div><div class='del'>-	batch.total_data_size = first_item-&gt;data_len;</div><div class='add'>+	batch.total_data_size = first_data_size;</div><div class='ctx'> 	batch.nr = 1;</div><div class='del'>-	total_size = first_item-&gt;data_len + sizeof(struct btrfs_item);</div><div class='add'>+	total_size = first_data_size + sizeof(struct btrfs_item);</div><div class='ctx'> 	curr = first_item;</div><div class='ctx'> </div><div class='ctx'> 	while (true) {</div><div class='ctx'> 		int next_size;</div><div class='ctx'> </div><div class='ctx'> 		next = __btrfs_next_delayed_item(curr);</div><div class='del'>-		if (!next || !btrfs_is_continuous_delayed_item(curr, next))</div><div class='add'>+		if (!next)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='add'>+		/*</div><div class='add'>+		 * We cannot allow gaps in the key space if we're doing log</div><div class='add'>+		 * replay.</div><div class='add'>+		 */</div><div class='add'>+		if (continuous_keys_only &amp;&amp; (next-&gt;index != curr-&gt;index + 1))</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		ASSERT(next-&gt;bytes_reserved == 0);</div><div class='add'>+</div><div class='ctx'> 		next_size = next-&gt;data_len + sizeof(struct btrfs_item);</div><div class='ctx'> 		if (total_size + next_size &gt; max_size)</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -713,25 +728,28 @@ static int btrfs_insert_delayed_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (batch.nr == 1) {</div><div class='del'>-		batch.keys = &amp;first_item-&gt;key;</div><div class='del'>-		batch.data_sizes = &amp;first_item-&gt;data_len;</div><div class='add'>+		first_key.objectid = node-&gt;inode_id;</div><div class='add'>+		first_key.type = BTRFS_DIR_INDEX_KEY;</div><div class='add'>+		first_key.offset = first_item-&gt;index;</div><div class='add'>+		batch.keys = &amp;first_key;</div><div class='add'>+		batch.data_sizes = &amp;first_data_size;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		struct btrfs_key *ins_keys;</div><div class='ctx'> 		u32 *ins_sizes;</div><div class='ctx'> 		int i = 0;</div><div class='ctx'> </div><div class='del'>-		ins_data = kmalloc(batch.nr * sizeof(u32) +</div><div class='del'>-				   batch.nr * sizeof(struct btrfs_key), GFP_NOFS);</div><div class='del'>-		if (!ins_data) {</div><div class='del'>-			ret = -ENOMEM;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+		ins_data = kmalloc_array(batch.nr,</div><div class='add'>+					 sizeof(u32) + sizeof(struct btrfs_key), GFP_NOFS);</div><div class='add'>+		if (!ins_data)</div><div class='add'>+			return -ENOMEM;</div><div class='ctx'> 		ins_sizes = (u32 *)ins_data;</div><div class='ctx'> 		ins_keys = (struct btrfs_key *)(ins_data + batch.nr * sizeof(u32));</div><div class='ctx'> 		batch.keys = ins_keys;</div><div class='ctx'> 		batch.data_sizes = ins_sizes;</div><div class='ctx'> 		list_for_each_entry(curr, &amp;item_list, tree_list) {</div><div class='del'>-			ins_keys[i] = curr-&gt;key;</div><div class='add'>+			ins_keys[i].objectid = node-&gt;inode_id;</div><div class='add'>+			ins_keys[i].type = BTRFS_DIR_INDEX_KEY;</div><div class='add'>+			ins_keys[i].offset = curr-&gt;index;</div><div class='ctx'> 			ins_sizes[i] = curr-&gt;data_len;</div><div class='ctx'> 			i++;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -739,7 +757,7 @@ static int btrfs_insert_delayed_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_insert_empty_items(trans, root, path, &amp;batch);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(curr, &amp;item_list, tree_list) {</div><div class='ctx'> 		char *data_ptr;</div><div class='hunk'>@@ -757,14 +775,45 @@ static int btrfs_insert_delayed_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 */</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='add'>+	ASSERT(node-&gt;index_item_leaves &gt; 0);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * For normal operations we will batch an entire leaf's worth of delayed</div><div class='add'>+	 * items, so if there are more items to process we can decrement</div><div class='add'>+	 * index_item_leaves by 1 as we inserted 1 leaf's worth of items.</div><div class='add'>+	 *</div><div class='add'>+	 * However for log replay we may not have inserted an entire leaf's</div><div class='add'>+	 * worth of items, we may have not had continuous items, so decrementing</div><div class='add'>+	 * here would mess up the index_item_leaves accounting.  For this case</div><div class='add'>+	 * only clean up the accounting when there are no items left.</div><div class='add'>+	 */</div><div class='add'>+	if (next &amp;&amp; !continuous_keys_only) {</div><div class='add'>+		/*</div><div class='add'>+		 * We inserted one batch of items into a leaf a there are more</div><div class='add'>+		 * items to flush in a future batch, now release one unit of</div><div class='add'>+		 * metadata space from the delayed block reserve, corresponding</div><div class='add'>+		 * the leaf we just flushed to.</div><div class='add'>+		 */</div><div class='add'>+		btrfs_delayed_item_release_leaves(node, 1);</div><div class='add'>+		node-&gt;index_item_leaves--;</div><div class='add'>+	} else if (!next) {</div><div class='add'>+		/*</div><div class='add'>+		 * There are no more items to insert. We can have a number of</div><div class='add'>+		 * reserved leaves &gt; 1 here - this happens when many dir index</div><div class='add'>+		 * items are added and then removed before they are flushed (file</div><div class='add'>+		 * names with a very short life, never span a transaction). So</div><div class='add'>+		 * release all remaining leaves.</div><div class='add'>+		 */</div><div class='add'>+		btrfs_delayed_item_release_leaves(node, node-&gt;index_item_leaves);</div><div class='add'>+		node-&gt;index_item_leaves = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	list_for_each_entry_safe(curr, next, &amp;item_list, tree_list) {</div><div class='ctx'> 		list_del(&amp;curr-&gt;tree_list);</div><div class='del'>-		btrfs_delayed_item_release_metadata(root, curr);</div><div class='ctx'> 		btrfs_release_delayed_item(curr);</div><div class='ctx'> 	}</div><div class='del'>-out:</div><div class='del'>-	kfree(ins_data);</div><div class='del'>-	return ret;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int btrfs_insert_delayed_items(struct btrfs_trans_handle *trans,</div><div class='hunk'>@@ -795,62 +844,77 @@ static int btrfs_batch_delete_items(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				    struct btrfs_path *path,</div><div class='ctx'> 				    struct btrfs_delayed_item *item)</div><div class='ctx'> {</div><div class='add'>+	const u64 ino = item-&gt;delayed_node-&gt;inode_id;</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_delayed_item *curr, *next;</div><div class='del'>-	struct extent_buffer *leaf;</div><div class='del'>-	struct btrfs_key key;</div><div class='del'>-	struct list_head head;</div><div class='del'>-	int nitems, i, last_item;</div><div class='del'>-	int ret = 0;</div><div class='add'>+	struct extent_buffer *leaf = path-&gt;nodes[0];</div><div class='add'>+	LIST_HEAD(batch_list);</div><div class='add'>+	int nitems, slot, last_slot;</div><div class='add'>+	int ret;</div><div class='add'>+	u64 total_reserved_size = item-&gt;bytes_reserved;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(!path-&gt;nodes[0]);</div><div class='add'>+	ASSERT(leaf != NULL);</div><div class='ctx'> </div><div class='del'>-	leaf = path-&gt;nodes[0];</div><div class='add'>+	slot = path-&gt;slots[0];</div><div class='add'>+	last_slot = btrfs_header_nritems(leaf) - 1;</div><div class='add'>+	/*</div><div class='add'>+	 * Our caller always gives us a path pointing to an existing item, so</div><div class='add'>+	 * this can not happen.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(slot &lt;= last_slot);</div><div class='add'>+	if (WARN_ON(slot &gt; last_slot))</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> </div><div class='del'>-	i = path-&gt;slots[0];</div><div class='del'>-	last_item = btrfs_header_nritems(leaf) - 1;</div><div class='del'>-	if (i &gt; last_item)</div><div class='del'>-		return -ENOENT;	/* FIXME: Is errno suitable? */</div><div class='add'>+	nitems = 1;</div><div class='add'>+	curr = item;</div><div class='add'>+	list_add_tail(&amp;curr-&gt;tree_list, &amp;batch_list);</div><div class='ctx'> </div><div class='del'>-	next = item;</div><div class='del'>-	INIT_LIST_HEAD(&amp;head);</div><div class='del'>-	btrfs_item_key_to_cpu(leaf, &amp;key, i);</div><div class='del'>-	nitems = 0;</div><div class='ctx'> 	/*</div><div class='del'>-	 * count the number of the dir index items that we can delete in batch</div><div class='add'>+	 * Keep checking if the next delayed item matches the next item in the</div><div class='add'>+	 * leaf - if so, we can add it to the batch of items to delete from the</div><div class='add'>+	 * leaf.</div><div class='ctx'> 	 */</div><div class='del'>-	while (btrfs_comp_cpu_keys(&amp;next-&gt;key, &amp;key) == 0) {</div><div class='del'>-		list_add_tail(&amp;next-&gt;tree_list, &amp;head);</div><div class='del'>-		nitems++;</div><div class='add'>+	while (slot &lt; last_slot) {</div><div class='add'>+		struct btrfs_key key;</div><div class='ctx'> </div><div class='del'>-		curr = next;</div><div class='ctx'> 		next = __btrfs_next_delayed_item(curr);</div><div class='ctx'> 		if (!next)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		if (!btrfs_is_continuous_delayed_item(curr, next))</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		i++;</div><div class='del'>-		if (i &gt; last_item)</div><div class='add'>+		slot++;</div><div class='add'>+		btrfs_item_key_to_cpu(leaf, &amp;key, slot);</div><div class='add'>+		if (key.objectid != ino ||</div><div class='add'>+		    key.type != BTRFS_DIR_INDEX_KEY ||</div><div class='add'>+		    key.offset != next-&gt;index)</div><div class='ctx'> 			break;</div><div class='del'>-		btrfs_item_key_to_cpu(leaf, &amp;key, i);</div><div class='add'>+		nitems++;</div><div class='add'>+		curr = next;</div><div class='add'>+		list_add_tail(&amp;curr-&gt;tree_list, &amp;batch_list);</div><div class='add'>+		total_reserved_size += curr-&gt;bytes_reserved;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!nitems)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='ctx'> 	ret = btrfs_del_items(trans, root, path, path-&gt;slots[0], nitems);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	/* In case of BTRFS_FS_LOG_RECOVERING items won't have reserved space */</div><div class='add'>+	if (total_reserved_size &gt; 0) {</div><div class='add'>+		/*</div><div class='add'>+		 * Check btrfs_delayed_item_reserve_metadata() to see why we</div><div class='add'>+		 * don't need to release/reserve qgroup space.</div><div class='add'>+		 */</div><div class='add'>+		trace_btrfs_space_reservation(fs_info, "delayed_item", ino,</div><div class='add'>+					      total_reserved_size, 0);</div><div class='add'>+		btrfs_block_rsv_release(fs_info, &amp;fs_info-&gt;delayed_block_rsv,</div><div class='add'>+					total_reserved_size, NULL);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry_safe(curr, next, &amp;head, tree_list) {</div><div class='del'>-		btrfs_delayed_item_release_metadata(root, curr);</div><div class='add'>+	list_for_each_entry_safe(curr, next, &amp;batch_list, tree_list) {</div><div class='ctx'> 		list_del(&amp;curr-&gt;tree_list);</div><div class='ctx'> 		btrfs_release_delayed_item(curr);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int btrfs_delete_delayed_items(struct btrfs_trans_handle *trans,</div><div class='hunk'>@@ -858,43 +922,57 @@ static int btrfs_delete_delayed_items(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				      struct btrfs_root *root,</div><div class='ctx'> 				      struct btrfs_delayed_node *node)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_delayed_item *curr, *prev;</div><div class='add'>+	struct btrfs_key key;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-do_again:</div><div class='del'>-	mutex_lock(&amp;node-&gt;mutex);</div><div class='del'>-	curr = __btrfs_first_delayed_deletion_item(node);</div><div class='del'>-	if (!curr)</div><div class='del'>-		goto delete_fail;</div><div class='add'>+	key.objectid = node-&gt;inode_id;</div><div class='add'>+	key.type = BTRFS_DIR_INDEX_KEY;</div><div class='add'>+</div><div class='add'>+	while (ret == 0) {</div><div class='add'>+		struct btrfs_delayed_item *item;</div><div class='add'>+</div><div class='add'>+		mutex_lock(&amp;node-&gt;mutex);</div><div class='add'>+		item = __btrfs_first_delayed_deletion_item(node);</div><div class='add'>+		if (!item) {</div><div class='add'>+			mutex_unlock(&amp;node-&gt;mutex);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		key.offset = item-&gt;index;</div><div class='add'>+		ret = btrfs_search_slot(trans, root, &amp;key, path, -1, 1);</div><div class='add'>+		if (ret &gt; 0) {</div><div class='add'>+			/*</div><div class='add'>+			 * There's no matching item in the leaf. This means we</div><div class='add'>+			 * have already deleted this item in a past run of the</div><div class='add'>+			 * delayed items. We ignore errors when running delayed</div><div class='add'>+			 * items from an async context, through a work queue job</div><div class='add'>+			 * running btrfs_async_run_delayed_root(), and don't</div><div class='add'>+			 * release delayed items that failed to complete. This</div><div class='add'>+			 * is because we will retry later, and at transaction</div><div class='add'>+			 * commit time we always run delayed items and will</div><div class='add'>+			 * then deal with errors if they fail to run again.</div><div class='add'>+			 *</div><div class='add'>+			 * So just release delayed items for which we can't find</div><div class='add'>+			 * an item in the tree, and move to the next item.</div><div class='add'>+			 */</div><div class='add'>+			btrfs_release_path(path);</div><div class='add'>+			btrfs_release_delayed_item(item);</div><div class='add'>+			ret = 0;</div><div class='add'>+		} else if (ret == 0) {</div><div class='add'>+			ret = btrfs_batch_delete_items(trans, root, path, item);</div><div class='add'>+			btrfs_release_path(path);</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_search_slot(trans, root, &amp;curr-&gt;key, path, -1, 1);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto delete_fail;</div><div class='del'>-	else if (ret &gt; 0) {</div><div class='ctx'> 		/*</div><div class='del'>-		 * can't find the item which the node points to, so this node</div><div class='del'>-		 * is invalid, just drop it.</div><div class='add'>+		 * We unlock and relock on each iteration, this is to prevent</div><div class='add'>+		 * blocking other tasks for too long while we are being run from</div><div class='add'>+		 * the async context (work queue job). Those tasks are typically</div><div class='add'>+		 * running system calls like creat/mkdir/rename/unlink/etc which</div><div class='add'>+		 * need to add delayed items to this delayed node.</div><div class='ctx'> 		 */</div><div class='del'>-		prev = curr;</div><div class='del'>-		curr = __btrfs_next_delayed_item(prev);</div><div class='del'>-		btrfs_release_delayed_item(prev);</div><div class='del'>-		ret = 0;</div><div class='del'>-		btrfs_release_path(path);</div><div class='del'>-		if (curr) {</div><div class='del'>-			mutex_unlock(&amp;node-&gt;mutex);</div><div class='del'>-			goto do_again;</div><div class='del'>-		} else</div><div class='del'>-			goto delete_fail;</div><div class='add'>+		mutex_unlock(&amp;node-&gt;mutex);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_batch_delete_items(trans, root, path, curr);</div><div class='del'>-	btrfs_release_path(path);</div><div class='del'>-	mutex_unlock(&amp;node-&gt;mutex);</div><div class='del'>-	goto do_again;</div><div class='del'>-</div><div class='del'>-delete_fail:</div><div class='del'>-	btrfs_release_path(path);</div><div class='del'>-	mutex_unlock(&amp;node-&gt;mutex);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -904,7 +982,7 @@ static void btrfs_release_delayed_inode(struct btrfs_delayed_node *delayed_node)</div><div class='ctx'> </div><div class='ctx'> 	if (delayed_node &amp;&amp;</div><div class='ctx'> 	    test_bit(BTRFS_DELAYED_NODE_INODE_DIRTY, &amp;delayed_node-&gt;flags)) {</div><div class='del'>-		BUG_ON(!delayed_node-&gt;root);</div><div class='add'>+		ASSERT(delayed_node-&gt;root);</div><div class='ctx'> 		clear_bit(BTRFS_DELAYED_NODE_INODE_DIRTY, &amp;delayed_node-&gt;flags);</div><div class='ctx'> 		delayed_node-&gt;count--;</div><div class='ctx'> </div><div class='hunk'>@@ -951,27 +1029,55 @@ static int __btrfs_update_delayed_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	ret = btrfs_lookup_inode(trans, root, path, &amp;key, mod);</div><div class='ctx'> 	if (ret &gt; 0)</div><div class='ctx'> 		ret = -ENOENT;</div><div class='del'>-	if (ret &lt; 0)</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		/*</div><div class='add'>+		 * If we fail to update the delayed inode we need to abort the</div><div class='add'>+		 * transaction, because we could leave the inode with the</div><div class='add'>+		 * improper counts behind.</div><div class='add'>+		 */</div><div class='add'>+		if (unlikely(ret != -ENOENT))</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	inode_item = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='ctx'> 				    struct btrfs_inode_item);</div><div class='ctx'> 	write_extent_buffer(leaf, &amp;node-&gt;inode_item, (unsigned long)inode_item,</div><div class='ctx'> 			    sizeof(struct btrfs_inode_item));</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> </div><div class='ctx'> 	if (!test_bit(BTRFS_DELAYED_NODE_DEL_IREF, &amp;node-&gt;flags))</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	path-&gt;slots[0]++;</div><div class='del'>-	if (path-&gt;slots[0] &gt;= btrfs_header_nritems(leaf))</div><div class='del'>-		goto search;</div><div class='del'>-again:</div><div class='add'>+	/*</div><div class='add'>+	 * Now we're going to delete the INODE_REF/EXTREF, which should be the</div><div class='add'>+	 * only one ref left.  Check if the next item is an INODE_REF/EXTREF.</div><div class='add'>+	 *</div><div class='add'>+	 * But if we're the last item already, release and search for the last</div><div class='add'>+	 * INODE_REF/EXTREF.</div><div class='add'>+	 */</div><div class='add'>+	if (path-&gt;slots[0] + 1 &gt;= btrfs_header_nritems(leaf)) {</div><div class='add'>+		key.objectid = node-&gt;inode_id;</div><div class='add'>+		key.type = BTRFS_INODE_EXTREF_KEY;</div><div class='add'>+		key.offset = (u64)-1;</div><div class='add'>+</div><div class='add'>+		btrfs_release_path(path);</div><div class='add'>+		ret = btrfs_search_slot(trans, root, &amp;key, path, -1, 1);</div><div class='add'>+		if (unlikely(ret &lt; 0)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			goto err_out;</div><div class='add'>+		}</div><div class='add'>+		ASSERT(ret &gt; 0);</div><div class='add'>+		ASSERT(path-&gt;slots[0] &gt; 0);</div><div class='add'>+		ret = 0;</div><div class='add'>+		path-&gt;slots[0]--;</div><div class='add'>+		leaf = path-&gt;nodes[0];</div><div class='add'>+	} else {</div><div class='add'>+		path-&gt;slots[0]++;</div><div class='add'>+	}</div><div class='ctx'> 	btrfs_item_key_to_cpu(leaf, &amp;key, path-&gt;slots[0]);</div><div class='ctx'> 	if (key.objectid != node-&gt;inode_id)</div><div class='ctx'> 		goto out;</div><div class='del'>-</div><div class='ctx'> 	if (key.type != BTRFS_INODE_REF_KEY &amp;&amp;</div><div class='ctx'> 	    key.type != BTRFS_INODE_EXTREF_KEY)</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -981,39 +1087,16 @@ again:</div><div class='ctx'> 	 * so there is only one iref. The case that several irefs are</div><div class='ctx'> 	 * in the same item doesn't exist.</div><div class='ctx'> 	 */</div><div class='del'>-	btrfs_del_item(trans, root, path);</div><div class='add'>+	ret = btrfs_del_item(trans, root, path);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> out:</div><div class='ctx'> 	btrfs_release_delayed_iref(node);</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> err_out:</div><div class='ctx'> 	btrfs_delayed_inode_release_metadata(fs_info, node, (ret &lt; 0));</div><div class='ctx'> 	btrfs_release_delayed_inode(node);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If we fail to update the delayed inode we need to abort the</div><div class='del'>-	 * transaction, because we could leave the inode with the improper</div><div class='del'>-	 * counts behind.</div><div class='del'>-	 */</div><div class='del'>-	if (ret &amp;&amp; ret != -ENOENT)</div><div class='del'>-		btrfs_abort_transaction(trans, ret);</div><div class='del'>-</div><div class='ctx'> 	return ret;</div><div class='del'>-</div><div class='del'>-search:</div><div class='del'>-	btrfs_release_path(path);</div><div class='del'>-</div><div class='del'>-	key.type = BTRFS_INODE_EXTREF_KEY;</div><div class='del'>-	key.offset = -1;</div><div class='del'>-</div><div class='del'>-	ret = btrfs_search_slot(trans, root, &amp;key, path, -1, 1);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto err_out;</div><div class='del'>-	ASSERT(ret);</div><div class='del'>-</div><div class='del'>-	ret = 0;</div><div class='del'>-	leaf = path-&gt;nodes[0];</div><div class='del'>-	path-&gt;slots[0]--;</div><div class='del'>-	goto again;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int btrfs_update_delayed_inode(struct btrfs_trans_handle *trans,</div><div class='hunk'>@@ -1049,6 +1132,9 @@ __btrfs_commit_inode_delayed_items(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='add'>+	ret = btrfs_record_root_in_trans(trans, node-&gt;root);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='ctx'> 	ret = btrfs_update_delayed_inode(trans, node-&gt;root, path, node);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -1064,6 +1150,7 @@ static int __btrfs_run_delayed_items(struct btrfs_trans_handle *trans, int nr)</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_delayed_root *delayed_root;</div><div class='ctx'> 	struct btrfs_delayed_node *curr_node, *prev_node;</div><div class='add'>+	struct btrfs_ref_tracker curr_delayed_node_tracker, prev_delayed_node_tracker;</div><div class='ctx'> 	struct btrfs_path *path;</div><div class='ctx'> 	struct btrfs_block_rsv *block_rsv;</div><div class='ctx'> 	int ret = 0;</div><div class='hunk'>@@ -1081,25 +1168,39 @@ static int __btrfs_run_delayed_items(struct btrfs_trans_handle *trans, int nr)</div><div class='ctx'> </div><div class='ctx'> 	delayed_root = fs_info-&gt;delayed_root;</div><div class='ctx'> </div><div class='del'>-	curr_node = btrfs_first_delayed_node(delayed_root);</div><div class='add'>+	curr_node = btrfs_first_delayed_node(delayed_root, &amp;curr_delayed_node_tracker);</div><div class='ctx'> 	while (curr_node &amp;&amp; (!count || nr--)) {</div><div class='ctx'> 		ret = __btrfs_commit_inode_delayed_items(trans, path,</div><div class='ctx'> 							 curr_node);</div><div class='del'>-		if (ret) {</div><div class='del'>-			btrfs_release_delayed_node(curr_node);</div><div class='del'>-			curr_node = NULL;</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		prev_node = curr_node;</div><div class='del'>-		curr_node = btrfs_next_delayed_node(curr_node);</div><div class='del'>-		btrfs_release_delayed_node(prev_node);</div><div class='add'>+		prev_delayed_node_tracker = curr_delayed_node_tracker;</div><div class='add'>+		curr_node = btrfs_next_delayed_node(curr_node, &amp;curr_delayed_node_tracker);</div><div class='add'>+		/*</div><div class='add'>+		 * See the comment below about releasing path before releasing</div><div class='add'>+		 * node. If the commit of delayed items was successful the path</div><div class='add'>+		 * should always be released, but in case of an error, it may</div><div class='add'>+		 * point to locked extent buffers (a leaf at the very least).</div><div class='add'>+		 */</div><div class='add'>+		ASSERT(path-&gt;nodes[0] == NULL);</div><div class='add'>+		btrfs_release_delayed_node(prev_node, &amp;prev_delayed_node_tracker);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (curr_node)</div><div class='del'>-		btrfs_release_delayed_node(curr_node);</div><div class='add'>+	/*</div><div class='add'>+	 * Release the path to avoid a potential deadlock and lockdep splat when</div><div class='add'>+	 * releasing the delayed node, as that requires taking the delayed node's</div><div class='add'>+	 * mutex. If another task starts running delayed items before we take</div><div class='add'>+	 * the mutex, it will first lock the mutex and then it may try to lock</div><div class='add'>+	 * the same btree path (leaf).</div><div class='add'>+	 */</div><div class='ctx'> 	btrfs_free_path(path);</div><div class='add'>+</div><div class='add'>+	if (curr_node)</div><div class='add'>+		btrfs_release_delayed_node(curr_node, &amp;curr_delayed_node_tracker);</div><div class='ctx'> 	trans-&gt;block_rsv = block_rsv;</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -1118,8 +1219,10 @@ int btrfs_run_delayed_items_nr(struct btrfs_trans_handle *trans, int nr)</div><div class='ctx'> int btrfs_commit_inode_delayed_items(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				     struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_delayed_node *delayed_node = btrfs_get_delayed_node(inode);</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	struct btrfs_ref_tracker delayed_node_tracker;</div><div class='add'>+	struct btrfs_delayed_node *delayed_node =</div><div class='add'>+		btrfs_get_delayed_node(inode, &amp;delayed_node_tracker);</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_block_rsv *block_rsv;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -1129,14 +1232,14 @@ int btrfs_commit_inode_delayed_items(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	mutex_lock(&amp;delayed_node-&gt;mutex);</div><div class='ctx'> 	if (!delayed_node-&gt;count) {</div><div class='ctx'> 		mutex_unlock(&amp;delayed_node-&gt;mutex);</div><div class='del'>-		btrfs_release_delayed_node(delayed_node);</div><div class='add'>+		btrfs_release_delayed_node(delayed_node, &amp;delayed_node_tracker);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> 	mutex_unlock(&amp;delayed_node-&gt;mutex);</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path) {</div><div class='del'>-		btrfs_release_delayed_node(delayed_node);</div><div class='add'>+		btrfs_release_delayed_node(delayed_node, &amp;delayed_node_tracker);</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1145,8 +1248,7 @@ int btrfs_commit_inode_delayed_items(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	ret = __btrfs_commit_inode_delayed_items(trans, path, delayed_node);</div><div class='ctx'> </div><div class='del'>-	btrfs_release_delayed_node(delayed_node);</div><div class='del'>-	btrfs_free_path(path);</div><div class='add'>+	btrfs_release_delayed_node(delayed_node, &amp;delayed_node_tracker);</div><div class='ctx'> 	trans-&gt;block_rsv = block_rsv;</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -1156,18 +1258,20 @@ int btrfs_commit_inode_delayed_inode(struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='del'>-	struct btrfs_delayed_node *delayed_node = btrfs_get_delayed_node(inode);</div><div class='add'>+	struct btrfs_ref_tracker delayed_node_tracker;</div><div class='add'>+	struct btrfs_delayed_node *delayed_node;</div><div class='ctx'> 	struct btrfs_path *path;</div><div class='ctx'> 	struct btrfs_block_rsv *block_rsv;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='add'>+	delayed_node = btrfs_get_delayed_node(inode, &amp;delayed_node_tracker);</div><div class='ctx'> 	if (!delayed_node)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;delayed_node-&gt;mutex);</div><div class='ctx'> 	if (!test_bit(BTRFS_DELAYED_NODE_INODE_DIRTY, &amp;delayed_node-&gt;flags)) {</div><div class='ctx'> 		mutex_unlock(&amp;delayed_node-&gt;mutex);</div><div class='del'>-		btrfs_release_delayed_node(delayed_node);</div><div class='add'>+		btrfs_release_delayed_node(delayed_node, &amp;delayed_node_tracker);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> 	mutex_unlock(&amp;delayed_node-&gt;mutex);</div><div class='hunk'>@@ -1201,7 +1305,7 @@ trans_out:</div><div class='ctx'> 	btrfs_end_transaction(trans);</div><div class='ctx'> 	btrfs_btree_balance_dirty(fs_info);</div><div class='ctx'> out:</div><div class='del'>-	btrfs_release_delayed_node(delayed_node);</div><div class='add'>+	btrfs_release_delayed_node(delayed_node, &amp;delayed_node_tracker);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -1215,7 +1319,8 @@ void btrfs_remove_delayed_node(struct btrfs_inode *inode)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;delayed_node = NULL;</div><div class='del'>-	btrfs_release_delayed_node(delayed_node);</div><div class='add'>+</div><div class='add'>+	btrfs_release_delayed_node(delayed_node, &amp;delayed_node-&gt;inode_cache_tracker);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct btrfs_async_delayed_work {</div><div class='hunk'>@@ -1231,6 +1336,7 @@ static void btrfs_async_run_delayed_root(struct btrfs_work *work)</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	struct btrfs_path *path;</div><div class='ctx'> 	struct btrfs_delayed_node *delayed_node = NULL;</div><div class='add'>+	struct btrfs_ref_tracker delayed_node_tracker;</div><div class='ctx'> 	struct btrfs_root *root;</div><div class='ctx'> 	struct btrfs_block_rsv *block_rsv;</div><div class='ctx'> 	int total_done = 0;</div><div class='hunk'>@@ -1247,7 +1353,8 @@ static void btrfs_async_run_delayed_root(struct btrfs_work *work)</div><div class='ctx'> 		    BTRFS_DELAYED_BACKGROUND / 2)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		delayed_node = btrfs_first_prepared_delayed_node(delayed_root);</div><div class='add'>+		delayed_node = btrfs_first_prepared_delayed_node(delayed_root,</div><div class='add'>+								 &amp;delayed_node_tracker);</div><div class='ctx'> 		if (!delayed_node)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='hunk'>@@ -1256,7 +1363,8 @@ static void btrfs_async_run_delayed_root(struct btrfs_work *work)</div><div class='ctx'> 		trans = btrfs_join_transaction(root);</div><div class='ctx'> 		if (IS_ERR(trans)) {</div><div class='ctx'> 			btrfs_release_path(path);</div><div class='del'>-			btrfs_release_prepared_delayed_node(delayed_node);</div><div class='add'>+			btrfs_release_prepared_delayed_node(delayed_node,</div><div class='add'>+							    &amp;delayed_node_tracker);</div><div class='ctx'> 			total_done++;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1271,7 +1379,8 @@ static void btrfs_async_run_delayed_root(struct btrfs_work *work)</div><div class='ctx'> 		btrfs_btree_balance_dirty_nodelay(root-&gt;fs_info);</div><div class='ctx'> </div><div class='ctx'> 		btrfs_release_path(path);</div><div class='del'>-		btrfs_release_prepared_delayed_node(delayed_node);</div><div class='add'>+		btrfs_release_prepared_delayed_node(delayed_node,</div><div class='add'>+						    &amp;delayed_node_tracker);</div><div class='ctx'> 		total_done++;</div><div class='ctx'> </div><div class='ctx'> 	} while ((async_work-&gt;nr == 0 &amp;&amp; total_done &lt; BTRFS_DELAYED_WRITEBACK)</div><div class='hunk'>@@ -1294,8 +1403,7 @@ static int btrfs_wq_run_delayed_node(struct btrfs_delayed_root *delayed_root,</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	async_work-&gt;delayed_root = delayed_root;</div><div class='del'>-	btrfs_init_work(&amp;async_work-&gt;work, btrfs_async_run_delayed_root, NULL,</div><div class='del'>-			NULL);</div><div class='add'>+	btrfs_init_work(&amp;async_work-&gt;work, btrfs_async_run_delayed_root, NULL);</div><div class='ctx'> 	async_work-&gt;nr = nr;</div><div class='ctx'> </div><div class='ctx'> 	btrfs_queue_work(fs_info-&gt;delayed_workers, &amp;async_work-&gt;work);</div><div class='hunk'>@@ -1304,20 +1412,28 @@ static int btrfs_wq_run_delayed_node(struct btrfs_delayed_root *delayed_root,</div><div class='ctx'> </div><div class='ctx'> void btrfs_assert_delayed_root_empty(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	WARN_ON(btrfs_first_delayed_node(fs_info-&gt;delayed_root));</div><div class='add'>+	struct btrfs_ref_tracker delayed_node_tracker;</div><div class='add'>+	struct btrfs_delayed_node *node;</div><div class='add'>+</div><div class='add'>+	node = btrfs_first_delayed_node( fs_info-&gt;delayed_root, &amp;delayed_node_tracker);</div><div class='add'>+	if (WARN_ON(node)) {</div><div class='add'>+		btrfs_delayed_node_ref_tracker_free(node,</div><div class='add'>+						    &amp;delayed_node_tracker);</div><div class='add'>+		refcount_dec(&amp;node-&gt;refs);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int could_end_wait(struct btrfs_delayed_root *delayed_root, int seq)</div><div class='add'>+static bool could_end_wait(struct btrfs_delayed_root *delayed_root, int seq)</div><div class='ctx'> {</div><div class='ctx'> 	int val = atomic_read(&amp;delayed_root-&gt;items_seq);</div><div class='ctx'> </div><div class='ctx'> 	if (val &lt; seq || val &gt;= seq + BTRFS_DELAYED_BATCH)</div><div class='del'>-		return 1;</div><div class='add'>+		return true;</div><div class='ctx'> </div><div class='ctx'> 	if (atomic_read(&amp;delayed_root-&gt;items) &lt; BTRFS_DELAYED_BACKGROUND)</div><div class='del'>-		return 1;</div><div class='add'>+		return true;</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_balance_delayed_items(struct btrfs_fs_info *fs_info)</div><div class='hunk'>@@ -1346,143 +1462,231 @@ void btrfs_balance_delayed_items(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	btrfs_wq_run_delayed_node(delayed_root, fs_info, BTRFS_DELAYED_BATCH);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Will return 0 or -ENOMEM */</div><div class='add'>+static void btrfs_release_dir_index_item_space(struct btrfs_trans_handle *trans)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='add'>+	const u64 bytes = btrfs_calc_insert_metadata_size(fs_info, 1);</div><div class='add'>+</div><div class='add'>+	if (test_bit(BTRFS_FS_LOG_RECOVERING, &amp;fs_info-&gt;flags))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Adding the new dir index item does not require touching another</div><div class='add'>+	 * leaf, so we can release 1 unit of metadata that was previously</div><div class='add'>+	 * reserved when starting the transaction. This applies only to</div><div class='add'>+	 * the case where we had a transaction start and excludes the</div><div class='add'>+	 * transaction join case (when replaying log trees).</div><div class='add'>+	 */</div><div class='add'>+	trace_btrfs_space_reservation(fs_info, "transaction",</div><div class='add'>+				      trans-&gt;transid, bytes, 0);</div><div class='add'>+	btrfs_block_rsv_release(fs_info, trans-&gt;block_rsv, bytes, NULL);</div><div class='add'>+	ASSERT(trans-&gt;bytes_reserved &gt;= bytes);</div><div class='add'>+	trans-&gt;bytes_reserved -= bytes;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Will return 0, -ENOMEM or -EEXIST (index number collision, unexpected). */</div><div class='ctx'> int btrfs_insert_delayed_dir_index(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				   const char *name, int name_len,</div><div class='ctx'> 				   struct btrfs_inode *dir,</div><div class='del'>-				   struct btrfs_disk_key *disk_key, u8 type,</div><div class='add'>+				   const struct btrfs_disk_key *disk_key, u8 flags,</div><div class='ctx'> 				   u64 index)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='add'>+	const unsigned int leaf_data_size = BTRFS_LEAF_DATA_SIZE(fs_info);</div><div class='ctx'> 	struct btrfs_delayed_node *delayed_node;</div><div class='add'>+	struct btrfs_ref_tracker delayed_node_tracker;</div><div class='ctx'> 	struct btrfs_delayed_item *delayed_item;</div><div class='ctx'> 	struct btrfs_dir_item *dir_item;</div><div class='add'>+	bool reserve_leaf_space;</div><div class='add'>+	u32 data_len;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	delayed_node = btrfs_get_or_create_delayed_node(dir);</div><div class='add'>+	delayed_node = btrfs_get_or_create_delayed_node(dir, &amp;delayed_node_tracker);</div><div class='ctx'> 	if (IS_ERR(delayed_node))</div><div class='ctx'> 		return PTR_ERR(delayed_node);</div><div class='ctx'> </div><div class='del'>-	delayed_item = btrfs_alloc_delayed_item(sizeof(*dir_item) + name_len);</div><div class='add'>+	delayed_item = btrfs_alloc_delayed_item(sizeof(*dir_item) + name_len,</div><div class='add'>+						delayed_node,</div><div class='add'>+						BTRFS_DELAYED_INSERTION_ITEM);</div><div class='ctx'> 	if (!delayed_item) {</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='ctx'> 		goto release_node;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	delayed_item-&gt;key.objectid = btrfs_ino(dir);</div><div class='del'>-	delayed_item-&gt;key.type = BTRFS_DIR_INDEX_KEY;</div><div class='del'>-	delayed_item-&gt;key.offset = index;</div><div class='add'>+	delayed_item-&gt;index = index;</div><div class='ctx'> </div><div class='ctx'> 	dir_item = (struct btrfs_dir_item *)delayed_item-&gt;data;</div><div class='ctx'> 	dir_item-&gt;location = *disk_key;</div><div class='ctx'> 	btrfs_set_stack_dir_transid(dir_item, trans-&gt;transid);</div><div class='ctx'> 	btrfs_set_stack_dir_data_len(dir_item, 0);</div><div class='ctx'> 	btrfs_set_stack_dir_name_len(dir_item, name_len);</div><div class='del'>-	btrfs_set_stack_dir_type(dir_item, type);</div><div class='add'>+	btrfs_set_stack_dir_flags(dir_item, flags);</div><div class='ctx'> 	memcpy((char *)(dir_item + 1), name, name_len);</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_delayed_item_reserve_metadata(trans, dir-&gt;root, delayed_item);</div><div class='del'>-	/*</div><div class='del'>-	 * we have reserved enough space when we start a new transaction,</div><div class='del'>-	 * so reserving metadata failure is impossible</div><div class='del'>-	 */</div><div class='del'>-	BUG_ON(ret);</div><div class='add'>+	data_len = delayed_item-&gt;data_len + sizeof(struct btrfs_item);</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;delayed_node-&gt;mutex);</div><div class='del'>-	ret = __btrfs_add_delayed_insertion_item(delayed_node, delayed_item);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * First attempt to insert the delayed item. This is to make the error</div><div class='add'>+	 * handling path simpler in case we fail (-EEXIST). There's no risk of</div><div class='add'>+	 * any other task coming in and running the delayed item before we do</div><div class='add'>+	 * the metadata space reservation below, because we are holding the</div><div class='add'>+	 * delayed node's mutex and that mutex must also be locked before the</div><div class='add'>+	 * node's delayed items can be run.</div><div class='add'>+	 */</div><div class='add'>+	ret = __btrfs_add_delayed_item(delayed_node, delayed_item);</div><div class='ctx'> 	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_err(trans-&gt;fs_info,</div><div class='del'>-			  "err add delayed dir index item(name: %.*s) into the insertion tree of the delayed node(root id: %llu, inode id: %llu, errno: %d)",</div><div class='del'>-			  name_len, name, delayed_node-&gt;root-&gt;root_key.objectid,</div><div class='del'>-			  delayed_node-&gt;inode_id, ret);</div><div class='del'>-		BUG();</div><div class='add'>+"error adding delayed dir index item, name: %.*s, index: %llu, root: %llu, dir: %llu, dir-&gt;index_cnt: %llu, delayed_node-&gt;index_cnt: %llu, error: %d",</div><div class='add'>+			  name_len, name, index, btrfs_root_id(delayed_node-&gt;root),</div><div class='add'>+			  delayed_node-&gt;inode_id, dir-&gt;index_cnt,</div><div class='add'>+			  delayed_node-&gt;index_cnt, ret);</div><div class='add'>+		btrfs_release_delayed_item(delayed_item);</div><div class='add'>+		btrfs_release_dir_index_item_space(trans);</div><div class='add'>+		mutex_unlock(&amp;delayed_node-&gt;mutex);</div><div class='add'>+		goto release_node;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (delayed_node-&gt;index_item_leaves == 0 ||</div><div class='add'>+	    delayed_node-&gt;curr_index_batch_size + data_len &gt; leaf_data_size) {</div><div class='add'>+		delayed_node-&gt;curr_index_batch_size = data_len;</div><div class='add'>+		reserve_leaf_space = true;</div><div class='add'>+	} else {</div><div class='add'>+		delayed_node-&gt;curr_index_batch_size += data_len;</div><div class='add'>+		reserve_leaf_space = false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (reserve_leaf_space) {</div><div class='add'>+		ret = btrfs_delayed_item_reserve_metadata(trans, delayed_item);</div><div class='add'>+		/*</div><div class='add'>+		 * Space was reserved for a dir index item insertion when we</div><div class='add'>+		 * started the transaction, so getting a failure here should be</div><div class='add'>+		 * impossible.</div><div class='add'>+		 */</div><div class='add'>+		if (WARN_ON(ret)) {</div><div class='add'>+			btrfs_release_delayed_item(delayed_item);</div><div class='add'>+			mutex_unlock(&amp;delayed_node-&gt;mutex);</div><div class='add'>+			goto release_node;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		delayed_node-&gt;index_item_leaves++;</div><div class='add'>+	} else {</div><div class='add'>+		btrfs_release_dir_index_item_space(trans);</div><div class='ctx'> 	}</div><div class='ctx'> 	mutex_unlock(&amp;delayed_node-&gt;mutex);</div><div class='ctx'> </div><div class='ctx'> release_node:</div><div class='del'>-	btrfs_release_delayed_node(delayed_node);</div><div class='add'>+	btrfs_release_delayed_node(delayed_node, &amp;delayed_node_tracker);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btrfs_delete_delayed_insertion_item(struct btrfs_fs_info *fs_info,</div><div class='del'>-					       struct btrfs_delayed_node *node,</div><div class='del'>-					       struct btrfs_key *key)</div><div class='add'>+static bool btrfs_delete_delayed_insertion_item(struct btrfs_delayed_node *node,</div><div class='add'>+						u64 index)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_delayed_item *item;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;node-&gt;mutex);</div><div class='del'>-	item = __btrfs_lookup_delayed_insertion_item(node, key);</div><div class='add'>+	item = __btrfs_lookup_delayed_item(&amp;node-&gt;ins_root.rb_root, index);</div><div class='ctx'> 	if (!item) {</div><div class='ctx'> 		mutex_unlock(&amp;node-&gt;mutex);</div><div class='del'>-		return 1;</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * For delayed items to insert, we track reserved metadata bytes based</div><div class='add'>+	 * on the number of leaves that we will use.</div><div class='add'>+	 * See btrfs_insert_delayed_dir_index() and</div><div class='add'>+	 * btrfs_delayed_item_reserve_metadata()).</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(item-&gt;bytes_reserved == 0);</div><div class='add'>+	ASSERT(node-&gt;index_item_leaves &gt; 0);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If there's only one leaf reserved, we can decrement this item from the</div><div class='add'>+	 * current batch, otherwise we can not because we don't know which leaf</div><div class='add'>+	 * it belongs to. With the current limit on delayed items, we rarely</div><div class='add'>+	 * accumulate enough dir index items to fill more than one leaf (even</div><div class='add'>+	 * when using a leaf size of 4K).</div><div class='add'>+	 */</div><div class='add'>+	if (node-&gt;index_item_leaves == 1) {</div><div class='add'>+		const u32 data_len = item-&gt;data_len + sizeof(struct btrfs_item);</div><div class='add'>+</div><div class='add'>+		ASSERT(node-&gt;curr_index_batch_size &gt;= data_len);</div><div class='add'>+		node-&gt;curr_index_batch_size -= data_len;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_delayed_item_release_metadata(node-&gt;root, item);</div><div class='ctx'> 	btrfs_release_delayed_item(item);</div><div class='add'>+</div><div class='add'>+	/* If we now have no more dir index items, we can release all leaves. */</div><div class='add'>+	if (RB_EMPTY_ROOT(&amp;node-&gt;ins_root.rb_root)) {</div><div class='add'>+		btrfs_delayed_item_release_leaves(node, node-&gt;index_item_leaves);</div><div class='add'>+		node-&gt;index_item_leaves = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	mutex_unlock(&amp;node-&gt;mutex);</div><div class='del'>-	return 0;</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_delete_delayed_dir_index(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				   struct btrfs_inode *dir, u64 index)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_delayed_node *node;</div><div class='add'>+	struct btrfs_ref_tracker delayed_node_tracker;</div><div class='ctx'> 	struct btrfs_delayed_item *item;</div><div class='del'>-	struct btrfs_key item_key;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	node = btrfs_get_or_create_delayed_node(dir);</div><div class='add'>+	node = btrfs_get_or_create_delayed_node(dir, &amp;delayed_node_tracker);</div><div class='ctx'> 	if (IS_ERR(node))</div><div class='ctx'> 		return PTR_ERR(node);</div><div class='ctx'> </div><div class='del'>-	item_key.objectid = btrfs_ino(dir);</div><div class='del'>-	item_key.type = BTRFS_DIR_INDEX_KEY;</div><div class='del'>-	item_key.offset = index;</div><div class='del'>-</div><div class='del'>-	ret = btrfs_delete_delayed_insertion_item(trans-&gt;fs_info, node,</div><div class='del'>-						  &amp;item_key);</div><div class='del'>-	if (!ret)</div><div class='add'>+	if (btrfs_delete_delayed_insertion_item(node, index)) {</div><div class='add'>+		ret = 0;</div><div class='ctx'> 		goto end;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	item = btrfs_alloc_delayed_item(0);</div><div class='add'>+	item = btrfs_alloc_delayed_item(0, node, BTRFS_DELAYED_DELETION_ITEM);</div><div class='ctx'> 	if (!item) {</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='ctx'> 		goto end;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	item-&gt;key = item_key;</div><div class='add'>+	item-&gt;index = index;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_delayed_item_reserve_metadata(trans, dir-&gt;root, item);</div><div class='add'>+	ret = btrfs_delayed_item_reserve_metadata(trans, item);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * we have reserved enough space when we start a new transaction,</div><div class='ctx'> 	 * so reserving metadata failure is impossible.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='ctx'> 		btrfs_err(trans-&gt;fs_info,</div><div class='del'>-"metadata reservation failed for delayed dir item deltiona, should have been reserved");</div><div class='add'>+"metadata reservation failed for delayed dir item deletion, index: %llu, root: %llu, inode: %llu, error: %d",</div><div class='add'>+			  index, btrfs_root_id(node-&gt;root), node-&gt;inode_id, ret);</div><div class='ctx'> 		btrfs_release_delayed_item(item);</div><div class='ctx'> 		goto end;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;node-&gt;mutex);</div><div class='del'>-	ret = __btrfs_add_delayed_deletion_item(node, item);</div><div class='add'>+	ret = __btrfs_add_delayed_item(node, item);</div><div class='ctx'> 	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_err(trans-&gt;fs_info,</div><div class='del'>-			  "err add delayed dir index item(index: %llu) into the deletion tree of the delayed node(root id: %llu, inode id: %llu, errno: %d)",</div><div class='del'>-			  index, node-&gt;root-&gt;root_key.objectid,</div><div class='del'>-			  node-&gt;inode_id, ret);</div><div class='add'>+"failed to add delayed dir index item, root: %llu, inode: %llu, index: %llu, error: %d",</div><div class='add'>+			  index, btrfs_root_id(node-&gt;root), node-&gt;inode_id, ret);</div><div class='ctx'> 		btrfs_delayed_item_release_metadata(dir-&gt;root, item);</div><div class='ctx'> 		btrfs_release_delayed_item(item);</div><div class='ctx'> 	}</div><div class='ctx'> 	mutex_unlock(&amp;node-&gt;mutex);</div><div class='ctx'> end:</div><div class='del'>-	btrfs_release_delayed_node(node);</div><div class='add'>+	btrfs_release_delayed_node(node, &amp;delayed_node_tracker);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_inode_delayed_dir_index_count(struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_delayed_node *delayed_node = btrfs_get_delayed_node(inode);</div><div class='add'>+	struct btrfs_ref_tracker delayed_node_tracker;</div><div class='add'>+	struct btrfs_delayed_node *delayed_node;</div><div class='ctx'> </div><div class='add'>+	delayed_node = btrfs_get_delayed_node(inode, &amp;delayed_node_tracker);</div><div class='ctx'> 	if (!delayed_node)</div><div class='ctx'> 		return -ENOENT;</div><div class='ctx'> </div><div class='hunk'>@@ -1492,23 +1696,25 @@ int btrfs_inode_delayed_dir_index_count(struct btrfs_inode *inode)</div><div class='ctx'> 	 * is updated now. So we needn't lock the delayed node.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (!delayed_node-&gt;index_cnt) {</div><div class='del'>-		btrfs_release_delayed_node(delayed_node);</div><div class='add'>+		btrfs_release_delayed_node(delayed_node, &amp;delayed_node_tracker);</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;index_cnt = delayed_node-&gt;index_cnt;</div><div class='del'>-	btrfs_release_delayed_node(delayed_node);</div><div class='add'>+	btrfs_release_delayed_node(delayed_node, &amp;delayed_node_tracker);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-bool btrfs_readdir_get_delayed_items(struct inode *inode,</div><div class='add'>+bool btrfs_readdir_get_delayed_items(struct btrfs_inode *inode,</div><div class='add'>+				     u64 last_index,</div><div class='ctx'> 				     struct list_head *ins_list,</div><div class='ctx'> 				     struct list_head *del_list)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_delayed_node *delayed_node;</div><div class='ctx'> 	struct btrfs_delayed_item *item;</div><div class='add'>+	struct btrfs_ref_tracker delayed_node_tracker;</div><div class='ctx'> </div><div class='del'>-	delayed_node = btrfs_get_delayed_node(BTRFS_I(inode));</div><div class='add'>+	delayed_node = btrfs_get_delayed_node(inode, &amp;delayed_node_tracker);</div><div class='ctx'> 	if (!delayed_node)</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='hunk'>@@ -1521,14 +1727,14 @@ bool btrfs_readdir_get_delayed_items(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;delayed_node-&gt;mutex);</div><div class='ctx'> 	item = __btrfs_first_delayed_insertion_item(delayed_node);</div><div class='del'>-	while (item) {</div><div class='add'>+	while (item &amp;&amp; item-&gt;index &lt;= last_index) {</div><div class='ctx'> 		refcount_inc(&amp;item-&gt;refs);</div><div class='ctx'> 		list_add_tail(&amp;item-&gt;readdir_list, ins_list);</div><div class='ctx'> 		item = __btrfs_next_delayed_item(item);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	item = __btrfs_first_delayed_deletion_item(delayed_node);</div><div class='del'>-	while (item) {</div><div class='add'>+	while (item &amp;&amp; item-&gt;index &lt;= last_index) {</div><div class='ctx'> 		refcount_inc(&amp;item-&gt;refs);</div><div class='ctx'> 		list_add_tail(&amp;item-&gt;readdir_list, del_list);</div><div class='ctx'> 		item = __btrfs_next_delayed_item(item);</div><div class='hunk'>@@ -1543,12 +1749,13 @@ bool btrfs_readdir_get_delayed_items(struct inode *inode,</div><div class='ctx'> 	 * insert/delete delayed items in this period. So we also needn't</div><div class='ctx'> 	 * requeue or dequeue this delayed node.</div><div class='ctx'> 	 */</div><div class='add'>+	btrfs_delayed_node_ref_tracker_free(delayed_node, &amp;delayed_node_tracker);</div><div class='ctx'> 	refcount_dec(&amp;delayed_node-&gt;refs);</div><div class='ctx'> </div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_readdir_put_delayed_items(struct inode *inode,</div><div class='add'>+void btrfs_readdir_put_delayed_items(struct btrfs_inode *inode,</div><div class='ctx'> 				     struct list_head *ins_list,</div><div class='ctx'> 				     struct list_head *del_list)</div><div class='ctx'> {</div><div class='hunk'>@@ -1570,20 +1777,19 @@ void btrfs_readdir_put_delayed_items(struct inode *inode,</div><div class='ctx'> 	 * The VFS is going to do up_read(), so we need to downgrade back to a</div><div class='ctx'> 	 * read lock.</div><div class='ctx'> 	 */</div><div class='del'>-	downgrade_write(&amp;inode-&gt;i_rwsem);</div><div class='add'>+	downgrade_write(&amp;inode-&gt;vfs_inode.i_rwsem);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_should_delete_dir_index(struct list_head *del_list,</div><div class='del'>-				  u64 index)</div><div class='add'>+bool btrfs_should_delete_dir_index(const struct list_head *del_list, u64 index)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_delayed_item *curr;</div><div class='del'>-	int ret = 0;</div><div class='add'>+	bool ret = false;</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(curr, del_list, readdir_list) {</div><div class='del'>-		if (curr-&gt;key.offset &gt; index)</div><div class='add'>+		if (curr-&gt;index &gt; index)</div><div class='ctx'> 			break;</div><div class='del'>-		if (curr-&gt;key.offset == index) {</div><div class='del'>-			ret = 1;</div><div class='add'>+		if (curr-&gt;index == index) {</div><div class='add'>+			ret = true;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1591,177 +1797,167 @@ int btrfs_should_delete_dir_index(struct list_head *del_list,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * btrfs_readdir_delayed_dir_index - read dir info stored in the delayed tree</div><div class='del'>- *</div><div class='add'>+ * Read dir info stored in the delayed tree.</div><div class='ctx'>  */</div><div class='del'>-int btrfs_readdir_delayed_dir_index(struct dir_context *ctx,</div><div class='del'>-				    struct list_head *ins_list)</div><div class='add'>+bool btrfs_readdir_delayed_dir_index(struct dir_context *ctx,</div><div class='add'>+				     const struct list_head *ins_list)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_dir_item *di;</div><div class='ctx'> 	struct btrfs_delayed_item *curr, *next;</div><div class='ctx'> 	struct btrfs_key location;</div><div class='ctx'> 	char *name;</div><div class='ctx'> 	int name_len;</div><div class='del'>-	int over = 0;</div><div class='ctx'> 	unsigned char d_type;</div><div class='ctx'> </div><div class='del'>-	if (list_empty(ins_list))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Changing the data of the delayed item is impossible. So</div><div class='ctx'> 	 * we needn't lock them. And we have held i_mutex of the</div><div class='ctx'> 	 * directory, nobody can delete any directory indexes now.</div><div class='ctx'> 	 */</div><div class='ctx'> 	list_for_each_entry_safe(curr, next, ins_list, readdir_list) {</div><div class='add'>+		bool over;</div><div class='add'>+</div><div class='ctx'> 		list_del(&amp;curr-&gt;readdir_list);</div><div class='ctx'> </div><div class='del'>-		if (curr-&gt;key.offset &lt; ctx-&gt;pos) {</div><div class='add'>+		if (curr-&gt;index &lt; ctx-&gt;pos) {</div><div class='ctx'> 			if (refcount_dec_and_test(&amp;curr-&gt;refs))</div><div class='ctx'> 				kfree(curr);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		ctx-&gt;pos = curr-&gt;key.offset;</div><div class='add'>+		ctx-&gt;pos = curr-&gt;index;</div><div class='ctx'> </div><div class='ctx'> 		di = (struct btrfs_dir_item *)curr-&gt;data;</div><div class='ctx'> 		name = (char *)(di + 1);</div><div class='ctx'> 		name_len = btrfs_stack_dir_name_len(di);</div><div class='ctx'> </div><div class='del'>-		d_type = fs_ftype_to_dtype(di-&gt;type);</div><div class='add'>+		d_type = fs_ftype_to_dtype(btrfs_dir_flags_to_ftype(di-&gt;type));</div><div class='ctx'> 		btrfs_disk_key_to_cpu(&amp;location, &amp;di-&gt;location);</div><div class='ctx'> </div><div class='del'>-		over = !dir_emit(ctx, name, name_len,</div><div class='del'>-			       location.objectid, d_type);</div><div class='add'>+		over = !dir_emit(ctx, name, name_len, location.objectid, d_type);</div><div class='ctx'> </div><div class='ctx'> 		if (refcount_dec_and_test(&amp;curr-&gt;refs))</div><div class='ctx'> 			kfree(curr);</div><div class='ctx'> </div><div class='ctx'> 		if (over)</div><div class='del'>-			return 1;</div><div class='add'>+			return true;</div><div class='ctx'> 		ctx-&gt;pos++;</div><div class='ctx'> 	}</div><div class='del'>-	return 0;</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void fill_stack_inode_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				  struct btrfs_inode_item *inode_item,</div><div class='del'>-				  struct inode *inode)</div><div class='add'>+				  struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='add'>+	struct inode *vfs_inode = &amp;inode-&gt;vfs_inode;</div><div class='ctx'> 	u64 flags;</div><div class='ctx'> </div><div class='del'>-	btrfs_set_stack_inode_uid(inode_item, i_uid_read(inode));</div><div class='del'>-	btrfs_set_stack_inode_gid(inode_item, i_gid_read(inode));</div><div class='del'>-	btrfs_set_stack_inode_size(inode_item, BTRFS_I(inode)-&gt;disk_i_size);</div><div class='del'>-	btrfs_set_stack_inode_mode(inode_item, inode-&gt;i_mode);</div><div class='del'>-	btrfs_set_stack_inode_nlink(inode_item, inode-&gt;i_nlink);</div><div class='del'>-	btrfs_set_stack_inode_nbytes(inode_item, inode_get_bytes(inode));</div><div class='del'>-	btrfs_set_stack_inode_generation(inode_item,</div><div class='del'>-					 BTRFS_I(inode)-&gt;generation);</div><div class='add'>+	btrfs_set_stack_inode_uid(inode_item, i_uid_read(vfs_inode));</div><div class='add'>+	btrfs_set_stack_inode_gid(inode_item, i_gid_read(vfs_inode));</div><div class='add'>+	btrfs_set_stack_inode_size(inode_item, inode-&gt;disk_i_size);</div><div class='add'>+	btrfs_set_stack_inode_mode(inode_item, vfs_inode-&gt;i_mode);</div><div class='add'>+	btrfs_set_stack_inode_nlink(inode_item, vfs_inode-&gt;i_nlink);</div><div class='add'>+	btrfs_set_stack_inode_nbytes(inode_item, inode_get_bytes(vfs_inode));</div><div class='add'>+	btrfs_set_stack_inode_generation(inode_item, inode-&gt;generation);</div><div class='ctx'> 	btrfs_set_stack_inode_sequence(inode_item,</div><div class='del'>-				       inode_peek_iversion(inode));</div><div class='add'>+				       inode_peek_iversion(vfs_inode));</div><div class='ctx'> 	btrfs_set_stack_inode_transid(inode_item, trans-&gt;transid);</div><div class='del'>-	btrfs_set_stack_inode_rdev(inode_item, inode-&gt;i_rdev);</div><div class='del'>-	flags = btrfs_inode_combine_flags(BTRFS_I(inode)-&gt;flags,</div><div class='del'>-					  BTRFS_I(inode)-&gt;ro_flags);</div><div class='add'>+	btrfs_set_stack_inode_rdev(inode_item, vfs_inode-&gt;i_rdev);</div><div class='add'>+	flags = btrfs_inode_combine_flags(inode-&gt;flags, inode-&gt;ro_flags);</div><div class='ctx'> 	btrfs_set_stack_inode_flags(inode_item, flags);</div><div class='ctx'> 	btrfs_set_stack_inode_block_group(inode_item, 0);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_set_stack_timespec_sec(&amp;inode_item-&gt;atime,</div><div class='del'>-				     inode-&gt;i_atime.tv_sec);</div><div class='add'>+				     inode_get_atime_sec(vfs_inode));</div><div class='ctx'> 	btrfs_set_stack_timespec_nsec(&amp;inode_item-&gt;atime,</div><div class='del'>-				      inode-&gt;i_atime.tv_nsec);</div><div class='add'>+				      inode_get_atime_nsec(vfs_inode));</div><div class='ctx'> </div><div class='ctx'> 	btrfs_set_stack_timespec_sec(&amp;inode_item-&gt;mtime,</div><div class='del'>-				     inode-&gt;i_mtime.tv_sec);</div><div class='add'>+				     inode_get_mtime_sec(vfs_inode));</div><div class='ctx'> 	btrfs_set_stack_timespec_nsec(&amp;inode_item-&gt;mtime,</div><div class='del'>-				      inode-&gt;i_mtime.tv_nsec);</div><div class='add'>+				      inode_get_mtime_nsec(vfs_inode));</div><div class='ctx'> </div><div class='ctx'> 	btrfs_set_stack_timespec_sec(&amp;inode_item-&gt;ctime,</div><div class='del'>-				     inode-&gt;i_ctime.tv_sec);</div><div class='add'>+				     inode_get_ctime_sec(vfs_inode));</div><div class='ctx'> 	btrfs_set_stack_timespec_nsec(&amp;inode_item-&gt;ctime,</div><div class='del'>-				      inode-&gt;i_ctime.tv_nsec);</div><div class='add'>+				      inode_get_ctime_nsec(vfs_inode));</div><div class='ctx'> </div><div class='del'>-	btrfs_set_stack_timespec_sec(&amp;inode_item-&gt;otime,</div><div class='del'>-				     BTRFS_I(inode)-&gt;i_otime.tv_sec);</div><div class='del'>-	btrfs_set_stack_timespec_nsec(&amp;inode_item-&gt;otime,</div><div class='del'>-				     BTRFS_I(inode)-&gt;i_otime.tv_nsec);</div><div class='add'>+	btrfs_set_stack_timespec_sec(&amp;inode_item-&gt;otime, inode-&gt;i_otime_sec);</div><div class='add'>+	btrfs_set_stack_timespec_nsec(&amp;inode_item-&gt;otime, inode-&gt;i_otime_nsec);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_fill_inode(struct inode *inode, u32 *rdev)</div><div class='add'>+int btrfs_fill_inode(struct btrfs_inode *inode, u32 *rdev)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = BTRFS_I(inode)-&gt;root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_delayed_node *delayed_node;</div><div class='add'>+	struct btrfs_ref_tracker delayed_node_tracker;</div><div class='ctx'> 	struct btrfs_inode_item *inode_item;</div><div class='add'>+	struct inode *vfs_inode = &amp;inode-&gt;vfs_inode;</div><div class='ctx'> </div><div class='del'>-	delayed_node = btrfs_get_delayed_node(BTRFS_I(inode));</div><div class='add'>+	delayed_node = btrfs_get_delayed_node(inode, &amp;delayed_node_tracker);</div><div class='ctx'> 	if (!delayed_node)</div><div class='ctx'> 		return -ENOENT;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;delayed_node-&gt;mutex);</div><div class='ctx'> 	if (!test_bit(BTRFS_DELAYED_NODE_INODE_DIRTY, &amp;delayed_node-&gt;flags)) {</div><div class='ctx'> 		mutex_unlock(&amp;delayed_node-&gt;mutex);</div><div class='del'>-		btrfs_release_delayed_node(delayed_node);</div><div class='add'>+		btrfs_release_delayed_node(delayed_node, &amp;delayed_node_tracker);</div><div class='ctx'> 		return -ENOENT;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	inode_item = &amp;delayed_node-&gt;inode_item;</div><div class='ctx'> </div><div class='del'>-	i_uid_write(inode, btrfs_stack_inode_uid(inode_item));</div><div class='del'>-	i_gid_write(inode, btrfs_stack_inode_gid(inode_item));</div><div class='del'>-	btrfs_i_size_write(BTRFS_I(inode), btrfs_stack_inode_size(inode_item));</div><div class='del'>-	btrfs_inode_set_file_extent_range(BTRFS_I(inode), 0,</div><div class='del'>-			round_up(i_size_read(inode), fs_info-&gt;sectorsize));</div><div class='del'>-	inode-&gt;i_mode = btrfs_stack_inode_mode(inode_item);</div><div class='del'>-	set_nlink(inode, btrfs_stack_inode_nlink(inode_item));</div><div class='del'>-	inode_set_bytes(inode, btrfs_stack_inode_nbytes(inode_item));</div><div class='del'>-	BTRFS_I(inode)-&gt;generation = btrfs_stack_inode_generation(inode_item);</div><div class='del'>-        BTRFS_I(inode)-&gt;last_trans = btrfs_stack_inode_transid(inode_item);</div><div class='del'>-</div><div class='del'>-	inode_set_iversion_queried(inode,</div><div class='del'>-				   btrfs_stack_inode_sequence(inode_item));</div><div class='del'>-	inode-&gt;i_rdev = 0;</div><div class='add'>+	i_uid_write(vfs_inode, btrfs_stack_inode_uid(inode_item));</div><div class='add'>+	i_gid_write(vfs_inode, btrfs_stack_inode_gid(inode_item));</div><div class='add'>+	btrfs_i_size_write(inode, btrfs_stack_inode_size(inode_item));</div><div class='add'>+	vfs_inode-&gt;i_mode = btrfs_stack_inode_mode(inode_item);</div><div class='add'>+	set_nlink(vfs_inode, btrfs_stack_inode_nlink(inode_item));</div><div class='add'>+	inode_set_bytes(vfs_inode, btrfs_stack_inode_nbytes(inode_item));</div><div class='add'>+	inode-&gt;generation = btrfs_stack_inode_generation(inode_item);</div><div class='add'>+	inode-&gt;last_trans = btrfs_stack_inode_transid(inode_item);</div><div class='add'>+</div><div class='add'>+	inode_set_iversion_queried(vfs_inode, btrfs_stack_inode_sequence(inode_item));</div><div class='add'>+	vfs_inode-&gt;i_rdev = 0;</div><div class='ctx'> 	*rdev = btrfs_stack_inode_rdev(inode_item);</div><div class='ctx'> 	btrfs_inode_split_flags(btrfs_stack_inode_flags(inode_item),</div><div class='del'>-				&amp;BTRFS_I(inode)-&gt;flags, &amp;BTRFS_I(inode)-&gt;ro_flags);</div><div class='add'>+				&amp;inode-&gt;flags, &amp;inode-&gt;ro_flags);</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_atime.tv_sec = btrfs_stack_timespec_sec(&amp;inode_item-&gt;atime);</div><div class='del'>-	inode-&gt;i_atime.tv_nsec = btrfs_stack_timespec_nsec(&amp;inode_item-&gt;atime);</div><div class='add'>+	inode_set_atime(vfs_inode, btrfs_stack_timespec_sec(&amp;inode_item-&gt;atime),</div><div class='add'>+			btrfs_stack_timespec_nsec(&amp;inode_item-&gt;atime));</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_mtime.tv_sec = btrfs_stack_timespec_sec(&amp;inode_item-&gt;mtime);</div><div class='del'>-	inode-&gt;i_mtime.tv_nsec = btrfs_stack_timespec_nsec(&amp;inode_item-&gt;mtime);</div><div class='add'>+	inode_set_mtime(vfs_inode, btrfs_stack_timespec_sec(&amp;inode_item-&gt;mtime),</div><div class='add'>+			btrfs_stack_timespec_nsec(&amp;inode_item-&gt;mtime));</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_ctime.tv_sec = btrfs_stack_timespec_sec(&amp;inode_item-&gt;ctime);</div><div class='del'>-	inode-&gt;i_ctime.tv_nsec = btrfs_stack_timespec_nsec(&amp;inode_item-&gt;ctime);</div><div class='add'>+	inode_set_ctime(vfs_inode, btrfs_stack_timespec_sec(&amp;inode_item-&gt;ctime),</div><div class='add'>+			btrfs_stack_timespec_nsec(&amp;inode_item-&gt;ctime));</div><div class='ctx'> </div><div class='del'>-	BTRFS_I(inode)-&gt;i_otime.tv_sec =</div><div class='del'>-		btrfs_stack_timespec_sec(&amp;inode_item-&gt;otime);</div><div class='del'>-	BTRFS_I(inode)-&gt;i_otime.tv_nsec =</div><div class='del'>-		btrfs_stack_timespec_nsec(&amp;inode_item-&gt;otime);</div><div class='add'>+	inode-&gt;i_otime_sec = btrfs_stack_timespec_sec(&amp;inode_item-&gt;otime);</div><div class='add'>+	inode-&gt;i_otime_nsec = btrfs_stack_timespec_nsec(&amp;inode_item-&gt;otime);</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_generation = BTRFS_I(inode)-&gt;generation;</div><div class='del'>-	BTRFS_I(inode)-&gt;index_cnt = (u64)-1;</div><div class='add'>+	vfs_inode-&gt;i_generation = inode-&gt;generation;</div><div class='add'>+	if (S_ISDIR(vfs_inode-&gt;i_mode))</div><div class='add'>+		inode-&gt;index_cnt = (u64)-1;</div><div class='ctx'> </div><div class='ctx'> 	mutex_unlock(&amp;delayed_node-&gt;mutex);</div><div class='del'>-	btrfs_release_delayed_node(delayed_node);</div><div class='add'>+	btrfs_release_delayed_node(delayed_node, &amp;delayed_node_tracker);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_delayed_update_inode(struct btrfs_trans_handle *trans,</div><div class='del'>-			       struct btrfs_root *root,</div><div class='ctx'> 			       struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	struct btrfs_delayed_node *delayed_node;</div><div class='add'>+	struct btrfs_ref_tracker delayed_node_tracker;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	delayed_node = btrfs_get_or_create_delayed_node(inode);</div><div class='add'>+	delayed_node = btrfs_get_or_create_delayed_node(inode, &amp;delayed_node_tracker);</div><div class='ctx'> 	if (IS_ERR(delayed_node))</div><div class='ctx'> 		return PTR_ERR(delayed_node);</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;delayed_node-&gt;mutex);</div><div class='ctx'> 	if (test_bit(BTRFS_DELAYED_NODE_INODE_DIRTY, &amp;delayed_node-&gt;flags)) {</div><div class='del'>-		fill_stack_inode_item(trans, &amp;delayed_node-&gt;inode_item,</div><div class='del'>-				      &amp;inode-&gt;vfs_inode);</div><div class='add'>+		fill_stack_inode_item(trans, &amp;delayed_node-&gt;inode_item, inode);</div><div class='ctx'> 		goto release_node;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1769,13 +1965,13 @@ int btrfs_delayed_update_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto release_node;</div><div class='ctx'> </div><div class='del'>-	fill_stack_inode_item(trans, &amp;delayed_node-&gt;inode_item, &amp;inode-&gt;vfs_inode);</div><div class='add'>+	fill_stack_inode_item(trans, &amp;delayed_node-&gt;inode_item, inode);</div><div class='ctx'> 	set_bit(BTRFS_DELAYED_NODE_INODE_DIRTY, &amp;delayed_node-&gt;flags);</div><div class='ctx'> 	delayed_node-&gt;count++;</div><div class='ctx'> 	atomic_inc(&amp;root-&gt;fs_info-&gt;delayed_root-&gt;items);</div><div class='ctx'> release_node:</div><div class='ctx'> 	mutex_unlock(&amp;delayed_node-&gt;mutex);</div><div class='del'>-	btrfs_release_delayed_node(delayed_node);</div><div class='add'>+	btrfs_release_delayed_node(delayed_node, &amp;delayed_node_tracker);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1783,6 +1979,7 @@ int btrfs_delayed_delete_inode_ref(struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_delayed_node *delayed_node;</div><div class='add'>+	struct btrfs_ref_tracker delayed_node_tracker;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * we don't do delayed inode updates during log recovery because it</div><div class='hunk'>@@ -1792,7 +1989,7 @@ int btrfs_delayed_delete_inode_ref(struct btrfs_inode *inode)</div><div class='ctx'> 	if (test_bit(BTRFS_FS_LOG_RECOVERING, &amp;fs_info-&gt;flags))</div><div class='ctx'> 		return -EAGAIN;</div><div class='ctx'> </div><div class='del'>-	delayed_node = btrfs_get_or_create_delayed_node(inode);</div><div class='add'>+	delayed_node = btrfs_get_or_create_delayed_node(inode, &amp;delayed_node_tracker);</div><div class='ctx'> 	if (IS_ERR(delayed_node))</div><div class='ctx'> 		return PTR_ERR(delayed_node);</div><div class='ctx'> </div><div class='hunk'>@@ -1811,15 +2008,12 @@ int btrfs_delayed_delete_inode_ref(struct btrfs_inode *inode)</div><div class='ctx'> 	 *   It is very rare.</div><div class='ctx'> 	 */</div><div class='ctx'> 	mutex_lock(&amp;delayed_node-&gt;mutex);</div><div class='del'>-	if (test_bit(BTRFS_DELAYED_NODE_DEL_IREF, &amp;delayed_node-&gt;flags))</div><div class='del'>-		goto release_node;</div><div class='del'>-</div><div class='del'>-	set_bit(BTRFS_DELAYED_NODE_DEL_IREF, &amp;delayed_node-&gt;flags);</div><div class='del'>-	delayed_node-&gt;count++;</div><div class='del'>-	atomic_inc(&amp;fs_info-&gt;delayed_root-&gt;items);</div><div class='del'>-release_node:</div><div class='add'>+	if (!test_and_set_bit(BTRFS_DELAYED_NODE_DEL_IREF, &amp;delayed_node-&gt;flags)) {</div><div class='add'>+		delayed_node-&gt;count++;</div><div class='add'>+		atomic_inc(&amp;fs_info-&gt;delayed_root-&gt;items);</div><div class='add'>+	}</div><div class='ctx'> 	mutex_unlock(&amp;delayed_node-&gt;mutex);</div><div class='del'>-	btrfs_release_delayed_node(delayed_node);</div><div class='add'>+	btrfs_release_delayed_node(delayed_node, &amp;delayed_node_tracker);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1832,12 +2026,17 @@ static void __btrfs_kill_delayed_node(struct btrfs_delayed_node *delayed_node)</div><div class='ctx'> 	mutex_lock(&amp;delayed_node-&gt;mutex);</div><div class='ctx'> 	curr_item = __btrfs_first_delayed_insertion_item(delayed_node);</div><div class='ctx'> 	while (curr_item) {</div><div class='del'>-		btrfs_delayed_item_release_metadata(root, curr_item);</div><div class='ctx'> 		prev_item = curr_item;</div><div class='ctx'> 		curr_item = __btrfs_next_delayed_item(prev_item);</div><div class='ctx'> 		btrfs_release_delayed_item(prev_item);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (delayed_node-&gt;index_item_leaves &gt; 0) {</div><div class='add'>+		btrfs_delayed_item_release_leaves(delayed_node,</div><div class='add'>+					  delayed_node-&gt;index_item_leaves);</div><div class='add'>+		delayed_node-&gt;index_item_leaves = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	curr_item = __btrfs_first_delayed_deletion_item(delayed_node);</div><div class='ctx'> 	while (curr_item) {</div><div class='ctx'> 		btrfs_delayed_item_release_metadata(root, curr_item);</div><div class='hunk'>@@ -1858,47 +2057,56 @@ static void __btrfs_kill_delayed_node(struct btrfs_delayed_node *delayed_node)</div><div class='ctx'> void btrfs_kill_delayed_inode_items(struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_delayed_node *delayed_node;</div><div class='add'>+	struct btrfs_ref_tracker delayed_node_tracker;</div><div class='ctx'> </div><div class='del'>-	delayed_node = btrfs_get_delayed_node(inode);</div><div class='add'>+	delayed_node = btrfs_get_delayed_node(inode, &amp;delayed_node_tracker);</div><div class='ctx'> 	if (!delayed_node)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	__btrfs_kill_delayed_node(delayed_node);</div><div class='del'>-	btrfs_release_delayed_node(delayed_node);</div><div class='add'>+	btrfs_release_delayed_node(delayed_node, &amp;delayed_node_tracker);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_kill_all_delayed_nodes(struct btrfs_root *root)</div><div class='ctx'> {</div><div class='del'>-	u64 inode_id = 0;</div><div class='add'>+	unsigned long index = 0;</div><div class='ctx'> 	struct btrfs_delayed_node *delayed_nodes[8];</div><div class='del'>-	int i, n;</div><div class='add'>+	struct btrfs_ref_tracker delayed_node_trackers[8];</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='del'>-		spin_lock(&amp;root-&gt;inode_lock);</div><div class='del'>-		n = radix_tree_gang_lookup(&amp;root-&gt;delayed_nodes_tree,</div><div class='del'>-					   (void **)delayed_nodes, inode_id,</div><div class='del'>-					   ARRAY_SIZE(delayed_nodes));</div><div class='del'>-		if (!n) {</div><div class='del'>-			spin_unlock(&amp;root-&gt;inode_lock);</div><div class='del'>-			break;</div><div class='add'>+		struct btrfs_delayed_node *node;</div><div class='add'>+		int count;</div><div class='add'>+</div><div class='add'>+		xa_lock(&amp;root-&gt;delayed_nodes);</div><div class='add'>+		if (xa_empty(&amp;root-&gt;delayed_nodes)) {</div><div class='add'>+			xa_unlock(&amp;root-&gt;delayed_nodes);</div><div class='add'>+			return;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		inode_id = delayed_nodes[n - 1]-&gt;inode_id + 1;</div><div class='del'>-		for (i = 0; i &lt; n; i++) {</div><div class='add'>+		count = 0;</div><div class='add'>+		xa_for_each_start(&amp;root-&gt;delayed_nodes, index, node, index) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Don't increase refs in case the node is dead and</div><div class='ctx'> 			 * about to be removed from the tree in the loop below</div><div class='ctx'> 			 */</div><div class='del'>-			if (!refcount_inc_not_zero(&amp;delayed_nodes[i]-&gt;refs))</div><div class='del'>-				delayed_nodes[i] = NULL;</div><div class='add'>+			if (refcount_inc_not_zero(&amp;node-&gt;refs)) {</div><div class='add'>+				btrfs_delayed_node_ref_tracker_alloc(node,</div><div class='add'>+						     &amp;delayed_node_trackers[count],</div><div class='add'>+						     GFP_ATOMIC);</div><div class='add'>+				delayed_nodes[count] = node;</div><div class='add'>+				count++;</div><div class='add'>+			}</div><div class='add'>+			if (count &gt;= ARRAY_SIZE(delayed_nodes))</div><div class='add'>+				break;</div><div class='ctx'> 		}</div><div class='del'>-		spin_unlock(&amp;root-&gt;inode_lock);</div><div class='add'>+		xa_unlock(&amp;root-&gt;delayed_nodes);</div><div class='add'>+		index++;</div><div class='ctx'> </div><div class='del'>-		for (i = 0; i &lt; n; i++) {</div><div class='del'>-			if (!delayed_nodes[i])</div><div class='del'>-				continue;</div><div class='add'>+		for (int i = 0; i &lt; count; i++) {</div><div class='ctx'> 			__btrfs_kill_delayed_node(delayed_nodes[i]);</div><div class='del'>-			btrfs_release_delayed_node(delayed_nodes[i]);</div><div class='add'>+			btrfs_delayed_node_ref_tracker_dir_print(delayed_nodes[i]);</div><div class='add'>+			btrfs_release_delayed_node(delayed_nodes[i],</div><div class='add'>+						   &amp;delayed_node_trackers[i]);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -1906,14 +2114,131 @@ void btrfs_kill_all_delayed_nodes(struct btrfs_root *root)</div><div class='ctx'> void btrfs_destroy_delayed_inodes(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_delayed_node *curr_node, *prev_node;</div><div class='add'>+	struct btrfs_ref_tracker curr_delayed_node_tracker, prev_delayed_node_tracker;</div><div class='ctx'> </div><div class='del'>-	curr_node = btrfs_first_delayed_node(fs_info-&gt;delayed_root);</div><div class='add'>+	curr_node = btrfs_first_delayed_node(fs_info-&gt;delayed_root,</div><div class='add'>+					     &amp;curr_delayed_node_tracker);</div><div class='ctx'> 	while (curr_node) {</div><div class='ctx'> 		__btrfs_kill_delayed_node(curr_node);</div><div class='ctx'> </div><div class='ctx'> 		prev_node = curr_node;</div><div class='del'>-		curr_node = btrfs_next_delayed_node(curr_node);</div><div class='del'>-		btrfs_release_delayed_node(prev_node);</div><div class='add'>+		prev_delayed_node_tracker = curr_delayed_node_tracker;</div><div class='add'>+		curr_node = btrfs_next_delayed_node(curr_node, &amp;curr_delayed_node_tracker);</div><div class='add'>+		btrfs_release_delayed_node(prev_node, &amp;prev_delayed_node_tracker);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void btrfs_log_get_delayed_items(struct btrfs_inode *inode,</div><div class='add'>+				 struct list_head *ins_list,</div><div class='add'>+				 struct list_head *del_list)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_delayed_node *node;</div><div class='add'>+	struct btrfs_delayed_item *item;</div><div class='add'>+	struct btrfs_ref_tracker delayed_node_tracker;</div><div class='add'>+</div><div class='add'>+	node = btrfs_get_delayed_node(inode, &amp;delayed_node_tracker);</div><div class='add'>+	if (!node)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;node-&gt;mutex);</div><div class='add'>+	item = __btrfs_first_delayed_insertion_item(node);</div><div class='add'>+	while (item) {</div><div class='add'>+		/*</div><div class='add'>+		 * It's possible that the item is already in a log list. This</div><div class='add'>+		 * can happen in case two tasks are trying to log the same</div><div class='add'>+		 * directory. For example if we have tasks A and task B:</div><div class='add'>+		 *</div><div class='add'>+		 * Task A collected the delayed items into a log list while</div><div class='add'>+		 * under the inode's log_mutex (at btrfs_log_inode()), but it</div><div class='add'>+		 * only releases the items after logging the inodes they point</div><div class='add'>+		 * to (if they are new inodes), which happens after unlocking</div><div class='add'>+		 * the log mutex;</div><div class='add'>+		 *</div><div class='add'>+		 * Task B enters btrfs_log_inode() and acquires the log_mutex</div><div class='add'>+		 * of the same directory inode, before task B releases the</div><div class='add'>+		 * delayed items. This can happen for example when logging some</div><div class='add'>+		 * inode we need to trigger logging of its parent directory, so</div><div class='add'>+		 * logging two files that have the same parent directory can</div><div class='add'>+		 * lead to this.</div><div class='add'>+		 *</div><div class='add'>+		 * If this happens, just ignore delayed items already in a log</div><div class='add'>+		 * list. All the tasks logging the directory are under a log</div><div class='add'>+		 * transaction and whichever finishes first can not sync the log</div><div class='add'>+		 * before the other completes and leaves the log transaction.</div><div class='add'>+		 */</div><div class='add'>+		if (!item-&gt;logged &amp;&amp; list_empty(&amp;item-&gt;log_list)) {</div><div class='add'>+			refcount_inc(&amp;item-&gt;refs);</div><div class='add'>+			list_add_tail(&amp;item-&gt;log_list, ins_list);</div><div class='add'>+		}</div><div class='add'>+		item = __btrfs_next_delayed_item(item);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	item = __btrfs_first_delayed_deletion_item(node);</div><div class='add'>+	while (item) {</div><div class='add'>+		/* It may be non-empty, for the same reason mentioned above. */</div><div class='add'>+		if (!item-&gt;logged &amp;&amp; list_empty(&amp;item-&gt;log_list)) {</div><div class='add'>+			refcount_inc(&amp;item-&gt;refs);</div><div class='add'>+			list_add_tail(&amp;item-&gt;log_list, del_list);</div><div class='add'>+		}</div><div class='add'>+		item = __btrfs_next_delayed_item(item);</div><div class='add'>+	}</div><div class='add'>+	mutex_unlock(&amp;node-&gt;mutex);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We are called during inode logging, which means the inode is in use</div><div class='add'>+	 * and can not be evicted before we finish logging the inode. So we never</div><div class='add'>+	 * have the last reference on the delayed inode.</div><div class='add'>+	 * Also, we don't use btrfs_release_delayed_node() because that would</div><div class='add'>+	 * requeue the delayed inode (change its order in the list of prepared</div><div class='add'>+	 * nodes) and we don't want to do such change because we don't create or</div><div class='add'>+	 * delete delayed items.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(refcount_read(&amp;node-&gt;refs) &gt; 1);</div><div class='add'>+	btrfs_delayed_node_ref_tracker_free(node, &amp;delayed_node_tracker);</div><div class='add'>+	refcount_dec(&amp;node-&gt;refs);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_log_put_delayed_items(struct btrfs_inode *inode,</div><div class='add'>+				 struct list_head *ins_list,</div><div class='add'>+				 struct list_head *del_list)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_delayed_node *node;</div><div class='add'>+	struct btrfs_delayed_item *item;</div><div class='add'>+	struct btrfs_delayed_item *next;</div><div class='add'>+	struct btrfs_ref_tracker delayed_node_tracker;</div><div class='add'>+</div><div class='add'>+	node = btrfs_get_delayed_node(inode, &amp;delayed_node_tracker);</div><div class='add'>+	if (!node)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;node-&gt;mutex);</div><div class='add'>+</div><div class='add'>+	list_for_each_entry_safe(item, next, ins_list, log_list) {</div><div class='add'>+		item-&gt;logged = true;</div><div class='add'>+		list_del_init(&amp;item-&gt;log_list);</div><div class='add'>+		if (refcount_dec_and_test(&amp;item-&gt;refs))</div><div class='add'>+			kfree(item);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	list_for_each_entry_safe(item, next, del_list, log_list) {</div><div class='add'>+		item-&gt;logged = true;</div><div class='add'>+		list_del_init(&amp;item-&gt;log_list);</div><div class='add'>+		if (refcount_dec_and_test(&amp;item-&gt;refs))</div><div class='add'>+			kfree(item);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	mutex_unlock(&amp;node-&gt;mutex);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We are called during inode logging, which means the inode is in use</div><div class='add'>+	 * and can not be evicted before we finish logging the inode. So we never</div><div class='add'>+	 * have the last reference on the delayed inode.</div><div class='add'>+	 * Also, we don't use btrfs_release_delayed_node() because that would</div><div class='add'>+	 * requeue the delayed inode (change its order in the list of prepared</div><div class='add'>+	 * nodes) and we don't want to do such change because we don't create or</div><div class='add'>+	 * delete delayed items.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(refcount_read(&amp;node-&gt;refs) &gt; 1);</div><div class='add'>+	btrfs_delayed_node_ref_tracker_free(node, &amp;delayed_node_tracker);</div><div class='add'>+	refcount_dec(&amp;node-&gt;refs);</div><div class='add'>+}</div><div class='head'>diff --git a/fs/btrfs/delayed-inode.h b/fs/btrfs/delayed-inode.h<br/>index b2412160c5bc..b09d4ec8c77d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/delayed-inode.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/delayed-inode.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/delayed-inode.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/delayed-inode.h</a></div><div class='hunk'>@@ -7,18 +7,28 @@</div><div class='ctx'> #ifndef BTRFS_DELAYED_INODE_H</div><div class='ctx'> #define BTRFS_DELAYED_INODE_H</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='ctx'> #include &lt;linux/rbtree.h&gt;</div><div class='ctx'> #include &lt;linux/spinlock.h&gt;</div><div class='ctx'> #include &lt;linux/mutex.h&gt;</div><div class='ctx'> #include &lt;linux/list.h&gt;</div><div class='ctx'> #include &lt;linux/wait.h&gt;</div><div class='add'>+#include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/atomic.h&gt;</div><div class='ctx'> #include &lt;linux/refcount.h&gt;</div><div class='add'>+#include &lt;linux/ref_tracker.h&gt;</div><div class='ctx'> #include "ctree.h"</div><div class='ctx'> </div><div class='del'>-/* types of the delayed item */</div><div class='del'>-#define BTRFS_DELAYED_INSERTION_ITEM	1</div><div class='del'>-#define BTRFS_DELAYED_DELETION_ITEM	2</div><div class='add'>+struct btrfs_disk_key;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+struct btrfs_inode;</div><div class='add'>+struct btrfs_root;</div><div class='add'>+struct btrfs_trans_handle;</div><div class='add'>+</div><div class='add'>+enum btrfs_delayed_item_type {</div><div class='add'>+	BTRFS_DELAYED_INSERTION_ITEM,</div><div class='add'>+	BTRFS_DELAYED_DELETION_ITEM</div><div class='add'>+};</div><div class='ctx'> </div><div class='ctx'> struct btrfs_delayed_root {</div><div class='ctx'> 	spinlock_t lock;</div><div class='hunk'>@@ -35,6 +45,22 @@ struct btrfs_delayed_root {</div><div class='ctx'> 	wait_queue_head_t wait;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+struct btrfs_ref_tracker_dir {</div><div class='add'>+#ifdef CONFIG_BTRFS_DEBUG</div><div class='add'>+	struct ref_tracker_dir dir;</div><div class='add'>+#else</div><div class='add'>+	struct {} tracker;</div><div class='add'>+#endif</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct btrfs_ref_tracker {</div><div class='add'>+#ifdef CONFIG_BTRFS_DEBUG</div><div class='add'>+	struct ref_tracker *tracker;</div><div class='add'>+#else</div><div class='add'>+	struct {} tracker;</div><div class='add'>+#endif</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> #define BTRFS_DELAYED_NODE_IN_LIST	0</div><div class='ctx'> #define BTRFS_DELAYED_NODE_INODE_DIRTY	1</div><div class='ctx'> #define BTRFS_DELAYED_NODE_DEL_IREF	2</div><div class='hunk'>@@ -55,40 +81,59 @@ struct btrfs_delayed_node {</div><div class='ctx'> 	struct mutex mutex;</div><div class='ctx'> 	struct btrfs_inode_item inode_item;</div><div class='ctx'> 	refcount_t refs;</div><div class='add'>+	int count;</div><div class='ctx'> 	u64 index_cnt;</div><div class='ctx'> 	unsigned long flags;</div><div class='del'>-	int count;</div><div class='add'>+	/*</div><div class='add'>+	 * The size of the next batch of dir index items to insert (if this</div><div class='add'>+	 * node is from a directory inode). Protected by @mutex.</div><div class='add'>+	 */</div><div class='add'>+	u32 curr_index_batch_size;</div><div class='add'>+	/*</div><div class='add'>+	 * Number of leaves reserved for inserting dir index items (if this</div><div class='add'>+	 * node belongs to a directory inode). This may be larger then the</div><div class='add'>+	 * actual number of leaves we end up using. Protected by @mutex.</div><div class='add'>+	 */</div><div class='add'>+	u32 index_item_leaves;</div><div class='add'>+	/* Track all references to this delayed node. */</div><div class='add'>+	struct btrfs_ref_tracker_dir ref_dir;</div><div class='add'>+	/* Track delayed node reference stored in node list. */</div><div class='add'>+	struct btrfs_ref_tracker node_list_tracker;</div><div class='add'>+	/* Track delayed node reference stored in inode cache. */</div><div class='add'>+	struct btrfs_ref_tracker inode_cache_tracker;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct btrfs_delayed_item {</div><div class='ctx'> 	struct rb_node rb_node;</div><div class='del'>-	struct btrfs_key key;</div><div class='add'>+	/* Offset value of the corresponding dir index key. */</div><div class='add'>+	u64 index;</div><div class='ctx'> 	struct list_head tree_list;	/* used for batch insert/delete items */</div><div class='ctx'> 	struct list_head readdir_list;	/* used for readdir items */</div><div class='add'>+	/*</div><div class='add'>+	 * Used when logging a directory.</div><div class='add'>+	 * Insertions and deletions to this list are protected by the parent</div><div class='add'>+	 * delayed node's mutex.</div><div class='add'>+	 */</div><div class='add'>+	struct list_head log_list;</div><div class='ctx'> 	u64 bytes_reserved;</div><div class='ctx'> 	struct btrfs_delayed_node *delayed_node;</div><div class='ctx'> 	refcount_t refs;</div><div class='del'>-	int ins_or_del;</div><div class='del'>-	u32 data_len;</div><div class='del'>-	char data[];</div><div class='add'>+	enum btrfs_delayed_item_type type:8;</div><div class='add'>+	/*</div><div class='add'>+	 * Track if this delayed item was already logged.</div><div class='add'>+	 * Protected by the mutex of the parent delayed inode.</div><div class='add'>+	 */</div><div class='add'>+	bool logged;</div><div class='add'>+	/* The maximum leaf size is 64K, so u16 is more than enough. */</div><div class='add'>+	u16 data_len;</div><div class='add'>+	char data[] __counted_by(data_len);</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static inline void btrfs_init_delayed_root(</div><div class='del'>-				struct btrfs_delayed_root *delayed_root)</div><div class='del'>-{</div><div class='del'>-	atomic_set(&amp;delayed_root-&gt;items, 0);</div><div class='del'>-	atomic_set(&amp;delayed_root-&gt;items_seq, 0);</div><div class='del'>-	delayed_root-&gt;nodes = 0;</div><div class='del'>-	spin_lock_init(&amp;delayed_root-&gt;lock);</div><div class='del'>-	init_waitqueue_head(&amp;delayed_root-&gt;wait);</div><div class='del'>-	INIT_LIST_HEAD(&amp;delayed_root-&gt;node_list);</div><div class='del'>-	INIT_LIST_HEAD(&amp;delayed_root-&gt;prepare_list);</div><div class='del'>-}</div><div class='del'>-</div><div class='add'>+void btrfs_init_delayed_root(struct btrfs_delayed_root *delayed_root);</div><div class='ctx'> int btrfs_insert_delayed_dir_index(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				   const char *name, int name_len,</div><div class='ctx'> 				   struct btrfs_inode *dir,</div><div class='del'>-				   struct btrfs_disk_key *disk_key, u8 type,</div><div class='add'>+				   const struct btrfs_disk_key *disk_key, u8 flags,</div><div class='ctx'> 				   u64 index);</div><div class='ctx'> </div><div class='ctx'> int btrfs_delete_delayed_dir_index(struct btrfs_trans_handle *trans,</div><div class='hunk'>@@ -110,9 +155,8 @@ int btrfs_commit_inode_delayed_inode(struct btrfs_inode *inode);</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> int btrfs_delayed_update_inode(struct btrfs_trans_handle *trans,</div><div class='del'>-			       struct btrfs_root *root,</div><div class='ctx'> 			       struct btrfs_inode *inode);</div><div class='del'>-int btrfs_fill_inode(struct inode *inode, u32 *rdev);</div><div class='add'>+int btrfs_fill_inode(struct btrfs_inode *inode, u32 *rdev);</div><div class='ctx'> int btrfs_delayed_delete_inode_ref(struct btrfs_inode *inode);</div><div class='ctx'> </div><div class='ctx'> /* Used for drop dead root */</div><div class='hunk'>@@ -122,16 +166,24 @@ void btrfs_kill_all_delayed_nodes(struct btrfs_root *root);</div><div class='ctx'> void btrfs_destroy_delayed_inodes(struct btrfs_fs_info *fs_info);</div><div class='ctx'> </div><div class='ctx'> /* Used for readdir() */</div><div class='del'>-bool btrfs_readdir_get_delayed_items(struct inode *inode,</div><div class='add'>+bool btrfs_readdir_get_delayed_items(struct btrfs_inode *inode,</div><div class='add'>+				     u64 last_index,</div><div class='ctx'> 				     struct list_head *ins_list,</div><div class='ctx'> 				     struct list_head *del_list);</div><div class='del'>-void btrfs_readdir_put_delayed_items(struct inode *inode,</div><div class='add'>+void btrfs_readdir_put_delayed_items(struct btrfs_inode *inode,</div><div class='ctx'> 				     struct list_head *ins_list,</div><div class='ctx'> 				     struct list_head *del_list);</div><div class='del'>-int btrfs_should_delete_dir_index(struct list_head *del_list,</div><div class='del'>-				  u64 index);</div><div class='del'>-int btrfs_readdir_delayed_dir_index(struct dir_context *ctx,</div><div class='del'>-				    struct list_head *ins_list);</div><div class='add'>+bool btrfs_should_delete_dir_index(const struct list_head *del_list, u64 index);</div><div class='add'>+bool btrfs_readdir_delayed_dir_index(struct dir_context *ctx,</div><div class='add'>+				     const struct list_head *ins_list);</div><div class='add'>+</div><div class='add'>+/* Used during directory logging. */</div><div class='add'>+void btrfs_log_get_delayed_items(struct btrfs_inode *inode,</div><div class='add'>+				 struct list_head *ins_list,</div><div class='add'>+				 struct list_head *del_list);</div><div class='add'>+void btrfs_log_put_delayed_items(struct btrfs_inode *inode,</div><div class='add'>+				 struct list_head *ins_list,</div><div class='add'>+				 struct list_head *del_list);</div><div class='ctx'> </div><div class='ctx'> /* for init */</div><div class='ctx'> int __init btrfs_delayed_inode_init(void);</div><div class='hunk'>@@ -140,4 +192,81 @@ void __cold btrfs_delayed_inode_exit(void);</div><div class='ctx'> /* for debugging */</div><div class='ctx'> void btrfs_assert_delayed_root_empty(struct btrfs_fs_info *fs_info);</div><div class='ctx'> </div><div class='add'>+#define BTRFS_DELAYED_NODE_REF_TRACKER_QUARANTINE_COUNT		16</div><div class='add'>+#define BTRFS_DELAYED_NODE_REF_TRACKER_DISPLAY_LIMIT		16</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BTRFS_DEBUG</div><div class='add'>+static inline void btrfs_delayed_node_ref_tracker_dir_init(struct btrfs_delayed_node *node)</div><div class='add'>+{</div><div class='add'>+	if (!btrfs_test_opt(node-&gt;root-&gt;fs_info, REF_TRACKER))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	ref_tracker_dir_init(&amp;node-&gt;ref_dir.dir,</div><div class='add'>+			     BTRFS_DELAYED_NODE_REF_TRACKER_QUARANTINE_COUNT,</div><div class='add'>+			     "delayed_node");</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_delayed_node_ref_tracker_dir_exit(struct btrfs_delayed_node *node)</div><div class='add'>+{</div><div class='add'>+	if (!btrfs_test_opt(node-&gt;root-&gt;fs_info, REF_TRACKER))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	ref_tracker_dir_exit(&amp;node-&gt;ref_dir.dir);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_delayed_node_ref_tracker_dir_print(struct btrfs_delayed_node *node)</div><div class='add'>+{</div><div class='add'>+	if (!btrfs_test_opt(node-&gt;root-&gt;fs_info, REF_TRACKER))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Only print if there are leaked references. The caller is</div><div class='add'>+	 * holding one reference, so if refs == 1 there is no leak.</div><div class='add'>+	 */</div><div class='add'>+	if (refcount_read(&amp;node-&gt;refs) == 1)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	ref_tracker_dir_print(&amp;node-&gt;ref_dir.dir,</div><div class='add'>+			      BTRFS_DELAYED_NODE_REF_TRACKER_DISPLAY_LIMIT);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int btrfs_delayed_node_ref_tracker_alloc(struct btrfs_delayed_node *node,</div><div class='add'>+						       struct btrfs_ref_tracker *tracker,</div><div class='add'>+						       gfp_t gfp)</div><div class='add'>+{</div><div class='add'>+	if (!btrfs_test_opt(node-&gt;root-&gt;fs_info, REF_TRACKER))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	return ref_tracker_alloc(&amp;node-&gt;ref_dir.dir, &amp;tracker-&gt;tracker, gfp);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int btrfs_delayed_node_ref_tracker_free(struct btrfs_delayed_node *node,</div><div class='add'>+						      struct btrfs_ref_tracker *tracker)</div><div class='add'>+{</div><div class='add'>+	if (!btrfs_test_opt(node-&gt;root-&gt;fs_info, REF_TRACKER))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	return ref_tracker_free(&amp;node-&gt;ref_dir.dir, &amp;tracker-&gt;tracker);</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+static inline void btrfs_delayed_node_ref_tracker_dir_init(struct btrfs_delayed_node *node) { }</div><div class='add'>+</div><div class='add'>+static inline void btrfs_delayed_node_ref_tracker_dir_exit(struct btrfs_delayed_node *node) { }</div><div class='add'>+</div><div class='add'>+static inline void btrfs_delayed_node_ref_tracker_dir_print(struct btrfs_delayed_node *node) { }</div><div class='add'>+</div><div class='add'>+static inline int btrfs_delayed_node_ref_tracker_alloc(struct btrfs_delayed_node *node,</div><div class='add'>+						       struct btrfs_ref_tracker *tracker,</div><div class='add'>+						       gfp_t gfp)</div><div class='add'>+{</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int btrfs_delayed_node_ref_tracker_free(struct btrfs_delayed_node *node,</div><div class='add'>+						      struct btrfs_ref_tracker *tracker)</div><div class='add'>+{</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/btrfs/delayed-ref.c b/fs/btrfs/delayed-ref.c<br/>index cca7e85e32dd..e8bc37453336 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/delayed-ref.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/delayed-ref.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/delayed-ref.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/delayed-ref.c</a></div><div class='hunk'>@@ -6,16 +6,18 @@</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/sort.h&gt;</div><div class='add'>+#include "messages.h"</div><div class='ctx'> #include "ctree.h"</div><div class='ctx'> #include "delayed-ref.h"</div><div class='add'>+#include "extent-tree.h"</div><div class='ctx'> #include "transaction.h"</div><div class='ctx'> #include "qgroup.h"</div><div class='ctx'> #include "space-info.h"</div><div class='ctx'> #include "tree-mod-log.h"</div><div class='add'>+#include "fs.h"</div><div class='ctx'> </div><div class='ctx'> struct kmem_cache *btrfs_delayed_ref_head_cachep;</div><div class='del'>-struct kmem_cache *btrfs_delayed_tree_ref_cachep;</div><div class='del'>-struct kmem_cache *btrfs_delayed_data_ref_cachep;</div><div class='add'>+struct kmem_cache *btrfs_delayed_ref_node_cachep;</div><div class='ctx'> struct kmem_cache *btrfs_delayed_extent_op_cachep;</div><div class='ctx'> /*</div><div class='ctx'>  * delayed back reference update tracking.  For subvolume trees</div><div class='hunk'>@@ -51,38 +53,24 @@ bool btrfs_check_space_for_delayed_refs(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_should_throttle_delayed_refs(struct btrfs_trans_handle *trans)</div><div class='del'>-{</div><div class='del'>-	u64 num_entries =</div><div class='del'>-		atomic_read(&amp;trans-&gt;transaction-&gt;delayed_refs.num_entries);</div><div class='del'>-	u64 avg_runtime;</div><div class='del'>-	u64 val;</div><div class='del'>-</div><div class='del'>-	smp_mb();</div><div class='del'>-	avg_runtime = trans-&gt;fs_info-&gt;avg_delayed_ref_runtime;</div><div class='del'>-	val = num_entries * avg_runtime;</div><div class='del'>-	if (val &gt;= NSEC_PER_SEC)</div><div class='del'>-		return 1;</div><div class='del'>-	if (val &gt;= NSEC_PER_SEC / 2)</div><div class='del'>-		return 2;</div><div class='del'>-</div><div class='del'>-	return btrfs_check_space_for_delayed_refs(trans-&gt;fs_info);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * Release a ref head's reservation</div><div class='add'>+/*</div><div class='add'>+ * Release a ref head's reservation.</div><div class='ctx'>  *</div><div class='ctx'>  * @fs_info:  the filesystem</div><div class='del'>- * @nr:       number of items to drop</div><div class='add'>+ * @nr_refs:  number of delayed refs to drop</div><div class='add'>+ * @nr_csums: number of csum items to drop</div><div class='ctx'>  *</div><div class='del'>- * This drops the delayed ref head's count from the delayed refs rsv and frees</div><div class='del'>- * any excess reservation we had.</div><div class='add'>+ * Drops the delayed ref head's count from the delayed refs rsv and free any</div><div class='add'>+ * excess reservation we had.</div><div class='ctx'>  */</div><div class='del'>-void btrfs_delayed_refs_rsv_release(struct btrfs_fs_info *fs_info, int nr)</div><div class='add'>+void btrfs_delayed_refs_rsv_release(struct btrfs_fs_info *fs_info, int nr_refs, int nr_csums)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_block_rsv *block_rsv = &amp;fs_info-&gt;delayed_refs_rsv;</div><div class='del'>-	u64 num_bytes = btrfs_calc_insert_metadata_size(fs_info, nr);</div><div class='del'>-	u64 released = 0;</div><div class='add'>+	u64 num_bytes;</div><div class='add'>+	u64 released;</div><div class='add'>+</div><div class='add'>+	num_bytes = btrfs_calc_delayed_ref_bytes(fs_info, nr_refs);</div><div class='add'>+	num_bytes += btrfs_calc_delayed_ref_csum_bytes(fs_info, nr_csums);</div><div class='ctx'> </div><div class='ctx'> 	released = btrfs_block_rsv_release(fs_info, block_rsv, num_bytes, NULL);</div><div class='ctx'> 	if (released)</div><div class='hunk'>@@ -91,81 +79,127 @@ void btrfs_delayed_refs_rsv_release(struct btrfs_fs_info *fs_info, int nr)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * btrfs_update_delayed_refs_rsv - adjust the size of the delayed refs rsv</div><div class='del'>- * @trans - the trans that may have generated delayed refs</div><div class='add'>+ * Adjust the size of the delayed refs rsv.</div><div class='ctx'>  *</div><div class='del'>- * This is to be called anytime we may have adjusted trans-&gt;delayed_ref_updates,</div><div class='del'>- * it'll calculate the additional size and add it to the delayed_refs_rsv.</div><div class='add'>+ * This is to be called anytime we may have adjusted trans-&gt;delayed_ref_updates</div><div class='add'>+ * or trans-&gt;delayed_ref_csum_deletions, it'll calculate the additional size and</div><div class='add'>+ * add it to the delayed_refs_rsv.</div><div class='ctx'>  */</div><div class='ctx'> void btrfs_update_delayed_refs_rsv(struct btrfs_trans_handle *trans)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_block_rsv *delayed_rsv = &amp;fs_info-&gt;delayed_refs_rsv;</div><div class='add'>+	struct btrfs_block_rsv *local_rsv = &amp;trans-&gt;delayed_rsv;</div><div class='ctx'> 	u64 num_bytes;</div><div class='add'>+	u64 reserved_bytes;</div><div class='add'>+</div><div class='add'>+	if (btrfs_is_testing(fs_info))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	num_bytes = btrfs_calc_delayed_ref_bytes(fs_info, trans-&gt;delayed_ref_updates);</div><div class='add'>+	num_bytes += btrfs_calc_delayed_ref_csum_bytes(fs_info,</div><div class='add'>+						       trans-&gt;delayed_ref_csum_deletions);</div><div class='ctx'> </div><div class='del'>-	if (!trans-&gt;delayed_ref_updates)</div><div class='add'>+	if (num_bytes == 0)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	num_bytes = btrfs_calc_insert_metadata_size(fs_info,</div><div class='del'>-						    trans-&gt;delayed_ref_updates);</div><div class='add'>+	/*</div><div class='add'>+	 * Try to take num_bytes from the transaction's local delayed reserve.</div><div class='add'>+	 * If not possible, try to take as much as it's available. If the local</div><div class='add'>+	 * reserve doesn't have enough reserved space, the delayed refs reserve</div><div class='add'>+	 * will be refilled next time btrfs_delayed_refs_rsv_refill() is called</div><div class='add'>+	 * by someone or if a transaction commit is triggered before that, the</div><div class='add'>+	 * global block reserve will be used. We want to minimize using the</div><div class='add'>+	 * global block reserve for cases we can account for in advance, to</div><div class='add'>+	 * avoid exhausting it and reach -ENOSPC during a transaction commit.</div><div class='add'>+	 */</div><div class='add'>+	spin_lock(&amp;local_rsv-&gt;lock);</div><div class='add'>+	reserved_bytes = min(num_bytes, local_rsv-&gt;reserved);</div><div class='add'>+	local_rsv-&gt;reserved -= reserved_bytes;</div><div class='add'>+	local_rsv-&gt;full = (local_rsv-&gt;reserved &gt;= local_rsv-&gt;size);</div><div class='add'>+	spin_unlock(&amp;local_rsv-&gt;lock);</div><div class='add'>+</div><div class='ctx'> 	spin_lock(&amp;delayed_rsv-&gt;lock);</div><div class='ctx'> 	delayed_rsv-&gt;size += num_bytes;</div><div class='del'>-	delayed_rsv-&gt;full = 0;</div><div class='add'>+	delayed_rsv-&gt;reserved += reserved_bytes;</div><div class='add'>+	delayed_rsv-&gt;full = (delayed_rsv-&gt;reserved &gt;= delayed_rsv-&gt;size);</div><div class='ctx'> 	spin_unlock(&amp;delayed_rsv-&gt;lock);</div><div class='ctx'> 	trans-&gt;delayed_ref_updates = 0;</div><div class='add'>+	trans-&gt;delayed_ref_csum_deletions = 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * Transfer bytes to our delayed refs rsv</div><div class='del'>- *</div><div class='del'>- * @fs_info:   the filesystem</div><div class='del'>- * @src:       source block rsv to transfer from</div><div class='del'>- * @num_bytes: number of bytes to transfer</div><div class='del'>- *</div><div class='del'>- * This transfers up to the num_bytes amount from the src rsv to the</div><div class='del'>- * delayed_refs_rsv.  Any extra bytes are returned to the space info.</div><div class='add'>+/*</div><div class='add'>+ * Adjust the size of the delayed refs block reserve for 1 block group item</div><div class='add'>+ * insertion, used after allocating a block group.</div><div class='ctx'>  */</div><div class='del'>-void btrfs_migrate_to_delayed_refs_rsv(struct btrfs_fs_info *fs_info,</div><div class='del'>-				       struct btrfs_block_rsv *src,</div><div class='del'>-				       u64 num_bytes)</div><div class='add'>+void btrfs_inc_delayed_refs_rsv_bg_inserts(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_block_rsv *delayed_refs_rsv = &amp;fs_info-&gt;delayed_refs_rsv;</div><div class='del'>-	u64 to_free = 0;</div><div class='add'>+	struct btrfs_block_rsv *delayed_rsv = &amp;fs_info-&gt;delayed_refs_rsv;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;src-&gt;lock);</div><div class='del'>-	src-&gt;reserved -= num_bytes;</div><div class='del'>-	src-&gt;size -= num_bytes;</div><div class='del'>-	spin_unlock(&amp;src-&gt;lock);</div><div class='add'>+	spin_lock(&amp;delayed_rsv-&gt;lock);</div><div class='add'>+	/*</div><div class='add'>+	 * Inserting a block group item does not require changing the free space</div><div class='add'>+	 * tree, only the extent tree or the block group tree, so this is all we</div><div class='add'>+	 * need.</div><div class='add'>+	 */</div><div class='add'>+	delayed_rsv-&gt;size += btrfs_calc_insert_metadata_size(fs_info, 1);</div><div class='add'>+	delayed_rsv-&gt;full = false;</div><div class='add'>+	spin_unlock(&amp;delayed_rsv-&gt;lock);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;delayed_refs_rsv-&gt;lock);</div><div class='del'>-	if (delayed_refs_rsv-&gt;size &gt; delayed_refs_rsv-&gt;reserved) {</div><div class='del'>-		u64 delta = delayed_refs_rsv-&gt;size -</div><div class='del'>-			delayed_refs_rsv-&gt;reserved;</div><div class='del'>-		if (num_bytes &gt; delta) {</div><div class='del'>-			to_free = num_bytes - delta;</div><div class='del'>-			num_bytes = delta;</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-		to_free = num_bytes;</div><div class='del'>-		num_bytes = 0;</div><div class='del'>-	}</div><div class='add'>+/*</div><div class='add'>+ * Adjust the size of the delayed refs block reserve to release space for 1</div><div class='add'>+ * block group item insertion.</div><div class='add'>+ */</div><div class='add'>+void btrfs_dec_delayed_refs_rsv_bg_inserts(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_block_rsv *delayed_rsv = &amp;fs_info-&gt;delayed_refs_rsv;</div><div class='add'>+	const u64 num_bytes = btrfs_calc_insert_metadata_size(fs_info, 1);</div><div class='add'>+	u64 released;</div><div class='ctx'> </div><div class='del'>-	if (num_bytes)</div><div class='del'>-		delayed_refs_rsv-&gt;reserved += num_bytes;</div><div class='del'>-	if (delayed_refs_rsv-&gt;reserved &gt;= delayed_refs_rsv-&gt;size)</div><div class='del'>-		delayed_refs_rsv-&gt;full = 1;</div><div class='del'>-	spin_unlock(&amp;delayed_refs_rsv-&gt;lock);</div><div class='add'>+	released = btrfs_block_rsv_release(fs_info, delayed_rsv, num_bytes, NULL);</div><div class='add'>+	if (released &gt; 0)</div><div class='add'>+		trace_btrfs_space_reservation(fs_info, "delayed_refs_rsv",</div><div class='add'>+					      0, released, 0);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if (num_bytes)</div><div class='add'>+/*</div><div class='add'>+ * Adjust the size of the delayed refs block reserve for 1 block group item</div><div class='add'>+ * update.</div><div class='add'>+ */</div><div class='add'>+void btrfs_inc_delayed_refs_rsv_bg_updates(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_block_rsv *delayed_rsv = &amp;fs_info-&gt;delayed_refs_rsv;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;delayed_rsv-&gt;lock);</div><div class='add'>+	/*</div><div class='add'>+	 * Updating a block group item does not result in new nodes/leaves and</div><div class='add'>+	 * does not require changing the free space tree, only the extent tree</div><div class='add'>+	 * or the block group tree, so this is all we need.</div><div class='add'>+	 */</div><div class='add'>+	delayed_rsv-&gt;size += btrfs_calc_metadata_size(fs_info, 1);</div><div class='add'>+	delayed_rsv-&gt;full = false;</div><div class='add'>+	spin_unlock(&amp;delayed_rsv-&gt;lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Adjust the size of the delayed refs block reserve to release space for 1</div><div class='add'>+ * block group item update.</div><div class='add'>+ */</div><div class='add'>+void btrfs_dec_delayed_refs_rsv_bg_updates(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_block_rsv *delayed_rsv = &amp;fs_info-&gt;delayed_refs_rsv;</div><div class='add'>+	const u64 num_bytes = btrfs_calc_metadata_size(fs_info, 1);</div><div class='add'>+	u64 released;</div><div class='add'>+</div><div class='add'>+	released = btrfs_block_rsv_release(fs_info, delayed_rsv, num_bytes, NULL);</div><div class='add'>+	if (released &gt; 0)</div><div class='ctx'> 		trace_btrfs_space_reservation(fs_info, "delayed_refs_rsv",</div><div class='del'>-					      0, num_bytes, 1);</div><div class='del'>-	if (to_free)</div><div class='del'>-		btrfs_space_info_free_bytes_may_use(fs_info,</div><div class='del'>-				delayed_refs_rsv-&gt;space_info, to_free);</div><div class='add'>+					      0, released, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * Refill based on our delayed refs usage</div><div class='add'>+/*</div><div class='add'>+ * Refill based on our delayed refs usage.</div><div class='ctx'>  *</div><div class='ctx'>  * @fs_info: the filesystem</div><div class='ctx'>  * @flush:   control how we can flush for this reservation.</div><div class='hunk'>@@ -177,8 +211,11 @@ int btrfs_delayed_refs_rsv_refill(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				  enum btrfs_reserve_flush_enum flush)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_block_rsv *block_rsv = &amp;fs_info-&gt;delayed_refs_rsv;</div><div class='del'>-	u64 limit = btrfs_calc_insert_metadata_size(fs_info, 1);</div><div class='add'>+	struct btrfs_space_info *space_info = block_rsv-&gt;space_info;</div><div class='add'>+	u64 limit = btrfs_calc_delayed_ref_bytes(fs_info, 1);</div><div class='ctx'> 	u64 num_bytes = 0;</div><div class='add'>+	u64 refilled_bytes;</div><div class='add'>+	u64 to_free;</div><div class='ctx'> 	int ret = -ENOSPC;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;block_rsv-&gt;lock);</div><div class='hunk'>@@ -191,66 +228,62 @@ int btrfs_delayed_refs_rsv_refill(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	if (!num_bytes)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_reserve_metadata_bytes(fs_info-&gt;extent_root, block_rsv,</div><div class='del'>-					   num_bytes, flush);</div><div class='add'>+	ret = btrfs_reserve_metadata_bytes(space_info, num_bytes, flush);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='del'>-	btrfs_block_rsv_add_bytes(block_rsv, num_bytes, 0);</div><div class='del'>-	trace_btrfs_space_reservation(fs_info, "delayed_refs_rsv",</div><div class='del'>-				      0, num_bytes, 1);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * compare two delayed tree backrefs with same bytenr and type</div><div class='del'>- */</div><div class='del'>-static int comp_tree_refs(struct btrfs_delayed_tree_ref *ref1,</div><div class='del'>-			  struct btrfs_delayed_tree_ref *ref2)</div><div class='del'>-{</div><div class='del'>-	if (ref1-&gt;node.type == BTRFS_TREE_BLOCK_REF_KEY) {</div><div class='del'>-		if (ref1-&gt;root &lt; ref2-&gt;root)</div><div class='del'>-			return -1;</div><div class='del'>-		if (ref1-&gt;root &gt; ref2-&gt;root)</div><div class='del'>-			return 1;</div><div class='add'>+	/*</div><div class='add'>+	 * We may have raced with someone else, so check again if we the block</div><div class='add'>+	 * reserve is still not full and release any excess space.</div><div class='add'>+	 */</div><div class='add'>+	spin_lock(&amp;block_rsv-&gt;lock);</div><div class='add'>+	if (block_rsv-&gt;reserved &lt; block_rsv-&gt;size) {</div><div class='add'>+		u64 needed = block_rsv-&gt;size - block_rsv-&gt;reserved;</div><div class='add'>+</div><div class='add'>+		if (num_bytes &gt;= needed) {</div><div class='add'>+			block_rsv-&gt;reserved += needed;</div><div class='add'>+			block_rsv-&gt;full = true;</div><div class='add'>+			to_free = num_bytes - needed;</div><div class='add'>+			refilled_bytes = needed;</div><div class='add'>+		} else {</div><div class='add'>+			block_rsv-&gt;reserved += num_bytes;</div><div class='add'>+			to_free = 0;</div><div class='add'>+			refilled_bytes = num_bytes;</div><div class='add'>+		}</div><div class='ctx'> 	} else {</div><div class='del'>-		if (ref1-&gt;parent &lt; ref2-&gt;parent)</div><div class='del'>-			return -1;</div><div class='del'>-		if (ref1-&gt;parent &gt; ref2-&gt;parent)</div><div class='del'>-			return 1;</div><div class='add'>+		to_free = num_bytes;</div><div class='add'>+		refilled_bytes = 0;</div><div class='ctx'> 	}</div><div class='add'>+	spin_unlock(&amp;block_rsv-&gt;lock);</div><div class='add'>+</div><div class='add'>+	if (to_free &gt; 0)</div><div class='add'>+		btrfs_space_info_free_bytes_may_use(space_info, to_free);</div><div class='add'>+</div><div class='add'>+	if (refilled_bytes &gt; 0)</div><div class='add'>+		trace_btrfs_space_reservation(fs_info, "delayed_refs_rsv", 0,</div><div class='add'>+					      refilled_bytes, 1);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * compare two delayed data backrefs with same bytenr and type</div><div class='ctx'>  */</div><div class='del'>-static int comp_data_refs(struct btrfs_delayed_data_ref *ref1,</div><div class='del'>-			  struct btrfs_delayed_data_ref *ref2)</div><div class='add'>+static int comp_data_refs(const struct btrfs_delayed_ref_node *ref1,</div><div class='add'>+			  const struct btrfs_delayed_ref_node *ref2)</div><div class='ctx'> {</div><div class='del'>-	if (ref1-&gt;node.type == BTRFS_EXTENT_DATA_REF_KEY) {</div><div class='del'>-		if (ref1-&gt;root &lt; ref2-&gt;root)</div><div class='del'>-			return -1;</div><div class='del'>-		if (ref1-&gt;root &gt; ref2-&gt;root)</div><div class='del'>-			return 1;</div><div class='del'>-		if (ref1-&gt;objectid &lt; ref2-&gt;objectid)</div><div class='del'>-			return -1;</div><div class='del'>-		if (ref1-&gt;objectid &gt; ref2-&gt;objectid)</div><div class='del'>-			return 1;</div><div class='del'>-		if (ref1-&gt;offset &lt; ref2-&gt;offset)</div><div class='del'>-			return -1;</div><div class='del'>-		if (ref1-&gt;offset &gt; ref2-&gt;offset)</div><div class='del'>-			return 1;</div><div class='del'>-	} else {</div><div class='del'>-		if (ref1-&gt;parent &lt; ref2-&gt;parent)</div><div class='del'>-			return -1;</div><div class='del'>-		if (ref1-&gt;parent &gt; ref2-&gt;parent)</div><div class='del'>-			return 1;</div><div class='del'>-	}</div><div class='add'>+	if (ref1-&gt;data_ref.objectid &lt; ref2-&gt;data_ref.objectid)</div><div class='add'>+		return -1;</div><div class='add'>+	if (ref1-&gt;data_ref.objectid &gt; ref2-&gt;data_ref.objectid)</div><div class='add'>+		return 1;</div><div class='add'>+	if (ref1-&gt;data_ref.offset &lt; ref2-&gt;data_ref.offset)</div><div class='add'>+		return -1;</div><div class='add'>+	if (ref1-&gt;data_ref.offset &gt; ref2-&gt;data_ref.offset)</div><div class='add'>+		return 1;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int comp_refs(struct btrfs_delayed_ref_node *ref1,</div><div class='del'>-		     struct btrfs_delayed_ref_node *ref2,</div><div class='add'>+static int comp_refs(const struct btrfs_delayed_ref_node *ref1,</div><div class='add'>+		     const struct btrfs_delayed_ref_node *ref2,</div><div class='ctx'> 		     bool check_seq)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='hunk'>@@ -259,13 +292,20 @@ static int comp_refs(struct btrfs_delayed_ref_node *ref1,</div><div class='ctx'> 		return -1;</div><div class='ctx'> 	if (ref1-&gt;type &gt; ref2-&gt;type)</div><div class='ctx'> 		return 1;</div><div class='del'>-	if (ref1-&gt;type == BTRFS_TREE_BLOCK_REF_KEY ||</div><div class='del'>-	    ref1-&gt;type == BTRFS_SHARED_BLOCK_REF_KEY)</div><div class='del'>-		ret = comp_tree_refs(btrfs_delayed_node_to_tree_ref(ref1),</div><div class='del'>-				     btrfs_delayed_node_to_tree_ref(ref2));</div><div class='del'>-	else</div><div class='del'>-		ret = comp_data_refs(btrfs_delayed_node_to_data_ref(ref1),</div><div class='del'>-				     btrfs_delayed_node_to_data_ref(ref2));</div><div class='add'>+	if (ref1-&gt;type == BTRFS_SHARED_BLOCK_REF_KEY ||</div><div class='add'>+	    ref1-&gt;type == BTRFS_SHARED_DATA_REF_KEY) {</div><div class='add'>+		if (ref1-&gt;parent &lt; ref2-&gt;parent)</div><div class='add'>+			return -1;</div><div class='add'>+		if (ref1-&gt;parent &gt; ref2-&gt;parent)</div><div class='add'>+			return 1;</div><div class='add'>+	} else {</div><div class='add'>+		if (ref1-&gt;ref_root &lt; ref2-&gt;ref_root)</div><div class='add'>+			return -1;</div><div class='add'>+		if (ref1-&gt;ref_root &gt; ref2-&gt;ref_root)</div><div class='add'>+			return 1;</div><div class='add'>+		if (ref1-&gt;type == BTRFS_EXTENT_DATA_REF_KEY)</div><div class='add'>+			ret = comp_data_refs(ref1, ref2);</div><div class='add'>+	}</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	if (check_seq) {</div><div class='hunk'>@@ -277,145 +317,57 @@ static int comp_refs(struct btrfs_delayed_ref_node *ref1,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* insert a new ref to head ref rbtree */</div><div class='del'>-static struct btrfs_delayed_ref_head *htree_insert(struct rb_root_cached *root,</div><div class='del'>-						   struct rb_node *node)</div><div class='add'>+static int cmp_refs_node(const struct rb_node *new, const struct rb_node *exist)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node **p = &amp;root-&gt;rb_root.rb_node;</div><div class='del'>-	struct rb_node *parent_node = NULL;</div><div class='del'>-	struct btrfs_delayed_ref_head *entry;</div><div class='del'>-	struct btrfs_delayed_ref_head *ins;</div><div class='del'>-	u64 bytenr;</div><div class='del'>-	bool leftmost = true;</div><div class='del'>-</div><div class='del'>-	ins = rb_entry(node, struct btrfs_delayed_ref_head, href_node);</div><div class='del'>-	bytenr = ins-&gt;bytenr;</div><div class='del'>-	while (*p) {</div><div class='del'>-		parent_node = *p;</div><div class='del'>-		entry = rb_entry(parent_node, struct btrfs_delayed_ref_head,</div><div class='del'>-				 href_node);</div><div class='del'>-</div><div class='del'>-		if (bytenr &lt; entry-&gt;bytenr) {</div><div class='del'>-			p = &amp;(*p)-&gt;rb_left;</div><div class='del'>-		} else if (bytenr &gt; entry-&gt;bytenr) {</div><div class='del'>-			p = &amp;(*p)-&gt;rb_right;</div><div class='del'>-			leftmost = false;</div><div class='del'>-		} else {</div><div class='del'>-			return entry;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	const struct btrfs_delayed_ref_node *new_node =</div><div class='add'>+		rb_entry(new, struct btrfs_delayed_ref_node, ref_node);</div><div class='add'>+	const struct btrfs_delayed_ref_node *exist_node =</div><div class='add'>+		rb_entry(exist, struct btrfs_delayed_ref_node, ref_node);</div><div class='ctx'> </div><div class='del'>-	rb_link_node(node, parent_node, p);</div><div class='del'>-	rb_insert_color_cached(node, root, leftmost);</div><div class='del'>-	return NULL;</div><div class='add'>+	return comp_refs(new_node, exist_node, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct btrfs_delayed_ref_node* tree_insert(struct rb_root_cached *root,</div><div class='ctx'> 		struct btrfs_delayed_ref_node *ins)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node **p = &amp;root-&gt;rb_root.rb_node;</div><div class='ctx'> 	struct rb_node *node = &amp;ins-&gt;ref_node;</div><div class='del'>-	struct rb_node *parent_node = NULL;</div><div class='del'>-	struct btrfs_delayed_ref_node *entry;</div><div class='del'>-	bool leftmost = true;</div><div class='del'>-</div><div class='del'>-	while (*p) {</div><div class='del'>-		int comp;</div><div class='del'>-</div><div class='del'>-		parent_node = *p;</div><div class='del'>-		entry = rb_entry(parent_node, struct btrfs_delayed_ref_node,</div><div class='del'>-				 ref_node);</div><div class='del'>-		comp = comp_refs(ins, entry, true);</div><div class='del'>-		if (comp &lt; 0) {</div><div class='del'>-			p = &amp;(*p)-&gt;rb_left;</div><div class='del'>-		} else if (comp &gt; 0) {</div><div class='del'>-			p = &amp;(*p)-&gt;rb_right;</div><div class='del'>-			leftmost = false;</div><div class='del'>-		} else {</div><div class='del'>-			return entry;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	struct rb_node *exist = rb_find_add_cached(node, root, cmp_refs_node);</div><div class='ctx'> </div><div class='del'>-	rb_link_node(node, parent_node, p);</div><div class='del'>-	rb_insert_color_cached(node, root, leftmost);</div><div class='del'>-	return NULL;</div><div class='add'>+	return rb_entry_safe(exist, struct btrfs_delayed_ref_node, ref_node);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct btrfs_delayed_ref_head *find_first_ref_head(</div><div class='ctx'> 		struct btrfs_delayed_ref_root *dr)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node *n;</div><div class='del'>-	struct btrfs_delayed_ref_head *entry;</div><div class='del'>-</div><div class='del'>-	n = rb_first_cached(&amp;dr-&gt;href_root);</div><div class='del'>-	if (!n)</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	entry = rb_entry(n, struct btrfs_delayed_ref_head, href_node);</div><div class='add'>+	unsigned long from = 0;</div><div class='ctx'> </div><div class='del'>-	return entry;</div><div class='del'>-}</div><div class='add'>+	lockdep_assert_held(&amp;dr-&gt;lock);</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Find a head entry based on bytenr. This returns the delayed ref head if it</div><div class='del'>- * was able to find one, or NULL if nothing was in that spot.  If return_bigger</div><div class='del'>- * is given, the next bigger entry is returned if no exact match is found.</div><div class='del'>- */</div><div class='del'>-static struct btrfs_delayed_ref_head *find_ref_head(</div><div class='del'>-		struct btrfs_delayed_ref_root *dr, u64 bytenr,</div><div class='del'>-		bool return_bigger)</div><div class='del'>-{</div><div class='del'>-	struct rb_root *root = &amp;dr-&gt;href_root.rb_root;</div><div class='del'>-	struct rb_node *n;</div><div class='del'>-	struct btrfs_delayed_ref_head *entry;</div><div class='del'>-</div><div class='del'>-	n = root-&gt;rb_node;</div><div class='del'>-	entry = NULL;</div><div class='del'>-	while (n) {</div><div class='del'>-		entry = rb_entry(n, struct btrfs_delayed_ref_head, href_node);</div><div class='del'>-</div><div class='del'>-		if (bytenr &lt; entry-&gt;bytenr)</div><div class='del'>-			n = n-&gt;rb_left;</div><div class='del'>-		else if (bytenr &gt; entry-&gt;bytenr)</div><div class='del'>-			n = n-&gt;rb_right;</div><div class='del'>-		else</div><div class='del'>-			return entry;</div><div class='del'>-	}</div><div class='del'>-	if (entry &amp;&amp; return_bigger) {</div><div class='del'>-		if (bytenr &gt; entry-&gt;bytenr) {</div><div class='del'>-			n = rb_next(&amp;entry-&gt;href_node);</div><div class='del'>-			if (!n)</div><div class='del'>-				return NULL;</div><div class='del'>-			entry = rb_entry(n, struct btrfs_delayed_ref_head,</div><div class='del'>-					 href_node);</div><div class='del'>-		}</div><div class='del'>-		return entry;</div><div class='del'>-	}</div><div class='del'>-	return NULL;</div><div class='add'>+	return xa_find(&amp;dr-&gt;head_refs, &amp;from, ULONG_MAX, XA_PRESENT);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_delayed_ref_lock(struct btrfs_delayed_ref_root *delayed_refs,</div><div class='del'>-			   struct btrfs_delayed_ref_head *head)</div><div class='add'>+static bool btrfs_delayed_ref_lock(struct btrfs_delayed_ref_root *delayed_refs,</div><div class='add'>+				   struct btrfs_delayed_ref_head *head)</div><div class='ctx'> {</div><div class='ctx'> 	lockdep_assert_held(&amp;delayed_refs-&gt;lock);</div><div class='ctx'> 	if (mutex_trylock(&amp;head-&gt;mutex))</div><div class='del'>-		return 0;</div><div class='add'>+		return true;</div><div class='ctx'> </div><div class='ctx'> 	refcount_inc(&amp;head-&gt;refs);</div><div class='ctx'> 	spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;head-&gt;mutex);</div><div class='ctx'> 	spin_lock(&amp;delayed_refs-&gt;lock);</div><div class='del'>-	if (RB_EMPTY_NODE(&amp;head-&gt;href_node)) {</div><div class='add'>+	if (!head-&gt;tracked) {</div><div class='ctx'> 		mutex_unlock(&amp;head-&gt;mutex);</div><div class='ctx'> 		btrfs_put_delayed_ref_head(head);</div><div class='del'>-		return -EAGAIN;</div><div class='add'>+		return false;</div><div class='ctx'> 	}</div><div class='ctx'> 	btrfs_put_delayed_ref_head(head);</div><div class='del'>-	return 0;</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void drop_delayed_ref(struct btrfs_trans_handle *trans,</div><div class='add'>+static inline void drop_delayed_ref(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				    struct btrfs_delayed_ref_root *delayed_refs,</div><div class='ctx'> 				    struct btrfs_delayed_ref_head *head,</div><div class='ctx'> 				    struct btrfs_delayed_ref_node *ref)</div><div class='hunk'>@@ -425,12 +377,11 @@ static inline void drop_delayed_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	RB_CLEAR_NODE(&amp;ref-&gt;ref_node);</div><div class='ctx'> 	if (!list_empty(&amp;ref-&gt;add_list))</div><div class='ctx'> 		list_del(&amp;ref-&gt;add_list);</div><div class='del'>-	ref-&gt;in_tree = 0;</div><div class='ctx'> 	btrfs_put_delayed_ref(ref);</div><div class='del'>-	atomic_dec(&amp;delayed_refs-&gt;num_entries);</div><div class='add'>+	btrfs_delayed_refs_rsv_release(fs_info, 1, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool merge_ref(struct btrfs_trans_handle *trans,</div><div class='add'>+static bool merge_ref(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		      struct btrfs_delayed_ref_root *delayed_refs,</div><div class='ctx'> 		      struct btrfs_delayed_ref_head *head,</div><div class='ctx'> 		      struct btrfs_delayed_ref_node *ref,</div><div class='hunk'>@@ -460,10 +411,10 @@ static bool merge_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			mod = -next-&gt;ref_mod;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		drop_delayed_ref(trans, delayed_refs, head, next);</div><div class='add'>+		drop_delayed_ref(fs_info, delayed_refs, head, next);</div><div class='ctx'> 		ref-&gt;ref_mod += mod;</div><div class='ctx'> 		if (ref-&gt;ref_mod == 0) {</div><div class='del'>-			drop_delayed_ref(trans, delayed_refs, head, ref);</div><div class='add'>+			drop_delayed_ref(fs_info, delayed_refs, head, ref);</div><div class='ctx'> 			done = true;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			/*</div><div class='hunk'>@@ -477,11 +428,10 @@ static bool merge_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	return done;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_merge_delayed_refs(struct btrfs_trans_handle *trans,</div><div class='add'>+void btrfs_merge_delayed_refs(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			      struct btrfs_delayed_ref_root *delayed_refs,</div><div class='ctx'> 			      struct btrfs_delayed_ref_head *head)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_delayed_ref_node *ref;</div><div class='ctx'> 	struct rb_node *node;</div><div class='ctx'> 	u64 seq = 0;</div><div class='hunk'>@@ -502,7 +452,7 @@ again:</div><div class='ctx'> 		ref = rb_entry(node, struct btrfs_delayed_ref_node, ref_node);</div><div class='ctx'> 		if (seq &amp;&amp; ref-&gt;seq &gt;= seq)</div><div class='ctx'> 			continue;</div><div class='del'>-		if (merge_ref(trans, delayed_refs, head, ref, seq))</div><div class='add'>+		if (merge_ref(fs_info, delayed_refs, head, ref, seq))</div><div class='ctx'> 			goto again;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -523,78 +473,131 @@ int btrfs_check_delayed_seq(struct btrfs_fs_info *fs_info, u64 seq)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct btrfs_delayed_ref_head *btrfs_select_ref_head(</div><div class='add'>+		const struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		struct btrfs_delayed_ref_root *delayed_refs)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_delayed_ref_head *head;</div><div class='add'>+	unsigned long start_index;</div><div class='add'>+	unsigned long found_index;</div><div class='add'>+	bool found_head = false;</div><div class='add'>+	bool locked;</div><div class='ctx'> </div><div class='add'>+	spin_lock(&amp;delayed_refs-&gt;lock);</div><div class='ctx'> again:</div><div class='del'>-	head = find_ref_head(delayed_refs, delayed_refs-&gt;run_delayed_start,</div><div class='del'>-			     true);</div><div class='del'>-	if (!head &amp;&amp; delayed_refs-&gt;run_delayed_start != 0) {</div><div class='del'>-		delayed_refs-&gt;run_delayed_start = 0;</div><div class='del'>-		head = find_first_ref_head(delayed_refs);</div><div class='add'>+	start_index = (delayed_refs-&gt;run_delayed_start &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+	xa_for_each_start(&amp;delayed_refs-&gt;head_refs, found_index, head, start_index) {</div><div class='add'>+		if (!head-&gt;processing) {</div><div class='add'>+			found_head = true;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='del'>-	if (!head)</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	while (head-&gt;processing) {</div><div class='del'>-		struct rb_node *node;</div><div class='del'>-</div><div class='del'>-		node = rb_next(&amp;head-&gt;href_node);</div><div class='del'>-		if (!node) {</div><div class='del'>-			if (delayed_refs-&gt;run_delayed_start == 0)</div><div class='del'>-				return NULL;</div><div class='del'>-			delayed_refs-&gt;run_delayed_start = 0;</div><div class='del'>-			goto again;</div><div class='add'>+	if (!found_head) {</div><div class='add'>+		if (delayed_refs-&gt;run_delayed_start == 0) {</div><div class='add'>+			spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='add'>+			return NULL;</div><div class='ctx'> 		}</div><div class='del'>-		head = rb_entry(node, struct btrfs_delayed_ref_head,</div><div class='del'>-				href_node);</div><div class='add'>+		delayed_refs-&gt;run_delayed_start = 0;</div><div class='add'>+		goto again;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	head-&gt;processing = 1;</div><div class='add'>+	head-&gt;processing = true;</div><div class='ctx'> 	WARN_ON(delayed_refs-&gt;num_heads_ready == 0);</div><div class='ctx'> 	delayed_refs-&gt;num_heads_ready--;</div><div class='ctx'> 	delayed_refs-&gt;run_delayed_start = head-&gt;bytenr +</div><div class='ctx'> 		head-&gt;num_bytes;</div><div class='add'>+</div><div class='add'>+	locked = btrfs_delayed_ref_lock(delayed_refs, head);</div><div class='add'>+	spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We may have dropped the spin lock to get the head mutex lock, and</div><div class='add'>+	 * that might have given someone else time to free the head.  If that's</div><div class='add'>+	 * true, it has been removed from our list and we can move on.</div><div class='add'>+	 */</div><div class='add'>+	if (!locked)</div><div class='add'>+		return ERR_PTR(-EAGAIN);</div><div class='add'>+</div><div class='ctx'> 	return head;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_delete_ref_head(struct btrfs_delayed_ref_root *delayed_refs,</div><div class='add'>+void btrfs_unselect_ref_head(struct btrfs_delayed_ref_root *delayed_refs,</div><div class='add'>+			     struct btrfs_delayed_ref_head *head)</div><div class='add'>+{</div><div class='add'>+	spin_lock(&amp;delayed_refs-&gt;lock);</div><div class='add'>+	head-&gt;processing = false;</div><div class='add'>+	delayed_refs-&gt;num_heads_ready++;</div><div class='add'>+	spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='add'>+	btrfs_delayed_ref_unlock(head);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_delete_ref_head(const struct btrfs_fs_info *fs_info,</div><div class='add'>+			   struct btrfs_delayed_ref_root *delayed_refs,</div><div class='ctx'> 			   struct btrfs_delayed_ref_head *head)</div><div class='ctx'> {</div><div class='add'>+	const unsigned long index = (head-&gt;bytenr &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+</div><div class='ctx'> 	lockdep_assert_held(&amp;delayed_refs-&gt;lock);</div><div class='ctx'> 	lockdep_assert_held(&amp;head-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	rb_erase_cached(&amp;head-&gt;href_node, &amp;delayed_refs-&gt;href_root);</div><div class='del'>-	RB_CLEAR_NODE(&amp;head-&gt;href_node);</div><div class='del'>-	atomic_dec(&amp;delayed_refs-&gt;num_entries);</div><div class='add'>+	xa_erase(&amp;delayed_refs-&gt;head_refs, index);</div><div class='add'>+	head-&gt;tracked = false;</div><div class='ctx'> 	delayed_refs-&gt;num_heads--;</div><div class='del'>-	if (head-&gt;processing == 0)</div><div class='add'>+	if (!head-&gt;processing)</div><div class='ctx'> 		delayed_refs-&gt;num_heads_ready--;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+struct btrfs_delayed_ref_node *btrfs_select_delayed_ref(struct btrfs_delayed_ref_head *head)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_delayed_ref_node *ref;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held(&amp;head-&gt;mutex);</div><div class='add'>+	lockdep_assert_held(&amp;head-&gt;lock);</div><div class='add'>+</div><div class='add'>+	if (RB_EMPTY_ROOT(&amp;head-&gt;ref_tree.rb_root))</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Select a delayed ref of type BTRFS_ADD_DELAYED_REF first.</div><div class='add'>+	 * This is to prevent a ref count from going down to zero, which deletes</div><div class='add'>+	 * the extent item from the extent tree, when there still are references</div><div class='add'>+	 * to add, which would fail because they would not find the extent item.</div><div class='add'>+	 */</div><div class='add'>+	if (!list_empty(&amp;head-&gt;ref_add_list))</div><div class='add'>+		return list_first_entry(&amp;head-&gt;ref_add_list,</div><div class='add'>+					struct btrfs_delayed_ref_node, add_list);</div><div class='add'>+</div><div class='add'>+	ref = rb_entry(rb_first_cached(&amp;head-&gt;ref_tree),</div><div class='add'>+		       struct btrfs_delayed_ref_node, ref_node);</div><div class='add'>+	ASSERT(list_empty(&amp;ref-&gt;add_list));</div><div class='add'>+	return ref;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Helper to insert the ref_node to the tail or merge with tail.</div><div class='ctx'>  *</div><div class='del'>- * Return 0 for insert.</div><div class='del'>- * Return &gt;0 for merge.</div><div class='add'>+ * Return false if the ref was inserted.</div><div class='add'>+ * Return true if the ref was merged into an existing one (and therefore can be</div><div class='add'>+ * freed by the caller).</div><div class='ctx'>  */</div><div class='del'>-static int insert_delayed_ref(struct btrfs_trans_handle *trans,</div><div class='del'>-			      struct btrfs_delayed_ref_root *root,</div><div class='del'>-			      struct btrfs_delayed_ref_head *href,</div><div class='del'>-			      struct btrfs_delayed_ref_node *ref)</div><div class='add'>+static bool insert_delayed_ref(struct btrfs_trans_handle *trans,</div><div class='add'>+			       struct btrfs_delayed_ref_head *href,</div><div class='add'>+			       struct btrfs_delayed_ref_node *ref)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_delayed_ref_root *root = &amp;trans-&gt;transaction-&gt;delayed_refs;</div><div class='ctx'> 	struct btrfs_delayed_ref_node *exist;</div><div class='ctx'> 	int mod;</div><div class='del'>-	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;href-&gt;lock);</div><div class='ctx'> 	exist = tree_insert(&amp;href-&gt;ref_tree, ref);</div><div class='del'>-	if (!exist)</div><div class='del'>-		goto inserted;</div><div class='add'>+	if (!exist) {</div><div class='add'>+		if (ref-&gt;action == BTRFS_ADD_DELAYED_REF)</div><div class='add'>+			list_add_tail(&amp;ref-&gt;add_list, &amp;href-&gt;ref_add_list);</div><div class='add'>+		spin_unlock(&amp;href-&gt;lock);</div><div class='add'>+		trans-&gt;delayed_ref_updates++;</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* Now we are sure we can merge */</div><div class='del'>-	ret = 1;</div><div class='ctx'> 	if (exist-&gt;action == ref-&gt;action) {</div><div class='ctx'> 		mod = ref-&gt;ref_mod;</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -608,7 +611,7 @@ static int insert_delayed_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 					      &amp;href-&gt;ref_add_list);</div><div class='ctx'> 			else if (ref-&gt;action == BTRFS_DROP_DELAYED_REF) {</div><div class='ctx'> 				ASSERT(!list_empty(&amp;exist-&gt;add_list));</div><div class='del'>-				list_del(&amp;exist-&gt;add_list);</div><div class='add'>+				list_del_init(&amp;exist-&gt;add_list);</div><div class='ctx'> 			} else {</div><div class='ctx'> 				ASSERT(0);</div><div class='ctx'> 			}</div><div class='hunk'>@@ -619,15 +622,9 @@ static int insert_delayed_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	/* remove existing tail if its ref_mod is zero */</div><div class='ctx'> 	if (exist-&gt;ref_mod == 0)</div><div class='del'>-		drop_delayed_ref(trans, root, href, exist);</div><div class='del'>-	spin_unlock(&amp;href-&gt;lock);</div><div class='del'>-	return ret;</div><div class='del'>-inserted:</div><div class='del'>-	if (ref-&gt;action == BTRFS_ADD_DELAYED_REF)</div><div class='del'>-		list_add_tail(&amp;ref-&gt;add_list, &amp;href-&gt;ref_add_list);</div><div class='del'>-	atomic_inc(&amp;root-&gt;num_entries);</div><div class='add'>+		drop_delayed_ref(trans-&gt;fs_info, root, href, exist);</div><div class='ctx'> 	spin_unlock(&amp;href-&gt;lock);</div><div class='del'>-	return ret;</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -646,6 +643,15 @@ static noinline void update_existing_head_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	BUG_ON(existing-&gt;is_data != update-&gt;is_data);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;existing-&gt;lock);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * When freeing an extent, we may not know the owning root when we</div><div class='add'>+	 * first create the head_ref. However, some deref before the last deref</div><div class='add'>+	 * will know it, so we just need to update the head_ref accordingly.</div><div class='add'>+	 */</div><div class='add'>+	if (!existing-&gt;owning_root)</div><div class='add'>+		existing-&gt;owning_root = update-&gt;owning_root;</div><div class='add'>+</div><div class='ctx'> 	if (update-&gt;must_insert_reserved) {</div><div class='ctx'> 		/* if the extent was freed and then</div><div class='ctx'> 		 * reallocated before the delayed ref</div><div class='hunk'>@@ -655,6 +661,7 @@ static noinline void update_existing_head_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		 * Set it again here</div><div class='ctx'> 		 */</div><div class='ctx'> 		existing-&gt;must_insert_reserved = update-&gt;must_insert_reserved;</div><div class='add'>+		existing-&gt;owning_root = update-&gt;owning_root;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * update the num_bytes so we make sure the accounting</div><div class='hunk'>@@ -694,6 +701,8 @@ static noinline void update_existing_head_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If we are going to from a positive ref mod to a negative or vice</div><div class='ctx'> 	 * versa we need to make sure to adjust pending_csums accordingly.</div><div class='add'>+	 * We reserve bytes for csum deletion when adding or updating a ref head</div><div class='add'>+	 * see add_delayed_ref_head() for more details.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (existing-&gt;is_data) {</div><div class='ctx'> 		u64 csum_leaves =</div><div class='hunk'>@@ -702,11 +711,11 @@ static noinline void update_existing_head_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 		if (existing-&gt;total_ref_mod &gt;= 0 &amp;&amp; old_ref_mod &lt; 0) {</div><div class='ctx'> 			delayed_refs-&gt;pending_csums -= existing-&gt;num_bytes;</div><div class='del'>-			btrfs_delayed_refs_rsv_release(fs_info, csum_leaves);</div><div class='add'>+			btrfs_delayed_refs_rsv_release(fs_info, 0, csum_leaves);</div><div class='ctx'> 		}</div><div class='ctx'> 		if (existing-&gt;total_ref_mod &lt; 0 &amp;&amp; old_ref_mod &gt;= 0) {</div><div class='ctx'> 			delayed_refs-&gt;pending_csums += existing-&gt;num_bytes;</div><div class='del'>-			trans-&gt;delayed_ref_updates += csum_leaves;</div><div class='add'>+			trans-&gt;delayed_ref_csum_deletions += csum_leaves;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -714,97 +723,150 @@ static noinline void update_existing_head_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void init_delayed_ref_head(struct btrfs_delayed_ref_head *head_ref,</div><div class='add'>+				  struct btrfs_ref *generic_ref,</div><div class='ctx'> 				  struct btrfs_qgroup_extent_record *qrecord,</div><div class='del'>-				  u64 bytenr, u64 num_bytes, u64 ref_root,</div><div class='del'>-				  u64 reserved, int action, bool is_data,</div><div class='del'>-				  bool is_system)</div><div class='add'>+				  u64 reserved)</div><div class='ctx'> {</div><div class='ctx'> 	int count_mod = 1;</div><div class='del'>-	int must_insert_reserved = 0;</div><div class='add'>+	bool must_insert_reserved = false;</div><div class='ctx'> </div><div class='ctx'> 	/* If reserved is provided, it must be a data extent. */</div><div class='del'>-	BUG_ON(!is_data &amp;&amp; reserved);</div><div class='add'>+	BUG_ON(generic_ref-&gt;type != BTRFS_REF_DATA &amp;&amp; reserved);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * The head node stores the sum of all the mods, so dropping a ref</div><div class='del'>-	 * should drop the sum in the head node by one.</div><div class='del'>-	 */</div><div class='del'>-	if (action == BTRFS_UPDATE_DELAYED_HEAD)</div><div class='add'>+	switch (generic_ref-&gt;action) {</div><div class='add'>+	case BTRFS_ADD_DELAYED_REF:</div><div class='add'>+		/* count_mod is already set to 1. */</div><div class='add'>+		break;</div><div class='add'>+	case BTRFS_UPDATE_DELAYED_HEAD:</div><div class='ctx'> 		count_mod = 0;</div><div class='del'>-	else if (action == BTRFS_DROP_DELAYED_REF)</div><div class='add'>+		break;</div><div class='add'>+	case BTRFS_DROP_DELAYED_REF:</div><div class='add'>+		/*</div><div class='add'>+		 * The head node stores the sum of all the mods, so dropping a ref</div><div class='add'>+		 * should drop the sum in the head node by one.</div><div class='add'>+		 */</div><div class='ctx'> 		count_mod = -1;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * BTRFS_ADD_DELAYED_EXTENT means that we need to update the reserved</div><div class='del'>-	 * accounting when the extent is finally added, or if a later</div><div class='del'>-	 * modification deletes the delayed ref without ever inserting the</div><div class='del'>-	 * extent into the extent allocation tree.  ref-&gt;must_insert_reserved</div><div class='del'>-	 * is the flag used to record that accounting mods are required.</div><div class='del'>-	 *</div><div class='del'>-	 * Once we record must_insert_reserved, switch the action to</div><div class='del'>-	 * BTRFS_ADD_DELAYED_REF because other special casing is not required.</div><div class='del'>-	 */</div><div class='del'>-	if (action == BTRFS_ADD_DELAYED_EXTENT)</div><div class='del'>-		must_insert_reserved = 1;</div><div class='del'>-	else</div><div class='del'>-		must_insert_reserved = 0;</div><div class='add'>+		break;</div><div class='add'>+	case BTRFS_ADD_DELAYED_EXTENT:</div><div class='add'>+		/*</div><div class='add'>+		 * BTRFS_ADD_DELAYED_EXTENT means that we need to update the</div><div class='add'>+		 * reserved accounting when the extent is finally added, or if a</div><div class='add'>+		 * later modification deletes the delayed ref without ever</div><div class='add'>+		 * inserting the extent into the extent allocation tree.</div><div class='add'>+		 * ref-&gt;must_insert_reserved is the flag used to record that</div><div class='add'>+		 * accounting mods are required.</div><div class='add'>+		 *</div><div class='add'>+		 * Once we record must_insert_reserved, switch the action to</div><div class='add'>+		 * BTRFS_ADD_DELAYED_REF because other special casing is not</div><div class='add'>+		 * required.</div><div class='add'>+		 */</div><div class='add'>+		must_insert_reserved = true;</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	refcount_set(&amp;head_ref-&gt;refs, 1);</div><div class='del'>-	head_ref-&gt;bytenr = bytenr;</div><div class='del'>-	head_ref-&gt;num_bytes = num_bytes;</div><div class='add'>+	head_ref-&gt;bytenr = generic_ref-&gt;bytenr;</div><div class='add'>+	head_ref-&gt;num_bytes = generic_ref-&gt;num_bytes;</div><div class='ctx'> 	head_ref-&gt;ref_mod = count_mod;</div><div class='add'>+	head_ref-&gt;reserved_bytes = reserved;</div><div class='ctx'> 	head_ref-&gt;must_insert_reserved = must_insert_reserved;</div><div class='del'>-	head_ref-&gt;is_data = is_data;</div><div class='del'>-	head_ref-&gt;is_system = is_system;</div><div class='add'>+	head_ref-&gt;owning_root = generic_ref-&gt;owning_root;</div><div class='add'>+	head_ref-&gt;is_data = (generic_ref-&gt;type == BTRFS_REF_DATA);</div><div class='add'>+	head_ref-&gt;is_system = (generic_ref-&gt;ref_root == BTRFS_CHUNK_TREE_OBJECTID);</div><div class='ctx'> 	head_ref-&gt;ref_tree = RB_ROOT_CACHED;</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;head_ref-&gt;ref_add_list);</div><div class='del'>-	RB_CLEAR_NODE(&amp;head_ref-&gt;href_node);</div><div class='del'>-	head_ref-&gt;processing = 0;</div><div class='add'>+	head_ref-&gt;tracked = false;</div><div class='add'>+	head_ref-&gt;processing = false;</div><div class='ctx'> 	head_ref-&gt;total_ref_mod = count_mod;</div><div class='ctx'> 	spin_lock_init(&amp;head_ref-&gt;lock);</div><div class='ctx'> 	mutex_init(&amp;head_ref-&gt;mutex);</div><div class='ctx'> </div><div class='add'>+	/* If not metadata set an impossible level to help debugging. */</div><div class='add'>+	if (generic_ref-&gt;type == BTRFS_REF_METADATA)</div><div class='add'>+		head_ref-&gt;level = generic_ref-&gt;tree_ref.level;</div><div class='add'>+	else</div><div class='add'>+		head_ref-&gt;level = U8_MAX;</div><div class='add'>+</div><div class='ctx'> 	if (qrecord) {</div><div class='del'>-		if (ref_root &amp;&amp; reserved) {</div><div class='add'>+		if (generic_ref-&gt;ref_root &amp;&amp; reserved) {</div><div class='ctx'> 			qrecord-&gt;data_rsv = reserved;</div><div class='del'>-			qrecord-&gt;data_rsv_refroot = ref_root;</div><div class='add'>+			qrecord-&gt;data_rsv_refroot = generic_ref-&gt;ref_root;</div><div class='ctx'> 		}</div><div class='del'>-		qrecord-&gt;bytenr = bytenr;</div><div class='del'>-		qrecord-&gt;num_bytes = num_bytes;</div><div class='add'>+		qrecord-&gt;num_bytes = generic_ref-&gt;num_bytes;</div><div class='ctx'> 		qrecord-&gt;old_roots = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * helper function to actually insert a head node into the rbtree.</div><div class='del'>- * this does all the dirty work in terms of maintaining the correct</div><div class='del'>- * overall modification count.</div><div class='add'>+ * Helper function to actually insert a head node into the xarray. This does all</div><div class='add'>+ * the dirty work in terms of maintaining the correct overall modification</div><div class='add'>+ * count.</div><div class='add'>+ *</div><div class='add'>+ * The caller is responsible for calling kfree() on @qrecord. More specifically,</div><div class='add'>+ * if this function reports that it did not insert it as noted in</div><div class='add'>+ * @qrecord_inserted_ret, then it's safe to call kfree() on it.</div><div class='add'>+ *</div><div class='add'>+ * Returns an error pointer in case of an error.</div><div class='ctx'>  */</div><div class='ctx'> static noinline struct btrfs_delayed_ref_head *</div><div class='ctx'> add_delayed_ref_head(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		     struct btrfs_delayed_ref_head *head_ref,</div><div class='ctx'> 		     struct btrfs_qgroup_extent_record *qrecord,</div><div class='del'>-		     int action, int *qrecord_inserted_ret)</div><div class='add'>+		     int action, bool *qrecord_inserted_ret)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_delayed_ref_head *existing;</div><div class='ctx'> 	struct btrfs_delayed_ref_root *delayed_refs;</div><div class='del'>-	int qrecord_inserted = 0;</div><div class='add'>+	const unsigned long index = (head_ref-&gt;bytenr &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If 'qrecord_inserted_ret' is provided, then the first thing we need</div><div class='add'>+	 * to do is to initialize it to false just in case we have an exit</div><div class='add'>+	 * before trying to insert the record.</div><div class='add'>+	 */</div><div class='add'>+	if (qrecord_inserted_ret)</div><div class='add'>+		*qrecord_inserted_ret = false;</div><div class='ctx'> </div><div class='ctx'> 	delayed_refs = &amp;trans-&gt;transaction-&gt;delayed_refs;</div><div class='add'>+	lockdep_assert_held(&amp;delayed_refs-&gt;lock);</div><div class='add'>+</div><div class='add'>+#if BITS_PER_LONG == 32</div><div class='add'>+	if (head_ref-&gt;bytenr &gt;= MAX_LFS_FILESIZE) {</div><div class='add'>+		if (qrecord)</div><div class='add'>+			xa_release(&amp;delayed_refs-&gt;dirty_extents, index);</div><div class='add'>+		btrfs_err_rl(fs_info,</div><div class='add'>+"delayed ref head %llu is beyond 32bit page cache and xarray index limit",</div><div class='add'>+			     head_ref-&gt;bytenr);</div><div class='add'>+		btrfs_err_32bit_limit(fs_info);</div><div class='add'>+		return ERR_PTR(-EOVERFLOW);</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='ctx'> 	/* Record qgroup extent info if provided */</div><div class='ctx'> 	if (qrecord) {</div><div class='del'>-		if (btrfs_qgroup_trace_extent_nolock(trans-&gt;fs_info,</div><div class='del'>-					delayed_refs, qrecord))</div><div class='del'>-			kfree(qrecord);</div><div class='del'>-		else</div><div class='del'>-			qrecord_inserted = 1;</div><div class='add'>+		/*</div><div class='add'>+		 * Setting 'qrecord' but not 'qrecord_inserted_ret' will likely</div><div class='add'>+		 * result in a memory leakage.</div><div class='add'>+		 */</div><div class='add'>+		ASSERT(qrecord_inserted_ret != NULL);</div><div class='add'>+</div><div class='add'>+		int ret;</div><div class='add'>+</div><div class='add'>+		ret = btrfs_qgroup_trace_extent_nolock(fs_info, delayed_refs, qrecord,</div><div class='add'>+						       head_ref-&gt;bytenr);</div><div class='add'>+		if (ret) {</div><div class='add'>+			/* Clean up if insertion fails or item exists. */</div><div class='add'>+			xa_release(&amp;delayed_refs-&gt;dirty_extents, index);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				return ERR_PTR(ret);</div><div class='add'>+		} else if (qrecord_inserted_ret) {</div><div class='add'>+			*qrecord_inserted_ret = true;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	trace_add_delayed_ref_head(trans-&gt;fs_info, head_ref, action);</div><div class='add'>+	trace_add_delayed_ref_head(fs_info, head_ref, action);</div><div class='ctx'> </div><div class='del'>-	existing = htree_insert(&amp;delayed_refs-&gt;href_root,</div><div class='del'>-				&amp;head_ref-&gt;href_node);</div><div class='add'>+	existing = xa_load(&amp;delayed_refs-&gt;head_refs, index);</div><div class='ctx'> 	if (existing) {</div><div class='ctx'> 		update_existing_head_ref(trans, existing, head_ref);</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -814,26 +876,39 @@ add_delayed_ref_head(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		kmem_cache_free(btrfs_delayed_ref_head_cachep, head_ref);</div><div class='ctx'> 		head_ref = existing;</div><div class='ctx'> 	} else {</div><div class='add'>+		existing = xa_store(&amp;delayed_refs-&gt;head_refs, index, head_ref, GFP_ATOMIC);</div><div class='add'>+		if (xa_is_err(existing)) {</div><div class='add'>+			/* Memory was preallocated by the caller. */</div><div class='add'>+			ASSERT(xa_err(existing) != -ENOMEM);</div><div class='add'>+			return ERR_PTR(xa_err(existing));</div><div class='add'>+		} else if (WARN_ON(existing)) {</div><div class='add'>+			/*</div><div class='add'>+			 * Shouldn't happen we just did a lookup before under</div><div class='add'>+			 * delayed_refs-&gt;lock.</div><div class='add'>+			 */</div><div class='add'>+			return ERR_PTR(-EEXIST);</div><div class='add'>+		}</div><div class='add'>+		head_ref-&gt;tracked = true;</div><div class='add'>+		/*</div><div class='add'>+		 * We reserve the amount of bytes needed to delete csums when</div><div class='add'>+		 * adding the ref head and not when adding individual drop refs</div><div class='add'>+		 * since the csum items are deleted only after running the last</div><div class='add'>+		 * delayed drop ref (the data extent's ref count drops to 0).</div><div class='add'>+		 */</div><div class='ctx'> 		if (head_ref-&gt;is_data &amp;&amp; head_ref-&gt;ref_mod &lt; 0) {</div><div class='ctx'> 			delayed_refs-&gt;pending_csums += head_ref-&gt;num_bytes;</div><div class='del'>-			trans-&gt;delayed_ref_updates +=</div><div class='del'>-				btrfs_csum_bytes_to_leaves(trans-&gt;fs_info,</div><div class='del'>-							   head_ref-&gt;num_bytes);</div><div class='add'>+			trans-&gt;delayed_ref_csum_deletions +=</div><div class='add'>+				btrfs_csum_bytes_to_leaves(fs_info, head_ref-&gt;num_bytes);</div><div class='ctx'> 		}</div><div class='ctx'> 		delayed_refs-&gt;num_heads++;</div><div class='ctx'> 		delayed_refs-&gt;num_heads_ready++;</div><div class='del'>-		atomic_inc(&amp;delayed_refs-&gt;num_entries);</div><div class='del'>-		trans-&gt;delayed_ref_updates++;</div><div class='ctx'> 	}</div><div class='del'>-	if (qrecord_inserted_ret)</div><div class='del'>-		*qrecord_inserted_ret = qrecord_inserted;</div><div class='ctx'> </div><div class='ctx'> 	return head_ref;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * init_delayed_ref_common - Initialize the structure which represents a</div><div class='del'>- *			     modification to a an extent.</div><div class='add'>+ * Initialize the structure which represents a modification to an extent.</div><div class='ctx'>  *</div><div class='ctx'>  * @fs_info:    Internal to the mounted filesystem mount structure.</div><div class='ctx'>  *</div><div class='hunk'>@@ -858,106 +933,148 @@ add_delayed_ref_head(struct btrfs_trans_handle *trans,</div><div class='ctx'>  */</div><div class='ctx'> static void init_delayed_ref_common(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				    struct btrfs_delayed_ref_node *ref,</div><div class='del'>-				    u64 bytenr, u64 num_bytes, u64 ref_root,</div><div class='del'>-				    int action, u8 ref_type)</div><div class='add'>+				    struct btrfs_ref *generic_ref)</div><div class='ctx'> {</div><div class='add'>+	int action = generic_ref-&gt;action;</div><div class='ctx'> 	u64 seq = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (action == BTRFS_ADD_DELAYED_EXTENT)</div><div class='ctx'> 		action = BTRFS_ADD_DELAYED_REF;</div><div class='ctx'> </div><div class='del'>-	if (is_fstree(ref_root))</div><div class='add'>+	if (btrfs_is_fstree(generic_ref-&gt;ref_root))</div><div class='ctx'> 		seq = atomic64_read(&amp;fs_info-&gt;tree_mod_seq);</div><div class='ctx'> </div><div class='ctx'> 	refcount_set(&amp;ref-&gt;refs, 1);</div><div class='del'>-	ref-&gt;bytenr = bytenr;</div><div class='del'>-	ref-&gt;num_bytes = num_bytes;</div><div class='add'>+	ref-&gt;bytenr = generic_ref-&gt;bytenr;</div><div class='add'>+	ref-&gt;num_bytes = generic_ref-&gt;num_bytes;</div><div class='ctx'> 	ref-&gt;ref_mod = 1;</div><div class='ctx'> 	ref-&gt;action = action;</div><div class='del'>-	ref-&gt;is_head = 0;</div><div class='del'>-	ref-&gt;in_tree = 1;</div><div class='ctx'> 	ref-&gt;seq = seq;</div><div class='del'>-	ref-&gt;type = ref_type;</div><div class='add'>+	ref-&gt;type = btrfs_ref_type(generic_ref);</div><div class='add'>+	ref-&gt;ref_root = generic_ref-&gt;ref_root;</div><div class='add'>+	ref-&gt;parent = generic_ref-&gt;parent;</div><div class='ctx'> 	RB_CLEAR_NODE(&amp;ref-&gt;ref_node);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;ref-&gt;add_list);</div><div class='add'>+</div><div class='add'>+	if (generic_ref-&gt;type == BTRFS_REF_DATA)</div><div class='add'>+		ref-&gt;data_ref = generic_ref-&gt;data_ref;</div><div class='add'>+	else</div><div class='add'>+		ref-&gt;tree_ref = generic_ref-&gt;tree_ref;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * add a delayed tree ref.  This does all of the accounting required</div><div class='del'>- * to make sure the delayed ref is eventually processed before this</div><div class='del'>- * transaction commits.</div><div class='del'>- */</div><div class='del'>-int btrfs_add_delayed_tree_ref(struct btrfs_trans_handle *trans,</div><div class='del'>-			       struct btrfs_ref *generic_ref,</div><div class='del'>-			       struct btrfs_delayed_extent_op *extent_op)</div><div class='add'>+void btrfs_init_tree_ref(struct btrfs_ref *generic_ref, int level, u64 mod_root,</div><div class='add'>+			 bool skip_qgroup)</div><div class='add'>+{</div><div class='add'>+#ifdef CONFIG_BTRFS_DEBUG</div><div class='add'>+	/* If @real_root not set, use @root as fallback */</div><div class='add'>+	generic_ref-&gt;real_root = mod_root ?: generic_ref-&gt;ref_root;</div><div class='add'>+#endif</div><div class='add'>+	generic_ref-&gt;tree_ref.level = level;</div><div class='add'>+	generic_ref-&gt;type = BTRFS_REF_METADATA;</div><div class='add'>+	if (skip_qgroup || !(btrfs_is_fstree(generic_ref-&gt;ref_root) &amp;&amp;</div><div class='add'>+			     (!mod_root || btrfs_is_fstree(mod_root))))</div><div class='add'>+		generic_ref-&gt;skip_qgroup = true;</div><div class='add'>+	else</div><div class='add'>+		generic_ref-&gt;skip_qgroup = false;</div><div class='add'>+</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_init_data_ref(struct btrfs_ref *generic_ref, u64 ino, u64 offset,</div><div class='add'>+			 u64 mod_root, bool skip_qgroup)</div><div class='add'>+{</div><div class='add'>+#ifdef CONFIG_BTRFS_DEBUG</div><div class='add'>+	/* If @real_root not set, use @root as fallback */</div><div class='add'>+	generic_ref-&gt;real_root = mod_root ?: generic_ref-&gt;ref_root;</div><div class='add'>+#endif</div><div class='add'>+	generic_ref-&gt;data_ref.objectid = ino;</div><div class='add'>+	generic_ref-&gt;data_ref.offset = offset;</div><div class='add'>+	generic_ref-&gt;type = BTRFS_REF_DATA;</div><div class='add'>+	if (skip_qgroup || !(btrfs_is_fstree(generic_ref-&gt;ref_root) &amp;&amp;</div><div class='add'>+			     (!mod_root || btrfs_is_fstree(mod_root))))</div><div class='add'>+		generic_ref-&gt;skip_qgroup = true;</div><div class='add'>+	else</div><div class='add'>+		generic_ref-&gt;skip_qgroup = false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int add_delayed_ref(struct btrfs_trans_handle *trans,</div><div class='add'>+			   struct btrfs_ref *generic_ref,</div><div class='add'>+			   struct btrfs_delayed_extent_op *extent_op,</div><div class='add'>+			   u64 reserved)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='del'>-	struct btrfs_delayed_tree_ref *ref;</div><div class='add'>+	struct btrfs_delayed_ref_node *node;</div><div class='ctx'> 	struct btrfs_delayed_ref_head *head_ref;</div><div class='add'>+	struct btrfs_delayed_ref_head *new_head_ref;</div><div class='ctx'> 	struct btrfs_delayed_ref_root *delayed_refs;</div><div class='ctx'> 	struct btrfs_qgroup_extent_record *record = NULL;</div><div class='del'>-	int qrecord_inserted;</div><div class='del'>-	bool is_system;</div><div class='add'>+	const unsigned long index = (generic_ref-&gt;bytenr &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+	bool qrecord_reserved = false;</div><div class='add'>+	bool qrecord_inserted;</div><div class='ctx'> 	int action = generic_ref-&gt;action;</div><div class='del'>-	int level = generic_ref-&gt;tree_ref.level;</div><div class='add'>+	bool merged;</div><div class='ctx'> 	int ret;</div><div class='del'>-	u64 bytenr = generic_ref-&gt;bytenr;</div><div class='del'>-	u64 num_bytes = generic_ref-&gt;len;</div><div class='del'>-	u64 parent = generic_ref-&gt;parent;</div><div class='del'>-	u8 ref_type;</div><div class='ctx'> </div><div class='del'>-	is_system = (generic_ref-&gt;tree_ref.owning_root == BTRFS_CHUNK_TREE_OBJECTID);</div><div class='del'>-</div><div class='del'>-	ASSERT(generic_ref-&gt;type == BTRFS_REF_METADATA &amp;&amp; generic_ref-&gt;action);</div><div class='del'>-	BUG_ON(extent_op &amp;&amp; extent_op-&gt;is_data);</div><div class='del'>-	ref = kmem_cache_alloc(btrfs_delayed_tree_ref_cachep, GFP_NOFS);</div><div class='del'>-	if (!ref)</div><div class='add'>+	node = kmem_cache_alloc(btrfs_delayed_ref_node_cachep, GFP_NOFS);</div><div class='add'>+	if (!node)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	head_ref = kmem_cache_alloc(btrfs_delayed_ref_head_cachep, GFP_NOFS);</div><div class='ctx'> 	if (!head_ref) {</div><div class='del'>-		kmem_cache_free(btrfs_delayed_tree_ref_cachep, ref);</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto free_node;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (test_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags) &amp;&amp;</div><div class='del'>-	    !generic_ref-&gt;skip_qgroup) {</div><div class='add'>+	delayed_refs = &amp;trans-&gt;transaction-&gt;delayed_refs;</div><div class='add'>+</div><div class='add'>+	if (btrfs_qgroup_full_accounting(fs_info) &amp;&amp; !generic_ref-&gt;skip_qgroup) {</div><div class='ctx'> 		record = kzalloc(sizeof(*record), GFP_NOFS);</div><div class='ctx'> 		if (!record) {</div><div class='del'>-			kmem_cache_free(btrfs_delayed_tree_ref_cachep, ref);</div><div class='del'>-			kmem_cache_free(btrfs_delayed_ref_head_cachep, head_ref);</div><div class='del'>-			return -ENOMEM;</div><div class='add'>+			ret = -ENOMEM;</div><div class='add'>+			goto free_head_ref;</div><div class='ctx'> 		}</div><div class='add'>+		if (xa_reserve(&amp;delayed_refs-&gt;dirty_extents, index, GFP_NOFS)) {</div><div class='add'>+			ret = -ENOMEM;</div><div class='add'>+			goto free_record;</div><div class='add'>+		}</div><div class='add'>+		qrecord_reserved = true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (parent)</div><div class='del'>-		ref_type = BTRFS_SHARED_BLOCK_REF_KEY;</div><div class='del'>-	else</div><div class='del'>-		ref_type = BTRFS_TREE_BLOCK_REF_KEY;</div><div class='del'>-</div><div class='del'>-	init_delayed_ref_common(fs_info, &amp;ref-&gt;node, bytenr, num_bytes,</div><div class='del'>-				generic_ref-&gt;tree_ref.owning_root, action,</div><div class='del'>-				ref_type);</div><div class='del'>-	ref-&gt;root = generic_ref-&gt;tree_ref.owning_root;</div><div class='del'>-	ref-&gt;parent = parent;</div><div class='del'>-	ref-&gt;level = level;</div><div class='del'>-</div><div class='del'>-	init_delayed_ref_head(head_ref, record, bytenr, num_bytes,</div><div class='del'>-			      generic_ref-&gt;tree_ref.owning_root, 0, action,</div><div class='del'>-			      false, is_system);</div><div class='add'>+	ret = xa_reserve(&amp;delayed_refs-&gt;head_refs, index, GFP_NOFS);</div><div class='add'>+	if (ret) {</div><div class='add'>+		if (qrecord_reserved)</div><div class='add'>+			xa_release(&amp;delayed_refs-&gt;dirty_extents, index);</div><div class='add'>+		goto free_record;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	init_delayed_ref_common(fs_info, node, generic_ref);</div><div class='add'>+	init_delayed_ref_head(head_ref, generic_ref, record, reserved);</div><div class='ctx'> 	head_ref-&gt;extent_op = extent_op;</div><div class='ctx'> </div><div class='del'>-	delayed_refs = &amp;trans-&gt;transaction-&gt;delayed_refs;</div><div class='ctx'> 	spin_lock(&amp;delayed_refs-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * insert both the head node and the new ref without dropping</div><div class='ctx'> 	 * the spin lock</div><div class='ctx'> 	 */</div><div class='del'>-	head_ref = add_delayed_ref_head(trans, head_ref, record,</div><div class='del'>-					action, &amp;qrecord_inserted);</div><div class='add'>+	new_head_ref = add_delayed_ref_head(trans, head_ref, record,</div><div class='add'>+					    action, &amp;qrecord_inserted);</div><div class='add'>+	if (IS_ERR(new_head_ref)) {</div><div class='add'>+		xa_release(&amp;delayed_refs-&gt;head_refs, index);</div><div class='add'>+		spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='add'>+		ret = PTR_ERR(new_head_ref);</div><div class='ctx'> </div><div class='del'>-	ret = insert_delayed_ref(trans, delayed_refs, head_ref, &amp;ref-&gt;node);</div><div class='add'>+		/*</div><div class='add'>+		 * It's only safe to call kfree() on 'qrecord' if</div><div class='add'>+		 * add_delayed_ref_head() has _not_ inserted it for</div><div class='add'>+		 * tracing. Otherwise we need to handle this here.</div><div class='add'>+		 */</div><div class='add'>+		if (!qrecord_reserved || qrecord_inserted)</div><div class='add'>+			goto free_head_ref;</div><div class='add'>+		goto free_record;</div><div class='add'>+	}</div><div class='add'>+	head_ref = new_head_ref;</div><div class='add'>+</div><div class='add'>+	merged = insert_delayed_ref(trans, head_ref, node);</div><div class='ctx'> 	spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -966,16 +1083,38 @@ int btrfs_add_delayed_tree_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 */</div><div class='ctx'> 	btrfs_update_delayed_refs_rsv(trans);</div><div class='ctx'> </div><div class='del'>-	trace_add_delayed_tree_ref(fs_info, &amp;ref-&gt;node, ref,</div><div class='del'>-				   action == BTRFS_ADD_DELAYED_EXTENT ?</div><div class='del'>-				   BTRFS_ADD_DELAYED_REF : action);</div><div class='del'>-	if (ret &gt; 0)</div><div class='del'>-		kmem_cache_free(btrfs_delayed_tree_ref_cachep, ref);</div><div class='add'>+	if (generic_ref-&gt;type == BTRFS_REF_DATA)</div><div class='add'>+		trace_add_delayed_data_ref(trans-&gt;fs_info, node);</div><div class='add'>+	else</div><div class='add'>+		trace_add_delayed_tree_ref(trans-&gt;fs_info, node);</div><div class='add'>+	if (merged)</div><div class='add'>+		kmem_cache_free(btrfs_delayed_ref_node_cachep, node);</div><div class='ctx'> </div><div class='ctx'> 	if (qrecord_inserted)</div><div class='del'>-		btrfs_qgroup_trace_extent_post(trans, record);</div><div class='add'>+		return btrfs_qgroup_trace_extent_post(trans, record, generic_ref-&gt;bytenr);</div><div class='ctx'> </div><div class='add'>+	kfree(record);</div><div class='ctx'> 	return 0;</div><div class='add'>+</div><div class='add'>+free_record:</div><div class='add'>+	kfree(record);</div><div class='add'>+free_head_ref:</div><div class='add'>+	kmem_cache_free(btrfs_delayed_ref_head_cachep, head_ref);</div><div class='add'>+free_node:</div><div class='add'>+	kmem_cache_free(btrfs_delayed_ref_node_cachep, node);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Add a delayed tree ref. This does all of the accounting required to make sure</div><div class='add'>+ * the delayed ref is eventually processed before this transaction commits.</div><div class='add'>+ */</div><div class='add'>+int btrfs_add_delayed_tree_ref(struct btrfs_trans_handle *trans,</div><div class='add'>+			       struct btrfs_ref *generic_ref,</div><div class='add'>+			       struct btrfs_delayed_extent_op *extent_op)</div><div class='add'>+{</div><div class='add'>+	ASSERT(generic_ref-&gt;type == BTRFS_REF_METADATA &amp;&amp; generic_ref-&gt;action);</div><div class='add'>+	return add_delayed_ref(trans, generic_ref, extent_op, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -985,113 +1124,51 @@ int btrfs_add_delayed_data_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			       struct btrfs_ref *generic_ref,</div><div class='ctx'> 			       u64 reserved)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='del'>-	struct btrfs_delayed_data_ref *ref;</div><div class='del'>-	struct btrfs_delayed_ref_head *head_ref;</div><div class='del'>-	struct btrfs_delayed_ref_root *delayed_refs;</div><div class='del'>-	struct btrfs_qgroup_extent_record *record = NULL;</div><div class='del'>-	int qrecord_inserted;</div><div class='del'>-	int action = generic_ref-&gt;action;</div><div class='del'>-	int ret;</div><div class='del'>-	u64 bytenr = generic_ref-&gt;bytenr;</div><div class='del'>-	u64 num_bytes = generic_ref-&gt;len;</div><div class='del'>-	u64 parent = generic_ref-&gt;parent;</div><div class='del'>-	u64 ref_root = generic_ref-&gt;data_ref.owning_root;</div><div class='del'>-	u64 owner = generic_ref-&gt;data_ref.ino;</div><div class='del'>-	u64 offset = generic_ref-&gt;data_ref.offset;</div><div class='del'>-	u8 ref_type;</div><div class='del'>-</div><div class='del'>-	ASSERT(generic_ref-&gt;type == BTRFS_REF_DATA &amp;&amp; action);</div><div class='del'>-	ref = kmem_cache_alloc(btrfs_delayed_data_ref_cachep, GFP_NOFS);</div><div class='del'>-	if (!ref)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	if (parent)</div><div class='del'>-	        ref_type = BTRFS_SHARED_DATA_REF_KEY;</div><div class='del'>-	else</div><div class='del'>-	        ref_type = BTRFS_EXTENT_DATA_REF_KEY;</div><div class='del'>-	init_delayed_ref_common(fs_info, &amp;ref-&gt;node, bytenr, num_bytes,</div><div class='del'>-				ref_root, action, ref_type);</div><div class='del'>-	ref-&gt;root = ref_root;</div><div class='del'>-	ref-&gt;parent = parent;</div><div class='del'>-	ref-&gt;objectid = owner;</div><div class='del'>-	ref-&gt;offset = offset;</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-	head_ref = kmem_cache_alloc(btrfs_delayed_ref_head_cachep, GFP_NOFS);</div><div class='del'>-	if (!head_ref) {</div><div class='del'>-		kmem_cache_free(btrfs_delayed_data_ref_cachep, ref);</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (test_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags) &amp;&amp;</div><div class='del'>-	    !generic_ref-&gt;skip_qgroup) {</div><div class='del'>-		record = kzalloc(sizeof(*record), GFP_NOFS);</div><div class='del'>-		if (!record) {</div><div class='del'>-			kmem_cache_free(btrfs_delayed_data_ref_cachep, ref);</div><div class='del'>-			kmem_cache_free(btrfs_delayed_ref_head_cachep,</div><div class='del'>-					head_ref);</div><div class='del'>-			return -ENOMEM;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	init_delayed_ref_head(head_ref, record, bytenr, num_bytes, ref_root,</div><div class='del'>-			      reserved, action, true, false);</div><div class='del'>-	head_ref-&gt;extent_op = NULL;</div><div class='del'>-</div><div class='del'>-	delayed_refs = &amp;trans-&gt;transaction-&gt;delayed_refs;</div><div class='del'>-	spin_lock(&amp;delayed_refs-&gt;lock);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * insert both the head node and the new ref without dropping</div><div class='del'>-	 * the spin lock</div><div class='del'>-	 */</div><div class='del'>-	head_ref = add_delayed_ref_head(trans, head_ref, record,</div><div class='del'>-					action, &amp;qrecord_inserted);</div><div class='del'>-</div><div class='del'>-	ret = insert_delayed_ref(trans, delayed_refs, head_ref, &amp;ref-&gt;node);</div><div class='del'>-	spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Need to update the delayed_refs_rsv with any changes we may have</div><div class='del'>-	 * made.</div><div class='del'>-	 */</div><div class='del'>-	btrfs_update_delayed_refs_rsv(trans);</div><div class='del'>-</div><div class='del'>-	trace_add_delayed_data_ref(trans-&gt;fs_info, &amp;ref-&gt;node, ref,</div><div class='del'>-				   action == BTRFS_ADD_DELAYED_EXTENT ?</div><div class='del'>-				   BTRFS_ADD_DELAYED_REF : action);</div><div class='del'>-	if (ret &gt; 0)</div><div class='del'>-		kmem_cache_free(btrfs_delayed_data_ref_cachep, ref);</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-	if (qrecord_inserted)</div><div class='del'>-		return btrfs_qgroup_trace_extent_post(trans, record);</div><div class='del'>-	return 0;</div><div class='add'>+	ASSERT(generic_ref-&gt;type == BTRFS_REF_DATA &amp;&amp; generic_ref-&gt;action);</div><div class='add'>+	return add_delayed_ref(trans, generic_ref, NULL, reserved);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_add_delayed_extent_op(struct btrfs_trans_handle *trans,</div><div class='del'>-				u64 bytenr, u64 num_bytes,</div><div class='add'>+				u64 bytenr, u64 num_bytes, u8 level,</div><div class='ctx'> 				struct btrfs_delayed_extent_op *extent_op)</div><div class='ctx'> {</div><div class='add'>+	const unsigned long index = (bytenr &gt;&gt; trans-&gt;fs_info-&gt;sectorsize_bits);</div><div class='ctx'> 	struct btrfs_delayed_ref_head *head_ref;</div><div class='add'>+	struct btrfs_delayed_ref_head *head_ref_ret;</div><div class='ctx'> 	struct btrfs_delayed_ref_root *delayed_refs;</div><div class='add'>+	struct btrfs_ref generic_ref = {</div><div class='add'>+		.type = BTRFS_REF_METADATA,</div><div class='add'>+		.action = BTRFS_UPDATE_DELAYED_HEAD,</div><div class='add'>+		.bytenr = bytenr,</div><div class='add'>+		.num_bytes = num_bytes,</div><div class='add'>+		.tree_ref.level = level,</div><div class='add'>+	};</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	head_ref = kmem_cache_alloc(btrfs_delayed_ref_head_cachep, GFP_NOFS);</div><div class='ctx'> 	if (!head_ref)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	init_delayed_ref_head(head_ref, NULL, bytenr, num_bytes, 0, 0,</div><div class='del'>-			      BTRFS_UPDATE_DELAYED_HEAD, extent_op-&gt;is_data,</div><div class='del'>-			      false);</div><div class='add'>+	init_delayed_ref_head(head_ref, &amp;generic_ref, NULL, 0);</div><div class='ctx'> 	head_ref-&gt;extent_op = extent_op;</div><div class='ctx'> </div><div class='ctx'> 	delayed_refs = &amp;trans-&gt;transaction-&gt;delayed_refs;</div><div class='del'>-	spin_lock(&amp;delayed_refs-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	add_delayed_ref_head(trans, head_ref, NULL, BTRFS_UPDATE_DELAYED_HEAD,</div><div class='del'>-			     NULL);</div><div class='add'>+	ret = xa_reserve(&amp;delayed_refs-&gt;head_refs, index, GFP_NOFS);</div><div class='add'>+	if (ret) {</div><div class='add'>+		kmem_cache_free(btrfs_delayed_ref_head_cachep, head_ref);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='add'>+	spin_lock(&amp;delayed_refs-&gt;lock);</div><div class='add'>+	head_ref_ret = add_delayed_ref_head(trans, head_ref, NULL,</div><div class='add'>+					    BTRFS_UPDATE_DELAYED_HEAD, NULL);</div><div class='add'>+	if (IS_ERR(head_ref_ret)) {</div><div class='add'>+		xa_release(&amp;delayed_refs-&gt;head_refs, index);</div><div class='add'>+		spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='add'>+		kmem_cache_free(btrfs_delayed_ref_head_cachep, head_ref);</div><div class='add'>+		return PTR_ERR(head_ref_ret);</div><div class='add'>+	}</div><div class='ctx'> 	spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1102,53 +1179,192 @@ int btrfs_add_delayed_extent_op(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void btrfs_put_delayed_ref(struct btrfs_delayed_ref_node *ref)</div><div class='add'>+{</div><div class='add'>+	if (refcount_dec_and_test(&amp;ref-&gt;refs)) {</div><div class='add'>+		WARN_ON(!RB_EMPTY_NODE(&amp;ref-&gt;ref_node));</div><div class='add'>+		kmem_cache_free(btrfs_delayed_ref_node_cachep, ref);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * This does a simple search for the head node for a given extent.  Returns the</div><div class='ctx'>  * head node if found, or NULL if not.</div><div class='ctx'>  */</div><div class='ctx'> struct btrfs_delayed_ref_head *</div><div class='del'>-btrfs_find_delayed_ref_head(struct btrfs_delayed_ref_root *delayed_refs, u64 bytenr)</div><div class='add'>+btrfs_find_delayed_ref_head(const struct btrfs_fs_info *fs_info,</div><div class='add'>+			    struct btrfs_delayed_ref_root *delayed_refs,</div><div class='add'>+			    u64 bytenr)</div><div class='ctx'> {</div><div class='add'>+	const unsigned long index = (bytenr &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+</div><div class='ctx'> 	lockdep_assert_held(&amp;delayed_refs-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	return find_ref_head(delayed_refs, bytenr, false);</div><div class='add'>+	return xa_load(&amp;delayed_refs-&gt;head_refs, index);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int find_comp(struct btrfs_delayed_ref_node *entry, u64 root, u64 parent)</div><div class='add'>+{</div><div class='add'>+	int type = parent ? BTRFS_SHARED_BLOCK_REF_KEY : BTRFS_TREE_BLOCK_REF_KEY;</div><div class='add'>+</div><div class='add'>+	if (type &lt; entry-&gt;type)</div><div class='add'>+		return -1;</div><div class='add'>+	if (type &gt; entry-&gt;type)</div><div class='add'>+		return 1;</div><div class='add'>+</div><div class='add'>+	if (type == BTRFS_TREE_BLOCK_REF_KEY) {</div><div class='add'>+		if (root &lt; entry-&gt;ref_root)</div><div class='add'>+			return -1;</div><div class='add'>+		if (root &gt; entry-&gt;ref_root)</div><div class='add'>+			return 1;</div><div class='add'>+	} else {</div><div class='add'>+		if (parent &lt; entry-&gt;parent)</div><div class='add'>+			return -1;</div><div class='add'>+		if (parent &gt; entry-&gt;parent)</div><div class='add'>+			return 1;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Check to see if a given root/parent reference is attached to the head.  This</div><div class='add'>+ * only checks for BTRFS_ADD_DELAYED_REF references that match, as that</div><div class='add'>+ * indicates the reference exists for the given root or parent.  This is for</div><div class='add'>+ * tree blocks only.</div><div class='add'>+ *</div><div class='add'>+ * @head: the head of the bytenr we're searching.</div><div class='add'>+ * @root: the root objectid of the reference if it is a normal reference.</div><div class='add'>+ * @parent: the parent if this is a shared backref.</div><div class='add'>+ */</div><div class='add'>+bool btrfs_find_delayed_tree_ref(struct btrfs_delayed_ref_head *head,</div><div class='add'>+				 u64 root, u64 parent)</div><div class='add'>+{</div><div class='add'>+	struct rb_node *node;</div><div class='add'>+	bool found = false;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held(&amp;head-&gt;mutex);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;head-&gt;lock);</div><div class='add'>+	node = head-&gt;ref_tree.rb_root.rb_node;</div><div class='add'>+	while (node) {</div><div class='add'>+		struct btrfs_delayed_ref_node *entry;</div><div class='add'>+		int ret;</div><div class='add'>+</div><div class='add'>+		entry = rb_entry(node, struct btrfs_delayed_ref_node, ref_node);</div><div class='add'>+		ret = find_comp(entry, root, parent);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			node = node-&gt;rb_left;</div><div class='add'>+		} else if (ret &gt; 0) {</div><div class='add'>+			node = node-&gt;rb_right;</div><div class='add'>+		} else {</div><div class='add'>+			/*</div><div class='add'>+			 * We only want to count ADD actions, as drops mean the</div><div class='add'>+			 * ref doesn't exist.</div><div class='add'>+			 */</div><div class='add'>+			if (entry-&gt;action == BTRFS_ADD_DELAYED_REF)</div><div class='add'>+				found = true;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;head-&gt;lock);</div><div class='add'>+	return found;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_destroy_delayed_refs(struct btrfs_transaction *trans)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_delayed_ref_root *delayed_refs = &amp;trans-&gt;delayed_refs;</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;delayed_refs-&gt;lock);</div><div class='add'>+	while (true) {</div><div class='add'>+		struct btrfs_delayed_ref_head *head;</div><div class='add'>+		struct rb_node *n;</div><div class='add'>+		bool pin_bytes = false;</div><div class='add'>+</div><div class='add'>+		head = find_first_ref_head(delayed_refs);</div><div class='add'>+		if (!head)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		if (!btrfs_delayed_ref_lock(delayed_refs, head))</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;head-&gt;lock);</div><div class='add'>+		while ((n = rb_first_cached(&amp;head-&gt;ref_tree)) != NULL) {</div><div class='add'>+			struct btrfs_delayed_ref_node *ref;</div><div class='add'>+</div><div class='add'>+			ref = rb_entry(n, struct btrfs_delayed_ref_node, ref_node);</div><div class='add'>+			drop_delayed_ref(fs_info, delayed_refs, head, ref);</div><div class='add'>+		}</div><div class='add'>+		if (head-&gt;must_insert_reserved)</div><div class='add'>+			pin_bytes = true;</div><div class='add'>+		btrfs_free_delayed_extent_op(head-&gt;extent_op);</div><div class='add'>+		btrfs_delete_ref_head(fs_info, delayed_refs, head);</div><div class='add'>+		spin_unlock(&amp;head-&gt;lock);</div><div class='add'>+		spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='add'>+		mutex_unlock(&amp;head-&gt;mutex);</div><div class='add'>+</div><div class='add'>+		if (!btrfs_is_testing(fs_info) &amp;&amp; pin_bytes) {</div><div class='add'>+			struct btrfs_block_group *bg;</div><div class='add'>+</div><div class='add'>+			bg = btrfs_lookup_block_group(fs_info, head-&gt;bytenr);</div><div class='add'>+			if (WARN_ON_ONCE(bg == NULL)) {</div><div class='add'>+				/*</div><div class='add'>+				 * Unexpected and there's nothing we can do here</div><div class='add'>+				 * because we are in a transaction abort path,</div><div class='add'>+				 * so any errors can only be ignored or reported</div><div class='add'>+				 * while attempting to cleanup all resources.</div><div class='add'>+				 */</div><div class='add'>+				btrfs_err(fs_info,</div><div class='add'>+"block group for delayed ref at %llu was not found while destroying ref head",</div><div class='add'>+					  head-&gt;bytenr);</div><div class='add'>+			} else {</div><div class='add'>+				spin_lock(&amp;bg-&gt;space_info-&gt;lock);</div><div class='add'>+				spin_lock(&amp;bg-&gt;lock);</div><div class='add'>+				bg-&gt;pinned += head-&gt;num_bytes;</div><div class='add'>+				btrfs_space_info_update_bytes_pinned(bg-&gt;space_info,</div><div class='add'>+								     head-&gt;num_bytes);</div><div class='add'>+				bg-&gt;reserved -= head-&gt;num_bytes;</div><div class='add'>+				bg-&gt;space_info-&gt;bytes_reserved -= head-&gt;num_bytes;</div><div class='add'>+				spin_unlock(&amp;bg-&gt;lock);</div><div class='add'>+				spin_unlock(&amp;bg-&gt;space_info-&gt;lock);</div><div class='add'>+</div><div class='add'>+				btrfs_put_block_group(bg);</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			btrfs_error_unpin_extent_range(fs_info, head-&gt;bytenr,</div><div class='add'>+				head-&gt;bytenr + head-&gt;num_bytes - 1);</div><div class='add'>+		}</div><div class='add'>+		if (!btrfs_is_testing(fs_info))</div><div class='add'>+			btrfs_cleanup_ref_head_accounting(fs_info, delayed_refs, head);</div><div class='add'>+		btrfs_put_delayed_ref_head(head);</div><div class='add'>+		cond_resched();</div><div class='add'>+		spin_lock(&amp;delayed_refs-&gt;lock);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!btrfs_is_testing(fs_info))</div><div class='add'>+		btrfs_qgroup_destroy_extent_records(trans);</div><div class='add'>+</div><div class='add'>+	spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void __cold btrfs_delayed_ref_exit(void)</div><div class='ctx'> {</div><div class='ctx'> 	kmem_cache_destroy(btrfs_delayed_ref_head_cachep);</div><div class='del'>-	kmem_cache_destroy(btrfs_delayed_tree_ref_cachep);</div><div class='del'>-	kmem_cache_destroy(btrfs_delayed_data_ref_cachep);</div><div class='add'>+	kmem_cache_destroy(btrfs_delayed_ref_node_cachep);</div><div class='ctx'> 	kmem_cache_destroy(btrfs_delayed_extent_op_cachep);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int __init btrfs_delayed_ref_init(void)</div><div class='ctx'> {</div><div class='del'>-	btrfs_delayed_ref_head_cachep = kmem_cache_create(</div><div class='del'>-				"btrfs_delayed_ref_head",</div><div class='del'>-				sizeof(struct btrfs_delayed_ref_head), 0,</div><div class='del'>-				SLAB_MEM_SPREAD, NULL);</div><div class='add'>+	btrfs_delayed_ref_head_cachep = KMEM_CACHE(btrfs_delayed_ref_head, 0);</div><div class='ctx'> 	if (!btrfs_delayed_ref_head_cachep)</div><div class='del'>-		goto fail;</div><div class='del'>-</div><div class='del'>-	btrfs_delayed_tree_ref_cachep = kmem_cache_create(</div><div class='del'>-				"btrfs_delayed_tree_ref",</div><div class='del'>-				sizeof(struct btrfs_delayed_tree_ref), 0,</div><div class='del'>-				SLAB_MEM_SPREAD, NULL);</div><div class='del'>-	if (!btrfs_delayed_tree_ref_cachep)</div><div class='del'>-		goto fail;</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	btrfs_delayed_data_ref_cachep = kmem_cache_create(</div><div class='del'>-				"btrfs_delayed_data_ref",</div><div class='del'>-				sizeof(struct btrfs_delayed_data_ref), 0,</div><div class='del'>-				SLAB_MEM_SPREAD, NULL);</div><div class='del'>-	if (!btrfs_delayed_data_ref_cachep)</div><div class='add'>+	btrfs_delayed_ref_node_cachep = KMEM_CACHE(btrfs_delayed_ref_node, 0);</div><div class='add'>+	if (!btrfs_delayed_ref_node_cachep)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> </div><div class='del'>-	btrfs_delayed_extent_op_cachep = kmem_cache_create(</div><div class='del'>-				"btrfs_delayed_extent_op",</div><div class='del'>-				sizeof(struct btrfs_delayed_extent_op), 0,</div><div class='del'>-				SLAB_MEM_SPREAD, NULL);</div><div class='add'>+	btrfs_delayed_extent_op_cachep = KMEM_CACHE(btrfs_delayed_extent_op, 0);</div><div class='ctx'> 	if (!btrfs_delayed_extent_op_cachep)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> </div><div class='head'>diff --git a/fs/btrfs/delayed-ref.h b/fs/btrfs/delayed-ref.h<br/>index 91a3aabad150..5ce940532144 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/delayed-ref.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/delayed-ref.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/delayed-ref.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/delayed-ref.h</a></div><div class='hunk'>@@ -6,20 +6,65 @@</div><div class='ctx'> #ifndef BTRFS_DELAYED_REF_H</div><div class='ctx'> #define BTRFS_DELAYED_REF_H</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='ctx'> #include &lt;linux/refcount.h&gt;</div><div class='add'>+#include &lt;linux/list.h&gt;</div><div class='add'>+#include &lt;linux/rbtree.h&gt;</div><div class='add'>+#include &lt;linux/mutex.h&gt;</div><div class='add'>+#include &lt;linux/spinlock.h&gt;</div><div class='add'>+#include &lt;linux/slab.h&gt;</div><div class='add'>+#include &lt;uapi/linux/btrfs_tree.h&gt;</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "messages.h"</div><div class='add'>+</div><div class='add'>+struct btrfs_trans_handle;</div><div class='add'>+struct btrfs_fs_info;</div><div class='ctx'> </div><div class='ctx'> /* these are the possible values of struct btrfs_delayed_ref_node-&gt;action */</div><div class='del'>-#define BTRFS_ADD_DELAYED_REF    1 /* add one backref to the tree */</div><div class='del'>-#define BTRFS_DROP_DELAYED_REF   2 /* delete one backref from the tree */</div><div class='del'>-#define BTRFS_ADD_DELAYED_EXTENT 3 /* record a full extent allocation */</div><div class='del'>-#define BTRFS_UPDATE_DELAYED_HEAD 4 /* not changing ref count on head ref */</div><div class='add'>+enum btrfs_delayed_ref_action {</div><div class='add'>+	/* Add one backref to the tree */</div><div class='add'>+	BTRFS_ADD_DELAYED_REF = 1,</div><div class='add'>+	/* Delete one backref from the tree */</div><div class='add'>+	BTRFS_DROP_DELAYED_REF,</div><div class='add'>+	/* Record a full extent allocation */</div><div class='add'>+	BTRFS_ADD_DELAYED_EXTENT,</div><div class='add'>+	/* Not changing ref count on head ref */</div><div class='add'>+	BTRFS_UPDATE_DELAYED_HEAD,</div><div class='add'>+} __packed;</div><div class='add'>+</div><div class='add'>+struct btrfs_data_ref {</div><div class='add'>+	/* For EXTENT_DATA_REF */</div><div class='add'>+</div><div class='add'>+	/* Inode which refers to this data extent */</div><div class='add'>+	u64 objectid;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * file_offset - extent_offset</div><div class='add'>+	 *</div><div class='add'>+	 * file_offset is the key.offset of the EXTENT_DATA key.</div><div class='add'>+	 * extent_offset is btrfs_file_extent_offset() of the EXTENT_DATA data.</div><div class='add'>+	 */</div><div class='add'>+	u64 offset;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct btrfs_tree_ref {</div><div class='add'>+	/*</div><div class='add'>+	 * Level of this tree block.</div><div class='add'>+	 *</div><div class='add'>+	 * Shared for skinny (TREE_BLOCK_REF) and normal tree ref.</div><div class='add'>+	 */</div><div class='add'>+	int level;</div><div class='add'>+</div><div class='add'>+	/* For non-skinny metadata, no special member needed */</div><div class='add'>+};</div><div class='ctx'> </div><div class='ctx'> struct btrfs_delayed_ref_node {</div><div class='ctx'> 	struct rb_node ref_node;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If action is BTRFS_ADD_DELAYED_REF, also link this node to</div><div class='ctx'> 	 * ref_head-&gt;ref_add_list, then we do not need to iterate the</div><div class='del'>-	 * whole ref_head-&gt;ref_list to find BTRFS_ADD_DELAYED_REF nodes.</div><div class='add'>+	 * refs rbtree in the corresponding delayed ref head</div><div class='add'>+	 * (struct btrfs_delayed_ref_head::ref_tree).</div><div class='ctx'> 	 */</div><div class='ctx'> 	struct list_head add_list;</div><div class='ctx'> </div><div class='hunk'>@@ -32,6 +77,15 @@ struct btrfs_delayed_ref_node {</div><div class='ctx'> 	/* seq number to keep track of insertion order */</div><div class='ctx'> 	u64 seq;</div><div class='ctx'> </div><div class='add'>+	/* The ref_root for this ref */</div><div class='add'>+	u64 ref_root;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The parent for this ref, if this isn't set the ref_root is the</div><div class='add'>+	 * reference owner.</div><div class='add'>+	 */</div><div class='add'>+	u64 parent;</div><div class='add'>+</div><div class='ctx'> 	/* ref count on this data structure */</div><div class='ctx'> 	refcount_t refs;</div><div class='ctx'> </div><div class='hunk'>@@ -48,17 +102,17 @@ struct btrfs_delayed_ref_node {</div><div class='ctx'> </div><div class='ctx'> 	unsigned int action:8;</div><div class='ctx'> 	unsigned int type:8;</div><div class='del'>-	/* is this node still in the rbtree? */</div><div class='del'>-	unsigned int is_head:1;</div><div class='del'>-	unsigned int in_tree:1;</div><div class='add'>+</div><div class='add'>+	union {</div><div class='add'>+		struct btrfs_tree_ref tree_ref;</div><div class='add'>+		struct btrfs_data_ref data_ref;</div><div class='add'>+	};</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct btrfs_delayed_extent_op {</div><div class='ctx'> 	struct btrfs_disk_key key;</div><div class='del'>-	u8 level;</div><div class='ctx'> 	bool update_key;</div><div class='ctx'> 	bool update_flags;</div><div class='del'>-	bool is_data;</div><div class='ctx'> 	u64 flags_to_set;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -71,20 +125,20 @@ struct btrfs_delayed_extent_op {</div><div class='ctx'> struct btrfs_delayed_ref_head {</div><div class='ctx'> 	u64 bytenr;</div><div class='ctx'> 	u64 num_bytes;</div><div class='del'>-	refcount_t refs;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * the mutex is held while running the refs, and it is also</div><div class='ctx'> 	 * held when checking the sum of reference modifications.</div><div class='ctx'> 	 */</div><div class='ctx'> 	struct mutex mutex;</div><div class='ctx'> </div><div class='add'>+	refcount_t refs;</div><div class='add'>+</div><div class='add'>+	/* Protects 'ref_tree' and 'ref_add_list'. */</div><div class='ctx'> 	spinlock_t lock;</div><div class='ctx'> 	struct rb_root_cached ref_tree;</div><div class='ctx'> 	/* accumulate add BTRFS_ADD_DELAYED_REF nodes to this ref_add_list. */</div><div class='ctx'> 	struct list_head ref_add_list;</div><div class='ctx'> </div><div class='del'>-	struct rb_node href_node;</div><div class='del'>-</div><div class='ctx'> 	struct btrfs_delayed_extent_op *extent_op;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -103,6 +157,21 @@ struct btrfs_delayed_ref_head {</div><div class='ctx'> 	int ref_mod;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='add'>+	 * The root that triggered the allocation when must_insert_reserved is</div><div class='add'>+	 * set to true.</div><div class='add'>+	 */</div><div class='add'>+	u64 owning_root;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Track reserved bytes when setting must_insert_reserved.  On success</div><div class='add'>+	 * or cleanup, we will need to free the reservation.</div><div class='add'>+	 */</div><div class='add'>+	u64 reserved_bytes;</div><div class='add'>+</div><div class='add'>+	/* Tree block level, for metadata only. */</div><div class='add'>+	u8 level;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='ctx'> 	 * when a new extent is allocated, it is just reserved in memory</div><div class='ctx'> 	 * The actual extent isn't inserted into the extent allocation tree</div><div class='ctx'> 	 * until the delayed ref is processed.  must_insert_reserved is</div><div class='hunk'>@@ -114,25 +183,16 @@ struct btrfs_delayed_ref_head {</div><div class='ctx'> 	 * we need to update the in ram accounting to properly reflect</div><div class='ctx'> 	 * the free has happened.</div><div class='ctx'> 	 */</div><div class='del'>-	unsigned int must_insert_reserved:1;</div><div class='del'>-	unsigned int is_data:1;</div><div class='del'>-	unsigned int is_system:1;</div><div class='del'>-	unsigned int processing:1;</div><div class='del'>-};</div><div class='add'>+	bool must_insert_reserved;</div><div class='ctx'> </div><div class='del'>-struct btrfs_delayed_tree_ref {</div><div class='del'>-	struct btrfs_delayed_ref_node node;</div><div class='del'>-	u64 root;</div><div class='del'>-	u64 parent;</div><div class='del'>-	int level;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct btrfs_delayed_data_ref {</div><div class='del'>-	struct btrfs_delayed_ref_node node;</div><div class='del'>-	u64 root;</div><div class='del'>-	u64 parent;</div><div class='del'>-	u64 objectid;</div><div class='del'>-	u64 offset;</div><div class='add'>+	bool is_data;</div><div class='add'>+	bool is_system;</div><div class='add'>+	bool processing;</div><div class='add'>+	/*</div><div class='add'>+	 * Indicate if it's currently in the data structure that tracks head</div><div class='add'>+	 * refs (struct btrfs_delayed_ref_root::head_refs).</div><div class='add'>+	 */</div><div class='add'>+	bool tracked;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> enum btrfs_delayed_ref_flags {</div><div class='hunk'>@@ -141,30 +201,52 @@ enum btrfs_delayed_ref_flags {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct btrfs_delayed_ref_root {</div><div class='del'>-	/* head ref rbtree */</div><div class='del'>-	struct rb_root_cached href_root;</div><div class='del'>-</div><div class='del'>-	/* dirty extent records */</div><div class='del'>-	struct rb_root dirty_extent_root;</div><div class='add'>+	/*</div><div class='add'>+	 * Track head references.</div><div class='add'>+	 * The keys correspond to the logical address of the extent ("bytenr")</div><div class='add'>+	 * right shifted by fs_info-&gt;sectorsize_bits. This is both to get a more</div><div class='add'>+	 * dense index space (optimizes xarray structure) and because indexes in</div><div class='add'>+	 * xarrays are of "unsigned long" type, meaning they are 32 bits wide on</div><div class='add'>+	 * 32 bits platforms, limiting the extent range to 4G which is too low</div><div class='add'>+	 * and makes it unusable (truncated index values) on 32 bits platforms.</div><div class='add'>+	 * Protected by the spinlock 'lock' defined below.</div><div class='add'>+	 */</div><div class='add'>+	struct xarray head_refs;</div><div class='ctx'> </div><div class='del'>-	/* this spin lock protects the rbtree and the entries inside */</div><div class='del'>-	spinlock_t lock;</div><div class='add'>+	/*</div><div class='add'>+	 * Track dirty extent records.</div><div class='add'>+	 * The keys correspond to the logical address of the extent ("bytenr")</div><div class='add'>+	 * right shifted by fs_info-&gt;sectorsize_bits, for same reasons as above.</div><div class='add'>+	 */</div><div class='add'>+	struct xarray dirty_extents;</div><div class='ctx'> </div><div class='del'>-	/* how many delayed ref updates we've queued, used by the</div><div class='del'>-	 * throttling code</div><div class='add'>+	/*</div><div class='add'>+	 * Protects the xarray head_refs, its entries and the following fields:</div><div class='add'>+	 * num_heads, num_heads_ready, pending_csums and run_delayed_start.</div><div class='ctx'> 	 */</div><div class='del'>-	atomic_t num_entries;</div><div class='add'>+	spinlock_t lock;</div><div class='ctx'> </div><div class='del'>-	/* total number of head nodes in tree */</div><div class='add'>+	/* Total number of head refs, protected by the spinlock 'lock'. */</div><div class='ctx'> 	unsigned long num_heads;</div><div class='ctx'> </div><div class='del'>-	/* total number of head nodes ready for processing */</div><div class='add'>+	/*</div><div class='add'>+	 * Total number of head refs ready for processing, protected by the</div><div class='add'>+	 * spinlock 'lock'.</div><div class='add'>+	 */</div><div class='ctx'> 	unsigned long num_heads_ready;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Track space reserved for deleting csums of data extents.</div><div class='add'>+	 * Protected by the spinlock 'lock'.</div><div class='add'>+	 */</div><div class='ctx'> 	u64 pending_csums;</div><div class='ctx'> </div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Track from which bytenr to start searching ref heads.</div><div class='add'>+	 * Protected by the spinlock 'lock'.</div><div class='add'>+	 */</div><div class='ctx'> 	u64 run_delayed_start;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -180,48 +262,11 @@ enum btrfs_ref_type {</div><div class='ctx'> 	BTRFS_REF_NOT_SET,</div><div class='ctx'> 	BTRFS_REF_DATA,</div><div class='ctx'> 	BTRFS_REF_METADATA,</div><div class='del'>-	BTRFS_REF_LAST,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct btrfs_data_ref {</div><div class='del'>-	/* For EXTENT_DATA_REF */</div><div class='del'>-</div><div class='del'>-	/* Original root this data extent belongs to */</div><div class='del'>-	u64 owning_root;</div><div class='del'>-</div><div class='del'>-	/* Inode which refers to this data extent */</div><div class='del'>-	u64 ino;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * file_offset - extent_offset</div><div class='del'>-	 *</div><div class='del'>-	 * file_offset is the key.offset of the EXTENT_DATA key.</div><div class='del'>-	 * extent_offset is btrfs_file_extent_offset() of the EXTENT_DATA data.</div><div class='del'>-	 */</div><div class='del'>-	u64 offset;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct btrfs_tree_ref {</div><div class='del'>-	/*</div><div class='del'>-	 * Level of this tree block</div><div class='del'>-	 *</div><div class='del'>-	 * Shared for skinny (TREE_BLOCK_REF) and normal tree ref.</div><div class='del'>-	 */</div><div class='del'>-	int level;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Root which owns this tree block.</div><div class='del'>-	 *</div><div class='del'>-	 * For TREE_BLOCK_REF (skinny metadata, either inline or keyed)</div><div class='del'>-	 */</div><div class='del'>-	u64 owning_root;</div><div class='del'>-</div><div class='del'>-	/* For non-skinny metadata, no special member needed */</div><div class='del'>-};</div><div class='add'>+} __packed;</div><div class='ctx'> </div><div class='ctx'> struct btrfs_ref {</div><div class='ctx'> 	enum btrfs_ref_type type;</div><div class='del'>-	int action;</div><div class='add'>+	enum btrfs_delayed_ref_action action;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Whether this extent should go through qgroup record.</div><div class='hunk'>@@ -231,12 +276,15 @@ struct btrfs_ref {</div><div class='ctx'> 	 */</div><div class='ctx'> 	bool skip_qgroup;</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_BTRFS_FS_REF_VERIFY</div><div class='del'>-	/* Through which root is this modification. */</div><div class='del'>-	u64 real_root;</div><div class='del'>-#endif</div><div class='ctx'> 	u64 bytenr;</div><div class='del'>-	u64 len;</div><div class='add'>+	u64 num_bytes;</div><div class='add'>+	u64 owning_root;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The root that owns the reference for this reference, this will be set</div><div class='add'>+	 * or -&gt;parent will be set, depending on what type of reference this is.</div><div class='add'>+	 */</div><div class='add'>+	u64 ref_root;</div><div class='ctx'> </div><div class='ctx'> 	/* Bytenr of the parent tree block */</div><div class='ctx'> 	u64 parent;</div><div class='hunk'>@@ -244,62 +292,57 @@ struct btrfs_ref {</div><div class='ctx'> 		struct btrfs_data_ref data_ref;</div><div class='ctx'> 		struct btrfs_tree_ref tree_ref;</div><div class='ctx'> 	};</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BTRFS_DEBUG</div><div class='add'>+	/* Through which root is this modification. */</div><div class='add'>+	u64 real_root;</div><div class='add'>+#endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> extern struct kmem_cache *btrfs_delayed_ref_head_cachep;</div><div class='del'>-extern struct kmem_cache *btrfs_delayed_tree_ref_cachep;</div><div class='del'>-extern struct kmem_cache *btrfs_delayed_data_ref_cachep;</div><div class='add'>+extern struct kmem_cache *btrfs_delayed_ref_node_cachep;</div><div class='ctx'> extern struct kmem_cache *btrfs_delayed_extent_op_cachep;</div><div class='ctx'> </div><div class='ctx'> int __init btrfs_delayed_ref_init(void);</div><div class='ctx'> void __cold btrfs_delayed_ref_exit(void);</div><div class='ctx'> </div><div class='del'>-static inline void btrfs_init_generic_ref(struct btrfs_ref *generic_ref,</div><div class='del'>-				int action, u64 bytenr, u64 len, u64 parent)</div><div class='add'>+static inline u64 btrfs_calc_delayed_ref_bytes(const struct btrfs_fs_info *fs_info,</div><div class='add'>+					       int num_delayed_refs)</div><div class='ctx'> {</div><div class='del'>-	generic_ref-&gt;action = action;</div><div class='del'>-	generic_ref-&gt;bytenr = bytenr;</div><div class='del'>-	generic_ref-&gt;len = len;</div><div class='del'>-	generic_ref-&gt;parent = parent;</div><div class='del'>-}</div><div class='add'>+	u64 num_bytes;</div><div class='ctx'> </div><div class='del'>-static inline void btrfs_init_tree_ref(struct btrfs_ref *generic_ref,</div><div class='del'>-				int level, u64 root, u64 mod_root, bool skip_qgroup)</div><div class='del'>-{</div><div class='del'>-#ifdef CONFIG_BTRFS_FS_REF_VERIFY</div><div class='del'>-	/* If @real_root not set, use @root as fallback */</div><div class='del'>-	generic_ref-&gt;real_root = mod_root ?: root;</div><div class='del'>-#endif</div><div class='del'>-	generic_ref-&gt;tree_ref.level = level;</div><div class='del'>-	generic_ref-&gt;tree_ref.owning_root = root;</div><div class='del'>-	generic_ref-&gt;type = BTRFS_REF_METADATA;</div><div class='del'>-	if (skip_qgroup || !(is_fstree(root) &amp;&amp;</div><div class='del'>-			     (!mod_root || is_fstree(mod_root))))</div><div class='del'>-		generic_ref-&gt;skip_qgroup = true;</div><div class='del'>-	else</div><div class='del'>-		generic_ref-&gt;skip_qgroup = false;</div><div class='add'>+	num_bytes = btrfs_calc_insert_metadata_size(fs_info, num_delayed_refs);</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * We have to check the mount option here because we could be enabling</div><div class='add'>+	 * the free space tree for the first time and don't have the compat_ro</div><div class='add'>+	 * option set yet.</div><div class='add'>+	 *</div><div class='add'>+	 * We need extra reservations if we have the free space tree because</div><div class='add'>+	 * we'll have to modify that tree as well.</div><div class='add'>+	 */</div><div class='add'>+	if (btrfs_test_opt(fs_info, FREE_SPACE_TREE))</div><div class='add'>+		num_bytes *= 2;</div><div class='add'>+</div><div class='add'>+	return num_bytes;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void btrfs_init_data_ref(struct btrfs_ref *generic_ref,</div><div class='del'>-				u64 ref_root, u64 ino, u64 offset, u64 mod_root,</div><div class='del'>-				bool skip_qgroup)</div><div class='add'>+static inline u64 btrfs_calc_delayed_ref_csum_bytes(const struct btrfs_fs_info *fs_info,</div><div class='add'>+						    int num_csum_items)</div><div class='ctx'> {</div><div class='del'>-#ifdef CONFIG_BTRFS_FS_REF_VERIFY</div><div class='del'>-	/* If @real_root not set, use @root as fallback */</div><div class='del'>-	generic_ref-&gt;real_root = mod_root ?: ref_root;</div><div class='del'>-#endif</div><div class='del'>-	generic_ref-&gt;data_ref.owning_root = ref_root;</div><div class='del'>-	generic_ref-&gt;data_ref.ino = ino;</div><div class='del'>-	generic_ref-&gt;data_ref.offset = offset;</div><div class='del'>-	generic_ref-&gt;type = BTRFS_REF_DATA;</div><div class='del'>-	if (skip_qgroup || !(is_fstree(ref_root) &amp;&amp;</div><div class='del'>-			     (!mod_root || is_fstree(mod_root))))</div><div class='del'>-		generic_ref-&gt;skip_qgroup = true;</div><div class='del'>-	else</div><div class='del'>-		generic_ref-&gt;skip_qgroup = false;</div><div class='add'>+	/*</div><div class='add'>+	 * Deleting csum items does not result in new nodes/leaves and does not</div><div class='add'>+	 * require changing the free space tree, only the csum tree, so this is</div><div class='add'>+	 * all we need.</div><div class='add'>+	 */</div><div class='add'>+	return btrfs_calc_metadata_size(fs_info, num_csum_items);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void btrfs_init_tree_ref(struct btrfs_ref *generic_ref, int level, u64 mod_root,</div><div class='add'>+			 bool skip_qgroup);</div><div class='add'>+void btrfs_init_data_ref(struct btrfs_ref *generic_ref, u64 ino, u64 offset,</div><div class='add'>+			 u64 mod_root, bool skip_qgroup);</div><div class='add'>+</div><div class='ctx'> static inline struct btrfs_delayed_extent_op *</div><div class='ctx'> btrfs_alloc_delayed_extent_op(void)</div><div class='ctx'> {</div><div class='hunk'>@@ -313,25 +356,7 @@ btrfs_free_delayed_extent_op(struct btrfs_delayed_extent_op *op)</div><div class='ctx'> 		kmem_cache_free(btrfs_delayed_extent_op_cachep, op);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void btrfs_put_delayed_ref(struct btrfs_delayed_ref_node *ref)</div><div class='del'>-{</div><div class='del'>-	WARN_ON(refcount_read(&amp;ref-&gt;refs) == 0);</div><div class='del'>-	if (refcount_dec_and_test(&amp;ref-&gt;refs)) {</div><div class='del'>-		WARN_ON(ref-&gt;in_tree);</div><div class='del'>-		switch (ref-&gt;type) {</div><div class='del'>-		case BTRFS_TREE_BLOCK_REF_KEY:</div><div class='del'>-		case BTRFS_SHARED_BLOCK_REF_KEY:</div><div class='del'>-			kmem_cache_free(btrfs_delayed_tree_ref_cachep, ref);</div><div class='del'>-			break;</div><div class='del'>-		case BTRFS_EXTENT_DATA_REF_KEY:</div><div class='del'>-		case BTRFS_SHARED_DATA_REF_KEY:</div><div class='del'>-			kmem_cache_free(btrfs_delayed_data_ref_cachep, ref);</div><div class='del'>-			break;</div><div class='del'>-		default:</div><div class='del'>-			BUG();</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-}</div><div class='add'>+void btrfs_put_delayed_ref(struct btrfs_delayed_ref_node *ref);</div><div class='ctx'> </div><div class='ctx'> static inline u64 btrfs_ref_head_to_space_flags(</div><div class='ctx'> 				struct btrfs_delayed_ref_head *head_ref)</div><div class='hunk'>@@ -356,52 +381,79 @@ int btrfs_add_delayed_data_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			       struct btrfs_ref *generic_ref,</div><div class='ctx'> 			       u64 reserved);</div><div class='ctx'> int btrfs_add_delayed_extent_op(struct btrfs_trans_handle *trans,</div><div class='del'>-				u64 bytenr, u64 num_bytes,</div><div class='add'>+				u64 bytenr, u64 num_bytes, u8 level,</div><div class='ctx'> 				struct btrfs_delayed_extent_op *extent_op);</div><div class='del'>-void btrfs_merge_delayed_refs(struct btrfs_trans_handle *trans,</div><div class='add'>+void btrfs_merge_delayed_refs(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			      struct btrfs_delayed_ref_root *delayed_refs,</div><div class='ctx'> 			      struct btrfs_delayed_ref_head *head);</div><div class='ctx'> </div><div class='ctx'> struct btrfs_delayed_ref_head *</div><div class='del'>-btrfs_find_delayed_ref_head(struct btrfs_delayed_ref_root *delayed_refs,</div><div class='add'>+btrfs_find_delayed_ref_head(const struct btrfs_fs_info *fs_info,</div><div class='add'>+			    struct btrfs_delayed_ref_root *delayed_refs,</div><div class='ctx'> 			    u64 bytenr);</div><div class='del'>-int btrfs_delayed_ref_lock(struct btrfs_delayed_ref_root *delayed_refs,</div><div class='del'>-			   struct btrfs_delayed_ref_head *head);</div><div class='ctx'> static inline void btrfs_delayed_ref_unlock(struct btrfs_delayed_ref_head *head)</div><div class='ctx'> {</div><div class='ctx'> 	mutex_unlock(&amp;head-&gt;mutex);</div><div class='ctx'> }</div><div class='del'>-void btrfs_delete_ref_head(struct btrfs_delayed_ref_root *delayed_refs,</div><div class='add'>+void btrfs_delete_ref_head(const struct btrfs_fs_info *fs_info,</div><div class='add'>+			   struct btrfs_delayed_ref_root *delayed_refs,</div><div class='ctx'> 			   struct btrfs_delayed_ref_head *head);</div><div class='ctx'> </div><div class='ctx'> struct btrfs_delayed_ref_head *btrfs_select_ref_head(</div><div class='add'>+		const struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		struct btrfs_delayed_ref_root *delayed_refs);</div><div class='add'>+void btrfs_unselect_ref_head(struct btrfs_delayed_ref_root *delayed_refs,</div><div class='add'>+			     struct btrfs_delayed_ref_head *head);</div><div class='add'>+struct btrfs_delayed_ref_node *btrfs_select_delayed_ref(struct btrfs_delayed_ref_head *head);</div><div class='ctx'> </div><div class='ctx'> int btrfs_check_delayed_seq(struct btrfs_fs_info *fs_info, u64 seq);</div><div class='ctx'> </div><div class='del'>-void btrfs_delayed_refs_rsv_release(struct btrfs_fs_info *fs_info, int nr);</div><div class='add'>+void btrfs_delayed_refs_rsv_release(struct btrfs_fs_info *fs_info, int nr_refs, int nr_csums);</div><div class='ctx'> void btrfs_update_delayed_refs_rsv(struct btrfs_trans_handle *trans);</div><div class='add'>+void btrfs_inc_delayed_refs_rsv_bg_inserts(struct btrfs_fs_info *fs_info);</div><div class='add'>+void btrfs_dec_delayed_refs_rsv_bg_inserts(struct btrfs_fs_info *fs_info);</div><div class='add'>+void btrfs_inc_delayed_refs_rsv_bg_updates(struct btrfs_fs_info *fs_info);</div><div class='add'>+void btrfs_dec_delayed_refs_rsv_bg_updates(struct btrfs_fs_info *fs_info);</div><div class='ctx'> int btrfs_delayed_refs_rsv_refill(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				  enum btrfs_reserve_flush_enum flush);</div><div class='del'>-void btrfs_migrate_to_delayed_refs_rsv(struct btrfs_fs_info *fs_info,</div><div class='del'>-				       struct btrfs_block_rsv *src,</div><div class='del'>-				       u64 num_bytes);</div><div class='del'>-int btrfs_should_throttle_delayed_refs(struct btrfs_trans_handle *trans);</div><div class='ctx'> bool btrfs_check_space_for_delayed_refs(struct btrfs_fs_info *fs_info);</div><div class='add'>+bool btrfs_find_delayed_tree_ref(struct btrfs_delayed_ref_head *head,</div><div class='add'>+				 u64 root, u64 parent);</div><div class='add'>+void btrfs_destroy_delayed_refs(struct btrfs_transaction *trans);</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * helper functions to cast a node into its container</div><div class='del'>- */</div><div class='del'>-static inline struct btrfs_delayed_tree_ref *</div><div class='del'>-btrfs_delayed_node_to_tree_ref(struct btrfs_delayed_ref_node *node)</div><div class='add'>+static inline u64 btrfs_delayed_ref_owner(const struct btrfs_delayed_ref_node *node)</div><div class='add'>+{</div><div class='add'>+	if (node-&gt;type == BTRFS_EXTENT_DATA_REF_KEY ||</div><div class='add'>+	    node-&gt;type == BTRFS_SHARED_DATA_REF_KEY)</div><div class='add'>+		return node-&gt;data_ref.objectid;</div><div class='add'>+	return node-&gt;tree_ref.level;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline u64 btrfs_delayed_ref_offset(const struct btrfs_delayed_ref_node *node)</div><div class='ctx'> {</div><div class='del'>-	return container_of(node, struct btrfs_delayed_tree_ref, node);</div><div class='add'>+	if (node-&gt;type == BTRFS_EXTENT_DATA_REF_KEY ||</div><div class='add'>+	    node-&gt;type == BTRFS_SHARED_DATA_REF_KEY)</div><div class='add'>+		return node-&gt;data_ref.offset;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline struct btrfs_delayed_data_ref *</div><div class='del'>-btrfs_delayed_node_to_data_ref(struct btrfs_delayed_ref_node *node)</div><div class='add'>+static inline u8 btrfs_ref_type(const struct btrfs_ref *ref)</div><div class='ctx'> {</div><div class='del'>-	return container_of(node, struct btrfs_delayed_data_ref, node);</div><div class='add'>+	ASSERT(ref-&gt;type == BTRFS_REF_DATA || ref-&gt;type == BTRFS_REF_METADATA);</div><div class='add'>+</div><div class='add'>+	if (ref-&gt;type == BTRFS_REF_DATA) {</div><div class='add'>+		if (ref-&gt;parent)</div><div class='add'>+			return BTRFS_SHARED_DATA_REF_KEY;</div><div class='add'>+		else</div><div class='add'>+			return BTRFS_EXTENT_DATA_REF_KEY;</div><div class='add'>+	} else {</div><div class='add'>+		if (ref-&gt;parent)</div><div class='add'>+			return BTRFS_SHARED_BLOCK_REF_KEY;</div><div class='add'>+		else</div><div class='add'>+			return BTRFS_TREE_BLOCK_REF_KEY;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/btrfs/dev-replace.c b/fs/btrfs/dev-replace.c<br/>index c85a7d44da79..b6c7da8e1bc8 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/dev-replace.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/dev-replace.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/dev-replace.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/dev-replace.c</a></div><div class='hunk'>@@ -11,18 +11,17 @@</div><div class='ctx'> #include &lt;linux/math64.h&gt;</div><div class='ctx'> #include "misc.h"</div><div class='ctx'> #include "ctree.h"</div><div class='del'>-#include "extent_map.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='ctx'> #include "transaction.h"</div><div class='del'>-#include "print-tree.h"</div><div class='ctx'> #include "volumes.h"</div><div class='ctx'> #include "async-thread.h"</div><div class='del'>-#include "check-integrity.h"</div><div class='del'>-#include "rcu-string.h"</div><div class='ctx'> #include "dev-replace.h"</div><div class='ctx'> #include "sysfs.h"</div><div class='ctx'> #include "zoned.h"</div><div class='ctx'> #include "block-group.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "scrub.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Device replace overview</div><div class='hunk'>@@ -39,14 +38,14 @@</div><div class='ctx'>  *   All new writes will be written to both target and source devices, so even</div><div class='ctx'>  *   if replace gets canceled, sources device still contains up-to-date data.</div><div class='ctx'>  *</div><div class='del'>- *   Location:		handle_ops_on_dev_replace() from __btrfs_map_block()</div><div class='add'>+ *   Location:		handle_ops_on_dev_replace() from btrfs_map_block()</div><div class='ctx'>  *   Start:		btrfs_dev_replace_start()</div><div class='ctx'>  *   End:		btrfs_dev_replace_finishing()</div><div class='ctx'>  *   Content:		Latest data/metadata</div><div class='ctx'>  *</div><div class='ctx'>  * - Copy existing extents</div><div class='ctx'>  *</div><div class='del'>- *   This happens by re-using scrub facility, as scrub also iterates through</div><div class='add'>+ *   This happens by reusing scrub facility, as scrub also iterates through</div><div class='ctx'>  *   existing extents from commit root.</div><div class='ctx'>  *</div><div class='ctx'>  *   Location:		scrub_write_block_to_dev_replace() from</div><div class='hunk'>@@ -77,7 +76,7 @@ int btrfs_init_dev_replace(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='ctx'> 	int slot;</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	struct btrfs_path *path = NULL;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	int item_size;</div><div class='ctx'> 	struct btrfs_dev_replace_item *ptr;</div><div class='ctx'> 	u64 src_devid;</div><div class='hunk'>@@ -86,10 +85,8 @@ int btrfs_init_dev_replace(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='del'>-	if (!path) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (!path)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = 0;</div><div class='ctx'> 	key.type = BTRFS_DEV_REPLACE_KEY;</div><div class='hunk'>@@ -101,13 +98,11 @@ no_valid_dev_replace_entry_found:</div><div class='ctx'> 		 * We don't have a replace item or it's corrupted.  If there is</div><div class='ctx'> 		 * a replace target, fail the mount.</div><div class='ctx'> 		 */</div><div class='del'>-		if (btrfs_find_device(fs_info-&gt;fs_devices, &amp;args)) {</div><div class='add'>+		if (unlikely(btrfs_find_device(fs_info-&gt;fs_devices, &amp;args))) {</div><div class='ctx'> 			btrfs_err(fs_info,</div><div class='ctx'> 			"found replace target device without a valid replace item");</div><div class='del'>-			ret = -EUCLEAN;</div><div class='del'>-			goto out;</div><div class='add'>+			return -EUCLEAN;</div><div class='ctx'> 		}</div><div class='del'>-		ret = 0;</div><div class='ctx'> 		dev_replace-&gt;replace_state =</div><div class='ctx'> 			BTRFS_IOCTL_DEV_REPLACE_STATE_NEVER_STARTED;</div><div class='ctx'> 		dev_replace-&gt;cont_reading_from_srcdev_mode =</div><div class='hunk'>@@ -124,11 +119,11 @@ no_valid_dev_replace_entry_found:</div><div class='ctx'> 		dev_replace-&gt;tgtdev = NULL;</div><div class='ctx'> 		dev_replace-&gt;is_valid = 0;</div><div class='ctx'> 		dev_replace-&gt;item_needs_writeback = 0;</div><div class='del'>-		goto out;</div><div class='add'>+		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> 	slot = path-&gt;slots[0];</div><div class='ctx'> 	eb = path-&gt;nodes[0];</div><div class='del'>-	item_size = btrfs_item_size_nr(eb, slot);</div><div class='add'>+	item_size = btrfs_item_size(eb, slot);</div><div class='ctx'> 	ptr = btrfs_item_ptr(eb, slot, struct btrfs_dev_replace_item);</div><div class='ctx'> </div><div class='ctx'> 	if (item_size != sizeof(struct btrfs_dev_replace_item)) {</div><div class='hunk'>@@ -163,9 +158,9 @@ no_valid_dev_replace_entry_found:</div><div class='ctx'> 		 * We don't have an active replace item but if there is a</div><div class='ctx'> 		 * replace target, fail the mount.</div><div class='ctx'> 		 */</div><div class='del'>-		if (btrfs_find_device(fs_info-&gt;fs_devices, &amp;args)) {</div><div class='add'>+		if (unlikely(btrfs_find_device(fs_info-&gt;fs_devices, &amp;args))) {</div><div class='ctx'> 			btrfs_err(fs_info,</div><div class='del'>-			"replace devid present without an active replace item");</div><div class='add'>+"replace without active item, run 'device scan --forget' on the target device");</div><div class='ctx'> 			ret = -EUCLEAN;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			dev_replace-&gt;srcdev = NULL;</div><div class='hunk'>@@ -182,8 +177,7 @@ no_valid_dev_replace_entry_found:</div><div class='ctx'> 		 * allow 'btrfs dev replace_cancel' if src/tgt device is</div><div class='ctx'> 		 * missing</div><div class='ctx'> 		 */</div><div class='del'>-		if (!dev_replace-&gt;srcdev &amp;&amp;</div><div class='del'>-		    !btrfs_test_opt(fs_info, DEGRADED)) {</div><div class='add'>+		if (unlikely(!dev_replace-&gt;srcdev &amp;&amp; !btrfs_test_opt(fs_info, DEGRADED))) {</div><div class='ctx'> 			ret = -EIO;</div><div class='ctx'> 			btrfs_warn(fs_info,</div><div class='ctx'> 			   "cannot mount because device replace operation is ongoing and");</div><div class='hunk'>@@ -191,8 +185,7 @@ no_valid_dev_replace_entry_found:</div><div class='ctx'> 			   "srcdev (devid %llu) is missing, need to run 'btrfs dev scan'?",</div><div class='ctx'> 			   src_devid);</div><div class='ctx'> 		}</div><div class='del'>-		if (!dev_replace-&gt;tgtdev &amp;&amp;</div><div class='del'>-		    !btrfs_test_opt(fs_info, DEGRADED)) {</div><div class='add'>+		if (unlikely(!dev_replace-&gt;tgtdev &amp;&amp; !btrfs_test_opt(fs_info, DEGRADED))) {</div><div class='ctx'> 			ret = -EIO;</div><div class='ctx'> 			btrfs_warn(fs_info,</div><div class='ctx'> 			   "cannot mount because device replace operation is ongoing and");</div><div class='hunk'>@@ -227,8 +220,6 @@ no_valid_dev_replace_entry_found:</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -243,9 +234,10 @@ static int btrfs_init_dev_replace_tgtdev(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				  struct btrfs_device *srcdev,</div><div class='ctx'> 				  struct btrfs_device **device_out)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_devices *fs_devices = fs_info-&gt;fs_devices;</div><div class='ctx'> 	struct btrfs_device *device;</div><div class='add'>+	struct file *bdev_file;</div><div class='ctx'> 	struct block_device *bdev;</div><div class='del'>-	struct rcu_string *name;</div><div class='ctx'> 	u64 devid = BTRFS_DEV_REPLACE_DEVID;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -255,12 +247,13 @@ static int btrfs_init_dev_replace_tgtdev(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	bdev = blkdev_get_by_path(device_path, FMODE_WRITE | FMODE_EXCL,</div><div class='del'>-				  fs_info-&gt;bdev_holder);</div><div class='del'>-	if (IS_ERR(bdev)) {</div><div class='add'>+	bdev_file = bdev_file_open_by_path(device_path, BLK_OPEN_WRITE,</div><div class='add'>+					   fs_info-&gt;sb, &amp;fs_holder_ops);</div><div class='add'>+	if (IS_ERR(bdev_file)) {</div><div class='ctx'> 		btrfs_err(fs_info, "target device %s is invalid!", device_path);</div><div class='del'>-		return PTR_ERR(bdev);</div><div class='add'>+		return PTR_ERR(bdev_file);</div><div class='ctx'> 	}</div><div class='add'>+	bdev = file_bdev(bdev_file);</div><div class='ctx'> </div><div class='ctx'> 	if (!btrfs_check_device_zone_type(fs_info, bdev)) {</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='hunk'>@@ -271,7 +264,7 @@ static int btrfs_init_dev_replace_tgtdev(struct btrfs_fs_info *fs_info,</div><div class='ctx'> </div><div class='ctx'> 	sync_blockdev(bdev);</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry(device, &amp;fs_info-&gt;fs_devices-&gt;devices, dev_list) {</div><div class='add'>+	list_for_each_entry(device, &amp;fs_devices-&gt;devices, dev_list) {</div><div class='ctx'> 		if (device-&gt;bdev == bdev) {</div><div class='ctx'> 			btrfs_err(fs_info,</div><div class='ctx'> 				  "target device is in the filesystem!");</div><div class='hunk'>@@ -289,19 +282,15 @@ static int btrfs_init_dev_replace_tgtdev(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> </div><div class='del'>-	device = btrfs_alloc_device(NULL, &amp;devid, NULL);</div><div class='add'>+	device = btrfs_alloc_device(NULL, &amp;devid, NULL, device_path);</div><div class='ctx'> 	if (IS_ERR(device)) {</div><div class='ctx'> 		ret = PTR_ERR(device);</div><div class='ctx'> 		goto error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	name = rcu_string_strdup(device_path, GFP_KERNEL);</div><div class='del'>-	if (!name) {</div><div class='del'>-		btrfs_free_device(device);</div><div class='del'>-		ret = -ENOMEM;</div><div class='add'>+	ret = lookup_bdev(device_path, &amp;device-&gt;devt);</div><div class='add'>+	if (ret)</div><div class='ctx'> 		goto error;</div><div class='del'>-	}</div><div class='del'>-	rcu_assign_pointer(device-&gt;name, name);</div><div class='ctx'> </div><div class='ctx'> 	set_bit(BTRFS_DEV_STATE_WRITEABLE, &amp;device-&gt;dev_state);</div><div class='ctx'> 	device-&gt;generation = 0;</div><div class='hunk'>@@ -315,28 +304,28 @@ static int btrfs_init_dev_replace_tgtdev(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	device-&gt;commit_bytes_used = device-&gt;bytes_used;</div><div class='ctx'> 	device-&gt;fs_info = fs_info;</div><div class='ctx'> 	device-&gt;bdev = bdev;</div><div class='add'>+	device-&gt;bdev_file = bdev_file;</div><div class='ctx'> 	set_bit(BTRFS_DEV_STATE_IN_FS_METADATA, &amp;device-&gt;dev_state);</div><div class='ctx'> 	set_bit(BTRFS_DEV_STATE_REPLACE_TGT, &amp;device-&gt;dev_state);</div><div class='del'>-	device-&gt;mode = FMODE_EXCL;</div><div class='ctx'> 	device-&gt;dev_stats_valid = 1;</div><div class='del'>-	set_blocksize(device-&gt;bdev, BTRFS_BDEV_BLOCKSIZE);</div><div class='del'>-	device-&gt;fs_devices = fs_info-&gt;fs_devices;</div><div class='add'>+	set_blocksize(bdev_file, BTRFS_BDEV_BLOCKSIZE);</div><div class='add'>+	device-&gt;fs_devices = fs_devices;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_get_dev_zone_info(device);</div><div class='add'>+	ret = btrfs_get_dev_zone_info(device, false);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto error;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;fs_info-&gt;fs_devices-&gt;device_list_mutex);</div><div class='del'>-	list_add(&amp;device-&gt;dev_list, &amp;fs_info-&gt;fs_devices-&gt;devices);</div><div class='del'>-	fs_info-&gt;fs_devices-&gt;num_devices++;</div><div class='del'>-	fs_info-&gt;fs_devices-&gt;open_devices++;</div><div class='del'>-	mutex_unlock(&amp;fs_info-&gt;fs_devices-&gt;device_list_mutex);</div><div class='add'>+	mutex_lock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='add'>+	list_add(&amp;device-&gt;dev_list, &amp;fs_devices-&gt;devices);</div><div class='add'>+	fs_devices-&gt;num_devices++;</div><div class='add'>+	fs_devices-&gt;open_devices++;</div><div class='add'>+	mutex_unlock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='ctx'> </div><div class='ctx'> 	*device_out = device;</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> error:</div><div class='del'>-	blkdev_put(bdev, FMODE_EXCL);</div><div class='add'>+	bdev_fput(bdev_file);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -349,7 +338,7 @@ int btrfs_run_dev_replace(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct btrfs_root *dev_root = fs_info-&gt;dev_root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='ctx'> 	struct btrfs_dev_replace_item *ptr;</div><div class='hunk'>@@ -368,20 +357,19 @@ int btrfs_run_dev_replace(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	key.offset = 0;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='del'>-	if (!path) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (!path)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='ctx'> 	ret = btrfs_search_slot(trans, dev_root, &amp;key, path, -1, 1);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='ctx'> 		btrfs_warn(fs_info,</div><div class='ctx'> 			   "error %d while searching for dev_replace item!",</div><div class='ctx'> 			   ret);</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (ret == 0 &amp;&amp;</div><div class='del'>-	    btrfs_item_size_nr(path-&gt;nodes[0], path-&gt;slots[0]) &lt; sizeof(*ptr)) {</div><div class='add'>+	    btrfs_item_size(path-&gt;nodes[0], path-&gt;slots[0]) &lt; sizeof(*ptr)) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * need to delete old one and insert a new one.</div><div class='ctx'> 		 * Since no attempt is made to recover any old state, if the</div><div class='hunk'>@@ -398,7 +386,7 @@ int btrfs_run_dev_replace(struct btrfs_trans_handle *trans)</div><div class='ctx'> 			btrfs_warn(fs_info,</div><div class='ctx'> 				   "delete too small dev_replace item failed %d!",</div><div class='ctx'> 				   ret);</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 		}</div><div class='ctx'> 		ret = 1;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -411,7 +399,7 @@ int btrfs_run_dev_replace(struct btrfs_trans_handle *trans)</div><div class='ctx'> 		if (ret &lt; 0) {</div><div class='ctx'> 			btrfs_warn(fs_info,</div><div class='ctx'> 				   "insert dev_replace item failed %d!", ret);</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -444,22 +432,9 @@ int btrfs_run_dev_replace(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	dev_replace-&gt;item_needs_writeback = 0;</div><div class='ctx'> 	up_write(&amp;dev_replace-&gt;rwsem);</div><div class='ctx'> </div><div class='del'>-	btrfs_mark_buffer_dirty(eb);</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static char* btrfs_dev_name(struct btrfs_device *device)</div><div class='del'>-{</div><div class='del'>-	if (!device || test_bit(BTRFS_DEV_STATE_MISSING, &amp;device-&gt;dev_state))</div><div class='del'>-		return "&lt;missing disk&gt;";</div><div class='del'>-	else</div><div class='del'>-		return rcu_str_deref(device-&gt;name);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int mark_block_group_to_copy(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				    struct btrfs_device *src_dev)</div><div class='ctx'> {</div><div class='hunk'>@@ -470,6 +445,7 @@ static int mark_block_group_to_copy(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	struct btrfs_dev_extent *dev_extent = NULL;</div><div class='ctx'> 	struct btrfs_block_group *cache;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='add'>+	int iter_ret = 0;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	u64 chunk_offset;</div><div class='ctx'> </div><div class='hunk'>@@ -513,36 +489,15 @@ static int mark_block_group_to_copy(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	path-&gt;reada = READA_FORWARD;</div><div class='del'>-	path-&gt;search_commit_root = 1;</div><div class='del'>-	path-&gt;skip_locking = 1;</div><div class='add'>+	path-&gt;search_commit_root = true;</div><div class='add'>+	path-&gt;skip_locking = true;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = src_dev-&gt;devid;</div><div class='ctx'> 	key.type = BTRFS_DEV_EXTENT_KEY;</div><div class='ctx'> 	key.offset = 0;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto free_path;</div><div class='del'>-	if (ret &gt; 0) {</div><div class='del'>-		if (path-&gt;slots[0] &gt;=</div><div class='del'>-		    btrfs_header_nritems(path-&gt;nodes[0])) {</div><div class='del'>-			ret = btrfs_next_leaf(root, path);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto free_path;</div><div class='del'>-			if (ret &gt; 0) {</div><div class='del'>-				ret = 0;</div><div class='del'>-				goto free_path;</div><div class='del'>-			}</div><div class='del'>-		} else {</div><div class='del'>-			ret = 0;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	while (1) {</div><div class='add'>+	btrfs_for_each_slot(root, &amp;key, &amp;found_key, path, iter_ret) {</div><div class='ctx'> 		struct extent_buffer *leaf = path-&gt;nodes[0];</div><div class='del'>-		int slot = path-&gt;slots[0];</div><div class='del'>-</div><div class='del'>-		btrfs_item_key_to_cpu(leaf, &amp;found_key, slot);</div><div class='ctx'> </div><div class='ctx'> 		if (found_key.objectid != src_dev-&gt;devid)</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -553,30 +508,20 @@ static int mark_block_group_to_copy(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		if (found_key.offset &lt; key.offset)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		dev_extent = btrfs_item_ptr(leaf, slot, struct btrfs_dev_extent);</div><div class='add'>+		dev_extent = btrfs_item_ptr(leaf, path-&gt;slots[0], struct btrfs_dev_extent);</div><div class='ctx'> </div><div class='ctx'> 		chunk_offset = btrfs_dev_extent_chunk_offset(leaf, dev_extent);</div><div class='ctx'> </div><div class='ctx'> 		cache = btrfs_lookup_block_group(fs_info, chunk_offset);</div><div class='ctx'> 		if (!cache)</div><div class='del'>-			goto skip;</div><div class='del'>-</div><div class='del'>-		spin_lock(&amp;cache-&gt;lock);</div><div class='del'>-		cache-&gt;to_copy = 1;</div><div class='del'>-		spin_unlock(&amp;cache-&gt;lock);</div><div class='add'>+			continue;</div><div class='ctx'> </div><div class='add'>+		set_bit(BLOCK_GROUP_FLAG_TO_COPY, &amp;cache-&gt;runtime_flags);</div><div class='ctx'> 		btrfs_put_block_group(cache);</div><div class='del'>-</div><div class='del'>-skip:</div><div class='del'>-		ret = btrfs_next_item(root, path);</div><div class='del'>-		if (ret != 0) {</div><div class='del'>-			if (ret &gt; 0)</div><div class='del'>-				ret = 0;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='add'>+	if (iter_ret &lt; 0)</div><div class='add'>+		ret = iter_ret;</div><div class='ctx'> </div><div class='del'>-free_path:</div><div class='ctx'> 	btrfs_free_path(path);</div><div class='ctx'> unlock:</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;chunk_mutex);</div><div class='hunk'>@@ -589,8 +534,7 @@ bool btrfs_finish_block_group_to_copy(struct btrfs_device *srcdev,</div><div class='ctx'> 				      u64 physical)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = cache-&gt;fs_info;</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	struct map_lookup *map;</div><div class='add'>+	struct btrfs_chunk_map *map;</div><div class='ctx'> 	u64 chunk_offset = cache-&gt;start;</div><div class='ctx'> 	int num_extents, cur_extent;</div><div class='ctx'> 	int i;</div><div class='hunk'>@@ -600,17 +544,17 @@ bool btrfs_finish_block_group_to_copy(struct btrfs_device *srcdev,</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;cache-&gt;lock);</div><div class='del'>-	if (cache-&gt;removed) {</div><div class='add'>+	if (test_bit(BLOCK_GROUP_FLAG_REMOVED, &amp;cache-&gt;runtime_flags)) {</div><div class='ctx'> 		spin_unlock(&amp;cache-&gt;lock);</div><div class='ctx'> 		return true;</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;cache-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	em = btrfs_get_chunk_map(fs_info, chunk_offset, 1);</div><div class='del'>-	ASSERT(!IS_ERR(em));</div><div class='del'>-	map = em-&gt;map_lookup;</div><div class='add'>+	map = btrfs_get_chunk_map(fs_info, chunk_offset, 1);</div><div class='add'>+	ASSERT(!IS_ERR(map));</div><div class='ctx'> </div><div class='del'>-	num_extents = cur_extent = 0;</div><div class='add'>+	num_extents = 0;</div><div class='add'>+	cur_extent = 0;</div><div class='ctx'> 	for (i = 0; i &lt; map-&gt;num_stripes; i++) {</div><div class='ctx'> 		/* We have more device extent to copy */</div><div class='ctx'> 		if (srcdev != map-&gt;stripes[i].dev)</div><div class='hunk'>@@ -621,7 +565,7 @@ bool btrfs_finish_block_group_to_copy(struct btrfs_device *srcdev,</div><div class='ctx'> 			cur_extent = i;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_chunk_map(map);</div><div class='ctx'> </div><div class='ctx'> 	if (num_extents &gt; 1 &amp;&amp; cur_extent &lt; num_extents - 1) {</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -632,9 +576,7 @@ bool btrfs_finish_block_group_to_copy(struct btrfs_device *srcdev,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Last stripe on this device */</div><div class='del'>-	spin_lock(&amp;cache-&gt;lock);</div><div class='del'>-	cache-&gt;to_copy = 0;</div><div class='del'>-	spin_unlock(&amp;cache-&gt;lock);</div><div class='add'>+	clear_bit(BLOCK_GROUP_FLAG_TO_COPY, &amp;cache-&gt;runtime_flags);</div><div class='ctx'> </div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='hunk'>@@ -656,7 +598,7 @@ static int btrfs_dev_replace_start(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		return PTR_ERR(src_device);</div><div class='ctx'> </div><div class='ctx'> 	if (btrfs_pinned_by_swapfile(fs_info, src_device)) {</div><div class='del'>-		btrfs_warn_in_rcu(fs_info,</div><div class='add'>+		btrfs_warn(fs_info,</div><div class='ctx'> 	  "cannot replace device %s (devid %llu) due to active swapfile",</div><div class='ctx'> 			btrfs_dev_name(src_device), src_device-&gt;devid);</div><div class='ctx'> 		return -ETXTBSY;</div><div class='hunk'>@@ -685,6 +627,7 @@ static int btrfs_dev_replace_start(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='ctx'> 	down_write(&amp;dev_replace-&gt;rwsem);</div><div class='add'>+	dev_replace-&gt;replace_task = current;</div><div class='ctx'> 	switch (dev_replace-&gt;replace_state) {</div><div class='ctx'> 	case BTRFS_IOCTL_DEV_REPLACE_STATE_NEVER_STARTED:</div><div class='ctx'> 	case BTRFS_IOCTL_DEV_REPLACE_STATE_FINISHED:</div><div class='hunk'>@@ -692,7 +635,7 @@ static int btrfs_dev_replace_start(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		break;</div><div class='ctx'> 	case BTRFS_IOCTL_DEV_REPLACE_STATE_STARTED:</div><div class='ctx'> 	case BTRFS_IOCTL_DEV_REPLACE_STATE_SUSPENDED:</div><div class='del'>-		ASSERT(0);</div><div class='add'>+		DEBUG_WARN("unexpected STARTED or SUSPENDED dev-replace state");</div><div class='ctx'> 		ret = BTRFS_IOCTL_DEV_REPLACE_RESULT_ALREADY_STARTED;</div><div class='ctx'> 		up_write(&amp;dev_replace-&gt;rwsem);</div><div class='ctx'> 		goto leave;</div><div class='hunk'>@@ -702,11 +645,11 @@ static int btrfs_dev_replace_start(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	dev_replace-&gt;srcdev = src_device;</div><div class='ctx'> 	dev_replace-&gt;tgtdev = tgt_device;</div><div class='ctx'> </div><div class='del'>-	btrfs_info_in_rcu(fs_info,</div><div class='add'>+	btrfs_info(fs_info,</div><div class='ctx'> 		      "dev_replace from %s (devid %llu) to %s started",</div><div class='ctx'> 		      btrfs_dev_name(src_device),</div><div class='ctx'> 		      src_device-&gt;devid,</div><div class='del'>-		      rcu_str_deref(tgt_device-&gt;name));</div><div class='add'>+		      btrfs_dev_name(tgt_device));</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * from now on, the writes to the srcdev are all duplicated to</div><div class='hunk'>@@ -728,9 +671,14 @@ static int btrfs_dev_replace_start(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		btrfs_err(fs_info, "kobj add dev failed %d", ret);</div><div class='ctx'> </div><div class='del'>-	btrfs_wait_ordered_roots(fs_info, U64_MAX, 0, (u64)-1);</div><div class='add'>+	btrfs_wait_ordered_roots(fs_info, U64_MAX, NULL);</div><div class='ctx'> </div><div class='del'>-	/* Commit dev_replace state and reserve 1 item for it. */</div><div class='add'>+	/*</div><div class='add'>+	 * Commit dev_replace state and reserve 1 item for it.</div><div class='add'>+	 * This is crucial to ensure we won't miss copying extents for new block</div><div class='add'>+	 * groups that are allocated after we started the device replace, and</div><div class='add'>+	 * must be done after setting up the device replace state.</div><div class='add'>+	 */</div><div class='ctx'> 	trans = btrfs_start_transaction(root, 1);</div><div class='ctx'> 	if (IS_ERR(trans)) {</div><div class='ctx'> 		ret = PTR_ERR(trans);</div><div class='hunk'>@@ -762,6 +710,23 @@ leave:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int btrfs_check_replace_dev_names(struct btrfs_ioctl_dev_replace_args *args)</div><div class='add'>+{</div><div class='add'>+	if (args-&gt;start.srcdevid == 0) {</div><div class='add'>+		if (memchr(args-&gt;start.srcdev_name, 0,</div><div class='add'>+			   sizeof(args-&gt;start.srcdev_name)) == NULL)</div><div class='add'>+			return -ENAMETOOLONG;</div><div class='add'>+	} else {</div><div class='add'>+		args-&gt;start.srcdev_name[0] = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (memchr(args-&gt;start.tgtdev_name, 0,</div><div class='add'>+		   sizeof(args-&gt;start.tgtdev_name)) == NULL)</div><div class='add'>+	    return -ENAMETOOLONG;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> int btrfs_dev_replace_by_ioctl(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			    struct btrfs_ioctl_dev_replace_args *args)</div><div class='ctx'> {</div><div class='hunk'>@@ -774,10 +739,9 @@ int btrfs_dev_replace_by_ioctl(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	default:</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	if ((args-&gt;start.srcdevid == 0 &amp;&amp; args-&gt;start.srcdev_name[0] == '\0') ||</div><div class='del'>-	    args-&gt;start.tgtdev_name[0] == '\0')</div><div class='del'>-		return -EINVAL;</div><div class='add'>+	ret = btrfs_check_replace_dev_names(args);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_dev_replace_start(fs_info, args-&gt;start.tgtdev_name,</div><div class='ctx'> 					args-&gt;start.srcdevid,</div><div class='hunk'>@@ -828,17 +792,17 @@ static int btrfs_set_target_alloc_state(struct btrfs_device *srcdev,</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;srcdev-&gt;fs_info-&gt;chunk_mutex);</div><div class='ctx'> </div><div class='del'>-	while (!find_first_extent_bit(&amp;srcdev-&gt;alloc_state, start,</div><div class='del'>-				      &amp;found_start, &amp;found_end,</div><div class='del'>-				      CHUNK_ALLOCATED, &amp;cached_state)) {</div><div class='del'>-		ret = set_extent_bits(&amp;tgtdev-&gt;alloc_state, found_start,</div><div class='del'>-				      found_end, CHUNK_ALLOCATED);</div><div class='add'>+	while (btrfs_find_first_extent_bit(&amp;srcdev-&gt;alloc_state, start,</div><div class='add'>+					   &amp;found_start, &amp;found_end,</div><div class='add'>+					   CHUNK_ALLOCATED, &amp;cached_state)) {</div><div class='add'>+		ret = btrfs_set_extent_bit(&amp;tgtdev-&gt;alloc_state, found_start,</div><div class='add'>+					   found_end, CHUNK_ALLOCATED, NULL);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			break;</div><div class='ctx'> 		start = found_end + 1;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	free_extent_state(cached_state);</div><div class='add'>+	btrfs_free_extent_state(cached_state);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -847,31 +811,53 @@ static void btrfs_dev_replace_update_device_in_mapping_tree(</div><div class='ctx'> 						struct btrfs_device *srcdev,</div><div class='ctx'> 						struct btrfs_device *tgtdev)</div><div class='ctx'> {</div><div class='del'>-	struct extent_map_tree *em_tree = &amp;fs_info-&gt;mapping_tree;</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	struct map_lookup *map;</div><div class='del'>-	u64 start = 0;</div><div class='del'>-	int i;</div><div class='add'>+	struct rb_node *node;</div><div class='ctx'> </div><div class='del'>-	write_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	do {</div><div class='del'>-		em = lookup_extent_mapping(em_tree, start, (u64)-1);</div><div class='del'>-		if (!em)</div><div class='del'>-			break;</div><div class='del'>-		map = em-&gt;map_lookup;</div><div class='del'>-		for (i = 0; i &lt; map-&gt;num_stripes; i++)</div><div class='add'>+	/*</div><div class='add'>+	 * The chunk mutex must be held so that no new chunks can be created</div><div class='add'>+	 * while we are updating existing chunks. This guarantees we don't miss</div><div class='add'>+	 * any new chunk that gets created for a range that falls before the</div><div class='add'>+	 * range of the last chunk we processed.</div><div class='add'>+	 */</div><div class='add'>+	lockdep_assert_held(&amp;fs_info-&gt;chunk_mutex);</div><div class='add'>+</div><div class='add'>+	write_lock(&amp;fs_info-&gt;mapping_tree_lock);</div><div class='add'>+	node = rb_first_cached(&amp;fs_info-&gt;mapping_tree);</div><div class='add'>+	while (node) {</div><div class='add'>+		struct rb_node *next = rb_next(node);</div><div class='add'>+		struct btrfs_chunk_map *map;</div><div class='add'>+		u64 next_start;</div><div class='add'>+</div><div class='add'>+		map = rb_entry(node, struct btrfs_chunk_map, rb_node);</div><div class='add'>+		next_start = map-&gt;start + map-&gt;chunk_len;</div><div class='add'>+</div><div class='add'>+		for (int i = 0; i &lt; map-&gt;num_stripes; i++)</div><div class='ctx'> 			if (srcdev == map-&gt;stripes[i].dev)</div><div class='ctx'> 				map-&gt;stripes[i].dev = tgtdev;</div><div class='del'>-		start = em-&gt;start + em-&gt;len;</div><div class='del'>-		free_extent_map(em);</div><div class='del'>-	} while (start);</div><div class='del'>-	write_unlock(&amp;em_tree-&gt;lock);</div><div class='add'>+</div><div class='add'>+		if (cond_resched_rwlock_write(&amp;fs_info-&gt;mapping_tree_lock)) {</div><div class='add'>+			map = btrfs_find_chunk_map_nolock(fs_info, next_start, U64_MAX);</div><div class='add'>+			if (!map)</div><div class='add'>+				break;</div><div class='add'>+			node = &amp;map-&gt;rb_node;</div><div class='add'>+			/*</div><div class='add'>+			 * Drop the lookup reference since we are holding the</div><div class='add'>+			 * lock in write mode and no one can remove the chunk</div><div class='add'>+			 * map from the tree and drop its tree reference.</div><div class='add'>+			 */</div><div class='add'>+			btrfs_free_chunk_map(map);</div><div class='add'>+		} else {</div><div class='add'>+			node = next;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	write_unlock(&amp;fs_info-&gt;mapping_tree_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int btrfs_dev_replace_finishing(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				       int scrub_ret)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_dev_replace *dev_replace = &amp;fs_info-&gt;dev_replace;</div><div class='add'>+	struct btrfs_fs_devices *fs_devices = fs_info-&gt;fs_devices;</div><div class='ctx'> 	struct btrfs_device *tgt_device;</div><div class='ctx'> 	struct btrfs_device *src_device;</div><div class='ctx'> 	struct btrfs_root *root = fs_info-&gt;tree_root;</div><div class='hunk'>@@ -904,10 +890,7 @@ static int btrfs_dev_replace_finishing(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		mutex_unlock(&amp;dev_replace-&gt;lock_finishing_cancel_unmount);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_wait_ordered_roots(fs_info, U64_MAX, 0, (u64)-1);</div><div class='del'>-</div><div class='del'>-	if (!scrub_ret)</div><div class='del'>-		btrfs_reada_remove_dev(src_device);</div><div class='add'>+	btrfs_wait_ordered_roots(fs_info, U64_MAX, NULL);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We have to use this loop approach because at this point src_device</div><div class='hunk'>@@ -917,7 +900,6 @@ static int btrfs_dev_replace_finishing(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		trans = btrfs_start_transaction(root, 0);</div><div class='ctx'> 		if (IS_ERR(trans)) {</div><div class='del'>-			btrfs_reada_undo_remove_dev(src_device);</div><div class='ctx'> 			mutex_unlock(&amp;dev_replace-&gt;lock_finishing_cancel_unmount);</div><div class='ctx'> 			return PTR_ERR(trans);</div><div class='ctx'> 		}</div><div class='hunk'>@@ -925,12 +907,12 @@ static int btrfs_dev_replace_finishing(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		WARN_ON(ret);</div><div class='ctx'> </div><div class='ctx'> 		/* Prevent write_all_supers() during the finishing procedure */</div><div class='del'>-		mutex_lock(&amp;fs_info-&gt;fs_devices-&gt;device_list_mutex);</div><div class='add'>+		mutex_lock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='ctx'> 		/* Prevent new chunks being allocated on the source device */</div><div class='ctx'> 		mutex_lock(&amp;fs_info-&gt;chunk_mutex);</div><div class='ctx'> </div><div class='ctx'> 		if (!list_empty(&amp;src_device-&gt;post_commit_list)) {</div><div class='del'>-			mutex_unlock(&amp;fs_info-&gt;fs_devices-&gt;device_list_mutex);</div><div class='add'>+			mutex_unlock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='ctx'> 			mutex_unlock(&amp;fs_info-&gt;chunk_mutex);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -959,16 +941,15 @@ static int btrfs_dev_replace_finishing(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 								tgt_device);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		if (scrub_ret != -ECANCELED)</div><div class='del'>-			btrfs_err_in_rcu(fs_info,</div><div class='add'>+			btrfs_err(fs_info,</div><div class='ctx'> 				 "btrfs_scrub_dev(%s, %llu, %s) failed %d",</div><div class='ctx'> 				 btrfs_dev_name(src_device),</div><div class='ctx'> 				 src_device-&gt;devid,</div><div class='del'>-				 rcu_str_deref(tgt_device-&gt;name), scrub_ret);</div><div class='add'>+				 btrfs_dev_name(tgt_device), scrub_ret);</div><div class='ctx'> error:</div><div class='ctx'> 		up_write(&amp;dev_replace-&gt;rwsem);</div><div class='ctx'> 		mutex_unlock(&amp;fs_info-&gt;chunk_mutex);</div><div class='del'>-		mutex_unlock(&amp;fs_info-&gt;fs_devices-&gt;device_list_mutex);</div><div class='del'>-		btrfs_reada_undo_remove_dev(src_device);</div><div class='add'>+		mutex_unlock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='ctx'> 		btrfs_rm_dev_replace_blocked(fs_info);</div><div class='ctx'> 		if (tgt_device)</div><div class='ctx'> 			btrfs_destroy_dev_replace_tgtdev(tgt_device);</div><div class='hunk'>@@ -978,11 +959,11 @@ error:</div><div class='ctx'> 		return scrub_ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_info_in_rcu(fs_info,</div><div class='add'>+	btrfs_info(fs_info,</div><div class='ctx'> 			  "dev_replace from %s (devid %llu) to %s finished",</div><div class='ctx'> 			  btrfs_dev_name(src_device),</div><div class='ctx'> 			  src_device-&gt;devid,</div><div class='del'>-			  rcu_str_deref(tgt_device-&gt;name));</div><div class='add'>+			  btrfs_dev_name(tgt_device));</div><div class='ctx'> 	clear_bit(BTRFS_DEV_STATE_REPLACE_TGT, &amp;tgt_device-&gt;dev_state);</div><div class='ctx'> 	tgt_device-&gt;devid = src_device-&gt;devid;</div><div class='ctx'> 	src_device-&gt;devid = BTRFS_DEV_REPLACE_DEVID;</div><div class='hunk'>@@ -997,9 +978,10 @@ error:</div><div class='ctx'> </div><div class='ctx'> 	btrfs_assign_next_active_device(src_device, tgt_device);</div><div class='ctx'> </div><div class='del'>-	list_add(&amp;tgt_device-&gt;dev_alloc_list, &amp;fs_info-&gt;fs_devices-&gt;alloc_list);</div><div class='del'>-	fs_info-&gt;fs_devices-&gt;rw_devices++;</div><div class='add'>+	list_add(&amp;tgt_device-&gt;dev_alloc_list, &amp;fs_devices-&gt;alloc_list);</div><div class='add'>+	fs_devices-&gt;rw_devices++;</div><div class='ctx'> </div><div class='add'>+	dev_replace-&gt;replace_task = NULL;</div><div class='ctx'> 	up_write(&amp;dev_replace-&gt;rwsem);</div><div class='ctx'> 	btrfs_rm_dev_replace_blocked(fs_info);</div><div class='ctx'> </div><div class='hunk'>@@ -1021,14 +1003,13 @@ error:</div><div class='ctx'> 	 * belong to this filesystem.</div><div class='ctx'> 	 */</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;chunk_mutex);</div><div class='del'>-	mutex_unlock(&amp;fs_info-&gt;fs_devices-&gt;device_list_mutex);</div><div class='add'>+	mutex_unlock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='ctx'> </div><div class='ctx'> 	/* replace the sysfs entry */</div><div class='ctx'> 	btrfs_sysfs_remove_device(src_device);</div><div class='ctx'> 	btrfs_sysfs_update_devid(tgt_device);</div><div class='ctx'> 	if (test_bit(BTRFS_DEV_STATE_WRITEABLE, &amp;src_device-&gt;dev_state))</div><div class='del'>-		btrfs_scratch_superblocks(fs_info, src_device-&gt;bdev,</div><div class='del'>-					  src_device-&gt;name-&gt;str);</div><div class='add'>+		btrfs_scratch_superblocks(fs_info, src_device);</div><div class='ctx'> </div><div class='ctx'> 	/* write back the superblocks */</div><div class='ctx'> 	trans = btrfs_start_transaction(root, 0);</div><div class='hunk'>@@ -1126,7 +1107,7 @@ int btrfs_dev_replace_cancel(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 			 * btrfs_dev_replace_finishing() will handle the</div><div class='ctx'> 			 * cleanup part</div><div class='ctx'> 			 */</div><div class='del'>-			btrfs_info_in_rcu(fs_info,</div><div class='add'>+			btrfs_info(fs_info,</div><div class='ctx'> 				"dev_replace from %s (devid %llu) to %s canceled",</div><div class='ctx'> 				btrfs_dev_name(src_device), src_device-&gt;devid,</div><div class='ctx'> 				btrfs_dev_name(tgt_device));</div><div class='hunk'>@@ -1150,8 +1131,7 @@ int btrfs_dev_replace_cancel(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 		up_write(&amp;dev_replace-&gt;rwsem);</div><div class='ctx'> </div><div class='ctx'> 		/* Scrub for replace must not be running in suspended state */</div><div class='del'>-		ret = btrfs_scrub_cancel(fs_info);</div><div class='del'>-		ASSERT(ret != -ENOTCONN);</div><div class='add'>+		btrfs_scrub_cancel(fs_info);</div><div class='ctx'> </div><div class='ctx'> 		trans = btrfs_start_transaction(root, 0);</div><div class='ctx'> 		if (IS_ERR(trans)) {</div><div class='hunk'>@@ -1161,7 +1141,7 @@ int btrfs_dev_replace_cancel(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 		ret = btrfs_commit_transaction(trans);</div><div class='ctx'> 		WARN_ON(ret);</div><div class='ctx'> </div><div class='del'>-		btrfs_info_in_rcu(fs_info,</div><div class='add'>+		btrfs_info(fs_info,</div><div class='ctx'> 		"suspended dev_replace from %s (devid %llu) to %s canceled",</div><div class='ctx'> 			btrfs_dev_name(src_device), src_device-&gt;devid,</div><div class='ctx'> 			btrfs_dev_name(tgt_device));</div><div class='hunk'>@@ -1265,7 +1245,7 @@ static int btrfs_dev_replace_kthread(void *data)</div><div class='ctx'> </div><div class='ctx'> 	progress = btrfs_dev_replace_progress(fs_info);</div><div class='ctx'> 	progress = div_u64(progress, 10);</div><div class='del'>-	btrfs_info_in_rcu(fs_info,</div><div class='add'>+	btrfs_info(fs_info,</div><div class='ctx'> 		"continuing dev_replace from %s (devid %llu) to target %s @%u%%",</div><div class='ctx'> 		btrfs_dev_name(dev_replace-&gt;srcdev),</div><div class='ctx'> 		dev_replace-&gt;srcdev-&gt;devid,</div><div class='hunk'>@@ -1283,16 +1263,16 @@ static int btrfs_dev_replace_kthread(void *data)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int __pure btrfs_dev_replace_is_ongoing(struct btrfs_dev_replace *dev_replace)</div><div class='add'>+bool __pure btrfs_dev_replace_is_ongoing(struct btrfs_dev_replace *dev_replace)</div><div class='ctx'> {</div><div class='ctx'> 	if (!dev_replace-&gt;is_valid)</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	switch (dev_replace-&gt;replace_state) {</div><div class='ctx'> 	case BTRFS_IOCTL_DEV_REPLACE_STATE_NEVER_STARTED:</div><div class='ctx'> 	case BTRFS_IOCTL_DEV_REPLACE_STATE_FINISHED:</div><div class='ctx'> 	case BTRFS_IOCTL_DEV_REPLACE_STATE_CANCELED:</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> 	case BTRFS_IOCTL_DEV_REPLACE_STATE_STARTED:</div><div class='ctx'> 	case BTRFS_IOCTL_DEV_REPLACE_STATE_SUSPENDED:</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -1307,12 +1287,7 @@ int __pure btrfs_dev_replace_is_ongoing(struct btrfs_dev_replace *dev_replace)</div><div class='ctx'> 		 */</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='del'>-	return 1;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void btrfs_bio_counter_inc_noblocked(struct btrfs_fs_info *fs_info)</div><div class='del'>-{</div><div class='del'>-	percpu_counter_inc(&amp;fs_info-&gt;dev_replace.bio_counter);</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_bio_counter_sub(struct btrfs_fs_info *fs_info, s64 amount)</div><div class='head'>diff --git a/fs/btrfs/dev-replace.h b/fs/btrfs/dev-replace.h<br/>index 3911049a5f23..b35cecf388f2 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/dev-replace.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/dev-replace.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/dev-replace.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/dev-replace.h</a></div><div class='hunk'>@@ -6,7 +6,15 @@</div><div class='ctx'> #ifndef BTRFS_DEV_REPLACE_H</div><div class='ctx'> #define BTRFS_DEV_REPLACE_H</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+#include &lt;linux/compiler_types.h&gt;</div><div class='add'>+</div><div class='ctx'> struct btrfs_ioctl_dev_replace_args;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+struct btrfs_trans_handle;</div><div class='add'>+struct btrfs_dev_replace;</div><div class='add'>+struct btrfs_block_group;</div><div class='add'>+struct btrfs_device;</div><div class='ctx'> </div><div class='ctx'> int btrfs_init_dev_replace(struct btrfs_fs_info *fs_info);</div><div class='ctx'> int btrfs_run_dev_replace(struct btrfs_trans_handle *trans);</div><div class='hunk'>@@ -17,9 +25,17 @@ void btrfs_dev_replace_status(struct btrfs_fs_info *fs_info,</div><div class='ctx'> int btrfs_dev_replace_cancel(struct btrfs_fs_info *fs_info);</div><div class='ctx'> void btrfs_dev_replace_suspend_for_unmount(struct btrfs_fs_info *fs_info);</div><div class='ctx'> int btrfs_resume_dev_replace_async(struct btrfs_fs_info *fs_info);</div><div class='del'>-int __pure btrfs_dev_replace_is_ongoing(struct btrfs_dev_replace *dev_replace);</div><div class='add'>+bool __pure btrfs_dev_replace_is_ongoing(struct btrfs_dev_replace *dev_replace);</div><div class='ctx'> bool btrfs_finish_block_group_to_copy(struct btrfs_device *srcdev,</div><div class='ctx'> 				      struct btrfs_block_group *cache,</div><div class='ctx'> 				      u64 physical);</div><div class='add'>+void btrfs_bio_counter_inc_blocked(struct btrfs_fs_info *fs_info);</div><div class='add'>+void btrfs_bio_counter_sub(struct btrfs_fs_info *fs_info, s64 amount);</div><div class='add'>+</div><div class='add'>+static inline void btrfs_bio_counter_dec(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	btrfs_bio_counter_sub(fs_info, 1);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/btrfs/dir-item.c b/fs/btrfs/dir-item.c<br/>index 7721ce0c0604..085a83ae9e62 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/dir-item.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/dir-item.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/dir-item.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/dir-item.c</a></div><div class='hunk'>@@ -3,9 +3,13 @@</div><div class='ctx'>  * Copyright (C) 2007 Oracle.  All rights reserved.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='add'>+#include "messages.h"</div><div class='ctx'> #include "ctree.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='ctx'> #include "transaction.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "dir-item.h"</div><div class='add'>+#include "delayed-inode.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * insert a name into a directory, doing overflow properly if there is a hash</div><div class='hunk'>@@ -19,32 +23,29 @@ static struct btrfs_dir_item *insert_with_overflow(struct btrfs_trans_handle</div><div class='ctx'> 						   *trans,</div><div class='ctx'> 						   struct btrfs_root *root,</div><div class='ctx'> 						   struct btrfs_path *path,</div><div class='del'>-						   struct btrfs_key *cpu_key,</div><div class='add'>+						   const struct btrfs_key *cpu_key,</div><div class='ctx'> 						   u32 data_size,</div><div class='ctx'> 						   const char *name,</div><div class='ctx'> 						   int name_len)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	char *ptr;</div><div class='del'>-	struct btrfs_item *item;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_insert_empty_item(trans, root, path, cpu_key, data_size);</div><div class='ctx'> 	if (ret == -EEXIST) {</div><div class='ctx'> 		struct btrfs_dir_item *di;</div><div class='del'>-		di = btrfs_match_dir_item_name(fs_info, path, name, name_len);</div><div class='add'>+		di = btrfs_match_dir_item_name(path, name, name_len);</div><div class='ctx'> 		if (di)</div><div class='ctx'> 			return ERR_PTR(-EEXIST);</div><div class='del'>-		btrfs_extend_item(path, data_size);</div><div class='add'>+		btrfs_extend_item(trans, path, data_size);</div><div class='ctx'> 	} else if (ret &lt; 0)</div><div class='ctx'> 		return ERR_PTR(ret);</div><div class='ctx'> 	WARN_ON(ret &gt; 0);</div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='del'>-	item = btrfs_item_nr(path-&gt;slots[0]);</div><div class='ctx'> 	ptr = btrfs_item_ptr(leaf, path-&gt;slots[0], char);</div><div class='del'>-	BUG_ON(data_size &gt; btrfs_item_size(leaf, item));</div><div class='del'>-	ptr += btrfs_item_size(leaf, item) - data_size;</div><div class='add'>+	ASSERT(data_size &lt;= btrfs_item_size(leaf, path-&gt;slots[0]));</div><div class='add'>+	ptr += btrfs_item_size(leaf, path-&gt;slots[0]) - data_size;</div><div class='ctx'> 	return (struct btrfs_dir_item *)ptr;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -83,7 +84,7 @@ int btrfs_insert_xattr_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	btrfs_cpu_key_to_disk(&amp;disk_key, &amp;location);</div><div class='ctx'> 	btrfs_set_dir_item_key(leaf, dir_item, &amp;disk_key);</div><div class='del'>-	btrfs_set_dir_type(leaf, dir_item, BTRFS_FT_XATTR);</div><div class='add'>+	btrfs_set_dir_flags(leaf, dir_item, BTRFS_FT_XATTR);</div><div class='ctx'> 	btrfs_set_dir_name_len(leaf, dir_item, name_len);</div><div class='ctx'> 	btrfs_set_dir_transid(leaf, dir_item, trans-&gt;transid);</div><div class='ctx'> 	btrfs_set_dir_data_len(leaf, dir_item, data_len);</div><div class='hunk'>@@ -92,7 +93,6 @@ int btrfs_insert_xattr_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	write_extent_buffer(leaf, name, name_ptr, name_len);</div><div class='ctx'> 	write_extent_buffer(leaf, data, data_ptr, data_len);</div><div class='del'>-	btrfs_mark_buffer_dirty(path-&gt;nodes[0]);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -105,14 +105,14 @@ int btrfs_insert_xattr_item(struct btrfs_trans_handle *trans,</div><div class='ctx'>  * to use for the second index (if one is created).</div><div class='ctx'>  * Will return 0 or -ENOMEM</div><div class='ctx'>  */</div><div class='del'>-int btrfs_insert_dir_item(struct btrfs_trans_handle *trans, const char *name,</div><div class='del'>-			  int name_len, struct btrfs_inode *dir,</div><div class='del'>-			  struct btrfs_key *location, u8 type, u64 index)</div><div class='add'>+int btrfs_insert_dir_item(struct btrfs_trans_handle *trans,</div><div class='add'>+			  const struct fscrypt_str *name, struct btrfs_inode *dir,</div><div class='add'>+			  const struct btrfs_key *location, u8 type, u64 index)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int ret2 = 0;</div><div class='ctx'> 	struct btrfs_root *root = dir-&gt;root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_dir_item *dir_item;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	unsigned long name_ptr;</div><div class='hunk'>@@ -122,7 +122,7 @@ int btrfs_insert_dir_item(struct btrfs_trans_handle *trans, const char *name,</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = btrfs_ino(dir);</div><div class='ctx'> 	key.type = BTRFS_DIR_ITEM_KEY;</div><div class='del'>-	key.offset = btrfs_name_hash(name, name_len);</div><div class='add'>+	key.offset = btrfs_name_hash(name-&gt;name, name-&gt;len);</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='hunk'>@@ -130,9 +130,9 @@ int btrfs_insert_dir_item(struct btrfs_trans_handle *trans, const char *name,</div><div class='ctx'> </div><div class='ctx'> 	btrfs_cpu_key_to_disk(&amp;disk_key, location);</div><div class='ctx'> </div><div class='del'>-	data_size = sizeof(*dir_item) + name_len;</div><div class='add'>+	data_size = sizeof(*dir_item) + name-&gt;len;</div><div class='ctx'> 	dir_item = insert_with_overflow(trans, root, path, &amp;key, data_size,</div><div class='del'>-					name, name_len);</div><div class='add'>+					name-&gt;name, name-&gt;len);</div><div class='ctx'> 	if (IS_ERR(dir_item)) {</div><div class='ctx'> 		ret = PTR_ERR(dir_item);</div><div class='ctx'> 		if (ret == -EEXIST)</div><div class='hunk'>@@ -140,16 +140,18 @@ int btrfs_insert_dir_item(struct btrfs_trans_handle *trans, const char *name,</div><div class='ctx'> 		goto out_free;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (IS_ENCRYPTED(&amp;dir-&gt;vfs_inode))</div><div class='add'>+		type |= BTRFS_FT_ENCRYPTED;</div><div class='add'>+</div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	btrfs_set_dir_item_key(leaf, dir_item, &amp;disk_key);</div><div class='del'>-	btrfs_set_dir_type(leaf, dir_item, type);</div><div class='add'>+	btrfs_set_dir_flags(leaf, dir_item, type);</div><div class='ctx'> 	btrfs_set_dir_data_len(leaf, dir_item, 0);</div><div class='del'>-	btrfs_set_dir_name_len(leaf, dir_item, name_len);</div><div class='add'>+	btrfs_set_dir_name_len(leaf, dir_item, name-&gt;len);</div><div class='ctx'> 	btrfs_set_dir_transid(leaf, dir_item, trans-&gt;transid);</div><div class='ctx'> 	name_ptr = (unsigned long)(dir_item + 1);</div><div class='ctx'> </div><div class='del'>-	write_extent_buffer(leaf, name, name_ptr, name_len);</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='add'>+	write_extent_buffer(leaf, name-&gt;name, name_ptr, name-&gt;len);</div><div class='ctx'> </div><div class='ctx'> second_insert:</div><div class='ctx'> 	/* FIXME, use some real flag for selecting the extra index */</div><div class='hunk'>@@ -159,10 +161,9 @@ second_insert:</div><div class='ctx'> 	}</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='del'>-	ret2 = btrfs_insert_delayed_dir_index(trans, name, name_len, dir,</div><div class='add'>+	ret2 = btrfs_insert_delayed_dir_index(trans, name-&gt;name, name-&gt;len, dir,</div><div class='ctx'> 					      &amp;disk_key, type, index);</div><div class='ctx'> out_free:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	if (ret2)</div><div class='hunk'>@@ -186,7 +187,7 @@ static struct btrfs_dir_item *btrfs_lookup_match_dir(</div><div class='ctx'> 	if (ret &gt; 0)</div><div class='ctx'> 		return ERR_PTR(-ENOENT);</div><div class='ctx'> </div><div class='del'>-	return btrfs_match_dir_item_name(root-&gt;fs_info, path, name, name_len);</div><div class='add'>+	return btrfs_match_dir_item_name(path, name, name_len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -208,7 +209,7 @@ static struct btrfs_dir_item *btrfs_lookup_match_dir(</div><div class='ctx'> struct btrfs_dir_item *btrfs_lookup_dir_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 					     struct btrfs_root *root,</div><div class='ctx'> 					     struct btrfs_path *path, u64 dir,</div><div class='del'>-					     const char *name, int name_len,</div><div class='add'>+					     const struct fscrypt_str *name,</div><div class='ctx'> 					     int mod)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_key key;</div><div class='hunk'>@@ -216,17 +217,18 @@ struct btrfs_dir_item *btrfs_lookup_dir_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = dir;</div><div class='ctx'> 	key.type = BTRFS_DIR_ITEM_KEY;</div><div class='del'>-	key.offset = btrfs_name_hash(name, name_len);</div><div class='add'>+	key.offset = btrfs_name_hash(name-&gt;name, name-&gt;len);</div><div class='ctx'> </div><div class='del'>-	di = btrfs_lookup_match_dir(trans, root, path, &amp;key, name, name_len, mod);</div><div class='add'>+	di = btrfs_lookup_match_dir(trans, root, path, &amp;key, name-&gt;name,</div><div class='add'>+				    name-&gt;len, mod);</div><div class='ctx'> 	if (IS_ERR(di) &amp;&amp; PTR_ERR(di) == -ENOENT)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='ctx'> 	return di;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_check_dir_item_collision(struct btrfs_root *root, u64 dir,</div><div class='del'>-				   const char *name, int name_len)</div><div class='add'>+int btrfs_check_dir_item_collision(struct btrfs_root *root, u64 dir_ino,</div><div class='add'>+				   const struct fscrypt_str *name)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='hunk'>@@ -234,53 +236,45 @@ int btrfs_check_dir_item_collision(struct btrfs_root *root, u64 dir,</div><div class='ctx'> 	int data_size;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	int slot;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	key.objectid = dir;</div><div class='add'>+	key.objectid = dir_ino;</div><div class='ctx'> 	key.type = BTRFS_DIR_ITEM_KEY;</div><div class='del'>-	key.offset = btrfs_name_hash(name, name_len);</div><div class='add'>+	key.offset = btrfs_name_hash(name-&gt;name, name-&gt;len);</div><div class='ctx'> </div><div class='del'>-	di = btrfs_lookup_match_dir(NULL, root, path, &amp;key, name, name_len, 0);</div><div class='add'>+	di = btrfs_lookup_match_dir(NULL, root, path, &amp;key, name-&gt;name,</div><div class='add'>+				    name-&gt;len, 0);</div><div class='ctx'> 	if (IS_ERR(di)) {</div><div class='ctx'> 		ret = PTR_ERR(di);</div><div class='ctx'> 		/* Nothing found, we're safe */</div><div class='del'>-		if (ret == -ENOENT) {</div><div class='del'>-			ret = 0;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+		if (ret == -ENOENT)</div><div class='add'>+			return 0;</div><div class='ctx'> </div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* we found an item, look for our name in the item */</div><div class='ctx'> 	if (di) {</div><div class='ctx'> 		/* our exact name was found */</div><div class='del'>-		ret = -EEXIST;</div><div class='del'>-		goto out;</div><div class='add'>+		return -EEXIST;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * see if there is room in the item to insert this</div><div class='del'>-	 * name</div><div class='del'>-	 */</div><div class='del'>-	data_size = sizeof(*di) + name_len;</div><div class='add'>+	/* See if there is room in the item to insert this name. */</div><div class='add'>+	data_size = sizeof(*di) + name-&gt;len;</div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	slot = path-&gt;slots[0];</div><div class='del'>-	if (data_size + btrfs_item_size_nr(leaf, slot) +</div><div class='add'>+	if (data_size + btrfs_item_size(leaf, slot) +</div><div class='ctx'> 	    sizeof(struct btrfs_item) &gt; BTRFS_LEAF_DATA_SIZE(root-&gt;fs_info)) {</div><div class='del'>-		ret = -EOVERFLOW;</div><div class='del'>-	} else {</div><div class='del'>-		/* plenty of insertion room */</div><div class='del'>-		ret = 0;</div><div class='add'>+		return -EOVERFLOW;</div><div class='ctx'> 	}</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+</div><div class='add'>+	/* Plenty of insertion room. */</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -305,8 +299,7 @@ struct btrfs_dir_item *</div><div class='ctx'> btrfs_lookup_dir_index_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			    struct btrfs_root *root,</div><div class='ctx'> 			    struct btrfs_path *path, u64 dir,</div><div class='del'>-			    u64 index, const char *name, int name_len,</div><div class='del'>-			    int mod)</div><div class='add'>+			    u64 index, const struct fscrypt_str *name, int mod)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_dir_item *di;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='hunk'>@@ -315,7 +308,8 @@ btrfs_lookup_dir_index_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	key.type = BTRFS_DIR_INDEX_KEY;</div><div class='ctx'> 	key.offset = index;</div><div class='ctx'> </div><div class='del'>-	di = btrfs_lookup_match_dir(trans, root, path, &amp;key, name, name_len, mod);</div><div class='add'>+	di = btrfs_lookup_match_dir(trans, root, path, &amp;key, name-&gt;name,</div><div class='add'>+				    name-&gt;len, mod);</div><div class='ctx'> 	if (di == ERR_PTR(-ENOENT))</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='hunk'>@@ -323,51 +317,30 @@ btrfs_lookup_dir_index_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct btrfs_dir_item *</div><div class='del'>-btrfs_search_dir_index_item(struct btrfs_root *root,</div><div class='del'>-			    struct btrfs_path *path, u64 dirid,</div><div class='del'>-			    const char *name, int name_len)</div><div class='add'>+btrfs_search_dir_index_item(struct btrfs_root *root, struct btrfs_path *path,</div><div class='add'>+			    u64 dirid, const struct fscrypt_str *name)</div><div class='ctx'> {</div><div class='del'>-	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_dir_item *di;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='del'>-	u32 nritems;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = dirid;</div><div class='ctx'> 	key.type = BTRFS_DIR_INDEX_KEY;</div><div class='ctx'> 	key.offset = 0;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		return ERR_PTR(ret);</div><div class='del'>-</div><div class='del'>-	leaf = path-&gt;nodes[0];</div><div class='del'>-	nritems = btrfs_header_nritems(leaf);</div><div class='del'>-</div><div class='del'>-	while (1) {</div><div class='del'>-		if (path-&gt;slots[0] &gt;= nritems) {</div><div class='del'>-			ret = btrfs_next_leaf(root, path);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				return ERR_PTR(ret);</div><div class='del'>-			if (ret &gt; 0)</div><div class='del'>-				break;</div><div class='del'>-			leaf = path-&gt;nodes[0];</div><div class='del'>-			nritems = btrfs_header_nritems(leaf);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		btrfs_item_key_to_cpu(leaf, &amp;key, path-&gt;slots[0]);</div><div class='add'>+	btrfs_for_each_slot(root, &amp;key, &amp;key, path, ret) {</div><div class='ctx'> 		if (key.objectid != dirid || key.type != BTRFS_DIR_INDEX_KEY)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		di = btrfs_match_dir_item_name(root-&gt;fs_info, path,</div><div class='del'>-					       name, name_len);</div><div class='add'>+		di = btrfs_match_dir_item_name(path, name-&gt;name, name-&gt;len);</div><div class='ctx'> 		if (di)</div><div class='ctx'> 			return di;</div><div class='del'>-</div><div class='del'>-		path-&gt;slots[0]++;</div><div class='ctx'> 	}</div><div class='del'>-	return NULL;</div><div class='add'>+	/* Adjust return code if the key was not found in the next leaf. */</div><div class='add'>+	if (ret &gt;= 0)</div><div class='add'>+		ret = -ENOENT;</div><div class='add'>+</div><div class='add'>+	return ERR_PTR(ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct btrfs_dir_item *btrfs_lookup_xattr(struct btrfs_trans_handle *trans,</div><div class='hunk'>@@ -395,8 +368,7 @@ struct btrfs_dir_item *btrfs_lookup_xattr(struct btrfs_trans_handle *trans,</div><div class='ctx'>  * this walks through all the entries in a dir item and finds one</div><div class='ctx'>  * for a specific name.</div><div class='ctx'>  */</div><div class='del'>-struct btrfs_dir_item *btrfs_match_dir_item_name(struct btrfs_fs_info *fs_info,</div><div class='del'>-						 struct btrfs_path *path,</div><div class='add'>+struct btrfs_dir_item *btrfs_match_dir_item_name(const struct btrfs_path *path,</div><div class='ctx'> 						 const char *name, int name_len)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_dir_item *dir_item;</div><div class='hunk'>@@ -409,7 +381,7 @@ struct btrfs_dir_item *btrfs_match_dir_item_name(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	dir_item = btrfs_item_ptr(leaf, path-&gt;slots[0], struct btrfs_dir_item);</div><div class='ctx'> </div><div class='del'>-	total_len = btrfs_item_size_nr(leaf, path-&gt;slots[0]);</div><div class='add'>+	total_len = btrfs_item_size(leaf, path-&gt;slots[0]);</div><div class='ctx'> 	while (cur &lt; total_len) {</div><div class='ctx'> 		this_len = sizeof(*dir_item) +</div><div class='ctx'> 			btrfs_dir_name_len(leaf, dir_item) +</div><div class='hunk'>@@ -434,7 +406,7 @@ struct btrfs_dir_item *btrfs_match_dir_item_name(struct btrfs_fs_info *fs_info,</div><div class='ctx'> int btrfs_delete_one_dir_name(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			      struct btrfs_root *root,</div><div class='ctx'> 			      struct btrfs_path *path,</div><div class='del'>-			      struct btrfs_dir_item *di)</div><div class='add'>+			      const struct btrfs_dir_item *di)</div><div class='ctx'> {</div><div class='ctx'> </div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='hunk'>@@ -445,7 +417,7 @@ int btrfs_delete_one_dir_name(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	sub_item_len = sizeof(*di) + btrfs_dir_name_len(leaf, di) +</div><div class='ctx'> 		btrfs_dir_data_len(leaf, di);</div><div class='del'>-	item_len = btrfs_item_size_nr(leaf, path-&gt;slots[0]);</div><div class='add'>+	item_len = btrfs_item_size(leaf, path-&gt;slots[0]);</div><div class='ctx'> 	if (sub_item_len == item_len) {</div><div class='ctx'> 		ret = btrfs_del_item(trans, root, path);</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -456,7 +428,7 @@ int btrfs_delete_one_dir_name(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		start = btrfs_item_ptr_offset(leaf, path-&gt;slots[0]);</div><div class='ctx'> 		memmove_extent_buffer(leaf, ptr, ptr + sub_item_len,</div><div class='ctx'> 			item_len - (ptr + sub_item_len - start));</div><div class='del'>-		btrfs_truncate_item(path, item_len - sub_item_len, 1);</div><div class='add'>+		btrfs_truncate_item(trans, path, item_len - sub_item_len, 1);</div><div class='ctx'> 	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/btrfs/dir-item.h b/fs/btrfs/dir-item.h<br/>new file mode 100644<br/>index 000000000000..e52174a8baf9<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/dir-item.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/dir-item.h</a></div><div class='hunk'>@@ -0,0 +1,57 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+</div><div class='add'>+#ifndef BTRFS_DIR_ITEM_H</div><div class='add'>+#define BTRFS_DIR_ITEM_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+#include &lt;linux/crc32c.h&gt;</div><div class='add'>+</div><div class='add'>+struct fscrypt_str;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+struct btrfs_key;</div><div class='add'>+struct btrfs_path;</div><div class='add'>+struct btrfs_inode;</div><div class='add'>+struct btrfs_root;</div><div class='add'>+struct btrfs_trans_handle;</div><div class='add'>+</div><div class='add'>+int btrfs_check_dir_item_collision(struct btrfs_root *root, u64 dir_ino,</div><div class='add'>+			  const struct fscrypt_str *name);</div><div class='add'>+int btrfs_insert_dir_item(struct btrfs_trans_handle *trans,</div><div class='add'>+			  const struct fscrypt_str *name, struct btrfs_inode *dir,</div><div class='add'>+			  const struct btrfs_key *location, u8 type, u64 index);</div><div class='add'>+struct btrfs_dir_item *btrfs_lookup_dir_item(struct btrfs_trans_handle *trans,</div><div class='add'>+					     struct btrfs_root *root,</div><div class='add'>+					     struct btrfs_path *path, u64 dir,</div><div class='add'>+					     const struct fscrypt_str *name, int mod);</div><div class='add'>+struct btrfs_dir_item *btrfs_lookup_dir_index_item(</div><div class='add'>+			struct btrfs_trans_handle *trans,</div><div class='add'>+			struct btrfs_root *root,</div><div class='add'>+			struct btrfs_path *path, u64 dir,</div><div class='add'>+			u64 index, const struct fscrypt_str *name, int mod);</div><div class='add'>+struct btrfs_dir_item *btrfs_search_dir_index_item(struct btrfs_root *root,</div><div class='add'>+			    struct btrfs_path *path, u64 dirid,</div><div class='add'>+			    const struct fscrypt_str *name);</div><div class='add'>+int btrfs_delete_one_dir_name(struct btrfs_trans_handle *trans,</div><div class='add'>+			      struct btrfs_root *root,</div><div class='add'>+			      struct btrfs_path *path,</div><div class='add'>+			      const struct btrfs_dir_item *di);</div><div class='add'>+int btrfs_insert_xattr_item(struct btrfs_trans_handle *trans,</div><div class='add'>+			    struct btrfs_root *root,</div><div class='add'>+			    struct btrfs_path *path, u64 objectid,</div><div class='add'>+			    const char *name, u16 name_len,</div><div class='add'>+			    const void *data, u16 data_len);</div><div class='add'>+struct btrfs_dir_item *btrfs_lookup_xattr(struct btrfs_trans_handle *trans,</div><div class='add'>+					  struct btrfs_root *root,</div><div class='add'>+					  struct btrfs_path *path, u64 dir,</div><div class='add'>+					  const char *name, u16 name_len,</div><div class='add'>+					  int mod);</div><div class='add'>+struct btrfs_dir_item *btrfs_match_dir_item_name(const struct btrfs_path *path,</div><div class='add'>+						 const char *name,</div><div class='add'>+						 int name_len);</div><div class='add'>+</div><div class='add'>+static inline u64 btrfs_name_hash(const char *name, int len)</div><div class='add'>+{</div><div class='add'>+       return crc32c((u32)~1, name, len);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#endif</div><div class='head'>diff --git a/fs/btrfs/direct-io.c b/fs/btrfs/direct-io.c<br/>new file mode 100644<br/>index 000000000000..07e19e88ba4b<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/direct-io.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/direct-io.c</a></div><div class='hunk'>@@ -0,0 +1,1106 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+</div><div class='add'>+#include &lt;linux/fsverity.h&gt;</div><div class='add'>+#include &lt;linux/iomap.h&gt;</div><div class='add'>+#include "ctree.h"</div><div class='add'>+#include "delalloc-space.h"</div><div class='add'>+#include "direct-io.h"</div><div class='add'>+#include "extent-tree.h"</div><div class='add'>+#include "file.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "transaction.h"</div><div class='add'>+#include "volumes.h"</div><div class='add'>+#include "bio.h"</div><div class='add'>+#include "ordered-data.h"</div><div class='add'>+</div><div class='add'>+struct btrfs_dio_data {</div><div class='add'>+	ssize_t submitted;</div><div class='add'>+	struct extent_changeset *data_reserved;</div><div class='add'>+	struct btrfs_ordered_extent *ordered;</div><div class='add'>+	bool data_space_reserved;</div><div class='add'>+	bool nocow_done;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct btrfs_dio_private {</div><div class='add'>+	/* Range of I/O */</div><div class='add'>+	u64 file_offset;</div><div class='add'>+	u32 bytes;</div><div class='add'>+</div><div class='add'>+	/* This must be last */</div><div class='add'>+	struct btrfs_bio bbio;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static struct bio_set btrfs_dio_bioset;</div><div class='add'>+</div><div class='add'>+static int lock_extent_direct(struct inode *inode, u64 lockstart, u64 lockend,</div><div class='add'>+			      struct extent_state **cached_state,</div><div class='add'>+			      unsigned int iomap_flags)</div><div class='add'>+{</div><div class='add'>+	const bool writing = (iomap_flags &amp; IOMAP_WRITE);</div><div class='add'>+	const bool nowait = (iomap_flags &amp; IOMAP_NOWAIT);</div><div class='add'>+	struct extent_io_tree *io_tree = &amp;BTRFS_I(inode)-&gt;io_tree;</div><div class='add'>+	struct btrfs_ordered_extent *ordered;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	/* Direct lock must be taken before the extent lock. */</div><div class='add'>+	if (nowait) {</div><div class='add'>+		if (!btrfs_try_lock_dio_extent(io_tree, lockstart, lockend, cached_state))</div><div class='add'>+			return -EAGAIN;</div><div class='add'>+	} else {</div><div class='add'>+		btrfs_lock_dio_extent(io_tree, lockstart, lockend, cached_state);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	while (1) {</div><div class='add'>+		if (nowait) {</div><div class='add'>+			if (!btrfs_try_lock_extent(io_tree, lockstart, lockend,</div><div class='add'>+						   cached_state)) {</div><div class='add'>+				ret = -EAGAIN;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+		} else {</div><div class='add'>+			btrfs_lock_extent(io_tree, lockstart, lockend, cached_state);</div><div class='add'>+		}</div><div class='add'>+		/*</div><div class='add'>+		 * We're concerned with the entire range that we're going to be</div><div class='add'>+		 * doing DIO to, so we need to make sure there's no ordered</div><div class='add'>+		 * extents in this range.</div><div class='add'>+		 */</div><div class='add'>+		ordered = btrfs_lookup_ordered_range(BTRFS_I(inode), lockstart,</div><div class='add'>+						     lockend - lockstart + 1);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * We need to make sure there are no buffered pages in this</div><div class='add'>+		 * range either, we could have raced between the invalidate in</div><div class='add'>+		 * generic_file_direct_write and locking the extent.  The</div><div class='add'>+		 * invalidate needs to happen so that reads after a write do not</div><div class='add'>+		 * get stale data.</div><div class='add'>+		 */</div><div class='add'>+		if (!ordered &amp;&amp;</div><div class='add'>+		    (!writing || !filemap_range_has_page(inode-&gt;i_mapping,</div><div class='add'>+							 lockstart, lockend)))</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		btrfs_unlock_extent(io_tree, lockstart, lockend, cached_state);</div><div class='add'>+</div><div class='add'>+		if (ordered) {</div><div class='add'>+			if (nowait) {</div><div class='add'>+				btrfs_put_ordered_extent(ordered);</div><div class='add'>+				ret = -EAGAIN;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+			/*</div><div class='add'>+			 * If we are doing a DIO read and the ordered extent we</div><div class='add'>+			 * found is for a buffered write, we can not wait for it</div><div class='add'>+			 * to complete and retry, because if we do so we can</div><div class='add'>+			 * deadlock with concurrent buffered writes on page</div><div class='add'>+			 * locks. This happens only if our DIO read covers more</div><div class='add'>+			 * than one extent map, if at this point has already</div><div class='add'>+			 * created an ordered extent for a previous extent map</div><div class='add'>+			 * and locked its range in the inode's io tree, and a</div><div class='add'>+			 * concurrent write against that previous extent map's</div><div class='add'>+			 * range and this range started (we unlock the ranges</div><div class='add'>+			 * in the io tree only when the bios complete and</div><div class='add'>+			 * buffered writes always lock pages before attempting</div><div class='add'>+			 * to lock range in the io tree).</div><div class='add'>+			 */</div><div class='add'>+			if (writing ||</div><div class='add'>+			    test_bit(BTRFS_ORDERED_DIRECT, &amp;ordered-&gt;flags))</div><div class='add'>+				btrfs_start_ordered_extent(ordered);</div><div class='add'>+			else</div><div class='add'>+				ret = nowait ? -EAGAIN : -ENOTBLK;</div><div class='add'>+			btrfs_put_ordered_extent(ordered);</div><div class='add'>+		} else {</div><div class='add'>+			/*</div><div class='add'>+			 * We could trigger writeback for this range (and wait</div><div class='add'>+			 * for it to complete) and then invalidate the pages for</div><div class='add'>+			 * this range (through invalidate_inode_pages2_range()),</div><div class='add'>+			 * but that can lead us to a deadlock with a concurrent</div><div class='add'>+			 * call to readahead (a buffered read or a defrag call</div><div class='add'>+			 * triggered a readahead) on a page lock due to an</div><div class='add'>+			 * ordered dio extent we created before but did not have</div><div class='add'>+			 * yet a corresponding bio submitted (whence it can not</div><div class='add'>+			 * complete), which makes readahead wait for that</div><div class='add'>+			 * ordered extent to complete while holding a lock on</div><div class='add'>+			 * that page.</div><div class='add'>+			 */</div><div class='add'>+			ret = nowait ? -EAGAIN : -ENOTBLK;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (ret)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		cond_resched();</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (ret)</div><div class='add'>+		btrfs_unlock_dio_extent(io_tree, lockstart, lockend, cached_state);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct extent_map *btrfs_create_dio_extent(struct btrfs_inode *inode,</div><div class='add'>+						  struct btrfs_dio_data *dio_data,</div><div class='add'>+						  const u64 start,</div><div class='add'>+						  const struct btrfs_file_extent *file_extent,</div><div class='add'>+						  const int type)</div><div class='add'>+{</div><div class='add'>+	struct extent_map *em = NULL;</div><div class='add'>+	struct btrfs_ordered_extent *ordered;</div><div class='add'>+</div><div class='add'>+	if (type != BTRFS_ORDERED_NOCOW) {</div><div class='add'>+		em = btrfs_create_io_em(inode, start, file_extent, type);</div><div class='add'>+		if (IS_ERR(em))</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ordered = btrfs_alloc_ordered_extent(inode, start, file_extent,</div><div class='add'>+					     (1U &lt;&lt; type) |</div><div class='add'>+					     (1U &lt;&lt; BTRFS_ORDERED_DIRECT));</div><div class='add'>+	if (IS_ERR(ordered)) {</div><div class='add'>+		if (em) {</div><div class='add'>+			btrfs_free_extent_map(em);</div><div class='add'>+			btrfs_drop_extent_map_range(inode, start,</div><div class='add'>+					start + file_extent-&gt;num_bytes - 1, false);</div><div class='add'>+		}</div><div class='add'>+		em = ERR_CAST(ordered);</div><div class='add'>+	} else {</div><div class='add'>+		ASSERT(!dio_data-&gt;ordered);</div><div class='add'>+		dio_data-&gt;ordered = ordered;</div><div class='add'>+	}</div><div class='add'>+ out:</div><div class='add'>+</div><div class='add'>+	return em;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct extent_map *btrfs_new_extent_direct(struct btrfs_inode *inode,</div><div class='add'>+						  struct btrfs_dio_data *dio_data,</div><div class='add'>+						  u64 start, u64 len)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+	struct btrfs_file_extent file_extent;</div><div class='add'>+	struct extent_map *em;</div><div class='add'>+	struct btrfs_key ins;</div><div class='add'>+	u64 alloc_hint;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	alloc_hint = btrfs_get_extent_allocation_hint(inode, start, len);</div><div class='add'>+again:</div><div class='add'>+	ret = btrfs_reserve_extent(root, len, len, fs_info-&gt;sectorsize,</div><div class='add'>+				   0, alloc_hint, &amp;ins, true, true);</div><div class='add'>+	if (ret == -EAGAIN) {</div><div class='add'>+		ASSERT(btrfs_is_zoned(fs_info));</div><div class='add'>+		wait_on_bit_io(&amp;inode-&gt;root-&gt;fs_info-&gt;flags, BTRFS_FS_NEED_ZONE_FINISH,</div><div class='add'>+			       TASK_UNINTERRUPTIBLE);</div><div class='add'>+		goto again;</div><div class='add'>+	}</div><div class='add'>+	if (ret)</div><div class='add'>+		return ERR_PTR(ret);</div><div class='add'>+</div><div class='add'>+	file_extent.disk_bytenr = ins.objectid;</div><div class='add'>+	file_extent.disk_num_bytes = ins.offset;</div><div class='add'>+	file_extent.num_bytes = ins.offset;</div><div class='add'>+	file_extent.ram_bytes = ins.offset;</div><div class='add'>+	file_extent.offset = 0;</div><div class='add'>+	file_extent.compression = BTRFS_COMPRESS_NONE;</div><div class='add'>+	em = btrfs_create_dio_extent(inode, dio_data, start, &amp;file_extent,</div><div class='add'>+				     BTRFS_ORDERED_REGULAR);</div><div class='add'>+	btrfs_dec_block_group_reservations(fs_info, ins.objectid);</div><div class='add'>+	if (IS_ERR(em))</div><div class='add'>+		btrfs_free_reserved_extent(fs_info, ins.objectid, ins.offset, true);</div><div class='add'>+</div><div class='add'>+	return em;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int btrfs_get_blocks_direct_write(struct extent_map **map,</div><div class='add'>+					 struct inode *inode,</div><div class='add'>+					 struct btrfs_dio_data *dio_data,</div><div class='add'>+					 u64 start, u64 *lenp,</div><div class='add'>+					 unsigned int iomap_flags)</div><div class='add'>+{</div><div class='add'>+	const bool nowait = (iomap_flags &amp; IOMAP_NOWAIT);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='add'>+	struct btrfs_file_extent file_extent;</div><div class='add'>+	struct extent_map *em = *map;</div><div class='add'>+	int type;</div><div class='add'>+	u64 block_start;</div><div class='add'>+	struct btrfs_block_group *bg;</div><div class='add'>+	bool can_nocow = false;</div><div class='add'>+	bool space_reserved = false;</div><div class='add'>+	u64 len = *lenp;</div><div class='add'>+	u64 prev_len;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We don't allocate a new extent in the following cases</div><div class='add'>+	 *</div><div class='add'>+	 * 1) The inode is marked as NODATACOW. In this case we'll just use the</div><div class='add'>+	 * existing extent.</div><div class='add'>+	 * 2) The extent is marked as PREALLOC. We're good to go here and can</div><div class='add'>+	 * just use the extent.</div><div class='add'>+	 *</div><div class='add'>+	 */</div><div class='add'>+	if ((em-&gt;flags &amp; EXTENT_FLAG_PREALLOC) ||</div><div class='add'>+	    ((BTRFS_I(inode)-&gt;flags &amp; BTRFS_INODE_NODATACOW) &amp;&amp;</div><div class='add'>+	     em-&gt;disk_bytenr != EXTENT_MAP_HOLE)) {</div><div class='add'>+		if (em-&gt;flags &amp; EXTENT_FLAG_PREALLOC)</div><div class='add'>+			type = BTRFS_ORDERED_PREALLOC;</div><div class='add'>+		else</div><div class='add'>+			type = BTRFS_ORDERED_NOCOW;</div><div class='add'>+		len = min(len, em-&gt;len - (start - em-&gt;start));</div><div class='add'>+		block_start = btrfs_extent_map_block_start(em) + (start - em-&gt;start);</div><div class='add'>+</div><div class='add'>+		if (can_nocow_extent(BTRFS_I(inode), start, &amp;len, &amp;file_extent,</div><div class='add'>+				     false) == 1) {</div><div class='add'>+			bg = btrfs_inc_nocow_writers(fs_info, block_start);</div><div class='add'>+			if (bg)</div><div class='add'>+				can_nocow = true;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	prev_len = len;</div><div class='add'>+	if (can_nocow) {</div><div class='add'>+		struct extent_map *em2;</div><div class='add'>+</div><div class='add'>+		/* We can NOCOW, so only need to reserve metadata space. */</div><div class='add'>+		ret = btrfs_delalloc_reserve_metadata(BTRFS_I(inode), len, len,</div><div class='add'>+						      nowait);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			/* Our caller expects us to free the input extent map. */</div><div class='add'>+			btrfs_free_extent_map(em);</div><div class='add'>+			*map = NULL;</div><div class='add'>+			btrfs_dec_nocow_writers(bg);</div><div class='add'>+			if (nowait &amp;&amp; (ret == -ENOSPC || ret == -EDQUOT))</div><div class='add'>+				ret = -EAGAIN;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		space_reserved = true;</div><div class='add'>+</div><div class='add'>+		em2 = btrfs_create_dio_extent(BTRFS_I(inode), dio_data, start,</div><div class='add'>+					      &amp;file_extent, type);</div><div class='add'>+		btrfs_dec_nocow_writers(bg);</div><div class='add'>+		if (type == BTRFS_ORDERED_PREALLOC) {</div><div class='add'>+			btrfs_free_extent_map(em);</div><div class='add'>+			*map = em2;</div><div class='add'>+			em = em2;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (IS_ERR(em2)) {</div><div class='add'>+			ret = PTR_ERR(em2);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		dio_data-&gt;nocow_done = true;</div><div class='add'>+	} else {</div><div class='add'>+		/* Our caller expects us to free the input extent map. */</div><div class='add'>+		btrfs_free_extent_map(em);</div><div class='add'>+		*map = NULL;</div><div class='add'>+</div><div class='add'>+		if (nowait) {</div><div class='add'>+			ret = -EAGAIN;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * If we could not allocate data space before locking the file</div><div class='add'>+		 * range and we can't do a NOCOW write, then we have to fail.</div><div class='add'>+		 */</div><div class='add'>+		if (!dio_data-&gt;data_space_reserved) {</div><div class='add'>+			ret = -ENOSPC;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * We have to COW and we have already reserved data space before,</div><div class='add'>+		 * so now we reserve only metadata.</div><div class='add'>+		 */</div><div class='add'>+		ret = btrfs_delalloc_reserve_metadata(BTRFS_I(inode), len, len,</div><div class='add'>+						      false);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out;</div><div class='add'>+		space_reserved = true;</div><div class='add'>+</div><div class='add'>+		em = btrfs_new_extent_direct(BTRFS_I(inode), dio_data, start, len);</div><div class='add'>+		if (IS_ERR(em)) {</div><div class='add'>+			ret = PTR_ERR(em);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		*map = em;</div><div class='add'>+		len = min(len, em-&gt;len - (start - em-&gt;start));</div><div class='add'>+		if (len &lt; prev_len)</div><div class='add'>+			btrfs_delalloc_release_metadata(BTRFS_I(inode),</div><div class='add'>+							prev_len - len, true);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We have created our ordered extent, so we can now release our reservation</div><div class='add'>+	 * for an outstanding extent.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_delalloc_release_extents(BTRFS_I(inode), prev_len);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Need to update the i_size under the extent lock so buffered</div><div class='add'>+	 * readers will get the updated i_size when we unlock.</div><div class='add'>+	 */</div><div class='add'>+	if (start + len &gt; i_size_read(inode))</div><div class='add'>+		i_size_write(inode, start + len);</div><div class='add'>+out:</div><div class='add'>+	if (ret &amp;&amp; space_reserved) {</div><div class='add'>+		btrfs_delalloc_release_extents(BTRFS_I(inode), len);</div><div class='add'>+		btrfs_delalloc_release_metadata(BTRFS_I(inode), len, true);</div><div class='add'>+	}</div><div class='add'>+	*lenp = len;</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int btrfs_dio_iomap_begin(struct inode *inode, loff_t start,</div><div class='add'>+		loff_t length, unsigned int flags, struct iomap *iomap,</div><div class='add'>+		struct iomap *srcmap)</div><div class='add'>+{</div><div class='add'>+	struct iomap_iter *iter = container_of(iomap, struct iomap_iter, iomap);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='add'>+	struct extent_map *em;</div><div class='add'>+	struct extent_state *cached_state = NULL;</div><div class='add'>+	struct btrfs_dio_data *dio_data = iter-&gt;private;</div><div class='add'>+	u64 lockstart, lockend;</div><div class='add'>+	const bool write = !!(flags &amp; IOMAP_WRITE);</div><div class='add'>+	int ret = 0;</div><div class='add'>+	u64 len = length;</div><div class='add'>+	const u64 data_alloc_len = length;</div><div class='add'>+	u32 unlock_bits = EXTENT_LOCKED;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We could potentially fault if we have a buffer &gt; PAGE_SIZE, and if</div><div class='add'>+	 * we're NOWAIT we may submit a bio for a partial range and return</div><div class='add'>+	 * EIOCBQUEUED, which would result in an errant short read.</div><div class='add'>+	 *</div><div class='add'>+	 * The best way to handle this would be to allow for partial completions</div><div class='add'>+	 * of iocb's, so we could submit the partial bio, return and fault in</div><div class='add'>+	 * the rest of the pages, and then submit the io for the rest of the</div><div class='add'>+	 * range.  However we don't have that currently, so simply return</div><div class='add'>+	 * -EAGAIN at this point so that the normal path is used.</div><div class='add'>+	 */</div><div class='add'>+	if (!write &amp;&amp; (flags &amp; IOMAP_NOWAIT) &amp;&amp; length &gt; PAGE_SIZE)</div><div class='add'>+		return -EAGAIN;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Cap the size of reads to that usually seen in buffered I/O as we need</div><div class='add'>+	 * to allocate a contiguous array for the checksums.</div><div class='add'>+	 */</div><div class='add'>+	if (!write)</div><div class='add'>+		len = min_t(u64, len, fs_info-&gt;sectorsize * BIO_MAX_VECS);</div><div class='add'>+</div><div class='add'>+	lockstart = start;</div><div class='add'>+	lockend = start + len - 1;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * iomap_dio_rw() only does filemap_write_and_wait_range(), which isn't</div><div class='add'>+	 * enough if we've written compressed pages to this area, so we need to</div><div class='add'>+	 * flush the dirty pages again to make absolutely sure that any</div><div class='add'>+	 * outstanding dirty pages are on disk - the first flush only starts</div><div class='add'>+	 * compression on the data, while keeping the pages locked, so by the</div><div class='add'>+	 * time the second flush returns we know bios for the compressed pages</div><div class='add'>+	 * were submitted and finished, and the pages no longer under writeback.</div><div class='add'>+	 *</div><div class='add'>+	 * If we have a NOWAIT request and we have any pages in the range that</div><div class='add'>+	 * are locked, likely due to compression still in progress, we don't want</div><div class='add'>+	 * to block on page locks. We also don't want to block on pages marked as</div><div class='add'>+	 * dirty or under writeback (same as for the non-compression case).</div><div class='add'>+	 * iomap_dio_rw() did the same check, but after that and before we got</div><div class='add'>+	 * here, mmap'ed writes may have happened or buffered reads started</div><div class='add'>+	 * (readpage() and readahead(), which lock pages), as we haven't locked</div><div class='add'>+	 * the file range yet.</div><div class='add'>+	 */</div><div class='add'>+	if (test_bit(BTRFS_INODE_HAS_ASYNC_EXTENT,</div><div class='add'>+		     &amp;BTRFS_I(inode)-&gt;runtime_flags)) {</div><div class='add'>+		if (flags &amp; IOMAP_NOWAIT) {</div><div class='add'>+			if (filemap_range_needs_writeback(inode-&gt;i_mapping,</div><div class='add'>+							  lockstart, lockend))</div><div class='add'>+				return -EAGAIN;</div><div class='add'>+		} else {</div><div class='add'>+			ret = filemap_fdatawrite_range(inode-&gt;i_mapping, start,</div><div class='add'>+						       start + length - 1);</div><div class='add'>+			if (ret)</div><div class='add'>+				return ret;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	memset(dio_data, 0, sizeof(*dio_data));</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We always try to allocate data space and must do it before locking</div><div class='add'>+	 * the file range, to avoid deadlocks with concurrent writes to the same</div><div class='add'>+	 * range if the range has several extents and the writes don't expand the</div><div class='add'>+	 * current i_size (the inode lock is taken in shared mode). If we fail to</div><div class='add'>+	 * allocate data space here we continue and later, after locking the</div><div class='add'>+	 * file range, we fail with ENOSPC only if we figure out we can not do a</div><div class='add'>+	 * NOCOW write.</div><div class='add'>+	 */</div><div class='add'>+	if (write &amp;&amp; !(flags &amp; IOMAP_NOWAIT)) {</div><div class='add'>+		ret = btrfs_check_data_free_space(BTRFS_I(inode),</div><div class='add'>+						  &amp;dio_data-&gt;data_reserved,</div><div class='add'>+						  start, data_alloc_len, false);</div><div class='add'>+		if (!ret)</div><div class='add'>+			dio_data-&gt;data_space_reserved = true;</div><div class='add'>+		else if (!(BTRFS_I(inode)-&gt;flags &amp;</div><div class='add'>+			   (BTRFS_INODE_NODATACOW | BTRFS_INODE_PREALLOC)))</div><div class='add'>+			goto err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If this errors out it's because we couldn't invalidate pagecache for</div><div class='add'>+	 * this range and we need to fallback to buffered IO, or we are doing a</div><div class='add'>+	 * NOWAIT read/write and we need to block.</div><div class='add'>+	 */</div><div class='add'>+	ret = lock_extent_direct(inode, lockstart, lockend, &amp;cached_state, flags);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto err;</div><div class='add'>+</div><div class='add'>+	em = btrfs_get_extent(BTRFS_I(inode), NULL, start, len);</div><div class='add'>+	if (IS_ERR(em)) {</div><div class='add'>+		ret = PTR_ERR(em);</div><div class='add'>+		goto unlock_err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Ok for INLINE and COMPRESSED extents we need to fallback on buffered</div><div class='add'>+	 * io.  INLINE is special, and we could probably kludge it in here, but</div><div class='add'>+	 * it's still buffered so for safety lets just fall back to the generic</div><div class='add'>+	 * buffered path.</div><div class='add'>+	 *</div><div class='add'>+	 * For COMPRESSED we _have_ to read the entire extent in so we can</div><div class='add'>+	 * decompress it, so there will be buffering required no matter what we</div><div class='add'>+	 * do, so go ahead and fallback to buffered.</div><div class='add'>+	 *</div><div class='add'>+	 * We return -ENOTBLK because that's what makes DIO go ahead and go back</div><div class='add'>+	 * to buffered IO.  Don't blame me, this is the price we pay for using</div><div class='add'>+	 * the generic code.</div><div class='add'>+	 */</div><div class='add'>+	if (btrfs_extent_map_is_compressed(em) || em-&gt;disk_bytenr == EXTENT_MAP_INLINE) {</div><div class='add'>+		btrfs_free_extent_map(em);</div><div class='add'>+		/*</div><div class='add'>+		 * If we are in a NOWAIT context, return -EAGAIN in order to</div><div class='add'>+		 * fallback to buffered IO. This is not only because we can</div><div class='add'>+		 * block with buffered IO (no support for NOWAIT semantics at</div><div class='add'>+		 * the moment) but also to avoid returning short reads to user</div><div class='add'>+		 * space - this happens if we were able to read some data from</div><div class='add'>+		 * previous non-compressed extents and then when we fallback to</div><div class='add'>+		 * buffered IO, at btrfs_file_read_iter() by calling</div><div class='add'>+		 * filemap_read(), we fail to fault in pages for the read buffer,</div><div class='add'>+		 * in which case filemap_read() returns a short read (the number</div><div class='add'>+		 * of bytes previously read is &gt; 0, so it does not return -EFAULT).</div><div class='add'>+		 */</div><div class='add'>+		ret = (flags &amp; IOMAP_NOWAIT) ? -EAGAIN : -ENOTBLK;</div><div class='add'>+		goto unlock_err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	len = min(len, em-&gt;len - (start - em-&gt;start));</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If we have a NOWAIT request and the range contains multiple extents</div><div class='add'>+	 * (or a mix of extents and holes), then we return -EAGAIN to make the</div><div class='add'>+	 * caller fallback to a context where it can do a blocking (without</div><div class='add'>+	 * NOWAIT) request. This way we avoid doing partial IO and returning</div><div class='add'>+	 * success to the caller, which is not optimal for writes and for reads</div><div class='add'>+	 * it can result in unexpected behaviour for an application.</div><div class='add'>+	 *</div><div class='add'>+	 * When doing a read, because we use IOMAP_DIO_PARTIAL when calling</div><div class='add'>+	 * iomap_dio_rw(), we can end up returning less data then what the caller</div><div class='add'>+	 * asked for, resulting in an unexpected, and incorrect, short read.</div><div class='add'>+	 * That is, the caller asked to read N bytes and we return less than that,</div><div class='add'>+	 * which is wrong unless we are crossing EOF. This happens if we get a</div><div class='add'>+	 * page fault error when trying to fault in pages for the buffer that is</div><div class='add'>+	 * associated to the struct iov_iter passed to iomap_dio_rw(), and we</div><div class='add'>+	 * have previously submitted bios for other extents in the range, in</div><div class='add'>+	 * which case iomap_dio_rw() may return us EIOCBQUEUED if not all of</div><div class='add'>+	 * those bios have completed by the time we get the page fault error,</div><div class='add'>+	 * which we return back to our caller - we should only return EIOCBQUEUED</div><div class='add'>+	 * after we have submitted bios for all the extents in the range.</div><div class='add'>+	 */</div><div class='add'>+	if ((flags &amp; IOMAP_NOWAIT) &amp;&amp; len &lt; length) {</div><div class='add'>+		btrfs_free_extent_map(em);</div><div class='add'>+		ret = -EAGAIN;</div><div class='add'>+		goto unlock_err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (write) {</div><div class='add'>+		ret = btrfs_get_blocks_direct_write(&amp;em, inode, dio_data,</div><div class='add'>+						    start, &amp;len, flags);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto unlock_err;</div><div class='add'>+		/* Recalc len in case the new em is smaller than requested */</div><div class='add'>+		len = min(len, em-&gt;len - (start - em-&gt;start));</div><div class='add'>+		if (dio_data-&gt;data_space_reserved) {</div><div class='add'>+			u64 release_offset;</div><div class='add'>+			u64 release_len = 0;</div><div class='add'>+</div><div class='add'>+			if (dio_data-&gt;nocow_done) {</div><div class='add'>+				release_offset = start;</div><div class='add'>+				release_len = data_alloc_len;</div><div class='add'>+			} else if (len &lt; data_alloc_len) {</div><div class='add'>+				release_offset = start + len;</div><div class='add'>+				release_len = data_alloc_len - len;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			if (release_len &gt; 0)</div><div class='add'>+				btrfs_free_reserved_data_space(BTRFS_I(inode),</div><div class='add'>+							       dio_data-&gt;data_reserved,</div><div class='add'>+							       release_offset,</div><div class='add'>+							       release_len);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Translate extent map information to iomap.</div><div class='add'>+	 * We trim the extents (and move the addr) even though iomap code does</div><div class='add'>+	 * that, since we have locked only the parts we are performing I/O in.</div><div class='add'>+	 */</div><div class='add'>+	if ((em-&gt;disk_bytenr == EXTENT_MAP_HOLE) ||</div><div class='add'>+	    ((em-&gt;flags &amp; EXTENT_FLAG_PREALLOC) &amp;&amp; !write)) {</div><div class='add'>+		iomap-&gt;addr = IOMAP_NULL_ADDR;</div><div class='add'>+		iomap-&gt;type = IOMAP_HOLE;</div><div class='add'>+	} else {</div><div class='add'>+		iomap-&gt;addr = btrfs_extent_map_block_start(em) + (start - em-&gt;start);</div><div class='add'>+		iomap-&gt;type = IOMAP_MAPPED;</div><div class='add'>+	}</div><div class='add'>+	iomap-&gt;offset = start;</div><div class='add'>+	iomap-&gt;bdev = fs_info-&gt;fs_devices-&gt;latest_dev-&gt;bdev;</div><div class='add'>+	iomap-&gt;length = len;</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Reads will hold the EXTENT_DIO_LOCKED bit until the io is completed,</div><div class='add'>+	 * writes only hold it for this part.  We hold the extent lock until</div><div class='add'>+	 * we're completely done with the extent map to make sure it remains</div><div class='add'>+	 * valid.</div><div class='add'>+	 */</div><div class='add'>+	if (write)</div><div class='add'>+		unlock_bits |= EXTENT_DIO_LOCKED;</div><div class='add'>+</div><div class='add'>+	btrfs_clear_extent_bit(&amp;BTRFS_I(inode)-&gt;io_tree, lockstart, lockend,</div><div class='add'>+			       unlock_bits, &amp;cached_state);</div><div class='add'>+</div><div class='add'>+	/* We didn't use everything, unlock the dio extent for the remainder. */</div><div class='add'>+	if (!write &amp;&amp; (start + len) &lt; lockend)</div><div class='add'>+		btrfs_unlock_dio_extent(&amp;BTRFS_I(inode)-&gt;io_tree, start + len,</div><div class='add'>+					lockend, NULL);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+unlock_err:</div><div class='add'>+	/*</div><div class='add'>+	 * Don't use EXTENT_LOCK_BITS here in case we extend it later and forget</div><div class='add'>+	 * to update this, be explicit that we expect EXTENT_LOCKED and</div><div class='add'>+	 * EXTENT_DIO_LOCKED to be set here, and so that's what we're clearing.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_clear_extent_bit(&amp;BTRFS_I(inode)-&gt;io_tree, lockstart, lockend,</div><div class='add'>+			       EXTENT_LOCKED | EXTENT_DIO_LOCKED, &amp;cached_state);</div><div class='add'>+err:</div><div class='add'>+	if (dio_data-&gt;data_space_reserved) {</div><div class='add'>+		btrfs_free_reserved_data_space(BTRFS_I(inode),</div><div class='add'>+					       dio_data-&gt;data_reserved,</div><div class='add'>+					       start, data_alloc_len);</div><div class='add'>+		extent_changeset_free(dio_data-&gt;data_reserved);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int btrfs_dio_iomap_end(struct inode *inode, loff_t pos, loff_t length,</div><div class='add'>+		ssize_t written, unsigned int flags, struct iomap *iomap)</div><div class='add'>+{</div><div class='add'>+	struct iomap_iter *iter = container_of(iomap, struct iomap_iter, iomap);</div><div class='add'>+	struct btrfs_dio_data *dio_data = iter-&gt;private;</div><div class='add'>+	size_t submitted = dio_data-&gt;submitted;</div><div class='add'>+	const bool write = !!(flags &amp; IOMAP_WRITE);</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	if (!write &amp;&amp; (iomap-&gt;type == IOMAP_HOLE)) {</div><div class='add'>+		/* If reading from a hole, unlock and return */</div><div class='add'>+		btrfs_unlock_dio_extent(&amp;BTRFS_I(inode)-&gt;io_tree, pos,</div><div class='add'>+					pos + length - 1, NULL);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (submitted &lt; length) {</div><div class='add'>+		pos += submitted;</div><div class='add'>+		length -= submitted;</div><div class='add'>+		if (write)</div><div class='add'>+			btrfs_finish_ordered_extent(dio_data-&gt;ordered, NULL,</div><div class='add'>+						    pos, length, false);</div><div class='add'>+		else</div><div class='add'>+			btrfs_unlock_dio_extent(&amp;BTRFS_I(inode)-&gt;io_tree, pos,</div><div class='add'>+						pos + length - 1, NULL);</div><div class='add'>+		ret = -ENOTBLK;</div><div class='add'>+	}</div><div class='add'>+	if (write) {</div><div class='add'>+		btrfs_put_ordered_extent(dio_data-&gt;ordered);</div><div class='add'>+		dio_data-&gt;ordered = NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (write)</div><div class='add'>+		extent_changeset_free(dio_data-&gt;data_reserved);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void btrfs_dio_end_io(struct btrfs_bio *bbio)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_dio_private *dip =</div><div class='add'>+		container_of(bbio, struct btrfs_dio_private, bbio);</div><div class='add'>+	struct btrfs_inode *inode = bbio-&gt;inode;</div><div class='add'>+	struct bio *bio = &amp;bbio-&gt;bio;</div><div class='add'>+</div><div class='add'>+	if (bio-&gt;bi_status) {</div><div class='add'>+		btrfs_warn(inode-&gt;root-&gt;fs_info,</div><div class='add'>+		"direct IO failed ino %llu op 0x%0x offset %#llx len %u err no %d",</div><div class='add'>+			   btrfs_ino(inode), bio-&gt;bi_opf,</div><div class='add'>+			   dip-&gt;file_offset, dip-&gt;bytes, bio-&gt;bi_status);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (btrfs_op(bio) == BTRFS_MAP_WRITE) {</div><div class='add'>+		btrfs_finish_ordered_extent(bbio-&gt;ordered, NULL,</div><div class='add'>+					    dip-&gt;file_offset, dip-&gt;bytes,</div><div class='add'>+					    !bio-&gt;bi_status);</div><div class='add'>+	} else {</div><div class='add'>+		btrfs_unlock_dio_extent(&amp;inode-&gt;io_tree, dip-&gt;file_offset,</div><div class='add'>+					dip-&gt;file_offset + dip-&gt;bytes - 1, NULL);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	bbio-&gt;bio.bi_private = bbio-&gt;private;</div><div class='add'>+	iomap_dio_bio_end_io(bio);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int btrfs_extract_ordered_extent(struct btrfs_bio *bbio,</div><div class='add'>+					struct btrfs_ordered_extent *ordered)</div><div class='add'>+{</div><div class='add'>+	u64 start = (u64)bbio-&gt;bio.bi_iter.bi_sector &lt;&lt; SECTOR_SHIFT;</div><div class='add'>+	u64 len = bbio-&gt;bio.bi_iter.bi_size;</div><div class='add'>+	struct btrfs_ordered_extent *new;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	/* Must always be called for the beginning of an ordered extent. */</div><div class='add'>+	if (WARN_ON_ONCE(start != ordered-&gt;disk_bytenr))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	/* No need to split if the ordered extent covers the entire bio. */</div><div class='add'>+	if (ordered-&gt;disk_num_bytes == len) {</div><div class='add'>+		refcount_inc(&amp;ordered-&gt;refs);</div><div class='add'>+		bbio-&gt;ordered = ordered;</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Don't split the extent_map for NOCOW extents, as we're writing into</div><div class='add'>+	 * a pre-existing one.</div><div class='add'>+	 */</div><div class='add'>+	if (!test_bit(BTRFS_ORDERED_NOCOW, &amp;ordered-&gt;flags)) {</div><div class='add'>+		ret = btrfs_split_extent_map(bbio-&gt;inode, bbio-&gt;file_offset,</div><div class='add'>+					     ordered-&gt;num_bytes, len,</div><div class='add'>+					     ordered-&gt;disk_bytenr);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	new = btrfs_split_ordered_extent(ordered, len);</div><div class='add'>+	if (IS_ERR(new))</div><div class='add'>+		return PTR_ERR(new);</div><div class='add'>+	bbio-&gt;ordered = new;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void btrfs_dio_submit_io(const struct iomap_iter *iter, struct bio *bio,</div><div class='add'>+				loff_t file_offset)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_bio *bbio = btrfs_bio(bio);</div><div class='add'>+	struct btrfs_dio_private *dip =</div><div class='add'>+		container_of(bbio, struct btrfs_dio_private, bbio);</div><div class='add'>+	struct btrfs_dio_data *dio_data = iter-&gt;private;</div><div class='add'>+</div><div class='add'>+	btrfs_bio_init(bbio, BTRFS_I(iter-&gt;inode), file_offset,</div><div class='add'>+		       btrfs_dio_end_io, bio-&gt;bi_private);</div><div class='add'>+</div><div class='add'>+	dip-&gt;file_offset = file_offset;</div><div class='add'>+	dip-&gt;bytes = bio-&gt;bi_iter.bi_size;</div><div class='add'>+</div><div class='add'>+	dio_data-&gt;submitted += bio-&gt;bi_iter.bi_size;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Check if we are doing a partial write.  If we are, we need to split</div><div class='add'>+	 * the ordered extent to match the submitted bio.  Hang on to the</div><div class='add'>+	 * remaining unfinishable ordered_extent in dio_data so that it can be</div><div class='add'>+	 * cancelled in iomap_end to avoid a deadlock wherein faulting the</div><div class='add'>+	 * remaining pages is blocked on the outstanding ordered extent.</div><div class='add'>+	 */</div><div class='add'>+	if (iter-&gt;flags &amp; IOMAP_WRITE) {</div><div class='add'>+		int ret;</div><div class='add'>+</div><div class='add'>+		ret = btrfs_extract_ordered_extent(bbio, dio_data-&gt;ordered);</div><div class='add'>+		if (ret) {</div><div class='add'>+			btrfs_finish_ordered_extent(dio_data-&gt;ordered, NULL,</div><div class='add'>+						    file_offset, dip-&gt;bytes,</div><div class='add'>+						    !ret);</div><div class='add'>+			bio-&gt;bi_status = errno_to_blk_status(ret);</div><div class='add'>+			iomap_dio_bio_end_io(bio);</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	btrfs_submit_bbio(bbio, 0);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct iomap_ops btrfs_dio_iomap_ops = {</div><div class='add'>+	.iomap_begin            = btrfs_dio_iomap_begin,</div><div class='add'>+	.iomap_end              = btrfs_dio_iomap_end,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct iomap_dio_ops btrfs_dio_ops = {</div><div class='add'>+	.submit_io		= btrfs_dio_submit_io,</div><div class='add'>+	.bio_set		= &amp;btrfs_dio_bioset,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static ssize_t btrfs_dio_read(struct kiocb *iocb, struct iov_iter *iter,</div><div class='add'>+			      size_t done_before)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_dio_data data = { 0 };</div><div class='add'>+</div><div class='add'>+	return iomap_dio_rw(iocb, iter, &amp;btrfs_dio_iomap_ops, &amp;btrfs_dio_ops,</div><div class='add'>+			    IOMAP_DIO_PARTIAL, &amp;data, done_before);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct iomap_dio *btrfs_dio_write(struct kiocb *iocb, struct iov_iter *iter,</div><div class='add'>+					 size_t done_before)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_dio_data data = { 0 };</div><div class='add'>+</div><div class='add'>+	return __iomap_dio_rw(iocb, iter, &amp;btrfs_dio_iomap_ops, &amp;btrfs_dio_ops,</div><div class='add'>+			    IOMAP_DIO_PARTIAL, &amp;data, done_before);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t check_direct_IO(struct btrfs_fs_info *fs_info,</div><div class='add'>+			       const struct iov_iter *iter, loff_t offset)</div><div class='add'>+{</div><div class='add'>+	const u32 blocksize_mask = fs_info-&gt;sectorsize - 1;</div><div class='add'>+</div><div class='add'>+	if (offset &amp; blocksize_mask)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	if (iov_iter_alignment(iter) &amp; blocksize_mask)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * For bs &gt; ps support, we heavily rely on large folios to make sure no</div><div class='add'>+	 * block will cross large folio boundaries.</div><div class='add'>+	 *</div><div class='add'>+	 * But memory provided by direct IO is only virtually contiguous, not</div><div class='add'>+	 * physically contiguous, and will break the btrfs' large folio requirement.</div><div class='add'>+	 *</div><div class='add'>+	 * So for bs &gt; ps support, all direct IOs should fallback to buffered ones.</div><div class='add'>+	 */</div><div class='add'>+	if (fs_info-&gt;sectorsize &gt; PAGE_SIZE)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+ssize_t btrfs_direct_write(struct kiocb *iocb, struct iov_iter *from)</div><div class='add'>+{</div><div class='add'>+	struct file *file = iocb-&gt;ki_filp;</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='add'>+	loff_t pos;</div><div class='add'>+	ssize_t written = 0;</div><div class='add'>+	ssize_t written_buffered;</div><div class='add'>+	size_t prev_left = 0;</div><div class='add'>+	loff_t endbyte;</div><div class='add'>+	ssize_t ret;</div><div class='add'>+	unsigned int ilock_flags = 0;</div><div class='add'>+	struct iomap_dio *dio;</div><div class='add'>+</div><div class='add'>+	if (iocb-&gt;ki_flags &amp; IOCB_NOWAIT)</div><div class='add'>+		ilock_flags |= BTRFS_ILOCK_TRY;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If the write DIO is within EOF, use a shared lock and also only if</div><div class='add'>+	 * security bits will likely not be dropped by file_remove_privs() called</div><div class='add'>+	 * from btrfs_write_check(). Either will need to be rechecked after the</div><div class='add'>+	 * lock was acquired.</div><div class='add'>+	 */</div><div class='add'>+	if (iocb-&gt;ki_pos + iov_iter_count(from) &lt;= i_size_read(inode) &amp;&amp; IS_NOSEC(inode))</div><div class='add'>+		ilock_flags |= BTRFS_ILOCK_SHARED;</div><div class='add'>+</div><div class='add'>+relock:</div><div class='add'>+	ret = btrfs_inode_lock(BTRFS_I(inode), ilock_flags);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	/* Shared lock cannot be used with security bits set. */</div><div class='add'>+	if ((ilock_flags &amp; BTRFS_ILOCK_SHARED) &amp;&amp; !IS_NOSEC(inode)) {</div><div class='add'>+		btrfs_inode_unlock(BTRFS_I(inode), ilock_flags);</div><div class='add'>+		ilock_flags &amp;= ~BTRFS_ILOCK_SHARED;</div><div class='add'>+		goto relock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = generic_write_checks(iocb, from);</div><div class='add'>+	if (ret &lt;= 0) {</div><div class='add'>+		btrfs_inode_unlock(BTRFS_I(inode), ilock_flags);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_write_check(iocb, ret);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		btrfs_inode_unlock(BTRFS_I(inode), ilock_flags);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	pos = iocb-&gt;ki_pos;</div><div class='add'>+	/*</div><div class='add'>+	 * Re-check since file size may have changed just before taking the</div><div class='add'>+	 * lock or pos may have changed because of O_APPEND in generic_write_check()</div><div class='add'>+	 */</div><div class='add'>+	if ((ilock_flags &amp; BTRFS_ILOCK_SHARED) &amp;&amp;</div><div class='add'>+	    pos + iov_iter_count(from) &gt; i_size_read(inode)) {</div><div class='add'>+		btrfs_inode_unlock(BTRFS_I(inode), ilock_flags);</div><div class='add'>+		ilock_flags &amp;= ~BTRFS_ILOCK_SHARED;</div><div class='add'>+		goto relock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (check_direct_IO(fs_info, from, pos)) {</div><div class='add'>+		btrfs_inode_unlock(BTRFS_I(inode), ilock_flags);</div><div class='add'>+		goto buffered;</div><div class='add'>+	}</div><div class='add'>+	/*</div><div class='add'>+	 * We can't control the folios being passed in, applications can write</div><div class='add'>+	 * to them while a direct IO write is in progress.  This means the</div><div class='add'>+	 * content might change after we calculated the data checksum.</div><div class='add'>+	 * Therefore we can end up storing a checksum that doesn't match the</div><div class='add'>+	 * persisted data.</div><div class='add'>+	 *</div><div class='add'>+	 * To be extra safe and avoid false data checksum mismatch, if the</div><div class='add'>+	 * inode requires data checksum, just fallback to buffered IO.</div><div class='add'>+	 * For buffered IO we have full control of page cache and can ensure</div><div class='add'>+	 * no one is modifying the content during writeback.</div><div class='add'>+	 */</div><div class='add'>+	if (!(BTRFS_I(inode)-&gt;flags &amp; BTRFS_INODE_NODATASUM)) {</div><div class='add'>+		btrfs_inode_unlock(BTRFS_I(inode), ilock_flags);</div><div class='add'>+		goto buffered;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The iov_iter can be mapped to the same file range we are writing to.</div><div class='add'>+	 * If that's the case, then we will deadlock in the iomap code, because</div><div class='add'>+	 * it first calls our callback btrfs_dio_iomap_begin(), which will create</div><div class='add'>+	 * an ordered extent, and after that it will fault in the pages that the</div><div class='add'>+	 * iov_iter refers to. During the fault in we end up in the readahead</div><div class='add'>+	 * pages code (starting at btrfs_readahead()), which will lock the range,</div><div class='add'>+	 * find that ordered extent and then wait for it to complete (at</div><div class='add'>+	 * btrfs_lock_and_flush_ordered_range()), resulting in a deadlock since</div><div class='add'>+	 * obviously the ordered extent can never complete as we didn't submit</div><div class='add'>+	 * yet the respective bio(s). This always happens when the buffer is</div><div class='add'>+	 * memory mapped to the same file range, since the iomap DIO code always</div><div class='add'>+	 * invalidates pages in the target file range (after starting and waiting</div><div class='add'>+	 * for any writeback).</div><div class='add'>+	 *</div><div class='add'>+	 * So here we disable page faults in the iov_iter and then retry if we</div><div class='add'>+	 * got -EFAULT, faulting in the pages before the retry.</div><div class='add'>+	 */</div><div class='add'>+again:</div><div class='add'>+	from-&gt;nofault = true;</div><div class='add'>+	dio = btrfs_dio_write(iocb, from, written);</div><div class='add'>+	from-&gt;nofault = false;</div><div class='add'>+</div><div class='add'>+	if (IS_ERR_OR_NULL(dio)) {</div><div class='add'>+		ret = PTR_ERR_OR_ZERO(dio);</div><div class='add'>+	} else {</div><div class='add'>+		/*</div><div class='add'>+		 * If we have a synchronous write, we must make sure the fsync</div><div class='add'>+		 * triggered by the iomap_dio_complete() call below doesn't</div><div class='add'>+		 * deadlock on the inode lock - we are already holding it and we</div><div class='add'>+		 * can't call it after unlocking because we may need to complete</div><div class='add'>+		 * partial writes due to the input buffer (or parts of it) not</div><div class='add'>+		 * being already faulted in.</div><div class='add'>+		 */</div><div class='add'>+		ASSERT(current-&gt;journal_info == NULL);</div><div class='add'>+		current-&gt;journal_info = BTRFS_TRANS_DIO_WRITE_STUB;</div><div class='add'>+		ret = iomap_dio_complete(dio);</div><div class='add'>+		current-&gt;journal_info = NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* No increment (+=) because iomap returns a cumulative value. */</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		written = ret;</div><div class='add'>+</div><div class='add'>+	if (iov_iter_count(from) &gt; 0 &amp;&amp; (ret == -EFAULT || ret &gt; 0)) {</div><div class='add'>+		const size_t left = iov_iter_count(from);</div><div class='add'>+		/*</div><div class='add'>+		 * We have more data left to write. Try to fault in as many as</div><div class='add'>+		 * possible of the remainder pages and retry. We do this without</div><div class='add'>+		 * releasing and locking again the inode, to prevent races with</div><div class='add'>+		 * truncate.</div><div class='add'>+		 *</div><div class='add'>+		 * Also, in case the iov refers to pages in the file range of the</div><div class='add'>+		 * file we want to write to (due to a mmap), we could enter an</div><div class='add'>+		 * infinite loop if we retry after faulting the pages in, since</div><div class='add'>+		 * iomap will invalidate any pages in the range early on, before</div><div class='add'>+		 * it tries to fault in the pages of the iov. So we keep track of</div><div class='add'>+		 * how much was left of iov in the previous EFAULT and fallback</div><div class='add'>+		 * to buffered IO in case we haven't made any progress.</div><div class='add'>+		 */</div><div class='add'>+		if (left == prev_left) {</div><div class='add'>+			ret = -ENOTBLK;</div><div class='add'>+		} else {</div><div class='add'>+			fault_in_iov_iter_readable(from, left);</div><div class='add'>+			prev_left = left;</div><div class='add'>+			goto again;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	btrfs_inode_unlock(BTRFS_I(inode), ilock_flags);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If 'ret' is -ENOTBLK or we have not written all data, then it means</div><div class='add'>+	 * we must fallback to buffered IO.</div><div class='add'>+	 */</div><div class='add'>+	if ((ret &lt; 0 &amp;&amp; ret != -ENOTBLK) || !iov_iter_count(from))</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+buffered:</div><div class='add'>+	/*</div><div class='add'>+	 * If we are in a NOWAIT context, then return -EAGAIN to signal the caller</div><div class='add'>+	 * it must retry the operation in a context where blocking is acceptable,</div><div class='add'>+	 * because even if we end up not blocking during the buffered IO attempt</div><div class='add'>+	 * below, we will block when flushing and waiting for the IO.</div><div class='add'>+	 */</div><div class='add'>+	if (iocb-&gt;ki_flags &amp; IOCB_NOWAIT) {</div><div class='add'>+		ret = -EAGAIN;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	pos = iocb-&gt;ki_pos;</div><div class='add'>+	written_buffered = btrfs_buffered_write(iocb, from);</div><div class='add'>+	if (written_buffered &lt; 0) {</div><div class='add'>+		ret = written_buffered;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	/*</div><div class='add'>+	 * Ensure all data is persisted. We want the next direct IO read to be</div><div class='add'>+	 * able to read what was just written.</div><div class='add'>+	 */</div><div class='add'>+	endbyte = pos + written_buffered - 1;</div><div class='add'>+	ret = btrfs_fdatawrite_range(BTRFS_I(inode), pos, endbyte);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+	ret = filemap_fdatawait_range(inode-&gt;i_mapping, pos, endbyte);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+	written += written_buffered;</div><div class='add'>+	iocb-&gt;ki_pos = pos + written_buffered;</div><div class='add'>+	invalidate_mapping_pages(file-&gt;f_mapping, pos &gt;&gt; PAGE_SHIFT,</div><div class='add'>+				 endbyte &gt;&gt; PAGE_SHIFT);</div><div class='add'>+out:</div><div class='add'>+	return ret &lt; 0 ? ret : written;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int check_direct_read(struct btrfs_fs_info *fs_info,</div><div class='add'>+			     const struct iov_iter *iter, loff_t offset)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+	int i, seg;</div><div class='add'>+</div><div class='add'>+	ret = check_direct_IO(fs_info, iter, offset);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	if (!iter_is_iovec(iter))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	for (seg = 0; seg &lt; iter-&gt;nr_segs; seg++) {</div><div class='add'>+		for (i = seg + 1; i &lt; iter-&gt;nr_segs; i++) {</div><div class='add'>+			const struct iovec *iov1 = iter_iov(iter) + seg;</div><div class='add'>+			const struct iovec *iov2 = iter_iov(iter) + i;</div><div class='add'>+</div><div class='add'>+			if (iov1-&gt;iov_base == iov2-&gt;iov_base)</div><div class='add'>+				return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+ssize_t btrfs_direct_read(struct kiocb *iocb, struct iov_iter *to)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='add'>+	size_t prev_left = 0;</div><div class='add'>+	ssize_t read = 0;</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	if (fsverity_active(inode))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if (check_direct_read(inode_to_fs_info(inode), to, iocb-&gt;ki_pos))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	btrfs_inode_lock(BTRFS_I(inode), BTRFS_ILOCK_SHARED);</div><div class='add'>+again:</div><div class='add'>+	/*</div><div class='add'>+	 * This is similar to what we do for direct IO writes, see the comment</div><div class='add'>+	 * at btrfs_direct_write(), but we also disable page faults in addition</div><div class='add'>+	 * to disabling them only at the iov_iter level. This is because when</div><div class='add'>+	 * reading from a hole or prealloc extent, iomap calls iov_iter_zero(),</div><div class='add'>+	 * which can still trigger page fault ins despite having set -&gt;nofault</div><div class='add'>+	 * to true of our 'to' iov_iter.</div><div class='add'>+	 *</div><div class='add'>+	 * The difference to direct IO writes is that we deadlock when trying</div><div class='add'>+	 * to lock the extent range in the inode's tree during he page reads</div><div class='add'>+	 * triggered by the fault in (while for writes it is due to waiting for</div><div class='add'>+	 * our own ordered extent). This is because for direct IO reads,</div><div class='add'>+	 * btrfs_dio_iomap_begin() returns with the extent range locked, which</div><div class='add'>+	 * is only unlocked in the endio callback (end_bio_extent_readpage()).</div><div class='add'>+	 */</div><div class='add'>+	pagefault_disable();</div><div class='add'>+	to-&gt;nofault = true;</div><div class='add'>+	ret = btrfs_dio_read(iocb, to, read);</div><div class='add'>+	to-&gt;nofault = false;</div><div class='add'>+	pagefault_enable();</div><div class='add'>+</div><div class='add'>+	/* No increment (+=) because iomap returns a cumulative value. */</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		read = ret;</div><div class='add'>+</div><div class='add'>+	if (iov_iter_count(to) &gt; 0 &amp;&amp; (ret == -EFAULT || ret &gt; 0)) {</div><div class='add'>+		const size_t left = iov_iter_count(to);</div><div class='add'>+</div><div class='add'>+		if (left == prev_left) {</div><div class='add'>+			/*</div><div class='add'>+			 * We didn't make any progress since the last attempt,</div><div class='add'>+			 * fallback to a buffered read for the remainder of the</div><div class='add'>+			 * range. This is just to avoid any possibility of looping</div><div class='add'>+			 * for too long.</div><div class='add'>+			 */</div><div class='add'>+			ret = read;</div><div class='add'>+		} else {</div><div class='add'>+			/*</div><div class='add'>+			 * We made some progress since the last retry or this is</div><div class='add'>+			 * the first time we are retrying. Fault in as many pages</div><div class='add'>+			 * as possible and retry.</div><div class='add'>+			 */</div><div class='add'>+			fault_in_iov_iter_writeable(to, left);</div><div class='add'>+			prev_left = left;</div><div class='add'>+			goto again;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	btrfs_inode_unlock(BTRFS_I(inode), BTRFS_ILOCK_SHARED);</div><div class='add'>+	return ret &lt; 0 ? ret : read;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int __init btrfs_init_dio(void)</div><div class='add'>+{</div><div class='add'>+	if (bioset_init(&amp;btrfs_dio_bioset, BIO_POOL_SIZE,</div><div class='add'>+			offsetof(struct btrfs_dio_private, bbio.bio),</div><div class='add'>+			BIOSET_NEED_BVECS))</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void __cold btrfs_destroy_dio(void)</div><div class='add'>+{</div><div class='add'>+	bioset_exit(&amp;btrfs_dio_bioset);</div><div class='add'>+}</div><div class='head'>diff --git a/fs/btrfs/direct-io.h b/fs/btrfs/direct-io.h<br/>new file mode 100644<br/>index 000000000000..df5d45ee6de7<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/direct-io.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/direct-io.h</a></div><div class='hunk'>@@ -0,0 +1,16 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+</div><div class='add'>+#ifndef BTRFS_DIRECT_IO_H</div><div class='add'>+#define BTRFS_DIRECT_IO_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+</div><div class='add'>+struct kiocb;</div><div class='add'>+</div><div class='add'>+int __init btrfs_init_dio(void);</div><div class='add'>+void __cold btrfs_destroy_dio(void);</div><div class='add'>+</div><div class='add'>+ssize_t btrfs_direct_write(struct kiocb *iocb, struct iov_iter *from);</div><div class='add'>+ssize_t btrfs_direct_read(struct kiocb *iocb, struct iov_iter *to);</div><div class='add'>+</div><div class='add'>+#endif /* BTRFS_DIRECT_IO_H */</div><div class='head'>diff --git a/fs/btrfs/discard.c b/fs/btrfs/discard.c<br/>index e1b7bd927d69..89fe85778115 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/discard.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/discard.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/discard.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/discard.c</a></div><div class='hunk'>@@ -11,6 +11,7 @@</div><div class='ctx'> #include "block-group.h"</div><div class='ctx'> #include "discard.h"</div><div class='ctx'> #include "free-space-cache.h"</div><div class='add'>+#include "fs.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * This contains the logic to handle async discard.</div><div class='hunk'>@@ -55,13 +56,11 @@</div><div class='ctx'> #define BTRFS_DISCARD_DELAY		(120ULL * NSEC_PER_SEC)</div><div class='ctx'> #define BTRFS_DISCARD_UNUSED_DELAY	(10ULL * NSEC_PER_SEC)</div><div class='ctx'> </div><div class='del'>-/* Target completion latency of discarding all discardable extents */</div><div class='del'>-#define BTRFS_DISCARD_TARGET_MSEC	(6 * 60 * 60UL * MSEC_PER_SEC)</div><div class='ctx'> #define BTRFS_DISCARD_MIN_DELAY_MSEC	(1UL)</div><div class='ctx'> #define BTRFS_DISCARD_MAX_DELAY_MSEC	(1000UL)</div><div class='del'>-#define BTRFS_DISCARD_MAX_IOPS		(10U)</div><div class='add'>+#define BTRFS_DISCARD_MAX_IOPS		(1000U)</div><div class='ctx'> </div><div class='del'>-/* Montonically decreasing minimum length filters after index 0 */</div><div class='add'>+/* Monotonically decreasing minimum length filters after index 0 */</div><div class='ctx'> static int discard_minlen[BTRFS_NR_DISCARD_LISTS] = {</div><div class='ctx'> 	0,</div><div class='ctx'> 	BTRFS_ASYNC_DISCARD_MAX_FILTER,</div><div class='hunk'>@@ -69,16 +68,32 @@ static int discard_minlen[BTRFS_NR_DISCARD_LISTS] = {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static struct list_head *get_discard_list(struct btrfs_discard_ctl *discard_ctl,</div><div class='del'>-					  struct btrfs_block_group *block_group)</div><div class='add'>+					  const struct btrfs_block_group *block_group)</div><div class='ctx'> {</div><div class='ctx'> 	return &amp;discard_ctl-&gt;discard_list[block_group-&gt;discard_index];</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Determine if async discard should be running.</div><div class='add'>+ *</div><div class='add'>+ * @discard_ctl: discard control</div><div class='add'>+ *</div><div class='add'>+ * Check if the file system is writeable and BTRFS_FS_DISCARD_RUNNING is set.</div><div class='add'>+ */</div><div class='add'>+static bool btrfs_run_discard_work(const struct btrfs_discard_ctl *discard_ctl)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = container_of(discard_ctl,</div><div class='add'>+						     struct btrfs_fs_info,</div><div class='add'>+						     discard_ctl);</div><div class='add'>+</div><div class='add'>+	return (!(fs_info-&gt;sb-&gt;s_flags &amp; SB_RDONLY) &amp;&amp;</div><div class='add'>+		test_bit(BTRFS_FS_DISCARD_RUNNING, &amp;fs_info-&gt;flags));</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void __add_to_discard_list(struct btrfs_discard_ctl *discard_ctl,</div><div class='ctx'> 				  struct btrfs_block_group *block_group)</div><div class='ctx'> {</div><div class='del'>-	if (!btrfs_run_discard_work(discard_ctl))</div><div class='del'>-		return;</div><div class='add'>+	lockdep_assert_held(&amp;discard_ctl-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	if (list_empty(&amp;block_group-&gt;discard_list) ||</div><div class='ctx'> 	    block_group-&gt;discard_index == BTRFS_DISCARD_INDEX_UNUSED) {</div><div class='hunk'>@@ -88,6 +103,8 @@ static void __add_to_discard_list(struct btrfs_discard_ctl *discard_ctl,</div><div class='ctx'> 						      BTRFS_DISCARD_DELAY);</div><div class='ctx'> 		block_group-&gt;discard_state = BTRFS_DISCARD_RESET_CURSOR;</div><div class='ctx'> 	}</div><div class='add'>+	if (list_empty(&amp;block_group-&gt;discard_list))</div><div class='add'>+		btrfs_get_block_group(block_group);</div><div class='ctx'> </div><div class='ctx'> 	list_move_tail(&amp;block_group-&gt;discard_list,</div><div class='ctx'> 		       get_discard_list(discard_ctl, block_group));</div><div class='hunk'>@@ -99,6 +116,9 @@ static void add_to_discard_list(struct btrfs_discard_ctl *discard_ctl,</div><div class='ctx'> 	if (!btrfs_is_block_group_data_only(block_group))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='add'>+	if (!btrfs_run_discard_work(discard_ctl))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='ctx'> 	spin_lock(&amp;discard_ctl-&gt;lock);</div><div class='ctx'> 	__add_to_discard_list(discard_ctl, block_group);</div><div class='ctx'> 	spin_unlock(&amp;discard_ctl-&gt;lock);</div><div class='hunk'>@@ -107,8 +127,12 @@ static void add_to_discard_list(struct btrfs_discard_ctl *discard_ctl,</div><div class='ctx'> static void add_to_discard_unused_list(struct btrfs_discard_ctl *discard_ctl,</div><div class='ctx'> 				       struct btrfs_block_group *block_group)</div><div class='ctx'> {</div><div class='add'>+	bool queued;</div><div class='add'>+</div><div class='ctx'> 	spin_lock(&amp;discard_ctl-&gt;lock);</div><div class='ctx'> </div><div class='add'>+	queued = !list_empty(&amp;block_group-&gt;discard_list);</div><div class='add'>+</div><div class='ctx'> 	if (!btrfs_run_discard_work(discard_ctl)) {</div><div class='ctx'> 		spin_unlock(&amp;discard_ctl-&gt;lock);</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -120,6 +144,8 @@ static void add_to_discard_unused_list(struct btrfs_discard_ctl *discard_ctl,</div><div class='ctx'> 	block_group-&gt;discard_eligible_time = (ktime_get_ns() +</div><div class='ctx'> 					      BTRFS_DISCARD_UNUSED_DELAY);</div><div class='ctx'> 	block_group-&gt;discard_state = BTRFS_DISCARD_RESET_CURSOR;</div><div class='add'>+	if (!queued)</div><div class='add'>+		btrfs_get_block_group(block_group);</div><div class='ctx'> 	list_add_tail(&amp;block_group-&gt;discard_list,</div><div class='ctx'> 		      &amp;discard_ctl-&gt;discard_list[BTRFS_DISCARD_INDEX_UNUSED]);</div><div class='ctx'> </div><div class='hunk'>@@ -130,6 +156,7 @@ static bool remove_from_discard_list(struct btrfs_discard_ctl *discard_ctl,</div><div class='ctx'> 				     struct btrfs_block_group *block_group)</div><div class='ctx'> {</div><div class='ctx'> 	bool running = false;</div><div class='add'>+	bool queued = false;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;discard_ctl-&gt;lock);</div><div class='ctx'> </div><div class='hunk'>@@ -139,17 +166,21 @@ static bool remove_from_discard_list(struct btrfs_discard_ctl *discard_ctl,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	block_group-&gt;discard_eligible_time = 0;</div><div class='add'>+	queued = !list_empty(&amp;block_group-&gt;discard_list);</div><div class='ctx'> 	list_del_init(&amp;block_group-&gt;discard_list);</div><div class='add'>+	if (queued)</div><div class='add'>+		btrfs_put_block_group(block_group);</div><div class='ctx'> </div><div class='ctx'> 	spin_unlock(&amp;discard_ctl-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	return running;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * find_next_block_group - find block_group that's up next for discarding</div><div class='del'>- * @discard_ctl: discard control</div><div class='del'>- * @now: current time</div><div class='add'>+/*</div><div class='add'>+ * Find block_group that's up next for discarding.</div><div class='add'>+ *</div><div class='add'>+ * @discard_ctl:  discard control</div><div class='add'>+ * @now:          current time</div><div class='ctx'>  *</div><div class='ctx'>  * Iterate over the discard lists to find the next block_group up for</div><div class='ctx'>  * discarding checking the discard_eligible_time of block_group.</div><div class='hunk'>@@ -184,17 +215,17 @@ static struct btrfs_block_group *find_next_block_group(</div><div class='ctx'> 	return ret_block_group;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * Wrap find_next_block_group()</div><div class='add'>+/*</div><div class='add'>+ * Look up next block group and set it for use.</div><div class='ctx'>  *</div><div class='ctx'>  * @discard_ctl:   discard control</div><div class='ctx'>  * @discard_state: the discard_state of the block_group after state management</div><div class='ctx'>  * @discard_index: the discard_index of the block_group after state management</div><div class='ctx'>  * @now:           time when discard was invoked, in ns</div><div class='ctx'>  *</div><div class='del'>- * This wraps find_next_block_group() and sets the block_group to be in use.</div><div class='del'>- * discard_state's control flow is managed here.  Variables related to</div><div class='del'>- * discard_state are reset here as needed (eg discard_cursor).  @discard_state</div><div class='add'>+ * Wrap find_next_block_group() and set the block_group to be in use.</div><div class='add'>+ * @discard_state's control flow is managed here.  Variables related to</div><div class='add'>+ * @discard_state are reset here as needed (eg. @discard_cursor).  @discard_state</div><div class='ctx'>  * and @discard_index are remembered as it may change while we're discarding,</div><div class='ctx'>  * but we want the discard to execute in the context determined here.</div><div class='ctx'>  */</div><div class='hunk'>@@ -212,19 +243,36 @@ again:</div><div class='ctx'> 	if (block_group &amp;&amp; now &gt;= block_group-&gt;discard_eligible_time) {</div><div class='ctx'> 		if (block_group-&gt;discard_index == BTRFS_DISCARD_INDEX_UNUSED &amp;&amp;</div><div class='ctx'> 		    block_group-&gt;used != 0) {</div><div class='del'>-			if (btrfs_is_block_group_data_only(block_group))</div><div class='add'>+			if (btrfs_is_block_group_data_only(block_group)) {</div><div class='ctx'> 				__add_to_discard_list(discard_ctl, block_group);</div><div class='del'>-			else</div><div class='add'>+				/*</div><div class='add'>+				 * The block group must have been moved to other</div><div class='add'>+				 * discard list even if discard was disabled in</div><div class='add'>+				 * the meantime or a transaction abort happened,</div><div class='add'>+				 * otherwise we can end up in an infinite loop,</div><div class='add'>+				 * always jumping into the 'again' label and</div><div class='add'>+				 * keep getting this block group over and over</div><div class='add'>+				 * in case there are no other block groups in</div><div class='add'>+				 * the discard lists.</div><div class='add'>+				 */</div><div class='add'>+				ASSERT(block_group-&gt;discard_index !=</div><div class='add'>+				       BTRFS_DISCARD_INDEX_UNUSED,</div><div class='add'>+				       "discard_index=%d",</div><div class='add'>+				       block_group-&gt;discard_index);</div><div class='add'>+			} else {</div><div class='ctx'> 				list_del_init(&amp;block_group-&gt;discard_list);</div><div class='add'>+				btrfs_put_block_group(block_group);</div><div class='add'>+			}</div><div class='ctx'> 			goto again;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (block_group-&gt;discard_state == BTRFS_DISCARD_RESET_CURSOR) {</div><div class='ctx'> 			block_group-&gt;discard_cursor = block_group-&gt;start;</div><div class='ctx'> 			block_group-&gt;discard_state = BTRFS_DISCARD_EXTENTS;</div><div class='ctx'> 		}</div><div class='del'>-		discard_ctl-&gt;block_group = block_group;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (block_group) {</div><div class='add'>+		btrfs_get_block_group(block_group);</div><div class='add'>+		discard_ctl-&gt;block_group = block_group;</div><div class='ctx'> 		*discard_state = block_group-&gt;discard_state;</div><div class='ctx'> 		*discard_index = block_group-&gt;discard_index;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -233,10 +281,11 @@ again:</div><div class='ctx'> 	return block_group;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * btrfs_discard_check_filter - updates a block groups filters</div><div class='del'>- * @block_group: block group of interest</div><div class='del'>- * @bytes: recently freed region size after coalescing</div><div class='add'>+/*</div><div class='add'>+ * Update a block group's filters.</div><div class='add'>+ *</div><div class='add'>+ * @block_group:  block group of interest</div><div class='add'>+ * @bytes:        recently freed region size after coalescing</div><div class='ctx'>  *</div><div class='ctx'>  * Async discard maintains multiple lists with progressively smaller filters</div><div class='ctx'>  * to prioritize discarding based on size.  Should a free space that matches</div><div class='hunk'>@@ -271,8 +320,9 @@ void btrfs_discard_check_filter(struct btrfs_block_group *block_group,</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * btrfs_update_discard_index - moves a block group along the discard lists</div><div class='add'>+/*</div><div class='add'>+ * Move a block group along the discard lists.</div><div class='add'>+ *</div><div class='ctx'>  * @discard_ctl: discard control</div><div class='ctx'>  * @block_group: block_group of interest</div><div class='ctx'>  *</div><div class='hunk'>@@ -291,13 +341,14 @@ static void btrfs_update_discard_index(struct btrfs_discard_ctl *discard_ctl,</div><div class='ctx'> 	add_to_discard_list(discard_ctl, block_group);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * btrfs_discard_cancel_work - remove a block_group from the discard lists</div><div class='add'>+/*</div><div class='add'>+ * Remove a block_group from the discard lists.</div><div class='add'>+ *</div><div class='ctx'>  * @discard_ctl: discard control</div><div class='ctx'>  * @block_group: block_group of interest</div><div class='ctx'>  *</div><div class='del'>- * This removes @block_group from the discard lists.  If necessary, it waits on</div><div class='del'>- * the current work and then reschedules the delayed work.</div><div class='add'>+ * Remove @block_group from the discard lists.  If necessary, wait on the</div><div class='add'>+ * current work and then reschedule the delayed work.</div><div class='ctx'>  */</div><div class='ctx'> void btrfs_discard_cancel_work(struct btrfs_discard_ctl *discard_ctl,</div><div class='ctx'> 			       struct btrfs_block_group *block_group)</div><div class='hunk'>@@ -308,12 +359,13 @@ void btrfs_discard_cancel_work(struct btrfs_discard_ctl *discard_ctl,</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * btrfs_discard_queue_work - handles queuing the block_groups</div><div class='add'>+/*</div><div class='add'>+ * Handles queuing the block_groups.</div><div class='add'>+ *</div><div class='ctx'>  * @discard_ctl: discard control</div><div class='ctx'>  * @block_group: block_group of interest</div><div class='ctx'>  *</div><div class='del'>- * This maintains the LRU order of the discard lists.</div><div class='add'>+ * Maintain the LRU order of the discard lists.</div><div class='ctx'>  */</div><div class='ctx'> void btrfs_discard_queue_work(struct btrfs_discard_ctl *discard_ctl,</div><div class='ctx'> 			      struct btrfs_block_group *block_group)</div><div class='hunk'>@@ -383,7 +435,8 @@ static void __btrfs_discard_schedule_work(struct btrfs_discard_ctl *discard_ctl,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * btrfs_discard_schedule_work - responsible for scheduling the discard work</div><div class='add'>+ * Responsible for scheduling the discard work.</div><div class='add'>+ *</div><div class='ctx'>  * @discard_ctl:  discard control</div><div class='ctx'>  * @override:     override the current timer</div><div class='ctx'>  *</div><div class='hunk'>@@ -401,15 +454,16 @@ void btrfs_discard_schedule_work(struct btrfs_discard_ctl *discard_ctl,</div><div class='ctx'> 	spin_unlock(&amp;discard_ctl-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * btrfs_finish_discard_pass - determine next step of a block_group</div><div class='add'>+/*</div><div class='add'>+ * Determine next step of a block_group.</div><div class='add'>+ *</div><div class='ctx'>  * @discard_ctl: discard control</div><div class='ctx'>  * @block_group: block_group of interest</div><div class='ctx'>  *</div><div class='del'>- * This determines the next step for a block group after it's finished going</div><div class='del'>- * through a pass on a discard list.  If it is unused and fully trimmed, we can</div><div class='del'>- * mark it unused and send it to the unused_bgs path.  Otherwise, pass it onto</div><div class='del'>- * the appropriate filter list or let it fall off.</div><div class='add'>+ * Determine the next step for a block group after it's finished going through</div><div class='add'>+ * a pass on a discard list.  If it is unused and fully trimmed, we can mark it</div><div class='add'>+ * unused and send it to the unused_bgs path.  Otherwise, pass it onto the</div><div class='add'>+ * appropriate filter list or let it fall off.</div><div class='ctx'>  */</div><div class='ctx'> static void btrfs_finish_discard_pass(struct btrfs_discard_ctl *discard_ctl,</div><div class='ctx'> 				      struct btrfs_block_group *block_group)</div><div class='hunk'>@@ -426,12 +480,13 @@ static void btrfs_finish_discard_pass(struct btrfs_discard_ctl *discard_ctl,</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * btrfs_discard_workfn - discard work function</div><div class='add'>+/*</div><div class='add'>+ * Discard work queue callback</div><div class='add'>+ *</div><div class='ctx'>  * @work: work</div><div class='ctx'>  *</div><div class='del'>- * This finds the next block_group to start discarding and then discards a</div><div class='del'>- * single region.  It does this in a two-pass fashion: first extents and second</div><div class='add'>+ * Find the next block_group to start discarding and then discard a single</div><div class='add'>+ * region.  It does this in a two-pass fashion: first extents and second</div><div class='ctx'>  * bitmaps.  Completely discarded block groups are sent to the unused_bgs path.</div><div class='ctx'>  */</div><div class='ctx'> static void btrfs_discard_workfn(struct work_struct *work)</div><div class='hunk'>@@ -448,9 +503,20 @@ static void btrfs_discard_workfn(struct work_struct *work)</div><div class='ctx'> </div><div class='ctx'> 	block_group = peek_discard_list(discard_ctl, &amp;discard_state,</div><div class='ctx'> 					&amp;discard_index, now);</div><div class='del'>-	if (!block_group || !btrfs_run_discard_work(discard_ctl))</div><div class='add'>+	if (!block_group)</div><div class='add'>+		return;</div><div class='add'>+	if (!btrfs_run_discard_work(discard_ctl)) {</div><div class='add'>+		spin_lock(&amp;discard_ctl-&gt;lock);</div><div class='add'>+		btrfs_put_block_group(block_group);</div><div class='add'>+		discard_ctl-&gt;block_group = NULL;</div><div class='add'>+		spin_unlock(&amp;discard_ctl-&gt;lock);</div><div class='ctx'> 		return;</div><div class='add'>+	}</div><div class='ctx'> 	if (now &lt; block_group-&gt;discard_eligible_time) {</div><div class='add'>+		spin_lock(&amp;discard_ctl-&gt;lock);</div><div class='add'>+		btrfs_put_block_group(block_group);</div><div class='add'>+		discard_ctl-&gt;block_group = NULL;</div><div class='add'>+		spin_unlock(&amp;discard_ctl-&gt;lock);</div><div class='ctx'> 		btrfs_discard_schedule_work(discard_ctl, false);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -502,29 +568,15 @@ static void btrfs_discard_workfn(struct work_struct *work)</div><div class='ctx'> 	spin_lock(&amp;discard_ctl-&gt;lock);</div><div class='ctx'> 	discard_ctl-&gt;prev_discard = trimmed;</div><div class='ctx'> 	discard_ctl-&gt;prev_discard_time = now;</div><div class='add'>+	btrfs_put_block_group(block_group);</div><div class='ctx'> 	discard_ctl-&gt;block_group = NULL;</div><div class='ctx'> 	__btrfs_discard_schedule_work(discard_ctl, now, false);</div><div class='ctx'> 	spin_unlock(&amp;discard_ctl-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * btrfs_run_discard_work - determines if async discard should be running</div><div class='del'>- * @discard_ctl: discard control</div><div class='add'>+/*</div><div class='add'>+ * Recalculate the base delay.</div><div class='ctx'>  *</div><div class='del'>- * Checks if the file system is writeable and BTRFS_FS_DISCARD_RUNNING is set.</div><div class='del'>- */</div><div class='del'>-bool btrfs_run_discard_work(struct btrfs_discard_ctl *discard_ctl)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = container_of(discard_ctl,</div><div class='del'>-						     struct btrfs_fs_info,</div><div class='del'>-						     discard_ctl);</div><div class='del'>-</div><div class='del'>-	return (!(fs_info-&gt;sb-&gt;s_flags &amp; SB_RDONLY) &amp;&amp;</div><div class='del'>-		test_bit(BTRFS_FS_DISCARD_RUNNING, &amp;fs_info-&gt;flags));</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * btrfs_discard_calc_delay - recalculate the base delay</div><div class='ctx'>  * @discard_ctl: discard control</div><div class='ctx'>  *</div><div class='ctx'>  * Recalculate the base delay which is based off the total number of</div><div class='hunk'>@@ -536,6 +588,7 @@ void btrfs_discard_calc_delay(struct btrfs_discard_ctl *discard_ctl)</div><div class='ctx'> 	s32 discardable_extents;</div><div class='ctx'> 	s64 discardable_bytes;</div><div class='ctx'> 	u32 iops_limit;</div><div class='add'>+	unsigned long min_delay = BTRFS_DISCARD_MIN_DELAY_MSEC;</div><div class='ctx'> 	unsigned long delay;</div><div class='ctx'> </div><div class='ctx'> 	discardable_extents = atomic_read(&amp;discard_ctl-&gt;discardable_extents);</div><div class='hunk'>@@ -545,7 +598,7 @@ void btrfs_discard_calc_delay(struct btrfs_discard_ctl *discard_ctl)</div><div class='ctx'> 	spin_lock(&amp;discard_ctl-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * The following is to fix a potential -1 discrepenancy that we're not</div><div class='add'>+	 * The following is to fix a potential -1 discrepancy that we're not</div><div class='ctx'> 	 * sure how to reproduce. But given that this is the only place that</div><div class='ctx'> 	 * utilizes these numbers and this is only called by from</div><div class='ctx'> 	 * btrfs_finish_extent_commit() which is synchronized, we can correct</div><div class='hunk'>@@ -566,25 +619,32 @@ void btrfs_discard_calc_delay(struct btrfs_discard_ctl *discard_ctl)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	iops_limit = READ_ONCE(discard_ctl-&gt;iops_limit);</div><div class='del'>-	if (iops_limit)</div><div class='add'>+</div><div class='add'>+	if (iops_limit) {</div><div class='ctx'> 		delay = MSEC_PER_SEC / iops_limit;</div><div class='del'>-	else</div><div class='del'>-		delay = BTRFS_DISCARD_TARGET_MSEC / discardable_extents;</div><div class='add'>+	} else {</div><div class='add'>+		/*</div><div class='add'>+		 * Unset iops_limit means go as fast as possible, so allow a</div><div class='add'>+		 * delay of 0.</div><div class='add'>+		 */</div><div class='add'>+		delay = 0;</div><div class='add'>+		min_delay = 0;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	delay = clamp(delay, BTRFS_DISCARD_MIN_DELAY_MSEC,</div><div class='del'>-		      BTRFS_DISCARD_MAX_DELAY_MSEC);</div><div class='add'>+	delay = clamp(delay, min_delay, BTRFS_DISCARD_MAX_DELAY_MSEC);</div><div class='ctx'> 	discard_ctl-&gt;delay_ms = delay;</div><div class='ctx'> </div><div class='ctx'> 	spin_unlock(&amp;discard_ctl-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * btrfs_discard_update_discardable - propagate discard counters</div><div class='add'>+/*</div><div class='add'>+ * Propagate discard counters.</div><div class='add'>+ *</div><div class='ctx'>  * @block_group: block_group of interest</div><div class='ctx'>  *</div><div class='del'>- * This propagates deltas of counters up to the discard_ctl.  It maintains a</div><div class='del'>- * current counter and a previous counter passing the delta up to the global</div><div class='del'>- * stat.  Then the current counter value becomes the previous counter value.</div><div class='add'>+ * Propagate deltas of counters up to the discard_ctl.  It maintains a current</div><div class='add'>+ * counter and a previous counter passing the delta up to the global stat.</div><div class='add'>+ * Then the current counter value becomes the previous counter value.</div><div class='ctx'>  */</div><div class='ctx'> void btrfs_discard_update_discardable(struct btrfs_block_group *block_group)</div><div class='ctx'> {</div><div class='hunk'>@@ -619,8 +679,9 @@ void btrfs_discard_update_discardable(struct btrfs_block_group *block_group)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * btrfs_discard_punt_unused_bgs_list - punt unused_bgs list to discard lists</div><div class='add'>+/*</div><div class='add'>+ * Punt unused_bgs list to discard lists.</div><div class='add'>+ *</div><div class='ctx'>  * @fs_info: fs_info of interest</div><div class='ctx'>  *</div><div class='ctx'>  * The unused_bgs list needs to be punted to the discard lists because the</div><div class='hunk'>@@ -638,14 +699,19 @@ void btrfs_discard_punt_unused_bgs_list(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	list_for_each_entry_safe(block_group, next, &amp;fs_info-&gt;unused_bgs,</div><div class='ctx'> 				 bg_list) {</div><div class='ctx'> 		list_del_init(&amp;block_group-&gt;bg_list);</div><div class='del'>-		btrfs_put_block_group(block_group);</div><div class='ctx'> 		btrfs_discard_queue_work(&amp;fs_info-&gt;discard_ctl, block_group);</div><div class='add'>+		/*</div><div class='add'>+		 * This put is for the get done by btrfs_mark_bg_unused.</div><div class='add'>+		 * Queueing discard incremented it for discard's reference.</div><div class='add'>+		 */</div><div class='add'>+		btrfs_put_block_group(block_group);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * btrfs_discard_purge_list - purge discard lists</div><div class='add'>+/*</div><div class='add'>+ * Purge discard lists.</div><div class='add'>+ *</div><div class='ctx'>  * @discard_ctl: discard control</div><div class='ctx'>  *</div><div class='ctx'>  * If we are disabling async discard, we may have intercepted block groups that</div><div class='hunk'>@@ -669,6 +735,7 @@ static void btrfs_discard_purge_list(struct btrfs_discard_ctl *discard_ctl)</div><div class='ctx'> 			if (block_group-&gt;used == 0)</div><div class='ctx'> 				btrfs_mark_bg_unused(block_group);</div><div class='ctx'> 			spin_lock(&amp;discard_ctl-&gt;lock);</div><div class='add'>+			btrfs_put_block_group(block_group);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;discard_ctl-&gt;lock);</div><div class='head'>diff --git a/fs/btrfs/discard.h b/fs/btrfs/discard.h<br/>index 57b9202f427f..2c5e85394092 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/discard.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/discard.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/discard.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/discard.h</a></div><div class='hunk'>@@ -3,6 +3,7 @@</div><div class='ctx'> #ifndef BTRFS_DISCARD_H</div><div class='ctx'> #define BTRFS_DISCARD_H</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='ctx'> #include &lt;linux/sizes.h&gt;</div><div class='ctx'> </div><div class='ctx'> struct btrfs_fs_info;</div><div class='hunk'>@@ -24,7 +25,6 @@ void btrfs_discard_queue_work(struct btrfs_discard_ctl *discard_ctl,</div><div class='ctx'> 			      struct btrfs_block_group *block_group);</div><div class='ctx'> void btrfs_discard_schedule_work(struct btrfs_discard_ctl *discard_ctl,</div><div class='ctx'> 				 bool override);</div><div class='del'>-bool btrfs_run_discard_work(struct btrfs_discard_ctl *discard_ctl);</div><div class='ctx'> </div><div class='ctx'> /* Update operations */</div><div class='ctx'> void btrfs_discard_calc_delay(struct btrfs_discard_ctl *discard_ctl);</div><div class='head'>diff --git a/fs/btrfs/disk-io.c b/fs/btrfs/disk-io.c<br/>index 59c3be8c1f4c..89149fac804c 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/disk-io.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/disk-io.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/disk-io.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/disk-io.c</a></div><div class='hunk'>@@ -17,20 +17,18 @@</div><div class='ctx'> #include &lt;linux/error-injection.h&gt;</div><div class='ctx'> #include &lt;linux/crc32c.h&gt;</div><div class='ctx'> #include &lt;linux/sched/mm.h&gt;</div><div class='del'>-#include &lt;asm/unaligned.h&gt;</div><div class='add'>+#include &lt;linux/unaligned.h&gt;</div><div class='ctx'> #include &lt;crypto/hash.h&gt;</div><div class='ctx'> #include "ctree.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='ctx'> #include "transaction.h"</div><div class='ctx'> #include "btrfs_inode.h"</div><div class='del'>-#include "volumes.h"</div><div class='add'>+#include "bio.h"</div><div class='ctx'> #include "print-tree.h"</div><div class='ctx'> #include "locking.h"</div><div class='ctx'> #include "tree-log.h"</div><div class='ctx'> #include "free-space-cache.h"</div><div class='ctx'> #include "free-space-tree.h"</div><div class='del'>-#include "check-integrity.h"</div><div class='del'>-#include "rcu-string.h"</div><div class='ctx'> #include "dev-replace.h"</div><div class='ctx'> #include "raid56.h"</div><div class='ctx'> #include "sysfs.h"</div><div class='hunk'>@@ -43,6 +41,16 @@</div><div class='ctx'> #include "space-info.h"</div><div class='ctx'> #include "zoned.h"</div><div class='ctx'> #include "subpage.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "extent-tree.h"</div><div class='add'>+#include "root-tree.h"</div><div class='add'>+#include "defrag.h"</div><div class='add'>+#include "uuid-tree.h"</div><div class='add'>+#include "relocation.h"</div><div class='add'>+#include "scrub.h"</div><div class='add'>+#include "super.h"</div><div class='add'>+#include "delayed-inode.h"</div><div class='ctx'> </div><div class='ctx'> #define BTRFS_SUPER_FLAG_SUPP	(BTRFS_HEADER_FLAG_WRITTEN |\</div><div class='ctx'> 				 BTRFS_HEADER_FLAG_RELOC |\</div><div class='hunk'>@@ -51,53 +59,9 @@</div><div class='ctx'> 				 BTRFS_SUPER_FLAG_METADUMP |\</div><div class='ctx'> 				 BTRFS_SUPER_FLAG_METADUMP_V2)</div><div class='ctx'> </div><div class='del'>-static void end_workqueue_fn(struct btrfs_work *work);</div><div class='del'>-static void btrfs_destroy_ordered_extents(struct btrfs_root *root);</div><div class='del'>-static int btrfs_destroy_delayed_refs(struct btrfs_transaction *trans,</div><div class='del'>-				      struct btrfs_fs_info *fs_info);</div><div class='del'>-static void btrfs_destroy_delalloc_inodes(struct btrfs_root *root);</div><div class='del'>-static int btrfs_destroy_marked_extents(struct btrfs_fs_info *fs_info,</div><div class='del'>-					struct extent_io_tree *dirty_pages,</div><div class='del'>-					int mark);</div><div class='del'>-static int btrfs_destroy_pinned_extent(struct btrfs_fs_info *fs_info,</div><div class='del'>-				       struct extent_io_tree *pinned_extents);</div><div class='ctx'> static int btrfs_cleanup_transaction(struct btrfs_fs_info *fs_info);</div><div class='ctx'> static void btrfs_error_commit_super(struct btrfs_fs_info *fs_info);</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * btrfs_end_io_wq structs are used to do processing in task context when an IO</div><div class='del'>- * is complete.  This is used during reads to verify checksums, and it is used</div><div class='del'>- * by writes to insert metadata for new file extents after IO is complete.</div><div class='del'>- */</div><div class='del'>-struct btrfs_end_io_wq {</div><div class='del'>-	struct bio *bio;</div><div class='del'>-	bio_end_io_t *end_io;</div><div class='del'>-	void *private;</div><div class='del'>-	struct btrfs_fs_info *info;</div><div class='del'>-	blk_status_t status;</div><div class='del'>-	enum btrfs_wq_endio_type metadata;</div><div class='del'>-	struct btrfs_work work;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static struct kmem_cache *btrfs_end_io_wq_cache;</div><div class='del'>-</div><div class='del'>-int __init btrfs_end_io_wq_init(void)</div><div class='del'>-{</div><div class='del'>-	btrfs_end_io_wq_cache = kmem_cache_create("btrfs_end_io_wq",</div><div class='del'>-					sizeof(struct btrfs_end_io_wq),</div><div class='del'>-					0,</div><div class='del'>-					SLAB_MEM_SPREAD,</div><div class='del'>-					NULL);</div><div class='del'>-	if (!btrfs_end_io_wq_cache)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void __cold btrfs_end_io_wq_exit(void)</div><div class='del'>-{</div><div class='del'>-	kmem_cache_destroy(btrfs_end_io_wq_cache);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static void btrfs_free_csum_hash(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	if (fs_info-&gt;csum_shash)</div><div class='hunk'>@@ -105,124 +69,42 @@ static void btrfs_free_csum_hash(struct btrfs_fs_info *fs_info)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * async submit bios are used to offload expensive checksumming</div><div class='del'>- * onto the worker threads.  They checksum file and metadata bios</div><div class='del'>- * just before they are sent down the IO stack.</div><div class='del'>- */</div><div class='del'>-struct async_submit_bio {</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	struct bio *bio;</div><div class='del'>-	extent_submit_bio_start_t *submit_bio_start;</div><div class='del'>-	int mirror_num;</div><div class='del'>-</div><div class='del'>-	/* Optional parameter for submit_bio_start used by direct io */</div><div class='del'>-	u64 dio_file_offset;</div><div class='del'>-	struct btrfs_work work;</div><div class='del'>-	blk_status_t status;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Lockdep class keys for extent_buffer-&gt;lock's in this root.  For a given</div><div class='del'>- * eb, the lockdep key is determined by the btrfs_root it belongs to and</div><div class='del'>- * the level the eb occupies in the tree.</div><div class='del'>- *</div><div class='del'>- * Different roots are used for different purposes and may nest inside each</div><div class='del'>- * other and they require separate keysets.  As lockdep keys should be</div><div class='del'>- * static, assign keysets according to the purpose of the root as indicated</div><div class='del'>- * by btrfs_root-&gt;root_key.objectid.  This ensures that all special purpose</div><div class='del'>- * roots have separate keysets.</div><div class='del'>- *</div><div class='del'>- * Lock-nesting across peer nodes is always done with the immediate parent</div><div class='del'>- * node locked thus preventing deadlock.  As lockdep doesn't know this, use</div><div class='del'>- * subclass to avoid triggering lockdep warning in such cases.</div><div class='del'>- *</div><div class='del'>- * The key is set by the readpage_end_io_hook after the buffer has passed</div><div class='del'>- * csum validation but before the pages are unlocked.  It is also set by</div><div class='del'>- * btrfs_init_new_buffer on freshly allocated blocks.</div><div class='del'>- *</div><div class='del'>- * We also add a check to make sure the highest level of the tree is the</div><div class='del'>- * same as our lockdep setup here.  If BTRFS_MAX_LEVEL changes, this code</div><div class='del'>- * needs update as well.</div><div class='del'>- */</div><div class='del'>-#ifdef CONFIG_DEBUG_LOCK_ALLOC</div><div class='del'>-# if BTRFS_MAX_LEVEL != 8</div><div class='del'>-#  error</div><div class='del'>-# endif</div><div class='del'>-</div><div class='del'>-#define DEFINE_LEVEL(stem, level)					\</div><div class='del'>-	.names[level] = "btrfs-" stem "-0" #level,</div><div class='del'>-</div><div class='del'>-#define DEFINE_NAME(stem)						\</div><div class='del'>-	DEFINE_LEVEL(stem, 0)						\</div><div class='del'>-	DEFINE_LEVEL(stem, 1)						\</div><div class='del'>-	DEFINE_LEVEL(stem, 2)						\</div><div class='del'>-	DEFINE_LEVEL(stem, 3)						\</div><div class='del'>-	DEFINE_LEVEL(stem, 4)						\</div><div class='del'>-	DEFINE_LEVEL(stem, 5)						\</div><div class='del'>-	DEFINE_LEVEL(stem, 6)						\</div><div class='del'>-	DEFINE_LEVEL(stem, 7)</div><div class='del'>-</div><div class='del'>-static struct btrfs_lockdep_keyset {</div><div class='del'>-	u64			id;		/* root objectid */</div><div class='del'>-	/* Longest entry: btrfs-free-space-00 */</div><div class='del'>-	char			names[BTRFS_MAX_LEVEL][20];</div><div class='del'>-	struct lock_class_key	keys[BTRFS_MAX_LEVEL];</div><div class='del'>-} btrfs_lockdep_keysets[] = {</div><div class='del'>-	{ .id = BTRFS_ROOT_TREE_OBJECTID,	DEFINE_NAME("root")	},</div><div class='del'>-	{ .id = BTRFS_EXTENT_TREE_OBJECTID,	DEFINE_NAME("extent")	},</div><div class='del'>-	{ .id = BTRFS_CHUNK_TREE_OBJECTID,	DEFINE_NAME("chunk")	},</div><div class='del'>-	{ .id = BTRFS_DEV_TREE_OBJECTID,	DEFINE_NAME("dev")	},</div><div class='del'>-	{ .id = BTRFS_CSUM_TREE_OBJECTID,	DEFINE_NAME("csum")	},</div><div class='del'>-	{ .id = BTRFS_QUOTA_TREE_OBJECTID,	DEFINE_NAME("quota")	},</div><div class='del'>-	{ .id = BTRFS_TREE_LOG_OBJECTID,	DEFINE_NAME("log")	},</div><div class='del'>-	{ .id = BTRFS_TREE_RELOC_OBJECTID,	DEFINE_NAME("treloc")	},</div><div class='del'>-	{ .id = BTRFS_DATA_RELOC_TREE_OBJECTID,	DEFINE_NAME("dreloc")	},</div><div class='del'>-	{ .id = BTRFS_UUID_TREE_OBJECTID,	DEFINE_NAME("uuid")	},</div><div class='del'>-	{ .id = BTRFS_FREE_SPACE_TREE_OBJECTID,	DEFINE_NAME("free-space") },</div><div class='del'>-	{ .id = 0,				DEFINE_NAME("tree")	},</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-#undef DEFINE_LEVEL</div><div class='del'>-#undef DEFINE_NAME</div><div class='del'>-</div><div class='del'>-void btrfs_set_buffer_lockdep_class(u64 objectid, struct extent_buffer *eb,</div><div class='del'>-				    int level)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_lockdep_keyset *ks;</div><div class='del'>-</div><div class='del'>-	BUG_ON(level &gt;= ARRAY_SIZE(ks-&gt;keys));</div><div class='del'>-</div><div class='del'>-	/* find the matching keyset, id 0 is the default entry */</div><div class='del'>-	for (ks = btrfs_lockdep_keysets; ks-&gt;id; ks++)</div><div class='del'>-		if (ks-&gt;id == objectid)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-	lockdep_set_class_and_name(&amp;eb-&gt;lock,</div><div class='del'>-				   &amp;ks-&gt;keys[level], ks-&gt;names[level]);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * Compute the csum of a btree block and store the result to provided buffer.</div><div class='ctx'>  */</div><div class='ctx'> static void csum_tree_block(struct extent_buffer *buf, u8 *result)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = buf-&gt;fs_info;</div><div class='del'>-	const int num_pages = num_extent_pages(buf);</div><div class='del'>-	const int first_page_part = min_t(u32, PAGE_SIZE, fs_info-&gt;nodesize);</div><div class='add'>+	int num_pages;</div><div class='add'>+	u32 first_page_part;</div><div class='ctx'> 	SHASH_DESC_ON_STACK(shash, fs_info-&gt;csum_shash);</div><div class='ctx'> 	char *kaddr;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='ctx'> 	shash-&gt;tfm = fs_info-&gt;csum_shash;</div><div class='ctx'> 	crypto_shash_init(shash);</div><div class='del'>-	kaddr = page_address(buf-&gt;pages[0]) + offset_in_page(buf-&gt;start);</div><div class='add'>+</div><div class='add'>+	if (buf-&gt;addr) {</div><div class='add'>+		/* Pages are contiguous, handle them as a big one. */</div><div class='add'>+		kaddr = buf-&gt;addr;</div><div class='add'>+		first_page_part = fs_info-&gt;nodesize;</div><div class='add'>+		num_pages = 1;</div><div class='add'>+	} else {</div><div class='add'>+		kaddr = folio_address(buf-&gt;folios[0]);</div><div class='add'>+		first_page_part = min_t(u32, PAGE_SIZE, fs_info-&gt;nodesize);</div><div class='add'>+		num_pages = num_extent_pages(buf);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	crypto_shash_update(shash, kaddr + BTRFS_CSUM_SIZE,</div><div class='ctx'> 			    first_page_part - BTRFS_CSUM_SIZE);</div><div class='ctx'> </div><div class='del'>-	for (i = 1; i &lt; num_pages; i++) {</div><div class='del'>-		kaddr = page_address(buf-&gt;pages[i]);</div><div class='add'>+	/*</div><div class='add'>+	 * Multiple single-page folios case would reach here.</div><div class='add'>+	 *</div><div class='add'>+	 * nodesize &lt;= PAGE_SIZE and large folio all handled by above</div><div class='add'>+	 * crypto_shash_update() already.</div><div class='add'>+	 */</div><div class='add'>+	for (i = 1; i &lt; num_pages &amp;&amp; INLINE_EXTENT_BUFFER_PAGES &gt; 1; i++) {</div><div class='add'>+		kaddr = folio_address(buf-&gt;folios[i]);</div><div class='ctx'> 		crypto_shash_update(shash, kaddr, PAGE_SIZE);</div><div class='ctx'> 	}</div><div class='ctx'> 	memset(result, 0, BTRFS_CSUM_SIZE);</div><div class='hunk'>@@ -235,36 +117,27 @@ static void csum_tree_block(struct extent_buffer *buf, u8 *result)</div><div class='ctx'>  * detect blocks that either didn't get written at all or got written</div><div class='ctx'>  * in the wrong place.</div><div class='ctx'>  */</div><div class='del'>-static int verify_parent_transid(struct extent_io_tree *io_tree,</div><div class='del'>-				 struct extent_buffer *eb, u64 parent_transid,</div><div class='del'>-				 int atomic)</div><div class='add'>+int btrfs_buffer_uptodate(struct extent_buffer *eb, u64 parent_transid, bool atomic)</div><div class='ctx'> {</div><div class='del'>-	struct extent_state *cached_state = NULL;</div><div class='del'>-	int ret;</div><div class='add'>+	if (!extent_buffer_uptodate(eb))</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> 	if (!parent_transid || btrfs_header_generation(eb) == parent_transid)</div><div class='del'>-		return 0;</div><div class='add'>+		return 1;</div><div class='ctx'> </div><div class='ctx'> 	if (atomic)</div><div class='ctx'> 		return -EAGAIN;</div><div class='ctx'> </div><div class='del'>-	lock_extent_bits(io_tree, eb-&gt;start, eb-&gt;start + eb-&gt;len - 1,</div><div class='del'>-			 &amp;cached_state);</div><div class='del'>-	if (extent_buffer_uptodate(eb) &amp;&amp;</div><div class='del'>-	    btrfs_header_generation(eb) == parent_transid) {</div><div class='del'>-		ret = 0;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	btrfs_err_rl(eb-&gt;fs_info,</div><div class='del'>-		"parent transid verify failed on %llu wanted %llu found %llu",</div><div class='del'>-			eb-&gt;start,</div><div class='add'>+	if (!extent_buffer_uptodate(eb) ||</div><div class='add'>+	    btrfs_header_generation(eb) != parent_transid) {</div><div class='add'>+		btrfs_err_rl(eb-&gt;fs_info,</div><div class='add'>+"parent transid verify failed on logical %llu mirror %u wanted %llu found %llu",</div><div class='add'>+			eb-&gt;start, eb-&gt;read_mirror,</div><div class='ctx'> 			parent_transid, btrfs_header_generation(eb));</div><div class='del'>-	ret = 1;</div><div class='del'>-	clear_extent_buffer_uptodate(eb);</div><div class='del'>-out:</div><div class='del'>-	unlock_extent_cached(io_tree, eb-&gt;start, eb-&gt;start + eb-&gt;len - 1,</div><div class='del'>-			     &amp;cached_state);</div><div class='del'>-	return ret;</div><div class='add'>+		clear_extent_buffer_uptodate(eb);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+	return 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool btrfs_supported_super_csum(u16 csum_type)</div><div class='hunk'>@@ -284,11 +157,9 @@ static bool btrfs_supported_super_csum(u16 csum_type)</div><div class='ctx'>  * Return 0 if the superblock checksum type matches the checksum value of that</div><div class='ctx'>  * algorithm. Pass the raw disk superblock data.</div><div class='ctx'>  */</div><div class='del'>-static int btrfs_check_super_csum(struct btrfs_fs_info *fs_info,</div><div class='del'>-				  char *raw_disk_sb)</div><div class='add'>+int btrfs_check_super_csum(struct btrfs_fs_info *fs_info,</div><div class='add'>+			   const struct btrfs_super_block *disk_sb)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_super_block *disk_sb =</div><div class='del'>-		(struct btrfs_super_block *)raw_disk_sb;</div><div class='ctx'> 	char result[BTRFS_CSUM_SIZE];</div><div class='ctx'> 	SHASH_DESC_ON_STACK(shash, fs_info-&gt;csum_shash);</div><div class='ctx'> </div><div class='hunk'>@@ -299,7 +170,7 @@ static int btrfs_check_super_csum(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	 * BTRFS_SUPER_INFO_SIZE range, we expect that the unused space is</div><div class='ctx'> 	 * filled with zeros and is included in the checksum.</div><div class='ctx'> 	 */</div><div class='del'>-	crypto_shash_digest(shash, raw_disk_sb + BTRFS_CSUM_SIZE,</div><div class='add'>+	crypto_shash_digest(shash, (const u8 *)disk_sb + BTRFS_CSUM_SIZE,</div><div class='ctx'> 			    BTRFS_SUPER_INFO_SIZE - BTRFS_CSUM_SIZE, result);</div><div class='ctx'> </div><div class='ctx'> 	if (memcmp(disk_sb-&gt;csum, result, fs_info-&gt;csum_size))</div><div class='hunk'>@@ -308,61 +179,37 @@ static int btrfs_check_super_csum(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_verify_level_key(struct extent_buffer *eb, int level,</div><div class='del'>-			   struct btrfs_key *first_key, u64 parent_transid)</div><div class='add'>+static int btrfs_repair_eb_io_failure(const struct extent_buffer *eb,</div><div class='add'>+				      int mirror_num)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='del'>-	int found_level;</div><div class='del'>-	struct btrfs_key found_key;</div><div class='del'>-	int ret;</div><div class='add'>+	const u32 step = min(fs_info-&gt;nodesize, PAGE_SIZE);</div><div class='add'>+	const u32 nr_steps = eb-&gt;len / step;</div><div class='add'>+	phys_addr_t paddrs[BTRFS_MAX_BLOCKSIZE / PAGE_SIZE];</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	found_level = btrfs_header_level(eb);</div><div class='del'>-	if (found_level != level) {</div><div class='del'>-		WARN(IS_ENABLED(CONFIG_BTRFS_DEBUG),</div><div class='del'>-		     KERN_ERR "BTRFS: tree level check failed\n");</div><div class='del'>-		btrfs_err(fs_info,</div><div class='del'>-"tree level mismatch detected, bytenr=%llu level expected=%u has=%u",</div><div class='del'>-			  eb-&gt;start, level, found_level);</div><div class='del'>-		return -EIO;</div><div class='del'>-	}</div><div class='add'>+	if (sb_rdonly(fs_info-&gt;sb))</div><div class='add'>+		return -EROFS;</div><div class='ctx'> </div><div class='del'>-	if (!first_key)</div><div class='del'>-		return 0;</div><div class='add'>+	for (int i = 0; i &lt; num_extent_pages(eb); i++) {</div><div class='add'>+		struct folio *folio = eb-&gt;folios[i];</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * For live tree block (new tree blocks in current transaction),</div><div class='del'>-	 * we need proper lock context to avoid race, which is impossible here.</div><div class='del'>-	 * So we only checks tree blocks which is read from disk, whose</div><div class='del'>-	 * generation &lt;= fs_info-&gt;last_trans_committed.</div><div class='del'>-	 */</div><div class='del'>-	if (btrfs_header_generation(eb) &gt; fs_info-&gt;last_trans_committed)</div><div class='del'>-		return 0;</div><div class='add'>+		/* No large folio support yet. */</div><div class='add'>+		ASSERT(folio_order(folio) == 0);</div><div class='add'>+		ASSERT(i &lt; nr_steps);</div><div class='ctx'> </div><div class='del'>-	/* We have @first_key, so this @eb must have at least one item */</div><div class='del'>-	if (btrfs_header_nritems(eb) == 0) {</div><div class='del'>-		btrfs_err(fs_info,</div><div class='del'>-		"invalid tree nritems, bytenr=%llu nritems=0 expect &gt;0",</div><div class='del'>-			  eb-&gt;start);</div><div class='del'>-		WARN_ON(IS_ENABLED(CONFIG_BTRFS_DEBUG));</div><div class='del'>-		return -EUCLEAN;</div><div class='add'>+		/*</div><div class='add'>+		 * For nodesize &lt; page size, there is just one paddr, with some</div><div class='add'>+		 * offset inside the page.</div><div class='add'>+		 *</div><div class='add'>+		 * For nodesize &gt;= page size, it's one or more paddrs, and eb-&gt;start</div><div class='add'>+		 * must be aligned to page boundary.</div><div class='add'>+		 */</div><div class='add'>+		paddrs[i] = page_to_phys(&amp;folio-&gt;page) + offset_in_page(eb-&gt;start);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (found_level)</div><div class='del'>-		btrfs_node_key_to_cpu(eb, &amp;found_key, 0);</div><div class='del'>-	else</div><div class='del'>-		btrfs_item_key_to_cpu(eb, &amp;found_key, 0);</div><div class='del'>-	ret = btrfs_comp_cpu_keys(first_key, &amp;found_key);</div><div class='del'>-</div><div class='del'>-	if (ret) {</div><div class='del'>-		WARN(IS_ENABLED(CONFIG_BTRFS_DEBUG),</div><div class='del'>-		     KERN_ERR "BTRFS: tree first key check failed\n");</div><div class='del'>-		btrfs_err(fs_info,</div><div class='del'>-"tree first key mismatch detected, bytenr=%llu parent_transid=%llu key expected=(%llu,%u,%llu) has=(%llu,%u,%llu)",</div><div class='del'>-			  eb-&gt;start, parent_transid, first_key-&gt;objectid,</div><div class='del'>-			  first_key-&gt;type, first_key-&gt;offset,</div><div class='del'>-			  found_key.objectid, found_key.type,</div><div class='del'>-			  found_key.offset);</div><div class='del'>-	}</div><div class='add'>+	ret = btrfs_repair_io_failure(fs_info, 0, eb-&gt;start, eb-&gt;len, eb-&gt;start,</div><div class='add'>+				      paddrs, step, mirror_num);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -370,36 +217,25 @@ int btrfs_verify_level_key(struct extent_buffer *eb, int level,</div><div class='ctx'>  * helper to read a given tree block, doing retries as required when</div><div class='ctx'>  * the checksums don't match and we have alternate mirrors to try.</div><div class='ctx'>  *</div><div class='del'>- * @parent_transid:	expected transid, skip check if 0</div><div class='del'>- * @level:		expected level, mandatory check</div><div class='del'>- * @first_key:		expected key of first slot, skip check if NULL</div><div class='add'>+ * @check:		expected tree parentness check, see the comments of the</div><div class='add'>+ *			structure for details.</div><div class='ctx'>  */</div><div class='del'>-static int btree_read_extent_buffer_pages(struct extent_buffer *eb,</div><div class='del'>-					  u64 parent_transid, int level,</div><div class='del'>-					  struct btrfs_key *first_key)</div><div class='add'>+int btrfs_read_extent_buffer(struct extent_buffer *eb,</div><div class='add'>+			     const struct btrfs_tree_parent_check *check)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='del'>-	struct extent_io_tree *io_tree;</div><div class='ctx'> 	int failed = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int num_copies = 0;</div><div class='ctx'> 	int mirror_num = 0;</div><div class='ctx'> 	int failed_mirror = 0;</div><div class='ctx'> </div><div class='del'>-	io_tree = &amp;BTRFS_I(fs_info-&gt;btree_inode)-&gt;io_tree;</div><div class='add'>+	ASSERT(check);</div><div class='add'>+</div><div class='ctx'> 	while (1) {</div><div class='del'>-		clear_bit(EXTENT_BUFFER_CORRUPT, &amp;eb-&gt;bflags);</div><div class='del'>-		ret = read_extent_buffer_pages(eb, WAIT_COMPLETE, mirror_num);</div><div class='del'>-		if (!ret) {</div><div class='del'>-			if (verify_parent_transid(io_tree, eb,</div><div class='del'>-						   parent_transid, 0))</div><div class='del'>-				ret = -EIO;</div><div class='del'>-			else if (btrfs_verify_level_key(eb, level,</div><div class='del'>-						first_key, parent_transid))</div><div class='del'>-				ret = -EUCLEAN;</div><div class='del'>-			else</div><div class='del'>-				break;</div><div class='del'>-		}</div><div class='add'>+		ret = read_extent_buffer_pages(eb, mirror_num, check);</div><div class='add'>+		if (!ret)</div><div class='add'>+			break;</div><div class='ctx'> </div><div class='ctx'> 		num_copies = btrfs_num_copies(fs_info,</div><div class='ctx'> 					      eb-&gt;start, eb-&gt;len);</div><div class='hunk'>@@ -425,12 +261,39 @@ static int btree_read_extent_buffer_pages(struct extent_buffer *eb,</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int csum_one_extent_buffer(struct extent_buffer *eb)</div><div class='add'>+/*</div><div class='add'>+ * Checksum a dirty tree block before IO.</div><div class='add'>+ */</div><div class='add'>+int btree_csum_one_bio(struct btrfs_bio *bbio)</div><div class='ctx'> {</div><div class='add'>+	struct extent_buffer *eb = bbio-&gt;private;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='add'>+	u64 found_start = btrfs_header_bytenr(eb);</div><div class='add'>+	u64 last_trans;</div><div class='ctx'> 	u8 result[BTRFS_CSUM_SIZE];</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='add'>+	/* Btree blocks are always contiguous on disk. */</div><div class='add'>+	if (WARN_ON_ONCE(bbio-&gt;file_offset != eb-&gt;start))</div><div class='add'>+		return -EIO;</div><div class='add'>+	if (WARN_ON_ONCE(bbio-&gt;bio.bi_iter.bi_size != eb-&gt;len))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If an extent_buffer is marked as EXTENT_BUFFER_ZONED_ZEROOUT, don't</div><div class='add'>+	 * checksum it but zero-out its content. This is done to preserve</div><div class='add'>+	 * ordering of I/O without unnecessarily writing out data.</div><div class='add'>+	 */</div><div class='add'>+	if (test_bit(EXTENT_BUFFER_ZONED_ZEROOUT, &amp;eb-&gt;bflags)) {</div><div class='add'>+		memzero_extent_buffer(eb, 0, eb-&gt;len);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (WARN_ON_ONCE(found_start != eb-&gt;start))</div><div class='add'>+		return -EIO;</div><div class='add'>+	if (WARN_ON(!btrfs_meta_folio_test_uptodate(eb-&gt;folios[0], eb)))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='ctx'> 	ASSERT(memcmp_extent_buffer(eb, fs_info-&gt;fs_devices-&gt;metadata_uuid,</div><div class='ctx'> 				    offsetof(struct btrfs_header, fsid),</div><div class='ctx'> 				    BTRFS_FSID_SIZE) == 0);</div><div class='hunk'>@@ -439,129 +302,69 @@ static int csum_one_extent_buffer(struct extent_buffer *eb)</div><div class='ctx'> 	if (btrfs_header_level(eb))</div><div class='ctx'> 		ret = btrfs_check_node(eb);</div><div class='ctx'> 	else</div><div class='del'>-		ret = btrfs_check_leaf_full(eb);</div><div class='add'>+		ret = btrfs_check_leaf(eb);</div><div class='ctx'> </div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		btrfs_print_tree(eb, 0);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto error;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Also check the generation, the eb reached here must be newer than</div><div class='add'>+	 * last committed. Or something seriously wrong happened.</div><div class='add'>+	 */</div><div class='add'>+	last_trans = btrfs_get_last_trans_committed(fs_info);</div><div class='add'>+	if (unlikely(btrfs_header_generation(eb) &lt;= last_trans)) {</div><div class='add'>+		ret = -EUCLEAN;</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='del'>-			"block=%llu write time tree block corruption detected",</div><div class='del'>-			eb-&gt;start);</div><div class='del'>-		WARN_ON(IS_ENABLED(CONFIG_BTRFS_DEBUG));</div><div class='del'>-		return ret;</div><div class='add'>+			"block=%llu bad generation, have %llu expect &gt; %llu",</div><div class='add'>+			  eb-&gt;start, btrfs_header_generation(eb), last_trans);</div><div class='add'>+		goto error;</div><div class='ctx'> 	}</div><div class='ctx'> 	write_extent_buffer(eb, result, 0, fs_info-&gt;csum_size);</div><div class='del'>-</div><div class='ctx'> 	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* Checksum all dirty extent buffers in one bio_vec */</div><div class='del'>-static int csum_dirty_subpage_buffers(struct btrfs_fs_info *fs_info,</div><div class='del'>-				      struct bio_vec *bvec)</div><div class='del'>-{</div><div class='del'>-	struct page *page = bvec-&gt;bv_page;</div><div class='del'>-	u64 bvec_start = page_offset(page) + bvec-&gt;bv_offset;</div><div class='del'>-	u64 cur;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	for (cur = bvec_start; cur &lt; bvec_start + bvec-&gt;bv_len;</div><div class='del'>-	     cur += fs_info-&gt;nodesize) {</div><div class='del'>-		struct extent_buffer *eb;</div><div class='del'>-		bool uptodate;</div><div class='del'>-</div><div class='del'>-		eb = find_extent_buffer(fs_info, cur);</div><div class='del'>-		uptodate = btrfs_subpage_test_uptodate(fs_info, page, cur,</div><div class='del'>-						       fs_info-&gt;nodesize);</div><div class='del'>-</div><div class='del'>-		/* A dirty eb shouldn't disappear from buffer_radix */</div><div class='del'>-		if (WARN_ON(!eb))</div><div class='del'>-			return -EUCLEAN;</div><div class='del'>-</div><div class='del'>-		if (WARN_ON(cur != btrfs_header_bytenr(eb))) {</div><div class='del'>-			free_extent_buffer(eb);</div><div class='del'>-			return -EUCLEAN;</div><div class='del'>-		}</div><div class='del'>-		if (WARN_ON(!uptodate)) {</div><div class='del'>-			free_extent_buffer(eb);</div><div class='del'>-			return -EUCLEAN;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		ret = csum_one_extent_buffer(eb);</div><div class='del'>-		free_extent_buffer(eb);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			return ret;</div><div class='del'>-	}</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Checksum a dirty tree block before IO.  This has extra checks to make sure</div><div class='del'>- * we only fill in the checksum field in the first page of a multi-page block.</div><div class='del'>- * For subpage extent buffers we need bvec to also read the offset in the page.</div><div class='del'>- */</div><div class='del'>-static int csum_dirty_buffer(struct btrfs_fs_info *fs_info, struct bio_vec *bvec)</div><div class='del'>-{</div><div class='del'>-	struct page *page = bvec-&gt;bv_page;</div><div class='del'>-	u64 start = page_offset(page);</div><div class='del'>-	u64 found_start;</div><div class='del'>-	struct extent_buffer *eb;</div><div class='del'>-</div><div class='del'>-	if (fs_info-&gt;sectorsize &lt; PAGE_SIZE)</div><div class='del'>-		return csum_dirty_subpage_buffers(fs_info, bvec);</div><div class='del'>-</div><div class='del'>-	eb = (struct extent_buffer *)page-&gt;private;</div><div class='del'>-	if (page != eb-&gt;pages[0])</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	found_start = btrfs_header_bytenr(eb);</div><div class='del'>-</div><div class='del'>-	if (test_bit(EXTENT_BUFFER_NO_CHECK, &amp;eb-&gt;bflags)) {</div><div class='del'>-		WARN_ON(found_start != 0);</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='add'>+error:</div><div class='add'>+	btrfs_print_tree(eb, 0);</div><div class='add'>+	btrfs_err(fs_info, "block=%llu write time tree block corruption detected",</div><div class='add'>+		  eb-&gt;start);</div><div class='ctx'> 	/*</div><div class='del'>-	 * Please do not consolidate these warnings into a single if.</div><div class='del'>-	 * It is useful to know what went wrong.</div><div class='add'>+	 * Be noisy if this is an extent buffer from a log tree. We don't abort</div><div class='add'>+	 * a transaction in case there's a bad log tree extent buffer, we just</div><div class='add'>+	 * fallback to a transaction commit. Still we want to know when there is</div><div class='add'>+	 * a bad log tree extent buffer, as that may signal a bug somewhere.</div><div class='ctx'> 	 */</div><div class='del'>-	if (WARN_ON(found_start != start))</div><div class='del'>-		return -EUCLEAN;</div><div class='del'>-	if (WARN_ON(!PageUptodate(page)))</div><div class='del'>-		return -EUCLEAN;</div><div class='del'>-</div><div class='del'>-	return csum_one_extent_buffer(eb);</div><div class='add'>+	WARN_ON(IS_ENABLED(CONFIG_BTRFS_DEBUG) ||</div><div class='add'>+		btrfs_header_owner(eb) == BTRFS_TREE_LOG_OBJECTID);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int check_tree_block_fsid(struct extent_buffer *eb)</div><div class='add'>+static bool check_tree_block_fsid(struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_fs_devices *fs_devices = fs_info-&gt;fs_devices, *seed_devs;</div><div class='ctx'> 	u8 fsid[BTRFS_FSID_SIZE];</div><div class='del'>-	u8 *metadata_uuid;</div><div class='ctx'> </div><div class='ctx'> 	read_extent_buffer(eb, fsid, offsetof(struct btrfs_header, fsid),</div><div class='ctx'> 			   BTRFS_FSID_SIZE);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='del'>-	 * Checking the incompat flag is only valid for the current fs. For</div><div class='del'>-	 * seed devices it's forbidden to have their uuid changed so reading</div><div class='del'>-	 * -&gt;fsid in this case is fine</div><div class='add'>+	 * alloc_fsid_devices() copies the fsid into fs_devices::metadata_uuid.</div><div class='add'>+	 * This is then overwritten by metadata_uuid if it is present in the</div><div class='add'>+	 * device_list_add(). The same true for a seed device as well. So use of</div><div class='add'>+	 * fs_devices::metadata_uuid is appropriate here.</div><div class='ctx'> 	 */</div><div class='del'>-	if (btrfs_fs_incompat(fs_info, METADATA_UUID))</div><div class='del'>-		metadata_uuid = fs_devices-&gt;metadata_uuid;</div><div class='del'>-	else</div><div class='del'>-		metadata_uuid = fs_devices-&gt;fsid;</div><div class='del'>-</div><div class='del'>-	if (!memcmp(fsid, metadata_uuid, BTRFS_FSID_SIZE))</div><div class='del'>-		return 0;</div><div class='add'>+	if (memcmp(fsid, fs_info-&gt;fs_devices-&gt;metadata_uuid, BTRFS_FSID_SIZE) == 0)</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(seed_devs, &amp;fs_devices-&gt;seed_list, seed_list)</div><div class='ctx'> 		if (!memcmp(fsid, seed_devs-&gt;fsid, BTRFS_FSID_SIZE))</div><div class='del'>-			return 0;</div><div class='add'>+			return false;</div><div class='ctx'> </div><div class='del'>-	return 1;</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Do basic extent buffer checks at read time */</div><div class='del'>-static int validate_extent_buffer(struct extent_buffer *eb)</div><div class='add'>+int btrfs_validate_extent_buffer(struct extent_buffer *eb,</div><div class='add'>+				 const struct btrfs_tree_parent_check *check)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='ctx'> 	u64 found_start;</div><div class='hunk'>@@ -570,424 +373,143 @@ static int validate_extent_buffer(struct extent_buffer *eb)</div><div class='ctx'> 	u8 result[BTRFS_CSUM_SIZE];</div><div class='ctx'> 	const u8 *header_csum;</div><div class='ctx'> 	int ret = 0;</div><div class='add'>+	const bool ignore_csum = btrfs_test_opt(fs_info, IGNOREMETACSUMS);</div><div class='add'>+</div><div class='add'>+	ASSERT(check);</div><div class='ctx'> </div><div class='ctx'> 	found_start = btrfs_header_bytenr(eb);</div><div class='del'>-	if (found_start != eb-&gt;start) {</div><div class='del'>-		btrfs_err_rl(fs_info, "bad tree block start, want %llu have %llu",</div><div class='del'>-			     eb-&gt;start, found_start);</div><div class='add'>+	if (unlikely(found_start != eb-&gt;start)) {</div><div class='add'>+		btrfs_err_rl(fs_info,</div><div class='add'>+			"bad tree block start, mirror %u want %llu have %llu",</div><div class='add'>+			     eb-&gt;read_mirror, eb-&gt;start, found_start);</div><div class='ctx'> 		ret = -EIO;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (check_tree_block_fsid(eb)) {</div><div class='del'>-		btrfs_err_rl(fs_info, "bad fsid on block %llu",</div><div class='del'>-			     eb-&gt;start);</div><div class='add'>+	if (unlikely(check_tree_block_fsid(eb))) {</div><div class='add'>+		btrfs_err_rl(fs_info, "bad fsid on logical %llu mirror %u",</div><div class='add'>+			     eb-&gt;start, eb-&gt;read_mirror);</div><div class='ctx'> 		ret = -EIO;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	found_level = btrfs_header_level(eb);</div><div class='del'>-	if (found_level &gt;= BTRFS_MAX_LEVEL) {</div><div class='del'>-		btrfs_err(fs_info, "bad tree block level %d on %llu",</div><div class='del'>-			  (int)btrfs_header_level(eb), eb-&gt;start);</div><div class='add'>+	if (unlikely(found_level &gt;= BTRFS_MAX_LEVEL)) {</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+			"bad tree block level, mirror %u level %d on logical %llu",</div><div class='add'>+			eb-&gt;read_mirror, btrfs_header_level(eb), eb-&gt;start);</div><div class='ctx'> 		ret = -EIO;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	csum_tree_block(eb, result);</div><div class='del'>-	header_csum = page_address(eb-&gt;pages[0]) +</div><div class='del'>-		get_eb_offset_in_page(eb, offsetof(struct btrfs_header, csum));</div><div class='add'>+	header_csum = folio_address(eb-&gt;folios[0]) +</div><div class='add'>+		get_eb_offset_in_folio(eb, offsetof(struct btrfs_header, csum));</div><div class='ctx'> </div><div class='ctx'> 	if (memcmp(result, header_csum, csum_size) != 0) {</div><div class='ctx'> 		btrfs_warn_rl(fs_info,</div><div class='del'>-	"checksum verify failed on %llu wanted " CSUM_FMT " found " CSUM_FMT " level %d",</div><div class='del'>-			      eb-&gt;start,</div><div class='del'>-			      CSUM_FMT_VALUE(csum_size, header_csum),</div><div class='del'>-			      CSUM_FMT_VALUE(csum_size, result),</div><div class='del'>-			      btrfs_header_level(eb));</div><div class='del'>-		ret = -EUCLEAN;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If this is a leaf block and it is corrupt, set the corrupt bit so</div><div class='del'>-	 * that we don't try and read the other copies of this block, just</div><div class='del'>-	 * return -EIO.</div><div class='del'>-	 */</div><div class='del'>-	if (found_level == 0 &amp;&amp; btrfs_check_leaf_full(eb)) {</div><div class='del'>-		set_bit(EXTENT_BUFFER_CORRUPT, &amp;eb-&gt;bflags);</div><div class='del'>-		ret = -EIO;</div><div class='add'>+"checksum verify failed on logical %llu mirror %u wanted " BTRFS_CSUM_FMT " found " BTRFS_CSUM_FMT " level %d%s",</div><div class='add'>+			      eb-&gt;start, eb-&gt;read_mirror,</div><div class='add'>+			      BTRFS_CSUM_FMT_VALUE(csum_size, header_csum),</div><div class='add'>+			      BTRFS_CSUM_FMT_VALUE(csum_size, result),</div><div class='add'>+			      btrfs_header_level(eb),</div><div class='add'>+			      ignore_csum ? ", ignored" : "");</div><div class='add'>+		if (unlikely(!ignore_csum)) {</div><div class='add'>+			ret = -EUCLEAN;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (found_level &gt; 0 &amp;&amp; btrfs_check_node(eb))</div><div class='del'>-		ret = -EIO;</div><div class='del'>-</div><div class='del'>-	if (!ret)</div><div class='del'>-		set_extent_buffer_uptodate(eb);</div><div class='del'>-	else</div><div class='add'>+	if (unlikely(found_level != check-&gt;level)) {</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='del'>-			  "block=%llu read time tree block corruption detected",</div><div class='del'>-			  eb-&gt;start);</div><div class='del'>-out:</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int validate_subpage_buffer(struct page *page, u64 start, u64 end,</div><div class='del'>-				   int mirror)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(page-&gt;mapping-&gt;host-&gt;i_sb);</div><div class='del'>-	struct extent_buffer *eb;</div><div class='del'>-	bool reads_done;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * We don't allow bio merge for subpage metadata read, so we should</div><div class='del'>-	 * only get one eb for each endio hook.</div><div class='del'>-	 */</div><div class='del'>-	ASSERT(end == start + fs_info-&gt;nodesize - 1);</div><div class='del'>-	ASSERT(PagePrivate(page));</div><div class='del'>-</div><div class='del'>-	eb = find_extent_buffer(fs_info, start);</div><div class='del'>-	/*</div><div class='del'>-	 * When we are reading one tree block, eb must have been inserted into</div><div class='del'>-	 * the radix tree. If not, something is wrong.</div><div class='del'>-	 */</div><div class='del'>-	ASSERT(eb);</div><div class='del'>-</div><div class='del'>-	reads_done = atomic_dec_and_test(&amp;eb-&gt;io_pages);</div><div class='del'>-	/* Subpage read must finish in page read */</div><div class='del'>-	ASSERT(reads_done);</div><div class='del'>-</div><div class='del'>-	eb-&gt;read_mirror = mirror;</div><div class='del'>-	if (test_bit(EXTENT_BUFFER_READ_ERR, &amp;eb-&gt;bflags)) {</div><div class='add'>+		"level verify failed on logical %llu mirror %u wanted %u found %u",</div><div class='add'>+			  eb-&gt;start, eb-&gt;read_mirror, check-&gt;level, found_level);</div><div class='ctx'> 		ret = -EIO;</div><div class='del'>-		goto err;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	ret = validate_extent_buffer(eb);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto err;</div><div class='del'>-</div><div class='del'>-	if (test_and_clear_bit(EXTENT_BUFFER_READAHEAD, &amp;eb-&gt;bflags))</div><div class='del'>-		btree_readahead_hook(eb, ret);</div><div class='del'>-</div><div class='del'>-	set_extent_buffer_uptodate(eb);</div><div class='del'>-</div><div class='del'>-	free_extent_buffer(eb);</div><div class='del'>-	return ret;</div><div class='del'>-err:</div><div class='del'>-	/*</div><div class='del'>-	 * end_bio_extent_readpage decrements io_pages in case of error,</div><div class='del'>-	 * make sure it has something to decrement.</div><div class='del'>-	 */</div><div class='del'>-	atomic_inc(&amp;eb-&gt;io_pages);</div><div class='del'>-	clear_extent_buffer_uptodate(eb);</div><div class='del'>-	free_extent_buffer(eb);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int btrfs_validate_metadata_buffer(struct btrfs_bio *bbio,</div><div class='del'>-				   struct page *page, u64 start, u64 end,</div><div class='del'>-				   int mirror)</div><div class='del'>-{</div><div class='del'>-	struct extent_buffer *eb;</div><div class='del'>-	int ret = 0;</div><div class='del'>-	int reads_done;</div><div class='del'>-</div><div class='del'>-	ASSERT(page-&gt;private);</div><div class='del'>-</div><div class='del'>-	if (btrfs_sb(page-&gt;mapping-&gt;host-&gt;i_sb)-&gt;sectorsize &lt; PAGE_SIZE)</div><div class='del'>-		return validate_subpage_buffer(page, start, end, mirror);</div><div class='del'>-</div><div class='del'>-	eb = (struct extent_buffer *)page-&gt;private;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * The pending IO might have been the only thing that kept this buffer</div><div class='del'>-	 * in memory.  Make sure we have a ref for all this other checks</div><div class='del'>-	 */</div><div class='del'>-	atomic_inc(&amp;eb-&gt;refs);</div><div class='del'>-</div><div class='del'>-	reads_done = atomic_dec_and_test(&amp;eb-&gt;io_pages);</div><div class='del'>-	if (!reads_done)</div><div class='del'>-		goto err;</div><div class='del'>-</div><div class='del'>-	eb-&gt;read_mirror = mirror;</div><div class='del'>-	if (test_bit(EXTENT_BUFFER_READ_ERR, &amp;eb-&gt;bflags)) {</div><div class='add'>+	if (unlikely(check-&gt;transid &amp;&amp;</div><div class='add'>+		     btrfs_header_generation(eb) != check-&gt;transid)) {</div><div class='add'>+		btrfs_err_rl(eb-&gt;fs_info,</div><div class='add'>+"parent transid verify failed on logical %llu mirror %u wanted %llu found %llu",</div><div class='add'>+				eb-&gt;start, eb-&gt;read_mirror, check-&gt;transid,</div><div class='add'>+				btrfs_header_generation(eb));</div><div class='ctx'> 		ret = -EIO;</div><div class='del'>-		goto err;</div><div class='del'>-	}</div><div class='del'>-	ret = validate_extent_buffer(eb);</div><div class='del'>-err:</div><div class='del'>-	if (reads_done &amp;&amp;</div><div class='del'>-	    test_and_clear_bit(EXTENT_BUFFER_READAHEAD, &amp;eb-&gt;bflags))</div><div class='del'>-		btree_readahead_hook(eb, ret);</div><div class='del'>-</div><div class='del'>-	if (ret) {</div><div class='del'>-		/*</div><div class='del'>-		 * our io error hook is going to dec the io pages</div><div class='del'>-		 * again, we have to make sure it has something</div><div class='del'>-		 * to decrement</div><div class='del'>-		 */</div><div class='del'>-		atomic_inc(&amp;eb-&gt;io_pages);</div><div class='del'>-		clear_extent_buffer_uptodate(eb);</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	free_extent_buffer(eb);</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='add'>+	if (check-&gt;has_first_key) {</div><div class='add'>+		const struct btrfs_key *expect_key = &amp;check-&gt;first_key;</div><div class='add'>+		struct btrfs_key found_key;</div><div class='ctx'> </div><div class='del'>-static void end_workqueue_bio(struct bio *bio)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_end_io_wq *end_io_wq = bio-&gt;bi_private;</div><div class='del'>-	struct btrfs_fs_info *fs_info;</div><div class='del'>-	struct btrfs_workqueue *wq;</div><div class='del'>-</div><div class='del'>-	fs_info = end_io_wq-&gt;info;</div><div class='del'>-	end_io_wq-&gt;status = bio-&gt;bi_status;</div><div class='del'>-</div><div class='del'>-	if (btrfs_op(bio) == BTRFS_MAP_WRITE) {</div><div class='del'>-		if (end_io_wq-&gt;metadata == BTRFS_WQ_ENDIO_METADATA)</div><div class='del'>-			wq = fs_info-&gt;endio_meta_write_workers;</div><div class='del'>-		else if (end_io_wq-&gt;metadata == BTRFS_WQ_ENDIO_FREE_SPACE)</div><div class='del'>-			wq = fs_info-&gt;endio_freespace_worker;</div><div class='del'>-		else if (end_io_wq-&gt;metadata == BTRFS_WQ_ENDIO_RAID56)</div><div class='del'>-			wq = fs_info-&gt;endio_raid56_workers;</div><div class='del'>-		else</div><div class='del'>-			wq = fs_info-&gt;endio_write_workers;</div><div class='del'>-	} else {</div><div class='del'>-		if (end_io_wq-&gt;metadata == BTRFS_WQ_ENDIO_RAID56)</div><div class='del'>-			wq = fs_info-&gt;endio_raid56_workers;</div><div class='del'>-		else if (end_io_wq-&gt;metadata)</div><div class='del'>-			wq = fs_info-&gt;endio_meta_workers;</div><div class='add'>+		if (found_level)</div><div class='add'>+			btrfs_node_key_to_cpu(eb, &amp;found_key, 0);</div><div class='ctx'> 		else</div><div class='del'>-			wq = fs_info-&gt;endio_workers;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	btrfs_init_work(&amp;end_io_wq-&gt;work, end_workqueue_fn, NULL, NULL);</div><div class='del'>-	btrfs_queue_work(wq, &amp;end_io_wq-&gt;work);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-blk_status_t btrfs_bio_wq_end_io(struct btrfs_fs_info *info, struct bio *bio,</div><div class='del'>-			enum btrfs_wq_endio_type metadata)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_end_io_wq *end_io_wq;</div><div class='del'>-</div><div class='del'>-	end_io_wq = kmem_cache_alloc(btrfs_end_io_wq_cache, GFP_NOFS);</div><div class='del'>-	if (!end_io_wq)</div><div class='del'>-		return BLK_STS_RESOURCE;</div><div class='del'>-</div><div class='del'>-	end_io_wq-&gt;private = bio-&gt;bi_private;</div><div class='del'>-	end_io_wq-&gt;end_io = bio-&gt;bi_end_io;</div><div class='del'>-	end_io_wq-&gt;info = info;</div><div class='del'>-	end_io_wq-&gt;status = 0;</div><div class='del'>-	end_io_wq-&gt;bio = bio;</div><div class='del'>-	end_io_wq-&gt;metadata = metadata;</div><div class='del'>-</div><div class='del'>-	bio-&gt;bi_private = end_io_wq;</div><div class='del'>-	bio-&gt;bi_end_io = end_workqueue_bio;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void run_one_async_start(struct btrfs_work *work)</div><div class='del'>-{</div><div class='del'>-	struct async_submit_bio *async;</div><div class='del'>-	blk_status_t ret;</div><div class='del'>-</div><div class='del'>-	async = container_of(work, struct  async_submit_bio, work);</div><div class='del'>-	ret = async-&gt;submit_bio_start(async-&gt;inode, async-&gt;bio,</div><div class='del'>-				      async-&gt;dio_file_offset);</div><div class='del'>-	if (ret)</div><div class='del'>-		async-&gt;status = ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * In order to insert checksums into the metadata in large chunks, we wait</div><div class='del'>- * until bio submission time.   All the pages in the bio are checksummed and</div><div class='del'>- * sums are attached onto the ordered extent record.</div><div class='del'>- *</div><div class='del'>- * At IO completion time the csums attached on the ordered extent record are</div><div class='del'>- * inserted into the tree.</div><div class='del'>- */</div><div class='del'>-static void run_one_async_done(struct btrfs_work *work)</div><div class='del'>-{</div><div class='del'>-	struct async_submit_bio *async;</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	blk_status_t ret;</div><div class='del'>-</div><div class='del'>-	async = container_of(work, struct  async_submit_bio, work);</div><div class='del'>-	inode = async-&gt;inode;</div><div class='del'>-</div><div class='del'>-	/* If an error occurred we just want to clean up the bio and move on */</div><div class='del'>-	if (async-&gt;status) {</div><div class='del'>-		async-&gt;bio-&gt;bi_status = async-&gt;status;</div><div class='del'>-		bio_endio(async-&gt;bio);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * All of the bios that pass through here are from async helpers.</div><div class='del'>-	 * Use REQ_CGROUP_PUNT to issue them from the owning cgroup's context.</div><div class='del'>-	 * This changes nothing when cgroups aren't in use.</div><div class='del'>-	 */</div><div class='del'>-	async-&gt;bio-&gt;bi_opf |= REQ_CGROUP_PUNT;</div><div class='del'>-	ret = btrfs_map_bio(btrfs_sb(inode-&gt;i_sb), async-&gt;bio, async-&gt;mirror_num);</div><div class='del'>-	if (ret) {</div><div class='del'>-		async-&gt;bio-&gt;bi_status = ret;</div><div class='del'>-		bio_endio(async-&gt;bio);</div><div class='add'>+			btrfs_item_key_to_cpu(eb, &amp;found_key, 0);</div><div class='add'>+		if (unlikely(btrfs_comp_cpu_keys(expect_key, &amp;found_key))) {</div><div class='add'>+			btrfs_err(fs_info,</div><div class='add'>+"tree first key mismatch detected, bytenr=%llu parent_transid=%llu key expected=(%llu,%u,%llu) has=(%llu,%u,%llu)",</div><div class='add'>+				  eb-&gt;start, check-&gt;transid,</div><div class='add'>+				  expect_key-&gt;objectid,</div><div class='add'>+				  expect_key-&gt;type, expect_key-&gt;offset,</div><div class='add'>+				  found_key.objectid, found_key.type,</div><div class='add'>+				  found_key.offset);</div><div class='add'>+			ret = -EUCLEAN;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void run_one_async_free(struct btrfs_work *work)</div><div class='del'>-{</div><div class='del'>-	struct async_submit_bio *async;</div><div class='del'>-</div><div class='del'>-	async = container_of(work, struct  async_submit_bio, work);</div><div class='del'>-	kfree(async);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-blk_status_t btrfs_wq_submit_bio(struct inode *inode, struct bio *bio,</div><div class='del'>-				 int mirror_num, unsigned long bio_flags,</div><div class='del'>-				 u64 dio_file_offset,</div><div class='del'>-				 extent_submit_bio_start_t *submit_bio_start)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = BTRFS_I(inode)-&gt;root-&gt;fs_info;</div><div class='del'>-	struct async_submit_bio *async;</div><div class='del'>-</div><div class='del'>-	async = kmalloc(sizeof(*async), GFP_NOFS);</div><div class='del'>-	if (!async)</div><div class='del'>-		return BLK_STS_RESOURCE;</div><div class='del'>-</div><div class='del'>-	async-&gt;inode = inode;</div><div class='del'>-	async-&gt;bio = bio;</div><div class='del'>-	async-&gt;mirror_num = mirror_num;</div><div class='del'>-	async-&gt;submit_bio_start = submit_bio_start;</div><div class='del'>-</div><div class='del'>-	btrfs_init_work(&amp;async-&gt;work, run_one_async_start, run_one_async_done,</div><div class='del'>-			run_one_async_free);</div><div class='del'>-</div><div class='del'>-	async-&gt;dio_file_offset = dio_file_offset;</div><div class='del'>-</div><div class='del'>-	async-&gt;status = 0;</div><div class='del'>-</div><div class='del'>-	if (op_is_sync(bio-&gt;bi_opf))</div><div class='del'>-		btrfs_set_work_high_priority(&amp;async-&gt;work);</div><div class='del'>-</div><div class='del'>-	btrfs_queue_work(fs_info-&gt;workers, &amp;async-&gt;work);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static blk_status_t btree_csum_one_bio(struct bio *bio)</div><div class='del'>-{</div><div class='del'>-	struct bio_vec *bvec;</div><div class='del'>-	struct btrfs_root *root;</div><div class='del'>-	int ret = 0;</div><div class='del'>-	struct bvec_iter_all iter_all;</div><div class='del'>-</div><div class='del'>-	ASSERT(!bio_flagged(bio, BIO_CLONED));</div><div class='del'>-	bio_for_each_segment_all(bvec, bio, iter_all) {</div><div class='del'>-		root = BTRFS_I(bvec-&gt;bv_page-&gt;mapping-&gt;host)-&gt;root;</div><div class='del'>-		ret = csum_dirty_buffer(root-&gt;fs_info, bvec);</div><div class='del'>-		if (ret)</div><div class='del'>-			break;</div><div class='add'>+	if (check-&gt;owner_root) {</div><div class='add'>+		ret = btrfs_check_eb_owner(eb, check-&gt;owner_root);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return errno_to_blk_status(ret);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static blk_status_t btree_submit_bio_start(struct inode *inode, struct bio *bio,</div><div class='del'>-					   u64 dio_file_offset)</div><div class='del'>-{</div><div class='del'>-	/*</div><div class='del'>-	 * when we're called for a write, we're already in the async</div><div class='del'>-	 * submission context.  Just jump into btrfs_map_bio</div><div class='del'>-	 */</div><div class='del'>-	return btree_csum_one_bio(bio);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool should_async_write(struct btrfs_fs_info *fs_info,</div><div class='del'>-			     struct btrfs_inode *bi)</div><div class='del'>-{</div><div class='del'>-	if (btrfs_is_zoned(fs_info))</div><div class='del'>-		return false;</div><div class='del'>-	if (atomic_read(&amp;bi-&gt;sync_writers))</div><div class='del'>-		return false;</div><div class='del'>-	if (test_bit(BTRFS_FS_CSUM_IMPL_FAST, &amp;fs_info-&gt;flags))</div><div class='del'>-		return false;</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-blk_status_t btrfs_submit_metadata_bio(struct inode *inode, struct bio *bio,</div><div class='del'>-				       int mirror_num, unsigned long bio_flags)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	blk_status_t ret;</div><div class='add'>+	/* If this is a leaf block and it is corrupt, just return -EIO. */</div><div class='add'>+	if (found_level == 0 &amp;&amp; btrfs_check_leaf(eb))</div><div class='add'>+		ret = -EIO;</div><div class='ctx'> </div><div class='del'>-	if (btrfs_op(bio) != BTRFS_MAP_WRITE) {</div><div class='del'>-		/*</div><div class='del'>-		 * called for a read, do the setup so that checksum validation</div><div class='del'>-		 * can happen in the async kernel threads</div><div class='del'>-		 */</div><div class='del'>-		ret = btrfs_bio_wq_end_io(fs_info, bio,</div><div class='del'>-					  BTRFS_WQ_ENDIO_METADATA);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto out_w_error;</div><div class='del'>-		ret = btrfs_map_bio(fs_info, bio, mirror_num);</div><div class='del'>-	} else if (!should_async_write(fs_info, BTRFS_I(inode))) {</div><div class='del'>-		ret = btree_csum_one_bio(bio);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto out_w_error;</div><div class='del'>-		ret = btrfs_map_bio(fs_info, bio, mirror_num);</div><div class='del'>-	} else {</div><div class='del'>-		/*</div><div class='del'>-		 * kthread helpers are used to submit writes so that</div><div class='del'>-		 * checksumming can happen in parallel across all CPUs</div><div class='del'>-		 */</div><div class='del'>-		ret = btrfs_wq_submit_bio(inode, bio, mirror_num, 0,</div><div class='del'>-					  0, btree_submit_bio_start);</div><div class='del'>-	}</div><div class='add'>+	if (found_level &gt; 0 &amp;&amp; btrfs_check_node(eb))</div><div class='add'>+		ret = -EIO;</div><div class='ctx'> </div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out_w_error;</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-out_w_error:</div><div class='del'>-	bio-&gt;bi_status = ret;</div><div class='del'>-	bio_endio(bio);</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+		"read time tree block corruption detected on logical %llu mirror %u",</div><div class='add'>+			  eb-&gt;start, eb-&gt;read_mirror);</div><div class='add'>+out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_MIGRATION</div><div class='del'>-static int btree_migratepage(struct address_space *mapping,</div><div class='del'>-			struct page *newpage, struct page *page,</div><div class='del'>-			enum migrate_mode mode)</div><div class='add'>+static int btree_migrate_folio(struct address_space *mapping,</div><div class='add'>+		struct folio *dst, struct folio *src, enum migrate_mode mode)</div><div class='ctx'> {</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * we can't safely write a btree page from here,</div><div class='ctx'> 	 * we haven't done the locking hook</div><div class='ctx'> 	 */</div><div class='del'>-	if (PageDirty(page))</div><div class='add'>+	if (folio_test_dirty(src))</div><div class='ctx'> 		return -EAGAIN;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Buffers may be managed in a filesystem specific way.</div><div class='ctx'> 	 * We must have no buffers or drop them.</div><div class='ctx'> 	 */</div><div class='del'>-	if (page_has_private(page) &amp;&amp;</div><div class='del'>-	    !try_to_release_page(page, GFP_KERNEL))</div><div class='add'>+	if (folio_get_private(src) &amp;&amp;</div><div class='add'>+	    !filemap_release_folio(src, GFP_KERNEL))</div><div class='ctx'> 		return -EAGAIN;</div><div class='del'>-	return migrate_page(mapping, newpage, page, mode);</div><div class='add'>+	return migrate_folio(mapping, dst, src, mode);</div><div class='ctx'> }</div><div class='add'>+#else</div><div class='add'>+#define btree_migrate_folio NULL</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-</div><div class='ctx'> static int btree_writepages(struct address_space *mapping,</div><div class='ctx'> 			    struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (wbc-&gt;sync_mode == WB_SYNC_NONE) {</div><div class='add'>+		struct btrfs_fs_info *fs_info;</div><div class='ctx'> </div><div class='ctx'> 		if (wbc-&gt;for_kupdate)</div><div class='ctx'> 			return 0;</div><div class='ctx'> </div><div class='del'>-		fs_info = BTRFS_I(mapping-&gt;host)-&gt;root-&gt;fs_info;</div><div class='add'>+		fs_info = inode_to_fs_info(mapping-&gt;host);</div><div class='ctx'> 		/* this is a bit racy, but that's ok */</div><div class='ctx'> 		ret = __percpu_counter_compare(&amp;fs_info-&gt;dirty_metadata_bytes,</div><div class='ctx'> 					     BTRFS_DIRTY_METADATA_THRESH,</div><div class='hunk'>@@ -998,60 +520,62 @@ static int btree_writepages(struct address_space *mapping,</div><div class='ctx'> 	return btree_write_cache_pages(mapping, wbc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btree_releasepage(struct page *page, gfp_t gfp_flags)</div><div class='add'>+static bool btree_release_folio(struct folio *folio, gfp_t gfp_flags)</div><div class='ctx'> {</div><div class='del'>-	if (PageWriteback(page) || PageDirty(page))</div><div class='del'>-		return 0;</div><div class='add'>+	if (folio_test_writeback(folio) || folio_test_dirty(folio))</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-	return try_release_extent_buffer(page);</div><div class='add'>+	return try_release_extent_buffer(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void btree_invalidatepage(struct page *page, unsigned int offset,</div><div class='del'>-				 unsigned int length)</div><div class='add'>+static void btree_invalidate_folio(struct folio *folio, size_t offset,</div><div class='add'>+				 size_t length)</div><div class='ctx'> {</div><div class='ctx'> 	struct extent_io_tree *tree;</div><div class='del'>-	tree = &amp;BTRFS_I(page-&gt;mapping-&gt;host)-&gt;io_tree;</div><div class='del'>-	extent_invalidatepage(tree, page, offset);</div><div class='del'>-	btree_releasepage(page, GFP_NOFS);</div><div class='del'>-	if (PagePrivate(page)) {</div><div class='del'>-		btrfs_warn(BTRFS_I(page-&gt;mapping-&gt;host)-&gt;root-&gt;fs_info,</div><div class='del'>-			   "page private not zero on page %llu",</div><div class='del'>-			   (unsigned long long)page_offset(page));</div><div class='del'>-		detach_page_private(page);</div><div class='add'>+</div><div class='add'>+	tree = &amp;folio_to_inode(folio)-&gt;io_tree;</div><div class='add'>+	extent_invalidate_folio(tree, folio, offset);</div><div class='add'>+	btree_release_folio(folio, GFP_NOFS);</div><div class='add'>+	if (folio_get_private(folio)) {</div><div class='add'>+		btrfs_warn(folio_to_fs_info(folio),</div><div class='add'>+			   "folio private not zero on folio %llu",</div><div class='add'>+			   (unsigned long long)folio_pos(folio));</div><div class='add'>+		folio_detach_private(folio);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btree_set_page_dirty(struct page *page)</div><div class='del'>-{</div><div class='ctx'> #ifdef DEBUG</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(page-&gt;mapping-&gt;host-&gt;i_sb);</div><div class='add'>+static bool btree_dirty_folio(struct address_space *mapping,</div><div class='add'>+		struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(mapping-&gt;host);</div><div class='add'>+	struct btrfs_subpage_info *spi = fs_info-&gt;subpage_info;</div><div class='ctx'> 	struct btrfs_subpage *subpage;</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='ctx'> 	int cur_bit = 0;</div><div class='del'>-	u64 page_start = page_offset(page);</div><div class='add'>+	u64 page_start = folio_pos(folio);</div><div class='ctx'> </div><div class='ctx'> 	if (fs_info-&gt;sectorsize == PAGE_SIZE) {</div><div class='del'>-		BUG_ON(!PagePrivate(page));</div><div class='del'>-		eb = (struct extent_buffer *)page-&gt;private;</div><div class='add'>+		eb = folio_get_private(folio);</div><div class='ctx'> 		BUG_ON(!eb);</div><div class='ctx'> 		BUG_ON(!test_bit(EXTENT_BUFFER_DIRTY, &amp;eb-&gt;bflags));</div><div class='ctx'> 		BUG_ON(!atomic_read(&amp;eb-&gt;refs));</div><div class='ctx'> 		btrfs_assert_tree_write_locked(eb);</div><div class='del'>-		return __set_page_dirty_nobuffers(page);</div><div class='add'>+		return filemap_dirty_folio(mapping, folio);</div><div class='ctx'> 	}</div><div class='del'>-	ASSERT(PagePrivate(page) &amp;&amp; page-&gt;private);</div><div class='del'>-	subpage = (struct btrfs_subpage *)page-&gt;private;</div><div class='ctx'> </div><div class='del'>-	ASSERT(subpage-&gt;dirty_bitmap);</div><div class='del'>-	while (cur_bit &lt; BTRFS_SUBPAGE_BITMAP_SIZE) {</div><div class='add'>+	ASSERT(spi);</div><div class='add'>+	subpage = folio_get_private(folio);</div><div class='add'>+</div><div class='add'>+	for (cur_bit = spi-&gt;dirty_offset;</div><div class='add'>+	     cur_bit &lt; spi-&gt;dirty_offset + spi-&gt;bitmap_nr_bits;</div><div class='add'>+	     cur_bit++) {</div><div class='ctx'> 		unsigned long flags;</div><div class='ctx'> 		u64 cur;</div><div class='del'>-		u16 tmp = (1 &lt;&lt; cur_bit);</div><div class='ctx'> </div><div class='ctx'> 		spin_lock_irqsave(&amp;subpage-&gt;lock, flags);</div><div class='del'>-		if (!(tmp &amp; subpage-&gt;dirty_bitmap)) {</div><div class='add'>+		if (!test_bit(cur_bit, subpage-&gt;bitmaps)) {</div><div class='ctx'> 			spin_unlock_irqrestore(&amp;subpage-&gt;lock, flags);</div><div class='del'>-			cur_bit++;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> 		spin_unlock_irqrestore(&amp;subpage-&gt;lock, flags);</div><div class='hunk'>@@ -1064,20 +588,20 @@ static int btree_set_page_dirty(struct page *page)</div><div class='ctx'> 		btrfs_assert_tree_write_locked(eb);</div><div class='ctx'> 		free_extent_buffer(eb);</div><div class='ctx'> </div><div class='del'>-		cur_bit += (fs_info-&gt;nodesize &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+		cur_bit += (fs_info-&gt;nodesize &gt;&gt; fs_info-&gt;sectorsize_bits) - 1;</div><div class='ctx'> 	}</div><div class='del'>-#endif</div><div class='del'>-	return __set_page_dirty_nobuffers(page);</div><div class='add'>+	return filemap_dirty_folio(mapping, folio);</div><div class='ctx'> }</div><div class='add'>+#else</div><div class='add'>+#define btree_dirty_folio filemap_dirty_folio</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='ctx'> static const struct address_space_operations btree_aops = {</div><div class='ctx'> 	.writepages	= btree_writepages,</div><div class='del'>-	.releasepage	= btree_releasepage,</div><div class='del'>-	.invalidatepage = btree_invalidatepage,</div><div class='del'>-#ifdef CONFIG_MIGRATION</div><div class='del'>-	.migratepage	= btree_migratepage,</div><div class='del'>-#endif</div><div class='del'>-	.set_page_dirty = btree_set_page_dirty,</div><div class='add'>+	.release_folio	= btree_release_folio,</div><div class='add'>+	.invalidate_folio = btree_invalidate_folio,</div><div class='add'>+	.migrate_folio	= btree_migrate_folio,</div><div class='add'>+	.dirty_folio	= btree_dirty_folio,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct extent_buffer *btrfs_find_create_tree_block(</div><div class='hunk'>@@ -1094,24 +618,23 @@ struct extent_buffer *btrfs_find_create_tree_block(</div><div class='ctx'>  * Read tree block at logical address @bytenr and do variant basic but critical</div><div class='ctx'>  * verification.</div><div class='ctx'>  *</div><div class='del'>- * @owner_root:		the objectid of the root owner for this block.</div><div class='del'>- * @parent_transid:	expected transid of this tree block, skip check if 0</div><div class='del'>- * @level:		expected level, mandatory check</div><div class='del'>- * @first_key:		expected key in slot 0, skip check if NULL</div><div class='add'>+ * @check:		expected tree parentness check, see comments of the</div><div class='add'>+ *			structure for details.</div><div class='ctx'>  */</div><div class='ctx'> struct extent_buffer *read_tree_block(struct btrfs_fs_info *fs_info, u64 bytenr,</div><div class='del'>-				      u64 owner_root, u64 parent_transid,</div><div class='del'>-				      int level, struct btrfs_key *first_key)</div><div class='add'>+				      struct btrfs_tree_parent_check *check)</div><div class='ctx'> {</div><div class='ctx'> 	struct extent_buffer *buf = NULL;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	buf = btrfs_find_create_tree_block(fs_info, bytenr, owner_root, level);</div><div class='add'>+	ASSERT(check);</div><div class='add'>+</div><div class='add'>+	buf = btrfs_find_create_tree_block(fs_info, bytenr, check-&gt;owner_root,</div><div class='add'>+					   check-&gt;level);</div><div class='ctx'> 	if (IS_ERR(buf))</div><div class='ctx'> 		return buf;</div><div class='ctx'> </div><div class='del'>-	ret = btree_read_extent_buffer_pages(buf, parent_transid,</div><div class='del'>-					     level, first_key);</div><div class='add'>+	ret = btrfs_read_extent_buffer(buf, check);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		free_extent_buffer_stale(buf);</div><div class='ctx'> 		return ERR_PTR(ret);</div><div class='hunk'>@@ -1120,39 +643,23 @@ struct extent_buffer *read_tree_block(struct btrfs_fs_info *fs_info, u64 bytenr,</div><div class='ctx'> </div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_clean_tree_block(struct extent_buffer *buf)</div><div class='add'>+static struct btrfs_root *btrfs_alloc_root(struct btrfs_fs_info *fs_info,</div><div class='add'>+					   u64 objectid, gfp_t flags)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = buf-&gt;fs_info;</div><div class='del'>-	if (btrfs_header_generation(buf) ==</div><div class='del'>-	    fs_info-&gt;running_transaction-&gt;transid) {</div><div class='del'>-		btrfs_assert_tree_write_locked(buf);</div><div class='del'>-</div><div class='del'>-		if (test_and_clear_bit(EXTENT_BUFFER_DIRTY, &amp;buf-&gt;bflags)) {</div><div class='del'>-			percpu_counter_add_batch(&amp;fs_info-&gt;dirty_metadata_bytes,</div><div class='del'>-						 -buf-&gt;len,</div><div class='del'>-						 fs_info-&gt;dirty_metadata_batch);</div><div class='del'>-			clear_extent_buffer_dirty(buf);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-}</div><div class='add'>+	struct btrfs_root *root;</div><div class='add'>+</div><div class='add'>+	root = kzalloc(sizeof(*root), flags);</div><div class='add'>+	if (!root)</div><div class='add'>+		return NULL;</div><div class='ctx'> </div><div class='del'>-static void __setup_root(struct btrfs_root *root, struct btrfs_fs_info *fs_info,</div><div class='del'>-			 u64 objectid)</div><div class='del'>-{</div><div class='del'>-	bool dummy = test_bit(BTRFS_FS_STATE_DUMMY_FS_INFO, &amp;fs_info-&gt;fs_state);</div><div class='ctx'> 	root-&gt;fs_info = fs_info;</div><div class='del'>-	root-&gt;node = NULL;</div><div class='del'>-	root-&gt;commit_root = NULL;</div><div class='del'>-	root-&gt;state = 0;</div><div class='del'>-	root-&gt;orphan_cleanup_state = 0;</div><div class='del'>-</div><div class='del'>-	root-&gt;last_trans = 0;</div><div class='del'>-	root-&gt;free_objectid = 0;</div><div class='del'>-	root-&gt;nr_delalloc_inodes = 0;</div><div class='del'>-	root-&gt;nr_ordered_extents = 0;</div><div class='del'>-	root-&gt;inode_tree = RB_ROOT;</div><div class='del'>-	INIT_RADIX_TREE(&amp;root-&gt;delayed_nodes_tree, GFP_ATOMIC);</div><div class='del'>-	root-&gt;block_rsv = NULL;</div><div class='add'>+	root-&gt;root_key.objectid = objectid;</div><div class='add'>+	RB_CLEAR_NODE(&amp;root-&gt;rb_node);</div><div class='add'>+</div><div class='add'>+	xa_init(&amp;root-&gt;inodes);</div><div class='add'>+	xa_init(&amp;root-&gt;delayed_nodes);</div><div class='add'>+</div><div class='add'>+	btrfs_init_root_block_rsv(root);</div><div class='ctx'> </div><div class='ctx'> 	INIT_LIST_HEAD(&amp;root-&gt;dirty_list);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;root-&gt;root_list);</div><div class='hunk'>@@ -1161,14 +668,9 @@ static void __setup_root(struct btrfs_root *root, struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;root-&gt;ordered_extents);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;root-&gt;ordered_root);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;root-&gt;reloc_dirty_list);</div><div class='del'>-	INIT_LIST_HEAD(&amp;root-&gt;logged_list[0]);</div><div class='del'>-	INIT_LIST_HEAD(&amp;root-&gt;logged_list[1]);</div><div class='del'>-	spin_lock_init(&amp;root-&gt;inode_lock);</div><div class='ctx'> 	spin_lock_init(&amp;root-&gt;delalloc_lock);</div><div class='ctx'> 	spin_lock_init(&amp;root-&gt;ordered_extent_lock);</div><div class='ctx'> 	spin_lock_init(&amp;root-&gt;accounting_lock);</div><div class='del'>-	spin_lock_init(&amp;root-&gt;log_extents_lock[0]);</div><div class='del'>-	spin_lock_init(&amp;root-&gt;log_extents_lock[1]);</div><div class='ctx'> 	spin_lock_init(&amp;root-&gt;qgroup_meta_rsv_lock);</div><div class='ctx'> 	mutex_init(&amp;root-&gt;objectid_mutex);</div><div class='ctx'> 	mutex_init(&amp;root-&gt;log_mutex);</div><div class='hunk'>@@ -1187,22 +689,14 @@ static void __setup_root(struct btrfs_root *root, struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	refcount_set(&amp;root-&gt;refs, 1);</div><div class='ctx'> 	atomic_set(&amp;root-&gt;snapshot_force_cow, 0);</div><div class='ctx'> 	atomic_set(&amp;root-&gt;nr_swapfiles, 0);</div><div class='del'>-	root-&gt;log_transid = 0;</div><div class='ctx'> 	root-&gt;log_transid_committed = -1;</div><div class='del'>-	root-&gt;last_log_commit = 0;</div><div class='del'>-	if (!dummy) {</div><div class='del'>-		extent_io_tree_init(fs_info, &amp;root-&gt;dirty_log_pages,</div><div class='del'>-				    IO_TREE_ROOT_DIRTY_LOG_PAGES, NULL);</div><div class='del'>-		extent_io_tree_init(fs_info, &amp;root-&gt;log_csum_range,</div><div class='del'>-				    IO_TREE_LOG_CSUM_RANGE, NULL);</div><div class='add'>+	if (!btrfs_is_testing(fs_info)) {</div><div class='add'>+		btrfs_extent_io_tree_init(fs_info, &amp;root-&gt;dirty_log_pages,</div><div class='add'>+					  IO_TREE_ROOT_DIRTY_LOG_PAGES);</div><div class='add'>+		btrfs_extent_io_tree_init(fs_info, &amp;root-&gt;log_csum_range,</div><div class='add'>+					  IO_TREE_LOG_CSUM_RANGE);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	memset(&amp;root-&gt;root_key, 0, sizeof(root-&gt;root_key));</div><div class='del'>-	memset(&amp;root-&gt;root_item, 0, sizeof(root-&gt;root_item));</div><div class='del'>-	memset(&amp;root-&gt;defrag_progress, 0, sizeof(root-&gt;defrag_progress));</div><div class='del'>-	root-&gt;root_key.objectid = objectid;</div><div class='del'>-	root-&gt;anon_dev = 0;</div><div class='del'>-</div><div class='ctx'> 	spin_lock_init(&amp;root-&gt;root_item_lock);</div><div class='ctx'> 	btrfs_qgroup_init_swapped_blocks(&amp;root-&gt;swapped_blocks);</div><div class='ctx'> #ifdef CONFIG_BTRFS_DEBUG</div><div class='hunk'>@@ -1211,14 +705,7 @@ static void __setup_root(struct btrfs_root *root, struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	list_add_tail(&amp;root-&gt;leak_list, &amp;fs_info-&gt;allocated_roots);</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;fs_roots_radix_lock);</div><div class='ctx'> #endif</div><div class='del'>-}</div><div class='ctx'> </div><div class='del'>-static struct btrfs_root *btrfs_alloc_root(struct btrfs_fs_info *fs_info,</div><div class='del'>-					   u64 objectid, gfp_t flags)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_root *root = kzalloc(sizeof(*root), flags);</div><div class='del'>-	if (root)</div><div class='del'>-		__setup_root(root, fs_info, objectid);</div><div class='ctx'> 	return root;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1242,6 +729,107 @@ struct btrfs_root *btrfs_alloc_dummy_root(struct btrfs_fs_info *fs_info)</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='add'>+static int global_root_cmp(struct rb_node *a_node, const struct rb_node *b_node)</div><div class='add'>+{</div><div class='add'>+	const struct btrfs_root *a = rb_entry(a_node, struct btrfs_root, rb_node);</div><div class='add'>+	const struct btrfs_root *b = rb_entry(b_node, struct btrfs_root, rb_node);</div><div class='add'>+</div><div class='add'>+	return btrfs_comp_cpu_keys(&amp;a-&gt;root_key, &amp;b-&gt;root_key);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int global_root_key_cmp(const void *k, const struct rb_node *node)</div><div class='add'>+{</div><div class='add'>+	const struct btrfs_key *key = k;</div><div class='add'>+	const struct btrfs_root *root = rb_entry(node, struct btrfs_root, rb_node);</div><div class='add'>+</div><div class='add'>+	return btrfs_comp_cpu_keys(key, &amp;root-&gt;root_key);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_global_root_insert(struct btrfs_root *root)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+	struct rb_node *tmp;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	write_lock(&amp;fs_info-&gt;global_root_lock);</div><div class='add'>+	tmp = rb_find_add(&amp;root-&gt;rb_node, &amp;fs_info-&gt;global_root_tree, global_root_cmp);</div><div class='add'>+	write_unlock(&amp;fs_info-&gt;global_root_lock);</div><div class='add'>+</div><div class='add'>+	if (tmp) {</div><div class='add'>+		ret = -EEXIST;</div><div class='add'>+		btrfs_warn(fs_info, "global root %llu %llu already exists",</div><div class='add'>+			   btrfs_root_id(root), root-&gt;root_key.offset);</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_global_root_delete(struct btrfs_root *root)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+</div><div class='add'>+	write_lock(&amp;fs_info-&gt;global_root_lock);</div><div class='add'>+	rb_erase(&amp;root-&gt;rb_node, &amp;fs_info-&gt;global_root_tree);</div><div class='add'>+	write_unlock(&amp;fs_info-&gt;global_root_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct btrfs_root *btrfs_global_root(struct btrfs_fs_info *fs_info,</div><div class='add'>+				     struct btrfs_key *key)</div><div class='add'>+{</div><div class='add'>+	struct rb_node *node;</div><div class='add'>+	struct btrfs_root *root = NULL;</div><div class='add'>+</div><div class='add'>+	read_lock(&amp;fs_info-&gt;global_root_lock);</div><div class='add'>+	node = rb_find(key, &amp;fs_info-&gt;global_root_tree, global_root_key_cmp);</div><div class='add'>+	if (node)</div><div class='add'>+		root = container_of(node, struct btrfs_root, rb_node);</div><div class='add'>+	read_unlock(&amp;fs_info-&gt;global_root_lock);</div><div class='add'>+</div><div class='add'>+	return root;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static u64 btrfs_global_root_id(struct btrfs_fs_info *fs_info, u64 bytenr)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_block_group *block_group;</div><div class='add'>+	u64 ret;</div><div class='add'>+</div><div class='add'>+	if (!btrfs_fs_incompat(fs_info, EXTENT_TREE_V2))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if (bytenr)</div><div class='add'>+		block_group = btrfs_lookup_block_group(fs_info, bytenr);</div><div class='add'>+	else</div><div class='add'>+		block_group = btrfs_lookup_first_block_group(fs_info, bytenr);</div><div class='add'>+	ASSERT(block_group);</div><div class='add'>+	if (!block_group)</div><div class='add'>+		return 0;</div><div class='add'>+	ret = block_group-&gt;global_root_id;</div><div class='add'>+	btrfs_put_block_group(block_group);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct btrfs_root *btrfs_csum_root(struct btrfs_fs_info *fs_info, u64 bytenr)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_key key = {</div><div class='add'>+		.objectid = BTRFS_CSUM_TREE_OBJECTID,</div><div class='add'>+		.type = BTRFS_ROOT_ITEM_KEY,</div><div class='add'>+		.offset = btrfs_global_root_id(fs_info, bytenr),</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+	return btrfs_global_root(fs_info, &amp;key);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct btrfs_root *btrfs_extent_root(struct btrfs_fs_info *fs_info, u64 bytenr)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_key key = {</div><div class='add'>+		.objectid = BTRFS_EXTENT_TREE_OBJECTID,</div><div class='add'>+		.type = BTRFS_ROOT_ITEM_KEY,</div><div class='add'>+		.offset = btrfs_global_root_id(fs_info, bytenr),</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+	return btrfs_global_root(fs_info, &amp;key);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> struct btrfs_root *btrfs_create_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				     u64 objectid)</div><div class='ctx'> {</div><div class='hunk'>@@ -1268,15 +856,15 @@ struct btrfs_root *btrfs_create_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	root-&gt;root_key.offset = 0;</div><div class='ctx'> </div><div class='ctx'> 	leaf = btrfs_alloc_tree_block(trans, root, 0, objectid, NULL, 0, 0, 0,</div><div class='del'>-				      BTRFS_NESTING_NORMAL);</div><div class='add'>+				      0, BTRFS_NESTING_NORMAL);</div><div class='ctx'> 	if (IS_ERR(leaf)) {</div><div class='ctx'> 		ret = PTR_ERR(leaf);</div><div class='ctx'> 		leaf = NULL;</div><div class='del'>-		goto fail_unlock;</div><div class='add'>+		goto fail;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	root-&gt;node = leaf;</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='add'>+	btrfs_mark_buffer_dirty(trans, leaf);</div><div class='ctx'> </div><div class='ctx'> 	root-&gt;commit_root = btrfs_root_node(root);</div><div class='ctx'> 	set_bit(BTRFS_ROOT_TRACK_DIRTY, &amp;root-&gt;state);</div><div class='hunk'>@@ -1290,7 +878,7 @@ struct btrfs_root *btrfs_create_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	btrfs_set_root_used(&amp;root-&gt;root_item, leaf-&gt;len);</div><div class='ctx'> 	btrfs_set_root_last_snapshot(&amp;root-&gt;root_item, 0);</div><div class='ctx'> 	btrfs_set_root_dirid(&amp;root-&gt;root_item, 0);</div><div class='del'>-	if (is_fstree(objectid))</div><div class='add'>+	if (btrfs_is_fstree(objectid))</div><div class='ctx'> 		generate_random_guid(root-&gt;root_item.uuid);</div><div class='ctx'> 	else</div><div class='ctx'> 		export_guid(root-&gt;root_item.uuid, &amp;guid_null);</div><div class='hunk'>@@ -1307,17 +895,13 @@ struct btrfs_root *btrfs_create_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	return root;</div><div class='ctx'> </div><div class='del'>-fail_unlock:</div><div class='del'>-	if (leaf)</div><div class='del'>-		btrfs_tree_unlock(leaf);</div><div class='ctx'> fail:</div><div class='ctx'> 	btrfs_put_root(root);</div><div class='ctx'> </div><div class='ctx'> 	return ERR_PTR(ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct btrfs_root *alloc_log_tree(struct btrfs_trans_handle *trans,</div><div class='del'>-					 struct btrfs_fs_info *fs_info)</div><div class='add'>+static struct btrfs_root *alloc_log_tree(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root;</div><div class='ctx'> </div><div class='hunk'>@@ -1348,13 +932,13 @@ int btrfs_alloc_log_tree_node(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='ctx'> 	leaf = btrfs_alloc_tree_block(trans, root, 0, BTRFS_TREE_LOG_OBJECTID,</div><div class='del'>-			NULL, 0, 0, 0, BTRFS_NESTING_NORMAL);</div><div class='add'>+			NULL, 0, 0, 0, 0, BTRFS_NESTING_NORMAL);</div><div class='ctx'> 	if (IS_ERR(leaf))</div><div class='ctx'> 		return PTR_ERR(leaf);</div><div class='ctx'> </div><div class='ctx'> 	root-&gt;node = leaf;</div><div class='ctx'> </div><div class='del'>-	btrfs_mark_buffer_dirty(root-&gt;node);</div><div class='add'>+	btrfs_mark_buffer_dirty(trans, root-&gt;node);</div><div class='ctx'> 	btrfs_tree_unlock(root-&gt;node);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -1365,7 +949,7 @@ int btrfs_init_log_root_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *log_root;</div><div class='ctx'> </div><div class='del'>-	log_root = alloc_log_tree(trans, fs_info);</div><div class='add'>+	log_root = alloc_log_tree(fs_info);</div><div class='ctx'> 	if (IS_ERR(log_root))</div><div class='ctx'> 		return PTR_ERR(log_root);</div><div class='ctx'> </div><div class='hunk'>@@ -1391,7 +975,7 @@ int btrfs_add_log_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	struct btrfs_inode_item *inode_item;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	log_root = alloc_log_tree(trans, fs_info);</div><div class='add'>+	log_root = alloc_log_tree(fs_info);</div><div class='ctx'> 	if (IS_ERR(log_root))</div><div class='ctx'> 		return PTR_ERR(log_root);</div><div class='ctx'> </div><div class='hunk'>@@ -1401,8 +985,8 @@ int btrfs_add_log_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	log_root-&gt;last_trans = trans-&gt;transid;</div><div class='del'>-	log_root-&gt;root_key.offset = root-&gt;root_key.objectid;</div><div class='add'>+	btrfs_set_root_last_trans(log_root, trans-&gt;transid);</div><div class='add'>+	log_root-&gt;root_key.offset = btrfs_root_id(root);</div><div class='ctx'> </div><div class='ctx'> 	inode_item = &amp;log_root-&gt;root_item.inode;</div><div class='ctx'> 	btrfs_set_stack_inode_generation(inode_item, 1);</div><div class='hunk'>@@ -1416,17 +1000,18 @@ int btrfs_add_log_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	WARN_ON(root-&gt;log_root);</div><div class='ctx'> 	root-&gt;log_root = log_root;</div><div class='del'>-	root-&gt;log_transid = 0;</div><div class='add'>+	btrfs_set_root_log_transid(root, 0);</div><div class='ctx'> 	root-&gt;log_transid_committed = -1;</div><div class='del'>-	root-&gt;last_log_commit = 0;</div><div class='add'>+	btrfs_set_root_last_log_commit(root, 0);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct btrfs_root *read_tree_root_path(struct btrfs_root *tree_root,</div><div class='ctx'> 					      struct btrfs_path *path,</div><div class='del'>-					      struct btrfs_key *key)</div><div class='add'>+					      const struct btrfs_key *key)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root;</div><div class='add'>+	struct btrfs_tree_parent_check check = { 0 };</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = tree_root-&gt;fs_info;</div><div class='ctx'> 	u64 generation;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -1446,17 +1031,37 @@ static struct btrfs_root *read_tree_root_path(struct btrfs_root *tree_root,</div><div class='ctx'> </div><div class='ctx'> 	generation = btrfs_root_generation(&amp;root-&gt;root_item);</div><div class='ctx'> 	level = btrfs_root_level(&amp;root-&gt;root_item);</div><div class='del'>-	root-&gt;node = read_tree_block(fs_info,</div><div class='del'>-				     btrfs_root_bytenr(&amp;root-&gt;root_item),</div><div class='del'>-				     key-&gt;objectid, generation, level, NULL);</div><div class='add'>+	check.level = level;</div><div class='add'>+	check.transid = generation;</div><div class='add'>+	check.owner_root = key-&gt;objectid;</div><div class='add'>+	root-&gt;node = read_tree_block(fs_info, btrfs_root_bytenr(&amp;root-&gt;root_item),</div><div class='add'>+				     &amp;check);</div><div class='ctx'> 	if (IS_ERR(root-&gt;node)) {</div><div class='ctx'> 		ret = PTR_ERR(root-&gt;node);</div><div class='ctx'> 		root-&gt;node = NULL;</div><div class='ctx'> 		goto fail;</div><div class='del'>-	} else if (!btrfs_buffer_uptodate(root-&gt;node, generation, 0)) {</div><div class='add'>+	}</div><div class='add'>+	if (unlikely(!btrfs_buffer_uptodate(root-&gt;node, generation, false))) {</div><div class='ctx'> 		ret = -EIO;</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * For real fs, and not log/reloc trees, root owner must</div><div class='add'>+	 * match its root node owner</div><div class='add'>+	 */</div><div class='add'>+	if (unlikely(!btrfs_is_testing(fs_info) &amp;&amp;</div><div class='add'>+		     btrfs_root_id(root) != BTRFS_TREE_LOG_OBJECTID &amp;&amp;</div><div class='add'>+		     btrfs_root_id(root) != BTRFS_TREE_RELOC_OBJECTID &amp;&amp;</div><div class='add'>+		     btrfs_root_id(root) != btrfs_header_owner(root-&gt;node))) {</div><div class='add'>+		btrfs_crit(fs_info,</div><div class='add'>+"root=%llu block=%llu, tree root owner mismatch, have %llu expect %llu",</div><div class='add'>+			   btrfs_root_id(root), root-&gt;node-&gt;start,</div><div class='add'>+			   btrfs_header_owner(root-&gt;node),</div><div class='add'>+			   btrfs_root_id(root));</div><div class='add'>+		ret = -EUCLEAN;</div><div class='add'>+		goto fail;</div><div class='add'>+	}</div><div class='ctx'> 	root-&gt;commit_root = btrfs_root_node(root);</div><div class='ctx'> 	return root;</div><div class='ctx'> fail:</div><div class='hunk'>@@ -1465,42 +1070,35 @@ fail:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct btrfs_root *btrfs_read_tree_root(struct btrfs_root *tree_root,</div><div class='del'>-					struct btrfs_key *key)</div><div class='add'>+					const struct btrfs_key *key)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> 	root = read_tree_root_path(tree_root, path, key);</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> </div><div class='ctx'> 	return root;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Initialize subvolume root in-memory structure</div><div class='add'>+ * Initialize subvolume root in-memory structure.</div><div class='ctx'>  *</div><div class='ctx'>  * @anon_dev:	anonymous device to attach to the root, if zero, allocate new</div><div class='add'>+ *</div><div class='add'>+ * In case of failure the caller is responsible to call btrfs_free_fs_root()</div><div class='ctx'>  */</div><div class='ctx'> static int btrfs_init_fs_root(struct btrfs_root *root, dev_t anon_dev)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='del'>-	unsigned int nofs_flag;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * We might be called under a transaction (e.g. indirect backref</div><div class='del'>-	 * resolution) which could deadlock if it triggers memory reclaim</div><div class='del'>-	 */</div><div class='del'>-	nofs_flag = memalloc_nofs_save();</div><div class='del'>-	ret = btrfs_drew_lock_init(&amp;root-&gt;snapshot_lock);</div><div class='del'>-	memalloc_nofs_restore(nofs_flag);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto fail;</div><div class='add'>+	btrfs_drew_lock_init(&amp;root-&gt;snapshot_lock);</div><div class='ctx'> </div><div class='del'>-	if (root-&gt;root_key.objectid != BTRFS_TREE_LOG_OBJECTID &amp;&amp;</div><div class='del'>-	    !btrfs_is_data_reloc_root(root)) {</div><div class='add'>+	if (btrfs_root_id(root) != BTRFS_TREE_LOG_OBJECTID &amp;&amp;</div><div class='add'>+	    !btrfs_is_data_reloc_root(root) &amp;&amp;</div><div class='add'>+	    btrfs_is_fstree(btrfs_root_id(root))) {</div><div class='ctx'> 		set_bit(BTRFS_ROOT_SHAREABLE, &amp;root-&gt;state);</div><div class='ctx'> 		btrfs_check_and_init_root_item(&amp;root-&gt;root_item);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1509,12 +1107,12 @@ static int btrfs_init_fs_root(struct btrfs_root *root, dev_t anon_dev)</div><div class='ctx'> 	 * Don't assign anonymous block device to roots that are not exposed to</div><div class='ctx'> 	 * userspace, the id pool is limited to 1M</div><div class='ctx'> 	 */</div><div class='del'>-	if (is_fstree(root-&gt;root_key.objectid) &amp;&amp;</div><div class='add'>+	if (btrfs_is_fstree(btrfs_root_id(root)) &amp;&amp;</div><div class='ctx'> 	    btrfs_root_refs(&amp;root-&gt;root_item) &gt; 0) {</div><div class='ctx'> 		if (!anon_dev) {</div><div class='ctx'> 			ret = get_anon_bdev(&amp;root-&gt;anon_dev);</div><div class='ctx'> 			if (ret)</div><div class='del'>-				goto fail;</div><div class='add'>+				return ret;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			root-&gt;anon_dev = anon_dev;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1524,7 +1122,7 @@ static int btrfs_init_fs_root(struct btrfs_root *root, dev_t anon_dev)</div><div class='ctx'> 	ret = btrfs_init_root_free_objectid(root);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		mutex_unlock(&amp;root-&gt;objectid_mutex);</div><div class='del'>-		goto fail;</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ASSERT(root-&gt;free_objectid &lt;= BTRFS_LAST_FREE_OBJECTID);</div><div class='hunk'>@@ -1532,9 +1130,6 @@ static int btrfs_init_fs_root(struct btrfs_root *root, dev_t anon_dev)</div><div class='ctx'> 	mutex_unlock(&amp;root-&gt;objectid_mutex);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='del'>-fail:</div><div class='del'>-	/* The caller is responsible to call btrfs_free_fs_root */</div><div class='del'>-	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct btrfs_root *btrfs_lookup_fs_root(struct btrfs_fs_info *fs_info,</div><div class='hunk'>@@ -1545,8 +1140,7 @@ static struct btrfs_root *btrfs_lookup_fs_root(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;fs_roots_radix_lock);</div><div class='ctx'> 	root = radix_tree_lookup(&amp;fs_info-&gt;fs_roots_radix,</div><div class='ctx'> 				 (unsigned long)root_id);</div><div class='del'>-	if (root)</div><div class='del'>-		root = btrfs_grab_root(root);</div><div class='add'>+	root = btrfs_grab_root(root);</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;fs_roots_radix_lock);</div><div class='ctx'> 	return root;</div><div class='ctx'> }</div><div class='hunk'>@@ -1554,26 +1148,36 @@ static struct btrfs_root *btrfs_lookup_fs_root(struct btrfs_fs_info *fs_info,</div><div class='ctx'> static struct btrfs_root *btrfs_get_global_root(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 						u64 objectid)</div><div class='ctx'> {</div><div class='del'>-	if (objectid == BTRFS_ROOT_TREE_OBJECTID)</div><div class='add'>+	struct btrfs_key key = {</div><div class='add'>+		.objectid = objectid,</div><div class='add'>+		.type = BTRFS_ROOT_ITEM_KEY,</div><div class='add'>+		.offset = 0,</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+	switch (objectid) {</div><div class='add'>+	case BTRFS_ROOT_TREE_OBJECTID:</div><div class='ctx'> 		return btrfs_grab_root(fs_info-&gt;tree_root);</div><div class='del'>-	if (objectid == BTRFS_EXTENT_TREE_OBJECTID)</div><div class='del'>-		return btrfs_grab_root(fs_info-&gt;extent_root);</div><div class='del'>-	if (objectid == BTRFS_CHUNK_TREE_OBJECTID)</div><div class='add'>+	case BTRFS_EXTENT_TREE_OBJECTID:</div><div class='add'>+		return btrfs_grab_root(btrfs_global_root(fs_info, &amp;key));</div><div class='add'>+	case BTRFS_CHUNK_TREE_OBJECTID:</div><div class='ctx'> 		return btrfs_grab_root(fs_info-&gt;chunk_root);</div><div class='del'>-	if (objectid == BTRFS_DEV_TREE_OBJECTID)</div><div class='add'>+	case BTRFS_DEV_TREE_OBJECTID:</div><div class='ctx'> 		return btrfs_grab_root(fs_info-&gt;dev_root);</div><div class='del'>-	if (objectid == BTRFS_CSUM_TREE_OBJECTID)</div><div class='del'>-		return btrfs_grab_root(fs_info-&gt;csum_root);</div><div class='del'>-	if (objectid == BTRFS_QUOTA_TREE_OBJECTID)</div><div class='del'>-		return btrfs_grab_root(fs_info-&gt;quota_root) ?</div><div class='del'>-			fs_info-&gt;quota_root : ERR_PTR(-ENOENT);</div><div class='del'>-	if (objectid == BTRFS_UUID_TREE_OBJECTID)</div><div class='del'>-		return btrfs_grab_root(fs_info-&gt;uuid_root) ?</div><div class='del'>-			fs_info-&gt;uuid_root : ERR_PTR(-ENOENT);</div><div class='del'>-	if (objectid == BTRFS_FREE_SPACE_TREE_OBJECTID)</div><div class='del'>-		return btrfs_grab_root(fs_info-&gt;free_space_root) ?</div><div class='del'>-			fs_info-&gt;free_space_root : ERR_PTR(-ENOENT);</div><div class='del'>-	return NULL;</div><div class='add'>+	case BTRFS_CSUM_TREE_OBJECTID:</div><div class='add'>+		return btrfs_grab_root(btrfs_global_root(fs_info, &amp;key));</div><div class='add'>+	case BTRFS_QUOTA_TREE_OBJECTID:</div><div class='add'>+		return btrfs_grab_root(fs_info-&gt;quota_root);</div><div class='add'>+	case BTRFS_UUID_TREE_OBJECTID:</div><div class='add'>+		return btrfs_grab_root(fs_info-&gt;uuid_root);</div><div class='add'>+	case BTRFS_BLOCK_GROUP_TREE_OBJECTID:</div><div class='add'>+		return btrfs_grab_root(fs_info-&gt;block_group_root);</div><div class='add'>+	case BTRFS_FREE_SPACE_TREE_OBJECTID:</div><div class='add'>+		return btrfs_grab_root(btrfs_global_root(fs_info, &amp;key));</div><div class='add'>+	case BTRFS_RAID_STRIPE_TREE_OBJECTID:</div><div class='add'>+		return btrfs_grab_root(fs_info-&gt;stripe_root);</div><div class='add'>+	default:</div><div class='add'>+		return NULL;</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_insert_fs_root(struct btrfs_fs_info *fs_info,</div><div class='hunk'>@@ -1587,7 +1191,7 @@ int btrfs_insert_fs_root(struct btrfs_fs_info *fs_info,</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;fs_roots_radix_lock);</div><div class='ctx'> 	ret = radix_tree_insert(&amp;fs_info-&gt;fs_roots_radix,</div><div class='del'>-				(unsigned long)root-&gt;root_key.objectid,</div><div class='add'>+				(unsigned long)btrfs_root_id(root),</div><div class='ctx'> 				root);</div><div class='ctx'> 	if (ret == 0) {</div><div class='ctx'> 		btrfs_grab_root(root);</div><div class='hunk'>@@ -1599,7 +1203,7 @@ int btrfs_insert_fs_root(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_check_leaked_roots(struct btrfs_fs_info *fs_info)</div><div class='add'>+void btrfs_check_leaked_roots(const struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> #ifdef CONFIG_BTRFS_DEBUG</div><div class='ctx'> 	struct btrfs_root *root;</div><div class='hunk'>@@ -1612,6 +1216,7 @@ void btrfs_check_leaked_roots(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 		btrfs_err(fs_info, "leaked root %s refcount %d",</div><div class='ctx'> 			  btrfs_root_name(&amp;root-&gt;root_key, buf),</div><div class='ctx'> 			  refcount_read(&amp;root-&gt;refs));</div><div class='add'>+		WARN_ON_ONCE(1);</div><div class='ctx'> 		while (refcount_read(&amp;root-&gt;refs) &gt; 1)</div><div class='ctx'> 			btrfs_put_root(root);</div><div class='ctx'> 		btrfs_put_root(root);</div><div class='hunk'>@@ -1619,32 +1224,52 @@ void btrfs_check_leaked_roots(struct btrfs_fs_info *fs_info)</div><div class='ctx'> #endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void free_global_roots(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_root *root;</div><div class='add'>+	struct rb_node *node;</div><div class='add'>+</div><div class='add'>+	while ((node = rb_first_postorder(&amp;fs_info-&gt;global_root_tree)) != NULL) {</div><div class='add'>+		root = rb_entry(node, struct btrfs_root, rb_node);</div><div class='add'>+		rb_erase(&amp;root-&gt;rb_node, &amp;fs_info-&gt;global_root_tree);</div><div class='add'>+		btrfs_put_root(root);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> void btrfs_free_fs_info(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='add'>+	struct percpu_counter *em_counter = &amp;fs_info-&gt;evictable_extent_maps;</div><div class='add'>+</div><div class='add'>+	if (fs_info-&gt;fs_devices)</div><div class='add'>+		btrfs_close_devices(fs_info-&gt;fs_devices);</div><div class='add'>+	btrfs_free_compress_wsm(fs_info);</div><div class='add'>+	percpu_counter_destroy(&amp;fs_info-&gt;stats_read_blocks);</div><div class='ctx'> 	percpu_counter_destroy(&amp;fs_info-&gt;dirty_metadata_bytes);</div><div class='ctx'> 	percpu_counter_destroy(&amp;fs_info-&gt;delalloc_bytes);</div><div class='ctx'> 	percpu_counter_destroy(&amp;fs_info-&gt;ordered_bytes);</div><div class='add'>+	if (percpu_counter_initialized(em_counter))</div><div class='add'>+		ASSERT(percpu_counter_sum_positive(em_counter) == 0);</div><div class='add'>+	percpu_counter_destroy(em_counter);</div><div class='ctx'> 	percpu_counter_destroy(&amp;fs_info-&gt;dev_replace.bio_counter);</div><div class='ctx'> 	btrfs_free_csum_hash(fs_info);</div><div class='ctx'> 	btrfs_free_stripe_hash_table(fs_info);</div><div class='ctx'> 	btrfs_free_ref_cache(fs_info);</div><div class='ctx'> 	kfree(fs_info-&gt;balance_ctl);</div><div class='ctx'> 	kfree(fs_info-&gt;delayed_root);</div><div class='del'>-	btrfs_put_root(fs_info-&gt;extent_root);</div><div class='add'>+	free_global_roots(fs_info);</div><div class='ctx'> 	btrfs_put_root(fs_info-&gt;tree_root);</div><div class='ctx'> 	btrfs_put_root(fs_info-&gt;chunk_root);</div><div class='ctx'> 	btrfs_put_root(fs_info-&gt;dev_root);</div><div class='del'>-	btrfs_put_root(fs_info-&gt;csum_root);</div><div class='ctx'> 	btrfs_put_root(fs_info-&gt;quota_root);</div><div class='ctx'> 	btrfs_put_root(fs_info-&gt;uuid_root);</div><div class='del'>-	btrfs_put_root(fs_info-&gt;free_space_root);</div><div class='ctx'> 	btrfs_put_root(fs_info-&gt;fs_root);</div><div class='ctx'> 	btrfs_put_root(fs_info-&gt;data_reloc_root);</div><div class='add'>+	btrfs_put_root(fs_info-&gt;block_group_root);</div><div class='add'>+	btrfs_put_root(fs_info-&gt;stripe_root);</div><div class='ctx'> 	btrfs_check_leaked_roots(fs_info);</div><div class='ctx'> 	btrfs_extent_buffer_leak_debug_check(fs_info);</div><div class='ctx'> 	kfree(fs_info-&gt;super_copy);</div><div class='ctx'> 	kfree(fs_info-&gt;super_for_commit);</div><div class='del'>-	kfree(fs_info-&gt;subpage_info);</div><div class='ctx'> 	kvfree(fs_info);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1663,12 +1288,12 @@ void btrfs_free_fs_info(struct btrfs_fs_info *fs_info)</div><div class='ctx'>  *</div><div class='ctx'>  * @objectid:	root id</div><div class='ctx'>  * @anon_dev:	preallocated anonymous block device number for new roots,</div><div class='del'>- * 		pass 0 for new allocation.</div><div class='add'>+ *		pass NULL for a new allocation.</div><div class='ctx'>  * @check_ref:	whether to check root item references, If true, return -ENOENT</div><div class='ctx'>  *		for orphan roots</div><div class='ctx'>  */</div><div class='ctx'> static struct btrfs_root *btrfs_get_root_ref(struct btrfs_fs_info *fs_info,</div><div class='del'>-					     u64 objectid, dev_t anon_dev,</div><div class='add'>+					     u64 objectid, dev_t *anon_dev,</div><div class='ctx'> 					     bool check_ref)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root;</div><div class='hunk'>@@ -1679,11 +1304,30 @@ static struct btrfs_root *btrfs_get_root_ref(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	root = btrfs_get_global_root(fs_info, objectid);</div><div class='ctx'> 	if (root)</div><div class='ctx'> 		return root;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If we're called for non-subvolume trees, and above function didn't</div><div class='add'>+	 * find one, do not try to read it from disk.</div><div class='add'>+	 *</div><div class='add'>+	 * This is namely for free-space-tree and quota tree, which can change</div><div class='add'>+	 * at runtime and should only be grabbed from fs_info.</div><div class='add'>+	 */</div><div class='add'>+	if (!btrfs_is_fstree(objectid) &amp;&amp; objectid != BTRFS_DATA_RELOC_TREE_OBJECTID)</div><div class='add'>+		return ERR_PTR(-ENOENT);</div><div class='ctx'> again:</div><div class='ctx'> 	root = btrfs_lookup_fs_root(fs_info, objectid);</div><div class='ctx'> 	if (root) {</div><div class='del'>-		/* Shouldn't get preallocated anon_dev for cached roots */</div><div class='del'>-		ASSERT(!anon_dev);</div><div class='add'>+		/*</div><div class='add'>+		 * Some other caller may have read out the newly inserted</div><div class='add'>+		 * subvolume already (for things like backref walk etc).  Not</div><div class='add'>+		 * that common but still possible.  In that case, we just need</div><div class='add'>+		 * to free the anon_dev.</div><div class='add'>+		 */</div><div class='add'>+		if (unlikely(anon_dev &amp;&amp; *anon_dev)) {</div><div class='add'>+			free_anon_bdev(*anon_dev);</div><div class='add'>+			*anon_dev = 0;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		if (check_ref &amp;&amp; btrfs_root_refs(&amp;root-&gt;root_item) == 0) {</div><div class='ctx'> 			btrfs_put_root(root);</div><div class='ctx'> 			return ERR_PTR(-ENOENT);</div><div class='hunk'>@@ -1703,7 +1347,7 @@ again:</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_init_fs_root(root, anon_dev);</div><div class='add'>+	ret = btrfs_init_fs_root(root, anon_dev ? *anon_dev : 0);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> </div><div class='hunk'>@@ -1725,13 +1369,22 @@ again:</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_insert_fs_root(fs_info, root);</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		btrfs_put_root(root);</div><div class='del'>-		if (ret == -EEXIST)</div><div class='add'>+		if (ret == -EEXIST) {</div><div class='add'>+			btrfs_put_root(root);</div><div class='ctx'> 			goto again;</div><div class='add'>+		}</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='ctx'> 	return root;</div><div class='ctx'> fail:</div><div class='add'>+	/*</div><div class='add'>+	 * If our caller provided us an anonymous device, then it's his</div><div class='add'>+	 * responsibility to free it in case we fail. So we have to set our</div><div class='add'>+	 * root's anon_dev to 0 to avoid a double free, once by btrfs_put_root()</div><div class='add'>+	 * and once again by our caller.</div><div class='add'>+	 */</div><div class='add'>+	if (anon_dev &amp;&amp; *anon_dev)</div><div class='add'>+		root-&gt;anon_dev = 0;</div><div class='ctx'> 	btrfs_put_root(root);</div><div class='ctx'> 	return ERR_PTR(ret);</div><div class='ctx'> }</div><div class='hunk'>@@ -1746,7 +1399,7 @@ fail:</div><div class='ctx'> struct btrfs_root *btrfs_get_fs_root(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				     u64 objectid, bool check_ref)</div><div class='ctx'> {</div><div class='del'>-	return btrfs_get_root_ref(fs_info, objectid, 0, check_ref);</div><div class='add'>+	return btrfs_get_root_ref(fs_info, objectid, NULL, check_ref);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1754,17 +1407,18 @@ struct btrfs_root *btrfs_get_fs_root(struct btrfs_fs_info *fs_info,</div><div class='ctx'>  * the anonymous block device id</div><div class='ctx'>  *</div><div class='ctx'>  * @objectid:	tree objectid</div><div class='del'>- * @anon_dev:	if zero, allocate a new anonymous block device or use the</div><div class='del'>- *		parameter value</div><div class='add'>+ * @anon_dev:	if NULL, allocate a new anonymous block device or use the</div><div class='add'>+ *		parameter value if not NULL</div><div class='ctx'>  */</div><div class='ctx'> struct btrfs_root *btrfs_get_new_fs_root(struct btrfs_fs_info *fs_info,</div><div class='del'>-					 u64 objectid, dev_t anon_dev)</div><div class='add'>+					 u64 objectid, dev_t *anon_dev)</div><div class='ctx'> {</div><div class='ctx'> 	return btrfs_get_root_ref(fs_info, objectid, anon_dev, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * btrfs_get_fs_root_commit_root - return a root for the given objectid</div><div class='add'>+ * Return a root for the given objectid.</div><div class='add'>+ *</div><div class='ctx'>  * @fs_info:	the fs_info</div><div class='ctx'>  * @objectid:	the objectid we need to lookup</div><div class='ctx'>  *</div><div class='hunk'>@@ -1809,29 +1463,9 @@ struct btrfs_root *btrfs_get_fs_root_commit_root(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	return root;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * called by the kthread helper functions to finally call the bio end_io</div><div class='del'>- * functions.  This is where read checksum verification actually happens</div><div class='del'>- */</div><div class='del'>-static void end_workqueue_fn(struct btrfs_work *work)</div><div class='del'>-{</div><div class='del'>-	struct bio *bio;</div><div class='del'>-	struct btrfs_end_io_wq *end_io_wq;</div><div class='del'>-</div><div class='del'>-	end_io_wq = container_of(work, struct btrfs_end_io_wq, work);</div><div class='del'>-	bio = end_io_wq-&gt;bio;</div><div class='del'>-</div><div class='del'>-	bio-&gt;bi_status = end_io_wq-&gt;status;</div><div class='del'>-	bio-&gt;bi_private = end_io_wq-&gt;private;</div><div class='del'>-	bio-&gt;bi_end_io = end_io_wq-&gt;end_io;</div><div class='del'>-	bio_endio(bio);</div><div class='del'>-	kmem_cache_free(btrfs_end_io_wq_cache, end_io_wq);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int cleaner_kthread(void *arg)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *root = arg;</div><div class='del'>-	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+	struct btrfs_fs_info *fs_info = arg;</div><div class='ctx'> 	int again;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='hunk'>@@ -1862,9 +1496,12 @@ static int cleaner_kthread(void *arg)</div><div class='ctx'> 			goto sleep;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		if (test_and_clear_bit(BTRFS_FS_FEATURE_CHANGED, &amp;fs_info-&gt;flags))</div><div class='add'>+			btrfs_sysfs_feature_update(fs_info);</div><div class='add'>+</div><div class='ctx'> 		btrfs_run_delayed_iputs(fs_info);</div><div class='ctx'> </div><div class='del'>-		again = btrfs_clean_one_deleted_snapshot(root);</div><div class='add'>+		again = btrfs_clean_one_deleted_snapshot(fs_info);</div><div class='ctx'> 		mutex_unlock(&amp;fs_info-&gt;cleaner_mutex);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='hunk'>@@ -1916,7 +1553,7 @@ static int transaction_kthread(void *arg)</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='ctx'> 		cannot_commit = false;</div><div class='del'>-		delay = msecs_to_jiffies(fs_info-&gt;commit_interval * 1000);</div><div class='add'>+		delay = secs_to_jiffies(fs_info-&gt;commit_interval);</div><div class='ctx'> 		mutex_lock(&amp;fs_info-&gt;transaction_kthread_mutex);</div><div class='ctx'> </div><div class='ctx'> 		spin_lock(&amp;fs_info-&gt;trans_lock);</div><div class='hunk'>@@ -1927,12 +1564,13 @@ static int transaction_kthread(void *arg)</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		delta = ktime_get_seconds() - cur-&gt;start_time;</div><div class='del'>-		if (cur-&gt;state &lt; TRANS_STATE_COMMIT_START &amp;&amp;</div><div class='add'>+		if (!test_and_clear_bit(BTRFS_FS_COMMIT_TRANS, &amp;fs_info-&gt;flags) &amp;&amp;</div><div class='add'>+		    cur-&gt;state &lt; TRANS_STATE_COMMIT_PREP &amp;&amp;</div><div class='ctx'> 		    delta &lt; fs_info-&gt;commit_interval) {</div><div class='ctx'> 			spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='del'>-			delay -= msecs_to_jiffies((delta - 1) * 1000);</div><div class='add'>+			delay -= secs_to_jiffies(delta - 1);</div><div class='ctx'> 			delay = min(delay,</div><div class='del'>-				    msecs_to_jiffies(fs_info-&gt;commit_interval * 1000));</div><div class='add'>+				    secs_to_jiffies(fs_info-&gt;commit_interval));</div><div class='ctx'> 			goto sleep;</div><div class='ctx'> 		}</div><div class='ctx'> 		transid = cur-&gt;transid;</div><div class='hunk'>@@ -2023,11 +1661,23 @@ static void backup_super_roots(struct btrfs_fs_info *info)</div><div class='ctx'> 	btrfs_set_backup_chunk_root_level(root_backup,</div><div class='ctx'> 			       btrfs_header_level(info-&gt;chunk_root-&gt;node));</div><div class='ctx'> </div><div class='del'>-	btrfs_set_backup_extent_root(root_backup, info-&gt;extent_root-&gt;node-&gt;start);</div><div class='del'>-	btrfs_set_backup_extent_root_gen(root_backup,</div><div class='del'>-			       btrfs_header_generation(info-&gt;extent_root-&gt;node));</div><div class='del'>-	btrfs_set_backup_extent_root_level(root_backup,</div><div class='del'>-			       btrfs_header_level(info-&gt;extent_root-&gt;node));</div><div class='add'>+	if (!btrfs_fs_compat_ro(info, BLOCK_GROUP_TREE)) {</div><div class='add'>+		struct btrfs_root *extent_root = btrfs_extent_root(info, 0);</div><div class='add'>+		struct btrfs_root *csum_root = btrfs_csum_root(info, 0);</div><div class='add'>+</div><div class='add'>+		btrfs_set_backup_extent_root(root_backup,</div><div class='add'>+					     extent_root-&gt;node-&gt;start);</div><div class='add'>+		btrfs_set_backup_extent_root_gen(root_backup,</div><div class='add'>+				btrfs_header_generation(extent_root-&gt;node));</div><div class='add'>+		btrfs_set_backup_extent_root_level(root_backup,</div><div class='add'>+					btrfs_header_level(extent_root-&gt;node));</div><div class='add'>+</div><div class='add'>+		btrfs_set_backup_csum_root(root_backup, csum_root-&gt;node-&gt;start);</div><div class='add'>+		btrfs_set_backup_csum_root_gen(root_backup,</div><div class='add'>+					       btrfs_header_generation(csum_root-&gt;node));</div><div class='add'>+		btrfs_set_backup_csum_root_level(root_backup,</div><div class='add'>+						 btrfs_header_level(csum_root-&gt;node));</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * we might commit during log recovery, which happens before we set</div><div class='hunk'>@@ -2048,12 +1698,6 @@ static void backup_super_roots(struct btrfs_fs_info *info)</div><div class='ctx'> 	btrfs_set_backup_dev_root_level(root_backup,</div><div class='ctx'> 				       btrfs_header_level(info-&gt;dev_root-&gt;node));</div><div class='ctx'> </div><div class='del'>-	btrfs_set_backup_csum_root(root_backup, info-&gt;csum_root-&gt;node-&gt;start);</div><div class='del'>-	btrfs_set_backup_csum_root_gen(root_backup,</div><div class='del'>-			       btrfs_header_generation(info-&gt;csum_root-&gt;node));</div><div class='del'>-	btrfs_set_backup_csum_root_level(root_backup,</div><div class='del'>-			       btrfs_header_level(info-&gt;csum_root-&gt;node));</div><div class='del'>-</div><div class='ctx'> 	btrfs_set_backup_total_bytes(root_backup,</div><div class='ctx'> 			     btrfs_super_total_bytes(info-&gt;super_copy));</div><div class='ctx'> 	btrfs_set_backup_bytes_used(root_backup,</div><div class='hunk'>@@ -2071,11 +1715,11 @@ static void backup_super_roots(struct btrfs_fs_info *info)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * read_backup_root - Reads a backup root based on the passed priority. Prio 0</div><div class='del'>- * is the newest, prio 1/2/3 are 2nd newest/3rd newest/4th (oldest) backup roots</div><div class='add'>+ * Reads a backup root based on the passed priority. Prio 0 is the newest, prio</div><div class='add'>+ * 1/2/3 are 2nd newest/3rd newest/4th (oldest) backup roots</div><div class='ctx'>  *</div><div class='del'>- * fs_info - filesystem whose backup roots need to be read</div><div class='del'>- * priority - priority of backup root required</div><div class='add'>+ * @fs_info:  filesystem whose backup roots need to be read</div><div class='add'>+ * @priority: priority of backup root required</div><div class='ctx'>  *</div><div class='ctx'>  * Returns backup root index on success and -EINVAL otherwise.</div><div class='ctx'>  */</div><div class='hunk'>@@ -2120,14 +1764,14 @@ static void btrfs_stop_all_workers(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	btrfs_destroy_workqueue(fs_info-&gt;fixup_workers);</div><div class='ctx'> 	btrfs_destroy_workqueue(fs_info-&gt;delalloc_workers);</div><div class='ctx'> 	btrfs_destroy_workqueue(fs_info-&gt;workers);</div><div class='del'>-	btrfs_destroy_workqueue(fs_info-&gt;endio_workers);</div><div class='del'>-	btrfs_destroy_workqueue(fs_info-&gt;endio_raid56_workers);</div><div class='del'>-	btrfs_destroy_workqueue(fs_info-&gt;rmw_workers);</div><div class='add'>+	if (fs_info-&gt;endio_workers)</div><div class='add'>+		destroy_workqueue(fs_info-&gt;endio_workers);</div><div class='add'>+	if (fs_info-&gt;rmw_workers)</div><div class='add'>+		destroy_workqueue(fs_info-&gt;rmw_workers);</div><div class='ctx'> 	btrfs_destroy_workqueue(fs_info-&gt;endio_write_workers);</div><div class='ctx'> 	btrfs_destroy_workqueue(fs_info-&gt;endio_freespace_worker);</div><div class='ctx'> 	btrfs_destroy_workqueue(fs_info-&gt;delayed_workers);</div><div class='ctx'> 	btrfs_destroy_workqueue(fs_info-&gt;caching_workers);</div><div class='del'>-	btrfs_destroy_workqueue(fs_info-&gt;readahead_workers);</div><div class='ctx'> 	btrfs_destroy_workqueue(fs_info-&gt;flush_workers);</div><div class='ctx'> 	btrfs_destroy_workqueue(fs_info-&gt;qgroup_rescan_workers);</div><div class='ctx'> 	if (fs_info-&gt;discard_ctl.discard_workers)</div><div class='hunk'>@@ -2137,8 +1781,8 @@ static void btrfs_stop_all_workers(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	 * the queues used for metadata I/O, since tasks from those other work</div><div class='ctx'> 	 * queues can do metadata I/O operations.</div><div class='ctx'> 	 */</div><div class='del'>-	btrfs_destroy_workqueue(fs_info-&gt;endio_meta_workers);</div><div class='del'>-	btrfs_destroy_workqueue(fs_info-&gt;endio_meta_write_workers);</div><div class='add'>+	if (fs_info-&gt;endio_meta_workers)</div><div class='add'>+		destroy_workqueue(fs_info-&gt;endio_meta_workers);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void free_root_extent_buffers(struct btrfs_root *root)</div><div class='hunk'>@@ -2151,21 +1795,31 @@ static void free_root_extent_buffers(struct btrfs_root *root)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void free_global_root_pointers(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_root *root, *tmp;</div><div class='add'>+</div><div class='add'>+	rbtree_postorder_for_each_entry_safe(root, tmp,</div><div class='add'>+					     &amp;fs_info-&gt;global_root_tree,</div><div class='add'>+					     rb_node)</div><div class='add'>+		free_root_extent_buffers(root);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /* helper to cleanup tree roots */</div><div class='ctx'> static void free_root_pointers(struct btrfs_fs_info *info, bool free_chunk_root)</div><div class='ctx'> {</div><div class='ctx'> 	free_root_extent_buffers(info-&gt;tree_root);</div><div class='ctx'> </div><div class='add'>+	free_global_root_pointers(info);</div><div class='ctx'> 	free_root_extent_buffers(info-&gt;dev_root);</div><div class='del'>-	free_root_extent_buffers(info-&gt;extent_root);</div><div class='del'>-	free_root_extent_buffers(info-&gt;csum_root);</div><div class='ctx'> 	free_root_extent_buffers(info-&gt;quota_root);</div><div class='ctx'> 	free_root_extent_buffers(info-&gt;uuid_root);</div><div class='ctx'> 	free_root_extent_buffers(info-&gt;fs_root);</div><div class='ctx'> 	free_root_extent_buffers(info-&gt;data_reloc_root);</div><div class='add'>+	free_root_extent_buffers(info-&gt;block_group_root);</div><div class='add'>+	free_root_extent_buffers(info-&gt;stripe_root);</div><div class='ctx'> 	if (free_chunk_root)</div><div class='ctx'> 		free_root_extent_buffers(info-&gt;chunk_root);</div><div class='del'>-	free_root_extent_buffers(info-&gt;free_space_root);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_put_root(struct btrfs_root *root)</div><div class='hunk'>@@ -2174,11 +1828,13 @@ void btrfs_put_root(struct btrfs_root *root)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	if (refcount_dec_and_test(&amp;root-&gt;refs)) {</div><div class='del'>-		WARN_ON(!RB_EMPTY_ROOT(&amp;root-&gt;inode_tree));</div><div class='add'>+		if (WARN_ON(!xa_empty(&amp;root-&gt;inodes)))</div><div class='add'>+			xa_destroy(&amp;root-&gt;inodes);</div><div class='add'>+		if (WARN_ON(!xa_empty(&amp;root-&gt;delayed_nodes)))</div><div class='add'>+			xa_destroy(&amp;root-&gt;delayed_nodes);</div><div class='ctx'> 		WARN_ON(test_bit(BTRFS_ROOT_DEAD_RELOC_TREE, &amp;root-&gt;state));</div><div class='ctx'> 		if (root-&gt;anon_dev)</div><div class='ctx'> 			free_anon_bdev(root-&gt;anon_dev);</div><div class='del'>-		btrfs_drew_lock_destroy(&amp;root-&gt;snapshot_lock);</div><div class='ctx'> 		free_root_extent_buffers(root);</div><div class='ctx'> #ifdef CONFIG_BTRFS_DEBUG</div><div class='ctx'> 		spin_lock(&amp;root-&gt;fs_info-&gt;fs_roots_radix_lock);</div><div class='hunk'>@@ -2196,8 +1852,8 @@ void btrfs_free_fs_roots(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='ctx'> 	while (!list_empty(&amp;fs_info-&gt;dead_roots)) {</div><div class='del'>-		gang[0] = list_entry(fs_info-&gt;dead_roots.next,</div><div class='del'>-				     struct btrfs_root, root_list);</div><div class='add'>+		gang[0] = list_first_entry(&amp;fs_info-&gt;dead_roots,</div><div class='add'>+					   struct btrfs_root, root_list);</div><div class='ctx'> 		list_del(&amp;gang[0]-&gt;root_list);</div><div class='ctx'> </div><div class='ctx'> 		if (test_bit(BTRFS_ROOT_IN_RADIX, &amp;gang[0]-&gt;state))</div><div class='hunk'>@@ -2238,11 +1894,18 @@ static void btrfs_init_balance(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	atomic_set(&amp;fs_info-&gt;reloc_cancel_req, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void btrfs_init_btree_inode(struct btrfs_fs_info *fs_info)</div><div class='add'>+static int btrfs_init_btree_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = fs_info-&gt;btree_inode;</div><div class='add'>+	struct btrfs_fs_info *fs_info = btrfs_sb(sb);</div><div class='add'>+	unsigned long hash = btrfs_inode_hash(BTRFS_BTREE_INODE_OBJECTID,</div><div class='add'>+					      fs_info-&gt;tree_root);</div><div class='add'>+	struct inode *inode;</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_ino = BTRFS_BTREE_INODE_OBJECTID;</div><div class='add'>+	inode = new_inode(sb);</div><div class='add'>+	if (!inode)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	btrfs_set_inode_number(BTRFS_I(inode), BTRFS_BTREE_INODE_OBJECTID);</div><div class='ctx'> 	set_nlink(inode, 1);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * we set the i_size on the btree inode to the max possible int.</div><div class='hunk'>@@ -2251,17 +1914,19 @@ static void btrfs_init_btree_inode(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	 */</div><div class='ctx'> 	inode-&gt;i_size = OFFSET_MAX;</div><div class='ctx'> 	inode-&gt;i_mapping-&gt;a_ops = &amp;btree_aops;</div><div class='add'>+	mapping_set_gfp_mask(inode-&gt;i_mapping, GFP_NOFS);</div><div class='ctx'> </div><div class='del'>-	RB_CLEAR_NODE(&amp;BTRFS_I(inode)-&gt;rb_node);</div><div class='del'>-	extent_io_tree_init(fs_info, &amp;BTRFS_I(inode)-&gt;io_tree,</div><div class='del'>-			    IO_TREE_BTREE_INODE_IO, inode);</div><div class='del'>-	BTRFS_I(inode)-&gt;io_tree.track_uptodate = false;</div><div class='del'>-	extent_map_tree_init(&amp;BTRFS_I(inode)-&gt;extent_tree);</div><div class='add'>+	btrfs_extent_io_tree_init(fs_info, &amp;BTRFS_I(inode)-&gt;io_tree,</div><div class='add'>+				  IO_TREE_BTREE_INODE_IO);</div><div class='add'>+	btrfs_extent_map_tree_init(&amp;BTRFS_I(inode)-&gt;extent_tree);</div><div class='ctx'> </div><div class='ctx'> 	BTRFS_I(inode)-&gt;root = btrfs_grab_root(fs_info-&gt;tree_root);</div><div class='del'>-	memset(&amp;BTRFS_I(inode)-&gt;location, 0, sizeof(struct btrfs_key));</div><div class='ctx'> 	set_bit(BTRFS_INODE_DUMMY, &amp;BTRFS_I(inode)-&gt;runtime_flags);</div><div class='del'>-	btrfs_insert_inode_hash(inode);</div><div class='add'>+	__insert_inode_hash(inode, hash);</div><div class='add'>+	set_bit(AS_KERNEL_FILE, &amp;inode-&gt;i_mapping-&gt;flags);</div><div class='add'>+	fs_info-&gt;btree_inode = inode;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void btrfs_init_dev_replace_locks(struct btrfs_fs_info *fs_info)</div><div class='hunk'>@@ -2278,20 +1943,19 @@ static void btrfs_init_qgroup(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	fs_info-&gt;qgroup_tree = RB_ROOT;</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;fs_info-&gt;dirty_qgroups);</div><div class='ctx'> 	fs_info-&gt;qgroup_seq = 1;</div><div class='del'>-	fs_info-&gt;qgroup_ulist = NULL;</div><div class='ctx'> 	fs_info-&gt;qgroup_rescan_running = false;</div><div class='add'>+	fs_info-&gt;qgroup_drop_subtree_thres = BTRFS_QGROUP_DROP_SUBTREE_THRES_DEFAULT;</div><div class='ctx'> 	mutex_init(&amp;fs_info-&gt;qgroup_rescan_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btrfs_init_workqueues(struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct btrfs_fs_devices *fs_devices)</div><div class='add'>+static int btrfs_init_workqueues(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	u32 max_active = fs_info-&gt;thread_pool_size;</div><div class='ctx'> 	unsigned int flags = WQ_MEM_RECLAIM | WQ_FREEZABLE | WQ_UNBOUND;</div><div class='add'>+	unsigned int ordered_flags = WQ_MEM_RECLAIM | WQ_FREEZABLE | WQ_PERCPU;</div><div class='ctx'> </div><div class='ctx'> 	fs_info-&gt;workers =</div><div class='del'>-		btrfs_alloc_workqueue(fs_info, "worker",</div><div class='del'>-				      flags | WQ_HIGHPRI, max_active, 16);</div><div class='add'>+		btrfs_alloc_workqueue(fs_info, "worker", flags, max_active, 16);</div><div class='ctx'> </div><div class='ctx'> 	fs_info-&gt;delalloc_workers =</div><div class='ctx'> 		btrfs_alloc_workqueue(fs_info, "delalloc",</div><div class='hunk'>@@ -2305,25 +1969,13 @@ static int btrfs_init_workqueues(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		btrfs_alloc_workqueue(fs_info, "cache", flags, max_active, 0);</div><div class='ctx'> </div><div class='ctx'> 	fs_info-&gt;fixup_workers =</div><div class='del'>-		btrfs_alloc_workqueue(fs_info, "fixup", flags, 1, 0);</div><div class='add'>+		btrfs_alloc_ordered_workqueue(fs_info, "fixup", ordered_flags);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * endios are largely parallel and should have a very</div><div class='del'>-	 * low idle thresh</div><div class='del'>-	 */</div><div class='ctx'> 	fs_info-&gt;endio_workers =</div><div class='del'>-		btrfs_alloc_workqueue(fs_info, "endio", flags, max_active, 4);</div><div class='add'>+		alloc_workqueue("btrfs-endio", flags, max_active);</div><div class='ctx'> 	fs_info-&gt;endio_meta_workers =</div><div class='del'>-		btrfs_alloc_workqueue(fs_info, "endio-meta", flags,</div><div class='del'>-				      max_active, 4);</div><div class='del'>-	fs_info-&gt;endio_meta_write_workers =</div><div class='del'>-		btrfs_alloc_workqueue(fs_info, "endio-meta-write", flags,</div><div class='del'>-				      max_active, 2);</div><div class='del'>-	fs_info-&gt;endio_raid56_workers =</div><div class='del'>-		btrfs_alloc_workqueue(fs_info, "endio-raid56", flags,</div><div class='del'>-				      max_active, 4);</div><div class='del'>-	fs_info-&gt;rmw_workers =</div><div class='del'>-		btrfs_alloc_workqueue(fs_info, "rmw", flags, max_active, 2);</div><div class='add'>+		alloc_workqueue("btrfs-endio-meta", flags, max_active);</div><div class='add'>+	fs_info-&gt;rmw_workers = alloc_workqueue("btrfs-rmw", flags, max_active);</div><div class='ctx'> 	fs_info-&gt;endio_write_workers =</div><div class='ctx'> 		btrfs_alloc_workqueue(fs_info, "endio-write", flags,</div><div class='ctx'> 				      max_active, 2);</div><div class='hunk'>@@ -2333,23 +1985,19 @@ static int btrfs_init_workqueues(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	fs_info-&gt;delayed_workers =</div><div class='ctx'> 		btrfs_alloc_workqueue(fs_info, "delayed-meta", flags,</div><div class='ctx'> 				      max_active, 0);</div><div class='del'>-	fs_info-&gt;readahead_workers =</div><div class='del'>-		btrfs_alloc_workqueue(fs_info, "readahead", flags,</div><div class='del'>-				      max_active, 2);</div><div class='ctx'> 	fs_info-&gt;qgroup_rescan_workers =</div><div class='del'>-		btrfs_alloc_workqueue(fs_info, "qgroup-rescan", flags, 1, 0);</div><div class='add'>+		btrfs_alloc_ordered_workqueue(fs_info, "qgroup-rescan",</div><div class='add'>+					      ordered_flags);</div><div class='ctx'> 	fs_info-&gt;discard_ctl.discard_workers =</div><div class='del'>-		alloc_workqueue("btrfs_discard", WQ_UNBOUND | WQ_FREEZABLE, 1);</div><div class='add'>+		alloc_ordered_workqueue("btrfs-discard", WQ_FREEZABLE);</div><div class='ctx'> </div><div class='del'>-	if (!(fs_info-&gt;workers &amp;&amp; fs_info-&gt;delalloc_workers &amp;&amp;</div><div class='del'>-	      fs_info-&gt;flush_workers &amp;&amp;</div><div class='add'>+	if (!(fs_info-&gt;workers &amp;&amp;</div><div class='add'>+	      fs_info-&gt;delalloc_workers &amp;&amp; fs_info-&gt;flush_workers &amp;&amp;</div><div class='ctx'> 	      fs_info-&gt;endio_workers &amp;&amp; fs_info-&gt;endio_meta_workers &amp;&amp;</div><div class='del'>-	      fs_info-&gt;endio_meta_write_workers &amp;&amp;</div><div class='del'>-	      fs_info-&gt;endio_write_workers &amp;&amp; fs_info-&gt;endio_raid56_workers &amp;&amp;</div><div class='add'>+	      fs_info-&gt;endio_write_workers &amp;&amp;</div><div class='ctx'> 	      fs_info-&gt;endio_freespace_worker &amp;&amp; fs_info-&gt;rmw_workers &amp;&amp;</div><div class='del'>-	      fs_info-&gt;caching_workers &amp;&amp; fs_info-&gt;readahead_workers &amp;&amp;</div><div class='del'>-	      fs_info-&gt;fixup_workers &amp;&amp; fs_info-&gt;delayed_workers &amp;&amp;</div><div class='del'>-	      fs_info-&gt;qgroup_rescan_workers &amp;&amp;</div><div class='add'>+	      fs_info-&gt;caching_workers &amp;&amp; fs_info-&gt;fixup_workers &amp;&amp;</div><div class='add'>+	      fs_info-&gt;delayed_workers &amp;&amp; fs_info-&gt;qgroup_rescan_workers &amp;&amp;</div><div class='ctx'> 	      fs_info-&gt;discard_ctl.discard_workers)) {</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2372,6 +2020,22 @@ static int btrfs_init_csum_hash(struct btrfs_fs_info *fs_info, u16 csum_type)</div><div class='ctx'> </div><div class='ctx'> 	fs_info-&gt;csum_shash = csum_shash;</div><div class='ctx'> </div><div class='add'>+	/* Check if the checksum implementation is a fast accelerated one. */</div><div class='add'>+	switch (csum_type) {</div><div class='add'>+	case BTRFS_CSUM_TYPE_CRC32:</div><div class='add'>+		if (crc32_optimizations() &amp; CRC32C_OPTIMIZATION)</div><div class='add'>+			set_bit(BTRFS_FS_CSUM_IMPL_FAST, &amp;fs_info-&gt;flags);</div><div class='add'>+		break;</div><div class='add'>+	case BTRFS_CSUM_TYPE_XXHASH:</div><div class='add'>+		set_bit(BTRFS_FS_CSUM_IMPL_FAST, &amp;fs_info-&gt;flags);</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	btrfs_info(fs_info, "using %s (%s) checksum algorithm",</div><div class='add'>+			btrfs_super_csum_name(csum_type),</div><div class='add'>+			crypto_shash_driver_name(csum_shash));</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2379,12 +2043,13 @@ static int btrfs_replay_log(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			    struct btrfs_fs_devices *fs_devices)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='add'>+	struct btrfs_tree_parent_check check = { 0 };</div><div class='ctx'> 	struct btrfs_root *log_tree_root;</div><div class='ctx'> 	struct btrfs_super_block *disk_super = fs_info-&gt;super_copy;</div><div class='ctx'> 	u64 bytenr = btrfs_super_log_root(disk_super);</div><div class='ctx'> 	int level = btrfs_super_log_root_level(disk_super);</div><div class='ctx'> </div><div class='del'>-	if (fs_devices-&gt;rw_devices == 0) {</div><div class='add'>+	if (unlikely(fs_devices-&gt;rw_devices == 0)) {</div><div class='ctx'> 		btrfs_warn(fs_info, "log replay required on RO media");</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2394,27 +2059,29 @@ static int btrfs_replay_log(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	if (!log_tree_root)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	log_tree_root-&gt;node = read_tree_block(fs_info, bytenr,</div><div class='del'>-					      BTRFS_TREE_LOG_OBJECTID,</div><div class='del'>-					      fs_info-&gt;generation + 1, level,</div><div class='del'>-					      NULL);</div><div class='add'>+	check.level = level;</div><div class='add'>+	check.transid = fs_info-&gt;generation + 1;</div><div class='add'>+	check.owner_root = BTRFS_TREE_LOG_OBJECTID;</div><div class='add'>+	log_tree_root-&gt;node = read_tree_block(fs_info, bytenr, &amp;check);</div><div class='ctx'> 	if (IS_ERR(log_tree_root-&gt;node)) {</div><div class='ctx'> 		btrfs_warn(fs_info, "failed to read log tree");</div><div class='ctx'> 		ret = PTR_ERR(log_tree_root-&gt;node);</div><div class='ctx'> 		log_tree_root-&gt;node = NULL;</div><div class='ctx'> 		btrfs_put_root(log_tree_root);</div><div class='ctx'> 		return ret;</div><div class='del'>-	} else if (!extent_buffer_uptodate(log_tree_root-&gt;node)) {</div><div class='add'>+	}</div><div class='add'>+	if (unlikely(!extent_buffer_uptodate(log_tree_root-&gt;node))) {</div><div class='ctx'> 		btrfs_err(fs_info, "failed to read log tree");</div><div class='ctx'> 		btrfs_put_root(log_tree_root);</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> 	/* returns with log_tree_root freed on success */</div><div class='ctx'> 	ret = btrfs_recover_log_trees(log_tree_root);</div><div class='add'>+	btrfs_put_root(log_tree_root);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		btrfs_handle_fs_error(fs_info, ret,</div><div class='ctx'> 				      "Failed to recover log tree");</div><div class='del'>-		btrfs_put_root(log_tree_root);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -2427,6 +2094,113 @@ static int btrfs_replay_log(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int load_global_roots_objectid(struct btrfs_root *tree_root,</div><div class='add'>+				      struct btrfs_path *path, u64 objectid,</div><div class='add'>+				      const char *name)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = tree_root-&gt;fs_info;</div><div class='add'>+	struct btrfs_root *root;</div><div class='add'>+	u64 max_global_id = 0;</div><div class='add'>+	int ret;</div><div class='add'>+	struct btrfs_key key = {</div><div class='add'>+		.objectid = objectid,</div><div class='add'>+		.type = BTRFS_ROOT_ITEM_KEY,</div><div class='add'>+		.offset = 0,</div><div class='add'>+	};</div><div class='add'>+	bool found = false;</div><div class='add'>+</div><div class='add'>+	/* If we have IGNOREDATACSUMS skip loading these roots. */</div><div class='add'>+	if (objectid == BTRFS_CSUM_TREE_OBJECTID &amp;&amp;</div><div class='add'>+	    btrfs_test_opt(fs_info, IGNOREDATACSUMS)) {</div><div class='add'>+		set_bit(BTRFS_FS_STATE_NO_DATA_CSUMS, &amp;fs_info-&gt;fs_state);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	while (1) {</div><div class='add'>+		ret = btrfs_search_slot(NULL, tree_root, &amp;key, path, 0, 0);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		if (path-&gt;slots[0] &gt;= btrfs_header_nritems(path-&gt;nodes[0])) {</div><div class='add'>+			ret = btrfs_next_leaf(tree_root, path);</div><div class='add'>+			if (ret) {</div><div class='add'>+				if (ret &gt; 0)</div><div class='add'>+					ret = 0;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+		ret = 0;</div><div class='add'>+</div><div class='add'>+		btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, path-&gt;slots[0]);</div><div class='add'>+		if (key.objectid != objectid)</div><div class='add'>+			break;</div><div class='add'>+		btrfs_release_path(path);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Just worry about this for extent tree, it'll be the same for</div><div class='add'>+		 * everybody.</div><div class='add'>+		 */</div><div class='add'>+		if (objectid == BTRFS_EXTENT_TREE_OBJECTID)</div><div class='add'>+			max_global_id = max(max_global_id, key.offset);</div><div class='add'>+</div><div class='add'>+		found = true;</div><div class='add'>+		root = read_tree_root_path(tree_root, path, &amp;key);</div><div class='add'>+		if (IS_ERR(root)) {</div><div class='add'>+			ret = PTR_ERR(root);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		set_bit(BTRFS_ROOT_TRACK_DIRTY, &amp;root-&gt;state);</div><div class='add'>+		ret = btrfs_global_root_insert(root);</div><div class='add'>+		if (ret) {</div><div class='add'>+			btrfs_put_root(root);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		key.offset++;</div><div class='add'>+	}</div><div class='add'>+	btrfs_release_path(path);</div><div class='add'>+</div><div class='add'>+	if (objectid == BTRFS_EXTENT_TREE_OBJECTID)</div><div class='add'>+		fs_info-&gt;nr_global_roots = max_global_id + 1;</div><div class='add'>+</div><div class='add'>+	if (!found || ret) {</div><div class='add'>+		if (objectid == BTRFS_CSUM_TREE_OBJECTID)</div><div class='add'>+			set_bit(BTRFS_FS_STATE_NO_DATA_CSUMS, &amp;fs_info-&gt;fs_state);</div><div class='add'>+</div><div class='add'>+		if (!btrfs_test_opt(fs_info, IGNOREBADROOTS))</div><div class='add'>+			ret = ret ? ret : -ENOENT;</div><div class='add'>+		else</div><div class='add'>+			ret = 0;</div><div class='add'>+		btrfs_err(fs_info, "failed to load root %s", name);</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int load_global_roots(struct btrfs_root *tree_root)</div><div class='add'>+{</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	path = btrfs_alloc_path();</div><div class='add'>+	if (!path)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	ret = load_global_roots_objectid(tree_root, path,</div><div class='add'>+					 BTRFS_EXTENT_TREE_OBJECTID, "extent");</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+	ret = load_global_roots_objectid(tree_root, path,</div><div class='add'>+					 BTRFS_CSUM_TREE_OBJECTID, "csum");</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+	if (!btrfs_fs_compat_ro(tree_root-&gt;fs_info, FREE_SPACE_TREE))</div><div class='add'>+		return ret;</div><div class='add'>+	ret = load_global_roots_objectid(tree_root, path,</div><div class='add'>+					 BTRFS_FREE_SPACE_TREE_OBJECTID,</div><div class='add'>+					 "free space");</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int btrfs_read_roots(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *tree_root = fs_info-&gt;tree_root;</div><div class='hunk'>@@ -2434,21 +2208,27 @@ static int btrfs_read_roots(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	struct btrfs_key location;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(!fs_info-&gt;tree_root);</div><div class='add'>+	ASSERT(fs_info-&gt;tree_root);</div><div class='add'>+</div><div class='add'>+	ret = load_global_roots(tree_root);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	location.objectid = BTRFS_EXTENT_TREE_OBJECTID;</div><div class='ctx'> 	location.type = BTRFS_ROOT_ITEM_KEY;</div><div class='ctx'> 	location.offset = 0;</div><div class='ctx'> </div><div class='del'>-	root = btrfs_read_tree_root(tree_root, &amp;location);</div><div class='del'>-	if (IS_ERR(root)) {</div><div class='del'>-		if (!btrfs_test_opt(fs_info, IGNOREBADROOTS)) {</div><div class='del'>-			ret = PTR_ERR(root);</div><div class='del'>-			goto out;</div><div class='add'>+	if (btrfs_fs_compat_ro(fs_info, BLOCK_GROUP_TREE)) {</div><div class='add'>+		location.objectid = BTRFS_BLOCK_GROUP_TREE_OBJECTID;</div><div class='add'>+		root = btrfs_read_tree_root(tree_root, &amp;location);</div><div class='add'>+		if (IS_ERR(root)) {</div><div class='add'>+			if (!btrfs_test_opt(fs_info, IGNOREBADROOTS)) {</div><div class='add'>+				ret = PTR_ERR(root);</div><div class='add'>+				goto out;</div><div class='add'>+			}</div><div class='add'>+		} else {</div><div class='add'>+			set_bit(BTRFS_ROOT_TRACK_DIRTY, &amp;root-&gt;state);</div><div class='add'>+			fs_info-&gt;block_group_root = root;</div><div class='ctx'> 		}</div><div class='del'>-	} else {</div><div class='del'>-		set_bit(BTRFS_ROOT_TRACK_DIRTY, &amp;root-&gt;state);</div><div class='del'>-		fs_info-&gt;extent_root = root;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	location.objectid = BTRFS_DEV_TREE_OBJECTID;</div><div class='hunk'>@@ -2463,22 +2243,9 @@ static int btrfs_read_roots(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 		fs_info-&gt;dev_root = root;</div><div class='ctx'> 	}</div><div class='ctx'> 	/* Initialize fs_info for all devices in any case */</div><div class='del'>-	btrfs_init_devices_late(fs_info);</div><div class='del'>-</div><div class='del'>-	/* If IGNOREDATACSUMS is set don't bother reading the csum root. */</div><div class='del'>-	if (!btrfs_test_opt(fs_info, IGNOREDATACSUMS)) {</div><div class='del'>-		location.objectid = BTRFS_CSUM_TREE_OBJECTID;</div><div class='del'>-		root = btrfs_read_tree_root(tree_root, &amp;location);</div><div class='del'>-		if (IS_ERR(root)) {</div><div class='del'>-			if (!btrfs_test_opt(fs_info, IGNOREBADROOTS)) {</div><div class='del'>-				ret = PTR_ERR(root);</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-		} else {</div><div class='del'>-			set_bit(BTRFS_ROOT_TRACK_DIRTY, &amp;root-&gt;state);</div><div class='del'>-			fs_info-&gt;csum_root = root;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	ret = btrfs_init_devices_late(fs_info);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * This tree can share blocks with some other fs tree during relocation</div><div class='hunk'>@@ -2500,7 +2267,6 @@ static int btrfs_read_roots(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	root = btrfs_read_tree_root(tree_root, &amp;location);</div><div class='ctx'> 	if (!IS_ERR(root)) {</div><div class='ctx'> 		set_bit(BTRFS_ROOT_TRACK_DIRTY, &amp;root-&gt;state);</div><div class='del'>-		set_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags);</div><div class='ctx'> 		fs_info-&gt;quota_root = root;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -2517,17 +2283,17 @@ static int btrfs_read_roots(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 		fs_info-&gt;uuid_root = root;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (btrfs_fs_compat_ro(fs_info, FREE_SPACE_TREE)) {</div><div class='del'>-		location.objectid = BTRFS_FREE_SPACE_TREE_OBJECTID;</div><div class='add'>+	if (btrfs_fs_incompat(fs_info, RAID_STRIPE_TREE)) {</div><div class='add'>+		location.objectid = BTRFS_RAID_STRIPE_TREE_OBJECTID;</div><div class='ctx'> 		root = btrfs_read_tree_root(tree_root, &amp;location);</div><div class='ctx'> 		if (IS_ERR(root)) {</div><div class='ctx'> 			if (!btrfs_test_opt(fs_info, IGNOREBADROOTS)) {</div><div class='ctx'> 				ret = PTR_ERR(root);</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='del'>-		}  else {</div><div class='add'>+		} else {</div><div class='ctx'> 			set_bit(BTRFS_ROOT_TRACK_DIRTY, &amp;root-&gt;state);</div><div class='del'>-			fs_info-&gt;free_space_root = root;</div><div class='add'>+			fs_info-&gt;stripe_root = root;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -2538,6 +2304,71 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int validate_sys_chunk_array(const struct btrfs_fs_info *fs_info,</div><div class='add'>+				    const struct btrfs_super_block *sb)</div><div class='add'>+{</div><div class='add'>+	unsigned int cur = 0; /* Offset inside the sys chunk array */</div><div class='add'>+	/*</div><div class='add'>+	 * At sb read time, fs_info is not fully initialized. Thus we have</div><div class='add'>+	 * to use super block sectorsize, which should have been validated.</div><div class='add'>+	 */</div><div class='add'>+	const u32 sectorsize = btrfs_super_sectorsize(sb);</div><div class='add'>+	u32 sys_array_size = btrfs_super_sys_array_size(sb);</div><div class='add'>+</div><div class='add'>+	if (unlikely(sys_array_size &gt; BTRFS_SYSTEM_CHUNK_ARRAY_SIZE)) {</div><div class='add'>+		btrfs_err(fs_info, "system chunk array too big %u &gt; %u",</div><div class='add'>+			  sys_array_size, BTRFS_SYSTEM_CHUNK_ARRAY_SIZE);</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	while (cur &lt; sys_array_size) {</div><div class='add'>+		struct btrfs_disk_key *disk_key;</div><div class='add'>+		struct btrfs_chunk *chunk;</div><div class='add'>+		struct btrfs_key key;</div><div class='add'>+		u64 type;</div><div class='add'>+		u16 num_stripes;</div><div class='add'>+		u32 len;</div><div class='add'>+		int ret;</div><div class='add'>+</div><div class='add'>+		disk_key = (struct btrfs_disk_key *)(sb-&gt;sys_chunk_array + cur);</div><div class='add'>+		len = sizeof(*disk_key);</div><div class='add'>+</div><div class='add'>+		if (unlikely(cur + len &gt; sys_array_size))</div><div class='add'>+			goto short_read;</div><div class='add'>+		cur += len;</div><div class='add'>+</div><div class='add'>+		btrfs_disk_key_to_cpu(&amp;key, disk_key);</div><div class='add'>+		if (unlikely(key.type != BTRFS_CHUNK_ITEM_KEY)) {</div><div class='add'>+			btrfs_err(fs_info,</div><div class='add'>+			    "unexpected item type %u in sys_array at offset %u",</div><div class='add'>+				  key.type, cur);</div><div class='add'>+			return -EUCLEAN;</div><div class='add'>+		}</div><div class='add'>+		chunk = (struct btrfs_chunk *)(sb-&gt;sys_chunk_array + cur);</div><div class='add'>+		num_stripes = btrfs_stack_chunk_num_stripes(chunk);</div><div class='add'>+		if (unlikely(cur + btrfs_chunk_item_size(num_stripes) &gt; sys_array_size))</div><div class='add'>+			goto short_read;</div><div class='add'>+		type = btrfs_stack_chunk_type(chunk);</div><div class='add'>+		if (unlikely(!(type &amp; BTRFS_BLOCK_GROUP_SYSTEM))) {</div><div class='add'>+			btrfs_err(fs_info,</div><div class='add'>+			"invalid chunk type %llu in sys_array at offset %u",</div><div class='add'>+				  type, cur);</div><div class='add'>+			return -EUCLEAN;</div><div class='add'>+		}</div><div class='add'>+		ret = btrfs_check_chunk_valid(fs_info, NULL, chunk, key.offset,</div><div class='add'>+					      sectorsize);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='add'>+		cur += btrfs_chunk_item_size(num_stripes);</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+short_read:</div><div class='add'>+	btrfs_err(fs_info,</div><div class='add'>+	"super block sys chunk array short read, cur=%u sys_array_size=%u",</div><div class='add'>+		  cur, sys_array_size);</div><div class='add'>+	return -EUCLEAN;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Real super block validation</div><div class='ctx'>  * NOTE: super csum type and incompat features will not be checked here.</div><div class='hunk'>@@ -2548,21 +2379,29 @@ out:</div><div class='ctx'>  * 		1, 2	2nd and 3rd backup copy</div><div class='ctx'>  * 	       -1	skip bytenr check</div><div class='ctx'>  */</div><div class='del'>-static int validate_super(struct btrfs_fs_info *fs_info,</div><div class='del'>-			    struct btrfs_super_block *sb, int mirror_num)</div><div class='add'>+int btrfs_validate_super(const struct btrfs_fs_info *fs_info,</div><div class='add'>+			 const struct btrfs_super_block *sb, int mirror_num)</div><div class='ctx'> {</div><div class='ctx'> 	u64 nodesize = btrfs_super_nodesize(sb);</div><div class='ctx'> 	u64 sectorsize = btrfs_super_sectorsize(sb);</div><div class='ctx'> 	int ret = 0;</div><div class='add'>+	const bool ignore_flags = btrfs_test_opt(fs_info, IGNORESUPERFLAGS);</div><div class='ctx'> </div><div class='ctx'> 	if (btrfs_super_magic(sb) != BTRFS_MAGIC) {</div><div class='ctx'> 		btrfs_err(fs_info, "no valid FS found");</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-	if (btrfs_super_flags(sb) &amp; ~BTRFS_SUPER_FLAG_SUPP) {</div><div class='del'>-		btrfs_err(fs_info, "unrecognized or unsupported super flag: %llu",</div><div class='del'>-				btrfs_super_flags(sb) &amp; ~BTRFS_SUPER_FLAG_SUPP);</div><div class='del'>-		ret = -EINVAL;</div><div class='add'>+	if ((btrfs_super_flags(sb) &amp; ~BTRFS_SUPER_FLAG_SUPP)) {</div><div class='add'>+		if (!ignore_flags) {</div><div class='add'>+			btrfs_err(fs_info,</div><div class='add'>+			"unrecognized or unsupported super flag 0x%llx",</div><div class='add'>+				  btrfs_super_flags(sb) &amp; ~BTRFS_SUPER_FLAG_SUPP);</div><div class='add'>+			ret = -EINVAL;</div><div class='add'>+		} else {</div><div class='add'>+			btrfs_info(fs_info,</div><div class='add'>+			"unrecognized or unsupported super flags: 0x%llx, ignored",</div><div class='add'>+				   btrfs_super_flags(sb) &amp; ~BTRFS_SUPER_FLAG_SUPP);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> 	if (btrfs_super_root_level(sb) &gt;= BTRFS_MAX_LEVEL) {</div><div class='ctx'> 		btrfs_err(fs_info, "tree_root level too big: %d &gt;= %d",</div><div class='hunk'>@@ -2584,19 +2423,13 @@ static int validate_super(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	 * Check sectorsize and nodesize first, other check will need it.</div><div class='ctx'> 	 * Check all possible sectorsize(4K, 8K, 16K, 32K, 64K) here.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!is_power_of_2(sectorsize) || sectorsize &lt; 4096 ||</div><div class='add'>+	if (!is_power_of_2(sectorsize) || sectorsize &lt; BTRFS_MIN_BLOCKSIZE ||</div><div class='ctx'> 	    sectorsize &gt; BTRFS_MAX_METADATA_BLOCKSIZE) {</div><div class='ctx'> 		btrfs_err(fs_info, "invalid sectorsize %llu", sectorsize);</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * For 4K page size, we only support 4K sector size.</div><div class='del'>-	 * For 64K page size, we support 64K and 4K sector sizes.</div><div class='del'>-	 */</div><div class='del'>-	if ((PAGE_SIZE == SZ_4K &amp;&amp; sectorsize != PAGE_SIZE) ||</div><div class='del'>-	    (PAGE_SIZE == SZ_64K &amp;&amp; (sectorsize != SZ_4K &amp;&amp;</div><div class='del'>-				     sectorsize != SZ_64K))) {</div><div class='add'>+	if (!btrfs_supported_blocksize(sectorsize)) {</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='ctx'> 			"sectorsize %llu not yet supported for page size %lu",</div><div class='ctx'> 			sectorsize, PAGE_SIZE);</div><div class='hunk'>@@ -2631,21 +2464,19 @@ static int validate_super(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (memcmp(fs_info-&gt;fs_devices-&gt;fsid, fs_info-&gt;super_copy-&gt;fsid,</div><div class='del'>-		   BTRFS_FSID_SIZE)) {</div><div class='add'>+	if (!fs_info-&gt;fs_devices-&gt;temp_fsid &amp;&amp;</div><div class='add'>+	    memcmp(fs_info-&gt;fs_devices-&gt;fsid, sb-&gt;fsid, BTRFS_FSID_SIZE) != 0) {</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='ctx'> 		"superblock fsid doesn't match fsid of fs_devices: %pU != %pU",</div><div class='del'>-			fs_info-&gt;super_copy-&gt;fsid, fs_info-&gt;fs_devices-&gt;fsid);</div><div class='add'>+			  sb-&gt;fsid, fs_info-&gt;fs_devices-&gt;fsid);</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (btrfs_fs_incompat(fs_info, METADATA_UUID) &amp;&amp;</div><div class='del'>-	    memcmp(fs_info-&gt;fs_devices-&gt;metadata_uuid,</div><div class='del'>-		   fs_info-&gt;super_copy-&gt;metadata_uuid, BTRFS_FSID_SIZE)) {</div><div class='add'>+	if (memcmp(fs_info-&gt;fs_devices-&gt;metadata_uuid, btrfs_sb_fsid_ptr(sb),</div><div class='add'>+		   BTRFS_FSID_SIZE) != 0) {</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='ctx'> "superblock metadata_uuid doesn't match metadata uuid of fs_devices: %pU != %pU",</div><div class='del'>-			fs_info-&gt;super_copy-&gt;metadata_uuid,</div><div class='del'>-			fs_info-&gt;fs_devices-&gt;metadata_uuid);</div><div class='add'>+			  btrfs_sb_fsid_ptr(sb), fs_info-&gt;fs_devices-&gt;metadata_uuid);</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -2658,6 +2489,18 @@ static int validate_super(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='add'>+	 * Artificial requirement for block-group-tree to force newer features</div><div class='add'>+	 * (free-space-tree, no-holes) so the test matrix is smaller.</div><div class='add'>+	 */</div><div class='add'>+	if (btrfs_fs_compat_ro(fs_info, BLOCK_GROUP_TREE) &amp;&amp;</div><div class='add'>+	    (!btrfs_fs_compat_ro(fs_info, FREE_SPACE_TREE_VALID) ||</div><div class='add'>+	     !btrfs_fs_incompat(fs_info, NO_HOLES))) {</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+		"block-group-tree feature requires free-space-tree and no-holes");</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='ctx'> 	 * Hint to catch really bogus numbers, bitflips or so, more exact checks are</div><div class='ctx'> 	 * done later</div><div class='ctx'> 	 */</div><div class='hunk'>@@ -2686,6 +2529,11 @@ static int validate_super(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	ret = validate_sys_chunk_array(fs_info, sb);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Obvious sys_chunk_array corruptions, it must hold at least one key</div><div class='ctx'> 	 * and one chunk</div><div class='hunk'>@@ -2731,7 +2579,7 @@ static int validate_super(struct btrfs_fs_info *fs_info,</div><div class='ctx'>  */</div><div class='ctx'> static int btrfs_validate_mount_super(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	return validate_super(fs_info, fs_info-&gt;super_copy, 0);</div><div class='add'>+	return btrfs_validate_super(fs_info, fs_info-&gt;super_copy, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2745,16 +2593,16 @@ static int btrfs_validate_write_super(struct btrfs_fs_info *fs_info,</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = validate_super(fs_info, sb, -1);</div><div class='add'>+	ret = btrfs_validate_super(fs_info, sb, -1);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='del'>-	if (!btrfs_supported_super_csum(btrfs_super_csum_type(sb))) {</div><div class='add'>+	if (unlikely(!btrfs_supported_super_csum(btrfs_super_csum_type(sb)))) {</div><div class='ctx'> 		ret = -EUCLEAN;</div><div class='ctx'> 		btrfs_err(fs_info, "invalid csum type, has %u want %u",</div><div class='ctx'> 			  btrfs_super_csum_type(sb), BTRFS_CSUM_TYPE_CRC32);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (btrfs_super_incompat_flags(sb) &amp; ~BTRFS_FEATURE_INCOMPAT_SUPP) {</div><div class='add'>+	if (unlikely(btrfs_super_incompat_flags(sb) &amp; ~BTRFS_FEATURE_INCOMPAT_SUPP)) {</div><div class='ctx'> 		ret = -EUCLEAN;</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='ctx'> 		"invalid incompat flags, has 0x%llx valid mask 0x%llx",</div><div class='hunk'>@@ -2769,6 +2617,50 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int load_super_root(struct btrfs_root *root, u64 bytenr, u64 gen, int level)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_tree_parent_check check = {</div><div class='add'>+		.level = level,</div><div class='add'>+		.transid = gen,</div><div class='add'>+		.owner_root = btrfs_root_id(root)</div><div class='add'>+	};</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	root-&gt;node = read_tree_block(root-&gt;fs_info, bytenr, &amp;check);</div><div class='add'>+	if (IS_ERR(root-&gt;node)) {</div><div class='add'>+		ret = PTR_ERR(root-&gt;node);</div><div class='add'>+		root-&gt;node = NULL;</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+	if (unlikely(!extent_buffer_uptodate(root-&gt;node))) {</div><div class='add'>+		free_extent_buffer(root-&gt;node);</div><div class='add'>+		root-&gt;node = NULL;</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	btrfs_set_root_node(&amp;root-&gt;root_item, root-&gt;node);</div><div class='add'>+	root-&gt;commit_root = btrfs_root_node(root);</div><div class='add'>+	btrfs_set_root_refs(&amp;root-&gt;root_item, 1);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int load_important_roots(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_super_block *sb = fs_info-&gt;super_copy;</div><div class='add'>+	u64 gen, bytenr;</div><div class='add'>+	int level, ret;</div><div class='add'>+</div><div class='add'>+	bytenr = btrfs_super_root(sb);</div><div class='add'>+	gen = btrfs_super_generation(sb);</div><div class='add'>+	level = btrfs_super_root_level(sb);</div><div class='add'>+	ret = load_super_root(fs_info-&gt;tree_root, bytenr, gen, level);</div><div class='add'>+	if (ret) {</div><div class='add'>+		btrfs_warn(fs_info, "couldn't read tree root");</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int __cold init_tree_roots(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	int backup_index = find_newest_super_backup(fs_info);</div><div class='hunk'>@@ -2779,9 +2671,6 @@ static int __cold init_tree_roots(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; BTRFS_NUM_BACKUP_ROOTS; i++) {</div><div class='del'>-		u64 generation;</div><div class='del'>-		int level;</div><div class='del'>-</div><div class='ctx'> 		if (handle_error) {</div><div class='ctx'> 			if (!IS_ERR(tree_root-&gt;node))</div><div class='ctx'> 				free_extent_buffer(tree_root-&gt;node);</div><div class='hunk'>@@ -2798,37 +2687,19 @@ static int __cold init_tree_roots(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 			 */</div><div class='ctx'> 			btrfs_set_super_log_root(sb, 0);</div><div class='ctx'> </div><div class='del'>-			/* We can't trust the free space cache either */</div><div class='del'>-			btrfs_set_opt(fs_info-&gt;mount_opt, CLEAR_CACHE);</div><div class='del'>-</div><div class='add'>+			btrfs_warn(fs_info, "try to load backup roots slot %d", i);</div><div class='ctx'> 			ret = read_backup_root(fs_info, i);</div><div class='ctx'> 			backup_index = ret;</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='ctx'> 				return ret;</div><div class='ctx'> 		}</div><div class='del'>-		generation = btrfs_super_generation(sb);</div><div class='del'>-		level = btrfs_super_root_level(sb);</div><div class='del'>-		tree_root-&gt;node = read_tree_block(fs_info, btrfs_super_root(sb),</div><div class='del'>-						  BTRFS_ROOT_TREE_OBJECTID,</div><div class='del'>-						  generation, level, NULL);</div><div class='del'>-		if (IS_ERR(tree_root-&gt;node)) {</div><div class='del'>-			handle_error = true;</div><div class='del'>-			ret = PTR_ERR(tree_root-&gt;node);</div><div class='del'>-			tree_root-&gt;node = NULL;</div><div class='del'>-			btrfs_warn(fs_info, "couldn't read tree root");</div><div class='del'>-			continue;</div><div class='ctx'> </div><div class='del'>-		} else if (!extent_buffer_uptodate(tree_root-&gt;node)) {</div><div class='add'>+		ret = load_important_roots(fs_info);</div><div class='add'>+		if (ret) {</div><div class='ctx'> 			handle_error = true;</div><div class='del'>-			ret = -EIO;</div><div class='del'>-			btrfs_warn(fs_info, "error while reading tree root");</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		btrfs_set_root_node(&amp;tree_root-&gt;root_item, tree_root-&gt;node);</div><div class='del'>-		tree_root-&gt;commit_root = btrfs_root_node(tree_root);</div><div class='del'>-		btrfs_set_root_refs(&amp;tree_root-&gt;root_item, 1);</div><div class='del'>-</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * No need to hold btrfs_root::objectid_mutex since the fs</div><div class='ctx'> 		 * hasn't been fully initialised and we are the only user</div><div class='hunk'>@@ -2848,8 +2719,9 @@ static int __cold init_tree_roots(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* All successful */</div><div class='del'>-		fs_info-&gt;generation = generation;</div><div class='del'>-		fs_info-&gt;last_trans_committed = generation;</div><div class='add'>+		fs_info-&gt;generation = btrfs_header_generation(tree_root-&gt;node);</div><div class='add'>+		btrfs_set_last_trans_committed(fs_info, fs_info-&gt;generation);</div><div class='add'>+		fs_info-&gt;last_reloc_trans = 0;</div><div class='ctx'> </div><div class='ctx'> 		/* Always begin writing backup roots after the one being used */</div><div class='ctx'> 		if (backup_index &lt; 0) {</div><div class='hunk'>@@ -2864,10 +2736,21 @@ static int __cold init_tree_roots(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Lockdep gets confused between our buffer_tree which requires IRQ locking because</div><div class='add'>+ * we modify marks in the IRQ context, and our delayed inode xarray which doesn't</div><div class='add'>+ * have these requirements. Use a class key so lockdep doesn't get them mixed up.</div><div class='add'>+ */</div><div class='add'>+static struct lock_class_key buffer_xa_class;</div><div class='add'>+</div><div class='ctx'> void btrfs_init_fs_info(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	INIT_RADIX_TREE(&amp;fs_info-&gt;fs_roots_radix, GFP_ATOMIC);</div><div class='del'>-	INIT_RADIX_TREE(&amp;fs_info-&gt;buffer_radix, GFP_ATOMIC);</div><div class='add'>+</div><div class='add'>+	/* Use the same flags as mapping-&gt;i_pages. */</div><div class='add'>+	xa_init_flags(&amp;fs_info-&gt;buffer_tree, XA_FLAGS_LOCK_IRQ | XA_FLAGS_ACCOUNT);</div><div class='add'>+	lockdep_set_class(&amp;fs_info-&gt;buffer_tree.xa_lock, &amp;buffer_xa_class);</div><div class='add'>+</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;fs_info-&gt;trans_list);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;fs_info-&gt;dead_roots);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;fs_info-&gt;delayed_iputs);</div><div class='hunk'>@@ -2879,19 +2762,33 @@ void btrfs_init_fs_info(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	spin_lock_init(&amp;fs_info-&gt;delayed_iput_lock);</div><div class='ctx'> 	spin_lock_init(&amp;fs_info-&gt;defrag_inodes_lock);</div><div class='ctx'> 	spin_lock_init(&amp;fs_info-&gt;super_lock);</div><div class='del'>-	spin_lock_init(&amp;fs_info-&gt;buffer_lock);</div><div class='ctx'> 	spin_lock_init(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='ctx'> 	spin_lock_init(&amp;fs_info-&gt;treelog_bg_lock);</div><div class='ctx'> 	spin_lock_init(&amp;fs_info-&gt;zone_active_bgs_lock);</div><div class='ctx'> 	spin_lock_init(&amp;fs_info-&gt;relocation_bg_lock);</div><div class='ctx'> 	rwlock_init(&amp;fs_info-&gt;tree_mod_log_lock);</div><div class='add'>+	rwlock_init(&amp;fs_info-&gt;global_root_lock);</div><div class='ctx'> 	mutex_init(&amp;fs_info-&gt;unused_bg_unpin_mutex);</div><div class='ctx'> 	mutex_init(&amp;fs_info-&gt;reclaim_bgs_lock);</div><div class='ctx'> 	mutex_init(&amp;fs_info-&gt;reloc_mutex);</div><div class='ctx'> 	mutex_init(&amp;fs_info-&gt;delalloc_root_mutex);</div><div class='ctx'> 	mutex_init(&amp;fs_info-&gt;zoned_meta_io_lock);</div><div class='add'>+	mutex_init(&amp;fs_info-&gt;zoned_data_reloc_io_lock);</div><div class='ctx'> 	seqlock_init(&amp;fs_info-&gt;profiles_lock);</div><div class='ctx'> </div><div class='add'>+	btrfs_lockdep_init_map(fs_info, btrfs_trans_num_writers);</div><div class='add'>+	btrfs_lockdep_init_map(fs_info, btrfs_trans_num_extwriters);</div><div class='add'>+	btrfs_lockdep_init_map(fs_info, btrfs_trans_pending_ordered);</div><div class='add'>+	btrfs_lockdep_init_map(fs_info, btrfs_ordered_extent);</div><div class='add'>+	btrfs_state_lockdep_init_map(fs_info, btrfs_trans_commit_prep,</div><div class='add'>+				     BTRFS_LOCKDEP_TRANS_COMMIT_PREP);</div><div class='add'>+	btrfs_state_lockdep_init_map(fs_info, btrfs_trans_unblocked,</div><div class='add'>+				     BTRFS_LOCKDEP_TRANS_UNBLOCKED);</div><div class='add'>+	btrfs_state_lockdep_init_map(fs_info, btrfs_trans_super_committed,</div><div class='add'>+				     BTRFS_LOCKDEP_TRANS_SUPER_COMMITTED);</div><div class='add'>+	btrfs_state_lockdep_init_map(fs_info, btrfs_trans_completed,</div><div class='add'>+				     BTRFS_LOCKDEP_TRANS_COMPLETED);</div><div class='add'>+</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;fs_info-&gt;dirty_cowonly_roots);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;fs_info-&gt;space_info);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;fs_info-&gt;tree_mod_seq_list);</div><div class='hunk'>@@ -2903,11 +2800,13 @@ void btrfs_init_fs_info(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;fs_info-&gt;allocated_ebs);</div><div class='ctx'> 	spin_lock_init(&amp;fs_info-&gt;eb_leak_lock);</div><div class='ctx'> #endif</div><div class='del'>-	extent_map_tree_init(&amp;fs_info-&gt;mapping_tree);</div><div class='add'>+	fs_info-&gt;mapping_tree = RB_ROOT_CACHED;</div><div class='add'>+	rwlock_init(&amp;fs_info-&gt;mapping_tree_lock);</div><div class='ctx'> 	btrfs_init_block_rsv(&amp;fs_info-&gt;global_block_rsv,</div><div class='ctx'> 			     BTRFS_BLOCK_RSV_GLOBAL);</div><div class='ctx'> 	btrfs_init_block_rsv(&amp;fs_info-&gt;trans_block_rsv, BTRFS_BLOCK_RSV_TRANS);</div><div class='ctx'> 	btrfs_init_block_rsv(&amp;fs_info-&gt;chunk_block_rsv, BTRFS_BLOCK_RSV_CHUNK);</div><div class='add'>+	btrfs_init_block_rsv(&amp;fs_info-&gt;treelog_rsv, BTRFS_BLOCK_RSV_TREELOG);</div><div class='ctx'> 	btrfs_init_block_rsv(&amp;fs_info-&gt;empty_block_rsv, BTRFS_BLOCK_RSV_EMPTY);</div><div class='ctx'> 	btrfs_init_block_rsv(&amp;fs_info-&gt;delayed_block_rsv,</div><div class='ctx'> 			     BTRFS_BLOCK_RSV_DELOPS);</div><div class='hunk'>@@ -2916,19 +2815,15 @@ void btrfs_init_fs_info(struct btrfs_fs_info *fs_info)</div><div class='ctx'> </div><div class='ctx'> 	atomic_set(&amp;fs_info-&gt;async_delalloc_pages, 0);</div><div class='ctx'> 	atomic_set(&amp;fs_info-&gt;defrag_running, 0);</div><div class='del'>-	atomic_set(&amp;fs_info-&gt;reada_works_cnt, 0);</div><div class='ctx'> 	atomic_set(&amp;fs_info-&gt;nr_delayed_iputs, 0);</div><div class='ctx'> 	atomic64_set(&amp;fs_info-&gt;tree_mod_seq, 0);</div><div class='add'>+	fs_info-&gt;global_root_tree = RB_ROOT;</div><div class='ctx'> 	fs_info-&gt;max_inline = BTRFS_DEFAULT_MAX_INLINE;</div><div class='ctx'> 	fs_info-&gt;metadata_ratio = 0;</div><div class='ctx'> 	fs_info-&gt;defrag_inodes = RB_ROOT;</div><div class='ctx'> 	atomic64_set(&amp;fs_info-&gt;free_chunk_space, 0);</div><div class='ctx'> 	fs_info-&gt;tree_mod_log = RB_ROOT;</div><div class='ctx'> 	fs_info-&gt;commit_interval = BTRFS_DEFAULT_COMMIT_INTERVAL;</div><div class='del'>-	fs_info-&gt;avg_delayed_ref_runtime = NSEC_PER_SEC &gt;&gt; 6; /* div by 64 */</div><div class='del'>-	/* readahead state */</div><div class='del'>-	INIT_RADIX_TREE(&amp;fs_info-&gt;reada_tree, GFP_NOFS &amp; ~__GFP_DIRECT_RECLAIM);</div><div class='del'>-	spin_lock_init(&amp;fs_info-&gt;reada_lock);</div><div class='ctx'> 	btrfs_init_ref_verify(fs_info);</div><div class='ctx'> </div><div class='ctx'> 	fs_info-&gt;thread_pool_size = min_t(unsigned long,</div><div class='hunk'>@@ -2938,19 +2833,15 @@ void btrfs_init_fs_info(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	spin_lock_init(&amp;fs_info-&gt;ordered_root_lock);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_init_scrub(fs_info);</div><div class='del'>-#ifdef CONFIG_BTRFS_FS_CHECK_INTEGRITY</div><div class='del'>-	fs_info-&gt;check_integrity_print_mask = 0;</div><div class='del'>-#endif</div><div class='ctx'> 	btrfs_init_balance(fs_info);</div><div class='ctx'> 	btrfs_init_async_reclaim_work(fs_info);</div><div class='add'>+	btrfs_init_extent_map_shrinker_work(fs_info);</div><div class='ctx'> </div><div class='del'>-	spin_lock_init(&amp;fs_info-&gt;block_group_cache_lock);</div><div class='del'>-	fs_info-&gt;block_group_cache_tree = RB_ROOT;</div><div class='del'>-	fs_info-&gt;first_logical_byte = (u64)-1;</div><div class='add'>+	rwlock_init(&amp;fs_info-&gt;block_group_cache_lock);</div><div class='add'>+	fs_info-&gt;block_group_cache_tree = RB_ROOT_CACHED;</div><div class='ctx'> </div><div class='del'>-	extent_io_tree_init(fs_info, &amp;fs_info-&gt;excluded_extents,</div><div class='del'>-			    IO_TREE_FS_EXCLUDED_EXTENTS, NULL);</div><div class='del'>-	set_bit(BTRFS_FS_BARRIER, &amp;fs_info-&gt;flags);</div><div class='add'>+	btrfs_extent_io_tree_init(fs_info, &amp;fs_info-&gt;excluded_extents,</div><div class='add'>+				  IO_TREE_FS_EXCLUDED_EXTENTS);</div><div class='ctx'> </div><div class='ctx'> 	mutex_init(&amp;fs_info-&gt;ordered_operations_mutex);</div><div class='ctx'> 	mutex_init(&amp;fs_info-&gt;tree_log_mutex);</div><div class='hunk'>@@ -2982,12 +2873,14 @@ void btrfs_init_fs_info(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	fs_info-&gt;sectorsize_bits = ilog2(4096);</div><div class='ctx'> 	fs_info-&gt;stripesize = 4096;</div><div class='ctx'> </div><div class='add'>+	/* Default compress algorithm when user does -o compress */</div><div class='add'>+	fs_info-&gt;compress_type = BTRFS_COMPRESS_ZLIB;</div><div class='add'>+</div><div class='add'>+	fs_info-&gt;max_extent_size = BTRFS_MAX_EXTENT_SIZE;</div><div class='add'>+</div><div class='ctx'> 	spin_lock_init(&amp;fs_info-&gt;swapfile_pins_lock);</div><div class='ctx'> 	fs_info-&gt;swapfile_pins = RB_ROOT;</div><div class='ctx'> </div><div class='del'>-	spin_lock_init(&amp;fs_info-&gt;send_reloc_lock);</div><div class='del'>-	fs_info-&gt;send_in_progress = 0;</div><div class='del'>-</div><div class='ctx'> 	fs_info-&gt;bg_reclaim_threshold = BTRFS_DEFAULT_RECLAIM_THRESH;</div><div class='ctx'> 	INIT_WORK(&amp;fs_info-&gt;reclaim_bgs_work, btrfs_reclaim_bgs_work);</div><div class='ctx'> }</div><div class='hunk'>@@ -2997,6 +2890,7 @@ static int init_mount_fs_info(struct btrfs_fs_info *fs_info, struct super_block</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	fs_info-&gt;sb = sb;</div><div class='add'>+	/* Temporary fixed values for block size until we read the superblock. */</div><div class='ctx'> 	sb-&gt;s_blocksize = BTRFS_BDEV_BLOCKSIZE;</div><div class='ctx'> 	sb-&gt;s_blocksize_bits = blksize_bits(BTRFS_BDEV_BLOCKSIZE);</div><div class='ctx'> </div><div class='hunk'>@@ -3004,10 +2898,18 @@ static int init_mount_fs_info(struct btrfs_fs_info *fs_info, struct super_block</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='add'>+	ret = percpu_counter_init(&amp;fs_info-&gt;evictable_extent_maps, 0, GFP_KERNEL);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='ctx'> 	ret = percpu_counter_init(&amp;fs_info-&gt;dirty_metadata_bytes, 0, GFP_KERNEL);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='add'>+	ret = percpu_counter_init(&amp;fs_info-&gt;stats_read_blocks, 0, GFP_KERNEL);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='ctx'> 	fs_info-&gt;dirty_metadata_batch = PAGE_SIZE *</div><div class='ctx'> 					(1 + ilog2(nr_cpu_ids));</div><div class='ctx'> </div><div class='hunk'>@@ -3028,13 +2930,15 @@ static int init_mount_fs_info(struct btrfs_fs_info *fs_info, struct super_block</div><div class='ctx'> </div><div class='ctx'> 	if (sb_rdonly(sb))</div><div class='ctx'> 		set_bit(BTRFS_FS_STATE_RO, &amp;fs_info-&gt;fs_state);</div><div class='add'>+	if (btrfs_test_opt(fs_info, IGNOREMETACSUMS))</div><div class='add'>+		set_bit(BTRFS_FS_STATE_SKIP_META_CSUMS, &amp;fs_info-&gt;fs_state);</div><div class='ctx'> </div><div class='ctx'> 	return btrfs_alloc_stripe_hash_table(fs_info);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int btrfs_uuid_rescan_kthread(void *data)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = (struct btrfs_fs_info *)data;</div><div class='add'>+	struct btrfs_fs_info *fs_info = data;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -3069,15 +2973,55 @@ static int btrfs_check_uuid_tree(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Some options only have meaning at mount time and shouldn't persist across</div><div class='del'>- * remounts, or be displayed. Clear these at the end of mount and remount</div><div class='del'>- * code paths.</div><div class='del'>- */</div><div class='del'>-void btrfs_clear_oneshot_options(struct btrfs_fs_info *fs_info)</div><div class='add'>+static int btrfs_cleanup_fs_roots(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	btrfs_clear_opt(fs_info-&gt;mount_opt, USEBACKUPROOT);</div><div class='del'>-	btrfs_clear_opt(fs_info-&gt;mount_opt, CLEAR_CACHE);</div><div class='add'>+	u64 root_objectid = 0;</div><div class='add'>+	struct btrfs_root *gang[8];</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	while (1) {</div><div class='add'>+		unsigned int found;</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;fs_info-&gt;fs_roots_radix_lock);</div><div class='add'>+		found = radix_tree_gang_lookup(&amp;fs_info-&gt;fs_roots_radix,</div><div class='add'>+					     (void **)gang, root_objectid,</div><div class='add'>+					     ARRAY_SIZE(gang));</div><div class='add'>+		if (!found) {</div><div class='add'>+			spin_unlock(&amp;fs_info-&gt;fs_roots_radix_lock);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		root_objectid = btrfs_root_id(gang[found - 1]) + 1;</div><div class='add'>+</div><div class='add'>+		for (int i = 0; i &lt; found; i++) {</div><div class='add'>+			/* Avoid to grab roots in dead_roots. */</div><div class='add'>+			if (btrfs_root_refs(&amp;gang[i]-&gt;root_item) == 0) {</div><div class='add'>+				gang[i] = NULL;</div><div class='add'>+				continue;</div><div class='add'>+			}</div><div class='add'>+			/* Grab all the search result for later use. */</div><div class='add'>+			gang[i] = btrfs_grab_root(gang[i]);</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;fs_info-&gt;fs_roots_radix_lock);</div><div class='add'>+</div><div class='add'>+		for (int i = 0; i &lt; found; i++) {</div><div class='add'>+			if (!gang[i])</div><div class='add'>+				continue;</div><div class='add'>+			root_objectid = btrfs_root_id(gang[i]);</div><div class='add'>+			/*</div><div class='add'>+			 * Continue to release the remaining roots after the first</div><div class='add'>+			 * error without cleanup and preserve the first error</div><div class='add'>+			 * for the return.</div><div class='add'>+			 */</div><div class='add'>+			if (!ret)</div><div class='add'>+				ret = btrfs_orphan_cleanup(gang[i]);</div><div class='add'>+			btrfs_put_root(gang[i]);</div><div class='add'>+		}</div><div class='add'>+		if (ret)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		root_objectid++;</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -3088,23 +3032,38 @@ int btrfs_start_pre_rw_mount(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	const bool cache_opt = btrfs_test_opt(fs_info, SPACE_CACHE);</div><div class='del'>-	bool clear_free_space_tree = false;</div><div class='add'>+	bool rebuild_free_space_tree = false;</div><div class='ctx'> </div><div class='ctx'> 	if (btrfs_test_opt(fs_info, CLEAR_CACHE) &amp;&amp;</div><div class='ctx'> 	    btrfs_fs_compat_ro(fs_info, FREE_SPACE_TREE)) {</div><div class='del'>-		clear_free_space_tree = true;</div><div class='add'>+		if (btrfs_fs_incompat(fs_info, EXTENT_TREE_V2))</div><div class='add'>+			btrfs_warn(fs_info,</div><div class='add'>+				   "'clear_cache' option is ignored with extent tree v2");</div><div class='add'>+		else</div><div class='add'>+			rebuild_free_space_tree = true;</div><div class='ctx'> 	} else if (btrfs_fs_compat_ro(fs_info, FREE_SPACE_TREE) &amp;&amp;</div><div class='ctx'> 		   !btrfs_fs_compat_ro(fs_info, FREE_SPACE_TREE_VALID)) {</div><div class='ctx'> 		btrfs_warn(fs_info, "free space tree is invalid");</div><div class='del'>-		clear_free_space_tree = true;</div><div class='add'>+		rebuild_free_space_tree = true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (clear_free_space_tree) {</div><div class='del'>-		btrfs_info(fs_info, "clearing free space tree");</div><div class='del'>-		ret = btrfs_clear_free_space_tree(fs_info);</div><div class='add'>+	if (rebuild_free_space_tree) {</div><div class='add'>+		btrfs_info(fs_info, "rebuilding free space tree");</div><div class='add'>+		ret = btrfs_rebuild_free_space_tree(fs_info);</div><div class='ctx'> 		if (ret) {</div><div class='ctx'> 			btrfs_warn(fs_info,</div><div class='del'>-				   "failed to clear free space tree: %d", ret);</div><div class='add'>+				   "failed to rebuild free space tree: %d", ret);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (btrfs_fs_compat_ro(fs_info, FREE_SPACE_TREE) &amp;&amp;</div><div class='add'>+	    !btrfs_test_opt(fs_info, FREE_SPACE_TREE)) {</div><div class='add'>+		btrfs_info(fs_info, "disabling free space tree");</div><div class='add'>+		ret = btrfs_delete_free_space_tree(fs_info);</div><div class='add'>+		if (ret) {</div><div class='add'>+			btrfs_warn(fs_info,</div><div class='add'>+				   "failed to disable free space tree: %d", ret);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3137,7 +3096,7 @@ int btrfs_start_pre_rw_mount(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	up_read(&amp;fs_info-&gt;cleanup_work_sem);</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;fs_info-&gt;cleaner_mutex);</div><div class='del'>-	ret = btrfs_recover_relocation(fs_info-&gt;tree_root);</div><div class='add'>+	ret = btrfs_recover_relocation(fs_info);</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;cleaner_mutex);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='ctx'> 		btrfs_warn(fs_info, "failed to recover relocation: %d", ret);</div><div class='hunk'>@@ -3187,28 +3146,131 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int __cold open_ctree(struct super_block *sb, struct btrfs_fs_devices *fs_devices,</div><div class='del'>-		      char *options)</div><div class='add'>+/*</div><div class='add'>+ * Do various sanity and dependency checks of different features.</div><div class='add'>+ *</div><div class='add'>+ * @is_rw_mount:	If the mount is read-write.</div><div class='add'>+ *</div><div class='add'>+ * This is the place for less strict checks (like for subpage or artificial</div><div class='add'>+ * feature dependencies).</div><div class='add'>+ *</div><div class='add'>+ * For strict checks or possible corruption detection, see</div><div class='add'>+ * btrfs_validate_super().</div><div class='add'>+ *</div><div class='add'>+ * This should be called after btrfs_parse_options(), as some mount options</div><div class='add'>+ * (space cache related) can modify on-disk format like free space tree and</div><div class='add'>+ * screw up certain feature dependencies.</div><div class='add'>+ */</div><div class='add'>+int btrfs_check_features(struct btrfs_fs_info *fs_info, bool is_rw_mount)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_super_block *disk_super = fs_info-&gt;super_copy;</div><div class='add'>+	u64 incompat = btrfs_super_incompat_flags(disk_super);</div><div class='add'>+	const u64 compat_ro = btrfs_super_compat_ro_flags(disk_super);</div><div class='add'>+	const u64 compat_ro_unsupp = (compat_ro &amp; ~BTRFS_FEATURE_COMPAT_RO_SUPP);</div><div class='add'>+</div><div class='add'>+	if (incompat &amp; ~BTRFS_FEATURE_INCOMPAT_SUPP) {</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+		"cannot mount because of unknown incompat features (0x%llx)",</div><div class='add'>+		    incompat);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Runtime limitation for mixed block groups. */</div><div class='add'>+	if ((incompat &amp; BTRFS_FEATURE_INCOMPAT_MIXED_GROUPS) &amp;&amp;</div><div class='add'>+	    (fs_info-&gt;sectorsize != fs_info-&gt;nodesize)) {</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+"unequal nodesize/sectorsize (%u != %u) are not allowed for mixed block groups",</div><div class='add'>+			fs_info-&gt;nodesize, fs_info-&gt;sectorsize);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Mixed backref is an always-enabled feature. */</div><div class='add'>+	incompat |= BTRFS_FEATURE_INCOMPAT_MIXED_BACKREF;</div><div class='add'>+</div><div class='add'>+	/* Set compression related flags just in case. */</div><div class='add'>+	if (fs_info-&gt;compress_type == BTRFS_COMPRESS_LZO)</div><div class='add'>+		incompat |= BTRFS_FEATURE_INCOMPAT_COMPRESS_LZO;</div><div class='add'>+	else if (fs_info-&gt;compress_type == BTRFS_COMPRESS_ZSTD)</div><div class='add'>+		incompat |= BTRFS_FEATURE_INCOMPAT_COMPRESS_ZSTD;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * An ancient flag, which should really be marked deprecated.</div><div class='add'>+	 * Such runtime limitation doesn't really need a incompat flag.</div><div class='add'>+	 */</div><div class='add'>+	if (btrfs_super_nodesize(disk_super) &gt; PAGE_SIZE)</div><div class='add'>+		incompat |= BTRFS_FEATURE_INCOMPAT_BIG_METADATA;</div><div class='add'>+</div><div class='add'>+	if (compat_ro_unsupp &amp;&amp; is_rw_mount) {</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+	"cannot mount read-write because of unknown compat_ro features (0x%llx)",</div><div class='add'>+		       compat_ro);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We have unsupported RO compat features, although RO mounted, we</div><div class='add'>+	 * should not cause any metadata writes, including log replay.</div><div class='add'>+	 * Or we could screw up whatever the new feature requires.</div><div class='add'>+	 */</div><div class='add'>+	if (compat_ro_unsupp &amp;&amp; btrfs_super_log_root(disk_super) &amp;&amp;</div><div class='add'>+	    !btrfs_test_opt(fs_info, NOLOGREPLAY)) {</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+"cannot replay dirty log with unsupported compat_ro features (0x%llx), try rescue=nologreplay",</div><div class='add'>+			  compat_ro);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Artificial limitations for block group tree, to force</div><div class='add'>+	 * block-group-tree to rely on no-holes and free-space-tree.</div><div class='add'>+	 */</div><div class='add'>+	if (btrfs_fs_compat_ro(fs_info, BLOCK_GROUP_TREE) &amp;&amp;</div><div class='add'>+	    (!btrfs_fs_incompat(fs_info, NO_HOLES) ||</div><div class='add'>+	     !btrfs_test_opt(fs_info, FREE_SPACE_TREE))) {</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+"block-group-tree feature requires no-holes and free-space-tree features");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Subpage/bs &gt; ps runtime limitation on v1 cache.</div><div class='add'>+	 *</div><div class='add'>+	 * V1 space cache still has some hard coded PAGE_SIZE usage, while</div><div class='add'>+	 * we're already defaulting to v2 cache, no need to bother v1 as it's</div><div class='add'>+	 * going to be deprecated anyway.</div><div class='add'>+	 */</div><div class='add'>+	if (fs_info-&gt;sectorsize != PAGE_SIZE &amp;&amp; btrfs_test_opt(fs_info, SPACE_CACHE)) {</div><div class='add'>+		btrfs_warn(fs_info,</div><div class='add'>+	"v1 space cache is not supported for page size %lu with sectorsize %u",</div><div class='add'>+			   PAGE_SIZE, fs_info-&gt;sectorsize);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* This can be called by remount, we need to protect the super block. */</div><div class='add'>+	spin_lock(&amp;fs_info-&gt;super_lock);</div><div class='add'>+	btrfs_set_super_incompat_flags(disk_super, incompat);</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;super_lock);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int __cold open_ctree(struct super_block *sb, struct btrfs_fs_devices *fs_devices)</div><div class='ctx'> {</div><div class='ctx'> 	u32 sectorsize;</div><div class='ctx'> 	u32 nodesize;</div><div class='ctx'> 	u32 stripesize;</div><div class='ctx'> 	u64 generation;</div><div class='del'>-	u64 features;</div><div class='ctx'> 	u16 csum_type;</div><div class='ctx'> 	struct btrfs_super_block *disk_super;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = btrfs_sb(sb);</div><div class='ctx'> 	struct btrfs_root *tree_root;</div><div class='ctx'> 	struct btrfs_root *chunk_root;</div><div class='ctx'> 	int ret;</div><div class='del'>-	int err = -EINVAL;</div><div class='ctx'> 	int level;</div><div class='ctx'> </div><div class='ctx'> 	ret = init_mount_fs_info(fs_info, sb);</div><div class='del'>-	if (ret) {</div><div class='del'>-		err = ret;</div><div class='add'>+	if (ret)</div><div class='ctx'> 		goto fail;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	/* These need to be init'ed before we start creating inodes and such. */</div><div class='ctx'> 	tree_root = btrfs_alloc_root(fs_info, BTRFS_ROOT_TREE_OBJECTID,</div><div class='hunk'>@@ -3218,29 +3280,26 @@ int __cold open_ctree(struct super_block *sb, struct btrfs_fs_devices *fs_device</div><div class='ctx'> 				      GFP_KERNEL);</div><div class='ctx'> 	fs_info-&gt;chunk_root = chunk_root;</div><div class='ctx'> 	if (!tree_root || !chunk_root) {</div><div class='del'>-		err = -ENOMEM;</div><div class='add'>+		ret = -ENOMEM;</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	fs_info-&gt;btree_inode = new_inode(sb);</div><div class='del'>-	if (!fs_info-&gt;btree_inode) {</div><div class='del'>-		err = -ENOMEM;</div><div class='add'>+	ret = btrfs_init_btree_inode(sb);</div><div class='add'>+	if (ret)</div><div class='ctx'> 		goto fail;</div><div class='del'>-	}</div><div class='del'>-	mapping_set_gfp_mask(fs_info-&gt;btree_inode-&gt;i_mapping, GFP_NOFS);</div><div class='del'>-	btrfs_init_btree_inode(fs_info);</div><div class='ctx'> </div><div class='ctx'> 	invalidate_bdev(fs_devices-&gt;latest_dev-&gt;bdev);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Read super block and check the signature bytes only</div><div class='ctx'> 	 */</div><div class='del'>-	disk_super = btrfs_read_dev_super(fs_devices-&gt;latest_dev-&gt;bdev);</div><div class='add'>+	disk_super = btrfs_read_disk_super(fs_devices-&gt;latest_dev-&gt;bdev, 0, false);</div><div class='ctx'> 	if (IS_ERR(disk_super)) {</div><div class='del'>-		err = PTR_ERR(disk_super);</div><div class='add'>+		ret = PTR_ERR(disk_super);</div><div class='ctx'> 		goto fail_alloc;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	btrfs_info(fs_info, "first mount of filesystem %pU", disk_super-&gt;fsid);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Verify the type first, if that or the checksum value are</div><div class='ctx'> 	 * corrupted, we'll find out</div><div class='hunk'>@@ -3249,7 +3308,7 @@ int __cold open_ctree(struct super_block *sb, struct btrfs_fs_devices *fs_device</div><div class='ctx'> 	if (!btrfs_supported_super_csum(csum_type)) {</div><div class='ctx'> 		btrfs_err(fs_info, "unsupported checksum algorithm: %u",</div><div class='ctx'> 			  csum_type);</div><div class='del'>-		err = -EINVAL;</div><div class='add'>+		ret = -EINVAL;</div><div class='ctx'> 		btrfs_release_disk_super(disk_super);</div><div class='ctx'> 		goto fail_alloc;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3258,7 +3317,6 @@ int __cold open_ctree(struct super_block *sb, struct btrfs_fs_devices *fs_device</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_init_csum_hash(fs_info, csum_type);</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		err = ret;</div><div class='ctx'> 		btrfs_release_disk_super(disk_super);</div><div class='ctx'> 		goto fail_alloc;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3267,9 +3325,9 @@ int __cold open_ctree(struct super_block *sb, struct btrfs_fs_devices *fs_device</div><div class='ctx'> 	 * We want to check superblock checksum, the type is stored inside.</div><div class='ctx'> 	 * Pass the whole disk block of size BTRFS_SUPER_INFO_SIZE (4k).</div><div class='ctx'> 	 */</div><div class='del'>-	if (btrfs_check_super_csum(fs_info, (u8 *)disk_super)) {</div><div class='add'>+	if (btrfs_check_super_csum(fs_info, disk_super)) {</div><div class='ctx'> 		btrfs_err(fs_info, "superblock checksum mismatch");</div><div class='del'>-		err = -EINVAL;</div><div class='add'>+		ret = -EINVAL;</div><div class='ctx'> 		btrfs_release_disk_super(disk_super);</div><div class='ctx'> 		goto fail_alloc;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3284,48 +3342,25 @@ int __cold open_ctree(struct super_block *sb, struct btrfs_fs_devices *fs_device</div><div class='ctx'> </div><div class='ctx'> 	disk_super = fs_info-&gt;super_copy;</div><div class='ctx'> </div><div class='del'>-</div><div class='del'>-	features = btrfs_super_flags(disk_super);</div><div class='del'>-	if (features &amp; BTRFS_SUPER_FLAG_CHANGING_FSID_V2) {</div><div class='del'>-		features &amp;= ~BTRFS_SUPER_FLAG_CHANGING_FSID_V2;</div><div class='del'>-		btrfs_set_super_flags(disk_super, features);</div><div class='del'>-		btrfs_info(fs_info,</div><div class='del'>-			"found metadata UUID change in progress flag, clearing");</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	memcpy(fs_info-&gt;super_for_commit, fs_info-&gt;super_copy,</div><div class='ctx'> 	       sizeof(*fs_info-&gt;super_for_commit));</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_validate_mount_super(fs_info);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		btrfs_err(fs_info, "superblock contains fatal errors");</div><div class='del'>-		err = -EINVAL;</div><div class='add'>+		ret = -EINVAL;</div><div class='ctx'> 		goto fail_alloc;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!btrfs_super_root(disk_super))</div><div class='add'>+	if (!btrfs_super_root(disk_super)) {</div><div class='add'>+		btrfs_err(fs_info, "invalid superblock tree root bytenr");</div><div class='add'>+		ret = -EINVAL;</div><div class='ctx'> 		goto fail_alloc;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* check FS state, whether FS is broken. */</div><div class='ctx'> 	if (btrfs_super_flags(disk_super) &amp; BTRFS_SUPER_FLAG_ERROR)</div><div class='del'>-		set_bit(BTRFS_FS_STATE_ERROR, &amp;fs_info-&gt;fs_state);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * In the long term, we'll store the compression type in the super</div><div class='del'>-	 * block, and it'll be used for per file compression control.</div><div class='del'>-	 */</div><div class='del'>-	fs_info-&gt;compress_type = BTRFS_COMPRESS_ZLIB;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Flag our filesystem as having big metadata blocks if they are bigger</div><div class='del'>-	 * than the page size.</div><div class='del'>-	 */</div><div class='del'>-	if (btrfs_super_nodesize(disk_super) &gt; PAGE_SIZE) {</div><div class='del'>-		if (!(features &amp; BTRFS_FEATURE_INCOMPAT_BIG_METADATA))</div><div class='del'>-			btrfs_info(fs_info,</div><div class='del'>-				"flagging fs with big metadata feature");</div><div class='del'>-		features |= BTRFS_FEATURE_INCOMPAT_BIG_METADATA;</div><div class='del'>-	}</div><div class='add'>+		WRITE_ONCE(fs_info-&gt;fs_error, -EUCLEAN);</div><div class='ctx'> </div><div class='ctx'> 	/* Set up fs_info before parsing mount options */</div><div class='ctx'> 	nodesize = btrfs_super_nodesize(disk_super);</div><div class='hunk'>@@ -3335,95 +3370,51 @@ int __cold open_ctree(struct super_block *sb, struct btrfs_fs_devices *fs_device</div><div class='ctx'> 	fs_info-&gt;delalloc_batch = sectorsize * 512 * (1 + ilog2(nr_cpu_ids));</div><div class='ctx'> </div><div class='ctx'> 	fs_info-&gt;nodesize = nodesize;</div><div class='add'>+	fs_info-&gt;nodesize_bits = ilog2(nodesize);</div><div class='ctx'> 	fs_info-&gt;sectorsize = sectorsize;</div><div class='ctx'> 	fs_info-&gt;sectorsize_bits = ilog2(sectorsize);</div><div class='add'>+	fs_info-&gt;block_min_order = ilog2(round_up(sectorsize, PAGE_SIZE) &gt;&gt; PAGE_SHIFT);</div><div class='add'>+	fs_info-&gt;block_max_order = ilog2((BITS_PER_LONG &lt;&lt; fs_info-&gt;sectorsize_bits) &gt;&gt; PAGE_SHIFT);</div><div class='ctx'> 	fs_info-&gt;csums_per_leaf = BTRFS_MAX_ITEM_SIZE(fs_info) / fs_info-&gt;csum_size;</div><div class='ctx'> 	fs_info-&gt;stripesize = stripesize;</div><div class='add'>+	fs_info-&gt;fs_devices-&gt;fs_info = fs_info;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_parse_options(fs_info, options, sb-&gt;s_flags);</div><div class='del'>-	if (ret) {</div><div class='del'>-		err = ret;</div><div class='del'>-		goto fail_alloc;</div><div class='del'>-	}</div><div class='add'>+	if (fs_info-&gt;sectorsize &gt; PAGE_SIZE)</div><div class='add'>+		btrfs_warn(fs_info,</div><div class='add'>+			   "support for block size %u with page size %lu is experimental, some features may be missing",</div><div class='add'>+			   fs_info-&gt;sectorsize, PAGE_SIZE);</div><div class='add'>+	/*</div><div class='add'>+	 * Handle the space caching options appropriately now that we have the</div><div class='add'>+	 * super block loaded and validated.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_set_free_space_cache_settings(fs_info);</div><div class='ctx'> </div><div class='del'>-	features = btrfs_super_incompat_flags(disk_super) &amp;</div><div class='del'>-		~BTRFS_FEATURE_INCOMPAT_SUPP;</div><div class='del'>-	if (features) {</div><div class='del'>-		btrfs_err(fs_info,</div><div class='del'>-		    "cannot mount because of unsupported optional features (%llx)",</div><div class='del'>-		    features);</div><div class='del'>-		err = -EINVAL;</div><div class='add'>+	if (!btrfs_check_options(fs_info, &amp;fs_info-&gt;mount_opt, sb-&gt;s_flags)) {</div><div class='add'>+		ret = -EINVAL;</div><div class='ctx'> 		goto fail_alloc;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	features = btrfs_super_incompat_flags(disk_super);</div><div class='del'>-	features |= BTRFS_FEATURE_INCOMPAT_MIXED_BACKREF;</div><div class='del'>-	if (fs_info-&gt;compress_type == BTRFS_COMPRESS_LZO)</div><div class='del'>-		features |= BTRFS_FEATURE_INCOMPAT_COMPRESS_LZO;</div><div class='del'>-	else if (fs_info-&gt;compress_type == BTRFS_COMPRESS_ZSTD)</div><div class='del'>-		features |= BTRFS_FEATURE_INCOMPAT_COMPRESS_ZSTD;</div><div class='del'>-</div><div class='del'>-	if (features &amp; BTRFS_FEATURE_INCOMPAT_SKINNY_METADATA)</div><div class='del'>-		btrfs_info(fs_info, "has skinny extents");</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * mixed block groups end up with duplicate but slightly offset</div><div class='del'>-	 * extent buffers for the same range.  It leads to corruptions</div><div class='del'>-	 */</div><div class='del'>-	if ((features &amp; BTRFS_FEATURE_INCOMPAT_MIXED_GROUPS) &amp;&amp;</div><div class='del'>-	    (sectorsize != nodesize)) {</div><div class='del'>-		btrfs_err(fs_info,</div><div class='del'>-"unequal nodesize/sectorsize (%u != %u) are not allowed for mixed block groups",</div><div class='del'>-			nodesize, sectorsize);</div><div class='add'>+	ret = btrfs_check_features(fs_info, !sb_rdonly(sb));</div><div class='add'>+	if (ret &lt; 0)</div><div class='ctx'> 		goto fail_alloc;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Needn't use the lock because there is no other task which will</div><div class='del'>-	 * update the flag.</div><div class='add'>+	 * At this point our mount options are validated, if we set -&gt;max_inline</div><div class='add'>+	 * to something non-standard make sure we truncate it to sectorsize.</div><div class='ctx'> 	 */</div><div class='del'>-	btrfs_set_super_incompat_flags(disk_super, features);</div><div class='del'>-</div><div class='del'>-	features = btrfs_super_compat_ro_flags(disk_super) &amp;</div><div class='del'>-		~BTRFS_FEATURE_COMPAT_RO_SUPP;</div><div class='del'>-	if (!sb_rdonly(sb) &amp;&amp; features) {</div><div class='del'>-		btrfs_err(fs_info,</div><div class='del'>-	"cannot mount read-write because of unsupported optional features (%llx)",</div><div class='del'>-		       features);</div><div class='del'>-		err = -EINVAL;</div><div class='del'>-		goto fail_alloc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (sectorsize &lt; PAGE_SIZE) {</div><div class='del'>-		struct btrfs_subpage_info *subpage_info;</div><div class='del'>-</div><div class='del'>-		btrfs_warn(fs_info,</div><div class='del'>-		"read-write for sector size %u with page size %lu is experimental",</div><div class='del'>-			   sectorsize, PAGE_SIZE);</div><div class='del'>-		if (btrfs_super_incompat_flags(fs_info-&gt;super_copy) &amp;</div><div class='del'>-			BTRFS_FEATURE_INCOMPAT_RAID56) {</div><div class='del'>-			btrfs_err(fs_info,</div><div class='del'>-		"RAID56 is not yet supported for sector size %u with page size %lu",</div><div class='del'>-				sectorsize, PAGE_SIZE);</div><div class='del'>-			err = -EINVAL;</div><div class='del'>-			goto fail_alloc;</div><div class='del'>-		}</div><div class='del'>-		subpage_info = kzalloc(sizeof(*subpage_info), GFP_KERNEL);</div><div class='del'>-		if (!subpage_info)</div><div class='del'>-			goto fail_alloc;</div><div class='del'>-		btrfs_init_subpage_info(subpage_info, sectorsize);</div><div class='del'>-		fs_info-&gt;subpage_info = subpage_info;</div><div class='del'>-	}</div><div class='add'>+	fs_info-&gt;max_inline = min_t(u64, fs_info-&gt;max_inline, fs_info-&gt;sectorsize);</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_init_workqueues(fs_info, fs_devices);</div><div class='del'>-	if (ret) {</div><div class='del'>-		err = ret;</div><div class='add'>+	ret = btrfs_alloc_compress_wsm(fs_info);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto fail_sb_buffer;</div><div class='add'>+	ret = btrfs_init_workqueues(fs_info);</div><div class='add'>+	if (ret)</div><div class='ctx'> 		goto fail_sb_buffer;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	sb-&gt;s_bdi-&gt;ra_pages *= btrfs_super_num_devices(disk_super);</div><div class='ctx'> 	sb-&gt;s_bdi-&gt;ra_pages = max(sb-&gt;s_bdi-&gt;ra_pages, SZ_4M / PAGE_SIZE);</div><div class='ctx'> </div><div class='add'>+	/* Update the values for the current filesystem. */</div><div class='ctx'> 	sb-&gt;s_blocksize = sectorsize;</div><div class='ctx'> 	sb-&gt;s_blocksize_bits = blksize_bits(sectorsize);</div><div class='ctx'> 	memcpy(&amp;sb-&gt;s_uuid, fs_info-&gt;fs_devices-&gt;fsid, BTRFS_FSID_SIZE);</div><div class='hunk'>@@ -3438,21 +3429,12 @@ int __cold open_ctree(struct super_block *sb, struct btrfs_fs_devices *fs_device</div><div class='ctx'> </div><div class='ctx'> 	generation = btrfs_super_chunk_root_generation(disk_super);</div><div class='ctx'> 	level = btrfs_super_chunk_root_level(disk_super);</div><div class='del'>-</div><div class='del'>-	chunk_root-&gt;node = read_tree_block(fs_info,</div><div class='del'>-					   btrfs_super_chunk_root(disk_super),</div><div class='del'>-					   BTRFS_CHUNK_TREE_OBJECTID,</div><div class='del'>-					   generation, level, NULL);</div><div class='del'>-	if (IS_ERR(chunk_root-&gt;node) ||</div><div class='del'>-	    !extent_buffer_uptodate(chunk_root-&gt;node)) {</div><div class='add'>+	ret = load_super_root(chunk_root, btrfs_super_chunk_root(disk_super),</div><div class='add'>+			      generation, level);</div><div class='add'>+	if (ret) {</div><div class='ctx'> 		btrfs_err(fs_info, "failed to read chunk root");</div><div class='del'>-		if (!IS_ERR(chunk_root-&gt;node))</div><div class='del'>-			free_extent_buffer(chunk_root-&gt;node);</div><div class='del'>-		chunk_root-&gt;node = NULL;</div><div class='ctx'> 		goto fail_tree_roots;</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_set_root_node(&amp;chunk_root-&gt;root_item, chunk_root-&gt;node);</div><div class='del'>-	chunk_root-&gt;commit_root = btrfs_root_node(chunk_root);</div><div class='ctx'> </div><div class='ctx'> 	read_extent_buffer(chunk_root-&gt;node, fs_info-&gt;chunk_tree_uuid,</div><div class='ctx'> 			   offsetof(struct btrfs_header, chunk_tree_uuid),</div><div class='hunk'>@@ -3472,8 +3454,9 @@ int __cold open_ctree(struct super_block *sb, struct btrfs_fs_devices *fs_device</div><div class='ctx'> 	 * below in btrfs_init_dev_replace().</div><div class='ctx'> 	 */</div><div class='ctx'> 	btrfs_free_extra_devids(fs_devices);</div><div class='del'>-	if (!fs_devices-&gt;latest_dev-&gt;bdev) {</div><div class='add'>+	if (unlikely(!fs_devices-&gt;latest_dev-&gt;bdev)) {</div><div class='ctx'> 		btrfs_err(fs_info, "failed to read devices");</div><div class='add'>+		ret = -EIO;</div><div class='ctx'> 		goto fail_tree_roots;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -3489,8 +3472,7 @@ int __cold open_ctree(struct super_block *sb, struct btrfs_fs_devices *fs_device</div><div class='ctx'> 	ret = btrfs_get_dev_zone_info_all_devices(fs_info);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='del'>-			  "zoned: failed to read device zone info: %d",</div><div class='del'>-			  ret);</div><div class='add'>+			  "zoned: failed to read device zone info: %d", ret);</div><div class='ctx'> 		goto fail_block_groups;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -3563,47 +3545,34 @@ int __cold open_ctree(struct super_block *sb, struct btrfs_fs_devices *fs_device</div><div class='ctx'> 		goto fail_sysfs;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	btrfs_zoned_reserve_data_reloc_bg(fs_info);</div><div class='add'>+	btrfs_free_zone_cache(fs_info);</div><div class='add'>+</div><div class='add'>+	btrfs_check_active_zone_reservation(fs_info);</div><div class='add'>+</div><div class='ctx'> 	if (!sb_rdonly(sb) &amp;&amp; fs_info-&gt;fs_devices-&gt;missing_devices &amp;&amp;</div><div class='ctx'> 	    !btrfs_check_rw_degradable(fs_info, NULL)) {</div><div class='ctx'> 		btrfs_warn(fs_info,</div><div class='ctx'> 		"writable mount is not allowed due to too many missing devices");</div><div class='add'>+		ret = -EINVAL;</div><div class='ctx'> 		goto fail_sysfs;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	fs_info-&gt;cleaner_kthread = kthread_run(cleaner_kthread, tree_root,</div><div class='add'>+	fs_info-&gt;cleaner_kthread = kthread_run(cleaner_kthread, fs_info,</div><div class='ctx'> 					       "btrfs-cleaner");</div><div class='del'>-	if (IS_ERR(fs_info-&gt;cleaner_kthread))</div><div class='add'>+	if (IS_ERR(fs_info-&gt;cleaner_kthread)) {</div><div class='add'>+		ret = PTR_ERR(fs_info-&gt;cleaner_kthread);</div><div class='ctx'> 		goto fail_sysfs;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	fs_info-&gt;transaction_kthread = kthread_run(transaction_kthread,</div><div class='ctx'> 						   tree_root,</div><div class='ctx'> 						   "btrfs-transaction");</div><div class='del'>-	if (IS_ERR(fs_info-&gt;transaction_kthread))</div><div class='add'>+	if (IS_ERR(fs_info-&gt;transaction_kthread)) {</div><div class='add'>+		ret = PTR_ERR(fs_info-&gt;transaction_kthread);</div><div class='ctx'> 		goto fail_cleaner;</div><div class='del'>-</div><div class='del'>-	if (!btrfs_test_opt(fs_info, NOSSD) &amp;&amp;</div><div class='del'>-	    !fs_info-&gt;fs_devices-&gt;rotating) {</div><div class='del'>-		btrfs_set_and_info(fs_info, SSD, "enabling ssd optimizations");</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Mount does not set all options immediately, we can do it now and do</div><div class='del'>-	 * not have to wait for transaction commit</div><div class='del'>-	 */</div><div class='del'>-	btrfs_apply_pending_changes(fs_info);</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_BTRFS_FS_CHECK_INTEGRITY</div><div class='del'>-	if (btrfs_test_opt(fs_info, CHECK_INTEGRITY)) {</div><div class='del'>-		ret = btrfsic_mount(fs_info, fs_devices,</div><div class='del'>-				    btrfs_test_opt(fs_info,</div><div class='del'>-					CHECK_INTEGRITY_DATA) ? 1 : 0,</div><div class='del'>-				    fs_info-&gt;check_integrity_print_mask);</div><div class='del'>-		if (ret)</div><div class='del'>-			btrfs_warn(fs_info,</div><div class='del'>-				"failed to initialize integrity check module: %d",</div><div class='del'>-				ret);</div><div class='del'>-	}</div><div class='del'>-#endif</div><div class='ctx'> 	ret = btrfs_read_qgroup_config(fs_info);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto fail_trans_kthread;</div><div class='hunk'>@@ -3616,22 +3585,20 @@ int __cold open_ctree(struct super_block *sb, struct btrfs_fs_devices *fs_device</div><div class='ctx'> 	    !btrfs_test_opt(fs_info, NOLOGREPLAY)) {</div><div class='ctx'> 		btrfs_info(fs_info, "start tree-log replay");</div><div class='ctx'> 		ret = btrfs_replay_log(fs_info, fs_devices);</div><div class='del'>-		if (ret) {</div><div class='del'>-			err = ret;</div><div class='add'>+		if (ret)</div><div class='ctx'> 			goto fail_qgroup;</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	fs_info-&gt;fs_root = btrfs_get_fs_root(fs_info, BTRFS_FS_TREE_OBJECTID, true);</div><div class='ctx'> 	if (IS_ERR(fs_info-&gt;fs_root)) {</div><div class='del'>-		err = PTR_ERR(fs_info-&gt;fs_root);</div><div class='del'>-		btrfs_warn(fs_info, "failed to read fs tree: %d", err);</div><div class='add'>+		ret = PTR_ERR(fs_info-&gt;fs_root);</div><div class='add'>+		btrfs_warn(fs_info, "failed to read fs tree: %d", ret);</div><div class='ctx'> 		fs_info-&gt;fs_root = NULL;</div><div class='ctx'> 		goto fail_qgroup;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (sb_rdonly(sb))</div><div class='del'>-		goto clear_oneshot;</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_start_pre_rw_mount(fs_info);</div><div class='ctx'> 	if (ret) {</div><div class='hunk'>@@ -3655,8 +3622,10 @@ int __cold open_ctree(struct super_block *sb, struct btrfs_fs_devices *fs_device</div><div class='ctx'> </div><div class='ctx'> 	set_bit(BTRFS_FS_OPEN, &amp;fs_info-&gt;flags);</div><div class='ctx'> </div><div class='del'>-clear_oneshot:</div><div class='del'>-	btrfs_clear_oneshot_options(fs_info);</div><div class='add'>+	/* Kick the cleaner thread so it'll start deleting snapshots. */</div><div class='add'>+	if (test_bit(BTRFS_FS_UNFINISHED_DROPS, &amp;fs_info-&gt;flags))</div><div class='add'>+		wake_up_process(fs_info-&gt;cleaner_kthread);</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> fail_qgroup:</div><div class='hunk'>@@ -3693,141 +3662,74 @@ fail_sb_buffer:</div><div class='ctx'> 	btrfs_stop_all_workers(fs_info);</div><div class='ctx'> 	btrfs_free_block_groups(fs_info);</div><div class='ctx'> fail_alloc:</div><div class='del'>-	btrfs_mapping_tree_free(&amp;fs_info-&gt;mapping_tree);</div><div class='add'>+	btrfs_mapping_tree_free(fs_info);</div><div class='ctx'> </div><div class='ctx'> 	iput(fs_info-&gt;btree_inode);</div><div class='ctx'> fail:</div><div class='del'>-	btrfs_close_devices(fs_info-&gt;fs_devices);</div><div class='del'>-	return err;</div><div class='add'>+	ASSERT(ret &lt; 0);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> ALLOW_ERROR_INJECTION(open_ctree, ERRNO);</div><div class='ctx'> </div><div class='ctx'> static void btrfs_end_super_write(struct bio *bio)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_device *device = bio-&gt;bi_private;</div><div class='del'>-	struct bio_vec *bvec;</div><div class='del'>-	struct bvec_iter_all iter_all;</div><div class='del'>-	struct page *page;</div><div class='del'>-</div><div class='del'>-	bio_for_each_segment_all(bvec, bio, iter_all) {</div><div class='del'>-		page = bvec-&gt;bv_page;</div><div class='add'>+	struct folio_iter fi;</div><div class='ctx'> </div><div class='add'>+	bio_for_each_folio_all(fi, bio) {</div><div class='ctx'> 		if (bio-&gt;bi_status) {</div><div class='del'>-			btrfs_warn_rl_in_rcu(device-&gt;fs_info,</div><div class='del'>-				"lost page write due to IO error on %s (%d)",</div><div class='del'>-				rcu_str_deref(device-&gt;name),</div><div class='add'>+			btrfs_warn_rl(device-&gt;fs_info,</div><div class='add'>+				"lost super block write due to IO error on %s (%d)",</div><div class='add'>+				btrfs_dev_name(device),</div><div class='ctx'> 				blk_status_to_errno(bio-&gt;bi_status));</div><div class='del'>-			ClearPageUptodate(page);</div><div class='del'>-			SetPageError(page);</div><div class='ctx'> 			btrfs_dev_stat_inc_and_print(device,</div><div class='ctx'> 						     BTRFS_DEV_STAT_WRITE_ERRS);</div><div class='del'>-		} else {</div><div class='del'>-			SetPageUptodate(page);</div><div class='add'>+			/* Ensure failure if the primary sb fails. */</div><div class='add'>+			if (bio-&gt;bi_opf &amp; REQ_FUA)</div><div class='add'>+				atomic_add(BTRFS_SUPER_PRIMARY_WRITE_ERROR,</div><div class='add'>+					   &amp;device-&gt;sb_write_errors);</div><div class='add'>+			else</div><div class='add'>+				atomic_inc(&amp;device-&gt;sb_write_errors);</div><div class='ctx'> 		}</div><div class='del'>-</div><div class='del'>-		put_page(page);</div><div class='del'>-		unlock_page(page);</div><div class='add'>+		folio_unlock(fi.folio);</div><div class='add'>+		folio_put(fi.folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	bio_put(bio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct btrfs_super_block *btrfs_read_dev_one_super(struct block_device *bdev,</div><div class='del'>-						   int copy_num)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_super_block *super;</div><div class='del'>-	struct page *page;</div><div class='del'>-	u64 bytenr, bytenr_orig;</div><div class='del'>-	struct address_space *mapping = bdev-&gt;bd_inode-&gt;i_mapping;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	bytenr_orig = btrfs_sb_offset(copy_num);</div><div class='del'>-	ret = btrfs_sb_log_location_bdev(bdev, copy_num, READ, &amp;bytenr);</div><div class='del'>-	if (ret == -ENOENT)</div><div class='del'>-		return ERR_PTR(-EINVAL);</div><div class='del'>-	else if (ret)</div><div class='del'>-		return ERR_PTR(ret);</div><div class='del'>-</div><div class='del'>-	if (bytenr + BTRFS_SUPER_INFO_SIZE &gt;= bdev_nr_bytes(bdev))</div><div class='del'>-		return ERR_PTR(-EINVAL);</div><div class='del'>-</div><div class='del'>-	page = read_cache_page_gfp(mapping, bytenr &gt;&gt; PAGE_SHIFT, GFP_NOFS);</div><div class='del'>-	if (IS_ERR(page))</div><div class='del'>-		return ERR_CAST(page);</div><div class='del'>-</div><div class='del'>-	super = page_address(page);</div><div class='del'>-	if (btrfs_super_magic(super) != BTRFS_MAGIC) {</div><div class='del'>-		btrfs_release_disk_super(super);</div><div class='del'>-		return ERR_PTR(-ENODATA);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (btrfs_super_bytenr(super) != bytenr_orig) {</div><div class='del'>-		btrfs_release_disk_super(super);</div><div class='del'>-		return ERR_PTR(-EINVAL);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return super;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-struct btrfs_super_block *btrfs_read_dev_super(struct block_device *bdev)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_super_block *super, *latest = NULL;</div><div class='del'>-	int i;</div><div class='del'>-	u64 transid = 0;</div><div class='del'>-</div><div class='del'>-	/* we would like to check all the supers, but that would make</div><div class='del'>-	 * a btrfs mount succeed after a mkfs from a different FS.</div><div class='del'>-	 * So, we need to add a special mount option to scan for</div><div class='del'>-	 * later supers, using BTRFS_SUPER_MIRROR_MAX instead</div><div class='del'>-	 */</div><div class='del'>-	for (i = 0; i &lt; 1; i++) {</div><div class='del'>-		super = btrfs_read_dev_one_super(bdev, i);</div><div class='del'>-		if (IS_ERR(super))</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		if (!latest || btrfs_super_generation(super) &gt; transid) {</div><div class='del'>-			if (latest)</div><div class='del'>-				btrfs_release_disk_super(super);</div><div class='del'>-</div><div class='del'>-			latest = super;</div><div class='del'>-			transid = btrfs_super_generation(super);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return super;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Write superblock @sb to the @device. Do not wait for completion, all the</div><div class='del'>- * pages we use for writing are locked.</div><div class='add'>+ * folios we use for writing are locked.</div><div class='ctx'>  *</div><div class='ctx'>  * Write @max_mirrors copies of the superblock, where 0 means default that fit</div><div class='ctx'>  * the expected device size at commit time. Note that max_mirrors must be</div><div class='ctx'>  * same for write and wait phases.</div><div class='ctx'>  *</div><div class='del'>- * Return number of errors when page is not found or submission fails.</div><div class='add'>+ * Return number of errors when folio is not found or submission fails.</div><div class='ctx'>  */</div><div class='ctx'> static int write_dev_supers(struct btrfs_device *device,</div><div class='ctx'> 			    struct btrfs_super_block *sb, int max_mirrors)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = device-&gt;fs_info;</div><div class='del'>-	struct address_space *mapping = device-&gt;bdev-&gt;bd_inode-&gt;i_mapping;</div><div class='add'>+	struct address_space *mapping = device-&gt;bdev-&gt;bd_mapping;</div><div class='ctx'> 	SHASH_DESC_ON_STACK(shash, fs_info-&gt;csum_shash);</div><div class='ctx'> 	int i;</div><div class='del'>-	int errors = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	u64 bytenr, bytenr_orig;</div><div class='ctx'> </div><div class='add'>+	atomic_set(&amp;device-&gt;sb_write_errors, 0);</div><div class='add'>+</div><div class='ctx'> 	if (max_mirrors == 0)</div><div class='ctx'> 		max_mirrors = BTRFS_SUPER_MIRROR_MAX;</div><div class='ctx'> </div><div class='ctx'> 	shash-&gt;tfm = fs_info-&gt;csum_shash;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; max_mirrors; i++) {</div><div class='del'>-		struct page *page;</div><div class='add'>+		struct folio *folio;</div><div class='ctx'> 		struct bio *bio;</div><div class='ctx'> 		struct btrfs_super_block *disk_super;</div><div class='add'>+		size_t offset;</div><div class='ctx'> </div><div class='ctx'> 		bytenr_orig = btrfs_sb_offset(i);</div><div class='ctx'> 		ret = btrfs_sb_log_location(device, i, WRITE, &amp;bytenr);</div><div class='hunk'>@@ -3835,9 +3737,9 @@ static int write_dev_supers(struct btrfs_device *device,</div><div class='ctx'> 			continue;</div><div class='ctx'> 		} else if (ret &lt; 0) {</div><div class='ctx'> 			btrfs_err(device-&gt;fs_info,</div><div class='del'>-				"couldn't get super block location for mirror %d",</div><div class='del'>-				i);</div><div class='del'>-			errors++;</div><div class='add'>+			  "couldn't get super block location for mirror %d error %d",</div><div class='add'>+			  i, ret);</div><div class='add'>+			atomic_inc(&amp;device-&gt;sb_write_errors);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (bytenr + BTRFS_SUPER_INFO_SIZE &gt;=</div><div class='hunk'>@@ -3850,20 +3752,19 @@ static int write_dev_supers(struct btrfs_device *device,</div><div class='ctx'> 				    BTRFS_SUPER_INFO_SIZE - BTRFS_CSUM_SIZE,</div><div class='ctx'> 				    sb-&gt;csum);</div><div class='ctx'> </div><div class='del'>-		page = find_or_create_page(mapping, bytenr &gt;&gt; PAGE_SHIFT,</div><div class='del'>-					   GFP_NOFS);</div><div class='del'>-		if (!page) {</div><div class='add'>+		folio = __filemap_get_folio(mapping, bytenr &gt;&gt; PAGE_SHIFT,</div><div class='add'>+					    FGP_LOCK | FGP_ACCESSED | FGP_CREAT,</div><div class='add'>+					    GFP_NOFS);</div><div class='add'>+		if (IS_ERR(folio)) {</div><div class='ctx'> 			btrfs_err(device-&gt;fs_info,</div><div class='del'>-			    "couldn't get super block page for bytenr %llu",</div><div class='del'>-			    bytenr);</div><div class='del'>-			errors++;</div><div class='add'>+			  "couldn't get super block page for bytenr %llu error %ld",</div><div class='add'>+			  bytenr, PTR_ERR(folio));</div><div class='add'>+			atomic_inc(&amp;device-&gt;sb_write_errors);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		/* Bump the refcount for wait_dev_supers() */</div><div class='del'>-		get_page(page);</div><div class='del'>-</div><div class='del'>-		disk_super = page_address(page);</div><div class='add'>+		offset = offset_in_folio(folio, bytenr);</div><div class='add'>+		disk_super = folio_address(folio) + offset;</div><div class='ctx'> 		memcpy(disk_super, sb, BTRFS_SUPER_INFO_SIZE);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='hunk'>@@ -3871,37 +3772,35 @@ static int write_dev_supers(struct btrfs_device *device,</div><div class='ctx'> 		 * to do I/O, so we don't lose the ability to do integrity</div><div class='ctx'> 		 * checking.</div><div class='ctx'> 		 */</div><div class='del'>-		bio = bio_alloc(GFP_NOFS, 1);</div><div class='del'>-		bio_set_dev(bio, device-&gt;bdev);</div><div class='add'>+		bio = bio_alloc(device-&gt;bdev, 1,</div><div class='add'>+				REQ_OP_WRITE | REQ_SYNC | REQ_META | REQ_PRIO,</div><div class='add'>+				GFP_NOFS);</div><div class='ctx'> 		bio-&gt;bi_iter.bi_sector = bytenr &gt;&gt; SECTOR_SHIFT;</div><div class='ctx'> 		bio-&gt;bi_private = device;</div><div class='ctx'> 		bio-&gt;bi_end_io = btrfs_end_super_write;</div><div class='del'>-		__bio_add_page(bio, page, BTRFS_SUPER_INFO_SIZE,</div><div class='del'>-			       offset_in_page(bytenr));</div><div class='add'>+		bio_add_folio_nofail(bio, folio, BTRFS_SUPER_INFO_SIZE, offset);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We FUA only the first super block.  The others we allow to</div><div class='ctx'> 		 * go down lazy and there's a short window where the on-disk</div><div class='ctx'> 		 * copies might still contain the older version.</div><div class='ctx'> 		 */</div><div class='del'>-		bio-&gt;bi_opf = REQ_OP_WRITE | REQ_SYNC | REQ_META | REQ_PRIO;</div><div class='ctx'> 		if (i == 0 &amp;&amp; !btrfs_test_opt(device-&gt;fs_info, NOBARRIER))</div><div class='ctx'> 			bio-&gt;bi_opf |= REQ_FUA;</div><div class='del'>-</div><div class='del'>-		btrfsic_submit_bio(bio);</div><div class='add'>+		submit_bio(bio);</div><div class='ctx'> </div><div class='ctx'> 		if (btrfs_advance_sb_log(device, i))</div><div class='del'>-			errors++;</div><div class='add'>+			atomic_inc(&amp;device-&gt;sb_write_errors);</div><div class='ctx'> 	}</div><div class='del'>-	return errors &lt; i ? 0 : -1;</div><div class='add'>+	return atomic_read(&amp;device-&gt;sb_write_errors) &lt; i ? 0 : -1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Wait for write completion of superblocks done by write_dev_supers,</div><div class='ctx'>  * @max_mirrors same for write and wait phases.</div><div class='ctx'>  *</div><div class='del'>- * Return number of errors when page is not found or not marked up to</div><div class='del'>- * date.</div><div class='add'>+ * Return -1 if primary super block write failed or when there were no super block</div><div class='add'>+ * copies written. Otherwise 0.</div><div class='ctx'>  */</div><div class='ctx'> static int wait_dev_supers(struct btrfs_device *device, int max_mirrors)</div><div class='ctx'> {</div><div class='hunk'>@@ -3915,7 +3814,7 @@ static int wait_dev_supers(struct btrfs_device *device, int max_mirrors)</div><div class='ctx'> 		max_mirrors = BTRFS_SUPER_MIRROR_MAX;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; max_mirrors; i++) {</div><div class='del'>-		struct page *page;</div><div class='add'>+		struct folio *folio;</div><div class='ctx'> </div><div class='ctx'> 		ret = btrfs_sb_log_location(device, i, READ, &amp;bytenr);</div><div class='ctx'> 		if (ret == -ENOENT) {</div><div class='hunk'>@@ -3930,30 +3829,20 @@ static int wait_dev_supers(struct btrfs_device *device, int max_mirrors)</div><div class='ctx'> 		    device-&gt;commit_total_bytes)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		page = find_get_page(device-&gt;bdev-&gt;bd_inode-&gt;i_mapping,</div><div class='del'>-				     bytenr &gt;&gt; PAGE_SHIFT);</div><div class='del'>-		if (!page) {</div><div class='del'>-			errors++;</div><div class='del'>-			if (i == 0)</div><div class='del'>-				primary_failed = true;</div><div class='add'>+		folio = filemap_get_folio(device-&gt;bdev-&gt;bd_mapping,</div><div class='add'>+					  bytenr &gt;&gt; PAGE_SHIFT);</div><div class='add'>+		/* If the folio has been removed, then we know it completed. */</div><div class='add'>+		if (IS_ERR(folio))</div><div class='ctx'> 			continue;</div><div class='del'>-		}</div><div class='del'>-		/* Page is submitted locked and unlocked once the IO completes */</div><div class='del'>-		wait_on_page_locked(page);</div><div class='del'>-		if (PageError(page)) {</div><div class='del'>-			errors++;</div><div class='del'>-			if (i == 0)</div><div class='del'>-				primary_failed = true;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/* Drop our reference */</div><div class='del'>-		put_page(page);</div><div class='ctx'> </div><div class='del'>-		/* Drop the reference from the writing run */</div><div class='del'>-		put_page(page);</div><div class='add'>+		/* Folio will be unlocked once the write completes. */</div><div class='add'>+		folio_wait_locked(folio);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* log error, force error return */</div><div class='add'>+	errors += atomic_read(&amp;device-&gt;sb_write_errors);</div><div class='add'>+	if (errors &gt;= BTRFS_SUPER_PRIMARY_WRITE_ERROR)</div><div class='add'>+		primary_failed = true;</div><div class='ctx'> 	if (primary_failed) {</div><div class='ctx'> 		btrfs_err(device-&gt;fs_info, "error writing primary super block to device %llu",</div><div class='ctx'> 			  device-&gt;devid);</div><div class='hunk'>@@ -3969,6 +3858,7 @@ static int wait_dev_supers(struct btrfs_device *device, int max_mirrors)</div><div class='ctx'>  */</div><div class='ctx'> static void btrfs_end_empty_barrier(struct bio *bio)</div><div class='ctx'> {</div><div class='add'>+	bio_uninit(bio);</div><div class='ctx'> 	complete(bio-&gt;bi_private);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3978,44 +3868,39 @@ static void btrfs_end_empty_barrier(struct bio *bio)</div><div class='ctx'>  */</div><div class='ctx'> static void write_dev_flush(struct btrfs_device *device)</div><div class='ctx'> {</div><div class='del'>-	struct request_queue *q = bdev_get_queue(device-&gt;bdev);</div><div class='del'>-	struct bio *bio = device-&gt;flush_bio;</div><div class='add'>+	struct bio *bio = &amp;device-&gt;flush_bio;</div><div class='ctx'> </div><div class='del'>-	if (!test_bit(QUEUE_FLAG_WC, &amp;q-&gt;queue_flags))</div><div class='del'>-		return;</div><div class='add'>+	device-&gt;last_flush_error = BLK_STS_OK;</div><div class='ctx'> </div><div class='del'>-	bio_reset(bio);</div><div class='add'>+	bio_init(bio, device-&gt;bdev, NULL, 0,</div><div class='add'>+		 REQ_OP_WRITE | REQ_SYNC | REQ_PREFLUSH);</div><div class='ctx'> 	bio-&gt;bi_end_io = btrfs_end_empty_barrier;</div><div class='del'>-	bio_set_dev(bio, device-&gt;bdev);</div><div class='del'>-	bio-&gt;bi_opf = REQ_OP_WRITE | REQ_SYNC | REQ_PREFLUSH;</div><div class='ctx'> 	init_completion(&amp;device-&gt;flush_wait);</div><div class='ctx'> 	bio-&gt;bi_private = &amp;device-&gt;flush_wait;</div><div class='del'>-</div><div class='del'>-	btrfsic_submit_bio(bio);</div><div class='add'>+	submit_bio(bio);</div><div class='ctx'> 	set_bit(BTRFS_DEV_STATE_FLUSH_SENT, &amp;device-&gt;dev_state);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * If the flush bio has been submitted by write_dev_flush, wait for it.</div><div class='add'>+ * Return true for any error, and false otherwise.</div><div class='ctx'>  */</div><div class='del'>-static blk_status_t wait_dev_flush(struct btrfs_device *device)</div><div class='add'>+static bool wait_dev_flush(struct btrfs_device *device)</div><div class='ctx'> {</div><div class='del'>-	struct bio *bio = device-&gt;flush_bio;</div><div class='add'>+	struct bio *bio = &amp;device-&gt;flush_bio;</div><div class='ctx'> </div><div class='del'>-	if (!test_bit(BTRFS_DEV_STATE_FLUSH_SENT, &amp;device-&gt;dev_state))</div><div class='del'>-		return BLK_STS_OK;</div><div class='add'>+	if (!test_and_clear_bit(BTRFS_DEV_STATE_FLUSH_SENT, &amp;device-&gt;dev_state))</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-	clear_bit(BTRFS_DEV_STATE_FLUSH_SENT, &amp;device-&gt;dev_state);</div><div class='ctx'> 	wait_for_completion_io(&amp;device-&gt;flush_wait);</div><div class='ctx'> </div><div class='del'>-	return bio-&gt;bi_status;</div><div class='del'>-}</div><div class='add'>+	if (bio-&gt;bi_status) {</div><div class='add'>+		device-&gt;last_flush_error = bio-&gt;bi_status;</div><div class='add'>+		btrfs_dev_stat_inc_and_print(device, BTRFS_DEV_STAT_FLUSH_ERRS);</div><div class='add'>+		return true;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-static int check_barrier_error(struct btrfs_fs_info *fs_info)</div><div class='del'>-{</div><div class='del'>-	if (!btrfs_check_rw_degradable(fs_info, NULL))</div><div class='del'>-		return -EIO;</div><div class='del'>-	return 0;</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -4027,7 +3912,6 @@ static int barrier_all_devices(struct btrfs_fs_info *info)</div><div class='ctx'> 	struct list_head *head;</div><div class='ctx'> 	struct btrfs_device *dev;</div><div class='ctx'> 	int errors_wait = 0;</div><div class='del'>-	blk_status_t ret;</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;info-&gt;fs_devices-&gt;device_list_mutex);</div><div class='ctx'> 	/* send down all the barriers */</div><div class='hunk'>@@ -4042,7 +3926,6 @@ static int barrier_all_devices(struct btrfs_fs_info *info)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		write_dev_flush(dev);</div><div class='del'>-		dev-&gt;last_flush_error = BLK_STS_OK;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* wait for all the barriers */</div><div class='hunk'>@@ -4057,23 +3940,17 @@ static int barrier_all_devices(struct btrfs_fs_info *info)</div><div class='ctx'> 		    !test_bit(BTRFS_DEV_STATE_WRITEABLE, &amp;dev-&gt;dev_state))</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		ret = wait_dev_flush(dev);</div><div class='del'>-		if (ret) {</div><div class='del'>-			dev-&gt;last_flush_error = ret;</div><div class='del'>-			btrfs_dev_stat_inc_and_print(dev,</div><div class='del'>-					BTRFS_DEV_STAT_FLUSH_ERRS);</div><div class='add'>+		if (wait_dev_flush(dev))</div><div class='ctx'> 			errors_wait++;</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (errors_wait) {</div><div class='del'>-		/*</div><div class='del'>-		 * At some point we need the status of all disks</div><div class='del'>-		 * to arrive at the volume status. So error checking</div><div class='del'>-		 * is being pushed to a separate loop.</div><div class='del'>-		 */</div><div class='del'>-		return check_barrier_error(info);</div><div class='del'>-	}</div><div class='add'>+	/*</div><div class='add'>+	 * Checks last_flush_error of disks in order to determine the device</div><div class='add'>+	 * state.</div><div class='add'>+	 */</div><div class='add'>+	if (unlikely(errors_wait &amp;&amp; !btrfs_check_rw_degradable(info, NULL)))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -4099,7 +3976,7 @@ int btrfs_get_num_tolerated_disk_barrier_failures(u64 flags)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (min_tolerated == INT_MAX) {</div><div class='del'>-		pr_warn("BTRFS: unknown raid flag: %llu", flags);</div><div class='add'>+		btrfs_warn(NULL, "unknown raid flag: %llu", flags);</div><div class='ctx'> 		min_tolerated = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -4173,7 +4050,7 @@ int write_all_supers(struct btrfs_fs_info *fs_info, int max_mirrors)</div><div class='ctx'> 		btrfs_set_super_flags(sb, flags | BTRFS_HEADER_FLAG_WRITTEN);</div><div class='ctx'> </div><div class='ctx'> 		ret = btrfs_validate_write_super(fs_info, sb);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='add'>+		if (unlikely(ret &lt; 0)) {</div><div class='ctx'> 			mutex_unlock(&amp;fs_info-&gt;fs_devices-&gt;device_list_mutex);</div><div class='ctx'> 			btrfs_handle_fs_error(fs_info, -EUCLEAN,</div><div class='ctx'> 				"unexpected superblock corruption detected");</div><div class='hunk'>@@ -4184,7 +4061,7 @@ int write_all_supers(struct btrfs_fs_info *fs_info, int max_mirrors)</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			total_errors++;</div><div class='ctx'> 	}</div><div class='del'>-	if (total_errors &gt; max_errors) {</div><div class='add'>+	if (unlikely(total_errors &gt; max_errors)) {</div><div class='ctx'> 		btrfs_err(fs_info, "%d errors while writing supers",</div><div class='ctx'> 			  total_errors);</div><div class='ctx'> 		mutex_unlock(&amp;fs_info-&gt;fs_devices-&gt;device_list_mutex);</div><div class='hunk'>@@ -4209,7 +4086,7 @@ int write_all_supers(struct btrfs_fs_info *fs_info, int max_mirrors)</div><div class='ctx'> 			total_errors++;</div><div class='ctx'> 	}</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;fs_devices-&gt;device_list_mutex);</div><div class='del'>-	if (total_errors &gt; max_errors) {</div><div class='add'>+	if (unlikely(total_errors &gt; max_errors)) {</div><div class='ctx'> 		btrfs_handle_fs_error(fs_info, -EIO,</div><div class='ctx'> 				      "%d errors while writing supers",</div><div class='ctx'> 				      total_errors);</div><div class='hunk'>@@ -4226,7 +4103,7 @@ void btrfs_drop_and_free_fs_root(struct btrfs_fs_info *fs_info,</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;fs_roots_radix_lock);</div><div class='ctx'> 	radix_tree_delete(&amp;fs_info-&gt;fs_roots_radix,</div><div class='del'>-			  (unsigned long)root-&gt;root_key.objectid);</div><div class='add'>+			  (unsigned long)btrfs_root_id(root));</div><div class='ctx'> 	if (test_and_clear_bit(BTRFS_ROOT_IN_RADIX, &amp;root-&gt;state))</div><div class='ctx'> 		drop_ref = true;</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;fs_roots_radix_lock);</div><div class='hunk'>@@ -4243,61 +4120,8 @@ void btrfs_drop_and_free_fs_root(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		btrfs_put_root(root);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_cleanup_fs_roots(struct btrfs_fs_info *fs_info)</div><div class='del'>-{</div><div class='del'>-	u64 root_objectid = 0;</div><div class='del'>-	struct btrfs_root *gang[8];</div><div class='del'>-	int i = 0;</div><div class='del'>-	int err = 0;</div><div class='del'>-	unsigned int ret = 0;</div><div class='del'>-</div><div class='del'>-	while (1) {</div><div class='del'>-		spin_lock(&amp;fs_info-&gt;fs_roots_radix_lock);</div><div class='del'>-		ret = radix_tree_gang_lookup(&amp;fs_info-&gt;fs_roots_radix,</div><div class='del'>-					     (void **)gang, root_objectid,</div><div class='del'>-					     ARRAY_SIZE(gang));</div><div class='del'>-		if (!ret) {</div><div class='del'>-			spin_unlock(&amp;fs_info-&gt;fs_roots_radix_lock);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		root_objectid = gang[ret - 1]-&gt;root_key.objectid + 1;</div><div class='del'>-</div><div class='del'>-		for (i = 0; i &lt; ret; i++) {</div><div class='del'>-			/* Avoid to grab roots in dead_roots */</div><div class='del'>-			if (btrfs_root_refs(&amp;gang[i]-&gt;root_item) == 0) {</div><div class='del'>-				gang[i] = NULL;</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='del'>-			/* grab all the search result for later use */</div><div class='del'>-			gang[i] = btrfs_grab_root(gang[i]);</div><div class='del'>-		}</div><div class='del'>-		spin_unlock(&amp;fs_info-&gt;fs_roots_radix_lock);</div><div class='del'>-</div><div class='del'>-		for (i = 0; i &lt; ret; i++) {</div><div class='del'>-			if (!gang[i])</div><div class='del'>-				continue;</div><div class='del'>-			root_objectid = gang[i]-&gt;root_key.objectid;</div><div class='del'>-			err = btrfs_orphan_cleanup(gang[i]);</div><div class='del'>-			if (err)</div><div class='del'>-				break;</div><div class='del'>-			btrfs_put_root(gang[i]);</div><div class='del'>-		}</div><div class='del'>-		root_objectid++;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* release the uncleaned roots due to error */</div><div class='del'>-	for (; i &lt; ret; i++) {</div><div class='del'>-		if (gang[i])</div><div class='del'>-			btrfs_put_root(gang[i]);</div><div class='del'>-	}</div><div class='del'>-	return err;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> int btrfs_commit_super(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *root = fs_info-&gt;tree_root;</div><div class='del'>-	struct btrfs_trans_handle *trans;</div><div class='del'>-</div><div class='ctx'> 	mutex_lock(&amp;fs_info-&gt;cleaner_mutex);</div><div class='ctx'> 	btrfs_run_delayed_iputs(fs_info);</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;cleaner_mutex);</div><div class='hunk'>@@ -4307,10 +4131,47 @@ int btrfs_commit_super(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	down_write(&amp;fs_info-&gt;cleanup_work_sem);</div><div class='ctx'> 	up_write(&amp;fs_info-&gt;cleanup_work_sem);</div><div class='ctx'> </div><div class='del'>-	trans = btrfs_join_transaction(root);</div><div class='del'>-	if (IS_ERR(trans))</div><div class='del'>-		return PTR_ERR(trans);</div><div class='del'>-	return btrfs_commit_transaction(trans);</div><div class='add'>+	return btrfs_commit_current_transaction(fs_info-&gt;tree_root);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void warn_about_uncommitted_trans(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_transaction *trans;</div><div class='add'>+	struct btrfs_transaction *tmp;</div><div class='add'>+	bool found = false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This function is only called at the very end of close_ctree(),</div><div class='add'>+	 * thus no other running transaction, no need to take trans_lock.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(test_bit(BTRFS_FS_CLOSING_DONE, &amp;fs_info-&gt;flags));</div><div class='add'>+	list_for_each_entry_safe(trans, tmp, &amp;fs_info-&gt;trans_list, list) {</div><div class='add'>+		struct extent_state *cached = NULL;</div><div class='add'>+		u64 dirty_bytes = 0;</div><div class='add'>+		u64 cur = 0;</div><div class='add'>+		u64 found_start;</div><div class='add'>+		u64 found_end;</div><div class='add'>+</div><div class='add'>+		found = true;</div><div class='add'>+		while (btrfs_find_first_extent_bit(&amp;trans-&gt;dirty_pages, cur,</div><div class='add'>+						   &amp;found_start, &amp;found_end,</div><div class='add'>+						   EXTENT_DIRTY, &amp;cached)) {</div><div class='add'>+			dirty_bytes += found_end + 1 - found_start;</div><div class='add'>+			cur = found_end + 1;</div><div class='add'>+		}</div><div class='add'>+		btrfs_warn(fs_info,</div><div class='add'>+	"transaction %llu (with %llu dirty metadata bytes) is not committed",</div><div class='add'>+			   trans-&gt;transid, dirty_bytes);</div><div class='add'>+		btrfs_cleanup_one_transaction(trans);</div><div class='add'>+</div><div class='add'>+		if (trans == fs_info-&gt;running_transaction)</div><div class='add'>+			fs_info-&gt;running_transaction = NULL;</div><div class='add'>+		list_del_init(&amp;trans-&gt;list);</div><div class='add'>+</div><div class='add'>+		btrfs_put_transaction(trans);</div><div class='add'>+		trace_btrfs_transaction_commit(fs_info);</div><div class='add'>+	}</div><div class='add'>+	ASSERT(!found);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void __cold close_ctree(struct btrfs_fs_info *fs_info)</div><div class='hunk'>@@ -4318,6 +4179,28 @@ void __cold close_ctree(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	set_bit(BTRFS_FS_CLOSING_START, &amp;fs_info-&gt;flags);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If we had UNFINISHED_DROPS we could still be processing them, so</div><div class='add'>+	 * clear that bit and wake up relocation so it can stop.</div><div class='add'>+	 * We must do this before stopping the block group reclaim task, because</div><div class='add'>+	 * at btrfs_relocate_block_group() we wait for this bit, and after the</div><div class='add'>+	 * wait we stop with -EINTR if btrfs_fs_closing() returns non-zero - we</div><div class='add'>+	 * have just set BTRFS_FS_CLOSING_START, so btrfs_fs_closing() will</div><div class='add'>+	 * return 1.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_wake_unfinished_drop(fs_info);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We may have the reclaim task running and relocating a data block group,</div><div class='add'>+	 * in which case it may create delayed iputs. So stop it before we park</div><div class='add'>+	 * the cleaner kthread otherwise we can get new delayed iputs after</div><div class='add'>+	 * parking the cleaner, and that can make the async reclaim task to hang</div><div class='add'>+	 * if it's waiting for delayed iputs to complete, since the cleaner is</div><div class='add'>+	 * parked and can not run delayed iputs - this will make us hang when</div><div class='add'>+	 * trying to stop the async reclaim task.</div><div class='add'>+	 */</div><div class='add'>+	cancel_work_sync(&amp;fs_info-&gt;reclaim_bgs_work);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We don't want the cleaner to start new transactions, add more delayed</div><div class='ctx'> 	 * iputs, etc. while we're closing. We can't use kthread_stop() yet</div><div class='hunk'>@@ -4348,11 +4231,104 @@ void __cold close_ctree(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	/* clear out the rbtree of defraggable inodes */</div><div class='ctx'> 	btrfs_cleanup_defrag_inodes(fs_info);</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Handle the error fs first, as it will flush and wait for all ordered</div><div class='add'>+	 * extents.  This will generate delayed iputs, thus we want to handle</div><div class='add'>+	 * it first.</div><div class='add'>+	 */</div><div class='add'>+	if (unlikely(BTRFS_FS_ERROR(fs_info)))</div><div class='add'>+		btrfs_error_commit_super(fs_info);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Wait for any fixup workers to complete.</div><div class='add'>+	 * If we don't wait for them here and they are still running by the time</div><div class='add'>+	 * we call kthread_stop() against the cleaner kthread further below, we</div><div class='add'>+	 * get an use-after-free on the cleaner because the fixup worker adds an</div><div class='add'>+	 * inode to the list of delayed iputs and then attempts to wakeup the</div><div class='add'>+	 * cleaner kthread, which was already stopped and destroyed. We parked</div><div class='add'>+	 * already the cleaner, but below we run all pending delayed iputs.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_flush_workqueue(fs_info-&gt;fixup_workers);</div><div class='add'>+	/*</div><div class='add'>+	 * Similar case here, we have to wait for delalloc workers before we</div><div class='add'>+	 * proceed below and stop the cleaner kthread, otherwise we trigger a</div><div class='add'>+	 * use-after-tree on the cleaner kthread task_struct when a delalloc</div><div class='add'>+	 * worker running submit_compressed_extents() adds a delayed iput, which</div><div class='add'>+	 * does a wake up on the cleaner kthread, which was already freed below</div><div class='add'>+	 * when we call kthread_stop().</div><div class='add'>+	 */</div><div class='add'>+	btrfs_flush_workqueue(fs_info-&gt;delalloc_workers);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We can have ordered extents getting their last reference dropped from</div><div class='add'>+	 * the fs_info-&gt;workers queue because for async writes for data bios we</div><div class='add'>+	 * queue a work for that queue, at btrfs_wq_submit_bio(), that runs</div><div class='add'>+	 * run_one_async_done() which calls btrfs_bio_end_io() in case the bio</div><div class='add'>+	 * has an error, and that later function can do the final</div><div class='add'>+	 * btrfs_put_ordered_extent() on the ordered extent attached to the bio,</div><div class='add'>+	 * which adds a delayed iput for the inode. So we must flush the queue</div><div class='add'>+	 * so that we don't have delayed iputs after committing the current</div><div class='add'>+	 * transaction below and stopping the cleaner and transaction kthreads.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_flush_workqueue(fs_info-&gt;workers);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * When finishing a compressed write bio we schedule a work queue item</div><div class='add'>+	 * to finish an ordered extent - end_bbio_compressed_write()</div><div class='add'>+	 * calls btrfs_finish_ordered_extent() which in turns does a call to</div><div class='add'>+	 * btrfs_queue_ordered_fn(), and that queues the ordered extent</div><div class='add'>+	 * completion either in the endio_write_workers work queue or in the</div><div class='add'>+	 * fs_info-&gt;endio_freespace_worker work queue. We flush those queues</div><div class='add'>+	 * below, so before we flush them we must flush this queue for the</div><div class='add'>+	 * workers of compressed writes.</div><div class='add'>+	 */</div><div class='add'>+	flush_workqueue(fs_info-&gt;endio_workers);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * After we parked the cleaner kthread, ordered extents may have</div><div class='add'>+	 * completed and created new delayed iputs. If one of the async reclaim</div><div class='add'>+	 * tasks is running and in the RUN_DELAYED_IPUTS flush state, then we</div><div class='add'>+	 * can hang forever trying to stop it, because if a delayed iput is</div><div class='add'>+	 * added after it ran btrfs_run_delayed_iputs() and before it called</div><div class='add'>+	 * btrfs_wait_on_delayed_iputs(), it will hang forever since there is</div><div class='add'>+	 * no one else to run iputs.</div><div class='add'>+	 *</div><div class='add'>+	 * So wait for all ongoing ordered extents to complete and then run</div><div class='add'>+	 * delayed iputs. This works because once we reach this point no one</div><div class='add'>+	 * can create new ordered extents, but delayed iputs can still be added</div><div class='add'>+	 * by a reclaim worker (see comments further below).</div><div class='add'>+	 *</div><div class='add'>+	 * Also note that btrfs_wait_ordered_roots() is not safe here, because</div><div class='add'>+	 * it waits for BTRFS_ORDERED_COMPLETE to be set on an ordered extent,</div><div class='add'>+	 * but the delayed iput for the respective inode is made only when doing</div><div class='add'>+	 * the final btrfs_put_ordered_extent() (which must happen at</div><div class='add'>+	 * btrfs_finish_ordered_io() when we are unmounting).</div><div class='add'>+	 */</div><div class='add'>+	btrfs_flush_workqueue(fs_info-&gt;endio_write_workers);</div><div class='add'>+	/* Ordered extents for free space inodes. */</div><div class='add'>+	btrfs_flush_workqueue(fs_info-&gt;endio_freespace_worker);</div><div class='add'>+	/*</div><div class='add'>+	 * Run delayed iputs in case an async reclaim worker is waiting for them</div><div class='add'>+	 * to be run as mentioned above.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_run_delayed_iputs(fs_info);</div><div class='add'>+</div><div class='ctx'> 	cancel_work_sync(&amp;fs_info-&gt;async_reclaim_work);</div><div class='ctx'> 	cancel_work_sync(&amp;fs_info-&gt;async_data_reclaim_work);</div><div class='ctx'> 	cancel_work_sync(&amp;fs_info-&gt;preempt_reclaim_work);</div><div class='add'>+	cancel_work_sync(&amp;fs_info-&gt;em_shrinker_work);</div><div class='ctx'> </div><div class='del'>-	cancel_work_sync(&amp;fs_info-&gt;reclaim_bgs_work);</div><div class='add'>+	/*</div><div class='add'>+	 * Run delayed iputs again because an async reclaim worker may have</div><div class='add'>+	 * added new ones if it was flushing delalloc:</div><div class='add'>+	 *</div><div class='add'>+	 * shrink_delalloc() -&gt; btrfs_start_delalloc_roots() -&gt;</div><div class='add'>+	 *    start_delalloc_inodes() -&gt; btrfs_add_delayed_iput()</div><div class='add'>+	 */</div><div class='add'>+	btrfs_run_delayed_iputs(fs_info);</div><div class='add'>+</div><div class='add'>+	/* There should be no more workload to generate new delayed iputs. */</div><div class='add'>+	set_bit(BTRFS_FS_STATE_NO_DELAYED_IPUT, &amp;fs_info-&gt;fs_state);</div><div class='ctx'> </div><div class='ctx'> 	/* Cancel or finish ongoing discard work */</div><div class='ctx'> 	btrfs_discard_cleanup(fs_info);</div><div class='hunk'>@@ -4382,9 +4358,6 @@ void __cold close_ctree(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 			btrfs_err(fs_info, "commit super ret %d", ret);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (BTRFS_FS_ERROR(fs_info))</div><div class='del'>-		btrfs_error_commit_super(fs_info);</div><div class='del'>-</div><div class='ctx'> 	kthread_stop(fs_info-&gt;transaction_kthread);</div><div class='ctx'> 	kthread_stop(fs_info-&gt;cleaner_kthread);</div><div class='ctx'> </div><div class='hunk'>@@ -4392,7 +4365,7 @@ void __cold close_ctree(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	set_bit(BTRFS_FS_CLOSING_DONE, &amp;fs_info-&gt;flags);</div><div class='ctx'> </div><div class='ctx'> 	if (btrfs_check_quota_leak(fs_info)) {</div><div class='del'>-		WARN_ON(IS_ENABLED(CONFIG_BTRFS_DEBUG));</div><div class='add'>+		DEBUG_WARN("qgroup reserved space leaked");</div><div class='ctx'> 		btrfs_err(fs_info, "qgroup reserved space leaked");</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -4421,7 +4394,7 @@ void __cold close_ctree(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	btrfs_stop_all_workers(fs_info);</div><div class='ctx'> </div><div class='ctx'> 	/* We shouldn't have any transaction open at this point */</div><div class='del'>-	ASSERT(list_empty(&amp;fs_info-&gt;trans_list));</div><div class='add'>+	warn_about_uncommitted_trans(fs_info);</div><div class='ctx'> </div><div class='ctx'> 	clear_bit(BTRFS_FS_OPEN, &amp;fs_info-&gt;flags);</div><div class='ctx'> 	free_root_pointers(fs_info, true);</div><div class='hunk'>@@ -4438,37 +4411,14 @@ void __cold close_ctree(struct btrfs_fs_info *fs_info)</div><div class='ctx'> </div><div class='ctx'> 	iput(fs_info-&gt;btree_inode);</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_BTRFS_FS_CHECK_INTEGRITY</div><div class='del'>-	if (btrfs_test_opt(fs_info, CHECK_INTEGRITY))</div><div class='del'>-		btrfsic_unmount(fs_info-&gt;fs_devices);</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-	btrfs_mapping_tree_free(&amp;fs_info-&gt;mapping_tree);</div><div class='del'>-	btrfs_close_devices(fs_info-&gt;fs_devices);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int btrfs_buffer_uptodate(struct extent_buffer *buf, u64 parent_transid,</div><div class='del'>-			  int atomic)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-	struct inode *btree_inode = buf-&gt;pages[0]-&gt;mapping-&gt;host;</div><div class='del'>-</div><div class='del'>-	ret = extent_buffer_uptodate(buf);</div><div class='del'>-	if (!ret)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	ret = verify_parent_transid(&amp;BTRFS_I(btree_inode)-&gt;io_tree, buf,</div><div class='del'>-				    parent_transid, atomic);</div><div class='del'>-	if (ret == -EAGAIN)</div><div class='del'>-		return ret;</div><div class='del'>-	return !ret;</div><div class='add'>+	btrfs_mapping_tree_free(fs_info);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_mark_buffer_dirty(struct extent_buffer *buf)</div><div class='add'>+void btrfs_mark_buffer_dirty(struct btrfs_trans_handle *trans,</div><div class='add'>+			     struct extent_buffer *buf)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = buf-&gt;fs_info;</div><div class='ctx'> 	u64 transid = btrfs_header_generation(buf);</div><div class='del'>-	int was_dirty;</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_BTRFS_FS_RUN_SANITY_TESTS</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -4479,27 +4429,16 @@ void btrfs_mark_buffer_dirty(struct extent_buffer *buf)</div><div class='ctx'> 	if (unlikely(test_bit(EXTENT_BUFFER_UNMAPPED, &amp;buf-&gt;bflags)))</div><div class='ctx'> 		return;</div><div class='ctx'> #endif</div><div class='add'>+	/* This is an active transaction (its state &lt; TRANS_STATE_UNBLOCKED). */</div><div class='add'>+	ASSERT(trans-&gt;transid == fs_info-&gt;generation);</div><div class='ctx'> 	btrfs_assert_tree_write_locked(buf);</div><div class='del'>-	if (transid != fs_info-&gt;generation)</div><div class='del'>-		WARN(1, KERN_CRIT "btrfs transid mismatch buffer %llu, found %llu running %llu\n",</div><div class='del'>-			buf-&gt;start, transid, fs_info-&gt;generation);</div><div class='del'>-	was_dirty = set_extent_buffer_dirty(buf);</div><div class='del'>-	if (!was_dirty)</div><div class='del'>-		percpu_counter_add_batch(&amp;fs_info-&gt;dirty_metadata_bytes,</div><div class='del'>-					 buf-&gt;len,</div><div class='del'>-					 fs_info-&gt;dirty_metadata_batch);</div><div class='del'>-#ifdef CONFIG_BTRFS_FS_CHECK_INTEGRITY</div><div class='del'>-	/*</div><div class='del'>-	 * Since btrfs_mark_buffer_dirty() can be called with item pointer set</div><div class='del'>-	 * but item data not updated.</div><div class='del'>-	 * So here we should only check item pointers, not item data.</div><div class='del'>-	 */</div><div class='del'>-	if (btrfs_header_level(buf) == 0 &amp;&amp;</div><div class='del'>-	    btrfs_check_leaf_relaxed(buf)) {</div><div class='del'>-		btrfs_print_leaf(buf);</div><div class='del'>-		ASSERT(0);</div><div class='add'>+	if (unlikely(transid != fs_info-&gt;generation)) {</div><div class='add'>+		btrfs_abort_transaction(trans, -EUCLEAN);</div><div class='add'>+		btrfs_crit(fs_info,</div><div class='add'>+"dirty buffer transid mismatch, logical %llu found transid %llu running transid %llu",</div><div class='add'>+			   buf-&gt;start, transid, fs_info-&gt;generation);</div><div class='ctx'> 	}</div><div class='del'>-#endif</div><div class='add'>+	set_extent_buffer_dirty(buf);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void __btrfs_btree_balance_dirty(struct btrfs_fs_info *fs_info,</div><div class='hunk'>@@ -4535,22 +4474,11 @@ void btrfs_btree_balance_dirty_nodelay(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	__btrfs_btree_balance_dirty(fs_info, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_read_buffer(struct extent_buffer *buf, u64 parent_transid, int level,</div><div class='del'>-		      struct btrfs_key *first_key)</div><div class='del'>-{</div><div class='del'>-	return btree_read_extent_buffer_pages(buf, parent_transid,</div><div class='del'>-					      level, first_key);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static void btrfs_error_commit_super(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	/* cleanup FS via transaction */</div><div class='ctx'> 	btrfs_cleanup_transaction(fs_info);</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;fs_info-&gt;cleaner_mutex);</div><div class='del'>-	btrfs_run_delayed_iputs(fs_info);</div><div class='del'>-	mutex_unlock(&amp;fs_info-&gt;cleaner_mutex);</div><div class='del'>-</div><div class='ctx'> 	down_write(&amp;fs_info-&gt;cleanup_work_sem);</div><div class='ctx'> 	up_write(&amp;fs_info-&gt;cleanup_work_sem);</div><div class='ctx'> }</div><div class='hunk'>@@ -4574,7 +4502,7 @@ static void btrfs_drop_all_logs(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 		for (i = 0; i &lt; ret; i++) {</div><div class='ctx'> 			if (!gang[i])</div><div class='ctx'> 				continue;</div><div class='del'>-			root_objectid = gang[i]-&gt;root_key.objectid;</div><div class='add'>+			root_objectid = btrfs_root_id(gang[i]);</div><div class='ctx'> 			btrfs_free_log(NULL, gang[i]);</div><div class='ctx'> 			btrfs_put_root(gang[i]);</div><div class='ctx'> 		}</div><div class='hunk'>@@ -4603,9 +4531,7 @@ static void btrfs_destroy_ordered_extents(struct btrfs_root *root)</div><div class='ctx'> static void btrfs_destroy_all_ordered_extents(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root;</div><div class='del'>-	struct list_head splice;</div><div class='del'>-</div><div class='del'>-	INIT_LIST_HEAD(&amp;splice);</div><div class='add'>+	LIST_HEAD(splice);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;ordered_root_lock);</div><div class='ctx'> 	list_splice_init(&amp;fs_info-&gt;ordered_roots, &amp;splice);</div><div class='hunk'>@@ -4629,95 +4555,13 @@ static void btrfs_destroy_all_ordered_extents(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	 * extents that haven't had their dirty pages IO start writeout yet</div><div class='ctx'> 	 * actually get run and error out properly.</div><div class='ctx'> 	 */</div><div class='del'>-	btrfs_wait_ordered_roots(fs_info, U64_MAX, 0, (u64)-1);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int btrfs_destroy_delayed_refs(struct btrfs_transaction *trans,</div><div class='del'>-				      struct btrfs_fs_info *fs_info)</div><div class='del'>-{</div><div class='del'>-	struct rb_node *node;</div><div class='del'>-	struct btrfs_delayed_ref_root *delayed_refs;</div><div class='del'>-	struct btrfs_delayed_ref_node *ref;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	delayed_refs = &amp;trans-&gt;delayed_refs;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;delayed_refs-&gt;lock);</div><div class='del'>-	if (atomic_read(&amp;delayed_refs-&gt;num_entries) == 0) {</div><div class='del'>-		spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='del'>-		btrfs_debug(fs_info, "delayed_refs has NO entry");</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	while ((node = rb_first_cached(&amp;delayed_refs-&gt;href_root)) != NULL) {</div><div class='del'>-		struct btrfs_delayed_ref_head *head;</div><div class='del'>-		struct rb_node *n;</div><div class='del'>-		bool pin_bytes = false;</div><div class='del'>-</div><div class='del'>-		head = rb_entry(node, struct btrfs_delayed_ref_head,</div><div class='del'>-				href_node);</div><div class='del'>-		if (btrfs_delayed_ref_lock(delayed_refs, head))</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		spin_lock(&amp;head-&gt;lock);</div><div class='del'>-		while ((n = rb_first_cached(&amp;head-&gt;ref_tree)) != NULL) {</div><div class='del'>-			ref = rb_entry(n, struct btrfs_delayed_ref_node,</div><div class='del'>-				       ref_node);</div><div class='del'>-			ref-&gt;in_tree = 0;</div><div class='del'>-			rb_erase_cached(&amp;ref-&gt;ref_node, &amp;head-&gt;ref_tree);</div><div class='del'>-			RB_CLEAR_NODE(&amp;ref-&gt;ref_node);</div><div class='del'>-			if (!list_empty(&amp;ref-&gt;add_list))</div><div class='del'>-				list_del(&amp;ref-&gt;add_list);</div><div class='del'>-			atomic_dec(&amp;delayed_refs-&gt;num_entries);</div><div class='del'>-			btrfs_put_delayed_ref(ref);</div><div class='del'>-		}</div><div class='del'>-		if (head-&gt;must_insert_reserved)</div><div class='del'>-			pin_bytes = true;</div><div class='del'>-		btrfs_free_delayed_extent_op(head-&gt;extent_op);</div><div class='del'>-		btrfs_delete_ref_head(delayed_refs, head);</div><div class='del'>-		spin_unlock(&amp;head-&gt;lock);</div><div class='del'>-		spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='del'>-		mutex_unlock(&amp;head-&gt;mutex);</div><div class='del'>-</div><div class='del'>-		if (pin_bytes) {</div><div class='del'>-			struct btrfs_block_group *cache;</div><div class='del'>-</div><div class='del'>-			cache = btrfs_lookup_block_group(fs_info, head-&gt;bytenr);</div><div class='del'>-			BUG_ON(!cache);</div><div class='del'>-</div><div class='del'>-			spin_lock(&amp;cache-&gt;space_info-&gt;lock);</div><div class='del'>-			spin_lock(&amp;cache-&gt;lock);</div><div class='del'>-			cache-&gt;pinned += head-&gt;num_bytes;</div><div class='del'>-			btrfs_space_info_update_bytes_pinned(fs_info,</div><div class='del'>-				cache-&gt;space_info, head-&gt;num_bytes);</div><div class='del'>-			cache-&gt;reserved -= head-&gt;num_bytes;</div><div class='del'>-			cache-&gt;space_info-&gt;bytes_reserved -= head-&gt;num_bytes;</div><div class='del'>-			spin_unlock(&amp;cache-&gt;lock);</div><div class='del'>-			spin_unlock(&amp;cache-&gt;space_info-&gt;lock);</div><div class='del'>-</div><div class='del'>-			btrfs_put_block_group(cache);</div><div class='del'>-</div><div class='del'>-			btrfs_error_unpin_extent_range(fs_info, head-&gt;bytenr,</div><div class='del'>-				head-&gt;bytenr + head-&gt;num_bytes - 1);</div><div class='del'>-		}</div><div class='del'>-		btrfs_cleanup_ref_head_accounting(fs_info, delayed_refs, head);</div><div class='del'>-		btrfs_put_delayed_ref_head(head);</div><div class='del'>-		cond_resched();</div><div class='del'>-		spin_lock(&amp;delayed_refs-&gt;lock);</div><div class='del'>-	}</div><div class='del'>-	btrfs_qgroup_destroy_extent_records(trans);</div><div class='del'>-</div><div class='del'>-	spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='add'>+	btrfs_wait_ordered_roots(fs_info, U64_MAX, NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void btrfs_destroy_delalloc_inodes(struct btrfs_root *root)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_inode *btrfs_inode;</div><div class='del'>-	struct list_head splice;</div><div class='del'>-</div><div class='del'>-	INIT_LIST_HEAD(&amp;splice);</div><div class='add'>+	LIST_HEAD(splice);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;root-&gt;delalloc_lock);</div><div class='ctx'> 	list_splice_init(&amp;root-&gt;delalloc_inodes, &amp;splice);</div><div class='hunk'>@@ -4726,7 +4570,7 @@ static void btrfs_destroy_delalloc_inodes(struct btrfs_root *root)</div><div class='ctx'> 		struct inode *inode = NULL;</div><div class='ctx'> 		btrfs_inode = list_first_entry(&amp;splice, struct btrfs_inode,</div><div class='ctx'> 					       delalloc_inodes);</div><div class='del'>-		__btrfs_del_delalloc_inode(root, btrfs_inode);</div><div class='add'>+		btrfs_del_delalloc_inode(btrfs_inode);</div><div class='ctx'> 		spin_unlock(&amp;root-&gt;delalloc_lock);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='hunk'>@@ -4735,7 +4579,11 @@ static void btrfs_destroy_delalloc_inodes(struct btrfs_root *root)</div><div class='ctx'> 		 */</div><div class='ctx'> 		inode = igrab(&amp;btrfs_inode-&gt;vfs_inode);</div><div class='ctx'> 		if (inode) {</div><div class='add'>+			unsigned int nofs_flag;</div><div class='add'>+</div><div class='add'>+			nofs_flag = memalloc_nofs_save();</div><div class='ctx'> 			invalidate_inode_pages2(inode-&gt;i_mapping);</div><div class='add'>+			memalloc_nofs_restore(nofs_flag);</div><div class='ctx'> 			iput(inode);</div><div class='ctx'> 		}</div><div class='ctx'> 		spin_lock(&amp;root-&gt;delalloc_lock);</div><div class='hunk'>@@ -4746,9 +4594,7 @@ static void btrfs_destroy_delalloc_inodes(struct btrfs_root *root)</div><div class='ctx'> static void btrfs_destroy_all_delalloc_inodes(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root;</div><div class='del'>-	struct list_head splice;</div><div class='del'>-</div><div class='del'>-	INIT_LIST_HEAD(&amp;splice);</div><div class='add'>+	LIST_HEAD(splice);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;delalloc_root_lock);</div><div class='ctx'> 	list_splice_init(&amp;fs_info-&gt;delalloc_roots, &amp;splice);</div><div class='hunk'>@@ -4767,45 +4613,38 @@ static void btrfs_destroy_all_delalloc_inodes(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;delalloc_root_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btrfs_destroy_marked_extents(struct btrfs_fs_info *fs_info,</div><div class='del'>-					struct extent_io_tree *dirty_pages,</div><div class='del'>-					int mark)</div><div class='add'>+static void btrfs_destroy_marked_extents(struct btrfs_fs_info *fs_info,</div><div class='add'>+					 struct extent_io_tree *dirty_pages,</div><div class='add'>+					 int mark)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='ctx'> 	u64 start = 0;</div><div class='ctx'> 	u64 end;</div><div class='ctx'> </div><div class='del'>-	while (1) {</div><div class='del'>-		ret = find_first_extent_bit(dirty_pages, start, &amp;start, &amp;end,</div><div class='del'>-					    mark, NULL);</div><div class='del'>-		if (ret)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		clear_extent_bits(dirty_pages, start, end, mark);</div><div class='add'>+	while (btrfs_find_first_extent_bit(dirty_pages, start, &amp;start, &amp;end,</div><div class='add'>+					   mark, NULL)) {</div><div class='add'>+		btrfs_clear_extent_bit(dirty_pages, start, end, mark, NULL);</div><div class='ctx'> 		while (start &lt;= end) {</div><div class='ctx'> 			eb = find_extent_buffer(fs_info, start);</div><div class='ctx'> 			start += fs_info-&gt;nodesize;</div><div class='ctx'> 			if (!eb)</div><div class='ctx'> 				continue;</div><div class='add'>+</div><div class='add'>+			btrfs_tree_lock(eb);</div><div class='ctx'> 			wait_on_extent_buffer_writeback(eb);</div><div class='add'>+			btrfs_clear_buffer_dirty(NULL, eb);</div><div class='add'>+			btrfs_tree_unlock(eb);</div><div class='ctx'> </div><div class='del'>-			if (test_and_clear_bit(EXTENT_BUFFER_DIRTY,</div><div class='del'>-					       &amp;eb-&gt;bflags))</div><div class='del'>-				clear_extent_buffer_dirty(eb);</div><div class='ctx'> 			free_extent_buffer_stale(eb);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btrfs_destroy_pinned_extent(struct btrfs_fs_info *fs_info,</div><div class='del'>-				       struct extent_io_tree *unpin)</div><div class='add'>+static void btrfs_destroy_pinned_extent(struct btrfs_fs_info *fs_info,</div><div class='add'>+					struct extent_io_tree *unpin)</div><div class='ctx'> {</div><div class='ctx'> 	u64 start;</div><div class='ctx'> 	u64 end;</div><div class='del'>-	int ret;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		struct extent_state *cached_state = NULL;</div><div class='hunk'>@@ -4817,21 +4656,18 @@ static int btrfs_destroy_pinned_extent(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		 * the same extent range.</div><div class='ctx'> 		 */</div><div class='ctx'> 		mutex_lock(&amp;fs_info-&gt;unused_bg_unpin_mutex);</div><div class='del'>-		ret = find_first_extent_bit(unpin, 0, &amp;start, &amp;end,</div><div class='del'>-					    EXTENT_DIRTY, &amp;cached_state);</div><div class='del'>-		if (ret) {</div><div class='add'>+		if (!btrfs_find_first_extent_bit(unpin, 0, &amp;start, &amp;end,</div><div class='add'>+						 EXTENT_DIRTY, &amp;cached_state)) {</div><div class='ctx'> 			mutex_unlock(&amp;fs_info-&gt;unused_bg_unpin_mutex);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		clear_extent_dirty(unpin, start, end, &amp;cached_state);</div><div class='del'>-		free_extent_state(cached_state);</div><div class='add'>+		btrfs_clear_extent_dirty(unpin, start, end, &amp;cached_state);</div><div class='add'>+		btrfs_free_extent_state(cached_state);</div><div class='ctx'> 		btrfs_error_unpin_extent_range(fs_info, start, end);</div><div class='ctx'> 		mutex_unlock(&amp;fs_info-&gt;unused_bg_unpin_mutex);</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void btrfs_cleanup_bg_io(struct btrfs_block_group *cache)</div><div class='hunk'>@@ -4840,7 +4676,12 @@ static void btrfs_cleanup_bg_io(struct btrfs_block_group *cache)</div><div class='ctx'> </div><div class='ctx'> 	inode = cache-&gt;io_ctl.inode;</div><div class='ctx'> 	if (inode) {</div><div class='add'>+		unsigned int nofs_flag;</div><div class='add'>+</div><div class='add'>+		nofs_flag = memalloc_nofs_save();</div><div class='ctx'> 		invalidate_inode_pages2(inode-&gt;i_mapping);</div><div class='add'>+		memalloc_nofs_restore(nofs_flag);</div><div class='add'>+</div><div class='ctx'> 		BTRFS_I(inode)-&gt;generation = 0;</div><div class='ctx'> 		cache-&gt;io_ctl.inode = NULL;</div><div class='ctx'> 		iput(inode);</div><div class='hunk'>@@ -4874,7 +4715,7 @@ void btrfs_cleanup_dirty_bgs(struct btrfs_transaction *cur_trans,</div><div class='ctx'> </div><div class='ctx'> 		spin_unlock(&amp;cur_trans-&gt;dirty_bgs_lock);</div><div class='ctx'> 		btrfs_put_block_group(cache);</div><div class='del'>-		btrfs_delayed_refs_rsv_release(fs_info, 1);</div><div class='add'>+		btrfs_dec_delayed_refs_rsv_bg_updates(fs_info);</div><div class='ctx'> 		spin_lock(&amp;cur_trans-&gt;dirty_bgs_lock);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;cur_trans-&gt;dirty_bgs_lock);</div><div class='hunk'>@@ -4896,9 +4737,35 @@ void btrfs_cleanup_dirty_bgs(struct btrfs_transaction *cur_trans,</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_cleanup_one_transaction(struct btrfs_transaction *cur_trans,</div><div class='del'>-				   struct btrfs_fs_info *fs_info)</div><div class='add'>+static void btrfs_free_all_qgroup_pertrans(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_root *gang[8];</div><div class='add'>+	int i;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fs_info-&gt;fs_roots_radix_lock);</div><div class='add'>+	while (1) {</div><div class='add'>+		ret = radix_tree_gang_lookup_tag(&amp;fs_info-&gt;fs_roots_radix,</div><div class='add'>+						 (void **)gang, 0,</div><div class='add'>+						 ARRAY_SIZE(gang),</div><div class='add'>+						 BTRFS_ROOT_TRANS_TAG);</div><div class='add'>+		if (ret == 0)</div><div class='add'>+			break;</div><div class='add'>+		for (i = 0; i &lt; ret; i++) {</div><div class='add'>+			struct btrfs_root *root = gang[i];</div><div class='add'>+</div><div class='add'>+			btrfs_qgroup_free_meta_all_pertrans(root);</div><div class='add'>+			radix_tree_tag_clear(&amp;fs_info-&gt;fs_roots_radix,</div><div class='add'>+					(unsigned long)btrfs_root_id(root),</div><div class='add'>+					BTRFS_ROOT_TRANS_TAG);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;fs_roots_radix_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_cleanup_one_transaction(struct btrfs_transaction *cur_trans)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = cur_trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_device *dev, *tmp;</div><div class='ctx'> </div><div class='ctx'> 	btrfs_cleanup_dirty_bgs(cur_trans, fs_info);</div><div class='hunk'>@@ -4910,7 +4777,7 @@ void btrfs_cleanup_one_transaction(struct btrfs_transaction *cur_trans,</div><div class='ctx'> 		list_del_init(&amp;dev-&gt;post_commit_list);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_destroy_delayed_refs(cur_trans, fs_info);</div><div class='add'>+	btrfs_destroy_delayed_refs(cur_trans);</div><div class='ctx'> </div><div class='ctx'> 	cur_trans-&gt;state = TRANS_STATE_COMMIT_START;</div><div class='ctx'> 	wake_up(&amp;fs_info-&gt;transaction_blocked_wait);</div><div class='hunk'>@@ -4918,14 +4785,10 @@ void btrfs_cleanup_one_transaction(struct btrfs_transaction *cur_trans,</div><div class='ctx'> 	cur_trans-&gt;state = TRANS_STATE_UNBLOCKED;</div><div class='ctx'> 	wake_up(&amp;fs_info-&gt;transaction_wait);</div><div class='ctx'> </div><div class='del'>-	btrfs_destroy_delayed_inodes(fs_info);</div><div class='del'>-</div><div class='ctx'> 	btrfs_destroy_marked_extents(fs_info, &amp;cur_trans-&gt;dirty_pages,</div><div class='ctx'> 				     EXTENT_DIRTY);</div><div class='ctx'> 	btrfs_destroy_pinned_extent(fs_info, &amp;cur_trans-&gt;pinned_extents);</div><div class='ctx'> </div><div class='del'>-	btrfs_free_redirty_list(cur_trans);</div><div class='del'>-</div><div class='ctx'> 	cur_trans-&gt;state =TRANS_STATE_COMPLETED;</div><div class='ctx'> 	wake_up(&amp;cur_trans-&gt;commit_wait);</div><div class='ctx'> }</div><div class='hunk'>@@ -4940,7 +4803,7 @@ static int btrfs_cleanup_transaction(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	while (!list_empty(&amp;fs_info-&gt;trans_list)) {</div><div class='ctx'> 		t = list_first_entry(&amp;fs_info-&gt;trans_list,</div><div class='ctx'> 				     struct btrfs_transaction, list);</div><div class='del'>-		if (t-&gt;state &gt;= TRANS_STATE_COMMIT_START) {</div><div class='add'>+		if (t-&gt;state &gt;= TRANS_STATE_COMMIT_PREP) {</div><div class='ctx'> 			refcount_inc(&amp;t-&gt;use_count);</div><div class='ctx'> 			spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='ctx'> 			btrfs_wait_for_commit(fs_info, t-&gt;transid);</div><div class='hunk'>@@ -4960,7 +4823,7 @@ static int btrfs_cleanup_transaction(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 		} else {</div><div class='ctx'> 			spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='ctx'> 		}</div><div class='del'>-		btrfs_cleanup_one_transaction(t, fs_info);</div><div class='add'>+		btrfs_cleanup_one_transaction(t);</div><div class='ctx'> </div><div class='ctx'> 		spin_lock(&amp;fs_info-&gt;trans_lock);</div><div class='ctx'> 		if (t == fs_info-&gt;running_transaction)</div><div class='hunk'>@@ -4969,7 +4832,7 @@ static int btrfs_cleanup_transaction(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 		spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='ctx'> </div><div class='ctx'> 		btrfs_put_transaction(t);</div><div class='del'>-		trace_btrfs_transaction_commit(fs_info-&gt;tree_root);</div><div class='add'>+		trace_btrfs_transaction_commit(fs_info);</div><div class='ctx'> 		spin_lock(&amp;fs_info-&gt;trans_lock);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='hunk'>@@ -4978,6 +4841,7 @@ static int btrfs_cleanup_transaction(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	btrfs_assert_delayed_root_empty(fs_info);</div><div class='ctx'> 	btrfs_destroy_all_delalloc_inodes(fs_info);</div><div class='ctx'> 	btrfs_drop_all_logs(fs_info);</div><div class='add'>+	btrfs_free_all_qgroup_pertrans(fs_info);</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;transaction_kthread_mutex);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -4985,7 +4849,7 @@ static int btrfs_cleanup_transaction(struct btrfs_fs_info *fs_info)</div><div class='ctx'> </div><div class='ctx'> int btrfs_init_root_free_objectid(struct btrfs_root *root)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct extent_buffer *l;</div><div class='ctx'> 	struct btrfs_key search_key;</div><div class='hunk'>@@ -5001,8 +4865,14 @@ int btrfs_init_root_free_objectid(struct btrfs_root *root)</div><div class='ctx'> 	search_key.offset = (u64)-1;</div><div class='ctx'> 	ret = btrfs_search_slot(NULL, root, &amp;search_key, path, 0, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto error;</div><div class='del'>-	BUG_ON(ret == 0); /* Corruption */</div><div class='add'>+		return ret;</div><div class='add'>+	if (unlikely(ret == 0)) {</div><div class='add'>+		/*</div><div class='add'>+		 * Key with offset -1 found, there would have to exist a root</div><div class='add'>+		 * with such id, but this is out of valid range.</div><div class='add'>+		 */</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='ctx'> 	if (path-&gt;slots[0] &gt; 0) {</div><div class='ctx'> 		slot = path-&gt;slots[0] - 1;</div><div class='ctx'> 		l = path-&gt;nodes[0];</div><div class='hunk'>@@ -5012,10 +4882,8 @@ int btrfs_init_root_free_objectid(struct btrfs_root *root)</div><div class='ctx'> 	} else {</div><div class='ctx'> 		root-&gt;free_objectid = BTRFS_FIRST_FREE_OBJECTID;</div><div class='ctx'> 	}</div><div class='del'>-	ret = 0;</div><div class='del'>-error:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_get_free_objectid(struct btrfs_root *root, u64 *objectid)</div><div class='hunk'>@@ -5026,7 +4894,7 @@ int btrfs_get_free_objectid(struct btrfs_root *root, u64 *objectid)</div><div class='ctx'> 	if (unlikely(root-&gt;free_objectid &gt;= BTRFS_LAST_FREE_OBJECTID)) {</div><div class='ctx'> 		btrfs_warn(root-&gt;fs_info,</div><div class='ctx'> 			   "the objectid of root %llu reaches its highest value",</div><div class='del'>-			   root-&gt;root_key.objectid);</div><div class='add'>+			   btrfs_root_id(root));</div><div class='ctx'> 		ret = -ENOSPC;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='head'>diff --git a/fs/btrfs/disk-io.h b/fs/btrfs/disk-io.h<br/>index a2b5db4ba262..5320da83d0cf 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/disk-io.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/disk-io.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/disk-io.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/disk-io.h</a></div><div class='hunk'>@@ -6,6 +6,23 @@</div><div class='ctx'> #ifndef BTRFS_DISK_IO_H</div><div class='ctx'> #define BTRFS_DISK_IO_H</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/sizes.h&gt;</div><div class='add'>+#include &lt;linux/compiler_types.h&gt;</div><div class='add'>+#include "ctree.h"</div><div class='add'>+#include "bio.h"</div><div class='add'>+#include "ordered-data.h"</div><div class='add'>+</div><div class='add'>+struct block_device;</div><div class='add'>+struct super_block;</div><div class='add'>+struct extent_buffer;</div><div class='add'>+struct btrfs_device;</div><div class='add'>+struct btrfs_fs_devices;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+struct btrfs_super_block;</div><div class='add'>+struct btrfs_trans_handle;</div><div class='add'>+struct btrfs_tree_parent_check;</div><div class='add'>+struct btrfs_transaction;</div><div class='add'>+</div><div class='ctx'> #define BTRFS_SUPER_MIRROR_MAX	 3</div><div class='ctx'> #define BTRFS_SUPER_MIRROR_SHIFT 12</div><div class='ctx'> </div><div class='hunk'>@@ -17,13 +34,6 @@</div><div class='ctx'>  */</div><div class='ctx'> #define BTRFS_BDEV_BLOCKSIZE	(4096)</div><div class='ctx'> </div><div class='del'>-enum btrfs_wq_endio_type {</div><div class='del'>-	BTRFS_WQ_ENDIO_DATA,</div><div class='del'>-	BTRFS_WQ_ENDIO_METADATA,</div><div class='del'>-	BTRFS_WQ_ENDIO_FREE_SPACE,</div><div class='del'>-	BTRFS_WQ_ENDIO_RAID56,</div><div class='del'>-};</div><div class='del'>-</div><div class='ctx'> static inline u64 btrfs_sb_offset(int mirror)</div><div class='ctx'> {</div><div class='ctx'> 	u64 start = SZ_16K;</div><div class='hunk'>@@ -32,34 +42,26 @@ static inline u64 btrfs_sb_offset(int mirror)</div><div class='ctx'> 	return BTRFS_SUPER_INFO_OFFSET;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct btrfs_device;</div><div class='del'>-struct btrfs_fs_devices;</div><div class='del'>-</div><div class='del'>-void btrfs_check_leaked_roots(struct btrfs_fs_info *fs_info);</div><div class='add'>+void btrfs_check_leaked_roots(const struct btrfs_fs_info *fs_info);</div><div class='ctx'> void btrfs_init_fs_info(struct btrfs_fs_info *fs_info);</div><div class='del'>-int btrfs_verify_level_key(struct extent_buffer *eb, int level,</div><div class='del'>-			   struct btrfs_key *first_key, u64 parent_transid);</div><div class='ctx'> struct extent_buffer *read_tree_block(struct btrfs_fs_info *fs_info, u64 bytenr,</div><div class='del'>-				      u64 owner_root, u64 parent_transid,</div><div class='del'>-				      int level, struct btrfs_key *first_key);</div><div class='add'>+				      struct btrfs_tree_parent_check *check);</div><div class='ctx'> struct extent_buffer *btrfs_find_create_tree_block(</div><div class='ctx'> 						struct btrfs_fs_info *fs_info,</div><div class='ctx'> 						u64 bytenr, u64 owner_root,</div><div class='ctx'> 						int level);</div><div class='del'>-void btrfs_clean_tree_block(struct extent_buffer *buf);</div><div class='del'>-void btrfs_clear_oneshot_options(struct btrfs_fs_info *fs_info);</div><div class='ctx'> int btrfs_start_pre_rw_mount(struct btrfs_fs_info *fs_info);</div><div class='del'>-int __cold open_ctree(struct super_block *sb,</div><div class='del'>-	       struct btrfs_fs_devices *fs_devices,</div><div class='del'>-	       char *options);</div><div class='add'>+int btrfs_check_super_csum(struct btrfs_fs_info *fs_info,</div><div class='add'>+			   const struct btrfs_super_block *disk_sb);</div><div class='add'>+int __cold open_ctree(struct super_block *sb, struct btrfs_fs_devices *fs_devices);</div><div class='ctx'> void __cold close_ctree(struct btrfs_fs_info *fs_info);</div><div class='add'>+int btrfs_validate_super(const struct btrfs_fs_info *fs_info,</div><div class='add'>+			 const struct btrfs_super_block *sb, int mirror_num);</div><div class='add'>+int btrfs_check_features(struct btrfs_fs_info *fs_info, bool is_rw_mount);</div><div class='ctx'> int write_all_supers(struct btrfs_fs_info *fs_info, int max_mirrors);</div><div class='del'>-struct btrfs_super_block *btrfs_read_dev_super(struct block_device *bdev);</div><div class='del'>-struct btrfs_super_block *btrfs_read_dev_one_super(struct block_device *bdev,</div><div class='del'>-						   int copy_num);</div><div class='ctx'> int btrfs_commit_super(struct btrfs_fs_info *fs_info);</div><div class='ctx'> struct btrfs_root *btrfs_read_tree_root(struct btrfs_root *tree_root,</div><div class='del'>-					struct btrfs_key *key);</div><div class='add'>+					const struct btrfs_key *key);</div><div class='ctx'> int btrfs_insert_fs_root(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			 struct btrfs_root *root);</div><div class='ctx'> void btrfs_free_fs_roots(struct btrfs_fs_info *fs_info);</div><div class='hunk'>@@ -67,22 +69,24 @@ void btrfs_free_fs_roots(struct btrfs_fs_info *fs_info);</div><div class='ctx'> struct btrfs_root *btrfs_get_fs_root(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				     u64 objectid, bool check_ref);</div><div class='ctx'> struct btrfs_root *btrfs_get_new_fs_root(struct btrfs_fs_info *fs_info,</div><div class='del'>-					 u64 objectid, dev_t anon_dev);</div><div class='add'>+					 u64 objectid, dev_t *anon_dev);</div><div class='ctx'> struct btrfs_root *btrfs_get_fs_root_commit_root(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 						 struct btrfs_path *path,</div><div class='ctx'> 						 u64 objectid);</div><div class='add'>+int btrfs_global_root_insert(struct btrfs_root *root);</div><div class='add'>+void btrfs_global_root_delete(struct btrfs_root *root);</div><div class='add'>+struct btrfs_root *btrfs_global_root(struct btrfs_fs_info *fs_info,</div><div class='add'>+				     struct btrfs_key *key);</div><div class='add'>+struct btrfs_root *btrfs_csum_root(struct btrfs_fs_info *fs_info, u64 bytenr);</div><div class='add'>+struct btrfs_root *btrfs_extent_root(struct btrfs_fs_info *fs_info, u64 bytenr);</div><div class='ctx'> </div><div class='ctx'> void btrfs_free_fs_info(struct btrfs_fs_info *fs_info);</div><div class='del'>-int btrfs_cleanup_fs_roots(struct btrfs_fs_info *fs_info);</div><div class='ctx'> void btrfs_btree_balance_dirty(struct btrfs_fs_info *fs_info);</div><div class='ctx'> void btrfs_btree_balance_dirty_nodelay(struct btrfs_fs_info *fs_info);</div><div class='ctx'> void btrfs_drop_and_free_fs_root(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				 struct btrfs_root *root);</div><div class='del'>-int btrfs_validate_metadata_buffer(struct btrfs_bio *bbio,</div><div class='del'>-				   struct page *page, u64 start, u64 end,</div><div class='del'>-				   int mirror);</div><div class='del'>-blk_status_t btrfs_submit_metadata_bio(struct inode *inode, struct bio *bio,</div><div class='del'>-				       int mirror_num, unsigned long bio_flags);</div><div class='add'>+int btrfs_validate_extent_buffer(struct extent_buffer *eb,</div><div class='add'>+				 const struct btrfs_tree_parent_check *check);</div><div class='ctx'> #ifdef CONFIG_BTRFS_FS_RUN_SANITY_TESTS</div><div class='ctx'> struct btrfs_root *btrfs_alloc_dummy_root(struct btrfs_fs_info *fs_info);</div><div class='ctx'> #endif</div><div class='hunk'>@@ -90,9 +94,6 @@ struct btrfs_root *btrfs_alloc_dummy_root(struct btrfs_fs_info *fs_info);</div><div class='ctx'> /*</div><div class='ctx'>  * This function is used to grab the root, and avoid it is freed when we</div><div class='ctx'>  * access it. But it doesn't ensure that the tree is not dropped.</div><div class='del'>- *</div><div class='del'>- * If you want to ensure the whole tree is safe, you should use</div><div class='del'>- * 	fs_info-&gt;subvol_srcu</div><div class='ctx'>  */</div><div class='ctx'> static inline struct btrfs_root *btrfs_grab_root(struct btrfs_root *root)</div><div class='ctx'> {</div><div class='hunk'>@@ -104,19 +105,13 @@ static inline struct btrfs_root *btrfs_grab_root(struct btrfs_root *root)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_put_root(struct btrfs_root *root);</div><div class='del'>-void btrfs_mark_buffer_dirty(struct extent_buffer *buf);</div><div class='del'>-int btrfs_buffer_uptodate(struct extent_buffer *buf, u64 parent_transid,</div><div class='del'>-			  int atomic);</div><div class='del'>-int btrfs_read_buffer(struct extent_buffer *buf, u64 parent_transid, int level,</div><div class='del'>-		      struct btrfs_key *first_key);</div><div class='del'>-blk_status_t btrfs_bio_wq_end_io(struct btrfs_fs_info *info, struct bio *bio,</div><div class='del'>-			enum btrfs_wq_endio_type metadata);</div><div class='del'>-blk_status_t btrfs_wq_submit_bio(struct inode *inode, struct bio *bio,</div><div class='del'>-				 int mirror_num, unsigned long bio_flags,</div><div class='del'>-				 u64 dio_file_offset,</div><div class='del'>-				 extent_submit_bio_start_t *submit_bio_start);</div><div class='del'>-blk_status_t btrfs_submit_bio_done(void *private_data, struct bio *bio,</div><div class='del'>-			  int mirror_num);</div><div class='add'>+void btrfs_mark_buffer_dirty(struct btrfs_trans_handle *trans,</div><div class='add'>+			     struct extent_buffer *buf);</div><div class='add'>+int btrfs_buffer_uptodate(struct extent_buffer *buf, u64 parent_transid, bool atomic);</div><div class='add'>+int btrfs_read_extent_buffer(struct extent_buffer *buf,</div><div class='add'>+			     const struct btrfs_tree_parent_check *check);</div><div class='add'>+</div><div class='add'>+int btree_csum_one_bio(struct btrfs_bio *bbio);</div><div class='ctx'> int btrfs_alloc_log_tree_node(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			      struct btrfs_root *root);</div><div class='ctx'> int btrfs_init_log_root_tree(struct btrfs_trans_handle *trans,</div><div class='hunk'>@@ -125,26 +120,11 @@ int btrfs_add_log_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		       struct btrfs_root *root);</div><div class='ctx'> void btrfs_cleanup_dirty_bgs(struct btrfs_transaction *trans,</div><div class='ctx'> 			     struct btrfs_fs_info *fs_info);</div><div class='del'>-void btrfs_cleanup_one_transaction(struct btrfs_transaction *trans,</div><div class='del'>-				  struct btrfs_fs_info *fs_info);</div><div class='add'>+void btrfs_cleanup_one_transaction(struct btrfs_transaction *trans);</div><div class='ctx'> struct btrfs_root *btrfs_create_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				     u64 objectid);</div><div class='del'>-int btree_lock_page_hook(struct page *page, void *data,</div><div class='del'>-				void (*flush_fn)(void *));</div><div class='ctx'> int btrfs_get_num_tolerated_disk_barrier_failures(u64 flags);</div><div class='ctx'> int btrfs_get_free_objectid(struct btrfs_root *root, u64 *objectid);</div><div class='ctx'> int btrfs_init_root_free_objectid(struct btrfs_root *root);</div><div class='del'>-int __init btrfs_end_io_wq_init(void);</div><div class='del'>-void __cold btrfs_end_io_wq_exit(void);</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_DEBUG_LOCK_ALLOC</div><div class='del'>-void btrfs_set_buffer_lockdep_class(u64 objectid,</div><div class='del'>-			            struct extent_buffer *eb, int level);</div><div class='del'>-#else</div><div class='del'>-static inline void btrfs_set_buffer_lockdep_class(u64 objectid,</div><div class='del'>-					struct extent_buffer *eb, int level)</div><div class='del'>-{</div><div class='del'>-}</div><div class='del'>-#endif</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/btrfs/export.c b/fs/btrfs/export.c<br/>index 1d4c2397d0d6..230d9326b685 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/export.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/export.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/export.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/export.c</a></div><div class='hunk'>@@ -5,8 +5,9 @@</div><div class='ctx'> #include "ctree.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='ctx'> #include "btrfs_inode.h"</div><div class='del'>-#include "print-tree.h"</div><div class='ctx'> #include "export.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "super.h"</div><div class='ctx'> </div><div class='ctx'> #define BTRFS_FID_SIZE_NON_CONNECTABLE (offsetof(struct btrfs_fid, \</div><div class='ctx'> 						 parent_objectid) / 4)</div><div class='hunk'>@@ -22,7 +23,11 @@ static int btrfs_encode_fh(struct inode *inode, u32 *fh, int *max_len,</div><div class='ctx'> 	int type;</div><div class='ctx'> </div><div class='ctx'> 	if (parent &amp;&amp; (len &lt; BTRFS_FID_SIZE_CONNECTABLE)) {</div><div class='del'>-		*max_len = BTRFS_FID_SIZE_CONNECTABLE;</div><div class='add'>+		if (btrfs_root_id(BTRFS_I(inode)-&gt;root) !=</div><div class='add'>+		    btrfs_root_id(BTRFS_I(parent)-&gt;root))</div><div class='add'>+			*max_len = BTRFS_FID_SIZE_CONNECTABLE_ROOT;</div><div class='add'>+		else</div><div class='add'>+			*max_len = BTRFS_FID_SIZE_CONNECTABLE;</div><div class='ctx'> 		return FILEID_INVALID;</div><div class='ctx'> 	} else if (len &lt; BTRFS_FID_SIZE_NON_CONNECTABLE) {</div><div class='ctx'> 		*max_len = BTRFS_FID_SIZE_NON_CONNECTABLE;</div><div class='hunk'>@@ -33,17 +38,19 @@ static int btrfs_encode_fh(struct inode *inode, u32 *fh, int *max_len,</div><div class='ctx'> 	type = FILEID_BTRFS_WITHOUT_PARENT;</div><div class='ctx'> </div><div class='ctx'> 	fid-&gt;objectid = btrfs_ino(BTRFS_I(inode));</div><div class='del'>-	fid-&gt;root_objectid = BTRFS_I(inode)-&gt;root-&gt;root_key.objectid;</div><div class='add'>+	fid-&gt;root_objectid = btrfs_root_id(BTRFS_I(inode)-&gt;root);</div><div class='ctx'> 	fid-&gt;gen = inode-&gt;i_generation;</div><div class='ctx'> </div><div class='ctx'> 	if (parent) {</div><div class='ctx'> 		u64 parent_root_id;</div><div class='ctx'> </div><div class='del'>-		fid-&gt;parent_objectid = BTRFS_I(parent)-&gt;location.objectid;</div><div class='add'>+		fid-&gt;parent_objectid = btrfs_ino(BTRFS_I(parent));</div><div class='ctx'> 		fid-&gt;parent_gen = parent-&gt;i_generation;</div><div class='del'>-		parent_root_id = BTRFS_I(parent)-&gt;root-&gt;root_key.objectid;</div><div class='add'>+		parent_root_id = btrfs_root_id(BTRFS_I(parent)-&gt;root);</div><div class='ctx'> </div><div class='ctx'> 		if (parent_root_id != fid-&gt;root_objectid) {</div><div class='add'>+			if (*max_len &lt; BTRFS_FID_SIZE_CONNECTABLE_ROOT)</div><div class='add'>+				return FILEID_INVALID;</div><div class='ctx'> 			fid-&gt;parent_root_objectid = parent_root_id;</div><div class='ctx'> 			len = BTRFS_FID_SIZE_CONNECTABLE_ROOT;</div><div class='ctx'> 			type = FILEID_BTRFS_WITH_PARENT_ROOT;</div><div class='hunk'>@@ -57,13 +64,24 @@ static int btrfs_encode_fh(struct inode *inode, u32 *fh, int *max_len,</div><div class='ctx'> 	return type;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Read dentry of inode with @objectid from filesystem root @root_objectid.</div><div class='add'>+ *</div><div class='add'>+ * @sb:             the filesystem super block</div><div class='add'>+ * @objectid:       inode objectid</div><div class='add'>+ * @root_objectid:  object id of the subvolume root where to look up the inode</div><div class='add'>+ * @generation:     optional, if not zero, verify that the found inode</div><div class='add'>+ *                  generation matches</div><div class='add'>+ *</div><div class='add'>+ * Return dentry alias for the inode, otherwise an error. In case the</div><div class='add'>+ * generation does not match return ESTALE.</div><div class='add'>+ */</div><div class='ctx'> struct dentry *btrfs_get_dentry(struct super_block *sb, u64 objectid,</div><div class='del'>-				u64 root_objectid, u32 generation,</div><div class='del'>-				int check_generation)</div><div class='add'>+				u64 root_objectid, u64 generation)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = btrfs_sb(sb);</div><div class='ctx'> 	struct btrfs_root *root;</div><div class='del'>-	struct inode *inode;</div><div class='add'>+	struct btrfs_inode *inode;</div><div class='ctx'> </div><div class='ctx'> 	if (objectid &lt; BTRFS_FIRST_FREE_OBJECTID)</div><div class='ctx'> 		return ERR_PTR(-ESTALE);</div><div class='hunk'>@@ -72,17 +90,17 @@ struct dentry *btrfs_get_dentry(struct super_block *sb, u64 objectid,</div><div class='ctx'> 	if (IS_ERR(root))</div><div class='ctx'> 		return ERR_CAST(root);</div><div class='ctx'> </div><div class='del'>-	inode = btrfs_iget(sb, objectid, root);</div><div class='add'>+	inode = btrfs_iget(objectid, root);</div><div class='ctx'> 	btrfs_put_root(root);</div><div class='ctx'> 	if (IS_ERR(inode))</div><div class='ctx'> 		return ERR_CAST(inode);</div><div class='ctx'> </div><div class='del'>-	if (check_generation &amp;&amp; generation != inode-&gt;i_generation) {</div><div class='del'>-		iput(inode);</div><div class='add'>+	if (generation != 0 &amp;&amp; generation != inode-&gt;vfs_inode.i_generation) {</div><div class='add'>+		iput(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> 		return ERR_PTR(-ESTALE);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return d_obtain_alias(inode);</div><div class='add'>+	return d_obtain_alias(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct dentry *btrfs_fh_to_parent(struct super_block *sb, struct fid *fh,</div><div class='hunk'>@@ -106,7 +124,7 @@ static struct dentry *btrfs_fh_to_parent(struct super_block *sb, struct fid *fh,</div><div class='ctx'> 	objectid = fid-&gt;parent_objectid;</div><div class='ctx'> 	generation = fid-&gt;parent_gen;</div><div class='ctx'> </div><div class='del'>-	return btrfs_get_dentry(sb, objectid, root_objectid, generation, 1);</div><div class='add'>+	return btrfs_get_dentry(sb, objectid, root_objectid, generation);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct dentry *btrfs_fh_to_dentry(struct super_block *sb, struct fid *fh,</div><div class='hunk'>@@ -128,14 +146,15 @@ static struct dentry *btrfs_fh_to_dentry(struct super_block *sb, struct fid *fh,</div><div class='ctx'> 	root_objectid = fid-&gt;root_objectid;</div><div class='ctx'> 	generation = fid-&gt;gen;</div><div class='ctx'> </div><div class='del'>-	return btrfs_get_dentry(sb, objectid, root_objectid, generation, 1);</div><div class='add'>+	return btrfs_get_dentry(sb, objectid, root_objectid, generation);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct dentry *btrfs_get_parent(struct dentry *child)</div><div class='ctx'> {</div><div class='del'>-	struct inode *dir = d_inode(child);</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(dir-&gt;i_sb);</div><div class='del'>-	struct btrfs_root *root = BTRFS_I(dir)-&gt;root;</div><div class='add'>+	struct btrfs_inode *dir = BTRFS_I(d_inode(child));</div><div class='add'>+	struct btrfs_inode *inode;</div><div class='add'>+	struct btrfs_root *root = dir-&gt;root;</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_path *path;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_root_ref *ref;</div><div class='hunk'>@@ -147,13 +166,13 @@ struct dentry *btrfs_get_parent(struct dentry *child)</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='del'>-	if (btrfs_ino(BTRFS_I(dir)) == BTRFS_FIRST_FREE_OBJECTID) {</div><div class='del'>-		key.objectid = root-&gt;root_key.objectid;</div><div class='add'>+	if (btrfs_ino(dir) == BTRFS_FIRST_FREE_OBJECTID) {</div><div class='add'>+		key.objectid = btrfs_root_id(root);</div><div class='ctx'> 		key.type = BTRFS_ROOT_BACKREF_KEY;</div><div class='ctx'> 		key.offset = (u64)-1;</div><div class='ctx'> 		root = fs_info-&gt;tree_root;</div><div class='ctx'> 	} else {</div><div class='del'>-		key.objectid = btrfs_ino(BTRFS_I(dir));</div><div class='add'>+		key.objectid = btrfs_ino(dir);</div><div class='ctx'> 		key.type = BTRFS_INODE_REF_KEY;</div><div class='ctx'> 		key.offset = (u64)-1;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -161,8 +180,15 @@ struct dentry *btrfs_get_parent(struct dentry *child)</div><div class='ctx'> 	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto fail;</div><div class='add'>+	if (unlikely(ret == 0)) {</div><div class='add'>+		/*</div><div class='add'>+		 * Key with offset of -1 found, there would have to exist an</div><div class='add'>+		 * inode with such number or a root with such id.</div><div class='add'>+		 */</div><div class='add'>+		ret = -EUCLEAN;</div><div class='add'>+		goto fail;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	BUG_ON(ret == 0); /* Key with offset of -1 found */</div><div class='ctx'> 	if (path-&gt;slots[0] == 0) {</div><div class='ctx'> 		ret = -ENOENT;</div><div class='ctx'> 		goto fail;</div><div class='hunk'>@@ -188,10 +214,14 @@ struct dentry *btrfs_get_parent(struct dentry *child)</div><div class='ctx'> </div><div class='ctx'> 	if (found_key.type == BTRFS_ROOT_BACKREF_KEY) {</div><div class='ctx'> 		return btrfs_get_dentry(fs_info-&gt;sb, key.objectid,</div><div class='del'>-					found_key.offset, 0, 0);</div><div class='add'>+					found_key.offset, 0);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return d_obtain_alias(btrfs_iget(fs_info-&gt;sb, key.objectid, root));</div><div class='add'>+	inode = btrfs_iget(key.objectid, root);</div><div class='add'>+	if (IS_ERR(inode))</div><div class='add'>+		return ERR_CAST(inode);</div><div class='add'>+</div><div class='add'>+	return d_obtain_alias(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> fail:</div><div class='ctx'> 	btrfs_free_path(path);</div><div class='ctx'> 	return ERR_PTR(ret);</div><div class='hunk'>@@ -200,11 +230,11 @@ fail:</div><div class='ctx'> static int btrfs_get_name(struct dentry *parent, char *name,</div><div class='ctx'> 			  struct dentry *child)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = d_inode(child);</div><div class='del'>-	struct inode *dir = d_inode(parent);</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	struct btrfs_path *path;</div><div class='del'>-	struct btrfs_root *root = BTRFS_I(dir)-&gt;root;</div><div class='add'>+	struct btrfs_inode *inode = BTRFS_I(d_inode(child));</div><div class='add'>+	struct btrfs_inode *dir = BTRFS_I(d_inode(parent));</div><div class='add'>+	struct btrfs_root *root = dir-&gt;root;</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_inode_ref *iref;</div><div class='ctx'> 	struct btrfs_root_ref *rref;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='hunk'>@@ -214,37 +244,34 @@ static int btrfs_get_name(struct dentry *parent, char *name,</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	u64 ino;</div><div class='ctx'> </div><div class='del'>-	if (!S_ISDIR(dir-&gt;i_mode))</div><div class='add'>+	if (!S_ISDIR(dir-&gt;vfs_inode.i_mode))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	ino = btrfs_ino(BTRFS_I(inode));</div><div class='add'>+	ino = btrfs_ino(inode);</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	if (ino == BTRFS_FIRST_FREE_OBJECTID) {</div><div class='del'>-		key.objectid = BTRFS_I(inode)-&gt;root-&gt;root_key.objectid;</div><div class='add'>+		key.objectid = btrfs_root_id(inode-&gt;root);</div><div class='ctx'> 		key.type = BTRFS_ROOT_BACKREF_KEY;</div><div class='ctx'> 		key.offset = (u64)-1;</div><div class='ctx'> 		root = fs_info-&gt;tree_root;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		key.objectid = ino;</div><div class='del'>-		key.offset = btrfs_ino(BTRFS_I(dir));</div><div class='ctx'> 		key.type = BTRFS_INODE_REF_KEY;</div><div class='add'>+		key.offset = btrfs_ino(dir);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='del'>-		btrfs_free_path(path);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	} else if (ret &gt; 0) {</div><div class='del'>-		if (ino == BTRFS_FIRST_FREE_OBJECTID) {</div><div class='add'>+		if (ino == BTRFS_FIRST_FREE_OBJECTID)</div><div class='ctx'> 			path-&gt;slots[0]--;</div><div class='del'>-		} else {</div><div class='del'>-			btrfs_free_path(path);</div><div class='add'>+		else</div><div class='ctx'> 			return -ENOENT;</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> </div><div class='hunk'>@@ -261,7 +288,6 @@ static int btrfs_get_name(struct dentry *parent, char *name,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	read_extent_buffer(leaf, name, name_ptr, name_len);</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * have to add the null termination to make sure that reconnect_path</div><div class='head'>diff --git a/fs/btrfs/export.h b/fs/btrfs/export.h<br/>index f32f4113c976..464582273af9 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/export.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/export.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/export.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/export.h</a></div><div class='hunk'>@@ -4,6 +4,10 @@</div><div class='ctx'> #define BTRFS_EXPORT_H</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/exportfs.h&gt;</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+</div><div class='add'>+struct dentry;</div><div class='add'>+struct super_block;</div><div class='ctx'> </div><div class='ctx'> extern const struct export_operations btrfs_export_ops;</div><div class='ctx'> </div><div class='hunk'>@@ -19,8 +23,7 @@ struct btrfs_fid {</div><div class='ctx'> } __attribute__ ((packed));</div><div class='ctx'> </div><div class='ctx'> struct dentry *btrfs_get_dentry(struct super_block *sb, u64 objectid,</div><div class='del'>-				u64 root_objectid, u32 generation,</div><div class='del'>-				int check_generation);</div><div class='add'>+				u64 root_objectid, u64 generation);</div><div class='ctx'> struct dentry *btrfs_get_parent(struct dentry *child);</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/btrfs/extent-io-tree.c b/fs/btrfs/extent-io-tree.c<br/>new file mode 100644<br/>index 000000000000..bb2ca1c9c7b0<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/extent-io-tree.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/extent-io-tree.c</a></div><div class='hunk'>@@ -0,0 +1,1959 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+</div><div class='add'>+#include &lt;linux/slab.h&gt;</div><div class='add'>+#include &lt;trace/events/btrfs.h&gt;</div><div class='add'>+#include "messages.h"</div><div class='add'>+#include "ctree.h"</div><div class='add'>+#include "extent_io.h"</div><div class='add'>+#include "extent-io-tree.h"</div><div class='add'>+#include "btrfs_inode.h"</div><div class='add'>+</div><div class='add'>+static struct kmem_cache *extent_state_cache;</div><div class='add'>+</div><div class='add'>+static inline bool extent_state_in_tree(const struct extent_state *state)</div><div class='add'>+{</div><div class='add'>+	return !RB_EMPTY_NODE(&amp;state-&gt;rb_node);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BTRFS_DEBUG</div><div class='add'>+static LIST_HEAD(states);</div><div class='add'>+static DEFINE_SPINLOCK(leak_lock);</div><div class='add'>+</div><div class='add'>+static inline void btrfs_leak_debug_add_state(struct extent_state *state)</div><div class='add'>+{</div><div class='add'>+	unsigned long flags;</div><div class='add'>+</div><div class='add'>+	spin_lock_irqsave(&amp;leak_lock, flags);</div><div class='add'>+	list_add(&amp;state-&gt;leak_list, &amp;states);</div><div class='add'>+	spin_unlock_irqrestore(&amp;leak_lock, flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_leak_debug_del_state(struct extent_state *state)</div><div class='add'>+{</div><div class='add'>+	unsigned long flags;</div><div class='add'>+</div><div class='add'>+	spin_lock_irqsave(&amp;leak_lock, flags);</div><div class='add'>+	list_del(&amp;state-&gt;leak_list);</div><div class='add'>+	spin_unlock_irqrestore(&amp;leak_lock, flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_extent_state_leak_debug_check(void)</div><div class='add'>+{</div><div class='add'>+	struct extent_state *state;</div><div class='add'>+</div><div class='add'>+	while (!list_empty(&amp;states)) {</div><div class='add'>+		state = list_first_entry(&amp;states, struct extent_state, leak_list);</div><div class='add'>+		btrfs_err(NULL,</div><div class='add'>+		       "state leak: start %llu end %llu state %u in tree %d refs %d",</div><div class='add'>+		       state-&gt;start, state-&gt;end, state-&gt;state,</div><div class='add'>+		       extent_state_in_tree(state),</div><div class='add'>+		       refcount_read(&amp;state-&gt;refs));</div><div class='add'>+		list_del(&amp;state-&gt;leak_list);</div><div class='add'>+		WARN_ON_ONCE(1);</div><div class='add'>+		kmem_cache_free(extent_state_cache, state);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define btrfs_debug_check_extent_io_range(tree, start, end)		\</div><div class='add'>+	__btrfs_debug_check_extent_io_range(__func__, (tree), (start), (end))</div><div class='add'>+static inline void __btrfs_debug_check_extent_io_range(const char *caller,</div><div class='add'>+						       struct extent_io_tree *tree,</div><div class='add'>+						       u64 start, u64 end)</div><div class='add'>+{</div><div class='add'>+	const struct btrfs_inode *inode = tree-&gt;inode;</div><div class='add'>+	u64 isize;</div><div class='add'>+</div><div class='add'>+	if (tree-&gt;owner != IO_TREE_INODE_IO)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	isize = i_size_read(&amp;inode-&gt;vfs_inode);</div><div class='add'>+	if (end &gt;= PAGE_SIZE &amp;&amp; (end % 2) == 0 &amp;&amp; end != isize - 1) {</div><div class='add'>+		btrfs_debug_rl(inode-&gt;root-&gt;fs_info,</div><div class='add'>+		    "%s: ino %llu isize %llu odd range [%llu,%llu]",</div><div class='add'>+			caller, btrfs_ino(inode), isize, start, end);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+#define btrfs_leak_debug_add_state(state)		do {} while (0)</div><div class='add'>+#define btrfs_leak_debug_del_state(state)		do {} while (0)</div><div class='add'>+#define btrfs_extent_state_leak_debug_check()		do {} while (0)</div><div class='add'>+#define btrfs_debug_check_extent_io_range(c, s, e)	do {} while (0)</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+/* Read-only access to the inode. */</div><div class='add'>+const struct btrfs_inode *btrfs_extent_io_tree_to_inode(const struct extent_io_tree *tree)</div><div class='add'>+{</div><div class='add'>+	if (tree-&gt;owner == IO_TREE_INODE_IO)</div><div class='add'>+		return tree-&gt;inode;</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* For read-only access to fs_info. */</div><div class='add'>+const struct btrfs_fs_info *btrfs_extent_io_tree_to_fs_info(const struct extent_io_tree *tree)</div><div class='add'>+{</div><div class='add'>+	if (tree-&gt;owner == IO_TREE_INODE_IO)</div><div class='add'>+		return tree-&gt;inode-&gt;root-&gt;fs_info;</div><div class='add'>+	return tree-&gt;fs_info;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_extent_io_tree_init(struct btrfs_fs_info *fs_info,</div><div class='add'>+			       struct extent_io_tree *tree, unsigned int owner)</div><div class='add'>+{</div><div class='add'>+	tree-&gt;state = RB_ROOT;</div><div class='add'>+	spin_lock_init(&amp;tree-&gt;lock);</div><div class='add'>+	tree-&gt;fs_info = fs_info;</div><div class='add'>+	tree-&gt;owner = owner;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Empty an io tree, removing and freeing every extent state record from the</div><div class='add'>+ * tree. This should be called once we are sure no other task can access the</div><div class='add'>+ * tree anymore, so no tree updates happen after we empty the tree and there</div><div class='add'>+ * aren't any waiters on any extent state record (EXTENT_LOCK_BITS are never</div><div class='add'>+ * set on any extent state when calling this function).</div><div class='add'>+ */</div><div class='add'>+void btrfs_extent_io_tree_release(struct extent_io_tree *tree)</div><div class='add'>+{</div><div class='add'>+	struct rb_root root;</div><div class='add'>+	struct extent_state *state;</div><div class='add'>+	struct extent_state *tmp;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;tree-&gt;lock);</div><div class='add'>+	root = tree-&gt;state;</div><div class='add'>+	tree-&gt;state = RB_ROOT;</div><div class='add'>+	rbtree_postorder_for_each_entry_safe(state, tmp, &amp;root, rb_node) {</div><div class='add'>+		/* Clear node to keep free_extent_state() happy. */</div><div class='add'>+		RB_CLEAR_NODE(&amp;state-&gt;rb_node);</div><div class='add'>+		ASSERT(!(state-&gt;state &amp; EXTENT_LOCK_BITS));</div><div class='add'>+		/*</div><div class='add'>+		 * No need for a memory barrier here, as we are holding the tree</div><div class='add'>+		 * lock and we only change the waitqueue while holding that lock</div><div class='add'>+		 * (see wait_extent_bit()).</div><div class='add'>+		 */</div><div class='add'>+		ASSERT(!waitqueue_active(&amp;state-&gt;wq));</div><div class='add'>+		btrfs_free_extent_state(state);</div><div class='add'>+		cond_resched_lock(&amp;tree-&gt;lock);</div><div class='add'>+	}</div><div class='add'>+	/*</div><div class='add'>+	 * Should still be empty even after a reschedule, no other task should</div><div class='add'>+	 * be accessing the tree anymore.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(RB_EMPTY_ROOT(&amp;tree-&gt;state));</div><div class='add'>+	spin_unlock(&amp;tree-&gt;lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct extent_state *alloc_extent_state(gfp_t mask)</div><div class='add'>+{</div><div class='add'>+	struct extent_state *state;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The given mask might be not appropriate for the slab allocator,</div><div class='add'>+	 * drop the unsupported bits</div><div class='add'>+	 */</div><div class='add'>+	mask &amp;= ~(__GFP_DMA32|__GFP_HIGHMEM);</div><div class='add'>+	state = kmem_cache_alloc(extent_state_cache, mask);</div><div class='add'>+	if (!state)</div><div class='add'>+		return state;</div><div class='add'>+	state-&gt;state = 0;</div><div class='add'>+	RB_CLEAR_NODE(&amp;state-&gt;rb_node);</div><div class='add'>+	btrfs_leak_debug_add_state(state);</div><div class='add'>+	refcount_set(&amp;state-&gt;refs, 1);</div><div class='add'>+	init_waitqueue_head(&amp;state-&gt;wq);</div><div class='add'>+	trace_btrfs_alloc_extent_state(state, mask, _RET_IP_);</div><div class='add'>+	return state;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct extent_state *alloc_extent_state_atomic(struct extent_state *prealloc)</div><div class='add'>+{</div><div class='add'>+	if (!prealloc)</div><div class='add'>+		prealloc = alloc_extent_state(GFP_ATOMIC);</div><div class='add'>+</div><div class='add'>+	return prealloc;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_free_extent_state(struct extent_state *state)</div><div class='add'>+{</div><div class='add'>+	if (!state)</div><div class='add'>+		return;</div><div class='add'>+	if (refcount_dec_and_test(&amp;state-&gt;refs)) {</div><div class='add'>+		WARN_ON(extent_state_in_tree(state));</div><div class='add'>+		btrfs_leak_debug_del_state(state);</div><div class='add'>+		trace_btrfs_free_extent_state(state, _RET_IP_);</div><div class='add'>+		kmem_cache_free(extent_state_cache, state);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int add_extent_changeset(struct extent_state *state, u32 bits,</div><div class='add'>+				 struct extent_changeset *changeset,</div><div class='add'>+				 int set)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (!changeset)</div><div class='add'>+		return 0;</div><div class='add'>+	if (set &amp;&amp; (state-&gt;state &amp; bits) == bits)</div><div class='add'>+		return 0;</div><div class='add'>+	if (!set &amp;&amp; (state-&gt;state &amp; bits) == 0)</div><div class='add'>+		return 0;</div><div class='add'>+	changeset-&gt;bytes_changed += state-&gt;end - state-&gt;start + 1;</div><div class='add'>+	ret = ulist_add(&amp;changeset-&gt;range_changed, state-&gt;start, state-&gt;end,</div><div class='add'>+			GFP_ATOMIC);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline struct extent_state *next_state(struct extent_state *state)</div><div class='add'>+{</div><div class='add'>+	struct rb_node *next = rb_next(&amp;state-&gt;rb_node);</div><div class='add'>+</div><div class='add'>+	return rb_entry_safe(next, struct extent_state, rb_node);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline struct extent_state *prev_state(struct extent_state *state)</div><div class='add'>+{</div><div class='add'>+	struct rb_node *next = rb_prev(&amp;state-&gt;rb_node);</div><div class='add'>+</div><div class='add'>+	return rb_entry_safe(next, struct extent_state, rb_node);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Search @tree for an entry that contains @offset or if none exists for the</div><div class='add'>+ * first entry that starts and ends after that offset.</div><div class='add'>+ *</div><div class='add'>+ * @tree:       the tree to search</div><div class='add'>+ * @offset:     search offset</div><div class='add'>+ * @node_ret:   pointer where new node should be anchored (used when inserting an</div><div class='add'>+ *	        entry in the tree)</div><div class='add'>+ * @parent_ret: points to entry which would have been the parent of the entry,</div><div class='add'>+ *               containing @offset</div><div class='add'>+ *</div><div class='add'>+ * Return a pointer to the entry that contains @offset byte address.</div><div class='add'>+ *</div><div class='add'>+ * If no such entry exists, return the first entry that starts and ends after</div><div class='add'>+ * @offset if one exists, otherwise NULL.</div><div class='add'>+ *</div><div class='add'>+ * If the returned entry starts at @offset, then @node_ret and @parent_ret</div><div class='add'>+ * aren't changed.</div><div class='add'>+ */</div><div class='add'>+static inline struct extent_state *tree_search_for_insert(struct extent_io_tree *tree,</div><div class='add'>+							  u64 offset,</div><div class='add'>+							  struct rb_node ***node_ret,</div><div class='add'>+							  struct rb_node **parent_ret)</div><div class='add'>+{</div><div class='add'>+	struct rb_root *root = &amp;tree-&gt;state;</div><div class='add'>+	struct rb_node **node = &amp;root-&gt;rb_node;</div><div class='add'>+	struct rb_node *prev = NULL;</div><div class='add'>+	struct extent_state *entry = NULL;</div><div class='add'>+</div><div class='add'>+	while (*node) {</div><div class='add'>+		prev = *node;</div><div class='add'>+		entry = rb_entry(prev, struct extent_state, rb_node);</div><div class='add'>+</div><div class='add'>+		if (offset &lt; entry-&gt;start)</div><div class='add'>+			node = &amp;(*node)-&gt;rb_left;</div><div class='add'>+		else if (offset &gt; entry-&gt;end)</div><div class='add'>+			node = &amp;(*node)-&gt;rb_right;</div><div class='add'>+		else</div><div class='add'>+			return entry;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (node_ret)</div><div class='add'>+		*node_ret = node;</div><div class='add'>+	if (parent_ret)</div><div class='add'>+		*parent_ret = prev;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Return either the current entry if it contains offset (it ends after</div><div class='add'>+	 * or at offset) or the first entry that starts and ends after offset if</div><div class='add'>+	 * one exists, or NULL.</div><div class='add'>+	 */</div><div class='add'>+	while (entry &amp;&amp; offset &gt; entry-&gt;end)</div><div class='add'>+		entry = next_state(entry);</div><div class='add'>+</div><div class='add'>+	return entry;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Search offset in the tree or fill neighbor rbtree node pointers.</div><div class='add'>+ *</div><div class='add'>+ * @tree:      the tree to search</div><div class='add'>+ * @offset:    offset that should fall within an entry in @tree</div><div class='add'>+ * @next_ret:  pointer to the first entry whose range ends after @offset</div><div class='add'>+ * @prev_ret:  pointer to the first entry whose range begins before @offset</div><div class='add'>+ *</div><div class='add'>+ * Return a pointer to the entry that contains @offset byte address. If no</div><div class='add'>+ * such entry exists, then return NULL and fill @prev_ret and @next_ret.</div><div class='add'>+ * Otherwise return the found entry and other pointers are left untouched.</div><div class='add'>+ */</div><div class='add'>+static struct extent_state *tree_search_prev_next(struct extent_io_tree *tree,</div><div class='add'>+						  u64 offset,</div><div class='add'>+						  struct extent_state **prev_ret,</div><div class='add'>+						  struct extent_state **next_ret)</div><div class='add'>+{</div><div class='add'>+	struct rb_root *root = &amp;tree-&gt;state;</div><div class='add'>+	struct rb_node **node = &amp;root-&gt;rb_node;</div><div class='add'>+	struct extent_state *orig_prev;</div><div class='add'>+	struct extent_state *entry = NULL;</div><div class='add'>+</div><div class='add'>+	ASSERT(prev_ret);</div><div class='add'>+	ASSERT(next_ret);</div><div class='add'>+</div><div class='add'>+	while (*node) {</div><div class='add'>+		entry = rb_entry(*node, struct extent_state, rb_node);</div><div class='add'>+</div><div class='add'>+		if (offset &lt; entry-&gt;start)</div><div class='add'>+			node = &amp;(*node)-&gt;rb_left;</div><div class='add'>+		else if (offset &gt; entry-&gt;end)</div><div class='add'>+			node = &amp;(*node)-&gt;rb_right;</div><div class='add'>+		else</div><div class='add'>+			return entry;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	orig_prev = entry;</div><div class='add'>+	while (entry &amp;&amp; offset &gt; entry-&gt;end)</div><div class='add'>+		entry = next_state(entry);</div><div class='add'>+	*next_ret = entry;</div><div class='add'>+	entry = orig_prev;</div><div class='add'>+</div><div class='add'>+	while (entry &amp;&amp; offset &lt; entry-&gt;start)</div><div class='add'>+		entry = prev_state(entry);</div><div class='add'>+	*prev_ret = entry;</div><div class='add'>+</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Inexact rb-tree search, return the next entry if @offset is not found</div><div class='add'>+ */</div><div class='add'>+static inline struct extent_state *tree_search(struct extent_io_tree *tree, u64 offset)</div><div class='add'>+{</div><div class='add'>+	return tree_search_for_insert(tree, offset, NULL, NULL);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void __cold extent_io_tree_panic(const struct extent_io_tree *tree,</div><div class='add'>+					const struct extent_state *state,</div><div class='add'>+					const char *opname,</div><div class='add'>+					int err)</div><div class='add'>+{</div><div class='add'>+	btrfs_panic(btrfs_extent_io_tree_to_fs_info(tree), err,</div><div class='add'>+		    "extent io tree error on %s state start %llu end %llu",</div><div class='add'>+		    opname, state-&gt;start, state-&gt;end);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void merge_prev_state(struct extent_io_tree *tree, struct extent_state *state)</div><div class='add'>+{</div><div class='add'>+	struct extent_state *prev;</div><div class='add'>+</div><div class='add'>+	prev = prev_state(state);</div><div class='add'>+	if (prev &amp;&amp; prev-&gt;end == state-&gt;start - 1 &amp;&amp; prev-&gt;state == state-&gt;state) {</div><div class='add'>+		if (tree-&gt;owner == IO_TREE_INODE_IO)</div><div class='add'>+			btrfs_merge_delalloc_extent(tree-&gt;inode, state, prev);</div><div class='add'>+		state-&gt;start = prev-&gt;start;</div><div class='add'>+		rb_erase(&amp;prev-&gt;rb_node, &amp;tree-&gt;state);</div><div class='add'>+		RB_CLEAR_NODE(&amp;prev-&gt;rb_node);</div><div class='add'>+		btrfs_free_extent_state(prev);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void merge_next_state(struct extent_io_tree *tree, struct extent_state *state)</div><div class='add'>+{</div><div class='add'>+	struct extent_state *next;</div><div class='add'>+</div><div class='add'>+	next = next_state(state);</div><div class='add'>+	if (next &amp;&amp; next-&gt;start == state-&gt;end + 1 &amp;&amp; next-&gt;state == state-&gt;state) {</div><div class='add'>+		if (tree-&gt;owner == IO_TREE_INODE_IO)</div><div class='add'>+			btrfs_merge_delalloc_extent(tree-&gt;inode, state, next);</div><div class='add'>+		state-&gt;end = next-&gt;end;</div><div class='add'>+		rb_erase(&amp;next-&gt;rb_node, &amp;tree-&gt;state);</div><div class='add'>+		RB_CLEAR_NODE(&amp;next-&gt;rb_node);</div><div class='add'>+		btrfs_free_extent_state(next);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Utility function to look for merge candidates inside a given range.  Any</div><div class='add'>+ * extents with matching state are merged together into a single extent in the</div><div class='add'>+ * tree.  Extents with EXTENT_IO in their state field are not merged because</div><div class='add'>+ * the end_io handlers need to be able to do operations on them without</div><div class='add'>+ * sleeping (or doing allocations/splits).</div><div class='add'>+ *</div><div class='add'>+ * This should be called with the tree lock held.</div><div class='add'>+ */</div><div class='add'>+static void merge_state(struct extent_io_tree *tree, struct extent_state *state)</div><div class='add'>+{</div><div class='add'>+	if (state-&gt;state &amp; (EXTENT_LOCK_BITS | EXTENT_BOUNDARY))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	merge_prev_state(tree, state);</div><div class='add'>+	merge_next_state(tree, state);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void set_state_bits(struct extent_io_tree *tree,</div><div class='add'>+			   struct extent_state *state,</div><div class='add'>+			   u32 bits, struct extent_changeset *changeset)</div><div class='add'>+{</div><div class='add'>+	u32 bits_to_set = bits &amp; ~EXTENT_CTLBITS;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (tree-&gt;owner == IO_TREE_INODE_IO)</div><div class='add'>+		btrfs_set_delalloc_extent(tree-&gt;inode, state, bits);</div><div class='add'>+</div><div class='add'>+	ret = add_extent_changeset(state, bits_to_set, changeset, 1);</div><div class='add'>+	BUG_ON(ret &lt; 0);</div><div class='add'>+	state-&gt;state |= bits_to_set;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Insert an extent_state struct into the tree.  'bits' are set on the</div><div class='add'>+ * struct before it is inserted.</div><div class='add'>+ *</div><div class='add'>+ * Returns a pointer to the struct extent_state record containing the range</div><div class='add'>+ * requested for insertion, which may be the same as the given struct or it</div><div class='add'>+ * may be an existing record in the tree that was expanded to accommodate the</div><div class='add'>+ * requested range. In case of an extent_state different from the one that was</div><div class='add'>+ * given, the later can be freed or reused by the caller.</div><div class='add'>+ *</div><div class='add'>+ * On error it returns an error pointer.</div><div class='add'>+ *</div><div class='add'>+ * The tree lock is not taken internally.  This is a utility function and</div><div class='add'>+ * probably isn't what you want to call (see set/clear_extent_bit).</div><div class='add'>+ */</div><div class='add'>+static struct extent_state *insert_state(struct extent_io_tree *tree,</div><div class='add'>+					 struct extent_state *state,</div><div class='add'>+					 u32 bits,</div><div class='add'>+					 struct extent_changeset *changeset)</div><div class='add'>+{</div><div class='add'>+	struct rb_node **node;</div><div class='add'>+	struct rb_node *parent = NULL;</div><div class='add'>+	const u64 start = state-&gt;start - 1;</div><div class='add'>+	const u64 end = state-&gt;end + 1;</div><div class='add'>+	const bool try_merge = !(bits &amp; (EXTENT_LOCK_BITS | EXTENT_BOUNDARY));</div><div class='add'>+</div><div class='add'>+	set_state_bits(tree, state, bits, changeset);</div><div class='add'>+</div><div class='add'>+	node = &amp;tree-&gt;state.rb_node;</div><div class='add'>+	while (*node) {</div><div class='add'>+		struct extent_state *entry;</div><div class='add'>+</div><div class='add'>+		parent = *node;</div><div class='add'>+		entry = rb_entry(parent, struct extent_state, rb_node);</div><div class='add'>+</div><div class='add'>+		if (state-&gt;end &lt; entry-&gt;start) {</div><div class='add'>+			if (try_merge &amp;&amp; end == entry-&gt;start &amp;&amp;</div><div class='add'>+			    state-&gt;state == entry-&gt;state) {</div><div class='add'>+				if (tree-&gt;owner == IO_TREE_INODE_IO)</div><div class='add'>+					btrfs_merge_delalloc_extent(tree-&gt;inode,</div><div class='add'>+								    state, entry);</div><div class='add'>+				entry-&gt;start = state-&gt;start;</div><div class='add'>+				merge_prev_state(tree, entry);</div><div class='add'>+				state-&gt;state = 0;</div><div class='add'>+				return entry;</div><div class='add'>+			}</div><div class='add'>+			node = &amp;(*node)-&gt;rb_left;</div><div class='add'>+		} else if (state-&gt;end &gt; entry-&gt;end) {</div><div class='add'>+			if (try_merge &amp;&amp; entry-&gt;end == start &amp;&amp;</div><div class='add'>+			    state-&gt;state == entry-&gt;state) {</div><div class='add'>+				if (tree-&gt;owner == IO_TREE_INODE_IO)</div><div class='add'>+					btrfs_merge_delalloc_extent(tree-&gt;inode,</div><div class='add'>+								    state, entry);</div><div class='add'>+				entry-&gt;end = state-&gt;end;</div><div class='add'>+				merge_next_state(tree, entry);</div><div class='add'>+				state-&gt;state = 0;</div><div class='add'>+				return entry;</div><div class='add'>+			}</div><div class='add'>+			node = &amp;(*node)-&gt;rb_right;</div><div class='add'>+		} else {</div><div class='add'>+			return ERR_PTR(-EEXIST);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	rb_link_node(&amp;state-&gt;rb_node, parent, node);</div><div class='add'>+	rb_insert_color(&amp;state-&gt;rb_node, &amp;tree-&gt;state);</div><div class='add'>+</div><div class='add'>+	return state;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Insert state to @tree to the location given by @node and @parent.</div><div class='add'>+ */</div><div class='add'>+static void insert_state_fast(struct extent_io_tree *tree,</div><div class='add'>+			      struct extent_state *state, struct rb_node **node,</div><div class='add'>+			      struct rb_node *parent, unsigned bits,</div><div class='add'>+			      struct extent_changeset *changeset)</div><div class='add'>+{</div><div class='add'>+	set_state_bits(tree, state, bits, changeset);</div><div class='add'>+	rb_link_node(&amp;state-&gt;rb_node, parent, node);</div><div class='add'>+	rb_insert_color(&amp;state-&gt;rb_node, &amp;tree-&gt;state);</div><div class='add'>+	merge_state(tree, state);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Split a given extent state struct in two, inserting the preallocated</div><div class='add'>+ * struct 'prealloc' as the newly created second half.  'split' indicates an</div><div class='add'>+ * offset inside 'orig' where it should be split.</div><div class='add'>+ *</div><div class='add'>+ * Before calling,</div><div class='add'>+ * the tree has 'orig' at [orig-&gt;start, orig-&gt;end].  After calling, there</div><div class='add'>+ * are two extent state structs in the tree:</div><div class='add'>+ * prealloc: [orig-&gt;start, split - 1]</div><div class='add'>+ * orig: [ split, orig-&gt;end ]</div><div class='add'>+ *</div><div class='add'>+ * The tree locks are not taken by this function. They need to be held</div><div class='add'>+ * by the caller.</div><div class='add'>+ */</div><div class='add'>+static int split_state(struct extent_io_tree *tree, struct extent_state *orig,</div><div class='add'>+		       struct extent_state *prealloc, u64 split)</div><div class='add'>+{</div><div class='add'>+	struct rb_node *parent = NULL;</div><div class='add'>+	struct rb_node **node;</div><div class='add'>+</div><div class='add'>+	if (tree-&gt;owner == IO_TREE_INODE_IO)</div><div class='add'>+		btrfs_split_delalloc_extent(tree-&gt;inode, orig, split);</div><div class='add'>+</div><div class='add'>+	prealloc-&gt;start = orig-&gt;start;</div><div class='add'>+	prealloc-&gt;end = split - 1;</div><div class='add'>+	prealloc-&gt;state = orig-&gt;state;</div><div class='add'>+	orig-&gt;start = split;</div><div class='add'>+</div><div class='add'>+	parent = &amp;orig-&gt;rb_node;</div><div class='add'>+	node = &amp;parent;</div><div class='add'>+	while (*node) {</div><div class='add'>+		struct extent_state *entry;</div><div class='add'>+</div><div class='add'>+		parent = *node;</div><div class='add'>+		entry = rb_entry(parent, struct extent_state, rb_node);</div><div class='add'>+</div><div class='add'>+		if (prealloc-&gt;end &lt; entry-&gt;start) {</div><div class='add'>+			node = &amp;(*node)-&gt;rb_left;</div><div class='add'>+		} else if (prealloc-&gt;end &gt; entry-&gt;end) {</div><div class='add'>+			node = &amp;(*node)-&gt;rb_right;</div><div class='add'>+		} else {</div><div class='add'>+			btrfs_free_extent_state(prealloc);</div><div class='add'>+			return -EEXIST;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	rb_link_node(&amp;prealloc-&gt;rb_node, parent, node);</div><div class='add'>+	rb_insert_color(&amp;prealloc-&gt;rb_node, &amp;tree-&gt;state);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Use this during tree iteration to avoid doing next node searches when it's</div><div class='add'>+ * not needed (the current record ends at or after the target range's end).</div><div class='add'>+ */</div><div class='add'>+static inline struct extent_state *next_search_state(struct extent_state *state, u64 end)</div><div class='add'>+{</div><div class='add'>+	if (state-&gt;end &lt; end)</div><div class='add'>+		return next_state(state);</div><div class='add'>+</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Utility function to clear some bits in an extent state struct.  It will</div><div class='add'>+ * optionally wake up anyone waiting on this state (wake == 1).</div><div class='add'>+ *</div><div class='add'>+ * If no bits are set on the state struct after clearing things, the</div><div class='add'>+ * struct is freed and removed from the tree</div><div class='add'>+ */</div><div class='add'>+static struct extent_state *clear_state_bit(struct extent_io_tree *tree,</div><div class='add'>+					    struct extent_state *state,</div><div class='add'>+					    u32 bits, int wake, u64 end,</div><div class='add'>+					    struct extent_changeset *changeset)</div><div class='add'>+{</div><div class='add'>+	struct extent_state *next;</div><div class='add'>+	u32 bits_to_clear = bits &amp; ~EXTENT_CTLBITS;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (tree-&gt;owner == IO_TREE_INODE_IO)</div><div class='add'>+		btrfs_clear_delalloc_extent(tree-&gt;inode, state, bits);</div><div class='add'>+</div><div class='add'>+	ret = add_extent_changeset(state, bits_to_clear, changeset, 0);</div><div class='add'>+	BUG_ON(ret &lt; 0);</div><div class='add'>+	state-&gt;state &amp;= ~bits_to_clear;</div><div class='add'>+	if (wake)</div><div class='add'>+		wake_up(&amp;state-&gt;wq);</div><div class='add'>+	if (state-&gt;state == 0) {</div><div class='add'>+		next = next_search_state(state, end);</div><div class='add'>+		if (extent_state_in_tree(state)) {</div><div class='add'>+			rb_erase(&amp;state-&gt;rb_node, &amp;tree-&gt;state);</div><div class='add'>+			RB_CLEAR_NODE(&amp;state-&gt;rb_node);</div><div class='add'>+			btrfs_free_extent_state(state);</div><div class='add'>+		} else {</div><div class='add'>+			WARN_ON(1);</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		merge_state(tree, state);</div><div class='add'>+		next = next_search_state(state, end);</div><div class='add'>+	}</div><div class='add'>+	return next;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Detect if extent bits request NOWAIT semantics and set the gfp mask accordingly,</div><div class='add'>+ * unset the EXTENT_NOWAIT bit.</div><div class='add'>+ */</div><div class='add'>+static void set_gfp_mask_from_bits(u32 *bits, gfp_t *mask)</div><div class='add'>+{</div><div class='add'>+	*mask = (*bits &amp; EXTENT_NOWAIT ? GFP_NOWAIT : GFP_NOFS);</div><div class='add'>+	*bits &amp;= EXTENT_NOWAIT - 1;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Clear some bits on a range in the tree.  This may require splitting or</div><div class='add'>+ * inserting elements in the tree, so the gfp mask is used to indicate which</div><div class='add'>+ * allocations or sleeping are allowed.</div><div class='add'>+ *</div><div class='add'>+ * The range [start, end] is inclusive.</div><div class='add'>+ *</div><div class='add'>+ * This takes the tree lock, and returns 0 on success and &lt; 0 on error.</div><div class='add'>+ */</div><div class='add'>+int btrfs_clear_extent_bit_changeset(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='add'>+				     u32 bits, struct extent_state **cached_state,</div><div class='add'>+				     struct extent_changeset *changeset)</div><div class='add'>+{</div><div class='add'>+	struct extent_state *state;</div><div class='add'>+	struct extent_state *cached;</div><div class='add'>+	struct extent_state *prealloc = NULL;</div><div class='add'>+	u64 last_end;</div><div class='add'>+	int ret = 0;</div><div class='add'>+	bool clear;</div><div class='add'>+	bool wake;</div><div class='add'>+	const bool delete = (bits &amp; EXTENT_CLEAR_ALL_BITS);</div><div class='add'>+	gfp_t mask;</div><div class='add'>+</div><div class='add'>+	set_gfp_mask_from_bits(&amp;bits, &amp;mask);</div><div class='add'>+	btrfs_debug_check_extent_io_range(tree, start, end);</div><div class='add'>+	trace_btrfs_clear_extent_bit(tree, start, end - start + 1, bits);</div><div class='add'>+</div><div class='add'>+	if (delete)</div><div class='add'>+		bits |= ~EXTENT_CTLBITS;</div><div class='add'>+</div><div class='add'>+	if (bits &amp; EXTENT_DELALLOC)</div><div class='add'>+		bits |= EXTENT_NORESERVE;</div><div class='add'>+</div><div class='add'>+	wake = (bits &amp; EXTENT_LOCK_BITS);</div><div class='add'>+	clear = (bits &amp; (EXTENT_LOCK_BITS | EXTENT_BOUNDARY));</div><div class='add'>+again:</div><div class='add'>+	if (!prealloc) {</div><div class='add'>+		/*</div><div class='add'>+		 * Don't care for allocation failure here because we might end</div><div class='add'>+		 * up not needing the pre-allocated extent state at all, which</div><div class='add'>+		 * is the case if we only have in the tree extent states that</div><div class='add'>+		 * cover our input range and don't cover too any other range.</div><div class='add'>+		 * If we end up needing a new extent state we allocate it later.</div><div class='add'>+		 */</div><div class='add'>+		prealloc = alloc_extent_state(mask);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;tree-&gt;lock);</div><div class='add'>+	if (cached_state) {</div><div class='add'>+		cached = *cached_state;</div><div class='add'>+</div><div class='add'>+		if (clear) {</div><div class='add'>+			*cached_state = NULL;</div><div class='add'>+			cached_state = NULL;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (cached &amp;&amp; extent_state_in_tree(cached) &amp;&amp;</div><div class='add'>+		    cached-&gt;start &lt;= start &amp;&amp; cached-&gt;end &gt; start) {</div><div class='add'>+			if (clear)</div><div class='add'>+				refcount_dec(&amp;cached-&gt;refs);</div><div class='add'>+			state = cached;</div><div class='add'>+			goto hit_next;</div><div class='add'>+		}</div><div class='add'>+		if (clear)</div><div class='add'>+			btrfs_free_extent_state(cached);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* This search will find the extents that end after our range starts. */</div><div class='add'>+	state = tree_search(tree, start);</div><div class='add'>+	if (!state)</div><div class='add'>+		goto out;</div><div class='add'>+hit_next:</div><div class='add'>+	if (state-&gt;start &gt; end)</div><div class='add'>+		goto out;</div><div class='add'>+	WARN_ON(state-&gt;end &lt; start);</div><div class='add'>+	last_end = state-&gt;end;</div><div class='add'>+</div><div class='add'>+	/* The state doesn't have the wanted bits, go ahead. */</div><div class='add'>+	if (!(state-&gt;state &amp; bits)) {</div><div class='add'>+		state = next_search_state(state, end);</div><div class='add'>+		goto next;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 *     | ---- desired range ---- |</div><div class='add'>+	 *  | state | or</div><div class='add'>+	 *  | ------------- state -------------- |</div><div class='add'>+	 *</div><div class='add'>+	 * We need to split the extent we found, and may flip bits on second</div><div class='add'>+	 * half.</div><div class='add'>+	 *</div><div class='add'>+	 * If the extent we found extends past our range, we just split and</div><div class='add'>+	 * search again.  It'll get split again the next time though.</div><div class='add'>+	 *</div><div class='add'>+	 * If the extent we found is inside our range, we clear the desired bit</div><div class='add'>+	 * on it.</div><div class='add'>+	 */</div><div class='add'>+</div><div class='add'>+	if (state-&gt;start &lt; start) {</div><div class='add'>+		prealloc = alloc_extent_state_atomic(prealloc);</div><div class='add'>+		if (!prealloc)</div><div class='add'>+			goto search_again;</div><div class='add'>+		ret = split_state(tree, state, prealloc, start);</div><div class='add'>+		prealloc = NULL;</div><div class='add'>+		if (ret) {</div><div class='add'>+			extent_io_tree_panic(tree, state, "split", ret);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		if (state-&gt;end &lt;= end) {</div><div class='add'>+			state = clear_state_bit(tree, state, bits, wake, end,</div><div class='add'>+						changeset);</div><div class='add'>+			goto next;</div><div class='add'>+		}</div><div class='add'>+		if (need_resched())</div><div class='add'>+			goto search_again;</div><div class='add'>+		/*</div><div class='add'>+		 * Fallthrough and try atomic extent state allocation if needed.</div><div class='add'>+		 * If it fails we'll jump to 'search_again' retry the allocation</div><div class='add'>+		 * in non-atomic mode and start the search again.</div><div class='add'>+		 */</div><div class='add'>+	}</div><div class='add'>+	/*</div><div class='add'>+	 * | ---- desired range ---- |</div><div class='add'>+	 *                        | state |</div><div class='add'>+	 * We need to split the extent, and clear the bit on the first half.</div><div class='add'>+	 */</div><div class='add'>+	if (state-&gt;start &lt;= end &amp;&amp; state-&gt;end &gt; end) {</div><div class='add'>+		prealloc = alloc_extent_state_atomic(prealloc);</div><div class='add'>+		if (!prealloc)</div><div class='add'>+			goto search_again;</div><div class='add'>+		ret = split_state(tree, state, prealloc, end + 1);</div><div class='add'>+		if (ret) {</div><div class='add'>+			extent_io_tree_panic(tree, state, "split", ret);</div><div class='add'>+			prealloc = NULL;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (wake)</div><div class='add'>+			wake_up(&amp;state-&gt;wq);</div><div class='add'>+</div><div class='add'>+		clear_state_bit(tree, prealloc, bits, wake, end, changeset);</div><div class='add'>+</div><div class='add'>+		prealloc = NULL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	state = clear_state_bit(tree, state, bits, wake, end, changeset);</div><div class='add'>+next:</div><div class='add'>+	if (last_end &gt;= end)</div><div class='add'>+		goto out;</div><div class='add'>+	start = last_end + 1;</div><div class='add'>+	if (state &amp;&amp; !need_resched())</div><div class='add'>+		goto hit_next;</div><div class='add'>+</div><div class='add'>+search_again:</div><div class='add'>+	spin_unlock(&amp;tree-&gt;lock);</div><div class='add'>+	if (gfpflags_allow_blocking(mask))</div><div class='add'>+		cond_resched();</div><div class='add'>+	goto again;</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	spin_unlock(&amp;tree-&gt;lock);</div><div class='add'>+	btrfs_free_extent_state(prealloc);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Wait for one or more bits to clear on a range in the state tree.</div><div class='add'>+ * The range [start, end] is inclusive.</div><div class='add'>+ * The tree lock is taken by this function</div><div class='add'>+ */</div><div class='add'>+static void wait_extent_bit(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='add'>+			    u32 bits, struct extent_state **cached_state)</div><div class='add'>+{</div><div class='add'>+	struct extent_state *state;</div><div class='add'>+</div><div class='add'>+	btrfs_debug_check_extent_io_range(tree, start, end);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;tree-&gt;lock);</div><div class='add'>+again:</div><div class='add'>+	/*</div><div class='add'>+	 * Maintain cached_state, as we may not remove it from the tree if there</div><div class='add'>+	 * are more bits than the bits we're waiting on set on this state.</div><div class='add'>+	 */</div><div class='add'>+	if (cached_state &amp;&amp; *cached_state) {</div><div class='add'>+		state = *cached_state;</div><div class='add'>+		if (extent_state_in_tree(state) &amp;&amp;</div><div class='add'>+		    state-&gt;start &lt;= start &amp;&amp; start &lt; state-&gt;end)</div><div class='add'>+			goto process_node;</div><div class='add'>+	}</div><div class='add'>+	while (1) {</div><div class='add'>+		/*</div><div class='add'>+		 * This search will find all the extents that end after our</div><div class='add'>+		 * range starts.</div><div class='add'>+		 */</div><div class='add'>+		state = tree_search(tree, start);</div><div class='add'>+process_node:</div><div class='add'>+		if (!state)</div><div class='add'>+			break;</div><div class='add'>+		if (state-&gt;start &gt; end)</div><div class='add'>+			goto out;</div><div class='add'>+</div><div class='add'>+		if (state-&gt;state &amp; bits) {</div><div class='add'>+			DEFINE_WAIT(wait);</div><div class='add'>+</div><div class='add'>+			start = state-&gt;start;</div><div class='add'>+			refcount_inc(&amp;state-&gt;refs);</div><div class='add'>+			prepare_to_wait(&amp;state-&gt;wq, &amp;wait, TASK_UNINTERRUPTIBLE);</div><div class='add'>+			spin_unlock(&amp;tree-&gt;lock);</div><div class='add'>+			schedule();</div><div class='add'>+			spin_lock(&amp;tree-&gt;lock);</div><div class='add'>+			finish_wait(&amp;state-&gt;wq, &amp;wait);</div><div class='add'>+			btrfs_free_extent_state(state);</div><div class='add'>+			goto again;</div><div class='add'>+		}</div><div class='add'>+		start = state-&gt;end + 1;</div><div class='add'>+</div><div class='add'>+		if (start &gt; end)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		if (!cond_resched_lock(&amp;tree-&gt;lock)) {</div><div class='add'>+			state = next_state(state);</div><div class='add'>+			goto process_node;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='add'>+	/* This state is no longer useful, clear it and free it up. */</div><div class='add'>+	if (cached_state &amp;&amp; *cached_state) {</div><div class='add'>+		state = *cached_state;</div><div class='add'>+		*cached_state = NULL;</div><div class='add'>+		btrfs_free_extent_state(state);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;tree-&gt;lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void cache_state_if_flags(struct extent_state *state,</div><div class='add'>+				 struct extent_state **cached_ptr,</div><div class='add'>+				 unsigned flags)</div><div class='add'>+{</div><div class='add'>+	if (cached_ptr &amp;&amp; !(*cached_ptr)) {</div><div class='add'>+		if (!flags || (state-&gt;state &amp; flags)) {</div><div class='add'>+			*cached_ptr = state;</div><div class='add'>+			refcount_inc(&amp;state-&gt;refs);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void cache_state(struct extent_state *state,</div><div class='add'>+			struct extent_state **cached_ptr)</div><div class='add'>+{</div><div class='add'>+	return cache_state_if_flags(state, cached_ptr, EXTENT_LOCK_BITS | EXTENT_BOUNDARY);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Find the first state struct with 'bits' set after 'start', and return it.</div><div class='add'>+ * tree-&gt;lock must be held.  NULL will returned if nothing was found after</div><div class='add'>+ * 'start'.</div><div class='add'>+ */</div><div class='add'>+static struct extent_state *find_first_extent_bit_state(struct extent_io_tree *tree,</div><div class='add'>+							u64 start, u32 bits)</div><div class='add'>+{</div><div class='add'>+	struct extent_state *state;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This search will find all the extents that end after our range</div><div class='add'>+	 * starts.</div><div class='add'>+	 */</div><div class='add'>+	state = tree_search(tree, start);</div><div class='add'>+	while (state) {</div><div class='add'>+		if (state-&gt;state &amp; bits)</div><div class='add'>+			return state;</div><div class='add'>+		state = next_state(state);</div><div class='add'>+	}</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Find the first offset in the io tree with one or more @bits set.</div><div class='add'>+ *</div><div class='add'>+ * Note: If there are multiple bits set in @bits, any of them will match.</div><div class='add'>+ *</div><div class='add'>+ * Return true if we find something, and update @start_ret and @end_ret.</div><div class='add'>+ * Return false if we found nothing.</div><div class='add'>+ */</div><div class='add'>+bool btrfs_find_first_extent_bit(struct extent_io_tree *tree, u64 start,</div><div class='add'>+				 u64 *start_ret, u64 *end_ret, u32 bits,</div><div class='add'>+				 struct extent_state **cached_state)</div><div class='add'>+{</div><div class='add'>+	struct extent_state *state;</div><div class='add'>+	bool ret = false;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;tree-&gt;lock);</div><div class='add'>+	if (cached_state &amp;&amp; *cached_state) {</div><div class='add'>+		state = *cached_state;</div><div class='add'>+		if (state-&gt;end == start - 1 &amp;&amp; extent_state_in_tree(state)) {</div><div class='add'>+			while ((state = next_state(state)) != NULL) {</div><div class='add'>+				if (state-&gt;state &amp; bits)</div><div class='add'>+					break;</div><div class='add'>+			}</div><div class='add'>+			/*</div><div class='add'>+			 * If we found the next extent state, clear cached_state</div><div class='add'>+			 * so that we can cache the next extent state below and</div><div class='add'>+			 * avoid future calls going over the same extent state</div><div class='add'>+			 * again. If we haven't found any, clear as well since</div><div class='add'>+			 * it's now useless.</div><div class='add'>+			 */</div><div class='add'>+			btrfs_free_extent_state(*cached_state);</div><div class='add'>+			*cached_state = NULL;</div><div class='add'>+			if (state)</div><div class='add'>+				goto got_it;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		btrfs_free_extent_state(*cached_state);</div><div class='add'>+		*cached_state = NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	state = find_first_extent_bit_state(tree, start, bits);</div><div class='add'>+got_it:</div><div class='add'>+	if (state) {</div><div class='add'>+		cache_state_if_flags(state, cached_state, 0);</div><div class='add'>+		*start_ret = state-&gt;start;</div><div class='add'>+		*end_ret = state-&gt;end;</div><div class='add'>+		ret = true;</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='add'>+	spin_unlock(&amp;tree-&gt;lock);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Find a contiguous area of bits</div><div class='add'>+ *</div><div class='add'>+ * @tree:      io tree to check</div><div class='add'>+ * @start:     offset to start the search from</div><div class='add'>+ * @start_ret: the first offset we found with the bits set</div><div class='add'>+ * @end_ret:   the final contiguous range of the bits that were set</div><div class='add'>+ * @bits:      bits to look for</div><div class='add'>+ *</div><div class='add'>+ * set_extent_bit and clear_extent_bit can temporarily split contiguous ranges</div><div class='add'>+ * to set bits appropriately, and then merge them again.  During this time it</div><div class='add'>+ * will drop the tree-&gt;lock, so use this helper if you want to find the actual</div><div class='add'>+ * contiguous area for given bits.  We will search to the first bit we find, and</div><div class='add'>+ * then walk down the tree until we find a non-contiguous area.  The area</div><div class='add'>+ * returned will be the full contiguous area with the bits set.</div><div class='add'>+ *</div><div class='add'>+ * Returns true if we found a range with the given bits set, in which case</div><div class='add'>+ * @start_ret and @end_ret are updated, or false if no range was found.</div><div class='add'>+ */</div><div class='add'>+bool btrfs_find_contiguous_extent_bit(struct extent_io_tree *tree, u64 start,</div><div class='add'>+				      u64 *start_ret, u64 *end_ret, u32 bits)</div><div class='add'>+{</div><div class='add'>+	struct extent_state *state;</div><div class='add'>+	bool ret = false;</div><div class='add'>+</div><div class='add'>+	ASSERT(!btrfs_fs_incompat(btrfs_extent_io_tree_to_fs_info(tree), NO_HOLES));</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;tree-&gt;lock);</div><div class='add'>+	state = find_first_extent_bit_state(tree, start, bits);</div><div class='add'>+	if (state) {</div><div class='add'>+		*start_ret = state-&gt;start;</div><div class='add'>+		*end_ret = state-&gt;end;</div><div class='add'>+		while ((state = next_state(state)) != NULL) {</div><div class='add'>+			if (state-&gt;start &gt; (*end_ret + 1))</div><div class='add'>+				break;</div><div class='add'>+			*end_ret = state-&gt;end;</div><div class='add'>+		}</div><div class='add'>+		ret = true;</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;tree-&gt;lock);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Find a contiguous range of bytes in the file marked as delalloc, not more</div><div class='add'>+ * than 'max_bytes'.  start and end are used to return the range,</div><div class='add'>+ *</div><div class='add'>+ * True is returned if we find something, false if nothing was in the tree.</div><div class='add'>+ */</div><div class='add'>+bool btrfs_find_delalloc_range(struct extent_io_tree *tree, u64 *start,</div><div class='add'>+			       u64 *end, u64 max_bytes,</div><div class='add'>+			       struct extent_state **cached_state)</div><div class='add'>+{</div><div class='add'>+	struct extent_state *state;</div><div class='add'>+	u64 cur_start = *start;</div><div class='add'>+	bool found = false;</div><div class='add'>+	u64 total_bytes = 0;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;tree-&gt;lock);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This search will find all the extents that end after our range</div><div class='add'>+	 * starts.</div><div class='add'>+	 */</div><div class='add'>+	state = tree_search(tree, cur_start);</div><div class='add'>+	if (!state) {</div><div class='add'>+		*end = (u64)-1;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	while (state) {</div><div class='add'>+		if (found &amp;&amp; (state-&gt;start != cur_start ||</div><div class='add'>+			      (state-&gt;state &amp; EXTENT_BOUNDARY))) {</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		if (!(state-&gt;state &amp; EXTENT_DELALLOC)) {</div><div class='add'>+			if (!found)</div><div class='add'>+				*end = state-&gt;end;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		if (!found) {</div><div class='add'>+			*start = state-&gt;start;</div><div class='add'>+			*cached_state = state;</div><div class='add'>+			refcount_inc(&amp;state-&gt;refs);</div><div class='add'>+		}</div><div class='add'>+		found = true;</div><div class='add'>+		*end = state-&gt;end;</div><div class='add'>+		cur_start = state-&gt;end + 1;</div><div class='add'>+		total_bytes += state-&gt;end - state-&gt;start + 1;</div><div class='add'>+		if (total_bytes &gt;= max_bytes)</div><div class='add'>+			break;</div><div class='add'>+		state = next_state(state);</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='add'>+	spin_unlock(&amp;tree-&gt;lock);</div><div class='add'>+	return found;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Set some bits on a range in the tree.  This may require allocations or</div><div class='add'>+ * sleeping. By default all allocations use GFP_NOFS, use EXTENT_NOWAIT for</div><div class='add'>+ * GFP_NOWAIT.</div><div class='add'>+ *</div><div class='add'>+ * If any of the exclusive bits are set, this will fail with -EEXIST if some</div><div class='add'>+ * part of the range already has the desired bits set.  The extent_state of the</div><div class='add'>+ * existing range is returned in failed_state in this case, and the start of the</div><div class='add'>+ * existing range is returned in failed_start.  failed_state is used as an</div><div class='add'>+ * optimization for wait_extent_bit, failed_start must be used as the source of</div><div class='add'>+ * truth as failed_state may have changed since we returned.</div><div class='add'>+ *</div><div class='add'>+ * [start, end] is inclusive This takes the tree lock.</div><div class='add'>+ */</div><div class='add'>+static int set_extent_bit(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='add'>+			  u32 bits, u64 *failed_start,</div><div class='add'>+			  struct extent_state **failed_state,</div><div class='add'>+			  struct extent_state **cached_state,</div><div class='add'>+			  struct extent_changeset *changeset)</div><div class='add'>+{</div><div class='add'>+	struct extent_state *state;</div><div class='add'>+	struct extent_state *prealloc = NULL;</div><div class='add'>+	struct rb_node **p = NULL;</div><div class='add'>+	struct rb_node *parent = NULL;</div><div class='add'>+	int ret = 0;</div><div class='add'>+	u64 last_start;</div><div class='add'>+	u64 last_end;</div><div class='add'>+	u32 exclusive_bits = (bits &amp; EXTENT_LOCK_BITS);</div><div class='add'>+	gfp_t mask;</div><div class='add'>+</div><div class='add'>+	set_gfp_mask_from_bits(&amp;bits, &amp;mask);</div><div class='add'>+	btrfs_debug_check_extent_io_range(tree, start, end);</div><div class='add'>+	trace_btrfs_set_extent_bit(tree, start, end - start + 1, bits);</div><div class='add'>+</div><div class='add'>+	if (exclusive_bits)</div><div class='add'>+		ASSERT(failed_start);</div><div class='add'>+	else</div><div class='add'>+		ASSERT(failed_start == NULL &amp;&amp; failed_state == NULL);</div><div class='add'>+again:</div><div class='add'>+	if (!prealloc) {</div><div class='add'>+		/*</div><div class='add'>+		 * Don't care for allocation failure here because we might end</div><div class='add'>+		 * up not needing the pre-allocated extent state at all, which</div><div class='add'>+		 * is the case if we only have in the tree extent states that</div><div class='add'>+		 * cover our input range and don't cover too any other range.</div><div class='add'>+		 * If we end up needing a new extent state we allocate it later.</div><div class='add'>+		 */</div><div class='add'>+		prealloc = alloc_extent_state(mask);</div><div class='add'>+	}</div><div class='add'>+	/* Optimistically preallocate the extent changeset ulist node. */</div><div class='add'>+	if (changeset)</div><div class='add'>+		extent_changeset_prealloc(changeset, mask);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;tree-&gt;lock);</div><div class='add'>+	if (cached_state &amp;&amp; *cached_state) {</div><div class='add'>+		state = *cached_state;</div><div class='add'>+		if (state-&gt;start &lt;= start &amp;&amp; state-&gt;end &gt; start &amp;&amp;</div><div class='add'>+		    extent_state_in_tree(state))</div><div class='add'>+			goto hit_next;</div><div class='add'>+	}</div><div class='add'>+	/*</div><div class='add'>+	 * This search will find all the extents that end after our range</div><div class='add'>+	 * starts.</div><div class='add'>+	 */</div><div class='add'>+	state = tree_search_for_insert(tree, start, &amp;p, &amp;parent);</div><div class='add'>+	if (!state) {</div><div class='add'>+		prealloc = alloc_extent_state_atomic(prealloc);</div><div class='add'>+		if (!prealloc)</div><div class='add'>+			goto search_again;</div><div class='add'>+		prealloc-&gt;start = start;</div><div class='add'>+		prealloc-&gt;end = end;</div><div class='add'>+		insert_state_fast(tree, prealloc, p, parent, bits, changeset);</div><div class='add'>+		cache_state(prealloc, cached_state);</div><div class='add'>+		prealloc = NULL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+hit_next:</div><div class='add'>+	last_start = state-&gt;start;</div><div class='add'>+	last_end = state-&gt;end;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * | ---- desired range ---- |</div><div class='add'>+	 * | state |</div><div class='add'>+	 *</div><div class='add'>+	 * Just lock what we found and keep going</div><div class='add'>+	 */</div><div class='add'>+	if (state-&gt;start == start &amp;&amp; state-&gt;end &lt;= end) {</div><div class='add'>+		if (state-&gt;state &amp; exclusive_bits) {</div><div class='add'>+			*failed_start = state-&gt;start;</div><div class='add'>+			cache_state(state, failed_state);</div><div class='add'>+			ret = -EEXIST;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		set_state_bits(tree, state, bits, changeset);</div><div class='add'>+		cache_state(state, cached_state);</div><div class='add'>+		merge_state(tree, state);</div><div class='add'>+		if (last_end &gt;= end)</div><div class='add'>+			goto out;</div><div class='add'>+		start = last_end + 1;</div><div class='add'>+		state = next_state(state);</div><div class='add'>+		if (state &amp;&amp; state-&gt;start == start &amp;&amp; !need_resched())</div><div class='add'>+			goto hit_next;</div><div class='add'>+		goto search_again;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 *     | ---- desired range ---- |</div><div class='add'>+	 * | state |</div><div class='add'>+	 *   or</div><div class='add'>+	 * | ------------- state -------------- |</div><div class='add'>+	 *</div><div class='add'>+	 * We need to split the extent we found, and may flip bits on second</div><div class='add'>+	 * half.</div><div class='add'>+	 *</div><div class='add'>+	 * If the extent we found extends past our range, we just split and</div><div class='add'>+	 * search again.  It'll get split again the next time though.</div><div class='add'>+	 *</div><div class='add'>+	 * If the extent we found is inside our range, we set the desired bit</div><div class='add'>+	 * on it.</div><div class='add'>+	 */</div><div class='add'>+	if (state-&gt;start &lt; start) {</div><div class='add'>+		if (state-&gt;state &amp; exclusive_bits) {</div><div class='add'>+			*failed_start = start;</div><div class='add'>+			cache_state(state, failed_state);</div><div class='add'>+			ret = -EEXIST;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * If this extent already has all the bits we want set, then</div><div class='add'>+		 * skip it, not necessary to split it or do anything with it.</div><div class='add'>+		 */</div><div class='add'>+		if ((state-&gt;state &amp; bits) == bits) {</div><div class='add'>+			start = state-&gt;end + 1;</div><div class='add'>+			cache_state(state, cached_state);</div><div class='add'>+			goto search_again;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		prealloc = alloc_extent_state_atomic(prealloc);</div><div class='add'>+		if (!prealloc)</div><div class='add'>+			goto search_again;</div><div class='add'>+		ret = split_state(tree, state, prealloc, start);</div><div class='add'>+		if (ret)</div><div class='add'>+			extent_io_tree_panic(tree, state, "split", ret);</div><div class='add'>+</div><div class='add'>+		prealloc = NULL;</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out;</div><div class='add'>+		if (state-&gt;end &lt;= end) {</div><div class='add'>+			set_state_bits(tree, state, bits, changeset);</div><div class='add'>+			cache_state(state, cached_state);</div><div class='add'>+			merge_state(tree, state);</div><div class='add'>+			if (last_end &gt;= end)</div><div class='add'>+				goto out;</div><div class='add'>+			start = last_end + 1;</div><div class='add'>+			state = next_state(state);</div><div class='add'>+			if (state &amp;&amp; state-&gt;start == start &amp;&amp; !need_resched())</div><div class='add'>+				goto hit_next;</div><div class='add'>+		}</div><div class='add'>+		goto search_again;</div><div class='add'>+	}</div><div class='add'>+	/*</div><div class='add'>+	 * | ---- desired range ---- |</div><div class='add'>+	 *     | state | or               | state |</div><div class='add'>+	 *</div><div class='add'>+	 * There's a hole, we need to insert something in it and ignore the</div><div class='add'>+	 * extent we found.</div><div class='add'>+	 */</div><div class='add'>+	if (state-&gt;start &gt; start) {</div><div class='add'>+		struct extent_state *inserted_state;</div><div class='add'>+</div><div class='add'>+		prealloc = alloc_extent_state_atomic(prealloc);</div><div class='add'>+		if (!prealloc)</div><div class='add'>+			goto search_again;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Avoid to free 'prealloc' if it can be merged with the later</div><div class='add'>+		 * extent.</div><div class='add'>+		 */</div><div class='add'>+		prealloc-&gt;start = start;</div><div class='add'>+		if (end &lt; last_start)</div><div class='add'>+			prealloc-&gt;end = end;</div><div class='add'>+		else</div><div class='add'>+			prealloc-&gt;end = last_start - 1;</div><div class='add'>+</div><div class='add'>+		inserted_state = insert_state(tree, prealloc, bits, changeset);</div><div class='add'>+		if (IS_ERR(inserted_state)) {</div><div class='add'>+			ret = PTR_ERR(inserted_state);</div><div class='add'>+			extent_io_tree_panic(tree, prealloc, "insert", ret);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		cache_state(inserted_state, cached_state);</div><div class='add'>+		if (inserted_state == prealloc)</div><div class='add'>+			prealloc = NULL;</div><div class='add'>+		start = inserted_state-&gt;end + 1;</div><div class='add'>+</div><div class='add'>+		/* Beyond target range, stop. */</div><div class='add'>+		if (start &gt; end)</div><div class='add'>+			goto out;</div><div class='add'>+</div><div class='add'>+		if (need_resched())</div><div class='add'>+			goto search_again;</div><div class='add'>+</div><div class='add'>+		state = next_search_state(inserted_state, end);</div><div class='add'>+		/*</div><div class='add'>+		 * If there's a next state, whether contiguous or not, we don't</div><div class='add'>+		 * need to unlock and start search again. If it's not contiguous</div><div class='add'>+		 * we will end up here and try to allocate a prealloc state and insert.</div><div class='add'>+		 */</div><div class='add'>+		if (state)</div><div class='add'>+			goto hit_next;</div><div class='add'>+		goto search_again;</div><div class='add'>+	}</div><div class='add'>+	/*</div><div class='add'>+	 * | ---- desired range ---- |</div><div class='add'>+	 *                        | state |</div><div class='add'>+	 *</div><div class='add'>+	 * We need to split the extent, and set the bit on the first half</div><div class='add'>+	 */</div><div class='add'>+	if (state-&gt;start &lt;= end &amp;&amp; state-&gt;end &gt; end) {</div><div class='add'>+		if (state-&gt;state &amp; exclusive_bits) {</div><div class='add'>+			*failed_start = start;</div><div class='add'>+			cache_state(state, failed_state);</div><div class='add'>+			ret = -EEXIST;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		prealloc = alloc_extent_state_atomic(prealloc);</div><div class='add'>+		if (!prealloc)</div><div class='add'>+			goto search_again;</div><div class='add'>+		ret = split_state(tree, state, prealloc, end + 1);</div><div class='add'>+		if (ret) {</div><div class='add'>+			extent_io_tree_panic(tree, state, "split", ret);</div><div class='add'>+			prealloc = NULL;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		set_state_bits(tree, prealloc, bits, changeset);</div><div class='add'>+		cache_state(prealloc, cached_state);</div><div class='add'>+		merge_state(tree, prealloc);</div><div class='add'>+		prealloc = NULL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+search_again:</div><div class='add'>+	if (start &gt; end)</div><div class='add'>+		goto out;</div><div class='add'>+	spin_unlock(&amp;tree-&gt;lock);</div><div class='add'>+	if (gfpflags_allow_blocking(mask))</div><div class='add'>+		cond_resched();</div><div class='add'>+	goto again;</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	spin_unlock(&amp;tree-&gt;lock);</div><div class='add'>+	btrfs_free_extent_state(prealloc);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_set_extent_bit(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='add'>+			 u32 bits, struct extent_state **cached_state)</div><div class='add'>+{</div><div class='add'>+	return set_extent_bit(tree, start, end, bits, NULL, NULL, cached_state, NULL);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Convert all bits in a given range from one bit to another</div><div class='add'>+ *</div><div class='add'>+ * @tree:	the io tree to search</div><div class='add'>+ * @start:	the start offset in bytes</div><div class='add'>+ * @end:	the end offset in bytes (inclusive)</div><div class='add'>+ * @bits:	the bits to set in this range</div><div class='add'>+ * @clear_bits:	the bits to clear in this range</div><div class='add'>+ * @cached_state:	state that we're going to cache</div><div class='add'>+ *</div><div class='add'>+ * This will go through and set bits for the given range.  If any states exist</div><div class='add'>+ * already in this range they are set with the given bit and cleared of the</div><div class='add'>+ * clear_bits.  This is only meant to be used by things that are mergeable, ie.</div><div class='add'>+ * converting from say DELALLOC to DIRTY.  This is not meant to be used with</div><div class='add'>+ * boundary bits like LOCK.</div><div class='add'>+ *</div><div class='add'>+ * All allocations are done with GFP_NOFS.</div><div class='add'>+ */</div><div class='add'>+int btrfs_convert_extent_bit(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='add'>+			     u32 bits, u32 clear_bits,</div><div class='add'>+			     struct extent_state **cached_state)</div><div class='add'>+{</div><div class='add'>+	struct extent_state *state;</div><div class='add'>+	struct extent_state *prealloc = NULL;</div><div class='add'>+	struct rb_node **p = NULL;</div><div class='add'>+	struct rb_node *parent = NULL;</div><div class='add'>+	int ret = 0;</div><div class='add'>+	u64 last_start;</div><div class='add'>+	u64 last_end;</div><div class='add'>+	bool first_iteration = true;</div><div class='add'>+</div><div class='add'>+	btrfs_debug_check_extent_io_range(tree, start, end);</div><div class='add'>+	trace_btrfs_convert_extent_bit(tree, start, end - start + 1, bits,</div><div class='add'>+				       clear_bits);</div><div class='add'>+</div><div class='add'>+again:</div><div class='add'>+	if (!prealloc) {</div><div class='add'>+		/*</div><div class='add'>+		 * Best effort, don't worry if extent state allocation fails</div><div class='add'>+		 * here for the first iteration. We might have a cached state</div><div class='add'>+		 * that matches exactly the target range, in which case no</div><div class='add'>+		 * extent state allocations are needed. We'll only know this</div><div class='add'>+		 * after locking the tree.</div><div class='add'>+		 */</div><div class='add'>+		prealloc = alloc_extent_state(GFP_NOFS);</div><div class='add'>+		if (!prealloc &amp;&amp; !first_iteration)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;tree-&gt;lock);</div><div class='add'>+	if (cached_state &amp;&amp; *cached_state) {</div><div class='add'>+		state = *cached_state;</div><div class='add'>+		if (state-&gt;start &lt;= start &amp;&amp; state-&gt;end &gt; start &amp;&amp;</div><div class='add'>+		    extent_state_in_tree(state))</div><div class='add'>+			goto hit_next;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This search will find all the extents that end after our range</div><div class='add'>+	 * starts.</div><div class='add'>+	 */</div><div class='add'>+	state = tree_search_for_insert(tree, start, &amp;p, &amp;parent);</div><div class='add'>+	if (!state) {</div><div class='add'>+		prealloc = alloc_extent_state_atomic(prealloc);</div><div class='add'>+		if (!prealloc) {</div><div class='add'>+			ret = -ENOMEM;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		prealloc-&gt;start = start;</div><div class='add'>+		prealloc-&gt;end = end;</div><div class='add'>+		insert_state_fast(tree, prealloc, p, parent, bits, NULL);</div><div class='add'>+		cache_state(prealloc, cached_state);</div><div class='add'>+		prealloc = NULL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+hit_next:</div><div class='add'>+	last_start = state-&gt;start;</div><div class='add'>+	last_end = state-&gt;end;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * | ---- desired range ---- |</div><div class='add'>+	 * | state |</div><div class='add'>+	 *</div><div class='add'>+	 * Just lock what we found and keep going.</div><div class='add'>+	 */</div><div class='add'>+	if (state-&gt;start == start &amp;&amp; state-&gt;end &lt;= end) {</div><div class='add'>+		set_state_bits(tree, state, bits, NULL);</div><div class='add'>+		cache_state(state, cached_state);</div><div class='add'>+		state = clear_state_bit(tree, state, clear_bits, 0, end, NULL);</div><div class='add'>+		if (last_end &gt;= end)</div><div class='add'>+			goto out;</div><div class='add'>+		start = last_end + 1;</div><div class='add'>+		if (state &amp;&amp; state-&gt;start == start &amp;&amp; !need_resched())</div><div class='add'>+			goto hit_next;</div><div class='add'>+		goto search_again;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 *     | ---- desired range ---- |</div><div class='add'>+	 * | state |</div><div class='add'>+	 *   or</div><div class='add'>+	 * | ------------- state -------------- |</div><div class='add'>+	 *</div><div class='add'>+	 * We need to split the extent we found, and may flip bits on second</div><div class='add'>+	 * half.</div><div class='add'>+	 *</div><div class='add'>+	 * If the extent we found extends past our range, we just split and</div><div class='add'>+	 * search again.  It'll get split again the next time though.</div><div class='add'>+	 *</div><div class='add'>+	 * If the extent we found is inside our range, we set the desired bit</div><div class='add'>+	 * on it.</div><div class='add'>+	 */</div><div class='add'>+	if (state-&gt;start &lt; start) {</div><div class='add'>+		prealloc = alloc_extent_state_atomic(prealloc);</div><div class='add'>+		if (!prealloc) {</div><div class='add'>+			ret = -ENOMEM;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		ret = split_state(tree, state, prealloc, start);</div><div class='add'>+		prealloc = NULL;</div><div class='add'>+		if (ret) {</div><div class='add'>+			extent_io_tree_panic(tree, state, "split", ret);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		if (state-&gt;end &lt;= end) {</div><div class='add'>+			set_state_bits(tree, state, bits, NULL);</div><div class='add'>+			cache_state(state, cached_state);</div><div class='add'>+			state = clear_state_bit(tree, state, clear_bits, 0, end, NULL);</div><div class='add'>+			if (last_end &gt;= end)</div><div class='add'>+				goto out;</div><div class='add'>+			start = last_end + 1;</div><div class='add'>+			if (state &amp;&amp; state-&gt;start == start &amp;&amp; !need_resched())</div><div class='add'>+				goto hit_next;</div><div class='add'>+		}</div><div class='add'>+		goto search_again;</div><div class='add'>+	}</div><div class='add'>+	/*</div><div class='add'>+	 * | ---- desired range ---- |</div><div class='add'>+	 *     | state | or               | state |</div><div class='add'>+	 *</div><div class='add'>+	 * There's a hole, we need to insert something in it and ignore the</div><div class='add'>+	 * extent we found.</div><div class='add'>+	 */</div><div class='add'>+	if (state-&gt;start &gt; start) {</div><div class='add'>+		struct extent_state *inserted_state;</div><div class='add'>+</div><div class='add'>+		prealloc = alloc_extent_state_atomic(prealloc);</div><div class='add'>+		if (!prealloc) {</div><div class='add'>+			ret = -ENOMEM;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Avoid to free 'prealloc' if it can be merged with the later</div><div class='add'>+		 * extent.</div><div class='add'>+		 */</div><div class='add'>+		prealloc-&gt;start = start;</div><div class='add'>+		if (end &lt; last_start)</div><div class='add'>+			prealloc-&gt;end = end;</div><div class='add'>+		else</div><div class='add'>+			prealloc-&gt;end = last_start - 1;</div><div class='add'>+</div><div class='add'>+		inserted_state = insert_state(tree, prealloc, bits, NULL);</div><div class='add'>+		if (IS_ERR(inserted_state)) {</div><div class='add'>+			ret = PTR_ERR(inserted_state);</div><div class='add'>+			extent_io_tree_panic(tree, prealloc, "insert", ret);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		cache_state(inserted_state, cached_state);</div><div class='add'>+		if (inserted_state == prealloc)</div><div class='add'>+			prealloc = NULL;</div><div class='add'>+		start = inserted_state-&gt;end + 1;</div><div class='add'>+</div><div class='add'>+		/* Beyond target range, stop. */</div><div class='add'>+		if (start &gt; end)</div><div class='add'>+			goto out;</div><div class='add'>+</div><div class='add'>+		if (need_resched())</div><div class='add'>+			goto search_again;</div><div class='add'>+</div><div class='add'>+		state = next_search_state(inserted_state, end);</div><div class='add'>+		/*</div><div class='add'>+		 * If there's a next state, whether contiguous or not, we don't</div><div class='add'>+		 * need to unlock and start search again. If it's not contiguous</div><div class='add'>+		 * we will end up here and try to allocate a prealloc state and insert.</div><div class='add'>+		 */</div><div class='add'>+		if (state)</div><div class='add'>+			goto hit_next;</div><div class='add'>+		goto search_again;</div><div class='add'>+	}</div><div class='add'>+	/*</div><div class='add'>+	 * | ---- desired range ---- |</div><div class='add'>+	 *                        | state |</div><div class='add'>+	 *</div><div class='add'>+	 * We need to split the extent, and set the bit on the first half.</div><div class='add'>+	 */</div><div class='add'>+	if (state-&gt;start &lt;= end &amp;&amp; state-&gt;end &gt; end) {</div><div class='add'>+		prealloc = alloc_extent_state_atomic(prealloc);</div><div class='add'>+		if (!prealloc) {</div><div class='add'>+			ret = -ENOMEM;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		ret = split_state(tree, state, prealloc, end + 1);</div><div class='add'>+		if (ret) {</div><div class='add'>+			extent_io_tree_panic(tree, state, "split", ret);</div><div class='add'>+			prealloc = NULL;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		set_state_bits(tree, prealloc, bits, NULL);</div><div class='add'>+		cache_state(prealloc, cached_state);</div><div class='add'>+		clear_state_bit(tree, prealloc, clear_bits, 0, end, NULL);</div><div class='add'>+		prealloc = NULL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+search_again:</div><div class='add'>+	if (start &gt; end)</div><div class='add'>+		goto out;</div><div class='add'>+	spin_unlock(&amp;tree-&gt;lock);</div><div class='add'>+	cond_resched();</div><div class='add'>+	first_iteration = false;</div><div class='add'>+	goto again;</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	spin_unlock(&amp;tree-&gt;lock);</div><div class='add'>+	btrfs_free_extent_state(prealloc);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Find the first range that has @bits not set. This range could start before</div><div class='add'>+ * @start.</div><div class='add'>+ *</div><div class='add'>+ * @tree:      the tree to search</div><div class='add'>+ * @start:     offset at/after which the found extent should start</div><div class='add'>+ * @start_ret: records the beginning of the range</div><div class='add'>+ * @end_ret:   records the end of the range (inclusive)</div><div class='add'>+ * @bits:      the set of bits which must be unset</div><div class='add'>+ *</div><div class='add'>+ * Since unallocated range is also considered one which doesn't have the bits</div><div class='add'>+ * set it's possible that @end_ret contains -1, this happens in case the range</div><div class='add'>+ * spans (last_range_end, end of device]. In this case it's up to the caller to</div><div class='add'>+ * trim @end_ret to the appropriate size.</div><div class='add'>+ */</div><div class='add'>+void btrfs_find_first_clear_extent_bit(struct extent_io_tree *tree, u64 start,</div><div class='add'>+				       u64 *start_ret, u64 *end_ret, u32 bits)</div><div class='add'>+{</div><div class='add'>+	struct extent_state *state;</div><div class='add'>+	struct extent_state *prev = NULL, *next = NULL;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;tree-&gt;lock);</div><div class='add'>+</div><div class='add'>+	/* Find first extent with bits cleared */</div><div class='add'>+	while (1) {</div><div class='add'>+		state = tree_search_prev_next(tree, start, &amp;prev, &amp;next);</div><div class='add'>+		if (!state &amp;&amp; !next &amp;&amp; !prev) {</div><div class='add'>+			/*</div><div class='add'>+			 * Tree is completely empty, send full range and let</div><div class='add'>+			 * caller deal with it</div><div class='add'>+			 */</div><div class='add'>+			*start_ret = 0;</div><div class='add'>+			*end_ret = -1;</div><div class='add'>+			goto out;</div><div class='add'>+		} else if (!state &amp;&amp; !next) {</div><div class='add'>+			/*</div><div class='add'>+			 * We are past the last allocated chunk, set start at</div><div class='add'>+			 * the end of the last extent.</div><div class='add'>+			 */</div><div class='add'>+			*start_ret = prev-&gt;end + 1;</div><div class='add'>+			*end_ret = -1;</div><div class='add'>+			goto out;</div><div class='add'>+		} else if (!state) {</div><div class='add'>+			state = next;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * At this point 'state' either contains 'start' or start is</div><div class='add'>+		 * before 'state'</div><div class='add'>+		 */</div><div class='add'>+		if (in_range(start, state-&gt;start, state-&gt;end - state-&gt;start + 1)) {</div><div class='add'>+			if (state-&gt;state &amp; bits) {</div><div class='add'>+				/*</div><div class='add'>+				 * |--range with bits sets--|</div><div class='add'>+				 *    |</div><div class='add'>+				 *    start</div><div class='add'>+				 */</div><div class='add'>+				start = state-&gt;end + 1;</div><div class='add'>+			} else {</div><div class='add'>+				/*</div><div class='add'>+				 * 'start' falls within a range that doesn't</div><div class='add'>+				 * have the bits set, so take its start as the</div><div class='add'>+				 * beginning of the desired range</div><div class='add'>+				 *</div><div class='add'>+				 * |--range with bits cleared----|</div><div class='add'>+				 *      |</div><div class='add'>+				 *      start</div><div class='add'>+				 */</div><div class='add'>+				*start_ret = state-&gt;start;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+		} else {</div><div class='add'>+			/*</div><div class='add'>+			 * |---prev range---|---hole/unset---|---node range---|</div><div class='add'>+			 *                          |</div><div class='add'>+			 *                        start</div><div class='add'>+			 *</div><div class='add'>+			 *                        or</div><div class='add'>+			 *</div><div class='add'>+			 * |---hole/unset--||--first node--|</div><div class='add'>+			 * 0   |</div><div class='add'>+			 *    start</div><div class='add'>+			 */</div><div class='add'>+			if (prev)</div><div class='add'>+				*start_ret = prev-&gt;end + 1;</div><div class='add'>+			else</div><div class='add'>+				*start_ret = 0;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Find the longest stretch from start until an entry which has the</div><div class='add'>+	 * bits set</div><div class='add'>+	 */</div><div class='add'>+	while (state) {</div><div class='add'>+		if (state-&gt;end &gt;= start &amp;&amp; !(state-&gt;state &amp; bits)) {</div><div class='add'>+			*end_ret = state-&gt;end;</div><div class='add'>+		} else {</div><div class='add'>+			*end_ret = state-&gt;start - 1;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		state = next_state(state);</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='add'>+	spin_unlock(&amp;tree-&gt;lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Count the number of bytes in the tree that have a given bit(s) set for a</div><div class='add'>+ * given range.</div><div class='add'>+ *</div><div class='add'>+ * @tree:         The io tree to search.</div><div class='add'>+ * @start:        The start offset of the range. This value is updated to the</div><div class='add'>+ *                offset of the first byte found with the given bit(s), so it</div><div class='add'>+ *                can end up being bigger than the initial value.</div><div class='add'>+ * @search_end:   The end offset (inclusive value) of the search range.</div><div class='add'>+ * @max_bytes:    The maximum byte count we are interested. The search stops</div><div class='add'>+ *                once it reaches this count.</div><div class='add'>+ * @bits:         The bits the range must have in order to be accounted for.</div><div class='add'>+ *                If multiple bits are set, then only subranges that have all</div><div class='add'>+ *                the bits set are accounted for.</div><div class='add'>+ * @contig:       Indicate if we should ignore holes in the range or not. If</div><div class='add'>+ *                this is true, then stop once we find a hole.</div><div class='add'>+ * @cached_state: A cached state to be used across multiple calls to this</div><div class='add'>+ *                function in order to speedup searches. Use NULL if this is</div><div class='add'>+ *                called only once or if each call does not start where the</div><div class='add'>+ *                previous one ended.</div><div class='add'>+ *</div><div class='add'>+ * Returns the total number of bytes found within the given range that have</div><div class='add'>+ * all given bits set. If the returned number of bytes is greater than zero</div><div class='add'>+ * then @start is updated with the offset of the first byte with the bits set.</div><div class='add'>+ */</div><div class='add'>+u64 btrfs_count_range_bits(struct extent_io_tree *tree,</div><div class='add'>+			   u64 *start, u64 search_end, u64 max_bytes,</div><div class='add'>+			   u32 bits, bool contig,</div><div class='add'>+			   struct extent_state **cached_state)</div><div class='add'>+{</div><div class='add'>+	struct extent_state *state = NULL;</div><div class='add'>+	struct extent_state *cached;</div><div class='add'>+	u64 cur_start = *start;</div><div class='add'>+	u64 total_bytes = 0;</div><div class='add'>+	u64 last = 0;</div><div class='add'>+	int found = 0;</div><div class='add'>+</div><div class='add'>+	if (WARN_ON(search_end &lt; cur_start))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;tree-&gt;lock);</div><div class='add'>+</div><div class='add'>+	if (!cached_state || !*cached_state)</div><div class='add'>+		goto search;</div><div class='add'>+</div><div class='add'>+	cached = *cached_state;</div><div class='add'>+</div><div class='add'>+	if (!extent_state_in_tree(cached))</div><div class='add'>+		goto search;</div><div class='add'>+</div><div class='add'>+	if (cached-&gt;start &lt;= cur_start &amp;&amp; cur_start &lt;= cached-&gt;end) {</div><div class='add'>+		state = cached;</div><div class='add'>+	} else if (cached-&gt;start &gt; cur_start) {</div><div class='add'>+		struct extent_state *prev;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * The cached state starts after our search range's start. Check</div><div class='add'>+		 * if the previous state record starts at or before the range we</div><div class='add'>+		 * are looking for, and if so, use it - this is a common case</div><div class='add'>+		 * when there are holes between records in the tree. If there is</div><div class='add'>+		 * no previous state record, we can start from our cached state.</div><div class='add'>+		 */</div><div class='add'>+		prev = prev_state(cached);</div><div class='add'>+		if (!prev)</div><div class='add'>+			state = cached;</div><div class='add'>+		else if (prev-&gt;start &lt;= cur_start &amp;&amp; cur_start &lt;= prev-&gt;end)</div><div class='add'>+			state = prev;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This search will find all the extents that end after our range</div><div class='add'>+	 * starts.</div><div class='add'>+	 */</div><div class='add'>+search:</div><div class='add'>+	if (!state)</div><div class='add'>+		state = tree_search(tree, cur_start);</div><div class='add'>+</div><div class='add'>+	while (state) {</div><div class='add'>+		if (state-&gt;start &gt; search_end)</div><div class='add'>+			break;</div><div class='add'>+		if (contig &amp;&amp; found &amp;&amp; state-&gt;start &gt; last + 1)</div><div class='add'>+			break;</div><div class='add'>+		if (state-&gt;end &gt;= cur_start &amp;&amp; (state-&gt;state &amp; bits) == bits) {</div><div class='add'>+			total_bytes += min(search_end, state-&gt;end) + 1 -</div><div class='add'>+				       max(cur_start, state-&gt;start);</div><div class='add'>+			if (total_bytes &gt;= max_bytes)</div><div class='add'>+				break;</div><div class='add'>+			if (!found) {</div><div class='add'>+				*start = max(cur_start, state-&gt;start);</div><div class='add'>+				found = 1;</div><div class='add'>+			}</div><div class='add'>+			last = state-&gt;end;</div><div class='add'>+		} else if (contig &amp;&amp; found) {</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		state = next_state(state);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (cached_state) {</div><div class='add'>+		btrfs_free_extent_state(*cached_state);</div><div class='add'>+		*cached_state = state;</div><div class='add'>+		if (state)</div><div class='add'>+			refcount_inc(&amp;state-&gt;refs);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_unlock(&amp;tree-&gt;lock);</div><div class='add'>+</div><div class='add'>+	return total_bytes;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Check if the single @bit exists in the given range.</div><div class='add'>+ */</div><div class='add'>+bool btrfs_test_range_bit_exists(struct extent_io_tree *tree, u64 start, u64 end, u32 bit)</div><div class='add'>+{</div><div class='add'>+	struct extent_state *state;</div><div class='add'>+	bool bitset = false;</div><div class='add'>+</div><div class='add'>+	ASSERT(is_power_of_2(bit));</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;tree-&gt;lock);</div><div class='add'>+	state = tree_search(tree, start);</div><div class='add'>+	while (state) {</div><div class='add'>+		if (state-&gt;start &gt; end)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		if (state-&gt;state &amp; bit) {</div><div class='add'>+			bitset = true;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (state-&gt;end &gt;= end)</div><div class='add'>+			break;</div><div class='add'>+		state = next_state(state);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;tree-&gt;lock);</div><div class='add'>+	return bitset;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_get_range_bits(struct extent_io_tree *tree, u64 start, u64 end, u32 *bits,</div><div class='add'>+			  struct extent_state **cached_state)</div><div class='add'>+{</div><div class='add'>+	struct extent_state *state;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The cached state is currently mandatory and not used to start the</div><div class='add'>+	 * search, only to cache the first state record found in the range.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(cached_state != NULL);</div><div class='add'>+	ASSERT(*cached_state == NULL);</div><div class='add'>+</div><div class='add'>+	*bits = 0;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;tree-&gt;lock);</div><div class='add'>+	state = tree_search(tree, start);</div><div class='add'>+	if (state &amp;&amp; state-&gt;start &lt; end) {</div><div class='add'>+		*cached_state = state;</div><div class='add'>+		refcount_inc(&amp;state-&gt;refs);</div><div class='add'>+	}</div><div class='add'>+	while (state) {</div><div class='add'>+		if (state-&gt;start &gt; end)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		*bits |= state-&gt;state;</div><div class='add'>+</div><div class='add'>+		if (state-&gt;end &gt;= end)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		state = next_state(state);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;tree-&gt;lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Check if the whole range [@start,@end) contains the single @bit set.</div><div class='add'>+ */</div><div class='add'>+bool btrfs_test_range_bit(struct extent_io_tree *tree, u64 start, u64 end, u32 bit,</div><div class='add'>+			  struct extent_state *cached)</div><div class='add'>+{</div><div class='add'>+	struct extent_state *state;</div><div class='add'>+	bool bitset = true;</div><div class='add'>+</div><div class='add'>+	ASSERT(is_power_of_2(bit));</div><div class='add'>+	ASSERT(start &lt; end);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;tree-&gt;lock);</div><div class='add'>+	if (cached &amp;&amp; extent_state_in_tree(cached) &amp;&amp; cached-&gt;start &lt;= start &amp;&amp;</div><div class='add'>+	    cached-&gt;end &gt; start)</div><div class='add'>+		state = cached;</div><div class='add'>+	else</div><div class='add'>+		state = tree_search(tree, start);</div><div class='add'>+	while (state) {</div><div class='add'>+		if (state-&gt;start &gt; start) {</div><div class='add'>+			bitset = false;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if ((state-&gt;state &amp; bit) == 0) {</div><div class='add'>+			bitset = false;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (state-&gt;end &gt;= end)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		/* Next state must start where this one ends. */</div><div class='add'>+		start = state-&gt;end + 1;</div><div class='add'>+		state = next_state(state);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* We ran out of states and were still inside of our range. */</div><div class='add'>+	if (!state)</div><div class='add'>+		bitset = false;</div><div class='add'>+	spin_unlock(&amp;tree-&gt;lock);</div><div class='add'>+	return bitset;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Wrappers around set/clear extent bit */</div><div class='add'>+int btrfs_set_record_extent_bits(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='add'>+				 u32 bits, struct extent_changeset *changeset)</div><div class='add'>+{</div><div class='add'>+	/*</div><div class='add'>+	 * We don't support EXTENT_LOCK_BITS yet, as current changeset will</div><div class='add'>+	 * record any bits changed, so for EXTENT_LOCK_BITS case, it will either</div><div class='add'>+	 * fail with -EEXIST or changeset will record the whole range.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(!(bits &amp; EXTENT_LOCK_BITS));</div><div class='add'>+</div><div class='add'>+	return set_extent_bit(tree, start, end, bits, NULL, NULL, NULL, changeset);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_clear_record_extent_bits(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='add'>+				   u32 bits, struct extent_changeset *changeset)</div><div class='add'>+{</div><div class='add'>+	/*</div><div class='add'>+	 * Don't support EXTENT_LOCK_BITS case, same reason as</div><div class='add'>+	 * set_record_extent_bits().</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(!(bits &amp; EXTENT_LOCK_BITS));</div><div class='add'>+</div><div class='add'>+	return btrfs_clear_extent_bit_changeset(tree, start, end, bits, NULL, changeset);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool btrfs_try_lock_extent_bits(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='add'>+				u32 bits, struct extent_state **cached)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+	u64 failed_start;</div><div class='add'>+</div><div class='add'>+	ret = set_extent_bit(tree, start, end, bits, &amp;failed_start, NULL, cached, NULL);</div><div class='add'>+	if (ret == -EEXIST) {</div><div class='add'>+		if (failed_start &gt; start)</div><div class='add'>+			btrfs_clear_extent_bit(tree, start, failed_start - 1,</div><div class='add'>+					       bits, cached);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+	return 1;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Either insert or lock state struct between start and end use mask to tell</div><div class='add'>+ * us if waiting is desired.</div><div class='add'>+ */</div><div class='add'>+int btrfs_lock_extent_bits(struct extent_io_tree *tree, u64 start, u64 end, u32 bits,</div><div class='add'>+			   struct extent_state **cached_state)</div><div class='add'>+{</div><div class='add'>+	struct extent_state *failed_state = NULL;</div><div class='add'>+	int ret;</div><div class='add'>+	u64 failed_start;</div><div class='add'>+</div><div class='add'>+	ret = set_extent_bit(tree, start, end, bits, &amp;failed_start,</div><div class='add'>+			     &amp;failed_state, cached_state, NULL);</div><div class='add'>+	while (ret == -EEXIST) {</div><div class='add'>+		if (failed_start != start)</div><div class='add'>+			btrfs_clear_extent_bit(tree, start, failed_start - 1,</div><div class='add'>+					       bits, cached_state);</div><div class='add'>+</div><div class='add'>+		wait_extent_bit(tree, failed_start, end, bits, &amp;failed_state);</div><div class='add'>+		ret = set_extent_bit(tree, start, end, bits, &amp;failed_start,</div><div class='add'>+				     &amp;failed_state, cached_state, NULL);</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Get the extent state that follows the given extent state.</div><div class='add'>+ * This is meant to be used in a context where we know no other tasks can</div><div class='add'>+ * concurrently modify the tree.</div><div class='add'>+ */</div><div class='add'>+struct extent_state *btrfs_next_extent_state(struct extent_io_tree *tree,</div><div class='add'>+					     struct extent_state *state)</div><div class='add'>+{</div><div class='add'>+	struct extent_state *next;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;tree-&gt;lock);</div><div class='add'>+	ASSERT(extent_state_in_tree(state));</div><div class='add'>+	next = next_state(state);</div><div class='add'>+	if (next)</div><div class='add'>+		refcount_inc(&amp;next-&gt;refs);</div><div class='add'>+	spin_unlock(&amp;tree-&gt;lock);</div><div class='add'>+</div><div class='add'>+	return next;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void __cold btrfs_extent_state_free_cachep(void)</div><div class='add'>+{</div><div class='add'>+	btrfs_extent_state_leak_debug_check();</div><div class='add'>+	kmem_cache_destroy(extent_state_cache);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int __init btrfs_extent_state_init_cachep(void)</div><div class='add'>+{</div><div class='add'>+	extent_state_cache = kmem_cache_create("btrfs_extent_state",</div><div class='add'>+					       sizeof(struct extent_state), 0, 0,</div><div class='add'>+					       NULL);</div><div class='add'>+	if (!extent_state_cache)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/btrfs/extent-io-tree.h b/fs/btrfs/extent-io-tree.h<br/>index 04083ee5ae6e..6f07b965e8da 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/extent-io-tree.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/extent-io-tree.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/extent-io-tree.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/extent-io-tree.h</a></div><div class='hunk'>@@ -3,42 +3,77 @@</div><div class='ctx'> #ifndef BTRFS_EXTENT_IO_TREE_H</div><div class='ctx'> #define BTRFS_EXTENT_IO_TREE_H</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/rbtree.h&gt;</div><div class='add'>+#include &lt;linux/spinlock.h&gt;</div><div class='add'>+#include &lt;linux/refcount.h&gt;</div><div class='add'>+#include &lt;linux/list.h&gt;</div><div class='add'>+#include &lt;linux/wait.h&gt;</div><div class='add'>+#include "misc.h"</div><div class='add'>+</div><div class='ctx'> struct extent_changeset;</div><div class='del'>-struct io_failure_record;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+struct btrfs_inode;</div><div class='ctx'> </div><div class='ctx'> /* Bits for the extent state */</div><div class='del'>-#define EXTENT_DIRTY		(1U &lt;&lt; 0)</div><div class='del'>-#define EXTENT_UPTODATE		(1U &lt;&lt; 1)</div><div class='del'>-#define EXTENT_LOCKED		(1U &lt;&lt; 2)</div><div class='del'>-#define EXTENT_NEW		(1U &lt;&lt; 3)</div><div class='del'>-#define EXTENT_DELALLOC		(1U &lt;&lt; 4)</div><div class='del'>-#define EXTENT_DEFRAG		(1U &lt;&lt; 5)</div><div class='del'>-#define EXTENT_BOUNDARY		(1U &lt;&lt; 6)</div><div class='del'>-#define EXTENT_NODATASUM	(1U &lt;&lt; 7)</div><div class='del'>-#define EXTENT_CLEAR_META_RESV	(1U &lt;&lt; 8)</div><div class='del'>-#define EXTENT_NEED_WAIT	(1U &lt;&lt; 9)</div><div class='del'>-#define EXTENT_DAMAGED		(1U &lt;&lt; 10)</div><div class='del'>-#define EXTENT_NORESERVE	(1U &lt;&lt; 11)</div><div class='del'>-#define EXTENT_QGROUP_RESERVED	(1U &lt;&lt; 12)</div><div class='del'>-#define EXTENT_CLEAR_DATA_RESV	(1U &lt;&lt; 13)</div><div class='del'>-/*</div><div class='del'>- * Must be cleared only during ordered extent completion or on error paths if we</div><div class='del'>- * did not manage to submit bios and create the ordered extents for the range.</div><div class='del'>- * Should not be cleared during page release and page invalidation (if there is</div><div class='del'>- * an ordered extent in flight), that is left for the ordered extent completion.</div><div class='del'>- */</div><div class='del'>-#define EXTENT_DELALLOC_NEW	(1U &lt;&lt; 14)</div><div class='del'>-/*</div><div class='del'>- * When an ordered extent successfully completes for a region marked as a new</div><div class='del'>- * delalloc range, use this flag when clearing a new delalloc range to indicate</div><div class='del'>- * that the VFS' inode number of bytes should be incremented and the inode's new</div><div class='del'>- * delalloc bytes decremented, in an atomic way to prevent races with stat(2).</div><div class='del'>- */</div><div class='del'>-#define EXTENT_ADD_INODE_BYTES  (1U &lt;&lt; 15)</div><div class='add'>+enum {</div><div class='add'>+	ENUM_BIT(EXTENT_DIRTY),</div><div class='add'>+	ENUM_BIT(EXTENT_LOCKED),</div><div class='add'>+	ENUM_BIT(EXTENT_DIO_LOCKED),</div><div class='add'>+	ENUM_BIT(EXTENT_DIRTY_LOG1),</div><div class='add'>+	ENUM_BIT(EXTENT_DIRTY_LOG2),</div><div class='add'>+	ENUM_BIT(EXTENT_DELALLOC),</div><div class='add'>+	ENUM_BIT(EXTENT_DEFRAG),</div><div class='add'>+	ENUM_BIT(EXTENT_BOUNDARY),</div><div class='add'>+	ENUM_BIT(EXTENT_NODATASUM),</div><div class='add'>+	ENUM_BIT(EXTENT_CLEAR_META_RESV),</div><div class='add'>+	ENUM_BIT(EXTENT_NEED_WAIT),</div><div class='add'>+	ENUM_BIT(EXTENT_NORESERVE),</div><div class='add'>+	ENUM_BIT(EXTENT_QGROUP_RESERVED),</div><div class='add'>+	ENUM_BIT(EXTENT_CLEAR_DATA_RESV),</div><div class='add'>+	/*</div><div class='add'>+	 * Must be cleared only during ordered extent completion or on error</div><div class='add'>+	 * paths if we did not manage to submit bios and create the ordered</div><div class='add'>+	 * extents for the range.  Should not be cleared during page release</div><div class='add'>+	 * and page invalidation (if there is an ordered extent in flight),</div><div class='add'>+	 * that is left for the ordered extent completion.</div><div class='add'>+	 */</div><div class='add'>+	ENUM_BIT(EXTENT_DELALLOC_NEW),</div><div class='add'>+	/*</div><div class='add'>+	 * Mark that a range is being locked for finishing an ordered extent.</div><div class='add'>+	 * Used together with EXTENT_LOCKED.</div><div class='add'>+	 */</div><div class='add'>+	ENUM_BIT(EXTENT_FINISHING_ORDERED),</div><div class='add'>+	/*</div><div class='add'>+	 * When an ordered extent successfully completes for a region marked as</div><div class='add'>+	 * a new delalloc range, use this flag when clearing a new delalloc</div><div class='add'>+	 * range to indicate that the VFS' inode number of bytes should be</div><div class='add'>+	 * incremented and the inode's new delalloc bytes decremented, in an</div><div class='add'>+	 * atomic way to prevent races with stat(2).</div><div class='add'>+	 */</div><div class='add'>+	ENUM_BIT(EXTENT_ADD_INODE_BYTES),</div><div class='add'>+	/*</div><div class='add'>+	 * Set during truncate when we're clearing an entire range and we just</div><div class='add'>+	 * want the extent states to go away.</div><div class='add'>+	 */</div><div class='add'>+	ENUM_BIT(EXTENT_CLEAR_ALL_BITS),</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This must be last.</div><div class='add'>+	 *</div><div class='add'>+	 * Bit not representing a state but a request for NOWAIT semantics,</div><div class='add'>+	 * e.g. when allocating memory, and must be masked out from the other</div><div class='add'>+	 * bits.</div><div class='add'>+	 */</div><div class='add'>+	ENUM_BIT(EXTENT_NOWAIT)</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> #define EXTENT_DO_ACCOUNTING    (EXTENT_CLEAR_META_RESV | \</div><div class='ctx'> 				 EXTENT_CLEAR_DATA_RESV)</div><div class='ctx'> #define EXTENT_CTLBITS		(EXTENT_DO_ACCOUNTING | \</div><div class='del'>-				 EXTENT_ADD_INODE_BYTES)</div><div class='add'>+				 EXTENT_ADD_INODE_BYTES | \</div><div class='add'>+				 EXTENT_CLEAR_ALL_BITS)</div><div class='add'>+</div><div class='add'>+#define EXTENT_LOCK_BITS	(EXTENT_LOCKED | EXTENT_DIO_LOCKED)</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Redefined bits above which are used only in the device allocation tree,</div><div class='hunk'>@@ -56,7 +91,6 @@ enum {</div><div class='ctx'> 	IO_TREE_FS_EXCLUDED_EXTENTS,</div><div class='ctx'> 	IO_TREE_BTREE_INODE_IO,</div><div class='ctx'> 	IO_TREE_INODE_IO,</div><div class='del'>-	IO_TREE_INODE_IO_FAILURE,</div><div class='ctx'> 	IO_TREE_RELOC_BLOCKS,</div><div class='ctx'> 	IO_TREE_TRANS_DIRTY_PAGES,</div><div class='ctx'> 	IO_TREE_ROOT_DIRTY_LOG_PAGES,</div><div class='hunk'>@@ -68,10 +102,17 @@ enum {</div><div class='ctx'> </div><div class='ctx'> struct extent_io_tree {</div><div class='ctx'> 	struct rb_root state;</div><div class='del'>-	struct btrfs_fs_info *fs_info;</div><div class='del'>-	void *private_data;</div><div class='del'>-	u64 dirty_bytes;</div><div class='del'>-	bool track_uptodate;</div><div class='add'>+	/*</div><div class='add'>+	 * The fs_info is needed for trace points, a tree attached to an inode</div><div class='add'>+	 * needs the inode.</div><div class='add'>+	 *</div><div class='add'>+	 * owner == IO_TREE_INODE_IO - then inode is valid and fs_info can be</div><div class='add'>+	 *                             accessed as inode-&gt;root-&gt;fs_info</div><div class='add'>+	 */</div><div class='add'>+	union {</div><div class='add'>+		struct btrfs_fs_info *fs_info;</div><div class='add'>+		struct btrfs_inode *inode;</div><div class='add'>+	};</div><div class='ctx'> </div><div class='ctx'> 	/* Who owns this io tree, should be one of IO_TREE_* */</div><div class='ctx'> 	u8 owner;</div><div class='hunk'>@@ -89,179 +130,115 @@ struct extent_state {</div><div class='ctx'> 	refcount_t refs;</div><div class='ctx'> 	u32 state;</div><div class='ctx'> </div><div class='del'>-	struct io_failure_record *failrec;</div><div class='del'>-</div><div class='ctx'> #ifdef CONFIG_BTRFS_DEBUG</div><div class='ctx'> 	struct list_head leak_list;</div><div class='ctx'> #endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-int __init extent_state_cache_init(void);</div><div class='del'>-void __cold extent_state_cache_exit(void);</div><div class='del'>-</div><div class='del'>-void extent_io_tree_init(struct btrfs_fs_info *fs_info,</div><div class='del'>-			 struct extent_io_tree *tree, unsigned int owner,</div><div class='del'>-			 void *private_data);</div><div class='del'>-void extent_io_tree_release(struct extent_io_tree *tree);</div><div class='del'>-</div><div class='del'>-int lock_extent_bits(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='del'>-		     struct extent_state **cached);</div><div class='add'>+const struct btrfs_inode *btrfs_extent_io_tree_to_inode(const struct extent_io_tree *tree);</div><div class='add'>+const struct btrfs_fs_info *btrfs_extent_io_tree_to_fs_info(const struct extent_io_tree *tree);</div><div class='ctx'> </div><div class='del'>-static inline int lock_extent(struct extent_io_tree *tree, u64 start, u64 end)</div><div class='del'>-{</div><div class='del'>-	return lock_extent_bits(tree, start, end, NULL);</div><div class='del'>-}</div><div class='add'>+void btrfs_extent_io_tree_init(struct btrfs_fs_info *fs_info,</div><div class='add'>+			       struct extent_io_tree *tree, unsigned int owner);</div><div class='add'>+void btrfs_extent_io_tree_release(struct extent_io_tree *tree);</div><div class='add'>+int btrfs_lock_extent_bits(struct extent_io_tree *tree, u64 start, u64 end, u32 bits,</div><div class='add'>+			   struct extent_state **cached);</div><div class='add'>+bool btrfs_try_lock_extent_bits(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='add'>+				u32 bits, struct extent_state **cached);</div><div class='ctx'> </div><div class='del'>-int try_lock_extent(struct extent_io_tree *tree, u64 start, u64 end);</div><div class='del'>-</div><div class='del'>-int __init extent_io_init(void);</div><div class='del'>-void __cold extent_io_exit(void);</div><div class='del'>-</div><div class='del'>-u64 count_range_bits(struct extent_io_tree *tree,</div><div class='del'>-		     u64 *start, u64 search_end,</div><div class='del'>-		     u64 max_bytes, u32 bits, int contig);</div><div class='del'>-</div><div class='del'>-void free_extent_state(struct extent_state *state);</div><div class='del'>-int test_range_bit(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='del'>-		   u32 bits, int filled, struct extent_state *cached_state);</div><div class='del'>-int clear_record_extent_bits(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='del'>-			     u32 bits, struct extent_changeset *changeset);</div><div class='del'>-int clear_extent_bit(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='del'>-		     u32 bits, int wake, int delete,</div><div class='del'>-		     struct extent_state **cached);</div><div class='del'>-int __clear_extent_bit(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='del'>-		     u32 bits, int wake, int delete,</div><div class='del'>-		     struct extent_state **cached, gfp_t mask,</div><div class='del'>-		     struct extent_changeset *changeset);</div><div class='del'>-</div><div class='del'>-static inline int unlock_extent(struct extent_io_tree *tree, u64 start, u64 end)</div><div class='add'>+static inline int btrfs_lock_extent(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='add'>+				    struct extent_state **cached)</div><div class='ctx'> {</div><div class='del'>-	return clear_extent_bit(tree, start, end, EXTENT_LOCKED, 1, 0, NULL);</div><div class='add'>+	return btrfs_lock_extent_bits(tree, start, end, EXTENT_LOCKED, cached);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int unlock_extent_cached(struct extent_io_tree *tree, u64 start,</div><div class='del'>-		u64 end, struct extent_state **cached)</div><div class='add'>+static inline bool btrfs_try_lock_extent(struct extent_io_tree *tree, u64 start,</div><div class='add'>+					 u64 end, struct extent_state **cached)</div><div class='ctx'> {</div><div class='del'>-	return __clear_extent_bit(tree, start, end, EXTENT_LOCKED, 1, 0, cached,</div><div class='del'>-				GFP_NOFS, NULL);</div><div class='add'>+	return btrfs_try_lock_extent_bits(tree, start, end, EXTENT_LOCKED, cached);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int unlock_extent_cached_atomic(struct extent_io_tree *tree,</div><div class='del'>-		u64 start, u64 end, struct extent_state **cached)</div><div class='del'>-{</div><div class='del'>-	return __clear_extent_bit(tree, start, end, EXTENT_LOCKED, 1, 0, cached,</div><div class='del'>-				GFP_ATOMIC, NULL);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline int clear_extent_bits(struct extent_io_tree *tree, u64 start,</div><div class='del'>-				    u64 end, u32 bits)</div><div class='del'>-{</div><div class='del'>-	int wake = 0;</div><div class='add'>+int __init btrfs_extent_state_init_cachep(void);</div><div class='add'>+void __cold btrfs_extent_state_free_cachep(void);</div><div class='ctx'> </div><div class='del'>-	if (bits &amp; EXTENT_LOCKED)</div><div class='del'>-		wake = 1;</div><div class='add'>+u64 btrfs_count_range_bits(struct extent_io_tree *tree,</div><div class='add'>+			   u64 *start, u64 search_end,</div><div class='add'>+			   u64 max_bytes, u32 bits, bool contig,</div><div class='add'>+			   struct extent_state **cached_state);</div><div class='ctx'> </div><div class='del'>-	return clear_extent_bit(tree, start, end, bits, wake, 0, NULL);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int set_record_extent_bits(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='del'>-			   u32 bits, struct extent_changeset *changeset);</div><div class='del'>-int set_extent_bit(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='del'>-		   u32 bits, unsigned exclusive_bits, u64 *failed_start,</div><div class='del'>-		   struct extent_state **cached_state, gfp_t mask,</div><div class='del'>-		   struct extent_changeset *changeset);</div><div class='del'>-int set_extent_bits_nowait(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='del'>-			   u32 bits);</div><div class='del'>-</div><div class='del'>-static inline int set_extent_bits(struct extent_io_tree *tree, u64 start,</div><div class='del'>-		u64 end, u32 bits)</div><div class='del'>-{</div><div class='del'>-	return set_extent_bit(tree, start, end, bits, 0, NULL, NULL, GFP_NOFS,</div><div class='del'>-			      NULL);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline int clear_extent_uptodate(struct extent_io_tree *tree, u64 start,</div><div class='del'>-		u64 end, struct extent_state **cached_state)</div><div class='del'>-{</div><div class='del'>-	return __clear_extent_bit(tree, start, end, EXTENT_UPTODATE, 0, 0,</div><div class='del'>-				cached_state, GFP_NOFS, NULL);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline int set_extent_dirty(struct extent_io_tree *tree, u64 start,</div><div class='del'>-		u64 end, gfp_t mask)</div><div class='add'>+void btrfs_free_extent_state(struct extent_state *state);</div><div class='add'>+bool btrfs_test_range_bit(struct extent_io_tree *tree, u64 start, u64 end, u32 bit,</div><div class='add'>+			  struct extent_state *cached_state);</div><div class='add'>+bool btrfs_test_range_bit_exists(struct extent_io_tree *tree, u64 start, u64 end, u32 bit);</div><div class='add'>+void btrfs_get_range_bits(struct extent_io_tree *tree, u64 start, u64 end, u32 *bits,</div><div class='add'>+			  struct extent_state **cached_state);</div><div class='add'>+int btrfs_clear_record_extent_bits(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='add'>+				   u32 bits, struct extent_changeset *changeset);</div><div class='add'>+int btrfs_clear_extent_bit_changeset(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='add'>+				     u32 bits, struct extent_state **cached,</div><div class='add'>+				     struct extent_changeset *changeset);</div><div class='add'>+</div><div class='add'>+static inline int btrfs_clear_extent_bit(struct extent_io_tree *tree, u64 start,</div><div class='add'>+					 u64 end, u32 bits,</div><div class='add'>+					 struct extent_state **cached)</div><div class='ctx'> {</div><div class='del'>-	return set_extent_bit(tree, start, end, EXTENT_DIRTY, 0, NULL, NULL,</div><div class='del'>-			      mask, NULL);</div><div class='add'>+	return btrfs_clear_extent_bit_changeset(tree, start, end, bits, cached, NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int clear_extent_dirty(struct extent_io_tree *tree, u64 start,</div><div class='del'>-				     u64 end, struct extent_state **cached)</div><div class='add'>+static inline int btrfs_unlock_extent(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='add'>+				      struct extent_state **cached)</div><div class='ctx'> {</div><div class='del'>-	return clear_extent_bit(tree, start, end,</div><div class='del'>-				EXTENT_DIRTY | EXTENT_DELALLOC |</div><div class='del'>-				EXTENT_DO_ACCOUNTING, 0, 0, cached);</div><div class='add'>+	return btrfs_clear_extent_bit_changeset(tree, start, end, EXTENT_LOCKED,</div><div class='add'>+						cached, NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int convert_extent_bit(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='del'>-		       u32 bits, u32 clear_bits,</div><div class='del'>-		       struct extent_state **cached_state);</div><div class='add'>+int btrfs_set_record_extent_bits(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='add'>+				 u32 bits, struct extent_changeset *changeset);</div><div class='add'>+int btrfs_set_extent_bit(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='add'>+			 u32 bits, struct extent_state **cached_state);</div><div class='ctx'> </div><div class='del'>-static inline int set_extent_delalloc(struct extent_io_tree *tree, u64 start,</div><div class='del'>-				      u64 end, u32 extra_bits,</div><div class='del'>-				      struct extent_state **cached_state)</div><div class='add'>+static inline int btrfs_clear_extent_dirty(struct extent_io_tree *tree, u64 start,</div><div class='add'>+					   u64 end, struct extent_state **cached)</div><div class='ctx'> {</div><div class='del'>-	return set_extent_bit(tree, start, end,</div><div class='del'>-			      EXTENT_DELALLOC | EXTENT_UPTODATE | extra_bits,</div><div class='del'>-			      0, NULL, cached_state, GFP_NOFS, NULL);</div><div class='add'>+	return btrfs_clear_extent_bit(tree, start, end,</div><div class='add'>+				      EXTENT_DIRTY | EXTENT_DELALLOC |</div><div class='add'>+				      EXTENT_DO_ACCOUNTING, cached);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int set_extent_defrag(struct extent_io_tree *tree, u64 start,</div><div class='del'>-		u64 end, struct extent_state **cached_state)</div><div class='add'>+int btrfs_convert_extent_bit(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='add'>+			     u32 bits, u32 clear_bits,</div><div class='add'>+			     struct extent_state **cached_state);</div><div class='add'>+</div><div class='add'>+bool btrfs_find_first_extent_bit(struct extent_io_tree *tree, u64 start,</div><div class='add'>+				 u64 *start_ret, u64 *end_ret, u32 bits,</div><div class='add'>+				 struct extent_state **cached_state);</div><div class='add'>+void btrfs_find_first_clear_extent_bit(struct extent_io_tree *tree, u64 start,</div><div class='add'>+				       u64 *start_ret, u64 *end_ret, u32 bits);</div><div class='add'>+bool btrfs_find_contiguous_extent_bit(struct extent_io_tree *tree, u64 start,</div><div class='add'>+				      u64 *start_ret, u64 *end_ret, u32 bits);</div><div class='add'>+bool btrfs_find_delalloc_range(struct extent_io_tree *tree, u64 *start,</div><div class='add'>+			       u64 *end, u64 max_bytes,</div><div class='add'>+			       struct extent_state **cached_state);</div><div class='add'>+static inline int btrfs_lock_dio_extent(struct extent_io_tree *tree, u64 start,</div><div class='add'>+					u64 end, struct extent_state **cached)</div><div class='ctx'> {</div><div class='del'>-	return set_extent_bit(tree, start, end,</div><div class='del'>-			      EXTENT_DELALLOC | EXTENT_UPTODATE | EXTENT_DEFRAG,</div><div class='del'>-			      0, NULL, cached_state, GFP_NOFS, NULL);</div><div class='add'>+	return btrfs_lock_extent_bits(tree, start, end, EXTENT_DIO_LOCKED, cached);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int set_extent_new(struct extent_io_tree *tree, u64 start,</div><div class='del'>-		u64 end)</div><div class='add'>+static inline bool btrfs_try_lock_dio_extent(struct extent_io_tree *tree, u64 start,</div><div class='add'>+					     u64 end, struct extent_state **cached)</div><div class='ctx'> {</div><div class='del'>-	return set_extent_bit(tree, start, end, EXTENT_NEW, 0, NULL, NULL,</div><div class='del'>-			      GFP_NOFS, NULL);</div><div class='add'>+	return btrfs_try_lock_extent_bits(tree, start, end, EXTENT_DIO_LOCKED, cached);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int set_extent_uptodate(struct extent_io_tree *tree, u64 start,</div><div class='del'>-		u64 end, struct extent_state **cached_state, gfp_t mask)</div><div class='add'>+static inline int btrfs_unlock_dio_extent(struct extent_io_tree *tree, u64 start,</div><div class='add'>+					  u64 end, struct extent_state **cached)</div><div class='ctx'> {</div><div class='del'>-	return set_extent_bit(tree, start, end, EXTENT_UPTODATE, 0, NULL,</div><div class='del'>-			      cached_state, mask, NULL);</div><div class='add'>+	return btrfs_clear_extent_bit_changeset(tree, start, end, EXTENT_DIO_LOCKED,</div><div class='add'>+						cached, NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int find_first_extent_bit(struct extent_io_tree *tree, u64 start,</div><div class='del'>-			  u64 *start_ret, u64 *end_ret, u32 bits,</div><div class='del'>-			  struct extent_state **cached_state);</div><div class='del'>-void find_first_clear_extent_bit(struct extent_io_tree *tree, u64 start,</div><div class='del'>-				 u64 *start_ret, u64 *end_ret, u32 bits);</div><div class='del'>-int find_contiguous_extent_bit(struct extent_io_tree *tree, u64 start,</div><div class='del'>-			       u64 *start_ret, u64 *end_ret, u32 bits);</div><div class='del'>-int extent_invalidatepage(struct extent_io_tree *tree,</div><div class='del'>-			  struct page *page, unsigned long offset);</div><div class='del'>-bool btrfs_find_delalloc_range(struct extent_io_tree *tree, u64 *start,</div><div class='del'>-			       u64 *end, u64 max_bytes,</div><div class='del'>-			       struct extent_state **cached_state);</div><div class='del'>-</div><div class='del'>-/* This should be reworked in the future and put elsewhere. */</div><div class='del'>-struct io_failure_record *get_state_failrec(struct extent_io_tree *tree, u64 start);</div><div class='del'>-int set_state_failrec(struct extent_io_tree *tree, u64 start,</div><div class='del'>-		      struct io_failure_record *failrec);</div><div class='del'>-void btrfs_free_io_failure_record(struct btrfs_inode *inode, u64 start,</div><div class='del'>-		u64 end);</div><div class='del'>-int free_io_failure(struct extent_io_tree *failure_tree,</div><div class='del'>-		    struct extent_io_tree *io_tree,</div><div class='del'>-		    struct io_failure_record *rec);</div><div class='del'>-int clean_io_failure(struct btrfs_fs_info *fs_info,</div><div class='del'>-		     struct extent_io_tree *failure_tree,</div><div class='del'>-		     struct extent_io_tree *io_tree, u64 start,</div><div class='del'>-		     struct page *page, u64 ino, unsigned int pg_offset);</div><div class='add'>+struct extent_state *btrfs_next_extent_state(struct extent_io_tree *tree,</div><div class='add'>+					     struct extent_state *state);</div><div class='ctx'> </div><div class='ctx'> #endif /* BTRFS_EXTENT_IO_TREE_H */</div><div class='head'>diff --git a/fs/btrfs/extent-tree.c b/fs/btrfs/extent-tree.c<br/>index 3fd736a02c1e..e4cae34620d1 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/extent-tree.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/extent-tree.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/extent-tree.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/extent-tree.c</a></div><div class='hunk'>@@ -16,8 +16,9 @@</div><div class='ctx'> #include &lt;linux/percpu_counter.h&gt;</div><div class='ctx'> #include &lt;linux/lockdep.h&gt;</div><div class='ctx'> #include &lt;linux/crc32c.h&gt;</div><div class='del'>-#include "misc.h"</div><div class='del'>-#include "tree-log.h"</div><div class='add'>+#include "ctree.h"</div><div class='add'>+#include "extent-tree.h"</div><div class='add'>+#include "transaction.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='ctx'> #include "print-tree.h"</div><div class='ctx'> #include "volumes.h"</div><div class='hunk'>@@ -25,25 +26,28 @@</div><div class='ctx'> #include "locking.h"</div><div class='ctx'> #include "free-space-cache.h"</div><div class='ctx'> #include "free-space-tree.h"</div><div class='del'>-#include "sysfs.h"</div><div class='ctx'> #include "qgroup.h"</div><div class='ctx'> #include "ref-verify.h"</div><div class='ctx'> #include "space-info.h"</div><div class='ctx'> #include "block-rsv.h"</div><div class='del'>-#include "delalloc-space.h"</div><div class='del'>-#include "block-group.h"</div><div class='ctx'> #include "discard.h"</div><div class='del'>-#include "rcu-string.h"</div><div class='ctx'> #include "zoned.h"</div><div class='ctx'> #include "dev-replace.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "root-tree.h"</div><div class='add'>+#include "file-item.h"</div><div class='add'>+#include "orphan.h"</div><div class='add'>+#include "tree-checker.h"</div><div class='add'>+#include "raid-stripe-tree.h"</div><div class='add'>+#include "delayed-inode.h"</div><div class='ctx'> </div><div class='ctx'> #undef SCRAMBLE_DELAYED_REFS</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> static int __btrfs_free_extent(struct btrfs_trans_handle *trans,</div><div class='del'>-			       struct btrfs_delayed_ref_node *node, u64 parent,</div><div class='del'>-			       u64 root_objectid, u64 owner_objectid,</div><div class='del'>-			       u64 owner_offset, int refs_to_drop,</div><div class='add'>+			       struct btrfs_delayed_ref_head *href,</div><div class='add'>+			       const struct btrfs_delayed_ref_node *node,</div><div class='ctx'> 			       struct btrfs_delayed_extent_op *extra_op);</div><div class='ctx'> static void __run_delayed_extent_op(struct btrfs_delayed_extent_op *extent_op,</div><div class='ctx'> 				    struct extent_buffer *leaf,</div><div class='hunk'>@@ -51,56 +55,33 @@ static void __run_delayed_extent_op(struct btrfs_delayed_extent_op *extent_op,</div><div class='ctx'> static int alloc_reserved_file_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				      u64 parent, u64 root_objectid,</div><div class='ctx'> 				      u64 flags, u64 owner, u64 offset,</div><div class='del'>-				      struct btrfs_key *ins, int ref_mod);</div><div class='add'>+				      struct btrfs_key *ins, int ref_mod, u64 oref_root);</div><div class='ctx'> static int alloc_reserved_tree_block(struct btrfs_trans_handle *trans,</div><div class='del'>-				     struct btrfs_delayed_ref_node *node,</div><div class='add'>+				     const struct btrfs_delayed_ref_node *node,</div><div class='ctx'> 				     struct btrfs_delayed_extent_op *extent_op);</div><div class='del'>-static int find_next_key(struct btrfs_path *path, int level,</div><div class='add'>+static int find_next_key(const struct btrfs_path *path, int level,</div><div class='ctx'> 			 struct btrfs_key *key);</div><div class='ctx'> </div><div class='del'>-static int block_group_bits(struct btrfs_block_group *cache, u64 bits)</div><div class='add'>+static int block_group_bits(const struct btrfs_block_group *cache, u64 bits)</div><div class='ctx'> {</div><div class='ctx'> 	return (cache-&gt;flags &amp; bits) == bits;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_add_excluded_extent(struct btrfs_fs_info *fs_info,</div><div class='del'>-			      u64 start, u64 num_bytes)</div><div class='del'>-{</div><div class='del'>-	u64 end = start + num_bytes - 1;</div><div class='del'>-	set_extent_bits(&amp;fs_info-&gt;excluded_extents, start, end,</div><div class='del'>-			EXTENT_UPTODATE);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void btrfs_free_excluded_extents(struct btrfs_block_group *cache)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = cache-&gt;fs_info;</div><div class='del'>-	u64 start, end;</div><div class='del'>-</div><div class='del'>-	start = cache-&gt;start;</div><div class='del'>-	end = start + cache-&gt;length - 1;</div><div class='del'>-</div><div class='del'>-	clear_extent_bits(&amp;fs_info-&gt;excluded_extents, start, end,</div><div class='del'>-			  EXTENT_UPTODATE);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /* simple helper to search for an existing data extent at a given offset */</div><div class='ctx'> int btrfs_lookup_data_extent(struct btrfs_fs_info *fs_info, u64 start, u64 len)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='add'>+	struct btrfs_root *root = btrfs_extent_root(fs_info, start);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = start;</div><div class='del'>-	key.offset = len;</div><div class='ctx'> 	key.type = BTRFS_EXTENT_ITEM_KEY;</div><div class='del'>-	ret = btrfs_search_slot(NULL, fs_info-&gt;extent_root, &amp;key, path, 0, 0);</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	key.offset = len;</div><div class='add'>+	return btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -114,17 +95,17 @@ int btrfs_lookup_data_extent(struct btrfs_fs_info *fs_info, u64 start, u64 len)</div><div class='ctx'>  */</div><div class='ctx'> int btrfs_lookup_extent_info(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			     struct btrfs_fs_info *fs_info, u64 bytenr,</div><div class='del'>-			     u64 offset, int metadata, u64 *refs, u64 *flags)</div><div class='add'>+			     u64 offset, int metadata, u64 *refs, u64 *flags,</div><div class='add'>+			     u64 *owning_root)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_root *extent_root;</div><div class='ctx'> 	struct btrfs_delayed_ref_head *head;</div><div class='ctx'> 	struct btrfs_delayed_ref_root *delayed_refs;</div><div class='del'>-	struct btrfs_path *path;</div><div class='del'>-	struct btrfs_extent_item *ei;</div><div class='del'>-	struct extent_buffer *leaf;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='del'>-	u32 item_size;</div><div class='ctx'> 	u64 num_refs;</div><div class='ctx'> 	u64 extent_flags;</div><div class='add'>+	u64 owner = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -140,24 +121,20 @@ int btrfs_lookup_extent_info(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	if (!trans) {</div><div class='del'>-		path-&gt;skip_locking = 1;</div><div class='del'>-		path-&gt;search_commit_root = 1;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> search_again:</div><div class='ctx'> 	key.objectid = bytenr;</div><div class='del'>-	key.offset = offset;</div><div class='ctx'> 	if (metadata)</div><div class='ctx'> 		key.type = BTRFS_METADATA_ITEM_KEY;</div><div class='ctx'> 	else</div><div class='ctx'> 		key.type = BTRFS_EXTENT_ITEM_KEY;</div><div class='add'>+	key.offset = offset;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_search_slot(NULL, fs_info-&gt;extent_root, &amp;key, path, 0, 0);</div><div class='add'>+	extent_root = btrfs_extent_root(fs_info, bytenr);</div><div class='add'>+	ret = btrfs_search_slot(NULL, extent_root, &amp;key, path, 0, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out_free;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	if (ret &gt; 0 &amp;&amp; metadata &amp;&amp; key.type == BTRFS_METADATA_ITEM_KEY) {</div><div class='add'>+	if (ret &gt; 0 &amp;&amp; key.type == BTRFS_METADATA_ITEM_KEY) {</div><div class='ctx'> 		if (path-&gt;slots[0]) {</div><div class='ctx'> 			path-&gt;slots[0]--;</div><div class='ctx'> 			btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key,</div><div class='hunk'>@@ -170,37 +147,40 @@ search_again:</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (ret == 0) {</div><div class='del'>-		leaf = path-&gt;nodes[0];</div><div class='del'>-		item_size = btrfs_item_size_nr(leaf, path-&gt;slots[0]);</div><div class='del'>-		if (item_size &gt;= sizeof(*ei)) {</div><div class='del'>-			ei = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='del'>-					    struct btrfs_extent_item);</div><div class='del'>-			num_refs = btrfs_extent_refs(leaf, ei);</div><div class='del'>-			extent_flags = btrfs_extent_flags(leaf, ei);</div><div class='del'>-		} else {</div><div class='del'>-			ret = -EINVAL;</div><div class='del'>-			btrfs_print_v0_err(fs_info);</div><div class='del'>-			if (trans)</div><div class='del'>-				btrfs_abort_transaction(trans, ret);</div><div class='del'>-			else</div><div class='del'>-				btrfs_handle_fs_error(fs_info, ret, NULL);</div><div class='add'>+		struct extent_buffer *leaf = path-&gt;nodes[0];</div><div class='add'>+		struct btrfs_extent_item *ei;</div><div class='add'>+		const u32 item_size = btrfs_item_size(leaf, path-&gt;slots[0]);</div><div class='ctx'> </div><div class='del'>-			goto out_free;</div><div class='add'>+		if (unlikely(item_size &lt; sizeof(*ei))) {</div><div class='add'>+			ret = -EUCLEAN;</div><div class='add'>+			btrfs_err(fs_info,</div><div class='add'>+			"unexpected extent item size, has %u expect &gt;= %zu",</div><div class='add'>+				  item_size, sizeof(*ei));</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			return ret;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		BUG_ON(num_refs == 0);</div><div class='add'>+		ei = btrfs_item_ptr(leaf, path-&gt;slots[0], struct btrfs_extent_item);</div><div class='add'>+		num_refs = btrfs_extent_refs(leaf, ei);</div><div class='add'>+		if (unlikely(num_refs == 0)) {</div><div class='add'>+			ret = -EUCLEAN;</div><div class='add'>+			btrfs_err(fs_info,</div><div class='add'>+		"unexpected zero reference count for extent item " BTRFS_KEY_FMT,</div><div class='add'>+				  BTRFS_KEY_FMT_VALUE(&amp;key));</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='add'>+		extent_flags = btrfs_extent_flags(leaf, ei);</div><div class='add'>+		owner = btrfs_get_extent_owner_root(fs_info, leaf, path-&gt;slots[0]);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		num_refs = 0;</div><div class='ctx'> 		extent_flags = 0;</div><div class='ctx'> 		ret = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!trans)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='ctx'> 	delayed_refs = &amp;trans-&gt;transaction-&gt;delayed_refs;</div><div class='ctx'> 	spin_lock(&amp;delayed_refs-&gt;lock);</div><div class='del'>-	head = btrfs_find_delayed_ref_head(delayed_refs, bytenr);</div><div class='add'>+	head = btrfs_find_delayed_ref_head(fs_info, delayed_refs, bytenr);</div><div class='ctx'> 	if (head) {</div><div class='ctx'> 		if (!mutex_trylock(&amp;head-&gt;mutex)) {</div><div class='ctx'> 			refcount_inc(&amp;head-&gt;refs);</div><div class='hunk'>@@ -220,22 +200,21 @@ search_again:</div><div class='ctx'> 		spin_lock(&amp;head-&gt;lock);</div><div class='ctx'> 		if (head-&gt;extent_op &amp;&amp; head-&gt;extent_op-&gt;update_flags)</div><div class='ctx'> 			extent_flags |= head-&gt;extent_op-&gt;flags_to_set;</div><div class='del'>-		else</div><div class='del'>-			BUG_ON(num_refs == 0);</div><div class='ctx'> </div><div class='ctx'> 		num_refs += head-&gt;ref_mod;</div><div class='ctx'> 		spin_unlock(&amp;head-&gt;lock);</div><div class='ctx'> 		mutex_unlock(&amp;head-&gt;mutex);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='del'>-out:</div><div class='add'>+</div><div class='ctx'> 	WARN_ON(num_refs == 0);</div><div class='ctx'> 	if (refs)</div><div class='ctx'> 		*refs = num_refs;</div><div class='ctx'> 	if (flags)</div><div class='ctx'> 		*flags = extent_flags;</div><div class='del'>-out_free:</div><div class='del'>-	btrfs_free_path(path);</div><div class='add'>+	if (owning_root)</div><div class='add'>+		*owning_root = owner;</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -347,16 +326,22 @@ out_free:</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * is_data == BTRFS_REF_TYPE_BLOCK, tree block type is required,</div><div class='del'>- * is_data == BTRFS_REF_TYPE_DATA, data type is requiried,</div><div class='add'>+ * is_data == BTRFS_REF_TYPE_DATA, data type is required,</div><div class='ctx'>  * is_data == BTRFS_REF_TYPE_ANY, either type is OK.</div><div class='ctx'>  */</div><div class='ctx'> int btrfs_get_extent_inline_ref_type(const struct extent_buffer *eb,</div><div class='del'>-				     struct btrfs_extent_inline_ref *iref,</div><div class='add'>+				     const struct btrfs_extent_inline_ref *iref,</div><div class='ctx'> 				     enum btrfs_inline_ref_type is_data)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='ctx'> 	int type = btrfs_extent_inline_ref_type(eb, iref);</div><div class='ctx'> 	u64 offset = btrfs_extent_inline_ref_offset(eb, iref);</div><div class='ctx'> </div><div class='add'>+	if (type == BTRFS_EXTENT_OWNER_REF_KEY) {</div><div class='add'>+		ASSERT(btrfs_fs_incompat(fs_info, SIMPLE_QUOTA));</div><div class='add'>+		return type;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (type == BTRFS_TREE_BLOCK_REF_KEY ||</div><div class='ctx'> 	    type == BTRFS_SHARED_BLOCK_REF_KEY ||</div><div class='ctx'> 	    type == BTRFS_SHARED_DATA_REF_KEY ||</div><div class='hunk'>@@ -365,26 +350,25 @@ int btrfs_get_extent_inline_ref_type(const struct extent_buffer *eb,</div><div class='ctx'> 			if (type == BTRFS_TREE_BLOCK_REF_KEY)</div><div class='ctx'> 				return type;</div><div class='ctx'> 			if (type == BTRFS_SHARED_BLOCK_REF_KEY) {</div><div class='del'>-				ASSERT(eb-&gt;fs_info);</div><div class='add'>+				ASSERT(fs_info);</div><div class='ctx'> 				/*</div><div class='ctx'> 				 * Every shared one has parent tree block,</div><div class='ctx'> 				 * which must be aligned to sector size.</div><div class='ctx'> 				 */</div><div class='del'>-				if (offset &amp;&amp;</div><div class='del'>-				    IS_ALIGNED(offset, eb-&gt;fs_info-&gt;sectorsize))</div><div class='add'>+				if (offset &amp;&amp; IS_ALIGNED(offset, fs_info-&gt;sectorsize))</div><div class='ctx'> 					return type;</div><div class='ctx'> 			}</div><div class='ctx'> 		} else if (is_data == BTRFS_REF_TYPE_DATA) {</div><div class='ctx'> 			if (type == BTRFS_EXTENT_DATA_REF_KEY)</div><div class='ctx'> 				return type;</div><div class='ctx'> 			if (type == BTRFS_SHARED_DATA_REF_KEY) {</div><div class='del'>-				ASSERT(eb-&gt;fs_info);</div><div class='add'>+				ASSERT(fs_info);</div><div class='ctx'> 				/*</div><div class='ctx'> 				 * Every shared one has parent tree block,</div><div class='ctx'> 				 * which must be aligned to sector size.</div><div class='ctx'> 				 */</div><div class='ctx'> 				if (offset &amp;&amp;</div><div class='del'>-				    IS_ALIGNED(offset, eb-&gt;fs_info-&gt;sectorsize))</div><div class='add'>+				    IS_ALIGNED(offset, fs_info-&gt;sectorsize))</div><div class='ctx'> 					return type;</div><div class='ctx'> 			}</div><div class='ctx'> 		} else {</div><div class='hunk'>@@ -393,11 +377,11 @@ int btrfs_get_extent_inline_ref_type(const struct extent_buffer *eb,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_print_leaf((struct extent_buffer *)eb);</div><div class='del'>-	btrfs_err(eb-&gt;fs_info,</div><div class='add'>+	WARN_ON(1);</div><div class='add'>+	btrfs_print_leaf(eb);</div><div class='add'>+	btrfs_err(fs_info,</div><div class='ctx'> 		  "eb %llu iref 0x%lx invalid extent inline ref type %d",</div><div class='ctx'> 		  eb-&gt;start, (unsigned long)iref, type);</div><div class='del'>-	WARN_ON(1);</div><div class='ctx'> </div><div class='ctx'> 	return BTRFS_REF_TYPE_INVALID;</div><div class='ctx'> }</div><div class='hunk'>@@ -409,32 +393,32 @@ u64 hash_extent_data_ref(u64 root_objectid, u64 owner, u64 offset)</div><div class='ctx'> 	__le64 lenum;</div><div class='ctx'> </div><div class='ctx'> 	lenum = cpu_to_le64(root_objectid);</div><div class='del'>-	high_crc = btrfs_crc32c(high_crc, &amp;lenum, sizeof(lenum));</div><div class='add'>+	high_crc = crc32c(high_crc, &amp;lenum, sizeof(lenum));</div><div class='ctx'> 	lenum = cpu_to_le64(owner);</div><div class='del'>-	low_crc = btrfs_crc32c(low_crc, &amp;lenum, sizeof(lenum));</div><div class='add'>+	low_crc = crc32c(low_crc, &amp;lenum, sizeof(lenum));</div><div class='ctx'> 	lenum = cpu_to_le64(offset);</div><div class='del'>-	low_crc = btrfs_crc32c(low_crc, &amp;lenum, sizeof(lenum));</div><div class='add'>+	low_crc = crc32c(low_crc, &amp;lenum, sizeof(lenum));</div><div class='ctx'> </div><div class='ctx'> 	return ((u64)high_crc &lt;&lt; 31) ^ (u64)low_crc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static u64 hash_extent_data_ref_item(struct extent_buffer *leaf,</div><div class='del'>-				     struct btrfs_extent_data_ref *ref)</div><div class='add'>+static u64 hash_extent_data_ref_item(const struct extent_buffer *leaf,</div><div class='add'>+				     const struct btrfs_extent_data_ref *ref)</div><div class='ctx'> {</div><div class='ctx'> 	return hash_extent_data_ref(btrfs_extent_data_ref_root(leaf, ref),</div><div class='ctx'> 				    btrfs_extent_data_ref_objectid(leaf, ref),</div><div class='ctx'> 				    btrfs_extent_data_ref_offset(leaf, ref));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int match_extent_data_ref(struct extent_buffer *leaf,</div><div class='del'>-				 struct btrfs_extent_data_ref *ref,</div><div class='del'>-				 u64 root_objectid, u64 owner, u64 offset)</div><div class='add'>+static bool match_extent_data_ref(const struct extent_buffer *leaf,</div><div class='add'>+				  const struct btrfs_extent_data_ref *ref,</div><div class='add'>+				  u64 root_objectid, u64 owner, u64 offset)</div><div class='ctx'> {</div><div class='ctx'> 	if (btrfs_extent_data_ref_root(leaf, ref) != root_objectid ||</div><div class='ctx'> 	    btrfs_extent_data_ref_objectid(leaf, ref) != owner ||</div><div class='ctx'> 	    btrfs_extent_data_ref_offset(leaf, ref) != offset)</div><div class='del'>-		return 0;</div><div class='del'>-	return 1;</div><div class='add'>+		return false;</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static noinline int lookup_extent_data_ref(struct btrfs_trans_handle *trans,</div><div class='hunk'>@@ -443,14 +427,13 @@ static noinline int lookup_extent_data_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 					   u64 root_objectid,</div><div class='ctx'> 					   u64 owner, u64 offset)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *root = trans-&gt;fs_info-&gt;extent_root;</div><div class='add'>+	struct btrfs_root *root = btrfs_extent_root(trans-&gt;fs_info, bytenr);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_extent_data_ref *ref;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	u32 nritems;</div><div class='del'>-	int ret;</div><div class='ctx'> 	int recow;</div><div class='del'>-	int err = -ENOENT;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = bytenr;</div><div class='ctx'> 	if (parent) {</div><div class='hunk'>@@ -464,26 +447,26 @@ static noinline int lookup_extent_data_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> again:</div><div class='ctx'> 	recow = 0;</div><div class='ctx'> 	ret = btrfs_search_slot(trans, root, &amp;key, path, -1, 1);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		err = ret;</div><div class='del'>-		goto fail;</div><div class='del'>-	}</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	if (parent) {</div><div class='del'>-		if (!ret)</div><div class='del'>-			return 0;</div><div class='del'>-		goto fail;</div><div class='add'>+		if (ret)</div><div class='add'>+			return -ENOENT;</div><div class='add'>+		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	ret = -ENOENT;</div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	nritems = btrfs_header_nritems(leaf);</div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		if (path-&gt;slots[0] &gt;= nritems) {</div><div class='ctx'> 			ret = btrfs_next_leaf(root, path);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				err = ret;</div><div class='del'>-			if (ret)</div><div class='del'>-				goto fail;</div><div class='add'>+			if (ret) {</div><div class='add'>+				if (ret &gt; 0)</div><div class='add'>+					return -ENOENT;</div><div class='add'>+				return ret;</div><div class='add'>+			}</div><div class='ctx'> </div><div class='ctx'> 			leaf = path-&gt;nodes[0];</div><div class='ctx'> 			nritems = btrfs_header_nritems(leaf);</div><div class='hunk'>@@ -504,37 +487,37 @@ again:</div><div class='ctx'> 				btrfs_release_path(path);</div><div class='ctx'> 				goto again;</div><div class='ctx'> 			}</div><div class='del'>-			err = 0;</div><div class='add'>+			ret = 0;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 		path-&gt;slots[0]++;</div><div class='ctx'> 	}</div><div class='ctx'> fail:</div><div class='del'>-	return err;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static noinline int insert_extent_data_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 					   struct btrfs_path *path,</div><div class='del'>-					   u64 bytenr, u64 parent,</div><div class='del'>-					   u64 root_objectid, u64 owner,</div><div class='del'>-					   u64 offset, int refs_to_add)</div><div class='add'>+					   const struct btrfs_delayed_ref_node *node,</div><div class='add'>+					   u64 bytenr)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *root = trans-&gt;fs_info-&gt;extent_root;</div><div class='add'>+	struct btrfs_root *root = btrfs_extent_root(trans-&gt;fs_info, bytenr);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='add'>+	u64 owner = btrfs_delayed_ref_owner(node);</div><div class='add'>+	u64 offset = btrfs_delayed_ref_offset(node);</div><div class='ctx'> 	u32 size;</div><div class='ctx'> 	u32 num_refs;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = bytenr;</div><div class='del'>-	if (parent) {</div><div class='add'>+	if (node-&gt;parent) {</div><div class='ctx'> 		key.type = BTRFS_SHARED_DATA_REF_KEY;</div><div class='del'>-		key.offset = parent;</div><div class='add'>+		key.offset = node-&gt;parent;</div><div class='ctx'> 		size = sizeof(struct btrfs_shared_data_ref);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		key.type = BTRFS_EXTENT_DATA_REF_KEY;</div><div class='del'>-		key.offset = hash_extent_data_ref(root_objectid,</div><div class='del'>-						  owner, offset);</div><div class='add'>+		key.offset = hash_extent_data_ref(node-&gt;ref_root, owner, offset);</div><div class='ctx'> 		size = sizeof(struct btrfs_extent_data_ref);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -543,15 +526,15 @@ static noinline int insert_extent_data_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		goto fail;</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='del'>-	if (parent) {</div><div class='add'>+	if (node-&gt;parent) {</div><div class='ctx'> 		struct btrfs_shared_data_ref *ref;</div><div class='ctx'> 		ref = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='ctx'> 				     struct btrfs_shared_data_ref);</div><div class='ctx'> 		if (ret == 0) {</div><div class='del'>-			btrfs_set_shared_data_ref_count(leaf, ref, refs_to_add);</div><div class='add'>+			btrfs_set_shared_data_ref_count(leaf, ref, node-&gt;ref_mod);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			num_refs = btrfs_shared_data_ref_count(leaf, ref);</div><div class='del'>-			num_refs += refs_to_add;</div><div class='add'>+			num_refs += node-&gt;ref_mod;</div><div class='ctx'> 			btrfs_set_shared_data_ref_count(leaf, ref, num_refs);</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -559,7 +542,7 @@ static noinline int insert_extent_data_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		while (ret == -EEXIST) {</div><div class='ctx'> 			ref = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='ctx'> 					     struct btrfs_extent_data_ref);</div><div class='del'>-			if (match_extent_data_ref(leaf, ref, root_objectid,</div><div class='add'>+			if (match_extent_data_ref(leaf, ref, node-&gt;ref_root,</div><div class='ctx'> 						  owner, offset))</div><div class='ctx'> 				break;</div><div class='ctx'> 			btrfs_release_path(path);</div><div class='hunk'>@@ -574,18 +557,16 @@ static noinline int insert_extent_data_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		ref = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='ctx'> 				     struct btrfs_extent_data_ref);</div><div class='ctx'> 		if (ret == 0) {</div><div class='del'>-			btrfs_set_extent_data_ref_root(leaf, ref,</div><div class='del'>-						       root_objectid);</div><div class='add'>+			btrfs_set_extent_data_ref_root(leaf, ref, node-&gt;ref_root);</div><div class='ctx'> 			btrfs_set_extent_data_ref_objectid(leaf, ref, owner);</div><div class='ctx'> 			btrfs_set_extent_data_ref_offset(leaf, ref, offset);</div><div class='del'>-			btrfs_set_extent_data_ref_count(leaf, ref, refs_to_add);</div><div class='add'>+			btrfs_set_extent_data_ref_count(leaf, ref, node-&gt;ref_mod);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			num_refs = btrfs_extent_data_ref_count(leaf, ref);</div><div class='del'>-			num_refs += refs_to_add;</div><div class='add'>+			num_refs += node-&gt;ref_mod;</div><div class='ctx'> 			btrfs_set_extent_data_ref_count(leaf, ref, num_refs);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> 	ret = 0;</div><div class='ctx'> fail:</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='hunk'>@@ -593,8 +574,9 @@ fail:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static noinline int remove_extent_data_ref(struct btrfs_trans_handle *trans,</div><div class='add'>+					   struct btrfs_root *root,</div><div class='ctx'> 					   struct btrfs_path *path,</div><div class='del'>-					   int refs_to_drop, int *last_ref)</div><div class='add'>+					   int refs_to_drop)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_extent_data_ref *ref1 = NULL;</div><div class='hunk'>@@ -614,44 +596,41 @@ static noinline int remove_extent_data_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		ref2 = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='ctx'> 				      struct btrfs_shared_data_ref);</div><div class='ctx'> 		num_refs = btrfs_shared_data_ref_count(leaf, ref2);</div><div class='del'>-	} else if (unlikely(key.type == BTRFS_EXTENT_REF_V0_KEY)) {</div><div class='del'>-		btrfs_print_v0_err(trans-&gt;fs_info);</div><div class='del'>-		btrfs_abort_transaction(trans, -EINVAL);</div><div class='del'>-		return -EINVAL;</div><div class='ctx'> 	} else {</div><div class='del'>-		BUG();</div><div class='add'>+		btrfs_err(trans-&gt;fs_info,</div><div class='add'>+			  "unrecognized backref key " BTRFS_KEY_FMT,</div><div class='add'>+			  BTRFS_KEY_FMT_VALUE(&amp;key));</div><div class='add'>+		btrfs_abort_transaction(trans, -EUCLEAN);</div><div class='add'>+		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(num_refs &lt; refs_to_drop);</div><div class='ctx'> 	num_refs -= refs_to_drop;</div><div class='ctx'> </div><div class='ctx'> 	if (num_refs == 0) {</div><div class='del'>-		ret = btrfs_del_item(trans, trans-&gt;fs_info-&gt;extent_root, path);</div><div class='del'>-		*last_ref = 1;</div><div class='add'>+		ret = btrfs_del_item(trans, root, path);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		if (key.type == BTRFS_EXTENT_DATA_REF_KEY)</div><div class='ctx'> 			btrfs_set_extent_data_ref_count(leaf, ref1, num_refs);</div><div class='ctx'> 		else if (key.type == BTRFS_SHARED_DATA_REF_KEY)</div><div class='ctx'> 			btrfs_set_shared_data_ref_count(leaf, ref2, num_refs);</div><div class='del'>-		btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> 	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline u32 extent_data_ref_count(struct btrfs_path *path,</div><div class='del'>-					  struct btrfs_extent_inline_ref *iref)</div><div class='add'>+static noinline u32 extent_data_ref_count(const struct btrfs_path *path,</div><div class='add'>+					  const struct btrfs_extent_inline_ref *iref)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='del'>-	struct btrfs_extent_data_ref *ref1;</div><div class='del'>-	struct btrfs_shared_data_ref *ref2;</div><div class='add'>+	const struct btrfs_extent_data_ref *ref1;</div><div class='add'>+	const struct btrfs_shared_data_ref *ref2;</div><div class='ctx'> 	u32 num_refs = 0;</div><div class='ctx'> 	int type;</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	btrfs_item_key_to_cpu(leaf, &amp;key, path-&gt;slots[0]);</div><div class='ctx'> </div><div class='del'>-	BUG_ON(key.type == BTRFS_EXTENT_REF_V0_KEY);</div><div class='ctx'> 	if (iref) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * If type is invalid, we should have bailed out earlier than</div><div class='hunk'>@@ -660,10 +639,10 @@ static noinline u32 extent_data_ref_count(struct btrfs_path *path,</div><div class='ctx'> 		type = btrfs_get_extent_inline_ref_type(leaf, iref, BTRFS_REF_TYPE_DATA);</div><div class='ctx'> 		ASSERT(type != BTRFS_REF_TYPE_INVALID);</div><div class='ctx'> 		if (type == BTRFS_EXTENT_DATA_REF_KEY) {</div><div class='del'>-			ref1 = (struct btrfs_extent_data_ref *)(&amp;iref-&gt;offset);</div><div class='add'>+			ref1 = (const struct btrfs_extent_data_ref *)(&amp;iref-&gt;offset);</div><div class='ctx'> 			num_refs = btrfs_extent_data_ref_count(leaf, ref1);</div><div class='ctx'> 		} else {</div><div class='del'>-			ref2 = (struct btrfs_shared_data_ref *)(iref + 1);</div><div class='add'>+			ref2 = (const struct btrfs_shared_data_ref *)(iref + 1);</div><div class='ctx'> 			num_refs = btrfs_shared_data_ref_count(leaf, ref2);</div><div class='ctx'> 		}</div><div class='ctx'> 	} else if (key.type == BTRFS_EXTENT_DATA_REF_KEY) {</div><div class='hunk'>@@ -685,7 +664,7 @@ static noinline int lookup_tree_block_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 					  u64 bytenr, u64 parent,</div><div class='ctx'> 					  u64 root_objectid)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *root = trans-&gt;fs_info-&gt;extent_root;</div><div class='add'>+	struct btrfs_root *root = btrfs_extent_root(trans-&gt;fs_info, bytenr);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -706,23 +685,23 @@ static noinline int lookup_tree_block_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> static noinline int insert_tree_block_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 					  struct btrfs_path *path,</div><div class='del'>-					  u64 bytenr, u64 parent,</div><div class='del'>-					  u64 root_objectid)</div><div class='add'>+					  const struct btrfs_delayed_ref_node *node,</div><div class='add'>+					  u64 bytenr)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_root *root = btrfs_extent_root(trans-&gt;fs_info, bytenr);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = bytenr;</div><div class='del'>-	if (parent) {</div><div class='add'>+	if (node-&gt;parent) {</div><div class='ctx'> 		key.type = BTRFS_SHARED_BLOCK_REF_KEY;</div><div class='del'>-		key.offset = parent;</div><div class='add'>+		key.offset = node-&gt;parent;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		key.type = BTRFS_TREE_BLOCK_REF_KEY;</div><div class='del'>-		key.offset = root_objectid;</div><div class='add'>+		key.offset = node-&gt;ref_root;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_insert_empty_item(trans, trans-&gt;fs_info-&gt;extent_root,</div><div class='del'>-				      path, &amp;key, 0);</div><div class='add'>+	ret = btrfs_insert_empty_item(trans, root, path, &amp;key, 0);</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -744,7 +723,7 @@ static inline int extent_ref_type(u64 parent, u64 owner)</div><div class='ctx'> 	return type;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int find_next_key(struct btrfs_path *path, int level,</div><div class='add'>+static int find_next_key(const struct btrfs_path *path, int level,</div><div class='ctx'> 			 struct btrfs_key *key)</div><div class='ctx'> </div><div class='ctx'> {</div><div class='hunk'>@@ -787,7 +766,7 @@ int lookup_inline_extent_backref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				 u64 owner, u64 offset, int insert)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='del'>-	struct btrfs_root *root = fs_info-&gt;extent_root;</div><div class='add'>+	struct btrfs_root *root = btrfs_extent_root(fs_info, bytenr);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_extent_item *ei;</div><div class='hunk'>@@ -800,7 +779,6 @@ int lookup_inline_extent_backref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	int type;</div><div class='ctx'> 	int want;</div><div class='ctx'> 	int ret;</div><div class='del'>-	int err = 0;</div><div class='ctx'> 	bool skinny_metadata = btrfs_fs_incompat(fs_info, SKINNY_METADATA);</div><div class='ctx'> 	int needed;</div><div class='ctx'> </div><div class='hunk'>@@ -811,8 +789,7 @@ int lookup_inline_extent_backref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	want = extent_ref_type(parent, owner);</div><div class='ctx'> 	if (insert) {</div><div class='ctx'> 		extra_size = btrfs_extent_inline_ref_size(want);</div><div class='del'>-		path-&gt;search_for_extension = 1;</div><div class='del'>-		path-&gt;keep_locks = 1;</div><div class='add'>+		path-&gt;search_for_extension = true;</div><div class='ctx'> 	} else</div><div class='ctx'> 		extra_size = -1;</div><div class='ctx'> </div><div class='hunk'>@@ -827,10 +804,8 @@ int lookup_inline_extent_backref(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> again:</div><div class='ctx'> 	ret = btrfs_search_slot(trans, root, &amp;key, path, extra_size, 1);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		err = ret;</div><div class='add'>+	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We may be a newly converted file system which still has the old fat</div><div class='hunk'>@@ -857,19 +832,26 @@ again:</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (ret &amp;&amp; !insert) {</div><div class='del'>-		err = -ENOENT;</div><div class='add'>+		ret = -ENOENT;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	} else if (WARN_ON(ret)) {</div><div class='del'>-		err = -EIO;</div><div class='add'>+		btrfs_print_leaf(path-&gt;nodes[0]);</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+"extent item not found for insert, bytenr %llu num_bytes %llu parent %llu root_objectid %llu owner %llu offset %llu",</div><div class='add'>+			  bytenr, num_bytes, parent, root_objectid, owner,</div><div class='add'>+			  offset);</div><div class='add'>+		ret = -EUCLEAN;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='del'>-	item_size = btrfs_item_size_nr(leaf, path-&gt;slots[0]);</div><div class='add'>+	item_size = btrfs_item_size(leaf, path-&gt;slots[0]);</div><div class='ctx'> 	if (unlikely(item_size &lt; sizeof(*ei))) {</div><div class='del'>-		err = -EINVAL;</div><div class='del'>-		btrfs_print_v0_err(fs_info);</div><div class='del'>-		btrfs_abort_transaction(trans, err);</div><div class='add'>+		ret = -EUCLEAN;</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+			  "unexpected extent item size, has %llu expect &gt;= %zu",</div><div class='add'>+			  item_size, sizeof(*ei));</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -889,16 +871,17 @@ again:</div><div class='ctx'> 	else</div><div class='ctx'> 		needed = BTRFS_REF_TYPE_BLOCK;</div><div class='ctx'> </div><div class='del'>-	err = -ENOENT;</div><div class='del'>-	while (1) {</div><div class='del'>-		if (ptr &gt;= end) {</div><div class='del'>-			WARN_ON(ptr &gt; end);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='add'>+	ret = -ENOENT;</div><div class='add'>+	while (ptr &lt; end) {</div><div class='ctx'> 		iref = (struct btrfs_extent_inline_ref *)ptr;</div><div class='ctx'> 		type = btrfs_get_extent_inline_ref_type(leaf, iref, needed);</div><div class='del'>-		if (type == BTRFS_REF_TYPE_INVALID) {</div><div class='del'>-			err = -EUCLEAN;</div><div class='add'>+		if (type == BTRFS_EXTENT_OWNER_REF_KEY) {</div><div class='add'>+			ASSERT(btrfs_fs_incompat(fs_info, SIMPLE_QUOTA));</div><div class='add'>+			ptr += btrfs_extent_inline_ref_size(type);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+		if (unlikely(type == BTRFS_REF_TYPE_INVALID)) {</div><div class='add'>+			ret = -EUCLEAN;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -914,7 +897,7 @@ again:</div><div class='ctx'> 			dref = (struct btrfs_extent_data_ref *)(&amp;iref-&gt;offset);</div><div class='ctx'> 			if (match_extent_data_ref(leaf, dref, root_objectid,</div><div class='ctx'> 						  owner, offset)) {</div><div class='del'>-				err = 0;</div><div class='add'>+				ret = 0;</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> 			if (hash_extent_data_ref_item(leaf, dref) &lt;</div><div class='hunk'>@@ -925,14 +908,14 @@ again:</div><div class='ctx'> 			ref_offset = btrfs_extent_inline_ref_offset(leaf, iref);</div><div class='ctx'> 			if (parent &gt; 0) {</div><div class='ctx'> 				if (parent == ref_offset) {</div><div class='del'>-					err = 0;</div><div class='add'>+					ret = 0;</div><div class='ctx'> 					break;</div><div class='ctx'> 				}</div><div class='ctx'> 				if (ref_offset &lt; parent)</div><div class='ctx'> 					break;</div><div class='ctx'> 			} else {</div><div class='ctx'> 				if (root_objectid == ref_offset) {</div><div class='del'>-					err = 0;</div><div class='add'>+					ret = 0;</div><div class='ctx'> 					break;</div><div class='ctx'> 				}</div><div class='ctx'> 				if (ref_offset &lt; root_objectid)</div><div class='hunk'>@@ -941,12 +924,41 @@ again:</div><div class='ctx'> 		}</div><div class='ctx'> 		ptr += btrfs_extent_inline_ref_size(type);</div><div class='ctx'> 	}</div><div class='del'>-	if (err == -ENOENT &amp;&amp; insert) {</div><div class='add'>+</div><div class='add'>+	if (unlikely(ptr &gt; end)) {</div><div class='add'>+		ret = -EUCLEAN;</div><div class='add'>+		btrfs_print_leaf(path-&gt;nodes[0]);</div><div class='add'>+		btrfs_crit(fs_info,</div><div class='add'>+"overrun extent record at slot %d while looking for inline extent for root %llu owner %llu offset %llu parent %llu",</div><div class='add'>+			   path-&gt;slots[0], root_objectid, owner, offset, parent);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (ret == -ENOENT &amp;&amp; insert) {</div><div class='ctx'> 		if (item_size + extra_size &gt;=</div><div class='ctx'> 		    BTRFS_MAX_EXTENT_ITEM_SIZE(root)) {</div><div class='del'>-			err = -EAGAIN;</div><div class='add'>+			ret = -EAGAIN;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='add'>+		if (path-&gt;slots[0] + 1 &lt; btrfs_header_nritems(path-&gt;nodes[0])) {</div><div class='add'>+			struct btrfs_key tmp_key;</div><div class='add'>+</div><div class='add'>+			btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;tmp_key, path-&gt;slots[0] + 1);</div><div class='add'>+			if (tmp_key.objectid == bytenr &amp;&amp;</div><div class='add'>+			    tmp_key.type &lt; BTRFS_BLOCK_GROUP_ITEM_KEY) {</div><div class='add'>+				ret = -EAGAIN;</div><div class='add'>+				goto out;</div><div class='add'>+			}</div><div class='add'>+			goto out_no_entry;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (!path-&gt;keep_locks) {</div><div class='add'>+			btrfs_release_path(path);</div><div class='add'>+			path-&gt;keep_locks = true;</div><div class='add'>+			goto again;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * To add new inline back ref, we have to make sure</div><div class='ctx'> 		 * there is no corresponding back ref item.</div><div class='hunk'>@@ -956,25 +968,27 @@ again:</div><div class='ctx'> 		if (find_next_key(path, 0, &amp;key) == 0 &amp;&amp;</div><div class='ctx'> 		    key.objectid == bytenr &amp;&amp;</div><div class='ctx'> 		    key.type &lt; BTRFS_BLOCK_GROUP_ITEM_KEY) {</div><div class='del'>-			err = -EAGAIN;</div><div class='add'>+			ret = -EAGAIN;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='add'>+out_no_entry:</div><div class='ctx'> 	*ref_ret = (struct btrfs_extent_inline_ref *)ptr;</div><div class='ctx'> out:</div><div class='del'>-	if (insert) {</div><div class='del'>-		path-&gt;keep_locks = 0;</div><div class='del'>-		path-&gt;search_for_extension = 0;</div><div class='add'>+	if (path-&gt;keep_locks) {</div><div class='add'>+		path-&gt;keep_locks = false;</div><div class='ctx'> 		btrfs_unlock_up_safe(path, 1);</div><div class='ctx'> 	}</div><div class='del'>-	return err;</div><div class='add'>+	if (insert)</div><div class='add'>+		path-&gt;search_for_extension = false;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * helper to add new inline back ref</div><div class='ctx'>  */</div><div class='ctx'> static noinline_for_stack</div><div class='del'>-void setup_inline_extent_backref(struct btrfs_fs_info *fs_info,</div><div class='add'>+void setup_inline_extent_backref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				 struct btrfs_path *path,</div><div class='ctx'> 				 struct btrfs_extent_inline_ref *iref,</div><div class='ctx'> 				 u64 parent, u64 root_objectid,</div><div class='hunk'>@@ -997,7 +1011,7 @@ void setup_inline_extent_backref(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	type = extent_ref_type(parent, owner);</div><div class='ctx'> 	size = btrfs_extent_inline_ref_size(type);</div><div class='ctx'> </div><div class='del'>-	btrfs_extend_item(path, size);</div><div class='add'>+	btrfs_extend_item(trans, path, size);</div><div class='ctx'> </div><div class='ctx'> 	ei = btrfs_item_ptr(leaf, path-&gt;slots[0], struct btrfs_extent_item);</div><div class='ctx'> 	refs = btrfs_extent_refs(leaf, ei);</div><div class='hunk'>@@ -1007,7 +1021,7 @@ void setup_inline_extent_backref(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		__run_delayed_extent_op(extent_op, leaf, ei);</div><div class='ctx'> </div><div class='ctx'> 	ptr = (unsigned long)ei + item_offset;</div><div class='del'>-	end = (unsigned long)ei + btrfs_item_size_nr(leaf, path-&gt;slots[0]);</div><div class='add'>+	end = (unsigned long)ei + btrfs_item_size(leaf, path-&gt;slots[0]);</div><div class='ctx'> 	if (ptr &lt; end - size)</div><div class='ctx'> 		memmove_extent_buffer(leaf, ptr + size, ptr,</div><div class='ctx'> 				      end - size - ptr);</div><div class='hunk'>@@ -1031,7 +1045,6 @@ void setup_inline_extent_backref(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	} else {</div><div class='ctx'> 		btrfs_set_extent_inline_ref_offset(leaf, iref, root_objectid);</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int lookup_extent_backref(struct btrfs_trans_handle *trans,</div><div class='hunk'>@@ -1064,14 +1077,15 @@ static int lookup_extent_backref(struct btrfs_trans_handle *trans,</div><div class='ctx'> /*</div><div class='ctx'>  * helper to update/remove inline back ref</div><div class='ctx'>  */</div><div class='del'>-static noinline_for_stack</div><div class='del'>-void update_inline_extent_backref(struct btrfs_path *path,</div><div class='add'>+static noinline_for_stack int update_inline_extent_backref(</div><div class='add'>+				  struct btrfs_trans_handle *trans,</div><div class='add'>+				  struct btrfs_path *path,</div><div class='ctx'> 				  struct btrfs_extent_inline_ref *iref,</div><div class='ctx'> 				  int refs_to_mod,</div><div class='del'>-				  struct btrfs_delayed_extent_op *extent_op,</div><div class='del'>-				  int *last_ref)</div><div class='add'>+				  struct btrfs_delayed_extent_op *extent_op)</div><div class='ctx'> {</div><div class='ctx'> 	struct extent_buffer *leaf = path-&gt;nodes[0];</div><div class='add'>+	struct btrfs_fs_info *fs_info = leaf-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_extent_item *ei;</div><div class='ctx'> 	struct btrfs_extent_data_ref *dref = NULL;</div><div class='ctx'> 	struct btrfs_shared_data_ref *sref = NULL;</div><div class='hunk'>@@ -1084,18 +1098,33 @@ void update_inline_extent_backref(struct btrfs_path *path,</div><div class='ctx'> </div><div class='ctx'> 	ei = btrfs_item_ptr(leaf, path-&gt;slots[0], struct btrfs_extent_item);</div><div class='ctx'> 	refs = btrfs_extent_refs(leaf, ei);</div><div class='del'>-	WARN_ON(refs_to_mod &lt; 0 &amp;&amp; refs + refs_to_mod &lt;= 0);</div><div class='add'>+	if (unlikely(refs_to_mod &lt; 0 &amp;&amp; refs + refs_to_mod &lt;= 0)) {</div><div class='add'>+		struct btrfs_key key;</div><div class='add'>+		u32 extent_size;</div><div class='add'>+</div><div class='add'>+		btrfs_item_key_to_cpu(leaf, &amp;key, path-&gt;slots[0]);</div><div class='add'>+		if (key.type == BTRFS_METADATA_ITEM_KEY)</div><div class='add'>+			extent_size = fs_info-&gt;nodesize;</div><div class='add'>+		else</div><div class='add'>+			extent_size = key.offset;</div><div class='add'>+		btrfs_print_leaf(leaf);</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+	"invalid refs_to_mod for extent %llu num_bytes %u, has %d expect &gt;= -%llu",</div><div class='add'>+			  key.objectid, extent_size, refs_to_mod, refs);</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='ctx'> 	refs += refs_to_mod;</div><div class='ctx'> 	btrfs_set_extent_refs(leaf, ei, refs);</div><div class='ctx'> 	if (extent_op)</div><div class='ctx'> 		__run_delayed_extent_op(extent_op, leaf, ei);</div><div class='ctx'> </div><div class='add'>+	type = btrfs_get_extent_inline_ref_type(leaf, iref, BTRFS_REF_TYPE_ANY);</div><div class='ctx'> 	/*</div><div class='del'>-	 * If type is invalid, we should have bailed out after</div><div class='del'>-	 * lookup_inline_extent_backref().</div><div class='add'>+	 * Function btrfs_get_extent_inline_ref_type() has already printed</div><div class='add'>+	 * error messages.</div><div class='ctx'> 	 */</div><div class='del'>-	type = btrfs_get_extent_inline_ref_type(leaf, iref, BTRFS_REF_TYPE_ANY);</div><div class='del'>-	ASSERT(type != BTRFS_REF_TYPE_INVALID);</div><div class='add'>+	if (unlikely(type == BTRFS_REF_TYPE_INVALID))</div><div class='add'>+		return -EUCLEAN;</div><div class='ctx'> </div><div class='ctx'> 	if (type == BTRFS_EXTENT_DATA_REF_KEY) {</div><div class='ctx'> 		dref = (struct btrfs_extent_data_ref *)(&amp;iref-&gt;offset);</div><div class='hunk'>@@ -1105,10 +1134,43 @@ void update_inline_extent_backref(struct btrfs_path *path,</div><div class='ctx'> 		refs = btrfs_shared_data_ref_count(leaf, sref);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		refs = 1;</div><div class='del'>-		BUG_ON(refs_to_mod != -1);</div><div class='add'>+		/*</div><div class='add'>+		 * For tree blocks we can only drop one ref for it, and tree</div><div class='add'>+		 * blocks should not have refs &gt; 1.</div><div class='add'>+		 *</div><div class='add'>+		 * Furthermore if we're inserting a new inline backref, we</div><div class='add'>+		 * won't reach this path either. That would be</div><div class='add'>+		 * setup_inline_extent_backref().</div><div class='add'>+		 */</div><div class='add'>+		if (unlikely(refs_to_mod != -1)) {</div><div class='add'>+			struct btrfs_key key;</div><div class='add'>+</div><div class='add'>+			btrfs_item_key_to_cpu(leaf, &amp;key, path-&gt;slots[0]);</div><div class='add'>+</div><div class='add'>+			btrfs_print_leaf(leaf);</div><div class='add'>+			btrfs_err(fs_info,</div><div class='add'>+			"invalid refs_to_mod for tree block %llu, has %d expect -1",</div><div class='add'>+				  key.objectid, refs_to_mod);</div><div class='add'>+			return -EUCLEAN;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	BUG_ON(refs_to_mod &lt; 0 &amp;&amp; refs &lt; -refs_to_mod);</div><div class='add'>+	if (unlikely(refs_to_mod &lt; 0 &amp;&amp; refs &lt; -refs_to_mod)) {</div><div class='add'>+		struct btrfs_key key;</div><div class='add'>+		u32 extent_size;</div><div class='add'>+</div><div class='add'>+		btrfs_item_key_to_cpu(leaf, &amp;key, path-&gt;slots[0]);</div><div class='add'>+		if (key.type == BTRFS_METADATA_ITEM_KEY)</div><div class='add'>+			extent_size = fs_info-&gt;nodesize;</div><div class='add'>+		else</div><div class='add'>+			extent_size = key.offset;</div><div class='add'>+		btrfs_print_leaf(leaf);</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+"invalid refs_to_mod for backref entry, iref %lu extent %llu num_bytes %u, has %d expect &gt;= -%llu",</div><div class='add'>+			  (unsigned long)iref, key.objectid, extent_size,</div><div class='add'>+			  refs_to_mod, refs);</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='ctx'> 	refs += refs_to_mod;</div><div class='ctx'> </div><div class='ctx'> 	if (refs &gt; 0) {</div><div class='hunk'>@@ -1117,18 +1179,17 @@ void update_inline_extent_backref(struct btrfs_path *path,</div><div class='ctx'> 		else</div><div class='ctx'> 			btrfs_set_shared_data_ref_count(leaf, sref, refs);</div><div class='ctx'> 	} else {</div><div class='del'>-		*last_ref = 1;</div><div class='ctx'> 		size =  btrfs_extent_inline_ref_size(type);</div><div class='del'>-		item_size = btrfs_item_size_nr(leaf, path-&gt;slots[0]);</div><div class='add'>+		item_size = btrfs_item_size(leaf, path-&gt;slots[0]);</div><div class='ctx'> 		ptr = (unsigned long)iref;</div><div class='ctx'> 		end = (unsigned long)ei + item_size;</div><div class='ctx'> 		if (ptr + size &lt; end)</div><div class='ctx'> 			memmove_extent_buffer(leaf, ptr, ptr + size,</div><div class='ctx'> 					      end - ptr - size);</div><div class='ctx'> 		item_size -= size;</div><div class='del'>-		btrfs_truncate_item(path, item_size, 1);</div><div class='add'>+		btrfs_truncate_item(trans, path, item_size, 1);</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static noinline_for_stack</div><div class='hunk'>@@ -1150,22 +1211,17 @@ int insert_inline_extent_backref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		 * We're adding refs to a tree block we already own, this</div><div class='ctx'> 		 * should not happen at all.</div><div class='ctx'> 		 */</div><div class='del'>-		if (owner &lt; BTRFS_FIRST_FREE_OBJECTID) {</div><div class='add'>+		if (unlikely(owner &lt; BTRFS_FIRST_FREE_OBJECTID)) {</div><div class='add'>+			btrfs_print_leaf(path-&gt;nodes[0]);</div><div class='ctx'> 			btrfs_crit(trans-&gt;fs_info,</div><div class='del'>-"adding refs to an existing tree ref, bytenr %llu num_bytes %llu root_objectid %llu",</div><div class='del'>-				   bytenr, num_bytes, root_objectid);</div><div class='del'>-			if (IS_ENABLED(CONFIG_BTRFS_DEBUG)) {</div><div class='del'>-				WARN_ON(1);</div><div class='del'>-				btrfs_crit(trans-&gt;fs_info,</div><div class='del'>-			"path-&gt;slots[0]=%d path-&gt;nodes[0]:", path-&gt;slots[0]);</div><div class='del'>-				btrfs_print_leaf(path-&gt;nodes[0]);</div><div class='del'>-			}</div><div class='add'>+"adding refs to an existing tree ref, bytenr %llu num_bytes %llu root_objectid %llu slot %u",</div><div class='add'>+				   bytenr, num_bytes, root_objectid, path-&gt;slots[0]);</div><div class='ctx'> 			return -EUCLEAN;</div><div class='ctx'> 		}</div><div class='del'>-		update_inline_extent_backref(path, iref, refs_to_add,</div><div class='del'>-					     extent_op, NULL);</div><div class='add'>+		ret = update_inline_extent_backref(trans, path, iref,</div><div class='add'>+						   refs_to_add, extent_op);</div><div class='ctx'> 	} else if (ret == -ENOENT) {</div><div class='del'>-		setup_inline_extent_backref(trans-&gt;fs_info, path, iref, parent,</div><div class='add'>+		setup_inline_extent_backref(trans, path, iref, parent,</div><div class='ctx'> 					    root_objectid, owner, offset,</div><div class='ctx'> 					    refs_to_add, extent_op);</div><div class='ctx'> 		ret = 0;</div><div class='hunk'>@@ -1174,23 +1230,21 @@ int insert_inline_extent_backref(struct btrfs_trans_handle *trans,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int remove_extent_backref(struct btrfs_trans_handle *trans,</div><div class='add'>+				 struct btrfs_root *root,</div><div class='ctx'> 				 struct btrfs_path *path,</div><div class='ctx'> 				 struct btrfs_extent_inline_ref *iref,</div><div class='del'>-				 int refs_to_drop, int is_data, int *last_ref)</div><div class='add'>+				 int refs_to_drop, int is_data)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(!is_data &amp;&amp; refs_to_drop != 1);</div><div class='del'>-	if (iref) {</div><div class='del'>-		update_inline_extent_backref(path, iref, -refs_to_drop, NULL,</div><div class='del'>-					     last_ref);</div><div class='del'>-	} else if (is_data) {</div><div class='del'>-		ret = remove_extent_data_ref(trans, path, refs_to_drop,</div><div class='del'>-					     last_ref);</div><div class='del'>-	} else {</div><div class='del'>-		*last_ref = 1;</div><div class='del'>-		ret = btrfs_del_item(trans, trans-&gt;fs_info-&gt;extent_root, path);</div><div class='del'>-	}</div><div class='add'>+	if (iref)</div><div class='add'>+		ret = update_inline_extent_backref(trans, path, iref,</div><div class='add'>+						   -refs_to_drop, NULL);</div><div class='add'>+	else if (is_data)</div><div class='add'>+		ret = remove_extent_data_ref(trans, root, path, refs_to_drop);</div><div class='add'>+	else</div><div class='add'>+		ret = btrfs_del_item(trans, root, path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1199,11 +1253,12 @@ static int btrfs_issue_discard(struct block_device *bdev, u64 start, u64 len,</div><div class='ctx'> {</div><div class='ctx'> 	int j, ret = 0;</div><div class='ctx'> 	u64 bytes_left, end;</div><div class='del'>-	u64 aligned_start = ALIGN(start, 1 &lt;&lt; 9);</div><div class='add'>+	u64 aligned_start = ALIGN(start, SECTOR_SIZE);</div><div class='ctx'> </div><div class='del'>-	if (WARN_ON(start != aligned_start)) {</div><div class='add'>+	/* Adjust the range to be aligned to 512B sectors if necessary. */</div><div class='add'>+	if (start != aligned_start) {</div><div class='ctx'> 		len -= aligned_start - start;</div><div class='del'>-		len = round_down(len, 1 &lt;&lt; 9);</div><div class='add'>+		len = round_down(len, SECTOR_SIZE);</div><div class='ctx'> 		start = aligned_start;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1241,8 +1296,9 @@ static int btrfs_issue_discard(struct block_device *bdev, u64 start, u64 len,</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (size) {</div><div class='del'>-			ret = blkdev_issue_discard(bdev, start &gt;&gt; 9, size &gt;&gt; 9,</div><div class='del'>-						   GFP_NOFS, 0);</div><div class='add'>+			ret = blkdev_issue_discard(bdev, start &gt;&gt; SECTOR_SHIFT,</div><div class='add'>+						   size &gt;&gt; SECTOR_SHIFT,</div><div class='add'>+						   GFP_NOFS);</div><div class='ctx'> 			if (!ret)</div><div class='ctx'> 				*discarded_bytes += size;</div><div class='ctx'> 			else if (ret != -EOPNOTSUPP)</div><div class='hunk'>@@ -1257,16 +1313,33 @@ static int btrfs_issue_discard(struct block_device *bdev, u64 start, u64 len,</div><div class='ctx'> 		bytes_left = end - start;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (bytes_left) {</div><div class='del'>-		ret = blkdev_issue_discard(bdev, start &gt;&gt; 9, bytes_left &gt;&gt; 9,</div><div class='del'>-					   GFP_NOFS, 0);</div><div class='del'>-		if (!ret)</div><div class='del'>-			*discarded_bytes += bytes_left;</div><div class='add'>+	while (bytes_left) {</div><div class='add'>+		u64 bytes_to_discard = min(BTRFS_MAX_DISCARD_CHUNK_SIZE, bytes_left);</div><div class='add'>+</div><div class='add'>+		ret = blkdev_issue_discard(bdev, start &gt;&gt; SECTOR_SHIFT,</div><div class='add'>+					   bytes_to_discard &gt;&gt; SECTOR_SHIFT,</div><div class='add'>+					   GFP_NOFS);</div><div class='add'>+</div><div class='add'>+		if (ret) {</div><div class='add'>+			if (ret != -EOPNOTSUPP)</div><div class='add'>+				break;</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		start += bytes_to_discard;</div><div class='add'>+		bytes_left -= bytes_to_discard;</div><div class='add'>+		*discarded_bytes += bytes_to_discard;</div><div class='add'>+</div><div class='add'>+		if (btrfs_trim_interrupted()) {</div><div class='add'>+			ret = -ERESTARTSYS;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int do_discard_extent(struct btrfs_io_stripe *stripe, u64 *bytes)</div><div class='add'>+static int do_discard_extent(struct btrfs_discard_stripe *stripe, u64 *bytes)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_device *dev = stripe-&gt;dev;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = dev-&gt;fs_info;</div><div class='hunk'>@@ -1294,7 +1367,7 @@ static int do_discard_extent(struct btrfs_io_stripe *stripe, u64 *bytes)</div><div class='ctx'> 		ret = btrfs_reset_device_zone(dev_replace-&gt;tgtdev, phys, len,</div><div class='ctx'> 					      &amp;discarded);</div><div class='ctx'> 		discarded += src_disc;</div><div class='del'>-	} else if (blk_queue_discard(bdev_get_queue(stripe-&gt;dev-&gt;bdev))) {</div><div class='add'>+	} else if (bdev_max_discard_sectors(stripe-&gt;dev-&gt;bdev)) {</div><div class='ctx'> 		ret = btrfs_issue_discard(dev-&gt;bdev, phys, len, &amp;discarded);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		ret = 0;</div><div class='hunk'>@@ -1313,76 +1386,60 @@ int btrfs_discard_extent(struct btrfs_fs_info *fs_info, u64 bytenr,</div><div class='ctx'> 	u64 discarded_bytes = 0;</div><div class='ctx'> 	u64 end = bytenr + num_bytes;</div><div class='ctx'> 	u64 cur = bytenr;</div><div class='del'>-	struct btrfs_io_context *bioc = NULL;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Avoid races with device replace and make sure our bioc has devices</div><div class='del'>-	 * associated to its stripes that don't go away while we are discarding.</div><div class='add'>+	 * Avoid races with device replace and make sure the devices in the</div><div class='add'>+	 * stripes don't go away while we are discarding.</div><div class='ctx'> 	 */</div><div class='ctx'> 	btrfs_bio_counter_inc_blocked(fs_info);</div><div class='ctx'> 	while (cur &lt; end) {</div><div class='del'>-		struct btrfs_io_stripe *stripe;</div><div class='add'>+		struct btrfs_discard_stripe *stripes;</div><div class='add'>+		unsigned int num_stripes;</div><div class='ctx'> 		int i;</div><div class='ctx'> </div><div class='ctx'> 		num_bytes = end - cur;</div><div class='del'>-		/* Tell the block device(s) that the sectors can be discarded */</div><div class='del'>-		ret = btrfs_map_block(fs_info, BTRFS_MAP_DISCARD, cur,</div><div class='del'>-				      &amp;num_bytes, &amp;bioc, 0);</div><div class='del'>-		/*</div><div class='del'>-		 * Error can be -ENOMEM, -ENOENT (no such chunk mapping) or</div><div class='del'>-		 * -EOPNOTSUPP. For any such error, @num_bytes is not updated,</div><div class='del'>-		 * thus we can't continue anyway.</div><div class='del'>-		 */</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='add'>+		stripes = btrfs_map_discard(fs_info, cur, &amp;num_bytes, &amp;num_stripes);</div><div class='add'>+		if (IS_ERR(stripes)) {</div><div class='add'>+			ret = PTR_ERR(stripes);</div><div class='add'>+			if (ret == -EOPNOTSUPP)</div><div class='add'>+				ret = 0;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-		stripe = bioc-&gt;stripes;</div><div class='del'>-		for (i = 0; i &lt; bioc-&gt;num_stripes; i++, stripe++) {</div><div class='add'>+		for (i = 0; i &lt; num_stripes; i++) {</div><div class='add'>+			struct btrfs_discard_stripe *stripe = stripes + i;</div><div class='ctx'> 			u64 bytes;</div><div class='del'>-			struct btrfs_device *device = stripe-&gt;dev;</div><div class='ctx'> </div><div class='del'>-			if (!device-&gt;bdev) {</div><div class='add'>+			if (!stripe-&gt;dev-&gt;bdev) {</div><div class='ctx'> 				ASSERT(btrfs_test_opt(fs_info, DEGRADED));</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			if (!test_bit(BTRFS_DEV_STATE_WRITEABLE, &amp;device-&gt;dev_state))</div><div class='add'>+			if (!test_bit(BTRFS_DEV_STATE_WRITEABLE,</div><div class='add'>+					&amp;stripe-&gt;dev-&gt;dev_state))</div><div class='ctx'> 				continue;</div><div class='ctx'> </div><div class='ctx'> 			ret = do_discard_extent(stripe, &amp;bytes);</div><div class='del'>-			if (!ret) {</div><div class='del'>-				discarded_bytes += bytes;</div><div class='del'>-			} else if (ret != -EOPNOTSUPP) {</div><div class='add'>+			if (ret) {</div><div class='ctx'> 				/*</div><div class='del'>-				 * Logic errors or -ENOMEM, or -EIO, but</div><div class='del'>-				 * unlikely to happen.</div><div class='del'>-				 *</div><div class='del'>-				 * And since there are two loops, explicitly</div><div class='del'>-				 * go to out to avoid confusion.</div><div class='add'>+				 * Keep going if discard is not supported by the</div><div class='add'>+				 * device.</div><div class='ctx'> 				 */</div><div class='del'>-				btrfs_put_bioc(bioc);</div><div class='del'>-				goto out;</div><div class='add'>+				if (ret != -EOPNOTSUPP)</div><div class='add'>+					break;</div><div class='add'>+				ret = 0;</div><div class='add'>+			} else {</div><div class='add'>+				discarded_bytes += bytes;</div><div class='ctx'> 			}</div><div class='del'>-</div><div class='del'>-			/*</div><div class='del'>-			 * Just in case we get back EOPNOTSUPP for some reason,</div><div class='del'>-			 * just ignore the return value so we don't screw up</div><div class='del'>-			 * people calling discard_extent.</div><div class='del'>-			 */</div><div class='del'>-			ret = 0;</div><div class='ctx'> 		}</div><div class='del'>-		btrfs_put_bioc(bioc);</div><div class='add'>+		kfree(stripes);</div><div class='add'>+		if (ret)</div><div class='add'>+			break;</div><div class='ctx'> 		cur += num_bytes;</div><div class='ctx'> 	}</div><div class='del'>-out:</div><div class='ctx'> 	btrfs_bio_counter_dec(fs_info);</div><div class='del'>-</div><div class='ctx'> 	if (actual_bytes)</div><div class='ctx'> 		*actual_bytes = discarded_bytes;</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-	if (ret == -EOPNOTSUPP)</div><div class='del'>-		ret = 0;</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1396,7 +1453,7 @@ int btrfs_inc_extent_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	ASSERT(generic_ref-&gt;type != BTRFS_REF_NOT_SET &amp;&amp;</div><div class='ctx'> 	       generic_ref-&gt;action);</div><div class='ctx'> 	BUG_ON(generic_ref-&gt;type == BTRFS_REF_METADATA &amp;&amp;</div><div class='del'>-	       generic_ref-&gt;tree_ref.owning_root == BTRFS_TREE_LOG_OBJECTID);</div><div class='add'>+	       generic_ref-&gt;ref_root == BTRFS_TREE_LOG_OBJECTID);</div><div class='ctx'> </div><div class='ctx'> 	if (generic_ref-&gt;type == BTRFS_REF_METADATA)</div><div class='ctx'> 		ret = btrfs_add_delayed_tree_ref(trans, generic_ref, NULL);</div><div class='hunk'>@@ -1409,7 +1466,7 @@ int btrfs_inc_extent_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * __btrfs_inc_extent_ref - insert backreference for a given extent</div><div class='add'>+ * Insert backreference for a given extent.</div><div class='ctx'>  *</div><div class='ctx'>  * The counterpart is in __btrfs_free_extent(), with examples and more details</div><div class='ctx'>  * how it works.</div><div class='hunk'>@@ -1419,45 +1476,24 @@ int btrfs_inc_extent_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'>  * @node:	    The delayed ref node used to get the bytenr/length for</div><div class='ctx'>  *		    extent whose references are incremented.</div><div class='ctx'>  *</div><div class='del'>- * @parent:	    If this is a shared extent (BTRFS_SHARED_DATA_REF_KEY/</div><div class='del'>- *		    BTRFS_SHARED_BLOCK_REF_KEY) then it holds the logical</div><div class='del'>- *		    bytenr of the parent block. Since new extents are always</div><div class='del'>- *		    created with indirect references, this will only be the case</div><div class='del'>- *		    when relocating a shared extent. In that case, root_objectid</div><div class='del'>- *		    will be BTRFS_TREE_RELOC_OBJECTID. Otherwise, parent must</div><div class='del'>- *		    be 0</div><div class='del'>- *</div><div class='del'>- * @root_objectid:  The id of the root where this modification has originated,</div><div class='del'>- *		    this can be either one of the well-known metadata trees or</div><div class='del'>- *		    the subvolume id which references this extent.</div><div class='del'>- *</div><div class='del'>- * @owner:	    For data extents it is the inode number of the owning file.</div><div class='del'>- *		    For metadata extents this parameter holds the level in the</div><div class='del'>- *		    tree of the extent.</div><div class='del'>- *</div><div class='del'>- * @offset:	    For metadata extents the offset is ignored and is currently</div><div class='del'>- *		    always passed as 0. For data extents it is the fileoffset</div><div class='del'>- *		    this extent belongs to.</div><div class='del'>- *</div><div class='del'>- * @refs_to_add     Number of references to add</div><div class='del'>- *</div><div class='ctx'>  * @extent_op       Pointer to a structure, holding information necessary when</div><div class='ctx'>  *                  updating a tree block's flags</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='ctx'> static int __btrfs_inc_extent_ref(struct btrfs_trans_handle *trans,</div><div class='del'>-				  struct btrfs_delayed_ref_node *node,</div><div class='del'>-				  u64 parent, u64 root_objectid,</div><div class='del'>-				  u64 owner, u64 offset, int refs_to_add,</div><div class='add'>+				  const struct btrfs_delayed_ref_node *node,</div><div class='ctx'> 				  struct btrfs_delayed_extent_op *extent_op)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_extent_item *item;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	u64 bytenr = node-&gt;bytenr;</div><div class='ctx'> 	u64 num_bytes = node-&gt;num_bytes;</div><div class='add'>+	u64 owner = btrfs_delayed_ref_owner(node);</div><div class='add'>+	u64 offset = btrfs_delayed_ref_offset(node);</div><div class='ctx'> 	u64 refs;</div><div class='add'>+	int refs_to_add = node-&gt;ref_mod;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='hunk'>@@ -1466,10 +1502,10 @@ static int __btrfs_inc_extent_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	/* this will setup the path even if it fails to insert the back ref */</div><div class='ctx'> 	ret = insert_inline_extent_backref(trans, path, bytenr, num_bytes,</div><div class='del'>-					   parent, root_objectid, owner,</div><div class='add'>+					   node-&gt;parent, node-&gt;ref_root, owner,</div><div class='ctx'> 					   offset, refs_to_add, extent_op);</div><div class='ctx'> 	if ((ret &lt; 0 &amp;&amp; ret != -EAGAIN) || !ret)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Ok we had -EAGAIN which means we didn't have space to insert and</div><div class='hunk'>@@ -1484,65 +1520,84 @@ static int __btrfs_inc_extent_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	if (extent_op)</div><div class='ctx'> 		__run_delayed_extent_op(extent_op, leaf, item);</div><div class='ctx'> </div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='ctx'> 	/* now insert the actual backref */</div><div class='ctx'> 	if (owner &lt; BTRFS_FIRST_FREE_OBJECTID) {</div><div class='del'>-		BUG_ON(refs_to_add != 1);</div><div class='del'>-		ret = insert_tree_block_ref(trans, path, bytenr, parent,</div><div class='del'>-					    root_objectid);</div><div class='add'>+		ret = insert_tree_block_ref(trans, path, node, bytenr);</div><div class='add'>+		if (ret)</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 	} else {</div><div class='del'>-		ret = insert_extent_data_ref(trans, path, bytenr, parent,</div><div class='del'>-					     root_objectid, owner, offset,</div><div class='del'>-					     refs_to_add);</div><div class='add'>+		ret = insert_extent_data_ref(trans, path, node, bytenr);</div><div class='add'>+		if (ret)</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 	}</div><div class='del'>-	if (ret)</div><div class='del'>-		btrfs_abort_transaction(trans, ret);</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void free_head_ref_squota_rsv(struct btrfs_fs_info *fs_info,</div><div class='add'>+				     const struct btrfs_delayed_ref_head *href)</div><div class='add'>+{</div><div class='add'>+	u64 root = href-&gt;owning_root;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Don't check must_insert_reserved, as this is called from contexts</div><div class='add'>+	 * where it has already been unset.</div><div class='add'>+	 */</div><div class='add'>+	if (btrfs_qgroup_mode(fs_info) != BTRFS_QGROUP_MODE_SIMPLE ||</div><div class='add'>+	    !href-&gt;is_data || !btrfs_is_fstree(root))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	btrfs_qgroup_free_refroot(fs_info, root, href-&gt;reserved_bytes,</div><div class='add'>+				  BTRFS_QGROUP_RSV_DATA);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int run_delayed_data_ref(struct btrfs_trans_handle *trans,</div><div class='del'>-				struct btrfs_delayed_ref_node *node,</div><div class='add'>+				struct btrfs_delayed_ref_head *href,</div><div class='add'>+				const struct btrfs_delayed_ref_node *node,</div><div class='ctx'> 				struct btrfs_delayed_extent_op *extent_op,</div><div class='del'>-				int insert_reserved)</div><div class='add'>+				bool insert_reserved)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	struct btrfs_delayed_data_ref *ref;</div><div class='del'>-	struct btrfs_key ins;</div><div class='ctx'> 	u64 parent = 0;</div><div class='del'>-	u64 ref_root = 0;</div><div class='ctx'> 	u64 flags = 0;</div><div class='ctx'> </div><div class='del'>-	ins.objectid = node-&gt;bytenr;</div><div class='del'>-	ins.offset = node-&gt;num_bytes;</div><div class='del'>-	ins.type = BTRFS_EXTENT_ITEM_KEY;</div><div class='del'>-</div><div class='del'>-	ref = btrfs_delayed_node_to_data_ref(node);</div><div class='del'>-	trace_run_delayed_data_ref(trans-&gt;fs_info, node, ref, node-&gt;action);</div><div class='add'>+	trace_run_delayed_data_ref(trans-&gt;fs_info, node);</div><div class='ctx'> </div><div class='ctx'> 	if (node-&gt;type == BTRFS_SHARED_DATA_REF_KEY)</div><div class='del'>-		parent = ref-&gt;parent;</div><div class='del'>-	ref_root = ref-&gt;root;</div><div class='add'>+		parent = node-&gt;parent;</div><div class='ctx'> </div><div class='ctx'> 	if (node-&gt;action == BTRFS_ADD_DELAYED_REF &amp;&amp; insert_reserved) {</div><div class='add'>+		struct btrfs_key key;</div><div class='add'>+		struct btrfs_squota_delta delta = {</div><div class='add'>+			.root = href-&gt;owning_root,</div><div class='add'>+			.num_bytes = node-&gt;num_bytes,</div><div class='add'>+			.is_data = true,</div><div class='add'>+			.is_inc	= true,</div><div class='add'>+			.generation = trans-&gt;transid,</div><div class='add'>+		};</div><div class='add'>+		u64 owner = btrfs_delayed_ref_owner(node);</div><div class='add'>+		u64 offset = btrfs_delayed_ref_offset(node);</div><div class='add'>+</div><div class='ctx'> 		if (extent_op)</div><div class='ctx'> 			flags |= extent_op-&gt;flags_to_set;</div><div class='del'>-		ret = alloc_reserved_file_extent(trans, parent, ref_root,</div><div class='del'>-						 flags, ref-&gt;objectid,</div><div class='del'>-						 ref-&gt;offset, &amp;ins,</div><div class='del'>-						 node-&gt;ref_mod);</div><div class='add'>+</div><div class='add'>+		key.objectid = node-&gt;bytenr;</div><div class='add'>+		key.type = BTRFS_EXTENT_ITEM_KEY;</div><div class='add'>+		key.offset = node-&gt;num_bytes;</div><div class='add'>+</div><div class='add'>+		ret = alloc_reserved_file_extent(trans, parent, node-&gt;ref_root,</div><div class='add'>+						 flags, owner, offset, &amp;key,</div><div class='add'>+						 node-&gt;ref_mod,</div><div class='add'>+						 href-&gt;owning_root);</div><div class='add'>+		free_head_ref_squota_rsv(trans-&gt;fs_info, href);</div><div class='add'>+		if (!ret)</div><div class='add'>+			ret = btrfs_record_squota_delta(trans-&gt;fs_info, &amp;delta);</div><div class='ctx'> 	} else if (node-&gt;action == BTRFS_ADD_DELAYED_REF) {</div><div class='del'>-		ret = __btrfs_inc_extent_ref(trans, node, parent, ref_root,</div><div class='del'>-					     ref-&gt;objectid, ref-&gt;offset,</div><div class='del'>-					     node-&gt;ref_mod, extent_op);</div><div class='add'>+		ret = __btrfs_inc_extent_ref(trans, node, extent_op);</div><div class='ctx'> 	} else if (node-&gt;action == BTRFS_DROP_DELAYED_REF) {</div><div class='del'>-		ret = __btrfs_free_extent(trans, node, parent,</div><div class='del'>-					  ref_root, ref-&gt;objectid,</div><div class='del'>-					  ref-&gt;offset, node-&gt;ref_mod,</div><div class='del'>-					  extent_op);</div><div class='add'>+		ret = __btrfs_free_extent(trans, href, node, extent_op);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		BUG();</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1568,23 +1623,23 @@ static void __run_delayed_extent_op(struct btrfs_delayed_extent_op *extent_op,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int run_delayed_extent_op(struct btrfs_trans_handle *trans,</div><div class='del'>-				 struct btrfs_delayed_ref_head *head,</div><div class='add'>+				 const struct btrfs_delayed_ref_head *head,</div><div class='ctx'> 				 struct btrfs_delayed_extent_op *extent_op)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='add'>+	struct btrfs_root *root;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_extent_item *ei;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	u32 item_size;</div><div class='ctx'> 	int ret;</div><div class='del'>-	int err = 0;</div><div class='del'>-	int metadata = !extent_op-&gt;is_data;</div><div class='add'>+	int metadata = 1;</div><div class='ctx'> </div><div class='ctx'> 	if (TRANS_ABORTED(trans))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	if (metadata &amp;&amp; !btrfs_fs_incompat(fs_info, SKINNY_METADATA))</div><div class='add'>+	if (!btrfs_fs_incompat(fs_info, SKINNY_METADATA))</div><div class='ctx'> 		metadata = 0;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='hunk'>@@ -1595,19 +1650,18 @@ static int run_delayed_extent_op(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	if (metadata) {</div><div class='ctx'> 		key.type = BTRFS_METADATA_ITEM_KEY;</div><div class='del'>-		key.offset = extent_op-&gt;level;</div><div class='add'>+		key.offset = head-&gt;level;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		key.type = BTRFS_EXTENT_ITEM_KEY;</div><div class='ctx'> 		key.offset = head-&gt;num_bytes;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	root = btrfs_extent_root(fs_info, key.objectid);</div><div class='ctx'> again:</div><div class='del'>-	ret = btrfs_search_slot(trans, fs_info-&gt;extent_root, &amp;key, path, 0, 1);</div><div class='add'>+	ret = btrfs_search_slot(trans, root, &amp;key, path, 0, 1);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='del'>-		err = ret;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	if (ret &gt; 0) {</div><div class='add'>+		return ret;</div><div class='add'>+	} else if (ret &gt; 0) {</div><div class='ctx'> 		if (metadata) {</div><div class='ctx'> 			if (path-&gt;slots[0] &gt; 0) {</div><div class='ctx'> 				path-&gt;slots[0]--;</div><div class='hunk'>@@ -1623,68 +1677,77 @@ again:</div><div class='ctx'> 				metadata = 0;</div><div class='ctx'> </div><div class='ctx'> 				key.objectid = head-&gt;bytenr;</div><div class='del'>-				key.offset = head-&gt;num_bytes;</div><div class='ctx'> 				key.type = BTRFS_EXTENT_ITEM_KEY;</div><div class='add'>+				key.offset = head-&gt;num_bytes;</div><div class='ctx'> 				goto again;</div><div class='ctx'> 			}</div><div class='ctx'> 		} else {</div><div class='del'>-			err = -EIO;</div><div class='del'>-			goto out;</div><div class='add'>+			ret = -EUCLEAN;</div><div class='add'>+			btrfs_err(fs_info,</div><div class='add'>+		  "missing extent item for extent %llu num_bytes %llu level %d",</div><div class='add'>+				  head-&gt;bytenr, head-&gt;num_bytes, head-&gt;level);</div><div class='add'>+			return ret;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='del'>-	item_size = btrfs_item_size_nr(leaf, path-&gt;slots[0]);</div><div class='add'>+	item_size = btrfs_item_size(leaf, path-&gt;slots[0]);</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(item_size &lt; sizeof(*ei))) {</div><div class='del'>-		err = -EINVAL;</div><div class='del'>-		btrfs_print_v0_err(fs_info);</div><div class='del'>-		btrfs_abort_transaction(trans, err);</div><div class='del'>-		goto out;</div><div class='add'>+		ret = -EUCLEAN;</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+			  "unexpected extent item size, has %u expect &gt;= %zu",</div><div class='add'>+			  item_size, sizeof(*ei));</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ei = btrfs_item_ptr(leaf, path-&gt;slots[0], struct btrfs_extent_item);</div><div class='ctx'> 	__run_delayed_extent_op(extent_op, leaf, ei);</div><div class='ctx'> </div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return err;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int run_delayed_tree_ref(struct btrfs_trans_handle *trans,</div><div class='del'>-				struct btrfs_delayed_ref_node *node,</div><div class='add'>+				struct btrfs_delayed_ref_head *href,</div><div class='add'>+				const struct btrfs_delayed_ref_node *node,</div><div class='ctx'> 				struct btrfs_delayed_extent_op *extent_op,</div><div class='del'>-				int insert_reserved)</div><div class='add'>+				bool insert_reserved)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	struct btrfs_delayed_tree_ref *ref;</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	u64 parent = 0;</div><div class='ctx'> 	u64 ref_root = 0;</div><div class='ctx'> </div><div class='del'>-	ref = btrfs_delayed_node_to_tree_ref(node);</div><div class='del'>-	trace_run_delayed_tree_ref(trans-&gt;fs_info, node, ref, node-&gt;action);</div><div class='add'>+	trace_run_delayed_tree_ref(trans-&gt;fs_info, node);</div><div class='ctx'> </div><div class='ctx'> 	if (node-&gt;type == BTRFS_SHARED_BLOCK_REF_KEY)</div><div class='del'>-		parent = ref-&gt;parent;</div><div class='del'>-	ref_root = ref-&gt;root;</div><div class='add'>+		parent = node-&gt;parent;</div><div class='add'>+	ref_root = node-&gt;ref_root;</div><div class='ctx'> </div><div class='del'>-	if (node-&gt;ref_mod != 1) {</div><div class='add'>+	if (unlikely(node-&gt;ref_mod != 1)) {</div><div class='ctx'> 		btrfs_err(trans-&gt;fs_info,</div><div class='del'>-	"btree block(%llu) has %d references rather than 1: action %d ref_root %llu parent %llu",</div><div class='add'>+	"btree block %llu has %d references rather than 1: action %d ref_root %llu parent %llu",</div><div class='ctx'> 			  node-&gt;bytenr, node-&gt;ref_mod, node-&gt;action, ref_root,</div><div class='ctx'> 			  parent);</div><div class='del'>-		return -EIO;</div><div class='add'>+		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (node-&gt;action == BTRFS_ADD_DELAYED_REF &amp;&amp; insert_reserved) {</div><div class='del'>-		BUG_ON(!extent_op || !extent_op-&gt;update_flags);</div><div class='add'>+		struct btrfs_squota_delta delta = {</div><div class='add'>+			.root = href-&gt;owning_root,</div><div class='add'>+			.num_bytes = fs_info-&gt;nodesize,</div><div class='add'>+			.is_data = false,</div><div class='add'>+			.is_inc = true,</div><div class='add'>+			.generation = trans-&gt;transid,</div><div class='add'>+		};</div><div class='add'>+</div><div class='ctx'> 		ret = alloc_reserved_tree_block(trans, node, extent_op);</div><div class='add'>+		if (!ret)</div><div class='add'>+			btrfs_record_squota_delta(fs_info, &amp;delta);</div><div class='ctx'> 	} else if (node-&gt;action == BTRFS_ADD_DELAYED_REF) {</div><div class='del'>-		ret = __btrfs_inc_extent_ref(trans, node, parent, ref_root,</div><div class='del'>-					     ref-&gt;level, 0, 1, extent_op);</div><div class='add'>+		ret = __btrfs_inc_extent_ref(trans, node, extent_op);</div><div class='ctx'> 	} else if (node-&gt;action == BTRFS_DROP_DELAYED_REF) {</div><div class='del'>-		ret = __btrfs_free_extent(trans, node, parent, ref_root,</div><div class='del'>-					  ref-&gt;level, 0, 1, extent_op);</div><div class='add'>+		ret = __btrfs_free_extent(trans, href, node, extent_op);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		BUG();</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1693,67 +1756,43 @@ static int run_delayed_tree_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> /* helper function to actually process a single delayed ref entry */</div><div class='ctx'> static int run_one_delayed_ref(struct btrfs_trans_handle *trans,</div><div class='del'>-			       struct btrfs_delayed_ref_node *node,</div><div class='add'>+			       struct btrfs_delayed_ref_head *href,</div><div class='add'>+			       const struct btrfs_delayed_ref_node *node,</div><div class='ctx'> 			       struct btrfs_delayed_extent_op *extent_op,</div><div class='del'>-			       int insert_reserved)</div><div class='add'>+			       bool insert_reserved)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (TRANS_ABORTED(trans)) {</div><div class='del'>-		if (insert_reserved)</div><div class='del'>-			btrfs_pin_extent(trans, node-&gt;bytenr, node-&gt;num_bytes, 1);</div><div class='add'>+		if (insert_reserved) {</div><div class='add'>+			btrfs_pin_extent(trans, node-&gt;bytenr, node-&gt;num_bytes);</div><div class='add'>+			free_head_ref_squota_rsv(trans-&gt;fs_info, href);</div><div class='add'>+		}</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (node-&gt;type == BTRFS_TREE_BLOCK_REF_KEY ||</div><div class='ctx'> 	    node-&gt;type == BTRFS_SHARED_BLOCK_REF_KEY)</div><div class='del'>-		ret = run_delayed_tree_ref(trans, node, extent_op,</div><div class='add'>+		ret = run_delayed_tree_ref(trans, href, node, extent_op,</div><div class='ctx'> 					   insert_reserved);</div><div class='ctx'> 	else if (node-&gt;type == BTRFS_EXTENT_DATA_REF_KEY ||</div><div class='ctx'> 		 node-&gt;type == BTRFS_SHARED_DATA_REF_KEY)</div><div class='del'>-		ret = run_delayed_data_ref(trans, node, extent_op,</div><div class='add'>+		ret = run_delayed_data_ref(trans, href, node, extent_op,</div><div class='ctx'> 					   insert_reserved);</div><div class='add'>+	else if (node-&gt;type == BTRFS_EXTENT_OWNER_REF_KEY)</div><div class='add'>+		ret = 0;</div><div class='ctx'> 	else</div><div class='ctx'> 		BUG();</div><div class='ctx'> 	if (ret &amp;&amp; insert_reserved)</div><div class='del'>-		btrfs_pin_extent(trans, node-&gt;bytenr, node-&gt;num_bytes, 1);</div><div class='add'>+		btrfs_pin_extent(trans, node-&gt;bytenr, node-&gt;num_bytes);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		btrfs_err(trans-&gt;fs_info,</div><div class='add'>+"failed to run delayed ref for logical %llu num_bytes %llu type %u action %u ref_mod %d: %d",</div><div class='add'>+			  node-&gt;bytenr, node-&gt;num_bytes, node-&gt;type,</div><div class='add'>+			  node-&gt;action, node-&gt;ref_mod, ret);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline struct btrfs_delayed_ref_node *</div><div class='del'>-select_delayed_ref(struct btrfs_delayed_ref_head *head)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_delayed_ref_node *ref;</div><div class='del'>-</div><div class='del'>-	if (RB_EMPTY_ROOT(&amp;head-&gt;ref_tree.rb_root))</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Select a delayed ref of type BTRFS_ADD_DELAYED_REF first.</div><div class='del'>-	 * This is to prevent a ref count from going down to zero, which deletes</div><div class='del'>-	 * the extent item from the extent tree, when there still are references</div><div class='del'>-	 * to add, which would fail because they would not find the extent item.</div><div class='del'>-	 */</div><div class='del'>-	if (!list_empty(&amp;head-&gt;ref_add_list))</div><div class='del'>-		return list_first_entry(&amp;head-&gt;ref_add_list,</div><div class='del'>-				struct btrfs_delayed_ref_node, add_list);</div><div class='del'>-</div><div class='del'>-	ref = rb_entry(rb_first_cached(&amp;head-&gt;ref_tree),</div><div class='del'>-		       struct btrfs_delayed_ref_node, ref_node);</div><div class='del'>-	ASSERT(list_empty(&amp;ref-&gt;add_list));</div><div class='del'>-	return ref;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void unselect_delayed_ref_head(struct btrfs_delayed_ref_root *delayed_refs,</div><div class='del'>-				      struct btrfs_delayed_ref_head *head)</div><div class='del'>-{</div><div class='del'>-	spin_lock(&amp;delayed_refs-&gt;lock);</div><div class='del'>-	head-&gt;processing = 0;</div><div class='del'>-	delayed_refs-&gt;num_heads_ready++;</div><div class='del'>-	spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='del'>-	btrfs_delayed_ref_unlock(head);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static struct btrfs_delayed_extent_op *cleanup_extent_op(</div><div class='ctx'> 				struct btrfs_delayed_ref_head *head)</div><div class='ctx'> {</div><div class='hunk'>@@ -1786,28 +1825,38 @@ static int run_and_cleanup_extent_op(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	return ret ? ret : 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_cleanup_ref_head_accounting(struct btrfs_fs_info *fs_info,</div><div class='add'>+u64 btrfs_cleanup_ref_head_accounting(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				  struct btrfs_delayed_ref_root *delayed_refs,</div><div class='ctx'> 				  struct btrfs_delayed_ref_head *head)</div><div class='ctx'> {</div><div class='del'>-	int nr_items = 1;	/* Dropping this ref head update. */</div><div class='add'>+	u64 ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We had csum deletions accounted for in our delayed refs rsv, we need</div><div class='ctx'> 	 * to drop the csum leaves for this update from our delayed_refs_rsv.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (head-&gt;total_ref_mod &lt; 0 &amp;&amp; head-&gt;is_data) {</div><div class='add'>+		int nr_csums;</div><div class='add'>+</div><div class='ctx'> 		spin_lock(&amp;delayed_refs-&gt;lock);</div><div class='ctx'> 		delayed_refs-&gt;pending_csums -= head-&gt;num_bytes;</div><div class='ctx'> 		spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='del'>-		nr_items += btrfs_csum_bytes_to_leaves(fs_info, head-&gt;num_bytes);</div><div class='add'>+		nr_csums = btrfs_csum_bytes_to_leaves(fs_info, head-&gt;num_bytes);</div><div class='add'>+</div><div class='add'>+		btrfs_delayed_refs_rsv_release(fs_info, 0, nr_csums);</div><div class='add'>+</div><div class='add'>+		ret = btrfs_calc_delayed_ref_csum_bytes(fs_info, nr_csums);</div><div class='ctx'> 	}</div><div class='add'>+	/* must_insert_reserved can be set only if we didn't run the head ref. */</div><div class='add'>+	if (head-&gt;must_insert_reserved)</div><div class='add'>+		free_head_ref_squota_rsv(fs_info, head);</div><div class='ctx'> </div><div class='del'>-	btrfs_delayed_refs_rsv_release(fs_info, nr_items);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int cleanup_ref_head(struct btrfs_trans_handle *trans,</div><div class='del'>-			    struct btrfs_delayed_ref_head *head)</div><div class='add'>+			    struct btrfs_delayed_ref_head *head,</div><div class='add'>+			    u64 *bytes_released)</div><div class='ctx'> {</div><div class='ctx'> </div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='hunk'>@@ -1818,7 +1867,7 @@ static int cleanup_ref_head(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	ret = run_and_cleanup_extent_op(trans, head);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='del'>-		unselect_delayed_ref_head(delayed_refs, head);</div><div class='add'>+		btrfs_unselect_ref_head(delayed_refs, head);</div><div class='ctx'> 		btrfs_debug(fs_info, "run_delayed_extent_op returned %d", ret);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	} else if (ret) {</div><div class='hunk'>@@ -1837,19 +1886,22 @@ static int cleanup_ref_head(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='ctx'> 		return 1;</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_delete_ref_head(delayed_refs, head);</div><div class='add'>+	btrfs_delete_ref_head(fs_info, delayed_refs, head);</div><div class='ctx'> 	spin_unlock(&amp;head-&gt;lock);</div><div class='ctx'> 	spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	if (head-&gt;must_insert_reserved) {</div><div class='del'>-		btrfs_pin_extent(trans, head-&gt;bytenr, head-&gt;num_bytes, 1);</div><div class='add'>+		btrfs_pin_extent(trans, head-&gt;bytenr, head-&gt;num_bytes);</div><div class='ctx'> 		if (head-&gt;is_data) {</div><div class='del'>-			ret = btrfs_del_csums(trans, fs_info-&gt;csum_root,</div><div class='del'>-					      head-&gt;bytenr, head-&gt;num_bytes);</div><div class='add'>+			struct btrfs_root *csum_root;</div><div class='add'>+</div><div class='add'>+			csum_root = btrfs_csum_root(fs_info, head-&gt;bytenr);</div><div class='add'>+			ret = btrfs_del_csums(trans, csum_root, head-&gt;bytenr,</div><div class='add'>+					      head-&gt;num_bytes);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_cleanup_ref_head_accounting(fs_info, delayed_refs, head);</div><div class='add'>+	*bytes_released += btrfs_cleanup_ref_head_accounting(fs_info, delayed_refs, head);</div><div class='ctx'> </div><div class='ctx'> 	trace_run_delayed_ref_head(fs_info, head, 0);</div><div class='ctx'> 	btrfs_delayed_ref_unlock(head);</div><div class='hunk'>@@ -1857,48 +1909,15 @@ static int cleanup_ref_head(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct btrfs_delayed_ref_head *btrfs_obtain_ref_head(</div><div class='del'>-					struct btrfs_trans_handle *trans)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_delayed_ref_root *delayed_refs =</div><div class='del'>-		&amp;trans-&gt;transaction-&gt;delayed_refs;</div><div class='del'>-	struct btrfs_delayed_ref_head *head = NULL;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;delayed_refs-&gt;lock);</div><div class='del'>-	head = btrfs_select_ref_head(delayed_refs);</div><div class='del'>-	if (!head) {</div><div class='del'>-		spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='del'>-		return head;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Grab the lock that says we are going to process all the refs for</div><div class='del'>-	 * this head</div><div class='del'>-	 */</div><div class='del'>-	ret = btrfs_delayed_ref_lock(delayed_refs, head);</div><div class='del'>-	spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * We may have dropped the spin lock to get the head mutex lock, and</div><div class='del'>-	 * that might have given someone else time to free the head.  If that's</div><div class='del'>-	 * true, it has been removed from our list and we can move on.</div><div class='del'>-	 */</div><div class='del'>-	if (ret == -EAGAIN)</div><div class='del'>-		head = ERR_PTR(-EAGAIN);</div><div class='del'>-</div><div class='del'>-	return head;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int btrfs_run_delayed_refs_for_head(struct btrfs_trans_handle *trans,</div><div class='del'>-				    struct btrfs_delayed_ref_head *locked_ref,</div><div class='del'>-				    unsigned long *run_refs)</div><div class='add'>+					   struct btrfs_delayed_ref_head *locked_ref,</div><div class='add'>+					   u64 *bytes_released)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_delayed_ref_root *delayed_refs;</div><div class='ctx'> 	struct btrfs_delayed_extent_op *extent_op;</div><div class='ctx'> 	struct btrfs_delayed_ref_node *ref;</div><div class='del'>-	int must_insert_reserved = 0;</div><div class='add'>+	bool must_insert_reserved;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	delayed_refs = &amp;trans-&gt;transaction-&gt;delayed_refs;</div><div class='hunk'>@@ -1906,16 +1925,14 @@ static int btrfs_run_delayed_refs_for_head(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	lockdep_assert_held(&amp;locked_ref-&gt;mutex);</div><div class='ctx'> 	lockdep_assert_held(&amp;locked_ref-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	while ((ref = select_delayed_ref(locked_ref))) {</div><div class='add'>+	while ((ref = btrfs_select_delayed_ref(locked_ref))) {</div><div class='ctx'> 		if (ref-&gt;seq &amp;&amp;</div><div class='ctx'> 		    btrfs_check_delayed_seq(fs_info, ref-&gt;seq)) {</div><div class='ctx'> 			spin_unlock(&amp;locked_ref-&gt;lock);</div><div class='del'>-			unselect_delayed_ref_head(delayed_refs, locked_ref);</div><div class='add'>+			btrfs_unselect_ref_head(delayed_refs, locked_ref);</div><div class='ctx'> 			return -EAGAIN;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		(*run_refs)++;</div><div class='del'>-		ref-&gt;in_tree = 0;</div><div class='ctx'> 		rb_erase_cached(&amp;ref-&gt;ref_node, &amp;locked_ref-&gt;ref_tree);</div><div class='ctx'> 		RB_CLEAR_NODE(&amp;ref-&gt;ref_node);</div><div class='ctx'> 		if (!list_empty(&amp;ref-&gt;add_list))</div><div class='hunk'>@@ -1935,28 +1952,33 @@ static int btrfs_run_delayed_refs_for_head(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		default:</div><div class='ctx'> 			WARN_ON(1);</div><div class='ctx'> 		}</div><div class='del'>-		atomic_dec(&amp;delayed_refs-&gt;num_entries);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Record the must_insert_reserved flag before we drop the</div><div class='ctx'> 		 * spin lock.</div><div class='ctx'> 		 */</div><div class='ctx'> 		must_insert_reserved = locked_ref-&gt;must_insert_reserved;</div><div class='del'>-		locked_ref-&gt;must_insert_reserved = 0;</div><div class='add'>+		/*</div><div class='add'>+		 * Unsetting this on the head ref relinquishes ownership of</div><div class='add'>+		 * the rsv_bytes, so it is critical that every possible code</div><div class='add'>+		 * path from here forward frees all reserves including qgroup</div><div class='add'>+		 * reserve.</div><div class='add'>+		 */</div><div class='add'>+		locked_ref-&gt;must_insert_reserved = false;</div><div class='ctx'> </div><div class='ctx'> 		extent_op = locked_ref-&gt;extent_op;</div><div class='ctx'> 		locked_ref-&gt;extent_op = NULL;</div><div class='ctx'> 		spin_unlock(&amp;locked_ref-&gt;lock);</div><div class='ctx'> </div><div class='del'>-		ret = run_one_delayed_ref(trans, ref, extent_op,</div><div class='add'>+		ret = run_one_delayed_ref(trans, locked_ref, ref, extent_op,</div><div class='ctx'> 					  must_insert_reserved);</div><div class='add'>+		btrfs_delayed_refs_rsv_release(fs_info, 1, 0);</div><div class='add'>+		*bytes_released += btrfs_calc_delayed_ref_bytes(fs_info, 1);</div><div class='ctx'> </div><div class='ctx'> 		btrfs_free_delayed_extent_op(extent_op);</div><div class='ctx'> 		if (ret) {</div><div class='del'>-			unselect_delayed_ref_head(delayed_refs, locked_ref);</div><div class='add'>+			btrfs_unselect_ref_head(delayed_refs, locked_ref);</div><div class='ctx'> 			btrfs_put_delayed_ref(ref);</div><div class='del'>-			btrfs_debug(fs_info, "run_one_delayed_ref returned %d",</div><div class='del'>-				    ret);</div><div class='ctx'> 			return ret;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -1964,7 +1986,7 @@ static int btrfs_run_delayed_refs_for_head(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> </div><div class='ctx'> 		spin_lock(&amp;locked_ref-&gt;lock);</div><div class='del'>-		btrfs_merge_delayed_refs(trans, delayed_refs, locked_ref);</div><div class='add'>+		btrfs_merge_delayed_refs(fs_info, delayed_refs, locked_ref);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -1975,20 +1997,30 @@ static int btrfs_run_delayed_refs_for_head(struct btrfs_trans_handle *trans,</div><div class='ctx'>  * Returns -ENOMEM or -EIO on failure and will abort the transaction.</div><div class='ctx'>  */</div><div class='ctx'> static noinline int __btrfs_run_delayed_refs(struct btrfs_trans_handle *trans,</div><div class='del'>-					     unsigned long nr)</div><div class='add'>+					     u64 min_bytes)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_delayed_ref_root *delayed_refs;</div><div class='ctx'> 	struct btrfs_delayed_ref_head *locked_ref = NULL;</div><div class='del'>-	ktime_t start = ktime_get();</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	unsigned long count = 0;</div><div class='del'>-	unsigned long actual_count = 0;</div><div class='add'>+	unsigned long max_count = 0;</div><div class='add'>+	u64 bytes_processed = 0;</div><div class='ctx'> </div><div class='ctx'> 	delayed_refs = &amp;trans-&gt;transaction-&gt;delayed_refs;</div><div class='add'>+	if (min_bytes == 0) {</div><div class='add'>+		/*</div><div class='add'>+		 * We may be subject to a harmless race if some task is</div><div class='add'>+		 * concurrently adding or removing a delayed ref, so silence</div><div class='add'>+		 * KCSAN and similar tools.</div><div class='add'>+		 */</div><div class='add'>+		max_count = data_race(delayed_refs-&gt;num_heads_ready);</div><div class='add'>+		min_bytes = U64_MAX;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	do {</div><div class='ctx'> 		if (!locked_ref) {</div><div class='del'>-			locked_ref = btrfs_obtain_ref_head(trans);</div><div class='add'>+			locked_ref = btrfs_select_ref_head(fs_info, delayed_refs);</div><div class='ctx'> 			if (IS_ERR_OR_NULL(locked_ref)) {</div><div class='ctx'> 				if (PTR_ERR(locked_ref) == -EAGAIN) {</div><div class='ctx'> 					continue;</div><div class='hunk'>@@ -2011,10 +2043,9 @@ static noinline int __btrfs_run_delayed_refs(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		 * insert_inline_extent_backref()).</div><div class='ctx'> 		 */</div><div class='ctx'> 		spin_lock(&amp;locked_ref-&gt;lock);</div><div class='del'>-		btrfs_merge_delayed_refs(trans, delayed_refs, locked_ref);</div><div class='add'>+		btrfs_merge_delayed_refs(fs_info, delayed_refs, locked_ref);</div><div class='ctx'> </div><div class='del'>-		ret = btrfs_run_delayed_refs_for_head(trans, locked_ref,</div><div class='del'>-						      &amp;actual_count);</div><div class='add'>+		ret = btrfs_run_delayed_refs_for_head(trans, locked_ref, &amp;bytes_processed);</div><div class='ctx'> 		if (ret &lt; 0 &amp;&amp; ret != -EAGAIN) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Error, btrfs_run_delayed_refs_for_head already</div><div class='hunk'>@@ -2026,7 +2057,7 @@ static noinline int __btrfs_run_delayed_refs(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			 * Success, perform the usual cleanup of a processed</div><div class='ctx'> 			 * head</div><div class='ctx'> 			 */</div><div class='del'>-			ret = cleanup_ref_head(trans, locked_ref);</div><div class='add'>+			ret = cleanup_ref_head(trans, locked_ref, &amp;bytes_processed);</div><div class='ctx'> 			if (ret &gt; 0 ) {</div><div class='ctx'> 				/* We dropped our lock, we need to loop. */</div><div class='ctx'> 				ret = 0;</div><div class='hunk'>@@ -2043,26 +2074,10 @@ static noinline int __btrfs_run_delayed_refs(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 		locked_ref = NULL;</div><div class='ctx'> 		cond_resched();</div><div class='del'>-	} while ((nr != -1 &amp;&amp; count &lt; nr) || locked_ref);</div><div class='add'>+	} while ((min_bytes != U64_MAX &amp;&amp; bytes_processed &lt; min_bytes) ||</div><div class='add'>+		 (max_count &gt; 0 &amp;&amp; count &lt; max_count) ||</div><div class='add'>+		 locked_ref);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * We don't want to include ref heads since we can have empty ref heads</div><div class='del'>-	 * and those will drastically skew our runtime down since we just do</div><div class='del'>-	 * accounting, no actual extent tree updates.</div><div class='del'>-	 */</div><div class='del'>-	if (actual_count &gt; 0) {</div><div class='del'>-		u64 runtime = ktime_to_ns(ktime_sub(ktime_get(), start));</div><div class='del'>-		u64 avg;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * We weigh the current average higher than our current runtime</div><div class='del'>-		 * to avoid large swings in the average.</div><div class='del'>-		 */</div><div class='del'>-		spin_lock(&amp;delayed_refs-&gt;lock);</div><div class='del'>-		avg = fs_info-&gt;avg_delayed_ref_runtime * 3 + runtime;</div><div class='del'>-		fs_info-&gt;avg_delayed_ref_runtime = avg &gt;&gt; 2;	/* div by 4 */</div><div class='del'>-		spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='del'>-	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2110,24 +2125,25 @@ static u64 find_middle(struct rb_root *root)</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * this starts processing the delayed reference count updates and</div><div class='del'>- * extent insertions we have queued up so far.  count can be</div><div class='del'>- * 0, which means to process everything in the tree at the start</div><div class='del'>- * of the run (but not newly added entries), or it can be some target</div><div class='del'>- * number you'd like to process.</div><div class='add'>+ * Start processing the delayed reference count updates and extent insertions</div><div class='add'>+ * we have queued up so far.</div><div class='add'>+ *</div><div class='add'>+ * @trans:	Transaction handle.</div><div class='add'>+ * @min_bytes:	How many bytes of delayed references to process. After this</div><div class='add'>+ *		many bytes we stop processing delayed references if there are</div><div class='add'>+ *		any more. If 0 it means to run all existing delayed references,</div><div class='add'>+ *		but not new ones added after running all existing ones.</div><div class='add'>+ *		Use (u64)-1 (U64_MAX) to run all existing delayed references</div><div class='add'>+ *		plus any new ones that are added.</div><div class='ctx'>  *</div><div class='ctx'>  * Returns 0 on success or if called with an aborted transaction</div><div class='ctx'>  * Returns &lt;0 on error and aborts the transaction</div><div class='ctx'>  */</div><div class='del'>-int btrfs_run_delayed_refs(struct btrfs_trans_handle *trans,</div><div class='del'>-			   unsigned long count)</div><div class='add'>+int btrfs_run_delayed_refs(struct btrfs_trans_handle *trans, u64 min_bytes)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='del'>-	struct rb_node *node;</div><div class='ctx'> 	struct btrfs_delayed_ref_root *delayed_refs;</div><div class='del'>-	struct btrfs_delayed_ref_head *head;</div><div class='ctx'> 	int ret;</div><div class='del'>-	int run_all = count == (unsigned long)-1;</div><div class='ctx'> </div><div class='ctx'> 	/* We'll clean this up in btrfs_cleanup_transaction */</div><div class='ctx'> 	if (TRANS_ABORTED(trans))</div><div class='hunk'>@@ -2137,48 +2153,35 @@ int btrfs_run_delayed_refs(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	delayed_refs = &amp;trans-&gt;transaction-&gt;delayed_refs;</div><div class='del'>-	if (count == 0)</div><div class='del'>-		count = delayed_refs-&gt;num_heads_ready;</div><div class='del'>-</div><div class='ctx'> again:</div><div class='ctx'> #ifdef SCRAMBLE_DELAYED_REFS</div><div class='ctx'> 	delayed_refs-&gt;run_delayed_start = find_middle(&amp;delayed_refs-&gt;root);</div><div class='ctx'> #endif</div><div class='del'>-	ret = __btrfs_run_delayed_refs(trans, count);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='add'>+	ret = __btrfs_run_delayed_refs(trans, min_bytes);</div><div class='add'>+	if (unlikely(ret &lt; 0)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (run_all) {</div><div class='add'>+	if (min_bytes == U64_MAX) {</div><div class='ctx'> 		btrfs_create_pending_block_groups(trans);</div><div class='ctx'> </div><div class='ctx'> 		spin_lock(&amp;delayed_refs-&gt;lock);</div><div class='del'>-		node = rb_first_cached(&amp;delayed_refs-&gt;href_root);</div><div class='del'>-		if (!node) {</div><div class='add'>+		if (xa_empty(&amp;delayed_refs-&gt;head_refs)) {</div><div class='ctx'> 			spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='del'>-			goto out;</div><div class='add'>+			return 0;</div><div class='ctx'> 		}</div><div class='del'>-		head = rb_entry(node, struct btrfs_delayed_ref_head,</div><div class='del'>-				href_node);</div><div class='del'>-		refcount_inc(&amp;head-&gt;refs);</div><div class='ctx'> 		spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='ctx'> </div><div class='del'>-		/* Mutex was contended, block until it's released and retry. */</div><div class='del'>-		mutex_lock(&amp;head-&gt;mutex);</div><div class='del'>-		mutex_unlock(&amp;head-&gt;mutex);</div><div class='del'>-</div><div class='del'>-		btrfs_put_delayed_ref_head(head);</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 		goto again;</div><div class='ctx'> 	}</div><div class='del'>-out:</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_set_disk_extent_flags(struct btrfs_trans_handle *trans,</div><div class='del'>-				struct extent_buffer *eb, u64 flags,</div><div class='del'>-				int level, int is_data)</div><div class='add'>+				struct extent_buffer *eb, u64 flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_delayed_extent_op *extent_op;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -2190,22 +2193,21 @@ int btrfs_set_disk_extent_flags(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	extent_op-&gt;flags_to_set = flags;</div><div class='ctx'> 	extent_op-&gt;update_flags = true;</div><div class='ctx'> 	extent_op-&gt;update_key = false;</div><div class='del'>-	extent_op-&gt;is_data = is_data ? true : false;</div><div class='del'>-	extent_op-&gt;level = level;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_add_delayed_extent_op(trans, eb-&gt;start, eb-&gt;len, extent_op);</div><div class='add'>+	ret = btrfs_add_delayed_extent_op(trans, eb-&gt;start, eb-&gt;len,</div><div class='add'>+					  btrfs_header_level(eb), extent_op);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		btrfs_free_delayed_extent_op(extent_op);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline int check_delayed_ref(struct btrfs_root *root,</div><div class='add'>+static noinline int check_delayed_ref(struct btrfs_inode *inode,</div><div class='ctx'> 				      struct btrfs_path *path,</div><div class='del'>-				      u64 objectid, u64 offset, u64 bytenr)</div><div class='add'>+				      u64 offset, u64 bytenr)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	struct btrfs_delayed_ref_head *head;</div><div class='ctx'> 	struct btrfs_delayed_ref_node *ref;</div><div class='del'>-	struct btrfs_delayed_data_ref *data_ref;</div><div class='ctx'> 	struct btrfs_delayed_ref_root *delayed_refs;</div><div class='ctx'> 	struct btrfs_transaction *cur_trans;</div><div class='ctx'> 	struct rb_node *node;</div><div class='hunk'>@@ -2221,7 +2223,7 @@ static noinline int check_delayed_ref(struct btrfs_root *root,</div><div class='ctx'> </div><div class='ctx'> 	delayed_refs = &amp;cur_trans-&gt;delayed_refs;</div><div class='ctx'> 	spin_lock(&amp;delayed_refs-&gt;lock);</div><div class='del'>-	head = btrfs_find_delayed_ref_head(delayed_refs, bytenr);</div><div class='add'>+	head = btrfs_find_delayed_ref_head(root-&gt;fs_info, delayed_refs, bytenr);</div><div class='ctx'> 	if (!head) {</div><div class='ctx'> 		spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='ctx'> 		btrfs_put_transaction(cur_trans);</div><div class='hunk'>@@ -2229,6 +2231,12 @@ static noinline int check_delayed_ref(struct btrfs_root *root,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!mutex_trylock(&amp;head-&gt;mutex)) {</div><div class='add'>+		if (path-&gt;nowait) {</div><div class='add'>+			spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='add'>+			btrfs_put_transaction(cur_trans);</div><div class='add'>+			return -EAGAIN;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		refcount_inc(&amp;head-&gt;refs);</div><div class='ctx'> 		spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='ctx'> </div><div class='hunk'>@@ -2253,6 +2261,9 @@ static noinline int check_delayed_ref(struct btrfs_root *root,</div><div class='ctx'> 	 */</div><div class='ctx'> 	for (node = rb_first_cached(&amp;head-&gt;ref_tree); node;</div><div class='ctx'> 	     node = rb_next(node)) {</div><div class='add'>+		u64 ref_owner;</div><div class='add'>+		u64 ref_offset;</div><div class='add'>+</div><div class='ctx'> 		ref = rb_entry(node, struct btrfs_delayed_ref_node, ref_node);</div><div class='ctx'> 		/* If it's a shared ref we know a cross reference exists */</div><div class='ctx'> 		if (ref-&gt;type != BTRFS_EXTENT_DATA_REF_KEY) {</div><div class='hunk'>@@ -2260,15 +2271,15 @@ static noinline int check_delayed_ref(struct btrfs_root *root,</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		data_ref = btrfs_delayed_node_to_data_ref(ref);</div><div class='add'>+		ref_owner = btrfs_delayed_ref_owner(ref);</div><div class='add'>+		ref_offset = btrfs_delayed_ref_offset(ref);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * If our ref doesn't match the one we're currently looking at</div><div class='ctx'> 		 * then we have a cross reference.</div><div class='ctx'> 		 */</div><div class='del'>-		if (data_ref-&gt;root != root-&gt;root_key.objectid ||</div><div class='del'>-		    data_ref-&gt;objectid != objectid ||</div><div class='del'>-		    data_ref-&gt;offset != offset) {</div><div class='add'>+		if (ref-&gt;ref_root != btrfs_root_id(root) ||</div><div class='add'>+		    ref_owner != btrfs_ino(inode) || ref_offset != offset) {</div><div class='ctx'> 			ret = 1;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2279,103 +2290,167 @@ static noinline int check_delayed_ref(struct btrfs_root *root,</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline int check_committed_ref(struct btrfs_root *root,</div><div class='add'>+/*</div><div class='add'>+ * Check if there are references for a data extent other than the one belonging</div><div class='add'>+ * to the given inode and offset.</div><div class='add'>+ *</div><div class='add'>+ * @inode:     The only inode we expect to find associated with the data extent.</div><div class='add'>+ * @path:      A path to use for searching the extent tree.</div><div class='add'>+ * @offset:    The only offset we expect to find associated with the data extent.</div><div class='add'>+ * @bytenr:    The logical address of the data extent.</div><div class='add'>+ *</div><div class='add'>+ * When the extent does not have any other references other than the one we</div><div class='add'>+ * expect to find, we always return a value of 0 with the path having a locked</div><div class='add'>+ * leaf that contains the extent's extent item - this is necessary to ensure</div><div class='add'>+ * we don't race with a task running delayed references, and our caller must</div><div class='add'>+ * have such a path when calling check_delayed_ref() - it must lock a delayed</div><div class='add'>+ * ref head while holding the leaf locked. In case the extent item is not found</div><div class='add'>+ * in the extent tree, we return -ENOENT with the path having the leaf (locked)</div><div class='add'>+ * where the extent item should be, in order to prevent races with another task</div><div class='add'>+ * running delayed references, so that we don't miss any reference when calling</div><div class='add'>+ * check_delayed_ref().</div><div class='add'>+ *</div><div class='add'>+ * Note: this may return false positives, and this is because we want to be</div><div class='add'>+ *       quick here as we're called in write paths (when flushing delalloc and</div><div class='add'>+ *       in the direct IO write path). For example we can have an extent with</div><div class='add'>+ *       a single reference but that reference is not inlined, or we may have</div><div class='add'>+ *       many references in the extent tree but we also have delayed references</div><div class='add'>+ *       that cancel all the reference except the one for our inode and offset,</div><div class='add'>+ *       but it would be expensive to do such checks and complex due to all</div><div class='add'>+ *       locking to avoid races between the checks and flushing delayed refs,</div><div class='add'>+ *       plus non-inline references may be located on leaves other than the one</div><div class='add'>+ *       that contains the extent item in the extent tree. The important thing</div><div class='add'>+ *       here is to not return false negatives and that the false positives are</div><div class='add'>+ *       not very common.</div><div class='add'>+ *</div><div class='add'>+ * Returns: 0 if there are no cross references and with the path having a locked</div><div class='add'>+ *          leaf from the extent tree that contains the extent's extent item.</div><div class='add'>+ *</div><div class='add'>+ *          1 if there are cross references (false positives can happen).</div><div class='add'>+ *</div><div class='add'>+ *          &lt; 0 in case of an error. In case of -ENOENT the leaf in the extent</div><div class='add'>+ *          tree where the extent item should be located at is read locked and</div><div class='add'>+ *          accessible in the given path.</div><div class='add'>+ */</div><div class='add'>+static noinline int check_committed_ref(struct btrfs_inode *inode,</div><div class='ctx'> 					struct btrfs_path *path,</div><div class='del'>-					u64 objectid, u64 offset, u64 bytenr,</div><div class='del'>-					bool strict)</div><div class='add'>+					u64 offset, u64 bytenr)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='del'>-	struct btrfs_root *extent_root = fs_info-&gt;extent_root;</div><div class='add'>+	struct btrfs_root *extent_root = btrfs_extent_root(fs_info, bytenr);</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_extent_data_ref *ref;</div><div class='ctx'> 	struct btrfs_extent_inline_ref *iref;</div><div class='ctx'> 	struct btrfs_extent_item *ei;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	u32 item_size;</div><div class='add'>+	u32 expected_size;</div><div class='ctx'> 	int type;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = bytenr;</div><div class='del'>-	key.offset = (u64)-1;</div><div class='ctx'> 	key.type = BTRFS_EXTENT_ITEM_KEY;</div><div class='add'>+	key.offset = (u64)-1;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_search_slot(NULL, extent_root, &amp;key, path, 0, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-	BUG_ON(ret == 0); /* Corruption */</div><div class='add'>+		return ret;</div><div class='add'>+	if (unlikely(ret == 0)) {</div><div class='add'>+		/*</div><div class='add'>+		 * Key with offset -1 found, there would have to exist an extent</div><div class='add'>+		 * item with such offset, but this is out of the valid range.</div><div class='add'>+		 */</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	ret = -ENOENT;</div><div class='ctx'> 	if (path-&gt;slots[0] == 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> </div><div class='ctx'> 	path-&gt;slots[0]--;</div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	btrfs_item_key_to_cpu(leaf, &amp;key, path-&gt;slots[0]);</div><div class='ctx'> </div><div class='ctx'> 	if (key.objectid != bytenr || key.type != BTRFS_EXTENT_ITEM_KEY)</div><div class='del'>-		goto out;</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> </div><div class='del'>-	ret = 1;</div><div class='del'>-	item_size = btrfs_item_size_nr(leaf, path-&gt;slots[0]);</div><div class='add'>+	item_size = btrfs_item_size(leaf, path-&gt;slots[0]);</div><div class='ctx'> 	ei = btrfs_item_ptr(leaf, path-&gt;slots[0], struct btrfs_extent_item);</div><div class='add'>+	expected_size = sizeof(*ei) + btrfs_extent_inline_ref_size(BTRFS_EXTENT_DATA_REF_KEY);</div><div class='ctx'> </div><div class='del'>-	/* If extent item has more than 1 inline ref then it's shared */</div><div class='del'>-	if (item_size != sizeof(*ei) +</div><div class='del'>-	    btrfs_extent_inline_ref_size(BTRFS_EXTENT_DATA_REF_KEY))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If extent created before last snapshot =&gt; it's shared unless the</div><div class='del'>-	 * snapshot has been deleted. Use the heuristic if strict is false.</div><div class='del'>-	 */</div><div class='del'>-	if (!strict &amp;&amp;</div><div class='del'>-	    (btrfs_extent_generation(leaf, ei) &lt;=</div><div class='del'>-	     btrfs_root_last_snapshot(&amp;root-&gt;root_item)))</div><div class='del'>-		goto out;</div><div class='add'>+	/* No inline refs; we need to bail before checking for owner ref. */</div><div class='add'>+	if (item_size == sizeof(*ei))</div><div class='add'>+		return 1;</div><div class='ctx'> </div><div class='add'>+	/* Check for an owner ref; skip over it to the real inline refs. */</div><div class='ctx'> 	iref = (struct btrfs_extent_inline_ref *)(ei + 1);</div><div class='add'>+	type = btrfs_get_extent_inline_ref_type(leaf, iref, BTRFS_REF_TYPE_DATA);</div><div class='add'>+	if (btrfs_fs_incompat(fs_info, SIMPLE_QUOTA) &amp;&amp; type == BTRFS_EXTENT_OWNER_REF_KEY) {</div><div class='add'>+		expected_size += btrfs_extent_inline_ref_size(BTRFS_EXTENT_OWNER_REF_KEY);</div><div class='add'>+		iref = (struct btrfs_extent_inline_ref *)(iref + 1);</div><div class='add'>+		type = btrfs_get_extent_inline_ref_type(leaf, iref, BTRFS_REF_TYPE_DATA);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* If extent item has more than 1 inline ref then it's shared */</div><div class='add'>+	if (item_size != expected_size)</div><div class='add'>+		return 1;</div><div class='ctx'> </div><div class='ctx'> 	/* If this extent has SHARED_DATA_REF then it's shared */</div><div class='del'>-	type = btrfs_get_extent_inline_ref_type(leaf, iref, BTRFS_REF_TYPE_DATA);</div><div class='ctx'> 	if (type != BTRFS_EXTENT_DATA_REF_KEY)</div><div class='del'>-		goto out;</div><div class='add'>+		return 1;</div><div class='ctx'> </div><div class='ctx'> 	ref = (struct btrfs_extent_data_ref *)(&amp;iref-&gt;offset);</div><div class='ctx'> 	if (btrfs_extent_refs(leaf, ei) !=</div><div class='ctx'> 	    btrfs_extent_data_ref_count(leaf, ref) ||</div><div class='del'>-	    btrfs_extent_data_ref_root(leaf, ref) !=</div><div class='del'>-	    root-&gt;root_key.objectid ||</div><div class='del'>-	    btrfs_extent_data_ref_objectid(leaf, ref) != objectid ||</div><div class='add'>+	    btrfs_extent_data_ref_root(leaf, ref) != btrfs_root_id(root) ||</div><div class='add'>+	    btrfs_extent_data_ref_objectid(leaf, ref) != btrfs_ino(inode) ||</div><div class='ctx'> 	    btrfs_extent_data_ref_offset(leaf, ref) != offset)</div><div class='del'>-		goto out;</div><div class='add'>+		return 1;</div><div class='ctx'> </div><div class='del'>-	ret = 0;</div><div class='del'>-out:</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_cross_ref_exist(struct btrfs_root *root, u64 objectid, u64 offset,</div><div class='del'>-			  u64 bytenr, bool strict)</div><div class='add'>+int btrfs_cross_ref_exist(struct btrfs_inode *inode, u64 offset,</div><div class='add'>+			  u64 bytenr, struct btrfs_path *path)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_path *path;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	path = btrfs_alloc_path();</div><div class='del'>-	if (!path)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='ctx'> 	do {</div><div class='del'>-		ret = check_committed_ref(root, path, objectid,</div><div class='del'>-					  offset, bytenr, strict);</div><div class='add'>+		ret = check_committed_ref(inode, path, offset, bytenr);</div><div class='ctx'> 		if (ret &amp;&amp; ret != -ENOENT)</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='del'>-		ret = check_delayed_ref(root, path, objectid, offset, bytenr);</div><div class='del'>-	} while (ret == -EAGAIN);</div><div class='add'>+		/*</div><div class='add'>+		 * The path must have a locked leaf from the extent tree where</div><div class='add'>+		 * the extent item for our extent is located, in case it exists,</div><div class='add'>+		 * or where it should be located in case it doesn't exist yet</div><div class='add'>+		 * because it's new and its delayed ref was not yet flushed.</div><div class='add'>+		 * We need to lock the delayed ref head at check_delayed_ref(),</div><div class='add'>+		 * if one exists, while holding the leaf locked in order to not</div><div class='add'>+		 * race with delayed ref flushing, missing references and</div><div class='add'>+		 * incorrectly reporting that the extent is not shared.</div><div class='add'>+		 */</div><div class='add'>+		if (IS_ENABLED(CONFIG_BTRFS_ASSERT)) {</div><div class='add'>+			struct extent_buffer *leaf = path-&gt;nodes[0];</div><div class='add'>+</div><div class='add'>+			ASSERT(leaf != NULL);</div><div class='add'>+			btrfs_assert_tree_read_locked(leaf);</div><div class='add'>+</div><div class='add'>+			if (ret != -ENOENT) {</div><div class='add'>+				struct btrfs_key key;</div><div class='add'>+</div><div class='add'>+				btrfs_item_key_to_cpu(leaf, &amp;key, path-&gt;slots[0]);</div><div class='add'>+				ASSERT(key.objectid == bytenr);</div><div class='add'>+				ASSERT(key.type == BTRFS_EXTENT_ITEM_KEY);</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		ret = check_delayed_ref(inode, path, offset, bytenr);</div><div class='add'>+	} while (ret == -EAGAIN &amp;&amp; !path-&gt;nowait);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	if (btrfs_is_data_reloc_root(root))</div><div class='add'>+	btrfs_release_path(path);</div><div class='add'>+	if (btrfs_is_data_reloc_root(inode-&gt;root))</div><div class='ctx'> 		WARN_ON(ret &gt; 0);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -2383,17 +2458,14 @@ out:</div><div class='ctx'> static int __btrfs_mod_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			   struct btrfs_root *root,</div><div class='ctx'> 			   struct extent_buffer *buf,</div><div class='del'>-			   int full_backref, int inc)</div><div class='add'>+			   bool full_backref, bool inc)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='del'>-	u64 bytenr;</div><div class='del'>-	u64 num_bytes;</div><div class='ctx'> 	u64 parent;</div><div class='ctx'> 	u64 ref_root;</div><div class='ctx'> 	u32 nritems;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_file_extent_item *fi;</div><div class='del'>-	struct btrfs_ref generic_ref = { 0 };</div><div class='ctx'> 	bool for_reloc = btrfs_header_flag(buf, BTRFS_HEADER_FLAG_RELOC);</div><div class='ctx'> 	int i;</div><div class='ctx'> 	int action;</div><div class='hunk'>@@ -2420,6 +2492,12 @@ static int __btrfs_mod_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		action = BTRFS_DROP_DELAYED_REF;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; nritems; i++) {</div><div class='add'>+		struct btrfs_ref ref = {</div><div class='add'>+			.action = action,</div><div class='add'>+			.parent = parent,</div><div class='add'>+			.ref_root = ref_root,</div><div class='add'>+		};</div><div class='add'>+</div><div class='ctx'> 		if (level == 0) {</div><div class='ctx'> 			btrfs_item_key_to_cpu(buf, &amp;key, i);</div><div class='ctx'> 			if (key.type != BTRFS_EXTENT_DATA_KEY)</div><div class='hunk'>@@ -2429,34 +2507,33 @@ static int __btrfs_mod_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			if (btrfs_file_extent_type(buf, fi) ==</div><div class='ctx'> 			    BTRFS_FILE_EXTENT_INLINE)</div><div class='ctx'> 				continue;</div><div class='del'>-			bytenr = btrfs_file_extent_disk_bytenr(buf, fi);</div><div class='del'>-			if (bytenr == 0)</div><div class='add'>+			ref.bytenr = btrfs_file_extent_disk_bytenr(buf, fi);</div><div class='add'>+			if (ref.bytenr == 0)</div><div class='ctx'> 				continue;</div><div class='ctx'> </div><div class='del'>-			num_bytes = btrfs_file_extent_disk_num_bytes(buf, fi);</div><div class='add'>+			ref.num_bytes = btrfs_file_extent_disk_num_bytes(buf, fi);</div><div class='add'>+			ref.owning_root = ref_root;</div><div class='add'>+</div><div class='ctx'> 			key.offset -= btrfs_file_extent_offset(buf, fi);</div><div class='del'>-			btrfs_init_generic_ref(&amp;generic_ref, action, bytenr,</div><div class='del'>-					       num_bytes, parent);</div><div class='del'>-			btrfs_init_data_ref(&amp;generic_ref, ref_root, key.objectid,</div><div class='del'>-					    key.offset, root-&gt;root_key.objectid,</div><div class='del'>-					    for_reloc);</div><div class='add'>+			btrfs_init_data_ref(&amp;ref, key.objectid, key.offset,</div><div class='add'>+					    btrfs_root_id(root), for_reloc);</div><div class='ctx'> 			if (inc)</div><div class='del'>-				ret = btrfs_inc_extent_ref(trans, &amp;generic_ref);</div><div class='add'>+				ret = btrfs_inc_extent_ref(trans, &amp;ref);</div><div class='ctx'> 			else</div><div class='del'>-				ret = btrfs_free_extent(trans, &amp;generic_ref);</div><div class='add'>+				ret = btrfs_free_extent(trans, &amp;ref);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				goto fail;</div><div class='ctx'> 		} else {</div><div class='del'>-			bytenr = btrfs_node_blockptr(buf, i);</div><div class='del'>-			num_bytes = fs_info-&gt;nodesize;</div><div class='del'>-			btrfs_init_generic_ref(&amp;generic_ref, action, bytenr,</div><div class='del'>-					       num_bytes, parent);</div><div class='del'>-			btrfs_init_tree_ref(&amp;generic_ref, level - 1, ref_root,</div><div class='del'>-					    root-&gt;root_key.objectid, for_reloc);</div><div class='add'>+			/* We don't know the owning_root, leave as 0. */</div><div class='add'>+			ref.bytenr = btrfs_node_blockptr(buf, i);</div><div class='add'>+			ref.num_bytes = fs_info-&gt;nodesize;</div><div class='add'>+</div><div class='add'>+			btrfs_init_tree_ref(&amp;ref, level - 1,</div><div class='add'>+					    btrfs_root_id(root), for_reloc);</div><div class='ctx'> 			if (inc)</div><div class='del'>-				ret = btrfs_inc_extent_ref(trans, &amp;generic_ref);</div><div class='add'>+				ret = btrfs_inc_extent_ref(trans, &amp;ref);</div><div class='ctx'> 			else</div><div class='del'>-				ret = btrfs_free_extent(trans, &amp;generic_ref);</div><div class='add'>+				ret = btrfs_free_extent(trans, &amp;ref);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				goto fail;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2467,15 +2544,15 @@ fail:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_inc_ref(struct btrfs_trans_handle *trans, struct btrfs_root *root,</div><div class='del'>-		  struct extent_buffer *buf, int full_backref)</div><div class='add'>+		  struct extent_buffer *buf, bool full_backref)</div><div class='ctx'> {</div><div class='del'>-	return __btrfs_mod_ref(trans, root, buf, full_backref, 1);</div><div class='add'>+	return __btrfs_mod_ref(trans, root, buf, full_backref, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_dec_ref(struct btrfs_trans_handle *trans, struct btrfs_root *root,</div><div class='del'>-		  struct extent_buffer *buf, int full_backref)</div><div class='add'>+		  struct extent_buffer *buf, bool full_backref)</div><div class='ctx'> {</div><div class='del'>-	return __btrfs_mod_ref(trans, root, buf, full_backref, 0);</div><div class='add'>+	return __btrfs_mod_ref(trans, root, buf, full_backref, false);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static u64 get_alloc_profile_by_root(struct btrfs_root *root, int data)</div><div class='hunk'>@@ -2495,97 +2572,81 @@ static u64 get_alloc_profile_by_root(struct btrfs_root *root, int data)</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static u64 first_logical_byte(struct btrfs_fs_info *fs_info, u64 search_start)</div><div class='add'>+static u64 first_logical_byte(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_block_group *cache;</div><div class='del'>-	u64 bytenr;</div><div class='add'>+	struct rb_node *leftmost;</div><div class='add'>+	u64 bytenr = 0;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;fs_info-&gt;block_group_cache_lock);</div><div class='del'>-	bytenr = fs_info-&gt;first_logical_byte;</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;block_group_cache_lock);</div><div class='add'>+	read_lock(&amp;fs_info-&gt;block_group_cache_lock);</div><div class='add'>+	/* Get the block group with the lowest logical start address. */</div><div class='add'>+	leftmost = rb_first_cached(&amp;fs_info-&gt;block_group_cache_tree);</div><div class='add'>+	if (leftmost) {</div><div class='add'>+		struct btrfs_block_group *bg;</div><div class='ctx'> </div><div class='del'>-	if (bytenr &lt; (u64)-1)</div><div class='del'>-		return bytenr;</div><div class='del'>-</div><div class='del'>-	cache = btrfs_lookup_first_block_group(fs_info, search_start);</div><div class='del'>-	if (!cache)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	bytenr = cache-&gt;start;</div><div class='del'>-	btrfs_put_block_group(cache);</div><div class='add'>+		bg = rb_entry(leftmost, struct btrfs_block_group, cache_node);</div><div class='add'>+		bytenr = bg-&gt;start;</div><div class='add'>+	}</div><div class='add'>+	read_unlock(&amp;fs_info-&gt;block_group_cache_lock);</div><div class='ctx'> </div><div class='ctx'> 	return bytenr;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int pin_down_extent(struct btrfs_trans_handle *trans,</div><div class='del'>-			   struct btrfs_block_group *cache,</div><div class='del'>-			   u64 bytenr, u64 num_bytes, int reserved)</div><div class='add'>+			   struct btrfs_block_group *bg,</div><div class='add'>+			   u64 bytenr, u64 num_bytes, bool reserved)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = cache-&gt;fs_info;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;cache-&gt;space_info-&gt;lock);</div><div class='del'>-	spin_lock(&amp;cache-&gt;lock);</div><div class='del'>-	cache-&gt;pinned += num_bytes;</div><div class='del'>-	btrfs_space_info_update_bytes_pinned(fs_info, cache-&gt;space_info,</div><div class='del'>-					     num_bytes);</div><div class='del'>-	if (reserved) {</div><div class='del'>-		cache-&gt;reserved -= num_bytes;</div><div class='del'>-		cache-&gt;space_info-&gt;bytes_reserved -= num_bytes;</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;cache-&gt;lock);</div><div class='del'>-	spin_unlock(&amp;cache-&gt;space_info-&gt;lock);</div><div class='del'>-</div><div class='del'>-	set_extent_dirty(&amp;trans-&gt;transaction-&gt;pinned_extents, bytenr,</div><div class='del'>-			 bytenr + num_bytes - 1, GFP_NOFS | __GFP_NOFAIL);</div><div class='add'>+	struct btrfs_space_info *space_info = bg-&gt;space_info;</div><div class='add'>+	const u64 reserved_bytes = (reserved ? num_bytes : 0);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;space_info-&gt;lock);</div><div class='add'>+	spin_lock(&amp;bg-&gt;lock);</div><div class='add'>+	bg-&gt;pinned += num_bytes;</div><div class='add'>+	bg-&gt;reserved -= reserved_bytes;</div><div class='add'>+	spin_unlock(&amp;bg-&gt;lock);</div><div class='add'>+	space_info-&gt;bytes_reserved -= reserved_bytes;</div><div class='add'>+	btrfs_space_info_update_bytes_pinned(space_info, num_bytes);</div><div class='add'>+	spin_unlock(&amp;space_info-&gt;lock);</div><div class='add'>+</div><div class='add'>+	btrfs_set_extent_bit(&amp;trans-&gt;transaction-&gt;pinned_extents, bytenr,</div><div class='add'>+			     bytenr + num_bytes - 1, EXTENT_DIRTY, NULL);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_pin_extent(struct btrfs_trans_handle *trans,</div><div class='del'>-		     u64 bytenr, u64 num_bytes, int reserved)</div><div class='add'>+int btrfs_pin_extent(struct btrfs_trans_handle *trans, u64 bytenr, u64 num_bytes)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_block_group *cache;</div><div class='ctx'> </div><div class='ctx'> 	cache = btrfs_lookup_block_group(trans-&gt;fs_info, bytenr);</div><div class='ctx'> 	BUG_ON(!cache); /* Logic error */</div><div class='ctx'> </div><div class='del'>-	pin_down_extent(trans, cache, bytenr, num_bytes, reserved);</div><div class='add'>+	pin_down_extent(trans, cache, bytenr, num_bytes, true);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_put_block_group(cache);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * this function must be called within transaction</div><div class='del'>- */</div><div class='ctx'> int btrfs_pin_extent_for_log_replay(struct btrfs_trans_handle *trans,</div><div class='del'>-				    u64 bytenr, u64 num_bytes)</div><div class='add'>+				    const struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_block_group *cache;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	cache = btrfs_lookup_block_group(trans-&gt;fs_info, bytenr);</div><div class='add'>+	cache = btrfs_lookup_block_group(trans-&gt;fs_info, eb-&gt;start);</div><div class='ctx'> 	if (!cache)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * pull in the free space cache (if any) so that our pin</div><div class='del'>-	 * removes the free space from the cache.  We have load_only set</div><div class='del'>-	 * to one because the slow code to read in the free extents does check</div><div class='del'>-	 * the pinned extents.</div><div class='del'>-	 */</div><div class='del'>-	btrfs_cache_block_group(cache, 1);</div><div class='del'>-	/*</div><div class='del'>-	 * Make sure we wait until the cache is completely built in case it is</div><div class='del'>-	 * missing or is invalid and therefore needs to be rebuilt.</div><div class='add'>+	 * Fully cache the free space first so that our pin removes the free space</div><div class='add'>+	 * from the cache.</div><div class='ctx'> 	 */</div><div class='del'>-	ret = btrfs_wait_block_group_cache_done(cache);</div><div class='add'>+	ret = btrfs_cache_block_group(cache, true);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	pin_down_extent(trans, cache, bytenr, num_bytes, 0);</div><div class='add'>+	pin_down_extent(trans, cache, eb-&gt;start, eb-&gt;len, false);</div><div class='ctx'> </div><div class='ctx'> 	/* remove us from the free space cache (if we're there at all) */</div><div class='del'>-	ret = btrfs_remove_free_space(cache, bytenr, num_bytes);</div><div class='add'>+	ret = btrfs_remove_free_space(cache, eb-&gt;start, eb-&gt;len);</div><div class='ctx'> out:</div><div class='ctx'> 	btrfs_put_block_group(cache);</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -2601,12 +2662,7 @@ static int __exclude_logged_extent(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	if (!block_group)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	btrfs_cache_block_group(block_group, 1);</div><div class='del'>-	/*</div><div class='del'>-	 * Make sure we wait until the cache is completely built in case it is</div><div class='del'>-	 * missing or is invalid and therefore needs to be rebuilt.</div><div class='del'>-	 */</div><div class='del'>-	ret = btrfs_wait_block_group_cache_done(block_group);</div><div class='add'>+	ret = btrfs_cache_block_group(block_group, true);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -2689,22 +2745,24 @@ static int unpin_extent_range(struct btrfs_fs_info *fs_info,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_block_group *cache = NULL;</div><div class='ctx'> 	struct btrfs_space_info *space_info;</div><div class='del'>-	struct btrfs_block_rsv *global_rsv = &amp;fs_info-&gt;global_block_rsv;</div><div class='ctx'> 	struct btrfs_free_cluster *cluster = NULL;</div><div class='del'>-	u64 len;</div><div class='ctx'> 	u64 total_unpinned = 0;</div><div class='ctx'> 	u64 empty_cluster = 0;</div><div class='del'>-	bool readonly;</div><div class='ctx'> </div><div class='ctx'> 	while (start &lt;= end) {</div><div class='del'>-		readonly = false;</div><div class='add'>+		u64 len;</div><div class='add'>+		bool readonly;</div><div class='add'>+</div><div class='ctx'> 		if (!cache ||</div><div class='ctx'> 		    start &gt;= cache-&gt;start + cache-&gt;length) {</div><div class='ctx'> 			if (cache)</div><div class='ctx'> 				btrfs_put_block_group(cache);</div><div class='ctx'> 			total_unpinned = 0;</div><div class='ctx'> 			cache = btrfs_lookup_block_group(fs_info, start);</div><div class='del'>-			BUG_ON(!cache); /* Logic error */</div><div class='add'>+			if (unlikely(cache == NULL)) {</div><div class='add'>+				/* Logic error, something removed the block group. */</div><div class='add'>+				return -EUCLEAN;</div><div class='add'>+			}</div><div class='ctx'> </div><div class='ctx'> 			cluster = fetch_cluster_info(fs_info,</div><div class='ctx'> 						     cache-&gt;space_info,</div><div class='hunk'>@@ -2715,13 +2773,8 @@ static int unpin_extent_range(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		len = cache-&gt;start + cache-&gt;length - start;</div><div class='ctx'> 		len = min(len, end + 1 - start);</div><div class='ctx'> </div><div class='del'>-		down_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='del'>-		if (start &lt; cache-&gt;last_byte_to_unpin &amp;&amp; return_free_space) {</div><div class='del'>-			u64 add_len = min(len, cache-&gt;last_byte_to_unpin - start);</div><div class='del'>-</div><div class='del'>-			btrfs_add_free_space(cache, start, add_len);</div><div class='del'>-		}</div><div class='del'>-		up_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='add'>+		if (return_free_space)</div><div class='add'>+			btrfs_add_free_space(cache, start, len);</div><div class='ctx'> </div><div class='ctx'> 		start += len;</div><div class='ctx'> 		total_unpinned += len;</div><div class='hunk'>@@ -2742,43 +2795,27 @@ static int unpin_extent_range(struct btrfs_fs_info *fs_info,</div><div class='ctx'> </div><div class='ctx'> 		spin_lock(&amp;space_info-&gt;lock);</div><div class='ctx'> 		spin_lock(&amp;cache-&gt;lock);</div><div class='add'>+		readonly = cache-&gt;ro;</div><div class='ctx'> 		cache-&gt;pinned -= len;</div><div class='del'>-		btrfs_space_info_update_bytes_pinned(fs_info, space_info, -len);</div><div class='add'>+		spin_unlock(&amp;cache-&gt;lock);</div><div class='add'>+</div><div class='add'>+		btrfs_space_info_update_bytes_pinned(space_info, -len);</div><div class='ctx'> 		space_info-&gt;max_extent_size = 0;</div><div class='del'>-		if (cache-&gt;ro) {</div><div class='add'>+</div><div class='add'>+		if (readonly) {</div><div class='ctx'> 			space_info-&gt;bytes_readonly += len;</div><div class='del'>-			readonly = true;</div><div class='ctx'> 		} else if (btrfs_is_zoned(fs_info)) {</div><div class='ctx'> 			/* Need reset before reusing in a zoned block group */</div><div class='del'>-			space_info-&gt;bytes_zone_unusable += len;</div><div class='del'>-			readonly = true;</div><div class='add'>+			btrfs_space_info_update_bytes_zone_unusable(space_info, len);</div><div class='add'>+		} else if (return_free_space) {</div><div class='add'>+			btrfs_return_free_space(space_info, len);</div><div class='ctx'> 		}</div><div class='del'>-		spin_unlock(&amp;cache-&gt;lock);</div><div class='del'>-		if (!readonly &amp;&amp; return_free_space &amp;&amp;</div><div class='del'>-		    global_rsv-&gt;space_info == space_info) {</div><div class='del'>-			u64 to_add = len;</div><div class='del'>-</div><div class='del'>-			spin_lock(&amp;global_rsv-&gt;lock);</div><div class='del'>-			if (!global_rsv-&gt;full) {</div><div class='del'>-				to_add = min(len, global_rsv-&gt;size -</div><div class='del'>-					     global_rsv-&gt;reserved);</div><div class='del'>-				global_rsv-&gt;reserved += to_add;</div><div class='del'>-				btrfs_space_info_update_bytes_may_use(fs_info,</div><div class='del'>-						space_info, to_add);</div><div class='del'>-				if (global_rsv-&gt;reserved &gt;= global_rsv-&gt;size)</div><div class='del'>-					global_rsv-&gt;full = 1;</div><div class='del'>-				len -= to_add;</div><div class='del'>-			}</div><div class='del'>-			spin_unlock(&amp;global_rsv-&gt;lock);</div><div class='del'>-		}</div><div class='del'>-		/* Add to any tickets we may have */</div><div class='del'>-		if (!readonly &amp;&amp; return_free_space &amp;&amp; len)</div><div class='del'>-			btrfs_try_granting_tickets(fs_info, space_info);</div><div class='ctx'> 		spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (cache)</div><div class='ctx'> 		btrfs_put_block_group(cache);</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2787,34 +2824,63 @@ int btrfs_finish_extent_commit(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_block_group *block_group, *tmp;</div><div class='ctx'> 	struct list_head *deleted_bgs;</div><div class='del'>-	struct extent_io_tree *unpin;</div><div class='add'>+	struct extent_io_tree *unpin = &amp;trans-&gt;transaction-&gt;pinned_extents;</div><div class='add'>+	struct extent_state *cached_state = NULL;</div><div class='ctx'> 	u64 start;</div><div class='ctx'> 	u64 end;</div><div class='add'>+	int unpin_error = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	unpin = &amp;trans-&gt;transaction-&gt;pinned_extents;</div><div class='add'>+	mutex_lock(&amp;fs_info-&gt;unused_bg_unpin_mutex);</div><div class='add'>+	btrfs_find_first_extent_bit(unpin, 0, &amp;start, &amp;end, EXTENT_DIRTY, &amp;cached_state);</div><div class='ctx'> </div><div class='del'>-	while (!TRANS_ABORTED(trans)) {</div><div class='del'>-		struct extent_state *cached_state = NULL;</div><div class='del'>-</div><div class='del'>-		mutex_lock(&amp;fs_info-&gt;unused_bg_unpin_mutex);</div><div class='del'>-		ret = find_first_extent_bit(unpin, 0, &amp;start, &amp;end,</div><div class='del'>-					    EXTENT_DIRTY, &amp;cached_state);</div><div class='del'>-		if (ret) {</div><div class='del'>-			mutex_unlock(&amp;fs_info-&gt;unused_bg_unpin_mutex);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='add'>+	while (!TRANS_ABORTED(trans) &amp;&amp; cached_state) {</div><div class='add'>+		struct extent_state *next_state;</div><div class='ctx'> </div><div class='ctx'> 		if (btrfs_test_opt(fs_info, DISCARD_SYNC))</div><div class='ctx'> 			ret = btrfs_discard_extent(fs_info, start,</div><div class='ctx'> 						   end + 1 - start, NULL);</div><div class='ctx'> </div><div class='del'>-		clear_extent_dirty(unpin, start, end, &amp;cached_state);</div><div class='del'>-		unpin_extent_range(fs_info, start, end, true);</div><div class='del'>-		mutex_unlock(&amp;fs_info-&gt;unused_bg_unpin_mutex);</div><div class='del'>-		free_extent_state(cached_state);</div><div class='del'>-		cond_resched();</div><div class='add'>+		next_state = btrfs_next_extent_state(unpin, cached_state);</div><div class='add'>+		btrfs_clear_extent_dirty(unpin, start, end, &amp;cached_state);</div><div class='add'>+		ret = unpin_extent_range(fs_info, start, end, true);</div><div class='add'>+		/*</div><div class='add'>+		 * If we get an error unpinning an extent range, store the first</div><div class='add'>+		 * error to return later after trying to unpin all ranges and do</div><div class='add'>+		 * the sync discards. Our caller will abort the transaction</div><div class='add'>+		 * (which already wrote new superblocks) and on the next mount</div><div class='add'>+		 * the space will be available as it was pinned by in-memory</div><div class='add'>+		 * only structures in this phase.</div><div class='add'>+		 */</div><div class='add'>+		if (ret) {</div><div class='add'>+			btrfs_err_rl(fs_info,</div><div class='add'>+"failed to unpin extent range [%llu, %llu] when committing transaction %llu: %s (%d)",</div><div class='add'>+				     start, end, trans-&gt;transid,</div><div class='add'>+				     btrfs_decode_error(ret), ret);</div><div class='add'>+			if (!unpin_error)</div><div class='add'>+				unpin_error = ret;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		btrfs_free_extent_state(cached_state);</div><div class='add'>+</div><div class='add'>+		if (need_resched()) {</div><div class='add'>+			btrfs_free_extent_state(next_state);</div><div class='add'>+			mutex_unlock(&amp;fs_info-&gt;unused_bg_unpin_mutex);</div><div class='add'>+			cond_resched();</div><div class='add'>+			cached_state = NULL;</div><div class='add'>+			mutex_lock(&amp;fs_info-&gt;unused_bg_unpin_mutex);</div><div class='add'>+			btrfs_find_first_extent_bit(unpin, 0, &amp;start, &amp;end,</div><div class='add'>+						    EXTENT_DIRTY, &amp;cached_state);</div><div class='add'>+		} else {</div><div class='add'>+			cached_state = next_state;</div><div class='add'>+			if (cached_state) {</div><div class='add'>+				start = cached_state-&gt;start;</div><div class='add'>+				end = cached_state-&gt;end;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='add'>+	mutex_unlock(&amp;fs_info-&gt;unused_bg_unpin_mutex);</div><div class='add'>+	btrfs_free_extent_state(cached_state);</div><div class='ctx'> </div><div class='ctx'> 	if (btrfs_test_opt(fs_info, DISCARD_ASYNC)) {</div><div class='ctx'> 		btrfs_discard_calc_delay(&amp;fs_info-&gt;discard_ctl);</div><div class='hunk'>@@ -2828,16 +2894,20 @@ int btrfs_finish_extent_commit(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	 */</div><div class='ctx'> 	deleted_bgs = &amp;trans-&gt;transaction-&gt;deleted_bgs;</div><div class='ctx'> 	list_for_each_entry_safe(block_group, tmp, deleted_bgs, bg_list) {</div><div class='del'>-		u64 trimmed = 0;</div><div class='del'>-</div><div class='ctx'> 		ret = -EROFS;</div><div class='ctx'> 		if (!TRANS_ABORTED(trans))</div><div class='del'>-			ret = btrfs_discard_extent(fs_info,</div><div class='del'>-						   block_group-&gt;start,</div><div class='del'>-						   block_group-&gt;length,</div><div class='del'>-						   &amp;trimmed);</div><div class='add'>+			ret = btrfs_discard_extent(fs_info, block_group-&gt;start,</div><div class='add'>+						   block_group-&gt;length, NULL);</div><div class='ctx'> </div><div class='add'>+		/*</div><div class='add'>+		 * Not strictly necessary to lock, as the block_group should be</div><div class='add'>+		 * read-only from btrfs_delete_unused_bgs().</div><div class='add'>+		 */</div><div class='add'>+		ASSERT(block_group-&gt;ro);</div><div class='add'>+		spin_lock(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='ctx'> 		list_del_init(&amp;block_group-&gt;bg_list);</div><div class='add'>+		spin_unlock(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='add'>+</div><div class='ctx'> 		btrfs_unfreeze_block_group(block_group);</div><div class='ctx'> 		btrfs_put_block_group(block_group);</div><div class='ctx'> </div><div class='hunk'>@@ -2849,9 +2919,106 @@ int btrfs_finish_extent_commit(struct btrfs_trans_handle *trans)</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	return unpin_error;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Parse an extent item's inline extents looking for a simple quotas owner ref.</div><div class='add'>+ *</div><div class='add'>+ * @fs_info:	the btrfs_fs_info for this mount</div><div class='add'>+ * @leaf:	a leaf in the extent tree containing the extent item</div><div class='add'>+ * @slot:	the slot in the leaf where the extent item is found</div><div class='add'>+ *</div><div class='add'>+ * Returns the objectid of the root that originally allocated the extent item</div><div class='add'>+ * if the inline owner ref is expected and present, otherwise 0.</div><div class='add'>+ *</div><div class='add'>+ * If an extent item has an owner ref item, it will be the first inline ref</div><div class='add'>+ * item. Therefore the logic is to check whether there are any inline ref</div><div class='add'>+ * items, then check the type of the first one.</div><div class='add'>+ */</div><div class='add'>+u64 btrfs_get_extent_owner_root(struct btrfs_fs_info *fs_info,</div><div class='add'>+				struct extent_buffer *leaf, int slot)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_extent_item *ei;</div><div class='add'>+	struct btrfs_extent_inline_ref *iref;</div><div class='add'>+	struct btrfs_extent_owner_ref *oref;</div><div class='add'>+	unsigned long ptr;</div><div class='add'>+	unsigned long end;</div><div class='add'>+	int type;</div><div class='add'>+</div><div class='add'>+	if (!btrfs_fs_incompat(fs_info, SIMPLE_QUOTA))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	ei = btrfs_item_ptr(leaf, slot, struct btrfs_extent_item);</div><div class='add'>+	ptr = (unsigned long)(ei + 1);</div><div class='add'>+	end = (unsigned long)ei + btrfs_item_size(leaf, slot);</div><div class='add'>+</div><div class='add'>+	/* No inline ref items of any kind, can't check type. */</div><div class='add'>+	if (ptr == end)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	iref = (struct btrfs_extent_inline_ref *)ptr;</div><div class='add'>+	type = btrfs_get_extent_inline_ref_type(leaf, iref, BTRFS_REF_TYPE_ANY);</div><div class='add'>+</div><div class='add'>+	/* We found an owner ref, get the root out of it. */</div><div class='add'>+	if (type == BTRFS_EXTENT_OWNER_REF_KEY) {</div><div class='add'>+		oref = (struct btrfs_extent_owner_ref *)(&amp;iref-&gt;offset);</div><div class='add'>+		return btrfs_extent_owner_ref_root_id(leaf, oref);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* We have inline refs, but not an owner ref. */</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int do_free_extent_accounting(struct btrfs_trans_handle *trans,</div><div class='add'>+				     u64 bytenr, struct btrfs_squota_delta *delta)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+	u64 num_bytes = delta-&gt;num_bytes;</div><div class='add'>+</div><div class='add'>+	if (delta-&gt;is_data) {</div><div class='add'>+		struct btrfs_root *csum_root;</div><div class='add'>+</div><div class='add'>+		csum_root = btrfs_csum_root(trans-&gt;fs_info, bytenr);</div><div class='add'>+		ret = btrfs_del_csums(trans, csum_root, bytenr, num_bytes);</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		ret = btrfs_delete_raid_extent(trans, bytenr, num_bytes);</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_record_squota_delta(trans-&gt;fs_info, delta);</div><div class='add'>+	if (unlikely(ret)) {</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_add_to_free_space_tree(trans, bytenr, num_bytes);</div><div class='add'>+	if (unlikely(ret)) {</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_update_block_group(trans, bytenr, num_bytes, false);</div><div class='add'>+	if (ret)</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define abort_and_dump(trans, path, fmt, args...)	\</div><div class='add'>+({							\</div><div class='add'>+	btrfs_abort_transaction(trans, -EUCLEAN);	\</div><div class='add'>+	btrfs_print_leaf(path-&gt;nodes[0]);		\</div><div class='add'>+	btrfs_crit(trans-&gt;fs_info, fmt, ##args);	\</div><div class='add'>+})</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Drop one or more refs of @node.</div><div class='ctx'>  *</div><div class='hunk'>@@ -2912,15 +3079,14 @@ int btrfs_finish_extent_commit(struct btrfs_trans_handle *trans)</div><div class='ctx'>  * And that (13631488 EXTENT_DATA_REF &lt;HASH&gt;) gets removed.</div><div class='ctx'>  */</div><div class='ctx'> static int __btrfs_free_extent(struct btrfs_trans_handle *trans,</div><div class='del'>-			       struct btrfs_delayed_ref_node *node, u64 parent,</div><div class='del'>-			       u64 root_objectid, u64 owner_objectid,</div><div class='del'>-			       u64 owner_offset, int refs_to_drop,</div><div class='add'>+			       struct btrfs_delayed_ref_head *href,</div><div class='add'>+			       const struct btrfs_delayed_ref_node *node,</div><div class='ctx'> 			       struct btrfs_delayed_extent_op *extent_op)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='del'>-	struct btrfs_path *path;</div><div class='del'>-	struct btrfs_root *extent_root = info-&gt;extent_root;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='add'>+	struct btrfs_root *extent_root;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_extent_item *ei;</div><div class='ctx'> 	struct btrfs_extent_inline_ref *iref;</div><div class='hunk'>@@ -2929,12 +3095,18 @@ static int __btrfs_free_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	int extent_slot = 0;</div><div class='ctx'> 	int found_extent = 0;</div><div class='ctx'> 	int num_to_del = 1;</div><div class='add'>+	int refs_to_drop = node-&gt;ref_mod;</div><div class='ctx'> 	u32 item_size;</div><div class='ctx'> 	u64 refs;</div><div class='ctx'> 	u64 bytenr = node-&gt;bytenr;</div><div class='ctx'> 	u64 num_bytes = node-&gt;num_bytes;</div><div class='del'>-	int last_ref = 0;</div><div class='add'>+	u64 owner_objectid = btrfs_delayed_ref_owner(node);</div><div class='add'>+	u64 owner_offset = btrfs_delayed_ref_offset(node);</div><div class='ctx'> 	bool skinny_metadata = btrfs_fs_incompat(info, SKINNY_METADATA);</div><div class='add'>+	u64 delayed_ref_root = href-&gt;owning_root;</div><div class='add'>+</div><div class='add'>+	extent_root = btrfs_extent_root(info, bytenr);</div><div class='add'>+	ASSERT(extent_root);</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='hunk'>@@ -2942,20 +3114,20 @@ static int __btrfs_free_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	is_data = owner_objectid &gt;= BTRFS_FIRST_FREE_OBJECTID;</div><div class='ctx'> </div><div class='del'>-	if (!is_data &amp;&amp; refs_to_drop != 1) {</div><div class='add'>+	if (unlikely(!is_data &amp;&amp; refs_to_drop != 1)) {</div><div class='ctx'> 		btrfs_crit(info,</div><div class='ctx'> "invalid refs_to_drop, dropping more than 1 refs for tree block %llu refs_to_drop %u",</div><div class='ctx'> 			   node-&gt;bytenr, refs_to_drop);</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (is_data)</div><div class='ctx'> 		skinny_metadata = false;</div><div class='ctx'> </div><div class='ctx'> 	ret = lookup_extent_backref(trans, path, &amp;iref, bytenr, num_bytes,</div><div class='del'>-				    parent, root_objectid, owner_objectid,</div><div class='add'>+				    node-&gt;parent, node-&gt;ref_root, owner_objectid,</div><div class='ctx'> 				    owner_offset);</div><div class='ctx'> 	if (ret == 0) {</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -2982,26 +3154,25 @@ static int __btrfs_free_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			/* Quick path didn't find the EXTEMT/METADATA_ITEM */</div><div class='add'>+			/* Quick path didn't find the EXTENT/METADATA_ITEM */</div><div class='ctx'> 			if (path-&gt;slots[0] - extent_slot &gt; 5)</div><div class='ctx'> 				break;</div><div class='ctx'> 			extent_slot--;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (!found_extent) {</div><div class='del'>-			if (iref) {</div><div class='del'>-				btrfs_crit(info,</div><div class='del'>-"invalid iref, no EXTENT/METADATA_ITEM found but has inline extent ref");</div><div class='del'>-				btrfs_abort_transaction(trans, -EUCLEAN);</div><div class='del'>-				goto err_dump;</div><div class='add'>+			if (unlikely(iref)) {</div><div class='add'>+				abort_and_dump(trans, path,</div><div class='add'>+"invalid iref slot %u, no EXTENT/METADATA_ITEM found but has inline extent ref",</div><div class='add'>+					   path-&gt;slots[0]);</div><div class='add'>+				return -EUCLEAN;</div><div class='ctx'> 			}</div><div class='ctx'> 			/* Must be SHARED_* item, remove the backref first */</div><div class='del'>-			ret = remove_extent_backref(trans, path, NULL,</div><div class='del'>-						    refs_to_drop,</div><div class='del'>-						    is_data, &amp;last_ref);</div><div class='del'>-			if (ret) {</div><div class='add'>+			ret = remove_extent_backref(trans, extent_root, path,</div><div class='add'>+						    NULL, refs_to_drop, is_data);</div><div class='add'>+			if (unlikely(ret)) {</div><div class='ctx'> 				btrfs_abort_transaction(trans, ret);</div><div class='del'>-				goto out;</div><div class='add'>+				return ret;</div><div class='ctx'> 			}</div><div class='ctx'> 			btrfs_release_path(path);</div><div class='ctx'> </div><div class='hunk'>@@ -3042,64 +3213,63 @@ static int __btrfs_free_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			if (ret) {</div><div class='del'>-				btrfs_err(info,</div><div class='del'>-					  "umm, got %d back from search, was looking for %llu",</div><div class='del'>-					  ret, bytenr);</div><div class='ctx'> 				if (ret &gt; 0)</div><div class='ctx'> 					btrfs_print_leaf(path-&gt;nodes[0]);</div><div class='add'>+				btrfs_err(info,</div><div class='add'>+			"umm, got %d back from search, was looking for %llu, slot %d",</div><div class='add'>+					  ret, bytenr, path-&gt;slots[0]);</div><div class='ctx'> 			}</div><div class='del'>-			if (ret &lt; 0) {</div><div class='add'>+			if (unlikely(ret &lt; 0)) {</div><div class='ctx'> 				btrfs_abort_transaction(trans, ret);</div><div class='del'>-				goto out;</div><div class='add'>+				return ret;</div><div class='ctx'> 			}</div><div class='ctx'> 			extent_slot = path-&gt;slots[0];</div><div class='ctx'> 		}</div><div class='ctx'> 	} else if (WARN_ON(ret == -ENOENT)) {</div><div class='del'>-		btrfs_print_leaf(path-&gt;nodes[0]);</div><div class='del'>-		btrfs_err(info,</div><div class='del'>-			"unable to find ref byte nr %llu parent %llu root %llu  owner %llu offset %llu",</div><div class='del'>-			bytenr, parent, root_objectid, owner_objectid,</div><div class='del'>-			owner_offset);</div><div class='del'>-		btrfs_abort_transaction(trans, ret);</div><div class='del'>-		goto out;</div><div class='add'>+		abort_and_dump(trans, path,</div><div class='add'>+"unable to find ref byte nr %llu parent %llu root %llu owner %llu offset %llu slot %d",</div><div class='add'>+			       bytenr, node-&gt;parent, node-&gt;ref_root, owner_objectid,</div><div class='add'>+			       owner_offset, path-&gt;slots[0]);</div><div class='add'>+		return ret;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='del'>-	item_size = btrfs_item_size_nr(leaf, extent_slot);</div><div class='add'>+	item_size = btrfs_item_size(leaf, extent_slot);</div><div class='ctx'> 	if (unlikely(item_size &lt; sizeof(*ei))) {</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		btrfs_print_v0_err(info);</div><div class='add'>+		ret = -EUCLEAN;</div><div class='add'>+		btrfs_err(trans-&gt;fs_info,</div><div class='add'>+			  "unexpected extent item size, has %u expect &gt;= %zu",</div><div class='add'>+			  item_size, sizeof(*ei));</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> 	ei = btrfs_item_ptr(leaf, extent_slot,</div><div class='ctx'> 			    struct btrfs_extent_item);</div><div class='ctx'> 	if (owner_objectid &lt; BTRFS_FIRST_FREE_OBJECTID &amp;&amp;</div><div class='ctx'> 	    key.type == BTRFS_EXTENT_ITEM_KEY) {</div><div class='ctx'> 		struct btrfs_tree_block_info *bi;</div><div class='del'>-		if (item_size &lt; sizeof(*ei) + sizeof(*bi)) {</div><div class='del'>-			btrfs_crit(info,</div><div class='del'>-"invalid extent item size for key (%llu, %u, %llu) owner %llu, has %u expect &gt;= %zu",</div><div class='del'>-				   key.objectid, key.type, key.offset,</div><div class='del'>-				   owner_objectid, item_size,</div><div class='del'>-				   sizeof(*ei) + sizeof(*bi));</div><div class='del'>-			btrfs_abort_transaction(trans, -EUCLEAN);</div><div class='del'>-			goto err_dump;</div><div class='add'>+</div><div class='add'>+		if (unlikely(item_size &lt; sizeof(*ei) + sizeof(*bi))) {</div><div class='add'>+			abort_and_dump(trans, path,</div><div class='add'>+"invalid extent item size for key (%llu, %u, %llu) slot %u owner %llu, has %u expect &gt;= %zu",</div><div class='add'>+				       key.objectid, key.type, key.offset,</div><div class='add'>+				       path-&gt;slots[0], owner_objectid, item_size,</div><div class='add'>+				       sizeof(*ei) + sizeof(*bi));</div><div class='add'>+			return -EUCLEAN;</div><div class='ctx'> 		}</div><div class='ctx'> 		bi = (struct btrfs_tree_block_info *)(ei + 1);</div><div class='ctx'> 		WARN_ON(owner_objectid != btrfs_tree_block_level(leaf, bi));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	refs = btrfs_extent_refs(leaf, ei);</div><div class='del'>-	if (refs &lt; refs_to_drop) {</div><div class='del'>-		btrfs_crit(info,</div><div class='del'>-		"trying to drop %d refs but we only have %llu for bytenr %llu",</div><div class='del'>-			  refs_to_drop, refs, bytenr);</div><div class='del'>-		btrfs_abort_transaction(trans, -EUCLEAN);</div><div class='del'>-		goto err_dump;</div><div class='add'>+	if (unlikely(refs &lt; refs_to_drop)) {</div><div class='add'>+		abort_and_dump(trans, path,</div><div class='add'>+		"trying to drop %d refs but we only have %llu for bytenr %llu slot %u",</div><div class='add'>+			       refs_to_drop, refs, bytenr, path-&gt;slots[0]);</div><div class='add'>+		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='ctx'> 	refs -= refs_to_drop;</div><div class='ctx'> </div><div class='hunk'>@@ -3111,45 +3281,49 @@ static int __btrfs_free_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		 * be updated by remove_extent_backref</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (iref) {</div><div class='del'>-			if (!found_extent) {</div><div class='del'>-				btrfs_crit(info,</div><div class='del'>-"invalid iref, got inlined extent ref but no EXTENT/METADATA_ITEM found");</div><div class='del'>-				btrfs_abort_transaction(trans, -EUCLEAN);</div><div class='del'>-				goto err_dump;</div><div class='add'>+			if (unlikely(!found_extent)) {</div><div class='add'>+				abort_and_dump(trans, path,</div><div class='add'>+"invalid iref, got inlined extent ref but no EXTENT/METADATA_ITEM found, slot %u",</div><div class='add'>+					       path-&gt;slots[0]);</div><div class='add'>+				return -EUCLEAN;</div><div class='ctx'> 			}</div><div class='ctx'> 		} else {</div><div class='ctx'> 			btrfs_set_extent_refs(leaf, ei, refs);</div><div class='del'>-			btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> 		}</div><div class='ctx'> 		if (found_extent) {</div><div class='del'>-			ret = remove_extent_backref(trans, path, iref,</div><div class='del'>-						    refs_to_drop, is_data,</div><div class='del'>-						    &amp;last_ref);</div><div class='del'>-			if (ret) {</div><div class='add'>+			ret = remove_extent_backref(trans, extent_root, path,</div><div class='add'>+						    iref, refs_to_drop, is_data);</div><div class='add'>+			if (unlikely(ret)) {</div><div class='ctx'> 				btrfs_abort_transaction(trans, ret);</div><div class='del'>-				goto out;</div><div class='add'>+				return ret;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='add'>+		struct btrfs_squota_delta delta = {</div><div class='add'>+			.root = delayed_ref_root,</div><div class='add'>+			.num_bytes = num_bytes,</div><div class='add'>+			.is_data = is_data,</div><div class='add'>+			.is_inc = false,</div><div class='add'>+			.generation = btrfs_extent_generation(leaf, ei),</div><div class='add'>+		};</div><div class='add'>+</div><div class='ctx'> 		/* In this branch refs == 1 */</div><div class='ctx'> 		if (found_extent) {</div><div class='del'>-			if (is_data &amp;&amp; refs_to_drop !=</div><div class='del'>-			    extent_data_ref_count(path, iref)) {</div><div class='del'>-				btrfs_crit(info,</div><div class='del'>-		"invalid refs_to_drop, current refs %u refs_to_drop %u",</div><div class='del'>-					   extent_data_ref_count(path, iref),</div><div class='del'>-					   refs_to_drop);</div><div class='del'>-				btrfs_abort_transaction(trans, -EUCLEAN);</div><div class='del'>-				goto err_dump;</div><div class='add'>+			if (unlikely(is_data &amp;&amp; refs_to_drop !=</div><div class='add'>+				     extent_data_ref_count(path, iref))) {</div><div class='add'>+				abort_and_dump(trans, path,</div><div class='add'>+		"invalid refs_to_drop, current refs %u refs_to_drop %u slot %u",</div><div class='add'>+					       extent_data_ref_count(path, iref),</div><div class='add'>+					       refs_to_drop, path-&gt;slots[0]);</div><div class='add'>+				return -EUCLEAN;</div><div class='ctx'> 			}</div><div class='ctx'> 			if (iref) {</div><div class='del'>-				if (path-&gt;slots[0] != extent_slot) {</div><div class='del'>-					btrfs_crit(info,</div><div class='del'>-"invalid iref, extent item key (%llu %u %llu) doesn't have wanted iref",</div><div class='del'>-						   key.objectid, key.type,</div><div class='del'>-						   key.offset);</div><div class='del'>-					btrfs_abort_transaction(trans, -EUCLEAN);</div><div class='del'>-					goto err_dump;</div><div class='add'>+				if (unlikely(path-&gt;slots[0] != extent_slot)) {</div><div class='add'>+					abort_and_dump(trans, path,</div><div class='add'>+"invalid iref, extent item key " BTRFS_KEY_FMT " slot %u doesn't have wanted iref",</div><div class='add'>+						       BTRFS_KEY_FMT_VALUE(&amp;key),</div><div class='add'>+						       path-&gt;slots[0]);</div><div class='add'>+					return -EUCLEAN;</div><div class='ctx'> 				}</div><div class='ctx'> 			} else {</div><div class='ctx'> 				/*</div><div class='hunk'>@@ -3158,65 +3332,40 @@ static int __btrfs_free_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				 * |	extent_slot	  ||extent_slot + 1|</div><div class='ctx'> 				 * [ EXTENT/METADATA_ITEM ][ SHARED_* ITEM ]</div><div class='ctx'> 				 */</div><div class='del'>-				if (path-&gt;slots[0] != extent_slot + 1) {</div><div class='del'>-					btrfs_crit(info,</div><div class='del'>-	"invalid SHARED_* item, previous item is not EXTENT/METADATA_ITEM");</div><div class='del'>-					btrfs_abort_transaction(trans, -EUCLEAN);</div><div class='del'>-					goto err_dump;</div><div class='add'>+				if (unlikely(path-&gt;slots[0] != extent_slot + 1)) {</div><div class='add'>+					abort_and_dump(trans, path,</div><div class='add'>+	"invalid SHARED_* item slot %u, previous item is not EXTENT/METADATA_ITEM",</div><div class='add'>+						       path-&gt;slots[0]);</div><div class='add'>+					return -EUCLEAN;</div><div class='ctx'> 				}</div><div class='ctx'> 				path-&gt;slots[0] = extent_slot;</div><div class='ctx'> 				num_to_del = 2;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='add'>+		/*</div><div class='add'>+		 * We can't infer the data owner from the delayed ref, so we need</div><div class='add'>+		 * to try to get it from the owning ref item.</div><div class='add'>+		 *</div><div class='add'>+		 * If it is not present, then that extent was not written under</div><div class='add'>+		 * simple quotas mode, so we don't need to account for its deletion.</div><div class='add'>+		 */</div><div class='add'>+		if (is_data)</div><div class='add'>+			delta.root = btrfs_get_extent_owner_root(trans-&gt;fs_info,</div><div class='add'>+								 leaf, extent_slot);</div><div class='ctx'> </div><div class='del'>-		last_ref = 1;</div><div class='ctx'> 		ret = btrfs_del_items(trans, extent_root, path, path-&gt;slots[0],</div><div class='ctx'> 				      num_to_del);</div><div class='del'>-		if (ret) {</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 		}</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> </div><div class='del'>-		if (is_data) {</div><div class='del'>-			ret = btrfs_del_csums(trans, info-&gt;csum_root, bytenr,</div><div class='del'>-					      num_bytes);</div><div class='del'>-			if (ret) {</div><div class='del'>-				btrfs_abort_transaction(trans, ret);</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		ret = add_to_free_space_tree(trans, bytenr, num_bytes);</div><div class='del'>-		if (ret) {</div><div class='del'>-			btrfs_abort_transaction(trans, ret);</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		ret = btrfs_update_block_group(trans, bytenr, num_bytes, false);</div><div class='del'>-		if (ret) {</div><div class='del'>-			btrfs_abort_transaction(trans, ret);</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+		ret = do_free_extent_accounting(trans, bytenr, &amp;delta);</div><div class='ctx'> 	}</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='del'>-err_dump:</div><div class='del'>-	/*</div><div class='del'>-	 * Leaf dump can take up a lot of log buffer, so we only do full leaf</div><div class='del'>-	 * dump for debug build.</div><div class='del'>-	 */</div><div class='del'>-	if (IS_ENABLED(CONFIG_BTRFS_DEBUG)) {</div><div class='del'>-		btrfs_crit(info, "path-&gt;slots[0]=%d extent_slot=%d",</div><div class='del'>-			   path-&gt;slots[0], extent_slot);</div><div class='del'>-		btrfs_print_leaf(path-&gt;nodes[0]);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return -EUCLEAN;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -3228,13 +3377,14 @@ err_dump:</div><div class='ctx'> static noinline int check_ref_cleanup(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				      u64 bytenr)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_delayed_ref_head *head;</div><div class='ctx'> 	struct btrfs_delayed_ref_root *delayed_refs;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	delayed_refs = &amp;trans-&gt;transaction-&gt;delayed_refs;</div><div class='ctx'> 	spin_lock(&amp;delayed_refs-&gt;lock);</div><div class='del'>-	head = btrfs_find_delayed_ref_head(delayed_refs, bytenr);</div><div class='add'>+	head = btrfs_find_delayed_ref_head(fs_info, delayed_refs, bytenr);</div><div class='ctx'> 	if (!head)</div><div class='ctx'> 		goto out_delayed_unlock;</div><div class='ctx'> </div><div class='hunk'>@@ -3252,8 +3402,8 @@ static noinline int check_ref_cleanup(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	if (!mutex_trylock(&amp;head-&gt;mutex))</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	btrfs_delete_ref_head(delayed_refs, head);</div><div class='del'>-	head-&gt;processing = 0;</div><div class='add'>+	btrfs_delete_ref_head(fs_info, delayed_refs, head);</div><div class='add'>+	head-&gt;processing = false;</div><div class='ctx'> </div><div class='ctx'> 	spin_unlock(&amp;head-&gt;lock);</div><div class='ctx'> 	spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='hunk'>@@ -3262,7 +3412,7 @@ static noinline int check_ref_cleanup(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	if (head-&gt;must_insert_reserved)</div><div class='ctx'> 		ret = 1;</div><div class='ctx'> </div><div class='del'>-	btrfs_cleanup_ref_head_accounting(trans-&gt;fs_info, delayed_refs, head);</div><div class='add'>+	btrfs_cleanup_ref_head_accounting(fs_info, delayed_refs, head);</div><div class='ctx'> 	mutex_unlock(&amp;head-&gt;mutex);</div><div class='ctx'> 	btrfs_put_delayed_ref_head(head);</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -3274,86 +3424,93 @@ out_delayed_unlock:</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_free_tree_block(struct btrfs_trans_handle *trans,</div><div class='del'>-			   struct btrfs_root *root,</div><div class='del'>-			   struct extent_buffer *buf,</div><div class='del'>-			   u64 parent, int last_ref)</div><div class='add'>+int btrfs_free_tree_block(struct btrfs_trans_handle *trans,</div><div class='add'>+			  u64 root_id,</div><div class='add'>+			  struct extent_buffer *buf,</div><div class='add'>+			  u64 parent, int last_ref)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='del'>-	struct btrfs_ref generic_ref = { 0 };</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='add'>+	struct btrfs_block_group *bg;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	btrfs_init_generic_ref(&amp;generic_ref, BTRFS_DROP_DELAYED_REF,</div><div class='del'>-			       buf-&gt;start, buf-&gt;len, parent);</div><div class='del'>-	btrfs_init_tree_ref(&amp;generic_ref, btrfs_header_level(buf),</div><div class='del'>-			    root-&gt;root_key.objectid, 0, false);</div><div class='add'>+	if (root_id != BTRFS_TREE_LOG_OBJECTID) {</div><div class='add'>+		struct btrfs_ref generic_ref = {</div><div class='add'>+			.action = BTRFS_DROP_DELAYED_REF,</div><div class='add'>+			.bytenr = buf-&gt;start,</div><div class='add'>+			.num_bytes = buf-&gt;len,</div><div class='add'>+			.parent = parent,</div><div class='add'>+			.owning_root = btrfs_header_owner(buf),</div><div class='add'>+			.ref_root = root_id,</div><div class='add'>+		};</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Assert that the extent buffer is not cleared due to</div><div class='add'>+		 * EXTENT_BUFFER_ZONED_ZEROOUT. Please refer</div><div class='add'>+		 * btrfs_clear_buffer_dirty() and btree_csum_one_bio() for</div><div class='add'>+		 * detail.</div><div class='add'>+		 */</div><div class='add'>+		ASSERT(btrfs_header_bytenr(buf) != 0);</div><div class='ctx'> </div><div class='del'>-	if (root-&gt;root_key.objectid != BTRFS_TREE_LOG_OBJECTID) {</div><div class='add'>+		btrfs_init_tree_ref(&amp;generic_ref, btrfs_header_level(buf), 0, false);</div><div class='ctx'> 		btrfs_ref_tree_mod(fs_info, &amp;generic_ref);</div><div class='ctx'> 		ret = btrfs_add_delayed_tree_ref(trans, &amp;generic_ref, NULL);</div><div class='del'>-		BUG_ON(ret); /* -ENOMEM */</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (last_ref &amp;&amp; btrfs_header_generation(buf) == trans-&gt;transid) {</div><div class='del'>-		struct btrfs_block_group *cache;</div><div class='del'>-		bool must_pin = false;</div><div class='del'>-</div><div class='del'>-		if (root-&gt;root_key.objectid != BTRFS_TREE_LOG_OBJECTID) {</div><div class='del'>-			ret = check_ref_cleanup(trans, buf-&gt;start);</div><div class='del'>-			if (!ret) {</div><div class='del'>-				btrfs_redirty_list_add(trans-&gt;transaction, buf);</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='add'>+	if (!last_ref)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-		cache = btrfs_lookup_block_group(fs_info, buf-&gt;start);</div><div class='add'>+	if (btrfs_header_generation(buf) != trans-&gt;transid)</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='del'>-		if (btrfs_header_flag(buf, BTRFS_HEADER_FLAG_WRITTEN)) {</div><div class='del'>-			pin_down_extent(trans, cache, buf-&gt;start, buf-&gt;len, 1);</div><div class='del'>-			btrfs_put_block_group(cache);</div><div class='add'>+	if (root_id != BTRFS_TREE_LOG_OBJECTID) {</div><div class='add'>+		ret = check_ref_cleanup(trans, buf-&gt;start);</div><div class='add'>+		if (!ret)</div><div class='ctx'> 			goto out;</div><div class='del'>-		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * If this is a leaf and there are tree mod log users, we may</div><div class='del'>-		 * have recorded mod log operations that point to this leaf.</div><div class='del'>-		 * So we must make sure no one reuses this leaf's extent before</div><div class='del'>-		 * mod log operations are applied to a node, otherwise after</div><div class='del'>-		 * rewinding a node using the mod log operations we get an</div><div class='del'>-		 * inconsistent btree, as the leaf's extent may now be used as</div><div class='del'>-		 * a node or leaf for another different btree.</div><div class='del'>-		 * We are safe from races here because at this point no other</div><div class='del'>-		 * node or root points to this extent buffer, so if after this</div><div class='del'>-		 * check a new tree mod log user joins, it will not be able to</div><div class='del'>-		 * find a node pointing to this leaf and record operations that</div><div class='del'>-		 * point to this leaf.</div><div class='del'>-		 */</div><div class='del'>-		if (btrfs_header_level(buf) == 0 &amp;&amp;</div><div class='del'>-		    test_bit(BTRFS_FS_TREE_MOD_LOG_USERS, &amp;fs_info-&gt;flags))</div><div class='del'>-			must_pin = true;</div><div class='add'>+	bg = btrfs_lookup_block_group(fs_info, buf-&gt;start);</div><div class='ctx'> </div><div class='del'>-		if (must_pin || btrfs_is_zoned(fs_info)) {</div><div class='del'>-			btrfs_redirty_list_add(trans-&gt;transaction, buf);</div><div class='del'>-			pin_down_extent(trans, cache, buf-&gt;start, buf-&gt;len, 1);</div><div class='del'>-			btrfs_put_block_group(cache);</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+	if (btrfs_header_flag(buf, BTRFS_HEADER_FLAG_WRITTEN)) {</div><div class='add'>+		pin_down_extent(trans, bg, buf-&gt;start, buf-&gt;len, true);</div><div class='add'>+		btrfs_put_block_group(bg);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		WARN_ON(test_bit(EXTENT_BUFFER_DIRTY, &amp;buf-&gt;bflags));</div><div class='add'>+	/*</div><div class='add'>+	 * If there are tree mod log users we may have recorded mod log</div><div class='add'>+	 * operations for this node.  If we re-allocate this node we</div><div class='add'>+	 * could replay operations on this node that happened when it</div><div class='add'>+	 * existed in a completely different root.  For example if it</div><div class='add'>+	 * was part of root A, then was reallocated to root B, and we</div><div class='add'>+	 * are doing a btrfs_old_search_slot(root b), we could replay</div><div class='add'>+	 * operations that happened when the block was part of root A,</div><div class='add'>+	 * giving us an inconsistent view of the btree.</div><div class='add'>+	 *</div><div class='add'>+	 * We are safe from races here because at this point no other</div><div class='add'>+	 * node or root points to this extent buffer, so if after this</div><div class='add'>+	 * check a new tree mod log user joins we will not have an</div><div class='add'>+	 * existing log of operations on this node that we have to</div><div class='add'>+	 * contend with.</div><div class='add'>+	 */</div><div class='ctx'> </div><div class='del'>-		btrfs_add_free_space(cache, buf-&gt;start, buf-&gt;len);</div><div class='del'>-		btrfs_free_reserved_bytes(cache, buf-&gt;len, 0);</div><div class='del'>-		btrfs_put_block_group(cache);</div><div class='del'>-		trace_btrfs_reserved_extent_free(fs_info, buf-&gt;start, buf-&gt;len);</div><div class='add'>+	if (test_bit(BTRFS_FS_TREE_MOD_LOG_USERS, &amp;fs_info-&gt;flags)</div><div class='add'>+		     || btrfs_is_zoned(fs_info)) {</div><div class='add'>+		pin_down_extent(trans, bg, buf-&gt;start, buf-&gt;len, true);</div><div class='add'>+		btrfs_put_block_group(bg);</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	WARN_ON(test_bit(EXTENT_BUFFER_DIRTY, &amp;buf-&gt;bflags));</div><div class='add'>+</div><div class='add'>+	btrfs_add_free_space(bg, buf-&gt;start, buf-&gt;len);</div><div class='add'>+	btrfs_free_reserved_bytes(bg, buf-&gt;len, false);</div><div class='add'>+	btrfs_put_block_group(bg);</div><div class='add'>+	trace_btrfs_reserved_extent_free(fs_info, buf-&gt;start, buf-&gt;len);</div><div class='add'>+</div><div class='ctx'> out:</div><div class='del'>-	if (last_ref) {</div><div class='del'>-		/*</div><div class='del'>-		 * Deleting the buffer, clear the corrupt flag since it doesn't</div><div class='del'>-		 * matter anymore.</div><div class='del'>-		 */</div><div class='del'>-		clear_bit(EXTENT_BUFFER_CORRUPT, &amp;buf-&gt;bflags);</div><div class='del'>-	}</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Can return -ENOMEM */</div><div class='hunk'>@@ -3369,12 +3526,8 @@ int btrfs_free_extent(struct btrfs_trans_handle *trans, struct btrfs_ref *ref)</div><div class='ctx'> 	 * tree log blocks never actually go into the extent allocation</div><div class='ctx'> 	 * tree, just update pinning info and exit early.</div><div class='ctx'> 	 */</div><div class='del'>-	if ((ref-&gt;type == BTRFS_REF_METADATA &amp;&amp;</div><div class='del'>-	     ref-&gt;tree_ref.owning_root == BTRFS_TREE_LOG_OBJECTID) ||</div><div class='del'>-	    (ref-&gt;type == BTRFS_REF_DATA &amp;&amp;</div><div class='del'>-	     ref-&gt;data_ref.owning_root == BTRFS_TREE_LOG_OBJECTID)) {</div><div class='del'>-		/* unlocks the pinned mutex */</div><div class='del'>-		btrfs_pin_extent(trans, ref-&gt;bytenr, ref-&gt;len, 1);</div><div class='add'>+	if (ref-&gt;ref_root == BTRFS_TREE_LOG_OBJECTID) {</div><div class='add'>+		btrfs_pin_extent(trans, ref-&gt;bytenr, ref-&gt;num_bytes);</div><div class='ctx'> 		ret = 0;</div><div class='ctx'> 	} else if (ref-&gt;type == BTRFS_REF_METADATA) {</div><div class='ctx'> 		ret = btrfs_add_delayed_tree_ref(trans, ref, NULL);</div><div class='hunk'>@@ -3382,32 +3535,57 @@ int btrfs_free_extent(struct btrfs_trans_handle *trans, struct btrfs_ref *ref)</div><div class='ctx'> 		ret = btrfs_add_delayed_data_ref(trans, ref, 0);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!((ref-&gt;type == BTRFS_REF_METADATA &amp;&amp;</div><div class='del'>-	       ref-&gt;tree_ref.owning_root == BTRFS_TREE_LOG_OBJECTID) ||</div><div class='del'>-	      (ref-&gt;type == BTRFS_REF_DATA &amp;&amp;</div><div class='del'>-	       ref-&gt;data_ref.owning_root == BTRFS_TREE_LOG_OBJECTID)))</div><div class='add'>+	if (ref-&gt;ref_root != BTRFS_TREE_LOG_OBJECTID)</div><div class='ctx'> 		btrfs_ref_tree_mod(fs_info, ref);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> enum btrfs_loop_type {</div><div class='add'>+	/*</div><div class='add'>+	 * Start caching block groups but do not wait for progress or for them</div><div class='add'>+	 * to be done.</div><div class='add'>+	 */</div><div class='ctx'> 	LOOP_CACHING_NOWAIT,</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Wait for the block group free_space &gt;= the space we're waiting for if</div><div class='add'>+	 * the block group isn't cached.</div><div class='add'>+	 */</div><div class='ctx'> 	LOOP_CACHING_WAIT,</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Allow allocations to happen from block groups that do not yet have a</div><div class='add'>+	 * size classification.</div><div class='add'>+	 */</div><div class='add'>+	LOOP_UNSET_SIZE_CLASS,</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Allocate a chunk and then retry the allocation.</div><div class='add'>+	 */</div><div class='ctx'> 	LOOP_ALLOC_CHUNK,</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Ignore the size class restrictions for this allocation.</div><div class='add'>+	 */</div><div class='add'>+	LOOP_WRONG_SIZE_CLASS,</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Ignore the empty size, only try to allocate the number of bytes</div><div class='add'>+	 * needed for this allocation.</div><div class='add'>+	 */</div><div class='ctx'> 	LOOP_NO_EMPTY_SIZE,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static inline void</div><div class='del'>-btrfs_lock_block_group(struct btrfs_block_group *cache,</div><div class='del'>-		       int delalloc)</div><div class='add'>+btrfs_lock_block_group(struct btrfs_block_group *cache, bool delalloc)</div><div class='ctx'> {</div><div class='ctx'> 	if (delalloc)</div><div class='ctx'> 		down_read(&amp;cache-&gt;data_rwsem);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void btrfs_grab_block_group(struct btrfs_block_group *cache,</div><div class='del'>-		       int delalloc)</div><div class='add'>+					  bool delalloc)</div><div class='ctx'> {</div><div class='ctx'> 	btrfs_get_block_group(cache);</div><div class='ctx'> 	if (delalloc)</div><div class='hunk'>@@ -3417,7 +3595,7 @@ static inline void btrfs_grab_block_group(struct btrfs_block_group *cache,</div><div class='ctx'> static struct btrfs_block_group *btrfs_lock_cluster(</div><div class='ctx'> 		   struct btrfs_block_group *block_group,</div><div class='ctx'> 		   struct btrfs_free_cluster *cluster,</div><div class='del'>-		   int delalloc)</div><div class='add'>+		   bool delalloc)</div><div class='ctx'> 	__acquires(&amp;cluster-&gt;refill_lock)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_block_group *used_bg = NULL;</div><div class='hunk'>@@ -3454,94 +3632,32 @@ static struct btrfs_block_group *btrfs_lock_cluster(</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void</div><div class='del'>-btrfs_release_block_group(struct btrfs_block_group *cache,</div><div class='del'>-			 int delalloc)</div><div class='add'>+btrfs_release_block_group(struct btrfs_block_group *cache, bool delalloc)</div><div class='ctx'> {</div><div class='ctx'> 	if (delalloc)</div><div class='ctx'> 		up_read(&amp;cache-&gt;data_rwsem);</div><div class='ctx'> 	btrfs_put_block_group(cache);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-enum btrfs_extent_allocation_policy {</div><div class='del'>-	BTRFS_EXTENT_ALLOC_CLUSTERED,</div><div class='del'>-	BTRFS_EXTENT_ALLOC_ZONED,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Structure used internally for find_free_extent() function.  Wraps needed</div><div class='del'>- * parameters.</div><div class='del'>- */</div><div class='del'>-struct find_free_extent_ctl {</div><div class='del'>-	/* Basic allocation info */</div><div class='del'>-	u64 ram_bytes;</div><div class='del'>-	u64 num_bytes;</div><div class='del'>-	u64 min_alloc_size;</div><div class='del'>-	u64 empty_size;</div><div class='del'>-	u64 flags;</div><div class='del'>-	int delalloc;</div><div class='del'>-</div><div class='del'>-	/* Where to start the search inside the bg */</div><div class='del'>-	u64 search_start;</div><div class='del'>-</div><div class='del'>-	/* For clustered allocation */</div><div class='del'>-	u64 empty_cluster;</div><div class='del'>-	struct btrfs_free_cluster *last_ptr;</div><div class='del'>-	bool use_cluster;</div><div class='del'>-</div><div class='del'>-	bool have_caching_bg;</div><div class='del'>-	bool orig_have_caching_bg;</div><div class='del'>-</div><div class='del'>-	/* Allocation is called for tree-log */</div><div class='del'>-	bool for_treelog;</div><div class='del'>-</div><div class='del'>-	/* Allocation is called for data relocation */</div><div class='del'>-	bool for_data_reloc;</div><div class='del'>-</div><div class='del'>-	/* RAID index, converted from flags */</div><div class='del'>-	int index;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Current loop number, check find_free_extent_update_loop() for details</div><div class='del'>-	 */</div><div class='del'>-	int loop;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Whether we're refilling a cluster, if true we need to re-search</div><div class='del'>-	 * current block group but don't try to refill the cluster again.</div><div class='del'>-	 */</div><div class='del'>-	bool retry_clustered;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Whether we're updating free space cache, if true we need to re-search</div><div class='del'>-	 * current block group but don't try updating free space cache again.</div><div class='del'>-	 */</div><div class='del'>-	bool retry_unclustered;</div><div class='del'>-</div><div class='del'>-	/* If current block group is cached */</div><div class='del'>-	int cached;</div><div class='del'>-</div><div class='del'>-	/* Max contiguous hole found */</div><div class='del'>-	u64 max_extent_size;</div><div class='del'>-</div><div class='del'>-	/* Total free space from free space cache, not always contiguous */</div><div class='del'>-	u64 total_free_space;</div><div class='del'>-</div><div class='del'>-	/* Found result */</div><div class='del'>-	u64 found_offset;</div><div class='del'>-</div><div class='del'>-	/* Hint where to start looking for an empty space */</div><div class='del'>-	u64 hint_byte;</div><div class='del'>-</div><div class='del'>-	/* Allocation policy */</div><div class='del'>-	enum btrfs_extent_allocation_policy policy;</div><div class='del'>-};</div><div class='del'>-</div><div class='add'>+static bool find_free_extent_check_size_class(const struct find_free_extent_ctl *ffe_ctl,</div><div class='add'>+					      const struct btrfs_block_group *bg)</div><div class='add'>+{</div><div class='add'>+	if (ffe_ctl-&gt;policy == BTRFS_EXTENT_ALLOC_ZONED)</div><div class='add'>+		return true;</div><div class='add'>+	if (!btrfs_block_group_should_use_size_class(bg))</div><div class='add'>+		return true;</div><div class='add'>+	if (ffe_ctl-&gt;loop &gt;= LOOP_WRONG_SIZE_CLASS)</div><div class='add'>+		return true;</div><div class='add'>+	if (ffe_ctl-&gt;loop &gt;= LOOP_UNSET_SIZE_CLASS &amp;&amp;</div><div class='add'>+	    bg-&gt;size_class == BTRFS_BG_SZ_NONE)</div><div class='add'>+		return true;</div><div class='add'>+	return ffe_ctl-&gt;size_class == bg-&gt;size_class;</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Helper function for find_free_extent().</div><div class='ctx'>  *</div><div class='ctx'>  * Return -ENOENT to inform caller that we need fallback to unclustered mode.</div><div class='del'>- * Return -EAGAIN to inform caller that we need to re-search this block group</div><div class='ctx'>  * Return &gt;0 to inform caller that we find nothing</div><div class='ctx'>  * Return 0 means we have found a location and set ffe_ctl-&gt;found_offset.</div><div class='ctx'>  */</div><div class='hunk'>@@ -3559,7 +3675,8 @@ static int find_free_extent_clustered(struct btrfs_block_group *bg,</div><div class='ctx'> 	if (!cluster_bg)</div><div class='ctx'> 		goto refill_cluster;</div><div class='ctx'> 	if (cluster_bg != bg &amp;&amp; (cluster_bg-&gt;ro ||</div><div class='del'>-	    !block_group_bits(cluster_bg, ffe_ctl-&gt;flags)))</div><div class='add'>+	    !block_group_bits(cluster_bg, ffe_ctl-&gt;flags) ||</div><div class='add'>+	    !find_free_extent_check_size_class(ffe_ctl, cluster_bg)))</div><div class='ctx'> 		goto release_cluster;</div><div class='ctx'> </div><div class='ctx'> 	offset = btrfs_alloc_from_cluster(cluster_bg, last_ptr,</div><div class='hunk'>@@ -3568,8 +3685,7 @@ static int find_free_extent_clustered(struct btrfs_block_group *bg,</div><div class='ctx'> 	if (offset) {</div><div class='ctx'> 		/* We have a block, we're done */</div><div class='ctx'> 		spin_unlock(&amp;last_ptr-&gt;refill_lock);</div><div class='del'>-		trace_btrfs_reserve_extent_cluster(cluster_bg,</div><div class='del'>-				ffe_ctl-&gt;search_start, ffe_ctl-&gt;num_bytes);</div><div class='add'>+		trace_btrfs_reserve_extent_cluster(cluster_bg, ffe_ctl);</div><div class='ctx'> 		*cluster_bg_ret = cluster_bg;</div><div class='ctx'> 		ffe_ctl-&gt;found_offset = offset;</div><div class='ctx'> 		return 0;</div><div class='hunk'>@@ -3619,20 +3735,10 @@ refill_cluster:</div><div class='ctx'> 		if (offset) {</div><div class='ctx'> 			/* We found one, proceed */</div><div class='ctx'> 			spin_unlock(&amp;last_ptr-&gt;refill_lock);</div><div class='del'>-			trace_btrfs_reserve_extent_cluster(bg,</div><div class='del'>-					ffe_ctl-&gt;search_start,</div><div class='del'>-					ffe_ctl-&gt;num_bytes);</div><div class='ctx'> 			ffe_ctl-&gt;found_offset = offset;</div><div class='add'>+			trace_btrfs_reserve_extent_cluster(bg, ffe_ctl);</div><div class='ctx'> 			return 0;</div><div class='ctx'> 		}</div><div class='del'>-	} else if (!ffe_ctl-&gt;cached &amp;&amp; ffe_ctl-&gt;loop &gt; LOOP_CACHING_NOWAIT &amp;&amp;</div><div class='del'>-		   !ffe_ctl-&gt;retry_clustered) {</div><div class='del'>-		spin_unlock(&amp;last_ptr-&gt;refill_lock);</div><div class='del'>-</div><div class='del'>-		ffe_ctl-&gt;retry_clustered = true;</div><div class='del'>-		btrfs_wait_block_group_cache_progress(bg, ffe_ctl-&gt;num_bytes +</div><div class='del'>-				ffe_ctl-&gt;empty_cluster + ffe_ctl-&gt;empty_size);</div><div class='del'>-		return -EAGAIN;</div><div class='ctx'> 	}</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * At this point we either didn't find a cluster or we weren't able to</div><div class='hunk'>@@ -3647,7 +3753,6 @@ refill_cluster:</div><div class='ctx'> /*</div><div class='ctx'>  * Return &gt;0 to inform caller that we find nothing</div><div class='ctx'>  * Return 0 when we found an free extent and set ffe_ctrl-&gt;found_offset</div><div class='del'>- * Return -EAGAIN to inform caller that we need to re-search this block group</div><div class='ctx'>  */</div><div class='ctx'> static int find_free_extent_unclustered(struct btrfs_block_group *bg,</div><div class='ctx'> 					struct find_free_extent_ctl *ffe_ctl)</div><div class='hunk'>@@ -3685,25 +3790,8 @@ static int find_free_extent_unclustered(struct btrfs_block_group *bg,</div><div class='ctx'> 	offset = btrfs_find_space_for_alloc(bg, ffe_ctl-&gt;search_start,</div><div class='ctx'> 			ffe_ctl-&gt;num_bytes, ffe_ctl-&gt;empty_size,</div><div class='ctx'> 			&amp;ffe_ctl-&gt;max_extent_size);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If we didn't find a chunk, and we haven't failed on this block group</div><div class='del'>-	 * before, and this block group is in the middle of caching and we are</div><div class='del'>-	 * ok with waiting, then go ahead and wait for progress to be made, and</div><div class='del'>-	 * set @retry_unclustered to true.</div><div class='del'>-	 *</div><div class='del'>-	 * If @retry_unclustered is true then we've already waited on this</div><div class='del'>-	 * block group once and should move on to the next block group.</div><div class='del'>-	 */</div><div class='del'>-	if (!offset &amp;&amp; !ffe_ctl-&gt;retry_unclustered &amp;&amp; !ffe_ctl-&gt;cached &amp;&amp;</div><div class='del'>-	    ffe_ctl-&gt;loop &gt; LOOP_CACHING_NOWAIT) {</div><div class='del'>-		btrfs_wait_block_group_cache_progress(bg, ffe_ctl-&gt;num_bytes +</div><div class='del'>-						      ffe_ctl-&gt;empty_size);</div><div class='del'>-		ffe_ctl-&gt;retry_unclustered = true;</div><div class='del'>-		return -EAGAIN;</div><div class='del'>-	} else if (!offset) {</div><div class='add'>+	if (!offset)</div><div class='ctx'> 		return 1;</div><div class='del'>-	}</div><div class='ctx'> 	ffe_ctl-&gt;found_offset = offset;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -3717,7 +3805,7 @@ static int do_allocation_clustered(struct btrfs_block_group *block_group,</div><div class='ctx'> 	/* We want to try and use the cluster allocator, so lets look there */</div><div class='ctx'> 	if (ffe_ctl-&gt;last_ptr &amp;&amp; ffe_ctl-&gt;use_cluster) {</div><div class='ctx'> 		ret = find_free_extent_clustered(block_group, ffe_ctl, bg_ret);</div><div class='del'>-		if (ret &gt;= 0 || ret == -EAGAIN)</div><div class='add'>+		if (ret &gt;= 0)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 		/* ret == -ENOENT case falls through */</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3790,23 +3878,36 @@ static int do_allocation_zoned(struct btrfs_block_group *block_group,</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;relocation_bg_lock);</div><div class='ctx'> 	if (skip)</div><div class='ctx'> 		return 1;</div><div class='add'>+</div><div class='ctx'> 	/* Check RO and no space case before trying to activate it */</div><div class='ctx'> 	spin_lock(&amp;block_group-&gt;lock);</div><div class='del'>-	if (block_group-&gt;ro ||</div><div class='del'>-	    block_group-&gt;alloc_offset == block_group-&gt;zone_capacity) {</div><div class='del'>-		spin_unlock(&amp;block_group-&gt;lock);</div><div class='del'>-		return 1;</div><div class='add'>+	if (block_group-&gt;ro || btrfs_zoned_bg_is_full(block_group)) {</div><div class='add'>+		ret = 1;</div><div class='add'>+		/*</div><div class='add'>+		 * May need to clear fs_info-&gt;{treelog,data_reloc}_bg.</div><div class='add'>+		 * Return the error after taking the locks.</div><div class='add'>+		 */</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;block_group-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	if (!btrfs_zone_activate(block_group))</div><div class='del'>-		return 1;</div><div class='add'>+	/* Metadata block group is activated at write time. */</div><div class='add'>+	if (!ret &amp;&amp; (block_group-&gt;flags &amp; BTRFS_BLOCK_GROUP_DATA) &amp;&amp;</div><div class='add'>+	    !btrfs_zone_activate(block_group)) {</div><div class='add'>+		ret = 1;</div><div class='add'>+		/*</div><div class='add'>+		 * May need to clear fs_info-&gt;{treelog,data_reloc}_bg.</div><div class='add'>+		 * Return the error after taking the locks.</div><div class='add'>+		 */</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;space_info-&gt;lock);</div><div class='ctx'> 	spin_lock(&amp;block_group-&gt;lock);</div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;treelog_bg_lock);</div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;relocation_bg_lock);</div><div class='ctx'> </div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='ctx'> 	ASSERT(!ffe_ctl-&gt;for_treelog ||</div><div class='ctx'> 	       block_group-&gt;start == fs_info-&gt;treelog_bg ||</div><div class='ctx'> 	       fs_info-&gt;treelog_bg == 0);</div><div class='hunk'>@@ -3814,7 +3915,9 @@ static int do_allocation_zoned(struct btrfs_block_group *block_group,</div><div class='ctx'> 	       block_group-&gt;start == fs_info-&gt;data_reloc_bg ||</div><div class='ctx'> 	       fs_info-&gt;data_reloc_bg == 0);</div><div class='ctx'> </div><div class='del'>-	if (block_group-&gt;ro) {</div><div class='add'>+	if (block_group-&gt;ro ||</div><div class='add'>+	    (!ffe_ctl-&gt;for_data_reloc &amp;&amp;</div><div class='add'>+	     test_bit(BLOCK_GROUP_FLAG_ZONED_DATA_RELOC, &amp;block_group-&gt;runtime_flags))) {</div><div class='ctx'> 		ret = 1;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3857,8 +3960,26 @@ static int do_allocation_zoned(struct btrfs_block_group *block_group,</div><div class='ctx'> 	if (ffe_ctl-&gt;for_treelog &amp;&amp; !fs_info-&gt;treelog_bg)</div><div class='ctx'> 		fs_info-&gt;treelog_bg = block_group-&gt;start;</div><div class='ctx'> </div><div class='del'>-	if (ffe_ctl-&gt;for_data_reloc &amp;&amp; !fs_info-&gt;data_reloc_bg)</div><div class='del'>-		fs_info-&gt;data_reloc_bg = block_group-&gt;start;</div><div class='add'>+	if (ffe_ctl-&gt;for_data_reloc) {</div><div class='add'>+		if (!fs_info-&gt;data_reloc_bg)</div><div class='add'>+			fs_info-&gt;data_reloc_bg = block_group-&gt;start;</div><div class='add'>+		/*</div><div class='add'>+		 * Do not allow allocations from this block group, unless it is</div><div class='add'>+		 * for data relocation. Compared to increasing the -&gt;ro, setting</div><div class='add'>+		 * the -&gt;zoned_data_reloc_ongoing flag still allows nocow</div><div class='add'>+		 * writers to come in. See btrfs_inc_nocow_writers().</div><div class='add'>+		 *</div><div class='add'>+		 * We need to disable an allocation to avoid an allocation of</div><div class='add'>+		 * regular (non-relocation data) extent. With mix of relocation</div><div class='add'>+		 * extents and regular extents, we can dispatch WRITE commands</div><div class='add'>+		 * (for relocation extents) and ZONE APPEND commands (for</div><div class='add'>+		 * regular extents) at the same time to the same zone, which</div><div class='add'>+		 * easily break the write pointer.</div><div class='add'>+		 *</div><div class='add'>+		 * Also, this flag avoids this block group to be zone finished.</div><div class='add'>+		 */</div><div class='add'>+		set_bit(BLOCK_GROUP_FLAG_ZONED_DATA_RELOC, &amp;block_group-&gt;runtime_flags);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	ffe_ctl-&gt;found_offset = start + block_group-&gt;alloc_offset;</div><div class='ctx'> 	block_group-&gt;alloc_offset += num_bytes;</div><div class='hunk'>@@ -3901,12 +4022,11 @@ static int do_allocation(struct btrfs_block_group *block_group,</div><div class='ctx'> </div><div class='ctx'> static void release_block_group(struct btrfs_block_group *block_group,</div><div class='ctx'> 				struct find_free_extent_ctl *ffe_ctl,</div><div class='del'>-				int delalloc)</div><div class='add'>+				bool delalloc)</div><div class='ctx'> {</div><div class='ctx'> 	switch (ffe_ctl-&gt;policy) {</div><div class='ctx'> 	case BTRFS_EXTENT_ALLOC_CLUSTERED:</div><div class='del'>-		ffe_ctl-&gt;retry_clustered = false;</div><div class='del'>-		ffe_ctl-&gt;retry_unclustered = false;</div><div class='add'>+		ffe_ctl-&gt;retry_uncached = false;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case BTRFS_EXTENT_ALLOC_ZONED:</div><div class='ctx'> 		/* Nothing to do */</div><div class='hunk'>@@ -3947,19 +4067,67 @@ static void found_extent(struct find_free_extent_ctl *ffe_ctl,</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int chunk_allocation_failed(struct find_free_extent_ctl *ffe_ctl)</div><div class='add'>+static int can_allocate_chunk_zoned(struct btrfs_fs_info *fs_info,</div><div class='add'>+				    struct find_free_extent_ctl *ffe_ctl)</div><div class='add'>+{</div><div class='add'>+	/* Block group's activeness is not a requirement for METADATA block groups. */</div><div class='add'>+	if (!(ffe_ctl-&gt;flags &amp; BTRFS_BLOCK_GROUP_DATA))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/* If we can activate new zone, just allocate a chunk and use it */</div><div class='add'>+	if (btrfs_can_activate_zone(fs_info-&gt;fs_devices, ffe_ctl-&gt;flags))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We already reached the max active zones. Try to finish one block</div><div class='add'>+	 * group to make a room for a new block group. This is only possible</div><div class='add'>+	 * for a data block group because btrfs_zone_finish() may need to wait</div><div class='add'>+	 * for a running transaction which can cause a deadlock for metadata</div><div class='add'>+	 * allocation.</div><div class='add'>+	 */</div><div class='add'>+	if (ffe_ctl-&gt;flags &amp; BTRFS_BLOCK_GROUP_DATA) {</div><div class='add'>+		int ret = btrfs_zone_finish_one_bg(fs_info);</div><div class='add'>+</div><div class='add'>+		if (ret == 1)</div><div class='add'>+			return 0;</div><div class='add'>+		else if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If we have enough free space left in an already active block group</div><div class='add'>+	 * and we can't activate any other zone now, do not allow allocating a</div><div class='add'>+	 * new chunk and let find_free_extent() retry with a smaller size.</div><div class='add'>+	 */</div><div class='add'>+	if (ffe_ctl-&gt;max_extent_size &gt;= ffe_ctl-&gt;min_alloc_size)</div><div class='add'>+		return -ENOSPC;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Even min_alloc_size is not left in any block groups. Since we cannot</div><div class='add'>+	 * activate a new block group, allocating it may not help. Let's tell a</div><div class='add'>+	 * caller to try again and hope it progress something by writing some</div><div class='add'>+	 * parts of the region. That is only possible for data block groups,</div><div class='add'>+	 * where a part of the region can be written.</div><div class='add'>+	 */</div><div class='add'>+	if (ffe_ctl-&gt;flags &amp; BTRFS_BLOCK_GROUP_DATA)</div><div class='add'>+		return -EAGAIN;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We cannot activate a new block group and no enough space left in any</div><div class='add'>+	 * block groups. So, allocating a new block group may not help. But,</div><div class='add'>+	 * there is nothing to do anyway, so let's go with it.</div><div class='add'>+	 */</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int can_allocate_chunk(struct btrfs_fs_info *fs_info,</div><div class='add'>+			      struct find_free_extent_ctl *ffe_ctl)</div><div class='ctx'> {</div><div class='ctx'> 	switch (ffe_ctl-&gt;policy) {</div><div class='ctx'> 	case BTRFS_EXTENT_ALLOC_CLUSTERED:</div><div class='del'>-		/*</div><div class='del'>-		 * If we can't allocate a new chunk we've already looped through</div><div class='del'>-		 * at least once, move on to the NO_EMPTY_SIZE case.</div><div class='del'>-		 */</div><div class='del'>-		ffe_ctl-&gt;loop = LOOP_NO_EMPTY_SIZE;</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	case BTRFS_EXTENT_ALLOC_ZONED:</div><div class='del'>-		/* Give up here */</div><div class='del'>-		return -ENOSPC;</div><div class='add'>+		return can_allocate_chunk_zoned(fs_info, ffe_ctl);</div><div class='ctx'> 	default:</div><div class='ctx'> 		BUG();</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3973,9 +4141,10 @@ static int chunk_allocation_failed(struct find_free_extent_ctl *ffe_ctl)</div><div class='ctx'> static int find_free_extent_update_loop(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 					struct btrfs_key *ins,</div><div class='ctx'> 					struct find_free_extent_ctl *ffe_ctl,</div><div class='add'>+					struct btrfs_space_info *space_info,</div><div class='ctx'> 					bool full_search)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *root = fs_info-&gt;extent_root;</div><div class='add'>+	struct btrfs_root *root = fs_info-&gt;chunk_root;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if ((ffe_ctl-&gt;loop == LOOP_CACHING_NOWAIT) &amp;&amp;</div><div class='hunk'>@@ -3987,18 +4156,6 @@ static int find_free_extent_update_loop(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (ffe_ctl-&gt;max_extent_size &gt;= ffe_ctl-&gt;min_alloc_size &amp;&amp;</div><div class='del'>-	    !btrfs_can_activate_zone(fs_info-&gt;fs_devices, ffe_ctl-&gt;index)) {</div><div class='del'>-		/*</div><div class='del'>-		 * If we have enough free space left in an already active block</div><div class='del'>-		 * group and we can't activate any other zone now, retry the</div><div class='del'>-		 * active ones with a smaller allocation size.  Returning early</div><div class='del'>-		 * from here will tell btrfs_reserve_extent() to haven the</div><div class='del'>-		 * size.</div><div class='del'>-		 */</div><div class='del'>-		return -ENOSPC;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	if (ffe_ctl-&gt;loop &gt;= LOOP_CACHING_WAIT &amp;&amp; ffe_ctl-&gt;have_caching_bg)</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='hunk'>@@ -4006,34 +4163,28 @@ static int find_free_extent_update_loop(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	if (ffe_ctl-&gt;index &lt; BTRFS_NR_RAID_TYPES)</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * LOOP_CACHING_NOWAIT, search partially cached block groups, kicking</div><div class='del'>-	 *			caching kthreads as we move along</div><div class='del'>-	 * LOOP_CACHING_WAIT, search everything, and wait if our bg is caching</div><div class='del'>-	 * LOOP_ALLOC_CHUNK, force a chunk allocation and try again</div><div class='del'>-	 * LOOP_NO_EMPTY_SIZE, set empty_size and empty_cluster to 0 and try</div><div class='del'>-	 *		       again</div><div class='del'>-	 */</div><div class='add'>+	/* See the comments for btrfs_loop_type for an explanation of the phases. */</div><div class='ctx'> 	if (ffe_ctl-&gt;loop &lt; LOOP_NO_EMPTY_SIZE) {</div><div class='ctx'> 		ffe_ctl-&gt;index = 0;</div><div class='del'>-		if (ffe_ctl-&gt;loop == LOOP_CACHING_NOWAIT) {</div><div class='del'>-			/*</div><div class='del'>-			 * We want to skip the LOOP_CACHING_WAIT step if we</div><div class='del'>-			 * don't have any uncached bgs and we've already done a</div><div class='del'>-			 * full search through.</div><div class='del'>-			 */</div><div class='del'>-			if (ffe_ctl-&gt;orig_have_caching_bg || !full_search)</div><div class='del'>-				ffe_ctl-&gt;loop = LOOP_CACHING_WAIT;</div><div class='del'>-			else</div><div class='del'>-				ffe_ctl-&gt;loop = LOOP_ALLOC_CHUNK;</div><div class='del'>-		} else {</div><div class='add'>+		/*</div><div class='add'>+		 * We want to skip the LOOP_CACHING_WAIT step if we don't have</div><div class='add'>+		 * any uncached bgs and we've already done a full search</div><div class='add'>+		 * through.</div><div class='add'>+		 */</div><div class='add'>+		if (ffe_ctl-&gt;loop == LOOP_CACHING_NOWAIT &amp;&amp;</div><div class='add'>+		    (!ffe_ctl-&gt;orig_have_caching_bg &amp;&amp; full_search))</div><div class='ctx'> 			ffe_ctl-&gt;loop++;</div><div class='del'>-		}</div><div class='add'>+		ffe_ctl-&gt;loop++;</div><div class='ctx'> </div><div class='ctx'> 		if (ffe_ctl-&gt;loop == LOOP_ALLOC_CHUNK) {</div><div class='ctx'> 			struct btrfs_trans_handle *trans;</div><div class='ctx'> 			int exist = 0;</div><div class='ctx'> </div><div class='add'>+			/* Check if allocation policy allows to create a new chunk */</div><div class='add'>+			ret = can_allocate_chunk(fs_info, ffe_ctl);</div><div class='add'>+			if (ret)</div><div class='add'>+				return ret;</div><div class='add'>+</div><div class='ctx'> 			trans = current-&gt;journal_info;</div><div class='ctx'> 			if (trans)</div><div class='ctx'> 				exist = 1;</div><div class='hunk'>@@ -4045,12 +4196,14 @@ static int find_free_extent_update_loop(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				return ret;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			ret = btrfs_chunk_alloc(trans, ffe_ctl-&gt;flags,</div><div class='del'>-						CHUNK_ALLOC_FORCE);</div><div class='add'>+			ret = btrfs_chunk_alloc(trans, space_info, ffe_ctl-&gt;flags,</div><div class='add'>+						CHUNK_ALLOC_FORCE_FOR_EXTENT);</div><div class='ctx'> </div><div class='ctx'> 			/* Do not bail out on ENOSPC since we can do more. */</div><div class='del'>-			if (ret == -ENOSPC)</div><div class='del'>-				ret = chunk_allocation_failed(ffe_ctl);</div><div class='add'>+			if (ret == -ENOSPC) {</div><div class='add'>+				ret = 0;</div><div class='add'>+				ffe_ctl-&gt;loop++;</div><div class='add'>+			}</div><div class='ctx'> 			else if (ret &lt; 0)</div><div class='ctx'> 				btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			else</div><div class='hunk'>@@ -4131,6 +4284,44 @@ static int prepare_allocation_clustered(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int prepare_allocation_zoned(struct btrfs_fs_info *fs_info,</div><div class='add'>+				    struct find_free_extent_ctl *ffe_ctl,</div><div class='add'>+				    struct btrfs_space_info *space_info)</div><div class='add'>+{</div><div class='add'>+	if (ffe_ctl-&gt;for_treelog) {</div><div class='add'>+		spin_lock(&amp;fs_info-&gt;treelog_bg_lock);</div><div class='add'>+		if (fs_info-&gt;treelog_bg)</div><div class='add'>+			ffe_ctl-&gt;hint_byte = fs_info-&gt;treelog_bg;</div><div class='add'>+		spin_unlock(&amp;fs_info-&gt;treelog_bg_lock);</div><div class='add'>+	} else if (ffe_ctl-&gt;for_data_reloc) {</div><div class='add'>+		spin_lock(&amp;fs_info-&gt;relocation_bg_lock);</div><div class='add'>+		if (fs_info-&gt;data_reloc_bg)</div><div class='add'>+			ffe_ctl-&gt;hint_byte = fs_info-&gt;data_reloc_bg;</div><div class='add'>+		spin_unlock(&amp;fs_info-&gt;relocation_bg_lock);</div><div class='add'>+	} else if (ffe_ctl-&gt;flags &amp; BTRFS_BLOCK_GROUP_DATA) {</div><div class='add'>+		struct btrfs_block_group *block_group;</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;fs_info-&gt;zone_active_bgs_lock);</div><div class='add'>+		list_for_each_entry(block_group, &amp;fs_info-&gt;zone_active_bgs, active_bg_list) {</div><div class='add'>+			/*</div><div class='add'>+			 * No lock is OK here because avail is monotonically</div><div class='add'>+			 * decreasing, and this is just a hint.</div><div class='add'>+			 */</div><div class='add'>+			u64 avail = block_group-&gt;zone_capacity - block_group-&gt;alloc_offset;</div><div class='add'>+</div><div class='add'>+			if (block_group_bits(block_group, ffe_ctl-&gt;flags) &amp;&amp;</div><div class='add'>+			    block_group-&gt;space_info == space_info &amp;&amp;</div><div class='add'>+			    avail &gt;= ffe_ctl-&gt;num_bytes) {</div><div class='add'>+				ffe_ctl-&gt;hint_byte = block_group-&gt;start;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;fs_info-&gt;zone_active_bgs_lock);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int prepare_allocation(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			      struct find_free_extent_ctl *ffe_ctl,</div><div class='ctx'> 			      struct btrfs_space_info *space_info,</div><div class='hunk'>@@ -4141,19 +4332,7 @@ static int prepare_allocation(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		return prepare_allocation_clustered(fs_info, ffe_ctl,</div><div class='ctx'> 						    space_info, ins);</div><div class='ctx'> 	case BTRFS_EXTENT_ALLOC_ZONED:</div><div class='del'>-		if (ffe_ctl-&gt;for_treelog) {</div><div class='del'>-			spin_lock(&amp;fs_info-&gt;treelog_bg_lock);</div><div class='del'>-			if (fs_info-&gt;treelog_bg)</div><div class='del'>-				ffe_ctl-&gt;hint_byte = fs_info-&gt;treelog_bg;</div><div class='del'>-			spin_unlock(&amp;fs_info-&gt;treelog_bg_lock);</div><div class='del'>-		}</div><div class='del'>-		if (ffe_ctl-&gt;for_data_reloc) {</div><div class='del'>-			spin_lock(&amp;fs_info-&gt;relocation_bg_lock);</div><div class='del'>-			if (fs_info-&gt;data_reloc_bg)</div><div class='del'>-				ffe_ctl-&gt;hint_byte = fs_info-&gt;data_reloc_bg;</div><div class='del'>-			spin_unlock(&amp;fs_info-&gt;relocation_bg_lock);</div><div class='del'>-		}</div><div class='del'>-		return 0;</div><div class='add'>+		return prepare_allocation_zoned(fs_info, ffe_ctl, space_info);</div><div class='ctx'> 	default:</div><div class='ctx'> 		BUG();</div><div class='ctx'> 	}</div><div class='hunk'>@@ -4206,14 +4385,13 @@ static noinline int find_free_extent(struct btrfs_root *root,</div><div class='ctx'> 	ffe_ctl-&gt;orig_have_caching_bg = false;</div><div class='ctx'> 	ffe_ctl-&gt;index = btrfs_bg_flags_to_raid_index(ffe_ctl-&gt;flags);</div><div class='ctx'> 	ffe_ctl-&gt;loop = 0;</div><div class='del'>-	/* For clustered allocation */</div><div class='del'>-	ffe_ctl-&gt;retry_clustered = false;</div><div class='del'>-	ffe_ctl-&gt;retry_unclustered = false;</div><div class='add'>+	ffe_ctl-&gt;retry_uncached = false;</div><div class='ctx'> 	ffe_ctl-&gt;cached = 0;</div><div class='ctx'> 	ffe_ctl-&gt;max_extent_size = 0;</div><div class='ctx'> 	ffe_ctl-&gt;total_free_space = 0;</div><div class='ctx'> 	ffe_ctl-&gt;found_offset = 0;</div><div class='ctx'> 	ffe_ctl-&gt;policy = BTRFS_EXTENT_ALLOC_CLUSTERED;</div><div class='add'>+	ffe_ctl-&gt;size_class = btrfs_calc_block_group_size_class(ffe_ctl-&gt;num_bytes);</div><div class='ctx'> </div><div class='ctx'> 	if (btrfs_is_zoned(fs_info))</div><div class='ctx'> 		ffe_ctl-&gt;policy = BTRFS_EXTENT_ALLOC_ZONED;</div><div class='hunk'>@@ -4222,12 +4400,22 @@ static noinline int find_free_extent(struct btrfs_root *root,</div><div class='ctx'> 	ins-&gt;objectid = 0;</div><div class='ctx'> 	ins-&gt;offset = 0;</div><div class='ctx'> </div><div class='del'>-	trace_find_free_extent(root, ffe_ctl-&gt;num_bytes, ffe_ctl-&gt;empty_size,</div><div class='del'>-			       ffe_ctl-&gt;flags);</div><div class='add'>+	trace_btrfs_find_free_extent(root, ffe_ctl);</div><div class='ctx'> </div><div class='ctx'> 	space_info = btrfs_find_space_info(fs_info, ffe_ctl-&gt;flags);</div><div class='add'>+	if (btrfs_is_zoned(fs_info) &amp;&amp; space_info) {</div><div class='add'>+		/* Use dedicated sub-space_info for dedicated block group users. */</div><div class='add'>+		if (ffe_ctl-&gt;for_data_reloc) {</div><div class='add'>+			space_info = space_info-&gt;sub_group[0];</div><div class='add'>+			ASSERT(space_info-&gt;subgroup_id == BTRFS_SUB_GROUP_DATA_RELOC);</div><div class='add'>+		} else if (ffe_ctl-&gt;for_treelog) {</div><div class='add'>+			space_info = space_info-&gt;sub_group[0];</div><div class='add'>+			ASSERT(space_info-&gt;subgroup_id == BTRFS_SUB_GROUP_TREELOG);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> 	if (!space_info) {</div><div class='del'>-		btrfs_err(fs_info, "No space info for %llu", ffe_ctl-&gt;flags);</div><div class='add'>+		btrfs_err(fs_info, "no space info for %llu, tree-log %d, relocation %d",</div><div class='add'>+			  ffe_ctl-&gt;flags, ffe_ctl-&gt;for_treelog, ffe_ctl-&gt;for_data_reloc);</div><div class='ctx'> 		return -ENOSPC;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -4236,7 +4424,7 @@ static noinline int find_free_extent(struct btrfs_root *root,</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='ctx'> 	ffe_ctl-&gt;search_start = max(ffe_ctl-&gt;search_start,</div><div class='del'>-				    first_logical_byte(fs_info, 0));</div><div class='add'>+				    first_logical_byte(fs_info));</div><div class='ctx'> 	ffe_ctl-&gt;search_start = max(ffe_ctl-&gt;search_start, ffe_ctl-&gt;hint_byte);</div><div class='ctx'> 	if (ffe_ctl-&gt;search_start == ffe_ctl-&gt;hint_byte) {</div><div class='ctx'> 		block_group = btrfs_lookup_block_group(fs_info,</div><div class='hunk'>@@ -4249,6 +4437,7 @@ static noinline int find_free_extent(struct btrfs_root *root,</div><div class='ctx'> 		 * picked out then we don't care that the block group is cached.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (block_group &amp;&amp; block_group_bits(block_group, ffe_ctl-&gt;flags) &amp;&amp;</div><div class='add'>+		    block_group-&gt;space_info == space_info &amp;&amp;</div><div class='ctx'> 		    block_group-&gt;cached != BTRFS_CACHE_NO) {</div><div class='ctx'> 			down_read(&amp;space_info-&gt;groups_sem);</div><div class='ctx'> 			if (list_empty(&amp;block_group-&gt;list) ||</div><div class='hunk'>@@ -4266,6 +4455,7 @@ static noinline int find_free_extent(struct btrfs_root *root,</div><div class='ctx'> 							block_group-&gt;flags);</div><div class='ctx'> 				btrfs_lock_block_group(block_group,</div><div class='ctx'> 						       ffe_ctl-&gt;delalloc);</div><div class='add'>+				ffe_ctl-&gt;hinted = true;</div><div class='ctx'> 				goto have_block_group;</div><div class='ctx'> 			}</div><div class='ctx'> 		} else if (block_group) {</div><div class='hunk'>@@ -4273,6 +4463,7 @@ static noinline int find_free_extent(struct btrfs_root *root,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> search:</div><div class='add'>+	trace_btrfs_find_free_extent_search_loop(root, ffe_ctl);</div><div class='ctx'> 	ffe_ctl-&gt;have_caching_bg = false;</div><div class='ctx'> 	if (ffe_ctl-&gt;index == btrfs_bg_flags_to_raid_index(ffe_ctl-&gt;flags) ||</div><div class='ctx'> 	    ffe_ctl-&gt;index == 0)</div><div class='hunk'>@@ -4282,6 +4473,7 @@ search:</div><div class='ctx'> 			    &amp;space_info-&gt;block_groups[ffe_ctl-&gt;index], list) {</div><div class='ctx'> 		struct btrfs_block_group *bg_ret;</div><div class='ctx'> </div><div class='add'>+		ffe_ctl-&gt;hinted = false;</div><div class='ctx'> 		/* If the block group is read-only, we can skip it entirely. */</div><div class='ctx'> 		if (unlikely(block_group-&gt;ro)) {</div><div class='ctx'> 			if (ffe_ctl-&gt;for_treelog)</div><div class='hunk'>@@ -4323,10 +4515,11 @@ search:</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> have_block_group:</div><div class='add'>+		trace_btrfs_find_free_extent_have_block_group(root, ffe_ctl, block_group);</div><div class='ctx'> 		ffe_ctl-&gt;cached = btrfs_block_group_done(block_group);</div><div class='ctx'> 		if (unlikely(!ffe_ctl-&gt;cached)) {</div><div class='ctx'> 			ffe_ctl-&gt;have_caching_bg = true;</div><div class='del'>-			ret = btrfs_cache_block_group(block_group, 0);</div><div class='add'>+			ret = btrfs_cache_block_group(block_group, false);</div><div class='ctx'> </div><div class='ctx'> 			/*</div><div class='ctx'> 			 * If we get ENOMEM here or something else we want to</div><div class='hunk'>@@ -4344,21 +4537,23 @@ have_block_group:</div><div class='ctx'> 			ret = 0;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (unlikely(block_group-&gt;cached == BTRFS_CACHE_ERROR))</div><div class='add'>+		if (unlikely(block_group-&gt;cached == BTRFS_CACHE_ERROR)) {</div><div class='add'>+			if (!cache_block_group_error)</div><div class='add'>+				cache_block_group_error = -EIO;</div><div class='add'>+			goto loop;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (!find_free_extent_check_size_class(ffe_ctl, block_group))</div><div class='ctx'> 			goto loop;</div><div class='ctx'> </div><div class='ctx'> 		bg_ret = NULL;</div><div class='ctx'> 		ret = do_allocation(block_group, ffe_ctl, &amp;bg_ret);</div><div class='del'>-		if (ret == 0) {</div><div class='del'>-			if (bg_ret &amp;&amp; bg_ret != block_group) {</div><div class='del'>-				btrfs_release_block_group(block_group,</div><div class='del'>-							  ffe_ctl-&gt;delalloc);</div><div class='del'>-				block_group = bg_ret;</div><div class='del'>-			}</div><div class='del'>-		} else if (ret == -EAGAIN) {</div><div class='del'>-			goto have_block_group;</div><div class='del'>-		} else if (ret &gt; 0) {</div><div class='add'>+		if (ret &gt; 0)</div><div class='ctx'> 			goto loop;</div><div class='add'>+</div><div class='add'>+		if (bg_ret &amp;&amp; bg_ret != block_group) {</div><div class='add'>+			btrfs_release_block_group(block_group, ffe_ctl-&gt;delalloc);</div><div class='add'>+			block_group = bg_ret;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* Checks */</div><div class='hunk'>@@ -4381,7 +4576,8 @@ have_block_group:</div><div class='ctx'> </div><div class='ctx'> 		ret = btrfs_add_reserved_bytes(block_group, ffe_ctl-&gt;ram_bytes,</div><div class='ctx'> 					       ffe_ctl-&gt;num_bytes,</div><div class='del'>-					       ffe_ctl-&gt;delalloc);</div><div class='add'>+					       ffe_ctl-&gt;delalloc,</div><div class='add'>+					       ffe_ctl-&gt;loop &gt;= LOOP_WRONG_SIZE_CLASS);</div><div class='ctx'> 		if (ret == -EAGAIN) {</div><div class='ctx'> 			btrfs_add_free_space_unused(block_group,</div><div class='ctx'> 					ffe_ctl-&gt;found_offset,</div><div class='hunk'>@@ -4394,17 +4590,26 @@ have_block_group:</div><div class='ctx'> 		ins-&gt;objectid = ffe_ctl-&gt;search_start;</div><div class='ctx'> 		ins-&gt;offset = ffe_ctl-&gt;num_bytes;</div><div class='ctx'> </div><div class='del'>-		trace_btrfs_reserve_extent(block_group, ffe_ctl-&gt;search_start,</div><div class='del'>-					   ffe_ctl-&gt;num_bytes);</div><div class='add'>+		trace_btrfs_reserve_extent(block_group, ffe_ctl);</div><div class='ctx'> 		btrfs_release_block_group(block_group, ffe_ctl-&gt;delalloc);</div><div class='ctx'> 		break;</div><div class='ctx'> loop:</div><div class='add'>+		if (!ffe_ctl-&gt;cached &amp;&amp; ffe_ctl-&gt;loop &gt; LOOP_CACHING_NOWAIT &amp;&amp;</div><div class='add'>+		    !ffe_ctl-&gt;retry_uncached) {</div><div class='add'>+			ffe_ctl-&gt;retry_uncached = true;</div><div class='add'>+			btrfs_wait_block_group_cache_progress(block_group,</div><div class='add'>+						ffe_ctl-&gt;num_bytes +</div><div class='add'>+						ffe_ctl-&gt;empty_cluster +</div><div class='add'>+						ffe_ctl-&gt;empty_size);</div><div class='add'>+			goto have_block_group;</div><div class='add'>+		}</div><div class='ctx'> 		release_block_group(block_group, ffe_ctl, ffe_ctl-&gt;delalloc);</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 	}</div><div class='ctx'> 	up_read(&amp;space_info-&gt;groups_sem);</div><div class='ctx'> </div><div class='del'>-	ret = find_free_extent_update_loop(fs_info, ins, ffe_ctl, full_search);</div><div class='add'>+	ret = find_free_extent_update_loop(fs_info, ins, ffe_ctl, space_info,</div><div class='add'>+					   full_search);</div><div class='ctx'> 	if (ret &gt; 0)</div><div class='ctx'> 		goto search;</div><div class='ctx'> </div><div class='hunk'>@@ -4426,8 +4631,8 @@ loop:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * btrfs_reserve_extent - entry point to the extent allocator. Tries to find a</div><div class='del'>- *			  hole that is at least as big as @num_bytes.</div><div class='add'>+ * Entry point to the extent allocator. Tries to find a hole that is at least</div><div class='add'>+ * as big as @num_bytes.</div><div class='ctx'>  *</div><div class='ctx'>  * @root           -	The root that will contain this extent</div><div class='ctx'>  *</div><div class='hunk'>@@ -4473,14 +4678,14 @@ loop:</div><div class='ctx'> int btrfs_reserve_extent(struct btrfs_root *root, u64 ram_bytes,</div><div class='ctx'> 			 u64 num_bytes, u64 min_alloc_size,</div><div class='ctx'> 			 u64 empty_size, u64 hint_byte,</div><div class='del'>-			 struct btrfs_key *ins, int is_data, int delalloc)</div><div class='add'>+			 struct btrfs_key *ins, bool is_data, bool delalloc)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct find_free_extent_ctl ffe_ctl = {};</div><div class='ctx'> 	bool final_tried = num_bytes == min_alloc_size;</div><div class='ctx'> 	u64 flags;</div><div class='ctx'> 	int ret;</div><div class='del'>-	bool for_treelog = (root-&gt;root_key.objectid == BTRFS_TREE_LOG_OBJECTID);</div><div class='add'>+	bool for_treelog = (btrfs_root_id(root) == BTRFS_TREE_LOG_OBJECTID);</div><div class='ctx'> 	bool for_data_reloc = (btrfs_is_data_reloc_root(root) &amp;&amp; is_data);</div><div class='ctx'> </div><div class='ctx'> 	flags = get_alloc_profile_by_root(root, is_data);</div><div class='hunk'>@@ -4518,16 +4723,15 @@ again:</div><div class='ctx'> 	"allocation failed flags %llu, wanted %llu tree-log %d, relocation: %d",</div><div class='ctx'> 				  flags, num_bytes, for_treelog, for_data_reloc);</div><div class='ctx'> 			if (sinfo)</div><div class='del'>-				btrfs_dump_space_info(fs_info, sinfo,</div><div class='del'>-						      num_bytes, 1);</div><div class='add'>+				btrfs_dump_space_info(sinfo, num_bytes, 1);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_free_reserved_extent(struct btrfs_fs_info *fs_info,</div><div class='del'>-			       u64 start, u64 len, int delalloc)</div><div class='add'>+int btrfs_free_reserved_extent(struct btrfs_fs_info *fs_info, u64 start, u64 len,</div><div class='add'>+			       bool is_delalloc)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_block_group *cache;</div><div class='ctx'> </div><div class='hunk'>@@ -4539,58 +4743,86 @@ int btrfs_free_reserved_extent(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	btrfs_add_free_space(cache, start, len);</div><div class='del'>-	btrfs_free_reserved_bytes(cache, len, delalloc);</div><div class='add'>+	btrfs_free_reserved_bytes(cache, len, is_delalloc);</div><div class='ctx'> 	trace_btrfs_reserved_extent_free(fs_info, start, len);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_put_block_group(cache);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_pin_reserved_extent(struct btrfs_trans_handle *trans, u64 start,</div><div class='del'>-			      u64 len)</div><div class='add'>+int btrfs_pin_reserved_extent(struct btrfs_trans_handle *trans,</div><div class='add'>+			      const struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_block_group *cache;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	cache = btrfs_lookup_block_group(trans-&gt;fs_info, start);</div><div class='add'>+	cache = btrfs_lookup_block_group(trans-&gt;fs_info, eb-&gt;start);</div><div class='ctx'> 	if (!cache) {</div><div class='ctx'> 		btrfs_err(trans-&gt;fs_info, "unable to find block group for %llu",</div><div class='del'>-			  start);</div><div class='add'>+			  eb-&gt;start);</div><div class='ctx'> 		return -ENOSPC;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = pin_down_extent(trans, cache, start, len, 1);</div><div class='add'>+	ret = pin_down_extent(trans, cache, eb-&gt;start, eb-&gt;len, true);</div><div class='ctx'> 	btrfs_put_block_group(cache);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int alloc_reserved_extent(struct btrfs_trans_handle *trans, u64 bytenr,</div><div class='add'>+				 u64 num_bytes)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_remove_from_free_space_tree(trans, bytenr, num_bytes);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_update_block_group(trans, bytenr, num_bytes, true);</div><div class='add'>+	if (ret) {</div><div class='add'>+		ASSERT(!ret);</div><div class='add'>+		btrfs_err(fs_info, "update block group failed for %llu %llu",</div><div class='add'>+			  bytenr, num_bytes);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	trace_btrfs_reserved_extent_alloc(fs_info, bytenr, num_bytes);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int alloc_reserved_file_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				      u64 parent, u64 root_objectid,</div><div class='ctx'> 				      u64 flags, u64 owner, u64 offset,</div><div class='del'>-				      struct btrfs_key *ins, int ref_mod)</div><div class='add'>+				      struct btrfs_key *ins, int ref_mod, u64 oref_root)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='add'>+	struct btrfs_root *extent_root;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct btrfs_extent_item *extent_item;</div><div class='add'>+	struct btrfs_extent_owner_ref *oref;</div><div class='ctx'> 	struct btrfs_extent_inline_ref *iref;</div><div class='ctx'> 	struct btrfs_path *path;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	int type;</div><div class='ctx'> 	u32 size;</div><div class='add'>+	const bool simple_quota = (btrfs_qgroup_mode(fs_info) == BTRFS_QGROUP_MODE_SIMPLE);</div><div class='ctx'> </div><div class='ctx'> 	if (parent &gt; 0)</div><div class='ctx'> 		type = BTRFS_SHARED_DATA_REF_KEY;</div><div class='ctx'> 	else</div><div class='ctx'> 		type = BTRFS_EXTENT_DATA_REF_KEY;</div><div class='ctx'> </div><div class='del'>-	size = sizeof(*extent_item) + btrfs_extent_inline_ref_size(type);</div><div class='add'>+	size = sizeof(*extent_item);</div><div class='add'>+	if (simple_quota)</div><div class='add'>+		size += btrfs_extent_inline_ref_size(BTRFS_EXTENT_OWNER_REF_KEY);</div><div class='add'>+	size += btrfs_extent_inline_ref_size(type);</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_insert_empty_item(trans, fs_info-&gt;extent_root, path,</div><div class='del'>-				      ins, size);</div><div class='add'>+	extent_root = btrfs_extent_root(fs_info, ins-&gt;objectid);</div><div class='add'>+	ret = btrfs_insert_empty_item(trans, extent_root, path, ins, size);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		btrfs_free_path(path);</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -4605,7 +4837,14 @@ static int alloc_reserved_file_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			       flags | BTRFS_EXTENT_FLAG_DATA);</div><div class='ctx'> </div><div class='ctx'> 	iref = (struct btrfs_extent_inline_ref *)(extent_item + 1);</div><div class='add'>+	if (simple_quota) {</div><div class='add'>+		btrfs_set_extent_inline_ref_type(leaf, iref, BTRFS_EXTENT_OWNER_REF_KEY);</div><div class='add'>+		oref = (struct btrfs_extent_owner_ref *)(&amp;iref-&gt;offset);</div><div class='add'>+		btrfs_set_extent_owner_ref_root_id(leaf, oref, oref_root);</div><div class='add'>+		iref = (struct btrfs_extent_inline_ref *)(oref + 1);</div><div class='add'>+	}</div><div class='ctx'> 	btrfs_set_extent_inline_ref_type(leaf, iref, type);</div><div class='add'>+</div><div class='ctx'> 	if (parent &gt; 0) {</div><div class='ctx'> 		struct btrfs_shared_data_ref *ref;</div><div class='ctx'> 		ref = (struct btrfs_shared_data_ref *)(iref + 1);</div><div class='hunk'>@@ -4620,28 +4859,17 @@ static int alloc_reserved_file_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		btrfs_set_extent_data_ref_count(leaf, ref, ref_mod);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_mark_buffer_dirty(path-&gt;nodes[0]);</div><div class='ctx'> 	btrfs_free_path(path);</div><div class='ctx'> </div><div class='del'>-	ret = remove_from_free_space_tree(trans, ins-&gt;objectid, ins-&gt;offset);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	ret = btrfs_update_block_group(trans, ins-&gt;objectid, ins-&gt;offset, true);</div><div class='del'>-	if (ret) { /* -ENOENT, logic error */</div><div class='del'>-		btrfs_err(fs_info, "update block group failed for %llu %llu",</div><div class='del'>-			ins-&gt;objectid, ins-&gt;offset);</div><div class='del'>-		BUG();</div><div class='del'>-	}</div><div class='del'>-	trace_btrfs_reserved_extent_alloc(fs_info, ins-&gt;objectid, ins-&gt;offset);</div><div class='del'>-	return ret;</div><div class='add'>+	return alloc_reserved_extent(trans, ins-&gt;objectid, ins-&gt;offset);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int alloc_reserved_tree_block(struct btrfs_trans_handle *trans,</div><div class='del'>-				     struct btrfs_delayed_ref_node *node,</div><div class='add'>+				     const struct btrfs_delayed_ref_node *node,</div><div class='ctx'> 				     struct btrfs_delayed_extent_op *extent_op)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='add'>+	struct btrfs_root *extent_root;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct btrfs_extent_item *extent_item;</div><div class='ctx'> 	struct btrfs_key extent_key;</div><div class='hunk'>@@ -4649,32 +4877,30 @@ static int alloc_reserved_tree_block(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	struct btrfs_extent_inline_ref *iref;</div><div class='ctx'> 	struct btrfs_path *path;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='del'>-	struct btrfs_delayed_tree_ref *ref;</div><div class='ctx'> 	u32 size = sizeof(*extent_item) + sizeof(*iref);</div><div class='del'>-	u64 num_bytes;</div><div class='del'>-	u64 flags = extent_op-&gt;flags_to_set;</div><div class='add'>+	const u64 flags = (extent_op ? extent_op-&gt;flags_to_set : 0);</div><div class='add'>+	/* The owner of a tree block is the level. */</div><div class='add'>+	int level = btrfs_delayed_ref_owner(node);</div><div class='ctx'> 	bool skinny_metadata = btrfs_fs_incompat(fs_info, SKINNY_METADATA);</div><div class='ctx'> </div><div class='del'>-	ref = btrfs_delayed_node_to_tree_ref(node);</div><div class='del'>-</div><div class='ctx'> 	extent_key.objectid = node-&gt;bytenr;</div><div class='ctx'> 	if (skinny_metadata) {</div><div class='del'>-		extent_key.offset = ref-&gt;level;</div><div class='add'>+		/* The owner of a tree block is the level. */</div><div class='add'>+		extent_key.offset = level;</div><div class='ctx'> 		extent_key.type = BTRFS_METADATA_ITEM_KEY;</div><div class='del'>-		num_bytes = fs_info-&gt;nodesize;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		extent_key.offset = node-&gt;num_bytes;</div><div class='ctx'> 		extent_key.type = BTRFS_EXTENT_ITEM_KEY;</div><div class='ctx'> 		size += sizeof(*block_info);</div><div class='del'>-		num_bytes = node-&gt;num_bytes;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_insert_empty_item(trans, fs_info-&gt;extent_root, path,</div><div class='del'>-				      &amp;extent_key, size);</div><div class='add'>+	extent_root = btrfs_extent_root(fs_info, extent_key.objectid);</div><div class='add'>+	ret = btrfs_insert_empty_item(trans, extent_root, path, &amp;extent_key,</div><div class='add'>+				      size);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		btrfs_free_path(path);</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -4693,39 +4919,23 @@ static int alloc_reserved_tree_block(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	} else {</div><div class='ctx'> 		block_info = (struct btrfs_tree_block_info *)(extent_item + 1);</div><div class='ctx'> 		btrfs_set_tree_block_key(leaf, block_info, &amp;extent_op-&gt;key);</div><div class='del'>-		btrfs_set_tree_block_level(leaf, block_info, ref-&gt;level);</div><div class='add'>+		btrfs_set_tree_block_level(leaf, block_info, level);</div><div class='ctx'> 		iref = (struct btrfs_extent_inline_ref *)(block_info + 1);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (node-&gt;type == BTRFS_SHARED_BLOCK_REF_KEY) {</div><div class='ctx'> 		btrfs_set_extent_inline_ref_type(leaf, iref,</div><div class='ctx'> 						 BTRFS_SHARED_BLOCK_REF_KEY);</div><div class='del'>-		btrfs_set_extent_inline_ref_offset(leaf, iref, ref-&gt;parent);</div><div class='add'>+		btrfs_set_extent_inline_ref_offset(leaf, iref, node-&gt;parent);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		btrfs_set_extent_inline_ref_type(leaf, iref,</div><div class='ctx'> 						 BTRFS_TREE_BLOCK_REF_KEY);</div><div class='del'>-		btrfs_set_extent_inline_ref_offset(leaf, iref, ref-&gt;root);</div><div class='add'>+		btrfs_set_extent_inline_ref_offset(leaf, iref, node-&gt;ref_root);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> 	btrfs_free_path(path);</div><div class='ctx'> </div><div class='del'>-	ret = remove_from_free_space_tree(trans, extent_key.objectid,</div><div class='del'>-					  num_bytes);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	ret = btrfs_update_block_group(trans, extent_key.objectid,</div><div class='del'>-				       fs_info-&gt;nodesize, true);</div><div class='del'>-	if (ret) { /* -ENOENT, logic error */</div><div class='del'>-		btrfs_err(fs_info, "update block group failed for %llu %llu",</div><div class='del'>-			extent_key.objectid, extent_key.offset);</div><div class='del'>-		BUG();</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	trace_btrfs_reserved_extent_alloc(fs_info, extent_key.objectid,</div><div class='del'>-					  fs_info-&gt;nodesize);</div><div class='del'>-	return ret;</div><div class='add'>+	return alloc_reserved_extent(trans, node-&gt;bytenr, fs_info-&gt;nodesize);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_alloc_reserved_file_extent(struct btrfs_trans_handle *trans,</div><div class='hunk'>@@ -4733,14 +4943,20 @@ int btrfs_alloc_reserved_file_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				     u64 offset, u64 ram_bytes,</div><div class='ctx'> 				     struct btrfs_key *ins)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_ref generic_ref = { 0 };</div><div class='add'>+	struct btrfs_ref generic_ref = {</div><div class='add'>+		.action = BTRFS_ADD_DELAYED_EXTENT,</div><div class='add'>+		.bytenr = ins-&gt;objectid,</div><div class='add'>+		.num_bytes = ins-&gt;offset,</div><div class='add'>+		.owning_root = btrfs_root_id(root),</div><div class='add'>+		.ref_root = btrfs_root_id(root),</div><div class='add'>+	};</div><div class='ctx'> </div><div class='del'>-	BUG_ON(root-&gt;root_key.objectid == BTRFS_TREE_LOG_OBJECTID);</div><div class='add'>+	ASSERT(generic_ref.ref_root != BTRFS_TREE_LOG_OBJECTID);</div><div class='ctx'> </div><div class='del'>-	btrfs_init_generic_ref(&amp;generic_ref, BTRFS_ADD_DELAYED_EXTENT,</div><div class='del'>-			       ins-&gt;objectid, ins-&gt;offset, 0);</div><div class='del'>-	btrfs_init_data_ref(&amp;generic_ref, root-&gt;root_key.objectid, owner,</div><div class='del'>-			    offset, 0, false);</div><div class='add'>+	if (btrfs_is_data_reloc_root(root) &amp;&amp; btrfs_is_fstree(root-&gt;relocation_src_root))</div><div class='add'>+		generic_ref.owning_root = root-&gt;relocation_src_root;</div><div class='add'>+</div><div class='add'>+	btrfs_init_data_ref(&amp;generic_ref, owner, offset, 0, false);</div><div class='ctx'> 	btrfs_ref_tree_mod(root-&gt;fs_info, &amp;generic_ref);</div><div class='ctx'> </div><div class='ctx'> 	return btrfs_add_delayed_data_ref(trans, &amp;generic_ref, ram_bytes);</div><div class='hunk'>@@ -4759,6 +4975,13 @@ int btrfs_alloc_logged_file_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct btrfs_block_group *block_group;</div><div class='ctx'> 	struct btrfs_space_info *space_info;</div><div class='add'>+	const struct btrfs_squota_delta delta = {</div><div class='add'>+		.root = root_objectid,</div><div class='add'>+		.num_bytes = ins-&gt;offset,</div><div class='add'>+		.generation = trans-&gt;transid,</div><div class='add'>+		.is_data = true,</div><div class='add'>+		.is_inc = true,</div><div class='add'>+	};</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Mixed block groups will exclude before processing the log so we only</div><div class='hunk'>@@ -4784,13 +5007,36 @@ int btrfs_alloc_logged_file_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	ret = alloc_reserved_file_extent(trans, 0, root_objectid, 0, owner,</div><div class='del'>-					 offset, ins, 1);</div><div class='add'>+					 offset, ins, 1, root_objectid);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		btrfs_pin_extent(trans, ins-&gt;objectid, ins-&gt;offset, 1);</div><div class='add'>+		btrfs_pin_extent(trans, ins-&gt;objectid, ins-&gt;offset);</div><div class='add'>+	ret = btrfs_record_squota_delta(fs_info, &amp;delta);</div><div class='ctx'> 	btrfs_put_block_group(block_group);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_BTRFS_DEBUG</div><div class='add'>+/*</div><div class='add'>+ * Extra safety check in case the extent tree is corrupted and extent allocator</div><div class='add'>+ * chooses to use a tree block which is already used and locked.</div><div class='add'>+ */</div><div class='add'>+static bool check_eb_lock_owner(const struct extent_buffer *eb)</div><div class='add'>+{</div><div class='add'>+	if (eb-&gt;lock_owner == current-&gt;pid) {</div><div class='add'>+		btrfs_err_rl(eb-&gt;fs_info,</div><div class='add'>+"tree block %llu owner %llu already locked by pid=%d, extent tree corruption detected",</div><div class='add'>+			     eb-&gt;start, btrfs_header_owner(eb), current-&gt;pid);</div><div class='add'>+		return true;</div><div class='add'>+	}</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+static bool check_eb_lock_owner(struct extent_buffer *eb)</div><div class='add'>+{</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> static struct extent_buffer *</div><div class='ctx'> btrfs_init_new_buffer(struct btrfs_trans_handle *trans, struct btrfs_root *root,</div><div class='ctx'> 		      u64 bytenr, int level, u64 owner,</div><div class='hunk'>@@ -4798,34 +5044,45 @@ btrfs_init_new_buffer(struct btrfs_trans_handle *trans, struct btrfs_root *root,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct extent_buffer *buf;</div><div class='add'>+	u64 lockdep_owner = owner;</div><div class='ctx'> </div><div class='ctx'> 	buf = btrfs_find_create_tree_block(fs_info, bytenr, owner, level);</div><div class='ctx'> 	if (IS_ERR(buf))</div><div class='ctx'> 		return buf;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Extra safety check in case the extent tree is corrupted and extent</div><div class='del'>-	 * allocator chooses to use a tree block which is already used and</div><div class='del'>-	 * locked.</div><div class='del'>-	 */</div><div class='del'>-	if (buf-&gt;lock_owner == current-&gt;pid) {</div><div class='del'>-		btrfs_err_rl(fs_info,</div><div class='del'>-"tree block %llu owner %llu already locked by pid=%d, extent tree corruption detected",</div><div class='del'>-			buf-&gt;start, btrfs_header_owner(buf), current-&gt;pid);</div><div class='add'>+	if (unlikely(check_eb_lock_owner(buf))) {</div><div class='ctx'> 		free_extent_buffer(buf);</div><div class='ctx'> 		return ERR_PTR(-EUCLEAN);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='add'>+	 * The reloc trees are just snapshots, so we need them to appear to be</div><div class='add'>+	 * just like any other fs tree WRT lockdep.</div><div class='add'>+	 *</div><div class='add'>+	 * The exception however is in replace_path() in relocation, where we</div><div class='add'>+	 * hold the lock on the original fs root and then search for the reloc</div><div class='add'>+	 * root.  At that point we need to make sure any reloc root buffers are</div><div class='add'>+	 * set to the BTRFS_TREE_RELOC_OBJECTID lockdep class in order to make</div><div class='add'>+	 * lockdep happy.</div><div class='add'>+	 */</div><div class='add'>+	if (lockdep_owner == BTRFS_TREE_RELOC_OBJECTID &amp;&amp;</div><div class='add'>+	    !test_bit(BTRFS_ROOT_RESET_LOCKDEP_CLASS, &amp;root-&gt;state))</div><div class='add'>+		lockdep_owner = BTRFS_FS_TREE_OBJECTID;</div><div class='add'>+</div><div class='add'>+	/* btrfs_clear_buffer_dirty() accesses generation field. */</div><div class='add'>+	btrfs_set_header_generation(buf, trans-&gt;transid);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='ctx'> 	 * This needs to stay, because we could allocate a freed block from an</div><div class='ctx'> 	 * old tree into a new tree, so we need to make sure this new block is</div><div class='ctx'> 	 * set to the appropriate level and owner.</div><div class='ctx'> 	 */</div><div class='del'>-	btrfs_set_buffer_lockdep_class(owner, buf, level);</div><div class='del'>-	__btrfs_tree_lock(buf, nest);</div><div class='del'>-	btrfs_clean_tree_block(buf);</div><div class='add'>+	btrfs_set_buffer_lockdep_class(lockdep_owner, buf, level);</div><div class='add'>+</div><div class='add'>+	btrfs_tree_lock_nested(buf, nest);</div><div class='add'>+	btrfs_clear_buffer_dirty(trans, buf);</div><div class='ctx'> 	clear_bit(EXTENT_BUFFER_STALE, &amp;buf-&gt;bflags);</div><div class='del'>-	clear_bit(EXTENT_BUFFER_NO_CHECK, &amp;buf-&gt;bflags);</div><div class='add'>+	clear_bit(EXTENT_BUFFER_ZONED_ZEROOUT, &amp;buf-&gt;bflags);</div><div class='ctx'> </div><div class='ctx'> 	set_extent_buffer_uptodate(buf);</div><div class='ctx'> </div><div class='hunk'>@@ -4837,22 +5094,24 @@ btrfs_init_new_buffer(struct btrfs_trans_handle *trans, struct btrfs_root *root,</div><div class='ctx'> 	btrfs_set_header_owner(buf, owner);</div><div class='ctx'> 	write_extent_buffer_fsid(buf, fs_info-&gt;fs_devices-&gt;metadata_uuid);</div><div class='ctx'> 	write_extent_buffer_chunk_tree_uuid(buf, fs_info-&gt;chunk_tree_uuid);</div><div class='del'>-	if (root-&gt;root_key.objectid == BTRFS_TREE_LOG_OBJECTID) {</div><div class='add'>+	if (btrfs_root_id(root) == BTRFS_TREE_LOG_OBJECTID) {</div><div class='ctx'> 		buf-&gt;log_index = root-&gt;log_transid % 2;</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * we allow two log transactions at a time, use different</div><div class='ctx'> 		 * EXTENT bit to differentiate dirty pages.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (buf-&gt;log_index == 0)</div><div class='del'>-			set_extent_dirty(&amp;root-&gt;dirty_log_pages, buf-&gt;start,</div><div class='del'>-					buf-&gt;start + buf-&gt;len - 1, GFP_NOFS);</div><div class='add'>+			btrfs_set_extent_bit(&amp;root-&gt;dirty_log_pages, buf-&gt;start,</div><div class='add'>+					     buf-&gt;start + buf-&gt;len - 1,</div><div class='add'>+					     EXTENT_DIRTY_LOG1, NULL);</div><div class='ctx'> 		else</div><div class='del'>-			set_extent_new(&amp;root-&gt;dirty_log_pages, buf-&gt;start,</div><div class='del'>-					buf-&gt;start + buf-&gt;len - 1);</div><div class='add'>+			btrfs_set_extent_bit(&amp;root-&gt;dirty_log_pages, buf-&gt;start,</div><div class='add'>+					     buf-&gt;start + buf-&gt;len - 1,</div><div class='add'>+					     EXTENT_DIRTY_LOG2, NULL);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		buf-&gt;log_index = -1;</div><div class='del'>-		set_extent_dirty(&amp;trans-&gt;transaction-&gt;dirty_pages, buf-&gt;start,</div><div class='del'>-			 buf-&gt;start + buf-&gt;len - 1, GFP_NOFS);</div><div class='add'>+		btrfs_set_extent_bit(&amp;trans-&gt;transaction-&gt;dirty_pages, buf-&gt;start,</div><div class='add'>+				     buf-&gt;start + buf-&gt;len - 1, EXTENT_DIRTY, NULL);</div><div class='ctx'> 	}</div><div class='ctx'> 	/* this returns a buffer locked for blocking */</div><div class='ctx'> 	return buf;</div><div class='hunk'>@@ -4868,18 +5127,18 @@ struct extent_buffer *btrfs_alloc_tree_block(struct btrfs_trans_handle *trans,</div><div class='ctx'> 					     const struct btrfs_disk_key *key,</div><div class='ctx'> 					     int level, u64 hint,</div><div class='ctx'> 					     u64 empty_size,</div><div class='add'>+					     u64 reloc_src_root,</div><div class='ctx'> 					     enum btrfs_lock_nesting nest)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_key ins;</div><div class='ctx'> 	struct btrfs_block_rsv *block_rsv;</div><div class='ctx'> 	struct extent_buffer *buf;</div><div class='del'>-	struct btrfs_delayed_extent_op *extent_op;</div><div class='del'>-	struct btrfs_ref generic_ref = { 0 };</div><div class='ctx'> 	u64 flags = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	u32 blocksize = fs_info-&gt;nodesize;</div><div class='ctx'> 	bool skinny_metadata = btrfs_fs_incompat(fs_info, SKINNY_METADATA);</div><div class='add'>+	u64 owning_root;</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_BTRFS_FS_RUN_SANITY_TESTS</div><div class='ctx'> 	if (btrfs_is_testing(fs_info)) {</div><div class='hunk'>@@ -4896,7 +5155,7 @@ struct extent_buffer *btrfs_alloc_tree_block(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		return ERR_CAST(block_rsv);</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_reserve_extent(root, blocksize, blocksize, blocksize,</div><div class='del'>-				   empty_size, hint, &amp;ins, 0, 0);</div><div class='add'>+				   empty_size, hint, &amp;ins, false, false);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out_unuse;</div><div class='ctx'> </div><div class='hunk'>@@ -4906,48 +5165,59 @@ struct extent_buffer *btrfs_alloc_tree_block(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		ret = PTR_ERR(buf);</div><div class='ctx'> 		goto out_free_reserved;</div><div class='ctx'> 	}</div><div class='add'>+	owning_root = btrfs_header_owner(buf);</div><div class='ctx'> </div><div class='ctx'> 	if (root_objectid == BTRFS_TREE_RELOC_OBJECTID) {</div><div class='ctx'> 		if (parent == 0)</div><div class='ctx'> 			parent = ins.objectid;</div><div class='ctx'> 		flags |= BTRFS_BLOCK_FLAG_FULL_BACKREF;</div><div class='add'>+		owning_root = reloc_src_root;</div><div class='ctx'> 	} else</div><div class='ctx'> 		BUG_ON(parent &gt; 0);</div><div class='ctx'> </div><div class='ctx'> 	if (root_objectid != BTRFS_TREE_LOG_OBJECTID) {</div><div class='del'>-		extent_op = btrfs_alloc_delayed_extent_op();</div><div class='del'>-		if (!extent_op) {</div><div class='del'>-			ret = -ENOMEM;</div><div class='del'>-			goto out_free_buf;</div><div class='add'>+		struct btrfs_delayed_extent_op *extent_op;</div><div class='add'>+		struct btrfs_ref generic_ref = {</div><div class='add'>+			.action = BTRFS_ADD_DELAYED_EXTENT,</div><div class='add'>+			.bytenr = ins.objectid,</div><div class='add'>+			.num_bytes = ins.offset,</div><div class='add'>+			.parent = parent,</div><div class='add'>+			.owning_root = owning_root,</div><div class='add'>+			.ref_root = root_objectid,</div><div class='add'>+		};</div><div class='add'>+</div><div class='add'>+		if (!skinny_metadata || flags != 0) {</div><div class='add'>+			extent_op = btrfs_alloc_delayed_extent_op();</div><div class='add'>+			if (!extent_op) {</div><div class='add'>+				ret = -ENOMEM;</div><div class='add'>+				goto out_free_buf;</div><div class='add'>+			}</div><div class='add'>+			if (key)</div><div class='add'>+				memcpy(&amp;extent_op-&gt;key, key, sizeof(extent_op-&gt;key));</div><div class='add'>+			else</div><div class='add'>+				memset(&amp;extent_op-&gt;key, 0, sizeof(extent_op-&gt;key));</div><div class='add'>+			extent_op-&gt;flags_to_set = flags;</div><div class='add'>+			extent_op-&gt;update_key = (skinny_metadata ? false : true);</div><div class='add'>+			extent_op-&gt;update_flags = (flags != 0);</div><div class='add'>+		} else {</div><div class='add'>+			extent_op = NULL;</div><div class='ctx'> 		}</div><div class='del'>-		if (key)</div><div class='del'>-			memcpy(&amp;extent_op-&gt;key, key, sizeof(extent_op-&gt;key));</div><div class='del'>-		else</div><div class='del'>-			memset(&amp;extent_op-&gt;key, 0, sizeof(extent_op-&gt;key));</div><div class='del'>-		extent_op-&gt;flags_to_set = flags;</div><div class='del'>-		extent_op-&gt;update_key = skinny_metadata ? false : true;</div><div class='del'>-		extent_op-&gt;update_flags = true;</div><div class='del'>-		extent_op-&gt;is_data = false;</div><div class='del'>-		extent_op-&gt;level = level;</div><div class='del'>-</div><div class='del'>-		btrfs_init_generic_ref(&amp;generic_ref, BTRFS_ADD_DELAYED_EXTENT,</div><div class='del'>-				       ins.objectid, ins.offset, parent);</div><div class='del'>-		btrfs_init_tree_ref(&amp;generic_ref, level, root_objectid,</div><div class='del'>-				    root-&gt;root_key.objectid, false);</div><div class='add'>+</div><div class='add'>+		btrfs_init_tree_ref(&amp;generic_ref, level, btrfs_root_id(root), false);</div><div class='ctx'> 		btrfs_ref_tree_mod(fs_info, &amp;generic_ref);</div><div class='ctx'> 		ret = btrfs_add_delayed_tree_ref(trans, &amp;generic_ref, extent_op);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto out_free_delayed;</div><div class='add'>+		if (ret) {</div><div class='add'>+			btrfs_free_delayed_extent_op(extent_op);</div><div class='add'>+			goto out_free_buf;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> 	return buf;</div><div class='ctx'> </div><div class='del'>-out_free_delayed:</div><div class='del'>-	btrfs_free_delayed_extent_op(extent_op);</div><div class='ctx'> out_free_buf:</div><div class='ctx'> 	btrfs_tree_unlock(buf);</div><div class='ctx'> 	free_extent_buffer(buf);</div><div class='ctx'> out_free_reserved:</div><div class='del'>-	btrfs_free_reserved_extent(fs_info, ins.objectid, ins.offset, 0);</div><div class='add'>+	btrfs_free_reserved_extent(fs_info, ins.objectid, ins.offset, false);</div><div class='ctx'> out_unuse:</div><div class='ctx'> 	btrfs_unuse_block_rsv(fs_info, block_rsv, blocksize);</div><div class='ctx'> 	return ERR_PTR(ret);</div><div class='hunk'>@@ -4967,11 +5237,99 @@ struct walk_control {</div><div class='ctx'> 	int reada_slot;</div><div class='ctx'> 	int reada_count;</div><div class='ctx'> 	int restarted;</div><div class='add'>+	/* Indicate that extent info needs to be looked up when walking the tree. */</div><div class='add'>+	int lookup_info;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * This is our normal stage.  We are traversing blocks the current snapshot owns</div><div class='add'>+ * and we are dropping any of our references to any children we are able to, and</div><div class='add'>+ * then freeing the block once we've processed all of the children.</div><div class='add'>+ */</div><div class='ctx'> #define DROP_REFERENCE	1</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * We enter this stage when we have to walk into a child block (meaning we can't</div><div class='add'>+ * simply drop our reference to it from our current parent node) and there are</div><div class='add'>+ * more than one reference on it.  If we are the owner of any of the children</div><div class='add'>+ * blocks from the current parent node then we have to do the FULL_BACKREF dance</div><div class='add'>+ * on them in order to drop our normal ref and add the shared ref.</div><div class='add'>+ */</div><div class='ctx'> #define UPDATE_BACKREF	2</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Decide if we need to walk down into this node to adjust the references.</div><div class='add'>+ *</div><div class='add'>+ * @root:	the root we are currently deleting</div><div class='add'>+ * @wc:		the walk control for this deletion</div><div class='add'>+ * @eb:		the parent eb that we're currently visiting</div><div class='add'>+ * @refs:	the number of refs for wc-&gt;level - 1</div><div class='add'>+ * @flags:	the flags for wc-&gt;level - 1</div><div class='add'>+ * @slot:	the slot in the eb that we're currently checking</div><div class='add'>+ *</div><div class='add'>+ * This is meant to be called when we're evaluating if a node we point to at</div><div class='add'>+ * wc-&gt;level should be read and walked into, or if we can simply delete our</div><div class='add'>+ * reference to it.  We return true if we should walk into the node, false if we</div><div class='add'>+ * can skip it.</div><div class='add'>+ *</div><div class='add'>+ * We have assertions in here to make sure this is called correctly.  We assume</div><div class='add'>+ * that sanity checking on the blocks read to this point has been done, so any</div><div class='add'>+ * corrupted file systems must have been caught before calling this function.</div><div class='add'>+ */</div><div class='add'>+static bool visit_node_for_delete(struct btrfs_root *root, struct walk_control *wc,</div><div class='add'>+				  struct extent_buffer *eb, u64 flags, int slot)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_key key;</div><div class='add'>+	u64 generation;</div><div class='add'>+	int level = wc-&gt;level;</div><div class='add'>+</div><div class='add'>+	ASSERT(level &gt; 0);</div><div class='add'>+	ASSERT(wc-&gt;refs[level - 1] &gt; 0);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The update backref stage we only want to skip if we already have</div><div class='add'>+	 * FULL_BACKREF set, otherwise we need to read.</div><div class='add'>+	 */</div><div class='add'>+	if (wc-&gt;stage == UPDATE_BACKREF) {</div><div class='add'>+		if (level == 1 &amp;&amp; flags &amp; BTRFS_BLOCK_FLAG_FULL_BACKREF)</div><div class='add'>+			return false;</div><div class='add'>+		return true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We're the last ref on this block, we must walk into it and process</div><div class='add'>+	 * any refs it's pointing at.</div><div class='add'>+	 */</div><div class='add'>+	if (wc-&gt;refs[level - 1] == 1)</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If we're already FULL_BACKREF then we know we can just drop our</div><div class='add'>+	 * current reference.</div><div class='add'>+	 */</div><div class='add'>+	if (level == 1 &amp;&amp; flags &amp; BTRFS_BLOCK_FLAG_FULL_BACKREF)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This block is older than our creation generation, we can drop our</div><div class='add'>+	 * reference to it.</div><div class='add'>+	 */</div><div class='add'>+	generation = btrfs_node_ptr_generation(eb, slot);</div><div class='add'>+	if (!wc-&gt;update_ref || generation &lt;= btrfs_root_origin_generation(root))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This block was processed from a previous snapshot deletion run, we</div><div class='add'>+	 * can skip it.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_node_key_to_cpu(eb, &amp;key, slot);</div><div class='add'>+	if (btrfs_comp_cpu_keys(&amp;key, &amp;wc-&gt;update_progress) &lt; 0)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/* All other cases we need to wander into the node. */</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static noinline void reada_walk_down(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				     struct btrfs_root *root,</div><div class='ctx'> 				     struct walk_control *wc,</div><div class='hunk'>@@ -4983,7 +5341,6 @@ static noinline void reada_walk_down(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	u64 refs;</div><div class='ctx'> 	u64 flags;</div><div class='ctx'> 	u32 nritems;</div><div class='del'>-	struct btrfs_key key;</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int slot;</div><div class='hunk'>@@ -5013,38 +5370,29 @@ static noinline void reada_walk_down(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			goto reada;</div><div class='ctx'> </div><div class='ctx'> 		if (wc-&gt;stage == UPDATE_BACKREF &amp;&amp;</div><div class='del'>-		    generation &lt;= root-&gt;root_key.offset)</div><div class='add'>+		    generation &lt;= btrfs_root_origin_generation(root))</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		/* We don't lock the tree block, it's OK to be racy here */</div><div class='ctx'> 		ret = btrfs_lookup_extent_info(trans, fs_info, bytenr,</div><div class='ctx'> 					       wc-&gt;level - 1, 1, &amp;refs,</div><div class='del'>-					       &amp;flags);</div><div class='add'>+					       &amp;flags, NULL);</div><div class='ctx'> 		/* We don't care about errors in readahead. */</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			continue;</div><div class='del'>-		BUG_ON(refs == 0);</div><div class='ctx'> </div><div class='del'>-		if (wc-&gt;stage == DROP_REFERENCE) {</div><div class='del'>-			if (refs == 1)</div><div class='del'>-				goto reada;</div><div class='add'>+		/*</div><div class='add'>+		 * This could be racey, it's conceivable that we raced and end</div><div class='add'>+		 * up with a bogus refs count, if that's the case just skip, if</div><div class='add'>+		 * we are actually corrupt we will notice when we look up</div><div class='add'>+		 * everything again with our locks.</div><div class='add'>+		 */</div><div class='add'>+		if (refs == 0)</div><div class='add'>+			continue;</div><div class='ctx'> </div><div class='del'>-			if (wc-&gt;level == 1 &amp;&amp;</div><div class='del'>-			    (flags &amp; BTRFS_BLOCK_FLAG_FULL_BACKREF))</div><div class='del'>-				continue;</div><div class='del'>-			if (!wc-&gt;update_ref ||</div><div class='del'>-			    generation &lt;= root-&gt;root_key.offset)</div><div class='del'>-				continue;</div><div class='del'>-			btrfs_node_key_to_cpu(eb, &amp;key, slot);</div><div class='del'>-			ret = btrfs_comp_cpu_keys(&amp;key,</div><div class='del'>-						  &amp;wc-&gt;update_progress);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				continue;</div><div class='del'>-		} else {</div><div class='del'>-			if (wc-&gt;level == 1 &amp;&amp;</div><div class='del'>-			    (flags &amp; BTRFS_BLOCK_FLAG_FULL_BACKREF))</div><div class='del'>-				continue;</div><div class='del'>-		}</div><div class='add'>+		/* If we don't need to visit this node don't reada. */</div><div class='add'>+		if (!visit_node_for_delete(root, wc, eb, flags, slot))</div><div class='add'>+			continue;</div><div class='ctx'> reada:</div><div class='ctx'> 		btrfs_readahead_node_child(eb, slot);</div><div class='ctx'> 		nread++;</div><div class='hunk'>@@ -5063,7 +5411,7 @@ reada:</div><div class='ctx'> static noinline int walk_down_proc(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				   struct btrfs_root *root,</div><div class='ctx'> 				   struct btrfs_path *path,</div><div class='del'>-				   struct walk_control *wc, int lookup_info)</div><div class='add'>+				   struct walk_control *wc)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	int level = wc-&gt;level;</div><div class='hunk'>@@ -5071,26 +5419,29 @@ static noinline int walk_down_proc(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	u64 flag = BTRFS_BLOCK_FLAG_FULL_BACKREF;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (wc-&gt;stage == UPDATE_BACKREF &amp;&amp;</div><div class='del'>-	    btrfs_header_owner(eb) != root-&gt;root_key.objectid)</div><div class='add'>+	if (wc-&gt;stage == UPDATE_BACKREF &amp;&amp; btrfs_header_owner(eb) != btrfs_root_id(root))</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * when reference count of tree block is 1, it won't increase</div><div class='ctx'> 	 * again. once full backref flag is set, we never clear it.</div><div class='ctx'> 	 */</div><div class='del'>-	if (lookup_info &amp;&amp;</div><div class='add'>+	if (wc-&gt;lookup_info &amp;&amp;</div><div class='ctx'> 	    ((wc-&gt;stage == DROP_REFERENCE &amp;&amp; wc-&gt;refs[level] != 1) ||</div><div class='ctx'> 	     (wc-&gt;stage == UPDATE_BACKREF &amp;&amp; !(wc-&gt;flags[level] &amp; flag)))) {</div><div class='del'>-		BUG_ON(!path-&gt;locks[level]);</div><div class='add'>+		ASSERT(path-&gt;locks[level]);</div><div class='ctx'> 		ret = btrfs_lookup_extent_info(trans, fs_info,</div><div class='ctx'> 					       eb-&gt;start, level, 1,</div><div class='ctx'> 					       &amp;wc-&gt;refs[level],</div><div class='del'>-					       &amp;wc-&gt;flags[level]);</div><div class='del'>-		BUG_ON(ret == -ENOMEM);</div><div class='add'>+					       &amp;wc-&gt;flags[level],</div><div class='add'>+					       NULL);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='del'>-		BUG_ON(wc-&gt;refs[level] == 0);</div><div class='add'>+		if (unlikely(wc-&gt;refs[level] == 0)) {</div><div class='add'>+			btrfs_err(fs_info, "bytenr %llu has 0 references, expect &gt; 0",</div><div class='add'>+				  eb-&gt;start);</div><div class='add'>+			return -EUCLEAN;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (wc-&gt;stage == DROP_REFERENCE) {</div><div class='hunk'>@@ -5106,14 +5457,22 @@ static noinline int walk_down_proc(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	/* wc-&gt;stage == UPDATE_BACKREF */</div><div class='ctx'> 	if (!(wc-&gt;flags[level] &amp; flag)) {</div><div class='del'>-		BUG_ON(!path-&gt;locks[level]);</div><div class='add'>+		ASSERT(path-&gt;locks[level]);</div><div class='ctx'> 		ret = btrfs_inc_ref(trans, root, eb, 1);</div><div class='del'>-		BUG_ON(ret); /* -ENOMEM */</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='ctx'> 		ret = btrfs_dec_ref(trans, root, eb, 0);</div><div class='del'>-		BUG_ON(ret); /* -ENOMEM */</div><div class='del'>-		ret = btrfs_set_disk_extent_flags(trans, eb, flag,</div><div class='del'>-						  btrfs_header_level(eb), 0);</div><div class='del'>-		BUG_ON(ret); /* -ENOMEM */</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='add'>+		ret = btrfs_set_disk_extent_flags(trans, eb, flag);</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='ctx'> 		wc-&gt;flags[level] |= flag;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -5136,23 +5495,186 @@ static int check_ref_exists(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			    struct btrfs_root *root, u64 bytenr, u64 parent,</div><div class='ctx'> 			    int level)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	struct btrfs_delayed_ref_root *delayed_refs;</div><div class='add'>+	struct btrfs_delayed_ref_head *head;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_extent_inline_ref *iref;</div><div class='ctx'> 	int ret;</div><div class='add'>+	bool exists = false;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='del'>-</div><div class='add'>+again:</div><div class='ctx'> 	ret = lookup_extent_backref(trans, path, &amp;iref, bytenr,</div><div class='ctx'> 				    root-&gt;fs_info-&gt;nodesize, parent,</div><div class='del'>-				    root-&gt;root_key.objectid, level, 0);</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	if (ret == -ENOENT)</div><div class='add'>+				    btrfs_root_id(root), level, 0);</div><div class='add'>+	if (ret != -ENOENT) {</div><div class='add'>+		/*</div><div class='add'>+		 * If we get 0 then we found our reference, return 1, else</div><div class='add'>+		 * return the error if it's not -ENOENT;</div><div class='add'>+		 */</div><div class='add'>+		return (ret &lt; 0 ) ? ret : 1;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We could have a delayed ref with this reference, so look it up while</div><div class='add'>+	 * we're holding the path open to make sure we don't race with the</div><div class='add'>+	 * delayed ref running.</div><div class='add'>+	 */</div><div class='add'>+	delayed_refs = &amp;trans-&gt;transaction-&gt;delayed_refs;</div><div class='add'>+	spin_lock(&amp;delayed_refs-&gt;lock);</div><div class='add'>+	head = btrfs_find_delayed_ref_head(root-&gt;fs_info, delayed_refs, bytenr);</div><div class='add'>+	if (!head)</div><div class='add'>+		goto out;</div><div class='add'>+	if (!mutex_trylock(&amp;head-&gt;mutex)) {</div><div class='add'>+		/*</div><div class='add'>+		 * We're contended, means that the delayed ref is running, get a</div><div class='add'>+		 * reference and wait for the ref head to be complete and then</div><div class='add'>+		 * try again.</div><div class='add'>+		 */</div><div class='add'>+		refcount_inc(&amp;head-&gt;refs);</div><div class='add'>+		spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='add'>+</div><div class='add'>+		btrfs_release_path(path);</div><div class='add'>+</div><div class='add'>+		mutex_lock(&amp;head-&gt;mutex);</div><div class='add'>+		mutex_unlock(&amp;head-&gt;mutex);</div><div class='add'>+		btrfs_put_delayed_ref_head(head);</div><div class='add'>+		goto again;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	exists = btrfs_find_delayed_tree_ref(head, btrfs_root_id(root), parent);</div><div class='add'>+	mutex_unlock(&amp;head-&gt;mutex);</div><div class='add'>+out:</div><div class='add'>+	spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='add'>+	return exists ? 1 : 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * We may not have an uptodate block, so if we are going to walk down into this</div><div class='add'>+ * block we need to drop the lock, read it off of the disk, re-lock it and</div><div class='add'>+ * return to continue dropping the snapshot.</div><div class='add'>+ */</div><div class='add'>+static int check_next_block_uptodate(struct btrfs_trans_handle *trans,</div><div class='add'>+				     struct btrfs_root *root,</div><div class='add'>+				     struct btrfs_path *path,</div><div class='add'>+				     struct walk_control *wc,</div><div class='add'>+				     struct extent_buffer *next)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_tree_parent_check check = { 0 };</div><div class='add'>+	u64 generation;</div><div class='add'>+	int level = wc-&gt;level;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	btrfs_assert_tree_write_locked(next);</div><div class='add'>+</div><div class='add'>+	generation = btrfs_node_ptr_generation(path-&gt;nodes[level], path-&gt;slots[level]);</div><div class='add'>+</div><div class='add'>+	if (btrfs_buffer_uptodate(next, generation, false))</div><div class='ctx'> 		return 0;</div><div class='del'>-	if (ret &lt; 0)</div><div class='add'>+</div><div class='add'>+	check.level = level - 1;</div><div class='add'>+	check.transid = generation;</div><div class='add'>+	check.owner_root = btrfs_root_id(root);</div><div class='add'>+	check.has_first_key = true;</div><div class='add'>+	btrfs_node_key_to_cpu(path-&gt;nodes[level], &amp;check.first_key, path-&gt;slots[level]);</div><div class='add'>+</div><div class='add'>+	btrfs_tree_unlock(next);</div><div class='add'>+	if (level == 1)</div><div class='add'>+		reada_walk_down(trans, root, wc, path);</div><div class='add'>+	ret = btrfs_read_extent_buffer(next, &amp;check);</div><div class='add'>+	if (ret) {</div><div class='add'>+		free_extent_buffer(next);</div><div class='ctx'> 		return ret;</div><div class='del'>-	return 1;</div><div class='add'>+	}</div><div class='add'>+	btrfs_tree_lock(next);</div><div class='add'>+	wc-&gt;lookup_info = 1;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * If we determine that we don't have to visit wc-&gt;level - 1 then we need to</div><div class='add'>+ * determine if we can drop our reference.</div><div class='add'>+ *</div><div class='add'>+ * If we are UPDATE_BACKREF then we will not, we need to update our backrefs.</div><div class='add'>+ *</div><div class='add'>+ * If we are DROP_REFERENCE this will figure out if we need to drop our current</div><div class='add'>+ * reference, skipping it if we dropped it from a previous uncompleted drop, or</div><div class='add'>+ * dropping it if we still have a reference to it.</div><div class='add'>+ */</div><div class='add'>+static int maybe_drop_reference(struct btrfs_trans_handle *trans, struct btrfs_root *root,</div><div class='add'>+				struct btrfs_path *path, struct walk_control *wc,</div><div class='add'>+				struct extent_buffer *next, u64 owner_root)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_ref ref = {</div><div class='add'>+		.action = BTRFS_DROP_DELAYED_REF,</div><div class='add'>+		.bytenr = next-&gt;start,</div><div class='add'>+		.num_bytes = root-&gt;fs_info-&gt;nodesize,</div><div class='add'>+		.owning_root = owner_root,</div><div class='add'>+		.ref_root = btrfs_root_id(root),</div><div class='add'>+	};</div><div class='add'>+	int level = wc-&gt;level;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	/* We are UPDATE_BACKREF, we're not dropping anything. */</div><div class='add'>+	if (wc-&gt;stage == UPDATE_BACKREF)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if (wc-&gt;flags[level] &amp; BTRFS_BLOCK_FLAG_FULL_BACKREF) {</div><div class='add'>+		ref.parent = path-&gt;nodes[level]-&gt;start;</div><div class='add'>+	} else {</div><div class='add'>+		ASSERT(btrfs_root_id(root) == btrfs_header_owner(path-&gt;nodes[level]));</div><div class='add'>+		if (unlikely(btrfs_root_id(root) != btrfs_header_owner(path-&gt;nodes[level]))) {</div><div class='add'>+			btrfs_err(root-&gt;fs_info, "mismatched block owner");</div><div class='add'>+			return -EIO;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If we had a drop_progress we need to verify the refs are set as</div><div class='add'>+	 * expected.  If we find our ref then we know that from here on out</div><div class='add'>+	 * everything should be correct, and we can clear the</div><div class='add'>+	 * -&gt;restarted flag.</div><div class='add'>+	 */</div><div class='add'>+	if (wc-&gt;restarted) {</div><div class='add'>+		ret = check_ref_exists(trans, root, next-&gt;start, ref.parent,</div><div class='add'>+				       level - 1);</div><div class='add'>+		if (ret &lt;= 0)</div><div class='add'>+			return ret;</div><div class='add'>+		ret = 0;</div><div class='add'>+		wc-&gt;restarted = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Reloc tree doesn't contribute to qgroup numbers, and we have already</div><div class='add'>+	 * accounted them at merge time (replace_path), thus we could skip</div><div class='add'>+	 * expensive subtree trace here.</div><div class='add'>+	 */</div><div class='add'>+	if (btrfs_root_id(root) != BTRFS_TREE_RELOC_OBJECTID &amp;&amp;</div><div class='add'>+	    wc-&gt;refs[level - 1] &gt; 1) {</div><div class='add'>+		u64 generation = btrfs_node_ptr_generation(path-&gt;nodes[level],</div><div class='add'>+							   path-&gt;slots[level]);</div><div class='add'>+</div><div class='add'>+		ret = btrfs_qgroup_trace_subtree(trans, next, generation, level - 1);</div><div class='add'>+		if (ret) {</div><div class='add'>+			btrfs_err_rl(root-&gt;fs_info,</div><div class='add'>+"error %d accounting shared subtree, quota is out of sync, rescan required",</div><div class='add'>+				     ret);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We need to update the next key in our walk control so we can update</div><div class='add'>+	 * the drop_progress key accordingly.  We don't care if find_next_key</div><div class='add'>+	 * doesn't find a key because that means we're at the end and are going</div><div class='add'>+	 * to clean up now.</div><div class='add'>+	 */</div><div class='add'>+	wc-&gt;drop_level = level;</div><div class='add'>+	find_next_key(path, level, &amp;wc-&gt;drop_progress);</div><div class='add'>+</div><div class='add'>+	btrfs_init_tree_ref(&amp;ref, level - 1, 0, false);</div><div class='add'>+	return btrfs_free_extent(trans, &amp;ref);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -5171,20 +5693,15 @@ static int check_ref_exists(struct btrfs_trans_handle *trans,</div><div class='ctx'> static noinline int do_walk_down(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				 struct btrfs_root *root,</div><div class='ctx'> 				 struct btrfs_path *path,</div><div class='del'>-				 struct walk_control *wc, int *lookup_info)</div><div class='add'>+				 struct walk_control *wc)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	u64 bytenr;</div><div class='ctx'> 	u64 generation;</div><div class='del'>-	u64 parent;</div><div class='del'>-	struct btrfs_key key;</div><div class='del'>-	struct btrfs_key first_key;</div><div class='del'>-	struct btrfs_ref ref = { 0 };</div><div class='add'>+	u64 owner_root = 0;</div><div class='ctx'> 	struct extent_buffer *next;</div><div class='ctx'> 	int level = wc-&gt;level;</div><div class='del'>-	int reada = 0;</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	bool need_account = false;</div><div class='ctx'> </div><div class='ctx'> 	generation = btrfs_node_ptr_generation(path-&gt;nodes[level],</div><div class='ctx'> 					       path-&gt;slots[level]);</div><div class='hunk'>@@ -5194,88 +5711,57 @@ static noinline int do_walk_down(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * for the subtree</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (wc-&gt;stage == UPDATE_BACKREF &amp;&amp;</div><div class='del'>-	    generation &lt;= root-&gt;root_key.offset) {</div><div class='del'>-		*lookup_info = 1;</div><div class='add'>+	    generation &lt;= btrfs_root_origin_generation(root)) {</div><div class='add'>+		wc-&gt;lookup_info = 1;</div><div class='ctx'> 		return 1;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	bytenr = btrfs_node_blockptr(path-&gt;nodes[level], path-&gt;slots[level]);</div><div class='del'>-	btrfs_node_key_to_cpu(path-&gt;nodes[level], &amp;first_key,</div><div class='del'>-			      path-&gt;slots[level]);</div><div class='ctx'> </div><div class='del'>-	next = find_extent_buffer(fs_info, bytenr);</div><div class='del'>-	if (!next) {</div><div class='del'>-		next = btrfs_find_create_tree_block(fs_info, bytenr,</div><div class='del'>-				root-&gt;root_key.objectid, level - 1);</div><div class='del'>-		if (IS_ERR(next))</div><div class='del'>-			return PTR_ERR(next);</div><div class='del'>-		reada = 1;</div><div class='del'>-	}</div><div class='add'>+	next = btrfs_find_create_tree_block(fs_info, bytenr, btrfs_root_id(root),</div><div class='add'>+					    level - 1);</div><div class='add'>+	if (IS_ERR(next))</div><div class='add'>+		return PTR_ERR(next);</div><div class='add'>+</div><div class='ctx'> 	btrfs_tree_lock(next);</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_lookup_extent_info(trans, fs_info, bytenr, level - 1, 1,</div><div class='ctx'> 				       &amp;wc-&gt;refs[level - 1],</div><div class='del'>-				       &amp;wc-&gt;flags[level - 1]);</div><div class='add'>+				       &amp;wc-&gt;flags[level - 1],</div><div class='add'>+				       &amp;owner_root);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(wc-&gt;refs[level - 1] == 0)) {</div><div class='del'>-		btrfs_err(fs_info, "Missing references.");</div><div class='del'>-		ret = -EIO;</div><div class='add'>+		btrfs_err(fs_info, "bytenr %llu has 0 references, expect &gt; 0",</div><div class='add'>+			  bytenr);</div><div class='add'>+		ret = -EUCLEAN;</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	}</div><div class='del'>-	*lookup_info = 0;</div><div class='add'>+	wc-&gt;lookup_info = 0;</div><div class='ctx'> </div><div class='del'>-	if (wc-&gt;stage == DROP_REFERENCE) {</div><div class='del'>-		if (wc-&gt;refs[level - 1] &gt; 1) {</div><div class='del'>-			need_account = true;</div><div class='del'>-			if (level == 1 &amp;&amp;</div><div class='del'>-			    (wc-&gt;flags[0] &amp; BTRFS_BLOCK_FLAG_FULL_BACKREF))</div><div class='del'>-				goto skip;</div><div class='del'>-</div><div class='del'>-			if (!wc-&gt;update_ref ||</div><div class='del'>-			    generation &lt;= root-&gt;root_key.offset)</div><div class='del'>-				goto skip;</div><div class='del'>-</div><div class='del'>-			btrfs_node_key_to_cpu(path-&gt;nodes[level], &amp;key,</div><div class='del'>-					      path-&gt;slots[level]);</div><div class='del'>-			ret = btrfs_comp_cpu_keys(&amp;key, &amp;wc-&gt;update_progress);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto skip;</div><div class='add'>+	/* If we don't have to walk into this node skip it. */</div><div class='add'>+	if (!visit_node_for_delete(root, wc, path-&gt;nodes[level],</div><div class='add'>+				   wc-&gt;flags[level - 1], path-&gt;slots[level]))</div><div class='add'>+		goto skip;</div><div class='ctx'> </div><div class='del'>-			wc-&gt;stage = UPDATE_BACKREF;</div><div class='del'>-			wc-&gt;shared_level = level - 1;</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-		if (level == 1 &amp;&amp;</div><div class='del'>-		    (wc-&gt;flags[0] &amp; BTRFS_BLOCK_FLAG_FULL_BACKREF))</div><div class='del'>-			goto skip;</div><div class='add'>+	/*</div><div class='add'>+	 * We have to walk down into this node, and if we're currently at the</div><div class='add'>+	 * DROP_REFERENCE stage and this block is shared then we need to switch</div><div class='add'>+	 * to the UPDATE_BACKREF stage in order to convert to FULL_BACKREF.</div><div class='add'>+	 */</div><div class='add'>+	if (wc-&gt;stage == DROP_REFERENCE &amp;&amp; wc-&gt;refs[level - 1] &gt; 1) {</div><div class='add'>+		wc-&gt;stage = UPDATE_BACKREF;</div><div class='add'>+		wc-&gt;shared_level = level - 1;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!btrfs_buffer_uptodate(next, generation, 0)) {</div><div class='del'>-		btrfs_tree_unlock(next);</div><div class='del'>-		free_extent_buffer(next);</div><div class='del'>-		next = NULL;</div><div class='del'>-		*lookup_info = 1;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!next) {</div><div class='del'>-		if (reada &amp;&amp; level == 1)</div><div class='del'>-			reada_walk_down(trans, root, wc, path);</div><div class='del'>-		next = read_tree_block(fs_info, bytenr, root-&gt;root_key.objectid,</div><div class='del'>-				       generation, level - 1, &amp;first_key);</div><div class='del'>-		if (IS_ERR(next)) {</div><div class='del'>-			return PTR_ERR(next);</div><div class='del'>-		} else if (!extent_buffer_uptodate(next)) {</div><div class='del'>-			free_extent_buffer(next);</div><div class='del'>-			return -EIO;</div><div class='del'>-		}</div><div class='del'>-		btrfs_tree_lock(next);</div><div class='del'>-	}</div><div class='add'>+	ret = check_next_block_uptodate(trans, root, path, wc, next);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	level--;</div><div class='ctx'> 	ASSERT(level == btrfs_header_level(next));</div><div class='del'>-	if (level != btrfs_header_level(next)) {</div><div class='add'>+	if (unlikely(level != btrfs_header_level(next))) {</div><div class='ctx'> 		btrfs_err(root-&gt;fs_info, "mismatched level");</div><div class='ctx'> 		ret = -EIO;</div><div class='ctx'> 		goto out_unlock;</div><div class='hunk'>@@ -5288,76 +5774,12 @@ static noinline int do_walk_down(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		wc-&gt;reada_slot = 0;</div><div class='ctx'> 	return 0;</div><div class='ctx'> skip:</div><div class='add'>+	ret = maybe_drop_reference(trans, root, path, wc, next, owner_root);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_unlock;</div><div class='ctx'> 	wc-&gt;refs[level - 1] = 0;</div><div class='ctx'> 	wc-&gt;flags[level - 1] = 0;</div><div class='del'>-	if (wc-&gt;stage == DROP_REFERENCE) {</div><div class='del'>-		if (wc-&gt;flags[level] &amp; BTRFS_BLOCK_FLAG_FULL_BACKREF) {</div><div class='del'>-			parent = path-&gt;nodes[level]-&gt;start;</div><div class='del'>-		} else {</div><div class='del'>-			ASSERT(root-&gt;root_key.objectid ==</div><div class='del'>-			       btrfs_header_owner(path-&gt;nodes[level]));</div><div class='del'>-			if (root-&gt;root_key.objectid !=</div><div class='del'>-			    btrfs_header_owner(path-&gt;nodes[level])) {</div><div class='del'>-				btrfs_err(root-&gt;fs_info,</div><div class='del'>-						"mismatched block owner");</div><div class='del'>-				ret = -EIO;</div><div class='del'>-				goto out_unlock;</div><div class='del'>-			}</div><div class='del'>-			parent = 0;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * If we had a drop_progress we need to verify the refs are set</div><div class='del'>-		 * as expected.  If we find our ref then we know that from here</div><div class='del'>-		 * on out everything should be correct, and we can clear the</div><div class='del'>-		 * -&gt;restarted flag.</div><div class='del'>-		 */</div><div class='del'>-		if (wc-&gt;restarted) {</div><div class='del'>-			ret = check_ref_exists(trans, root, bytenr, parent,</div><div class='del'>-					       level - 1);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto out_unlock;</div><div class='del'>-			if (ret == 0)</div><div class='del'>-				goto no_delete;</div><div class='del'>-			ret = 0;</div><div class='del'>-			wc-&gt;restarted = 0;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Reloc tree doesn't contribute to qgroup numbers, and we have</div><div class='del'>-		 * already accounted them at merge time (replace_path),</div><div class='del'>-		 * thus we could skip expensive subtree trace here.</div><div class='del'>-		 */</div><div class='del'>-		if (root-&gt;root_key.objectid != BTRFS_TREE_RELOC_OBJECTID &amp;&amp;</div><div class='del'>-		    need_account) {</div><div class='del'>-			ret = btrfs_qgroup_trace_subtree(trans, next,</div><div class='del'>-							 generation, level - 1);</div><div class='del'>-			if (ret) {</div><div class='del'>-				btrfs_err_rl(fs_info,</div><div class='del'>-					     "Error %d accounting shared subtree. Quota is out of sync, rescan required.",</div><div class='del'>-					     ret);</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * We need to update the next key in our walk control so we can</div><div class='del'>-		 * update the drop_progress key accordingly.  We don't care if</div><div class='del'>-		 * find_next_key doesn't find a key because that means we're at</div><div class='del'>-		 * the end and are going to clean up now.</div><div class='del'>-		 */</div><div class='del'>-		wc-&gt;drop_level = level;</div><div class='del'>-		find_next_key(path, level, &amp;wc-&gt;drop_progress);</div><div class='del'>-</div><div class='del'>-		btrfs_init_generic_ref(&amp;ref, BTRFS_DROP_DELAYED_REF, bytenr,</div><div class='del'>-				       fs_info-&gt;nodesize, parent);</div><div class='del'>-		btrfs_init_tree_ref(&amp;ref, level - 1, root-&gt;root_key.objectid,</div><div class='del'>-				    0, false);</div><div class='del'>-		ret = btrfs_free_extent(trans, &amp;ref);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto out_unlock;</div><div class='del'>-	}</div><div class='del'>-no_delete:</div><div class='del'>-	*lookup_info = 1;</div><div class='add'>+	wc-&gt;lookup_info = 1;</div><div class='ctx'> 	ret = 1;</div><div class='ctx'> </div><div class='ctx'> out_unlock:</div><div class='hunk'>@@ -5385,13 +5807,13 @@ static noinline int walk_up_proc(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				 struct walk_control *wc)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='del'>-	int ret;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> 	int level = wc-&gt;level;</div><div class='ctx'> 	struct extent_buffer *eb = path-&gt;nodes[level];</div><div class='ctx'> 	u64 parent = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (wc-&gt;stage == UPDATE_BACKREF) {</div><div class='del'>-		BUG_ON(wc-&gt;shared_level &lt; level);</div><div class='add'>+		ASSERT(wc-&gt;shared_level &gt;= level);</div><div class='ctx'> 		if (level &lt; wc-&gt;shared_level)</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -5409,20 +5831,26 @@ static noinline int walk_up_proc(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		 * count is one.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (!path-&gt;locks[level]) {</div><div class='del'>-			BUG_ON(level == 0);</div><div class='add'>+			ASSERT(level &gt; 0);</div><div class='ctx'> 			btrfs_tree_lock(eb);</div><div class='ctx'> 			path-&gt;locks[level] = BTRFS_WRITE_LOCK;</div><div class='ctx'> </div><div class='ctx'> 			ret = btrfs_lookup_extent_info(trans, fs_info,</div><div class='ctx'> 						       eb-&gt;start, level, 1,</div><div class='ctx'> 						       &amp;wc-&gt;refs[level],</div><div class='del'>-						       &amp;wc-&gt;flags[level]);</div><div class='add'>+						       &amp;wc-&gt;flags[level],</div><div class='add'>+						       NULL);</div><div class='ctx'> 			if (ret &lt; 0) {</div><div class='ctx'> 				btrfs_tree_unlock_rw(eb, path-&gt;locks[level]);</div><div class='ctx'> 				path-&gt;locks[level] = 0;</div><div class='ctx'> 				return ret;</div><div class='ctx'> 			}</div><div class='del'>-			BUG_ON(wc-&gt;refs[level] == 0);</div><div class='add'>+			if (unlikely(wc-&gt;refs[level] == 0)) {</div><div class='add'>+				btrfs_tree_unlock_rw(eb, path-&gt;locks[level]);</div><div class='add'>+				btrfs_err(fs_info, "bytenr %llu has 0 references, expect &gt; 0",</div><div class='add'>+					  eb-&gt;start);</div><div class='add'>+				return -EUCLEAN;</div><div class='add'>+			}</div><div class='ctx'> 			if (wc-&gt;refs[level] == 1) {</div><div class='ctx'> 				btrfs_tree_unlock_rw(eb, path-&gt;locks[level]);</div><div class='ctx'> 				path-&gt;locks[level] = 0;</div><div class='hunk'>@@ -5432,16 +5860,24 @@ static noinline int walk_up_proc(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* wc-&gt;stage == DROP_REFERENCE */</div><div class='del'>-	BUG_ON(wc-&gt;refs[level] &gt; 1 &amp;&amp; !path-&gt;locks[level]);</div><div class='add'>+	ASSERT(path-&gt;locks[level] || wc-&gt;refs[level] == 1);</div><div class='ctx'> </div><div class='ctx'> 	if (wc-&gt;refs[level] == 1) {</div><div class='ctx'> 		if (level == 0) {</div><div class='del'>-			if (wc-&gt;flags[level] &amp; BTRFS_BLOCK_FLAG_FULL_BACKREF)</div><div class='add'>+			if (wc-&gt;flags[level] &amp; BTRFS_BLOCK_FLAG_FULL_BACKREF) {</div><div class='ctx'> 				ret = btrfs_dec_ref(trans, root, eb, 1);</div><div class='del'>-			else</div><div class='add'>+				if (ret) {</div><div class='add'>+					btrfs_abort_transaction(trans, ret);</div><div class='add'>+					return ret;</div><div class='add'>+				}</div><div class='add'>+			} else {</div><div class='ctx'> 				ret = btrfs_dec_ref(trans, root, eb, 0);</div><div class='del'>-			BUG_ON(ret); /* -ENOMEM */</div><div class='del'>-			if (is_fstree(root-&gt;root_key.objectid)) {</div><div class='add'>+				if (unlikely(ret)) {</div><div class='add'>+					btrfs_abort_transaction(trans, ret);</div><div class='add'>+					return ret;</div><div class='add'>+				}</div><div class='add'>+			}</div><div class='add'>+			if (btrfs_is_fstree(btrfs_root_id(root))) {</div><div class='ctx'> 				ret = btrfs_qgroup_trace_leaf_items(trans, eb);</div><div class='ctx'> 				if (ret) {</div><div class='ctx'> 					btrfs_err_rl(fs_info,</div><div class='hunk'>@@ -5450,52 +5886,75 @@ static noinline int walk_up_proc(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				}</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		/* make block locked assertion in btrfs_clean_tree_block happy */</div><div class='del'>-		if (!path-&gt;locks[level] &amp;&amp;</div><div class='del'>-		    btrfs_header_generation(eb) == trans-&gt;transid) {</div><div class='add'>+		/* Make block locked assertion in btrfs_clear_buffer_dirty happy. */</div><div class='add'>+		if (!path-&gt;locks[level]) {</div><div class='ctx'> 			btrfs_tree_lock(eb);</div><div class='ctx'> 			path-&gt;locks[level] = BTRFS_WRITE_LOCK;</div><div class='ctx'> 		}</div><div class='del'>-		btrfs_clean_tree_block(eb);</div><div class='add'>+		btrfs_clear_buffer_dirty(trans, eb);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (eb == root-&gt;node) {</div><div class='ctx'> 		if (wc-&gt;flags[level] &amp; BTRFS_BLOCK_FLAG_FULL_BACKREF)</div><div class='ctx'> 			parent = eb-&gt;start;</div><div class='del'>-		else if (root-&gt;root_key.objectid != btrfs_header_owner(eb))</div><div class='add'>+		else if (unlikely(btrfs_root_id(root) != btrfs_header_owner(eb)))</div><div class='ctx'> 			goto owner_mismatch;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		if (wc-&gt;flags[level + 1] &amp; BTRFS_BLOCK_FLAG_FULL_BACKREF)</div><div class='ctx'> 			parent = path-&gt;nodes[level + 1]-&gt;start;</div><div class='del'>-		else if (root-&gt;root_key.objectid !=</div><div class='del'>-			 btrfs_header_owner(path-&gt;nodes[level + 1]))</div><div class='add'>+		else if (unlikely(btrfs_root_id(root) !=</div><div class='add'>+				  btrfs_header_owner(path-&gt;nodes[level + 1])))</div><div class='ctx'> 			goto owner_mismatch;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_free_tree_block(trans, root, eb, parent, wc-&gt;refs[level] == 1);</div><div class='add'>+	ret = btrfs_free_tree_block(trans, btrfs_root_id(root), eb, parent,</div><div class='add'>+				    wc-&gt;refs[level] == 1);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> out:</div><div class='ctx'> 	wc-&gt;refs[level] = 0;</div><div class='ctx'> 	wc-&gt;flags[level] = 0;</div><div class='del'>-	return 0;</div><div class='add'>+	return ret;</div><div class='ctx'> </div><div class='ctx'> owner_mismatch:</div><div class='ctx'> 	btrfs_err_rl(fs_info, "unexpected tree owner, have %llu expect %llu",</div><div class='del'>-		     btrfs_header_owner(eb), root-&gt;root_key.objectid);</div><div class='add'>+		     btrfs_header_owner(eb), btrfs_root_id(root));</div><div class='ctx'> 	return -EUCLEAN;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * walk_down_tree consists of two steps.</div><div class='add'>+ *</div><div class='add'>+ * walk_down_proc().  Look up the reference count and reference of our current</div><div class='add'>+ * wc-&gt;level.  At this point path-&gt;nodes[wc-&gt;level] should be populated and</div><div class='add'>+ * uptodate, and in most cases should already be locked.  If we are in</div><div class='add'>+ * DROP_REFERENCE and our refcount is &gt; 1 then we've entered a shared node and</div><div class='add'>+ * we can walk back up the tree.  If we are UPDATE_BACKREF we have to set</div><div class='add'>+ * FULL_BACKREF on this node if it's not already set, and then do the</div><div class='add'>+ * FULL_BACKREF conversion dance, which is to drop the root reference and add</div><div class='add'>+ * the shared reference to all of this nodes children.</div><div class='add'>+ *</div><div class='add'>+ * do_walk_down().  This is where we actually start iterating on the children of</div><div class='add'>+ * our current path-&gt;nodes[wc-&gt;level].  For DROP_REFERENCE that means dropping</div><div class='add'>+ * our reference to the children that return false from visit_node_for_delete(),</div><div class='add'>+ * which has various conditions where we know we can just drop our reference</div><div class='add'>+ * without visiting the node.  For UPDATE_BACKREF we will skip any children that</div><div class='add'>+ * visit_node_for_delete() returns false for, only walking down when necessary.</div><div class='add'>+ * The bulk of the work for UPDATE_BACKREF occurs in the walk_up_tree() part of</div><div class='add'>+ * snapshot deletion.</div><div class='add'>+ */</div><div class='ctx'> static noinline int walk_down_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				   struct btrfs_root *root,</div><div class='ctx'> 				   struct btrfs_path *path,</div><div class='ctx'> 				   struct walk_control *wc)</div><div class='ctx'> {</div><div class='ctx'> 	int level = wc-&gt;level;</div><div class='del'>-	int lookup_info = 1;</div><div class='del'>-	int ret;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='add'>+	wc-&gt;lookup_info = 1;</div><div class='ctx'> 	while (level &gt;= 0) {</div><div class='del'>-		ret = walk_down_proc(trans, root, path, wc, lookup_info);</div><div class='del'>-		if (ret &gt; 0)</div><div class='add'>+		ret = walk_down_proc(trans, root, path, wc);</div><div class='add'>+		if (ret)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='ctx'> 		if (level == 0)</div><div class='hunk'>@@ -5505,17 +5964,34 @@ static noinline int walk_down_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		    btrfs_header_nritems(path-&gt;nodes[level]))</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		ret = do_walk_down(trans, root, path, wc, &amp;lookup_info);</div><div class='add'>+		ret = do_walk_down(trans, root, path, wc);</div><div class='ctx'> 		if (ret &gt; 0) {</div><div class='ctx'> 			path-&gt;slots[level]++;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		} else if (ret &lt; 0)</div><div class='del'>-			return ret;</div><div class='add'>+			break;</div><div class='ctx'> 		level = wc-&gt;level;</div><div class='ctx'> 	}</div><div class='del'>-	return 0;</div><div class='add'>+	return (ret == 1) ? 0 : ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * walk_up_tree() is responsible for making sure we visit every slot on our</div><div class='add'>+ * current node, and if we're at the end of that node then we call</div><div class='add'>+ * walk_up_proc() on our current node which will do one of a few things based on</div><div class='add'>+ * our stage.</div><div class='add'>+ *</div><div class='add'>+ * UPDATE_BACKREF.  If we wc-&gt;level is currently less than our wc-&gt;shared_level</div><div class='add'>+ * then we need to walk back up the tree, and then going back down into the</div><div class='add'>+ * other slots via walk_down_tree to update any other children from our original</div><div class='add'>+ * wc-&gt;shared_level.  Once we're at or above our wc-&gt;shared_level we can switch</div><div class='add'>+ * back to DROP_REFERENCE, lookup the current nodes refs and flags, and carry on.</div><div class='add'>+ *</div><div class='add'>+ * DROP_REFERENCE. If our refs == 1 then we're going to free this tree block.</div><div class='add'>+ * If we're level 0 then we need to btrfs_dec_ref() on all of the data extents</div><div class='add'>+ * in our current leaf.  After that we call btrfs_free_tree_block() on the</div><div class='add'>+ * current node and walk up to the next node to walk down the next slot.</div><div class='add'>+ */</div><div class='ctx'> static noinline int walk_up_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				 struct btrfs_root *root,</div><div class='ctx'> 				 struct btrfs_path *path,</div><div class='hunk'>@@ -5562,35 +6038,36 @@ static noinline int walk_up_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'>  * also make sure backrefs for the shared block and all lower level</div><div class='ctx'>  * blocks are properly updated.</div><div class='ctx'>  *</div><div class='del'>- * If called with for_reloc == 0, may exit early with -EAGAIN</div><div class='add'>+ * If called with for_reloc set, may exit early with -EAGAIN</div><div class='ctx'>  */</div><div class='del'>-int btrfs_drop_snapshot(struct btrfs_root *root, int update_ref, int for_reloc)</div><div class='add'>+int btrfs_drop_snapshot(struct btrfs_root *root, bool update_ref, bool for_reloc)</div><div class='ctx'> {</div><div class='add'>+	const bool is_reloc_root = (btrfs_root_id(root) == BTRFS_TREE_RELOC_OBJECTID);</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_path *path;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	struct btrfs_root *tree_root = fs_info-&gt;tree_root;</div><div class='ctx'> 	struct btrfs_root_item *root_item = &amp;root-&gt;root_item;</div><div class='del'>-	struct walk_control *wc;</div><div class='add'>+	struct walk_control AUTO_KFREE(wc);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='del'>-	int err = 0;</div><div class='del'>-	int ret;</div><div class='add'>+	const u64 rootid = btrfs_root_id(root);</div><div class='add'>+	int ret = 0;</div><div class='ctx'> 	int level;</div><div class='ctx'> 	bool root_dropped = false;</div><div class='add'>+	bool unfinished_drop = false;</div><div class='ctx'> </div><div class='del'>-	btrfs_debug(fs_info, "Drop subvolume %llu", root-&gt;root_key.objectid);</div><div class='add'>+	btrfs_debug(fs_info, "Drop subvolume %llu", btrfs_root_id(root));</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path) {</div><div class='del'>-		err = -ENOMEM;</div><div class='add'>+		ret = -ENOMEM;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	wc = kzalloc(sizeof(*wc), GFP_NOFS);</div><div class='ctx'> 	if (!wc) {</div><div class='del'>-		btrfs_free_path(path);</div><div class='del'>-		err = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out_free;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -5602,12 +6079,12 @@ int btrfs_drop_snapshot(struct btrfs_root *root, int update_ref, int for_reloc)</div><div class='ctx'> 	else</div><div class='ctx'> 		trans = btrfs_start_transaction(tree_root, 0);</div><div class='ctx'> 	if (IS_ERR(trans)) {</div><div class='del'>-		err = PTR_ERR(trans);</div><div class='add'>+		ret = PTR_ERR(trans);</div><div class='ctx'> 		goto out_free;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = btrfs_run_delayed_items(trans);</div><div class='del'>-	if (err)</div><div class='add'>+	ret = btrfs_run_delayed_items(trans);</div><div class='add'>+	if (ret)</div><div class='ctx'> 		goto out_end_trans;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -5619,6 +6096,8 @@ int btrfs_drop_snapshot(struct btrfs_root *root, int update_ref, int for_reloc)</div><div class='ctx'> 	 * already dropped.</div><div class='ctx'> 	 */</div><div class='ctx'> 	set_bit(BTRFS_ROOT_DELETING, &amp;root-&gt;state);</div><div class='add'>+	unfinished_drop = test_bit(BTRFS_ROOT_UNFINISHED_DROP, &amp;root-&gt;state);</div><div class='add'>+</div><div class='ctx'> 	if (btrfs_disk_key_objectid(&amp;root_item-&gt;drop_progress) == 0) {</div><div class='ctx'> 		level = btrfs_header_level(root-&gt;node);</div><div class='ctx'> 		path-&gt;nodes[level] = btrfs_lock_root_node(root);</div><div class='hunk'>@@ -5636,11 +6115,11 @@ int btrfs_drop_snapshot(struct btrfs_root *root, int update_ref, int for_reloc)</div><div class='ctx'> 		path-&gt;lowest_level = level;</div><div class='ctx'> 		ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='ctx'> 		path-&gt;lowest_level = 0;</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			err = ret;</div><div class='add'>+		if (ret &lt; 0)</div><div class='ctx'> 			goto out_end_trans;</div><div class='del'>-		}</div><div class='add'>+</div><div class='ctx'> 		WARN_ON(ret &gt; 0);</div><div class='add'>+		ret = 0;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * unlock our path, this is safe because only this</div><div class='hunk'>@@ -5653,14 +6132,17 @@ int btrfs_drop_snapshot(struct btrfs_root *root, int update_ref, int for_reloc)</div><div class='ctx'> 			btrfs_tree_lock(path-&gt;nodes[level]);</div><div class='ctx'> 			path-&gt;locks[level] = BTRFS_WRITE_LOCK;</div><div class='ctx'> </div><div class='add'>+			/*</div><div class='add'>+			 * btrfs_lookup_extent_info() returns 0 for success,</div><div class='add'>+			 * or &lt; 0 for error.</div><div class='add'>+			 */</div><div class='ctx'> 			ret = btrfs_lookup_extent_info(trans, fs_info,</div><div class='ctx'> 						path-&gt;nodes[level]-&gt;start,</div><div class='ctx'> 						level, 1, &amp;wc-&gt;refs[level],</div><div class='del'>-						&amp;wc-&gt;flags[level]);</div><div class='del'>-			if (ret &lt; 0) {</div><div class='del'>-				err = ret;</div><div class='add'>+						&amp;wc-&gt;flags[level], NULL);</div><div class='add'>+			if (ret &lt; 0)</div><div class='ctx'> 				goto out_end_trans;</div><div class='del'>-			}</div><div class='add'>+</div><div class='ctx'> 			BUG_ON(wc-&gt;refs[level] == 0);</div><div class='ctx'> </div><div class='ctx'> 			if (level == btrfs_root_drop_level(root_item))</div><div class='hunk'>@@ -5684,19 +6166,20 @@ int btrfs_drop_snapshot(struct btrfs_root *root, int update_ref, int for_reloc)</div><div class='ctx'> 	while (1) {</div><div class='ctx'> </div><div class='ctx'> 		ret = walk_down_tree(trans, root, path, wc);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			err = ret;</div><div class='add'>+		if (unlikely(ret &lt; 0)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		ret = walk_up_tree(trans, root, path, wc, BTRFS_MAX_LEVEL);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			err = ret;</div><div class='add'>+		if (unlikely(ret &lt; 0)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (ret &gt; 0) {</div><div class='ctx'> 			BUG_ON(wc-&gt;stage != DROP_REFERENCE);</div><div class='add'>+			ret = 0;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -5716,17 +6199,19 @@ int btrfs_drop_snapshot(struct btrfs_root *root, int update_ref, int for_reloc)</div><div class='ctx'> 			ret = btrfs_update_root(trans, tree_root,</div><div class='ctx'> 						&amp;root-&gt;root_key,</div><div class='ctx'> 						root_item);</div><div class='del'>-			if (ret) {</div><div class='add'>+			if (unlikely(ret)) {</div><div class='ctx'> 				btrfs_abort_transaction(trans, ret);</div><div class='del'>-				err = ret;</div><div class='ctx'> 				goto out_end_trans;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='add'>+			if (!is_reloc_root)</div><div class='add'>+				btrfs_set_last_root_drop_gen(fs_info, trans-&gt;transid);</div><div class='add'>+</div><div class='ctx'> 			btrfs_end_transaction_throttle(trans);</div><div class='ctx'> 			if (!for_reloc &amp;&amp; btrfs_need_cleaner_sleep(fs_info)) {</div><div class='ctx'> 				btrfs_debug(fs_info,</div><div class='ctx'> 					    "drop snapshot early exit");</div><div class='del'>-				err = -EAGAIN;</div><div class='add'>+				ret = -EAGAIN;</div><div class='ctx'> 				goto out_free;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='hunk'>@@ -5740,37 +6225,36 @@ int btrfs_drop_snapshot(struct btrfs_root *root, int update_ref, int for_reloc)</div><div class='ctx'> 			else</div><div class='ctx'> 				trans = btrfs_start_transaction(tree_root, 0);</div><div class='ctx'> 			if (IS_ERR(trans)) {</div><div class='del'>-				err = PTR_ERR(trans);</div><div class='add'>+				ret = PTR_ERR(trans);</div><div class='ctx'> 				goto out_free;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='del'>-	if (err)</div><div class='add'>+	if (ret)</div><div class='ctx'> 		goto out_end_trans;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_del_root(trans, &amp;root-&gt;root_key);</div><div class='del'>-	if (ret) {</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='del'>-		err = ret;</div><div class='ctx'> 		goto out_end_trans;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (root-&gt;root_key.objectid != BTRFS_TREE_RELOC_OBJECTID) {</div><div class='add'>+	if (!is_reloc_root) {</div><div class='ctx'> 		ret = btrfs_find_root(tree_root, &amp;root-&gt;root_key, path,</div><div class='ctx'> 				      NULL, NULL);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='add'>+		if (unlikely(ret &lt; 0)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='del'>-			err = ret;</div><div class='ctx'> 			goto out_end_trans;</div><div class='ctx'> 		} else if (ret &gt; 0) {</div><div class='del'>-			/* if we fail to delete the orphan item this time</div><div class='add'>+			ret = 0;</div><div class='add'>+			/*</div><div class='add'>+			 * If we fail to delete the orphan item this time</div><div class='ctx'> 			 * around, it'll get picked up the next time.</div><div class='ctx'> 			 *</div><div class='ctx'> 			 * The most common failure here is just -ENOENT.</div><div class='ctx'> 			 */</div><div class='del'>-			btrfs_del_orphan_item(trans, tree_root,</div><div class='del'>-					      root-&gt;root_key.objectid);</div><div class='add'>+			btrfs_del_orphan_item(trans, tree_root, btrfs_root_id(root));</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -5788,11 +6272,28 @@ int btrfs_drop_snapshot(struct btrfs_root *root, int update_ref, int for_reloc)</div><div class='ctx'> 		btrfs_put_root(root);</div><div class='ctx'> 	root_dropped = true;</div><div class='ctx'> out_end_trans:</div><div class='add'>+	if (!is_reloc_root)</div><div class='add'>+		btrfs_set_last_root_drop_gen(fs_info, trans-&gt;transid);</div><div class='add'>+</div><div class='ctx'> 	btrfs_end_transaction_throttle(trans);</div><div class='ctx'> out_free:</div><div class='del'>-	kfree(wc);</div><div class='ctx'> 	btrfs_free_path(path);</div><div class='ctx'> out:</div><div class='add'>+	if (!ret &amp;&amp; root_dropped) {</div><div class='add'>+		ret = btrfs_qgroup_cleanup_dropped_subvolume(fs_info, rootid);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			btrfs_warn_rl(fs_info,</div><div class='add'>+				      "failed to cleanup qgroup 0/%llu: %d",</div><div class='add'>+				      rootid, ret);</div><div class='add'>+		ret = 0;</div><div class='add'>+	}</div><div class='add'>+	/*</div><div class='add'>+	 * We were an unfinished drop root, check to see if there are any</div><div class='add'>+	 * pending, and if not clear and wake up any waiters.</div><div class='add'>+	 */</div><div class='add'>+	if (!ret &amp;&amp; unfinished_drop)</div><div class='add'>+		btrfs_maybe_wake_unfinished_drop(fs_info);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * So if we need to stop dropping the snapshot for whatever reason we</div><div class='ctx'> 	 * need to make sure to add it back to the dead root list so that we</div><div class='hunk'>@@ -5802,7 +6303,7 @@ out:</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (!for_reloc &amp;&amp; !root_dropped)</div><div class='ctx'> 		btrfs_add_dead_root(root);</div><div class='del'>-	return err;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -5817,28 +6318,25 @@ int btrfs_drop_subtree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			struct extent_buffer *parent)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='del'>-	struct btrfs_path *path;</div><div class='del'>-	struct walk_control *wc;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='add'>+	struct walk_control AUTO_KFREE(wc);</div><div class='ctx'> 	int level;</div><div class='ctx'> 	int parent_level;</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	int wret;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(root-&gt;root_key.objectid != BTRFS_TREE_RELOC_OBJECTID);</div><div class='add'>+	BUG_ON(btrfs_root_id(root) != BTRFS_TREE_RELOC_OBJECTID);</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	wc = kzalloc(sizeof(*wc), GFP_NOFS);</div><div class='del'>-	if (!wc) {</div><div class='del'>-		btrfs_free_path(path);</div><div class='add'>+	if (!wc)</div><div class='ctx'> 		return -ENOMEM;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	btrfs_assert_tree_write_locked(parent);</div><div class='ctx'> 	parent_level = btrfs_header_level(parent);</div><div class='del'>-	atomic_inc(&amp;parent-&gt;refs);</div><div class='add'>+	refcount_inc(&amp;parent-&gt;refs);</div><div class='ctx'> 	path-&gt;nodes[parent_level] = parent;</div><div class='ctx'> 	path-&gt;slots[parent_level] = btrfs_header_nritems(parent);</div><div class='ctx'> </div><div class='hunk'>@@ -5858,62 +6356,28 @@ int btrfs_drop_subtree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	wc-&gt;reada_count = BTRFS_NODEPTRS_PER_BLOCK(fs_info);</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='del'>-		wret = walk_down_tree(trans, root, path, wc);</div><div class='del'>-		if (wret &lt; 0) {</div><div class='del'>-			ret = wret;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='add'>+		ret = walk_down_tree(trans, root, path, wc);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='ctx'> </div><div class='del'>-		wret = walk_up_tree(trans, root, path, wc, parent_level);</div><div class='del'>-		if (wret &lt; 0)</div><div class='del'>-			ret = wret;</div><div class='del'>-		if (wret != 0)</div><div class='add'>+		ret = walk_up_tree(trans, root, path, wc, parent_level);</div><div class='add'>+		if (ret) {</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				return ret;</div><div class='ctx'> 			break;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	kfree(wc);</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * helper to account the unused space of all the readonly block group in the</div><div class='del'>- * space_info. takes mirrors into account.</div><div class='add'>+ * Unpin the extent range in an error context and don't add the space back.</div><div class='add'>+ * Errors are not propagated further.</div><div class='ctx'>  */</div><div class='del'>-u64 btrfs_account_ro_block_groups_free_space(struct btrfs_space_info *sinfo)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_block_group *block_group;</div><div class='del'>-	u64 free_bytes = 0;</div><div class='del'>-	int factor;</div><div class='del'>-</div><div class='del'>-	/* It's df, we don't care if it's racy */</div><div class='del'>-	if (list_empty(&amp;sinfo-&gt;ro_bgs))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;sinfo-&gt;lock);</div><div class='del'>-	list_for_each_entry(block_group, &amp;sinfo-&gt;ro_bgs, ro_list) {</div><div class='del'>-		spin_lock(&amp;block_group-&gt;lock);</div><div class='del'>-</div><div class='del'>-		if (!block_group-&gt;ro) {</div><div class='del'>-			spin_unlock(&amp;block_group-&gt;lock);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		factor = btrfs_bg_type_to_factor(block_group-&gt;flags);</div><div class='del'>-		free_bytes += (block_group-&gt;length -</div><div class='del'>-			       block_group-&gt;used) * factor;</div><div class='del'>-</div><div class='del'>-		spin_unlock(&amp;block_group-&gt;lock);</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;sinfo-&gt;lock);</div><div class='del'>-</div><div class='del'>-	return free_bytes;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int btrfs_error_unpin_extent_range(struct btrfs_fs_info *fs_info,</div><div class='del'>-				   u64 start, u64 end)</div><div class='add'>+void btrfs_error_unpin_extent_range(struct btrfs_fs_info *fs_info, u64 start, u64 end)</div><div class='ctx'> {</div><div class='del'>-	return unpin_extent_range(fs_info, start, end, false);</div><div class='add'>+	unpin_extent_range(fs_info, start, end, false);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -5938,13 +6402,13 @@ int btrfs_error_unpin_extent_range(struct btrfs_fs_info *fs_info,</div><div class='ctx'>  */</div><div class='ctx'> static int btrfs_trim_free_extents(struct btrfs_device *device, u64 *trimmed)</div><div class='ctx'> {</div><div class='del'>-	u64 start = SZ_1M, len = 0, end = 0;</div><div class='add'>+	u64 start = BTRFS_DEVICE_RANGE_RESERVED, len = 0, end = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	*trimmed = 0;</div><div class='ctx'> </div><div class='ctx'> 	/* Discard not supported = nothing to do. */</div><div class='del'>-	if (!blk_queue_discard(bdev_get_queue(device-&gt;bdev)))</div><div class='add'>+	if (!bdev_max_discard_sectors(device-&gt;bdev))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/* Not writable = nothing to do. */</div><div class='hunk'>@@ -5965,25 +6429,25 @@ static int btrfs_trim_free_extents(struct btrfs_device *device, u64 *trimmed)</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		find_first_clear_extent_bit(&amp;device-&gt;alloc_state, start,</div><div class='del'>-					    &amp;start, &amp;end,</div><div class='del'>-					    CHUNK_TRIMMED | CHUNK_ALLOCATED);</div><div class='add'>+		btrfs_find_first_clear_extent_bit(&amp;device-&gt;alloc_state, start,</div><div class='add'>+						  &amp;start, &amp;end,</div><div class='add'>+						  CHUNK_TRIMMED | CHUNK_ALLOCATED);</div><div class='ctx'> </div><div class='ctx'> 		/* Check if there are any CHUNK_* bits left */</div><div class='ctx'> 		if (start &gt; device-&gt;total_bytes) {</div><div class='del'>-			WARN_ON(IS_ENABLED(CONFIG_BTRFS_DEBUG));</div><div class='del'>-			btrfs_warn_in_rcu(fs_info,</div><div class='add'>+			DEBUG_WARN();</div><div class='add'>+			btrfs_warn(fs_info,</div><div class='ctx'> "ignoring attempt to trim beyond device size: offset %llu length %llu device %s device size %llu",</div><div class='ctx'> 					  start, end - start + 1,</div><div class='del'>-					  rcu_str_deref(device-&gt;name),</div><div class='add'>+					  btrfs_dev_name(device),</div><div class='ctx'> 					  device-&gt;total_bytes);</div><div class='ctx'> 			mutex_unlock(&amp;fs_info-&gt;chunk_mutex);</div><div class='ctx'> 			ret = 0;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		/* Ensure we skip the reserved area in the first 1M */</div><div class='del'>-		start = max_t(u64, start, SZ_1M);</div><div class='add'>+		/* Ensure we skip the reserved space on each device. */</div><div class='add'>+		start = max_t(u64, start, BTRFS_DEVICE_RANGE_RESERVED);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * If find_first_clear_extent_bit find a range that spans the</div><div class='hunk'>@@ -6004,9 +6468,8 @@ static int btrfs_trim_free_extents(struct btrfs_device *device, u64 *trimmed)</div><div class='ctx'> 		ret = btrfs_issue_discard(device-&gt;bdev, start, len,</div><div class='ctx'> 					  &amp;bytes);</div><div class='ctx'> 		if (!ret)</div><div class='del'>-			set_extent_bits(&amp;device-&gt;alloc_state, start,</div><div class='del'>-					start + bytes - 1,</div><div class='del'>-					CHUNK_TRIMMED);</div><div class='add'>+			btrfs_set_extent_bit(&amp;device-&gt;alloc_state, start,</div><div class='add'>+					     start + bytes - 1, CHUNK_TRIMMED, NULL);</div><div class='ctx'> 		mutex_unlock(&amp;fs_info-&gt;chunk_mutex);</div><div class='ctx'> </div><div class='ctx'> 		if (ret)</div><div class='hunk'>@@ -6015,7 +6478,7 @@ static int btrfs_trim_free_extents(struct btrfs_device *device, u64 *trimmed)</div><div class='ctx'> 		start += len;</div><div class='ctx'> 		*trimmed += bytes;</div><div class='ctx'> </div><div class='del'>-		if (fatal_signal_pending(current)) {</div><div class='add'>+		if (btrfs_trim_interrupted()) {</div><div class='ctx'> 			ret = -ERESTARTSYS;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -6051,6 +6514,9 @@ int btrfs_trim_fs(struct btrfs_fs_info *fs_info, struct fstrim_range *range)</div><div class='ctx'> 	int dev_ret = 0;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='add'>+	if (range-&gt;start == U64_MAX)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Check range overflow if range-&gt;len is set.</div><div class='ctx'> 	 * The default range-&gt;len is U64_MAX.</div><div class='hunk'>@@ -6071,13 +6537,7 @@ int btrfs_trim_fs(struct btrfs_fs_info *fs_info, struct fstrim_range *range)</div><div class='ctx'> </div><div class='ctx'> 		if (end - start &gt;= range-&gt;minlen) {</div><div class='ctx'> 			if (!btrfs_block_group_done(cache)) {</div><div class='del'>-				ret = btrfs_cache_block_group(cache, 0);</div><div class='del'>-				if (ret) {</div><div class='del'>-					bg_failed++;</div><div class='del'>-					bg_ret = ret;</div><div class='del'>-					continue;</div><div class='del'>-				}</div><div class='del'>-				ret = btrfs_wait_block_group_cache_done(cache);</div><div class='add'>+				ret = btrfs_cache_block_group(cache, true);</div><div class='ctx'> 				if (ret) {</div><div class='ctx'> 					bg_failed++;</div><div class='ctx'> 					bg_ret = ret;</div><div class='hunk'>@@ -6110,13 +6570,13 @@ int btrfs_trim_fs(struct btrfs_fs_info *fs_info, struct fstrim_range *range)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		ret = btrfs_trim_free_extents(device, &amp;group_trimmed);</div><div class='add'>+</div><div class='add'>+		trimmed += group_trimmed;</div><div class='ctx'> 		if (ret) {</div><div class='ctx'> 			dev_failed++;</div><div class='ctx'> 			dev_ret = ret;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-</div><div class='del'>-		trimmed += group_trimmed;</div><div class='ctx'> 	}</div><div class='ctx'> 	mutex_unlock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='ctx'> </div><div class='head'>diff --git a/fs/btrfs/extent-tree.h b/fs/btrfs/extent-tree.h<br/>new file mode 100644<br/>index 000000000000..71bb8109c969<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/extent-tree.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/extent-tree.h</a></div><div class='hunk'>@@ -0,0 +1,167 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+</div><div class='add'>+#ifndef BTRFS_EXTENT_TREE_H</div><div class='add'>+#define BTRFS_EXTENT_TREE_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+#include "block-group.h"</div><div class='add'>+#include "locking.h"</div><div class='add'>+</div><div class='add'>+struct extent_buffer;</div><div class='add'>+struct btrfs_free_cluster;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+struct btrfs_root;</div><div class='add'>+struct btrfs_path;</div><div class='add'>+struct btrfs_ref;</div><div class='add'>+struct btrfs_disk_key;</div><div class='add'>+struct btrfs_delayed_ref_head;</div><div class='add'>+struct btrfs_delayed_ref_root;</div><div class='add'>+struct btrfs_extent_inline_ref;</div><div class='add'>+</div><div class='add'>+enum btrfs_extent_allocation_policy {</div><div class='add'>+	BTRFS_EXTENT_ALLOC_CLUSTERED,</div><div class='add'>+	BTRFS_EXTENT_ALLOC_ZONED,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct find_free_extent_ctl {</div><div class='add'>+	/* Basic allocation info */</div><div class='add'>+	u64 ram_bytes;</div><div class='add'>+	u64 num_bytes;</div><div class='add'>+	u64 min_alloc_size;</div><div class='add'>+	u64 empty_size;</div><div class='add'>+	u64 flags;</div><div class='add'>+</div><div class='add'>+	/* Where to start the search inside the bg */</div><div class='add'>+	u64 search_start;</div><div class='add'>+</div><div class='add'>+	/* For clustered allocation */</div><div class='add'>+	u64 empty_cluster;</div><div class='add'>+	struct btrfs_free_cluster *last_ptr;</div><div class='add'>+	bool use_cluster;</div><div class='add'>+</div><div class='add'>+	bool delalloc;</div><div class='add'>+	bool have_caching_bg;</div><div class='add'>+	bool orig_have_caching_bg;</div><div class='add'>+</div><div class='add'>+	/* Allocation is called for tree-log */</div><div class='add'>+	bool for_treelog;</div><div class='add'>+</div><div class='add'>+	/* Allocation is called for data relocation */</div><div class='add'>+	bool for_data_reloc;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Set to true if we're retrying the allocation on this block group</div><div class='add'>+	 * after waiting for caching progress, this is so that we retry only</div><div class='add'>+	 * once before moving on to another block group.</div><div class='add'>+	 */</div><div class='add'>+	bool retry_uncached;</div><div class='add'>+</div><div class='add'>+	/* Whether or not the allocator is currently following a hint. */</div><div class='add'>+	bool hinted;</div><div class='add'>+</div><div class='add'>+	/* RAID index, converted from flags */</div><div class='add'>+	int index;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Current loop number, check find_free_extent_update_loop() for details</div><div class='add'>+	 */</div><div class='add'>+	int loop;</div><div class='add'>+</div><div class='add'>+	/* If current block group is cached */</div><div class='add'>+	int cached;</div><div class='add'>+</div><div class='add'>+	/* Max contiguous hole found */</div><div class='add'>+	u64 max_extent_size;</div><div class='add'>+</div><div class='add'>+	/* Total free space from free space cache, not always contiguous */</div><div class='add'>+	u64 total_free_space;</div><div class='add'>+</div><div class='add'>+	/* Found result */</div><div class='add'>+	u64 found_offset;</div><div class='add'>+</div><div class='add'>+	/* Hint where to start looking for an empty space */</div><div class='add'>+	u64 hint_byte;</div><div class='add'>+</div><div class='add'>+	/* Allocation policy */</div><div class='add'>+	enum btrfs_extent_allocation_policy policy;</div><div class='add'>+</div><div class='add'>+	/* Size class of block groups to prefer in early loops */</div><div class='add'>+	enum btrfs_block_group_size_class size_class;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+enum btrfs_inline_ref_type {</div><div class='add'>+	BTRFS_REF_TYPE_INVALID,</div><div class='add'>+	BTRFS_REF_TYPE_BLOCK,</div><div class='add'>+	BTRFS_REF_TYPE_DATA,</div><div class='add'>+	BTRFS_REF_TYPE_ANY,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+int btrfs_get_extent_inline_ref_type(const struct extent_buffer *eb,</div><div class='add'>+				     const struct btrfs_extent_inline_ref *iref,</div><div class='add'>+				     enum btrfs_inline_ref_type is_data);</div><div class='add'>+u64 hash_extent_data_ref(u64 root_objectid, u64 owner, u64 offset);</div><div class='add'>+</div><div class='add'>+int btrfs_run_delayed_refs(struct btrfs_trans_handle *trans, u64 min_bytes);</div><div class='add'>+u64 btrfs_cleanup_ref_head_accounting(struct btrfs_fs_info *fs_info,</div><div class='add'>+				  struct btrfs_delayed_ref_root *delayed_refs,</div><div class='add'>+				  struct btrfs_delayed_ref_head *head);</div><div class='add'>+int btrfs_lookup_data_extent(struct btrfs_fs_info *fs_info, u64 start, u64 len);</div><div class='add'>+int btrfs_lookup_extent_info(struct btrfs_trans_handle *trans,</div><div class='add'>+			     struct btrfs_fs_info *fs_info, u64 bytenr,</div><div class='add'>+			     u64 offset, int metadata, u64 *refs, u64 *flags,</div><div class='add'>+			     u64 *owner_root);</div><div class='add'>+int btrfs_pin_extent(struct btrfs_trans_handle *trans, u64 bytenr, u64 num);</div><div class='add'>+int btrfs_pin_extent_for_log_replay(struct btrfs_trans_handle *trans,</div><div class='add'>+				    const struct extent_buffer *eb);</div><div class='add'>+int btrfs_exclude_logged_extents(struct extent_buffer *eb);</div><div class='add'>+int btrfs_cross_ref_exist(struct btrfs_inode *inode, u64 offset, u64 bytenr,</div><div class='add'>+			  struct btrfs_path *path);</div><div class='add'>+struct extent_buffer *btrfs_alloc_tree_block(struct btrfs_trans_handle *trans,</div><div class='add'>+					     struct btrfs_root *root,</div><div class='add'>+					     u64 parent, u64 root_objectid,</div><div class='add'>+					     const struct btrfs_disk_key *key,</div><div class='add'>+					     int level, u64 hint,</div><div class='add'>+					     u64 empty_size,</div><div class='add'>+					     u64 reloc_src_root,</div><div class='add'>+					     enum btrfs_lock_nesting nest);</div><div class='add'>+int btrfs_free_tree_block(struct btrfs_trans_handle *trans,</div><div class='add'>+			  u64 root_id,</div><div class='add'>+			  struct extent_buffer *buf,</div><div class='add'>+			  u64 parent, int last_ref);</div><div class='add'>+int btrfs_alloc_reserved_file_extent(struct btrfs_trans_handle *trans,</div><div class='add'>+				     struct btrfs_root *root, u64 owner,</div><div class='add'>+				     u64 offset, u64 ram_bytes,</div><div class='add'>+				     struct btrfs_key *ins);</div><div class='add'>+int btrfs_alloc_logged_file_extent(struct btrfs_trans_handle *trans,</div><div class='add'>+				   u64 root_objectid, u64 owner, u64 offset,</div><div class='add'>+				   struct btrfs_key *ins);</div><div class='add'>+int btrfs_reserve_extent(struct btrfs_root *root, u64 ram_bytes, u64 num_bytes,</div><div class='add'>+			 u64 min_alloc_size, u64 empty_size, u64 hint_byte,</div><div class='add'>+			 struct btrfs_key *ins, bool is_data, bool delalloc);</div><div class='add'>+int btrfs_inc_ref(struct btrfs_trans_handle *trans, struct btrfs_root *root,</div><div class='add'>+		  struct extent_buffer *buf, bool full_backref);</div><div class='add'>+int btrfs_dec_ref(struct btrfs_trans_handle *trans, struct btrfs_root *root,</div><div class='add'>+		  struct extent_buffer *buf, bool full_backref);</div><div class='add'>+int btrfs_set_disk_extent_flags(struct btrfs_trans_handle *trans,</div><div class='add'>+				struct extent_buffer *eb, u64 flags);</div><div class='add'>+int btrfs_free_extent(struct btrfs_trans_handle *trans, struct btrfs_ref *ref);</div><div class='add'>+</div><div class='add'>+u64 btrfs_get_extent_owner_root(struct btrfs_fs_info *fs_info,</div><div class='add'>+				struct extent_buffer *leaf, int slot);</div><div class='add'>+int btrfs_free_reserved_extent(struct btrfs_fs_info *fs_info, u64 start, u64 len,</div><div class='add'>+			       bool is_delalloc);</div><div class='add'>+int btrfs_pin_reserved_extent(struct btrfs_trans_handle *trans,</div><div class='add'>+			      const struct extent_buffer *eb);</div><div class='add'>+int btrfs_finish_extent_commit(struct btrfs_trans_handle *trans);</div><div class='add'>+int btrfs_inc_extent_ref(struct btrfs_trans_handle *trans, struct btrfs_ref *generic_ref);</div><div class='add'>+int btrfs_drop_snapshot(struct btrfs_root *root, bool update_ref, bool for_reloc);</div><div class='add'>+int btrfs_drop_subtree(struct btrfs_trans_handle *trans,</div><div class='add'>+			struct btrfs_root *root,</div><div class='add'>+			struct extent_buffer *node,</div><div class='add'>+			struct extent_buffer *parent);</div><div class='add'>+void btrfs_error_unpin_extent_range(struct btrfs_fs_info *fs_info, u64 start, u64 end);</div><div class='add'>+int btrfs_discard_extent(struct btrfs_fs_info *fs_info, u64 bytenr,</div><div class='add'>+			 u64 num_bytes, u64 *actual_bytes);</div><div class='add'>+int btrfs_trim_fs(struct btrfs_fs_info *fs_info, struct fstrim_range *range);</div><div class='add'>+</div><div class='add'>+#endif</div><div class='head'>diff --git a/fs/btrfs/extent_io.c b/fs/btrfs/extent_io.c<br/>index 4e03a6d3aa32..629fd5af4286 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/extent_io.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/extent_io.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/extent_io.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/extent_io.c</a></div><div class='hunk'>@@ -6,62 +6,56 @@</div><div class='ctx'> #include &lt;linux/mm.h&gt;</div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='ctx'> #include &lt;linux/page-flags.h&gt;</div><div class='add'>+#include &lt;linux/sched/mm.h&gt;</div><div class='ctx'> #include &lt;linux/spinlock.h&gt;</div><div class='ctx'> #include &lt;linux/blkdev.h&gt;</div><div class='ctx'> #include &lt;linux/swap.h&gt;</div><div class='ctx'> #include &lt;linux/writeback.h&gt;</div><div class='ctx'> #include &lt;linux/pagevec.h&gt;</div><div class='ctx'> #include &lt;linux/prefetch.h&gt;</div><div class='del'>-#include &lt;linux/cleancache.h&gt;</div><div class='ctx'> #include &lt;linux/fsverity.h&gt;</div><div class='del'>-#include "misc.h"</div><div class='ctx'> #include "extent_io.h"</div><div class='ctx'> #include "extent-io-tree.h"</div><div class='ctx'> #include "extent_map.h"</div><div class='ctx'> #include "ctree.h"</div><div class='ctx'> #include "btrfs_inode.h"</div><div class='del'>-#include "volumes.h"</div><div class='del'>-#include "check-integrity.h"</div><div class='add'>+#include "bio.h"</div><div class='ctx'> #include "locking.h"</div><div class='del'>-#include "rcu-string.h"</div><div class='ctx'> #include "backref.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='ctx'> #include "subpage.h"</div><div class='ctx'> #include "zoned.h"</div><div class='ctx'> #include "block-group.h"</div><div class='add'>+#include "compression.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "file-item.h"</div><div class='add'>+#include "file.h"</div><div class='add'>+#include "dev-replace.h"</div><div class='add'>+#include "super.h"</div><div class='add'>+#include "transaction.h"</div><div class='ctx'> </div><div class='del'>-static struct kmem_cache *extent_state_cache;</div><div class='ctx'> static struct kmem_cache *extent_buffer_cache;</div><div class='del'>-static struct bio_set btrfs_bioset;</div><div class='del'>-</div><div class='del'>-static inline bool extent_state_in_tree(const struct extent_state *state)</div><div class='del'>-{</div><div class='del'>-	return !RB_EMPTY_NODE(&amp;state-&gt;rb_node);</div><div class='del'>-}</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_BTRFS_DEBUG</div><div class='del'>-static LIST_HEAD(states);</div><div class='del'>-static DEFINE_SPINLOCK(leak_lock);</div><div class='del'>-</div><div class='del'>-static inline void btrfs_leak_debug_add(spinlock_t *lock,</div><div class='del'>-					struct list_head *new,</div><div class='del'>-					struct list_head *head)</div><div class='add'>+static inline void btrfs_leak_debug_add_eb(struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> </div><div class='del'>-	spin_lock_irqsave(lock, flags);</div><div class='del'>-	list_add(new, head);</div><div class='del'>-	spin_unlock_irqrestore(lock, flags);</div><div class='add'>+	spin_lock_irqsave(&amp;fs_info-&gt;eb_leak_lock, flags);</div><div class='add'>+	list_add(&amp;eb-&gt;leak_list, &amp;fs_info-&gt;allocated_ebs);</div><div class='add'>+	spin_unlock_irqrestore(&amp;fs_info-&gt;eb_leak_lock, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void btrfs_leak_debug_del(spinlock_t *lock,</div><div class='del'>-					struct list_head *entry)</div><div class='add'>+static inline void btrfs_leak_debug_del_eb(struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> </div><div class='del'>-	spin_lock_irqsave(lock, flags);</div><div class='del'>-	list_del(entry);</div><div class='del'>-	spin_unlock_irqrestore(lock, flags);</div><div class='add'>+	spin_lock_irqsave(&amp;fs_info-&gt;eb_leak_lock, flags);</div><div class='add'>+	list_del(&amp;eb-&gt;leak_list);</div><div class='add'>+	spin_unlock_irqrestore(&amp;fs_info-&gt;eb_leak_lock, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_extent_buffer_leak_debug_check(struct btrfs_fs_info *fs_info)</div><div class='hunk'>@@ -76,1753 +70,179 @@ void btrfs_extent_buffer_leak_debug_check(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	if (!fs_info-&gt;allocated_ebs.next)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='add'>+	WARN_ON(!list_empty(&amp;fs_info-&gt;allocated_ebs));</div><div class='ctx'> 	spin_lock_irqsave(&amp;fs_info-&gt;eb_leak_lock, flags);</div><div class='ctx'> 	while (!list_empty(&amp;fs_info-&gt;allocated_ebs)) {</div><div class='ctx'> 		eb = list_first_entry(&amp;fs_info-&gt;allocated_ebs,</div><div class='ctx'> 				      struct extent_buffer, leak_list);</div><div class='del'>-		pr_err(</div><div class='del'>-	"BTRFS: buffer leak start %llu len %lu refs %d bflags %lu owner %llu\n",</div><div class='del'>-		       eb-&gt;start, eb-&gt;len, atomic_read(&amp;eb-&gt;refs), eb-&gt;bflags,</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+		       "buffer leak start %llu len %u refs %d bflags %lu owner %llu",</div><div class='add'>+		       eb-&gt;start, eb-&gt;len, refcount_read(&amp;eb-&gt;refs), eb-&gt;bflags,</div><div class='ctx'> 		       btrfs_header_owner(eb));</div><div class='ctx'> 		list_del(&amp;eb-&gt;leak_list);</div><div class='add'>+		WARN_ON_ONCE(1);</div><div class='ctx'> 		kmem_cache_free(extent_buffer_cache, eb);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock_irqrestore(&amp;fs_info-&gt;eb_leak_lock, flags);</div><div class='ctx'> }</div><div class='del'>-</div><div class='del'>-static inline void btrfs_extent_state_leak_debug_check(void)</div><div class='del'>-{</div><div class='del'>-	struct extent_state *state;</div><div class='del'>-</div><div class='del'>-	while (!list_empty(&amp;states)) {</div><div class='del'>-		state = list_entry(states.next, struct extent_state, leak_list);</div><div class='del'>-		pr_err("BTRFS: state leak: start %llu end %llu state %u in tree %d refs %d\n",</div><div class='del'>-		       state-&gt;start, state-&gt;end, state-&gt;state,</div><div class='del'>-		       extent_state_in_tree(state),</div><div class='del'>-		       refcount_read(&amp;state-&gt;refs));</div><div class='del'>-		list_del(&amp;state-&gt;leak_list);</div><div class='del'>-		kmem_cache_free(extent_state_cache, state);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#define btrfs_debug_check_extent_io_range(tree, start, end)		\</div><div class='del'>-	__btrfs_debug_check_extent_io_range(__func__, (tree), (start), (end))</div><div class='del'>-static inline void __btrfs_debug_check_extent_io_range(const char *caller,</div><div class='del'>-		struct extent_io_tree *tree, u64 start, u64 end)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = tree-&gt;private_data;</div><div class='del'>-	u64 isize;</div><div class='del'>-</div><div class='del'>-	if (!inode || !is_data_inode(inode))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	isize = i_size_read(inode);</div><div class='del'>-	if (end &gt;= PAGE_SIZE &amp;&amp; (end % 2) == 0 &amp;&amp; end != isize - 1) {</div><div class='del'>-		btrfs_debug_rl(BTRFS_I(inode)-&gt;root-&gt;fs_info,</div><div class='del'>-		    "%s: ino %llu isize %llu odd range [%llu,%llu]",</div><div class='del'>-			caller, btrfs_ino(BTRFS_I(inode)), isize, start, end);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='ctx'> #else</div><div class='del'>-#define btrfs_leak_debug_add(lock, new, head)	do {} while (0)</div><div class='del'>-#define btrfs_leak_debug_del(lock, entry)	do {} while (0)</div><div class='del'>-#define btrfs_extent_state_leak_debug_check()	do {} while (0)</div><div class='del'>-#define btrfs_debug_check_extent_io_range(c, s, e)	do {} while (0)</div><div class='add'>+#define btrfs_leak_debug_add_eb(eb)			do {} while (0)</div><div class='add'>+#define btrfs_leak_debug_del_eb(eb)			do {} while (0)</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-struct tree_entry {</div><div class='del'>-	u64 start;</div><div class='del'>-	u64 end;</div><div class='del'>-	struct rb_node rb_node;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct extent_page_data {</div><div class='del'>-	struct btrfs_bio_ctrl bio_ctrl;</div><div class='del'>-	/* tells writepage not to lock the state bits for this range</div><div class='del'>-	 * it still does the unlocking</div><div class='del'>-	 */</div><div class='del'>-	unsigned int extent_locked:1;</div><div class='del'>-</div><div class='del'>-	/* tells the submit_bio code to use REQ_SYNC */</div><div class='del'>-	unsigned int sync_io:1;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static int add_extent_changeset(struct extent_state *state, u32 bits,</div><div class='del'>-				 struct extent_changeset *changeset,</div><div class='del'>-				 int set)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (!changeset)</div><div class='del'>-		return 0;</div><div class='del'>-	if (set &amp;&amp; (state-&gt;state &amp; bits) == bits)</div><div class='del'>-		return 0;</div><div class='del'>-	if (!set &amp;&amp; (state-&gt;state &amp; bits) == 0)</div><div class='del'>-		return 0;</div><div class='del'>-	changeset-&gt;bytes_changed += state-&gt;end - state-&gt;start + 1;</div><div class='del'>-	ret = ulist_add(&amp;changeset-&gt;range_changed, state-&gt;start, state-&gt;end,</div><div class='del'>-			GFP_ATOMIC);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int __must_check submit_one_bio(struct bio *bio, int mirror_num,</div><div class='del'>-				unsigned long bio_flags)</div><div class='del'>-{</div><div class='del'>-	blk_status_t ret = 0;</div><div class='del'>-	struct extent_io_tree *tree = bio-&gt;bi_private;</div><div class='del'>-</div><div class='del'>-	bio-&gt;bi_private = NULL;</div><div class='del'>-</div><div class='del'>-	/* Caller should ensure the bio has at least some range added */</div><div class='del'>-	ASSERT(bio-&gt;bi_iter.bi_size);</div><div class='del'>-	if (is_data_inode(tree-&gt;private_data))</div><div class='del'>-		ret = btrfs_submit_data_bio(tree-&gt;private_data, bio, mirror_num,</div><div class='del'>-					    bio_flags);</div><div class='del'>-	else</div><div class='del'>-		ret = btrfs_submit_metadata_bio(tree-&gt;private_data, bio,</div><div class='del'>-						mirror_num, bio_flags);</div><div class='del'>-</div><div class='del'>-	return blk_status_to_errno(ret);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* Cleanup unsubmitted bios */</div><div class='del'>-static void end_write_bio(struct extent_page_data *epd, int ret)</div><div class='del'>-{</div><div class='del'>-	struct bio *bio = epd-&gt;bio_ctrl.bio;</div><div class='del'>-</div><div class='del'>-	if (bio) {</div><div class='del'>-		bio-&gt;bi_status = errno_to_blk_status(ret);</div><div class='del'>-		bio_endio(bio);</div><div class='del'>-		epd-&gt;bio_ctrl.bio = NULL;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Submit bio from extent page data via submit_one_bio</div><div class='del'>- *</div><div class='del'>- * Return 0 if everything is OK.</div><div class='del'>- * Return &lt;0 for error.</div><div class='del'>- */</div><div class='del'>-static int __must_check flush_write_bio(struct extent_page_data *epd)</div><div class='del'>-{</div><div class='del'>-	int ret = 0;</div><div class='del'>-	struct bio *bio = epd-&gt;bio_ctrl.bio;</div><div class='del'>-</div><div class='del'>-	if (bio) {</div><div class='del'>-		ret = submit_one_bio(bio, 0, 0);</div><div class='del'>-		/*</div><div class='del'>-		 * Clean up of epd-&gt;bio is handled by its endio function.</div><div class='del'>-		 * And endio is either triggered by successful bio execution</div><div class='del'>-		 * or the error handler of submit bio hook.</div><div class='del'>-		 * So at this point, no matter what happened, we don't need</div><div class='del'>-		 * to clean up epd-&gt;bio.</div><div class='del'>-		 */</div><div class='del'>-		epd-&gt;bio_ctrl.bio = NULL;</div><div class='del'>-	}</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int __init extent_state_cache_init(void)</div><div class='del'>-{</div><div class='del'>-	extent_state_cache = kmem_cache_create("btrfs_extent_state",</div><div class='del'>-			sizeof(struct extent_state), 0,</div><div class='del'>-			SLAB_MEM_SPREAD, NULL);</div><div class='del'>-	if (!extent_state_cache)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int __init extent_io_init(void)</div><div class='del'>-{</div><div class='del'>-	extent_buffer_cache = kmem_cache_create("btrfs_extent_buffer",</div><div class='del'>-			sizeof(struct extent_buffer), 0,</div><div class='del'>-			SLAB_MEM_SPREAD, NULL);</div><div class='del'>-	if (!extent_buffer_cache)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	if (bioset_init(&amp;btrfs_bioset, BIO_POOL_SIZE,</div><div class='del'>-			offsetof(struct btrfs_bio, bio),</div><div class='del'>-			BIOSET_NEED_BVECS))</div><div class='del'>-		goto free_buffer_cache;</div><div class='del'>-</div><div class='del'>-	if (bioset_integrity_create(&amp;btrfs_bioset, BIO_POOL_SIZE))</div><div class='del'>-		goto free_bioset;</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-free_bioset:</div><div class='del'>-	bioset_exit(&amp;btrfs_bioset);</div><div class='del'>-</div><div class='del'>-free_buffer_cache:</div><div class='del'>-	kmem_cache_destroy(extent_buffer_cache);</div><div class='del'>-	extent_buffer_cache = NULL;</div><div class='del'>-	return -ENOMEM;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void __cold extent_state_cache_exit(void)</div><div class='del'>-{</div><div class='del'>-	btrfs_extent_state_leak_debug_check();</div><div class='del'>-	kmem_cache_destroy(extent_state_cache);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void __cold extent_io_exit(void)</div><div class='del'>-{</div><div class='del'>-	/*</div><div class='del'>-	 * Make sure all delayed rcu free are flushed before we</div><div class='del'>-	 * destroy caches.</div><div class='del'>-	 */</div><div class='del'>-	rcu_barrier();</div><div class='del'>-	kmem_cache_destroy(extent_buffer_cache);</div><div class='del'>-	bioset_exit(&amp;btrfs_bioset);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * For the file_extent_tree, we want to hold the inode lock when we lookup and</div><div class='del'>- * update the disk_i_size, but lockdep will complain because our io_tree we hold</div><div class='del'>- * the tree lock and get the inode lock when setting delalloc.  These two things</div><div class='del'>- * are unrelated, so make a class for the file_extent_tree so we don't get the</div><div class='del'>- * two locking patterns mixed up.</div><div class='del'>- */</div><div class='del'>-static struct lock_class_key file_extent_tree_class;</div><div class='del'>-</div><div class='del'>-void extent_io_tree_init(struct btrfs_fs_info *fs_info,</div><div class='del'>-			 struct extent_io_tree *tree, unsigned int owner,</div><div class='del'>-			 void *private_data)</div><div class='del'>-{</div><div class='del'>-	tree-&gt;fs_info = fs_info;</div><div class='del'>-	tree-&gt;state = RB_ROOT;</div><div class='del'>-	tree-&gt;dirty_bytes = 0;</div><div class='del'>-	spin_lock_init(&amp;tree-&gt;lock);</div><div class='del'>-	tree-&gt;private_data = private_data;</div><div class='del'>-	tree-&gt;owner = owner;</div><div class='del'>-	if (owner == IO_TREE_INODE_FILE_EXTENT)</div><div class='del'>-		lockdep_set_class(&amp;tree-&gt;lock, &amp;file_extent_tree_class);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void extent_io_tree_release(struct extent_io_tree *tree)</div><div class='del'>-{</div><div class='del'>-	spin_lock(&amp;tree-&gt;lock);</div><div class='del'>-	/*</div><div class='del'>-	 * Do a single barrier for the waitqueue_active check here, the state</div><div class='del'>-	 * of the waitqueue should not change once extent_io_tree_release is</div><div class='del'>-	 * called.</div><div class='del'>-	 */</div><div class='del'>-	smp_mb();</div><div class='del'>-	while (!RB_EMPTY_ROOT(&amp;tree-&gt;state)) {</div><div class='del'>-		struct rb_node *node;</div><div class='del'>-		struct extent_state *state;</div><div class='del'>-</div><div class='del'>-		node = rb_first(&amp;tree-&gt;state);</div><div class='del'>-		state = rb_entry(node, struct extent_state, rb_node);</div><div class='del'>-		rb_erase(&amp;state-&gt;rb_node, &amp;tree-&gt;state);</div><div class='del'>-		RB_CLEAR_NODE(&amp;state-&gt;rb_node);</div><div class='del'>-		/*</div><div class='del'>-		 * btree io trees aren't supposed to have tasks waiting for</div><div class='del'>-		 * changes in the flags of extent states ever.</div><div class='del'>-		 */</div><div class='del'>-		ASSERT(!waitqueue_active(&amp;state-&gt;wq));</div><div class='del'>-		free_extent_state(state);</div><div class='del'>-</div><div class='del'>-		cond_resched_lock(&amp;tree-&gt;lock);</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;tree-&gt;lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct extent_state *alloc_extent_state(gfp_t mask)</div><div class='del'>-{</div><div class='del'>-	struct extent_state *state;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * The given mask might be not appropriate for the slab allocator,</div><div class='del'>-	 * drop the unsupported bits</div><div class='del'>-	 */</div><div class='del'>-	mask &amp;= ~(__GFP_DMA32|__GFP_HIGHMEM);</div><div class='del'>-	state = kmem_cache_alloc(extent_state_cache, mask);</div><div class='del'>-	if (!state)</div><div class='del'>-		return state;</div><div class='del'>-	state-&gt;state = 0;</div><div class='del'>-	state-&gt;failrec = NULL;</div><div class='del'>-	RB_CLEAR_NODE(&amp;state-&gt;rb_node);</div><div class='del'>-	btrfs_leak_debug_add(&amp;leak_lock, &amp;state-&gt;leak_list, &amp;states);</div><div class='del'>-	refcount_set(&amp;state-&gt;refs, 1);</div><div class='del'>-	init_waitqueue_head(&amp;state-&gt;wq);</div><div class='del'>-	trace_alloc_extent_state(state, mask, _RET_IP_);</div><div class='del'>-	return state;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void free_extent_state(struct extent_state *state)</div><div class='del'>-{</div><div class='del'>-	if (!state)</div><div class='del'>-		return;</div><div class='del'>-	if (refcount_dec_and_test(&amp;state-&gt;refs)) {</div><div class='del'>-		WARN_ON(extent_state_in_tree(state));</div><div class='del'>-		btrfs_leak_debug_del(&amp;leak_lock, &amp;state-&gt;leak_list);</div><div class='del'>-		trace_free_extent_state(state, _RET_IP_);</div><div class='del'>-		kmem_cache_free(extent_state_cache, state);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct rb_node *tree_insert(struct rb_root *root,</div><div class='del'>-				   struct rb_node *search_start,</div><div class='del'>-				   u64 offset,</div><div class='del'>-				   struct rb_node *node,</div><div class='del'>-				   struct rb_node ***p_in,</div><div class='del'>-				   struct rb_node **parent_in)</div><div class='del'>-{</div><div class='del'>-	struct rb_node **p;</div><div class='del'>-	struct rb_node *parent = NULL;</div><div class='del'>-	struct tree_entry *entry;</div><div class='del'>-</div><div class='del'>-	if (p_in &amp;&amp; parent_in) {</div><div class='del'>-		p = *p_in;</div><div class='del'>-		parent = *parent_in;</div><div class='del'>-		goto do_insert;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	p = search_start ? &amp;search_start : &amp;root-&gt;rb_node;</div><div class='del'>-	while (*p) {</div><div class='del'>-		parent = *p;</div><div class='del'>-		entry = rb_entry(parent, struct tree_entry, rb_node);</div><div class='del'>-</div><div class='del'>-		if (offset &lt; entry-&gt;start)</div><div class='del'>-			p = &amp;(*p)-&gt;rb_left;</div><div class='del'>-		else if (offset &gt; entry-&gt;end)</div><div class='del'>-			p = &amp;(*p)-&gt;rb_right;</div><div class='del'>-		else</div><div class='del'>-			return parent;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-do_insert:</div><div class='del'>-	rb_link_node(node, parent, p);</div><div class='del'>-	rb_insert_color(node, root);</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * Search @tree for an entry that contains @offset. Such entry would have</div><div class='del'>- * entry-&gt;start &lt;= offset &amp;&amp; entry-&gt;end &gt;= offset.</div><div class='del'>- *</div><div class='del'>- * @tree:       the tree to search</div><div class='del'>- * @offset:     offset that should fall within an entry in @tree</div><div class='del'>- * @next_ret:   pointer to the first entry whose range ends after @offset</div><div class='del'>- * @prev_ret:   pointer to the first entry whose range begins before @offset</div><div class='del'>- * @p_ret:      pointer where new node should be anchored (used when inserting an</div><div class='del'>- *	        entry in the tree)</div><div class='del'>- * @parent_ret: points to entry which would have been the parent of the entry,</div><div class='del'>- *               containing @offset</div><div class='del'>- *</div><div class='del'>- * This function returns a pointer to the entry that contains @offset byte</div><div class='del'>- * address. If no such entry exists, then NULL is returned and the other</div><div class='del'>- * pointer arguments to the function are filled, otherwise the found entry is</div><div class='del'>- * returned and other pointers are left untouched.</div><div class='del'>- */</div><div class='del'>-static struct rb_node *__etree_search(struct extent_io_tree *tree, u64 offset,</div><div class='del'>-				      struct rb_node **next_ret,</div><div class='del'>-				      struct rb_node **prev_ret,</div><div class='del'>-				      struct rb_node ***p_ret,</div><div class='del'>-				      struct rb_node **parent_ret)</div><div class='del'>-{</div><div class='del'>-	struct rb_root *root = &amp;tree-&gt;state;</div><div class='del'>-	struct rb_node **n = &amp;root-&gt;rb_node;</div><div class='del'>-	struct rb_node *prev = NULL;</div><div class='del'>-	struct rb_node *orig_prev = NULL;</div><div class='del'>-	struct tree_entry *entry;</div><div class='del'>-	struct tree_entry *prev_entry = NULL;</div><div class='del'>-</div><div class='del'>-	while (*n) {</div><div class='del'>-		prev = *n;</div><div class='del'>-		entry = rb_entry(prev, struct tree_entry, rb_node);</div><div class='del'>-		prev_entry = entry;</div><div class='del'>-</div><div class='del'>-		if (offset &lt; entry-&gt;start)</div><div class='del'>-			n = &amp;(*n)-&gt;rb_left;</div><div class='del'>-		else if (offset &gt; entry-&gt;end)</div><div class='del'>-			n = &amp;(*n)-&gt;rb_right;</div><div class='del'>-		else</div><div class='del'>-			return *n;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (p_ret)</div><div class='del'>-		*p_ret = n;</div><div class='del'>-	if (parent_ret)</div><div class='del'>-		*parent_ret = prev;</div><div class='del'>-</div><div class='del'>-	if (next_ret) {</div><div class='del'>-		orig_prev = prev;</div><div class='del'>-		while (prev &amp;&amp; offset &gt; prev_entry-&gt;end) {</div><div class='del'>-			prev = rb_next(prev);</div><div class='del'>-			prev_entry = rb_entry(prev, struct tree_entry, rb_node);</div><div class='del'>-		}</div><div class='del'>-		*next_ret = prev;</div><div class='del'>-		prev = orig_prev;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (prev_ret) {</div><div class='del'>-		prev_entry = rb_entry(prev, struct tree_entry, rb_node);</div><div class='del'>-		while (prev &amp;&amp; offset &lt; prev_entry-&gt;start) {</div><div class='del'>-			prev = rb_prev(prev);</div><div class='del'>-			prev_entry = rb_entry(prev, struct tree_entry, rb_node);</div><div class='del'>-		}</div><div class='del'>-		*prev_ret = prev;</div><div class='del'>-	}</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline struct rb_node *</div><div class='del'>-tree_search_for_insert(struct extent_io_tree *tree,</div><div class='del'>-		       u64 offset,</div><div class='del'>-		       struct rb_node ***p_ret,</div><div class='del'>-		       struct rb_node **parent_ret)</div><div class='del'>-{</div><div class='del'>-	struct rb_node *next= NULL;</div><div class='del'>-	struct rb_node *ret;</div><div class='del'>-</div><div class='del'>-	ret = __etree_search(tree, offset, &amp;next, NULL, p_ret, parent_ret);</div><div class='del'>-	if (!ret)</div><div class='del'>-		return next;</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline struct rb_node *tree_search(struct extent_io_tree *tree,</div><div class='del'>-					  u64 offset)</div><div class='del'>-{</div><div class='del'>-	return tree_search_for_insert(tree, offset, NULL, NULL);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * utility function to look for merge candidates inside a given range.</div><div class='del'>- * Any extents with matching state are merged together into a single</div><div class='del'>- * extent in the tree.  Extents with EXTENT_IO in their state field</div><div class='del'>- * are not merged because the end_io handlers need to be able to do</div><div class='del'>- * operations on them without sleeping (or doing allocations/splits).</div><div class='del'>- *</div><div class='del'>- * This should be called with the tree lock held.</div><div class='del'>- */</div><div class='del'>-static void merge_state(struct extent_io_tree *tree,</div><div class='del'>-		        struct extent_state *state)</div><div class='del'>-{</div><div class='del'>-	struct extent_state *other;</div><div class='del'>-	struct rb_node *other_node;</div><div class='del'>-</div><div class='del'>-	if (state-&gt;state &amp; (EXTENT_LOCKED | EXTENT_BOUNDARY))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	other_node = rb_prev(&amp;state-&gt;rb_node);</div><div class='del'>-	if (other_node) {</div><div class='del'>-		other = rb_entry(other_node, struct extent_state, rb_node);</div><div class='del'>-		if (other-&gt;end == state-&gt;start - 1 &amp;&amp;</div><div class='del'>-		    other-&gt;state == state-&gt;state) {</div><div class='del'>-			if (tree-&gt;private_data &amp;&amp;</div><div class='del'>-			    is_data_inode(tree-&gt;private_data))</div><div class='del'>-				btrfs_merge_delalloc_extent(tree-&gt;private_data,</div><div class='del'>-							    state, other);</div><div class='del'>-			state-&gt;start = other-&gt;start;</div><div class='del'>-			rb_erase(&amp;other-&gt;rb_node, &amp;tree-&gt;state);</div><div class='del'>-			RB_CLEAR_NODE(&amp;other-&gt;rb_node);</div><div class='del'>-			free_extent_state(other);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	other_node = rb_next(&amp;state-&gt;rb_node);</div><div class='del'>-	if (other_node) {</div><div class='del'>-		other = rb_entry(other_node, struct extent_state, rb_node);</div><div class='del'>-		if (other-&gt;start == state-&gt;end + 1 &amp;&amp;</div><div class='del'>-		    other-&gt;state == state-&gt;state) {</div><div class='del'>-			if (tree-&gt;private_data &amp;&amp;</div><div class='del'>-			    is_data_inode(tree-&gt;private_data))</div><div class='del'>-				btrfs_merge_delalloc_extent(tree-&gt;private_data,</div><div class='del'>-							    state, other);</div><div class='del'>-			state-&gt;end = other-&gt;end;</div><div class='del'>-			rb_erase(&amp;other-&gt;rb_node, &amp;tree-&gt;state);</div><div class='del'>-			RB_CLEAR_NODE(&amp;other-&gt;rb_node);</div><div class='del'>-			free_extent_state(other);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void set_state_bits(struct extent_io_tree *tree,</div><div class='del'>-			   struct extent_state *state, u32 *bits,</div><div class='del'>-			   struct extent_changeset *changeset);</div><div class='del'>-</div><div class='ctx'> /*</div><div class='del'>- * insert an extent_state struct into the tree.  'bits' are set on the</div><div class='del'>- * struct before it is inserted.</div><div class='del'>- *</div><div class='del'>- * This may return -EEXIST if the extent is already there, in which case the</div><div class='del'>- * state struct is freed.</div><div class='del'>- *</div><div class='del'>- * The tree lock is not taken internally.  This is a utility function and</div><div class='del'>- * probably isn't what you want to call (see set/clear_extent_bit).</div><div class='add'>+ * Structure to record info about the bio being assembled, and other info like</div><div class='add'>+ * how many bytes are there before stripe/ordered extent boundary.</div><div class='ctx'>  */</div><div class='del'>-static int insert_state(struct extent_io_tree *tree,</div><div class='del'>-			struct extent_state *state, u64 start, u64 end,</div><div class='del'>-			struct rb_node ***p,</div><div class='del'>-			struct rb_node **parent,</div><div class='del'>-			u32 *bits, struct extent_changeset *changeset)</div><div class='del'>-{</div><div class='del'>-	struct rb_node *node;</div><div class='del'>-</div><div class='del'>-	if (end &lt; start) {</div><div class='del'>-		btrfs_err(tree-&gt;fs_info,</div><div class='del'>-			"insert state: end &lt; start %llu %llu", end, start);</div><div class='del'>-		WARN_ON(1);</div><div class='del'>-	}</div><div class='del'>-	state-&gt;start = start;</div><div class='del'>-	state-&gt;end = end;</div><div class='del'>-</div><div class='del'>-	set_state_bits(tree, state, bits, changeset);</div><div class='del'>-</div><div class='del'>-	node = tree_insert(&amp;tree-&gt;state, NULL, end, &amp;state-&gt;rb_node, p, parent);</div><div class='del'>-	if (node) {</div><div class='del'>-		struct extent_state *found;</div><div class='del'>-		found = rb_entry(node, struct extent_state, rb_node);</div><div class='del'>-		btrfs_err(tree-&gt;fs_info,</div><div class='del'>-		       "found node %llu %llu on insert of %llu %llu",</div><div class='del'>-		       found-&gt;start, found-&gt;end, start, end);</div><div class='del'>-		return -EEXIST;</div><div class='del'>-	}</div><div class='del'>-	merge_state(tree, state);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * split a given extent state struct in two, inserting the preallocated</div><div class='del'>- * struct 'prealloc' as the newly created second half.  'split' indicates an</div><div class='del'>- * offset inside 'orig' where it should be split.</div><div class='del'>- *</div><div class='del'>- * Before calling,</div><div class='del'>- * the tree has 'orig' at [orig-&gt;start, orig-&gt;end].  After calling, there</div><div class='del'>- * are two extent state structs in the tree:</div><div class='del'>- * prealloc: [orig-&gt;start, split - 1]</div><div class='del'>- * orig: [ split, orig-&gt;end ]</div><div class='del'>- *</div><div class='del'>- * The tree locks are not taken by this function. They need to be held</div><div class='del'>- * by the caller.</div><div class='del'>- */</div><div class='del'>-static int split_state(struct extent_io_tree *tree, struct extent_state *orig,</div><div class='del'>-		       struct extent_state *prealloc, u64 split)</div><div class='del'>-{</div><div class='del'>-	struct rb_node *node;</div><div class='del'>-</div><div class='del'>-	if (tree-&gt;private_data &amp;&amp; is_data_inode(tree-&gt;private_data))</div><div class='del'>-		btrfs_split_delalloc_extent(tree-&gt;private_data, orig, split);</div><div class='del'>-</div><div class='del'>-	prealloc-&gt;start = orig-&gt;start;</div><div class='del'>-	prealloc-&gt;end = split - 1;</div><div class='del'>-	prealloc-&gt;state = orig-&gt;state;</div><div class='del'>-	orig-&gt;start = split;</div><div class='del'>-</div><div class='del'>-	node = tree_insert(&amp;tree-&gt;state, &amp;orig-&gt;rb_node, prealloc-&gt;end,</div><div class='del'>-			   &amp;prealloc-&gt;rb_node, NULL, NULL);</div><div class='del'>-	if (node) {</div><div class='del'>-		free_extent_state(prealloc);</div><div class='del'>-		return -EEXIST;</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct extent_state *next_state(struct extent_state *state)</div><div class='del'>-{</div><div class='del'>-	struct rb_node *next = rb_next(&amp;state-&gt;rb_node);</div><div class='del'>-	if (next)</div><div class='del'>-		return rb_entry(next, struct extent_state, rb_node);</div><div class='del'>-	else</div><div class='del'>-		return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * utility function to clear some bits in an extent state struct.</div><div class='del'>- * it will optionally wake up anyone waiting on this state (wake == 1).</div><div class='del'>- *</div><div class='del'>- * If no bits are set on the state struct after clearing things, the</div><div class='del'>- * struct is freed and removed from the tree</div><div class='del'>- */</div><div class='del'>-static struct extent_state *clear_state_bit(struct extent_io_tree *tree,</div><div class='del'>-					    struct extent_state *state,</div><div class='del'>-					    u32 *bits, int wake,</div><div class='del'>-					    struct extent_changeset *changeset)</div><div class='del'>-{</div><div class='del'>-	struct extent_state *next;</div><div class='del'>-	u32 bits_to_clear = *bits &amp; ~EXTENT_CTLBITS;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if ((bits_to_clear &amp; EXTENT_DIRTY) &amp;&amp; (state-&gt;state &amp; EXTENT_DIRTY)) {</div><div class='del'>-		u64 range = state-&gt;end - state-&gt;start + 1;</div><div class='del'>-		WARN_ON(range &gt; tree-&gt;dirty_bytes);</div><div class='del'>-		tree-&gt;dirty_bytes -= range;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (tree-&gt;private_data &amp;&amp; is_data_inode(tree-&gt;private_data))</div><div class='del'>-		btrfs_clear_delalloc_extent(tree-&gt;private_data, state, bits);</div><div class='del'>-</div><div class='del'>-	ret = add_extent_changeset(state, bits_to_clear, changeset, 0);</div><div class='del'>-	BUG_ON(ret &lt; 0);</div><div class='del'>-	state-&gt;state &amp;= ~bits_to_clear;</div><div class='del'>-	if (wake)</div><div class='del'>-		wake_up(&amp;state-&gt;wq);</div><div class='del'>-	if (state-&gt;state == 0) {</div><div class='del'>-		next = next_state(state);</div><div class='del'>-		if (extent_state_in_tree(state)) {</div><div class='del'>-			rb_erase(&amp;state-&gt;rb_node, &amp;tree-&gt;state);</div><div class='del'>-			RB_CLEAR_NODE(&amp;state-&gt;rb_node);</div><div class='del'>-			free_extent_state(state);</div><div class='del'>-		} else {</div><div class='del'>-			WARN_ON(1);</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-		merge_state(tree, state);</div><div class='del'>-		next = next_state(state);</div><div class='del'>-	}</div><div class='del'>-	return next;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct extent_state *</div><div class='del'>-alloc_extent_state_atomic(struct extent_state *prealloc)</div><div class='del'>-{</div><div class='del'>-	if (!prealloc)</div><div class='del'>-		prealloc = alloc_extent_state(GFP_ATOMIC);</div><div class='del'>-</div><div class='del'>-	return prealloc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void extent_io_tree_panic(struct extent_io_tree *tree, int err)</div><div class='del'>-{</div><div class='del'>-	btrfs_panic(tree-&gt;fs_info, err,</div><div class='del'>-	"locking error: extent tree was modified by another thread while locked");</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * clear some bits on a range in the tree.  This may require splitting</div><div class='del'>- * or inserting elements in the tree, so the gfp mask is used to</div><div class='del'>- * indicate which allocations or sleeping are allowed.</div><div class='del'>- *</div><div class='del'>- * pass 'wake' == 1 to kick any sleepers, and 'delete' == 1 to remove</div><div class='del'>- * the given range from the tree regardless of state (ie for truncate).</div><div class='del'>- *</div><div class='del'>- * the range [start, end] is inclusive.</div><div class='del'>- *</div><div class='del'>- * This takes the tree lock, and returns 0 on success and &lt; 0 on error.</div><div class='del'>- */</div><div class='del'>-int __clear_extent_bit(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='del'>-		       u32 bits, int wake, int delete,</div><div class='del'>-		       struct extent_state **cached_state,</div><div class='del'>-		       gfp_t mask, struct extent_changeset *changeset)</div><div class='del'>-{</div><div class='del'>-	struct extent_state *state;</div><div class='del'>-	struct extent_state *cached;</div><div class='del'>-	struct extent_state *prealloc = NULL;</div><div class='del'>-	struct rb_node *node;</div><div class='del'>-	u64 last_end;</div><div class='del'>-	int err;</div><div class='del'>-	int clear = 0;</div><div class='del'>-</div><div class='del'>-	btrfs_debug_check_extent_io_range(tree, start, end);</div><div class='del'>-	trace_btrfs_clear_extent_bit(tree, start, end - start + 1, bits);</div><div class='del'>-</div><div class='del'>-	if (bits &amp; EXTENT_DELALLOC)</div><div class='del'>-		bits |= EXTENT_NORESERVE;</div><div class='del'>-</div><div class='del'>-	if (delete)</div><div class='del'>-		bits |= ~EXTENT_CTLBITS;</div><div class='del'>-</div><div class='del'>-	if (bits &amp; (EXTENT_LOCKED | EXTENT_BOUNDARY))</div><div class='del'>-		clear = 1;</div><div class='del'>-again:</div><div class='del'>-	if (!prealloc &amp;&amp; gfpflags_allow_blocking(mask)) {</div><div class='del'>-		/*</div><div class='del'>-		 * Don't care for allocation failure here because we might end</div><div class='del'>-		 * up not needing the pre-allocated extent state at all, which</div><div class='del'>-		 * is the case if we only have in the tree extent states that</div><div class='del'>-		 * cover our input range and don't cover too any other range.</div><div class='del'>-		 * If we end up needing a new extent state we allocate it later.</div><div class='del'>-		 */</div><div class='del'>-		prealloc = alloc_extent_state(mask);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;tree-&gt;lock);</div><div class='del'>-	if (cached_state) {</div><div class='del'>-		cached = *cached_state;</div><div class='del'>-</div><div class='del'>-		if (clear) {</div><div class='del'>-			*cached_state = NULL;</div><div class='del'>-			cached_state = NULL;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (cached &amp;&amp; extent_state_in_tree(cached) &amp;&amp;</div><div class='del'>-		    cached-&gt;start &lt;= start &amp;&amp; cached-&gt;end &gt; start) {</div><div class='del'>-			if (clear)</div><div class='del'>-				refcount_dec(&amp;cached-&gt;refs);</div><div class='del'>-			state = cached;</div><div class='del'>-			goto hit_next;</div><div class='del'>-		}</div><div class='del'>-		if (clear)</div><div class='del'>-			free_extent_state(cached);</div><div class='del'>-	}</div><div class='del'>-	/*</div><div class='del'>-	 * this search will find the extents that end after</div><div class='del'>-	 * our range starts</div><div class='del'>-	 */</div><div class='del'>-	node = tree_search(tree, start);</div><div class='del'>-	if (!node)</div><div class='del'>-		goto out;</div><div class='del'>-	state = rb_entry(node, struct extent_state, rb_node);</div><div class='del'>-hit_next:</div><div class='del'>-	if (state-&gt;start &gt; end)</div><div class='del'>-		goto out;</div><div class='del'>-	WARN_ON(state-&gt;end &lt; start);</div><div class='del'>-	last_end = state-&gt;end;</div><div class='del'>-</div><div class='del'>-	/* the state doesn't have the wanted bits, go ahead */</div><div class='del'>-	if (!(state-&gt;state &amp; bits)) {</div><div class='del'>-		state = next_state(state);</div><div class='del'>-		goto next;</div><div class='del'>-	}</div><div class='del'>-</div><div class='add'>+struct btrfs_bio_ctrl {</div><div class='add'>+	struct btrfs_bio *bbio;</div><div class='add'>+	/* Last byte contained in bbio + 1 . */</div><div class='add'>+	loff_t next_file_offset;</div><div class='add'>+	enum btrfs_compression_type compress_type;</div><div class='add'>+	u32 len_to_oe_boundary;</div><div class='add'>+	blk_opf_t opf;</div><div class='ctx'> 	/*</div><div class='del'>-	 *     | ---- desired range ---- |</div><div class='del'>-	 *  | state | or</div><div class='del'>-	 *  | ------------- state -------------- |</div><div class='add'>+	 * For data read bios, we attempt to optimize csum lookups if the extent</div><div class='add'>+	 * generation is older than the current one. To make this possible, we</div><div class='add'>+	 * need to track the maximum generation of an extent in a bio_ctrl to</div><div class='add'>+	 * make the decision when submitting the bio.</div><div class='ctx'> 	 *</div><div class='del'>-	 * We need to split the extent we found, and may flip</div><div class='del'>-	 * bits on second half.</div><div class='add'>+	 * The pattern between do_readpage(), submit_one_bio() and</div><div class='add'>+	 * submit_extent_folio() is quite subtle, so tracking this is tricky.</div><div class='ctx'> 	 *</div><div class='del'>-	 * If the extent we found extends past our range, we</div><div class='del'>-	 * just split and search again.  It'll get split again</div><div class='del'>-	 * the next time though.</div><div class='add'>+	 * As we process extent E, we might submit a bio with existing built up</div><div class='add'>+	 * extents before adding E to a new bio, or we might just add E to the</div><div class='add'>+	 * bio. As a result, E's generation could apply to the current bio or</div><div class='add'>+	 * to the next one, so we need to be careful to update the bio_ctrl's</div><div class='add'>+	 * generation with E's only when we are sure E is added to bio_ctrl-&gt;bbio</div><div class='add'>+	 * in submit_extent_folio().</div><div class='ctx'> 	 *</div><div class='del'>-	 * If the extent we found is inside our range, we clear</div><div class='del'>-	 * the desired bit on it.</div><div class='add'>+	 * See the comment in btrfs_lookup_bio_sums() for more detail on the</div><div class='add'>+	 * need for this optimization.</div><div class='ctx'> 	 */</div><div class='add'>+	u64 generation;</div><div class='add'>+	btrfs_bio_end_io_t end_io_func;</div><div class='add'>+	struct writeback_control *wbc;</div><div class='ctx'> </div><div class='del'>-	if (state-&gt;start &lt; start) {</div><div class='del'>-		prealloc = alloc_extent_state_atomic(prealloc);</div><div class='del'>-		BUG_ON(!prealloc);</div><div class='del'>-		err = split_state(tree, state, prealloc, start);</div><div class='del'>-		if (err)</div><div class='del'>-			extent_io_tree_panic(tree, err);</div><div class='del'>-</div><div class='del'>-		prealloc = NULL;</div><div class='del'>-		if (err)</div><div class='del'>-			goto out;</div><div class='del'>-		if (state-&gt;end &lt;= end) {</div><div class='del'>-			state = clear_state_bit(tree, state, &amp;bits, wake,</div><div class='del'>-						changeset);</div><div class='del'>-			goto next;</div><div class='del'>-		}</div><div class='del'>-		goto search_again;</div><div class='del'>-	}</div><div class='ctx'> 	/*</div><div class='del'>-	 * | ---- desired range ---- |</div><div class='del'>-	 *                        | state |</div><div class='del'>-	 * We need to split the extent, and clear the bit</div><div class='del'>-	 * on the first half</div><div class='add'>+	 * The sectors of the page which are going to be submitted by</div><div class='add'>+	 * extent_writepage_io().</div><div class='add'>+	 * This is to avoid touching ranges covered by compression/inline.</div><div class='ctx'> 	 */</div><div class='del'>-	if (state-&gt;start &lt;= end &amp;&amp; state-&gt;end &gt; end) {</div><div class='del'>-		prealloc = alloc_extent_state_atomic(prealloc);</div><div class='del'>-		BUG_ON(!prealloc);</div><div class='del'>-		err = split_state(tree, state, prealloc, end + 1);</div><div class='del'>-		if (err)</div><div class='del'>-			extent_io_tree_panic(tree, err);</div><div class='del'>-</div><div class='del'>-		if (wake)</div><div class='del'>-			wake_up(&amp;state-&gt;wq);</div><div class='del'>-</div><div class='del'>-		clear_state_bit(tree, prealloc, &amp;bits, wake, changeset);</div><div class='del'>-</div><div class='del'>-		prealloc = NULL;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	state = clear_state_bit(tree, state, &amp;bits, wake, changeset);</div><div class='del'>-next:</div><div class='del'>-	if (last_end == (u64)-1)</div><div class='del'>-		goto out;</div><div class='del'>-	start = last_end + 1;</div><div class='del'>-	if (start &lt;= end &amp;&amp; state &amp;&amp; !need_resched())</div><div class='del'>-		goto hit_next;</div><div class='del'>-</div><div class='del'>-search_again:</div><div class='del'>-	if (start &gt; end)</div><div class='del'>-		goto out;</div><div class='del'>-	spin_unlock(&amp;tree-&gt;lock);</div><div class='del'>-	if (gfpflags_allow_blocking(mask))</div><div class='del'>-		cond_resched();</div><div class='del'>-	goto again;</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	spin_unlock(&amp;tree-&gt;lock);</div><div class='del'>-	if (prealloc)</div><div class='del'>-		free_extent_state(prealloc);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void wait_on_state(struct extent_io_tree *tree,</div><div class='del'>-			  struct extent_state *state)</div><div class='del'>-		__releases(tree-&gt;lock)</div><div class='del'>-		__acquires(tree-&gt;lock)</div><div class='del'>-{</div><div class='del'>-	DEFINE_WAIT(wait);</div><div class='del'>-	prepare_to_wait(&amp;state-&gt;wq, &amp;wait, TASK_UNINTERRUPTIBLE);</div><div class='del'>-	spin_unlock(&amp;tree-&gt;lock);</div><div class='del'>-	schedule();</div><div class='del'>-	spin_lock(&amp;tree-&gt;lock);</div><div class='del'>-	finish_wait(&amp;state-&gt;wq, &amp;wait);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * waits for one or more bits to clear on a range in the state tree.</div><div class='del'>- * The range [start, end] is inclusive.</div><div class='del'>- * The tree lock is taken by this function</div><div class='del'>- */</div><div class='del'>-static void wait_extent_bit(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='del'>-			    u32 bits)</div><div class='del'>-{</div><div class='del'>-	struct extent_state *state;</div><div class='del'>-	struct rb_node *node;</div><div class='del'>-</div><div class='del'>-	btrfs_debug_check_extent_io_range(tree, start, end);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;tree-&gt;lock);</div><div class='del'>-again:</div><div class='del'>-	while (1) {</div><div class='del'>-		/*</div><div class='del'>-		 * this search will find all the extents that end after</div><div class='del'>-		 * our range starts</div><div class='del'>-		 */</div><div class='del'>-		node = tree_search(tree, start);</div><div class='del'>-process_node:</div><div class='del'>-		if (!node)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		state = rb_entry(node, struct extent_state, rb_node);</div><div class='del'>-</div><div class='del'>-		if (state-&gt;start &gt; end)</div><div class='del'>-			goto out;</div><div class='del'>-</div><div class='del'>-		if (state-&gt;state &amp; bits) {</div><div class='del'>-			start = state-&gt;start;</div><div class='del'>-			refcount_inc(&amp;state-&gt;refs);</div><div class='del'>-			wait_on_state(tree, state);</div><div class='del'>-			free_extent_state(state);</div><div class='del'>-			goto again;</div><div class='del'>-		}</div><div class='del'>-		start = state-&gt;end + 1;</div><div class='del'>-</div><div class='del'>-		if (start &gt; end)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		if (!cond_resched_lock(&amp;tree-&gt;lock)) {</div><div class='del'>-			node = rb_next(node);</div><div class='del'>-			goto process_node;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-out:</div><div class='del'>-	spin_unlock(&amp;tree-&gt;lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void set_state_bits(struct extent_io_tree *tree,</div><div class='del'>-			   struct extent_state *state,</div><div class='del'>-			   u32 *bits, struct extent_changeset *changeset)</div><div class='del'>-{</div><div class='del'>-	u32 bits_to_set = *bits &amp; ~EXTENT_CTLBITS;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (tree-&gt;private_data &amp;&amp; is_data_inode(tree-&gt;private_data))</div><div class='del'>-		btrfs_set_delalloc_extent(tree-&gt;private_data, state, bits);</div><div class='del'>-</div><div class='del'>-	if ((bits_to_set &amp; EXTENT_DIRTY) &amp;&amp; !(state-&gt;state &amp; EXTENT_DIRTY)) {</div><div class='del'>-		u64 range = state-&gt;end - state-&gt;start + 1;</div><div class='del'>-		tree-&gt;dirty_bytes += range;</div><div class='del'>-	}</div><div class='del'>-	ret = add_extent_changeset(state, bits_to_set, changeset, 1);</div><div class='del'>-	BUG_ON(ret &lt; 0);</div><div class='del'>-	state-&gt;state |= bits_to_set;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void cache_state_if_flags(struct extent_state *state,</div><div class='del'>-				 struct extent_state **cached_ptr,</div><div class='del'>-				 unsigned flags)</div><div class='del'>-{</div><div class='del'>-	if (cached_ptr &amp;&amp; !(*cached_ptr)) {</div><div class='del'>-		if (!flags || (state-&gt;state &amp; flags)) {</div><div class='del'>-			*cached_ptr = state;</div><div class='del'>-			refcount_inc(&amp;state-&gt;refs);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void cache_state(struct extent_state *state,</div><div class='del'>-			struct extent_state **cached_ptr)</div><div class='del'>-{</div><div class='del'>-	return cache_state_if_flags(state, cached_ptr,</div><div class='del'>-				    EXTENT_LOCKED | EXTENT_BOUNDARY);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * set some bits on a range in the tree.  This may require allocations or</div><div class='del'>- * sleeping, so the gfp mask is used to indicate what is allowed.</div><div class='del'>- *</div><div class='del'>- * If any of the exclusive bits are set, this will fail with -EEXIST if some</div><div class='del'>- * part of the range already has the desired bits set.  The start of the</div><div class='del'>- * existing range is returned in failed_start in this case.</div><div class='del'>- *</div><div class='del'>- * [start, end] is inclusive This takes the tree lock.</div><div class='del'>- */</div><div class='del'>-int set_extent_bit(struct extent_io_tree *tree, u64 start, u64 end, u32 bits,</div><div class='del'>-		   u32 exclusive_bits, u64 *failed_start,</div><div class='del'>-		   struct extent_state **cached_state, gfp_t mask,</div><div class='del'>-		   struct extent_changeset *changeset)</div><div class='del'>-{</div><div class='del'>-	struct extent_state *state;</div><div class='del'>-	struct extent_state *prealloc = NULL;</div><div class='del'>-	struct rb_node *node;</div><div class='del'>-	struct rb_node **p;</div><div class='del'>-	struct rb_node *parent;</div><div class='del'>-	int err = 0;</div><div class='del'>-	u64 last_start;</div><div class='del'>-	u64 last_end;</div><div class='del'>-</div><div class='del'>-	btrfs_debug_check_extent_io_range(tree, start, end);</div><div class='del'>-	trace_btrfs_set_extent_bit(tree, start, end - start + 1, bits);</div><div class='del'>-</div><div class='del'>-	if (exclusive_bits)</div><div class='del'>-		ASSERT(failed_start);</div><div class='del'>-	else</div><div class='del'>-		ASSERT(failed_start == NULL);</div><div class='del'>-again:</div><div class='del'>-	if (!prealloc &amp;&amp; gfpflags_allow_blocking(mask)) {</div><div class='del'>-		/*</div><div class='del'>-		 * Don't care for allocation failure here because we might end</div><div class='del'>-		 * up not needing the pre-allocated extent state at all, which</div><div class='del'>-		 * is the case if we only have in the tree extent states that</div><div class='del'>-		 * cover our input range and don't cover too any other range.</div><div class='del'>-		 * If we end up needing a new extent state we allocate it later.</div><div class='del'>-		 */</div><div class='del'>-		prealloc = alloc_extent_state(mask);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;tree-&gt;lock);</div><div class='del'>-	if (cached_state &amp;&amp; *cached_state) {</div><div class='del'>-		state = *cached_state;</div><div class='del'>-		if (state-&gt;start &lt;= start &amp;&amp; state-&gt;end &gt; start &amp;&amp;</div><div class='del'>-		    extent_state_in_tree(state)) {</div><div class='del'>-			node = &amp;state-&gt;rb_node;</div><div class='del'>-			goto hit_next;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	/*</div><div class='del'>-	 * this search will find all the extents that end after</div><div class='del'>-	 * our range starts.</div><div class='del'>-	 */</div><div class='del'>-	node = tree_search_for_insert(tree, start, &amp;p, &amp;parent);</div><div class='del'>-	if (!node) {</div><div class='del'>-		prealloc = alloc_extent_state_atomic(prealloc);</div><div class='del'>-		BUG_ON(!prealloc);</div><div class='del'>-		err = insert_state(tree, prealloc, start, end,</div><div class='del'>-				   &amp;p, &amp;parent, &amp;bits, changeset);</div><div class='del'>-		if (err)</div><div class='del'>-			extent_io_tree_panic(tree, err);</div><div class='del'>-</div><div class='del'>-		cache_state(prealloc, cached_state);</div><div class='del'>-		prealloc = NULL;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	state = rb_entry(node, struct extent_state, rb_node);</div><div class='del'>-hit_next:</div><div class='del'>-	last_start = state-&gt;start;</div><div class='del'>-	last_end = state-&gt;end;</div><div class='add'>+	unsigned long submit_bitmap;</div><div class='add'>+	struct readahead_control *ractl;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * | ---- desired range ---- |</div><div class='del'>-	 * | state |</div><div class='add'>+	 * The start offset of the last used extent map by a read operation.</div><div class='ctx'> 	 *</div><div class='del'>-	 * Just lock what we found and keep going</div><div class='del'>-	 */</div><div class='del'>-	if (state-&gt;start == start &amp;&amp; state-&gt;end &lt;= end) {</div><div class='del'>-		if (state-&gt;state &amp; exclusive_bits) {</div><div class='del'>-			*failed_start = state-&gt;start;</div><div class='del'>-			err = -EEXIST;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		set_state_bits(tree, state, &amp;bits, changeset);</div><div class='del'>-		cache_state(state, cached_state);</div><div class='del'>-		merge_state(tree, state);</div><div class='del'>-		if (last_end == (u64)-1)</div><div class='del'>-			goto out;</div><div class='del'>-		start = last_end + 1;</div><div class='del'>-		state = next_state(state);</div><div class='del'>-		if (start &lt; end &amp;&amp; state &amp;&amp; state-&gt;start == start &amp;&amp;</div><div class='del'>-		    !need_resched())</div><div class='del'>-			goto hit_next;</div><div class='del'>-		goto search_again;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 *     | ---- desired range ---- |</div><div class='del'>-	 * | state |</div><div class='del'>-	 *   or</div><div class='del'>-	 * | ------------- state -------------- |</div><div class='add'>+	 * This is for proper compressed read merge.</div><div class='add'>+	 * U64_MAX means we are starting the read and have made no progress yet.</div><div class='ctx'> 	 *</div><div class='del'>-	 * We need to split the extent we found, and may flip bits on</div><div class='del'>-	 * second half.</div><div class='add'>+	 * The current btrfs_bio_is_contig() only uses disk_bytenr as</div><div class='add'>+	 * the condition to check if the read can be merged with previous</div><div class='add'>+	 * bio, which is not correct. E.g. two file extents pointing to the</div><div class='add'>+	 * same extent but with different offset.</div><div class='ctx'> 	 *</div><div class='del'>-	 * If the extent we found extends past our</div><div class='del'>-	 * range, we just split and search again.  It'll get split</div><div class='del'>-	 * again the next time though.</div><div class='del'>-	 *</div><div class='del'>-	 * If the extent we found is inside our range, we set the</div><div class='del'>-	 * desired bit on it.</div><div class='add'>+	 * So here we need to do extra checks to only merge reads that are</div><div class='add'>+	 * covered by the same extent map.</div><div class='add'>+	 * Just extent_map::start will be enough, as they are unique</div><div class='add'>+	 * inside the same inode.</div><div class='ctx'> 	 */</div><div class='del'>-	if (state-&gt;start &lt; start) {</div><div class='del'>-		if (state-&gt;state &amp; exclusive_bits) {</div><div class='del'>-			*failed_start = start;</div><div class='del'>-			err = -EEXIST;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * If this extent already has all the bits we want set, then</div><div class='del'>-		 * skip it, not necessary to split it or do anything with it.</div><div class='del'>-		 */</div><div class='del'>-		if ((state-&gt;state &amp; bits) == bits) {</div><div class='del'>-			start = state-&gt;end + 1;</div><div class='del'>-			cache_state(state, cached_state);</div><div class='del'>-			goto search_again;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		prealloc = alloc_extent_state_atomic(prealloc);</div><div class='del'>-		BUG_ON(!prealloc);</div><div class='del'>-		err = split_state(tree, state, prealloc, start);</div><div class='del'>-		if (err)</div><div class='del'>-			extent_io_tree_panic(tree, err);</div><div class='del'>-</div><div class='del'>-		prealloc = NULL;</div><div class='del'>-		if (err)</div><div class='del'>-			goto out;</div><div class='del'>-		if (state-&gt;end &lt;= end) {</div><div class='del'>-			set_state_bits(tree, state, &amp;bits, changeset);</div><div class='del'>-			cache_state(state, cached_state);</div><div class='del'>-			merge_state(tree, state);</div><div class='del'>-			if (last_end == (u64)-1)</div><div class='del'>-				goto out;</div><div class='del'>-			start = last_end + 1;</div><div class='del'>-			state = next_state(state);</div><div class='del'>-			if (start &lt; end &amp;&amp; state &amp;&amp; state-&gt;start == start &amp;&amp;</div><div class='del'>-			    !need_resched())</div><div class='del'>-				goto hit_next;</div><div class='del'>-		}</div><div class='del'>-		goto search_again;</div><div class='del'>-	}</div><div class='del'>-	/*</div><div class='del'>-	 * | ---- desired range ---- |</div><div class='del'>-	 *     | state | or               | state |</div><div class='del'>-	 *</div><div class='del'>-	 * There's a hole, we need to insert something in it and</div><div class='del'>-	 * ignore the extent we found.</div><div class='del'>-	 */</div><div class='del'>-	if (state-&gt;start &gt; start) {</div><div class='del'>-		u64 this_end;</div><div class='del'>-		if (end &lt; last_start)</div><div class='del'>-			this_end = end;</div><div class='del'>-		else</div><div class='del'>-			this_end = last_start - 1;</div><div class='del'>-</div><div class='del'>-		prealloc = alloc_extent_state_atomic(prealloc);</div><div class='del'>-		BUG_ON(!prealloc);</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Avoid to free 'prealloc' if it can be merged with</div><div class='del'>-		 * the later extent.</div><div class='del'>-		 */</div><div class='del'>-		err = insert_state(tree, prealloc, start, this_end,</div><div class='del'>-				   NULL, NULL, &amp;bits, changeset);</div><div class='del'>-		if (err)</div><div class='del'>-			extent_io_tree_panic(tree, err);</div><div class='del'>-</div><div class='del'>-		cache_state(prealloc, cached_state);</div><div class='del'>-		prealloc = NULL;</div><div class='del'>-		start = this_end + 1;</div><div class='del'>-		goto search_again;</div><div class='del'>-	}</div><div class='del'>-	/*</div><div class='del'>-	 * | ---- desired range ---- |</div><div class='del'>-	 *                        | state |</div><div class='del'>-	 * We need to split the extent, and set the bit</div><div class='del'>-	 * on the first half</div><div class='del'>-	 */</div><div class='del'>-	if (state-&gt;start &lt;= end &amp;&amp; state-&gt;end &gt; end) {</div><div class='del'>-		if (state-&gt;state &amp; exclusive_bits) {</div><div class='del'>-			*failed_start = start;</div><div class='del'>-			err = -EEXIST;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		prealloc = alloc_extent_state_atomic(prealloc);</div><div class='del'>-		BUG_ON(!prealloc);</div><div class='del'>-		err = split_state(tree, state, prealloc, end + 1);</div><div class='del'>-		if (err)</div><div class='del'>-			extent_io_tree_panic(tree, err);</div><div class='del'>-</div><div class='del'>-		set_state_bits(tree, prealloc, &amp;bits, changeset);</div><div class='del'>-		cache_state(prealloc, cached_state);</div><div class='del'>-		merge_state(tree, prealloc);</div><div class='del'>-		prealloc = NULL;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-search_again:</div><div class='del'>-	if (start &gt; end)</div><div class='del'>-		goto out;</div><div class='del'>-	spin_unlock(&amp;tree-&gt;lock);</div><div class='del'>-	if (gfpflags_allow_blocking(mask))</div><div class='del'>-		cond_resched();</div><div class='del'>-	goto again;</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	spin_unlock(&amp;tree-&gt;lock);</div><div class='del'>-	if (prealloc)</div><div class='del'>-		free_extent_state(prealloc);</div><div class='del'>-</div><div class='del'>-	return err;</div><div class='del'>-</div><div class='del'>-}</div><div class='add'>+	u64 last_em_start;</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * convert_extent_bit - convert all bits in a given range from one bit to</div><div class='del'>- * 			another</div><div class='del'>- * @tree:	the io tree to search</div><div class='del'>- * @start:	the start offset in bytes</div><div class='del'>- * @end:	the end offset in bytes (inclusive)</div><div class='del'>- * @bits:	the bits to set in this range</div><div class='del'>- * @clear_bits:	the bits to clear in this range</div><div class='del'>- * @cached_state:	state that we're going to cache</div><div class='del'>- *</div><div class='del'>- * This will go through and set bits for the given range.  If any states exist</div><div class='del'>- * already in this range they are set with the given bit and cleared of the</div><div class='del'>- * clear_bits.  This is only meant to be used by things that are mergeable, ie</div><div class='del'>- * converting from say DELALLOC to DIRTY.  This is not meant to be used with</div><div class='del'>- * boundary bits like LOCK.</div><div class='add'>+/*</div><div class='add'>+ * Helper to set the csum search commit root option for a bio_ctrl's bbio</div><div class='add'>+ * before submitting the bio.</div><div class='ctx'>  *</div><div class='del'>- * All allocations are done with GFP_NOFS.</div><div class='add'>+ * Only for use by submit_one_bio().</div><div class='ctx'>  */</div><div class='del'>-int convert_extent_bit(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='del'>-		       u32 bits, u32 clear_bits,</div><div class='del'>-		       struct extent_state **cached_state)</div><div class='add'>+static void bio_set_csum_search_commit_root(struct btrfs_bio_ctrl *bio_ctrl)</div><div class='ctx'> {</div><div class='del'>-	struct extent_state *state;</div><div class='del'>-	struct extent_state *prealloc = NULL;</div><div class='del'>-	struct rb_node *node;</div><div class='del'>-	struct rb_node **p;</div><div class='del'>-	struct rb_node *parent;</div><div class='del'>-	int err = 0;</div><div class='del'>-	u64 last_start;</div><div class='del'>-	u64 last_end;</div><div class='del'>-	bool first_iteration = true;</div><div class='del'>-</div><div class='del'>-	btrfs_debug_check_extent_io_range(tree, start, end);</div><div class='del'>-	trace_btrfs_convert_extent_bit(tree, start, end - start + 1, bits,</div><div class='del'>-				       clear_bits);</div><div class='del'>-</div><div class='del'>-again:</div><div class='del'>-	if (!prealloc) {</div><div class='del'>-		/*</div><div class='del'>-		 * Best effort, don't worry if extent state allocation fails</div><div class='del'>-		 * here for the first iteration. We might have a cached state</div><div class='del'>-		 * that matches exactly the target range, in which case no</div><div class='del'>-		 * extent state allocations are needed. We'll only know this</div><div class='del'>-		 * after locking the tree.</div><div class='del'>-		 */</div><div class='del'>-		prealloc = alloc_extent_state(GFP_NOFS);</div><div class='del'>-		if (!prealloc &amp;&amp; !first_iteration)</div><div class='del'>-			return -ENOMEM;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;tree-&gt;lock);</div><div class='del'>-	if (cached_state &amp;&amp; *cached_state) {</div><div class='del'>-		state = *cached_state;</div><div class='del'>-		if (state-&gt;start &lt;= start &amp;&amp; state-&gt;end &gt; start &amp;&amp;</div><div class='del'>-		    extent_state_in_tree(state)) {</div><div class='del'>-			node = &amp;state-&gt;rb_node;</div><div class='del'>-			goto hit_next;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	struct btrfs_bio *bbio = bio_ctrl-&gt;bbio;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * this search will find all the extents that end after</div><div class='del'>-	 * our range starts.</div><div class='del'>-	 */</div><div class='del'>-	node = tree_search_for_insert(tree, start, &amp;p, &amp;parent);</div><div class='del'>-	if (!node) {</div><div class='del'>-		prealloc = alloc_extent_state_atomic(prealloc);</div><div class='del'>-		if (!prealloc) {</div><div class='del'>-			err = -ENOMEM;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		err = insert_state(tree, prealloc, start, end,</div><div class='del'>-				   &amp;p, &amp;parent, &amp;bits, NULL);</div><div class='del'>-		if (err)</div><div class='del'>-			extent_io_tree_panic(tree, err);</div><div class='del'>-		cache_state(prealloc, cached_state);</div><div class='del'>-		prealloc = NULL;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	state = rb_entry(node, struct extent_state, rb_node);</div><div class='del'>-hit_next:</div><div class='del'>-	last_start = state-&gt;start;</div><div class='del'>-	last_end = state-&gt;end;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * | ---- desired range ---- |</div><div class='del'>-	 * | state |</div><div class='del'>-	 *</div><div class='del'>-	 * Just lock what we found and keep going</div><div class='del'>-	 */</div><div class='del'>-	if (state-&gt;start == start &amp;&amp; state-&gt;end &lt;= end) {</div><div class='del'>-		set_state_bits(tree, state, &amp;bits, NULL);</div><div class='del'>-		cache_state(state, cached_state);</div><div class='del'>-		state = clear_state_bit(tree, state, &amp;clear_bits, 0, NULL);</div><div class='del'>-		if (last_end == (u64)-1)</div><div class='del'>-			goto out;</div><div class='del'>-		start = last_end + 1;</div><div class='del'>-		if (start &lt; end &amp;&amp; state &amp;&amp; state-&gt;start == start &amp;&amp;</div><div class='del'>-		    !need_resched())</div><div class='del'>-			goto hit_next;</div><div class='del'>-		goto search_again;</div><div class='del'>-	}</div><div class='add'>+	ASSERT(bbio);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 *     | ---- desired range ---- |</div><div class='del'>-	 * | state |</div><div class='del'>-	 *   or</div><div class='del'>-	 * | ------------- state -------------- |</div><div class='del'>-	 *</div><div class='del'>-	 * We need to split the extent we found, and may flip bits on</div><div class='del'>-	 * second half.</div><div class='del'>-	 *</div><div class='del'>-	 * If the extent we found extends past our</div><div class='del'>-	 * range, we just split and search again.  It'll get split</div><div class='del'>-	 * again the next time though.</div><div class='del'>-	 *</div><div class='del'>-	 * If the extent we found is inside our range, we set the</div><div class='del'>-	 * desired bit on it.</div><div class='del'>-	 */</div><div class='del'>-	if (state-&gt;start &lt; start) {</div><div class='del'>-		prealloc = alloc_extent_state_atomic(prealloc);</div><div class='del'>-		if (!prealloc) {</div><div class='del'>-			err = -ENOMEM;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		err = split_state(tree, state, prealloc, start);</div><div class='del'>-		if (err)</div><div class='del'>-			extent_io_tree_panic(tree, err);</div><div class='del'>-		prealloc = NULL;</div><div class='del'>-		if (err)</div><div class='del'>-			goto out;</div><div class='del'>-		if (state-&gt;end &lt;= end) {</div><div class='del'>-			set_state_bits(tree, state, &amp;bits, NULL);</div><div class='del'>-			cache_state(state, cached_state);</div><div class='del'>-			state = clear_state_bit(tree, state, &amp;clear_bits, 0,</div><div class='del'>-						NULL);</div><div class='del'>-			if (last_end == (u64)-1)</div><div class='del'>-				goto out;</div><div class='del'>-			start = last_end + 1;</div><div class='del'>-			if (start &lt; end &amp;&amp; state &amp;&amp; state-&gt;start == start &amp;&amp;</div><div class='del'>-			    !need_resched())</div><div class='del'>-				goto hit_next;</div><div class='del'>-		}</div><div class='del'>-		goto search_again;</div><div class='del'>-	}</div><div class='del'>-	/*</div><div class='del'>-	 * | ---- desired range ---- |</div><div class='del'>-	 *     | state | or               | state |</div><div class='del'>-	 *</div><div class='del'>-	 * There's a hole, we need to insert something in it and</div><div class='del'>-	 * ignore the extent we found.</div><div class='del'>-	 */</div><div class='del'>-	if (state-&gt;start &gt; start) {</div><div class='del'>-		u64 this_end;</div><div class='del'>-		if (end &lt; last_start)</div><div class='del'>-			this_end = end;</div><div class='del'>-		else</div><div class='del'>-			this_end = last_start - 1;</div><div class='del'>-</div><div class='del'>-		prealloc = alloc_extent_state_atomic(prealloc);</div><div class='del'>-		if (!prealloc) {</div><div class='del'>-			err = -ENOMEM;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Avoid to free 'prealloc' if it can be merged with</div><div class='del'>-		 * the later extent.</div><div class='del'>-		 */</div><div class='del'>-		err = insert_state(tree, prealloc, start, this_end,</div><div class='del'>-				   NULL, NULL, &amp;bits, NULL);</div><div class='del'>-		if (err)</div><div class='del'>-			extent_io_tree_panic(tree, err);</div><div class='del'>-		cache_state(prealloc, cached_state);</div><div class='del'>-		prealloc = NULL;</div><div class='del'>-		start = this_end + 1;</div><div class='del'>-		goto search_again;</div><div class='del'>-	}</div><div class='del'>-	/*</div><div class='del'>-	 * | ---- desired range ---- |</div><div class='del'>-	 *                        | state |</div><div class='del'>-	 * We need to split the extent, and set the bit</div><div class='del'>-	 * on the first half</div><div class='del'>-	 */</div><div class='del'>-	if (state-&gt;start &lt;= end &amp;&amp; state-&gt;end &gt; end) {</div><div class='del'>-		prealloc = alloc_extent_state_atomic(prealloc);</div><div class='del'>-		if (!prealloc) {</div><div class='del'>-			err = -ENOMEM;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		err = split_state(tree, state, prealloc, end + 1);</div><div class='del'>-		if (err)</div><div class='del'>-			extent_io_tree_panic(tree, err);</div><div class='del'>-</div><div class='del'>-		set_state_bits(tree, prealloc, &amp;bits, NULL);</div><div class='del'>-		cache_state(prealloc, cached_state);</div><div class='del'>-		clear_state_bit(tree, prealloc, &amp;clear_bits, 0, NULL);</div><div class='del'>-		prealloc = NULL;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-search_again:</div><div class='del'>-	if (start &gt; end)</div><div class='del'>-		goto out;</div><div class='del'>-	spin_unlock(&amp;tree-&gt;lock);</div><div class='del'>-	cond_resched();</div><div class='del'>-	first_iteration = false;</div><div class='del'>-	goto again;</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	spin_unlock(&amp;tree-&gt;lock);</div><div class='del'>-	if (prealloc)</div><div class='del'>-		free_extent_state(prealloc);</div><div class='del'>-</div><div class='del'>-	return err;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* wrappers around set/clear extent bit */</div><div class='del'>-int set_record_extent_bits(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='del'>-			   u32 bits, struct extent_changeset *changeset)</div><div class='del'>-{</div><div class='del'>-	/*</div><div class='del'>-	 * We don't support EXTENT_LOCKED yet, as current changeset will</div><div class='del'>-	 * record any bits changed, so for EXTENT_LOCKED case, it will</div><div class='del'>-	 * either fail with -EEXIST or changeset will record the whole</div><div class='del'>-	 * range.</div><div class='del'>-	 */</div><div class='del'>-	BUG_ON(bits &amp; EXTENT_LOCKED);</div><div class='del'>-</div><div class='del'>-	return set_extent_bit(tree, start, end, bits, 0, NULL, NULL, GFP_NOFS,</div><div class='del'>-			      changeset);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int set_extent_bits_nowait(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='del'>-			   u32 bits)</div><div class='del'>-{</div><div class='del'>-	return set_extent_bit(tree, start, end, bits, 0, NULL, NULL,</div><div class='del'>-			      GFP_NOWAIT, NULL);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int clear_extent_bit(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='del'>-		     u32 bits, int wake, int delete,</div><div class='del'>-		     struct extent_state **cached)</div><div class='del'>-{</div><div class='del'>-	return __clear_extent_bit(tree, start, end, bits, wake, delete,</div><div class='del'>-				  cached, GFP_NOFS, NULL);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int clear_record_extent_bits(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='del'>-		u32 bits, struct extent_changeset *changeset)</div><div class='del'>-{</div><div class='del'>-	/*</div><div class='del'>-	 * Don't support EXTENT_LOCKED case, same reason as</div><div class='del'>-	 * set_record_extent_bits().</div><div class='del'>-	 */</div><div class='del'>-	BUG_ON(bits &amp; EXTENT_LOCKED);</div><div class='del'>-</div><div class='del'>-	return __clear_extent_bit(tree, start, end, bits, 0, 0, NULL, GFP_NOFS,</div><div class='del'>-				  changeset);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * either insert or lock state struct between start and end use mask to tell</div><div class='del'>- * us if waiting is desired.</div><div class='del'>- */</div><div class='del'>-int lock_extent_bits(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='del'>-		     struct extent_state **cached_state)</div><div class='del'>-{</div><div class='del'>-	int err;</div><div class='del'>-	u64 failed_start;</div><div class='del'>-</div><div class='del'>-	while (1) {</div><div class='del'>-		err = set_extent_bit(tree, start, end, EXTENT_LOCKED,</div><div class='del'>-				     EXTENT_LOCKED, &amp;failed_start,</div><div class='del'>-				     cached_state, GFP_NOFS, NULL);</div><div class='del'>-		if (err == -EEXIST) {</div><div class='del'>-			wait_extent_bit(tree, failed_start, end, EXTENT_LOCKED);</div><div class='del'>-			start = failed_start;</div><div class='del'>-		} else</div><div class='del'>-			break;</div><div class='del'>-		WARN_ON(start &gt; end);</div><div class='del'>-	}</div><div class='del'>-	return err;</div><div class='del'>-}</div><div class='add'>+	if (!(btrfs_op(&amp;bbio-&gt;bio) == BTRFS_MAP_READ &amp;&amp; is_data_inode(bbio-&gt;inode)))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-int try_lock_extent(struct extent_io_tree *tree, u64 start, u64 end)</div><div class='del'>-{</div><div class='del'>-	int err;</div><div class='del'>-	u64 failed_start;</div><div class='del'>-</div><div class='del'>-	err = set_extent_bit(tree, start, end, EXTENT_LOCKED, EXTENT_LOCKED,</div><div class='del'>-			     &amp;failed_start, NULL, GFP_NOFS, NULL);</div><div class='del'>-	if (err == -EEXIST) {</div><div class='del'>-		if (failed_start &gt; start)</div><div class='del'>-			clear_extent_bit(tree, start, failed_start - 1,</div><div class='del'>-					 EXTENT_LOCKED, 1, 0, NULL);</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-	return 1;</div><div class='add'>+	bio_ctrl-&gt;bbio-&gt;csum_search_commit_root =</div><div class='add'>+		(bio_ctrl-&gt;generation &amp;&amp;</div><div class='add'>+		 bio_ctrl-&gt;generation &lt; btrfs_get_fs_generation(bbio-&gt;inode-&gt;root-&gt;fs_info));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void extent_range_clear_dirty_for_io(struct inode *inode, u64 start, u64 end)</div><div class='add'>+static void submit_one_bio(struct btrfs_bio_ctrl *bio_ctrl)</div><div class='ctx'> {</div><div class='del'>-	unsigned long index = start &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	unsigned long end_index = end &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct btrfs_bio *bbio = bio_ctrl-&gt;bbio;</div><div class='ctx'> </div><div class='del'>-	while (index &lt;= end_index) {</div><div class='del'>-		page = find_get_page(inode-&gt;i_mapping, index);</div><div class='del'>-		BUG_ON(!page); /* Pages should be in the extent_io_tree */</div><div class='del'>-		clear_page_dirty_for_io(page);</div><div class='del'>-		put_page(page);</div><div class='del'>-		index++;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='add'>+	if (!bbio)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-void extent_range_redirty_for_io(struct inode *inode, u64 start, u64 end)</div><div class='del'>-{</div><div class='del'>-	unsigned long index = start &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	unsigned long end_index = end &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	struct page *page;</div><div class='add'>+	/* Caller should ensure the bio has at least some range added */</div><div class='add'>+	ASSERT(bbio-&gt;bio.bi_iter.bi_size);</div><div class='ctx'> </div><div class='del'>-	while (index &lt;= end_index) {</div><div class='del'>-		page = find_get_page(inode-&gt;i_mapping, index);</div><div class='del'>-		BUG_ON(!page); /* Pages should be in the extent_io_tree */</div><div class='del'>-		__set_page_dirty_nobuffers(page);</div><div class='del'>-		account_page_redirty(page);</div><div class='del'>-		put_page(page);</div><div class='del'>-		index++;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='add'>+	bio_set_csum_search_commit_root(bio_ctrl);</div><div class='ctx'> </div><div class='del'>-/* find the first state struct with 'bits' set after 'start', and</div><div class='del'>- * return it.  tree-&gt;lock must be held.  NULL will returned if</div><div class='del'>- * nothing was found after 'start'</div><div class='del'>- */</div><div class='del'>-static struct extent_state *</div><div class='del'>-find_first_extent_bit_state(struct extent_io_tree *tree, u64 start, u32 bits)</div><div class='del'>-{</div><div class='del'>-	struct rb_node *node;</div><div class='del'>-	struct extent_state *state;</div><div class='add'>+	if (btrfs_op(&amp;bbio-&gt;bio) == BTRFS_MAP_READ &amp;&amp;</div><div class='add'>+	    bio_ctrl-&gt;compress_type != BTRFS_COMPRESS_NONE)</div><div class='add'>+		btrfs_submit_compressed_read(bbio);</div><div class='add'>+	else</div><div class='add'>+		btrfs_submit_bbio(bbio, 0);</div><div class='ctx'> </div><div class='add'>+	/* The bbio is owned by the end_io handler now */</div><div class='add'>+	bio_ctrl-&gt;bbio = NULL;</div><div class='ctx'> 	/*</div><div class='del'>-	 * this search will find all the extents that end after</div><div class='del'>-	 * our range starts.</div><div class='add'>+	 * We used the generation to decide whether to lookup csums in the</div><div class='add'>+	 * commit_root or not when we called bio_set_csum_search_commit_root()</div><div class='add'>+	 * above. Now, reset the generation for the next bio.</div><div class='ctx'> 	 */</div><div class='del'>-	node = tree_search(tree, start);</div><div class='del'>-	if (!node)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	while (1) {</div><div class='del'>-		state = rb_entry(node, struct extent_state, rb_node);</div><div class='del'>-		if (state-&gt;end &gt;= start &amp;&amp; (state-&gt;state &amp; bits))</div><div class='del'>-			return state;</div><div class='del'>-</div><div class='del'>-		node = rb_next(node);</div><div class='del'>-		if (!node)</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-out:</div><div class='del'>-	return NULL;</div><div class='add'>+	bio_ctrl-&gt;generation = 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Find the first offset in the io tree with one or more @bits set.</div><div class='del'>- *</div><div class='del'>- * Note: If there are multiple bits set in @bits, any of them will match.</div><div class='del'>- *</div><div class='del'>- * Return 0 if we find something, and update @start_ret and @end_ret.</div><div class='del'>- * Return 1 if we found nothing.</div><div class='add'>+ * Submit or fail the current bio in the bio_ctrl structure.</div><div class='ctx'>  */</div><div class='del'>-int find_first_extent_bit(struct extent_io_tree *tree, u64 start,</div><div class='del'>-			  u64 *start_ret, u64 *end_ret, u32 bits,</div><div class='del'>-			  struct extent_state **cached_state)</div><div class='add'>+static void submit_write_bio(struct btrfs_bio_ctrl *bio_ctrl, int ret)</div><div class='ctx'> {</div><div class='del'>-	struct extent_state *state;</div><div class='del'>-	int ret = 1;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;tree-&gt;lock);</div><div class='del'>-	if (cached_state &amp;&amp; *cached_state) {</div><div class='del'>-		state = *cached_state;</div><div class='del'>-		if (state-&gt;end == start - 1 &amp;&amp; extent_state_in_tree(state)) {</div><div class='del'>-			while ((state = next_state(state)) != NULL) {</div><div class='del'>-				if (state-&gt;state &amp; bits)</div><div class='del'>-					goto got_it;</div><div class='del'>-			}</div><div class='del'>-			free_extent_state(*cached_state);</div><div class='del'>-			*cached_state = NULL;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		free_extent_state(*cached_state);</div><div class='del'>-		*cached_state = NULL;</div><div class='del'>-	}</div><div class='add'>+	struct btrfs_bio *bbio = bio_ctrl-&gt;bbio;</div><div class='ctx'> </div><div class='del'>-	state = find_first_extent_bit_state(tree, start, bits);</div><div class='del'>-got_it:</div><div class='del'>-	if (state) {</div><div class='del'>-		cache_state_if_flags(state, cached_state, 0);</div><div class='del'>-		*start_ret = state-&gt;start;</div><div class='del'>-		*end_ret = state-&gt;end;</div><div class='del'>-		ret = 0;</div><div class='del'>-	}</div><div class='del'>-out:</div><div class='del'>-	spin_unlock(&amp;tree-&gt;lock);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='add'>+	if (!bbio)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * Find a contiguous area of bits</div><div class='del'>- *</div><div class='del'>- * @tree:      io tree to check</div><div class='del'>- * @start:     offset to start the search from</div><div class='del'>- * @start_ret: the first offset we found with the bits set</div><div class='del'>- * @end_ret:   the final contiguous range of the bits that were set</div><div class='del'>- * @bits:      bits to look for</div><div class='del'>- *</div><div class='del'>- * set_extent_bit and clear_extent_bit can temporarily split contiguous ranges</div><div class='del'>- * to set bits appropriately, and then merge them again.  During this time it</div><div class='del'>- * will drop the tree-&gt;lock, so use this helper if you want to find the actual</div><div class='del'>- * contiguous area for given bits.  We will search to the first bit we find, and</div><div class='del'>- * then walk down the tree until we find a non-contiguous area.  The area</div><div class='del'>- * returned will be the full contiguous area with the bits set.</div><div class='del'>- */</div><div class='del'>-int find_contiguous_extent_bit(struct extent_io_tree *tree, u64 start,</div><div class='del'>-			       u64 *start_ret, u64 *end_ret, u32 bits)</div><div class='del'>-{</div><div class='del'>-	struct extent_state *state;</div><div class='del'>-	int ret = 1;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;tree-&gt;lock);</div><div class='del'>-	state = find_first_extent_bit_state(tree, start, bits);</div><div class='del'>-	if (state) {</div><div class='del'>-		*start_ret = state-&gt;start;</div><div class='del'>-		*end_ret = state-&gt;end;</div><div class='del'>-		while ((state = next_state(state)) != NULL) {</div><div class='del'>-			if (state-&gt;start &gt; (*end_ret + 1))</div><div class='del'>-				break;</div><div class='del'>-			*end_ret = state-&gt;end;</div><div class='del'>-		}</div><div class='del'>-		ret = 0;</div><div class='add'>+	if (ret) {</div><div class='add'>+		ASSERT(ret &lt; 0);</div><div class='add'>+		btrfs_bio_end_io(bbio, errno_to_blk_status(ret));</div><div class='add'>+		/* The bio is owned by the end_io handler now */</div><div class='add'>+		bio_ctrl-&gt;bbio = NULL;</div><div class='add'>+	} else {</div><div class='add'>+		submit_one_bio(bio_ctrl);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;tree-&gt;lock);</div><div class='del'>-	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * Find the first range that has @bits not set. This range could start before</div><div class='del'>- * @start.</div><div class='del'>- *</div><div class='del'>- * @tree:      the tree to search</div><div class='del'>- * @start:     offset at/after which the found extent should start</div><div class='del'>- * @start_ret: records the beginning of the range</div><div class='del'>- * @end_ret:   records the end of the range (inclusive)</div><div class='del'>- * @bits:      the set of bits which must be unset</div><div class='del'>- *</div><div class='del'>- * Since unallocated range is also considered one which doesn't have the bits</div><div class='del'>- * set it's possible that @end_ret contains -1, this happens in case the range</div><div class='del'>- * spans (last_range_end, end of device]. In this case it's up to the caller to</div><div class='del'>- * trim @end_ret to the appropriate size.</div><div class='del'>- */</div><div class='del'>-void find_first_clear_extent_bit(struct extent_io_tree *tree, u64 start,</div><div class='del'>-				 u64 *start_ret, u64 *end_ret, u32 bits)</div><div class='add'>+int __init extent_buffer_init_cachep(void)</div><div class='ctx'> {</div><div class='del'>-	struct extent_state *state;</div><div class='del'>-	struct rb_node *node, *prev = NULL, *next;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;tree-&gt;lock);</div><div class='del'>-</div><div class='del'>-	/* Find first extent with bits cleared */</div><div class='del'>-	while (1) {</div><div class='del'>-		node = __etree_search(tree, start, &amp;next, &amp;prev, NULL, NULL);</div><div class='del'>-		if (!node &amp;&amp; !next &amp;&amp; !prev) {</div><div class='del'>-			/*</div><div class='del'>-			 * Tree is completely empty, send full range and let</div><div class='del'>-			 * caller deal with it</div><div class='del'>-			 */</div><div class='del'>-			*start_ret = 0;</div><div class='del'>-			*end_ret = -1;</div><div class='del'>-			goto out;</div><div class='del'>-		} else if (!node &amp;&amp; !next) {</div><div class='del'>-			/*</div><div class='del'>-			 * We are past the last allocated chunk, set start at</div><div class='del'>-			 * the end of the last extent.</div><div class='del'>-			 */</div><div class='del'>-			state = rb_entry(prev, struct extent_state, rb_node);</div><div class='del'>-			*start_ret = state-&gt;end + 1;</div><div class='del'>-			*end_ret = -1;</div><div class='del'>-			goto out;</div><div class='del'>-		} else if (!node) {</div><div class='del'>-			node = next;</div><div class='del'>-		}</div><div class='del'>-		/*</div><div class='del'>-		 * At this point 'node' either contains 'start' or start is</div><div class='del'>-		 * before 'node'</div><div class='del'>-		 */</div><div class='del'>-		state = rb_entry(node, struct extent_state, rb_node);</div><div class='del'>-</div><div class='del'>-		if (in_range(start, state-&gt;start, state-&gt;end - state-&gt;start + 1)) {</div><div class='del'>-			if (state-&gt;state &amp; bits) {</div><div class='del'>-				/*</div><div class='del'>-				 * |--range with bits sets--|</div><div class='del'>-				 *    |</div><div class='del'>-				 *    start</div><div class='del'>-				 */</div><div class='del'>-				start = state-&gt;end + 1;</div><div class='del'>-			} else {</div><div class='del'>-				/*</div><div class='del'>-				 * 'start' falls within a range that doesn't</div><div class='del'>-				 * have the bits set, so take its start as</div><div class='del'>-				 * the beginning of the desired range</div><div class='del'>-				 *</div><div class='del'>-				 * |--range with bits cleared----|</div><div class='del'>-				 *      |</div><div class='del'>-				 *      start</div><div class='del'>-				 */</div><div class='del'>-				*start_ret = state-&gt;start;</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-		} else {</div><div class='del'>-			/*</div><div class='del'>-			 * |---prev range---|---hole/unset---|---node range---|</div><div class='del'>-			 *                          |</div><div class='del'>-			 *                        start</div><div class='del'>-			 *</div><div class='del'>-			 *                        or</div><div class='del'>-			 *</div><div class='del'>-			 * |---hole/unset--||--first node--|</div><div class='del'>-			 * 0   |</div><div class='del'>-			 *    start</div><div class='del'>-			 */</div><div class='del'>-			if (prev) {</div><div class='del'>-				state = rb_entry(prev, struct extent_state,</div><div class='del'>-						 rb_node);</div><div class='del'>-				*start_ret = state-&gt;end + 1;</div><div class='del'>-			} else {</div><div class='del'>-				*start_ret = 0;</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Find the longest stretch from start until an entry which has the</div><div class='del'>-	 * bits set</div><div class='del'>-	 */</div><div class='del'>-	while (1) {</div><div class='del'>-		state = rb_entry(node, struct extent_state, rb_node);</div><div class='del'>-		if (state-&gt;end &gt;= start &amp;&amp; !(state-&gt;state &amp; bits)) {</div><div class='del'>-			*end_ret = state-&gt;end;</div><div class='del'>-		} else {</div><div class='del'>-			*end_ret = state-&gt;start - 1;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='add'>+	extent_buffer_cache = kmem_cache_create("btrfs_extent_buffer",</div><div class='add'>+						sizeof(struct extent_buffer), 0, 0,</div><div class='add'>+						NULL);</div><div class='add'>+	if (!extent_buffer_cache)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-		node = rb_next(node);</div><div class='del'>-		if (!node)</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-out:</div><div class='del'>-	spin_unlock(&amp;tree-&gt;lock);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * find a contiguous range of bytes in the file marked as delalloc, not</div><div class='del'>- * more than 'max_bytes'.  start and end are used to return the range,</div><div class='del'>- *</div><div class='del'>- * true is returned if we find something, false if nothing was in the tree</div><div class='del'>- */</div><div class='del'>-bool btrfs_find_delalloc_range(struct extent_io_tree *tree, u64 *start,</div><div class='del'>-			       u64 *end, u64 max_bytes,</div><div class='del'>-			       struct extent_state **cached_state)</div><div class='add'>+void __cold extent_buffer_free_cachep(void)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node *node;</div><div class='del'>-	struct extent_state *state;</div><div class='del'>-	u64 cur_start = *start;</div><div class='del'>-	bool found = false;</div><div class='del'>-	u64 total_bytes = 0;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;tree-&gt;lock);</div><div class='del'>-</div><div class='ctx'> 	/*</div><div class='del'>-	 * this search will find all the extents that end after</div><div class='del'>-	 * our range starts.</div><div class='add'>+	 * Make sure all delayed rcu free are flushed before we</div><div class='add'>+	 * destroy caches.</div><div class='ctx'> 	 */</div><div class='del'>-	node = tree_search(tree, cur_start);</div><div class='del'>-	if (!node) {</div><div class='del'>-		*end = (u64)-1;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	while (1) {</div><div class='del'>-		state = rb_entry(node, struct extent_state, rb_node);</div><div class='del'>-		if (found &amp;&amp; (state-&gt;start != cur_start ||</div><div class='del'>-			      (state-&gt;state &amp; EXTENT_BOUNDARY))) {</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		if (!(state-&gt;state &amp; EXTENT_DELALLOC)) {</div><div class='del'>-			if (!found)</div><div class='del'>-				*end = state-&gt;end;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		if (!found) {</div><div class='del'>-			*start = state-&gt;start;</div><div class='del'>-			*cached_state = state;</div><div class='del'>-			refcount_inc(&amp;state-&gt;refs);</div><div class='del'>-		}</div><div class='del'>-		found = true;</div><div class='del'>-		*end = state-&gt;end;</div><div class='del'>-		cur_start = state-&gt;end + 1;</div><div class='del'>-		node = rb_next(node);</div><div class='del'>-		total_bytes += state-&gt;end - state-&gt;start + 1;</div><div class='del'>-		if (total_bytes &gt;= max_bytes)</div><div class='del'>-			break;</div><div class='del'>-		if (!node)</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-out:</div><div class='del'>-	spin_unlock(&amp;tree-&gt;lock);</div><div class='del'>-	return found;</div><div class='add'>+	rcu_barrier();</div><div class='add'>+	kmem_cache_destroy(extent_buffer_cache);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Process one page for __process_pages_contig().</div><div class='del'>- *</div><div class='del'>- * Return &gt;0 if we hit @page == @locked_page.</div><div class='del'>- * Return 0 if we updated the page status.</div><div class='del'>- * Return -EGAIN if the we need to try again.</div><div class='del'>- * (For PAGE_LOCK case but got dirty page or page not belong to mapping)</div><div class='del'>- */</div><div class='del'>-static int process_one_page(struct btrfs_fs_info *fs_info,</div><div class='del'>-			    struct address_space *mapping,</div><div class='del'>-			    struct page *page, struct page *locked_page,</div><div class='del'>-			    unsigned long page_ops, u64 start, u64 end)</div><div class='add'>+static void process_one_folio(struct btrfs_fs_info *fs_info,</div><div class='add'>+			      struct folio *folio, const struct folio *locked_folio,</div><div class='add'>+			      unsigned long page_ops, u64 start, u64 end)</div><div class='ctx'> {</div><div class='ctx'> 	u32 len;</div><div class='ctx'> </div><div class='hunk'>@@ -1830,147 +250,104 @@ static int process_one_page(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	len = end + 1 - start;</div><div class='ctx'> </div><div class='ctx'> 	if (page_ops &amp; PAGE_SET_ORDERED)</div><div class='del'>-		btrfs_page_clamp_set_ordered(fs_info, page, start, len);</div><div class='del'>-	if (page_ops &amp; PAGE_SET_ERROR)</div><div class='del'>-		btrfs_page_clamp_set_error(fs_info, page, start, len);</div><div class='add'>+		btrfs_folio_clamp_set_ordered(fs_info, folio, start, len);</div><div class='ctx'> 	if (page_ops &amp; PAGE_START_WRITEBACK) {</div><div class='del'>-		btrfs_page_clamp_clear_dirty(fs_info, page, start, len);</div><div class='del'>-		btrfs_page_clamp_set_writeback(fs_info, page, start, len);</div><div class='add'>+		btrfs_folio_clamp_clear_dirty(fs_info, folio, start, len);</div><div class='add'>+		btrfs_folio_clamp_set_writeback(fs_info, folio, start, len);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (page_ops &amp; PAGE_END_WRITEBACK)</div><div class='del'>-		btrfs_page_clamp_clear_writeback(fs_info, page, start, len);</div><div class='del'>-</div><div class='del'>-	if (page == locked_page)</div><div class='del'>-		return 1;</div><div class='del'>-</div><div class='del'>-	if (page_ops &amp; PAGE_LOCK) {</div><div class='del'>-		int ret;</div><div class='add'>+		btrfs_folio_clamp_clear_writeback(fs_info, folio, start, len);</div><div class='ctx'> </div><div class='del'>-		ret = btrfs_page_start_writer_lock(fs_info, page, start, len);</div><div class='del'>-		if (ret)</div><div class='del'>-			return ret;</div><div class='del'>-		if (!PageDirty(page) || page-&gt;mapping != mapping) {</div><div class='del'>-			btrfs_page_end_writer_lock(fs_info, page, start, len);</div><div class='del'>-			return -EAGAIN;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	if (page_ops &amp; PAGE_UNLOCK)</div><div class='del'>-		btrfs_page_end_writer_lock(fs_info, page, start, len);</div><div class='del'>-	return 0;</div><div class='add'>+	if (folio != locked_folio &amp;&amp; (page_ops &amp; PAGE_UNLOCK))</div><div class='add'>+		btrfs_folio_end_lock(fs_info, folio, start, len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __process_pages_contig(struct address_space *mapping,</div><div class='del'>-				  struct page *locked_page,</div><div class='del'>-				  u64 start, u64 end, unsigned long page_ops,</div><div class='del'>-				  u64 *processed_end)</div><div class='add'>+static void __process_folios_contig(struct address_space *mapping,</div><div class='add'>+				    const struct folio *locked_folio, u64 start,</div><div class='add'>+				    u64 end, unsigned long page_ops)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(mapping-&gt;host-&gt;i_sb);</div><div class='del'>-	pgoff_t start_index = start &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(mapping-&gt;host);</div><div class='add'>+	pgoff_t index = start &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> 	pgoff_t end_index = end &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	pgoff_t index = start_index;</div><div class='del'>-	unsigned long nr_pages = end_index - start_index + 1;</div><div class='del'>-	unsigned long pages_processed = 0;</div><div class='del'>-	struct page *pages[16];</div><div class='del'>-	int err = 0;</div><div class='add'>+	struct folio_batch fbatch;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	if (page_ops &amp; PAGE_LOCK) {</div><div class='del'>-		ASSERT(page_ops == PAGE_LOCK);</div><div class='del'>-		ASSERT(processed_end &amp;&amp; *processed_end == start);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if ((page_ops &amp; PAGE_SET_ERROR) &amp;&amp; nr_pages &gt; 0)</div><div class='del'>-		mapping_set_error(mapping, -EIO);</div><div class='del'>-</div><div class='del'>-	while (nr_pages &gt; 0) {</div><div class='del'>-		int found_pages;</div><div class='del'>-</div><div class='del'>-		found_pages = find_get_pages_contig(mapping, index,</div><div class='del'>-				     min_t(unsigned long,</div><div class='del'>-				     nr_pages, ARRAY_SIZE(pages)), pages);</div><div class='del'>-		if (found_pages == 0) {</div><div class='del'>-			/*</div><div class='del'>-			 * Only if we're going to lock these pages, we can find</div><div class='del'>-			 * nothing at @index.</div><div class='del'>-			 */</div><div class='del'>-			ASSERT(page_ops &amp; PAGE_LOCK);</div><div class='del'>-			err = -EAGAIN;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+	folio_batch_init(&amp;fbatch);</div><div class='add'>+	while (index &lt;= end_index) {</div><div class='add'>+		int found_folios;</div><div class='ctx'> </div><div class='del'>-		for (i = 0; i &lt; found_pages; i++) {</div><div class='del'>-			int process_ret;</div><div class='add'>+		found_folios = filemap_get_folios_contig(mapping, &amp;index,</div><div class='add'>+				end_index, &amp;fbatch);</div><div class='add'>+		for (i = 0; i &lt; found_folios; i++) {</div><div class='add'>+			struct folio *folio = fbatch.folios[i];</div><div class='ctx'> </div><div class='del'>-			process_ret = process_one_page(fs_info, mapping,</div><div class='del'>-					pages[i], locked_page, page_ops,</div><div class='del'>-					start, end);</div><div class='del'>-			if (process_ret &lt; 0) {</div><div class='del'>-				for (; i &lt; found_pages; i++)</div><div class='del'>-					put_page(pages[i]);</div><div class='del'>-				err = -EAGAIN;</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-			put_page(pages[i]);</div><div class='del'>-			pages_processed++;</div><div class='add'>+			process_one_folio(fs_info, folio, locked_folio,</div><div class='add'>+					  page_ops, start, end);</div><div class='ctx'> 		}</div><div class='del'>-		nr_pages -= found_pages;</div><div class='del'>-		index += found_pages;</div><div class='add'>+		folio_batch_release(&amp;fbatch);</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 	}</div><div class='del'>-out:</div><div class='del'>-	if (err &amp;&amp; processed_end) {</div><div class='del'>-		/*</div><div class='del'>-		 * Update @processed_end. I know this is awful since it has</div><div class='del'>-		 * two different return value patterns (inclusive vs exclusive).</div><div class='del'>-		 *</div><div class='del'>-		 * But the exclusive pattern is necessary if @start is 0, or we</div><div class='del'>-		 * underflow and check against processed_end won't work as</div><div class='del'>-		 * expected.</div><div class='del'>-		 */</div><div class='del'>-		if (pages_processed)</div><div class='del'>-			*processed_end = min(end,</div><div class='del'>-			((u64)(start_index + pages_processed) &lt;&lt; PAGE_SHIFT) - 1);</div><div class='del'>-		else</div><div class='del'>-			*processed_end = start;</div><div class='del'>-	}</div><div class='del'>-	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline void __unlock_for_delalloc(struct inode *inode,</div><div class='del'>-					   struct page *locked_page,</div><div class='add'>+static noinline void unlock_delalloc_folio(const struct inode *inode,</div><div class='add'>+					   struct folio *locked_folio,</div><div class='ctx'> 					   u64 start, u64 end)</div><div class='ctx'> {</div><div class='del'>-	unsigned long index = start &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	unsigned long end_index = end &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	ASSERT(locked_folio);</div><div class='ctx'> </div><div class='del'>-	ASSERT(locked_page);</div><div class='del'>-	if (index == locked_page-&gt;index &amp;&amp; end_index == index)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	__process_pages_contig(inode-&gt;i_mapping, locked_page, start, end,</div><div class='del'>-			       PAGE_UNLOCK, NULL);</div><div class='add'>+	__process_folios_contig(inode-&gt;i_mapping, locked_folio, start, end,</div><div class='add'>+				PAGE_UNLOCK);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline int lock_delalloc_pages(struct inode *inode,</div><div class='del'>-					struct page *locked_page,</div><div class='del'>-					u64 delalloc_start,</div><div class='del'>-					u64 delalloc_end)</div><div class='add'>+static noinline int lock_delalloc_folios(struct inode *inode,</div><div class='add'>+					 struct folio *locked_folio,</div><div class='add'>+					 u64 start, u64 end)</div><div class='ctx'> {</div><div class='del'>-	unsigned long index = delalloc_start &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	unsigned long end_index = delalloc_end &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	u64 processed_end = delalloc_start;</div><div class='del'>-	int ret;</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='add'>+	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='add'>+	pgoff_t index = start &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	pgoff_t end_index = end &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	u64 processed_end = start;</div><div class='add'>+	struct folio_batch fbatch;</div><div class='ctx'> </div><div class='del'>-	ASSERT(locked_page);</div><div class='del'>-	if (index == locked_page-&gt;index &amp;&amp; index == end_index)</div><div class='del'>-		return 0;</div><div class='add'>+	folio_batch_init(&amp;fbatch);</div><div class='add'>+	while (index &lt;= end_index) {</div><div class='add'>+		unsigned int found_folios, i;</div><div class='ctx'> </div><div class='del'>-	ret = __process_pages_contig(inode-&gt;i_mapping, locked_page, delalloc_start,</div><div class='del'>-				     delalloc_end, PAGE_LOCK, &amp;processed_end);</div><div class='del'>-	if (ret == -EAGAIN &amp;&amp; processed_end &gt; delalloc_start)</div><div class='del'>-		__unlock_for_delalloc(inode, locked_page, delalloc_start,</div><div class='del'>-				      processed_end);</div><div class='del'>-	return ret;</div><div class='add'>+		found_folios = filemap_get_folios_contig(mapping, &amp;index,</div><div class='add'>+				end_index, &amp;fbatch);</div><div class='add'>+		if (found_folios == 0)</div><div class='add'>+			goto out;</div><div class='add'>+</div><div class='add'>+		for (i = 0; i &lt; found_folios; i++) {</div><div class='add'>+			struct folio *folio = fbatch.folios[i];</div><div class='add'>+			u64 range_start;</div><div class='add'>+			u32 range_len;</div><div class='add'>+</div><div class='add'>+			if (folio == locked_folio)</div><div class='add'>+				continue;</div><div class='add'>+</div><div class='add'>+			folio_lock(folio);</div><div class='add'>+			if (!folio_test_dirty(folio) || folio-&gt;mapping != mapping) {</div><div class='add'>+				folio_unlock(folio);</div><div class='add'>+				goto out;</div><div class='add'>+			}</div><div class='add'>+			range_start = max_t(u64, folio_pos(folio), start);</div><div class='add'>+			range_len = min_t(u64, folio_next_pos(folio), end + 1) - range_start;</div><div class='add'>+			btrfs_folio_set_lock(fs_info, folio, range_start, range_len);</div><div class='add'>+</div><div class='add'>+			processed_end = range_start + range_len - 1;</div><div class='add'>+		}</div><div class='add'>+		folio_batch_release(&amp;fbatch);</div><div class='add'>+		cond_resched();</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+out:</div><div class='add'>+	folio_batch_release(&amp;fbatch);</div><div class='add'>+	if (processed_end &gt; start)</div><div class='add'>+		unlock_delalloc_folio(inode, locked_folio, start, processed_end);</div><div class='add'>+	return -EAGAIN;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1990,13 +367,14 @@ static noinline int lock_delalloc_pages(struct inode *inode,</div><div class='ctx'>  */</div><div class='ctx'> EXPORT_FOR_TESTS</div><div class='ctx'> noinline_for_stack bool find_lock_delalloc_range(struct inode *inode,</div><div class='del'>-				    struct page *locked_page, u64 *start,</div><div class='del'>-				    u64 *end)</div><div class='add'>+						 struct folio *locked_folio,</div><div class='add'>+						 u64 *start, u64 *end)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='ctx'> 	struct extent_io_tree *tree = &amp;BTRFS_I(inode)-&gt;io_tree;</div><div class='ctx'> 	const u64 orig_start = *start;</div><div class='ctx'> 	const u64 orig_end = *end;</div><div class='del'>-	u64 max_bytes = BTRFS_MAX_EXTENT_SIZE;</div><div class='add'>+	u64 max_bytes = fs_info-&gt;max_extent_size;</div><div class='ctx'> 	u64 delalloc_start;</div><div class='ctx'> 	u64 delalloc_end;</div><div class='ctx'> 	bool found;</div><div class='hunk'>@@ -2007,13 +385,20 @@ noinline_for_stack bool find_lock_delalloc_range(struct inode *inode,</div><div class='ctx'> 	/* Caller should pass a valid @end to indicate the search range end */</div><div class='ctx'> 	ASSERT(orig_end &gt; orig_start);</div><div class='ctx'> </div><div class='del'>-	/* The range should at least cover part of the page */</div><div class='del'>-	ASSERT(!(orig_start &gt;= page_offset(locked_page) + PAGE_SIZE ||</div><div class='del'>-		 orig_end &lt;= page_offset(locked_page)));</div><div class='add'>+	/* The range should at least cover part of the folio */</div><div class='add'>+	ASSERT(!(orig_start &gt;= folio_next_pos(locked_folio) ||</div><div class='add'>+		 orig_end &lt;= folio_pos(locked_folio)));</div><div class='ctx'> again:</div><div class='ctx'> 	/* step one, find a bunch of delalloc bytes starting at start */</div><div class='ctx'> 	delalloc_start = *start;</div><div class='ctx'> 	delalloc_end = 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If @max_bytes is smaller than a block, btrfs_find_delalloc_range() can</div><div class='add'>+	 * return early without handling any dirty ranges.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(max_bytes &gt;= fs_info-&gt;sectorsize);</div><div class='add'>+</div><div class='ctx'> 	found = btrfs_find_delalloc_range(tree, &amp;delalloc_start, &amp;delalloc_end,</div><div class='ctx'> 					  max_bytes, &amp;cached_state);</div><div class='ctx'> 	if (!found || delalloc_end &lt;= *start || delalloc_start &gt; orig_end) {</div><div class='hunk'>@@ -2021,36 +406,37 @@ again:</div><div class='ctx'> </div><div class='ctx'> 		/* @delalloc_end can be -1, never go beyond @orig_end */</div><div class='ctx'> 		*end = min(delalloc_end, orig_end);</div><div class='del'>-		free_extent_state(cached_state);</div><div class='add'>+		btrfs_free_extent_state(cached_state);</div><div class='ctx'> 		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * start comes from the offset of locked_page.  We have to lock</div><div class='del'>-	 * pages in order, so we can't process delalloc bytes before</div><div class='del'>-	 * locked_page</div><div class='add'>+	 * start comes from the offset of locked_folio.  We have to lock</div><div class='add'>+	 * folios in order, so we can't process delalloc bytes before</div><div class='add'>+	 * locked_folio</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (delalloc_start &lt; *start)</div><div class='ctx'> 		delalloc_start = *start;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * make sure to limit the number of pages we try to lock down</div><div class='add'>+	 * make sure to limit the number of folios we try to lock down</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (delalloc_end + 1 - delalloc_start &gt; max_bytes)</div><div class='ctx'> 		delalloc_end = delalloc_start + max_bytes - 1;</div><div class='ctx'> </div><div class='del'>-	/* step two, lock all the pages after the page that has start */</div><div class='del'>-	ret = lock_delalloc_pages(inode, locked_page,</div><div class='del'>-				  delalloc_start, delalloc_end);</div><div class='add'>+	/* step two, lock all the folios after the folios that has start */</div><div class='add'>+	ret = lock_delalloc_folios(inode, locked_folio, delalloc_start,</div><div class='add'>+				   delalloc_end);</div><div class='ctx'> 	ASSERT(!ret || ret == -EAGAIN);</div><div class='ctx'> 	if (ret == -EAGAIN) {</div><div class='del'>-		/* some of the pages are gone, lets avoid looping by</div><div class='del'>-		 * shortening the size of the delalloc range we're searching</div><div class='add'>+		/*</div><div class='add'>+		 * Some of the folios are gone, lets avoid looping by</div><div class='add'>+		 * shortening the size of the delalloc range we're searching.</div><div class='ctx'> 		 */</div><div class='del'>-		free_extent_state(cached_state);</div><div class='add'>+		btrfs_free_extent_state(cached_state);</div><div class='ctx'> 		cached_state = NULL;</div><div class='ctx'> 		if (!loops) {</div><div class='del'>-			max_bytes = PAGE_SIZE;</div><div class='add'>+			max_bytes = fs_info-&gt;sectorsize;</div><div class='ctx'> 			loops = 1;</div><div class='ctx'> 			goto again;</div><div class='ctx'> 		} else {</div><div class='hunk'>@@ -2060,20 +446,19 @@ again:</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* step three, lock the state bits for the whole range */</div><div class='del'>-	lock_extent_bits(tree, delalloc_start, delalloc_end, &amp;cached_state);</div><div class='add'>+	btrfs_lock_extent(tree, delalloc_start, delalloc_end, &amp;cached_state);</div><div class='ctx'> </div><div class='ctx'> 	/* then test to make sure it is all still delalloc */</div><div class='del'>-	ret = test_range_bit(tree, delalloc_start, delalloc_end,</div><div class='del'>-			     EXTENT_DELALLOC, 1, cached_state);</div><div class='add'>+	ret = btrfs_test_range_bit(tree, delalloc_start, delalloc_end,</div><div class='add'>+				   EXTENT_DELALLOC, cached_state);</div><div class='add'>+</div><div class='add'>+	btrfs_unlock_extent(tree, delalloc_start, delalloc_end, &amp;cached_state);</div><div class='ctx'> 	if (!ret) {</div><div class='del'>-		unlock_extent_cached(tree, delalloc_start, delalloc_end,</div><div class='del'>-				     &amp;cached_state);</div><div class='del'>-		__unlock_for_delalloc(inode, locked_page,</div><div class='del'>-			      delalloc_start, delalloc_end);</div><div class='add'>+		unlock_delalloc_folio(inode, locked_folio, delalloc_start,</div><div class='add'>+				      delalloc_end);</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 		goto again;</div><div class='ctx'> 	}</div><div class='del'>-	free_extent_state(cached_state);</div><div class='ctx'> 	*start = delalloc_start;</div><div class='ctx'> 	*end = delalloc_end;</div><div class='ctx'> out_failed:</div><div class='hunk'>@@ -2081,1375 +466,405 @@ out_failed:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void extent_clear_unlock_delalloc(struct btrfs_inode *inode, u64 start, u64 end,</div><div class='del'>-				  struct page *locked_page,</div><div class='add'>+				  const struct folio *locked_folio,</div><div class='add'>+				  struct extent_state **cached,</div><div class='ctx'> 				  u32 clear_bits, unsigned long page_ops)</div><div class='ctx'> {</div><div class='del'>-	clear_extent_bit(&amp;inode-&gt;io_tree, start, end, clear_bits, 1, 0, NULL);</div><div class='add'>+	btrfs_clear_extent_bit(&amp;inode-&gt;io_tree, start, end, clear_bits, cached);</div><div class='ctx'> </div><div class='del'>-	__process_pages_contig(inode-&gt;vfs_inode.i_mapping, locked_page,</div><div class='del'>-			       start, end, page_ops, NULL);</div><div class='add'>+	__process_folios_contig(inode-&gt;vfs_inode.i_mapping, locked_folio, start,</div><div class='add'>+				end, page_ops);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * count the number of bytes in the tree that have a given bit(s)</div><div class='del'>- * set.  This can be fairly slow, except for EXTENT_DIRTY which is</div><div class='del'>- * cached.  The total number found is returned.</div><div class='del'>- */</div><div class='del'>-u64 count_range_bits(struct extent_io_tree *tree,</div><div class='del'>-		     u64 *start, u64 search_end, u64 max_bytes,</div><div class='del'>-		     u32 bits, int contig)</div><div class='add'>+static bool btrfs_verify_folio(struct folio *folio, u64 start, u32 len)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node *node;</div><div class='del'>-	struct extent_state *state;</div><div class='del'>-	u64 cur_start = *start;</div><div class='del'>-	u64 total_bytes = 0;</div><div class='del'>-	u64 last = 0;</div><div class='del'>-	int found = 0;</div><div class='del'>-</div><div class='del'>-	if (WARN_ON(search_end &lt;= cur_start))</div><div class='del'>-		return 0;</div><div class='add'>+	struct btrfs_fs_info *fs_info = folio_to_fs_info(folio);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;tree-&gt;lock);</div><div class='del'>-	if (cur_start == 0 &amp;&amp; bits == EXTENT_DIRTY) {</div><div class='del'>-		total_bytes = tree-&gt;dirty_bytes;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	/*</div><div class='del'>-	 * this search will find all the extents that end after</div><div class='del'>-	 * our range starts.</div><div class='del'>-	 */</div><div class='del'>-	node = tree_search(tree, cur_start);</div><div class='del'>-	if (!node)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	while (1) {</div><div class='del'>-		state = rb_entry(node, struct extent_state, rb_node);</div><div class='del'>-		if (state-&gt;start &gt; search_end)</div><div class='del'>-			break;</div><div class='del'>-		if (contig &amp;&amp; found &amp;&amp; state-&gt;start &gt; last + 1)</div><div class='del'>-			break;</div><div class='del'>-		if (state-&gt;end &gt;= cur_start &amp;&amp; (state-&gt;state &amp; bits) == bits) {</div><div class='del'>-			total_bytes += min(search_end, state-&gt;end) + 1 -</div><div class='del'>-				       max(cur_start, state-&gt;start);</div><div class='del'>-			if (total_bytes &gt;= max_bytes)</div><div class='del'>-				break;</div><div class='del'>-			if (!found) {</div><div class='del'>-				*start = max(cur_start, state-&gt;start);</div><div class='del'>-				found = 1;</div><div class='del'>-			}</div><div class='del'>-			last = state-&gt;end;</div><div class='del'>-		} else if (contig &amp;&amp; found) {</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		node = rb_next(node);</div><div class='del'>-		if (!node)</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-out:</div><div class='del'>-	spin_unlock(&amp;tree-&gt;lock);</div><div class='del'>-	return total_bytes;</div><div class='add'>+	if (!fsverity_active(folio-&gt;mapping-&gt;host) ||</div><div class='add'>+	    btrfs_folio_test_uptodate(fs_info, folio, start, len) ||</div><div class='add'>+	    start &gt;= i_size_read(folio-&gt;mapping-&gt;host))</div><div class='add'>+		return true;</div><div class='add'>+	return fsverity_verify_folio(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * set the private field for a given byte offset in the tree.  If there isn't</div><div class='del'>- * an extent_state there already, this does nothing.</div><div class='del'>- */</div><div class='del'>-int set_state_failrec(struct extent_io_tree *tree, u64 start,</div><div class='del'>-		      struct io_failure_record *failrec)</div><div class='add'>+static void end_folio_read(struct folio *folio, bool uptodate, u64 start, u32 len)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node *node;</div><div class='del'>-	struct extent_state *state;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;tree-&gt;lock);</div><div class='del'>-	/*</div><div class='del'>-	 * this search will find all the extents that end after</div><div class='del'>-	 * our range starts.</div><div class='del'>-	 */</div><div class='del'>-	node = tree_search(tree, start);</div><div class='del'>-	if (!node) {</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	state = rb_entry(node, struct extent_state, rb_node);</div><div class='del'>-	if (state-&gt;start != start) {</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	state-&gt;failrec = failrec;</div><div class='del'>-out:</div><div class='del'>-	spin_unlock(&amp;tree-&gt;lock);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct io_failure_record *get_state_failrec(struct extent_io_tree *tree, u64 start)</div><div class='del'>-{</div><div class='del'>-	struct rb_node *node;</div><div class='del'>-	struct extent_state *state;</div><div class='del'>-	struct io_failure_record *failrec;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;tree-&gt;lock);</div><div class='del'>-	/*</div><div class='del'>-	 * this search will find all the extents that end after</div><div class='del'>-	 * our range starts.</div><div class='del'>-	 */</div><div class='del'>-	node = tree_search(tree, start);</div><div class='del'>-	if (!node) {</div><div class='del'>-		failrec = ERR_PTR(-ENOENT);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	state = rb_entry(node, struct extent_state, rb_node);</div><div class='del'>-	if (state-&gt;start != start) {</div><div class='del'>-		failrec = ERR_PTR(-ENOENT);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	struct btrfs_fs_info *fs_info = folio_to_fs_info(folio);</div><div class='ctx'> </div><div class='del'>-	failrec = state-&gt;failrec;</div><div class='del'>-out:</div><div class='del'>-	spin_unlock(&amp;tree-&gt;lock);</div><div class='del'>-	return failrec;</div><div class='del'>-}</div><div class='add'>+	ASSERT(folio_pos(folio) &lt;= start &amp;&amp;</div><div class='add'>+	       start + len &lt;= folio_next_pos(folio));</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * searches a range in the state tree for a given mask.</div><div class='del'>- * If 'filled' == 1, this returns 1 only if every extent in the tree</div><div class='del'>- * has the bits set.  Otherwise, 1 is returned if any bit in the</div><div class='del'>- * range is found set.</div><div class='del'>- */</div><div class='del'>-int test_range_bit(struct extent_io_tree *tree, u64 start, u64 end,</div><div class='del'>-		   u32 bits, int filled, struct extent_state *cached)</div><div class='del'>-{</div><div class='del'>-	struct extent_state *state = NULL;</div><div class='del'>-	struct rb_node *node;</div><div class='del'>-	int bitset = 0;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;tree-&gt;lock);</div><div class='del'>-	if (cached &amp;&amp; extent_state_in_tree(cached) &amp;&amp; cached-&gt;start &lt;= start &amp;&amp;</div><div class='del'>-	    cached-&gt;end &gt; start)</div><div class='del'>-		node = &amp;cached-&gt;rb_node;</div><div class='add'>+	if (uptodate &amp;&amp; btrfs_verify_folio(folio, start, len))</div><div class='add'>+		btrfs_folio_set_uptodate(fs_info, folio, start, len);</div><div class='ctx'> 	else</div><div class='del'>-		node = tree_search(tree, start);</div><div class='del'>-	while (node &amp;&amp; start &lt;= end) {</div><div class='del'>-		state = rb_entry(node, struct extent_state, rb_node);</div><div class='del'>-</div><div class='del'>-		if (filled &amp;&amp; state-&gt;start &gt; start) {</div><div class='del'>-			bitset = 0;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (state-&gt;start &gt; end)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		if (state-&gt;state &amp; bits) {</div><div class='del'>-			bitset = 1;</div><div class='del'>-			if (!filled)</div><div class='del'>-				break;</div><div class='del'>-		} else if (filled) {</div><div class='del'>-			bitset = 0;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (state-&gt;end == (u64)-1)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		start = state-&gt;end + 1;</div><div class='del'>-		if (start &gt; end)</div><div class='del'>-			break;</div><div class='del'>-		node = rb_next(node);</div><div class='del'>-		if (!node) {</div><div class='del'>-			if (filled)</div><div class='del'>-				bitset = 0;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;tree-&gt;lock);</div><div class='del'>-	return bitset;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int free_io_failure(struct extent_io_tree *failure_tree,</div><div class='del'>-		    struct extent_io_tree *io_tree,</div><div class='del'>-		    struct io_failure_record *rec)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-	int err = 0;</div><div class='del'>-</div><div class='del'>-	set_state_failrec(failure_tree, rec-&gt;start, NULL);</div><div class='del'>-	ret = clear_extent_bits(failure_tree, rec-&gt;start,</div><div class='del'>-				rec-&gt;start + rec-&gt;len - 1,</div><div class='del'>-				EXTENT_LOCKED | EXTENT_DIRTY);</div><div class='del'>-	if (ret)</div><div class='del'>-		err = ret;</div><div class='del'>-</div><div class='del'>-	ret = clear_extent_bits(io_tree, rec-&gt;start,</div><div class='del'>-				rec-&gt;start + rec-&gt;len - 1,</div><div class='del'>-				EXTENT_DAMAGED);</div><div class='del'>-	if (ret &amp;&amp; !err)</div><div class='del'>-		err = ret;</div><div class='del'>-</div><div class='del'>-	kfree(rec);</div><div class='del'>-	return err;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * this bypasses the standard btrfs submit functions deliberately, as</div><div class='del'>- * the standard behavior is to write all copies in a raid setup. here we only</div><div class='del'>- * want to write the one bad copy. so we do the mapping for ourselves and issue</div><div class='del'>- * submit_bio directly.</div><div class='del'>- * to avoid any synchronization issues, wait for the data after writing, which</div><div class='del'>- * actually prevents the read that triggered the error from finishing.</div><div class='del'>- * currently, there can be no more than two copies of every data bit. thus,</div><div class='del'>- * exactly one rewrite is required.</div><div class='del'>- */</div><div class='del'>-static int repair_io_failure(struct btrfs_fs_info *fs_info, u64 ino, u64 start,</div><div class='del'>-			     u64 length, u64 logical, struct page *page,</div><div class='del'>-			     unsigned int pg_offset, int mirror_num)</div><div class='del'>-{</div><div class='del'>-	struct bio *bio;</div><div class='del'>-	struct btrfs_device *dev;</div><div class='del'>-	u64 map_length = 0;</div><div class='del'>-	u64 sector;</div><div class='del'>-	struct btrfs_io_context *bioc = NULL;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ASSERT(!(fs_info-&gt;sb-&gt;s_flags &amp; SB_RDONLY));</div><div class='del'>-	BUG_ON(!mirror_num);</div><div class='del'>-</div><div class='del'>-	if (btrfs_is_zoned(fs_info))</div><div class='del'>-		return btrfs_repair_one_zone(fs_info, logical);</div><div class='del'>-</div><div class='del'>-	bio = btrfs_bio_alloc(1);</div><div class='del'>-	bio-&gt;bi_iter.bi_size = 0;</div><div class='del'>-	map_length = length;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Avoid races with device replace and make sure our bioc has devices</div><div class='del'>-	 * associated to its stripes that don't go away while we are doing the</div><div class='del'>-	 * read repair operation.</div><div class='del'>-	 */</div><div class='del'>-	btrfs_bio_counter_inc_blocked(fs_info);</div><div class='del'>-	if (btrfs_is_parity_mirror(fs_info, logical, length)) {</div><div class='del'>-		/*</div><div class='del'>-		 * Note that we don't use BTRFS_MAP_WRITE because it's supposed</div><div class='del'>-		 * to update all raid stripes, but here we just want to correct</div><div class='del'>-		 * bad stripe, thus BTRFS_MAP_READ is abused to only get the bad</div><div class='del'>-		 * stripe's dev and sector.</div><div class='del'>-		 */</div><div class='del'>-		ret = btrfs_map_block(fs_info, BTRFS_MAP_READ, logical,</div><div class='del'>-				      &amp;map_length, &amp;bioc, 0);</div><div class='del'>-		if (ret) {</div><div class='del'>-			btrfs_bio_counter_dec(fs_info);</div><div class='del'>-			bio_put(bio);</div><div class='del'>-			return -EIO;</div><div class='del'>-		}</div><div class='del'>-		ASSERT(bioc-&gt;mirror_num == 1);</div><div class='del'>-	} else {</div><div class='del'>-		ret = btrfs_map_block(fs_info, BTRFS_MAP_WRITE, logical,</div><div class='del'>-				      &amp;map_length, &amp;bioc, mirror_num);</div><div class='del'>-		if (ret) {</div><div class='del'>-			btrfs_bio_counter_dec(fs_info);</div><div class='del'>-			bio_put(bio);</div><div class='del'>-			return -EIO;</div><div class='del'>-		}</div><div class='del'>-		BUG_ON(mirror_num != bioc-&gt;mirror_num);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	sector = bioc-&gt;stripes[bioc-&gt;mirror_num - 1].physical &gt;&gt; 9;</div><div class='del'>-	bio-&gt;bi_iter.bi_sector = sector;</div><div class='del'>-	dev = bioc-&gt;stripes[bioc-&gt;mirror_num - 1].dev;</div><div class='del'>-	btrfs_put_bioc(bioc);</div><div class='del'>-	if (!dev || !dev-&gt;bdev ||</div><div class='del'>-	    !test_bit(BTRFS_DEV_STATE_WRITEABLE, &amp;dev-&gt;dev_state)) {</div><div class='del'>-		btrfs_bio_counter_dec(fs_info);</div><div class='del'>-		bio_put(bio);</div><div class='del'>-		return -EIO;</div><div class='del'>-	}</div><div class='del'>-	bio_set_dev(bio, dev-&gt;bdev);</div><div class='del'>-	bio-&gt;bi_opf = REQ_OP_WRITE | REQ_SYNC;</div><div class='del'>-	bio_add_page(bio, page, length, pg_offset);</div><div class='del'>-</div><div class='del'>-	if (btrfsic_submit_bio_wait(bio)) {</div><div class='del'>-		/* try to remap that extent elsewhere? */</div><div class='del'>-		btrfs_bio_counter_dec(fs_info);</div><div class='del'>-		bio_put(bio);</div><div class='del'>-		btrfs_dev_stat_inc_and_print(dev, BTRFS_DEV_STAT_WRITE_ERRS);</div><div class='del'>-		return -EIO;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	btrfs_info_rl_in_rcu(fs_info,</div><div class='del'>-		"read error corrected: ino %llu off %llu (dev %s sector %llu)",</div><div class='del'>-				  ino, start,</div><div class='del'>-				  rcu_str_deref(dev-&gt;name), sector);</div><div class='del'>-	btrfs_bio_counter_dec(fs_info);</div><div class='del'>-	bio_put(bio);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int btrfs_repair_eb_io_failure(const struct extent_buffer *eb, int mirror_num)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='del'>-	u64 start = eb-&gt;start;</div><div class='del'>-	int i, num_pages = num_extent_pages(eb);</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	if (sb_rdonly(fs_info-&gt;sb))</div><div class='del'>-		return -EROFS;</div><div class='add'>+		btrfs_folio_clear_uptodate(fs_info, folio, start, len);</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; num_pages; i++) {</div><div class='del'>-		struct page *p = eb-&gt;pages[i];</div><div class='del'>-</div><div class='del'>-		ret = repair_io_failure(fs_info, 0, start, PAGE_SIZE, start, p,</div><div class='del'>-					start - page_offset(p), mirror_num);</div><div class='del'>-		if (ret)</div><div class='del'>-			break;</div><div class='del'>-		start += PAGE_SIZE;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * each time an IO finishes, we do a fast check in the IO failure tree</div><div class='del'>- * to see if we need to process or clean up an io_failure_record</div><div class='del'>- */</div><div class='del'>-int clean_io_failure(struct btrfs_fs_info *fs_info,</div><div class='del'>-		     struct extent_io_tree *failure_tree,</div><div class='del'>-		     struct extent_io_tree *io_tree, u64 start,</div><div class='del'>-		     struct page *page, u64 ino, unsigned int pg_offset)</div><div class='del'>-{</div><div class='del'>-	u64 private;</div><div class='del'>-	struct io_failure_record *failrec;</div><div class='del'>-	struct extent_state *state;</div><div class='del'>-	int num_copies;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	private = 0;</div><div class='del'>-	ret = count_range_bits(failure_tree, &amp;private, (u64)-1, 1,</div><div class='del'>-			       EXTENT_DIRTY, 0);</div><div class='del'>-	if (!ret)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	failrec = get_state_failrec(failure_tree, start);</div><div class='del'>-	if (IS_ERR(failrec))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	BUG_ON(!failrec-&gt;this_mirror);</div><div class='del'>-</div><div class='del'>-	if (sb_rdonly(fs_info-&gt;sb))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;io_tree-&gt;lock);</div><div class='del'>-	state = find_first_extent_bit_state(io_tree,</div><div class='del'>-					    failrec-&gt;start,</div><div class='del'>-					    EXTENT_LOCKED);</div><div class='del'>-	spin_unlock(&amp;io_tree-&gt;lock);</div><div class='del'>-</div><div class='del'>-	if (state &amp;&amp; state-&gt;start &lt;= failrec-&gt;start &amp;&amp;</div><div class='del'>-	    state-&gt;end &gt;= failrec-&gt;start + failrec-&gt;len - 1) {</div><div class='del'>-		num_copies = btrfs_num_copies(fs_info, failrec-&gt;logical,</div><div class='del'>-					      failrec-&gt;len);</div><div class='del'>-		if (num_copies &gt; 1)  {</div><div class='del'>-			repair_io_failure(fs_info, ino, start, failrec-&gt;len,</div><div class='del'>-					  failrec-&gt;logical, page, pg_offset,</div><div class='del'>-					  failrec-&gt;failed_mirror);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	free_io_failure(failure_tree, io_tree, failrec);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Can be called when</div><div class='del'>- * - hold extent lock</div><div class='del'>- * - under ordered extent</div><div class='del'>- * - the inode is freeing</div><div class='del'>- */</div><div class='del'>-void btrfs_free_io_failure_record(struct btrfs_inode *inode, u64 start, u64 end)</div><div class='del'>-{</div><div class='del'>-	struct extent_io_tree *failure_tree = &amp;inode-&gt;io_failure_tree;</div><div class='del'>-	struct io_failure_record *failrec;</div><div class='del'>-	struct extent_state *state, *next;</div><div class='del'>-</div><div class='del'>-	if (RB_EMPTY_ROOT(&amp;failure_tree-&gt;state))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;failure_tree-&gt;lock);</div><div class='del'>-	state = find_first_extent_bit_state(failure_tree, start, EXTENT_DIRTY);</div><div class='del'>-	while (state) {</div><div class='del'>-		if (state-&gt;start &gt; end)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		ASSERT(state-&gt;end &lt;= end);</div><div class='del'>-</div><div class='del'>-		next = next_state(state);</div><div class='del'>-</div><div class='del'>-		failrec = state-&gt;failrec;</div><div class='del'>-		free_extent_state(state);</div><div class='del'>-		kfree(failrec);</div><div class='del'>-</div><div class='del'>-		state = next;</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;failure_tree-&gt;lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct io_failure_record *btrfs_get_io_failure_record(struct inode *inode,</div><div class='del'>-							     u64 start)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	struct io_failure_record *failrec;</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	struct extent_io_tree *failure_tree = &amp;BTRFS_I(inode)-&gt;io_failure_tree;</div><div class='del'>-	struct extent_io_tree *tree = &amp;BTRFS_I(inode)-&gt;io_tree;</div><div class='del'>-	struct extent_map_tree *em_tree = &amp;BTRFS_I(inode)-&gt;extent_tree;</div><div class='del'>-	const u32 sectorsize = fs_info-&gt;sectorsize;</div><div class='del'>-	int ret;</div><div class='del'>-	u64 logical;</div><div class='del'>-</div><div class='del'>-	failrec = get_state_failrec(failure_tree, start);</div><div class='del'>-	if (!IS_ERR(failrec)) {</div><div class='del'>-		btrfs_debug(fs_info,</div><div class='del'>-	"Get IO Failure Record: (found) logical=%llu, start=%llu, len=%llu",</div><div class='del'>-			failrec-&gt;logical, failrec-&gt;start, failrec-&gt;len);</div><div class='del'>-		/*</div><div class='del'>-		 * when data can be on disk more than twice, add to failrec here</div><div class='del'>-		 * (e.g. with a list for failed_mirror) to make</div><div class='del'>-		 * clean_io_failure() clean all those errors at once.</div><div class='del'>-		 */</div><div class='del'>-</div><div class='del'>-		return failrec;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	failrec = kzalloc(sizeof(*failrec), GFP_NOFS);</div><div class='del'>-	if (!failrec)</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='del'>-</div><div class='del'>-	failrec-&gt;start = start;</div><div class='del'>-	failrec-&gt;len = sectorsize;</div><div class='del'>-	failrec-&gt;this_mirror = 0;</div><div class='del'>-	failrec-&gt;bio_flags = 0;</div><div class='del'>-</div><div class='del'>-	read_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	em = lookup_extent_mapping(em_tree, start, failrec-&gt;len);</div><div class='del'>-	if (!em) {</div><div class='del'>-		read_unlock(&amp;em_tree-&gt;lock);</div><div class='del'>-		kfree(failrec);</div><div class='del'>-		return ERR_PTR(-EIO);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (em-&gt;start &gt; start || em-&gt;start + em-&gt;len &lt;= start) {</div><div class='del'>-		free_extent_map(em);</div><div class='del'>-		em = NULL;</div><div class='del'>-	}</div><div class='del'>-	read_unlock(&amp;em_tree-&gt;lock);</div><div class='del'>-	if (!em) {</div><div class='del'>-		kfree(failrec);</div><div class='del'>-		return ERR_PTR(-EIO);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	logical = start - em-&gt;start;</div><div class='del'>-	logical = em-&gt;block_start + logical;</div><div class='del'>-	if (test_bit(EXTENT_FLAG_COMPRESSED, &amp;em-&gt;flags)) {</div><div class='del'>-		logical = em-&gt;block_start;</div><div class='del'>-		failrec-&gt;bio_flags = EXTENT_BIO_COMPRESSED;</div><div class='del'>-		extent_set_compress_type(&amp;failrec-&gt;bio_flags, em-&gt;compress_type);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	btrfs_debug(fs_info,</div><div class='del'>-		    "Get IO Failure Record: (new) logical=%llu, start=%llu, len=%llu",</div><div class='del'>-		    logical, start, failrec-&gt;len);</div><div class='del'>-</div><div class='del'>-	failrec-&gt;logical = logical;</div><div class='del'>-	free_extent_map(em);</div><div class='del'>-</div><div class='del'>-	/* Set the bits in the private failure tree */</div><div class='del'>-	ret = set_extent_bits(failure_tree, start, start + sectorsize - 1,</div><div class='del'>-			      EXTENT_LOCKED | EXTENT_DIRTY);</div><div class='del'>-	if (ret &gt;= 0) {</div><div class='del'>-		ret = set_state_failrec(failure_tree, start, failrec);</div><div class='del'>-		/* Set the bits in the inode's tree */</div><div class='del'>-		ret = set_extent_bits(tree, start, start + sectorsize - 1,</div><div class='del'>-				      EXTENT_DAMAGED);</div><div class='del'>-	} else if (ret &lt; 0) {</div><div class='del'>-		kfree(failrec);</div><div class='del'>-		return ERR_PTR(ret);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return failrec;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool btrfs_check_repairable(struct inode *inode,</div><div class='del'>-				   struct io_failure_record *failrec,</div><div class='del'>-				   int failed_mirror)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	int num_copies;</div><div class='del'>-</div><div class='del'>-	num_copies = btrfs_num_copies(fs_info, failrec-&gt;logical, failrec-&gt;len);</div><div class='del'>-	if (num_copies == 1) {</div><div class='del'>-		/*</div><div class='del'>-		 * we only have a single copy of the data, so don't bother with</div><div class='del'>-		 * all the retry and error correction code that follows. no</div><div class='del'>-		 * matter what the error is, it is very likely to persist.</div><div class='del'>-		 */</div><div class='del'>-		btrfs_debug(fs_info,</div><div class='del'>-			"Check Repairable: cannot repair, num_copies=%d, next_mirror %d, failed_mirror %d",</div><div class='del'>-			num_copies, failrec-&gt;this_mirror, failed_mirror);</div><div class='del'>-		return false;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* The failure record should only contain one sector */</div><div class='del'>-	ASSERT(failrec-&gt;len == fs_info-&gt;sectorsize);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * There are two premises:</div><div class='del'>-	 * a) deliver good data to the caller</div><div class='del'>-	 * b) correct the bad sectors on disk</div><div class='del'>-	 *</div><div class='del'>-	 * Since we're only doing repair for one sector, we only need to get</div><div class='del'>-	 * a good copy of the failed sector and if we succeed, we have setup</div><div class='del'>-	 * everything for repair_io_failure to do the rest for us.</div><div class='del'>-	 */</div><div class='del'>-	failrec-&gt;failed_mirror = failed_mirror;</div><div class='del'>-	failrec-&gt;this_mirror++;</div><div class='del'>-	if (failrec-&gt;this_mirror == failed_mirror)</div><div class='del'>-		failrec-&gt;this_mirror++;</div><div class='del'>-</div><div class='del'>-	if (failrec-&gt;this_mirror &gt; num_copies) {</div><div class='del'>-		btrfs_debug(fs_info,</div><div class='del'>-			"Check Repairable: (fail) num_copies=%d, next_mirror %d, failed_mirror %d",</div><div class='del'>-			num_copies, failrec-&gt;this_mirror, failed_mirror);</div><div class='del'>-		return false;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int btrfs_repair_one_sector(struct inode *inode,</div><div class='del'>-			    struct bio *failed_bio, u32 bio_offset,</div><div class='del'>-			    struct page *page, unsigned int pgoff,</div><div class='del'>-			    u64 start, int failed_mirror,</div><div class='del'>-			    submit_bio_hook_t *submit_bio_hook)</div><div class='del'>-{</div><div class='del'>-	struct io_failure_record *failrec;</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	struct extent_io_tree *tree = &amp;BTRFS_I(inode)-&gt;io_tree;</div><div class='del'>-	struct extent_io_tree *failure_tree = &amp;BTRFS_I(inode)-&gt;io_failure_tree;</div><div class='del'>-	struct btrfs_bio *failed_bbio = btrfs_bio(failed_bio);</div><div class='del'>-	const int icsum = bio_offset &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='del'>-	struct bio *repair_bio;</div><div class='del'>-	struct btrfs_bio *repair_bbio;</div><div class='del'>-	blk_status_t status;</div><div class='del'>-</div><div class='del'>-	btrfs_debug(fs_info,</div><div class='del'>-		   "repair read error: read error at %llu", start);</div><div class='del'>-</div><div class='del'>-	BUG_ON(bio_op(failed_bio) == REQ_OP_WRITE);</div><div class='del'>-</div><div class='del'>-	failrec = btrfs_get_io_failure_record(inode, start);</div><div class='del'>-	if (IS_ERR(failrec))</div><div class='del'>-		return PTR_ERR(failrec);</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-	if (!btrfs_check_repairable(inode, failrec, failed_mirror)) {</div><div class='del'>-		free_io_failure(failure_tree, tree, failrec);</div><div class='del'>-		return -EIO;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	repair_bio = btrfs_bio_alloc(1);</div><div class='del'>-	repair_bbio = btrfs_bio(repair_bio);</div><div class='del'>-	repair_bio-&gt;bi_opf = REQ_OP_READ;</div><div class='del'>-	repair_bio-&gt;bi_end_io = failed_bio-&gt;bi_end_io;</div><div class='del'>-	repair_bio-&gt;bi_iter.bi_sector = failrec-&gt;logical &gt;&gt; 9;</div><div class='del'>-	repair_bio-&gt;bi_private = failed_bio-&gt;bi_private;</div><div class='del'>-</div><div class='del'>-	if (failed_bbio-&gt;csum) {</div><div class='del'>-		const u32 csum_size = fs_info-&gt;csum_size;</div><div class='del'>-</div><div class='del'>-		repair_bbio-&gt;csum = repair_bbio-&gt;csum_inline;</div><div class='del'>-		memcpy(repair_bbio-&gt;csum,</div><div class='del'>-		       failed_bbio-&gt;csum + csum_size * icsum, csum_size);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	bio_add_page(repair_bio, page, failrec-&gt;len, pgoff);</div><div class='del'>-	repair_bbio-&gt;iter = repair_bio-&gt;bi_iter;</div><div class='del'>-</div><div class='del'>-	btrfs_debug(btrfs_sb(inode-&gt;i_sb),</div><div class='del'>-		    "repair read error: submitting new read to mirror %d",</div><div class='del'>-		    failrec-&gt;this_mirror);</div><div class='del'>-</div><div class='del'>-	status = submit_bio_hook(inode, repair_bio, failrec-&gt;this_mirror,</div><div class='del'>-				 failrec-&gt;bio_flags);</div><div class='del'>-	if (status) {</div><div class='del'>-		free_io_failure(failure_tree, tree, failrec);</div><div class='del'>-		bio_put(repair_bio);</div><div class='del'>-	}</div><div class='del'>-	return blk_status_to_errno(status);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void end_page_read(struct page *page, bool uptodate, u64 start, u32 len)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(page-&gt;mapping-&gt;host-&gt;i_sb);</div><div class='del'>-</div><div class='del'>-	ASSERT(page_offset(page) &lt;= start &amp;&amp;</div><div class='del'>-	       start + len &lt;= page_offset(page) + PAGE_SIZE);</div><div class='del'>-</div><div class='del'>-	if (uptodate) {</div><div class='del'>-		if (fsverity_active(page-&gt;mapping-&gt;host) &amp;&amp;</div><div class='del'>-		    !PageError(page) &amp;&amp;</div><div class='del'>-		    !PageUptodate(page) &amp;&amp;</div><div class='del'>-		    start &lt; i_size_read(page-&gt;mapping-&gt;host) &amp;&amp;</div><div class='del'>-		    !fsverity_verify_page(page)) {</div><div class='del'>-			btrfs_page_set_error(fs_info, page, start, len);</div><div class='del'>-		} else {</div><div class='del'>-			btrfs_page_set_uptodate(fs_info, page, start, len);</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-		btrfs_page_clear_uptodate(fs_info, page, start, len);</div><div class='del'>-		btrfs_page_set_error(fs_info, page, start, len);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (fs_info-&gt;sectorsize == PAGE_SIZE)</div><div class='del'>-		unlock_page(page);</div><div class='add'>+	if (!btrfs_is_subpage(fs_info, folio))</div><div class='add'>+		folio_unlock(folio);</div><div class='ctx'> 	else</div><div class='del'>-		btrfs_subpage_end_reader(fs_info, page, start, len);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static blk_status_t submit_read_repair(struct inode *inode,</div><div class='del'>-				      struct bio *failed_bio, u32 bio_offset,</div><div class='del'>-				      struct page *page, unsigned int pgoff,</div><div class='del'>-				      u64 start, u64 end, int failed_mirror,</div><div class='del'>-				      unsigned int error_bitmap,</div><div class='del'>-				      submit_bio_hook_t *submit_bio_hook)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	const u32 sectorsize = fs_info-&gt;sectorsize;</div><div class='del'>-	const int nr_bits = (end + 1 - start) &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='del'>-	int error = 0;</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	BUG_ON(bio_op(failed_bio) == REQ_OP_WRITE);</div><div class='del'>-</div><div class='del'>-	/* We're here because we had some read errors or csum mismatch */</div><div class='del'>-	ASSERT(error_bitmap);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * We only get called on buffered IO, thus page must be mapped and bio</div><div class='del'>-	 * must not be cloned.</div><div class='del'>-	 */</div><div class='del'>-	ASSERT(page-&gt;mapping &amp;&amp; !bio_flagged(failed_bio, BIO_CLONED));</div><div class='del'>-</div><div class='del'>-	/* Iterate through all the sectors in the range */</div><div class='del'>-	for (i = 0; i &lt; nr_bits; i++) {</div><div class='del'>-		const unsigned int offset = i * sectorsize;</div><div class='del'>-		struct extent_state *cached = NULL;</div><div class='del'>-		bool uptodate = false;</div><div class='del'>-		int ret;</div><div class='del'>-</div><div class='del'>-		if (!(error_bitmap &amp; (1U &lt;&lt; i))) {</div><div class='del'>-			/*</div><div class='del'>-			 * This sector has no error, just end the page read</div><div class='del'>-			 * and unlock the range.</div><div class='del'>-			 */</div><div class='del'>-			uptodate = true;</div><div class='del'>-			goto next;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		ret = btrfs_repair_one_sector(inode, failed_bio,</div><div class='del'>-				bio_offset + offset,</div><div class='del'>-				page, pgoff + offset, start + offset,</div><div class='del'>-				failed_mirror, submit_bio_hook);</div><div class='del'>-		if (!ret) {</div><div class='del'>-			/*</div><div class='del'>-			 * We have submitted the read repair, the page release</div><div class='del'>-			 * will be handled by the endio function of the</div><div class='del'>-			 * submitted repair bio.</div><div class='del'>-			 * Thus we don't need to do any thing here.</div><div class='del'>-			 */</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-		/*</div><div class='del'>-		 * Repair failed, just record the error but still continue.</div><div class='del'>-		 * Or the remaining sectors will not be properly unlocked.</div><div class='del'>-		 */</div><div class='del'>-		if (!error)</div><div class='del'>-			error = ret;</div><div class='del'>-next:</div><div class='del'>-		end_page_read(page, uptodate, start + offset, sectorsize);</div><div class='del'>-		if (uptodate)</div><div class='del'>-			set_extent_uptodate(&amp;BTRFS_I(inode)-&gt;io_tree,</div><div class='del'>-					start + offset,</div><div class='del'>-					start + offset + sectorsize - 1,</div><div class='del'>-					&amp;cached, GFP_ATOMIC);</div><div class='del'>-		unlock_extent_cached_atomic(&amp;BTRFS_I(inode)-&gt;io_tree,</div><div class='del'>-				start + offset,</div><div class='del'>-				start + offset + sectorsize - 1,</div><div class='del'>-				&amp;cached);</div><div class='del'>-	}</div><div class='del'>-	return errno_to_blk_status(error);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* lots and lots of room for performance fixes in the end_bio funcs */</div><div class='del'>-</div><div class='del'>-void end_extent_writepage(struct page *page, int err, u64 start, u64 end)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_inode *inode;</div><div class='del'>-	const bool uptodate = (err == 0);</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	ASSERT(page &amp;&amp; page-&gt;mapping);</div><div class='del'>-	inode = BTRFS_I(page-&gt;mapping-&gt;host);</div><div class='del'>-	btrfs_writepage_endio_finish_ordered(inode, page, start, end, uptodate);</div><div class='del'>-</div><div class='del'>-	if (!uptodate) {</div><div class='del'>-		const struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='del'>-		u32 len;</div><div class='del'>-</div><div class='del'>-		ASSERT(end + 1 - start &lt;= U32_MAX);</div><div class='del'>-		len = end + 1 - start;</div><div class='del'>-</div><div class='del'>-		btrfs_page_clear_uptodate(fs_info, page, start, len);</div><div class='del'>-		btrfs_page_set_error(fs_info, page, start, len);</div><div class='del'>-		ret = err &lt; 0 ? err : -EIO;</div><div class='del'>-		mapping_set_error(page-&gt;mapping, ret);</div><div class='del'>-	}</div><div class='add'>+		btrfs_folio_end_lock(fs_info, folio, start, len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * after a writepage IO is done, we need to:</div><div class='del'>- * clear the uptodate bits on error</div><div class='del'>- * clear the writeback bits in the extent tree for this IO</div><div class='del'>- * end_page_writeback if the page has no more pending IO</div><div class='add'>+ * After a write IO is done, we need to:</div><div class='add'>+ *</div><div class='add'>+ * - clear the uptodate bits on error</div><div class='add'>+ * - clear the writeback bits in the extent tree for the range</div><div class='add'>+ * - filio_end_writeback()  if there is no more pending io for the folio</div><div class='ctx'>  *</div><div class='ctx'>  * Scheduling is not allowed, so the extent state tree is expected</div><div class='ctx'>  * to have one and only one object corresponding to this IO.</div><div class='ctx'>  */</div><div class='del'>-static void end_bio_extent_writepage(struct bio *bio)</div><div class='add'>+static void end_bbio_data_write(struct btrfs_bio *bbio)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = bbio-&gt;inode-&gt;root-&gt;fs_info;</div><div class='add'>+	struct bio *bio = &amp;bbio-&gt;bio;</div><div class='ctx'> 	int error = blk_status_to_errno(bio-&gt;bi_status);</div><div class='del'>-	struct bio_vec *bvec;</div><div class='del'>-	u64 start;</div><div class='del'>-	u64 end;</div><div class='del'>-	struct bvec_iter_all iter_all;</div><div class='del'>-	bool first_bvec = true;</div><div class='add'>+	struct folio_iter fi;</div><div class='add'>+	const u32 sectorsize = fs_info-&gt;sectorsize;</div><div class='ctx'> </div><div class='ctx'> 	ASSERT(!bio_flagged(bio, BIO_CLONED));</div><div class='del'>-	bio_for_each_segment_all(bvec, bio, iter_all) {</div><div class='del'>-		struct page *page = bvec-&gt;bv_page;</div><div class='del'>-		struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-		struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-		const u32 sectorsize = fs_info-&gt;sectorsize;</div><div class='add'>+	bio_for_each_folio_all(fi, bio) {</div><div class='add'>+		struct folio *folio = fi.folio;</div><div class='add'>+		u64 start = folio_pos(folio) + fi.offset;</div><div class='add'>+		u32 len = fi.length;</div><div class='ctx'> </div><div class='ctx'> 		/* Our read/write should always be sector aligned. */</div><div class='del'>-		if (!IS_ALIGNED(bvec-&gt;bv_offset, sectorsize))</div><div class='add'>+		if (!IS_ALIGNED(fi.offset, sectorsize))</div><div class='ctx'> 			btrfs_err(fs_info,</div><div class='del'>-		"partial page write in btrfs with offset %u and length %u",</div><div class='del'>-				  bvec-&gt;bv_offset, bvec-&gt;bv_len);</div><div class='del'>-		else if (!IS_ALIGNED(bvec-&gt;bv_len, sectorsize))</div><div class='add'>+		"partial page write in btrfs with offset %zu and length %zu",</div><div class='add'>+				  fi.offset, fi.length);</div><div class='add'>+		else if (!IS_ALIGNED(fi.length, sectorsize))</div><div class='ctx'> 			btrfs_info(fs_info,</div><div class='del'>-		"incomplete page write with offset %u and length %u",</div><div class='del'>-				   bvec-&gt;bv_offset, bvec-&gt;bv_len);</div><div class='del'>-</div><div class='del'>-		start = page_offset(page) + bvec-&gt;bv_offset;</div><div class='del'>-		end = start + bvec-&gt;bv_len - 1;</div><div class='del'>-</div><div class='del'>-		if (first_bvec) {</div><div class='del'>-			btrfs_record_physical_zoned(inode, start, bio);</div><div class='del'>-			first_bvec = false;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		end_extent_writepage(page, error, start, end);</div><div class='add'>+		"incomplete page write with offset %zu and length %zu",</div><div class='add'>+				   fi.offset, fi.length);</div><div class='ctx'> </div><div class='del'>-		btrfs_page_clear_writeback(fs_info, page, start, bvec-&gt;bv_len);</div><div class='add'>+		btrfs_finish_ordered_extent(bbio-&gt;ordered, folio, start, len,</div><div class='add'>+					    !error);</div><div class='add'>+		if (error)</div><div class='add'>+			mapping_set_error(folio-&gt;mapping, error);</div><div class='add'>+		btrfs_folio_clear_writeback(fs_info, folio, start, len);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	bio_put(bio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Record previously processed extent range</div><div class='del'>- *</div><div class='del'>- * For endio_readpage_release_extent() to handle a full extent range, reducing</div><div class='del'>- * the extent io operations.</div><div class='del'>- */</div><div class='del'>-struct processed_extent {</div><div class='del'>-	struct btrfs_inode *inode;</div><div class='del'>-	/* Start of the range in @inode */</div><div class='del'>-	u64 start;</div><div class='del'>-	/* End of the range in @inode */</div><div class='del'>-	u64 end;</div><div class='del'>-	bool uptodate;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Try to release processed extent range</div><div class='del'>- *</div><div class='del'>- * May not release the extent range right now if the current range is</div><div class='del'>- * contiguous to processed extent.</div><div class='del'>- *</div><div class='del'>- * Will release processed extent when any of @inode, @uptodate, the range is</div><div class='del'>- * no longer contiguous to the processed range.</div><div class='del'>- *</div><div class='del'>- * Passing @inode == NULL will force processed extent to be released.</div><div class='del'>- */</div><div class='del'>-static void endio_readpage_release_extent(struct processed_extent *processed,</div><div class='del'>-			      struct btrfs_inode *inode, u64 start, u64 end,</div><div class='del'>-			      bool uptodate)</div><div class='add'>+static void begin_folio_read(struct btrfs_fs_info *fs_info, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct extent_state *cached = NULL;</div><div class='del'>-	struct extent_io_tree *tree;</div><div class='del'>-</div><div class='del'>-	/* The first extent, initialize @processed */</div><div class='del'>-	if (!processed-&gt;inode)</div><div class='del'>-		goto update;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Contiguous to processed extent, just uptodate the end.</div><div class='del'>-	 *</div><div class='del'>-	 * Several things to notice:</div><div class='del'>-	 *</div><div class='del'>-	 * - bio can be merged as long as on-disk bytenr is contiguous</div><div class='del'>-	 *   This means we can have page belonging to other inodes, thus need to</div><div class='del'>-	 *   check if the inode still matches.</div><div class='del'>-	 * - bvec can contain range beyond current page for multi-page bvec</div><div class='del'>-	 *   Thus we need to do processed-&gt;end + 1 &gt;= start check</div><div class='del'>-	 */</div><div class='del'>-	if (processed-&gt;inode == inode &amp;&amp; processed-&gt;uptodate == uptodate &amp;&amp;</div><div class='del'>-	    processed-&gt;end + 1 &gt;= start &amp;&amp; end &gt;= processed-&gt;end) {</div><div class='del'>-		processed-&gt;end = end;</div><div class='add'>+	ASSERT(folio_test_locked(folio));</div><div class='add'>+	if (!btrfs_is_subpage(fs_info, folio))</div><div class='ctx'> 		return;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	tree = &amp;processed-&gt;inode-&gt;io_tree;</div><div class='del'>-	/*</div><div class='del'>-	 * Now we don't have range contiguous to the processed range, release</div><div class='del'>-	 * the processed range now.</div><div class='del'>-	 */</div><div class='del'>-	if (processed-&gt;uptodate &amp;&amp; tree-&gt;track_uptodate)</div><div class='del'>-		set_extent_uptodate(tree, processed-&gt;start, processed-&gt;end,</div><div class='del'>-				    &amp;cached, GFP_ATOMIC);</div><div class='del'>-	unlock_extent_cached_atomic(tree, processed-&gt;start, processed-&gt;end,</div><div class='del'>-				    &amp;cached);</div><div class='del'>-</div><div class='del'>-update:</div><div class='del'>-	/* Update processed to current range */</div><div class='del'>-	processed-&gt;inode = inode;</div><div class='del'>-	processed-&gt;start = start;</div><div class='del'>-	processed-&gt;end = end;</div><div class='del'>-	processed-&gt;uptodate = uptodate;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void begin_page_read(struct btrfs_fs_info *fs_info, struct page *page)</div><div class='del'>-{</div><div class='del'>-	ASSERT(PageLocked(page));</div><div class='del'>-	if (fs_info-&gt;sectorsize == PAGE_SIZE)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	ASSERT(PagePrivate(page));</div><div class='del'>-	btrfs_subpage_start_reader(fs_info, page, page_offset(page), PAGE_SIZE);</div><div class='add'>+	ASSERT(folio_test_private(folio));</div><div class='add'>+	btrfs_folio_set_lock(fs_info, folio, folio_pos(folio), folio_size(folio));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Find extent buffer for a givne bytenr.</div><div class='add'>+ * After a data read IO is done, we need to:</div><div class='ctx'>  *</div><div class='del'>- * This is for end_bio_extent_readpage(), thus we can't do any unsafe locking</div><div class='del'>- * in endio context.</div><div class='del'>- */</div><div class='del'>-static struct extent_buffer *find_extent_buffer_readpage(</div><div class='del'>-		struct btrfs_fs_info *fs_info, struct page *page, u64 bytenr)</div><div class='del'>-{</div><div class='del'>-	struct extent_buffer *eb;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * For regular sectorsize, we can use page-&gt;private to grab extent</div><div class='del'>-	 * buffer</div><div class='del'>-	 */</div><div class='del'>-	if (fs_info-&gt;sectorsize == PAGE_SIZE) {</div><div class='del'>-		ASSERT(PagePrivate(page) &amp;&amp; page-&gt;private);</div><div class='del'>-		return (struct extent_buffer *)page-&gt;private;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* For subpage case, we need to lookup buffer radix tree */</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	eb = radix_tree_lookup(&amp;fs_info-&gt;buffer_radix,</div><div class='del'>-			       bytenr &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-	ASSERT(eb);</div><div class='del'>-	return eb;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * after a readpage IO is done, we need to:</div><div class='del'>- * clear the uptodate bits on error</div><div class='del'>- * set the uptodate bits if things worked</div><div class='del'>- * set the page up to date if all extents in the tree are uptodate</div><div class='del'>- * clear the lock bit in the extent tree</div><div class='del'>- * unlock the page if there are no other extents locked for it</div><div class='add'>+ * - clear the uptodate bits on error</div><div class='add'>+ * - set the uptodate bits if things worked</div><div class='add'>+ * - set the folio up to date if all extents in the tree are uptodate</div><div class='add'>+ * - clear the lock bit in the extent tree</div><div class='add'>+ * - unlock the folio if there are no other extents locked for it</div><div class='ctx'>  *</div><div class='ctx'>  * Scheduling is not allowed, so the extent state tree is expected</div><div class='ctx'>  * to have one and only one object corresponding to this IO.</div><div class='ctx'>  */</div><div class='del'>-static void end_bio_extent_readpage(struct bio *bio)</div><div class='add'>+static void end_bbio_data_read(struct btrfs_bio *bbio)</div><div class='ctx'> {</div><div class='del'>-	struct bio_vec *bvec;</div><div class='del'>-	struct btrfs_bio *bbio = btrfs_bio(bio);</div><div class='del'>-	struct extent_io_tree *tree, *failure_tree;</div><div class='del'>-	struct processed_extent processed = { 0 };</div><div class='del'>-	/*</div><div class='del'>-	 * The offset to the beginning of a bio, since one bio can never be</div><div class='del'>-	 * larger than UINT_MAX, u32 here is enough.</div><div class='del'>-	 */</div><div class='del'>-	u32 bio_offset = 0;</div><div class='del'>-	int mirror;</div><div class='del'>-	int ret;</div><div class='del'>-	struct bvec_iter_all iter_all;</div><div class='add'>+	struct btrfs_fs_info *fs_info = bbio-&gt;inode-&gt;root-&gt;fs_info;</div><div class='add'>+	struct bio *bio = &amp;bbio-&gt;bio;</div><div class='add'>+	struct folio_iter fi;</div><div class='ctx'> </div><div class='ctx'> 	ASSERT(!bio_flagged(bio, BIO_CLONED));</div><div class='del'>-	bio_for_each_segment_all(bvec, bio, iter_all) {</div><div class='add'>+	bio_for_each_folio_all(fi, &amp;bbio-&gt;bio) {</div><div class='ctx'> 		bool uptodate = !bio-&gt;bi_status;</div><div class='del'>-		struct page *page = bvec-&gt;bv_page;</div><div class='del'>-		struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-		struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-		const u32 sectorsize = fs_info-&gt;sectorsize;</div><div class='del'>-		unsigned int error_bitmap = (unsigned int)-1;</div><div class='del'>-		u64 start;</div><div class='del'>-		u64 end;</div><div class='del'>-		u32 len;</div><div class='add'>+		struct folio *folio = fi.folio;</div><div class='add'>+		struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+		u64 start = folio_pos(folio) + fi.offset;</div><div class='ctx'> </div><div class='ctx'> 		btrfs_debug(fs_info,</div><div class='del'>-			"end_bio_extent_readpage: bi_sector=%llu, err=%d, mirror=%u",</div><div class='del'>-			bio-&gt;bi_iter.bi_sector, bio-&gt;bi_status,</div><div class='add'>+			"%s: bi_sector=%llu, err=%d, mirror=%u",</div><div class='add'>+			__func__, bio-&gt;bi_iter.bi_sector, bio-&gt;bi_status,</div><div class='ctx'> 			bbio-&gt;mirror_num);</div><div class='del'>-		tree = &amp;BTRFS_I(inode)-&gt;io_tree;</div><div class='del'>-		failure_tree = &amp;BTRFS_I(inode)-&gt;io_failure_tree;</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * We always issue full-sector reads, but if some block in a</div><div class='del'>-		 * page fails to read, blk_update_request() will advance</div><div class='del'>-		 * bv_offset and adjust bv_len to compensate.  Print a warning</div><div class='del'>-		 * for unaligned offsets, and an error if they don't add up to</div><div class='del'>-		 * a full sector.</div><div class='del'>-		 */</div><div class='del'>-		if (!IS_ALIGNED(bvec-&gt;bv_offset, sectorsize))</div><div class='del'>-			btrfs_err(fs_info,</div><div class='del'>-		"partial page read in btrfs with offset %u and length %u",</div><div class='del'>-				  bvec-&gt;bv_offset, bvec-&gt;bv_len);</div><div class='del'>-		else if (!IS_ALIGNED(bvec-&gt;bv_offset + bvec-&gt;bv_len,</div><div class='del'>-				     sectorsize))</div><div class='del'>-			btrfs_info(fs_info,</div><div class='del'>-		"incomplete page read with offset %u and length %u",</div><div class='del'>-				   bvec-&gt;bv_offset, bvec-&gt;bv_len);</div><div class='del'>-</div><div class='del'>-		start = page_offset(page) + bvec-&gt;bv_offset;</div><div class='del'>-		end = start + bvec-&gt;bv_len - 1;</div><div class='del'>-		len = bvec-&gt;bv_len;</div><div class='ctx'> </div><div class='del'>-		mirror = bbio-&gt;mirror_num;</div><div class='del'>-		if (likely(uptodate)) {</div><div class='del'>-			if (is_data_inode(inode)) {</div><div class='del'>-				error_bitmap = btrfs_verify_data_csum(bbio,</div><div class='del'>-						bio_offset, page, start, end);</div><div class='del'>-				ret = error_bitmap;</div><div class='del'>-			} else {</div><div class='del'>-				ret = btrfs_validate_metadata_buffer(bbio,</div><div class='del'>-					page, start, end, mirror);</div><div class='del'>-			}</div><div class='del'>-			if (ret)</div><div class='del'>-				uptodate = false;</div><div class='del'>-			else</div><div class='del'>-				clean_io_failure(BTRFS_I(inode)-&gt;root-&gt;fs_info,</div><div class='del'>-						 failure_tree, tree, start,</div><div class='del'>-						 page,</div><div class='del'>-						 btrfs_ino(BTRFS_I(inode)), 0);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (likely(uptodate))</div><div class='del'>-			goto readpage_ok;</div><div class='del'>-</div><div class='del'>-		if (is_data_inode(inode)) {</div><div class='del'>-			/*</div><div class='del'>-			 * btrfs_submit_read_repair() will handle all the good</div><div class='del'>-			 * and bad sectors, we just continue to the next bvec.</div><div class='del'>-			 */</div><div class='del'>-			submit_read_repair(inode, bio, bio_offset, page,</div><div class='del'>-					   start - page_offset(page), start,</div><div class='del'>-					   end, mirror, error_bitmap,</div><div class='del'>-					   btrfs_submit_data_bio);</div><div class='del'>-</div><div class='del'>-			ASSERT(bio_offset + len &gt; bio_offset);</div><div class='del'>-			bio_offset += len;</div><div class='del'>-			continue;</div><div class='del'>-		} else {</div><div class='del'>-			struct extent_buffer *eb;</div><div class='del'>-</div><div class='del'>-			eb = find_extent_buffer_readpage(fs_info, page, start);</div><div class='del'>-			set_bit(EXTENT_BUFFER_READ_ERR, &amp;eb-&gt;bflags);</div><div class='del'>-			eb-&gt;read_mirror = mirror;</div><div class='del'>-			atomic_dec(&amp;eb-&gt;io_pages);</div><div class='del'>-			if (test_and_clear_bit(EXTENT_BUFFER_READAHEAD,</div><div class='del'>-					       &amp;eb-&gt;bflags))</div><div class='del'>-				btree_readahead_hook(eb, -EIO);</div><div class='del'>-		}</div><div class='del'>-readpage_ok:</div><div class='ctx'> 		if (likely(uptodate)) {</div><div class='add'>+			u64 end = start + fi.length - 1;</div><div class='ctx'> 			loff_t i_size = i_size_read(inode);</div><div class='del'>-			pgoff_t end_index = i_size &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> </div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Zero out the remaining part if this range straddles</div><div class='ctx'> 			 * i_size.</div><div class='ctx'> 			 *</div><div class='del'>-			 * Here we should only zero the range inside the bvec,</div><div class='add'>+			 * Here we should only zero the range inside the folio,</div><div class='ctx'> 			 * not touch anything else.</div><div class='ctx'> 			 *</div><div class='del'>-			 * NOTE: i_size is exclusive while end is inclusive.</div><div class='add'>+			 * NOTE: i_size is exclusive while end is inclusive and</div><div class='add'>+			 * folio_contains() takes PAGE_SIZE units.</div><div class='ctx'> 			 */</div><div class='del'>-			if (page-&gt;index == end_index &amp;&amp; i_size &lt;= end) {</div><div class='del'>-				u32 zero_start = max(offset_in_page(i_size),</div><div class='del'>-						     offset_in_page(start));</div><div class='del'>-</div><div class='del'>-				zero_user_segment(page, zero_start,</div><div class='del'>-						  offset_in_page(end) + 1);</div><div class='add'>+			if (folio_contains(folio, i_size &gt;&gt; PAGE_SHIFT) &amp;&amp;</div><div class='add'>+			    i_size &lt;= end) {</div><div class='add'>+				u32 zero_start = max(offset_in_folio(folio, i_size),</div><div class='add'>+						     offset_in_folio(folio, start));</div><div class='add'>+				u32 zero_len = offset_in_folio(folio, end) + 1 -</div><div class='add'>+					       zero_start;</div><div class='add'>+</div><div class='add'>+				folio_zero_range(folio, zero_start, zero_len);</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		ASSERT(bio_offset + len &gt; bio_offset);</div><div class='del'>-		bio_offset += len;</div><div class='ctx'> </div><div class='del'>-		/* Update page status and unlock */</div><div class='del'>-		end_page_read(page, uptodate, start, len);</div><div class='del'>-		endio_readpage_release_extent(&amp;processed, BTRFS_I(inode),</div><div class='del'>-					      start, end, PageUptodate(page));</div><div class='add'>+		/* Update page status and unlock. */</div><div class='add'>+		end_folio_read(folio, uptodate, start, fi.length);</div><div class='ctx'> 	}</div><div class='del'>-	/* Release the last extent */</div><div class='del'>-	endio_readpage_release_extent(&amp;processed, NULL, 0, 0, false);</div><div class='del'>-	btrfs_bio_free_csum(bbio);</div><div class='ctx'> 	bio_put(bio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Initialize the members up to but not including 'bio'. Use after allocating a</div><div class='del'>- * new bio by bio_alloc_bioset as it does not initialize the bytes outside of</div><div class='del'>- * 'bio' because use of __GFP_ZERO is not supported.</div><div class='add'>+ * Populate every free slot in a provided array with folios using GFP_NOFS.</div><div class='add'>+ *</div><div class='add'>+ * @nr_folios:   number of folios to allocate</div><div class='add'>+ * @order:	 the order of the folios to be allocated</div><div class='add'>+ * @folio_array: the array to fill with folios; any existing non-NULL entries in</div><div class='add'>+ *		 the array will be skipped</div><div class='add'>+ *</div><div class='add'>+ * Return: 0        if all folios were able to be allocated;</div><div class='add'>+ *         -ENOMEM  otherwise, the partially allocated folios would be freed and</div><div class='add'>+ *                  the array slots zeroed</div><div class='ctx'>  */</div><div class='del'>-static inline void btrfs_bio_init(struct btrfs_bio *bbio)</div><div class='add'>+int btrfs_alloc_folio_array(unsigned int nr_folios, unsigned int order,</div><div class='add'>+			    struct folio **folio_array)</div><div class='ctx'> {</div><div class='del'>-	memset(bbio, 0, offsetof(struct btrfs_bio, bio));</div><div class='add'>+	for (int i = 0; i &lt; nr_folios; i++) {</div><div class='add'>+		if (folio_array[i])</div><div class='add'>+			continue;</div><div class='add'>+		folio_array[i] = folio_alloc(GFP_NOFS, order);</div><div class='add'>+		if (!folio_array[i])</div><div class='add'>+			goto error;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+error:</div><div class='add'>+	for (int i = 0; i &lt; nr_folios; i++) {</div><div class='add'>+		if (folio_array[i])</div><div class='add'>+			folio_put(folio_array[i]);</div><div class='add'>+		folio_array[i] = NULL;</div><div class='add'>+	}</div><div class='add'>+	return -ENOMEM;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Allocate a btrfs_io_bio, with @nr_iovecs as maximum number of iovecs.</div><div class='add'>+ * Populate every free slot in a provided array with pages, using GFP_NOFS.</div><div class='add'>+ *</div><div class='add'>+ * @nr_pages:   number of pages to allocate</div><div class='add'>+ * @page_array: the array to fill with pages; any existing non-null entries in</div><div class='add'>+ *		the array will be skipped</div><div class='add'>+ * @nofail:	whether using __GFP_NOFAIL flag</div><div class='ctx'>  *</div><div class='del'>- * The bio allocation is backed by bioset and does not fail.</div><div class='add'>+ * Return: 0        if all pages were able to be allocated;</div><div class='add'>+ *         -ENOMEM  otherwise, the partially allocated pages would be freed and</div><div class='add'>+ *                  the array slots zeroed</div><div class='ctx'>  */</div><div class='del'>-struct bio *btrfs_bio_alloc(unsigned int nr_iovecs)</div><div class='del'>-{</div><div class='del'>-	struct bio *bio;</div><div class='del'>-</div><div class='del'>-	ASSERT(0 &lt; nr_iovecs &amp;&amp; nr_iovecs &lt;= BIO_MAX_VECS);</div><div class='del'>-	bio = bio_alloc_bioset(GFP_NOFS, nr_iovecs, &amp;btrfs_bioset);</div><div class='del'>-	btrfs_bio_init(btrfs_bio(bio));</div><div class='del'>-	return bio;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct bio *btrfs_bio_clone(struct bio *bio)</div><div class='add'>+int btrfs_alloc_page_array(unsigned int nr_pages, struct page **page_array,</div><div class='add'>+			   bool nofail)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_bio *bbio;</div><div class='del'>-	struct bio *new;</div><div class='del'>-</div><div class='del'>-	/* Bio allocation backed by a bioset does not fail */</div><div class='del'>-	new = bio_clone_fast(bio, GFP_NOFS, &amp;btrfs_bioset);</div><div class='del'>-	bbio = btrfs_bio(new);</div><div class='del'>-	btrfs_bio_init(bbio);</div><div class='del'>-	bbio-&gt;iter = bio-&gt;bi_iter;</div><div class='del'>-	return new;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct bio *btrfs_bio_clone_partial(struct bio *orig, u64 offset, u64 size)</div><div class='del'>-{</div><div class='del'>-	struct bio *bio;</div><div class='del'>-	struct btrfs_bio *bbio;</div><div class='add'>+	const gfp_t gfp = nofail ? (GFP_NOFS | __GFP_NOFAIL) : GFP_NOFS;</div><div class='add'>+	unsigned int allocated;</div><div class='ctx'> </div><div class='del'>-	ASSERT(offset &lt;= UINT_MAX &amp;&amp; size &lt;= UINT_MAX);</div><div class='add'>+	for (allocated = 0; allocated &lt; nr_pages;) {</div><div class='add'>+		unsigned int last = allocated;</div><div class='ctx'> </div><div class='del'>-	/* this will never fail when it's backed by a bioset */</div><div class='del'>-	bio = bio_clone_fast(orig, GFP_NOFS, &amp;btrfs_bioset);</div><div class='del'>-	ASSERT(bio);</div><div class='del'>-</div><div class='del'>-	bbio = btrfs_bio(bio);</div><div class='del'>-	btrfs_bio_init(bbio);</div><div class='del'>-</div><div class='del'>-	bio_trim(bio, offset &gt;&gt; 9, size &gt;&gt; 9);</div><div class='del'>-	bbio-&gt;iter = bio-&gt;bi_iter;</div><div class='del'>-	return bio;</div><div class='add'>+		allocated = alloc_pages_bulk(gfp, nr_pages, page_array);</div><div class='add'>+		if (unlikely(allocated == last)) {</div><div class='add'>+			/* No progress, fail and do cleanup. */</div><div class='add'>+			for (int i = 0; i &lt; allocated; i++) {</div><div class='add'>+				__free_page(page_array[i]);</div><div class='add'>+				page_array[i] = NULL;</div><div class='add'>+			}</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * Attempt to add a page to bio</div><div class='del'>- *</div><div class='del'>- * @bio:	destination bio</div><div class='del'>- * @page:	page to add to the bio</div><div class='del'>- * @disk_bytenr:  offset of the new bio or to check whether we are adding</div><div class='del'>- *                a contiguous page to the previous one</div><div class='del'>- * @pg_offset:	starting offset in the page</div><div class='del'>- * @size:	portion of page that we want to write</div><div class='del'>- * @prev_bio_flags:  flags of previous bio to see if we can merge the current one</div><div class='del'>- * @bio_flags:	flags of the current bio to see if we can merge them</div><div class='del'>- *</div><div class='del'>- * Attempt to add a page to bio considering stripe alignment etc.</div><div class='add'>+/*</div><div class='add'>+ * Populate needed folios for the extent buffer.</div><div class='ctx'>  *</div><div class='del'>- * Return &gt;= 0 for the number of bytes added to the bio.</div><div class='del'>- * Can return 0 if the current bio is already at stripe/zone boundary.</div><div class='del'>- * Return &lt;0 for error.</div><div class='add'>+ * For now, the folios populated are always in order 0 (aka, single page).</div><div class='ctx'>  */</div><div class='del'>-static int btrfs_bio_add_page(struct btrfs_bio_ctrl *bio_ctrl,</div><div class='del'>-			      struct page *page,</div><div class='del'>-			      u64 disk_bytenr, unsigned int size,</div><div class='del'>-			      unsigned int pg_offset,</div><div class='del'>-			      unsigned long bio_flags)</div><div class='add'>+static int alloc_eb_folio_array(struct extent_buffer *eb, bool nofail)</div><div class='ctx'> {</div><div class='del'>-	struct bio *bio = bio_ctrl-&gt;bio;</div><div class='del'>-	u32 bio_size = bio-&gt;bi_iter.bi_size;</div><div class='del'>-	u32 real_size;</div><div class='del'>-	const sector_t sector = disk_bytenr &gt;&gt; SECTOR_SHIFT;</div><div class='del'>-	bool contig;</div><div class='add'>+	struct page *page_array[INLINE_EXTENT_BUFFER_PAGES] = { 0 };</div><div class='add'>+	int num_pages = num_extent_pages(eb);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ASSERT(bio);</div><div class='del'>-	/* The limit should be calculated when bio_ctrl-&gt;bio is allocated */</div><div class='del'>-	ASSERT(bio_ctrl-&gt;len_to_oe_boundary &amp;&amp; bio_ctrl-&gt;len_to_stripe_boundary);</div><div class='del'>-	if (bio_ctrl-&gt;bio_flags != bio_flags)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	if (bio_ctrl-&gt;bio_flags &amp; EXTENT_BIO_COMPRESSED)</div><div class='del'>-		contig = bio-&gt;bi_iter.bi_sector == sector;</div><div class='del'>-	else</div><div class='del'>-		contig = bio_end_sector(bio) == sector;</div><div class='del'>-	if (!contig)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	real_size = min(bio_ctrl-&gt;len_to_oe_boundary,</div><div class='del'>-			bio_ctrl-&gt;len_to_stripe_boundary) - bio_size;</div><div class='del'>-	real_size = min(real_size, size);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If real_size is 0, never call bio_add_*_page(), as even size is 0,</div><div class='del'>-	 * bio will still execute its endio function on the page!</div><div class='del'>-	 */</div><div class='del'>-	if (real_size == 0)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	if (bio_op(bio) == REQ_OP_ZONE_APPEND)</div><div class='del'>-		ret = bio_add_zone_append_page(bio, page, real_size, pg_offset);</div><div class='del'>-	else</div><div class='del'>-		ret = bio_add_page(bio, page, real_size, pg_offset);</div><div class='add'>+	ret = btrfs_alloc_page_array(num_pages, page_array, nofail);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	return ret;</div><div class='add'>+	for (int i = 0; i &lt; num_pages; i++)</div><div class='add'>+		eb-&gt;folios[i] = page_folio(page_array[i]);</div><div class='add'>+	eb-&gt;folio_size = PAGE_SIZE;</div><div class='add'>+	eb-&gt;folio_shift = PAGE_SHIFT;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int calc_bio_boundaries(struct btrfs_bio_ctrl *bio_ctrl,</div><div class='del'>-			       struct btrfs_inode *inode, u64 file_offset)</div><div class='add'>+static bool btrfs_bio_is_contig(struct btrfs_bio_ctrl *bio_ctrl,</div><div class='add'>+				u64 disk_bytenr, loff_t file_offset)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='del'>-	struct btrfs_io_geometry geom;</div><div class='del'>-	struct btrfs_ordered_extent *ordered;</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	u64 logical = (bio_ctrl-&gt;bio-&gt;bi_iter.bi_sector &lt;&lt; SECTOR_SHIFT);</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Pages for compressed extent are never submitted to disk directly,</div><div class='del'>-	 * thus it has no real boundary, just set them to U32_MAX.</div><div class='del'>-	 *</div><div class='del'>-	 * The split happens for real compressed bio, which happens in</div><div class='del'>-	 * btrfs_submit_compressed_read/write().</div><div class='del'>-	 */</div><div class='del'>-	if (bio_ctrl-&gt;bio_flags &amp; EXTENT_BIO_COMPRESSED) {</div><div class='del'>-		bio_ctrl-&gt;len_to_oe_boundary = U32_MAX;</div><div class='del'>-		bio_ctrl-&gt;len_to_stripe_boundary = U32_MAX;</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-	em = btrfs_get_chunk_map(fs_info, logical, fs_info-&gt;sectorsize);</div><div class='del'>-	if (IS_ERR(em))</div><div class='del'>-		return PTR_ERR(em);</div><div class='del'>-	ret = btrfs_get_io_geometry(fs_info, em, btrfs_op(bio_ctrl-&gt;bio),</div><div class='del'>-				    logical, &amp;geom);</div><div class='del'>-	free_extent_map(em);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-	if (geom.len &gt; U32_MAX)</div><div class='del'>-		bio_ctrl-&gt;len_to_stripe_boundary = U32_MAX;</div><div class='del'>-	else</div><div class='del'>-		bio_ctrl-&gt;len_to_stripe_boundary = (u32)geom.len;</div><div class='del'>-</div><div class='del'>-	if (!btrfs_is_zoned(fs_info) ||</div><div class='del'>-	    bio_op(bio_ctrl-&gt;bio) != REQ_OP_ZONE_APPEND) {</div><div class='del'>-		bio_ctrl-&gt;len_to_oe_boundary = U32_MAX;</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='add'>+	struct bio *bio = &amp;bio_ctrl-&gt;bbio-&gt;bio;</div><div class='add'>+	const sector_t sector = disk_bytenr &gt;&gt; SECTOR_SHIFT;</div><div class='ctx'> </div><div class='del'>-	/* Ordered extent not yet created, so we're good */</div><div class='del'>-	ordered = btrfs_lookup_ordered_extent(inode, file_offset);</div><div class='del'>-	if (!ordered) {</div><div class='del'>-		bio_ctrl-&gt;len_to_oe_boundary = U32_MAX;</div><div class='del'>-		return 0;</div><div class='add'>+	if (bio_ctrl-&gt;compress_type != BTRFS_COMPRESS_NONE) {</div><div class='add'>+		/*</div><div class='add'>+		 * For compression, all IO should have its logical bytenr set</div><div class='add'>+		 * to the starting bytenr of the compressed extent.</div><div class='add'>+		 */</div><div class='add'>+		return bio-&gt;bi_iter.bi_sector == sector;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	bio_ctrl-&gt;len_to_oe_boundary = min_t(u32, U32_MAX,</div><div class='del'>-		ordered-&gt;disk_bytenr + ordered-&gt;disk_num_bytes - logical);</div><div class='del'>-	btrfs_put_ordered_extent(ordered);</div><div class='del'>-	return 0;</div><div class='add'>+	/*</div><div class='add'>+	 * To merge into a bio both the disk sector and the logical offset in</div><div class='add'>+	 * the file need to be contiguous.</div><div class='add'>+	 */</div><div class='add'>+	return bio_ctrl-&gt;next_file_offset == file_offset &amp;&amp;</div><div class='add'>+		bio_end_sector(bio) == sector;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int alloc_new_bio(struct btrfs_inode *inode,</div><div class='del'>-			 struct btrfs_bio_ctrl *bio_ctrl,</div><div class='del'>-			 struct writeback_control *wbc,</div><div class='del'>-			 unsigned int opf,</div><div class='del'>-			 bio_end_io_t end_io_func,</div><div class='del'>-			 u64 disk_bytenr, u32 offset, u64 file_offset,</div><div class='del'>-			 unsigned long bio_flags)</div><div class='add'>+static void alloc_new_bio(struct btrfs_inode *inode,</div><div class='add'>+			  struct btrfs_bio_ctrl *bio_ctrl,</div><div class='add'>+			  u64 disk_bytenr, u64 file_offset)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='del'>-	struct bio *bio;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	bio = btrfs_bio_alloc(BIO_MAX_VECS);</div><div class='del'>-	/*</div><div class='del'>-	 * For compressed page range, its disk_bytenr is always @disk_bytenr</div><div class='del'>-	 * passed in, no matter if we have added any range into previous bio.</div><div class='del'>-	 */</div><div class='del'>-	if (bio_flags &amp; EXTENT_BIO_COMPRESSED)</div><div class='del'>-		bio-&gt;bi_iter.bi_sector = disk_bytenr &gt;&gt; SECTOR_SHIFT;</div><div class='del'>-	else</div><div class='del'>-		bio-&gt;bi_iter.bi_sector = (disk_bytenr + offset) &gt;&gt; SECTOR_SHIFT;</div><div class='del'>-	bio_ctrl-&gt;bio = bio;</div><div class='del'>-	bio_ctrl-&gt;bio_flags = bio_flags;</div><div class='del'>-	bio-&gt;bi_end_io = end_io_func;</div><div class='del'>-	bio-&gt;bi_private = &amp;inode-&gt;io_tree;</div><div class='del'>-	bio-&gt;bi_write_hint = inode-&gt;vfs_inode.i_write_hint;</div><div class='del'>-	bio-&gt;bi_opf = opf;</div><div class='del'>-	ret = calc_bio_boundaries(bio_ctrl, inode, file_offset);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto error;</div><div class='del'>-	if (wbc) {</div><div class='del'>-		struct block_device *bdev;</div><div class='del'>-</div><div class='del'>-		bdev = fs_info-&gt;fs_devices-&gt;latest_dev-&gt;bdev;</div><div class='del'>-		bio_set_dev(bio, bdev);</div><div class='del'>-		wbc_init_bio(wbc, bio);</div><div class='del'>-	}</div><div class='del'>-	if (btrfs_is_zoned(fs_info) &amp;&amp; bio_op(bio) == REQ_OP_ZONE_APPEND) {</div><div class='del'>-		struct btrfs_device *device;</div><div class='add'>+	struct btrfs_bio *bbio;</div><div class='ctx'> </div><div class='del'>-		device = btrfs_zoned_get_device(fs_info, disk_bytenr,</div><div class='del'>-						fs_info-&gt;sectorsize);</div><div class='del'>-		if (IS_ERR(device)) {</div><div class='del'>-			ret = PTR_ERR(device);</div><div class='del'>-			goto error;</div><div class='add'>+	bbio = btrfs_bio_alloc(BIO_MAX_VECS, bio_ctrl-&gt;opf, inode,</div><div class='add'>+			       file_offset, bio_ctrl-&gt;end_io_func, NULL);</div><div class='add'>+	bbio-&gt;bio.bi_iter.bi_sector = disk_bytenr &gt;&gt; SECTOR_SHIFT;</div><div class='add'>+	bbio-&gt;bio.bi_write_hint = inode-&gt;vfs_inode.i_write_hint;</div><div class='add'>+	bio_ctrl-&gt;bbio = bbio;</div><div class='add'>+	bio_ctrl-&gt;len_to_oe_boundary = U32_MAX;</div><div class='add'>+	bio_ctrl-&gt;next_file_offset = file_offset;</div><div class='add'>+</div><div class='add'>+	/* Limit data write bios to the ordered boundary. */</div><div class='add'>+	if (bio_ctrl-&gt;wbc) {</div><div class='add'>+		struct btrfs_ordered_extent *ordered;</div><div class='add'>+</div><div class='add'>+		ordered = btrfs_lookup_ordered_extent(inode, file_offset);</div><div class='add'>+		if (ordered) {</div><div class='add'>+			bio_ctrl-&gt;len_to_oe_boundary = min_t(u32, U32_MAX,</div><div class='add'>+					ordered-&gt;file_offset +</div><div class='add'>+					ordered-&gt;disk_num_bytes - file_offset);</div><div class='add'>+			bbio-&gt;ordered = ordered;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		btrfs_bio(bio)-&gt;device = device;</div><div class='add'>+		/*</div><div class='add'>+		 * Pick the last added device to support cgroup writeback.  For</div><div class='add'>+		 * multi-device file systems this means blk-cgroup policies have</div><div class='add'>+		 * to always be set on the last added/replaced device.</div><div class='add'>+		 * This is a bit odd but has been like that for a long time.</div><div class='add'>+		 */</div><div class='add'>+		bio_set_dev(&amp;bbio-&gt;bio, fs_info-&gt;fs_devices-&gt;latest_dev-&gt;bdev);</div><div class='add'>+		wbc_init_bio(bio_ctrl-&gt;wbc, &amp;bbio-&gt;bio);</div><div class='ctx'> 	}</div><div class='del'>-	return 0;</div><div class='del'>-error:</div><div class='del'>-	bio_ctrl-&gt;bio = NULL;</div><div class='del'>-	bio-&gt;bi_status = errno_to_blk_status(ret);</div><div class='del'>-	bio_endio(bio);</div><div class='del'>-	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * @opf:	bio REQ_OP_* and REQ_* flags as one value</div><div class='del'>- * @wbc:	optional writeback control for io accounting</div><div class='del'>- * @page:	page to add to the bio</div><div class='ctx'>  * @disk_bytenr: logical bytenr where the write will be</div><div class='add'>+ * @page:	page to add to the bio</div><div class='ctx'>  * @size:	portion of page that we want to write to</div><div class='ctx'>  * @pg_offset:	offset of the new bio or to check whether we are adding</div><div class='ctx'>  *              a contiguous page to the previous one</div><div class='del'>- * @bio_ret:	must be valid pointer, newly allocated bio will be stored there</div><div class='del'>- * @end_io_func:     end_io callback for new bio</div><div class='del'>- * @mirror_num:	     desired mirror to read/write</div><div class='del'>- * @prev_bio_flags:  flags of previous bio to see if we can merge the current one</div><div class='del'>- * @bio_flags:	flags of the current bio to see if we can merge them</div><div class='add'>+ * @read_em_generation: generation of the extent_map we are submitting</div><div class='add'>+ *			(only used for read)</div><div class='add'>+ *</div><div class='add'>+ * The will either add the page into the existing @bio_ctrl-&gt;bbio, or allocate a</div><div class='add'>+ * new one in @bio_ctrl-&gt;bbio.</div><div class='add'>+ * The mirror number for this IO should already be initialized in</div><div class='add'>+ * @bio_ctrl-&gt;mirror_num.</div><div class='ctx'>  */</div><div class='del'>-static int submit_extent_page(unsigned int opf,</div><div class='del'>-			      struct writeback_control *wbc,</div><div class='del'>-			      struct btrfs_bio_ctrl *bio_ctrl,</div><div class='del'>-			      struct page *page, u64 disk_bytenr,</div><div class='del'>-			      size_t size, unsigned long pg_offset,</div><div class='del'>-			      bio_end_io_t end_io_func,</div><div class='del'>-			      int mirror_num,</div><div class='del'>-			      unsigned long bio_flags,</div><div class='del'>-			      bool force_bio_submit)</div><div class='add'>+static void submit_extent_folio(struct btrfs_bio_ctrl *bio_ctrl,</div><div class='add'>+			       u64 disk_bytenr, struct folio *folio,</div><div class='add'>+			       size_t size, unsigned long pg_offset,</div><div class='add'>+			       u64 read_em_generation)</div><div class='ctx'> {</div><div class='del'>-	int ret = 0;</div><div class='del'>-	struct btrfs_inode *inode = BTRFS_I(page-&gt;mapping-&gt;host);</div><div class='del'>-	unsigned int cur = pg_offset;</div><div class='add'>+	struct btrfs_inode *inode = folio_to_inode(folio);</div><div class='add'>+	loff_t file_offset = folio_pos(folio) + pg_offset;</div><div class='ctx'> </div><div class='del'>-	ASSERT(bio_ctrl);</div><div class='add'>+	ASSERT(pg_offset + size &lt;= folio_size(folio));</div><div class='add'>+	ASSERT(bio_ctrl-&gt;end_io_func);</div><div class='ctx'> </div><div class='del'>-	ASSERT(pg_offset &lt; PAGE_SIZE &amp;&amp; size &lt;= PAGE_SIZE &amp;&amp;</div><div class='del'>-	       pg_offset + size &lt;= PAGE_SIZE);</div><div class='del'>-	if (force_bio_submit &amp;&amp; bio_ctrl-&gt;bio) {</div><div class='del'>-		ret = submit_one_bio(bio_ctrl-&gt;bio, mirror_num, bio_ctrl-&gt;bio_flags);</div><div class='del'>-		bio_ctrl-&gt;bio = NULL;</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			return ret;</div><div class='del'>-	}</div><div class='add'>+	if (bio_ctrl-&gt;bbio &amp;&amp;</div><div class='add'>+	    !btrfs_bio_is_contig(bio_ctrl, disk_bytenr, file_offset))</div><div class='add'>+		submit_one_bio(bio_ctrl);</div><div class='ctx'> </div><div class='del'>-	while (cur &lt; pg_offset + size) {</div><div class='del'>-		u32 offset = cur - pg_offset;</div><div class='del'>-		int added;</div><div class='add'>+	do {</div><div class='add'>+		u32 len = size;</div><div class='ctx'> </div><div class='ctx'> 		/* Allocate new bio if needed */</div><div class='del'>-		if (!bio_ctrl-&gt;bio) {</div><div class='del'>-			ret = alloc_new_bio(inode, bio_ctrl, wbc, opf,</div><div class='del'>-					    end_io_func, disk_bytenr, offset,</div><div class='del'>-					    page_offset(page) + cur,</div><div class='del'>-					    bio_flags);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				return ret;</div><div class='add'>+		if (!bio_ctrl-&gt;bbio)</div><div class='add'>+			alloc_new_bio(inode, bio_ctrl, disk_bytenr, file_offset);</div><div class='add'>+</div><div class='add'>+		/* Cap to the current ordered extent boundary if there is one. */</div><div class='add'>+		if (len &gt; bio_ctrl-&gt;len_to_oe_boundary) {</div><div class='add'>+			ASSERT(bio_ctrl-&gt;compress_type == BTRFS_COMPRESS_NONE);</div><div class='add'>+			ASSERT(is_data_inode(inode));</div><div class='add'>+			len = bio_ctrl-&gt;len_to_oe_boundary;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (!bio_add_folio(&amp;bio_ctrl-&gt;bbio-&gt;bio, folio, len, pg_offset)) {</div><div class='add'>+			/* bio full: move on to a new one */</div><div class='add'>+			submit_one_bio(bio_ctrl);</div><div class='add'>+			continue;</div><div class='ctx'> 		}</div><div class='ctx'> 		/*</div><div class='del'>-		 * We must go through btrfs_bio_add_page() to ensure each</div><div class='del'>-		 * page range won't cross various boundaries.</div><div class='add'>+		 * Now that the folio is definitely added to the bio, include its</div><div class='add'>+		 * generation in the max generation calculation.</div><div class='ctx'> 		 */</div><div class='del'>-		if (bio_flags &amp; EXTENT_BIO_COMPRESSED)</div><div class='del'>-			added = btrfs_bio_add_page(bio_ctrl, page, disk_bytenr,</div><div class='del'>-					size - offset, pg_offset + offset,</div><div class='del'>-					bio_flags);</div><div class='del'>-		else</div><div class='del'>-			added = btrfs_bio_add_page(bio_ctrl, page,</div><div class='del'>-					disk_bytenr + offset, size - offset,</div><div class='del'>-					pg_offset + offset, bio_flags);</div><div class='del'>-</div><div class='del'>-		/* Metadata page range should never be split */</div><div class='del'>-		if (!is_data_inode(&amp;inode-&gt;vfs_inode))</div><div class='del'>-			ASSERT(added == 0 || added == size - offset);</div><div class='del'>-</div><div class='del'>-		/* At least we added some page, update the account */</div><div class='del'>-		if (wbc &amp;&amp; added)</div><div class='del'>-			wbc_account_cgroup_owner(wbc, page, added);</div><div class='del'>-</div><div class='del'>-		/* We have reached boundary, submit right now */</div><div class='del'>-		if (added &lt; size - offset) {</div><div class='del'>-			/* The bio should contain some page(s) */</div><div class='del'>-			ASSERT(bio_ctrl-&gt;bio-&gt;bi_iter.bi_size);</div><div class='del'>-			ret = submit_one_bio(bio_ctrl-&gt;bio, mirror_num,</div><div class='del'>-					bio_ctrl-&gt;bio_flags);</div><div class='del'>-			bio_ctrl-&gt;bio = NULL;</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				return ret;</div><div class='del'>-		}</div><div class='del'>-		cur += added;</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='add'>+		bio_ctrl-&gt;generation = max(bio_ctrl-&gt;generation, read_em_generation);</div><div class='add'>+		bio_ctrl-&gt;next_file_offset += len;</div><div class='add'>+</div><div class='add'>+		if (bio_ctrl-&gt;wbc)</div><div class='add'>+			wbc_account_cgroup_owner(bio_ctrl-&gt;wbc, folio, len);</div><div class='add'>+</div><div class='add'>+		size -= len;</div><div class='add'>+		pg_offset += len;</div><div class='add'>+		disk_bytenr += len;</div><div class='add'>+		file_offset += len;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * len_to_oe_boundary defaults to U32_MAX, which isn't folio or</div><div class='add'>+		 * sector aligned.  alloc_new_bio() then sets it to the end of</div><div class='add'>+		 * our ordered extent for writes into zoned devices.</div><div class='add'>+		 *</div><div class='add'>+		 * When len_to_oe_boundary is tracking an ordered extent, we</div><div class='add'>+		 * trust the ordered extent code to align things properly, and</div><div class='add'>+		 * the check above to cap our write to the ordered extent</div><div class='add'>+		 * boundary is correct.</div><div class='add'>+		 *</div><div class='add'>+		 * When len_to_oe_boundary is U32_MAX, the cap above would</div><div class='add'>+		 * result in a 4095 byte IO for the last folio right before</div><div class='add'>+		 * we hit the bio limit of UINT_MAX.  bio_add_folio() has all</div><div class='add'>+		 * the checks required to make sure we don't overflow the bio,</div><div class='add'>+		 * and we should just ignore len_to_oe_boundary completely</div><div class='add'>+		 * unless we're using it to track an ordered extent.</div><div class='add'>+		 *</div><div class='add'>+		 * It's pretty hard to make a bio sized U32_MAX, but it can</div><div class='add'>+		 * happen when the page cache is able to feed us contiguous</div><div class='add'>+		 * folios for large extents.</div><div class='add'>+		 */</div><div class='add'>+		if (bio_ctrl-&gt;len_to_oe_boundary != U32_MAX)</div><div class='add'>+			bio_ctrl-&gt;len_to_oe_boundary -= len;</div><div class='add'>+</div><div class='add'>+		/* Ordered extent boundary: move on to a new bio. */</div><div class='add'>+		if (bio_ctrl-&gt;len_to_oe_boundary == 0)</div><div class='add'>+			submit_one_bio(bio_ctrl);</div><div class='add'>+	} while (size);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int attach_extent_buffer_page(struct extent_buffer *eb,</div><div class='del'>-				     struct page *page,</div><div class='del'>-				     struct btrfs_subpage *prealloc)</div><div class='add'>+static int attach_extent_buffer_folio(struct extent_buffer *eb,</div><div class='add'>+				      struct folio *folio,</div><div class='add'>+				      struct btrfs_folio_state *prealloc)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='ctx'> 	int ret = 0;</div><div class='hunk'>@@ -3460,93 +875,114 @@ static int attach_extent_buffer_page(struct extent_buffer *eb,</div><div class='ctx'> 	 * For cloned or dummy extent buffers, their pages are not mapped and</div><div class='ctx'> 	 * will not race with any other ebs.</div><div class='ctx'> 	 */</div><div class='del'>-	if (page-&gt;mapping)</div><div class='del'>-		lockdep_assert_held(&amp;page-&gt;mapping-&gt;private_lock);</div><div class='add'>+	if (folio-&gt;mapping)</div><div class='add'>+		lockdep_assert_held(&amp;folio-&gt;mapping-&gt;i_private_lock);</div><div class='ctx'> </div><div class='del'>-	if (fs_info-&gt;sectorsize == PAGE_SIZE) {</div><div class='del'>-		if (!PagePrivate(page))</div><div class='del'>-			attach_page_private(page, eb);</div><div class='add'>+	if (!btrfs_meta_is_subpage(fs_info)) {</div><div class='add'>+		if (!folio_test_private(folio))</div><div class='add'>+			folio_attach_private(folio, eb);</div><div class='ctx'> 		else</div><div class='del'>-			WARN_ON(page-&gt;private != (unsigned long)eb);</div><div class='add'>+			WARN_ON(folio_get_private(folio) != eb);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Already mapped, just free prealloc */</div><div class='del'>-	if (PagePrivate(page)) {</div><div class='del'>-		btrfs_free_subpage(prealloc);</div><div class='add'>+	if (folio_test_private(folio)) {</div><div class='add'>+		btrfs_free_folio_state(prealloc);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (prealloc)</div><div class='ctx'> 		/* Has preallocated memory for subpage */</div><div class='del'>-		attach_page_private(page, prealloc);</div><div class='add'>+		folio_attach_private(folio, prealloc);</div><div class='ctx'> 	else</div><div class='ctx'> 		/* Do new allocation to attach subpage */</div><div class='del'>-		ret = btrfs_attach_subpage(fs_info, page,</div><div class='del'>-					   BTRFS_SUBPAGE_METADATA);</div><div class='add'>+		ret = btrfs_attach_folio_state(fs_info, folio, BTRFS_SUBPAGE_METADATA);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int set_page_extent_mapped(struct page *page)</div><div class='add'>+int set_folio_extent_mapped(struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info;</div><div class='ctx'> </div><div class='del'>-	ASSERT(page-&gt;mapping);</div><div class='add'>+	ASSERT(folio-&gt;mapping);</div><div class='ctx'> </div><div class='del'>-	if (PagePrivate(page))</div><div class='add'>+	if (folio_test_private(folio))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	fs_info = btrfs_sb(page-&gt;mapping-&gt;host-&gt;i_sb);</div><div class='add'>+	fs_info = folio_to_fs_info(folio);</div><div class='ctx'> </div><div class='del'>-	if (fs_info-&gt;sectorsize &lt; PAGE_SIZE)</div><div class='del'>-		return btrfs_attach_subpage(fs_info, page, BTRFS_SUBPAGE_DATA);</div><div class='add'>+	if (btrfs_is_subpage(fs_info, folio))</div><div class='add'>+		return btrfs_attach_folio_state(fs_info, folio, BTRFS_SUBPAGE_DATA);</div><div class='ctx'> </div><div class='del'>-	attach_page_private(page, (void *)EXTENT_PAGE_PRIVATE);</div><div class='add'>+	folio_attach_private(folio, (void *)EXTENT_FOLIO_PRIVATE);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void clear_page_extent_mapped(struct page *page)</div><div class='add'>+void clear_folio_extent_mapped(struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info;</div><div class='ctx'> </div><div class='del'>-	ASSERT(page-&gt;mapping);</div><div class='add'>+	ASSERT(folio-&gt;mapping);</div><div class='ctx'> </div><div class='del'>-	if (!PagePrivate(page))</div><div class='add'>+	if (!folio_test_private(folio))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	fs_info = btrfs_sb(page-&gt;mapping-&gt;host-&gt;i_sb);</div><div class='del'>-	if (fs_info-&gt;sectorsize &lt; PAGE_SIZE)</div><div class='del'>-		return btrfs_detach_subpage(fs_info, page);</div><div class='add'>+	fs_info = folio_to_fs_info(folio);</div><div class='add'>+	if (btrfs_is_subpage(fs_info, folio))</div><div class='add'>+		return btrfs_detach_folio_state(fs_info, folio, BTRFS_SUBPAGE_DATA);</div><div class='ctx'> </div><div class='del'>-	detach_page_private(page);</div><div class='add'>+	folio_detach_private(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct extent_map *</div><div class='del'>-__get_extent_map(struct inode *inode, struct page *page, size_t pg_offset,</div><div class='del'>-		 u64 start, u64 len, struct extent_map **em_cached)</div><div class='add'>+static struct extent_map *get_extent_map(struct btrfs_inode *inode,</div><div class='add'>+					 struct folio *folio, u64 start,</div><div class='add'>+					 u64 len, struct extent_map **em_cached)</div><div class='ctx'> {</div><div class='ctx'> 	struct extent_map *em;</div><div class='ctx'> </div><div class='del'>-	if (em_cached &amp;&amp; *em_cached) {</div><div class='add'>+	ASSERT(em_cached);</div><div class='add'>+</div><div class='add'>+	if (*em_cached) {</div><div class='ctx'> 		em = *em_cached;</div><div class='del'>-		if (extent_map_in_tree(em) &amp;&amp; start &gt;= em-&gt;start &amp;&amp;</div><div class='del'>-		    start &lt; extent_map_end(em)) {</div><div class='add'>+		if (btrfs_extent_map_in_tree(em) &amp;&amp; start &gt;= em-&gt;start &amp;&amp;</div><div class='add'>+		    start &lt; btrfs_extent_map_end(em)) {</div><div class='ctx'> 			refcount_inc(&amp;em-&gt;refs);</div><div class='ctx'> 			return em;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		free_extent_map(em);</div><div class='add'>+		btrfs_free_extent_map(em);</div><div class='ctx'> 		*em_cached = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	em = btrfs_get_extent(BTRFS_I(inode), page, pg_offset, start, len);</div><div class='del'>-	if (em_cached &amp;&amp; !IS_ERR_OR_NULL(em)) {</div><div class='add'>+	em = btrfs_get_extent(inode, folio, start, len);</div><div class='add'>+	if (!IS_ERR(em)) {</div><div class='ctx'> 		BUG_ON(*em_cached);</div><div class='ctx'> 		refcount_inc(&amp;em-&gt;refs);</div><div class='ctx'> 		*em_cached = em;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> 	return em;</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+static void btrfs_readahead_expand(struct readahead_control *ractl,</div><div class='add'>+				   const struct extent_map *em)</div><div class='add'>+{</div><div class='add'>+	const u64 ra_pos = readahead_pos(ractl);</div><div class='add'>+	const u64 ra_end = ra_pos + readahead_length(ractl);</div><div class='add'>+	const u64 em_end = em-&gt;start + em-&gt;len;</div><div class='add'>+</div><div class='add'>+	/* No expansion for holes and inline extents. */</div><div class='add'>+	if (em-&gt;disk_bytenr &gt; EXTENT_MAP_LAST_BYTE)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	ASSERT(em_end &gt;= ra_pos,</div><div class='add'>+	       "extent_map %llu %llu ends before current readahead position %llu",</div><div class='add'>+	       em-&gt;start, em-&gt;len, ra_pos);</div><div class='add'>+	if (em_end &gt; ra_end)</div><div class='add'>+		readahead_expand(ractl, ra_pos, em_end - ra_pos);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * basic readpage implementation.  Locked extent state structs are inserted</div><div class='ctx'>  * into the tree that are removed when the IO is done (by the end_io</div><div class='hunk'>@@ -3554,100 +990,82 @@ __get_extent_map(struct inode *inode, struct page *page, size_t pg_offset,</div><div class='ctx'>  * XXX JDM: This needs looking at to ensure proper page locking</div><div class='ctx'>  * return 0 on success, otherwise return error</div><div class='ctx'>  */</div><div class='del'>-int btrfs_do_readpage(struct page *page, struct extent_map **em_cached,</div><div class='del'>-		      struct btrfs_bio_ctrl *bio_ctrl,</div><div class='del'>-		      unsigned int read_flags, u64 *prev_em_start)</div><div class='add'>+static int btrfs_do_readpage(struct folio *folio, struct extent_map **em_cached,</div><div class='add'>+			     struct btrfs_bio_ctrl *bio_ctrl)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	u64 start = page_offset(page);</div><div class='del'>-	const u64 end = start + PAGE_SIZE - 1;</div><div class='del'>-	u64 cur = start;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='add'>+	u64 start = folio_pos(folio);</div><div class='add'>+	const u64 end = start + folio_size(folio) - 1;</div><div class='ctx'> 	u64 extent_offset;</div><div class='ctx'> 	u64 last_byte = i_size_read(inode);</div><div class='del'>-	u64 block_start;</div><div class='del'>-	u64 cur_end;</div><div class='ctx'> 	struct extent_map *em;</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	int nr = 0;</div><div class='del'>-	size_t pg_offset = 0;</div><div class='del'>-	size_t iosize;</div><div class='del'>-	size_t blocksize = inode-&gt;i_sb-&gt;s_blocksize;</div><div class='del'>-	struct extent_io_tree *tree = &amp;BTRFS_I(inode)-&gt;io_tree;</div><div class='add'>+	const size_t blocksize = fs_info-&gt;sectorsize;</div><div class='ctx'> </div><div class='del'>-	ret = set_page_extent_mapped(page);</div><div class='add'>+	ret = set_folio_extent_mapped(folio);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='del'>-		unlock_extent(tree, start, end);</div><div class='del'>-		btrfs_page_set_error(fs_info, page, start, PAGE_SIZE);</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!PageUptodate(page)) {</div><div class='del'>-		if (cleancache_get_page(page) == 0) {</div><div class='del'>-			BUG_ON(blocksize != PAGE_SIZE);</div><div class='del'>-			unlock_extent(tree, start, end);</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (page-&gt;index == last_byte &gt;&gt; PAGE_SHIFT) {</div><div class='del'>-		size_t zero_offset = offset_in_page(last_byte);</div><div class='add'>+	if (folio_contains(folio, last_byte &gt;&gt; PAGE_SHIFT)) {</div><div class='add'>+		size_t zero_offset = offset_in_folio(folio, last_byte);</div><div class='ctx'> </div><div class='del'>-		if (zero_offset) {</div><div class='del'>-			iosize = PAGE_SIZE - zero_offset;</div><div class='del'>-			memzero_page(page, zero_offset, iosize);</div><div class='del'>-			flush_dcache_page(page);</div><div class='del'>-		}</div><div class='add'>+		if (zero_offset)</div><div class='add'>+			folio_zero_range(folio, zero_offset,</div><div class='add'>+					 folio_size(folio) - zero_offset);</div><div class='ctx'> 	}</div><div class='del'>-	begin_page_read(fs_info, page);</div><div class='del'>-	while (cur &lt;= end) {</div><div class='del'>-		unsigned long this_bio_flag = 0;</div><div class='add'>+	bio_ctrl-&gt;end_io_func = end_bbio_data_read;</div><div class='add'>+	begin_folio_read(fs_info, folio);</div><div class='add'>+	for (u64 cur = start; cur &lt;= end; cur += blocksize) {</div><div class='add'>+		enum btrfs_compression_type compress_type = BTRFS_COMPRESS_NONE;</div><div class='add'>+		unsigned long pg_offset = offset_in_folio(folio, cur);</div><div class='ctx'> 		bool force_bio_submit = false;</div><div class='ctx'> 		u64 disk_bytenr;</div><div class='add'>+		u64 block_start;</div><div class='add'>+		u64 em_gen;</div><div class='ctx'> </div><div class='ctx'> 		ASSERT(IS_ALIGNED(cur, fs_info-&gt;sectorsize));</div><div class='ctx'> 		if (cur &gt;= last_byte) {</div><div class='del'>-			struct extent_state *cached = NULL;</div><div class='del'>-</div><div class='del'>-			iosize = PAGE_SIZE - pg_offset;</div><div class='del'>-			memzero_page(page, pg_offset, iosize);</div><div class='del'>-			flush_dcache_page(page);</div><div class='del'>-			set_extent_uptodate(tree, cur, cur + iosize - 1,</div><div class='del'>-					    &amp;cached, GFP_NOFS);</div><div class='del'>-			unlock_extent_cached(tree, cur,</div><div class='del'>-					     cur + iosize - 1, &amp;cached);</div><div class='del'>-			end_page_read(page, true, cur, iosize);</div><div class='add'>+			folio_zero_range(folio, pg_offset, end - cur + 1);</div><div class='add'>+			end_folio_read(folio, true, cur, end - cur + 1);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-		em = __get_extent_map(inode, page, pg_offset, cur,</div><div class='del'>-				      end - cur + 1, em_cached);</div><div class='del'>-		if (IS_ERR_OR_NULL(em)) {</div><div class='del'>-			unlock_extent(tree, cur, end);</div><div class='del'>-			end_page_read(page, false, cur, end + 1 - cur);</div><div class='del'>-			break;</div><div class='add'>+		if (btrfs_folio_test_uptodate(fs_info, folio, cur, blocksize)) {</div><div class='add'>+			end_folio_read(folio, true, cur, blocksize);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+		em = get_extent_map(BTRFS_I(inode), folio, cur, end - cur + 1, em_cached);</div><div class='add'>+		if (IS_ERR(em)) {</div><div class='add'>+			end_folio_read(folio, false, cur, end + 1 - cur);</div><div class='add'>+			return PTR_ERR(em);</div><div class='ctx'> 		}</div><div class='ctx'> 		extent_offset = cur - em-&gt;start;</div><div class='del'>-		BUG_ON(extent_map_end(em) &lt;= cur);</div><div class='add'>+		BUG_ON(btrfs_extent_map_end(em) &lt;= cur);</div><div class='ctx'> 		BUG_ON(end &lt; cur);</div><div class='ctx'> </div><div class='del'>-		if (test_bit(EXTENT_FLAG_COMPRESSED, &amp;em-&gt;flags)) {</div><div class='del'>-			this_bio_flag |= EXTENT_BIO_COMPRESSED;</div><div class='del'>-			extent_set_compress_type(&amp;this_bio_flag,</div><div class='del'>-						 em-&gt;compress_type);</div><div class='del'>-		}</div><div class='add'>+		compress_type = btrfs_extent_map_compression(em);</div><div class='ctx'> </div><div class='del'>-		iosize = min(extent_map_end(em) - cur, end - cur + 1);</div><div class='del'>-		cur_end = min(extent_map_end(em) - 1, end);</div><div class='del'>-		iosize = ALIGN(iosize, blocksize);</div><div class='del'>-		if (this_bio_flag &amp; EXTENT_BIO_COMPRESSED)</div><div class='del'>-			disk_bytenr = em-&gt;block_start;</div><div class='add'>+		/*</div><div class='add'>+		 * Only expand readahead for extents which are already creating</div><div class='add'>+		 * the pages anyway in add_ra_bio_pages, which is compressed</div><div class='add'>+		 * extents in the non subpage case.</div><div class='add'>+		 */</div><div class='add'>+		if (bio_ctrl-&gt;ractl &amp;&amp;</div><div class='add'>+		    !btrfs_is_subpage(fs_info, folio) &amp;&amp;</div><div class='add'>+		    compress_type != BTRFS_COMPRESS_NONE)</div><div class='add'>+			btrfs_readahead_expand(bio_ctrl-&gt;ractl, em);</div><div class='add'>+</div><div class='add'>+		if (compress_type != BTRFS_COMPRESS_NONE)</div><div class='add'>+			disk_bytenr = em-&gt;disk_bytenr;</div><div class='ctx'> 		else</div><div class='del'>-			disk_bytenr = em-&gt;block_start + extent_offset;</div><div class='del'>-		block_start = em-&gt;block_start;</div><div class='del'>-		if (test_bit(EXTENT_FLAG_PREALLOC, &amp;em-&gt;flags))</div><div class='add'>+			disk_bytenr = btrfs_extent_map_block_start(em) + extent_offset;</div><div class='add'>+</div><div class='add'>+		if (em-&gt;flags &amp; EXTENT_FLAG_PREALLOC)</div><div class='ctx'> 			block_start = EXTENT_MAP_HOLE;</div><div class='add'>+		else</div><div class='add'>+			block_start = btrfs_extent_map_block_start(em);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * If we have a file range that points to a compressed extent</div><div class='hunk'>@@ -3655,8 +1073,8 @@ int btrfs_do_readpage(struct page *page, struct extent_map **em_cached,</div><div class='ctx'> 		 * to the same compressed extent (possibly with a different</div><div class='ctx'> 		 * offset and/or length, so it either points to the whole extent</div><div class='ctx'> 		 * or only part of it), we must make sure we do not submit a</div><div class='del'>-		 * single bio to populate the pages for the 2 ranges because</div><div class='del'>-		 * this makes the compressed extent read zero out the pages</div><div class='add'>+		 * single bio to populate the folios for the 2 ranges because</div><div class='add'>+		 * this makes the compressed extent read zero out the folios</div><div class='ctx'> 		 * belonging to the 2nd range. Imagine the following scenario:</div><div class='ctx'> 		 *</div><div class='ctx'> 		 *  File layout</div><div class='hunk'>@@ -3669,13 +1087,13 @@ int btrfs_do_readpage(struct page *page, struct extent_map **em_cached,</div><div class='ctx'> 		 * [extent X, compressed length = 4K uncompressed length = 16K]</div><div class='ctx'> 		 *</div><div class='ctx'> 		 * If the bio to read the compressed extent covers both ranges,</div><div class='del'>-		 * it will decompress extent X into the pages belonging to the</div><div class='add'>+		 * it will decompress extent X into the folios belonging to the</div><div class='ctx'> 		 * first range and then it will stop, zeroing out the remaining</div><div class='del'>-		 * pages that belong to the other range that points to extent X.</div><div class='add'>+		 * folios that belong to the other range that points to extent X.</div><div class='ctx'> 		 * So here we make sure we submit 2 bios, one for the first</div><div class='ctx'> 		 * range and another one for the third range. Both will target</div><div class='ctx'> 		 * the same physical extent from disk, but we can't currently</div><div class='del'>-		 * make the compressed bio endio callback populate the pages</div><div class='add'>+		 * make the compressed bio endio callback populate the folios</div><div class='ctx'> 		 * for both ranges because each compressed bio is tightly</div><div class='ctx'> 		 * coupled with a single extent map, and each range can have</div><div class='ctx'> 		 * an extent map with a different offset value relative to the</div><div class='hunk'>@@ -3683,143 +1101,489 @@ int btrfs_do_readpage(struct page *page, struct extent_map **em_cached,</div><div class='ctx'> 		 * is a corner case so we prioritize correctness over</div><div class='ctx'> 		 * non-optimal behavior (submitting 2 bios for the same extent).</div><div class='ctx'> 		 */</div><div class='del'>-		if (test_bit(EXTENT_FLAG_COMPRESSED, &amp;em-&gt;flags) &amp;&amp;</div><div class='del'>-		    prev_em_start &amp;&amp; *prev_em_start != (u64)-1 &amp;&amp;</div><div class='del'>-		    *prev_em_start != em-&gt;start)</div><div class='add'>+		if (compress_type != BTRFS_COMPRESS_NONE &amp;&amp;</div><div class='add'>+		    bio_ctrl-&gt;last_em_start != U64_MAX &amp;&amp;</div><div class='add'>+		    bio_ctrl-&gt;last_em_start != em-&gt;start)</div><div class='ctx'> 			force_bio_submit = true;</div><div class='ctx'> </div><div class='del'>-		if (prev_em_start)</div><div class='del'>-			*prev_em_start = em-&gt;start;</div><div class='add'>+		bio_ctrl-&gt;last_em_start = em-&gt;start;</div><div class='ctx'> </div><div class='del'>-		free_extent_map(em);</div><div class='add'>+		em_gen = em-&gt;generation;</div><div class='add'>+		btrfs_free_extent_map(em);</div><div class='ctx'> 		em = NULL;</div><div class='ctx'> </div><div class='ctx'> 		/* we've found a hole, just zero and go on */</div><div class='ctx'> 		if (block_start == EXTENT_MAP_HOLE) {</div><div class='del'>-			struct extent_state *cached = NULL;</div><div class='del'>-</div><div class='del'>-			memzero_page(page, pg_offset, iosize);</div><div class='del'>-			flush_dcache_page(page);</div><div class='del'>-</div><div class='del'>-			set_extent_uptodate(tree, cur, cur + iosize - 1,</div><div class='del'>-					    &amp;cached, GFP_NOFS);</div><div class='del'>-			unlock_extent_cached(tree, cur,</div><div class='del'>-					     cur + iosize - 1, &amp;cached);</div><div class='del'>-			end_page_read(page, true, cur, iosize);</div><div class='del'>-			cur = cur + iosize;</div><div class='del'>-			pg_offset += iosize;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-		/* the get_extent function already copied into the page */</div><div class='del'>-		if (test_range_bit(tree, cur, cur_end,</div><div class='del'>-				   EXTENT_UPTODATE, 1, NULL)) {</div><div class='del'>-			unlock_extent(tree, cur, cur + iosize - 1);</div><div class='del'>-			end_page_read(page, true, cur, iosize);</div><div class='del'>-			cur = cur + iosize;</div><div class='del'>-			pg_offset += iosize;</div><div class='add'>+			folio_zero_range(folio, pg_offset, blocksize);</div><div class='add'>+			end_folio_read(folio, true, cur, blocksize);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='del'>-		/* we have an inline extent but it didn't get marked up</div><div class='del'>-		 * to date.  Error out</div><div class='del'>-		 */</div><div class='add'>+		/* the get_extent function already copied into the folio */</div><div class='ctx'> 		if (block_start == EXTENT_MAP_INLINE) {</div><div class='del'>-			unlock_extent(tree, cur, cur + iosize - 1);</div><div class='del'>-			end_page_read(page, false, cur, iosize);</div><div class='del'>-			cur = cur + iosize;</div><div class='del'>-			pg_offset += iosize;</div><div class='add'>+			end_folio_read(folio, true, cur, blocksize);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		ret = submit_extent_page(REQ_OP_READ | read_flags, NULL,</div><div class='del'>-					 bio_ctrl, page, disk_bytenr, iosize,</div><div class='del'>-					 pg_offset,</div><div class='del'>-					 end_bio_extent_readpage, 0,</div><div class='del'>-					 this_bio_flag,</div><div class='del'>-					 force_bio_submit);</div><div class='del'>-		if (!ret) {</div><div class='del'>-			nr++;</div><div class='del'>-		} else {</div><div class='del'>-			unlock_extent(tree, cur, cur + iosize - 1);</div><div class='del'>-			end_page_read(page, false, cur, iosize);</div><div class='del'>-			goto out;</div><div class='add'>+		if (bio_ctrl-&gt;compress_type != compress_type) {</div><div class='add'>+			submit_one_bio(bio_ctrl);</div><div class='add'>+			bio_ctrl-&gt;compress_type = compress_type;</div><div class='ctx'> 		}</div><div class='del'>-		cur = cur + iosize;</div><div class='del'>-		pg_offset += iosize;</div><div class='add'>+</div><div class='add'>+		if (force_bio_submit)</div><div class='add'>+			submit_one_bio(bio_ctrl);</div><div class='add'>+		submit_extent_folio(bio_ctrl, disk_bytenr, folio, blocksize,</div><div class='add'>+				    pg_offset, em_gen);</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Check if we can skip waiting the @ordered extent covering the block at @fileoff.</div><div class='add'>+ *</div><div class='add'>+ * @fileoff:	Both input and output.</div><div class='add'>+ *		Input as the file offset where the check should start at.</div><div class='add'>+ *		Output as where the next check should start at,</div><div class='add'>+ *		if the function returns true.</div><div class='add'>+ *</div><div class='add'>+ * Return true if we can skip to @fileoff. The caller needs to check the new</div><div class='add'>+ * @fileoff value to make sure it covers the full range, before skipping the</div><div class='add'>+ * full OE.</div><div class='add'>+ *</div><div class='add'>+ * Return false if we must wait for the ordered extent.</div><div class='add'>+ */</div><div class='add'>+static bool can_skip_one_ordered_range(struct btrfs_inode *inode,</div><div class='add'>+				       struct btrfs_ordered_extent *ordered,</div><div class='add'>+				       u64 *fileoff)</div><div class='add'>+{</div><div class='add'>+	const struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	const u32 blocksize = fs_info-&gt;sectorsize;</div><div class='add'>+	u64 cur = *fileoff;</div><div class='add'>+	bool ret;</div><div class='add'>+</div><div class='add'>+	folio = filemap_get_folio(inode-&gt;vfs_inode.i_mapping, cur &gt;&gt; PAGE_SHIFT);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We should have locked the folio(s) for range [start, end], thus</div><div class='add'>+	 * there must be a folio and it must be locked.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(!IS_ERR(folio));</div><div class='add'>+	ASSERT(folio_test_locked(folio));</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * There are several cases for the folio and OE combination:</div><div class='add'>+	 *</div><div class='add'>+	 * 1) Folio has no private flag</div><div class='add'>+	 *    The OE has all its IO done but not yet finished, and folio got</div><div class='add'>+	 *    invalidated.</div><div class='add'>+	 *</div><div class='add'>+	 * Have we have to wait for the OE to finish, as it may contain the</div><div class='add'>+	 * to-be-inserted data checksum.</div><div class='add'>+	 * Without the data checksum inserted into the csum tree, read will</div><div class='add'>+	 * just fail with missing csum.</div><div class='add'>+	 */</div><div class='add'>+	if (!folio_test_private(folio)) {</div><div class='add'>+		ret = false;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * 2) The first block is DIRTY.</div><div class='add'>+	 *</div><div class='add'>+	 * This means the OE is created by some other folios whose file pos is</div><div class='add'>+	 * before this one. And since we are holding the folio lock, the writeback</div><div class='add'>+	 * of this folio cannot start.</div><div class='add'>+	 *</div><div class='add'>+	 * We must skip the whole OE, because it will never start until we</div><div class='add'>+	 * finished our folio read and unlocked the folio.</div><div class='add'>+	 */</div><div class='add'>+	if (btrfs_folio_test_dirty(fs_info, folio, cur, blocksize)) {</div><div class='add'>+		u64 range_len = umin(folio_next_pos(folio),</div><div class='add'>+				    ordered-&gt;file_offset + ordered-&gt;num_bytes) - cur;</div><div class='add'>+</div><div class='add'>+		ret = true;</div><div class='add'>+		/*</div><div class='add'>+		 * At least inside the folio, all the remaining blocks should</div><div class='add'>+		 * also be dirty.</div><div class='add'>+		 */</div><div class='add'>+		ASSERT(btrfs_folio_test_dirty(fs_info, folio, cur, range_len));</div><div class='add'>+		*fileoff = ordered-&gt;file_offset + ordered-&gt;num_bytes;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * 3) The first block is uptodate.</div><div class='add'>+	 *</div><div class='add'>+	 * At least the first block can be skipped, but we are still not fully</div><div class='add'>+	 * sure. E.g. if the OE has some other folios in the range that cannot</div><div class='add'>+	 * be skipped.</div><div class='add'>+	 * So we return true and update @next_ret to the OE/folio boundary.</div><div class='add'>+	 */</div><div class='add'>+	if (btrfs_folio_test_uptodate(fs_info, folio, cur, blocksize)) {</div><div class='add'>+		u64 range_len = umin(folio_next_pos(folio),</div><div class='add'>+				    ordered-&gt;file_offset + ordered-&gt;num_bytes) - cur;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * The whole range to the OE end or folio boundary should also</div><div class='add'>+		 * be uptodate.</div><div class='add'>+		 */</div><div class='add'>+		ASSERT(btrfs_folio_test_uptodate(fs_info, folio, cur, range_len));</div><div class='add'>+		ret = true;</div><div class='add'>+		*fileoff = cur + range_len;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * 4) The first block is not uptodate.</div><div class='add'>+	 *</div><div class='add'>+	 * This means the folio is invalidated after the writeback was finished,</div><div class='add'>+	 * but by some other operations (e.g. block aligned buffered write) the</div><div class='add'>+	 * folio is inserted into filemap.</div><div class='add'>+	 * Very much the same as case 1).</div><div class='add'>+	 */</div><div class='add'>+	ret = false;</div><div class='ctx'> out:</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void contiguous_readpages(struct page *pages[], int nr_pages,</div><div class='del'>-					u64 start, u64 end,</div><div class='del'>-					struct extent_map **em_cached,</div><div class='del'>-					struct btrfs_bio_ctrl *bio_ctrl,</div><div class='del'>-					u64 *prev_em_start)</div><div class='add'>+static bool can_skip_ordered_extent(struct btrfs_inode *inode,</div><div class='add'>+				    struct btrfs_ordered_extent *ordered,</div><div class='add'>+				    u64 start, u64 end)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_inode *inode = BTRFS_I(pages[0]-&gt;mapping-&gt;host);</div><div class='del'>-	int index;</div><div class='add'>+	const u64 range_end = min(end, ordered-&gt;file_offset + ordered-&gt;num_bytes - 1);</div><div class='add'>+	u64 cur = max(start, ordered-&gt;file_offset);</div><div class='ctx'> </div><div class='del'>-	btrfs_lock_and_flush_ordered_range(inode, start, end, NULL);</div><div class='add'>+	while (cur &lt; range_end) {</div><div class='add'>+		bool can_skip;</div><div class='ctx'> </div><div class='del'>-	for (index = 0; index &lt; nr_pages; index++) {</div><div class='del'>-		btrfs_do_readpage(pages[index], em_cached, bio_ctrl,</div><div class='del'>-				  REQ_RAHEAD, prev_em_start);</div><div class='del'>-		put_page(pages[index]);</div><div class='add'>+		can_skip = can_skip_one_ordered_range(inode, ordered, &amp;cur);</div><div class='add'>+		if (!can_skip)</div><div class='add'>+			return false;</div><div class='ctx'> 	}</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void update_nr_written(struct writeback_control *wbc,</div><div class='del'>-			      unsigned long nr_written)</div><div class='add'>+/*</div><div class='add'>+ * Locking helper to make sure we get a stable view of extent maps for the</div><div class='add'>+ * involved range.</div><div class='add'>+ *</div><div class='add'>+ * This is for folio read paths (read and readahead), thus the involved range</div><div class='add'>+ * should have all the folios locked.</div><div class='add'>+ */</div><div class='add'>+static void lock_extents_for_read(struct btrfs_inode *inode, u64 start, u64 end,</div><div class='add'>+				  struct extent_state **cached_state)</div><div class='ctx'> {</div><div class='del'>-	wbc-&gt;nr_to_write -= nr_written;</div><div class='add'>+	u64 cur_pos;</div><div class='add'>+</div><div class='add'>+	/* Caller must provide a valid @cached_state. */</div><div class='add'>+	ASSERT(cached_state);</div><div class='add'>+</div><div class='add'>+	/* The range must at least be page aligned, as all read paths are folio based. */</div><div class='add'>+	ASSERT(IS_ALIGNED(start, PAGE_SIZE));</div><div class='add'>+	ASSERT(IS_ALIGNED(end + 1, PAGE_SIZE));</div><div class='add'>+</div><div class='add'>+again:</div><div class='add'>+	btrfs_lock_extent(&amp;inode-&gt;io_tree, start, end, cached_state);</div><div class='add'>+	cur_pos = start;</div><div class='add'>+	while (cur_pos &lt; end) {</div><div class='add'>+		struct btrfs_ordered_extent *ordered;</div><div class='add'>+</div><div class='add'>+		ordered = btrfs_lookup_ordered_range(inode, cur_pos,</div><div class='add'>+						     end - cur_pos + 1);</div><div class='add'>+		/*</div><div class='add'>+		 * No ordered extents in the range, and we hold the extent lock,</div><div class='add'>+		 * no one can modify the extent maps in the range, we're safe to return.</div><div class='add'>+		 */</div><div class='add'>+		if (!ordered)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		/* Check if we can skip waiting for the whole OE. */</div><div class='add'>+		if (can_skip_ordered_extent(inode, ordered, start, end)) {</div><div class='add'>+			cur_pos = min(ordered-&gt;file_offset + ordered-&gt;num_bytes,</div><div class='add'>+				      end + 1);</div><div class='add'>+			btrfs_put_ordered_extent(ordered);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* Now wait for the OE to finish. */</div><div class='add'>+		btrfs_unlock_extent(&amp;inode-&gt;io_tree, start, end, cached_state);</div><div class='add'>+		btrfs_start_ordered_extent_nowriteback(ordered, start, end + 1 - start);</div><div class='add'>+		btrfs_put_ordered_extent(ordered);</div><div class='add'>+		/* We have unlocked the whole range, restart from the beginning. */</div><div class='add'>+		goto again;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_read_folio(struct file *file, struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_inode *inode = folio_to_inode(folio);</div><div class='add'>+	const u64 start = folio_pos(folio);</div><div class='add'>+	const u64 end = start + folio_size(folio) - 1;</div><div class='add'>+	struct extent_state *cached_state = NULL;</div><div class='add'>+	struct btrfs_bio_ctrl bio_ctrl = {</div><div class='add'>+		.opf = REQ_OP_READ,</div><div class='add'>+		.last_em_start = U64_MAX,</div><div class='add'>+	};</div><div class='add'>+	struct extent_map *em_cached = NULL;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	lock_extents_for_read(inode, start, end, &amp;cached_state);</div><div class='add'>+	ret = btrfs_do_readpage(folio, &amp;em_cached, &amp;bio_ctrl);</div><div class='add'>+	btrfs_unlock_extent(&amp;inode-&gt;io_tree, start, end, &amp;cached_state);</div><div class='add'>+</div><div class='add'>+	btrfs_free_extent_map(em_cached);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If btrfs_do_readpage() failed we will want to submit the assembled</div><div class='add'>+	 * bio to do the cleanup.</div><div class='add'>+	 */</div><div class='add'>+	submit_one_bio(&amp;bio_ctrl);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void set_delalloc_bitmap(struct folio *folio, unsigned long *delalloc_bitmap,</div><div class='add'>+				u64 start, u32 len)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = folio_to_fs_info(folio);</div><div class='add'>+	const u64 folio_start = folio_pos(folio);</div><div class='add'>+	unsigned int start_bit;</div><div class='add'>+	unsigned int nbits;</div><div class='add'>+</div><div class='add'>+	ASSERT(start &gt;= folio_start &amp;&amp; start + len &lt;= folio_start + folio_size(folio));</div><div class='add'>+	start_bit = (start - folio_start) &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='add'>+	nbits = len &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='add'>+	ASSERT(bitmap_test_range_all_zero(delalloc_bitmap, start_bit, nbits));</div><div class='add'>+	bitmap_set(delalloc_bitmap, start_bit, nbits);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool find_next_delalloc_bitmap(struct folio *folio,</div><div class='add'>+				      unsigned long *delalloc_bitmap, u64 start,</div><div class='add'>+				      u64 *found_start, u32 *found_len)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = folio_to_fs_info(folio);</div><div class='add'>+	const u64 folio_start = folio_pos(folio);</div><div class='add'>+	const unsigned int bitmap_size = btrfs_blocks_per_folio(fs_info, folio);</div><div class='add'>+	unsigned int start_bit;</div><div class='add'>+	unsigned int first_zero;</div><div class='add'>+	unsigned int first_set;</div><div class='add'>+</div><div class='add'>+	ASSERT(start &gt;= folio_start &amp;&amp; start &lt; folio_start + folio_size(folio));</div><div class='add'>+</div><div class='add'>+	start_bit = (start - folio_start) &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='add'>+	first_set = find_next_bit(delalloc_bitmap, bitmap_size, start_bit);</div><div class='add'>+	if (first_set &gt;= bitmap_size)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	*found_start = folio_start + (first_set &lt;&lt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+	first_zero = find_next_zero_bit(delalloc_bitmap, bitmap_size, first_set);</div><div class='add'>+	*found_len = (first_zero - first_set) &lt;&lt; fs_info-&gt;sectorsize_bits;</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * helper for __extent_writepage, doing all of the delayed allocation setup.</div><div class='add'>+ * Do all of the delayed allocation setup.</div><div class='ctx'>  *</div><div class='del'>- * This returns 1 if btrfs_run_delalloc_range function did all the work required</div><div class='del'>- * to write the page (copy into inline extent).  In this case the IO has</div><div class='del'>- * been started and the page is already unlocked.</div><div class='add'>+ * Return &gt;0 if all the dirty blocks are submitted async (compression) or inlined.</div><div class='add'>+ * The @folio should no longer be touched (treat it as already unlocked).</div><div class='ctx'>  *</div><div class='del'>- * This returns 0 if all went well (page still locked)</div><div class='del'>- * This returns &lt; 0 if there were errors (page still locked)</div><div class='add'>+ * Return 0 if there is still dirty block that needs to be submitted through</div><div class='add'>+ * extent_writepage_io().</div><div class='add'>+ * bio_ctrl-&gt;submit_bitmap will indicate which blocks of the folio should be</div><div class='add'>+ * submitted, and @folio is still kept locked.</div><div class='add'>+ *</div><div class='add'>+ * Return &lt;0 if there is any error hit.</div><div class='add'>+ * Any allocated ordered extent range covering this folio will be marked</div><div class='add'>+ * finished (IOERR), and @folio is still kept locked.</div><div class='ctx'>  */</div><div class='ctx'> static noinline_for_stack int writepage_delalloc(struct btrfs_inode *inode,</div><div class='del'>-		struct page *page, struct writeback_control *wbc,</div><div class='del'>-		unsigned long *nr_written)</div><div class='del'>-{</div><div class='del'>-	const u64 page_end = page_offset(page) + PAGE_SIZE - 1;</div><div class='del'>-	u64 delalloc_start = page_offset(page);</div><div class='add'>+						 struct folio *folio,</div><div class='add'>+						 struct btrfs_bio_ctrl *bio_ctrl)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(&amp;inode-&gt;vfs_inode);</div><div class='add'>+	struct writeback_control *wbc = bio_ctrl-&gt;wbc;</div><div class='add'>+	const bool is_subpage = btrfs_is_subpage(fs_info, folio);</div><div class='add'>+	const u64 page_start = folio_pos(folio);</div><div class='add'>+	const u64 page_end = page_start + folio_size(folio) - 1;</div><div class='add'>+	const unsigned int blocks_per_folio = btrfs_blocks_per_folio(fs_info, folio);</div><div class='add'>+	unsigned long delalloc_bitmap = 0;</div><div class='add'>+	/*</div><div class='add'>+	 * Save the last found delalloc end. As the delalloc end can go beyond</div><div class='add'>+	 * page boundary, thus we cannot rely on subpage bitmap to locate the</div><div class='add'>+	 * last delalloc end.</div><div class='add'>+	 */</div><div class='add'>+	u64 last_delalloc_end = 0;</div><div class='add'>+	/*</div><div class='add'>+	 * The range end (exclusive) of the last successfully finished delalloc</div><div class='add'>+	 * range.</div><div class='add'>+	 * Any range covered by ordered extent must either be manually marked</div><div class='add'>+	 * finished (error handling), or has IO submitted (and finish the</div><div class='add'>+	 * ordered extent normally).</div><div class='add'>+	 *</div><div class='add'>+	 * This records the end of ordered extent cleanup if we hit an error.</div><div class='add'>+	 */</div><div class='add'>+	u64 last_finished_delalloc_end = page_start;</div><div class='add'>+	u64 delalloc_start = page_start;</div><div class='add'>+	u64 delalloc_end = page_end;</div><div class='ctx'> 	u64 delalloc_to_write = 0;</div><div class='del'>-	int ret;</div><div class='del'>-	int page_started = 0;</div><div class='add'>+	int ret = 0;</div><div class='add'>+	int bit;</div><div class='ctx'> </div><div class='del'>-	while (delalloc_start &lt; page_end) {</div><div class='del'>-		u64 delalloc_end = page_end;</div><div class='del'>-		bool found;</div><div class='add'>+	/* Save the dirty bitmap as our submission bitmap will be a subset of it. */</div><div class='add'>+	if (btrfs_is_subpage(fs_info, folio)) {</div><div class='add'>+		ASSERT(blocks_per_folio &gt; 1);</div><div class='add'>+		btrfs_get_subpage_dirty_bitmap(fs_info, folio, &amp;bio_ctrl-&gt;submit_bitmap);</div><div class='add'>+	} else {</div><div class='add'>+		bio_ctrl-&gt;submit_bitmap = 1;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for_each_set_bit(bit, &amp;bio_ctrl-&gt;submit_bitmap, blocks_per_folio) {</div><div class='add'>+		u64 start = page_start + (bit &lt;&lt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+</div><div class='add'>+		btrfs_folio_set_lock(fs_info, folio, start, fs_info-&gt;sectorsize);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		found = find_lock_delalloc_range(&amp;inode-&gt;vfs_inode, page,</div><div class='del'>-					       &amp;delalloc_start,</div><div class='del'>-					       &amp;delalloc_end);</div><div class='del'>-		if (!found) {</div><div class='add'>+	/* Lock all (subpage) delalloc ranges inside the folio first. */</div><div class='add'>+	while (delalloc_start &lt; page_end) {</div><div class='add'>+		delalloc_end = page_end;</div><div class='add'>+		if (!find_lock_delalloc_range(&amp;inode-&gt;vfs_inode, folio,</div><div class='add'>+					      &amp;delalloc_start, &amp;delalloc_end)) {</div><div class='ctx'> 			delalloc_start = delalloc_end + 1;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='del'>-		ret = btrfs_run_delalloc_range(inode, page, delalloc_start,</div><div class='del'>-				delalloc_end, &amp;page_started, nr_written, wbc);</div><div class='del'>-		if (ret) {</div><div class='del'>-			btrfs_page_set_error(inode-&gt;root-&gt;fs_info, page,</div><div class='del'>-					     page_offset(page), PAGE_SIZE);</div><div class='del'>-			return ret;</div><div class='add'>+		set_delalloc_bitmap(folio, &amp;delalloc_bitmap, delalloc_start,</div><div class='add'>+				    min(delalloc_end, page_end) + 1 - delalloc_start);</div><div class='add'>+		last_delalloc_end = delalloc_end;</div><div class='add'>+		delalloc_start = delalloc_end + 1;</div><div class='add'>+	}</div><div class='add'>+	delalloc_start = page_start;</div><div class='add'>+</div><div class='add'>+	if (!last_delalloc_end)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	/* Run the delalloc ranges for the above locked ranges. */</div><div class='add'>+	while (delalloc_start &lt; page_end) {</div><div class='add'>+		u64 found_start;</div><div class='add'>+		u32 found_len;</div><div class='add'>+		bool found;</div><div class='add'>+</div><div class='add'>+		if (!is_subpage) {</div><div class='add'>+			/*</div><div class='add'>+			 * For non-subpage case, the found delalloc range must</div><div class='add'>+			 * cover this folio and there must be only one locked</div><div class='add'>+			 * delalloc range.</div><div class='add'>+			 */</div><div class='add'>+			found_start = page_start;</div><div class='add'>+			found_len = last_delalloc_end + 1 - found_start;</div><div class='add'>+			found = true;</div><div class='add'>+		} else {</div><div class='add'>+			found = find_next_delalloc_bitmap(folio, &amp;delalloc_bitmap,</div><div class='add'>+					delalloc_start, &amp;found_start, &amp;found_len);</div><div class='ctx'> 		}</div><div class='add'>+		if (!found)</div><div class='add'>+			break;</div><div class='ctx'> 		/*</div><div class='del'>-		 * delalloc_end is already one less than the total length, so</div><div class='del'>-		 * we don't subtract one from PAGE_SIZE</div><div class='add'>+		 * The subpage range covers the last sector, the delalloc range may</div><div class='add'>+		 * end beyond the folio boundary, use the saved delalloc_end</div><div class='add'>+		 * instead.</div><div class='ctx'> 		 */</div><div class='del'>-		delalloc_to_write += (delalloc_end - delalloc_start +</div><div class='del'>-				      PAGE_SIZE) &gt;&gt; PAGE_SHIFT;</div><div class='del'>-		delalloc_start = delalloc_end + 1;</div><div class='add'>+		if (found_start + found_len &gt;= page_end)</div><div class='add'>+			found_len = last_delalloc_end + 1 - found_start;</div><div class='add'>+</div><div class='add'>+		if (ret &gt;= 0) {</div><div class='add'>+			/*</div><div class='add'>+			 * Some delalloc range may be created by previous folios.</div><div class='add'>+			 * Thus we still need to clean up this range during error</div><div class='add'>+			 * handling.</div><div class='add'>+			 */</div><div class='add'>+			last_finished_delalloc_end = found_start;</div><div class='add'>+			/* No errors hit so far, run the current delalloc range. */</div><div class='add'>+			ret = btrfs_run_delalloc_range(inode, folio,</div><div class='add'>+						       found_start,</div><div class='add'>+						       found_start + found_len - 1,</div><div class='add'>+						       wbc);</div><div class='add'>+			if (ret &gt;= 0)</div><div class='add'>+				last_finished_delalloc_end = found_start + found_len;</div><div class='add'>+			if (unlikely(ret &lt; 0))</div><div class='add'>+				btrfs_err_rl(fs_info,</div><div class='add'>+"failed to run delalloc range, root=%lld ino=%llu folio=%llu submit_bitmap=%*pbl start=%llu len=%u: %d",</div><div class='add'>+					     btrfs_root_id(inode-&gt;root),</div><div class='add'>+					     btrfs_ino(inode),</div><div class='add'>+					     folio_pos(folio),</div><div class='add'>+					     blocks_per_folio,</div><div class='add'>+					     &amp;bio_ctrl-&gt;submit_bitmap,</div><div class='add'>+					     found_start, found_len, ret);</div><div class='add'>+		} else {</div><div class='add'>+			/*</div><div class='add'>+			 * We've hit an error during previous delalloc range,</div><div class='add'>+			 * have to cleanup the remaining locked ranges.</div><div class='add'>+			 */</div><div class='add'>+			btrfs_unlock_extent(&amp;inode-&gt;io_tree, found_start,</div><div class='add'>+					    found_start + found_len - 1, NULL);</div><div class='add'>+			unlock_delalloc_folio(&amp;inode-&gt;vfs_inode, folio,</div><div class='add'>+					      found_start,</div><div class='add'>+					      found_start + found_len - 1);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * We have some ranges that's going to be submitted asynchronously</div><div class='add'>+		 * (compression or inline).  These range have their own control</div><div class='add'>+		 * on when to unlock the pages.  We should not touch them</div><div class='add'>+		 * anymore, so clear the range from the submission bitmap.</div><div class='add'>+		 */</div><div class='add'>+		if (ret &gt; 0) {</div><div class='add'>+			unsigned int start_bit = (found_start - page_start) &gt;&gt;</div><div class='add'>+						 fs_info-&gt;sectorsize_bits;</div><div class='add'>+			unsigned int end_bit = (min(page_end + 1, found_start + found_len) -</div><div class='add'>+						page_start) &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='add'>+			bitmap_clear(&amp;bio_ctrl-&gt;submit_bitmap, start_bit, end_bit - start_bit);</div><div class='add'>+		}</div><div class='add'>+		/*</div><div class='add'>+		 * Above btrfs_run_delalloc_range() may have unlocked the folio,</div><div class='add'>+		 * thus for the last range, we cannot touch the folio anymore.</div><div class='add'>+		 */</div><div class='add'>+		if (found_start + found_len &gt;= last_delalloc_end + 1)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		delalloc_start = found_start + found_len;</div><div class='add'>+	}</div><div class='add'>+	/*</div><div class='add'>+	 * It's possible we had some ordered extents created before we hit</div><div class='add'>+	 * an error, cleanup non-async successfully created delalloc ranges.</div><div class='add'>+	 */</div><div class='add'>+	if (unlikely(ret &lt; 0)) {</div><div class='add'>+		unsigned int bitmap_size = min(</div><div class='add'>+				(last_finished_delalloc_end - page_start) &gt;&gt;</div><div class='add'>+				fs_info-&gt;sectorsize_bits,</div><div class='add'>+				blocks_per_folio);</div><div class='add'>+</div><div class='add'>+		for_each_set_bit(bit, &amp;bio_ctrl-&gt;submit_bitmap, bitmap_size)</div><div class='add'>+			btrfs_mark_ordered_io_finished(inode, folio,</div><div class='add'>+				page_start + (bit &lt;&lt; fs_info-&gt;sectorsize_bits),</div><div class='add'>+				fs_info-&gt;sectorsize, false);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='add'>+	if (last_delalloc_end)</div><div class='add'>+		delalloc_end = last_delalloc_end;</div><div class='add'>+	else</div><div class='add'>+		delalloc_end = page_end;</div><div class='add'>+	/*</div><div class='add'>+	 * delalloc_end is already one less than the total length, so</div><div class='add'>+	 * we don't subtract one from PAGE_SIZE.</div><div class='add'>+	 */</div><div class='add'>+	delalloc_to_write +=</div><div class='add'>+		DIV_ROUND_UP(delalloc_end + 1 - page_start, PAGE_SIZE);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If all ranges are submitted asynchronously, we just need to account</div><div class='add'>+	 * for them here.</div><div class='add'>+	 */</div><div class='add'>+	if (bitmap_empty(&amp;bio_ctrl-&gt;submit_bitmap, blocks_per_folio)) {</div><div class='add'>+		wbc-&gt;nr_to_write -= delalloc_to_write;</div><div class='add'>+		return 1;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> 	if (wbc-&gt;nr_to_write &lt; delalloc_to_write) {</div><div class='ctx'> 		int thresh = 8192;</div><div class='ctx'> </div><div class='hunk'>@@ -3829,230 +1593,205 @@ static noinline_for_stack int writepage_delalloc(struct btrfs_inode *inode,</div><div class='ctx'> 					 thresh);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* did the fill delalloc function already unlock and start</div><div class='del'>-	 * the IO?</div><div class='del'>-	 */</div><div class='del'>-	if (page_started) {</div><div class='del'>-		/*</div><div class='del'>-		 * we've unlocked the page, so we can't update</div><div class='del'>-		 * the mapping's writeback index, just update</div><div class='del'>-		 * nr_to_write.</div><div class='del'>-		 */</div><div class='del'>-		wbc-&gt;nr_to_write -= *nr_written;</div><div class='del'>-		return 1;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Find the first byte we need to write.</div><div class='add'>+ * Return 0 if we have submitted or queued the sector for submission.</div><div class='add'>+ * Return &lt;0 for critical errors, and the sector will have its dirty flag cleared.</div><div class='ctx'>  *</div><div class='del'>- * For subpage, one page can contain several sectors, and</div><div class='del'>- * __extent_writepage_io() will just grab all extent maps in the page</div><div class='del'>- * range and try to submit all non-inline/non-compressed extents.</div><div class='del'>- *</div><div class='del'>- * This is a big problem for subpage, we shouldn't re-submit already written</div><div class='del'>- * data at all.</div><div class='del'>- * This function will lookup subpage dirty bit to find which range we really</div><div class='del'>- * need to submit.</div><div class='del'>- *</div><div class='del'>- * Return the next dirty range in [@start, @end).</div><div class='del'>- * If no dirty range is found, @start will be page_offset(page) + PAGE_SIZE.</div><div class='add'>+ * Caller should make sure filepos &lt; i_size and handle filepos &gt;= i_size case.</div><div class='ctx'>  */</div><div class='del'>-static void find_next_dirty_byte(struct btrfs_fs_info *fs_info,</div><div class='del'>-				 struct page *page, u64 *start, u64 *end)</div><div class='add'>+static int submit_one_sector(struct btrfs_inode *inode,</div><div class='add'>+			     struct folio *folio,</div><div class='add'>+			     u64 filepos, struct btrfs_bio_ctrl *bio_ctrl,</div><div class='add'>+			     loff_t i_size)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page-&gt;private;</div><div class='del'>-	struct btrfs_subpage_info *spi = fs_info-&gt;subpage_info;</div><div class='del'>-	u64 orig_start = *start;</div><div class='del'>-	/* Declare as unsigned long so we can use bitmap ops */</div><div class='del'>-	unsigned long flags;</div><div class='del'>-	int range_start_bit;</div><div class='del'>-	int range_end_bit;</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	struct extent_map *em;</div><div class='add'>+	u64 block_start;</div><div class='add'>+	u64 disk_bytenr;</div><div class='add'>+	u64 extent_offset;</div><div class='add'>+	u64 em_end;</div><div class='add'>+	const u32 sectorsize = fs_info-&gt;sectorsize;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * For regular sector size == page size case, since one page only</div><div class='del'>-	 * contains one sector, we return the page offset directly.</div><div class='del'>-	 */</div><div class='del'>-	if (fs_info-&gt;sectorsize == PAGE_SIZE) {</div><div class='del'>-		*start = page_offset(page);</div><div class='del'>-		*end = page_offset(page) + PAGE_SIZE;</div><div class='del'>-		return;</div><div class='add'>+	ASSERT(IS_ALIGNED(filepos, sectorsize));</div><div class='add'>+</div><div class='add'>+	/* @filepos &gt;= i_size case should be handled by the caller. */</div><div class='add'>+	ASSERT(filepos &lt; i_size);</div><div class='add'>+</div><div class='add'>+	em = btrfs_get_extent(inode, NULL, filepos, sectorsize);</div><div class='add'>+	if (IS_ERR(em)) {</div><div class='add'>+		/*</div><div class='add'>+		 * When submission failed, we should still clear the folio dirty.</div><div class='add'>+		 * Or the folio will be written back again but without any</div><div class='add'>+		 * ordered extent.</div><div class='add'>+		 */</div><div class='add'>+		btrfs_folio_clear_dirty(fs_info, folio, filepos, sectorsize);</div><div class='add'>+		btrfs_folio_set_writeback(fs_info, folio, filepos, sectorsize);</div><div class='add'>+		btrfs_folio_clear_writeback(fs_info, folio, filepos, sectorsize);</div><div class='add'>+		return PTR_ERR(em);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	range_start_bit = spi-&gt;dirty_offset +</div><div class='del'>-			  (offset_in_page(orig_start) &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+	extent_offset = filepos - em-&gt;start;</div><div class='add'>+	em_end = btrfs_extent_map_end(em);</div><div class='add'>+	ASSERT(filepos &lt;= em_end);</div><div class='add'>+	ASSERT(IS_ALIGNED(em-&gt;start, sectorsize));</div><div class='add'>+	ASSERT(IS_ALIGNED(em-&gt;len, sectorsize));</div><div class='ctx'> </div><div class='del'>-	/* We should have the page locked, but just in case */</div><div class='del'>-	spin_lock_irqsave(&amp;subpage-&gt;lock, flags);</div><div class='del'>-	bitmap_next_set_region(subpage-&gt;bitmaps, &amp;range_start_bit, &amp;range_end_bit,</div><div class='del'>-			       spi-&gt;dirty_offset + spi-&gt;bitmap_nr_bits);</div><div class='del'>-	spin_unlock_irqrestore(&amp;subpage-&gt;lock, flags);</div><div class='add'>+	block_start = btrfs_extent_map_block_start(em);</div><div class='add'>+	disk_bytenr = btrfs_extent_map_block_start(em) + extent_offset;</div><div class='ctx'> </div><div class='del'>-	range_start_bit -= spi-&gt;dirty_offset;</div><div class='del'>-	range_end_bit -= spi-&gt;dirty_offset;</div><div class='add'>+	ASSERT(!btrfs_extent_map_is_compressed(em));</div><div class='add'>+	ASSERT(block_start != EXTENT_MAP_HOLE);</div><div class='add'>+	ASSERT(block_start != EXTENT_MAP_INLINE);</div><div class='add'>+</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='add'>+	em = NULL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Although the PageDirty bit is cleared before entering this</div><div class='add'>+	 * function, subpage dirty bit is not cleared.</div><div class='add'>+	 * So clear subpage dirty bit here so next time we won't submit</div><div class='add'>+	 * a folio for a range already written to disk.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_folio_clear_dirty(fs_info, folio, filepos, sectorsize);</div><div class='add'>+	btrfs_folio_set_writeback(fs_info, folio, filepos, sectorsize);</div><div class='add'>+	/*</div><div class='add'>+	 * Above call should set the whole folio with writeback flag, even</div><div class='add'>+	 * just for a single subpage sector.</div><div class='add'>+	 * As long as the folio is properly locked and the range is correct,</div><div class='add'>+	 * we should always get the folio with writeback flag.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(folio_test_writeback(folio));</div><div class='ctx'> </div><div class='del'>-	*start = page_offset(page) + range_start_bit * fs_info-&gt;sectorsize;</div><div class='del'>-	*end = page_offset(page) + range_end_bit * fs_info-&gt;sectorsize;</div><div class='add'>+	submit_extent_folio(bio_ctrl, disk_bytenr, folio,</div><div class='add'>+			    sectorsize, filepos - folio_pos(folio), 0);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * helper for __extent_writepage.  This calls the writepage start hooks,</div><div class='add'>+ * Helper for extent_writepage().  This calls the writepage start hooks,</div><div class='ctx'>  * and does the loop to map the page into extents and bios.</div><div class='ctx'>  *</div><div class='ctx'>  * We return 1 if the IO is started and the page is unlocked,</div><div class='ctx'>  * 0 if all went well (page still locked)</div><div class='ctx'>  * &lt; 0 if there were errors (page still locked)</div><div class='ctx'>  */</div><div class='del'>-static noinline_for_stack int __extent_writepage_io(struct btrfs_inode *inode,</div><div class='del'>-				 struct page *page,</div><div class='del'>-				 struct writeback_control *wbc,</div><div class='del'>-				 struct extent_page_data *epd,</div><div class='del'>-				 loff_t i_size,</div><div class='del'>-				 unsigned long nr_written,</div><div class='del'>-				 int *nr_ret)</div><div class='add'>+static noinline_for_stack int extent_writepage_io(struct btrfs_inode *inode,</div><div class='add'>+						  struct folio *folio,</div><div class='add'>+						  u64 start, u32 len,</div><div class='add'>+						  struct btrfs_bio_ctrl *bio_ctrl,</div><div class='add'>+						  loff_t i_size)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='del'>-	u64 cur = page_offset(page);</div><div class='del'>-	u64 end = cur + PAGE_SIZE - 1;</div><div class='del'>-	u64 extent_offset;</div><div class='del'>-	u64 block_start;</div><div class='del'>-	struct extent_map *em;</div><div class='add'>+	unsigned long range_bitmap = 0;</div><div class='add'>+	bool submitted_io = false;</div><div class='add'>+	int found_error = 0;</div><div class='add'>+	const u64 end = start + len;</div><div class='add'>+	const u64 folio_start = folio_pos(folio);</div><div class='add'>+	const u64 folio_end = folio_start + folio_size(folio);</div><div class='add'>+	const unsigned int blocks_per_folio = btrfs_blocks_per_folio(fs_info, folio);</div><div class='add'>+	u64 cur;</div><div class='add'>+	int bit;</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	int nr = 0;</div><div class='del'>-	u32 opf = REQ_OP_WRITE;</div><div class='del'>-	const unsigned int write_flags = wbc_to_write_flags(wbc);</div><div class='del'>-	bool compressed;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_writepage_cow_fixup(page);</div><div class='del'>-	if (ret) {</div><div class='add'>+	ASSERT(start &gt;= folio_start, "start=%llu folio_start=%llu", start, folio_start);</div><div class='add'>+	ASSERT(end &lt;= folio_end, "start=%llu len=%u folio_start=%llu folio_size=%zu",</div><div class='add'>+	       start, len, folio_start, folio_size(folio));</div><div class='add'>+</div><div class='add'>+	ret = btrfs_writepage_cow_fixup(folio);</div><div class='add'>+	if (ret == -EAGAIN) {</div><div class='ctx'> 		/* Fixup worker will requeue */</div><div class='del'>-		redirty_page_for_writepage(wbc, page);</div><div class='del'>-		update_nr_written(wbc, nr_written);</div><div class='del'>-		unlock_page(page);</div><div class='add'>+		folio_redirty_for_writepage(bio_ctrl-&gt;wbc, folio);</div><div class='add'>+		folio_unlock(folio);</div><div class='ctx'> 		return 1;</div><div class='ctx'> 	}</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		btrfs_folio_clear_dirty(fs_info, folio, start, len);</div><div class='add'>+		btrfs_folio_set_writeback(fs_info, folio, start, len);</div><div class='add'>+		btrfs_folio_clear_writeback(fs_info, folio, start, len);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * we don't want to touch the inode after unlocking the page,</div><div class='del'>-	 * so we update the mapping writeback index now</div><div class='del'>-	 */</div><div class='del'>-	update_nr_written(wbc, nr_written + 1);</div><div class='add'>+	for (cur = start; cur &lt; end; cur += fs_info-&gt;sectorsize)</div><div class='add'>+		set_bit((cur - folio_start) &gt;&gt; fs_info-&gt;sectorsize_bits, &amp;range_bitmap);</div><div class='add'>+	bitmap_and(&amp;bio_ctrl-&gt;submit_bitmap, &amp;bio_ctrl-&gt;submit_bitmap, &amp;range_bitmap,</div><div class='add'>+		   blocks_per_folio);</div><div class='ctx'> </div><div class='del'>-	while (cur &lt;= end) {</div><div class='del'>-		u64 disk_bytenr;</div><div class='del'>-		u64 em_end;</div><div class='del'>-		u64 dirty_range_start = cur;</div><div class='del'>-		u64 dirty_range_end;</div><div class='del'>-		u32 iosize;</div><div class='add'>+	bio_ctrl-&gt;end_io_func = end_bbio_data_write;</div><div class='add'>+</div><div class='add'>+	for_each_set_bit(bit, &amp;bio_ctrl-&gt;submit_bitmap, blocks_per_folio) {</div><div class='add'>+		cur = folio_pos(folio) + (bit &lt;&lt; fs_info-&gt;sectorsize_bits);</div><div class='ctx'> </div><div class='ctx'> 		if (cur &gt;= i_size) {</div><div class='del'>-			btrfs_writepage_endio_finish_ordered(inode, page, cur,</div><div class='del'>-							     end, true);</div><div class='add'>+			struct btrfs_ordered_extent *ordered;</div><div class='add'>+</div><div class='add'>+			ordered = btrfs_lookup_first_ordered_range(inode, cur,</div><div class='add'>+								   folio_end - cur);</div><div class='add'>+			/*</div><div class='add'>+			 * We have just run delalloc before getting here, so</div><div class='add'>+			 * there must be an ordered extent.</div><div class='add'>+			 */</div><div class='add'>+			ASSERT(ordered != NULL);</div><div class='add'>+			spin_lock(&amp;inode-&gt;ordered_tree_lock);</div><div class='add'>+			set_bit(BTRFS_ORDERED_TRUNCATED, &amp;ordered-&gt;flags);</div><div class='add'>+			ordered-&gt;truncated_len = min(ordered-&gt;truncated_len,</div><div class='add'>+						     cur - ordered-&gt;file_offset);</div><div class='add'>+			spin_unlock(&amp;inode-&gt;ordered_tree_lock);</div><div class='add'>+			btrfs_put_ordered_extent(ordered);</div><div class='add'>+</div><div class='add'>+			btrfs_mark_ordered_io_finished(inode, folio, cur,</div><div class='add'>+						       end - cur, true);</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * This range is beyond i_size, thus we don't need to</div><div class='ctx'> 			 * bother writing back.</div><div class='ctx'> 			 * But we still need to clear the dirty subpage bit, or</div><div class='del'>-			 * the next time the page gets dirtied, we will try to</div><div class='add'>+			 * the next time the folio gets dirtied, we will try to</div><div class='ctx'> 			 * writeback the sectors with subpage dirty bits,</div><div class='ctx'> 			 * causing writeback without ordered extent.</div><div class='ctx'> 			 */</div><div class='del'>-			btrfs_page_clear_dirty(fs_info, page, cur, end + 1 - cur);</div><div class='add'>+			btrfs_folio_clear_dirty(fs_info, folio, cur, end - cur);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-</div><div class='del'>-		find_next_dirty_byte(fs_info, page, &amp;dirty_range_start,</div><div class='del'>-				     &amp;dirty_range_end);</div><div class='del'>-		if (cur &lt; dirty_range_start) {</div><div class='del'>-			cur = dirty_range_start;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		em = btrfs_get_extent(inode, NULL, 0, cur, end - cur + 1);</div><div class='del'>-		if (IS_ERR_OR_NULL(em)) {</div><div class='del'>-			btrfs_page_set_error(fs_info, page, cur, end - cur + 1);</div><div class='del'>-			ret = PTR_ERR_OR_ZERO(em);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		extent_offset = cur - em-&gt;start;</div><div class='del'>-		em_end = extent_map_end(em);</div><div class='del'>-		ASSERT(cur &lt;= em_end);</div><div class='del'>-		ASSERT(cur &lt; end);</div><div class='del'>-		ASSERT(IS_ALIGNED(em-&gt;start, fs_info-&gt;sectorsize));</div><div class='del'>-		ASSERT(IS_ALIGNED(em-&gt;len, fs_info-&gt;sectorsize));</div><div class='del'>-		block_start = em-&gt;block_start;</div><div class='del'>-		compressed = test_bit(EXTENT_FLAG_COMPRESSED, &amp;em-&gt;flags);</div><div class='del'>-		disk_bytenr = em-&gt;block_start + extent_offset;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Note that em_end from extent_map_end() and dirty_range_end from</div><div class='del'>-		 * find_next_dirty_byte() are all exclusive</div><div class='del'>-		 */</div><div class='del'>-		iosize = min(min(em_end, end + 1), dirty_range_end) - cur;</div><div class='del'>-</div><div class='del'>-		if (btrfs_use_zone_append(inode, em-&gt;block_start))</div><div class='del'>-			opf = REQ_OP_ZONE_APPEND;</div><div class='del'>-</div><div class='del'>-		free_extent_map(em);</div><div class='del'>-		em = NULL;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * compressed and inline extents are written through other</div><div class='del'>-		 * paths in the FS</div><div class='del'>-		 */</div><div class='del'>-		if (compressed || block_start == EXTENT_MAP_HOLE ||</div><div class='del'>-		    block_start == EXTENT_MAP_INLINE) {</div><div class='del'>-			if (compressed)</div><div class='del'>-				nr++;</div><div class='del'>-			else</div><div class='del'>-				btrfs_writepage_endio_finish_ordered(inode,</div><div class='del'>-						page, cur, cur + iosize - 1, true);</div><div class='del'>-			btrfs_page_clear_dirty(fs_info, page, cur, iosize);</div><div class='del'>-			cur += iosize;</div><div class='add'>+		ret = submit_one_sector(inode, folio, cur, bio_ctrl, i_size);</div><div class='add'>+		if (unlikely(ret &lt; 0)) {</div><div class='add'>+			/*</div><div class='add'>+			 * bio_ctrl may contain a bio crossing several folios.</div><div class='add'>+			 * Submit it immediately so that the bio has a chance</div><div class='add'>+			 * to finish normally, other than marked as error.</div><div class='add'>+			 */</div><div class='add'>+			submit_one_bio(bio_ctrl);</div><div class='add'>+			/*</div><div class='add'>+			 * Failed to grab the extent map which should be very rare.</div><div class='add'>+			 * Since there is no bio submitted to finish the ordered</div><div class='add'>+			 * extent, we have to manually finish this sector.</div><div class='add'>+			 */</div><div class='add'>+			btrfs_mark_ordered_io_finished(inode, folio, cur,</div><div class='add'>+						       fs_info-&gt;sectorsize, false);</div><div class='add'>+			if (!found_error)</div><div class='add'>+				found_error = ret;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='del'>-</div><div class='del'>-		btrfs_set_range_writeback(inode, cur, cur + iosize - 1);</div><div class='del'>-		if (!PageWriteback(page)) {</div><div class='del'>-			btrfs_err(inode-&gt;root-&gt;fs_info,</div><div class='del'>-				   "page %lu not writeback, cur %llu end %llu",</div><div class='del'>-			       page-&gt;index, cur, end);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Although the PageDirty bit is cleared before entering this</div><div class='del'>-		 * function, subpage dirty bit is not cleared.</div><div class='del'>-		 * So clear subpage dirty bit here so next time we won't submit</div><div class='del'>-		 * page for range already written to disk.</div><div class='del'>-		 */</div><div class='del'>-		btrfs_page_clear_dirty(fs_info, page, cur, iosize);</div><div class='del'>-</div><div class='del'>-		ret = submit_extent_page(opf | write_flags, wbc,</div><div class='del'>-					 &amp;epd-&gt;bio_ctrl, page,</div><div class='del'>-					 disk_bytenr, iosize,</div><div class='del'>-					 cur - page_offset(page),</div><div class='del'>-					 end_bio_extent_writepage,</div><div class='del'>-					 0, 0, false);</div><div class='del'>-		if (ret) {</div><div class='del'>-			btrfs_page_set_error(fs_info, page, cur, iosize);</div><div class='del'>-			if (PageWriteback(page))</div><div class='del'>-				btrfs_page_clear_writeback(fs_info, page, cur,</div><div class='del'>-							   iosize);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		cur += iosize;</div><div class='del'>-		nr++;</div><div class='add'>+		submitted_io = true;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='del'>-	 * If we finish without problem, we should not only clear page dirty,</div><div class='del'>-	 * but also empty subpage dirty bits</div><div class='add'>+	 * If we didn't submitted any sector (&gt;= i_size), folio dirty get</div><div class='add'>+	 * cleared but PAGECACHE_TAG_DIRTY is not cleared (only cleared</div><div class='add'>+	 * by folio_start_writeback() if the folio is not dirty).</div><div class='add'>+	 *</div><div class='add'>+	 * Here we set writeback and clear for the range. If the full folio</div><div class='add'>+	 * is no longer dirty then we clear the PAGECACHE_TAG_DIRTY tag.</div><div class='add'>+	 *</div><div class='add'>+	 * If we hit any error, the corresponding sector will have its dirty</div><div class='add'>+	 * flag cleared and writeback finished, thus no need to handle the error case.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!ret)</div><div class='del'>-		btrfs_page_assert_not_dirty(fs_info, page);</div><div class='del'>-	*nr_ret = nr;</div><div class='del'>-	return ret;</div><div class='add'>+	if (!submitted_io &amp;&amp; !found_error) {</div><div class='add'>+		btrfs_folio_set_writeback(fs_info, folio, start, len);</div><div class='add'>+		btrfs_folio_clear_writeback(fs_info, folio, start, len);</div><div class='add'>+	}</div><div class='add'>+	return found_error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -4064,174 +1803,115 @@ static noinline_for_stack int __extent_writepage_io(struct btrfs_inode *inode,</div><div class='ctx'>  * Return 0 if everything goes well.</div><div class='ctx'>  * Return &lt;0 for error.</div><div class='ctx'>  */</div><div class='del'>-static int __extent_writepage(struct page *page, struct writeback_control *wbc,</div><div class='del'>-			      struct extent_page_data *epd)</div><div class='add'>+static int extent_writepage(struct folio *folio, struct btrfs_bio_ctrl *bio_ctrl)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	const u64 page_start = page_offset(page);</div><div class='del'>-	const u64 page_end = page_start + PAGE_SIZE - 1;</div><div class='add'>+	struct btrfs_inode *inode = BTRFS_I(folio-&gt;mapping-&gt;host);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='ctx'> 	int ret;</div><div class='del'>-	int nr = 0;</div><div class='ctx'> 	size_t pg_offset;</div><div class='del'>-	loff_t i_size = i_size_read(inode);</div><div class='del'>-	unsigned long end_index = i_size &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	unsigned long nr_written = 0;</div><div class='del'>-</div><div class='del'>-	trace___extent_writepage(page, inode, wbc);</div><div class='add'>+	loff_t i_size = i_size_read(&amp;inode-&gt;vfs_inode);</div><div class='add'>+	const pgoff_t end_index = i_size &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	const unsigned int blocks_per_folio = btrfs_blocks_per_folio(fs_info, folio);</div><div class='ctx'> </div><div class='del'>-	WARN_ON(!PageLocked(page));</div><div class='add'>+	trace_extent_writepage(folio, &amp;inode-&gt;vfs_inode, bio_ctrl-&gt;wbc);</div><div class='ctx'> </div><div class='del'>-	btrfs_page_clear_error(btrfs_sb(inode-&gt;i_sb), page,</div><div class='del'>-			       page_offset(page), PAGE_SIZE);</div><div class='add'>+	WARN_ON(!folio_test_locked(folio));</div><div class='ctx'> </div><div class='del'>-	pg_offset = offset_in_page(i_size);</div><div class='del'>-	if (page-&gt;index &gt; end_index ||</div><div class='del'>-	   (page-&gt;index == end_index &amp;&amp; !pg_offset)) {</div><div class='del'>-		page-&gt;mapping-&gt;a_ops-&gt;invalidatepage(page, 0, PAGE_SIZE);</div><div class='del'>-		unlock_page(page);</div><div class='add'>+	pg_offset = offset_in_folio(folio, i_size);</div><div class='add'>+	if (folio-&gt;index &gt; end_index ||</div><div class='add'>+	   (folio-&gt;index == end_index &amp;&amp; !pg_offset)) {</div><div class='add'>+		folio_invalidate(folio, 0, folio_size(folio));</div><div class='add'>+		folio_unlock(folio);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (page-&gt;index == end_index) {</div><div class='del'>-		memzero_page(page, pg_offset, PAGE_SIZE - pg_offset);</div><div class='del'>-		flush_dcache_page(page);</div><div class='del'>-	}</div><div class='add'>+	if (folio_contains(folio, end_index))</div><div class='add'>+		folio_zero_range(folio, pg_offset, folio_size(folio) - pg_offset);</div><div class='ctx'> </div><div class='del'>-	ret = set_page_extent_mapped(page);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		SetPageError(page);</div><div class='add'>+	/*</div><div class='add'>+	 * Default to unlock the whole folio.</div><div class='add'>+	 * The proper bitmap can only be initialized until writepage_delalloc().</div><div class='add'>+	 */</div><div class='add'>+	bio_ctrl-&gt;submit_bitmap = (unsigned long)-1;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If the page is dirty but without private set, it's marked dirty</div><div class='add'>+	 * without informing the fs.</div><div class='add'>+	 * Nowadays that is a bug, since the introduction of</div><div class='add'>+	 * pin_user_pages*().</div><div class='add'>+	 *</div><div class='add'>+	 * So here we check if the page has private set to rule out such</div><div class='add'>+	 * case.</div><div class='add'>+	 * But we also have a long history of relying on the COW fixup,</div><div class='add'>+	 * so here we only enable this check for experimental builds until</div><div class='add'>+	 * we're sure it's safe.</div><div class='add'>+	 */</div><div class='add'>+	if (IS_ENABLED(CONFIG_BTRFS_EXPERIMENTAL) &amp;&amp;</div><div class='add'>+	    unlikely(!folio_test_private(folio))) {</div><div class='add'>+		WARN_ON(IS_ENABLED(CONFIG_BTRFS_DEBUG));</div><div class='add'>+		btrfs_err_rl(fs_info,</div><div class='add'>+	"root %lld ino %llu folio %llu is marked dirty without notifying the fs",</div><div class='add'>+			     btrfs_root_id(inode-&gt;root),</div><div class='add'>+			     btrfs_ino(inode), folio_pos(folio));</div><div class='add'>+		ret = -EUCLEAN;</div><div class='ctx'> 		goto done;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!epd-&gt;extent_locked) {</div><div class='del'>-		ret = writepage_delalloc(BTRFS_I(inode), page, wbc, &amp;nr_written);</div><div class='del'>-		if (ret == 1)</div><div class='del'>-			return 0;</div><div class='del'>-		if (ret)</div><div class='del'>-			goto done;</div><div class='del'>-	}</div><div class='add'>+	ret = set_folio_extent_mapped(folio);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto done;</div><div class='ctx'> </div><div class='del'>-	ret = __extent_writepage_io(BTRFS_I(inode), page, wbc, epd, i_size,</div><div class='del'>-				    nr_written, &amp;nr);</div><div class='add'>+	ret = writepage_delalloc(inode, folio, bio_ctrl);</div><div class='ctx'> 	if (ret == 1)</div><div class='ctx'> 		return 0;</div><div class='add'>+	if (ret)</div><div class='add'>+		goto done;</div><div class='add'>+</div><div class='add'>+	ret = extent_writepage_io(inode, folio, folio_pos(folio),</div><div class='add'>+				  folio_size(folio), bio_ctrl, i_size);</div><div class='add'>+	if (ret == 1)</div><div class='add'>+		return 0;</div><div class='add'>+	if (unlikely(ret &lt; 0))</div><div class='add'>+		btrfs_err_rl(fs_info,</div><div class='add'>+"failed to submit blocks, root=%lld inode=%llu folio=%llu submit_bitmap=%*pbl: %d",</div><div class='add'>+			     btrfs_root_id(inode-&gt;root), btrfs_ino(inode),</div><div class='add'>+			     folio_pos(folio), blocks_per_folio,</div><div class='add'>+			     &amp;bio_ctrl-&gt;submit_bitmap, ret);</div><div class='add'>+</div><div class='add'>+	bio_ctrl-&gt;wbc-&gt;nr_to_write--;</div><div class='ctx'> </div><div class='ctx'> done:</div><div class='del'>-	if (nr == 0) {</div><div class='del'>-		/* make sure the mapping tag for page dirty gets cleared */</div><div class='del'>-		set_page_writeback(page);</div><div class='del'>-		end_page_writeback(page);</div><div class='del'>-	}</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		mapping_set_error(folio-&gt;mapping, ret);</div><div class='ctx'> 	/*</div><div class='del'>-	 * Here we used to have a check for PageError() and then set @ret and</div><div class='del'>-	 * call end_extent_writepage().</div><div class='del'>-	 *</div><div class='del'>-	 * But in fact setting @ret here will cause different error paths</div><div class='del'>-	 * between subpage and regular sectorsize.</div><div class='del'>-	 *</div><div class='del'>-	 * For regular page size, we never submit current page, but only add</div><div class='del'>-	 * current page to current bio.</div><div class='del'>-	 * The bio submission can only happen in next page.</div><div class='del'>-	 * Thus if we hit the PageError() branch, @ret is already set to</div><div class='del'>-	 * non-zero value and will not get updated for regular sectorsize.</div><div class='del'>-	 *</div><div class='del'>-	 * But for subpage case, it's possible we submit part of current page,</div><div class='del'>-	 * thus can get PageError() set by submitted bio of the same page,</div><div class='del'>-	 * while our @ret is still 0.</div><div class='del'>-	 *</div><div class='del'>-	 * So here we unify the behavior and don't set @ret.</div><div class='del'>-	 * Error can still be properly passed to higher layer as page will</div><div class='del'>-	 * be set error, here we just don't handle the IO failure.</div><div class='del'>-	 *</div><div class='del'>-	 * NOTE: This is just a hotfix for subpage.</div><div class='del'>-	 * The root fix will be properly ending ordered extent when we hit</div><div class='del'>-	 * an error during writeback.</div><div class='del'>-	 *</div><div class='del'>-	 * But that needs a bigger refactoring, as we not only need to grab the</div><div class='del'>-	 * submitted OE, but also need to know exactly at which bytenr we hit</div><div class='del'>-	 * the error.</div><div class='del'>-	 * Currently the full page based __extent_writepage_io() is not</div><div class='del'>-	 * capable of that.</div><div class='add'>+	 * Only unlock ranges that are submitted. As there can be some async</div><div class='add'>+	 * submitted ranges inside the folio.</div><div class='ctx'> 	 */</div><div class='del'>-	if (PageError(page))</div><div class='del'>-		end_extent_writepage(page, ret, page_start, page_end);</div><div class='del'>-	if (epd-&gt;extent_locked) {</div><div class='del'>-		/*</div><div class='del'>-		 * If epd-&gt;extent_locked, it's from extent_write_locked_range(),</div><div class='del'>-		 * the page can either be locked by lock_page() or</div><div class='del'>-		 * process_one_page().</div><div class='del'>-		 * Let btrfs_page_unlock_writer() handle both cases.</div><div class='del'>-		 */</div><div class='del'>-		ASSERT(wbc);</div><div class='del'>-		btrfs_page_unlock_writer(fs_info, page, wbc-&gt;range_start,</div><div class='del'>-					 wbc-&gt;range_end + 1 - wbc-&gt;range_start);</div><div class='del'>-	} else {</div><div class='del'>-		unlock_page(page);</div><div class='del'>-	}</div><div class='add'>+	btrfs_folio_end_lock_bitmap(fs_info, folio, bio_ctrl-&gt;submit_bitmap);</div><div class='ctx'> 	ASSERT(ret &lt;= 0);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void wait_on_extent_buffer_writeback(struct extent_buffer *eb)</div><div class='del'>-{</div><div class='del'>-	wait_on_bit_io(&amp;eb-&gt;bflags, EXTENT_BUFFER_WRITEBACK,</div><div class='del'>-		       TASK_UNINTERRUPTIBLE);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void end_extent_buffer_writeback(struct extent_buffer *eb)</div><div class='del'>-{</div><div class='del'>-	if (test_bit(EXTENT_BUFFER_ZONE_FINISH, &amp;eb-&gt;bflags))</div><div class='del'>-		btrfs_zone_finish_endio(eb-&gt;fs_info, eb-&gt;start, eb-&gt;len);</div><div class='del'>-</div><div class='del'>-	clear_bit(EXTENT_BUFFER_WRITEBACK, &amp;eb-&gt;bflags);</div><div class='del'>-	smp_mb__after_atomic();</div><div class='del'>-	wake_up_bit(&amp;eb-&gt;bflags, EXTENT_BUFFER_WRITEBACK);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Lock extent buffer status and pages for writeback.</div><div class='ctx'>  *</div><div class='del'>- * May try to flush write bio if we can't get the lock.</div><div class='del'>- *</div><div class='del'>- * Return  0 if the extent buffer doesn't need to be submitted.</div><div class='del'>- *           (E.g. the extent buffer is not dirty)</div><div class='del'>- * Return &gt;0 is the extent buffer is submitted to bio.</div><div class='del'>- * Return &lt;0 if something went wrong, no page is locked.</div><div class='add'>+ * Return %false if the extent buffer doesn't need to be submitted (e.g. the</div><div class='add'>+ * extent buffer is not dirty)</div><div class='add'>+ * Return %true is the extent buffer is submitted to bio.</div><div class='ctx'>  */</div><div class='del'>-static noinline_for_stack int lock_extent_buffer_for_io(struct extent_buffer *eb,</div><div class='del'>-			  struct extent_page_data *epd)</div><div class='add'>+static noinline_for_stack bool lock_extent_buffer_for_io(struct extent_buffer *eb,</div><div class='add'>+			  struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='del'>-	int i, num_pages, failed_page_nr;</div><div class='del'>-	int flush = 0;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	if (!btrfs_try_tree_write_lock(eb)) {</div><div class='del'>-		ret = flush_write_bio(epd);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			return ret;</div><div class='del'>-		flush = 1;</div><div class='del'>-		btrfs_tree_lock(eb);</div><div class='del'>-	}</div><div class='add'>+	bool ret = false;</div><div class='ctx'> </div><div class='del'>-	if (test_bit(EXTENT_BUFFER_WRITEBACK, &amp;eb-&gt;bflags)) {</div><div class='add'>+	btrfs_tree_lock(eb);</div><div class='add'>+	while (test_bit(EXTENT_BUFFER_WRITEBACK, &amp;eb-&gt;bflags)) {</div><div class='ctx'> 		btrfs_tree_unlock(eb);</div><div class='del'>-		if (!epd-&gt;sync_io)</div><div class='del'>-			return 0;</div><div class='del'>-		if (!flush) {</div><div class='del'>-			ret = flush_write_bio(epd);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				return ret;</div><div class='del'>-			flush = 1;</div><div class='del'>-		}</div><div class='del'>-		while (1) {</div><div class='del'>-			wait_on_extent_buffer_writeback(eb);</div><div class='del'>-			btrfs_tree_lock(eb);</div><div class='del'>-			if (!test_bit(EXTENT_BUFFER_WRITEBACK, &amp;eb-&gt;bflags))</div><div class='del'>-				break;</div><div class='del'>-			btrfs_tree_unlock(eb);</div><div class='del'>-		}</div><div class='add'>+		if (wbc-&gt;sync_mode != WB_SYNC_ALL)</div><div class='add'>+			return false;</div><div class='add'>+		wait_on_extent_buffer_writeback(eb);</div><div class='add'>+		btrfs_tree_lock(eb);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -4241,84 +1921,50 @@ static noinline_for_stack int lock_extent_buffer_for_io(struct extent_buffer *eb</div><div class='ctx'> 	 */</div><div class='ctx'> 	spin_lock(&amp;eb-&gt;refs_lock);</div><div class='ctx'> 	if (test_and_clear_bit(EXTENT_BUFFER_DIRTY, &amp;eb-&gt;bflags)) {</div><div class='add'>+		XA_STATE(xas, &amp;fs_info-&gt;buffer_tree, eb-&gt;start &gt;&gt; fs_info-&gt;nodesize_bits);</div><div class='add'>+		unsigned long flags;</div><div class='add'>+</div><div class='ctx'> 		set_bit(EXTENT_BUFFER_WRITEBACK, &amp;eb-&gt;bflags);</div><div class='ctx'> 		spin_unlock(&amp;eb-&gt;refs_lock);</div><div class='add'>+</div><div class='add'>+		xas_lock_irqsave(&amp;xas, flags);</div><div class='add'>+		xas_load(&amp;xas);</div><div class='add'>+		xas_set_mark(&amp;xas, PAGECACHE_TAG_WRITEBACK);</div><div class='add'>+		xas_clear_mark(&amp;xas, PAGECACHE_TAG_DIRTY);</div><div class='add'>+		xas_clear_mark(&amp;xas, PAGECACHE_TAG_TOWRITE);</div><div class='add'>+		xas_unlock_irqrestore(&amp;xas, flags);</div><div class='add'>+</div><div class='ctx'> 		btrfs_set_header_flag(eb, BTRFS_HEADER_FLAG_WRITTEN);</div><div class='ctx'> 		percpu_counter_add_batch(&amp;fs_info-&gt;dirty_metadata_bytes,</div><div class='ctx'> 					 -eb-&gt;len,</div><div class='ctx'> 					 fs_info-&gt;dirty_metadata_batch);</div><div class='del'>-		ret = 1;</div><div class='add'>+		ret = true;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		spin_unlock(&amp;eb-&gt;refs_lock);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	btrfs_tree_unlock(eb);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Either we don't need to submit any tree block, or we're submitting</div><div class='del'>-	 * subpage eb.</div><div class='del'>-	 * Subpage metadata doesn't use page locking at all, so we can skip</div><div class='del'>-	 * the page locking.</div><div class='del'>-	 */</div><div class='del'>-	if (!ret || fs_info-&gt;sectorsize &lt; PAGE_SIZE)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	num_pages = num_extent_pages(eb);</div><div class='del'>-	for (i = 0; i &lt; num_pages; i++) {</div><div class='del'>-		struct page *p = eb-&gt;pages[i];</div><div class='del'>-</div><div class='del'>-		if (!trylock_page(p)) {</div><div class='del'>-			if (!flush) {</div><div class='del'>-				int err;</div><div class='del'>-</div><div class='del'>-				err = flush_write_bio(epd);</div><div class='del'>-				if (err &lt; 0) {</div><div class='del'>-					ret = err;</div><div class='del'>-					failed_page_nr = i;</div><div class='del'>-					goto err_unlock;</div><div class='del'>-				}</div><div class='del'>-				flush = 1;</div><div class='del'>-			}</div><div class='del'>-			lock_page(p);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-err_unlock:</div><div class='del'>-	/* Unlock already locked pages */</div><div class='del'>-	for (i = 0; i &lt; failed_page_nr; i++)</div><div class='del'>-		unlock_page(eb-&gt;pages[i]);</div><div class='del'>-	/*</div><div class='del'>-	 * Clear EXTENT_BUFFER_WRITEBACK and wake up anyone waiting on it.</div><div class='del'>-	 * Also set back EXTENT_BUFFER_DIRTY so future attempts to this eb can</div><div class='del'>-	 * be made and undo everything done before.</div><div class='del'>-	 */</div><div class='del'>-	btrfs_tree_lock(eb);</div><div class='del'>-	spin_lock(&amp;eb-&gt;refs_lock);</div><div class='del'>-	set_bit(EXTENT_BUFFER_DIRTY, &amp;eb-&gt;bflags);</div><div class='del'>-	end_extent_buffer_writeback(eb);</div><div class='del'>-	spin_unlock(&amp;eb-&gt;refs_lock);</div><div class='del'>-	percpu_counter_add_batch(&amp;fs_info-&gt;dirty_metadata_bytes, eb-&gt;len,</div><div class='del'>-				 fs_info-&gt;dirty_metadata_batch);</div><div class='del'>-	btrfs_clear_header_flag(eb, BTRFS_HEADER_FLAG_WRITTEN);</div><div class='ctx'> 	btrfs_tree_unlock(eb);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void set_btree_ioerr(struct page *page, struct extent_buffer *eb)</div><div class='add'>+static void set_btree_ioerr(struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='ctx'> </div><div class='del'>-	btrfs_page_set_error(fs_info, page, eb-&gt;start, eb-&gt;len);</div><div class='del'>-	if (test_and_set_bit(EXTENT_BUFFER_WRITE_ERR, &amp;eb-&gt;bflags))</div><div class='del'>-		return;</div><div class='add'>+	set_bit(EXTENT_BUFFER_WRITE_ERR, &amp;eb-&gt;bflags);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * A read may stumble upon this buffer later, make sure that it gets an</div><div class='add'>+	 * error and knows there was an error.</div><div class='add'>+	 */</div><div class='add'>+	clear_bit(EXTENT_BUFFER_UPTODATE, &amp;eb-&gt;bflags);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * If we error out, we should add back the dirty_metadata_bytes</div><div class='del'>-	 * to make it consistent.</div><div class='add'>+	 * We need to set the mapping with the io error as well because a write</div><div class='add'>+	 * error will flip the file system readonly, and then syncfs() will</div><div class='add'>+	 * return a 0 because we are readonly if we don't modify the err seq for</div><div class='add'>+	 * the superblock.</div><div class='ctx'> 	 */</div><div class='del'>-	percpu_counter_add_batch(&amp;fs_info-&gt;dirty_metadata_bytes,</div><div class='del'>-				 eb-&gt;len, fs_info-&gt;dirty_metadata_batch);</div><div class='add'>+	mapping_set_error(eb-&gt;fs_info-&gt;btree_inode-&gt;i_mapping, -EIO);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If writeback for a btree extent that doesn't belong to a log tree</div><div class='hunk'>@@ -4332,7 +1978,7 @@ static void set_btree_ioerr(struct page *page, struct extent_buffer *eb)</div><div class='ctx'> 	 * can be no longer dirty nor marked anymore for writeback (if a</div><div class='ctx'> 	 * subsequent modification to the extent buffer didn't happen before the</div><div class='ctx'> 	 * transaction commit), which makes filemap_fdata[write|wait]_range not</div><div class='del'>-	 * able to find the pages tagged with SetPageError at transaction</div><div class='add'>+	 * able to find the pages which contain errors at transaction</div><div class='ctx'> 	 * commit time. So if this happens we must abort the transaction,</div><div class='ctx'> 	 * otherwise we commit a super block with btree roots that point to</div><div class='ctx'> 	 * btree nodes/leafs whose content on disk is invalid - either garbage</div><div class='hunk'>@@ -4373,119 +2019,168 @@ static void set_btree_ioerr(struct page *page, struct extent_buffer *eb)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * The endio specific version which won't touch any unsafe spinlock in endio</div><div class='del'>- * context.</div><div class='del'>- */</div><div class='del'>-static struct extent_buffer *find_extent_buffer_nolock(</div><div class='del'>-		struct btrfs_fs_info *fs_info, u64 start)</div><div class='add'>+static void buffer_tree_set_mark(const struct extent_buffer *eb, xa_mark_t mark)</div><div class='ctx'> {</div><div class='del'>-	struct extent_buffer *eb;</div><div class='add'>+	struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='add'>+	XA_STATE(xas, &amp;fs_info-&gt;buffer_tree, eb-&gt;start &gt;&gt; fs_info-&gt;nodesize_bits);</div><div class='add'>+	unsigned long flags;</div><div class='ctx'> </div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	eb = radix_tree_lookup(&amp;fs_info-&gt;buffer_radix,</div><div class='del'>-			       start &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='del'>-	if (eb &amp;&amp; atomic_inc_not_zero(&amp;eb-&gt;refs)) {</div><div class='del'>-		rcu_read_unlock();</div><div class='del'>-		return eb;</div><div class='add'>+	xas_lock_irqsave(&amp;xas, flags);</div><div class='add'>+	xas_load(&amp;xas);</div><div class='add'>+	xas_set_mark(&amp;xas, mark);</div><div class='add'>+	xas_unlock_irqrestore(&amp;xas, flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void buffer_tree_clear_mark(const struct extent_buffer *eb, xa_mark_t mark)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='add'>+	XA_STATE(xas, &amp;fs_info-&gt;buffer_tree, eb-&gt;start &gt;&gt; fs_info-&gt;nodesize_bits);</div><div class='add'>+	unsigned long flags;</div><div class='add'>+</div><div class='add'>+	xas_lock_irqsave(&amp;xas, flags);</div><div class='add'>+	xas_load(&amp;xas);</div><div class='add'>+	xas_clear_mark(&amp;xas, mark);</div><div class='add'>+	xas_unlock_irqrestore(&amp;xas, flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void buffer_tree_tag_for_writeback(struct btrfs_fs_info *fs_info,</div><div class='add'>+					  unsigned long start, unsigned long end)</div><div class='add'>+{</div><div class='add'>+	XA_STATE(xas, &amp;fs_info-&gt;buffer_tree, start);</div><div class='add'>+	unsigned int tagged = 0;</div><div class='add'>+	void *eb;</div><div class='add'>+</div><div class='add'>+	xas_lock_irq(&amp;xas);</div><div class='add'>+	xas_for_each_marked(&amp;xas, eb, end, PAGECACHE_TAG_DIRTY) {</div><div class='add'>+		xas_set_mark(&amp;xas, PAGECACHE_TAG_TOWRITE);</div><div class='add'>+		if (++tagged % XA_CHECK_SCHED)</div><div class='add'>+			continue;</div><div class='add'>+		xas_pause(&amp;xas);</div><div class='add'>+		xas_unlock_irq(&amp;xas);</div><div class='add'>+		cond_resched();</div><div class='add'>+		xas_lock_irq(&amp;xas);</div><div class='ctx'> 	}</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-	return NULL;</div><div class='add'>+	xas_unlock_irq(&amp;xas);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * The endio function for subpage extent buffer write.</div><div class='del'>- *</div><div class='del'>- * Unlike end_bio_extent_buffer_writepage(), we only call end_page_writeback()</div><div class='del'>- * after all extent buffers in the page has finished their writeback.</div><div class='del'>- */</div><div class='del'>-static void end_bio_subpage_eb_writepage(struct bio *bio)</div><div class='add'>+struct eb_batch {</div><div class='add'>+	unsigned int nr;</div><div class='add'>+	unsigned int cur;</div><div class='add'>+	struct extent_buffer *ebs[PAGEVEC_SIZE];</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static inline bool eb_batch_add(struct eb_batch *batch, struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info;</div><div class='del'>-	struct bio_vec *bvec;</div><div class='del'>-	struct bvec_iter_all iter_all;</div><div class='add'>+	batch-&gt;ebs[batch-&gt;nr++] = eb;</div><div class='add'>+	return (batch-&gt;nr &lt; PAGEVEC_SIZE);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	fs_info = btrfs_sb(bio_first_page_all(bio)-&gt;mapping-&gt;host-&gt;i_sb);</div><div class='del'>-	ASSERT(fs_info-&gt;sectorsize &lt; PAGE_SIZE);</div><div class='add'>+static inline void eb_batch_init(struct eb_batch *batch)</div><div class='add'>+{</div><div class='add'>+	batch-&gt;nr = 0;</div><div class='add'>+	batch-&gt;cur = 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	ASSERT(!bio_flagged(bio, BIO_CLONED));</div><div class='del'>-	bio_for_each_segment_all(bvec, bio, iter_all) {</div><div class='del'>-		struct page *page = bvec-&gt;bv_page;</div><div class='del'>-		u64 bvec_start = page_offset(page) + bvec-&gt;bv_offset;</div><div class='del'>-		u64 bvec_end = bvec_start + bvec-&gt;bv_len - 1;</div><div class='del'>-		u64 cur_bytenr = bvec_start;</div><div class='add'>+static inline struct extent_buffer *eb_batch_next(struct eb_batch *batch)</div><div class='add'>+{</div><div class='add'>+	if (batch-&gt;cur &gt;= batch-&gt;nr)</div><div class='add'>+		return NULL;</div><div class='add'>+	return batch-&gt;ebs[batch-&gt;cur++];</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		ASSERT(IS_ALIGNED(bvec-&gt;bv_len, fs_info-&gt;nodesize));</div><div class='add'>+static inline void eb_batch_release(struct eb_batch *batch)</div><div class='add'>+{</div><div class='add'>+	for (unsigned int i = 0; i &lt; batch-&gt;nr; i++)</div><div class='add'>+		free_extent_buffer(batch-&gt;ebs[i]);</div><div class='add'>+	eb_batch_init(batch);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		/* Iterate through all extent buffers in the range */</div><div class='del'>-		while (cur_bytenr &lt;= bvec_end) {</div><div class='del'>-			struct extent_buffer *eb;</div><div class='del'>-			int done;</div><div class='add'>+static inline struct extent_buffer *find_get_eb(struct xa_state *xas, unsigned long max,</div><div class='add'>+						xa_mark_t mark)</div><div class='add'>+{</div><div class='add'>+	struct extent_buffer *eb;</div><div class='ctx'> </div><div class='del'>-			/*</div><div class='del'>-			 * Here we can't use find_extent_buffer(), as it may</div><div class='del'>-			 * try to lock eb-&gt;refs_lock, which is not safe in endio</div><div class='del'>-			 * context.</div><div class='del'>-			 */</div><div class='del'>-			eb = find_extent_buffer_nolock(fs_info, cur_bytenr);</div><div class='del'>-			ASSERT(eb);</div><div class='add'>+retry:</div><div class='add'>+	eb = xas_find_marked(xas, max, mark);</div><div class='ctx'> </div><div class='del'>-			cur_bytenr = eb-&gt;start + eb-&gt;len;</div><div class='add'>+	if (xas_retry(xas, eb))</div><div class='add'>+		goto retry;</div><div class='ctx'> </div><div class='del'>-			ASSERT(test_bit(EXTENT_BUFFER_WRITEBACK, &amp;eb-&gt;bflags));</div><div class='del'>-			done = atomic_dec_and_test(&amp;eb-&gt;io_pages);</div><div class='del'>-			ASSERT(done);</div><div class='add'>+	if (!eb)</div><div class='add'>+		return NULL;</div><div class='ctx'> </div><div class='del'>-			if (bio-&gt;bi_status ||</div><div class='del'>-			    test_bit(EXTENT_BUFFER_WRITE_ERR, &amp;eb-&gt;bflags)) {</div><div class='del'>-				ClearPageUptodate(page);</div><div class='del'>-				set_btree_ioerr(page, eb);</div><div class='del'>-			}</div><div class='add'>+	if (!refcount_inc_not_zero(&amp;eb-&gt;refs)) {</div><div class='add'>+		xas_reset(xas);</div><div class='add'>+		goto retry;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-			btrfs_subpage_clear_writeback(fs_info, page, eb-&gt;start,</div><div class='del'>-						      eb-&gt;len);</div><div class='del'>-			end_extent_buffer_writeback(eb);</div><div class='del'>-			/*</div><div class='del'>-			 * free_extent_buffer() will grab spinlock which is not</div><div class='del'>-			 * safe in endio context. Thus here we manually dec</div><div class='del'>-			 * the ref.</div><div class='del'>-			 */</div><div class='del'>-			atomic_dec(&amp;eb-&gt;refs);</div><div class='del'>-		}</div><div class='add'>+	if (unlikely(eb != xas_reload(xas))) {</div><div class='add'>+		free_extent_buffer(eb);</div><div class='add'>+		xas_reset(xas);</div><div class='add'>+		goto retry;</div><div class='ctx'> 	}</div><div class='del'>-	bio_put(bio);</div><div class='add'>+</div><div class='add'>+	return eb;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void end_bio_extent_buffer_writepage(struct bio *bio)</div><div class='add'>+static unsigned int buffer_tree_get_ebs_tag(struct btrfs_fs_info *fs_info,</div><div class='add'>+					    unsigned long *start,</div><div class='add'>+					    unsigned long end, xa_mark_t tag,</div><div class='add'>+					    struct eb_batch *batch)</div><div class='ctx'> {</div><div class='del'>-	struct bio_vec *bvec;</div><div class='add'>+	XA_STATE(xas, &amp;fs_info-&gt;buffer_tree, *start);</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='del'>-	int done;</div><div class='del'>-	struct bvec_iter_all iter_all;</div><div class='ctx'> </div><div class='del'>-	ASSERT(!bio_flagged(bio, BIO_CLONED));</div><div class='del'>-	bio_for_each_segment_all(bvec, bio, iter_all) {</div><div class='del'>-		struct page *page = bvec-&gt;bv_page;</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	while ((eb = find_get_eb(&amp;xas, end, tag)) != NULL) {</div><div class='add'>+		if (!eb_batch_add(batch, eb)) {</div><div class='add'>+			*start = ((eb-&gt;start + eb-&gt;len) &gt;&gt; fs_info-&gt;nodesize_bits);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	if (end == ULONG_MAX)</div><div class='add'>+		*start = ULONG_MAX;</div><div class='add'>+	else</div><div class='add'>+		*start = end + 1;</div><div class='add'>+out:</div><div class='add'>+	rcu_read_unlock();</div><div class='ctx'> </div><div class='del'>-		eb = (struct extent_buffer *)page-&gt;private;</div><div class='del'>-		BUG_ON(!eb);</div><div class='del'>-		done = atomic_dec_and_test(&amp;eb-&gt;io_pages);</div><div class='add'>+	return batch-&gt;nr;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		if (bio-&gt;bi_status ||</div><div class='del'>-		    test_bit(EXTENT_BUFFER_WRITE_ERR, &amp;eb-&gt;bflags)) {</div><div class='del'>-			ClearPageUptodate(page);</div><div class='del'>-			set_btree_ioerr(page, eb);</div><div class='del'>-		}</div><div class='add'>+/*</div><div class='add'>+ * The endio specific version which won't touch any unsafe spinlock in endio</div><div class='add'>+ * context.</div><div class='add'>+ */</div><div class='add'>+static struct extent_buffer *find_extent_buffer_nolock(</div><div class='add'>+		struct btrfs_fs_info *fs_info, u64 start)</div><div class='add'>+{</div><div class='add'>+	struct extent_buffer *eb;</div><div class='add'>+	unsigned long index = (start &gt;&gt; fs_info-&gt;nodesize_bits);</div><div class='add'>+</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	eb = xa_load(&amp;fs_info-&gt;buffer_tree, index);</div><div class='add'>+	if (eb &amp;&amp; !refcount_inc_not_zero(&amp;eb-&gt;refs))</div><div class='add'>+		eb = NULL;</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+	return eb;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		end_page_writeback(page);</div><div class='add'>+static void end_bbio_meta_write(struct btrfs_bio *bbio)</div><div class='add'>+{</div><div class='add'>+	struct extent_buffer *eb = bbio-&gt;private;</div><div class='add'>+	struct folio_iter fi;</div><div class='ctx'> </div><div class='del'>-		if (!done)</div><div class='del'>-			continue;</div><div class='add'>+	if (bbio-&gt;bio.bi_status != BLK_STS_OK)</div><div class='add'>+		set_btree_ioerr(eb);</div><div class='ctx'> </div><div class='del'>-		end_extent_buffer_writeback(eb);</div><div class='add'>+	bio_for_each_folio_all(fi, &amp;bbio-&gt;bio) {</div><div class='add'>+		btrfs_meta_folio_clear_writeback(fi.folio, eb);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	bio_put(bio);</div><div class='add'>+	buffer_tree_clear_mark(eb, PAGECACHE_TAG_WRITEBACK);</div><div class='add'>+	clear_and_wake_up_bit(EXTENT_BUFFER_WRITEBACK, &amp;eb-&gt;bflags);</div><div class='add'>+	bio_put(&amp;bbio-&gt;bio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void prepare_eb_write(struct extent_buffer *eb)</div><div class='hunk'>@@ -4495,342 +2190,131 @@ static void prepare_eb_write(struct extent_buffer *eb)</div><div class='ctx'> 	unsigned long end;</div><div class='ctx'> </div><div class='ctx'> 	clear_bit(EXTENT_BUFFER_WRITE_ERR, &amp;eb-&gt;bflags);</div><div class='del'>-	atomic_set(&amp;eb-&gt;io_pages, num_extent_pages(eb));</div><div class='ctx'> </div><div class='ctx'> 	/* Set btree blocks beyond nritems with 0 to avoid stale content */</div><div class='ctx'> 	nritems = btrfs_header_nritems(eb);</div><div class='ctx'> 	if (btrfs_header_level(eb) &gt; 0) {</div><div class='del'>-		end = btrfs_node_key_ptr_offset(nritems);</div><div class='add'>+		end = btrfs_node_key_ptr_offset(eb, nritems);</div><div class='ctx'> 		memzero_extent_buffer(eb, end, eb-&gt;len - end);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Leaf:</div><div class='ctx'> 		 * header 0 1 2 .. N ... data_N .. data_2 data_1 data_0</div><div class='ctx'> 		 */</div><div class='del'>-		start = btrfs_item_nr_offset(nritems);</div><div class='del'>-		end = BTRFS_LEAF_DATA_OFFSET + leaf_data_end(eb);</div><div class='add'>+		start = btrfs_item_nr_offset(eb, nritems);</div><div class='add'>+		end = btrfs_item_nr_offset(eb, 0);</div><div class='add'>+		if (nritems == 0)</div><div class='add'>+			end += BTRFS_LEAF_DATA_SIZE(eb-&gt;fs_info);</div><div class='add'>+		else</div><div class='add'>+			end += btrfs_item_offset(eb, nritems - 1);</div><div class='ctx'> 		memzero_extent_buffer(eb, start, end - start);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Unlike the work in write_one_eb(), we rely completely on extent locking.</div><div class='del'>- * Page locking is only utilized at minimum to keep the VMM code happy.</div><div class='del'>- */</div><div class='del'>-static int write_one_subpage_eb(struct extent_buffer *eb,</div><div class='del'>-				struct writeback_control *wbc,</div><div class='del'>-				struct extent_page_data *epd)</div><div class='add'>+static noinline_for_stack void write_one_eb(struct extent_buffer *eb,</div><div class='add'>+					    struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='del'>-	struct page *page = eb-&gt;pages[0];</div><div class='del'>-	unsigned int write_flags = wbc_to_write_flags(wbc) | REQ_META;</div><div class='del'>-	bool no_dirty_ebs = false;</div><div class='del'>-	int ret;</div><div class='add'>+	struct btrfs_bio *bbio;</div><div class='ctx'> </div><div class='ctx'> 	prepare_eb_write(eb);</div><div class='ctx'> </div><div class='del'>-	/* clear_page_dirty_for_io() in subpage helper needs page locked */</div><div class='del'>-	lock_page(page);</div><div class='del'>-	btrfs_subpage_set_writeback(fs_info, page, eb-&gt;start, eb-&gt;len);</div><div class='del'>-</div><div class='del'>-	/* Check if this is the last dirty bit to update nr_written */</div><div class='del'>-	no_dirty_ebs = btrfs_subpage_clear_and_test_dirty(fs_info, page,</div><div class='del'>-							  eb-&gt;start, eb-&gt;len);</div><div class='del'>-	if (no_dirty_ebs)</div><div class='del'>-		clear_page_dirty_for_io(page);</div><div class='del'>-</div><div class='del'>-	ret = submit_extent_page(REQ_OP_WRITE | write_flags, wbc,</div><div class='del'>-			&amp;epd-&gt;bio_ctrl, page, eb-&gt;start, eb-&gt;len,</div><div class='del'>-			eb-&gt;start - page_offset(page),</div><div class='del'>-			end_bio_subpage_eb_writepage, 0, 0, false);</div><div class='del'>-	if (ret) {</div><div class='del'>-		btrfs_subpage_clear_writeback(fs_info, page, eb-&gt;start, eb-&gt;len);</div><div class='del'>-		set_btree_ioerr(page, eb);</div><div class='del'>-		unlock_page(page);</div><div class='del'>-</div><div class='del'>-		if (atomic_dec_and_test(&amp;eb-&gt;io_pages))</div><div class='del'>-			end_extent_buffer_writeback(eb);</div><div class='del'>-		return -EIO;</div><div class='add'>+	bbio = btrfs_bio_alloc(INLINE_EXTENT_BUFFER_PAGES,</div><div class='add'>+			       REQ_OP_WRITE | REQ_META | wbc_to_write_flags(wbc),</div><div class='add'>+			       BTRFS_I(fs_info-&gt;btree_inode), eb-&gt;start,</div><div class='add'>+			       end_bbio_meta_write, eb);</div><div class='add'>+	bbio-&gt;bio.bi_iter.bi_sector = eb-&gt;start &gt;&gt; SECTOR_SHIFT;</div><div class='add'>+	bio_set_dev(&amp;bbio-&gt;bio, fs_info-&gt;fs_devices-&gt;latest_dev-&gt;bdev);</div><div class='add'>+	wbc_init_bio(wbc, &amp;bbio-&gt;bio);</div><div class='add'>+	for (int i = 0; i &lt; num_extent_folios(eb); i++) {</div><div class='add'>+		struct folio *folio = eb-&gt;folios[i];</div><div class='add'>+		u64 range_start = max_t(u64, eb-&gt;start, folio_pos(folio));</div><div class='add'>+		u32 range_len = min_t(u64, folio_next_pos(folio),</div><div class='add'>+				      eb-&gt;start + eb-&gt;len) - range_start;</div><div class='add'>+</div><div class='add'>+		folio_lock(folio);</div><div class='add'>+		btrfs_meta_folio_clear_dirty(folio, eb);</div><div class='add'>+		btrfs_meta_folio_set_writeback(folio, eb);</div><div class='add'>+		if (!folio_test_dirty(folio))</div><div class='add'>+			wbc-&gt;nr_to_write -= folio_nr_pages(folio);</div><div class='add'>+		bio_add_folio_nofail(&amp;bbio-&gt;bio, folio, range_len,</div><div class='add'>+				     offset_in_folio(folio, range_start));</div><div class='add'>+		wbc_account_cgroup_owner(wbc, folio, range_len);</div><div class='add'>+		folio_unlock(folio);</div><div class='ctx'> 	}</div><div class='del'>-	unlock_page(page);</div><div class='ctx'> 	/*</div><div class='del'>-	 * Submission finished without problem, if no range of the page is</div><div class='del'>-	 * dirty anymore, we have submitted a page.  Update nr_written in wbc.</div><div class='add'>+	 * If the fs is already in error status, do not submit any writeback</div><div class='add'>+	 * but immediately finish it.</div><div class='ctx'> 	 */</div><div class='del'>-	if (no_dirty_ebs)</div><div class='del'>-		update_nr_written(wbc, 1);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static noinline_for_stack int write_one_eb(struct extent_buffer *eb,</div><div class='del'>-			struct writeback_control *wbc,</div><div class='del'>-			struct extent_page_data *epd)</div><div class='del'>-{</div><div class='del'>-	u64 disk_bytenr = eb-&gt;start;</div><div class='del'>-	int i, num_pages;</div><div class='del'>-	unsigned int write_flags = wbc_to_write_flags(wbc) | REQ_META;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	prepare_eb_write(eb);</div><div class='del'>-</div><div class='del'>-	num_pages = num_extent_pages(eb);</div><div class='del'>-	for (i = 0; i &lt; num_pages; i++) {</div><div class='del'>-		struct page *p = eb-&gt;pages[i];</div><div class='del'>-</div><div class='del'>-		clear_page_dirty_for_io(p);</div><div class='del'>-		set_page_writeback(p);</div><div class='del'>-		ret = submit_extent_page(REQ_OP_WRITE | write_flags, wbc,</div><div class='del'>-					 &amp;epd-&gt;bio_ctrl, p, disk_bytenr,</div><div class='del'>-					 PAGE_SIZE, 0,</div><div class='del'>-					 end_bio_extent_buffer_writepage,</div><div class='del'>-					 0, 0, false);</div><div class='del'>-		if (ret) {</div><div class='del'>-			set_btree_ioerr(p, eb);</div><div class='del'>-			if (PageWriteback(p))</div><div class='del'>-				end_page_writeback(p);</div><div class='del'>-			if (atomic_sub_and_test(num_pages - i, &amp;eb-&gt;io_pages))</div><div class='del'>-				end_extent_buffer_writeback(eb);</div><div class='del'>-			ret = -EIO;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		disk_bytenr += PAGE_SIZE;</div><div class='del'>-		update_nr_written(wbc, 1);</div><div class='del'>-		unlock_page(p);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (unlikely(ret)) {</div><div class='del'>-		for (; i &lt; num_pages; i++) {</div><div class='del'>-			struct page *p = eb-&gt;pages[i];</div><div class='del'>-			clear_page_dirty_for_io(p);</div><div class='del'>-			unlock_page(p);</div><div class='del'>-		}</div><div class='add'>+	if (unlikely(BTRFS_FS_ERROR(fs_info))) {</div><div class='add'>+		btrfs_bio_end_io(bbio, errno_to_blk_status(BTRFS_FS_ERROR(fs_info)));</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='add'>+	btrfs_submit_bbio(bbio, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Submit one subpage btree page.</div><div class='add'>+ * Wait for all eb writeback in the given range to finish.</div><div class='ctx'>  *</div><div class='del'>- * The main difference to submit_eb_page() is:</div><div class='del'>- * - Page locking</div><div class='del'>- *   For subpage, we don't rely on page locking at all.</div><div class='del'>- *</div><div class='del'>- * - Flush write bio</div><div class='del'>- *   We only flush bio if we may be unable to fit current extent buffers into</div><div class='del'>- *   current bio.</div><div class='del'>- *</div><div class='del'>- * Return &gt;=0 for the number of submitted extent buffers.</div><div class='del'>- * Return &lt;0 for fatal error.</div><div class='add'>+ * @fs_info:	The fs_info for this file system.</div><div class='add'>+ * @start:	The offset of the range to start waiting on writeback.</div><div class='add'>+ * @end:	The end of the range, inclusive. This is meant to be used in</div><div class='add'>+ *		conjunction with wait_marked_extents, so this will usually be</div><div class='add'>+ *		the_next_eb-&gt;start - 1.</div><div class='ctx'>  */</div><div class='del'>-static int submit_eb_subpage(struct page *page,</div><div class='del'>-			     struct writeback_control *wbc,</div><div class='del'>-			     struct extent_page_data *epd)</div><div class='add'>+void btrfs_btree_wait_writeback_range(struct btrfs_fs_info *fs_info, u64 start,</div><div class='add'>+				      u64 end)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(page-&gt;mapping-&gt;host-&gt;i_sb);</div><div class='del'>-	int submitted = 0;</div><div class='del'>-	u64 page_start = page_offset(page);</div><div class='del'>-	int bit_start = 0;</div><div class='del'>-	int sectors_per_node = fs_info-&gt;nodesize &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='del'>-	int ret;</div><div class='add'>+	struct eb_batch batch;</div><div class='add'>+	unsigned long start_index = (start &gt;&gt; fs_info-&gt;nodesize_bits);</div><div class='add'>+	unsigned long end_index = (end &gt;&gt; fs_info-&gt;nodesize_bits);</div><div class='ctx'> </div><div class='del'>-	/* Lock and write each dirty extent buffers in the range */</div><div class='del'>-	while (bit_start &lt; fs_info-&gt;subpage_info-&gt;bitmap_nr_bits) {</div><div class='del'>-		struct btrfs_subpage *subpage = (struct btrfs_subpage *)page-&gt;private;</div><div class='add'>+	eb_batch_init(&amp;batch);</div><div class='add'>+	while (start_index &lt;= end_index) {</div><div class='ctx'> 		struct extent_buffer *eb;</div><div class='del'>-		unsigned long flags;</div><div class='del'>-		u64 start;</div><div class='add'>+		unsigned int nr_ebs;</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * Take private lock to ensure the subpage won't be detached</div><div class='del'>-		 * in the meantime.</div><div class='del'>-		 */</div><div class='del'>-		spin_lock(&amp;page-&gt;mapping-&gt;private_lock);</div><div class='del'>-		if (!PagePrivate(page)) {</div><div class='del'>-			spin_unlock(&amp;page-&gt;mapping-&gt;private_lock);</div><div class='add'>+		nr_ebs = buffer_tree_get_ebs_tag(fs_info, &amp;start_index, end_index,</div><div class='add'>+						 PAGECACHE_TAG_WRITEBACK, &amp;batch);</div><div class='add'>+		if (!nr_ebs)</div><div class='ctx'> 			break;</div><div class='del'>-		}</div><div class='del'>-		spin_lock_irqsave(&amp;subpage-&gt;lock, flags);</div><div class='del'>-		if (!test_bit(bit_start + fs_info-&gt;subpage_info-&gt;dirty_offset,</div><div class='del'>-			      subpage-&gt;bitmaps)) {</div><div class='del'>-			spin_unlock_irqrestore(&amp;subpage-&gt;lock, flags);</div><div class='del'>-			spin_unlock(&amp;page-&gt;mapping-&gt;private_lock);</div><div class='del'>-			bit_start++;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		start = page_start + bit_start * fs_info-&gt;sectorsize;</div><div class='del'>-		bit_start += sectors_per_node;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Here we just want to grab the eb without touching extra</div><div class='del'>-		 * spin locks, so call find_extent_buffer_nolock().</div><div class='del'>-		 */</div><div class='del'>-		eb = find_extent_buffer_nolock(fs_info, start);</div><div class='del'>-		spin_unlock_irqrestore(&amp;subpage-&gt;lock, flags);</div><div class='del'>-		spin_unlock(&amp;page-&gt;mapping-&gt;private_lock);</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * The eb has already reached 0 refs thus find_extent_buffer()</div><div class='del'>-		 * doesn't return it. We don't need to write back such eb</div><div class='del'>-		 * anyway.</div><div class='del'>-		 */</div><div class='del'>-		if (!eb)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		ret = lock_extent_buffer_for_io(eb, epd);</div><div class='del'>-		if (ret == 0) {</div><div class='del'>-			free_extent_buffer(eb);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			free_extent_buffer(eb);</div><div class='del'>-			goto cleanup;</div><div class='del'>-		}</div><div class='del'>-		ret = write_one_subpage_eb(eb, wbc, epd);</div><div class='del'>-		free_extent_buffer(eb);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			goto cleanup;</div><div class='del'>-		submitted++;</div><div class='del'>-	}</div><div class='del'>-	return submitted;</div><div class='del'>-</div><div class='del'>-cleanup:</div><div class='del'>-	/* We hit error, end bio for the submitted extent buffers */</div><div class='del'>-	end_write_bio(epd, ret);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Submit all page(s) of one extent buffer.</div><div class='del'>- *</div><div class='del'>- * @page:	the page of one extent buffer</div><div class='del'>- * @eb_context:	to determine if we need to submit this page, if current page</div><div class='del'>- *		belongs to this eb, we don't need to submit</div><div class='del'>- *</div><div class='del'>- * The caller should pass each page in their bytenr order, and here we use</div><div class='del'>- * @eb_context to determine if we have submitted pages of one extent buffer.</div><div class='del'>- *</div><div class='del'>- * If we have, we just skip until we hit a new page that doesn't belong to</div><div class='del'>- * current @eb_context.</div><div class='del'>- *</div><div class='del'>- * If not, we submit all the page(s) of the extent buffer.</div><div class='del'>- *</div><div class='del'>- * Return &gt;0 if we have submitted the extent buffer successfully.</div><div class='del'>- * Return 0 if we don't need to submit the page, as it's already submitted by</div><div class='del'>- * previous call.</div><div class='del'>- * Return &lt;0 for fatal error.</div><div class='del'>- */</div><div class='del'>-static int submit_eb_page(struct page *page, struct writeback_control *wbc,</div><div class='del'>-			  struct extent_page_data *epd,</div><div class='del'>-			  struct extent_buffer **eb_context)</div><div class='del'>-{</div><div class='del'>-	struct address_space *mapping = page-&gt;mapping;</div><div class='del'>-	struct btrfs_block_group *cache = NULL;</div><div class='del'>-	struct extent_buffer *eb;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (!PagePrivate(page))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	if (btrfs_sb(page-&gt;mapping-&gt;host-&gt;i_sb)-&gt;sectorsize &lt; PAGE_SIZE)</div><div class='del'>-		return submit_eb_subpage(page, wbc, epd);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;mapping-&gt;private_lock);</div><div class='del'>-	if (!PagePrivate(page)) {</div><div class='del'>-		spin_unlock(&amp;mapping-&gt;private_lock);</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	eb = (struct extent_buffer *)page-&gt;private;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Shouldn't happen and normally this would be a BUG_ON but no point</div><div class='del'>-	 * crashing the machine for something we can survive anyway.</div><div class='del'>-	 */</div><div class='del'>-	if (WARN_ON(!eb)) {</div><div class='del'>-		spin_unlock(&amp;mapping-&gt;private_lock);</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (eb == *eb_context) {</div><div class='del'>-		spin_unlock(&amp;mapping-&gt;private_lock);</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-	ret = atomic_inc_not_zero(&amp;eb-&gt;refs);</div><div class='del'>-	spin_unlock(&amp;mapping-&gt;private_lock);</div><div class='del'>-	if (!ret)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	if (!btrfs_check_meta_write_pointer(eb-&gt;fs_info, eb, &amp;cache)) {</div><div class='del'>-		/*</div><div class='del'>-		 * If for_sync, this hole will be filled with</div><div class='del'>-		 * trasnsaction commit.</div><div class='del'>-		 */</div><div class='del'>-		if (wbc-&gt;sync_mode == WB_SYNC_ALL &amp;&amp; !wbc-&gt;for_sync)</div><div class='del'>-			ret = -EAGAIN;</div><div class='del'>-		else</div><div class='del'>-			ret = 0;</div><div class='del'>-		free_extent_buffer(eb);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	*eb_context = eb;</div><div class='del'>-</div><div class='del'>-	ret = lock_extent_buffer_for_io(eb, epd);</div><div class='del'>-	if (ret &lt;= 0) {</div><div class='del'>-		btrfs_revert_meta_write_pointer(cache, eb);</div><div class='del'>-		if (cache)</div><div class='del'>-			btrfs_put_block_group(cache);</div><div class='del'>-		free_extent_buffer(eb);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-	if (cache) {</div><div class='del'>-		/* Impiles write in zoned mode */</div><div class='del'>-		btrfs_put_block_group(cache);</div><div class='del'>-		/* Mark the last eb in a block group */</div><div class='del'>-		if (cache-&gt;seq_zone &amp;&amp; eb-&gt;start + eb-&gt;len == cache-&gt;zone_capacity)</div><div class='del'>-			set_bit(EXTENT_BUFFER_ZONE_FINISH, &amp;eb-&gt;bflags);</div><div class='add'>+		while ((eb = eb_batch_next(&amp;batch)) != NULL)</div><div class='add'>+			wait_on_extent_buffer_writeback(eb);</div><div class='add'>+		eb_batch_release(&amp;batch);</div><div class='add'>+		cond_resched();</div><div class='ctx'> 	}</div><div class='del'>-	ret = write_one_eb(eb, wbc, epd);</div><div class='del'>-	free_extent_buffer(eb);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		return ret;</div><div class='del'>-	return 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btree_write_cache_pages(struct address_space *mapping,</div><div class='ctx'> 				   struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='del'>-	struct extent_buffer *eb_context = NULL;</div><div class='del'>-	struct extent_page_data epd = {</div><div class='del'>-		.bio_ctrl = { 0 },</div><div class='del'>-		.extent_locked = 0,</div><div class='del'>-		.sync_io = wbc-&gt;sync_mode == WB_SYNC_ALL,</div><div class='del'>-	};</div><div class='del'>-	struct btrfs_fs_info *fs_info = BTRFS_I(mapping-&gt;host)-&gt;root-&gt;fs_info;</div><div class='add'>+	struct btrfs_eb_write_context ctx = { .wbc = wbc };</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(mapping-&gt;host);</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int done = 0;</div><div class='ctx'> 	int nr_to_write_done = 0;</div><div class='del'>-	struct pagevec pvec;</div><div class='del'>-	int nr_pages;</div><div class='del'>-	pgoff_t index;</div><div class='del'>-	pgoff_t end;		/* Inclusive */</div><div class='add'>+	struct eb_batch batch;</div><div class='add'>+	unsigned int nr_ebs;</div><div class='add'>+	unsigned long index;</div><div class='add'>+	unsigned long end;</div><div class='ctx'> 	int scanned = 0;</div><div class='ctx'> 	xa_mark_t tag;</div><div class='ctx'> </div><div class='del'>-	pagevec_init(&amp;pvec);</div><div class='add'>+	eb_batch_init(&amp;batch);</div><div class='ctx'> 	if (wbc-&gt;range_cyclic) {</div><div class='del'>-		index = mapping-&gt;writeback_index; /* Start from prev offset */</div><div class='add'>+		index = ((mapping-&gt;writeback_index &lt;&lt; PAGE_SHIFT) &gt;&gt; fs_info-&gt;nodesize_bits);</div><div class='ctx'> 		end = -1;</div><div class='add'>+</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Start from the beginning does not need to cycle over the</div><div class='ctx'> 		 * range, mark it as scanned.</div><div class='ctx'> 		 */</div><div class='ctx'> 		scanned = (index == 0);</div><div class='ctx'> 	} else {</div><div class='del'>-		index = wbc-&gt;range_start &gt;&gt; PAGE_SHIFT;</div><div class='del'>-		end = wbc-&gt;range_end &gt;&gt; PAGE_SHIFT;</div><div class='add'>+		index = (wbc-&gt;range_start &gt;&gt; fs_info-&gt;nodesize_bits);</div><div class='add'>+		end = (wbc-&gt;range_end &gt;&gt; fs_info-&gt;nodesize_bits);</div><div class='add'>+</div><div class='ctx'> 		scanned = 1;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (wbc-&gt;sync_mode == WB_SYNC_ALL)</div><div class='hunk'>@@ -4840,31 +2324,39 @@ int btree_write_cache_pages(struct address_space *mapping,</div><div class='ctx'> 	btrfs_zoned_meta_io_lock(fs_info);</div><div class='ctx'> retry:</div><div class='ctx'> 	if (wbc-&gt;sync_mode == WB_SYNC_ALL)</div><div class='del'>-		tag_pages_for_writeback(mapping, index, end);</div><div class='add'>+		buffer_tree_tag_for_writeback(fs_info, index, end);</div><div class='ctx'> 	while (!done &amp;&amp; !nr_to_write_done &amp;&amp; (index &lt;= end) &amp;&amp;</div><div class='del'>-	       (nr_pages = pagevec_lookup_range_tag(&amp;pvec, mapping, &amp;index, end,</div><div class='del'>-			tag))) {</div><div class='del'>-		unsigned i;</div><div class='add'>+	       (nr_ebs = buffer_tree_get_ebs_tag(fs_info, &amp;index, end, tag, &amp;batch))) {</div><div class='add'>+		struct extent_buffer *eb;</div><div class='add'>+</div><div class='add'>+		while ((eb = eb_batch_next(&amp;batch)) != NULL) {</div><div class='add'>+			ctx.eb = eb;</div><div class='ctx'> </div><div class='del'>-		for (i = 0; i &lt; nr_pages; i++) {</div><div class='del'>-			struct page *page = pvec.pages[i];</div><div class='add'>+			ret = btrfs_check_meta_write_pointer(eb-&gt;fs_info, &amp;ctx);</div><div class='add'>+			if (ret) {</div><div class='add'>+				if (ret == -EBUSY)</div><div class='add'>+					ret = 0;</div><div class='ctx'> </div><div class='del'>-			ret = submit_eb_page(page, wbc, &amp;epd, &amp;eb_context);</div><div class='del'>-			if (ret == 0)</div><div class='add'>+				if (ret) {</div><div class='add'>+					done = 1;</div><div class='add'>+					break;</div><div class='add'>+				}</div><div class='ctx'> 				continue;</div><div class='del'>-			if (ret &lt; 0) {</div><div class='del'>-				done = 1;</div><div class='del'>-				break;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			/*</div><div class='del'>-			 * the filesystem may choose to bump up nr_to_write.</div><div class='del'>-			 * We have to make sure to honor the new nr_to_write</div><div class='del'>-			 * at any time</div><div class='del'>-			 */</div><div class='del'>-			nr_to_write_done = wbc-&gt;nr_to_write &lt;= 0;</div><div class='add'>+			if (!lock_extent_buffer_for_io(eb, wbc))</div><div class='add'>+				continue;</div><div class='add'>+</div><div class='add'>+			/* Implies write in zoned mode. */</div><div class='add'>+			if (ctx.zoned_bg) {</div><div class='add'>+				/* Mark the last eb in the block group. */</div><div class='add'>+				btrfs_schedule_zone_finish_bg(ctx.zoned_bg, eb);</div><div class='add'>+				ctx.zoned_bg-&gt;meta_write_pointer += eb-&gt;len;</div><div class='add'>+			}</div><div class='add'>+			write_one_eb(eb, wbc);</div><div class='ctx'> 		}</div><div class='del'>-		pagevec_release(&amp;pvec);</div><div class='add'>+		nr_to_write_done = (wbc-&gt;nr_to_write &lt;= 0);</div><div class='add'>+		eb_batch_release(&amp;batch);</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!scanned &amp;&amp; !done) {</div><div class='hunk'>@@ -4876,10 +2368,6 @@ retry:</div><div class='ctx'> 		index = 0;</div><div class='ctx'> 		goto retry;</div><div class='ctx'> 	}</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		end_write_bio(&amp;epd, ret);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If something went wrong, don't allow any metadata write bio to be</div><div class='ctx'> 	 * submitted.</div><div class='hunk'>@@ -4906,24 +2394,27 @@ retry:</div><div class='ctx'> 	 *   Now such dirty tree block will not be cleaned by any dirty</div><div class='ctx'> 	 *   extent io tree. Thus we don't want to submit such wild eb</div><div class='ctx'> 	 *   if the fs already has error.</div><div class='add'>+	 *</div><div class='add'>+	 * We can get ret &gt; 0 from submit_extent_folio() indicating how many ebs</div><div class='add'>+	 * were submitted. Reset it to 0 to avoid false alerts for the caller.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!BTRFS_FS_ERROR(fs_info)) {</div><div class='del'>-		ret = flush_write_bio(&amp;epd);</div><div class='del'>-	} else {</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		ret = 0;</div><div class='add'>+	if (!ret &amp;&amp; BTRFS_FS_ERROR(fs_info))</div><div class='ctx'> 		ret = -EROFS;</div><div class='del'>-		end_write_bio(&amp;epd, ret);</div><div class='del'>-	}</div><div class='del'>-out:</div><div class='add'>+</div><div class='add'>+	if (ctx.zoned_bg)</div><div class='add'>+		btrfs_put_block_group(ctx.zoned_bg);</div><div class='ctx'> 	btrfs_zoned_meta_io_unlock(fs_info);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='add'>+/*</div><div class='ctx'>  * Walk the list of dirty pages of the given address space and write all of them.</div><div class='ctx'>  *</div><div class='del'>- * @mapping: address space structure to write</div><div class='del'>- * @wbc:     subtract the number of written pages from *@wbc-&gt;nr_to_write</div><div class='del'>- * @epd:     holds context for the write, namely the bio</div><div class='add'>+ * @mapping:   address space structure to write</div><div class='add'>+ * @wbc:       subtract the number of written pages from *@wbc-&gt;nr_to_write</div><div class='add'>+ * @bio_ctrl:  holds context for the write, namely the bio</div><div class='ctx'>  *</div><div class='ctx'>  * If a page is already under I/O, write_cache_pages() skips it, even</div><div class='ctx'>  * if it's dirty.  This is desirable behaviour for memory-cleaning writeback,</div><div class='hunk'>@@ -4934,15 +2425,15 @@ out:</div><div class='ctx'>  * existing IO to complete.</div><div class='ctx'>  */</div><div class='ctx'> static int extent_write_cache_pages(struct address_space *mapping,</div><div class='del'>-			     struct writeback_control *wbc,</div><div class='del'>-			     struct extent_page_data *epd)</div><div class='add'>+			     struct btrfs_bio_ctrl *bio_ctrl)</div><div class='ctx'> {</div><div class='add'>+	struct writeback_control *wbc = bio_ctrl-&gt;wbc;</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int done = 0;</div><div class='ctx'> 	int nr_to_write_done = 0;</div><div class='del'>-	struct pagevec pvec;</div><div class='del'>-	int nr_pages;</div><div class='add'>+	struct folio_batch fbatch;</div><div class='add'>+	unsigned int nr_folios;</div><div class='ctx'> 	pgoff_t index;</div><div class='ctx'> 	pgoff_t end;		/* Inclusive */</div><div class='ctx'> 	pgoff_t done_index;</div><div class='hunk'>@@ -4962,7 +2453,7 @@ static int extent_write_cache_pages(struct address_space *mapping,</div><div class='ctx'> 	if (!igrab(inode))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	pagevec_init(&amp;pvec);</div><div class='add'>+	folio_batch_init(&amp;fbatch);</div><div class='ctx'> 	if (wbc-&gt;range_cyclic) {</div><div class='ctx'> 		index = mapping-&gt;writeback_index; /* Start from prev offset */</div><div class='ctx'> 		end = -1;</div><div class='hunk'>@@ -4991,69 +2482,88 @@ static int extent_write_cache_pages(struct address_space *mapping,</div><div class='ctx'> 			       &amp;BTRFS_I(inode)-&gt;runtime_flags))</div><div class='ctx'> 		wbc-&gt;tagged_writepages = 1;</div><div class='ctx'> </div><div class='del'>-	if (wbc-&gt;sync_mode == WB_SYNC_ALL || wbc-&gt;tagged_writepages)</div><div class='del'>-		tag = PAGECACHE_TAG_TOWRITE;</div><div class='del'>-	else</div><div class='del'>-		tag = PAGECACHE_TAG_DIRTY;</div><div class='add'>+	tag = wbc_to_tag(wbc);</div><div class='ctx'> retry:</div><div class='ctx'> 	if (wbc-&gt;sync_mode == WB_SYNC_ALL || wbc-&gt;tagged_writepages)</div><div class='ctx'> 		tag_pages_for_writeback(mapping, index, end);</div><div class='ctx'> 	done_index = index;</div><div class='ctx'> 	while (!done &amp;&amp; !nr_to_write_done &amp;&amp; (index &lt;= end) &amp;&amp;</div><div class='del'>-			(nr_pages = pagevec_lookup_range_tag(&amp;pvec, mapping,</div><div class='del'>-						&amp;index, end, tag))) {</div><div class='add'>+			(nr_folios = filemap_get_folios_tag(mapping, &amp;index,</div><div class='add'>+							end, tag, &amp;fbatch))) {</div><div class='ctx'> 		unsigned i;</div><div class='ctx'> </div><div class='del'>-		for (i = 0; i &lt; nr_pages; i++) {</div><div class='del'>-			struct page *page = pvec.pages[i];</div><div class='add'>+		for (i = 0; i &lt; nr_folios; i++) {</div><div class='add'>+			struct folio *folio = fbatch.folios[i];</div><div class='ctx'> </div><div class='del'>-			done_index = page-&gt;index + 1;</div><div class='add'>+			done_index = folio_next_index(folio);</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * At this point we hold neither the i_pages lock nor</div><div class='del'>-			 * the page lock: the page may be truncated or</div><div class='del'>-			 * invalidated (changing page-&gt;mapping to NULL),</div><div class='del'>-			 * or even swizzled back from swapper_space to</div><div class='del'>-			 * tmpfs file mapping</div><div class='add'>+			 * the folio lock: the folio may be truncated or</div><div class='add'>+			 * invalidated (changing folio-&gt;mapping to NULL).</div><div class='ctx'> 			 */</div><div class='del'>-			if (!trylock_page(page)) {</div><div class='del'>-				ret = flush_write_bio(epd);</div><div class='del'>-				BUG_ON(ret &lt; 0);</div><div class='del'>-				lock_page(page);</div><div class='add'>+			if (!folio_trylock(folio)) {</div><div class='add'>+				submit_write_bio(bio_ctrl, 0);</div><div class='add'>+				folio_lock(folio);</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			if (unlikely(page-&gt;mapping != mapping)) {</div><div class='del'>-				unlock_page(page);</div><div class='add'>+			if (unlikely(folio-&gt;mapping != mapping)) {</div><div class='add'>+				folio_unlock(folio);</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			if (wbc-&gt;sync_mode != WB_SYNC_NONE) {</div><div class='del'>-				if (PageWriteback(page)) {</div><div class='del'>-					ret = flush_write_bio(epd);</div><div class='del'>-					BUG_ON(ret &lt; 0);</div><div class='del'>-				}</div><div class='del'>-				wait_on_page_writeback(page);</div><div class='add'>+			if (!folio_test_dirty(folio)) {</div><div class='add'>+				/* Someone wrote it for us. */</div><div class='add'>+				folio_unlock(folio);</div><div class='add'>+				continue;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			if (PageWriteback(page) ||</div><div class='del'>-			    !clear_page_dirty_for_io(page)) {</div><div class='del'>-				unlock_page(page);</div><div class='add'>+			/*</div><div class='add'>+			 * For subpage case, compression can lead to mixed</div><div class='add'>+			 * writeback and dirty flags, e.g:</div><div class='add'>+			 * 0     32K    64K    96K    128K</div><div class='add'>+			 * |     |//////||/////|   |//|</div><div class='add'>+			 *</div><div class='add'>+			 * In above case, [32K, 96K) is asynchronously submitted</div><div class='add'>+			 * for compression, and [124K, 128K) needs to be written back.</div><div class='add'>+			 *</div><div class='add'>+			 * If we didn't wait writeback for page 64K, [128K, 128K)</div><div class='add'>+			 * won't be submitted as the page still has writeback flag</div><div class='add'>+			 * and will be skipped in the next check.</div><div class='add'>+			 *</div><div class='add'>+			 * This mixed writeback and dirty case is only possible for</div><div class='add'>+			 * subpage case.</div><div class='add'>+			 *</div><div class='add'>+			 * TODO: Remove this check after migrating compression to</div><div class='add'>+			 * regular submission.</div><div class='add'>+			 */</div><div class='add'>+			if (wbc-&gt;sync_mode != WB_SYNC_NONE ||</div><div class='add'>+			    btrfs_is_subpage(inode_to_fs_info(inode), folio)) {</div><div class='add'>+				if (folio_test_writeback(folio))</div><div class='add'>+					submit_write_bio(bio_ctrl, 0);</div><div class='add'>+				folio_wait_writeback(folio);</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			if (folio_test_writeback(folio) ||</div><div class='add'>+			    !folio_clear_dirty_for_io(folio)) {</div><div class='add'>+				folio_unlock(folio);</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			ret = __extent_writepage(page, wbc, epd);</div><div class='add'>+			ret = extent_writepage(folio, bio_ctrl);</div><div class='ctx'> 			if (ret &lt; 0) {</div><div class='ctx'> 				done = 1;</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			/*</div><div class='del'>-			 * the filesystem may choose to bump up nr_to_write.</div><div class='add'>+			 * The filesystem may choose to bump up nr_to_write.</div><div class='ctx'> 			 * We have to make sure to honor the new nr_to_write</div><div class='del'>-			 * at any time</div><div class='add'>+			 * at any time.</div><div class='ctx'> 			 */</div><div class='del'>-			nr_to_write_done = wbc-&gt;nr_to_write &lt;= 0;</div><div class='add'>+			nr_to_write_done = (wbc-&gt;sync_mode == WB_SYNC_NONE &amp;&amp;</div><div class='add'>+					    wbc-&gt;nr_to_write &lt;= 0);</div><div class='ctx'> 		}</div><div class='del'>-		pagevec_release(&amp;pvec);</div><div class='add'>+		folio_batch_release(&amp;fbatch);</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!scanned &amp;&amp; !done) {</div><div class='hunk'>@@ -5070,36 +2580,14 @@ retry:</div><div class='ctx'> 		 * page in our current bio, and thus deadlock, so flush the</div><div class='ctx'> 		 * write bio here.</div><div class='ctx'> 		 */</div><div class='del'>-		ret = flush_write_bio(epd);</div><div class='del'>-		if (!ret)</div><div class='del'>-			goto retry;</div><div class='add'>+		submit_write_bio(bio_ctrl, 0);</div><div class='add'>+		goto retry;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (wbc-&gt;range_cyclic || (wbc-&gt;nr_to_write &gt; 0 &amp;&amp; range_whole))</div><div class='ctx'> 		mapping-&gt;writeback_index = done_index;</div><div class='ctx'> </div><div class='del'>-	btrfs_add_delayed_iput(inode);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int extent_write_full_page(struct page *page, struct writeback_control *wbc)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-	struct extent_page_data epd = {</div><div class='del'>-		.bio_ctrl = { 0 },</div><div class='del'>-		.extent_locked = 0,</div><div class='del'>-		.sync_io = wbc-&gt;sync_mode == WB_SYNC_ALL,</div><div class='del'>-	};</div><div class='del'>-</div><div class='del'>-	ret = __extent_writepage(page, wbc, &amp;epd);</div><div class='del'>-	ASSERT(ret &lt;= 0);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		end_write_bio(&amp;epd, ret);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = flush_write_bio(&amp;epd);</div><div class='del'>-	ASSERT(ret &lt;= 0);</div><div class='add'>+	btrfs_add_delayed_iput(BTRFS_I(inode));</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5108,137 +2596,136 @@ int extent_write_full_page(struct page *page, struct writeback_control *wbc)</div><div class='ctx'>  * already been ran (aka, ordered extent inserted) and all pages are still</div><div class='ctx'>  * locked.</div><div class='ctx'>  */</div><div class='del'>-int extent_write_locked_range(struct inode *inode, u64 start, u64 end)</div><div class='add'>+void extent_write_locked_range(struct inode *inode, const struct folio *locked_folio,</div><div class='add'>+			       u64 start, u64 end, struct writeback_control *wbc,</div><div class='add'>+			       bool pages_dirty)</div><div class='ctx'> {</div><div class='ctx'> 	bool found_error = false;</div><div class='del'>-	int first_error = 0;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='add'>+	const u32 sectorsize = fs_info-&gt;sectorsize;</div><div class='add'>+	loff_t i_size = i_size_read(inode);</div><div class='ctx'> 	u64 cur = start;</div><div class='del'>-	unsigned long nr_pages;</div><div class='del'>-	const u32 sectorsize = btrfs_sb(inode-&gt;i_sb)-&gt;sectorsize;</div><div class='del'>-	struct extent_page_data epd = {</div><div class='del'>-		.bio_ctrl = { 0 },</div><div class='del'>-		.extent_locked = 1,</div><div class='del'>-		.sync_io = 1,</div><div class='del'>-	};</div><div class='del'>-	struct writeback_control wbc_writepages = {</div><div class='del'>-		.sync_mode	= WB_SYNC_ALL,</div><div class='del'>-		.range_start	= start,</div><div class='del'>-		.range_end	= end + 1,</div><div class='del'>-		/* We're called from an async helper function */</div><div class='del'>-		.punt_to_cgroup	= 1,</div><div class='del'>-		.no_cgroup_owner = 1,</div><div class='add'>+	struct btrfs_bio_ctrl bio_ctrl = {</div><div class='add'>+		.wbc = wbc,</div><div class='add'>+		.opf = REQ_OP_WRITE | wbc_to_write_flags(wbc),</div><div class='ctx'> 	};</div><div class='ctx'> </div><div class='add'>+	if (wbc-&gt;no_cgroup_owner)</div><div class='add'>+		bio_ctrl.opf |= REQ_BTRFS_CGROUP_PUNT;</div><div class='add'>+</div><div class='ctx'> 	ASSERT(IS_ALIGNED(start, sectorsize) &amp;&amp; IS_ALIGNED(end + 1, sectorsize));</div><div class='del'>-	nr_pages = (round_up(end, PAGE_SIZE) - round_down(start, PAGE_SIZE)) &gt;&gt;</div><div class='del'>-		   PAGE_SHIFT;</div><div class='del'>-	wbc_writepages.nr_to_write = nr_pages * 2;</div><div class='ctx'> </div><div class='del'>-	wbc_attach_fdatawrite_inode(&amp;wbc_writepages, inode);</div><div class='ctx'> 	while (cur &lt;= end) {</div><div class='del'>-		u64 cur_end = min(round_down(cur, PAGE_SIZE) + PAGE_SIZE - 1, end);</div><div class='add'>+		u64 cur_end;</div><div class='add'>+		u32 cur_len;</div><div class='add'>+		struct folio *folio;</div><div class='add'>+</div><div class='add'>+		folio = filemap_get_folio(mapping, cur &gt;&gt; PAGE_SHIFT);</div><div class='ctx'> </div><div class='del'>-		page = find_get_page(mapping, cur &gt;&gt; PAGE_SHIFT);</div><div class='ctx'> 		/*</div><div class='del'>-		 * All pages in the range are locked since</div><div class='del'>-		 * btrfs_run_delalloc_range(), thus there is no way to clear</div><div class='del'>-		 * the page dirty flag.</div><div class='add'>+		 * This shouldn't happen, the pages are pinned and locked, this</div><div class='add'>+		 * code is just in case, but shouldn't actually be run.</div><div class='ctx'> 		 */</div><div class='del'>-		ASSERT(PageLocked(page));</div><div class='del'>-		ASSERT(PageDirty(page));</div><div class='del'>-		clear_page_dirty_for_io(page);</div><div class='del'>-		ret = __extent_writepage(page, &amp;wbc_writepages, &amp;epd);</div><div class='del'>-		ASSERT(ret &lt;= 0);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			found_error = true;</div><div class='del'>-			first_error = ret;</div><div class='add'>+		if (IS_ERR(folio)) {</div><div class='add'>+			cur_end = min(round_down(cur, PAGE_SIZE) + PAGE_SIZE - 1, end);</div><div class='add'>+			cur_len = cur_end + 1 - cur;</div><div class='add'>+			btrfs_mark_ordered_io_finished(BTRFS_I(inode), NULL,</div><div class='add'>+						       cur, cur_len, false);</div><div class='add'>+			mapping_set_error(mapping, PTR_ERR(folio));</div><div class='add'>+			cur = cur_end;</div><div class='add'>+			continue;</div><div class='ctx'> 		}</div><div class='del'>-		put_page(page);</div><div class='add'>+</div><div class='add'>+		cur_end = min_t(u64, folio_next_pos(folio) - 1, end);</div><div class='add'>+		cur_len = cur_end + 1 - cur;</div><div class='add'>+</div><div class='add'>+		ASSERT(folio_test_locked(folio));</div><div class='add'>+		if (pages_dirty &amp;&amp; folio != locked_folio)</div><div class='add'>+			ASSERT(folio_test_dirty(folio));</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Set the submission bitmap to submit all sectors.</div><div class='add'>+		 * extent_writepage_io() will do the truncation correctly.</div><div class='add'>+		 */</div><div class='add'>+		bio_ctrl.submit_bitmap = (unsigned long)-1;</div><div class='add'>+		ret = extent_writepage_io(BTRFS_I(inode), folio, cur, cur_len,</div><div class='add'>+					  &amp;bio_ctrl, i_size);</div><div class='add'>+		if (ret == 1)</div><div class='add'>+			goto next_page;</div><div class='add'>+</div><div class='add'>+		if (ret)</div><div class='add'>+			mapping_set_error(mapping, ret);</div><div class='add'>+		btrfs_folio_end_lock(fs_info, folio, cur, cur_len);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			found_error = true;</div><div class='add'>+next_page:</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 		cur = cur_end + 1;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!found_error)</div><div class='del'>-		ret = flush_write_bio(&amp;epd);</div><div class='del'>-	else</div><div class='del'>-		end_write_bio(&amp;epd, ret);</div><div class='del'>-</div><div class='del'>-	wbc_detach_inode(&amp;wbc_writepages);</div><div class='del'>-	if (found_error)</div><div class='del'>-		return first_error;</div><div class='del'>-	return ret;</div><div class='add'>+	submit_write_bio(&amp;bio_ctrl, found_error ? ret : 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int extent_writepages(struct address_space *mapping,</div><div class='del'>-		      struct writeback_control *wbc)</div><div class='add'>+int btrfs_writepages(struct address_space *mapping, struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='del'>-	const bool data_reloc = btrfs_is_data_reloc_root(BTRFS_I(inode)-&gt;root);</div><div class='del'>-	const bool zoned = btrfs_is_zoned(BTRFS_I(inode)-&gt;root-&gt;fs_info);</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	struct extent_page_data epd = {</div><div class='del'>-		.bio_ctrl = { 0 },</div><div class='del'>-		.extent_locked = 0,</div><div class='del'>-		.sync_io = wbc-&gt;sync_mode == WB_SYNC_ALL,</div><div class='add'>+	struct btrfs_bio_ctrl bio_ctrl = {</div><div class='add'>+		.wbc = wbc,</div><div class='add'>+		.opf = REQ_OP_WRITE | wbc_to_write_flags(wbc),</div><div class='ctx'> 	};</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Allow only a single thread to do the reloc work in zoned mode to</div><div class='ctx'> 	 * protect the write pointer updates.</div><div class='ctx'> 	 */</div><div class='del'>-	if (data_reloc &amp;&amp; zoned)</div><div class='del'>-		btrfs_inode_lock(inode, 0);</div><div class='del'>-	ret = extent_write_cache_pages(mapping, wbc, &amp;epd);</div><div class='del'>-	if (data_reloc &amp;&amp; zoned)</div><div class='del'>-		btrfs_inode_unlock(inode, 0);</div><div class='del'>-	ASSERT(ret &lt;= 0);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		end_write_bio(&amp;epd, ret);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-	ret = flush_write_bio(&amp;epd);</div><div class='add'>+	btrfs_zoned_data_reloc_lock(BTRFS_I(inode));</div><div class='add'>+	ret = extent_write_cache_pages(mapping, &amp;bio_ctrl);</div><div class='add'>+	submit_write_bio(&amp;bio_ctrl, ret);</div><div class='add'>+	btrfs_zoned_data_reloc_unlock(BTRFS_I(inode));</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void extent_readahead(struct readahead_control *rac)</div><div class='add'>+void btrfs_readahead(struct readahead_control *rac)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_bio_ctrl bio_ctrl = { 0 };</div><div class='del'>-	struct page *pagepool[16];</div><div class='add'>+	struct btrfs_bio_ctrl bio_ctrl = {</div><div class='add'>+		.opf = REQ_OP_READ | REQ_RAHEAD,</div><div class='add'>+		.ractl = rac,</div><div class='add'>+		.last_em_start = U64_MAX,</div><div class='add'>+	};</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	struct btrfs_inode *inode = BTRFS_I(rac-&gt;mapping-&gt;host);</div><div class='add'>+	const u64 start = readahead_pos(rac);</div><div class='add'>+	const u64 end = start + readahead_length(rac) - 1;</div><div class='add'>+	struct extent_state *cached_state = NULL;</div><div class='ctx'> 	struct extent_map *em_cached = NULL;</div><div class='del'>-	u64 prev_em_start = (u64)-1;</div><div class='del'>-	int nr;</div><div class='ctx'> </div><div class='del'>-	while ((nr = readahead_page_batch(rac, pagepool))) {</div><div class='del'>-		u64 contig_start = readahead_pos(rac);</div><div class='del'>-		u64 contig_end = contig_start + readahead_batch_length(rac) - 1;</div><div class='add'>+	lock_extents_for_read(inode, start, end, &amp;cached_state);</div><div class='ctx'> </div><div class='del'>-		contiguous_readpages(pagepool, nr, contig_start, contig_end,</div><div class='del'>-				&amp;em_cached, &amp;bio_ctrl, &amp;prev_em_start);</div><div class='del'>-	}</div><div class='add'>+	while ((folio = readahead_folio(rac)) != NULL)</div><div class='add'>+		btrfs_do_readpage(folio, &amp;em_cached, &amp;bio_ctrl);</div><div class='ctx'> </div><div class='del'>-	if (em_cached)</div><div class='del'>-		free_extent_map(em_cached);</div><div class='add'>+	btrfs_unlock_extent(&amp;inode-&gt;io_tree, start, end, &amp;cached_state);</div><div class='ctx'> </div><div class='del'>-	if (bio_ctrl.bio) {</div><div class='del'>-		if (submit_one_bio(bio_ctrl.bio, 0, bio_ctrl.bio_flags))</div><div class='del'>-			return;</div><div class='del'>-	}</div><div class='add'>+	if (em_cached)</div><div class='add'>+		btrfs_free_extent_map(em_cached);</div><div class='add'>+	submit_one_bio(&amp;bio_ctrl);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * basic invalidatepage code, this waits on any locked or writeback</div><div class='del'>- * ranges corresponding to the page, and then deletes any extent state</div><div class='add'>+ * basic invalidate_folio code, this waits on any locked or writeback</div><div class='add'>+ * ranges corresponding to the folio, and then deletes any extent state</div><div class='ctx'>  * records from the tree</div><div class='ctx'>  */</div><div class='del'>-int extent_invalidatepage(struct extent_io_tree *tree,</div><div class='del'>-			  struct page *page, unsigned long offset)</div><div class='add'>+int extent_invalidate_folio(struct extent_io_tree *tree,</div><div class='add'>+			  struct folio *folio, size_t offset)</div><div class='ctx'> {</div><div class='ctx'> 	struct extent_state *cached_state = NULL;</div><div class='del'>-	u64 start = page_offset(page);</div><div class='del'>-	u64 end = start + PAGE_SIZE - 1;</div><div class='del'>-	size_t blocksize = page-&gt;mapping-&gt;host-&gt;i_sb-&gt;s_blocksize;</div><div class='add'>+	u64 start = folio_pos(folio);</div><div class='add'>+	u64 end = start + folio_size(folio) - 1;</div><div class='add'>+	size_t blocksize = folio_to_fs_info(folio)-&gt;sectorsize;</div><div class='ctx'> </div><div class='ctx'> 	/* This function is only called for the btree inode */</div><div class='ctx'> 	ASSERT(tree-&gt;owner == IO_TREE_BTREE_INODE_IO);</div><div class='hunk'>@@ -5247,617 +2734,239 @@ int extent_invalidatepage(struct extent_io_tree *tree,</div><div class='ctx'> 	if (start &gt; end)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	lock_extent_bits(tree, start, end, &amp;cached_state);</div><div class='del'>-	wait_on_page_writeback(page);</div><div class='add'>+	btrfs_lock_extent(tree, start, end, &amp;cached_state);</div><div class='add'>+	folio_wait_writeback(folio);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Currently for btree io tree, only EXTENT_LOCKED is utilized,</div><div class='ctx'> 	 * so here we only need to unlock the extent range to free any</div><div class='ctx'> 	 * existing extent state.</div><div class='ctx'> 	 */</div><div class='del'>-	unlock_extent_cached(tree, start, end, &amp;cached_state);</div><div class='add'>+	btrfs_unlock_extent(tree, start, end, &amp;cached_state);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * a helper for releasepage, this tests for areas of the page that</div><div class='del'>- * are locked or under IO and drops the related state bits if it is safe</div><div class='del'>- * to drop the page.</div><div class='del'>- */</div><div class='del'>-static int try_release_extent_state(struct extent_io_tree *tree,</div><div class='del'>-				    struct page *page, gfp_t mask)</div><div class='del'>-{</div><div class='del'>-	u64 start = page_offset(page);</div><div class='del'>-	u64 end = start + PAGE_SIZE - 1;</div><div class='del'>-	int ret = 1;</div><div class='del'>-</div><div class='del'>-	if (test_range_bit(tree, start, end, EXTENT_LOCKED, 0, NULL)) {</div><div class='del'>-		ret = 0;</div><div class='del'>-	} else {</div><div class='del'>-		/*</div><div class='del'>-		 * At this point we can safely clear everything except the</div><div class='del'>-		 * locked bit, the nodatasum bit and the delalloc new bit.</div><div class='del'>-		 * The delalloc new bit will be cleared by ordered extent</div><div class='del'>-		 * completion.</div><div class='del'>-		 */</div><div class='del'>-		ret = __clear_extent_bit(tree, start, end,</div><div class='del'>-			 ~(EXTENT_LOCKED | EXTENT_NODATASUM | EXTENT_DELALLOC_NEW),</div><div class='del'>-			 0, 0, NULL, mask, NULL);</div><div class='del'>-</div><div class='del'>-		/* if clear_extent_bit failed for enomem reasons,</div><div class='del'>-		 * we can't allow the release to continue.</div><div class='del'>-		 */</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			ret = 0;</div><div class='del'>-		else</div><div class='del'>-			ret = 1;</div><div class='del'>-	}</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * a helper for releasepage.  As long as there are no locked extents</div><div class='del'>- * in the range corresponding to the page, both state records and extent</div><div class='del'>- * map records are removed</div><div class='del'>- */</div><div class='del'>-int try_release_extent_mapping(struct page *page, gfp_t mask)</div><div class='del'>-{</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	u64 start = page_offset(page);</div><div class='del'>-	u64 end = start + PAGE_SIZE - 1;</div><div class='del'>-	struct btrfs_inode *btrfs_inode = BTRFS_I(page-&gt;mapping-&gt;host);</div><div class='del'>-	struct extent_io_tree *tree = &amp;btrfs_inode-&gt;io_tree;</div><div class='del'>-	struct extent_map_tree *map = &amp;btrfs_inode-&gt;extent_tree;</div><div class='del'>-</div><div class='del'>-	if (gfpflags_allow_blocking(mask) &amp;&amp;</div><div class='del'>-	    page-&gt;mapping-&gt;host-&gt;i_size &gt; SZ_16M) {</div><div class='del'>-		u64 len;</div><div class='del'>-		while (start &lt;= end) {</div><div class='del'>-			struct btrfs_fs_info *fs_info;</div><div class='del'>-			u64 cur_gen;</div><div class='del'>-</div><div class='del'>-			len = end - start + 1;</div><div class='del'>-			write_lock(&amp;map-&gt;lock);</div><div class='del'>-			em = lookup_extent_mapping(map, start, len);</div><div class='del'>-			if (!em) {</div><div class='del'>-				write_unlock(&amp;map-&gt;lock);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			if (test_bit(EXTENT_FLAG_PINNED, &amp;em-&gt;flags) ||</div><div class='del'>-			    em-&gt;start != start) {</div><div class='del'>-				write_unlock(&amp;map-&gt;lock);</div><div class='del'>-				free_extent_map(em);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			if (test_range_bit(tree, em-&gt;start,</div><div class='del'>-					   extent_map_end(em) - 1,</div><div class='del'>-					   EXTENT_LOCKED, 0, NULL))</div><div class='del'>-				goto next;</div><div class='del'>-			/*</div><div class='del'>-			 * If it's not in the list of modified extents, used</div><div class='del'>-			 * by a fast fsync, we can remove it. If it's being</div><div class='del'>-			 * logged we can safely remove it since fsync took an</div><div class='del'>-			 * extra reference on the em.</div><div class='del'>-			 */</div><div class='del'>-			if (list_empty(&amp;em-&gt;list) ||</div><div class='del'>-			    test_bit(EXTENT_FLAG_LOGGING, &amp;em-&gt;flags))</div><div class='del'>-				goto remove_em;</div><div class='del'>-			/*</div><div class='del'>-			 * If it's in the list of modified extents, remove it</div><div class='del'>-			 * only if its generation is older then the current one,</div><div class='del'>-			 * in which case we don't need it for a fast fsync.</div><div class='del'>-			 * Otherwise don't remove it, we could be racing with an</div><div class='del'>-			 * ongoing fast fsync that could miss the new extent.</div><div class='del'>-			 */</div><div class='del'>-			fs_info = btrfs_inode-&gt;root-&gt;fs_info;</div><div class='del'>-			spin_lock(&amp;fs_info-&gt;trans_lock);</div><div class='del'>-			cur_gen = fs_info-&gt;generation;</div><div class='del'>-			spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='del'>-			if (em-&gt;generation &gt;= cur_gen)</div><div class='del'>-				goto next;</div><div class='del'>-remove_em:</div><div class='del'>-			/*</div><div class='del'>-			 * We only remove extent maps that are not in the list of</div><div class='del'>-			 * modified extents or that are in the list but with a</div><div class='del'>-			 * generation lower then the current generation, so there</div><div class='del'>-			 * is no need to set the full fsync flag on the inode (it</div><div class='del'>-			 * hurts the fsync performance for workloads with a data</div><div class='del'>-			 * size that exceeds or is close to the system's memory).</div><div class='del'>-			 */</div><div class='del'>-			remove_extent_mapping(map, em);</div><div class='del'>-			/* once for the rb tree */</div><div class='del'>-			free_extent_map(em);</div><div class='del'>-next:</div><div class='del'>-			start = extent_map_end(em);</div><div class='del'>-			write_unlock(&amp;map-&gt;lock);</div><div class='del'>-</div><div class='del'>-			/* once for us */</div><div class='del'>-			free_extent_map(em);</div><div class='del'>-</div><div class='del'>-			cond_resched(); /* Allow large-extent preemption. */</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	return try_release_extent_state(tree, page, mask);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * helper function for fiemap, which doesn't want to see any holes.</div><div class='del'>- * This maps until we find something past 'last'</div><div class='add'>+ * A helper for struct address_space_operations::release_folio, this tests for</div><div class='add'>+ * areas of the folio that are locked or under IO and drops the related state</div><div class='add'>+ * bits if it is safe to drop the folio.</div><div class='ctx'>  */</div><div class='del'>-static struct extent_map *get_extent_skip_holes(struct btrfs_inode *inode,</div><div class='del'>-						u64 offset, u64 last)</div><div class='add'>+static bool try_release_extent_state(struct extent_io_tree *tree,</div><div class='add'>+				     struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	u64 sectorsize = btrfs_inode_sectorsize(inode);</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	u64 len;</div><div class='del'>-</div><div class='del'>-	if (offset &gt;= last)</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	while (1) {</div><div class='del'>-		len = last - offset;</div><div class='del'>-		if (len == 0)</div><div class='del'>-			break;</div><div class='del'>-		len = ALIGN(len, sectorsize);</div><div class='del'>-		em = btrfs_get_extent_fiemap(inode, offset, len);</div><div class='del'>-		if (IS_ERR_OR_NULL(em))</div><div class='del'>-			return em;</div><div class='del'>-</div><div class='del'>-		/* if this isn't a hole return it */</div><div class='del'>-		if (em-&gt;block_start != EXTENT_MAP_HOLE)</div><div class='del'>-			return em;</div><div class='del'>-</div><div class='del'>-		/* this is a hole, advance to the next extent */</div><div class='del'>-		offset = extent_map_end(em);</div><div class='del'>-		free_extent_map(em);</div><div class='del'>-		if (offset &gt;= last)</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * To cache previous fiemap extent</div><div class='del'>- *</div><div class='del'>- * Will be used for merging fiemap extent</div><div class='del'>- */</div><div class='del'>-struct fiemap_cache {</div><div class='del'>-	u64 offset;</div><div class='del'>-	u64 phys;</div><div class='del'>-	u64 len;</div><div class='del'>-	u32 flags;</div><div class='del'>-	bool cached;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Helper to submit fiemap extent.</div><div class='del'>- *</div><div class='del'>- * Will try to merge current fiemap extent specified by @offset, @phys,</div><div class='del'>- * @len and @flags with cached one.</div><div class='del'>- * And only when we fails to merge, cached one will be submitted as</div><div class='del'>- * fiemap extent.</div><div class='del'>- *</div><div class='del'>- * Return value is the same as fiemap_fill_next_extent().</div><div class='del'>- */</div><div class='del'>-static int emit_fiemap_extent(struct fiemap_extent_info *fieinfo,</div><div class='del'>-				struct fiemap_cache *cache,</div><div class='del'>-				u64 offset, u64 phys, u64 len, u32 flags)</div><div class='del'>-{</div><div class='del'>-	int ret = 0;</div><div class='add'>+	struct extent_state *cached_state = NULL;</div><div class='add'>+	u64 start = folio_pos(folio);</div><div class='add'>+	u64 end = start + folio_size(folio) - 1;</div><div class='add'>+	u32 range_bits;</div><div class='add'>+	u32 clear_bits;</div><div class='add'>+	bool ret = false;</div><div class='add'>+	int ret2;</div><div class='ctx'> </div><div class='del'>-	if (!cache-&gt;cached)</div><div class='del'>-		goto assign;</div><div class='add'>+	btrfs_get_range_bits(tree, start, end, &amp;range_bits, &amp;cached_state);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Sanity check, extent_fiemap() should have ensured that new</div><div class='del'>-	 * fiemap extent won't overlap with cached one.</div><div class='del'>-	 * Not recoverable.</div><div class='del'>-	 *</div><div class='del'>-	 * NOTE: Physical address can overlap, due to compression</div><div class='add'>+	 * We can release the folio if it's locked only for ordered extent</div><div class='add'>+	 * completion, since that doesn't require using the folio.</div><div class='ctx'> 	 */</div><div class='del'>-	if (cache-&gt;offset + cache-&gt;len &gt; offset) {</div><div class='del'>-		WARN_ON(1);</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='add'>+	if ((range_bits &amp; EXTENT_LOCKED) &amp;&amp;</div><div class='add'>+	    !(range_bits &amp; EXTENT_FINISHING_ORDERED))</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='add'>+	clear_bits = ~(EXTENT_LOCKED | EXTENT_NODATASUM | EXTENT_DELALLOC_NEW |</div><div class='add'>+		       EXTENT_CTLBITS | EXTENT_QGROUP_RESERVED |</div><div class='add'>+		       EXTENT_FINISHING_ORDERED);</div><div class='ctx'> 	/*</div><div class='del'>-	 * Only merges fiemap extents if</div><div class='del'>-	 * 1) Their logical addresses are continuous</div><div class='del'>-	 *</div><div class='del'>-	 * 2) Their physical addresses are continuous</div><div class='del'>-	 *    So truly compressed (physical size smaller than logical size)</div><div class='del'>-	 *    extents won't get merged with each other</div><div class='del'>-	 *</div><div class='del'>-	 * 3) Share same flags except FIEMAP_EXTENT_LAST</div><div class='del'>-	 *    So regular extent won't get merged with prealloc extent</div><div class='add'>+	 * At this point we can safely clear everything except the locked,</div><div class='add'>+	 * nodatasum, delalloc new and finishing ordered bits. The delalloc new</div><div class='add'>+	 * bit will be cleared by ordered extent completion.</div><div class='ctx'> 	 */</div><div class='del'>-	if (cache-&gt;offset + cache-&gt;len  == offset &amp;&amp;</div><div class='del'>-	    cache-&gt;phys + cache-&gt;len == phys  &amp;&amp;</div><div class='del'>-	    (cache-&gt;flags &amp; ~FIEMAP_EXTENT_LAST) ==</div><div class='del'>-			(flags &amp; ~FIEMAP_EXTENT_LAST)) {</div><div class='del'>-		cache-&gt;len += len;</div><div class='del'>-		cache-&gt;flags |= flags;</div><div class='del'>-		goto try_submit_last;</div><div class='del'>-	}</div><div class='add'>+	ret2 = btrfs_clear_extent_bit(tree, start, end, clear_bits, &amp;cached_state);</div><div class='add'>+	/*</div><div class='add'>+	 * If clear_extent_bit failed for enomem reasons, we can't allow the</div><div class='add'>+	 * release to continue.</div><div class='add'>+	 */</div><div class='add'>+	if (ret2 == 0)</div><div class='add'>+		ret = true;</div><div class='add'>+out:</div><div class='add'>+	btrfs_free_extent_state(cached_state);</div><div class='ctx'> </div><div class='del'>-	/* Not mergeable, need to submit cached one */</div><div class='del'>-	ret = fiemap_fill_next_extent(fieinfo, cache-&gt;offset, cache-&gt;phys,</div><div class='del'>-				      cache-&gt;len, cache-&gt;flags);</div><div class='del'>-	cache-&gt;cached = false;</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-assign:</div><div class='del'>-	cache-&gt;cached = true;</div><div class='del'>-	cache-&gt;offset = offset;</div><div class='del'>-	cache-&gt;phys = phys;</div><div class='del'>-	cache-&gt;len = len;</div><div class='del'>-	cache-&gt;flags = flags;</div><div class='del'>-try_submit_last:</div><div class='del'>-	if (cache-&gt;flags &amp; FIEMAP_EXTENT_LAST) {</div><div class='del'>-		ret = fiemap_fill_next_extent(fieinfo, cache-&gt;offset,</div><div class='del'>-				cache-&gt;phys, cache-&gt;len, cache-&gt;flags);</div><div class='del'>-		cache-&gt;cached = false;</div><div class='del'>-	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Emit last fiemap cache</div><div class='del'>- *</div><div class='del'>- * The last fiemap cache may still be cached in the following case:</div><div class='del'>- * 0		      4k		    8k</div><div class='del'>- * |&lt;- Fiemap range -&gt;|</div><div class='del'>- * |&lt;------------  First extent -----------&gt;|</div><div class='del'>- *</div><div class='del'>- * In this case, the first extent range will be cached but not emitted.</div><div class='del'>- * So we must emit it before ending extent_fiemap().</div><div class='add'>+ * a helper for release_folio.  As long as there are no locked extents</div><div class='add'>+ * in the range corresponding to the page, both state records and extent</div><div class='add'>+ * map records are removed</div><div class='ctx'>  */</div><div class='del'>-static int emit_last_fiemap_cache(struct fiemap_extent_info *fieinfo,</div><div class='del'>-				  struct fiemap_cache *cache)</div><div class='add'>+bool try_release_extent_mapping(struct folio *folio, gfp_t mask)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (!cache-&gt;cached)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	ret = fiemap_fill_next_extent(fieinfo, cache-&gt;offset, cache-&gt;phys,</div><div class='del'>-				      cache-&gt;len, cache-&gt;flags);</div><div class='del'>-	cache-&gt;cached = false;</div><div class='del'>-	if (ret &gt; 0)</div><div class='del'>-		ret = 0;</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int extent_fiemap(struct btrfs_inode *inode, struct fiemap_extent_info *fieinfo,</div><div class='del'>-		  u64 start, u64 len)</div><div class='del'>-{</div><div class='del'>-	int ret = 0;</div><div class='del'>-	u64 off;</div><div class='del'>-	u64 max = start + len;</div><div class='del'>-	u32 flags = 0;</div><div class='del'>-	u32 found_type;</div><div class='del'>-	u64 last;</div><div class='del'>-	u64 last_for_get_extent = 0;</div><div class='del'>-	u64 disko = 0;</div><div class='del'>-	u64 isize = i_size_read(&amp;inode-&gt;vfs_inode);</div><div class='del'>-	struct btrfs_key found_key;</div><div class='del'>-	struct extent_map *em = NULL;</div><div class='del'>-	struct extent_state *cached_state = NULL;</div><div class='del'>-	struct btrfs_path *path;</div><div class='del'>-	struct btrfs_root *root = inode-&gt;root;</div><div class='del'>-	struct fiemap_cache cache = { 0 };</div><div class='del'>-	struct ulist *roots;</div><div class='del'>-	struct ulist *tmp_ulist;</div><div class='del'>-	int end = 0;</div><div class='del'>-	u64 em_start = 0;</div><div class='del'>-	u64 em_len = 0;</div><div class='del'>-	u64 em_end = 0;</div><div class='del'>-</div><div class='del'>-	if (len == 0)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	path = btrfs_alloc_path();</div><div class='del'>-	if (!path)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	roots = ulist_alloc(GFP_KERNEL);</div><div class='del'>-	tmp_ulist = ulist_alloc(GFP_KERNEL);</div><div class='del'>-	if (!roots || !tmp_ulist) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out_free_ulist;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * We can't initialize that to 'start' as this could miss extents due</div><div class='del'>-	 * to extent item merging</div><div class='del'>-	 */</div><div class='del'>-	off = 0;</div><div class='del'>-	start = round_down(start, btrfs_inode_sectorsize(inode));</div><div class='del'>-	len = round_up(max, btrfs_inode_sectorsize(inode)) - start;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * lookup the last file extent.  We're not using i_size here</div><div class='del'>-	 * because there might be preallocation past i_size</div><div class='del'>-	 */</div><div class='del'>-	ret = btrfs_lookup_file_extent(NULL, root, path, btrfs_ino(inode), -1,</div><div class='del'>-				       0);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		goto out_free_ulist;</div><div class='del'>-	} else {</div><div class='del'>-		WARN_ON(!ret);</div><div class='del'>-		if (ret == 1)</div><div class='del'>-			ret = 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	path-&gt;slots[0]--;</div><div class='del'>-	btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;found_key, path-&gt;slots[0]);</div><div class='del'>-	found_type = found_key.type;</div><div class='del'>-</div><div class='del'>-	/* No extents, but there might be delalloc bits */</div><div class='del'>-	if (found_key.objectid != btrfs_ino(inode) ||</div><div class='del'>-	    found_type != BTRFS_EXTENT_DATA_KEY) {</div><div class='del'>-		/* have to trust i_size as the end */</div><div class='del'>-		last = (u64)-1;</div><div class='del'>-		last_for_get_extent = isize;</div><div class='del'>-	} else {</div><div class='del'>-		/*</div><div class='del'>-		 * remember the start of the last extent.  There are a</div><div class='del'>-		 * bunch of different factors that go into the length of the</div><div class='del'>-		 * extent, so its much less complex to remember where it started</div><div class='del'>-		 */</div><div class='del'>-		last = found_key.offset;</div><div class='del'>-		last_for_get_extent = last + 1;</div><div class='del'>-	}</div><div class='del'>-	btrfs_release_path(path);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * we might have some extents allocated but more delalloc past those</div><div class='del'>-	 * extents.  so, we trust isize unless the start of the last extent is</div><div class='del'>-	 * beyond isize</div><div class='del'>-	 */</div><div class='del'>-	if (last &lt; isize) {</div><div class='del'>-		last = (u64)-1;</div><div class='del'>-		last_for_get_extent = isize;</div><div class='del'>-	}</div><div class='add'>+	u64 start = folio_pos(folio);</div><div class='add'>+	u64 end = start + folio_size(folio) - 1;</div><div class='add'>+	struct btrfs_inode *inode = folio_to_inode(folio);</div><div class='add'>+	struct extent_io_tree *io_tree = &amp;inode-&gt;io_tree;</div><div class='ctx'> </div><div class='del'>-	lock_extent_bits(&amp;inode-&gt;io_tree, start, start + len - 1,</div><div class='del'>-			 &amp;cached_state);</div><div class='add'>+	while (start &lt;= end) {</div><div class='add'>+		const u64 cur_gen = btrfs_get_fs_generation(inode-&gt;root-&gt;fs_info);</div><div class='add'>+		const u64 len = end - start + 1;</div><div class='add'>+		struct extent_map_tree *extent_tree = &amp;inode-&gt;extent_tree;</div><div class='add'>+		struct extent_map *em;</div><div class='ctx'> </div><div class='del'>-	em = get_extent_skip_holes(inode, start, last_for_get_extent);</div><div class='del'>-	if (!em)</div><div class='del'>-		goto out;</div><div class='del'>-	if (IS_ERR(em)) {</div><div class='del'>-		ret = PTR_ERR(em);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	while (!end) {</div><div class='del'>-		u64 offset_in_extent = 0;</div><div class='del'>-</div><div class='del'>-		/* break if the extent we found is outside the range */</div><div class='del'>-		if (em-&gt;start &gt;= max || extent_map_end(em) &lt; off)</div><div class='add'>+		write_lock(&amp;extent_tree-&gt;lock);</div><div class='add'>+		em = btrfs_lookup_extent_mapping(extent_tree, start, len);</div><div class='add'>+		if (!em) {</div><div class='add'>+			write_unlock(&amp;extent_tree-&gt;lock);</div><div class='ctx'> 			break;</div><div class='del'>-</div><div class='add'>+		}</div><div class='add'>+		if ((em-&gt;flags &amp; EXTENT_FLAG_PINNED) || em-&gt;start != start) {</div><div class='add'>+			write_unlock(&amp;extent_tree-&gt;lock);</div><div class='add'>+			btrfs_free_extent_map(em);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		if (btrfs_test_range_bit_exists(io_tree, em-&gt;start,</div><div class='add'>+						btrfs_extent_map_end(em) - 1,</div><div class='add'>+						EXTENT_LOCKED))</div><div class='add'>+			goto next;</div><div class='ctx'> 		/*</div><div class='del'>-		 * get_extent may return an extent that starts before our</div><div class='del'>-		 * requested range.  We have to make sure the ranges</div><div class='del'>-		 * we return to fiemap always move forward and don't</div><div class='del'>-		 * overlap, so adjust the offsets here</div><div class='add'>+		 * If it's not in the list of modified extents, used by a fast</div><div class='add'>+		 * fsync, we can remove it. If it's being logged we can safely</div><div class='add'>+		 * remove it since fsync took an extra reference on the em.</div><div class='ctx'> 		 */</div><div class='del'>-		em_start = max(em-&gt;start, off);</div><div class='del'>-</div><div class='add'>+		if (list_empty(&amp;em-&gt;list) || (em-&gt;flags &amp; EXTENT_FLAG_LOGGING))</div><div class='add'>+			goto remove_em;</div><div class='ctx'> 		/*</div><div class='del'>-		 * record the offset from the start of the extent</div><div class='del'>-		 * for adjusting the disk offset below.  Only do this if the</div><div class='del'>-		 * extent isn't compressed since our in ram offset may be past</div><div class='del'>-		 * what we have actually allocated on disk.</div><div class='add'>+		 * If it's in the list of modified extents, remove it only if</div><div class='add'>+		 * its generation is older then the current one, in which case</div><div class='add'>+		 * we don't need it for a fast fsync. Otherwise don't remove it,</div><div class='add'>+		 * we could be racing with an ongoing fast fsync that could miss</div><div class='add'>+		 * the new extent.</div><div class='ctx'> 		 */</div><div class='del'>-		if (!test_bit(EXTENT_FLAG_COMPRESSED, &amp;em-&gt;flags))</div><div class='del'>-			offset_in_extent = em_start - em-&gt;start;</div><div class='del'>-		em_end = extent_map_end(em);</div><div class='del'>-		em_len = em_end - em_start;</div><div class='del'>-		flags = 0;</div><div class='del'>-		if (em-&gt;block_start &lt; EXTENT_MAP_LAST_BYTE)</div><div class='del'>-			disko = em-&gt;block_start + offset_in_extent;</div><div class='del'>-		else</div><div class='del'>-			disko = 0;</div><div class='del'>-</div><div class='add'>+		if (em-&gt;generation &gt;= cur_gen)</div><div class='add'>+			goto next;</div><div class='add'>+remove_em:</div><div class='ctx'> 		/*</div><div class='del'>-		 * bump off for our next call to get_extent</div><div class='add'>+		 * We only remove extent maps that are not in the list of</div><div class='add'>+		 * modified extents or that are in the list but with a</div><div class='add'>+		 * generation lower then the current generation, so there is no</div><div class='add'>+		 * need to set the full fsync flag on the inode (it hurts the</div><div class='add'>+		 * fsync performance for workloads with a data size that exceeds</div><div class='add'>+		 * or is close to the system's memory).</div><div class='ctx'> 		 */</div><div class='del'>-		off = extent_map_end(em);</div><div class='del'>-		if (off &gt;= max)</div><div class='del'>-			end = 1;</div><div class='del'>-</div><div class='del'>-		if (em-&gt;block_start == EXTENT_MAP_LAST_BYTE) {</div><div class='del'>-			end = 1;</div><div class='del'>-			flags |= FIEMAP_EXTENT_LAST;</div><div class='del'>-		} else if (em-&gt;block_start == EXTENT_MAP_INLINE) {</div><div class='del'>-			flags |= (FIEMAP_EXTENT_DATA_INLINE |</div><div class='del'>-				  FIEMAP_EXTENT_NOT_ALIGNED);</div><div class='del'>-		} else if (em-&gt;block_start == EXTENT_MAP_DELALLOC) {</div><div class='del'>-			flags |= (FIEMAP_EXTENT_DELALLOC |</div><div class='del'>-				  FIEMAP_EXTENT_UNKNOWN);</div><div class='del'>-		} else if (fieinfo-&gt;fi_extents_max) {</div><div class='del'>-			u64 bytenr = em-&gt;block_start -</div><div class='del'>-				(em-&gt;start - em-&gt;orig_start);</div><div class='add'>+		btrfs_remove_extent_mapping(inode, em);</div><div class='add'>+		/* Once for the inode's extent map tree. */</div><div class='add'>+		btrfs_free_extent_map(em);</div><div class='add'>+next:</div><div class='add'>+		start = btrfs_extent_map_end(em);</div><div class='add'>+		write_unlock(&amp;extent_tree-&gt;lock);</div><div class='ctx'> </div><div class='add'>+		/* Once for us, for the lookup_extent_mapping() reference. */</div><div class='add'>+		btrfs_free_extent_map(em);</div><div class='add'>+</div><div class='add'>+		if (need_resched()) {</div><div class='ctx'> 			/*</div><div class='del'>-			 * As btrfs supports shared space, this information</div><div class='del'>-			 * can be exported to userspace tools via</div><div class='del'>-			 * flag FIEMAP_EXTENT_SHARED.  If fi_extents_max == 0</div><div class='del'>-			 * then we're just getting a count and we can skip the</div><div class='del'>-			 * lookup stuff.</div><div class='add'>+			 * If we need to resched but we can't block just exit</div><div class='add'>+			 * and leave any remaining extent maps.</div><div class='ctx'> 			 */</div><div class='del'>-			ret = btrfs_check_shared(root, btrfs_ino(inode),</div><div class='del'>-						 bytenr, roots, tmp_ulist);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto out_free;</div><div class='del'>-			if (ret)</div><div class='del'>-				flags |= FIEMAP_EXTENT_SHARED;</div><div class='del'>-			ret = 0;</div><div class='del'>-		}</div><div class='del'>-		if (test_bit(EXTENT_FLAG_COMPRESSED, &amp;em-&gt;flags))</div><div class='del'>-			flags |= FIEMAP_EXTENT_ENCODED;</div><div class='del'>-		if (test_bit(EXTENT_FLAG_PREALLOC, &amp;em-&gt;flags))</div><div class='del'>-			flags |= FIEMAP_EXTENT_UNWRITTEN;</div><div class='del'>-</div><div class='del'>-		free_extent_map(em);</div><div class='del'>-		em = NULL;</div><div class='del'>-		if ((em_start &gt;= last) || em_len == (u64)-1 ||</div><div class='del'>-		   (last == (u64)-1 &amp;&amp; isize &lt;= em_end)) {</div><div class='del'>-			flags |= FIEMAP_EXTENT_LAST;</div><div class='del'>-			end = 1;</div><div class='del'>-		}</div><div class='add'>+			if (!gfpflags_allow_blocking(mask))</div><div class='add'>+				break;</div><div class='ctx'> </div><div class='del'>-		/* now scan forward to see if this is really the last extent. */</div><div class='del'>-		em = get_extent_skip_holes(inode, off, last_for_get_extent);</div><div class='del'>-		if (IS_ERR(em)) {</div><div class='del'>-			ret = PTR_ERR(em);</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		if (!em) {</div><div class='del'>-			flags |= FIEMAP_EXTENT_LAST;</div><div class='del'>-			end = 1;</div><div class='del'>-		}</div><div class='del'>-		ret = emit_fiemap_extent(fieinfo, &amp;cache, em_start, disko,</div><div class='del'>-					   em_len, flags);</div><div class='del'>-		if (ret) {</div><div class='del'>-			if (ret == 1)</div><div class='del'>-				ret = 0;</div><div class='del'>-			goto out_free;</div><div class='add'>+			cond_resched();</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-out_free:</div><div class='del'>-	if (!ret)</div><div class='del'>-		ret = emit_last_fiemap_cache(fieinfo, &amp;cache);</div><div class='del'>-	free_extent_map(em);</div><div class='del'>-out:</div><div class='del'>-	unlock_extent_cached(&amp;inode-&gt;io_tree, start, start + len - 1,</div><div class='del'>-			     &amp;cached_state);</div><div class='del'>-</div><div class='del'>-out_free_ulist:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	ulist_free(roots);</div><div class='del'>-	ulist_free(tmp_ulist);</div><div class='del'>-	return ret;</div><div class='add'>+	return try_release_extent_state(io_tree, folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void __free_extent_buffer(struct extent_buffer *eb)</div><div class='add'>+static int extent_buffer_under_io(const struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='del'>-	kmem_cache_free(extent_buffer_cache, eb);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int extent_buffer_under_io(const struct extent_buffer *eb)</div><div class='del'>-{</div><div class='del'>-	return (atomic_read(&amp;eb-&gt;io_pages) ||</div><div class='del'>-		test_bit(EXTENT_BUFFER_WRITEBACK, &amp;eb-&gt;bflags) ||</div><div class='add'>+	return (test_bit(EXTENT_BUFFER_WRITEBACK, &amp;eb-&gt;bflags) ||</div><div class='ctx'> 		test_bit(EXTENT_BUFFER_DIRTY, &amp;eb-&gt;bflags));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool page_range_has_eb(struct btrfs_fs_info *fs_info, struct page *page)</div><div class='add'>+static bool folio_range_has_eb(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_subpage *subpage;</div><div class='add'>+	struct btrfs_folio_state *bfs;</div><div class='ctx'> </div><div class='del'>-	lockdep_assert_held(&amp;page-&gt;mapping-&gt;private_lock);</div><div class='add'>+	lockdep_assert_held(&amp;folio-&gt;mapping-&gt;i_private_lock);</div><div class='ctx'> </div><div class='del'>-	if (PagePrivate(page)) {</div><div class='del'>-		subpage = (struct btrfs_subpage *)page-&gt;private;</div><div class='del'>-		if (atomic_read(&amp;subpage-&gt;eb_refs))</div><div class='del'>-			return true;</div><div class='del'>-		/*</div><div class='del'>-		 * Even there is no eb refs here, we may still have</div><div class='del'>-		 * end_page_read() call relying on page::private.</div><div class='del'>-		 */</div><div class='del'>-		if (atomic_read(&amp;subpage-&gt;readers))</div><div class='add'>+	if (folio_test_private(folio)) {</div><div class='add'>+		bfs = folio_get_private(folio);</div><div class='add'>+		if (atomic_read(&amp;bfs-&gt;eb_refs))</div><div class='ctx'> 			return true;</div><div class='ctx'> 	}</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void detach_extent_buffer_page(struct extent_buffer *eb, struct page *page)</div><div class='add'>+static void detach_extent_buffer_folio(const struct extent_buffer *eb, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='add'>+	struct address_space *mapping = folio-&gt;mapping;</div><div class='ctx'> 	const bool mapped = !test_bit(EXTENT_BUFFER_UNMAPPED, &amp;eb-&gt;bflags);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * For mapped eb, we're going to change the page private, which should</div><div class='del'>-	 * be done under the private_lock.</div><div class='add'>+	 * For mapped eb, we're going to change the folio private, which should</div><div class='add'>+	 * be done under the i_private_lock.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (mapped)</div><div class='del'>-		spin_lock(&amp;page-&gt;mapping-&gt;private_lock);</div><div class='add'>+		spin_lock(&amp;mapping-&gt;i_private_lock);</div><div class='ctx'> </div><div class='del'>-	if (!PagePrivate(page)) {</div><div class='add'>+	if (!folio_test_private(folio)) {</div><div class='ctx'> 		if (mapped)</div><div class='del'>-			spin_unlock(&amp;page-&gt;mapping-&gt;private_lock);</div><div class='add'>+			spin_unlock(&amp;mapping-&gt;i_private_lock);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (fs_info-&gt;sectorsize == PAGE_SIZE) {</div><div class='add'>+	if (!btrfs_meta_is_subpage(fs_info)) {</div><div class='ctx'> 		/*</div><div class='del'>-		 * We do this since we'll remove the pages after we've</div><div class='del'>-		 * removed the eb from the radix tree, so we could race</div><div class='del'>-		 * and have this page now attached to the new eb.  So</div><div class='del'>-		 * only clear page_private if it's still connected to</div><div class='del'>-		 * this eb.</div><div class='add'>+		 * We do this since we'll remove the pages after we've removed</div><div class='add'>+		 * the eb from the xarray, so we could race and have this page</div><div class='add'>+		 * now attached to the new eb.  So only clear folio if it's</div><div class='add'>+		 * still connected to this eb.</div><div class='ctx'> 		 */</div><div class='del'>-		if (PagePrivate(page) &amp;&amp;</div><div class='del'>-		    page-&gt;private == (unsigned long)eb) {</div><div class='add'>+		if (folio_test_private(folio) &amp;&amp; folio_get_private(folio) == eb) {</div><div class='ctx'> 			BUG_ON(test_bit(EXTENT_BUFFER_DIRTY, &amp;eb-&gt;bflags));</div><div class='del'>-			BUG_ON(PageDirty(page));</div><div class='del'>-			BUG_ON(PageWriteback(page));</div><div class='del'>-			/*</div><div class='del'>-			 * We need to make sure we haven't be attached</div><div class='del'>-			 * to a new eb.</div><div class='del'>-			 */</div><div class='del'>-			detach_page_private(page);</div><div class='add'>+			BUG_ON(folio_test_dirty(folio));</div><div class='add'>+			BUG_ON(folio_test_writeback(folio));</div><div class='add'>+			/* We need to make sure we haven't be attached to a new eb. */</div><div class='add'>+			folio_detach_private(folio);</div><div class='ctx'> 		}</div><div class='ctx'> 		if (mapped)</div><div class='del'>-			spin_unlock(&amp;page-&gt;mapping-&gt;private_lock);</div><div class='add'>+			spin_unlock(&amp;mapping-&gt;i_private_lock);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * For subpage, we can have dummy eb with page private.  In this case,</div><div class='del'>-	 * we can directly detach the private as such page is only attached to</div><div class='del'>-	 * one dummy eb, no sharing.</div><div class='add'>+	 * For subpage, we can have dummy eb with folio private attached.  In</div><div class='add'>+	 * this case, we can directly detach the private as such folio is only</div><div class='add'>+	 * attached to one dummy eb, no sharing.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (!mapped) {</div><div class='del'>-		btrfs_detach_subpage(fs_info, page);</div><div class='add'>+		btrfs_detach_folio_state(fs_info, folio, BTRFS_SUBPAGE_METADATA);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_page_dec_eb_refs(fs_info, page);</div><div class='add'>+	btrfs_folio_dec_eb_refs(fs_info, folio);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * We can only detach the page private if there are no other ebs in the</div><div class='add'>+	 * We can only detach the folio private if there are no other ebs in the</div><div class='ctx'> 	 * page range and no unfinished IO.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!page_range_has_eb(fs_info, page))</div><div class='del'>-		btrfs_detach_subpage(fs_info, page);</div><div class='add'>+	if (!folio_range_has_eb(folio))</div><div class='add'>+		btrfs_detach_folio_state(fs_info, folio, BTRFS_SUBPAGE_METADATA);</div><div class='ctx'> </div><div class='del'>-	spin_unlock(&amp;page-&gt;mapping-&gt;private_lock);</div><div class='add'>+	spin_unlock(&amp;mapping-&gt;i_private_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Release all pages attached to the extent buffer */</div><div class='del'>-static void btrfs_release_extent_buffer_pages(struct extent_buffer *eb)</div><div class='add'>+/* Release all folios attached to the extent buffer */</div><div class='add'>+static void btrfs_release_extent_buffer_folios(const struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='del'>-	int i;</div><div class='del'>-	int num_pages;</div><div class='del'>-</div><div class='ctx'> 	ASSERT(!extent_buffer_under_io(eb));</div><div class='ctx'> </div><div class='del'>-	num_pages = num_extent_pages(eb);</div><div class='del'>-	for (i = 0; i &lt; num_pages; i++) {</div><div class='del'>-		struct page *page = eb-&gt;pages[i];</div><div class='add'>+	for (int i = 0; i &lt; INLINE_EXTENT_BUFFER_PAGES; i++) {</div><div class='add'>+		struct folio *folio = eb-&gt;folios[i];</div><div class='ctx'> </div><div class='del'>-		if (!page)</div><div class='add'>+		if (!folio)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		detach_extent_buffer_page(eb, page);</div><div class='del'>-</div><div class='del'>-		/* One for when we allocated the page */</div><div class='del'>-		put_page(page);</div><div class='add'>+		detach_extent_buffer_folio(eb, folio);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5866,45 +2975,57 @@ static void btrfs_release_extent_buffer_pages(struct extent_buffer *eb)</div><div class='ctx'>  */</div><div class='ctx'> static inline void btrfs_release_extent_buffer(struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='del'>-	btrfs_release_extent_buffer_pages(eb);</div><div class='del'>-	btrfs_leak_debug_del(&amp;eb-&gt;fs_info-&gt;eb_leak_lock, &amp;eb-&gt;leak_list);</div><div class='del'>-	__free_extent_buffer(eb);</div><div class='add'>+	btrfs_release_extent_buffer_folios(eb);</div><div class='add'>+	btrfs_leak_debug_del_eb(eb);</div><div class='add'>+	kmem_cache_free(extent_buffer_cache, eb);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct extent_buffer *</div><div class='del'>-__alloc_extent_buffer(struct btrfs_fs_info *fs_info, u64 start,</div><div class='del'>-		      unsigned long len)</div><div class='add'>+static struct extent_buffer *__alloc_extent_buffer(struct btrfs_fs_info *fs_info,</div><div class='add'>+						   u64 start)</div><div class='ctx'> {</div><div class='ctx'> 	struct extent_buffer *eb = NULL;</div><div class='ctx'> </div><div class='ctx'> 	eb = kmem_cache_zalloc(extent_buffer_cache, GFP_NOFS|__GFP_NOFAIL);</div><div class='ctx'> 	eb-&gt;start = start;</div><div class='del'>-	eb-&gt;len = len;</div><div class='add'>+	eb-&gt;len = fs_info-&gt;nodesize;</div><div class='ctx'> 	eb-&gt;fs_info = fs_info;</div><div class='del'>-	eb-&gt;bflags = 0;</div><div class='ctx'> 	init_rwsem(&amp;eb-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	btrfs_leak_debug_add(&amp;fs_info-&gt;eb_leak_lock, &amp;eb-&gt;leak_list,</div><div class='del'>-			     &amp;fs_info-&gt;allocated_ebs);</div><div class='del'>-	INIT_LIST_HEAD(&amp;eb-&gt;release_list);</div><div class='add'>+	btrfs_leak_debug_add_eb(eb);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock_init(&amp;eb-&gt;refs_lock);</div><div class='del'>-	atomic_set(&amp;eb-&gt;refs, 1);</div><div class='del'>-	atomic_set(&amp;eb-&gt;io_pages, 0);</div><div class='add'>+	refcount_set(&amp;eb-&gt;refs, 1);</div><div class='ctx'> </div><div class='del'>-	ASSERT(len &lt;= BTRFS_MAX_METADATA_BLOCKSIZE);</div><div class='add'>+	ASSERT(eb-&gt;len &lt;= BTRFS_MAX_METADATA_BLOCKSIZE);</div><div class='ctx'> </div><div class='ctx'> 	return eb;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * For use in eb allocation error cleanup paths, as btrfs_release_extent_buffer()</div><div class='add'>+ * does not call folio_put(), and we need to set the folios to NULL so that</div><div class='add'>+ * btrfs_release_extent_buffer() will not detach them a second time.</div><div class='add'>+ */</div><div class='add'>+static void cleanup_extent_buffer_folios(struct extent_buffer *eb)</div><div class='add'>+{</div><div class='add'>+	const int num_folios = num_extent_folios(eb);</div><div class='add'>+</div><div class='add'>+	/* We cannot use num_extent_folios() as loop bound as eb-&gt;folios changes. */</div><div class='add'>+	for (int i = 0; i &lt; num_folios; i++) {</div><div class='add'>+		ASSERT(eb-&gt;folios[i]);</div><div class='add'>+		detach_extent_buffer_folio(eb, eb-&gt;folios[i]);</div><div class='add'>+		folio_put(eb-&gt;folios[i]);</div><div class='add'>+		eb-&gt;folios[i] = NULL;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> struct extent_buffer *btrfs_clone_extent_buffer(const struct extent_buffer *src)</div><div class='ctx'> {</div><div class='del'>-	int i;</div><div class='del'>-	struct page *p;</div><div class='ctx'> 	struct extent_buffer *new;</div><div class='del'>-	int num_pages = num_extent_pages(src);</div><div class='add'>+	int num_folios;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	new = __alloc_extent_buffer(src-&gt;fs_info, src-&gt;start, src-&gt;len);</div><div class='add'>+	new = __alloc_extent_buffer(src-&gt;fs_info, src-&gt;start);</div><div class='ctx'> 	if (new == NULL)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='hunk'>@@ -5915,121 +3036,113 @@ struct extent_buffer *btrfs_clone_extent_buffer(const struct extent_buffer *src)</div><div class='ctx'> 	 */</div><div class='ctx'> 	set_bit(EXTENT_BUFFER_UNMAPPED, &amp;new-&gt;bflags);</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; num_pages; i++) {</div><div class='del'>-		int ret;</div><div class='add'>+	ret = alloc_eb_folio_array(new, false);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto release_eb;</div><div class='ctx'> </div><div class='del'>-		p = alloc_page(GFP_NOFS);</div><div class='del'>-		if (!p) {</div><div class='del'>-			btrfs_release_extent_buffer(new);</div><div class='del'>-			return NULL;</div><div class='del'>-		}</div><div class='del'>-		ret = attach_extent_buffer_page(new, p, NULL);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			put_page(p);</div><div class='del'>-			btrfs_release_extent_buffer(new);</div><div class='del'>-			return NULL;</div><div class='del'>-		}</div><div class='del'>-		WARN_ON(PageDirty(p));</div><div class='del'>-		new-&gt;pages[i] = p;</div><div class='del'>-		copy_page(page_address(p), page_address(src-&gt;pages[i]));</div><div class='add'>+	ASSERT(num_extent_folios(src) == num_extent_folios(new),</div><div class='add'>+	       "%d != %d", num_extent_folios(src), num_extent_folios(new));</div><div class='add'>+	/* Explicitly use the cached num_extent value from now on. */</div><div class='add'>+	num_folios = num_extent_folios(src);</div><div class='add'>+	for (int i = 0; i &lt; num_folios; i++) {</div><div class='add'>+		struct folio *folio = new-&gt;folios[i];</div><div class='add'>+</div><div class='add'>+		ret = attach_extent_buffer_folio(new, folio, NULL);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto cleanup_folios;</div><div class='add'>+		WARN_ON(folio_test_dirty(folio));</div><div class='ctx'> 	}</div><div class='add'>+	for (int i = 0; i &lt; num_folios; i++)</div><div class='add'>+		folio_put(new-&gt;folios[i]);</div><div class='add'>+</div><div class='add'>+	copy_extent_buffer_full(new, src);</div><div class='ctx'> 	set_extent_buffer_uptodate(new);</div><div class='ctx'> </div><div class='ctx'> 	return new;</div><div class='add'>+</div><div class='add'>+cleanup_folios:</div><div class='add'>+	cleanup_extent_buffer_folios(new);</div><div class='add'>+release_eb:</div><div class='add'>+	btrfs_release_extent_buffer(new);</div><div class='add'>+	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct extent_buffer *__alloc_dummy_extent_buffer(struct btrfs_fs_info *fs_info,</div><div class='del'>-						  u64 start, unsigned long len)</div><div class='add'>+struct extent_buffer *alloc_dummy_extent_buffer(struct btrfs_fs_info *fs_info,</div><div class='add'>+						u64 start)</div><div class='ctx'> {</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='del'>-	int num_pages;</div><div class='del'>-	int i;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	eb = __alloc_extent_buffer(fs_info, start, len);</div><div class='add'>+	eb = __alloc_extent_buffer(fs_info, start);</div><div class='ctx'> 	if (!eb)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='del'>-	num_pages = num_extent_pages(eb);</div><div class='del'>-	for (i = 0; i &lt; num_pages; i++) {</div><div class='del'>-		int ret;</div><div class='add'>+	ret = alloc_eb_folio_array(eb, false);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto release_eb;</div><div class='ctx'> </div><div class='del'>-		eb-&gt;pages[i] = alloc_page(GFP_NOFS);</div><div class='del'>-		if (!eb-&gt;pages[i])</div><div class='del'>-			goto err;</div><div class='del'>-		ret = attach_extent_buffer_page(eb, eb-&gt;pages[i], NULL);</div><div class='add'>+	for (int i = 0; i &lt; num_extent_folios(eb); i++) {</div><div class='add'>+		ret = attach_extent_buffer_folio(eb, eb-&gt;folios[i], NULL);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto err;</div><div class='add'>+			goto cleanup_folios;</div><div class='ctx'> 	}</div><div class='add'>+	for (int i = 0; i &lt; num_extent_folios(eb); i++)</div><div class='add'>+		folio_put(eb-&gt;folios[i]);</div><div class='add'>+</div><div class='ctx'> 	set_extent_buffer_uptodate(eb);</div><div class='ctx'> 	btrfs_set_header_nritems(eb, 0);</div><div class='ctx'> 	set_bit(EXTENT_BUFFER_UNMAPPED, &amp;eb-&gt;bflags);</div><div class='ctx'> </div><div class='ctx'> 	return eb;</div><div class='del'>-err:</div><div class='del'>-	for (; i &gt; 0; i--) {</div><div class='del'>-		detach_extent_buffer_page(eb, eb-&gt;pages[i - 1]);</div><div class='del'>-		__free_page(eb-&gt;pages[i - 1]);</div><div class='del'>-	}</div><div class='del'>-	__free_extent_buffer(eb);</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='ctx'> </div><div class='del'>-struct extent_buffer *alloc_dummy_extent_buffer(struct btrfs_fs_info *fs_info,</div><div class='del'>-						u64 start)</div><div class='del'>-{</div><div class='del'>-	return __alloc_dummy_extent_buffer(fs_info, start, fs_info-&gt;nodesize);</div><div class='add'>+cleanup_folios:</div><div class='add'>+	cleanup_extent_buffer_folios(eb);</div><div class='add'>+release_eb:</div><div class='add'>+	btrfs_release_extent_buffer(eb);</div><div class='add'>+	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void check_buffer_tree_ref(struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='ctx'> 	int refs;</div><div class='ctx'> 	/*</div><div class='del'>-	 * The TREE_REF bit is first set when the extent_buffer is added</div><div class='del'>-	 * to the radix tree. It is also reset, if unset, when a new reference</div><div class='del'>-	 * is created by find_extent_buffer.</div><div class='add'>+	 * The TREE_REF bit is first set when the extent_buffer is added to the</div><div class='add'>+	 * xarray. It is also reset, if unset, when a new reference is created</div><div class='add'>+	 * by find_extent_buffer.</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * It is only cleared in two cases: freeing the last non-tree</div><div class='ctx'> 	 * reference to the extent_buffer when its STALE bit is set or</div><div class='del'>-	 * calling releasepage when the tree reference is the only reference.</div><div class='add'>+	 * calling release_folio when the tree reference is the only reference.</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * In both cases, care is taken to ensure that the extent_buffer's</div><div class='del'>-	 * pages are not under io. However, releasepage can be concurrently</div><div class='add'>+	 * pages are not under io. However, release_folio can be concurrently</div><div class='ctx'> 	 * called with creating new references, which is prone to race</div><div class='ctx'> 	 * conditions between the calls to check_buffer_tree_ref in those</div><div class='ctx'> 	 * codepaths and clearing TREE_REF in try_release_extent_buffer.</div><div class='ctx'> 	 *</div><div class='del'>-	 * The actual lifetime of the extent_buffer in the radix tree is</div><div class='del'>-	 * adequately protected by the refcount, but the TREE_REF bit and</div><div class='del'>-	 * its corresponding reference are not. To protect against this</div><div class='del'>-	 * class of races, we call check_buffer_tree_ref from the codepaths</div><div class='del'>-	 * which trigger io after they set eb-&gt;io_pages. Note that once io is</div><div class='del'>-	 * initiated, TREE_REF can no longer be cleared, so that is the</div><div class='del'>-	 * moment at which any such race is best fixed.</div><div class='add'>+	 * The actual lifetime of the extent_buffer in the xarray is adequately</div><div class='add'>+	 * protected by the refcount, but the TREE_REF bit and its corresponding</div><div class='add'>+	 * reference are not. To protect against this class of races, we call</div><div class='add'>+	 * check_buffer_tree_ref() from the code paths which trigger io. Note that</div><div class='add'>+	 * once io is initiated, TREE_REF can no longer be cleared, so that is</div><div class='add'>+	 * the moment at which any such race is best fixed.</div><div class='ctx'> 	 */</div><div class='del'>-	refs = atomic_read(&amp;eb-&gt;refs);</div><div class='add'>+	refs = refcount_read(&amp;eb-&gt;refs);</div><div class='ctx'> 	if (refs &gt;= 2 &amp;&amp; test_bit(EXTENT_BUFFER_TREE_REF, &amp;eb-&gt;bflags))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;eb-&gt;refs_lock);</div><div class='ctx'> 	if (!test_and_set_bit(EXTENT_BUFFER_TREE_REF, &amp;eb-&gt;bflags))</div><div class='del'>-		atomic_inc(&amp;eb-&gt;refs);</div><div class='add'>+		refcount_inc(&amp;eb-&gt;refs);</div><div class='ctx'> 	spin_unlock(&amp;eb-&gt;refs_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void mark_extent_buffer_accessed(struct extent_buffer *eb,</div><div class='del'>-		struct page *accessed)</div><div class='add'>+static void mark_extent_buffer_accessed(struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='del'>-	int num_pages, i;</div><div class='del'>-</div><div class='ctx'> 	check_buffer_tree_ref(eb);</div><div class='ctx'> </div><div class='del'>-	num_pages = num_extent_pages(eb);</div><div class='del'>-	for (i = 0; i &lt; num_pages; i++) {</div><div class='del'>-		struct page *p = eb-&gt;pages[i];</div><div class='del'>-</div><div class='del'>-		if (p != accessed)</div><div class='del'>-			mark_page_accessed(p);</div><div class='del'>-	}</div><div class='add'>+	for (int i = 0; i &lt; num_extent_folios(eb); i++)</div><div class='add'>+		folio_mark_accessed(eb-&gt;folios[i]);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct extent_buffer *find_extent_buffer(struct btrfs_fs_info *fs_info,</div><div class='hunk'>@@ -6057,14 +3170,14 @@ struct extent_buffer *find_extent_buffer(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		spin_lock(&amp;eb-&gt;refs_lock);</div><div class='ctx'> 		spin_unlock(&amp;eb-&gt;refs_lock);</div><div class='ctx'> 	}</div><div class='del'>-	mark_extent_buffer_accessed(eb, NULL);</div><div class='add'>+	mark_extent_buffer_accessed(eb);</div><div class='ctx'> 	return eb;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_BTRFS_FS_RUN_SANITY_TESTS</div><div class='ctx'> struct extent_buffer *alloc_test_extent_buffer(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 					u64 start)</div><div class='ctx'> {</div><div class='add'>+#ifdef CONFIG_BTRFS_FS_RUN_SANITY_TESTS</div><div class='ctx'> 	struct extent_buffer *eb, *exists = NULL;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -6076,83 +3189,202 @@ struct extent_buffer *alloc_test_extent_buffer(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> 	eb-&gt;fs_info = fs_info;</div><div class='ctx'> again:</div><div class='del'>-	ret = radix_tree_preload(GFP_NOFS);</div><div class='del'>-	if (ret) {</div><div class='del'>-		exists = ERR_PTR(ret);</div><div class='del'>-		goto free_eb;</div><div class='add'>+	xa_lock_irq(&amp;fs_info-&gt;buffer_tree);</div><div class='add'>+	exists = __xa_cmpxchg(&amp;fs_info-&gt;buffer_tree, start &gt;&gt; fs_info-&gt;nodesize_bits,</div><div class='add'>+			      NULL, eb, GFP_NOFS);</div><div class='add'>+	if (xa_is_err(exists)) {</div><div class='add'>+		ret = xa_err(exists);</div><div class='add'>+		xa_unlock_irq(&amp;fs_info-&gt;buffer_tree);</div><div class='add'>+		btrfs_release_extent_buffer(eb);</div><div class='add'>+		return ERR_PTR(ret);</div><div class='ctx'> 	}</div><div class='del'>-	spin_lock(&amp;fs_info-&gt;buffer_lock);</div><div class='del'>-	ret = radix_tree_insert(&amp;fs_info-&gt;buffer_radix,</div><div class='del'>-				start &gt;&gt; fs_info-&gt;sectorsize_bits, eb);</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;buffer_lock);</div><div class='del'>-	radix_tree_preload_end();</div><div class='del'>-	if (ret == -EEXIST) {</div><div class='del'>-		exists = find_extent_buffer(fs_info, start);</div><div class='del'>-		if (exists)</div><div class='del'>-			goto free_eb;</div><div class='del'>-		else</div><div class='add'>+	if (exists) {</div><div class='add'>+		if (!refcount_inc_not_zero(&amp;exists-&gt;refs)) {</div><div class='add'>+			/* The extent buffer is being freed, retry. */</div><div class='add'>+			xa_unlock_irq(&amp;fs_info-&gt;buffer_tree);</div><div class='ctx'> 			goto again;</div><div class='add'>+		}</div><div class='add'>+		xa_unlock_irq(&amp;fs_info-&gt;buffer_tree);</div><div class='add'>+		btrfs_release_extent_buffer(eb);</div><div class='add'>+		return exists;</div><div class='ctx'> 	}</div><div class='add'>+	xa_unlock_irq(&amp;fs_info-&gt;buffer_tree);</div><div class='ctx'> 	check_buffer_tree_ref(eb);</div><div class='del'>-	set_bit(EXTENT_BUFFER_IN_TREE, &amp;eb-&gt;bflags);</div><div class='ctx'> </div><div class='ctx'> 	return eb;</div><div class='del'>-free_eb:</div><div class='del'>-	btrfs_release_extent_buffer(eb);</div><div class='del'>-	return exists;</div><div class='del'>-}</div><div class='add'>+#else</div><div class='add'>+	/* Stub to avoid linker error when compiled with optimizations turned off. */</div><div class='add'>+	return NULL;</div><div class='ctx'> #endif</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-static struct extent_buffer *grab_extent_buffer(</div><div class='del'>-		struct btrfs_fs_info *fs_info, struct page *page)</div><div class='add'>+static struct extent_buffer *grab_extent_buffer(struct btrfs_fs_info *fs_info,</div><div class='add'>+						struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct extent_buffer *exists;</div><div class='ctx'> </div><div class='add'>+	lockdep_assert_held(&amp;folio-&gt;mapping-&gt;i_private_lock);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='del'>-	 * For subpage case, we completely rely on radix tree to ensure we</div><div class='del'>-	 * don't try to insert two ebs for the same bytenr.  So here we always</div><div class='del'>-	 * return NULL and just continue.</div><div class='add'>+	 * For subpage case, we completely rely on xarray to ensure we don't try</div><div class='add'>+	 * to insert two ebs for the same bytenr.  So here we always return NULL</div><div class='add'>+	 * and just continue.</div><div class='ctx'> 	 */</div><div class='del'>-	if (fs_info-&gt;sectorsize &lt; PAGE_SIZE)</div><div class='add'>+	if (btrfs_meta_is_subpage(fs_info))</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='ctx'> 	/* Page not yet attached to an extent buffer */</div><div class='del'>-	if (!PagePrivate(page))</div><div class='add'>+	if (!folio_test_private(folio))</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * We could have already allocated an eb for this page and attached one</div><div class='add'>+	 * We could have already allocated an eb for this folio and attached one</div><div class='ctx'> 	 * so lets see if we can get a ref on the existing eb, and if we can we</div><div class='ctx'> 	 * know it's good and we can just return that one, else we know we can</div><div class='del'>-	 * just overwrite page-&gt;private.</div><div class='add'>+	 * just overwrite folio private.</div><div class='ctx'> 	 */</div><div class='del'>-	exists = (struct extent_buffer *)page-&gt;private;</div><div class='del'>-	if (atomic_inc_not_zero(&amp;exists-&gt;refs))</div><div class='add'>+	exists = folio_get_private(folio);</div><div class='add'>+	if (refcount_inc_not_zero(&amp;exists-&gt;refs))</div><div class='ctx'> 		return exists;</div><div class='ctx'> </div><div class='del'>-	WARN_ON(PageDirty(page));</div><div class='del'>-	detach_page_private(page);</div><div class='add'>+	WARN_ON(folio_test_dirty(folio));</div><div class='add'>+	folio_detach_private(folio);</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Validate alignment constraints of eb at logical address @start.</div><div class='add'>+ */</div><div class='add'>+static bool check_eb_alignment(struct btrfs_fs_info *fs_info, u64 start)</div><div class='add'>+{</div><div class='add'>+	const u32 nodesize = fs_info-&gt;nodesize;</div><div class='add'>+</div><div class='add'>+	if (unlikely(!IS_ALIGNED(start, fs_info-&gt;sectorsize))) {</div><div class='add'>+		btrfs_err(fs_info, "bad tree block start %llu", start);</div><div class='add'>+		return true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (unlikely(nodesize &lt; PAGE_SIZE &amp;&amp; !IS_ALIGNED(start, nodesize))) {</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+		"tree block is not nodesize aligned, start %llu nodesize %u",</div><div class='add'>+			  start, nodesize);</div><div class='add'>+		return true;</div><div class='add'>+	}</div><div class='add'>+	if (unlikely(nodesize &gt;= PAGE_SIZE &amp;&amp; !PAGE_ALIGNED(start))) {</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+		"tree block is not page aligned, start %llu nodesize %u",</div><div class='add'>+			  start, nodesize);</div><div class='add'>+		return true;</div><div class='add'>+	}</div><div class='add'>+	if (unlikely(!IS_ALIGNED(start, nodesize) &amp;&amp;</div><div class='add'>+		     !test_and_set_bit(BTRFS_FS_UNALIGNED_TREE_BLOCK, &amp;fs_info-&gt;flags))) {</div><div class='add'>+		btrfs_warn(fs_info,</div><div class='add'>+"tree block not nodesize aligned, start %llu nodesize %u, can be resolved by a full metadata balance",</div><div class='add'>+			      start, nodesize);</div><div class='add'>+	}</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Return 0 if eb-&gt;folios[i] is attached to btree inode successfully.</div><div class='add'>+ * Return &gt;0 if there is already another extent buffer for the range,</div><div class='add'>+ * and @found_eb_ret would be updated.</div><div class='add'>+ * Return -EAGAIN if the filemap has an existing folio but with different size</div><div class='add'>+ * than @eb.</div><div class='add'>+ * The caller needs to free the existing folios and retry using the same order.</div><div class='add'>+ */</div><div class='add'>+static int attach_eb_folio_to_filemap(struct extent_buffer *eb, int i,</div><div class='add'>+				      struct btrfs_folio_state *prealloc,</div><div class='add'>+				      struct extent_buffer **found_eb_ret)</div><div class='add'>+{</div><div class='add'>+</div><div class='add'>+	struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='add'>+	struct address_space *mapping = fs_info-&gt;btree_inode-&gt;i_mapping;</div><div class='add'>+	const pgoff_t index = eb-&gt;start &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	struct folio *existing_folio;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ASSERT(found_eb_ret);</div><div class='add'>+</div><div class='add'>+	/* Caller should ensure the folio exists. */</div><div class='add'>+	ASSERT(eb-&gt;folios[i]);</div><div class='add'>+</div><div class='add'>+retry:</div><div class='add'>+	existing_folio = NULL;</div><div class='add'>+	ret = filemap_add_folio(mapping, eb-&gt;folios[i], index + i,</div><div class='add'>+				GFP_NOFS | __GFP_NOFAIL);</div><div class='add'>+	if (!ret)</div><div class='add'>+		goto finish;</div><div class='add'>+</div><div class='add'>+	existing_folio = filemap_lock_folio(mapping, index + i);</div><div class='add'>+	/* The page cache only exists for a very short time, just retry. */</div><div class='add'>+	if (IS_ERR(existing_folio))</div><div class='add'>+		goto retry;</div><div class='add'>+</div><div class='add'>+	/* For now, we should only have single-page folios for btree inode. */</div><div class='add'>+	ASSERT(folio_nr_pages(existing_folio) == 1);</div><div class='add'>+</div><div class='add'>+	if (folio_size(existing_folio) != eb-&gt;folio_size) {</div><div class='add'>+		folio_unlock(existing_folio);</div><div class='add'>+		folio_put(existing_folio);</div><div class='add'>+		return -EAGAIN;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+finish:</div><div class='add'>+	spin_lock(&amp;mapping-&gt;i_private_lock);</div><div class='add'>+	if (existing_folio &amp;&amp; btrfs_meta_is_subpage(fs_info)) {</div><div class='add'>+		/* We're going to reuse the existing page, can drop our folio now. */</div><div class='add'>+		__free_page(folio_page(eb-&gt;folios[i], 0));</div><div class='add'>+		eb-&gt;folios[i] = existing_folio;</div><div class='add'>+	} else if (existing_folio) {</div><div class='add'>+		struct extent_buffer *existing_eb;</div><div class='add'>+</div><div class='add'>+		existing_eb = grab_extent_buffer(fs_info, existing_folio);</div><div class='add'>+		if (existing_eb) {</div><div class='add'>+			/* The extent buffer still exists, we can use it directly. */</div><div class='add'>+			*found_eb_ret = existing_eb;</div><div class='add'>+			spin_unlock(&amp;mapping-&gt;i_private_lock);</div><div class='add'>+			folio_unlock(existing_folio);</div><div class='add'>+			folio_put(existing_folio);</div><div class='add'>+			return 1;</div><div class='add'>+		}</div><div class='add'>+		/* The extent buffer no longer exists, we can reuse the folio. */</div><div class='add'>+		__free_page(folio_page(eb-&gt;folios[i], 0));</div><div class='add'>+		eb-&gt;folios[i] = existing_folio;</div><div class='add'>+	}</div><div class='add'>+	eb-&gt;folio_size = folio_size(eb-&gt;folios[i]);</div><div class='add'>+	eb-&gt;folio_shift = folio_shift(eb-&gt;folios[i]);</div><div class='add'>+	/* Should not fail, as we have preallocated the memory. */</div><div class='add'>+	ret = attach_extent_buffer_folio(eb, eb-&gt;folios[i], prealloc);</div><div class='add'>+	ASSERT(!ret);</div><div class='add'>+	/*</div><div class='add'>+	 * To inform we have an extra eb under allocation, so that</div><div class='add'>+	 * detach_extent_buffer_page() won't release the folio private when the</div><div class='add'>+	 * eb hasn't been inserted into the xarray yet.</div><div class='add'>+	 *</div><div class='add'>+	 * The ref will be decreased when the eb releases the page, in</div><div class='add'>+	 * detach_extent_buffer_page().  Thus needs no special handling in the</div><div class='add'>+	 * error path.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_folio_inc_eb_refs(fs_info, eb-&gt;folios[i]);</div><div class='add'>+	spin_unlock(&amp;mapping-&gt;i_private_lock);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> struct extent_buffer *alloc_extent_buffer(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 					  u64 start, u64 owner_root, int level)</div><div class='ctx'> {</div><div class='del'>-	unsigned long len = fs_info-&gt;nodesize;</div><div class='del'>-	int num_pages;</div><div class='del'>-	int i;</div><div class='del'>-	unsigned long index = start &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	int attached = 0;</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='del'>-	struct extent_buffer *exists = NULL;</div><div class='del'>-	struct page *p;</div><div class='del'>-	struct address_space *mapping = fs_info-&gt;btree_inode-&gt;i_mapping;</div><div class='add'>+	struct extent_buffer *existing_eb = NULL;</div><div class='add'>+	struct btrfs_folio_state *prealloc = NULL;</div><div class='add'>+	u64 lockdep_owner = owner_root;</div><div class='add'>+	bool page_contig = true;</div><div class='ctx'> 	int uptodate = 1;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (!IS_ALIGNED(start, fs_info-&gt;sectorsize)) {</div><div class='del'>-		btrfs_err(fs_info, "bad tree block start %llu", start);</div><div class='add'>+	if (check_eb_alignment(fs_info, start))</div><div class='ctx'> 		return ERR_PTR(-EINVAL);</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> #if BITS_PER_LONG == 32</div><div class='ctx'> 	if (start &gt;= MAX_LFS_FILESIZE) {</div><div class='hunk'>@@ -6165,135 +3397,184 @@ struct extent_buffer *alloc_extent_buffer(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		btrfs_warn_32bit_limit(fs_info);</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-	if (fs_info-&gt;sectorsize &lt; PAGE_SIZE &amp;&amp;</div><div class='del'>-	    offset_in_page(start) + len &gt; PAGE_SIZE) {</div><div class='del'>-		btrfs_err(fs_info,</div><div class='del'>-		"tree block crosses page boundary, start %llu nodesize %lu",</div><div class='del'>-			  start, len);</div><div class='del'>-		return ERR_PTR(-EINVAL);</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	eb = find_extent_buffer(fs_info, start);</div><div class='ctx'> 	if (eb)</div><div class='ctx'> 		return eb;</div><div class='ctx'> </div><div class='del'>-	eb = __alloc_extent_buffer(fs_info, start, len);</div><div class='add'>+	eb = __alloc_extent_buffer(fs_info, start);</div><div class='ctx'> 	if (!eb)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='del'>-	btrfs_set_buffer_lockdep_class(owner_root, eb, level);</div><div class='ctx'> </div><div class='del'>-	num_pages = num_extent_pages(eb);</div><div class='del'>-	for (i = 0; i &lt; num_pages; i++, index++) {</div><div class='del'>-		struct btrfs_subpage *prealloc = NULL;</div><div class='add'>+	/*</div><div class='add'>+	 * The reloc trees are just snapshots, so we need them to appear to be</div><div class='add'>+	 * just like any other fs tree WRT lockdep.</div><div class='add'>+	 */</div><div class='add'>+	if (lockdep_owner == BTRFS_TREE_RELOC_OBJECTID)</div><div class='add'>+		lockdep_owner = BTRFS_FS_TREE_OBJECTID;</div><div class='add'>+</div><div class='add'>+	btrfs_set_buffer_lockdep_class(lockdep_owner, eb, level);</div><div class='ctx'> </div><div class='del'>-		p = find_or_create_page(mapping, index, GFP_NOFS|__GFP_NOFAIL);</div><div class='del'>-		if (!p) {</div><div class='del'>-			exists = ERR_PTR(-ENOMEM);</div><div class='del'>-			goto free_eb;</div><div class='add'>+	/*</div><div class='add'>+	 * Preallocate folio private for subpage case, so that we won't</div><div class='add'>+	 * allocate memory with i_private_lock nor page lock hold.</div><div class='add'>+	 *</div><div class='add'>+	 * The memory will be freed by attach_extent_buffer_page() or freed</div><div class='add'>+	 * manually if we exit earlier.</div><div class='add'>+	 */</div><div class='add'>+	if (btrfs_meta_is_subpage(fs_info)) {</div><div class='add'>+		prealloc = btrfs_alloc_folio_state(fs_info, PAGE_SIZE, BTRFS_SUBPAGE_METADATA);</div><div class='add'>+		if (IS_ERR(prealloc)) {</div><div class='add'>+			ret = PTR_ERR(prealloc);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+reallocate:</div><div class='add'>+	/* Allocate all pages first. */</div><div class='add'>+	ret = alloc_eb_folio_array(eb, true);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		btrfs_free_folio_state(prealloc);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Attach all pages to the filemap. */</div><div class='add'>+	for (int i = 0; i &lt; num_extent_folios(eb); i++) {</div><div class='add'>+		struct folio *folio;</div><div class='add'>+</div><div class='add'>+		ret = attach_eb_folio_to_filemap(eb, i, prealloc, &amp;existing_eb);</div><div class='add'>+		if (ret &gt; 0) {</div><div class='add'>+			ASSERT(existing_eb);</div><div class='add'>+			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * Preallocate page-&gt;private for subpage case, so that we won't</div><div class='del'>-		 * allocate memory with private_lock hold.  The memory will be</div><div class='del'>-		 * freed by attach_extent_buffer_page() or freed manually if</div><div class='del'>-		 * we exit earlier.</div><div class='add'>+		 * TODO: Special handling for a corner case where the order of</div><div class='add'>+		 * folios mismatch between the new eb and filemap.</div><div class='add'>+		 *</div><div class='add'>+		 * This happens when:</div><div class='add'>+		 *</div><div class='add'>+		 * - the new eb is using higher order folio</div><div class='ctx'> 		 *</div><div class='del'>-		 * Although we have ensured one subpage eb can only have one</div><div class='del'>-		 * page, but it may change in the future for 16K page size</div><div class='del'>-		 * support, so we still preallocate the memory in the loop.</div><div class='add'>+		 * - the filemap is still using 0-order folios for the range</div><div class='add'>+		 *   This can happen at the previous eb allocation, and we don't</div><div class='add'>+		 *   have higher order folio for the call.</div><div class='add'>+		 *</div><div class='add'>+		 * - the existing eb has already been freed</div><div class='add'>+		 *</div><div class='add'>+		 * In this case, we have to free the existing folios first, and</div><div class='add'>+		 * re-allocate using the same order.</div><div class='add'>+		 * Thankfully this is not going to happen yet, as we're still</div><div class='add'>+		 * using 0-order folios.</div><div class='ctx'> 		 */</div><div class='del'>-		if (fs_info-&gt;sectorsize &lt; PAGE_SIZE) {</div><div class='del'>-			prealloc = btrfs_alloc_subpage(fs_info, BTRFS_SUBPAGE_METADATA);</div><div class='del'>-			if (IS_ERR(prealloc)) {</div><div class='del'>-				ret = PTR_ERR(prealloc);</div><div class='del'>-				unlock_page(p);</div><div class='del'>-				put_page(p);</div><div class='del'>-				exists = ERR_PTR(ret);</div><div class='del'>-				goto free_eb;</div><div class='del'>-			}</div><div class='add'>+		if (unlikely(ret == -EAGAIN)) {</div><div class='add'>+			DEBUG_WARN("folio order mismatch between new eb and filemap");</div><div class='add'>+			goto reallocate;</div><div class='ctx'> 		}</div><div class='add'>+		attached++;</div><div class='ctx'> </div><div class='del'>-		spin_lock(&amp;mapping-&gt;private_lock);</div><div class='del'>-		exists = grab_extent_buffer(fs_info, p);</div><div class='del'>-		if (exists) {</div><div class='del'>-			spin_unlock(&amp;mapping-&gt;private_lock);</div><div class='del'>-			unlock_page(p);</div><div class='del'>-			put_page(p);</div><div class='del'>-			mark_extent_buffer_accessed(exists, p);</div><div class='del'>-			btrfs_free_subpage(prealloc);</div><div class='del'>-			goto free_eb;</div><div class='del'>-		}</div><div class='del'>-		/* Should not fail, as we have preallocated the memory */</div><div class='del'>-		ret = attach_extent_buffer_page(eb, p, prealloc);</div><div class='del'>-		ASSERT(!ret);</div><div class='ctx'> 		/*</div><div class='del'>-		 * To inform we have extra eb under allocation, so that</div><div class='del'>-		 * detach_extent_buffer_page() won't release the page private</div><div class='del'>-		 * when the eb hasn't yet been inserted into radix tree.</div><div class='del'>-		 *</div><div class='del'>-		 * The ref will be decreased when the eb released the page, in</div><div class='del'>-		 * detach_extent_buffer_page().</div><div class='del'>-		 * Thus needs no special handling in error path.</div><div class='add'>+		 * Only after attach_eb_folio_to_filemap(), eb-&gt;folios[] is</div><div class='add'>+		 * reliable, as we may choose to reuse the existing page cache</div><div class='add'>+		 * and free the allocated page.</div><div class='add'>+		 */</div><div class='add'>+		folio = eb-&gt;folios[i];</div><div class='add'>+		WARN_ON(btrfs_meta_folio_test_dirty(folio, eb));</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Check if the current page is physically contiguous with previous eb</div><div class='add'>+		 * page.</div><div class='add'>+		 * At this stage, either we allocated a large folio, thus @i</div><div class='add'>+		 * would only be 0, or we fall back to per-page allocation.</div><div class='ctx'> 		 */</div><div class='del'>-		btrfs_page_inc_eb_refs(fs_info, p);</div><div class='del'>-		spin_unlock(&amp;mapping-&gt;private_lock);</div><div class='add'>+		if (i &amp;&amp; folio_page(eb-&gt;folios[i - 1], 0) + 1 != folio_page(folio, 0))</div><div class='add'>+			page_contig = false;</div><div class='ctx'> </div><div class='del'>-		WARN_ON(btrfs_page_test_dirty(fs_info, p, eb-&gt;start, eb-&gt;len));</div><div class='del'>-		eb-&gt;pages[i] = p;</div><div class='del'>-		if (!PageUptodate(p))</div><div class='add'>+		if (!btrfs_meta_folio_test_uptodate(folio, eb))</div><div class='ctx'> 			uptodate = 0;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We can't unlock the pages just yet since the extent buffer</div><div class='del'>-		 * hasn't been properly inserted in the radix tree, this</div><div class='del'>-		 * opens a race with btree_releasepage which can free a page</div><div class='del'>-		 * while we are still filling in all pages for the buffer and</div><div class='del'>-		 * we could crash.</div><div class='add'>+		 * hasn't been properly inserted into the xarray, this opens a</div><div class='add'>+		 * race with btree_release_folio() which can free a page while we</div><div class='add'>+		 * are still filling in all pages for the buffer and we could crash.</div><div class='ctx'> 		 */</div><div class='ctx'> 	}</div><div class='ctx'> 	if (uptodate)</div><div class='ctx'> 		set_bit(EXTENT_BUFFER_UPTODATE, &amp;eb-&gt;bflags);</div><div class='add'>+	/* All pages are physically contiguous, can skip cross page handling. */</div><div class='add'>+	if (page_contig)</div><div class='add'>+		eb-&gt;addr = folio_address(eb-&gt;folios[0]) + offset_in_page(eb-&gt;start);</div><div class='ctx'> again:</div><div class='del'>-	ret = radix_tree_preload(GFP_NOFS);</div><div class='del'>-	if (ret) {</div><div class='del'>-		exists = ERR_PTR(ret);</div><div class='del'>-		goto free_eb;</div><div class='add'>+	xa_lock_irq(&amp;fs_info-&gt;buffer_tree);</div><div class='add'>+	existing_eb = __xa_cmpxchg(&amp;fs_info-&gt;buffer_tree,</div><div class='add'>+				   start &gt;&gt; fs_info-&gt;nodesize_bits, NULL, eb,</div><div class='add'>+				   GFP_NOFS);</div><div class='add'>+	if (xa_is_err(existing_eb)) {</div><div class='add'>+		ret = xa_err(existing_eb);</div><div class='add'>+		xa_unlock_irq(&amp;fs_info-&gt;buffer_tree);</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;fs_info-&gt;buffer_lock);</div><div class='del'>-	ret = radix_tree_insert(&amp;fs_info-&gt;buffer_radix,</div><div class='del'>-				start &gt;&gt; fs_info-&gt;sectorsize_bits, eb);</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;buffer_lock);</div><div class='del'>-	radix_tree_preload_end();</div><div class='del'>-	if (ret == -EEXIST) {</div><div class='del'>-		exists = find_extent_buffer(fs_info, start);</div><div class='del'>-		if (exists)</div><div class='del'>-			goto free_eb;</div><div class='del'>-		else</div><div class='add'>+	if (existing_eb) {</div><div class='add'>+		if (!refcount_inc_not_zero(&amp;existing_eb-&gt;refs)) {</div><div class='add'>+			xa_unlock_irq(&amp;fs_info-&gt;buffer_tree);</div><div class='ctx'> 			goto again;</div><div class='add'>+		}</div><div class='add'>+		xa_unlock_irq(&amp;fs_info-&gt;buffer_tree);</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='add'>+	xa_unlock_irq(&amp;fs_info-&gt;buffer_tree);</div><div class='add'>+</div><div class='ctx'> 	/* add one reference for the tree */</div><div class='ctx'> 	check_buffer_tree_ref(eb);</div><div class='del'>-	set_bit(EXTENT_BUFFER_IN_TREE, &amp;eb-&gt;bflags);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Now it's safe to unlock the pages because any calls to</div><div class='del'>-	 * btree_releasepage will correctly detect that a page belongs to a</div><div class='add'>+	 * btree_release_folio will correctly detect that a page belongs to a</div><div class='ctx'> 	 * live buffer and won't free them prematurely.</div><div class='ctx'> 	 */</div><div class='del'>-	for (i = 0; i &lt; num_pages; i++)</div><div class='del'>-		unlock_page(eb-&gt;pages[i]);</div><div class='add'>+	for (int i = 0; i &lt; num_extent_folios(eb); i++) {</div><div class='add'>+		folio_unlock(eb-&gt;folios[i]);</div><div class='add'>+		/*</div><div class='add'>+		 * A folio that has been added to an address_space mapping</div><div class='add'>+		 * should not continue holding the refcount from its original</div><div class='add'>+		 * allocation indefinitely.</div><div class='add'>+		 */</div><div class='add'>+		folio_put(eb-&gt;folios[i]);</div><div class='add'>+	}</div><div class='ctx'> 	return eb;</div><div class='ctx'> </div><div class='del'>-free_eb:</div><div class='del'>-	WARN_ON(!atomic_dec_and_test(&amp;eb-&gt;refs));</div><div class='del'>-	for (i = 0; i &lt; num_pages; i++) {</div><div class='del'>-		if (eb-&gt;pages[i])</div><div class='del'>-			unlock_page(eb-&gt;pages[i]);</div><div class='del'>-	}</div><div class='add'>+out:</div><div class='add'>+	WARN_ON(!refcount_dec_and_test(&amp;eb-&gt;refs));</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Any attached folios need to be detached before we unlock them.  This</div><div class='add'>+	 * is because when we're inserting our new folios into the mapping, and</div><div class='add'>+	 * then attaching our eb to that folio.  If we fail to insert our folio</div><div class='add'>+	 * we'll lookup the folio for that index, and grab that EB.  We do not</div><div class='add'>+	 * want that to grab this eb, as we're getting ready to free it.  So we</div><div class='add'>+	 * have to detach it first and then unlock it.</div><div class='add'>+	 *</div><div class='add'>+	 * Note: the bounds is num_extent_pages() as we need to go through all slots.</div><div class='add'>+	 */</div><div class='add'>+	for (int i = 0; i &lt; num_extent_pages(eb); i++) {</div><div class='add'>+		struct folio *folio = eb-&gt;folios[i];</div><div class='add'>+</div><div class='add'>+		if (i &lt; attached) {</div><div class='add'>+			ASSERT(folio);</div><div class='add'>+			detach_extent_buffer_folio(eb, folio);</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+		} else if (!folio) {</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='add'>+		folio_put(folio);</div><div class='add'>+		eb-&gt;folios[i] = NULL;</div><div class='add'>+	}</div><div class='ctx'> 	btrfs_release_extent_buffer(eb);</div><div class='del'>-	return exists;</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ERR_PTR(ret);</div><div class='add'>+	ASSERT(existing_eb);</div><div class='add'>+	return existing_eb;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void btrfs_release_extent_buffer_rcu(struct rcu_head *head)</div><div class='hunk'>@@ -6301,7 +3582,7 @@ static inline void btrfs_release_extent_buffer_rcu(struct rcu_head *head)</div><div class='ctx'> 	struct extent_buffer *eb =</div><div class='ctx'> 			container_of(head, struct extent_buffer, rcu_head);</div><div class='ctx'> </div><div class='del'>-	__free_extent_buffer(eb);</div><div class='add'>+	kmem_cache_free(extent_buffer_cache, eb);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int release_extent_buffer(struct extent_buffer *eb)</div><div class='hunk'>@@ -6309,27 +3590,35 @@ static int release_extent_buffer(struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='ctx'> 	lockdep_assert_held(&amp;eb-&gt;refs_lock);</div><div class='ctx'> </div><div class='del'>-	WARN_ON(atomic_read(&amp;eb-&gt;refs) == 0);</div><div class='del'>-	if (atomic_dec_and_test(&amp;eb-&gt;refs)) {</div><div class='del'>-		if (test_and_clear_bit(EXTENT_BUFFER_IN_TREE, &amp;eb-&gt;bflags)) {</div><div class='del'>-			struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='add'>+	if (refcount_dec_and_test(&amp;eb-&gt;refs)) {</div><div class='add'>+		struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='ctx'> </div><div class='del'>-			spin_unlock(&amp;eb-&gt;refs_lock);</div><div class='add'>+		spin_unlock(&amp;eb-&gt;refs_lock);</div><div class='ctx'> </div><div class='del'>-			spin_lock(&amp;fs_info-&gt;buffer_lock);</div><div class='del'>-			radix_tree_delete(&amp;fs_info-&gt;buffer_radix,</div><div class='del'>-					  eb-&gt;start &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='del'>-			spin_unlock(&amp;fs_info-&gt;buffer_lock);</div><div class='del'>-		} else {</div><div class='del'>-			spin_unlock(&amp;eb-&gt;refs_lock);</div><div class='del'>-		}</div><div class='add'>+		/*</div><div class='add'>+		 * We're erasing, theoretically there will be no allocations, so</div><div class='add'>+		 * just use GFP_ATOMIC.</div><div class='add'>+		 *</div><div class='add'>+		 * We use cmpxchg instead of erase because we do not know if</div><div class='add'>+		 * this eb is actually in the tree or not, we could be cleaning</div><div class='add'>+		 * up an eb that we allocated but never inserted into the tree.</div><div class='add'>+		 * Thus use cmpxchg to remove it from the tree if it is there,</div><div class='add'>+		 * or leave the other entry if this isn't in the tree.</div><div class='add'>+		 *</div><div class='add'>+		 * The documentation says that putting a NULL value is the same</div><div class='add'>+		 * as erase as long as XA_FLAGS_ALLOC is not set, which it isn't</div><div class='add'>+		 * in this case.</div><div class='add'>+		 */</div><div class='add'>+		xa_cmpxchg_irq(&amp;fs_info-&gt;buffer_tree,</div><div class='add'>+			       eb-&gt;start &gt;&gt; fs_info-&gt;nodesize_bits, eb, NULL,</div><div class='add'>+			       GFP_ATOMIC);</div><div class='ctx'> </div><div class='del'>-		btrfs_leak_debug_del(&amp;eb-&gt;fs_info-&gt;eb_leak_lock, &amp;eb-&gt;leak_list);</div><div class='del'>-		/* Should be safe to release our pages at this point */</div><div class='del'>-		btrfs_release_extent_buffer_pages(eb);</div><div class='add'>+		btrfs_leak_debug_del_eb(eb);</div><div class='add'>+		/* Should be safe to release folios at this point. */</div><div class='add'>+		btrfs_release_extent_buffer_folios(eb);</div><div class='ctx'> #ifdef CONFIG_BTRFS_FS_RUN_SANITY_TESTS</div><div class='ctx'> 		if (unlikely(test_bit(EXTENT_BUFFER_UNMAPPED, &amp;eb-&gt;bflags))) {</div><div class='del'>-			__free_extent_buffer(eb);</div><div class='add'>+			kmem_cache_free(extent_buffer_cache, eb);</div><div class='ctx'> 			return 1;</div><div class='ctx'> 		}</div><div class='ctx'> #endif</div><div class='hunk'>@@ -6344,27 +3633,29 @@ static int release_extent_buffer(struct extent_buffer *eb)</div><div class='ctx'> void free_extent_buffer(struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='ctx'> 	int refs;</div><div class='del'>-	int old;</div><div class='ctx'> 	if (!eb)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='add'>+	refs = refcount_read(&amp;eb-&gt;refs);</div><div class='ctx'> 	while (1) {</div><div class='del'>-		refs = atomic_read(&amp;eb-&gt;refs);</div><div class='del'>-		if ((!test_bit(EXTENT_BUFFER_UNMAPPED, &amp;eb-&gt;bflags) &amp;&amp; refs &lt;= 3)</div><div class='del'>-		    || (test_bit(EXTENT_BUFFER_UNMAPPED, &amp;eb-&gt;bflags) &amp;&amp;</div><div class='del'>-			refs == 1))</div><div class='add'>+		if (test_bit(EXTENT_BUFFER_UNMAPPED, &amp;eb-&gt;bflags)) {</div><div class='add'>+			if (refs == 1)</div><div class='add'>+				break;</div><div class='add'>+		} else if (refs &lt;= 3) {</div><div class='ctx'> 			break;</div><div class='del'>-		old = atomic_cmpxchg(&amp;eb-&gt;refs, refs, refs - 1);</div><div class='del'>-		if (old == refs)</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* Optimization to avoid locking eb-&gt;refs_lock. */</div><div class='add'>+		if (atomic_try_cmpxchg(&amp;eb-&gt;refs.refs, &amp;refs, refs - 1))</div><div class='ctx'> 			return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;eb-&gt;refs_lock);</div><div class='del'>-	if (atomic_read(&amp;eb-&gt;refs) == 2 &amp;&amp;</div><div class='add'>+	if (refcount_read(&amp;eb-&gt;refs) == 2 &amp;&amp;</div><div class='ctx'> 	    test_bit(EXTENT_BUFFER_STALE, &amp;eb-&gt;bflags) &amp;&amp;</div><div class='ctx'> 	    !extent_buffer_under_io(eb) &amp;&amp;</div><div class='ctx'> 	    test_and_clear_bit(EXTENT_BUFFER_TREE_REF, &amp;eb-&gt;bflags))</div><div class='del'>-		atomic_dec(&amp;eb-&gt;refs);</div><div class='add'>+		refcount_dec(&amp;eb-&gt;refs);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * I know this is terrible, but it's temporary until we stop tracking</div><div class='hunk'>@@ -6381,335 +3672,244 @@ void free_extent_buffer_stale(struct extent_buffer *eb)</div><div class='ctx'> 	spin_lock(&amp;eb-&gt;refs_lock);</div><div class='ctx'> 	set_bit(EXTENT_BUFFER_STALE, &amp;eb-&gt;bflags);</div><div class='ctx'> </div><div class='del'>-	if (atomic_read(&amp;eb-&gt;refs) == 2 &amp;&amp; !extent_buffer_under_io(eb) &amp;&amp;</div><div class='add'>+	if (refcount_read(&amp;eb-&gt;refs) == 2 &amp;&amp; !extent_buffer_under_io(eb) &amp;&amp;</div><div class='ctx'> 	    test_and_clear_bit(EXTENT_BUFFER_TREE_REF, &amp;eb-&gt;bflags))</div><div class='del'>-		atomic_dec(&amp;eb-&gt;refs);</div><div class='add'>+		refcount_dec(&amp;eb-&gt;refs);</div><div class='ctx'> 	release_extent_buffer(eb);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void btree_clear_page_dirty(struct page *page)</div><div class='add'>+static void btree_clear_folio_dirty_tag(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	ASSERT(PageDirty(page));</div><div class='del'>-	ASSERT(PageLocked(page));</div><div class='del'>-	clear_page_dirty_for_io(page);</div><div class='del'>-	xa_lock_irq(&amp;page-&gt;mapping-&gt;i_pages);</div><div class='del'>-	if (!PageDirty(page))</div><div class='del'>-		__xa_clear_mark(&amp;page-&gt;mapping-&gt;i_pages,</div><div class='del'>-				page_index(page), PAGECACHE_TAG_DIRTY);</div><div class='del'>-	xa_unlock_irq(&amp;page-&gt;mapping-&gt;i_pages);</div><div class='add'>+	ASSERT(!folio_test_dirty(folio));</div><div class='add'>+	ASSERT(folio_test_locked(folio));</div><div class='add'>+	xa_lock_irq(&amp;folio-&gt;mapping-&gt;i_pages);</div><div class='add'>+	if (!folio_test_dirty(folio))</div><div class='add'>+		__xa_clear_mark(&amp;folio-&gt;mapping-&gt;i_pages, folio-&gt;index,</div><div class='add'>+				PAGECACHE_TAG_DIRTY);</div><div class='add'>+	xa_unlock_irq(&amp;folio-&gt;mapping-&gt;i_pages);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void clear_subpage_extent_buffer_dirty(const struct extent_buffer *eb)</div><div class='add'>+void btrfs_clear_buffer_dirty(struct btrfs_trans_handle *trans,</div><div class='add'>+			      struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='del'>-	struct page *page = eb-&gt;pages[0];</div><div class='del'>-	bool last;</div><div class='del'>-</div><div class='del'>-	/* btree_clear_page_dirty() needs page locked */</div><div class='del'>-	lock_page(page);</div><div class='del'>-	last = btrfs_subpage_clear_and_test_dirty(fs_info, page, eb-&gt;start,</div><div class='del'>-						  eb-&gt;len);</div><div class='del'>-	if (last)</div><div class='del'>-		btree_clear_page_dirty(page);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	WARN_ON(atomic_read(&amp;eb-&gt;refs) == 0);</div><div class='del'>-}</div><div class='ctx'> </div><div class='del'>-void clear_extent_buffer_dirty(const struct extent_buffer *eb)</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-	int num_pages;</div><div class='del'>-	struct page *page;</div><div class='add'>+	btrfs_assert_tree_write_locked(eb);</div><div class='add'>+</div><div class='add'>+	if (trans &amp;&amp; btrfs_header_generation(eb) != trans-&gt;transid)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Instead of clearing the dirty flag off of the buffer, mark it as</div><div class='add'>+	 * EXTENT_BUFFER_ZONED_ZEROOUT. This allows us to preserve</div><div class='add'>+	 * write-ordering in zoned mode, without the need to later re-dirty</div><div class='add'>+	 * the extent_buffer.</div><div class='add'>+	 *</div><div class='add'>+	 * The actual zeroout of the buffer will happen later in</div><div class='add'>+	 * btree_csum_one_bio.</div><div class='add'>+	 */</div><div class='add'>+	if (btrfs_is_zoned(fs_info) &amp;&amp; test_bit(EXTENT_BUFFER_DIRTY, &amp;eb-&gt;bflags)) {</div><div class='add'>+		set_bit(EXTENT_BUFFER_ZONED_ZEROOUT, &amp;eb-&gt;bflags);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (eb-&gt;fs_info-&gt;sectorsize &lt; PAGE_SIZE)</div><div class='del'>-		return clear_subpage_extent_buffer_dirty(eb);</div><div class='add'>+	if (!test_and_clear_bit(EXTENT_BUFFER_DIRTY, &amp;eb-&gt;bflags))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	buffer_tree_clear_mark(eb, PAGECACHE_TAG_DIRTY);</div><div class='add'>+	percpu_counter_add_batch(&amp;fs_info-&gt;dirty_metadata_bytes, -eb-&gt;len,</div><div class='add'>+				 fs_info-&gt;dirty_metadata_batch);</div><div class='ctx'> </div><div class='del'>-	num_pages = num_extent_pages(eb);</div><div class='add'>+	for (int i = 0; i &lt; num_extent_folios(eb); i++) {</div><div class='add'>+		struct folio *folio = eb-&gt;folios[i];</div><div class='add'>+		bool last;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; num_pages; i++) {</div><div class='del'>-		page = eb-&gt;pages[i];</div><div class='del'>-		if (!PageDirty(page))</div><div class='add'>+		if (!folio_test_dirty(folio))</div><div class='ctx'> 			continue;</div><div class='del'>-		lock_page(page);</div><div class='del'>-		btree_clear_page_dirty(page);</div><div class='del'>-		ClearPageError(page);</div><div class='del'>-		unlock_page(page);</div><div class='add'>+		folio_lock(folio);</div><div class='add'>+		last = btrfs_meta_folio_clear_and_test_dirty(folio, eb);</div><div class='add'>+		if (last)</div><div class='add'>+			btree_clear_folio_dirty_tag(folio);</div><div class='add'>+		folio_unlock(folio);</div><div class='ctx'> 	}</div><div class='del'>-	WARN_ON(atomic_read(&amp;eb-&gt;refs) == 0);</div><div class='add'>+	WARN_ON(refcount_read(&amp;eb-&gt;refs) == 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-bool set_extent_buffer_dirty(struct extent_buffer *eb)</div><div class='add'>+void set_extent_buffer_dirty(struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='del'>-	int i;</div><div class='del'>-	int num_pages;</div><div class='ctx'> 	bool was_dirty;</div><div class='ctx'> </div><div class='ctx'> 	check_buffer_tree_ref(eb);</div><div class='ctx'> </div><div class='ctx'> 	was_dirty = test_and_set_bit(EXTENT_BUFFER_DIRTY, &amp;eb-&gt;bflags);</div><div class='ctx'> </div><div class='del'>-	num_pages = num_extent_pages(eb);</div><div class='del'>-	WARN_ON(atomic_read(&amp;eb-&gt;refs) == 0);</div><div class='add'>+	WARN_ON(refcount_read(&amp;eb-&gt;refs) == 0);</div><div class='ctx'> 	WARN_ON(!test_bit(EXTENT_BUFFER_TREE_REF, &amp;eb-&gt;bflags));</div><div class='add'>+	WARN_ON(test_bit(EXTENT_BUFFER_ZONED_ZEROOUT, &amp;eb-&gt;bflags));</div><div class='ctx'> </div><div class='ctx'> 	if (!was_dirty) {</div><div class='del'>-		bool subpage = eb-&gt;fs_info-&gt;sectorsize &lt; PAGE_SIZE;</div><div class='add'>+		bool subpage = btrfs_meta_is_subpage(eb-&gt;fs_info);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * For subpage case, we can have other extent buffers in the</div><div class='del'>-		 * same page, and in clear_subpage_extent_buffer_dirty() we</div><div class='add'>+		 * same page, and in clear_extent_buffer_dirty() we</div><div class='ctx'> 		 * have to clear page dirty without subpage lock held.</div><div class='ctx'> 		 * This can cause race where our page gets dirty cleared after</div><div class='ctx'> 		 * we just set it.</div><div class='ctx'> 		 *</div><div class='del'>-		 * Thankfully, clear_subpage_extent_buffer_dirty() has locked</div><div class='add'>+		 * Thankfully, clear_extent_buffer_dirty() has locked</div><div class='ctx'> 		 * its page for other reasons, we can use page lock to prevent</div><div class='ctx'> 		 * the above race.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (subpage)</div><div class='del'>-			lock_page(eb-&gt;pages[0]);</div><div class='del'>-		for (i = 0; i &lt; num_pages; i++)</div><div class='del'>-			btrfs_page_set_dirty(eb-&gt;fs_info, eb-&gt;pages[i],</div><div class='del'>-					     eb-&gt;start, eb-&gt;len);</div><div class='add'>+			folio_lock(eb-&gt;folios[0]);</div><div class='add'>+		for (int i = 0; i &lt; num_extent_folios(eb); i++)</div><div class='add'>+			btrfs_meta_folio_set_dirty(eb-&gt;folios[i], eb);</div><div class='add'>+		buffer_tree_set_mark(eb, PAGECACHE_TAG_DIRTY);</div><div class='ctx'> 		if (subpage)</div><div class='del'>-			unlock_page(eb-&gt;pages[0]);</div><div class='add'>+			folio_unlock(eb-&gt;folios[0]);</div><div class='add'>+		percpu_counter_add_batch(&amp;eb-&gt;fs_info-&gt;dirty_metadata_bytes,</div><div class='add'>+					 eb-&gt;len,</div><div class='add'>+					 eb-&gt;fs_info-&gt;dirty_metadata_batch);</div><div class='ctx'> 	}</div><div class='ctx'> #ifdef CONFIG_BTRFS_DEBUG</div><div class='del'>-	for (i = 0; i &lt; num_pages; i++)</div><div class='del'>-		ASSERT(PageDirty(eb-&gt;pages[i]));</div><div class='add'>+	for (int i = 0; i &lt; num_extent_folios(eb); i++)</div><div class='add'>+		ASSERT(folio_test_dirty(eb-&gt;folios[i]));</div><div class='ctx'> #endif</div><div class='del'>-</div><div class='del'>-	return was_dirty;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void clear_extent_buffer_uptodate(struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='del'>-	struct page *page;</div><div class='del'>-	int num_pages;</div><div class='del'>-	int i;</div><div class='ctx'> </div><div class='ctx'> 	clear_bit(EXTENT_BUFFER_UPTODATE, &amp;eb-&gt;bflags);</div><div class='del'>-	num_pages = num_extent_pages(eb);</div><div class='del'>-	for (i = 0; i &lt; num_pages; i++) {</div><div class='del'>-		page = eb-&gt;pages[i];</div><div class='del'>-		if (page)</div><div class='del'>-			btrfs_page_clear_uptodate(fs_info, page,</div><div class='del'>-						  eb-&gt;start, eb-&gt;len);</div><div class='add'>+	for (int i = 0; i &lt; num_extent_folios(eb); i++) {</div><div class='add'>+		struct folio *folio = eb-&gt;folios[i];</div><div class='add'>+</div><div class='add'>+		if (!folio)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		btrfs_meta_folio_clear_uptodate(folio, eb);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void set_extent_buffer_uptodate(struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='del'>-	struct page *page;</div><div class='del'>-	int num_pages;</div><div class='del'>-	int i;</div><div class='ctx'> </div><div class='ctx'> 	set_bit(EXTENT_BUFFER_UPTODATE, &amp;eb-&gt;bflags);</div><div class='del'>-	num_pages = num_extent_pages(eb);</div><div class='del'>-	for (i = 0; i &lt; num_pages; i++) {</div><div class='del'>-		page = eb-&gt;pages[i];</div><div class='del'>-		btrfs_page_set_uptodate(fs_info, page, eb-&gt;start, eb-&gt;len);</div><div class='del'>-	}</div><div class='add'>+	for (int i = 0; i &lt; num_extent_folios(eb); i++)</div><div class='add'>+		btrfs_meta_folio_set_uptodate(eb-&gt;folios[i], eb);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int read_extent_buffer_subpage(struct extent_buffer *eb, int wait,</div><div class='del'>-				      int mirror_num)</div><div class='add'>+static void clear_extent_buffer_reading(struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='del'>-	struct extent_io_tree *io_tree;</div><div class='del'>-	struct page *page = eb-&gt;pages[0];</div><div class='del'>-	struct btrfs_bio_ctrl bio_ctrl = { 0 };</div><div class='del'>-	int ret = 0;</div><div class='add'>+	clear_and_wake_up_bit(EXTENT_BUFFER_READING, &amp;eb-&gt;bflags);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	ASSERT(!test_bit(EXTENT_BUFFER_UNMAPPED, &amp;eb-&gt;bflags));</div><div class='del'>-	ASSERT(PagePrivate(page));</div><div class='del'>-	io_tree = &amp;BTRFS_I(fs_info-&gt;btree_inode)-&gt;io_tree;</div><div class='add'>+static void end_bbio_meta_read(struct btrfs_bio *bbio)</div><div class='add'>+{</div><div class='add'>+	struct extent_buffer *eb = bbio-&gt;private;</div><div class='add'>+	bool uptodate = !bbio-&gt;bio.bi_status;</div><div class='ctx'> </div><div class='del'>-	if (wait == WAIT_NONE) {</div><div class='del'>-		if (!try_lock_extent(io_tree, eb-&gt;start, eb-&gt;start + eb-&gt;len - 1))</div><div class='del'>-			return -EAGAIN;</div><div class='del'>-	} else {</div><div class='del'>-		ret = lock_extent(io_tree, eb-&gt;start, eb-&gt;start + eb-&gt;len - 1);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			return ret;</div><div class='del'>-	}</div><div class='add'>+	/*</div><div class='add'>+	 * If the extent buffer is marked UPTODATE before the read operation</div><div class='add'>+	 * completes, other calls to read_extent_buffer_pages() will return</div><div class='add'>+	 * early without waiting for the read to finish, causing data races.</div><div class='add'>+	 */</div><div class='add'>+	WARN_ON(test_bit(EXTENT_BUFFER_UPTODATE, &amp;eb-&gt;bflags));</div><div class='ctx'> </div><div class='del'>-	ret = 0;</div><div class='del'>-	if (test_bit(EXTENT_BUFFER_UPTODATE, &amp;eb-&gt;bflags) ||</div><div class='del'>-	    PageUptodate(page) ||</div><div class='del'>-	    btrfs_subpage_test_uptodate(fs_info, page, eb-&gt;start, eb-&gt;len)) {</div><div class='del'>-		set_bit(EXTENT_BUFFER_UPTODATE, &amp;eb-&gt;bflags);</div><div class='del'>-		unlock_extent(io_tree, eb-&gt;start, eb-&gt;start + eb-&gt;len - 1);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='add'>+	eb-&gt;read_mirror = bbio-&gt;mirror_num;</div><div class='ctx'> </div><div class='del'>-	clear_bit(EXTENT_BUFFER_READ_ERR, &amp;eb-&gt;bflags);</div><div class='del'>-	eb-&gt;read_mirror = 0;</div><div class='del'>-	atomic_set(&amp;eb-&gt;io_pages, 1);</div><div class='del'>-	check_buffer_tree_ref(eb);</div><div class='del'>-	btrfs_subpage_clear_error(fs_info, page, eb-&gt;start, eb-&gt;len);</div><div class='del'>-</div><div class='del'>-	btrfs_subpage_start_reader(fs_info, page, eb-&gt;start, eb-&gt;len);</div><div class='del'>-	ret = submit_extent_page(REQ_OP_READ | REQ_META, NULL, &amp;bio_ctrl,</div><div class='del'>-				 page, eb-&gt;start, eb-&gt;len,</div><div class='del'>-				 eb-&gt;start - page_offset(page),</div><div class='del'>-				 end_bio_extent_readpage, mirror_num, 0,</div><div class='del'>-				 true);</div><div class='del'>-	if (ret) {</div><div class='del'>-		/*</div><div class='del'>-		 * In the endio function, if we hit something wrong we will</div><div class='del'>-		 * increase the io_pages, so here we need to decrease it for</div><div class='del'>-		 * error path.</div><div class='del'>-		 */</div><div class='del'>-		atomic_dec(&amp;eb-&gt;io_pages);</div><div class='del'>-	}</div><div class='del'>-	if (bio_ctrl.bio) {</div><div class='del'>-		int tmp;</div><div class='add'>+	if (uptodate &amp;&amp;</div><div class='add'>+	    btrfs_validate_extent_buffer(eb, &amp;bbio-&gt;parent_check) &lt; 0)</div><div class='add'>+		uptodate = false;</div><div class='ctx'> </div><div class='del'>-		tmp = submit_one_bio(bio_ctrl.bio, mirror_num, 0);</div><div class='del'>-		bio_ctrl.bio = NULL;</div><div class='del'>-		if (tmp &lt; 0)</div><div class='del'>-			return tmp;</div><div class='del'>-	}</div><div class='del'>-	if (ret || wait != WAIT_COMPLETE)</div><div class='del'>-		return ret;</div><div class='add'>+	if (uptodate)</div><div class='add'>+		set_extent_buffer_uptodate(eb);</div><div class='add'>+	else</div><div class='add'>+		clear_extent_buffer_uptodate(eb);</div><div class='ctx'> </div><div class='del'>-	wait_extent_bit(io_tree, eb-&gt;start, eb-&gt;start + eb-&gt;len - 1, EXTENT_LOCKED);</div><div class='del'>-	if (!test_bit(EXTENT_BUFFER_UPTODATE, &amp;eb-&gt;bflags))</div><div class='del'>-		ret = -EIO;</div><div class='del'>-	return ret;</div><div class='add'>+	clear_extent_buffer_reading(eb);</div><div class='add'>+	free_extent_buffer(eb);</div><div class='add'>+</div><div class='add'>+	bio_put(&amp;bbio-&gt;bio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int read_extent_buffer_pages(struct extent_buffer *eb, int wait, int mirror_num)</div><div class='add'>+int read_extent_buffer_pages_nowait(struct extent_buffer *eb, int mirror_num,</div><div class='add'>+				    const struct btrfs_tree_parent_check *check)</div><div class='ctx'> {</div><div class='del'>-	int i;</div><div class='del'>-	struct page *page;</div><div class='del'>-	int err;</div><div class='del'>-	int ret = 0;</div><div class='del'>-	int locked_pages = 0;</div><div class='del'>-	int all_uptodate = 1;</div><div class='del'>-	int num_pages;</div><div class='del'>-	unsigned long num_reads = 0;</div><div class='del'>-	struct btrfs_bio_ctrl bio_ctrl = { 0 };</div><div class='add'>+	struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='add'>+	struct btrfs_bio *bbio;</div><div class='ctx'> </div><div class='ctx'> 	if (test_bit(EXTENT_BUFFER_UPTODATE, &amp;eb-&gt;bflags))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	if (eb-&gt;fs_info-&gt;sectorsize &lt; PAGE_SIZE)</div><div class='del'>-		return read_extent_buffer_subpage(eb, wait, mirror_num);</div><div class='del'>-</div><div class='del'>-	num_pages = num_extent_pages(eb);</div><div class='del'>-	for (i = 0; i &lt; num_pages; i++) {</div><div class='del'>-		page = eb-&gt;pages[i];</div><div class='del'>-		if (wait == WAIT_NONE) {</div><div class='del'>-			/*</div><div class='del'>-			 * WAIT_NONE is only utilized by readahead. If we can't</div><div class='del'>-			 * acquire the lock atomically it means either the eb</div><div class='del'>-			 * is being read out or under modification.</div><div class='del'>-			 * Either way the eb will be or has been cached,</div><div class='del'>-			 * readahead can exit safely.</div><div class='del'>-			 */</div><div class='del'>-			if (!trylock_page(page))</div><div class='del'>-				goto unlock_exit;</div><div class='del'>-		} else {</div><div class='del'>-			lock_page(page);</div><div class='del'>-		}</div><div class='del'>-		locked_pages++;</div><div class='del'>-	}</div><div class='ctx'> 	/*</div><div class='del'>-	 * We need to firstly lock all pages to make sure that</div><div class='del'>-	 * the uptodate bit of our pages won't be affected by</div><div class='del'>-	 * clear_extent_buffer_uptodate().</div><div class='add'>+	 * We could have had EXTENT_BUFFER_UPTODATE cleared by the write</div><div class='add'>+	 * operation, which could potentially still be in flight.  In this case</div><div class='add'>+	 * we simply want to return an error.</div><div class='ctx'> 	 */</div><div class='del'>-	for (i = 0; i &lt; num_pages; i++) {</div><div class='del'>-		page = eb-&gt;pages[i];</div><div class='del'>-		if (!PageUptodate(page)) {</div><div class='del'>-			num_reads++;</div><div class='del'>-			all_uptodate = 0;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	if (unlikely(test_bit(EXTENT_BUFFER_WRITE_ERR, &amp;eb-&gt;bflags)))</div><div class='add'>+		return -EIO;</div><div class='ctx'> </div><div class='del'>-	if (all_uptodate) {</div><div class='del'>-		set_bit(EXTENT_BUFFER_UPTODATE, &amp;eb-&gt;bflags);</div><div class='del'>-		goto unlock_exit;</div><div class='del'>-	}</div><div class='add'>+	/* Someone else is already reading the buffer, just wait for it. */</div><div class='add'>+	if (test_and_set_bit(EXTENT_BUFFER_READING, &amp;eb-&gt;bflags))</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	clear_bit(EXTENT_BUFFER_READ_ERR, &amp;eb-&gt;bflags);</div><div class='del'>-	eb-&gt;read_mirror = 0;</div><div class='del'>-	atomic_set(&amp;eb-&gt;io_pages, num_reads);</div><div class='ctx'> 	/*</div><div class='del'>-	 * It is possible for releasepage to clear the TREE_REF bit before we</div><div class='del'>-	 * set io_pages. See check_buffer_tree_ref for a more detailed comment.</div><div class='add'>+	 * Between the initial test_bit(EXTENT_BUFFER_UPTODATE) and the above</div><div class='add'>+	 * test_and_set_bit(EXTENT_BUFFER_READING), someone else could have</div><div class='add'>+	 * started and finished reading the same eb.  In this case, UPTODATE</div><div class='add'>+	 * will now be set, and we shouldn't read it in again.</div><div class='ctx'> 	 */</div><div class='del'>-	check_buffer_tree_ref(eb);</div><div class='del'>-	for (i = 0; i &lt; num_pages; i++) {</div><div class='del'>-		page = eb-&gt;pages[i];</div><div class='del'>-</div><div class='del'>-		if (!PageUptodate(page)) {</div><div class='del'>-			if (ret) {</div><div class='del'>-				atomic_dec(&amp;eb-&gt;io_pages);</div><div class='del'>-				unlock_page(page);</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			ClearPageError(page);</div><div class='del'>-			err = submit_extent_page(REQ_OP_READ | REQ_META, NULL,</div><div class='del'>-					 &amp;bio_ctrl, page, page_offset(page),</div><div class='del'>-					 PAGE_SIZE, 0, end_bio_extent_readpage,</div><div class='del'>-					 mirror_num, 0, false);</div><div class='del'>-			if (err) {</div><div class='del'>-				/*</div><div class='del'>-				 * We failed to submit the bio so it's the</div><div class='del'>-				 * caller's responsibility to perform cleanup</div><div class='del'>-				 * i.e unlock page/set error bit.</div><div class='del'>-				 */</div><div class='del'>-				ret = err;</div><div class='del'>-				SetPageError(page);</div><div class='del'>-				unlock_page(page);</div><div class='del'>-				atomic_dec(&amp;eb-&gt;io_pages);</div><div class='del'>-			}</div><div class='del'>-		} else {</div><div class='del'>-			unlock_page(page);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (bio_ctrl.bio) {</div><div class='del'>-		err = submit_one_bio(bio_ctrl.bio, mirror_num, bio_ctrl.bio_flags);</div><div class='del'>-		bio_ctrl.bio = NULL;</div><div class='del'>-		if (err)</div><div class='del'>-			return err;</div><div class='add'>+	if (unlikely(test_bit(EXTENT_BUFFER_UPTODATE, &amp;eb-&gt;bflags))) {</div><div class='add'>+		clear_extent_buffer_reading(eb);</div><div class='add'>+		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (ret || wait != WAIT_COMPLETE)</div><div class='del'>-		return ret;</div><div class='add'>+	eb-&gt;read_mirror = 0;</div><div class='add'>+	check_buffer_tree_ref(eb);</div><div class='add'>+	refcount_inc(&amp;eb-&gt;refs);</div><div class='add'>+</div><div class='add'>+	bbio = btrfs_bio_alloc(INLINE_EXTENT_BUFFER_PAGES,</div><div class='add'>+			       REQ_OP_READ | REQ_META, BTRFS_I(fs_info-&gt;btree_inode),</div><div class='add'>+			       eb-&gt;start, end_bbio_meta_read, eb);</div><div class='add'>+	bbio-&gt;bio.bi_iter.bi_sector = eb-&gt;start &gt;&gt; SECTOR_SHIFT;</div><div class='add'>+	memcpy(&amp;bbio-&gt;parent_check, check, sizeof(*check));</div><div class='add'>+	for (int i = 0; i &lt; num_extent_folios(eb); i++) {</div><div class='add'>+		struct folio *folio = eb-&gt;folios[i];</div><div class='add'>+		u64 range_start = max_t(u64, eb-&gt;start, folio_pos(folio));</div><div class='add'>+		u32 range_len = min_t(u64, folio_next_pos(folio),</div><div class='add'>+				      eb-&gt;start + eb-&gt;len) - range_start;</div><div class='add'>+</div><div class='add'>+		bio_add_folio_nofail(&amp;bbio-&gt;bio, folio, range_len,</div><div class='add'>+				     offset_in_folio(folio, range_start));</div><div class='add'>+	}</div><div class='add'>+	btrfs_submit_bbio(bbio, mirror_num);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; num_pages; i++) {</div><div class='del'>-		page = eb-&gt;pages[i];</div><div class='del'>-		wait_on_page_locked(page);</div><div class='del'>-		if (!PageUptodate(page))</div><div class='del'>-			ret = -EIO;</div><div class='del'>-	}</div><div class='add'>+int read_extent_buffer_pages(struct extent_buffer *eb, int mirror_num,</div><div class='add'>+			     const struct btrfs_tree_parent_check *check)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	return ret;</div><div class='add'>+	ret = read_extent_buffer_pages_nowait(eb, mirror_num, check);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-unlock_exit:</div><div class='del'>-	while (locked_pages &gt; 0) {</div><div class='del'>-		locked_pages--;</div><div class='del'>-		page = eb-&gt;pages[locked_pages];</div><div class='del'>-		unlock_page(page);</div><div class='del'>-	}</div><div class='del'>-	return ret;</div><div class='add'>+	wait_on_bit_io(&amp;eb-&gt;bflags, EXTENT_BUFFER_READING, TASK_UNINTERRUPTIBLE);</div><div class='add'>+	if (unlikely(!test_bit(EXTENT_BUFFER_UPTODATE, &amp;eb-&gt;bflags)))</div><div class='add'>+		return -EIO;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool report_eb_range(const struct extent_buffer *eb, unsigned long start,</div><div class='ctx'> 			    unsigned long len)</div><div class='ctx'> {</div><div class='ctx'> 	btrfs_warn(eb-&gt;fs_info,</div><div class='del'>-		"access to eb bytenr %llu len %lu out of range start %lu len %lu",</div><div class='add'>+		"access to eb bytenr %llu len %u out of range start %lu len %lu",</div><div class='ctx'> 		eb-&gt;start, eb-&gt;len, start, len);</div><div class='del'>-	WARN_ON(IS_ENABLED(CONFIG_BTRFS_DEBUG));</div><div class='add'>+	DEBUG_WARN();</div><div class='ctx'> </div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='hunk'>@@ -6736,23 +3936,33 @@ static inline int check_eb_range(const struct extent_buffer *eb,</div><div class='ctx'> void read_extent_buffer(const struct extent_buffer *eb, void *dstv,</div><div class='ctx'> 			unsigned long start, unsigned long len)</div><div class='ctx'> {</div><div class='add'>+	const int unit_size = eb-&gt;folio_size;</div><div class='ctx'> 	size_t cur;</div><div class='ctx'> 	size_t offset;</div><div class='del'>-	struct page *page;</div><div class='del'>-	char *kaddr;</div><div class='ctx'> 	char *dst = (char *)dstv;</div><div class='del'>-	unsigned long i = get_eb_page_index(start);</div><div class='add'>+	unsigned long i = get_eb_folio_index(eb, start);</div><div class='ctx'> </div><div class='del'>-	if (check_eb_range(eb, start, len))</div><div class='add'>+	if (check_eb_range(eb, start, len)) {</div><div class='add'>+		/*</div><div class='add'>+		 * Invalid range hit, reset the memory, so callers won't get</div><div class='add'>+		 * some random garbage for their uninitialized memory.</div><div class='add'>+		 */</div><div class='add'>+		memset(dstv, 0, len);</div><div class='ctx'> 		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	offset = get_eb_offset_in_page(eb, start);</div><div class='add'>+	if (eb-&gt;addr) {</div><div class='add'>+		memcpy(dstv, eb-&gt;addr + start, len);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	offset = get_eb_offset_in_folio(eb, start);</div><div class='ctx'> </div><div class='ctx'> 	while (len &gt; 0) {</div><div class='del'>-		page = eb-&gt;pages[i];</div><div class='add'>+		char *kaddr;</div><div class='ctx'> </div><div class='del'>-		cur = min(len, (PAGE_SIZE - offset));</div><div class='del'>-		kaddr = page_address(page);</div><div class='add'>+		cur = min(len, unit_size - offset);</div><div class='add'>+		kaddr = folio_address(eb-&gt;folios[i]);</div><div class='ctx'> 		memcpy(dst, kaddr + offset, cur);</div><div class='ctx'> </div><div class='ctx'> 		dst += cur;</div><div class='hunk'>@@ -6766,24 +3976,29 @@ int read_extent_buffer_to_user_nofault(const struct extent_buffer *eb,</div><div class='ctx'> 				       void __user *dstv,</div><div class='ctx'> 				       unsigned long start, unsigned long len)</div><div class='ctx'> {</div><div class='add'>+	const int unit_size = eb-&gt;folio_size;</div><div class='ctx'> 	size_t cur;</div><div class='ctx'> 	size_t offset;</div><div class='del'>-	struct page *page;</div><div class='del'>-	char *kaddr;</div><div class='ctx'> 	char __user *dst = (char __user *)dstv;</div><div class='del'>-	unsigned long i = get_eb_page_index(start);</div><div class='add'>+	unsigned long i = get_eb_folio_index(eb, start);</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	WARN_ON(start &gt; eb-&gt;len);</div><div class='ctx'> 	WARN_ON(start + len &gt; eb-&gt;start + eb-&gt;len);</div><div class='ctx'> </div><div class='del'>-	offset = get_eb_offset_in_page(eb, start);</div><div class='add'>+	if (eb-&gt;addr) {</div><div class='add'>+		if (copy_to_user_nofault(dstv, eb-&gt;addr + start, len))</div><div class='add'>+			ret = -EFAULT;</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	offset = get_eb_offset_in_folio(eb, start);</div><div class='ctx'> </div><div class='ctx'> 	while (len &gt; 0) {</div><div class='del'>-		page = eb-&gt;pages[i];</div><div class='add'>+		char *kaddr;</div><div class='ctx'> </div><div class='del'>-		cur = min(len, (PAGE_SIZE - offset));</div><div class='del'>-		kaddr = page_address(page);</div><div class='add'>+		cur = min(len, unit_size - offset);</div><div class='add'>+		kaddr = folio_address(eb-&gt;folios[i]);</div><div class='ctx'> 		if (copy_to_user_nofault(dst, kaddr + offset, cur)) {</div><div class='ctx'> 			ret = -EFAULT;</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -6801,25 +4016,25 @@ int read_extent_buffer_to_user_nofault(const struct extent_buffer *eb,</div><div class='ctx'> int memcmp_extent_buffer(const struct extent_buffer *eb, const void *ptrv,</div><div class='ctx'> 			 unsigned long start, unsigned long len)</div><div class='ctx'> {</div><div class='add'>+	const int unit_size = eb-&gt;folio_size;</div><div class='ctx'> 	size_t cur;</div><div class='ctx'> 	size_t offset;</div><div class='del'>-	struct page *page;</div><div class='ctx'> 	char *kaddr;</div><div class='ctx'> 	char *ptr = (char *)ptrv;</div><div class='del'>-	unsigned long i = get_eb_page_index(start);</div><div class='add'>+	unsigned long i = get_eb_folio_index(eb, start);</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (check_eb_range(eb, start, len))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	offset = get_eb_offset_in_page(eb, start);</div><div class='add'>+	if (eb-&gt;addr)</div><div class='add'>+		return memcmp(ptrv, eb-&gt;addr + start, len);</div><div class='ctx'> </div><div class='del'>-	while (len &gt; 0) {</div><div class='del'>-		page = eb-&gt;pages[i];</div><div class='add'>+	offset = get_eb_offset_in_folio(eb, start);</div><div class='ctx'> </div><div class='del'>-		cur = min(len, (PAGE_SIZE - offset));</div><div class='del'>-</div><div class='del'>-		kaddr = page_address(page);</div><div class='add'>+	while (len &gt; 0) {</div><div class='add'>+		cur = min(len, unit_size - offset);</div><div class='add'>+		kaddr = folio_address(eb-&gt;folios[i]);</div><div class='ctx'> 		ret = memcmp(ptr, kaddr + offset, cur);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -6838,68 +4053,71 @@ int memcmp_extent_buffer(const struct extent_buffer *eb, const void *ptrv,</div><div class='ctx'>  * For regular sector size == PAGE_SIZE case, check if @page is uptodate.</div><div class='ctx'>  * For subpage case, check if the range covered by the eb has EXTENT_UPTODATE.</div><div class='ctx'>  */</div><div class='del'>-static void assert_eb_page_uptodate(const struct extent_buffer *eb,</div><div class='del'>-				    struct page *page)</div><div class='add'>+static void assert_eb_folio_uptodate(const struct extent_buffer *eb, int i)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='add'>+	struct folio *folio = eb-&gt;folios[i];</div><div class='ctx'> </div><div class='del'>-	if (fs_info-&gt;sectorsize &lt; PAGE_SIZE) {</div><div class='del'>-		bool uptodate;</div><div class='add'>+	ASSERT(folio);</div><div class='ctx'> </div><div class='del'>-		uptodate = btrfs_subpage_test_uptodate(fs_info, page,</div><div class='del'>-						       eb-&gt;start, eb-&gt;len);</div><div class='del'>-		WARN_ON(!uptodate);</div><div class='add'>+	/*</div><div class='add'>+	 * If we are using the commit root we could potentially clear a page</div><div class='add'>+	 * Uptodate while we're using the extent buffer that we've previously</div><div class='add'>+	 * looked up.  We don't want to complain in this case, as the page was</div><div class='add'>+	 * valid before, we just didn't write it out.  Instead we want to catch</div><div class='add'>+	 * the case where we didn't actually read the block properly, which</div><div class='add'>+	 * would have !PageUptodate and !EXTENT_BUFFER_WRITE_ERR.</div><div class='add'>+	 */</div><div class='add'>+	if (test_bit(EXTENT_BUFFER_WRITE_ERR, &amp;eb-&gt;bflags))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (btrfs_meta_is_subpage(fs_info)) {</div><div class='add'>+		folio = eb-&gt;folios[0];</div><div class='add'>+		ASSERT(i == 0);</div><div class='add'>+		if (WARN_ON(!btrfs_subpage_test_uptodate(fs_info, folio,</div><div class='add'>+							 eb-&gt;start, eb-&gt;len)))</div><div class='add'>+			btrfs_subpage_dump_bitmap(fs_info, folio, eb-&gt;start, eb-&gt;len);</div><div class='ctx'> 	} else {</div><div class='del'>-		WARN_ON(!PageUptodate(page));</div><div class='add'>+		WARN_ON(!folio_test_uptodate(folio));</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void write_extent_buffer_chunk_tree_uuid(const struct extent_buffer *eb,</div><div class='del'>-		const void *srcv)</div><div class='del'>-{</div><div class='del'>-	char *kaddr;</div><div class='del'>-</div><div class='del'>-	assert_eb_page_uptodate(eb, eb-&gt;pages[0]);</div><div class='del'>-	kaddr = page_address(eb-&gt;pages[0]) +</div><div class='del'>-		get_eb_offset_in_page(eb, offsetof(struct btrfs_header,</div><div class='del'>-						   chunk_tree_uuid));</div><div class='del'>-	memcpy(kaddr, srcv, BTRFS_FSID_SIZE);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void write_extent_buffer_fsid(const struct extent_buffer *eb, const void *srcv)</div><div class='del'>-{</div><div class='del'>-	char *kaddr;</div><div class='del'>-</div><div class='del'>-	assert_eb_page_uptodate(eb, eb-&gt;pages[0]);</div><div class='del'>-	kaddr = page_address(eb-&gt;pages[0]) +</div><div class='del'>-		get_eb_offset_in_page(eb, offsetof(struct btrfs_header, fsid));</div><div class='del'>-	memcpy(kaddr, srcv, BTRFS_FSID_SIZE);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void write_extent_buffer(const struct extent_buffer *eb, const void *srcv,</div><div class='del'>-			 unsigned long start, unsigned long len)</div><div class='add'>+static void __write_extent_buffer(const struct extent_buffer *eb,</div><div class='add'>+				  const void *srcv, unsigned long start,</div><div class='add'>+				  unsigned long len, bool use_memmove)</div><div class='ctx'> {</div><div class='add'>+	const int unit_size = eb-&gt;folio_size;</div><div class='ctx'> 	size_t cur;</div><div class='ctx'> 	size_t offset;</div><div class='del'>-	struct page *page;</div><div class='ctx'> 	char *kaddr;</div><div class='del'>-	char *src = (char *)srcv;</div><div class='del'>-	unsigned long i = get_eb_page_index(start);</div><div class='del'>-</div><div class='del'>-	WARN_ON(test_bit(EXTENT_BUFFER_NO_CHECK, &amp;eb-&gt;bflags));</div><div class='add'>+	const char *src = (const char *)srcv;</div><div class='add'>+	unsigned long i = get_eb_folio_index(eb, start);</div><div class='add'>+	/* For unmapped (dummy) ebs, no need to check their uptodate status. */</div><div class='add'>+	const bool check_uptodate = !test_bit(EXTENT_BUFFER_UNMAPPED, &amp;eb-&gt;bflags);</div><div class='ctx'> </div><div class='ctx'> 	if (check_eb_range(eb, start, len))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	offset = get_eb_offset_in_page(eb, start);</div><div class='add'>+	if (eb-&gt;addr) {</div><div class='add'>+		if (use_memmove)</div><div class='add'>+			memmove(eb-&gt;addr + start, srcv, len);</div><div class='add'>+		else</div><div class='add'>+			memcpy(eb-&gt;addr + start, srcv, len);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	offset = get_eb_offset_in_folio(eb, start);</div><div class='ctx'> </div><div class='ctx'> 	while (len &gt; 0) {</div><div class='del'>-		page = eb-&gt;pages[i];</div><div class='del'>-		assert_eb_page_uptodate(eb, page);</div><div class='add'>+		if (check_uptodate)</div><div class='add'>+			assert_eb_folio_uptodate(eb, i);</div><div class='ctx'> </div><div class='del'>-		cur = min(len, PAGE_SIZE - offset);</div><div class='del'>-		kaddr = page_address(page);</div><div class='del'>-		memcpy(kaddr + offset, src, cur);</div><div class='add'>+		cur = min(len, unit_size - offset);</div><div class='add'>+		kaddr = folio_address(eb-&gt;folios[i]);</div><div class='add'>+		if (use_memmove)</div><div class='add'>+			memmove(kaddr + offset, src, cur);</div><div class='add'>+		else</div><div class='add'>+			memcpy(kaddr + offset, src, cur);</div><div class='ctx'> </div><div class='ctx'> 		src += cur;</div><div class='ctx'> 		len -= cur;</div><div class='hunk'>@@ -6908,55 +4126,60 @@ void write_extent_buffer(const struct extent_buffer *eb, const void *srcv,</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void memzero_extent_buffer(const struct extent_buffer *eb, unsigned long start,</div><div class='del'>-		unsigned long len)</div><div class='add'>+void write_extent_buffer(const struct extent_buffer *eb, const void *srcv,</div><div class='add'>+			 unsigned long start, unsigned long len)</div><div class='ctx'> {</div><div class='del'>-	size_t cur;</div><div class='del'>-	size_t offset;</div><div class='del'>-	struct page *page;</div><div class='del'>-	char *kaddr;</div><div class='del'>-	unsigned long i = get_eb_page_index(start);</div><div class='add'>+	return __write_extent_buffer(eb, srcv, start, len, false);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if (check_eb_range(eb, start, len))</div><div class='del'>-		return;</div><div class='add'>+static void memset_extent_buffer(const struct extent_buffer *eb, int c,</div><div class='add'>+				 unsigned long start, unsigned long len)</div><div class='add'>+{</div><div class='add'>+	const int unit_size = eb-&gt;folio_size;</div><div class='add'>+	unsigned long cur = start;</div><div class='ctx'> </div><div class='del'>-	offset = get_eb_offset_in_page(eb, start);</div><div class='add'>+	if (eb-&gt;addr) {</div><div class='add'>+		memset(eb-&gt;addr + start, c, len);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	while (len &gt; 0) {</div><div class='del'>-		page = eb-&gt;pages[i];</div><div class='del'>-		assert_eb_page_uptodate(eb, page);</div><div class='add'>+	while (cur &lt; start + len) {</div><div class='add'>+		unsigned long index = get_eb_folio_index(eb, cur);</div><div class='add'>+		unsigned int offset = get_eb_offset_in_folio(eb, cur);</div><div class='add'>+		unsigned int cur_len = min(start + len - cur, unit_size - offset);</div><div class='ctx'> </div><div class='del'>-		cur = min(len, PAGE_SIZE - offset);</div><div class='del'>-		kaddr = page_address(page);</div><div class='del'>-		memset(kaddr + offset, 0, cur);</div><div class='add'>+		assert_eb_folio_uptodate(eb, index);</div><div class='add'>+		memset(folio_address(eb-&gt;folios[index]) + offset, c, cur_len);</div><div class='ctx'> </div><div class='del'>-		len -= cur;</div><div class='del'>-		offset = 0;</div><div class='del'>-		i++;</div><div class='add'>+		cur += cur_len;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void memzero_extent_buffer(const struct extent_buffer *eb, unsigned long start,</div><div class='add'>+			   unsigned long len)</div><div class='add'>+{</div><div class='add'>+	if (check_eb_range(eb, start, len))</div><div class='add'>+		return;</div><div class='add'>+	return memset_extent_buffer(eb, 0, start, len);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> void copy_extent_buffer_full(const struct extent_buffer *dst,</div><div class='ctx'> 			     const struct extent_buffer *src)</div><div class='ctx'> {</div><div class='del'>-	int i;</div><div class='del'>-	int num_pages;</div><div class='add'>+	const int unit_size = src-&gt;folio_size;</div><div class='add'>+	unsigned long cur = 0;</div><div class='ctx'> </div><div class='ctx'> 	ASSERT(dst-&gt;len == src-&gt;len);</div><div class='ctx'> </div><div class='del'>-	if (dst-&gt;fs_info-&gt;sectorsize == PAGE_SIZE) {</div><div class='del'>-		num_pages = num_extent_pages(dst);</div><div class='del'>-		for (i = 0; i &lt; num_pages; i++)</div><div class='del'>-			copy_page(page_address(dst-&gt;pages[i]),</div><div class='del'>-				  page_address(src-&gt;pages[i]));</div><div class='del'>-	} else {</div><div class='del'>-		size_t src_offset = get_eb_offset_in_page(src, 0);</div><div class='del'>-		size_t dst_offset = get_eb_offset_in_page(dst, 0);</div><div class='add'>+	while (cur &lt; src-&gt;len) {</div><div class='add'>+		unsigned long index = get_eb_folio_index(src, cur);</div><div class='add'>+		unsigned long offset = get_eb_offset_in_folio(src, cur);</div><div class='add'>+		unsigned long cur_len = min(src-&gt;len, unit_size - offset);</div><div class='add'>+		void *addr = folio_address(src-&gt;folios[index]) + offset;</div><div class='add'>+</div><div class='add'>+		write_extent_buffer(dst, addr, cur, cur_len);</div><div class='ctx'> </div><div class='del'>-		ASSERT(src-&gt;fs_info-&gt;sectorsize &lt; PAGE_SIZE);</div><div class='del'>-		memcpy(page_address(dst-&gt;pages[0]) + dst_offset,</div><div class='del'>-		       page_address(src-&gt;pages[0]) + src_offset,</div><div class='del'>-		       src-&gt;len);</div><div class='add'>+		cur += cur_len;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -6965,12 +4188,12 @@ void copy_extent_buffer(const struct extent_buffer *dst,</div><div class='ctx'> 			unsigned long dst_offset, unsigned long src_offset,</div><div class='ctx'> 			unsigned long len)</div><div class='ctx'> {</div><div class='add'>+	const int unit_size = dst-&gt;folio_size;</div><div class='ctx'> 	u64 dst_len = dst-&gt;len;</div><div class='ctx'> 	size_t cur;</div><div class='ctx'> 	size_t offset;</div><div class='del'>-	struct page *page;</div><div class='ctx'> 	char *kaddr;</div><div class='del'>-	unsigned long i = get_eb_page_index(dst_offset);</div><div class='add'>+	unsigned long i = get_eb_folio_index(dst, dst_offset);</div><div class='ctx'> </div><div class='ctx'> 	if (check_eb_range(dst, dst_offset, len) ||</div><div class='ctx'> 	    check_eb_range(src, src_offset, len))</div><div class='hunk'>@@ -6978,15 +4201,14 @@ void copy_extent_buffer(const struct extent_buffer *dst,</div><div class='ctx'> </div><div class='ctx'> 	WARN_ON(src-&gt;len != dst_len);</div><div class='ctx'> </div><div class='del'>-	offset = get_eb_offset_in_page(dst, dst_offset);</div><div class='add'>+	offset = get_eb_offset_in_folio(dst, dst_offset);</div><div class='ctx'> </div><div class='ctx'> 	while (len &gt; 0) {</div><div class='del'>-		page = dst-&gt;pages[i];</div><div class='del'>-		assert_eb_page_uptodate(dst, page);</div><div class='add'>+		assert_eb_folio_uptodate(dst, i);</div><div class='ctx'> </div><div class='del'>-		cur = min(len, (unsigned long)(PAGE_SIZE - offset));</div><div class='add'>+		cur = min(len, (unsigned long)(unit_size - offset));</div><div class='ctx'> </div><div class='del'>-		kaddr = page_address(page);</div><div class='add'>+		kaddr = folio_address(dst-&gt;folios[i]);</div><div class='ctx'> 		read_extent_buffer(src, kaddr + offset, src_offset, cur);</div><div class='ctx'> </div><div class='ctx'> 		src_offset += cur;</div><div class='hunk'>@@ -6997,22 +4219,22 @@ void copy_extent_buffer(const struct extent_buffer *dst,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * eb_bitmap_offset() - calculate the page and offset of the byte containing the</div><div class='del'>- * given bit number</div><div class='del'>- * @eb: the extent buffer</div><div class='del'>- * @start: offset of the bitmap item in the extent buffer</div><div class='del'>- * @nr: bit number</div><div class='del'>- * @page_index: return index of the page in the extent buffer that contains the</div><div class='del'>- * given bit number</div><div class='del'>- * @page_offset: return offset into the page given by page_index</div><div class='add'>+ * Calculate the folio and offset of the byte containing the given bit number.</div><div class='add'>+ *</div><div class='add'>+ * @eb:           the extent buffer</div><div class='add'>+ * @start:        offset of the bitmap item in the extent buffer</div><div class='add'>+ * @nr:           bit number</div><div class='add'>+ * @folio_index:  return index of the folio in the extent buffer that contains</div><div class='add'>+ *                the given bit number</div><div class='add'>+ * @folio_offset: return offset into the folio given by folio_index</div><div class='ctx'>  *</div><div class='ctx'>  * This helper hides the ugliness of finding the byte in an extent buffer which</div><div class='ctx'>  * contains a given bit.</div><div class='ctx'>  */</div><div class='ctx'> static inline void eb_bitmap_offset(const struct extent_buffer *eb,</div><div class='ctx'> 				    unsigned long start, unsigned long nr,</div><div class='del'>-				    unsigned long *page_index,</div><div class='del'>-				    size_t *page_offset)</div><div class='add'>+				    unsigned long *folio_index,</div><div class='add'>+				    size_t *folio_offset)</div><div class='ctx'> {</div><div class='ctx'> 	size_t byte_offset = BIT_BYTE(nr);</div><div class='ctx'> 	size_t offset;</div><div class='hunk'>@@ -7022,115 +4244,111 @@ static inline void eb_bitmap_offset(const struct extent_buffer *eb,</div><div class='ctx'> 	 * the bitmap item in the extent buffer + the offset of the byte in the</div><div class='ctx'> 	 * bitmap item.</div><div class='ctx'> 	 */</div><div class='del'>-	offset = start + offset_in_page(eb-&gt;start) + byte_offset;</div><div class='add'>+	offset = start + offset_in_eb_folio(eb, eb-&gt;start) + byte_offset;</div><div class='ctx'> </div><div class='del'>-	*page_index = offset &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	*page_offset = offset_in_page(offset);</div><div class='add'>+	*folio_index = offset &gt;&gt; eb-&gt;folio_shift;</div><div class='add'>+	*folio_offset = offset_in_eb_folio(eb, offset);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * extent_buffer_test_bit - determine whether a bit in a bitmap item is set</div><div class='del'>- * @eb: the extent buffer</div><div class='del'>- * @start: offset of the bitmap item in the extent buffer</div><div class='del'>- * @nr: bit number to test</div><div class='add'>+/*</div><div class='add'>+ * Determine whether a bit in a bitmap item is set.</div><div class='add'>+ *</div><div class='add'>+ * @eb:     the extent buffer</div><div class='add'>+ * @start:  offset of the bitmap item in the extent buffer</div><div class='add'>+ * @nr:     bit number to test</div><div class='ctx'>  */</div><div class='del'>-int extent_buffer_test_bit(const struct extent_buffer *eb, unsigned long start,</div><div class='del'>-			   unsigned long nr)</div><div class='add'>+bool extent_buffer_test_bit(const struct extent_buffer *eb, unsigned long start,</div><div class='add'>+			    unsigned long nr)</div><div class='ctx'> {</div><div class='del'>-	u8 *kaddr;</div><div class='del'>-	struct page *page;</div><div class='ctx'> 	unsigned long i;</div><div class='ctx'> 	size_t offset;</div><div class='add'>+	u8 *kaddr;</div><div class='ctx'> </div><div class='ctx'> 	eb_bitmap_offset(eb, start, nr, &amp;i, &amp;offset);</div><div class='del'>-	page = eb-&gt;pages[i];</div><div class='del'>-	assert_eb_page_uptodate(eb, page);</div><div class='del'>-	kaddr = page_address(page);</div><div class='add'>+	assert_eb_folio_uptodate(eb, i);</div><div class='add'>+	kaddr = folio_address(eb-&gt;folios[i]);</div><div class='ctx'> 	return 1U &amp; (kaddr[offset] &gt;&gt; (nr &amp; (BITS_PER_BYTE - 1)));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * extent_buffer_bitmap_set - set an area of a bitmap</div><div class='del'>- * @eb: the extent buffer</div><div class='del'>- * @start: offset of the bitmap item in the extent buffer</div><div class='del'>- * @pos: bit number of the first bit</div><div class='del'>- * @len: number of bits to set</div><div class='add'>+static u8 *extent_buffer_get_byte(const struct extent_buffer *eb, unsigned long bytenr)</div><div class='add'>+{</div><div class='add'>+	unsigned long index = get_eb_folio_index(eb, bytenr);</div><div class='add'>+</div><div class='add'>+	if (check_eb_range(eb, bytenr, 1))</div><div class='add'>+		return NULL;</div><div class='add'>+	return folio_address(eb-&gt;folios[index]) + get_eb_offset_in_folio(eb, bytenr);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Set an area of a bitmap to 1.</div><div class='add'>+ *</div><div class='add'>+ * @eb:     the extent buffer</div><div class='add'>+ * @start:  offset of the bitmap item in the extent buffer</div><div class='add'>+ * @pos:    bit number of the first bit</div><div class='add'>+ * @len:    number of bits to set</div><div class='ctx'>  */</div><div class='ctx'> void extent_buffer_bitmap_set(const struct extent_buffer *eb, unsigned long start,</div><div class='ctx'> 			      unsigned long pos, unsigned long len)</div><div class='ctx'> {</div><div class='add'>+	unsigned int first_byte = start + BIT_BYTE(pos);</div><div class='add'>+	unsigned int last_byte = start + BIT_BYTE(pos + len - 1);</div><div class='add'>+	const bool same_byte = (first_byte == last_byte);</div><div class='add'>+	u8 mask = BITMAP_FIRST_BYTE_MASK(pos);</div><div class='ctx'> 	u8 *kaddr;</div><div class='del'>-	struct page *page;</div><div class='del'>-	unsigned long i;</div><div class='del'>-	size_t offset;</div><div class='del'>-	const unsigned int size = pos + len;</div><div class='del'>-	int bits_to_set = BITS_PER_BYTE - (pos % BITS_PER_BYTE);</div><div class='del'>-	u8 mask_to_set = BITMAP_FIRST_BYTE_MASK(pos);</div><div class='del'>-</div><div class='del'>-	eb_bitmap_offset(eb, start, pos, &amp;i, &amp;offset);</div><div class='del'>-	page = eb-&gt;pages[i];</div><div class='del'>-	assert_eb_page_uptodate(eb, page);</div><div class='del'>-	kaddr = page_address(page);</div><div class='del'>-</div><div class='del'>-	while (len &gt;= bits_to_set) {</div><div class='del'>-		kaddr[offset] |= mask_to_set;</div><div class='del'>-		len -= bits_to_set;</div><div class='del'>-		bits_to_set = BITS_PER_BYTE;</div><div class='del'>-		mask_to_set = ~0;</div><div class='del'>-		if (++offset &gt;= PAGE_SIZE &amp;&amp; len &gt; 0) {</div><div class='del'>-			offset = 0;</div><div class='del'>-			page = eb-&gt;pages[++i];</div><div class='del'>-			assert_eb_page_uptodate(eb, page);</div><div class='del'>-			kaddr = page_address(page);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	if (len) {</div><div class='del'>-		mask_to_set &amp;= BITMAP_LAST_BYTE_MASK(size);</div><div class='del'>-		kaddr[offset] |= mask_to_set;</div><div class='del'>-	}</div><div class='add'>+</div><div class='add'>+	if (same_byte)</div><div class='add'>+		mask &amp;= BITMAP_LAST_BYTE_MASK(pos + len);</div><div class='add'>+</div><div class='add'>+	/* Handle the first byte. */</div><div class='add'>+	kaddr = extent_buffer_get_byte(eb, first_byte);</div><div class='add'>+	*kaddr |= mask;</div><div class='add'>+	if (same_byte)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/* Handle the byte aligned part. */</div><div class='add'>+	ASSERT(first_byte + 1 &lt;= last_byte);</div><div class='add'>+	memset_extent_buffer(eb, 0xff, first_byte + 1, last_byte - first_byte - 1);</div><div class='add'>+</div><div class='add'>+	/* Handle the last byte. */</div><div class='add'>+	kaddr = extent_buffer_get_byte(eb, last_byte);</div><div class='add'>+	*kaddr |= BITMAP_LAST_BYTE_MASK(pos + len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * extent_buffer_bitmap_clear - clear an area of a bitmap</div><div class='del'>- * @eb: the extent buffer</div><div class='del'>- * @start: offset of the bitmap item in the extent buffer</div><div class='del'>- * @pos: bit number of the first bit</div><div class='del'>- * @len: number of bits to clear</div><div class='add'>+/*</div><div class='add'>+ * Clear an area of a bitmap.</div><div class='add'>+ *</div><div class='add'>+ * @eb:     the extent buffer</div><div class='add'>+ * @start:  offset of the bitmap item in the extent buffer</div><div class='add'>+ * @pos:    bit number of the first bit</div><div class='add'>+ * @len:    number of bits to clear</div><div class='ctx'>  */</div><div class='ctx'> void extent_buffer_bitmap_clear(const struct extent_buffer *eb,</div><div class='ctx'> 				unsigned long start, unsigned long pos,</div><div class='ctx'> 				unsigned long len)</div><div class='ctx'> {</div><div class='add'>+	unsigned int first_byte = start + BIT_BYTE(pos);</div><div class='add'>+	unsigned int last_byte = start + BIT_BYTE(pos + len - 1);</div><div class='add'>+	const bool same_byte = (first_byte == last_byte);</div><div class='add'>+	u8 mask = BITMAP_FIRST_BYTE_MASK(pos);</div><div class='ctx'> 	u8 *kaddr;</div><div class='del'>-	struct page *page;</div><div class='del'>-	unsigned long i;</div><div class='del'>-	size_t offset;</div><div class='del'>-	const unsigned int size = pos + len;</div><div class='del'>-	int bits_to_clear = BITS_PER_BYTE - (pos % BITS_PER_BYTE);</div><div class='del'>-	u8 mask_to_clear = BITMAP_FIRST_BYTE_MASK(pos);</div><div class='del'>-</div><div class='del'>-	eb_bitmap_offset(eb, start, pos, &amp;i, &amp;offset);</div><div class='del'>-	page = eb-&gt;pages[i];</div><div class='del'>-	assert_eb_page_uptodate(eb, page);</div><div class='del'>-	kaddr = page_address(page);</div><div class='del'>-</div><div class='del'>-	while (len &gt;= bits_to_clear) {</div><div class='del'>-		kaddr[offset] &amp;= ~mask_to_clear;</div><div class='del'>-		len -= bits_to_clear;</div><div class='del'>-		bits_to_clear = BITS_PER_BYTE;</div><div class='del'>-		mask_to_clear = ~0;</div><div class='del'>-		if (++offset &gt;= PAGE_SIZE &amp;&amp; len &gt; 0) {</div><div class='del'>-			offset = 0;</div><div class='del'>-			page = eb-&gt;pages[++i];</div><div class='del'>-			assert_eb_page_uptodate(eb, page);</div><div class='del'>-			kaddr = page_address(page);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	if (len) {</div><div class='del'>-		mask_to_clear &amp;= BITMAP_LAST_BYTE_MASK(size);</div><div class='del'>-		kaddr[offset] &amp;= ~mask_to_clear;</div><div class='del'>-	}</div><div class='add'>+</div><div class='add'>+	if (same_byte)</div><div class='add'>+		mask &amp;= BITMAP_LAST_BYTE_MASK(pos + len);</div><div class='add'>+</div><div class='add'>+	/* Handle the first byte. */</div><div class='add'>+	kaddr = extent_buffer_get_byte(eb, first_byte);</div><div class='add'>+	*kaddr &amp;= ~mask;</div><div class='add'>+	if (same_byte)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/* Handle the byte aligned part. */</div><div class='add'>+	ASSERT(first_byte + 1 &lt;= last_byte);</div><div class='add'>+	memset_extent_buffer(eb, 0, first_byte + 1, last_byte - first_byte - 1);</div><div class='add'>+</div><div class='add'>+	/* Handle the last byte. */</div><div class='add'>+	kaddr = extent_buffer_get_byte(eb, last_byte);</div><div class='add'>+	*kaddr &amp;= ~BITMAP_LAST_BYTE_MASK(pos + len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline bool areas_overlap(unsigned long src, unsigned long dst, unsigned long len)</div><div class='hunk'>@@ -7139,60 +4357,40 @@ static inline bool areas_overlap(unsigned long src, unsigned long dst, unsigned</div><div class='ctx'> 	return distance &lt; len;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void copy_pages(struct page *dst_page, struct page *src_page,</div><div class='del'>-		       unsigned long dst_off, unsigned long src_off,</div><div class='del'>-		       unsigned long len)</div><div class='del'>-{</div><div class='del'>-	char *dst_kaddr = page_address(dst_page);</div><div class='del'>-	char *src_kaddr;</div><div class='del'>-	int must_memmove = 0;</div><div class='del'>-</div><div class='del'>-	if (dst_page != src_page) {</div><div class='del'>-		src_kaddr = page_address(src_page);</div><div class='del'>-	} else {</div><div class='del'>-		src_kaddr = dst_kaddr;</div><div class='del'>-		if (areas_overlap(src_off, dst_off, len))</div><div class='del'>-			must_memmove = 1;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (must_memmove)</div><div class='del'>-		memmove(dst_kaddr + dst_off, src_kaddr + src_off, len);</div><div class='del'>-	else</div><div class='del'>-		memcpy(dst_kaddr + dst_off, src_kaddr + src_off, len);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> void memcpy_extent_buffer(const struct extent_buffer *dst,</div><div class='ctx'> 			  unsigned long dst_offset, unsigned long src_offset,</div><div class='ctx'> 			  unsigned long len)</div><div class='ctx'> {</div><div class='del'>-	size_t cur;</div><div class='del'>-	size_t dst_off_in_page;</div><div class='del'>-	size_t src_off_in_page;</div><div class='del'>-	unsigned long dst_i;</div><div class='del'>-	unsigned long src_i;</div><div class='add'>+	const int unit_size = dst-&gt;folio_size;</div><div class='add'>+	unsigned long cur_off = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (check_eb_range(dst, dst_offset, len) ||</div><div class='ctx'> 	    check_eb_range(dst, src_offset, len))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	while (len &gt; 0) {</div><div class='del'>-		dst_off_in_page = get_eb_offset_in_page(dst, dst_offset);</div><div class='del'>-		src_off_in_page = get_eb_offset_in_page(dst, src_offset);</div><div class='del'>-</div><div class='del'>-		dst_i = get_eb_page_index(dst_offset);</div><div class='del'>-		src_i = get_eb_page_index(src_offset);</div><div class='add'>+	if (dst-&gt;addr) {</div><div class='add'>+		const bool use_memmove = areas_overlap(src_offset, dst_offset, len);</div><div class='ctx'> </div><div class='del'>-		cur = min(len, (unsigned long)(PAGE_SIZE -</div><div class='del'>-					       src_off_in_page));</div><div class='del'>-		cur = min_t(unsigned long, cur,</div><div class='del'>-			(unsigned long)(PAGE_SIZE - dst_off_in_page));</div><div class='add'>+		if (use_memmove)</div><div class='add'>+			memmove(dst-&gt;addr + dst_offset, dst-&gt;addr + src_offset, len);</div><div class='add'>+		else</div><div class='add'>+			memcpy(dst-&gt;addr + dst_offset, dst-&gt;addr + src_offset, len);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		copy_pages(dst-&gt;pages[dst_i], dst-&gt;pages[src_i],</div><div class='del'>-			   dst_off_in_page, src_off_in_page, cur);</div><div class='add'>+	while (cur_off &lt; len) {</div><div class='add'>+		unsigned long cur_src = cur_off + src_offset;</div><div class='add'>+		unsigned long folio_index = get_eb_folio_index(dst, cur_src);</div><div class='add'>+		unsigned long folio_off = get_eb_offset_in_folio(dst, cur_src);</div><div class='add'>+		unsigned long cur_len = min(src_offset + len - cur_src,</div><div class='add'>+					    unit_size - folio_off);</div><div class='add'>+		void *src_addr = folio_address(dst-&gt;folios[folio_index]) + folio_off;</div><div class='add'>+		const bool use_memmove = areas_overlap(src_offset + cur_off,</div><div class='add'>+						       dst_offset + cur_off, cur_len);</div><div class='ctx'> </div><div class='del'>-		src_offset += cur;</div><div class='del'>-		dst_offset += cur;</div><div class='del'>-		len -= cur;</div><div class='add'>+		__write_extent_buffer(dst, src_addr, dst_offset + cur_off, cur_len,</div><div class='add'>+				      use_memmove);</div><div class='add'>+		cur_off += cur_len;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -7200,33 +4398,46 @@ void memmove_extent_buffer(const struct extent_buffer *dst,</div><div class='ctx'> 			   unsigned long dst_offset, unsigned long src_offset,</div><div class='ctx'> 			   unsigned long len)</div><div class='ctx'> {</div><div class='del'>-	size_t cur;</div><div class='del'>-	size_t dst_off_in_page;</div><div class='del'>-	size_t src_off_in_page;</div><div class='ctx'> 	unsigned long dst_end = dst_offset + len - 1;</div><div class='ctx'> 	unsigned long src_end = src_offset + len - 1;</div><div class='del'>-	unsigned long dst_i;</div><div class='del'>-	unsigned long src_i;</div><div class='ctx'> </div><div class='ctx'> 	if (check_eb_range(dst, dst_offset, len) ||</div><div class='ctx'> 	    check_eb_range(dst, src_offset, len))</div><div class='ctx'> 		return;</div><div class='add'>+</div><div class='ctx'> 	if (dst_offset &lt; src_offset) {</div><div class='ctx'> 		memcpy_extent_buffer(dst, dst_offset, src_offset, len);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	if (dst-&gt;addr) {</div><div class='add'>+		memmove(dst-&gt;addr + dst_offset, dst-&gt;addr + src_offset, len);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	while (len &gt; 0) {</div><div class='del'>-		dst_i = get_eb_page_index(dst_end);</div><div class='del'>-		src_i = get_eb_page_index(src_end);</div><div class='add'>+		unsigned long src_i;</div><div class='add'>+		size_t cur;</div><div class='add'>+		size_t dst_off_in_folio;</div><div class='add'>+		size_t src_off_in_folio;</div><div class='add'>+		void *src_addr;</div><div class='add'>+		bool use_memmove;</div><div class='add'>+</div><div class='add'>+		src_i = get_eb_folio_index(dst, src_end);</div><div class='add'>+</div><div class='add'>+		dst_off_in_folio = get_eb_offset_in_folio(dst, dst_end);</div><div class='add'>+		src_off_in_folio = get_eb_offset_in_folio(dst, src_end);</div><div class='add'>+</div><div class='add'>+		cur = min_t(unsigned long, len, src_off_in_folio + 1);</div><div class='add'>+		cur = min(cur, dst_off_in_folio + 1);</div><div class='ctx'> </div><div class='del'>-		dst_off_in_page = get_eb_offset_in_page(dst, dst_end);</div><div class='del'>-		src_off_in_page = get_eb_offset_in_page(dst, src_end);</div><div class='add'>+		src_addr = folio_address(dst-&gt;folios[src_i]) + src_off_in_folio -</div><div class='add'>+					 cur + 1;</div><div class='add'>+		use_memmove = areas_overlap(src_end - cur + 1, dst_end - cur + 1,</div><div class='add'>+					    cur);</div><div class='ctx'> </div><div class='del'>-		cur = min_t(unsigned long, len, src_off_in_page + 1);</div><div class='del'>-		cur = min(cur, dst_off_in_page + 1);</div><div class='del'>-		copy_pages(dst-&gt;pages[dst_i], dst-&gt;pages[src_i],</div><div class='del'>-			   dst_off_in_page - cur + 1,</div><div class='del'>-			   src_off_in_page - cur + 1, cur);</div><div class='add'>+		__write_extent_buffer(dst, src_addr, dst_end - cur + 1, cur,</div><div class='add'>+				      use_memmove);</div><div class='ctx'> </div><div class='ctx'> 		dst_end -= cur;</div><div class='ctx'> 		src_end -= cur;</div><div class='hunk'>@@ -7234,82 +4445,29 @@ void memmove_extent_buffer(const struct extent_buffer *dst,</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#define GANG_LOOKUP_SIZE	16</div><div class='del'>-static struct extent_buffer *get_next_extent_buffer(</div><div class='del'>-		struct btrfs_fs_info *fs_info, struct page *page, u64 bytenr)</div><div class='del'>-{</div><div class='del'>-	struct extent_buffer *gang[GANG_LOOKUP_SIZE];</div><div class='del'>-	struct extent_buffer *found = NULL;</div><div class='del'>-	u64 page_start = page_offset(page);</div><div class='del'>-	u64 cur = page_start;</div><div class='del'>-</div><div class='del'>-	ASSERT(in_range(bytenr, page_start, PAGE_SIZE));</div><div class='del'>-	lockdep_assert_held(&amp;fs_info-&gt;buffer_lock);</div><div class='del'>-</div><div class='del'>-	while (cur &lt; page_start + PAGE_SIZE) {</div><div class='del'>-		int ret;</div><div class='del'>-		int i;</div><div class='del'>-</div><div class='del'>-		ret = radix_tree_gang_lookup(&amp;fs_info-&gt;buffer_radix,</div><div class='del'>-				(void **)gang, cur &gt;&gt; fs_info-&gt;sectorsize_bits,</div><div class='del'>-				min_t(unsigned int, GANG_LOOKUP_SIZE,</div><div class='del'>-				      PAGE_SIZE / fs_info-&gt;nodesize));</div><div class='del'>-		if (ret == 0)</div><div class='del'>-			goto out;</div><div class='del'>-		for (i = 0; i &lt; ret; i++) {</div><div class='del'>-			/* Already beyond page end */</div><div class='del'>-			if (gang[i]-&gt;start &gt;= page_start + PAGE_SIZE)</div><div class='del'>-				goto out;</div><div class='del'>-			/* Found one */</div><div class='del'>-			if (gang[i]-&gt;start &gt;= bytenr) {</div><div class='del'>-				found = gang[i];</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-		cur = gang[ret - 1]-&gt;start + gang[ret - 1]-&gt;len;</div><div class='del'>-	}</div><div class='del'>-out:</div><div class='del'>-	return found;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int try_release_subpage_extent_buffer(struct page *page)</div><div class='add'>+static int try_release_subpage_extent_buffer(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(page-&gt;mapping-&gt;host-&gt;i_sb);</div><div class='del'>-	u64 cur = page_offset(page);</div><div class='del'>-	const u64 end = page_offset(page) + PAGE_SIZE;</div><div class='add'>+	struct btrfs_fs_info *fs_info = folio_to_fs_info(folio);</div><div class='add'>+	struct extent_buffer *eb;</div><div class='add'>+	unsigned long start = (folio_pos(folio) &gt;&gt; fs_info-&gt;nodesize_bits);</div><div class='add'>+	unsigned long index = start;</div><div class='add'>+	unsigned long end = index + (PAGE_SIZE &gt;&gt; fs_info-&gt;nodesize_bits) - 1;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	while (cur &lt; end) {</div><div class='del'>-		struct extent_buffer *eb = NULL;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Unlike try_release_extent_buffer() which uses page-&gt;private</div><div class='del'>-		 * to grab buffer, for subpage case we rely on radix tree, thus</div><div class='del'>-		 * we need to ensure radix tree consistency.</div><div class='del'>-		 *</div><div class='del'>-		 * We also want an atomic snapshot of the radix tree, thus go</div><div class='del'>-		 * with spinlock rather than RCU.</div><div class='del'>-		 */</div><div class='del'>-		spin_lock(&amp;fs_info-&gt;buffer_lock);</div><div class='del'>-		eb = get_next_extent_buffer(fs_info, page, cur);</div><div class='del'>-		if (!eb) {</div><div class='del'>-			/* No more eb in the page range after or at cur */</div><div class='del'>-			spin_unlock(&amp;fs_info-&gt;buffer_lock);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		cur = eb-&gt;start + eb-&gt;len;</div><div class='del'>-</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	xa_for_each_range(&amp;fs_info-&gt;buffer_tree, index, eb, start, end) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * The same as try_release_extent_buffer(), to ensure the eb</div><div class='ctx'> 		 * won't disappear out from under us.</div><div class='ctx'> 		 */</div><div class='ctx'> 		spin_lock(&amp;eb-&gt;refs_lock);</div><div class='del'>-		if (atomic_read(&amp;eb-&gt;refs) != 1 || extent_buffer_under_io(eb)) {</div><div class='add'>+		rcu_read_unlock();</div><div class='add'>+</div><div class='add'>+		if (refcount_read(&amp;eb-&gt;refs) != 1 || extent_buffer_under_io(eb)) {</div><div class='ctx'> 			spin_unlock(&amp;eb-&gt;refs_lock);</div><div class='del'>-			spin_unlock(&amp;fs_info-&gt;buffer_lock);</div><div class='del'>-			break;</div><div class='add'>+			rcu_read_lock();</div><div class='add'>+			continue;</div><div class='ctx'> 		}</div><div class='del'>-		spin_unlock(&amp;fs_info-&gt;buffer_lock);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * If tree ref isn't set then we know the ref on this eb is a</div><div class='hunk'>@@ -7323,43 +4481,45 @@ static int try_release_subpage_extent_buffer(struct page *page)</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Here we don't care about the return value, we will always</div><div class='del'>-		 * check the page private at the end.  And</div><div class='add'>+		 * check the folio private at the end.  And</div><div class='ctx'> 		 * release_extent_buffer() will release the refs_lock.</div><div class='ctx'> 		 */</div><div class='ctx'> 		release_extent_buffer(eb);</div><div class='add'>+		rcu_read_lock();</div><div class='ctx'> 	}</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='del'>-	 * Finally to check if we have cleared page private, as if we have</div><div class='del'>-	 * released all ebs in the page, the page private should be cleared now.</div><div class='add'>+	 * Finally to check if we have cleared folio private, as if we have</div><div class='add'>+	 * released all ebs in the page, the folio private should be cleared now.</div><div class='ctx'> 	 */</div><div class='del'>-	spin_lock(&amp;page-&gt;mapping-&gt;private_lock);</div><div class='del'>-	if (!PagePrivate(page))</div><div class='add'>+	spin_lock(&amp;folio-&gt;mapping-&gt;i_private_lock);</div><div class='add'>+	if (!folio_test_private(folio))</div><div class='ctx'> 		ret = 1;</div><div class='ctx'> 	else</div><div class='ctx'> 		ret = 0;</div><div class='del'>-	spin_unlock(&amp;page-&gt;mapping-&gt;private_lock);</div><div class='add'>+	spin_unlock(&amp;folio-&gt;mapping-&gt;i_private_lock);</div><div class='ctx'> 	return ret;</div><div class='del'>-</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int try_release_extent_buffer(struct page *page)</div><div class='add'>+int try_release_extent_buffer(struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='ctx'> </div><div class='del'>-	if (btrfs_sb(page-&gt;mapping-&gt;host-&gt;i_sb)-&gt;sectorsize &lt; PAGE_SIZE)</div><div class='del'>-		return try_release_subpage_extent_buffer(page);</div><div class='add'>+	if (btrfs_meta_is_subpage(folio_to_fs_info(folio)))</div><div class='add'>+		return try_release_subpage_extent_buffer(folio);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * We need to make sure nobody is changing page-&gt;private, as we rely on</div><div class='del'>-	 * page-&gt;private as the pointer to extent buffer.</div><div class='add'>+	 * We need to make sure nobody is changing folio private, as we rely on</div><div class='add'>+	 * folio private as the pointer to extent buffer.</div><div class='ctx'> 	 */</div><div class='del'>-	spin_lock(&amp;page-&gt;mapping-&gt;private_lock);</div><div class='del'>-	if (!PagePrivate(page)) {</div><div class='del'>-		spin_unlock(&amp;page-&gt;mapping-&gt;private_lock);</div><div class='add'>+	spin_lock(&amp;folio-&gt;mapping-&gt;i_private_lock);</div><div class='add'>+	if (!folio_test_private(folio)) {</div><div class='add'>+		spin_unlock(&amp;folio-&gt;mapping-&gt;i_private_lock);</div><div class='ctx'> 		return 1;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	eb = (struct extent_buffer *)page-&gt;private;</div><div class='add'>+	eb = folio_get_private(folio);</div><div class='ctx'> 	BUG_ON(!eb);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -7368,12 +4528,12 @@ int try_release_extent_buffer(struct page *page)</div><div class='ctx'> 	 * this page.</div><div class='ctx'> 	 */</div><div class='ctx'> 	spin_lock(&amp;eb-&gt;refs_lock);</div><div class='del'>-	if (atomic_read(&amp;eb-&gt;refs) != 1 || extent_buffer_under_io(eb)) {</div><div class='add'>+	if (refcount_read(&amp;eb-&gt;refs) != 1 || extent_buffer_under_io(eb)) {</div><div class='ctx'> 		spin_unlock(&amp;eb-&gt;refs_lock);</div><div class='del'>-		spin_unlock(&amp;page-&gt;mapping-&gt;private_lock);</div><div class='add'>+		spin_unlock(&amp;folio-&gt;mapping-&gt;i_private_lock);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;page-&gt;mapping-&gt;private_lock);</div><div class='add'>+	spin_unlock(&amp;folio-&gt;mapping-&gt;i_private_lock);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If tree ref isn't set then we know the ref on this eb is a real ref,</div><div class='hunk'>@@ -7388,7 +4548,8 @@ int try_release_extent_buffer(struct page *page)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * btrfs_readahead_tree_block - attempt to readahead a child block</div><div class='add'>+ * Attempt to readahead a child block.</div><div class='add'>+ *</div><div class='ctx'>  * @fs_info:	the fs_info</div><div class='ctx'>  * @bytenr:	bytenr to read</div><div class='ctx'>  * @owner_root: objectid of the root that owns this eb</div><div class='hunk'>@@ -7402,6 +4563,10 @@ int try_release_extent_buffer(struct page *page)</div><div class='ctx'> void btrfs_readahead_tree_block(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				u64 bytenr, u64 owner_root, u64 gen, int level)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_tree_parent_check check = {</div><div class='add'>+		.level = level,</div><div class='add'>+		.transid = gen</div><div class='add'>+	};</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -7409,12 +4574,12 @@ void btrfs_readahead_tree_block(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	if (IS_ERR(eb))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	if (btrfs_buffer_uptodate(eb, gen, 1)) {</div><div class='add'>+	if (btrfs_buffer_uptodate(eb, gen, true)) {</div><div class='ctx'> 		free_extent_buffer(eb);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = read_extent_buffer_pages(eb, WAIT_NONE, 0);</div><div class='add'>+	ret = read_extent_buffer_pages_nowait(eb, 0, &amp;check);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		free_extent_buffer_stale(eb);</div><div class='ctx'> 	else</div><div class='hunk'>@@ -7422,7 +4587,8 @@ void btrfs_readahead_tree_block(struct btrfs_fs_info *fs_info,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * btrfs_readahead_node_child - readahead a node's child block</div><div class='add'>+ * Readahead a node's child block.</div><div class='add'>+ *</div><div class='ctx'>  * @node:	parent node we're reading from</div><div class='ctx'>  * @slot:	slot in the parent node for the child we want to read</div><div class='ctx'>  *</div><div class='head'>diff --git a/fs/btrfs/extent_io.h b/fs/btrfs/extent_io.h<br/>index 0399cf8e3c32..02ebb2f238af 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/extent_io.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/extent_io.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/extent_io.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/extent_io.h</a></div><div class='hunk'>@@ -7,48 +7,62 @@</div><div class='ctx'> #include &lt;linux/refcount.h&gt;</div><div class='ctx'> #include &lt;linux/fiemap.h&gt;</div><div class='ctx'> #include &lt;linux/btrfs_tree.h&gt;</div><div class='add'>+#include &lt;linux/spinlock.h&gt;</div><div class='add'>+#include &lt;linux/atomic.h&gt;</div><div class='add'>+#include &lt;linux/rwsem.h&gt;</div><div class='add'>+#include &lt;linux/list.h&gt;</div><div class='add'>+#include &lt;linux/slab.h&gt;</div><div class='add'>+#include "messages.h"</div><div class='ctx'> #include "ulist.h"</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * flags for bio submission. The high bits indicate the compression</div><div class='del'>- * type for this bio</div><div class='del'>- */</div><div class='del'>-#define EXTENT_BIO_COMPRESSED 1</div><div class='del'>-#define EXTENT_BIO_FLAG_SHIFT 16</div><div class='add'>+#include "misc.h"</div><div class='add'>+</div><div class='add'>+struct page;</div><div class='add'>+struct file;</div><div class='add'>+struct folio;</div><div class='add'>+struct inode;</div><div class='add'>+struct fiemap_extent_info;</div><div class='add'>+struct readahead_control;</div><div class='add'>+struct address_space;</div><div class='add'>+struct writeback_control;</div><div class='add'>+struct extent_io_tree;</div><div class='add'>+struct extent_map_tree;</div><div class='add'>+struct extent_state;</div><div class='add'>+struct btrfs_block_group;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+struct btrfs_inode;</div><div class='add'>+struct btrfs_root;</div><div class='add'>+struct btrfs_trans_handle;</div><div class='add'>+struct btrfs_tree_parent_check;</div><div class='ctx'> </div><div class='ctx'> enum {</div><div class='ctx'> 	EXTENT_BUFFER_UPTODATE,</div><div class='ctx'> 	EXTENT_BUFFER_DIRTY,</div><div class='del'>-	EXTENT_BUFFER_CORRUPT,</div><div class='del'>-	/* this got triggered by readahead */</div><div class='del'>-	EXTENT_BUFFER_READAHEAD,</div><div class='ctx'> 	EXTENT_BUFFER_TREE_REF,</div><div class='ctx'> 	EXTENT_BUFFER_STALE,</div><div class='ctx'> 	EXTENT_BUFFER_WRITEBACK,</div><div class='del'>-	/* read IO error */</div><div class='del'>-	EXTENT_BUFFER_READ_ERR,</div><div class='ctx'> 	EXTENT_BUFFER_UNMAPPED,</div><div class='del'>-	EXTENT_BUFFER_IN_TREE,</div><div class='ctx'> 	/* write IO error */</div><div class='ctx'> 	EXTENT_BUFFER_WRITE_ERR,</div><div class='del'>-	EXTENT_BUFFER_NO_CHECK,</div><div class='del'>-	EXTENT_BUFFER_ZONE_FINISH,</div><div class='add'>+	/* Indicate the extent buffer is written zeroed out (for zoned) */</div><div class='add'>+	EXTENT_BUFFER_ZONED_ZEROOUT,</div><div class='add'>+	/* Indicate that extent buffer pages a being read */</div><div class='add'>+	EXTENT_BUFFER_READING,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /* these are flags for __process_pages_contig */</div><div class='del'>-#define PAGE_UNLOCK		(1 &lt;&lt; 0)</div><div class='del'>-/* Page starts writeback, clear dirty bit and set writeback bit */</div><div class='del'>-#define PAGE_START_WRITEBACK	(1 &lt;&lt; 1)</div><div class='del'>-#define PAGE_END_WRITEBACK	(1 &lt;&lt; 2)</div><div class='del'>-#define PAGE_SET_ORDERED	(1 &lt;&lt; 3)</div><div class='del'>-#define PAGE_SET_ERROR		(1 &lt;&lt; 4)</div><div class='del'>-#define PAGE_LOCK		(1 &lt;&lt; 5)</div><div class='add'>+enum {</div><div class='add'>+	ENUM_BIT(PAGE_UNLOCK),</div><div class='add'>+	/* Page starts writeback, clear dirty bit and set writeback bit */</div><div class='add'>+	ENUM_BIT(PAGE_START_WRITEBACK),</div><div class='add'>+	ENUM_BIT(PAGE_END_WRITEBACK),</div><div class='add'>+	ENUM_BIT(PAGE_SET_ORDERED),</div><div class='add'>+};</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * page-&gt;private values.  Every page that is controlled by the extent</div><div class='del'>- * map has page-&gt;private set to one.</div><div class='add'>+ * Folio private values.  Every page that is controlled by the extent map has</div><div class='add'>+ * folio private set to this value.</div><div class='ctx'>  */</div><div class='del'>-#define EXTENT_PAGE_PRIVATE 1</div><div class='add'>+#define EXTENT_FOLIO_PRIVATE			1</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * The extent buffer bitmap operations are done with byte granularity instead of</div><div class='hunk'>@@ -58,67 +72,119 @@ enum {</div><div class='ctx'>  *    single word in a bitmap may straddle two pages in the extent buffer.</div><div class='ctx'>  */</div><div class='ctx'> #define BIT_BYTE(nr) ((nr) / BITS_PER_BYTE)</div><div class='del'>-#define BYTE_MASK ((1 &lt;&lt; BITS_PER_BYTE) - 1)</div><div class='add'>+#define BYTE_MASK ((1U &lt;&lt; BITS_PER_BYTE) - 1)</div><div class='ctx'> #define BITMAP_FIRST_BYTE_MASK(start) \</div><div class='ctx'> 	((BYTE_MASK &lt;&lt; ((start) &amp; (BITS_PER_BYTE - 1))) &amp; BYTE_MASK)</div><div class='ctx'> #define BITMAP_LAST_BYTE_MASK(nbits) \</div><div class='ctx'> 	(BYTE_MASK &gt;&gt; (-(nbits) &amp; (BITS_PER_BYTE - 1)))</div><div class='ctx'> </div><div class='del'>-struct btrfs_root;</div><div class='del'>-struct btrfs_inode;</div><div class='del'>-struct btrfs_io_bio;</div><div class='del'>-struct btrfs_fs_info;</div><div class='del'>-struct io_failure_record;</div><div class='del'>-struct extent_io_tree;</div><div class='del'>-</div><div class='del'>-typedef blk_status_t (submit_bio_hook_t)(struct inode *inode, struct bio *bio,</div><div class='del'>-					 int mirror_num,</div><div class='del'>-					 unsigned long bio_flags);</div><div class='ctx'> </div><div class='del'>-typedef blk_status_t (extent_submit_bio_start_t)(struct inode *inode,</div><div class='del'>-		struct bio *bio, u64 dio_file_offset);</div><div class='add'>+int __init extent_buffer_init_cachep(void);</div><div class='add'>+void __cold extent_buffer_free_cachep(void);</div><div class='ctx'> </div><div class='ctx'> #define INLINE_EXTENT_BUFFER_PAGES     (BTRFS_MAX_METADATA_BLOCKSIZE / PAGE_SIZE)</div><div class='ctx'> struct extent_buffer {</div><div class='ctx'> 	u64 start;</div><div class='del'>-	unsigned long len;</div><div class='add'>+	u32 len;</div><div class='add'>+	u32 folio_size;</div><div class='ctx'> 	unsigned long bflags;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The address where the eb can be accessed without any cross-page handling.</div><div class='add'>+	 * This can be NULL if not possible.</div><div class='add'>+	 */</div><div class='add'>+	void *addr;</div><div class='add'>+</div><div class='ctx'> 	spinlock_t refs_lock;</div><div class='del'>-	atomic_t refs;</div><div class='del'>-	atomic_t io_pages;</div><div class='add'>+	refcount_t refs;</div><div class='ctx'> 	int read_mirror;</div><div class='del'>-	struct rcu_head rcu_head;</div><div class='del'>-	pid_t lock_owner;</div><div class='ctx'> 	/* &gt;= 0 if eb belongs to a log tree, -1 otherwise */</div><div class='ctx'> 	s8 log_index;</div><div class='add'>+	u8 folio_shift;</div><div class='add'>+	struct rcu_head rcu_head;</div><div class='ctx'> </div><div class='ctx'> 	struct rw_semaphore lock;</div><div class='ctx'> </div><div class='del'>-	struct page *pages[INLINE_EXTENT_BUFFER_PAGES];</div><div class='del'>-	struct list_head release_list;</div><div class='add'>+	/*</div><div class='add'>+	 * Pointers to all the folios of the extent buffer.</div><div class='add'>+	 *</div><div class='add'>+	 * For now the folio is always order 0 (aka, a single page).</div><div class='add'>+	 */</div><div class='add'>+	struct folio *folios[INLINE_EXTENT_BUFFER_PAGES];</div><div class='ctx'> #ifdef CONFIG_BTRFS_DEBUG</div><div class='ctx'> 	struct list_head leak_list;</div><div class='add'>+	pid_t lock_owner;</div><div class='ctx'> #endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+struct btrfs_eb_write_context {</div><div class='add'>+	struct writeback_control *wbc;</div><div class='add'>+	struct extent_buffer *eb;</div><div class='add'>+	/* Block group @eb resides in. Only used for zoned mode. */</div><div class='add'>+	struct btrfs_block_group *zoned_bg;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static inline unsigned long offset_in_eb_folio(const struct extent_buffer *eb,</div><div class='add'>+					       u64 start)</div><div class='add'>+{</div><div class='add'>+	ASSERT(eb-&gt;folio_size);</div><div class='add'>+	return start &amp; (eb-&gt;folio_size - 1);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='del'>- * Structure to record info about the bio being assembled, and other info like</div><div class='del'>- * how many bytes are there before stripe/ordered extent boundary.</div><div class='add'>+ * Get the correct offset inside the page of extent buffer.</div><div class='add'>+ *</div><div class='add'>+ * @eb:		target extent buffer</div><div class='add'>+ * @start:	offset inside the extent buffer</div><div class='add'>+ *</div><div class='add'>+ * Will handle both sectorsize == PAGE_SIZE and sectorsize &lt; PAGE_SIZE cases.</div><div class='ctx'>  */</div><div class='del'>-struct btrfs_bio_ctrl {</div><div class='del'>-	struct bio *bio;</div><div class='del'>-	unsigned long bio_flags;</div><div class='del'>-	u32 len_to_stripe_boundary;</div><div class='del'>-	u32 len_to_oe_boundary;</div><div class='del'>-};</div><div class='add'>+static inline size_t get_eb_offset_in_folio(const struct extent_buffer *eb,</div><div class='add'>+					    unsigned long offset)</div><div class='add'>+{</div><div class='add'>+	/*</div><div class='add'>+	 * 1) sectorsize == PAGE_SIZE and nodesize &gt;= PAGE_SIZE case</div><div class='add'>+	 *    1.1) One large folio covering the whole eb</div><div class='add'>+	 *	   The eb-&gt;start is aligned to folio size, thus adding it</div><div class='add'>+	 *	   won't cause any difference.</div><div class='add'>+	 *    1.2) Several page sized folios</div><div class='add'>+	 *	   The eb-&gt;start is aligned to folio (page) size, thus</div><div class='add'>+	 *	   adding it won't cause any difference.</div><div class='add'>+	 *</div><div class='add'>+	 * 2) sectorsize &lt; PAGE_SIZE and nodesize &lt; PAGE_SIZE case</div><div class='add'>+	 *    In this case there would only be one page sized folio, and there</div><div class='add'>+	 *    may be several different extent buffers in the page/folio.</div><div class='add'>+	 *    We need to add eb-&gt;start to properly access the offset inside</div><div class='add'>+	 *    that eb.</div><div class='add'>+	 */</div><div class='add'>+	return offset_in_folio(eb-&gt;folios[0], offset + eb-&gt;start);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline unsigned long get_eb_folio_index(const struct extent_buffer *eb,</div><div class='add'>+					       unsigned long offset)</div><div class='add'>+{</div><div class='add'>+	/*</div><div class='add'>+	 * 1) sectorsize == PAGE_SIZE and nodesize &gt;= PAGE_SIZE case</div><div class='add'>+	 *    1.1) One large folio covering the whole eb.</div><div class='add'>+	 *	   the folio_shift would be large enough to always make us</div><div class='add'>+	 *	   return 0 as index.</div><div class='add'>+	 *    1.2) Several page sized folios</div><div class='add'>+	 *         The folio_shift would be PAGE_SHIFT, giving us the correct</div><div class='add'>+	 *         index.</div><div class='add'>+	 *</div><div class='add'>+	 * 2) sectorsize &lt; PAGE_SIZE and nodesize &lt; PAGE_SIZE case</div><div class='add'>+	 *    The folio would only be page sized, and always give us 0 as index.</div><div class='add'>+	 */</div><div class='add'>+	return offset &gt;&gt; eb-&gt;folio_shift;</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Structure to record how many bytes and which ranges are set/cleared</div><div class='ctx'>  */</div><div class='ctx'> struct extent_changeset {</div><div class='ctx'> 	/* How many bytes are set/cleared in this operation */</div><div class='del'>-	unsigned int bytes_changed;</div><div class='add'>+	u64 bytes_changed;</div><div class='ctx'> </div><div class='ctx'> 	/* Changed ranges */</div><div class='ctx'> 	struct ulist range_changed;</div><div class='hunk'>@@ -142,6 +208,11 @@ static inline struct extent_changeset *extent_changeset_alloc(void)</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline void extent_changeset_prealloc(struct extent_changeset *changeset, gfp_t gfp_mask)</div><div class='add'>+{</div><div class='add'>+	ulist_prealloc(&amp;changeset-&gt;range_changed, gfp_mask);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline void extent_changeset_release(struct extent_changeset *changeset)</div><div class='ctx'> {</div><div class='ctx'> 	if (!changeset)</div><div class='hunk'>@@ -158,47 +229,23 @@ static inline void extent_changeset_free(struct extent_changeset *changeset)</div><div class='ctx'> 	kfree(changeset);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void extent_set_compress_type(unsigned long *bio_flags,</div><div class='del'>-					    int compress_type)</div><div class='del'>-{</div><div class='del'>-	*bio_flags |= compress_type &lt;&lt; EXTENT_BIO_FLAG_SHIFT;</div><div class='del'>-}</div><div class='add'>+bool try_release_extent_mapping(struct folio *folio, gfp_t mask);</div><div class='add'>+int try_release_extent_buffer(struct folio *folio);</div><div class='ctx'> </div><div class='del'>-static inline int extent_compress_type(unsigned long bio_flags)</div><div class='del'>-{</div><div class='del'>-	return bio_flags &gt;&gt; EXTENT_BIO_FLAG_SHIFT;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct extent_map_tree;</div><div class='del'>-</div><div class='del'>-typedef struct extent_map *(get_extent_t)(struct btrfs_inode *inode,</div><div class='del'>-					  struct page *page, size_t pg_offset,</div><div class='del'>-					  u64 start, u64 len);</div><div class='del'>-</div><div class='del'>-int try_release_extent_mapping(struct page *page, gfp_t mask);</div><div class='del'>-int try_release_extent_buffer(struct page *page);</div><div class='del'>-</div><div class='del'>-int __must_check submit_one_bio(struct bio *bio, int mirror_num,</div><div class='del'>-				unsigned long bio_flags);</div><div class='del'>-int btrfs_do_readpage(struct page *page, struct extent_map **em_cached,</div><div class='del'>-		      struct btrfs_bio_ctrl *bio_ctrl,</div><div class='del'>-		      unsigned int read_flags, u64 *prev_em_start);</div><div class='del'>-int extent_write_full_page(struct page *page, struct writeback_control *wbc);</div><div class='del'>-int extent_write_locked_range(struct inode *inode, u64 start, u64 end);</div><div class='del'>-int extent_writepages(struct address_space *mapping,</div><div class='del'>-		      struct writeback_control *wbc);</div><div class='add'>+int btrfs_read_folio(struct file *file, struct folio *folio);</div><div class='add'>+void extent_write_locked_range(struct inode *inode, const struct folio *locked_folio,</div><div class='add'>+			       u64 start, u64 end, struct writeback_control *wbc,</div><div class='add'>+			       bool pages_dirty);</div><div class='add'>+int btrfs_writepages(struct address_space *mapping, struct writeback_control *wbc);</div><div class='ctx'> int btree_write_cache_pages(struct address_space *mapping,</div><div class='ctx'> 			    struct writeback_control *wbc);</div><div class='del'>-void extent_readahead(struct readahead_control *rac);</div><div class='del'>-int extent_fiemap(struct btrfs_inode *inode, struct fiemap_extent_info *fieinfo,</div><div class='del'>-		  u64 start, u64 len);</div><div class='del'>-int set_page_extent_mapped(struct page *page);</div><div class='del'>-void clear_page_extent_mapped(struct page *page);</div><div class='add'>+void btrfs_btree_wait_writeback_range(struct btrfs_fs_info *fs_info, u64 start, u64 end);</div><div class='add'>+void btrfs_readahead(struct readahead_control *rac);</div><div class='add'>+int set_folio_extent_mapped(struct folio *folio);</div><div class='add'>+void clear_folio_extent_mapped(struct folio *folio);</div><div class='ctx'> </div><div class='ctx'> struct extent_buffer *alloc_extent_buffer(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 					  u64 start, u64 owner_root, int level);</div><div class='del'>-struct extent_buffer *__alloc_dummy_extent_buffer(struct btrfs_fs_info *fs_info,</div><div class='del'>-						  u64 start, unsigned long len);</div><div class='ctx'> struct extent_buffer *alloc_dummy_extent_buffer(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 						u64 start);</div><div class='ctx'> struct extent_buffer *btrfs_clone_extent_buffer(const struct extent_buffer *src);</div><div class='hunk'>@@ -206,17 +253,23 @@ struct extent_buffer *find_extent_buffer(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 					 u64 start);</div><div class='ctx'> void free_extent_buffer(struct extent_buffer *eb);</div><div class='ctx'> void free_extent_buffer_stale(struct extent_buffer *eb);</div><div class='del'>-#define WAIT_NONE	0</div><div class='del'>-#define WAIT_COMPLETE	1</div><div class='del'>-#define WAIT_PAGE_LOCK	2</div><div class='del'>-int read_extent_buffer_pages(struct extent_buffer *eb, int wait,</div><div class='del'>-			     int mirror_num);</div><div class='del'>-void wait_on_extent_buffer_writeback(struct extent_buffer *eb);</div><div class='add'>+int read_extent_buffer_pages(struct extent_buffer *eb, int mirror_num,</div><div class='add'>+			     const struct btrfs_tree_parent_check *parent_check);</div><div class='add'>+int read_extent_buffer_pages_nowait(struct extent_buffer *eb, int mirror_num,</div><div class='add'>+				    const struct btrfs_tree_parent_check *parent_check);</div><div class='add'>+</div><div class='add'>+static inline void wait_on_extent_buffer_writeback(struct extent_buffer *eb)</div><div class='add'>+{</div><div class='add'>+	wait_on_bit_io(&amp;eb-&gt;bflags, EXTENT_BUFFER_WRITEBACK,</div><div class='add'>+		       TASK_UNINTERRUPTIBLE);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> void btrfs_readahead_tree_block(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				u64 bytenr, u64 owner_root, u64 gen, int level);</div><div class='ctx'> void btrfs_readahead_node_child(struct extent_buffer *node, int slot);</div><div class='ctx'> </div><div class='del'>-static inline int num_extent_pages(const struct extent_buffer *eb)</div><div class='add'>+/* Note: this can be used in for loops without caching the value in a variable. */</div><div class='add'>+static inline int __pure num_extent_pages(const struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * For sectorsize == PAGE_SIZE case, since nodesize is always aligned to</div><div class='hunk'>@@ -228,6 +281,24 @@ static inline int num_extent_pages(const struct extent_buffer *eb)</div><div class='ctx'> 	return (eb-&gt;len &gt;&gt; PAGE_SHIFT) ?: 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * This can only be determined at runtime by checking eb::folios[0].</div><div class='add'>+ *</div><div class='add'>+ * As we can have either one large folio covering the whole eb</div><div class='add'>+ * (either nodesize &lt;= PAGE_SIZE, or high order folio), or multiple</div><div class='add'>+ * single-paged folios.</div><div class='add'>+ *</div><div class='add'>+ * Note: this can be used in for loops without caching the value in a variable.</div><div class='add'>+ */</div><div class='add'>+static inline int __pure num_extent_folios(const struct extent_buffer *eb)</div><div class='add'>+{</div><div class='add'>+	if (!eb-&gt;folios[0])</div><div class='add'>+		return 0;</div><div class='add'>+	if (folio_order(eb-&gt;folios[0]))</div><div class='add'>+		return 1;</div><div class='add'>+	return num_extent_pages(eb);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline int extent_buffer_uptodate(const struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='ctx'> 	return test_bit(EXTENT_BUFFER_UPTODATE, &amp;eb-&gt;bflags);</div><div class='hunk'>@@ -241,11 +312,24 @@ void read_extent_buffer(const struct extent_buffer *eb, void *dst,</div><div class='ctx'> int read_extent_buffer_to_user_nofault(const struct extent_buffer *eb,</div><div class='ctx'> 				       void __user *dst, unsigned long start,</div><div class='ctx'> 				       unsigned long len);</div><div class='del'>-void write_extent_buffer_fsid(const struct extent_buffer *eb, const void *src);</div><div class='del'>-void write_extent_buffer_chunk_tree_uuid(const struct extent_buffer *eb,</div><div class='del'>-		const void *src);</div><div class='ctx'> void write_extent_buffer(const struct extent_buffer *eb, const void *src,</div><div class='ctx'> 			 unsigned long start, unsigned long len);</div><div class='add'>+</div><div class='add'>+static inline void write_extent_buffer_chunk_tree_uuid(</div><div class='add'>+		const struct extent_buffer *eb, const void *chunk_tree_uuid)</div><div class='add'>+{</div><div class='add'>+	write_extent_buffer(eb, chunk_tree_uuid,</div><div class='add'>+			    offsetof(struct btrfs_header, chunk_tree_uuid),</div><div class='add'>+			    BTRFS_FSID_SIZE);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void write_extent_buffer_fsid(const struct extent_buffer *eb,</div><div class='add'>+					    const void *fsid)</div><div class='add'>+{</div><div class='add'>+	write_extent_buffer(eb, fsid, offsetof(struct btrfs_header, fsid),</div><div class='add'>+			    BTRFS_FSID_SIZE);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> void copy_extent_buffer_full(const struct extent_buffer *dst,</div><div class='ctx'> 			     const struct extent_buffer *src);</div><div class='ctx'> void copy_extent_buffer(const struct extent_buffer *dst,</div><div class='hunk'>@@ -260,57 +344,33 @@ void memmove_extent_buffer(const struct extent_buffer *dst,</div><div class='ctx'> 			   unsigned long len);</div><div class='ctx'> void memzero_extent_buffer(const struct extent_buffer *eb, unsigned long start,</div><div class='ctx'> 			   unsigned long len);</div><div class='del'>-int extent_buffer_test_bit(const struct extent_buffer *eb, unsigned long start,</div><div class='del'>-			   unsigned long pos);</div><div class='add'>+bool extent_buffer_test_bit(const struct extent_buffer *eb, unsigned long start,</div><div class='add'>+			    unsigned long pos);</div><div class='ctx'> void extent_buffer_bitmap_set(const struct extent_buffer *eb, unsigned long start,</div><div class='ctx'> 			      unsigned long pos, unsigned long len);</div><div class='ctx'> void extent_buffer_bitmap_clear(const struct extent_buffer *eb,</div><div class='ctx'> 				unsigned long start, unsigned long pos,</div><div class='ctx'> 				unsigned long len);</div><div class='del'>-void clear_extent_buffer_dirty(const struct extent_buffer *eb);</div><div class='del'>-bool set_extent_buffer_dirty(struct extent_buffer *eb);</div><div class='add'>+void set_extent_buffer_dirty(struct extent_buffer *eb);</div><div class='ctx'> void set_extent_buffer_uptodate(struct extent_buffer *eb);</div><div class='ctx'> void clear_extent_buffer_uptodate(struct extent_buffer *eb);</div><div class='del'>-int extent_buffer_under_io(const struct extent_buffer *eb);</div><div class='del'>-void extent_range_clear_dirty_for_io(struct inode *inode, u64 start, u64 end);</div><div class='del'>-void extent_range_redirty_for_io(struct inode *inode, u64 start, u64 end);</div><div class='ctx'> void extent_clear_unlock_delalloc(struct btrfs_inode *inode, u64 start, u64 end,</div><div class='del'>-				  struct page *locked_page,</div><div class='add'>+				  const struct folio *locked_folio,</div><div class='add'>+				  struct extent_state **cached,</div><div class='ctx'> 				  u32 bits_to_clear, unsigned long page_ops);</div><div class='del'>-struct bio *btrfs_bio_alloc(unsigned int nr_iovecs);</div><div class='del'>-struct bio *btrfs_bio_clone(struct bio *bio);</div><div class='del'>-struct bio *btrfs_bio_clone_partial(struct bio *orig, u64 offset, u64 size);</div><div class='del'>-</div><div class='del'>-void end_extent_writepage(struct page *page, int err, u64 start, u64 end);</div><div class='del'>-int btrfs_repair_eb_io_failure(const struct extent_buffer *eb, int mirror_num);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * When IO fails, either with EIO or csum verification fails, we</div><div class='del'>- * try other mirrors that might have a good copy of the data.  This</div><div class='del'>- * io_failure_record is used to record state as we go through all the</div><div class='del'>- * mirrors.  If another mirror has good data, the sector is set up to date</div><div class='del'>- * and things continue.  If a good mirror can't be found, the original</div><div class='del'>- * bio end_io callback is called to indicate things have failed.</div><div class='del'>- */</div><div class='del'>-struct io_failure_record {</div><div class='del'>-	struct page *page;</div><div class='del'>-	u64 start;</div><div class='del'>-	u64 len;</div><div class='del'>-	u64 logical;</div><div class='del'>-	unsigned long bio_flags;</div><div class='del'>-	int this_mirror;</div><div class='del'>-	int failed_mirror;</div><div class='del'>-};</div><div class='add'>+int extent_invalidate_folio(struct extent_io_tree *tree,</div><div class='add'>+			    struct folio *folio, size_t offset);</div><div class='add'>+void btrfs_clear_buffer_dirty(struct btrfs_trans_handle *trans,</div><div class='add'>+			      struct extent_buffer *buf);</div><div class='ctx'> </div><div class='del'>-int btrfs_repair_one_sector(struct inode *inode,</div><div class='del'>-			    struct bio *failed_bio, u32 bio_offset,</div><div class='del'>-			    struct page *page, unsigned int pgoff,</div><div class='del'>-			    u64 start, int failed_mirror,</div><div class='del'>-			    submit_bio_hook_t *submit_bio_hook);</div><div class='add'>+int btrfs_alloc_page_array(unsigned int nr_pages, struct page **page_array,</div><div class='add'>+			   bool nofail);</div><div class='add'>+int btrfs_alloc_folio_array(unsigned int nr_folios, unsigned int order,</div><div class='add'>+			    struct folio **folio_array);</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_BTRFS_FS_RUN_SANITY_TESTS</div><div class='ctx'> bool find_lock_delalloc_range(struct inode *inode,</div><div class='del'>-			     struct page *locked_page, u64 *start,</div><div class='add'>+			      struct folio *locked_folio, u64 *start,</div><div class='ctx'> 			     u64 *end);</div><div class='ctx'> #endif</div><div class='ctx'> struct extent_buffer *alloc_test_extent_buffer(struct btrfs_fs_info *fs_info,</div><div class='head'>diff --git a/fs/btrfs/extent_map.c b/fs/btrfs/extent_map.c<br/>index 5a36add21305..7e38c23a0c1c 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/extent_map.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/extent_map.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/extent_map.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/extent_map.c</a></div><div class='hunk'>@@ -3,87 +3,73 @@</div><div class='ctx'> #include &lt;linux/err.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/spinlock.h&gt;</div><div class='add'>+#include "messages.h"</div><div class='ctx'> #include "ctree.h"</div><div class='del'>-#include "volumes.h"</div><div class='ctx'> #include "extent_map.h"</div><div class='ctx'> #include "compression.h"</div><div class='add'>+#include "btrfs_inode.h"</div><div class='add'>+#include "disk-io.h"</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> static struct kmem_cache *extent_map_cache;</div><div class='ctx'> </div><div class='del'>-int __init extent_map_init(void)</div><div class='add'>+int __init btrfs_extent_map_init(void)</div><div class='ctx'> {</div><div class='ctx'> 	extent_map_cache = kmem_cache_create("btrfs_extent_map",</div><div class='del'>-			sizeof(struct extent_map), 0,</div><div class='del'>-			SLAB_MEM_SPREAD, NULL);</div><div class='add'>+					     sizeof(struct extent_map), 0, 0, NULL);</div><div class='ctx'> 	if (!extent_map_cache)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void __cold extent_map_exit(void)</div><div class='add'>+void __cold btrfs_extent_map_exit(void)</div><div class='ctx'> {</div><div class='ctx'> 	kmem_cache_destroy(extent_map_cache);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * extent_map_tree_init - initialize extent map tree</div><div class='del'>- * @tree:		tree to initialize</div><div class='del'>- *</div><div class='del'>- * Initialize the extent tree @tree.  Should be called for each new inode</div><div class='del'>- * or other user of the extent_map interface.</div><div class='add'>+/*</div><div class='add'>+ * Initialize the extent tree @tree.  Should be called for each new inode or</div><div class='add'>+ * other user of the extent_map interface.</div><div class='ctx'>  */</div><div class='del'>-void extent_map_tree_init(struct extent_map_tree *tree)</div><div class='add'>+void btrfs_extent_map_tree_init(struct extent_map_tree *tree)</div><div class='ctx'> {</div><div class='del'>-	tree-&gt;map = RB_ROOT_CACHED;</div><div class='add'>+	tree-&gt;root = RB_ROOT;</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;tree-&gt;modified_extents);</div><div class='ctx'> 	rwlock_init(&amp;tree-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * alloc_extent_map - allocate new extent map structure</div><div class='del'>- *</div><div class='del'>- * Allocate a new extent_map structure.  The new structure is</div><div class='del'>- * returned with a reference count of one and needs to be</div><div class='del'>- * freed using free_extent_map()</div><div class='add'>+/*</div><div class='add'>+ * Allocate a new extent_map structure.  The new structure is returned with a</div><div class='add'>+ * reference count of one and needs to be freed using free_extent_map()</div><div class='ctx'>  */</div><div class='del'>-struct extent_map *alloc_extent_map(void)</div><div class='add'>+struct extent_map *btrfs_alloc_extent_map(void)</div><div class='ctx'> {</div><div class='ctx'> 	struct extent_map *em;</div><div class='ctx'> 	em = kmem_cache_zalloc(extent_map_cache, GFP_NOFS);</div><div class='ctx'> 	if (!em)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	RB_CLEAR_NODE(&amp;em-&gt;rb_node);</div><div class='del'>-	em-&gt;flags = 0;</div><div class='del'>-	em-&gt;compress_type = BTRFS_COMPRESS_NONE;</div><div class='del'>-	em-&gt;generation = 0;</div><div class='ctx'> 	refcount_set(&amp;em-&gt;refs, 1);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;em-&gt;list);</div><div class='ctx'> 	return em;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * free_extent_map - drop reference count of an extent_map</div><div class='del'>- * @em:		extent map being released</div><div class='del'>- *</div><div class='del'>- * Drops the reference out on @em by one and free the structure</div><div class='del'>- * if the reference count hits zero.</div><div class='add'>+/*</div><div class='add'>+ * Drop the reference out on @em by one and free the structure if the reference</div><div class='add'>+ * count hits zero.</div><div class='ctx'>  */</div><div class='del'>-void free_extent_map(struct extent_map *em)</div><div class='add'>+void btrfs_free_extent_map(struct extent_map *em)</div><div class='ctx'> {</div><div class='ctx'> 	if (!em)</div><div class='ctx'> 		return;</div><div class='del'>-	WARN_ON(refcount_read(&amp;em-&gt;refs) == 0);</div><div class='ctx'> 	if (refcount_dec_and_test(&amp;em-&gt;refs)) {</div><div class='del'>-		WARN_ON(extent_map_in_tree(em));</div><div class='add'>+		WARN_ON(btrfs_extent_map_in_tree(em));</div><div class='ctx'> 		WARN_ON(!list_empty(&amp;em-&gt;list));</div><div class='del'>-		if (test_bit(EXTENT_FLAG_FS_MAPPING, &amp;em-&gt;flags))</div><div class='del'>-			kfree(em-&gt;map_lookup);</div><div class='ctx'> 		kmem_cache_free(extent_map_cache, em);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* simple helper to do math around the end of an extent, handling wrap */</div><div class='add'>+/* Do the math around the end of an extent, handling wrapping. */</div><div class='ctx'> static u64 range_end(u64 start, u64 len)</div><div class='ctx'> {</div><div class='ctx'> 	if (start + len &lt; start)</div><div class='hunk'>@@ -91,36 +77,44 @@ static u64 range_end(u64 start, u64 len)</div><div class='ctx'> 	return start + len;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int tree_insert(struct rb_root_cached *root, struct extent_map *em)</div><div class='add'>+static void remove_em(struct btrfs_inode *inode, struct extent_map *em)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+</div><div class='add'>+	rb_erase(&amp;em-&gt;rb_node, &amp;inode-&gt;extent_tree.root);</div><div class='add'>+	RB_CLEAR_NODE(&amp;em-&gt;rb_node);</div><div class='add'>+</div><div class='add'>+	if (!btrfs_is_testing(fs_info) &amp;&amp; btrfs_is_fstree(btrfs_root_id(inode-&gt;root)))</div><div class='add'>+		percpu_counter_dec(&amp;fs_info-&gt;evictable_extent_maps);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int tree_insert(struct rb_root *root, struct extent_map *em)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node **p = &amp;root-&gt;rb_root.rb_node;</div><div class='add'>+	struct rb_node **p = &amp;root-&gt;rb_node;</div><div class='ctx'> 	struct rb_node *parent = NULL;</div><div class='ctx'> 	struct extent_map *entry = NULL;</div><div class='ctx'> 	struct rb_node *orig_parent = NULL;</div><div class='ctx'> 	u64 end = range_end(em-&gt;start, em-&gt;len);</div><div class='del'>-	bool leftmost = true;</div><div class='ctx'> </div><div class='ctx'> 	while (*p) {</div><div class='ctx'> 		parent = *p;</div><div class='ctx'> 		entry = rb_entry(parent, struct extent_map, rb_node);</div><div class='ctx'> </div><div class='del'>-		if (em-&gt;start &lt; entry-&gt;start) {</div><div class='add'>+		if (em-&gt;start &lt; entry-&gt;start)</div><div class='ctx'> 			p = &amp;(*p)-&gt;rb_left;</div><div class='del'>-		} else if (em-&gt;start &gt;= extent_map_end(entry)) {</div><div class='add'>+		else if (em-&gt;start &gt;= btrfs_extent_map_end(entry))</div><div class='ctx'> 			p = &amp;(*p)-&gt;rb_right;</div><div class='del'>-			leftmost = false;</div><div class='del'>-		} else {</div><div class='add'>+		else</div><div class='ctx'> 			return -EEXIST;</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	orig_parent = parent;</div><div class='del'>-	while (parent &amp;&amp; em-&gt;start &gt;= extent_map_end(entry)) {</div><div class='add'>+	while (parent &amp;&amp; em-&gt;start &gt;= btrfs_extent_map_end(entry)) {</div><div class='ctx'> 		parent = rb_next(parent);</div><div class='ctx'> 		entry = rb_entry(parent, struct extent_map, rb_node);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (parent)</div><div class='del'>-		if (end &gt; entry-&gt;start &amp;&amp; em-&gt;start &lt; extent_map_end(entry))</div><div class='add'>+		if (end &gt; entry-&gt;start &amp;&amp; em-&gt;start &lt; btrfs_extent_map_end(entry))</div><div class='ctx'> 			return -EEXIST;</div><div class='ctx'> </div><div class='ctx'> 	parent = orig_parent;</div><div class='hunk'>@@ -130,21 +124,20 @@ static int tree_insert(struct rb_root_cached *root, struct extent_map *em)</div><div class='ctx'> 		entry = rb_entry(parent, struct extent_map, rb_node);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (parent)</div><div class='del'>-		if (end &gt; entry-&gt;start &amp;&amp; em-&gt;start &lt; extent_map_end(entry))</div><div class='add'>+		if (end &gt; entry-&gt;start &amp;&amp; em-&gt;start &lt; btrfs_extent_map_end(entry))</div><div class='ctx'> 			return -EEXIST;</div><div class='ctx'> </div><div class='ctx'> 	rb_link_node(&amp;em-&gt;rb_node, orig_parent, p);</div><div class='del'>-	rb_insert_color_cached(&amp;em-&gt;rb_node, root, leftmost);</div><div class='add'>+	rb_insert_color(&amp;em-&gt;rb_node, root);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * search through the tree for an extent_map with a given offset.  If</div><div class='del'>- * it can't be found, try to find some neighboring extents</div><div class='add'>+ * Search through the tree for an extent_map with a given offset.  If it can't</div><div class='add'>+ * be found, try to find some neighboring extents</div><div class='ctx'>  */</div><div class='del'>-static struct rb_node *__tree_search(struct rb_root *root, u64 offset,</div><div class='del'>-				     struct rb_node **prev_ret,</div><div class='del'>-				     struct rb_node **next_ret)</div><div class='add'>+static struct rb_node *tree_search(struct rb_root *root, u64 offset,</div><div class='add'>+				   struct rb_node **prev_or_next_ret)</div><div class='ctx'> {</div><div class='ctx'> 	struct rb_node *n = root-&gt;rb_node;</div><div class='ctx'> 	struct rb_node *prev = NULL;</div><div class='hunk'>@@ -152,6 +145,8 @@ static struct rb_node *__tree_search(struct rb_root *root, u64 offset,</div><div class='ctx'> 	struct extent_map *entry;</div><div class='ctx'> 	struct extent_map *prev_entry = NULL;</div><div class='ctx'> </div><div class='add'>+	ASSERT(prev_or_next_ret);</div><div class='add'>+</div><div class='ctx'> 	while (n) {</div><div class='ctx'> 		entry = rb_entry(n, struct extent_map, rb_node);</div><div class='ctx'> 		prev = n;</div><div class='hunk'>@@ -159,81 +154,194 @@ static struct rb_node *__tree_search(struct rb_root *root, u64 offset,</div><div class='ctx'> </div><div class='ctx'> 		if (offset &lt; entry-&gt;start)</div><div class='ctx'> 			n = n-&gt;rb_left;</div><div class='del'>-		else if (offset &gt;= extent_map_end(entry))</div><div class='add'>+		else if (offset &gt;= btrfs_extent_map_end(entry))</div><div class='ctx'> 			n = n-&gt;rb_right;</div><div class='ctx'> 		else</div><div class='ctx'> 			return n;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (prev_ret) {</div><div class='del'>-		orig_prev = prev;</div><div class='del'>-		while (prev &amp;&amp; offset &gt;= extent_map_end(prev_entry)) {</div><div class='del'>-			prev = rb_next(prev);</div><div class='del'>-			prev_entry = rb_entry(prev, struct extent_map, rb_node);</div><div class='del'>-		}</div><div class='del'>-		*prev_ret = prev;</div><div class='del'>-		prev = orig_prev;</div><div class='add'>+	orig_prev = prev;</div><div class='add'>+	while (prev &amp;&amp; offset &gt;= btrfs_extent_map_end(prev_entry)) {</div><div class='add'>+		prev = rb_next(prev);</div><div class='add'>+		prev_entry = rb_entry(prev, struct extent_map, rb_node);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (next_ret) {</div><div class='add'>+	/*</div><div class='add'>+	 * Previous extent map found, return as in this case the caller does not</div><div class='add'>+	 * care about the next one.</div><div class='add'>+	 */</div><div class='add'>+	if (prev) {</div><div class='add'>+		*prev_or_next_ret = prev;</div><div class='add'>+		return NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	prev = orig_prev;</div><div class='add'>+	prev_entry = rb_entry(prev, struct extent_map, rb_node);</div><div class='add'>+	while (prev &amp;&amp; offset &lt; prev_entry-&gt;start) {</div><div class='add'>+		prev = rb_prev(prev);</div><div class='ctx'> 		prev_entry = rb_entry(prev, struct extent_map, rb_node);</div><div class='del'>-		while (prev &amp;&amp; offset &lt; prev_entry-&gt;start) {</div><div class='del'>-			prev = rb_prev(prev);</div><div class='del'>-			prev_entry = rb_entry(prev, struct extent_map, rb_node);</div><div class='del'>-		}</div><div class='del'>-		*next_ret = prev;</div><div class='ctx'> 	}</div><div class='add'>+	*prev_or_next_ret = prev;</div><div class='add'>+</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* check to see if two extent_map structs are adjacent and safe to merge */</div><div class='del'>-static int mergable_maps(struct extent_map *prev, struct extent_map *next)</div><div class='add'>+static inline u64 extent_map_block_len(const struct extent_map *em)</div><div class='ctx'> {</div><div class='del'>-	if (test_bit(EXTENT_FLAG_PINNED, &amp;prev-&gt;flags))</div><div class='del'>-		return 0;</div><div class='add'>+	if (btrfs_extent_map_is_compressed(em))</div><div class='add'>+		return em-&gt;disk_num_bytes;</div><div class='add'>+	return em-&gt;len;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * don't merge compressed extents, we need to know their</div><div class='del'>-	 * actual size</div><div class='del'>-	 */</div><div class='del'>-	if (test_bit(EXTENT_FLAG_COMPRESSED, &amp;prev-&gt;flags))</div><div class='del'>-		return 0;</div><div class='add'>+static inline u64 extent_map_block_end(const struct extent_map *em)</div><div class='add'>+{</div><div class='add'>+	const u64 block_start = btrfs_extent_map_block_start(em);</div><div class='add'>+	const u64 block_end = block_start + extent_map_block_len(em);</div><div class='ctx'> </div><div class='del'>-	if (test_bit(EXTENT_FLAG_LOGGING, &amp;prev-&gt;flags) ||</div><div class='del'>-	    test_bit(EXTENT_FLAG_LOGGING, &amp;next-&gt;flags))</div><div class='del'>-		return 0;</div><div class='add'>+	if (block_end &lt; block_start)</div><div class='add'>+		return (u64)-1;</div><div class='add'>+</div><div class='add'>+	return block_end;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool can_merge_extent_map(const struct extent_map *em)</div><div class='add'>+{</div><div class='add'>+	if (em-&gt;flags &amp; EXTENT_FLAG_PINNED)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/* Don't merge compressed extents, we need to know their actual size. */</div><div class='add'>+	if (btrfs_extent_map_is_compressed(em))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	if (em-&gt;flags &amp; EXTENT_FLAG_LOGGING)</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We don't want to merge stuff that hasn't been written to the log yet</div><div class='ctx'> 	 * since it may not reflect exactly what is on disk, and that would be</div><div class='ctx'> 	 * bad.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!list_empty(&amp;prev-&gt;list) || !list_empty(&amp;next-&gt;list))</div><div class='del'>-		return 0;</div><div class='add'>+	if (!list_empty(&amp;em-&gt;list))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Check to see if two extent_map structs are adjacent and safe to merge. */</div><div class='add'>+static bool mergeable_maps(const struct extent_map *prev, const struct extent_map *next)</div><div class='add'>+{</div><div class='add'>+	if (btrfs_extent_map_end(prev) != next-&gt;start)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The merged flag is not an on-disk flag, it just indicates we had the</div><div class='add'>+	 * extent maps of 2 (or more) adjacent extents merged, so factor it out.</div><div class='add'>+	 */</div><div class='add'>+	if ((prev-&gt;flags &amp; ~EXTENT_FLAG_MERGED) !=</div><div class='add'>+	    (next-&gt;flags &amp; ~EXTENT_FLAG_MERGED))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	if (next-&gt;disk_bytenr &lt; EXTENT_MAP_LAST_BYTE - 1)</div><div class='add'>+		return btrfs_extent_map_block_start(next) == extent_map_block_end(prev);</div><div class='add'>+</div><div class='add'>+	/* HOLES and INLINE extents. */</div><div class='add'>+	return next-&gt;disk_bytenr == prev-&gt;disk_bytenr;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Handle the on-disk data extents merge for @prev and @next.</div><div class='add'>+ *</div><div class='add'>+ * @prev:    left extent to merge</div><div class='add'>+ * @next:    right extent to merge</div><div class='add'>+ * @merged:  the extent we will not discard after the merge; updated with new values</div><div class='add'>+ *</div><div class='add'>+ * After this, one of the two extents is the new merged extent and the other is</div><div class='add'>+ * removed from the tree and likely freed. Note that @merged is one of @prev/@next</div><div class='add'>+ * so there is const/non-const aliasing occurring here.</div><div class='add'>+ *</div><div class='add'>+ * Only touches disk_bytenr/disk_num_bytes/offset/ram_bytes.</div><div class='add'>+ * For now only uncompressed regular extent can be merged.</div><div class='add'>+ */</div><div class='add'>+static void merge_ondisk_extents(const struct extent_map *prev, const struct extent_map *next,</div><div class='add'>+				 struct extent_map *merged)</div><div class='add'>+{</div><div class='add'>+	u64 new_disk_bytenr;</div><div class='add'>+	u64 new_disk_num_bytes;</div><div class='add'>+	u64 new_offset;</div><div class='ctx'> </div><div class='del'>-	ASSERT(next-&gt;block_start != EXTENT_MAP_DELALLOC &amp;&amp;</div><div class='del'>-	       prev-&gt;block_start != EXTENT_MAP_DELALLOC);</div><div class='del'>-</div><div class='del'>-	if (prev-&gt;map_lookup || next-&gt;map_lookup)</div><div class='del'>-		ASSERT(test_bit(EXTENT_FLAG_FS_MAPPING, &amp;prev-&gt;flags) &amp;&amp;</div><div class='del'>-		       test_bit(EXTENT_FLAG_FS_MAPPING, &amp;next-&gt;flags));</div><div class='del'>-</div><div class='del'>-	if (extent_map_end(prev) == next-&gt;start &amp;&amp;</div><div class='del'>-	    prev-&gt;flags == next-&gt;flags &amp;&amp;</div><div class='del'>-	    prev-&gt;map_lookup == next-&gt;map_lookup &amp;&amp;</div><div class='del'>-	    ((next-&gt;block_start == EXTENT_MAP_HOLE &amp;&amp;</div><div class='del'>-	      prev-&gt;block_start == EXTENT_MAP_HOLE) ||</div><div class='del'>-	     (next-&gt;block_start == EXTENT_MAP_INLINE &amp;&amp;</div><div class='del'>-	      prev-&gt;block_start == EXTENT_MAP_INLINE) ||</div><div class='del'>-	     (next-&gt;block_start &lt; EXTENT_MAP_LAST_BYTE - 1 &amp;&amp;</div><div class='del'>-	      next-&gt;block_start == extent_map_block_end(prev)))) {</div><div class='del'>-		return 1;</div><div class='add'>+	/* @prev and @next should not be compressed. */</div><div class='add'>+	ASSERT(!btrfs_extent_map_is_compressed(prev));</div><div class='add'>+	ASSERT(!btrfs_extent_map_is_compressed(next));</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * There are two different cases where @prev and @next can be merged.</div><div class='add'>+	 *</div><div class='add'>+	 * 1) They are referring to the same data extent:</div><div class='add'>+	 *</div><div class='add'>+	 * |&lt;----- data extent A -----&gt;|</div><div class='add'>+	 *    |&lt;- prev -&gt;|&lt;- next -&gt;|</div><div class='add'>+	 *</div><div class='add'>+	 * 2) They are referring to different data extents but still adjacent:</div><div class='add'>+	 *</div><div class='add'>+	 * |&lt;-- data extent A --&gt;|&lt;-- data extent B --&gt;|</div><div class='add'>+	 *            |&lt;- prev -&gt;|&lt;- next -&gt;|</div><div class='add'>+	 *</div><div class='add'>+	 * The calculation here always merges the data extents first, then updates</div><div class='add'>+	 * @offset using the new data extents.</div><div class='add'>+	 *</div><div class='add'>+	 * For case 1), the merged data extent would be the same.</div><div class='add'>+	 * For case 2), we just merge the two data extents into one.</div><div class='add'>+	 */</div><div class='add'>+	new_disk_bytenr = min(prev-&gt;disk_bytenr, next-&gt;disk_bytenr);</div><div class='add'>+	new_disk_num_bytes = max(prev-&gt;disk_bytenr + prev-&gt;disk_num_bytes,</div><div class='add'>+				 next-&gt;disk_bytenr + next-&gt;disk_num_bytes) -</div><div class='add'>+			     new_disk_bytenr;</div><div class='add'>+	new_offset = prev-&gt;disk_bytenr + prev-&gt;offset - new_disk_bytenr;</div><div class='add'>+</div><div class='add'>+	merged-&gt;disk_bytenr = new_disk_bytenr;</div><div class='add'>+	merged-&gt;disk_num_bytes = new_disk_num_bytes;</div><div class='add'>+	merged-&gt;ram_bytes = new_disk_num_bytes;</div><div class='add'>+	merged-&gt;offset = new_offset;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void dump_extent_map(struct btrfs_fs_info *fs_info, const char *prefix,</div><div class='add'>+			    struct extent_map *em)</div><div class='add'>+{</div><div class='add'>+	if (!IS_ENABLED(CONFIG_BTRFS_DEBUG))</div><div class='add'>+		return;</div><div class='add'>+	btrfs_crit(fs_info,</div><div class='add'>+"%s, start=%llu len=%llu disk_bytenr=%llu disk_num_bytes=%llu ram_bytes=%llu offset=%llu flags=0x%x",</div><div class='add'>+		prefix, em-&gt;start, em-&gt;len, em-&gt;disk_bytenr, em-&gt;disk_num_bytes,</div><div class='add'>+		em-&gt;ram_bytes, em-&gt;offset, em-&gt;flags);</div><div class='add'>+	ASSERT(0);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Internal sanity checks for btrfs debug builds. */</div><div class='add'>+static void validate_extent_map(struct btrfs_fs_info *fs_info, struct extent_map *em)</div><div class='add'>+{</div><div class='add'>+	if (!IS_ENABLED(CONFIG_BTRFS_DEBUG))</div><div class='add'>+		return;</div><div class='add'>+	if (em-&gt;disk_bytenr &lt; EXTENT_MAP_LAST_BYTE) {</div><div class='add'>+		if (em-&gt;disk_num_bytes == 0)</div><div class='add'>+			dump_extent_map(fs_info, "zero disk_num_bytes", em);</div><div class='add'>+		if (em-&gt;offset + em-&gt;len &gt; em-&gt;ram_bytes)</div><div class='add'>+			dump_extent_map(fs_info, "ram_bytes too small", em);</div><div class='add'>+		if (em-&gt;offset + em-&gt;len &gt; em-&gt;disk_num_bytes &amp;&amp;</div><div class='add'>+		    !btrfs_extent_map_is_compressed(em))</div><div class='add'>+			dump_extent_map(fs_info, "disk_num_bytes too small", em);</div><div class='add'>+		if (!btrfs_extent_map_is_compressed(em) &amp;&amp;</div><div class='add'>+		    em-&gt;ram_bytes != em-&gt;disk_num_bytes)</div><div class='add'>+			dump_extent_map(fs_info,</div><div class='add'>+		"ram_bytes mismatch with disk_num_bytes for non-compressed em",</div><div class='add'>+					em);</div><div class='add'>+	} else if (em-&gt;offset) {</div><div class='add'>+		dump_extent_map(fs_info, "non-zero offset for hole/inline", em);</div><div class='ctx'> 	}</div><div class='del'>-	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void try_merge_map(struct extent_map_tree *tree, struct extent_map *em)</div><div class='add'>+static void try_merge_map(struct btrfs_inode *inode, struct extent_map *em)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='ctx'> 	struct extent_map *merge = NULL;</div><div class='ctx'> 	struct rb_node *rb;</div><div class='ctx'> </div><div class='hunk'>@@ -248,43 +356,47 @@ static void try_merge_map(struct extent_map_tree *tree, struct extent_map *em)</div><div class='ctx'> 	if (refcount_read(&amp;em-&gt;refs) &gt; 2)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='add'>+	if (!can_merge_extent_map(em))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='ctx'> 	if (em-&gt;start != 0) {</div><div class='ctx'> 		rb = rb_prev(&amp;em-&gt;rb_node);</div><div class='del'>-		if (rb)</div><div class='del'>-			merge = rb_entry(rb, struct extent_map, rb_node);</div><div class='del'>-		if (rb &amp;&amp; mergable_maps(merge, em)) {</div><div class='add'>+		merge = rb_entry_safe(rb, struct extent_map, rb_node);</div><div class='add'>+</div><div class='add'>+		if (rb &amp;&amp; can_merge_extent_map(merge) &amp;&amp; mergeable_maps(merge, em)) {</div><div class='ctx'> 			em-&gt;start = merge-&gt;start;</div><div class='del'>-			em-&gt;orig_start = merge-&gt;orig_start;</div><div class='ctx'> 			em-&gt;len += merge-&gt;len;</div><div class='del'>-			em-&gt;block_len += merge-&gt;block_len;</div><div class='del'>-			em-&gt;block_start = merge-&gt;block_start;</div><div class='del'>-			em-&gt;mod_len = (em-&gt;mod_len + em-&gt;mod_start) - merge-&gt;mod_start;</div><div class='del'>-			em-&gt;mod_start = merge-&gt;mod_start;</div><div class='ctx'> 			em-&gt;generation = max(em-&gt;generation, merge-&gt;generation);</div><div class='ctx'> </div><div class='del'>-			rb_erase_cached(&amp;merge-&gt;rb_node, &amp;tree-&gt;map);</div><div class='del'>-			RB_CLEAR_NODE(&amp;merge-&gt;rb_node);</div><div class='del'>-			free_extent_map(merge);</div><div class='add'>+			if (em-&gt;disk_bytenr &lt; EXTENT_MAP_LAST_BYTE)</div><div class='add'>+				merge_ondisk_extents(merge, em, em);</div><div class='add'>+			em-&gt;flags |= EXTENT_FLAG_MERGED;</div><div class='add'>+</div><div class='add'>+			validate_extent_map(fs_info, em);</div><div class='add'>+			remove_em(inode, merge);</div><div class='add'>+			btrfs_free_extent_map(merge);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	rb = rb_next(&amp;em-&gt;rb_node);</div><div class='del'>-	if (rb)</div><div class='del'>-		merge = rb_entry(rb, struct extent_map, rb_node);</div><div class='del'>-	if (rb &amp;&amp; mergable_maps(em, merge)) {</div><div class='add'>+	merge = rb_entry_safe(rb, struct extent_map, rb_node);</div><div class='add'>+</div><div class='add'>+	if (rb &amp;&amp; can_merge_extent_map(merge) &amp;&amp; mergeable_maps(em, merge)) {</div><div class='ctx'> 		em-&gt;len += merge-&gt;len;</div><div class='del'>-		em-&gt;block_len += merge-&gt;block_len;</div><div class='del'>-		rb_erase_cached(&amp;merge-&gt;rb_node, &amp;tree-&gt;map);</div><div class='del'>-		RB_CLEAR_NODE(&amp;merge-&gt;rb_node);</div><div class='del'>-		em-&gt;mod_len = (merge-&gt;mod_start + merge-&gt;mod_len) - em-&gt;mod_start;</div><div class='add'>+		if (em-&gt;disk_bytenr &lt; EXTENT_MAP_LAST_BYTE)</div><div class='add'>+			merge_ondisk_extents(em, merge, em);</div><div class='add'>+		validate_extent_map(fs_info, em);</div><div class='ctx'> 		em-&gt;generation = max(em-&gt;generation, merge-&gt;generation);</div><div class='del'>-		free_extent_map(merge);</div><div class='add'>+		em-&gt;flags |= EXTENT_FLAG_MERGED;</div><div class='add'>+		remove_em(inode, merge);</div><div class='add'>+		btrfs_free_extent_map(merge);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * unpin_extent_cache - unpin an extent from the cache</div><div class='del'>- * @tree:	tree to unpin the extent in</div><div class='add'>+/*</div><div class='add'>+ * Unpin an extent from the cache.</div><div class='add'>+ *</div><div class='add'>+ * @inode:	the inode from which we are unpinning an extent range</div><div class='ctx'>  * @start:	logical offset in the file</div><div class='ctx'>  * @len:	length of the extent</div><div class='ctx'>  * @gen:	generation that this extent has been modified in</div><div class='hunk'>@@ -292,162 +404,138 @@ static void try_merge_map(struct extent_map_tree *tree, struct extent_map *em)</div><div class='ctx'>  * Called after an extent has been written to disk properly.  Set the generation</div><div class='ctx'>  * to the generation that actually added the file item to the inode so we know</div><div class='ctx'>  * we need to sync this extent when we call fsync().</div><div class='add'>+ *</div><div class='add'>+ * Returns: 0	     on success</div><div class='add'>+ * 	    -ENOENT  when the extent is not found in the tree</div><div class='add'>+ * 	    -EUCLEAN if the found extent does not match the expected start</div><div class='ctx'>  */</div><div class='del'>-int unpin_extent_cache(struct extent_map_tree *tree, u64 start, u64 len,</div><div class='del'>-		       u64 gen)</div><div class='add'>+int btrfs_unpin_extent_cache(struct btrfs_inode *inode, u64 start, u64 len, u64 gen)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	struct extent_map_tree *tree = &amp;inode-&gt;extent_tree;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	struct extent_map *em;</div><div class='del'>-	bool prealloc = false;</div><div class='ctx'> </div><div class='ctx'> 	write_lock(&amp;tree-&gt;lock);</div><div class='del'>-	em = lookup_extent_mapping(tree, start, len);</div><div class='del'>-</div><div class='del'>-	WARN_ON(!em || em-&gt;start != start);</div><div class='del'>-</div><div class='del'>-	if (!em)</div><div class='add'>+	em = btrfs_lookup_extent_mapping(tree, start, len);</div><div class='add'>+</div><div class='add'>+	if (WARN_ON(!em)) {</div><div class='add'>+		btrfs_warn(fs_info,</div><div class='add'>+"no extent map found for inode %llu (root %lld) when unpinning extent range [%llu, %llu), generation %llu",</div><div class='add'>+			   btrfs_ino(inode), btrfs_root_id(inode-&gt;root),</div><div class='add'>+			   start, start + len, gen);</div><div class='add'>+		ret = -ENOENT;</div><div class='ctx'> 		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	em-&gt;generation = gen;</div><div class='del'>-	clear_bit(EXTENT_FLAG_PINNED, &amp;em-&gt;flags);</div><div class='del'>-	em-&gt;mod_start = em-&gt;start;</div><div class='del'>-	em-&gt;mod_len = em-&gt;len;</div><div class='del'>-</div><div class='del'>-	if (test_bit(EXTENT_FLAG_FILLING, &amp;em-&gt;flags)) {</div><div class='del'>-		prealloc = true;</div><div class='del'>-		clear_bit(EXTENT_FLAG_FILLING, &amp;em-&gt;flags);</div><div class='add'>+	if (WARN_ON(em-&gt;start != start)) {</div><div class='add'>+		btrfs_warn(fs_info,</div><div class='add'>+"found extent map for inode %llu (root %lld) with unexpected start offset %llu when unpinning extent range [%llu, %llu), generation %llu",</div><div class='add'>+			   btrfs_ino(inode), btrfs_root_id(inode-&gt;root),</div><div class='add'>+			   em-&gt;start, start, start + len, gen);</div><div class='add'>+		ret = -EUCLEAN;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	try_merge_map(tree, em);</div><div class='add'>+	em-&gt;generation = gen;</div><div class='add'>+	em-&gt;flags &amp;= ~EXTENT_FLAG_PINNED;</div><div class='ctx'> </div><div class='del'>-	if (prealloc) {</div><div class='del'>-		em-&gt;mod_start = em-&gt;start;</div><div class='del'>-		em-&gt;mod_len = em-&gt;len;</div><div class='del'>-	}</div><div class='add'>+	try_merge_map(inode, em);</div><div class='ctx'> </div><div class='del'>-	free_extent_map(em);</div><div class='ctx'> out:</div><div class='ctx'> 	write_unlock(&amp;tree-&gt;lock);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> 	return ret;</div><div class='ctx'> </div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void clear_em_logging(struct extent_map_tree *tree, struct extent_map *em)</div><div class='add'>+void btrfs_clear_em_logging(struct btrfs_inode *inode, struct extent_map *em)</div><div class='ctx'> {</div><div class='del'>-	clear_bit(EXTENT_FLAG_LOGGING, &amp;em-&gt;flags);</div><div class='del'>-	if (extent_map_in_tree(em))</div><div class='del'>-		try_merge_map(tree, em);</div><div class='add'>+	lockdep_assert_held_write(&amp;inode-&gt;extent_tree.lock);</div><div class='add'>+</div><div class='add'>+	em-&gt;flags &amp;= ~EXTENT_FLAG_LOGGING;</div><div class='add'>+	if (btrfs_extent_map_in_tree(em))</div><div class='add'>+		try_merge_map(inode, em);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void setup_extent_mapping(struct extent_map_tree *tree,</div><div class='add'>+static inline void setup_extent_mapping(struct btrfs_inode *inode,</div><div class='ctx'> 					struct extent_map *em,</div><div class='del'>-					int modified)</div><div class='add'>+					bool modified)</div><div class='ctx'> {</div><div class='ctx'> 	refcount_inc(&amp;em-&gt;refs);</div><div class='del'>-	em-&gt;mod_start = em-&gt;start;</div><div class='del'>-	em-&gt;mod_len = em-&gt;len;</div><div class='add'>+</div><div class='add'>+	ASSERT(list_empty(&amp;em-&gt;list));</div><div class='ctx'> </div><div class='ctx'> 	if (modified)</div><div class='del'>-		list_move(&amp;em-&gt;list, &amp;tree-&gt;modified_extents);</div><div class='add'>+		list_add(&amp;em-&gt;list, &amp;inode-&gt;extent_tree.modified_extents);</div><div class='ctx'> 	else</div><div class='del'>-		try_merge_map(tree, em);</div><div class='add'>+		try_merge_map(inode, em);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void extent_map_device_set_bits(struct extent_map *em, unsigned bits)</div><div class='del'>-{</div><div class='del'>-	struct map_lookup *map = em-&gt;map_lookup;</div><div class='del'>-	u64 stripe_size = em-&gt;orig_block_len;</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; map-&gt;num_stripes; i++) {</div><div class='del'>-		struct btrfs_io_stripe *stripe = &amp;map-&gt;stripes[i];</div><div class='del'>-		struct btrfs_device *device = stripe-&gt;dev;</div><div class='del'>-</div><div class='del'>-		set_extent_bits_nowait(&amp;device-&gt;alloc_state, stripe-&gt;physical,</div><div class='del'>-				 stripe-&gt;physical + stripe_size - 1, bits);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void extent_map_device_clear_bits(struct extent_map *em, unsigned bits)</div><div class='del'>-{</div><div class='del'>-	struct map_lookup *map = em-&gt;map_lookup;</div><div class='del'>-	u64 stripe_size = em-&gt;orig_block_len;</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; map-&gt;num_stripes; i++) {</div><div class='del'>-		struct btrfs_io_stripe *stripe = &amp;map-&gt;stripes[i];</div><div class='del'>-		struct btrfs_device *device = stripe-&gt;dev;</div><div class='del'>-</div><div class='del'>-		__clear_extent_bit(&amp;device-&gt;alloc_state, stripe-&gt;physical,</div><div class='del'>-				   stripe-&gt;physical + stripe_size - 1, bits,</div><div class='del'>-				   0, 0, NULL, GFP_NOWAIT, NULL);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * Add new extent map to the extent tree</div><div class='add'>+/*</div><div class='add'>+ * Add a new extent map to an inode's extent map tree.</div><div class='ctx'>  *</div><div class='del'>- * @tree:	tree to insert new map in</div><div class='add'>+ * @inode:	the target inode</div><div class='ctx'>  * @em:		map to insert</div><div class='ctx'>  * @modified:	indicate whether the given @em should be added to the</div><div class='ctx'>  *	        modified list, which indicates the extent needs to be logged</div><div class='ctx'>  *</div><div class='del'>- * Insert @em into @tree or perform a simple forward/backward merge with</div><div class='del'>- * existing mappings.  The extent_map struct passed in will be inserted</div><div class='del'>- * into the tree directly, with an additional reference taken, or a</div><div class='del'>- * reference dropped if the merge attempt was successful.</div><div class='add'>+ * Insert @em into the @inode's extent map tree or perform a simple</div><div class='add'>+ * forward/backward merge with existing mappings.  The extent_map struct passed</div><div class='add'>+ * in will be inserted into the tree directly, with an additional reference</div><div class='add'>+ * taken, or a reference dropped if the merge attempt was successful.</div><div class='ctx'>  */</div><div class='del'>-int add_extent_mapping(struct extent_map_tree *tree,</div><div class='del'>-		       struct extent_map *em, int modified)</div><div class='add'>+static int add_extent_mapping(struct btrfs_inode *inode,</div><div class='add'>+			      struct extent_map *em, bool modified)</div><div class='ctx'> {</div><div class='del'>-	int ret = 0;</div><div class='add'>+	struct extent_map_tree *tree = &amp;inode-&gt;extent_tree;</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held_write(&amp;tree-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	ret = tree_insert(&amp;tree-&gt;map, em);</div><div class='add'>+	validate_extent_map(fs_info, em);</div><div class='add'>+	ret = tree_insert(&amp;tree-&gt;root, em);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	setup_extent_mapping(tree, em, modified);</div><div class='del'>-	if (test_bit(EXTENT_FLAG_FS_MAPPING, &amp;em-&gt;flags)) {</div><div class='del'>-		extent_map_device_set_bits(em, CHUNK_ALLOCATED);</div><div class='del'>-		extent_map_device_clear_bits(em, CHUNK_TRIMMED);</div><div class='del'>-	}</div><div class='del'>-out:</div><div class='del'>-	return ret;</div><div class='add'>+	setup_extent_mapping(inode, em, modified);</div><div class='add'>+</div><div class='add'>+	if (!btrfs_is_testing(fs_info) &amp;&amp; btrfs_is_fstree(btrfs_root_id(root)))</div><div class='add'>+		percpu_counter_inc(&amp;fs_info-&gt;evictable_extent_maps);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct extent_map *</div><div class='del'>-__lookup_extent_mapping(struct extent_map_tree *tree,</div><div class='del'>-			u64 start, u64 len, int strict)</div><div class='add'>+static struct extent_map *lookup_extent_mapping(struct extent_map_tree *tree,</div><div class='add'>+						u64 start, u64 len, bool strict)</div><div class='ctx'> {</div><div class='ctx'> 	struct extent_map *em;</div><div class='ctx'> 	struct rb_node *rb_node;</div><div class='del'>-	struct rb_node *prev = NULL;</div><div class='del'>-	struct rb_node *next = NULL;</div><div class='add'>+	struct rb_node *prev_or_next = NULL;</div><div class='ctx'> 	u64 end = range_end(start, len);</div><div class='ctx'> </div><div class='del'>-	rb_node = __tree_search(&amp;tree-&gt;map.rb_root, start, &amp;prev, &amp;next);</div><div class='add'>+	rb_node = tree_search(&amp;tree-&gt;root, start, &amp;prev_or_next);</div><div class='ctx'> 	if (!rb_node) {</div><div class='del'>-		if (prev)</div><div class='del'>-			rb_node = prev;</div><div class='del'>-		else if (next)</div><div class='del'>-			rb_node = next;</div><div class='add'>+		if (prev_or_next)</div><div class='add'>+			rb_node = prev_or_next;</div><div class='ctx'> 		else</div><div class='ctx'> 			return NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	em = rb_entry(rb_node, struct extent_map, rb_node);</div><div class='ctx'> </div><div class='del'>-	if (strict &amp;&amp; !(end &gt; em-&gt;start &amp;&amp; start &lt; extent_map_end(em)))</div><div class='add'>+	if (strict &amp;&amp; !(end &gt; em-&gt;start &amp;&amp; start &lt; btrfs_extent_map_end(em)))</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='ctx'> 	refcount_inc(&amp;em-&gt;refs);</div><div class='ctx'> 	return em;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * lookup_extent_mapping - lookup extent_map</div><div class='add'>+/*</div><div class='add'>+ * Lookup extent_map that intersects @start + @len range.</div><div class='add'>+ *</div><div class='ctx'>  * @tree:	tree to lookup in</div><div class='ctx'>  * @start:	byte offset to start the search</div><div class='ctx'>  * @len:	length of the lookup range</div><div class='hunk'>@@ -457,14 +545,15 @@ __lookup_extent_mapping(struct extent_map_tree *tree,</div><div class='ctx'>  * intersect, so check the object returned carefully to make sure that no</div><div class='ctx'>  * additional lookups are needed.</div><div class='ctx'>  */</div><div class='del'>-struct extent_map *lookup_extent_mapping(struct extent_map_tree *tree,</div><div class='del'>-					 u64 start, u64 len)</div><div class='add'>+struct extent_map *btrfs_lookup_extent_mapping(struct extent_map_tree *tree,</div><div class='add'>+					       u64 start, u64 len)</div><div class='ctx'> {</div><div class='del'>-	return __lookup_extent_mapping(tree, start, len, 1);</div><div class='add'>+	return lookup_extent_mapping(tree, start, len, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * search_extent_mapping - find a nearby extent map</div><div class='add'>+/*</div><div class='add'>+ * Find a nearby extent map intersecting @start + @len (not an exact search).</div><div class='add'>+ *</div><div class='ctx'>  * @tree:	tree to lookup in</div><div class='ctx'>  * @start:	byte offset to start the search</div><div class='ctx'>  * @len:	length of the lookup range</div><div class='hunk'>@@ -474,47 +563,57 @@ struct extent_map *lookup_extent_mapping(struct extent_map_tree *tree,</div><div class='ctx'>  *</div><div class='ctx'>  * If one can't be found, any nearby extent may be returned</div><div class='ctx'>  */</div><div class='del'>-struct extent_map *search_extent_mapping(struct extent_map_tree *tree,</div><div class='del'>-					 u64 start, u64 len)</div><div class='add'>+struct extent_map *btrfs_search_extent_mapping(struct extent_map_tree *tree,</div><div class='add'>+					       u64 start, u64 len)</div><div class='ctx'> {</div><div class='del'>-	return __lookup_extent_mapping(tree, start, len, 0);</div><div class='add'>+	return lookup_extent_mapping(tree, start, len, false);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * remove_extent_mapping - removes an extent_map from the extent tree</div><div class='del'>- * @tree:	extent tree to remove from</div><div class='add'>+/*</div><div class='add'>+ * Remove an extent_map from its inode's extent tree.</div><div class='add'>+ *</div><div class='add'>+ * @inode:	the inode the extent map belongs to</div><div class='ctx'>  * @em:		extent map being removed</div><div class='ctx'>  *</div><div class='del'>- * Removes @em from @tree.  No reference counts are dropped, and no checks</div><div class='del'>- * are done to see if the range is in use</div><div class='add'>+ * Remove @em from the extent tree of @inode.  No reference counts are dropped,</div><div class='add'>+ * and no checks are done to see if the range is in use.</div><div class='ctx'>  */</div><div class='del'>-void remove_extent_mapping(struct extent_map_tree *tree, struct extent_map *em)</div><div class='add'>+void btrfs_remove_extent_mapping(struct btrfs_inode *inode, struct extent_map *em)</div><div class='ctx'> {</div><div class='del'>-	WARN_ON(test_bit(EXTENT_FLAG_PINNED, &amp;em-&gt;flags));</div><div class='del'>-	rb_erase_cached(&amp;em-&gt;rb_node, &amp;tree-&gt;map);</div><div class='del'>-	if (!test_bit(EXTENT_FLAG_LOGGING, &amp;em-&gt;flags))</div><div class='add'>+	struct extent_map_tree *tree = &amp;inode-&gt;extent_tree;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held_write(&amp;tree-&gt;lock);</div><div class='add'>+</div><div class='add'>+	WARN_ON(em-&gt;flags &amp; EXTENT_FLAG_PINNED);</div><div class='add'>+	if (!(em-&gt;flags &amp; EXTENT_FLAG_LOGGING))</div><div class='ctx'> 		list_del_init(&amp;em-&gt;list);</div><div class='del'>-	if (test_bit(EXTENT_FLAG_FS_MAPPING, &amp;em-&gt;flags))</div><div class='del'>-		extent_map_device_clear_bits(em, CHUNK_ALLOCATED);</div><div class='del'>-	RB_CLEAR_NODE(&amp;em-&gt;rb_node);</div><div class='add'>+</div><div class='add'>+	remove_em(inode, em);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void replace_extent_mapping(struct extent_map_tree *tree,</div><div class='del'>-			    struct extent_map *cur,</div><div class='del'>-			    struct extent_map *new,</div><div class='del'>-			    int modified)</div><div class='add'>+static void replace_extent_mapping(struct btrfs_inode *inode,</div><div class='add'>+				   struct extent_map *cur,</div><div class='add'>+				   struct extent_map *new,</div><div class='add'>+				   bool modified)</div><div class='ctx'> {</div><div class='del'>-	WARN_ON(test_bit(EXTENT_FLAG_PINNED, &amp;cur-&gt;flags));</div><div class='del'>-	ASSERT(extent_map_in_tree(cur));</div><div class='del'>-	if (!test_bit(EXTENT_FLAG_LOGGING, &amp;cur-&gt;flags))</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	struct extent_map_tree *tree = &amp;inode-&gt;extent_tree;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held_write(&amp;tree-&gt;lock);</div><div class='add'>+</div><div class='add'>+	validate_extent_map(fs_info, new);</div><div class='add'>+</div><div class='add'>+	WARN_ON(cur-&gt;flags &amp; EXTENT_FLAG_PINNED);</div><div class='add'>+	ASSERT(btrfs_extent_map_in_tree(cur));</div><div class='add'>+	if (!(cur-&gt;flags &amp; EXTENT_FLAG_LOGGING))</div><div class='ctx'> 		list_del_init(&amp;cur-&gt;list);</div><div class='del'>-	rb_replace_node_cached(&amp;cur-&gt;rb_node, &amp;new-&gt;rb_node, &amp;tree-&gt;map);</div><div class='add'>+	rb_replace_node(&amp;cur-&gt;rb_node, &amp;new-&gt;rb_node, &amp;tree-&gt;root);</div><div class='ctx'> 	RB_CLEAR_NODE(&amp;cur-&gt;rb_node);</div><div class='ctx'> </div><div class='del'>-	setup_extent_mapping(tree, new, modified);</div><div class='add'>+	setup_extent_mapping(inode, new, modified);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct extent_map *next_extent_map(struct extent_map *em)</div><div class='add'>+static struct extent_map *next_extent_map(const struct extent_map *em)</div><div class='ctx'> {</div><div class='ctx'> 	struct rb_node *next;</div><div class='ctx'> </div><div class='hunk'>@@ -540,7 +639,7 @@ static struct extent_map *prev_extent_map(struct extent_map *em)</div><div class='ctx'>  * and an extent that you want to insert, deal with overlap and insert</div><div class='ctx'>  * the best fitted new extent into the tree.</div><div class='ctx'>  */</div><div class='del'>-static noinline int merge_extent_mapping(struct extent_map_tree *em_tree,</div><div class='add'>+static noinline int merge_extent_mapping(struct btrfs_inode *inode,</div><div class='ctx'> 					 struct extent_map *existing,</div><div class='ctx'> 					 struct extent_map *em,</div><div class='ctx'> 					 u64 map_start)</div><div class='hunk'>@@ -551,7 +650,8 @@ static noinline int merge_extent_mapping(struct extent_map_tree *em_tree,</div><div class='ctx'> 	u64 end;</div><div class='ctx'> 	u64 start_diff;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(map_start &lt; em-&gt;start || map_start &gt;= extent_map_end(em));</div><div class='add'>+	if (map_start &lt; em-&gt;start || map_start &gt;= btrfs_extent_map_end(em))</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	if (existing-&gt;start &gt; map_start) {</div><div class='ctx'> 		next = existing;</div><div class='hunk'>@@ -561,26 +661,22 @@ static noinline int merge_extent_mapping(struct extent_map_tree *em_tree,</div><div class='ctx'> 		next = next_extent_map(prev);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	start = prev ? extent_map_end(prev) : em-&gt;start;</div><div class='add'>+	start = prev ? btrfs_extent_map_end(prev) : em-&gt;start;</div><div class='ctx'> 	start = max_t(u64, start, em-&gt;start);</div><div class='del'>-	end = next ? next-&gt;start : extent_map_end(em);</div><div class='del'>-	end = min_t(u64, end, extent_map_end(em));</div><div class='add'>+	end = next ? next-&gt;start : btrfs_extent_map_end(em);</div><div class='add'>+	end = min_t(u64, end, btrfs_extent_map_end(em));</div><div class='ctx'> 	start_diff = start - em-&gt;start;</div><div class='ctx'> 	em-&gt;start = start;</div><div class='ctx'> 	em-&gt;len = end - start;</div><div class='del'>-	if (em-&gt;block_start &lt; EXTENT_MAP_LAST_BYTE &amp;&amp;</div><div class='del'>-	    !test_bit(EXTENT_FLAG_COMPRESSED, &amp;em-&gt;flags)) {</div><div class='del'>-		em-&gt;block_start += start_diff;</div><div class='del'>-		em-&gt;block_len = em-&gt;len;</div><div class='del'>-	}</div><div class='del'>-	return add_extent_mapping(em_tree, em, 0);</div><div class='add'>+	if (em-&gt;disk_bytenr &lt; EXTENT_MAP_LAST_BYTE)</div><div class='add'>+		em-&gt;offset += start_diff;</div><div class='add'>+	return add_extent_mapping(inode, em, false);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * Add extent mapping into em_tree</div><div class='add'>+/*</div><div class='add'>+ * Add extent mapping into an inode's extent map tree.</div><div class='ctx'>  *</div><div class='del'>- * @fs_info:  the filesystem</div><div class='del'>- * @em_tree:  extent tree into which we want to insert the extent mapping</div><div class='add'>+ * @inode:    target inode</div><div class='ctx'>  * @em_in:    extent we are inserting</div><div class='ctx'>  * @start:    start of the logical range btrfs_get_extent() is requesting</div><div class='ctx'>  * @len:      length of the logical range btrfs_get_extent() is requesting</div><div class='hunk'>@@ -588,8 +684,8 @@ static noinline int merge_extent_mapping(struct extent_map_tree *em_tree,</div><div class='ctx'>  * Note that @em_in's range may be different from [start, start+len),</div><div class='ctx'>  * but they must be overlapped.</div><div class='ctx'>  *</div><div class='del'>- * Insert @em_in into @em_tree. In case there is an overlapping range, handle</div><div class='del'>- * the -EEXIST by either:</div><div class='add'>+ * Insert @em_in into the inode's extent map tree. In case there is an</div><div class='add'>+ * overlapping range, handle the -EEXIST by either:</div><div class='ctx'>  * a) Returning the existing extent in @em_in if @start is within the</div><div class='ctx'>  *    existing em.</div><div class='ctx'>  * b) Merge the existing extent with @em_in passed in.</div><div class='hunk'>@@ -597,14 +693,21 @@ static noinline int merge_extent_mapping(struct extent_map_tree *em_tree,</div><div class='ctx'>  * Return 0 on success, otherwise -EEXIST.</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='del'>-int btrfs_add_extent_mapping(struct btrfs_fs_info *fs_info,</div><div class='del'>-			     struct extent_map_tree *em_tree,</div><div class='add'>+int btrfs_add_extent_mapping(struct btrfs_inode *inode,</div><div class='ctx'> 			     struct extent_map **em_in, u64 start, u64 len)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct extent_map *em = *em_in;</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='ctx'> </div><div class='del'>-	ret = add_extent_mapping(em_tree, em, 0);</div><div class='add'>+	/*</div><div class='add'>+	 * Tree-checker should have rejected any inline extent with non-zero</div><div class='add'>+	 * file offset. Here just do a sanity check.</div><div class='add'>+	 */</div><div class='add'>+	if (em-&gt;disk_bytenr == EXTENT_MAP_INLINE)</div><div class='add'>+		ASSERT(em-&gt;start == 0);</div><div class='add'>+</div><div class='add'>+	ret = add_extent_mapping(inode, em, false);</div><div class='ctx'> 	/* it is possible that someone inserted the extent into the tree</div><div class='ctx'> 	 * while we had the lock dropped.  It is also possible that</div><div class='ctx'> 	 * an overlapping map exists in the tree</div><div class='hunk'>@@ -612,9 +715,7 @@ int btrfs_add_extent_mapping(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	if (ret == -EEXIST) {</div><div class='ctx'> 		struct extent_map *existing;</div><div class='ctx'> </div><div class='del'>-		ret = 0;</div><div class='del'>-</div><div class='del'>-		existing = search_extent_mapping(em_tree, start, len);</div><div class='add'>+		existing = btrfs_search_extent_mapping(&amp;inode-&gt;extent_tree, start, len);</div><div class='ctx'> </div><div class='ctx'> 		trace_btrfs_handle_em_exist(fs_info, existing, em, start, len);</div><div class='ctx'> </div><div class='hunk'>@@ -623,8 +724,8 @@ int btrfs_add_extent_mapping(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		 * extent causing the -EEXIST.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (start &gt;= existing-&gt;start &amp;&amp;</div><div class='del'>-		    start &lt; extent_map_end(existing)) {</div><div class='del'>-			free_extent_map(em);</div><div class='add'>+		    start &lt; btrfs_extent_map_end(existing)) {</div><div class='add'>+			btrfs_free_extent_map(em);</div><div class='ctx'> 			*em_in = existing;</div><div class='ctx'> 			ret = 0;</div><div class='ctx'> 		} else {</div><div class='hunk'>@@ -635,20 +736,647 @@ int btrfs_add_extent_mapping(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			 * The existing extent map is the one nearest to</div><div class='ctx'> 			 * the [start, start + len) range which overlaps</div><div class='ctx'> 			 */</div><div class='del'>-			ret = merge_extent_mapping(em_tree, existing,</div><div class='del'>-						   em, start);</div><div class='del'>-			if (ret) {</div><div class='del'>-				free_extent_map(em);</div><div class='add'>+			ret = merge_extent_mapping(inode, existing, em, start);</div><div class='add'>+			if (WARN_ON(ret)) {</div><div class='add'>+				btrfs_free_extent_map(em);</div><div class='ctx'> 				*em_in = NULL;</div><div class='del'>-				WARN_ONCE(ret,</div><div class='del'>-"unexpected error %d: merge existing(start %llu len %llu) with em(start %llu len %llu)\n",</div><div class='del'>-					  ret, existing-&gt;start, existing-&gt;len,</div><div class='del'>-					  orig_start, orig_len);</div><div class='add'>+				btrfs_warn(fs_info,</div><div class='add'>+"extent map merge error existing [%llu, %llu) with em [%llu, %llu) start %llu",</div><div class='add'>+					   existing-&gt;start, btrfs_extent_map_end(existing),</div><div class='add'>+					   orig_start, orig_start + orig_len, start);</div><div class='ctx'> 			}</div><div class='del'>-			free_extent_map(existing);</div><div class='add'>+			btrfs_free_extent_map(existing);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ASSERT(ret == 0 || ret == -EEXIST);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Drop all extent maps from a tree in the fastest possible way, rescheduling</div><div class='add'>+ * if needed. This avoids searching the tree, from the root down to the first</div><div class='add'>+ * extent map, before each deletion.</div><div class='add'>+ */</div><div class='add'>+static void drop_all_extent_maps_fast(struct btrfs_inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct extent_map_tree *tree = &amp;inode-&gt;extent_tree;</div><div class='add'>+	struct rb_node *node;</div><div class='add'>+</div><div class='add'>+	write_lock(&amp;tree-&gt;lock);</div><div class='add'>+	node = rb_first(&amp;tree-&gt;root);</div><div class='add'>+	while (node) {</div><div class='add'>+		struct extent_map *em;</div><div class='add'>+		struct rb_node *next = rb_next(node);</div><div class='add'>+</div><div class='add'>+		em = rb_entry(node, struct extent_map, rb_node);</div><div class='add'>+		em-&gt;flags &amp;= ~(EXTENT_FLAG_PINNED | EXTENT_FLAG_LOGGING);</div><div class='add'>+		btrfs_remove_extent_mapping(inode, em);</div><div class='add'>+		btrfs_free_extent_map(em);</div><div class='add'>+</div><div class='add'>+		if (cond_resched_rwlock_write(&amp;tree-&gt;lock))</div><div class='add'>+			node = rb_first(&amp;tree-&gt;root);</div><div class='add'>+		else</div><div class='add'>+			node = next;</div><div class='add'>+	}</div><div class='add'>+	write_unlock(&amp;tree-&gt;lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Drop all extent maps in a given range.</div><div class='add'>+ *</div><div class='add'>+ * @inode:       The target inode.</div><div class='add'>+ * @start:       Start offset of the range.</div><div class='add'>+ * @end:         End offset of the range (inclusive value).</div><div class='add'>+ * @skip_pinned: Indicate if pinned extent maps should be ignored or not.</div><div class='add'>+ *</div><div class='add'>+ * This drops all the extent maps that intersect the given range [@start, @end].</div><div class='add'>+ * Extent maps that partially overlap the range and extend behind or beyond it,</div><div class='add'>+ * are split.</div><div class='add'>+ * The caller should have locked an appropriate file range in the inode's io</div><div class='add'>+ * tree before calling this function.</div><div class='add'>+ */</div><div class='add'>+void btrfs_drop_extent_map_range(struct btrfs_inode *inode, u64 start, u64 end,</div><div class='add'>+				 bool skip_pinned)</div><div class='add'>+{</div><div class='add'>+	struct extent_map *split;</div><div class='add'>+	struct extent_map *split2;</div><div class='add'>+	struct extent_map *em;</div><div class='add'>+	struct extent_map_tree *em_tree = &amp;inode-&gt;extent_tree;</div><div class='add'>+	u64 len = end - start + 1;</div><div class='add'>+</div><div class='add'>+	WARN_ON(end &lt; start);</div><div class='add'>+	if (end == (u64)-1) {</div><div class='add'>+		if (start == 0 &amp;&amp; !skip_pinned) {</div><div class='add'>+			drop_all_extent_maps_fast(inode);</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+		len = (u64)-1;</div><div class='add'>+	} else {</div><div class='add'>+		/* Make end offset exclusive for use in the loop below. */</div><div class='add'>+		end++;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * It's ok if we fail to allocate the extent maps, see the comment near</div><div class='add'>+	 * the bottom of the loop below. We only need two spare extent maps in</div><div class='add'>+	 * the worst case, where the first extent map that intersects our range</div><div class='add'>+	 * starts before the range and the last extent map that intersects our</div><div class='add'>+	 * range ends after our range (and they might be the same extent map),</div><div class='add'>+	 * because we need to split those two extent maps at the boundaries.</div><div class='add'>+	 */</div><div class='add'>+	split = btrfs_alloc_extent_map();</div><div class='add'>+	split2 = btrfs_alloc_extent_map();</div><div class='add'>+</div><div class='add'>+	write_lock(&amp;em_tree-&gt;lock);</div><div class='add'>+	em = btrfs_lookup_extent_mapping(em_tree, start, len);</div><div class='add'>+</div><div class='add'>+	while (em) {</div><div class='add'>+		/* extent_map_end() returns exclusive value (last byte + 1). */</div><div class='add'>+		const u64 em_end = btrfs_extent_map_end(em);</div><div class='add'>+		struct extent_map *next_em = NULL;</div><div class='add'>+		u64 gen;</div><div class='add'>+		unsigned long flags;</div><div class='add'>+		bool modified;</div><div class='add'>+</div><div class='add'>+		if (em_end &lt; end) {</div><div class='add'>+			next_em = next_extent_map(em);</div><div class='add'>+			if (next_em) {</div><div class='add'>+				if (next_em-&gt;start &lt; end)</div><div class='add'>+					refcount_inc(&amp;next_em-&gt;refs);</div><div class='add'>+				else</div><div class='add'>+					next_em = NULL;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (skip_pinned &amp;&amp; (em-&gt;flags &amp; EXTENT_FLAG_PINNED)) {</div><div class='add'>+			start = em_end;</div><div class='add'>+			goto next;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		flags = em-&gt;flags;</div><div class='add'>+		/*</div><div class='add'>+		 * In case we split the extent map, we want to preserve the</div><div class='add'>+		 * EXTENT_FLAG_LOGGING flag on our extent map, but we don't want</div><div class='add'>+		 * it on the new extent maps.</div><div class='add'>+		 */</div><div class='add'>+		em-&gt;flags &amp;= ~(EXTENT_FLAG_PINNED | EXTENT_FLAG_LOGGING);</div><div class='add'>+		modified = !list_empty(&amp;em-&gt;list);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * The extent map does not cross our target range, so no need to</div><div class='add'>+		 * split it, we can remove it directly.</div><div class='add'>+		 */</div><div class='add'>+		if (em-&gt;start &gt;= start &amp;&amp; em_end &lt;= end)</div><div class='add'>+			goto remove_em;</div><div class='add'>+</div><div class='add'>+		gen = em-&gt;generation;</div><div class='add'>+</div><div class='add'>+		if (em-&gt;start &lt; start) {</div><div class='add'>+			if (!split) {</div><div class='add'>+				split = split2;</div><div class='add'>+				split2 = NULL;</div><div class='add'>+				if (!split)</div><div class='add'>+					goto remove_em;</div><div class='add'>+			}</div><div class='add'>+			split-&gt;start = em-&gt;start;</div><div class='add'>+			split-&gt;len = start - em-&gt;start;</div><div class='add'>+</div><div class='add'>+			if (em-&gt;disk_bytenr &lt; EXTENT_MAP_LAST_BYTE) {</div><div class='add'>+				split-&gt;disk_bytenr = em-&gt;disk_bytenr;</div><div class='add'>+				split-&gt;disk_num_bytes = em-&gt;disk_num_bytes;</div><div class='add'>+				split-&gt;offset = em-&gt;offset;</div><div class='add'>+				split-&gt;ram_bytes = em-&gt;ram_bytes;</div><div class='add'>+			} else {</div><div class='add'>+				split-&gt;disk_bytenr = em-&gt;disk_bytenr;</div><div class='add'>+				split-&gt;disk_num_bytes = 0;</div><div class='add'>+				split-&gt;offset = 0;</div><div class='add'>+				split-&gt;ram_bytes = split-&gt;len;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			split-&gt;generation = gen;</div><div class='add'>+			split-&gt;flags = flags;</div><div class='add'>+			replace_extent_mapping(inode, em, split, modified);</div><div class='add'>+			btrfs_free_extent_map(split);</div><div class='add'>+			split = split2;</div><div class='add'>+			split2 = NULL;</div><div class='add'>+		}</div><div class='add'>+		if (em_end &gt; end) {</div><div class='add'>+			if (!split) {</div><div class='add'>+				split = split2;</div><div class='add'>+				split2 = NULL;</div><div class='add'>+				if (!split)</div><div class='add'>+					goto remove_em;</div><div class='add'>+			}</div><div class='add'>+			split-&gt;start = end;</div><div class='add'>+			split-&gt;len = em_end - end;</div><div class='add'>+			split-&gt;disk_bytenr = em-&gt;disk_bytenr;</div><div class='add'>+			split-&gt;flags = flags;</div><div class='add'>+			split-&gt;generation = gen;</div><div class='add'>+</div><div class='add'>+			if (em-&gt;disk_bytenr &lt; EXTENT_MAP_LAST_BYTE) {</div><div class='add'>+				split-&gt;disk_num_bytes = em-&gt;disk_num_bytes;</div><div class='add'>+				split-&gt;offset = em-&gt;offset + end - em-&gt;start;</div><div class='add'>+				split-&gt;ram_bytes = em-&gt;ram_bytes;</div><div class='add'>+			} else {</div><div class='add'>+				split-&gt;disk_num_bytes = 0;</div><div class='add'>+				split-&gt;offset = 0;</div><div class='add'>+				split-&gt;ram_bytes = split-&gt;len;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			if (btrfs_extent_map_in_tree(em)) {</div><div class='add'>+				replace_extent_mapping(inode, em, split, modified);</div><div class='add'>+			} else {</div><div class='add'>+				int ret;</div><div class='add'>+</div><div class='add'>+				ret = add_extent_mapping(inode, split, modified);</div><div class='add'>+				/* Logic error, shouldn't happen. */</div><div class='add'>+				ASSERT(ret == 0);</div><div class='add'>+				if (WARN_ON(ret != 0) &amp;&amp; modified)</div><div class='add'>+					btrfs_set_inode_full_sync(inode);</div><div class='add'>+			}</div><div class='add'>+			btrfs_free_extent_map(split);</div><div class='add'>+			split = NULL;</div><div class='add'>+		}</div><div class='add'>+remove_em:</div><div class='add'>+		if (btrfs_extent_map_in_tree(em)) {</div><div class='add'>+			/*</div><div class='add'>+			 * If the extent map is still in the tree it means that</div><div class='add'>+			 * either of the following is true:</div><div class='add'>+			 *</div><div class='add'>+			 * 1) It fits entirely in our range (doesn't end beyond</div><div class='add'>+			 *    it or starts before it);</div><div class='add'>+			 *</div><div class='add'>+			 * 2) It starts before our range and/or ends after our</div><div class='add'>+			 *    range, and we were not able to allocate the extent</div><div class='add'>+			 *    maps for split operations, @split and @split2.</div><div class='add'>+			 *</div><div class='add'>+			 * If we are at case 2) then we just remove the entire</div><div class='add'>+			 * extent map - this is fine since if anyone needs it to</div><div class='add'>+			 * access the subranges outside our range, will just</div><div class='add'>+			 * load it again from the subvolume tree's file extent</div><div class='add'>+			 * item. However if the extent map was in the list of</div><div class='add'>+			 * modified extents, then we must mark the inode for a</div><div class='add'>+			 * full fsync, otherwise a fast fsync will miss this</div><div class='add'>+			 * extent if it's new and needs to be logged.</div><div class='add'>+			 */</div><div class='add'>+			if ((em-&gt;start &lt; start || em_end &gt; end) &amp;&amp; modified) {</div><div class='add'>+				ASSERT(!split);</div><div class='add'>+				btrfs_set_inode_full_sync(inode);</div><div class='add'>+			}</div><div class='add'>+			btrfs_remove_extent_mapping(inode, em);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Once for the tree reference (we replaced or removed the</div><div class='add'>+		 * extent map from the tree).</div><div class='add'>+		 */</div><div class='add'>+		btrfs_free_extent_map(em);</div><div class='add'>+next:</div><div class='add'>+		/* Once for us (for our lookup reference). */</div><div class='add'>+		btrfs_free_extent_map(em);</div><div class='add'>+</div><div class='add'>+		em = next_em;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	write_unlock(&amp;em_tree-&gt;lock);</div><div class='add'>+</div><div class='add'>+	btrfs_free_extent_map(split);</div><div class='add'>+	btrfs_free_extent_map(split2);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Replace a range in the inode's extent map tree with a new extent map.</div><div class='add'>+ *</div><div class='add'>+ * @inode:      The target inode.</div><div class='add'>+ * @new_em:     The new extent map to add to the inode's extent map tree.</div><div class='add'>+ * @modified:   Indicate if the new extent map should be added to the list of</div><div class='add'>+ *              modified extents (for fast fsync tracking).</div><div class='add'>+ *</div><div class='add'>+ * Drops all the extent maps in the inode's extent map tree that intersect the</div><div class='add'>+ * range of the new extent map and adds the new extent map to the tree.</div><div class='add'>+ * The caller should have locked an appropriate file range in the inode's io</div><div class='add'>+ * tree before calling this function.</div><div class='add'>+ */</div><div class='add'>+int btrfs_replace_extent_map_range(struct btrfs_inode *inode,</div><div class='add'>+				   struct extent_map *new_em,</div><div class='add'>+				   bool modified)</div><div class='add'>+{</div><div class='add'>+	const u64 end = new_em-&gt;start + new_em-&gt;len - 1;</div><div class='add'>+	struct extent_map_tree *tree = &amp;inode-&gt;extent_tree;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ASSERT(!btrfs_extent_map_in_tree(new_em));</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The caller has locked an appropriate file range in the inode's io</div><div class='add'>+	 * tree, but getting -EEXIST when adding the new extent map can still</div><div class='add'>+	 * happen in case there are extents that partially cover the range, and</div><div class='add'>+	 * this is due to two tasks operating on different parts of the extent.</div><div class='add'>+	 * See commit 18e83ac75bfe67 ("Btrfs: fix unexpected EEXIST from</div><div class='add'>+	 * btrfs_get_extent") for an example and details.</div><div class='add'>+	 */</div><div class='add'>+	do {</div><div class='add'>+		btrfs_drop_extent_map_range(inode, new_em-&gt;start, end, false);</div><div class='add'>+		write_lock(&amp;tree-&gt;lock);</div><div class='add'>+		ret = add_extent_mapping(inode, new_em, modified);</div><div class='add'>+		write_unlock(&amp;tree-&gt;lock);</div><div class='add'>+	} while (ret == -EEXIST);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Split off the first pre bytes from the extent_map at [start, start + len],</div><div class='add'>+ * and set the block_start for it to new_logical.</div><div class='add'>+ *</div><div class='add'>+ * This function is used when an ordered_extent needs to be split.</div><div class='add'>+ */</div><div class='add'>+int btrfs_split_extent_map(struct btrfs_inode *inode, u64 start, u64 len, u64 pre,</div><div class='add'>+			   u64 new_logical)</div><div class='add'>+{</div><div class='add'>+	struct extent_map_tree *em_tree = &amp;inode-&gt;extent_tree;</div><div class='add'>+	struct extent_map *em;</div><div class='add'>+	struct extent_map *split_pre = NULL;</div><div class='add'>+	struct extent_map *split_mid = NULL;</div><div class='add'>+	int ret = 0;</div><div class='add'>+	unsigned long flags;</div><div class='add'>+</div><div class='add'>+	ASSERT(pre != 0);</div><div class='add'>+	ASSERT(pre &lt; len);</div><div class='add'>+</div><div class='add'>+	split_pre = btrfs_alloc_extent_map();</div><div class='add'>+	if (!split_pre)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	split_mid = btrfs_alloc_extent_map();</div><div class='add'>+	if (!split_mid) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out_free_pre;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	btrfs_lock_extent(&amp;inode-&gt;io_tree, start, start + len - 1, NULL);</div><div class='add'>+	write_lock(&amp;em_tree-&gt;lock);</div><div class='add'>+	em = btrfs_lookup_extent_mapping(em_tree, start, len);</div><div class='add'>+	if (unlikely(!em)) {</div><div class='add'>+		ret = -EIO;</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ASSERT(em-&gt;len == len);</div><div class='add'>+	ASSERT(!btrfs_extent_map_is_compressed(em));</div><div class='add'>+	ASSERT(em-&gt;disk_bytenr &lt; EXTENT_MAP_LAST_BYTE);</div><div class='add'>+	ASSERT(em-&gt;flags &amp; EXTENT_FLAG_PINNED);</div><div class='add'>+	ASSERT(!(em-&gt;flags &amp; EXTENT_FLAG_LOGGING));</div><div class='add'>+	ASSERT(!list_empty(&amp;em-&gt;list));</div><div class='add'>+</div><div class='add'>+	flags = em-&gt;flags;</div><div class='add'>+	em-&gt;flags &amp;= ~EXTENT_FLAG_PINNED;</div><div class='add'>+</div><div class='add'>+	/* First, replace the em with a new extent_map starting from * em-&gt;start */</div><div class='add'>+	split_pre-&gt;start = em-&gt;start;</div><div class='add'>+	split_pre-&gt;len = pre;</div><div class='add'>+	split_pre-&gt;disk_bytenr = new_logical;</div><div class='add'>+	split_pre-&gt;disk_num_bytes = split_pre-&gt;len;</div><div class='add'>+	split_pre-&gt;offset = 0;</div><div class='add'>+	split_pre-&gt;ram_bytes = split_pre-&gt;len;</div><div class='add'>+	split_pre-&gt;flags = flags;</div><div class='add'>+	split_pre-&gt;generation = em-&gt;generation;</div><div class='add'>+</div><div class='add'>+	replace_extent_mapping(inode, em, split_pre, true);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Now we only have an extent_map at:</div><div class='add'>+	 *     [em-&gt;start, em-&gt;start + pre]</div><div class='add'>+	 */</div><div class='add'>+</div><div class='add'>+	/* Insert the middle extent_map. */</div><div class='add'>+	split_mid-&gt;start = em-&gt;start + pre;</div><div class='add'>+	split_mid-&gt;len = em-&gt;len - pre;</div><div class='add'>+	split_mid-&gt;disk_bytenr = btrfs_extent_map_block_start(em) + pre;</div><div class='add'>+	split_mid-&gt;disk_num_bytes = split_mid-&gt;len;</div><div class='add'>+	split_mid-&gt;offset = 0;</div><div class='add'>+	split_mid-&gt;ram_bytes = split_mid-&gt;len;</div><div class='add'>+	split_mid-&gt;flags = flags;</div><div class='add'>+	split_mid-&gt;generation = em-&gt;generation;</div><div class='add'>+	add_extent_mapping(inode, split_mid, true);</div><div class='add'>+</div><div class='add'>+	/* Once for us */</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='add'>+	/* Once for the tree */</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='add'>+</div><div class='add'>+out_unlock:</div><div class='add'>+	write_unlock(&amp;em_tree-&gt;lock);</div><div class='add'>+	btrfs_unlock_extent(&amp;inode-&gt;io_tree, start, start + len - 1, NULL);</div><div class='add'>+	btrfs_free_extent_map(split_mid);</div><div class='add'>+out_free_pre:</div><div class='add'>+	btrfs_free_extent_map(split_pre);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct btrfs_em_shrink_ctx {</div><div class='add'>+	long nr_to_scan;</div><div class='add'>+	long scanned;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static long btrfs_scan_inode(struct btrfs_inode *inode, struct btrfs_em_shrink_ctx *ctx)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	const u64 cur_fs_gen = btrfs_get_fs_generation(fs_info);</div><div class='add'>+	struct extent_map_tree *tree = &amp;inode-&gt;extent_tree;</div><div class='add'>+	long nr_dropped = 0;</div><div class='add'>+	struct rb_node *node;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held_write(&amp;tree-&gt;lock);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Take the mmap lock so that we serialize with the inode logging phase</div><div class='add'>+	 * of fsync because we may need to set the full sync flag on the inode,</div><div class='add'>+	 * in case we have to remove extent maps in the tree's list of modified</div><div class='add'>+	 * extents. If we set the full sync flag in the inode while an fsync is</div><div class='add'>+	 * in progress, we may risk missing new extents because before the flag</div><div class='add'>+	 * is set, fsync decides to only wait for writeback to complete and then</div><div class='add'>+	 * during inode logging it sees the flag set and uses the subvolume tree</div><div class='add'>+	 * to find new extents, which may not be there yet because ordered</div><div class='add'>+	 * extents haven't completed yet.</div><div class='add'>+	 *</div><div class='add'>+	 * We also do a try lock because we don't want to block for too long and</div><div class='add'>+	 * we are holding the extent map tree's lock in write mode.</div><div class='add'>+	 */</div><div class='add'>+	if (!down_read_trylock(&amp;inode-&gt;i_mmap_lock))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	node = rb_first(&amp;tree-&gt;root);</div><div class='add'>+	while (node) {</div><div class='add'>+		struct rb_node *next = rb_next(node);</div><div class='add'>+		struct extent_map *em;</div><div class='add'>+</div><div class='add'>+		em = rb_entry(node, struct extent_map, rb_node);</div><div class='add'>+		ctx-&gt;scanned++;</div><div class='add'>+</div><div class='add'>+		if (em-&gt;flags &amp; EXTENT_FLAG_PINNED)</div><div class='add'>+			goto next;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * If the inode is in the list of modified extents (new) and its</div><div class='add'>+		 * generation is the same (or is greater than) the current fs</div><div class='add'>+		 * generation, it means it was not yet persisted so we have to</div><div class='add'>+		 * set the full sync flag so that the next fsync will not miss</div><div class='add'>+		 * it.</div><div class='add'>+		 */</div><div class='add'>+		if (!list_empty(&amp;em-&gt;list) &amp;&amp; em-&gt;generation &gt;= cur_fs_gen)</div><div class='add'>+			btrfs_set_inode_full_sync(inode);</div><div class='add'>+</div><div class='add'>+		btrfs_remove_extent_mapping(inode, em);</div><div class='add'>+		trace_btrfs_extent_map_shrinker_remove_em(inode, em);</div><div class='add'>+		/* Drop the reference for the tree. */</div><div class='add'>+		btrfs_free_extent_map(em);</div><div class='add'>+		nr_dropped++;</div><div class='add'>+next:</div><div class='add'>+		if (ctx-&gt;scanned &gt;= ctx-&gt;nr_to_scan)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Stop if we need to reschedule or there's contention on the</div><div class='add'>+		 * lock. This is to avoid slowing other tasks trying to take the</div><div class='add'>+		 * lock.</div><div class='add'>+		 */</div><div class='add'>+		if (need_resched() || rwlock_needbreak(&amp;tree-&gt;lock) ||</div><div class='add'>+		    btrfs_fs_closing(fs_info))</div><div class='add'>+			break;</div><div class='add'>+		node = next;</div><div class='add'>+	}</div><div class='add'>+	up_read(&amp;inode-&gt;i_mmap_lock);</div><div class='add'>+</div><div class='add'>+	return nr_dropped;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct btrfs_inode *find_first_inode_to_shrink(struct btrfs_root *root,</div><div class='add'>+						      u64 min_ino)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_inode *inode;</div><div class='add'>+	unsigned long from = min_ino;</div><div class='add'>+</div><div class='add'>+	xa_lock(&amp;root-&gt;inodes);</div><div class='add'>+	while (true) {</div><div class='add'>+		struct extent_map_tree *tree;</div><div class='add'>+</div><div class='add'>+		inode = xa_find(&amp;root-&gt;inodes, &amp;from, ULONG_MAX, XA_PRESENT);</div><div class='add'>+		if (!inode)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		tree = &amp;inode-&gt;extent_tree;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * We want to be fast so if the lock is busy we don't want to</div><div class='add'>+		 * spend time waiting for it (some task is about to do IO for</div><div class='add'>+		 * the inode).</div><div class='add'>+		 */</div><div class='add'>+		if (!write_trylock(&amp;tree-&gt;lock))</div><div class='add'>+			goto next;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Skip inode if it doesn't have loaded extent maps, so we avoid</div><div class='add'>+		 * getting a reference and doing an iput later. This includes</div><div class='add'>+		 * cases like files that were opened for things like stat(2), or</div><div class='add'>+		 * files with all extent maps previously released through the</div><div class='add'>+		 * release folio callback (btrfs_release_folio()) or released in</div><div class='add'>+		 * a previous run, or directories which never have extent maps.</div><div class='add'>+		 */</div><div class='add'>+		if (RB_EMPTY_ROOT(&amp;tree-&gt;root)) {</div><div class='add'>+			write_unlock(&amp;tree-&gt;lock);</div><div class='add'>+			goto next;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (igrab(&amp;inode-&gt;vfs_inode))</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		write_unlock(&amp;tree-&gt;lock);</div><div class='add'>+next:</div><div class='add'>+		from = btrfs_ino(inode) + 1;</div><div class='add'>+		cond_resched_lock(&amp;root-&gt;inodes.xa_lock);</div><div class='add'>+	}</div><div class='add'>+	xa_unlock(&amp;root-&gt;inodes);</div><div class='add'>+</div><div class='add'>+	return inode;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static long btrfs_scan_root(struct btrfs_root *root, struct btrfs_em_shrink_ctx *ctx)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+	struct btrfs_inode *inode;</div><div class='add'>+	long nr_dropped = 0;</div><div class='add'>+	u64 min_ino = fs_info-&gt;em_shrinker_last_ino + 1;</div><div class='add'>+</div><div class='add'>+	inode = find_first_inode_to_shrink(root, min_ino);</div><div class='add'>+	while (inode) {</div><div class='add'>+		nr_dropped += btrfs_scan_inode(inode, ctx);</div><div class='add'>+		write_unlock(&amp;inode-&gt;extent_tree.lock);</div><div class='add'>+</div><div class='add'>+		min_ino = btrfs_ino(inode) + 1;</div><div class='add'>+		fs_info-&gt;em_shrinker_last_ino = btrfs_ino(inode);</div><div class='add'>+		iput(&amp;inode-&gt;vfs_inode);</div><div class='add'>+</div><div class='add'>+		if (ctx-&gt;scanned &gt;= ctx-&gt;nr_to_scan || btrfs_fs_closing(fs_info))</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		cond_resched();</div><div class='add'>+</div><div class='add'>+		inode = find_first_inode_to_shrink(root, min_ino);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (inode) {</div><div class='add'>+		/*</div><div class='add'>+		 * There are still inodes in this root or we happened to process</div><div class='add'>+		 * the last one and reached the scan limit. In either case set</div><div class='add'>+		 * the current root to this one, so we'll resume from the next</div><div class='add'>+		 * inode if there is one or we will find out this was the last</div><div class='add'>+		 * one and move to the next root.</div><div class='add'>+		 */</div><div class='add'>+		fs_info-&gt;em_shrinker_last_root = btrfs_root_id(root);</div><div class='add'>+	} else {</div><div class='add'>+		/*</div><div class='add'>+		 * No more inodes in this root, set extent_map_shrinker_last_ino to 0 so</div><div class='add'>+		 * that when processing the next root we start from its first inode.</div><div class='add'>+		 */</div><div class='add'>+		fs_info-&gt;em_shrinker_last_ino = 0;</div><div class='add'>+		fs_info-&gt;em_shrinker_last_root = btrfs_root_id(root) + 1;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return nr_dropped;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void btrfs_extent_map_shrinker_worker(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info;</div><div class='add'>+	struct btrfs_em_shrink_ctx ctx;</div><div class='add'>+	u64 start_root_id;</div><div class='add'>+	u64 next_root_id;</div><div class='add'>+	bool cycled = false;</div><div class='add'>+	long nr_dropped = 0;</div><div class='add'>+</div><div class='add'>+	fs_info = container_of(work, struct btrfs_fs_info, em_shrinker_work);</div><div class='add'>+</div><div class='add'>+	ctx.scanned = 0;</div><div class='add'>+	ctx.nr_to_scan = atomic64_read(&amp;fs_info-&gt;em_shrinker_nr_to_scan);</div><div class='add'>+</div><div class='add'>+	start_root_id = fs_info-&gt;em_shrinker_last_root;</div><div class='add'>+	next_root_id = fs_info-&gt;em_shrinker_last_root;</div><div class='add'>+</div><div class='add'>+	if (trace_btrfs_extent_map_shrinker_scan_enter_enabled()) {</div><div class='add'>+		s64 nr = percpu_counter_sum_positive(&amp;fs_info-&gt;evictable_extent_maps);</div><div class='add'>+</div><div class='add'>+		trace_btrfs_extent_map_shrinker_scan_enter(fs_info, nr);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	while (ctx.scanned &lt; ctx.nr_to_scan &amp;&amp; !btrfs_fs_closing(fs_info)) {</div><div class='add'>+		struct btrfs_root *root;</div><div class='add'>+		unsigned long count;</div><div class='add'>+</div><div class='add'>+		cond_resched();</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;fs_info-&gt;fs_roots_radix_lock);</div><div class='add'>+		count = radix_tree_gang_lookup(&amp;fs_info-&gt;fs_roots_radix,</div><div class='add'>+					       (void **)&amp;root,</div><div class='add'>+					       (unsigned long)next_root_id, 1);</div><div class='add'>+		if (count == 0) {</div><div class='add'>+			spin_unlock(&amp;fs_info-&gt;fs_roots_radix_lock);</div><div class='add'>+			if (start_root_id &gt; 0 &amp;&amp; !cycled) {</div><div class='add'>+				next_root_id = 0;</div><div class='add'>+				fs_info-&gt;em_shrinker_last_root = 0;</div><div class='add'>+				fs_info-&gt;em_shrinker_last_ino = 0;</div><div class='add'>+				cycled = true;</div><div class='add'>+				continue;</div><div class='add'>+			}</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		next_root_id = btrfs_root_id(root) + 1;</div><div class='add'>+		root = btrfs_grab_root(root);</div><div class='add'>+		spin_unlock(&amp;fs_info-&gt;fs_roots_radix_lock);</div><div class='add'>+</div><div class='add'>+		if (!root)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		if (btrfs_is_fstree(btrfs_root_id(root)))</div><div class='add'>+			nr_dropped += btrfs_scan_root(root, &amp;ctx);</div><div class='add'>+</div><div class='add'>+		btrfs_put_root(root);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (trace_btrfs_extent_map_shrinker_scan_exit_enabled()) {</div><div class='add'>+		s64 nr = percpu_counter_sum_positive(&amp;fs_info-&gt;evictable_extent_maps);</div><div class='add'>+</div><div class='add'>+		trace_btrfs_extent_map_shrinker_scan_exit(fs_info, nr_dropped, nr);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	atomic64_set(&amp;fs_info-&gt;em_shrinker_nr_to_scan, 0);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_free_extent_maps(struct btrfs_fs_info *fs_info, long nr_to_scan)</div><div class='add'>+{</div><div class='add'>+	/*</div><div class='add'>+	 * Do nothing if the shrinker is already running. In case of high memory</div><div class='add'>+	 * pressure we can have a lot of tasks calling us and all passing the</div><div class='add'>+	 * same nr_to_scan value, but in reality we may need only to free</div><div class='add'>+	 * nr_to_scan extent maps (or less). In case we need to free more than</div><div class='add'>+	 * that, we will be called again by the fs shrinker, so no worries about</div><div class='add'>+	 * not doing enough work to reclaim memory from extent maps.</div><div class='add'>+	 * We can also be repeatedly called with the same nr_to_scan value</div><div class='add'>+	 * simply because the shrinker runs asynchronously and multiple calls</div><div class='add'>+	 * to this function are made before the shrinker does enough progress.</div><div class='add'>+	 *</div><div class='add'>+	 * That's why we set the atomic counter to nr_to_scan only if its</div><div class='add'>+	 * current value is zero, instead of incrementing the counter by</div><div class='add'>+	 * nr_to_scan.</div><div class='add'>+	 */</div><div class='add'>+	if (atomic64_cmpxchg(&amp;fs_info-&gt;em_shrinker_nr_to_scan, 0, nr_to_scan) != 0)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	queue_work(system_dfl_wq, &amp;fs_info-&gt;em_shrinker_work);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_init_extent_map_shrinker_work(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	atomic64_set(&amp;fs_info-&gt;em_shrinker_nr_to_scan, 0);</div><div class='add'>+	INIT_WORK(&amp;fs_info-&gt;em_shrinker_work, btrfs_extent_map_shrinker_worker);</div><div class='add'>+}</div><div class='head'>diff --git a/fs/btrfs/extent_map.h b/fs/btrfs/extent_map.h<br/>index 8e217337dff9..6f685f3c9327 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/extent_map.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/extent_map.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/extent_map.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/extent_map.h</a></div><div class='hunk'>@@ -3,98 +3,193 @@</div><div class='ctx'> #ifndef BTRFS_EXTENT_MAP_H</div><div class='ctx'> #define BTRFS_EXTENT_MAP_H</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/compiler_types.h&gt;</div><div class='add'>+#include &lt;linux/spinlock_types.h&gt;</div><div class='ctx'> #include &lt;linux/rbtree.h&gt;</div><div class='add'>+#include &lt;linux/list.h&gt;</div><div class='ctx'> #include &lt;linux/refcount.h&gt;</div><div class='add'>+#include "fs.h"</div><div class='add'>+</div><div class='add'>+struct btrfs_inode;</div><div class='add'>+struct btrfs_fs_info;</div><div class='ctx'> </div><div class='ctx'> #define EXTENT_MAP_LAST_BYTE ((u64)-4)</div><div class='ctx'> #define EXTENT_MAP_HOLE ((u64)-3)</div><div class='ctx'> #define EXTENT_MAP_INLINE ((u64)-2)</div><div class='del'>-/* used only during fiemap calls */</div><div class='del'>-#define EXTENT_MAP_DELALLOC ((u64)-1)</div><div class='ctx'> </div><div class='ctx'> /* bits for the extent_map::flags field */</div><div class='ctx'> enum {</div><div class='ctx'> 	/* this entry not yet on disk, don't free it */</div><div class='del'>-	EXTENT_FLAG_PINNED,</div><div class='del'>-	EXTENT_FLAG_COMPRESSED,</div><div class='add'>+	ENUM_BIT(EXTENT_FLAG_PINNED),</div><div class='add'>+	ENUM_BIT(EXTENT_FLAG_COMPRESS_ZLIB),</div><div class='add'>+	ENUM_BIT(EXTENT_FLAG_COMPRESS_LZO),</div><div class='add'>+	ENUM_BIT(EXTENT_FLAG_COMPRESS_ZSTD),</div><div class='ctx'> 	/* pre-allocated extent */</div><div class='del'>-	EXTENT_FLAG_PREALLOC,</div><div class='add'>+	ENUM_BIT(EXTENT_FLAG_PREALLOC),</div><div class='ctx'> 	/* Logging this extent */</div><div class='del'>-	EXTENT_FLAG_LOGGING,</div><div class='del'>-	/* Filling in a preallocated extent */</div><div class='del'>-	EXTENT_FLAG_FILLING,</div><div class='del'>-	/* filesystem extent mapping type */</div><div class='del'>-	EXTENT_FLAG_FS_MAPPING,</div><div class='add'>+	ENUM_BIT(EXTENT_FLAG_LOGGING),</div><div class='add'>+	/* This em is merged from two or more physically adjacent ems */</div><div class='add'>+	ENUM_BIT(EXTENT_FLAG_MERGED),</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * This structure represents file extents and holes.</div><div class='add'>+ *</div><div class='add'>+ * Unlike on-disk file extent items, extent maps can be merged to save memory.</div><div class='add'>+ * This means members only match file extent items before any merging.</div><div class='add'>+ *</div><div class='add'>+ * Keep this structure as compact as possible, as we can have really large</div><div class='add'>+ * amounts of allocated extent maps at any time.</div><div class='add'>+ */</div><div class='ctx'> struct extent_map {</div><div class='ctx'> 	struct rb_node rb_node;</div><div class='ctx'> </div><div class='del'>-	/* all of these are in bytes */</div><div class='add'>+	/* All of these are in bytes. */</div><div class='add'>+</div><div class='add'>+	/* File offset matching the offset of a BTRFS_EXTENT_ITEM_KEY key. */</div><div class='ctx'> 	u64 start;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Length of the file extent.</div><div class='add'>+	 *</div><div class='add'>+	 * For non-inlined file extents it's btrfs_file_extent_item::num_bytes.</div><div class='add'>+	 * For inline extents it's sectorsize, since inline data starts at</div><div class='add'>+	 * offsetof(struct btrfs_file_extent_item, disk_bytenr) thus</div><div class='add'>+	 * btrfs_file_extent_item::num_bytes is not valid.</div><div class='add'>+	 */</div><div class='ctx'> 	u64 len;</div><div class='del'>-	u64 mod_start;</div><div class='del'>-	u64 mod_len;</div><div class='del'>-	u64 orig_start;</div><div class='del'>-	u64 orig_block_len;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The bytenr of the full on-disk extent.</div><div class='add'>+	 *</div><div class='add'>+	 * For regular extents it's btrfs_file_extent_item::disk_bytenr.</div><div class='add'>+	 * For holes it's EXTENT_MAP_HOLE and for inline extents it's</div><div class='add'>+	 * EXTENT_MAP_INLINE.</div><div class='add'>+	 */</div><div class='add'>+	u64 disk_bytenr;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The full on-disk extent length, matching</div><div class='add'>+	 * btrfs_file_extent_item::disk_num_bytes.</div><div class='add'>+	 */</div><div class='add'>+	u64 disk_num_bytes;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Offset inside the decompressed extent.</div><div class='add'>+	 *</div><div class='add'>+	 * For regular extents it's btrfs_file_extent_item::offset.</div><div class='add'>+	 * For holes and inline extents it's 0.</div><div class='add'>+	 */</div><div class='add'>+	u64 offset;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The decompressed size of the whole on-disk extent, matching</div><div class='add'>+	 * btrfs_file_extent_item::ram_bytes.</div><div class='add'>+	 */</div><div class='ctx'> 	u64 ram_bytes;</div><div class='del'>-	u64 block_start;</div><div class='del'>-	u64 block_len;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Generation of the extent map, for merged em it's the highest</div><div class='add'>+	 * generation of all merged ems.</div><div class='add'>+	 * For non-merged extents, it's from btrfs_file_extent_item::generation.</div><div class='add'>+	 */</div><div class='ctx'> 	u64 generation;</div><div class='del'>-	unsigned long flags;</div><div class='del'>-	/* Used for chunk mappings, flag EXTENT_FLAG_FS_MAPPING must be set */</div><div class='del'>-	struct map_lookup *map_lookup;</div><div class='add'>+	u32 flags;</div><div class='ctx'> 	refcount_t refs;</div><div class='del'>-	unsigned int compress_type;</div><div class='ctx'> 	struct list_head list;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct extent_map_tree {</div><div class='del'>-	struct rb_root_cached map;</div><div class='add'>+	struct rb_root root;</div><div class='ctx'> 	struct list_head modified_extents;</div><div class='ctx'> 	rwlock_t lock;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static inline int extent_map_in_tree(const struct extent_map *em)</div><div class='add'>+struct btrfs_inode;</div><div class='add'>+</div><div class='add'>+static inline void btrfs_extent_map_set_compression(struct extent_map *em,</div><div class='add'>+						    enum btrfs_compression_type type)</div><div class='add'>+{</div><div class='add'>+	if (type == BTRFS_COMPRESS_ZLIB)</div><div class='add'>+		em-&gt;flags |= EXTENT_FLAG_COMPRESS_ZLIB;</div><div class='add'>+	else if (type == BTRFS_COMPRESS_LZO)</div><div class='add'>+		em-&gt;flags |= EXTENT_FLAG_COMPRESS_LZO;</div><div class='add'>+	else if (type == BTRFS_COMPRESS_ZSTD)</div><div class='add'>+		em-&gt;flags |= EXTENT_FLAG_COMPRESS_ZSTD;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline enum btrfs_compression_type btrfs_extent_map_compression(</div><div class='add'>+						       const struct extent_map *em)</div><div class='add'>+{</div><div class='add'>+	if (em-&gt;flags &amp; EXTENT_FLAG_COMPRESS_ZLIB)</div><div class='add'>+		return BTRFS_COMPRESS_ZLIB;</div><div class='add'>+</div><div class='add'>+	if (em-&gt;flags &amp; EXTENT_FLAG_COMPRESS_LZO)</div><div class='add'>+		return BTRFS_COMPRESS_LZO;</div><div class='add'>+</div><div class='add'>+	if (em-&gt;flags &amp; EXTENT_FLAG_COMPRESS_ZSTD)</div><div class='add'>+		return BTRFS_COMPRESS_ZSTD;</div><div class='add'>+</div><div class='add'>+	return BTRFS_COMPRESS_NONE;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * More efficient way to determine if extent is compressed, instead of using</div><div class='add'>+ * 'extent_map_compression() != BTRFS_COMPRESS_NONE'.</div><div class='add'>+ */</div><div class='add'>+static inline bool btrfs_extent_map_is_compressed(const struct extent_map *em)</div><div class='add'>+{</div><div class='add'>+	return (em-&gt;flags &amp; (EXTENT_FLAG_COMPRESS_ZLIB |</div><div class='add'>+			     EXTENT_FLAG_COMPRESS_LZO |</div><div class='add'>+			     EXTENT_FLAG_COMPRESS_ZSTD)) != 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int btrfs_extent_map_in_tree(const struct extent_map *em)</div><div class='ctx'> {</div><div class='ctx'> 	return !RB_EMPTY_NODE(&amp;em-&gt;rb_node);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u64 extent_map_end(struct extent_map *em)</div><div class='add'>+static inline u64 btrfs_extent_map_block_start(const struct extent_map *em)</div><div class='ctx'> {</div><div class='del'>-	if (em-&gt;start + em-&gt;len &lt; em-&gt;start)</div><div class='del'>-		return (u64)-1;</div><div class='del'>-	return em-&gt;start + em-&gt;len;</div><div class='add'>+	if (em-&gt;disk_bytenr &lt; EXTENT_MAP_LAST_BYTE) {</div><div class='add'>+		if (btrfs_extent_map_is_compressed(em))</div><div class='add'>+			return em-&gt;disk_bytenr;</div><div class='add'>+		return em-&gt;disk_bytenr + em-&gt;offset;</div><div class='add'>+	}</div><div class='add'>+	return em-&gt;disk_bytenr;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u64 extent_map_block_end(struct extent_map *em)</div><div class='add'>+static inline u64 btrfs_extent_map_end(const struct extent_map *em)</div><div class='ctx'> {</div><div class='del'>-	if (em-&gt;block_start + em-&gt;block_len &lt; em-&gt;block_start)</div><div class='add'>+	if (em-&gt;start + em-&gt;len &lt; em-&gt;start)</div><div class='ctx'> 		return (u64)-1;</div><div class='del'>-	return em-&gt;block_start + em-&gt;block_len;</div><div class='add'>+	return em-&gt;start + em-&gt;len;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void extent_map_tree_init(struct extent_map_tree *tree);</div><div class='del'>-struct extent_map *lookup_extent_mapping(struct extent_map_tree *tree,</div><div class='del'>-					 u64 start, u64 len);</div><div class='del'>-int add_extent_mapping(struct extent_map_tree *tree,</div><div class='del'>-		       struct extent_map *em, int modified);</div><div class='del'>-void remove_extent_mapping(struct extent_map_tree *tree, struct extent_map *em);</div><div class='del'>-void replace_extent_mapping(struct extent_map_tree *tree,</div><div class='del'>-			    struct extent_map *cur,</div><div class='del'>-			    struct extent_map *new,</div><div class='del'>-			    int modified);</div><div class='del'>-</div><div class='del'>-struct extent_map *alloc_extent_map(void);</div><div class='del'>-void free_extent_map(struct extent_map *em);</div><div class='del'>-int __init extent_map_init(void);</div><div class='del'>-void __cold extent_map_exit(void);</div><div class='del'>-int unpin_extent_cache(struct extent_map_tree *tree, u64 start, u64 len, u64 gen);</div><div class='del'>-void clear_em_logging(struct extent_map_tree *tree, struct extent_map *em);</div><div class='del'>-struct extent_map *search_extent_mapping(struct extent_map_tree *tree,</div><div class='del'>-					 u64 start, u64 len);</div><div class='del'>-int btrfs_add_extent_mapping(struct btrfs_fs_info *fs_info,</div><div class='del'>-			     struct extent_map_tree *em_tree,</div><div class='add'>+void btrfs_extent_map_tree_init(struct extent_map_tree *tree);</div><div class='add'>+struct extent_map *btrfs_lookup_extent_mapping(struct extent_map_tree *tree,</div><div class='add'>+					       u64 start, u64 len);</div><div class='add'>+void btrfs_remove_extent_mapping(struct btrfs_inode *inode, struct extent_map *em);</div><div class='add'>+int btrfs_split_extent_map(struct btrfs_inode *inode, u64 start, u64 len, u64 pre,</div><div class='add'>+			   u64 new_logical);</div><div class='add'>+</div><div class='add'>+struct extent_map *btrfs_alloc_extent_map(void);</div><div class='add'>+void btrfs_free_extent_map(struct extent_map *em);</div><div class='add'>+int __init btrfs_extent_map_init(void);</div><div class='add'>+void __cold btrfs_extent_map_exit(void);</div><div class='add'>+int btrfs_unpin_extent_cache(struct btrfs_inode *inode, u64 start, u64 len, u64 gen);</div><div class='add'>+void btrfs_clear_em_logging(struct btrfs_inode *inode, struct extent_map *em);</div><div class='add'>+struct extent_map *btrfs_search_extent_mapping(struct extent_map_tree *tree,</div><div class='add'>+					       u64 start, u64 len);</div><div class='add'>+int btrfs_add_extent_mapping(struct btrfs_inode *inode,</div><div class='ctx'> 			     struct extent_map **em_in, u64 start, u64 len);</div><div class='add'>+void btrfs_drop_extent_map_range(struct btrfs_inode *inode,</div><div class='add'>+				 u64 start, u64 end,</div><div class='add'>+				 bool skip_pinned);</div><div class='add'>+int btrfs_replace_extent_map_range(struct btrfs_inode *inode,</div><div class='add'>+				   struct extent_map *new_em,</div><div class='add'>+				   bool modified);</div><div class='add'>+void btrfs_free_extent_maps(struct btrfs_fs_info *fs_info, long nr_to_scan);</div><div class='add'>+void btrfs_init_extent_map_shrinker_work(struct btrfs_fs_info *fs_info);</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/btrfs/fiemap.c b/fs/btrfs/fiemap.c<br/>new file mode 100644<br/>index 000000000000..f2eaaef8422b<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/fiemap.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/fiemap.c</a></div><div class='hunk'>@@ -0,0 +1,929 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+</div><div class='add'>+#include "backref.h"</div><div class='add'>+#include "btrfs_inode.h"</div><div class='add'>+#include "fiemap.h"</div><div class='add'>+#include "file.h"</div><div class='add'>+#include "file-item.h"</div><div class='add'>+</div><div class='add'>+struct btrfs_fiemap_entry {</div><div class='add'>+	u64 offset;</div><div class='add'>+	u64 phys;</div><div class='add'>+	u64 len;</div><div class='add'>+	u32 flags;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Indicate the caller of emit_fiemap_extent() that it needs to unlock the file</div><div class='add'>+ * range from the inode's io tree, unlock the subvolume tree search path, flush</div><div class='add'>+ * the fiemap cache and relock the file range and research the subvolume tree.</div><div class='add'>+ * The value here is something negative that can't be confused with a valid</div><div class='add'>+ * errno value and different from 1 because that's also a return value from</div><div class='add'>+ * fiemap_fill_next_extent() and also it's often used to mean some btree search</div><div class='add'>+ * did not find a key, so make it some distinct negative value.</div><div class='add'>+ */</div><div class='add'>+#define BTRFS_FIEMAP_FLUSH_CACHE (-(MAX_ERRNO + 1))</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Used to:</div><div class='add'>+ *</div><div class='add'>+ * - Cache the next entry to be emitted to the fiemap buffer, so that we can</div><div class='add'>+ *   merge extents that are contiguous and can be grouped as a single one;</div><div class='add'>+ *</div><div class='add'>+ * - Store extents ready to be written to the fiemap buffer in an intermediary</div><div class='add'>+ *   buffer. This intermediary buffer is to ensure that in case the fiemap</div><div class='add'>+ *   buffer is memory mapped to the fiemap target file, we don't deadlock</div><div class='add'>+ *   during btrfs_page_mkwrite(). This is because during fiemap we are locking</div><div class='add'>+ *   an extent range in order to prevent races with delalloc flushing and</div><div class='add'>+ *   ordered extent completion, which is needed in order to reliably detect</div><div class='add'>+ *   delalloc in holes and prealloc extents. And this can lead to a deadlock</div><div class='add'>+ *   if the fiemap buffer is memory mapped to the file we are running fiemap</div><div class='add'>+ *   against (a silly, useless in practice scenario, but possible) because</div><div class='add'>+ *   btrfs_page_mkwrite() will try to lock the same extent range.</div><div class='add'>+ */</div><div class='add'>+struct fiemap_cache {</div><div class='add'>+	/* An array of ready fiemap entries. */</div><div class='add'>+	struct btrfs_fiemap_entry *entries;</div><div class='add'>+	/* Number of entries in the entries array. */</div><div class='add'>+	int entries_size;</div><div class='add'>+	/* Index of the next entry in the entries array to write to. */</div><div class='add'>+	int entries_pos;</div><div class='add'>+	/*</div><div class='add'>+	 * Once the entries array is full, this indicates what's the offset for</div><div class='add'>+	 * the next file extent item we must search for in the inode's subvolume</div><div class='add'>+	 * tree after unlocking the extent range in the inode's io tree and</div><div class='add'>+	 * releasing the search path.</div><div class='add'>+	 */</div><div class='add'>+	u64 next_search_offset;</div><div class='add'>+	/*</div><div class='add'>+	 * This matches struct fiemap_extent_info::fi_mapped_extents, we use it</div><div class='add'>+	 * to count ourselves emitted extents and stop instead of relying on</div><div class='add'>+	 * fiemap_fill_next_extent() because we buffer ready fiemap entries at</div><div class='add'>+	 * the @entries array, and we want to stop as soon as we hit the max</div><div class='add'>+	 * amount of extents to map, not just to save time but also to make the</div><div class='add'>+	 * logic at extent_fiemap() simpler.</div><div class='add'>+	 */</div><div class='add'>+	unsigned int extents_mapped;</div><div class='add'>+	/* Fields for the cached extent (unsubmitted, not ready, extent). */</div><div class='add'>+	u64 offset;</div><div class='add'>+	u64 phys;</div><div class='add'>+	u64 len;</div><div class='add'>+	u32 flags;</div><div class='add'>+	bool cached;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int flush_fiemap_cache(struct fiemap_extent_info *fieinfo,</div><div class='add'>+			      struct fiemap_cache *cache)</div><div class='add'>+{</div><div class='add'>+	for (int i = 0; i &lt; cache-&gt;entries_pos; i++) {</div><div class='add'>+		struct btrfs_fiemap_entry *entry = &amp;cache-&gt;entries[i];</div><div class='add'>+		int ret;</div><div class='add'>+</div><div class='add'>+		ret = fiemap_fill_next_extent(fieinfo, entry-&gt;offset,</div><div class='add'>+					      entry-&gt;phys, entry-&gt;len,</div><div class='add'>+					      entry-&gt;flags);</div><div class='add'>+		/*</div><div class='add'>+		 * Ignore 1 (reached max entries) because we keep track of that</div><div class='add'>+		 * ourselves in emit_fiemap_extent().</div><div class='add'>+		 */</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+	cache-&gt;entries_pos = 0;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Helper to submit fiemap extent.</div><div class='add'>+ *</div><div class='add'>+ * Will try to merge current fiemap extent specified by @offset, @phys,</div><div class='add'>+ * @len and @flags with cached one.</div><div class='add'>+ * And only when we fails to merge, cached one will be submitted as</div><div class='add'>+ * fiemap extent.</div><div class='add'>+ *</div><div class='add'>+ * Return value is the same as fiemap_fill_next_extent().</div><div class='add'>+ */</div><div class='add'>+static int emit_fiemap_extent(struct fiemap_extent_info *fieinfo,</div><div class='add'>+				struct fiemap_cache *cache,</div><div class='add'>+				u64 offset, u64 phys, u64 len, u32 flags)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fiemap_entry *entry;</div><div class='add'>+	u64 cache_end;</div><div class='add'>+</div><div class='add'>+	/* Set at the end of extent_fiemap(). */</div><div class='add'>+	ASSERT((flags &amp; FIEMAP_EXTENT_LAST) == 0);</div><div class='add'>+</div><div class='add'>+	if (!cache-&gt;cached)</div><div class='add'>+		goto assign;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * When iterating the extents of the inode, at extent_fiemap(), we may</div><div class='add'>+	 * find an extent that starts at an offset behind the end offset of the</div><div class='add'>+	 * previous extent we processed. This happens if fiemap is called</div><div class='add'>+	 * without FIEMAP_FLAG_SYNC and there are ordered extents completing</div><div class='add'>+	 * after we had to unlock the file range, release the search path, emit</div><div class='add'>+	 * the fiemap extents stored in the buffer (cache-&gt;entries array) and</div><div class='add'>+	 * the lock the remainder of the range and re-search the btree.</div><div class='add'>+	 *</div><div class='add'>+	 * For example we are in leaf X processing its last item, which is the</div><div class='add'>+	 * file extent item for file range [512K, 1M[, and after</div><div class='add'>+	 * btrfs_next_leaf() releases the path, there's an ordered extent that</div><div class='add'>+	 * completes for the file range [768K, 2M[, and that results in trimming</div><div class='add'>+	 * the file extent item so that it now corresponds to the file range</div><div class='add'>+	 * [512K, 768K[ and a new file extent item is inserted for the file</div><div class='add'>+	 * range [768K, 2M[, which may end up as the last item of leaf X or as</div><div class='add'>+	 * the first item of the next leaf - in either case btrfs_next_leaf()</div><div class='add'>+	 * will leave us with a path pointing to the new extent item, for the</div><div class='add'>+	 * file range [768K, 2M[, since that's the first key that follows the</div><div class='add'>+	 * last one we processed. So in order not to report overlapping extents</div><div class='add'>+	 * to user space, we trim the length of the previously cached extent and</div><div class='add'>+	 * emit it.</div><div class='add'>+	 *</div><div class='add'>+	 * Upon calling btrfs_next_leaf() we may also find an extent with an</div><div class='add'>+	 * offset smaller than or equals to cache-&gt;offset, and this happens</div><div class='add'>+	 * when we had a hole or prealloc extent with several delalloc ranges in</div><div class='add'>+	 * it, but after btrfs_next_leaf() released the path, delalloc was</div><div class='add'>+	 * flushed and the resulting ordered extents were completed, so we can</div><div class='add'>+	 * now have found a file extent item for an offset that is smaller than</div><div class='add'>+	 * or equals to what we have in cache-&gt;offset. We deal with this as</div><div class='add'>+	 * described below.</div><div class='add'>+	 */</div><div class='add'>+	cache_end = cache-&gt;offset + cache-&gt;len;</div><div class='add'>+	if (cache_end &gt; offset) {</div><div class='add'>+		if (offset == cache-&gt;offset) {</div><div class='add'>+			/*</div><div class='add'>+			 * We cached a delalloc range (found in the io tree) for</div><div class='add'>+			 * a hole or prealloc extent and we have now found a</div><div class='add'>+			 * file extent item for the same offset. What we have</div><div class='add'>+			 * now is more recent and up to date, so discard what</div><div class='add'>+			 * we had in the cache and use what we have just found.</div><div class='add'>+			 */</div><div class='add'>+			goto assign;</div><div class='add'>+		} else if (offset &gt; cache-&gt;offset) {</div><div class='add'>+			/*</div><div class='add'>+			 * The extent range we previously found ends after the</div><div class='add'>+			 * offset of the file extent item we found and that</div><div class='add'>+			 * offset falls somewhere in the middle of that previous</div><div class='add'>+			 * extent range. So adjust the range we previously found</div><div class='add'>+			 * to end at the offset of the file extent item we have</div><div class='add'>+			 * just found, since this extent is more up to date.</div><div class='add'>+			 * Emit that adjusted range and cache the file extent</div><div class='add'>+			 * item we have just found. This corresponds to the case</div><div class='add'>+			 * where a previously found file extent item was split</div><div class='add'>+			 * due to an ordered extent completing.</div><div class='add'>+			 */</div><div class='add'>+			cache-&gt;len = offset - cache-&gt;offset;</div><div class='add'>+			goto emit;</div><div class='add'>+		} else {</div><div class='add'>+			const u64 range_end = offset + len;</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * The offset of the file extent item we have just found</div><div class='add'>+			 * is behind the cached offset. This means we were</div><div class='add'>+			 * processing a hole or prealloc extent for which we</div><div class='add'>+			 * have found delalloc ranges (in the io tree), so what</div><div class='add'>+			 * we have in the cache is the last delalloc range we</div><div class='add'>+			 * found while the file extent item we found can be</div><div class='add'>+			 * either for a whole delalloc range we previously</div><div class='add'>+			 * emitted or only a part of that range.</div><div class='add'>+			 *</div><div class='add'>+			 * We have two cases here:</div><div class='add'>+			 *</div><div class='add'>+			 * 1) The file extent item's range ends at or behind the</div><div class='add'>+			 *    cached extent's end. In this case just ignore the</div><div class='add'>+			 *    current file extent item because we don't want to</div><div class='add'>+			 *    overlap with previous ranges that may have been</div><div class='add'>+			 *    emitted already;</div><div class='add'>+			 *</div><div class='add'>+			 * 2) The file extent item starts behind the currently</div><div class='add'>+			 *    cached extent but its end offset goes beyond the</div><div class='add'>+			 *    end offset of the cached extent. We don't want to</div><div class='add'>+			 *    overlap with a previous range that may have been</div><div class='add'>+			 *    emitted already, so we emit the currently cached</div><div class='add'>+			 *    extent and then partially store the current file</div><div class='add'>+			 *    extent item's range in the cache, for the subrange</div><div class='add'>+			 *    going the cached extent's end to the end of the</div><div class='add'>+			 *    file extent item.</div><div class='add'>+			 */</div><div class='add'>+			if (range_end &lt;= cache_end)</div><div class='add'>+				return 0;</div><div class='add'>+</div><div class='add'>+			if (!(flags &amp; (FIEMAP_EXTENT_ENCODED | FIEMAP_EXTENT_DELALLOC)))</div><div class='add'>+				phys += cache_end - offset;</div><div class='add'>+</div><div class='add'>+			offset = cache_end;</div><div class='add'>+			len = range_end - cache_end;</div><div class='add'>+			goto emit;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Only merges fiemap extents if</div><div class='add'>+	 * 1) Their logical addresses are continuous</div><div class='add'>+	 *</div><div class='add'>+	 * 2) Their physical addresses are continuous</div><div class='add'>+	 *    So truly compressed (physical size smaller than logical size)</div><div class='add'>+	 *    extents won't get merged with each other</div><div class='add'>+	 *</div><div class='add'>+	 * 3) Share same flags</div><div class='add'>+	 */</div><div class='add'>+	if (cache-&gt;offset + cache-&gt;len  == offset &amp;&amp;</div><div class='add'>+	    cache-&gt;phys + cache-&gt;len == phys  &amp;&amp;</div><div class='add'>+	    cache-&gt;flags == flags) {</div><div class='add'>+		cache-&gt;len += len;</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+emit:</div><div class='add'>+	/* Not mergeable, need to submit cached one */</div><div class='add'>+</div><div class='add'>+	if (cache-&gt;entries_pos == cache-&gt;entries_size) {</div><div class='add'>+		/*</div><div class='add'>+		 * We will need to research for the end offset of the last</div><div class='add'>+		 * stored extent and not from the current offset, because after</div><div class='add'>+		 * unlocking the range and releasing the path, if there's a hole</div><div class='add'>+		 * between that end offset and this current offset, a new extent</div><div class='add'>+		 * may have been inserted due to a new write, so we don't want</div><div class='add'>+		 * to miss it.</div><div class='add'>+		 */</div><div class='add'>+		entry = &amp;cache-&gt;entries[cache-&gt;entries_size - 1];</div><div class='add'>+		cache-&gt;next_search_offset = entry-&gt;offset + entry-&gt;len;</div><div class='add'>+		cache-&gt;cached = false;</div><div class='add'>+</div><div class='add'>+		return BTRFS_FIEMAP_FLUSH_CACHE;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	entry = &amp;cache-&gt;entries[cache-&gt;entries_pos];</div><div class='add'>+	entry-&gt;offset = cache-&gt;offset;</div><div class='add'>+	entry-&gt;phys = cache-&gt;phys;</div><div class='add'>+	entry-&gt;len = cache-&gt;len;</div><div class='add'>+	entry-&gt;flags = cache-&gt;flags;</div><div class='add'>+	cache-&gt;entries_pos++;</div><div class='add'>+	cache-&gt;extents_mapped++;</div><div class='add'>+</div><div class='add'>+	if (cache-&gt;extents_mapped == fieinfo-&gt;fi_extents_max) {</div><div class='add'>+		cache-&gt;cached = false;</div><div class='add'>+		return 1;</div><div class='add'>+	}</div><div class='add'>+assign:</div><div class='add'>+	cache-&gt;cached = true;</div><div class='add'>+	cache-&gt;offset = offset;</div><div class='add'>+	cache-&gt;phys = phys;</div><div class='add'>+	cache-&gt;len = len;</div><div class='add'>+	cache-&gt;flags = flags;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Emit last fiemap cache</div><div class='add'>+ *</div><div class='add'>+ * The last fiemap cache may still be cached in the following case:</div><div class='add'>+ * 0		      4k		    8k</div><div class='add'>+ * |&lt;- Fiemap range -&gt;|</div><div class='add'>+ * |&lt;------------  First extent -----------&gt;|</div><div class='add'>+ *</div><div class='add'>+ * In this case, the first extent range will be cached but not emitted.</div><div class='add'>+ * So we must emit it before ending extent_fiemap().</div><div class='add'>+ */</div><div class='add'>+static int emit_last_fiemap_cache(struct fiemap_extent_info *fieinfo,</div><div class='add'>+				  struct fiemap_cache *cache)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (!cache-&gt;cached)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	ret = fiemap_fill_next_extent(fieinfo, cache-&gt;offset, cache-&gt;phys,</div><div class='add'>+				      cache-&gt;len, cache-&gt;flags);</div><div class='add'>+	cache-&gt;cached = false;</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		ret = 0;</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int fiemap_next_leaf_item(struct btrfs_inode *inode, struct btrfs_path *path)</div><div class='add'>+{</div><div class='add'>+	struct extent_buffer *clone = path-&gt;nodes[0];</div><div class='add'>+	struct btrfs_key key;</div><div class='add'>+	int slot;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	path-&gt;slots[0]++;</div><div class='add'>+	if (path-&gt;slots[0] &lt; btrfs_header_nritems(path-&gt;nodes[0]))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Add a temporary extra ref to an already cloned extent buffer to</div><div class='add'>+	 * prevent btrfs_next_leaf() freeing it, we want to reuse it to avoid</div><div class='add'>+	 * the cost of allocating a new one.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(test_bit(EXTENT_BUFFER_UNMAPPED, &amp;clone-&gt;bflags));</div><div class='add'>+	refcount_inc(&amp;clone-&gt;refs);</div><div class='add'>+</div><div class='add'>+	ret = btrfs_next_leaf(inode-&gt;root, path);</div><div class='add'>+	if (ret != 0)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Don't bother with cloning if there are no more file extent items for</div><div class='add'>+	 * our inode.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, path-&gt;slots[0]);</div><div class='add'>+	if (key.objectid != btrfs_ino(inode) || key.type != BTRFS_EXTENT_DATA_KEY) {</div><div class='add'>+		ret = 1;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Important to preserve the start field, for the optimizations when</div><div class='add'>+	 * checking if extents are shared (see extent_fiemap()).</div><div class='add'>+	 *</div><div class='add'>+	 * We must set -&gt;start before calling copy_extent_buffer_full().  If we</div><div class='add'>+	 * are on sub-pagesize blocksize, we use -&gt;start to determine the offset</div><div class='add'>+	 * into the folio where our eb exists, and if we update -&gt;start after</div><div class='add'>+	 * the fact then any subsequent reads of the eb may read from a</div><div class='add'>+	 * different offset in the folio than where we originally copied into.</div><div class='add'>+	 */</div><div class='add'>+	clone-&gt;start = path-&gt;nodes[0]-&gt;start;</div><div class='add'>+	/* See the comment at fiemap_search_slot() about why we clone. */</div><div class='add'>+	copy_extent_buffer_full(clone, path-&gt;nodes[0]);</div><div class='add'>+</div><div class='add'>+	slot = path-&gt;slots[0];</div><div class='add'>+	btrfs_release_path(path);</div><div class='add'>+	path-&gt;nodes[0] = clone;</div><div class='add'>+	path-&gt;slots[0] = slot;</div><div class='add'>+out:</div><div class='add'>+	if (ret)</div><div class='add'>+		free_extent_buffer(clone);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Search for the first file extent item that starts at a given file offset or</div><div class='add'>+ * the one that starts immediately before that offset.</div><div class='add'>+ * Returns: 0 on success, &lt; 0 on error, 1 if not found.</div><div class='add'>+ */</div><div class='add'>+static int fiemap_search_slot(struct btrfs_inode *inode, struct btrfs_path *path,</div><div class='add'>+			      u64 file_offset)</div><div class='add'>+{</div><div class='add'>+	const u64 ino = btrfs_ino(inode);</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	struct extent_buffer *clone;</div><div class='add'>+	struct btrfs_key key;</div><div class='add'>+	int slot;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	key.objectid = ino;</div><div class='add'>+	key.type = BTRFS_EXTENT_DATA_KEY;</div><div class='add'>+	key.offset = file_offset;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	if (ret &gt; 0 &amp;&amp; path-&gt;slots[0] &gt; 0) {</div><div class='add'>+		btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, path-&gt;slots[0] - 1);</div><div class='add'>+		if (key.objectid == ino &amp;&amp; key.type == BTRFS_EXTENT_DATA_KEY)</div><div class='add'>+			path-&gt;slots[0]--;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (path-&gt;slots[0] &gt;= btrfs_header_nritems(path-&gt;nodes[0])) {</div><div class='add'>+		ret = btrfs_next_leaf(root, path);</div><div class='add'>+		if (ret != 0)</div><div class='add'>+			return ret;</div><div class='add'>+</div><div class='add'>+		btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, path-&gt;slots[0]);</div><div class='add'>+		if (key.objectid != ino || key.type != BTRFS_EXTENT_DATA_KEY)</div><div class='add'>+			return 1;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We clone the leaf and use it during fiemap. This is because while</div><div class='add'>+	 * using the leaf we do expensive things like checking if an extent is</div><div class='add'>+	 * shared, which can take a long time. In order to prevent blocking</div><div class='add'>+	 * other tasks for too long, we use a clone of the leaf. We have locked</div><div class='add'>+	 * the file range in the inode's io tree, so we know none of our file</div><div class='add'>+	 * extent items can change. This way we avoid blocking other tasks that</div><div class='add'>+	 * want to insert items for other inodes in the same leaf or b+tree</div><div class='add'>+	 * rebalance operations (triggered for example when someone is trying</div><div class='add'>+	 * to push items into this leaf when trying to insert an item in a</div><div class='add'>+	 * neighbour leaf).</div><div class='add'>+	 * We also need the private clone because holding a read lock on an</div><div class='add'>+	 * extent buffer of the subvolume's b+tree will make lockdep unhappy</div><div class='add'>+	 * when we check if extents are shared, as backref walking may need to</div><div class='add'>+	 * lock the same leaf we are processing.</div><div class='add'>+	 */</div><div class='add'>+	clone = btrfs_clone_extent_buffer(path-&gt;nodes[0]);</div><div class='add'>+	if (!clone)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	slot = path-&gt;slots[0];</div><div class='add'>+	btrfs_release_path(path);</div><div class='add'>+	path-&gt;nodes[0] = clone;</div><div class='add'>+	path-&gt;slots[0] = slot;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Process a range which is a hole or a prealloc extent in the inode's subvolume</div><div class='add'>+ * btree. If @disk_bytenr is 0, we are dealing with a hole, otherwise a prealloc</div><div class='add'>+ * extent. The end offset (@end) is inclusive.</div><div class='add'>+ */</div><div class='add'>+static int fiemap_process_hole(struct btrfs_inode *inode,</div><div class='add'>+			       struct fiemap_extent_info *fieinfo,</div><div class='add'>+			       struct fiemap_cache *cache,</div><div class='add'>+			       struct extent_state **delalloc_cached_state,</div><div class='add'>+			       struct btrfs_backref_share_check_ctx *backref_ctx,</div><div class='add'>+			       u64 disk_bytenr, u64 extent_offset,</div><div class='add'>+			       u64 extent_gen,</div><div class='add'>+			       u64 start, u64 end)</div><div class='add'>+{</div><div class='add'>+	const u64 i_size = i_size_read(&amp;inode-&gt;vfs_inode);</div><div class='add'>+	u64 cur_offset = start;</div><div class='add'>+	u64 last_delalloc_end = 0;</div><div class='add'>+	u32 prealloc_flags = FIEMAP_EXTENT_UNWRITTEN;</div><div class='add'>+	bool checked_extent_shared = false;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * There can be no delalloc past i_size, so don't waste time looking for</div><div class='add'>+	 * it beyond i_size.</div><div class='add'>+	 */</div><div class='add'>+	while (cur_offset &lt; end &amp;&amp; cur_offset &lt; i_size) {</div><div class='add'>+		u64 delalloc_start;</div><div class='add'>+		u64 delalloc_end;</div><div class='add'>+		u64 prealloc_start;</div><div class='add'>+		u64 prealloc_len = 0;</div><div class='add'>+		bool delalloc;</div><div class='add'>+</div><div class='add'>+		delalloc = btrfs_find_delalloc_in_range(inode, cur_offset, end,</div><div class='add'>+							delalloc_cached_state,</div><div class='add'>+							&amp;delalloc_start,</div><div class='add'>+							&amp;delalloc_end);</div><div class='add'>+		if (!delalloc)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * If this is a prealloc extent we have to report every section</div><div class='add'>+		 * of it that has no delalloc.</div><div class='add'>+		 */</div><div class='add'>+		if (disk_bytenr != 0) {</div><div class='add'>+			if (last_delalloc_end == 0) {</div><div class='add'>+				prealloc_start = start;</div><div class='add'>+				prealloc_len = delalloc_start - start;</div><div class='add'>+			} else {</div><div class='add'>+				prealloc_start = last_delalloc_end + 1;</div><div class='add'>+				prealloc_len = delalloc_start - prealloc_start;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (prealloc_len &gt; 0) {</div><div class='add'>+			if (!checked_extent_shared &amp;&amp; fieinfo-&gt;fi_extents_max) {</div><div class='add'>+				ret = btrfs_is_data_extent_shared(inode,</div><div class='add'>+								  disk_bytenr,</div><div class='add'>+								  extent_gen,</div><div class='add'>+								  backref_ctx);</div><div class='add'>+				if (ret &lt; 0)</div><div class='add'>+					return ret;</div><div class='add'>+				else if (ret &gt; 0)</div><div class='add'>+					prealloc_flags |= FIEMAP_EXTENT_SHARED;</div><div class='add'>+</div><div class='add'>+				checked_extent_shared = true;</div><div class='add'>+			}</div><div class='add'>+			ret = emit_fiemap_extent(fieinfo, cache, prealloc_start,</div><div class='add'>+						 disk_bytenr + extent_offset,</div><div class='add'>+						 prealloc_len, prealloc_flags);</div><div class='add'>+			if (ret)</div><div class='add'>+				return ret;</div><div class='add'>+			extent_offset += prealloc_len;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		ret = emit_fiemap_extent(fieinfo, cache, delalloc_start, 0,</div><div class='add'>+					 delalloc_end + 1 - delalloc_start,</div><div class='add'>+					 FIEMAP_EXTENT_DELALLOC |</div><div class='add'>+					 FIEMAP_EXTENT_UNKNOWN);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+</div><div class='add'>+		last_delalloc_end = delalloc_end;</div><div class='add'>+		cur_offset = delalloc_end + 1;</div><div class='add'>+		extent_offset += cur_offset - delalloc_start;</div><div class='add'>+		cond_resched();</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Either we found no delalloc for the whole prealloc extent or we have</div><div class='add'>+	 * a prealloc extent that spans i_size or starts at or after i_size.</div><div class='add'>+	 */</div><div class='add'>+	if (disk_bytenr != 0 &amp;&amp; last_delalloc_end &lt; end) {</div><div class='add'>+		u64 prealloc_start;</div><div class='add'>+		u64 prealloc_len;</div><div class='add'>+</div><div class='add'>+		if (last_delalloc_end == 0) {</div><div class='add'>+			prealloc_start = start;</div><div class='add'>+			prealloc_len = end + 1 - start;</div><div class='add'>+		} else {</div><div class='add'>+			prealloc_start = last_delalloc_end + 1;</div><div class='add'>+			prealloc_len = end + 1 - prealloc_start;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (!checked_extent_shared &amp;&amp; fieinfo-&gt;fi_extents_max) {</div><div class='add'>+			ret = btrfs_is_data_extent_shared(inode,</div><div class='add'>+							  disk_bytenr,</div><div class='add'>+							  extent_gen,</div><div class='add'>+							  backref_ctx);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				return ret;</div><div class='add'>+			else if (ret &gt; 0)</div><div class='add'>+				prealloc_flags |= FIEMAP_EXTENT_SHARED;</div><div class='add'>+		}</div><div class='add'>+		ret = emit_fiemap_extent(fieinfo, cache, prealloc_start,</div><div class='add'>+					 disk_bytenr + extent_offset,</div><div class='add'>+					 prealloc_len, prealloc_flags);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int fiemap_find_last_extent_offset(struct btrfs_inode *inode,</div><div class='add'>+					  struct btrfs_path *path,</div><div class='add'>+					  u64 *last_extent_end_ret)</div><div class='add'>+{</div><div class='add'>+	const u64 ino = btrfs_ino(inode);</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	struct extent_buffer *leaf;</div><div class='add'>+	struct btrfs_file_extent_item *ei;</div><div class='add'>+	struct btrfs_key key;</div><div class='add'>+	u64 disk_bytenr;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Lookup the last file extent. We're not using i_size here because</div><div class='add'>+	 * there might be preallocation past i_size.</div><div class='add'>+	 */</div><div class='add'>+	ret = btrfs_lookup_file_extent(NULL, root, path, ino, (u64)-1, 0);</div><div class='add'>+	/* There can't be a file extent item at offset (u64)-1 */</div><div class='add'>+	ASSERT(ret != 0);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * For a non-existing key, btrfs_search_slot() always leaves us at a</div><div class='add'>+	 * slot &gt; 0, except if the btree is empty, which is impossible because</div><div class='add'>+	 * at least it has the inode item for this inode and all the items for</div><div class='add'>+	 * the root inode 256.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(path-&gt;slots[0] &gt; 0);</div><div class='add'>+	path-&gt;slots[0]--;</div><div class='add'>+	leaf = path-&gt;nodes[0];</div><div class='add'>+	btrfs_item_key_to_cpu(leaf, &amp;key, path-&gt;slots[0]);</div><div class='add'>+	if (key.objectid != ino || key.type != BTRFS_EXTENT_DATA_KEY) {</div><div class='add'>+		/* No file extent items in the subvolume tree. */</div><div class='add'>+		*last_extent_end_ret = 0;</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * For an inline extent, the disk_bytenr is where inline data starts at,</div><div class='add'>+	 * so first check if we have an inline extent item before checking if we</div><div class='add'>+	 * have an implicit hole (disk_bytenr == 0).</div><div class='add'>+	 */</div><div class='add'>+	ei = btrfs_item_ptr(leaf, path-&gt;slots[0], struct btrfs_file_extent_item);</div><div class='add'>+	if (btrfs_file_extent_type(leaf, ei) == BTRFS_FILE_EXTENT_INLINE) {</div><div class='add'>+		*last_extent_end_ret = btrfs_file_extent_end(path);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Find the last file extent item that is not a hole (when NO_HOLES is</div><div class='add'>+	 * not enabled). This should take at most 2 iterations in the worst</div><div class='add'>+	 * case: we have one hole file extent item at slot 0 of a leaf and</div><div class='add'>+	 * another hole file extent item as the last item in the previous leaf.</div><div class='add'>+	 * This is because we merge file extent items that represent holes.</div><div class='add'>+	 */</div><div class='add'>+	disk_bytenr = btrfs_file_extent_disk_bytenr(leaf, ei);</div><div class='add'>+	while (disk_bytenr == 0) {</div><div class='add'>+		ret = btrfs_previous_item(root, path, ino, BTRFS_EXTENT_DATA_KEY);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			return ret;</div><div class='add'>+		} else if (ret &gt; 0) {</div><div class='add'>+			/* No file extent items that are not holes. */</div><div class='add'>+			*last_extent_end_ret = 0;</div><div class='add'>+			return 0;</div><div class='add'>+		}</div><div class='add'>+		leaf = path-&gt;nodes[0];</div><div class='add'>+		ei = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='add'>+				    struct btrfs_file_extent_item);</div><div class='add'>+		disk_bytenr = btrfs_file_extent_disk_bytenr(leaf, ei);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	*last_extent_end_ret = btrfs_file_extent_end(path);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int extent_fiemap(struct btrfs_inode *inode,</div><div class='add'>+			 struct fiemap_extent_info *fieinfo,</div><div class='add'>+			 u64 start, u64 len)</div><div class='add'>+{</div><div class='add'>+	const u64 ino = btrfs_ino(inode);</div><div class='add'>+	struct extent_state *cached_state = NULL;</div><div class='add'>+	struct extent_state *delalloc_cached_state = NULL;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='add'>+	struct fiemap_cache cache = { 0 };</div><div class='add'>+	struct btrfs_backref_share_check_ctx *backref_ctx;</div><div class='add'>+	u64 last_extent_end = 0;</div><div class='add'>+	u64 prev_extent_end;</div><div class='add'>+	u64 range_start;</div><div class='add'>+	u64 range_end;</div><div class='add'>+	const u64 sectorsize = inode-&gt;root-&gt;fs_info-&gt;sectorsize;</div><div class='add'>+	bool stopped = false;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	cache.entries_size = PAGE_SIZE / sizeof(struct btrfs_fiemap_entry);</div><div class='add'>+	cache.entries = kmalloc_array(cache.entries_size,</div><div class='add'>+				      sizeof(struct btrfs_fiemap_entry),</div><div class='add'>+				      GFP_KERNEL);</div><div class='add'>+	backref_ctx = btrfs_alloc_backref_share_check_ctx();</div><div class='add'>+	path = btrfs_alloc_path();</div><div class='add'>+	if (!cache.entries || !backref_ctx || !path) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+restart:</div><div class='add'>+	range_start = round_down(start, sectorsize);</div><div class='add'>+	range_end = round_up(start + len, sectorsize);</div><div class='add'>+	prev_extent_end = range_start;</div><div class='add'>+</div><div class='add'>+	btrfs_lock_extent(&amp;inode-&gt;io_tree, range_start, range_end, &amp;cached_state);</div><div class='add'>+</div><div class='add'>+	ret = fiemap_find_last_extent_offset(inode, path, &amp;last_extent_end);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	btrfs_release_path(path);</div><div class='add'>+</div><div class='add'>+	path-&gt;reada = READA_FORWARD;</div><div class='add'>+	ret = fiemap_search_slot(inode, path, range_start);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	} else if (ret &gt; 0) {</div><div class='add'>+		/*</div><div class='add'>+		 * No file extent item found, but we may have delalloc between</div><div class='add'>+		 * the current offset and i_size. So check for that.</div><div class='add'>+		 */</div><div class='add'>+		ret = 0;</div><div class='add'>+		goto check_eof_delalloc;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	while (prev_extent_end &lt; range_end) {</div><div class='add'>+		struct extent_buffer *leaf = path-&gt;nodes[0];</div><div class='add'>+		struct btrfs_file_extent_item *ei;</div><div class='add'>+		struct btrfs_key key;</div><div class='add'>+		u64 extent_end;</div><div class='add'>+		u64 extent_len;</div><div class='add'>+		u64 extent_offset = 0;</div><div class='add'>+		u64 extent_gen;</div><div class='add'>+		u64 disk_bytenr = 0;</div><div class='add'>+		u64 flags = 0;</div><div class='add'>+		int extent_type;</div><div class='add'>+		u8 compression;</div><div class='add'>+</div><div class='add'>+		btrfs_item_key_to_cpu(leaf, &amp;key, path-&gt;slots[0]);</div><div class='add'>+		if (key.objectid != ino || key.type != BTRFS_EXTENT_DATA_KEY)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		extent_end = btrfs_file_extent_end(path);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * The first iteration can leave us at an extent item that ends</div><div class='add'>+		 * before our range's start. Move to the next item.</div><div class='add'>+		 */</div><div class='add'>+		if (extent_end &lt;= range_start)</div><div class='add'>+			goto next_item;</div><div class='add'>+</div><div class='add'>+		backref_ctx-&gt;curr_leaf_bytenr = leaf-&gt;start;</div><div class='add'>+</div><div class='add'>+		/* We have in implicit hole (NO_HOLES feature enabled). */</div><div class='add'>+		if (prev_extent_end &lt; key.offset) {</div><div class='add'>+			const u64 hole_end = min(key.offset, range_end) - 1;</div><div class='add'>+</div><div class='add'>+			ret = fiemap_process_hole(inode, fieinfo, &amp;cache,</div><div class='add'>+						  &amp;delalloc_cached_state,</div><div class='add'>+						  backref_ctx, 0, 0, 0,</div><div class='add'>+						  prev_extent_end, hole_end);</div><div class='add'>+			if (ret &lt; 0) {</div><div class='add'>+				goto out_unlock;</div><div class='add'>+			} else if (ret &gt; 0) {</div><div class='add'>+				/* fiemap_fill_next_extent() told us to stop. */</div><div class='add'>+				stopped = true;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			/* We've reached the end of the fiemap range, stop. */</div><div class='add'>+			if (key.offset &gt;= range_end) {</div><div class='add'>+				stopped = true;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		extent_len = extent_end - key.offset;</div><div class='add'>+		ei = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='add'>+				    struct btrfs_file_extent_item);</div><div class='add'>+		compression = btrfs_file_extent_compression(leaf, ei);</div><div class='add'>+		extent_type = btrfs_file_extent_type(leaf, ei);</div><div class='add'>+		extent_gen = btrfs_file_extent_generation(leaf, ei);</div><div class='add'>+</div><div class='add'>+		if (extent_type != BTRFS_FILE_EXTENT_INLINE) {</div><div class='add'>+			disk_bytenr = btrfs_file_extent_disk_bytenr(leaf, ei);</div><div class='add'>+			if (compression == BTRFS_COMPRESS_NONE)</div><div class='add'>+				extent_offset = btrfs_file_extent_offset(leaf, ei);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (compression != BTRFS_COMPRESS_NONE)</div><div class='add'>+			flags |= FIEMAP_EXTENT_ENCODED;</div><div class='add'>+</div><div class='add'>+		if (extent_type == BTRFS_FILE_EXTENT_INLINE) {</div><div class='add'>+			flags |= FIEMAP_EXTENT_DATA_INLINE;</div><div class='add'>+			flags |= FIEMAP_EXTENT_NOT_ALIGNED;</div><div class='add'>+			ret = emit_fiemap_extent(fieinfo, &amp;cache, key.offset, 0,</div><div class='add'>+						 extent_len, flags);</div><div class='add'>+		} else if (extent_type == BTRFS_FILE_EXTENT_PREALLOC) {</div><div class='add'>+			ret = fiemap_process_hole(inode, fieinfo, &amp;cache,</div><div class='add'>+						  &amp;delalloc_cached_state,</div><div class='add'>+						  backref_ctx,</div><div class='add'>+						  disk_bytenr, extent_offset,</div><div class='add'>+						  extent_gen, key.offset,</div><div class='add'>+						  extent_end - 1);</div><div class='add'>+		} else if (disk_bytenr == 0) {</div><div class='add'>+			/* We have an explicit hole. */</div><div class='add'>+			ret = fiemap_process_hole(inode, fieinfo, &amp;cache,</div><div class='add'>+						  &amp;delalloc_cached_state,</div><div class='add'>+						  backref_ctx, 0, 0, 0,</div><div class='add'>+						  key.offset, extent_end - 1);</div><div class='add'>+		} else {</div><div class='add'>+			/* We have a regular extent. */</div><div class='add'>+			if (fieinfo-&gt;fi_extents_max) {</div><div class='add'>+				ret = btrfs_is_data_extent_shared(inode,</div><div class='add'>+								  disk_bytenr,</div><div class='add'>+								  extent_gen,</div><div class='add'>+								  backref_ctx);</div><div class='add'>+				if (ret &lt; 0)</div><div class='add'>+					goto out_unlock;</div><div class='add'>+				else if (ret &gt; 0)</div><div class='add'>+					flags |= FIEMAP_EXTENT_SHARED;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			ret = emit_fiemap_extent(fieinfo, &amp;cache, key.offset,</div><div class='add'>+						 disk_bytenr + extent_offset,</div><div class='add'>+						 extent_len, flags);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			goto out_unlock;</div><div class='add'>+		} else if (ret &gt; 0) {</div><div class='add'>+			/* emit_fiemap_extent() told us to stop. */</div><div class='add'>+			stopped = true;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		prev_extent_end = extent_end;</div><div class='add'>+next_item:</div><div class='add'>+		if (fatal_signal_pending(current)) {</div><div class='add'>+			ret = -EINTR;</div><div class='add'>+			goto out_unlock;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		ret = fiemap_next_leaf_item(inode, path);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			goto out_unlock;</div><div class='add'>+		} else if (ret &gt; 0) {</div><div class='add'>+			/* No more file extent items for this inode. */</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		cond_resched();</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+check_eof_delalloc:</div><div class='add'>+	if (!stopped &amp;&amp; prev_extent_end &lt; range_end) {</div><div class='add'>+		ret = fiemap_process_hole(inode, fieinfo, &amp;cache,</div><div class='add'>+					  &amp;delalloc_cached_state, backref_ctx,</div><div class='add'>+					  0, 0, 0, prev_extent_end, range_end - 1);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out_unlock;</div><div class='add'>+		prev_extent_end = range_end;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (cache.cached &amp;&amp; cache.offset + cache.len &gt;= last_extent_end) {</div><div class='add'>+		const u64 i_size = i_size_read(&amp;inode-&gt;vfs_inode);</div><div class='add'>+</div><div class='add'>+		if (prev_extent_end &lt; i_size) {</div><div class='add'>+			u64 delalloc_start;</div><div class='add'>+			u64 delalloc_end;</div><div class='add'>+			bool delalloc;</div><div class='add'>+</div><div class='add'>+			delalloc = btrfs_find_delalloc_in_range(inode,</div><div class='add'>+								prev_extent_end,</div><div class='add'>+								i_size - 1,</div><div class='add'>+								&amp;delalloc_cached_state,</div><div class='add'>+								&amp;delalloc_start,</div><div class='add'>+								&amp;delalloc_end);</div><div class='add'>+			if (!delalloc)</div><div class='add'>+				cache.flags |= FIEMAP_EXTENT_LAST;</div><div class='add'>+		} else {</div><div class='add'>+			cache.flags |= FIEMAP_EXTENT_LAST;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+out_unlock:</div><div class='add'>+	btrfs_unlock_extent(&amp;inode-&gt;io_tree, range_start, range_end, &amp;cached_state);</div><div class='add'>+</div><div class='add'>+	if (ret == BTRFS_FIEMAP_FLUSH_CACHE) {</div><div class='add'>+		btrfs_release_path(path);</div><div class='add'>+		ret = flush_fiemap_cache(fieinfo, &amp;cache);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out;</div><div class='add'>+		len -= cache.next_search_offset - start;</div><div class='add'>+		start = cache.next_search_offset;</div><div class='add'>+		goto restart;</div><div class='add'>+	} else if (ret &lt; 0) {</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Must free the path before emitting to the fiemap buffer because we</div><div class='add'>+	 * may have a non-cloned leaf and if the fiemap buffer is memory mapped</div><div class='add'>+	 * to a file, a write into it (through btrfs_page_mkwrite()) may trigger</div><div class='add'>+	 * waiting for an ordered extent that in order to complete needs to</div><div class='add'>+	 * modify that leaf, therefore leading to a deadlock.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_free_path(path);</div><div class='add'>+	path = NULL;</div><div class='add'>+</div><div class='add'>+	ret = flush_fiemap_cache(fieinfo, &amp;cache);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	ret = emit_last_fiemap_cache(fieinfo, &amp;cache);</div><div class='add'>+out:</div><div class='add'>+	btrfs_free_extent_state(delalloc_cached_state);</div><div class='add'>+	kfree(cache.entries);</div><div class='add'>+	btrfs_free_backref_share_ctx(backref_ctx);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_fiemap(struct inode *inode, struct fiemap_extent_info *fieinfo,</div><div class='add'>+		 u64 start, u64 len)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_inode *btrfs_inode = BTRFS_I(inode);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = fiemap_prep(inode, fieinfo, start, &amp;len, 0);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * fiemap_prep() called filemap_write_and_wait() for the whole possible</div><div class='add'>+	 * file range (0 to LLONG_MAX), but that is not enough if we have</div><div class='add'>+	 * compression enabled. The first filemap_fdatawrite_range() only kicks</div><div class='add'>+	 * in the compression of data (in an async thread) and will return</div><div class='add'>+	 * before the compression is done and writeback is started. A second</div><div class='add'>+	 * filemap_fdatawrite_range() is needed to wait for the compression to</div><div class='add'>+	 * complete and writeback to start. We also need to wait for ordered</div><div class='add'>+	 * extents to complete, because our fiemap implementation uses mainly</div><div class='add'>+	 * file extent items to list the extents, searching for extent maps</div><div class='add'>+	 * only for file ranges with holes or prealloc extents to figure out</div><div class='add'>+	 * if we have delalloc in those ranges.</div><div class='add'>+	 */</div><div class='add'>+	if (fieinfo-&gt;fi_flags &amp; FIEMAP_FLAG_SYNC) {</div><div class='add'>+		ret = btrfs_wait_ordered_range(btrfs_inode, 0, LLONG_MAX);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	btrfs_inode_lock(btrfs_inode, BTRFS_ILOCK_SHARED);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We did an initial flush to avoid holding the inode's lock while</div><div class='add'>+	 * triggering writeback and waiting for the completion of IO and ordered</div><div class='add'>+	 * extents. Now after we locked the inode we do it again, because it's</div><div class='add'>+	 * possible a new write may have happened in between those two steps.</div><div class='add'>+	 */</div><div class='add'>+	if (fieinfo-&gt;fi_flags &amp; FIEMAP_FLAG_SYNC) {</div><div class='add'>+		ret = btrfs_wait_ordered_range(btrfs_inode, 0, LLONG_MAX);</div><div class='add'>+		if (ret) {</div><div class='add'>+			btrfs_inode_unlock(btrfs_inode, BTRFS_ILOCK_SHARED);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = extent_fiemap(btrfs_inode, fieinfo, start, len);</div><div class='add'>+	btrfs_inode_unlock(btrfs_inode, BTRFS_ILOCK_SHARED);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/btrfs/fiemap.h b/fs/btrfs/fiemap.h<br/>new file mode 100644<br/>index 000000000000..cfd74b35988f<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/fiemap.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/fiemap.h</a></div><div class='hunk'>@@ -0,0 +1,11 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+</div><div class='add'>+#ifndef BTRFS_FIEMAP_H</div><div class='add'>+#define BTRFS_FIEMAP_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/fiemap.h&gt;</div><div class='add'>+</div><div class='add'>+int btrfs_fiemap(struct inode *inode, struct fiemap_extent_info *fieinfo,</div><div class='add'>+		 u64 start, u64 len);</div><div class='add'>+</div><div class='add'>+#endif /* BTRFS_FIEMAP_H */</div><div class='head'>diff --git a/fs/btrfs/file-item.c b/fs/btrfs/file-item.c<br/>index d1cbb64a78f3..14e5257f0f04 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/file-item.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/file-item.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/file-item.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/file-item.c</a></div><div class='hunk'>@@ -9,13 +9,16 @@</div><div class='ctx'> #include &lt;linux/highmem.h&gt;</div><div class='ctx'> #include &lt;linux/sched/mm.h&gt;</div><div class='ctx'> #include &lt;crypto/hash.h&gt;</div><div class='del'>-#include "misc.h"</div><div class='add'>+#include "messages.h"</div><div class='ctx'> #include "ctree.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='ctx'> #include "transaction.h"</div><div class='del'>-#include "volumes.h"</div><div class='del'>-#include "print-tree.h"</div><div class='add'>+#include "bio.h"</div><div class='ctx'> #include "compression.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "file-item.h"</div><div class='add'>+#include "volumes.h"</div><div class='ctx'> </div><div class='ctx'> #define __MAX_CSUM_ITEMS(r, size) ((unsigned long)(((BTRFS_LEAF_DATA_SIZE(r) - \</div><div class='ctx'> 				   sizeof(struct btrfs_item) * 2) / \</div><div class='hunk'>@@ -24,8 +27,8 @@</div><div class='ctx'> #define MAX_CSUM_ITEMS(r, size) (min_t(u32, __MAX_CSUM_ITEMS(r, size), \</div><div class='ctx'> 				       PAGE_SIZE))</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * Set inode's size according to filesystem options</div><div class='add'>+/*</div><div class='add'>+ * Set inode's size according to filesystem options.</div><div class='ctx'>  *</div><div class='ctx'>  * @inode:      inode we want to update the disk_i_size for</div><div class='ctx'>  * @new_i_size: i_size we want to set to, 0 if we use i_size</div><div class='hunk'>@@ -43,29 +46,29 @@</div><div class='ctx'>  */</div><div class='ctx'> void btrfs_inode_safe_disk_i_size_write(struct btrfs_inode *inode, u64 new_i_size)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='ctx'> 	u64 start, end, i_size;</div><div class='del'>-	int ret;</div><div class='add'>+	bool found;</div><div class='ctx'> </div><div class='add'>+	spin_lock(&amp;inode-&gt;lock);</div><div class='ctx'> 	i_size = new_i_size ?: i_size_read(&amp;inode-&gt;vfs_inode);</div><div class='del'>-	if (btrfs_fs_incompat(fs_info, NO_HOLES)) {</div><div class='add'>+	if (!inode-&gt;file_extent_tree) {</div><div class='ctx'> 		inode-&gt;disk_i_size = i_size;</div><div class='del'>-		return;</div><div class='add'>+		goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;inode-&gt;lock);</div><div class='del'>-	ret = find_contiguous_extent_bit(&amp;inode-&gt;file_extent_tree, 0, &amp;start,</div><div class='del'>-					 &amp;end, EXTENT_DIRTY);</div><div class='del'>-	if (!ret &amp;&amp; start == 0)</div><div class='add'>+	found = btrfs_find_contiguous_extent_bit(inode-&gt;file_extent_tree, 0, &amp;start,</div><div class='add'>+						 &amp;end, EXTENT_DIRTY);</div><div class='add'>+	if (found &amp;&amp; start == 0)</div><div class='ctx'> 		i_size = min(i_size, end + 1);</div><div class='ctx'> 	else</div><div class='ctx'> 		i_size = 0;</div><div class='ctx'> 	inode-&gt;disk_i_size = i_size;</div><div class='add'>+out_unlock:</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * Mark range within a file as having a new extent inserted</div><div class='add'>+/*</div><div class='add'>+ * Mark range within a file as having a new extent inserted.</div><div class='ctx'>  *</div><div class='ctx'>  * @inode: inode being modified</div><div class='ctx'>  * @start: start file offset of the file extent we've inserted</div><div class='hunk'>@@ -81,19 +84,20 @@ void btrfs_inode_safe_disk_i_size_write(struct btrfs_inode *inode, u64 new_i_siz</div><div class='ctx'> int btrfs_inode_set_file_extent_range(struct btrfs_inode *inode, u64 start,</div><div class='ctx'> 				      u64 len)</div><div class='ctx'> {</div><div class='add'>+	if (!inode-&gt;file_extent_tree)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='ctx'> 	if (len == 0)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	ASSERT(IS_ALIGNED(start + len, inode-&gt;root-&gt;fs_info-&gt;sectorsize));</div><div class='ctx'> </div><div class='del'>-	if (btrfs_fs_incompat(inode-&gt;root-&gt;fs_info, NO_HOLES))</div><div class='del'>-		return 0;</div><div class='del'>-	return set_extent_bits(&amp;inode-&gt;file_extent_tree, start, start + len - 1,</div><div class='del'>-			       EXTENT_DIRTY);</div><div class='add'>+	return btrfs_set_extent_bit(inode-&gt;file_extent_tree, start, start + len - 1,</div><div class='add'>+				    EXTENT_DIRTY, NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * Marks an inode range as not having a backing extent</div><div class='add'>+/*</div><div class='add'>+ * Mark an inode range as not having a backing extent.</div><div class='ctx'>  *</div><div class='ctx'>  * @inode: inode being modified</div><div class='ctx'>  * @start: start file offset of the file extent we've inserted</div><div class='hunk'>@@ -109,68 +113,86 @@ int btrfs_inode_set_file_extent_range(struct btrfs_inode *inode, u64 start,</div><div class='ctx'> int btrfs_inode_clear_file_extent_range(struct btrfs_inode *inode, u64 start,</div><div class='ctx'> 					u64 len)</div><div class='ctx'> {</div><div class='add'>+	if (!inode-&gt;file_extent_tree)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='ctx'> 	if (len == 0)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	ASSERT(IS_ALIGNED(start + len, inode-&gt;root-&gt;fs_info-&gt;sectorsize) ||</div><div class='ctx'> 	       len == (u64)-1);</div><div class='ctx'> </div><div class='del'>-	if (btrfs_fs_incompat(inode-&gt;root-&gt;fs_info, NO_HOLES))</div><div class='del'>-		return 0;</div><div class='del'>-	return clear_extent_bit(&amp;inode-&gt;file_extent_tree, start,</div><div class='del'>-				start + len - 1, EXTENT_DIRTY, 0, 0, NULL);</div><div class='add'>+	return btrfs_clear_extent_bit(inode-&gt;file_extent_tree, start,</div><div class='add'>+				      start + len - 1, EXTENT_DIRTY, NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 max_ordered_sum_bytes(struct btrfs_fs_info *fs_info,</div><div class='del'>-					u16 csum_size)</div><div class='add'>+static size_t bytes_to_csum_size(const struct btrfs_fs_info *fs_info, u32 bytes)</div><div class='ctx'> {</div><div class='del'>-	u32 ncsums = (PAGE_SIZE - sizeof(struct btrfs_ordered_sum)) / csum_size;</div><div class='add'>+	ASSERT(IS_ALIGNED(bytes, fs_info-&gt;sectorsize));</div><div class='ctx'> </div><div class='del'>-	return ncsums * fs_info-&gt;sectorsize;</div><div class='add'>+	return (bytes &gt;&gt; fs_info-&gt;sectorsize_bits) * fs_info-&gt;csum_size;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_insert_file_extent(struct btrfs_trans_handle *trans,</div><div class='add'>+static size_t csum_size_to_bytes(const struct btrfs_fs_info *fs_info, u32 csum_size)</div><div class='add'>+{</div><div class='add'>+	ASSERT(IS_ALIGNED(csum_size, fs_info-&gt;csum_size));</div><div class='add'>+</div><div class='add'>+	return (csum_size / fs_info-&gt;csum_size) &lt;&lt; fs_info-&gt;sectorsize_bits;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline u32 max_ordered_sum_bytes(const struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	u32 max_csum_size = round_down(PAGE_SIZE - sizeof(struct btrfs_ordered_sum),</div><div class='add'>+				       fs_info-&gt;csum_size);</div><div class='add'>+</div><div class='add'>+	return csum_size_to_bytes(fs_info, max_csum_size);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Calculate the total size needed to allocate for an ordered sum structure</div><div class='add'>+ * spanning @bytes in the file.</div><div class='add'>+ */</div><div class='add'>+static int btrfs_ordered_sum_size(const struct btrfs_fs_info *fs_info, unsigned long bytes)</div><div class='add'>+{</div><div class='add'>+	return sizeof(struct btrfs_ordered_sum) + bytes_to_csum_size(fs_info, bytes);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_insert_hole_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			     struct btrfs_root *root,</div><div class='del'>-			     u64 objectid, u64 pos,</div><div class='del'>-			     u64 disk_offset, u64 disk_num_bytes,</div><div class='del'>-			     u64 num_bytes, u64 offset, u64 ram_bytes,</div><div class='del'>-			     u8 compression, u8 encryption, u16 other_encoding)</div><div class='add'>+			     u64 objectid, u64 pos, u64 num_bytes)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	struct btrfs_file_extent_item *item;</div><div class='ctx'> 	struct btrfs_key file_key;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='add'>+</div><div class='ctx'> 	file_key.objectid = objectid;</div><div class='del'>-	file_key.offset = pos;</div><div class='ctx'> 	file_key.type = BTRFS_EXTENT_DATA_KEY;</div><div class='add'>+	file_key.offset = pos;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_insert_empty_item(trans, root, path, &amp;file_key,</div><div class='ctx'> 				      sizeof(*item));</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-	BUG_ON(ret); /* Can't happen */</div><div class='add'>+		return ret;</div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	item = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='ctx'> 			      struct btrfs_file_extent_item);</div><div class='del'>-	btrfs_set_file_extent_disk_bytenr(leaf, item, disk_offset);</div><div class='del'>-	btrfs_set_file_extent_disk_num_bytes(leaf, item, disk_num_bytes);</div><div class='del'>-	btrfs_set_file_extent_offset(leaf, item, offset);</div><div class='add'>+	btrfs_set_file_extent_disk_bytenr(leaf, item, 0);</div><div class='add'>+	btrfs_set_file_extent_disk_num_bytes(leaf, item, 0);</div><div class='add'>+	btrfs_set_file_extent_offset(leaf, item, 0);</div><div class='ctx'> 	btrfs_set_file_extent_num_bytes(leaf, item, num_bytes);</div><div class='del'>-	btrfs_set_file_extent_ram_bytes(leaf, item, ram_bytes);</div><div class='add'>+	btrfs_set_file_extent_ram_bytes(leaf, item, num_bytes);</div><div class='ctx'> 	btrfs_set_file_extent_generation(leaf, item, trans-&gt;transid);</div><div class='ctx'> 	btrfs_set_file_extent_type(leaf, item, BTRFS_FILE_EXTENT_REG);</div><div class='del'>-	btrfs_set_file_extent_compression(leaf, item, compression);</div><div class='del'>-	btrfs_set_file_extent_encryption(leaf, item, encryption);</div><div class='del'>-	btrfs_set_file_extent_other_encoding(leaf, item, other_encoding);</div><div class='add'>+	btrfs_set_file_extent_compression(leaf, item, 0);</div><div class='add'>+	btrfs_set_file_extent_encryption(leaf, item, 0);</div><div class='add'>+	btrfs_set_file_extent_other_encoding(leaf, item, 0);</div><div class='ctx'> </div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -191,8 +213,8 @@ btrfs_lookup_csum(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	int csums_in_item;</div><div class='ctx'> </div><div class='ctx'> 	file_key.objectid = BTRFS_EXTENT_CSUM_OBJECTID;</div><div class='del'>-	file_key.offset = bytenr;</div><div class='ctx'> 	file_key.type = BTRFS_EXTENT_CSUM_KEY;</div><div class='add'>+	file_key.offset = bytenr;</div><div class='ctx'> 	ret = btrfs_search_slot(trans, root, &amp;file_key, path, 0, cow);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto fail;</div><div class='hunk'>@@ -208,7 +230,7 @@ btrfs_lookup_csum(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 		csum_offset = (bytenr - found_key.offset) &gt;&gt;</div><div class='ctx'> 				fs_info-&gt;sectorsize_bits;</div><div class='del'>-		csums_in_item = btrfs_item_size_nr(leaf, path-&gt;slots[0]);</div><div class='add'>+		csums_in_item = btrfs_item_size(leaf, path-&gt;slots[0]);</div><div class='ctx'> 		csums_in_item /= csum_size;</div><div class='ctx'> </div><div class='ctx'> 		if (csum_offset == csums_in_item) {</div><div class='hunk'>@@ -238,15 +260,15 @@ int btrfs_lookup_file_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	int cow = mod != 0;</div><div class='ctx'> </div><div class='ctx'> 	file_key.objectid = objectid;</div><div class='del'>-	file_key.offset = offset;</div><div class='ctx'> 	file_key.type = BTRFS_EXTENT_DATA_KEY;</div><div class='add'>+	file_key.offset = offset;</div><div class='ctx'> </div><div class='ctx'> 	return btrfs_search_slot(trans, root, &amp;file_key, path, ins_len, cow);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Find checksums for logical bytenr range [disk_bytenr, disk_bytenr + len) and</div><div class='del'>- * estore the result to @dst.</div><div class='add'>+ * store the result to @dst.</div><div class='ctx'>  *</div><div class='ctx'>  * Return &gt;0 for the number of sectors we found.</div><div class='ctx'>  * Return 0 for the range [disk_bytenr, disk_bytenr + sectorsize) has no csum</div><div class='hunk'>@@ -257,6 +279,7 @@ static int search_csum_tree(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			    struct btrfs_path *path, u64 disk_bytenr,</div><div class='ctx'> 			    u64 len, u8 *dst)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_root *csum_root;</div><div class='ctx'> 	struct btrfs_csum_item *item = NULL;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	const u32 sectorsize = fs_info-&gt;sectorsize;</div><div class='hunk'>@@ -274,7 +297,7 @@ static int search_csum_tree(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		item = btrfs_item_ptr(path-&gt;nodes[0], path-&gt;slots[0],</div><div class='ctx'> 				      struct btrfs_csum_item);</div><div class='ctx'> 		btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, path-&gt;slots[0]);</div><div class='del'>-		itemsize = btrfs_item_size_nr(path-&gt;nodes[0], path-&gt;slots[0]);</div><div class='add'>+		itemsize = btrfs_item_size(path-&gt;nodes[0], path-&gt;slots[0]);</div><div class='ctx'> </div><div class='ctx'> 		csum_start = key.offset;</div><div class='ctx'> 		csum_len = (itemsize / csum_size) * sectorsize;</div><div class='hunk'>@@ -285,13 +308,14 @@ static int search_csum_tree(struct btrfs_fs_info *fs_info,</div><div class='ctx'> </div><div class='ctx'> 	/* Current item doesn't contain the desired range, search again */</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='del'>-	item = btrfs_lookup_csum(NULL, fs_info-&gt;csum_root, path, disk_bytenr, 0);</div><div class='add'>+	csum_root = btrfs_csum_root(fs_info, disk_bytenr);</div><div class='add'>+	item = btrfs_lookup_csum(NULL, csum_root, path, disk_bytenr, 0);</div><div class='ctx'> 	if (IS_ERR(item)) {</div><div class='ctx'> 		ret = PTR_ERR(item);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, path-&gt;slots[0]);</div><div class='del'>-	itemsize = btrfs_item_size_nr(path-&gt;nodes[0], path-&gt;slots[0]);</div><div class='add'>+	itemsize = btrfs_item_size(path-&gt;nodes[0], path-&gt;slots[0]);</div><div class='ctx'> </div><div class='ctx'> 	csum_start = key.offset;</div><div class='ctx'> 	csum_len = (itemsize / csum_size) * sectorsize;</div><div class='hunk'>@@ -303,81 +327,33 @@ found:</div><div class='ctx'> 	read_extent_buffer(path-&gt;nodes[0], dst, (unsigned long)item,</div><div class='ctx'> 			ret * csum_size);</div><div class='ctx'> out:</div><div class='del'>-	if (ret == -ENOENT)</div><div class='add'>+	if (ret == -ENOENT || ret == -EFBIG)</div><div class='ctx'> 		ret = 0;</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Locate the file_offset of @cur_disk_bytenr of a @bio.</div><div class='del'>- *</div><div class='del'>- * Bio of btrfs represents read range of</div><div class='del'>- * [bi_sector &lt;&lt; 9, bi_sector &lt;&lt; 9 + bi_size).</div><div class='del'>- * Knowing this, we can iterate through each bvec to locate the page belong to</div><div class='del'>- * @cur_disk_bytenr and get the file offset.</div><div class='del'>- *</div><div class='del'>- * @inode is used to determine if the bvec page really belongs to @inode.</div><div class='del'>- *</div><div class='del'>- * Return 0 if we can't find the file offset</div><div class='del'>- * Return &gt;0 if we find the file offset and restore it to @file_offset_ret</div><div class='del'>- */</div><div class='del'>-static int search_file_offset_in_bio(struct bio *bio, struct inode *inode,</div><div class='del'>-				     u64 disk_bytenr, u64 *file_offset_ret)</div><div class='del'>-{</div><div class='del'>-	struct bvec_iter iter;</div><div class='del'>-	struct bio_vec bvec;</div><div class='del'>-	u64 cur = bio-&gt;bi_iter.bi_sector &lt;&lt; SECTOR_SHIFT;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	bio_for_each_segment(bvec, bio, iter) {</div><div class='del'>-		struct page *page = bvec.bv_page;</div><div class='del'>-</div><div class='del'>-		if (cur &gt; disk_bytenr)</div><div class='del'>-			break;</div><div class='del'>-		if (cur + bvec.bv_len &lt;= disk_bytenr) {</div><div class='del'>-			cur += bvec.bv_len;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-		ASSERT(in_range(disk_bytenr, cur, bvec.bv_len));</div><div class='del'>-		if (page-&gt;mapping &amp;&amp; page-&gt;mapping-&gt;host &amp;&amp;</div><div class='del'>-		    page-&gt;mapping-&gt;host == inode) {</div><div class='del'>-			ret = 1;</div><div class='del'>-			*file_offset_ret = page_offset(page) + bvec.bv_offset +</div><div class='del'>-					   disk_bytenr - cur;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='ctx'>  * Lookup the checksum for the read bio in csum tree.</div><div class='ctx'>  *</div><div class='del'>- * @inode: inode that the bio is for.</div><div class='del'>- * @bio: bio to look up.</div><div class='del'>- * @dst: Buffer of size nblocks * btrfs_super_csum_size() used to return</div><div class='del'>- *       checksum (nblocks = bio-&gt;bi_iter.bi_size / fs_info-&gt;sectorsize). If</div><div class='del'>- *       NULL, the checksum buffer is allocated and returned in</div><div class='del'>- *       btrfs_bio(bio)-&gt;csum instead.</div><div class='del'>- *</div><div class='ctx'>  * Return: BLK_STS_RESOURCE if allocating memory fails, BLK_STS_OK otherwise.</div><div class='ctx'>  */</div><div class='del'>-blk_status_t btrfs_lookup_bio_sums(struct inode *inode, struct bio *bio, u8 *dst)</div><div class='add'>+int btrfs_lookup_bio_sums(struct btrfs_bio *bbio)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	struct extent_io_tree *io_tree = &amp;BTRFS_I(inode)-&gt;io_tree;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	struct btrfs_inode *inode = bbio-&gt;inode;</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	struct bio *bio = &amp;bbio-&gt;bio;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	const u32 sectorsize = fs_info-&gt;sectorsize;</div><div class='ctx'> 	const u32 csum_size = fs_info-&gt;csum_size;</div><div class='ctx'> 	u32 orig_len = bio-&gt;bi_iter.bi_size;</div><div class='ctx'> 	u64 orig_disk_bytenr = bio-&gt;bi_iter.bi_sector &lt;&lt; SECTOR_SHIFT;</div><div class='del'>-	u64 cur_disk_bytenr;</div><div class='del'>-	u8 *csum;</div><div class='ctx'> 	const unsigned int nblocks = orig_len &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='del'>-	int count = 0;</div><div class='add'>+	int ret = 0;</div><div class='add'>+	u32 bio_offset = 0;</div><div class='ctx'> </div><div class='del'>-	if (!fs_info-&gt;csum_root || (BTRFS_I(inode)-&gt;flags &amp; BTRFS_INODE_NODATASUM))</div><div class='del'>-		return BLK_STS_OK;</div><div class='add'>+	if ((inode-&gt;flags &amp; BTRFS_INODE_NODATASUM) ||</div><div class='add'>+	    test_bit(BTRFS_FS_STATE_NO_DATA_CSUMS, &amp;fs_info-&gt;fs_state))</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * This function is only called for read bio.</div><div class='hunk'>@@ -394,23 +370,14 @@ blk_status_t btrfs_lookup_bio_sums(struct inode *inode, struct bio *bio, u8 *dst</div><div class='ctx'> 	ASSERT(bio_op(bio) == REQ_OP_READ);</div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='del'>-		return BLK_STS_RESOURCE;</div><div class='del'>-</div><div class='del'>-	if (!dst) {</div><div class='del'>-		struct btrfs_bio *bbio = btrfs_bio(bio);</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-		if (nblocks * csum_size &gt; BTRFS_BIO_INLINE_CSUM_SIZE) {</div><div class='del'>-			bbio-&gt;csum = kmalloc_array(nblocks, csum_size, GFP_NOFS);</div><div class='del'>-			if (!bbio-&gt;csum) {</div><div class='del'>-				btrfs_free_path(path);</div><div class='del'>-				return BLK_STS_RESOURCE;</div><div class='del'>-			}</div><div class='del'>-		} else {</div><div class='del'>-			bbio-&gt;csum = bbio-&gt;csum_inline;</div><div class='del'>-		}</div><div class='del'>-		csum = bbio-&gt;csum;</div><div class='add'>+	if (nblocks * csum_size &gt; BTRFS_BIO_INLINE_CSUM_SIZE) {</div><div class='add'>+		bbio-&gt;csum = kvcalloc(nblocks, csum_size, GFP_NOFS);</div><div class='add'>+		if (!bbio-&gt;csum)</div><div class='add'>+			return -ENOMEM;</div><div class='ctx'> 	} else {</div><div class='del'>-		csum = dst;</div><div class='add'>+		bbio-&gt;csum = bbio-&gt;csum_inline;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -426,73 +393,107 @@ blk_status_t btrfs_lookup_bio_sums(struct inode *inode, struct bio *bio, u8 *dst</div><div class='ctx'> 	 * read from the commit root and sidestep a nasty deadlock</div><div class='ctx'> 	 * between reading the free space cache and updating the csum tree.</div><div class='ctx'> 	 */</div><div class='del'>-	if (btrfs_is_free_space_inode(BTRFS_I(inode))) {</div><div class='del'>-		path-&gt;search_commit_root = 1;</div><div class='del'>-		path-&gt;skip_locking = 1;</div><div class='add'>+	if (btrfs_is_free_space_inode(inode)) {</div><div class='add'>+		path-&gt;search_commit_root = true;</div><div class='add'>+		path-&gt;skip_locking = true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If we are searching for a csum of an extent from a past</div><div class='add'>+	 * transaction, we can search in the commit root and reduce</div><div class='add'>+	 * lock contention on the csum tree extent buffers.</div><div class='add'>+	 *</div><div class='add'>+	 * This is important because that lock is an rwsem which gets</div><div class='add'>+	 * pretty heavy write load under memory pressure and sustained</div><div class='add'>+	 * csum overwrites, unlike the commit_root_sem. (Memory pressure</div><div class='add'>+	 * makes us writeback the nodes multiple times per transaction,</div><div class='add'>+	 * which makes us cow them each time, taking the write lock.)</div><div class='add'>+	 *</div><div class='add'>+	 * Due to how rwsem is implemented, there is a possible</div><div class='add'>+	 * priority inversion where the readers holding the lock don't</div><div class='add'>+	 * get scheduled (say they're in a cgroup stuck in heavy reclaim)</div><div class='add'>+	 * which then blocks writers, including transaction commit. By</div><div class='add'>+	 * using a semaphore with fewer writers (only a commit switching</div><div class='add'>+	 * the roots), we make this issue less likely.</div><div class='add'>+	 *</div><div class='add'>+	 * Note that we don't rely on btrfs_search_slot to lock the</div><div class='add'>+	 * commit root csum. We call search_slot multiple times, which would</div><div class='add'>+	 * create a potential race where a commit comes in between searches</div><div class='add'>+	 * while we are not holding the commit_root_sem, and we get csums</div><div class='add'>+	 * from across transactions.</div><div class='add'>+	 */</div><div class='add'>+	if (bbio-&gt;csum_search_commit_root) {</div><div class='add'>+		path-&gt;search_commit_root = true;</div><div class='add'>+		path-&gt;skip_locking = true;</div><div class='add'>+		down_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	for (cur_disk_bytenr = orig_disk_bytenr;</div><div class='del'>-	     cur_disk_bytenr &lt; orig_disk_bytenr + orig_len;</div><div class='del'>-	     cur_disk_bytenr += (count * sectorsize)) {</div><div class='del'>-		u64 search_len = orig_disk_bytenr + orig_len - cur_disk_bytenr;</div><div class='del'>-		unsigned int sector_offset;</div><div class='del'>-		u8 *csum_dst;</div><div class='add'>+	while (bio_offset &lt; orig_len) {</div><div class='add'>+		int count;</div><div class='add'>+		u64 cur_disk_bytenr = orig_disk_bytenr + bio_offset;</div><div class='add'>+		u8 *csum_dst = bbio-&gt;csum +</div><div class='add'>+			(bio_offset &gt;&gt; fs_info-&gt;sectorsize_bits) * csum_size;</div><div class='add'>+</div><div class='add'>+		count = search_csum_tree(fs_info, path, cur_disk_bytenr,</div><div class='add'>+					 orig_len - bio_offset, csum_dst);</div><div class='add'>+		if (count &lt; 0) {</div><div class='add'>+			ret = count;</div><div class='add'>+			if (bbio-&gt;csum != bbio-&gt;csum_inline)</div><div class='add'>+				kvfree(bbio-&gt;csum);</div><div class='add'>+			bbio-&gt;csum = NULL;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * Although both cur_disk_bytenr and orig_disk_bytenr is u64,</div><div class='del'>-		 * we're calculating the offset to the bio start.</div><div class='add'>+		 * We didn't find a csum for this range.  We need to make sure</div><div class='add'>+		 * we complain loudly about this, because we are not NODATASUM.</div><div class='ctx'> 		 *</div><div class='del'>-		 * Bio size is limited to UINT_MAX, thus unsigned int is large</div><div class='del'>-		 * enough to contain the raw result, not to mention the right</div><div class='del'>-		 * shifted result.</div><div class='add'>+		 * However for the DATA_RELOC inode we could potentially be</div><div class='add'>+		 * relocating data extents for a NODATASUM inode, so the inode</div><div class='add'>+		 * itself won't be marked with NODATASUM, but the extent we're</div><div class='add'>+		 * copying is in fact NODATASUM.  If we don't find a csum we</div><div class='add'>+		 * assume this is the case.</div><div class='ctx'> 		 */</div><div class='del'>-		ASSERT(cur_disk_bytenr - orig_disk_bytenr &lt; UINT_MAX);</div><div class='del'>-		sector_offset = (cur_disk_bytenr - orig_disk_bytenr) &gt;&gt;</div><div class='del'>-				fs_info-&gt;sectorsize_bits;</div><div class='del'>-		csum_dst = csum + sector_offset * csum_size;</div><div class='del'>-</div><div class='del'>-		count = search_csum_tree(fs_info, path, cur_disk_bytenr,</div><div class='del'>-					 search_len, csum_dst);</div><div class='del'>-		if (count &lt;= 0) {</div><div class='del'>-			/*</div><div class='del'>-			 * Either we hit a critical error or we didn't find</div><div class='del'>-			 * the csum.</div><div class='del'>-			 * Either way, we put zero into the csums dst, and skip</div><div class='del'>-			 * to the next sector.</div><div class='del'>-			 */</div><div class='add'>+		if (count == 0) {</div><div class='ctx'> 			memset(csum_dst, 0, csum_size);</div><div class='ctx'> 			count = 1;</div><div class='ctx'> </div><div class='del'>-			/*</div><div class='del'>-			 * For data reloc inode, we need to mark the range</div><div class='del'>-			 * NODATASUM so that balance won't report false csum</div><div class='del'>-			 * error.</div><div class='del'>-			 */</div><div class='del'>-			if (BTRFS_I(inode)-&gt;root-&gt;root_key.objectid ==</div><div class='del'>-			    BTRFS_DATA_RELOC_TREE_OBJECTID) {</div><div class='del'>-				u64 file_offset;</div><div class='del'>-				int ret;</div><div class='del'>-</div><div class='del'>-				ret = search_file_offset_in_bio(bio, inode,</div><div class='del'>-						cur_disk_bytenr, &amp;file_offset);</div><div class='del'>-				if (ret)</div><div class='del'>-					set_extent_bits(io_tree, file_offset,</div><div class='del'>-						file_offset + sectorsize - 1,</div><div class='del'>-						EXTENT_NODATASUM);</div><div class='add'>+			if (btrfs_is_data_reloc_root(inode-&gt;root)) {</div><div class='add'>+				u64 file_offset = bbio-&gt;file_offset + bio_offset;</div><div class='add'>+</div><div class='add'>+				btrfs_set_extent_bit(&amp;inode-&gt;io_tree, file_offset,</div><div class='add'>+						     file_offset + sectorsize - 1,</div><div class='add'>+						     EXTENT_NODATASUM, NULL);</div><div class='ctx'> 			} else {</div><div class='ctx'> 				btrfs_warn_rl(fs_info,</div><div class='ctx'> 			"csum hole found for disk bytenr range [%llu, %llu)",</div><div class='ctx'> 				cur_disk_bytenr, cur_disk_bytenr + sectorsize);</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='add'>+		bio_offset += count * sectorsize;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return BLK_STS_OK;</div><div class='add'>+	if (bbio-&gt;csum_search_commit_root)</div><div class='add'>+		up_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_lookup_csums_range(struct btrfs_root *root, u64 start, u64 end,</div><div class='del'>-			     struct list_head *list, int search_commit)</div><div class='add'>+/*</div><div class='add'>+ * Search for checksums for a given logical range.</div><div class='add'>+ *</div><div class='add'>+ * @root:		The root where to look for checksums.</div><div class='add'>+ * @start:		Logical address of target checksum range.</div><div class='add'>+ * @end:		End offset (inclusive) of the target checksum range.</div><div class='add'>+ * @list:		List for adding each checksum that was found.</div><div class='add'>+ *			Can be NULL in case the caller only wants to check if</div><div class='add'>+ *			there any checksums for the range.</div><div class='add'>+ * @nowait:		Indicate if the search must be non-blocking or not.</div><div class='add'>+ *</div><div class='add'>+ * Return &lt; 0 on error, 0 if no checksums were found, or 1 if checksums were</div><div class='add'>+ * found.</div><div class='add'>+ */</div><div class='add'>+int btrfs_lookup_csums_list(struct btrfs_root *root, u64 start, u64 end,</div><div class='add'>+			    struct list_head *list, bool nowait)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='hunk'>@@ -500,12 +501,8 @@ int btrfs_lookup_csums_range(struct btrfs_root *root, u64 start, u64 end,</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_ordered_sum *sums;</div><div class='ctx'> 	struct btrfs_csum_item *item;</div><div class='del'>-	LIST_HEAD(tmplist);</div><div class='del'>-	unsigned long offset;</div><div class='ctx'> 	int ret;</div><div class='del'>-	size_t size;</div><div class='del'>-	u64 csum_end;</div><div class='del'>-	const u32 csum_size = fs_info-&gt;csum_size;</div><div class='add'>+	bool found_csums = false;</div><div class='ctx'> </div><div class='ctx'> 	ASSERT(IS_ALIGNED(start, fs_info-&gt;sectorsize) &amp;&amp;</div><div class='ctx'> 	       IS_ALIGNED(end + 1, fs_info-&gt;sectorsize));</div><div class='hunk'>@@ -514,37 +511,50 @@ int btrfs_lookup_csums_range(struct btrfs_root *root, u64 start, u64 end,</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	if (search_commit) {</div><div class='del'>-		path-&gt;skip_locking = 1;</div><div class='del'>-		path-&gt;reada = READA_FORWARD;</div><div class='del'>-		path-&gt;search_commit_root = 1;</div><div class='del'>-	}</div><div class='add'>+	path-&gt;nowait = nowait;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = BTRFS_EXTENT_CSUM_OBJECTID;</div><div class='del'>-	key.offset = start;</div><div class='ctx'> 	key.type = BTRFS_EXTENT_CSUM_KEY;</div><div class='add'>+	key.offset = start;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto fail;</div><div class='add'>+		goto out;</div><div class='ctx'> 	if (ret &gt; 0 &amp;&amp; path-&gt;slots[0] &gt; 0) {</div><div class='ctx'> 		leaf = path-&gt;nodes[0];</div><div class='ctx'> 		btrfs_item_key_to_cpu(leaf, &amp;key, path-&gt;slots[0] - 1);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * There are two cases we can hit here for the previous csum</div><div class='add'>+		 * item:</div><div class='add'>+		 *</div><div class='add'>+		 *		|&lt;- search range -&gt;|</div><div class='add'>+		 *	|&lt;- csum item -&gt;|</div><div class='add'>+		 *</div><div class='add'>+		 * Or</div><div class='add'>+		 *				|&lt;- search range -&gt;|</div><div class='add'>+		 *	|&lt;- csum item -&gt;|</div><div class='add'>+		 *</div><div class='add'>+		 * Check if the previous csum item covers the leading part of</div><div class='add'>+		 * the search range.  If so we have to start from previous csum</div><div class='add'>+		 * item.</div><div class='add'>+		 */</div><div class='ctx'> 		if (key.objectid == BTRFS_EXTENT_CSUM_OBJECTID &amp;&amp;</div><div class='ctx'> 		    key.type == BTRFS_EXTENT_CSUM_KEY) {</div><div class='del'>-			offset = (start - key.offset) &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='del'>-			if (offset * csum_size &lt;</div><div class='del'>-			    btrfs_item_size_nr(leaf, path-&gt;slots[0] - 1))</div><div class='add'>+			if (bytes_to_csum_size(fs_info, start - key.offset) &lt;</div><div class='add'>+			    btrfs_item_size(leaf, path-&gt;slots[0] - 1))</div><div class='ctx'> 				path-&gt;slots[0]--;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	while (start &lt;= end) {</div><div class='add'>+		u64 csum_end;</div><div class='add'>+</div><div class='ctx'> 		leaf = path-&gt;nodes[0];</div><div class='ctx'> 		if (path-&gt;slots[0] &gt;= btrfs_header_nritems(leaf)) {</div><div class='ctx'> 			ret = btrfs_next_leaf(root, path);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='del'>-				goto fail;</div><div class='add'>+				goto out;</div><div class='ctx'> 			if (ret &gt; 0)</div><div class='ctx'> 				break;</div><div class='ctx'> 			leaf = path-&gt;nodes[0];</div><div class='hunk'>@@ -559,82 +569,251 @@ int btrfs_lookup_csums_range(struct btrfs_root *root, u64 start, u64 end,</div><div class='ctx'> 		if (key.offset &gt; start)</div><div class='ctx'> 			start = key.offset;</div><div class='ctx'> </div><div class='del'>-		size = btrfs_item_size_nr(leaf, path-&gt;slots[0]);</div><div class='del'>-		csum_end = key.offset + (size / csum_size) * fs_info-&gt;sectorsize;</div><div class='add'>+		csum_end = key.offset + csum_size_to_bytes(fs_info,</div><div class='add'>+					btrfs_item_size(leaf, path-&gt;slots[0]));</div><div class='ctx'> 		if (csum_end &lt;= start) {</div><div class='ctx'> 			path-&gt;slots[0]++;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		found_csums = true;</div><div class='add'>+		if (!list)</div><div class='add'>+			goto out;</div><div class='add'>+</div><div class='ctx'> 		csum_end = min(csum_end, end + 1);</div><div class='ctx'> 		item = btrfs_item_ptr(path-&gt;nodes[0], path-&gt;slots[0],</div><div class='ctx'> 				      struct btrfs_csum_item);</div><div class='ctx'> 		while (start &lt; csum_end) {</div><div class='add'>+			unsigned long offset;</div><div class='add'>+			size_t size;</div><div class='add'>+</div><div class='ctx'> 			size = min_t(size_t, csum_end - start,</div><div class='del'>-				     max_ordered_sum_bytes(fs_info, csum_size));</div><div class='add'>+				     max_ordered_sum_bytes(fs_info));</div><div class='ctx'> 			sums = kzalloc(btrfs_ordered_sum_size(fs_info, size),</div><div class='ctx'> 				       GFP_NOFS);</div><div class='ctx'> 			if (!sums) {</div><div class='ctx'> 				ret = -ENOMEM;</div><div class='del'>-				goto fail;</div><div class='add'>+				goto out;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			sums-&gt;bytenr = start;</div><div class='del'>-			sums-&gt;len = (int)size;</div><div class='add'>+			sums-&gt;logical = start;</div><div class='add'>+			sums-&gt;len = size;</div><div class='ctx'> </div><div class='del'>-			offset = (start - key.offset) &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='del'>-			offset *= csum_size;</div><div class='del'>-			size &gt;&gt;= fs_info-&gt;sectorsize_bits;</div><div class='add'>+			offset = bytes_to_csum_size(fs_info, start - key.offset);</div><div class='ctx'> </div><div class='ctx'> 			read_extent_buffer(path-&gt;nodes[0],</div><div class='ctx'> 					   sums-&gt;sums,</div><div class='ctx'> 					   ((unsigned long)item) + offset,</div><div class='del'>-					   csum_size * size);</div><div class='add'>+					   bytes_to_csum_size(fs_info, size));</div><div class='add'>+</div><div class='add'>+			start += size;</div><div class='add'>+			list_add_tail(&amp;sums-&gt;list, list);</div><div class='add'>+		}</div><div class='add'>+		path-&gt;slots[0]++;</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='add'>+	btrfs_free_path(path);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		if (list) {</div><div class='add'>+			struct btrfs_ordered_sum *tmp_sums;</div><div class='add'>+</div><div class='add'>+			list_for_each_entry_safe(sums, tmp_sums, list, list)</div><div class='add'>+				kfree(sums);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return found_csums ? 1 : 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Do the same work as btrfs_lookup_csums_list(), the difference is in how</div><div class='add'>+ * we return the result.</div><div class='add'>+ *</div><div class='add'>+ * This version will set the corresponding bits in @csum_bitmap to represent</div><div class='add'>+ * that there is a csum found.</div><div class='add'>+ * Each bit represents a sector. Thus caller should ensure @csum_buf passed</div><div class='add'>+ * in is large enough to contain all csums.</div><div class='add'>+ */</div><div class='add'>+int btrfs_lookup_csums_bitmap(struct btrfs_root *root, struct btrfs_path *path,</div><div class='add'>+			      u64 start, u64 end, u8 *csum_buf,</div><div class='add'>+			      unsigned long *csum_bitmap)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+	struct btrfs_key key;</div><div class='add'>+	struct extent_buffer *leaf;</div><div class='add'>+	struct btrfs_csum_item *item;</div><div class='add'>+	const u64 orig_start = start;</div><div class='add'>+	bool free_path = false;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ASSERT(IS_ALIGNED(start, fs_info-&gt;sectorsize) &amp;&amp;</div><div class='add'>+	       IS_ALIGNED(end + 1, fs_info-&gt;sectorsize));</div><div class='add'>+</div><div class='add'>+	if (!path) {</div><div class='add'>+		path = btrfs_alloc_path();</div><div class='add'>+		if (!path)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+		free_path = true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Check if we can reuse the previous path. */</div><div class='add'>+	if (path-&gt;nodes[0]) {</div><div class='add'>+		btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, path-&gt;slots[0]);</div><div class='add'>+</div><div class='add'>+		if (key.objectid == BTRFS_EXTENT_CSUM_OBJECTID &amp;&amp;</div><div class='add'>+		    key.type == BTRFS_EXTENT_CSUM_KEY &amp;&amp;</div><div class='add'>+		    key.offset &lt;= start)</div><div class='add'>+			goto search_forward;</div><div class='add'>+		btrfs_release_path(path);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	key.objectid = BTRFS_EXTENT_CSUM_OBJECTID;</div><div class='add'>+	key.type = BTRFS_EXTENT_CSUM_KEY;</div><div class='add'>+	key.offset = start;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto fail;</div><div class='add'>+	if (ret &gt; 0 &amp;&amp; path-&gt;slots[0] &gt; 0) {</div><div class='add'>+		leaf = path-&gt;nodes[0];</div><div class='add'>+		btrfs_item_key_to_cpu(leaf, &amp;key, path-&gt;slots[0] - 1);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * There are two cases we can hit here for the previous csum</div><div class='add'>+		 * item:</div><div class='add'>+		 *</div><div class='add'>+		 *		|&lt;- search range -&gt;|</div><div class='add'>+		 *	|&lt;- csum item -&gt;|</div><div class='add'>+		 *</div><div class='add'>+		 * Or</div><div class='add'>+		 *				|&lt;- search range -&gt;|</div><div class='add'>+		 *	|&lt;- csum item -&gt;|</div><div class='add'>+		 *</div><div class='add'>+		 * Check if the previous csum item covers the leading part of</div><div class='add'>+		 * the search range.  If so we have to start from previous csum</div><div class='add'>+		 * item.</div><div class='add'>+		 */</div><div class='add'>+		if (key.objectid == BTRFS_EXTENT_CSUM_OBJECTID &amp;&amp;</div><div class='add'>+		    key.type == BTRFS_EXTENT_CSUM_KEY) {</div><div class='add'>+			if (bytes_to_csum_size(fs_info, start - key.offset) &lt;</div><div class='add'>+			    btrfs_item_size(leaf, path-&gt;slots[0] - 1))</div><div class='add'>+				path-&gt;slots[0]--;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+search_forward:</div><div class='add'>+	while (start &lt;= end) {</div><div class='add'>+		u64 csum_end;</div><div class='add'>+</div><div class='add'>+		leaf = path-&gt;nodes[0];</div><div class='add'>+		if (path-&gt;slots[0] &gt;= btrfs_header_nritems(leaf)) {</div><div class='add'>+			ret = btrfs_next_leaf(root, path);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				goto fail;</div><div class='add'>+			if (ret &gt; 0)</div><div class='add'>+				break;</div><div class='add'>+			leaf = path-&gt;nodes[0];</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		btrfs_item_key_to_cpu(leaf, &amp;key, path-&gt;slots[0]);</div><div class='add'>+		if (key.objectid != BTRFS_EXTENT_CSUM_OBJECTID ||</div><div class='add'>+		    key.type != BTRFS_EXTENT_CSUM_KEY ||</div><div class='add'>+		    key.offset &gt; end)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		if (key.offset &gt; start)</div><div class='add'>+			start = key.offset;</div><div class='add'>+</div><div class='add'>+		csum_end = key.offset + csum_size_to_bytes(fs_info,</div><div class='add'>+					btrfs_item_size(leaf, path-&gt;slots[0]));</div><div class='add'>+		if (csum_end &lt;= start) {</div><div class='add'>+			path-&gt;slots[0]++;</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		csum_end = min(csum_end, end + 1);</div><div class='add'>+		item = btrfs_item_ptr(path-&gt;nodes[0], path-&gt;slots[0],</div><div class='add'>+				      struct btrfs_csum_item);</div><div class='add'>+		while (start &lt; csum_end) {</div><div class='add'>+			unsigned long offset;</div><div class='add'>+			size_t size;</div><div class='add'>+			u8 *csum_dest = csum_buf + bytes_to_csum_size(fs_info,</div><div class='add'>+						start - orig_start);</div><div class='add'>+</div><div class='add'>+			size = min_t(size_t, csum_end - start, end + 1 - start);</div><div class='add'>+</div><div class='add'>+			offset = bytes_to_csum_size(fs_info, start - key.offset);</div><div class='add'>+</div><div class='add'>+			read_extent_buffer(path-&gt;nodes[0], csum_dest,</div><div class='add'>+					   ((unsigned long)item) + offset,</div><div class='add'>+					   bytes_to_csum_size(fs_info, size));</div><div class='ctx'> </div><div class='del'>-			start += fs_info-&gt;sectorsize * size;</div><div class='del'>-			list_add_tail(&amp;sums-&gt;list, &amp;tmplist);</div><div class='add'>+			bitmap_set(csum_bitmap,</div><div class='add'>+				(start - orig_start) &gt;&gt; fs_info-&gt;sectorsize_bits,</div><div class='add'>+				size &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+</div><div class='add'>+			start += size;</div><div class='ctx'> 		}</div><div class='ctx'> 		path-&gt;slots[0]++;</div><div class='ctx'> 	}</div><div class='ctx'> 	ret = 0;</div><div class='ctx'> fail:</div><div class='del'>-	while (ret &lt; 0 &amp;&amp; !list_empty(&amp;tmplist)) {</div><div class='del'>-		sums = list_entry(tmplist.next, struct btrfs_ordered_sum, list);</div><div class='del'>-		list_del(&amp;sums-&gt;list);</div><div class='del'>-		kfree(sums);</div><div class='add'>+	if (free_path)</div><div class='add'>+		btrfs_free_path(path);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void csum_one_bio(struct btrfs_bio *bbio, struct bvec_iter *src)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_inode *inode = bbio-&gt;inode;</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	SHASH_DESC_ON_STACK(shash, fs_info-&gt;csum_shash);</div><div class='add'>+	struct bio *bio = &amp;bbio-&gt;bio;</div><div class='add'>+	struct btrfs_ordered_sum *sums = bbio-&gt;sums;</div><div class='add'>+	struct bvec_iter iter = *src;</div><div class='add'>+	phys_addr_t paddr;</div><div class='add'>+	const u32 blocksize = fs_info-&gt;sectorsize;</div><div class='add'>+	const u32 step = min(blocksize, PAGE_SIZE);</div><div class='add'>+	const u32 nr_steps = blocksize / step;</div><div class='add'>+	phys_addr_t paddrs[BTRFS_MAX_BLOCKSIZE / PAGE_SIZE];</div><div class='add'>+	u32 offset = 0;</div><div class='add'>+	int index = 0;</div><div class='add'>+</div><div class='add'>+	shash-&gt;tfm = fs_info-&gt;csum_shash;</div><div class='add'>+</div><div class='add'>+	btrfs_bio_for_each_block(paddr, bio, &amp;iter, step) {</div><div class='add'>+		paddrs[(offset / step) % nr_steps] = paddr;</div><div class='add'>+		offset += step;</div><div class='add'>+</div><div class='add'>+		if (IS_ALIGNED(offset, blocksize)) {</div><div class='add'>+			btrfs_calculate_block_csum_pages(fs_info, paddrs, sums-&gt;sums + index);</div><div class='add'>+			index += fs_info-&gt;csum_size;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='del'>-	list_splice_tail(&amp;tmplist, list);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+static void csum_one_bio_work(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_bio *bbio = container_of(work, struct btrfs_bio, csum_work);</div><div class='add'>+</div><div class='add'>+	ASSERT(btrfs_op(&amp;bbio-&gt;bio) == BTRFS_MAP_WRITE);</div><div class='add'>+	ASSERT(bbio-&gt;async_csum == true);</div><div class='add'>+	csum_one_bio(bbio, &amp;bbio-&gt;csum_saved_iter);</div><div class='add'>+	complete(&amp;bbio-&gt;csum_done);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * btrfs_csum_one_bio - Calculates checksums of the data contained inside a bio</div><div class='del'>- * @inode:	 Owner of the data inside the bio</div><div class='del'>- * @bio:	 Contains the data to be checksummed</div><div class='del'>- * @file_start:  offset in file this bio begins to describe</div><div class='del'>- * @contig:	 Boolean. If true/1 means all bio vecs in this bio are</div><div class='del'>- *		 contiguous and they begin at @file_start in the file. False/0</div><div class='del'>- *		 means this bio can contain potentially discontiguous bio vecs</div><div class='del'>- *		 so the logical offset of each should be calculated separately.</div><div class='add'>+ * Calculate checksums of the data contained inside a bio.</div><div class='ctx'>  */</div><div class='del'>-blk_status_t btrfs_csum_one_bio(struct btrfs_inode *inode, struct bio *bio,</div><div class='del'>-		       u64 file_start, int contig)</div><div class='add'>+int btrfs_csum_one_bio(struct btrfs_bio *bbio, bool async)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_ordered_extent *ordered = bbio-&gt;ordered;</div><div class='add'>+	struct btrfs_inode *inode = bbio-&gt;inode;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='del'>-	SHASH_DESC_ON_STACK(shash, fs_info-&gt;csum_shash);</div><div class='add'>+	struct bio *bio = &amp;bbio-&gt;bio;</div><div class='ctx'> 	struct btrfs_ordered_sum *sums;</div><div class='del'>-	struct btrfs_ordered_extent *ordered = NULL;</div><div class='del'>-	char *data;</div><div class='del'>-	struct bvec_iter iter;</div><div class='del'>-	struct bio_vec bvec;</div><div class='del'>-	int index;</div><div class='del'>-	int nr_sectors;</div><div class='del'>-	unsigned long total_bytes = 0;</div><div class='del'>-	unsigned long this_sum_bytes = 0;</div><div class='del'>-	int i;</div><div class='del'>-	u64 offset;</div><div class='ctx'> 	unsigned nofs_flag;</div><div class='ctx'> </div><div class='ctx'> 	nofs_flag = memalloc_nofs_save();</div><div class='hunk'>@@ -643,106 +822,60 @@ blk_status_t btrfs_csum_one_bio(struct btrfs_inode *inode, struct bio *bio,</div><div class='ctx'> 	memalloc_nofs_restore(nofs_flag);</div><div class='ctx'> </div><div class='ctx'> 	if (!sums)</div><div class='del'>-		return BLK_STS_RESOURCE;</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='add'>+	sums-&gt;logical = bbio-&gt;orig_logical;</div><div class='ctx'> 	sums-&gt;len = bio-&gt;bi_iter.bi_size;</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;sums-&gt;list);</div><div class='add'>+	bbio-&gt;sums = sums;</div><div class='add'>+	btrfs_add_ordered_sum(ordered, sums);</div><div class='ctx'> </div><div class='del'>-	if (contig)</div><div class='del'>-		offset = file_start;</div><div class='del'>-	else</div><div class='del'>-		offset = 0; /* shut up gcc */</div><div class='del'>-</div><div class='del'>-	sums-&gt;bytenr = bio-&gt;bi_iter.bi_sector &lt;&lt; 9;</div><div class='del'>-	index = 0;</div><div class='del'>-</div><div class='del'>-	shash-&gt;tfm = fs_info-&gt;csum_shash;</div><div class='del'>-</div><div class='del'>-	bio_for_each_segment(bvec, bio, iter) {</div><div class='del'>-		if (!contig)</div><div class='del'>-			offset = page_offset(bvec.bv_page) + bvec.bv_offset;</div><div class='del'>-</div><div class='del'>-		if (!ordered) {</div><div class='del'>-			ordered = btrfs_lookup_ordered_extent(inode, offset);</div><div class='del'>-			/*</div><div class='del'>-			 * The bio range is not covered by any ordered extent,</div><div class='del'>-			 * must be a code logic error.</div><div class='del'>-			 */</div><div class='del'>-			if (unlikely(!ordered)) {</div><div class='del'>-				WARN(1, KERN_WARNING</div><div class='del'>-			"no ordered extent for root %llu ino %llu offset %llu\n",</div><div class='del'>-				     inode-&gt;root-&gt;root_key.objectid,</div><div class='del'>-				     btrfs_ino(inode), offset);</div><div class='del'>-				kvfree(sums);</div><div class='del'>-				return BLK_STS_IOERR;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		nr_sectors = BTRFS_BYTES_TO_BLKS(fs_info,</div><div class='del'>-						 bvec.bv_len + fs_info-&gt;sectorsize</div><div class='del'>-						 - 1);</div><div class='del'>-</div><div class='del'>-		for (i = 0; i &lt; nr_sectors; i++) {</div><div class='del'>-			if (offset &gt;= ordered-&gt;file_offset + ordered-&gt;num_bytes ||</div><div class='del'>-			    offset &lt; ordered-&gt;file_offset) {</div><div class='del'>-				unsigned long bytes_left;</div><div class='del'>-</div><div class='del'>-				sums-&gt;len = this_sum_bytes;</div><div class='del'>-				this_sum_bytes = 0;</div><div class='del'>-				btrfs_add_ordered_sum(ordered, sums);</div><div class='del'>-				btrfs_put_ordered_extent(ordered);</div><div class='del'>-</div><div class='del'>-				bytes_left = bio-&gt;bi_iter.bi_size - total_bytes;</div><div class='del'>-</div><div class='del'>-				nofs_flag = memalloc_nofs_save();</div><div class='del'>-				sums = kvzalloc(btrfs_ordered_sum_size(fs_info,</div><div class='del'>-						      bytes_left), GFP_KERNEL);</div><div class='del'>-				memalloc_nofs_restore(nofs_flag);</div><div class='del'>-				BUG_ON(!sums); /* -ENOMEM */</div><div class='del'>-				sums-&gt;len = bytes_left;</div><div class='del'>-				ordered = btrfs_lookup_ordered_extent(inode,</div><div class='del'>-								offset);</div><div class='del'>-				ASSERT(ordered); /* Logic error */</div><div class='del'>-				sums-&gt;bytenr = (bio-&gt;bi_iter.bi_sector &lt;&lt; 9)</div><div class='del'>-					+ total_bytes;</div><div class='del'>-				index = 0;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			data = bvec_kmap_local(&amp;bvec);</div><div class='del'>-			crypto_shash_digest(shash,</div><div class='del'>-					    data + (i * fs_info-&gt;sectorsize),</div><div class='del'>-					    fs_info-&gt;sectorsize,</div><div class='del'>-					    sums-&gt;sums + index);</div><div class='del'>-			kunmap_local(data);</div><div class='del'>-			index += fs_info-&gt;csum_size;</div><div class='del'>-			offset += fs_info-&gt;sectorsize;</div><div class='del'>-			this_sum_bytes += fs_info-&gt;sectorsize;</div><div class='del'>-			total_bytes += fs_info-&gt;sectorsize;</div><div class='del'>-		}</div><div class='del'>-</div><div class='add'>+	if (!async) {</div><div class='add'>+		csum_one_bio(bbio, &amp;bbio-&gt;bio.bi_iter);</div><div class='add'>+		return 0;</div><div class='ctx'> 	}</div><div class='del'>-	this_sum_bytes = 0;</div><div class='del'>-	btrfs_add_ordered_sum(ordered, sums);</div><div class='del'>-	btrfs_put_ordered_extent(ordered);</div><div class='add'>+	init_completion(&amp;bbio-&gt;csum_done);</div><div class='add'>+	bbio-&gt;async_csum = true;</div><div class='add'>+	bbio-&gt;csum_saved_iter = bbio-&gt;bio.bi_iter;</div><div class='add'>+	INIT_WORK(&amp;bbio-&gt;csum_work, csum_one_bio_work);</div><div class='add'>+	schedule_work(&amp;bbio-&gt;csum_work);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * helper function for csum removal, this expects the</div><div class='del'>- * key to describe the csum pointed to by the path, and it expects</div><div class='del'>- * the csum to overlap the range [bytenr, len]</div><div class='add'>+ * Nodatasum I/O on zoned file systems still requires an btrfs_ordered_sum to</div><div class='add'>+ * record the updated logical address on Zone Append completion.</div><div class='add'>+ * Allocate just the structure with an empty sums array here for that case.</div><div class='add'>+ */</div><div class='add'>+int btrfs_alloc_dummy_sum(struct btrfs_bio *bbio)</div><div class='add'>+{</div><div class='add'>+	bbio-&gt;sums = kmalloc(sizeof(*bbio-&gt;sums), GFP_NOFS);</div><div class='add'>+	if (!bbio-&gt;sums)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	bbio-&gt;sums-&gt;len = bbio-&gt;bio.bi_iter.bi_size;</div><div class='add'>+	bbio-&gt;sums-&gt;logical = bbio-&gt;bio.bi_iter.bi_sector &lt;&lt; SECTOR_SHIFT;</div><div class='add'>+	btrfs_add_ordered_sum(bbio-&gt;ordered, bbio-&gt;sums);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Remove one checksum overlapping a range.</div><div class='add'>+ *</div><div class='add'>+ * This expects the key to describe the csum pointed to by the path, and it</div><div class='add'>+ * expects the csum to overlap the range [bytenr, len]</div><div class='ctx'>  *</div><div class='del'>- * The csum should not be entirely contained in the range and the</div><div class='del'>- * range should not be entirely contained in the csum.</div><div class='add'>+ * The csum should not be entirely contained in the range and the range should</div><div class='add'>+ * not be entirely contained in the csum.</div><div class='ctx'>  *</div><div class='del'>- * This calls btrfs_truncate_item with the correct args based on the</div><div class='del'>- * overlap, and fixes up the key as required.</div><div class='add'>+ * This calls btrfs_truncate_item with the correct args based on the overlap,</div><div class='add'>+ * and fixes up the key as required.</div><div class='ctx'>  */</div><div class='del'>-static noinline void truncate_one_csum(struct btrfs_fs_info *fs_info,</div><div class='add'>+static noinline void truncate_one_csum(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				       struct btrfs_path *path,</div><div class='ctx'> 				       struct btrfs_key *key,</div><div class='ctx'> 				       u64 bytenr, u64 len)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	const u32 csum_size = fs_info-&gt;csum_size;</div><div class='ctx'> 	u64 csum_end;</div><div class='hunk'>@@ -750,7 +883,7 @@ static noinline void truncate_one_csum(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	u32 blocksize_bits = fs_info-&gt;sectorsize_bits;</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='del'>-	csum_end = btrfs_item_size_nr(leaf, path-&gt;slots[0]) / csum_size;</div><div class='add'>+	csum_end = btrfs_item_size(leaf, path-&gt;slots[0]) / csum_size;</div><div class='ctx'> 	csum_end &lt;&lt;= blocksize_bits;</div><div class='ctx'> 	csum_end += key-&gt;offset;</div><div class='ctx'> </div><div class='hunk'>@@ -763,7 +896,7 @@ static noinline void truncate_one_csum(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		 */</div><div class='ctx'> 		u32 new_size = (bytenr - key-&gt;offset) &gt;&gt; blocksize_bits;</div><div class='ctx'> 		new_size *= csum_size;</div><div class='del'>-		btrfs_truncate_item(path, new_size, 1);</div><div class='add'>+		btrfs_truncate_item(trans, path, new_size, 1);</div><div class='ctx'> 	} else if (key-&gt;offset &gt;= bytenr &amp;&amp; csum_end &gt; end_byte &amp;&amp;</div><div class='ctx'> 		   end_byte &gt; key-&gt;offset) {</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -775,24 +908,23 @@ static noinline void truncate_one_csum(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		u32 new_size = (csum_end - end_byte) &gt;&gt; blocksize_bits;</div><div class='ctx'> 		new_size *= csum_size;</div><div class='ctx'> </div><div class='del'>-		btrfs_truncate_item(path, new_size, 0);</div><div class='add'>+		btrfs_truncate_item(trans, path, new_size, 0);</div><div class='ctx'> </div><div class='ctx'> 		key-&gt;offset = end_byte;</div><div class='del'>-		btrfs_set_item_key_safe(fs_info, path, key);</div><div class='add'>+		btrfs_set_item_key_safe(trans, path, key);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		BUG();</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * deletes the csum items from the csum tree for a given</div><div class='del'>- * range of bytes.</div><div class='add'>+ * Delete the csum items from the csum tree for a given range of bytes.</div><div class='ctx'>  */</div><div class='ctx'> int btrfs_del_csums(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		    struct btrfs_root *root, u64 bytenr, u64 len)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	u64 end_byte = bytenr + len;</div><div class='ctx'> 	u64 csum_end;</div><div class='hunk'>@@ -801,8 +933,8 @@ int btrfs_del_csums(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	const u32 csum_size = fs_info-&gt;csum_size;</div><div class='ctx'> 	u32 blocksize_bits = fs_info-&gt;sectorsize_bits;</div><div class='ctx'> </div><div class='del'>-	ASSERT(root == fs_info-&gt;csum_root ||</div><div class='del'>-	       root-&gt;root_key.objectid == BTRFS_TREE_LOG_OBJECTID);</div><div class='add'>+	ASSERT(btrfs_root_id(root) == BTRFS_CSUM_TREE_OBJECTID ||</div><div class='add'>+	       btrfs_root_id(root) == BTRFS_TREE_LOG_OBJECTID);</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='hunk'>@@ -810,8 +942,8 @@ int btrfs_del_csums(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		key.objectid = BTRFS_EXTENT_CSUM_OBJECTID;</div><div class='del'>-		key.offset = end_byte - 1;</div><div class='ctx'> 		key.type = BTRFS_EXTENT_CSUM_KEY;</div><div class='add'>+		key.offset = end_byte - 1;</div><div class='ctx'> </div><div class='ctx'> 		ret = btrfs_search_slot(trans, root, &amp;key, path, -1, 1);</div><div class='ctx'> 		if (ret &gt; 0) {</div><div class='hunk'>@@ -834,7 +966,7 @@ int btrfs_del_csums(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		if (key.offset &gt;= end_byte)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		csum_end = btrfs_item_size_nr(leaf, path-&gt;slots[0]) / csum_size;</div><div class='add'>+		csum_end = btrfs_item_size(leaf, path-&gt;slots[0]) / csum_size;</div><div class='ctx'> 		csum_end &lt;&lt;= blocksize_bits;</div><div class='ctx'> 		csum_end += key.offset;</div><div class='ctx'> </div><div class='hunk'>@@ -914,7 +1046,7 @@ int btrfs_del_csums(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			 * item changed size or key</div><div class='ctx'> 			 */</div><div class='ctx'> 			ret = btrfs_split_item(trans, root, path, &amp;key, offset);</div><div class='del'>-			if (ret &amp;&amp; ret != -EAGAIN) {</div><div class='add'>+			if (unlikely(ret &amp;&amp; ret != -EAGAIN)) {</div><div class='ctx'> 				btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -922,13 +1054,12 @@ int btrfs_del_csums(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 			key.offset = end_byte - 1;</div><div class='ctx'> 		} else {</div><div class='del'>-			truncate_one_csum(fs_info, path, &amp;key, bytenr, len);</div><div class='add'>+			truncate_one_csum(trans, path, &amp;key, bytenr, len);</div><div class='ctx'> 			if (key.offset &lt; bytenr)</div><div class='ctx'> 				break;</div><div class='ctx'> 		}</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -970,7 +1101,7 @@ int btrfs_csum_file_blocks(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_key file_key;</div><div class='ctx'> 	struct btrfs_key found_key;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_csum_item *item;</div><div class='ctx'> 	struct btrfs_csum_item *item_end;</div><div class='ctx'> 	struct extent_buffer *leaf = NULL;</div><div class='hunk'>@@ -990,10 +1121,10 @@ int btrfs_csum_file_blocks(struct btrfs_trans_handle *trans,</div><div class='ctx'> again:</div><div class='ctx'> 	next_offset = (u64)-1;</div><div class='ctx'> 	found_next = 0;</div><div class='del'>-	bytenr = sums-&gt;bytenr + total_bytes;</div><div class='add'>+	bytenr = sums-&gt;logical + total_bytes;</div><div class='ctx'> 	file_key.objectid = BTRFS_EXTENT_CSUM_OBJECTID;</div><div class='del'>-	file_key.offset = bytenr;</div><div class='ctx'> 	file_key.type = BTRFS_EXTENT_CSUM_KEY;</div><div class='add'>+	file_key.offset = bytenr;</div><div class='ctx'> </div><div class='ctx'> 	item = btrfs_lookup_csum(trans, root, path, bytenr, 1);</div><div class='ctx'> 	if (!IS_ERR(item)) {</div><div class='hunk'>@@ -1002,7 +1133,7 @@ again:</div><div class='ctx'> 		item_end = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='ctx'> 					  struct btrfs_csum_item);</div><div class='ctx'> 		item_end = (struct btrfs_csum_item *)((char *)item_end +</div><div class='del'>-			   btrfs_item_size_nr(leaf, path-&gt;slots[0]));</div><div class='add'>+			   btrfs_item_size(leaf, path-&gt;slots[0]));</div><div class='ctx'> 		goto found;</div><div class='ctx'> 	}</div><div class='ctx'> 	ret = PTR_ERR(item);</div><div class='hunk'>@@ -1013,7 +1144,7 @@ again:</div><div class='ctx'> 		u32 item_size;</div><div class='ctx'> 		/* we found one, but it isn't big enough yet */</div><div class='ctx'> 		leaf = path-&gt;nodes[0];</div><div class='del'>-		item_size = btrfs_item_size_nr(leaf, path-&gt;slots[0]);</div><div class='add'>+		item_size = btrfs_item_size(leaf, path-&gt;slots[0]);</div><div class='ctx'> 		if ((item_size / csum_size) &gt;=</div><div class='ctx'> 		    MAX_CSUM_ITEMS(fs_info, csum_size)) {</div><div class='ctx'> 			/* already at max size, make a new one */</div><div class='hunk'>@@ -1046,10 +1177,10 @@ again:</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	btrfs_release_path(path);</div><div class='del'>-	path-&gt;search_for_extension = 1;</div><div class='add'>+	path-&gt;search_for_extension = true;</div><div class='ctx'> 	ret = btrfs_search_slot(trans, root, &amp;file_key, path,</div><div class='ctx'> 				csum_size, 1);</div><div class='del'>-	path-&gt;search_for_extension = 0;</div><div class='add'>+	path-&gt;search_for_extension = false;</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -1070,7 +1201,7 @@ again:</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> extend_csum:</div><div class='del'>-	if (csum_offset == btrfs_item_size_nr(leaf, path-&gt;slots[0]) /</div><div class='add'>+	if (csum_offset == btrfs_item_size(leaf, path-&gt;slots[0]) /</div><div class='ctx'> 	    csum_size) {</div><div class='ctx'> 		int extend_nr;</div><div class='ctx'> 		u64 tmp;</div><div class='hunk'>@@ -1102,7 +1233,7 @@ extend_csum:</div><div class='ctx'> 		 * search, etc, because log trees are temporary anyway and it</div><div class='ctx'> 		 * would only save a few bytes of leaf space.</div><div class='ctx'> 		 */</div><div class='del'>-		if (root-&gt;root_key.objectid == BTRFS_TREE_LOG_OBJECTID) {</div><div class='add'>+		if (btrfs_root_id(root) == BTRFS_TREE_LOG_OBJECTID) {</div><div class='ctx'> 			if (path-&gt;slots[0] + 1 &gt;=</div><div class='ctx'> 			    btrfs_header_nritems(path-&gt;nodes[0])) {</div><div class='ctx'> 				ret = find_next_csum_offset(root, path, &amp;next_offset);</div><div class='hunk'>@@ -1125,12 +1256,12 @@ extend_csum:</div><div class='ctx'> 		diff = min(diff,</div><div class='ctx'> 			   MAX_CSUM_ITEMS(fs_info, csum_size) * csum_size);</div><div class='ctx'> </div><div class='del'>-		diff = diff - btrfs_item_size_nr(leaf, path-&gt;slots[0]);</div><div class='add'>+		diff = diff - btrfs_item_size(leaf, path-&gt;slots[0]);</div><div class='ctx'> 		diff = min_t(u32, btrfs_leaf_free_space(leaf), diff);</div><div class='ctx'> 		diff /= csum_size;</div><div class='ctx'> 		diff *= csum_size;</div><div class='ctx'> </div><div class='del'>-		btrfs_extend_item(path, diff);</div><div class='add'>+		btrfs_extend_item(trans, path, diff);</div><div class='ctx'> 		ret = 0;</div><div class='ctx'> 		goto csum;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1156,13 +1287,11 @@ insert:</div><div class='ctx'> 				      ins_size);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='del'>-	if (WARN_ON(ret != 0))</div><div class='del'>-		goto out;</div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> csum:</div><div class='ctx'> 	item = btrfs_item_ptr(leaf, path-&gt;slots[0], struct btrfs_csum_item);</div><div class='ctx'> 	item_end = (struct btrfs_csum_item *)((unsigned char *)item +</div><div class='del'>-				      btrfs_item_size_nr(leaf, path-&gt;slots[0]));</div><div class='add'>+				      btrfs_item_size(leaf, path-&gt;slots[0]));</div><div class='ctx'> 	item = (struct btrfs_csum_item *)((unsigned char *)item +</div><div class='ctx'> 					  csum_offset * csum_size);</div><div class='ctx'> found:</div><div class='hunk'>@@ -1177,21 +1306,18 @@ found:</div><div class='ctx'> 	ins_size /= csum_size;</div><div class='ctx'> 	total_bytes += ins_size * fs_info-&gt;sectorsize;</div><div class='ctx'> </div><div class='del'>-	btrfs_mark_buffer_dirty(path-&gt;nodes[0]);</div><div class='ctx'> 	if (total_bytes &lt; sums-&gt;len) {</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 		goto again;</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_extent_item_to_extent_map(struct btrfs_inode *inode,</div><div class='ctx'> 				     const struct btrfs_path *path,</div><div class='del'>-				     struct btrfs_file_extent_item *fi,</div><div class='del'>-				     const bool new_inline,</div><div class='add'>+				     const struct btrfs_file_extent_item *fi,</div><div class='ctx'> 				     struct extent_map *em)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='hunk'>@@ -1199,58 +1325,56 @@ void btrfs_extent_item_to_extent_map(struct btrfs_inode *inode,</div><div class='ctx'> 	struct extent_buffer *leaf = path-&gt;nodes[0];</div><div class='ctx'> 	const int slot = path-&gt;slots[0];</div><div class='ctx'> 	struct btrfs_key key;</div><div class='del'>-	u64 extent_start, extent_end;</div><div class='del'>-	u64 bytenr;</div><div class='add'>+	u64 extent_start;</div><div class='ctx'> 	u8 type = btrfs_file_extent_type(leaf, fi);</div><div class='ctx'> 	int compress_type = btrfs_file_extent_compression(leaf, fi);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_item_key_to_cpu(leaf, &amp;key, slot);</div><div class='ctx'> 	extent_start = key.offset;</div><div class='del'>-	extent_end = btrfs_file_extent_end(path);</div><div class='ctx'> 	em-&gt;ram_bytes = btrfs_file_extent_ram_bytes(leaf, fi);</div><div class='add'>+	em-&gt;generation = btrfs_file_extent_generation(leaf, fi);</div><div class='ctx'> 	if (type == BTRFS_FILE_EXTENT_REG ||</div><div class='ctx'> 	    type == BTRFS_FILE_EXTENT_PREALLOC) {</div><div class='add'>+		const u64 disk_bytenr = btrfs_file_extent_disk_bytenr(leaf, fi);</div><div class='add'>+</div><div class='ctx'> 		em-&gt;start = extent_start;</div><div class='del'>-		em-&gt;len = extent_end - extent_start;</div><div class='del'>-		em-&gt;orig_start = extent_start -</div><div class='del'>-			btrfs_file_extent_offset(leaf, fi);</div><div class='del'>-		em-&gt;orig_block_len = btrfs_file_extent_disk_num_bytes(leaf, fi);</div><div class='del'>-		bytenr = btrfs_file_extent_disk_bytenr(leaf, fi);</div><div class='del'>-		if (bytenr == 0) {</div><div class='del'>-			em-&gt;block_start = EXTENT_MAP_HOLE;</div><div class='add'>+		em-&gt;len = btrfs_file_extent_end(path) - extent_start;</div><div class='add'>+		if (disk_bytenr == 0) {</div><div class='add'>+			em-&gt;disk_bytenr = EXTENT_MAP_HOLE;</div><div class='add'>+			em-&gt;disk_num_bytes = 0;</div><div class='add'>+			em-&gt;offset = 0;</div><div class='ctx'> 			return;</div><div class='ctx'> 		}</div><div class='add'>+		em-&gt;disk_bytenr = disk_bytenr;</div><div class='add'>+		em-&gt;disk_num_bytes = btrfs_file_extent_disk_num_bytes(leaf, fi);</div><div class='add'>+		em-&gt;offset = btrfs_file_extent_offset(leaf, fi);</div><div class='ctx'> 		if (compress_type != BTRFS_COMPRESS_NONE) {</div><div class='del'>-			set_bit(EXTENT_FLAG_COMPRESSED, &amp;em-&gt;flags);</div><div class='del'>-			em-&gt;compress_type = compress_type;</div><div class='del'>-			em-&gt;block_start = bytenr;</div><div class='del'>-			em-&gt;block_len = em-&gt;orig_block_len;</div><div class='add'>+			btrfs_extent_map_set_compression(em, compress_type);</div><div class='ctx'> 		} else {</div><div class='del'>-			bytenr += btrfs_file_extent_offset(leaf, fi);</div><div class='del'>-			em-&gt;block_start = bytenr;</div><div class='del'>-			em-&gt;block_len = em-&gt;len;</div><div class='add'>+			/*</div><div class='add'>+			 * Older kernels can create regular non-hole data</div><div class='add'>+			 * extents with ram_bytes smaller than disk_num_bytes.</div><div class='add'>+			 * Not a big deal, just always use disk_num_bytes</div><div class='add'>+			 * for ram_bytes.</div><div class='add'>+			 */</div><div class='add'>+			em-&gt;ram_bytes = em-&gt;disk_num_bytes;</div><div class='ctx'> 			if (type == BTRFS_FILE_EXTENT_PREALLOC)</div><div class='del'>-				set_bit(EXTENT_FLAG_PREALLOC, &amp;em-&gt;flags);</div><div class='add'>+				em-&gt;flags |= EXTENT_FLAG_PREALLOC;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else if (type == BTRFS_FILE_EXTENT_INLINE) {</div><div class='del'>-		em-&gt;block_start = EXTENT_MAP_INLINE;</div><div class='del'>-		em-&gt;start = extent_start;</div><div class='del'>-		em-&gt;len = extent_end - extent_start;</div><div class='del'>-		/*</div><div class='del'>-		 * Initialize orig_start and block_len with the same values</div><div class='del'>-		 * as in inode.c:btrfs_get_extent().</div><div class='del'>-		 */</div><div class='del'>-		em-&gt;orig_start = EXTENT_MAP_HOLE;</div><div class='del'>-		em-&gt;block_len = (u64)-1;</div><div class='del'>-		if (!new_inline &amp;&amp; compress_type != BTRFS_COMPRESS_NONE) {</div><div class='del'>-			set_bit(EXTENT_FLAG_COMPRESSED, &amp;em-&gt;flags);</div><div class='del'>-			em-&gt;compress_type = compress_type;</div><div class='del'>-		}</div><div class='add'>+		/* Tree-checker has ensured this. */</div><div class='add'>+		ASSERT(extent_start == 0);</div><div class='add'>+</div><div class='add'>+		em-&gt;disk_bytenr = EXTENT_MAP_INLINE;</div><div class='add'>+		em-&gt;start = 0;</div><div class='add'>+		em-&gt;len = fs_info-&gt;sectorsize;</div><div class='add'>+		em-&gt;offset = 0;</div><div class='add'>+		btrfs_extent_map_set_compression(em, compress_type);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='ctx'> 			  "unknown file extent item type %d, inode %llu, offset %llu, "</div><div class='ctx'> 			  "root %llu", type, btrfs_ino(inode), extent_start,</div><div class='del'>-			  root-&gt;root_key.objectid);</div><div class='add'>+			  btrfs_root_id(root));</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1271,12 +1395,10 @@ u64 btrfs_file_extent_end(const struct btrfs_path *path)</div><div class='ctx'> 	ASSERT(key.type == BTRFS_EXTENT_DATA_KEY);</div><div class='ctx'> 	fi = btrfs_item_ptr(leaf, slot, struct btrfs_file_extent_item);</div><div class='ctx'> </div><div class='del'>-	if (btrfs_file_extent_type(leaf, fi) == BTRFS_FILE_EXTENT_INLINE) {</div><div class='del'>-		end = btrfs_file_extent_ram_bytes(leaf, fi);</div><div class='del'>-		end = ALIGN(key.offset + end, leaf-&gt;fs_info-&gt;sectorsize);</div><div class='del'>-	} else {</div><div class='add'>+	if (btrfs_file_extent_type(leaf, fi) == BTRFS_FILE_EXTENT_INLINE)</div><div class='add'>+		end = leaf-&gt;fs_info-&gt;sectorsize;</div><div class='add'>+	else</div><div class='ctx'> 		end = key.offset + btrfs_file_extent_num_bytes(leaf, fi);</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	return end;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/btrfs/file-item.h b/fs/btrfs/file-item.h<br/>new file mode 100644<br/>index 000000000000..5645c5e3abdb<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/file-item.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/file-item.h</a></div><div class='hunk'>@@ -0,0 +1,87 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+</div><div class='add'>+#ifndef BTRFS_FILE_ITEM_H</div><div class='add'>+#define BTRFS_FILE_ITEM_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/blk_types.h&gt;</div><div class='add'>+#include &lt;linux/list.h&gt;</div><div class='add'>+#include &lt;uapi/linux/btrfs_tree.h&gt;</div><div class='add'>+#include "ctree.h"</div><div class='add'>+#include "ordered-data.h"</div><div class='add'>+</div><div class='add'>+struct extent_map;</div><div class='add'>+struct btrfs_file_extent_item;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+struct btrfs_path;</div><div class='add'>+struct btrfs_bio;</div><div class='add'>+struct btrfs_trans_handle;</div><div class='add'>+struct btrfs_root;</div><div class='add'>+struct btrfs_ordered_sum;</div><div class='add'>+struct btrfs_path;</div><div class='add'>+struct btrfs_inode;</div><div class='add'>+</div><div class='add'>+#define BTRFS_FILE_EXTENT_INLINE_DATA_START		\</div><div class='add'>+		(offsetof(struct btrfs_file_extent_item, disk_bytenr))</div><div class='add'>+</div><div class='add'>+static inline u32 BTRFS_MAX_INLINE_DATA_SIZE(const struct btrfs_fs_info *info)</div><div class='add'>+{</div><div class='add'>+	return BTRFS_MAX_ITEM_SIZE(info) - BTRFS_FILE_EXTENT_INLINE_DATA_START;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Return the number of bytes used by the item on disk, minus the size of any</div><div class='add'>+ * extent headers.  If a file is compressed on disk, this is the compressed</div><div class='add'>+ * size.</div><div class='add'>+ */</div><div class='add'>+static inline u32 btrfs_file_extent_inline_item_len(</div><div class='add'>+						const struct extent_buffer *eb,</div><div class='add'>+						int nr)</div><div class='add'>+{</div><div class='add'>+	return btrfs_item_size(eb, nr) - BTRFS_FILE_EXTENT_INLINE_DATA_START;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline unsigned long btrfs_file_extent_inline_start(</div><div class='add'>+				const struct btrfs_file_extent_item *e)</div><div class='add'>+{</div><div class='add'>+	return (unsigned long)e + BTRFS_FILE_EXTENT_INLINE_DATA_START;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline u32 btrfs_file_extent_calc_inline_size(u32 datasize)</div><div class='add'>+{</div><div class='add'>+	return BTRFS_FILE_EXTENT_INLINE_DATA_START + datasize;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_del_csums(struct btrfs_trans_handle *trans,</div><div class='add'>+		    struct btrfs_root *root, u64 bytenr, u64 len);</div><div class='add'>+int btrfs_lookup_bio_sums(struct btrfs_bio *bbio);</div><div class='add'>+int btrfs_insert_hole_extent(struct btrfs_trans_handle *trans,</div><div class='add'>+			     struct btrfs_root *root, u64 objectid, u64 pos,</div><div class='add'>+			     u64 num_bytes);</div><div class='add'>+int btrfs_lookup_file_extent(struct btrfs_trans_handle *trans,</div><div class='add'>+			     struct btrfs_root *root,</div><div class='add'>+			     struct btrfs_path *path, u64 objectid,</div><div class='add'>+			     u64 bytenr, int mod);</div><div class='add'>+int btrfs_csum_file_blocks(struct btrfs_trans_handle *trans,</div><div class='add'>+			   struct btrfs_root *root,</div><div class='add'>+			   struct btrfs_ordered_sum *sums);</div><div class='add'>+int btrfs_csum_one_bio(struct btrfs_bio *bbio, bool async);</div><div class='add'>+int btrfs_alloc_dummy_sum(struct btrfs_bio *bbio);</div><div class='add'>+int btrfs_lookup_csums_range(struct btrfs_root *root, u64 start, u64 end,</div><div class='add'>+			     struct list_head *list, int search_commit,</div><div class='add'>+			     bool nowait);</div><div class='add'>+int btrfs_lookup_csums_list(struct btrfs_root *root, u64 start, u64 end,</div><div class='add'>+			    struct list_head *list, bool nowait);</div><div class='add'>+int btrfs_lookup_csums_bitmap(struct btrfs_root *root, struct btrfs_path *path,</div><div class='add'>+			      u64 start, u64 end, u8 *csum_buf,</div><div class='add'>+			      unsigned long *csum_bitmap);</div><div class='add'>+void btrfs_extent_item_to_extent_map(struct btrfs_inode *inode,</div><div class='add'>+				     const struct btrfs_path *path,</div><div class='add'>+				     const struct btrfs_file_extent_item *fi,</div><div class='add'>+				     struct extent_map *em);</div><div class='add'>+int btrfs_inode_clear_file_extent_range(struct btrfs_inode *inode, u64 start,</div><div class='add'>+					u64 len);</div><div class='add'>+int btrfs_inode_set_file_extent_range(struct btrfs_inode *inode, u64 start, u64 len);</div><div class='add'>+void btrfs_inode_safe_disk_i_size_write(struct btrfs_inode *inode, u64 new_i_size);</div><div class='add'>+u64 btrfs_file_extent_end(const struct btrfs_path *path);</div><div class='add'>+</div><div class='add'>+#endif</div><div class='head'>diff --git a/fs/btrfs/file.c b/fs/btrfs/file.c<br/>index 11204dbbe053..7a501e73d880 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/file.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/file.c</a></div><div class='hunk'>@@ -18,466 +18,64 @@</div><div class='ctx'> #include &lt;linux/iversion.h&gt;</div><div class='ctx'> #include &lt;linux/fsverity.h&gt;</div><div class='ctx'> #include "ctree.h"</div><div class='add'>+#include "direct-io.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='ctx'> #include "transaction.h"</div><div class='ctx'> #include "btrfs_inode.h"</div><div class='del'>-#include "print-tree.h"</div><div class='ctx'> #include "tree-log.h"</div><div class='ctx'> #include "locking.h"</div><div class='del'>-#include "volumes.h"</div><div class='ctx'> #include "qgroup.h"</div><div class='ctx'> #include "compression.h"</div><div class='ctx'> #include "delalloc-space.h"</div><div class='ctx'> #include "reflink.h"</div><div class='ctx'> #include "subpage.h"</div><div class='del'>-</div><div class='del'>-static struct kmem_cache *btrfs_inode_defrag_cachep;</div><div class='del'>-/*</div><div class='del'>- * when auto defrag is enabled we</div><div class='del'>- * queue up these defrag structs to remember which</div><div class='del'>- * inodes need defragging passes</div><div class='del'>- */</div><div class='del'>-struct inode_defrag {</div><div class='del'>-	struct rb_node rb_node;</div><div class='del'>-	/* objectid */</div><div class='del'>-	u64 ino;</div><div class='del'>-	/*</div><div class='del'>-	 * transid where the defrag was added, we search for</div><div class='del'>-	 * extents newer than this</div><div class='del'>-	 */</div><div class='del'>-	u64 transid;</div><div class='del'>-</div><div class='del'>-	/* root objectid */</div><div class='del'>-	u64 root;</div><div class='del'>-</div><div class='del'>-	/* last offset we were able to defrag */</div><div class='del'>-	u64 last_offset;</div><div class='del'>-</div><div class='del'>-	/* if we've wrapped around back to zero once already */</div><div class='del'>-	int cycled;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static int __compare_inode_defrag(struct inode_defrag *defrag1,</div><div class='del'>-				  struct inode_defrag *defrag2)</div><div class='del'>-{</div><div class='del'>-	if (defrag1-&gt;root &gt; defrag2-&gt;root)</div><div class='del'>-		return 1;</div><div class='del'>-	else if (defrag1-&gt;root &lt; defrag2-&gt;root)</div><div class='del'>-		return -1;</div><div class='del'>-	else if (defrag1-&gt;ino &gt; defrag2-&gt;ino)</div><div class='del'>-		return 1;</div><div class='del'>-	else if (defrag1-&gt;ino &lt; defrag2-&gt;ino)</div><div class='del'>-		return -1;</div><div class='del'>-	else</div><div class='del'>-		return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* pop a record for an inode into the defrag tree.  The lock</div><div class='del'>- * must be held already</div><div class='del'>- *</div><div class='del'>- * If you're inserting a record for an older transid than an</div><div class='del'>- * existing record, the transid already in the tree is lowered</div><div class='del'>- *</div><div class='del'>- * If an existing record is found the defrag item you</div><div class='del'>- * pass in is freed</div><div class='del'>- */</div><div class='del'>-static int __btrfs_add_inode_defrag(struct btrfs_inode *inode,</div><div class='del'>-				    struct inode_defrag *defrag)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='del'>-	struct inode_defrag *entry;</div><div class='del'>-	struct rb_node **p;</div><div class='del'>-	struct rb_node *parent = NULL;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	p = &amp;fs_info-&gt;defrag_inodes.rb_node;</div><div class='del'>-	while (*p) {</div><div class='del'>-		parent = *p;</div><div class='del'>-		entry = rb_entry(parent, struct inode_defrag, rb_node);</div><div class='del'>-</div><div class='del'>-		ret = __compare_inode_defrag(defrag, entry);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			p = &amp;parent-&gt;rb_left;</div><div class='del'>-		else if (ret &gt; 0)</div><div class='del'>-			p = &amp;parent-&gt;rb_right;</div><div class='del'>-		else {</div><div class='del'>-			/* if we're reinserting an entry for</div><div class='del'>-			 * an old defrag run, make sure to</div><div class='del'>-			 * lower the transid of our existing record</div><div class='del'>-			 */</div><div class='del'>-			if (defrag-&gt;transid &lt; entry-&gt;transid)</div><div class='del'>-				entry-&gt;transid = defrag-&gt;transid;</div><div class='del'>-			if (defrag-&gt;last_offset &gt; entry-&gt;last_offset)</div><div class='del'>-				entry-&gt;last_offset = defrag-&gt;last_offset;</div><div class='del'>-			return -EEXIST;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	set_bit(BTRFS_INODE_IN_DEFRAG, &amp;inode-&gt;runtime_flags);</div><div class='del'>-	rb_link_node(&amp;defrag-&gt;rb_node, parent, p);</div><div class='del'>-	rb_insert_color(&amp;defrag-&gt;rb_node, &amp;fs_info-&gt;defrag_inodes);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline int __need_auto_defrag(struct btrfs_fs_info *fs_info)</div><div class='del'>-{</div><div class='del'>-	if (!btrfs_test_opt(fs_info, AUTO_DEFRAG))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	if (btrfs_fs_closing(fs_info))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	return 1;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * insert a defrag record for this inode if auto defrag is</div><div class='del'>- * enabled</div><div class='del'>- */</div><div class='del'>-int btrfs_add_inode_defrag(struct btrfs_trans_handle *trans,</div><div class='del'>-			   struct btrfs_inode *inode)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_root *root = inode-&gt;root;</div><div class='del'>-	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='del'>-	struct inode_defrag *defrag;</div><div class='del'>-	u64 transid;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (!__need_auto_defrag(fs_info))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	if (test_bit(BTRFS_INODE_IN_DEFRAG, &amp;inode-&gt;runtime_flags))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	if (trans)</div><div class='del'>-		transid = trans-&gt;transid;</div><div class='del'>-	else</div><div class='del'>-		transid = inode-&gt;root-&gt;last_trans;</div><div class='del'>-</div><div class='del'>-	defrag = kmem_cache_zalloc(btrfs_inode_defrag_cachep, GFP_NOFS);</div><div class='del'>-	if (!defrag)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	defrag-&gt;ino = btrfs_ino(inode);</div><div class='del'>-	defrag-&gt;transid = transid;</div><div class='del'>-	defrag-&gt;root = root-&gt;root_key.objectid;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;fs_info-&gt;defrag_inodes_lock);</div><div class='del'>-	if (!test_bit(BTRFS_INODE_IN_DEFRAG, &amp;inode-&gt;runtime_flags)) {</div><div class='del'>-		/*</div><div class='del'>-		 * If we set IN_DEFRAG flag and evict the inode from memory,</div><div class='del'>-		 * and then re-read this inode, this new inode doesn't have</div><div class='del'>-		 * IN_DEFRAG flag. At the case, we may find the existed defrag.</div><div class='del'>-		 */</div><div class='del'>-		ret = __btrfs_add_inode_defrag(inode, defrag);</div><div class='del'>-		if (ret)</div><div class='del'>-			kmem_cache_free(btrfs_inode_defrag_cachep, defrag);</div><div class='del'>-	} else {</div><div class='del'>-		kmem_cache_free(btrfs_inode_defrag_cachep, defrag);</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;defrag_inodes_lock);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Requeue the defrag object. If there is a defrag object that points to</div><div class='del'>- * the same inode in the tree, we will merge them together (by</div><div class='del'>- * __btrfs_add_inode_defrag()) and free the one that we want to requeue.</div><div class='del'>- */</div><div class='del'>-static void btrfs_requeue_inode_defrag(struct btrfs_inode *inode,</div><div class='del'>-				       struct inode_defrag *defrag)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (!__need_auto_defrag(fs_info))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Here we don't check the IN_DEFRAG flag, because we need merge</div><div class='del'>-	 * them together.</div><div class='del'>-	 */</div><div class='del'>-	spin_lock(&amp;fs_info-&gt;defrag_inodes_lock);</div><div class='del'>-	ret = __btrfs_add_inode_defrag(inode, defrag);</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;defrag_inodes_lock);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto out;</div><div class='del'>-	return;</div><div class='del'>-out:</div><div class='del'>-	kmem_cache_free(btrfs_inode_defrag_cachep, defrag);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * pick the defragable inode that we want, if it doesn't exist, we will get</div><div class='del'>- * the next one.</div><div class='del'>- */</div><div class='del'>-static struct inode_defrag *</div><div class='del'>-btrfs_pick_defrag_inode(struct btrfs_fs_info *fs_info, u64 root, u64 ino)</div><div class='del'>-{</div><div class='del'>-	struct inode_defrag *entry = NULL;</div><div class='del'>-	struct inode_defrag tmp;</div><div class='del'>-	struct rb_node *p;</div><div class='del'>-	struct rb_node *parent = NULL;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	tmp.ino = ino;</div><div class='del'>-	tmp.root = root;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;fs_info-&gt;defrag_inodes_lock);</div><div class='del'>-	p = fs_info-&gt;defrag_inodes.rb_node;</div><div class='del'>-	while (p) {</div><div class='del'>-		parent = p;</div><div class='del'>-		entry = rb_entry(parent, struct inode_defrag, rb_node);</div><div class='del'>-</div><div class='del'>-		ret = __compare_inode_defrag(&amp;tmp, entry);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			p = parent-&gt;rb_left;</div><div class='del'>-		else if (ret &gt; 0)</div><div class='del'>-			p = parent-&gt;rb_right;</div><div class='del'>-		else</div><div class='del'>-			goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (parent &amp;&amp; __compare_inode_defrag(&amp;tmp, entry) &gt; 0) {</div><div class='del'>-		parent = rb_next(parent);</div><div class='del'>-		if (parent)</div><div class='del'>-			entry = rb_entry(parent, struct inode_defrag, rb_node);</div><div class='del'>-		else</div><div class='del'>-			entry = NULL;</div><div class='del'>-	}</div><div class='del'>-out:</div><div class='del'>-	if (entry)</div><div class='del'>-		rb_erase(parent, &amp;fs_info-&gt;defrag_inodes);</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;defrag_inodes_lock);</div><div class='del'>-	return entry;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void btrfs_cleanup_defrag_inodes(struct btrfs_fs_info *fs_info)</div><div class='del'>-{</div><div class='del'>-	struct inode_defrag *defrag;</div><div class='del'>-	struct rb_node *node;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;fs_info-&gt;defrag_inodes_lock);</div><div class='del'>-	node = rb_first(&amp;fs_info-&gt;defrag_inodes);</div><div class='del'>-	while (node) {</div><div class='del'>-		rb_erase(node, &amp;fs_info-&gt;defrag_inodes);</div><div class='del'>-		defrag = rb_entry(node, struct inode_defrag, rb_node);</div><div class='del'>-		kmem_cache_free(btrfs_inode_defrag_cachep, defrag);</div><div class='del'>-</div><div class='del'>-		cond_resched_lock(&amp;fs_info-&gt;defrag_inodes_lock);</div><div class='del'>-</div><div class='del'>-		node = rb_first(&amp;fs_info-&gt;defrag_inodes);</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;defrag_inodes_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#define BTRFS_DEFRAG_BATCH	1024</div><div class='del'>-</div><div class='del'>-static int __btrfs_run_defrag_inode(struct btrfs_fs_info *fs_info,</div><div class='del'>-				    struct inode_defrag *defrag)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_root *inode_root;</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	struct btrfs_ioctl_defrag_range_args range;</div><div class='del'>-	int num_defrag;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	/* get the inode */</div><div class='del'>-	inode_root = btrfs_get_fs_root(fs_info, defrag-&gt;root, true);</div><div class='del'>-	if (IS_ERR(inode_root)) {</div><div class='del'>-		ret = PTR_ERR(inode_root);</div><div class='del'>-		goto cleanup;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	inode = btrfs_iget(fs_info-&gt;sb, defrag-&gt;ino, inode_root);</div><div class='del'>-	btrfs_put_root(inode_root);</div><div class='del'>-	if (IS_ERR(inode)) {</div><div class='del'>-		ret = PTR_ERR(inode);</div><div class='del'>-		goto cleanup;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* do a chunk of defrag */</div><div class='del'>-	clear_bit(BTRFS_INODE_IN_DEFRAG, &amp;BTRFS_I(inode)-&gt;runtime_flags);</div><div class='del'>-	memset(&amp;range, 0, sizeof(range));</div><div class='del'>-	range.len = (u64)-1;</div><div class='del'>-	range.start = defrag-&gt;last_offset;</div><div class='del'>-</div><div class='del'>-	sb_start_write(fs_info-&gt;sb);</div><div class='del'>-	num_defrag = btrfs_defrag_file(inode, NULL, &amp;range, defrag-&gt;transid,</div><div class='del'>-				       BTRFS_DEFRAG_BATCH);</div><div class='del'>-	sb_end_write(fs_info-&gt;sb);</div><div class='del'>-	/*</div><div class='del'>-	 * if we filled the whole defrag batch, there</div><div class='del'>-	 * must be more work to do.  Queue this defrag</div><div class='del'>-	 * again</div><div class='del'>-	 */</div><div class='del'>-	if (num_defrag == BTRFS_DEFRAG_BATCH) {</div><div class='del'>-		defrag-&gt;last_offset = range.start;</div><div class='del'>-		btrfs_requeue_inode_defrag(BTRFS_I(inode), defrag);</div><div class='del'>-	} else if (defrag-&gt;last_offset &amp;&amp; !defrag-&gt;cycled) {</div><div class='del'>-		/*</div><div class='del'>-		 * we didn't fill our defrag batch, but</div><div class='del'>-		 * we didn't start at zero.  Make sure we loop</div><div class='del'>-		 * around to the start of the file.</div><div class='del'>-		 */</div><div class='del'>-		defrag-&gt;last_offset = 0;</div><div class='del'>-		defrag-&gt;cycled = 1;</div><div class='del'>-		btrfs_requeue_inode_defrag(BTRFS_I(inode), defrag);</div><div class='del'>-	} else {</div><div class='del'>-		kmem_cache_free(btrfs_inode_defrag_cachep, defrag);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	iput(inode);</div><div class='del'>-	return 0;</div><div class='del'>-cleanup:</div><div class='del'>-	kmem_cache_free(btrfs_inode_defrag_cachep, defrag);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * run through the list of inodes in the FS that need</div><div class='del'>- * defragging</div><div class='del'>- */</div><div class='del'>-int btrfs_run_defrag_inodes(struct btrfs_fs_info *fs_info)</div><div class='del'>-{</div><div class='del'>-	struct inode_defrag *defrag;</div><div class='del'>-	u64 first_ino = 0;</div><div class='del'>-	u64 root_objectid = 0;</div><div class='del'>-</div><div class='del'>-	atomic_inc(&amp;fs_info-&gt;defrag_running);</div><div class='del'>-	while (1) {</div><div class='del'>-		/* Pause the auto defragger. */</div><div class='del'>-		if (test_bit(BTRFS_FS_STATE_REMOUNTING,</div><div class='del'>-			     &amp;fs_info-&gt;fs_state))</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		if (!__need_auto_defrag(fs_info))</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		/* find an inode to defrag */</div><div class='del'>-		defrag = btrfs_pick_defrag_inode(fs_info, root_objectid,</div><div class='del'>-						 first_ino);</div><div class='del'>-		if (!defrag) {</div><div class='del'>-			if (root_objectid || first_ino) {</div><div class='del'>-				root_objectid = 0;</div><div class='del'>-				first_ino = 0;</div><div class='del'>-				continue;</div><div class='del'>-			} else {</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		first_ino = defrag-&gt;ino + 1;</div><div class='del'>-		root_objectid = defrag-&gt;root;</div><div class='del'>-</div><div class='del'>-		__btrfs_run_defrag_inode(fs_info, defrag);</div><div class='del'>-	}</div><div class='del'>-	atomic_dec(&amp;fs_info-&gt;defrag_running);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * during unmount, we use the transaction_wait queue to</div><div class='del'>-	 * wait for the defragger to stop</div><div class='del'>-	 */</div><div class='del'>-	wake_up(&amp;fs_info-&gt;transaction_wait);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* simple helper to fault in pages and copy.  This should go away</div><div class='del'>- * and be replaced with calls into generic code.</div><div class='del'>- */</div><div class='del'>-static noinline int btrfs_copy_from_user(loff_t pos, size_t write_bytes,</div><div class='del'>-					 struct page **prepared_pages,</div><div class='del'>-					 struct iov_iter *i)</div><div class='del'>-{</div><div class='del'>-	size_t copied = 0;</div><div class='del'>-	size_t total_copied = 0;</div><div class='del'>-	int pg = 0;</div><div class='del'>-	int offset = offset_in_page(pos);</div><div class='del'>-</div><div class='del'>-	while (write_bytes &gt; 0) {</div><div class='del'>-		size_t count = min_t(size_t,</div><div class='del'>-				     PAGE_SIZE - offset, write_bytes);</div><div class='del'>-		struct page *page = prepared_pages[pg];</div><div class='del'>-		/*</div><div class='del'>-		 * Copy data from userspace to the current page</div><div class='del'>-		 */</div><div class='del'>-		copied = copy_page_from_iter_atomic(page, offset, count, i);</div><div class='del'>-</div><div class='del'>-		/* Flush processor's dcache for this page */</div><div class='del'>-		flush_dcache_page(page);</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * if we get a partial write, we can end up with</div><div class='del'>-		 * partially up to date pages.  These add</div><div class='del'>-		 * a lot of complexity, so make sure they don't</div><div class='del'>-		 * happen by forcing this copy to be retried.</div><div class='del'>-		 *</div><div class='del'>-		 * The rest of the btrfs_file_write code will fall</div><div class='del'>-		 * back to page at a time copies after we return 0.</div><div class='del'>-		 */</div><div class='del'>-		if (unlikely(copied &lt; count)) {</div><div class='del'>-			if (!PageUptodate(page)) {</div><div class='del'>-				iov_iter_revert(i, copied);</div><div class='del'>-				copied = 0;</div><div class='del'>-			}</div><div class='del'>-			if (!copied)</div><div class='del'>-				break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		write_bytes -= copied;</div><div class='del'>-		total_copied += copied;</div><div class='del'>-		offset += copied;</div><div class='del'>-		if (offset == PAGE_SIZE) {</div><div class='del'>-			pg++;</div><div class='del'>-			offset = 0;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	return total_copied;</div><div class='del'>-}</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "extent-tree.h"</div><div class='add'>+#include "file-item.h"</div><div class='add'>+#include "ioctl.h"</div><div class='add'>+#include "file.h"</div><div class='add'>+#include "super.h"</div><div class='add'>+#include "print-tree.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * unlocks pages after btrfs_file_write is done with them</div><div class='add'>+ * Unlock folio after btrfs_file_write() is done with it.</div><div class='ctx'>  */</div><div class='del'>-static void btrfs_drop_pages(struct btrfs_fs_info *fs_info,</div><div class='del'>-			     struct page **pages, size_t num_pages,</div><div class='add'>+static void btrfs_drop_folio(struct btrfs_fs_info *fs_info, struct folio *folio,</div><div class='ctx'> 			     u64 pos, u64 copied)</div><div class='ctx'> {</div><div class='del'>-	size_t i;</div><div class='ctx'> 	u64 block_start = round_down(pos, fs_info-&gt;sectorsize);</div><div class='ctx'> 	u64 block_len = round_up(pos + copied, fs_info-&gt;sectorsize) - block_start;</div><div class='ctx'> </div><div class='ctx'> 	ASSERT(block_len &lt;= U32_MAX);</div><div class='del'>-	for (i = 0; i &lt; num_pages; i++) {</div><div class='del'>-		/* page checked is some magic around finding pages that</div><div class='del'>-		 * have been modified without going through btrfs_set_page_dirty</div><div class='del'>-		 * clear it here. There should be no need to mark the pages</div><div class='del'>-		 * accessed as prepare_pages should have marked them accessed</div><div class='del'>-		 * in prepare_pages via find_or_create_page()</div><div class='del'>-		 */</div><div class='del'>-		btrfs_page_clamp_clear_checked(fs_info, pages[i], block_start,</div><div class='del'>-					       block_len);</div><div class='del'>-		unlock_page(pages[i]);</div><div class='del'>-		put_page(pages[i]);</div><div class='del'>-	}</div><div class='add'>+	/*</div><div class='add'>+	 * Folio checked is some magic around finding folios that have been</div><div class='add'>+	 * modified without going through btrfs_dirty_folio().  Clear it here.</div><div class='add'>+	 * There should be no need to mark the pages accessed as</div><div class='add'>+	 * prepare_one_folio() should have marked them accessed in</div><div class='add'>+	 * prepare_one_folio() via find_or_create_page()</div><div class='add'>+	 */</div><div class='add'>+	btrfs_folio_clamp_clear_checked(fs_info, folio, block_start, block_len);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * After btrfs_copy_from_user(), update the following things for delalloc:</div><div class='del'>- * - Mark newly dirtied pages as DELALLOC in the io tree.</div><div class='add'>+ * After copy_folio_from_iter_atomic(), update the following things for delalloc:</div><div class='add'>+ * - Mark newly dirtied folio as DELALLOC in the io tree.</div><div class='ctx'>  *   Used to advise which range is to be written back.</div><div class='del'>- * - Mark modified pages as Uptodate/Dirty and not needing COW fixup</div><div class='add'>+ * - Mark modified folio as Uptodate/Dirty and not needing COW fixup</div><div class='ctx'>  * - Update inode size for past EOF write</div><div class='ctx'>  */</div><div class='del'>-int btrfs_dirty_pages(struct btrfs_inode *inode, struct page **pages,</div><div class='del'>-		      size_t num_pages, loff_t pos, size_t write_bytes,</div><div class='del'>-		      struct extent_state **cached, bool noreserve)</div><div class='add'>+int btrfs_dirty_folio(struct btrfs_inode *inode, struct folio *folio, loff_t pos,</div><div class='add'>+		      size_t write_bytes, struct extent_state **cached, bool noreserve)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='del'>-	int err = 0;</div><div class='del'>-	int i;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> 	u64 num_bytes;</div><div class='ctx'> 	u64 start_pos;</div><div class='ctx'> 	u64 end_of_last_block;</div><div class='del'>-	u64 end_pos = pos + write_bytes;</div><div class='add'>+	const u64 end_pos = pos + write_bytes;</div><div class='ctx'> 	loff_t isize = i_size_read(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> 	unsigned int extra_bits = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -488,9 +86,9 @@ int btrfs_dirty_pages(struct btrfs_inode *inode, struct page **pages,</div><div class='ctx'> 		extra_bits |= EXTENT_NORESERVE;</div><div class='ctx'> </div><div class='ctx'> 	start_pos = round_down(pos, fs_info-&gt;sectorsize);</div><div class='del'>-	num_bytes = round_up(write_bytes + pos - start_pos,</div><div class='del'>-			     fs_info-&gt;sectorsize);</div><div class='add'>+	num_bytes = round_up(end_pos - start_pos, fs_info-&gt;sectorsize);</div><div class='ctx'> 	ASSERT(num_bytes &lt;= U32_MAX);</div><div class='add'>+	ASSERT(folio_pos(folio) &lt;= pos &amp;&amp; folio_next_pos(folio) &gt;= end_pos);</div><div class='ctx'> </div><div class='ctx'> 	end_of_last_block = start_pos + num_bytes - 1;</div><div class='ctx'> </div><div class='hunk'>@@ -498,22 +96,18 @@ int btrfs_dirty_pages(struct btrfs_inode *inode, struct page **pages,</div><div class='ctx'> 	 * The pages may have already been dirty, clear out old accounting so</div><div class='ctx'> 	 * we can set things up properly</div><div class='ctx'> 	 */</div><div class='del'>-	clear_extent_bit(&amp;inode-&gt;io_tree, start_pos, end_of_last_block,</div><div class='del'>-			 EXTENT_DELALLOC | EXTENT_DO_ACCOUNTING | EXTENT_DEFRAG,</div><div class='del'>-			 0, 0, cached);</div><div class='add'>+	btrfs_clear_extent_bit(&amp;inode-&gt;io_tree, start_pos, end_of_last_block,</div><div class='add'>+			       EXTENT_DELALLOC | EXTENT_DO_ACCOUNTING | EXTENT_DEFRAG,</div><div class='add'>+			       cached);</div><div class='ctx'> </div><div class='del'>-	err = btrfs_set_extent_delalloc(inode, start_pos, end_of_last_block,</div><div class='add'>+	ret = btrfs_set_extent_delalloc(inode, start_pos, end_of_last_block,</div><div class='ctx'> 					extra_bits, cached);</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; num_pages; i++) {</div><div class='del'>-		struct page *p = pages[i];</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-		btrfs_page_clamp_set_uptodate(fs_info, p, start_pos, num_bytes);</div><div class='del'>-		btrfs_page_clamp_clear_checked(fs_info, p, start_pos, num_bytes);</div><div class='del'>-		btrfs_page_clamp_set_dirty(fs_info, p, start_pos, num_bytes);</div><div class='del'>-	}</div><div class='add'>+	btrfs_folio_clamp_set_uptodate(fs_info, folio, start_pos, num_bytes);</div><div class='add'>+	btrfs_folio_clamp_clear_checked(fs_info, folio, start_pos, num_bytes);</div><div class='add'>+	btrfs_folio_clamp_set_dirty(fs_info, folio, start_pos, num_bytes);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * we've only changed i_size in ram, and we haven't updated</div><div class='hunk'>@@ -526,159 +120,6 @@ int btrfs_dirty_pages(struct btrfs_inode *inode, struct page **pages,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * this drops all the extents in the cache that intersect the range</div><div class='del'>- * [start, end].  Existing extents are split as required.</div><div class='del'>- */</div><div class='del'>-void btrfs_drop_extent_cache(struct btrfs_inode *inode, u64 start, u64 end,</div><div class='del'>-			     int skip_pinned)</div><div class='del'>-{</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	struct extent_map *split = NULL;</div><div class='del'>-	struct extent_map *split2 = NULL;</div><div class='del'>-	struct extent_map_tree *em_tree = &amp;inode-&gt;extent_tree;</div><div class='del'>-	u64 len = end - start + 1;</div><div class='del'>-	u64 gen;</div><div class='del'>-	int ret;</div><div class='del'>-	int testend = 1;</div><div class='del'>-	unsigned long flags;</div><div class='del'>-	int compressed = 0;</div><div class='del'>-	bool modified;</div><div class='del'>-</div><div class='del'>-	WARN_ON(end &lt; start);</div><div class='del'>-	if (end == (u64)-1) {</div><div class='del'>-		len = (u64)-1;</div><div class='del'>-		testend = 0;</div><div class='del'>-	}</div><div class='del'>-	while (1) {</div><div class='del'>-		int no_splits = 0;</div><div class='del'>-</div><div class='del'>-		modified = false;</div><div class='del'>-		if (!split)</div><div class='del'>-			split = alloc_extent_map();</div><div class='del'>-		if (!split2)</div><div class='del'>-			split2 = alloc_extent_map();</div><div class='del'>-		if (!split || !split2)</div><div class='del'>-			no_splits = 1;</div><div class='del'>-</div><div class='del'>-		write_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-		em = lookup_extent_mapping(em_tree, start, len);</div><div class='del'>-		if (!em) {</div><div class='del'>-			write_unlock(&amp;em_tree-&gt;lock);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		flags = em-&gt;flags;</div><div class='del'>-		gen = em-&gt;generation;</div><div class='del'>-		if (skip_pinned &amp;&amp; test_bit(EXTENT_FLAG_PINNED, &amp;em-&gt;flags)) {</div><div class='del'>-			if (testend &amp;&amp; em-&gt;start + em-&gt;len &gt;= start + len) {</div><div class='del'>-				free_extent_map(em);</div><div class='del'>-				write_unlock(&amp;em_tree-&gt;lock);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			start = em-&gt;start + em-&gt;len;</div><div class='del'>-			if (testend)</div><div class='del'>-				len = start + len - (em-&gt;start + em-&gt;len);</div><div class='del'>-			free_extent_map(em);</div><div class='del'>-			write_unlock(&amp;em_tree-&gt;lock);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-		compressed = test_bit(EXTENT_FLAG_COMPRESSED, &amp;em-&gt;flags);</div><div class='del'>-		clear_bit(EXTENT_FLAG_PINNED, &amp;em-&gt;flags);</div><div class='del'>-		clear_bit(EXTENT_FLAG_LOGGING, &amp;flags);</div><div class='del'>-		modified = !list_empty(&amp;em-&gt;list);</div><div class='del'>-		if (no_splits)</div><div class='del'>-			goto next;</div><div class='del'>-</div><div class='del'>-		if (em-&gt;start &lt; start) {</div><div class='del'>-			split-&gt;start = em-&gt;start;</div><div class='del'>-			split-&gt;len = start - em-&gt;start;</div><div class='del'>-</div><div class='del'>-			if (em-&gt;block_start &lt; EXTENT_MAP_LAST_BYTE) {</div><div class='del'>-				split-&gt;orig_start = em-&gt;orig_start;</div><div class='del'>-				split-&gt;block_start = em-&gt;block_start;</div><div class='del'>-</div><div class='del'>-				if (compressed)</div><div class='del'>-					split-&gt;block_len = em-&gt;block_len;</div><div class='del'>-				else</div><div class='del'>-					split-&gt;block_len = split-&gt;len;</div><div class='del'>-				split-&gt;orig_block_len = max(split-&gt;block_len,</div><div class='del'>-						em-&gt;orig_block_len);</div><div class='del'>-				split-&gt;ram_bytes = em-&gt;ram_bytes;</div><div class='del'>-			} else {</div><div class='del'>-				split-&gt;orig_start = split-&gt;start;</div><div class='del'>-				split-&gt;block_len = 0;</div><div class='del'>-				split-&gt;block_start = em-&gt;block_start;</div><div class='del'>-				split-&gt;orig_block_len = 0;</div><div class='del'>-				split-&gt;ram_bytes = split-&gt;len;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			split-&gt;generation = gen;</div><div class='del'>-			split-&gt;flags = flags;</div><div class='del'>-			split-&gt;compress_type = em-&gt;compress_type;</div><div class='del'>-			replace_extent_mapping(em_tree, em, split, modified);</div><div class='del'>-			free_extent_map(split);</div><div class='del'>-			split = split2;</div><div class='del'>-			split2 = NULL;</div><div class='del'>-		}</div><div class='del'>-		if (testend &amp;&amp; em-&gt;start + em-&gt;len &gt; start + len) {</div><div class='del'>-			u64 diff = start + len - em-&gt;start;</div><div class='del'>-</div><div class='del'>-			split-&gt;start = start + len;</div><div class='del'>-			split-&gt;len = em-&gt;start + em-&gt;len - (start + len);</div><div class='del'>-			split-&gt;flags = flags;</div><div class='del'>-			split-&gt;compress_type = em-&gt;compress_type;</div><div class='del'>-			split-&gt;generation = gen;</div><div class='del'>-</div><div class='del'>-			if (em-&gt;block_start &lt; EXTENT_MAP_LAST_BYTE) {</div><div class='del'>-				split-&gt;orig_block_len = max(em-&gt;block_len,</div><div class='del'>-						    em-&gt;orig_block_len);</div><div class='del'>-</div><div class='del'>-				split-&gt;ram_bytes = em-&gt;ram_bytes;</div><div class='del'>-				if (compressed) {</div><div class='del'>-					split-&gt;block_len = em-&gt;block_len;</div><div class='del'>-					split-&gt;block_start = em-&gt;block_start;</div><div class='del'>-					split-&gt;orig_start = em-&gt;orig_start;</div><div class='del'>-				} else {</div><div class='del'>-					split-&gt;block_len = split-&gt;len;</div><div class='del'>-					split-&gt;block_start = em-&gt;block_start</div><div class='del'>-						+ diff;</div><div class='del'>-					split-&gt;orig_start = em-&gt;orig_start;</div><div class='del'>-				}</div><div class='del'>-			} else {</div><div class='del'>-				split-&gt;ram_bytes = split-&gt;len;</div><div class='del'>-				split-&gt;orig_start = split-&gt;start;</div><div class='del'>-				split-&gt;block_len = 0;</div><div class='del'>-				split-&gt;block_start = em-&gt;block_start;</div><div class='del'>-				split-&gt;orig_block_len = 0;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			if (extent_map_in_tree(em)) {</div><div class='del'>-				replace_extent_mapping(em_tree, em, split,</div><div class='del'>-						       modified);</div><div class='del'>-			} else {</div><div class='del'>-				ret = add_extent_mapping(em_tree, split,</div><div class='del'>-							 modified);</div><div class='del'>-				ASSERT(ret == 0); /* Logic error */</div><div class='del'>-			}</div><div class='del'>-			free_extent_map(split);</div><div class='del'>-			split = NULL;</div><div class='del'>-		}</div><div class='del'>-next:</div><div class='del'>-		if (extent_map_in_tree(em))</div><div class='del'>-			remove_extent_mapping(em_tree, em);</div><div class='del'>-		write_unlock(&amp;em_tree-&gt;lock);</div><div class='del'>-</div><div class='del'>-		/* once for us */</div><div class='del'>-		free_extent_map(em);</div><div class='del'>-		/* once for the tree*/</div><div class='del'>-		free_extent_map(em);</div><div class='del'>-	}</div><div class='del'>-	if (split)</div><div class='del'>-		free_extent_map(split);</div><div class='del'>-	if (split2)</div><div class='del'>-		free_extent_map(split2);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * this is very complex, but the basic idea is to drop all extents</div><div class='ctx'>  * in the range start - end.  hint_block is filled in with a block number</div><div class='ctx'>  * that would be a good hint to the block allocator for this file.</div><div class='hunk'>@@ -700,7 +141,6 @@ int btrfs_drop_extents(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_file_extent_item *fi;</div><div class='del'>-	struct btrfs_ref ref = { 0 };</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_key new_key;</div><div class='ctx'> 	u64 ino = btrfs_ino(inode);</div><div class='hunk'>@@ -718,7 +158,6 @@ int btrfs_drop_extents(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	int modify_tree = -1;</div><div class='ctx'> 	int update_refs;</div><div class='ctx'> 	int found = 0;</div><div class='del'>-	int leafs_visited = 0;</div><div class='ctx'> 	struct btrfs_path *path = args-&gt;path;</div><div class='ctx'> </div><div class='ctx'> 	args-&gt;bytes_found = 0;</div><div class='hunk'>@@ -736,12 +175,12 @@ int btrfs_drop_extents(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (args-&gt;drop_cache)</div><div class='del'>-		btrfs_drop_extent_cache(inode, args-&gt;start, args-&gt;end - 1, 0);</div><div class='add'>+		btrfs_drop_extent_map_range(inode, args-&gt;start, args-&gt;end - 1, false);</div><div class='ctx'> </div><div class='del'>-	if (args-&gt;start &gt;= inode-&gt;disk_i_size &amp;&amp; !args-&gt;replace_extent)</div><div class='add'>+	if (data_race(args-&gt;start &gt;= inode-&gt;disk_i_size) &amp;&amp; !args-&gt;replace_extent)</div><div class='ctx'> 		modify_tree = 0;</div><div class='ctx'> </div><div class='del'>-	update_refs = (root-&gt;root_key.objectid != BTRFS_TREE_LOG_OBJECTID);</div><div class='add'>+	update_refs = (btrfs_root_id(root) != BTRFS_TREE_LOG_OBJECTID);</div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		recow = 0;</div><div class='ctx'> 		ret = btrfs_lookup_file_extent(trans, root, path, ino,</div><div class='hunk'>@@ -756,11 +195,14 @@ int btrfs_drop_extents(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				path-&gt;slots[0]--;</div><div class='ctx'> 		}</div><div class='ctx'> 		ret = 0;</div><div class='del'>-		leafs_visited++;</div><div class='ctx'> next_slot:</div><div class='ctx'> 		leaf = path-&gt;nodes[0];</div><div class='ctx'> 		if (path-&gt;slots[0] &gt;= btrfs_header_nritems(leaf)) {</div><div class='del'>-			BUG_ON(del_nr &gt; 0);</div><div class='add'>+			if (WARN_ON(del_nr &gt; 0)) {</div><div class='add'>+				btrfs_print_leaf(leaf);</div><div class='add'>+				ret = -EINVAL;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='ctx'> 			ret = btrfs_next_leaf(root, path);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='ctx'> 				break;</div><div class='hunk'>@@ -768,7 +210,6 @@ next_slot:</div><div class='ctx'> 				ret = 0;</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='del'>-			leafs_visited++;</div><div class='ctx'> 			leaf = path-&gt;nodes[0];</div><div class='ctx'> 			recow = 1;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -837,7 +278,11 @@ next_slot:</div><div class='ctx'> 		 *  | -------- extent -------- |</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (args-&gt;start &gt; key.offset &amp;&amp; args-&gt;end &lt; extent_end) {</div><div class='del'>-			BUG_ON(del_nr &gt; 0);</div><div class='add'>+			if (WARN_ON(del_nr &gt; 0)) {</div><div class='add'>+				btrfs_print_leaf(leaf);</div><div class='add'>+				ret = -EINVAL;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='ctx'> 			if (extent_type == BTRFS_FILE_EXTENT_INLINE) {</div><div class='ctx'> 				ret = -EOPNOTSUPP;</div><div class='ctx'> 				break;</div><div class='hunk'>@@ -867,19 +312,24 @@ next_slot:</div><div class='ctx'> 			btrfs_set_file_extent_offset(leaf, fi, extent_offset);</div><div class='ctx'> 			btrfs_set_file_extent_num_bytes(leaf, fi,</div><div class='ctx'> 							extent_end - args-&gt;start);</div><div class='del'>-			btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> </div><div class='ctx'> 			if (update_refs &amp;&amp; disk_bytenr &gt; 0) {</div><div class='del'>-				btrfs_init_generic_ref(&amp;ref,</div><div class='del'>-						BTRFS_ADD_DELAYED_REF,</div><div class='del'>-						disk_bytenr, num_bytes, 0);</div><div class='del'>-				btrfs_init_data_ref(&amp;ref,</div><div class='del'>-						root-&gt;root_key.objectid,</div><div class='del'>-						new_key.objectid,</div><div class='del'>-						args-&gt;start - extent_offset,</div><div class='del'>-						0, false);</div><div class='add'>+				struct btrfs_ref ref = {</div><div class='add'>+					.action = BTRFS_ADD_DELAYED_REF,</div><div class='add'>+					.bytenr = disk_bytenr,</div><div class='add'>+					.num_bytes = num_bytes,</div><div class='add'>+					.parent = 0,</div><div class='add'>+					.owning_root = btrfs_root_id(root),</div><div class='add'>+					.ref_root = btrfs_root_id(root),</div><div class='add'>+				};</div><div class='add'>+				btrfs_init_data_ref(&amp;ref, new_key.objectid,</div><div class='add'>+						    args-&gt;start - extent_offset,</div><div class='add'>+						    0, false);</div><div class='ctx'> 				ret = btrfs_inc_extent_ref(trans, &amp;ref);</div><div class='del'>-				BUG_ON(ret); /* -ENOMEM */</div><div class='add'>+				if (unlikely(ret)) {</div><div class='add'>+					btrfs_abort_transaction(trans, ret);</div><div class='add'>+					break;</div><div class='add'>+				}</div><div class='ctx'> 			}</div><div class='ctx'> 			key.offset = args-&gt;start;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -901,13 +351,12 @@ next_slot:</div><div class='ctx'> </div><div class='ctx'> 			memcpy(&amp;new_key, &amp;key, sizeof(new_key));</div><div class='ctx'> 			new_key.offset = args-&gt;end;</div><div class='del'>-			btrfs_set_item_key_safe(fs_info, path, &amp;new_key);</div><div class='add'>+			btrfs_set_item_key_safe(trans, path, &amp;new_key);</div><div class='ctx'> </div><div class='ctx'> 			extent_offset += args-&gt;end - key.offset;</div><div class='ctx'> 			btrfs_set_file_extent_offset(leaf, fi, extent_offset);</div><div class='ctx'> 			btrfs_set_file_extent_num_bytes(leaf, fi,</div><div class='ctx'> 							extent_end - args-&gt;end);</div><div class='del'>-			btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> 			if (update_refs &amp;&amp; disk_bytenr &gt; 0)</div><div class='ctx'> 				args-&gt;bytes_found += args-&gt;end - key.offset;</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -919,7 +368,11 @@ next_slot:</div><div class='ctx'> 		 *  | -------- extent -------- |</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (args-&gt;start &gt; key.offset &amp;&amp; args-&gt;end &gt;= extent_end) {</div><div class='del'>-			BUG_ON(del_nr &gt; 0);</div><div class='add'>+			if (WARN_ON(del_nr &gt; 0)) {</div><div class='add'>+				btrfs_print_leaf(leaf);</div><div class='add'>+				ret = -EINVAL;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='ctx'> 			if (extent_type == BTRFS_FILE_EXTENT_INLINE) {</div><div class='ctx'> 				ret = -EOPNOTSUPP;</div><div class='ctx'> 				break;</div><div class='hunk'>@@ -927,7 +380,6 @@ next_slot:</div><div class='ctx'> </div><div class='ctx'> 			btrfs_set_file_extent_num_bytes(leaf, fi,</div><div class='ctx'> 							args-&gt;start - key.offset);</div><div class='del'>-			btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> 			if (update_refs &amp;&amp; disk_bytenr &gt; 0)</div><div class='ctx'> 				args-&gt;bytes_found += extent_end - args-&gt;start;</div><div class='ctx'> 			if (args-&gt;end == extent_end)</div><div class='hunk'>@@ -947,7 +399,11 @@ delete_extent_item:</div><div class='ctx'> 				del_slot = path-&gt;slots[0];</div><div class='ctx'> 				del_nr = 1;</div><div class='ctx'> 			} else {</div><div class='del'>-				BUG_ON(del_slot + del_nr != path-&gt;slots[0]);</div><div class='add'>+				if (WARN_ON(del_slot + del_nr != path-&gt;slots[0])) {</div><div class='add'>+					btrfs_print_leaf(leaf);</div><div class='add'>+					ret = -EINVAL;</div><div class='add'>+					break;</div><div class='add'>+				}</div><div class='ctx'> 				del_nr++;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='hunk'>@@ -957,16 +413,22 @@ delete_extent_item:</div><div class='ctx'> 				extent_end = ALIGN(extent_end,</div><div class='ctx'> 						   fs_info-&gt;sectorsize);</div><div class='ctx'> 			} else if (update_refs &amp;&amp; disk_bytenr &gt; 0) {</div><div class='del'>-				btrfs_init_generic_ref(&amp;ref,</div><div class='del'>-						BTRFS_DROP_DELAYED_REF,</div><div class='del'>-						disk_bytenr, num_bytes, 0);</div><div class='del'>-				btrfs_init_data_ref(&amp;ref,</div><div class='del'>-						root-&gt;root_key.objectid,</div><div class='del'>-						key.objectid,</div><div class='del'>-						key.offset - extent_offset, 0,</div><div class='del'>-						false);</div><div class='add'>+				struct btrfs_ref ref = {</div><div class='add'>+					.action = BTRFS_DROP_DELAYED_REF,</div><div class='add'>+					.bytenr = disk_bytenr,</div><div class='add'>+					.num_bytes = num_bytes,</div><div class='add'>+					.parent = 0,</div><div class='add'>+					.owning_root = btrfs_root_id(root),</div><div class='add'>+					.ref_root = btrfs_root_id(root),</div><div class='add'>+				};</div><div class='add'>+				btrfs_init_data_ref(&amp;ref, key.objectid,</div><div class='add'>+						    key.offset - extent_offset,</div><div class='add'>+						    0, false);</div><div class='ctx'> 				ret = btrfs_free_extent(trans, &amp;ref);</div><div class='del'>-				BUG_ON(ret); /* -ENOMEM */</div><div class='add'>+				if (unlikely(ret)) {</div><div class='add'>+					btrfs_abort_transaction(trans, ret);</div><div class='add'>+					break;</div><div class='add'>+				}</div><div class='ctx'> 				args-&gt;bytes_found += extent_end - key.offset;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='hunk'>@@ -980,7 +442,7 @@ delete_extent_item:</div><div class='ctx'> </div><div class='ctx'> 			ret = btrfs_del_items(trans, root, path, del_slot,</div><div class='ctx'> 					      del_nr);</div><div class='del'>-			if (ret) {</div><div class='add'>+			if (unlikely(ret)) {</div><div class='ctx'> 				btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -1014,7 +476,7 @@ delete_extent_item:</div><div class='ctx'> 	 * which case it unlocked our path, so check path-&gt;locks[0] matches a</div><div class='ctx'> 	 * write lock.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!ret &amp;&amp; args-&gt;replace_extent &amp;&amp; leafs_visited == 1 &amp;&amp;</div><div class='add'>+	if (!ret &amp;&amp; args-&gt;replace_extent &amp;&amp;</div><div class='ctx'> 	    path-&gt;locks[0] == BTRFS_WRITE_LOCK &amp;&amp;</div><div class='ctx'> 	    btrfs_leaf_free_space(leaf) &gt;=</div><div class='ctx'> 	    sizeof(struct btrfs_item) + args-&gt;extent_item_size) {</div><div class='hunk'>@@ -1029,7 +491,8 @@ delete_extent_item:</div><div class='ctx'> 			if (btrfs_comp_cpu_keys(&amp;key, &amp;slot_key) &gt; 0)</div><div class='ctx'> 				path-&gt;slots[0]++;</div><div class='ctx'> 		}</div><div class='del'>-		btrfs_setup_item_for_insert(root, path, &amp;key, args-&gt;extent_item_size);</div><div class='add'>+		btrfs_setup_item_for_insert(trans, root, path, &amp;key,</div><div class='add'>+					    args-&gt;extent_item_size);</div><div class='ctx'> 		args-&gt;extent_inserted = true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1043,20 +506,19 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int extent_mergeable(struct extent_buffer *leaf, int slot,</div><div class='del'>-			    u64 objectid, u64 bytenr, u64 orig_offset,</div><div class='del'>-			    u64 *start, u64 *end)</div><div class='add'>+static bool extent_mergeable(struct extent_buffer *leaf, int slot, u64 objectid,</div><div class='add'>+			     u64 bytenr, u64 orig_offset, u64 *start, u64 *end)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_file_extent_item *fi;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	u64 extent_end;</div><div class='ctx'> </div><div class='ctx'> 	if (slot &lt; 0 || slot &gt;= btrfs_header_nritems(leaf))</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	btrfs_item_key_to_cpu(leaf, &amp;key, slot);</div><div class='ctx'> 	if (key.objectid != objectid || key.type != BTRFS_EXTENT_DATA_KEY)</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	fi = btrfs_item_ptr(leaf, slot, struct btrfs_file_extent_item);</div><div class='ctx'> 	if (btrfs_file_extent_type(leaf, fi) != BTRFS_FILE_EXTENT_REG ||</div><div class='hunk'>@@ -1065,15 +527,15 @@ static int extent_mergeable(struct extent_buffer *leaf, int slot,</div><div class='ctx'> 	    btrfs_file_extent_compression(leaf, fi) ||</div><div class='ctx'> 	    btrfs_file_extent_encryption(leaf, fi) ||</div><div class='ctx'> 	    btrfs_file_extent_other_encoding(leaf, fi))</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	extent_end = key.offset + btrfs_file_extent_num_bytes(leaf, fi);</div><div class='ctx'> 	if ((*start &amp;&amp; *start != key.offset) || (*end &amp;&amp; *end != extent_end))</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	*start = key.offset;</div><div class='ctx'> 	*end = extent_end;</div><div class='del'>-	return 1;</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1086,10 +548,9 @@ static int extent_mergeable(struct extent_buffer *leaf, int slot,</div><div class='ctx'> int btrfs_mark_extent_written(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			      struct btrfs_inode *inode, u64 start, u64 end)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_file_extent_item *fi;</div><div class='ctx'> 	struct btrfs_ref ref = { 0 };</div><div class='ctx'> 	struct btrfs_key key;</div><div class='hunk'>@@ -1125,21 +586,20 @@ again:</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	btrfs_item_key_to_cpu(leaf, &amp;key, path-&gt;slots[0]);</div><div class='del'>-	if (key.objectid != ino ||</div><div class='del'>-	    key.type != BTRFS_EXTENT_DATA_KEY) {</div><div class='add'>+	if (unlikely(key.objectid != ino || key.type != BTRFS_EXTENT_DATA_KEY)) {</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	fi = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='ctx'> 			    struct btrfs_file_extent_item);</div><div class='del'>-	if (btrfs_file_extent_type(leaf, fi) != BTRFS_FILE_EXTENT_PREALLOC) {</div><div class='add'>+	if (unlikely(btrfs_file_extent_type(leaf, fi) != BTRFS_FILE_EXTENT_PREALLOC)) {</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	extent_end = key.offset + btrfs_file_extent_num_bytes(leaf, fi);</div><div class='del'>-	if (key.offset &gt; start || extent_end &lt; end) {</div><div class='add'>+	if (unlikely(key.offset &gt; start || extent_end &lt; end)) {</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -1157,7 +617,7 @@ again:</div><div class='ctx'> 				     ino, bytenr, orig_offset,</div><div class='ctx'> 				     &amp;other_start, &amp;other_end)) {</div><div class='ctx'> 			new_key.offset = end;</div><div class='del'>-			btrfs_set_item_key_safe(fs_info, path, &amp;new_key);</div><div class='add'>+			btrfs_set_item_key_safe(trans, path, &amp;new_key);</div><div class='ctx'> 			fi = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='ctx'> 					    struct btrfs_file_extent_item);</div><div class='ctx'> 			btrfs_set_file_extent_generation(leaf, fi,</div><div class='hunk'>@@ -1172,7 +632,6 @@ again:</div><div class='ctx'> 							 trans-&gt;transid);</div><div class='ctx'> 			btrfs_set_file_extent_num_bytes(leaf, fi,</div><div class='ctx'> 							end - other_start);</div><div class='del'>-			btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1191,7 +650,7 @@ again:</div><div class='ctx'> 							 trans-&gt;transid);</div><div class='ctx'> 			path-&gt;slots[0]++;</div><div class='ctx'> 			new_key.offset = start;</div><div class='del'>-			btrfs_set_item_key_safe(fs_info, path, &amp;new_key);</div><div class='add'>+			btrfs_set_item_key_safe(trans, path, &amp;new_key);</div><div class='ctx'> </div><div class='ctx'> 			fi = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='ctx'> 					    struct btrfs_file_extent_item);</div><div class='hunk'>@@ -1201,7 +660,6 @@ again:</div><div class='ctx'> 							other_end - start);</div><div class='ctx'> 			btrfs_set_file_extent_offset(leaf, fi,</div><div class='ctx'> 						     start - orig_offset);</div><div class='del'>-			btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1216,7 +674,7 @@ again:</div><div class='ctx'> 			btrfs_release_path(path);</div><div class='ctx'> 			goto again;</div><div class='ctx'> 		}</div><div class='del'>-		if (ret &lt; 0) {</div><div class='add'>+		if (unlikely(ret &lt; 0)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1235,14 +693,16 @@ again:</div><div class='ctx'> 		btrfs_set_file_extent_offset(leaf, fi, split - orig_offset);</div><div class='ctx'> 		btrfs_set_file_extent_num_bytes(leaf, fi,</div><div class='ctx'> 						extent_end - split);</div><div class='del'>-		btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> </div><div class='del'>-		btrfs_init_generic_ref(&amp;ref, BTRFS_ADD_DELAYED_REF, bytenr,</div><div class='del'>-				       num_bytes, 0);</div><div class='del'>-		btrfs_init_data_ref(&amp;ref, root-&gt;root_key.objectid, ino,</div><div class='del'>-				    orig_offset, 0, false);</div><div class='add'>+		ref.action = BTRFS_ADD_DELAYED_REF;</div><div class='add'>+		ref.bytenr = bytenr;</div><div class='add'>+		ref.num_bytes = num_bytes;</div><div class='add'>+		ref.parent = 0;</div><div class='add'>+		ref.owning_root = btrfs_root_id(root);</div><div class='add'>+		ref.ref_root = btrfs_root_id(root);</div><div class='add'>+		btrfs_init_data_ref(&amp;ref, ino, orig_offset, 0, false);</div><div class='ctx'> 		ret = btrfs_inc_extent_ref(trans, &amp;ref);</div><div class='del'>-		if (ret) {</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1250,7 +710,7 @@ again:</div><div class='ctx'> 		if (split == start) {</div><div class='ctx'> 			key.offset = start;</div><div class='ctx'> 		} else {</div><div class='del'>-			if (start != key.offset) {</div><div class='add'>+			if (unlikely(start != key.offset)) {</div><div class='ctx'> 				ret = -EINVAL;</div><div class='ctx'> 				btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 				goto out;</div><div class='hunk'>@@ -1263,10 +723,14 @@ again:</div><div class='ctx'> </div><div class='ctx'> 	other_start = end;</div><div class='ctx'> 	other_end = 0;</div><div class='del'>-	btrfs_init_generic_ref(&amp;ref, BTRFS_DROP_DELAYED_REF, bytenr,</div><div class='del'>-			       num_bytes, 0);</div><div class='del'>-	btrfs_init_data_ref(&amp;ref, root-&gt;root_key.objectid, ino, orig_offset,</div><div class='del'>-			    0, false);</div><div class='add'>+</div><div class='add'>+	ref.action = BTRFS_DROP_DELAYED_REF;</div><div class='add'>+	ref.bytenr = bytenr;</div><div class='add'>+	ref.num_bytes = num_bytes;</div><div class='add'>+	ref.parent = 0;</div><div class='add'>+	ref.owning_root = btrfs_root_id(root);</div><div class='add'>+	ref.ref_root = btrfs_root_id(root);</div><div class='add'>+	btrfs_init_data_ref(&amp;ref, ino, orig_offset, 0, false);</div><div class='ctx'> 	if (extent_mergeable(leaf, path-&gt;slots[0] + 1,</div><div class='ctx'> 			     ino, bytenr, orig_offset,</div><div class='ctx'> 			     &amp;other_start, &amp;other_end)) {</div><div class='hunk'>@@ -1278,7 +742,7 @@ again:</div><div class='ctx'> 		del_slot = path-&gt;slots[0] + 1;</div><div class='ctx'> 		del_nr++;</div><div class='ctx'> 		ret = btrfs_free_extent(trans, &amp;ref);</div><div class='del'>-		if (ret) {</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1296,7 +760,7 @@ again:</div><div class='ctx'> 		del_slot = path-&gt;slots[0];</div><div class='ctx'> 		del_nr++;</div><div class='ctx'> 		ret = btrfs_free_extent(trans, &amp;ref);</div><div class='del'>-		if (ret) {</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1307,7 +771,6 @@ again:</div><div class='ctx'> 		btrfs_set_file_extent_type(leaf, fi,</div><div class='ctx'> 					   BTRFS_FILE_EXTENT_REG);</div><div class='ctx'> 		btrfs_set_file_extent_generation(leaf, fi, trans-&gt;transid);</div><div class='del'>-		btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		fi = btrfs_item_ptr(leaf, del_slot - 1,</div><div class='ctx'> 			   struct btrfs_file_extent_item);</div><div class='hunk'>@@ -1316,137 +779,131 @@ again:</div><div class='ctx'> 		btrfs_set_file_extent_generation(leaf, fi, trans-&gt;transid);</div><div class='ctx'> 		btrfs_set_file_extent_num_bytes(leaf, fi,</div><div class='ctx'> 						extent_end - key.offset);</div><div class='del'>-		btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> </div><div class='ctx'> 		ret = btrfs_del_items(trans, root, path, del_slot, del_nr);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='add'>+		if (unlikely(ret &lt; 0)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * on error we return an unlocked page and the error value</div><div class='del'>- * on success we return a locked page and 0</div><div class='add'>+ * On error return an unlocked folio and the error value</div><div class='add'>+ * On success return a locked folio and 0</div><div class='ctx'>  */</div><div class='del'>-static int prepare_uptodate_page(struct inode *inode,</div><div class='del'>-				 struct page *page, u64 pos,</div><div class='del'>-				 bool force_uptodate)</div><div class='add'>+static int prepare_uptodate_folio(struct inode *inode, struct folio *folio, u64 pos,</div><div class='add'>+				  u64 len)</div><div class='ctx'> {</div><div class='add'>+	u64 clamp_start = max_t(u64, pos, folio_pos(folio));</div><div class='add'>+	u64 clamp_end = min_t(u64, pos + len, folio_next_pos(folio));</div><div class='add'>+	const u32 blocksize = inode_to_fs_info(inode)-&gt;sectorsize;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	if (((pos &amp; (PAGE_SIZE - 1)) || force_uptodate) &amp;&amp;</div><div class='del'>-	    !PageUptodate(page)) {</div><div class='del'>-		ret = btrfs_readpage(NULL, page);</div><div class='del'>-		if (ret)</div><div class='del'>-			return ret;</div><div class='del'>-		lock_page(page);</div><div class='del'>-		if (!PageUptodate(page)) {</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			return -EIO;</div><div class='del'>-		}</div><div class='add'>+	if (folio_test_uptodate(folio))</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * Since btrfs_readpage() will unlock the page before it</div><div class='del'>-		 * returns, there is a window where btrfs_releasepage() can be</div><div class='del'>-		 * called to release the page.  Here we check both inode</div><div class='del'>-		 * mapping and PagePrivate() to make sure the page was not</div><div class='del'>-		 * released.</div><div class='del'>-		 *</div><div class='del'>-		 * The private flag check is essential for subpage as we need</div><div class='del'>-		 * to store extra bitmap using page-&gt;private.</div><div class='del'>-		 */</div><div class='del'>-		if (page-&gt;mapping != inode-&gt;i_mapping || !PagePrivate(page)) {</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			return -EAGAIN;</div><div class='del'>-		}</div><div class='add'>+	if (IS_ALIGNED(clamp_start, blocksize) &amp;&amp;</div><div class='add'>+	    IS_ALIGNED(clamp_end, blocksize))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_read_folio(NULL, folio);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+	folio_lock(folio);</div><div class='add'>+	if (unlikely(!folio_test_uptodate(folio))) {</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Since btrfs_read_folio() will unlock the folio before it returns,</div><div class='add'>+	 * there is a window where btrfs_release_folio() can be called to</div><div class='add'>+	 * release the page.  Here we check both inode mapping and page</div><div class='add'>+	 * private to make sure the page was not released.</div><div class='add'>+	 *</div><div class='add'>+	 * The private flag check is essential for subpage as we need to store</div><div class='add'>+	 * extra bitmap using folio private.</div><div class='add'>+	 */</div><div class='add'>+	if (folio-&gt;mapping != inode-&gt;i_mapping || !folio_test_private(folio)) {</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		return -EAGAIN;</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static gfp_t get_prepare_gfp_flags(struct inode *inode, bool nowait)</div><div class='add'>+{</div><div class='add'>+	gfp_t gfp;</div><div class='add'>+</div><div class='add'>+	gfp = btrfs_alloc_write_mask(inode-&gt;i_mapping);</div><div class='add'>+	if (nowait) {</div><div class='add'>+		gfp &amp;= ~__GFP_DIRECT_RECLAIM;</div><div class='add'>+		gfp |= GFP_NOWAIT;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return gfp;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='del'>- * this just gets pages into the page cache and locks them down.</div><div class='add'>+ * Get folio into the page cache and lock it.</div><div class='ctx'>  */</div><div class='del'>-static noinline int prepare_pages(struct inode *inode, struct page **pages,</div><div class='del'>-				  size_t num_pages, loff_t pos,</div><div class='del'>-				  size_t write_bytes, bool force_uptodate)</div><div class='add'>+static noinline int prepare_one_folio(struct inode *inode, struct folio **folio_ret,</div><div class='add'>+				      loff_t pos, size_t write_bytes,</div><div class='add'>+				      bool nowait)</div><div class='ctx'> {</div><div class='del'>-	int i;</div><div class='del'>-	unsigned long index = pos &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	gfp_t mask = btrfs_alloc_write_mask(inode-&gt;i_mapping);</div><div class='del'>-	int err = 0;</div><div class='del'>-	int faili;</div><div class='add'>+	const pgoff_t index = pos &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	gfp_t mask = get_prepare_gfp_flags(inode, nowait);</div><div class='add'>+	fgf_t fgp_flags = (nowait ? FGP_WRITEBEGIN | FGP_NOWAIT : FGP_WRITEBEGIN) |</div><div class='add'>+			  fgf_set_order(write_bytes);</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; num_pages; i++) {</div><div class='ctx'> again:</div><div class='del'>-		pages[i] = find_or_create_page(inode-&gt;i_mapping, index + i,</div><div class='del'>-					       mask | __GFP_WRITE);</div><div class='del'>-		if (!pages[i]) {</div><div class='del'>-			faili = i - 1;</div><div class='del'>-			err = -ENOMEM;</div><div class='del'>-			goto fail;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		err = set_page_extent_mapped(pages[i]);</div><div class='del'>-		if (err &lt; 0) {</div><div class='del'>-			faili = i;</div><div class='del'>-			goto fail;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (i == 0)</div><div class='del'>-			err = prepare_uptodate_page(inode, pages[i], pos,</div><div class='del'>-						    force_uptodate);</div><div class='del'>-		if (!err &amp;&amp; i == num_pages - 1)</div><div class='del'>-			err = prepare_uptodate_page(inode, pages[i],</div><div class='del'>-						    pos + write_bytes, false);</div><div class='del'>-		if (err) {</div><div class='del'>-			put_page(pages[i]);</div><div class='del'>-			if (err == -EAGAIN) {</div><div class='del'>-				err = 0;</div><div class='del'>-				goto again;</div><div class='del'>-			}</div><div class='del'>-			faili = i - 1;</div><div class='del'>-			goto fail;</div><div class='add'>+	folio = __filemap_get_folio(inode-&gt;i_mapping, index, fgp_flags, mask);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio);</div><div class='add'>+</div><div class='add'>+	ret = set_folio_extent_mapped(folio);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+	ret = prepare_uptodate_folio(inode, folio, pos, write_bytes);</div><div class='add'>+	if (ret) {</div><div class='add'>+		/* The folio is already unlocked. */</div><div class='add'>+		folio_put(folio);</div><div class='add'>+		if (!nowait &amp;&amp; ret == -EAGAIN) {</div><div class='add'>+			ret = 0;</div><div class='add'>+			goto again;</div><div class='ctx'> 		}</div><div class='del'>-		wait_on_page_writeback(pages[i]);</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='add'>+	*folio_ret = folio;</div><div class='ctx'> 	return 0;</div><div class='del'>-fail:</div><div class='del'>-	while (faili &gt;= 0) {</div><div class='del'>-		unlock_page(pages[faili]);</div><div class='del'>-		put_page(pages[faili]);</div><div class='del'>-		faili--;</div><div class='del'>-	}</div><div class='del'>-	return err;</div><div class='del'>-</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * This function locks the extent and properly waits for data=ordered extents</div><div class='del'>- * to finish before allowing the pages to be modified if need.</div><div class='add'>+ * Locks the extent and properly waits for data=ordered extents to finish</div><div class='add'>+ * before allowing the folios to be modified if need.</div><div class='ctx'>  *</div><div class='del'>- * The return value:</div><div class='add'>+ * Return:</div><div class='ctx'>  * 1 - the extent is locked</div><div class='ctx'>  * 0 - the extent is not locked, and everything is OK</div><div class='del'>- * -EAGAIN - need re-prepare the pages</div><div class='del'>- * the other &lt; 0 number - Something wrong happens</div><div class='add'>+ * -EAGAIN - need to prepare the folios again</div><div class='ctx'>  */</div><div class='ctx'> static noinline int</div><div class='del'>-lock_and_cleanup_extent_if_need(struct btrfs_inode *inode, struct page **pages,</div><div class='del'>-				size_t num_pages, loff_t pos,</div><div class='del'>-				size_t write_bytes,</div><div class='del'>-				u64 *lockstart, u64 *lockend,</div><div class='add'>+lock_and_cleanup_extent_if_need(struct btrfs_inode *inode, struct folio *folio,</div><div class='add'>+				loff_t pos, size_t write_bytes,</div><div class='add'>+				u64 *lockstart, u64 *lockend, bool nowait,</div><div class='ctx'> 				struct extent_state **cached_state)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='ctx'> 	u64 start_pos;</div><div class='ctx'> 	u64 last_pos;</div><div class='del'>-	int i;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	start_pos = round_down(pos, fs_info-&gt;sectorsize);</div><div class='hunk'>@@ -1455,20 +912,28 @@ lock_and_cleanup_extent_if_need(struct btrfs_inode *inode, struct page **pages,</div><div class='ctx'> 	if (start_pos &lt; inode-&gt;vfs_inode.i_size) {</div><div class='ctx'> 		struct btrfs_ordered_extent *ordered;</div><div class='ctx'> </div><div class='del'>-		lock_extent_bits(&amp;inode-&gt;io_tree, start_pos, last_pos,</div><div class='del'>-				cached_state);</div><div class='add'>+		if (nowait) {</div><div class='add'>+			if (!btrfs_try_lock_extent(&amp;inode-&gt;io_tree, start_pos,</div><div class='add'>+						   last_pos, cached_state)) {</div><div class='add'>+				folio_unlock(folio);</div><div class='add'>+				folio_put(folio);</div><div class='add'>+				return -EAGAIN;</div><div class='add'>+			}</div><div class='add'>+		} else {</div><div class='add'>+			btrfs_lock_extent(&amp;inode-&gt;io_tree, start_pos, last_pos,</div><div class='add'>+					  cached_state);</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		ordered = btrfs_lookup_ordered_range(inode, start_pos,</div><div class='ctx'> 						     last_pos - start_pos + 1);</div><div class='ctx'> 		if (ordered &amp;&amp;</div><div class='ctx'> 		    ordered-&gt;file_offset + ordered-&gt;num_bytes &gt; start_pos &amp;&amp;</div><div class='ctx'> 		    ordered-&gt;file_offset &lt;= last_pos) {</div><div class='del'>-			unlock_extent_cached(&amp;inode-&gt;io_tree, start_pos,</div><div class='del'>-					last_pos, cached_state);</div><div class='del'>-			for (i = 0; i &lt; num_pages; i++) {</div><div class='del'>-				unlock_page(pages[i]);</div><div class='del'>-				put_page(pages[i]);</div><div class='del'>-			}</div><div class='del'>-			btrfs_start_ordered_extent(ordered, 1);</div><div class='add'>+			btrfs_unlock_extent(&amp;inode-&gt;io_tree, start_pos, last_pos,</div><div class='add'>+					    cached_state);</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+			folio_put(folio);</div><div class='add'>+			btrfs_start_ordered_extent(ordered);</div><div class='ctx'> 			btrfs_put_ordered_extent(ordered);</div><div class='ctx'> 			return -EAGAIN;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1481,98 +946,96 @@ lock_and_cleanup_extent_if_need(struct btrfs_inode *inode, struct page **pages,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * We should be called after prepare_pages() which should have locked</div><div class='add'>+	 * We should be called after prepare_one_folio() which should have locked</div><div class='ctx'> 	 * all pages in the range.</div><div class='ctx'> 	 */</div><div class='del'>-	for (i = 0; i &lt; num_pages; i++)</div><div class='del'>-		WARN_ON(!PageLocked(pages[i]));</div><div class='add'>+	WARN_ON(!folio_test_locked(folio));</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int check_can_nocow(struct btrfs_inode *inode, loff_t pos,</div><div class='add'>+/*</div><div class='add'>+ * Check if we can do nocow write into the range [@pos, @pos + @write_bytes)</div><div class='add'>+ *</div><div class='add'>+ * @pos:         File offset.</div><div class='add'>+ * @write_bytes: The length to write, will be updated to the nocow writeable</div><div class='add'>+ *               range.</div><div class='add'>+ * @nowait:      Indicate if we can block or not (non-blocking IO context).</div><div class='add'>+ *</div><div class='add'>+ * This function will flush ordered extents in the range to ensure proper</div><div class='add'>+ * nocow checks.</div><div class='add'>+ *</div><div class='add'>+ * Return:</div><div class='add'>+ * &gt; 0          If we can nocow, and updates @write_bytes.</div><div class='add'>+ *  0           If we can't do a nocow write.</div><div class='add'>+ * -EAGAIN      If we can't do a nocow write because snapshotting of the inode's</div><div class='add'>+ *              root is in progress or because we are in a non-blocking IO</div><div class='add'>+ *              context and need to block (@nowait is true).</div><div class='add'>+ * &lt; 0          If an error happened.</div><div class='add'>+ *</div><div class='add'>+ * NOTE: Callers need to call btrfs_check_nocow_unlock() if we return &gt; 0.</div><div class='add'>+ */</div><div class='add'>+int btrfs_check_nocow_lock(struct btrfs_inode *inode, loff_t pos,</div><div class='ctx'> 			   size_t *write_bytes, bool nowait)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	struct extent_state *cached_state = NULL;</div><div class='ctx'> 	u64 lockstart, lockend;</div><div class='del'>-	u64 num_bytes;</div><div class='del'>-	int ret;</div><div class='add'>+	u64 cur_offset;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (!(inode-&gt;flags &amp; (BTRFS_INODE_NODATACOW | BTRFS_INODE_PREALLOC)))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	if (!nowait &amp;&amp; !btrfs_drew_try_write_lock(&amp;root-&gt;snapshot_lock))</div><div class='add'>+	if (!btrfs_drew_try_write_lock(&amp;root-&gt;snapshot_lock))</div><div class='ctx'> 		return -EAGAIN;</div><div class='ctx'> </div><div class='ctx'> 	lockstart = round_down(pos, fs_info-&gt;sectorsize);</div><div class='ctx'> 	lockend = round_up(pos + *write_bytes,</div><div class='ctx'> 			   fs_info-&gt;sectorsize) - 1;</div><div class='del'>-	num_bytes = lockend - lockstart + 1;</div><div class='ctx'> </div><div class='ctx'> 	if (nowait) {</div><div class='del'>-		struct btrfs_ordered_extent *ordered;</div><div class='del'>-</div><div class='del'>-		if (!try_lock_extent(&amp;inode-&gt;io_tree, lockstart, lockend))</div><div class='add'>+		if (!btrfs_try_lock_ordered_range(inode, lockstart, lockend,</div><div class='add'>+						  &amp;cached_state)) {</div><div class='add'>+			btrfs_drew_write_unlock(&amp;root-&gt;snapshot_lock);</div><div class='ctx'> 			return -EAGAIN;</div><div class='del'>-</div><div class='del'>-		ordered = btrfs_lookup_ordered_range(inode, lockstart,</div><div class='del'>-						     num_bytes);</div><div class='del'>-		if (ordered) {</div><div class='del'>-			btrfs_put_ordered_extent(ordered);</div><div class='del'>-			ret = -EAGAIN;</div><div class='del'>-			goto out_unlock;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='del'>-		btrfs_lock_and_flush_ordered_range(inode, lockstart,</div><div class='del'>-						   lockend, NULL);</div><div class='add'>+		btrfs_lock_and_flush_ordered_range(inode, lockstart, lockend,</div><div class='add'>+						   &amp;cached_state);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = can_nocow_extent(&amp;inode-&gt;vfs_inode, lockstart, &amp;num_bytes,</div><div class='del'>-			NULL, NULL, NULL, false);</div><div class='del'>-	if (ret &lt;= 0) {</div><div class='del'>-		ret = 0;</div><div class='del'>-		if (!nowait)</div><div class='del'>-			btrfs_drew_write_unlock(&amp;root-&gt;snapshot_lock);</div><div class='del'>-	} else {</div><div class='del'>-		*write_bytes = min_t(size_t, *write_bytes ,</div><div class='del'>-				     num_bytes - pos + lockstart);</div><div class='add'>+	cur_offset = lockstart;</div><div class='add'>+	while (cur_offset &lt; lockend) {</div><div class='add'>+		u64 num_bytes = lockend - cur_offset + 1;</div><div class='add'>+</div><div class='add'>+		ret = can_nocow_extent(inode, cur_offset, &amp;num_bytes, NULL, nowait);</div><div class='add'>+		if (ret &lt;= 0) {</div><div class='add'>+			/*</div><div class='add'>+			 * If cur_offset == lockstart it means we haven't found</div><div class='add'>+			 * any extent against which we can NOCOW, so unlock the</div><div class='add'>+			 * snapshot lock.</div><div class='add'>+			 */</div><div class='add'>+			if (cur_offset == lockstart)</div><div class='add'>+				btrfs_drew_write_unlock(&amp;root-&gt;snapshot_lock);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		cur_offset += num_bytes;</div><div class='ctx'> 	}</div><div class='del'>-out_unlock:</div><div class='del'>-	unlock_extent(&amp;inode-&gt;io_tree, lockstart, lockend);</div><div class='ctx'> </div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='add'>+	btrfs_unlock_extent(&amp;inode-&gt;io_tree, lockstart, lockend, &amp;cached_state);</div><div class='ctx'> </div><div class='del'>-static int check_nocow_nolock(struct btrfs_inode *inode, loff_t pos,</div><div class='del'>-			      size_t *write_bytes)</div><div class='del'>-{</div><div class='del'>-	return check_can_nocow(inode, pos, write_bytes, true);</div><div class='del'>-}</div><div class='add'>+	/*</div><div class='add'>+	 * cur_offset &gt; lockstart means there's at least a partial range we can</div><div class='add'>+	 * NOCOW, and that range can cover one or more extents.</div><div class='add'>+	 */</div><div class='add'>+	if (cur_offset &gt; lockstart) {</div><div class='add'>+		*write_bytes = min_t(size_t, *write_bytes, cur_offset - pos);</div><div class='add'>+		return 1;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Check if we can do nocow write into the range [@pos, @pos + @write_bytes)</div><div class='del'>- *</div><div class='del'>- * @pos:	 File offset</div><div class='del'>- * @write_bytes: The length to write, will be updated to the nocow writeable</div><div class='del'>- *		 range</div><div class='del'>- *</div><div class='del'>- * This function will flush ordered extents in the range to ensure proper</div><div class='del'>- * nocow checks.</div><div class='del'>- *</div><div class='del'>- * Return:</div><div class='del'>- * &gt;0		and update @write_bytes if we can do nocow write</div><div class='del'>- *  0		if we can't do nocow write</div><div class='del'>- * -EAGAIN	if we can't get the needed lock or there are ordered extents</div><div class='del'>- * 		for * (nowait == true) case</div><div class='del'>- * &lt;0		if other error happened</div><div class='del'>- *</div><div class='del'>- * NOTE: Callers need to release the lock by btrfs_check_nocow_unlock().</div><div class='del'>- */</div><div class='del'>-int btrfs_check_nocow_lock(struct btrfs_inode *inode, loff_t pos,</div><div class='del'>-			   size_t *write_bytes)</div><div class='del'>-{</div><div class='del'>-	return check_can_nocow(inode, pos, write_bytes, false);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_check_nocow_unlock(struct btrfs_inode *inode)</div><div class='hunk'>@@ -1580,51 +1043,25 @@ void btrfs_check_nocow_unlock(struct btrfs_inode *inode)</div><div class='ctx'> 	btrfs_drew_write_unlock(&amp;inode-&gt;root-&gt;snapshot_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void update_time_for_write(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	struct timespec64 now;</div><div class='del'>-</div><div class='del'>-	if (IS_NOCMTIME(inode))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	now = current_time(inode);</div><div class='del'>-	if (!timespec64_equal(&amp;inode-&gt;i_mtime, &amp;now))</div><div class='del'>-		inode-&gt;i_mtime = now;</div><div class='del'>-</div><div class='del'>-	if (!timespec64_equal(&amp;inode-&gt;i_ctime, &amp;now))</div><div class='del'>-		inode-&gt;i_ctime = now;</div><div class='del'>-</div><div class='del'>-	if (IS_I_VERSION(inode))</div><div class='del'>-		inode_inc_iversion(inode);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int btrfs_write_check(struct kiocb *iocb, struct iov_iter *from,</div><div class='del'>-			     size_t count)</div><div class='add'>+int btrfs_write_check(struct kiocb *iocb, size_t count)</div><div class='ctx'> {</div><div class='ctx'> 	struct file *file = iocb-&gt;ki_filp;</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='ctx'> 	loff_t pos = iocb-&gt;ki_pos;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	loff_t oldsize;</div><div class='del'>-	loff_t start_pos;</div><div class='del'>-</div><div class='del'>-	if (iocb-&gt;ki_flags &amp; IOCB_NOWAIT) {</div><div class='del'>-		size_t nocow_bytes = count;</div><div class='ctx'> </div><div class='del'>-		/* We will allocate space in case nodatacow is not set, so bail */</div><div class='del'>-		if (check_nocow_nolock(BTRFS_I(inode), pos, &amp;nocow_bytes) &lt;= 0)</div><div class='del'>-			return -EAGAIN;</div><div class='del'>-		/*</div><div class='del'>-		 * There are holes in the range or parts of the range that must</div><div class='del'>-		 * be COWed (shared extents, RO block groups, etc), so just bail</div><div class='del'>-		 * out.</div><div class='del'>-		 */</div><div class='del'>-		if (nocow_bytes &lt; count)</div><div class='del'>-			return -EAGAIN;</div><div class='del'>-	}</div><div class='add'>+	/*</div><div class='add'>+	 * Quickly bail out on NOWAIT writes if we don't have the nodatacow or</div><div class='add'>+	 * prealloc flags, as without those flags we always have to COW. We will</div><div class='add'>+	 * later check if we can really COW into the target range (using</div><div class='add'>+	 * can_nocow_extent() at btrfs_get_blocks_direct_write()).</div><div class='add'>+	 */</div><div class='add'>+	if ((iocb-&gt;ki_flags &amp; IOCB_NOWAIT) &amp;&amp;</div><div class='add'>+	    !(BTRFS_I(inode)-&gt;flags &amp; (BTRFS_INODE_NODATACOW | BTRFS_INODE_PREALLOC)))</div><div class='add'>+		return -EAGAIN;</div><div class='ctx'> </div><div class='del'>-	current-&gt;backing_dev_info = inode_to_bdi(inode);</div><div class='ctx'> 	ret = file_remove_privs(file);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -1635,445 +1072,376 @@ static int btrfs_write_check(struct kiocb *iocb, struct iov_iter *from,</div><div class='ctx'> 	 * need to start yet another transaction to update the inode as we will</div><div class='ctx'> 	 * update the inode when we finish writing whatever data we write.</div><div class='ctx'> 	 */</div><div class='del'>-	update_time_for_write(inode);</div><div class='add'>+	if (!IS_NOCMTIME(inode)) {</div><div class='add'>+		inode_set_mtime_to_ts(inode, inode_set_ctime_current(inode));</div><div class='add'>+		inode_inc_iversion(inode);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	start_pos = round_down(pos, fs_info-&gt;sectorsize);</div><div class='ctx'> 	oldsize = i_size_read(inode);</div><div class='del'>-	if (start_pos &gt; oldsize) {</div><div class='add'>+	if (pos &gt; oldsize) {</div><div class='ctx'> 		/* Expand hole size to cover write data, preventing empty gap */</div><div class='ctx'> 		loff_t end_pos = round_up(pos + count, fs_info-&gt;sectorsize);</div><div class='ctx'> </div><div class='ctx'> 		ret = btrfs_cont_expand(BTRFS_I(inode), oldsize, end_pos);</div><div class='del'>-		if (ret) {</div><div class='del'>-			current-&gt;backing_dev_info = NULL;</div><div class='add'>+		if (ret)</div><div class='ctx'> 			return ret;</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline ssize_t btrfs_buffered_write(struct kiocb *iocb,</div><div class='del'>-					       struct iov_iter *i)</div><div class='add'>+static void release_space(struct btrfs_inode *inode, struct extent_changeset *data_reserved,</div><div class='add'>+			  u64 start, u64 len, bool only_release_metadata)</div><div class='ctx'> {</div><div class='del'>-	struct file *file = iocb-&gt;ki_filp;</div><div class='del'>-	loff_t pos;</div><div class='del'>-	struct inode *inode = file_inode(file);</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	struct page **pages = NULL;</div><div class='del'>-	struct extent_changeset *data_reserved = NULL;</div><div class='del'>-	u64 release_bytes = 0;</div><div class='del'>-	u64 lockstart;</div><div class='del'>-	u64 lockend;</div><div class='del'>-	size_t num_written = 0;</div><div class='del'>-	int nrptrs;</div><div class='del'>-	ssize_t ret;</div><div class='del'>-	bool only_release_metadata = false;</div><div class='del'>-	bool force_page_uptodate = false;</div><div class='del'>-	loff_t old_isize = i_size_read(inode);</div><div class='del'>-	unsigned int ilock_flags = 0;</div><div class='del'>-</div><div class='del'>-	if (iocb-&gt;ki_flags &amp; IOCB_NOWAIT)</div><div class='del'>-		ilock_flags |= BTRFS_ILOCK_TRY;</div><div class='add'>+	if (len == 0)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_inode_lock(inode, ilock_flags);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		return ret;</div><div class='add'>+	if (only_release_metadata) {</div><div class='add'>+		btrfs_check_nocow_unlock(inode);</div><div class='add'>+		btrfs_delalloc_release_metadata(inode, len, true);</div><div class='add'>+	} else {</div><div class='add'>+		const struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='ctx'> </div><div class='del'>-	ret = generic_write_checks(iocb, i);</div><div class='del'>-	if (ret &lt;= 0)</div><div class='del'>-		goto out;</div><div class='add'>+		btrfs_delalloc_release_space(inode, data_reserved,</div><div class='add'>+					     round_down(start, fs_info-&gt;sectorsize),</div><div class='add'>+					     len, true);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_write_check(iocb, i, ret);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+/*</div><div class='add'>+ * Reserve data and metadata space for this buffered write range.</div><div class='add'>+ *</div><div class='add'>+ * Return &gt;0 for the number of bytes reserved, which is always block aligned.</div><div class='add'>+ * Return &lt;0 for error.</div><div class='add'>+ */</div><div class='add'>+static ssize_t reserve_space(struct btrfs_inode *inode,</div><div class='add'>+			     struct extent_changeset **data_reserved,</div><div class='add'>+			     u64 start, size_t *len, bool nowait,</div><div class='add'>+			     bool *only_release_metadata)</div><div class='add'>+{</div><div class='add'>+	const struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	const unsigned int block_offset = (start &amp; (fs_info-&gt;sectorsize - 1));</div><div class='add'>+	size_t reserve_bytes;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	pos = iocb-&gt;ki_pos;</div><div class='del'>-	nrptrs = min(DIV_ROUND_UP(iov_iter_count(i), PAGE_SIZE),</div><div class='del'>-			PAGE_SIZE / (sizeof(struct page *)));</div><div class='del'>-	nrptrs = min(nrptrs, current-&gt;nr_dirtied_pause - current-&gt;nr_dirtied);</div><div class='del'>-	nrptrs = max(nrptrs, 8);</div><div class='del'>-	pages = kmalloc_array(nrptrs, sizeof(struct page *), GFP_KERNEL);</div><div class='del'>-	if (!pages) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	ret = btrfs_check_data_free_space(inode, data_reserved, start, *len, nowait);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		int can_nocow;</div><div class='ctx'> </div><div class='del'>-	while (iov_iter_count(i) &gt; 0) {</div><div class='del'>-		struct extent_state *cached_state = NULL;</div><div class='del'>-		size_t offset = offset_in_page(pos);</div><div class='del'>-		size_t sector_offset;</div><div class='del'>-		size_t write_bytes = min(iov_iter_count(i),</div><div class='del'>-					 nrptrs * (size_t)PAGE_SIZE -</div><div class='del'>-					 offset);</div><div class='del'>-		size_t num_pages;</div><div class='del'>-		size_t reserve_bytes;</div><div class='del'>-		size_t dirty_pages;</div><div class='del'>-		size_t copied;</div><div class='del'>-		size_t dirty_sectors;</div><div class='del'>-		size_t num_sectors;</div><div class='del'>-		int extents_locked;</div><div class='add'>+		if (nowait &amp;&amp; (ret == -ENOSPC || ret == -EAGAIN))</div><div class='add'>+			return -EAGAIN;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * Fault pages before locking them in prepare_pages</div><div class='del'>-		 * to avoid recursive lock</div><div class='add'>+		 * If we don't have to COW at the offset, reserve metadata only.</div><div class='add'>+		 * write_bytes may get smaller than requested here.</div><div class='ctx'> 		 */</div><div class='del'>-		if (unlikely(fault_in_iov_iter_readable(i, write_bytes))) {</div><div class='del'>-			ret = -EFAULT;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='add'>+		can_nocow = btrfs_check_nocow_lock(inode, start, len, nowait);</div><div class='add'>+		if (can_nocow &lt; 0)</div><div class='add'>+			ret = can_nocow;</div><div class='add'>+		if (can_nocow &gt; 0)</div><div class='add'>+			ret = 0;</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		*only_release_metadata = true;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		only_release_metadata = false;</div><div class='del'>-		sector_offset = pos &amp; (fs_info-&gt;sectorsize - 1);</div><div class='add'>+	reserve_bytes = round_up(*len + block_offset, fs_info-&gt;sectorsize);</div><div class='add'>+	WARN_ON(reserve_bytes == 0);</div><div class='add'>+	ret = btrfs_delalloc_reserve_metadata(inode, reserve_bytes,</div><div class='add'>+					      reserve_bytes, nowait);</div><div class='add'>+	if (ret) {</div><div class='add'>+		if (!*only_release_metadata)</div><div class='add'>+			btrfs_free_reserved_data_space(inode, *data_reserved,</div><div class='add'>+						       start, *len);</div><div class='add'>+		else</div><div class='add'>+			btrfs_check_nocow_unlock(inode);</div><div class='ctx'> </div><div class='del'>-		extent_changeset_release(data_reserved);</div><div class='del'>-		ret = btrfs_check_data_free_space(BTRFS_I(inode),</div><div class='del'>-						  &amp;data_reserved, pos,</div><div class='del'>-						  write_bytes);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			/*</div><div class='del'>-			 * If we don't have to COW at the offset, reserve</div><div class='del'>-			 * metadata only. write_bytes may get smaller than</div><div class='del'>-			 * requested here.</div><div class='del'>-			 */</div><div class='del'>-			if (btrfs_check_nocow_lock(BTRFS_I(inode), pos,</div><div class='del'>-						   &amp;write_bytes) &gt; 0)</div><div class='del'>-				only_release_metadata = true;</div><div class='del'>-			else</div><div class='del'>-				break;</div><div class='del'>-		}</div><div class='add'>+		if (nowait &amp;&amp; ret == -ENOSPC)</div><div class='add'>+			ret = -EAGAIN;</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+	return reserve_bytes;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		num_pages = DIV_ROUND_UP(write_bytes + offset, PAGE_SIZE);</div><div class='del'>-		WARN_ON(num_pages &gt; nrptrs);</div><div class='del'>-		reserve_bytes = round_up(write_bytes + sector_offset,</div><div class='del'>-					 fs_info-&gt;sectorsize);</div><div class='del'>-		WARN_ON(reserve_bytes == 0);</div><div class='del'>-		ret = btrfs_delalloc_reserve_metadata(BTRFS_I(inode),</div><div class='del'>-				reserve_bytes);</div><div class='del'>-		if (ret) {</div><div class='del'>-			if (!only_release_metadata)</div><div class='del'>-				btrfs_free_reserved_data_space(BTRFS_I(inode),</div><div class='del'>-						data_reserved, pos,</div><div class='del'>-						write_bytes);</div><div class='del'>-			else</div><div class='del'>-				btrfs_check_nocow_unlock(BTRFS_I(inode));</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='add'>+/* Shrink the reserved data and metadata space from @reserved_len to @new_len. */</div><div class='add'>+static void shrink_reserved_space(struct btrfs_inode *inode,</div><div class='add'>+				  struct extent_changeset *data_reserved,</div><div class='add'>+				  u64 reserved_start, u64 reserved_len,</div><div class='add'>+				  u64 new_len, bool only_release_metadata)</div><div class='add'>+{</div><div class='add'>+	const u64 diff = reserved_len - new_len;</div><div class='ctx'> </div><div class='del'>-		release_bytes = reserve_bytes;</div><div class='del'>-again:</div><div class='del'>-		/*</div><div class='del'>-		 * This is going to setup the pages array with the number of</div><div class='del'>-		 * pages we want, so we don't really need to worry about the</div><div class='del'>-		 * contents of pages from loop to loop</div><div class='del'>-		 */</div><div class='del'>-		ret = prepare_pages(inode, pages, num_pages,</div><div class='del'>-				    pos, write_bytes,</div><div class='del'>-				    force_page_uptodate);</div><div class='del'>-		if (ret) {</div><div class='del'>-			btrfs_delalloc_release_extents(BTRFS_I(inode),</div><div class='del'>-						       reserve_bytes);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='add'>+	ASSERT(new_len &lt;= reserved_len);</div><div class='add'>+	btrfs_delalloc_shrink_extents(inode, reserved_len, new_len);</div><div class='add'>+	if (only_release_metadata)</div><div class='add'>+		btrfs_delalloc_release_metadata(inode, diff, true);</div><div class='add'>+	else</div><div class='add'>+		btrfs_delalloc_release_space(inode, data_reserved,</div><div class='add'>+					     reserved_start + new_len, diff, true);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		extents_locked = lock_and_cleanup_extent_if_need(</div><div class='del'>-				BTRFS_I(inode), pages,</div><div class='del'>-				num_pages, pos, write_bytes, &amp;lockstart,</div><div class='del'>-				&amp;lockend, &amp;cached_state);</div><div class='del'>-		if (extents_locked &lt; 0) {</div><div class='del'>-			if (extents_locked == -EAGAIN)</div><div class='del'>-				goto again;</div><div class='del'>-			btrfs_delalloc_release_extents(BTRFS_I(inode),</div><div class='del'>-						       reserve_bytes);</div><div class='del'>-			ret = extents_locked;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='add'>+/* Calculate the maximum amount of bytes we can write into one folio. */</div><div class='add'>+static size_t calc_write_bytes(const struct btrfs_inode *inode,</div><div class='add'>+			       const struct iov_iter *iter, u64 start)</div><div class='add'>+{</div><div class='add'>+	const size_t max_folio_size = mapping_max_folio_size(inode-&gt;vfs_inode.i_mapping);</div><div class='add'>+</div><div class='add'>+	return min(max_folio_size - (start &amp; (max_folio_size - 1)),</div><div class='add'>+		   iov_iter_count(iter));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Do the heavy-lifting work to copy one range into one folio of the page cache.</div><div class='add'>+ *</div><div class='add'>+ * Return &gt; 0 in case we copied all bytes or just some of them.</div><div class='add'>+ * Return 0 if no bytes were copied, in which case the caller should retry.</div><div class='add'>+ * Return &lt;0 on error.</div><div class='add'>+ */</div><div class='add'>+static int copy_one_range(struct btrfs_inode *inode, struct iov_iter *iter,</div><div class='add'>+			  struct extent_changeset **data_reserved, u64 start,</div><div class='add'>+			  bool nowait)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	struct extent_state *cached_state = NULL;</div><div class='add'>+	size_t write_bytes = calc_write_bytes(inode, iter, start);</div><div class='add'>+	size_t copied;</div><div class='add'>+	const u64 reserved_start = round_down(start, fs_info-&gt;sectorsize);</div><div class='add'>+	u64 reserved_len;</div><div class='add'>+	struct folio *folio = NULL;</div><div class='add'>+	int extents_locked;</div><div class='add'>+	u64 lockstart;</div><div class='add'>+	u64 lockend;</div><div class='add'>+	bool only_release_metadata = false;</div><div class='add'>+	const unsigned int bdp_flags = (nowait ? BDP_ASYNC : 0);</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-		copied = btrfs_copy_from_user(pos, write_bytes, pages, i);</div><div class='add'>+	/*</div><div class='add'>+	 * Fault all pages before locking them in prepare_one_folio() to avoid</div><div class='add'>+	 * recursive lock.</div><div class='add'>+	 */</div><div class='add'>+	if (unlikely(fault_in_iov_iter_readable(iter, write_bytes)))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+	extent_changeset_release(*data_reserved);</div><div class='add'>+	ret = reserve_space(inode, data_reserved, start, &amp;write_bytes, nowait,</div><div class='add'>+			    &amp;only_release_metadata);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+	reserved_len = ret;</div><div class='add'>+	/* Write range must be inside the reserved range. */</div><div class='add'>+	ASSERT(reserved_start &lt;= start);</div><div class='add'>+	ASSERT(start + write_bytes &lt;= reserved_start + reserved_len);</div><div class='ctx'> </div><div class='del'>-		num_sectors = BTRFS_BYTES_TO_BLKS(fs_info, reserve_bytes);</div><div class='del'>-		dirty_sectors = round_up(copied + sector_offset,</div><div class='del'>-					fs_info-&gt;sectorsize);</div><div class='del'>-		dirty_sectors = BTRFS_BYTES_TO_BLKS(fs_info, dirty_sectors);</div><div class='add'>+again:</div><div class='add'>+	ret = balance_dirty_pages_ratelimited_flags(inode-&gt;vfs_inode.i_mapping,</div><div class='add'>+						    bdp_flags);</div><div class='add'>+	if (ret) {</div><div class='add'>+		btrfs_delalloc_release_extents(inode, reserved_len);</div><div class='add'>+		release_space(inode, *data_reserved, reserved_start, reserved_len,</div><div class='add'>+			      only_release_metadata);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * if we have trouble faulting in the pages, fall</div><div class='del'>-		 * back to one page at a time</div><div class='del'>-		 */</div><div class='del'>-		if (copied &lt; write_bytes)</div><div class='del'>-			nrptrs = 1;</div><div class='add'>+	ret = prepare_one_folio(&amp;inode-&gt;vfs_inode, &amp;folio, start, write_bytes, false);</div><div class='add'>+	if (ret) {</div><div class='add'>+		btrfs_delalloc_release_extents(inode, reserved_len);</div><div class='add'>+		release_space(inode, *data_reserved, reserved_start, reserved_len,</div><div class='add'>+			      only_release_metadata);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		if (copied == 0) {</div><div class='del'>-			force_page_uptodate = true;</div><div class='del'>-			dirty_sectors = 0;</div><div class='del'>-			dirty_pages = 0;</div><div class='del'>-		} else {</div><div class='del'>-			force_page_uptodate = false;</div><div class='del'>-			dirty_pages = DIV_ROUND_UP(copied + offset,</div><div class='del'>-						   PAGE_SIZE);</div><div class='del'>-		}</div><div class='add'>+	/*</div><div class='add'>+	 * The reserved range goes beyond the current folio, shrink the reserved</div><div class='add'>+	 * space to the folio boundary.</div><div class='add'>+	 */</div><div class='add'>+	if (reserved_start + reserved_len &gt; folio_next_pos(folio)) {</div><div class='add'>+		const u64 last_block = folio_next_pos(folio);</div><div class='add'>+</div><div class='add'>+		shrink_reserved_space(inode, *data_reserved, reserved_start,</div><div class='add'>+				      reserved_len, last_block - reserved_start,</div><div class='add'>+				      only_release_metadata);</div><div class='add'>+		write_bytes = last_block - start;</div><div class='add'>+		reserved_len = last_block - reserved_start;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	extents_locked = lock_and_cleanup_extent_if_need(inode, folio, start,</div><div class='add'>+							 write_bytes, &amp;lockstart,</div><div class='add'>+							 &amp;lockend, nowait,</div><div class='add'>+							 &amp;cached_state);</div><div class='add'>+	if (extents_locked &lt; 0) {</div><div class='add'>+		if (!nowait &amp;&amp; extents_locked == -EAGAIN)</div><div class='add'>+			goto again;</div><div class='ctx'> </div><div class='del'>-		if (num_sectors &gt; dirty_sectors) {</div><div class='del'>-			/* release everything except the sectors we dirtied */</div><div class='del'>-			release_bytes -= dirty_sectors &lt;&lt; fs_info-&gt;sectorsize_bits;</div><div class='del'>-			if (only_release_metadata) {</div><div class='del'>-				btrfs_delalloc_release_metadata(BTRFS_I(inode),</div><div class='del'>-							release_bytes, true);</div><div class='del'>-			} else {</div><div class='del'>-				u64 __pos;</div><div class='del'>-</div><div class='del'>-				__pos = round_down(pos,</div><div class='del'>-						   fs_info-&gt;sectorsize) +</div><div class='del'>-					(dirty_pages &lt;&lt; PAGE_SHIFT);</div><div class='del'>-				btrfs_delalloc_release_space(BTRFS_I(inode),</div><div class='del'>-						data_reserved, __pos,</div><div class='del'>-						release_bytes, true);</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='add'>+		btrfs_delalloc_release_extents(inode, reserved_len);</div><div class='add'>+		release_space(inode, *data_reserved, reserved_start, reserved_len,</div><div class='add'>+			      only_release_metadata);</div><div class='add'>+		ret = extents_locked;</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		release_bytes = round_up(copied + sector_offset,</div><div class='del'>-					fs_info-&gt;sectorsize);</div><div class='add'>+	copied = copy_folio_from_iter_atomic(folio, offset_in_folio(folio, start),</div><div class='add'>+					     write_bytes, iter);</div><div class='add'>+	flush_dcache_folio(folio);</div><div class='ctx'> </div><div class='del'>-		ret = btrfs_dirty_pages(BTRFS_I(inode), pages,</div><div class='del'>-					dirty_pages, pos, copied,</div><div class='del'>-					&amp;cached_state, only_release_metadata);</div><div class='add'>+	if (unlikely(copied &lt; write_bytes)) {</div><div class='add'>+		u64 last_block;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * If we have not locked the extent range, because the range's</div><div class='del'>-		 * start offset is &gt;= i_size, we might still have a non-NULL</div><div class='del'>-		 * cached extent state, acquired while marking the extent range</div><div class='del'>-		 * as delalloc through btrfs_dirty_pages(). Therefore free any</div><div class='del'>-		 * possible cached extent state to avoid a memory leak.</div><div class='add'>+		 * The original write range doesn't need an uptodate folio as</div><div class='add'>+		 * the range is block aligned. But now a short copy happened.</div><div class='add'>+		 * We cannot handle it without an uptodate folio.</div><div class='add'>+		 *</div><div class='add'>+		 * So just revert the range and we will retry.</div><div class='ctx'> 		 */</div><div class='del'>-		if (extents_locked)</div><div class='del'>-			unlock_extent_cached(&amp;BTRFS_I(inode)-&gt;io_tree,</div><div class='del'>-					     lockstart, lockend, &amp;cached_state);</div><div class='del'>-		else</div><div class='del'>-			free_extent_state(cached_state);</div><div class='del'>-</div><div class='del'>-		btrfs_delalloc_release_extents(BTRFS_I(inode), reserve_bytes);</div><div class='del'>-		if (ret) {</div><div class='del'>-			btrfs_drop_pages(fs_info, pages, num_pages, pos, copied);</div><div class='del'>-			break;</div><div class='add'>+		if (!folio_test_uptodate(folio)) {</div><div class='add'>+			iov_iter_revert(iter, copied);</div><div class='add'>+			copied = 0;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		release_bytes = 0;</div><div class='del'>-		if (only_release_metadata)</div><div class='del'>-			btrfs_check_nocow_unlock(BTRFS_I(inode));</div><div class='del'>-</div><div class='del'>-		btrfs_drop_pages(fs_info, pages, num_pages, pos, copied);</div><div class='del'>-</div><div class='del'>-		cond_resched();</div><div class='add'>+		/* No copied bytes, unlock, release reserved space and exit. */</div><div class='add'>+		if (copied == 0) {</div><div class='add'>+			if (extents_locked)</div><div class='add'>+				btrfs_unlock_extent(&amp;inode-&gt;io_tree, lockstart, lockend,</div><div class='add'>+						    &amp;cached_state);</div><div class='add'>+			else</div><div class='add'>+				btrfs_free_extent_state(cached_state);</div><div class='add'>+			btrfs_delalloc_release_extents(inode, reserved_len);</div><div class='add'>+			release_space(inode, *data_reserved, reserved_start, reserved_len,</div><div class='add'>+				      only_release_metadata);</div><div class='add'>+			btrfs_drop_folio(fs_info, folio, start, copied);</div><div class='add'>+			return 0;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-		balance_dirty_pages_ratelimited(inode-&gt;i_mapping);</div><div class='add'>+		/* Release the reserved space beyond the last block. */</div><div class='add'>+		last_block = round_up(start + copied, fs_info-&gt;sectorsize);</div><div class='ctx'> </div><div class='del'>-		pos += copied;</div><div class='del'>-		num_written += copied;</div><div class='add'>+		shrink_reserved_space(inode, *data_reserved, reserved_start,</div><div class='add'>+				      reserved_len, last_block - reserved_start,</div><div class='add'>+				      only_release_metadata);</div><div class='add'>+		reserved_len = last_block - reserved_start;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	kfree(pages);</div><div class='del'>-</div><div class='del'>-	if (release_bytes) {</div><div class='del'>-		if (only_release_metadata) {</div><div class='del'>-			btrfs_check_nocow_unlock(BTRFS_I(inode));</div><div class='del'>-			btrfs_delalloc_release_metadata(BTRFS_I(inode),</div><div class='del'>-					release_bytes, true);</div><div class='del'>-		} else {</div><div class='del'>-			btrfs_delalloc_release_space(BTRFS_I(inode),</div><div class='del'>-					data_reserved,</div><div class='del'>-					round_down(pos, fs_info-&gt;sectorsize),</div><div class='del'>-					release_bytes, true);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	ret = btrfs_dirty_folio(inode, folio, start, copied, &amp;cached_state,</div><div class='add'>+				only_release_metadata);</div><div class='add'>+	/*</div><div class='add'>+	 * If we have not locked the extent range, because the range's start</div><div class='add'>+	 * offset is &gt;= i_size, we might still have a non-NULL cached extent</div><div class='add'>+	 * state, acquired while marking the extent range as delalloc through</div><div class='add'>+	 * btrfs_dirty_page(). Therefore free any possible cached extent state</div><div class='add'>+	 * to avoid a memory leak.</div><div class='add'>+	 */</div><div class='add'>+	if (extents_locked)</div><div class='add'>+		btrfs_unlock_extent(&amp;inode-&gt;io_tree, lockstart, lockend, &amp;cached_state);</div><div class='add'>+	else</div><div class='add'>+		btrfs_free_extent_state(cached_state);</div><div class='ctx'> </div><div class='del'>-	extent_changeset_free(data_reserved);</div><div class='del'>-	if (num_written &gt; 0) {</div><div class='del'>-		pagecache_isize_extended(inode, old_isize, iocb-&gt;ki_pos);</div><div class='del'>-		iocb-&gt;ki_pos += num_written;</div><div class='add'>+	btrfs_delalloc_release_extents(inode, reserved_len);</div><div class='add'>+	if (ret) {</div><div class='add'>+		btrfs_drop_folio(fs_info, folio, start, copied);</div><div class='add'>+		release_space(inode, *data_reserved, reserved_start, reserved_len,</div><div class='add'>+			      only_release_metadata);</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='del'>-out:</div><div class='del'>-	btrfs_inode_unlock(inode, ilock_flags);</div><div class='del'>-	return num_written ? num_written : ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static ssize_t check_direct_IO(struct btrfs_fs_info *fs_info,</div><div class='del'>-			       const struct iov_iter *iter, loff_t offset)</div><div class='del'>-{</div><div class='del'>-	const u32 blocksize_mask = fs_info-&gt;sectorsize - 1;</div><div class='del'>-</div><div class='del'>-	if (offset &amp; blocksize_mask)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	if (iov_iter_alignment(iter) &amp; blocksize_mask)</div><div class='del'>-		return -EINVAL;</div><div class='add'>+	if (only_release_metadata)</div><div class='add'>+		btrfs_check_nocow_unlock(inode);</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+	btrfs_drop_folio(fs_info, folio, start, copied);</div><div class='add'>+	return copied;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static ssize_t btrfs_direct_write(struct kiocb *iocb, struct iov_iter *from)</div><div class='add'>+ssize_t btrfs_buffered_write(struct kiocb *iocb, struct iov_iter *iter)</div><div class='ctx'> {</div><div class='del'>-	const bool is_sync_write = (iocb-&gt;ki_flags &amp; IOCB_DSYNC);</div><div class='ctx'> 	struct file *file = iocb-&gt;ki_filp;</div><div class='del'>-	struct inode *inode = file_inode(file);</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='ctx'> 	loff_t pos;</div><div class='del'>-	ssize_t written = 0;</div><div class='del'>-	ssize_t written_buffered;</div><div class='del'>-	size_t prev_left = 0;</div><div class='del'>-	loff_t endbyte;</div><div class='del'>-	ssize_t err;</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='add'>+	struct extent_changeset *data_reserved = NULL;</div><div class='add'>+	size_t num_written = 0;</div><div class='add'>+	ssize_t ret;</div><div class='add'>+	loff_t old_isize;</div><div class='ctx'> 	unsigned int ilock_flags = 0;</div><div class='add'>+	const bool nowait = (iocb-&gt;ki_flags &amp; IOCB_NOWAIT);</div><div class='ctx'> </div><div class='del'>-	if (iocb-&gt;ki_flags &amp; IOCB_NOWAIT)</div><div class='add'>+	if (nowait)</div><div class='ctx'> 		ilock_flags |= BTRFS_ILOCK_TRY;</div><div class='ctx'> </div><div class='del'>-	/* If the write DIO is within EOF, use a shared lock */</div><div class='del'>-	if (iocb-&gt;ki_pos + iov_iter_count(from) &lt;= i_size_read(inode))</div><div class='del'>-		ilock_flags |= BTRFS_ILOCK_SHARED;</div><div class='add'>+	ret = btrfs_inode_lock(BTRFS_I(inode), ilock_flags);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-relock:</div><div class='del'>-	err = btrfs_inode_lock(inode, ilock_flags);</div><div class='del'>-	if (err &lt; 0)</div><div class='del'>-		return err;</div><div class='add'>+	/*</div><div class='add'>+	 * We can only trust the isize with inode lock held, or it can race with</div><div class='add'>+	 * other buffered writes and cause incorrect call of</div><div class='add'>+	 * pagecache_isize_extended() to overwrite existing data.</div><div class='add'>+	 */</div><div class='add'>+	old_isize = i_size_read(inode);</div><div class='ctx'> </div><div class='del'>-	err = generic_write_checks(iocb, from);</div><div class='del'>-	if (err &lt;= 0) {</div><div class='del'>-		btrfs_inode_unlock(inode, ilock_flags);</div><div class='del'>-		return err;</div><div class='del'>-	}</div><div class='add'>+	ret = generic_write_checks(iocb, iter);</div><div class='add'>+	if (ret &lt;= 0)</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='del'>-	err = btrfs_write_check(iocb, from, err);</div><div class='del'>-	if (err &lt; 0) {</div><div class='del'>-		btrfs_inode_unlock(inode, ilock_flags);</div><div class='add'>+	ret = btrfs_write_check(iocb, ret);</div><div class='add'>+	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	pos = iocb-&gt;ki_pos;</div><div class='del'>-	/*</div><div class='del'>-	 * Re-check since file size may have changed just before taking the</div><div class='del'>-	 * lock or pos may have changed because of O_APPEND in generic_write_check()</div><div class='del'>-	 */</div><div class='del'>-	if ((ilock_flags &amp; BTRFS_ILOCK_SHARED) &amp;&amp;</div><div class='del'>-	    pos + iov_iter_count(from) &gt; i_size_read(inode)) {</div><div class='del'>-		btrfs_inode_unlock(inode, ilock_flags);</div><div class='del'>-		ilock_flags &amp;= ~BTRFS_ILOCK_SHARED;</div><div class='del'>-		goto relock;</div><div class='add'>+	while (iov_iter_count(iter) &gt; 0) {</div><div class='add'>+		ret = copy_one_range(BTRFS_I(inode), iter, &amp;data_reserved, pos, nowait);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			break;</div><div class='add'>+		pos += ret;</div><div class='add'>+		num_written += ret;</div><div class='add'>+		cond_resched();</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (check_direct_IO(fs_info, from, pos)) {</div><div class='del'>-		btrfs_inode_unlock(inode, ilock_flags);</div><div class='del'>-		goto buffered;</div><div class='add'>+	extent_changeset_free(data_reserved);</div><div class='add'>+	if (num_written &gt; 0) {</div><div class='add'>+		pagecache_isize_extended(inode, old_isize, iocb-&gt;ki_pos);</div><div class='add'>+		iocb-&gt;ki_pos += num_written;</div><div class='ctx'> 	}</div><div class='add'>+out:</div><div class='add'>+	btrfs_inode_unlock(BTRFS_I(inode), ilock_flags);</div><div class='add'>+	return num_written ? num_written : ret;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * We remove IOCB_DSYNC so that we don't deadlock when iomap_dio_rw()</div><div class='del'>-	 * calls generic_write_sync() (through iomap_dio_complete()), because</div><div class='del'>-	 * that results in calling fsync (btrfs_sync_file()) which will try to</div><div class='del'>-	 * lock the inode in exclusive/write mode.</div><div class='del'>-	 */</div><div class='del'>-	if (is_sync_write)</div><div class='del'>-		iocb-&gt;ki_flags &amp;= ~IOCB_DSYNC;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * The iov_iter can be mapped to the same file range we are writing to.</div><div class='del'>-	 * If that's the case, then we will deadlock in the iomap code, because</div><div class='del'>-	 * it first calls our callback btrfs_dio_iomap_begin(), which will create</div><div class='del'>-	 * an ordered extent, and after that it will fault in the pages that the</div><div class='del'>-	 * iov_iter refers to. During the fault in we end up in the readahead</div><div class='del'>-	 * pages code (starting at btrfs_readahead()), which will lock the range,</div><div class='del'>-	 * find that ordered extent and then wait for it to complete (at</div><div class='del'>-	 * btrfs_lock_and_flush_ordered_range()), resulting in a deadlock since</div><div class='del'>-	 * obviously the ordered extent can never complete as we didn't submit</div><div class='del'>-	 * yet the respective bio(s). This always happens when the buffer is</div><div class='del'>-	 * memory mapped to the same file range, since the iomap DIO code always</div><div class='del'>-	 * invalidates pages in the target file range (after starting and waiting</div><div class='del'>-	 * for any writeback).</div><div class='del'>-	 *</div><div class='del'>-	 * So here we disable page faults in the iov_iter and then retry if we</div><div class='del'>-	 * got -EFAULT, faulting in the pages before the retry.</div><div class='del'>-	 */</div><div class='del'>-again:</div><div class='del'>-	from-&gt;nofault = true;</div><div class='del'>-	err = iomap_dio_rw(iocb, from, &amp;btrfs_dio_iomap_ops, &amp;btrfs_dio_ops,</div><div class='del'>-			   IOMAP_DIO_PARTIAL, written);</div><div class='del'>-	from-&gt;nofault = false;</div><div class='del'>-</div><div class='del'>-	/* No increment (+=) because iomap returns a cumulative value. */</div><div class='del'>-	if (err &gt; 0)</div><div class='del'>-		written = err;</div><div class='add'>+static ssize_t btrfs_encoded_write(struct kiocb *iocb, struct iov_iter *from,</div><div class='add'>+			const struct btrfs_ioctl_encoded_io_args *encoded)</div><div class='add'>+{</div><div class='add'>+	struct file *file = iocb-&gt;ki_filp;</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='add'>+	loff_t count;</div><div class='add'>+	ssize_t ret;</div><div class='ctx'> </div><div class='del'>-	if (iov_iter_count(from) &gt; 0 &amp;&amp; (err == -EFAULT || err &gt; 0)) {</div><div class='del'>-		const size_t left = iov_iter_count(from);</div><div class='add'>+	btrfs_inode_lock(BTRFS_I(inode), 0);</div><div class='add'>+	count = encoded-&gt;len;</div><div class='add'>+	ret = generic_write_checks_count(iocb, &amp;count);</div><div class='add'>+	if (ret == 0 &amp;&amp; count != encoded-&gt;len) {</div><div class='ctx'> 		/*</div><div class='del'>-		 * We have more data left to write. Try to fault in as many as</div><div class='del'>-		 * possible of the remainder pages and retry. We do this without</div><div class='del'>-		 * releasing and locking again the inode, to prevent races with</div><div class='del'>-		 * truncate.</div><div class='del'>-		 *</div><div class='del'>-		 * Also, in case the iov refers to pages in the file range of the</div><div class='del'>-		 * file we want to write to (due to a mmap), we could enter an</div><div class='del'>-		 * infinite loop if we retry after faulting the pages in, since</div><div class='del'>-		 * iomap will invalidate any pages in the range early on, before</div><div class='del'>-		 * it tries to fault in the pages of the iov. So we keep track of</div><div class='del'>-		 * how much was left of iov in the previous EFAULT and fallback</div><div class='del'>-		 * to buffered IO in case we haven't made any progress.</div><div class='add'>+		 * The write got truncated by generic_write_checks_count(). We</div><div class='add'>+		 * can't do a partial encoded write.</div><div class='ctx'> 		 */</div><div class='del'>-		if (left == prev_left) {</div><div class='del'>-			err = -ENOTBLK;</div><div class='del'>-		} else {</div><div class='del'>-			fault_in_iov_iter_readable(from, left);</div><div class='del'>-			prev_left = left;</div><div class='del'>-			goto again;</div><div class='del'>-		}</div><div class='add'>+		ret = -EFBIG;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	btrfs_inode_unlock(inode, ilock_flags);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Add back IOCB_DSYNC. Our caller, btrfs_file_write_iter(), will do</div><div class='del'>-	 * the fsync (call generic_write_sync()).</div><div class='del'>-	 */</div><div class='del'>-	if (is_sync_write)</div><div class='del'>-		iocb-&gt;ki_flags |= IOCB_DSYNC;</div><div class='del'>-</div><div class='del'>-	/* If 'err' is -ENOTBLK then it means we must fallback to buffered IO. */</div><div class='del'>-	if ((err &lt; 0 &amp;&amp; err != -ENOTBLK) || !iov_iter_count(from))</div><div class='add'>+	if (ret || encoded-&gt;len == 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-buffered:</div><div class='del'>-	pos = iocb-&gt;ki_pos;</div><div class='del'>-	written_buffered = btrfs_buffered_write(iocb, from);</div><div class='del'>-	if (written_buffered &lt; 0) {</div><div class='del'>-		err = written_buffered;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	/*</div><div class='del'>-	 * Ensure all data is persisted. We want the next direct IO read to be</div><div class='del'>-	 * able to read what was just written.</div><div class='del'>-	 */</div><div class='del'>-	endbyte = pos + written_buffered - 1;</div><div class='del'>-	err = btrfs_fdatawrite_range(inode, pos, endbyte);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out;</div><div class='del'>-	err = filemap_fdatawait_range(inode-&gt;i_mapping, pos, endbyte);</div><div class='del'>-	if (err)</div><div class='add'>+	ret = btrfs_write_check(iocb, encoded-&gt;len);</div><div class='add'>+	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='del'>-	written += written_buffered;</div><div class='del'>-	iocb-&gt;ki_pos = pos + written_buffered;</div><div class='del'>-	invalidate_mapping_pages(file-&gt;f_mapping, pos &gt;&gt; PAGE_SHIFT,</div><div class='del'>-				 endbyte &gt;&gt; PAGE_SHIFT);</div><div class='add'>+</div><div class='add'>+	ret = btrfs_do_encoded_write(iocb, from, encoded);</div><div class='ctx'> out:</div><div class='del'>-	return err &lt; 0 ? err : written;</div><div class='add'>+	btrfs_inode_unlock(BTRFS_I(inode), 0);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static ssize_t btrfs_file_write_iter(struct kiocb *iocb,</div><div class='del'>-				    struct iov_iter *from)</div><div class='add'>+ssize_t btrfs_do_write_iter(struct kiocb *iocb, struct iov_iter *from,</div><div class='add'>+			    const struct btrfs_ioctl_encoded_io_args *encoded)</div><div class='ctx'> {</div><div class='ctx'> 	struct file *file = iocb-&gt;ki_filp;</div><div class='ctx'> 	struct btrfs_inode *inode = BTRFS_I(file_inode(file));</div><div class='del'>-	ssize_t num_written = 0;</div><div class='del'>-	const bool sync = iocb-&gt;ki_flags &amp; IOCB_DSYNC;</div><div class='add'>+	ssize_t num_written, num_sync;</div><div class='ctx'> </div><div class='add'>+	if (unlikely(btrfs_is_shutdown(inode-&gt;root-&gt;fs_info)))</div><div class='add'>+		return -EIO;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If the fs flips readonly due to some impossible error, although we</div><div class='ctx'> 	 * have opened a file as writable, we have to stop this write operation</div><div class='hunk'>@@ -2082,38 +1450,46 @@ static ssize_t btrfs_file_write_iter(struct kiocb *iocb,</div><div class='ctx'> 	if (BTRFS_FS_ERROR(inode-&gt;root-&gt;fs_info))</div><div class='ctx'> 		return -EROFS;</div><div class='ctx'> </div><div class='del'>-	if (!(iocb-&gt;ki_flags &amp; IOCB_DIRECT) &amp;&amp;</div><div class='del'>-	    (iocb-&gt;ki_flags &amp; IOCB_NOWAIT))</div><div class='add'>+	if (encoded &amp;&amp; (iocb-&gt;ki_flags &amp; IOCB_NOWAIT))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='del'>-	if (sync)</div><div class='del'>-		atomic_inc(&amp;inode-&gt;sync_writers);</div><div class='del'>-</div><div class='del'>-	if (iocb-&gt;ki_flags &amp; IOCB_DIRECT)</div><div class='add'>+	if (encoded) {</div><div class='add'>+		num_written = btrfs_encoded_write(iocb, from, encoded);</div><div class='add'>+		num_sync = encoded-&gt;len;</div><div class='add'>+	} else if (iocb-&gt;ki_flags &amp; IOCB_DIRECT) {</div><div class='ctx'> 		num_written = btrfs_direct_write(iocb, from);</div><div class='del'>-	else</div><div class='add'>+		num_sync = num_written;</div><div class='add'>+	} else {</div><div class='ctx'> 		num_written = btrfs_buffered_write(iocb, from);</div><div class='add'>+		num_sync = num_written;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	btrfs_set_inode_last_sub_trans(inode);</div><div class='ctx'> </div><div class='del'>-	if (num_written &gt; 0)</div><div class='del'>-		num_written = generic_write_sync(iocb, num_written);</div><div class='del'>-</div><div class='del'>-	if (sync)</div><div class='del'>-		atomic_dec(&amp;inode-&gt;sync_writers);</div><div class='add'>+	if (num_sync &gt; 0) {</div><div class='add'>+		num_sync = generic_write_sync(iocb, num_sync);</div><div class='add'>+		if (num_sync &lt; 0)</div><div class='add'>+			num_written = num_sync;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	current-&gt;backing_dev_info = NULL;</div><div class='ctx'> 	return num_written;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static ssize_t btrfs_file_write_iter(struct kiocb *iocb, struct iov_iter *from)</div><div class='add'>+{</div><div class='add'>+	return btrfs_do_write_iter(iocb, from, NULL);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> int btrfs_release_file(struct inode *inode, struct file *filp)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_file_private *private = filp-&gt;private_data;</div><div class='ctx'> </div><div class='del'>-	if (private &amp;&amp; private-&gt;filldir_buf)</div><div class='add'>+	if (private) {</div><div class='ctx'> 		kfree(private-&gt;filldir_buf);</div><div class='del'>-	kfree(private);</div><div class='del'>-	filp-&gt;private_data = NULL;</div><div class='add'>+		btrfs_free_extent_state(private-&gt;llseek_cached_state);</div><div class='add'>+		kfree(private);</div><div class='add'>+		filp-&gt;private_data = NULL;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Set by setattr when we are about to truncate a file from a non-zero</div><div class='hunk'>@@ -2127,7 +1503,7 @@ int btrfs_release_file(struct inode *inode, struct file *filp)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int start_ordered_ops(struct inode *inode, loff_t start, loff_t end)</div><div class='add'>+static int start_ordered_ops(struct btrfs_inode *inode, loff_t start, loff_t end)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct blk_plug plug;</div><div class='hunk'>@@ -2139,9 +1515,7 @@ static int start_ordered_ops(struct inode *inode, loff_t start, loff_t end)</div><div class='ctx'> 	 * several segments of stripe length (currently 64K).</div><div class='ctx'> 	 */</div><div class='ctx'> 	blk_start_plug(&amp;plug);</div><div class='del'>-	atomic_inc(&amp;BTRFS_I(inode)-&gt;sync_writers);</div><div class='ctx'> 	ret = btrfs_fdatawrite_range(inode, start, end);</div><div class='del'>-	atomic_dec(&amp;BTRFS_I(inode)-&gt;sync_writers);</div><div class='ctx'> 	blk_finish_plug(&amp;plug);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -2149,10 +1523,10 @@ static int start_ordered_ops(struct inode *inode, loff_t start, loff_t end)</div><div class='ctx'> </div><div class='ctx'> static inline bool skip_inode_logging(const struct btrfs_log_ctx *ctx)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_inode *inode = BTRFS_I(ctx-&gt;inode);</div><div class='add'>+	struct btrfs_inode *inode = ctx-&gt;inode;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='ctx'> </div><div class='del'>-	if (btrfs_inode_in_log(inode, fs_info-&gt;generation) &amp;&amp;</div><div class='add'>+	if (btrfs_inode_in_log(inode, btrfs_get_fs_generation(fs_info)) &amp;&amp;</div><div class='ctx'> 	    list_empty(&amp;ctx-&gt;ordered_extents))</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='hunk'>@@ -2163,7 +1537,7 @@ static inline bool skip_inode_logging(const struct btrfs_log_ctx *ctx)</div><div class='ctx'> 	 * and for a fast fsync we don't wait for that, we only wait for the</div><div class='ctx'> 	 * writeback to complete.</div><div class='ctx'> 	 */</div><div class='del'>-	if (inode-&gt;last_trans &lt;= fs_info-&gt;last_trans_committed &amp;&amp;</div><div class='add'>+	if (inode-&gt;last_trans &lt;= btrfs_get_last_trans_committed(fs_info) &amp;&amp;</div><div class='ctx'> 	    (test_bit(BTRFS_INODE_NEEDS_FULL_SYNC, &amp;inode-&gt;runtime_flags) ||</div><div class='ctx'> 	     list_empty(&amp;ctx-&gt;ordered_extents)))</div><div class='ctx'> 		return true;</div><div class='hunk'>@@ -2185,14 +1559,21 @@ static inline bool skip_inode_logging(const struct btrfs_log_ctx *ctx)</div><div class='ctx'> int btrfs_sync_file(struct file *file, loff_t start, loff_t end, int datasync)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dentry = file_dentry(file);</div><div class='del'>-	struct inode *inode = d_inode(dentry);</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='add'>+	struct btrfs_inode *inode = BTRFS_I(d_inode(dentry));</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	struct btrfs_log_ctx ctx;</div><div class='ctx'> 	int ret = 0, err;</div><div class='ctx'> 	u64 len;</div><div class='ctx'> 	bool full_sync;</div><div class='add'>+	bool skip_ilock = false;</div><div class='add'>+</div><div class='add'>+	if (current-&gt;journal_info == BTRFS_TRANS_DIO_WRITE_STUB) {</div><div class='add'>+		skip_ilock = true;</div><div class='add'>+		current-&gt;journal_info = NULL;</div><div class='add'>+		btrfs_assert_inode_locked(inode);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	trace_btrfs_sync_file(file, datasync);</div><div class='ctx'> </div><div class='hunk'>@@ -2220,19 +1601,14 @@ int btrfs_sync_file(struct file *file, loff_t start, loff_t end, int datasync)</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	btrfs_inode_lock(inode, BTRFS_ILOCK_MMAP);</div><div class='add'>+	if (skip_ilock)</div><div class='add'>+		down_write(&amp;inode-&gt;i_mmap_lock);</div><div class='add'>+	else</div><div class='add'>+		btrfs_inode_lock(inode, BTRFS_ILOCK_MMAP);</div><div class='ctx'> </div><div class='ctx'> 	atomic_inc(&amp;root-&gt;log_batch);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Always check for the full sync flag while holding the inode's lock,</div><div class='del'>-	 * to avoid races with other tasks. The flag must be either set all the</div><div class='del'>-	 * time during logging or always off all the time while logging.</div><div class='del'>-	 */</div><div class='del'>-	full_sync = test_bit(BTRFS_INODE_NEEDS_FULL_SYNC,</div><div class='del'>-			     &amp;BTRFS_I(inode)-&gt;runtime_flags);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='ctx'> 	 * Before we acquired the inode's lock and the mmap lock, someone may</div><div class='ctx'> 	 * have dirtied more pages in the target range. We need to make sure</div><div class='ctx'> 	 * that writeback for any such pages does not start while we are logging</div><div class='hunk'>@@ -2252,11 +1628,24 @@ int btrfs_sync_file(struct file *file, loff_t start, loff_t end, int datasync)</div><div class='ctx'> 	 */</div><div class='ctx'> 	ret = start_ordered_ops(inode, start, end);</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		btrfs_inode_unlock(inode, BTRFS_ILOCK_MMAP);</div><div class='add'>+		if (skip_ilock)</div><div class='add'>+			up_write(&amp;inode-&gt;i_mmap_lock);</div><div class='add'>+		else</div><div class='add'>+			btrfs_inode_unlock(inode, BTRFS_ILOCK_MMAP);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='add'>+	 * Always check for the full sync flag while holding the inode's lock,</div><div class='add'>+	 * to avoid races with other tasks. The flag must be either set all the</div><div class='add'>+	 * time during logging or always off all the time while logging.</div><div class='add'>+	 * We check the flag here after starting delalloc above, because when</div><div class='add'>+	 * running delalloc the full sync flag may be set if we need to drop</div><div class='add'>+	 * extra extent map ranges due to temporary memory allocation failures.</div><div class='add'>+	 */</div><div class='add'>+	full_sync = test_bit(BTRFS_INODE_NEEDS_FULL_SYNC, &amp;inode-&gt;runtime_flags);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='ctx'> 	 * We have to do this here to avoid the priority inversion of waiting on</div><div class='ctx'> 	 * IO of a lower priority task while holding a transaction open.</div><div class='ctx'> 	 *</div><div class='hunk'>@@ -2273,15 +1662,29 @@ int btrfs_sync_file(struct file *file, loff_t start, loff_t end, int datasync)</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (full_sync || btrfs_is_zoned(fs_info)) {</div><div class='ctx'> 		ret = btrfs_wait_ordered_range(inode, start, len);</div><div class='add'>+		clear_bit(BTRFS_INODE_COW_WRITE_ERROR, &amp;inode-&gt;runtime_flags);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Get our ordered extents as soon as possible to avoid doing</div><div class='ctx'> 		 * checksum lookups in the csum tree, and use instead the</div><div class='ctx'> 		 * checksums attached to the ordered extents.</div><div class='ctx'> 		 */</div><div class='del'>-		btrfs_get_ordered_extents_for_logging(BTRFS_I(inode),</div><div class='del'>-						      &amp;ctx.ordered_extents);</div><div class='del'>-		ret = filemap_fdatawait_range(inode-&gt;i_mapping, start, end);</div><div class='add'>+		btrfs_get_ordered_extents_for_logging(inode, &amp;ctx.ordered_extents);</div><div class='add'>+		ret = filemap_fdatawait_range(inode-&gt;vfs_inode.i_mapping, start, end);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out_release_extents;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Check and clear the BTRFS_INODE_COW_WRITE_ERROR now after</div><div class='add'>+		 * starting and waiting for writeback, because for buffered IO</div><div class='add'>+		 * it may have been set during the end IO callback</div><div class='add'>+		 * (end_bbio_data_write() -&gt; btrfs_finish_ordered_extent()) in</div><div class='add'>+		 * case an error happened and we need to wait for ordered</div><div class='add'>+		 * extents to complete so that any extent maps that point to</div><div class='add'>+		 * unwritten locations are dropped and we don't log them.</div><div class='add'>+		 */</div><div class='add'>+		if (test_and_clear_bit(BTRFS_INODE_COW_WRITE_ERROR, &amp;inode-&gt;runtime_flags))</div><div class='add'>+			ret = btrfs_wait_ordered_range(inode, start, len);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (ret)</div><div class='hunk'>@@ -2289,15 +1692,13 @@ int btrfs_sync_file(struct file *file, loff_t start, loff_t end, int datasync)</div><div class='ctx'> </div><div class='ctx'> 	atomic_inc(&amp;root-&gt;log_batch);</div><div class='ctx'> </div><div class='del'>-	smp_mb();</div><div class='ctx'> 	if (skip_inode_logging(&amp;ctx)) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We've had everything committed since the last time we were</div><div class='ctx'> 		 * modified so clear this flag in case it was set for whatever</div><div class='ctx'> 		 * reason, it's no longer relevant.</div><div class='ctx'> 		 */</div><div class='del'>-		clear_bit(BTRFS_INODE_NEEDS_FULL_SYNC,</div><div class='del'>-			  &amp;BTRFS_I(inode)-&gt;runtime_flags);</div><div class='add'>+		clear_bit(BTRFS_INODE_NEEDS_FULL_SYNC, &amp;inode-&gt;runtime_flags);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * An ordered extent might have started before and completed</div><div class='ctx'> 		 * already with io errors, in which case the inode was not</div><div class='hunk'>@@ -2305,10 +1706,12 @@ int btrfs_sync_file(struct file *file, loff_t start, loff_t end, int datasync)</div><div class='ctx'> 		 * for any errors that might have happened since we last</div><div class='ctx'> 		 * checked called fsync.</div><div class='ctx'> 		 */</div><div class='del'>-		ret = filemap_check_wb_err(inode-&gt;i_mapping, file-&gt;f_wb_err);</div><div class='add'>+		ret = filemap_check_wb_err(inode-&gt;vfs_inode.i_mapping, file-&gt;f_wb_err);</div><div class='ctx'> 		goto out_release_extents;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	btrfs_init_log_ctx_scratch_eb(&amp;ctx);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We use start here because we will need to wait on the IO to complete</div><div class='ctx'> 	 * in btrfs_sync_log, which could require joining a transaction (for</div><div class='hunk'>@@ -2328,10 +1731,19 @@ int btrfs_sync_file(struct file *file, loff_t start, loff_t end, int datasync)</div><div class='ctx'> 	trans-&gt;in_fsync = true;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_log_dentry_safe(trans, dentry, &amp;ctx);</div><div class='add'>+	/*</div><div class='add'>+	 * Scratch eb no longer needed, release before syncing log or commit</div><div class='add'>+	 * transaction, to avoid holding unnecessary memory during such long</div><div class='add'>+	 * operations.</div><div class='add'>+	 */</div><div class='add'>+	if (ctx.scratch_eb) {</div><div class='add'>+		free_extent_buffer(ctx.scratch_eb);</div><div class='add'>+		ctx.scratch_eb = NULL;</div><div class='add'>+	}</div><div class='ctx'> 	btrfs_release_log_ctx_extents(&amp;ctx);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='ctx'> 		/* Fallthrough and commit/free transaction. */</div><div class='del'>-		ret = 1;</div><div class='add'>+		ret = BTRFS_LOG_FORCE_COMMIT;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* we've logged all the items and now have a consistent</div><div class='hunk'>@@ -2344,29 +1756,71 @@ int btrfs_sync_file(struct file *file, loff_t start, loff_t end, int datasync)</div><div class='ctx'> 	 * file again, but that will end up using the synchronization</div><div class='ctx'> 	 * inside btrfs_sync_log to keep things safe.</div><div class='ctx'> 	 */</div><div class='del'>-	btrfs_inode_unlock(inode, BTRFS_ILOCK_MMAP);</div><div class='add'>+	if (skip_ilock)</div><div class='add'>+		up_write(&amp;inode-&gt;i_mmap_lock);</div><div class='add'>+	else</div><div class='add'>+		btrfs_inode_unlock(inode, BTRFS_ILOCK_MMAP);</div><div class='add'>+</div><div class='add'>+	if (ret == BTRFS_NO_LOG_SYNC) {</div><div class='add'>+		ret = btrfs_end_transaction(trans);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (ret != BTRFS_NO_LOG_SYNC) {</div><div class='add'>+	/* We successfully logged the inode, attempt to sync the log. */</div><div class='add'>+	if (!ret) {</div><div class='add'>+		ret = btrfs_sync_log(trans, root, &amp;ctx);</div><div class='ctx'> 		if (!ret) {</div><div class='del'>-			ret = btrfs_sync_log(trans, root, &amp;ctx);</div><div class='del'>-			if (!ret) {</div><div class='del'>-				ret = btrfs_end_transaction(trans);</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-		if (!full_sync) {</div><div class='del'>-			ret = btrfs_wait_ordered_range(inode, start, len);</div><div class='del'>-			if (ret) {</div><div class='del'>-				btrfs_end_transaction(trans);</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='add'>+			ret = btrfs_end_transaction(trans);</div><div class='add'>+			goto out;</div><div class='ctx'> 		}</div><div class='del'>-		ret = btrfs_commit_transaction(trans);</div><div class='del'>-	} else {</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * At this point we need to commit the transaction because we had</div><div class='add'>+	 * btrfs_need_log_full_commit() or some other error.</div><div class='add'>+	 *</div><div class='add'>+	 * If we didn't do a full sync we have to stop the trans handle, wait on</div><div class='add'>+	 * the ordered extents, start it again and commit the transaction.  If</div><div class='add'>+	 * we attempt to wait on the ordered extents here we could deadlock with</div><div class='add'>+	 * something like fallocate() that is holding the extent lock trying to</div><div class='add'>+	 * start a transaction while some other thread is trying to commit the</div><div class='add'>+	 * transaction while we (fsync) are currently holding the transaction</div><div class='add'>+	 * open.</div><div class='add'>+	 */</div><div class='add'>+	if (!full_sync) {</div><div class='ctx'> 		ret = btrfs_end_transaction(trans);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out;</div><div class='add'>+		ret = btrfs_wait_ordered_range(inode, start, len);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * This is safe to use here because we're only interested in</div><div class='add'>+		 * making sure the transaction that had the ordered extents is</div><div class='add'>+		 * committed.  We aren't waiting on anything past this point,</div><div class='add'>+		 * we're purely getting the transaction and committing it.</div><div class='add'>+		 */</div><div class='add'>+		trans = btrfs_attach_transaction_barrier(root);</div><div class='add'>+		if (IS_ERR(trans)) {</div><div class='add'>+			ret = PTR_ERR(trans);</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * We committed the transaction and there's no currently</div><div class='add'>+			 * running transaction, this means everything we care</div><div class='add'>+			 * about made it to disk and we are done.</div><div class='add'>+			 */</div><div class='add'>+			if (ret == -ENOENT)</div><div class='add'>+				ret = 0;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_commit_transaction(trans);</div><div class='ctx'> out:</div><div class='add'>+	free_extent_buffer(ctx.scratch_eb);</div><div class='ctx'> 	ASSERT(list_empty(&amp;ctx.list));</div><div class='add'>+	ASSERT(list_empty(&amp;ctx.conflict_inodes));</div><div class='ctx'> 	err = file_check_and_advance_wb_err(file);</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		ret = err;</div><div class='hunk'>@@ -2374,56 +1828,260 @@ out:</div><div class='ctx'> </div><div class='ctx'> out_release_extents:</div><div class='ctx'> 	btrfs_release_log_ctx_extents(&amp;ctx);</div><div class='del'>-	btrfs_inode_unlock(inode, BTRFS_ILOCK_MMAP);</div><div class='add'>+	if (skip_ilock)</div><div class='add'>+		up_write(&amp;inode-&gt;i_mmap_lock);</div><div class='add'>+	else</div><div class='add'>+		btrfs_inode_unlock(inode, BTRFS_ILOCK_MMAP);</div><div class='ctx'> 	goto out;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * btrfs_page_mkwrite() is not allowed to change the file size as it gets</div><div class='add'>+ * called from a page fault handler when a page is first dirtied. Hence we must</div><div class='add'>+ * be careful to check for EOF conditions here. We set the page up correctly</div><div class='add'>+ * for a written page which means we get ENOSPC checking when writing into</div><div class='add'>+ * holes and correct delalloc and unwritten extent mapping on filesystems that</div><div class='add'>+ * support these features.</div><div class='add'>+ *</div><div class='add'>+ * We are not allowed to take the i_mutex here so we have to play games to</div><div class='add'>+ * protect against truncate races as the page could now be beyond EOF.  Because</div><div class='add'>+ * truncate_setsize() writes the inode size before removing pages, once we have</div><div class='add'>+ * the page lock we can determine safely if the page is beyond EOF. If it is not</div><div class='add'>+ * beyond EOF, then the page is guaranteed safe against truncation until we</div><div class='add'>+ * unlock the page.</div><div class='add'>+ */</div><div class='add'>+static vm_fault_t btrfs_page_mkwrite(struct vm_fault *vmf)</div><div class='add'>+{</div><div class='add'>+	struct page *page = vmf-&gt;page;</div><div class='add'>+	struct folio *folio = page_folio(page);</div><div class='add'>+	struct btrfs_inode *inode = BTRFS_I(file_inode(vmf-&gt;vma-&gt;vm_file));</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	struct extent_io_tree *io_tree = &amp;inode-&gt;io_tree;</div><div class='add'>+	struct btrfs_ordered_extent *ordered;</div><div class='add'>+	struct extent_state *cached_state = NULL;</div><div class='add'>+	struct extent_changeset *data_reserved = NULL;</div><div class='add'>+	unsigned long zero_start;</div><div class='add'>+	loff_t size;</div><div class='add'>+	size_t fsize = folio_size(folio);</div><div class='add'>+	int ret;</div><div class='add'>+	bool only_release_metadata = false;</div><div class='add'>+	u64 reserved_space;</div><div class='add'>+	u64 page_start;</div><div class='add'>+	u64 page_end;</div><div class='add'>+	u64 end;</div><div class='add'>+</div><div class='add'>+	reserved_space = fsize;</div><div class='add'>+</div><div class='add'>+	sb_start_pagefault(inode-&gt;vfs_inode.i_sb);</div><div class='add'>+	page_start = folio_pos(folio);</div><div class='add'>+	page_end = page_start + folio_size(folio) - 1;</div><div class='add'>+	end = page_end;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Reserving delalloc space after obtaining the page lock can lead to</div><div class='add'>+	 * deadlock. For example, if a dirty page is locked by this function</div><div class='add'>+	 * and the call to btrfs_delalloc_reserve_space() ends up triggering</div><div class='add'>+	 * dirty page write out, then the btrfs_writepages() function could</div><div class='add'>+	 * end up waiting indefinitely to get a lock on the page currently</div><div class='add'>+	 * being processed by btrfs_page_mkwrite() function.</div><div class='add'>+	 */</div><div class='add'>+	ret = btrfs_check_data_free_space(inode, &amp;data_reserved, page_start,</div><div class='add'>+					  reserved_space, false);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		size_t write_bytes = reserved_space;</div><div class='add'>+</div><div class='add'>+		if (btrfs_check_nocow_lock(inode, page_start, &amp;write_bytes, false) &lt;= 0)</div><div class='add'>+			goto out_noreserve;</div><div class='add'>+</div><div class='add'>+		only_release_metadata = true;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Can't write the whole range, there may be shared extents or</div><div class='add'>+		 * holes in the range, bail out with @only_release_metadata set</div><div class='add'>+		 * to true so that we unlock the nocow lock before returning the</div><div class='add'>+		 * error.</div><div class='add'>+		 */</div><div class='add'>+		if (write_bytes &lt; reserved_space)</div><div class='add'>+			goto out_noreserve;</div><div class='add'>+	}</div><div class='add'>+	ret = btrfs_delalloc_reserve_metadata(inode, reserved_space,</div><div class='add'>+					      reserved_space, false);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		if (!only_release_metadata)</div><div class='add'>+			btrfs_free_reserved_data_space(inode, data_reserved,</div><div class='add'>+						       page_start, reserved_space);</div><div class='add'>+		goto out_noreserve;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = file_update_time(vmf-&gt;vma-&gt;vm_file);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+again:</div><div class='add'>+	down_read(&amp;inode-&gt;i_mmap_lock);</div><div class='add'>+	folio_lock(folio);</div><div class='add'>+	size = i_size_read(&amp;inode-&gt;vfs_inode);</div><div class='add'>+</div><div class='add'>+	if ((folio-&gt;mapping != inode-&gt;vfs_inode.i_mapping) ||</div><div class='add'>+	    (page_start &gt;= size)) {</div><div class='add'>+		/* Page got truncated out from underneath us. */</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	}</div><div class='add'>+	folio_wait_writeback(folio);</div><div class='add'>+</div><div class='add'>+	btrfs_lock_extent(io_tree, page_start, page_end, &amp;cached_state);</div><div class='add'>+	ret = set_folio_extent_mapped(folio);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		btrfs_unlock_extent(io_tree, page_start, page_end, &amp;cached_state);</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We can't set the delalloc bits if there are pending ordered</div><div class='add'>+	 * extents.  Drop our locks and wait for them to finish.</div><div class='add'>+	 */</div><div class='add'>+	ordered = btrfs_lookup_ordered_range(inode, page_start, fsize);</div><div class='add'>+	if (ordered) {</div><div class='add'>+		btrfs_unlock_extent(io_tree, page_start, page_end, &amp;cached_state);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		up_read(&amp;inode-&gt;i_mmap_lock);</div><div class='add'>+		btrfs_start_ordered_extent(ordered);</div><div class='add'>+		btrfs_put_ordered_extent(ordered);</div><div class='add'>+		goto again;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (folio_contains(folio, (size - 1) &gt;&gt; PAGE_SHIFT)) {</div><div class='add'>+		reserved_space = round_up(size - page_start, fs_info-&gt;sectorsize);</div><div class='add'>+		if (reserved_space &lt; fsize) {</div><div class='add'>+			const u64 to_free = fsize - reserved_space;</div><div class='add'>+</div><div class='add'>+			end = page_start + reserved_space - 1;</div><div class='add'>+			if (only_release_metadata)</div><div class='add'>+				btrfs_delalloc_release_metadata(inode, to_free, true);</div><div class='add'>+			else</div><div class='add'>+				btrfs_delalloc_release_space(inode, data_reserved,</div><div class='add'>+							     end + 1, to_free, true);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * page_mkwrite gets called when the page is firstly dirtied after it's</div><div class='add'>+	 * faulted in, but write(2) could also dirty a page and set delalloc</div><div class='add'>+	 * bits, thus in this case for space account reason, we still need to</div><div class='add'>+	 * clear any delalloc bits within this page range since we have to</div><div class='add'>+	 * reserve data&amp;meta space before lock_page() (see above comments).</div><div class='add'>+	 */</div><div class='add'>+	btrfs_clear_extent_bit(io_tree, page_start, end,</div><div class='add'>+			       EXTENT_DELALLOC | EXTENT_DO_ACCOUNTING |</div><div class='add'>+			       EXTENT_DEFRAG, &amp;cached_state);</div><div class='add'>+</div><div class='add'>+	ret = btrfs_set_extent_delalloc(inode, page_start, end, 0, &amp;cached_state);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		btrfs_unlock_extent(io_tree, page_start, page_end, &amp;cached_state);</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Page is wholly or partially inside EOF. */</div><div class='add'>+	if (page_start + folio_size(folio) &gt; size)</div><div class='add'>+		zero_start = offset_in_folio(folio, size);</div><div class='add'>+	else</div><div class='add'>+		zero_start = fsize;</div><div class='add'>+</div><div class='add'>+	if (zero_start != fsize)</div><div class='add'>+		folio_zero_range(folio, zero_start, folio_size(folio) - zero_start);</div><div class='add'>+</div><div class='add'>+	btrfs_folio_clear_checked(fs_info, folio, page_start, fsize);</div><div class='add'>+	btrfs_folio_set_dirty(fs_info, folio, page_start, end + 1 - page_start);</div><div class='add'>+	btrfs_folio_set_uptodate(fs_info, folio, page_start, end + 1 - page_start);</div><div class='add'>+</div><div class='add'>+	btrfs_set_inode_last_sub_trans(inode);</div><div class='add'>+</div><div class='add'>+	if (only_release_metadata)</div><div class='add'>+		btrfs_set_extent_bit(io_tree, page_start, end, EXTENT_NORESERVE,</div><div class='add'>+				     &amp;cached_state);</div><div class='add'>+</div><div class='add'>+	btrfs_unlock_extent(io_tree, page_start, page_end, &amp;cached_state);</div><div class='add'>+	up_read(&amp;inode-&gt;i_mmap_lock);</div><div class='add'>+</div><div class='add'>+	btrfs_delalloc_release_extents(inode, fsize);</div><div class='add'>+	if (only_release_metadata)</div><div class='add'>+		btrfs_check_nocow_unlock(inode);</div><div class='add'>+	sb_end_pagefault(inode-&gt;vfs_inode.i_sb);</div><div class='add'>+	extent_changeset_free(data_reserved);</div><div class='add'>+	return VM_FAULT_LOCKED;</div><div class='add'>+</div><div class='add'>+out_unlock:</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	up_read(&amp;inode-&gt;i_mmap_lock);</div><div class='add'>+out:</div><div class='add'>+	btrfs_delalloc_release_extents(inode, fsize);</div><div class='add'>+	if (only_release_metadata)</div><div class='add'>+		btrfs_delalloc_release_metadata(inode, reserved_space, true);</div><div class='add'>+	else</div><div class='add'>+		btrfs_delalloc_release_space(inode, data_reserved, page_start,</div><div class='add'>+					     reserved_space, true);</div><div class='add'>+	extent_changeset_free(data_reserved);</div><div class='add'>+out_noreserve:</div><div class='add'>+	if (only_release_metadata)</div><div class='add'>+		btrfs_check_nocow_unlock(inode);</div><div class='add'>+</div><div class='add'>+	sb_end_pagefault(inode-&gt;vfs_inode.i_sb);</div><div class='add'>+</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return vmf_error(ret);</div><div class='add'>+</div><div class='add'>+	/* Make the VM retry the fault. */</div><div class='add'>+	return VM_FAULT_NOPAGE;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static const struct vm_operations_struct btrfs_file_vm_ops = {</div><div class='ctx'> 	.fault		= filemap_fault,</div><div class='ctx'> 	.map_pages	= filemap_map_pages,</div><div class='ctx'> 	.page_mkwrite	= btrfs_page_mkwrite,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int btrfs_file_mmap(struct file	*filp, struct vm_area_struct *vma)</div><div class='add'>+static int btrfs_file_mmap_prepare(struct vm_area_desc *desc)</div><div class='ctx'> {</div><div class='add'>+	struct file *filp = desc-&gt;file;</div><div class='ctx'> 	struct address_space *mapping = filp-&gt;f_mapping;</div><div class='ctx'> </div><div class='del'>-	if (!mapping-&gt;a_ops-&gt;readpage)</div><div class='add'>+	if (unlikely(btrfs_is_shutdown(inode_to_fs_info(file_inode(filp)))))</div><div class='add'>+		return -EIO;</div><div class='add'>+	if (!mapping-&gt;a_ops-&gt;read_folio)</div><div class='ctx'> 		return -ENOEXEC;</div><div class='ctx'> </div><div class='ctx'> 	file_accessed(filp);</div><div class='del'>-	vma-&gt;vm_ops = &amp;btrfs_file_vm_ops;</div><div class='add'>+	desc-&gt;vm_ops = &amp;btrfs_file_vm_ops;</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hole_mergeable(struct btrfs_inode *inode, struct extent_buffer *leaf,</div><div class='del'>-			  int slot, u64 start, u64 end)</div><div class='add'>+static bool hole_mergeable(struct btrfs_inode *inode, struct extent_buffer *leaf,</div><div class='add'>+			   int slot, u64 start, u64 end)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_file_extent_item *fi;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> </div><div class='ctx'> 	if (slot &lt; 0 || slot &gt;= btrfs_header_nritems(leaf))</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	btrfs_item_key_to_cpu(leaf, &amp;key, slot);</div><div class='ctx'> 	if (key.objectid != btrfs_ino(inode) ||</div><div class='ctx'> 	    key.type != BTRFS_EXTENT_DATA_KEY)</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	fi = btrfs_item_ptr(leaf, slot, struct btrfs_file_extent_item);</div><div class='ctx'> </div><div class='ctx'> 	if (btrfs_file_extent_type(leaf, fi) != BTRFS_FILE_EXTENT_REG)</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	if (btrfs_file_extent_disk_bytenr(leaf, fi))</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	if (key.offset == end)</div><div class='del'>-		return 1;</div><div class='add'>+		return true;</div><div class='ctx'> 	if (key.offset + btrfs_file_extent_num_bytes(leaf, fi) == start)</div><div class='del'>-		return 1;</div><div class='del'>-	return 0;</div><div class='add'>+		return true;</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int fill_holes(struct btrfs_trans_handle *trans,</div><div class='hunk'>@@ -2435,7 +2093,6 @@ static int fill_holes(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_file_extent_item *fi;</div><div class='ctx'> 	struct extent_map *hole_em;</div><div class='del'>-	struct extent_map_tree *em_tree = &amp;inode-&gt;extent_tree;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -2469,7 +2126,7 @@ static int fill_holes(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		btrfs_set_file_extent_num_bytes(leaf, fi, num_bytes);</div><div class='ctx'> 		btrfs_set_file_extent_ram_bytes(leaf, fi, num_bytes);</div><div class='ctx'> 		btrfs_set_file_extent_offset(leaf, fi, 0);</div><div class='del'>-		btrfs_mark_buffer_dirty(leaf);</div><div class='add'>+		btrfs_set_file_extent_generation(leaf, fi, trans-&gt;transid);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -2477,7 +2134,7 @@ static int fill_holes(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		u64 num_bytes;</div><div class='ctx'> </div><div class='ctx'> 		key.offset = offset;</div><div class='del'>-		btrfs_set_item_key_safe(fs_info, path, &amp;key);</div><div class='add'>+		btrfs_set_item_key_safe(trans, path, &amp;key);</div><div class='ctx'> 		fi = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='ctx'> 				    struct btrfs_file_extent_item);</div><div class='ctx'> 		num_bytes = btrfs_file_extent_num_bytes(leaf, fi) + end -</div><div class='hunk'>@@ -2485,45 +2142,36 @@ static int fill_holes(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		btrfs_set_file_extent_num_bytes(leaf, fi, num_bytes);</div><div class='ctx'> 		btrfs_set_file_extent_ram_bytes(leaf, fi, num_bytes);</div><div class='ctx'> 		btrfs_set_file_extent_offset(leaf, fi, 0);</div><div class='del'>-		btrfs_mark_buffer_dirty(leaf);</div><div class='add'>+		btrfs_set_file_extent_generation(leaf, fi, trans-&gt;transid);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_insert_file_extent(trans, root, btrfs_ino(inode),</div><div class='del'>-			offset, 0, 0, end - offset, 0, end - offset, 0, 0, 0);</div><div class='add'>+	ret = btrfs_insert_hole_extent(trans, root, btrfs_ino(inode), offset,</div><div class='add'>+				       end - offset);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='del'>-	hole_em = alloc_extent_map();</div><div class='add'>+	hole_em = btrfs_alloc_extent_map();</div><div class='ctx'> 	if (!hole_em) {</div><div class='del'>-		btrfs_drop_extent_cache(inode, offset, end - 1, 0);</div><div class='del'>-		set_bit(BTRFS_INODE_NEEDS_FULL_SYNC, &amp;inode-&gt;runtime_flags);</div><div class='add'>+		btrfs_drop_extent_map_range(inode, offset, end - 1, false);</div><div class='add'>+		btrfs_set_inode_full_sync(inode);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		hole_em-&gt;start = offset;</div><div class='ctx'> 		hole_em-&gt;len = end - offset;</div><div class='ctx'> 		hole_em-&gt;ram_bytes = hole_em-&gt;len;</div><div class='del'>-		hole_em-&gt;orig_start = offset;</div><div class='ctx'> </div><div class='del'>-		hole_em-&gt;block_start = EXTENT_MAP_HOLE;</div><div class='del'>-		hole_em-&gt;block_len = 0;</div><div class='del'>-		hole_em-&gt;orig_block_len = 0;</div><div class='del'>-		hole_em-&gt;compress_type = BTRFS_COMPRESS_NONE;</div><div class='add'>+		hole_em-&gt;disk_bytenr = EXTENT_MAP_HOLE;</div><div class='add'>+		hole_em-&gt;disk_num_bytes = 0;</div><div class='ctx'> 		hole_em-&gt;generation = trans-&gt;transid;</div><div class='ctx'> </div><div class='del'>-		do {</div><div class='del'>-			btrfs_drop_extent_cache(inode, offset, end - 1, 0);</div><div class='del'>-			write_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-			ret = add_extent_mapping(em_tree, hole_em, 1);</div><div class='del'>-			write_unlock(&amp;em_tree-&gt;lock);</div><div class='del'>-		} while (ret == -EEXIST);</div><div class='del'>-		free_extent_map(hole_em);</div><div class='add'>+		ret = btrfs_replace_extent_map_range(inode, hole_em, true);</div><div class='add'>+		btrfs_free_extent_map(hole_em);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			set_bit(BTRFS_INODE_NEEDS_FULL_SYNC,</div><div class='del'>-					&amp;inode-&gt;runtime_flags);</div><div class='add'>+			btrfs_set_inode_full_sync(inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -2541,28 +2189,46 @@ static int find_first_non_hole(struct btrfs_inode *inode, u64 *start, u64 *len)</div><div class='ctx'> 	struct extent_map *em;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	em = btrfs_get_extent(inode, NULL, 0,</div><div class='add'>+	em = btrfs_get_extent(inode, NULL,</div><div class='ctx'> 			      round_down(*start, fs_info-&gt;sectorsize),</div><div class='ctx'> 			      round_up(*len, fs_info-&gt;sectorsize));</div><div class='ctx'> 	if (IS_ERR(em))</div><div class='ctx'> 		return PTR_ERR(em);</div><div class='ctx'> </div><div class='ctx'> 	/* Hole or vacuum extent(only exists in no-hole mode) */</div><div class='del'>-	if (em-&gt;block_start == EXTENT_MAP_HOLE) {</div><div class='add'>+	if (em-&gt;disk_bytenr == EXTENT_MAP_HOLE) {</div><div class='ctx'> 		ret = 1;</div><div class='ctx'> 		*len = em-&gt;start + em-&gt;len &gt; *start + *len ?</div><div class='ctx'> 		       0 : *start + *len - em-&gt;start - em-&gt;len;</div><div class='ctx'> 		*start = em-&gt;start + em-&gt;len;</div><div class='ctx'> 	}</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btrfs_punch_hole_lock_range(struct inode *inode,</div><div class='del'>-				       const u64 lockstart,</div><div class='del'>-				       const u64 lockend,</div><div class='del'>-				       struct extent_state **cached_state)</div><div class='add'>+/*</div><div class='add'>+ * Check if there is no folio in the range.</div><div class='add'>+ *</div><div class='add'>+ * We cannot utilize filemap_range_has_page() in a filemap with large folios</div><div class='add'>+ * as we can hit the following false positive:</div><div class='add'>+ *</div><div class='add'>+ *        start                            end</div><div class='add'>+ *        |                                |</div><div class='add'>+ *  |//|//|//|//|  |  |  |  |  |  |  |  |//|//|</div><div class='add'>+ *   \         /                         \   /</div><div class='add'>+ *    Folio A                            Folio B</div><div class='add'>+ *</div><div class='add'>+ * That large folio A and B cover the start and end indexes.</div><div class='add'>+ * In that case filemap_range_has_page() will always return true, but the above</div><div class='add'>+ * case is fine for btrfs_punch_hole_lock_range() usage.</div><div class='add'>+ *</div><div class='add'>+ * So here we only ensure that no other folios is in the range, excluding the</div><div class='add'>+ * head/tail large folio.</div><div class='add'>+ */</div><div class='add'>+static bool check_range_has_page(struct inode *inode, u64 start, u64 end)</div><div class='ctx'> {</div><div class='add'>+	struct folio_batch fbatch;</div><div class='add'>+	bool ret = false;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * For subpage case, if the range is not at page boundary, we could</div><div class='ctx'> 	 * have pages at the leading/tailing part of the range.</div><div class='hunk'>@@ -2570,45 +2236,66 @@ static int btrfs_punch_hole_lock_range(struct inode *inode,</div><div class='ctx'> 	 * will always return true.</div><div class='ctx'> 	 * So here we need to do extra page alignment for</div><div class='ctx'> 	 * filemap_range_has_page().</div><div class='add'>+	 *</div><div class='add'>+	 * And do not decrease page_lockend right now, as it can be 0.</div><div class='ctx'> 	 */</div><div class='del'>-	const u64 page_lockstart = round_up(lockstart, PAGE_SIZE);</div><div class='del'>-	const u64 page_lockend = round_down(lockend + 1, PAGE_SIZE) - 1;</div><div class='add'>+	const u64 page_lockstart = round_up(start, PAGE_SIZE);</div><div class='add'>+	const u64 page_lockend = round_down(end + 1, PAGE_SIZE);</div><div class='add'>+	const pgoff_t start_index = page_lockstart &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	const pgoff_t end_index = (page_lockend - 1) &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	pgoff_t tmp = start_index;</div><div class='add'>+	int found_folios;</div><div class='add'>+</div><div class='add'>+	/* The same page or adjacent pages. */</div><div class='add'>+	if (page_lockend &lt;= page_lockstart)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	folio_batch_init(&amp;fbatch);</div><div class='add'>+	found_folios = filemap_get_folios(inode-&gt;i_mapping, &amp;tmp, end_index, &amp;fbatch);</div><div class='add'>+	for (int i = 0; i &lt; found_folios; i++) {</div><div class='add'>+		struct folio *folio = fbatch.folios[i];</div><div class='add'>+</div><div class='add'>+		/* A large folio begins before the start. Not a target. */</div><div class='add'>+		if (folio-&gt;index &lt; start_index)</div><div class='add'>+			continue;</div><div class='add'>+		/* A large folio extends beyond the end. Not a target. */</div><div class='add'>+		if (folio_next_index(folio) &gt; end_index)</div><div class='add'>+			continue;</div><div class='add'>+		/* A folio doesn't cover the head/tail index. Found a target. */</div><div class='add'>+		ret = true;</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+	folio_batch_release(&amp;fbatch);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='ctx'> </div><div class='add'>+static void btrfs_punch_hole_lock_range(struct inode *inode,</div><div class='add'>+					const u64 lockstart, const u64 lockend,</div><div class='add'>+					struct extent_state **cached_state)</div><div class='add'>+{</div><div class='ctx'> 	while (1) {</div><div class='del'>-		struct btrfs_ordered_extent *ordered;</div><div class='del'>-		int ret;</div><div class='del'>-</div><div class='ctx'> 		truncate_pagecache_range(inode, lockstart, lockend);</div><div class='ctx'> </div><div class='del'>-		lock_extent_bits(&amp;BTRFS_I(inode)-&gt;io_tree, lockstart, lockend,</div><div class='del'>-				 cached_state);</div><div class='del'>-		ordered = btrfs_lookup_first_ordered_extent(BTRFS_I(inode),</div><div class='del'>-							    lockend);</div><div class='del'>-</div><div class='add'>+		btrfs_lock_extent(&amp;BTRFS_I(inode)-&gt;io_tree, lockstart, lockend,</div><div class='add'>+				  cached_state);</div><div class='ctx'> 		/*</div><div class='del'>-		 * We need to make sure we have no ordered extents in this range</div><div class='del'>-		 * and nobody raced in and read a page in this range, if we did</div><div class='del'>-		 * we need to try again.</div><div class='add'>+		 * We can't have ordered extents in the range, nor dirty/writeback</div><div class='add'>+		 * pages, because we have locked the inode's VFS lock in exclusive</div><div class='add'>+		 * mode, we have locked the inode's i_mmap_lock in exclusive mode,</div><div class='add'>+		 * we have flushed all delalloc in the range and we have waited</div><div class='add'>+		 * for any ordered extents in the range to complete.</div><div class='add'>+		 * We can race with anyone reading pages from this range, so after</div><div class='add'>+		 * locking the range check if we have pages in the range, and if</div><div class='add'>+		 * we do, unlock the range and retry.</div><div class='ctx'> 		 */</div><div class='del'>-		if ((!ordered ||</div><div class='del'>-		    (ordered-&gt;file_offset + ordered-&gt;num_bytes &lt;= lockstart ||</div><div class='del'>-		     ordered-&gt;file_offset &gt; lockend)) &amp;&amp;</div><div class='del'>-		     !filemap_range_has_page(inode-&gt;i_mapping,</div><div class='del'>-					     page_lockstart, page_lockend)) {</div><div class='del'>-			if (ordered)</div><div class='del'>-				btrfs_put_ordered_extent(ordered);</div><div class='add'>+		if (!check_range_has_page(inode, lockstart, lockend))</div><div class='ctx'> 			break;</div><div class='del'>-		}</div><div class='del'>-		if (ordered)</div><div class='del'>-			btrfs_put_ordered_extent(ordered);</div><div class='del'>-		unlock_extent_cached(&amp;BTRFS_I(inode)-&gt;io_tree, lockstart,</div><div class='del'>-				     lockend, cached_state);</div><div class='del'>-		ret = btrfs_wait_ordered_range(inode, lockstart,</div><div class='del'>-					       lockend - lockstart + 1);</div><div class='del'>-		if (ret)</div><div class='del'>-			return ret;</div><div class='add'>+</div><div class='add'>+		btrfs_unlock_extent(&amp;BTRFS_I(inode)-&gt;io_tree, lockstart, lockend,</div><div class='add'>+				    cached_state);</div><div class='ctx'> 	}</div><div class='del'>-	return 0;</div><div class='add'>+</div><div class='add'>+	btrfs_assert_inode_range_clean(BTRFS_I(inode), lockstart, lockend);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int btrfs_insert_replace_extent(struct btrfs_trans_handle *trans,</div><div class='hunk'>@@ -2624,7 +2311,6 @@ static int btrfs_insert_replace_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	int slot;</div><div class='del'>-	struct btrfs_ref ref = { 0 };</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (replace_len == 0)</div><div class='hunk'>@@ -2654,7 +2340,6 @@ static int btrfs_insert_replace_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	btrfs_set_file_extent_num_bytes(leaf, extent, replace_len);</div><div class='ctx'> 	if (extent_info-&gt;is_new_extent)</div><div class='ctx'> 		btrfs_set_file_extent_generation(leaf, extent, trans-&gt;transid);</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_inode_set_file_extent_range(inode, extent_info-&gt;file_offset,</div><div class='hunk'>@@ -2680,14 +2365,17 @@ static int btrfs_insert_replace_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 						       extent_info-&gt;qgroup_reserved,</div><div class='ctx'> 						       &amp;key);</div><div class='ctx'> 	} else {</div><div class='add'>+		struct btrfs_ref ref = {</div><div class='add'>+			.action = BTRFS_ADD_DELAYED_REF,</div><div class='add'>+			.bytenr = extent_info-&gt;disk_offset,</div><div class='add'>+			.num_bytes = extent_info-&gt;disk_len,</div><div class='add'>+			.owning_root = btrfs_root_id(root),</div><div class='add'>+			.ref_root = btrfs_root_id(root),</div><div class='add'>+		};</div><div class='ctx'> 		u64 ref_offset;</div><div class='ctx'> </div><div class='del'>-		btrfs_init_generic_ref(&amp;ref, BTRFS_ADD_DELAYED_REF,</div><div class='del'>-				       extent_info-&gt;disk_offset,</div><div class='del'>-				       extent_info-&gt;disk_len, 0);</div><div class='ctx'> 		ref_offset = extent_info-&gt;file_offset - extent_info-&gt;data_offset;</div><div class='del'>-		btrfs_init_data_ref(&amp;ref, root-&gt;root_key.objectid,</div><div class='del'>-				    btrfs_ino(inode), ref_offset, 0, false);</div><div class='add'>+		btrfs_init_data_ref(&amp;ref, btrfs_ino(inode), ref_offset, 0, false);</div><div class='ctx'> 		ret = btrfs_inc_extent_ref(trans, &amp;ref);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -2717,7 +2405,7 @@ int btrfs_replace_file_extents(struct btrfs_inode *inode,</div><div class='ctx'> 	u64 min_size = btrfs_calc_insert_metadata_size(fs_info, 1);</div><div class='ctx'> 	u64 ino_size = round_up(inode-&gt;vfs_inode.i_size, fs_info-&gt;sectorsize);</div><div class='ctx'> 	struct btrfs_trans_handle *trans = NULL;</div><div class='del'>-	struct btrfs_block_rsv *rsv;</div><div class='add'>+	struct btrfs_block_rsv rsv;</div><div class='ctx'> 	unsigned int rsv_count;</div><div class='ctx'> 	u64 cur_offset;</div><div class='ctx'> 	u64 len = end - start;</div><div class='hunk'>@@ -2726,13 +2414,9 @@ int btrfs_replace_file_extents(struct btrfs_inode *inode,</div><div class='ctx'> 	if (end &lt;= start)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	rsv = btrfs_alloc_block_rsv(fs_info, BTRFS_BLOCK_RSV_TEMP);</div><div class='del'>-	if (!rsv) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	rsv-&gt;size = btrfs_calc_insert_metadata_size(fs_info, 1);</div><div class='del'>-	rsv-&gt;failfast = 1;</div><div class='add'>+	btrfs_init_metadata_block_rsv(fs_info, &amp;rsv, BTRFS_BLOCK_RSV_TEMP);</div><div class='add'>+	rsv.size = btrfs_calc_insert_metadata_size(fs_info, 1);</div><div class='add'>+	rsv.failfast = true;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * 1 - update the inode</div><div class='hunk'>@@ -2749,13 +2433,14 @@ int btrfs_replace_file_extents(struct btrfs_inode *inode,</div><div class='ctx'> 	if (IS_ERR(trans)) {</div><div class='ctx'> 		ret = PTR_ERR(trans);</div><div class='ctx'> 		trans = NULL;</div><div class='del'>-		goto out_free;</div><div class='add'>+		goto out_release;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_block_rsv_migrate(&amp;fs_info-&gt;trans_block_rsv, rsv,</div><div class='add'>+	ret = btrfs_block_rsv_migrate(&amp;fs_info-&gt;trans_block_rsv, &amp;rsv,</div><div class='ctx'> 				      min_size, false);</div><div class='del'>-	BUG_ON(ret);</div><div class='del'>-	trans-&gt;block_rsv = rsv;</div><div class='add'>+	if (WARN_ON(ret))</div><div class='add'>+		goto out_trans;</div><div class='add'>+	trans-&gt;block_rsv = &amp;rsv;</div><div class='ctx'> </div><div class='ctx'> 	cur_offset = start;</div><div class='ctx'> 	drop_args.path = path;</div><div class='hunk'>@@ -2777,9 +2462,9 @@ int btrfs_replace_file_extents(struct btrfs_inode *inode,</div><div class='ctx'> 			 * got EOPNOTSUPP via prealloc then we messed up and</div><div class='ctx'> 			 * need to abort.</div><div class='ctx'> 			 */</div><div class='del'>-			if (ret &amp;&amp;</div><div class='del'>-			    (ret != -EOPNOTSUPP ||</div><div class='del'>-			     (extent_info &amp;&amp; extent_info-&gt;is_new_extent)))</div><div class='add'>+			if (unlikely(ret &amp;&amp;</div><div class='add'>+				     (ret != -EOPNOTSUPP ||</div><div class='add'>+				      (extent_info &amp;&amp; extent_info-&gt;is_new_extent))))</div><div class='ctx'> 				btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2790,7 +2475,7 @@ int btrfs_replace_file_extents(struct btrfs_inode *inode,</div><div class='ctx'> 		    cur_offset &lt; ino_size) {</div><div class='ctx'> 			ret = fill_holes(trans, inode, path, cur_offset,</div><div class='ctx'> 					 drop_args.drop_end);</div><div class='del'>-			if (ret) {</div><div class='add'>+			if (unlikely(ret)) {</div><div class='ctx'> 				/*</div><div class='ctx'> 				 * If we failed then we didn't insert our hole</div><div class='ctx'> 				 * entries for the area we dropped, so now the</div><div class='hunk'>@@ -2810,7 +2495,7 @@ int btrfs_replace_file_extents(struct btrfs_inode *inode,</div><div class='ctx'> 			ret = btrfs_inode_clear_file_extent_range(inode,</div><div class='ctx'> 					cur_offset,</div><div class='ctx'> 					drop_args.drop_end - cur_offset);</div><div class='del'>-			if (ret) {</div><div class='add'>+			if (unlikely(ret)) {</div><div class='ctx'> 				/*</div><div class='ctx'> 				 * We couldn't clear our area, so we could</div><div class='ctx'> 				 * presumably adjust up and corrupt the fs, so</div><div class='hunk'>@@ -2829,7 +2514,7 @@ int btrfs_replace_file_extents(struct btrfs_inode *inode,</div><div class='ctx'> 			ret = btrfs_insert_replace_extent(trans, inode,	path,</div><div class='ctx'> 					extent_info, replace_len,</div><div class='ctx'> 					drop_args.bytes_found);</div><div class='del'>-			if (ret) {</div><div class='add'>+			if (unlikely(ret)) {</div><div class='ctx'> 				btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -2838,7 +2523,25 @@ int btrfs_replace_file_extents(struct btrfs_inode *inode,</div><div class='ctx'> 			extent_info-&gt;file_offset += replace_len;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		ret = btrfs_update_inode(trans, root, inode);</div><div class='add'>+		/*</div><div class='add'>+		 * We are releasing our handle on the transaction, balance the</div><div class='add'>+		 * dirty pages of the btree inode and flush delayed items, and</div><div class='add'>+		 * then get a new transaction handle, which may now point to a</div><div class='add'>+		 * new transaction in case someone else may have committed the</div><div class='add'>+		 * transaction we used to replace/drop file extent items. So</div><div class='add'>+		 * bump the inode's iversion and update mtime and ctime except</div><div class='add'>+		 * if we are called from a dedupe context. This is because a</div><div class='add'>+		 * power failure/crash may happen after the transaction is</div><div class='add'>+		 * committed and before we finish replacing/dropping all the</div><div class='add'>+		 * file extent items we need.</div><div class='add'>+		 */</div><div class='add'>+		inode_inc_iversion(&amp;inode-&gt;vfs_inode);</div><div class='add'>+</div><div class='add'>+		if (!extent_info || extent_info-&gt;update_times)</div><div class='add'>+			inode_set_mtime_to_ts(&amp;inode-&gt;vfs_inode,</div><div class='add'>+					      inode_set_ctime_current(&amp;inode-&gt;vfs_inode));</div><div class='add'>+</div><div class='add'>+		ret = btrfs_update_inode(trans, inode);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='hunk'>@@ -2853,9 +2556,10 @@ int btrfs_replace_file_extents(struct btrfs_inode *inode,</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		ret = btrfs_block_rsv_migrate(&amp;fs_info-&gt;trans_block_rsv,</div><div class='del'>-					      rsv, min_size, false);</div><div class='del'>-		BUG_ON(ret);	/* shouldn't happen */</div><div class='del'>-		trans-&gt;block_rsv = rsv;</div><div class='add'>+					      &amp;rsv, min_size, false);</div><div class='add'>+		if (WARN_ON(ret))</div><div class='add'>+			break;</div><div class='add'>+		trans-&gt;block_rsv = &amp;rsv;</div><div class='ctx'> </div><div class='ctx'> 		cur_offset = drop_args.drop_end;</div><div class='ctx'> 		len = end - cur_offset;</div><div class='hunk'>@@ -2877,7 +2581,7 @@ int btrfs_replace_file_extents(struct btrfs_inode *inode,</div><div class='ctx'> 	 * maps for the replacement extents (or holes).</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (extent_info &amp;&amp; !extent_info-&gt;is_new_extent)</div><div class='del'>-		set_bit(BTRFS_INODE_NEEDS_FULL_SYNC, &amp;inode-&gt;runtime_flags);</div><div class='add'>+		btrfs_set_inode_full_sync(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out_trans;</div><div class='hunk'>@@ -2905,7 +2609,7 @@ int btrfs_replace_file_extents(struct btrfs_inode *inode,</div><div class='ctx'> 	    cur_offset &lt; drop_args.drop_end) {</div><div class='ctx'> 		ret = fill_holes(trans, inode, path, cur_offset,</div><div class='ctx'> 				 drop_args.drop_end);</div><div class='del'>-		if (ret) {</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			/* Same comment as above. */</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out_trans;</div><div class='hunk'>@@ -2914,7 +2618,7 @@ int btrfs_replace_file_extents(struct btrfs_inode *inode,</div><div class='ctx'> 		/* See the comment in the loop above for the reasoning here. */</div><div class='ctx'> 		ret = btrfs_inode_clear_file_extent_range(inode, cur_offset,</div><div class='ctx'> 					drop_args.drop_end - cur_offset);</div><div class='del'>-		if (ret) {</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out_trans;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2924,7 +2628,7 @@ int btrfs_replace_file_extents(struct btrfs_inode *inode,</div><div class='ctx'> 		ret = btrfs_insert_replace_extent(trans, inode, path,</div><div class='ctx'> 				extent_info, extent_info-&gt;data_len,</div><div class='ctx'> 				drop_args.bytes_found);</div><div class='del'>-		if (ret) {</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out_trans;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2932,22 +2636,22 @@ int btrfs_replace_file_extents(struct btrfs_inode *inode,</div><div class='ctx'> </div><div class='ctx'> out_trans:</div><div class='ctx'> 	if (!trans)</div><div class='del'>-		goto out_free;</div><div class='add'>+		goto out_release;</div><div class='ctx'> </div><div class='ctx'> 	trans-&gt;block_rsv = &amp;fs_info-&gt;trans_block_rsv;</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		btrfs_end_transaction(trans);</div><div class='ctx'> 	else</div><div class='ctx'> 		*trans_out = trans;</div><div class='del'>-out_free:</div><div class='del'>-	btrfs_free_block_rsv(fs_info, rsv);</div><div class='del'>-out:</div><div class='add'>+out_release:</div><div class='add'>+	btrfs_block_rsv_release(fs_info, &amp;rsv, (u64)-1, NULL);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btrfs_punch_hole(struct inode *inode, loff_t offset, loff_t len)</div><div class='add'>+static int btrfs_punch_hole(struct file *file, loff_t offset, loff_t len)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='ctx'> 	struct extent_state *cached_state = NULL;</div><div class='ctx'> 	struct btrfs_path *path;</div><div class='hunk'>@@ -2956,18 +2660,20 @@ static int btrfs_punch_hole(struct inode *inode, loff_t offset, loff_t len)</div><div class='ctx'> 	u64 lockend;</div><div class='ctx'> 	u64 tail_start;</div><div class='ctx'> 	u64 tail_len;</div><div class='del'>-	u64 orig_start = offset;</div><div class='add'>+	const u64 orig_start = offset;</div><div class='add'>+	const u64 orig_end = offset + len - 1;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	bool same_block;</div><div class='ctx'> 	u64 ino_size;</div><div class='ctx'> 	bool truncated_block = false;</div><div class='ctx'> 	bool updated_inode = false;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_wait_ordered_range(inode, offset, len);</div><div class='add'>+	btrfs_inode_lock(BTRFS_I(inode), BTRFS_ILOCK_MMAP);</div><div class='add'>+</div><div class='add'>+	ret = btrfs_wait_ordered_range(BTRFS_I(inode), offset, len);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		return ret;</div><div class='add'>+		goto out_only_mutex;</div><div class='ctx'> </div><div class='del'>-	btrfs_inode_lock(inode, BTRFS_ILOCK_MMAP);</div><div class='ctx'> 	ino_size = round_up(inode-&gt;i_size, fs_info-&gt;sectorsize);</div><div class='ctx'> 	ret = find_first_non_hole(BTRFS_I(inode), &amp;offset, &amp;len);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='hunk'>@@ -2978,24 +2684,23 @@ static int btrfs_punch_hole(struct inode *inode, loff_t offset, loff_t len)</div><div class='ctx'> 		goto out_only_mutex;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	lockstart = round_up(offset, btrfs_inode_sectorsize(BTRFS_I(inode)));</div><div class='del'>-	lockend = round_down(offset + len,</div><div class='del'>-			     btrfs_inode_sectorsize(BTRFS_I(inode))) - 1;</div><div class='add'>+	ret = file_modified(file);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_only_mutex;</div><div class='add'>+</div><div class='add'>+	lockstart = round_up(offset, fs_info-&gt;sectorsize);</div><div class='add'>+	lockend = round_down(offset + len, fs_info-&gt;sectorsize) - 1;</div><div class='ctx'> 	same_block = (BTRFS_BYTES_TO_BLKS(fs_info, offset))</div><div class='ctx'> 		== (BTRFS_BYTES_TO_BLKS(fs_info, offset + len - 1));</div><div class='ctx'> 	/*</div><div class='del'>-	 * We needn't truncate any block which is beyond the end of the file</div><div class='del'>-	 * because we are sure there is no data there.</div><div class='del'>-	 */</div><div class='del'>-	/*</div><div class='ctx'> 	 * Only do this if we are in the same block and we aren't doing the</div><div class='ctx'> 	 * entire block.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (same_block &amp;&amp; len &lt; fs_info-&gt;sectorsize) {</div><div class='ctx'> 		if (offset &lt; ino_size) {</div><div class='ctx'> 			truncated_block = true;</div><div class='del'>-			ret = btrfs_truncate_block(BTRFS_I(inode), offset, len,</div><div class='del'>-						   0);</div><div class='add'>+			ret = btrfs_truncate_block(BTRFS_I(inode), offset + len - 1,</div><div class='add'>+						   orig_start, orig_end);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			ret = 0;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -3005,9 +2710,9 @@ static int btrfs_punch_hole(struct inode *inode, loff_t offset, loff_t len)</div><div class='ctx'> 	/* zero back part of the first block */</div><div class='ctx'> 	if (offset &lt; ino_size) {</div><div class='ctx'> 		truncated_block = true;</div><div class='del'>-		ret = btrfs_truncate_block(BTRFS_I(inode), offset, 0, 0);</div><div class='add'>+		ret = btrfs_truncate_block(BTRFS_I(inode), offset, orig_start, orig_end);</div><div class='ctx'> 		if (ret) {</div><div class='del'>-			btrfs_inode_unlock(inode, BTRFS_ILOCK_MMAP);</div><div class='add'>+			btrfs_inode_unlock(BTRFS_I(inode), BTRFS_ILOCK_MMAP);</div><div class='ctx'> 			return ret;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3042,8 +2747,8 @@ static int btrfs_punch_hole(struct inode *inode, loff_t offset, loff_t len)</div><div class='ctx'> 			if (tail_start + tail_len &lt; ino_size) {</div><div class='ctx'> 				truncated_block = true;</div><div class='ctx'> 				ret = btrfs_truncate_block(BTRFS_I(inode),</div><div class='del'>-							tail_start + tail_len,</div><div class='del'>-							0, 1);</div><div class='add'>+							tail_start + tail_len - 1,</div><div class='add'>+							orig_start, orig_end);</div><div class='ctx'> 				if (ret)</div><div class='ctx'> 					goto out_only_mutex;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -3055,10 +2760,7 @@ static int btrfs_punch_hole(struct inode *inode, loff_t offset, loff_t len)</div><div class='ctx'> 		goto out_only_mutex;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_punch_hole_lock_range(inode, lockstart, lockend,</div><div class='del'>-					  &amp;cached_state);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto out_only_mutex;</div><div class='add'>+	btrfs_punch_hole_lock_range(inode, lockstart, lockend, &amp;cached_state);</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path) {</div><div class='hunk'>@@ -3074,14 +2776,14 @@ static int btrfs_punch_hole(struct inode *inode, loff_t offset, loff_t len)</div><div class='ctx'> </div><div class='ctx'> 	ASSERT(trans != NULL);</div><div class='ctx'> 	inode_inc_iversion(inode);</div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='del'>-	ret = btrfs_update_inode(trans, root, BTRFS_I(inode));</div><div class='add'>+	inode_set_mtime_to_ts(inode, inode_set_ctime_current(inode));</div><div class='add'>+	ret = btrfs_update_inode(trans, BTRFS_I(inode));</div><div class='ctx'> 	updated_inode = true;</div><div class='ctx'> 	btrfs_end_transaction(trans);</div><div class='ctx'> 	btrfs_btree_balance_dirty(fs_info);</div><div class='ctx'> out:</div><div class='del'>-	unlock_extent_cached(&amp;BTRFS_I(inode)-&gt;io_tree, lockstart, lockend,</div><div class='del'>-			     &amp;cached_state);</div><div class='add'>+	btrfs_unlock_extent(&amp;BTRFS_I(inode)-&gt;io_tree, lockstart, lockend,</div><div class='add'>+			    &amp;cached_state);</div><div class='ctx'> out_only_mutex:</div><div class='ctx'> 	if (!updated_inode &amp;&amp; truncated_block &amp;&amp; !ret) {</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -3091,24 +2793,23 @@ out_only_mutex:</div><div class='ctx'> 		 * for detecting, at fsync time, if the inode isn't yet in the</div><div class='ctx'> 		 * log tree or it's there but not up to date.</div><div class='ctx'> 		 */</div><div class='del'>-		struct timespec64 now = current_time(inode);</div><div class='add'>+		struct timespec64 now = inode_set_ctime_current(inode);</div><div class='ctx'> </div><div class='ctx'> 		inode_inc_iversion(inode);</div><div class='del'>-		inode-&gt;i_mtime = now;</div><div class='del'>-		inode-&gt;i_ctime = now;</div><div class='add'>+		inode_set_mtime_to_ts(inode, now);</div><div class='ctx'> 		trans = btrfs_start_transaction(root, 1);</div><div class='ctx'> 		if (IS_ERR(trans)) {</div><div class='ctx'> 			ret = PTR_ERR(trans);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			int ret2;</div><div class='ctx'> </div><div class='del'>-			ret = btrfs_update_inode(trans, root, BTRFS_I(inode));</div><div class='add'>+			ret = btrfs_update_inode(trans, BTRFS_I(inode));</div><div class='ctx'> 			ret2 = btrfs_end_transaction(trans);</div><div class='ctx'> 			if (!ret)</div><div class='ctx'> 				ret = ret2;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_inode_unlock(inode, BTRFS_ILOCK_MMAP);</div><div class='add'>+	btrfs_inode_unlock(BTRFS_I(inode), BTRFS_ILOCK_MMAP);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3156,20 +2857,30 @@ static int btrfs_fallocate_update_isize(struct inode *inode,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='add'>+	u64 range_start;</div><div class='add'>+	u64 range_end;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int ret2;</div><div class='ctx'> </div><div class='ctx'> 	if (mode &amp; FALLOC_FL_KEEP_SIZE || end &lt;= i_size_read(inode))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='add'>+	range_start = round_down(i_size_read(inode), root-&gt;fs_info-&gt;sectorsize);</div><div class='add'>+	range_end = round_up(end, root-&gt;fs_info-&gt;sectorsize);</div><div class='add'>+</div><div class='add'>+	ret = btrfs_inode_set_file_extent_range(BTRFS_I(inode), range_start,</div><div class='add'>+						range_end - range_start);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='ctx'> 	trans = btrfs_start_transaction(root, 1);</div><div class='ctx'> 	if (IS_ERR(trans))</div><div class='ctx'> 		return PTR_ERR(trans);</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> 	i_size_write(inode, end);</div><div class='ctx'> 	btrfs_inode_safe_disk_i_size_write(BTRFS_I(inode), 0);</div><div class='del'>-	ret = btrfs_update_inode(trans, root, BTRFS_I(inode));</div><div class='add'>+	ret = btrfs_update_inode(trans, BTRFS_I(inode));</div><div class='ctx'> 	ret2 = btrfs_end_transaction(trans);</div><div class='ctx'> </div><div class='ctx'> 	return ret ? ret : ret2;</div><div class='hunk'>@@ -3184,23 +2895,23 @@ enum {</div><div class='ctx'> static int btrfs_zero_range_check_range_boundary(struct btrfs_inode *inode,</div><div class='ctx'> 						 u64 offset)</div><div class='ctx'> {</div><div class='del'>-	const u64 sectorsize = btrfs_inode_sectorsize(inode);</div><div class='add'>+	const u64 sectorsize = inode-&gt;root-&gt;fs_info-&gt;sectorsize;</div><div class='ctx'> 	struct extent_map *em;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	offset = round_down(offset, sectorsize);</div><div class='del'>-	em = btrfs_get_extent(inode, NULL, 0, offset, sectorsize);</div><div class='add'>+	em = btrfs_get_extent(inode, NULL, offset, sectorsize);</div><div class='ctx'> 	if (IS_ERR(em))</div><div class='ctx'> 		return PTR_ERR(em);</div><div class='ctx'> </div><div class='del'>-	if (em-&gt;block_start == EXTENT_MAP_HOLE)</div><div class='add'>+	if (em-&gt;disk_bytenr == EXTENT_MAP_HOLE)</div><div class='ctx'> 		ret = RANGE_BOUNDARY_HOLE;</div><div class='del'>-	else if (test_bit(EXTENT_FLAG_PREALLOC, &amp;em-&gt;flags))</div><div class='add'>+	else if (em-&gt;flags &amp; EXTENT_FLAG_PREALLOC)</div><div class='ctx'> 		ret = RANGE_BOUNDARY_PREALLOC_EXTENT;</div><div class='ctx'> 	else</div><div class='ctx'> 		ret = RANGE_BOUNDARY_WRITTEN_EXTENT;</div><div class='ctx'> </div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3214,15 +2925,15 @@ static int btrfs_zero_range(struct inode *inode,</div><div class='ctx'> 	struct extent_changeset *data_reserved = NULL;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	u64 alloc_hint = 0;</div><div class='del'>-	const u64 sectorsize = btrfs_inode_sectorsize(BTRFS_I(inode));</div><div class='add'>+	const u64 sectorsize = fs_info-&gt;sectorsize;</div><div class='add'>+	const u64 orig_start = offset;</div><div class='add'>+	const u64 orig_end = offset + len - 1;</div><div class='ctx'> 	u64 alloc_start = round_down(offset, sectorsize);</div><div class='ctx'> 	u64 alloc_end = round_up(offset + len, sectorsize);</div><div class='ctx'> 	u64 bytes_to_reserve = 0;</div><div class='ctx'> 	bool space_reserved = false;</div><div class='ctx'> </div><div class='del'>-	inode_dio_wait(inode);</div><div class='del'>-</div><div class='del'>-	em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, alloc_start,</div><div class='add'>+	em = btrfs_get_extent(BTRFS_I(inode), NULL, alloc_start,</div><div class='ctx'> 			      alloc_end - alloc_start);</div><div class='ctx'> 	if (IS_ERR(em)) {</div><div class='ctx'> 		ret = PTR_ERR(em);</div><div class='hunk'>@@ -3237,8 +2948,7 @@ static int btrfs_zero_range(struct inode *inode,</div><div class='ctx'> 	 * extents and holes, we drop all the existing extents and allocate a</div><div class='ctx'> 	 * new prealloc extent, so that we get a larger contiguous disk extent.</div><div class='ctx'> 	 */</div><div class='del'>-	if (em-&gt;start &lt;= alloc_start &amp;&amp;</div><div class='del'>-	    test_bit(EXTENT_FLAG_PREALLOC, &amp;em-&gt;flags)) {</div><div class='add'>+	if (em-&gt;start &lt;= alloc_start &amp;&amp; (em-&gt;flags &amp; EXTENT_FLAG_PREALLOC)) {</div><div class='ctx'> 		const u64 em_end = em-&gt;start + em-&gt;len;</div><div class='ctx'> </div><div class='ctx'> 		if (em_end &gt;= offset + len) {</div><div class='hunk'>@@ -3247,7 +2957,7 @@ static int btrfs_zero_range(struct inode *inode,</div><div class='ctx'> 			 * do nothing except updating the inode's i_size if</div><div class='ctx'> 			 * needed.</div><div class='ctx'> 			 */</div><div class='del'>-			free_extent_map(em);</div><div class='add'>+			btrfs_free_extent_map(em);</div><div class='ctx'> 			ret = btrfs_fallocate_update_isize(inode, offset + len,</div><div class='ctx'> 							   mode);</div><div class='ctx'> 			goto out;</div><div class='hunk'>@@ -3260,36 +2970,35 @@ static int btrfs_zero_range(struct inode *inode,</div><div class='ctx'> 		ASSERT(IS_ALIGNED(alloc_start, sectorsize));</div><div class='ctx'> 		len = offset + len - alloc_start;</div><div class='ctx'> 		offset = alloc_start;</div><div class='del'>-		alloc_hint = em-&gt;block_start + em-&gt;len;</div><div class='add'>+		alloc_hint = btrfs_extent_map_block_start(em) + em-&gt;len;</div><div class='ctx'> 	}</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='ctx'> 	if (BTRFS_BYTES_TO_BLKS(fs_info, offset) ==</div><div class='ctx'> 	    BTRFS_BYTES_TO_BLKS(fs_info, offset + len - 1)) {</div><div class='del'>-		em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, alloc_start,</div><div class='del'>-				      sectorsize);</div><div class='add'>+		em = btrfs_get_extent(BTRFS_I(inode), NULL, alloc_start, sectorsize);</div><div class='ctx'> 		if (IS_ERR(em)) {</div><div class='ctx'> 			ret = PTR_ERR(em);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (test_bit(EXTENT_FLAG_PREALLOC, &amp;em-&gt;flags)) {</div><div class='del'>-			free_extent_map(em);</div><div class='add'>+		if (em-&gt;flags &amp; EXTENT_FLAG_PREALLOC) {</div><div class='add'>+			btrfs_free_extent_map(em);</div><div class='ctx'> 			ret = btrfs_fallocate_update_isize(inode, offset + len,</div><div class='ctx'> 							   mode);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='del'>-		if (len &lt; sectorsize &amp;&amp; em-&gt;block_start != EXTENT_MAP_HOLE) {</div><div class='del'>-			free_extent_map(em);</div><div class='del'>-			ret = btrfs_truncate_block(BTRFS_I(inode), offset, len,</div><div class='del'>-						   0);</div><div class='add'>+		if (len &lt; sectorsize &amp;&amp; em-&gt;disk_bytenr != EXTENT_MAP_HOLE) {</div><div class='add'>+			btrfs_free_extent_map(em);</div><div class='add'>+			ret = btrfs_truncate_block(BTRFS_I(inode), offset + len - 1,</div><div class='add'>+						   orig_start, orig_end);</div><div class='ctx'> 			if (!ret)</div><div class='ctx'> 				ret = btrfs_fallocate_update_isize(inode,</div><div class='ctx'> 								   offset + len,</div><div class='ctx'> 								   mode);</div><div class='ctx'> 			return ret;</div><div class='ctx'> 		}</div><div class='del'>-		free_extent_map(em);</div><div class='add'>+		btrfs_free_extent_map(em);</div><div class='ctx'> 		alloc_start = round_down(offset, sectorsize);</div><div class='ctx'> 		alloc_end = alloc_start + sectorsize;</div><div class='ctx'> 		goto reserve_space;</div><div class='hunk'>@@ -3313,7 +3022,8 @@ static int btrfs_zero_range(struct inode *inode,</div><div class='ctx'> 			alloc_start = round_down(offset, sectorsize);</div><div class='ctx'> 			ret = 0;</div><div class='ctx'> 		} else if (ret == RANGE_BOUNDARY_WRITTEN_EXTENT) {</div><div class='del'>-			ret = btrfs_truncate_block(BTRFS_I(inode), offset, 0, 0);</div><div class='add'>+			ret = btrfs_truncate_block(BTRFS_I(inode), offset,</div><div class='add'>+						   orig_start, orig_end);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				goto out;</div><div class='ctx'> 		} else {</div><div class='hunk'>@@ -3330,8 +3040,8 @@ static int btrfs_zero_range(struct inode *inode,</div><div class='ctx'> 			alloc_end = round_up(offset + len, sectorsize);</div><div class='ctx'> 			ret = 0;</div><div class='ctx'> 		} else if (ret == RANGE_BOUNDARY_WRITTEN_EXTENT) {</div><div class='del'>-			ret = btrfs_truncate_block(BTRFS_I(inode), offset + len,</div><div class='del'>-						   0, 1);</div><div class='add'>+			ret = btrfs_truncate_block(BTRFS_I(inode), offset + len - 1,</div><div class='add'>+						   orig_start, orig_end);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				goto out;</div><div class='ctx'> 		} else {</div><div class='hunk'>@@ -3351,23 +3061,21 @@ reserve_space:</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		space_reserved = true;</div><div class='del'>-		ret = btrfs_punch_hole_lock_range(inode, lockstart, lockend,</div><div class='del'>-						  &amp;cached_state);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto out;</div><div class='add'>+		btrfs_punch_hole_lock_range(inode, lockstart, lockend,</div><div class='add'>+					    &amp;cached_state);</div><div class='ctx'> 		ret = btrfs_qgroup_reserve_data(BTRFS_I(inode), &amp;data_reserved,</div><div class='ctx'> 						alloc_start, bytes_to_reserve);</div><div class='ctx'> 		if (ret) {</div><div class='del'>-			unlock_extent_cached(&amp;BTRFS_I(inode)-&gt;io_tree, lockstart,</div><div class='del'>-					     lockend, &amp;cached_state);</div><div class='add'>+			btrfs_unlock_extent(&amp;BTRFS_I(inode)-&gt;io_tree, lockstart,</div><div class='add'>+					    lockend, &amp;cached_state);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 		ret = btrfs_prealloc_file_range(inode, mode, alloc_start,</div><div class='ctx'> 						alloc_end - alloc_start,</div><div class='del'>-						i_blocksize(inode),</div><div class='add'>+						fs_info-&gt;sectorsize,</div><div class='ctx'> 						offset + len, &amp;alloc_hint);</div><div class='del'>-		unlock_extent_cached(&amp;BTRFS_I(inode)-&gt;io_tree, lockstart,</div><div class='del'>-				     lockend, &amp;cached_state);</div><div class='add'>+		btrfs_unlock_extent(&amp;BTRFS_I(inode)-&gt;io_tree, lockstart, lockend,</div><div class='add'>+				    &amp;cached_state);</div><div class='ctx'> 		/* btrfs_prealloc_file_range releases reserved space on error */</div><div class='ctx'> 		if (ret) {</div><div class='ctx'> 			space_reserved = false;</div><div class='hunk'>@@ -3392,7 +3100,7 @@ static long btrfs_fallocate(struct file *file, int mode,</div><div class='ctx'> 	struct extent_changeset *data_reserved = NULL;</div><div class='ctx'> 	struct falloc_range *range;</div><div class='ctx'> 	struct falloc_range *tmp;</div><div class='del'>-	struct list_head reserve_list;</div><div class='add'>+	LIST_HEAD(reserve_list);</div><div class='ctx'> 	u64 cur_offset;</div><div class='ctx'> 	u64 last_byte;</div><div class='ctx'> 	u64 alloc_start;</div><div class='hunk'>@@ -3400,12 +3108,18 @@ static long btrfs_fallocate(struct file *file, int mode,</div><div class='ctx'> 	u64 alloc_hint = 0;</div><div class='ctx'> 	u64 locked_end;</div><div class='ctx'> 	u64 actual_end = 0;</div><div class='add'>+	u64 data_space_needed = 0;</div><div class='add'>+	u64 data_space_reserved = 0;</div><div class='add'>+	u64 qgroup_reserved = 0;</div><div class='ctx'> 	struct extent_map *em;</div><div class='del'>-	int blocksize = btrfs_inode_sectorsize(BTRFS_I(inode));</div><div class='add'>+	int blocksize = BTRFS_I(inode)-&gt;root-&gt;fs_info-&gt;sectorsize;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='add'>+	if (unlikely(btrfs_is_shutdown(inode_to_fs_info(inode))))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='ctx'> 	/* Do not allow fallocate in ZONED mode */</div><div class='del'>-	if (btrfs_is_zoned(btrfs_sb(inode-&gt;i_sb)))</div><div class='add'>+	if (btrfs_is_zoned(inode_to_fs_info(inode)))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='ctx'> 	alloc_start = round_down(offset, blocksize);</div><div class='hunk'>@@ -3418,21 +3132,9 @@ static long btrfs_fallocate(struct file *file, int mode,</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='ctx'> 	if (mode &amp; FALLOC_FL_PUNCH_HOLE)</div><div class='del'>-		return btrfs_punch_hole(inode, offset, len);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Only trigger disk allocation, don't trigger qgroup reserve</div><div class='del'>-	 *</div><div class='del'>-	 * For qgroup space, it will be checked later.</div><div class='del'>-	 */</div><div class='del'>-	if (!(mode &amp; FALLOC_FL_ZERO_RANGE)) {</div><div class='del'>-		ret = btrfs_alloc_data_chunk_ondemand(BTRFS_I(inode),</div><div class='del'>-						      alloc_end - alloc_start);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			return ret;</div><div class='del'>-	}</div><div class='add'>+		return btrfs_punch_hole(file, offset, len);</div><div class='ctx'> </div><div class='del'>-	btrfs_inode_lock(inode, BTRFS_ILOCK_MMAP);</div><div class='add'>+	btrfs_inode_lock(BTRFS_I(inode), BTRFS_ILOCK_MMAP);</div><div class='ctx'> </div><div class='ctx'> 	if (!(mode &amp; FALLOC_FL_KEEP_SIZE) &amp;&amp; offset + len &gt; inode-&gt;i_size) {</div><div class='ctx'> 		ret = inode_newsize_ok(inode, offset + len);</div><div class='hunk'>@@ -3440,6 +3142,10 @@ static long btrfs_fallocate(struct file *file, int mode,</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	ret = file_modified(file);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * TODO: Move these two operations after we have checked</div><div class='ctx'> 	 * accurate reserved space, or fallocate can still fail but</div><div class='hunk'>@@ -3458,117 +3164,109 @@ static long btrfs_fallocate(struct file *file, int mode,</div><div class='ctx'> 		 * need to zero out the end of the block if i_size lands in the</div><div class='ctx'> 		 * middle of a block.</div><div class='ctx'> 		 */</div><div class='del'>-		ret = btrfs_truncate_block(BTRFS_I(inode), inode-&gt;i_size, 0, 0);</div><div class='add'>+		ret = btrfs_truncate_block(BTRFS_I(inode), inode-&gt;i_size,</div><div class='add'>+					   inode-&gt;i_size, (u64)-1);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * wait for ordered IO before we have any locks.  We'll loop again</div><div class='del'>-	 * below with the locks held.</div><div class='add'>+	 * We have locked the inode at the VFS level (in exclusive mode) and we</div><div class='add'>+	 * have locked the i_mmap_lock lock (in exclusive mode). Now before</div><div class='add'>+	 * locking the file range, flush all dealloc in the range and wait for</div><div class='add'>+	 * all ordered extents in the range to complete. After this we can lock</div><div class='add'>+	 * the file range and, due to the previous locking we did, we know there</div><div class='add'>+	 * can't be more delalloc or ordered extents in the range.</div><div class='ctx'> 	 */</div><div class='del'>-	ret = btrfs_wait_ordered_range(inode, alloc_start,</div><div class='add'>+	ret = btrfs_wait_ordered_range(BTRFS_I(inode), alloc_start,</div><div class='ctx'> 				       alloc_end - alloc_start);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	if (mode &amp; FALLOC_FL_ZERO_RANGE) {</div><div class='ctx'> 		ret = btrfs_zero_range(inode, offset, len, mode);</div><div class='del'>-		btrfs_inode_unlock(inode, BTRFS_ILOCK_MMAP);</div><div class='add'>+		btrfs_inode_unlock(BTRFS_I(inode), BTRFS_ILOCK_MMAP);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	locked_end = alloc_end - 1;</div><div class='del'>-	while (1) {</div><div class='del'>-		struct btrfs_ordered_extent *ordered;</div><div class='add'>+	btrfs_lock_extent(&amp;BTRFS_I(inode)-&gt;io_tree, alloc_start, locked_end,</div><div class='add'>+			  &amp;cached_state);</div><div class='ctx'> </div><div class='del'>-		/* the extent lock is ordered inside the running</div><div class='del'>-		 * transaction</div><div class='del'>-		 */</div><div class='del'>-		lock_extent_bits(&amp;BTRFS_I(inode)-&gt;io_tree, alloc_start,</div><div class='del'>-				 locked_end, &amp;cached_state);</div><div class='del'>-		ordered = btrfs_lookup_first_ordered_extent(BTRFS_I(inode),</div><div class='del'>-							    locked_end);</div><div class='del'>-</div><div class='del'>-		if (ordered &amp;&amp;</div><div class='del'>-		    ordered-&gt;file_offset + ordered-&gt;num_bytes &gt; alloc_start &amp;&amp;</div><div class='del'>-		    ordered-&gt;file_offset &lt; alloc_end) {</div><div class='del'>-			btrfs_put_ordered_extent(ordered);</div><div class='del'>-			unlock_extent_cached(&amp;BTRFS_I(inode)-&gt;io_tree,</div><div class='del'>-					     alloc_start, locked_end,</div><div class='del'>-					     &amp;cached_state);</div><div class='del'>-			/*</div><div class='del'>-			 * we can't wait on the range with the transaction</div><div class='del'>-			 * running or with the extent lock held</div><div class='del'>-			 */</div><div class='del'>-			ret = btrfs_wait_ordered_range(inode, alloc_start,</div><div class='del'>-						       alloc_end - alloc_start);</div><div class='del'>-			if (ret)</div><div class='del'>-				goto out;</div><div class='del'>-		} else {</div><div class='del'>-			if (ordered)</div><div class='del'>-				btrfs_put_ordered_extent(ordered);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	btrfs_assert_inode_range_clean(BTRFS_I(inode), alloc_start, locked_end);</div><div class='ctx'> </div><div class='ctx'> 	/* First, check if we exceed the qgroup limit */</div><div class='del'>-	INIT_LIST_HEAD(&amp;reserve_list);</div><div class='ctx'> 	while (cur_offset &lt; alloc_end) {</div><div class='del'>-		em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, cur_offset,</div><div class='add'>+		em = btrfs_get_extent(BTRFS_I(inode), NULL, cur_offset,</div><div class='ctx'> 				      alloc_end - cur_offset);</div><div class='ctx'> 		if (IS_ERR(em)) {</div><div class='ctx'> 			ret = PTR_ERR(em);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-		last_byte = min(extent_map_end(em), alloc_end);</div><div class='del'>-		actual_end = min_t(u64, extent_map_end(em), offset + len);</div><div class='add'>+		last_byte = min(btrfs_extent_map_end(em), alloc_end);</div><div class='add'>+		actual_end = min_t(u64, btrfs_extent_map_end(em), offset + len);</div><div class='ctx'> 		last_byte = ALIGN(last_byte, blocksize);</div><div class='del'>-		if (em-&gt;block_start == EXTENT_MAP_HOLE ||</div><div class='add'>+		if (em-&gt;disk_bytenr == EXTENT_MAP_HOLE ||</div><div class='ctx'> 		    (cur_offset &gt;= inode-&gt;i_size &amp;&amp;</div><div class='del'>-		     !test_bit(EXTENT_FLAG_PREALLOC, &amp;em-&gt;flags))) {</div><div class='del'>-			ret = add_falloc_range(&amp;reserve_list, cur_offset,</div><div class='del'>-					       last_byte - cur_offset);</div><div class='add'>+		     !(em-&gt;flags &amp; EXTENT_FLAG_PREALLOC))) {</div><div class='add'>+			const u64 range_len = last_byte - cur_offset;</div><div class='add'>+</div><div class='add'>+			ret = add_falloc_range(&amp;reserve_list, cur_offset, range_len);</div><div class='ctx'> 			if (ret &lt; 0) {</div><div class='del'>-				free_extent_map(em);</div><div class='add'>+				btrfs_free_extent_map(em);</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> 			ret = btrfs_qgroup_reserve_data(BTRFS_I(inode),</div><div class='del'>-					&amp;data_reserved, cur_offset,</div><div class='del'>-					last_byte - cur_offset);</div><div class='add'>+					&amp;data_reserved, cur_offset, range_len);</div><div class='ctx'> 			if (ret &lt; 0) {</div><div class='del'>-				cur_offset = last_byte;</div><div class='del'>-				free_extent_map(em);</div><div class='add'>+				btrfs_free_extent_map(em);</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='del'>-		} else {</div><div class='del'>-			/*</div><div class='del'>-			 * Do not need to reserve unwritten extent for this</div><div class='del'>-			 * range, free reserved data space first, otherwise</div><div class='del'>-			 * it'll result in false ENOSPC error.</div><div class='del'>-			 */</div><div class='del'>-			btrfs_free_reserved_data_space(BTRFS_I(inode),</div><div class='del'>-				data_reserved, cur_offset,</div><div class='del'>-				last_byte - cur_offset);</div><div class='add'>+			qgroup_reserved += range_len;</div><div class='add'>+			data_space_needed += range_len;</div><div class='ctx'> 		}</div><div class='del'>-		free_extent_map(em);</div><div class='add'>+		btrfs_free_extent_map(em);</div><div class='ctx'> 		cur_offset = last_byte;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (!ret &amp;&amp; data_space_needed &gt; 0) {</div><div class='add'>+		/*</div><div class='add'>+		 * We are safe to reserve space here as we can't have delalloc</div><div class='add'>+		 * in the range, see above.</div><div class='add'>+		 */</div><div class='add'>+		ret = btrfs_alloc_data_chunk_ondemand(BTRFS_I(inode),</div><div class='add'>+						      data_space_needed);</div><div class='add'>+		if (!ret)</div><div class='add'>+			data_space_reserved = data_space_needed;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If ret is still 0, means we're OK to fallocate.</div><div class='ctx'> 	 * Or just cleanup the list and exit.</div><div class='ctx'> 	 */</div><div class='ctx'> 	list_for_each_entry_safe(range, tmp, &amp;reserve_list, list) {</div><div class='del'>-		if (!ret)</div><div class='add'>+		if (!ret) {</div><div class='ctx'> 			ret = btrfs_prealloc_file_range(inode, mode,</div><div class='ctx'> 					range-&gt;start,</div><div class='del'>-					range-&gt;len, i_blocksize(inode),</div><div class='add'>+					range-&gt;len, blocksize,</div><div class='ctx'> 					offset + len, &amp;alloc_hint);</div><div class='del'>-		else</div><div class='add'>+			/*</div><div class='add'>+			 * btrfs_prealloc_file_range() releases space even</div><div class='add'>+			 * if it returns an error.</div><div class='add'>+			 */</div><div class='add'>+			data_space_reserved -= range-&gt;len;</div><div class='add'>+			qgroup_reserved -= range-&gt;len;</div><div class='add'>+		} else if (data_space_reserved &gt; 0) {</div><div class='ctx'> 			btrfs_free_reserved_data_space(BTRFS_I(inode),</div><div class='del'>-					data_reserved, range-&gt;start,</div><div class='del'>-					range-&gt;len);</div><div class='add'>+					       data_reserved, range-&gt;start,</div><div class='add'>+					       range-&gt;len);</div><div class='add'>+			data_space_reserved -= range-&gt;len;</div><div class='add'>+			qgroup_reserved -= range-&gt;len;</div><div class='add'>+		} else if (qgroup_reserved &gt; 0) {</div><div class='add'>+			btrfs_qgroup_free_data(BTRFS_I(inode), data_reserved,</div><div class='add'>+					       range-&gt;start, range-&gt;len, NULL);</div><div class='add'>+			qgroup_reserved -= range-&gt;len;</div><div class='add'>+		}</div><div class='ctx'> 		list_del(&amp;range-&gt;list);</div><div class='ctx'> 		kfree(range);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3581,35 +3279,331 @@ static long btrfs_fallocate(struct file *file, int mode,</div><div class='ctx'> 	 */</div><div class='ctx'> 	ret = btrfs_fallocate_update_isize(inode, actual_end, mode);</div><div class='ctx'> out_unlock:</div><div class='del'>-	unlock_extent_cached(&amp;BTRFS_I(inode)-&gt;io_tree, alloc_start, locked_end,</div><div class='del'>-			     &amp;cached_state);</div><div class='add'>+	btrfs_unlock_extent(&amp;BTRFS_I(inode)-&gt;io_tree, alloc_start, locked_end,</div><div class='add'>+			    &amp;cached_state);</div><div class='ctx'> out:</div><div class='del'>-	btrfs_inode_unlock(inode, BTRFS_ILOCK_MMAP);</div><div class='del'>-	/* Let go of our reservation. */</div><div class='del'>-	if (ret != 0 &amp;&amp; !(mode &amp; FALLOC_FL_ZERO_RANGE))</div><div class='del'>-		btrfs_free_reserved_data_space(BTRFS_I(inode), data_reserved,</div><div class='del'>-				cur_offset, alloc_end - cur_offset);</div><div class='add'>+	btrfs_inode_unlock(BTRFS_I(inode), BTRFS_ILOCK_MMAP);</div><div class='ctx'> 	extent_changeset_free(data_reserved);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static loff_t find_desired_extent(struct btrfs_inode *inode, loff_t offset,</div><div class='del'>-				  int whence)</div><div class='add'>+/*</div><div class='add'>+ * Helper for btrfs_find_delalloc_in_range(). Find a subrange in a given range</div><div class='add'>+ * that has unflushed and/or flushing delalloc. There might be other adjacent</div><div class='add'>+ * subranges after the one it found, so btrfs_find_delalloc_in_range() keeps</div><div class='add'>+ * looping while it gets adjacent subranges, and merging them together.</div><div class='add'>+ */</div><div class='add'>+static bool find_delalloc_subrange(struct btrfs_inode *inode, u64 start, u64 end,</div><div class='add'>+				   struct extent_state **cached_state,</div><div class='add'>+				   bool *search_io_tree,</div><div class='add'>+				   u64 *delalloc_start_ret, u64 *delalloc_end_ret)</div><div class='ctx'> {</div><div class='add'>+	u64 len = end + 1 - start;</div><div class='add'>+	u64 delalloc_len = 0;</div><div class='add'>+	struct btrfs_ordered_extent *oe;</div><div class='add'>+	u64 oe_start;</div><div class='add'>+	u64 oe_end;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Search the io tree first for EXTENT_DELALLOC. If we find any, it</div><div class='add'>+	 * means we have delalloc (dirty pages) for which writeback has not</div><div class='add'>+	 * started yet.</div><div class='add'>+	 */</div><div class='add'>+	if (*search_io_tree) {</div><div class='add'>+		spin_lock(&amp;inode-&gt;lock);</div><div class='add'>+		if (inode-&gt;delalloc_bytes &gt; 0) {</div><div class='add'>+			spin_unlock(&amp;inode-&gt;lock);</div><div class='add'>+			*delalloc_start_ret = start;</div><div class='add'>+			delalloc_len = btrfs_count_range_bits(&amp;inode-&gt;io_tree,</div><div class='add'>+							      delalloc_start_ret, end,</div><div class='add'>+							      len, EXTENT_DELALLOC, 1,</div><div class='add'>+							      cached_state);</div><div class='add'>+		} else {</div><div class='add'>+			spin_unlock(&amp;inode-&gt;lock);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (delalloc_len &gt; 0) {</div><div class='add'>+		/*</div><div class='add'>+		 * If delalloc was found then *delalloc_start_ret has a sector size</div><div class='add'>+		 * aligned value (rounded down).</div><div class='add'>+		 */</div><div class='add'>+		*delalloc_end_ret = *delalloc_start_ret + delalloc_len - 1;</div><div class='add'>+</div><div class='add'>+		if (*delalloc_start_ret == start) {</div><div class='add'>+			/* Delalloc for the whole range, nothing more to do. */</div><div class='add'>+			if (*delalloc_end_ret == end)</div><div class='add'>+				return true;</div><div class='add'>+			/* Else trim our search range for ordered extents. */</div><div class='add'>+			start = *delalloc_end_ret + 1;</div><div class='add'>+			len = end + 1 - start;</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		/* No delalloc, future calls don't need to search again. */</div><div class='add'>+		*search_io_tree = false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Now also check if there's any ordered extent in the range.</div><div class='add'>+	 * We do this because:</div><div class='add'>+	 *</div><div class='add'>+	 * 1) When delalloc is flushed, the file range is locked, we clear the</div><div class='add'>+	 *    EXTENT_DELALLOC bit from the io tree and create an extent map and</div><div class='add'>+	 *    an ordered extent for the write. So we might just have been called</div><div class='add'>+	 *    after delalloc is flushed and before the ordered extent completes</div><div class='add'>+	 *    and inserts the new file extent item in the subvolume's btree;</div><div class='add'>+	 *</div><div class='add'>+	 * 2) We may have an ordered extent created by flushing delalloc for a</div><div class='add'>+	 *    subrange that starts before the subrange we found marked with</div><div class='add'>+	 *    EXTENT_DELALLOC in the io tree.</div><div class='add'>+	 *</div><div class='add'>+	 * We could also use the extent map tree to find such delalloc that is</div><div class='add'>+	 * being flushed, but using the ordered extents tree is more efficient</div><div class='add'>+	 * because it's usually much smaller as ordered extents are removed from</div><div class='add'>+	 * the tree once they complete. With the extent maps, we may have them</div><div class='add'>+	 * in the extent map tree for a very long time, and they were either</div><div class='add'>+	 * created by previous writes or loaded by read operations.</div><div class='add'>+	 */</div><div class='add'>+	oe = btrfs_lookup_first_ordered_range(inode, start, len);</div><div class='add'>+	if (!oe)</div><div class='add'>+		return (delalloc_len &gt; 0);</div><div class='add'>+</div><div class='add'>+	/* The ordered extent may span beyond our search range. */</div><div class='add'>+	oe_start = max(oe-&gt;file_offset, start);</div><div class='add'>+	oe_end = min(oe-&gt;file_offset + oe-&gt;num_bytes - 1, end);</div><div class='add'>+</div><div class='add'>+	btrfs_put_ordered_extent(oe);</div><div class='add'>+</div><div class='add'>+	/* Don't have unflushed delalloc, return the ordered extent range. */</div><div class='add'>+	if (delalloc_len == 0) {</div><div class='add'>+		*delalloc_start_ret = oe_start;</div><div class='add'>+		*delalloc_end_ret = oe_end;</div><div class='add'>+		return true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We have both unflushed delalloc (io_tree) and an ordered extent.</div><div class='add'>+	 * If the ranges are adjacent returned a combined range, otherwise</div><div class='add'>+	 * return the leftmost range.</div><div class='add'>+	 */</div><div class='add'>+	if (oe_start &lt; *delalloc_start_ret) {</div><div class='add'>+		if (oe_end &lt; *delalloc_start_ret)</div><div class='add'>+			*delalloc_end_ret = oe_end;</div><div class='add'>+		*delalloc_start_ret = oe_start;</div><div class='add'>+	} else if (*delalloc_end_ret + 1 == oe_start) {</div><div class='add'>+		*delalloc_end_ret = oe_end;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Check if there's delalloc in a given range.</div><div class='add'>+ *</div><div class='add'>+ * @inode:               The inode.</div><div class='add'>+ * @start:               The start offset of the range. It does not need to be</div><div class='add'>+ *                       sector size aligned.</div><div class='add'>+ * @end:                 The end offset (inclusive value) of the search range.</div><div class='add'>+ *                       It does not need to be sector size aligned.</div><div class='add'>+ * @cached_state:        Extent state record used for speeding up delalloc</div><div class='add'>+ *                       searches in the inode's io_tree. Can be NULL.</div><div class='add'>+ * @delalloc_start_ret:  Output argument, set to the start offset of the</div><div class='add'>+ *                       subrange found with delalloc (may not be sector size</div><div class='add'>+ *                       aligned).</div><div class='add'>+ * @delalloc_end_ret:    Output argument, set to he end offset (inclusive value)</div><div class='add'>+ *                       of the subrange found with delalloc.</div><div class='add'>+ *</div><div class='add'>+ * Returns true if a subrange with delalloc is found within the given range, and</div><div class='add'>+ * if so it sets @delalloc_start_ret and @delalloc_end_ret with the start and</div><div class='add'>+ * end offsets of the subrange.</div><div class='add'>+ */</div><div class='add'>+bool btrfs_find_delalloc_in_range(struct btrfs_inode *inode, u64 start, u64 end,</div><div class='add'>+				  struct extent_state **cached_state,</div><div class='add'>+				  u64 *delalloc_start_ret, u64 *delalloc_end_ret)</div><div class='add'>+{</div><div class='add'>+	u64 cur_offset = round_down(start, inode-&gt;root-&gt;fs_info-&gt;sectorsize);</div><div class='add'>+	u64 prev_delalloc_end = 0;</div><div class='add'>+	bool search_io_tree = true;</div><div class='add'>+	bool ret = false;</div><div class='add'>+</div><div class='add'>+	while (cur_offset &lt;= end) {</div><div class='add'>+		u64 delalloc_start;</div><div class='add'>+		u64 delalloc_end;</div><div class='add'>+		bool delalloc;</div><div class='add'>+</div><div class='add'>+		delalloc = find_delalloc_subrange(inode, cur_offset, end,</div><div class='add'>+						  cached_state, &amp;search_io_tree,</div><div class='add'>+						  &amp;delalloc_start,</div><div class='add'>+						  &amp;delalloc_end);</div><div class='add'>+		if (!delalloc)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		if (prev_delalloc_end == 0) {</div><div class='add'>+			/* First subrange found. */</div><div class='add'>+			*delalloc_start_ret = max(delalloc_start, start);</div><div class='add'>+			*delalloc_end_ret = delalloc_end;</div><div class='add'>+			ret = true;</div><div class='add'>+		} else if (delalloc_start == prev_delalloc_end + 1) {</div><div class='add'>+			/* Subrange adjacent to the previous one, merge them. */</div><div class='add'>+			*delalloc_end_ret = delalloc_end;</div><div class='add'>+		} else {</div><div class='add'>+			/* Subrange not adjacent to the previous one, exit. */</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		prev_delalloc_end = delalloc_end;</div><div class='add'>+		cur_offset = delalloc_end + 1;</div><div class='add'>+		cond_resched();</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Check if there's a hole or delalloc range in a range representing a hole (or</div><div class='add'>+ * prealloc extent) found in the inode's subvolume btree.</div><div class='add'>+ *</div><div class='add'>+ * @inode:      The inode.</div><div class='add'>+ * @whence:     Seek mode (SEEK_DATA or SEEK_HOLE).</div><div class='add'>+ * @start:      Start offset of the hole region. It does not need to be sector</div><div class='add'>+ *              size aligned.</div><div class='add'>+ * @end:        End offset (inclusive value) of the hole region. It does not</div><div class='add'>+ *              need to be sector size aligned.</div><div class='add'>+ * @start_ret:  Return parameter, used to set the start of the subrange in the</div><div class='add'>+ *              hole that matches the search criteria (seek mode), if such</div><div class='add'>+ *              subrange is found (return value of the function is true).</div><div class='add'>+ *              The value returned here may not be sector size aligned.</div><div class='add'>+ *</div><div class='add'>+ * Returns true if a subrange matching the given seek mode is found, and if one</div><div class='add'>+ * is found, it updates @start_ret with the start of the subrange.</div><div class='add'>+ */</div><div class='add'>+static bool find_desired_extent_in_hole(struct btrfs_inode *inode, int whence,</div><div class='add'>+					struct extent_state **cached_state,</div><div class='add'>+					u64 start, u64 end, u64 *start_ret)</div><div class='add'>+{</div><div class='add'>+	u64 delalloc_start;</div><div class='add'>+	u64 delalloc_end;</div><div class='add'>+	bool delalloc;</div><div class='add'>+</div><div class='add'>+	delalloc = btrfs_find_delalloc_in_range(inode, start, end, cached_state,</div><div class='add'>+						&amp;delalloc_start, &amp;delalloc_end);</div><div class='add'>+	if (delalloc &amp;&amp; whence == SEEK_DATA) {</div><div class='add'>+		*start_ret = delalloc_start;</div><div class='add'>+		return true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (delalloc &amp;&amp; whence == SEEK_HOLE) {</div><div class='add'>+		/*</div><div class='add'>+		 * We found delalloc but it starts after out start offset. So we</div><div class='add'>+		 * have a hole between our start offset and the delalloc start.</div><div class='add'>+		 */</div><div class='add'>+		if (start &lt; delalloc_start) {</div><div class='add'>+			*start_ret = start;</div><div class='add'>+			return true;</div><div class='add'>+		}</div><div class='add'>+		/*</div><div class='add'>+		 * Delalloc range starts at our start offset.</div><div class='add'>+		 * If the delalloc range's length is smaller than our range,</div><div class='add'>+		 * then it means we have a hole that starts where the delalloc</div><div class='add'>+		 * subrange ends.</div><div class='add'>+		 */</div><div class='add'>+		if (delalloc_end &lt; end) {</div><div class='add'>+			*start_ret = delalloc_end + 1;</div><div class='add'>+			return true;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* There's delalloc for the whole range. */</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!delalloc &amp;&amp; whence == SEEK_HOLE) {</div><div class='add'>+		*start_ret = start;</div><div class='add'>+		return true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * No delalloc in the range and we are seeking for data. The caller has</div><div class='add'>+	 * to iterate to the next extent item in the subvolume btree.</div><div class='add'>+	 */</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static loff_t find_desired_extent(struct file *file, loff_t offset, int whence)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_inode *inode = BTRFS_I(file-&gt;f_mapping-&gt;host);</div><div class='add'>+	struct btrfs_file_private *private;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='del'>-	struct extent_map *em = NULL;</div><div class='ctx'> 	struct extent_state *cached_state = NULL;</div><div class='del'>-	loff_t i_size = inode-&gt;vfs_inode.i_size;</div><div class='add'>+	struct extent_state **delalloc_cached_state;</div><div class='add'>+	const loff_t i_size = i_size_read(&amp;inode-&gt;vfs_inode);</div><div class='add'>+	const u64 ino = btrfs_ino(inode);</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	struct btrfs_path *path;</div><div class='add'>+	struct btrfs_key key;</div><div class='add'>+	u64 last_extent_end;</div><div class='ctx'> 	u64 lockstart;</div><div class='ctx'> 	u64 lockend;</div><div class='ctx'> 	u64 start;</div><div class='del'>-	u64 len;</div><div class='del'>-	int ret = 0;</div><div class='add'>+	int ret;</div><div class='add'>+	bool found = false;</div><div class='ctx'> </div><div class='ctx'> 	if (i_size == 0 || offset &gt;= i_size)</div><div class='ctx'> 		return -ENXIO;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='add'>+	 * Quick path. If the inode has no prealloc extents and its number of</div><div class='add'>+	 * bytes used matches its i_size, then it can not have holes.</div><div class='add'>+	 */</div><div class='add'>+	if (whence == SEEK_HOLE &amp;&amp;</div><div class='add'>+	    !(inode-&gt;flags &amp; BTRFS_INODE_PREALLOC) &amp;&amp;</div><div class='add'>+	    inode_get_bytes(&amp;inode-&gt;vfs_inode) == i_size)</div><div class='add'>+		return i_size;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;inode-&gt;lock);</div><div class='add'>+	private = file-&gt;private_data;</div><div class='add'>+	spin_unlock(&amp;inode-&gt;lock);</div><div class='add'>+</div><div class='add'>+	if (private &amp;&amp; private-&gt;owner_task != current) {</div><div class='add'>+		/*</div><div class='add'>+		 * Not allocated by us, don't use it as its cached state is used</div><div class='add'>+		 * by the task that allocated it and we don't want neither to</div><div class='add'>+		 * mess with it nor get incorrect results because it reflects an</div><div class='add'>+		 * invalid state for the current task.</div><div class='add'>+		 */</div><div class='add'>+		private = NULL;</div><div class='add'>+	} else if (!private) {</div><div class='add'>+		private = kzalloc(sizeof(*private), GFP_KERNEL);</div><div class='add'>+		/*</div><div class='add'>+		 * No worries if memory allocation failed.</div><div class='add'>+		 * The private structure is used only for speeding up multiple</div><div class='add'>+		 * lseek SEEK_HOLE/DATA calls to a file when there's delalloc,</div><div class='add'>+		 * so everything will still be correct.</div><div class='add'>+		 */</div><div class='add'>+		if (private) {</div><div class='add'>+			bool free = false;</div><div class='add'>+</div><div class='add'>+			private-&gt;owner_task = current;</div><div class='add'>+</div><div class='add'>+			spin_lock(&amp;inode-&gt;lock);</div><div class='add'>+			if (file-&gt;private_data)</div><div class='add'>+				free = true;</div><div class='add'>+			else</div><div class='add'>+				file-&gt;private_data = private;</div><div class='add'>+			spin_unlock(&amp;inode-&gt;lock);</div><div class='add'>+</div><div class='add'>+			if (free) {</div><div class='add'>+				kfree(private);</div><div class='add'>+				private = NULL;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (private)</div><div class='add'>+		delalloc_cached_state = &amp;private-&gt;llseek_cached_state;</div><div class='add'>+	else</div><div class='add'>+		delalloc_cached_state = NULL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='ctx'> 	 * offset can be negative, in this case we start finding DATA/HOLE from</div><div class='ctx'> 	 * the very start of the file.</div><div class='ctx'> 	 */</div><div class='hunk'>@@ -3620,45 +3614,174 @@ static loff_t find_desired_extent(struct btrfs_inode *inode, loff_t offset,</div><div class='ctx'> 	if (lockend &lt;= lockstart)</div><div class='ctx'> 		lockend = lockstart + fs_info-&gt;sectorsize;</div><div class='ctx'> 	lockend--;</div><div class='del'>-	len = lockend - lockstart + 1;</div><div class='ctx'> </div><div class='del'>-	lock_extent_bits(&amp;inode-&gt;io_tree, lockstart, lockend, &amp;cached_state);</div><div class='add'>+	path = btrfs_alloc_path();</div><div class='add'>+	if (!path)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	path-&gt;reada = READA_FORWARD;</div><div class='add'>+</div><div class='add'>+	key.objectid = ino;</div><div class='add'>+	key.type = BTRFS_EXTENT_DATA_KEY;</div><div class='add'>+	key.offset = start;</div><div class='add'>+</div><div class='add'>+	last_extent_end = lockstart;</div><div class='add'>+</div><div class='add'>+	btrfs_lock_extent(&amp;inode-&gt;io_tree, lockstart, lockend, &amp;cached_state);</div><div class='add'>+</div><div class='add'>+	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		goto out;</div><div class='add'>+	} else if (ret &gt; 0 &amp;&amp; path-&gt;slots[0] &gt; 0) {</div><div class='add'>+		btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, path-&gt;slots[0] - 1);</div><div class='add'>+		if (key.objectid == ino &amp;&amp; key.type == BTRFS_EXTENT_DATA_KEY)</div><div class='add'>+			path-&gt;slots[0]--;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	while (start &lt; i_size) {</div><div class='del'>-		em = btrfs_get_extent_fiemap(inode, start, len);</div><div class='del'>-		if (IS_ERR(em)) {</div><div class='del'>-			ret = PTR_ERR(em);</div><div class='del'>-			em = NULL;</div><div class='del'>-			break;</div><div class='add'>+		struct extent_buffer *leaf = path-&gt;nodes[0];</div><div class='add'>+		struct btrfs_file_extent_item *extent;</div><div class='add'>+		u64 extent_end;</div><div class='add'>+		u8 type;</div><div class='add'>+</div><div class='add'>+		if (path-&gt;slots[0] &gt;= btrfs_header_nritems(leaf)) {</div><div class='add'>+			ret = btrfs_next_leaf(root, path);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				goto out;</div><div class='add'>+			else if (ret &gt; 0)</div><div class='add'>+				break;</div><div class='add'>+</div><div class='add'>+			leaf = path-&gt;nodes[0];</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (whence == SEEK_HOLE &amp;&amp;</div><div class='del'>-		    (em-&gt;block_start == EXTENT_MAP_HOLE ||</div><div class='del'>-		     test_bit(EXTENT_FLAG_PREALLOC, &amp;em-&gt;flags)))</div><div class='del'>-			break;</div><div class='del'>-		else if (whence == SEEK_DATA &amp;&amp;</div><div class='del'>-			   (em-&gt;block_start != EXTENT_MAP_HOLE &amp;&amp;</div><div class='del'>-			    !test_bit(EXTENT_FLAG_PREALLOC, &amp;em-&gt;flags)))</div><div class='add'>+		btrfs_item_key_to_cpu(leaf, &amp;key, path-&gt;slots[0]);</div><div class='add'>+		if (key.objectid != ino || key.type != BTRFS_EXTENT_DATA_KEY)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		start = em-&gt;start + em-&gt;len;</div><div class='del'>-		free_extent_map(em);</div><div class='del'>-		em = NULL;</div><div class='add'>+		extent_end = btrfs_file_extent_end(path);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * In the first iteration we may have a slot that points to an</div><div class='add'>+		 * extent that ends before our start offset, so skip it.</div><div class='add'>+		 */</div><div class='add'>+		if (extent_end &lt;= start) {</div><div class='add'>+			path-&gt;slots[0]++;</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* We have an implicit hole, NO_HOLES feature is likely set. */</div><div class='add'>+		if (last_extent_end &lt; key.offset) {</div><div class='add'>+			u64 search_start = last_extent_end;</div><div class='add'>+			u64 found_start;</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * First iteration, @start matches @offset and it's</div><div class='add'>+			 * within the hole.</div><div class='add'>+			 */</div><div class='add'>+			if (start == offset)</div><div class='add'>+				search_start = offset;</div><div class='add'>+</div><div class='add'>+			found = find_desired_extent_in_hole(inode, whence,</div><div class='add'>+							    delalloc_cached_state,</div><div class='add'>+							    search_start,</div><div class='add'>+							    key.offset - 1,</div><div class='add'>+							    &amp;found_start);</div><div class='add'>+			if (found) {</div><div class='add'>+				start = found_start;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+			/*</div><div class='add'>+			 * Didn't find data or a hole (due to delalloc) in the</div><div class='add'>+			 * implicit hole range, so need to analyze the extent.</div><div class='add'>+			 */</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		extent = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='add'>+					struct btrfs_file_extent_item);</div><div class='add'>+		type = btrfs_file_extent_type(leaf, extent);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Can't access the extent's disk_bytenr field if this is an</div><div class='add'>+		 * inline extent, since at that offset, it's where the extent</div><div class='add'>+		 * data starts.</div><div class='add'>+		 */</div><div class='add'>+		if (type == BTRFS_FILE_EXTENT_PREALLOC ||</div><div class='add'>+		    (type == BTRFS_FILE_EXTENT_REG &amp;&amp;</div><div class='add'>+		     btrfs_file_extent_disk_bytenr(leaf, extent) == 0)) {</div><div class='add'>+			/*</div><div class='add'>+			 * Explicit hole or prealloc extent, search for delalloc.</div><div class='add'>+			 * A prealloc extent is treated like a hole.</div><div class='add'>+			 */</div><div class='add'>+			u64 search_start = key.offset;</div><div class='add'>+			u64 found_start;</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * First iteration, @start matches @offset and it's</div><div class='add'>+			 * within the hole.</div><div class='add'>+			 */</div><div class='add'>+			if (start == offset)</div><div class='add'>+				search_start = offset;</div><div class='add'>+</div><div class='add'>+			found = find_desired_extent_in_hole(inode, whence,</div><div class='add'>+							    delalloc_cached_state,</div><div class='add'>+							    search_start,</div><div class='add'>+							    extent_end - 1,</div><div class='add'>+							    &amp;found_start);</div><div class='add'>+			if (found) {</div><div class='add'>+				start = found_start;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+			/*</div><div class='add'>+			 * Didn't find data or a hole (due to delalloc) in the</div><div class='add'>+			 * implicit hole range, so need to analyze the next</div><div class='add'>+			 * extent item.</div><div class='add'>+			 */</div><div class='add'>+		} else {</div><div class='add'>+			/*</div><div class='add'>+			 * Found a regular or inline extent.</div><div class='add'>+			 * If we are seeking for data, adjust the start offset</div><div class='add'>+			 * and stop, we're done.</div><div class='add'>+			 */</div><div class='add'>+			if (whence == SEEK_DATA) {</div><div class='add'>+				start = max_t(u64, key.offset, offset);</div><div class='add'>+				found = true;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+			/*</div><div class='add'>+			 * Else, we are seeking for a hole, check the next file</div><div class='add'>+			 * extent item.</div><div class='add'>+			 */</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		start = extent_end;</div><div class='add'>+		last_extent_end = extent_end;</div><div class='add'>+		path-&gt;slots[0]++;</div><div class='add'>+		if (fatal_signal_pending(current)) {</div><div class='add'>+			ret = -EINTR;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 	}</div><div class='del'>-	free_extent_map(em);</div><div class='del'>-	unlock_extent_cached(&amp;inode-&gt;io_tree, lockstart, lockend,</div><div class='del'>-			     &amp;cached_state);</div><div class='del'>-	if (ret) {</div><div class='del'>-		offset = ret;</div><div class='del'>-	} else {</div><div class='del'>-		if (whence == SEEK_DATA &amp;&amp; start &gt;= i_size)</div><div class='del'>-			offset = -ENXIO;</div><div class='del'>-		else</div><div class='del'>-			offset = min_t(loff_t, start, i_size);</div><div class='add'>+</div><div class='add'>+	/* We have an implicit hole from the last extent found up to i_size. */</div><div class='add'>+	if (!found &amp;&amp; start &lt; i_size) {</div><div class='add'>+		found = find_desired_extent_in_hole(inode, whence,</div><div class='add'>+						    delalloc_cached_state, start,</div><div class='add'>+						    i_size - 1, &amp;start);</div><div class='add'>+		if (!found)</div><div class='add'>+			start = i_size;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return offset;</div><div class='add'>+out:</div><div class='add'>+	btrfs_unlock_extent(&amp;inode-&gt;io_tree, lockstart, lockend, &amp;cached_state);</div><div class='add'>+	btrfs_free_path(path);</div><div class='add'>+</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	if (whence == SEEK_DATA &amp;&amp; start &gt;= i_size)</div><div class='add'>+		return -ENXIO;</div><div class='add'>+</div><div class='add'>+	return min_t(loff_t, start, i_size);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static loff_t btrfs_file_llseek(struct file *file, loff_t offset, int whence)</div><div class='hunk'>@@ -3670,9 +3793,9 @@ static loff_t btrfs_file_llseek(struct file *file, loff_t offset, int whence)</div><div class='ctx'> 		return generic_file_llseek(file, offset, whence);</div><div class='ctx'> 	case SEEK_DATA:</div><div class='ctx'> 	case SEEK_HOLE:</div><div class='del'>-		btrfs_inode_lock(inode, BTRFS_ILOCK_SHARED);</div><div class='del'>-		offset = find_desired_extent(BTRFS_I(inode), offset, whence);</div><div class='del'>-		btrfs_inode_unlock(inode, BTRFS_ILOCK_SHARED);</div><div class='add'>+		btrfs_inode_lock(BTRFS_I(inode), BTRFS_ILOCK_SHARED);</div><div class='add'>+		offset = find_desired_extent(file, offset, whence);</div><div class='add'>+		btrfs_inode_unlock(BTRFS_I(inode), BTRFS_ILOCK_SHARED);</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -3686,7 +3809,10 @@ static int btrfs_file_open(struct inode *inode, struct file *filp)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	filp-&gt;f_mode |= FMODE_NOWAIT | FMODE_BUF_RASYNC;</div><div class='add'>+	if (unlikely(btrfs_is_shutdown(inode_to_fs_info(inode))))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	filp-&gt;f_mode |= FMODE_NOWAIT | FMODE_CAN_ODIRECT;</div><div class='ctx'> </div><div class='ctx'> 	ret = fsverity_file_open(inode, filp);</div><div class='ctx'> 	if (ret)</div><div class='hunk'>@@ -3694,97 +3820,13 @@ static int btrfs_file_open(struct inode *inode, struct file *filp)</div><div class='ctx'> 	return generic_file_open(inode, filp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int check_direct_read(struct btrfs_fs_info *fs_info,</div><div class='del'>-			     const struct iov_iter *iter, loff_t offset)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-	int i, seg;</div><div class='del'>-</div><div class='del'>-	ret = check_direct_IO(fs_info, iter, offset);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	if (!iter_is_iovec(iter))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	for (seg = 0; seg &lt; iter-&gt;nr_segs; seg++)</div><div class='del'>-		for (i = seg + 1; i &lt; iter-&gt;nr_segs; i++)</div><div class='del'>-			if (iter-&gt;iov[seg].iov_base == iter-&gt;iov[i].iov_base)</div><div class='del'>-				return -EINVAL;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static ssize_t btrfs_direct_read(struct kiocb *iocb, struct iov_iter *to)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='del'>-	size_t prev_left = 0;</div><div class='del'>-	ssize_t read = 0;</div><div class='del'>-	ssize_t ret;</div><div class='del'>-</div><div class='del'>-	if (fsverity_active(inode))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	if (check_direct_read(btrfs_sb(inode-&gt;i_sb), to, iocb-&gt;ki_pos))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	btrfs_inode_lock(inode, BTRFS_ILOCK_SHARED);</div><div class='del'>-again:</div><div class='del'>-	/*</div><div class='del'>-	 * This is similar to what we do for direct IO writes, see the comment</div><div class='del'>-	 * at btrfs_direct_write(), but we also disable page faults in addition</div><div class='del'>-	 * to disabling them only at the iov_iter level. This is because when</div><div class='del'>-	 * reading from a hole or prealloc extent, iomap calls iov_iter_zero(),</div><div class='del'>-	 * which can still trigger page fault ins despite having set -&gt;nofault</div><div class='del'>-	 * to true of our 'to' iov_iter.</div><div class='del'>-	 *</div><div class='del'>-	 * The difference to direct IO writes is that we deadlock when trying</div><div class='del'>-	 * to lock the extent range in the inode's tree during he page reads</div><div class='del'>-	 * triggered by the fault in (while for writes it is due to waiting for</div><div class='del'>-	 * our own ordered extent). This is because for direct IO reads,</div><div class='del'>-	 * btrfs_dio_iomap_begin() returns with the extent range locked, which</div><div class='del'>-	 * is only unlocked in the endio callback (end_bio_extent_readpage()).</div><div class='del'>-	 */</div><div class='del'>-	pagefault_disable();</div><div class='del'>-	to-&gt;nofault = true;</div><div class='del'>-	ret = iomap_dio_rw(iocb, to, &amp;btrfs_dio_iomap_ops, &amp;btrfs_dio_ops,</div><div class='del'>-			   IOMAP_DIO_PARTIAL, read);</div><div class='del'>-	to-&gt;nofault = false;</div><div class='del'>-	pagefault_enable();</div><div class='del'>-</div><div class='del'>-	/* No increment (+=) because iomap returns a cumulative value. */</div><div class='del'>-	if (ret &gt; 0)</div><div class='del'>-		read = ret;</div><div class='del'>-</div><div class='del'>-	if (iov_iter_count(to) &gt; 0 &amp;&amp; (ret == -EFAULT || ret &gt; 0)) {</div><div class='del'>-		const size_t left = iov_iter_count(to);</div><div class='del'>-</div><div class='del'>-		if (left == prev_left) {</div><div class='del'>-			/*</div><div class='del'>-			 * We didn't make any progress since the last attempt,</div><div class='del'>-			 * fallback to a buffered read for the remainder of the</div><div class='del'>-			 * range. This is just to avoid any possibility of looping</div><div class='del'>-			 * for too long.</div><div class='del'>-			 */</div><div class='del'>-			ret = read;</div><div class='del'>-		} else {</div><div class='del'>-			/*</div><div class='del'>-			 * We made some progress since the last retry or this is</div><div class='del'>-			 * the first time we are retrying. Fault in as many pages</div><div class='del'>-			 * as possible and retry.</div><div class='del'>-			 */</div><div class='del'>-			fault_in_iov_iter_writeable(to, left);</div><div class='del'>-			prev_left = left;</div><div class='del'>-			goto again;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	btrfs_inode_unlock(inode, BTRFS_ILOCK_SHARED);</div><div class='del'>-	return ret &lt; 0 ? ret : read;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static ssize_t btrfs_file_read_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='ctx'> {</div><div class='ctx'> 	ssize_t ret = 0;</div><div class='ctx'> </div><div class='add'>+	if (unlikely(btrfs_is_shutdown(inode_to_fs_info(file_inode(iocb-&gt;ki_filp)))))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='ctx'> 	if (iocb-&gt;ki_flags &amp; IOCB_DIRECT) {</div><div class='ctx'> 		ret = btrfs_direct_read(iocb, to);</div><div class='ctx'> 		if (ret &lt; 0 || !iov_iter_count(to) ||</div><div class='hunk'>@@ -3795,15 +3837,26 @@ static ssize_t btrfs_file_read_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='ctx'> 	return filemap_read(iocb, to, ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static ssize_t btrfs_file_splice_read(struct file *in, loff_t *ppos,</div><div class='add'>+				      struct pipe_inode_info *pipe,</div><div class='add'>+				      size_t len, unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	if (unlikely(btrfs_is_shutdown(inode_to_fs_info(file_inode(in)))))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	return filemap_splice_read(in, ppos, pipe, len, flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> const struct file_operations btrfs_file_operations = {</div><div class='ctx'> 	.llseek		= btrfs_file_llseek,</div><div class='ctx'> 	.read_iter      = btrfs_file_read_iter,</div><div class='del'>-	.splice_read	= generic_file_splice_read,</div><div class='add'>+	.splice_read	= btrfs_file_splice_read,</div><div class='ctx'> 	.write_iter	= btrfs_file_write_iter,</div><div class='ctx'> 	.splice_write	= iter_file_splice_write,</div><div class='del'>-	.mmap		= btrfs_file_mmap,</div><div class='add'>+	.mmap_prepare	= btrfs_file_mmap_prepare,</div><div class='ctx'> 	.open		= btrfs_file_open,</div><div class='ctx'> 	.release	= btrfs_release_file,</div><div class='add'>+	.get_unmapped_area = thp_get_unmapped_area,</div><div class='ctx'> 	.fsync		= btrfs_sync_file,</div><div class='ctx'> 	.fallocate	= btrfs_fallocate,</div><div class='ctx'> 	.unlocked_ioctl	= btrfs_ioctl,</div><div class='hunk'>@@ -3811,27 +3864,13 @@ const struct file_operations btrfs_file_operations = {</div><div class='ctx'> 	.compat_ioctl	= btrfs_compat_ioctl,</div><div class='ctx'> #endif</div><div class='ctx'> 	.remap_file_range = btrfs_remap_file_range,</div><div class='add'>+	.uring_cmd	= btrfs_uring_cmd,</div><div class='add'>+	.fop_flags	= FOP_BUFFER_RASYNC | FOP_BUFFER_WASYNC,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-void __cold btrfs_auto_defrag_exit(void)</div><div class='del'>-{</div><div class='del'>-	kmem_cache_destroy(btrfs_inode_defrag_cachep);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int __init btrfs_auto_defrag_init(void)</div><div class='del'>-{</div><div class='del'>-	btrfs_inode_defrag_cachep = kmem_cache_create("btrfs_inode_defrag",</div><div class='del'>-					sizeof(struct inode_defrag), 0,</div><div class='del'>-					SLAB_MEM_SPREAD,</div><div class='del'>-					NULL);</div><div class='del'>-	if (!btrfs_inode_defrag_cachep)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int btrfs_fdatawrite_range(struct inode *inode, loff_t start, loff_t end)</div><div class='add'>+int btrfs_fdatawrite_range(struct btrfs_inode *inode, loff_t start, loff_t end)</div><div class='ctx'> {</div><div class='add'>+	struct address_space *mapping = inode-&gt;vfs_inode.i_mapping;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -3848,10 +3887,9 @@ int btrfs_fdatawrite_range(struct inode *inode, loff_t start, loff_t end)</div><div class='ctx'> 	 * know better and pull this out at some point in the future, it is</div><div class='ctx'> 	 * right and you are wrong.</div><div class='ctx'> 	 */</div><div class='del'>-	ret = filemap_fdatawrite_range(inode-&gt;i_mapping, start, end);</div><div class='del'>-	if (!ret &amp;&amp; test_bit(BTRFS_INODE_HAS_ASYNC_EXTENT,</div><div class='del'>-			     &amp;BTRFS_I(inode)-&gt;runtime_flags))</div><div class='del'>-		ret = filemap_fdatawrite_range(inode-&gt;i_mapping, start, end);</div><div class='add'>+	ret = filemap_fdatawrite_range(mapping, start, end);</div><div class='add'>+	if (!ret &amp;&amp; test_bit(BTRFS_INODE_HAS_ASYNC_EXTENT, &amp;inode-&gt;runtime_flags))</div><div class='add'>+		ret = filemap_fdatawrite_range(mapping, start, end);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/btrfs/file.h b/fs/btrfs/file.h<br/>new file mode 100644<br/>index 000000000000..d7df81388cbe<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/file.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/file.h</a></div><div class='hunk'>@@ -0,0 +1,51 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+</div><div class='add'>+#ifndef BTRFS_FILE_H</div><div class='add'>+#define BTRFS_FILE_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+</div><div class='add'>+struct file;</div><div class='add'>+struct extent_state;</div><div class='add'>+struct kiocb;</div><div class='add'>+struct iov_iter;</div><div class='add'>+struct inode;</div><div class='add'>+struct folio;</div><div class='add'>+struct page;</div><div class='add'>+struct btrfs_ioctl_encoded_io_args;</div><div class='add'>+struct btrfs_drop_extents_args;</div><div class='add'>+struct btrfs_inode;</div><div class='add'>+struct btrfs_root;</div><div class='add'>+struct btrfs_path;</div><div class='add'>+struct btrfs_replace_extent_info;</div><div class='add'>+struct btrfs_trans_handle;</div><div class='add'>+</div><div class='add'>+extern const struct file_operations btrfs_file_operations;</div><div class='add'>+</div><div class='add'>+int btrfs_sync_file(struct file *file, loff_t start, loff_t end, int datasync);</div><div class='add'>+int btrfs_drop_extents(struct btrfs_trans_handle *trans,</div><div class='add'>+		       struct btrfs_root *root, struct btrfs_inode *inode,</div><div class='add'>+		       struct btrfs_drop_extents_args *args);</div><div class='add'>+int btrfs_replace_file_extents(struct btrfs_inode *inode,</div><div class='add'>+			   struct btrfs_path *path, const u64 start,</div><div class='add'>+			   const u64 end,</div><div class='add'>+			   struct btrfs_replace_extent_info *extent_info,</div><div class='add'>+			   struct btrfs_trans_handle **trans_out);</div><div class='add'>+int btrfs_mark_extent_written(struct btrfs_trans_handle *trans,</div><div class='add'>+			      struct btrfs_inode *inode, u64 start, u64 end);</div><div class='add'>+ssize_t btrfs_do_write_iter(struct kiocb *iocb, struct iov_iter *from,</div><div class='add'>+			    const struct btrfs_ioctl_encoded_io_args *encoded);</div><div class='add'>+int btrfs_release_file(struct inode *inode, struct file *file);</div><div class='add'>+int btrfs_dirty_folio(struct btrfs_inode *inode, struct folio *folio, loff_t pos,</div><div class='add'>+		      size_t write_bytes, struct extent_state **cached, bool noreserve);</div><div class='add'>+int btrfs_fdatawrite_range(struct btrfs_inode *inode, loff_t start, loff_t end);</div><div class='add'>+int btrfs_check_nocow_lock(struct btrfs_inode *inode, loff_t pos,</div><div class='add'>+			   size_t *write_bytes, bool nowait);</div><div class='add'>+void btrfs_check_nocow_unlock(struct btrfs_inode *inode);</div><div class='add'>+bool btrfs_find_delalloc_in_range(struct btrfs_inode *inode, u64 start, u64 end,</div><div class='add'>+				  struct extent_state **cached_state,</div><div class='add'>+				  u64 *delalloc_start_ret, u64 *delalloc_end_ret);</div><div class='add'>+int btrfs_write_check(struct kiocb *iocb, size_t count);</div><div class='add'>+ssize_t btrfs_buffered_write(struct kiocb *iocb, struct iov_iter *i);</div><div class='add'>+</div><div class='add'>+#endif</div><div class='head'>diff --git a/fs/btrfs/free-space-cache.c b/fs/btrfs/free-space-cache.c<br/>index f3fee88c8ee0..f0f72850fab2 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/free-space-cache.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/free-space-cache.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/free-space-cache.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/free-space-cache.c</a></div><div class='hunk'>@@ -11,23 +11,32 @@</div><div class='ctx'> #include &lt;linux/ratelimit.h&gt;</div><div class='ctx'> #include &lt;linux/error-injection.h&gt;</div><div class='ctx'> #include &lt;linux/sched/mm.h&gt;</div><div class='add'>+#include &lt;linux/string_choices.h&gt;</div><div class='add'>+#include "extent-tree.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "messages.h"</div><div class='ctx'> #include "misc.h"</div><div class='del'>-#include "ctree.h"</div><div class='ctx'> #include "free-space-cache.h"</div><div class='ctx'> #include "transaction.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='ctx'> #include "extent_io.h"</div><div class='del'>-#include "volumes.h"</div><div class='ctx'> #include "space-info.h"</div><div class='del'>-#include "delalloc-space.h"</div><div class='ctx'> #include "block-group.h"</div><div class='ctx'> #include "discard.h"</div><div class='ctx'> #include "subpage.h"</div><div class='add'>+#include "inode-item.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "file-item.h"</div><div class='add'>+#include "file.h"</div><div class='add'>+#include "super.h"</div><div class='ctx'> </div><div class='ctx'> #define BITS_PER_BITMAP		(PAGE_SIZE * 8UL)</div><div class='ctx'> #define MAX_CACHE_BYTES_PER_GIG	SZ_64K</div><div class='ctx'> #define FORCE_EXTENT_THRESHOLD	SZ_1M</div><div class='ctx'> </div><div class='add'>+static struct kmem_cache *btrfs_free_space_cachep;</div><div class='add'>+static struct kmem_cache *btrfs_free_space_bitmap_cachep;</div><div class='add'>+</div><div class='ctx'> struct btrfs_trim_range {</div><div class='ctx'> 	u64 start;</div><div class='ctx'> 	u64 bytes;</div><div class='hunk'>@@ -37,7 +46,7 @@ struct btrfs_trim_range {</div><div class='ctx'> static int link_free_space(struct btrfs_free_space_ctl *ctl,</div><div class='ctx'> 			   struct btrfs_free_space *info);</div><div class='ctx'> static void unlink_free_space(struct btrfs_free_space_ctl *ctl,</div><div class='del'>-			      struct btrfs_free_space *info);</div><div class='add'>+			      struct btrfs_free_space *info, bool update_stat);</div><div class='ctx'> static int search_bitmap(struct btrfs_free_space_ctl *ctl,</div><div class='ctx'> 			 struct btrfs_free_space *bitmap_info, u64 *offset,</div><div class='ctx'> 			 u64 *bytes, bool for_alloc);</div><div class='hunk'>@@ -45,25 +54,47 @@ static void free_bitmap(struct btrfs_free_space_ctl *ctl,</div><div class='ctx'> 			struct btrfs_free_space *bitmap_info);</div><div class='ctx'> static void bitmap_clear_bits(struct btrfs_free_space_ctl *ctl,</div><div class='ctx'> 			      struct btrfs_free_space *info, u64 offset,</div><div class='del'>-			      u64 bytes);</div><div class='add'>+			      u64 bytes, bool update_stats);</div><div class='add'>+</div><div class='add'>+static void btrfs_crc32c_final(u32 crc, u8 *result)</div><div class='add'>+{</div><div class='add'>+	put_unaligned_le32(~crc, result);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void __btrfs_remove_free_space_cache(struct btrfs_free_space_ctl *ctl)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_free_space *info;</div><div class='add'>+	struct rb_node *node;</div><div class='add'>+</div><div class='add'>+	while ((node = rb_last(&amp;ctl-&gt;free_space_offset)) != NULL) {</div><div class='add'>+		info = rb_entry(node, struct btrfs_free_space, offset_index);</div><div class='add'>+		if (!info-&gt;bitmap) {</div><div class='add'>+			unlink_free_space(ctl, info, true);</div><div class='add'>+			kmem_cache_free(btrfs_free_space_cachep, info);</div><div class='add'>+		} else {</div><div class='add'>+			free_bitmap(ctl, info);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		cond_resched_lock(&amp;ctl-&gt;tree_lock);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> static struct inode *__lookup_free_space_inode(struct btrfs_root *root,</div><div class='ctx'> 					       struct btrfs_path *path,</div><div class='ctx'> 					       u64 offset)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_key location;</div><div class='ctx'> 	struct btrfs_disk_key disk_key;</div><div class='ctx'> 	struct btrfs_free_space_header *header;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='del'>-	struct inode *inode = NULL;</div><div class='add'>+	struct btrfs_inode *inode;</div><div class='ctx'> 	unsigned nofs_flag;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = BTRFS_FREE_SPACE_OBJECTID;</div><div class='del'>-	key.offset = offset;</div><div class='ctx'> 	key.type = 0;</div><div class='add'>+	key.offset = offset;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='hunk'>@@ -85,17 +116,17 @@ static struct inode *__lookup_free_space_inode(struct btrfs_root *root,</div><div class='ctx'> 	 * sure NOFS is set to keep us from deadlocking.</div><div class='ctx'> 	 */</div><div class='ctx'> 	nofs_flag = memalloc_nofs_save();</div><div class='del'>-	inode = btrfs_iget_path(fs_info-&gt;sb, location.objectid, root, path);</div><div class='add'>+	inode = btrfs_iget_path(location.objectid, root, path);</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> 	memalloc_nofs_restore(nofs_flag);</div><div class='ctx'> 	if (IS_ERR(inode))</div><div class='del'>-		return inode;</div><div class='add'>+		return ERR_CAST(inode);</div><div class='ctx'> </div><div class='del'>-	mapping_set_gfp_mask(inode-&gt;i_mapping,</div><div class='del'>-			mapping_gfp_constraint(inode-&gt;i_mapping,</div><div class='add'>+	mapping_set_gfp_mask(inode-&gt;vfs_inode.i_mapping,</div><div class='add'>+			mapping_gfp_constraint(inode-&gt;vfs_inode.i_mapping,</div><div class='ctx'> 			~(__GFP_FS | __GFP_HIGHMEM)));</div><div class='ctx'> </div><div class='del'>-	return inode;</div><div class='add'>+	return &amp;inode-&gt;vfs_inode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct inode *lookup_free_space_inode(struct btrfs_block_group *block_group,</div><div class='hunk'>@@ -107,7 +138,7 @@ struct inode *lookup_free_space_inode(struct btrfs_block_group *block_group,</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;block_group-&gt;lock);</div><div class='ctx'> 	if (block_group-&gt;inode)</div><div class='del'>-		inode = igrab(block_group-&gt;inode);</div><div class='add'>+		inode = igrab(&amp;block_group-&gt;inode-&gt;vfs_inode);</div><div class='ctx'> 	spin_unlock(&amp;block_group-&gt;lock);</div><div class='ctx'> 	if (inode)</div><div class='ctx'> 		return inode;</div><div class='hunk'>@@ -125,10 +156,8 @@ struct inode *lookup_free_space_inode(struct btrfs_block_group *block_group,</div><div class='ctx'> 		block_group-&gt;disk_cache_state = BTRFS_DC_CLEAR;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!block_group-&gt;iref) {</div><div class='del'>-		block_group-&gt;inode = igrab(inode);</div><div class='del'>-		block_group-&gt;iref = 1;</div><div class='del'>-	}</div><div class='add'>+	if (!test_and_set_bit(BLOCK_GROUP_FLAG_IREF, &amp;block_group-&gt;runtime_flags))</div><div class='add'>+		block_group-&gt;inode = BTRFS_I(igrab(inode));</div><div class='ctx'> 	spin_unlock(&amp;block_group-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	return inode;</div><div class='hunk'>@@ -169,12 +198,11 @@ static int __create_free_space_inode(struct btrfs_root *root,</div><div class='ctx'> 	btrfs_set_inode_nlink(leaf, inode_item, 1);</div><div class='ctx'> 	btrfs_set_inode_transid(leaf, inode_item, trans-&gt;transid);</div><div class='ctx'> 	btrfs_set_inode_block_group(leaf, inode_item, offset);</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = BTRFS_FREE_SPACE_OBJECTID;</div><div class='del'>-	key.offset = offset;</div><div class='ctx'> 	key.type = 0;</div><div class='add'>+	key.offset = offset;</div><div class='ctx'> 	ret = btrfs_insert_empty_item(trans, root, path, &amp;key,</div><div class='ctx'> 				      sizeof(struct btrfs_free_space_header));</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='hunk'>@@ -187,7 +215,6 @@ static int __create_free_space_inode(struct btrfs_root *root,</div><div class='ctx'> 				struct btrfs_free_space_header);</div><div class='ctx'> 	memzero_extent_buffer(leaf, (unsigned long)header, sizeof(*header));</div><div class='ctx'> 	btrfs_set_free_space_key(leaf, header, &amp;disk_key);</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -217,7 +244,7 @@ int btrfs_remove_free_space_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				  struct inode *inode,</div><div class='ctx'> 				  struct btrfs_block_group *block_group)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -230,18 +257,17 @@ int btrfs_remove_free_space_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	if (IS_ERR(inode)) {</div><div class='ctx'> 		if (PTR_ERR(inode) != -ENOENT)</div><div class='ctx'> 			ret = PTR_ERR(inode);</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> 	ret = btrfs_orphan_add(trans, BTRFS_I(inode));</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		btrfs_add_delayed_iput(inode);</div><div class='del'>-		goto out;</div><div class='add'>+		btrfs_add_delayed_iput(BTRFS_I(inode));</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> 	clear_nlink(inode);</div><div class='ctx'> 	/* One for the block groups ref */</div><div class='ctx'> 	spin_lock(&amp;block_group-&gt;lock);</div><div class='del'>-	if (block_group-&gt;iref) {</div><div class='del'>-		block_group-&gt;iref = 0;</div><div class='add'>+	if (test_and_clear_bit(BLOCK_GROUP_FLAG_IREF, &amp;block_group-&gt;runtime_flags)) {</div><div class='ctx'> 		block_group-&gt;inode = NULL;</div><div class='ctx'> 		spin_unlock(&amp;block_group-&gt;lock);</div><div class='ctx'> 		iput(inode);</div><div class='hunk'>@@ -249,7 +275,7 @@ int btrfs_remove_free_space_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		spin_unlock(&amp;block_group-&gt;lock);</div><div class='ctx'> 	}</div><div class='ctx'> 	/* One for the lookup ref */</div><div class='del'>-	btrfs_add_delayed_iput(inode);</div><div class='add'>+	btrfs_add_delayed_iput(BTRFS_I(inode));</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = BTRFS_FREE_SPACE_OBJECTID;</div><div class='ctx'> 	key.type = 0;</div><div class='hunk'>@@ -259,44 +285,32 @@ int btrfs_remove_free_space_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		if (ret &gt; 0)</div><div class='ctx'> 			ret = 0;</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='del'>-	ret = btrfs_del_item(trans, trans-&gt;fs_info-&gt;tree_root, path);</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int btrfs_check_trunc_cache_free_space(struct btrfs_fs_info *fs_info,</div><div class='del'>-				       struct btrfs_block_rsv *rsv)</div><div class='del'>-{</div><div class='del'>-	u64 needed_bytes;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	/* 1 for slack space, 1 for updating the inode */</div><div class='del'>-	needed_bytes = btrfs_calc_insert_metadata_size(fs_info, 1) +</div><div class='del'>-		btrfs_calc_metadata_size(fs_info, 1);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;rsv-&gt;lock);</div><div class='del'>-	if (rsv-&gt;reserved &lt; needed_bytes)</div><div class='del'>-		ret = -ENOSPC;</div><div class='del'>-	else</div><div class='del'>-		ret = 0;</div><div class='del'>-	spin_unlock(&amp;rsv-&gt;lock);</div><div class='del'>-	return ret;</div><div class='add'>+	return btrfs_del_item(trans, trans-&gt;fs_info-&gt;tree_root, path);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_truncate_free_space_cache(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				    struct btrfs_block_group *block_group,</div><div class='del'>-				    struct inode *inode)</div><div class='add'>+				    struct inode *vfs_inode)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='add'>+	struct btrfs_truncate_control control = {</div><div class='add'>+		.inode = BTRFS_I(vfs_inode),</div><div class='add'>+		.new_size = 0,</div><div class='add'>+		.ino = btrfs_ino(BTRFS_I(vfs_inode)),</div><div class='add'>+		.min_type = BTRFS_EXTENT_DATA_KEY,</div><div class='add'>+		.clear_extent_range = true,</div><div class='add'>+	};</div><div class='add'>+	struct btrfs_inode *inode = BTRFS_I(vfs_inode);</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	struct extent_state *cached_state = NULL;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	bool locked = false;</div><div class='ctx'> </div><div class='ctx'> 	if (block_group) {</div><div class='del'>-		struct btrfs_path *path = btrfs_alloc_path();</div><div class='add'>+		BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> </div><div class='add'>+		path = btrfs_alloc_path();</div><div class='ctx'> 		if (!path) {</div><div class='ctx'> 			ret = -ENOMEM;</div><div class='ctx'> 			goto fail;</div><div class='hunk'>@@ -317,22 +331,28 @@ int btrfs_truncate_free_space_cache(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		spin_lock(&amp;block_group-&gt;lock);</div><div class='ctx'> 		block_group-&gt;disk_cache_state = BTRFS_DC_CLEAR;</div><div class='ctx'> 		spin_unlock(&amp;block_group-&gt;lock);</div><div class='del'>-		btrfs_free_path(path);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_i_size_write(BTRFS_I(inode), 0);</div><div class='del'>-	truncate_pagecache(inode, 0);</div><div class='add'>+	btrfs_i_size_write(inode, 0);</div><div class='add'>+	truncate_pagecache(vfs_inode, 0);</div><div class='add'>+</div><div class='add'>+	btrfs_lock_extent(&amp;inode-&gt;io_tree, 0, (u64)-1, &amp;cached_state);</div><div class='add'>+	btrfs_drop_extent_map_range(inode, 0, (u64)-1, false);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We skip the throttling logic for free space cache inodes, so we don't</div><div class='ctx'> 	 * need to check for -EAGAIN.</div><div class='ctx'> 	 */</div><div class='del'>-	ret = btrfs_truncate_inode_items(trans, root, BTRFS_I(inode),</div><div class='del'>-					 0, BTRFS_EXTENT_DATA_KEY, NULL);</div><div class='add'>+	ret = btrfs_truncate_inode_items(trans, root, &amp;control);</div><div class='add'>+</div><div class='add'>+	inode_sub_bytes(&amp;inode-&gt;vfs_inode, control.sub_bytes);</div><div class='add'>+	btrfs_inode_safe_disk_i_size_write(inode, control.last_size);</div><div class='add'>+</div><div class='add'>+	btrfs_unlock_extent(&amp;inode-&gt;io_tree, 0, (u64)-1, &amp;cached_state);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_update_inode(trans, root, BTRFS_I(inode));</div><div class='add'>+	ret = btrfs_update_inode(trans, inode);</div><div class='ctx'> </div><div class='ctx'> fail:</div><div class='ctx'> 	if (locked)</div><div class='hunk'>@@ -346,7 +366,7 @@ fail:</div><div class='ctx'> static void readahead_cache(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct file_ra_state ra;</div><div class='del'>-	unsigned long last_index;</div><div class='add'>+	pgoff_t last_index;</div><div class='ctx'> </div><div class='ctx'> 	file_ra_state_init(&amp;ra, inode-&gt;i_mapping);</div><div class='ctx'> 	last_index = (i_size_read(inode) - 1) &gt;&gt; PAGE_SHIFT;</div><div class='hunk'>@@ -372,7 +392,7 @@ static int io_ctl_init(struct btrfs_io_ctl *io_ctl, struct inode *inode,</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	io_ctl-&gt;num_pages = num_pages;</div><div class='del'>-	io_ctl-&gt;fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='add'>+	io_ctl-&gt;fs_info = inode_to_fs_info(inode);</div><div class='ctx'> 	io_ctl-&gt;inode = inode;</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -412,8 +432,8 @@ static void io_ctl_drop_pages(struct btrfs_io_ctl *io_ctl)</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; io_ctl-&gt;num_pages; i++) {</div><div class='ctx'> 		if (io_ctl-&gt;pages[i]) {</div><div class='del'>-			btrfs_page_clear_checked(io_ctl-&gt;fs_info,</div><div class='del'>-					io_ctl-&gt;pages[i],</div><div class='add'>+			btrfs_folio_clear_checked(io_ctl-&gt;fs_info,</div><div class='add'>+					page_folio(io_ctl-&gt;pages[i]),</div><div class='ctx'> 					page_offset(io_ctl-&gt;pages[i]),</div><div class='ctx'> 					PAGE_SIZE);</div><div class='ctx'> 			unlock_page(io_ctl-&gt;pages[i]);</div><div class='hunk'>@@ -424,7 +444,7 @@ static void io_ctl_drop_pages(struct btrfs_io_ctl *io_ctl)</div><div class='ctx'> </div><div class='ctx'> static int io_ctl_prepare_pages(struct btrfs_io_ctl *io_ctl, bool uptodate)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	struct inode *inode = io_ctl-&gt;inode;</div><div class='ctx'> 	gfp_t mask = btrfs_alloc_write_mask(inode-&gt;i_mapping);</div><div class='ctx'> 	int i;</div><div class='hunk'>@@ -432,31 +452,33 @@ static int io_ctl_prepare_pages(struct btrfs_io_ctl *io_ctl, bool uptodate)</div><div class='ctx'> 	for (i = 0; i &lt; io_ctl-&gt;num_pages; i++) {</div><div class='ctx'> 		int ret;</div><div class='ctx'> </div><div class='del'>-		page = find_or_create_page(inode-&gt;i_mapping, i, mask);</div><div class='del'>-		if (!page) {</div><div class='add'>+		folio = __filemap_get_folio(inode-&gt;i_mapping, i,</div><div class='add'>+					    FGP_LOCK | FGP_ACCESSED | FGP_CREAT,</div><div class='add'>+					    mask);</div><div class='add'>+		if (IS_ERR(folio)) {</div><div class='ctx'> 			io_ctl_drop_pages(io_ctl);</div><div class='del'>-			return -ENOMEM;</div><div class='add'>+			return PTR_ERR(folio);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		ret = set_page_extent_mapped(page);</div><div class='add'>+		ret = set_folio_extent_mapped(folio);</div><div class='ctx'> 		if (ret &lt; 0) {</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			put_page(page);</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+			folio_put(folio);</div><div class='ctx'> 			io_ctl_drop_pages(io_ctl);</div><div class='ctx'> 			return ret;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		io_ctl-&gt;pages[i] = page;</div><div class='del'>-		if (uptodate &amp;&amp; !PageUptodate(page)) {</div><div class='del'>-			btrfs_readpage(NULL, page);</div><div class='del'>-			lock_page(page);</div><div class='del'>-			if (page-&gt;mapping != inode-&gt;i_mapping) {</div><div class='add'>+		io_ctl-&gt;pages[i] = &amp;folio-&gt;page;</div><div class='add'>+		if (uptodate &amp;&amp; !folio_test_uptodate(folio)) {</div><div class='add'>+			btrfs_read_folio(NULL, folio);</div><div class='add'>+			folio_lock(folio);</div><div class='add'>+			if (folio-&gt;mapping != inode-&gt;i_mapping) {</div><div class='ctx'> 				btrfs_err(BTRFS_I(inode)-&gt;root-&gt;fs_info,</div><div class='ctx'> 					  "free space cache page truncated");</div><div class='ctx'> 				io_ctl_drop_pages(io_ctl);</div><div class='ctx'> 				return -EIO;</div><div class='ctx'> 			}</div><div class='del'>-			if (!PageUptodate(page)) {</div><div class='add'>+			if (!folio_test_uptodate(folio)) {</div><div class='ctx'> 				btrfs_err(BTRFS_I(inode)-&gt;root-&gt;fs_info,</div><div class='ctx'> 					   "error reading free space cache");</div><div class='ctx'> 				io_ctl_drop_pages(io_ctl);</div><div class='hunk'>@@ -518,7 +540,7 @@ static void io_ctl_set_crc(struct btrfs_io_ctl *io_ctl, int index)</div><div class='ctx'> 	if (index == 0)</div><div class='ctx'> 		offset = sizeof(u32) * io_ctl-&gt;num_pages;</div><div class='ctx'> </div><div class='del'>-	crc = btrfs_crc32c(crc, io_ctl-&gt;orig + offset, PAGE_SIZE - offset);</div><div class='add'>+	crc = crc32c(crc, io_ctl-&gt;orig + offset, PAGE_SIZE - offset);</div><div class='ctx'> 	btrfs_crc32c_final(crc, (u8 *)&amp;crc);</div><div class='ctx'> 	io_ctl_unmap_page(io_ctl);</div><div class='ctx'> 	tmp = page_address(io_ctl-&gt;pages[0]);</div><div class='hunk'>@@ -540,7 +562,7 @@ static int io_ctl_check_crc(struct btrfs_io_ctl *io_ctl, int index)</div><div class='ctx'> 	val = *tmp;</div><div class='ctx'> </div><div class='ctx'> 	io_ctl_map_page(io_ctl, 0);</div><div class='del'>-	crc = btrfs_crc32c(crc, io_ctl-&gt;orig + offset, PAGE_SIZE - offset);</div><div class='add'>+	crc = crc32c(crc, io_ctl-&gt;orig + offset, PAGE_SIZE - offset);</div><div class='ctx'> 	btrfs_crc32c_final(crc, (u8 *)&amp;crc);</div><div class='ctx'> 	if (val != crc) {</div><div class='ctx'> 		btrfs_err_rl(io_ctl-&gt;fs_info,</div><div class='hunk'>@@ -666,7 +688,7 @@ static int io_ctl_read_bitmap(struct btrfs_io_ctl *io_ctl,</div><div class='ctx'> </div><div class='ctx'> static void recalculate_thresholds(struct btrfs_free_space_ctl *ctl)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_block_group *block_group = ctl-&gt;private;</div><div class='add'>+	struct btrfs_block_group *block_group = ctl-&gt;block_group;</div><div class='ctx'> 	u64 max_bytes;</div><div class='ctx'> 	u64 bitmap_bytes;</div><div class='ctx'> 	u64 extent_bytes;</div><div class='hunk'>@@ -676,6 +698,12 @@ static void recalculate_thresholds(struct btrfs_free_space_ctl *ctl)</div><div class='ctx'> </div><div class='ctx'> 	max_bitmaps = max_t(u64, max_bitmaps, 1);</div><div class='ctx'> </div><div class='add'>+	if (ctl-&gt;total_bitmaps &gt; max_bitmaps)</div><div class='add'>+		btrfs_err(block_group-&gt;fs_info,</div><div class='add'>+"invalid free space control: bg start=%llu len=%llu total_bitmaps=%u unit=%u max_bitmaps=%llu bytes_per_bg=%llu",</div><div class='add'>+			  block_group-&gt;start, block_group-&gt;length,</div><div class='add'>+			  ctl-&gt;total_bitmaps, ctl-&gt;unit, max_bitmaps,</div><div class='add'>+			  bytes_per_bg);</div><div class='ctx'> 	ASSERT(ctl-&gt;total_bitmaps &lt;= max_bitmaps);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -724,8 +752,8 @@ static int __load_free_space_cache(struct btrfs_root *root, struct inode *inode,</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = BTRFS_FREE_SPACE_OBJECTID;</div><div class='del'>-	key.offset = offset;</div><div class='ctx'> 	key.type = 0;</div><div class='add'>+	key.offset = offset;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='hunk'>@@ -823,15 +851,17 @@ static int __load_free_space_cache(struct btrfs_root *root, struct inode *inode,</div><div class='ctx'> 			}</div><div class='ctx'> 			spin_lock(&amp;ctl-&gt;tree_lock);</div><div class='ctx'> 			ret = link_free_space(ctl, e);</div><div class='del'>-			ctl-&gt;total_bitmaps++;</div><div class='del'>-			recalculate_thresholds(ctl);</div><div class='del'>-			spin_unlock(&amp;ctl-&gt;tree_lock);</div><div class='ctx'> 			if (ret) {</div><div class='add'>+				spin_unlock(&amp;ctl-&gt;tree_lock);</div><div class='ctx'> 				btrfs_err(fs_info,</div><div class='ctx'> 					"Duplicate entries in free space cache, dumping");</div><div class='add'>+				kmem_cache_free(btrfs_free_space_bitmap_cachep, e-&gt;bitmap);</div><div class='ctx'> 				kmem_cache_free(btrfs_free_space_cachep, e);</div><div class='ctx'> 				goto free_cache;</div><div class='ctx'> 			}</div><div class='add'>+			ctl-&gt;total_bitmaps++;</div><div class='add'>+			recalculate_thresholds(ctl);</div><div class='add'>+			spin_unlock(&amp;ctl-&gt;tree_lock);</div><div class='ctx'> 			list_add_tail(&amp;e-&gt;list, &amp;bitmaps);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -858,7 +888,10 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> free_cache:</div><div class='ctx'> 	io_ctl_drop_pages(&amp;io_ctl);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;ctl-&gt;tree_lock);</div><div class='ctx'> 	__btrfs_remove_free_space_cache(ctl);</div><div class='add'>+	spin_unlock(&amp;ctl-&gt;tree_lock);</div><div class='ctx'> 	goto out;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -872,31 +905,37 @@ static int copy_free_space_cache(struct btrfs_block_group *block_group,</div><div class='ctx'> 	while (!ret &amp;&amp; (n = rb_first(&amp;ctl-&gt;free_space_offset)) != NULL) {</div><div class='ctx'> 		info = rb_entry(n, struct btrfs_free_space, offset_index);</div><div class='ctx'> 		if (!info-&gt;bitmap) {</div><div class='del'>-			unlink_free_space(ctl, info);</div><div class='del'>-			ret = btrfs_add_free_space(block_group, info-&gt;offset,</div><div class='del'>-						   info-&gt;bytes);</div><div class='add'>+			const u64 offset = info-&gt;offset;</div><div class='add'>+			const u64 bytes = info-&gt;bytes;</div><div class='add'>+</div><div class='add'>+			unlink_free_space(ctl, info, true);</div><div class='add'>+			spin_unlock(&amp;ctl-&gt;tree_lock);</div><div class='ctx'> 			kmem_cache_free(btrfs_free_space_cachep, info);</div><div class='add'>+			ret = btrfs_add_free_space(block_group, offset, bytes);</div><div class='add'>+			spin_lock(&amp;ctl-&gt;tree_lock);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			u64 offset = info-&gt;offset;</div><div class='ctx'> 			u64 bytes = ctl-&gt;unit;</div><div class='ctx'> </div><div class='del'>-			while (search_bitmap(ctl, info, &amp;offset, &amp;bytes,</div><div class='del'>-					     false) == 0) {</div><div class='add'>+			ret = search_bitmap(ctl, info, &amp;offset, &amp;bytes, false);</div><div class='add'>+			if (ret == 0) {</div><div class='add'>+				bitmap_clear_bits(ctl, info, offset, bytes, true);</div><div class='add'>+				spin_unlock(&amp;ctl-&gt;tree_lock);</div><div class='ctx'> 				ret = btrfs_add_free_space(block_group, offset,</div><div class='ctx'> 							   bytes);</div><div class='del'>-				if (ret)</div><div class='del'>-					break;</div><div class='del'>-				bitmap_clear_bits(ctl, info, offset, bytes);</div><div class='del'>-				offset = info-&gt;offset;</div><div class='del'>-				bytes = ctl-&gt;unit;</div><div class='add'>+				spin_lock(&amp;ctl-&gt;tree_lock);</div><div class='add'>+			} else {</div><div class='add'>+				free_bitmap(ctl, info);</div><div class='add'>+				ret = 0;</div><div class='ctx'> 			}</div><div class='del'>-			free_bitmap(ctl, info);</div><div class='ctx'> 		}</div><div class='del'>-		cond_resched();</div><div class='add'>+		cond_resched_lock(&amp;ctl-&gt;tree_lock);</div><div class='ctx'> 	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static struct lock_class_key btrfs_free_space_inode_key;</div><div class='add'>+</div><div class='ctx'> int load_free_space_cache(struct btrfs_block_group *block_group)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = block_group-&gt;fs_info;</div><div class='hunk'>@@ -929,8 +968,8 @@ int load_free_space_cache(struct btrfs_block_group *block_group)</div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return 0;</div><div class='del'>-	path-&gt;search_commit_root = 1;</div><div class='del'>-	path-&gt;skip_locking = 1;</div><div class='add'>+	path-&gt;search_commit_root = true;</div><div class='add'>+	path-&gt;skip_locking = true;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We must pass a path with search_commit_root set to btrfs_iget in</div><div class='hunk'>@@ -966,6 +1005,14 @@ int load_free_space_cache(struct btrfs_block_group *block_group)</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;block_group-&gt;lock);</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Reinitialize the class of struct inode's mapping-&gt;invalidate_lock for</div><div class='add'>+	 * free space inodes to prevent false positives related to locks for normal</div><div class='add'>+	 * inodes.</div><div class='add'>+	 */</div><div class='add'>+	lockdep_set_class(&amp;(&amp;inode-&gt;i_data)-&gt;invalidate_lock,</div><div class='add'>+			  &amp;btrfs_free_space_inode_key);</div><div class='add'>+</div><div class='ctx'> 	ret = __load_free_space_cache(fs_info-&gt;tree_root, inode, &amp;tmp_ctl,</div><div class='ctx'> 				      path, block_group-&gt;start);</div><div class='ctx'> 	btrfs_free_path(path);</div><div class='hunk'>@@ -976,7 +1023,9 @@ int load_free_space_cache(struct btrfs_block_group *block_group)</div><div class='ctx'> 					  block_group-&gt;bytes_super));</div><div class='ctx'> </div><div class='ctx'> 	if (matched) {</div><div class='add'>+		spin_lock(&amp;tmp_ctl.tree_lock);</div><div class='ctx'> 		ret = copy_free_space_cache(block_group, &amp;tmp_ctl);</div><div class='add'>+		spin_unlock(&amp;tmp_ctl.tree_lock);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * ret == 1 means we successfully loaded the free space cache,</div><div class='ctx'> 		 * so we need to re-set it here.</div><div class='hunk'>@@ -984,7 +1033,13 @@ int load_free_space_cache(struct btrfs_block_group *block_group)</div><div class='ctx'> 		if (ret == 0)</div><div class='ctx'> 			ret = 1;</div><div class='ctx'> 	} else {</div><div class='add'>+		/*</div><div class='add'>+		 * We need to call the _locked variant so we don't try to update</div><div class='add'>+		 * the discard counters.</div><div class='add'>+		 */</div><div class='add'>+		spin_lock(&amp;tmp_ctl.tree_lock);</div><div class='ctx'> 		__btrfs_remove_free_space_cache(&amp;tmp_ctl);</div><div class='add'>+		spin_unlock(&amp;tmp_ctl.tree_lock);</div><div class='ctx'> 		btrfs_warn(fs_info,</div><div class='ctx'> 			   "block group %llu has wrong amount of free space",</div><div class='ctx'> 			   block_group-&gt;start);</div><div class='hunk'>@@ -1025,9 +1080,8 @@ int write_cache_extent_entries(struct btrfs_io_ctl *io_ctl,</div><div class='ctx'> </div><div class='ctx'> 	/* Get the cluster for this block_group if it exists */</div><div class='ctx'> 	if (block_group &amp;&amp; !list_empty(&amp;block_group-&gt;cluster_list)) {</div><div class='del'>-		cluster = list_entry(block_group-&gt;cluster_list.next,</div><div class='del'>-				     struct btrfs_free_cluster,</div><div class='del'>-				     block_group_list);</div><div class='add'>+		cluster = list_first_entry(&amp;block_group-&gt;cluster_list,</div><div class='add'>+					   struct btrfs_free_cluster, block_group_list);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!node &amp;&amp; cluster) {</div><div class='hunk'>@@ -1100,13 +1154,13 @@ update_cache_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = BTRFS_FREE_SPACE_OBJECTID;</div><div class='del'>-	key.offset = offset;</div><div class='ctx'> 	key.type = 0;</div><div class='add'>+	key.offset = offset;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_search_slot(trans, root, &amp;key, path, 0, 1);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='del'>-		clear_extent_bit(&amp;BTRFS_I(inode)-&gt;io_tree, 0, inode-&gt;i_size - 1,</div><div class='del'>-				 EXTENT_DELALLOC, 0, 0, NULL);</div><div class='add'>+		btrfs_clear_extent_bit(&amp;BTRFS_I(inode)-&gt;io_tree, 0, inode-&gt;i_size - 1,</div><div class='add'>+				       EXTENT_DELALLOC, NULL);</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='hunk'>@@ -1117,9 +1171,9 @@ update_cache_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		btrfs_item_key_to_cpu(leaf, &amp;found_key, path-&gt;slots[0]);</div><div class='ctx'> 		if (found_key.objectid != BTRFS_FREE_SPACE_OBJECTID ||</div><div class='ctx'> 		    found_key.offset != offset) {</div><div class='del'>-			clear_extent_bit(&amp;BTRFS_I(inode)-&gt;io_tree, 0,</div><div class='del'>-					 inode-&gt;i_size - 1, EXTENT_DELALLOC, 0,</div><div class='del'>-					 0, NULL);</div><div class='add'>+			btrfs_clear_extent_bit(&amp;BTRFS_I(inode)-&gt;io_tree, 0,</div><div class='add'>+					       inode-&gt;i_size - 1, EXTENT_DELALLOC,</div><div class='add'>+					       NULL);</div><div class='ctx'> 			btrfs_release_path(path);</div><div class='ctx'> 			goto fail;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1131,7 +1185,6 @@ update_cache_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	btrfs_set_free_space_entries(leaf, header, entries);</div><div class='ctx'> 	btrfs_set_free_space_bitmaps(leaf, header, bitmaps);</div><div class='ctx'> 	btrfs_set_free_space_generation(leaf, header, trans-&gt;transid);</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -1165,10 +1218,9 @@ static noinline_for_stack int write_pinned_extent_entries(</div><div class='ctx'> 	start = block_group-&gt;start;</div><div class='ctx'> </div><div class='ctx'> 	while (start &lt; block_group-&gt;start + block_group-&gt;length) {</div><div class='del'>-		ret = find_first_extent_bit(unpin, start,</div><div class='del'>-					    &amp;extent_start, &amp;extent_end,</div><div class='del'>-					    EXTENT_DIRTY, NULL);</div><div class='del'>-		if (ret)</div><div class='add'>+		if (!btrfs_find_first_extent_bit(unpin, start,</div><div class='add'>+						 &amp;extent_start, &amp;extent_end,</div><div class='add'>+						 EXTENT_DIRTY, NULL))</div><div class='ctx'> 			return 0;</div><div class='ctx'> </div><div class='ctx'> 		/* This pinned extent is out of our range */</div><div class='hunk'>@@ -1212,10 +1264,10 @@ static int flush_dirty_cache(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_wait_ordered_range(inode, 0, (u64)-1);</div><div class='add'>+	ret = btrfs_wait_ordered_range(BTRFS_I(inode), 0, (u64)-1);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		clear_extent_bit(&amp;BTRFS_I(inode)-&gt;io_tree, 0, inode-&gt;i_size - 1,</div><div class='del'>-				 EXTENT_DELALLOC, 0, 0, NULL);</div><div class='add'>+		btrfs_clear_extent_bit(&amp;BTRFS_I(inode)-&gt;io_tree, 0, inode-&gt;i_size - 1,</div><div class='add'>+				       EXTENT_DELALLOC, NULL);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -1235,8 +1287,8 @@ cleanup_write_cache_enospc(struct inode *inode,</div><div class='ctx'> 			   struct extent_state **cached_state)</div><div class='ctx'> {</div><div class='ctx'> 	io_ctl_drop_pages(io_ctl);</div><div class='del'>-	unlock_extent_cached(&amp;BTRFS_I(inode)-&gt;io_tree, 0,</div><div class='del'>-			     i_size_read(inode) - 1, cached_state);</div><div class='add'>+	btrfs_unlock_extent(&amp;BTRFS_I(inode)-&gt;io_tree, 0, i_size_read(inode) - 1,</div><div class='add'>+			    cached_state);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int __btrfs_wait_cache_io(struct btrfs_root *root,</div><div class='hunk'>@@ -1268,7 +1320,7 @@ out:</div><div class='ctx'> 	  "failed to write free space cache for block group %llu error %d",</div><div class='ctx'> 				  block_group-&gt;start, ret);</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_update_inode(trans, root, BTRFS_I(inode));</div><div class='add'>+	btrfs_update_inode(trans, BTRFS_I(inode));</div><div class='ctx'> </div><div class='ctx'> 	if (block_group) {</div><div class='ctx'> 		/* the dirty list is protected by the dirty_bgs_lock */</div><div class='hunk'>@@ -1306,10 +1358,9 @@ int btrfs_wait_cache_io(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				     path, block_group-&gt;start);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * Write out cached info to an inode</div><div class='add'>+/*</div><div class='add'>+ * Write out cached info to an inode.</div><div class='ctx'>  *</div><div class='del'>- * @root:        root the inode belongs to</div><div class='ctx'>  * @inode:       freespace inode we are writing out</div><div class='ctx'>  * @ctl:         free space cache we are going to write out</div><div class='ctx'>  * @block_group: block_group for this cache if it belongs to a block_group</div><div class='hunk'>@@ -1320,7 +1371,7 @@ int btrfs_wait_cache_io(struct btrfs_trans_handle *trans,</div><div class='ctx'>  * on mount.  This will return 0 if it was successful in writing the cache out,</div><div class='ctx'>  * or an errno if it was not.</div><div class='ctx'>  */</div><div class='del'>-static int __btrfs_write_out_cache(struct btrfs_root *root, struct inode *inode,</div><div class='add'>+static int __btrfs_write_out_cache(struct inode *inode,</div><div class='ctx'> 				   struct btrfs_free_space_ctl *ctl,</div><div class='ctx'> 				   struct btrfs_block_group *block_group,</div><div class='ctx'> 				   struct btrfs_io_ctl *io_ctl,</div><div class='hunk'>@@ -1332,6 +1383,7 @@ static int __btrfs_write_out_cache(struct btrfs_root *root, struct inode *inode,</div><div class='ctx'> 	int bitmaps = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int must_iput = 0;</div><div class='add'>+	int i_size;</div><div class='ctx'> </div><div class='ctx'> 	if (!i_size_read(inode))</div><div class='ctx'> 		return -EIO;</div><div class='hunk'>@@ -1361,8 +1413,8 @@ static int __btrfs_write_out_cache(struct btrfs_root *root, struct inode *inode,</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='del'>-	lock_extent_bits(&amp;BTRFS_I(inode)-&gt;io_tree, 0, i_size_read(inode) - 1,</div><div class='del'>-			 &amp;cached_state);</div><div class='add'>+	btrfs_lock_extent(&amp;BTRFS_I(inode)-&gt;io_tree, 0, i_size_read(inode) - 1,</div><div class='add'>+			  &amp;cached_state);</div><div class='ctx'> </div><div class='ctx'> 	io_ctl_set_generation(io_ctl, trans-&gt;transid);</div><div class='ctx'> </div><div class='hunk'>@@ -1402,11 +1454,16 @@ static int __btrfs_write_out_cache(struct btrfs_root *root, struct inode *inode,</div><div class='ctx'> 	io_ctl_zero_remaining_pages(io_ctl);</div><div class='ctx'> </div><div class='ctx'> 	/* Everything is written out, now we dirty the pages in the file. */</div><div class='del'>-	ret = btrfs_dirty_pages(BTRFS_I(inode), io_ctl-&gt;pages,</div><div class='del'>-				io_ctl-&gt;num_pages, 0, i_size_read(inode),</div><div class='del'>-				&amp;cached_state, false);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto out_nospc;</div><div class='add'>+	i_size = i_size_read(inode);</div><div class='add'>+	for (int i = 0; i &lt; round_up(i_size, PAGE_SIZE) / PAGE_SIZE; i++) {</div><div class='add'>+		u64 dirty_start = i * PAGE_SIZE;</div><div class='add'>+		u64 dirty_len = min_t(u64, dirty_start + PAGE_SIZE, i_size) - dirty_start;</div><div class='add'>+</div><div class='add'>+		ret = btrfs_dirty_folio(BTRFS_I(inode), page_folio(io_ctl-&gt;pages[i]),</div><div class='add'>+					dirty_start, dirty_len, &amp;cached_state, false);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out_nospc;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (block_group &amp;&amp; (block_group-&gt;flags &amp; BTRFS_BLOCK_GROUP_DATA))</div><div class='ctx'> 		up_write(&amp;block_group-&gt;data_rwsem);</div><div class='hunk'>@@ -1417,8 +1474,8 @@ static int __btrfs_write_out_cache(struct btrfs_root *root, struct inode *inode,</div><div class='ctx'> 	io_ctl_drop_pages(io_ctl);</div><div class='ctx'> 	io_ctl_free(io_ctl);</div><div class='ctx'> </div><div class='del'>-	unlock_extent_cached(&amp;BTRFS_I(inode)-&gt;io_tree, 0,</div><div class='del'>-			     i_size_read(inode) - 1, &amp;cached_state);</div><div class='add'>+	btrfs_unlock_extent(&amp;BTRFS_I(inode)-&gt;io_tree, 0, i_size_read(inode) - 1,</div><div class='add'>+			    &amp;cached_state);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * at this point the pages are under IO and we're happy,</div><div class='hunk'>@@ -1428,7 +1485,7 @@ static int __btrfs_write_out_cache(struct btrfs_root *root, struct inode *inode,</div><div class='ctx'> 	io_ctl-&gt;entries = entries;</div><div class='ctx'> 	io_ctl-&gt;bitmaps = bitmaps;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_fdatawrite_range(inode, 0, (u64)-1);</div><div class='add'>+	ret = btrfs_fdatawrite_range(BTRFS_I(inode), 0, (u64)-1);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -1453,7 +1510,7 @@ out:</div><div class='ctx'> 		invalidate_inode_pages2(inode-&gt;i_mapping);</div><div class='ctx'> 		BTRFS_I(inode)-&gt;generation = 0;</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_update_inode(trans, root, BTRFS_I(inode));</div><div class='add'>+	btrfs_update_inode(trans, BTRFS_I(inode));</div><div class='ctx'> 	if (must_iput)</div><div class='ctx'> 		iput(inode);</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -1479,8 +1536,8 @@ int btrfs_write_out_cache(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	if (IS_ERR(inode))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	ret = __btrfs_write_out_cache(fs_info-&gt;tree_root, inode, ctl,</div><div class='del'>-				block_group, &amp;block_group-&gt;io_ctl, trans);</div><div class='add'>+	ret = __btrfs_write_out_cache(inode, ctl, block_group,</div><div class='add'>+				      &amp;block_group-&gt;io_ctl, trans);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		btrfs_debug(fs_info,</div><div class='ctx'> 	  "failed to write free space cache for block group %llu error %d",</div><div class='hunk'>@@ -1529,20 +1586,34 @@ static inline u64 offset_to_bitmap(struct btrfs_free_space_ctl *ctl,</div><div class='ctx'> 	return bitmap_start;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int tree_insert_offset(struct rb_root *root, u64 offset,</div><div class='del'>-			      struct rb_node *node, int bitmap)</div><div class='add'>+static int tree_insert_offset(struct btrfs_free_space_ctl *ctl,</div><div class='add'>+			      struct btrfs_free_cluster *cluster,</div><div class='add'>+			      struct btrfs_free_space *new_entry)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node **p = &amp;root-&gt;rb_node;</div><div class='add'>+	struct rb_root *root;</div><div class='add'>+	struct rb_node **p;</div><div class='ctx'> 	struct rb_node *parent = NULL;</div><div class='del'>-	struct btrfs_free_space *info;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held(&amp;ctl-&gt;tree_lock);</div><div class='add'>+</div><div class='add'>+	if (cluster) {</div><div class='add'>+		lockdep_assert_held(&amp;cluster-&gt;lock);</div><div class='add'>+		root = &amp;cluster-&gt;root;</div><div class='add'>+	} else {</div><div class='add'>+		root = &amp;ctl-&gt;free_space_offset;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	p = &amp;root-&gt;rb_node;</div><div class='ctx'> </div><div class='ctx'> 	while (*p) {</div><div class='add'>+		struct btrfs_free_space *info;</div><div class='add'>+</div><div class='ctx'> 		parent = *p;</div><div class='ctx'> 		info = rb_entry(parent, struct btrfs_free_space, offset_index);</div><div class='ctx'> </div><div class='del'>-		if (offset &lt; info-&gt;offset) {</div><div class='add'>+		if (new_entry-&gt;offset &lt; info-&gt;offset) {</div><div class='ctx'> 			p = &amp;(*p)-&gt;rb_left;</div><div class='del'>-		} else if (offset &gt; info-&gt;offset) {</div><div class='add'>+		} else if (new_entry-&gt;offset &gt; info-&gt;offset) {</div><div class='ctx'> 			p = &amp;(*p)-&gt;rb_right;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			/*</div><div class='hunk'>@@ -1558,7 +1629,7 @@ static int tree_insert_offset(struct rb_root *root, u64 offset,</div><div class='ctx'> 			 * found a bitmap, we want to go left, or before</div><div class='ctx'> 			 * logically.</div><div class='ctx'> 			 */</div><div class='del'>-			if (bitmap) {</div><div class='add'>+			if (new_entry-&gt;bitmap) {</div><div class='ctx'> 				if (info-&gt;bitmap) {</div><div class='ctx'> 					WARN_ON_ONCE(1);</div><div class='ctx'> 					return -EEXIST;</div><div class='hunk'>@@ -1574,13 +1645,57 @@ static int tree_insert_offset(struct rb_root *root, u64 offset,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	rb_link_node(node, parent, p);</div><div class='del'>-	rb_insert_color(node, root);</div><div class='add'>+	rb_link_node(&amp;new_entry-&gt;offset_index, parent, p);</div><div class='add'>+	rb_insert_color(&amp;new_entry-&gt;offset_index, root);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * This is a little subtle.  We *only* have -&gt;max_extent_size set if we actually</div><div class='add'>+ * searched through the bitmap and figured out the largest -&gt;max_extent_size,</div><div class='add'>+ * otherwise it's 0.  In the case that it's 0 we don't want to tell the</div><div class='add'>+ * allocator the wrong thing, we want to use the actual real max_extent_size</div><div class='add'>+ * we've found already if it's larger, or we want to use -&gt;bytes.</div><div class='add'>+ *</div><div class='add'>+ * This matters because find_free_space() will skip entries who's -&gt;bytes is</div><div class='add'>+ * less than the required bytes.  So if we didn't search down this bitmap, we</div><div class='add'>+ * may pick some previous entry that has a smaller -&gt;max_extent_size than we</div><div class='add'>+ * have.  For example, assume we have two entries, one that has</div><div class='add'>+ * -&gt;max_extent_size set to 4K and -&gt;bytes set to 1M.  A second entry hasn't set</div><div class='add'>+ * -&gt;max_extent_size yet, has -&gt;bytes set to 8K and it's contiguous.  We will</div><div class='add'>+ *  call into find_free_space(), and return with max_extent_size == 4K, because</div><div class='add'>+ *  that first bitmap entry had -&gt;max_extent_size set, but the second one did</div><div class='add'>+ *  not.  If instead we returned 8K we'd come in searching for 8K, and find the</div><div class='add'>+ *  8K contiguous range.</div><div class='add'>+ *</div><div class='add'>+ *  Consider the other case, we have 2 8K chunks in that second entry and still</div><div class='add'>+ *  don't have -&gt;max_extent_size set.  We'll return 16K, and the next time the</div><div class='add'>+ *  allocator comes in it'll fully search our second bitmap, and this time it'll</div><div class='add'>+ *  get an uptodate value of 8K as the maximum chunk size.  Then we'll get the</div><div class='add'>+ *  right allocation the next loop through.</div><div class='add'>+ */</div><div class='add'>+static inline u64 get_max_extent_size(const struct btrfs_free_space *entry)</div><div class='add'>+{</div><div class='add'>+	if (entry-&gt;bitmap &amp;&amp; entry-&gt;max_extent_size)</div><div class='add'>+		return entry-&gt;max_extent_size;</div><div class='add'>+	return entry-&gt;bytes;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * We want the largest entry to be leftmost, so this is inverted from what you'd</div><div class='add'>+ * normally expect.</div><div class='add'>+ */</div><div class='add'>+static bool entry_less(struct rb_node *node, const struct rb_node *parent)</div><div class='add'>+{</div><div class='add'>+	const struct btrfs_free_space *entry, *exist;</div><div class='add'>+</div><div class='add'>+	entry = rb_entry(node, struct btrfs_free_space, bytes_index);</div><div class='add'>+	exist = rb_entry(parent, struct btrfs_free_space, bytes_index);</div><div class='add'>+	return get_max_extent_size(exist) &lt; get_max_extent_size(entry);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * searches the tree for the given offset.</div><div class='ctx'>  *</div><div class='ctx'>  * fuzzy - If this is set, then we are trying to make an allocation, and we just</div><div class='hunk'>@@ -1592,15 +1707,12 @@ tree_search_offset(struct btrfs_free_space_ctl *ctl,</div><div class='ctx'> 		   u64 offset, int bitmap_only, int fuzzy)</div><div class='ctx'> {</div><div class='ctx'> 	struct rb_node *n = ctl-&gt;free_space_offset.rb_node;</div><div class='del'>-	struct btrfs_free_space *entry, *prev = NULL;</div><div class='add'>+	struct btrfs_free_space *entry = NULL, *prev = NULL;</div><div class='ctx'> </div><div class='del'>-	/* find entry that is closest to the 'offset' */</div><div class='del'>-	while (1) {</div><div class='del'>-		if (!n) {</div><div class='del'>-			entry = NULL;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='add'>+	lockdep_assert_held(&amp;ctl-&gt;tree_lock);</div><div class='ctx'> </div><div class='add'>+	/* find entry that is closest to the 'offset' */</div><div class='add'>+	while (n) {</div><div class='ctx'> 		entry = rb_entry(n, struct btrfs_free_space, offset_index);</div><div class='ctx'> 		prev = entry;</div><div class='ctx'> </div><div class='hunk'>@@ -1610,6 +1722,8 @@ tree_search_offset(struct btrfs_free_space_ctl *ctl,</div><div class='ctx'> 			n = n-&gt;rb_right;</div><div class='ctx'> 		else</div><div class='ctx'> 			break;</div><div class='add'>+</div><div class='add'>+		entry = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (bitmap_only) {</div><div class='hunk'>@@ -1686,6 +1800,10 @@ tree_search_offset(struct btrfs_free_space_ctl *ctl,</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='add'>+		n = rb_next(&amp;entry-&gt;offset_index);</div><div class='add'>+		if (!n)</div><div class='add'>+			return NULL;</div><div class='add'>+		entry = rb_entry(n, struct btrfs_free_space, offset_index);</div><div class='ctx'> 		if (entry-&gt;bitmap) {</div><div class='ctx'> 			if (entry-&gt;offset + BITS_PER_BITMAP *</div><div class='ctx'> 			    ctl-&gt;unit &gt; offset)</div><div class='hunk'>@@ -1694,33 +1812,27 @@ tree_search_offset(struct btrfs_free_space_ctl *ctl,</div><div class='ctx'> 			if (entry-&gt;offset + entry-&gt;bytes &gt; offset)</div><div class='ctx'> 				break;</div><div class='ctx'> 		}</div><div class='del'>-</div><div class='del'>-		n = rb_next(&amp;entry-&gt;offset_index);</div><div class='del'>-		if (!n)</div><div class='del'>-			return NULL;</div><div class='del'>-		entry = rb_entry(n, struct btrfs_free_space, offset_index);</div><div class='ctx'> 	}</div><div class='ctx'> 	return entry;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void</div><div class='del'>-__unlink_free_space(struct btrfs_free_space_ctl *ctl,</div><div class='del'>-		    struct btrfs_free_space *info)</div><div class='add'>+static inline void unlink_free_space(struct btrfs_free_space_ctl *ctl,</div><div class='add'>+				     struct btrfs_free_space *info,</div><div class='add'>+				     bool update_stat)</div><div class='ctx'> {</div><div class='add'>+	lockdep_assert_held(&amp;ctl-&gt;tree_lock);</div><div class='add'>+</div><div class='ctx'> 	rb_erase(&amp;info-&gt;offset_index, &amp;ctl-&gt;free_space_offset);</div><div class='add'>+	rb_erase_cached(&amp;info-&gt;bytes_index, &amp;ctl-&gt;free_space_bytes);</div><div class='ctx'> 	ctl-&gt;free_extents--;</div><div class='ctx'> </div><div class='ctx'> 	if (!info-&gt;bitmap &amp;&amp; !btrfs_free_space_trimmed(info)) {</div><div class='ctx'> 		ctl-&gt;discardable_extents[BTRFS_STAT_CURR]--;</div><div class='ctx'> 		ctl-&gt;discardable_bytes[BTRFS_STAT_CURR] -= info-&gt;bytes;</div><div class='ctx'> 	}</div><div class='del'>-}</div><div class='ctx'> </div><div class='del'>-static void unlink_free_space(struct btrfs_free_space_ctl *ctl,</div><div class='del'>-			      struct btrfs_free_space *info)</div><div class='del'>-{</div><div class='del'>-	__unlink_free_space(ctl, info);</div><div class='del'>-	ctl-&gt;free_space -= info-&gt;bytes;</div><div class='add'>+	if (update_stat)</div><div class='add'>+		ctl-&gt;free_space -= info-&gt;bytes;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int link_free_space(struct btrfs_free_space_ctl *ctl,</div><div class='hunk'>@@ -1728,12 +1840,15 @@ static int link_free_space(struct btrfs_free_space_ctl *ctl,</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='add'>+	lockdep_assert_held(&amp;ctl-&gt;tree_lock);</div><div class='add'>+</div><div class='ctx'> 	ASSERT(info-&gt;bytes || info-&gt;bitmap);</div><div class='del'>-	ret = tree_insert_offset(&amp;ctl-&gt;free_space_offset, info-&gt;offset,</div><div class='del'>-				 &amp;info-&gt;offset_index, (info-&gt;bitmap != NULL));</div><div class='add'>+	ret = tree_insert_offset(ctl, NULL, info);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='add'>+	rb_add_cached(&amp;info-&gt;bytes_index, &amp;ctl-&gt;free_space_bytes, entry_less);</div><div class='add'>+</div><div class='ctx'> 	if (!info-&gt;bitmap &amp;&amp; !btrfs_free_space_trimmed(info)) {</div><div class='ctx'> 		ctl-&gt;discardable_extents[BTRFS_STAT_CURR]++;</div><div class='ctx'> 		ctl-&gt;discardable_bytes[BTRFS_STAT_CURR] += info-&gt;bytes;</div><div class='hunk'>@@ -1744,9 +1859,27 @@ static int link_free_space(struct btrfs_free_space_ctl *ctl,</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void __bitmap_clear_bits(struct btrfs_free_space_ctl *ctl,</div><div class='del'>-				       struct btrfs_free_space *info,</div><div class='del'>-				       u64 offset, u64 bytes)</div><div class='add'>+static void relink_bitmap_entry(struct btrfs_free_space_ctl *ctl,</div><div class='add'>+				struct btrfs_free_space *info)</div><div class='add'>+{</div><div class='add'>+	ASSERT(info-&gt;bitmap);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If our entry is empty it's because we're on a cluster and we don't</div><div class='add'>+	 * want to re-link it into our ctl bytes index.</div><div class='add'>+	 */</div><div class='add'>+	if (RB_EMPTY_NODE(&amp;info-&gt;bytes_index))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held(&amp;ctl-&gt;tree_lock);</div><div class='add'>+</div><div class='add'>+	rb_erase_cached(&amp;info-&gt;bytes_index, &amp;ctl-&gt;free_space_bytes);</div><div class='add'>+	rb_add_cached(&amp;info-&gt;bytes_index, &amp;ctl-&gt;free_space_bytes, entry_less);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void bitmap_clear_bits(struct btrfs_free_space_ctl *ctl,</div><div class='add'>+				     struct btrfs_free_space *info,</div><div class='add'>+				     u64 offset, u64 bytes, bool update_stat)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned long start, count, end;</div><div class='ctx'> 	int extent_delta = -1;</div><div class='hunk'>@@ -1762,6 +1895,8 @@ static inline void __bitmap_clear_bits(struct btrfs_free_space_ctl *ctl,</div><div class='ctx'> 	if (info-&gt;max_extent_size &gt; ctl-&gt;unit)</div><div class='ctx'> 		info-&gt;max_extent_size = 0;</div><div class='ctx'> </div><div class='add'>+	relink_bitmap_entry(ctl, info);</div><div class='add'>+</div><div class='ctx'> 	if (start &amp;&amp; test_bit(start - 1, info-&gt;bitmap))</div><div class='ctx'> 		extent_delta++;</div><div class='ctx'> </div><div class='hunk'>@@ -1773,19 +1908,14 @@ static inline void __bitmap_clear_bits(struct btrfs_free_space_ctl *ctl,</div><div class='ctx'> 		ctl-&gt;discardable_extents[BTRFS_STAT_CURR] += extent_delta;</div><div class='ctx'> 		ctl-&gt;discardable_bytes[BTRFS_STAT_CURR] -= bytes;</div><div class='ctx'> 	}</div><div class='del'>-}</div><div class='ctx'> </div><div class='del'>-static void bitmap_clear_bits(struct btrfs_free_space_ctl *ctl,</div><div class='del'>-			      struct btrfs_free_space *info, u64 offset,</div><div class='del'>-			      u64 bytes)</div><div class='del'>-{</div><div class='del'>-	__bitmap_clear_bits(ctl, info, offset, bytes);</div><div class='del'>-	ctl-&gt;free_space -= bytes;</div><div class='add'>+	if (update_stat)</div><div class='add'>+		ctl-&gt;free_space -= bytes;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void bitmap_set_bits(struct btrfs_free_space_ctl *ctl,</div><div class='del'>-			    struct btrfs_free_space *info, u64 offset,</div><div class='del'>-			    u64 bytes)</div><div class='add'>+static void btrfs_bitmap_set_bits(struct btrfs_free_space_ctl *ctl,</div><div class='add'>+				  struct btrfs_free_space *info, u64 offset,</div><div class='add'>+				  u64 bytes)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned long start, count, end;</div><div class='ctx'> 	int extent_delta = 1;</div><div class='hunk'>@@ -1797,9 +1927,16 @@ static void bitmap_set_bits(struct btrfs_free_space_ctl *ctl,</div><div class='ctx'> </div><div class='ctx'> 	bitmap_set(info-&gt;bitmap, start, count);</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * We set some bytes, we have no idea what the max extent size is</div><div class='add'>+	 * anymore.</div><div class='add'>+	 */</div><div class='add'>+	info-&gt;max_extent_size = 0;</div><div class='ctx'> 	info-&gt;bytes += bytes;</div><div class='ctx'> 	ctl-&gt;free_space += bytes;</div><div class='ctx'> </div><div class='add'>+	relink_bitmap_entry(ctl, info);</div><div class='add'>+</div><div class='ctx'> 	if (start &amp;&amp; test_bit(start - 1, info-&gt;bitmap))</div><div class='ctx'> 		extent_delta--;</div><div class='ctx'> </div><div class='hunk'>@@ -1867,20 +2004,14 @@ static int search_bitmap(struct btrfs_free_space_ctl *ctl,</div><div class='ctx'> </div><div class='ctx'> 	*bytes = (u64)(max_bits) * ctl-&gt;unit;</div><div class='ctx'> 	bitmap_info-&gt;max_extent_size = *bytes;</div><div class='add'>+	relink_bitmap_entry(ctl, bitmap_info);</div><div class='ctx'> 	return -1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u64 get_max_extent_size(struct btrfs_free_space *entry)</div><div class='del'>-{</div><div class='del'>-	if (entry-&gt;bitmap)</div><div class='del'>-		return entry-&gt;max_extent_size;</div><div class='del'>-	return entry-&gt;bytes;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /* Cache the size of the max extent in bytes */</div><div class='ctx'> static struct btrfs_free_space *</div><div class='ctx'> find_free_space(struct btrfs_free_space_ctl *ctl, u64 *offset, u64 *bytes,</div><div class='del'>-		unsigned long align, u64 *max_extent_size)</div><div class='add'>+		unsigned long align, u64 *max_extent_size, bool use_bytes_index)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_free_space *entry;</div><div class='ctx'> 	struct rb_node *node;</div><div class='hunk'>@@ -1890,16 +2021,38 @@ find_free_space(struct btrfs_free_space_ctl *ctl, u64 *offset, u64 *bytes,</div><div class='ctx'> </div><div class='ctx'> 	if (!ctl-&gt;free_space_offset.rb_node)</div><div class='ctx'> 		goto out;</div><div class='add'>+again:</div><div class='add'>+	if (use_bytes_index) {</div><div class='add'>+		node = rb_first_cached(&amp;ctl-&gt;free_space_bytes);</div><div class='add'>+	} else {</div><div class='add'>+		entry = tree_search_offset(ctl, offset_to_bitmap(ctl, *offset),</div><div class='add'>+					   0, 1);</div><div class='add'>+		if (!entry)</div><div class='add'>+			goto out;</div><div class='add'>+		node = &amp;entry-&gt;offset_index;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	entry = tree_search_offset(ctl, offset_to_bitmap(ctl, *offset), 0, 1);</div><div class='del'>-	if (!entry)</div><div class='del'>-		goto out;</div><div class='add'>+	for (; node; node = rb_next(node)) {</div><div class='add'>+		if (use_bytes_index)</div><div class='add'>+			entry = rb_entry(node, struct btrfs_free_space,</div><div class='add'>+					 bytes_index);</div><div class='add'>+		else</div><div class='add'>+			entry = rb_entry(node, struct btrfs_free_space,</div><div class='add'>+					 offset_index);</div><div class='ctx'> </div><div class='del'>-	for (node = &amp;entry-&gt;offset_index; node; node = rb_next(node)) {</div><div class='del'>-		entry = rb_entry(node, struct btrfs_free_space, offset_index);</div><div class='add'>+		/*</div><div class='add'>+		 * If we are using the bytes index then all subsequent entries</div><div class='add'>+		 * in this tree are going to be &lt; bytes, so simply set the max</div><div class='add'>+		 * extent size and exit the loop.</div><div class='add'>+		 *</div><div class='add'>+		 * If we're using the offset index then we need to keep going</div><div class='add'>+		 * through the rest of the tree.</div><div class='add'>+		 */</div><div class='ctx'> 		if (entry-&gt;bytes &lt; *bytes) {</div><div class='ctx'> 			*max_extent_size = max(get_max_extent_size(entry),</div><div class='ctx'> 					       *max_extent_size);</div><div class='add'>+			if (use_bytes_index)</div><div class='add'>+				break;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -1916,6 +2069,13 @@ find_free_space(struct btrfs_free_space_ctl *ctl, u64 *offset, u64 *bytes,</div><div class='ctx'> 			tmp = entry-&gt;offset;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		/*</div><div class='add'>+		 * We don't break here if we're using the bytes index because we</div><div class='add'>+		 * may have another entry that has the correct alignment that is</div><div class='add'>+		 * the right size, so we don't want to miss that possibility.</div><div class='add'>+		 * At worst this adds another loop through the logic, but if we</div><div class='add'>+		 * broke here we could prematurely ENOSPC.</div><div class='add'>+		 */</div><div class='ctx'> 		if (entry-&gt;bytes &lt; *bytes + align_off) {</div><div class='ctx'> 			*max_extent_size = max(get_max_extent_size(entry),</div><div class='ctx'> 					       *max_extent_size);</div><div class='hunk'>@@ -1923,6 +2083,7 @@ find_free_space(struct btrfs_free_space_ctl *ctl, u64 *offset, u64 *bytes,</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (entry-&gt;bitmap) {</div><div class='add'>+			struct rb_node *old_next = rb_next(node);</div><div class='ctx'> 			u64 size = *bytes;</div><div class='ctx'> </div><div class='ctx'> 			ret = search_bitmap(ctl, entry, &amp;tmp, &amp;size, true);</div><div class='hunk'>@@ -1935,6 +2096,15 @@ find_free_space(struct btrfs_free_space_ctl *ctl, u64 *offset, u64 *bytes,</div><div class='ctx'> 					max(get_max_extent_size(entry),</div><div class='ctx'> 					    *max_extent_size);</div><div class='ctx'> 			}</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * The bitmap may have gotten re-arranged in the space</div><div class='add'>+			 * index here because the max_extent_size may have been</div><div class='add'>+			 * updated.  Start from the beginning again if this</div><div class='add'>+			 * happened.</div><div class='add'>+			 */</div><div class='add'>+			if (use_bytes_index &amp;&amp; old_next != rb_next(node))</div><div class='add'>+				goto again;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -1973,7 +2143,7 @@ static void free_bitmap(struct btrfs_free_space_ctl *ctl,</div><div class='ctx'> 		ctl-&gt;discardable_bytes[BTRFS_STAT_CURR] -= bitmap_info-&gt;bytes;</div><div class='ctx'> </div><div class='ctx'> 	}</div><div class='del'>-	unlink_free_space(ctl, bitmap_info);</div><div class='add'>+	unlink_free_space(ctl, bitmap_info, true);</div><div class='ctx'> 	kmem_cache_free(btrfs_free_space_bitmap_cachep, bitmap_info-&gt;bitmap);</div><div class='ctx'> 	kmem_cache_free(btrfs_free_space_cachep, bitmap_info);</div><div class='ctx'> 	ctl-&gt;total_bitmaps--;</div><div class='hunk'>@@ -2011,7 +2181,7 @@ again:</div><div class='ctx'> 	/* Cannot clear past the end of the bitmap */</div><div class='ctx'> 	search_bytes = min(search_bytes, end - search_start + 1);</div><div class='ctx'> </div><div class='del'>-	bitmap_clear_bits(ctl, bitmap_info, search_start, search_bytes);</div><div class='add'>+	bitmap_clear_bits(ctl, bitmap_info, search_start, search_bytes, true);</div><div class='ctx'> 	*offset += search_bytes;</div><div class='ctx'> 	*bytes -= search_bytes;</div><div class='ctx'> </div><div class='hunk'>@@ -2081,13 +2251,7 @@ static u64 add_bytes_to_bitmap(struct btrfs_free_space_ctl *ctl,</div><div class='ctx'> </div><div class='ctx'> 	bytes_to_set = min(end - offset, bytes);</div><div class='ctx'> </div><div class='del'>-	bitmap_set_bits(ctl, info, offset, bytes_to_set);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * We set some bytes, we have no idea what the max extent size is</div><div class='del'>-	 * anymore.</div><div class='del'>-	 */</div><div class='del'>-	info-&gt;max_extent_size = 0;</div><div class='add'>+	btrfs_bitmap_set_bits(ctl, info, offset, bytes_to_set);</div><div class='ctx'> </div><div class='ctx'> 	return bytes_to_set;</div><div class='ctx'> </div><div class='hunk'>@@ -2096,7 +2260,7 @@ static u64 add_bytes_to_bitmap(struct btrfs_free_space_ctl *ctl,</div><div class='ctx'> static bool use_bitmap(struct btrfs_free_space_ctl *ctl,</div><div class='ctx'> 		      struct btrfs_free_space *info)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_block_group *block_group = ctl-&gt;private;</div><div class='add'>+	struct btrfs_block_group *block_group = ctl-&gt;block_group;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = block_group-&gt;fs_info;</div><div class='ctx'> 	bool forced = false;</div><div class='ctx'> </div><div class='hunk'>@@ -2118,7 +2282,7 @@ static bool use_bitmap(struct btrfs_free_space_ctl *ctl,</div><div class='ctx'> 		 * If this block group has some small extents we don't want to</div><div class='ctx'> 		 * use up all of our free slots in the cache with them, we want</div><div class='ctx'> 		 * to reserve them to larger extents, however if we have plenty</div><div class='del'>-		 * of cache left then go ahead an dadd them, no sense in adding</div><div class='add'>+		 * of cache left then go ahead and add them, no sense in adding</div><div class='ctx'> 		 * the overhead of a bitmap if we don't have to.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (info-&gt;bytes &lt;= fs_info-&gt;sectorsize * 8) {</div><div class='hunk'>@@ -2165,7 +2329,7 @@ static int insert_into_bitmap(struct btrfs_free_space_ctl *ctl,</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	if (ctl-&gt;op == &amp;free_space_op)</div><div class='del'>-		block_group = ctl-&gt;private;</div><div class='add'>+		block_group = ctl-&gt;block_group;</div><div class='ctx'> again:</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Since we link bitmaps right into the cluster we need to see if we</div><div class='hunk'>@@ -2177,9 +2341,8 @@ again:</div><div class='ctx'> 		struct rb_node *node;</div><div class='ctx'> 		struct btrfs_free_space *entry;</div><div class='ctx'> </div><div class='del'>-		cluster = list_entry(block_group-&gt;cluster_list.next,</div><div class='del'>-				     struct btrfs_free_cluster,</div><div class='del'>-				     block_group_list);</div><div class='add'>+		cluster = list_first_entry(&amp;block_group-&gt;cluster_list,</div><div class='add'>+					   struct btrfs_free_cluster, block_group_list);</div><div class='ctx'> 		spin_lock(&amp;cluster-&gt;lock);</div><div class='ctx'> 		node = rb_first(&amp;cluster-&gt;root);</div><div class='ctx'> 		if (!node) {</div><div class='hunk'>@@ -2294,6 +2457,7 @@ static bool try_merge_free_space(struct btrfs_free_space_ctl *ctl,</div><div class='ctx'> 	u64 offset = info-&gt;offset;</div><div class='ctx'> 	u64 bytes = info-&gt;bytes;</div><div class='ctx'> 	const bool is_trimmed = btrfs_free_space_trimmed(info);</div><div class='add'>+	struct rb_node *right_prev = NULL;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * first we want to see if there is free space adjacent to the range we</div><div class='hunk'>@@ -2301,19 +2465,18 @@ static bool try_merge_free_space(struct btrfs_free_space_ctl *ctl,</div><div class='ctx'> 	 * cover the entire range</div><div class='ctx'> 	 */</div><div class='ctx'> 	right_info = tree_search_offset(ctl, offset + bytes, 0, 0);</div><div class='del'>-	if (right_info &amp;&amp; rb_prev(&amp;right_info-&gt;offset_index))</div><div class='del'>-		left_info = rb_entry(rb_prev(&amp;right_info-&gt;offset_index),</div><div class='del'>-				     struct btrfs_free_space, offset_index);</div><div class='add'>+	if (right_info)</div><div class='add'>+		right_prev = rb_prev(&amp;right_info-&gt;offset_index);</div><div class='add'>+</div><div class='add'>+	if (right_prev)</div><div class='add'>+		left_info = rb_entry(right_prev, struct btrfs_free_space, offset_index);</div><div class='ctx'> 	else if (!right_info)</div><div class='ctx'> 		left_info = tree_search_offset(ctl, offset - 1, 0, 0);</div><div class='ctx'> </div><div class='ctx'> 	/* See try_merge_free_space() comment. */</div><div class='ctx'> 	if (right_info &amp;&amp; !right_info-&gt;bitmap &amp;&amp;</div><div class='ctx'> 	    (!is_trimmed || btrfs_free_space_trimmed(right_info))) {</div><div class='del'>-		if (update_stat)</div><div class='del'>-			unlink_free_space(ctl, right_info);</div><div class='del'>-		else</div><div class='del'>-			__unlink_free_space(ctl, right_info);</div><div class='add'>+		unlink_free_space(ctl, right_info, update_stat);</div><div class='ctx'> 		info-&gt;bytes += right_info-&gt;bytes;</div><div class='ctx'> 		kmem_cache_free(btrfs_free_space_cachep, right_info);</div><div class='ctx'> 		merged = true;</div><div class='hunk'>@@ -2323,10 +2486,7 @@ static bool try_merge_free_space(struct btrfs_free_space_ctl *ctl,</div><div class='ctx'> 	if (left_info &amp;&amp; !left_info-&gt;bitmap &amp;&amp;</div><div class='ctx'> 	    left_info-&gt;offset + left_info-&gt;bytes == offset &amp;&amp;</div><div class='ctx'> 	    (!is_trimmed || btrfs_free_space_trimmed(left_info))) {</div><div class='del'>-		if (update_stat)</div><div class='del'>-			unlink_free_space(ctl, left_info);</div><div class='del'>-		else</div><div class='del'>-			__unlink_free_space(ctl, left_info);</div><div class='add'>+		unlink_free_space(ctl, left_info, update_stat);</div><div class='ctx'> 		info-&gt;offset = left_info-&gt;offset;</div><div class='ctx'> 		info-&gt;bytes += left_info-&gt;bytes;</div><div class='ctx'> 		kmem_cache_free(btrfs_free_space_cachep, left_info);</div><div class='hunk'>@@ -2362,10 +2522,7 @@ static bool steal_from_bitmap_to_end(struct btrfs_free_space_ctl *ctl,</div><div class='ctx'> 	if (!btrfs_free_space_trimmed(bitmap))</div><div class='ctx'> 		info-&gt;trim_state = BTRFS_TRIM_STATE_UNTRIMMED;</div><div class='ctx'> </div><div class='del'>-	if (update_stat)</div><div class='del'>-		bitmap_clear_bits(ctl, bitmap, end, bytes);</div><div class='del'>-	else</div><div class='del'>-		__bitmap_clear_bits(ctl, bitmap, end, bytes);</div><div class='add'>+	bitmap_clear_bits(ctl, bitmap, end, bytes, update_stat);</div><div class='ctx'> </div><div class='ctx'> 	if (!bitmap-&gt;bytes)</div><div class='ctx'> 		free_bitmap(ctl, bitmap);</div><div class='hunk'>@@ -2419,10 +2576,7 @@ static bool steal_from_bitmap_to_front(struct btrfs_free_space_ctl *ctl,</div><div class='ctx'> 	if (!btrfs_free_space_trimmed(bitmap))</div><div class='ctx'> 		info-&gt;trim_state = BTRFS_TRIM_STATE_UNTRIMMED;</div><div class='ctx'> </div><div class='del'>-	if (update_stat)</div><div class='del'>-		bitmap_clear_bits(ctl, bitmap, info-&gt;offset, bytes);</div><div class='del'>-	else</div><div class='del'>-		__bitmap_clear_bits(ctl, bitmap, info-&gt;offset, bytes);</div><div class='add'>+	bitmap_clear_bits(ctl, bitmap, info-&gt;offset, bytes, update_stat);</div><div class='ctx'> </div><div class='ctx'> 	if (!bitmap-&gt;bytes)</div><div class='ctx'> 		free_bitmap(ctl, bitmap);</div><div class='hunk'>@@ -2466,12 +2620,12 @@ static void steal_from_bitmap(struct btrfs_free_space_ctl *ctl,</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int __btrfs_add_free_space(struct btrfs_fs_info *fs_info,</div><div class='del'>-			   struct btrfs_free_space_ctl *ctl,</div><div class='add'>+static int __btrfs_add_free_space(struct btrfs_block_group *block_group,</div><div class='ctx'> 			   u64 offset, u64 bytes,</div><div class='ctx'> 			   enum btrfs_trim_state trim_state)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_block_group *block_group = ctl-&gt;private;</div><div class='add'>+	struct btrfs_fs_info *fs_info = block_group-&gt;fs_info;</div><div class='add'>+	struct btrfs_free_space_ctl *ctl = block_group-&gt;free_space_ctl;</div><div class='ctx'> 	struct btrfs_free_space *info;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	u64 filter_bytes = bytes;</div><div class='hunk'>@@ -2486,6 +2640,7 @@ int __btrfs_add_free_space(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	info-&gt;bytes = bytes;</div><div class='ctx'> 	info-&gt;trim_state = trim_state;</div><div class='ctx'> 	RB_CLEAR_NODE(&amp;info-&gt;offset_index);</div><div class='add'>+	RB_CLEAR_NODE(&amp;info-&gt;bytes_index);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;ctl-&gt;tree_lock);</div><div class='ctx'> </div><div class='hunk'>@@ -2538,17 +2693,21 @@ out:</div><div class='ctx'> static int __btrfs_add_free_space_zoned(struct btrfs_block_group *block_group,</div><div class='ctx'> 					u64 bytenr, u64 size, bool used)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = block_group-&gt;fs_info;</div><div class='add'>+	struct btrfs_space_info *sinfo = block_group-&gt;space_info;</div><div class='ctx'> 	struct btrfs_free_space_ctl *ctl = block_group-&gt;free_space_ctl;</div><div class='ctx'> 	u64 offset = bytenr - block_group-&gt;start;</div><div class='ctx'> 	u64 to_free, to_unusable;</div><div class='del'>-	const int bg_reclaim_threshold = READ_ONCE(fs_info-&gt;bg_reclaim_threshold);</div><div class='del'>-	bool initial = (size == block_group-&gt;length);</div><div class='add'>+	int bg_reclaim_threshold = 0;</div><div class='add'>+	bool initial;</div><div class='ctx'> 	u64 reclaimable_unusable;</div><div class='ctx'> </div><div class='add'>+	spin_lock(&amp;block_group-&gt;lock);</div><div class='add'>+</div><div class='add'>+	initial = ((size == block_group-&gt;length) &amp;&amp; (block_group-&gt;alloc_offset == 0));</div><div class='ctx'> 	WARN_ON(!initial &amp;&amp; offset + size &gt; block_group-&gt;zone_capacity);</div><div class='add'>+	if (!initial)</div><div class='add'>+		bg_reclaim_threshold = READ_ONCE(sinfo-&gt;bg_reclaim_threshold);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ctl-&gt;tree_lock);</div><div class='ctx'> 	if (!used)</div><div class='ctx'> 		to_free = size;</div><div class='ctx'> 	else if (initial)</div><div class='hunk'>@@ -2561,18 +2720,19 @@ static int __btrfs_add_free_space_zoned(struct btrfs_block_group *block_group,</div><div class='ctx'> 		to_free = offset + size - block_group-&gt;alloc_offset;</div><div class='ctx'> 	to_unusable = size - to_free;</div><div class='ctx'> </div><div class='add'>+	spin_lock(&amp;ctl-&gt;tree_lock);</div><div class='ctx'> 	ctl-&gt;free_space += to_free;</div><div class='add'>+	spin_unlock(&amp;ctl-&gt;tree_lock);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If the block group is read-only, we should account freed space into</div><div class='ctx'> 	 * bytes_readonly.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!block_group-&gt;ro)</div><div class='add'>+	if (!block_group-&gt;ro) {</div><div class='ctx'> 		block_group-&gt;zone_unusable += to_unusable;</div><div class='del'>-	spin_unlock(&amp;ctl-&gt;tree_lock);</div><div class='add'>+		WARN_ON(block_group-&gt;zone_unusable &gt; block_group-&gt;length);</div><div class='add'>+	}</div><div class='ctx'> 	if (!used) {</div><div class='del'>-		spin_lock(&amp;block_group-&gt;lock);</div><div class='ctx'> 		block_group-&gt;alloc_offset -= size;</div><div class='del'>-		spin_unlock(&amp;block_group-&gt;lock);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	reclaimable_unusable = block_group-&gt;zone_unusable -</div><div class='hunk'>@@ -2582,11 +2742,12 @@ static int __btrfs_add_free_space_zoned(struct btrfs_block_group *block_group,</div><div class='ctx'> 		btrfs_mark_bg_unused(block_group);</div><div class='ctx'> 	} else if (bg_reclaim_threshold &amp;&amp;</div><div class='ctx'> 		   reclaimable_unusable &gt;=</div><div class='del'>-		   div_factor_fine(block_group-&gt;zone_capacity,</div><div class='del'>-				   bg_reclaim_threshold)) {</div><div class='add'>+		   mult_perc(block_group-&gt;zone_capacity, bg_reclaim_threshold)) {</div><div class='ctx'> 		btrfs_mark_bg_to_reclaim(block_group);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	spin_unlock(&amp;block_group-&gt;lock);</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2602,9 +2763,7 @@ int btrfs_add_free_space(struct btrfs_block_group *block_group,</div><div class='ctx'> 	if (btrfs_test_opt(block_group-&gt;fs_info, DISCARD_SYNC))</div><div class='ctx'> 		trim_state = BTRFS_TRIM_STATE_TRIMMED;</div><div class='ctx'> </div><div class='del'>-	return __btrfs_add_free_space(block_group-&gt;fs_info,</div><div class='del'>-				      block_group-&gt;free_space_ctl,</div><div class='del'>-				      bytenr, size, trim_state);</div><div class='add'>+	return __btrfs_add_free_space(block_group, bytenr, size, trim_state);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_add_free_space_unused(struct btrfs_block_group *block_group,</div><div class='hunk'>@@ -2635,9 +2794,7 @@ int btrfs_add_free_space_async_trimmed(struct btrfs_block_group *block_group,</div><div class='ctx'> 	    btrfs_test_opt(block_group-&gt;fs_info, DISCARD_ASYNC))</div><div class='ctx'> 		trim_state = BTRFS_TRIM_STATE_TRIMMED;</div><div class='ctx'> </div><div class='del'>-	return __btrfs_add_free_space(block_group-&gt;fs_info,</div><div class='del'>-				      block_group-&gt;free_space_ctl,</div><div class='del'>-				      bytenr, size, trim_state);</div><div class='add'>+	return __btrfs_add_free_space(block_group, bytenr, size, trim_state);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_remove_free_space(struct btrfs_block_group *block_group,</div><div class='hunk'>@@ -2696,7 +2853,7 @@ again:</div><div class='ctx'> </div><div class='ctx'> 	re_search = false;</div><div class='ctx'> 	if (!info-&gt;bitmap) {</div><div class='del'>-		unlink_free_space(ctl, info);</div><div class='add'>+		unlink_free_space(ctl, info, true);</div><div class='ctx'> 		if (offset == info-&gt;offset) {</div><div class='ctx'> 			u64 to_free = min(bytes, info-&gt;bytes);</div><div class='ctx'> </div><div class='hunk'>@@ -2732,7 +2889,7 @@ again:</div><div class='ctx'> 			}</div><div class='ctx'> 			spin_unlock(&amp;ctl-&gt;tree_lock);</div><div class='ctx'> </div><div class='del'>-			ret = __btrfs_add_free_space(block_group-&gt;fs_info, ctl,</div><div class='add'>+			ret = __btrfs_add_free_space(block_group,</div><div class='ctx'> 						     offset + bytes,</div><div class='ctx'> 						     old_end - (offset + bytes),</div><div class='ctx'> 						     info-&gt;trim_state);</div><div class='hunk'>@@ -2769,7 +2926,8 @@ void btrfs_dump_free_space(struct btrfs_block_group *block_group,</div><div class='ctx'> 	if (btrfs_is_zoned(fs_info)) {</div><div class='ctx'> 		btrfs_info(fs_info, "free space %llu active %d",</div><div class='ctx'> 			   block_group-&gt;zone_capacity - block_group-&gt;alloc_offset,</div><div class='del'>-			   block_group-&gt;zone_is_active);</div><div class='add'>+			   test_bit(BLOCK_GROUP_FLAG_ZONE_IS_ACTIVE,</div><div class='add'>+				    &amp;block_group-&gt;runtime_flags));</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -2779,14 +2937,14 @@ void btrfs_dump_free_space(struct btrfs_block_group *block_group,</div><div class='ctx'> 		if (info-&gt;bytes &gt;= bytes &amp;&amp; !block_group-&gt;ro)</div><div class='ctx'> 			count++;</div><div class='ctx'> 		btrfs_crit(fs_info, "entry offset %llu, bytes %llu, bitmap %s",</div><div class='del'>-			   info-&gt;offset, info-&gt;bytes,</div><div class='del'>-		       (info-&gt;bitmap) ? "yes" : "no");</div><div class='add'>+			   info-&gt;offset, info-&gt;bytes, str_yes_no(info-&gt;bitmap));</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;ctl-&gt;tree_lock);</div><div class='ctx'> 	btrfs_info(fs_info, "block group has cluster?: %s",</div><div class='del'>-	       list_empty(&amp;block_group-&gt;cluster_list) ? "no" : "yes");</div><div class='add'>+	       str_no_yes(list_empty(&amp;block_group-&gt;cluster_list)));</div><div class='ctx'> 	btrfs_info(fs_info,</div><div class='del'>-		   "%d blocks of free space at or bigger than bytes is", count);</div><div class='add'>+		   "%d free space entries at or bigger than %llu bytes",</div><div class='add'>+		   count, bytes);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_init_free_space_ctl(struct btrfs_block_group *block_group,</div><div class='hunk'>@@ -2797,8 +2955,9 @@ void btrfs_init_free_space_ctl(struct btrfs_block_group *block_group,</div><div class='ctx'> 	spin_lock_init(&amp;ctl-&gt;tree_lock);</div><div class='ctx'> 	ctl-&gt;unit = fs_info-&gt;sectorsize;</div><div class='ctx'> 	ctl-&gt;start = block_group-&gt;start;</div><div class='del'>-	ctl-&gt;private = block_group;</div><div class='add'>+	ctl-&gt;block_group = block_group;</div><div class='ctx'> 	ctl-&gt;op = &amp;free_space_op;</div><div class='add'>+	ctl-&gt;free_space_bytes = RB_ROOT_CACHED;</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;ctl-&gt;trimming_ranges);</div><div class='ctx'> 	mutex_init(&amp;ctl-&gt;cache_writeout_mutex);</div><div class='ctx'> </div><div class='hunk'>@@ -2821,9 +2980,10 @@ static void __btrfs_return_cluster_to_free_space(</div><div class='ctx'> 			     struct btrfs_free_cluster *cluster)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_free_space_ctl *ctl = block_group-&gt;free_space_ctl;</div><div class='del'>-	struct btrfs_free_space *entry;</div><div class='ctx'> 	struct rb_node *node;</div><div class='ctx'> </div><div class='add'>+	lockdep_assert_held(&amp;ctl-&gt;tree_lock);</div><div class='add'>+</div><div class='ctx'> 	spin_lock(&amp;cluster-&gt;lock);</div><div class='ctx'> 	if (cluster-&gt;block_group != block_group) {</div><div class='ctx'> 		spin_unlock(&amp;cluster-&gt;lock);</div><div class='hunk'>@@ -2836,15 +2996,14 @@ static void __btrfs_return_cluster_to_free_space(</div><div class='ctx'> </div><div class='ctx'> 	node = rb_first(&amp;cluster-&gt;root);</div><div class='ctx'> 	while (node) {</div><div class='del'>-		bool bitmap;</div><div class='add'>+		struct btrfs_free_space *entry;</div><div class='ctx'> </div><div class='ctx'> 		entry = rb_entry(node, struct btrfs_free_space, offset_index);</div><div class='ctx'> 		node = rb_next(&amp;entry-&gt;offset_index);</div><div class='ctx'> 		rb_erase(&amp;entry-&gt;offset_index, &amp;cluster-&gt;root);</div><div class='ctx'> 		RB_CLEAR_NODE(&amp;entry-&gt;offset_index);</div><div class='ctx'> </div><div class='del'>-		bitmap = (entry-&gt;bitmap != NULL);</div><div class='del'>-		if (!bitmap) {</div><div class='add'>+		if (!entry-&gt;bitmap) {</div><div class='ctx'> 			/* Merging treats extents as if they were new */</div><div class='ctx'> 			if (!btrfs_free_space_trimmed(entry)) {</div><div class='ctx'> 				ctl-&gt;discardable_extents[BTRFS_STAT_CURR]--;</div><div class='hunk'>@@ -2862,42 +3021,15 @@ static void __btrfs_return_cluster_to_free_space(</div><div class='ctx'> 					entry-&gt;bytes;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		tree_insert_offset(&amp;ctl-&gt;free_space_offset,</div><div class='del'>-				   entry-&gt;offset, &amp;entry-&gt;offset_index, bitmap);</div><div class='add'>+		tree_insert_offset(ctl, NULL, entry);</div><div class='add'>+		rb_add_cached(&amp;entry-&gt;bytes_index, &amp;ctl-&gt;free_space_bytes,</div><div class='add'>+			      entry_less);</div><div class='ctx'> 	}</div><div class='ctx'> 	cluster-&gt;root = RB_ROOT;</div><div class='ctx'> 	spin_unlock(&amp;cluster-&gt;lock);</div><div class='ctx'> 	btrfs_put_block_group(block_group);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void __btrfs_remove_free_space_cache_locked(</div><div class='del'>-				struct btrfs_free_space_ctl *ctl)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_free_space *info;</div><div class='del'>-	struct rb_node *node;</div><div class='del'>-</div><div class='del'>-	while ((node = rb_last(&amp;ctl-&gt;free_space_offset)) != NULL) {</div><div class='del'>-		info = rb_entry(node, struct btrfs_free_space, offset_index);</div><div class='del'>-		if (!info-&gt;bitmap) {</div><div class='del'>-			unlink_free_space(ctl, info);</div><div class='del'>-			kmem_cache_free(btrfs_free_space_cachep, info);</div><div class='del'>-		} else {</div><div class='del'>-			free_bitmap(ctl, info);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		cond_resched_lock(&amp;ctl-&gt;tree_lock);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void __btrfs_remove_free_space_cache(struct btrfs_free_space_ctl *ctl)</div><div class='del'>-{</div><div class='del'>-	spin_lock(&amp;ctl-&gt;tree_lock);</div><div class='del'>-	__btrfs_remove_free_space_cache_locked(ctl);</div><div class='del'>-	if (ctl-&gt;private)</div><div class='del'>-		btrfs_discard_update_discardable(ctl-&gt;private);</div><div class='del'>-	spin_unlock(&amp;ctl-&gt;tree_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> void btrfs_remove_free_space_cache(struct btrfs_block_group *block_group)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_free_space_ctl *ctl = block_group-&gt;free_space_ctl;</div><div class='hunk'>@@ -2915,16 +3047,13 @@ void btrfs_remove_free_space_cache(struct btrfs_block_group *block_group)</div><div class='ctx'> </div><div class='ctx'> 		cond_resched_lock(&amp;ctl-&gt;tree_lock);</div><div class='ctx'> 	}</div><div class='del'>-	__btrfs_remove_free_space_cache_locked(ctl);</div><div class='add'>+	__btrfs_remove_free_space_cache(ctl);</div><div class='ctx'> 	btrfs_discard_update_discardable(block_group);</div><div class='ctx'> 	spin_unlock(&amp;ctl-&gt;tree_lock);</div><div class='ctx'> </div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * btrfs_is_free_space_trimmed - see if everything is trimmed</div><div class='del'>- * @block_group: block_group of interest</div><div class='del'>- *</div><div class='add'>+/*</div><div class='ctx'>  * Walk @block_group's free space rb_tree to determine if everything is trimmed.</div><div class='ctx'>  */</div><div class='ctx'> bool btrfs_is_free_space_trimmed(struct btrfs_block_group *block_group)</div><div class='hunk'>@@ -2965,18 +3094,20 @@ u64 btrfs_find_space_for_alloc(struct btrfs_block_group *block_group,</div><div class='ctx'> 	u64 align_gap = 0;</div><div class='ctx'> 	u64 align_gap_len = 0;</div><div class='ctx'> 	enum btrfs_trim_state align_gap_trim_state = BTRFS_TRIM_STATE_UNTRIMMED;</div><div class='add'>+	bool use_bytes_index = (offset == block_group-&gt;start);</div><div class='ctx'> </div><div class='ctx'> 	ASSERT(!btrfs_is_zoned(block_group-&gt;fs_info));</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;ctl-&gt;tree_lock);</div><div class='ctx'> 	entry = find_free_space(ctl, &amp;offset, &amp;bytes_search,</div><div class='del'>-				block_group-&gt;full_stripe_len, max_extent_size);</div><div class='add'>+				block_group-&gt;full_stripe_len, max_extent_size,</div><div class='add'>+				use_bytes_index);</div><div class='ctx'> 	if (!entry)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	ret = offset;</div><div class='ctx'> 	if (entry-&gt;bitmap) {</div><div class='del'>-		bitmap_clear_bits(ctl, entry, offset, bytes);</div><div class='add'>+		bitmap_clear_bits(ctl, entry, offset, bytes, true);</div><div class='ctx'> </div><div class='ctx'> 		if (!btrfs_free_space_trimmed(entry))</div><div class='ctx'> 			atomic64_add(bytes, &amp;discard_ctl-&gt;discard_bytes_saved);</div><div class='hunk'>@@ -2984,7 +3115,7 @@ u64 btrfs_find_space_for_alloc(struct btrfs_block_group *block_group,</div><div class='ctx'> 		if (!entry-&gt;bytes)</div><div class='ctx'> 			free_bitmap(ctl, entry);</div><div class='ctx'> 	} else {</div><div class='del'>-		unlink_free_space(ctl, entry);</div><div class='add'>+		unlink_free_space(ctl, entry, true);</div><div class='ctx'> 		align_gap_len = offset - entry-&gt;offset;</div><div class='ctx'> 		align_gap = entry-&gt;offset;</div><div class='ctx'> 		align_gap_trim_state = entry-&gt;trim_state;</div><div class='hunk'>@@ -3006,8 +3137,7 @@ out:</div><div class='ctx'> 	spin_unlock(&amp;ctl-&gt;tree_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (align_gap_len)</div><div class='del'>-		__btrfs_add_free_space(block_group-&gt;fs_info, ctl,</div><div class='del'>-				       align_gap, align_gap_len,</div><div class='add'>+		__btrfs_add_free_space(block_group, align_gap, align_gap_len,</div><div class='ctx'> 				       align_gap_trim_state);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -3062,7 +3192,7 @@ static u64 btrfs_alloc_from_bitmap(struct btrfs_block_group *block_group,</div><div class='ctx'> 				   u64 *max_extent_size)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_free_space_ctl *ctl = block_group-&gt;free_space_ctl;</div><div class='del'>-	int err;</div><div class='add'>+	int ret2;</div><div class='ctx'> 	u64 search_start = cluster-&gt;window_start;</div><div class='ctx'> 	u64 search_bytes = bytes;</div><div class='ctx'> 	u64 ret = 0;</div><div class='hunk'>@@ -3070,15 +3200,15 @@ static u64 btrfs_alloc_from_bitmap(struct btrfs_block_group *block_group,</div><div class='ctx'> 	search_start = min_start;</div><div class='ctx'> 	search_bytes = bytes;</div><div class='ctx'> </div><div class='del'>-	err = search_bitmap(ctl, entry, &amp;search_start, &amp;search_bytes, true);</div><div class='del'>-	if (err) {</div><div class='add'>+	ret2 = search_bitmap(ctl, entry, &amp;search_start, &amp;search_bytes, true);</div><div class='add'>+	if (ret2) {</div><div class='ctx'> 		*max_extent_size = max(get_max_extent_size(entry),</div><div class='ctx'> 				       *max_extent_size);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = search_start;</div><div class='del'>-	__bitmap_clear_bits(ctl, entry, ret, bytes);</div><div class='add'>+	bitmap_clear_bits(ctl, entry, ret, bytes, false);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -3204,6 +3334,8 @@ static int btrfs_bitmap_cluster(struct btrfs_block_group *block_group,</div><div class='ctx'> 	unsigned long total_found = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='add'>+	lockdep_assert_held(&amp;ctl-&gt;tree_lock);</div><div class='add'>+</div><div class='ctx'> 	i = offset_to_bit(entry-&gt;offset, ctl-&gt;unit,</div><div class='ctx'> 			  max_t(u64, offset, entry-&gt;offset));</div><div class='ctx'> 	want_bits = bytes_to_bits(bytes, ctl-&gt;unit);</div><div class='hunk'>@@ -3254,8 +3386,18 @@ again:</div><div class='ctx'> </div><div class='ctx'> 	cluster-&gt;window_start = start * ctl-&gt;unit + entry-&gt;offset;</div><div class='ctx'> 	rb_erase(&amp;entry-&gt;offset_index, &amp;ctl-&gt;free_space_offset);</div><div class='del'>-	ret = tree_insert_offset(&amp;cluster-&gt;root, entry-&gt;offset,</div><div class='del'>-				 &amp;entry-&gt;offset_index, 1);</div><div class='add'>+	rb_erase_cached(&amp;entry-&gt;bytes_index, &amp;ctl-&gt;free_space_bytes);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We need to know if we're currently on the normal space index when we</div><div class='add'>+	 * manipulate the bitmap so that we know we need to remove and re-insert</div><div class='add'>+	 * it into the space_index tree.  Clear the bytes_index node here so the</div><div class='add'>+	 * bitmap manipulation helpers know not to mess with the space_index</div><div class='add'>+	 * until this bitmap entry is added back into the normal cache.</div><div class='add'>+	 */</div><div class='add'>+	RB_CLEAR_NODE(&amp;entry-&gt;bytes_index);</div><div class='add'>+</div><div class='add'>+	ret = tree_insert_offset(ctl, cluster, entry);</div><div class='ctx'> 	ASSERT(!ret); /* -EEXIST; Logic error */</div><div class='ctx'> </div><div class='ctx'> 	trace_btrfs_setup_cluster(block_group, cluster,</div><div class='hunk'>@@ -3283,6 +3425,8 @@ setup_cluster_no_bitmap(struct btrfs_block_group *block_group,</div><div class='ctx'> 	u64 max_extent;</div><div class='ctx'> 	u64 total_size = 0;</div><div class='ctx'> </div><div class='add'>+	lockdep_assert_held(&amp;ctl-&gt;tree_lock);</div><div class='add'>+</div><div class='ctx'> 	entry = tree_search_offset(ctl, offset, 0, 1);</div><div class='ctx'> 	if (!entry)</div><div class='ctx'> 		return -ENOSPC;</div><div class='hunk'>@@ -3344,8 +3488,8 @@ setup_cluster_no_bitmap(struct btrfs_block_group *block_group,</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		rb_erase(&amp;entry-&gt;offset_index, &amp;ctl-&gt;free_space_offset);</div><div class='del'>-		ret = tree_insert_offset(&amp;cluster-&gt;root, entry-&gt;offset,</div><div class='del'>-					 &amp;entry-&gt;offset_index, 0);</div><div class='add'>+		rb_erase_cached(&amp;entry-&gt;bytes_index, &amp;ctl-&gt;free_space_bytes);</div><div class='add'>+		ret = tree_insert_offset(ctl, cluster, entry);</div><div class='ctx'> 		total_size += entry-&gt;bytes;</div><div class='ctx'> 		ASSERT(!ret); /* -EEXIST; Logic error */</div><div class='ctx'> 	} while (node &amp;&amp; entry != last);</div><div class='hunk'>@@ -3429,7 +3573,8 @@ int btrfs_find_space_cluster(struct btrfs_block_group *block_group,</div><div class='ctx'> 	 * data, keep it dense.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (btrfs_test_opt(fs_info, SSD_SPREAD)) {</div><div class='del'>-		cont1_bytes = min_bytes = bytes + empty_size;</div><div class='add'>+		cont1_bytes = bytes + empty_size;</div><div class='add'>+		min_bytes = cont1_bytes;</div><div class='ctx'> 	} else if (block_group-&gt;flags &amp; BTRFS_BLOCK_GROUP_METADATA) {</div><div class='ctx'> 		cont1_bytes = bytes;</div><div class='ctx'> 		min_bytes = fs_info-&gt;sectorsize;</div><div class='hunk'>@@ -3511,7 +3656,7 @@ static int do_trimming(struct btrfs_block_group *block_group,</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = block_group-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_free_space_ctl *ctl = block_group-&gt;free_space_ctl;</div><div class='ctx'> 	int ret;</div><div class='del'>-	int update = 0;</div><div class='add'>+	bool bg_ro;</div><div class='ctx'> 	const u64 end = start + bytes;</div><div class='ctx'> 	const u64 reserved_end = reserved_start + reserved_bytes;</div><div class='ctx'> 	enum btrfs_trim_state trim_state = BTRFS_TRIM_STATE_UNTRIMMED;</div><div class='hunk'>@@ -3519,12 +3664,14 @@ static int do_trimming(struct btrfs_block_group *block_group,</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;space_info-&gt;lock);</div><div class='ctx'> 	spin_lock(&amp;block_group-&gt;lock);</div><div class='del'>-	if (!block_group-&gt;ro) {</div><div class='add'>+	bg_ro = block_group-&gt;ro;</div><div class='add'>+	if (!bg_ro) {</div><div class='ctx'> 		block_group-&gt;reserved += reserved_bytes;</div><div class='add'>+		spin_unlock(&amp;block_group-&gt;lock);</div><div class='ctx'> 		space_info-&gt;bytes_reserved += reserved_bytes;</div><div class='del'>-		update = 1;</div><div class='add'>+	} else {</div><div class='add'>+		spin_unlock(&amp;block_group-&gt;lock);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;block_group-&gt;lock);</div><div class='ctx'> 	spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_discard_extent(fs_info, start, bytes, &amp;trimmed);</div><div class='hunk'>@@ -3535,24 +3682,26 @@ static int do_trimming(struct btrfs_block_group *block_group,</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;ctl-&gt;cache_writeout_mutex);</div><div class='ctx'> 	if (reserved_start &lt; start)</div><div class='del'>-		__btrfs_add_free_space(fs_info, ctl, reserved_start,</div><div class='add'>+		__btrfs_add_free_space(block_group, reserved_start,</div><div class='ctx'> 				       start - reserved_start,</div><div class='ctx'> 				       reserved_trim_state);</div><div class='del'>-	if (start + bytes &lt; reserved_start + reserved_bytes)</div><div class='del'>-		__btrfs_add_free_space(fs_info, ctl, end, reserved_end - end,</div><div class='add'>+	if (end &lt; reserved_end)</div><div class='add'>+		__btrfs_add_free_space(block_group, end, reserved_end - end,</div><div class='ctx'> 				       reserved_trim_state);</div><div class='del'>-	__btrfs_add_free_space(fs_info, ctl, start, bytes, trim_state);</div><div class='add'>+	__btrfs_add_free_space(block_group, start, bytes, trim_state);</div><div class='ctx'> 	list_del(&amp;trim_entry-&gt;list);</div><div class='ctx'> 	mutex_unlock(&amp;ctl-&gt;cache_writeout_mutex);</div><div class='ctx'> </div><div class='del'>-	if (update) {</div><div class='add'>+	if (!bg_ro) {</div><div class='ctx'> 		spin_lock(&amp;space_info-&gt;lock);</div><div class='ctx'> 		spin_lock(&amp;block_group-&gt;lock);</div><div class='del'>-		if (block_group-&gt;ro)</div><div class='del'>-			space_info-&gt;bytes_readonly += reserved_bytes;</div><div class='add'>+		bg_ro = block_group-&gt;ro;</div><div class='ctx'> 		block_group-&gt;reserved -= reserved_bytes;</div><div class='del'>-		space_info-&gt;bytes_reserved -= reserved_bytes;</div><div class='ctx'> 		spin_unlock(&amp;block_group-&gt;lock);</div><div class='add'>+</div><div class='add'>+		space_info-&gt;bytes_reserved -= reserved_bytes;</div><div class='add'>+		if (bg_ro)</div><div class='add'>+			space_info-&gt;bytes_readonly += reserved_bytes;</div><div class='ctx'> 		spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -3615,7 +3764,7 @@ static int trim_no_bitmap(struct btrfs_block_group *block_group,</div><div class='ctx'> 				mutex_unlock(&amp;ctl-&gt;cache_writeout_mutex);</div><div class='ctx'> 				goto next;</div><div class='ctx'> 			}</div><div class='del'>-			unlink_free_space(ctl, entry);</div><div class='add'>+			unlink_free_space(ctl, entry, true);</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Let bytes = BTRFS_MAX_DISCARD_SIZE + X.</div><div class='ctx'> 			 * If X &lt; BTRFS_ASYNC_DISCARD_MIN_FILTER, we won't trim</div><div class='hunk'>@@ -3641,7 +3790,7 @@ static int trim_no_bitmap(struct btrfs_block_group *block_group,</div><div class='ctx'> 				goto next;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			unlink_free_space(ctl, entry);</div><div class='add'>+			unlink_free_space(ctl, entry, true);</div><div class='ctx'> 			kmem_cache_free(btrfs_free_space_cachep, entry);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -3664,7 +3813,7 @@ next:</div><div class='ctx'> 		if (async &amp;&amp; *total_trimmed)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		if (fatal_signal_pending(current)) {</div><div class='add'>+		if (btrfs_trim_interrupted()) {</div><div class='ctx'> 			ret = -ERESTARTSYS;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -3684,7 +3833,7 @@ out_unlock:</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * If we break out of trimming a bitmap prematurely, we should reset the</div><div class='del'>- * trimming bit.  In a rather contrieved case, it's possible to race here so</div><div class='add'>+ * trimming bit.  In a rather contrived case, it's possible to race here so</div><div class='ctx'>  * reset the state to BTRFS_TRIM_STATE_UNTRIMMED.</div><div class='ctx'>  *</div><div class='ctx'>  * start = start of bitmap</div><div class='hunk'>@@ -3828,7 +3977,7 @@ static int trim_bitmaps(struct btrfs_block_group *block_group,</div><div class='ctx'> 		    bytes &gt; (max_discard_size + minlen))</div><div class='ctx'> 			bytes = max_discard_size;</div><div class='ctx'> </div><div class='del'>-		bitmap_clear_bits(ctl, entry, start, bytes);</div><div class='add'>+		bitmap_clear_bits(ctl, entry, start, bytes, true);</div><div class='ctx'> 		if (entry-&gt;bytes == 0)</div><div class='ctx'> 			free_bitmap(ctl, entry);</div><div class='ctx'> </div><div class='hunk'>@@ -3855,7 +4004,7 @@ next:</div><div class='ctx'> 		}</div><div class='ctx'> 		block_group-&gt;discard_cursor = start;</div><div class='ctx'> </div><div class='del'>-		if (fatal_signal_pending(current)) {</div><div class='add'>+		if (btrfs_trim_interrupted()) {</div><div class='ctx'> 			if (start != offset)</div><div class='ctx'> 				reset_trimming_bitmap(ctl, offset);</div><div class='ctx'> 			ret = -ERESTARTSYS;</div><div class='hunk'>@@ -3884,7 +4033,7 @@ int btrfs_trim_block_group(struct btrfs_block_group *block_group,</div><div class='ctx'> 	*trimmed = 0;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;block_group-&gt;lock);</div><div class='del'>-	if (block_group-&gt;removed) {</div><div class='add'>+	if (test_bit(BLOCK_GROUP_FLAG_REMOVED, &amp;block_group-&gt;runtime_flags)) {</div><div class='ctx'> 		spin_unlock(&amp;block_group-&gt;lock);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3914,7 +4063,7 @@ int btrfs_trim_block_group_extents(struct btrfs_block_group *block_group,</div><div class='ctx'> 	*trimmed = 0;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;block_group-&gt;lock);</div><div class='del'>-	if (block_group-&gt;removed) {</div><div class='add'>+	if (test_bit(BLOCK_GROUP_FLAG_REMOVED, &amp;block_group-&gt;runtime_flags)) {</div><div class='ctx'> 		spin_unlock(&amp;block_group-&gt;lock);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3936,7 +4085,7 @@ int btrfs_trim_block_group_bitmaps(struct btrfs_block_group *block_group,</div><div class='ctx'> 	*trimmed = 0;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;block_group-&gt;lock);</div><div class='del'>-	if (block_group-&gt;removed) {</div><div class='add'>+	if (test_bit(BLOCK_GROUP_FLAG_REMOVED, &amp;block_group-&gt;runtime_flags)) {</div><div class='ctx'> 		spin_unlock(&amp;block_group-&gt;lock);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3965,7 +4114,7 @@ static int cleanup_free_space_cache_v1(struct btrfs_fs_info *fs_info,</div><div class='ctx'> </div><div class='ctx'> 	btrfs_info(fs_info, "cleaning free space cache v1");</div><div class='ctx'> </div><div class='del'>-	node = rb_first(&amp;fs_info-&gt;block_group_cache_tree);</div><div class='add'>+	node = rb_first_cached(&amp;fs_info-&gt;block_group_cache_tree);</div><div class='ctx'> 	while (node) {</div><div class='ctx'> 		block_group = rb_entry(node, struct btrfs_block_group, cache_node);</div><div class='ctx'> 		ret = btrfs_remove_free_space_inode(trans, NULL, block_group);</div><div class='hunk'>@@ -3997,7 +4146,7 @@ int btrfs_set_free_space_cache_v1_active(struct btrfs_fs_info *fs_info, bool act</div><div class='ctx'> 	if (!active) {</div><div class='ctx'> 		set_bit(BTRFS_FS_CLEANUP_SPACE_CACHE_V1, &amp;fs_info-&gt;flags);</div><div class='ctx'> 		ret = cleanup_free_space_cache_v1(fs_info, trans);</div><div class='del'>-		if (ret) {</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			btrfs_end_transaction(trans);</div><div class='ctx'> 			goto out;</div><div class='hunk'>@@ -4011,6 +4160,29 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+int __init btrfs_free_space_init(void)</div><div class='add'>+{</div><div class='add'>+	btrfs_free_space_cachep = KMEM_CACHE(btrfs_free_space, 0);</div><div class='add'>+	if (!btrfs_free_space_cachep)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	btrfs_free_space_bitmap_cachep = kmem_cache_create("btrfs_free_space_bitmap",</div><div class='add'>+							PAGE_SIZE, PAGE_SIZE,</div><div class='add'>+							0, NULL);</div><div class='add'>+	if (!btrfs_free_space_bitmap_cachep) {</div><div class='add'>+		kmem_cache_destroy(btrfs_free_space_cachep);</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void __cold btrfs_free_space_exit(void)</div><div class='add'>+{</div><div class='add'>+	kmem_cache_destroy(btrfs_free_space_cachep);</div><div class='add'>+	kmem_cache_destroy(btrfs_free_space_bitmap_cachep);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> #ifdef CONFIG_BTRFS_FS_RUN_SANITY_TESTS</div><div class='ctx'> /*</div><div class='ctx'>  * Use this if you need to make a bitmap or extent entry specifically, it</div><div class='head'>diff --git a/fs/btrfs/free-space-cache.h b/fs/btrfs/free-space-cache.h<br/>index 1f23088d43f9..9f1dbfdee8ca 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/free-space-cache.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/free-space-cache.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/free-space-cache.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/free-space-cache.h</a></div><div class='hunk'>@@ -6,6 +6,20 @@</div><div class='ctx'> #ifndef BTRFS_FREE_SPACE_CACHE_H</div><div class='ctx'> #define BTRFS_FREE_SPACE_CACHE_H</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/rbtree.h&gt;</div><div class='add'>+#include &lt;linux/list.h&gt;</div><div class='add'>+#include &lt;linux/spinlock.h&gt;</div><div class='add'>+#include &lt;linux/mutex.h&gt;</div><div class='add'>+#include &lt;linux/freezer.h&gt;</div><div class='add'>+#include "fs.h"</div><div class='add'>+</div><div class='add'>+struct inode;</div><div class='add'>+struct page;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+struct btrfs_path;</div><div class='add'>+struct btrfs_trans_handle;</div><div class='add'>+struct btrfs_trim_block_group;</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * This is the trim state of an extent or bitmap.</div><div class='ctx'>  *</div><div class='hunk'>@@ -22,6 +36,7 @@ enum btrfs_trim_state {</div><div class='ctx'> </div><div class='ctx'> struct btrfs_free_space {</div><div class='ctx'> 	struct rb_node offset_index;</div><div class='add'>+	struct rb_node bytes_index;</div><div class='ctx'> 	u64 offset;</div><div class='ctx'> 	u64 bytes;</div><div class='ctx'> 	u64 max_extent_size;</div><div class='hunk'>@@ -42,9 +57,26 @@ static inline bool btrfs_free_space_trimming_bitmap(</div><div class='ctx'> 	return (info-&gt;trim_state == BTRFS_TRIM_STATE_TRIMMING);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline bool btrfs_trim_interrupted(void)</div><div class='add'>+{</div><div class='add'>+	return fatal_signal_pending(current) || freezing(current);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Deltas are an effective way to populate global statistics.  Give macro names</div><div class='add'>+ * to make it clear what we're doing.  An example is discard_extents in</div><div class='add'>+ * btrfs_free_space_ctl.</div><div class='add'>+ */</div><div class='add'>+enum {</div><div class='add'>+	BTRFS_STAT_CURR,</div><div class='add'>+	BTRFS_STAT_PREV,</div><div class='add'>+	BTRFS_STAT_NR_ENTRIES,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> struct btrfs_free_space_ctl {</div><div class='ctx'> 	spinlock_t tree_lock;</div><div class='ctx'> 	struct rb_root free_space_offset;</div><div class='add'>+	struct rb_root_cached free_space_bytes;</div><div class='ctx'> 	u64 free_space;</div><div class='ctx'> 	int extents_thresh;</div><div class='ctx'> 	int free_extents;</div><div class='hunk'>@@ -54,7 +86,7 @@ struct btrfs_free_space_ctl {</div><div class='ctx'> 	s32 discardable_extents[BTRFS_STAT_NR_ENTRIES];</div><div class='ctx'> 	s64 discardable_bytes[BTRFS_STAT_NR_ENTRIES];</div><div class='ctx'> 	const struct btrfs_free_space_op *op;</div><div class='del'>-	void *private;</div><div class='add'>+	struct btrfs_block_group *block_group;</div><div class='ctx'> 	struct mutex cache_writeout_mutex;</div><div class='ctx'> 	struct list_head trimming_ranges;</div><div class='ctx'> };</div><div class='hunk'>@@ -77,6 +109,8 @@ struct btrfs_io_ctl {</div><div class='ctx'> 	int bitmaps;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+int __init btrfs_free_space_init(void);</div><div class='add'>+void __cold btrfs_free_space_exit(void);</div><div class='ctx'> struct inode *lookup_free_space_inode(struct btrfs_block_group *block_group,</div><div class='ctx'> 		struct btrfs_path *path);</div><div class='ctx'> int create_free_space_inode(struct btrfs_trans_handle *trans,</div><div class='hunk'>@@ -86,8 +120,6 @@ int btrfs_remove_free_space_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				  struct inode *inode,</div><div class='ctx'> 				  struct btrfs_block_group *block_group);</div><div class='ctx'> </div><div class='del'>-int btrfs_check_trunc_cache_free_space(struct btrfs_fs_info *fs_info,</div><div class='del'>-				       struct btrfs_block_rsv *rsv);</div><div class='ctx'> int btrfs_truncate_free_space_cache(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				    struct btrfs_block_group *block_group,</div><div class='ctx'> 				    struct inode *inode);</div><div class='hunk'>@@ -101,10 +133,6 @@ int btrfs_write_out_cache(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> void btrfs_init_free_space_ctl(struct btrfs_block_group *block_group,</div><div class='ctx'> 			       struct btrfs_free_space_ctl *ctl);</div><div class='del'>-int __btrfs_add_free_space(struct btrfs_fs_info *fs_info,</div><div class='del'>-			   struct btrfs_free_space_ctl *ctl,</div><div class='del'>-			   u64 bytenr, u64 size,</div><div class='del'>-			   enum btrfs_trim_state trim_state);</div><div class='ctx'> int btrfs_add_free_space(struct btrfs_block_group *block_group,</div><div class='ctx'> 			 u64 bytenr, u64 size);</div><div class='ctx'> int btrfs_add_free_space_unused(struct btrfs_block_group *block_group,</div><div class='hunk'>@@ -113,7 +141,6 @@ int btrfs_add_free_space_async_trimmed(struct btrfs_block_group *block_group,</div><div class='ctx'> 				       u64 bytenr, u64 size);</div><div class='ctx'> int btrfs_remove_free_space(struct btrfs_block_group *block_group,</div><div class='ctx'> 			    u64 bytenr, u64 size);</div><div class='del'>-void __btrfs_remove_free_space_cache(struct btrfs_free_space_ctl *ctl);</div><div class='ctx'> void btrfs_remove_free_space_cache(struct btrfs_block_group *block_group);</div><div class='ctx'> bool btrfs_is_free_space_trimmed(struct btrfs_block_group *block_group);</div><div class='ctx'> u64 btrfs_find_space_for_alloc(struct btrfs_block_group *block_group,</div><div class='head'>diff --git a/fs/btrfs/free-space-tree.c b/fs/btrfs/free-space-tree.c<br/>index a33bca94d133..1ad2ad384b9e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/free-space-tree.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/free-space-tree.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/free-space-tree.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/free-space-tree.c</a></div><div class='hunk'>@@ -5,18 +5,37 @@</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/kernel.h&gt;</div><div class='ctx'> #include &lt;linux/sched/mm.h&gt;</div><div class='add'>+#include "messages.h"</div><div class='ctx'> #include "ctree.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='ctx'> #include "locking.h"</div><div class='ctx'> #include "free-space-tree.h"</div><div class='ctx'> #include "transaction.h"</div><div class='ctx'> #include "block-group.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "extent-tree.h"</div><div class='add'>+#include "root-tree.h"</div><div class='ctx'> </div><div class='ctx'> static int __add_block_group_free_space(struct btrfs_trans_handle *trans,</div><div class='ctx'> 					struct btrfs_block_group *block_group,</div><div class='ctx'> 					struct btrfs_path *path);</div><div class='ctx'> </div><div class='del'>-void set_free_space_tree_thresholds(struct btrfs_block_group *cache)</div><div class='add'>+static struct btrfs_root *btrfs_free_space_root(</div><div class='add'>+				struct btrfs_block_group *block_group)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_key key = {</div><div class='add'>+		.objectid = BTRFS_FREE_SPACE_TREE_OBJECTID,</div><div class='add'>+		.type = BTRFS_ROOT_ITEM_KEY,</div><div class='add'>+		.offset = 0,</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+	if (btrfs_fs_incompat(block_group-&gt;fs_info, EXTENT_TREE_V2))</div><div class='add'>+		key.offset = block_group-&gt;global_root_id;</div><div class='add'>+	return btrfs_global_root(block_group-&gt;fs_info, &amp;key);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_set_free_space_tree_thresholds(struct btrfs_block_group *cache)</div><div class='ctx'> {</div><div class='ctx'> 	u32 bitmap_range;</div><div class='ctx'> 	size_t bitmap_size;</div><div class='hunk'>@@ -51,7 +70,7 @@ static int add_new_free_space_info(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				   struct btrfs_block_group *block_group,</div><div class='ctx'> 				   struct btrfs_path *path)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *root = trans-&gt;fs_info-&gt;free_space_root;</div><div class='add'>+	struct btrfs_root *root = btrfs_free_space_root(block_group);</div><div class='ctx'> 	struct btrfs_free_space_info *info;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='hunk'>@@ -63,29 +82,25 @@ static int add_new_free_space_info(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_insert_empty_item(trans, root, path, &amp;key, sizeof(*info));</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	info = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='ctx'> 			      struct btrfs_free_space_info);</div><div class='ctx'> 	btrfs_set_free_space_extent_count(leaf, info, 0);</div><div class='ctx'> 	btrfs_set_free_space_flags(leaf, info, 0);</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='del'>-</div><div class='del'>-	ret = 0;</div><div class='del'>-out:</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> EXPORT_FOR_TESTS</div><div class='del'>-struct btrfs_free_space_info *search_free_space_info(</div><div class='add'>+struct btrfs_free_space_info *btrfs_search_free_space_info(</div><div class='ctx'> 		struct btrfs_trans_handle *trans,</div><div class='ctx'> 		struct btrfs_block_group *block_group,</div><div class='ctx'> 		struct btrfs_path *path, int cow)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = block_group-&gt;fs_info;</div><div class='del'>-	struct btrfs_root *root = fs_info-&gt;free_space_root;</div><div class='add'>+	struct btrfs_root *root = btrfs_free_space_root(block_group);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -99,7 +114,7 @@ struct btrfs_free_space_info *search_free_space_info(</div><div class='ctx'> 	if (ret != 0) {</div><div class='ctx'> 		btrfs_warn(fs_info, "missing free space info for %llu",</div><div class='ctx'> 			   block_group-&gt;start);</div><div class='del'>-		ASSERT(0);</div><div class='add'>+		DEBUG_WARN();</div><div class='ctx'> 		return ERR_PTR(-ENOENT);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -122,13 +137,13 @@ static int btrfs_search_prev_slot(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	if (ret == 0) {</div><div class='del'>-		ASSERT(0);</div><div class='add'>+	if (unlikely(ret == 0)) {</div><div class='add'>+		DEBUG_WARN();</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (p-&gt;slots[0] == 0) {</div><div class='del'>-		ASSERT(0);</div><div class='add'>+	if (unlikely(p-&gt;slots[0] == 0)) {</div><div class='add'>+		DEBUG_WARN("no previous slot found");</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> 	p-&gt;slots[0]--;</div><div class='hunk'>@@ -150,11 +165,9 @@ static unsigned long *alloc_bitmap(u32 bitmap_size)</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * GFP_NOFS doesn't work with kvmalloc(), but we really can't recurse</div><div class='del'>-	 * into the filesystem as the free space bitmap can be modified in the</div><div class='del'>-	 * critical section of a transaction commit.</div><div class='del'>-	 *</div><div class='del'>-	 * TODO: push the memalloc_nofs_{save,restore}() to the caller where we</div><div class='del'>-	 * know that recursion is unsafe.</div><div class='add'>+	 * into the filesystem here. All callers hold a transaction handle</div><div class='add'>+	 * open, so if a GFP_KERNEL allocation recurses into the filesystem</div><div class='add'>+	 * and triggers a transaction commit, we would deadlock.</div><div class='ctx'> 	 */</div><div class='ctx'> 	nofs_flag = memalloc_nofs_save();</div><div class='ctx'> 	ret = kvzalloc(bitmap_rounded_size, GFP_KERNEL);</div><div class='hunk'>@@ -183,12 +196,12 @@ static void le_bitmap_set(unsigned long *map, unsigned int start, int len)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> EXPORT_FOR_TESTS</div><div class='del'>-int convert_free_space_to_bitmaps(struct btrfs_trans_handle *trans,</div><div class='del'>-				  struct btrfs_block_group *block_group,</div><div class='del'>-				  struct btrfs_path *path)</div><div class='add'>+int btrfs_convert_free_space_to_bitmaps(struct btrfs_trans_handle *trans,</div><div class='add'>+					struct btrfs_block_group *block_group,</div><div class='add'>+					struct btrfs_path *path)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='del'>-	struct btrfs_root *root = fs_info-&gt;free_space_root;</div><div class='add'>+	struct btrfs_root *root = btrfs_free_space_root(block_group);</div><div class='ctx'> 	struct btrfs_free_space_info *info;</div><div class='ctx'> 	struct btrfs_key key, found_key;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='hunk'>@@ -203,10 +216,8 @@ int convert_free_space_to_bitmaps(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	bitmap_size = free_space_bitmap_size(fs_info, block_group-&gt;length);</div><div class='ctx'> 	bitmap = alloc_bitmap(bitmap_size);</div><div class='del'>-	if (!bitmap) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (unlikely(!bitmap))</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> 	start = block_group-&gt;start;</div><div class='ctx'> 	end = block_group-&gt;start + block_group-&gt;length;</div><div class='hunk'>@@ -217,8 +228,10 @@ int convert_free_space_to_bitmaps(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	while (!done) {</div><div class='ctx'> 		ret = btrfs_search_prev_slot(trans, root, &amp;key, path, -1, 1);</div><div class='del'>-		if (ret)</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		leaf = path-&gt;nodes[0];</div><div class='ctx'> 		nr = 0;</div><div class='hunk'>@@ -253,31 +266,35 @@ int convert_free_space_to_bitmaps(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		ret = btrfs_del_items(trans, root, path, path-&gt;slots[0], nr);</div><div class='del'>-		if (ret)</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out;</div><div class='add'>+		}</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	info = search_free_space_info(trans, block_group, path, 1);</div><div class='add'>+	info = btrfs_search_free_space_info(trans, block_group, path, 1);</div><div class='ctx'> 	if (IS_ERR(info)) {</div><div class='ctx'> 		ret = PTR_ERR(info);</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	flags = btrfs_free_space_flags(leaf, info);</div><div class='ctx'> 	flags |= BTRFS_FREE_SPACE_USING_BITMAPS;</div><div class='add'>+	block_group-&gt;using_free_space_bitmaps = true;</div><div class='add'>+	block_group-&gt;using_free_space_bitmaps_cached = true;</div><div class='ctx'> 	btrfs_set_free_space_flags(leaf, info, flags);</div><div class='ctx'> 	expected_extent_count = btrfs_free_space_extent_count(leaf, info);</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='del'>-	if (extent_count != expected_extent_count) {</div><div class='add'>+	if (unlikely(extent_count != expected_extent_count)) {</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='ctx'> 			  "incorrect extent count for %llu; counted %u, expected %u",</div><div class='ctx'> 			  block_group-&gt;start, extent_count,</div><div class='ctx'> 			  expected_extent_count);</div><div class='del'>-		ASSERT(0);</div><div class='ctx'> 		ret = -EIO;</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -298,14 +315,15 @@ int convert_free_space_to_bitmaps(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 		ret = btrfs_insert_empty_item(trans, root, path, &amp;key,</div><div class='ctx'> 					      data_size);</div><div class='del'>-		if (ret)</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		leaf = path-&gt;nodes[0];</div><div class='ctx'> 		ptr = btrfs_item_ptr_offset(leaf, path-&gt;slots[0]);</div><div class='ctx'> 		write_extent_buffer(leaf, bitmap_cursor, ptr,</div><div class='ctx'> 				    data_size);</div><div class='del'>-		btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> </div><div class='ctx'> 		i += extent_size;</div><div class='hunk'>@@ -315,18 +333,16 @@ int convert_free_space_to_bitmaps(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	ret = 0;</div><div class='ctx'> out:</div><div class='ctx'> 	kvfree(bitmap);</div><div class='del'>-	if (ret)</div><div class='del'>-		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> EXPORT_FOR_TESTS</div><div class='del'>-int convert_free_space_to_extents(struct btrfs_trans_handle *trans,</div><div class='del'>-				  struct btrfs_block_group *block_group,</div><div class='del'>-				  struct btrfs_path *path)</div><div class='add'>+int btrfs_convert_free_space_to_extents(struct btrfs_trans_handle *trans,</div><div class='add'>+					struct btrfs_block_group *block_group,</div><div class='add'>+					struct btrfs_path *path)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='del'>-	struct btrfs_root *root = fs_info-&gt;free_space_root;</div><div class='add'>+	struct btrfs_root *root = btrfs_free_space_root(block_group);</div><div class='ctx'> 	struct btrfs_free_space_info *info;</div><div class='ctx'> 	struct btrfs_key key, found_key;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='hunk'>@@ -340,10 +356,8 @@ int convert_free_space_to_extents(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	bitmap_size = free_space_bitmap_size(fs_info, block_group-&gt;length);</div><div class='ctx'> 	bitmap = alloc_bitmap(bitmap_size);</div><div class='del'>-	if (!bitmap) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (unlikely(!bitmap))</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> 	start = block_group-&gt;start;</div><div class='ctx'> 	end = block_group-&gt;start + block_group-&gt;length;</div><div class='hunk'>@@ -354,8 +368,10 @@ int convert_free_space_to_extents(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	while (!done) {</div><div class='ctx'> 		ret = btrfs_search_prev_slot(trans, root, &amp;key, path, -1, 1);</div><div class='del'>-		if (ret)</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		leaf = path-&gt;nodes[0];</div><div class='ctx'> 		nr = 0;</div><div class='hunk'>@@ -384,50 +400,56 @@ int convert_free_space_to_extents(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				data_size = free_space_bitmap_size(fs_info,</div><div class='ctx'> 								found_key.offset);</div><div class='ctx'> </div><div class='del'>-				ptr = btrfs_item_ptr_offset(leaf, path-&gt;slots[0] - 1);</div><div class='add'>+				path-&gt;slots[0]--;</div><div class='add'>+				ptr = btrfs_item_ptr_offset(leaf, path-&gt;slots[0]);</div><div class='ctx'> 				read_extent_buffer(leaf, bitmap_cursor, ptr,</div><div class='ctx'> 						   data_size);</div><div class='ctx'> </div><div class='ctx'> 				nr++;</div><div class='del'>-				path-&gt;slots[0]--;</div><div class='ctx'> 			} else {</div><div class='ctx'> 				ASSERT(0);</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		ret = btrfs_del_items(trans, root, path, path-&gt;slots[0], nr);</div><div class='del'>-		if (ret)</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out;</div><div class='add'>+		}</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	info = search_free_space_info(trans, block_group, path, 1);</div><div class='add'>+	info = btrfs_search_free_space_info(trans, block_group, path, 1);</div><div class='ctx'> 	if (IS_ERR(info)) {</div><div class='ctx'> 		ret = PTR_ERR(info);</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	flags = btrfs_free_space_flags(leaf, info);</div><div class='ctx'> 	flags &amp;= ~BTRFS_FREE_SPACE_USING_BITMAPS;</div><div class='add'>+	block_group-&gt;using_free_space_bitmaps = false;</div><div class='add'>+	block_group-&gt;using_free_space_bitmaps_cached = true;</div><div class='ctx'> 	btrfs_set_free_space_flags(leaf, info, flags);</div><div class='ctx'> 	expected_extent_count = btrfs_free_space_extent_count(leaf, info);</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='del'>-	nrbits = block_group-&gt;length &gt;&gt; block_group-&gt;fs_info-&gt;sectorsize_bits;</div><div class='add'>+	nrbits = block_group-&gt;length &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='ctx'> 	start_bit = find_next_bit_le(bitmap, nrbits, 0);</div><div class='ctx'> </div><div class='ctx'> 	while (start_bit &lt; nrbits) {</div><div class='ctx'> 		end_bit = find_next_zero_bit_le(bitmap, nrbits, start_bit);</div><div class='ctx'> 		ASSERT(start_bit &lt; end_bit);</div><div class='ctx'> </div><div class='del'>-		key.objectid = start + start_bit * block_group-&gt;fs_info-&gt;sectorsize;</div><div class='add'>+		key.objectid = start + start_bit * fs_info-&gt;sectorsize;</div><div class='ctx'> 		key.type = BTRFS_FREE_SPACE_EXTENT_KEY;</div><div class='del'>-		key.offset = (end_bit - start_bit) * block_group-&gt;fs_info-&gt;sectorsize;</div><div class='add'>+		key.offset = (end_bit - start_bit) * fs_info-&gt;sectorsize;</div><div class='ctx'> </div><div class='ctx'> 		ret = btrfs_insert_empty_item(trans, root, path, &amp;key, 0);</div><div class='del'>-		if (ret)</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out;</div><div class='add'>+		}</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> </div><div class='ctx'> 		extent_count++;</div><div class='hunk'>@@ -435,21 +457,19 @@ int convert_free_space_to_extents(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		start_bit = find_next_bit_le(bitmap, nrbits, end_bit);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (extent_count != expected_extent_count) {</div><div class='add'>+	if (unlikely(extent_count != expected_extent_count)) {</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='ctx'> 			  "incorrect extent count for %llu; counted %u, expected %u",</div><div class='ctx'> 			  block_group-&gt;start, extent_count,</div><div class='ctx'> 			  expected_extent_count);</div><div class='del'>-		ASSERT(0);</div><div class='ctx'> 		ret = -EIO;</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = 0;</div><div class='ctx'> out:</div><div class='ctx'> 	kvfree(bitmap);</div><div class='del'>-	if (ret)</div><div class='del'>-		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -466,34 +486,31 @@ static int update_free_space_extent_count(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	if (new_extents == 0)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	info = search_free_space_info(trans, block_group, path, 1);</div><div class='del'>-	if (IS_ERR(info)) {</div><div class='del'>-		ret = PTR_ERR(info);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	info = btrfs_search_free_space_info(trans, block_group, path, 1);</div><div class='add'>+	if (IS_ERR(info))</div><div class='add'>+		return PTR_ERR(info);</div><div class='add'>+</div><div class='ctx'> 	flags = btrfs_free_space_flags(path-&gt;nodes[0], info);</div><div class='ctx'> 	extent_count = btrfs_free_space_extent_count(path-&gt;nodes[0], info);</div><div class='ctx'> </div><div class='ctx'> 	extent_count += new_extents;</div><div class='ctx'> 	btrfs_set_free_space_extent_count(path-&gt;nodes[0], info, extent_count);</div><div class='del'>-	btrfs_mark_buffer_dirty(path-&gt;nodes[0]);</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='ctx'> 	if (!(flags &amp; BTRFS_FREE_SPACE_USING_BITMAPS) &amp;&amp;</div><div class='ctx'> 	    extent_count &gt; block_group-&gt;bitmap_high_thresh) {</div><div class='del'>-		ret = convert_free_space_to_bitmaps(trans, block_group, path);</div><div class='add'>+		ret = btrfs_convert_free_space_to_bitmaps(trans, block_group, path);</div><div class='ctx'> 	} else if ((flags &amp; BTRFS_FREE_SPACE_USING_BITMAPS) &amp;&amp;</div><div class='ctx'> 		   extent_count &lt; block_group-&gt;bitmap_low_thresh) {</div><div class='del'>-		ret = convert_free_space_to_extents(trans, block_group, path);</div><div class='add'>+		ret = btrfs_convert_free_space_to_extents(trans, block_group, path);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> EXPORT_FOR_TESTS</div><div class='del'>-int free_space_test_bit(struct btrfs_block_group *block_group,</div><div class='del'>-			struct btrfs_path *path, u64 offset)</div><div class='add'>+bool btrfs_free_space_test_bit(struct btrfs_block_group *block_group,</div><div class='add'>+			       struct btrfs_path *path, u64 offset)</div><div class='ctx'> {</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='hunk'>@@ -511,12 +528,13 @@ int free_space_test_bit(struct btrfs_block_group *block_group,</div><div class='ctx'> 	ptr = btrfs_item_ptr_offset(leaf, path-&gt;slots[0]);</div><div class='ctx'> 	i = div_u64(offset - found_start,</div><div class='ctx'> 		    block_group-&gt;fs_info-&gt;sectorsize);</div><div class='del'>-	return !!extent_buffer_test_bit(leaf, ptr, i);</div><div class='add'>+	return extent_buffer_test_bit(leaf, ptr, i);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void free_space_set_bits(struct btrfs_block_group *block_group,</div><div class='del'>-				struct btrfs_path *path, u64 *start, u64 *size,</div><div class='del'>-				int bit)</div><div class='add'>+static void free_space_modify_bits(struct btrfs_trans_handle *trans,</div><div class='add'>+				   struct btrfs_block_group *block_group,</div><div class='add'>+				   struct btrfs_path *path, u64 *start, u64 *size,</div><div class='add'>+				   bool set_bits)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = block_group-&gt;fs_info;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='hunk'>@@ -540,11 +558,11 @@ static void free_space_set_bits(struct btrfs_block_group *block_group,</div><div class='ctx'> 	ptr = btrfs_item_ptr_offset(leaf, path-&gt;slots[0]);</div><div class='ctx'> 	first = (*start - found_start) &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='ctx'> 	last = (end - found_start) &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='del'>-	if (bit)</div><div class='add'>+	if (set_bits)</div><div class='ctx'> 		extent_buffer_bitmap_set(leaf, ptr, first, last - first);</div><div class='ctx'> 	else</div><div class='ctx'> 		extent_buffer_bitmap_clear(leaf, ptr, first, last - first);</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='add'>+	btrfs_mark_buffer_dirty(trans, leaf);</div><div class='ctx'> </div><div class='ctx'> 	*size -= end - *start;</div><div class='ctx'> 	*start = end;</div><div class='hunk'>@@ -584,13 +602,14 @@ static int free_space_next_bitmap(struct btrfs_trans_handle *trans,</div><div class='ctx'> static int modify_free_space_bitmap(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				    struct btrfs_block_group *block_group,</div><div class='ctx'> 				    struct btrfs_path *path,</div><div class='del'>-				    u64 start, u64 size, int remove)</div><div class='add'>+				    u64 start, u64 size, bool remove)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *root = block_group-&gt;fs_info-&gt;free_space_root;</div><div class='add'>+	struct btrfs_root *root = btrfs_free_space_root(block_group);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	u64 end = start + size;</div><div class='ctx'> 	u64 cur_start, cur_size;</div><div class='del'>-	int prev_bit, next_bit;</div><div class='add'>+	bool prev_bit_set = false;</div><div class='add'>+	bool next_bit_set = false;</div><div class='ctx'> 	int new_extents;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -607,16 +626,16 @@ static int modify_free_space_bitmap(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 		ret = btrfs_search_prev_slot(trans, root, &amp;key, path, 0, 1);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> </div><div class='del'>-		prev_bit = free_space_test_bit(block_group, path, prev_block);</div><div class='add'>+		prev_bit_set = btrfs_free_space_test_bit(block_group, path, prev_block);</div><div class='ctx'> </div><div class='ctx'> 		/* The previous block may have been in the previous bitmap. */</div><div class='ctx'> 		btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, path-&gt;slots[0]);</div><div class='ctx'> 		if (start &gt;= key.objectid + key.offset) {</div><div class='ctx'> 			ret = free_space_next_bitmap(trans, root, path);</div><div class='ctx'> 			if (ret)</div><div class='del'>-				goto out;</div><div class='add'>+				return ret;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='ctx'> 		key.objectid = start;</div><div class='hunk'>@@ -625,9 +644,7 @@ static int modify_free_space_bitmap(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 		ret = btrfs_search_prev_slot(trans, root, &amp;key, path, 0, 1);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			goto out;</div><div class='del'>-</div><div class='del'>-		prev_bit = -1;</div><div class='add'>+			return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -637,13 +654,13 @@ static int modify_free_space_bitmap(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	cur_start = start;</div><div class='ctx'> 	cur_size = size;</div><div class='ctx'> 	while (1) {</div><div class='del'>-		free_space_set_bits(block_group, path, &amp;cur_start, &amp;cur_size,</div><div class='del'>-				    !remove);</div><div class='add'>+		free_space_modify_bits(trans, block_group, path, &amp;cur_start,</div><div class='add'>+				       &amp;cur_size, !remove);</div><div class='ctx'> 		if (cur_size == 0)</div><div class='ctx'> 			break;</div><div class='ctx'> 		ret = free_space_next_bitmap(trans, root, path);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -656,42 +673,36 @@ static int modify_free_space_bitmap(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		if (end &gt;= key.objectid + key.offset) {</div><div class='ctx'> 			ret = free_space_next_bitmap(trans, root, path);</div><div class='ctx'> 			if (ret)</div><div class='del'>-				goto out;</div><div class='add'>+				return ret;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		next_bit = free_space_test_bit(block_group, path, end);</div><div class='del'>-	} else {</div><div class='del'>-		next_bit = -1;</div><div class='add'>+		next_bit_set = btrfs_free_space_test_bit(block_group, path, end);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (remove) {</div><div class='ctx'> 		new_extents = -1;</div><div class='del'>-		if (prev_bit == 1) {</div><div class='add'>+		if (prev_bit_set) {</div><div class='ctx'> 			/* Leftover on the left. */</div><div class='ctx'> 			new_extents++;</div><div class='ctx'> 		}</div><div class='del'>-		if (next_bit == 1) {</div><div class='add'>+		if (next_bit_set) {</div><div class='ctx'> 			/* Leftover on the right. */</div><div class='ctx'> 			new_extents++;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='ctx'> 		new_extents = 1;</div><div class='del'>-		if (prev_bit == 1) {</div><div class='add'>+		if (prev_bit_set) {</div><div class='ctx'> 			/* Merging with neighbor on the left. */</div><div class='ctx'> 			new_extents--;</div><div class='ctx'> 		}</div><div class='del'>-		if (next_bit == 1) {</div><div class='add'>+		if (next_bit_set) {</div><div class='ctx'> 			/* Merging with neighbor on the right. */</div><div class='ctx'> 			new_extents--;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	btrfs_release_path(path);</div><div class='del'>-	ret = update_free_space_extent_count(trans, block_group, path,</div><div class='del'>-					     new_extents);</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	return ret;</div><div class='add'>+	return update_free_space_extent_count(trans, block_group, path, new_extents);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int remove_free_space_extent(struct btrfs_trans_handle *trans,</div><div class='hunk'>@@ -699,7 +710,7 @@ static int remove_free_space_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				    struct btrfs_path *path,</div><div class='ctx'> 				    u64 start, u64 size)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *root = trans-&gt;fs_info-&gt;free_space_root;</div><div class='add'>+	struct btrfs_root *root = btrfs_free_space_root(block_group);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	u64 found_start, found_end;</div><div class='ctx'> 	u64 end = start + size;</div><div class='hunk'>@@ -712,7 +723,7 @@ static int remove_free_space_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_search_prev_slot(trans, root, &amp;key, path, -1, 1);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, path-&gt;slots[0]);</div><div class='ctx'> </div><div class='hunk'>@@ -744,7 +755,7 @@ static int remove_free_space_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	/* Delete the existing key (cases 1-4). */</div><div class='ctx'> 	ret = btrfs_del_item(trans, root, path);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	/* Add a key for leftovers at the beginning (cases 3 and 4). */</div><div class='ctx'> 	if (start &gt; found_start) {</div><div class='hunk'>@@ -755,7 +766,7 @@ static int remove_free_space_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> 		ret = btrfs_insert_empty_item(trans, root, path, &amp;key, 0);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 		new_extents++;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -768,81 +779,89 @@ static int remove_free_space_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> 		ret = btrfs_insert_empty_item(trans, root, path, &amp;key, 0);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 		new_extents++;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	btrfs_release_path(path);</div><div class='del'>-	ret = update_free_space_extent_count(trans, block_group, path,</div><div class='del'>-					     new_extents);</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	return ret;</div><div class='add'>+	return update_free_space_extent_count(trans, block_group, path, new_extents);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-EXPORT_FOR_TESTS</div><div class='del'>-int __remove_from_free_space_tree(struct btrfs_trans_handle *trans,</div><div class='del'>-				  struct btrfs_block_group *block_group,</div><div class='del'>-				  struct btrfs_path *path, u64 start, u64 size)</div><div class='add'>+static int using_bitmaps(struct btrfs_block_group *bg, struct btrfs_path *path)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_free_space_info *info;</div><div class='ctx'> 	u32 flags;</div><div class='del'>-	int ret;</div><div class='ctx'> </div><div class='del'>-	if (block_group-&gt;needs_free_space) {</div><div class='del'>-		ret = __add_block_group_free_space(trans, block_group, path);</div><div class='del'>-		if (ret)</div><div class='del'>-			return ret;</div><div class='del'>-	}</div><div class='add'>+	if (bg-&gt;using_free_space_bitmaps_cached)</div><div class='add'>+		return bg-&gt;using_free_space_bitmaps;</div><div class='ctx'> </div><div class='del'>-	info = search_free_space_info(NULL, block_group, path, 0);</div><div class='add'>+	info = btrfs_search_free_space_info(NULL, bg, path, 0);</div><div class='ctx'> 	if (IS_ERR(info))</div><div class='ctx'> 		return PTR_ERR(info);</div><div class='ctx'> 	flags = btrfs_free_space_flags(path-&gt;nodes[0], info);</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='del'>-	if (flags &amp; BTRFS_FREE_SPACE_USING_BITMAPS) {</div><div class='add'>+	bg-&gt;using_free_space_bitmaps = (flags &amp; BTRFS_FREE_SPACE_USING_BITMAPS);</div><div class='add'>+	bg-&gt;using_free_space_bitmaps_cached = true;</div><div class='add'>+</div><div class='add'>+	return bg-&gt;using_free_space_bitmaps;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+EXPORT_FOR_TESTS</div><div class='add'>+int __btrfs_remove_from_free_space_tree(struct btrfs_trans_handle *trans,</div><div class='add'>+					struct btrfs_block_group *block_group,</div><div class='add'>+					struct btrfs_path *path, u64 start, u64 size)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = __add_block_group_free_space(trans, block_group, path);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	ret = using_bitmaps(block_group, path);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	if (ret)</div><div class='ctx'> 		return modify_free_space_bitmap(trans, block_group, path,</div><div class='del'>-						start, size, 1);</div><div class='del'>-	} else {</div><div class='del'>-		return remove_free_space_extent(trans, block_group, path,</div><div class='del'>-						start, size);</div><div class='del'>-	}</div><div class='add'>+						start, size, true);</div><div class='add'>+</div><div class='add'>+	return remove_free_space_extent(trans, block_group, path, start, size);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int remove_from_free_space_tree(struct btrfs_trans_handle *trans,</div><div class='del'>-				u64 start, u64 size)</div><div class='add'>+int btrfs_remove_from_free_space_tree(struct btrfs_trans_handle *trans,</div><div class='add'>+				      u64 start, u64 size)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_block_group *block_group;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!btrfs_fs_compat_ro(trans-&gt;fs_info, FREE_SPACE_TREE))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='del'>-	if (!path) {</div><div class='add'>+	if (unlikely(!path)) {</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	block_group = btrfs_lookup_block_group(trans-&gt;fs_info, start);</div><div class='del'>-	if (!block_group) {</div><div class='del'>-		ASSERT(0);</div><div class='add'>+	if (unlikely(!block_group)) {</div><div class='add'>+		DEBUG_WARN("no block group found for start=%llu", start);</div><div class='ctx'> 		ret = -ENOENT;</div><div class='del'>-		goto out;</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;block_group-&gt;free_space_lock);</div><div class='del'>-	ret = __remove_from_free_space_tree(trans, block_group, path, start,</div><div class='del'>-					    size);</div><div class='add'>+	ret = __btrfs_remove_from_free_space_tree(trans, block_group, path, start, size);</div><div class='ctx'> 	mutex_unlock(&amp;block_group-&gt;free_space_lock);</div><div class='del'>-</div><div class='del'>-	btrfs_put_block_group(block_group);</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='add'>+</div><div class='add'>+	btrfs_put_block_group(block_group);</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -851,7 +870,7 @@ static int add_free_space_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				 struct btrfs_path *path,</div><div class='ctx'> 				 u64 start, u64 size)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *root = trans-&gt;fs_info-&gt;free_space_root;</div><div class='add'>+	struct btrfs_root *root = btrfs_free_space_root(block_group);</div><div class='ctx'> 	struct btrfs_key key, new_key;</div><div class='ctx'> 	u64 found_start, found_end;</div><div class='ctx'> 	u64 end = start + size;</div><div class='hunk'>@@ -889,7 +908,7 @@ static int add_free_space_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_search_prev_slot(trans, root, &amp;key, path, -1, 1);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, path-&gt;slots[0]);</div><div class='ctx'> </div><div class='hunk'>@@ -912,7 +931,7 @@ static int add_free_space_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	if (found_end == start) {</div><div class='ctx'> 		ret = btrfs_del_item(trans, root, path);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 		new_key.objectid = found_start;</div><div class='ctx'> 		new_key.offset += key.offset;</div><div class='ctx'> 		new_extents--;</div><div class='hunk'>@@ -929,7 +948,7 @@ right:</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_search_prev_slot(trans, root, &amp;key, path, -1, 1);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, path-&gt;slots[0]);</div><div class='ctx'> </div><div class='hunk'>@@ -953,7 +972,7 @@ right:</div><div class='ctx'> 	if (found_start == end) {</div><div class='ctx'> 		ret = btrfs_del_item(trans, root, path);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 		new_key.offset += key.offset;</div><div class='ctx'> 		new_extents--;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -963,78 +982,67 @@ insert:</div><div class='ctx'> 	/* Insert the new key (cases 1-4). */</div><div class='ctx'> 	ret = btrfs_insert_empty_item(trans, root, path, &amp;new_key, 0);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	btrfs_release_path(path);</div><div class='del'>-	ret = update_free_space_extent_count(trans, block_group, path,</div><div class='del'>-					     new_extents);</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	return ret;</div><div class='add'>+	return update_free_space_extent_count(trans, block_group, path, new_extents);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> EXPORT_FOR_TESTS</div><div class='del'>-int __add_to_free_space_tree(struct btrfs_trans_handle *trans,</div><div class='del'>-			     struct btrfs_block_group *block_group,</div><div class='del'>-			     struct btrfs_path *path, u64 start, u64 size)</div><div class='add'>+int __btrfs_add_to_free_space_tree(struct btrfs_trans_handle *trans,</div><div class='add'>+				   struct btrfs_block_group *block_group,</div><div class='add'>+				   struct btrfs_path *path, u64 start, u64 size)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_free_space_info *info;</div><div class='del'>-	u32 flags;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (block_group-&gt;needs_free_space) {</div><div class='del'>-		ret = __add_block_group_free_space(trans, block_group, path);</div><div class='del'>-		if (ret)</div><div class='del'>-			return ret;</div><div class='del'>-	}</div><div class='add'>+	ret = __add_block_group_free_space(trans, block_group, path);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	info = search_free_space_info(NULL, block_group, path, 0);</div><div class='del'>-	if (IS_ERR(info))</div><div class='del'>-		return PTR_ERR(info);</div><div class='del'>-	flags = btrfs_free_space_flags(path-&gt;nodes[0], info);</div><div class='del'>-	btrfs_release_path(path);</div><div class='add'>+	ret = using_bitmaps(block_group, path);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	if (flags &amp; BTRFS_FREE_SPACE_USING_BITMAPS) {</div><div class='add'>+	if (ret)</div><div class='ctx'> 		return modify_free_space_bitmap(trans, block_group, path,</div><div class='del'>-						start, size, 0);</div><div class='del'>-	} else {</div><div class='del'>-		return add_free_space_extent(trans, block_group, path, start,</div><div class='del'>-					     size);</div><div class='del'>-	}</div><div class='add'>+						start, size, false);</div><div class='add'>+</div><div class='add'>+	return add_free_space_extent(trans, block_group, path, start, size);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int add_to_free_space_tree(struct btrfs_trans_handle *trans,</div><div class='del'>-			   u64 start, u64 size)</div><div class='add'>+int btrfs_add_to_free_space_tree(struct btrfs_trans_handle *trans,</div><div class='add'>+				 u64 start, u64 size)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_block_group *block_group;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!btrfs_fs_compat_ro(trans-&gt;fs_info, FREE_SPACE_TREE))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='del'>-	if (!path) {</div><div class='add'>+	if (unlikely(!path)) {</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	block_group = btrfs_lookup_block_group(trans-&gt;fs_info, start);</div><div class='del'>-	if (!block_group) {</div><div class='del'>-		ASSERT(0);</div><div class='add'>+	if (unlikely(!block_group)) {</div><div class='add'>+		DEBUG_WARN("no block group found for start=%llu", start);</div><div class='ctx'> 		ret = -ENOENT;</div><div class='del'>-		goto out;</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;block_group-&gt;free_space_lock);</div><div class='del'>-	ret = __add_to_free_space_tree(trans, block_group, path, start, size);</div><div class='add'>+	ret = __btrfs_add_to_free_space_tree(trans, block_group, path, start, size);</div><div class='ctx'> 	mutex_unlock(&amp;block_group-&gt;free_space_lock);</div><div class='del'>-</div><div class='del'>-	btrfs_put_block_group(block_group);</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='add'>+</div><div class='add'>+	btrfs_put_block_group(block_group);</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1046,8 +1054,9 @@ out:</div><div class='ctx'> static int populate_free_space_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				    struct btrfs_block_group *block_group)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *extent_root = trans-&gt;fs_info-&gt;extent_root;</div><div class='del'>-	struct btrfs_path *path, *path2;</div><div class='add'>+	struct btrfs_root *extent_root;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path2);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	u64 start, end;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -1055,17 +1064,16 @@ static int populate_free_space_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='del'>-	path-&gt;reada = READA_FORWARD;</div><div class='ctx'> </div><div class='ctx'> 	path2 = btrfs_alloc_path();</div><div class='del'>-	if (!path2) {</div><div class='del'>-		btrfs_free_path(path);</div><div class='add'>+	if (!path2)</div><div class='ctx'> 		return -ENOMEM;</div><div class='del'>-	}</div><div class='add'>+</div><div class='add'>+	path-&gt;reada = READA_FORWARD;</div><div class='ctx'> </div><div class='ctx'> 	ret = add_new_free_space_info(trans, block_group, path2);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;block_group-&gt;free_space_lock);</div><div class='ctx'> </div><div class='hunk'>@@ -1080,14 +1088,26 @@ static int populate_free_space_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	key.type = BTRFS_EXTENT_ITEM_KEY;</div><div class='ctx'> 	key.offset = 0;</div><div class='ctx'> </div><div class='add'>+	extent_root = btrfs_extent_root(trans-&gt;fs_info, key.objectid);</div><div class='ctx'> 	ret = btrfs_search_slot_for_read(extent_root, &amp;key, path, 1, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out_locked;</div><div class='del'>-	ASSERT(ret == 0);</div><div class='del'>-</div><div class='add'>+	/*</div><div class='add'>+	 * If ret is 1 (no key found), it means this is an empty block group,</div><div class='add'>+	 * without any extents allocated from it and there's no block group</div><div class='add'>+	 * item (key BTRFS_BLOCK_GROUP_ITEM_KEY) located in the extent tree</div><div class='add'>+	 * because we are using the block group tree feature (so block group</div><div class='add'>+	 * items are stored in the block group tree) or this is a new block</div><div class='add'>+	 * group created in the current transaction and its block group item</div><div class='add'>+	 * was not yet inserted in the extent tree (that happens in</div><div class='add'>+	 * btrfs_create_pending_block_groups() -&gt; insert_block_group_item()).</div><div class='add'>+	 * It also means there are no extents allocated for block groups with a</div><div class='add'>+	 * start offset beyond this block group's end offset (this is the last,</div><div class='add'>+	 * highest, block group).</div><div class='add'>+	 */</div><div class='ctx'> 	start = block_group-&gt;start;</div><div class='ctx'> 	end = block_group-&gt;start + block_group-&gt;length;</div><div class='del'>-	while (1) {</div><div class='add'>+	while (ret == 0) {</div><div class='ctx'> 		btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, path-&gt;slots[0]);</div><div class='ctx'> </div><div class='ctx'> 		if (key.type == BTRFS_EXTENT_ITEM_KEY ||</div><div class='hunk'>@@ -1096,11 +1116,11 @@ static int populate_free_space_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				break;</div><div class='ctx'> </div><div class='ctx'> 			if (start &lt; key.objectid) {</div><div class='del'>-				ret = __add_to_free_space_tree(trans,</div><div class='del'>-							       block_group,</div><div class='del'>-							       path2, start,</div><div class='del'>-							       key.objectid -</div><div class='del'>-							       start);</div><div class='add'>+				ret = __btrfs_add_to_free_space_tree(trans,</div><div class='add'>+								     block_group,</div><div class='add'>+								     path2, start,</div><div class='add'>+								     key.objectid -</div><div class='add'>+								     start);</div><div class='ctx'> 				if (ret)</div><div class='ctx'> 					goto out_locked;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -1117,12 +1137,10 @@ static int populate_free_space_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		ret = btrfs_next_item(extent_root, path);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out_locked;</div><div class='del'>-		if (ret)</div><div class='del'>-			break;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (start &lt; end) {</div><div class='del'>-		ret = __add_to_free_space_tree(trans, block_group, path2,</div><div class='del'>-					       start, end - start);</div><div class='add'>+		ret = __btrfs_add_to_free_space_tree(trans, block_group, path2,</div><div class='add'>+						     start, end - start);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto out_locked;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1130,9 +1148,7 @@ static int populate_free_space_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	ret = 0;</div><div class='ctx'> out_locked:</div><div class='ctx'> 	mutex_unlock(&amp;block_group-&gt;free_space_lock);</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path2);</div><div class='del'>-	btrfs_free_path(path);</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1155,17 +1171,28 @@ int btrfs_create_free_space_tree(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 					    BTRFS_FREE_SPACE_TREE_OBJECTID);</div><div class='ctx'> 	if (IS_ERR(free_space_root)) {</div><div class='ctx'> 		ret = PTR_ERR(free_space_root);</div><div class='del'>-		goto abort;</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		btrfs_end_transaction(trans);</div><div class='add'>+		goto out_clear;</div><div class='add'>+	}</div><div class='add'>+	ret = btrfs_global_root_insert(free_space_root);</div><div class='add'>+	if (unlikely(ret)) {</div><div class='add'>+		btrfs_put_root(free_space_root);</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		btrfs_end_transaction(trans);</div><div class='add'>+		goto out_clear;</div><div class='ctx'> 	}</div><div class='del'>-	fs_info-&gt;free_space_root = free_space_root;</div><div class='ctx'> </div><div class='del'>-	node = rb_first(&amp;fs_info-&gt;block_group_cache_tree);</div><div class='add'>+	node = rb_first_cached(&amp;fs_info-&gt;block_group_cache_tree);</div><div class='ctx'> 	while (node) {</div><div class='ctx'> 		block_group = rb_entry(node, struct btrfs_block_group,</div><div class='ctx'> 				       cache_node);</div><div class='ctx'> 		ret = populate_free_space_tree(trans, block_group);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto abort;</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			btrfs_end_transaction(trans);</div><div class='add'>+			goto out_clear;</div><div class='add'>+		}</div><div class='ctx'> 		node = rb_next(node);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1181,19 +1208,18 @@ int btrfs_create_free_space_tree(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	clear_bit(BTRFS_FS_FREE_SPACE_TREE_UNTRUSTED, &amp;fs_info-&gt;flags);</div><div class='ctx'> 	return ret;</div><div class='ctx'> </div><div class='del'>-abort:</div><div class='add'>+out_clear:</div><div class='ctx'> 	clear_bit(BTRFS_FS_CREATING_FREE_SPACE_TREE, &amp;fs_info-&gt;flags);</div><div class='ctx'> 	clear_bit(BTRFS_FS_FREE_SPACE_TREE_UNTRUSTED, &amp;fs_info-&gt;flags);</div><div class='del'>-	btrfs_abort_transaction(trans, ret);</div><div class='del'>-	btrfs_end_transaction(trans);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int clear_free_space_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				 struct btrfs_root *root)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='add'>+	struct rb_node *node;</div><div class='ctx'> 	int nr;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -1208,7 +1234,7 @@ static int clear_free_space_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		ret = btrfs_search_slot(trans, root, &amp;key, path, -1, 1);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> </div><div class='ctx'> 		nr = btrfs_header_nritems(path-&gt;nodes[0]);</div><div class='ctx'> 		if (!nr)</div><div class='hunk'>@@ -1217,22 +1243,34 @@ static int clear_free_space_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		path-&gt;slots[0] = 0;</div><div class='ctx'> 		ret = btrfs_del_items(trans, root, path, 0, nr);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> </div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = 0;</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	node = rb_first_cached(&amp;trans-&gt;fs_info-&gt;block_group_cache_tree);</div><div class='add'>+	while (node) {</div><div class='add'>+		struct btrfs_block_group *bg;</div><div class='add'>+</div><div class='add'>+		bg = rb_entry(node, struct btrfs_block_group, cache_node);</div><div class='add'>+		clear_bit(BLOCK_GROUP_FLAG_FREE_SPACE_ADDED, &amp;bg-&gt;runtime_flags);</div><div class='add'>+		node = rb_next(node);</div><div class='add'>+		cond_resched();</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_clear_free_space_tree(struct btrfs_fs_info *fs_info)</div><div class='add'>+int btrfs_delete_free_space_tree(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	struct btrfs_root *tree_root = fs_info-&gt;tree_root;</div><div class='del'>-	struct btrfs_root *free_space_root = fs_info-&gt;free_space_root;</div><div class='add'>+	struct btrfs_key key = {</div><div class='add'>+		.objectid = BTRFS_FREE_SPACE_TREE_OBJECTID,</div><div class='add'>+		.type = BTRFS_ROOT_ITEM_KEY,</div><div class='add'>+		.offset = 0,</div><div class='add'>+	};</div><div class='add'>+	struct btrfs_root *free_space_root = btrfs_global_root(fs_info, &amp;key);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	trans = btrfs_start_transaction(tree_root, 0);</div><div class='hunk'>@@ -1241,86 +1279,184 @@ int btrfs_clear_free_space_tree(struct btrfs_fs_info *fs_info)</div><div class='ctx'> </div><div class='ctx'> 	btrfs_clear_fs_compat_ro(fs_info, FREE_SPACE_TREE);</div><div class='ctx'> 	btrfs_clear_fs_compat_ro(fs_info, FREE_SPACE_TREE_VALID);</div><div class='del'>-	fs_info-&gt;free_space_root = NULL;</div><div class='ctx'> </div><div class='ctx'> 	ret = clear_free_space_tree(trans, free_space_root);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto abort;</div><div class='add'>+	if (unlikely(ret)) {</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		btrfs_end_transaction(trans);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_del_root(trans, &amp;free_space_root-&gt;root_key);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto abort;</div><div class='add'>+	if (unlikely(ret)) {</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		btrfs_end_transaction(trans);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	btrfs_global_root_delete(free_space_root);</div><div class='ctx'> </div><div class='add'>+	spin_lock(&amp;fs_info-&gt;trans_lock);</div><div class='ctx'> 	list_del(&amp;free_space_root-&gt;dirty_list);</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_tree_lock(free_space_root-&gt;node);</div><div class='del'>-	btrfs_clean_tree_block(free_space_root-&gt;node);</div><div class='add'>+	btrfs_clear_buffer_dirty(trans, free_space_root-&gt;node);</div><div class='ctx'> 	btrfs_tree_unlock(free_space_root-&gt;node);</div><div class='del'>-	btrfs_free_tree_block(trans, free_space_root, free_space_root-&gt;node,</div><div class='del'>-			      0, 1);</div><div class='del'>-</div><div class='add'>+	ret = btrfs_free_tree_block(trans, btrfs_root_id(free_space_root),</div><div class='add'>+				    free_space_root-&gt;node, 0, 1);</div><div class='ctx'> 	btrfs_put_root(free_space_root);</div><div class='add'>+	if (unlikely(ret &lt; 0)) {</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		btrfs_end_transaction(trans);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	return btrfs_commit_transaction(trans);</div><div class='del'>-</div><div class='del'>-abort:</div><div class='del'>-	btrfs_abort_transaction(trans, ret);</div><div class='del'>-	btrfs_end_transaction(trans);</div><div class='del'>-	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __add_block_group_free_space(struct btrfs_trans_handle *trans,</div><div class='del'>-					struct btrfs_block_group *block_group,</div><div class='del'>-					struct btrfs_path *path)</div><div class='add'>+int btrfs_rebuild_free_space_tree(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_trans_handle *trans;</div><div class='add'>+	struct btrfs_key key = {</div><div class='add'>+		.objectid = BTRFS_FREE_SPACE_TREE_OBJECTID,</div><div class='add'>+		.type = BTRFS_ROOT_ITEM_KEY,</div><div class='add'>+		.offset = 0,</div><div class='add'>+	};</div><div class='add'>+	struct btrfs_root *free_space_root = btrfs_global_root(fs_info, &amp;key);</div><div class='add'>+	struct rb_node *node;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	block_group-&gt;needs_free_space = 0;</div><div class='add'>+	trans = btrfs_start_transaction(free_space_root, 1);</div><div class='add'>+	if (IS_ERR(trans))</div><div class='add'>+		return PTR_ERR(trans);</div><div class='ctx'> </div><div class='del'>-	ret = add_new_free_space_info(trans, block_group, path);</div><div class='del'>-	if (ret)</div><div class='add'>+	set_bit(BTRFS_FS_CREATING_FREE_SPACE_TREE, &amp;fs_info-&gt;flags);</div><div class='add'>+	set_bit(BTRFS_FS_FREE_SPACE_TREE_UNTRUSTED, &amp;fs_info-&gt;flags);</div><div class='add'>+</div><div class='add'>+	ret = clear_free_space_tree(trans, free_space_root);</div><div class='add'>+	if (unlikely(ret)) {</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		btrfs_end_transaction(trans);</div><div class='ctx'> 		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	node = rb_first_cached(&amp;fs_info-&gt;block_group_cache_tree);</div><div class='add'>+	while (node) {</div><div class='add'>+		struct btrfs_block_group *block_group;</div><div class='add'>+</div><div class='add'>+		block_group = rb_entry(node, struct btrfs_block_group,</div><div class='add'>+				       cache_node);</div><div class='add'>+</div><div class='add'>+		if (test_bit(BLOCK_GROUP_FLAG_FREE_SPACE_ADDED,</div><div class='add'>+			     &amp;block_group-&gt;runtime_flags))</div><div class='add'>+			goto next;</div><div class='add'>+</div><div class='add'>+		ret = populate_free_space_tree(trans, block_group);</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			btrfs_end_transaction(trans);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='add'>+next:</div><div class='add'>+		if (btrfs_should_end_transaction(trans)) {</div><div class='add'>+			btrfs_end_transaction(trans);</div><div class='add'>+			trans = btrfs_start_transaction(free_space_root, 1);</div><div class='add'>+			if (IS_ERR(trans))</div><div class='add'>+				return PTR_ERR(trans);</div><div class='add'>+		}</div><div class='add'>+		node = rb_next(node);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	return __add_to_free_space_tree(trans, block_group, path,</div><div class='del'>-					block_group-&gt;start,</div><div class='del'>-					block_group-&gt;length);</div><div class='add'>+	btrfs_set_fs_compat_ro(fs_info, FREE_SPACE_TREE);</div><div class='add'>+	btrfs_set_fs_compat_ro(fs_info, FREE_SPACE_TREE_VALID);</div><div class='add'>+	clear_bit(BTRFS_FS_CREATING_FREE_SPACE_TREE, &amp;fs_info-&gt;flags);</div><div class='add'>+</div><div class='add'>+	ret = btrfs_commit_transaction(trans);</div><div class='add'>+	clear_bit(BTRFS_FS_FREE_SPACE_TREE_UNTRUSTED, &amp;fs_info-&gt;flags);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int add_block_group_free_space(struct btrfs_trans_handle *trans,</div><div class='del'>-			       struct btrfs_block_group *block_group)</div><div class='add'>+static int __add_block_group_free_space(struct btrfs_trans_handle *trans,</div><div class='add'>+					struct btrfs_block_group *block_group,</div><div class='add'>+					struct btrfs_path *path)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='del'>-	struct btrfs_path *path = NULL;</div><div class='del'>-	int ret = 0;</div><div class='add'>+	bool own_path = false;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	if (!btrfs_fs_compat_ro(fs_info, FREE_SPACE_TREE))</div><div class='add'>+	if (!test_and_clear_bit(BLOCK_GROUP_FLAG_NEEDS_FREE_SPACE,</div><div class='add'>+				&amp;block_group-&gt;runtime_flags))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;block_group-&gt;free_space_lock);</div><div class='del'>-	if (!block_group-&gt;needs_free_space)</div><div class='del'>-		goto out;</div><div class='add'>+	/*</div><div class='add'>+	 * While rebuilding the free space tree we may allocate new metadata</div><div class='add'>+	 * block groups while modifying the free space tree.</div><div class='add'>+	 *</div><div class='add'>+	 * Because during the rebuild (at btrfs_rebuild_free_space_tree()) we</div><div class='add'>+	 * can use multiple transactions, every time btrfs_end_transaction() is</div><div class='add'>+	 * called at btrfs_rebuild_free_space_tree() we finish the creation of</div><div class='add'>+	 * new block groups by calling btrfs_create_pending_block_groups(), and</div><div class='add'>+	 * that in turn calls us, through add_block_group_free_space(), to add</div><div class='add'>+	 * a free space info item and a free space extent item for the block</div><div class='add'>+	 * group.</div><div class='add'>+	 *</div><div class='add'>+	 * Then later btrfs_rebuild_free_space_tree() may find such new block</div><div class='add'>+	 * groups and processes them with populate_free_space_tree(), which can</div><div class='add'>+	 * fail with EEXIST since there are already items for the block group in</div><div class='add'>+	 * the free space tree. Notice that we say "may find" because a new</div><div class='add'>+	 * block group may be added to the block groups rbtree in a node before</div><div class='add'>+	 * or after the block group currently being processed by the rebuild</div><div class='add'>+	 * process. So signal the rebuild process to skip such new block groups</div><div class='add'>+	 * if it finds them.</div><div class='add'>+	 */</div><div class='add'>+	set_bit(BLOCK_GROUP_FLAG_FREE_SPACE_ADDED, &amp;block_group-&gt;runtime_flags);</div><div class='ctx'> </div><div class='del'>-	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='add'>+		path = btrfs_alloc_path();</div><div class='add'>+		if (unlikely(!path)) {</div><div class='add'>+			btrfs_abort_transaction(trans, -ENOMEM);</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+		}</div><div class='add'>+		own_path = true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = add_new_free_space_info(trans, block_group, path);</div><div class='add'>+	if (unlikely(ret)) {</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = __add_block_group_free_space(trans, block_group, path);</div><div class='add'>+	ret = __btrfs_add_to_free_space_tree(trans, block_group, path,</div><div class='add'>+					     block_group-&gt;start, block_group-&gt;length);</div><div class='add'>+	if (ret)</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='add'>+	if (own_path)</div><div class='add'>+		btrfs_free_path(path);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_add_block_group_free_space(struct btrfs_trans_handle *trans,</div><div class='add'>+				     struct btrfs_block_group *block_group)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (!btrfs_fs_compat_ro(trans-&gt;fs_info, FREE_SPACE_TREE))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;block_group-&gt;free_space_lock);</div><div class='add'>+	ret = __add_block_group_free_space(trans, block_group, NULL);</div><div class='ctx'> 	mutex_unlock(&amp;block_group-&gt;free_space_lock);</div><div class='del'>-	if (ret)</div><div class='del'>-		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int remove_block_group_free_space(struct btrfs_trans_handle *trans,</div><div class='del'>-				  struct btrfs_block_group *block_group)</div><div class='add'>+int btrfs_remove_block_group_free_space(struct btrfs_trans_handle *trans,</div><div class='add'>+					struct btrfs_block_group *block_group)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *root = trans-&gt;fs_info-&gt;free_space_root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	struct btrfs_root *root = btrfs_free_space_root(block_group);</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key, found_key;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	u64 start, end;</div><div class='hunk'>@@ -1330,15 +1466,16 @@ int remove_block_group_free_space(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	if (!btrfs_fs_compat_ro(trans-&gt;fs_info, FREE_SPACE_TREE))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	if (block_group-&gt;needs_free_space) {</div><div class='add'>+	if (test_bit(BLOCK_GROUP_FLAG_NEEDS_FREE_SPACE, &amp;block_group-&gt;runtime_flags)) {</div><div class='ctx'> 		/* We never added this block group to the free space tree. */</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='del'>-	if (!path) {</div><div class='add'>+	if (unlikely(!path)) {</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	start = block_group-&gt;start;</div><div class='hunk'>@@ -1350,8 +1487,10 @@ int remove_block_group_free_space(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	while (!done) {</div><div class='ctx'> 		ret = btrfs_search_prev_slot(trans, root, &amp;key, path, -1, 1);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto out;</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		leaf = path-&gt;nodes[0];</div><div class='ctx'> 		nr = 0;</div><div class='hunk'>@@ -1379,16 +1518,15 @@ int remove_block_group_free_space(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		ret = btrfs_del_items(trans, root, path, path-&gt;slots[0], nr);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto out;</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = 0;</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	if (ret)</div><div class='del'>-		btrfs_abort_transaction(trans, ret);</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1400,7 +1538,7 @@ static int load_free_space_bitmaps(struct btrfs_caching_control *caching_ctl,</div><div class='ctx'> 	struct btrfs_fs_info *fs_info;</div><div class='ctx'> 	struct btrfs_root *root;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='del'>-	int prev_bit = 0, bit;</div><div class='add'>+	bool prev_bit_set = false;</div><div class='ctx'> 	/* Initialize to silence GCC. */</div><div class='ctx'> 	u64 extent_start = 0;</div><div class='ctx'> 	u64 end, offset;</div><div class='hunk'>@@ -1410,14 +1548,14 @@ static int load_free_space_bitmaps(struct btrfs_caching_control *caching_ctl,</div><div class='ctx'> </div><div class='ctx'> 	block_group = caching_ctl-&gt;block_group;</div><div class='ctx'> 	fs_info = block_group-&gt;fs_info;</div><div class='del'>-	root = fs_info-&gt;free_space_root;</div><div class='add'>+	root = btrfs_free_space_root(block_group);</div><div class='ctx'> </div><div class='ctx'> 	end = block_group-&gt;start + block_group-&gt;length;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		ret = btrfs_next_item(root, path);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='hunk'>@@ -1429,48 +1567,50 @@ static int load_free_space_bitmaps(struct btrfs_caching_control *caching_ctl,</div><div class='ctx'> 		ASSERT(key.type == BTRFS_FREE_SPACE_BITMAP_KEY);</div><div class='ctx'> 		ASSERT(key.objectid &lt; end &amp;&amp; key.objectid + key.offset &lt;= end);</div><div class='ctx'> </div><div class='del'>-		caching_ctl-&gt;progress = key.objectid;</div><div class='del'>-</div><div class='ctx'> 		offset = key.objectid;</div><div class='ctx'> 		while (offset &lt; key.objectid + key.offset) {</div><div class='del'>-			bit = free_space_test_bit(block_group, path, offset);</div><div class='del'>-			if (prev_bit == 0 &amp;&amp; bit == 1) {</div><div class='add'>+			bool bit_set;</div><div class='add'>+</div><div class='add'>+			bit_set = btrfs_free_space_test_bit(block_group, path, offset);</div><div class='add'>+			if (!prev_bit_set &amp;&amp; bit_set) {</div><div class='ctx'> 				extent_start = offset;</div><div class='del'>-			} else if (prev_bit == 1 &amp;&amp; bit == 0) {</div><div class='del'>-				total_found += add_new_free_space(block_group,</div><div class='del'>-								  extent_start,</div><div class='del'>-								  offset);</div><div class='add'>+			} else if (prev_bit_set &amp;&amp; !bit_set) {</div><div class='add'>+				u64 space_added;</div><div class='add'>+</div><div class='add'>+				ret = btrfs_add_new_free_space(block_group,</div><div class='add'>+							       extent_start,</div><div class='add'>+							       offset,</div><div class='add'>+							       &amp;space_added);</div><div class='add'>+				if (ret)</div><div class='add'>+					return ret;</div><div class='add'>+				total_found += space_added;</div><div class='ctx'> 				if (total_found &gt; CACHING_CTL_WAKE_UP) {</div><div class='ctx'> 					total_found = 0;</div><div class='ctx'> 					wake_up(&amp;caching_ctl-&gt;wait);</div><div class='ctx'> 				}</div><div class='ctx'> 				extent_count++;</div><div class='ctx'> 			}</div><div class='del'>-			prev_bit = bit;</div><div class='add'>+			prev_bit_set = bit_set;</div><div class='ctx'> 			offset += fs_info-&gt;sectorsize;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	if (prev_bit == 1) {</div><div class='del'>-		total_found += add_new_free_space(block_group, extent_start,</div><div class='del'>-						  end);</div><div class='add'>+	if (prev_bit_set) {</div><div class='add'>+		ret = btrfs_add_new_free_space(block_group, extent_start, end, NULL);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='ctx'> 		extent_count++;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (extent_count != expected_extent_count) {</div><div class='add'>+	if (unlikely(extent_count != expected_extent_count)) {</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='ctx'> 			  "incorrect extent count for %llu; counted %u, expected %u",</div><div class='ctx'> 			  block_group-&gt;start, extent_count,</div><div class='ctx'> 			  expected_extent_count);</div><div class='del'>-		ASSERT(0);</div><div class='del'>-		ret = -EIO;</div><div class='del'>-		goto out;</div><div class='add'>+		DEBUG_WARN();</div><div class='add'>+		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	caching_ctl-&gt;progress = (u64)-1;</div><div class='del'>-</div><div class='del'>-	ret = 0;</div><div class='del'>-out:</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int load_free_space_extents(struct btrfs_caching_control *caching_ctl,</div><div class='hunk'>@@ -1488,14 +1628,16 @@ static int load_free_space_extents(struct btrfs_caching_control *caching_ctl,</div><div class='ctx'> </div><div class='ctx'> 	block_group = caching_ctl-&gt;block_group;</div><div class='ctx'> 	fs_info = block_group-&gt;fs_info;</div><div class='del'>-	root = fs_info-&gt;free_space_root;</div><div class='add'>+	root = btrfs_free_space_root(block_group);</div><div class='ctx'> </div><div class='ctx'> 	end = block_group-&gt;start + block_group-&gt;length;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='add'>+		u64 space_added;</div><div class='add'>+</div><div class='ctx'> 		ret = btrfs_next_item(root, path);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='hunk'>@@ -1507,10 +1649,12 @@ static int load_free_space_extents(struct btrfs_caching_control *caching_ctl,</div><div class='ctx'> 		ASSERT(key.type == BTRFS_FREE_SPACE_EXTENT_KEY);</div><div class='ctx'> 		ASSERT(key.objectid &lt; end &amp;&amp; key.objectid + key.offset &lt;= end);</div><div class='ctx'> </div><div class='del'>-		caching_ctl-&gt;progress = key.objectid;</div><div class='del'>-</div><div class='del'>-		total_found += add_new_free_space(block_group, key.objectid,</div><div class='del'>-						  key.objectid + key.offset);</div><div class='add'>+		ret = btrfs_add_new_free_space(block_group, key.objectid,</div><div class='add'>+					       key.objectid + key.offset,</div><div class='add'>+					       &amp;space_added);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		total_found += space_added;</div><div class='ctx'> 		if (total_found &gt; CACHING_CTL_WAKE_UP) {</div><div class='ctx'> 			total_found = 0;</div><div class='ctx'> 			wake_up(&amp;caching_ctl-&gt;wait);</div><div class='hunk'>@@ -1518,30 +1662,24 @@ static int load_free_space_extents(struct btrfs_caching_control *caching_ctl,</div><div class='ctx'> 		extent_count++;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (extent_count != expected_extent_count) {</div><div class='add'>+	if (unlikely(extent_count != expected_extent_count)) {</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='ctx'> 			  "incorrect extent count for %llu; counted %u, expected %u",</div><div class='ctx'> 			  block_group-&gt;start, extent_count,</div><div class='ctx'> 			  expected_extent_count);</div><div class='del'>-		ASSERT(0);</div><div class='del'>-		ret = -EIO;</div><div class='del'>-		goto out;</div><div class='add'>+		DEBUG_WARN();</div><div class='add'>+		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	caching_ctl-&gt;progress = (u64)-1;</div><div class='del'>-</div><div class='del'>-	ret = 0;</div><div class='del'>-out:</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int load_free_space_tree(struct btrfs_caching_control *caching_ctl)</div><div class='add'>+int btrfs_load_free_space_tree(struct btrfs_caching_control *caching_ctl)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_block_group *block_group;</div><div class='ctx'> 	struct btrfs_free_space_info *info;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	u32 extent_count, flags;</div><div class='del'>-	int ret;</div><div class='ctx'> </div><div class='ctx'> 	block_group = caching_ctl-&gt;block_group;</div><div class='ctx'> </div><div class='hunk'>@@ -1553,15 +1691,14 @@ int load_free_space_tree(struct btrfs_caching_control *caching_ctl)</div><div class='ctx'> 	 * Just like caching_thread() doesn't want to deadlock on the extent</div><div class='ctx'> 	 * tree, we don't want to deadlock on the free space tree.</div><div class='ctx'> 	 */</div><div class='del'>-	path-&gt;skip_locking = 1;</div><div class='del'>-	path-&gt;search_commit_root = 1;</div><div class='add'>+	path-&gt;skip_locking = true;</div><div class='add'>+	path-&gt;search_commit_root = true;</div><div class='ctx'> 	path-&gt;reada = READA_FORWARD;</div><div class='ctx'> </div><div class='del'>-	info = search_free_space_info(NULL, block_group, path, 0);</div><div class='del'>-	if (IS_ERR(info)) {</div><div class='del'>-		ret = PTR_ERR(info);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	info = btrfs_search_free_space_info(NULL, block_group, path, 0);</div><div class='add'>+	if (IS_ERR(info))</div><div class='add'>+		return PTR_ERR(info);</div><div class='add'>+</div><div class='ctx'> 	extent_count = btrfs_free_space_extent_count(path-&gt;nodes[0], info);</div><div class='ctx'> 	flags = btrfs_free_space_flags(path-&gt;nodes[0], info);</div><div class='ctx'> </div><div class='hunk'>@@ -1571,11 +1708,7 @@ int load_free_space_tree(struct btrfs_caching_control *caching_ctl)</div><div class='ctx'> 	 * there.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (flags &amp; BTRFS_FREE_SPACE_USING_BITMAPS)</div><div class='del'>-		ret = load_free_space_bitmaps(caching_ctl, path, extent_count);</div><div class='add'>+		return load_free_space_bitmaps(caching_ctl, path, extent_count);</div><div class='ctx'> 	else</div><div class='del'>-		ret = load_free_space_extents(caching_ctl, path, extent_count);</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+		return load_free_space_extents(caching_ctl, path, extent_count);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/btrfs/free-space-tree.h b/fs/btrfs/free-space-tree.h<br/>index dc2463e4cfe3..3d9a5d4477fc 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/free-space-tree.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/free-space-tree.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/free-space-tree.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/free-space-tree.h</a></div><div class='hunk'>@@ -6,7 +6,13 @@</div><div class='ctx'> #ifndef BTRFS_FREE_SPACE_TREE_H</div><div class='ctx'> #define BTRFS_FREE_SPACE_TREE_H</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/bits.h&gt;</div><div class='add'>+</div><div class='ctx'> struct btrfs_caching_control;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+struct btrfs_path;</div><div class='add'>+struct btrfs_block_group;</div><div class='add'>+struct btrfs_trans_handle;</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * The default size for new free space bitmap items. The last bitmap in a block</div><div class='hunk'>@@ -16,38 +22,39 @@ struct btrfs_caching_control;</div><div class='ctx'> #define BTRFS_FREE_SPACE_BITMAP_SIZE 256</div><div class='ctx'> #define BTRFS_FREE_SPACE_BITMAP_BITS (BTRFS_FREE_SPACE_BITMAP_SIZE * BITS_PER_BYTE)</div><div class='ctx'> </div><div class='del'>-void set_free_space_tree_thresholds(struct btrfs_block_group *block_group);</div><div class='add'>+void btrfs_set_free_space_tree_thresholds(struct btrfs_block_group *block_group);</div><div class='ctx'> int btrfs_create_free_space_tree(struct btrfs_fs_info *fs_info);</div><div class='del'>-int btrfs_clear_free_space_tree(struct btrfs_fs_info *fs_info);</div><div class='del'>-int load_free_space_tree(struct btrfs_caching_control *caching_ctl);</div><div class='del'>-int add_block_group_free_space(struct btrfs_trans_handle *trans,</div><div class='del'>-			       struct btrfs_block_group *block_group);</div><div class='del'>-int remove_block_group_free_space(struct btrfs_trans_handle *trans,</div><div class='del'>-				  struct btrfs_block_group *block_group);</div><div class='del'>-int add_to_free_space_tree(struct btrfs_trans_handle *trans,</div><div class='del'>-			   u64 start, u64 size);</div><div class='del'>-int remove_from_free_space_tree(struct btrfs_trans_handle *trans,</div><div class='del'>-				u64 start, u64 size);</div><div class='add'>+int btrfs_delete_free_space_tree(struct btrfs_fs_info *fs_info);</div><div class='add'>+int btrfs_rebuild_free_space_tree(struct btrfs_fs_info *fs_info);</div><div class='add'>+int btrfs_load_free_space_tree(struct btrfs_caching_control *caching_ctl);</div><div class='add'>+int btrfs_add_block_group_free_space(struct btrfs_trans_handle *trans,</div><div class='add'>+				     struct btrfs_block_group *block_group);</div><div class='add'>+int btrfs_remove_block_group_free_space(struct btrfs_trans_handle *trans,</div><div class='add'>+					struct btrfs_block_group *block_group);</div><div class='add'>+int btrfs_add_to_free_space_tree(struct btrfs_trans_handle *trans,</div><div class='add'>+				 u64 start, u64 size);</div><div class='add'>+int btrfs_remove_from_free_space_tree(struct btrfs_trans_handle *trans,</div><div class='add'>+				      u64 start, u64 size);</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_BTRFS_FS_RUN_SANITY_TESTS</div><div class='ctx'> struct btrfs_free_space_info *</div><div class='del'>-search_free_space_info(struct btrfs_trans_handle *trans,</div><div class='del'>-		       struct btrfs_block_group *block_group,</div><div class='del'>-		       struct btrfs_path *path, int cow);</div><div class='del'>-int __add_to_free_space_tree(struct btrfs_trans_handle *trans,</div><div class='add'>+btrfs_search_free_space_info(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			     struct btrfs_block_group *block_group,</div><div class='del'>-			     struct btrfs_path *path, u64 start, u64 size);</div><div class='del'>-int __remove_from_free_space_tree(struct btrfs_trans_handle *trans,</div><div class='del'>-				  struct btrfs_block_group *block_group,</div><div class='del'>-				  struct btrfs_path *path, u64 start, u64 size);</div><div class='del'>-int convert_free_space_to_bitmaps(struct btrfs_trans_handle *trans,</div><div class='del'>-				  struct btrfs_block_group *block_group,</div><div class='del'>-				  struct btrfs_path *path);</div><div class='del'>-int convert_free_space_to_extents(struct btrfs_trans_handle *trans,</div><div class='del'>-				  struct btrfs_block_group *block_group,</div><div class='del'>-				  struct btrfs_path *path);</div><div class='del'>-int free_space_test_bit(struct btrfs_block_group *block_group,</div><div class='del'>-			struct btrfs_path *path, u64 offset);</div><div class='add'>+			     struct btrfs_path *path, int cow);</div><div class='add'>+int __btrfs_add_to_free_space_tree(struct btrfs_trans_handle *trans,</div><div class='add'>+				   struct btrfs_block_group *block_group,</div><div class='add'>+				   struct btrfs_path *path, u64 start, u64 size);</div><div class='add'>+int __btrfs_remove_from_free_space_tree(struct btrfs_trans_handle *trans,</div><div class='add'>+					struct btrfs_block_group *block_group,</div><div class='add'>+					struct btrfs_path *path, u64 start, u64 size);</div><div class='add'>+int btrfs_convert_free_space_to_bitmaps(struct btrfs_trans_handle *trans,</div><div class='add'>+					struct btrfs_block_group *block_group,</div><div class='add'>+					struct btrfs_path *path);</div><div class='add'>+int btrfs_convert_free_space_to_extents(struct btrfs_trans_handle *trans,</div><div class='add'>+					struct btrfs_block_group *block_group,</div><div class='add'>+					struct btrfs_path *path);</div><div class='add'>+bool btrfs_free_space_test_bit(struct btrfs_block_group *block_group,</div><div class='add'>+			       struct btrfs_path *path, u64 offset);</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/btrfs/fs.c b/fs/btrfs/fs.c<br/>new file mode 100644<br/>index 000000000000..feb0a2faa837<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/fs.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/fs.c</a></div><div class='hunk'>@@ -0,0 +1,275 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+</div><div class='add'>+#include "messages.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "volumes.h"</div><div class='add'>+</div><div class='add'>+static const struct btrfs_csums {</div><div class='add'>+	u16		size;</div><div class='add'>+	const char	name[10];</div><div class='add'>+	const char	driver[12];</div><div class='add'>+} btrfs_csums[] = {</div><div class='add'>+	[BTRFS_CSUM_TYPE_CRC32] = { .size = 4, .name = "crc32c" },</div><div class='add'>+	[BTRFS_CSUM_TYPE_XXHASH] = { .size = 8, .name = "xxhash64" },</div><div class='add'>+	[BTRFS_CSUM_TYPE_SHA256] = { .size = 32, .name = "sha256" },</div><div class='add'>+	[BTRFS_CSUM_TYPE_BLAKE2] = { .size = 32, .name = "blake2b",</div><div class='add'>+				     .driver = "blake2b-256" },</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/* This exists for btrfs-progs usages. */</div><div class='add'>+u16 btrfs_csum_type_size(u16 type)</div><div class='add'>+{</div><div class='add'>+	return btrfs_csums[type].size;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_super_csum_size(const struct btrfs_super_block *s)</div><div class='add'>+{</div><div class='add'>+	u16 t = btrfs_super_csum_type(s);</div><div class='add'>+</div><div class='add'>+	/* csum type is validated at mount time. */</div><div class='add'>+	return btrfs_csum_type_size(t);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+const char *btrfs_super_csum_name(u16 csum_type)</div><div class='add'>+{</div><div class='add'>+	/* csum type is validated at mount time. */</div><div class='add'>+	return btrfs_csums[csum_type].name;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Return driver name if defined, otherwise the name that's also a valid driver</div><div class='add'>+ * name.</div><div class='add'>+ */</div><div class='add'>+const char *btrfs_super_csum_driver(u16 csum_type)</div><div class='add'>+{</div><div class='add'>+	/* csum type is validated at mount time */</div><div class='add'>+	return btrfs_csums[csum_type].driver[0] ?</div><div class='add'>+		btrfs_csums[csum_type].driver :</div><div class='add'>+		btrfs_csums[csum_type].name;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+size_t __attribute_const__ btrfs_get_num_csums(void)</div><div class='add'>+{</div><div class='add'>+	return ARRAY_SIZE(btrfs_csums);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * We support the following block sizes for all systems:</div><div class='add'>+ *</div><div class='add'>+ * - 4K</div><div class='add'>+ *   This is the most common block size. For PAGE SIZE &gt; 4K cases the subpage</div><div class='add'>+ *   mode is used.</div><div class='add'>+ *</div><div class='add'>+ * - PAGE_SIZE</div><div class='add'>+ *   The straightforward block size to support.</div><div class='add'>+ *</div><div class='add'>+ * And extra support for the following block sizes based on the kernel config:</div><div class='add'>+ *</div><div class='add'>+ * - MIN_BLOCKSIZE</div><div class='add'>+ *   This is either 4K (regular builds) or 2K (debug builds)</div><div class='add'>+ *   This allows testing subpage routines on x86_64.</div><div class='add'>+ */</div><div class='add'>+bool __attribute_const__ btrfs_supported_blocksize(u32 blocksize)</div><div class='add'>+{</div><div class='add'>+	/* @blocksize should be validated first. */</div><div class='add'>+	ASSERT(is_power_of_2(blocksize) &amp;&amp; blocksize &gt;= BTRFS_MIN_BLOCKSIZE &amp;&amp;</div><div class='add'>+	       blocksize &lt;= BTRFS_MAX_BLOCKSIZE);</div><div class='add'>+</div><div class='add'>+	if (blocksize == PAGE_SIZE || blocksize == SZ_4K || blocksize == BTRFS_MIN_BLOCKSIZE)</div><div class='add'>+		return true;</div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+	/*</div><div class='add'>+	 * For bs &gt; ps support it's done by specifying a minimal folio order</div><div class='add'>+	 * for filemap, thus implying large data folios.</div><div class='add'>+	 * For HIGHMEM systems, we can not always access the content of a (large)</div><div class='add'>+	 * folio in one go, but go through them page by page.</div><div class='add'>+	 *</div><div class='add'>+	 * A lot of features don't implement a proper PAGE sized loop for large</div><div class='add'>+	 * folios, this includes:</div><div class='add'>+	 *</div><div class='add'>+	 * - compression</div><div class='add'>+	 * - verity</div><div class='add'>+	 * - encoded write</div><div class='add'>+	 *</div><div class='add'>+	 * Considering HIGHMEM is such a pain to deal with and it's going</div><div class='add'>+	 * to be deprecated eventually, just reject HIGHMEM &amp;&amp; bs &gt; ps cases.</div><div class='add'>+	 */</div><div class='add'>+	if (IS_ENABLED(CONFIG_HIGHMEM) &amp;&amp; blocksize &gt; PAGE_SIZE)</div><div class='add'>+		return false;</div><div class='add'>+	return true;</div><div class='add'>+#endif</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Start exclusive operation @type, return true on success.</div><div class='add'>+ */</div><div class='add'>+bool btrfs_exclop_start(struct btrfs_fs_info *fs_info,</div><div class='add'>+			enum btrfs_exclusive_operation type)</div><div class='add'>+{</div><div class='add'>+	bool ret = false;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fs_info-&gt;super_lock);</div><div class='add'>+	if (fs_info-&gt;exclusive_operation == BTRFS_EXCLOP_NONE) {</div><div class='add'>+		fs_info-&gt;exclusive_operation = type;</div><div class='add'>+		ret = true;</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;super_lock);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Conditionally allow to enter the exclusive operation in case it's compatible</div><div class='add'>+ * with the running one.  This must be paired with btrfs_exclop_start_unlock()</div><div class='add'>+ * and btrfs_exclop_finish().</div><div class='add'>+ *</div><div class='add'>+ * Compatibility:</div><div class='add'>+ * - the same type is already running</div><div class='add'>+ * - when trying to add a device and balance has been paused</div><div class='add'>+ * - not BTRFS_EXCLOP_NONE - this is intentionally incompatible and the caller</div><div class='add'>+ *   must check the condition first that would allow none -&gt; @type</div><div class='add'>+ */</div><div class='add'>+bool btrfs_exclop_start_try_lock(struct btrfs_fs_info *fs_info,</div><div class='add'>+				 enum btrfs_exclusive_operation type)</div><div class='add'>+{</div><div class='add'>+	spin_lock(&amp;fs_info-&gt;super_lock);</div><div class='add'>+	if (fs_info-&gt;exclusive_operation == type ||</div><div class='add'>+	    (fs_info-&gt;exclusive_operation == BTRFS_EXCLOP_BALANCE_PAUSED &amp;&amp;</div><div class='add'>+	     type == BTRFS_EXCLOP_DEV_ADD))</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;super_lock);</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_exclop_start_unlock(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;super_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_exclop_finish(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	spin_lock(&amp;fs_info-&gt;super_lock);</div><div class='add'>+	WRITE_ONCE(fs_info-&gt;exclusive_operation, BTRFS_EXCLOP_NONE);</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;super_lock);</div><div class='add'>+	sysfs_notify(&amp;fs_info-&gt;fs_devices-&gt;fsid_kobj, NULL, "exclusive_operation");</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_exclop_balance(struct btrfs_fs_info *fs_info,</div><div class='add'>+			  enum btrfs_exclusive_operation op)</div><div class='add'>+{</div><div class='add'>+	switch (op) {</div><div class='add'>+	case BTRFS_EXCLOP_BALANCE_PAUSED:</div><div class='add'>+		spin_lock(&amp;fs_info-&gt;super_lock);</div><div class='add'>+		ASSERT(fs_info-&gt;exclusive_operation == BTRFS_EXCLOP_BALANCE ||</div><div class='add'>+		       fs_info-&gt;exclusive_operation == BTRFS_EXCLOP_DEV_ADD ||</div><div class='add'>+		       fs_info-&gt;exclusive_operation == BTRFS_EXCLOP_NONE ||</div><div class='add'>+		       fs_info-&gt;exclusive_operation == BTRFS_EXCLOP_BALANCE_PAUSED);</div><div class='add'>+		fs_info-&gt;exclusive_operation = BTRFS_EXCLOP_BALANCE_PAUSED;</div><div class='add'>+		spin_unlock(&amp;fs_info-&gt;super_lock);</div><div class='add'>+		break;</div><div class='add'>+	case BTRFS_EXCLOP_BALANCE:</div><div class='add'>+		spin_lock(&amp;fs_info-&gt;super_lock);</div><div class='add'>+		ASSERT(fs_info-&gt;exclusive_operation == BTRFS_EXCLOP_BALANCE_PAUSED);</div><div class='add'>+		fs_info-&gt;exclusive_operation = BTRFS_EXCLOP_BALANCE;</div><div class='add'>+		spin_unlock(&amp;fs_info-&gt;super_lock);</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		btrfs_warn(fs_info,</div><div class='add'>+			"invalid exclop balance operation %d requested", op);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void __btrfs_set_fs_incompat(struct btrfs_fs_info *fs_info, u64 flag,</div><div class='add'>+			     const char *name)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_super_block *disk_super;</div><div class='add'>+	u64 features;</div><div class='add'>+</div><div class='add'>+	disk_super = fs_info-&gt;super_copy;</div><div class='add'>+	features = btrfs_super_incompat_flags(disk_super);</div><div class='add'>+	if (!(features &amp; flag)) {</div><div class='add'>+		spin_lock(&amp;fs_info-&gt;super_lock);</div><div class='add'>+		features = btrfs_super_incompat_flags(disk_super);</div><div class='add'>+		if (!(features &amp; flag)) {</div><div class='add'>+			features |= flag;</div><div class='add'>+			btrfs_set_super_incompat_flags(disk_super, features);</div><div class='add'>+			btrfs_info(fs_info,</div><div class='add'>+				"setting incompat feature flag for %s (0x%llx)",</div><div class='add'>+				name, flag);</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;fs_info-&gt;super_lock);</div><div class='add'>+		set_bit(BTRFS_FS_FEATURE_CHANGED, &amp;fs_info-&gt;flags);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void __btrfs_clear_fs_incompat(struct btrfs_fs_info *fs_info, u64 flag,</div><div class='add'>+			       const char *name)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_super_block *disk_super;</div><div class='add'>+	u64 features;</div><div class='add'>+</div><div class='add'>+	disk_super = fs_info-&gt;super_copy;</div><div class='add'>+	features = btrfs_super_incompat_flags(disk_super);</div><div class='add'>+	if (features &amp; flag) {</div><div class='add'>+		spin_lock(&amp;fs_info-&gt;super_lock);</div><div class='add'>+		features = btrfs_super_incompat_flags(disk_super);</div><div class='add'>+		if (features &amp; flag) {</div><div class='add'>+			features &amp;= ~flag;</div><div class='add'>+			btrfs_set_super_incompat_flags(disk_super, features);</div><div class='add'>+			btrfs_info(fs_info,</div><div class='add'>+				"clearing incompat feature flag for %s (0x%llx)",</div><div class='add'>+				name, flag);</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;fs_info-&gt;super_lock);</div><div class='add'>+		set_bit(BTRFS_FS_FEATURE_CHANGED, &amp;fs_info-&gt;flags);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void __btrfs_set_fs_compat_ro(struct btrfs_fs_info *fs_info, u64 flag,</div><div class='add'>+			      const char *name)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_super_block *disk_super;</div><div class='add'>+	u64 features;</div><div class='add'>+</div><div class='add'>+	disk_super = fs_info-&gt;super_copy;</div><div class='add'>+	features = btrfs_super_compat_ro_flags(disk_super);</div><div class='add'>+	if (!(features &amp; flag)) {</div><div class='add'>+		spin_lock(&amp;fs_info-&gt;super_lock);</div><div class='add'>+		features = btrfs_super_compat_ro_flags(disk_super);</div><div class='add'>+		if (!(features &amp; flag)) {</div><div class='add'>+			features |= flag;</div><div class='add'>+			btrfs_set_super_compat_ro_flags(disk_super, features);</div><div class='add'>+			btrfs_info(fs_info,</div><div class='add'>+				"setting compat-ro feature flag for %s (0x%llx)",</div><div class='add'>+				name, flag);</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;fs_info-&gt;super_lock);</div><div class='add'>+		set_bit(BTRFS_FS_FEATURE_CHANGED, &amp;fs_info-&gt;flags);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void __btrfs_clear_fs_compat_ro(struct btrfs_fs_info *fs_info, u64 flag,</div><div class='add'>+				const char *name)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_super_block *disk_super;</div><div class='add'>+	u64 features;</div><div class='add'>+</div><div class='add'>+	disk_super = fs_info-&gt;super_copy;</div><div class='add'>+	features = btrfs_super_compat_ro_flags(disk_super);</div><div class='add'>+	if (features &amp; flag) {</div><div class='add'>+		spin_lock(&amp;fs_info-&gt;super_lock);</div><div class='add'>+		features = btrfs_super_compat_ro_flags(disk_super);</div><div class='add'>+		if (features &amp; flag) {</div><div class='add'>+			features &amp;= ~flag;</div><div class='add'>+			btrfs_set_super_compat_ro_flags(disk_super, features);</div><div class='add'>+			btrfs_info(fs_info,</div><div class='add'>+				"clearing compat-ro feature flag for %s (0x%llx)",</div><div class='add'>+				name, flag);</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;fs_info-&gt;super_lock);</div><div class='add'>+		set_bit(BTRFS_FS_FEATURE_CHANGED, &amp;fs_info-&gt;flags);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='head'>diff --git a/fs/btrfs/fs.h b/fs/btrfs/fs.h<br/>new file mode 100644<br/>index 000000000000..0f7e1ef27891<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/fs.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/fs.h</a></div><div class='hunk'>@@ -0,0 +1,1186 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+</div><div class='add'>+#ifndef BTRFS_FS_H</div><div class='add'>+#define BTRFS_FS_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/blkdev.h&gt;</div><div class='add'>+#include &lt;linux/sizes.h&gt;</div><div class='add'>+#include &lt;linux/time64.h&gt;</div><div class='add'>+#include &lt;linux/compiler.h&gt;</div><div class='add'>+#include &lt;linux/math.h&gt;</div><div class='add'>+#include &lt;linux/atomic.h&gt;</div><div class='add'>+#include &lt;linux/percpu_counter.h&gt;</div><div class='add'>+#include &lt;linux/completion.h&gt;</div><div class='add'>+#include &lt;linux/lockdep.h&gt;</div><div class='add'>+#include &lt;linux/spinlock.h&gt;</div><div class='add'>+#include &lt;linux/mutex.h&gt;</div><div class='add'>+#include &lt;linux/rwsem.h&gt;</div><div class='add'>+#include &lt;linux/semaphore.h&gt;</div><div class='add'>+#include &lt;linux/list.h&gt;</div><div class='add'>+#include &lt;linux/pagemap.h&gt;</div><div class='add'>+#include &lt;linux/radix-tree.h&gt;</div><div class='add'>+#include &lt;linux/workqueue.h&gt;</div><div class='add'>+#include &lt;linux/wait.h&gt;</div><div class='add'>+#include &lt;linux/wait_bit.h&gt;</div><div class='add'>+#include &lt;linux/sched.h&gt;</div><div class='add'>+#include &lt;linux/rbtree.h&gt;</div><div class='add'>+#include &lt;uapi/linux/btrfs.h&gt;</div><div class='add'>+#include &lt;uapi/linux/btrfs_tree.h&gt;</div><div class='add'>+#include "extent-io-tree.h"</div><div class='add'>+#include "async-thread.h"</div><div class='add'>+#include "block-rsv.h"</div><div class='add'>+#include "messages.h"</div><div class='add'>+</div><div class='add'>+struct inode;</div><div class='add'>+struct super_block;</div><div class='add'>+struct kobject;</div><div class='add'>+struct reloc_control;</div><div class='add'>+struct crypto_shash;</div><div class='add'>+struct ulist;</div><div class='add'>+struct btrfs_device;</div><div class='add'>+struct btrfs_block_group;</div><div class='add'>+struct btrfs_root;</div><div class='add'>+struct btrfs_fs_devices;</div><div class='add'>+struct btrfs_transaction;</div><div class='add'>+struct btrfs_delayed_root;</div><div class='add'>+struct btrfs_balance_control;</div><div class='add'>+struct btrfs_subpage_info;</div><div class='add'>+struct btrfs_stripe_hash_table;</div><div class='add'>+struct btrfs_space_info;</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Minimum data and metadata block size.</div><div class='add'>+ *</div><div class='add'>+ * Normally it's 4K, but for testing subpage block size on 4K page systems, we</div><div class='add'>+ * allow DEBUG builds to accept 2K page size.</div><div class='add'>+ */</div><div class='add'>+#ifdef CONFIG_BTRFS_DEBUG</div><div class='add'>+#define BTRFS_MIN_BLOCKSIZE	(SZ_2K)</div><div class='add'>+#else</div><div class='add'>+#define BTRFS_MIN_BLOCKSIZE	(SZ_4K)</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+#define BTRFS_MAX_BLOCKSIZE	(SZ_64K)</div><div class='add'>+</div><div class='add'>+#define BTRFS_MAX_EXTENT_SIZE SZ_128M</div><div class='add'>+</div><div class='add'>+#define BTRFS_OLDEST_GENERATION	0ULL</div><div class='add'>+</div><div class='add'>+#define BTRFS_EMPTY_DIR_SIZE 0</div><div class='add'>+</div><div class='add'>+#define BTRFS_DIRTY_METADATA_THRESH		SZ_32M</div><div class='add'>+</div><div class='add'>+#define BTRFS_SUPER_INFO_OFFSET			SZ_64K</div><div class='add'>+#define BTRFS_SUPER_INFO_SIZE			4096</div><div class='add'>+static_assert(sizeof(struct btrfs_super_block) == BTRFS_SUPER_INFO_SIZE);</div><div class='add'>+</div><div class='add'>+/* Array of bytes with variable length, hexadecimal format 0x1234 */</div><div class='add'>+#define BTRFS_CSUM_FMT				"0x%*phN"</div><div class='add'>+#define BTRFS_CSUM_FMT_VALUE(size, bytes)	size, bytes</div><div class='add'>+</div><div class='add'>+#define BTRFS_KEY_FMT			"(%llu %u %llu)"</div><div class='add'>+#define BTRFS_KEY_FMT_VALUE(key)	(key)-&gt;objectid, (key)-&gt;type, (key)-&gt;offset</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Number of metadata items necessary for an unlink operation:</div><div class='add'>+ *</div><div class='add'>+ * 1 for the possible orphan item</div><div class='add'>+ * 1 for the dir item</div><div class='add'>+ * 1 for the dir index</div><div class='add'>+ * 1 for the inode ref</div><div class='add'>+ * 1 for the inode</div><div class='add'>+ * 1 for the parent inode</div><div class='add'>+ */</div><div class='add'>+#define BTRFS_UNLINK_METADATA_UNITS		6</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * The reserved space at the beginning of each device.  It covers the primary</div><div class='add'>+ * super block and leaves space for potential use by other tools like</div><div class='add'>+ * bootloaders or to lower potential damage of accidental overwrite.</div><div class='add'>+ */</div><div class='add'>+#define BTRFS_DEVICE_RANGE_RESERVED			(SZ_1M)</div><div class='add'>+/*</div><div class='add'>+ * Runtime (in-memory) states of filesystem</div><div class='add'>+ */</div><div class='add'>+enum {</div><div class='add'>+	/*</div><div class='add'>+	 * Filesystem is being remounted, allow to skip some operations, like</div><div class='add'>+	 * defrag</div><div class='add'>+	 */</div><div class='add'>+	BTRFS_FS_STATE_REMOUNTING,</div><div class='add'>+	/* Filesystem in RO mode */</div><div class='add'>+	BTRFS_FS_STATE_RO,</div><div class='add'>+	/* Track if a transaction abort has been reported on this filesystem */</div><div class='add'>+	BTRFS_FS_STATE_TRANS_ABORTED,</div><div class='add'>+	/* Track if log replay has failed. */</div><div class='add'>+	BTRFS_FS_STATE_LOG_REPLAY_ABORTED,</div><div class='add'>+	/*</div><div class='add'>+	 * Bio operations should be blocked on this filesystem because a source</div><div class='add'>+	 * or target device is being destroyed as part of a device replace</div><div class='add'>+	 */</div><div class='add'>+	BTRFS_FS_STATE_DEV_REPLACING,</div><div class='add'>+	/* The btrfs_fs_info created for self-tests */</div><div class='add'>+	BTRFS_FS_STATE_DUMMY_FS_INFO,</div><div class='add'>+</div><div class='add'>+	/* Checksum errors are ignored. */</div><div class='add'>+	BTRFS_FS_STATE_NO_DATA_CSUMS,</div><div class='add'>+	BTRFS_FS_STATE_SKIP_META_CSUMS,</div><div class='add'>+</div><div class='add'>+	/* Indicates there was an error cleaning up a log tree. */</div><div class='add'>+	BTRFS_FS_STATE_LOG_CLEANUP_ERROR,</div><div class='add'>+</div><div class='add'>+	/* No more delayed iput can be queued. */</div><div class='add'>+	BTRFS_FS_STATE_NO_DELAYED_IPUT,</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Emergency shutdown, a step further than transaction aborted by</div><div class='add'>+	 * rejecting all operations.</div><div class='add'>+	 */</div><div class='add'>+	BTRFS_FS_STATE_EMERGENCY_SHUTDOWN,</div><div class='add'>+</div><div class='add'>+	BTRFS_FS_STATE_COUNT</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+enum {</div><div class='add'>+	BTRFS_FS_CLOSING_START,</div><div class='add'>+	BTRFS_FS_CLOSING_DONE,</div><div class='add'>+	BTRFS_FS_LOG_RECOVERING,</div><div class='add'>+	BTRFS_FS_OPEN,</div><div class='add'>+	BTRFS_FS_QUOTA_ENABLED,</div><div class='add'>+	BTRFS_FS_UPDATE_UUID_TREE_GEN,</div><div class='add'>+	BTRFS_FS_CREATING_FREE_SPACE_TREE,</div><div class='add'>+	BTRFS_FS_BTREE_ERR,</div><div class='add'>+	BTRFS_FS_LOG1_ERR,</div><div class='add'>+	BTRFS_FS_LOG2_ERR,</div><div class='add'>+	BTRFS_FS_QUOTA_OVERRIDE,</div><div class='add'>+	/* Used to record internally whether fs has been frozen */</div><div class='add'>+	BTRFS_FS_FROZEN,</div><div class='add'>+	/*</div><div class='add'>+	 * Indicate that balance has been set up from the ioctl and is in the</div><div class='add'>+	 * main phase. The fs_info::balance_ctl is initialized.</div><div class='add'>+	 */</div><div class='add'>+	BTRFS_FS_BALANCE_RUNNING,</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Indicate that relocation of a chunk has started, it's set per chunk</div><div class='add'>+	 * and is toggled between chunks.</div><div class='add'>+	 */</div><div class='add'>+	BTRFS_FS_RELOC_RUNNING,</div><div class='add'>+</div><div class='add'>+	/* Indicate that the cleaner thread is awake and doing something. */</div><div class='add'>+	BTRFS_FS_CLEANER_RUNNING,</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The checksumming has an optimized version and is considered fast,</div><div class='add'>+	 * so we don't need to offload checksums to workqueues.</div><div class='add'>+	 */</div><div class='add'>+	BTRFS_FS_CSUM_IMPL_FAST,</div><div class='add'>+</div><div class='add'>+	/* Indicate that the discard workqueue can service discards. */</div><div class='add'>+	BTRFS_FS_DISCARD_RUNNING,</div><div class='add'>+</div><div class='add'>+	/* Indicate that we need to cleanup space cache v1 */</div><div class='add'>+	BTRFS_FS_CLEANUP_SPACE_CACHE_V1,</div><div class='add'>+</div><div class='add'>+	/* Indicate that we can't trust the free space tree for caching yet */</div><div class='add'>+	BTRFS_FS_FREE_SPACE_TREE_UNTRUSTED,</div><div class='add'>+</div><div class='add'>+	/* Indicate whether there are any tree modification log users */</div><div class='add'>+	BTRFS_FS_TREE_MOD_LOG_USERS,</div><div class='add'>+</div><div class='add'>+	/* Indicate that we want the transaction kthread to commit right now. */</div><div class='add'>+	BTRFS_FS_COMMIT_TRANS,</div><div class='add'>+</div><div class='add'>+	/* Indicate we have half completed snapshot deletions pending. */</div><div class='add'>+	BTRFS_FS_UNFINISHED_DROPS,</div><div class='add'>+</div><div class='add'>+	/* Indicate we have to finish a zone to do next allocation. */</div><div class='add'>+	BTRFS_FS_NEED_ZONE_FINISH,</div><div class='add'>+</div><div class='add'>+	/* Indicate that we want to commit the transaction. */</div><div class='add'>+	BTRFS_FS_NEED_TRANS_COMMIT,</div><div class='add'>+</div><div class='add'>+	/* This is set when active zone tracking is needed. */</div><div class='add'>+	BTRFS_FS_ACTIVE_ZONE_TRACKING,</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Indicate if we have some features changed, this is mostly for</div><div class='add'>+	 * cleaner thread to update the sysfs interface.</div><div class='add'>+	 */</div><div class='add'>+	BTRFS_FS_FEATURE_CHANGED,</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Indicate that we have found a tree block which is only aligned to</div><div class='add'>+	 * sectorsize, but not to nodesize.  This should be rare nowadays.</div><div class='add'>+	 */</div><div class='add'>+	BTRFS_FS_UNALIGNED_TREE_BLOCK,</div><div class='add'>+</div><div class='add'>+#if BITS_PER_LONG == 32</div><div class='add'>+	/* Indicate if we have error/warn message printed on 32bit systems */</div><div class='add'>+	BTRFS_FS_32BIT_ERROR,</div><div class='add'>+	BTRFS_FS_32BIT_WARN,</div><div class='add'>+#endif</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Flags for mount options.</div><div class='add'>+ *</div><div class='add'>+ * Note: don't forget to add new options to btrfs_show_options()</div><div class='add'>+ */</div><div class='add'>+enum {</div><div class='add'>+	BTRFS_MOUNT_NODATASUM			= (1ULL &lt;&lt; 0),</div><div class='add'>+	BTRFS_MOUNT_NODATACOW			= (1ULL &lt;&lt; 1),</div><div class='add'>+	BTRFS_MOUNT_NOBARRIER			= (1ULL &lt;&lt; 2),</div><div class='add'>+	BTRFS_MOUNT_SSD				= (1ULL &lt;&lt; 3),</div><div class='add'>+	BTRFS_MOUNT_DEGRADED			= (1ULL &lt;&lt; 4),</div><div class='add'>+	BTRFS_MOUNT_COMPRESS			= (1ULL &lt;&lt; 5),</div><div class='add'>+	BTRFS_MOUNT_NOTREELOG			= (1ULL &lt;&lt; 6),</div><div class='add'>+	BTRFS_MOUNT_FLUSHONCOMMIT		= (1ULL &lt;&lt; 7),</div><div class='add'>+	BTRFS_MOUNT_SSD_SPREAD			= (1ULL &lt;&lt; 8),</div><div class='add'>+	BTRFS_MOUNT_NOSSD			= (1ULL &lt;&lt; 9),</div><div class='add'>+	BTRFS_MOUNT_DISCARD_SYNC		= (1ULL &lt;&lt; 10),</div><div class='add'>+	BTRFS_MOUNT_FORCE_COMPRESS		= (1ULL &lt;&lt; 11),</div><div class='add'>+	BTRFS_MOUNT_SPACE_CACHE			= (1ULL &lt;&lt; 12),</div><div class='add'>+	BTRFS_MOUNT_CLEAR_CACHE			= (1ULL &lt;&lt; 13),</div><div class='add'>+	BTRFS_MOUNT_USER_SUBVOL_RM_ALLOWED	= (1ULL &lt;&lt; 14),</div><div class='add'>+	BTRFS_MOUNT_ENOSPC_DEBUG		= (1ULL &lt;&lt; 15),</div><div class='add'>+	BTRFS_MOUNT_AUTO_DEFRAG			= (1ULL &lt;&lt; 16),</div><div class='add'>+	BTRFS_MOUNT_USEBACKUPROOT		= (1ULL &lt;&lt; 17),</div><div class='add'>+	BTRFS_MOUNT_SKIP_BALANCE		= (1ULL &lt;&lt; 18),</div><div class='add'>+	BTRFS_MOUNT_PANIC_ON_FATAL_ERROR	= (1ULL &lt;&lt; 19),</div><div class='add'>+	BTRFS_MOUNT_RESCAN_UUID_TREE		= (1ULL &lt;&lt; 20),</div><div class='add'>+	BTRFS_MOUNT_FRAGMENT_DATA		= (1ULL &lt;&lt; 21),</div><div class='add'>+	BTRFS_MOUNT_FRAGMENT_METADATA		= (1ULL &lt;&lt; 22),</div><div class='add'>+	BTRFS_MOUNT_FREE_SPACE_TREE		= (1ULL &lt;&lt; 23),</div><div class='add'>+	BTRFS_MOUNT_NOLOGREPLAY			= (1ULL &lt;&lt; 24),</div><div class='add'>+	BTRFS_MOUNT_REF_VERIFY			= (1ULL &lt;&lt; 25),</div><div class='add'>+	BTRFS_MOUNT_DISCARD_ASYNC		= (1ULL &lt;&lt; 26),</div><div class='add'>+	BTRFS_MOUNT_IGNOREBADROOTS		= (1ULL &lt;&lt; 27),</div><div class='add'>+	BTRFS_MOUNT_IGNOREDATACSUMS		= (1ULL &lt;&lt; 28),</div><div class='add'>+	BTRFS_MOUNT_NODISCARD			= (1ULL &lt;&lt; 29),</div><div class='add'>+	BTRFS_MOUNT_NOSPACECACHE		= (1ULL &lt;&lt; 30),</div><div class='add'>+	BTRFS_MOUNT_IGNOREMETACSUMS		= (1ULL &lt;&lt; 31),</div><div class='add'>+	BTRFS_MOUNT_IGNORESUPERFLAGS		= (1ULL &lt;&lt; 32),</div><div class='add'>+	BTRFS_MOUNT_REF_TRACKER			= (1ULL &lt;&lt; 33),</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Compat flags that we support.  If any incompat flags are set other than the</div><div class='add'>+ * ones specified below then we will fail to mount</div><div class='add'>+ */</div><div class='add'>+#define BTRFS_FEATURE_COMPAT_SUPP		0ULL</div><div class='add'>+#define BTRFS_FEATURE_COMPAT_SAFE_SET		0ULL</div><div class='add'>+#define BTRFS_FEATURE_COMPAT_SAFE_CLEAR		0ULL</div><div class='add'>+</div><div class='add'>+#define BTRFS_FEATURE_COMPAT_RO_SUPP			\</div><div class='add'>+	(BTRFS_FEATURE_COMPAT_RO_FREE_SPACE_TREE |	\</div><div class='add'>+	 BTRFS_FEATURE_COMPAT_RO_FREE_SPACE_TREE_VALID | \</div><div class='add'>+	 BTRFS_FEATURE_COMPAT_RO_VERITY |		\</div><div class='add'>+	 BTRFS_FEATURE_COMPAT_RO_BLOCK_GROUP_TREE)</div><div class='add'>+</div><div class='add'>+#define BTRFS_FEATURE_COMPAT_RO_SAFE_SET	0ULL</div><div class='add'>+#define BTRFS_FEATURE_COMPAT_RO_SAFE_CLEAR	0ULL</div><div class='add'>+</div><div class='add'>+#define BTRFS_FEATURE_INCOMPAT_SUPP_STABLE		\</div><div class='add'>+	(BTRFS_FEATURE_INCOMPAT_MIXED_BACKREF |		\</div><div class='add'>+	 BTRFS_FEATURE_INCOMPAT_DEFAULT_SUBVOL |	\</div><div class='add'>+	 BTRFS_FEATURE_INCOMPAT_MIXED_GROUPS |		\</div><div class='add'>+	 BTRFS_FEATURE_INCOMPAT_BIG_METADATA |		\</div><div class='add'>+	 BTRFS_FEATURE_INCOMPAT_COMPRESS_LZO |		\</div><div class='add'>+	 BTRFS_FEATURE_INCOMPAT_COMPRESS_ZSTD |		\</div><div class='add'>+	 BTRFS_FEATURE_INCOMPAT_RAID56 |		\</div><div class='add'>+	 BTRFS_FEATURE_INCOMPAT_EXTENDED_IREF |		\</div><div class='add'>+	 BTRFS_FEATURE_INCOMPAT_SKINNY_METADATA |	\</div><div class='add'>+	 BTRFS_FEATURE_INCOMPAT_NO_HOLES	|	\</div><div class='add'>+	 BTRFS_FEATURE_INCOMPAT_METADATA_UUID	|	\</div><div class='add'>+	 BTRFS_FEATURE_INCOMPAT_RAID1C34	|	\</div><div class='add'>+	 BTRFS_FEATURE_INCOMPAT_ZONED		|	\</div><div class='add'>+	 BTRFS_FEATURE_INCOMPAT_SIMPLE_QUOTA)</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+	/*</div><div class='add'>+	 * Features under development like Extent tree v2 support is enabled</div><div class='add'>+	 * only under CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+	 */</div><div class='add'>+#define BTRFS_FEATURE_INCOMPAT_SUPP		\</div><div class='add'>+	(BTRFS_FEATURE_INCOMPAT_SUPP_STABLE |	\</div><div class='add'>+	 BTRFS_FEATURE_INCOMPAT_RAID_STRIPE_TREE | \</div><div class='add'>+	 BTRFS_FEATURE_INCOMPAT_EXTENT_TREE_V2)</div><div class='add'>+</div><div class='add'>+#else</div><div class='add'>+</div><div class='add'>+#define BTRFS_FEATURE_INCOMPAT_SUPP		\</div><div class='add'>+	(BTRFS_FEATURE_INCOMPAT_SUPP_STABLE)</div><div class='add'>+</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+#define BTRFS_FEATURE_INCOMPAT_SAFE_SET			\</div><div class='add'>+	(BTRFS_FEATURE_INCOMPAT_EXTENDED_IREF)</div><div class='add'>+#define BTRFS_FEATURE_INCOMPAT_SAFE_CLEAR		0ULL</div><div class='add'>+</div><div class='add'>+#define BTRFS_DEFAULT_COMMIT_INTERVAL	(30)</div><div class='add'>+#define BTRFS_WARNING_COMMIT_INTERVAL	(300)</div><div class='add'>+#define BTRFS_DEFAULT_MAX_INLINE	(2048)</div><div class='add'>+</div><div class='add'>+enum btrfs_compression_type {</div><div class='add'>+	BTRFS_COMPRESS_NONE  = 0,</div><div class='add'>+	BTRFS_COMPRESS_ZLIB  = 1,</div><div class='add'>+	BTRFS_COMPRESS_LZO   = 2,</div><div class='add'>+	BTRFS_COMPRESS_ZSTD  = 3,</div><div class='add'>+	BTRFS_NR_COMPRESS_TYPES = 4,</div><div class='add'>+</div><div class='add'>+	BTRFS_DEFRAG_DONT_COMPRESS,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct btrfs_dev_replace {</div><div class='add'>+	/* See #define above */</div><div class='add'>+	u64 replace_state;</div><div class='add'>+	/* Seconds since 1-Jan-1970 */</div><div class='add'>+	time64_t time_started;</div><div class='add'>+	/* Seconds since 1-Jan-1970 */</div><div class='add'>+	time64_t time_stopped;</div><div class='add'>+	atomic64_t num_write_errors;</div><div class='add'>+	atomic64_t num_uncorrectable_read_errors;</div><div class='add'>+</div><div class='add'>+	u64 cursor_left;</div><div class='add'>+	u64 committed_cursor_left;</div><div class='add'>+	u64 cursor_left_last_write_of_item;</div><div class='add'>+	u64 cursor_right;</div><div class='add'>+</div><div class='add'>+	/* See #define above */</div><div class='add'>+	u64 cont_reading_from_srcdev_mode;</div><div class='add'>+</div><div class='add'>+	int is_valid;</div><div class='add'>+	int item_needs_writeback;</div><div class='add'>+	struct btrfs_device *srcdev;</div><div class='add'>+	struct btrfs_device *tgtdev;</div><div class='add'>+</div><div class='add'>+	struct mutex lock_finishing_cancel_unmount;</div><div class='add'>+	struct rw_semaphore rwsem;</div><div class='add'>+</div><div class='add'>+	struct btrfs_scrub_progress scrub_progress;</div><div class='add'>+</div><div class='add'>+	struct percpu_counter bio_counter;</div><div class='add'>+	wait_queue_head_t replace_wait;</div><div class='add'>+</div><div class='add'>+	struct task_struct *replace_task;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Free clusters are used to claim free space in relatively large chunks,</div><div class='add'>+ * allowing us to do less seeky writes. They are used for all metadata</div><div class='add'>+ * allocations. In ssd_spread mode they are also used for data allocations.</div><div class='add'>+ */</div><div class='add'>+struct btrfs_free_cluster {</div><div class='add'>+	spinlock_t lock;</div><div class='add'>+	spinlock_t refill_lock;</div><div class='add'>+	struct rb_root root;</div><div class='add'>+</div><div class='add'>+	/* Largest extent in this cluster */</div><div class='add'>+	u64 max_size;</div><div class='add'>+</div><div class='add'>+	/* First extent starting offset */</div><div class='add'>+	u64 window_start;</div><div class='add'>+</div><div class='add'>+	/* We did a full search and couldn't create a cluster */</div><div class='add'>+	bool fragmented;</div><div class='add'>+</div><div class='add'>+	struct btrfs_block_group *block_group;</div><div class='add'>+	/*</div><div class='add'>+	 * When a cluster is allocated from a block group, we put the cluster</div><div class='add'>+	 * onto a list in the block group so that it can be freed before the</div><div class='add'>+	 * block group is freed.</div><div class='add'>+	 */</div><div class='add'>+	struct list_head block_group_list;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/* Discard control. */</div><div class='add'>+/*</div><div class='add'>+ * Async discard uses multiple lists to differentiate the discard filter</div><div class='add'>+ * parameters.  Index 0 is for completely free block groups where we need to</div><div class='add'>+ * ensure the entire block group is trimmed without being lossy.  Indices</div><div class='add'>+ * afterwards represent monotonically decreasing discard filter sizes to</div><div class='add'>+ * prioritize what should be discarded next.</div><div class='add'>+ */</div><div class='add'>+#define BTRFS_NR_DISCARD_LISTS		3</div><div class='add'>+#define BTRFS_DISCARD_INDEX_UNUSED	0</div><div class='add'>+#define BTRFS_DISCARD_INDEX_START	1</div><div class='add'>+</div><div class='add'>+struct btrfs_discard_ctl {</div><div class='add'>+	struct workqueue_struct *discard_workers;</div><div class='add'>+	struct delayed_work work;</div><div class='add'>+	spinlock_t lock;</div><div class='add'>+	struct btrfs_block_group *block_group;</div><div class='add'>+	struct list_head discard_list[BTRFS_NR_DISCARD_LISTS];</div><div class='add'>+	u64 prev_discard;</div><div class='add'>+	u64 prev_discard_time;</div><div class='add'>+	atomic_t discardable_extents;</div><div class='add'>+	atomic64_t discardable_bytes;</div><div class='add'>+	u64 max_discard_size;</div><div class='add'>+	u64 delay_ms;</div><div class='add'>+	u32 iops_limit;</div><div class='add'>+	u32 kbps_limit;</div><div class='add'>+	u64 discard_extent_bytes;</div><div class='add'>+	u64 discard_bitmap_bytes;</div><div class='add'>+	atomic64_t discard_bytes_saved;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Exclusive operations (device replace, resize, device add/remove, balance)</div><div class='add'>+ */</div><div class='add'>+enum btrfs_exclusive_operation {</div><div class='add'>+	BTRFS_EXCLOP_NONE,</div><div class='add'>+	BTRFS_EXCLOP_BALANCE_PAUSED,</div><div class='add'>+	BTRFS_EXCLOP_BALANCE,</div><div class='add'>+	BTRFS_EXCLOP_DEV_ADD,</div><div class='add'>+	BTRFS_EXCLOP_DEV_REMOVE,</div><div class='add'>+	BTRFS_EXCLOP_DEV_REPLACE,</div><div class='add'>+	BTRFS_EXCLOP_RESIZE,</div><div class='add'>+	BTRFS_EXCLOP_SWAP_ACTIVATE,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/* Store data about transaction commits, exported via sysfs. */</div><div class='add'>+struct btrfs_commit_stats {</div><div class='add'>+	/* Total number of commits */</div><div class='add'>+	u64 commit_count;</div><div class='add'>+	/* The maximum commit duration so far in ns */</div><div class='add'>+	u64 max_commit_dur;</div><div class='add'>+	/* The last commit duration in ns */</div><div class='add'>+	u64 last_commit_dur;</div><div class='add'>+	/* The total commit duration in ns */</div><div class='add'>+	u64 total_commit_dur;</div><div class='add'>+	/* Start of the last critical section in ns. */</div><div class='add'>+	u64 critical_section_start_time;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct btrfs_fs_info {</div><div class='add'>+	u8 chunk_tree_uuid[BTRFS_UUID_SIZE];</div><div class='add'>+	unsigned long flags;</div><div class='add'>+	struct btrfs_root *tree_root;</div><div class='add'>+	struct btrfs_root *chunk_root;</div><div class='add'>+	struct btrfs_root *dev_root;</div><div class='add'>+	struct btrfs_root *fs_root;</div><div class='add'>+	struct btrfs_root *quota_root;</div><div class='add'>+	struct btrfs_root *uuid_root;</div><div class='add'>+	struct btrfs_root *data_reloc_root;</div><div class='add'>+	struct btrfs_root *block_group_root;</div><div class='add'>+	struct btrfs_root *stripe_root;</div><div class='add'>+</div><div class='add'>+	/* The log root tree is a directory of all the other log roots */</div><div class='add'>+	struct btrfs_root *log_root_tree;</div><div class='add'>+</div><div class='add'>+	/* The tree that holds the global roots (csum, extent, etc) */</div><div class='add'>+	rwlock_t global_root_lock;</div><div class='add'>+	struct rb_root global_root_tree;</div><div class='add'>+</div><div class='add'>+	spinlock_t fs_roots_radix_lock;</div><div class='add'>+	struct radix_tree_root fs_roots_radix;</div><div class='add'>+</div><div class='add'>+	/* Block group cache stuff */</div><div class='add'>+	rwlock_t block_group_cache_lock;</div><div class='add'>+	struct rb_root_cached block_group_cache_tree;</div><div class='add'>+</div><div class='add'>+	/* Keep track of unallocated space */</div><div class='add'>+	atomic64_t free_chunk_space;</div><div class='add'>+</div><div class='add'>+	/* Track ranges which are used by log trees blocks/logged data extents */</div><div class='add'>+	struct extent_io_tree excluded_extents;</div><div class='add'>+</div><div class='add'>+	/* logical-&gt;physical extent mapping */</div><div class='add'>+	struct rb_root_cached mapping_tree;</div><div class='add'>+	rwlock_t mapping_tree_lock;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Block reservation for extent, checksum, root tree and delayed dir</div><div class='add'>+	 * index item.</div><div class='add'>+	 */</div><div class='add'>+	struct btrfs_block_rsv global_block_rsv;</div><div class='add'>+	/* Block reservation for metadata operations */</div><div class='add'>+	struct btrfs_block_rsv trans_block_rsv;</div><div class='add'>+	/* Block reservation for chunk tree */</div><div class='add'>+	struct btrfs_block_rsv chunk_block_rsv;</div><div class='add'>+	/* Block reservation for delayed operations */</div><div class='add'>+	struct btrfs_block_rsv delayed_block_rsv;</div><div class='add'>+	/* Block reservation for delayed refs */</div><div class='add'>+	struct btrfs_block_rsv delayed_refs_rsv;</div><div class='add'>+	/* Block reservation for treelog tree */</div><div class='add'>+	struct btrfs_block_rsv treelog_rsv;</div><div class='add'>+</div><div class='add'>+	struct btrfs_block_rsv empty_block_rsv;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Updated while holding the lock 'trans_lock'. Due to the life cycle of</div><div class='add'>+	 * a transaction, it can be directly read while holding a transaction</div><div class='add'>+	 * handle, everywhere else must be read with btrfs_get_fs_generation().</div><div class='add'>+	 * Should always be updated using btrfs_set_fs_generation().</div><div class='add'>+	 */</div><div class='add'>+	u64 generation;</div><div class='add'>+	/*</div><div class='add'>+	 * Always use btrfs_get_last_trans_committed() and</div><div class='add'>+	 * btrfs_set_last_trans_committed() to read and update this field.</div><div class='add'>+	 */</div><div class='add'>+	u64 last_trans_committed;</div><div class='add'>+	/*</div><div class='add'>+	 * Generation of the last transaction used for block group relocation</div><div class='add'>+	 * since the filesystem was last mounted (or 0 if none happened yet).</div><div class='add'>+	 * Must be written and read while holding btrfs_fs_info::commit_root_sem.</div><div class='add'>+	 */</div><div class='add'>+	u64 last_reloc_trans;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This is updated to the current trans every time a full commit is</div><div class='add'>+	 * required instead of the faster short fsync log commits</div><div class='add'>+	 */</div><div class='add'>+	u64 last_trans_log_full_commit;</div><div class='add'>+	unsigned long long mount_opt;</div><div class='add'>+</div><div class='add'>+	/* Compress related structures. */</div><div class='add'>+	void *compr_wsm[BTRFS_NR_COMPRESS_TYPES];</div><div class='add'>+</div><div class='add'>+	int compress_type;</div><div class='add'>+	int compress_level;</div><div class='add'>+	u32 commit_interval;</div><div class='add'>+	/*</div><div class='add'>+	 * It is a suggestive number, the read side is safe even it gets a</div><div class='add'>+	 * wrong number because we will write out the data into a regular</div><div class='add'>+	 * extent. The write side(mount/remount) is under -&gt;s_umount lock,</div><div class='add'>+	 * so it is also safe.</div><div class='add'>+	 */</div><div class='add'>+	u64 max_inline;</div><div class='add'>+</div><div class='add'>+	struct btrfs_transaction *running_transaction;</div><div class='add'>+	wait_queue_head_t transaction_throttle;</div><div class='add'>+	wait_queue_head_t transaction_wait;</div><div class='add'>+	wait_queue_head_t transaction_blocked_wait;</div><div class='add'>+	wait_queue_head_t async_submit_wait;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Used to protect the incompat_flags, compat_flags, compat_ro_flags</div><div class='add'>+	 * when they are updated.</div><div class='add'>+	 *</div><div class='add'>+	 * Because we do not clear the flags for ever, so we needn't use</div><div class='add'>+	 * the lock on the read side.</div><div class='add'>+	 *</div><div class='add'>+	 * We also needn't use the lock when we mount the fs, because</div><div class='add'>+	 * there is no other task which will update the flag.</div><div class='add'>+	 */</div><div class='add'>+	spinlock_t super_lock;</div><div class='add'>+	struct btrfs_super_block *super_copy;</div><div class='add'>+	struct btrfs_super_block *super_for_commit;</div><div class='add'>+	struct super_block *sb;</div><div class='add'>+	struct inode *btree_inode;</div><div class='add'>+	struct mutex tree_log_mutex;</div><div class='add'>+	struct mutex transaction_kthread_mutex;</div><div class='add'>+	struct mutex cleaner_mutex;</div><div class='add'>+	struct mutex chunk_mutex;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This is taken to make sure we don't set block groups ro after the</div><div class='add'>+	 * free space cache has been allocated on them.</div><div class='add'>+	 */</div><div class='add'>+	struct mutex ro_block_group_mutex;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This is used during read/modify/write to make sure no two ios are</div><div class='add'>+	 * trying to mod the same stripe at the same time.</div><div class='add'>+	 */</div><div class='add'>+	struct btrfs_stripe_hash_table *stripe_hash_table;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This protects the ordered operations list only while we are</div><div class='add'>+	 * processing all of the entries on it.  This way we make sure the</div><div class='add'>+	 * commit code doesn't find the list temporarily empty because another</div><div class='add'>+	 * function happens to be doing non-waiting preflush before jumping</div><div class='add'>+	 * into the main commit.</div><div class='add'>+	 */</div><div class='add'>+	struct mutex ordered_operations_mutex;</div><div class='add'>+</div><div class='add'>+	struct rw_semaphore commit_root_sem;</div><div class='add'>+</div><div class='add'>+	struct rw_semaphore cleanup_work_sem;</div><div class='add'>+</div><div class='add'>+	struct rw_semaphore subvol_sem;</div><div class='add'>+</div><div class='add'>+	spinlock_t trans_lock;</div><div class='add'>+	/*</div><div class='add'>+	 * The reloc mutex goes with the trans lock, it is taken during commit</div><div class='add'>+	 * to protect us from the relocation code.</div><div class='add'>+	 */</div><div class='add'>+	struct mutex reloc_mutex;</div><div class='add'>+</div><div class='add'>+	struct list_head trans_list;</div><div class='add'>+	struct list_head dead_roots;</div><div class='add'>+	struct list_head caching_block_groups;</div><div class='add'>+</div><div class='add'>+	spinlock_t delayed_iput_lock;</div><div class='add'>+	struct list_head delayed_iputs;</div><div class='add'>+	atomic_t nr_delayed_iputs;</div><div class='add'>+	wait_queue_head_t delayed_iputs_wait;</div><div class='add'>+</div><div class='add'>+	atomic64_t tree_mod_seq;</div><div class='add'>+</div><div class='add'>+	/* This protects tree_mod_log and tree_mod_seq_list */</div><div class='add'>+	rwlock_t tree_mod_log_lock;</div><div class='add'>+	struct rb_root tree_mod_log;</div><div class='add'>+	struct list_head tree_mod_seq_list;</div><div class='add'>+</div><div class='add'>+	atomic_t async_delalloc_pages;</div><div class='add'>+</div><div class='add'>+	/* This is used to protect the following list -- ordered_roots. */</div><div class='add'>+	spinlock_t ordered_root_lock;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * All fs/file tree roots in which there are data=ordered extents</div><div class='add'>+	 * pending writeback are added into this list.</div><div class='add'>+	 *</div><div class='add'>+	 * These can span multiple transactions and basically include every</div><div class='add'>+	 * dirty data page that isn't from nodatacow.</div><div class='add'>+	 */</div><div class='add'>+	struct list_head ordered_roots;</div><div class='add'>+</div><div class='add'>+	struct mutex delalloc_root_mutex;</div><div class='add'>+	spinlock_t delalloc_root_lock;</div><div class='add'>+	/* All fs/file tree roots that have delalloc inodes. */</div><div class='add'>+	struct list_head delalloc_roots;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * There is a pool of worker threads for checksumming during writes and</div><div class='add'>+	 * a pool for checksumming after reads.  This is because readers can</div><div class='add'>+	 * run with FS locks held, and the writers may be waiting for those</div><div class='add'>+	 * locks.  We don't want ordering in the pending list to cause</div><div class='add'>+	 * deadlocks, and so the two are serviced separately.</div><div class='add'>+	 *</div><div class='add'>+	 * A third pool does submit_bio to avoid deadlocking with the other two.</div><div class='add'>+	 */</div><div class='add'>+	struct btrfs_workqueue *workers;</div><div class='add'>+	struct btrfs_workqueue *delalloc_workers;</div><div class='add'>+	struct btrfs_workqueue *flush_workers;</div><div class='add'>+	struct workqueue_struct *endio_workers;</div><div class='add'>+	struct workqueue_struct *endio_meta_workers;</div><div class='add'>+	struct workqueue_struct *rmw_workers;</div><div class='add'>+	struct btrfs_workqueue *endio_write_workers;</div><div class='add'>+	struct btrfs_workqueue *endio_freespace_worker;</div><div class='add'>+	struct btrfs_workqueue *caching_workers;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Fixup workers take dirty pages that didn't properly go through the</div><div class='add'>+	 * cow mechanism and make them safe to write.  It happens for the</div><div class='add'>+	 * sys_munmap function call path.</div><div class='add'>+	 */</div><div class='add'>+	struct btrfs_workqueue *fixup_workers;</div><div class='add'>+	struct btrfs_workqueue *delayed_workers;</div><div class='add'>+</div><div class='add'>+	struct task_struct *transaction_kthread;</div><div class='add'>+	struct task_struct *cleaner_kthread;</div><div class='add'>+	u32 thread_pool_size;</div><div class='add'>+</div><div class='add'>+	struct kobject *space_info_kobj;</div><div class='add'>+	struct kobject *qgroups_kobj;</div><div class='add'>+	struct kobject *discard_kobj;</div><div class='add'>+</div><div class='add'>+	/* Track the number of blocks (sectors) read by the filesystem. */</div><div class='add'>+	struct percpu_counter stats_read_blocks;</div><div class='add'>+</div><div class='add'>+	/* Used to keep from writing metadata until there is a nice batch */</div><div class='add'>+	struct percpu_counter dirty_metadata_bytes;</div><div class='add'>+	struct percpu_counter delalloc_bytes;</div><div class='add'>+	struct percpu_counter ordered_bytes;</div><div class='add'>+	s32 dirty_metadata_batch;</div><div class='add'>+	s32 delalloc_batch;</div><div class='add'>+</div><div class='add'>+	struct percpu_counter evictable_extent_maps;</div><div class='add'>+	u64 em_shrinker_last_root;</div><div class='add'>+	u64 em_shrinker_last_ino;</div><div class='add'>+	atomic64_t em_shrinker_nr_to_scan;</div><div class='add'>+	struct work_struct em_shrinker_work;</div><div class='add'>+</div><div class='add'>+	/* Protected by 'trans_lock'. */</div><div class='add'>+	struct list_head dirty_cowonly_roots;</div><div class='add'>+</div><div class='add'>+	struct btrfs_fs_devices *fs_devices;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The space_info list is effectively read only after initial setup.</div><div class='add'>+	 * It is populated at mount time and cleaned up after all block groups</div><div class='add'>+	 * are removed.  RCU is used to protect it.</div><div class='add'>+	 */</div><div class='add'>+	struct list_head space_info;</div><div class='add'>+</div><div class='add'>+	struct btrfs_space_info *data_sinfo;</div><div class='add'>+</div><div class='add'>+	struct reloc_control *reloc_ctl;</div><div class='add'>+</div><div class='add'>+	/* data_alloc_cluster is only used in ssd_spread mode */</div><div class='add'>+	struct btrfs_free_cluster data_alloc_cluster;</div><div class='add'>+</div><div class='add'>+	/* All metadata allocations go through this cluster. */</div><div class='add'>+	struct btrfs_free_cluster meta_alloc_cluster;</div><div class='add'>+</div><div class='add'>+	/* Auto defrag inodes go here. */</div><div class='add'>+	spinlock_t defrag_inodes_lock;</div><div class='add'>+	struct rb_root defrag_inodes;</div><div class='add'>+	atomic_t defrag_running;</div><div class='add'>+</div><div class='add'>+	/* Used to protect avail_{data, metadata, system}_alloc_bits */</div><div class='add'>+	seqlock_t profiles_lock;</div><div class='add'>+	/*</div><div class='add'>+	 * These three are in extended format (availability of single chunks is</div><div class='add'>+	 * denoted by BTRFS_AVAIL_ALLOC_BIT_SINGLE bit, other types are denoted</div><div class='add'>+	 * by corresponding BTRFS_BLOCK_GROUP_* bits)</div><div class='add'>+	 */</div><div class='add'>+	u64 avail_data_alloc_bits;</div><div class='add'>+	u64 avail_metadata_alloc_bits;</div><div class='add'>+	u64 avail_system_alloc_bits;</div><div class='add'>+</div><div class='add'>+	/* Balance state */</div><div class='add'>+	spinlock_t balance_lock;</div><div class='add'>+	struct mutex balance_mutex;</div><div class='add'>+	atomic_t balance_pause_req;</div><div class='add'>+	atomic_t balance_cancel_req;</div><div class='add'>+	struct btrfs_balance_control *balance_ctl;</div><div class='add'>+	wait_queue_head_t balance_wait_q;</div><div class='add'>+</div><div class='add'>+	/* Cancellation requests for chunk relocation */</div><div class='add'>+	atomic_t reloc_cancel_req;</div><div class='add'>+</div><div class='add'>+	u32 data_chunk_allocations;</div><div class='add'>+	u32 metadata_ratio;</div><div class='add'>+</div><div class='add'>+	/* Private scrub information */</div><div class='add'>+	struct mutex scrub_lock;</div><div class='add'>+	atomic_t scrubs_running;</div><div class='add'>+	atomic_t scrub_pause_req;</div><div class='add'>+	atomic_t scrubs_paused;</div><div class='add'>+	atomic_t scrub_cancel_req;</div><div class='add'>+	wait_queue_head_t scrub_pause_wait;</div><div class='add'>+	/*</div><div class='add'>+	 * The worker pointers are NULL iff the refcount is 0, ie. scrub is not</div><div class='add'>+	 * running.</div><div class='add'>+	 */</div><div class='add'>+	refcount_t scrub_workers_refcnt;</div><div class='add'>+	struct workqueue_struct *scrub_workers;</div><div class='add'>+</div><div class='add'>+	struct btrfs_discard_ctl discard_ctl;</div><div class='add'>+</div><div class='add'>+	/* Is qgroup tracking in a consistent state? */</div><div class='add'>+	u64 qgroup_flags;</div><div class='add'>+</div><div class='add'>+	/* Holds configuration and tracking. Protected by qgroup_lock. */</div><div class='add'>+	struct rb_root qgroup_tree;</div><div class='add'>+	spinlock_t qgroup_lock;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Protect user change for quota operations. If a transaction is needed,</div><div class='add'>+	 * it must be started before locking this lock.</div><div class='add'>+	 */</div><div class='add'>+	struct mutex qgroup_ioctl_lock;</div><div class='add'>+</div><div class='add'>+	/* List of dirty qgroups to be written at next commit. */</div><div class='add'>+	struct list_head dirty_qgroups;</div><div class='add'>+</div><div class='add'>+	/* Used by qgroup for an efficient tree traversal. */</div><div class='add'>+	u64 qgroup_seq;</div><div class='add'>+</div><div class='add'>+	/* Qgroup rescan items. */</div><div class='add'>+	/* Protects the progress item */</div><div class='add'>+	struct mutex qgroup_rescan_lock;</div><div class='add'>+	struct btrfs_key qgroup_rescan_progress;</div><div class='add'>+	struct btrfs_workqueue *qgroup_rescan_workers;</div><div class='add'>+	struct completion qgroup_rescan_completion;</div><div class='add'>+	struct btrfs_work qgroup_rescan_work;</div><div class='add'>+	/* Protected by qgroup_rescan_lock */</div><div class='add'>+	bool qgroup_rescan_running;</div><div class='add'>+	u8 qgroup_drop_subtree_thres;</div><div class='add'>+	u64 qgroup_enable_gen;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If this is not 0, then it indicates a serious filesystem error has</div><div class='add'>+	 * happened and it contains that error (negative errno value).</div><div class='add'>+	 */</div><div class='add'>+	int fs_error;</div><div class='add'>+</div><div class='add'>+	/* Filesystem state */</div><div class='add'>+	unsigned long fs_state;</div><div class='add'>+</div><div class='add'>+	struct btrfs_delayed_root *delayed_root;</div><div class='add'>+</div><div class='add'>+	/* Entries are eb-&gt;start &gt;&gt; nodesize_bits */</div><div class='add'>+	struct xarray buffer_tree;</div><div class='add'>+</div><div class='add'>+	/* Next backup root to be overwritten */</div><div class='add'>+	int backup_root_index;</div><div class='add'>+</div><div class='add'>+	/* Device replace state */</div><div class='add'>+	struct btrfs_dev_replace dev_replace;</div><div class='add'>+</div><div class='add'>+	struct semaphore uuid_tree_rescan_sem;</div><div class='add'>+</div><div class='add'>+	/* Used to reclaim the metadata space in the background. */</div><div class='add'>+	struct work_struct async_reclaim_work;</div><div class='add'>+	struct work_struct async_data_reclaim_work;</div><div class='add'>+	struct work_struct preempt_reclaim_work;</div><div class='add'>+</div><div class='add'>+	/* Reclaim partially filled block groups in the background */</div><div class='add'>+	struct work_struct reclaim_bgs_work;</div><div class='add'>+	/* Protected by unused_bgs_lock. */</div><div class='add'>+	struct list_head reclaim_bgs;</div><div class='add'>+	int bg_reclaim_threshold;</div><div class='add'>+</div><div class='add'>+	/* Protects the lists unused_bgs and reclaim_bgs. */</div><div class='add'>+	spinlock_t unused_bgs_lock;</div><div class='add'>+	/* Protected by unused_bgs_lock. */</div><div class='add'>+	struct list_head unused_bgs;</div><div class='add'>+	struct mutex unused_bg_unpin_mutex;</div><div class='add'>+	/* Protect block groups that are going to be deleted */</div><div class='add'>+	struct mutex reclaim_bgs_lock;</div><div class='add'>+</div><div class='add'>+	/* Cached block sizes */</div><div class='add'>+	u32 nodesize;</div><div class='add'>+	u32 nodesize_bits;</div><div class='add'>+	u32 sectorsize;</div><div class='add'>+	/* ilog2 of sectorsize, use to avoid 64bit division */</div><div class='add'>+	u32 sectorsize_bits;</div><div class='add'>+	u32 block_min_order;</div><div class='add'>+	u32 block_max_order;</div><div class='add'>+	u32 csum_size;</div><div class='add'>+	u32 csums_per_leaf;</div><div class='add'>+	u32 stripesize;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Maximum size of an extent. BTRFS_MAX_EXTENT_SIZE on regular</div><div class='add'>+	 * filesystem, on zoned it depends on the device constraints.</div><div class='add'>+	 */</div><div class='add'>+	u64 max_extent_size;</div><div class='add'>+</div><div class='add'>+	/* Block groups and devices containing active swapfiles. */</div><div class='add'>+	spinlock_t swapfile_pins_lock;</div><div class='add'>+	struct rb_root swapfile_pins;</div><div class='add'>+</div><div class='add'>+	struct crypto_shash *csum_shash;</div><div class='add'>+</div><div class='add'>+	/* Type of exclusive operation running, protected by super_lock */</div><div class='add'>+	enum btrfs_exclusive_operation exclusive_operation;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Zone size &gt; 0 when in ZONED mode, otherwise it's used for a check</div><div class='add'>+	 * if the mode is enabled</div><div class='add'>+	 */</div><div class='add'>+	u64 zone_size;</div><div class='add'>+</div><div class='add'>+	/* Constraints for ZONE_APPEND commands: */</div><div class='add'>+	struct queue_limits limits;</div><div class='add'>+	u64 max_zone_append_size;</div><div class='add'>+</div><div class='add'>+	struct mutex zoned_meta_io_lock;</div><div class='add'>+	spinlock_t treelog_bg_lock;</div><div class='add'>+	u64 treelog_bg;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Start of the dedicated data relocation block group, protected by</div><div class='add'>+	 * relocation_bg_lock.</div><div class='add'>+	 */</div><div class='add'>+	spinlock_t relocation_bg_lock;</div><div class='add'>+	u64 data_reloc_bg;</div><div class='add'>+	struct mutex zoned_data_reloc_io_lock;</div><div class='add'>+</div><div class='add'>+	struct btrfs_block_group *active_meta_bg;</div><div class='add'>+	struct btrfs_block_group *active_system_bg;</div><div class='add'>+</div><div class='add'>+	u64 nr_global_roots;</div><div class='add'>+</div><div class='add'>+	spinlock_t zone_active_bgs_lock;</div><div class='add'>+	struct list_head zone_active_bgs;</div><div class='add'>+</div><div class='add'>+	/* Updates are not protected by any lock */</div><div class='add'>+	struct btrfs_commit_stats commit_stats;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Last generation where we dropped a non-relocation root.</div><div class='add'>+	 * Use btrfs_set_last_root_drop_gen() and btrfs_get_last_root_drop_gen()</div><div class='add'>+	 * to change it and to read it, respectively.</div><div class='add'>+	 */</div><div class='add'>+	u64 last_root_drop_gen;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Annotations for transaction events (structures are empty when</div><div class='add'>+	 * compiled without lockdep).</div><div class='add'>+	 */</div><div class='add'>+	struct lockdep_map btrfs_trans_num_writers_map;</div><div class='add'>+	struct lockdep_map btrfs_trans_num_extwriters_map;</div><div class='add'>+	struct lockdep_map btrfs_state_change_map[4];</div><div class='add'>+	struct lockdep_map btrfs_trans_pending_ordered_map;</div><div class='add'>+	struct lockdep_map btrfs_ordered_extent_map;</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BTRFS_DEBUG</div><div class='add'>+	spinlock_t ref_verify_lock;</div><div class='add'>+	struct rb_root block_tree;</div><div class='add'>+</div><div class='add'>+	struct kobject *debug_kobj;</div><div class='add'>+	struct list_head allocated_roots;</div><div class='add'>+</div><div class='add'>+	spinlock_t eb_leak_lock;</div><div class='add'>+	struct list_head allocated_ebs;</div><div class='add'>+#endif</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+#define folio_to_inode(_folio)	(BTRFS_I(_Generic((_folio),			\</div><div class='add'>+					  struct folio *: (_folio))-&gt;mapping-&gt;host))</div><div class='add'>+</div><div class='add'>+#define folio_to_fs_info(_folio) (folio_to_inode(_folio)-&gt;root-&gt;fs_info)</div><div class='add'>+</div><div class='add'>+#define inode_to_fs_info(_inode) (BTRFS_I(_Generic((_inode),			\</div><div class='add'>+					   struct inode *: (_inode)))-&gt;root-&gt;fs_info)</div><div class='add'>+</div><div class='add'>+static inline gfp_t btrfs_alloc_write_mask(struct address_space *mapping)</div><div class='add'>+{</div><div class='add'>+	return mapping_gfp_constraint(mapping, ~__GFP_FS);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Return the minimal folio size of the fs. */</div><div class='add'>+static inline unsigned int btrfs_min_folio_size(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	return 1U &lt;&lt; (PAGE_SHIFT + fs_info-&gt;block_min_order);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline u64 btrfs_get_fs_generation(const struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	return READ_ONCE(fs_info-&gt;generation);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_set_fs_generation(struct btrfs_fs_info *fs_info, u64 gen)</div><div class='add'>+{</div><div class='add'>+	WRITE_ONCE(fs_info-&gt;generation, gen);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline u64 btrfs_get_last_trans_committed(const struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	return READ_ONCE(fs_info-&gt;last_trans_committed);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_set_last_trans_committed(struct btrfs_fs_info *fs_info, u64 gen)</div><div class='add'>+{</div><div class='add'>+	WRITE_ONCE(fs_info-&gt;last_trans_committed, gen);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_set_last_root_drop_gen(struct btrfs_fs_info *fs_info,</div><div class='add'>+						u64 gen)</div><div class='add'>+{</div><div class='add'>+	WRITE_ONCE(fs_info-&gt;last_root_drop_gen, gen);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline u64 btrfs_get_last_root_drop_gen(const struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	return READ_ONCE(fs_info-&gt;last_root_drop_gen);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Take the number of bytes to be checksummed and figure out how many leaves</div><div class='add'>+ * it would require to store the csums for that many bytes.</div><div class='add'>+ */</div><div class='add'>+static inline u64 btrfs_csum_bytes_to_leaves(</div><div class='add'>+			const struct btrfs_fs_info *fs_info, u64 csum_bytes)</div><div class='add'>+{</div><div class='add'>+	const u64 num_csums = csum_bytes &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='add'>+</div><div class='add'>+	return DIV_ROUND_UP_ULL(num_csums, fs_info-&gt;csums_per_leaf);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Use this if we would be adding new items, as we could split nodes as we cow</div><div class='add'>+ * down the tree.</div><div class='add'>+ */</div><div class='add'>+static inline u64 btrfs_calc_insert_metadata_size(const struct btrfs_fs_info *fs_info,</div><div class='add'>+						  unsigned num_items)</div><div class='add'>+{</div><div class='add'>+	return (u64)fs_info-&gt;nodesize * BTRFS_MAX_LEVEL * 2 * num_items;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Doing a truncate or a modification won't result in new nodes or leaves, just</div><div class='add'>+ * what we need for COW.</div><div class='add'>+ */</div><div class='add'>+static inline u64 btrfs_calc_metadata_size(const struct btrfs_fs_info *fs_info,</div><div class='add'>+						 unsigned num_items)</div><div class='add'>+{</div><div class='add'>+	return (u64)fs_info-&gt;nodesize * BTRFS_MAX_LEVEL * num_items;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define BTRFS_MAX_EXTENT_ITEM_SIZE(r) ((BTRFS_LEAF_DATA_SIZE(r-&gt;fs_info) &gt;&gt; 4) - \</div><div class='add'>+					sizeof(struct btrfs_item))</div><div class='add'>+</div><div class='add'>+#define BTRFS_BYTES_TO_BLKS(fs_info, bytes) ((bytes) &gt;&gt; (fs_info)-&gt;sectorsize_bits)</div><div class='add'>+</div><div class='add'>+static inline bool btrfs_is_zoned(const struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	return IS_ENABLED(CONFIG_BLK_DEV_ZONED) &amp;&amp; fs_info-&gt;zone_size &gt; 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Count how many fs_info-&gt;max_extent_size cover the @size</div><div class='add'>+ */</div><div class='add'>+static inline u32 count_max_extents(const struct btrfs_fs_info *fs_info, u64 size)</div><div class='add'>+{</div><div class='add'>+#ifdef CONFIG_BTRFS_FS_RUN_SANITY_TESTS</div><div class='add'>+	if (!fs_info)</div><div class='add'>+		return div_u64(size + BTRFS_MAX_EXTENT_SIZE - 1, BTRFS_MAX_EXTENT_SIZE);</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+	return div_u64(size + fs_info-&gt;max_extent_size - 1, fs_info-&gt;max_extent_size);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline unsigned int btrfs_blocks_per_folio(const struct btrfs_fs_info *fs_info,</div><div class='add'>+						  const struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	return folio_size(folio) &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool __attribute_const__ btrfs_supported_blocksize(u32 blocksize);</div><div class='add'>+bool btrfs_exclop_start(struct btrfs_fs_info *fs_info,</div><div class='add'>+			enum btrfs_exclusive_operation type);</div><div class='add'>+bool btrfs_exclop_start_try_lock(struct btrfs_fs_info *fs_info,</div><div class='add'>+				 enum btrfs_exclusive_operation type);</div><div class='add'>+void btrfs_exclop_start_unlock(struct btrfs_fs_info *fs_info);</div><div class='add'>+void btrfs_exclop_finish(struct btrfs_fs_info *fs_info);</div><div class='add'>+void btrfs_exclop_balance(struct btrfs_fs_info *fs_info,</div><div class='add'>+			  enum btrfs_exclusive_operation op);</div><div class='add'>+</div><div class='add'>+int btrfs_check_ioctl_vol_args_path(const struct btrfs_ioctl_vol_args *vol_args);</div><div class='add'>+</div><div class='add'>+u16 btrfs_csum_type_size(u16 type);</div><div class='add'>+int btrfs_super_csum_size(const struct btrfs_super_block *s);</div><div class='add'>+const char *btrfs_super_csum_name(u16 csum_type);</div><div class='add'>+const char *btrfs_super_csum_driver(u16 csum_type);</div><div class='add'>+size_t __attribute_const__ btrfs_get_num_csums(void);</div><div class='add'>+</div><div class='add'>+static inline bool btrfs_is_empty_uuid(const u8 *uuid)</div><div class='add'>+{</div><div class='add'>+	return uuid_is_null((const uuid_t *)uuid);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Compatibility and incompatibility defines */</div><div class='add'>+void __btrfs_set_fs_incompat(struct btrfs_fs_info *fs_info, u64 flag,</div><div class='add'>+			     const char *name);</div><div class='add'>+void __btrfs_clear_fs_incompat(struct btrfs_fs_info *fs_info, u64 flag,</div><div class='add'>+			       const char *name);</div><div class='add'>+void __btrfs_set_fs_compat_ro(struct btrfs_fs_info *fs_info, u64 flag,</div><div class='add'>+			      const char *name);</div><div class='add'>+void __btrfs_clear_fs_compat_ro(struct btrfs_fs_info *fs_info, u64 flag,</div><div class='add'>+				const char *name);</div><div class='add'>+</div><div class='add'>+#define __btrfs_fs_incompat(fs_info, flags)				\</div><div class='add'>+	(!!(btrfs_super_incompat_flags((fs_info)-&gt;super_copy) &amp; (flags)))</div><div class='add'>+</div><div class='add'>+#define __btrfs_fs_compat_ro(fs_info, flags)				\</div><div class='add'>+	(!!(btrfs_super_compat_ro_flags((fs_info)-&gt;super_copy) &amp; (flags)))</div><div class='add'>+</div><div class='add'>+#define btrfs_set_fs_incompat(__fs_info, opt)				\</div><div class='add'>+	__btrfs_set_fs_incompat((__fs_info), BTRFS_FEATURE_INCOMPAT_##opt, #opt)</div><div class='add'>+</div><div class='add'>+#define btrfs_clear_fs_incompat(__fs_info, opt)				\</div><div class='add'>+	__btrfs_clear_fs_incompat((__fs_info), BTRFS_FEATURE_INCOMPAT_##opt, #opt)</div><div class='add'>+</div><div class='add'>+#define btrfs_fs_incompat(fs_info, opt)					\</div><div class='add'>+	__btrfs_fs_incompat((fs_info), BTRFS_FEATURE_INCOMPAT_##opt)</div><div class='add'>+</div><div class='add'>+#define btrfs_set_fs_compat_ro(__fs_info, opt)				\</div><div class='add'>+	__btrfs_set_fs_compat_ro((__fs_info), BTRFS_FEATURE_COMPAT_RO_##opt, #opt)</div><div class='add'>+</div><div class='add'>+#define btrfs_clear_fs_compat_ro(__fs_info, opt)			\</div><div class='add'>+	__btrfs_clear_fs_compat_ro((__fs_info), BTRFS_FEATURE_COMPAT_RO_##opt, #opt)</div><div class='add'>+</div><div class='add'>+#define btrfs_fs_compat_ro(fs_info, opt)				\</div><div class='add'>+	__btrfs_fs_compat_ro((fs_info), BTRFS_FEATURE_COMPAT_RO_##opt)</div><div class='add'>+</div><div class='add'>+#define btrfs_clear_opt(o, opt)		((o) &amp;= ~BTRFS_MOUNT_##opt)</div><div class='add'>+#define btrfs_set_opt(o, opt)		((o) |= BTRFS_MOUNT_##opt)</div><div class='add'>+#define btrfs_raw_test_opt(o, opt)	((o) &amp; BTRFS_MOUNT_##opt)</div><div class='add'>+#define btrfs_test_opt(fs_info, opt)	((fs_info)-&gt;mount_opt &amp; \</div><div class='add'>+					 BTRFS_MOUNT_##opt)</div><div class='add'>+</div><div class='add'>+static inline int btrfs_fs_closing(const struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	/* Do it this way so we only ever do one test_bit in the normal case. */</div><div class='add'>+	if (test_bit(BTRFS_FS_CLOSING_START, &amp;fs_info-&gt;flags)) {</div><div class='add'>+		if (test_bit(BTRFS_FS_CLOSING_DONE, &amp;fs_info-&gt;flags))</div><div class='add'>+			return 2;</div><div class='add'>+		return 1;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * If we remount the fs to be R/O or umount the fs, the cleaner needn't do</div><div class='add'>+ * anything except sleeping. This function is used to check the status of</div><div class='add'>+ * the fs.</div><div class='add'>+ * We check for BTRFS_FS_STATE_RO to avoid races with a concurrent remount,</div><div class='add'>+ * since setting and checking for SB_RDONLY in the superblock's flags is not</div><div class='add'>+ * atomic.</div><div class='add'>+ */</div><div class='add'>+static inline int btrfs_need_cleaner_sleep(const struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	return test_bit(BTRFS_FS_STATE_RO, &amp;fs_info-&gt;fs_state) ||</div><div class='add'>+		btrfs_fs_closing(fs_info);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_wake_unfinished_drop(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	clear_and_wake_up_bit(BTRFS_FS_UNFINISHED_DROPS, &amp;fs_info-&gt;flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define BTRFS_FS_ERROR(fs_info)	(READ_ONCE((fs_info)-&gt;fs_error))</div><div class='add'>+</div><div class='add'>+#define BTRFS_FS_LOG_CLEANUP_ERROR(fs_info)				\</div><div class='add'>+	(unlikely(test_bit(BTRFS_FS_STATE_LOG_CLEANUP_ERROR,		\</div><div class='add'>+			   &amp;(fs_info)-&gt;fs_state)))</div><div class='add'>+</div><div class='add'>+static inline bool btrfs_is_shutdown(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	return test_bit(BTRFS_FS_STATE_EMERGENCY_SHUTDOWN, &amp;fs_info-&gt;fs_state);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_force_shutdown(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	/*</div><div class='add'>+	 * Here we do not want to use handle_fs_error(), which will mark the fs</div><div class='add'>+	 * read-only.</div><div class='add'>+	 * Some call sites like shutdown ioctl will mark the fs shutdown when</div><div class='add'>+	 * the fs is frozen. But thaw path will handle RO and RW fs</div><div class='add'>+	 * differently.</div><div class='add'>+	 *</div><div class='add'>+	 * So here we only mark the fs error without flipping it RO.</div><div class='add'>+	 */</div><div class='add'>+	WRITE_ONCE(fs_info-&gt;fs_error, -EIO);</div><div class='add'>+	if (!test_and_set_bit(BTRFS_FS_STATE_EMERGENCY_SHUTDOWN, &amp;fs_info-&gt;fs_state))</div><div class='add'>+		btrfs_crit(fs_info, "emergency shutdown");</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * We use folio flag owner_2 to indicate there is an ordered extent with</div><div class='add'>+ * unfinished IO.</div><div class='add'>+ */</div><div class='add'>+#define folio_test_ordered(folio)	folio_test_owner_2(folio)</div><div class='add'>+#define folio_set_ordered(folio)	folio_set_owner_2(folio)</div><div class='add'>+#define folio_clear_ordered(folio)	folio_clear_owner_2(folio)</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BTRFS_FS_RUN_SANITY_TESTS</div><div class='add'>+</div><div class='add'>+#define EXPORT_FOR_TESTS</div><div class='add'>+</div><div class='add'>+static inline bool btrfs_is_testing(const struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	return unlikely(test_bit(BTRFS_FS_STATE_DUMMY_FS_INFO, &amp;fs_info-&gt;fs_state));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_test_destroy_inode(struct inode *inode);</div><div class='add'>+</div><div class='add'>+#else</div><div class='add'>+</div><div class='add'>+#define EXPORT_FOR_TESTS static</div><div class='add'>+</div><div class='add'>+static inline bool btrfs_is_testing(const struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+#endif</div><div class='head'>diff --git a/fs/btrfs/inode-item.c b/fs/btrfs/inode-item.c<br/>index 37f36ffdaf6b..b73e1dd97208 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/inode-item.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/inode-item.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/inode-item.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/inode-item.c</a></div><div class='hunk'>@@ -4,13 +4,19 @@</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> #include "ctree.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "messages.h"</div><div class='add'>+#include "inode-item.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='ctx'> #include "transaction.h"</div><div class='del'>-#include "print-tree.h"</div><div class='del'>-</div><div class='del'>-struct btrfs_inode_ref *btrfs_find_name_in_backref(struct extent_buffer *leaf,</div><div class='del'>-						   int slot, const char *name,</div><div class='del'>-						   int name_len)</div><div class='add'>+#include "space-info.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "extent-tree.h"</div><div class='add'>+#include "file-item.h"</div><div class='add'>+</div><div class='add'>+struct btrfs_inode_ref *btrfs_find_name_in_backref(const struct extent_buffer *leaf,</div><div class='add'>+						   int slot,</div><div class='add'>+						   const struct fscrypt_str *name)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_inode_ref *ref;</div><div class='ctx'> 	unsigned long ptr;</div><div class='hunk'>@@ -19,24 +25,25 @@ struct btrfs_inode_ref *btrfs_find_name_in_backref(struct extent_buffer *leaf,</div><div class='ctx'> 	u32 cur_offset = 0;</div><div class='ctx'> 	int len;</div><div class='ctx'> </div><div class='del'>-	item_size = btrfs_item_size_nr(leaf, slot);</div><div class='add'>+	item_size = btrfs_item_size(leaf, slot);</div><div class='ctx'> 	ptr = btrfs_item_ptr_offset(leaf, slot);</div><div class='ctx'> 	while (cur_offset &lt; item_size) {</div><div class='ctx'> 		ref = (struct btrfs_inode_ref *)(ptr + cur_offset);</div><div class='ctx'> 		len = btrfs_inode_ref_name_len(leaf, ref);</div><div class='ctx'> 		name_ptr = (unsigned long)(ref + 1);</div><div class='ctx'> 		cur_offset += len + sizeof(*ref);</div><div class='del'>-		if (len != name_len)</div><div class='add'>+		if (len != name-&gt;len)</div><div class='ctx'> 			continue;</div><div class='del'>-		if (memcmp_extent_buffer(leaf, name, name_ptr, name_len) == 0)</div><div class='add'>+		if (memcmp_extent_buffer(leaf, name-&gt;name, name_ptr,</div><div class='add'>+					 name-&gt;len) == 0)</div><div class='ctx'> 			return ref;</div><div class='ctx'> 	}</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct btrfs_inode_extref *btrfs_find_name_in_ext_backref(</div><div class='del'>-		struct extent_buffer *leaf, int slot, u64 ref_objectid,</div><div class='del'>-		const char *name, int name_len)</div><div class='add'>+		const struct extent_buffer *leaf, int slot, u64 ref_objectid,</div><div class='add'>+		const struct fscrypt_str *name)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_inode_extref *extref;</div><div class='ctx'> 	unsigned long ptr;</div><div class='hunk'>@@ -45,7 +52,7 @@ struct btrfs_inode_extref *btrfs_find_name_in_ext_backref(</div><div class='ctx'> 	u32 cur_offset = 0;</div><div class='ctx'> 	int ref_name_len;</div><div class='ctx'> </div><div class='del'>-	item_size = btrfs_item_size_nr(leaf, slot);</div><div class='add'>+	item_size = btrfs_item_size(leaf, slot);</div><div class='ctx'> 	ptr = btrfs_item_ptr_offset(leaf, slot);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -59,9 +66,10 @@ struct btrfs_inode_extref *btrfs_find_name_in_ext_backref(</div><div class='ctx'> 		name_ptr = (unsigned long)(&amp;extref-&gt;name);</div><div class='ctx'> 		ref_name_len = btrfs_inode_extref_name_len(leaf, extref);</div><div class='ctx'> </div><div class='del'>-		if (ref_name_len == name_len &amp;&amp;</div><div class='add'>+		if (ref_name_len == name-&gt;len &amp;&amp;</div><div class='ctx'> 		    btrfs_inode_extref_parent(leaf, extref) == ref_objectid &amp;&amp;</div><div class='del'>-		    (memcmp_extent_buffer(leaf, name, name_ptr, name_len) == 0))</div><div class='add'>+		    (memcmp_extent_buffer(leaf, name-&gt;name, name_ptr,</div><div class='add'>+					  name-&gt;len) == 0))</div><div class='ctx'> 			return extref;</div><div class='ctx'> </div><div class='ctx'> 		cur_offset += ref_name_len + sizeof(*extref);</div><div class='hunk'>@@ -70,50 +78,47 @@ struct btrfs_inode_extref *btrfs_find_name_in_ext_backref(</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Returns NULL if no extref found */</div><div class='del'>-struct btrfs_inode_extref *</div><div class='del'>-btrfs_lookup_inode_extref(struct btrfs_trans_handle *trans,</div><div class='del'>-			  struct btrfs_root *root,</div><div class='del'>-			  struct btrfs_path *path,</div><div class='del'>-			  const char *name, int name_len,</div><div class='del'>-			  u64 inode_objectid, u64 ref_objectid, int ins_len,</div><div class='del'>-			  int cow)</div><div class='add'>+struct btrfs_inode_extref *btrfs_lookup_inode_extref(struct btrfs_root *root,</div><div class='add'>+						     struct btrfs_path *path,</div><div class='add'>+						     const struct fscrypt_str *name,</div><div class='add'>+						     u64 inode_objectid, u64 ref_objectid)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = inode_objectid;</div><div class='ctx'> 	key.type = BTRFS_INODE_EXTREF_KEY;</div><div class='del'>-	key.offset = btrfs_extref_hash(ref_objectid, name, name_len);</div><div class='add'>+	key.offset = btrfs_extref_hash(ref_objectid, name-&gt;name, name-&gt;len);</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_search_slot(trans, root, &amp;key, path, ins_len, cow);</div><div class='add'>+	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ERR_PTR(ret);</div><div class='ctx'> 	if (ret &gt; 0)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	return btrfs_find_name_in_ext_backref(path-&gt;nodes[0], path-&gt;slots[0],</div><div class='del'>-					      ref_objectid, name, name_len);</div><div class='add'>+					      ref_objectid, name);</div><div class='ctx'> </div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int btrfs_del_inode_extref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				  struct btrfs_root *root,</div><div class='del'>-				  const char *name, int name_len,</div><div class='add'>+				  const struct fscrypt_str *name,</div><div class='ctx'> 				  u64 inode_objectid, u64 ref_objectid,</div><div class='ctx'> 				  u64 *index)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_inode_extref *extref;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	int ret;</div><div class='del'>-	int del_len = name_len + sizeof(*extref);</div><div class='add'>+	int del_len = name-&gt;len + sizeof(*extref);</div><div class='ctx'> 	unsigned long ptr;</div><div class='ctx'> 	unsigned long item_start;</div><div class='ctx'> 	u32 item_size;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = inode_objectid;</div><div class='ctx'> 	key.type = BTRFS_INODE_EXTREF_KEY;</div><div class='del'>-	key.offset = btrfs_extref_hash(ref_objectid, name, name_len);</div><div class='add'>+	key.offset = btrfs_extref_hash(ref_objectid, name-&gt;name, name-&gt;len);</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='hunk'>@@ -121,9 +126,9 @@ static int btrfs_del_inode_extref(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_search_slot(trans, root, &amp;key, path, -1, 1);</div><div class='ctx'> 	if (ret &gt; 0)</div><div class='del'>-		ret = -ENOENT;</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Sanity check - did we find the right item for this name?</div><div class='hunk'>@@ -131,25 +136,20 @@ static int btrfs_del_inode_extref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * readonly.</div><div class='ctx'> 	 */</div><div class='ctx'> 	extref = btrfs_find_name_in_ext_backref(path-&gt;nodes[0], path-&gt;slots[0],</div><div class='del'>-						ref_objectid, name, name_len);</div><div class='del'>-	if (!extref) {</div><div class='del'>-		btrfs_handle_fs_error(root-&gt;fs_info, -ENOENT, NULL);</div><div class='del'>-		ret = -EROFS;</div><div class='del'>-		goto out;</div><div class='add'>+						ref_objectid, name);</div><div class='add'>+	if (unlikely(!extref)) {</div><div class='add'>+		btrfs_abort_transaction(trans, -ENOENT);</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='del'>-	item_size = btrfs_item_size_nr(leaf, path-&gt;slots[0]);</div><div class='add'>+	item_size = btrfs_item_size(leaf, path-&gt;slots[0]);</div><div class='ctx'> 	if (index)</div><div class='ctx'> 		*index = btrfs_inode_extref_index(leaf, extref);</div><div class='ctx'> </div><div class='ctx'> 	if (del_len == item_size) {</div><div class='del'>-		/*</div><div class='del'>-		 * Common case only one ref in the item, remove the</div><div class='del'>-		 * whole item.</div><div class='del'>-		 */</div><div class='del'>-		ret = btrfs_del_item(trans, root, path);</div><div class='del'>-		goto out;</div><div class='add'>+		/* Common case only one ref in the item, remove the whole item. */</div><div class='add'>+		return btrfs_del_item(trans, root, path);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ptr = (unsigned long)extref;</div><div class='hunk'>@@ -158,17 +158,13 @@ static int btrfs_del_inode_extref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	memmove_extent_buffer(leaf, ptr, ptr + del_len,</div><div class='ctx'> 			      item_size - (ptr + del_len - item_start));</div><div class='ctx'> </div><div class='del'>-	btrfs_truncate_item(path, item_size - del_len, 1);</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='add'>+	btrfs_truncate_item(trans, path, item_size - del_len, 1);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_del_inode_ref(struct btrfs_trans_handle *trans,</div><div class='del'>-			struct btrfs_root *root,</div><div class='del'>-			const char *name, int name_len,</div><div class='add'>+			struct btrfs_root *root, const struct fscrypt_str *name,</div><div class='ctx'> 			u64 inode_objectid, u64 ref_objectid, u64 *index)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_path *path;</div><div class='hunk'>@@ -181,11 +177,11 @@ int btrfs_del_inode_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	u32 sub_item_len;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int search_ext_refs = 0;</div><div class='del'>-	int del_len = name_len + sizeof(*ref);</div><div class='add'>+	int del_len = name-&gt;len + sizeof(*ref);</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = inode_objectid;</div><div class='del'>-	key.offset = ref_objectid;</div><div class='ctx'> 	key.type = BTRFS_INODE_REF_KEY;</div><div class='add'>+	key.offset = ref_objectid;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='hunk'>@@ -200,15 +196,14 @@ int btrfs_del_inode_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ref = btrfs_find_name_in_backref(path-&gt;nodes[0], path-&gt;slots[0], name,</div><div class='del'>-					 name_len);</div><div class='add'>+	ref = btrfs_find_name_in_backref(path-&gt;nodes[0], path-&gt;slots[0], name);</div><div class='ctx'> 	if (!ref) {</div><div class='ctx'> 		ret = -ENOENT;</div><div class='ctx'> 		search_ext_refs = 1;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='del'>-	item_size = btrfs_item_size_nr(leaf, path-&gt;slots[0]);</div><div class='add'>+	item_size = btrfs_item_size(leaf, path-&gt;slots[0]);</div><div class='ctx'> </div><div class='ctx'> 	if (index)</div><div class='ctx'> 		*index = btrfs_inode_ref_index(leaf, ref);</div><div class='hunk'>@@ -218,11 +213,11 @@ int btrfs_del_inode_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	ptr = (unsigned long)ref;</div><div class='del'>-	sub_item_len = name_len + sizeof(*ref);</div><div class='add'>+	sub_item_len = name-&gt;len + sizeof(*ref);</div><div class='ctx'> 	item_start = btrfs_item_ptr_offset(leaf, path-&gt;slots[0]);</div><div class='ctx'> 	memmove_extent_buffer(leaf, ptr, ptr + sub_item_len,</div><div class='ctx'> 			      item_size - (ptr + sub_item_len - item_start));</div><div class='del'>-	btrfs_truncate_item(path, item_size - sub_item_len, 1);</div><div class='add'>+	btrfs_truncate_item(trans, path, item_size - sub_item_len, 1);</div><div class='ctx'> out:</div><div class='ctx'> 	btrfs_free_path(path);</div><div class='ctx'> </div><div class='hunk'>@@ -232,7 +227,7 @@ out:</div><div class='ctx'> 		 * name in our ref array. Find and remove the extended</div><div class='ctx'> 		 * inode ref then.</div><div class='ctx'> 		 */</div><div class='del'>-		return btrfs_del_inode_extref(trans, root, name, name_len,</div><div class='add'>+		return btrfs_del_inode_extref(trans, root, name,</div><div class='ctx'> 					      inode_objectid, ref_objectid, index);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -240,27 +235,27 @@ out:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * btrfs_insert_inode_extref() - Inserts an extended inode ref into a tree.</div><div class='add'>+ * Insert an extended inode ref into a tree.</div><div class='ctx'>  *</div><div class='ctx'>  * The caller must have checked against BTRFS_LINK_MAX already.</div><div class='ctx'>  */</div><div class='ctx'> static int btrfs_insert_inode_extref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				     struct btrfs_root *root,</div><div class='del'>-				     const char *name, int name_len,</div><div class='del'>-				     u64 inode_objectid, u64 ref_objectid, u64 index)</div><div class='add'>+				     const struct fscrypt_str *name,</div><div class='add'>+				     u64 inode_objectid, u64 ref_objectid,</div><div class='add'>+				     u64 index)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_inode_extref *extref;</div><div class='ctx'> 	int ret;</div><div class='del'>-	int ins_len = name_len + sizeof(*extref);</div><div class='add'>+	int ins_len = name-&gt;len + sizeof(*extref);</div><div class='ctx'> 	unsigned long ptr;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='del'>-	struct btrfs_item *item;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = inode_objectid;</div><div class='ctx'> 	key.type = BTRFS_INODE_EXTREF_KEY;</div><div class='del'>-	key.offset = btrfs_extref_hash(ref_objectid, name, name_len);</div><div class='add'>+	key.offset = btrfs_extref_hash(ref_objectid, name-&gt;name, name-&gt;len);</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='hunk'>@@ -272,38 +267,33 @@ static int btrfs_insert_inode_extref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		if (btrfs_find_name_in_ext_backref(path-&gt;nodes[0],</div><div class='ctx'> 						   path-&gt;slots[0],</div><div class='ctx'> 						   ref_objectid,</div><div class='del'>-						   name, name_len))</div><div class='del'>-			goto out;</div><div class='add'>+						   name))</div><div class='add'>+			return ret;</div><div class='ctx'> </div><div class='del'>-		btrfs_extend_item(path, ins_len);</div><div class='add'>+		btrfs_extend_item(trans, path, ins_len);</div><div class='ctx'> 		ret = 0;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='del'>-	item = btrfs_item_nr(path-&gt;slots[0]);</div><div class='ctx'> 	ptr = (unsigned long)btrfs_item_ptr(leaf, path-&gt;slots[0], char);</div><div class='del'>-	ptr += btrfs_item_size(leaf, item) - ins_len;</div><div class='add'>+	ptr += btrfs_item_size(leaf, path-&gt;slots[0]) - ins_len;</div><div class='ctx'> 	extref = (struct btrfs_inode_extref *)ptr;</div><div class='ctx'> </div><div class='del'>-	btrfs_set_inode_extref_name_len(path-&gt;nodes[0], extref, name_len);</div><div class='add'>+	btrfs_set_inode_extref_name_len(path-&gt;nodes[0], extref, name-&gt;len);</div><div class='ctx'> 	btrfs_set_inode_extref_index(path-&gt;nodes[0], extref, index);</div><div class='ctx'> 	btrfs_set_inode_extref_parent(path-&gt;nodes[0], extref, ref_objectid);</div><div class='ctx'> </div><div class='ctx'> 	ptr = (unsigned long)&amp;extref-&gt;name;</div><div class='del'>-	write_extent_buffer(path-&gt;nodes[0], name, ptr, name_len);</div><div class='del'>-	btrfs_mark_buffer_dirty(path-&gt;nodes[0]);</div><div class='add'>+	write_extent_buffer(path-&gt;nodes[0], name-&gt;name, ptr, name-&gt;len);</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Will return 0, -ENOMEM, -EMLINK, or -EEXIST or anything from the CoW path */</div><div class='ctx'> int btrfs_insert_inode_ref(struct btrfs_trans_handle *trans,</div><div class='del'>-			   struct btrfs_root *root,</div><div class='del'>-			   const char *name, int name_len,</div><div class='add'>+			   struct btrfs_root *root, const struct fscrypt_str *name,</div><div class='ctx'> 			   u64 inode_objectid, u64 ref_objectid, u64 index)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='hunk'>@@ -312,32 +302,32 @@ int btrfs_insert_inode_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	struct btrfs_inode_ref *ref;</div><div class='ctx'> 	unsigned long ptr;</div><div class='ctx'> 	int ret;</div><div class='del'>-	int ins_len = name_len + sizeof(*ref);</div><div class='add'>+	int ins_len = name-&gt;len + sizeof(*ref);</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = inode_objectid;</div><div class='del'>-	key.offset = ref_objectid;</div><div class='ctx'> 	key.type = BTRFS_INODE_REF_KEY;</div><div class='add'>+	key.offset = ref_objectid;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	path-&gt;skip_release_on_error = 1;</div><div class='add'>+	path-&gt;skip_release_on_error = true;</div><div class='ctx'> 	ret = btrfs_insert_empty_item(trans, root, path, &amp;key,</div><div class='ctx'> 				      ins_len);</div><div class='ctx'> 	if (ret == -EEXIST) {</div><div class='ctx'> 		u32 old_size;</div><div class='ctx'> 		ref = btrfs_find_name_in_backref(path-&gt;nodes[0], path-&gt;slots[0],</div><div class='del'>-						 name, name_len);</div><div class='add'>+						 name);</div><div class='ctx'> 		if (ref)</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='del'>-		old_size = btrfs_item_size_nr(path-&gt;nodes[0], path-&gt;slots[0]);</div><div class='del'>-		btrfs_extend_item(path, ins_len);</div><div class='add'>+		old_size = btrfs_item_size(path-&gt;nodes[0], path-&gt;slots[0]);</div><div class='add'>+		btrfs_extend_item(trans, path, ins_len);</div><div class='ctx'> 		ref = btrfs_item_ptr(path-&gt;nodes[0], path-&gt;slots[0],</div><div class='ctx'> 				     struct btrfs_inode_ref);</div><div class='ctx'> 		ref = (struct btrfs_inode_ref *)((unsigned long)ref + old_size);</div><div class='del'>-		btrfs_set_inode_ref_name_len(path-&gt;nodes[0], ref, name_len);</div><div class='add'>+		btrfs_set_inode_ref_name_len(path-&gt;nodes[0], ref, name-&gt;len);</div><div class='ctx'> 		btrfs_set_inode_ref_index(path-&gt;nodes[0], ref, index);</div><div class='ctx'> 		ptr = (unsigned long)(ref + 1);</div><div class='ctx'> 		ret = 0;</div><div class='hunk'>@@ -345,7 +335,7 @@ int btrfs_insert_inode_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		if (ret == -EOVERFLOW) {</div><div class='ctx'> 			if (btrfs_find_name_in_backref(path-&gt;nodes[0],</div><div class='ctx'> 						       path-&gt;slots[0],</div><div class='del'>-						       name, name_len))</div><div class='add'>+						       name))</div><div class='ctx'> 				ret = -EEXIST;</div><div class='ctx'> 			else</div><div class='ctx'> 				ret = -EMLINK;</div><div class='hunk'>@@ -354,13 +344,11 @@ int btrfs_insert_inode_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	} else {</div><div class='ctx'> 		ref = btrfs_item_ptr(path-&gt;nodes[0], path-&gt;slots[0],</div><div class='ctx'> 				     struct btrfs_inode_ref);</div><div class='del'>-		btrfs_set_inode_ref_name_len(path-&gt;nodes[0], ref, name_len);</div><div class='add'>+		btrfs_set_inode_ref_name_len(path-&gt;nodes[0], ref, name-&gt;len);</div><div class='ctx'> 		btrfs_set_inode_ref_index(path-&gt;nodes[0], ref, index);</div><div class='ctx'> 		ptr = (unsigned long)(ref + 1);</div><div class='ctx'> 	}</div><div class='del'>-	write_extent_buffer(path-&gt;nodes[0], name, ptr, name_len);</div><div class='del'>-	btrfs_mark_buffer_dirty(path-&gt;nodes[0]);</div><div class='del'>-</div><div class='add'>+	write_extent_buffer(path-&gt;nodes[0], name-&gt;name, ptr, name-&gt;len);</div><div class='ctx'> out:</div><div class='ctx'> 	btrfs_free_path(path);</div><div class='ctx'> </div><div class='hunk'>@@ -371,7 +359,6 @@ out:</div><div class='ctx'> 		if (btrfs_super_incompat_flags(disk_super)</div><div class='ctx'> 		    &amp; BTRFS_FEATURE_INCOMPAT_EXTENDED_IREF)</div><div class='ctx'> 			ret = btrfs_insert_inode_extref(trans, root, name,</div><div class='del'>-							name_len,</div><div class='ctx'> 							inode_objectid,</div><div class='ctx'> 							ref_objectid, index);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -419,3 +406,329 @@ int btrfs_lookup_inode(struct btrfs_trans_handle *trans, struct btrfs_root</div><div class='ctx'> 	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+static inline void btrfs_trace_truncate(const struct btrfs_inode *inode,</div><div class='add'>+					const struct extent_buffer *leaf,</div><div class='add'>+					const struct btrfs_file_extent_item *fi,</div><div class='add'>+					u64 offset, int extent_type, int slot)</div><div class='add'>+{</div><div class='add'>+	if (!inode)</div><div class='add'>+		return;</div><div class='add'>+	if (extent_type == BTRFS_FILE_EXTENT_INLINE)</div><div class='add'>+		trace_btrfs_truncate_show_fi_inline(inode, leaf, fi, slot,</div><div class='add'>+						    offset);</div><div class='add'>+	else</div><div class='add'>+		trace_btrfs_truncate_show_fi_regular(inode, leaf, fi, offset);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Remove inode items from a given root.</div><div class='add'>+ *</div><div class='add'>+ * @trans:		A transaction handle.</div><div class='add'>+ * @root:		The root from which to remove items.</div><div class='add'>+ * @inode:		The inode whose items we want to remove.</div><div class='add'>+ * @control:		The btrfs_truncate_control to control how and what we</div><div class='add'>+ *			are truncating.</div><div class='add'>+ *</div><div class='add'>+ * Remove all keys associated with the inode from the given root that have a key</div><div class='add'>+ * with a type greater than or equals to @min_type. When @min_type has a value of</div><div class='add'>+ * BTRFS_EXTENT_DATA_KEY, only remove file extent items that have an offset value</div><div class='add'>+ * greater than or equals to @new_size. If a file extent item that starts before</div><div class='add'>+ * @new_size and ends after it is found, its length is adjusted.</div><div class='add'>+ *</div><div class='add'>+ * Returns: 0 on success, &lt; 0 on error and NEED_TRUNCATE_BLOCK when @min_type is</div><div class='add'>+ * BTRFS_EXTENT_DATA_KEY and the caller must truncate the last block.</div><div class='add'>+ */</div><div class='add'>+int btrfs_truncate_inode_items(struct btrfs_trans_handle *trans,</div><div class='add'>+			       struct btrfs_root *root,</div><div class='add'>+			       struct btrfs_truncate_control *control)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='add'>+	struct extent_buffer *leaf;</div><div class='add'>+	struct btrfs_file_extent_item *fi;</div><div class='add'>+	struct btrfs_key key;</div><div class='add'>+	struct btrfs_key found_key;</div><div class='add'>+	u64 new_size = control-&gt;new_size;</div><div class='add'>+	u64 extent_num_bytes = 0;</div><div class='add'>+	u64 extent_offset = 0;</div><div class='add'>+	u64 item_end = 0;</div><div class='add'>+	u32 found_type = (u8)-1;</div><div class='add'>+	int del_item;</div><div class='add'>+	int pending_del_nr = 0;</div><div class='add'>+	int pending_del_slot = 0;</div><div class='add'>+	int extent_type = -1;</div><div class='add'>+	int ret;</div><div class='add'>+	u64 bytes_deleted = 0;</div><div class='add'>+	bool be_nice = false;</div><div class='add'>+</div><div class='add'>+	ASSERT(control-&gt;inode || !control-&gt;clear_extent_range);</div><div class='add'>+	ASSERT(new_size == 0 || control-&gt;min_type == BTRFS_EXTENT_DATA_KEY);</div><div class='add'>+</div><div class='add'>+	control-&gt;last_size = new_size;</div><div class='add'>+	control-&gt;sub_bytes = 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * For shareable roots we want to back off from time to time, this turns</div><div class='add'>+	 * out to be subvolume roots, reloc roots, and data reloc roots.</div><div class='add'>+	 */</div><div class='add'>+	if (test_bit(BTRFS_ROOT_SHAREABLE, &amp;root-&gt;state))</div><div class='add'>+		be_nice = true;</div><div class='add'>+</div><div class='add'>+	path = btrfs_alloc_path();</div><div class='add'>+	if (!path)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	path-&gt;reada = READA_BACK;</div><div class='add'>+</div><div class='add'>+	key.objectid = control-&gt;ino;</div><div class='add'>+	key.type = (u8)-1;</div><div class='add'>+	key.offset = (u64)-1;</div><div class='add'>+</div><div class='add'>+search_again:</div><div class='add'>+	/*</div><div class='add'>+	 * With a 16K leaf size and 128MiB extents, you can actually queue up a</div><div class='add'>+	 * huge file in a single leaf.  Most of the time that bytes_deleted is</div><div class='add'>+	 * &gt; 0, it will be huge by the time we get here</div><div class='add'>+	 */</div><div class='add'>+	if (be_nice &amp;&amp; bytes_deleted &gt; SZ_32M &amp;&amp;</div><div class='add'>+	    btrfs_should_end_transaction(trans)) {</div><div class='add'>+		ret = -EAGAIN;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_search_slot(trans, root, &amp;key, path, -1, 1);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	if (ret &gt; 0) {</div><div class='add'>+		ret = 0;</div><div class='add'>+		/* There are no items in the tree for us to truncate, we're done */</div><div class='add'>+		if (path-&gt;slots[0] == 0)</div><div class='add'>+			goto out;</div><div class='add'>+		path-&gt;slots[0]--;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	while (1) {</div><div class='add'>+		u64 clear_start = 0, clear_len = 0, extent_start = 0;</div><div class='add'>+		bool refill_delayed_refs_rsv = false;</div><div class='add'>+</div><div class='add'>+		fi = NULL;</div><div class='add'>+		leaf = path-&gt;nodes[0];</div><div class='add'>+		btrfs_item_key_to_cpu(leaf, &amp;found_key, path-&gt;slots[0]);</div><div class='add'>+		found_type = found_key.type;</div><div class='add'>+</div><div class='add'>+		if (found_key.objectid != control-&gt;ino)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		if (found_type &lt; control-&gt;min_type)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		item_end = found_key.offset;</div><div class='add'>+		if (found_type == BTRFS_EXTENT_DATA_KEY) {</div><div class='add'>+			fi = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='add'>+					    struct btrfs_file_extent_item);</div><div class='add'>+			extent_type = btrfs_file_extent_type(leaf, fi);</div><div class='add'>+			if (extent_type != BTRFS_FILE_EXTENT_INLINE)</div><div class='add'>+				item_end +=</div><div class='add'>+				    btrfs_file_extent_num_bytes(leaf, fi);</div><div class='add'>+			else if (extent_type == BTRFS_FILE_EXTENT_INLINE)</div><div class='add'>+				item_end += btrfs_file_extent_ram_bytes(leaf, fi);</div><div class='add'>+</div><div class='add'>+			btrfs_trace_truncate(control-&gt;inode, leaf, fi,</div><div class='add'>+					     found_key.offset, extent_type,</div><div class='add'>+					     path-&gt;slots[0]);</div><div class='add'>+			item_end--;</div><div class='add'>+		}</div><div class='add'>+		if (found_type &gt; control-&gt;min_type) {</div><div class='add'>+			del_item = 1;</div><div class='add'>+		} else {</div><div class='add'>+			if (item_end &lt; new_size)</div><div class='add'>+				break;</div><div class='add'>+			if (found_key.offset &gt;= new_size)</div><div class='add'>+				del_item = 1;</div><div class='add'>+			else</div><div class='add'>+				del_item = 0;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* FIXME, shrink the extent if the ref count is only 1 */</div><div class='add'>+		if (found_type != BTRFS_EXTENT_DATA_KEY)</div><div class='add'>+			goto delete;</div><div class='add'>+</div><div class='add'>+		control-&gt;extents_found++;</div><div class='add'>+</div><div class='add'>+		if (extent_type != BTRFS_FILE_EXTENT_INLINE) {</div><div class='add'>+			u64 num_dec;</div><div class='add'>+</div><div class='add'>+			clear_start = found_key.offset;</div><div class='add'>+			extent_start = btrfs_file_extent_disk_bytenr(leaf, fi);</div><div class='add'>+			if (!del_item) {</div><div class='add'>+				u64 orig_num_bytes =</div><div class='add'>+					btrfs_file_extent_num_bytes(leaf, fi);</div><div class='add'>+				extent_num_bytes = ALIGN(new_size -</div><div class='add'>+						found_key.offset,</div><div class='add'>+						fs_info-&gt;sectorsize);</div><div class='add'>+				clear_start = ALIGN(new_size, fs_info-&gt;sectorsize);</div><div class='add'>+</div><div class='add'>+				btrfs_set_file_extent_num_bytes(leaf, fi,</div><div class='add'>+							 extent_num_bytes);</div><div class='add'>+				num_dec = (orig_num_bytes - extent_num_bytes);</div><div class='add'>+				if (extent_start != 0)</div><div class='add'>+					control-&gt;sub_bytes += num_dec;</div><div class='add'>+			} else {</div><div class='add'>+				extent_num_bytes =</div><div class='add'>+					btrfs_file_extent_disk_num_bytes(leaf, fi);</div><div class='add'>+				extent_offset = found_key.offset -</div><div class='add'>+					btrfs_file_extent_offset(leaf, fi);</div><div class='add'>+</div><div class='add'>+				/* FIXME blocksize != 4096 */</div><div class='add'>+				num_dec = btrfs_file_extent_num_bytes(leaf, fi);</div><div class='add'>+				if (extent_start != 0)</div><div class='add'>+					control-&gt;sub_bytes += num_dec;</div><div class='add'>+			}</div><div class='add'>+			clear_len = num_dec;</div><div class='add'>+		} else if (extent_type == BTRFS_FILE_EXTENT_INLINE) {</div><div class='add'>+			/*</div><div class='add'>+			 * We can't truncate inline items that have had</div><div class='add'>+			 * special encodings</div><div class='add'>+			 */</div><div class='add'>+			if (!del_item &amp;&amp;</div><div class='add'>+			    btrfs_file_extent_encryption(leaf, fi) == 0 &amp;&amp;</div><div class='add'>+			    btrfs_file_extent_other_encoding(leaf, fi) == 0 &amp;&amp;</div><div class='add'>+			    btrfs_file_extent_compression(leaf, fi) == 0) {</div><div class='add'>+				u32 size = (u32)(new_size - found_key.offset);</div><div class='add'>+</div><div class='add'>+				btrfs_set_file_extent_ram_bytes(leaf, fi, size);</div><div class='add'>+				size = btrfs_file_extent_calc_inline_size(size);</div><div class='add'>+				btrfs_truncate_item(trans, path, size, 1);</div><div class='add'>+			} else if (!del_item) {</div><div class='add'>+				/*</div><div class='add'>+				 * We have to bail so the last_size is set to</div><div class='add'>+				 * just before this extent.</div><div class='add'>+				 */</div><div class='add'>+				ret = BTRFS_NEED_TRUNCATE_BLOCK;</div><div class='add'>+				break;</div><div class='add'>+			} else {</div><div class='add'>+				/*</div><div class='add'>+				 * Inline extents are special, we just treat</div><div class='add'>+				 * them as a full sector worth in the file</div><div class='add'>+				 * extent tree just for simplicity sake.</div><div class='add'>+				 */</div><div class='add'>+				clear_len = fs_info-&gt;sectorsize;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			control-&gt;sub_bytes += item_end + 1 - new_size;</div><div class='add'>+		}</div><div class='add'>+delete:</div><div class='add'>+		/*</div><div class='add'>+		 * We only want to clear the file extent range if we're</div><div class='add'>+		 * modifying the actual inode's mapping, which is just the</div><div class='add'>+		 * normal truncate path.</div><div class='add'>+		 */</div><div class='add'>+		if (control-&gt;clear_extent_range) {</div><div class='add'>+			ret = btrfs_inode_clear_file_extent_range(control-&gt;inode,</div><div class='add'>+						  clear_start, clear_len);</div><div class='add'>+			if (unlikely(ret)) {</div><div class='add'>+				btrfs_abort_transaction(trans, ret);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (del_item) {</div><div class='add'>+			ASSERT(!pending_del_nr ||</div><div class='add'>+			       ((path-&gt;slots[0] + 1) == pending_del_slot));</div><div class='add'>+</div><div class='add'>+			control-&gt;last_size = found_key.offset;</div><div class='add'>+			if (!pending_del_nr) {</div><div class='add'>+				/* No pending yet, add ourselves */</div><div class='add'>+				pending_del_slot = path-&gt;slots[0];</div><div class='add'>+				pending_del_nr = 1;</div><div class='add'>+			} else if (path-&gt;slots[0] + 1 == pending_del_slot) {</div><div class='add'>+				/* Hop on the pending chunk */</div><div class='add'>+				pending_del_nr++;</div><div class='add'>+				pending_del_slot = path-&gt;slots[0];</div><div class='add'>+			}</div><div class='add'>+		} else {</div><div class='add'>+			control-&gt;last_size = new_size;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (del_item &amp;&amp; extent_start != 0 &amp;&amp; !control-&gt;skip_ref_updates) {</div><div class='add'>+			struct btrfs_ref ref = {</div><div class='add'>+				.action = BTRFS_DROP_DELAYED_REF,</div><div class='add'>+				.bytenr = extent_start,</div><div class='add'>+				.num_bytes = extent_num_bytes,</div><div class='add'>+				.owning_root = btrfs_root_id(root),</div><div class='add'>+				.ref_root = btrfs_header_owner(leaf),</div><div class='add'>+			};</div><div class='add'>+</div><div class='add'>+			bytes_deleted += extent_num_bytes;</div><div class='add'>+</div><div class='add'>+			btrfs_init_data_ref(&amp;ref, control-&gt;ino, extent_offset,</div><div class='add'>+					    btrfs_root_id(root), false);</div><div class='add'>+			ret = btrfs_free_extent(trans, &amp;ref);</div><div class='add'>+			if (unlikely(ret)) {</div><div class='add'>+				btrfs_abort_transaction(trans, ret);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+			if (be_nice &amp;&amp; btrfs_check_space_for_delayed_refs(fs_info))</div><div class='add'>+				refill_delayed_refs_rsv = true;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (found_type == BTRFS_INODE_ITEM_KEY)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		if (path-&gt;slots[0] == 0 ||</div><div class='add'>+		    path-&gt;slots[0] != pending_del_slot ||</div><div class='add'>+		    refill_delayed_refs_rsv) {</div><div class='add'>+			if (pending_del_nr) {</div><div class='add'>+				ret = btrfs_del_items(trans, root, path,</div><div class='add'>+						pending_del_slot,</div><div class='add'>+						pending_del_nr);</div><div class='add'>+				if (unlikely(ret)) {</div><div class='add'>+					btrfs_abort_transaction(trans, ret);</div><div class='add'>+					break;</div><div class='add'>+				}</div><div class='add'>+				pending_del_nr = 0;</div><div class='add'>+			}</div><div class='add'>+			btrfs_release_path(path);</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * We can generate a lot of delayed refs, so we need to</div><div class='add'>+			 * throttle every once and a while and make sure we're</div><div class='add'>+			 * adding enough space to keep up with the work we are</div><div class='add'>+			 * generating.  Since we hold a transaction here we</div><div class='add'>+			 * can't flush, and we don't want to FLUSH_LIMIT because</div><div class='add'>+			 * we could have generated too many delayed refs to</div><div class='add'>+			 * actually allocate, so just bail if we're short and</div><div class='add'>+			 * let the normal reservation dance happen higher up.</div><div class='add'>+			 */</div><div class='add'>+			if (refill_delayed_refs_rsv) {</div><div class='add'>+				ret = btrfs_delayed_refs_rsv_refill(fs_info,</div><div class='add'>+							BTRFS_RESERVE_NO_FLUSH);</div><div class='add'>+				if (ret) {</div><div class='add'>+					ret = -EAGAIN;</div><div class='add'>+					break;</div><div class='add'>+				}</div><div class='add'>+			}</div><div class='add'>+			goto search_again;</div><div class='add'>+		} else {</div><div class='add'>+			path-&gt;slots[0]--;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='add'>+	if (ret &gt;= 0 &amp;&amp; pending_del_nr) {</div><div class='add'>+		int ret2;</div><div class='add'>+</div><div class='add'>+		ret2 = btrfs_del_items(trans, root, path, pending_del_slot, pending_del_nr);</div><div class='add'>+		if (unlikely(ret2)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret2);</div><div class='add'>+			ret = ret2;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ASSERT(control-&gt;last_size &gt;= new_size);</div><div class='add'>+	if (!ret &amp;&amp; control-&gt;last_size &gt; new_size)</div><div class='add'>+		control-&gt;last_size = new_size;</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/btrfs/inode-item.h b/fs/btrfs/inode-item.h<br/>new file mode 100644<br/>index 000000000000..6d9f5ad20646<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/inode-item.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/inode-item.h</a></div><div class='hunk'>@@ -0,0 +1,116 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+</div><div class='add'>+#ifndef BTRFS_INODE_ITEM_H</div><div class='add'>+#define BTRFS_INODE_ITEM_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+#include &lt;linux/crc32c.h&gt;</div><div class='add'>+</div><div class='add'>+struct fscrypt_str;</div><div class='add'>+struct extent_buffer;</div><div class='add'>+struct btrfs_trans_handle;</div><div class='add'>+struct btrfs_root;</div><div class='add'>+struct btrfs_path;</div><div class='add'>+struct btrfs_key;</div><div class='add'>+struct btrfs_inode_extref;</div><div class='add'>+struct btrfs_inode;</div><div class='add'>+struct btrfs_truncate_control;</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Return this if we need to call truncate_block for the last bit of the</div><div class='add'>+ * truncate.</div><div class='add'>+ */</div><div class='add'>+#define BTRFS_NEED_TRUNCATE_BLOCK		1</div><div class='add'>+</div><div class='add'>+struct btrfs_truncate_control {</div><div class='add'>+	/*</div><div class='add'>+	 * IN: the inode we're operating on, this can be NULL if</div><div class='add'>+	 * -&gt;clear_extent_range is false.</div><div class='add'>+	 */</div><div class='add'>+	struct btrfs_inode *inode;</div><div class='add'>+</div><div class='add'>+	/* IN: the size we're truncating to. */</div><div class='add'>+	u64 new_size;</div><div class='add'>+</div><div class='add'>+	/* OUT: the number of extents truncated. */</div><div class='add'>+	u64 extents_found;</div><div class='add'>+</div><div class='add'>+	/* OUT: the last size we truncated this inode to. */</div><div class='add'>+	u64 last_size;</div><div class='add'>+</div><div class='add'>+	/* OUT: the number of bytes to sub from this inode. */</div><div class='add'>+	u64 sub_bytes;</div><div class='add'>+</div><div class='add'>+	/* IN: the ino we are truncating. */</div><div class='add'>+	u64 ino;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * IN: minimum key type to remove.  All key types with this type are</div><div class='add'>+	 * removed only if their offset &gt;= new_size.</div><div class='add'>+	 */</div><div class='add'>+	u32 min_type;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * IN: true if we don't want to do extent reference updates for any file</div><div class='add'>+	 * extents we drop.</div><div class='add'>+	 */</div><div class='add'>+	bool skip_ref_updates;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * IN: true if we need to clear the file extent range for the inode as</div><div class='add'>+	 * we drop the file extent items.</div><div class='add'>+	 */</div><div class='add'>+	bool clear_extent_range;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * btrfs_inode_item stores flags in a u64, btrfs_inode stores them in two</div><div class='add'>+ * separate u32s. These two functions convert between the two representations.</div><div class='add'>+ */</div><div class='add'>+static inline u64 btrfs_inode_combine_flags(u32 flags, u32 ro_flags)</div><div class='add'>+{</div><div class='add'>+	return (flags | ((u64)ro_flags &lt;&lt; 32));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_inode_split_flags(u64 inode_item_flags,</div><div class='add'>+					   u32 *flags, u32 *ro_flags)</div><div class='add'>+{</div><div class='add'>+	*flags = (u32)inode_item_flags;</div><div class='add'>+	*ro_flags = (u32)(inode_item_flags &gt;&gt; 32);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Figure the key offset of an extended inode ref. */</div><div class='add'>+static inline u64 btrfs_extref_hash(u64 parent_objectid, const char *name, int len)</div><div class='add'>+{</div><div class='add'>+       return (u64)crc32c(parent_objectid, name, len);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_truncate_inode_items(struct btrfs_trans_handle *trans,</div><div class='add'>+			       struct btrfs_root *root,</div><div class='add'>+			       struct btrfs_truncate_control *control);</div><div class='add'>+int btrfs_insert_inode_ref(struct btrfs_trans_handle *trans,</div><div class='add'>+			   struct btrfs_root *root, const struct fscrypt_str *name,</div><div class='add'>+			   u64 inode_objectid, u64 ref_objectid, u64 index);</div><div class='add'>+int btrfs_del_inode_ref(struct btrfs_trans_handle *trans,</div><div class='add'>+			struct btrfs_root *root, const struct fscrypt_str *name,</div><div class='add'>+			u64 inode_objectid, u64 ref_objectid, u64 *index);</div><div class='add'>+int btrfs_insert_empty_inode(struct btrfs_trans_handle *trans,</div><div class='add'>+			     struct btrfs_root *root,</div><div class='add'>+			     struct btrfs_path *path, u64 objectid);</div><div class='add'>+int btrfs_lookup_inode(struct btrfs_trans_handle *trans,</div><div class='add'>+		       struct btrfs_root *root, struct btrfs_path *path,</div><div class='add'>+		       struct btrfs_key *location, int mod);</div><div class='add'>+</div><div class='add'>+struct btrfs_inode_extref *btrfs_lookup_inode_extref(struct btrfs_root *root,</div><div class='add'>+						     struct btrfs_path *path,</div><div class='add'>+						     const struct fscrypt_str *name,</div><div class='add'>+						     u64 inode_objectid, u64 ref_objectid);</div><div class='add'>+</div><div class='add'>+struct btrfs_inode_ref *btrfs_find_name_in_backref(const struct extent_buffer *leaf,</div><div class='add'>+						   int slot,</div><div class='add'>+						   const struct fscrypt_str *name);</div><div class='add'>+struct btrfs_inode_extref *btrfs_find_name_in_ext_backref(</div><div class='add'>+		const struct extent_buffer *leaf, int slot, u64 ref_objectid,</div><div class='add'>+		const struct fscrypt_str *name);</div><div class='add'>+</div><div class='add'>+#endif</div><div class='head'>diff --git a/fs/btrfs/inode.c b/fs/btrfs/inode.c<br/>index b8c911a4a320..c4bee47829ed 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/inode.c</a></div><div class='hunk'>@@ -9,6 +9,7 @@</div><div class='ctx'> #include &lt;linux/blk-cgroup.h&gt;</div><div class='ctx'> #include &lt;linux/file.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/fs_struct.h&gt;</div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='ctx'> #include &lt;linux/highmem.h&gt;</div><div class='ctx'> #include &lt;linux/time.h&gt;</div><div class='hunk'>@@ -32,21 +33,19 @@</div><div class='ctx'> #include &lt;linux/migrate.h&gt;</div><div class='ctx'> #include &lt;linux/sched/mm.h&gt;</div><div class='ctx'> #include &lt;linux/iomap.h&gt;</div><div class='del'>-#include &lt;asm/unaligned.h&gt;</div><div class='add'>+#include &lt;linux/unaligned.h&gt;</div><div class='ctx'> #include &lt;linux/fsverity.h&gt;</div><div class='ctx'> #include "misc.h"</div><div class='ctx'> #include "ctree.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='ctx'> #include "transaction.h"</div><div class='ctx'> #include "btrfs_inode.h"</div><div class='del'>-#include "print-tree.h"</div><div class='ctx'> #include "ordered-data.h"</div><div class='ctx'> #include "xattr.h"</div><div class='ctx'> #include "tree-log.h"</div><div class='del'>-#include "volumes.h"</div><div class='add'>+#include "bio.h"</div><div class='ctx'> #include "compression.h"</div><div class='ctx'> #include "locking.h"</div><div class='del'>-#include "free-space-cache.h"</div><div class='ctx'> #include "props.h"</div><div class='ctx'> #include "qgroup.h"</div><div class='ctx'> #include "delalloc-space.h"</div><div class='hunk'>@@ -54,19 +53,61 @@</div><div class='ctx'> #include "space-info.h"</div><div class='ctx'> #include "zoned.h"</div><div class='ctx'> #include "subpage.h"</div><div class='add'>+#include "inode-item.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "extent-tree.h"</div><div class='add'>+#include "root-tree.h"</div><div class='add'>+#include "defrag.h"</div><div class='add'>+#include "dir-item.h"</div><div class='add'>+#include "file-item.h"</div><div class='add'>+#include "uuid-tree.h"</div><div class='add'>+#include "ioctl.h"</div><div class='add'>+#include "file.h"</div><div class='add'>+#include "acl.h"</div><div class='add'>+#include "relocation.h"</div><div class='add'>+#include "verity.h"</div><div class='add'>+#include "super.h"</div><div class='add'>+#include "orphan.h"</div><div class='add'>+#include "backref.h"</div><div class='add'>+#include "raid-stripe-tree.h"</div><div class='add'>+#include "fiemap.h"</div><div class='add'>+#include "delayed-inode.h"</div><div class='add'>+</div><div class='add'>+#define COW_FILE_RANGE_KEEP_LOCKED	(1UL &lt;&lt; 0)</div><div class='add'>+#define COW_FILE_RANGE_NO_INLINE	(1UL &lt;&lt; 1)</div><div class='ctx'> </div><div class='ctx'> struct btrfs_iget_args {</div><div class='ctx'> 	u64 ino;</div><div class='ctx'> 	struct btrfs_root *root;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-struct btrfs_dio_data {</div><div class='del'>-	u64 reserve;</div><div class='del'>-	loff_t length;</div><div class='del'>-	ssize_t submitted;</div><div class='del'>-	struct extent_changeset *data_reserved;</div><div class='add'>+struct btrfs_rename_ctx {</div><div class='add'>+	/* Output field. Stores the index number of the old directory entry. */</div><div class='add'>+	u64 index;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Used by data_reloc_print_warning_inode() to pass needed info for filename</div><div class='add'>+ * resolution and output of error message.</div><div class='add'>+ */</div><div class='add'>+struct data_reloc_warn {</div><div class='add'>+	struct btrfs_path path;</div><div class='add'>+	struct btrfs_fs_info *fs_info;</div><div class='add'>+	u64 extent_item_size;</div><div class='add'>+	u64 logical;</div><div class='add'>+	int mirror_num;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * For the file_extent_tree, we want to hold the inode lock when we lookup and</div><div class='add'>+ * update the disk_i_size, but lockdep will complain because our io_tree we hold</div><div class='add'>+ * the tree lock and get the inode lock when setting delalloc. These two things</div><div class='add'>+ * are unrelated, so make a class for the file_extent_tree so we don't get the</div><div class='add'>+ * two locking patterns mixed up.</div><div class='add'>+ */</div><div class='add'>+static struct lock_class_key file_extent_tree_class;</div><div class='add'>+</div><div class='ctx'> static const struct inode_operations btrfs_dir_inode_operations;</div><div class='ctx'> static const struct inode_operations btrfs_symlink_inode_operations;</div><div class='ctx'> static const struct inode_operations btrfs_special_inode_operations;</div><div class='hunk'>@@ -75,30 +116,229 @@ static const struct address_space_operations btrfs_aops;</div><div class='ctx'> static const struct file_operations btrfs_dir_file_operations;</div><div class='ctx'> </div><div class='ctx'> static struct kmem_cache *btrfs_inode_cachep;</div><div class='del'>-struct kmem_cache *btrfs_trans_handle_cachep;</div><div class='del'>-struct kmem_cache *btrfs_path_cachep;</div><div class='del'>-struct kmem_cache *btrfs_free_space_cachep;</div><div class='del'>-struct kmem_cache *btrfs_free_space_bitmap_cachep;</div><div class='ctx'> </div><div class='ctx'> static int btrfs_setsize(struct inode *inode, struct iattr *attr);</div><div class='del'>-static int btrfs_truncate(struct inode *inode, bool skip_writeback);</div><div class='del'>-static int btrfs_finish_ordered_io(struct btrfs_ordered_extent *ordered_extent);</div><div class='del'>-static noinline int cow_file_range(struct btrfs_inode *inode,</div><div class='del'>-				   struct page *locked_page,</div><div class='del'>-				   u64 start, u64 end, int *page_started,</div><div class='del'>-				   unsigned long *nr_written, int unlock);</div><div class='del'>-static struct extent_map *create_io_em(struct btrfs_inode *inode, u64 start,</div><div class='del'>-				       u64 len, u64 orig_start, u64 block_start,</div><div class='del'>-				       u64 block_len, u64 orig_block_len,</div><div class='del'>-				       u64 ram_bytes, int compress_type,</div><div class='del'>-				       int type);</div><div class='del'>-</div><div class='del'>-static void __endio_write_update_ordered(struct btrfs_inode *inode,</div><div class='del'>-					 const u64 offset, const u64 bytes,</div><div class='del'>-					 const bool uptodate);</div><div class='add'>+static int btrfs_truncate(struct btrfs_inode *inode, bool skip_writeback);</div><div class='add'>+</div><div class='add'>+static noinline int run_delalloc_cow(struct btrfs_inode *inode,</div><div class='add'>+				     struct folio *locked_folio, u64 start,</div><div class='add'>+				     u64 end, struct writeback_control *wbc,</div><div class='add'>+				     bool pages_dirty);</div><div class='add'>+</div><div class='add'>+static int data_reloc_print_warning_inode(u64 inum, u64 offset, u64 num_bytes,</div><div class='add'>+					  u64 root, void *warn_ctx)</div><div class='add'>+{</div><div class='add'>+	struct data_reloc_warn *warn = warn_ctx;</div><div class='add'>+	struct btrfs_fs_info *fs_info = warn-&gt;fs_info;</div><div class='add'>+	struct extent_buffer *eb;</div><div class='add'>+	struct btrfs_inode_item *inode_item;</div><div class='add'>+	struct inode_fs_paths *ipath __free(inode_fs_paths) = NULL;</div><div class='add'>+	struct btrfs_root *local_root;</div><div class='add'>+	struct btrfs_key key;</div><div class='add'>+	unsigned int nofs_flag;</div><div class='add'>+	u32 nlink;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	local_root = btrfs_get_fs_root(fs_info, root, true);</div><div class='add'>+	if (IS_ERR(local_root)) {</div><div class='add'>+		ret = PTR_ERR(local_root);</div><div class='add'>+		goto err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* This makes the path point to (inum INODE_ITEM ioff). */</div><div class='add'>+	key.objectid = inum;</div><div class='add'>+	key.type = BTRFS_INODE_ITEM_KEY;</div><div class='add'>+	key.offset = 0;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_search_slot(NULL, local_root, &amp;key, &amp;warn-&gt;path, 0, 0);</div><div class='add'>+	if (ret) {</div><div class='add'>+		btrfs_put_root(local_root);</div><div class='add'>+		btrfs_release_path(&amp;warn-&gt;path);</div><div class='add'>+		goto err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	eb = warn-&gt;path.nodes[0];</div><div class='add'>+	inode_item = btrfs_item_ptr(eb, warn-&gt;path.slots[0], struct btrfs_inode_item);</div><div class='add'>+	nlink = btrfs_inode_nlink(eb, inode_item);</div><div class='add'>+	btrfs_release_path(&amp;warn-&gt;path);</div><div class='add'>+</div><div class='add'>+	nofs_flag = memalloc_nofs_save();</div><div class='add'>+	ipath = init_ipath(4096, local_root, &amp;warn-&gt;path);</div><div class='add'>+	memalloc_nofs_restore(nofs_flag);</div><div class='add'>+	if (IS_ERR(ipath)) {</div><div class='add'>+		btrfs_put_root(local_root);</div><div class='add'>+		ret = PTR_ERR(ipath);</div><div class='add'>+		ipath = NULL;</div><div class='add'>+		/*</div><div class='add'>+		 * -ENOMEM, not a critical error, just output an generic error</div><div class='add'>+		 * without filename.</div><div class='add'>+		 */</div><div class='add'>+		btrfs_warn(fs_info,</div><div class='add'>+"checksum error at logical %llu mirror %u root %llu, inode %llu offset %llu",</div><div class='add'>+			   warn-&gt;logical, warn-&gt;mirror_num, root, inum, offset);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+	ret = paths_from_inode(inum, ipath);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		btrfs_put_root(local_root);</div><div class='add'>+		goto err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We deliberately ignore the bit ipath might have been too small to</div><div class='add'>+	 * hold all of the paths here</div><div class='add'>+	 */</div><div class='add'>+	for (int i = 0; i &lt; ipath-&gt;fspath-&gt;elem_cnt; i++) {</div><div class='add'>+		btrfs_warn(fs_info,</div><div class='add'>+"checksum error at logical %llu mirror %u root %llu inode %llu offset %llu length %u links %u (path: %s)",</div><div class='add'>+			   warn-&gt;logical, warn-&gt;mirror_num, root, inum, offset,</div><div class='add'>+			   fs_info-&gt;sectorsize, nlink,</div><div class='add'>+			   (char *)(unsigned long)ipath-&gt;fspath-&gt;val[i]);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	btrfs_put_root(local_root);</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+err:</div><div class='add'>+	btrfs_warn(fs_info,</div><div class='add'>+"checksum error at logical %llu mirror %u root %llu inode %llu offset %llu, path resolving failed with ret=%d",</div><div class='add'>+		   warn-&gt;logical, warn-&gt;mirror_num, root, inum, offset, ret);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * btrfs_inode_lock - lock inode i_rwsem based on arguments passed</div><div class='add'>+ * Do extra user-friendly error output (e.g. lookup all the affected files).</div><div class='add'>+ *</div><div class='add'>+ * Return true if we succeeded doing the backref lookup.</div><div class='add'>+ * Return false if such lookup failed, and has to fallback to the old error message.</div><div class='add'>+ */</div><div class='add'>+static void print_data_reloc_error(const struct btrfs_inode *inode, u64 file_off,</div><div class='add'>+				   const u8 *csum, const u8 *csum_expected,</div><div class='add'>+				   int mirror_num)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	struct btrfs_path path = { 0 };</div><div class='add'>+	struct btrfs_key found_key = { 0 };</div><div class='add'>+	struct extent_buffer *eb;</div><div class='add'>+	struct btrfs_extent_item *ei;</div><div class='add'>+	const u32 csum_size = fs_info-&gt;csum_size;</div><div class='add'>+	u64 logical;</div><div class='add'>+	u64 flags;</div><div class='add'>+	u32 item_size;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;fs_info-&gt;reloc_mutex);</div><div class='add'>+	logical = btrfs_get_reloc_bg_bytenr(fs_info);</div><div class='add'>+	mutex_unlock(&amp;fs_info-&gt;reloc_mutex);</div><div class='add'>+</div><div class='add'>+	if (logical == U64_MAX) {</div><div class='add'>+		btrfs_warn_rl(fs_info, "has data reloc tree but no running relocation");</div><div class='add'>+		btrfs_warn_rl(fs_info,</div><div class='add'>+"csum failed root %lld ino %llu off %llu csum " BTRFS_CSUM_FMT " expected csum " BTRFS_CSUM_FMT " mirror %d",</div><div class='add'>+			btrfs_root_id(inode-&gt;root), btrfs_ino(inode), file_off,</div><div class='add'>+			BTRFS_CSUM_FMT_VALUE(csum_size, csum),</div><div class='add'>+			BTRFS_CSUM_FMT_VALUE(csum_size, csum_expected),</div><div class='add'>+			mirror_num);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	logical += file_off;</div><div class='add'>+	btrfs_warn_rl(fs_info,</div><div class='add'>+"csum failed root %lld ino %llu off %llu logical %llu csum " BTRFS_CSUM_FMT " expected csum " BTRFS_CSUM_FMT " mirror %d",</div><div class='add'>+			btrfs_root_id(inode-&gt;root),</div><div class='add'>+			btrfs_ino(inode), file_off, logical,</div><div class='add'>+			BTRFS_CSUM_FMT_VALUE(csum_size, csum),</div><div class='add'>+			BTRFS_CSUM_FMT_VALUE(csum_size, csum_expected),</div><div class='add'>+			mirror_num);</div><div class='add'>+</div><div class='add'>+	ret = extent_from_logical(fs_info, logical, &amp;path, &amp;found_key, &amp;flags);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		btrfs_err_rl(fs_info, "failed to lookup extent item for logical %llu: %d",</div><div class='add'>+			     logical, ret);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+	eb = path.nodes[0];</div><div class='add'>+	ei = btrfs_item_ptr(eb, path.slots[0], struct btrfs_extent_item);</div><div class='add'>+	item_size = btrfs_item_size(eb, path.slots[0]);</div><div class='add'>+	if (flags &amp; BTRFS_EXTENT_FLAG_TREE_BLOCK) {</div><div class='add'>+		unsigned long ptr = 0;</div><div class='add'>+		u64 ref_root;</div><div class='add'>+		u8 ref_level;</div><div class='add'>+</div><div class='add'>+		while (true) {</div><div class='add'>+			ret = tree_backref_for_extent(&amp;ptr, eb, &amp;found_key, ei,</div><div class='add'>+						      item_size, &amp;ref_root,</div><div class='add'>+						      &amp;ref_level);</div><div class='add'>+			if (ret &lt; 0) {</div><div class='add'>+				btrfs_warn_rl(fs_info,</div><div class='add'>+				"failed to resolve tree backref for logical %llu: %d",</div><div class='add'>+					      logical, ret);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+			if (ret &gt; 0)</div><div class='add'>+				break;</div><div class='add'>+</div><div class='add'>+			btrfs_warn_rl(fs_info,</div><div class='add'>+"csum error at logical %llu mirror %u: metadata %s (level %d) in tree %llu",</div><div class='add'>+				logical, mirror_num,</div><div class='add'>+				(ref_level ? "node" : "leaf"),</div><div class='add'>+				ref_level, ref_root);</div><div class='add'>+		}</div><div class='add'>+		btrfs_release_path(&amp;path);</div><div class='add'>+	} else {</div><div class='add'>+		struct btrfs_backref_walk_ctx ctx = { 0 };</div><div class='add'>+		struct data_reloc_warn reloc_warn = { 0 };</div><div class='add'>+</div><div class='add'>+		btrfs_release_path(&amp;path);</div><div class='add'>+</div><div class='add'>+		ctx.bytenr = found_key.objectid;</div><div class='add'>+		ctx.extent_item_pos = logical - found_key.objectid;</div><div class='add'>+		ctx.fs_info = fs_info;</div><div class='add'>+</div><div class='add'>+		reloc_warn.logical = logical;</div><div class='add'>+		reloc_warn.extent_item_size = found_key.offset;</div><div class='add'>+		reloc_warn.mirror_num = mirror_num;</div><div class='add'>+		reloc_warn.fs_info = fs_info;</div><div class='add'>+</div><div class='add'>+		iterate_extent_inodes(&amp;ctx, true,</div><div class='add'>+				      data_reloc_print_warning_inode, &amp;reloc_warn);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void __cold btrfs_print_data_csum_error(struct btrfs_inode *inode,</div><div class='add'>+		u64 logical_start, u8 *csum, u8 *csum_expected, int mirror_num)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	const u32 csum_size = root-&gt;fs_info-&gt;csum_size;</div><div class='add'>+</div><div class='add'>+	/* For data reloc tree, it's better to do a backref lookup instead. */</div><div class='add'>+	if (btrfs_is_data_reloc_root(root))</div><div class='add'>+		return print_data_reloc_error(inode, logical_start, csum,</div><div class='add'>+					      csum_expected, mirror_num);</div><div class='add'>+</div><div class='add'>+	/* Output without objectid, which is more meaningful */</div><div class='add'>+	if (btrfs_root_id(root) &gt;= BTRFS_LAST_FREE_OBJECTID) {</div><div class='add'>+		btrfs_warn_rl(root-&gt;fs_info,</div><div class='add'>+"csum failed root %lld ino %lld off %llu csum " BTRFS_CSUM_FMT " expected csum " BTRFS_CSUM_FMT " mirror %d",</div><div class='add'>+			btrfs_root_id(root), btrfs_ino(inode),</div><div class='add'>+			logical_start,</div><div class='add'>+			BTRFS_CSUM_FMT_VALUE(csum_size, csum),</div><div class='add'>+			BTRFS_CSUM_FMT_VALUE(csum_size, csum_expected),</div><div class='add'>+			mirror_num);</div><div class='add'>+	} else {</div><div class='add'>+		btrfs_warn_rl(root-&gt;fs_info,</div><div class='add'>+"csum failed root %llu ino %llu off %llu csum " BTRFS_CSUM_FMT " expected csum " BTRFS_CSUM_FMT " mirror %d",</div><div class='add'>+			btrfs_root_id(root), btrfs_ino(inode),</div><div class='add'>+			logical_start,</div><div class='add'>+			BTRFS_CSUM_FMT_VALUE(csum_size, csum),</div><div class='add'>+			BTRFS_CSUM_FMT_VALUE(csum_size, csum_expected),</div><div class='add'>+			mirror_num);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Lock inode i_rwsem based on arguments passed.</div><div class='ctx'>  *</div><div class='ctx'>  * ilock_flags can have the following bit set:</div><div class='ctx'>  *</div><div class='hunk'>@@ -107,44 +347,44 @@ static void __endio_write_update_ordered(struct btrfs_inode *inode,</div><div class='ctx'>  *		     return -EAGAIN</div><div class='ctx'>  * BTRFS_ILOCK_MMAP - acquire a write lock on the i_mmap_lock</div><div class='ctx'>  */</div><div class='del'>-int btrfs_inode_lock(struct inode *inode, unsigned int ilock_flags)</div><div class='add'>+int btrfs_inode_lock(struct btrfs_inode *inode, unsigned int ilock_flags)</div><div class='ctx'> {</div><div class='ctx'> 	if (ilock_flags &amp; BTRFS_ILOCK_SHARED) {</div><div class='ctx'> 		if (ilock_flags &amp; BTRFS_ILOCK_TRY) {</div><div class='del'>-			if (!inode_trylock_shared(inode))</div><div class='add'>+			if (!inode_trylock_shared(&amp;inode-&gt;vfs_inode))</div><div class='ctx'> 				return -EAGAIN;</div><div class='ctx'> 			else</div><div class='ctx'> 				return 0;</div><div class='ctx'> 		}</div><div class='del'>-		inode_lock_shared(inode);</div><div class='add'>+		inode_lock_shared(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		if (ilock_flags &amp; BTRFS_ILOCK_TRY) {</div><div class='del'>-			if (!inode_trylock(inode))</div><div class='add'>+			if (!inode_trylock(&amp;inode-&gt;vfs_inode))</div><div class='ctx'> 				return -EAGAIN;</div><div class='ctx'> 			else</div><div class='ctx'> 				return 0;</div><div class='ctx'> 		}</div><div class='del'>-		inode_lock(inode);</div><div class='add'>+		inode_lock(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (ilock_flags &amp; BTRFS_ILOCK_MMAP)</div><div class='del'>-		down_write(&amp;BTRFS_I(inode)-&gt;i_mmap_lock);</div><div class='add'>+		down_write(&amp;inode-&gt;i_mmap_lock);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * btrfs_inode_unlock - unock inode i_rwsem</div><div class='add'>+ * Unlock inode i_rwsem.</div><div class='ctx'>  *</div><div class='ctx'>  * ilock_flags should contain the same bits set as passed to btrfs_inode_lock()</div><div class='ctx'>  * to decide whether the lock acquired is shared or exclusive.</div><div class='ctx'>  */</div><div class='del'>-void btrfs_inode_unlock(struct inode *inode, unsigned int ilock_flags)</div><div class='add'>+void btrfs_inode_unlock(struct btrfs_inode *inode, unsigned int ilock_flags)</div><div class='ctx'> {</div><div class='ctx'> 	if (ilock_flags &amp; BTRFS_ILOCK_MMAP)</div><div class='del'>-		up_write(&amp;BTRFS_I(inode)-&gt;i_mmap_lock);</div><div class='add'>+		up_write(&amp;inode-&gt;i_mmap_lock);</div><div class='ctx'> 	if (ilock_flags &amp; BTRFS_ILOCK_SHARED)</div><div class='del'>-		inode_unlock_shared(inode);</div><div class='add'>+		inode_unlock_shared(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> 	else</div><div class='del'>-		inode_unlock(inode);</div><div class='add'>+		inode_unlock(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -158,75 +398,55 @@ void btrfs_inode_unlock(struct inode *inode, unsigned int ilock_flags)</div><div class='ctx'>  * extent (btrfs_finish_ordered_io()).</div><div class='ctx'>  */</div><div class='ctx'> static inline void btrfs_cleanup_ordered_extents(struct btrfs_inode *inode,</div><div class='del'>-						 struct page *locked_page,</div><div class='ctx'> 						 u64 offset, u64 bytes)</div><div class='ctx'> {</div><div class='del'>-	unsigned long index = offset &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	unsigned long end_index = (offset + bytes - 1) &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	u64 page_start = page_offset(locked_page);</div><div class='del'>-	u64 page_end = page_start + PAGE_SIZE - 1;</div><div class='del'>-</div><div class='del'>-	struct page *page;</div><div class='add'>+	pgoff_t index = offset &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	const pgoff_t end_index = (offset + bytes - 1) &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> </div><div class='ctx'> 	while (index &lt;= end_index) {</div><div class='del'>-		/*</div><div class='del'>-		 * For locked page, we will call end_extent_writepage() on it</div><div class='del'>-		 * in run_delalloc_range() for the error handling.  That</div><div class='del'>-		 * end_extent_writepage() function will call</div><div class='del'>-		 * btrfs_mark_ordered_io_finished() to clear page Ordered and</div><div class='del'>-		 * run the ordered extent accounting.</div><div class='del'>-		 *</div><div class='del'>-		 * Here we can't just clear the Ordered bit, or</div><div class='del'>-		 * btrfs_mark_ordered_io_finished() would skip the accounting</div><div class='del'>-		 * for the page range, and the ordered extent will never finish.</div><div class='del'>-		 */</div><div class='del'>-		if (index == (page_offset(locked_page) &gt;&gt; PAGE_SHIFT)) {</div><div class='add'>+		folio = filemap_get_folio(inode-&gt;vfs_inode.i_mapping, index);</div><div class='add'>+		if (IS_ERR(folio)) {</div><div class='ctx'> 			index++;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='del'>-		page = find_get_page(inode-&gt;vfs_inode.i_mapping, index);</div><div class='del'>-		index++;</div><div class='del'>-		if (!page)</div><div class='del'>-			continue;</div><div class='ctx'> </div><div class='add'>+		index = folio_next_index(folio);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Here we just clear all Ordered bits for every page in the</div><div class='del'>-		 * range, then __endio_write_update_ordered() will handle</div><div class='add'>+		 * range, then btrfs_mark_ordered_io_finished() will handle</div><div class='ctx'> 		 * the ordered extent accounting for the range.</div><div class='ctx'> 		 */</div><div class='del'>-		btrfs_page_clamp_clear_ordered(inode-&gt;root-&gt;fs_info, page,</div><div class='del'>-					       offset, bytes);</div><div class='del'>-		put_page(page);</div><div class='add'>+		btrfs_folio_clamp_clear_ordered(inode-&gt;root-&gt;fs_info, folio,</div><div class='add'>+						offset, bytes);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* The locked page covers the full range, nothing needs to be done */</div><div class='del'>-	if (bytes + offset &lt;= page_offset(locked_page) + PAGE_SIZE)</div><div class='del'>-		return;</div><div class='del'>-	/*</div><div class='del'>-	 * In case this page belongs to the delalloc range being instantiated</div><div class='del'>-	 * then skip it, since the first page of a range is going to be</div><div class='del'>-	 * properly cleaned up by the caller of run_delalloc_range</div><div class='del'>-	 */</div><div class='del'>-	if (page_start &gt;= offset &amp;&amp; page_end &lt;= (offset + bytes - 1)) {</div><div class='del'>-		bytes = offset + bytes - page_offset(locked_page) - PAGE_SIZE;</div><div class='del'>-		offset = page_offset(locked_page) + PAGE_SIZE;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return __endio_write_update_ordered(inode, offset, bytes, false);</div><div class='add'>+	return btrfs_mark_ordered_io_finished(inode, NULL, offset, bytes, false);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btrfs_dirty_inode(struct inode *inode);</div><div class='add'>+static int btrfs_dirty_inode(struct btrfs_inode *inode);</div><div class='ctx'> </div><div class='ctx'> static int btrfs_init_inode_security(struct btrfs_trans_handle *trans,</div><div class='del'>-				     struct inode *inode,  struct inode *dir,</div><div class='del'>-				     const struct qstr *qstr)</div><div class='add'>+				     struct btrfs_new_inode_args *args)</div><div class='ctx'> {</div><div class='del'>-	int err;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	err = btrfs_init_acl(trans, inode, dir);</div><div class='del'>-	if (!err)</div><div class='del'>-		err = btrfs_xattr_security_init(trans, inode, dir, qstr);</div><div class='del'>-	return err;</div><div class='add'>+	if (args-&gt;default_acl) {</div><div class='add'>+		ret = __btrfs_set_acl(trans, args-&gt;inode, args-&gt;default_acl,</div><div class='add'>+				      ACL_TYPE_DEFAULT);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+	if (args-&gt;acl) {</div><div class='add'>+		ret = __btrfs_set_acl(trans, args-&gt;inode, args-&gt;acl, ACL_TYPE_ACCESS);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+	if (!args-&gt;default_acl &amp;&amp; !args-&gt;acl)</div><div class='add'>+		cache_no_acl(args-&gt;inode);</div><div class='add'>+	return btrfs_xattr_security_init(trans, args-&gt;inode, args-&gt;dir,</div><div class='add'>+					 &amp;args-&gt;dentry-&gt;d_name);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -235,34 +455,49 @@ static int btrfs_init_inode_security(struct btrfs_trans_handle *trans,</div><div class='ctx'>  * no overlapping inline items exist in the btree</div><div class='ctx'>  */</div><div class='ctx'> static int insert_inline_extent(struct btrfs_trans_handle *trans,</div><div class='del'>-				struct btrfs_path *path, bool extent_inserted,</div><div class='del'>-				struct btrfs_root *root, struct inode *inode,</div><div class='del'>-				u64 start, size_t size, size_t compressed_size,</div><div class='add'>+				struct btrfs_path *path,</div><div class='add'>+				struct btrfs_inode *inode, bool extent_inserted,</div><div class='add'>+				size_t size, size_t compressed_size,</div><div class='ctx'> 				int compress_type,</div><div class='del'>-				struct page **compressed_pages)</div><div class='add'>+				struct folio *compressed_folio,</div><div class='add'>+				bool update_i_size)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='del'>-	struct page *page = NULL;</div><div class='add'>+	const u32 sectorsize = trans-&gt;fs_info-&gt;sectorsize;</div><div class='ctx'> 	char *kaddr;</div><div class='ctx'> 	unsigned long ptr;</div><div class='ctx'> 	struct btrfs_file_extent_item *ei;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	size_t cur_size = size;</div><div class='del'>-	unsigned long offset;</div><div class='add'>+	u64 i_size;</div><div class='ctx'> </div><div class='del'>-	ASSERT((compressed_size &gt; 0 &amp;&amp; compressed_pages) ||</div><div class='del'>-	       (compressed_size == 0 &amp;&amp; !compressed_pages));</div><div class='add'>+	/*</div><div class='add'>+	 * The decompressed size must still be no larger than a sector.  Under</div><div class='add'>+	 * heavy race, we can have size == 0 passed in, but that shouldn't be a</div><div class='add'>+	 * big deal and we can continue the insertion.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(size &lt;= sectorsize);</div><div class='ctx'> </div><div class='del'>-	if (compressed_size &amp;&amp; compressed_pages)</div><div class='add'>+	/*</div><div class='add'>+	 * The compressed size also needs to be no larger than a sector.</div><div class='add'>+	 * That's also why we only need one page as the parameter.</div><div class='add'>+	 */</div><div class='add'>+	if (compressed_folio)</div><div class='add'>+		ASSERT(compressed_size &lt;= sectorsize);</div><div class='add'>+	else</div><div class='add'>+		ASSERT(compressed_size == 0);</div><div class='add'>+</div><div class='add'>+	if (compressed_size &amp;&amp; compressed_folio)</div><div class='ctx'> 		cur_size = compressed_size;</div><div class='ctx'> </div><div class='ctx'> 	if (!extent_inserted) {</div><div class='ctx'> 		struct btrfs_key key;</div><div class='ctx'> 		size_t datasize;</div><div class='ctx'> </div><div class='del'>-		key.objectid = btrfs_ino(BTRFS_I(inode));</div><div class='del'>-		key.offset = start;</div><div class='add'>+		key.objectid = btrfs_ino(inode);</div><div class='ctx'> 		key.type = BTRFS_EXTENT_DATA_KEY;</div><div class='add'>+		key.offset = 0;</div><div class='ctx'> </div><div class='ctx'> 		datasize = btrfs_file_extent_calc_inline_size(cur_size);</div><div class='ctx'> 		ret = btrfs_insert_empty_item(trans, root, path, &amp;key,</div><div class='hunk'>@@ -281,95 +516,112 @@ static int insert_inline_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	ptr = btrfs_file_extent_inline_start(ei);</div><div class='ctx'> </div><div class='ctx'> 	if (compress_type != BTRFS_COMPRESS_NONE) {</div><div class='del'>-		struct page *cpage;</div><div class='del'>-		int i = 0;</div><div class='del'>-		while (compressed_size &gt; 0) {</div><div class='del'>-			cpage = compressed_pages[i];</div><div class='del'>-			cur_size = min_t(unsigned long, compressed_size,</div><div class='del'>-				       PAGE_SIZE);</div><div class='add'>+		kaddr = kmap_local_folio(compressed_folio, 0);</div><div class='add'>+		write_extent_buffer(leaf, kaddr, ptr, compressed_size);</div><div class='add'>+		kunmap_local(kaddr);</div><div class='ctx'> </div><div class='del'>-			kaddr = kmap_atomic(cpage);</div><div class='del'>-			write_extent_buffer(leaf, kaddr, ptr, cur_size);</div><div class='del'>-			kunmap_atomic(kaddr);</div><div class='del'>-</div><div class='del'>-			i++;</div><div class='del'>-			ptr += cur_size;</div><div class='del'>-			compressed_size -= cur_size;</div><div class='del'>-		}</div><div class='ctx'> 		btrfs_set_file_extent_compression(leaf, ei,</div><div class='ctx'> 						  compress_type);</div><div class='ctx'> 	} else {</div><div class='del'>-		page = find_get_page(inode-&gt;i_mapping,</div><div class='del'>-				     start &gt;&gt; PAGE_SHIFT);</div><div class='add'>+		struct folio *folio;</div><div class='add'>+</div><div class='add'>+		folio = filemap_get_folio(inode-&gt;vfs_inode.i_mapping, 0);</div><div class='add'>+		ASSERT(!IS_ERR(folio));</div><div class='ctx'> 		btrfs_set_file_extent_compression(leaf, ei, 0);</div><div class='del'>-		kaddr = kmap_atomic(page);</div><div class='del'>-		offset = offset_in_page(start);</div><div class='del'>-		write_extent_buffer(leaf, kaddr + offset, ptr, size);</div><div class='del'>-		kunmap_atomic(kaddr);</div><div class='del'>-		put_page(page);</div><div class='add'>+		kaddr = kmap_local_folio(folio, 0);</div><div class='add'>+		write_extent_buffer(leaf, kaddr, ptr, size);</div><div class='add'>+		kunmap_local(kaddr);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We align size to sectorsize for inline extents just for simplicity</div><div class='ctx'> 	 * sake.</div><div class='ctx'> 	 */</div><div class='del'>-	size = ALIGN(size, root-&gt;fs_info-&gt;sectorsize);</div><div class='del'>-	ret = btrfs_inode_set_file_extent_range(BTRFS_I(inode), start, size);</div><div class='add'>+	ret = btrfs_inode_set_file_extent_range(inode, 0,</div><div class='add'>+					ALIGN(size, root-&gt;fs_info-&gt;sectorsize));</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * we're an inline extent, so nobody can</div><div class='del'>-	 * extend the file past i_size without locking</div><div class='del'>-	 * a page we already have locked.</div><div class='add'>+	 * We're an inline extent, so nobody can extend the file past i_size</div><div class='add'>+	 * without locking a page we already have locked.</div><div class='ctx'> 	 *</div><div class='del'>-	 * We must do any isize and inode updates</div><div class='del'>-	 * before we unlock the pages.  Otherwise we</div><div class='del'>-	 * could end up racing with unlink.</div><div class='add'>+	 * We must do any i_size and inode updates before we unlock the pages.</div><div class='add'>+	 * Otherwise we could end up racing with unlink.</div><div class='ctx'> 	 */</div><div class='del'>-	BTRFS_I(inode)-&gt;disk_i_size = inode-&gt;i_size;</div><div class='add'>+	i_size = i_size_read(&amp;inode-&gt;vfs_inode);</div><div class='add'>+	if (update_i_size &amp;&amp; size &gt; i_size) {</div><div class='add'>+		i_size_write(&amp;inode-&gt;vfs_inode, size);</div><div class='add'>+		i_size = size;</div><div class='add'>+	}</div><div class='add'>+	inode-&gt;disk_i_size = i_size;</div><div class='add'>+</div><div class='ctx'> fail:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool can_cow_file_range_inline(struct btrfs_inode *inode,</div><div class='add'>+				      u64 offset, u64 size,</div><div class='add'>+				      size_t compressed_size)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	u64 data_len = (compressed_size ?: size);</div><div class='add'>+</div><div class='add'>+	/* Inline extents must start at offset 0. */</div><div class='add'>+	if (offset != 0)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/* Inline extents are limited to sectorsize. */</div><div class='add'>+	if (size &gt; fs_info-&gt;sectorsize)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/* We do not allow a non-compressed extent to be as large as block size. */</div><div class='add'>+	if (data_len &gt;= fs_info-&gt;sectorsize)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/* We cannot exceed the maximum inline data size. */</div><div class='add'>+	if (data_len &gt; BTRFS_MAX_INLINE_DATA_SIZE(fs_info))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/* We cannot exceed the user specified max_inline size. */</div><div class='add'>+	if (data_len &gt; fs_info-&gt;max_inline)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/* Inline extents must be the entirety of the file. */</div><div class='add'>+	if (size &lt; i_size_read(&amp;inode-&gt;vfs_inode))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/* Encrypted file cannot be inlined. */</div><div class='add'>+	if (IS_ENCRYPTED(&amp;inode-&gt;vfs_inode))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * conditionally insert an inline extent into the file.  This</div><div class='ctx'>  * does the checks required to make sure the data is small enough</div><div class='ctx'>  * to fit as an inline extent.</div><div class='add'>+ *</div><div class='add'>+ * If being used directly, you must have already checked we're allowed to cow</div><div class='add'>+ * the range by getting true from can_cow_file_range_inline().</div><div class='ctx'>  */</div><div class='del'>-static noinline int cow_file_range_inline(struct btrfs_inode *inode, u64 start,</div><div class='del'>-					  u64 end, size_t compressed_size,</div><div class='del'>-					  int compress_type,</div><div class='del'>-					  struct page **compressed_pages)</div><div class='add'>+static noinline int __cow_file_range_inline(struct btrfs_inode *inode,</div><div class='add'>+					    u64 size, size_t compressed_size,</div><div class='add'>+					    int compress_type,</div><div class='add'>+					    struct folio *compressed_folio,</div><div class='add'>+					    bool update_i_size)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_drop_extents_args drop_args = { 0 };</div><div class='ctx'> 	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='del'>-	u64 isize = i_size_read(&amp;inode-&gt;vfs_inode);</div><div class='del'>-	u64 actual_end = min(end + 1, isize);</div><div class='del'>-	u64 inline_len = actual_end - start;</div><div class='del'>-	u64 aligned_end = ALIGN(end, fs_info-&gt;sectorsize);</div><div class='del'>-	u64 data_len = inline_len;</div><div class='add'>+	u64 data_len = (compressed_size ?: size);</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct btrfs_path *path;</div><div class='ctx'> </div><div class='del'>-	if (compressed_size)</div><div class='del'>-		data_len = compressed_size;</div><div class='del'>-</div><div class='del'>-	if (start &gt; 0 ||</div><div class='del'>-	    actual_end &gt; fs_info-&gt;sectorsize ||</div><div class='del'>-	    data_len &gt; BTRFS_MAX_INLINE_DATA_SIZE(fs_info) ||</div><div class='del'>-	    (!compressed_size &amp;&amp;</div><div class='del'>-	    (actual_end &amp; (fs_info-&gt;sectorsize - 1)) == 0) ||</div><div class='del'>-	    end + 1 &lt; isize ||</div><div class='del'>-	    data_len &gt; fs_info-&gt;max_inline) {</div><div class='del'>-		return 1;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='hunk'>@@ -382,31 +634,21 @@ static noinline int cow_file_range_inline(struct btrfs_inode *inode, u64 start,</div><div class='ctx'> 	trans-&gt;block_rsv = &amp;inode-&gt;block_rsv;</div><div class='ctx'> </div><div class='ctx'> 	drop_args.path = path;</div><div class='del'>-	drop_args.start = start;</div><div class='del'>-	drop_args.end = aligned_end;</div><div class='add'>+	drop_args.start = 0;</div><div class='add'>+	drop_args.end = fs_info-&gt;sectorsize;</div><div class='ctx'> 	drop_args.drop_cache = true;</div><div class='ctx'> 	drop_args.replace_extent = true;</div><div class='del'>-</div><div class='del'>-	if (compressed_size &amp;&amp; compressed_pages)</div><div class='del'>-		drop_args.extent_item_size = btrfs_file_extent_calc_inline_size(</div><div class='del'>-		   compressed_size);</div><div class='del'>-	else</div><div class='del'>-		drop_args.extent_item_size = btrfs_file_extent_calc_inline_size(</div><div class='del'>-		    inline_len);</div><div class='del'>-</div><div class='add'>+	drop_args.extent_item_size = btrfs_file_extent_calc_inline_size(data_len);</div><div class='ctx'> 	ret = btrfs_drop_extents(trans, root, inode, &amp;drop_args);</div><div class='del'>-	if (ret) {</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (isize &gt; actual_end)</div><div class='del'>-		inline_len = min_t(u64, isize, actual_end);</div><div class='del'>-	ret = insert_inline_extent(trans, path, drop_args.extent_inserted,</div><div class='del'>-				   root, &amp;inode-&gt;vfs_inode, start,</div><div class='del'>-				   inline_len, compressed_size,</div><div class='del'>-				   compress_type, compressed_pages);</div><div class='del'>-	if (ret &amp;&amp; ret != -ENOSPC) {</div><div class='add'>+	ret = insert_inline_extent(trans, path, inode, drop_args.extent_inserted,</div><div class='add'>+				   size, compressed_size, compress_type,</div><div class='add'>+				   compressed_folio, update_i_size);</div><div class='add'>+	if (unlikely(ret &amp;&amp; ret != -ENOSPC)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	} else if (ret == -ENOSPC) {</div><div class='hunk'>@@ -414,9 +656,9 @@ static noinline int cow_file_range_inline(struct btrfs_inode *inode, u64 start,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_update_inode_bytes(inode, inline_len, drop_args.bytes_found);</div><div class='del'>-	ret = btrfs_update_inode(trans, root, inode);</div><div class='del'>-	if (ret &amp;&amp; ret != -ENOSPC) {</div><div class='add'>+	btrfs_update_inode_bytes(inode, size, drop_args.bytes_found);</div><div class='add'>+	ret = btrfs_update_inode(trans, inode);</div><div class='add'>+	if (unlikely(ret &amp;&amp; ret != -ENOSPC)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	} else if (ret == -ENOSPC) {</div><div class='hunk'>@@ -424,7 +666,7 @@ static noinline int cow_file_range_inline(struct btrfs_inode *inode, u64 start,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	set_bit(BTRFS_INODE_NEEDS_FULL_SYNC, &amp;inode-&gt;runtime_flags);</div><div class='add'>+	btrfs_set_inode_full_sync(inode);</div><div class='ctx'> out:</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Don't forget to free the reserved space, as for inlined extent</div><div class='hunk'>@@ -432,28 +674,77 @@ out:</div><div class='ctx'> 	 * And at reserve time, it's always aligned to page size, so</div><div class='ctx'> 	 * just free one page here.</div><div class='ctx'> 	 */</div><div class='del'>-	btrfs_qgroup_free_data(inode, NULL, 0, PAGE_SIZE);</div><div class='add'>+	btrfs_qgroup_free_data(inode, NULL, 0, fs_info-&gt;sectorsize, NULL);</div><div class='ctx'> 	btrfs_free_path(path);</div><div class='ctx'> 	btrfs_end_transaction(trans);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static noinline int cow_file_range_inline(struct btrfs_inode *inode,</div><div class='add'>+					  struct folio *locked_folio,</div><div class='add'>+					  u64 offset, u64 end,</div><div class='add'>+					  size_t compressed_size,</div><div class='add'>+					  int compress_type,</div><div class='add'>+					  struct folio *compressed_folio,</div><div class='add'>+					  bool update_i_size)</div><div class='add'>+{</div><div class='add'>+	struct extent_state *cached = NULL;</div><div class='add'>+	unsigned long clear_flags = EXTENT_DELALLOC | EXTENT_DELALLOC_NEW |</div><div class='add'>+		EXTENT_DEFRAG | EXTENT_DO_ACCOUNTING | EXTENT_LOCKED;</div><div class='add'>+	u64 size = min_t(u64, i_size_read(&amp;inode-&gt;vfs_inode), end + 1);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (!can_cow_file_range_inline(inode, offset, size, compressed_size))</div><div class='add'>+		return 1;</div><div class='add'>+</div><div class='add'>+	btrfs_lock_extent(&amp;inode-&gt;io_tree, offset, end, &amp;cached);</div><div class='add'>+	ret = __cow_file_range_inline(inode, size, compressed_size,</div><div class='add'>+				      compress_type, compressed_folio,</div><div class='add'>+				      update_i_size);</div><div class='add'>+	if (ret &gt; 0) {</div><div class='add'>+		btrfs_unlock_extent(&amp;inode-&gt;io_tree, offset, end, &amp;cached);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * In the successful case (ret == 0 here), cow_file_range will return 1.</div><div class='add'>+	 *</div><div class='add'>+	 * Quite a bit further up the callstack in extent_writepage(), ret == 1</div><div class='add'>+	 * is treated as a short circuited success and does not unlock the folio,</div><div class='add'>+	 * so we must do it here.</div><div class='add'>+	 *</div><div class='add'>+	 * In the failure case, the locked_folio does get unlocked by</div><div class='add'>+	 * btrfs_folio_end_all_writers, which asserts that it is still locked</div><div class='add'>+	 * at that point, so we must *not* unlock it here.</div><div class='add'>+	 *</div><div class='add'>+	 * The other two callsites in compress_file_range do not have a</div><div class='add'>+	 * locked_folio, so they are not relevant to this logic.</div><div class='add'>+	 */</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		locked_folio = NULL;</div><div class='add'>+</div><div class='add'>+	extent_clear_unlock_delalloc(inode, offset, end, locked_folio, &amp;cached,</div><div class='add'>+				     clear_flags, PAGE_UNLOCK |</div><div class='add'>+				     PAGE_START_WRITEBACK | PAGE_END_WRITEBACK);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> struct async_extent {</div><div class='ctx'> 	u64 start;</div><div class='ctx'> 	u64 ram_size;</div><div class='ctx'> 	u64 compressed_size;</div><div class='del'>-	struct page **pages;</div><div class='del'>-	unsigned long nr_pages;</div><div class='add'>+	struct folio **folios;</div><div class='add'>+	unsigned long nr_folios;</div><div class='ctx'> 	int compress_type;</div><div class='ctx'> 	struct list_head list;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct async_chunk {</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	struct page *locked_page;</div><div class='add'>+	struct btrfs_inode *inode;</div><div class='add'>+	struct folio *locked_folio;</div><div class='ctx'> 	u64 start;</div><div class='ctx'> 	u64 end;</div><div class='del'>-	unsigned int write_flags;</div><div class='add'>+	blk_opf_t write_flags;</div><div class='ctx'> 	struct list_head extents;</div><div class='ctx'> 	struct cgroup_subsys_state *blkcg_css;</div><div class='ctx'> 	struct btrfs_work work;</div><div class='hunk'>@@ -468,36 +759,26 @@ struct async_cow {</div><div class='ctx'> static noinline int add_async_extent(struct async_chunk *cow,</div><div class='ctx'> 				     u64 start, u64 ram_size,</div><div class='ctx'> 				     u64 compressed_size,</div><div class='del'>-				     struct page **pages,</div><div class='del'>-				     unsigned long nr_pages,</div><div class='add'>+				     struct folio **folios,</div><div class='add'>+				     unsigned long nr_folios,</div><div class='ctx'> 				     int compress_type)</div><div class='ctx'> {</div><div class='ctx'> 	struct async_extent *async_extent;</div><div class='ctx'> </div><div class='ctx'> 	async_extent = kmalloc(sizeof(*async_extent), GFP_NOFS);</div><div class='del'>-	BUG_ON(!async_extent); /* -ENOMEM */</div><div class='add'>+	if (!async_extent)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> 	async_extent-&gt;start = start;</div><div class='ctx'> 	async_extent-&gt;ram_size = ram_size;</div><div class='ctx'> 	async_extent-&gt;compressed_size = compressed_size;</div><div class='del'>-	async_extent-&gt;pages = pages;</div><div class='del'>-	async_extent-&gt;nr_pages = nr_pages;</div><div class='add'>+	async_extent-&gt;folios = folios;</div><div class='add'>+	async_extent-&gt;nr_folios = nr_folios;</div><div class='ctx'> 	async_extent-&gt;compress_type = compress_type;</div><div class='ctx'> 	list_add_tail(&amp;async_extent-&gt;list, &amp;cow-&gt;extents);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Check if the inode has flags compatible with compression</div><div class='del'>- */</div><div class='del'>-static inline bool inode_can_compress(struct btrfs_inode *inode)</div><div class='del'>-{</div><div class='del'>-	if (inode-&gt;flags &amp; BTRFS_INODE_NODATACOW ||</div><div class='del'>-	    inode-&gt;flags &amp; BTRFS_INODE_NODATASUM)</div><div class='del'>-		return false;</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * Check if the inode needs to be submitted to compression, based on mount</div><div class='ctx'>  * options, defragmentation, properties or heuristics.</div><div class='ctx'>  */</div><div class='hunk'>@@ -506,108 +787,116 @@ static inline int inode_need_compress(struct btrfs_inode *inode, u64 start,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='ctx'> </div><div class='del'>-	if (!inode_can_compress(inode)) {</div><div class='del'>-		WARN(IS_ENABLED(CONFIG_BTRFS_DEBUG),</div><div class='del'>-			KERN_ERR "BTRFS: unexpected compression for ino %llu\n",</div><div class='del'>-			btrfs_ino(inode));</div><div class='add'>+	if (!btrfs_inode_can_compress(inode)) {</div><div class='add'>+		DEBUG_WARN("BTRFS: unexpected compression for ino %llu", btrfs_ino(inode));</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='del'>-	/*</div><div class='del'>-	 * Special check for subpage.</div><div class='del'>-	 *</div><div class='del'>-	 * We lock the full page then run each delalloc range in the page, thus</div><div class='del'>-	 * for the following case, we will hit some subpage specific corner case:</div><div class='del'>-	 *</div><div class='del'>-	 * 0		32K		64K</div><div class='del'>-	 * |	|///////|	|///////|</div><div class='del'>-	 *		\- A		\- B</div><div class='del'>-	 *</div><div class='del'>-	 * In above case, both range A and range B will try to unlock the full</div><div class='del'>-	 * page [0, 64K), causing the one finished later will have page</div><div class='del'>-	 * unlocked already, triggering various page lock requirement BUG_ON()s.</div><div class='del'>-	 *</div><div class='del'>-	 * So here we add an artificial limit that subpage compression can only</div><div class='del'>-	 * if the range is fully page aligned.</div><div class='del'>-	 *</div><div class='del'>-	 * In theory we only need to ensure the first page is fully covered, but</div><div class='del'>-	 * the tailing partial page will be locked until the full compression</div><div class='del'>-	 * finishes, delaying the write of other range.</div><div class='del'>-	 *</div><div class='del'>-	 * TODO: Make btrfs_run_delalloc_range() to lock all delalloc range</div><div class='del'>-	 * first to prevent any submitted async extent to unlock the full page.</div><div class='del'>-	 * By this, we can ensure for subpage case that only the last async_cow</div><div class='del'>-	 * will unlock the full page.</div><div class='del'>-	 */</div><div class='del'>-	if (fs_info-&gt;sectorsize &lt; PAGE_SIZE) {</div><div class='del'>-		if (!IS_ALIGNED(start, PAGE_SIZE) ||</div><div class='del'>-		    !IS_ALIGNED(end + 1, PAGE_SIZE))</div><div class='del'>-			return 0;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='add'>+	/* Defrag ioctl takes precedence over mount options and properties. */</div><div class='add'>+	if (inode-&gt;defrag_compress == BTRFS_DEFRAG_DONT_COMPRESS)</div><div class='add'>+		return 0;</div><div class='add'>+	if (BTRFS_COMPRESS_NONE &lt; inode-&gt;defrag_compress &amp;&amp;</div><div class='add'>+	    inode-&gt;defrag_compress &lt; BTRFS_NR_COMPRESS_TYPES)</div><div class='add'>+		return 1;</div><div class='ctx'> 	/* force compress */</div><div class='ctx'> 	if (btrfs_test_opt(fs_info, FORCE_COMPRESS))</div><div class='ctx'> 		return 1;</div><div class='del'>-	/* defrag ioctl */</div><div class='del'>-	if (inode-&gt;defrag_compress)</div><div class='del'>-		return 1;</div><div class='ctx'> 	/* bad compression ratios */</div><div class='ctx'> 	if (inode-&gt;flags &amp; BTRFS_INODE_NOCOMPRESS)</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	if (btrfs_test_opt(fs_info, COMPRESS) ||</div><div class='ctx'> 	    inode-&gt;flags &amp; BTRFS_INODE_COMPRESS ||</div><div class='ctx'> 	    inode-&gt;prop_compress)</div><div class='del'>-		return btrfs_compress_heuristic(&amp;inode-&gt;vfs_inode, start, end);</div><div class='add'>+		return btrfs_compress_heuristic(inode, start, end);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void inode_should_defrag(struct btrfs_inode *inode,</div><div class='del'>-		u64 start, u64 end, u64 num_bytes, u64 small_write)</div><div class='add'>+		u64 start, u64 end, u64 num_bytes, u32 small_write)</div><div class='ctx'> {</div><div class='ctx'> 	/* If this is a small write inside eof, kick off a defrag */</div><div class='ctx'> 	if (num_bytes &lt; small_write &amp;&amp;</div><div class='ctx'> 	    (start &gt; 0 || end + 1 &lt; inode-&gt;disk_i_size))</div><div class='del'>-		btrfs_add_inode_defrag(NULL, inode);</div><div class='add'>+		btrfs_add_inode_defrag(inode, small_write);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int extent_range_clear_dirty_for_io(struct btrfs_inode *inode, u64 start, u64 end)</div><div class='add'>+{</div><div class='add'>+	const pgoff_t end_index = end &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	for (pgoff_t index = start &gt;&gt; PAGE_SHIFT; index &lt;= end_index; index++) {</div><div class='add'>+		folio = filemap_get_folio(inode-&gt;vfs_inode.i_mapping, index);</div><div class='add'>+		if (IS_ERR(folio)) {</div><div class='add'>+			if (!ret)</div><div class='add'>+				ret = PTR_ERR(folio);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+		btrfs_folio_clamp_clear_dirty(inode-&gt;root-&gt;fs_info, folio, start,</div><div class='add'>+					      end + 1 - start);</div><div class='add'>+		folio_put(folio);</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * we create compressed extents in two phases.  The first</div><div class='del'>- * phase compresses a range of pages that have already been</div><div class='del'>- * locked (both pages and state bits are locked).</div><div class='add'>+ * Work queue call back to started compression on a file and pages.</div><div class='ctx'>  *</div><div class='del'>- * This is done inside an ordered work queue, and the compression</div><div class='del'>- * is spread across many cpus.  The actual IO submission is step</div><div class='del'>- * two, and the ordered work queue takes care of making sure that</div><div class='del'>- * happens in the same order things were put onto the queue by</div><div class='del'>- * writepages and friends.</div><div class='add'>+ * This is done inside an ordered work queue, and the compression is spread</div><div class='add'>+ * across many cpus.  The actual IO submission is step two, and the ordered work</div><div class='add'>+ * queue takes care of making sure that happens in the same order things were</div><div class='add'>+ * put onto the queue by writepages and friends.</div><div class='ctx'>  *</div><div class='del'>- * If this code finds it can't get good compression, it puts an</div><div class='del'>- * entry onto the work queue to write the uncompressed bytes.  This</div><div class='del'>- * makes sure that both compressed inodes and uncompressed inodes</div><div class='del'>- * are written in the same order that the flusher thread sent them</div><div class='del'>- * down.</div><div class='add'>+ * If this code finds it can't get good compression, it puts an entry onto the</div><div class='add'>+ * work queue to write the uncompressed bytes.  This makes sure that both</div><div class='add'>+ * compressed inodes and uncompressed inodes are written in the same order that</div><div class='add'>+ * the flusher thread sent them down.</div><div class='ctx'>  */</div><div class='del'>-static noinline int compress_file_range(struct async_chunk *async_chunk)</div><div class='add'>+static void compress_file_range(struct btrfs_work *work)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = async_chunk-&gt;inode;</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='add'>+	struct async_chunk *async_chunk =</div><div class='add'>+		container_of(work, struct async_chunk, work);</div><div class='add'>+	struct btrfs_inode *inode = async_chunk-&gt;inode;</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	struct address_space *mapping = inode-&gt;vfs_inode.i_mapping;</div><div class='add'>+	const u32 min_folio_shift = PAGE_SHIFT + fs_info-&gt;block_min_order;</div><div class='add'>+	const u32 min_folio_size = btrfs_min_folio_size(fs_info);</div><div class='ctx'> 	u64 blocksize = fs_info-&gt;sectorsize;</div><div class='ctx'> 	u64 start = async_chunk-&gt;start;</div><div class='ctx'> 	u64 end = async_chunk-&gt;end;</div><div class='ctx'> 	u64 actual_end;</div><div class='ctx'> 	u64 i_size;</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	struct page **pages = NULL;</div><div class='del'>-	unsigned long nr_pages;</div><div class='add'>+	struct folio **folios = NULL;</div><div class='add'>+	unsigned long nr_folios;</div><div class='ctx'> 	unsigned long total_compressed = 0;</div><div class='ctx'> 	unsigned long total_in = 0;</div><div class='add'>+	unsigned int loff;</div><div class='ctx'> 	int i;</div><div class='del'>-	int will_compress;</div><div class='ctx'> 	int compress_type = fs_info-&gt;compress_type;</div><div class='del'>-	int compressed_extents = 0;</div><div class='del'>-	int redirty = 0;</div><div class='add'>+	int compress_level = fs_info-&gt;compress_level;</div><div class='ctx'> </div><div class='del'>-	inode_should_defrag(BTRFS_I(inode), start, end, end - start + 1,</div><div class='del'>-			SZ_16K);</div><div class='add'>+	if (unlikely(btrfs_is_shutdown(fs_info)))</div><div class='add'>+		goto cleanup_and_bail_uncompressed;</div><div class='add'>+</div><div class='add'>+	inode_should_defrag(inode, start, end, end - start + 1, SZ_16K);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We need to call clear_page_dirty_for_io on each page in the range.</div><div class='add'>+	 * Otherwise applications with the file mmap'd can wander in and change</div><div class='add'>+	 * the page contents while we are compressing them.</div><div class='add'>+	 */</div><div class='add'>+	ret = extent_range_clear_dirty_for_io(inode, start, end);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * All the folios should have been locked thus no failure.</div><div class='add'>+	 *</div><div class='add'>+	 * And even if some folios are missing, btrfs_compress_folios()</div><div class='add'>+	 * would handle them correctly, so here just do an ASSERT() check for</div><div class='add'>+	 * early logic errors.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(ret == 0);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We need to save i_size before now because it could change in between</div><div class='hunk'>@@ -619,15 +908,13 @@ static noinline int compress_file_range(struct async_chunk *async_chunk)</div><div class='ctx'> 	 * does that for us.</div><div class='ctx'> 	 */</div><div class='ctx'> 	barrier();</div><div class='del'>-	i_size = i_size_read(inode);</div><div class='add'>+	i_size = i_size_read(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> 	barrier();</div><div class='ctx'> 	actual_end = min_t(u64, i_size, end + 1);</div><div class='ctx'> again:</div><div class='del'>-	will_compress = 0;</div><div class='del'>-	nr_pages = (end &gt;&gt; PAGE_SHIFT) - (start &gt;&gt; PAGE_SHIFT) + 1;</div><div class='del'>-	BUILD_BUG_ON((BTRFS_MAX_COMPRESSED % PAGE_SIZE) != 0);</div><div class='del'>-	nr_pages = min_t(unsigned long, nr_pages,</div><div class='del'>-			BTRFS_MAX_COMPRESSED / PAGE_SIZE);</div><div class='add'>+	folios = NULL;</div><div class='add'>+	nr_folios = (end &gt;&gt; min_folio_shift) - (start &gt;&gt; min_folio_shift) + 1;</div><div class='add'>+	nr_folios = min_t(unsigned long, nr_folios, BTRFS_MAX_COMPRESSED &gt;&gt; min_folio_shift);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * we don't want to send crud past the end of i_size through</div><div class='hunk'>@@ -649,447 +936,313 @@ again:</div><div class='ctx'> 	 * isn't an inline extent, since it doesn't save disk space at all.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (total_compressed &lt;= blocksize &amp;&amp;</div><div class='del'>-	   (start &gt; 0 || end + 1 &lt; BTRFS_I(inode)-&gt;disk_i_size))</div><div class='add'>+	   (start &gt; 0 || end + 1 &lt; inode-&gt;disk_i_size))</div><div class='ctx'> 		goto cleanup_and_bail_uncompressed;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * For subpage case, we require full page alignment for the sector</div><div class='del'>-	 * aligned range.</div><div class='del'>-	 * Thus we must also check against @actual_end, not just @end.</div><div class='del'>-	 */</div><div class='del'>-	if (blocksize &lt; PAGE_SIZE) {</div><div class='del'>-		if (!IS_ALIGNED(start, PAGE_SIZE) ||</div><div class='del'>-		    !IS_ALIGNED(round_up(actual_end, blocksize), PAGE_SIZE))</div><div class='del'>-			goto cleanup_and_bail_uncompressed;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	total_compressed = min_t(unsigned long, total_compressed,</div><div class='ctx'> 			BTRFS_MAX_UNCOMPRESSED);</div><div class='ctx'> 	total_in = 0;</div><div class='ctx'> 	ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * we do compression for mount -o compress and when the</div><div class='del'>-	 * inode has not been flagged as nocompress.  This flag can</div><div class='del'>-	 * change at any time if we discover bad compression ratios.</div><div class='add'>+	 * We do compression for mount -o compress and when the inode has not</div><div class='add'>+	 * been flagged as NOCOMPRESS.  This flag can change at any time if we</div><div class='add'>+	 * discover bad compression ratios.</div><div class='ctx'> 	 */</div><div class='del'>-	if (inode_need_compress(BTRFS_I(inode), start, end)) {</div><div class='del'>-		WARN_ON(pages);</div><div class='del'>-		pages = kcalloc(nr_pages, sizeof(struct page *), GFP_NOFS);</div><div class='del'>-		if (!pages) {</div><div class='del'>-			/* just bail out to the uncompressed code */</div><div class='del'>-			nr_pages = 0;</div><div class='del'>-			goto cont;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (BTRFS_I(inode)-&gt;defrag_compress)</div><div class='del'>-			compress_type = BTRFS_I(inode)-&gt;defrag_compress;</div><div class='del'>-		else if (BTRFS_I(inode)-&gt;prop_compress)</div><div class='del'>-			compress_type = BTRFS_I(inode)-&gt;prop_compress;</div><div class='add'>+	if (!inode_need_compress(inode, start, end))</div><div class='add'>+		goto cleanup_and_bail_uncompressed;</div><div class='ctx'> </div><div class='add'>+	folios = kcalloc(nr_folios, sizeof(struct folio *), GFP_NOFS);</div><div class='add'>+	if (!folios) {</div><div class='ctx'> 		/*</div><div class='del'>-		 * we need to call clear_page_dirty_for_io on each</div><div class='del'>-		 * page in the range.  Otherwise applications with the file</div><div class='del'>-		 * mmap'd can wander in and change the page contents while</div><div class='del'>-		 * we are compressing them.</div><div class='del'>-		 *</div><div class='del'>-		 * If the compression fails for any reason, we set the pages</div><div class='del'>-		 * dirty again later on.</div><div class='del'>-		 *</div><div class='del'>-		 * Note that the remaining part is redirtied, the start pointer</div><div class='del'>-		 * has moved, the end is the original one.</div><div class='add'>+		 * Memory allocation failure is not a fatal error, we can fall</div><div class='add'>+		 * back to uncompressed code.</div><div class='ctx'> 		 */</div><div class='del'>-		if (!redirty) {</div><div class='del'>-			extent_range_clear_dirty_for_io(inode, start, end);</div><div class='del'>-			redirty = 1;</div><div class='del'>-		}</div><div class='add'>+		goto cleanup_and_bail_uncompressed;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		/* Compression level is applied here and only here */</div><div class='del'>-		ret = btrfs_compress_pages(</div><div class='del'>-			compress_type | (fs_info-&gt;compress_level &lt;&lt; 4),</div><div class='del'>-					   inode-&gt;i_mapping, start,</div><div class='del'>-					   pages,</div><div class='del'>-					   &amp;nr_pages,</div><div class='del'>-					   &amp;total_in,</div><div class='del'>-					   &amp;total_compressed);</div><div class='add'>+	if (0 &lt; inode-&gt;defrag_compress &amp;&amp; inode-&gt;defrag_compress &lt; BTRFS_NR_COMPRESS_TYPES) {</div><div class='add'>+		compress_type = inode-&gt;defrag_compress;</div><div class='add'>+		compress_level = inode-&gt;defrag_compress_level;</div><div class='add'>+	} else if (inode-&gt;prop_compress) {</div><div class='add'>+		compress_type = inode-&gt;prop_compress;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		if (!ret) {</div><div class='del'>-			unsigned long offset = offset_in_page(total_compressed);</div><div class='del'>-			struct page *page = pages[nr_pages - 1];</div><div class='add'>+	/* Compression level is applied here. */</div><div class='add'>+	ret = btrfs_compress_folios(compress_type, compress_level,</div><div class='add'>+				    inode, start, folios, &amp;nr_folios, &amp;total_in,</div><div class='add'>+				    &amp;total_compressed);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto mark_incompressible;</div><div class='ctx'> </div><div class='del'>-			/* zero the tail end of the last page, we might be</div><div class='del'>-			 * sending it down to disk</div><div class='del'>-			 */</div><div class='del'>-			if (offset)</div><div class='del'>-				memzero_page(page, offset, PAGE_SIZE - offset);</div><div class='del'>-			will_compress = 1;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-cont:</div><div class='ctx'> 	/*</div><div class='del'>-	 * Check cow_file_range() for why we don't even try to create inline</div><div class='del'>-	 * extent for subpage case.</div><div class='add'>+	 * Zero the tail end of the last folio, as we might be sending it down</div><div class='add'>+	 * to disk.</div><div class='ctx'> 	 */</div><div class='del'>-	if (start == 0 &amp;&amp; fs_info-&gt;sectorsize == PAGE_SIZE) {</div><div class='del'>-		/* lets try to make an inline extent */</div><div class='del'>-		if (ret || total_in &lt; actual_end) {</div><div class='del'>-			/* we didn't compress the entire range, try</div><div class='del'>-			 * to make an uncompressed inline extent.</div><div class='del'>-			 */</div><div class='del'>-			ret = cow_file_range_inline(BTRFS_I(inode), start, end,</div><div class='del'>-						    0, BTRFS_COMPRESS_NONE,</div><div class='del'>-						    NULL);</div><div class='del'>-		} else {</div><div class='del'>-			/* try making a compressed inline extent */</div><div class='del'>-			ret = cow_file_range_inline(BTRFS_I(inode), start, end,</div><div class='del'>-						    total_compressed,</div><div class='del'>-						    compress_type, pages);</div><div class='del'>-		}</div><div class='del'>-		if (ret &lt;= 0) {</div><div class='del'>-			unsigned long clear_flags = EXTENT_DELALLOC |</div><div class='del'>-				EXTENT_DELALLOC_NEW | EXTENT_DEFRAG |</div><div class='del'>-				EXTENT_DO_ACCOUNTING;</div><div class='del'>-			unsigned long page_error_op;</div><div class='del'>-</div><div class='del'>-			page_error_op = ret &lt; 0 ? PAGE_SET_ERROR : 0;</div><div class='add'>+	loff = (total_compressed &amp; (min_folio_size - 1));</div><div class='add'>+	if (loff)</div><div class='add'>+		folio_zero_range(folios[nr_folios - 1], loff, min_folio_size - loff);</div><div class='ctx'> </div><div class='del'>-			/*</div><div class='del'>-			 * inline extent creation worked or returned error,</div><div class='del'>-			 * we don't need to create any more async work items.</div><div class='del'>-			 * Unlock and free up our temp pages.</div><div class='del'>-			 *</div><div class='del'>-			 * We use DO_ACCOUNTING here because we need the</div><div class='del'>-			 * delalloc_release_metadata to be done _after_ we drop</div><div class='del'>-			 * our outstanding extent for clearing delalloc for this</div><div class='del'>-			 * range.</div><div class='del'>-			 */</div><div class='del'>-			extent_clear_unlock_delalloc(BTRFS_I(inode), start, end,</div><div class='del'>-						     NULL,</div><div class='del'>-						     clear_flags,</div><div class='del'>-						     PAGE_UNLOCK |</div><div class='del'>-						     PAGE_START_WRITEBACK |</div><div class='del'>-						     page_error_op |</div><div class='del'>-						     PAGE_END_WRITEBACK);</div><div class='del'>-</div><div class='del'>-			/*</div><div class='del'>-			 * Ensure we only free the compressed pages if we have</div><div class='del'>-			 * them allocated, as we can still reach here with</div><div class='del'>-			 * inode_need_compress() == false.</div><div class='del'>-			 */</div><div class='del'>-			if (pages) {</div><div class='del'>-				for (i = 0; i &lt; nr_pages; i++) {</div><div class='del'>-					WARN_ON(pages[i]-&gt;mapping);</div><div class='del'>-					put_page(pages[i]);</div><div class='del'>-				}</div><div class='del'>-				kfree(pages);</div><div class='del'>-			}</div><div class='del'>-			return 0;</div><div class='del'>-		}</div><div class='add'>+	/*</div><div class='add'>+	 * Try to create an inline extent.</div><div class='add'>+	 *</div><div class='add'>+	 * If we didn't compress the entire range, try to create an uncompressed</div><div class='add'>+	 * inline extent, else a compressed one.</div><div class='add'>+	 *</div><div class='add'>+	 * Check cow_file_range() for why we don't even try to create inline</div><div class='add'>+	 * extent for the subpage case.</div><div class='add'>+	 */</div><div class='add'>+	if (total_in &lt; actual_end)</div><div class='add'>+		ret = cow_file_range_inline(inode, NULL, start, end, 0,</div><div class='add'>+					    BTRFS_COMPRESS_NONE, NULL, false);</div><div class='add'>+	else</div><div class='add'>+		ret = cow_file_range_inline(inode, NULL, start, end, total_compressed,</div><div class='add'>+					    compress_type, folios[0], false);</div><div class='add'>+	if (ret &lt;= 0) {</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			mapping_set_error(mapping, -EIO);</div><div class='add'>+		goto free_pages;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (will_compress) {</div><div class='del'>-		/*</div><div class='del'>-		 * we aren't doing an inline extent round the compressed size</div><div class='del'>-		 * up to a block size boundary so the allocator does sane</div><div class='del'>-		 * things</div><div class='del'>-		 */</div><div class='del'>-		total_compressed = ALIGN(total_compressed, blocksize);</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * one last check to make sure the compression is really a</div><div class='del'>-		 * win, compare the page count read with the blocks on disk,</div><div class='del'>-		 * compression must free at least one sector size</div><div class='del'>-		 */</div><div class='del'>-		total_in = round_up(total_in, fs_info-&gt;sectorsize);</div><div class='del'>-		if (total_compressed + blocksize &lt;= total_in) {</div><div class='del'>-			compressed_extents++;</div><div class='add'>+	/*</div><div class='add'>+	 * We aren't doing an inline extent. Round the compressed size up to a</div><div class='add'>+	 * block size boundary so the allocator does sane things.</div><div class='add'>+	 */</div><div class='add'>+	total_compressed = ALIGN(total_compressed, blocksize);</div><div class='ctx'> </div><div class='del'>-			/*</div><div class='del'>-			 * The async work queues will take care of doing actual</div><div class='del'>-			 * allocation on disk for these compressed pages, and</div><div class='del'>-			 * will submit them to the elevator.</div><div class='del'>-			 */</div><div class='del'>-			add_async_extent(async_chunk, start, total_in,</div><div class='del'>-					total_compressed, pages, nr_pages,</div><div class='del'>-					compress_type);</div><div class='del'>-</div><div class='del'>-			if (start + total_in &lt; end) {</div><div class='del'>-				start += total_in;</div><div class='del'>-				pages = NULL;</div><div class='del'>-				cond_resched();</div><div class='del'>-				goto again;</div><div class='del'>-			}</div><div class='del'>-			return compressed_extents;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	if (pages) {</div><div class='del'>-		/*</div><div class='del'>-		 * the compression code ran but failed to make things smaller,</div><div class='del'>-		 * free any pages it allocated and our page pointer array</div><div class='del'>-		 */</div><div class='del'>-		for (i = 0; i &lt; nr_pages; i++) {</div><div class='del'>-			WARN_ON(pages[i]-&gt;mapping);</div><div class='del'>-			put_page(pages[i]);</div><div class='del'>-		}</div><div class='del'>-		kfree(pages);</div><div class='del'>-		pages = NULL;</div><div class='del'>-		total_compressed = 0;</div><div class='del'>-		nr_pages = 0;</div><div class='add'>+	/*</div><div class='add'>+	 * One last check to make sure the compression is really a win, compare</div><div class='add'>+	 * the page count read with the blocks on disk, compression must free at</div><div class='add'>+	 * least one sector.</div><div class='add'>+	 */</div><div class='add'>+	total_in = round_up(total_in, fs_info-&gt;sectorsize);</div><div class='add'>+	if (total_compressed + blocksize &gt; total_in)</div><div class='add'>+		goto mark_incompressible;</div><div class='ctx'> </div><div class='del'>-		/* flag the file so we don't compress in the future */</div><div class='del'>-		if (!btrfs_test_opt(fs_info, FORCE_COMPRESS) &amp;&amp;</div><div class='del'>-		    !(BTRFS_I(inode)-&gt;prop_compress)) {</div><div class='del'>-			BTRFS_I(inode)-&gt;flags |= BTRFS_INODE_NOCOMPRESS;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-cleanup_and_bail_uncompressed:</div><div class='ctx'> 	/*</div><div class='del'>-	 * No compression, but we still need to write the pages in the file</div><div class='del'>-	 * we've been given so far.  redirty the locked page if it corresponds</div><div class='del'>-	 * to our extent and set things up for the async work queue to run</div><div class='del'>-	 * cow_file_range to do the normal delalloc dance.</div><div class='add'>+	 * The async work queues will take care of doing actual allocation on</div><div class='add'>+	 * disk for these compressed pages, and will submit the bios.</div><div class='ctx'> 	 */</div><div class='del'>-	if (async_chunk-&gt;locked_page &amp;&amp;</div><div class='del'>-	    (page_offset(async_chunk-&gt;locked_page) &gt;= start &amp;&amp;</div><div class='del'>-	     page_offset(async_chunk-&gt;locked_page)) &lt;= end) {</div><div class='del'>-		__set_page_dirty_nobuffers(async_chunk-&gt;locked_page);</div><div class='del'>-		/* unlocked later on in the async handlers */</div><div class='add'>+	ret = add_async_extent(async_chunk, start, total_in, total_compressed, folios,</div><div class='add'>+			       nr_folios, compress_type);</div><div class='add'>+	BUG_ON(ret);</div><div class='add'>+	if (start + total_in &lt; end) {</div><div class='add'>+		start += total_in;</div><div class='add'>+		cond_resched();</div><div class='add'>+		goto again;</div><div class='ctx'> 	}</div><div class='add'>+	return;</div><div class='ctx'> </div><div class='del'>-	if (redirty)</div><div class='del'>-		extent_range_redirty_for_io(inode, start, end);</div><div class='del'>-	add_async_extent(async_chunk, start, end - start + 1, 0, NULL, 0,</div><div class='del'>-			 BTRFS_COMPRESS_NONE);</div><div class='del'>-	compressed_extents++;</div><div class='del'>-</div><div class='del'>-	return compressed_extents;</div><div class='add'>+mark_incompressible:</div><div class='add'>+	if (!btrfs_test_opt(fs_info, FORCE_COMPRESS) &amp;&amp; !inode-&gt;prop_compress)</div><div class='add'>+		inode-&gt;flags |= BTRFS_INODE_NOCOMPRESS;</div><div class='add'>+cleanup_and_bail_uncompressed:</div><div class='add'>+	ret = add_async_extent(async_chunk, start, end - start + 1, 0, NULL, 0,</div><div class='add'>+			       BTRFS_COMPRESS_NONE);</div><div class='add'>+	BUG_ON(ret);</div><div class='add'>+free_pages:</div><div class='add'>+	if (folios) {</div><div class='add'>+		for (i = 0; i &lt; nr_folios; i++) {</div><div class='add'>+			WARN_ON(folios[i]-&gt;mapping);</div><div class='add'>+			btrfs_free_compr_folio(folios[i]);</div><div class='add'>+		}</div><div class='add'>+		kfree(folios);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void free_async_extent_pages(struct async_extent *async_extent)</div><div class='ctx'> {</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	if (!async_extent-&gt;pages)</div><div class='add'>+	if (!async_extent-&gt;folios)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; async_extent-&gt;nr_pages; i++) {</div><div class='del'>-		WARN_ON(async_extent-&gt;pages[i]-&gt;mapping);</div><div class='del'>-		put_page(async_extent-&gt;pages[i]);</div><div class='add'>+	for (i = 0; i &lt; async_extent-&gt;nr_folios; i++) {</div><div class='add'>+		WARN_ON(async_extent-&gt;folios[i]-&gt;mapping);</div><div class='add'>+		btrfs_free_compr_folio(async_extent-&gt;folios[i]);</div><div class='ctx'> 	}</div><div class='del'>-	kfree(async_extent-&gt;pages);</div><div class='del'>-	async_extent-&gt;nr_pages = 0;</div><div class='del'>-	async_extent-&gt;pages = NULL;</div><div class='add'>+	kfree(async_extent-&gt;folios);</div><div class='add'>+	async_extent-&gt;nr_folios = 0;</div><div class='add'>+	async_extent-&gt;folios = NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int submit_uncompressed_range(struct btrfs_inode *inode,</div><div class='del'>-				     struct async_extent *async_extent,</div><div class='del'>-				     struct page *locked_page)</div><div class='add'>+static void submit_uncompressed_range(struct btrfs_inode *inode,</div><div class='add'>+				      struct async_extent *async_extent,</div><div class='add'>+				      struct folio *locked_folio)</div><div class='ctx'> {</div><div class='ctx'> 	u64 start = async_extent-&gt;start;</div><div class='ctx'> 	u64 end = async_extent-&gt;start + async_extent-&gt;ram_size - 1;</div><div class='del'>-	unsigned long nr_written = 0;</div><div class='del'>-	int page_started = 0;</div><div class='ctx'> 	int ret;</div><div class='add'>+	struct writeback_control wbc = {</div><div class='add'>+		.sync_mode		= WB_SYNC_ALL,</div><div class='add'>+		.range_start		= start,</div><div class='add'>+		.range_end		= end,</div><div class='add'>+		.no_cgroup_owner	= 1,</div><div class='add'>+	};</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Call cow_file_range() to run the delalloc range directly, since we</div><div class='del'>-	 * won't go to NOCOW or async path again.</div><div class='del'>-	 *</div><div class='del'>-	 * Also we call cow_file_range() with @unlock_page == 0, so that we</div><div class='del'>-	 * can directly submit them without interruption.</div><div class='del'>-	 */</div><div class='del'>-	ret = cow_file_range(inode, locked_page, start, end, &amp;page_started,</div><div class='del'>-			     &amp;nr_written, 0);</div><div class='del'>-	/* Inline extent inserted, page gets unlocked and everything is done */</div><div class='del'>-	if (page_started) {</div><div class='del'>-		ret = 0;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	wbc_attach_fdatawrite_inode(&amp;wbc, &amp;inode-&gt;vfs_inode);</div><div class='add'>+	ret = run_delalloc_cow(inode, locked_folio, start, end,</div><div class='add'>+			       &amp;wbc, false);</div><div class='add'>+	wbc_detach_inode(&amp;wbc);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='del'>-		if (locked_page)</div><div class='del'>-			unlock_page(locked_page);</div><div class='del'>-		goto out;</div><div class='add'>+		if (locked_folio)</div><div class='add'>+			btrfs_folio_end_lock(inode-&gt;root-&gt;fs_info, locked_folio,</div><div class='add'>+					     start, async_extent-&gt;ram_size);</div><div class='add'>+		btrfs_err_rl(inode-&gt;root-&gt;fs_info,</div><div class='add'>+			"%s failed, root=%llu inode=%llu start=%llu len=%llu: %d",</div><div class='add'>+			     __func__, btrfs_root_id(inode-&gt;root),</div><div class='add'>+			     btrfs_ino(inode), start, async_extent-&gt;ram_size, ret);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	ret = extent_write_locked_range(&amp;inode-&gt;vfs_inode, start, end);</div><div class='del'>-	/* All pages will be unlocked, including @locked_page */</div><div class='del'>-out:</div><div class='del'>-	kfree(async_extent);</div><div class='del'>-	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int submit_one_async_extent(struct btrfs_inode *inode,</div><div class='del'>-				   struct async_chunk *async_chunk,</div><div class='del'>-				   struct async_extent *async_extent,</div><div class='del'>-				   u64 *alloc_hint)</div><div class='add'>+static void submit_one_async_extent(struct async_chunk *async_chunk,</div><div class='add'>+				    struct async_extent *async_extent,</div><div class='add'>+				    u64 *alloc_hint)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_inode *inode = async_chunk-&gt;inode;</div><div class='ctx'> 	struct extent_io_tree *io_tree = &amp;inode-&gt;io_tree;</div><div class='ctx'> 	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+	struct btrfs_ordered_extent *ordered;</div><div class='add'>+	struct btrfs_file_extent file_extent;</div><div class='ctx'> 	struct btrfs_key ins;</div><div class='del'>-	struct page *locked_page = NULL;</div><div class='add'>+	struct folio *locked_folio = NULL;</div><div class='add'>+	struct extent_state *cached = NULL;</div><div class='ctx'> 	struct extent_map *em;</div><div class='ctx'> 	int ret = 0;</div><div class='add'>+	bool free_pages = false;</div><div class='ctx'> 	u64 start = async_extent-&gt;start;</div><div class='ctx'> 	u64 end = async_extent-&gt;start + async_extent-&gt;ram_size - 1;</div><div class='ctx'> </div><div class='add'>+	if (async_chunk-&gt;blkcg_css)</div><div class='add'>+		kthread_associate_blkcg(async_chunk-&gt;blkcg_css);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='del'>-	 * If async_chunk-&gt;locked_page is in the async_extent range, we need to</div><div class='add'>+	 * If async_chunk-&gt;locked_folio is in the async_extent range, we need to</div><div class='ctx'> 	 * handle it.</div><div class='ctx'> 	 */</div><div class='del'>-	if (async_chunk-&gt;locked_page) {</div><div class='del'>-		u64 locked_page_start = page_offset(async_chunk-&gt;locked_page);</div><div class='del'>-		u64 locked_page_end = locked_page_start + PAGE_SIZE - 1;</div><div class='add'>+	if (async_chunk-&gt;locked_folio) {</div><div class='add'>+		u64 locked_folio_start = folio_pos(async_chunk-&gt;locked_folio);</div><div class='add'>+		u64 locked_folio_end = locked_folio_start +</div><div class='add'>+			folio_size(async_chunk-&gt;locked_folio) - 1;</div><div class='ctx'> </div><div class='del'>-		if (!(start &gt;= locked_page_end || end &lt;= locked_page_start))</div><div class='del'>-			locked_page = async_chunk-&gt;locked_page;</div><div class='add'>+		if (!(start &gt;= locked_folio_end || end &lt;= locked_folio_start))</div><div class='add'>+			locked_folio = async_chunk-&gt;locked_folio;</div><div class='ctx'> 	}</div><div class='del'>-	lock_extent(io_tree, start, end);</div><div class='ctx'> </div><div class='del'>-	/* We have fall back to uncompressed write */</div><div class='del'>-	if (!async_extent-&gt;pages)</div><div class='del'>-		return submit_uncompressed_range(inode, async_extent, locked_page);</div><div class='add'>+	if (async_extent-&gt;compress_type == BTRFS_COMPRESS_NONE) {</div><div class='add'>+		ASSERT(!async_extent-&gt;folios);</div><div class='add'>+		ASSERT(async_extent-&gt;nr_folios == 0);</div><div class='add'>+		submit_uncompressed_range(inode, async_extent, locked_folio);</div><div class='add'>+		free_pages = true;</div><div class='add'>+		goto done;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_reserve_extent(root, async_extent-&gt;ram_size,</div><div class='ctx'> 				   async_extent-&gt;compressed_size,</div><div class='ctx'> 				   async_extent-&gt;compressed_size,</div><div class='del'>-				   0, *alloc_hint, &amp;ins, 1, 1);</div><div class='add'>+				   0, *alloc_hint, &amp;ins, true, true);</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		free_async_extent_pages(async_extent);</div><div class='ctx'> 		/*</div><div class='del'>-		 * Here we used to try again by going back to non-compressed</div><div class='del'>-		 * path for ENOSPC.  But we can't reserve space even for</div><div class='del'>-		 * compressed size, how could it work for uncompressed size</div><div class='del'>-		 * which requires larger size?  So here we directly go error</div><div class='del'>-		 * path.</div><div class='add'>+		 * We can't reserve contiguous space for the compressed size.</div><div class='add'>+		 * Unlikely, but it's possible that we could have enough</div><div class='add'>+		 * non-contiguous space for the uncompressed size instead.  So</div><div class='add'>+		 * fall back to uncompressed.</div><div class='ctx'> 		 */</div><div class='del'>-		goto out_free;</div><div class='add'>+		submit_uncompressed_range(inode, async_extent, locked_folio);</div><div class='add'>+		free_pages = true;</div><div class='add'>+		goto done;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	btrfs_lock_extent(io_tree, start, end, &amp;cached);</div><div class='add'>+</div><div class='ctx'> 	/* Here we're doing allocation and writeback of the compressed pages */</div><div class='del'>-	em = create_io_em(inode, start,</div><div class='del'>-			  async_extent-&gt;ram_size,	/* len */</div><div class='del'>-			  start,			/* orig_start */</div><div class='del'>-			  ins.objectid,			/* block_start */</div><div class='del'>-			  ins.offset,			/* block_len */</div><div class='del'>-			  ins.offset,			/* orig_block_len */</div><div class='del'>-			  async_extent-&gt;ram_size,	/* ram_bytes */</div><div class='del'>-			  async_extent-&gt;compress_type,</div><div class='del'>-			  BTRFS_ORDERED_COMPRESSED);</div><div class='add'>+	file_extent.disk_bytenr = ins.objectid;</div><div class='add'>+	file_extent.disk_num_bytes = ins.offset;</div><div class='add'>+	file_extent.ram_bytes = async_extent-&gt;ram_size;</div><div class='add'>+	file_extent.num_bytes = async_extent-&gt;ram_size;</div><div class='add'>+	file_extent.offset = 0;</div><div class='add'>+	file_extent.compression = async_extent-&gt;compress_type;</div><div class='add'>+</div><div class='add'>+	em = btrfs_create_io_em(inode, start, &amp;file_extent, BTRFS_ORDERED_COMPRESSED);</div><div class='ctx'> 	if (IS_ERR(em)) {</div><div class='ctx'> 		ret = PTR_ERR(em);</div><div class='ctx'> 		goto out_free_reserve;</div><div class='ctx'> 	}</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_add_ordered_extent_compress(inode, start,	/* file_offset */</div><div class='del'>-					ins.objectid,		/* disk_bytenr */</div><div class='del'>-					async_extent-&gt;ram_size, /* num_bytes */</div><div class='del'>-					ins.offset,		/* disk_num_bytes */</div><div class='del'>-					async_extent-&gt;compress_type);</div><div class='del'>-	if (ret) {</div><div class='del'>-		btrfs_drop_extent_cache(inode, start, end, 0);</div><div class='add'>+	ordered = btrfs_alloc_ordered_extent(inode, start, &amp;file_extent,</div><div class='add'>+					     1U &lt;&lt; BTRFS_ORDERED_COMPRESSED);</div><div class='add'>+	if (IS_ERR(ordered)) {</div><div class='add'>+		btrfs_drop_extent_map_range(inode, start, end, false);</div><div class='add'>+		ret = PTR_ERR(ordered);</div><div class='ctx'> 		goto out_free_reserve;</div><div class='ctx'> 	}</div><div class='ctx'> 	btrfs_dec_block_group_reservations(fs_info, ins.objectid);</div><div class='ctx'> </div><div class='ctx'> 	/* Clear dirty, set writeback and unlock the pages. */</div><div class='ctx'> 	extent_clear_unlock_delalloc(inode, start, end,</div><div class='del'>-			NULL, EXTENT_LOCKED | EXTENT_DELALLOC,</div><div class='add'>+			NULL, &amp;cached, EXTENT_LOCKED | EXTENT_DELALLOC,</div><div class='ctx'> 			PAGE_UNLOCK | PAGE_START_WRITEBACK);</div><div class='del'>-	if (btrfs_submit_compressed_write(inode, start,	/* file_offset */</div><div class='del'>-			    async_extent-&gt;ram_size,	/* num_bytes */</div><div class='del'>-			    ins.objectid,		/* disk_bytenr */</div><div class='del'>-			    ins.offset,			/* compressed_len */</div><div class='del'>-			    async_extent-&gt;pages,	/* compressed_pages */</div><div class='del'>-			    async_extent-&gt;nr_pages,</div><div class='del'>-			    async_chunk-&gt;write_flags,</div><div class='del'>-			    async_chunk-&gt;blkcg_css)) {</div><div class='del'>-		const u64 start = async_extent-&gt;start;</div><div class='del'>-		const u64 end = start + async_extent-&gt;ram_size - 1;</div><div class='del'>-</div><div class='del'>-		btrfs_writepage_endio_finish_ordered(inode, NULL, start, end, 0);</div><div class='del'>-</div><div class='del'>-		extent_clear_unlock_delalloc(inode, start, end, NULL, 0,</div><div class='del'>-					     PAGE_END_WRITEBACK | PAGE_SET_ERROR);</div><div class='del'>-		free_async_extent_pages(async_extent);</div><div class='del'>-	}</div><div class='add'>+	btrfs_submit_compressed_write(ordered,</div><div class='add'>+			    async_extent-&gt;folios,	/* compressed_folios */</div><div class='add'>+			    async_extent-&gt;nr_folios,</div><div class='add'>+			    async_chunk-&gt;write_flags, true);</div><div class='ctx'> 	*alloc_hint = ins.objectid + ins.offset;</div><div class='add'>+done:</div><div class='add'>+	if (async_chunk-&gt;blkcg_css)</div><div class='add'>+		kthread_associate_blkcg(NULL);</div><div class='add'>+	if (free_pages)</div><div class='add'>+		free_async_extent_pages(async_extent);</div><div class='ctx'> 	kfree(async_extent);</div><div class='del'>-	return ret;</div><div class='add'>+	return;</div><div class='ctx'> </div><div class='ctx'> out_free_reserve:</div><div class='ctx'> 	btrfs_dec_block_group_reservations(fs_info, ins.objectid);</div><div class='del'>-	btrfs_free_reserved_extent(fs_info, ins.objectid, ins.offset, 1);</div><div class='del'>-out_free:</div><div class='add'>+	btrfs_free_reserved_extent(fs_info, ins.objectid, ins.offset, true);</div><div class='add'>+	mapping_set_error(inode-&gt;vfs_inode.i_mapping, -EIO);</div><div class='ctx'> 	extent_clear_unlock_delalloc(inode, start, end,</div><div class='del'>-				     NULL, EXTENT_LOCKED | EXTENT_DELALLOC |</div><div class='add'>+				     NULL, &amp;cached,</div><div class='add'>+				     EXTENT_LOCKED | EXTENT_DELALLOC |</div><div class='ctx'> 				     EXTENT_DELALLOC_NEW |</div><div class='ctx'> 				     EXTENT_DEFRAG | EXTENT_DO_ACCOUNTING,</div><div class='ctx'> 				     PAGE_UNLOCK | PAGE_START_WRITEBACK |</div><div class='del'>-				     PAGE_END_WRITEBACK | PAGE_SET_ERROR);</div><div class='add'>+				     PAGE_END_WRITEBACK);</div><div class='ctx'> 	free_async_extent_pages(async_extent);</div><div class='del'>-	kfree(async_extent);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Phase two of compressed writeback.  This is the ordered portion of the code,</div><div class='del'>- * which only gets called in the order the work was queued.  We walk all the</div><div class='del'>- * async extents created by compress_file_range and send them down to the disk.</div><div class='del'>- */</div><div class='del'>-static noinline void submit_compressed_extents(struct async_chunk *async_chunk)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_inode *inode = BTRFS_I(async_chunk-&gt;inode);</div><div class='del'>-	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='del'>-	struct async_extent *async_extent;</div><div class='del'>-	u64 alloc_hint = 0;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	while (!list_empty(&amp;async_chunk-&gt;extents)) {</div><div class='del'>-		u64 extent_start;</div><div class='del'>-		u64 ram_size;</div><div class='del'>-</div><div class='del'>-		async_extent = list_entry(async_chunk-&gt;extents.next,</div><div class='del'>-					  struct async_extent, list);</div><div class='del'>-		list_del(&amp;async_extent-&gt;list);</div><div class='del'>-		extent_start = async_extent-&gt;start;</div><div class='del'>-		ram_size = async_extent-&gt;ram_size;</div><div class='del'>-</div><div class='del'>-		ret = submit_one_async_extent(inode, async_chunk, async_extent,</div><div class='del'>-					      &amp;alloc_hint);</div><div class='del'>-		btrfs_debug(fs_info,</div><div class='add'>+	if (async_chunk-&gt;blkcg_css)</div><div class='add'>+		kthread_associate_blkcg(NULL);</div><div class='add'>+	btrfs_debug(fs_info,</div><div class='ctx'> "async extent submission failed root=%lld inode=%llu start=%llu len=%llu ret=%d",</div><div class='del'>-			    inode-&gt;root-&gt;root_key.objectid,</div><div class='del'>-			    btrfs_ino(inode), extent_start, ram_size, ret);</div><div class='del'>-	}</div><div class='add'>+		    btrfs_root_id(root), btrfs_ino(inode), start,</div><div class='add'>+		    async_extent-&gt;ram_size, ret);</div><div class='add'>+	kfree(async_extent);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static u64 get_extent_allocation_hint(struct btrfs_inode *inode, u64 start,</div><div class='del'>-				      u64 num_bytes)</div><div class='add'>+u64 btrfs_get_extent_allocation_hint(struct btrfs_inode *inode, u64 start,</div><div class='add'>+				     u64 num_bytes)</div><div class='ctx'> {</div><div class='ctx'> 	struct extent_map_tree *em_tree = &amp;inode-&gt;extent_tree;</div><div class='ctx'> 	struct extent_map *em;</div><div class='ctx'> 	u64 alloc_hint = 0;</div><div class='ctx'> </div><div class='ctx'> 	read_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	em = search_extent_mapping(em_tree, start, num_bytes);</div><div class='add'>+	em = btrfs_search_extent_mapping(em_tree, start, num_bytes);</div><div class='ctx'> 	if (em) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * if block start isn't an actual block number then find the</div><div class='ctx'> 		 * first block in this inode and use that as a hint.  If that</div><div class='ctx'> 		 * block is also bogus then just don't worry about it.</div><div class='ctx'> 		 */</div><div class='del'>-		if (em-&gt;block_start &gt;= EXTENT_MAP_LAST_BYTE) {</div><div class='del'>-			free_extent_map(em);</div><div class='del'>-			em = search_extent_mapping(em_tree, 0, 0);</div><div class='del'>-			if (em &amp;&amp; em-&gt;block_start &lt; EXTENT_MAP_LAST_BYTE)</div><div class='del'>-				alloc_hint = em-&gt;block_start;</div><div class='add'>+		if (em-&gt;disk_bytenr &gt;= EXTENT_MAP_LAST_BYTE) {</div><div class='add'>+			btrfs_free_extent_map(em);</div><div class='add'>+			em = btrfs_search_extent_mapping(em_tree, 0, 0);</div><div class='add'>+			if (em &amp;&amp; em-&gt;disk_bytenr &lt; EXTENT_MAP_LAST_BYTE)</div><div class='add'>+				alloc_hint = btrfs_extent_map_block_start(em);</div><div class='ctx'> 			if (em)</div><div class='del'>-				free_extent_map(em);</div><div class='add'>+				btrfs_free_extent_map(em);</div><div class='ctx'> 		} else {</div><div class='del'>-			alloc_hint = em-&gt;block_start;</div><div class='del'>-			free_extent_map(em);</div><div class='add'>+			alloc_hint = btrfs_extent_map_block_start(em);</div><div class='add'>+			btrfs_free_extent_map(em);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	read_unlock(&amp;em_tree-&gt;lock);</div><div class='hunk'>@@ -1103,23 +1256,36 @@ static u64 get_extent_allocation_hint(struct btrfs_inode *inode, u64 start,</div><div class='ctx'>  * allocate extents on disk for the range, and create ordered data structs</div><div class='ctx'>  * in ram to track those extents.</div><div class='ctx'>  *</div><div class='del'>- * locked_page is the page that writepage had locked already.  We use</div><div class='add'>+ * locked_folio is the folio that writepage had locked already.  We use</div><div class='ctx'>  * it to make sure we don't do extra locks or unlocks.</div><div class='ctx'>  *</div><div class='del'>- * *page_started is set to one if we unlock locked_page and do everything</div><div class='del'>- * required to start IO on it.  It may be clean and already done with</div><div class='del'>- * IO when we return.</div><div class='add'>+ * When this function fails, it unlocks all folios except @locked_folio.</div><div class='add'>+ *</div><div class='add'>+ * When this function successfully creates an inline extent, it returns 1 and</div><div class='add'>+ * unlocks all folios including locked_folio and starts I/O on them.</div><div class='add'>+ * (In reality inline extents are limited to a single block, so locked_folio is</div><div class='add'>+ * the only folio handled anyway).</div><div class='add'>+ *</div><div class='add'>+ * When this function succeed and creates a normal extent, the folio locking</div><div class='add'>+ * status depends on the passed in flags:</div><div class='add'>+ *</div><div class='add'>+ * - If COW_FILE_RANGE_KEEP_LOCKED flag is set, all folios are kept locked.</div><div class='add'>+ * - Else all folios except for @locked_folio are unlocked.</div><div class='add'>+ *</div><div class='add'>+ * When a failure happens in the second or later iteration of the</div><div class='add'>+ * while-loop, the ordered extents created in previous iterations are cleaned up.</div><div class='ctx'>  */</div><div class='ctx'> static noinline int cow_file_range(struct btrfs_inode *inode,</div><div class='del'>-				   struct page *locked_page,</div><div class='del'>-				   u64 start, u64 end, int *page_started,</div><div class='del'>-				   unsigned long *nr_written, int unlock)</div><div class='add'>+				   struct folio *locked_folio, u64 start,</div><div class='add'>+				   u64 end, u64 *done_offset,</div><div class='add'>+				   unsigned long flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+	struct extent_state *cached = NULL;</div><div class='ctx'> 	u64 alloc_hint = 0;</div><div class='add'>+	u64 orig_start = start;</div><div class='ctx'> 	u64 num_bytes;</div><div class='del'>-	unsigned long ram_size;</div><div class='ctx'> 	u64 cur_alloc_size = 0;</div><div class='ctx'> 	u64 min_alloc_size;</div><div class='ctx'> 	u64 blocksize = fs_info-&gt;sectorsize;</div><div class='hunk'>@@ -1127,11 +1293,14 @@ static noinline int cow_file_range(struct btrfs_inode *inode,</div><div class='ctx'> 	struct extent_map *em;</div><div class='ctx'> 	unsigned clear_bits;</div><div class='ctx'> 	unsigned long page_ops;</div><div class='del'>-	bool extent_reserved = false;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='add'>+	if (unlikely(btrfs_is_shutdown(fs_info))) {</div><div class='add'>+		ret = -EIO;</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (btrfs_is_free_space_inode(inode)) {</div><div class='del'>-		WARN_ON_ONCE(1);</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1142,57 +1311,36 @@ static noinline int cow_file_range(struct btrfs_inode *inode,</div><div class='ctx'> </div><div class='ctx'> 	inode_should_defrag(inode, start, end, num_bytes, SZ_64K);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Due to the page size limit, for subpage we can only trigger the</div><div class='del'>-	 * writeback for the dirty sectors of page, that means data writeback</div><div class='del'>-	 * is doing more writeback than what we want.</div><div class='del'>-	 *</div><div class='del'>-	 * This is especially unexpected for some call sites like fallocate,</div><div class='del'>-	 * where we only increase i_size after everything is done.</div><div class='del'>-	 * This means we can trigger inline extent even if we didn't want to.</div><div class='del'>-	 * So here we skip inline extent creation completely.</div><div class='del'>-	 */</div><div class='del'>-	if (start == 0 &amp;&amp; fs_info-&gt;sectorsize == PAGE_SIZE) {</div><div class='add'>+	if (!(flags &amp; COW_FILE_RANGE_NO_INLINE)) {</div><div class='ctx'> 		/* lets try to make an inline extent */</div><div class='del'>-		ret = cow_file_range_inline(inode, start, end, 0,</div><div class='del'>-					    BTRFS_COMPRESS_NONE, NULL);</div><div class='del'>-		if (ret == 0) {</div><div class='del'>-			/*</div><div class='del'>-			 * We use DO_ACCOUNTING here because we need the</div><div class='del'>-			 * delalloc_release_metadata to be run _after_ we drop</div><div class='del'>-			 * our outstanding extent for clearing delalloc for this</div><div class='del'>-			 * range.</div><div class='del'>-			 */</div><div class='del'>-			extent_clear_unlock_delalloc(inode, start, end,</div><div class='del'>-				     locked_page,</div><div class='del'>-				     EXTENT_LOCKED | EXTENT_DELALLOC |</div><div class='del'>-				     EXTENT_DELALLOC_NEW | EXTENT_DEFRAG |</div><div class='del'>-				     EXTENT_DO_ACCOUNTING, PAGE_UNLOCK |</div><div class='del'>-				     PAGE_START_WRITEBACK | PAGE_END_WRITEBACK);</div><div class='del'>-			*nr_written = *nr_written +</div><div class='del'>-			     (end - start + PAGE_SIZE) / PAGE_SIZE;</div><div class='del'>-			*page_started = 1;</div><div class='add'>+		ret = cow_file_range_inline(inode, locked_folio, start, end, 0,</div><div class='add'>+					    BTRFS_COMPRESS_NONE, NULL, false);</div><div class='add'>+		if (ret &lt;= 0) {</div><div class='ctx'> 			/*</div><div class='del'>-			 * locked_page is locked by the caller of</div><div class='del'>-			 * writepage_delalloc(), not locked by</div><div class='del'>-			 * __process_pages_contig().</div><div class='del'>-			 *</div><div class='del'>-			 * We can't let __process_pages_contig() to unlock it,</div><div class='del'>-			 * as it doesn't have any subpage::writers recorded.</div><div class='add'>+			 * We succeeded, return 1 so the caller knows we're done</div><div class='add'>+			 * with this page and already handled the IO.</div><div class='ctx'> 			 *</div><div class='del'>-			 * Here we manually unlock the page, since the caller</div><div class='del'>-			 * can't use page_started to determine if it's an</div><div class='del'>-			 * inline extent or a compressed extent.</div><div class='add'>+			 * If there was an error then cow_file_range_inline() has</div><div class='add'>+			 * already done the cleanup.</div><div class='ctx'> 			 */</div><div class='del'>-			unlock_page(locked_page);</div><div class='del'>-			goto out;</div><div class='del'>-		} else if (ret &lt; 0) {</div><div class='del'>-			goto out_unlock;</div><div class='add'>+			if (ret == 0)</div><div class='add'>+				ret = 1;</div><div class='add'>+			goto done;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	alloc_hint = get_extent_allocation_hint(inode, start, num_bytes);</div><div class='del'>-	btrfs_drop_extent_cache(inode, start, start + num_bytes - 1, 0);</div><div class='add'>+	alloc_hint = btrfs_get_extent_allocation_hint(inode, start, num_bytes);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We're not doing compressed IO, don't unlock the first page (which</div><div class='add'>+	 * the caller expects to stay locked), don't clear any dirty bits and</div><div class='add'>+	 * don't set any writeback bits.</div><div class='add'>+	 *</div><div class='add'>+	 * Do set the Ordered (Private2) bit so we know this page was properly</div><div class='add'>+	 * setup for writepage.</div><div class='add'>+	 */</div><div class='add'>+	page_ops = ((flags &amp; COW_FILE_RANGE_KEEP_LOCKED) ? 0 : PAGE_UNLOCK);</div><div class='add'>+	page_ops |= PAGE_SET_ORDERED;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Relocation relies on the relocated extents to have exactly the same</div><div class='hunk'>@@ -1211,39 +1359,82 @@ static noinline int cow_file_range(struct btrfs_inode *inode,</div><div class='ctx'> 		min_alloc_size = fs_info-&gt;sectorsize;</div><div class='ctx'> </div><div class='ctx'> 	while (num_bytes &gt; 0) {</div><div class='del'>-		cur_alloc_size = num_bytes;</div><div class='del'>-		ret = btrfs_reserve_extent(root, cur_alloc_size, cur_alloc_size,</div><div class='add'>+		struct btrfs_ordered_extent *ordered;</div><div class='add'>+		struct btrfs_file_extent file_extent;</div><div class='add'>+</div><div class='add'>+		ret = btrfs_reserve_extent(root, num_bytes, num_bytes,</div><div class='ctx'> 					   min_alloc_size, 0, alloc_hint,</div><div class='del'>-					   &amp;ins, 1, 1);</div><div class='add'>+					   &amp;ins, true, true);</div><div class='add'>+		if (ret == -EAGAIN) {</div><div class='add'>+			/*</div><div class='add'>+			 * btrfs_reserve_extent only returns -EAGAIN for zoned</div><div class='add'>+			 * file systems, which is an indication that there are</div><div class='add'>+			 * no active zones to allocate from at the moment.</div><div class='add'>+			 *</div><div class='add'>+			 * If this is the first loop iteration, wait for at</div><div class='add'>+			 * least one zone to finish before retrying the</div><div class='add'>+			 * allocation.  Otherwise ask the caller to write out</div><div class='add'>+			 * the already allocated blocks before coming back to</div><div class='add'>+			 * us, or return -ENOSPC if it can't handle retries.</div><div class='add'>+			 */</div><div class='add'>+			ASSERT(btrfs_is_zoned(fs_info));</div><div class='add'>+			if (start == orig_start) {</div><div class='add'>+				wait_on_bit_io(&amp;inode-&gt;root-&gt;fs_info-&gt;flags,</div><div class='add'>+					       BTRFS_FS_NEED_ZONE_FINISH,</div><div class='add'>+					       TASK_UNINTERRUPTIBLE);</div><div class='add'>+				continue;</div><div class='add'>+			}</div><div class='add'>+			if (done_offset) {</div><div class='add'>+				/*</div><div class='add'>+				 * Move @end to the end of the processed range,</div><div class='add'>+				 * and exit the loop to unlock the processed extents.</div><div class='add'>+				 */</div><div class='add'>+				end = start - 1;</div><div class='add'>+				ret = 0;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+			ret = -ENOSPC;</div><div class='add'>+		}</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out_unlock;</div><div class='ctx'> 		cur_alloc_size = ins.offset;</div><div class='del'>-		extent_reserved = true;</div><div class='del'>-</div><div class='del'>-		ram_size = ins.offset;</div><div class='del'>-		em = create_io_em(inode, start, ins.offset, /* len */</div><div class='del'>-				  start, /* orig_start */</div><div class='del'>-				  ins.objectid, /* block_start */</div><div class='del'>-				  ins.offset, /* block_len */</div><div class='del'>-				  ins.offset, /* orig_block_len */</div><div class='del'>-				  ram_size, /* ram_bytes */</div><div class='del'>-				  BTRFS_COMPRESS_NONE, /* compress_type */</div><div class='del'>-				  BTRFS_ORDERED_REGULAR /* type */);</div><div class='add'>+</div><div class='add'>+		file_extent.disk_bytenr = ins.objectid;</div><div class='add'>+		file_extent.disk_num_bytes = ins.offset;</div><div class='add'>+		file_extent.num_bytes = ins.offset;</div><div class='add'>+		file_extent.ram_bytes = ins.offset;</div><div class='add'>+		file_extent.offset = 0;</div><div class='add'>+		file_extent.compression = BTRFS_COMPRESS_NONE;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Locked range will be released either during error clean up or</div><div class='add'>+		 * after the whole range is finished.</div><div class='add'>+		 */</div><div class='add'>+		btrfs_lock_extent(&amp;inode-&gt;io_tree, start, start + cur_alloc_size - 1,</div><div class='add'>+				  &amp;cached);</div><div class='add'>+</div><div class='add'>+		em = btrfs_create_io_em(inode, start, &amp;file_extent,</div><div class='add'>+					BTRFS_ORDERED_REGULAR);</div><div class='ctx'> 		if (IS_ERR(em)) {</div><div class='add'>+			btrfs_unlock_extent(&amp;inode-&gt;io_tree, start,</div><div class='add'>+					    start + cur_alloc_size - 1, &amp;cached);</div><div class='ctx'> 			ret = PTR_ERR(em);</div><div class='ctx'> 			goto out_reserve;</div><div class='ctx'> 		}</div><div class='del'>-		free_extent_map(em);</div><div class='add'>+		btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='del'>-		ret = btrfs_add_ordered_extent(inode, start, ins.objectid,</div><div class='del'>-					       ram_size, cur_alloc_size,</div><div class='del'>-					       BTRFS_ORDERED_REGULAR);</div><div class='del'>-		if (ret)</div><div class='add'>+		ordered = btrfs_alloc_ordered_extent(inode, start, &amp;file_extent,</div><div class='add'>+						     1U &lt;&lt; BTRFS_ORDERED_REGULAR);</div><div class='add'>+		if (IS_ERR(ordered)) {</div><div class='add'>+			btrfs_unlock_extent(&amp;inode-&gt;io_tree, start,</div><div class='add'>+					    start + cur_alloc_size - 1, &amp;cached);</div><div class='add'>+			ret = PTR_ERR(ordered);</div><div class='ctx'> 			goto out_drop_extent_cache;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		if (btrfs_is_data_reloc_root(root)) {</div><div class='del'>-			ret = btrfs_reloc_clone_csums(inode, start,</div><div class='del'>-						      cur_alloc_size);</div><div class='add'>+			ret = btrfs_reloc_clone_csums(ordered);</div><div class='add'>+</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Only drop cache here, and process as normal.</div><div class='ctx'> 			 *</div><div class='hunk'>@@ -1256,34 +1447,21 @@ static noinline int cow_file_range(struct btrfs_inode *inode,</div><div class='ctx'> 			 * skip current ordered extent.</div><div class='ctx'> 			 */</div><div class='ctx'> 			if (ret)</div><div class='del'>-				btrfs_drop_extent_cache(inode, start,</div><div class='del'>-						start + ram_size - 1, 0);</div><div class='add'>+				btrfs_drop_extent_map_range(inode, start,</div><div class='add'>+							    start + cur_alloc_size - 1,</div><div class='add'>+							    false);</div><div class='ctx'> 		}</div><div class='add'>+		btrfs_put_ordered_extent(ordered);</div><div class='ctx'> </div><div class='ctx'> 		btrfs_dec_block_group_reservations(fs_info, ins.objectid);</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * We're not doing compressed IO, don't unlock the first page</div><div class='del'>-		 * (which the caller expects to stay locked), don't clear any</div><div class='del'>-		 * dirty bits and don't set any writeback bits</div><div class='del'>-		 *</div><div class='del'>-		 * Do set the Ordered (Private2) bit so we know this page was</div><div class='del'>-		 * properly setup for writepage.</div><div class='del'>-		 */</div><div class='del'>-		page_ops = unlock ? PAGE_UNLOCK : 0;</div><div class='del'>-		page_ops |= PAGE_SET_ORDERED;</div><div class='del'>-</div><div class='del'>-		extent_clear_unlock_delalloc(inode, start, start + ram_size - 1,</div><div class='del'>-					     locked_page,</div><div class='del'>-					     EXTENT_LOCKED | EXTENT_DELALLOC,</div><div class='del'>-					     page_ops);</div><div class='ctx'> 		if (num_bytes &lt; cur_alloc_size)</div><div class='ctx'> 			num_bytes = 0;</div><div class='ctx'> 		else</div><div class='ctx'> 			num_bytes -= cur_alloc_size;</div><div class='ctx'> 		alloc_hint = ins.objectid + ins.offset;</div><div class='ctx'> 		start += cur_alloc_size;</div><div class='del'>-		extent_reserved = false;</div><div class='add'>+		cur_alloc_size = 0;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * btrfs_reloc_clone_csums() error, since start is increased</div><div class='hunk'>@@ -1293,82 +1471,132 @@ static noinline int cow_file_range(struct btrfs_inode *inode,</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto out_unlock;</div><div class='ctx'> 	}</div><div class='del'>-out:</div><div class='add'>+	extent_clear_unlock_delalloc(inode, orig_start, end, locked_folio, &amp;cached,</div><div class='add'>+				     EXTENT_LOCKED | EXTENT_DELALLOC, page_ops);</div><div class='add'>+done:</div><div class='add'>+	if (done_offset)</div><div class='add'>+		*done_offset = end;</div><div class='ctx'> 	return ret;</div><div class='ctx'> </div><div class='ctx'> out_drop_extent_cache:</div><div class='del'>-	btrfs_drop_extent_cache(inode, start, start + ram_size - 1, 0);</div><div class='add'>+	btrfs_drop_extent_map_range(inode, start, start + cur_alloc_size - 1, false);</div><div class='ctx'> out_reserve:</div><div class='ctx'> 	btrfs_dec_block_group_reservations(fs_info, ins.objectid);</div><div class='del'>-	btrfs_free_reserved_extent(fs_info, ins.objectid, ins.offset, 1);</div><div class='add'>+	btrfs_free_reserved_extent(fs_info, ins.objectid, ins.offset, true);</div><div class='ctx'> out_unlock:</div><div class='add'>+	/*</div><div class='add'>+	 * Now, we have three regions to clean up:</div><div class='add'>+	 *</div><div class='add'>+	 * |-------(1)----|---(2)---|-------------(3)----------|</div><div class='add'>+	 * `- orig_start  `- start  `- start + cur_alloc_size  `- end</div><div class='add'>+	 *</div><div class='add'>+	 * We process each region below.</div><div class='add'>+	 */</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * For the range (1). We have already instantiated the ordered extents</div><div class='add'>+	 * for this region, thus we need to cleanup those ordered extents.</div><div class='add'>+	 * EXTENT_DELALLOC_NEW | EXTENT_DEFRAG | EXTENT_CLEAR_META_RESV</div><div class='add'>+	 * are also handled by the ordered extents cleanup.</div><div class='add'>+	 *</div><div class='add'>+	 * So here we only clear EXTENT_LOCKED and EXTENT_DELALLOC flag, and</div><div class='add'>+	 * finish the writeback of the involved folios, which will be never submitted.</div><div class='add'>+	 */</div><div class='add'>+	if (orig_start &lt; start) {</div><div class='add'>+		clear_bits = EXTENT_LOCKED | EXTENT_DELALLOC;</div><div class='add'>+		page_ops = PAGE_UNLOCK | PAGE_START_WRITEBACK | PAGE_END_WRITEBACK;</div><div class='add'>+</div><div class='add'>+		if (!locked_folio)</div><div class='add'>+			mapping_set_error(inode-&gt;vfs_inode.i_mapping, ret);</div><div class='add'>+</div><div class='add'>+		btrfs_cleanup_ordered_extents(inode, orig_start, start - orig_start);</div><div class='add'>+		extent_clear_unlock_delalloc(inode, orig_start, start - 1,</div><div class='add'>+					     locked_folio, NULL, clear_bits, page_ops);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	clear_bits = EXTENT_LOCKED | EXTENT_DELALLOC | EXTENT_DELALLOC_NEW |</div><div class='del'>-		EXTENT_DEFRAG | EXTENT_CLEAR_META_RESV;</div><div class='add'>+		     EXTENT_DEFRAG | EXTENT_CLEAR_META_RESV;</div><div class='ctx'> 	page_ops = PAGE_UNLOCK | PAGE_START_WRITEBACK | PAGE_END_WRITEBACK;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='del'>-	 * If we reserved an extent for our delalloc range (or a subrange) and</div><div class='del'>-	 * failed to create the respective ordered extent, then it means that</div><div class='del'>-	 * when we reserved the extent we decremented the extent's size from</div><div class='del'>-	 * the data space_info's bytes_may_use counter and incremented the</div><div class='del'>-	 * space_info's bytes_reserved counter by the same amount. We must make</div><div class='del'>-	 * sure extent_clear_unlock_delalloc() does not try to decrement again</div><div class='del'>-	 * the data space_info's bytes_may_use counter, therefore we do not pass</div><div class='del'>-	 * it the flag EXTENT_CLEAR_DATA_RESV.</div><div class='add'>+	 * For the range (2). If we reserved an extent for our delalloc range</div><div class='add'>+	 * (or a subrange) and failed to create the respective ordered extent,</div><div class='add'>+	 * then it means that when we reserved the extent we decremented the</div><div class='add'>+	 * extent's size from the data space_info's bytes_may_use counter and</div><div class='add'>+	 * incremented the space_info's bytes_reserved counter by the same</div><div class='add'>+	 * amount. We must make sure extent_clear_unlock_delalloc() does not try</div><div class='add'>+	 * to decrement again the data space_info's bytes_may_use counter,</div><div class='add'>+	 * therefore we do not pass it the flag EXTENT_CLEAR_DATA_RESV.</div><div class='ctx'> 	 */</div><div class='del'>-	if (extent_reserved) {</div><div class='add'>+	if (cur_alloc_size) {</div><div class='ctx'> 		extent_clear_unlock_delalloc(inode, start,</div><div class='ctx'> 					     start + cur_alloc_size - 1,</div><div class='del'>-					     locked_page,</div><div class='del'>-					     clear_bits,</div><div class='add'>+					     locked_folio, &amp;cached, clear_bits,</div><div class='ctx'> 					     page_ops);</div><div class='del'>-		start += cur_alloc_size;</div><div class='del'>-		if (start &gt;= end)</div><div class='del'>-			goto out;</div><div class='add'>+		btrfs_qgroup_free_data(inode, NULL, start, cur_alloc_size, NULL);</div><div class='ctx'> 	}</div><div class='del'>-	extent_clear_unlock_delalloc(inode, start, end, locked_page,</div><div class='del'>-				     clear_bits | EXTENT_CLEAR_DATA_RESV,</div><div class='del'>-				     page_ops);</div><div class='del'>-	goto out;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * work queue call back to started compression on a file and pages</div><div class='del'>- */</div><div class='del'>-static noinline void async_cow_start(struct btrfs_work *work)</div><div class='del'>-{</div><div class='del'>-	struct async_chunk *async_chunk;</div><div class='del'>-	int compressed_extents;</div><div class='ctx'> </div><div class='del'>-	async_chunk = container_of(work, struct async_chunk, work);</div><div class='del'>-</div><div class='del'>-	compressed_extents = compress_file_range(async_chunk);</div><div class='del'>-	if (compressed_extents == 0) {</div><div class='del'>-		btrfs_add_delayed_iput(async_chunk-&gt;inode);</div><div class='del'>-		async_chunk-&gt;inode = NULL;</div><div class='del'>-	}</div><div class='add'>+	/*</div><div class='add'>+	 * For the range (3). We never touched the region. In addition to the</div><div class='add'>+	 * clear_bits above, we add EXTENT_CLEAR_DATA_RESV to release the data</div><div class='add'>+	 * space_info's bytes_may_use counter, reserved in</div><div class='add'>+	 * btrfs_check_data_free_space().</div><div class='add'>+	 */</div><div class='add'>+	if (start + cur_alloc_size &lt; end) {</div><div class='add'>+		clear_bits |= EXTENT_CLEAR_DATA_RESV;</div><div class='add'>+		extent_clear_unlock_delalloc(inode, start + cur_alloc_size,</div><div class='add'>+					     end, locked_folio,</div><div class='add'>+					     &amp;cached, clear_bits, page_ops);</div><div class='add'>+		btrfs_qgroup_free_data(inode, NULL, start + cur_alloc_size,</div><div class='add'>+				       end - start - cur_alloc_size + 1, NULL);</div><div class='add'>+	}</div><div class='add'>+	btrfs_err(fs_info,</div><div class='add'>+"%s failed, root=%llu inode=%llu start=%llu len=%llu cur_offset=%llu cur_alloc_size=%llu: %d",</div><div class='add'>+		  __func__, btrfs_root_id(inode-&gt;root),</div><div class='add'>+		  btrfs_ino(inode), orig_start, end + 1 - orig_start,</div><div class='add'>+		  start, cur_alloc_size, ret);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * work queue call back to submit previously compressed pages</div><div class='add'>+ * Phase two of compressed writeback.  This is the ordered portion of the code,</div><div class='add'>+ * which only gets called in the order the work was queued.  We walk all the</div><div class='add'>+ * async extents created by compress_file_range and send them down to the disk.</div><div class='add'>+ *</div><div class='add'>+ * If called with @do_free == true then it'll try to finish the work and free</div><div class='add'>+ * the work struct eventually.</div><div class='ctx'>  */</div><div class='del'>-static noinline void async_cow_submit(struct btrfs_work *work)</div><div class='add'>+static noinline void submit_compressed_extents(struct btrfs_work *work, bool do_free)</div><div class='ctx'> {</div><div class='ctx'> 	struct async_chunk *async_chunk = container_of(work, struct async_chunk,</div><div class='ctx'> 						     work);</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = btrfs_work_owner(work);</div><div class='add'>+	struct async_extent *async_extent;</div><div class='ctx'> 	unsigned long nr_pages;</div><div class='add'>+	u64 alloc_hint = 0;</div><div class='add'>+</div><div class='add'>+	if (do_free) {</div><div class='add'>+		struct async_cow *async_cow;</div><div class='add'>+</div><div class='add'>+		btrfs_add_delayed_iput(async_chunk-&gt;inode);</div><div class='add'>+		if (async_chunk-&gt;blkcg_css)</div><div class='add'>+			css_put(async_chunk-&gt;blkcg_css);</div><div class='add'>+</div><div class='add'>+		async_cow = async_chunk-&gt;async_cow;</div><div class='add'>+		if (atomic_dec_and_test(&amp;async_cow-&gt;num_chunks))</div><div class='add'>+			kvfree(async_cow);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	nr_pages = (async_chunk-&gt;end - async_chunk-&gt;start + PAGE_SIZE) &gt;&gt;</div><div class='ctx'> 		PAGE_SHIFT;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * -&gt;inode could be NULL if async_chunk_start has failed to compress,</div><div class='del'>-	 * in which case we don't have anything to submit, yet we need to</div><div class='del'>-	 * always adjust -&gt;async_delalloc_pages as its paired with the init</div><div class='del'>-	 * happening in cow_file_range_async</div><div class='del'>-	 */</div><div class='del'>-	if (async_chunk-&gt;inode)</div><div class='del'>-		submit_compressed_extents(async_chunk);</div><div class='add'>+	while (!list_empty(&amp;async_chunk-&gt;extents)) {</div><div class='add'>+		async_extent = list_first_entry(&amp;async_chunk-&gt;extents,</div><div class='add'>+						struct async_extent, list);</div><div class='add'>+		list_del(&amp;async_extent-&gt;list);</div><div class='add'>+		submit_one_async_extent(async_chunk, async_extent, &amp;alloc_hint);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* atomic_sub_return implies a barrier */</div><div class='ctx'> 	if (atomic_sub_return(nr_pages, &amp;fs_info-&gt;async_delalloc_pages) &lt;</div><div class='hunk'>@@ -1376,74 +1604,33 @@ static noinline void async_cow_submit(struct btrfs_work *work)</div><div class='ctx'> 		cond_wake_up_nomb(&amp;fs_info-&gt;async_submit_wait);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline void async_cow_free(struct btrfs_work *work)</div><div class='del'>-{</div><div class='del'>-	struct async_chunk *async_chunk;</div><div class='del'>-	struct async_cow *async_cow;</div><div class='del'>-</div><div class='del'>-	async_chunk = container_of(work, struct async_chunk, work);</div><div class='del'>-	if (async_chunk-&gt;inode)</div><div class='del'>-		btrfs_add_delayed_iput(async_chunk-&gt;inode);</div><div class='del'>-	if (async_chunk-&gt;blkcg_css)</div><div class='del'>-		css_put(async_chunk-&gt;blkcg_css);</div><div class='del'>-</div><div class='del'>-	async_cow = async_chunk-&gt;async_cow;</div><div class='del'>-	if (atomic_dec_and_test(&amp;async_cow-&gt;num_chunks))</div><div class='del'>-		kvfree(async_cow);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int cow_file_range_async(struct btrfs_inode *inode,</div><div class='del'>-				struct writeback_control *wbc,</div><div class='del'>-				struct page *locked_page,</div><div class='del'>-				u64 start, u64 end, int *page_started,</div><div class='del'>-				unsigned long *nr_written)</div><div class='add'>+static bool run_delalloc_compressed(struct btrfs_inode *inode,</div><div class='add'>+				    struct folio *locked_folio, u64 start,</div><div class='add'>+				    u64 end, struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='ctx'> 	struct cgroup_subsys_state *blkcg_css = wbc_blkcg_css(wbc);</div><div class='ctx'> 	struct async_cow *ctx;</div><div class='ctx'> 	struct async_chunk *async_chunk;</div><div class='ctx'> 	unsigned long nr_pages;</div><div class='del'>-	u64 cur_end;</div><div class='ctx'> 	u64 num_chunks = DIV_ROUND_UP(end - start, SZ_512K);</div><div class='ctx'> 	int i;</div><div class='del'>-	bool should_compress;</div><div class='ctx'> 	unsigned nofs_flag;</div><div class='del'>-	const unsigned int write_flags = wbc_to_write_flags(wbc);</div><div class='del'>-</div><div class='del'>-	unlock_extent(&amp;inode-&gt;io_tree, start, end);</div><div class='del'>-</div><div class='del'>-	if (inode-&gt;flags &amp; BTRFS_INODE_NOCOMPRESS &amp;&amp;</div><div class='del'>-	    !btrfs_test_opt(fs_info, FORCE_COMPRESS)) {</div><div class='del'>-		num_chunks = 1;</div><div class='del'>-		should_compress = false;</div><div class='del'>-	} else {</div><div class='del'>-		should_compress = true;</div><div class='del'>-	}</div><div class='add'>+	const blk_opf_t write_flags = wbc_to_write_flags(wbc);</div><div class='ctx'> </div><div class='ctx'> 	nofs_flag = memalloc_nofs_save();</div><div class='ctx'> 	ctx = kvmalloc(struct_size(ctx, chunks, num_chunks), GFP_KERNEL);</div><div class='ctx'> 	memalloc_nofs_restore(nofs_flag);</div><div class='add'>+	if (!ctx)</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-	if (!ctx) {</div><div class='del'>-		unsigned clear_bits = EXTENT_LOCKED | EXTENT_DELALLOC |</div><div class='del'>-			EXTENT_DELALLOC_NEW | EXTENT_DEFRAG |</div><div class='del'>-			EXTENT_DO_ACCOUNTING;</div><div class='del'>-		unsigned long page_ops = PAGE_UNLOCK | PAGE_START_WRITEBACK |</div><div class='del'>-					 PAGE_END_WRITEBACK | PAGE_SET_ERROR;</div><div class='del'>-</div><div class='del'>-		extent_clear_unlock_delalloc(inode, start, end, locked_page,</div><div class='del'>-					     clear_bits, page_ops);</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	}</div><div class='add'>+	set_bit(BTRFS_INODE_HAS_ASYNC_EXTENT, &amp;inode-&gt;runtime_flags);</div><div class='ctx'> </div><div class='ctx'> 	async_chunk = ctx-&gt;chunks;</div><div class='ctx'> 	atomic_set(&amp;ctx-&gt;num_chunks, num_chunks);</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; num_chunks; i++) {</div><div class='del'>-		if (should_compress)</div><div class='del'>-			cur_end = min(end, start + SZ_512K - 1);</div><div class='del'>-		else</div><div class='del'>-			cur_end = end;</div><div class='add'>+		u64 cur_end = min(end, start + SZ_512K - 1);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * igrab is called higher up in the call chain, take only the</div><div class='hunk'>@@ -1451,22 +1638,23 @@ static int cow_file_range_async(struct btrfs_inode *inode,</div><div class='ctx'> 		 */</div><div class='ctx'> 		ihold(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> 		async_chunk[i].async_cow = ctx;</div><div class='del'>-		async_chunk[i].inode = &amp;inode-&gt;vfs_inode;</div><div class='add'>+		async_chunk[i].inode = inode;</div><div class='ctx'> 		async_chunk[i].start = start;</div><div class='ctx'> 		async_chunk[i].end = cur_end;</div><div class='ctx'> 		async_chunk[i].write_flags = write_flags;</div><div class='ctx'> 		INIT_LIST_HEAD(&amp;async_chunk[i].extents);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * The locked_page comes all the way from writepage and its</div><div class='del'>-		 * the original page we were actually given.  As we spread</div><div class='add'>+		 * The locked_folio comes all the way from writepage and its</div><div class='add'>+		 * the original folio we were actually given.  As we spread</div><div class='ctx'> 		 * this large delalloc region across multiple async_chunk</div><div class='del'>-		 * structs, only the first struct needs a pointer to locked_page</div><div class='add'>+		 * structs, only the first struct needs a pointer to</div><div class='add'>+		 * locked_folio.</div><div class='ctx'> 		 *</div><div class='ctx'> 		 * This way we don't need racey decisions about who is supposed</div><div class='ctx'> 		 * to unlock it.</div><div class='ctx'> 		 */</div><div class='del'>-		if (locked_page) {</div><div class='add'>+		if (locked_folio) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Depending on the compressibility, the pages might or</div><div class='ctx'> 			 * might not go through async.  We want all of them to</div><div class='hunk'>@@ -1476,91 +1664,72 @@ static int cow_file_range_async(struct btrfs_inode *inode,</div><div class='ctx'> 			 * need full accuracy.  Just account the whole thing</div><div class='ctx'> 			 * against the first page.</div><div class='ctx'> 			 */</div><div class='del'>-			wbc_account_cgroup_owner(wbc, locked_page,</div><div class='add'>+			wbc_account_cgroup_owner(wbc, locked_folio,</div><div class='ctx'> 						 cur_end - start);</div><div class='del'>-			async_chunk[i].locked_page = locked_page;</div><div class='del'>-			locked_page = NULL;</div><div class='add'>+			async_chunk[i].locked_folio = locked_folio;</div><div class='add'>+			locked_folio = NULL;</div><div class='ctx'> 		} else {</div><div class='del'>-			async_chunk[i].locked_page = NULL;</div><div class='add'>+			async_chunk[i].locked_folio = NULL;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (blkcg_css != blkcg_root_css) {</div><div class='ctx'> 			css_get(blkcg_css);</div><div class='ctx'> 			async_chunk[i].blkcg_css = blkcg_css;</div><div class='add'>+			async_chunk[i].write_flags |= REQ_BTRFS_CGROUP_PUNT;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			async_chunk[i].blkcg_css = NULL;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		btrfs_init_work(&amp;async_chunk[i].work, async_cow_start,</div><div class='del'>-				async_cow_submit, async_cow_free);</div><div class='add'>+		btrfs_init_work(&amp;async_chunk[i].work, compress_file_range,</div><div class='add'>+				submit_compressed_extents);</div><div class='ctx'> </div><div class='ctx'> 		nr_pages = DIV_ROUND_UP(cur_end - start, PAGE_SIZE);</div><div class='ctx'> 		atomic_add(nr_pages, &amp;fs_info-&gt;async_delalloc_pages);</div><div class='ctx'> </div><div class='ctx'> 		btrfs_queue_work(fs_info-&gt;delalloc_workers, &amp;async_chunk[i].work);</div><div class='ctx'> </div><div class='del'>-		*nr_written += nr_pages;</div><div class='ctx'> 		start = cur_end + 1;</div><div class='ctx'> 	}</div><div class='del'>-	*page_started = 1;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static noinline int run_delalloc_zoned(struct btrfs_inode *inode,</div><div class='del'>-				       struct page *locked_page, u64 start,</div><div class='del'>-				       u64 end, int *page_started,</div><div class='del'>-				       unsigned long *nr_written)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ret = cow_file_range(inode, locked_page, start, end, page_started,</div><div class='del'>-			     nr_written, 0);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	if (*page_started)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	__set_page_dirty_nobuffers(locked_page);</div><div class='del'>-	account_page_redirty(locked_page);</div><div class='del'>-	extent_write_locked_range(&amp;inode-&gt;vfs_inode, start, end);</div><div class='del'>-	*page_started = 1;</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline int csum_exist_in_range(struct btrfs_fs_info *fs_info,</div><div class='del'>-					u64 bytenr, u64 num_bytes)</div><div class='add'>+/*</div><div class='add'>+ * Run the delalloc range from start to end, and write back any dirty pages</div><div class='add'>+ * covered by the range.</div><div class='add'>+ */</div><div class='add'>+static noinline int run_delalloc_cow(struct btrfs_inode *inode,</div><div class='add'>+				     struct folio *locked_folio, u64 start,</div><div class='add'>+				     u64 end, struct writeback_control *wbc,</div><div class='add'>+				     bool pages_dirty)</div><div class='ctx'> {</div><div class='add'>+	u64 done_offset = end;</div><div class='ctx'> 	int ret;</div><div class='del'>-	struct btrfs_ordered_sum *sums;</div><div class='del'>-	LIST_HEAD(list);</div><div class='del'>-</div><div class='del'>-	ret = btrfs_lookup_csums_range(fs_info-&gt;csum_root, bytenr,</div><div class='del'>-				       bytenr + num_bytes - 1, &amp;list, 0);</div><div class='del'>-	if (ret == 0 &amp;&amp; list_empty(&amp;list))</div><div class='del'>-		return 0;</div><div class='ctx'> </div><div class='del'>-	while (!list_empty(&amp;list)) {</div><div class='del'>-		sums = list_entry(list.next, struct btrfs_ordered_sum, list);</div><div class='del'>-		list_del(&amp;sums-&gt;list);</div><div class='del'>-		kfree(sums);</div><div class='add'>+	while (start &lt;= end) {</div><div class='add'>+		ret = cow_file_range(inode, locked_folio, start, end,</div><div class='add'>+				     &amp;done_offset, COW_FILE_RANGE_KEEP_LOCKED);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		extent_write_locked_range(&amp;inode-&gt;vfs_inode, locked_folio,</div><div class='add'>+					  start, done_offset, wbc, pages_dirty);</div><div class='add'>+		start = done_offset + 1;</div><div class='ctx'> 	}</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		return ret;</div><div class='add'>+</div><div class='ctx'> 	return 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fallback_to_cow(struct btrfs_inode *inode, struct page *locked_page,</div><div class='del'>-			   const u64 start, const u64 end,</div><div class='del'>-			   int *page_started, unsigned long *nr_written)</div><div class='add'>+static int fallback_to_cow(struct btrfs_inode *inode,</div><div class='add'>+			   struct folio *locked_folio, const u64 start,</div><div class='add'>+			   const u64 end)</div><div class='ctx'> {</div><div class='ctx'> 	const bool is_space_ino = btrfs_is_free_space_inode(inode);</div><div class='ctx'> 	const bool is_reloc_ino = btrfs_is_data_reloc_root(inode-&gt;root);</div><div class='ctx'> 	const u64 range_bytes = end + 1 - start;</div><div class='ctx'> 	struct extent_io_tree *io_tree = &amp;inode-&gt;io_tree;</div><div class='add'>+	struct extent_state *cached_state = NULL;</div><div class='ctx'> 	u64 range_start = start;</div><div class='ctx'> 	u64 count;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If EXTENT_NORESERVE is set it means that when the buffered write was</div><div class='hunk'>@@ -1594,8 +1763,9 @@ static int fallback_to_cow(struct btrfs_inode *inode, struct page *locked_page,</div><div class='ctx'> 	 * group that contains that extent to RO mode and therefore force COW</div><div class='ctx'> 	 * when starting writeback.</div><div class='ctx'> 	 */</div><div class='del'>-	count = count_range_bits(io_tree, &amp;range_start, end, range_bytes,</div><div class='del'>-				 EXTENT_NORESERVE, 0);</div><div class='add'>+	btrfs_lock_extent(io_tree, start, end, &amp;cached_state);</div><div class='add'>+	count = btrfs_count_range_bits(io_tree, &amp;range_start, end, range_bytes,</div><div class='add'>+				       EXTENT_NORESERVE, 0, NULL);</div><div class='ctx'> 	if (count &gt; 0 || is_space_ino || is_reloc_ino) {</div><div class='ctx'> 		u64 bytes = count;</div><div class='ctx'> 		struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='hunk'>@@ -1605,68 +1775,301 @@ static int fallback_to_cow(struct btrfs_inode *inode, struct page *locked_page,</div><div class='ctx'> 			bytes = range_bytes;</div><div class='ctx'> </div><div class='ctx'> 		spin_lock(&amp;sinfo-&gt;lock);</div><div class='del'>-		btrfs_space_info_update_bytes_may_use(fs_info, sinfo, bytes);</div><div class='add'>+		btrfs_space_info_update_bytes_may_use(sinfo, bytes);</div><div class='ctx'> 		spin_unlock(&amp;sinfo-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 		if (count &gt; 0)</div><div class='del'>-			clear_extent_bit(io_tree, start, end, EXTENT_NORESERVE,</div><div class='del'>-					 0, 0, NULL);</div><div class='add'>+			btrfs_clear_extent_bit(io_tree, start, end, EXTENT_NORESERVE,</div><div class='add'>+					       &amp;cached_state);</div><div class='ctx'> 	}</div><div class='add'>+	btrfs_unlock_extent(io_tree, start, end, &amp;cached_state);</div><div class='ctx'> </div><div class='del'>-	return cow_file_range(inode, locked_page, start, end, page_started,</div><div class='del'>-			      nr_written, 1);</div><div class='add'>+	/*</div><div class='add'>+	 * Don't try to create inline extents, as a mix of inline extent that</div><div class='add'>+	 * is written out and unlocked directly and a normal NOCOW extent</div><div class='add'>+	 * doesn't work.</div><div class='add'>+	 *</div><div class='add'>+	 * And here we do not unlock the folio after a successful run.</div><div class='add'>+	 * The folios will be unlocked after everything is finished, or by error handling.</div><div class='add'>+	 *</div><div class='add'>+	 * This is to ensure error handling won't need to clear dirty/ordered flags without</div><div class='add'>+	 * a locked folio, which can race with writeback.</div><div class='add'>+	 */</div><div class='add'>+	ret = cow_file_range(inode, locked_folio, start, end, NULL,</div><div class='add'>+			     COW_FILE_RANGE_NO_INLINE | COW_FILE_RANGE_KEEP_LOCKED);</div><div class='add'>+	ASSERT(ret != 1);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+struct can_nocow_file_extent_args {</div><div class='add'>+	/* Input fields. */</div><div class='add'>+</div><div class='add'>+	/* Start file offset of the range we want to NOCOW. */</div><div class='add'>+	u64 start;</div><div class='add'>+	/* End file offset (inclusive) of the range we want to NOCOW. */</div><div class='add'>+	u64 end;</div><div class='add'>+	bool writeback_path;</div><div class='add'>+	/*</div><div class='add'>+	 * Free the path passed to can_nocow_file_extent() once it's not needed</div><div class='add'>+	 * anymore.</div><div class='add'>+	 */</div><div class='add'>+	bool free_path;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Output fields. Only set when can_nocow_file_extent() returns 1.</div><div class='add'>+	 * The expected file extent for the NOCOW write.</div><div class='add'>+	 */</div><div class='add'>+	struct btrfs_file_extent file_extent;</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> /*</div><div class='del'>- * when nowcow writeback call back.  This checks for snapshots or COW copies</div><div class='add'>+ * Check if we can NOCOW the file extent that the path points to.</div><div class='add'>+ * This function may return with the path released, so the caller should check</div><div class='add'>+ * if path-&gt;nodes[0] is NULL or not if it needs to use the path afterwards.</div><div class='add'>+ *</div><div class='add'>+ * Returns: &lt; 0 on error</div><div class='add'>+ *            0 if we can not NOCOW</div><div class='add'>+ *            1 if we can NOCOW</div><div class='add'>+ */</div><div class='add'>+static int can_nocow_file_extent(struct btrfs_path *path,</div><div class='add'>+				 struct btrfs_key *key,</div><div class='add'>+				 struct btrfs_inode *inode,</div><div class='add'>+				 struct can_nocow_file_extent_args *args)</div><div class='add'>+{</div><div class='add'>+	const bool is_freespace_inode = btrfs_is_free_space_inode(inode);</div><div class='add'>+	struct extent_buffer *leaf = path-&gt;nodes[0];</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	struct btrfs_file_extent_item *fi;</div><div class='add'>+	struct btrfs_root *csum_root;</div><div class='add'>+	u64 io_start;</div><div class='add'>+	u64 extent_end;</div><div class='add'>+	u8 extent_type;</div><div class='add'>+	int can_nocow = 0;</div><div class='add'>+	int ret = 0;</div><div class='add'>+	bool nowait = path-&gt;nowait;</div><div class='add'>+</div><div class='add'>+	fi = btrfs_item_ptr(leaf, path-&gt;slots[0], struct btrfs_file_extent_item);</div><div class='add'>+	extent_type = btrfs_file_extent_type(leaf, fi);</div><div class='add'>+</div><div class='add'>+	if (extent_type == BTRFS_FILE_EXTENT_INLINE)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	if (!(inode-&gt;flags &amp; BTRFS_INODE_NODATACOW) &amp;&amp;</div><div class='add'>+	    extent_type == BTRFS_FILE_EXTENT_REG)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If the extent was created before the generation where the last snapshot</div><div class='add'>+	 * for its subvolume was created, then this implies the extent is shared,</div><div class='add'>+	 * hence we must COW.</div><div class='add'>+	 */</div><div class='add'>+	if (btrfs_file_extent_generation(leaf, fi) &lt;=</div><div class='add'>+	    btrfs_root_last_snapshot(&amp;root-&gt;root_item))</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	/* An explicit hole, must COW. */</div><div class='add'>+	if (btrfs_file_extent_disk_bytenr(leaf, fi) == 0)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	/* Compressed/encrypted/encoded extents must be COWed. */</div><div class='add'>+	if (btrfs_file_extent_compression(leaf, fi) ||</div><div class='add'>+	    btrfs_file_extent_encryption(leaf, fi) ||</div><div class='add'>+	    btrfs_file_extent_other_encoding(leaf, fi))</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	extent_end = btrfs_file_extent_end(path);</div><div class='add'>+</div><div class='add'>+	args-&gt;file_extent.disk_bytenr = btrfs_file_extent_disk_bytenr(leaf, fi);</div><div class='add'>+	args-&gt;file_extent.disk_num_bytes = btrfs_file_extent_disk_num_bytes(leaf, fi);</div><div class='add'>+	args-&gt;file_extent.ram_bytes = btrfs_file_extent_ram_bytes(leaf, fi);</div><div class='add'>+	args-&gt;file_extent.offset = btrfs_file_extent_offset(leaf, fi);</div><div class='add'>+	args-&gt;file_extent.compression = btrfs_file_extent_compression(leaf, fi);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The following checks can be expensive, as they need to take other</div><div class='add'>+	 * locks and do btree or rbtree searches, so release the path to avoid</div><div class='add'>+	 * blocking other tasks for too long.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_release_path(path);</div><div class='add'>+</div><div class='add'>+	ret = btrfs_cross_ref_exist(inode, key-&gt;offset - args-&gt;file_extent.offset,</div><div class='add'>+				    args-&gt;file_extent.disk_bytenr, path);</div><div class='add'>+	WARN_ON_ONCE(ret &gt; 0 &amp;&amp; is_freespace_inode);</div><div class='add'>+	if (ret != 0)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	if (args-&gt;free_path) {</div><div class='add'>+		/*</div><div class='add'>+		 * We don't need the path anymore, plus through the</div><div class='add'>+		 * btrfs_lookup_csums_list() call below we will end up allocating</div><div class='add'>+		 * another path. So free the path to avoid unnecessary extra</div><div class='add'>+		 * memory usage.</div><div class='add'>+		 */</div><div class='add'>+		btrfs_free_path(path);</div><div class='add'>+		path = NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* If there are pending snapshots for this root, we must COW. */</div><div class='add'>+	if (args-&gt;writeback_path &amp;&amp; !is_freespace_inode &amp;&amp;</div><div class='add'>+	    atomic_read(&amp;root-&gt;snapshot_force_cow))</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	args-&gt;file_extent.num_bytes = min(args-&gt;end + 1, extent_end) - args-&gt;start;</div><div class='add'>+	args-&gt;file_extent.offset += args-&gt;start - key-&gt;offset;</div><div class='add'>+	io_start = args-&gt;file_extent.disk_bytenr + args-&gt;file_extent.offset;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Force COW if csums exist in the range. This ensures that csums for a</div><div class='add'>+	 * given extent are either valid or do not exist.</div><div class='add'>+	 */</div><div class='add'>+</div><div class='add'>+	csum_root = btrfs_csum_root(root-&gt;fs_info, io_start);</div><div class='add'>+	ret = btrfs_lookup_csums_list(csum_root, io_start,</div><div class='add'>+				      io_start + args-&gt;file_extent.num_bytes - 1,</div><div class='add'>+				      NULL, nowait);</div><div class='add'>+	WARN_ON_ONCE(ret &gt; 0 &amp;&amp; is_freespace_inode);</div><div class='add'>+	if (ret != 0)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	can_nocow = 1;</div><div class='add'>+ out:</div><div class='add'>+	if (args-&gt;free_path &amp;&amp; path)</div><div class='add'>+		btrfs_free_path(path);</div><div class='add'>+</div><div class='add'>+	return ret &lt; 0 ? ret : can_nocow;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int nocow_one_range(struct btrfs_inode *inode, struct folio *locked_folio,</div><div class='add'>+			   struct extent_state **cached,</div><div class='add'>+			   struct can_nocow_file_extent_args *nocow_args,</div><div class='add'>+			   u64 file_pos, bool is_prealloc)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_ordered_extent *ordered;</div><div class='add'>+	const u64 len = nocow_args-&gt;file_extent.num_bytes;</div><div class='add'>+	const u64 end = file_pos + len - 1;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	btrfs_lock_extent(&amp;inode-&gt;io_tree, file_pos, end, cached);</div><div class='add'>+</div><div class='add'>+	if (is_prealloc) {</div><div class='add'>+		struct extent_map *em;</div><div class='add'>+</div><div class='add'>+		em = btrfs_create_io_em(inode, file_pos, &amp;nocow_args-&gt;file_extent,</div><div class='add'>+					BTRFS_ORDERED_PREALLOC);</div><div class='add'>+		if (IS_ERR(em)) {</div><div class='add'>+			ret = PTR_ERR(em);</div><div class='add'>+			goto error;</div><div class='add'>+		}</div><div class='add'>+		btrfs_free_extent_map(em);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ordered = btrfs_alloc_ordered_extent(inode, file_pos, &amp;nocow_args-&gt;file_extent,</div><div class='add'>+					     is_prealloc</div><div class='add'>+					     ? (1U &lt;&lt; BTRFS_ORDERED_PREALLOC)</div><div class='add'>+					     : (1U &lt;&lt; BTRFS_ORDERED_NOCOW));</div><div class='add'>+	if (IS_ERR(ordered)) {</div><div class='add'>+		if (is_prealloc)</div><div class='add'>+			btrfs_drop_extent_map_range(inode, file_pos, end, false);</div><div class='add'>+		ret = PTR_ERR(ordered);</div><div class='add'>+		goto error;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (btrfs_is_data_reloc_root(inode-&gt;root))</div><div class='add'>+		/*</div><div class='add'>+		 * Errors are handled later, as we must prevent</div><div class='add'>+		 * extent_clear_unlock_delalloc() in error handler from freeing</div><div class='add'>+		 * metadata of the created ordered extent.</div><div class='add'>+		 */</div><div class='add'>+		ret = btrfs_reloc_clone_csums(ordered);</div><div class='add'>+	btrfs_put_ordered_extent(ordered);</div><div class='add'>+</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto error;</div><div class='add'>+	extent_clear_unlock_delalloc(inode, file_pos, end, locked_folio, cached,</div><div class='add'>+				     EXTENT_LOCKED | EXTENT_DELALLOC |</div><div class='add'>+				     EXTENT_CLEAR_DATA_RESV,</div><div class='add'>+				     PAGE_SET_ORDERED);</div><div class='add'>+	return ret;</div><div class='add'>+</div><div class='add'>+error:</div><div class='add'>+	btrfs_cleanup_ordered_extents(inode, file_pos, len);</div><div class='add'>+	extent_clear_unlock_delalloc(inode, file_pos, end, locked_folio, cached,</div><div class='add'>+				     EXTENT_LOCKED | EXTENT_DELALLOC |</div><div class='add'>+				     EXTENT_CLEAR_DATA_RESV,</div><div class='add'>+				     PAGE_UNLOCK | PAGE_START_WRITEBACK |</div><div class='add'>+				     PAGE_END_WRITEBACK);</div><div class='add'>+	btrfs_err(inode-&gt;root-&gt;fs_info,</div><div class='add'>+		  "%s failed, root=%lld inode=%llu start=%llu len=%llu: %d",</div><div class='add'>+		  __func__, btrfs_root_id(inode-&gt;root), btrfs_ino(inode),</div><div class='add'>+		  file_pos, len, ret);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * When nocow writeback calls back.  This checks for snapshots or COW copies</div><div class='ctx'>  * of the extents that exist in the file, and COWs the file as required.</div><div class='ctx'>  *</div><div class='ctx'>  * If no cow copies or snapshots exist, we write directly to the existing</div><div class='ctx'>  * blocks on disk</div><div class='ctx'>  */</div><div class='ctx'> static noinline int run_delalloc_nocow(struct btrfs_inode *inode,</div><div class='del'>-				       struct page *locked_page,</div><div class='del'>-				       const u64 start, const u64 end,</div><div class='del'>-				       int *page_started,</div><div class='del'>-				       unsigned long *nr_written)</div><div class='add'>+				       struct folio *locked_folio,</div><div class='add'>+				       const u64 start, const u64 end)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_root *root = inode-&gt;root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	struct btrfs_path *path = NULL;</div><div class='ctx'> 	u64 cow_start = (u64)-1;</div><div class='add'>+	/*</div><div class='add'>+	 * If not 0, represents the inclusive end of the last fallback_to_cow()</div><div class='add'>+	 * range. Only for error handling.</div><div class='add'>+	 *</div><div class='add'>+	 * The same for nocow_end, it's to avoid double cleaning up the range</div><div class='add'>+	 * already cleaned by nocow_one_range().</div><div class='add'>+	 */</div><div class='add'>+	u64 cow_end = 0;</div><div class='add'>+	u64 nocow_end = 0;</div><div class='ctx'> 	u64 cur_offset = start;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	bool check_prev = true;</div><div class='del'>-	const bool freespace_inode = btrfs_is_free_space_inode(inode);</div><div class='ctx'> 	u64 ino = btrfs_ino(inode);</div><div class='del'>-	bool nocow = false;</div><div class='del'>-	u64 disk_bytenr = 0;</div><div class='del'>-	const bool force = inode-&gt;flags &amp; BTRFS_INODE_NODATACOW;</div><div class='add'>+	struct can_nocow_file_extent_args nocow_args = { 0 };</div><div class='add'>+	/* The range that has ordered extent(s). */</div><div class='add'>+	u64 oe_cleanup_start;</div><div class='add'>+	u64 oe_cleanup_len = 0;</div><div class='add'>+	/* The range that is untouched. */</div><div class='add'>+	u64 untouched_start;</div><div class='add'>+	u64 untouched_len = 0;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Normally on a zoned device we're only doing COW writes, but in case</div><div class='add'>+	 * of relocation on a zoned filesystem serializes I/O so that we're only</div><div class='add'>+	 * writing sequentially and can end up here as well.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(!btrfs_is_zoned(fs_info) || btrfs_is_data_reloc_root(root));</div><div class='add'>+</div><div class='add'>+	if (unlikely(btrfs_is_shutdown(fs_info))) {</div><div class='add'>+		ret = -EIO;</div><div class='add'>+		goto error;</div><div class='add'>+	}</div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path) {</div><div class='del'>-		extent_clear_unlock_delalloc(inode, start, end, locked_page,</div><div class='del'>-					     EXTENT_LOCKED | EXTENT_DELALLOC |</div><div class='del'>-					     EXTENT_DO_ACCOUNTING |</div><div class='del'>-					     EXTENT_DEFRAG, PAGE_UNLOCK |</div><div class='del'>-					     PAGE_START_WRITEBACK |</div><div class='del'>-					     PAGE_END_WRITEBACK);</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	while (1) {</div><div class='add'>+	nocow_args.end = end;</div><div class='add'>+	nocow_args.writeback_path = true;</div><div class='add'>+</div><div class='add'>+	while (cur_offset &lt;= end) {</div><div class='add'>+		struct btrfs_block_group *nocow_bg = NULL;</div><div class='ctx'> 		struct btrfs_key found_key;</div><div class='ctx'> 		struct btrfs_file_extent_item *fi;</div><div class='ctx'> 		struct extent_buffer *leaf;</div><div class='add'>+		struct extent_state *cached_state = NULL;</div><div class='ctx'> 		u64 extent_end;</div><div class='del'>-		u64 extent_offset;</div><div class='del'>-		u64 num_bytes = 0;</div><div class='del'>-		u64 disk_num_bytes;</div><div class='del'>-		u64 ram_bytes;</div><div class='ctx'> 		int extent_type;</div><div class='ctx'> </div><div class='del'>-		nocow = false;</div><div class='del'>-</div><div class='ctx'> 		ret = btrfs_lookup_file_extent(NULL, root, path, ino,</div><div class='ctx'> 					       cur_offset, 0);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='hunk'>@@ -1691,11 +2094,8 @@ next_slot:</div><div class='ctx'> 		leaf = path-&gt;nodes[0];</div><div class='ctx'> 		if (path-&gt;slots[0] &gt;= btrfs_header_nritems(leaf)) {</div><div class='ctx'> 			ret = btrfs_next_leaf(root, path);</div><div class='del'>-			if (ret &lt; 0) {</div><div class='del'>-				if (cow_start != (u64)-1)</div><div class='del'>-					cur_offset = cow_start;</div><div class='add'>+			if (ret &lt; 0)</div><div class='ctx'> 				goto error;</div><div class='del'>-			}</div><div class='ctx'> 			if (ret &gt; 0)</div><div class='ctx'> 				break;</div><div class='ctx'> 			leaf = path-&gt;nodes[0];</div><div class='hunk'>@@ -1723,12 +2123,13 @@ next_slot:</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * If the found extent starts after requested offset, then</div><div class='del'>-		 * adjust extent_end to be right before this extent begins</div><div class='add'>+		 * adjust cur_offset to be right before this extent begins.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (found_key.offset &gt; cur_offset) {</div><div class='del'>-			extent_end = found_key.offset;</div><div class='del'>-			extent_type = 0;</div><div class='del'>-			goto out_check;</div><div class='add'>+			if (cow_start == (u64)-1)</div><div class='add'>+				cow_start = cur_offset;</div><div class='add'>+			cur_offset = found_key.offset;</div><div class='add'>+			goto next_slot;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='hunk'>@@ -1738,122 +2139,43 @@ next_slot:</div><div class='ctx'> 		fi = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='ctx'> 				    struct btrfs_file_extent_item);</div><div class='ctx'> 		extent_type = btrfs_file_extent_type(leaf, fi);</div><div class='add'>+		/* If this is triggered then we have a memory corruption. */</div><div class='add'>+		ASSERT(extent_type &lt; BTRFS_NR_FILE_EXTENT_TYPES);</div><div class='add'>+		if (WARN_ON(extent_type &gt;= BTRFS_NR_FILE_EXTENT_TYPES)) {</div><div class='add'>+			ret = -EUCLEAN;</div><div class='add'>+			goto error;</div><div class='add'>+		}</div><div class='add'>+		extent_end = btrfs_file_extent_end(path);</div><div class='ctx'> </div><div class='del'>-		ram_bytes = btrfs_file_extent_ram_bytes(leaf, fi);</div><div class='del'>-		if (extent_type == BTRFS_FILE_EXTENT_REG ||</div><div class='del'>-		    extent_type == BTRFS_FILE_EXTENT_PREALLOC) {</div><div class='del'>-			disk_bytenr = btrfs_file_extent_disk_bytenr(leaf, fi);</div><div class='del'>-			extent_offset = btrfs_file_extent_offset(leaf, fi);</div><div class='del'>-			extent_end = found_key.offset +</div><div class='del'>-				btrfs_file_extent_num_bytes(leaf, fi);</div><div class='del'>-			disk_num_bytes =</div><div class='del'>-				btrfs_file_extent_disk_num_bytes(leaf, fi);</div><div class='del'>-			/*</div><div class='del'>-			 * If the extent we got ends before our current offset,</div><div class='del'>-			 * skip to the next extent.</div><div class='del'>-			 */</div><div class='del'>-			if (extent_end &lt;= cur_offset) {</div><div class='del'>-				path-&gt;slots[0]++;</div><div class='del'>-				goto next_slot;</div><div class='del'>-			}</div><div class='del'>-			/* Skip holes */</div><div class='del'>-			if (disk_bytenr == 0)</div><div class='del'>-				goto out_check;</div><div class='del'>-			/* Skip compressed/encrypted/encoded extents */</div><div class='del'>-			if (btrfs_file_extent_compression(leaf, fi) ||</div><div class='del'>-			    btrfs_file_extent_encryption(leaf, fi) ||</div><div class='del'>-			    btrfs_file_extent_other_encoding(leaf, fi))</div><div class='del'>-				goto out_check;</div><div class='del'>-			/*</div><div class='del'>-			 * If extent is created before the last volume's snapshot</div><div class='del'>-			 * this implies the extent is shared, hence we can't do</div><div class='del'>-			 * nocow. This is the same check as in</div><div class='del'>-			 * btrfs_cross_ref_exist but without calling</div><div class='del'>-			 * btrfs_search_slot.</div><div class='del'>-			 */</div><div class='del'>-			if (!freespace_inode &amp;&amp;</div><div class='del'>-			    btrfs_file_extent_generation(leaf, fi) &lt;=</div><div class='del'>-			    btrfs_root_last_snapshot(&amp;root-&gt;root_item))</div><div class='del'>-				goto out_check;</div><div class='del'>-			if (extent_type == BTRFS_FILE_EXTENT_REG &amp;&amp; !force)</div><div class='del'>-				goto out_check;</div><div class='add'>+		/*</div><div class='add'>+		 * If the extent we got ends before our current offset, skip to</div><div class='add'>+		 * the next extent.</div><div class='add'>+		 */</div><div class='add'>+		if (extent_end &lt;= cur_offset) {</div><div class='add'>+			path-&gt;slots[0]++;</div><div class='add'>+			goto next_slot;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-			/*</div><div class='del'>-			 * The following checks can be expensive, as they need to</div><div class='del'>-			 * take other locks and do btree or rbtree searches, so</div><div class='del'>-			 * release the path to avoid blocking other tasks for too</div><div class='del'>-			 * long.</div><div class='del'>-			 */</div><div class='del'>-			btrfs_release_path(path);</div><div class='add'>+		nocow_args.start = cur_offset;</div><div class='add'>+		ret = can_nocow_file_extent(path, &amp;found_key, inode, &amp;nocow_args);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto error;</div><div class='add'>+		if (ret == 0)</div><div class='add'>+			goto must_cow;</div><div class='ctx'> </div><div class='del'>-			ret = btrfs_cross_ref_exist(root, ino,</div><div class='del'>-						    found_key.offset -</div><div class='del'>-						    extent_offset, disk_bytenr, false);</div><div class='del'>-			if (ret) {</div><div class='del'>-				/*</div><div class='del'>-				 * ret could be -EIO if the above fails to read</div><div class='del'>-				 * metadata.</div><div class='del'>-				 */</div><div class='del'>-				if (ret &lt; 0) {</div><div class='del'>-					if (cow_start != (u64)-1)</div><div class='del'>-						cur_offset = cow_start;</div><div class='del'>-					goto error;</div><div class='del'>-				}</div><div class='del'>-</div><div class='del'>-				WARN_ON_ONCE(freespace_inode);</div><div class='del'>-				goto out_check;</div><div class='del'>-			}</div><div class='del'>-			disk_bytenr += extent_offset;</div><div class='del'>-			disk_bytenr += cur_offset - found_key.offset;</div><div class='del'>-			num_bytes = min(end + 1, extent_end) - cur_offset;</div><div class='del'>-			/*</div><div class='del'>-			 * If there are pending snapshots for this root, we</div><div class='del'>-			 * fall into common COW way</div><div class='del'>-			 */</div><div class='del'>-			if (!freespace_inode &amp;&amp; atomic_read(&amp;root-&gt;snapshot_force_cow))</div><div class='del'>-				goto out_check;</div><div class='add'>+		ret = 0;</div><div class='add'>+		nocow_bg = btrfs_inc_nocow_writers(fs_info,</div><div class='add'>+				nocow_args.file_extent.disk_bytenr +</div><div class='add'>+				nocow_args.file_extent.offset);</div><div class='add'>+		if (!nocow_bg) {</div><div class='add'>+must_cow:</div><div class='ctx'> 			/*</div><div class='del'>-			 * force cow if csum exists in the range.</div><div class='del'>-			 * this ensure that csum for a given extent are</div><div class='del'>-			 * either valid or do not exist.</div><div class='add'>+			 * If we can't perform NOCOW writeback for the range,</div><div class='add'>+			 * then record the beginning of the range that needs to</div><div class='add'>+			 * be COWed.  It will be written out before the next</div><div class='add'>+			 * NOCOW range if we find one, or when exiting this</div><div class='add'>+			 * loop.</div><div class='ctx'> 			 */</div><div class='del'>-			ret = csum_exist_in_range(fs_info, disk_bytenr,</div><div class='del'>-						  num_bytes);</div><div class='del'>-			if (ret) {</div><div class='del'>-				/*</div><div class='del'>-				 * ret could be -EIO if the above fails to read</div><div class='del'>-				 * metadata.</div><div class='del'>-				 */</div><div class='del'>-				if (ret &lt; 0) {</div><div class='del'>-					if (cow_start != (u64)-1)</div><div class='del'>-						cur_offset = cow_start;</div><div class='del'>-					goto error;</div><div class='del'>-				}</div><div class='del'>-				WARN_ON_ONCE(freespace_inode);</div><div class='del'>-				goto out_check;</div><div class='del'>-			}</div><div class='del'>-			/* If the extent's block group is RO, we must COW */</div><div class='del'>-			if (!btrfs_inc_nocow_writers(fs_info, disk_bytenr))</div><div class='del'>-				goto out_check;</div><div class='del'>-			nocow = true;</div><div class='del'>-		} else if (extent_type == BTRFS_FILE_EXTENT_INLINE) {</div><div class='del'>-			extent_end = found_key.offset + ram_bytes;</div><div class='del'>-			extent_end = ALIGN(extent_end, fs_info-&gt;sectorsize);</div><div class='del'>-			/* Skip extents outside of our requested range */</div><div class='del'>-			if (extent_end &lt;= start) {</div><div class='del'>-				path-&gt;slots[0]++;</div><div class='del'>-				goto next_slot;</div><div class='del'>-			}</div><div class='del'>-		} else {</div><div class='del'>-			/* If this triggers then we have a memory corruption */</div><div class='del'>-			BUG();</div><div class='del'>-		}</div><div class='del'>-out_check:</div><div class='del'>-		/*</div><div class='del'>-		 * If nocow is false then record the beginning of the range</div><div class='del'>-		 * that needs to be COWed</div><div class='del'>-		 */</div><div class='del'>-		if (!nocow) {</div><div class='ctx'> 			if (cow_start == (u64)-1)</div><div class='ctx'> 				cow_start = cur_offset;</div><div class='ctx'> 			cur_offset = extent_end;</div><div class='hunk'>@@ -1871,80 +2193,25 @@ out_check:</div><div class='ctx'> 		 * NOCOW, following one which needs to be COW'ed</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (cow_start != (u64)-1) {</div><div class='del'>-			ret = fallback_to_cow(inode, locked_page,</div><div class='del'>-					      cow_start, found_key.offset - 1,</div><div class='del'>-					      page_started, nr_written);</div><div class='del'>-			if (ret)</div><div class='del'>-				goto error;</div><div class='del'>-			cow_start = (u64)-1;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (extent_type == BTRFS_FILE_EXTENT_PREALLOC) {</div><div class='del'>-			u64 orig_start = found_key.offset - extent_offset;</div><div class='del'>-			struct extent_map *em;</div><div class='del'>-</div><div class='del'>-			em = create_io_em(inode, cur_offset, num_bytes,</div><div class='del'>-					  orig_start,</div><div class='del'>-					  disk_bytenr, /* block_start */</div><div class='del'>-					  num_bytes, /* block_len */</div><div class='del'>-					  disk_num_bytes, /* orig_block_len */</div><div class='del'>-					  ram_bytes, BTRFS_COMPRESS_NONE,</div><div class='del'>-					  BTRFS_ORDERED_PREALLOC);</div><div class='del'>-			if (IS_ERR(em)) {</div><div class='del'>-				ret = PTR_ERR(em);</div><div class='del'>-				goto error;</div><div class='del'>-			}</div><div class='del'>-			free_extent_map(em);</div><div class='del'>-			ret = btrfs_add_ordered_extent(inode, cur_offset,</div><div class='del'>-						       disk_bytenr, num_bytes,</div><div class='del'>-						       num_bytes,</div><div class='del'>-						       BTRFS_ORDERED_PREALLOC);</div><div class='add'>+			ret = fallback_to_cow(inode, locked_folio, cow_start,</div><div class='add'>+					      found_key.offset - 1);</div><div class='ctx'> 			if (ret) {</div><div class='del'>-				btrfs_drop_extent_cache(inode, cur_offset,</div><div class='del'>-							cur_offset + num_bytes - 1,</div><div class='del'>-							0);</div><div class='add'>+				cow_end = found_key.offset - 1;</div><div class='add'>+				btrfs_dec_nocow_writers(nocow_bg);</div><div class='ctx'> 				goto error;</div><div class='ctx'> 			}</div><div class='del'>-		} else {</div><div class='del'>-			ret = btrfs_add_ordered_extent(inode, cur_offset,</div><div class='del'>-						       disk_bytenr, num_bytes,</div><div class='del'>-						       num_bytes,</div><div class='del'>-						       BTRFS_ORDERED_NOCOW);</div><div class='del'>-			if (ret)</div><div class='del'>-				goto error;</div><div class='add'>+			cow_start = (u64)-1;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (nocow)</div><div class='del'>-			btrfs_dec_nocow_writers(fs_info, disk_bytenr);</div><div class='del'>-		nocow = false;</div><div class='del'>-</div><div class='del'>-		if (btrfs_is_data_reloc_root(root))</div><div class='del'>-			/*</div><div class='del'>-			 * Error handled later, as we must prevent</div><div class='del'>-			 * extent_clear_unlock_delalloc() in error handler</div><div class='del'>-			 * from freeing metadata of created ordered extent.</div><div class='del'>-			 */</div><div class='del'>-			ret = btrfs_reloc_clone_csums(inode, cur_offset,</div><div class='del'>-						      num_bytes);</div><div class='del'>-</div><div class='del'>-		extent_clear_unlock_delalloc(inode, cur_offset,</div><div class='del'>-					     cur_offset + num_bytes - 1,</div><div class='del'>-					     locked_page, EXTENT_LOCKED |</div><div class='del'>-					     EXTENT_DELALLOC |</div><div class='del'>-					     EXTENT_CLEAR_DATA_RESV,</div><div class='del'>-					     PAGE_UNLOCK | PAGE_SET_ORDERED);</div><div class='del'>-</div><div class='del'>-		cur_offset = extent_end;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * btrfs_reloc_clone_csums() error, now we're OK to call error</div><div class='del'>-		 * handler, as metadata for created ordered extent will only</div><div class='del'>-		 * be freed by btrfs_finish_ordered_io().</div><div class='del'>-		 */</div><div class='del'>-		if (ret)</div><div class='add'>+		ret = nocow_one_range(inode, locked_folio, &amp;cached_state,</div><div class='add'>+				      &amp;nocow_args, cur_offset,</div><div class='add'>+				      extent_type == BTRFS_FILE_EXTENT_PREALLOC);</div><div class='add'>+		btrfs_dec_nocow_writers(nocow_bg);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			nocow_end = cur_offset + nocow_args.file_extent.num_bytes - 1;</div><div class='ctx'> 			goto error;</div><div class='del'>-		if (cur_offset &gt; end)</div><div class='del'>-			break;</div><div class='add'>+		}</div><div class='add'>+		cur_offset = extent_end;</div><div class='ctx'> 	}</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='hunk'>@@ -1952,25 +2219,113 @@ out_check:</div><div class='ctx'> 		cow_start = cur_offset;</div><div class='ctx'> </div><div class='ctx'> 	if (cow_start != (u64)-1) {</div><div class='del'>-		cur_offset = end;</div><div class='del'>-		ret = fallback_to_cow(inode, locked_page, cow_start, end,</div><div class='del'>-				      page_started, nr_written);</div><div class='del'>-		if (ret)</div><div class='add'>+		ret = fallback_to_cow(inode, locked_folio, cow_start, end);</div><div class='add'>+		if (ret) {</div><div class='add'>+			cow_end = end;</div><div class='ctx'> 			goto error;</div><div class='add'>+		}</div><div class='add'>+		cow_start = (u64)-1;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Everything is finished without an error, can unlock the folios now.</div><div class='add'>+	 *</div><div class='add'>+	 * No need to touch the io tree range nor set folio ordered flag, as</div><div class='add'>+	 * fallback_to_cow() and nocow_one_range() have already handled them.</div><div class='add'>+	 */</div><div class='add'>+	extent_clear_unlock_delalloc(inode, start, end, locked_folio, NULL, 0, PAGE_UNLOCK);</div><div class='add'>+</div><div class='add'>+	btrfs_free_path(path);</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='ctx'> error:</div><div class='del'>-	if (nocow)</div><div class='del'>-		btrfs_dec_nocow_writers(fs_info, disk_bytenr);</div><div class='add'>+	if (cow_start == (u64)-1) {</div><div class='add'>+		/*</div><div class='add'>+		 * case a)</div><div class='add'>+		 *    start           cur_offset               end</div><div class='add'>+		 *    |   OE cleanup  |       Untouched        |</div><div class='add'>+		 *</div><div class='add'>+		 * We finished a fallback_to_cow() or nocow_one_range() call,</div><div class='add'>+		 * but failed to check the next range.</div><div class='add'>+		 *</div><div class='add'>+		 * or</div><div class='add'>+		 *    start           cur_offset   nocow_end   end</div><div class='add'>+		 *    |   OE cleanup  |   Skip     | Untouched |</div><div class='add'>+		 *</div><div class='add'>+		 * nocow_one_range() failed, the range [cur_offset, nocow_end] is</div><div class='add'>+		 * already cleaned up.</div><div class='add'>+		 */</div><div class='add'>+		oe_cleanup_start = start;</div><div class='add'>+		oe_cleanup_len = cur_offset - start;</div><div class='add'>+		if (nocow_end)</div><div class='add'>+			untouched_start = nocow_end + 1;</div><div class='add'>+		else</div><div class='add'>+			untouched_start = cur_offset;</div><div class='add'>+		untouched_len = end + 1 - untouched_start;</div><div class='add'>+	} else if (cow_start != (u64)-1 &amp;&amp; cow_end == 0) {</div><div class='add'>+		/*</div><div class='add'>+		 * case b)</div><div class='add'>+		 *    start        cow_start    cur_offset   end</div><div class='add'>+		 *    | OE cleanup |        Untouched        |</div><div class='add'>+		 *</div><div class='add'>+		 * We got a range that needs COW, but before we hit the next NOCOW range,</div><div class='add'>+		 * thus [cow_start, cur_offset) doesn't yet have any OE.</div><div class='add'>+		 */</div><div class='add'>+		oe_cleanup_start = start;</div><div class='add'>+		oe_cleanup_len = cow_start - start;</div><div class='add'>+		untouched_start = cow_start;</div><div class='add'>+		untouched_len = end + 1 - untouched_start;</div><div class='add'>+	} else {</div><div class='add'>+		/*</div><div class='add'>+		 * case c)</div><div class='add'>+		 *    start        cow_start    cow_end      end</div><div class='add'>+		 *    | OE cleanup |   Skip     |  Untouched |</div><div class='add'>+		 *</div><div class='add'>+		 * fallback_to_cow() failed, and fallback_to_cow() will do the</div><div class='add'>+		 * cleanup for its range, we shouldn't touch the range</div><div class='add'>+		 * [cow_start, cow_end].</div><div class='add'>+		 */</div><div class='add'>+		ASSERT(cow_start != (u64)-1 &amp;&amp; cow_end != 0);</div><div class='add'>+		oe_cleanup_start = start;</div><div class='add'>+		oe_cleanup_len = cow_start - start;</div><div class='add'>+		untouched_start = cow_end + 1;</div><div class='add'>+		untouched_len = end + 1 - untouched_start;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (oe_cleanup_len) {</div><div class='add'>+		const u64 oe_cleanup_end = oe_cleanup_start + oe_cleanup_len - 1;</div><div class='add'>+		btrfs_cleanup_ordered_extents(inode, oe_cleanup_start, oe_cleanup_len);</div><div class='add'>+		extent_clear_unlock_delalloc(inode, oe_cleanup_start, oe_cleanup_end,</div><div class='add'>+					     locked_folio, NULL,</div><div class='add'>+					     EXTENT_LOCKED | EXTENT_DELALLOC,</div><div class='add'>+					     PAGE_UNLOCK | PAGE_START_WRITEBACK |</div><div class='add'>+					     PAGE_END_WRITEBACK);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (untouched_len) {</div><div class='add'>+		struct extent_state *cached = NULL;</div><div class='add'>+		const u64 untouched_end = untouched_start + untouched_len - 1;</div><div class='ctx'> </div><div class='del'>-	if (ret &amp;&amp; cur_offset &lt; end)</div><div class='del'>-		extent_clear_unlock_delalloc(inode, cur_offset, end,</div><div class='del'>-					     locked_page, EXTENT_LOCKED |</div><div class='del'>-					     EXTENT_DELALLOC | EXTENT_DEFRAG |</div><div class='add'>+		/*</div><div class='add'>+		 * We need to lock the extent here because we're clearing DELALLOC and</div><div class='add'>+		 * we're not locked at this point.</div><div class='add'>+		 */</div><div class='add'>+		btrfs_lock_extent(&amp;inode-&gt;io_tree, untouched_start, untouched_end, &amp;cached);</div><div class='add'>+		extent_clear_unlock_delalloc(inode, untouched_start, untouched_end,</div><div class='add'>+					     locked_folio, &amp;cached,</div><div class='add'>+					     EXTENT_LOCKED | EXTENT_DELALLOC |</div><div class='add'>+					     EXTENT_DEFRAG |</div><div class='ctx'> 					     EXTENT_DO_ACCOUNTING, PAGE_UNLOCK |</div><div class='ctx'> 					     PAGE_START_WRITEBACK |</div><div class='ctx'> 					     PAGE_END_WRITEBACK);</div><div class='add'>+		btrfs_qgroup_free_data(inode, NULL, untouched_start, untouched_len, NULL);</div><div class='add'>+	}</div><div class='ctx'> 	btrfs_free_path(path);</div><div class='add'>+	btrfs_err(fs_info,</div><div class='add'>+"%s failed, root=%llu inode=%llu start=%llu len=%llu cur_offset=%llu oe_cleanup=%llu oe_cleanup_len=%llu untouched_start=%llu untouched_len=%llu: %d",</div><div class='add'>+		  __func__, btrfs_root_id(inode-&gt;root), btrfs_ino(inode),</div><div class='add'>+		  start, end + 1 - start, cur_offset, oe_cleanup_start, oe_cleanup_len,</div><div class='add'>+		  untouched_start, untouched_len, ret);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1978,8 +2333,7 @@ static bool should_nocow(struct btrfs_inode *inode, u64 start, u64 end)</div><div class='ctx'> {</div><div class='ctx'> 	if (inode-&gt;flags &amp; (BTRFS_INODE_NODATACOW | BTRFS_INODE_PREALLOC)) {</div><div class='ctx'> 		if (inode-&gt;defrag_bytes &amp;&amp;</div><div class='del'>-		    test_range_bit(&amp;inode-&gt;io_tree, start, end, EXTENT_DEFRAG,</div><div class='del'>-				   0, NULL))</div><div class='add'>+		    btrfs_test_range_bit_exists(&amp;inode-&gt;io_tree, start, end, EXTENT_DEFRAG))</div><div class='ctx'> 			return false;</div><div class='ctx'> 		return true;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1990,63 +2344,51 @@ static bool should_nocow(struct btrfs_inode *inode, u64 start, u64 end)</div><div class='ctx'>  * Function to process delayed allocation (create CoW) for ranges which are</div><div class='ctx'>  * being touched for the first time.</div><div class='ctx'>  */</div><div class='del'>-int btrfs_run_delalloc_range(struct btrfs_inode *inode, struct page *locked_page,</div><div class='del'>-		u64 start, u64 end, int *page_started, unsigned long *nr_written,</div><div class='del'>-		struct writeback_control *wbc)</div><div class='add'>+int btrfs_run_delalloc_range(struct btrfs_inode *inode, struct folio *locked_folio,</div><div class='add'>+			     u64 start, u64 end, struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='ctx'> 	const bool zoned = btrfs_is_zoned(inode-&gt;root-&gt;fs_info);</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * The range must cover part of the @locked_page, or the returned</div><div class='del'>-	 * @page_started can confuse the caller.</div><div class='add'>+	 * The range must cover part of the @locked_folio, or a return of 1</div><div class='add'>+	 * can confuse the caller.</div><div class='ctx'> 	 */</div><div class='del'>-	ASSERT(!(end &lt;= page_offset(locked_page) ||</div><div class='del'>-		 start &gt;= page_offset(locked_page) + PAGE_SIZE));</div><div class='add'>+	ASSERT(!(end &lt;= folio_pos(locked_folio) ||</div><div class='add'>+		 start &gt;= folio_next_pos(locked_folio)));</div><div class='ctx'> </div><div class='ctx'> 	if (should_nocow(inode, start, end)) {</div><div class='del'>-		/*</div><div class='del'>-		 * Normally on a zoned device we're only doing COW writes, but</div><div class='del'>-		 * in case of relocation on a zoned filesystem we have taken</div><div class='del'>-		 * precaution, that we're only writing sequentially. It's safe</div><div class='del'>-		 * to use run_delalloc_nocow() here, like for  regular</div><div class='del'>-		 * preallocated inodes.</div><div class='del'>-		 */</div><div class='del'>-		ASSERT(!zoned ||</div><div class='del'>-		       (zoned &amp;&amp; btrfs_is_data_reloc_root(inode-&gt;root)));</div><div class='del'>-		ret = run_delalloc_nocow(inode, locked_page, start, end,</div><div class='del'>-					 page_started, nr_written);</div><div class='del'>-	} else if (!inode_can_compress(inode) ||</div><div class='del'>-		   !inode_need_compress(inode, start, end)) {</div><div class='del'>-		if (zoned)</div><div class='del'>-			ret = run_delalloc_zoned(inode, locked_page, start, end,</div><div class='del'>-						 page_started, nr_written);</div><div class='del'>-		else</div><div class='del'>-			ret = cow_file_range(inode, locked_page, start, end,</div><div class='del'>-					     page_started, nr_written, 1);</div><div class='del'>-	} else {</div><div class='del'>-		set_bit(BTRFS_INODE_HAS_ASYNC_EXTENT, &amp;inode-&gt;runtime_flags);</div><div class='del'>-		ret = cow_file_range_async(inode, wbc, locked_page, start, end,</div><div class='del'>-					   page_started, nr_written);</div><div class='add'>+		ret = run_delalloc_nocow(inode, locked_folio, start, end);</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='del'>-	ASSERT(ret &lt;= 0);</div><div class='del'>-	if (ret)</div><div class='del'>-		btrfs_cleanup_ordered_extents(inode, locked_page, start,</div><div class='del'>-					      end - start + 1);</div><div class='add'>+</div><div class='add'>+	if (btrfs_inode_can_compress(inode) &amp;&amp;</div><div class='add'>+	    inode_need_compress(inode, start, end) &amp;&amp;</div><div class='add'>+	    run_delalloc_compressed(inode, locked_folio, start, end, wbc))</div><div class='add'>+		return 1;</div><div class='add'>+</div><div class='add'>+	if (zoned)</div><div class='add'>+		ret = run_delalloc_cow(inode, locked_folio, start, end, wbc,</div><div class='add'>+				       true);</div><div class='add'>+	else</div><div class='add'>+		ret = cow_file_range(inode, locked_folio, start, end, NULL, 0);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_split_delalloc_extent(struct inode *inode,</div><div class='add'>+void btrfs_split_delalloc_extent(struct btrfs_inode *inode,</div><div class='ctx'> 				 struct extent_state *orig, u64 split)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='ctx'> 	u64 size;</div><div class='ctx'> </div><div class='add'>+	lockdep_assert_held(&amp;inode-&gt;io_tree.lock);</div><div class='add'>+</div><div class='ctx'> 	/* not delalloc, ignore it */</div><div class='ctx'> 	if (!(orig-&gt;state &amp; EXTENT_DELALLOC))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	size = orig-&gt;end - orig-&gt;start + 1;</div><div class='del'>-	if (size &gt; BTRFS_MAX_EXTENT_SIZE) {</div><div class='add'>+	if (size &gt; fs_info-&gt;max_extent_size) {</div><div class='ctx'> 		u32 num_extents;</div><div class='ctx'> 		u64 new_size;</div><div class='ctx'> </div><div class='hunk'>@@ -2055,16 +2397,16 @@ void btrfs_split_delalloc_extent(struct inode *inode,</div><div class='ctx'> 		 * applies here, just in reverse.</div><div class='ctx'> 		 */</div><div class='ctx'> 		new_size = orig-&gt;end - split + 1;</div><div class='del'>-		num_extents = count_max_extents(new_size);</div><div class='add'>+		num_extents = count_max_extents(fs_info, new_size);</div><div class='ctx'> 		new_size = split - orig-&gt;start;</div><div class='del'>-		num_extents += count_max_extents(new_size);</div><div class='del'>-		if (count_max_extents(size) &gt;= num_extents)</div><div class='add'>+		num_extents += count_max_extents(fs_info, new_size);</div><div class='add'>+		if (count_max_extents(fs_info, size) &gt;= num_extents)</div><div class='ctx'> 			return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;BTRFS_I(inode)-&gt;lock);</div><div class='del'>-	btrfs_mod_outstanding_extents(BTRFS_I(inode), 1);</div><div class='del'>-	spin_unlock(&amp;BTRFS_I(inode)-&gt;lock);</div><div class='add'>+	spin_lock(&amp;inode-&gt;lock);</div><div class='add'>+	btrfs_mod_outstanding_extents(inode, 1);</div><div class='add'>+	spin_unlock(&amp;inode-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2072,12 +2414,15 @@ void btrfs_split_delalloc_extent(struct inode *inode,</div><div class='ctx'>  * that are just merged onto old extents, such as when we are doing sequential</div><div class='ctx'>  * writes, so we can properly account for the metadata space we'll need.</div><div class='ctx'>  */</div><div class='del'>-void btrfs_merge_delalloc_extent(struct inode *inode, struct extent_state *new,</div><div class='add'>+void btrfs_merge_delalloc_extent(struct btrfs_inode *inode, struct extent_state *new,</div><div class='ctx'> 				 struct extent_state *other)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='ctx'> 	u64 new_size, old_size;</div><div class='ctx'> 	u32 num_extents;</div><div class='ctx'> </div><div class='add'>+	lockdep_assert_held(&amp;inode-&gt;io_tree.lock);</div><div class='add'>+</div><div class='ctx'> 	/* not delalloc, ignore it */</div><div class='ctx'> 	if (!(other-&gt;state &amp; EXTENT_DELALLOC))</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -2088,10 +2433,10 @@ void btrfs_merge_delalloc_extent(struct inode *inode, struct extent_state *new,</div><div class='ctx'> 		new_size = other-&gt;end - new-&gt;start + 1;</div><div class='ctx'> </div><div class='ctx'> 	/* we're not bigger than the max, unreserve the space and go */</div><div class='del'>-	if (new_size &lt;= BTRFS_MAX_EXTENT_SIZE) {</div><div class='del'>-		spin_lock(&amp;BTRFS_I(inode)-&gt;lock);</div><div class='del'>-		btrfs_mod_outstanding_extents(BTRFS_I(inode), -1);</div><div class='del'>-		spin_unlock(&amp;BTRFS_I(inode)-&gt;lock);</div><div class='add'>+	if (new_size &lt;= fs_info-&gt;max_extent_size) {</div><div class='add'>+		spin_lock(&amp;inode-&gt;lock);</div><div class='add'>+		btrfs_mod_outstanding_extents(inode, -1);</div><div class='add'>+		spin_unlock(&amp;inode-&gt;lock);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -2114,94 +2459,87 @@ void btrfs_merge_delalloc_extent(struct inode *inode, struct extent_state *new,</div><div class='ctx'> 	 * this case.</div><div class='ctx'> 	 */</div><div class='ctx'> 	old_size = other-&gt;end - other-&gt;start + 1;</div><div class='del'>-	num_extents = count_max_extents(old_size);</div><div class='add'>+	num_extents = count_max_extents(fs_info, old_size);</div><div class='ctx'> 	old_size = new-&gt;end - new-&gt;start + 1;</div><div class='del'>-	num_extents += count_max_extents(old_size);</div><div class='del'>-	if (count_max_extents(new_size) &gt;= num_extents)</div><div class='add'>+	num_extents += count_max_extents(fs_info, old_size);</div><div class='add'>+	if (count_max_extents(fs_info, new_size) &gt;= num_extents)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;BTRFS_I(inode)-&gt;lock);</div><div class='del'>-	btrfs_mod_outstanding_extents(BTRFS_I(inode), -1);</div><div class='del'>-	spin_unlock(&amp;BTRFS_I(inode)-&gt;lock);</div><div class='add'>+	spin_lock(&amp;inode-&gt;lock);</div><div class='add'>+	btrfs_mod_outstanding_extents(inode, -1);</div><div class='add'>+	spin_unlock(&amp;inode-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void btrfs_add_delalloc_inodes(struct btrfs_root *root,</div><div class='del'>-				      struct inode *inode)</div><div class='add'>+static void btrfs_add_delalloc_inode(struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;root-&gt;delalloc_lock);</div><div class='del'>-	if (list_empty(&amp;BTRFS_I(inode)-&gt;delalloc_inodes)) {</div><div class='del'>-		list_add_tail(&amp;BTRFS_I(inode)-&gt;delalloc_inodes,</div><div class='del'>-			      &amp;root-&gt;delalloc_inodes);</div><div class='del'>-		set_bit(BTRFS_INODE_IN_DELALLOC_LIST,</div><div class='del'>-			&amp;BTRFS_I(inode)-&gt;runtime_flags);</div><div class='del'>-		root-&gt;nr_delalloc_inodes++;</div><div class='del'>-		if (root-&gt;nr_delalloc_inodes == 1) {</div><div class='del'>-			spin_lock(&amp;fs_info-&gt;delalloc_root_lock);</div><div class='del'>-			BUG_ON(!list_empty(&amp;root-&gt;delalloc_root));</div><div class='del'>-			list_add_tail(&amp;root-&gt;delalloc_root,</div><div class='del'>-				      &amp;fs_info-&gt;delalloc_roots);</div><div class='del'>-			spin_unlock(&amp;fs_info-&gt;delalloc_root_lock);</div><div class='del'>-		}</div><div class='add'>+	ASSERT(list_empty(&amp;inode-&gt;delalloc_inodes));</div><div class='add'>+	list_add_tail(&amp;inode-&gt;delalloc_inodes, &amp;root-&gt;delalloc_inodes);</div><div class='add'>+	root-&gt;nr_delalloc_inodes++;</div><div class='add'>+	if (root-&gt;nr_delalloc_inodes == 1) {</div><div class='add'>+		spin_lock(&amp;fs_info-&gt;delalloc_root_lock);</div><div class='add'>+		ASSERT(list_empty(&amp;root-&gt;delalloc_root));</div><div class='add'>+		list_add_tail(&amp;root-&gt;delalloc_root, &amp;fs_info-&gt;delalloc_roots);</div><div class='add'>+		spin_unlock(&amp;fs_info-&gt;delalloc_root_lock);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;root-&gt;delalloc_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-</div><div class='del'>-void __btrfs_del_delalloc_inode(struct btrfs_root *root,</div><div class='del'>-				struct btrfs_inode *inode)</div><div class='add'>+void btrfs_del_delalloc_inode(struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> </div><div class='add'>+	lockdep_assert_held(&amp;root-&gt;delalloc_lock);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We may be called after the inode was already deleted from the list,</div><div class='add'>+	 * namely in the transaction abort path btrfs_destroy_delalloc_inodes(),</div><div class='add'>+	 * and then later through btrfs_clear_delalloc_extent() while the inode</div><div class='add'>+	 * still has -&gt;delalloc_bytes &gt; 0.</div><div class='add'>+	 */</div><div class='ctx'> 	if (!list_empty(&amp;inode-&gt;delalloc_inodes)) {</div><div class='ctx'> 		list_del_init(&amp;inode-&gt;delalloc_inodes);</div><div class='del'>-		clear_bit(BTRFS_INODE_IN_DELALLOC_LIST,</div><div class='del'>-			  &amp;inode-&gt;runtime_flags);</div><div class='ctx'> 		root-&gt;nr_delalloc_inodes--;</div><div class='ctx'> 		if (!root-&gt;nr_delalloc_inodes) {</div><div class='ctx'> 			ASSERT(list_empty(&amp;root-&gt;delalloc_inodes));</div><div class='ctx'> 			spin_lock(&amp;fs_info-&gt;delalloc_root_lock);</div><div class='del'>-			BUG_ON(list_empty(&amp;root-&gt;delalloc_root));</div><div class='add'>+			ASSERT(!list_empty(&amp;root-&gt;delalloc_root));</div><div class='ctx'> 			list_del_init(&amp;root-&gt;delalloc_root);</div><div class='ctx'> 			spin_unlock(&amp;fs_info-&gt;delalloc_root_lock);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void btrfs_del_delalloc_inode(struct btrfs_root *root,</div><div class='del'>-				     struct btrfs_inode *inode)</div><div class='del'>-{</div><div class='del'>-	spin_lock(&amp;root-&gt;delalloc_lock);</div><div class='del'>-	__btrfs_del_delalloc_inode(root, inode);</div><div class='del'>-	spin_unlock(&amp;root-&gt;delalloc_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Properly track delayed allocation bytes in the inode and to maintain the</div><div class='ctx'>  * list of inodes that have pending delalloc work to be done.</div><div class='ctx'>  */</div><div class='del'>-void btrfs_set_delalloc_extent(struct inode *inode, struct extent_state *state,</div><div class='del'>-			       unsigned *bits)</div><div class='add'>+void btrfs_set_delalloc_extent(struct btrfs_inode *inode, struct extent_state *state,</div><div class='add'>+			       u32 bits)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='ctx'> </div><div class='del'>-	if ((*bits &amp; EXTENT_DEFRAG) &amp;&amp; !(*bits &amp; EXTENT_DELALLOC))</div><div class='add'>+	lockdep_assert_held(&amp;inode-&gt;io_tree.lock);</div><div class='add'>+</div><div class='add'>+	if ((bits &amp; EXTENT_DEFRAG) &amp;&amp; !(bits &amp; EXTENT_DELALLOC))</div><div class='ctx'> 		WARN_ON(1);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * set_bit and clear bit hooks normally require _irqsave/restore</div><div class='ctx'> 	 * but in this case, we are only testing for the DELALLOC</div><div class='ctx'> 	 * bit, which is only set or cleared with irqs on</div><div class='ctx'> 	 */</div><div class='del'>-	if (!(state-&gt;state &amp; EXTENT_DELALLOC) &amp;&amp; (*bits &amp; EXTENT_DELALLOC)) {</div><div class='del'>-		struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='add'>+	if (!(state-&gt;state &amp; EXTENT_DELALLOC) &amp;&amp; (bits &amp; EXTENT_DELALLOC)) {</div><div class='ctx'> 		u64 len = state-&gt;end + 1 - state-&gt;start;</div><div class='del'>-		u32 num_extents = count_max_extents(len);</div><div class='del'>-		bool do_list = !btrfs_is_free_space_inode(BTRFS_I(inode));</div><div class='add'>+		u64 prev_delalloc_bytes;</div><div class='add'>+		u32 num_extents = count_max_extents(fs_info, len);</div><div class='ctx'> </div><div class='del'>-		spin_lock(&amp;BTRFS_I(inode)-&gt;lock);</div><div class='del'>-		btrfs_mod_outstanding_extents(BTRFS_I(inode), num_extents);</div><div class='del'>-		spin_unlock(&amp;BTRFS_I(inode)-&gt;lock);</div><div class='add'>+		spin_lock(&amp;inode-&gt;lock);</div><div class='add'>+		btrfs_mod_outstanding_extents(inode, num_extents);</div><div class='add'>+		spin_unlock(&amp;inode-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 		/* For sanity tests */</div><div class='ctx'> 		if (btrfs_is_testing(fs_info))</div><div class='hunk'>@@ -2209,22 +2547,28 @@ void btrfs_set_delalloc_extent(struct inode *inode, struct extent_state *state,</div><div class='ctx'> </div><div class='ctx'> 		percpu_counter_add_batch(&amp;fs_info-&gt;delalloc_bytes, len,</div><div class='ctx'> 					 fs_info-&gt;delalloc_batch);</div><div class='del'>-		spin_lock(&amp;BTRFS_I(inode)-&gt;lock);</div><div class='del'>-		BTRFS_I(inode)-&gt;delalloc_bytes += len;</div><div class='del'>-		if (*bits &amp; EXTENT_DEFRAG)</div><div class='del'>-			BTRFS_I(inode)-&gt;defrag_bytes += len;</div><div class='del'>-		if (do_list &amp;&amp; !test_bit(BTRFS_INODE_IN_DELALLOC_LIST,</div><div class='del'>-					 &amp;BTRFS_I(inode)-&gt;runtime_flags))</div><div class='del'>-			btrfs_add_delalloc_inodes(root, inode);</div><div class='del'>-		spin_unlock(&amp;BTRFS_I(inode)-&gt;lock);</div><div class='add'>+		spin_lock(&amp;inode-&gt;lock);</div><div class='add'>+		prev_delalloc_bytes = inode-&gt;delalloc_bytes;</div><div class='add'>+		inode-&gt;delalloc_bytes += len;</div><div class='add'>+		if (bits &amp; EXTENT_DEFRAG)</div><div class='add'>+			inode-&gt;defrag_bytes += len;</div><div class='add'>+		spin_unlock(&amp;inode-&gt;lock);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * We don't need to be under the protection of the inode's lock,</div><div class='add'>+		 * because we are called while holding the inode's io_tree lock</div><div class='add'>+		 * and are therefore protected against concurrent calls of this</div><div class='add'>+		 * function and btrfs_clear_delalloc_extent().</div><div class='add'>+		 */</div><div class='add'>+		if (!btrfs_is_free_space_inode(inode) &amp;&amp; prev_delalloc_bytes == 0)</div><div class='add'>+			btrfs_add_delalloc_inode(inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!(state-&gt;state &amp; EXTENT_DELALLOC_NEW) &amp;&amp;</div><div class='del'>-	    (*bits &amp; EXTENT_DELALLOC_NEW)) {</div><div class='del'>-		spin_lock(&amp;BTRFS_I(inode)-&gt;lock);</div><div class='del'>-		BTRFS_I(inode)-&gt;new_delalloc_bytes += state-&gt;end + 1 -</div><div class='del'>-			state-&gt;start;</div><div class='del'>-		spin_unlock(&amp;BTRFS_I(inode)-&gt;lock);</div><div class='add'>+	    (bits &amp; EXTENT_DELALLOC_NEW)) {</div><div class='add'>+		spin_lock(&amp;inode-&gt;lock);</div><div class='add'>+		inode-&gt;new_delalloc_bytes += state-&gt;end + 1 - state-&gt;start;</div><div class='add'>+		spin_unlock(&amp;inode-&gt;lock);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2232,15 +2576,16 @@ void btrfs_set_delalloc_extent(struct inode *inode, struct extent_state *state,</div><div class='ctx'>  * Once a range is no longer delalloc this function ensures that proper</div><div class='ctx'>  * accounting happens.</div><div class='ctx'>  */</div><div class='del'>-void btrfs_clear_delalloc_extent(struct inode *vfs_inode,</div><div class='del'>-				 struct extent_state *state, unsigned *bits)</div><div class='add'>+void btrfs_clear_delalloc_extent(struct btrfs_inode *inode,</div><div class='add'>+				 struct extent_state *state, u32 bits)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_inode *inode = BTRFS_I(vfs_inode);</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(vfs_inode-&gt;i_sb);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='ctx'> 	u64 len = state-&gt;end + 1 - state-&gt;start;</div><div class='del'>-	u32 num_extents = count_max_extents(len);</div><div class='add'>+	u32 num_extents = count_max_extents(fs_info, len);</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held(&amp;inode-&gt;io_tree.lock);</div><div class='ctx'> </div><div class='del'>-	if ((state-&gt;state &amp; EXTENT_DEFRAG) &amp;&amp; (*bits &amp; EXTENT_DEFRAG)) {</div><div class='add'>+	if ((state-&gt;state &amp; EXTENT_DEFRAG) &amp;&amp; (bits &amp; EXTENT_DEFRAG)) {</div><div class='ctx'> 		spin_lock(&amp;inode-&gt;lock);</div><div class='ctx'> 		inode-&gt;defrag_bytes -= len;</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;lock);</div><div class='hunk'>@@ -2251,9 +2596,9 @@ void btrfs_clear_delalloc_extent(struct inode *vfs_inode,</div><div class='ctx'> 	 * but in this case, we are only testing for the DELALLOC</div><div class='ctx'> 	 * bit, which is only set or cleared with irqs on</div><div class='ctx'> 	 */</div><div class='del'>-	if ((state-&gt;state &amp; EXTENT_DELALLOC) &amp;&amp; (*bits &amp; EXTENT_DELALLOC)) {</div><div class='add'>+	if ((state-&gt;state &amp; EXTENT_DELALLOC) &amp;&amp; (bits &amp; EXTENT_DELALLOC)) {</div><div class='ctx'> 		struct btrfs_root *root = inode-&gt;root;</div><div class='del'>-		bool do_list = !btrfs_is_free_space_inode(inode);</div><div class='add'>+		u64 new_delalloc_bytes;</div><div class='ctx'> </div><div class='ctx'> 		spin_lock(&amp;inode-&gt;lock);</div><div class='ctx'> 		btrfs_mod_outstanding_extents(inode, -num_extents);</div><div class='hunk'>@@ -2264,321 +2609,52 @@ void btrfs_clear_delalloc_extent(struct inode *vfs_inode,</div><div class='ctx'> 		 * don't need to call delalloc_release_metadata if there is an</div><div class='ctx'> 		 * error.</div><div class='ctx'> 		 */</div><div class='del'>-		if (*bits &amp; EXTENT_CLEAR_META_RESV &amp;&amp;</div><div class='add'>+		if (bits &amp; EXTENT_CLEAR_META_RESV &amp;&amp;</div><div class='ctx'> 		    root != fs_info-&gt;tree_root)</div><div class='del'>-			btrfs_delalloc_release_metadata(inode, len, false);</div><div class='add'>+			btrfs_delalloc_release_metadata(inode, len, true);</div><div class='ctx'> </div><div class='ctx'> 		/* For sanity tests. */</div><div class='ctx'> 		if (btrfs_is_testing(fs_info))</div><div class='ctx'> 			return;</div><div class='ctx'> </div><div class='ctx'> 		if (!btrfs_is_data_reloc_root(root) &amp;&amp;</div><div class='del'>-		    do_list &amp;&amp; !(state-&gt;state &amp; EXTENT_NORESERVE) &amp;&amp;</div><div class='del'>-		    (*bits &amp; EXTENT_CLEAR_DATA_RESV))</div><div class='del'>-			btrfs_free_reserved_data_space_noquota(fs_info, len);</div><div class='add'>+		    !btrfs_is_free_space_inode(inode) &amp;&amp;</div><div class='add'>+		    !(state-&gt;state &amp; EXTENT_NORESERVE) &amp;&amp;</div><div class='add'>+		    (bits &amp; EXTENT_CLEAR_DATA_RESV))</div><div class='add'>+			btrfs_free_reserved_data_space_noquota(inode, len);</div><div class='ctx'> </div><div class='ctx'> 		percpu_counter_add_batch(&amp;fs_info-&gt;delalloc_bytes, -len,</div><div class='ctx'> 					 fs_info-&gt;delalloc_batch);</div><div class='ctx'> 		spin_lock(&amp;inode-&gt;lock);</div><div class='ctx'> 		inode-&gt;delalloc_bytes -= len;</div><div class='del'>-		if (do_list &amp;&amp; inode-&gt;delalloc_bytes == 0 &amp;&amp;</div><div class='del'>-		    test_bit(BTRFS_INODE_IN_DELALLOC_LIST,</div><div class='del'>-					&amp;inode-&gt;runtime_flags))</div><div class='del'>-			btrfs_del_delalloc_inode(root, inode);</div><div class='add'>+		new_delalloc_bytes = inode-&gt;delalloc_bytes;</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;lock);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * We don't need to be under the protection of the inode's lock,</div><div class='add'>+		 * because we are called while holding the inode's io_tree lock</div><div class='add'>+		 * and are therefore protected against concurrent calls of this</div><div class='add'>+		 * function and btrfs_set_delalloc_extent().</div><div class='add'>+		 */</div><div class='add'>+		if (!btrfs_is_free_space_inode(inode) &amp;&amp; new_delalloc_bytes == 0) {</div><div class='add'>+			spin_lock(&amp;root-&gt;delalloc_lock);</div><div class='add'>+			btrfs_del_delalloc_inode(inode);</div><div class='add'>+			spin_unlock(&amp;root-&gt;delalloc_lock);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if ((state-&gt;state &amp; EXTENT_DELALLOC_NEW) &amp;&amp;</div><div class='del'>-	    (*bits &amp; EXTENT_DELALLOC_NEW)) {</div><div class='add'>+	    (bits &amp; EXTENT_DELALLOC_NEW)) {</div><div class='ctx'> 		spin_lock(&amp;inode-&gt;lock);</div><div class='ctx'> 		ASSERT(inode-&gt;new_delalloc_bytes &gt;= len);</div><div class='ctx'> 		inode-&gt;new_delalloc_bytes -= len;</div><div class='del'>-		if (*bits &amp; EXTENT_ADD_INODE_BYTES)</div><div class='add'>+		if (bits &amp; EXTENT_ADD_INODE_BYTES)</div><div class='ctx'> 			inode_add_bytes(&amp;inode-&gt;vfs_inode, len);</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;lock);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * in order to insert checksums into the metadata in large chunks,</div><div class='del'>- * we wait until bio submission time.   All the pages in the bio are</div><div class='del'>- * checksummed and sums are attached onto the ordered extent record.</div><div class='del'>- *</div><div class='del'>- * At IO completion time the cums attached on the ordered extent record</div><div class='del'>- * are inserted into the btree</div><div class='del'>- */</div><div class='del'>-static blk_status_t btrfs_submit_bio_start(struct inode *inode, struct bio *bio,</div><div class='del'>-					   u64 dio_file_offset)</div><div class='del'>-{</div><div class='del'>-	return btrfs_csum_one_bio(BTRFS_I(inode), bio, 0, 0);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Split an extent_map at [start, start + len]</div><div class='del'>- *</div><div class='del'>- * This function is intended to be used only for extract_ordered_extent().</div><div class='del'>- */</div><div class='del'>-static int split_zoned_em(struct btrfs_inode *inode, u64 start, u64 len,</div><div class='del'>-			  u64 pre, u64 post)</div><div class='del'>-{</div><div class='del'>-	struct extent_map_tree *em_tree = &amp;inode-&gt;extent_tree;</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	struct extent_map *split_pre = NULL;</div><div class='del'>-	struct extent_map *split_mid = NULL;</div><div class='del'>-	struct extent_map *split_post = NULL;</div><div class='del'>-	int ret = 0;</div><div class='del'>-	unsigned long flags;</div><div class='del'>-</div><div class='del'>-	/* Sanity check */</div><div class='del'>-	if (pre == 0 &amp;&amp; post == 0)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	split_pre = alloc_extent_map();</div><div class='del'>-	if (pre)</div><div class='del'>-		split_mid = alloc_extent_map();</div><div class='del'>-	if (post)</div><div class='del'>-		split_post = alloc_extent_map();</div><div class='del'>-	if (!split_pre || (pre &amp;&amp; !split_mid) || (post &amp;&amp; !split_post)) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ASSERT(pre + post &lt; len);</div><div class='del'>-</div><div class='del'>-	lock_extent(&amp;inode-&gt;io_tree, start, start + len - 1);</div><div class='del'>-	write_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	em = lookup_extent_mapping(em_tree, start, len);</div><div class='del'>-	if (!em) {</div><div class='del'>-		ret = -EIO;</div><div class='del'>-		goto out_unlock;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ASSERT(em-&gt;len == len);</div><div class='del'>-	ASSERT(!test_bit(EXTENT_FLAG_COMPRESSED, &amp;em-&gt;flags));</div><div class='del'>-	ASSERT(em-&gt;block_start &lt; EXTENT_MAP_LAST_BYTE);</div><div class='del'>-	ASSERT(test_bit(EXTENT_FLAG_PINNED, &amp;em-&gt;flags));</div><div class='del'>-	ASSERT(!test_bit(EXTENT_FLAG_LOGGING, &amp;em-&gt;flags));</div><div class='del'>-	ASSERT(!list_empty(&amp;em-&gt;list));</div><div class='del'>-</div><div class='del'>-	flags = em-&gt;flags;</div><div class='del'>-	clear_bit(EXTENT_FLAG_PINNED, &amp;em-&gt;flags);</div><div class='del'>-</div><div class='del'>-	/* First, replace the em with a new extent_map starting from * em-&gt;start */</div><div class='del'>-	split_pre-&gt;start = em-&gt;start;</div><div class='del'>-	split_pre-&gt;len = (pre ? pre : em-&gt;len - post);</div><div class='del'>-	split_pre-&gt;orig_start = split_pre-&gt;start;</div><div class='del'>-	split_pre-&gt;block_start = em-&gt;block_start;</div><div class='del'>-	split_pre-&gt;block_len = split_pre-&gt;len;</div><div class='del'>-	split_pre-&gt;orig_block_len = split_pre-&gt;block_len;</div><div class='del'>-	split_pre-&gt;ram_bytes = split_pre-&gt;len;</div><div class='del'>-	split_pre-&gt;flags = flags;</div><div class='del'>-	split_pre-&gt;compress_type = em-&gt;compress_type;</div><div class='del'>-	split_pre-&gt;generation = em-&gt;generation;</div><div class='del'>-</div><div class='del'>-	replace_extent_mapping(em_tree, em, split_pre, 1);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Now we only have an extent_map at:</div><div class='del'>-	 *     [em-&gt;start, em-&gt;start + pre] if pre != 0</div><div class='del'>-	 *     [em-&gt;start, em-&gt;start + em-&gt;len - post] if pre == 0</div><div class='del'>-	 */</div><div class='del'>-</div><div class='del'>-	if (pre) {</div><div class='del'>-		/* Insert the middle extent_map */</div><div class='del'>-		split_mid-&gt;start = em-&gt;start + pre;</div><div class='del'>-		split_mid-&gt;len = em-&gt;len - pre - post;</div><div class='del'>-		split_mid-&gt;orig_start = split_mid-&gt;start;</div><div class='del'>-		split_mid-&gt;block_start = em-&gt;block_start + pre;</div><div class='del'>-		split_mid-&gt;block_len = split_mid-&gt;len;</div><div class='del'>-		split_mid-&gt;orig_block_len = split_mid-&gt;block_len;</div><div class='del'>-		split_mid-&gt;ram_bytes = split_mid-&gt;len;</div><div class='del'>-		split_mid-&gt;flags = flags;</div><div class='del'>-		split_mid-&gt;compress_type = em-&gt;compress_type;</div><div class='del'>-		split_mid-&gt;generation = em-&gt;generation;</div><div class='del'>-		add_extent_mapping(em_tree, split_mid, 1);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (post) {</div><div class='del'>-		split_post-&gt;start = em-&gt;start + em-&gt;len - post;</div><div class='del'>-		split_post-&gt;len = post;</div><div class='del'>-		split_post-&gt;orig_start = split_post-&gt;start;</div><div class='del'>-		split_post-&gt;block_start = em-&gt;block_start + em-&gt;len - post;</div><div class='del'>-		split_post-&gt;block_len = split_post-&gt;len;</div><div class='del'>-		split_post-&gt;orig_block_len = split_post-&gt;block_len;</div><div class='del'>-		split_post-&gt;ram_bytes = split_post-&gt;len;</div><div class='del'>-		split_post-&gt;flags = flags;</div><div class='del'>-		split_post-&gt;compress_type = em-&gt;compress_type;</div><div class='del'>-		split_post-&gt;generation = em-&gt;generation;</div><div class='del'>-		add_extent_mapping(em_tree, split_post, 1);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Once for us */</div><div class='del'>-	free_extent_map(em);</div><div class='del'>-	/* Once for the tree */</div><div class='del'>-	free_extent_map(em);</div><div class='del'>-</div><div class='del'>-out_unlock:</div><div class='del'>-	write_unlock(&amp;em_tree-&gt;lock);</div><div class='del'>-	unlock_extent(&amp;inode-&gt;io_tree, start, start + len - 1);</div><div class='del'>-out:</div><div class='del'>-	free_extent_map(split_pre);</div><div class='del'>-	free_extent_map(split_mid);</div><div class='del'>-	free_extent_map(split_post);</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static blk_status_t extract_ordered_extent(struct btrfs_inode *inode,</div><div class='del'>-					   struct bio *bio, loff_t file_offset)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_ordered_extent *ordered;</div><div class='del'>-	u64 start = (u64)bio-&gt;bi_iter.bi_sector &lt;&lt; SECTOR_SHIFT;</div><div class='del'>-	u64 file_len;</div><div class='del'>-	u64 len = bio-&gt;bi_iter.bi_size;</div><div class='del'>-	u64 end = start + len;</div><div class='del'>-	u64 ordered_end;</div><div class='del'>-	u64 pre, post;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	ordered = btrfs_lookup_ordered_extent(inode, file_offset);</div><div class='del'>-	if (WARN_ON_ONCE(!ordered))</div><div class='del'>-		return BLK_STS_IOERR;</div><div class='del'>-</div><div class='del'>-	/* No need to split */</div><div class='del'>-	if (ordered-&gt;disk_num_bytes == len)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	/* We cannot split once end_bio'd ordered extent */</div><div class='del'>-	if (WARN_ON_ONCE(ordered-&gt;bytes_left != ordered-&gt;disk_num_bytes)) {</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* We cannot split a compressed ordered extent */</div><div class='del'>-	if (WARN_ON_ONCE(ordered-&gt;disk_num_bytes != ordered-&gt;num_bytes)) {</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ordered_end = ordered-&gt;disk_bytenr + ordered-&gt;disk_num_bytes;</div><div class='del'>-	/* bio must be in one ordered extent */</div><div class='del'>-	if (WARN_ON_ONCE(start &lt; ordered-&gt;disk_bytenr || end &gt; ordered_end)) {</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Checksum list should be empty */</div><div class='del'>-	if (WARN_ON_ONCE(!list_empty(&amp;ordered-&gt;list))) {</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	file_len = ordered-&gt;num_bytes;</div><div class='del'>-	pre = start - ordered-&gt;disk_bytenr;</div><div class='del'>-	post = ordered_end - end;</div><div class='del'>-</div><div class='del'>-	ret = btrfs_split_ordered_extent(ordered, pre, post);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto out;</div><div class='del'>-	ret = split_zoned_em(inode, file_offset, file_len, pre, post);</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	btrfs_put_ordered_extent(ordered);</div><div class='del'>-</div><div class='del'>-	return errno_to_blk_status(ret);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * extent_io.c submission hook. This does the right thing for csum calculation</div><div class='del'>- * on write, or reading the csums from the tree before a read.</div><div class='del'>- *</div><div class='del'>- * Rules about async/sync submit,</div><div class='del'>- * a) read:				sync submit</div><div class='del'>- *</div><div class='del'>- * b) write without checksum:		sync submit</div><div class='del'>- *</div><div class='del'>- * c) write with checksum:</div><div class='del'>- *    c-1) if bio is issued by fsync:	sync submit</div><div class='del'>- *         (sync_writers != 0)</div><div class='del'>- *</div><div class='del'>- *    c-2) if root is reloc root:	sync submit</div><div class='del'>- *         (only in case of buffered IO)</div><div class='del'>- *</div><div class='del'>- *    c-3) otherwise:			async submit</div><div class='del'>- */</div><div class='del'>-blk_status_t btrfs_submit_data_bio(struct inode *inode, struct bio *bio,</div><div class='del'>-				   int mirror_num, unsigned long bio_flags)</div><div class='del'>-</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='del'>-	enum btrfs_wq_endio_type metadata = BTRFS_WQ_ENDIO_DATA;</div><div class='del'>-	blk_status_t ret = 0;</div><div class='del'>-	int skip_sum;</div><div class='del'>-	int async = !atomic_read(&amp;BTRFS_I(inode)-&gt;sync_writers);</div><div class='del'>-</div><div class='del'>-	skip_sum = (BTRFS_I(inode)-&gt;flags &amp; BTRFS_INODE_NODATASUM) ||</div><div class='del'>-		   !fs_info-&gt;csum_root;</div><div class='del'>-</div><div class='del'>-	if (btrfs_is_free_space_inode(BTRFS_I(inode)))</div><div class='del'>-		metadata = BTRFS_WQ_ENDIO_FREE_SPACE;</div><div class='del'>-</div><div class='del'>-	if (bio_op(bio) == REQ_OP_ZONE_APPEND) {</div><div class='del'>-		struct page *page = bio_first_bvec_all(bio)-&gt;bv_page;</div><div class='del'>-		loff_t file_offset = page_offset(page);</div><div class='del'>-</div><div class='del'>-		ret = extract_ordered_extent(BTRFS_I(inode), bio, file_offset);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (btrfs_op(bio) != BTRFS_MAP_WRITE) {</div><div class='del'>-		ret = btrfs_bio_wq_end_io(fs_info, bio, metadata);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto out;</div><div class='del'>-</div><div class='del'>-		if (bio_flags &amp; EXTENT_BIO_COMPRESSED) {</div><div class='del'>-			ret = btrfs_submit_compressed_read(inode, bio,</div><div class='del'>-							   mirror_num,</div><div class='del'>-							   bio_flags);</div><div class='del'>-			goto out;</div><div class='del'>-		} else {</div><div class='del'>-			/*</div><div class='del'>-			 * Lookup bio sums does extra checks around whether we</div><div class='del'>-			 * need to csum or not, which is why we ignore skip_sum</div><div class='del'>-			 * here.</div><div class='del'>-			 */</div><div class='del'>-			ret = btrfs_lookup_bio_sums(inode, bio, NULL);</div><div class='del'>-			if (ret)</div><div class='del'>-				goto out;</div><div class='del'>-		}</div><div class='del'>-		goto mapit;</div><div class='del'>-	} else if (async &amp;&amp; !skip_sum) {</div><div class='del'>-		/* csum items have already been cloned */</div><div class='del'>-		if (btrfs_is_data_reloc_root(root))</div><div class='del'>-			goto mapit;</div><div class='del'>-		/* we're doing a write, do the async checksumming */</div><div class='del'>-		ret = btrfs_wq_submit_bio(inode, bio, mirror_num, bio_flags,</div><div class='del'>-					  0, btrfs_submit_bio_start);</div><div class='del'>-		goto out;</div><div class='del'>-	} else if (!skip_sum) {</div><div class='del'>-		ret = btrfs_csum_one_bio(BTRFS_I(inode), bio, 0, 0);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-mapit:</div><div class='del'>-	ret = btrfs_map_bio(fs_info, bio, mirror_num);</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	if (ret) {</div><div class='del'>-		bio-&gt;bi_status = ret;</div><div class='del'>-		bio_endio(bio);</div><div class='del'>-	}</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * given a list of ordered sums record them in the inode.  This happens</div><div class='ctx'>  * at IO completion time based on sums calculated at bio submission time.</div><div class='ctx'>  */</div><div class='hunk'>@@ -2586,11 +2662,15 @@ static int add_pending_csums(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			     struct list_head *list)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_ordered_sum *sum;</div><div class='add'>+	struct btrfs_root *csum_root = NULL;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(sum, list, list) {</div><div class='ctx'> 		trans-&gt;adding_csums = true;</div><div class='del'>-		ret = btrfs_csum_file_blocks(trans, trans-&gt;fs_info-&gt;csum_root, sum);</div><div class='add'>+		if (!csum_root)</div><div class='add'>+			csum_root = btrfs_csum_root(trans-&gt;fs_info,</div><div class='add'>+						    sum-&gt;logical);</div><div class='add'>+		ret = btrfs_csum_file_blocks(trans, csum_root, sum);</div><div class='ctx'> 		trans-&gt;adding_csums = false;</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='hunk'>@@ -2612,11 +2692,11 @@ static int btrfs_find_new_delalloc_bytes(struct btrfs_inode *inode,</div><div class='ctx'> 		u64 em_len;</div><div class='ctx'> 		int ret = 0;</div><div class='ctx'> </div><div class='del'>-		em = btrfs_get_extent(inode, NULL, 0, search_start, search_len);</div><div class='add'>+		em = btrfs_get_extent(inode, NULL, search_start, search_len);</div><div class='ctx'> 		if (IS_ERR(em))</div><div class='ctx'> 			return PTR_ERR(em);</div><div class='ctx'> </div><div class='del'>-		if (em-&gt;block_start != EXTENT_MAP_HOLE)</div><div class='add'>+		if (em-&gt;disk_bytenr != EXTENT_MAP_HOLE)</div><div class='ctx'> 			goto next;</div><div class='ctx'> </div><div class='ctx'> 		em_len = em-&gt;len;</div><div class='hunk'>@@ -2625,13 +2705,12 @@ static int btrfs_find_new_delalloc_bytes(struct btrfs_inode *inode,</div><div class='ctx'> 		if (em_len &gt; search_len)</div><div class='ctx'> 			em_len = search_len;</div><div class='ctx'> </div><div class='del'>-		ret = set_extent_bit(&amp;inode-&gt;io_tree, search_start,</div><div class='del'>-				     search_start + em_len - 1,</div><div class='del'>-				     EXTENT_DELALLOC_NEW, 0, NULL, cached_state,</div><div class='del'>-				     GFP_NOFS, NULL);</div><div class='add'>+		ret = btrfs_set_extent_bit(&amp;inode-&gt;io_tree, search_start,</div><div class='add'>+					   search_start + em_len - 1,</div><div class='add'>+					   EXTENT_DELALLOC_NEW, cached_state);</div><div class='ctx'> next:</div><div class='del'>-		search_start = extent_map_end(em);</div><div class='del'>-		free_extent_map(em);</div><div class='add'>+		search_start = btrfs_extent_map_end(em);</div><div class='add'>+		btrfs_free_extent_map(em);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2661,72 +2740,69 @@ int btrfs_set_extent_delalloc(struct btrfs_inode *inode, u64 start, u64 end,</div><div class='ctx'> 			return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return set_extent_delalloc(&amp;inode-&gt;io_tree, start, end, extra_bits,</div><div class='del'>-				   cached_state);</div><div class='add'>+	return btrfs_set_extent_bit(&amp;inode-&gt;io_tree, start, end,</div><div class='add'>+				    EXTENT_DELALLOC | extra_bits, cached_state);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* see btrfs_writepage_start_hook for details on why this is required */</div><div class='ctx'> struct btrfs_writepage_fixup {</div><div class='del'>-	struct page *page;</div><div class='del'>-	struct inode *inode;</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	struct btrfs_inode *inode;</div><div class='ctx'> 	struct btrfs_work work;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static void btrfs_writepage_fixup_worker(struct btrfs_work *work)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_writepage_fixup *fixup;</div><div class='add'>+	struct btrfs_writepage_fixup *fixup =</div><div class='add'>+		container_of(work, struct btrfs_writepage_fixup, work);</div><div class='ctx'> 	struct btrfs_ordered_extent *ordered;</div><div class='ctx'> 	struct extent_state *cached_state = NULL;</div><div class='ctx'> 	struct extent_changeset *data_reserved = NULL;</div><div class='del'>-	struct page *page;</div><div class='del'>-	struct btrfs_inode *inode;</div><div class='del'>-	u64 page_start;</div><div class='del'>-	u64 page_end;</div><div class='add'>+	struct folio *folio = fixup-&gt;folio;</div><div class='add'>+	struct btrfs_inode *inode = fixup-&gt;inode;</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	u64 page_start = folio_pos(folio);</div><div class='add'>+	u64 page_end = folio_next_pos(folio) - 1;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	bool free_delalloc_space = true;</div><div class='ctx'> </div><div class='del'>-	fixup = container_of(work, struct btrfs_writepage_fixup, work);</div><div class='del'>-	page = fixup-&gt;page;</div><div class='del'>-	inode = BTRFS_I(fixup-&gt;inode);</div><div class='del'>-	page_start = page_offset(page);</div><div class='del'>-	page_end = page_offset(page) + PAGE_SIZE - 1;</div><div class='del'>-</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * This is similar to page_mkwrite, we need to reserve the space before</div><div class='del'>-	 * we take the page lock.</div><div class='add'>+	 * we take the folio lock.</div><div class='ctx'> 	 */</div><div class='ctx'> 	ret = btrfs_delalloc_reserve_space(inode, &amp;data_reserved, page_start,</div><div class='del'>-					   PAGE_SIZE);</div><div class='add'>+					   folio_size(folio));</div><div class='ctx'> again:</div><div class='del'>-	lock_page(page);</div><div class='add'>+	folio_lock(folio);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Before we queued this fixup, we took a reference on the page.</div><div class='del'>-	 * page-&gt;mapping may go NULL, but it shouldn't be moved to a different</div><div class='add'>+	 * Before we queued this fixup, we took a reference on the folio.</div><div class='add'>+	 * folio-&gt;mapping may go NULL, but it shouldn't be moved to a different</div><div class='ctx'> 	 * address space.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!page-&gt;mapping || !PageDirty(page) || !PageChecked(page)) {</div><div class='add'>+	if (!folio-&gt;mapping || !folio_test_dirty(folio) ||</div><div class='add'>+	    !folio_test_checked(folio)) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Unfortunately this is a little tricky, either</div><div class='ctx'> 		 *</div><div class='del'>-		 * 1) We got here and our page had already been dealt with and</div><div class='add'>+		 * 1) We got here and our folio had already been dealt with and</div><div class='ctx'> 		 *    we reserved our space, thus ret == 0, so we need to just</div><div class='ctx'> 		 *    drop our space reservation and bail.  This can happen the</div><div class='ctx'> 		 *    first time we come into the fixup worker, or could happen</div><div class='ctx'> 		 *    while waiting for the ordered extent.</div><div class='del'>-		 * 2) Our page was already dealt with, but we happened to get an</div><div class='add'>+		 * 2) Our folio was already dealt with, but we happened to get an</div><div class='ctx'> 		 *    ENOSPC above from the btrfs_delalloc_reserve_space.  In</div><div class='ctx'> 		 *    this case we obviously don't have anything to release, but</div><div class='del'>-		 *    because the page was already dealt with we don't want to</div><div class='del'>-		 *    mark the page with an error, so make sure we're resetting</div><div class='add'>+		 *    because the folio was already dealt with we don't want to</div><div class='add'>+		 *    mark the folio with an error, so make sure we're resetting</div><div class='ctx'> 		 *    ret to 0.  This is why we have this check _before_ the ret</div><div class='ctx'> 		 *    check, because we do not want to have a surprise ENOSPC</div><div class='del'>-		 *    when the page was already properly dealt with.</div><div class='add'>+		 *    when the folio was already properly dealt with.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (!ret) {</div><div class='del'>-			btrfs_delalloc_release_extents(inode, PAGE_SIZE);</div><div class='add'>+			btrfs_delalloc_release_extents(inode, folio_size(folio));</div><div class='ctx'> 			btrfs_delalloc_release_space(inode, data_reserved,</div><div class='del'>-						     page_start, PAGE_SIZE,</div><div class='add'>+						     page_start, folio_size(folio),</div><div class='ctx'> 						     true);</div><div class='ctx'> 		}</div><div class='ctx'> 		ret = 0;</div><div class='hunk'>@@ -2734,24 +2810,24 @@ again:</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * We can't mess with the page state unless it is locked, so now that</div><div class='add'>+	 * We can't mess with the folio state unless it is locked, so now that</div><div class='ctx'> 	 * it is locked bail if we failed to make our space reservation.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out_page;</div><div class='ctx'> </div><div class='del'>-	lock_extent_bits(&amp;inode-&gt;io_tree, page_start, page_end, &amp;cached_state);</div><div class='add'>+	btrfs_lock_extent(&amp;inode-&gt;io_tree, page_start, page_end, &amp;cached_state);</div><div class='ctx'> </div><div class='ctx'> 	/* already ordered? We're done */</div><div class='del'>-	if (PageOrdered(page))</div><div class='add'>+	if (folio_test_ordered(folio))</div><div class='ctx'> 		goto out_reserved;</div><div class='ctx'> </div><div class='ctx'> 	ordered = btrfs_lookup_ordered_range(inode, page_start, PAGE_SIZE);</div><div class='ctx'> 	if (ordered) {</div><div class='del'>-		unlock_extent_cached(&amp;inode-&gt;io_tree, page_start, page_end,</div><div class='del'>-				     &amp;cached_state);</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		btrfs_start_ordered_extent(ordered, 1);</div><div class='add'>+		btrfs_unlock_extent(&amp;inode-&gt;io_tree, page_start, page_end,</div><div class='add'>+				    &amp;cached_state);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		btrfs_start_ordered_extent(ordered);</div><div class='ctx'> 		btrfs_put_ordered_extent(ordered);</div><div class='ctx'> 		goto again;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2768,29 +2844,28 @@ again:</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * The page was dirty when we started, nothing should have cleaned it.</div><div class='ctx'> 	 */</div><div class='del'>-	BUG_ON(!PageDirty(page));</div><div class='add'>+	BUG_ON(!folio_test_dirty(folio));</div><div class='ctx'> 	free_delalloc_space = false;</div><div class='ctx'> out_reserved:</div><div class='ctx'> 	btrfs_delalloc_release_extents(inode, PAGE_SIZE);</div><div class='ctx'> 	if (free_delalloc_space)</div><div class='ctx'> 		btrfs_delalloc_release_space(inode, data_reserved, page_start,</div><div class='ctx'> 					     PAGE_SIZE, true);</div><div class='del'>-	unlock_extent_cached(&amp;inode-&gt;io_tree, page_start, page_end,</div><div class='del'>-			     &amp;cached_state);</div><div class='add'>+	btrfs_unlock_extent(&amp;inode-&gt;io_tree, page_start, page_end, &amp;cached_state);</div><div class='ctx'> out_page:</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We hit ENOSPC or other errors.  Update the mapping and page</div><div class='ctx'> 		 * to reflect the errors and clean the page.</div><div class='ctx'> 		 */</div><div class='del'>-		mapping_set_error(page-&gt;mapping, ret);</div><div class='del'>-		end_extent_writepage(page, ret, page_start, page_end);</div><div class='del'>-		clear_page_dirty_for_io(page);</div><div class='del'>-		SetPageError(page);</div><div class='del'>-	}</div><div class='del'>-	btrfs_page_clear_checked(inode-&gt;root-&gt;fs_info, page, page_start, PAGE_SIZE);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='add'>+		mapping_set_error(folio-&gt;mapping, ret);</div><div class='add'>+		btrfs_mark_ordered_io_finished(inode, folio, page_start,</div><div class='add'>+					       folio_size(folio), !ret);</div><div class='add'>+		folio_clear_dirty_for_io(folio);</div><div class='add'>+	}</div><div class='add'>+	btrfs_folio_clear_checked(fs_info, folio, page_start, PAGE_SIZE);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> 	kfree(fixup);</div><div class='ctx'> 	extent_changeset_free(data_reserved);</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -2798,38 +2873,54 @@ out_page:</div><div class='ctx'> 	 * that could need flushing space. Recursing back to fixup worker would</div><div class='ctx'> 	 * deadlock.</div><div class='ctx'> 	 */</div><div class='del'>-	btrfs_add_delayed_iput(&amp;inode-&gt;vfs_inode);</div><div class='add'>+	btrfs_add_delayed_iput(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * There are a few paths in the higher layers of the kernel that directly</div><div class='del'>- * set the page dirty bit without asking the filesystem if it is a</div><div class='add'>+ * set the folio dirty bit without asking the filesystem if it is a</div><div class='ctx'>  * good idea.  This causes problems because we want to make sure COW</div><div class='ctx'>  * properly happens and the data=ordered rules are followed.</div><div class='ctx'>  *</div><div class='ctx'>  * In our case any range that doesn't have the ORDERED bit set</div><div class='ctx'>  * hasn't been properly setup for IO.  We kick off an async process</div><div class='ctx'>  * to fix it up.  The async helper will wait for ordered extents, set</div><div class='del'>- * the delalloc bit and make it safe to write the page.</div><div class='add'>+ * the delalloc bit and make it safe to write the folio.</div><div class='ctx'>  */</div><div class='del'>-int btrfs_writepage_cow_fixup(struct page *page)</div><div class='add'>+int btrfs_writepage_cow_fixup(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='ctx'> 	struct btrfs_writepage_fixup *fixup;</div><div class='ctx'> </div><div class='del'>-	/* This page has ordered extent covering it already */</div><div class='del'>-	if (PageOrdered(page))</div><div class='add'>+	/* This folio has ordered extent covering it already */</div><div class='add'>+	if (folio_test_ordered(folio))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * PageChecked is set below when we create a fixup worker for this page,</div><div class='del'>-	 * don't try to create another one if we're already PageChecked()</div><div class='add'>+	 * For experimental build, we error out instead of EAGAIN.</div><div class='add'>+	 *</div><div class='add'>+	 * We should not hit such out-of-band dirty folios anymore.</div><div class='add'>+	 */</div><div class='add'>+	if (IS_ENABLED(CONFIG_BTRFS_EXPERIMENTAL)) {</div><div class='add'>+		DEBUG_WARN();</div><div class='add'>+		btrfs_err_rl(fs_info,</div><div class='add'>+	"root %lld ino %llu folio %llu is marked dirty without notifying the fs",</div><div class='add'>+			     btrfs_root_id(BTRFS_I(inode)-&gt;root),</div><div class='add'>+			     btrfs_ino(BTRFS_I(inode)),</div><div class='add'>+			     folio_pos(folio));</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * folio_checked is set below when we create a fixup worker for this</div><div class='add'>+	 * folio, don't try to create another one if we're already</div><div class='add'>+	 * folio_test_checked.</div><div class='ctx'> 	 *</div><div class='del'>-	 * The extent_io writepage code will redirty the page if we send back</div><div class='add'>+	 * The extent_io writepage code will redirty the foio if we send back</div><div class='ctx'> 	 * EAGAIN.</div><div class='ctx'> 	 */</div><div class='del'>-	if (PageChecked(page))</div><div class='add'>+	if (folio_test_checked(folio))</div><div class='ctx'> 		return -EAGAIN;</div><div class='ctx'> </div><div class='ctx'> 	fixup = kzalloc(sizeof(*fixup), GFP_NOFS);</div><div class='hunk'>@@ -2839,15 +2930,15 @@ int btrfs_writepage_cow_fixup(struct page *page)</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We are already holding a reference to this inode from</div><div class='ctx'> 	 * write_cache_pages.  We need to hold it because the space reservation</div><div class='del'>-	 * takes place outside of the page lock, and we can't trust</div><div class='del'>-	 * page-&gt;mapping outside of the page lock.</div><div class='add'>+	 * takes place outside of the folio lock, and we can't trust</div><div class='add'>+	 * folio-&gt;mapping outside of the folio lock.</div><div class='ctx'> 	 */</div><div class='ctx'> 	ihold(inode);</div><div class='del'>-	btrfs_page_set_checked(fs_info, page, page_offset(page), PAGE_SIZE);</div><div class='del'>-	get_page(page);</div><div class='del'>-	btrfs_init_work(&amp;fixup-&gt;work, btrfs_writepage_fixup_worker, NULL, NULL);</div><div class='del'>-	fixup-&gt;page = page;</div><div class='del'>-	fixup-&gt;inode = inode;</div><div class='add'>+	btrfs_folio_set_checked(fs_info, folio, folio_pos(folio), folio_size(folio));</div><div class='add'>+	folio_get(folio);</div><div class='add'>+	btrfs_init_work(&amp;fixup-&gt;work, btrfs_writepage_fixup_worker, NULL);</div><div class='add'>+	fixup-&gt;folio = folio;</div><div class='add'>+	fixup-&gt;inode = BTRFS_I(inode);</div><div class='ctx'> 	btrfs_queue_work(fs_info-&gt;fixup_workers, &amp;fixup-&gt;work);</div><div class='ctx'> </div><div class='ctx'> 	return -EAGAIN;</div><div class='hunk'>@@ -2861,11 +2952,12 @@ static int insert_reserved_file_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	const u64 sectorsize = root-&gt;fs_info-&gt;sectorsize;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_key ins;</div><div class='ctx'> 	u64 disk_num_bytes = btrfs_stack_file_extent_disk_num_bytes(stack_fi);</div><div class='ctx'> 	u64 disk_bytenr = btrfs_stack_file_extent_disk_bytenr(stack_fi);</div><div class='add'>+	u64 offset = btrfs_stack_file_extent_offset(stack_fi);</div><div class='ctx'> 	u64 num_bytes = btrfs_stack_file_extent_num_bytes(stack_fi);</div><div class='ctx'> 	u64 ram_bytes = btrfs_stack_file_extent_ram_bytes(stack_fi);</div><div class='ctx'> 	struct btrfs_drop_extents_args drop_args = { 0 };</div><div class='hunk'>@@ -2895,8 +2987,8 @@ static int insert_reserved_file_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	if (!drop_args.extent_inserted) {</div><div class='ctx'> 		ins.objectid = btrfs_ino(inode);</div><div class='del'>-		ins.offset = file_pos;</div><div class='ctx'> 		ins.type = BTRFS_EXTENT_DATA_KEY;</div><div class='add'>+		ins.offset = file_pos;</div><div class='ctx'> </div><div class='ctx'> 		ret = btrfs_insert_empty_item(trans, root, path, &amp;ins,</div><div class='ctx'> 					      sizeof(*stack_fi));</div><div class='hunk'>@@ -2909,14 +3001,13 @@ static int insert_reserved_file_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			btrfs_item_ptr_offset(leaf, path-&gt;slots[0]),</div><div class='ctx'> 			sizeof(struct btrfs_file_extent_item));</div><div class='ctx'> </div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If we dropped an inline extent here, we know the range where it is</div><div class='ctx'> 	 * was not marked with the EXTENT_DELALLOC_NEW bit, so we update the</div><div class='ctx'> 	 * number of bytes only for that range containing the inline extent.</div><div class='del'>-	 * The remaining of the range will be processed when clearning the</div><div class='add'>+	 * The remaining of the range will be processed when clearing the</div><div class='ctx'> 	 * EXTENT_DELALLOC_BIT bit through the ordered extent completion.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (file_pos == 0 &amp;&amp; !IS_ALIGNED(drop_args.bytes_found, sectorsize)) {</div><div class='hunk'>@@ -2932,18 +3023,17 @@ static int insert_reserved_file_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		btrfs_update_inode_bytes(inode, num_bytes, drop_args.bytes_found);</div><div class='ctx'> </div><div class='ctx'> 	ins.objectid = disk_bytenr;</div><div class='del'>-	ins.offset = disk_num_bytes;</div><div class='ctx'> 	ins.type = BTRFS_EXTENT_ITEM_KEY;</div><div class='add'>+	ins.offset = disk_num_bytes;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_inode_set_file_extent_range(inode, file_pos, ram_bytes);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_alloc_reserved_file_extent(trans, root, btrfs_ino(inode),</div><div class='del'>-					       file_pos, qgroup_reserved, &amp;ins);</div><div class='add'>+					       file_pos - offset,</div><div class='add'>+					       qgroup_reserved, &amp;ins);</div><div class='ctx'> out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2966,20 +3056,20 @@ static int insert_ordered_extent_file_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 					     struct btrfs_ordered_extent *oe)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_file_extent_item stack_fi;</div><div class='del'>-	u64 logical_len;</div><div class='ctx'> 	bool update_inode_bytes;</div><div class='add'>+	u64 num_bytes = oe-&gt;num_bytes;</div><div class='add'>+	u64 ram_bytes = oe-&gt;ram_bytes;</div><div class='ctx'> </div><div class='ctx'> 	memset(&amp;stack_fi, 0, sizeof(stack_fi));</div><div class='ctx'> 	btrfs_set_stack_file_extent_type(&amp;stack_fi, BTRFS_FILE_EXTENT_REG);</div><div class='ctx'> 	btrfs_set_stack_file_extent_disk_bytenr(&amp;stack_fi, oe-&gt;disk_bytenr);</div><div class='ctx'> 	btrfs_set_stack_file_extent_disk_num_bytes(&amp;stack_fi,</div><div class='ctx'> 						   oe-&gt;disk_num_bytes);</div><div class='add'>+	btrfs_set_stack_file_extent_offset(&amp;stack_fi, oe-&gt;offset);</div><div class='ctx'> 	if (test_bit(BTRFS_ORDERED_TRUNCATED, &amp;oe-&gt;flags))</div><div class='del'>-		logical_len = oe-&gt;truncated_len;</div><div class='del'>-	else</div><div class='del'>-		logical_len = oe-&gt;num_bytes;</div><div class='del'>-	btrfs_set_stack_file_extent_num_bytes(&amp;stack_fi, logical_len);</div><div class='del'>-	btrfs_set_stack_file_extent_ram_bytes(&amp;stack_fi, logical_len);</div><div class='add'>+		num_bytes = oe-&gt;truncated_len;</div><div class='add'>+	btrfs_set_stack_file_extent_num_bytes(&amp;stack_fi, num_bytes);</div><div class='add'>+	btrfs_set_stack_file_extent_ram_bytes(&amp;stack_fi, ram_bytes);</div><div class='ctx'> 	btrfs_set_stack_file_extent_compression(&amp;stack_fi, oe-&gt;compress_type);</div><div class='ctx'> 	/* Encryption and other encoding is reserved and all 0 */</div><div class='ctx'> </div><div class='hunk'>@@ -2990,9 +3080,10 @@ static int insert_ordered_extent_file_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * except if the ordered extent was truncated.</div><div class='ctx'> 	 */</div><div class='ctx'> 	update_inode_bytes = test_bit(BTRFS_ORDERED_DIRECT, &amp;oe-&gt;flags) ||</div><div class='add'>+			     test_bit(BTRFS_ORDERED_ENCODED, &amp;oe-&gt;flags) ||</div><div class='ctx'> 			     test_bit(BTRFS_ORDERED_TRUNCATED, &amp;oe-&gt;flags);</div><div class='ctx'> </div><div class='del'>-	return insert_reserved_file_extent(trans, BTRFS_I(oe-&gt;inode),</div><div class='add'>+	return insert_reserved_file_extent(trans, oe-&gt;inode,</div><div class='ctx'> 					   oe-&gt;file_offset, &amp;stack_fi,</div><div class='ctx'> 					   update_inode_bytes, oe-&gt;qgroup_rsv);</div><div class='ctx'> }</div><div class='hunk'>@@ -3002,9 +3093,9 @@ static int insert_ordered_extent_file_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'>  * an ordered extent if the range of bytes in the file it covers are</div><div class='ctx'>  * fully written.</div><div class='ctx'>  */</div><div class='del'>-static int btrfs_finish_ordered_io(struct btrfs_ordered_extent *ordered_extent)</div><div class='add'>+int btrfs_finish_one_ordered(struct btrfs_ordered_extent *ordered_extent)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_inode *inode = BTRFS_I(ordered_extent-&gt;inode);</div><div class='add'>+	struct btrfs_inode *inode = ordered_extent-&gt;inode;</div><div class='ctx'> 	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_trans_handle *trans = NULL;</div><div class='hunk'>@@ -3024,24 +3115,23 @@ static int btrfs_finish_ordered_io(struct btrfs_ordered_extent *ordered_extent)</div><div class='ctx'> </div><div class='ctx'> 	if (!test_bit(BTRFS_ORDERED_NOCOW, &amp;ordered_extent-&gt;flags) &amp;&amp;</div><div class='ctx'> 	    !test_bit(BTRFS_ORDERED_PREALLOC, &amp;ordered_extent-&gt;flags) &amp;&amp;</div><div class='del'>-	    !test_bit(BTRFS_ORDERED_DIRECT, &amp;ordered_extent-&gt;flags))</div><div class='add'>+	    !test_bit(BTRFS_ORDERED_DIRECT, &amp;ordered_extent-&gt;flags) &amp;&amp;</div><div class='add'>+	    !test_bit(BTRFS_ORDERED_ENCODED, &amp;ordered_extent-&gt;flags))</div><div class='ctx'> 		clear_bits |= EXTENT_DELALLOC_NEW;</div><div class='ctx'> </div><div class='ctx'> 	freespace_inode = btrfs_is_free_space_inode(inode);</div><div class='add'>+	if (!freespace_inode)</div><div class='add'>+		btrfs_lockdep_acquire(fs_info, btrfs_ordered_extent);</div><div class='ctx'> </div><div class='del'>-	if (test_bit(BTRFS_ORDERED_IOERR, &amp;ordered_extent-&gt;flags)) {</div><div class='add'>+	if (unlikely(test_bit(BTRFS_ORDERED_IOERR, &amp;ordered_extent-&gt;flags))) {</div><div class='ctx'> 		ret = -EIO;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* A valid bdev implies a write on a sequential zone */</div><div class='del'>-	if (ordered_extent-&gt;bdev) {</div><div class='del'>-		btrfs_rewrite_logical_zoned(ordered_extent);</div><div class='del'>-		btrfs_zone_finish_endio(fs_info, ordered_extent-&gt;disk_bytenr,</div><div class='del'>-					ordered_extent-&gt;disk_num_bytes);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	btrfs_free_io_failure_record(inode, start, end);</div><div class='add'>+	ret = btrfs_zone_finish_endio(fs_info, ordered_extent-&gt;disk_bytenr,</div><div class='add'>+				      ordered_extent-&gt;disk_num_bytes);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='ctx'> 	if (test_bit(BTRFS_ORDERED_TRUNCATED, &amp;ordered_extent-&gt;flags)) {</div><div class='ctx'> 		truncated = true;</div><div class='hunk'>@@ -3051,29 +3141,21 @@ static int btrfs_finish_ordered_io(struct btrfs_ordered_extent *ordered_extent)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (test_bit(BTRFS_ORDERED_NOCOW, &amp;ordered_extent-&gt;flags)) {</div><div class='del'>-		BUG_ON(!list_empty(&amp;ordered_extent-&gt;list)); /* Logic error */</div><div class='del'>-</div><div class='del'>-		btrfs_inode_safe_disk_i_size_write(inode, 0);</div><div class='del'>-		if (freespace_inode)</div><div class='del'>-			trans = btrfs_join_transaction_spacecache(root);</div><div class='del'>-		else</div><div class='del'>-			trans = btrfs_join_transaction(root);</div><div class='del'>-		if (IS_ERR(trans)) {</div><div class='del'>-			ret = PTR_ERR(trans);</div><div class='del'>-			trans = NULL;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		trans-&gt;block_rsv = &amp;inode-&gt;block_rsv;</div><div class='del'>-		ret = btrfs_update_inode_fallback(trans, root, inode);</div><div class='del'>-		if (ret) /* -ENOMEM or corruption */</div><div class='del'>-			btrfs_abort_transaction(trans, ret);</div><div class='del'>-		goto out;</div><div class='add'>+	/*</div><div class='add'>+	 * If it's a COW write we need to lock the extent range as we will be</div><div class='add'>+	 * inserting/replacing file extent items and unpinning an extent map.</div><div class='add'>+	 * This must be taken before joining a transaction, as it's a higher</div><div class='add'>+	 * level lock (like the inode's VFS lock), otherwise we can run into an</div><div class='add'>+	 * ABBA deadlock with other tasks (transactions work like a lock,</div><div class='add'>+	 * depending on their current state).</div><div class='add'>+	 */</div><div class='add'>+	if (!test_bit(BTRFS_ORDERED_NOCOW, &amp;ordered_extent-&gt;flags)) {</div><div class='add'>+		clear_bits |= EXTENT_LOCKED | EXTENT_FINISHING_ORDERED;</div><div class='add'>+		btrfs_lock_extent_bits(io_tree, start, end,</div><div class='add'>+				       EXTENT_LOCKED | EXTENT_FINISHING_ORDERED,</div><div class='add'>+				       &amp;cached_state);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	clear_bits |= EXTENT_LOCKED;</div><div class='del'>-	lock_extent_bits(io_tree, start, end, &amp;cached_state);</div><div class='del'>-</div><div class='ctx'> 	if (freespace_inode)</div><div class='ctx'> 		trans = btrfs_join_transaction_spacecache(root);</div><div class='ctx'> 	else</div><div class='hunk'>@@ -3086,6 +3168,30 @@ static int btrfs_finish_ordered_io(struct btrfs_ordered_extent *ordered_extent)</div><div class='ctx'> </div><div class='ctx'> 	trans-&gt;block_rsv = &amp;inode-&gt;block_rsv;</div><div class='ctx'> </div><div class='add'>+	ret = btrfs_insert_raid_extent(trans, ordered_extent);</div><div class='add'>+	if (unlikely(ret)) {</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (test_bit(BTRFS_ORDERED_NOCOW, &amp;ordered_extent-&gt;flags)) {</div><div class='add'>+		/* Logic error */</div><div class='add'>+		ASSERT(list_empty(&amp;ordered_extent-&gt;list));</div><div class='add'>+		if (unlikely(!list_empty(&amp;ordered_extent-&gt;list))) {</div><div class='add'>+			ret = -EINVAL;</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		btrfs_inode_safe_disk_i_size_write(inode, 0);</div><div class='add'>+		ret = btrfs_update_inode_fallback(trans, inode);</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			/* -ENOMEM or corruption */</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+		}</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (test_bit(BTRFS_ORDERED_COMPRESSED, &amp;ordered_extent-&gt;flags))</div><div class='ctx'> 		compress_type = ordered_extent-&gt;compress_type;</div><div class='ctx'> 	if (test_bit(BTRFS_ORDERED_PREALLOC, &amp;ordered_extent-&gt;flags)) {</div><div class='hunk'>@@ -3094,6 +3200,8 @@ static int btrfs_finish_ordered_io(struct btrfs_ordered_extent *ordered_extent)</div><div class='ctx'> 						ordered_extent-&gt;file_offset,</div><div class='ctx'> 						ordered_extent-&gt;file_offset +</div><div class='ctx'> 						logical_len);</div><div class='add'>+		btrfs_zoned_release_data_reloc_bg(fs_info, ordered_extent-&gt;disk_bytenr,</div><div class='add'>+						  ordered_extent-&gt;disk_num_bytes);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		BUG_ON(root == fs_info-&gt;tree_root);</div><div class='ctx'> 		ret = insert_ordered_extent_file_extent(trans, ordered_extent);</div><div class='hunk'>@@ -3104,15 +3212,20 @@ static int btrfs_finish_ordered_io(struct btrfs_ordered_extent *ordered_extent)</div><div class='ctx'> 						ordered_extent-&gt;disk_num_bytes);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	unpin_extent_cache(&amp;inode-&gt;extent_tree, ordered_extent-&gt;file_offset,</div><div class='del'>-			   ordered_extent-&gt;num_bytes, trans-&gt;transid);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='add'>+	if (unlikely(ret &lt; 0)) {</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_unpin_extent_cache(inode, ordered_extent-&gt;file_offset,</div><div class='add'>+				       ordered_extent-&gt;num_bytes, trans-&gt;transid);</div><div class='add'>+	if (unlikely(ret &lt; 0)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = add_pending_csums(trans, &amp;ordered_extent-&gt;list);</div><div class='del'>-	if (ret) {</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3124,28 +3237,24 @@ static int btrfs_finish_ordered_io(struct btrfs_ordered_extent *ordered_extent)</div><div class='ctx'> 	 */</div><div class='ctx'> 	if ((clear_bits &amp; EXTENT_DELALLOC_NEW) &amp;&amp;</div><div class='ctx'> 	    !test_bit(BTRFS_ORDERED_TRUNCATED, &amp;ordered_extent-&gt;flags))</div><div class='del'>-		clear_extent_bit(&amp;inode-&gt;io_tree, start, end,</div><div class='del'>-				 EXTENT_DELALLOC_NEW | EXTENT_ADD_INODE_BYTES,</div><div class='del'>-				 0, 0, &amp;cached_state);</div><div class='add'>+		btrfs_clear_extent_bit(&amp;inode-&gt;io_tree, start, end,</div><div class='add'>+				       EXTENT_DELALLOC_NEW | EXTENT_ADD_INODE_BYTES,</div><div class='add'>+				       &amp;cached_state);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_inode_safe_disk_i_size_write(inode, 0);</div><div class='del'>-	ret = btrfs_update_inode_fallback(trans, root, inode);</div><div class='del'>-	if (ret) { /* -ENOMEM or corruption */</div><div class='add'>+	ret = btrfs_update_inode_fallback(trans, inode);</div><div class='add'>+	if (unlikely(ret)) { /* -ENOMEM or corruption */</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	ret = 0;</div><div class='ctx'> out:</div><div class='del'>-	clear_extent_bit(&amp;inode-&gt;io_tree, start, end, clear_bits,</div><div class='del'>-			 (clear_bits &amp; EXTENT_LOCKED) ? 1 : 0, 0,</div><div class='del'>-			 &amp;cached_state);</div><div class='add'>+	btrfs_clear_extent_bit(&amp;inode-&gt;io_tree, start, end, clear_bits,</div><div class='add'>+			       &amp;cached_state);</div><div class='ctx'> </div><div class='ctx'> 	if (trans)</div><div class='ctx'> 		btrfs_end_transaction(trans);</div><div class='ctx'> </div><div class='ctx'> 	if (ret || truncated) {</div><div class='del'>-		u64 unwritten_start = start;</div><div class='del'>-</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * If we failed to finish this ordered extent for any reason we</div><div class='ctx'> 		 * need to make sure BTRFS_ORDERED_IOERR is set on the ordered</div><div class='hunk'>@@ -3154,16 +3263,32 @@ out:</div><div class='ctx'> 		 * set the mapping error, so we need to set it if we're the ones</div><div class='ctx'> 		 * marking this ordered extent as failed.</div><div class='ctx'> 		 */</div><div class='del'>-		if (ret &amp;&amp; !test_and_set_bit(BTRFS_ORDERED_IOERR,</div><div class='del'>-					     &amp;ordered_extent-&gt;flags))</div><div class='del'>-			mapping_set_error(ordered_extent-&gt;inode-&gt;i_mapping, -EIO);</div><div class='add'>+		if (ret)</div><div class='add'>+			btrfs_mark_ordered_extent_error(ordered_extent);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Drop extent maps for the part of the extent we didn't write.</div><div class='add'>+		 *</div><div class='add'>+		 * We have an exception here for the free_space_inode, this is</div><div class='add'>+		 * because when we do btrfs_get_extent() on the free space inode</div><div class='add'>+		 * we will search the commit root.  If this is a new block group</div><div class='add'>+		 * we won't find anything, and we will trip over the assert in</div><div class='add'>+		 * writepage where we do ASSERT(em-&gt;block_start !=</div><div class='add'>+		 * EXTENT_MAP_HOLE).</div><div class='add'>+		 *</div><div class='add'>+		 * Theoretically we could also skip this for any NOCOW extent as</div><div class='add'>+		 * we don't mess with the extent map tree in the NOCOW case, but</div><div class='add'>+		 * for now simply skip this if we are the free space inode.</div><div class='add'>+		 */</div><div class='add'>+		if (!btrfs_is_free_space_inode(inode)) {</div><div class='add'>+			u64 unwritten_start = start;</div><div class='ctx'> </div><div class='del'>-		if (truncated)</div><div class='del'>-			unwritten_start += logical_len;</div><div class='del'>-		clear_extent_uptodate(io_tree, unwritten_start, end, NULL);</div><div class='add'>+			if (truncated)</div><div class='add'>+				unwritten_start += logical_len;</div><div class='ctx'> </div><div class='del'>-		/* Drop the cache for the part of the extent we didn't write. */</div><div class='del'>-		btrfs_drop_extent_cache(inode, unwritten_start, end, 0);</div><div class='add'>+			btrfs_drop_extent_map_range(inode, unwritten_start,</div><div class='add'>+						    end, false);</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * If the ordered extent had an IOERR or something else went</div><div class='hunk'>@@ -3190,7 +3315,14 @@ out:</div><div class='ctx'> 						NULL);</div><div class='ctx'> 			btrfs_free_reserved_extent(fs_info,</div><div class='ctx'> 					ordered_extent-&gt;disk_bytenr,</div><div class='del'>-					ordered_extent-&gt;disk_num_bytes, 1);</div><div class='add'>+					ordered_extent-&gt;disk_num_bytes, true);</div><div class='add'>+			/*</div><div class='add'>+			 * Actually free the qgroup rsv which was released when</div><div class='add'>+			 * the ordered extent was created.</div><div class='add'>+			 */</div><div class='add'>+			btrfs_qgroup_free_refroot(fs_info, btrfs_root_id(inode-&gt;root),</div><div class='add'>+						  ordered_extent-&gt;qgroup_rsv,</div><div class='add'>+						  BTRFS_QGROUP_RSV_DATA);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -3208,149 +3340,149 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void finish_ordered_fn(struct btrfs_work *work)</div><div class='add'>+int btrfs_finish_ordered_io(struct btrfs_ordered_extent *ordered)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_ordered_extent *ordered_extent;</div><div class='del'>-	ordered_extent = container_of(work, struct btrfs_ordered_extent, work);</div><div class='del'>-	btrfs_finish_ordered_io(ordered_extent);</div><div class='add'>+	if (btrfs_is_zoned(ordered-&gt;inode-&gt;root-&gt;fs_info) &amp;&amp;</div><div class='add'>+	    !test_bit(BTRFS_ORDERED_IOERR, &amp;ordered-&gt;flags) &amp;&amp;</div><div class='add'>+	    list_empty(&amp;ordered-&gt;bioc_list))</div><div class='add'>+		btrfs_finish_ordered_zoned(ordered);</div><div class='add'>+	return btrfs_finish_one_ordered(ordered);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_writepage_endio_finish_ordered(struct btrfs_inode *inode,</div><div class='del'>-					  struct page *page, u64 start,</div><div class='del'>-					  u64 end, bool uptodate)</div><div class='add'>+/*</div><div class='add'>+ * Calculate the checksum of an fs block at physical memory address @paddr,</div><div class='add'>+ * and save the result to @dest.</div><div class='add'>+ *</div><div class='add'>+ * The folio containing @paddr must be large enough to contain a full fs block.</div><div class='add'>+ */</div><div class='add'>+void btrfs_calculate_block_csum_folio(struct btrfs_fs_info *fs_info,</div><div class='add'>+				      const phys_addr_t paddr, u8 *dest)</div><div class='ctx'> {</div><div class='del'>-	trace_btrfs_writepage_end_io_hook(inode, start, end, uptodate);</div><div class='add'>+	struct folio *folio = page_folio(phys_to_page(paddr));</div><div class='add'>+	const u32 blocksize = fs_info-&gt;sectorsize;</div><div class='add'>+	const u32 step = min(blocksize, PAGE_SIZE);</div><div class='add'>+	const u32 nr_steps = blocksize / step;</div><div class='add'>+	phys_addr_t paddrs[BTRFS_MAX_BLOCKSIZE / PAGE_SIZE];</div><div class='ctx'> </div><div class='del'>-	btrfs_mark_ordered_io_finished(inode, page, start, end + 1 - start,</div><div class='del'>-				       finish_ordered_fn, uptodate);</div><div class='add'>+	/* The full block must be inside the folio. */</div><div class='add'>+	ASSERT(offset_in_folio(folio, paddr) + blocksize &lt;= folio_size(folio));</div><div class='add'>+</div><div class='add'>+	for (int i = 0; i &lt; nr_steps; i++) {</div><div class='add'>+		u32 pindex = offset_in_folio(folio, paddr + i * step) &gt;&gt; PAGE_SHIFT;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * For bs &lt;= ps cases, we will only run the loop once, so the offset</div><div class='add'>+		 * inside the page will only added to paddrs[0].</div><div class='add'>+		 *</div><div class='add'>+		 * For bs &gt; ps cases, the block must be page aligned, thus offset</div><div class='add'>+		 * inside the page will always be 0.</div><div class='add'>+		 */</div><div class='add'>+		paddrs[i] = page_to_phys(folio_page(folio, pindex)) + offset_in_page(paddr);</div><div class='add'>+	}</div><div class='add'>+	return btrfs_calculate_block_csum_pages(fs_info, paddrs, dest);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * check_data_csum - verify checksum of one sector of uncompressed data</div><div class='del'>- * @inode:	inode</div><div class='del'>- * @io_bio:	btrfs_io_bio which contains the csum</div><div class='del'>- * @bio_offset:	offset to the beginning of the bio (in bytes)</div><div class='del'>- * @page:	page where is the data to be verified</div><div class='del'>- * @pgoff:	offset inside the page</div><div class='del'>- * @start:	logical offset in the file</div><div class='add'>+ * Calculate the checksum of a fs block backed by multiple noncontiguous pages</div><div class='add'>+ * at @paddrs[] and save the result to @dest.</div><div class='ctx'>  *</div><div class='del'>- * The length of such check is always one sector size.</div><div class='add'>+ * The folio containing @paddr must be large enough to contain a full fs block.</div><div class='ctx'>  */</div><div class='del'>-static int check_data_csum(struct inode *inode, struct btrfs_bio *bbio,</div><div class='del'>-			   u32 bio_offset, struct page *page, u32 pgoff,</div><div class='del'>-			   u64 start)</div><div class='add'>+void btrfs_calculate_block_csum_pages(struct btrfs_fs_info *fs_info,</div><div class='add'>+				      const phys_addr_t paddrs[], u8 *dest)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='add'>+	const u32 blocksize = fs_info-&gt;sectorsize;</div><div class='add'>+	const u32 step = min(blocksize, PAGE_SIZE);</div><div class='add'>+	const u32 nr_steps = blocksize / step;</div><div class='ctx'> 	SHASH_DESC_ON_STACK(shash, fs_info-&gt;csum_shash);</div><div class='del'>-	char *kaddr;</div><div class='del'>-	u32 len = fs_info-&gt;sectorsize;</div><div class='del'>-	const u32 csum_size = fs_info-&gt;csum_size;</div><div class='del'>-	unsigned int offset_sectors;</div><div class='del'>-	u8 *csum_expected;</div><div class='del'>-	u8 csum[BTRFS_CSUM_SIZE];</div><div class='del'>-</div><div class='del'>-	ASSERT(pgoff + len &lt;= PAGE_SIZE);</div><div class='del'>-</div><div class='del'>-	offset_sectors = bio_offset &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='del'>-	csum_expected = ((u8 *)bbio-&gt;csum) + offset_sectors * csum_size;</div><div class='ctx'> </div><div class='del'>-	kaddr = kmap_atomic(page);</div><div class='ctx'> 	shash-&gt;tfm = fs_info-&gt;csum_shash;</div><div class='add'>+	crypto_shash_init(shash);</div><div class='add'>+	for (int i = 0; i &lt; nr_steps; i++) {</div><div class='add'>+		const phys_addr_t paddr = paddrs[i];</div><div class='add'>+		void *kaddr;</div><div class='ctx'> </div><div class='del'>-	crypto_shash_digest(shash, kaddr + pgoff, len, csum);</div><div class='del'>-</div><div class='del'>-	if (memcmp(csum, csum_expected, csum_size))</div><div class='del'>-		goto zeroit;</div><div class='add'>+		ASSERT(offset_in_page(paddr) + step &lt;= PAGE_SIZE);</div><div class='add'>+		kaddr = kmap_local_page(phys_to_page(paddr)) + offset_in_page(paddr);</div><div class='add'>+		crypto_shash_update(shash, kaddr, step);</div><div class='add'>+		kunmap_local(kaddr);</div><div class='add'>+	}</div><div class='add'>+	crypto_shash_final(shash, dest);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	kunmap_atomic(kaddr);</div><div class='add'>+/*</div><div class='add'>+ * Verify the checksum for a single sector without any extra action that depend</div><div class='add'>+ * on the type of I/O.</div><div class='add'>+ *</div><div class='add'>+ * @kaddr must be a properly kmapped address.</div><div class='add'>+ */</div><div class='add'>+int btrfs_check_block_csum(struct btrfs_fs_info *fs_info, phys_addr_t paddr, u8 *csum,</div><div class='add'>+			   const u8 * const csum_expected)</div><div class='add'>+{</div><div class='add'>+	btrfs_calculate_block_csum_folio(fs_info, paddr, csum);</div><div class='add'>+	if (unlikely(memcmp(csum, csum_expected, fs_info-&gt;csum_size) != 0))</div><div class='add'>+		return -EIO;</div><div class='ctx'> 	return 0;</div><div class='del'>-zeroit:</div><div class='del'>-	btrfs_print_data_csum_error(BTRFS_I(inode), start, csum, csum_expected,</div><div class='del'>-				    bbio-&gt;mirror_num);</div><div class='del'>-	if (bbio-&gt;device)</div><div class='del'>-		btrfs_dev_stat_inc_and_print(bbio-&gt;device,</div><div class='del'>-					     BTRFS_DEV_STAT_CORRUPTION_ERRS);</div><div class='del'>-	memset(kaddr + pgoff, 1, len);</div><div class='del'>-	flush_dcache_page(page);</div><div class='del'>-	kunmap_atomic(kaddr);</div><div class='del'>-	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * When reads are done, we need to check csums to verify the data is correct.</div><div class='del'>- * if there's a match, we allow the bio to finish.  If not, the code in</div><div class='del'>- * extent_io.c will try to find good copies for us.</div><div class='add'>+ * Verify the checksum of a single data sector, which can be scattered at</div><div class='add'>+ * different noncontiguous pages.</div><div class='ctx'>  *</div><div class='add'>+ * @bbio:	btrfs_io_bio which contains the csum</div><div class='add'>+ * @dev:	device the sector is on</div><div class='ctx'>  * @bio_offset:	offset to the beginning of the bio (in bytes)</div><div class='del'>- * @start:	file offset of the range start</div><div class='del'>- * @end:	file offset of the range end (inclusive)</div><div class='add'>+ * @paddrs:	physical addresses which back the fs block</div><div class='ctx'>  *</div><div class='del'>- * Return a bitmap where bit set means a csum mismatch, and bit not set means</div><div class='del'>- * csum match.</div><div class='add'>+ * Check if the checksum on a data block is valid.  When a checksum mismatch is</div><div class='add'>+ * detected, report the error and fill the corrupted range with zero.</div><div class='add'>+ *</div><div class='add'>+ * Return %true if the sector is ok or had no checksum to start with, else %false.</div><div class='ctx'>  */</div><div class='del'>-unsigned int btrfs_verify_data_csum(struct btrfs_bio *bbio,</div><div class='del'>-				    u32 bio_offset, struct page *page,</div><div class='del'>-				    u64 start, u64 end)</div><div class='add'>+bool btrfs_data_csum_ok(struct btrfs_bio *bbio, struct btrfs_device *dev,</div><div class='add'>+			u32 bio_offset, const phys_addr_t paddrs[])</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	struct extent_io_tree *io_tree = &amp;BTRFS_I(inode)-&gt;io_tree;</div><div class='del'>-	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='del'>-	const u32 sectorsize = root-&gt;fs_info-&gt;sectorsize;</div><div class='del'>-	u32 pg_off;</div><div class='del'>-	unsigned int result = 0;</div><div class='del'>-</div><div class='del'>-	if (btrfs_page_test_checked(fs_info, page, start, end + 1 - start)) {</div><div class='del'>-		btrfs_page_clear_checked(fs_info, page, start, end + 1 - start);</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * This only happens for NODATASUM or compressed read.</div><div class='del'>-	 * Normally this should be covered by above check for compressed read</div><div class='del'>-	 * or the next check for NODATASUM.  Just do a quicker exit here.</div><div class='del'>-	 */</div><div class='del'>-	if (bbio-&gt;csum == NULL)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	if (BTRFS_I(inode)-&gt;flags &amp; BTRFS_INODE_NODATASUM)</div><div class='del'>-		return 0;</div><div class='add'>+	struct btrfs_inode *inode = bbio-&gt;inode;</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	const u32 blocksize = fs_info-&gt;sectorsize;</div><div class='add'>+	const u32 step = min(blocksize, PAGE_SIZE);</div><div class='add'>+	const u32 nr_steps = blocksize / step;</div><div class='add'>+	u64 file_offset = bbio-&gt;file_offset + bio_offset;</div><div class='add'>+	u64 end = file_offset + blocksize - 1;</div><div class='add'>+	u8 *csum_expected;</div><div class='add'>+	u8 csum[BTRFS_CSUM_SIZE];</div><div class='ctx'> </div><div class='del'>-	if (!root-&gt;fs_info-&gt;csum_root)</div><div class='del'>-		return 0;</div><div class='add'>+	if (!bbio-&gt;csum)</div><div class='add'>+		return true;</div><div class='ctx'> </div><div class='del'>-	ASSERT(page_offset(page) &lt;= start &amp;&amp;</div><div class='del'>-	       end &lt;= page_offset(page) + PAGE_SIZE - 1);</div><div class='del'>-	for (pg_off = offset_in_page(start);</div><div class='del'>-	     pg_off &lt; offset_in_page(end);</div><div class='del'>-	     pg_off += sectorsize, bio_offset += sectorsize) {</div><div class='del'>-		u64 file_offset = pg_off + page_offset(page);</div><div class='del'>-		int ret;</div><div class='add'>+	if (btrfs_is_data_reloc_root(inode-&gt;root) &amp;&amp;</div><div class='add'>+	    btrfs_test_range_bit(&amp;inode-&gt;io_tree, file_offset, end, EXTENT_NODATASUM,</div><div class='add'>+				 NULL)) {</div><div class='add'>+		/* Skip the range without csum for data reloc inode */</div><div class='add'>+		btrfs_clear_extent_bit(&amp;inode-&gt;io_tree, file_offset, end,</div><div class='add'>+				       EXTENT_NODATASUM, NULL);</div><div class='add'>+		return true;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		if (btrfs_is_data_reloc_root(root) &amp;&amp;</div><div class='del'>-		    test_range_bit(io_tree, file_offset,</div><div class='del'>-				   file_offset + sectorsize - 1,</div><div class='del'>-				   EXTENT_NODATASUM, 1, NULL)) {</div><div class='del'>-			/* Skip the range without csum for data reloc inode */</div><div class='del'>-			clear_extent_bits(io_tree, file_offset,</div><div class='del'>-					  file_offset + sectorsize - 1,</div><div class='del'>-					  EXTENT_NODATASUM);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-		ret = check_data_csum(inode, bbio, bio_offset, page, pg_off,</div><div class='del'>-				      page_offset(page) + pg_off);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			const int nr_bit = (pg_off - offset_in_page(start)) &gt;&gt;</div><div class='del'>-				     root-&gt;fs_info-&gt;sectorsize_bits;</div><div class='add'>+	csum_expected = bbio-&gt;csum + (bio_offset &gt;&gt; fs_info-&gt;sectorsize_bits) *</div><div class='add'>+				fs_info-&gt;csum_size;</div><div class='add'>+	btrfs_calculate_block_csum_pages(fs_info, paddrs, csum);</div><div class='add'>+	if (unlikely(memcmp(csum, csum_expected, fs_info-&gt;csum_size) != 0))</div><div class='add'>+		goto zeroit;</div><div class='add'>+	return true;</div><div class='ctx'> </div><div class='del'>-			result |= (1U &lt;&lt; nr_bit);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	return result;</div><div class='add'>+zeroit:</div><div class='add'>+	btrfs_print_data_csum_error(inode, file_offset, csum, csum_expected,</div><div class='add'>+				    bbio-&gt;mirror_num);</div><div class='add'>+	if (dev)</div><div class='add'>+		btrfs_dev_stat_inc_and_print(dev, BTRFS_DEV_STAT_CORRUPTION_ERRS);</div><div class='add'>+	for (int i = 0; i &lt; nr_steps; i++)</div><div class='add'>+		memzero_page(phys_to_page(paddrs[i]), offset_in_page(paddrs[i]), step);</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * btrfs_add_delayed_iput - perform a delayed iput on @inode</div><div class='add'>+ * Perform a delayed iput on @inode.</div><div class='ctx'>  *</div><div class='ctx'>  * @inode: The inode we want to perform iput on</div><div class='ctx'>  *</div><div class='hunk'>@@ -3359,19 +3491,25 @@ unsigned int btrfs_verify_data_csum(struct btrfs_bio *bbio,</div><div class='ctx'>  * the inode to the delayed iput machinery. Delayed iputs are processed at</div><div class='ctx'>  * transaction commit time/superblock commit/cleaner kthread.</div><div class='ctx'>  */</div><div class='del'>-void btrfs_add_delayed_iput(struct inode *inode)</div><div class='add'>+void btrfs_add_delayed_iput(struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	struct btrfs_inode *binode = BTRFS_I(inode);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	unsigned long flags;</div><div class='ctx'> </div><div class='del'>-	if (atomic_add_unless(&amp;inode-&gt;i_count, -1, 1))</div><div class='add'>+	if (atomic_add_unless(&amp;inode-&gt;vfs_inode.i_count, -1, 1))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='add'>+	WARN_ON_ONCE(test_bit(BTRFS_FS_STATE_NO_DELAYED_IPUT, &amp;fs_info-&gt;fs_state));</div><div class='ctx'> 	atomic_inc(&amp;fs_info-&gt;nr_delayed_iputs);</div><div class='del'>-	spin_lock(&amp;fs_info-&gt;delayed_iput_lock);</div><div class='del'>-	ASSERT(list_empty(&amp;binode-&gt;delayed_iput));</div><div class='del'>-	list_add_tail(&amp;binode-&gt;delayed_iput, &amp;fs_info-&gt;delayed_iputs);</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;delayed_iput_lock);</div><div class='add'>+	/*</div><div class='add'>+	 * Need to be irq safe here because we can be called from either an irq</div><div class='add'>+	 * context (see bio.c and btrfs_put_ordered_extent()) or a non-irq</div><div class='add'>+	 * context.</div><div class='add'>+	 */</div><div class='add'>+	spin_lock_irqsave(&amp;fs_info-&gt;delayed_iput_lock, flags);</div><div class='add'>+	ASSERT(list_empty(&amp;inode-&gt;delayed_iput));</div><div class='add'>+	list_add_tail(&amp;inode-&gt;delayed_iput, &amp;fs_info-&gt;delayed_iputs);</div><div class='add'>+	spin_unlock_irqrestore(&amp;fs_info-&gt;delayed_iput_lock, flags);</div><div class='ctx'> 	if (!test_bit(BTRFS_FS_CLEANER_RUNNING, &amp;fs_info-&gt;flags))</div><div class='ctx'> 		wake_up_process(fs_info-&gt;cleaner_kthread);</div><div class='ctx'> }</div><div class='hunk'>@@ -3380,40 +3518,49 @@ static void run_delayed_iput_locked(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				    struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	list_del_init(&amp;inode-&gt;delayed_iput);</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;delayed_iput_lock);</div><div class='add'>+	spin_unlock_irq(&amp;fs_info-&gt;delayed_iput_lock);</div><div class='ctx'> 	iput(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> 	if (atomic_dec_and_test(&amp;fs_info-&gt;nr_delayed_iputs))</div><div class='ctx'> 		wake_up(&amp;fs_info-&gt;delayed_iputs_wait);</div><div class='del'>-	spin_lock(&amp;fs_info-&gt;delayed_iput_lock);</div><div class='add'>+	spin_lock_irq(&amp;fs_info-&gt;delayed_iput_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void btrfs_run_delayed_iput(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				   struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	if (!list_empty(&amp;inode-&gt;delayed_iput)) {</div><div class='del'>-		spin_lock(&amp;fs_info-&gt;delayed_iput_lock);</div><div class='add'>+		spin_lock_irq(&amp;fs_info-&gt;delayed_iput_lock);</div><div class='ctx'> 		if (!list_empty(&amp;inode-&gt;delayed_iput))</div><div class='ctx'> 			run_delayed_iput_locked(fs_info, inode);</div><div class='del'>-		spin_unlock(&amp;fs_info-&gt;delayed_iput_lock);</div><div class='add'>+		spin_unlock_irq(&amp;fs_info-&gt;delayed_iput_lock);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_run_delayed_iputs(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;fs_info-&gt;delayed_iput_lock);</div><div class='add'>+	/*</div><div class='add'>+	 * btrfs_put_ordered_extent() can run in irq context (see bio.c), which</div><div class='add'>+	 * calls btrfs_add_delayed_iput() and that needs to lock</div><div class='add'>+	 * fs_info-&gt;delayed_iput_lock. So we need to disable irqs here to</div><div class='add'>+	 * prevent a deadlock.</div><div class='add'>+	 */</div><div class='add'>+	spin_lock_irq(&amp;fs_info-&gt;delayed_iput_lock);</div><div class='ctx'> 	while (!list_empty(&amp;fs_info-&gt;delayed_iputs)) {</div><div class='ctx'> 		struct btrfs_inode *inode;</div><div class='ctx'> </div><div class='ctx'> 		inode = list_first_entry(&amp;fs_info-&gt;delayed_iputs,</div><div class='ctx'> 				struct btrfs_inode, delayed_iput);</div><div class='ctx'> 		run_delayed_iput_locked(fs_info, inode);</div><div class='del'>-		cond_resched_lock(&amp;fs_info-&gt;delayed_iput_lock);</div><div class='add'>+		if (need_resched()) {</div><div class='add'>+			spin_unlock_irq(&amp;fs_info-&gt;delayed_iput_lock);</div><div class='add'>+			cond_resched();</div><div class='add'>+			spin_lock_irq(&amp;fs_info-&gt;delayed_iput_lock);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;delayed_iput_lock);</div><div class='add'>+	spin_unlock_irq(&amp;fs_info-&gt;delayed_iput_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='add'>+/*</div><div class='ctx'>  * Wait for flushing all delayed iputs</div><div class='ctx'>  *</div><div class='ctx'>  * @fs_info:  the filesystem</div><div class='hunk'>@@ -3444,7 +3591,7 @@ int btrfs_orphan_add(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_insert_orphan_item(trans, inode-&gt;root, btrfs_ino(inode));</div><div class='del'>-	if (ret &amp;&amp; ret != -EEXIST) {</div><div class='add'>+	if (unlikely(ret &amp;&amp; ret != -EEXIST)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3469,15 +3616,14 @@ static int btrfs_orphan_del(struct btrfs_trans_handle *trans,</div><div class='ctx'> int btrfs_orphan_cleanup(struct btrfs_root *root)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_key key, found_key;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='del'>-	struct inode *inode;</div><div class='ctx'> 	u64 last_objectid = 0;</div><div class='ctx'> 	int ret = 0, nr_unlink = 0;</div><div class='ctx'> </div><div class='del'>-	if (cmpxchg(&amp;root-&gt;orphan_cleanup_state, 0, ORPHAN_CLEANUP_STARTED))</div><div class='add'>+	if (test_and_set_bit(BTRFS_ROOT_ORPHAN_CLEANUP, &amp;root-&gt;state))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='hunk'>@@ -3492,6 +3638,8 @@ int btrfs_orphan_cleanup(struct btrfs_root *root)</div><div class='ctx'> 	key.offset = (u64)-1;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='add'>+		struct btrfs_inode *inode;</div><div class='add'>+</div><div class='ctx'> 		ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='hunk'>@@ -3528,9 +3676,16 @@ int btrfs_orphan_cleanup(struct btrfs_root *root)</div><div class='ctx'> 		 */</div><div class='ctx'> </div><div class='ctx'> 		if (found_key.offset == last_objectid) {</div><div class='add'>+			/*</div><div class='add'>+			 * We found the same inode as before. This means we were</div><div class='add'>+			 * not able to remove its items via eviction triggered</div><div class='add'>+			 * by an iput(). A transaction abort may have happened,</div><div class='add'>+			 * due to -ENOSPC for example, so try to grab the error</div><div class='add'>+			 * that lead to a transaction abort, if any.</div><div class='add'>+			 */</div><div class='ctx'> 			btrfs_err(fs_info,</div><div class='ctx'> 				  "Error removing orphan entry, stopping orphan cleanup");</div><div class='del'>-			ret = -EINVAL;</div><div class='add'>+			ret = BTRFS_FS_ERROR(fs_info) ?: -EINVAL;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -3539,12 +3694,15 @@ int btrfs_orphan_cleanup(struct btrfs_root *root)</div><div class='ctx'> 		found_key.objectid = found_key.offset;</div><div class='ctx'> 		found_key.type = BTRFS_INODE_ITEM_KEY;</div><div class='ctx'> 		found_key.offset = 0;</div><div class='del'>-		inode = btrfs_iget(fs_info-&gt;sb, last_objectid, root);</div><div class='del'>-		ret = PTR_ERR_OR_ZERO(inode);</div><div class='del'>-		if (ret &amp;&amp; ret != -ENOENT)</div><div class='del'>-			goto out;</div><div class='add'>+		inode = btrfs_iget(last_objectid, root);</div><div class='add'>+		if (IS_ERR(inode)) {</div><div class='add'>+			ret = PTR_ERR(inode);</div><div class='add'>+			inode = NULL;</div><div class='add'>+			if (ret != -ENOENT)</div><div class='add'>+				goto out;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-		if (ret == -ENOENT &amp;&amp; root == fs_info-&gt;tree_root) {</div><div class='add'>+		if (!inode &amp;&amp; root == fs_info-&gt;tree_root) {</div><div class='ctx'> 			struct btrfs_root *dead_root;</div><div class='ctx'> 			int is_dead_root = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -3605,10 +3763,11 @@ int btrfs_orphan_cleanup(struct btrfs_root *root)</div><div class='ctx'> 		 * deleted but wasn't. The inode number may have been reused,</div><div class='ctx'> 		 * but either way, we can delete the orphan item.</div><div class='ctx'> 		 */</div><div class='del'>-		if (ret == -ENOENT || inode-&gt;i_nlink) {</div><div class='del'>-			if (!ret) {</div><div class='del'>-				ret = btrfs_drop_verity_items(BTRFS_I(inode));</div><div class='del'>-				iput(inode);</div><div class='add'>+		if (!inode || inode-&gt;vfs_inode.i_nlink) {</div><div class='add'>+			if (inode) {</div><div class='add'>+				ret = btrfs_drop_verity_items(inode);</div><div class='add'>+				iput(&amp;inode-&gt;vfs_inode);</div><div class='add'>+				inode = NULL;</div><div class='ctx'> 				if (ret)</div><div class='ctx'> 					goto out;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -3630,13 +3789,11 @@ int btrfs_orphan_cleanup(struct btrfs_root *root)</div><div class='ctx'> 		nr_unlink++;</div><div class='ctx'> </div><div class='ctx'> 		/* this will do delete_inode and everything for us */</div><div class='del'>-		iput(inode);</div><div class='add'>+		iput(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> 	}</div><div class='ctx'> 	/* release the path since we're done with it */</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='del'>-	root-&gt;orphan_cleanup_state = ORPHAN_CLEANUP_DONE;</div><div class='del'>-</div><div class='ctx'> 	if (test_bit(BTRFS_ROOT_ORPHAN_ITEM_INSERTED, &amp;root-&gt;state)) {</div><div class='ctx'> 		trans = btrfs_join_transaction(root);</div><div class='ctx'> 		if (!IS_ERR(trans))</div><div class='hunk'>@@ -3649,19 +3806,22 @@ int btrfs_orphan_cleanup(struct btrfs_root *root)</div><div class='ctx'> out:</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		btrfs_err(fs_info, "could not do orphan cleanup %d", ret);</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * very simple check to peek ahead in the leaf looking for xattrs.  If we</div><div class='del'>- * don't find any xattrs, we know there can't be any acls.</div><div class='add'>+ * Look ahead in the leaf for xattrs. If we don't find any then we know there</div><div class='add'>+ * can't be any ACLs.</div><div class='add'>+ *</div><div class='add'>+ * @leaf:       the eb leaf where to search</div><div class='add'>+ * @slot:       the slot the inode is in</div><div class='add'>+ * @objectid:   the objectid of the inode</div><div class='ctx'>  *</div><div class='del'>- * slot is the slot the inode is in, objectid is the objectid of the inode</div><div class='add'>+ * Return true if there is xattr/ACL, false otherwise.</div><div class='ctx'>  */</div><div class='del'>-static noinline int acls_after_inode_item(struct extent_buffer *leaf,</div><div class='del'>-					  int slot, u64 objectid,</div><div class='del'>-					  int *first_xattr_slot)</div><div class='add'>+static noinline bool acls_after_inode_item(struct extent_buffer *leaf,</div><div class='add'>+					   int slot, u64 objectid,</div><div class='add'>+					   int *first_xattr_slot)</div><div class='ctx'> {</div><div class='ctx'> 	u32 nritems = btrfs_header_nritems(leaf);</div><div class='ctx'> 	struct btrfs_key found_key;</div><div class='hunk'>@@ -3681,58 +3841,120 @@ static noinline int acls_after_inode_item(struct extent_buffer *leaf,</div><div class='ctx'> 	while (slot &lt; nritems) {</div><div class='ctx'> 		btrfs_item_key_to_cpu(leaf, &amp;found_key, slot);</div><div class='ctx'> </div><div class='del'>-		/* we found a different objectid, there must not be acls */</div><div class='add'>+		/* We found a different objectid, there must be no ACLs. */</div><div class='ctx'> 		if (found_key.objectid != objectid)</div><div class='del'>-			return 0;</div><div class='add'>+			return false;</div><div class='ctx'> </div><div class='del'>-		/* we found an xattr, assume we've got an acl */</div><div class='add'>+		/* We found an xattr, assume we've got an ACL. */</div><div class='ctx'> 		if (found_key.type == BTRFS_XATTR_ITEM_KEY) {</div><div class='ctx'> 			if (*first_xattr_slot == -1)</div><div class='ctx'> 				*first_xattr_slot = slot;</div><div class='ctx'> 			if (found_key.offset == xattr_access ||</div><div class='ctx'> 			    found_key.offset == xattr_default)</div><div class='del'>-				return 1;</div><div class='add'>+				return true;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * we found a key greater than an xattr key, there can't</div><div class='del'>-		 * be any acls later on</div><div class='add'>+		 * We found a key greater than an xattr key, there can't be any</div><div class='add'>+		 * ACLs later on.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (found_key.type &gt; BTRFS_XATTR_ITEM_KEY)</div><div class='del'>-			return 0;</div><div class='add'>+			return false;</div><div class='ctx'> </div><div class='ctx'> 		slot++;</div><div class='ctx'> 		scanned++;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * it goes inode, inode backrefs, xattrs, extents,</div><div class='del'>-		 * so if there are a ton of hard links to an inode there can</div><div class='del'>-		 * be a lot of backrefs.  Don't waste time searching too hard,</div><div class='del'>-		 * this is just an optimization</div><div class='add'>+		 * The item order goes like:</div><div class='add'>+		 * - inode</div><div class='add'>+		 * - inode backrefs</div><div class='add'>+		 * - xattrs</div><div class='add'>+		 * - extents,</div><div class='add'>+		 *</div><div class='add'>+		 * so if there are lots of hard links to an inode there can be</div><div class='add'>+		 * a lot of backrefs.  Don't waste time searching too hard,</div><div class='add'>+		 * this is just an optimization.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (scanned &gt;= 8)</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='del'>-	/* we hit the end of the leaf before we found an xattr or</div><div class='del'>-	 * something larger than an xattr.  We have to assume the inode</div><div class='del'>-	 * has acls</div><div class='add'>+	/*</div><div class='add'>+	 * We hit the end of the leaf before we found an xattr or something</div><div class='add'>+	 * larger than an xattr.  We have to assume the inode has ACLs.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (*first_xattr_slot == -1)</div><div class='ctx'> 		*first_xattr_slot = slot;</div><div class='del'>-	return 1;</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int btrfs_init_file_extent_tree(struct btrfs_inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+</div><div class='add'>+	if (WARN_ON_ONCE(inode-&gt;file_extent_tree))</div><div class='add'>+		return 0;</div><div class='add'>+	if (btrfs_fs_incompat(fs_info, NO_HOLES))</div><div class='add'>+		return 0;</div><div class='add'>+	if (!S_ISREG(inode-&gt;vfs_inode.i_mode))</div><div class='add'>+		return 0;</div><div class='add'>+	if (btrfs_is_free_space_inode(inode))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	inode-&gt;file_extent_tree = kmalloc(sizeof(struct extent_io_tree), GFP_KERNEL);</div><div class='add'>+	if (!inode-&gt;file_extent_tree)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	btrfs_extent_io_tree_init(fs_info, inode-&gt;file_extent_tree,</div><div class='add'>+				  IO_TREE_INODE_FILE_EXTENT);</div><div class='add'>+	/* Lockdep class is set only for the file extent tree. */</div><div class='add'>+	lockdep_set_class(&amp;inode-&gt;file_extent_tree-&gt;lock, &amp;file_extent_tree_class);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int btrfs_add_inode_to_root(struct btrfs_inode *inode, bool prealloc)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	struct btrfs_inode *existing;</div><div class='add'>+	const u64 ino = btrfs_ino(inode);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (inode_unhashed(&amp;inode-&gt;vfs_inode))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if (prealloc) {</div><div class='add'>+		ret = xa_reserve(&amp;root-&gt;inodes, ino, GFP_NOFS);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	existing = xa_store(&amp;root-&gt;inodes, ino, inode, GFP_ATOMIC);</div><div class='add'>+</div><div class='add'>+	if (xa_is_err(existing)) {</div><div class='add'>+		ret = xa_err(existing);</div><div class='add'>+		ASSERT(ret != -EINVAL);</div><div class='add'>+		ASSERT(ret != -ENOMEM);</div><div class='add'>+		return ret;</div><div class='add'>+	} else if (existing) {</div><div class='add'>+		WARN_ON(!(inode_state_read_once(&amp;existing-&gt;vfs_inode) &amp; (I_WILL_FREE | I_FREEING)));</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * read an inode from the btree into the in-memory inode</div><div class='add'>+ * Read a locked inode from the btree into the in-memory inode and add it to</div><div class='add'>+ * its root list/tree.</div><div class='add'>+ *</div><div class='add'>+ * On failure clean up the inode.</div><div class='ctx'>  */</div><div class='del'>-static int btrfs_read_locked_inode(struct inode *inode,</div><div class='del'>-				   struct btrfs_path *in_path)</div><div class='add'>+static int btrfs_read_locked_inode(struct btrfs_inode *inode, struct btrfs_path *path)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	struct btrfs_path *path = in_path;</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_inode_item *inode_item;</div><div class='del'>-	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='add'>+	struct inode *vfs_inode = &amp;inode-&gt;vfs_inode;</div><div class='ctx'> 	struct btrfs_key location;</div><div class='ctx'> 	unsigned long ptr;</div><div class='ctx'> 	int maybe_acls;</div><div class='hunk'>@@ -3745,19 +3967,19 @@ static int btrfs_read_locked_inode(struct inode *inode,</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		filled = true;</div><div class='ctx'> </div><div class='del'>-	if (!path) {</div><div class='del'>-		path = btrfs_alloc_path();</div><div class='del'>-		if (!path)</div><div class='del'>-			return -ENOMEM;</div><div class='del'>-	}</div><div class='add'>+	ASSERT(path);</div><div class='ctx'> </div><div class='del'>-	memcpy(&amp;location, &amp;BTRFS_I(inode)-&gt;location, sizeof(location));</div><div class='add'>+	btrfs_get_inode_key(inode, &amp;location);</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_lookup_inode(NULL, root, path, &amp;location, 0);</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		if (path != in_path)</div><div class='del'>-			btrfs_free_path(path);</div><div class='del'>-		return ret;</div><div class='add'>+		/*</div><div class='add'>+		 * ret &gt; 0 can come from btrfs_search_slot called by</div><div class='add'>+		 * btrfs_lookup_inode(), this means the inode was not found.</div><div class='add'>+		 */</div><div class='add'>+		if (ret &gt; 0)</div><div class='add'>+			ret = -ENOENT;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='hunk'>@@ -3767,43 +3989,47 @@ static int btrfs_read_locked_inode(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 	inode_item = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='ctx'> 				    struct btrfs_inode_item);</div><div class='del'>-	inode-&gt;i_mode = btrfs_inode_mode(leaf, inode_item);</div><div class='del'>-	set_nlink(inode, btrfs_inode_nlink(leaf, inode_item));</div><div class='del'>-	i_uid_write(inode, btrfs_inode_uid(leaf, inode_item));</div><div class='del'>-	i_gid_write(inode, btrfs_inode_gid(leaf, inode_item));</div><div class='del'>-	btrfs_i_size_write(BTRFS_I(inode), btrfs_inode_size(leaf, inode_item));</div><div class='del'>-	btrfs_inode_set_file_extent_range(BTRFS_I(inode), 0,</div><div class='del'>-			round_up(i_size_read(inode), fs_info-&gt;sectorsize));</div><div class='del'>-</div><div class='del'>-	inode-&gt;i_atime.tv_sec = btrfs_timespec_sec(leaf, &amp;inode_item-&gt;atime);</div><div class='del'>-	inode-&gt;i_atime.tv_nsec = btrfs_timespec_nsec(leaf, &amp;inode_item-&gt;atime);</div><div class='del'>-</div><div class='del'>-	inode-&gt;i_mtime.tv_sec = btrfs_timespec_sec(leaf, &amp;inode_item-&gt;mtime);</div><div class='del'>-	inode-&gt;i_mtime.tv_nsec = btrfs_timespec_nsec(leaf, &amp;inode_item-&gt;mtime);</div><div class='del'>-</div><div class='del'>-	inode-&gt;i_ctime.tv_sec = btrfs_timespec_sec(leaf, &amp;inode_item-&gt;ctime);</div><div class='del'>-	inode-&gt;i_ctime.tv_nsec = btrfs_timespec_nsec(leaf, &amp;inode_item-&gt;ctime);</div><div class='del'>-</div><div class='del'>-	BTRFS_I(inode)-&gt;i_otime.tv_sec =</div><div class='del'>-		btrfs_timespec_sec(leaf, &amp;inode_item-&gt;otime);</div><div class='del'>-	BTRFS_I(inode)-&gt;i_otime.tv_nsec =</div><div class='del'>-		btrfs_timespec_nsec(leaf, &amp;inode_item-&gt;otime);</div><div class='del'>-</div><div class='del'>-	inode_set_bytes(inode, btrfs_inode_nbytes(leaf, inode_item));</div><div class='del'>-	BTRFS_I(inode)-&gt;generation = btrfs_inode_generation(leaf, inode_item);</div><div class='del'>-	BTRFS_I(inode)-&gt;last_trans = btrfs_inode_transid(leaf, inode_item);</div><div class='del'>-</div><div class='del'>-	inode_set_iversion_queried(inode,</div><div class='del'>-				   btrfs_inode_sequence(leaf, inode_item));</div><div class='del'>-	inode-&gt;i_generation = BTRFS_I(inode)-&gt;generation;</div><div class='del'>-	inode-&gt;i_rdev = 0;</div><div class='add'>+	vfs_inode-&gt;i_mode = btrfs_inode_mode(leaf, inode_item);</div><div class='add'>+	set_nlink(vfs_inode, btrfs_inode_nlink(leaf, inode_item));</div><div class='add'>+	i_uid_write(vfs_inode, btrfs_inode_uid(leaf, inode_item));</div><div class='add'>+	i_gid_write(vfs_inode, btrfs_inode_gid(leaf, inode_item));</div><div class='add'>+	btrfs_i_size_write(inode, btrfs_inode_size(leaf, inode_item));</div><div class='add'>+</div><div class='add'>+	inode_set_atime(vfs_inode, btrfs_timespec_sec(leaf, &amp;inode_item-&gt;atime),</div><div class='add'>+			btrfs_timespec_nsec(leaf, &amp;inode_item-&gt;atime));</div><div class='add'>+</div><div class='add'>+	inode_set_mtime(vfs_inode, btrfs_timespec_sec(leaf, &amp;inode_item-&gt;mtime),</div><div class='add'>+			btrfs_timespec_nsec(leaf, &amp;inode_item-&gt;mtime));</div><div class='add'>+</div><div class='add'>+	inode_set_ctime(vfs_inode, btrfs_timespec_sec(leaf, &amp;inode_item-&gt;ctime),</div><div class='add'>+			btrfs_timespec_nsec(leaf, &amp;inode_item-&gt;ctime));</div><div class='add'>+</div><div class='add'>+	inode-&gt;i_otime_sec = btrfs_timespec_sec(leaf, &amp;inode_item-&gt;otime);</div><div class='add'>+	inode-&gt;i_otime_nsec = btrfs_timespec_nsec(leaf, &amp;inode_item-&gt;otime);</div><div class='add'>+</div><div class='add'>+	inode_set_bytes(vfs_inode, btrfs_inode_nbytes(leaf, inode_item));</div><div class='add'>+	inode-&gt;generation = btrfs_inode_generation(leaf, inode_item);</div><div class='add'>+	inode-&gt;last_trans = btrfs_inode_transid(leaf, inode_item);</div><div class='add'>+</div><div class='add'>+	inode_set_iversion_queried(vfs_inode, btrfs_inode_sequence(leaf, inode_item));</div><div class='add'>+	vfs_inode-&gt;i_generation = inode-&gt;generation;</div><div class='add'>+	vfs_inode-&gt;i_rdev = 0;</div><div class='ctx'> 	rdev = btrfs_inode_rdev(leaf, inode_item);</div><div class='ctx'> </div><div class='del'>-	BTRFS_I(inode)-&gt;index_cnt = (u64)-1;</div><div class='add'>+	if (S_ISDIR(vfs_inode-&gt;i_mode))</div><div class='add'>+		inode-&gt;index_cnt = (u64)-1;</div><div class='add'>+</div><div class='ctx'> 	btrfs_inode_split_flags(btrfs_inode_flags(leaf, inode_item),</div><div class='del'>-				&amp;BTRFS_I(inode)-&gt;flags, &amp;BTRFS_I(inode)-&gt;ro_flags);</div><div class='add'>+				&amp;inode-&gt;flags, &amp;inode-&gt;ro_flags);</div><div class='add'>+	btrfs_update_inode_mapping_flags(inode);</div><div class='add'>+	btrfs_set_inode_mapping_order(inode);</div><div class='ctx'> </div><div class='ctx'> cache_index:</div><div class='add'>+	ret = btrfs_init_file_extent_tree(inode);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+	btrfs_inode_set_file_extent_range(inode, 0,</div><div class='add'>+			round_up(i_size_read(vfs_inode), fs_info-&gt;sectorsize));</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If we were modified in the current generation and evicted from memory</div><div class='ctx'> 	 * and then re-read we need to do a full sync since we don't have any</div><div class='hunk'>@@ -3811,11 +4037,10 @@ cache_index:</div><div class='ctx'> 	 * cache.</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * This is required for both inode re-read from disk and delayed inode</div><div class='del'>-	 * in delayed_nodes_tree.</div><div class='add'>+	 * in the delayed_nodes xarray.</div><div class='ctx'> 	 */</div><div class='del'>-	if (BTRFS_I(inode)-&gt;last_trans == fs_info-&gt;generation)</div><div class='del'>-		set_bit(BTRFS_INODE_NEEDS_FULL_SYNC,</div><div class='del'>-			&amp;BTRFS_I(inode)-&gt;runtime_flags);</div><div class='add'>+	if (inode-&gt;last_trans == btrfs_get_fs_generation(fs_info))</div><div class='add'>+		set_bit(BTRFS_INODE_NEEDS_FULL_SYNC, &amp;inode-&gt;runtime_flags);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We don't persist the id of the transaction where an unlink operation</div><div class='hunk'>@@ -3844,7 +4069,7 @@ cache_index:</div><div class='ctx'> 	 * transaction commits on fsync if our inode is a directory, or if our</div><div class='ctx'> 	 * inode is not a directory, logging its parent unnecessarily.</div><div class='ctx'> 	 */</div><div class='del'>-	BTRFS_I(inode)-&gt;last_unlink_trans = BTRFS_I(inode)-&gt;last_trans;</div><div class='add'>+	inode-&gt;last_unlink_trans = inode-&gt;last_trans;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Same logic as for last_unlink_trans. We don't persist the generation</div><div class='hunk'>@@ -3852,15 +4077,15 @@ cache_index:</div><div class='ctx'> 	 * operation, so after eviction and reloading the inode we must be</div><div class='ctx'> 	 * pessimistic and assume the last transaction that modified the inode.</div><div class='ctx'> 	 */</div><div class='del'>-	BTRFS_I(inode)-&gt;last_reflink_trans = BTRFS_I(inode)-&gt;last_trans;</div><div class='add'>+	inode-&gt;last_reflink_trans = inode-&gt;last_trans;</div><div class='ctx'> </div><div class='ctx'> 	path-&gt;slots[0]++;</div><div class='del'>-	if (inode-&gt;i_nlink != 1 ||</div><div class='add'>+	if (vfs_inode-&gt;i_nlink != 1 ||</div><div class='ctx'> 	    path-&gt;slots[0] &gt;= btrfs_header_nritems(leaf))</div><div class='ctx'> 		goto cache_acl;</div><div class='ctx'> </div><div class='ctx'> 	btrfs_item_key_to_cpu(leaf, &amp;location, path-&gt;slots[0]);</div><div class='del'>-	if (location.objectid != btrfs_ino(BTRFS_I(inode)))</div><div class='add'>+	if (location.objectid != btrfs_ino(inode))</div><div class='ctx'> 		goto cache_acl;</div><div class='ctx'> </div><div class='ctx'> 	ptr = btrfs_item_ptr_offset(leaf, path-&gt;slots[0]);</div><div class='hunk'>@@ -3868,13 +4093,12 @@ cache_index:</div><div class='ctx'> 		struct btrfs_inode_ref *ref;</div><div class='ctx'> </div><div class='ctx'> 		ref = (struct btrfs_inode_ref *)ptr;</div><div class='del'>-		BTRFS_I(inode)-&gt;dir_index = btrfs_inode_ref_index(leaf, ref);</div><div class='add'>+		inode-&gt;dir_index = btrfs_inode_ref_index(leaf, ref);</div><div class='ctx'> 	} else if (location.type == BTRFS_INODE_EXTREF_KEY) {</div><div class='ctx'> 		struct btrfs_inode_extref *extref;</div><div class='ctx'> </div><div class='ctx'> 		extref = (struct btrfs_inode_extref *)ptr;</div><div class='del'>-		BTRFS_I(inode)-&gt;dir_index = btrfs_inode_extref_index(leaf,</div><div class='del'>-								     extref);</div><div class='add'>+		inode-&gt;dir_index = btrfs_inode_extref_index(leaf, extref);</div><div class='ctx'> 	}</div><div class='ctx'> cache_acl:</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -3882,45 +4106,50 @@ cache_acl:</div><div class='ctx'> 	 * any xattrs or acls</div><div class='ctx'> 	 */</div><div class='ctx'> 	maybe_acls = acls_after_inode_item(leaf, path-&gt;slots[0],</div><div class='del'>-			btrfs_ino(BTRFS_I(inode)), &amp;first_xattr_slot);</div><div class='add'>+					   btrfs_ino(inode), &amp;first_xattr_slot);</div><div class='ctx'> 	if (first_xattr_slot != -1) {</div><div class='ctx'> 		path-&gt;slots[0] = first_xattr_slot;</div><div class='ctx'> 		ret = btrfs_load_inode_props(inode, path);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			btrfs_err(fs_info,</div><div class='ctx'> 				  "error loading props for ino %llu (root %llu): %d",</div><div class='del'>-				  btrfs_ino(BTRFS_I(inode)),</div><div class='del'>-				  root-&gt;root_key.objectid, ret);</div><div class='add'>+				  btrfs_ino(inode), btrfs_root_id(root), ret);</div><div class='ctx'> 	}</div><div class='del'>-	if (path != in_path)</div><div class='del'>-		btrfs_free_path(path);</div><div class='ctx'> </div><div class='ctx'> 	if (!maybe_acls)</div><div class='del'>-		cache_no_acl(inode);</div><div class='add'>+		cache_no_acl(vfs_inode);</div><div class='ctx'> </div><div class='del'>-	switch (inode-&gt;i_mode &amp; S_IFMT) {</div><div class='add'>+	switch (vfs_inode-&gt;i_mode &amp; S_IFMT) {</div><div class='ctx'> 	case S_IFREG:</div><div class='del'>-		inode-&gt;i_mapping-&gt;a_ops = &amp;btrfs_aops;</div><div class='del'>-		inode-&gt;i_fop = &amp;btrfs_file_operations;</div><div class='del'>-		inode-&gt;i_op = &amp;btrfs_file_inode_operations;</div><div class='add'>+		vfs_inode-&gt;i_mapping-&gt;a_ops = &amp;btrfs_aops;</div><div class='add'>+		vfs_inode-&gt;i_fop = &amp;btrfs_file_operations;</div><div class='add'>+		vfs_inode-&gt;i_op = &amp;btrfs_file_inode_operations;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case S_IFDIR:</div><div class='del'>-		inode-&gt;i_fop = &amp;btrfs_dir_file_operations;</div><div class='del'>-		inode-&gt;i_op = &amp;btrfs_dir_inode_operations;</div><div class='add'>+		vfs_inode-&gt;i_fop = &amp;btrfs_dir_file_operations;</div><div class='add'>+		vfs_inode-&gt;i_op = &amp;btrfs_dir_inode_operations;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case S_IFLNK:</div><div class='del'>-		inode-&gt;i_op = &amp;btrfs_symlink_inode_operations;</div><div class='del'>-		inode_nohighmem(inode);</div><div class='del'>-		inode-&gt;i_mapping-&gt;a_ops = &amp;btrfs_aops;</div><div class='add'>+		vfs_inode-&gt;i_op = &amp;btrfs_symlink_inode_operations;</div><div class='add'>+		inode_nohighmem(vfs_inode);</div><div class='add'>+		vfs_inode-&gt;i_mapping-&gt;a_ops = &amp;btrfs_aops;</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='del'>-		inode-&gt;i_op = &amp;btrfs_special_inode_operations;</div><div class='del'>-		init_special_inode(inode, inode-&gt;i_mode, rdev);</div><div class='add'>+		vfs_inode-&gt;i_op = &amp;btrfs_special_inode_operations;</div><div class='add'>+		init_special_inode(vfs_inode, vfs_inode-&gt;i_mode, rdev);</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	btrfs_sync_inode_flags_to_i_flags(inode);</div><div class='add'>+</div><div class='add'>+	ret = btrfs_add_inode_to_root(inode, true);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='add'>+out:</div><div class='add'>+	iget_failed(vfs_inode);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -3931,70 +4160,59 @@ static void fill_inode_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			    struct btrfs_inode_item *item,</div><div class='ctx'> 			    struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_map_token token;</div><div class='ctx'> 	u64 flags;</div><div class='ctx'> </div><div class='del'>-	btrfs_init_map_token(&amp;token, leaf);</div><div class='del'>-</div><div class='del'>-	btrfs_set_token_inode_uid(&amp;token, item, i_uid_read(inode));</div><div class='del'>-	btrfs_set_token_inode_gid(&amp;token, item, i_gid_read(inode));</div><div class='del'>-	btrfs_set_token_inode_size(&amp;token, item, BTRFS_I(inode)-&gt;disk_i_size);</div><div class='del'>-	btrfs_set_token_inode_mode(&amp;token, item, inode-&gt;i_mode);</div><div class='del'>-	btrfs_set_token_inode_nlink(&amp;token, item, inode-&gt;i_nlink);</div><div class='del'>-</div><div class='del'>-	btrfs_set_token_timespec_sec(&amp;token, &amp;item-&gt;atime,</div><div class='del'>-				     inode-&gt;i_atime.tv_sec);</div><div class='del'>-	btrfs_set_token_timespec_nsec(&amp;token, &amp;item-&gt;atime,</div><div class='del'>-				      inode-&gt;i_atime.tv_nsec);</div><div class='del'>-</div><div class='del'>-	btrfs_set_token_timespec_sec(&amp;token, &amp;item-&gt;mtime,</div><div class='del'>-				     inode-&gt;i_mtime.tv_sec);</div><div class='del'>-	btrfs_set_token_timespec_nsec(&amp;token, &amp;item-&gt;mtime,</div><div class='del'>-				      inode-&gt;i_mtime.tv_nsec);</div><div class='del'>-</div><div class='del'>-	btrfs_set_token_timespec_sec(&amp;token, &amp;item-&gt;ctime,</div><div class='del'>-				     inode-&gt;i_ctime.tv_sec);</div><div class='del'>-	btrfs_set_token_timespec_nsec(&amp;token, &amp;item-&gt;ctime,</div><div class='del'>-				      inode-&gt;i_ctime.tv_nsec);</div><div class='del'>-</div><div class='del'>-	btrfs_set_token_timespec_sec(&amp;token, &amp;item-&gt;otime,</div><div class='del'>-				     BTRFS_I(inode)-&gt;i_otime.tv_sec);</div><div class='del'>-	btrfs_set_token_timespec_nsec(&amp;token, &amp;item-&gt;otime,</div><div class='del'>-				      BTRFS_I(inode)-&gt;i_otime.tv_nsec);</div><div class='del'>-</div><div class='del'>-	btrfs_set_token_inode_nbytes(&amp;token, item, inode_get_bytes(inode));</div><div class='del'>-	btrfs_set_token_inode_generation(&amp;token, item,</div><div class='del'>-					 BTRFS_I(inode)-&gt;generation);</div><div class='del'>-	btrfs_set_token_inode_sequence(&amp;token, item, inode_peek_iversion(inode));</div><div class='del'>-	btrfs_set_token_inode_transid(&amp;token, item, trans-&gt;transid);</div><div class='del'>-	btrfs_set_token_inode_rdev(&amp;token, item, inode-&gt;i_rdev);</div><div class='add'>+	btrfs_set_inode_uid(leaf, item, i_uid_read(inode));</div><div class='add'>+	btrfs_set_inode_gid(leaf, item, i_gid_read(inode));</div><div class='add'>+	btrfs_set_inode_size(leaf, item, BTRFS_I(inode)-&gt;disk_i_size);</div><div class='add'>+	btrfs_set_inode_mode(leaf, item, inode-&gt;i_mode);</div><div class='add'>+	btrfs_set_inode_nlink(leaf, item, inode-&gt;i_nlink);</div><div class='add'>+</div><div class='add'>+	btrfs_set_timespec_sec(leaf, &amp;item-&gt;atime, inode_get_atime_sec(inode));</div><div class='add'>+	btrfs_set_timespec_nsec(leaf, &amp;item-&gt;atime, inode_get_atime_nsec(inode));</div><div class='add'>+</div><div class='add'>+	btrfs_set_timespec_sec(leaf, &amp;item-&gt;mtime, inode_get_mtime_sec(inode));</div><div class='add'>+	btrfs_set_timespec_nsec(leaf, &amp;item-&gt;mtime, inode_get_mtime_nsec(inode));</div><div class='add'>+</div><div class='add'>+	btrfs_set_timespec_sec(leaf, &amp;item-&gt;ctime, inode_get_ctime_sec(inode));</div><div class='add'>+	btrfs_set_timespec_nsec(leaf, &amp;item-&gt;ctime, inode_get_ctime_nsec(inode));</div><div class='add'>+</div><div class='add'>+	btrfs_set_timespec_sec(leaf, &amp;item-&gt;otime, BTRFS_I(inode)-&gt;i_otime_sec);</div><div class='add'>+	btrfs_set_timespec_nsec(leaf, &amp;item-&gt;otime, BTRFS_I(inode)-&gt;i_otime_nsec);</div><div class='add'>+</div><div class='add'>+	btrfs_set_inode_nbytes(leaf, item, inode_get_bytes(inode));</div><div class='add'>+	btrfs_set_inode_generation(leaf, item, BTRFS_I(inode)-&gt;generation);</div><div class='add'>+	btrfs_set_inode_sequence(leaf, item, inode_peek_iversion(inode));</div><div class='add'>+	btrfs_set_inode_transid(leaf, item, trans-&gt;transid);</div><div class='add'>+	btrfs_set_inode_rdev(leaf, item, inode-&gt;i_rdev);</div><div class='ctx'> 	flags = btrfs_inode_combine_flags(BTRFS_I(inode)-&gt;flags,</div><div class='ctx'> 					  BTRFS_I(inode)-&gt;ro_flags);</div><div class='del'>-	btrfs_set_token_inode_flags(&amp;token, item, flags);</div><div class='del'>-	btrfs_set_token_inode_block_group(&amp;token, item, 0);</div><div class='add'>+	btrfs_set_inode_flags(leaf, item, flags);</div><div class='add'>+	btrfs_set_inode_block_group(leaf, item, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * copy everything in the in-memory inode into the btree.</div><div class='ctx'>  */</div><div class='ctx'> static noinline int btrfs_update_inode_item(struct btrfs_trans_handle *trans,</div><div class='del'>-				struct btrfs_root *root,</div><div class='del'>-				struct btrfs_inode *inode)</div><div class='add'>+					    struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_inode_item *inode_item;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='add'>+	struct btrfs_key key;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_lookup_inode(trans, root, path, &amp;inode-&gt;location, 1);</div><div class='add'>+	btrfs_get_inode_key(inode, &amp;key);</div><div class='add'>+	ret = btrfs_lookup_inode(trans, inode-&gt;root, path, &amp;key, 1);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		if (ret &gt; 0)</div><div class='ctx'> 			ret = -ENOENT;</div><div class='del'>-		goto failed;</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='hunk'>@@ -4002,21 +4220,17 @@ static noinline int btrfs_update_inode_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				    struct btrfs_inode_item);</div><div class='ctx'> </div><div class='ctx'> 	fill_inode_item(trans, leaf, inode_item, &amp;inode-&gt;vfs_inode);</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> 	btrfs_set_inode_last_trans(trans, inode);</div><div class='del'>-	ret = 0;</div><div class='del'>-failed:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * copy everything in the in-memory inode into the btree.</div><div class='ctx'>  */</div><div class='del'>-noinline int btrfs_update_inode(struct btrfs_trans_handle *trans,</div><div class='del'>-				struct btrfs_root *root,</div><div class='del'>-				struct btrfs_inode *inode)</div><div class='add'>+int btrfs_update_inode(struct btrfs_trans_handle *trans,</div><div class='add'>+		       struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -4032,26 +4246,43 @@ noinline int btrfs_update_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	    &amp;&amp; !test_bit(BTRFS_FS_LOG_RECOVERING, &amp;fs_info-&gt;flags)) {</div><div class='ctx'> 		btrfs_update_root_times(trans, root);</div><div class='ctx'> </div><div class='del'>-		ret = btrfs_delayed_update_inode(trans, root, inode);</div><div class='add'>+		ret = btrfs_delayed_update_inode(trans, inode);</div><div class='ctx'> 		if (!ret)</div><div class='ctx'> 			btrfs_set_inode_last_trans(trans, inode);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return btrfs_update_inode_item(trans, root, inode);</div><div class='add'>+	return btrfs_update_inode_item(trans, inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_update_inode_fallback(struct btrfs_trans_handle *trans,</div><div class='del'>-				struct btrfs_root *root, struct btrfs_inode *inode)</div><div class='add'>+				struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_update_inode(trans, root, inode);</div><div class='add'>+	ret = btrfs_update_inode(trans, inode);</div><div class='ctx'> 	if (ret == -ENOSPC)</div><div class='del'>-		return btrfs_update_inode_item(trans, root, inode);</div><div class='add'>+		return btrfs_update_inode_item(trans, inode);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void update_time_after_link_or_unlink(struct btrfs_inode *dir)</div><div class='add'>+{</div><div class='add'>+	struct timespec64 now;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If we are replaying a log tree, we do not want to update the mtime</div><div class='add'>+	 * and ctime of the parent directory with the current time, since the</div><div class='add'>+	 * log replay procedure is responsible for setting them to their correct</div><div class='add'>+	 * values (the ones it had when the fsync was done).</div><div class='add'>+	 */</div><div class='add'>+	if (test_bit(BTRFS_FS_LOG_RECOVERING, &amp;dir-&gt;root-&gt;fs_info-&gt;flags))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	now = inode_set_ctime_current(&amp;dir-&gt;vfs_inode);</div><div class='add'>+	inode_set_mtime_to_ts(&amp;dir-&gt;vfs_inode, now);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * unlink helper that gets used here in inode.c and in the tree logging</div><div class='ctx'>  * recovery code.  It remove a link in a directory with a given name, and</div><div class='hunk'>@@ -4060,7 +4291,8 @@ int btrfs_update_inode_fallback(struct btrfs_trans_handle *trans,</div><div class='ctx'> static int __btrfs_unlink_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				struct btrfs_inode *dir,</div><div class='ctx'> 				struct btrfs_inode *inode,</div><div class='del'>-				const char *name, int name_len)</div><div class='add'>+				const struct fscrypt_str *name,</div><div class='add'>+				struct btrfs_rename_ctx *rename_ctx)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root = dir-&gt;root;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='hunk'>@@ -4072,21 +4304,22 @@ static int __btrfs_unlink_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	u64 dir_ino = btrfs_ino(dir);</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='del'>-	if (!path) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (!path)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	di = btrfs_lookup_dir_item(trans, root, path, dir_ino,</div><div class='del'>-				    name, name_len, -1);</div><div class='add'>+	di = btrfs_lookup_dir_item(trans, root, path, dir_ino, name, -1);</div><div class='ctx'> 	if (IS_ERR_OR_NULL(di)) {</div><div class='del'>-		ret = di ? PTR_ERR(di) : -ENOENT;</div><div class='del'>-		goto err;</div><div class='add'>+		btrfs_free_path(path);</div><div class='add'>+		return di ? PTR_ERR(di) : -ENOENT;</div><div class='ctx'> 	}</div><div class='ctx'> 	ret = btrfs_delete_one_dir_name(trans, root, path, di);</div><div class='add'>+	/*</div><div class='add'>+	 * Down the call chains below we'll also need to allocate a path, so no</div><div class='add'>+	 * need to hold on to this one for longer than necessary.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_free_path(path);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto err;</div><div class='del'>-	btrfs_release_path(path);</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If we don't have dir index, we have to get it by looking up</div><div class='hunk'>@@ -4106,25 +4339,34 @@ static int __btrfs_unlink_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_del_inode_ref(trans, root, name, name_len, ino,</div><div class='del'>-				  dir_ino, &amp;index);</div><div class='del'>-	if (ret) {</div><div class='del'>-		btrfs_info(fs_info,</div><div class='del'>-			"failed to delete reference to %.*s, inode %llu parent %llu",</div><div class='del'>-			name_len, name, ino, dir_ino);</div><div class='add'>+	ret = btrfs_del_inode_ref(trans, root, name, ino, dir_ino, &amp;index);</div><div class='add'>+	if (unlikely(ret)) {</div><div class='add'>+		btrfs_crit(fs_info,</div><div class='add'>+	   "failed to delete reference to %.*s, root %llu inode %llu parent %llu",</div><div class='add'>+			   name-&gt;len, name-&gt;name, btrfs_root_id(root), ino, dir_ino);</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='del'>-		goto err;</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> skip_backref:</div><div class='add'>+	if (rename_ctx)</div><div class='add'>+		rename_ctx-&gt;index = index;</div><div class='add'>+</div><div class='ctx'> 	ret = btrfs_delete_delayed_dir_index(trans, dir, index);</div><div class='del'>-	if (ret) {</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='del'>-		goto err;</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_del_inode_ref_in_log(trans, root, name, name_len, inode,</div><div class='del'>-				   dir_ino);</div><div class='del'>-	btrfs_del_dir_entries_in_log(trans, root, name, name_len, dir, index);</div><div class='add'>+	/*</div><div class='add'>+	 * If we are in a rename context, we don't need to update anything in the</div><div class='add'>+	 * log. That will be done later during the rename by btrfs_log_new_name().</div><div class='add'>+	 * Besides that, doing it here would only cause extra unnecessary btree</div><div class='add'>+	 * operations on the log tree, increasing latency for applications.</div><div class='add'>+	 */</div><div class='add'>+	if (!rename_ctx) {</div><div class='add'>+		btrfs_del_inode_ref_in_log(trans, name, inode, dir);</div><div class='add'>+		btrfs_del_dir_entries_in_log(trans, name, dir, index);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If we have a pending delayed iput we could end up with the final iput</div><div class='hunk'>@@ -4136,30 +4378,26 @@ skip_backref:</div><div class='ctx'> 	 * holding.</div><div class='ctx'> 	 */</div><div class='ctx'> 	btrfs_run_delayed_iput(fs_info, inode);</div><div class='del'>-err:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto out;</div><div class='ctx'> </div><div class='del'>-	btrfs_i_size_write(dir, dir-&gt;vfs_inode.i_size - name_len * 2);</div><div class='add'>+	btrfs_i_size_write(dir, dir-&gt;vfs_inode.i_size - name-&gt;len * 2);</div><div class='ctx'> 	inode_inc_iversion(&amp;inode-&gt;vfs_inode);</div><div class='add'>+	inode_set_ctime_current(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> 	inode_inc_iversion(&amp;dir-&gt;vfs_inode);</div><div class='del'>-	inode-&gt;vfs_inode.i_ctime = dir-&gt;vfs_inode.i_mtime =</div><div class='del'>-		dir-&gt;vfs_inode.i_ctime = current_time(&amp;inode-&gt;vfs_inode);</div><div class='del'>-	ret = btrfs_update_inode(trans, root, dir);</div><div class='del'>-out:</div><div class='del'>-	return ret;</div><div class='add'>+	update_time_after_link_or_unlink(dir);</div><div class='add'>+</div><div class='add'>+	return btrfs_update_inode(trans, dir);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_unlink_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		       struct btrfs_inode *dir, struct btrfs_inode *inode,</div><div class='del'>-		       const char *name, int name_len)</div><div class='add'>+		       const struct fscrypt_str *name)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='del'>-	ret = __btrfs_unlink_inode(trans, dir, inode, name, name_len);</div><div class='add'>+</div><div class='add'>+	ret = __btrfs_unlink_inode(trans, dir, inode, name, NULL);</div><div class='ctx'> 	if (!ret) {</div><div class='ctx'> 		drop_nlink(&amp;inode-&gt;vfs_inode);</div><div class='del'>-		ret = btrfs_update_inode(trans, inode-&gt;root, inode);</div><div class='add'>+		ret = btrfs_update_inode(trans, inode);</div><div class='ctx'> 	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -4172,18 +4410,12 @@ int btrfs_unlink_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'>  * plenty of slack room in the global reserve to migrate, otherwise we cannot</div><div class='ctx'>  * allow the unlink to occur.</div><div class='ctx'>  */</div><div class='del'>-static struct btrfs_trans_handle *__unlink_start_trans(struct inode *dir)</div><div class='add'>+static struct btrfs_trans_handle *__unlink_start_trans(struct btrfs_inode *dir)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *root = BTRFS_I(dir)-&gt;root;</div><div class='add'>+	struct btrfs_root *root = dir-&gt;root;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * 1 for the possible orphan item</div><div class='del'>-	 * 1 for the dir item</div><div class='del'>-	 * 1 for the dir index</div><div class='del'>-	 * 1 for the inode ref</div><div class='del'>-	 * 1 for the inode</div><div class='del'>-	 */</div><div class='del'>-	return btrfs_start_transaction_fallback_global_rsv(root, 5);</div><div class='add'>+	return btrfs_start_transaction_fallback_global_rsv(root,</div><div class='add'>+						   BTRFS_UNLINK_METADATA_UNITS);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int btrfs_unlink(struct inode *dir, struct dentry *dentry)</div><div class='hunk'>@@ -4191,63 +4423,81 @@ static int btrfs_unlink(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	int ret;</div><div class='add'>+	struct fscrypt_name fname;</div><div class='ctx'> </div><div class='del'>-	trans = __unlink_start_trans(dir);</div><div class='del'>-	if (IS_ERR(trans))</div><div class='del'>-		return PTR_ERR(trans);</div><div class='add'>+	ret = fscrypt_setup_filename(dir, &amp;dentry-&gt;d_name, 1, &amp;fname);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	/* This needs to handle no-key deletions later on */</div><div class='add'>+</div><div class='add'>+	trans = __unlink_start_trans(BTRFS_I(dir));</div><div class='add'>+	if (IS_ERR(trans)) {</div><div class='add'>+		ret = PTR_ERR(trans);</div><div class='add'>+		goto fscrypt_free;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	btrfs_record_unlink_dir(trans, BTRFS_I(dir), BTRFS_I(d_inode(dentry)),</div><div class='del'>-			0);</div><div class='add'>+				false);</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_unlink_inode(trans, BTRFS_I(dir),</div><div class='del'>-			BTRFS_I(d_inode(dentry)), dentry-&gt;d_name.name,</div><div class='del'>-			dentry-&gt;d_name.len);</div><div class='add'>+	ret = btrfs_unlink_inode(trans, BTRFS_I(dir), BTRFS_I(d_inode(dentry)),</div><div class='add'>+				 &amp;fname.disk_name);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+		goto end_trans;</div><div class='ctx'> </div><div class='ctx'> 	if (inode-&gt;i_nlink == 0) {</div><div class='ctx'> 		ret = btrfs_orphan_add(trans, BTRFS_I(inode));</div><div class='ctx'> 		if (ret)</div><div class='del'>-			goto out;</div><div class='add'>+			goto end_trans;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-out:</div><div class='add'>+end_trans:</div><div class='ctx'> 	btrfs_end_transaction(trans);</div><div class='ctx'> 	btrfs_btree_balance_dirty(BTRFS_I(dir)-&gt;root-&gt;fs_info);</div><div class='add'>+fscrypt_free:</div><div class='add'>+	fscrypt_free_filename(&amp;fname);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int btrfs_unlink_subvol(struct btrfs_trans_handle *trans,</div><div class='del'>-			       struct inode *dir, struct dentry *dentry)</div><div class='add'>+			       struct btrfs_inode *dir, struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *root = BTRFS_I(dir)-&gt;root;</div><div class='add'>+	struct btrfs_root *root = dir-&gt;root;</div><div class='ctx'> 	struct btrfs_inode *inode = BTRFS_I(d_inode(dentry));</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_dir_item *di;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='del'>-	const char *name = dentry-&gt;d_name.name;</div><div class='del'>-	int name_len = dentry-&gt;d_name.len;</div><div class='ctx'> 	u64 index;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	u64 objectid;</div><div class='del'>-	u64 dir_ino = btrfs_ino(BTRFS_I(dir));</div><div class='add'>+	u64 dir_ino = btrfs_ino(dir);</div><div class='add'>+	struct fscrypt_name fname;</div><div class='add'>+</div><div class='add'>+	ret = fscrypt_setup_filename(&amp;dir-&gt;vfs_inode, &amp;dentry-&gt;d_name, 1, &amp;fname);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	/* This needs to handle no-key deletions later on */</div><div class='ctx'> </div><div class='ctx'> 	if (btrfs_ino(inode) == BTRFS_FIRST_FREE_OBJECTID) {</div><div class='del'>-		objectid = inode-&gt;root-&gt;root_key.objectid;</div><div class='add'>+		objectid = btrfs_root_id(inode-&gt;root);</div><div class='ctx'> 	} else if (btrfs_ino(inode) == BTRFS_EMPTY_SUBVOL_DIR_OBJECTID) {</div><div class='del'>-		objectid = inode-&gt;location.objectid;</div><div class='add'>+		objectid = inode-&gt;ref_root_id;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		WARN_ON(1);</div><div class='add'>+		fscrypt_free_filename(&amp;fname);</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='del'>-	if (!path)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	if (!path) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	di = btrfs_lookup_dir_item(trans, root, path, dir_ino,</div><div class='del'>-				   name, name_len, -1);</div><div class='add'>+				   &amp;fname.disk_name, -1);</div><div class='ctx'> 	if (IS_ERR_OR_NULL(di)) {</div><div class='ctx'> 		ret = di ? PTR_ERR(di) : -ENOENT;</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -4257,7 +4507,7 @@ static int btrfs_unlink_subvol(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	btrfs_dir_item_key_to_cpu(leaf, di, &amp;key);</div><div class='ctx'> 	WARN_ON(key.type != BTRFS_ROOT_ITEM_KEY || key.objectid != objectid);</div><div class='ctx'> 	ret = btrfs_delete_one_dir_name(trans, root, path, di);</div><div class='del'>-	if (ret) {</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -4273,13 +4523,9 @@ static int btrfs_unlink_subvol(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * call btrfs_del_root_ref, and it _shouldn't_ fail.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (btrfs_ino(inode) == BTRFS_EMPTY_SUBVOL_DIR_OBJECTID) {</div><div class='del'>-		di = btrfs_search_dir_index_item(root, path, dir_ino,</div><div class='del'>-						 name, name_len);</div><div class='del'>-		if (IS_ERR_OR_NULL(di)) {</div><div class='del'>-			if (!di)</div><div class='del'>-				ret = -ENOENT;</div><div class='del'>-			else</div><div class='del'>-				ret = PTR_ERR(di);</div><div class='add'>+		di = btrfs_search_dir_index_item(root, path, dir_ino, &amp;fname.disk_name);</div><div class='add'>+		if (IS_ERR(di)) {</div><div class='add'>+			ret = PTR_ERR(di);</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -4290,28 +4536,28 @@ static int btrfs_unlink_subvol(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		ret = btrfs_del_root_ref(trans, objectid,</div><div class='del'>-					 root-&gt;root_key.objectid, dir_ino,</div><div class='del'>-					 &amp;index, name, name_len);</div><div class='del'>-		if (ret) {</div><div class='add'>+					 btrfs_root_id(root), dir_ino,</div><div class='add'>+					 &amp;index, &amp;fname.disk_name);</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_delete_delayed_dir_index(trans, BTRFS_I(dir), index);</div><div class='del'>-	if (ret) {</div><div class='add'>+	ret = btrfs_delete_delayed_dir_index(trans, dir, index);</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_i_size_write(BTRFS_I(dir), dir-&gt;i_size - name_len * 2);</div><div class='del'>-	inode_inc_iversion(dir);</div><div class='del'>-	dir-&gt;i_mtime = dir-&gt;i_ctime = current_time(dir);</div><div class='del'>-	ret = btrfs_update_inode_fallback(trans, root, BTRFS_I(dir));</div><div class='add'>+	btrfs_i_size_write(dir, dir-&gt;vfs_inode.i_size - fname.disk_name.len * 2);</div><div class='add'>+	inode_inc_iversion(&amp;dir-&gt;vfs_inode);</div><div class='add'>+	inode_set_mtime_to_ts(&amp;dir-&gt;vfs_inode, inode_set_ctime_current(&amp;dir-&gt;vfs_inode));</div><div class='add'>+	ret = btrfs_update_inode_fallback(trans, dir);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='add'>+	fscrypt_free_filename(&amp;fname);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -4322,9 +4568,10 @@ out:</div><div class='ctx'> static noinline int may_destroy_subvol(struct btrfs_root *root)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_dir_item *di;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='add'>+	struct fscrypt_str name = FSTR_INIT("default", 7);</div><div class='ctx'> 	u64 dir_id;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -4335,38 +4582,42 @@ static noinline int may_destroy_subvol(struct btrfs_root *root)</div><div class='ctx'> 	/* Make sure this root isn't set as the default subvol */</div><div class='ctx'> 	dir_id = btrfs_super_root_dir(fs_info-&gt;super_copy);</div><div class='ctx'> 	di = btrfs_lookup_dir_item(NULL, fs_info-&gt;tree_root, path,</div><div class='del'>-				   dir_id, "default", 7, 0);</div><div class='add'>+				   dir_id, &amp;name, 0);</div><div class='ctx'> 	if (di &amp;&amp; !IS_ERR(di)) {</div><div class='ctx'> 		btrfs_dir_item_key_to_cpu(path-&gt;nodes[0], di, &amp;key);</div><div class='del'>-		if (key.objectid == root-&gt;root_key.objectid) {</div><div class='add'>+		if (key.objectid == btrfs_root_id(root)) {</div><div class='ctx'> 			ret = -EPERM;</div><div class='ctx'> 			btrfs_err(fs_info,</div><div class='ctx'> 				  "deleting default subvolume %llu is not allowed",</div><div class='ctx'> 				  key.objectid);</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 		}</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	key.objectid = root-&gt;root_key.objectid;</div><div class='add'>+	key.objectid = btrfs_root_id(root);</div><div class='ctx'> 	key.type = BTRFS_ROOT_REF_KEY;</div><div class='ctx'> 	key.offset = (u64)-1;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_search_slot(NULL, fs_info-&gt;tree_root, &amp;key, path, 0, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-	BUG_ON(ret == 0);</div><div class='add'>+		return ret;</div><div class='add'>+	if (unlikely(ret == 0)) {</div><div class='add'>+		/*</div><div class='add'>+		 * Key with offset -1 found, there would have to exist a root</div><div class='add'>+		 * with such id, but this is out of valid range.</div><div class='add'>+		 */</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	ret = 0;</div><div class='ctx'> 	if (path-&gt;slots[0] &gt; 0) {</div><div class='ctx'> 		path-&gt;slots[0]--;</div><div class='ctx'> 		btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, path-&gt;slots[0]);</div><div class='del'>-		if (key.objectid == root-&gt;root_key.objectid &amp;&amp;</div><div class='del'>-		    key.type == BTRFS_ROOT_REF_KEY)</div><div class='add'>+		if (key.objectid == btrfs_root_id(root) &amp;&amp; key.type == BTRFS_ROOT_REF_KEY)</div><div class='ctx'> 			ret = -ENOTEMPTY;</div><div class='ctx'> 	}</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -4374,77 +4625,42 @@ out:</div><div class='ctx'> static void btrfs_prune_dentries(struct btrfs_root *root)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='del'>-	struct rb_node *node;</div><div class='del'>-	struct rb_node *prev;</div><div class='del'>-	struct btrfs_inode *entry;</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	u64 objectid = 0;</div><div class='add'>+	struct btrfs_inode *inode;</div><div class='add'>+	u64 min_ino = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (!BTRFS_FS_ERROR(fs_info))</div><div class='ctx'> 		WARN_ON(btrfs_root_refs(&amp;root-&gt;root_item) != 0);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;root-&gt;inode_lock);</div><div class='del'>-again:</div><div class='del'>-	node = root-&gt;inode_tree.rb_node;</div><div class='del'>-	prev = NULL;</div><div class='del'>-	while (node) {</div><div class='del'>-		prev = node;</div><div class='del'>-		entry = rb_entry(node, struct btrfs_inode, rb_node);</div><div class='del'>-</div><div class='del'>-		if (objectid &lt; btrfs_ino(entry))</div><div class='del'>-			node = node-&gt;rb_left;</div><div class='del'>-		else if (objectid &gt; btrfs_ino(entry))</div><div class='del'>-			node = node-&gt;rb_right;</div><div class='del'>-		else</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-	if (!node) {</div><div class='del'>-		while (prev) {</div><div class='del'>-			entry = rb_entry(prev, struct btrfs_inode, rb_node);</div><div class='del'>-			if (objectid &lt;= btrfs_ino(entry)) {</div><div class='del'>-				node = prev;</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			prev = rb_next(prev);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	while (node) {</div><div class='del'>-		entry = rb_entry(node, struct btrfs_inode, rb_node);</div><div class='del'>-		objectid = btrfs_ino(entry) + 1;</div><div class='del'>-		inode = igrab(&amp;entry-&gt;vfs_inode);</div><div class='del'>-		if (inode) {</div><div class='del'>-			spin_unlock(&amp;root-&gt;inode_lock);</div><div class='del'>-			if (atomic_read(&amp;inode-&gt;i_count) &gt; 1)</div><div class='del'>-				d_prune_aliases(inode);</div><div class='del'>-			/*</div><div class='del'>-			 * btrfs_drop_inode will have it removed from the inode</div><div class='del'>-			 * cache when its usage count hits zero.</div><div class='del'>-			 */</div><div class='del'>-			iput(inode);</div><div class='del'>-			cond_resched();</div><div class='del'>-			spin_lock(&amp;root-&gt;inode_lock);</div><div class='del'>-			goto again;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (cond_resched_lock(&amp;root-&gt;inode_lock))</div><div class='del'>-			goto again;</div><div class='add'>+	inode = btrfs_find_first_inode(root, min_ino);</div><div class='add'>+	while (inode) {</div><div class='add'>+		if (icount_read(&amp;inode-&gt;vfs_inode) &gt; 1)</div><div class='add'>+			d_prune_aliases(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> </div><div class='del'>-		node = rb_next(node);</div><div class='add'>+		min_ino = btrfs_ino(inode) + 1;</div><div class='add'>+		/*</div><div class='add'>+		 * btrfs_drop_inode() will have it removed from the inode</div><div class='add'>+		 * cache when its usage count hits zero.</div><div class='add'>+		 */</div><div class='add'>+		iput(&amp;inode-&gt;vfs_inode);</div><div class='add'>+		cond_resched();</div><div class='add'>+		inode = btrfs_find_first_inode(root, min_ino);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;root-&gt;inode_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_delete_subvolume(struct inode *dir, struct dentry *dentry)</div><div class='add'>+int btrfs_delete_subvolume(struct btrfs_inode *dir, struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(dentry-&gt;d_sb);</div><div class='del'>-	struct btrfs_root *root = BTRFS_I(dir)-&gt;root;</div><div class='add'>+	struct btrfs_root *root = dir-&gt;root;</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	struct btrfs_root *dest = BTRFS_I(inode)-&gt;root;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	struct btrfs_block_rsv block_rsv;</div><div class='ctx'> 	u64 root_flags;</div><div class='add'>+	u64 qgroup_reserved = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='add'>+	down_write(&amp;fs_info-&gt;subvol_sem);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Don't allow to delete a subvolume with send in progress. This is</div><div class='ctx'> 	 * inside the inode lock so the error handling that has to drop the bit</div><div class='hunk'>@@ -4455,19 +4671,26 @@ int btrfs_delete_subvolume(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 		spin_unlock(&amp;dest-&gt;root_item_lock);</div><div class='ctx'> 		btrfs_warn(fs_info,</div><div class='ctx'> 			   "attempt to delete subvolume %llu during send",</div><div class='del'>-			   dest-&gt;root_key.objectid);</div><div class='del'>-		return -EPERM;</div><div class='add'>+			   btrfs_root_id(dest));</div><div class='add'>+		ret = -EPERM;</div><div class='add'>+		goto out_up_write;</div><div class='add'>+	}</div><div class='add'>+	if (atomic_read(&amp;dest-&gt;nr_swapfiles)) {</div><div class='add'>+		spin_unlock(&amp;dest-&gt;root_item_lock);</div><div class='add'>+		btrfs_warn(fs_info,</div><div class='add'>+			   "attempt to delete subvolume %llu with active swapfile",</div><div class='add'>+			   btrfs_root_id(root));</div><div class='add'>+		ret = -EPERM;</div><div class='add'>+		goto out_up_write;</div><div class='ctx'> 	}</div><div class='ctx'> 	root_flags = btrfs_root_flags(&amp;dest-&gt;root_item);</div><div class='ctx'> 	btrfs_set_root_flags(&amp;dest-&gt;root_item,</div><div class='ctx'> 			     root_flags | BTRFS_ROOT_SUBVOL_DEAD);</div><div class='ctx'> 	spin_unlock(&amp;dest-&gt;root_item_lock);</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;fs_info-&gt;subvol_sem);</div><div class='del'>-</div><div class='ctx'> 	ret = may_destroy_subvol(dest);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out_up_write;</div><div class='add'>+		goto out_undead;</div><div class='ctx'> </div><div class='ctx'> 	btrfs_init_block_rsv(&amp;block_rsv, BTRFS_BLOCK_RSV_TEMP);</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -4477,26 +4700,29 @@ int btrfs_delete_subvolume(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	 */</div><div class='ctx'> 	ret = btrfs_subvolume_reserve_metadata(root, &amp;block_rsv, 5, true);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out_up_write;</div><div class='add'>+		goto out_undead;</div><div class='add'>+	qgroup_reserved = block_rsv.qgroup_rsv_reserved;</div><div class='ctx'> </div><div class='ctx'> 	trans = btrfs_start_transaction(root, 0);</div><div class='ctx'> 	if (IS_ERR(trans)) {</div><div class='ctx'> 		ret = PTR_ERR(trans);</div><div class='ctx'> 		goto out_release;</div><div class='ctx'> 	}</div><div class='add'>+	btrfs_qgroup_convert_reserved_meta(root, qgroup_reserved);</div><div class='add'>+	qgroup_reserved = 0;</div><div class='ctx'> 	trans-&gt;block_rsv = &amp;block_rsv;</div><div class='ctx'> 	trans-&gt;bytes_reserved = block_rsv.size;</div><div class='ctx'> </div><div class='del'>-	btrfs_record_snapshot_destroy(trans, BTRFS_I(dir));</div><div class='add'>+	btrfs_record_snapshot_destroy(trans, dir);</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_unlink_subvol(trans, dir, dentry);</div><div class='del'>-	if (ret) {</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out_end_trans;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_record_root_in_trans(trans, dest);</div><div class='del'>-	if (ret) {</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out_end_trans;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -4509,17 +4735,16 @@ int btrfs_delete_subvolume(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	if (!test_and_set_bit(BTRFS_ROOT_ORPHAN_ITEM_INSERTED, &amp;dest-&gt;state)) {</div><div class='ctx'> 		ret = btrfs_insert_orphan_item(trans,</div><div class='ctx'> 					fs_info-&gt;tree_root,</div><div class='del'>-					dest-&gt;root_key.objectid);</div><div class='del'>-		if (ret) {</div><div class='add'>+					btrfs_root_id(dest));</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out_end_trans;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_uuid_tree_remove(trans, dest-&gt;root_item.uuid,</div><div class='del'>-				  BTRFS_UUID_KEY_SUBVOL,</div><div class='del'>-				  dest-&gt;root_key.objectid);</div><div class='del'>-	if (ret &amp;&amp; ret != -ENOENT) {</div><div class='add'>+				     BTRFS_UUID_KEY_SUBVOL, btrfs_root_id(dest));</div><div class='add'>+	if (unlikely(ret &amp;&amp; ret != -ENOENT)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out_end_trans;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -4527,8 +4752,8 @@ int btrfs_delete_subvolume(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 		ret = btrfs_uuid_tree_remove(trans,</div><div class='ctx'> 					  dest-&gt;root_item.received_uuid,</div><div class='ctx'> 					  BTRFS_UUID_KEY_RECEIVED_SUBVOL,</div><div class='del'>-					  dest-&gt;root_key.objectid);</div><div class='del'>-		if (ret &amp;&amp; ret != -ENOENT) {</div><div class='add'>+					  btrfs_root_id(dest));</div><div class='add'>+		if (unlikely(ret &amp;&amp; ret != -ENOENT)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out_end_trans;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -4542,16 +4767,20 @@ out_end_trans:</div><div class='ctx'> 	ret = btrfs_end_transaction(trans);</div><div class='ctx'> 	inode-&gt;i_flags |= S_DEAD;</div><div class='ctx'> out_release:</div><div class='del'>-	btrfs_subvolume_release_metadata(root, &amp;block_rsv);</div><div class='del'>-out_up_write:</div><div class='del'>-	up_write(&amp;fs_info-&gt;subvol_sem);</div><div class='add'>+	btrfs_block_rsv_release(fs_info, &amp;block_rsv, (u64)-1, NULL);</div><div class='add'>+	if (qgroup_reserved)</div><div class='add'>+		btrfs_qgroup_free_meta_prealloc(root, qgroup_reserved);</div><div class='add'>+out_undead:</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		spin_lock(&amp;dest-&gt;root_item_lock);</div><div class='ctx'> 		root_flags = btrfs_root_flags(&amp;dest-&gt;root_item);</div><div class='ctx'> 		btrfs_set_root_flags(&amp;dest-&gt;root_item,</div><div class='ctx'> 				root_flags &amp; ~BTRFS_ROOT_SUBVOL_DEAD);</div><div class='ctx'> 		spin_unlock(&amp;dest-&gt;root_item_lock);</div><div class='del'>-	} else {</div><div class='add'>+	}</div><div class='add'>+out_up_write:</div><div class='add'>+	up_write(&amp;fs_info-&gt;subvol_sem);</div><div class='add'>+	if (!ret) {</div><div class='ctx'> 		d_invalidate(dentry);</div><div class='ctx'> 		btrfs_prune_dentries(dest);</div><div class='ctx'> 		ASSERT(dest-&gt;send_in_progress == 0);</div><div class='hunk'>@@ -4560,456 +4789,151 @@ out_up_write:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btrfs_rmdir(struct inode *dir, struct dentry *dentry)</div><div class='add'>+static int btrfs_rmdir(struct inode *vfs_dir, struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = d_inode(dentry);</div><div class='del'>-	int err = 0;</div><div class='add'>+	struct btrfs_inode *dir = BTRFS_I(vfs_dir);</div><div class='add'>+	struct btrfs_inode *inode = BTRFS_I(d_inode(dentry));</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='del'>-	u64 last_unlink_trans;</div><div class='add'>+	struct fscrypt_name fname;</div><div class='ctx'> </div><div class='del'>-	if (inode-&gt;i_size &gt; BTRFS_EMPTY_DIR_SIZE)</div><div class='add'>+	if (inode-&gt;vfs_inode.i_size &gt; BTRFS_EMPTY_DIR_SIZE)</div><div class='ctx'> 		return -ENOTEMPTY;</div><div class='del'>-	if (btrfs_ino(BTRFS_I(inode)) == BTRFS_FIRST_FREE_OBJECTID)</div><div class='add'>+	if (btrfs_ino(inode) == BTRFS_FIRST_FREE_OBJECTID) {</div><div class='add'>+		if (unlikely(btrfs_fs_incompat(fs_info, EXTENT_TREE_V2))) {</div><div class='add'>+			btrfs_err(fs_info,</div><div class='add'>+			"extent tree v2 doesn't support snapshot deletion yet");</div><div class='add'>+			return -EOPNOTSUPP;</div><div class='add'>+		}</div><div class='ctx'> 		return btrfs_delete_subvolume(dir, dentry);</div><div class='del'>-</div><div class='del'>-	trans = __unlink_start_trans(dir);</div><div class='del'>-	if (IS_ERR(trans))</div><div class='del'>-		return PTR_ERR(trans);</div><div class='del'>-</div><div class='del'>-	if (unlikely(btrfs_ino(BTRFS_I(inode)) == BTRFS_EMPTY_SUBVOL_DIR_OBJECTID)) {</div><div class='del'>-		err = btrfs_unlink_subvol(trans, dir, dentry);</div><div class='del'>-		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = btrfs_orphan_add(trans, BTRFS_I(inode));</div><div class='del'>-	if (err)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	last_unlink_trans = BTRFS_I(inode)-&gt;last_unlink_trans;</div><div class='del'>-</div><div class='del'>-	/* now the directory is empty */</div><div class='del'>-	err = btrfs_unlink_inode(trans, BTRFS_I(dir),</div><div class='del'>-			BTRFS_I(d_inode(dentry)), dentry-&gt;d_name.name,</div><div class='del'>-			dentry-&gt;d_name.len);</div><div class='del'>-	if (!err) {</div><div class='del'>-		btrfs_i_size_write(BTRFS_I(inode), 0);</div><div class='del'>-		/*</div><div class='del'>-		 * Propagate the last_unlink_trans value of the deleted dir to</div><div class='del'>-		 * its parent directory. This is to prevent an unrecoverable</div><div class='del'>-		 * log tree in the case we do something like this:</div><div class='del'>-		 * 1) create dir foo</div><div class='del'>-		 * 2) create snapshot under dir foo</div><div class='del'>-		 * 3) delete the snapshot</div><div class='del'>-		 * 4) rmdir foo</div><div class='del'>-		 * 5) mkdir foo</div><div class='del'>-		 * 6) fsync foo or some file inside foo</div><div class='del'>-		 */</div><div class='del'>-		if (last_unlink_trans &gt;= trans-&gt;transid)</div><div class='del'>-			BTRFS_I(dir)-&gt;last_unlink_trans = last_unlink_trans;</div><div class='del'>-	}</div><div class='del'>-out:</div><div class='del'>-	btrfs_end_transaction(trans);</div><div class='del'>-	btrfs_btree_balance_dirty(BTRFS_I(dir)-&gt;root-&gt;fs_info);</div><div class='del'>-</div><div class='del'>-	return err;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Return this if we need to call truncate_block for the last bit of the</div><div class='del'>- * truncate.</div><div class='del'>- */</div><div class='del'>-#define NEED_TRUNCATE_BLOCK 1</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Remove inode items from a given root.</div><div class='del'>- *</div><div class='del'>- * @trans:		A transaction handle.</div><div class='del'>- * @root:		The root from which to remove items.</div><div class='del'>- * @inode:		The inode whose items we want to remove.</div><div class='del'>- * @new_size:		The new i_size for the inode. This is only applicable when</div><div class='del'>- *			@min_type is BTRFS_EXTENT_DATA_KEY, must be 0 otherwise.</div><div class='del'>- * @min_type:		The minimum key type to remove. All keys with a type</div><div class='del'>- *			greater than this value are removed and all keys with</div><div class='del'>- *			this type are removed only if their offset is &gt;= @new_size.</div><div class='del'>- * @extents_found:	Output parameter that will contain the number of file</div><div class='del'>- *			extent items that were removed or adjusted to the new</div><div class='del'>- *			inode i_size. The caller is responsible for initializing</div><div class='del'>- *			the counter. Also, it can be NULL if the caller does not</div><div class='del'>- *			need this counter.</div><div class='del'>- *</div><div class='del'>- * Remove all keys associated with the inode from the given root that have a key</div><div class='del'>- * with a type greater than or equals to @min_type. When @min_type has a value of</div><div class='del'>- * BTRFS_EXTENT_DATA_KEY, only remove file extent items that have an offset value</div><div class='del'>- * greater than or equals to @new_size. If a file extent item that starts before</div><div class='del'>- * @new_size and ends after it is found, its length is adjusted.</div><div class='del'>- *</div><div class='del'>- * Returns: 0 on success, &lt; 0 on error and NEED_TRUNCATE_BLOCK when @min_type is</div><div class='del'>- * BTRFS_EXTENT_DATA_KEY and the caller must truncate the last block.</div><div class='del'>- */</div><div class='del'>-int btrfs_truncate_inode_items(struct btrfs_trans_handle *trans,</div><div class='del'>-			       struct btrfs_root *root,</div><div class='del'>-			       struct btrfs_inode *inode,</div><div class='del'>-			       u64 new_size, u32 min_type,</div><div class='del'>-			       u64 *extents_found)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='del'>-	struct btrfs_path *path;</div><div class='del'>-	struct extent_buffer *leaf;</div><div class='del'>-	struct btrfs_file_extent_item *fi;</div><div class='del'>-	struct btrfs_key key;</div><div class='del'>-	struct btrfs_key found_key;</div><div class='del'>-	u64 extent_start = 0;</div><div class='del'>-	u64 extent_num_bytes = 0;</div><div class='del'>-	u64 extent_offset = 0;</div><div class='del'>-	u64 item_end = 0;</div><div class='del'>-	u64 last_size = new_size;</div><div class='del'>-	u32 found_type = (u8)-1;</div><div class='del'>-	int found_extent;</div><div class='del'>-	int del_item;</div><div class='del'>-	int pending_del_nr = 0;</div><div class='del'>-	int pending_del_slot = 0;</div><div class='del'>-	int extent_type = -1;</div><div class='del'>-	int ret;</div><div class='del'>-	u64 ino = btrfs_ino(inode);</div><div class='del'>-	u64 bytes_deleted = 0;</div><div class='del'>-	bool be_nice = false;</div><div class='del'>-	bool should_throttle = false;</div><div class='del'>-	const u64 lock_start = ALIGN_DOWN(new_size, fs_info-&gt;sectorsize);</div><div class='del'>-	struct extent_state *cached_state = NULL;</div><div class='del'>-</div><div class='del'>-	BUG_ON(new_size &gt; 0 &amp;&amp; min_type != BTRFS_EXTENT_DATA_KEY);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * For non-free space inodes and non-shareable roots, we want to back</div><div class='del'>-	 * off from time to time.  This means all inodes in subvolume roots,</div><div class='del'>-	 * reloc roots, and data reloc roots.</div><div class='del'>-	 */</div><div class='del'>-	if (!btrfs_is_free_space_inode(inode) &amp;&amp;</div><div class='del'>-	    test_bit(BTRFS_ROOT_SHAREABLE, &amp;root-&gt;state))</div><div class='del'>-		be_nice = true;</div><div class='del'>-</div><div class='del'>-	path = btrfs_alloc_path();</div><div class='del'>-	if (!path)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	path-&gt;reada = READA_BACK;</div><div class='add'>+	ret = fscrypt_setup_filename(vfs_dir, &amp;dentry-&gt;d_name, 1, &amp;fname);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	if (root-&gt;root_key.objectid != BTRFS_TREE_LOG_OBJECTID) {</div><div class='del'>-		lock_extent_bits(&amp;inode-&gt;io_tree, lock_start, (u64)-1,</div><div class='del'>-				 &amp;cached_state);</div><div class='add'>+	/* This needs to handle no-key deletions later on */</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * We want to drop from the next block forward in case this</div><div class='del'>-		 * new size is not block aligned since we will be keeping the</div><div class='del'>-		 * last block of the extent just the way it is.</div><div class='del'>-		 */</div><div class='del'>-		btrfs_drop_extent_cache(inode, ALIGN(new_size,</div><div class='del'>-					fs_info-&gt;sectorsize),</div><div class='del'>-					(u64)-1, 0);</div><div class='add'>+	trans = __unlink_start_trans(dir);</div><div class='add'>+	if (IS_ERR(trans)) {</div><div class='add'>+		ret = PTR_ERR(trans);</div><div class='add'>+		goto out_notrans;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * This function is also used to drop the items in the log tree before</div><div class='del'>-	 * we relog the inode, so if root != BTRFS_I(inode)-&gt;root, it means</div><div class='del'>-	 * it is used to drop the logged items. So we shouldn't kill the delayed</div><div class='del'>-	 * items.</div><div class='add'>+	 * Propagate the last_unlink_trans value of the deleted dir to its</div><div class='add'>+	 * parent directory. This is to prevent an unrecoverable log tree in the</div><div class='add'>+	 * case we do something like this:</div><div class='add'>+	 * 1) create dir foo</div><div class='add'>+	 * 2) create snapshot under dir foo</div><div class='add'>+	 * 3) delete the snapshot</div><div class='add'>+	 * 4) rmdir foo</div><div class='add'>+	 * 5) mkdir foo</div><div class='add'>+	 * 6) fsync foo or some file inside foo</div><div class='add'>+	 *</div><div class='add'>+	 * This is because we can't unlink other roots when replaying the dir</div><div class='add'>+	 * deletes for directory foo.</div><div class='ctx'> 	 */</div><div class='del'>-	if (min_type == 0 &amp;&amp; root == inode-&gt;root)</div><div class='del'>-		btrfs_kill_delayed_inode_items(inode);</div><div class='del'>-</div><div class='del'>-	key.objectid = ino;</div><div class='del'>-	key.offset = (u64)-1;</div><div class='del'>-	key.type = (u8)-1;</div><div class='add'>+	if (inode-&gt;last_unlink_trans &gt;= trans-&gt;transid)</div><div class='add'>+		btrfs_record_snapshot_destroy(trans, dir);</div><div class='ctx'> </div><div class='del'>-search_again:</div><div class='del'>-	/*</div><div class='del'>-	 * with a 16K leaf size and 128MB extents, you can actually queue</div><div class='del'>-	 * up a huge file in a single leaf.  Most of the time that</div><div class='del'>-	 * bytes_deleted is &gt; 0, it will be huge by the time we get here</div><div class='del'>-	 */</div><div class='del'>-	if (be_nice &amp;&amp; bytes_deleted &gt; SZ_32M &amp;&amp;</div><div class='del'>-	    btrfs_should_end_transaction(trans)) {</div><div class='del'>-		ret = -EAGAIN;</div><div class='add'>+	if (unlikely(btrfs_ino(inode) == BTRFS_EMPTY_SUBVOL_DIR_OBJECTID)) {</div><div class='add'>+		ret = btrfs_unlink_subvol(trans, dir, dentry);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_search_slot(trans, root, &amp;key, path, -1, 1);</div><div class='del'>-	if (ret &lt; 0)</div><div class='add'>+	ret = btrfs_orphan_add(trans, inode);</div><div class='add'>+	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	if (ret &gt; 0) {</div><div class='del'>-		ret = 0;</div><div class='del'>-		/* there are no items in the tree for us to truncate, we're</div><div class='del'>-		 * done</div><div class='del'>-		 */</div><div class='del'>-		if (path-&gt;slots[0] == 0)</div><div class='del'>-			goto out;</div><div class='del'>-		path-&gt;slots[0]--;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	while (1) {</div><div class='del'>-		u64 clear_start = 0, clear_len = 0;</div><div class='del'>-</div><div class='del'>-		fi = NULL;</div><div class='del'>-		leaf = path-&gt;nodes[0];</div><div class='del'>-		btrfs_item_key_to_cpu(leaf, &amp;found_key, path-&gt;slots[0]);</div><div class='del'>-		found_type = found_key.type;</div><div class='del'>-</div><div class='del'>-		if (found_key.objectid != ino)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		if (found_type &lt; min_type)</div><div class='del'>-			break;</div><div class='add'>+	/* now the directory is empty */</div><div class='add'>+	ret = btrfs_unlink_inode(trans, dir, inode, &amp;fname.disk_name);</div><div class='add'>+	if (!ret)</div><div class='add'>+		btrfs_i_size_write(inode, 0);</div><div class='add'>+out:</div><div class='add'>+	btrfs_end_transaction(trans);</div><div class='add'>+out_notrans:</div><div class='add'>+	btrfs_btree_balance_dirty(fs_info);</div><div class='add'>+	fscrypt_free_filename(&amp;fname);</div><div class='ctx'> </div><div class='del'>-		item_end = found_key.offset;</div><div class='del'>-		if (found_type == BTRFS_EXTENT_DATA_KEY) {</div><div class='del'>-			fi = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='del'>-					    struct btrfs_file_extent_item);</div><div class='del'>-			extent_type = btrfs_file_extent_type(leaf, fi);</div><div class='del'>-			if (extent_type != BTRFS_FILE_EXTENT_INLINE) {</div><div class='del'>-				item_end +=</div><div class='del'>-				    btrfs_file_extent_num_bytes(leaf, fi);</div><div class='del'>-</div><div class='del'>-				trace_btrfs_truncate_show_fi_regular(</div><div class='del'>-					inode, leaf, fi, found_key.offset);</div><div class='del'>-			} else if (extent_type == BTRFS_FILE_EXTENT_INLINE) {</div><div class='del'>-				item_end += btrfs_file_extent_ram_bytes(leaf,</div><div class='del'>-									fi);</div><div class='del'>-</div><div class='del'>-				trace_btrfs_truncate_show_fi_inline(</div><div class='del'>-					inode, leaf, fi, path-&gt;slots[0],</div><div class='del'>-					found_key.offset);</div><div class='del'>-			}</div><div class='del'>-			item_end--;</div><div class='del'>-		}</div><div class='del'>-		if (found_type &gt; min_type) {</div><div class='del'>-			del_item = 1;</div><div class='del'>-		} else {</div><div class='del'>-			if (item_end &lt; new_size)</div><div class='del'>-				break;</div><div class='del'>-			if (found_key.offset &gt;= new_size)</div><div class='del'>-				del_item = 1;</div><div class='del'>-			else</div><div class='del'>-				del_item = 0;</div><div class='del'>-		}</div><div class='del'>-		found_extent = 0;</div><div class='del'>-		/* FIXME, shrink the extent if the ref count is only 1 */</div><div class='del'>-		if (found_type != BTRFS_EXTENT_DATA_KEY)</div><div class='del'>-			goto delete;</div><div class='del'>-</div><div class='del'>-		if (extents_found != NULL)</div><div class='del'>-			(*extents_found)++;</div><div class='del'>-</div><div class='del'>-		if (extent_type != BTRFS_FILE_EXTENT_INLINE) {</div><div class='del'>-			u64 num_dec;</div><div class='del'>-</div><div class='del'>-			clear_start = found_key.offset;</div><div class='del'>-			extent_start = btrfs_file_extent_disk_bytenr(leaf, fi);</div><div class='del'>-			if (!del_item) {</div><div class='del'>-				u64 orig_num_bytes =</div><div class='del'>-					btrfs_file_extent_num_bytes(leaf, fi);</div><div class='del'>-				extent_num_bytes = ALIGN(new_size -</div><div class='del'>-						found_key.offset,</div><div class='del'>-						fs_info-&gt;sectorsize);</div><div class='del'>-				clear_start = ALIGN(new_size, fs_info-&gt;sectorsize);</div><div class='del'>-				btrfs_set_file_extent_num_bytes(leaf, fi,</div><div class='del'>-							 extent_num_bytes);</div><div class='del'>-				num_dec = (orig_num_bytes -</div><div class='del'>-					   extent_num_bytes);</div><div class='del'>-				if (test_bit(BTRFS_ROOT_SHAREABLE,</div><div class='del'>-					     &amp;root-&gt;state) &amp;&amp;</div><div class='del'>-				    extent_start != 0)</div><div class='del'>-					inode_sub_bytes(&amp;inode-&gt;vfs_inode,</div><div class='del'>-							num_dec);</div><div class='del'>-				btrfs_mark_buffer_dirty(leaf);</div><div class='del'>-			} else {</div><div class='del'>-				extent_num_bytes =</div><div class='del'>-					btrfs_file_extent_disk_num_bytes(leaf,</div><div class='del'>-									 fi);</div><div class='del'>-				extent_offset = found_key.offset -</div><div class='del'>-					btrfs_file_extent_offset(leaf, fi);</div><div class='del'>-</div><div class='del'>-				/* FIXME blocksize != 4096 */</div><div class='del'>-				num_dec = btrfs_file_extent_num_bytes(leaf, fi);</div><div class='del'>-				if (extent_start != 0) {</div><div class='del'>-					found_extent = 1;</div><div class='del'>-					if (test_bit(BTRFS_ROOT_SHAREABLE,</div><div class='del'>-						     &amp;root-&gt;state))</div><div class='del'>-						inode_sub_bytes(&amp;inode-&gt;vfs_inode,</div><div class='del'>-								num_dec);</div><div class='del'>-				}</div><div class='del'>-			}</div><div class='del'>-			clear_len = num_dec;</div><div class='del'>-		} else if (extent_type == BTRFS_FILE_EXTENT_INLINE) {</div><div class='del'>-			/*</div><div class='del'>-			 * we can't truncate inline items that have had</div><div class='del'>-			 * special encodings</div><div class='del'>-			 */</div><div class='del'>-			if (!del_item &amp;&amp;</div><div class='del'>-			    btrfs_file_extent_encryption(leaf, fi) == 0 &amp;&amp;</div><div class='del'>-			    btrfs_file_extent_other_encoding(leaf, fi) == 0 &amp;&amp;</div><div class='del'>-			    btrfs_file_extent_compression(leaf, fi) == 0) {</div><div class='del'>-				u32 size = (u32)(new_size - found_key.offset);</div><div class='del'>-</div><div class='del'>-				btrfs_set_file_extent_ram_bytes(leaf, fi, size);</div><div class='del'>-				size = btrfs_file_extent_calc_inline_size(size);</div><div class='del'>-				btrfs_truncate_item(path, size, 1);</div><div class='del'>-			} else if (!del_item) {</div><div class='del'>-				/*</div><div class='del'>-				 * We have to bail so the last_size is set to</div><div class='del'>-				 * just before this extent.</div><div class='del'>-				 */</div><div class='del'>-				ret = NEED_TRUNCATE_BLOCK;</div><div class='del'>-				break;</div><div class='del'>-			} else {</div><div class='del'>-				/*</div><div class='del'>-				 * Inline extents are special, we just treat</div><div class='del'>-				 * them as a full sector worth in the file</div><div class='del'>-				 * extent tree just for simplicity sake.</div><div class='del'>-				 */</div><div class='del'>-				clear_len = fs_info-&gt;sectorsize;</div><div class='del'>-			}</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-			if (test_bit(BTRFS_ROOT_SHAREABLE, &amp;root-&gt;state))</div><div class='del'>-				inode_sub_bytes(&amp;inode-&gt;vfs_inode,</div><div class='del'>-						item_end + 1 - new_size);</div><div class='del'>-		}</div><div class='del'>-delete:</div><div class='del'>-		/*</div><div class='del'>-		 * We use btrfs_truncate_inode_items() to clean up log trees for</div><div class='del'>-		 * multiple fsyncs, and in this case we don't want to clear the</div><div class='del'>-		 * file extent range because it's just the log.</div><div class='del'>-		 */</div><div class='del'>-		if (root == inode-&gt;root) {</div><div class='del'>-			ret = btrfs_inode_clear_file_extent_range(inode,</div><div class='del'>-						  clear_start, clear_len);</div><div class='del'>-			if (ret) {</div><div class='del'>-				btrfs_abort_transaction(trans, ret);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='add'>+static bool is_inside_block(u64 bytenr, u64 blockstart, u32 blocksize)</div><div class='add'>+{</div><div class='add'>+	ASSERT(IS_ALIGNED(blockstart, blocksize), "blockstart=%llu blocksize=%u",</div><div class='add'>+		blockstart, blocksize);</div><div class='ctx'> </div><div class='del'>-		if (del_item)</div><div class='del'>-			last_size = found_key.offset;</div><div class='del'>-		else</div><div class='del'>-			last_size = new_size;</div><div class='del'>-		if (del_item) {</div><div class='del'>-			if (!pending_del_nr) {</div><div class='del'>-				/* no pending yet, add ourselves */</div><div class='del'>-				pending_del_slot = path-&gt;slots[0];</div><div class='del'>-				pending_del_nr = 1;</div><div class='del'>-			} else if (pending_del_nr &amp;&amp;</div><div class='del'>-				   path-&gt;slots[0] + 1 == pending_del_slot) {</div><div class='del'>-				/* hop on the pending chunk */</div><div class='del'>-				pending_del_nr++;</div><div class='del'>-				pending_del_slot = path-&gt;slots[0];</div><div class='del'>-			} else {</div><div class='del'>-				BUG();</div><div class='del'>-			}</div><div class='del'>-		} else {</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		should_throttle = false;</div><div class='add'>+	if (blockstart &lt;= bytenr &amp;&amp; bytenr &lt;= blockstart + blocksize - 1)</div><div class='add'>+		return true;</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		if (found_extent &amp;&amp;</div><div class='del'>-		    root-&gt;root_key.objectid != BTRFS_TREE_LOG_OBJECTID) {</div><div class='del'>-			struct btrfs_ref ref = { 0 };</div><div class='add'>+static int truncate_block_zero_beyond_eof(struct btrfs_inode *inode, u64 start)</div><div class='add'>+{</div><div class='add'>+	const pgoff_t index = (start &gt;&gt; PAGE_SHIFT);</div><div class='add'>+	struct address_space *mapping = inode-&gt;vfs_inode.i_mapping;</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	u64 zero_start;</div><div class='add'>+	u64 zero_end;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='del'>-			bytes_deleted += extent_num_bytes;</div><div class='add'>+again:</div><div class='add'>+	folio = filemap_lock_folio(mapping, index);</div><div class='add'>+	/* No folio present. */</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-			btrfs_init_generic_ref(&amp;ref, BTRFS_DROP_DELAYED_REF,</div><div class='del'>-					extent_start, extent_num_bytes, 0);</div><div class='del'>-			btrfs_init_data_ref(&amp;ref, btrfs_header_owner(leaf),</div><div class='del'>-					ino, extent_offset,</div><div class='del'>-					root-&gt;root_key.objectid, false);</div><div class='del'>-			ret = btrfs_free_extent(trans, &amp;ref);</div><div class='del'>-			if (ret) {</div><div class='del'>-				btrfs_abort_transaction(trans, ret);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			if (be_nice) {</div><div class='del'>-				if (btrfs_should_throttle_delayed_refs(trans))</div><div class='del'>-					should_throttle = true;</div><div class='del'>-			}</div><div class='add'>+	if (!folio_test_uptodate(folio)) {</div><div class='add'>+		ret = btrfs_read_folio(NULL, folio);</div><div class='add'>+		folio_lock(folio);</div><div class='add'>+		if (folio-&gt;mapping != mapping) {</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+			folio_put(folio);</div><div class='add'>+			goto again;</div><div class='ctx'> 		}</div><div class='del'>-</div><div class='del'>-		if (found_type == BTRFS_INODE_ITEM_KEY)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		if (path-&gt;slots[0] == 0 ||</div><div class='del'>-		    path-&gt;slots[0] != pending_del_slot ||</div><div class='del'>-		    should_throttle) {</div><div class='del'>-			if (pending_del_nr) {</div><div class='del'>-				ret = btrfs_del_items(trans, root, path,</div><div class='del'>-						pending_del_slot,</div><div class='del'>-						pending_del_nr);</div><div class='del'>-				if (ret) {</div><div class='del'>-					btrfs_abort_transaction(trans, ret);</div><div class='del'>-					break;</div><div class='del'>-				}</div><div class='del'>-				pending_del_nr = 0;</div><div class='del'>-			}</div><div class='del'>-			btrfs_release_path(path);</div><div class='del'>-</div><div class='del'>-			/*</div><div class='del'>-			 * We can generate a lot of delayed refs, so we need to</div><div class='del'>-			 * throttle every once and a while and make sure we're</div><div class='del'>-			 * adding enough space to keep up with the work we are</div><div class='del'>-			 * generating.  Since we hold a transaction here we</div><div class='del'>-			 * can't flush, and we don't want to FLUSH_LIMIT because</div><div class='del'>-			 * we could have generated too many delayed refs to</div><div class='del'>-			 * actually allocate, so just bail if we're short and</div><div class='del'>-			 * let the normal reservation dance happen higher up.</div><div class='del'>-			 */</div><div class='del'>-			if (should_throttle) {</div><div class='del'>-				ret = btrfs_delayed_refs_rsv_refill(fs_info,</div><div class='del'>-							BTRFS_RESERVE_NO_FLUSH);</div><div class='del'>-				if (ret) {</div><div class='del'>-					ret = -EAGAIN;</div><div class='del'>-					break;</div><div class='del'>-				}</div><div class='del'>-			}</div><div class='del'>-			goto search_again;</div><div class='del'>-		} else {</div><div class='del'>-			path-&gt;slots[0]--;</div><div class='add'>+		if (unlikely(!folio_test_uptodate(folio))) {</div><div class='add'>+			ret = -EIO;</div><div class='add'>+			goto out_unlock;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-out:</div><div class='del'>-	if (ret &gt;= 0 &amp;&amp; pending_del_nr) {</div><div class='del'>-		int err;</div><div class='add'>+	folio_wait_writeback(folio);</div><div class='ctx'> </div><div class='del'>-		err = btrfs_del_items(trans, root, path, pending_del_slot,</div><div class='del'>-				      pending_del_nr);</div><div class='del'>-		if (err) {</div><div class='del'>-			btrfs_abort_transaction(trans, err);</div><div class='del'>-			ret = err;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	if (root-&gt;root_key.objectid != BTRFS_TREE_LOG_OBJECTID) {</div><div class='del'>-		ASSERT(last_size &gt;= new_size);</div><div class='del'>-		if (!ret &amp;&amp; last_size &gt; new_size)</div><div class='del'>-			last_size = new_size;</div><div class='del'>-		btrfs_inode_safe_disk_i_size_write(inode, last_size);</div><div class='del'>-		unlock_extent_cached(&amp;inode-&gt;io_tree, lock_start, (u64)-1,</div><div class='del'>-				     &amp;cached_state);</div><div class='del'>-	}</div><div class='add'>+	/*</div><div class='add'>+	 * We do not need to lock extents nor wait for OE, as it's already</div><div class='add'>+	 * beyond EOF.</div><div class='add'>+	 */</div><div class='ctx'> </div><div class='del'>-	btrfs_free_path(path);</div><div class='add'>+	zero_start = max_t(u64, folio_pos(folio), start);</div><div class='add'>+	zero_end = folio_next_pos(folio);</div><div class='add'>+	folio_zero_range(folio, zero_start - folio_pos(folio),</div><div class='add'>+			 zero_end - zero_start);</div><div class='add'>+</div><div class='add'>+out_unlock:</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * btrfs_truncate_block - read, zero a chunk and write a block</div><div class='del'>- * @inode - inode that we're zeroing</div><div class='del'>- * @from - the offset to start zeroing</div><div class='del'>- * @len - the length to zero, 0 to zero the entire range respective to the</div><div class='del'>- *	offset</div><div class='del'>- * @front - zero up to the offset instead of from the offset on</div><div class='add'>+ * Handle the truncation of a fs block.</div><div class='add'>+ *</div><div class='add'>+ * @inode  - inode that we're zeroing</div><div class='add'>+ * @offset - the file offset of the block to truncate</div><div class='add'>+ *           The value must be inside [@start, @end], and the function will do</div><div class='add'>+ *           extra checks if the block that covers @offset needs to be zeroed.</div><div class='add'>+ * @start  - the start file offset of the range we want to zero</div><div class='add'>+ * @end    - the end (inclusive) file offset of the range we want to zero.</div><div class='ctx'>  *</div><div class='del'>- * This will find the block for the "from" offset and cow the block and zero the</div><div class='del'>- * part we want to zero.  This is used with truncate and hole punching.</div><div class='add'>+ * If the range is not block aligned, read out the folio that covers @offset,</div><div class='add'>+ * and if needed zero blocks that are inside the folio and covered by [@start, @end).</div><div class='add'>+ * If @start or @end + 1 lands inside a block, that block will be marked dirty</div><div class='add'>+ * for writeback.</div><div class='add'>+ *</div><div class='add'>+ * This is utilized by hole punch, zero range, file expansion.</div><div class='ctx'>  */</div><div class='del'>-int btrfs_truncate_block(struct btrfs_inode *inode, loff_t from, loff_t len,</div><div class='del'>-			 int front)</div><div class='add'>+int btrfs_truncate_block(struct btrfs_inode *inode, u64 offset, u64 start, u64 end)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='ctx'> 	struct address_space *mapping = inode-&gt;vfs_inode.i_mapping;</div><div class='hunk'>@@ -5019,33 +4943,72 @@ int btrfs_truncate_block(struct btrfs_inode *inode, loff_t from, loff_t len,</div><div class='ctx'> 	struct extent_changeset *data_reserved = NULL;</div><div class='ctx'> 	bool only_release_metadata = false;</div><div class='ctx'> 	u32 blocksize = fs_info-&gt;sectorsize;</div><div class='del'>-	pgoff_t index = from &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	unsigned offset = from &amp; (blocksize - 1);</div><div class='del'>-	struct page *page;</div><div class='add'>+	pgoff_t index = (offset &gt;&gt; PAGE_SHIFT);</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	gfp_t mask = btrfs_alloc_write_mask(mapping);</div><div class='del'>-	size_t write_bytes = blocksize;</div><div class='ctx'> 	int ret = 0;</div><div class='add'>+	const bool in_head_block = is_inside_block(offset, round_down(start, blocksize),</div><div class='add'>+						   blocksize);</div><div class='add'>+	const bool in_tail_block = is_inside_block(offset, round_down(end, blocksize),</div><div class='add'>+						   blocksize);</div><div class='add'>+	bool need_truncate_head = false;</div><div class='add'>+	bool need_truncate_tail = false;</div><div class='add'>+	u64 zero_start;</div><div class='add'>+	u64 zero_end;</div><div class='ctx'> 	u64 block_start;</div><div class='ctx'> 	u64 block_end;</div><div class='ctx'> </div><div class='del'>-	if (IS_ALIGNED(offset, blocksize) &amp;&amp;</div><div class='del'>-	    (!len || IS_ALIGNED(len, blocksize)))</div><div class='add'>+	/* @offset should be inside the range. */</div><div class='add'>+	ASSERT(start &lt;= offset &amp;&amp; offset &lt;= end, "offset=%llu start=%llu end=%llu",</div><div class='add'>+	       offset, start, end);</div><div class='add'>+</div><div class='add'>+	/* The range is aligned at both ends. */</div><div class='add'>+	if (IS_ALIGNED(start, blocksize) &amp;&amp; IS_ALIGNED(end + 1, blocksize)) {</div><div class='add'>+		/*</div><div class='add'>+		 * For block size &lt; page size case, we may have polluted blocks</div><div class='add'>+		 * beyond EOF. So we also need to zero them out.</div><div class='add'>+		 */</div><div class='add'>+		if (end == (u64)-1 &amp;&amp; blocksize &lt; PAGE_SIZE)</div><div class='add'>+			ret = truncate_block_zero_beyond_eof(inode, start);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * @offset may not be inside the head nor tail block. In that case we</div><div class='add'>+	 * don't need to do anything.</div><div class='add'>+	 */</div><div class='add'>+	if (!in_head_block &amp;&amp; !in_tail_block)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Skip the truncation if the range in the target block is already aligned.</div><div class='add'>+	 * The seemingly complex check will also handle the same block case.</div><div class='add'>+	 */</div><div class='add'>+	if (in_head_block &amp;&amp; !IS_ALIGNED(start, blocksize))</div><div class='add'>+		need_truncate_head = true;</div><div class='add'>+	if (in_tail_block &amp;&amp; !IS_ALIGNED(end + 1, blocksize))</div><div class='add'>+		need_truncate_tail = true;</div><div class='add'>+	if (!need_truncate_head &amp;&amp; !need_truncate_tail)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	block_start = round_down(from, blocksize);</div><div class='add'>+	block_start = round_down(offset, blocksize);</div><div class='ctx'> 	block_end = block_start + blocksize - 1;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_check_data_free_space(inode, &amp;data_reserved, block_start,</div><div class='del'>-					  blocksize);</div><div class='add'>+					  blocksize, false);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='del'>-		if (btrfs_check_nocow_lock(inode, block_start, &amp;write_bytes) &gt; 0) {</div><div class='del'>-			/* For nocow case, no need to reserve data space */</div><div class='add'>+		size_t write_bytes = blocksize;</div><div class='add'>+</div><div class='add'>+		if (btrfs_check_nocow_lock(inode, block_start, &amp;write_bytes, false) &gt; 0) {</div><div class='add'>+			/* For nocow case, no need to reserve data space. */</div><div class='add'>+			ASSERT(write_bytes == blocksize, "write_bytes=%zu blocksize=%u",</div><div class='add'>+			       write_bytes, blocksize);</div><div class='ctx'> 			only_release_metadata = true;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	ret = btrfs_delalloc_reserve_metadata(inode, blocksize);</div><div class='add'>+	ret = btrfs_delalloc_reserve_metadata(inode, blocksize, blocksize, false);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='ctx'> 		if (!only_release_metadata)</div><div class='ctx'> 			btrfs_free_reserved_data_space(inode, data_reserved,</div><div class='hunk'>@@ -5053,77 +5016,97 @@ int btrfs_truncate_block(struct btrfs_inode *inode, loff_t from, loff_t len,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> again:</div><div class='del'>-	page = find_or_create_page(mapping, index, mask);</div><div class='del'>-	if (!page) {</div><div class='del'>-		btrfs_delalloc_release_space(inode, data_reserved, block_start,</div><div class='del'>-					     blocksize, true);</div><div class='add'>+	folio = __filemap_get_folio(mapping, index,</div><div class='add'>+				    FGP_LOCK | FGP_ACCESSED | FGP_CREAT, mask);</div><div class='add'>+	if (IS_ERR(folio)) {</div><div class='add'>+		if (only_release_metadata)</div><div class='add'>+			btrfs_delalloc_release_metadata(inode, blocksize, true);</div><div class='add'>+		else</div><div class='add'>+			btrfs_delalloc_release_space(inode, data_reserved,</div><div class='add'>+						     block_start, blocksize, true);</div><div class='ctx'> 		btrfs_delalloc_release_extents(inode, blocksize);</div><div class='del'>-		ret = -ENOMEM;</div><div class='add'>+		ret = PTR_ERR(folio);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	ret = set_page_extent_mapped(page);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out_unlock;</div><div class='ctx'> </div><div class='del'>-	if (!PageUptodate(page)) {</div><div class='del'>-		ret = btrfs_readpage(NULL, page);</div><div class='del'>-		lock_page(page);</div><div class='del'>-		if (page-&gt;mapping != mapping) {</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			put_page(page);</div><div class='add'>+	if (!folio_test_uptodate(folio)) {</div><div class='add'>+		ret = btrfs_read_folio(NULL, folio);</div><div class='add'>+		folio_lock(folio);</div><div class='add'>+		if (folio-&gt;mapping != mapping) {</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+			folio_put(folio);</div><div class='ctx'> 			goto again;</div><div class='ctx'> 		}</div><div class='del'>-		if (!PageUptodate(page)) {</div><div class='add'>+		if (unlikely(!folio_test_uptodate(folio))) {</div><div class='ctx'> 			ret = -EIO;</div><div class='ctx'> 			goto out_unlock;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	wait_on_page_writeback(page);</div><div class='ctx'> </div><div class='del'>-	lock_extent_bits(io_tree, block_start, block_end, &amp;cached_state);</div><div class='add'>+	/*</div><div class='add'>+	 * We unlock the page after the io is completed and then re-lock it</div><div class='add'>+	 * above.  release_folio() could have come in between that and cleared</div><div class='add'>+	 * folio private, but left the page in the mapping.  Set the page mapped</div><div class='add'>+	 * here to make sure it's properly set for the subpage stuff.</div><div class='add'>+	 */</div><div class='add'>+	ret = set_folio_extent_mapped(folio);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out_unlock;</div><div class='add'>+</div><div class='add'>+	folio_wait_writeback(folio);</div><div class='add'>+</div><div class='add'>+	btrfs_lock_extent(io_tree, block_start, block_end, &amp;cached_state);</div><div class='ctx'> </div><div class='ctx'> 	ordered = btrfs_lookup_ordered_extent(inode, block_start);</div><div class='ctx'> 	if (ordered) {</div><div class='del'>-		unlock_extent_cached(io_tree, block_start, block_end,</div><div class='del'>-				     &amp;cached_state);</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		put_page(page);</div><div class='del'>-		btrfs_start_ordered_extent(ordered, 1);</div><div class='add'>+		btrfs_unlock_extent(io_tree, block_start, block_end, &amp;cached_state);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='add'>+		btrfs_start_ordered_extent(ordered);</div><div class='ctx'> 		btrfs_put_ordered_extent(ordered);</div><div class='ctx'> 		goto again;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	clear_extent_bit(&amp;inode-&gt;io_tree, block_start, block_end,</div><div class='del'>-			 EXTENT_DELALLOC | EXTENT_DO_ACCOUNTING | EXTENT_DEFRAG,</div><div class='del'>-			 0, 0, &amp;cached_state);</div><div class='add'>+	btrfs_clear_extent_bit(&amp;inode-&gt;io_tree, block_start, block_end,</div><div class='add'>+			       EXTENT_DELALLOC | EXTENT_DO_ACCOUNTING | EXTENT_DEFRAG,</div><div class='add'>+			       &amp;cached_state);</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_set_extent_delalloc(inode, block_start, block_end, 0,</div><div class='ctx'> 					&amp;cached_state);</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		unlock_extent_cached(io_tree, block_start, block_end,</div><div class='del'>-				     &amp;cached_state);</div><div class='add'>+		btrfs_unlock_extent(io_tree, block_start, block_end, &amp;cached_state);</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (offset != blocksize) {</div><div class='del'>-		if (!len)</div><div class='del'>-			len = blocksize - offset;</div><div class='del'>-		if (front)</div><div class='del'>-			memzero_page(page, (block_start - page_offset(page)),</div><div class='del'>-				     offset);</div><div class='del'>-		else</div><div class='del'>-			memzero_page(page, (block_start - page_offset(page)) + offset,</div><div class='del'>-				     len);</div><div class='del'>-		flush_dcache_page(page);</div><div class='add'>+	if (end == (u64)-1) {</div><div class='add'>+		/*</div><div class='add'>+		 * We're truncating beyond EOF, the remaining blocks normally are</div><div class='add'>+		 * already holes thus no need to zero again, but it's possible for</div><div class='add'>+		 * fs block size &lt; page size cases to have memory mapped writes</div><div class='add'>+		 * to pollute ranges beyond EOF.</div><div class='add'>+		 *</div><div class='add'>+		 * In that case although such polluted blocks beyond EOF will</div><div class='add'>+		 * not reach disk, it still affects our page caches.</div><div class='add'>+		 */</div><div class='add'>+		zero_start = max_t(u64, folio_pos(folio), start);</div><div class='add'>+		zero_end = min_t(u64, folio_next_pos(folio) - 1, end);</div><div class='add'>+	} else {</div><div class='add'>+		zero_start = max_t(u64, block_start, start);</div><div class='add'>+		zero_end = min_t(u64, block_end, end);</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_page_clear_checked(fs_info, page, block_start,</div><div class='del'>-				 block_end + 1 - block_start);</div><div class='del'>-	btrfs_page_set_dirty(fs_info, page, block_start, block_end + 1 - block_start);</div><div class='del'>-	unlock_extent_cached(io_tree, block_start, block_end, &amp;cached_state);</div><div class='add'>+	folio_zero_range(folio, zero_start - folio_pos(folio),</div><div class='add'>+			 zero_end - zero_start + 1);</div><div class='add'>+</div><div class='add'>+	btrfs_folio_clear_checked(fs_info, folio, block_start,</div><div class='add'>+				  block_end + 1 - block_start);</div><div class='add'>+	btrfs_folio_set_dirty(fs_info, folio, block_start,</div><div class='add'>+			      block_end + 1 - block_start);</div><div class='ctx'> </div><div class='ctx'> 	if (only_release_metadata)</div><div class='del'>-		set_extent_bit(&amp;inode-&gt;io_tree, block_start, block_end,</div><div class='del'>-			       EXTENT_NORESERVE, 0, NULL, NULL, GFP_NOFS, NULL);</div><div class='add'>+		btrfs_set_extent_bit(&amp;inode-&gt;io_tree, block_start, block_end,</div><div class='add'>+				     EXTENT_NORESERVE, &amp;cached_state);</div><div class='add'>+</div><div class='add'>+	btrfs_unlock_extent(io_tree, block_start, block_end, &amp;cached_state);</div><div class='ctx'> </div><div class='ctx'> out_unlock:</div><div class='ctx'> 	if (ret) {</div><div class='hunk'>@@ -5134,8 +5117,8 @@ out_unlock:</div><div class='ctx'> 					block_start, blocksize, true);</div><div class='ctx'> 	}</div><div class='ctx'> 	btrfs_delalloc_release_extents(inode, blocksize);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> out:</div><div class='ctx'> 	if (only_release_metadata)</div><div class='ctx'> 		btrfs_check_nocow_unlock(inode);</div><div class='hunk'>@@ -5143,9 +5126,9 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int maybe_insert_hole(struct btrfs_root *root, struct btrfs_inode *inode,</div><div class='del'>-			     u64 offset, u64 len)</div><div class='add'>+static int maybe_insert_hole(struct btrfs_inode *inode, u64 offset, u64 len)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	struct btrfs_drop_extents_args drop_args = { 0 };</div><div class='hunk'>@@ -5174,19 +5157,18 @@ static int maybe_insert_hole(struct btrfs_root *root, struct btrfs_inode *inode,</div><div class='ctx'> 	drop_args.drop_cache = true;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_drop_extents(trans, root, inode, &amp;drop_args);</div><div class='del'>-	if (ret) {</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		btrfs_end_transaction(trans);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_insert_file_extent(trans, root, btrfs_ino(inode),</div><div class='del'>-			offset, 0, 0, len, 0, len, 0, 0, 0);</div><div class='add'>+	ret = btrfs_insert_hole_extent(trans, root, btrfs_ino(inode), offset, len);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		btrfs_update_inode_bytes(inode, 0, drop_args.bytes_found);</div><div class='del'>-		btrfs_update_inode(trans, root, inode);</div><div class='add'>+		btrfs_update_inode(trans, inode);</div><div class='ctx'> 	}</div><div class='ctx'> 	btrfs_end_transaction(trans);</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -5205,22 +5187,21 @@ int btrfs_cont_expand(struct btrfs_inode *inode, loff_t oldsize, loff_t size)</div><div class='ctx'> 	struct extent_io_tree *io_tree = &amp;inode-&gt;io_tree;</div><div class='ctx'> 	struct extent_map *em = NULL;</div><div class='ctx'> 	struct extent_state *cached_state = NULL;</div><div class='del'>-	struct extent_map_tree *em_tree = &amp;inode-&gt;extent_tree;</div><div class='ctx'> 	u64 hole_start = ALIGN(oldsize, fs_info-&gt;sectorsize);</div><div class='ctx'> 	u64 block_end = ALIGN(size, fs_info-&gt;sectorsize);</div><div class='ctx'> 	u64 last_byte;</div><div class='ctx'> 	u64 cur_offset;</div><div class='ctx'> 	u64 hole_size;</div><div class='del'>-	int err = 0;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If our size started in the middle of a block we need to zero out the</div><div class='ctx'> 	 * rest of the block before we expand the i_size, otherwise we could</div><div class='ctx'> 	 * expose stale data.</div><div class='ctx'> 	 */</div><div class='del'>-	err = btrfs_truncate_block(inode, oldsize, 0, 0);</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='add'>+	ret = btrfs_truncate_block(inode, oldsize, oldsize, -1);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	if (size &lt;= hole_start)</div><div class='ctx'> 		return 0;</div><div class='hunk'>@@ -5229,76 +5210,62 @@ int btrfs_cont_expand(struct btrfs_inode *inode, loff_t oldsize, loff_t size)</div><div class='ctx'> 					   &amp;cached_state);</div><div class='ctx'> 	cur_offset = hole_start;</div><div class='ctx'> 	while (1) {</div><div class='del'>-		em = btrfs_get_extent(inode, NULL, 0, cur_offset,</div><div class='del'>-				      block_end - cur_offset);</div><div class='add'>+		em = btrfs_get_extent(inode, NULL, cur_offset, block_end - cur_offset);</div><div class='ctx'> 		if (IS_ERR(em)) {</div><div class='del'>-			err = PTR_ERR(em);</div><div class='add'>+			ret = PTR_ERR(em);</div><div class='ctx'> 			em = NULL;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-		last_byte = min(extent_map_end(em), block_end);</div><div class='add'>+		last_byte = min(btrfs_extent_map_end(em), block_end);</div><div class='ctx'> 		last_byte = ALIGN(last_byte, fs_info-&gt;sectorsize);</div><div class='ctx'> 		hole_size = last_byte - cur_offset;</div><div class='ctx'> </div><div class='del'>-		if (!test_bit(EXTENT_FLAG_PREALLOC, &amp;em-&gt;flags)) {</div><div class='add'>+		if (!(em-&gt;flags &amp; EXTENT_FLAG_PREALLOC)) {</div><div class='ctx'> 			struct extent_map *hole_em;</div><div class='ctx'> </div><div class='del'>-			err = maybe_insert_hole(root, inode, cur_offset,</div><div class='del'>-						hole_size);</div><div class='del'>-			if (err)</div><div class='add'>+			ret = maybe_insert_hole(inode, cur_offset, hole_size);</div><div class='add'>+			if (ret)</div><div class='ctx'> 				break;</div><div class='ctx'> </div><div class='del'>-			err = btrfs_inode_set_file_extent_range(inode,</div><div class='add'>+			ret = btrfs_inode_set_file_extent_range(inode,</div><div class='ctx'> 							cur_offset, hole_size);</div><div class='del'>-			if (err)</div><div class='add'>+			if (ret)</div><div class='ctx'> 				break;</div><div class='ctx'> </div><div class='del'>-			btrfs_drop_extent_cache(inode, cur_offset,</div><div class='del'>-						cur_offset + hole_size - 1, 0);</div><div class='del'>-			hole_em = alloc_extent_map();</div><div class='add'>+			hole_em = btrfs_alloc_extent_map();</div><div class='ctx'> 			if (!hole_em) {</div><div class='del'>-				set_bit(BTRFS_INODE_NEEDS_FULL_SYNC,</div><div class='del'>-					&amp;inode-&gt;runtime_flags);</div><div class='add'>+				btrfs_drop_extent_map_range(inode, cur_offset,</div><div class='add'>+						    cur_offset + hole_size - 1,</div><div class='add'>+						    false);</div><div class='add'>+				btrfs_set_inode_full_sync(inode);</div><div class='ctx'> 				goto next;</div><div class='ctx'> 			}</div><div class='ctx'> 			hole_em-&gt;start = cur_offset;</div><div class='ctx'> 			hole_em-&gt;len = hole_size;</div><div class='del'>-			hole_em-&gt;orig_start = cur_offset;</div><div class='ctx'> </div><div class='del'>-			hole_em-&gt;block_start = EXTENT_MAP_HOLE;</div><div class='del'>-			hole_em-&gt;block_len = 0;</div><div class='del'>-			hole_em-&gt;orig_block_len = 0;</div><div class='add'>+			hole_em-&gt;disk_bytenr = EXTENT_MAP_HOLE;</div><div class='add'>+			hole_em-&gt;disk_num_bytes = 0;</div><div class='ctx'> 			hole_em-&gt;ram_bytes = hole_size;</div><div class='del'>-			hole_em-&gt;compress_type = BTRFS_COMPRESS_NONE;</div><div class='del'>-			hole_em-&gt;generation = fs_info-&gt;generation;</div><div class='del'>-</div><div class='del'>-			while (1) {</div><div class='del'>-				write_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-				err = add_extent_mapping(em_tree, hole_em, 1);</div><div class='del'>-				write_unlock(&amp;em_tree-&gt;lock);</div><div class='del'>-				if (err != -EEXIST)</div><div class='del'>-					break;</div><div class='del'>-				btrfs_drop_extent_cache(inode, cur_offset,</div><div class='del'>-							cur_offset +</div><div class='del'>-							hole_size - 1, 0);</div><div class='del'>-			}</div><div class='del'>-			free_extent_map(hole_em);</div><div class='add'>+			hole_em-&gt;generation = btrfs_get_fs_generation(fs_info);</div><div class='add'>+</div><div class='add'>+			ret = btrfs_replace_extent_map_range(inode, hole_em, true);</div><div class='add'>+			btrfs_free_extent_map(hole_em);</div><div class='ctx'> 		} else {</div><div class='del'>-			err = btrfs_inode_set_file_extent_range(inode,</div><div class='add'>+			ret = btrfs_inode_set_file_extent_range(inode,</div><div class='ctx'> 							cur_offset, hole_size);</div><div class='del'>-			if (err)</div><div class='add'>+			if (ret)</div><div class='ctx'> 				break;</div><div class='ctx'> 		}</div><div class='ctx'> next:</div><div class='del'>-		free_extent_map(em);</div><div class='add'>+		btrfs_free_extent_map(em);</div><div class='ctx'> 		em = NULL;</div><div class='ctx'> 		cur_offset = last_byte;</div><div class='ctx'> 		if (cur_offset &gt;= block_end)</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='del'>-	free_extent_map(em);</div><div class='del'>-	unlock_extent_cached(io_tree, hole_start, block_end - 1, &amp;cached_state);</div><div class='del'>-	return err;</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='add'>+	btrfs_unlock_extent(io_tree, hole_start, block_end - 1, &amp;cached_state);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int btrfs_setsize(struct inode *inode, struct iattr *attr)</div><div class='hunk'>@@ -5318,9 +5285,10 @@ static int btrfs_setsize(struct inode *inode, struct iattr *attr)</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (newsize != oldsize) {</div><div class='ctx'> 		inode_inc_iversion(inode);</div><div class='del'>-		if (!(mask &amp; (ATTR_CTIME | ATTR_MTIME)))</div><div class='del'>-			inode-&gt;i_ctime = inode-&gt;i_mtime =</div><div class='del'>-				current_time(inode);</div><div class='add'>+		if (!(mask &amp; (ATTR_CTIME | ATTR_MTIME))) {</div><div class='add'>+			inode_set_mtime_to_ts(inode,</div><div class='add'>+					      inode_set_ctime_current(inode));</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (newsize &gt; oldsize) {</div><div class='hunk'>@@ -5347,14 +5315,14 @@ static int btrfs_setsize(struct inode *inode, struct iattr *attr)</div><div class='ctx'> 		i_size_write(inode, newsize);</div><div class='ctx'> 		btrfs_inode_safe_disk_i_size_write(BTRFS_I(inode), 0);</div><div class='ctx'> 		pagecache_isize_extended(inode, oldsize, newsize);</div><div class='del'>-		ret = btrfs_update_inode(trans, root, BTRFS_I(inode));</div><div class='add'>+		ret = btrfs_update_inode(trans, BTRFS_I(inode));</div><div class='ctx'> 		btrfs_drew_write_unlock(&amp;root-&gt;snapshot_lock);</div><div class='ctx'> 		btrfs_end_transaction(trans);</div><div class='ctx'> 	} else {</div><div class='del'>-		struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='add'>+		struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='ctx'> </div><div class='ctx'> 		if (btrfs_is_zoned(fs_info)) {</div><div class='del'>-			ret = btrfs_wait_ordered_range(inode,</div><div class='add'>+			ret = btrfs_wait_ordered_range(BTRFS_I(inode),</div><div class='ctx'> 					ALIGN(newsize, fs_info-&gt;sectorsize),</div><div class='ctx'> 					(u64)-1);</div><div class='ctx'> 			if (ret)</div><div class='hunk'>@@ -5374,9 +5342,9 @@ static int btrfs_setsize(struct inode *inode, struct iattr *attr)</div><div class='ctx'> </div><div class='ctx'> 		inode_dio_wait(inode);</div><div class='ctx'> </div><div class='del'>-		ret = btrfs_truncate(inode, newsize == oldsize);</div><div class='add'>+		ret = btrfs_truncate(BTRFS_I(inode), newsize == oldsize);</div><div class='ctx'> 		if (ret &amp;&amp; inode-&gt;i_nlink) {</div><div class='del'>-			int err;</div><div class='add'>+			int ret2;</div><div class='ctx'> </div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Truncate failed, so fix up the in-memory size. We</div><div class='hunk'>@@ -5384,9 +5352,9 @@ static int btrfs_setsize(struct inode *inode, struct iattr *attr)</div><div class='ctx'> 			 * wait for disk_i_size to be stable and then update the</div><div class='ctx'> 			 * in-memory size to match.</div><div class='ctx'> 			 */</div><div class='del'>-			err = btrfs_wait_ordered_range(inode, 0, (u64)-1);</div><div class='del'>-			if (err)</div><div class='del'>-				return err;</div><div class='add'>+			ret2 = btrfs_wait_ordered_range(BTRFS_I(inode), 0, (u64)-1);</div><div class='add'>+			if (ret2)</div><div class='add'>+				return ret2;</div><div class='ctx'> 			i_size_write(inode, BTRFS_I(inode)-&gt;disk_i_size);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -5394,76 +5362,60 @@ static int btrfs_setsize(struct inode *inode, struct iattr *attr)</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btrfs_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='add'>+static int btrfs_setattr(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 			 struct iattr *attr)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='del'>-	int err;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (btrfs_root_readonly(root))</div><div class='ctx'> 		return -EROFS;</div><div class='ctx'> </div><div class='del'>-	err = setattr_prepare(mnt_userns, dentry, attr);</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='add'>+	ret = setattr_prepare(idmap, dentry, attr);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	if (S_ISREG(inode-&gt;i_mode) &amp;&amp; (attr-&gt;ia_valid &amp; ATTR_SIZE)) {</div><div class='del'>-		err = btrfs_setsize(inode, attr);</div><div class='del'>-		if (err)</div><div class='del'>-			return err;</div><div class='add'>+		ret = btrfs_setsize(inode, attr);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (attr-&gt;ia_valid) {</div><div class='del'>-		setattr_copy(mnt_userns, inode, attr);</div><div class='add'>+		setattr_copy(idmap, inode, attr);</div><div class='ctx'> 		inode_inc_iversion(inode);</div><div class='del'>-		err = btrfs_dirty_inode(inode);</div><div class='add'>+		ret = btrfs_dirty_inode(BTRFS_I(inode));</div><div class='ctx'> </div><div class='del'>-		if (!err &amp;&amp; attr-&gt;ia_valid &amp; ATTR_MODE)</div><div class='del'>-			err = posix_acl_chmod(mnt_userns, inode, inode-&gt;i_mode);</div><div class='add'>+		if (!ret &amp;&amp; attr-&gt;ia_valid &amp; ATTR_MODE)</div><div class='add'>+			ret = posix_acl_chmod(idmap, dentry, inode-&gt;i_mode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return err;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * While truncating the inode pages during eviction, we get the VFS calling</div><div class='del'>- * btrfs_invalidatepage() against each page of the inode. This is slow because</div><div class='del'>- * the calls to btrfs_invalidatepage() result in a huge amount of calls to</div><div class='del'>- * lock_extent_bits() and clear_extent_bit(), which keep merging and splitting</div><div class='del'>- * extent_state structures over and over, wasting lots of time.</div><div class='add'>+ * While truncating the inode pages during eviction, we get the VFS</div><div class='add'>+ * calling btrfs_invalidate_folio() against each folio of the inode. This</div><div class='add'>+ * is slow because the calls to btrfs_invalidate_folio() result in a</div><div class='add'>+ * huge amount of calls to lock_extent() and clear_extent_bit(),</div><div class='add'>+ * which keep merging and splitting extent_state structures over and over,</div><div class='add'>+ * wasting lots of time.</div><div class='ctx'>  *</div><div class='del'>- * Therefore if the inode is being evicted, let btrfs_invalidatepage() skip all</div><div class='del'>- * those expensive operations on a per page basis and do only the ordered io</div><div class='del'>- * finishing, while we release here the extent_map and extent_state structures,</div><div class='del'>- * without the excessive merging and splitting.</div><div class='add'>+ * Therefore if the inode is being evicted, let btrfs_invalidate_folio()</div><div class='add'>+ * skip all those expensive operations on a per folio basis and do only</div><div class='add'>+ * the ordered io finishing, while we release here the extent_map and</div><div class='add'>+ * extent_state structures, without the excessive merging and splitting.</div><div class='ctx'>  */</div><div class='ctx'> static void evict_inode_truncate_pages(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct extent_io_tree *io_tree = &amp;BTRFS_I(inode)-&gt;io_tree;</div><div class='del'>-	struct extent_map_tree *map_tree = &amp;BTRFS_I(inode)-&gt;extent_tree;</div><div class='ctx'> 	struct rb_node *node;</div><div class='ctx'> </div><div class='del'>-	ASSERT(inode-&gt;i_state &amp; I_FREEING);</div><div class='add'>+	ASSERT(inode_state_read_once(inode) &amp; I_FREEING);</div><div class='ctx'> 	truncate_inode_pages_final(&amp;inode-&gt;i_data);</div><div class='ctx'> </div><div class='del'>-	write_lock(&amp;map_tree-&gt;lock);</div><div class='del'>-	while (!RB_EMPTY_ROOT(&amp;map_tree-&gt;map.rb_root)) {</div><div class='del'>-		struct extent_map *em;</div><div class='del'>-</div><div class='del'>-		node = rb_first_cached(&amp;map_tree-&gt;map);</div><div class='del'>-		em = rb_entry(node, struct extent_map, rb_node);</div><div class='del'>-		clear_bit(EXTENT_FLAG_PINNED, &amp;em-&gt;flags);</div><div class='del'>-		clear_bit(EXTENT_FLAG_LOGGING, &amp;em-&gt;flags);</div><div class='del'>-		remove_extent_mapping(map_tree, em);</div><div class='del'>-		free_extent_map(em);</div><div class='del'>-		if (need_resched()) {</div><div class='del'>-			write_unlock(&amp;map_tree-&gt;lock);</div><div class='del'>-			cond_resched();</div><div class='del'>-			write_lock(&amp;map_tree-&gt;lock);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	write_unlock(&amp;map_tree-&gt;lock);</div><div class='add'>+	btrfs_drop_extent_map_range(BTRFS_I(inode), 0, (u64)-1, false);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Keep looping until we have no more ranges in the io tree.</div><div class='hunk'>@@ -5496,24 +5448,23 @@ static void evict_inode_truncate_pages(struct inode *inode)</div><div class='ctx'> 		state_flags = state-&gt;state;</div><div class='ctx'> 		spin_unlock(&amp;io_tree-&gt;lock);</div><div class='ctx'> </div><div class='del'>-		lock_extent_bits(io_tree, start, end, &amp;cached_state);</div><div class='add'>+		btrfs_lock_extent(io_tree, start, end, &amp;cached_state);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * If still has DELALLOC flag, the extent didn't reach disk,</div><div class='ctx'> 		 * and its reserved space won't be freed by delayed_ref.</div><div class='ctx'> 		 * So we need to free its reserved space here.</div><div class='del'>-		 * (Refer to comment in btrfs_invalidatepage, case 2)</div><div class='add'>+		 * (Refer to comment in btrfs_invalidate_folio, case 2)</div><div class='ctx'> 		 *</div><div class='ctx'> 		 * Note, end is the bytenr of last byte, so we need + 1 here.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (state_flags &amp; EXTENT_DELALLOC)</div><div class='ctx'> 			btrfs_qgroup_free_data(BTRFS_I(inode), NULL, start,</div><div class='del'>-					       end - start + 1);</div><div class='add'>+					       end - start + 1, NULL);</div><div class='ctx'> </div><div class='del'>-		clear_extent_bit(io_tree, start, end,</div><div class='del'>-				 EXTENT_LOCKED | EXTENT_DELALLOC |</div><div class='del'>-				 EXTENT_DO_ACCOUNTING | EXTENT_DEFRAG, 1, 1,</div><div class='del'>-				 &amp;cached_state);</div><div class='add'>+		btrfs_clear_extent_bit(io_tree, start, end,</div><div class='add'>+				       EXTENT_CLEAR_ALL_BITS | EXTENT_DO_ACCOUNTING,</div><div class='add'>+				       &amp;cached_state);</div><div class='ctx'> </div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 		spin_lock(&amp;io_tree-&gt;lock);</div><div class='hunk'>@@ -5525,9 +5476,8 @@ static struct btrfs_trans_handle *evict_refill_and_join(struct btrfs_root *root,</div><div class='ctx'> 							struct btrfs_block_rsv *rsv)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='del'>-	struct btrfs_block_rsv *global_rsv = &amp;fs_info-&gt;global_block_rsv;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='del'>-	u64 delayed_refs_extra = btrfs_calc_insert_metadata_size(fs_info, 1);</div><div class='add'>+	u64 delayed_refs_extra = btrfs_calc_delayed_ref_bytes(fs_info, 1);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -5540,18 +5490,16 @@ static struct btrfs_trans_handle *evict_refill_and_join(struct btrfs_root *root,</div><div class='ctx'> 	 * above.  We reserve our extra bit here because we generate a ton of</div><div class='ctx'> 	 * delayed refs activity by truncating.</div><div class='ctx'> 	 *</div><div class='del'>-	 * If we cannot make our reservation we'll attempt to steal from the</div><div class='del'>-	 * global reserve, because we really want to be able to free up space.</div><div class='add'>+	 * BTRFS_RESERVE_FLUSH_EVICT will steal from the global_rsv if it can,</div><div class='add'>+	 * if we fail to make this reservation we can re-try without the</div><div class='add'>+	 * delayed_refs_extra so we can make some forward progress.</div><div class='ctx'> 	 */</div><div class='del'>-	ret = btrfs_block_rsv_refill(root, rsv, rsv-&gt;size + delayed_refs_extra,</div><div class='add'>+	ret = btrfs_block_rsv_refill(fs_info, rsv, rsv-&gt;size + delayed_refs_extra,</div><div class='ctx'> 				     BTRFS_RESERVE_FLUSH_EVICT);</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		/*</div><div class='del'>-		 * Try to steal from the global reserve if there is space for</div><div class='del'>-		 * it.</div><div class='del'>-		 */</div><div class='del'>-		if (btrfs_check_space_for_delayed_refs(fs_info) ||</div><div class='del'>-		    btrfs_block_rsv_migrate(global_rsv, rsv, rsv-&gt;size, 0)) {</div><div class='add'>+		ret = btrfs_block_rsv_refill(fs_info, rsv, rsv-&gt;size,</div><div class='add'>+					     BTRFS_RESERVE_FLUSH_EVICT);</div><div class='add'>+		if (ret) {</div><div class='ctx'> 			btrfs_warn(fs_info,</div><div class='ctx'> 				   "could not allocate space for delete; will truncate on mount");</div><div class='ctx'> 			return ERR_PTR(-ENOSPC);</div><div class='hunk'>@@ -5567,17 +5515,17 @@ static struct btrfs_trans_handle *evict_refill_and_join(struct btrfs_root *root,</div><div class='ctx'> 		trans-&gt;block_rsv = &amp;fs_info-&gt;trans_block_rsv;</div><div class='ctx'> 		trans-&gt;bytes_reserved = delayed_refs_extra;</div><div class='ctx'> 		btrfs_block_rsv_migrate(rsv, trans-&gt;block_rsv,</div><div class='del'>-					delayed_refs_extra, 1);</div><div class='add'>+					delayed_refs_extra, true);</div><div class='ctx'> 	}</div><div class='ctx'> 	return trans;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_evict_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='add'>+	struct btrfs_fs_info *fs_info;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='del'>-	struct btrfs_block_rsv *rsv;</div><div class='add'>+	struct btrfs_block_rsv rsv;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	trace_btrfs_inode_evict(inode);</div><div class='hunk'>@@ -5588,54 +5536,74 @@ void btrfs_evict_inode(struct inode *inode)</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	fs_info = inode_to_fs_info(inode);</div><div class='ctx'> 	evict_inode_truncate_pages(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (inode-&gt;i_nlink &amp;&amp;</div><div class='ctx'> 	    ((btrfs_root_refs(&amp;root-&gt;root_item) != 0 &amp;&amp;</div><div class='del'>-	      root-&gt;root_key.objectid != BTRFS_ROOT_TREE_OBJECTID) ||</div><div class='add'>+	      btrfs_root_id(root) != BTRFS_ROOT_TREE_OBJECTID) ||</div><div class='ctx'> 	     btrfs_is_free_space_inode(BTRFS_I(inode))))</div><div class='del'>-		goto no_delete;</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='ctx'> 	if (is_bad_inode(inode))</div><div class='del'>-		goto no_delete;</div><div class='del'>-</div><div class='del'>-	btrfs_free_io_failure_record(BTRFS_I(inode), 0, (u64)-1);</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='ctx'> 	if (test_bit(BTRFS_FS_LOG_RECOVERING, &amp;fs_info-&gt;flags))</div><div class='del'>-		goto no_delete;</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='ctx'> 	if (inode-&gt;i_nlink &gt; 0) {</div><div class='ctx'> 		BUG_ON(btrfs_root_refs(&amp;root-&gt;root_item) != 0 &amp;&amp;</div><div class='del'>-		       root-&gt;root_key.objectid != BTRFS_ROOT_TREE_OBJECTID);</div><div class='del'>-		goto no_delete;</div><div class='add'>+		       btrfs_root_id(root) != BTRFS_ROOT_TREE_OBJECTID);</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * This makes sure the inode item in tree is uptodate and the space for</div><div class='add'>+	 * the inode update is released.</div><div class='add'>+	 */</div><div class='ctx'> 	ret = btrfs_commit_inode_delayed_inode(BTRFS_I(inode));</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto no_delete;</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This drops any pending insert or delete operations we have for this</div><div class='add'>+	 * inode.  We could have a delayed dir index deletion queued up, but</div><div class='add'>+	 * we're removing the inode completely so that'll be taken care of in</div><div class='add'>+	 * the truncate.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_kill_delayed_inode_items(BTRFS_I(inode));</div><div class='ctx'> </div><div class='del'>-	rsv = btrfs_alloc_block_rsv(fs_info, BTRFS_BLOCK_RSV_TEMP);</div><div class='del'>-	if (!rsv)</div><div class='del'>-		goto no_delete;</div><div class='del'>-	rsv-&gt;size = btrfs_calc_metadata_size(fs_info, 1);</div><div class='del'>-	rsv-&gt;failfast = 1;</div><div class='add'>+	btrfs_init_metadata_block_rsv(fs_info, &amp;rsv, BTRFS_BLOCK_RSV_TEMP);</div><div class='add'>+	rsv.size = btrfs_calc_metadata_size(fs_info, 1);</div><div class='add'>+	rsv.failfast = true;</div><div class='ctx'> </div><div class='ctx'> 	btrfs_i_size_write(BTRFS_I(inode), 0);</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='del'>-		trans = evict_refill_and_join(root, rsv);</div><div class='add'>+		struct btrfs_truncate_control control = {</div><div class='add'>+			.inode = BTRFS_I(inode),</div><div class='add'>+			.ino = btrfs_ino(BTRFS_I(inode)),</div><div class='add'>+			.new_size = 0,</div><div class='add'>+			.min_type = 0,</div><div class='add'>+		};</div><div class='add'>+</div><div class='add'>+		trans = evict_refill_and_join(root, &amp;rsv);</div><div class='ctx'> 		if (IS_ERR(trans))</div><div class='del'>-			goto free_rsv;</div><div class='add'>+			goto out_release;</div><div class='ctx'> </div><div class='del'>-		trans-&gt;block_rsv = rsv;</div><div class='add'>+		trans-&gt;block_rsv = &amp;rsv;</div><div class='ctx'> </div><div class='del'>-		ret = btrfs_truncate_inode_items(trans, root, BTRFS_I(inode),</div><div class='del'>-						 0, 0, NULL);</div><div class='add'>+		ret = btrfs_truncate_inode_items(trans, root, &amp;control);</div><div class='ctx'> 		trans-&gt;block_rsv = &amp;fs_info-&gt;trans_block_rsv;</div><div class='ctx'> 		btrfs_end_transaction(trans);</div><div class='del'>-		btrfs_btree_balance_dirty(fs_info);</div><div class='add'>+		/*</div><div class='add'>+		 * We have not added new delayed items for our inode after we</div><div class='add'>+		 * have flushed its delayed items, so no need to throttle on</div><div class='add'>+		 * delayed items. However we have modified extent buffers.</div><div class='add'>+		 */</div><div class='add'>+		btrfs_btree_balance_dirty_nodelay(fs_info);</div><div class='ctx'> 		if (ret &amp;&amp; ret != -ENOSPC &amp;&amp; ret != -EAGAIN)</div><div class='del'>-			goto free_rsv;</div><div class='add'>+			goto out_release;</div><div class='ctx'> 		else if (!ret)</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -5649,17 +5617,17 @@ void btrfs_evict_inode(struct inode *inode)</div><div class='ctx'> 	 * If it turns out that we are dropping too many of these, we might want</div><div class='ctx'> 	 * to add a mechanism for retrying these after a commit.</div><div class='ctx'> 	 */</div><div class='del'>-	trans = evict_refill_and_join(root, rsv);</div><div class='add'>+	trans = evict_refill_and_join(root, &amp;rsv);</div><div class='ctx'> 	if (!IS_ERR(trans)) {</div><div class='del'>-		trans-&gt;block_rsv = rsv;</div><div class='add'>+		trans-&gt;block_rsv = &amp;rsv;</div><div class='ctx'> 		btrfs_orphan_del(trans, BTRFS_I(inode));</div><div class='ctx'> 		trans-&gt;block_rsv = &amp;fs_info-&gt;trans_block_rsv;</div><div class='ctx'> 		btrfs_end_transaction(trans);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-free_rsv:</div><div class='del'>-	btrfs_free_block_rsv(fs_info, rsv);</div><div class='del'>-no_delete:</div><div class='add'>+out_release:</div><div class='add'>+	btrfs_block_rsv_release(fs_info, &amp;rsv, (u64)-1, NULL);</div><div class='add'>+out:</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If we didn't successfully delete, the orphan item will still be in</div><div class='ctx'> 	 * the tree and we'll retry on the next mount. Again, we might also want</div><div class='hunk'>@@ -5677,40 +5645,50 @@ no_delete:</div><div class='ctx'>  * If no dir entries were found, returns -ENOENT.</div><div class='ctx'>  * If found a corrupted location in dir entry, returns -EUCLEAN.</div><div class='ctx'>  */</div><div class='del'>-static int btrfs_inode_by_name(struct inode *dir, struct dentry *dentry,</div><div class='add'>+static int btrfs_inode_by_name(struct btrfs_inode *dir, struct dentry *dentry,</div><div class='ctx'> 			       struct btrfs_key *location, u8 *type)</div><div class='ctx'> {</div><div class='del'>-	const char *name = dentry-&gt;d_name.name;</div><div class='del'>-	int namelen = dentry-&gt;d_name.len;</div><div class='ctx'> 	struct btrfs_dir_item *di;</div><div class='del'>-	struct btrfs_path *path;</div><div class='del'>-	struct btrfs_root *root = BTRFS_I(dir)-&gt;root;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='add'>+	struct btrfs_root *root = dir-&gt;root;</div><div class='ctx'> 	int ret = 0;</div><div class='add'>+	struct fscrypt_name fname;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	di = btrfs_lookup_dir_item(NULL, root, path, btrfs_ino(BTRFS_I(dir)),</div><div class='del'>-			name, namelen, 0);</div><div class='add'>+	ret = fscrypt_setup_filename(&amp;dir-&gt;vfs_inode, &amp;dentry-&gt;d_name, 1, &amp;fname);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+	/*</div><div class='add'>+	 * fscrypt_setup_filename() should never return a positive value, but</div><div class='add'>+	 * gcc on sparc/parisc thinks it can, so assert that doesn't happen.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(ret == 0);</div><div class='add'>+</div><div class='add'>+	/* This needs to handle no-key deletions later on */</div><div class='add'>+</div><div class='add'>+	di = btrfs_lookup_dir_item(NULL, root, path, btrfs_ino(dir),</div><div class='add'>+				   &amp;fname.disk_name, 0);</div><div class='ctx'> 	if (IS_ERR_OR_NULL(di)) {</div><div class='ctx'> 		ret = di ? PTR_ERR(di) : -ENOENT;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	btrfs_dir_item_key_to_cpu(path-&gt;nodes[0], di, location);</div><div class='del'>-	if (location-&gt;type != BTRFS_INODE_ITEM_KEY &amp;&amp;</div><div class='del'>-	    location-&gt;type != BTRFS_ROOT_ITEM_KEY) {</div><div class='add'>+	if (unlikely(location-&gt;type != BTRFS_INODE_ITEM_KEY &amp;&amp;</div><div class='add'>+		     location-&gt;type != BTRFS_ROOT_ITEM_KEY)) {</div><div class='ctx'> 		ret = -EUCLEAN;</div><div class='ctx'> 		btrfs_warn(root-&gt;fs_info,</div><div class='del'>-"%s gets something invalid in DIR_ITEM (name %s, directory ino %llu, location(%llu %u %llu))",</div><div class='del'>-			   __func__, name, btrfs_ino(BTRFS_I(dir)),</div><div class='del'>-			   location-&gt;objectid, location-&gt;type, location-&gt;offset);</div><div class='add'>+"%s gets something invalid in DIR_ITEM (name %s, directory ino %llu, location " BTRFS_KEY_FMT ")",</div><div class='add'>+			   __func__, fname.disk_name.name, btrfs_ino(dir),</div><div class='add'>+			   BTRFS_KEY_FMT_VALUE(location));</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!ret)</div><div class='del'>-		*type = btrfs_dir_type(path-&gt;nodes[0], di);</div><div class='add'>+		*type = btrfs_dir_ftype(path-&gt;nodes[0], di);</div><div class='ctx'> out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='add'>+	fscrypt_free_filename(&amp;fname);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5720,18 +5698,23 @@ out:</div><div class='ctx'>  * is kind of like crossing a mount point.</div><div class='ctx'>  */</div><div class='ctx'> static int fixup_tree_root_location(struct btrfs_fs_info *fs_info,</div><div class='del'>-				    struct inode *dir,</div><div class='add'>+				    struct btrfs_inode *dir,</div><div class='ctx'> 				    struct dentry *dentry,</div><div class='ctx'> 				    struct btrfs_key *location,</div><div class='ctx'> 				    struct btrfs_root **sub_root)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_root *new_root;</div><div class='ctx'> 	struct btrfs_root_ref *ref;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int err = 0;</div><div class='add'>+	struct fscrypt_name fname;</div><div class='add'>+</div><div class='add'>+	ret = fscrypt_setup_filename(&amp;dir-&gt;vfs_inode, &amp;dentry-&gt;d_name, 0, &amp;fname);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path) {</div><div class='hunk'>@@ -5740,7 +5723,7 @@ static int fixup_tree_root_location(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	err = -ENOENT;</div><div class='del'>-	key.objectid = BTRFS_I(dir)-&gt;root-&gt;root_key.objectid;</div><div class='add'>+	key.objectid = btrfs_root_id(dir-&gt;root);</div><div class='ctx'> 	key.type = BTRFS_ROOT_REF_KEY;</div><div class='ctx'> 	key.offset = location-&gt;objectid;</div><div class='ctx'> </div><div class='hunk'>@@ -5753,13 +5736,12 @@ static int fixup_tree_root_location(struct btrfs_fs_info *fs_info,</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	ref = btrfs_item_ptr(leaf, path-&gt;slots[0], struct btrfs_root_ref);</div><div class='del'>-	if (btrfs_root_ref_dirid(leaf, ref) != btrfs_ino(BTRFS_I(dir)) ||</div><div class='del'>-	    btrfs_root_ref_name_len(leaf, ref) != dentry-&gt;d_name.len)</div><div class='add'>+	if (btrfs_root_ref_dirid(leaf, ref) != btrfs_ino(dir) ||</div><div class='add'>+	    btrfs_root_ref_name_len(leaf, ref) != fname.disk_name.len)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	ret = memcmp_extent_buffer(leaf, dentry-&gt;d_name.name,</div><div class='del'>-				   (unsigned long)(ref + 1),</div><div class='del'>-				   dentry-&gt;d_name.len);</div><div class='add'>+	ret = memcmp_extent_buffer(leaf, fname.disk_name.name,</div><div class='add'>+				   (unsigned long)(ref + 1), fname.disk_name.len);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -5777,63 +5759,38 @@ static int fixup_tree_root_location(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	location-&gt;offset = 0;</div><div class='ctx'> 	err = 0;</div><div class='ctx'> out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='add'>+	fscrypt_free_filename(&amp;fname);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void inode_tree_add(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='del'>-	struct btrfs_inode *entry;</div><div class='del'>-	struct rb_node **p;</div><div class='del'>-	struct rb_node *parent;</div><div class='del'>-	struct rb_node *new = &amp;BTRFS_I(inode)-&gt;rb_node;</div><div class='del'>-	u64 ino = btrfs_ino(BTRFS_I(inode));</div><div class='ctx'> </div><div class='del'>-	if (inode_unhashed(inode))</div><div class='del'>-		return;</div><div class='del'>-	parent = NULL;</div><div class='del'>-	spin_lock(&amp;root-&gt;inode_lock);</div><div class='del'>-	p = &amp;root-&gt;inode_tree.rb_node;</div><div class='del'>-	while (*p) {</div><div class='del'>-		parent = *p;</div><div class='del'>-		entry = rb_entry(parent, struct btrfs_inode, rb_node);</div><div class='del'>-</div><div class='del'>-		if (ino &lt; btrfs_ino(entry))</div><div class='del'>-			p = &amp;parent-&gt;rb_left;</div><div class='del'>-		else if (ino &gt; btrfs_ino(entry))</div><div class='del'>-			p = &amp;parent-&gt;rb_right;</div><div class='del'>-		else {</div><div class='del'>-			WARN_ON(!(entry-&gt;vfs_inode.i_state &amp;</div><div class='del'>-				  (I_WILL_FREE | I_FREEING)));</div><div class='del'>-			rb_replace_node(parent, new, &amp;root-&gt;inode_tree);</div><div class='del'>-			RB_CLEAR_NODE(parent);</div><div class='del'>-			spin_unlock(&amp;root-&gt;inode_lock);</div><div class='del'>-			return;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	rb_link_node(new, parent, p);</div><div class='del'>-	rb_insert_color(new, &amp;root-&gt;inode_tree);</div><div class='del'>-	spin_unlock(&amp;root-&gt;inode_lock);</div><div class='del'>-}</div><div class='ctx'> </div><div class='del'>-static void inode_tree_del(struct btrfs_inode *inode)</div><div class='add'>+static void btrfs_del_inode_from_root(struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root = inode-&gt;root;</div><div class='del'>-	int empty = 0;</div><div class='add'>+	struct btrfs_inode *entry;</div><div class='add'>+	bool empty = false;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;root-&gt;inode_lock);</div><div class='del'>-	if (!RB_EMPTY_NODE(&amp;inode-&gt;rb_node)) {</div><div class='del'>-		rb_erase(&amp;inode-&gt;rb_node, &amp;root-&gt;inode_tree);</div><div class='del'>-		RB_CLEAR_NODE(&amp;inode-&gt;rb_node);</div><div class='del'>-		empty = RB_EMPTY_ROOT(&amp;root-&gt;inode_tree);</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;root-&gt;inode_lock);</div><div class='add'>+	xa_lock(&amp;root-&gt;inodes);</div><div class='add'>+	/*</div><div class='add'>+	 * This btrfs_inode is being freed and has already been unhashed at this</div><div class='add'>+	 * point. It's possible that another btrfs_inode has already been</div><div class='add'>+	 * allocated for the same inode and inserted itself into the root, so</div><div class='add'>+	 * don't delete it in that case.</div><div class='add'>+	 *</div><div class='add'>+	 * Note that this shouldn't need to allocate memory, so the gfp flags</div><div class='add'>+	 * don't really matter.</div><div class='add'>+	 */</div><div class='add'>+	entry = __xa_cmpxchg(&amp;root-&gt;inodes, btrfs_ino(inode), inode, NULL,</div><div class='add'>+			     GFP_ATOMIC);</div><div class='add'>+	if (entry == inode)</div><div class='add'>+		empty = xa_empty(&amp;root-&gt;inodes);</div><div class='add'>+	xa_unlock(&amp;root-&gt;inodes);</div><div class='ctx'> </div><div class='ctx'> 	if (empty &amp;&amp; btrfs_root_refs(&amp;root-&gt;root_item) == 0) {</div><div class='del'>-		spin_lock(&amp;root-&gt;inode_lock);</div><div class='del'>-		empty = RB_EMPTY_ROOT(&amp;root-&gt;inode_tree);</div><div class='del'>-		spin_unlock(&amp;root-&gt;inode_lock);</div><div class='add'>+		xa_lock(&amp;root-&gt;inodes);</div><div class='add'>+		empty = xa_empty(&amp;root-&gt;inodes);</div><div class='add'>+		xa_unlock(&amp;root-&gt;inodes);</div><div class='ctx'> 		if (empty)</div><div class='ctx'> 			btrfs_add_dead_root(root);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -5844,12 +5801,13 @@ static int btrfs_init_locked_inode(struct inode *inode, void *p)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_iget_args *args = p;</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_ino = args-&gt;ino;</div><div class='del'>-	BTRFS_I(inode)-&gt;location.objectid = args-&gt;ino;</div><div class='del'>-	BTRFS_I(inode)-&gt;location.type = BTRFS_INODE_ITEM_KEY;</div><div class='del'>-	BTRFS_I(inode)-&gt;location.offset = 0;</div><div class='add'>+	btrfs_set_inode_number(BTRFS_I(inode), args-&gt;ino);</div><div class='ctx'> 	BTRFS_I(inode)-&gt;root = btrfs_grab_root(args-&gt;root);</div><div class='del'>-	BUG_ON(args-&gt;root &amp;&amp; !BTRFS_I(inode)-&gt;root);</div><div class='add'>+</div><div class='add'>+	if (args-&gt;root &amp;&amp; args-&gt;root == args-&gt;root-&gt;fs_info-&gt;tree_root &amp;&amp;</div><div class='add'>+	    args-&gt;ino != BTRFS_BTREE_INODE_OBJECTID)</div><div class='add'>+		set_bit(BTRFS_INODE_FREE_SPACE_INODE,</div><div class='add'>+			&amp;BTRFS_I(inode)-&gt;runtime_flags);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5857,12 +5815,11 @@ static int btrfs_find_actor(struct inode *inode, void *opaque)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_iget_args *args = opaque;</div><div class='ctx'> </div><div class='del'>-	return args-&gt;ino == BTRFS_I(inode)-&gt;location.objectid &amp;&amp;</div><div class='add'>+	return args-&gt;ino == btrfs_ino(BTRFS_I(inode)) &amp;&amp;</div><div class='ctx'> 		args-&gt;root == BTRFS_I(inode)-&gt;root;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct inode *btrfs_iget_locked(struct super_block *s, u64 ino,</div><div class='del'>-				       struct btrfs_root *root)</div><div class='add'>+static struct btrfs_inode *btrfs_iget_locked(u64 ino, struct btrfs_root *root)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct btrfs_iget_args args;</div><div class='hunk'>@@ -5871,162 +5828,188 @@ static struct inode *btrfs_iget_locked(struct super_block *s, u64 ino,</div><div class='ctx'> 	args.ino = ino;</div><div class='ctx'> 	args.root = root;</div><div class='ctx'> </div><div class='del'>-	inode = iget5_locked(s, hashval, btrfs_find_actor,</div><div class='add'>+	inode = iget5_locked_rcu(root-&gt;fs_info-&gt;sb, hashval, btrfs_find_actor,</div><div class='ctx'> 			     btrfs_init_locked_inode,</div><div class='ctx'> 			     (void *)&amp;args);</div><div class='del'>-	return inode;</div><div class='add'>+	if (!inode)</div><div class='add'>+		return NULL;</div><div class='add'>+	return BTRFS_I(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Get an inode object given its inode number and corresponding root.</div><div class='del'>- * Path can be preallocated to prevent recursing back to iget through</div><div class='del'>- * allocator. NULL is also valid but may require an additional allocation</div><div class='del'>- * later.</div><div class='add'>+ * Get an inode object given its inode number and corresponding root.  Path is</div><div class='add'>+ * preallocated to prevent recursing back to iget through allocator.</div><div class='ctx'>  */</div><div class='del'>-struct inode *btrfs_iget_path(struct super_block *s, u64 ino,</div><div class='del'>-			      struct btrfs_root *root, struct btrfs_path *path)</div><div class='add'>+struct btrfs_inode *btrfs_iget_path(u64 ino, struct btrfs_root *root,</div><div class='add'>+				    struct btrfs_path *path)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode;</div><div class='add'>+	struct btrfs_inode *inode;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	inode = btrfs_iget_locked(s, ino, root);</div><div class='add'>+	inode = btrfs_iget_locked(ino, root);</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='del'>-	if (inode-&gt;i_state &amp; I_NEW) {</div><div class='del'>-		int ret;</div><div class='add'>+	if (!(inode_state_read_once(&amp;inode-&gt;vfs_inode) &amp; I_NEW))</div><div class='add'>+		return inode;</div><div class='ctx'> </div><div class='del'>-		ret = btrfs_read_locked_inode(inode, path);</div><div class='del'>-		if (!ret) {</div><div class='del'>-			inode_tree_add(inode);</div><div class='del'>-			unlock_new_inode(inode);</div><div class='del'>-		} else {</div><div class='del'>-			iget_failed(inode);</div><div class='del'>-			/*</div><div class='del'>-			 * ret &gt; 0 can come from btrfs_search_slot called by</div><div class='del'>-			 * btrfs_read_locked_inode, this means the inode item</div><div class='del'>-			 * was not found.</div><div class='del'>-			 */</div><div class='del'>-			if (ret &gt; 0)</div><div class='del'>-				ret = -ENOENT;</div><div class='del'>-			inode = ERR_PTR(ret);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	ret = btrfs_read_locked_inode(inode, path);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ERR_PTR(ret);</div><div class='ctx'> </div><div class='add'>+	unlock_new_inode(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> 	return inode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct inode *btrfs_iget(struct super_block *s, u64 ino, struct btrfs_root *root)</div><div class='add'>+/*</div><div class='add'>+ * Get an inode object given its inode number and corresponding root.</div><div class='add'>+ */</div><div class='add'>+struct btrfs_inode *btrfs_iget(u64 ino, struct btrfs_root *root)</div><div class='ctx'> {</div><div class='del'>-	return btrfs_iget_path(s, ino, root, NULL);</div><div class='add'>+	struct btrfs_inode *inode;</div><div class='add'>+	struct btrfs_path *path;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	inode = btrfs_iget_locked(ino, root);</div><div class='add'>+	if (!inode)</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+</div><div class='add'>+	if (!(inode_state_read_once(&amp;inode-&gt;vfs_inode) &amp; I_NEW))</div><div class='add'>+		return inode;</div><div class='add'>+</div><div class='add'>+	path = btrfs_alloc_path();</div><div class='add'>+	if (!path) {</div><div class='add'>+		iget_failed(&amp;inode-&gt;vfs_inode);</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_read_locked_inode(inode, path);</div><div class='add'>+	btrfs_free_path(path);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ERR_PTR(ret);</div><div class='add'>+</div><div class='add'>+	if (S_ISDIR(inode-&gt;vfs_inode.i_mode))</div><div class='add'>+		inode-&gt;vfs_inode.i_opflags |= IOP_FASTPERM_MAY_EXEC;</div><div class='add'>+	unlock_new_inode(&amp;inode-&gt;vfs_inode);</div><div class='add'>+	return inode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct inode *new_simple_dir(struct super_block *s,</div><div class='del'>-				    struct btrfs_key *key,</div><div class='del'>-				    struct btrfs_root *root)</div><div class='add'>+static struct btrfs_inode *new_simple_dir(struct inode *dir,</div><div class='add'>+					  struct btrfs_key *key,</div><div class='add'>+					  struct btrfs_root *root)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = new_inode(s);</div><div class='add'>+	struct timespec64 ts;</div><div class='add'>+	struct inode *vfs_inode;</div><div class='add'>+	struct btrfs_inode *inode;</div><div class='ctx'> </div><div class='del'>-	if (!inode)</div><div class='add'>+	vfs_inode = new_inode(dir-&gt;i_sb);</div><div class='add'>+	if (!vfs_inode)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='del'>-	BTRFS_I(inode)-&gt;root = btrfs_grab_root(root);</div><div class='del'>-	memcpy(&amp;BTRFS_I(inode)-&gt;location, key, sizeof(*key));</div><div class='del'>-	set_bit(BTRFS_INODE_DUMMY, &amp;BTRFS_I(inode)-&gt;runtime_flags);</div><div class='add'>+	inode = BTRFS_I(vfs_inode);</div><div class='add'>+	inode-&gt;root = btrfs_grab_root(root);</div><div class='add'>+	inode-&gt;ref_root_id = key-&gt;objectid;</div><div class='add'>+	set_bit(BTRFS_INODE_ROOT_STUB, &amp;inode-&gt;runtime_flags);</div><div class='add'>+	set_bit(BTRFS_INODE_DUMMY, &amp;inode-&gt;runtime_flags);</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_ino = BTRFS_EMPTY_SUBVOL_DIR_OBJECTID;</div><div class='add'>+	btrfs_set_inode_number(inode, BTRFS_EMPTY_SUBVOL_DIR_OBJECTID);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We only need lookup, the rest is read-only and there's no inode</div><div class='ctx'> 	 * associated with the dentry</div><div class='ctx'> 	 */</div><div class='del'>-	inode-&gt;i_op = &amp;simple_dir_inode_operations;</div><div class='del'>-	inode-&gt;i_opflags &amp;= ~IOP_XATTR;</div><div class='del'>-	inode-&gt;i_fop = &amp;simple_dir_operations;</div><div class='del'>-	inode-&gt;i_mode = S_IFDIR | S_IRUGO | S_IWUSR | S_IXUGO;</div><div class='del'>-	inode-&gt;i_mtime = current_time(inode);</div><div class='del'>-	inode-&gt;i_atime = inode-&gt;i_mtime;</div><div class='del'>-	inode-&gt;i_ctime = inode-&gt;i_mtime;</div><div class='del'>-	BTRFS_I(inode)-&gt;i_otime = inode-&gt;i_mtime;</div><div class='add'>+	vfs_inode-&gt;i_op = &amp;simple_dir_inode_operations;</div><div class='add'>+	vfs_inode-&gt;i_opflags &amp;= ~IOP_XATTR;</div><div class='add'>+	vfs_inode-&gt;i_fop = &amp;simple_dir_operations;</div><div class='add'>+	vfs_inode-&gt;i_mode = S_IFDIR | S_IRUGO | S_IWUSR | S_IXUGO;</div><div class='add'>+</div><div class='add'>+	ts = inode_set_ctime_current(vfs_inode);</div><div class='add'>+	inode_set_mtime_to_ts(vfs_inode, ts);</div><div class='add'>+	inode_set_atime_to_ts(vfs_inode, inode_get_atime(dir));</div><div class='add'>+	inode-&gt;i_otime_sec = ts.tv_sec;</div><div class='add'>+	inode-&gt;i_otime_nsec = ts.tv_nsec;</div><div class='add'>+</div><div class='add'>+	vfs_inode-&gt;i_uid = dir-&gt;i_uid;</div><div class='add'>+	vfs_inode-&gt;i_gid = dir-&gt;i_gid;</div><div class='ctx'> </div><div class='ctx'> 	return inode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u8 btrfs_inode_type(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	/*</div><div class='del'>-	 * Compile-time asserts that generic FT_* types still match</div><div class='del'>-	 * BTRFS_FT_* types</div><div class='del'>-	 */</div><div class='del'>-	BUILD_BUG_ON(BTRFS_FT_UNKNOWN != FT_UNKNOWN);</div><div class='del'>-	BUILD_BUG_ON(BTRFS_FT_REG_FILE != FT_REG_FILE);</div><div class='del'>-	BUILD_BUG_ON(BTRFS_FT_DIR != FT_DIR);</div><div class='del'>-	BUILD_BUG_ON(BTRFS_FT_CHRDEV != FT_CHRDEV);</div><div class='del'>-	BUILD_BUG_ON(BTRFS_FT_BLKDEV != FT_BLKDEV);</div><div class='del'>-	BUILD_BUG_ON(BTRFS_FT_FIFO != FT_FIFO);</div><div class='del'>-	BUILD_BUG_ON(BTRFS_FT_SOCK != FT_SOCK);</div><div class='del'>-	BUILD_BUG_ON(BTRFS_FT_SYMLINK != FT_SYMLINK);</div><div class='add'>+static_assert(BTRFS_FT_UNKNOWN == FT_UNKNOWN);</div><div class='add'>+static_assert(BTRFS_FT_REG_FILE == FT_REG_FILE);</div><div class='add'>+static_assert(BTRFS_FT_DIR == FT_DIR);</div><div class='add'>+static_assert(BTRFS_FT_CHRDEV == FT_CHRDEV);</div><div class='add'>+static_assert(BTRFS_FT_BLKDEV == FT_BLKDEV);</div><div class='add'>+static_assert(BTRFS_FT_FIFO == FT_FIFO);</div><div class='add'>+static_assert(BTRFS_FT_SOCK == FT_SOCK);</div><div class='add'>+static_assert(BTRFS_FT_SYMLINK == FT_SYMLINK);</div><div class='ctx'> </div><div class='del'>-	return fs_umode_to_ftype(inode-&gt;i_mode);</div><div class='add'>+static inline u8 btrfs_inode_type(const struct btrfs_inode *inode)</div><div class='add'>+{</div><div class='add'>+	return fs_umode_to_ftype(inode-&gt;vfs_inode.i_mode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct inode *btrfs_lookup_dentry(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(dir-&gt;i_sb);</div><div class='del'>-	struct inode *inode;</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(dir);</div><div class='add'>+	struct btrfs_inode *inode;</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(dir)-&gt;root;</div><div class='ctx'> 	struct btrfs_root *sub_root = root;</div><div class='del'>-	struct btrfs_key location;</div><div class='add'>+	struct btrfs_key location = { 0 };</div><div class='ctx'> 	u8 di_type = 0;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (dentry-&gt;d_name.len &gt; BTRFS_NAME_LEN)</div><div class='ctx'> 		return ERR_PTR(-ENAMETOOLONG);</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_inode_by_name(dir, dentry, &amp;location, &amp;di_type);</div><div class='add'>+	ret = btrfs_inode_by_name(BTRFS_I(dir), dentry, &amp;location, &amp;di_type);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ERR_PTR(ret);</div><div class='ctx'> </div><div class='ctx'> 	if (location.type == BTRFS_INODE_ITEM_KEY) {</div><div class='del'>-		inode = btrfs_iget(dir-&gt;i_sb, location.objectid, root);</div><div class='add'>+		inode = btrfs_iget(location.objectid, root);</div><div class='ctx'> 		if (IS_ERR(inode))</div><div class='del'>-			return inode;</div><div class='add'>+			return ERR_CAST(inode);</div><div class='ctx'> </div><div class='ctx'> 		/* Do extra check against inode mode with di_type */</div><div class='del'>-		if (btrfs_inode_type(inode) != di_type) {</div><div class='add'>+		if (unlikely(btrfs_inode_type(inode) != di_type)) {</div><div class='ctx'> 			btrfs_crit(fs_info,</div><div class='ctx'> "inode mode mismatch with dir: inode mode=0%o btrfs type=%u dir type=%u",</div><div class='del'>-				  inode-&gt;i_mode, btrfs_inode_type(inode),</div><div class='add'>+				  inode-&gt;vfs_inode.i_mode, btrfs_inode_type(inode),</div><div class='ctx'> 				  di_type);</div><div class='del'>-			iput(inode);</div><div class='add'>+			iput(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> 			return ERR_PTR(-EUCLEAN);</div><div class='ctx'> 		}</div><div class='del'>-		return inode;</div><div class='add'>+		return &amp;inode-&gt;vfs_inode;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = fixup_tree_root_location(fs_info, dir, dentry,</div><div class='add'>+	ret = fixup_tree_root_location(fs_info, BTRFS_I(dir), dentry,</div><div class='ctx'> 				       &amp;location, &amp;sub_root);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='ctx'> 		if (ret != -ENOENT)</div><div class='ctx'> 			inode = ERR_PTR(ret);</div><div class='ctx'> 		else</div><div class='del'>-			inode = new_simple_dir(dir-&gt;i_sb, &amp;location, sub_root);</div><div class='add'>+			inode = new_simple_dir(dir, &amp;location, root);</div><div class='ctx'> 	} else {</div><div class='del'>-		inode = btrfs_iget(dir-&gt;i_sb, location.objectid, sub_root);</div><div class='del'>-	}</div><div class='del'>-	if (root != sub_root)</div><div class='add'>+		inode = btrfs_iget(location.objectid, sub_root);</div><div class='ctx'> 		btrfs_put_root(sub_root);</div><div class='ctx'> </div><div class='del'>-	if (!IS_ERR(inode) &amp;&amp; root != sub_root) {</div><div class='add'>+		if (IS_ERR(inode))</div><div class='add'>+			return ERR_CAST(inode);</div><div class='add'>+</div><div class='ctx'> 		down_read(&amp;fs_info-&gt;cleanup_work_sem);</div><div class='del'>-		if (!sb_rdonly(inode-&gt;i_sb))</div><div class='add'>+		if (!sb_rdonly(inode-&gt;vfs_inode.i_sb))</div><div class='ctx'> 			ret = btrfs_orphan_cleanup(sub_root);</div><div class='ctx'> 		up_read(&amp;fs_info-&gt;cleanup_work_sem);</div><div class='ctx'> 		if (ret) {</div><div class='del'>-			iput(inode);</div><div class='add'>+			iput(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> 			inode = ERR_PTR(ret);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return inode;</div><div class='add'>+	if (IS_ERR(inode))</div><div class='add'>+		return ERR_CAST(inode);</div><div class='add'>+</div><div class='add'>+	return &amp;inode-&gt;vfs_inode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int btrfs_dentry_delete(const struct dentry *dentry)</div><div class='hunk'>@@ -6059,6 +6042,76 @@ static struct dentry *btrfs_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * Find the highest existing sequence number in a directory and then set the</div><div class='add'>+ * in-memory index_cnt variable to the first free sequence number.</div><div class='add'>+ */</div><div class='add'>+static int btrfs_set_inode_index_count(struct btrfs_inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	struct btrfs_key key, found_key;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='add'>+	struct extent_buffer *leaf;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	key.objectid = btrfs_ino(inode);</div><div class='add'>+	key.type = BTRFS_DIR_INDEX_KEY;</div><div class='add'>+	key.offset = (u64)-1;</div><div class='add'>+</div><div class='add'>+	path = btrfs_alloc_path();</div><div class='add'>+	if (!path)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+	/* FIXME: we should be able to handle this */</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	if (path-&gt;slots[0] == 0) {</div><div class='add'>+		inode-&gt;index_cnt = BTRFS_DIR_START_INDEX;</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	path-&gt;slots[0]--;</div><div class='add'>+</div><div class='add'>+	leaf = path-&gt;nodes[0];</div><div class='add'>+	btrfs_item_key_to_cpu(leaf, &amp;found_key, path-&gt;slots[0]);</div><div class='add'>+</div><div class='add'>+	if (found_key.objectid != btrfs_ino(inode) ||</div><div class='add'>+	    found_key.type != BTRFS_DIR_INDEX_KEY) {</div><div class='add'>+		inode-&gt;index_cnt = BTRFS_DIR_START_INDEX;</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	inode-&gt;index_cnt = found_key.offset + 1;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int btrfs_get_dir_last_index(struct btrfs_inode *dir, u64 *index)</div><div class='add'>+{</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	btrfs_inode_lock(dir, 0);</div><div class='add'>+	if (dir-&gt;index_cnt == (u64)-1) {</div><div class='add'>+		ret = btrfs_inode_delayed_dir_index_count(dir);</div><div class='add'>+		if (ret) {</div><div class='add'>+			ret = btrfs_set_inode_index_count(dir);</div><div class='add'>+			if (ret)</div><div class='add'>+				goto out;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* index_cnt is the index number of next new entry, so decrement it. */</div><div class='add'>+	*index = dir-&gt;index_cnt - 1;</div><div class='add'>+out:</div><div class='add'>+	btrfs_inode_unlock(dir, 0);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * All this infrastructure exists because dir_emit can fault, and we are holding</div><div class='ctx'>  * the tree lock when doing readdir.  For now just allocate a buffer and copy</div><div class='ctx'>  * our information into that, and then dir_emit from the buffer.  This is</div><div class='hunk'>@@ -6070,10 +6123,17 @@ static struct dentry *btrfs_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> static int btrfs_opendir(struct inode *inode, struct file *file)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_file_private *private;</div><div class='add'>+	u64 last_index;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_get_dir_last_index(BTRFS_I(inode), &amp;last_index);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	private = kzalloc(sizeof(struct btrfs_file_private), GFP_KERNEL);</div><div class='ctx'> 	if (!private)</div><div class='ctx'> 		return -ENOMEM;</div><div class='add'>+	private-&gt;last_index = last_index;</div><div class='ctx'> 	private-&gt;filldir_buf = kzalloc(PAGE_SIZE, GFP_KERNEL);</div><div class='ctx'> 	if (!private-&gt;filldir_buf) {</div><div class='ctx'> 		kfree(private);</div><div class='hunk'>@@ -6083,6 +6143,19 @@ static int btrfs_opendir(struct inode *inode, struct file *file)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static loff_t btrfs_dir_llseek(struct file *file, loff_t offset, int whence)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_file_private *private = file-&gt;private_data;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_get_dir_last_index(BTRFS_I(file_inode(file)),</div><div class='add'>+				       &amp;private-&gt;last_index);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	return generic_file_llseek(file, offset, whence);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> struct dir_entry {</div><div class='ctx'> 	u64 ino;</div><div class='ctx'> 	u64 offset;</div><div class='hunk'>@@ -6116,13 +6189,11 @@ static int btrfs_real_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 	struct btrfs_dir_item *di;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_key found_key;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	void *addr;</div><div class='del'>-	struct list_head ins_list;</div><div class='del'>-	struct list_head del_list;</div><div class='add'>+	LIST_HEAD(ins_list);</div><div class='add'>+	LIST_HEAD(del_list);</div><div class='ctx'> 	int ret;</div><div class='del'>-	struct extent_buffer *leaf;</div><div class='del'>-	int slot;</div><div class='ctx'> 	char *name_ptr;</div><div class='ctx'> 	int name_len;</div><div class='ctx'> 	int entries = 0;</div><div class='hunk'>@@ -6140,44 +6211,30 @@ static int btrfs_real_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 	addr = private-&gt;filldir_buf;</div><div class='ctx'> 	path-&gt;reada = READA_FORWARD;</div><div class='ctx'> </div><div class='del'>-	INIT_LIST_HEAD(&amp;ins_list);</div><div class='del'>-	INIT_LIST_HEAD(&amp;del_list);</div><div class='del'>-	put = btrfs_readdir_get_delayed_items(inode, &amp;ins_list, &amp;del_list);</div><div class='add'>+	put = btrfs_readdir_get_delayed_items(BTRFS_I(inode), private-&gt;last_index,</div><div class='add'>+					      &amp;ins_list, &amp;del_list);</div><div class='ctx'> </div><div class='ctx'> again:</div><div class='ctx'> 	key.type = BTRFS_DIR_INDEX_KEY;</div><div class='ctx'> 	key.offset = ctx-&gt;pos;</div><div class='ctx'> 	key.objectid = btrfs_ino(BTRFS_I(inode));</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto err;</div><div class='del'>-</div><div class='del'>-	while (1) {</div><div class='add'>+	btrfs_for_each_slot(root, &amp;key, &amp;found_key, path, ret) {</div><div class='ctx'> 		struct dir_entry *entry;</div><div class='del'>-</div><div class='del'>-		leaf = path-&gt;nodes[0];</div><div class='del'>-		slot = path-&gt;slots[0];</div><div class='del'>-		if (slot &gt;= btrfs_header_nritems(leaf)) {</div><div class='del'>-			ret = btrfs_next_leaf(root, path);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto err;</div><div class='del'>-			else if (ret &gt; 0)</div><div class='del'>-				break;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		btrfs_item_key_to_cpu(leaf, &amp;found_key, slot);</div><div class='add'>+		struct extent_buffer *leaf = path-&gt;nodes[0];</div><div class='add'>+		u8 ftype;</div><div class='ctx'> </div><div class='ctx'> 		if (found_key.objectid != key.objectid)</div><div class='ctx'> 			break;</div><div class='ctx'> 		if (found_key.type != BTRFS_DIR_INDEX_KEY)</div><div class='ctx'> 			break;</div><div class='ctx'> 		if (found_key.offset &lt; ctx-&gt;pos)</div><div class='del'>-			goto next;</div><div class='add'>+			continue;</div><div class='add'>+		if (found_key.offset &gt; private-&gt;last_index)</div><div class='add'>+			break;</div><div class='ctx'> 		if (btrfs_should_delete_dir_index(&amp;del_list, found_key.offset))</div><div class='del'>-			goto next;</div><div class='del'>-		di = btrfs_item_ptr(leaf, slot, struct btrfs_dir_item);</div><div class='add'>+			continue;</div><div class='add'>+		di = btrfs_item_ptr(leaf, path-&gt;slots[0], struct btrfs_dir_item);</div><div class='ctx'> 		name_len = btrfs_dir_name_len(leaf, di);</div><div class='ctx'> 		if ((total_len + sizeof(struct dir_entry) + name_len) &gt;=</div><div class='ctx'> 		    PAGE_SIZE) {</div><div class='hunk'>@@ -6191,30 +6248,31 @@ again:</div><div class='ctx'> 			goto again;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		ftype = btrfs_dir_flags_to_ftype(btrfs_dir_flags(leaf, di));</div><div class='ctx'> 		entry = addr;</div><div class='del'>-		put_unaligned(name_len, &amp;entry-&gt;name_len);</div><div class='ctx'> 		name_ptr = (char *)(entry + 1);</div><div class='del'>-		read_extent_buffer(leaf, name_ptr, (unsigned long)(di + 1),</div><div class='del'>-				   name_len);</div><div class='del'>-		put_unaligned(fs_ftype_to_dtype(btrfs_dir_type(leaf, di)),</div><div class='del'>-				&amp;entry-&gt;type);</div><div class='add'>+		read_extent_buffer(leaf, name_ptr,</div><div class='add'>+				   (unsigned long)(di + 1), name_len);</div><div class='add'>+		put_unaligned(name_len, &amp;entry-&gt;name_len);</div><div class='add'>+		put_unaligned(fs_ftype_to_dtype(ftype), &amp;entry-&gt;type);</div><div class='ctx'> 		btrfs_dir_item_key_to_cpu(leaf, di, &amp;location);</div><div class='ctx'> 		put_unaligned(location.objectid, &amp;entry-&gt;ino);</div><div class='ctx'> 		put_unaligned(found_key.offset, &amp;entry-&gt;offset);</div><div class='ctx'> 		entries++;</div><div class='ctx'> 		addr += sizeof(struct dir_entry) + name_len;</div><div class='ctx'> 		total_len += sizeof(struct dir_entry) + name_len;</div><div class='del'>-next:</div><div class='del'>-		path-&gt;slots[0]++;</div><div class='ctx'> 	}</div><div class='add'>+	/* Catch error encountered during iteration */</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto err;</div><div class='add'>+</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_filldir(private-&gt;filldir_buf, entries, ctx);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto nopos;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_readdir_delayed_dir_index(ctx, &amp;ins_list);</div><div class='del'>-	if (ret)</div><div class='add'>+	if (btrfs_readdir_delayed_dir_index(ctx, &amp;ins_list))</div><div class='ctx'> 		goto nopos;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -6225,7 +6283,7 @@ next:</div><div class='ctx'> 	 * offset.  This means that new entries created during readdir</div><div class='ctx'> 	 * are *guaranteed* to be seen in the future by that readdir.</div><div class='ctx'> 	 * This has broken buggy programs which operate on names as</div><div class='del'>-	 * they're returned by readdir.  Until we re-use freed offsets</div><div class='add'>+	 * they're returned by readdir.  Until we reuse freed offsets</div><div class='ctx'> 	 * we have this hack to stop new entries from being returned</div><div class='ctx'> 	 * under the assumption that they'll never reach this huge</div><div class='ctx'> 	 * offset.</div><div class='hunk'>@@ -6242,8 +6300,7 @@ nopos:</div><div class='ctx'> 	ret = 0;</div><div class='ctx'> err:</div><div class='ctx'> 	if (put)</div><div class='del'>-		btrfs_readdir_put_delayed_items(inode, &amp;ins_list, &amp;del_list);</div><div class='del'>-	btrfs_free_path(path);</div><div class='add'>+		btrfs_readdir_put_delayed_items(BTRFS_I(inode), &amp;ins_list, &amp;del_list);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -6253,116 +6310,51 @@ err:</div><div class='ctx'>  * FIXME, needs more benchmarking...there are no reasons other than performance</div><div class='ctx'>  * to keep or drop this code.</div><div class='ctx'>  */</div><div class='del'>-static int btrfs_dirty_inode(struct inode *inode)</div><div class='add'>+static int btrfs_dirty_inode(struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (test_bit(BTRFS_INODE_DUMMY, &amp;BTRFS_I(inode)-&gt;runtime_flags))</div><div class='add'>+	if (test_bit(BTRFS_INODE_DUMMY, &amp;inode-&gt;runtime_flags))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	trans = btrfs_join_transaction(root);</div><div class='ctx'> 	if (IS_ERR(trans))</div><div class='ctx'> 		return PTR_ERR(trans);</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_update_inode(trans, root, BTRFS_I(inode));</div><div class='del'>-	if (ret &amp;&amp; (ret == -ENOSPC || ret == -EDQUOT)) {</div><div class='add'>+	ret = btrfs_update_inode(trans, inode);</div><div class='add'>+	if (ret == -ENOSPC || ret == -EDQUOT) {</div><div class='ctx'> 		/* whoops, lets try again with the full transaction */</div><div class='ctx'> 		btrfs_end_transaction(trans);</div><div class='ctx'> 		trans = btrfs_start_transaction(root, 1);</div><div class='ctx'> 		if (IS_ERR(trans))</div><div class='ctx'> 			return PTR_ERR(trans);</div><div class='ctx'> </div><div class='del'>-		ret = btrfs_update_inode(trans, root, BTRFS_I(inode));</div><div class='add'>+		ret = btrfs_update_inode(trans, inode);</div><div class='ctx'> 	}</div><div class='ctx'> 	btrfs_end_transaction(trans);</div><div class='del'>-	if (BTRFS_I(inode)-&gt;delayed_node)</div><div class='add'>+	if (inode-&gt;delayed_node)</div><div class='ctx'> 		btrfs_balance_delayed_items(fs_info);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * This is a copy of file_update_time.  We need this so we can return error on</div><div class='del'>- * ENOSPC for updating the inode in the case of file write and mmap writes.</div><div class='add'>+ * We need our own -&gt;update_time so that we can return error on ENOSPC for</div><div class='add'>+ * updating the inode in the case of file write and mmap writes.</div><div class='ctx'>  */</div><div class='del'>-static int btrfs_update_time(struct inode *inode, struct timespec64 *now,</div><div class='del'>-			     int flags)</div><div class='add'>+static int btrfs_update_time(struct inode *inode, int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='del'>-	bool dirty = flags &amp; ~S_VERSION;</div><div class='add'>+	bool dirty;</div><div class='ctx'> </div><div class='ctx'> 	if (btrfs_root_readonly(root))</div><div class='ctx'> 		return -EROFS;</div><div class='ctx'> </div><div class='del'>-	if (flags &amp; S_VERSION)</div><div class='del'>-		dirty |= inode_maybe_inc_iversion(inode, dirty);</div><div class='del'>-	if (flags &amp; S_CTIME)</div><div class='del'>-		inode-&gt;i_ctime = *now;</div><div class='del'>-	if (flags &amp; S_MTIME)</div><div class='del'>-		inode-&gt;i_mtime = *now;</div><div class='del'>-	if (flags &amp; S_ATIME)</div><div class='del'>-		inode-&gt;i_atime = *now;</div><div class='del'>-	return dirty ? btrfs_dirty_inode(inode) : 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * find the highest existing sequence number in a directory</div><div class='del'>- * and then set the in-memory index_cnt variable to reflect</div><div class='del'>- * free sequence numbers</div><div class='del'>- */</div><div class='del'>-static int btrfs_set_inode_index_count(struct btrfs_inode *inode)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_root *root = inode-&gt;root;</div><div class='del'>-	struct btrfs_key key, found_key;</div><div class='del'>-	struct btrfs_path *path;</div><div class='del'>-	struct extent_buffer *leaf;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	key.objectid = btrfs_ino(inode);</div><div class='del'>-	key.type = BTRFS_DIR_INDEX_KEY;</div><div class='del'>-	key.offset = (u64)-1;</div><div class='del'>-</div><div class='del'>-	path = btrfs_alloc_path();</div><div class='del'>-	if (!path)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-	/* FIXME: we should be able to handle this */</div><div class='del'>-	if (ret == 0)</div><div class='del'>-		goto out;</div><div class='del'>-	ret = 0;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * MAGIC NUMBER EXPLANATION:</div><div class='del'>-	 * since we search a directory based on f_pos we have to start at 2</div><div class='del'>-	 * since '.' and '..' have f_pos of 0 and 1 respectively, so everybody</div><div class='del'>-	 * else has to start at 2</div><div class='del'>-	 */</div><div class='del'>-	if (path-&gt;slots[0] == 0) {</div><div class='del'>-		inode-&gt;index_cnt = 2;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	path-&gt;slots[0]--;</div><div class='del'>-</div><div class='del'>-	leaf = path-&gt;nodes[0];</div><div class='del'>-	btrfs_item_key_to_cpu(leaf, &amp;found_key, path-&gt;slots[0]);</div><div class='del'>-</div><div class='del'>-	if (found_key.objectid != btrfs_ino(inode) ||</div><div class='del'>-	    found_key.type != BTRFS_DIR_INDEX_KEY) {</div><div class='del'>-		inode-&gt;index_cnt = 2;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	inode-&gt;index_cnt = found_key.offset + 1;</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	dirty = inode_update_timestamps(inode, flags);</div><div class='add'>+	return dirty ? btrfs_dirty_inode(BTRFS_I(inode)) : 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -6392,7 +6384,7 @@ static int btrfs_insert_inode_locked(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_iget_args args;</div><div class='ctx'> </div><div class='del'>-	args.ino = BTRFS_I(inode)-&gt;location.objectid;</div><div class='add'>+	args.ino = btrfs_ino(BTRFS_I(inode));</div><div class='ctx'> 	args.root = BTRFS_I(inode)-&gt;root;</div><div class='ctx'> </div><div class='ctx'> 	return insert_inode_locked4(inode,</div><div class='hunk'>@@ -6400,105 +6392,188 @@ static int btrfs_insert_inode_locked(struct inode *inode)</div><div class='ctx'> 		   btrfs_find_actor, &amp;args);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+int btrfs_new_inode_prepare(struct btrfs_new_inode_args *args,</div><div class='add'>+			    unsigned int *trans_num_items)</div><div class='add'>+{</div><div class='add'>+	struct inode *dir = args-&gt;dir;</div><div class='add'>+	struct inode *inode = args-&gt;inode;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (!args-&gt;orphan) {</div><div class='add'>+		ret = fscrypt_setup_filename(dir, &amp;args-&gt;dentry-&gt;d_name, 0,</div><div class='add'>+					     &amp;args-&gt;fname);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = posix_acl_create(dir, &amp;inode-&gt;i_mode, &amp;args-&gt;default_acl, &amp;args-&gt;acl);</div><div class='add'>+	if (ret) {</div><div class='add'>+		fscrypt_free_filename(&amp;args-&gt;fname);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* 1 to add inode item */</div><div class='add'>+	*trans_num_items = 1;</div><div class='add'>+	/* 1 to add compression property */</div><div class='add'>+	if (BTRFS_I(dir)-&gt;prop_compress)</div><div class='add'>+		(*trans_num_items)++;</div><div class='add'>+	/* 1 to add default ACL xattr */</div><div class='add'>+	if (args-&gt;default_acl)</div><div class='add'>+		(*trans_num_items)++;</div><div class='add'>+	/* 1 to add access ACL xattr */</div><div class='add'>+	if (args-&gt;acl)</div><div class='add'>+		(*trans_num_items)++;</div><div class='add'>+#ifdef CONFIG_SECURITY</div><div class='add'>+	/* 1 to add LSM xattr */</div><div class='add'>+	if (dir-&gt;i_security)</div><div class='add'>+		(*trans_num_items)++;</div><div class='add'>+#endif</div><div class='add'>+	if (args-&gt;orphan) {</div><div class='add'>+		/* 1 to add orphan item */</div><div class='add'>+		(*trans_num_items)++;</div><div class='add'>+	} else {</div><div class='add'>+		/*</div><div class='add'>+		 * 1 to add dir item</div><div class='add'>+		 * 1 to add dir index</div><div class='add'>+		 * 1 to update parent inode item</div><div class='add'>+		 *</div><div class='add'>+		 * No need for 1 unit for the inode ref item because it is</div><div class='add'>+		 * inserted in a batch together with the inode item at</div><div class='add'>+		 * btrfs_create_new_inode().</div><div class='add'>+		 */</div><div class='add'>+		*trans_num_items += 3;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_new_inode_args_destroy(struct btrfs_new_inode_args *args)</div><div class='add'>+{</div><div class='add'>+	posix_acl_release(args-&gt;acl);</div><div class='add'>+	posix_acl_release(args-&gt;default_acl);</div><div class='add'>+	fscrypt_free_filename(&amp;args-&gt;fname);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Inherit flags from the parent inode.</div><div class='ctx'>  *</div><div class='ctx'>  * Currently only the compression flags and the cow flags are inherited.</div><div class='ctx'>  */</div><div class='del'>-static void btrfs_inherit_iflags(struct inode *inode, struct inode *dir)</div><div class='add'>+static void btrfs_inherit_iflags(struct btrfs_inode *inode, struct btrfs_inode *dir)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int flags;</div><div class='ctx'> </div><div class='del'>-	if (!dir)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	flags = BTRFS_I(dir)-&gt;flags;</div><div class='add'>+	flags = dir-&gt;flags;</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; BTRFS_INODE_NOCOMPRESS) {</div><div class='del'>-		BTRFS_I(inode)-&gt;flags &amp;= ~BTRFS_INODE_COMPRESS;</div><div class='del'>-		BTRFS_I(inode)-&gt;flags |= BTRFS_INODE_NOCOMPRESS;</div><div class='add'>+		inode-&gt;flags &amp;= ~BTRFS_INODE_COMPRESS;</div><div class='add'>+		inode-&gt;flags |= BTRFS_INODE_NOCOMPRESS;</div><div class='ctx'> 	} else if (flags &amp; BTRFS_INODE_COMPRESS) {</div><div class='del'>-		BTRFS_I(inode)-&gt;flags &amp;= ~BTRFS_INODE_NOCOMPRESS;</div><div class='del'>-		BTRFS_I(inode)-&gt;flags |= BTRFS_INODE_COMPRESS;</div><div class='add'>+		inode-&gt;flags &amp;= ~BTRFS_INODE_NOCOMPRESS;</div><div class='add'>+		inode-&gt;flags |= BTRFS_INODE_COMPRESS;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; BTRFS_INODE_NODATACOW) {</div><div class='del'>-		BTRFS_I(inode)-&gt;flags |= BTRFS_INODE_NODATACOW;</div><div class='del'>-		if (S_ISREG(inode-&gt;i_mode))</div><div class='del'>-			BTRFS_I(inode)-&gt;flags |= BTRFS_INODE_NODATASUM;</div><div class='add'>+		inode-&gt;flags |= BTRFS_INODE_NODATACOW;</div><div class='add'>+		if (S_ISREG(inode-&gt;vfs_inode.i_mode))</div><div class='add'>+			inode-&gt;flags |= BTRFS_INODE_NODATASUM;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	btrfs_sync_inode_flags_to_i_flags(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct inode *btrfs_new_inode(struct btrfs_trans_handle *trans,</div><div class='del'>-				     struct btrfs_root *root,</div><div class='del'>-				     struct user_namespace *mnt_userns,</div><div class='del'>-				     struct inode *dir,</div><div class='del'>-				     const char *name, int name_len,</div><div class='del'>-				     u64 ref_objectid, u64 objectid,</div><div class='del'>-				     umode_t mode, u64 *index)</div><div class='add'>+int btrfs_create_new_inode(struct btrfs_trans_handle *trans,</div><div class='add'>+			   struct btrfs_new_inode_args *args)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='del'>-	struct inode *inode;</div><div class='add'>+	struct timespec64 ts;</div><div class='add'>+	struct inode *dir = args-&gt;dir;</div><div class='add'>+	struct inode *inode = args-&gt;inode;</div><div class='add'>+	const struct fscrypt_str *name = args-&gt;orphan ? NULL : &amp;args-&gt;fname.disk_name;</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(dir);</div><div class='add'>+	struct btrfs_root *root;</div><div class='ctx'> 	struct btrfs_inode_item *inode_item;</div><div class='del'>-	struct btrfs_key *location;</div><div class='ctx'> 	struct btrfs_path *path;</div><div class='add'>+	u64 objectid;</div><div class='ctx'> 	struct btrfs_inode_ref *ref;</div><div class='ctx'> 	struct btrfs_key key[2];</div><div class='ctx'> 	u32 sizes[2];</div><div class='ctx'> 	struct btrfs_item_batch batch;</div><div class='ctx'> 	unsigned long ptr;</div><div class='del'>-	unsigned int nofs_flag;</div><div class='ctx'> 	int ret;</div><div class='add'>+	bool xa_reserved = false;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	nofs_flag = memalloc_nofs_save();</div><div class='del'>-	inode = new_inode(fs_info-&gt;sb);</div><div class='del'>-	memalloc_nofs_restore(nofs_flag);</div><div class='del'>-	if (!inode) {</div><div class='del'>-		btrfs_free_path(path);</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='add'>+	if (!args-&gt;subvol)</div><div class='add'>+		BTRFS_I(inode)-&gt;root = btrfs_grab_root(BTRFS_I(dir)-&gt;root);</div><div class='add'>+	root = BTRFS_I(inode)-&gt;root;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_init_file_extent_tree(BTRFS_I(inode));</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_get_free_objectid(root, &amp;objectid);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+	btrfs_set_inode_number(BTRFS_I(inode), objectid);</div><div class='add'>+</div><div class='add'>+	ret = xa_reserve(&amp;root-&gt;inodes, objectid, GFP_NOFS);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+	xa_reserved = true;</div><div class='add'>+</div><div class='add'>+	if (args-&gt;orphan) {</div><div class='add'>+		/*</div><div class='add'>+		 * O_TMPFILE, set link count to 0, so that after this point, we</div><div class='add'>+		 * fill in an inode item with the correct link count.</div><div class='add'>+		 */</div><div class='add'>+		set_nlink(inode, 0);</div><div class='add'>+	} else {</div><div class='add'>+		trace_btrfs_inode_request(dir);</div><div class='add'>+</div><div class='add'>+		ret = btrfs_set_inode_index(BTRFS_I(dir), &amp;BTRFS_I(inode)-&gt;dir_index);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (S_ISDIR(inode-&gt;i_mode))</div><div class='add'>+		BTRFS_I(inode)-&gt;index_cnt = BTRFS_DIR_START_INDEX;</div><div class='add'>+</div><div class='add'>+	BTRFS_I(inode)-&gt;generation = trans-&gt;transid;</div><div class='add'>+	inode-&gt;i_generation = BTRFS_I(inode)-&gt;generation;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='del'>-	 * O_TMPFILE, set link count to 0, so that after this point,</div><div class='del'>-	 * we fill in an inode item with the correct link count.</div><div class='add'>+	 * We don't have any capability xattrs set here yet, shortcut any</div><div class='add'>+	 * queries for the xattrs here.  If we add them later via the inode</div><div class='add'>+	 * security init path or any other path this flag will be cleared.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!name)</div><div class='del'>-		set_nlink(inode, 0);</div><div class='add'>+	set_bit(BTRFS_INODE_NO_CAP_XATTR, &amp;BTRFS_I(inode)-&gt;runtime_flags);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * we have to initialize this early, so we can reclaim the inode</div><div class='del'>-	 * number if we fail afterwards in this function.</div><div class='add'>+	 * Subvolumes don't inherit flags from their parent directory.</div><div class='add'>+	 * Originally this was probably by accident, but we probably can't</div><div class='add'>+	 * change it now without compatibility issues.</div><div class='ctx'> 	 */</div><div class='del'>-	inode-&gt;i_ino = objectid;</div><div class='add'>+	if (!args-&gt;subvol)</div><div class='add'>+		btrfs_inherit_iflags(BTRFS_I(inode), BTRFS_I(dir));</div><div class='ctx'> </div><div class='del'>-	if (dir &amp;&amp; name) {</div><div class='del'>-		trace_btrfs_inode_request(dir);</div><div class='add'>+	btrfs_set_inode_mapping_order(BTRFS_I(inode));</div><div class='add'>+	if (S_ISREG(inode-&gt;i_mode)) {</div><div class='add'>+		if (btrfs_test_opt(fs_info, NODATASUM))</div><div class='add'>+			BTRFS_I(inode)-&gt;flags |= BTRFS_INODE_NODATASUM;</div><div class='add'>+		if (btrfs_test_opt(fs_info, NODATACOW))</div><div class='add'>+			BTRFS_I(inode)-&gt;flags |= BTRFS_INODE_NODATACOW |</div><div class='add'>+				BTRFS_INODE_NODATASUM;</div><div class='add'>+		btrfs_update_inode_mapping_flags(BTRFS_I(inode));</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		ret = btrfs_set_inode_index(BTRFS_I(dir), index);</div><div class='del'>-		if (ret) {</div><div class='del'>-			btrfs_free_path(path);</div><div class='del'>-			iput(inode);</div><div class='del'>-			return ERR_PTR(ret);</div><div class='del'>-		}</div><div class='del'>-	} else if (dir) {</div><div class='del'>-		*index = 0;</div><div class='add'>+	ret = btrfs_insert_inode_locked(inode);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		if (!args-&gt;orphan)</div><div class='add'>+			BTRFS_I(dir)-&gt;index_cnt--;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	/*</div><div class='del'>-	 * index_cnt is ignored for everything but a dir,</div><div class='del'>-	 * btrfs_set_inode_index_count has an explanation for the magic</div><div class='del'>-	 * number</div><div class='del'>-	 */</div><div class='del'>-	BTRFS_I(inode)-&gt;index_cnt = 2;</div><div class='del'>-	BTRFS_I(inode)-&gt;dir_index = *index;</div><div class='del'>-	BTRFS_I(inode)-&gt;root = btrfs_grab_root(root);</div><div class='del'>-	BTRFS_I(inode)-&gt;generation = trans-&gt;transid;</div><div class='del'>-	inode-&gt;i_generation = BTRFS_I(inode)-&gt;generation;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We could have gotten an inode number from somebody who was fsynced</div><div class='hunk'>@@ -6506,7 +6581,7 @@ static struct inode *btrfs_new_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * sync since it will be a full sync anyway and this will blow away the</div><div class='ctx'> 	 * old info in the log.</div><div class='ctx'> 	 */</div><div class='del'>-	set_bit(BTRFS_INODE_NEEDS_FULL_SYNC, &amp;BTRFS_I(inode)-&gt;runtime_flags);</div><div class='add'>+	btrfs_set_inode_full_sync(BTRFS_I(inode));</div><div class='ctx'> </div><div class='ctx'> 	key[0].objectid = objectid;</div><div class='ctx'> 	key[0].type = BTRFS_INODE_ITEM_KEY;</div><div class='hunk'>@@ -6514,7 +6589,7 @@ static struct inode *btrfs_new_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	sizes[0] = sizeof(struct btrfs_inode_item);</div><div class='ctx'> </div><div class='del'>-	if (name) {</div><div class='add'>+	if (!args-&gt;orphan) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Start new inodes with an inode_ref. This is slightly more</div><div class='ctx'> 		 * efficient for small numbers of hard links since they will</div><div class='hunk'>@@ -6523,37 +6598,33 @@ static struct inode *btrfs_new_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		 */</div><div class='ctx'> 		key[1].objectid = objectid;</div><div class='ctx'> 		key[1].type = BTRFS_INODE_REF_KEY;</div><div class='del'>-		key[1].offset = ref_objectid;</div><div class='del'>-</div><div class='del'>-		sizes[1] = name_len + sizeof(*ref);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	location = &amp;BTRFS_I(inode)-&gt;location;</div><div class='del'>-	location-&gt;objectid = objectid;</div><div class='del'>-	location-&gt;offset = 0;</div><div class='del'>-	location-&gt;type = BTRFS_INODE_ITEM_KEY;</div><div class='del'>-</div><div class='del'>-	ret = btrfs_insert_inode_locked(inode);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		iput(inode);</div><div class='del'>-		goto fail;</div><div class='add'>+		if (args-&gt;subvol) {</div><div class='add'>+			key[1].offset = objectid;</div><div class='add'>+			sizes[1] = 2 + sizeof(*ref);</div><div class='add'>+		} else {</div><div class='add'>+			key[1].offset = btrfs_ino(BTRFS_I(dir));</div><div class='add'>+			sizes[1] = name-&gt;len + sizeof(*ref);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	batch.keys = &amp;key[0];</div><div class='ctx'> 	batch.data_sizes = &amp;sizes[0];</div><div class='del'>-	batch.total_data_size = sizes[0] + (name ? sizes[1] : 0);</div><div class='del'>-	batch.nr = name ? 2 : 1;</div><div class='add'>+	batch.total_data_size = sizes[0] + (args-&gt;orphan ? 0 : sizes[1]);</div><div class='add'>+	batch.nr = args-&gt;orphan ? 1 : 2;</div><div class='ctx'> 	ret = btrfs_insert_empty_items(trans, root, path, &amp;batch);</div><div class='del'>-	if (ret != 0)</div><div class='del'>-		goto fail_unlock;</div><div class='add'>+	if (unlikely(ret != 0)) {</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		goto discard;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	inode_init_owner(mnt_userns, inode, dir, mode);</div><div class='del'>-	inode_set_bytes(inode, 0);</div><div class='add'>+	ts = simple_inode_init_ts(inode);</div><div class='add'>+	BTRFS_I(inode)-&gt;i_otime_sec = ts.tv_sec;</div><div class='add'>+	BTRFS_I(inode)-&gt;i_otime_nsec = ts.tv_nsec;</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_mtime = current_time(inode);</div><div class='del'>-	inode-&gt;i_atime = inode-&gt;i_mtime;</div><div class='del'>-	inode-&gt;i_ctime = inode-&gt;i_mtime;</div><div class='del'>-	BTRFS_I(inode)-&gt;i_otime = inode-&gt;i_mtime;</div><div class='add'>+	/*</div><div class='add'>+	 * We're going to fill the inode item now, so at this point the inode</div><div class='add'>+	 * must be fully initialized.</div><div class='add'>+	 */</div><div class='ctx'> </div><div class='ctx'> 	inode_item = btrfs_item_ptr(path-&gt;nodes[0], path-&gt;slots[0],</div><div class='ctx'> 				  struct btrfs_inode_item);</div><div class='hunk'>@@ -6561,50 +6632,111 @@ static struct inode *btrfs_new_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			     sizeof(*inode_item));</div><div class='ctx'> 	fill_inode_item(trans, path-&gt;nodes[0], inode_item, inode);</div><div class='ctx'> </div><div class='del'>-	if (name) {</div><div class='add'>+	if (!args-&gt;orphan) {</div><div class='ctx'> 		ref = btrfs_item_ptr(path-&gt;nodes[0], path-&gt;slots[0] + 1,</div><div class='ctx'> 				     struct btrfs_inode_ref);</div><div class='del'>-		btrfs_set_inode_ref_name_len(path-&gt;nodes[0], ref, name_len);</div><div class='del'>-		btrfs_set_inode_ref_index(path-&gt;nodes[0], ref, *index);</div><div class='ctx'> 		ptr = (unsigned long)(ref + 1);</div><div class='del'>-		write_extent_buffer(path-&gt;nodes[0], name, ptr, name_len);</div><div class='add'>+		if (args-&gt;subvol) {</div><div class='add'>+			btrfs_set_inode_ref_name_len(path-&gt;nodes[0], ref, 2);</div><div class='add'>+			btrfs_set_inode_ref_index(path-&gt;nodes[0], ref, 0);</div><div class='add'>+			write_extent_buffer(path-&gt;nodes[0], "..", ptr, 2);</div><div class='add'>+		} else {</div><div class='add'>+			btrfs_set_inode_ref_name_len(path-&gt;nodes[0], ref,</div><div class='add'>+						     name-&gt;len);</div><div class='add'>+			btrfs_set_inode_ref_index(path-&gt;nodes[0], ref,</div><div class='add'>+						  BTRFS_I(inode)-&gt;dir_index);</div><div class='add'>+			write_extent_buffer(path-&gt;nodes[0], name-&gt;name, ptr,</div><div class='add'>+					    name-&gt;len);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_mark_buffer_dirty(path-&gt;nodes[0]);</div><div class='add'>+	/*</div><div class='add'>+	 * We don't need the path anymore, plus inheriting properties, adding</div><div class='add'>+	 * ACLs, security xattrs, orphan item or adding the link, will result in</div><div class='add'>+	 * allocating yet another path. So just free our path.</div><div class='add'>+	 */</div><div class='ctx'> 	btrfs_free_path(path);</div><div class='add'>+	path = NULL;</div><div class='ctx'> </div><div class='del'>-	btrfs_inherit_iflags(inode, dir);</div><div class='add'>+	if (args-&gt;subvol) {</div><div class='add'>+		struct btrfs_inode *parent;</div><div class='ctx'> </div><div class='del'>-	if (S_ISREG(mode)) {</div><div class='del'>-		if (btrfs_test_opt(fs_info, NODATASUM))</div><div class='del'>-			BTRFS_I(inode)-&gt;flags |= BTRFS_INODE_NODATASUM;</div><div class='del'>-		if (btrfs_test_opt(fs_info, NODATACOW))</div><div class='del'>-			BTRFS_I(inode)-&gt;flags |= BTRFS_INODE_NODATACOW |</div><div class='del'>-				BTRFS_INODE_NODATASUM;</div><div class='add'>+		/*</div><div class='add'>+		 * Subvolumes inherit properties from their parent subvolume,</div><div class='add'>+		 * not the directory they were created in.</div><div class='add'>+		 */</div><div class='add'>+		parent = btrfs_iget(BTRFS_FIRST_FREE_OBJECTID, BTRFS_I(dir)-&gt;root);</div><div class='add'>+		if (IS_ERR(parent)) {</div><div class='add'>+			ret = PTR_ERR(parent);</div><div class='add'>+		} else {</div><div class='add'>+			ret = btrfs_inode_inherit_props(trans, BTRFS_I(inode),</div><div class='add'>+							parent);</div><div class='add'>+			iput(&amp;parent-&gt;vfs_inode);</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		ret = btrfs_inode_inherit_props(trans, BTRFS_I(inode),</div><div class='add'>+						BTRFS_I(dir));</div><div class='add'>+	}</div><div class='add'>+	if (ret) {</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+			  "error inheriting props for ino %llu (root %llu): %d",</div><div class='add'>+			  btrfs_ino(BTRFS_I(inode)), btrfs_root_id(root), ret);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	inode_tree_add(inode);</div><div class='add'>+	/*</div><div class='add'>+	 * Subvolumes don't inherit ACLs or get passed to the LSM. This is</div><div class='add'>+	 * probably a bug.</div><div class='add'>+	 */</div><div class='add'>+	if (!args-&gt;subvol) {</div><div class='add'>+		ret = btrfs_init_inode_security(trans, args);</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			goto discard;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_add_inode_to_root(BTRFS_I(inode), false);</div><div class='add'>+	if (WARN_ON(ret)) {</div><div class='add'>+		/* Shouldn't happen, we used xa_reserve() before. */</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		goto discard;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	trace_btrfs_inode_new(inode);</div><div class='ctx'> 	btrfs_set_inode_last_trans(trans, BTRFS_I(inode));</div><div class='ctx'> </div><div class='ctx'> 	btrfs_update_root_times(trans, root);</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_inode_inherit_props(trans, inode, dir);</div><div class='del'>-	if (ret)</div><div class='del'>-		btrfs_err(fs_info,</div><div class='del'>-			  "error inheriting props for ino %llu (root %llu): %d",</div><div class='del'>-			btrfs_ino(BTRFS_I(inode)), root-&gt;root_key.objectid, ret);</div><div class='add'>+	if (args-&gt;orphan) {</div><div class='add'>+		ret = btrfs_orphan_add(trans, BTRFS_I(inode));</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			goto discard;</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		ret = btrfs_add_link(trans, BTRFS_I(dir), BTRFS_I(inode), name,</div><div class='add'>+				     0, BTRFS_I(inode)-&gt;dir_index);</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			goto discard;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	return inode;</div><div class='add'>+	return 0;</div><div class='ctx'> </div><div class='del'>-fail_unlock:</div><div class='add'>+discard:</div><div class='add'>+	/*</div><div class='add'>+	 * discard_new_inode() calls iput(), but the caller owns the reference</div><div class='add'>+	 * to the inode.</div><div class='add'>+	 */</div><div class='add'>+	ihold(inode);</div><div class='ctx'> 	discard_new_inode(inode);</div><div class='del'>-fail:</div><div class='del'>-	if (dir &amp;&amp; name)</div><div class='del'>-		BTRFS_I(dir)-&gt;index_cnt--;</div><div class='add'>+out:</div><div class='add'>+	if (xa_reserved)</div><div class='add'>+		xa_release(&amp;root-&gt;inodes, objectid);</div><div class='add'>+</div><div class='ctx'> 	btrfs_free_path(path);</div><div class='del'>-	return ERR_PTR(ret);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -6615,7 +6747,7 @@ fail:</div><div class='ctx'>  */</div><div class='ctx'> int btrfs_add_link(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		   struct btrfs_inode *parent_inode, struct btrfs_inode *inode,</div><div class='del'>-		   const char *name, int name_len, int add_backref, u64 index)</div><div class='add'>+		   const struct fscrypt_str *name, bool add_backref, u64 index)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='hunk'>@@ -6633,42 +6765,32 @@ int btrfs_add_link(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(ino == BTRFS_FIRST_FREE_OBJECTID)) {</div><div class='ctx'> 		ret = btrfs_add_root_ref(trans, key.objectid,</div><div class='del'>-					 root-&gt;root_key.objectid, parent_ino,</div><div class='del'>-					 index, name, name_len);</div><div class='add'>+					 btrfs_root_id(root), parent_ino,</div><div class='add'>+					 index, name);</div><div class='ctx'> 	} else if (add_backref) {</div><div class='del'>-		ret = btrfs_insert_inode_ref(trans, root, name, name_len, ino,</div><div class='del'>-					     parent_ino, index);</div><div class='add'>+		ret = btrfs_insert_inode_ref(trans, root, name,</div><div class='add'>+					     ino, parent_ino, index);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Nothing to clean up yet */</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_insert_dir_item(trans, name, name_len, parent_inode, &amp;key,</div><div class='del'>-				    btrfs_inode_type(&amp;inode-&gt;vfs_inode), index);</div><div class='add'>+	ret = btrfs_insert_dir_item(trans, name, parent_inode, &amp;key,</div><div class='add'>+				    btrfs_inode_type(inode), index);</div><div class='ctx'> 	if (ret == -EEXIST || ret == -EOVERFLOW)</div><div class='ctx'> 		goto fail_dir_item;</div><div class='del'>-	else if (ret) {</div><div class='add'>+	else if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	btrfs_i_size_write(parent_inode, parent_inode-&gt;vfs_inode.i_size +</div><div class='del'>-			   name_len * 2);</div><div class='add'>+			   name-&gt;len * 2);</div><div class='ctx'> 	inode_inc_iversion(&amp;parent_inode-&gt;vfs_inode);</div><div class='del'>-	/*</div><div class='del'>-	 * If we are replaying a log tree, we do not want to update the mtime</div><div class='del'>-	 * and ctime of the parent directory with the current time, since the</div><div class='del'>-	 * log replay procedure is responsible for setting them to their correct</div><div class='del'>-	 * values (the ones it had when the fsync was done).</div><div class='del'>-	 */</div><div class='del'>-	if (!test_bit(BTRFS_FS_LOG_RECOVERING, &amp;root-&gt;fs_info-&gt;flags)) {</div><div class='del'>-		struct timespec64 now = current_time(&amp;parent_inode-&gt;vfs_inode);</div><div class='add'>+	update_time_after_link_or_unlink(parent_inode);</div><div class='ctx'> </div><div class='del'>-		parent_inode-&gt;vfs_inode.i_mtime = now;</div><div class='del'>-		parent_inode-&gt;vfs_inode.i_ctime = now;</div><div class='del'>-	}</div><div class='del'>-	ret = btrfs_update_inode(trans, root, parent_inode);</div><div class='add'>+	ret = btrfs_update_inode(trans, parent_inode);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -6676,167 +6798,92 @@ int btrfs_add_link(struct btrfs_trans_handle *trans,</div><div class='ctx'> fail_dir_item:</div><div class='ctx'> 	if (unlikely(ino == BTRFS_FIRST_FREE_OBJECTID)) {</div><div class='ctx'> 		u64 local_index;</div><div class='del'>-		int err;</div><div class='del'>-		err = btrfs_del_root_ref(trans, key.objectid,</div><div class='del'>-					 root-&gt;root_key.objectid, parent_ino,</div><div class='del'>-					 &amp;local_index, name, name_len);</div><div class='del'>-		if (err)</div><div class='del'>-			btrfs_abort_transaction(trans, err);</div><div class='add'>+		int ret2;</div><div class='add'>+</div><div class='add'>+		ret2 = btrfs_del_root_ref(trans, key.objectid, btrfs_root_id(root),</div><div class='add'>+					  parent_ino, &amp;local_index, name);</div><div class='add'>+		if (ret2)</div><div class='add'>+			btrfs_abort_transaction(trans, ret2);</div><div class='ctx'> 	} else if (add_backref) {</div><div class='del'>-		u64 local_index;</div><div class='del'>-		int err;</div><div class='add'>+		int ret2;</div><div class='ctx'> </div><div class='del'>-		err = btrfs_del_inode_ref(trans, root, name, name_len,</div><div class='del'>-					  ino, parent_ino, &amp;local_index);</div><div class='del'>-		if (err)</div><div class='del'>-			btrfs_abort_transaction(trans, err);</div><div class='add'>+		ret2 = btrfs_del_inode_ref(trans, root, name, ino, parent_ino, NULL);</div><div class='add'>+		if (ret2)</div><div class='add'>+			btrfs_abort_transaction(trans, ret2);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Return the original error code */</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btrfs_add_nondir(struct btrfs_trans_handle *trans,</div><div class='del'>-			    struct btrfs_inode *dir, struct dentry *dentry,</div><div class='del'>-			    struct btrfs_inode *inode, int backref, u64 index)</div><div class='add'>+static int btrfs_create_common(struct inode *dir, struct dentry *dentry,</div><div class='add'>+			       struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	int err = btrfs_add_link(trans, dir, inode,</div><div class='del'>-				 dentry-&gt;d_name.name, dentry-&gt;d_name.len,</div><div class='del'>-				 backref, index);</div><div class='del'>-	if (err &gt; 0)</div><div class='del'>-		err = -EEXIST;</div><div class='del'>-	return err;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int btrfs_mknod(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-		       struct dentry *dentry, umode_t mode, dev_t rdev)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(dir-&gt;i_sb);</div><div class='del'>-	struct btrfs_trans_handle *trans;</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(dir);</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(dir)-&gt;root;</div><div class='del'>-	struct inode *inode = NULL;</div><div class='del'>-	int err;</div><div class='del'>-	u64 objectid;</div><div class='del'>-	u64 index = 0;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * 2 for inode item and ref</div><div class='del'>-	 * 2 for dir items</div><div class='del'>-	 * 1 for xattr if selinux is on</div><div class='del'>-	 */</div><div class='del'>-	trans = btrfs_start_transaction(root, 5);</div><div class='del'>-	if (IS_ERR(trans))</div><div class='del'>-		return PTR_ERR(trans);</div><div class='add'>+	struct btrfs_new_inode_args new_inode_args = {</div><div class='add'>+		.dir = dir,</div><div class='add'>+		.dentry = dentry,</div><div class='add'>+		.inode = inode,</div><div class='add'>+	};</div><div class='add'>+	unsigned int trans_num_items;</div><div class='add'>+	struct btrfs_trans_handle *trans;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	err = btrfs_get_free_objectid(root, &amp;objectid);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out_unlock;</div><div class='add'>+	ret = btrfs_new_inode_prepare(&amp;new_inode_args, &amp;trans_num_items);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_inode;</div><div class='ctx'> </div><div class='del'>-	inode = btrfs_new_inode(trans, root, mnt_userns, dir,</div><div class='del'>-			dentry-&gt;d_name.name, dentry-&gt;d_name.len,</div><div class='del'>-			btrfs_ino(BTRFS_I(dir)), objectid, mode, &amp;index);</div><div class='del'>-	if (IS_ERR(inode)) {</div><div class='del'>-		err = PTR_ERR(inode);</div><div class='del'>-		inode = NULL;</div><div class='del'>-		goto out_unlock;</div><div class='add'>+	trans = btrfs_start_transaction(root, trans_num_items);</div><div class='add'>+	if (IS_ERR(trans)) {</div><div class='add'>+		ret = PTR_ERR(trans);</div><div class='add'>+		goto out_new_inode_args;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	* If the active LSM wants to access the inode during</div><div class='del'>-	* d_instantiate it needs these. Smack checks to see</div><div class='del'>-	* if the filesystem supports xattrs by looking at the</div><div class='del'>-	* ops vector.</div><div class='del'>-	*/</div><div class='del'>-	inode-&gt;i_op = &amp;btrfs_special_inode_operations;</div><div class='del'>-	init_special_inode(inode, inode-&gt;i_mode, rdev);</div><div class='del'>-</div><div class='del'>-	err = btrfs_init_inode_security(trans, inode, dir, &amp;dentry-&gt;d_name);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out_unlock;</div><div class='del'>-</div><div class='del'>-	err = btrfs_add_nondir(trans, BTRFS_I(dir), dentry, BTRFS_I(inode),</div><div class='del'>-			0, index);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out_unlock;</div><div class='del'>-</div><div class='del'>-	btrfs_update_inode(trans, root, BTRFS_I(inode));</div><div class='del'>-	d_instantiate_new(dentry, inode);</div><div class='add'>+	ret = btrfs_create_new_inode(trans, &amp;new_inode_args);</div><div class='add'>+	if (!ret) {</div><div class='add'>+		if (S_ISDIR(inode-&gt;i_mode))</div><div class='add'>+			inode-&gt;i_opflags |= IOP_FASTPERM_MAY_EXEC;</div><div class='add'>+		d_instantiate_new(dentry, inode);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-out_unlock:</div><div class='ctx'> 	btrfs_end_transaction(trans);</div><div class='ctx'> 	btrfs_btree_balance_dirty(fs_info);</div><div class='del'>-	if (err &amp;&amp; inode) {</div><div class='del'>-		inode_dec_link_count(inode);</div><div class='del'>-		discard_new_inode(inode);</div><div class='del'>-	}</div><div class='del'>-	return err;</div><div class='add'>+out_new_inode_args:</div><div class='add'>+	btrfs_new_inode_args_destroy(&amp;new_inode_args);</div><div class='add'>+out_inode:</div><div class='add'>+	if (ret)</div><div class='add'>+		iput(inode);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btrfs_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-			struct dentry *dentry, umode_t mode, bool excl)</div><div class='add'>+static int btrfs_mknod(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+		       struct dentry *dentry, umode_t mode, dev_t rdev)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(dir-&gt;i_sb);</div><div class='del'>-	struct btrfs_trans_handle *trans;</div><div class='del'>-	struct btrfs_root *root = BTRFS_I(dir)-&gt;root;</div><div class='del'>-	struct inode *inode = NULL;</div><div class='del'>-	int err;</div><div class='del'>-	u64 objectid;</div><div class='del'>-	u64 index = 0;</div><div class='add'>+	struct inode *inode;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * 2 for inode item and ref</div><div class='del'>-	 * 2 for dir items</div><div class='del'>-	 * 1 for xattr if selinux is on</div><div class='del'>-	 */</div><div class='del'>-	trans = btrfs_start_transaction(root, 5);</div><div class='del'>-	if (IS_ERR(trans))</div><div class='del'>-		return PTR_ERR(trans);</div><div class='add'>+	inode = new_inode(dir-&gt;i_sb);</div><div class='add'>+	if (!inode)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	inode_init_owner(idmap, inode, dir, mode);</div><div class='add'>+	inode-&gt;i_op = &amp;btrfs_special_inode_operations;</div><div class='add'>+	init_special_inode(inode, inode-&gt;i_mode, rdev);</div><div class='add'>+	return btrfs_create_common(dir, dentry, inode);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	err = btrfs_get_free_objectid(root, &amp;objectid);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out_unlock;</div><div class='add'>+static int btrfs_create(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+			struct dentry *dentry, umode_t mode, bool excl)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode;</div><div class='ctx'> </div><div class='del'>-	inode = btrfs_new_inode(trans, root, mnt_userns, dir,</div><div class='del'>-			dentry-&gt;d_name.name, dentry-&gt;d_name.len,</div><div class='del'>-			btrfs_ino(BTRFS_I(dir)), objectid, mode, &amp;index);</div><div class='del'>-	if (IS_ERR(inode)) {</div><div class='del'>-		err = PTR_ERR(inode);</div><div class='del'>-		inode = NULL;</div><div class='del'>-		goto out_unlock;</div><div class='del'>-	}</div><div class='del'>-	/*</div><div class='del'>-	* If the active LSM wants to access the inode during</div><div class='del'>-	* d_instantiate it needs these. Smack checks to see</div><div class='del'>-	* if the filesystem supports xattrs by looking at the</div><div class='del'>-	* ops vector.</div><div class='del'>-	*/</div><div class='add'>+	inode = new_inode(dir-&gt;i_sb);</div><div class='add'>+	if (!inode)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	inode_init_owner(idmap, inode, dir, mode);</div><div class='ctx'> 	inode-&gt;i_fop = &amp;btrfs_file_operations;</div><div class='ctx'> 	inode-&gt;i_op = &amp;btrfs_file_inode_operations;</div><div class='ctx'> 	inode-&gt;i_mapping-&gt;a_ops = &amp;btrfs_aops;</div><div class='del'>-</div><div class='del'>-	err = btrfs_init_inode_security(trans, inode, dir, &amp;dentry-&gt;d_name);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out_unlock;</div><div class='del'>-</div><div class='del'>-	err = btrfs_update_inode(trans, root, BTRFS_I(inode));</div><div class='del'>-	if (err)</div><div class='del'>-		goto out_unlock;</div><div class='del'>-</div><div class='del'>-	err = btrfs_add_nondir(trans, BTRFS_I(dir), dentry, BTRFS_I(inode),</div><div class='del'>-			0, index);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out_unlock;</div><div class='del'>-</div><div class='del'>-	d_instantiate_new(dentry, inode);</div><div class='del'>-</div><div class='del'>-out_unlock:</div><div class='del'>-	btrfs_end_transaction(trans);</div><div class='del'>-	if (err &amp;&amp; inode) {</div><div class='del'>-		inode_dec_link_count(inode);</div><div class='del'>-		discard_new_inode(inode);</div><div class='del'>-	}</div><div class='del'>-	btrfs_btree_balance_dirty(fs_info);</div><div class='del'>-	return err;</div><div class='add'>+	return btrfs_create_common(dir, dentry, inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int btrfs_link(struct dentry *old_dentry, struct inode *dir,</div><div class='hunk'>@@ -6845,20 +6892,24 @@ static int btrfs_link(struct dentry *old_dentry, struct inode *dir,</div><div class='ctx'> 	struct btrfs_trans_handle *trans = NULL;</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(dir)-&gt;root;</div><div class='ctx'> 	struct inode *inode = d_inode(old_dentry);</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='add'>+	struct fscrypt_name fname;</div><div class='ctx'> 	u64 index;</div><div class='del'>-	int err;</div><div class='del'>-	int drop_inode = 0;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	/* do not allow sys_link's with other subvols of the same device */</div><div class='del'>-	if (root-&gt;root_key.objectid != BTRFS_I(inode)-&gt;root-&gt;root_key.objectid)</div><div class='add'>+	if (btrfs_root_id(root) != btrfs_root_id(BTRFS_I(inode)-&gt;root))</div><div class='ctx'> 		return -EXDEV;</div><div class='ctx'> </div><div class='ctx'> 	if (inode-&gt;i_nlink &gt;= BTRFS_LINK_MAX)</div><div class='ctx'> 		return -EMLINK;</div><div class='ctx'> </div><div class='del'>-	err = btrfs_set_inode_index(BTRFS_I(dir), &amp;index);</div><div class='del'>-	if (err)</div><div class='add'>+	ret = fscrypt_setup_filename(dir, &amp;dentry-&gt;d_name, 0, &amp;fname);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto fail;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_set_inode_index(BTRFS_I(dir), &amp;index);</div><div class='add'>+	if (ret)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -6869,137 +6920,84 @@ static int btrfs_link(struct dentry *old_dentry, struct inode *dir,</div><div class='ctx'> 	 */</div><div class='ctx'> 	trans = btrfs_start_transaction(root, inode-&gt;i_nlink ? 5 : 6);</div><div class='ctx'> 	if (IS_ERR(trans)) {</div><div class='del'>-		err = PTR_ERR(trans);</div><div class='add'>+		ret = PTR_ERR(trans);</div><div class='ctx'> 		trans = NULL;</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* There are several dir indexes for this inode, clear the cache. */</div><div class='ctx'> 	BTRFS_I(inode)-&gt;dir_index = 0ULL;</div><div class='del'>-	inc_nlink(inode);</div><div class='ctx'> 	inode_inc_iversion(inode);</div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='del'>-	ihold(inode);</div><div class='del'>-	set_bit(BTRFS_INODE_COPY_EVERYTHING, &amp;BTRFS_I(inode)-&gt;runtime_flags);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> </div><div class='del'>-	err = btrfs_add_nondir(trans, BTRFS_I(dir), dentry, BTRFS_I(inode),</div><div class='del'>-			1, index);</div><div class='add'>+	ret = btrfs_add_link(trans, BTRFS_I(dir), BTRFS_I(inode),</div><div class='add'>+			     &amp;fname.disk_name, 1, index);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto fail;</div><div class='ctx'> </div><div class='del'>-	if (err) {</div><div class='del'>-		drop_inode = 1;</div><div class='del'>-	} else {</div><div class='del'>-		struct dentry *parent = dentry-&gt;d_parent;</div><div class='add'>+	/* Link added now we update the inode item with the new link count. */</div><div class='add'>+	inc_nlink(inode);</div><div class='add'>+	ret = btrfs_update_inode(trans, BTRFS_I(inode));</div><div class='add'>+	if (unlikely(ret)) {</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		goto fail;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		err = btrfs_update_inode(trans, root, BTRFS_I(inode));</div><div class='del'>-		if (err)</div><div class='add'>+	if (inode-&gt;i_nlink == 1) {</div><div class='add'>+		/*</div><div class='add'>+		 * If the new hard link count is 1, it's a file created with the</div><div class='add'>+		 * open(2) O_TMPFILE flag.</div><div class='add'>+		 */</div><div class='add'>+		ret = btrfs_orphan_del(trans, BTRFS_I(inode));</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto fail;</div><div class='del'>-		if (inode-&gt;i_nlink == 1) {</div><div class='del'>-			/*</div><div class='del'>-			 * If new hard link count is 1, it's a file created</div><div class='del'>-			 * with open(2) O_TMPFILE flag.</div><div class='del'>-			 */</div><div class='del'>-			err = btrfs_orphan_del(trans, BTRFS_I(inode));</div><div class='del'>-			if (err)</div><div class='del'>-				goto fail;</div><div class='ctx'> 		}</div><div class='del'>-		d_instantiate(dentry, inode);</div><div class='del'>-		btrfs_log_new_name(trans, BTRFS_I(inode), NULL, parent);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/* Grab reference for the new dentry passed to d_instantiate(). */</div><div class='add'>+	ihold(inode);</div><div class='add'>+	d_instantiate(dentry, inode);</div><div class='add'>+	btrfs_log_new_name(trans, old_dentry, NULL, 0, dentry-&gt;d_parent);</div><div class='add'>+</div><div class='ctx'> fail:</div><div class='add'>+	fscrypt_free_filename(&amp;fname);</div><div class='ctx'> 	if (trans)</div><div class='ctx'> 		btrfs_end_transaction(trans);</div><div class='del'>-	if (drop_inode) {</div><div class='del'>-		inode_dec_link_count(inode);</div><div class='del'>-		iput(inode);</div><div class='del'>-	}</div><div class='ctx'> 	btrfs_btree_balance_dirty(fs_info);</div><div class='del'>-	return err;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btrfs_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-		       struct dentry *dentry, umode_t mode)</div><div class='add'>+static struct dentry *btrfs_mkdir(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+				  struct dentry *dentry, umode_t mode)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(dir-&gt;i_sb);</div><div class='del'>-	struct inode *inode = NULL;</div><div class='del'>-	struct btrfs_trans_handle *trans;</div><div class='del'>-	struct btrfs_root *root = BTRFS_I(dir)-&gt;root;</div><div class='del'>-	int err = 0;</div><div class='del'>-	u64 objectid = 0;</div><div class='del'>-	u64 index = 0;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * 2 items for inode and ref</div><div class='del'>-	 * 2 items for dir items</div><div class='del'>-	 * 1 for xattr if selinux is on</div><div class='del'>-	 */</div><div class='del'>-	trans = btrfs_start_transaction(root, 5);</div><div class='del'>-	if (IS_ERR(trans))</div><div class='del'>-		return PTR_ERR(trans);</div><div class='del'>-</div><div class='del'>-	err = btrfs_get_free_objectid(root, &amp;objectid);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out_fail;</div><div class='del'>-</div><div class='del'>-	inode = btrfs_new_inode(trans, root, mnt_userns, dir,</div><div class='del'>-			dentry-&gt;d_name.name, dentry-&gt;d_name.len,</div><div class='del'>-			btrfs_ino(BTRFS_I(dir)), objectid,</div><div class='del'>-			S_IFDIR | mode, &amp;index);</div><div class='del'>-	if (IS_ERR(inode)) {</div><div class='del'>-		err = PTR_ERR(inode);</div><div class='del'>-		inode = NULL;</div><div class='del'>-		goto out_fail;</div><div class='del'>-	}</div><div class='add'>+	struct inode *inode;</div><div class='ctx'> </div><div class='del'>-	/* these must be set before we unlock the inode */</div><div class='add'>+	inode = new_inode(dir-&gt;i_sb);</div><div class='add'>+	if (!inode)</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+	inode_init_owner(idmap, inode, dir, S_IFDIR | mode);</div><div class='ctx'> 	inode-&gt;i_op = &amp;btrfs_dir_inode_operations;</div><div class='ctx'> 	inode-&gt;i_fop = &amp;btrfs_dir_file_operations;</div><div class='del'>-</div><div class='del'>-	err = btrfs_init_inode_security(trans, inode, dir, &amp;dentry-&gt;d_name);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out_fail;</div><div class='del'>-</div><div class='del'>-	btrfs_i_size_write(BTRFS_I(inode), 0);</div><div class='del'>-	err = btrfs_update_inode(trans, root, BTRFS_I(inode));</div><div class='del'>-	if (err)</div><div class='del'>-		goto out_fail;</div><div class='del'>-</div><div class='del'>-	err = btrfs_add_link(trans, BTRFS_I(dir), BTRFS_I(inode),</div><div class='del'>-			dentry-&gt;d_name.name,</div><div class='del'>-			dentry-&gt;d_name.len, 0, index);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out_fail;</div><div class='del'>-</div><div class='del'>-	d_instantiate_new(dentry, inode);</div><div class='del'>-</div><div class='del'>-out_fail:</div><div class='del'>-	btrfs_end_transaction(trans);</div><div class='del'>-	if (err &amp;&amp; inode) {</div><div class='del'>-		inode_dec_link_count(inode);</div><div class='del'>-		discard_new_inode(inode);</div><div class='del'>-	}</div><div class='del'>-	btrfs_btree_balance_dirty(fs_info);</div><div class='del'>-	return err;</div><div class='add'>+	return ERR_PTR(btrfs_create_common(dir, dentry, inode));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static noinline int uncompress_inline(struct btrfs_path *path,</div><div class='del'>-				      struct page *page,</div><div class='del'>-				      size_t pg_offset, u64 extent_offset,</div><div class='add'>+				      struct folio *folio,</div><div class='ctx'> 				      struct btrfs_file_extent_item *item)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct extent_buffer *leaf = path-&gt;nodes[0];</div><div class='add'>+	const u32 blocksize = leaf-&gt;fs_info-&gt;sectorsize;</div><div class='ctx'> 	char *tmp;</div><div class='ctx'> 	size_t max_size;</div><div class='ctx'> 	unsigned long inline_size;</div><div class='ctx'> 	unsigned long ptr;</div><div class='ctx'> 	int compress_type;</div><div class='ctx'> </div><div class='del'>-	WARN_ON(pg_offset != 0);</div><div class='ctx'> 	compress_type = btrfs_file_extent_compression(leaf, item);</div><div class='ctx'> 	max_size = btrfs_file_extent_ram_bytes(leaf, item);</div><div class='del'>-	inline_size = btrfs_file_extent_inline_item_len(leaf,</div><div class='del'>-					btrfs_item_nr(path-&gt;slots[0]));</div><div class='add'>+	inline_size = btrfs_file_extent_inline_item_len(leaf, path-&gt;slots[0]);</div><div class='ctx'> 	tmp = kmalloc(inline_size, GFP_NOFS);</div><div class='ctx'> 	if (!tmp)</div><div class='ctx'> 		return -ENOMEM;</div><div class='hunk'>@@ -7007,9 +7005,9 @@ static noinline int uncompress_inline(struct btrfs_path *path,</div><div class='ctx'> </div><div class='ctx'> 	read_extent_buffer(leaf, tmp, ptr, inline_size);</div><div class='ctx'> </div><div class='del'>-	max_size = min_t(unsigned long, PAGE_SIZE, max_size);</div><div class='del'>-	ret = btrfs_decompress(compress_type, tmp, page,</div><div class='del'>-			       extent_offset, inline_size, max_size);</div><div class='add'>+	max_size = min_t(unsigned long, blocksize, max_size);</div><div class='add'>+	ret = btrfs_decompress(compress_type, tmp, folio, 0, inline_size,</div><div class='add'>+			       max_size);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * decompression code contains a memset to fill in any space between the end</div><div class='hunk'>@@ -7019,25 +7017,51 @@ static noinline int uncompress_inline(struct btrfs_path *path,</div><div class='ctx'> 	 * cover that region here.</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='del'>-	if (max_size + pg_offset &lt; PAGE_SIZE)</div><div class='del'>-		memzero_page(page,  pg_offset + max_size,</div><div class='del'>-			     PAGE_SIZE - max_size - pg_offset);</div><div class='add'>+	if (max_size &lt; blocksize)</div><div class='add'>+		folio_zero_range(folio, max_size, blocksize - max_size);</div><div class='ctx'> 	kfree(tmp);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * btrfs_get_extent - Lookup the first extent overlapping a range in a file.</div><div class='add'>+static int read_inline_extent(struct btrfs_path *path, struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	const u32 blocksize = path-&gt;nodes[0]-&gt;fs_info-&gt;sectorsize;</div><div class='add'>+	struct btrfs_file_extent_item *fi;</div><div class='add'>+	void *kaddr;</div><div class='add'>+	size_t copy_size;</div><div class='add'>+</div><div class='add'>+	if (!folio || folio_test_uptodate(folio))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	ASSERT(folio_pos(folio) == 0);</div><div class='add'>+</div><div class='add'>+	fi = btrfs_item_ptr(path-&gt;nodes[0], path-&gt;slots[0],</div><div class='add'>+			    struct btrfs_file_extent_item);</div><div class='add'>+	if (btrfs_file_extent_compression(path-&gt;nodes[0], fi) != BTRFS_COMPRESS_NONE)</div><div class='add'>+		return uncompress_inline(path, folio, fi);</div><div class='add'>+</div><div class='add'>+	copy_size = min_t(u64, blocksize,</div><div class='add'>+			  btrfs_file_extent_ram_bytes(path-&gt;nodes[0], fi));</div><div class='add'>+	kaddr = kmap_local_folio(folio, 0);</div><div class='add'>+	read_extent_buffer(path-&gt;nodes[0], kaddr,</div><div class='add'>+			   btrfs_file_extent_inline_start(fi), copy_size);</div><div class='add'>+	kunmap_local(kaddr);</div><div class='add'>+	if (copy_size &lt; blocksize)</div><div class='add'>+		folio_zero_range(folio, copy_size, blocksize - copy_size);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Lookup the first extent overlapping a range in a file.</div><div class='add'>+ *</div><div class='ctx'>  * @inode:	file to search in</div><div class='ctx'>  * @page:	page to read extent data into if the extent is inline</div><div class='del'>- * @pg_offset:	offset into @page to copy to</div><div class='ctx'>  * @start:	file offset</div><div class='ctx'>  * @len:	length of range starting at @start</div><div class='ctx'>  *</div><div class='del'>- * This returns the first &amp;struct extent_map which overlaps with the given</div><div class='del'>- * range, reading it from the B-tree and caching it if necessary. Note that</div><div class='del'>- * there may be more extents which overlap the given range after the returned</div><div class='del'>- * extent_map.</div><div class='add'>+ * Return the first &amp;struct extent_map which overlaps the given range, reading</div><div class='add'>+ * it from the B-tree and caching it if necessary. Note that there may be more</div><div class='add'>+ * extents which overlap the given range after the returned extent_map.</div><div class='ctx'>  *</div><div class='ctx'>  * If @page is not NULL and the extent is inline, this also reads the extent</div><div class='ctx'>  * data directly into the page and marks the extent up to date in the io_tree.</div><div class='hunk'>@@ -7045,8 +7069,7 @@ static noinline int uncompress_inline(struct btrfs_path *path,</div><div class='ctx'>  * Return: ERR_PTR on error, non-NULL extent_map on success.</div><div class='ctx'>  */</div><div class='ctx'> struct extent_map *btrfs_get_extent(struct btrfs_inode *inode,</div><div class='del'>-				    struct page *page, size_t pg_offset,</div><div class='del'>-				    u64 start, u64 len)</div><div class='add'>+				    struct folio *folio, u64 start, u64 len)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='ctx'> 	int ret = 0;</div><div class='hunk'>@@ -7061,29 +7084,27 @@ struct extent_map *btrfs_get_extent(struct btrfs_inode *inode,</div><div class='ctx'> 	struct btrfs_key found_key;</div><div class='ctx'> 	struct extent_map *em = NULL;</div><div class='ctx'> 	struct extent_map_tree *em_tree = &amp;inode-&gt;extent_tree;</div><div class='del'>-	struct extent_io_tree *io_tree = &amp;inode-&gt;io_tree;</div><div class='ctx'> </div><div class='ctx'> 	read_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	em = lookup_extent_mapping(em_tree, start, len);</div><div class='add'>+	em = btrfs_lookup_extent_mapping(em_tree, start, len);</div><div class='ctx'> 	read_unlock(&amp;em_tree-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	if (em) {</div><div class='ctx'> 		if (em-&gt;start &gt; start || em-&gt;start + em-&gt;len &lt;= start)</div><div class='del'>-			free_extent_map(em);</div><div class='del'>-		else if (em-&gt;block_start == EXTENT_MAP_INLINE &amp;&amp; page)</div><div class='del'>-			free_extent_map(em);</div><div class='add'>+			btrfs_free_extent_map(em);</div><div class='add'>+		else if (em-&gt;disk_bytenr == EXTENT_MAP_INLINE &amp;&amp; folio)</div><div class='add'>+			btrfs_free_extent_map(em);</div><div class='ctx'> 		else</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='del'>-	em = alloc_extent_map();</div><div class='add'>+	em = btrfs_alloc_extent_map();</div><div class='ctx'> 	if (!em) {</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	em-&gt;start = EXTENT_MAP_HOLE;</div><div class='del'>-	em-&gt;orig_start = EXTENT_MAP_HOLE;</div><div class='add'>+	em-&gt;disk_bytenr = EXTENT_MAP_HOLE;</div><div class='ctx'> 	em-&gt;len = (u64)-1;</div><div class='del'>-	em-&gt;block_len = (u64)-1;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path) {</div><div class='hunk'>@@ -7100,8 +7121,8 @@ struct extent_map *btrfs_get_extent(struct btrfs_inode *inode,</div><div class='ctx'> 	 * point the commit_root has everything we need.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (btrfs_is_free_space_inode(inode)) {</div><div class='del'>-		path-&gt;search_commit_root = 1;</div><div class='del'>-		path-&gt;skip_locking = 1;</div><div class='add'>+		path-&gt;search_commit_root = true;</div><div class='add'>+		path-&gt;skip_locking = true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_lookup_file_extent(NULL, root, path, objectid, start, 0);</div><div class='hunk'>@@ -7136,7 +7157,7 @@ struct extent_map *btrfs_get_extent(struct btrfs_inode *inode,</div><div class='ctx'> 	if (extent_type == BTRFS_FILE_EXTENT_REG ||</div><div class='ctx'> 	    extent_type == BTRFS_FILE_EXTENT_PREALLOC) {</div><div class='ctx'> 		/* Only regular file could have regular/prealloc extent */</div><div class='del'>-		if (!S_ISREG(inode-&gt;vfs_inode.i_mode)) {</div><div class='add'>+		if (unlikely(!S_ISREG(inode-&gt;vfs_inode.i_mode))) {</div><div class='ctx'> 			ret = -EUCLEAN;</div><div class='ctx'> 			btrfs_crit(fs_info,</div><div class='ctx'> 		"regular/prealloc extent found for non-regular inode %llu",</div><div class='hunk'>@@ -7173,70 +7194,47 @@ next:</div><div class='ctx'> </div><div class='ctx'> 		/* New extent overlaps with existing one */</div><div class='ctx'> 		em-&gt;start = start;</div><div class='del'>-		em-&gt;orig_start = start;</div><div class='ctx'> 		em-&gt;len = found_key.offset - start;</div><div class='del'>-		em-&gt;block_start = EXTENT_MAP_HOLE;</div><div class='add'>+		em-&gt;disk_bytenr = EXTENT_MAP_HOLE;</div><div class='ctx'> 		goto insert;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_extent_item_to_extent_map(inode, path, item, !page, em);</div><div class='add'>+	btrfs_extent_item_to_extent_map(inode, path, item, em);</div><div class='ctx'> </div><div class='ctx'> 	if (extent_type == BTRFS_FILE_EXTENT_REG ||</div><div class='ctx'> 	    extent_type == BTRFS_FILE_EXTENT_PREALLOC) {</div><div class='ctx'> 		goto insert;</div><div class='ctx'> 	} else if (extent_type == BTRFS_FILE_EXTENT_INLINE) {</div><div class='del'>-		unsigned long ptr;</div><div class='del'>-		char *map;</div><div class='del'>-		size_t size;</div><div class='del'>-		size_t extent_offset;</div><div class='del'>-		size_t copy_size;</div><div class='add'>+		/*</div><div class='add'>+		 * Inline extent can only exist at file offset 0. This is</div><div class='add'>+		 * ensured by tree-checker and inline extent creation path.</div><div class='add'>+		 * Thus all members representing file offsets should be zero.</div><div class='add'>+		 */</div><div class='add'>+		ASSERT(extent_start == 0);</div><div class='add'>+		ASSERT(em-&gt;start == 0);</div><div class='ctx'> </div><div class='del'>-		if (!page)</div><div class='del'>-			goto out;</div><div class='add'>+		/*</div><div class='add'>+		 * btrfs_extent_item_to_extent_map() should have properly</div><div class='add'>+		 * initialized em members already.</div><div class='add'>+		 *</div><div class='add'>+		 * Other members are not utilized for inline extents.</div><div class='add'>+		 */</div><div class='add'>+		ASSERT(em-&gt;disk_bytenr == EXTENT_MAP_INLINE);</div><div class='add'>+		ASSERT(em-&gt;len == fs_info-&gt;sectorsize);</div><div class='ctx'> </div><div class='del'>-		size = btrfs_file_extent_ram_bytes(leaf, item);</div><div class='del'>-		extent_offset = page_offset(page) + pg_offset - extent_start;</div><div class='del'>-		copy_size = min_t(u64, PAGE_SIZE - pg_offset,</div><div class='del'>-				  size - extent_offset);</div><div class='del'>-		em-&gt;start = extent_start + extent_offset;</div><div class='del'>-		em-&gt;len = ALIGN(copy_size, fs_info-&gt;sectorsize);</div><div class='del'>-		em-&gt;orig_block_len = em-&gt;len;</div><div class='del'>-		em-&gt;orig_start = em-&gt;start;</div><div class='del'>-		ptr = btrfs_file_extent_inline_start(item) + extent_offset;</div><div class='del'>-</div><div class='del'>-		if (!PageUptodate(page)) {</div><div class='del'>-			if (btrfs_file_extent_compression(leaf, item) !=</div><div class='del'>-			    BTRFS_COMPRESS_NONE) {</div><div class='del'>-				ret = uncompress_inline(path, page, pg_offset,</div><div class='del'>-							extent_offset, item);</div><div class='del'>-				if (ret)</div><div class='del'>-					goto out;</div><div class='del'>-			} else {</div><div class='del'>-				map = kmap_local_page(page);</div><div class='del'>-				read_extent_buffer(leaf, map + pg_offset, ptr,</div><div class='del'>-						   copy_size);</div><div class='del'>-				if (pg_offset + copy_size &lt; PAGE_SIZE) {</div><div class='del'>-					memset(map + pg_offset + copy_size, 0,</div><div class='del'>-					       PAGE_SIZE - pg_offset -</div><div class='del'>-					       copy_size);</div><div class='del'>-				}</div><div class='del'>-				kunmap_local(map);</div><div class='del'>-			}</div><div class='del'>-			flush_dcache_page(page);</div><div class='del'>-		}</div><div class='del'>-		set_extent_uptodate(io_tree, em-&gt;start,</div><div class='del'>-				    extent_map_end(em) - 1, NULL, GFP_NOFS);</div><div class='add'>+		ret = read_inline_extent(path, folio);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out;</div><div class='ctx'> 		goto insert;</div><div class='ctx'> 	}</div><div class='ctx'> not_found:</div><div class='ctx'> 	em-&gt;start = start;</div><div class='del'>-	em-&gt;orig_start = start;</div><div class='ctx'> 	em-&gt;len = len;</div><div class='del'>-	em-&gt;block_start = EXTENT_MAP_HOLE;</div><div class='add'>+	em-&gt;disk_bytenr = EXTENT_MAP_HOLE;</div><div class='ctx'> insert:</div><div class='ctx'> 	ret = 0;</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='del'>-	if (em-&gt;start &gt; start || extent_map_end(em) &lt;= start) {</div><div class='add'>+	if (unlikely(em-&gt;start &gt; start || btrfs_extent_map_end(em) &lt;= start)) {</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='ctx'> 			  "bad extent! em: [%llu %llu] passed [%llu %llu]",</div><div class='ctx'> 			  em-&gt;start, em-&gt;len, start, len);</div><div class='hunk'>@@ -7245,7 +7243,7 @@ insert:</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	write_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	ret = btrfs_add_extent_mapping(fs_info, em_tree, &amp;em, start, len);</div><div class='add'>+	ret = btrfs_add_extent_mapping(inode, &amp;em, start, len);</div><div class='ctx'> 	write_unlock(&amp;em_tree-&gt;lock);</div><div class='ctx'> out:</div><div class='ctx'> 	btrfs_free_path(path);</div><div class='hunk'>@@ -7253,201 +7251,12 @@ out:</div><div class='ctx'> 	trace_btrfs_get_extent(root, inode, em);</div><div class='ctx'> </div><div class='ctx'> 	if (ret) {</div><div class='del'>-		free_extent_map(em);</div><div class='add'>+		btrfs_free_extent_map(em);</div><div class='ctx'> 		return ERR_PTR(ret);</div><div class='ctx'> 	}</div><div class='ctx'> 	return em;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct extent_map *btrfs_get_extent_fiemap(struct btrfs_inode *inode,</div><div class='del'>-					   u64 start, u64 len)</div><div class='del'>-{</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	struct extent_map *hole_em = NULL;</div><div class='del'>-	u64 delalloc_start = start;</div><div class='del'>-	u64 end;</div><div class='del'>-	u64 delalloc_len;</div><div class='del'>-	u64 delalloc_end;</div><div class='del'>-	int err = 0;</div><div class='del'>-</div><div class='del'>-	em = btrfs_get_extent(inode, NULL, 0, start, len);</div><div class='del'>-	if (IS_ERR(em))</div><div class='del'>-		return em;</div><div class='del'>-	/*</div><div class='del'>-	 * If our em maps to:</div><div class='del'>-	 * - a hole or</div><div class='del'>-	 * - a pre-alloc extent,</div><div class='del'>-	 * there might actually be delalloc bytes behind it.</div><div class='del'>-	 */</div><div class='del'>-	if (em-&gt;block_start != EXTENT_MAP_HOLE &amp;&amp;</div><div class='del'>-	    !test_bit(EXTENT_FLAG_PREALLOC, &amp;em-&gt;flags))</div><div class='del'>-		return em;</div><div class='del'>-	else</div><div class='del'>-		hole_em = em;</div><div class='del'>-</div><div class='del'>-	/* check to see if we've wrapped (len == -1 or similar) */</div><div class='del'>-	end = start + len;</div><div class='del'>-	if (end &lt; start)</div><div class='del'>-		end = (u64)-1;</div><div class='del'>-	else</div><div class='del'>-		end -= 1;</div><div class='del'>-</div><div class='del'>-	em = NULL;</div><div class='del'>-</div><div class='del'>-	/* ok, we didn't find anything, lets look for delalloc */</div><div class='del'>-	delalloc_len = count_range_bits(&amp;inode-&gt;io_tree, &amp;delalloc_start,</div><div class='del'>-				 end, len, EXTENT_DELALLOC, 1);</div><div class='del'>-	delalloc_end = delalloc_start + delalloc_len;</div><div class='del'>-	if (delalloc_end &lt; delalloc_start)</div><div class='del'>-		delalloc_end = (u64)-1;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * We didn't find anything useful, return the original results from</div><div class='del'>-	 * get_extent()</div><div class='del'>-	 */</div><div class='del'>-	if (delalloc_start &gt; end || delalloc_end &lt;= start) {</div><div class='del'>-		em = hole_em;</div><div class='del'>-		hole_em = NULL;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Adjust the delalloc_start to make sure it doesn't go backwards from</div><div class='del'>-	 * the start they passed in</div><div class='del'>-	 */</div><div class='del'>-	delalloc_start = max(start, delalloc_start);</div><div class='del'>-	delalloc_len = delalloc_end - delalloc_start;</div><div class='del'>-</div><div class='del'>-	if (delalloc_len &gt; 0) {</div><div class='del'>-		u64 hole_start;</div><div class='del'>-		u64 hole_len;</div><div class='del'>-		const u64 hole_end = extent_map_end(hole_em);</div><div class='del'>-</div><div class='del'>-		em = alloc_extent_map();</div><div class='del'>-		if (!em) {</div><div class='del'>-			err = -ENOMEM;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		ASSERT(hole_em);</div><div class='del'>-		/*</div><div class='del'>-		 * When btrfs_get_extent can't find anything it returns one</div><div class='del'>-		 * huge hole</div><div class='del'>-		 *</div><div class='del'>-		 * Make sure what it found really fits our range, and adjust to</div><div class='del'>-		 * make sure it is based on the start from the caller</div><div class='del'>-		 */</div><div class='del'>-		if (hole_end &lt;= start || hole_em-&gt;start &gt; end) {</div><div class='del'>-		       free_extent_map(hole_em);</div><div class='del'>-		       hole_em = NULL;</div><div class='del'>-		} else {</div><div class='del'>-		       hole_start = max(hole_em-&gt;start, start);</div><div class='del'>-		       hole_len = hole_end - hole_start;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (hole_em &amp;&amp; delalloc_start &gt; hole_start) {</div><div class='del'>-			/*</div><div class='del'>-			 * Our hole starts before our delalloc, so we have to</div><div class='del'>-			 * return just the parts of the hole that go until the</div><div class='del'>-			 * delalloc starts</div><div class='del'>-			 */</div><div class='del'>-			em-&gt;len = min(hole_len, delalloc_start - hole_start);</div><div class='del'>-			em-&gt;start = hole_start;</div><div class='del'>-			em-&gt;orig_start = hole_start;</div><div class='del'>-			/*</div><div class='del'>-			 * Don't adjust block start at all, it is fixed at</div><div class='del'>-			 * EXTENT_MAP_HOLE</div><div class='del'>-			 */</div><div class='del'>-			em-&gt;block_start = hole_em-&gt;block_start;</div><div class='del'>-			em-&gt;block_len = hole_len;</div><div class='del'>-			if (test_bit(EXTENT_FLAG_PREALLOC, &amp;hole_em-&gt;flags))</div><div class='del'>-				set_bit(EXTENT_FLAG_PREALLOC, &amp;em-&gt;flags);</div><div class='del'>-		} else {</div><div class='del'>-			/*</div><div class='del'>-			 * Hole is out of passed range or it starts after</div><div class='del'>-			 * delalloc range</div><div class='del'>-			 */</div><div class='del'>-			em-&gt;start = delalloc_start;</div><div class='del'>-			em-&gt;len = delalloc_len;</div><div class='del'>-			em-&gt;orig_start = delalloc_start;</div><div class='del'>-			em-&gt;block_start = EXTENT_MAP_DELALLOC;</div><div class='del'>-			em-&gt;block_len = delalloc_len;</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-		return hole_em;</div><div class='del'>-	}</div><div class='del'>-out:</div><div class='del'>-</div><div class='del'>-	free_extent_map(hole_em);</div><div class='del'>-	if (err) {</div><div class='del'>-		free_extent_map(em);</div><div class='del'>-		return ERR_PTR(err);</div><div class='del'>-	}</div><div class='del'>-	return em;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct extent_map *btrfs_create_dio_extent(struct btrfs_inode *inode,</div><div class='del'>-						  const u64 start,</div><div class='del'>-						  const u64 len,</div><div class='del'>-						  const u64 orig_start,</div><div class='del'>-						  const u64 block_start,</div><div class='del'>-						  const u64 block_len,</div><div class='del'>-						  const u64 orig_block_len,</div><div class='del'>-						  const u64 ram_bytes,</div><div class='del'>-						  const int type)</div><div class='del'>-{</div><div class='del'>-	struct extent_map *em = NULL;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (type != BTRFS_ORDERED_NOCOW) {</div><div class='del'>-		em = create_io_em(inode, start, len, orig_start, block_start,</div><div class='del'>-				  block_len, orig_block_len, ram_bytes,</div><div class='del'>-				  BTRFS_COMPRESS_NONE, /* compress_type */</div><div class='del'>-				  type);</div><div class='del'>-		if (IS_ERR(em))</div><div class='del'>-			goto out;</div><div class='del'>-	}</div><div class='del'>-	ret = btrfs_add_ordered_extent_dio(inode, start, block_start, len,</div><div class='del'>-					   block_len, type);</div><div class='del'>-	if (ret) {</div><div class='del'>-		if (em) {</div><div class='del'>-			free_extent_map(em);</div><div class='del'>-			btrfs_drop_extent_cache(inode, start, start + len - 1, 0);</div><div class='del'>-		}</div><div class='del'>-		em = ERR_PTR(ret);</div><div class='del'>-	}</div><div class='del'>- out:</div><div class='del'>-</div><div class='del'>-	return em;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct extent_map *btrfs_new_extent_direct(struct btrfs_inode *inode,</div><div class='del'>-						  u64 start, u64 len)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_root *root = inode-&gt;root;</div><div class='del'>-	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	struct btrfs_key ins;</div><div class='del'>-	u64 alloc_hint;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	alloc_hint = get_extent_allocation_hint(inode, start, len);</div><div class='del'>-	ret = btrfs_reserve_extent(root, len, len, fs_info-&gt;sectorsize,</div><div class='del'>-				   0, alloc_hint, &amp;ins, 1, 1);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ERR_PTR(ret);</div><div class='del'>-</div><div class='del'>-	em = btrfs_create_dio_extent(inode, start, ins.offset, start,</div><div class='del'>-				     ins.objectid, ins.offset, ins.offset,</div><div class='del'>-				     ins.offset, BTRFS_ORDERED_REGULAR);</div><div class='del'>-	btrfs_dec_block_group_reservations(fs_info, ins.objectid);</div><div class='del'>-	if (IS_ERR(em))</div><div class='del'>-		btrfs_free_reserved_extent(fs_info, ins.objectid, ins.offset,</div><div class='del'>-					   1);</div><div class='del'>-</div><div class='del'>-	return em;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static bool btrfs_extent_readonly(struct btrfs_fs_info *fs_info, u64 bytenr)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_block_group *block_group;</div><div class='hunk'>@@ -7470,8 +7279,6 @@ static bool btrfs_extent_readonly(struct btrfs_fs_info *fs_info, u64 bytenr)</div><div class='ctx'>  * @orig_start:	(optional) Return the original file offset of the file extent</div><div class='ctx'>  * @orig_len:	(optional) Return the original on-disk length of the file extent</div><div class='ctx'>  * @ram_bytes:	(optional) Return the ram_bytes of the file extent</div><div class='del'>- * @strict:	if true, omit optimizations that might force us into unnecessary</div><div class='del'>- *		cow. e.g., don't trust generation number.</div><div class='ctx'>  *</div><div class='ctx'>  * Return:</div><div class='ctx'>  * &gt;0	and update @len if we can do nocow write</div><div class='hunk'>@@ -7481,1010 +7288,183 @@ static bool btrfs_extent_readonly(struct btrfs_fs_info *fs_info, u64 bytenr)</div><div class='ctx'>  * NOTE: This only checks the file extents, caller is responsible to wait for</div><div class='ctx'>  *	 any ordered extents.</div><div class='ctx'>  */</div><div class='del'>-noinline int can_nocow_extent(struct inode *inode, u64 offset, u64 *len,</div><div class='del'>-			      u64 *orig_start, u64 *orig_block_len,</div><div class='del'>-			      u64 *ram_bytes, bool strict)</div><div class='add'>+noinline int can_nocow_extent(struct btrfs_inode *inode, u64 offset, u64 *len,</div><div class='add'>+			      struct btrfs_file_extent *file_extent,</div><div class='add'>+			      bool nowait)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+	struct can_nocow_file_extent_args nocow_args = { 0 };</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='del'>-	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='del'>-	struct extent_io_tree *io_tree = &amp;BTRFS_I(inode)-&gt;io_tree;</div><div class='add'>+	struct extent_io_tree *io_tree = &amp;inode-&gt;io_tree;</div><div class='ctx'> 	struct btrfs_file_extent_item *fi;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='del'>-	u64 disk_bytenr;</div><div class='del'>-	u64 backref_offset;</div><div class='del'>-	u64 extent_end;</div><div class='del'>-	u64 num_bytes;</div><div class='del'>-	int slot;</div><div class='ctx'> 	int found_type;</div><div class='del'>-	bool nocow = (BTRFS_I(inode)-&gt;flags &amp; BTRFS_INODE_NODATACOW);</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='add'>+	path-&gt;nowait = nowait;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_lookup_file_extent(NULL, root, path,</div><div class='del'>-			btrfs_ino(BTRFS_I(inode)), offset, 0);</div><div class='add'>+	ret = btrfs_lookup_file_extent(NULL, root, path, btrfs_ino(inode),</div><div class='add'>+				       offset, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	slot = path-&gt;slots[0];</div><div class='ctx'> 	if (ret == 1) {</div><div class='del'>-		if (slot == 0) {</div><div class='del'>-			/* can't find the item, must cow */</div><div class='del'>-			ret = 0;</div><div class='del'>-			goto out;</div><div class='add'>+		if (path-&gt;slots[0] == 0) {</div><div class='add'>+			/* Can't find the item, must COW. */</div><div class='add'>+			return 0;</div><div class='ctx'> 		}</div><div class='del'>-		slot--;</div><div class='add'>+		path-&gt;slots[0]--;</div><div class='ctx'> 	}</div><div class='ctx'> 	ret = 0;</div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='del'>-	btrfs_item_key_to_cpu(leaf, &amp;key, slot);</div><div class='del'>-	if (key.objectid != btrfs_ino(BTRFS_I(inode)) ||</div><div class='add'>+	btrfs_item_key_to_cpu(leaf, &amp;key, path-&gt;slots[0]);</div><div class='add'>+	if (key.objectid != btrfs_ino(inode) ||</div><div class='ctx'> 	    key.type != BTRFS_EXTENT_DATA_KEY) {</div><div class='del'>-		/* not our file or wrong item type, must cow */</div><div class='del'>-		goto out;</div><div class='add'>+		/* Not our file or wrong item type, must COW. */</div><div class='add'>+		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (key.offset &gt; offset) {</div><div class='del'>-		/* Wrong offset, must cow */</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	fi = btrfs_item_ptr(leaf, slot, struct btrfs_file_extent_item);</div><div class='del'>-	found_type = btrfs_file_extent_type(leaf, fi);</div><div class='del'>-	if (found_type != BTRFS_FILE_EXTENT_REG &amp;&amp;</div><div class='del'>-	    found_type != BTRFS_FILE_EXTENT_PREALLOC) {</div><div class='del'>-		/* not a regular extent, must cow */</div><div class='del'>-		goto out;</div><div class='add'>+		/* Wrong offset, must COW. */</div><div class='add'>+		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!nocow &amp;&amp; found_type == BTRFS_FILE_EXTENT_REG)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	extent_end = key.offset + btrfs_file_extent_num_bytes(leaf, fi);</div><div class='del'>-	if (extent_end &lt;= offset)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	disk_bytenr = btrfs_file_extent_disk_bytenr(leaf, fi);</div><div class='del'>-	if (disk_bytenr == 0)</div><div class='del'>-		goto out;</div><div class='add'>+	if (btrfs_file_extent_end(path) &lt;= offset)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	if (btrfs_file_extent_compression(leaf, fi) ||</div><div class='del'>-	    btrfs_file_extent_encryption(leaf, fi) ||</div><div class='del'>-	    btrfs_file_extent_other_encoding(leaf, fi))</div><div class='del'>-		goto out;</div><div class='add'>+	fi = btrfs_item_ptr(leaf, path-&gt;slots[0], struct btrfs_file_extent_item);</div><div class='add'>+	found_type = btrfs_file_extent_type(leaf, fi);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Do the same check as in btrfs_cross_ref_exist but without the</div><div class='del'>-	 * unnecessary search.</div><div class='del'>-	 */</div><div class='del'>-	if (!strict &amp;&amp;</div><div class='del'>-	    (btrfs_file_extent_generation(leaf, fi) &lt;=</div><div class='del'>-	     btrfs_root_last_snapshot(&amp;root-&gt;root_item)))</div><div class='del'>-		goto out;</div><div class='add'>+	nocow_args.start = offset;</div><div class='add'>+	nocow_args.end = offset + *len - 1;</div><div class='add'>+	nocow_args.free_path = true;</div><div class='ctx'> </div><div class='del'>-	backref_offset = btrfs_file_extent_offset(leaf, fi);</div><div class='add'>+	ret = can_nocow_file_extent(path, &amp;key, inode, &amp;nocow_args);</div><div class='add'>+	/* can_nocow_file_extent() has freed the path. */</div><div class='add'>+	path = NULL;</div><div class='ctx'> </div><div class='del'>-	if (orig_start) {</div><div class='del'>-		*orig_start = key.offset - backref_offset;</div><div class='del'>-		*orig_block_len = btrfs_file_extent_disk_num_bytes(leaf, fi);</div><div class='del'>-		*ram_bytes = btrfs_file_extent_ram_bytes(leaf, fi);</div><div class='add'>+	if (ret != 1) {</div><div class='add'>+		/* Treat errors as not being able to NOCOW. */</div><div class='add'>+		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (btrfs_extent_readonly(fs_info, disk_bytenr))</div><div class='del'>-		goto out;</div><div class='add'>+	if (btrfs_extent_readonly(fs_info,</div><div class='add'>+				  nocow_args.file_extent.disk_bytenr +</div><div class='add'>+				  nocow_args.file_extent.offset))</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	num_bytes = min(offset + *len, extent_end) - offset;</div><div class='del'>-	if (!nocow &amp;&amp; found_type == BTRFS_FILE_EXTENT_PREALLOC) {</div><div class='add'>+	if (!(inode-&gt;flags &amp; BTRFS_INODE_NODATACOW) &amp;&amp;</div><div class='add'>+	    found_type == BTRFS_FILE_EXTENT_PREALLOC) {</div><div class='ctx'> 		u64 range_end;</div><div class='ctx'> </div><div class='del'>-		range_end = round_up(offset + num_bytes,</div><div class='add'>+		range_end = round_up(offset + nocow_args.file_extent.num_bytes,</div><div class='ctx'> 				     root-&gt;fs_info-&gt;sectorsize) - 1;</div><div class='del'>-		ret = test_range_bit(io_tree, offset, range_end,</div><div class='del'>-				     EXTENT_DELALLOC, 0, NULL);</div><div class='del'>-		if (ret) {</div><div class='del'>-			ret = -EAGAIN;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	btrfs_release_path(path);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * look for other files referencing this extent, if we</div><div class='del'>-	 * find any we must cow</div><div class='del'>-	 */</div><div class='del'>-</div><div class='del'>-	ret = btrfs_cross_ref_exist(root, btrfs_ino(BTRFS_I(inode)),</div><div class='del'>-				    key.offset - backref_offset, disk_bytenr,</div><div class='del'>-				    strict);</div><div class='del'>-	if (ret) {</div><div class='del'>-		ret = 0;</div><div class='del'>-		goto out;</div><div class='add'>+		ret = btrfs_test_range_bit_exists(io_tree, offset, range_end,</div><div class='add'>+						  EXTENT_DELALLOC);</div><div class='add'>+		if (ret)</div><div class='add'>+			return -EAGAIN;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * adjust disk_bytenr and num_bytes to cover just the bytes</div><div class='del'>-	 * in this extent we are about to write.  If there</div><div class='del'>-	 * are any csums in that range we have to cow in order</div><div class='del'>-	 * to keep the csums correct</div><div class='del'>-	 */</div><div class='del'>-	disk_bytenr += backref_offset;</div><div class='del'>-	disk_bytenr += offset - key.offset;</div><div class='del'>-	if (csum_exist_in_range(fs_info, disk_bytenr, num_bytes))</div><div class='del'>-		goto out;</div><div class='del'>-	/*</div><div class='del'>-	 * all of the above have passed, it is safe to overwrite this extent</div><div class='del'>-	 * without cow</div><div class='del'>-	 */</div><div class='del'>-	*len = num_bytes;</div><div class='del'>-	ret = 1;</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int lock_extent_direct(struct inode *inode, u64 lockstart, u64 lockend,</div><div class='del'>-			      struct extent_state **cached_state, bool writing)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_ordered_extent *ordered;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	while (1) {</div><div class='del'>-		lock_extent_bits(&amp;BTRFS_I(inode)-&gt;io_tree, lockstart, lockend,</div><div class='del'>-				 cached_state);</div><div class='del'>-		/*</div><div class='del'>-		 * We're concerned with the entire range that we're going to be</div><div class='del'>-		 * doing DIO to, so we need to make sure there's no ordered</div><div class='del'>-		 * extents in this range.</div><div class='del'>-		 */</div><div class='del'>-		ordered = btrfs_lookup_ordered_range(BTRFS_I(inode), lockstart,</div><div class='del'>-						     lockend - lockstart + 1);</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * We need to make sure there are no buffered pages in this</div><div class='del'>-		 * range either, we could have raced between the invalidate in</div><div class='del'>-		 * generic_file_direct_write and locking the extent.  The</div><div class='del'>-		 * invalidate needs to happen so that reads after a write do not</div><div class='del'>-		 * get stale data.</div><div class='del'>-		 */</div><div class='del'>-		if (!ordered &amp;&amp;</div><div class='del'>-		    (!writing || !filemap_range_has_page(inode-&gt;i_mapping,</div><div class='del'>-							 lockstart, lockend)))</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		unlock_extent_cached(&amp;BTRFS_I(inode)-&gt;io_tree, lockstart, lockend,</div><div class='del'>-				     cached_state);</div><div class='del'>-</div><div class='del'>-		if (ordered) {</div><div class='del'>-			/*</div><div class='del'>-			 * If we are doing a DIO read and the ordered extent we</div><div class='del'>-			 * found is for a buffered write, we can not wait for it</div><div class='del'>-			 * to complete and retry, because if we do so we can</div><div class='del'>-			 * deadlock with concurrent buffered writes on page</div><div class='del'>-			 * locks. This happens only if our DIO read covers more</div><div class='del'>-			 * than one extent map, if at this point has already</div><div class='del'>-			 * created an ordered extent for a previous extent map</div><div class='del'>-			 * and locked its range in the inode's io tree, and a</div><div class='del'>-			 * concurrent write against that previous extent map's</div><div class='del'>-			 * range and this range started (we unlock the ranges</div><div class='del'>-			 * in the io tree only when the bios complete and</div><div class='del'>-			 * buffered writes always lock pages before attempting</div><div class='del'>-			 * to lock range in the io tree).</div><div class='del'>-			 */</div><div class='del'>-			if (writing ||</div><div class='del'>-			    test_bit(BTRFS_ORDERED_DIRECT, &amp;ordered-&gt;flags))</div><div class='del'>-				btrfs_start_ordered_extent(ordered, 1);</div><div class='del'>-			else</div><div class='del'>-				ret = -ENOTBLK;</div><div class='del'>-			btrfs_put_ordered_extent(ordered);</div><div class='del'>-		} else {</div><div class='del'>-			/*</div><div class='del'>-			 * We could trigger writeback for this range (and wait</div><div class='del'>-			 * for it to complete) and then invalidate the pages for</div><div class='del'>-			 * this range (through invalidate_inode_pages2_range()),</div><div class='del'>-			 * but that can lead us to a deadlock with a concurrent</div><div class='del'>-			 * call to readahead (a buffered read or a defrag call</div><div class='del'>-			 * triggered a readahead) on a page lock due to an</div><div class='del'>-			 * ordered dio extent we created before but did not have</div><div class='del'>-			 * yet a corresponding bio submitted (whence it can not</div><div class='del'>-			 * complete), which makes readahead wait for that</div><div class='del'>-			 * ordered extent to complete while holding a lock on</div><div class='del'>-			 * that page.</div><div class='del'>-			 */</div><div class='del'>-			ret = -ENOTBLK;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (ret)</div><div class='del'>-			break;</div><div class='add'>+	if (file_extent)</div><div class='add'>+		memcpy(file_extent, &amp;nocow_args.file_extent, sizeof(*file_extent));</div><div class='ctx'> </div><div class='del'>-		cond_resched();</div><div class='del'>-	}</div><div class='add'>+	*len = nocow_args.file_extent.num_bytes;</div><div class='ctx'> </div><div class='del'>-	return ret;</div><div class='add'>+	return 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* The callers of this must take lock_extent() */</div><div class='del'>-static struct extent_map *create_io_em(struct btrfs_inode *inode, u64 start,</div><div class='del'>-				       u64 len, u64 orig_start, u64 block_start,</div><div class='del'>-				       u64 block_len, u64 orig_block_len,</div><div class='del'>-				       u64 ram_bytes, int compress_type,</div><div class='del'>-				       int type)</div><div class='add'>+struct extent_map *btrfs_create_io_em(struct btrfs_inode *inode, u64 start,</div><div class='add'>+				      const struct btrfs_file_extent *file_extent,</div><div class='add'>+				      int type)</div><div class='ctx'> {</div><div class='del'>-	struct extent_map_tree *em_tree;</div><div class='ctx'> 	struct extent_map *em;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Note the missing NOCOW type.</div><div class='add'>+	 *</div><div class='add'>+	 * For pure NOCOW writes, we should not create an io extent map, but</div><div class='add'>+	 * just reusing the existing one.</div><div class='add'>+	 * Only PREALLOC writes (NOCOW write into preallocated range) can</div><div class='add'>+	 * create an io extent map.</div><div class='add'>+	 */</div><div class='ctx'> 	ASSERT(type == BTRFS_ORDERED_PREALLOC ||</div><div class='ctx'> 	       type == BTRFS_ORDERED_COMPRESSED ||</div><div class='del'>-	       type == BTRFS_ORDERED_NOCOW ||</div><div class='ctx'> 	       type == BTRFS_ORDERED_REGULAR);</div><div class='ctx'> </div><div class='del'>-	em_tree = &amp;inode-&gt;extent_tree;</div><div class='del'>-	em = alloc_extent_map();</div><div class='add'>+	switch (type) {</div><div class='add'>+	case BTRFS_ORDERED_PREALLOC:</div><div class='add'>+		/* We're only referring part of a larger preallocated extent. */</div><div class='add'>+		ASSERT(file_extent-&gt;num_bytes &lt;= file_extent-&gt;ram_bytes);</div><div class='add'>+		break;</div><div class='add'>+	case BTRFS_ORDERED_REGULAR:</div><div class='add'>+		/* COW results a new extent matching our file extent size. */</div><div class='add'>+		ASSERT(file_extent-&gt;disk_num_bytes == file_extent-&gt;num_bytes);</div><div class='add'>+		ASSERT(file_extent-&gt;ram_bytes == file_extent-&gt;num_bytes);</div><div class='add'>+</div><div class='add'>+		/* Since it's a new extent, we should not have any offset. */</div><div class='add'>+		ASSERT(file_extent-&gt;offset == 0);</div><div class='add'>+		break;</div><div class='add'>+	case BTRFS_ORDERED_COMPRESSED:</div><div class='add'>+		/* Must be compressed. */</div><div class='add'>+		ASSERT(file_extent-&gt;compression != BTRFS_COMPRESS_NONE);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Encoded write can make us to refer to part of the</div><div class='add'>+		 * uncompressed extent.</div><div class='add'>+		 */</div><div class='add'>+		ASSERT(file_extent-&gt;num_bytes &lt;= file_extent-&gt;ram_bytes);</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	em = btrfs_alloc_extent_map();</div><div class='ctx'> 	if (!em)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='ctx'> 	em-&gt;start = start;</div><div class='del'>-	em-&gt;orig_start = orig_start;</div><div class='del'>-	em-&gt;len = len;</div><div class='del'>-	em-&gt;block_len = block_len;</div><div class='del'>-	em-&gt;block_start = block_start;</div><div class='del'>-	em-&gt;orig_block_len = orig_block_len;</div><div class='del'>-	em-&gt;ram_bytes = ram_bytes;</div><div class='add'>+	em-&gt;len = file_extent-&gt;num_bytes;</div><div class='add'>+	em-&gt;disk_bytenr = file_extent-&gt;disk_bytenr;</div><div class='add'>+	em-&gt;disk_num_bytes = file_extent-&gt;disk_num_bytes;</div><div class='add'>+	em-&gt;ram_bytes = file_extent-&gt;ram_bytes;</div><div class='ctx'> 	em-&gt;generation = -1;</div><div class='del'>-	set_bit(EXTENT_FLAG_PINNED, &amp;em-&gt;flags);</div><div class='del'>-	if (type == BTRFS_ORDERED_PREALLOC) {</div><div class='del'>-		set_bit(EXTENT_FLAG_FILLING, &amp;em-&gt;flags);</div><div class='del'>-	} else if (type == BTRFS_ORDERED_COMPRESSED) {</div><div class='del'>-		set_bit(EXTENT_FLAG_COMPRESSED, &amp;em-&gt;flags);</div><div class='del'>-		em-&gt;compress_type = compress_type;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		btrfs_drop_extent_cache(inode, em-&gt;start,</div><div class='del'>-					em-&gt;start + em-&gt;len - 1, 0);</div><div class='del'>-		write_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-		ret = add_extent_mapping(em_tree, em, 1);</div><div class='del'>-		write_unlock(&amp;em_tree-&gt;lock);</div><div class='del'>-		/*</div><div class='del'>-		 * The caller has taken lock_extent(), who could race with us</div><div class='del'>-		 * to add em?</div><div class='del'>-		 */</div><div class='del'>-	} while (ret == -EEXIST);</div><div class='add'>+	em-&gt;offset = file_extent-&gt;offset;</div><div class='add'>+	em-&gt;flags |= EXTENT_FLAG_PINNED;</div><div class='add'>+	if (type == BTRFS_ORDERED_COMPRESSED)</div><div class='add'>+		btrfs_extent_map_set_compression(em, file_extent-&gt;compression);</div><div class='ctx'> </div><div class='add'>+	ret = btrfs_replace_extent_map_range(inode, em, true);</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		free_extent_map(em);</div><div class='add'>+		btrfs_free_extent_map(em);</div><div class='ctx'> 		return ERR_PTR(ret);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* em got 2 refs now, callers needs to do free_extent_map once. */</div><div class='add'>+	/* em got 2 refs now, callers needs to do btrfs_free_extent_map once. */</div><div class='ctx'> 	return em;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-</div><div class='del'>-static int btrfs_get_blocks_direct_write(struct extent_map **map,</div><div class='del'>-					 struct inode *inode,</div><div class='del'>-					 struct btrfs_dio_data *dio_data,</div><div class='del'>-					 u64 start, u64 len)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	struct extent_map *em = *map;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * We don't allocate a new extent in the following cases</div><div class='del'>-	 *</div><div class='del'>-	 * 1) The inode is marked as NODATACOW. In this case we'll just use the</div><div class='del'>-	 * existing extent.</div><div class='del'>-	 * 2) The extent is marked as PREALLOC. We're good to go here and can</div><div class='del'>-	 * just use the extent.</div><div class='del'>-	 *</div><div class='del'>-	 */</div><div class='del'>-	if (test_bit(EXTENT_FLAG_PREALLOC, &amp;em-&gt;flags) ||</div><div class='del'>-	    ((BTRFS_I(inode)-&gt;flags &amp; BTRFS_INODE_NODATACOW) &amp;&amp;</div><div class='del'>-	     em-&gt;block_start != EXTENT_MAP_HOLE)) {</div><div class='del'>-		int type;</div><div class='del'>-		u64 block_start, orig_start, orig_block_len, ram_bytes;</div><div class='del'>-</div><div class='del'>-		if (test_bit(EXTENT_FLAG_PREALLOC, &amp;em-&gt;flags))</div><div class='del'>-			type = BTRFS_ORDERED_PREALLOC;</div><div class='del'>-		else</div><div class='del'>-			type = BTRFS_ORDERED_NOCOW;</div><div class='del'>-		len = min(len, em-&gt;len - (start - em-&gt;start));</div><div class='del'>-		block_start = em-&gt;block_start + (start - em-&gt;start);</div><div class='del'>-</div><div class='del'>-		if (can_nocow_extent(inode, start, &amp;len, &amp;orig_start,</div><div class='del'>-				     &amp;orig_block_len, &amp;ram_bytes, false) == 1 &amp;&amp;</div><div class='del'>-		    btrfs_inc_nocow_writers(fs_info, block_start)) {</div><div class='del'>-			struct extent_map *em2;</div><div class='del'>-</div><div class='del'>-			em2 = btrfs_create_dio_extent(BTRFS_I(inode), start, len,</div><div class='del'>-						      orig_start, block_start,</div><div class='del'>-						      len, orig_block_len,</div><div class='del'>-						      ram_bytes, type);</div><div class='del'>-			btrfs_dec_nocow_writers(fs_info, block_start);</div><div class='del'>-			if (type == BTRFS_ORDERED_PREALLOC) {</div><div class='del'>-				free_extent_map(em);</div><div class='del'>-				*map = em = em2;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			if (em2 &amp;&amp; IS_ERR(em2)) {</div><div class='del'>-				ret = PTR_ERR(em2);</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-			/*</div><div class='del'>-			 * For inode marked NODATACOW or extent marked PREALLOC,</div><div class='del'>-			 * use the existing or preallocated extent, so does not</div><div class='del'>-			 * need to adjust btrfs_space_info's bytes_may_use.</div><div class='del'>-			 */</div><div class='del'>-			btrfs_free_reserved_data_space_noquota(fs_info, len);</div><div class='del'>-			goto skip_cow;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* this will cow the extent */</div><div class='del'>-	free_extent_map(em);</div><div class='del'>-	*map = em = btrfs_new_extent_direct(BTRFS_I(inode), start, len);</div><div class='del'>-	if (IS_ERR(em)) {</div><div class='del'>-		ret = PTR_ERR(em);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	len = min(len, em-&gt;len - (start - em-&gt;start));</div><div class='del'>-</div><div class='del'>-skip_cow:</div><div class='del'>-	/*</div><div class='del'>-	 * Need to update the i_size under the extent lock so buffered</div><div class='del'>-	 * readers will get the updated i_size when we unlock.</div><div class='del'>-	 */</div><div class='del'>-	if (start + len &gt; i_size_read(inode))</div><div class='del'>-		i_size_write(inode, start + len);</div><div class='del'>-</div><div class='del'>-	dio_data-&gt;reserve -= len;</div><div class='del'>-out:</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int btrfs_dio_iomap_begin(struct inode *inode, loff_t start,</div><div class='del'>-		loff_t length, unsigned int flags, struct iomap *iomap,</div><div class='del'>-		struct iomap *srcmap)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	struct extent_state *cached_state = NULL;</div><div class='del'>-	struct btrfs_dio_data *dio_data = NULL;</div><div class='del'>-	u64 lockstart, lockend;</div><div class='del'>-	const bool write = !!(flags &amp; IOMAP_WRITE);</div><div class='del'>-	int ret = 0;</div><div class='del'>-	u64 len = length;</div><div class='del'>-	bool unlock_extents = false;</div><div class='del'>-</div><div class='del'>-	if (!write)</div><div class='del'>-		len = min_t(u64, len, fs_info-&gt;sectorsize);</div><div class='del'>-</div><div class='del'>-	lockstart = start;</div><div class='del'>-	lockend = start + len - 1;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * The generic stuff only does filemap_write_and_wait_range, which</div><div class='del'>-	 * isn't enough if we've written compressed pages to this area, so we</div><div class='del'>-	 * need to flush the dirty pages again to make absolutely sure that any</div><div class='del'>-	 * outstanding dirty pages are on disk.</div><div class='del'>-	 */</div><div class='del'>-	if (test_bit(BTRFS_INODE_HAS_ASYNC_EXTENT,</div><div class='del'>-		     &amp;BTRFS_I(inode)-&gt;runtime_flags)) {</div><div class='del'>-		ret = filemap_fdatawrite_range(inode-&gt;i_mapping, start,</div><div class='del'>-					       start + length - 1);</div><div class='del'>-		if (ret)</div><div class='del'>-			return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	dio_data = kzalloc(sizeof(*dio_data), GFP_NOFS);</div><div class='del'>-	if (!dio_data)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	dio_data-&gt;length = length;</div><div class='del'>-	if (write) {</div><div class='del'>-		dio_data-&gt;reserve = round_up(length, fs_info-&gt;sectorsize);</div><div class='del'>-		ret = btrfs_delalloc_reserve_space(BTRFS_I(inode),</div><div class='del'>-				&amp;dio_data-&gt;data_reserved,</div><div class='del'>-				start, dio_data-&gt;reserve);</div><div class='del'>-		if (ret) {</div><div class='del'>-			extent_changeset_free(dio_data-&gt;data_reserved);</div><div class='del'>-			kfree(dio_data);</div><div class='del'>-			return ret;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	iomap-&gt;private = dio_data;</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If this errors out it's because we couldn't invalidate pagecache for</div><div class='del'>-	 * this range and we need to fallback to buffered.</div><div class='del'>-	 */</div><div class='del'>-	if (lock_extent_direct(inode, lockstart, lockend, &amp;cached_state, write)) {</div><div class='del'>-		ret = -ENOTBLK;</div><div class='del'>-		goto err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, start, len);</div><div class='del'>-	if (IS_ERR(em)) {</div><div class='del'>-		ret = PTR_ERR(em);</div><div class='del'>-		goto unlock_err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Ok for INLINE and COMPRESSED extents we need to fallback on buffered</div><div class='del'>-	 * io.  INLINE is special, and we could probably kludge it in here, but</div><div class='del'>-	 * it's still buffered so for safety lets just fall back to the generic</div><div class='del'>-	 * buffered path.</div><div class='del'>-	 *</div><div class='del'>-	 * For COMPRESSED we _have_ to read the entire extent in so we can</div><div class='del'>-	 * decompress it, so there will be buffering required no matter what we</div><div class='del'>-	 * do, so go ahead and fallback to buffered.</div><div class='del'>-	 *</div><div class='del'>-	 * We return -ENOTBLK because that's what makes DIO go ahead and go back</div><div class='del'>-	 * to buffered IO.  Don't blame me, this is the price we pay for using</div><div class='del'>-	 * the generic code.</div><div class='del'>-	 */</div><div class='del'>-	if (test_bit(EXTENT_FLAG_COMPRESSED, &amp;em-&gt;flags) ||</div><div class='del'>-	    em-&gt;block_start == EXTENT_MAP_INLINE) {</div><div class='del'>-		free_extent_map(em);</div><div class='del'>-		ret = -ENOTBLK;</div><div class='del'>-		goto unlock_err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	len = min(len, em-&gt;len - (start - em-&gt;start));</div><div class='del'>-	if (write) {</div><div class='del'>-		ret = btrfs_get_blocks_direct_write(&amp;em, inode, dio_data,</div><div class='del'>-						    start, len);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			goto unlock_err;</div><div class='del'>-		unlock_extents = true;</div><div class='del'>-		/* Recalc len in case the new em is smaller than requested */</div><div class='del'>-		len = min(len, em-&gt;len - (start - em-&gt;start));</div><div class='del'>-	} else {</div><div class='del'>-		/*</div><div class='del'>-		 * We need to unlock only the end area that we aren't using.</div><div class='del'>-		 * The rest is going to be unlocked by the endio routine.</div><div class='del'>-		 */</div><div class='del'>-		lockstart = start + len;</div><div class='del'>-		if (lockstart &lt; lockend)</div><div class='del'>-			unlock_extents = true;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (unlock_extents)</div><div class='del'>-		unlock_extent_cached(&amp;BTRFS_I(inode)-&gt;io_tree,</div><div class='del'>-				     lockstart, lockend, &amp;cached_state);</div><div class='del'>-	else</div><div class='del'>-		free_extent_state(cached_state);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Translate extent map information to iomap.</div><div class='del'>-	 * We trim the extents (and move the addr) even though iomap code does</div><div class='del'>-	 * that, since we have locked only the parts we are performing I/O in.</div><div class='del'>-	 */</div><div class='del'>-	if ((em-&gt;block_start == EXTENT_MAP_HOLE) ||</div><div class='del'>-	    (test_bit(EXTENT_FLAG_PREALLOC, &amp;em-&gt;flags) &amp;&amp; !write)) {</div><div class='del'>-		iomap-&gt;addr = IOMAP_NULL_ADDR;</div><div class='del'>-		iomap-&gt;type = IOMAP_HOLE;</div><div class='del'>-	} else {</div><div class='del'>-		iomap-&gt;addr = em-&gt;block_start + (start - em-&gt;start);</div><div class='del'>-		iomap-&gt;type = IOMAP_MAPPED;</div><div class='del'>-	}</div><div class='del'>-	iomap-&gt;offset = start;</div><div class='del'>-	iomap-&gt;bdev = fs_info-&gt;fs_devices-&gt;latest_dev-&gt;bdev;</div><div class='del'>-	iomap-&gt;length = len;</div><div class='del'>-</div><div class='del'>-	if (write &amp;&amp; btrfs_use_zone_append(BTRFS_I(inode), em-&gt;block_start))</div><div class='del'>-		iomap-&gt;flags |= IOMAP_F_ZONE_APPEND;</div><div class='del'>-</div><div class='del'>-	free_extent_map(em);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-unlock_err:</div><div class='del'>-	unlock_extent_cached(&amp;BTRFS_I(inode)-&gt;io_tree, lockstart, lockend,</div><div class='del'>-			     &amp;cached_state);</div><div class='del'>-err:</div><div class='del'>-	if (dio_data) {</div><div class='del'>-		btrfs_delalloc_release_space(BTRFS_I(inode),</div><div class='del'>-				dio_data-&gt;data_reserved, start,</div><div class='del'>-				dio_data-&gt;reserve, true);</div><div class='del'>-		btrfs_delalloc_release_extents(BTRFS_I(inode), dio_data-&gt;reserve);</div><div class='del'>-		extent_changeset_free(dio_data-&gt;data_reserved);</div><div class='del'>-		kfree(dio_data);</div><div class='del'>-	}</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int btrfs_dio_iomap_end(struct inode *inode, loff_t pos, loff_t length,</div><div class='del'>-		ssize_t written, unsigned int flags, struct iomap *iomap)</div><div class='del'>-{</div><div class='del'>-	int ret = 0;</div><div class='del'>-	struct btrfs_dio_data *dio_data = iomap-&gt;private;</div><div class='del'>-	size_t submitted = dio_data-&gt;submitted;</div><div class='del'>-	const bool write = !!(flags &amp; IOMAP_WRITE);</div><div class='del'>-</div><div class='del'>-	if (!write &amp;&amp; (iomap-&gt;type == IOMAP_HOLE)) {</div><div class='del'>-		/* If reading from a hole, unlock and return */</div><div class='del'>-		unlock_extent(&amp;BTRFS_I(inode)-&gt;io_tree, pos, pos + length - 1);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (submitted &lt; length) {</div><div class='del'>-		pos += submitted;</div><div class='del'>-		length -= submitted;</div><div class='del'>-		if (write)</div><div class='del'>-			__endio_write_update_ordered(BTRFS_I(inode), pos,</div><div class='del'>-					length, false);</div><div class='del'>-		else</div><div class='del'>-			unlock_extent(&amp;BTRFS_I(inode)-&gt;io_tree, pos,</div><div class='del'>-				      pos + length - 1);</div><div class='del'>-		ret = -ENOTBLK;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (write) {</div><div class='del'>-		if (dio_data-&gt;reserve)</div><div class='del'>-			btrfs_delalloc_release_space(BTRFS_I(inode),</div><div class='del'>-					dio_data-&gt;data_reserved, pos,</div><div class='del'>-					dio_data-&gt;reserve, true);</div><div class='del'>-		btrfs_delalloc_release_extents(BTRFS_I(inode), dio_data-&gt;length);</div><div class='del'>-		extent_changeset_free(dio_data-&gt;data_reserved);</div><div class='del'>-	}</div><div class='del'>-out:</div><div class='del'>-	kfree(dio_data);</div><div class='del'>-	iomap-&gt;private = NULL;</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfs_dio_private_put(struct btrfs_dio_private *dip)</div><div class='del'>-{</div><div class='del'>-	/*</div><div class='del'>-	 * This implies a barrier so that stores to dio_bio-&gt;bi_status before</div><div class='del'>-	 * this and loads of dio_bio-&gt;bi_status after this are fully ordered.</div><div class='del'>-	 */</div><div class='del'>-	if (!refcount_dec_and_test(&amp;dip-&gt;refs))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	if (btrfs_op(dip-&gt;dio_bio) == BTRFS_MAP_WRITE) {</div><div class='del'>-		__endio_write_update_ordered(BTRFS_I(dip-&gt;inode),</div><div class='del'>-					     dip-&gt;file_offset,</div><div class='del'>-					     dip-&gt;bytes,</div><div class='del'>-					     !dip-&gt;dio_bio-&gt;bi_status);</div><div class='del'>-	} else {</div><div class='del'>-		unlock_extent(&amp;BTRFS_I(dip-&gt;inode)-&gt;io_tree,</div><div class='del'>-			      dip-&gt;file_offset,</div><div class='del'>-			      dip-&gt;file_offset + dip-&gt;bytes - 1);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	bio_endio(dip-&gt;dio_bio);</div><div class='del'>-	kfree(dip);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static blk_status_t submit_dio_repair_bio(struct inode *inode, struct bio *bio,</div><div class='del'>-					  int mirror_num,</div><div class='del'>-					  unsigned long bio_flags)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_dio_private *dip = bio-&gt;bi_private;</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	blk_status_t ret;</div><div class='del'>-</div><div class='del'>-	BUG_ON(bio_op(bio) == REQ_OP_WRITE);</div><div class='del'>-</div><div class='del'>-	ret = btrfs_bio_wq_end_io(fs_info, bio, BTRFS_WQ_ENDIO_DATA);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	refcount_inc(&amp;dip-&gt;refs);</div><div class='del'>-	ret = btrfs_map_bio(fs_info, bio, mirror_num);</div><div class='del'>-	if (ret)</div><div class='del'>-		refcount_dec(&amp;dip-&gt;refs);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static blk_status_t btrfs_check_read_dio_bio(struct btrfs_dio_private *dip,</div><div class='del'>-					     struct btrfs_bio *bbio,</div><div class='del'>-					     const bool uptodate)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = dip-&gt;inode;</div><div class='del'>-	struct btrfs_fs_info *fs_info = BTRFS_I(inode)-&gt;root-&gt;fs_info;</div><div class='del'>-	const u32 sectorsize = fs_info-&gt;sectorsize;</div><div class='del'>-	struct extent_io_tree *failure_tree = &amp;BTRFS_I(inode)-&gt;io_failure_tree;</div><div class='del'>-	struct extent_io_tree *io_tree = &amp;BTRFS_I(inode)-&gt;io_tree;</div><div class='del'>-	const bool csum = !(BTRFS_I(inode)-&gt;flags &amp; BTRFS_INODE_NODATASUM);</div><div class='del'>-	struct bio_vec bvec;</div><div class='del'>-	struct bvec_iter iter;</div><div class='del'>-	const u64 orig_file_offset = dip-&gt;file_offset;</div><div class='del'>-	u64 start = orig_file_offset;</div><div class='del'>-	u32 bio_offset = 0;</div><div class='del'>-	blk_status_t err = BLK_STS_OK;</div><div class='del'>-</div><div class='del'>-	__bio_for_each_segment(bvec, &amp;bbio-&gt;bio, iter, bbio-&gt;iter) {</div><div class='del'>-		unsigned int i, nr_sectors, pgoff;</div><div class='del'>-</div><div class='del'>-		nr_sectors = BTRFS_BYTES_TO_BLKS(fs_info, bvec.bv_len);</div><div class='del'>-		pgoff = bvec.bv_offset;</div><div class='del'>-		for (i = 0; i &lt; nr_sectors; i++) {</div><div class='del'>-			ASSERT(pgoff &lt; PAGE_SIZE);</div><div class='del'>-			if (uptodate &amp;&amp;</div><div class='del'>-			    (!csum || !check_data_csum(inode, bbio,</div><div class='del'>-						       bio_offset, bvec.bv_page,</div><div class='del'>-						       pgoff, start))) {</div><div class='del'>-				clean_io_failure(fs_info, failure_tree, io_tree,</div><div class='del'>-						 start, bvec.bv_page,</div><div class='del'>-						 btrfs_ino(BTRFS_I(inode)),</div><div class='del'>-						 pgoff);</div><div class='del'>-			} else {</div><div class='del'>-				int ret;</div><div class='del'>-</div><div class='del'>-				ASSERT((start - orig_file_offset) &lt; UINT_MAX);</div><div class='del'>-				ret = btrfs_repair_one_sector(inode,</div><div class='del'>-						&amp;bbio-&gt;bio,</div><div class='del'>-						start - orig_file_offset,</div><div class='del'>-						bvec.bv_page, pgoff,</div><div class='del'>-						start, bbio-&gt;mirror_num,</div><div class='del'>-						submit_dio_repair_bio);</div><div class='del'>-				if (ret)</div><div class='del'>-					err = errno_to_blk_status(ret);</div><div class='del'>-			}</div><div class='del'>-			start += sectorsize;</div><div class='del'>-			ASSERT(bio_offset + sectorsize &gt; bio_offset);</div><div class='del'>-			bio_offset += sectorsize;</div><div class='del'>-			pgoff += sectorsize;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	return err;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void __endio_write_update_ordered(struct btrfs_inode *inode,</div><div class='del'>-					 const u64 offset, const u64 bytes,</div><div class='del'>-					 const bool uptodate)</div><div class='del'>-{</div><div class='del'>-	btrfs_mark_ordered_io_finished(inode, NULL, offset, bytes,</div><div class='del'>-				       finish_ordered_fn, uptodate);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static blk_status_t btrfs_submit_bio_start_direct_io(struct inode *inode,</div><div class='del'>-						     struct bio *bio,</div><div class='del'>-						     u64 dio_file_offset)</div><div class='del'>-{</div><div class='del'>-	return btrfs_csum_one_bio(BTRFS_I(inode), bio, dio_file_offset, 1);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfs_end_dio_bio(struct bio *bio)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_dio_private *dip = bio-&gt;bi_private;</div><div class='del'>-	blk_status_t err = bio-&gt;bi_status;</div><div class='del'>-</div><div class='del'>-	if (err)</div><div class='del'>-		btrfs_warn(BTRFS_I(dip-&gt;inode)-&gt;root-&gt;fs_info,</div><div class='del'>-			   "direct IO failed ino %llu rw %d,%u sector %#Lx len %u err no %d",</div><div class='del'>-			   btrfs_ino(BTRFS_I(dip-&gt;inode)), bio_op(bio),</div><div class='del'>-			   bio-&gt;bi_opf, bio-&gt;bi_iter.bi_sector,</div><div class='del'>-			   bio-&gt;bi_iter.bi_size, err);</div><div class='del'>-</div><div class='del'>-	if (bio_op(bio) == REQ_OP_READ)</div><div class='del'>-		err = btrfs_check_read_dio_bio(dip, btrfs_bio(bio), !err);</div><div class='del'>-</div><div class='del'>-	if (err)</div><div class='del'>-		dip-&gt;dio_bio-&gt;bi_status = err;</div><div class='del'>-</div><div class='del'>-	btrfs_record_physical_zoned(dip-&gt;inode, dip-&gt;file_offset, bio);</div><div class='del'>-</div><div class='del'>-	bio_put(bio);</div><div class='del'>-	btrfs_dio_private_put(dip);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline blk_status_t btrfs_submit_dio_bio(struct bio *bio,</div><div class='del'>-		struct inode *inode, u64 file_offset, int async_submit)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	struct btrfs_dio_private *dip = bio-&gt;bi_private;</div><div class='del'>-	bool write = btrfs_op(bio) == BTRFS_MAP_WRITE;</div><div class='del'>-	blk_status_t ret;</div><div class='del'>-</div><div class='del'>-	/* Check btrfs_submit_bio_hook() for rules about async submit. */</div><div class='del'>-	if (async_submit)</div><div class='del'>-		async_submit = !atomic_read(&amp;BTRFS_I(inode)-&gt;sync_writers);</div><div class='del'>-</div><div class='del'>-	if (!write) {</div><div class='del'>-		ret = btrfs_bio_wq_end_io(fs_info, bio, BTRFS_WQ_ENDIO_DATA);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (BTRFS_I(inode)-&gt;flags &amp; BTRFS_INODE_NODATASUM)</div><div class='del'>-		goto map;</div><div class='del'>-</div><div class='del'>-	if (write &amp;&amp; async_submit) {</div><div class='del'>-		ret = btrfs_wq_submit_bio(inode, bio, 0, 0, file_offset,</div><div class='del'>-					  btrfs_submit_bio_start_direct_io);</div><div class='del'>-		goto err;</div><div class='del'>-	} else if (write) {</div><div class='del'>-		/*</div><div class='del'>-		 * If we aren't doing async submit, calculate the csum of the</div><div class='del'>-		 * bio now.</div><div class='del'>-		 */</div><div class='del'>-		ret = btrfs_csum_one_bio(BTRFS_I(inode), bio, file_offset, 1);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto err;</div><div class='del'>-	} else {</div><div class='del'>-		u64 csum_offset;</div><div class='del'>-</div><div class='del'>-		csum_offset = file_offset - dip-&gt;file_offset;</div><div class='del'>-		csum_offset &gt;&gt;= fs_info-&gt;sectorsize_bits;</div><div class='del'>-		csum_offset *= fs_info-&gt;csum_size;</div><div class='del'>-		btrfs_bio(bio)-&gt;csum = dip-&gt;csums + csum_offset;</div><div class='del'>-	}</div><div class='del'>-map:</div><div class='del'>-	ret = btrfs_map_bio(fs_info, bio, 0);</div><div class='del'>-err:</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='del'>- * If this succeeds, the btrfs_dio_private is responsible for cleaning up locked</div><div class='del'>- * or ordered extents whether or not we submit any bios.</div><div class='del'>- */</div><div class='del'>-static struct btrfs_dio_private *btrfs_create_dio_private(struct bio *dio_bio,</div><div class='del'>-							  struct inode *inode,</div><div class='del'>-							  loff_t file_offset)</div><div class='del'>-{</div><div class='del'>-	const bool write = (btrfs_op(dio_bio) == BTRFS_MAP_WRITE);</div><div class='del'>-	const bool csum = !(BTRFS_I(inode)-&gt;flags &amp; BTRFS_INODE_NODATASUM);</div><div class='del'>-	size_t dip_size;</div><div class='del'>-	struct btrfs_dio_private *dip;</div><div class='del'>-</div><div class='del'>-	dip_size = sizeof(*dip);</div><div class='del'>-	if (!write &amp;&amp; csum) {</div><div class='del'>-		struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-		size_t nblocks;</div><div class='del'>-</div><div class='del'>-		nblocks = dio_bio-&gt;bi_iter.bi_size &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='del'>-		dip_size += fs_info-&gt;csum_size * nblocks;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	dip = kzalloc(dip_size, GFP_NOFS);</div><div class='del'>-	if (!dip)</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	dip-&gt;inode = inode;</div><div class='del'>-	dip-&gt;file_offset = file_offset;</div><div class='del'>-	dip-&gt;bytes = dio_bio-&gt;bi_iter.bi_size;</div><div class='del'>-	dip-&gt;disk_bytenr = dio_bio-&gt;bi_iter.bi_sector &lt;&lt; 9;</div><div class='del'>-	dip-&gt;dio_bio = dio_bio;</div><div class='del'>-	refcount_set(&amp;dip-&gt;refs, 1);</div><div class='del'>-	return dip;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfs_submit_direct(const struct iomap_iter *iter,</div><div class='del'>-		struct bio *dio_bio, loff_t file_offset)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = iter-&gt;inode;</div><div class='del'>-	const bool write = (btrfs_op(dio_bio) == BTRFS_MAP_WRITE);</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	const bool raid56 = (btrfs_data_alloc_profile(fs_info) &amp;</div><div class='del'>-			     BTRFS_BLOCK_GROUP_RAID56_MASK);</div><div class='del'>-	struct btrfs_dio_private *dip;</div><div class='del'>-	struct bio *bio;</div><div class='del'>-	u64 start_sector;</div><div class='del'>-	int async_submit = 0;</div><div class='del'>-	u64 submit_len;</div><div class='del'>-	u64 clone_offset = 0;</div><div class='del'>-	u64 clone_len;</div><div class='del'>-	u64 logical;</div><div class='del'>-	int ret;</div><div class='del'>-	blk_status_t status;</div><div class='del'>-	struct btrfs_io_geometry geom;</div><div class='del'>-	struct btrfs_dio_data *dio_data = iter-&gt;iomap.private;</div><div class='del'>-	struct extent_map *em = NULL;</div><div class='del'>-</div><div class='del'>-	dip = btrfs_create_dio_private(dio_bio, inode, file_offset);</div><div class='del'>-	if (!dip) {</div><div class='del'>-		if (!write) {</div><div class='del'>-			unlock_extent(&amp;BTRFS_I(inode)-&gt;io_tree, file_offset,</div><div class='del'>-				file_offset + dio_bio-&gt;bi_iter.bi_size - 1);</div><div class='del'>-		}</div><div class='del'>-		dio_bio-&gt;bi_status = BLK_STS_RESOURCE;</div><div class='del'>-		bio_endio(dio_bio);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!write) {</div><div class='del'>-		/*</div><div class='del'>-		 * Load the csums up front to reduce csum tree searches and</div><div class='del'>-		 * contention when submitting bios.</div><div class='del'>-		 *</div><div class='del'>-		 * If we have csums disabled this will do nothing.</div><div class='del'>-		 */</div><div class='del'>-		status = btrfs_lookup_bio_sums(inode, dio_bio, dip-&gt;csums);</div><div class='del'>-		if (status != BLK_STS_OK)</div><div class='del'>-			goto out_err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	start_sector = dio_bio-&gt;bi_iter.bi_sector;</div><div class='del'>-	submit_len = dio_bio-&gt;bi_iter.bi_size;</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		logical = start_sector &lt;&lt; 9;</div><div class='del'>-		em = btrfs_get_chunk_map(fs_info, logical, submit_len);</div><div class='del'>-		if (IS_ERR(em)) {</div><div class='del'>-			status = errno_to_blk_status(PTR_ERR(em));</div><div class='del'>-			em = NULL;</div><div class='del'>-			goto out_err_em;</div><div class='del'>-		}</div><div class='del'>-		ret = btrfs_get_io_geometry(fs_info, em, btrfs_op(dio_bio),</div><div class='del'>-					    logical, &amp;geom);</div><div class='del'>-		if (ret) {</div><div class='del'>-			status = errno_to_blk_status(ret);</div><div class='del'>-			goto out_err_em;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		clone_len = min(submit_len, geom.len);</div><div class='del'>-		ASSERT(clone_len &lt;= UINT_MAX);</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * This will never fail as it's passing GPF_NOFS and</div><div class='del'>-		 * the allocation is backed by btrfs_bioset.</div><div class='del'>-		 */</div><div class='del'>-		bio = btrfs_bio_clone_partial(dio_bio, clone_offset, clone_len);</div><div class='del'>-		bio-&gt;bi_private = dip;</div><div class='del'>-		bio-&gt;bi_end_io = btrfs_end_dio_bio;</div><div class='del'>-</div><div class='del'>-		if (bio_op(bio) == REQ_OP_ZONE_APPEND) {</div><div class='del'>-			status = extract_ordered_extent(BTRFS_I(inode), bio,</div><div class='del'>-							file_offset);</div><div class='del'>-			if (status) {</div><div class='del'>-				bio_put(bio);</div><div class='del'>-				goto out_err;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		ASSERT(submit_len &gt;= clone_len);</div><div class='del'>-		submit_len -= clone_len;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Increase the count before we submit the bio so we know</div><div class='del'>-		 * the end IO handler won't happen before we increase the</div><div class='del'>-		 * count. Otherwise, the dip might get freed before we're</div><div class='del'>-		 * done setting it up.</div><div class='del'>-		 *</div><div class='del'>-		 * We transfer the initial reference to the last bio, so we</div><div class='del'>-		 * don't need to increment the reference count for the last one.</div><div class='del'>-		 */</div><div class='del'>-		if (submit_len &gt; 0) {</div><div class='del'>-			refcount_inc(&amp;dip-&gt;refs);</div><div class='del'>-			/*</div><div class='del'>-			 * If we are submitting more than one bio, submit them</div><div class='del'>-			 * all asynchronously. The exception is RAID 5 or 6, as</div><div class='del'>-			 * asynchronous checksums make it difficult to collect</div><div class='del'>-			 * full stripe writes.</div><div class='del'>-			 */</div><div class='del'>-			if (!raid56)</div><div class='del'>-				async_submit = 1;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		status = btrfs_submit_dio_bio(bio, inode, file_offset,</div><div class='del'>-						async_submit);</div><div class='del'>-		if (status) {</div><div class='del'>-			bio_put(bio);</div><div class='del'>-			if (submit_len &gt; 0)</div><div class='del'>-				refcount_dec(&amp;dip-&gt;refs);</div><div class='del'>-			goto out_err_em;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		dio_data-&gt;submitted += clone_len;</div><div class='del'>-		clone_offset += clone_len;</div><div class='del'>-		start_sector += clone_len &gt;&gt; 9;</div><div class='del'>-		file_offset += clone_len;</div><div class='del'>-</div><div class='del'>-		free_extent_map(em);</div><div class='del'>-	} while (submit_len &gt; 0);</div><div class='del'>-	return;</div><div class='del'>-</div><div class='del'>-out_err_em:</div><div class='del'>-	free_extent_map(em);</div><div class='del'>-out_err:</div><div class='del'>-	dip-&gt;dio_bio-&gt;bi_status = status;</div><div class='del'>-	btrfs_dio_private_put(dip);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-const struct iomap_ops btrfs_dio_iomap_ops = {</div><div class='del'>-	.iomap_begin            = btrfs_dio_iomap_begin,</div><div class='del'>-	.iomap_end              = btrfs_dio_iomap_end,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-const struct iomap_dio_ops btrfs_dio_ops = {</div><div class='del'>-	.submit_io		= btrfs_submit_direct,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static int btrfs_fiemap(struct inode *inode, struct fiemap_extent_info *fieinfo,</div><div class='del'>-			u64 start, u64 len)</div><div class='del'>-{</div><div class='del'>-	int	ret;</div><div class='del'>-</div><div class='del'>-	ret = fiemap_prep(inode, fieinfo, start, &amp;len, 0);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	return extent_fiemap(BTRFS_I(inode), fieinfo, start, len);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int btrfs_readpage(struct file *file, struct page *page)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_inode *inode = BTRFS_I(page-&gt;mapping-&gt;host);</div><div class='del'>-	u64 start = page_offset(page);</div><div class='del'>-	u64 end = start + PAGE_SIZE - 1;</div><div class='del'>-	struct btrfs_bio_ctrl bio_ctrl = { 0 };</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	btrfs_lock_and_flush_ordered_range(inode, start, end, NULL);</div><div class='del'>-</div><div class='del'>-	ret = btrfs_do_readpage(page, NULL, &amp;bio_ctrl, 0, NULL);</div><div class='del'>-	if (bio_ctrl.bio)</div><div class='del'>-		ret = submit_one_bio(bio_ctrl.bio, 0, bio_ctrl.bio_flags);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int btrfs_writepage(struct page *page, struct writeback_control *wbc)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (current-&gt;flags &amp; PF_MEMALLOC) {</div><div class='del'>-		redirty_page_for_writepage(wbc, page);</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If we are under memory pressure we will call this directly from the</div><div class='del'>-	 * VM, we need to make sure we have the inode referenced for the ordered</div><div class='del'>-	 * extent.  If not just return like we didn't do anything.</div><div class='del'>-	 */</div><div class='del'>-	if (!igrab(inode)) {</div><div class='del'>-		redirty_page_for_writepage(wbc, page);</div><div class='del'>-		return AOP_WRITEPAGE_ACTIVATE;</div><div class='del'>-	}</div><div class='del'>-	ret = extent_write_full_page(page, wbc);</div><div class='del'>-	btrfs_add_delayed_iput(inode);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int btrfs_writepages(struct address_space *mapping,</div><div class='del'>-			    struct writeback_control *wbc)</div><div class='del'>-{</div><div class='del'>-	return extent_writepages(mapping, wbc);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfs_readahead(struct readahead_control *rac)</div><div class='del'>-{</div><div class='del'>-	extent_readahead(rac);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * For releasepage() and invalidatepage() we have a race window where</div><div class='del'>- * end_page_writeback() is called but the subpage spinlock is not yet released.</div><div class='add'>+ * For release_folio() and invalidate_folio() we have a race window where</div><div class='add'>+ * folio_end_writeback() is called but the subpage spinlock is not yet released.</div><div class='ctx'>  * If we continue to release/invalidate the page, we could cause use-after-free</div><div class='ctx'>  * for subpage spinlock.  So this function is to spin and wait for subpage</div><div class='ctx'>  * spinlock.</div><div class='ctx'>  */</div><div class='del'>-static void wait_subpage_spinlock(struct page *page)</div><div class='add'>+static void wait_subpage_spinlock(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(page-&gt;mapping-&gt;host-&gt;i_sb);</div><div class='del'>-	struct btrfs_subpage *subpage;</div><div class='add'>+	struct btrfs_fs_info *fs_info = folio_to_fs_info(folio);</div><div class='add'>+	struct btrfs_folio_state *bfs;</div><div class='ctx'> </div><div class='del'>-	if (fs_info-&gt;sectorsize == PAGE_SIZE)</div><div class='add'>+	if (!btrfs_is_subpage(fs_info, folio))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	ASSERT(PagePrivate(page) &amp;&amp; page-&gt;private);</div><div class='del'>-	subpage = (struct btrfs_subpage *)page-&gt;private;</div><div class='add'>+	ASSERT(folio_test_private(folio) &amp;&amp; folio_get_private(folio));</div><div class='add'>+	bfs = folio_get_private(folio);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * This may look insane as we just acquire the spinlock and release it,</div><div class='hunk'>@@ -8497,109 +7477,108 @@ static void wait_subpage_spinlock(struct page *page)</div><div class='ctx'> 	 * Here we just acquire the spinlock so that all existing callers</div><div class='ctx'> 	 * should exit and we're safe to release/invalidate the page.</div><div class='ctx'> 	 */</div><div class='del'>-	spin_lock_irq(&amp;subpage-&gt;lock);</div><div class='del'>-	spin_unlock_irq(&amp;subpage-&gt;lock);</div><div class='add'>+	spin_lock_irq(&amp;bfs-&gt;lock);</div><div class='add'>+	spin_unlock_irq(&amp;bfs-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __btrfs_releasepage(struct page *page, gfp_t gfp_flags)</div><div class='add'>+static int btrfs_launder_folio(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	int ret = try_release_extent_mapping(page, gfp_flags);</div><div class='add'>+	return btrfs_qgroup_free_data(folio_to_inode(folio), NULL, folio_pos(folio),</div><div class='add'>+				      folio_size(folio), NULL);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if (ret == 1) {</div><div class='del'>-		wait_subpage_spinlock(page);</div><div class='del'>-		clear_page_extent_mapped(page);</div><div class='add'>+static bool __btrfs_release_folio(struct folio *folio, gfp_t gfp_flags)</div><div class='add'>+{</div><div class='add'>+	if (try_release_extent_mapping(folio, gfp_flags)) {</div><div class='add'>+		wait_subpage_spinlock(folio);</div><div class='add'>+		clear_folio_extent_mapped(folio);</div><div class='add'>+		return true;</div><div class='ctx'> 	}</div><div class='del'>-	return ret;</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btrfs_releasepage(struct page *page, gfp_t gfp_flags)</div><div class='add'>+static bool btrfs_release_folio(struct folio *folio, gfp_t gfp_flags)</div><div class='ctx'> {</div><div class='del'>-	if (PageWriteback(page) || PageDirty(page))</div><div class='del'>-		return 0;</div><div class='del'>-	return __btrfs_releasepage(page, gfp_flags);</div><div class='add'>+	if (folio_test_writeback(folio) || folio_test_dirty(folio))</div><div class='add'>+		return false;</div><div class='add'>+	return __btrfs_release_folio(folio, gfp_flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_MIGRATION</div><div class='del'>-static int btrfs_migratepage(struct address_space *mapping,</div><div class='del'>-			     struct page *newpage, struct page *page,</div><div class='add'>+static int btrfs_migrate_folio(struct address_space *mapping,</div><div class='add'>+			     struct folio *dst, struct folio *src,</div><div class='ctx'> 			     enum migrate_mode mode)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='add'>+	int ret = filemap_migrate_folio(mapping, dst, src, mode);</div><div class='ctx'> </div><div class='del'>-	ret = migrate_page_move_mapping(mapping, newpage, page, 0);</div><div class='del'>-	if (ret != MIGRATEPAGE_SUCCESS)</div><div class='add'>+	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	if (page_has_private(page))</div><div class='del'>-		attach_page_private(newpage, detach_page_private(page));</div><div class='del'>-</div><div class='del'>-	if (PageOrdered(page)) {</div><div class='del'>-		ClearPageOrdered(page);</div><div class='del'>-		SetPageOrdered(newpage);</div><div class='add'>+	if (folio_test_ordered(src)) {</div><div class='add'>+		folio_clear_ordered(src);</div><div class='add'>+		folio_set_ordered(dst);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (mode != MIGRATE_SYNC_NO_COPY)</div><div class='del'>-		migrate_page_copy(newpage, page);</div><div class='del'>-	else</div><div class='del'>-		migrate_page_states(newpage, page);</div><div class='del'>-	return MIGRATEPAGE_SUCCESS;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='add'>+#else</div><div class='add'>+#define btrfs_migrate_folio NULL</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-static void btrfs_invalidatepage(struct page *page, unsigned int offset,</div><div class='del'>-				 unsigned int length)</div><div class='add'>+static void btrfs_invalidate_folio(struct folio *folio, size_t offset,</div><div class='add'>+				 size_t length)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_inode *inode = BTRFS_I(page-&gt;mapping-&gt;host);</div><div class='add'>+	struct btrfs_inode *inode = folio_to_inode(folio);</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='ctx'> 	struct extent_io_tree *tree = &amp;inode-&gt;io_tree;</div><div class='ctx'> 	struct extent_state *cached_state = NULL;</div><div class='del'>-	u64 page_start = page_offset(page);</div><div class='del'>-	u64 page_end = page_start + PAGE_SIZE - 1;</div><div class='add'>+	u64 page_start = folio_pos(folio);</div><div class='add'>+	u64 page_end = page_start + folio_size(folio) - 1;</div><div class='ctx'> 	u64 cur;</div><div class='del'>-	int inode_evicting = inode-&gt;vfs_inode.i_state &amp; I_FREEING;</div><div class='add'>+	int inode_evicting = inode_state_read_once(&amp;inode-&gt;vfs_inode) &amp; I_FREEING;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * We have page locked so no new ordered extent can be created on this</div><div class='del'>-	 * page, nor bio can be submitted for this page.</div><div class='add'>+	 * We have folio locked so no new ordered extent can be created on this</div><div class='add'>+	 * page, nor bio can be submitted for this folio.</div><div class='ctx'> 	 *</div><div class='del'>-	 * But already submitted bio can still be finished on this page.</div><div class='del'>-	 * Furthermore, endio function won't skip page which has Ordered</div><div class='del'>-	 * (Private2) already cleared, so it's possible for endio and</div><div class='del'>-	 * invalidatepage to do the same ordered extent accounting twice</div><div class='del'>-	 * on one page.</div><div class='add'>+	 * But already submitted bio can still be finished on this folio.</div><div class='add'>+	 * Furthermore, endio function won't skip folio which has Ordered</div><div class='add'>+	 * already cleared, so it's possible for endio and</div><div class='add'>+	 * invalidate_folio to do the same ordered extent accounting twice</div><div class='add'>+	 * on one folio.</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * So here we wait for any submitted bios to finish, so that we won't</div><div class='del'>-	 * do double ordered extent accounting on the same page.</div><div class='add'>+	 * do double ordered extent accounting on the same folio.</div><div class='ctx'> 	 */</div><div class='del'>-	wait_on_page_writeback(page);</div><div class='del'>-	wait_subpage_spinlock(page);</div><div class='add'>+	folio_wait_writeback(folio);</div><div class='add'>+	wait_subpage_spinlock(folio);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * For subpage case, we have call sites like</div><div class='ctx'> 	 * btrfs_punch_hole_lock_range() which passes range not aligned to</div><div class='ctx'> 	 * sectorsize.</div><div class='del'>-	 * If the range doesn't cover the full page, we don't need to and</div><div class='del'>-	 * shouldn't clear page extent mapped, as page-&gt;private can still</div><div class='add'>+	 * If the range doesn't cover the full folio, we don't need to and</div><div class='add'>+	 * shouldn't clear page extent mapped, as folio-&gt;private can still</div><div class='ctx'> 	 * record subpage dirty bits for other part of the range.</div><div class='ctx'> 	 *</div><div class='del'>-	 * For cases that can invalidate the full even the range doesn't</div><div class='del'>-	 * cover the full page, like invalidating the last page, we're</div><div class='add'>+	 * For cases that invalidate the full folio even the range doesn't</div><div class='add'>+	 * cover the full folio, like invalidating the last folio, we're</div><div class='ctx'> 	 * still safe to wait for ordered extent to finish.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!(offset == 0 &amp;&amp; length == PAGE_SIZE)) {</div><div class='del'>-		btrfs_releasepage(page, GFP_NOFS);</div><div class='add'>+	if (!(offset == 0 &amp;&amp; length == folio_size(folio))) {</div><div class='add'>+		btrfs_release_folio(folio, GFP_NOFS);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!inode_evicting)</div><div class='del'>-		lock_extent_bits(tree, page_start, page_end, &amp;cached_state);</div><div class='add'>+		btrfs_lock_extent(tree, page_start, page_end, &amp;cached_state);</div><div class='ctx'> </div><div class='ctx'> 	cur = page_start;</div><div class='ctx'> 	while (cur &lt; page_end) {</div><div class='ctx'> 		struct btrfs_ordered_extent *ordered;</div><div class='del'>-		bool delete_states;</div><div class='ctx'> 		u64 range_end;</div><div class='ctx'> 		u32 range_len;</div><div class='add'>+		u32 extra_flags = 0;</div><div class='ctx'> </div><div class='ctx'> 		ordered = btrfs_lookup_first_ordered_range(inode, cur,</div><div class='ctx'> 							   page_end + 1 - cur);</div><div class='hunk'>@@ -8609,7 +7588,7 @@ static void btrfs_invalidatepage(struct page *page, unsigned int offset,</div><div class='ctx'> 			 * No ordered extent covering this range, we are safe</div><div class='ctx'> 			 * to delete all extent states in the range.</div><div class='ctx'> 			 */</div><div class='del'>-			delete_states = true;</div><div class='add'>+			extra_flags = EXTENT_CLEAR_ALL_BITS;</div><div class='ctx'> 			goto next;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (ordered-&gt;file_offset &gt; cur) {</div><div class='hunk'>@@ -8620,7 +7599,7 @@ static void btrfs_invalidatepage(struct page *page, unsigned int offset,</div><div class='ctx'> 			 * the ordered extent in the next iteration.</div><div class='ctx'> 			 */</div><div class='ctx'> 			range_end = ordered-&gt;file_offset - 1;</div><div class='del'>-			delete_states = true;</div><div class='add'>+			extra_flags = EXTENT_CLEAR_ALL_BITS;</div><div class='ctx'> 			goto next;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -8628,17 +7607,16 @@ static void btrfs_invalidatepage(struct page *page, unsigned int offset,</div><div class='ctx'> 				page_end);</div><div class='ctx'> 		ASSERT(range_end + 1 - cur &lt; U32_MAX);</div><div class='ctx'> 		range_len = range_end + 1 - cur;</div><div class='del'>-		if (!btrfs_page_test_ordered(fs_info, page, cur, range_len)) {</div><div class='add'>+		if (!btrfs_folio_test_ordered(fs_info, folio, cur, range_len)) {</div><div class='ctx'> 			/*</div><div class='del'>-			 * If Ordered (Private2) is cleared, it means endio has</div><div class='add'>+			 * If Ordered is cleared, it means endio has</div><div class='ctx'> 			 * already been executed for the range.</div><div class='ctx'> 			 * We can't delete the extent states as</div><div class='ctx'> 			 * btrfs_finish_ordered_io() may still use some of them.</div><div class='ctx'> 			 */</div><div class='del'>-			delete_states = false;</div><div class='ctx'> 			goto next;</div><div class='ctx'> 		}</div><div class='del'>-		btrfs_page_clear_ordered(fs_info, page, cur, range_len);</div><div class='add'>+		btrfs_folio_clear_ordered(fs_info, folio, cur, range_len);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * IO on this page will never be started, so we need to account</div><div class='hunk'>@@ -8649,17 +7627,23 @@ static void btrfs_invalidatepage(struct page *page, unsigned int offset,</div><div class='ctx'> 		 * btrfs_finish_ordered_io().</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (!inode_evicting)</div><div class='del'>-			clear_extent_bit(tree, cur, range_end,</div><div class='del'>-					 EXTENT_DELALLOC |</div><div class='del'>-					 EXTENT_LOCKED | EXTENT_DO_ACCOUNTING |</div><div class='del'>-					 EXTENT_DEFRAG, 1, 0, &amp;cached_state);</div><div class='add'>+			btrfs_clear_extent_bit(tree, cur, range_end,</div><div class='add'>+					       EXTENT_DELALLOC |</div><div class='add'>+					       EXTENT_LOCKED | EXTENT_DO_ACCOUNTING |</div><div class='add'>+					       EXTENT_DEFRAG, &amp;cached_state);</div><div class='ctx'> </div><div class='del'>-		spin_lock_irq(&amp;inode-&gt;ordered_tree.lock);</div><div class='add'>+		spin_lock(&amp;inode-&gt;ordered_tree_lock);</div><div class='ctx'> 		set_bit(BTRFS_ORDERED_TRUNCATED, &amp;ordered-&gt;flags);</div><div class='ctx'> 		ordered-&gt;truncated_len = min(ordered-&gt;truncated_len,</div><div class='ctx'> 					     cur - ordered-&gt;file_offset);</div><div class='del'>-		spin_unlock_irq(&amp;inode-&gt;ordered_tree.lock);</div><div class='add'>+		spin_unlock(&amp;inode-&gt;ordered_tree_lock);</div><div class='ctx'> </div><div class='add'>+		/*</div><div class='add'>+		 * If the ordered extent has finished, we're safe to delete all</div><div class='add'>+		 * the extent states of the range, otherwise</div><div class='add'>+		 * btrfs_finish_ordered_io() will get executed by endio for</div><div class='add'>+		 * other pages, so we can't delete extent states.</div><div class='add'>+		 */</div><div class='ctx'> 		if (btrfs_dec_test_ordered_pending(inode, &amp;ordered,</div><div class='ctx'> 						   cur, range_end + 1 - cur)) {</div><div class='ctx'> 			btrfs_finish_ordered_io(ordered);</div><div class='hunk'>@@ -8667,14 +7651,7 @@ static void btrfs_invalidatepage(struct page *page, unsigned int offset,</div><div class='ctx'> 			 * The ordered extent has finished, now we're again</div><div class='ctx'> 			 * safe to delete all extent states of the range.</div><div class='ctx'> 			 */</div><div class='del'>-			delete_states = true;</div><div class='del'>-		} else {</div><div class='del'>-			/*</div><div class='del'>-			 * btrfs_finish_ordered_io() will get executed by endio</div><div class='del'>-			 * of other pages, thus we can't delete extent states</div><div class='del'>-			 * anymore</div><div class='del'>-			 */</div><div class='del'>-			delete_states = false;</div><div class='add'>+			extra_flags = EXTENT_CLEAR_ALL_BITS;</div><div class='ctx'> 		}</div><div class='ctx'> next:</div><div class='ctx'> 		if (ordered)</div><div class='hunk'>@@ -8694,208 +7671,49 @@ next:</div><div class='ctx'> 		 *    reserved data space.</div><div class='ctx'> 		 *    Since the IO will never happen for this page.</div><div class='ctx'> 		 */</div><div class='del'>-		btrfs_qgroup_free_data(inode, NULL, cur, range_end + 1 - cur);</div><div class='del'>-		if (!inode_evicting) {</div><div class='del'>-			clear_extent_bit(tree, cur, range_end, EXTENT_LOCKED |</div><div class='del'>-				 EXTENT_DELALLOC | EXTENT_UPTODATE |</div><div class='del'>-				 EXTENT_DO_ACCOUNTING | EXTENT_DEFRAG, 1,</div><div class='del'>-				 delete_states, &amp;cached_state);</div><div class='del'>-		}</div><div class='add'>+		btrfs_qgroup_free_data(inode, NULL, cur, range_end + 1 - cur, NULL);</div><div class='add'>+		if (!inode_evicting)</div><div class='add'>+			btrfs_clear_extent_bit(tree, cur, range_end, EXTENT_LOCKED |</div><div class='add'>+					       EXTENT_DELALLOC | EXTENT_DO_ACCOUNTING |</div><div class='add'>+					       EXTENT_DEFRAG | extra_flags,</div><div class='add'>+					       &amp;cached_state);</div><div class='ctx'> 		cur = range_end + 1;</div><div class='ctx'> 	}</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We have iterated through all ordered extents of the page, the page</div><div class='del'>-	 * should not have Ordered (Private2) anymore, or the above iteration</div><div class='add'>+	 * should not have Ordered anymore, or the above iteration</div><div class='ctx'> 	 * did something wrong.</div><div class='ctx'> 	 */</div><div class='del'>-	ASSERT(!PageOrdered(page));</div><div class='del'>-	btrfs_page_clear_checked(fs_info, page, page_offset(page), PAGE_SIZE);</div><div class='add'>+	ASSERT(!folio_test_ordered(folio));</div><div class='add'>+	btrfs_folio_clear_checked(fs_info, folio, folio_pos(folio), folio_size(folio));</div><div class='ctx'> 	if (!inode_evicting)</div><div class='del'>-		__btrfs_releasepage(page, GFP_NOFS);</div><div class='del'>-	clear_page_extent_mapped(page);</div><div class='add'>+		__btrfs_release_folio(folio, GFP_NOFS);</div><div class='add'>+	clear_folio_extent_mapped(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * btrfs_page_mkwrite() is not allowed to change the file size as it gets</div><div class='del'>- * called from a page fault handler when a page is first dirtied. Hence we must</div><div class='del'>- * be careful to check for EOF conditions here. We set the page up correctly</div><div class='del'>- * for a written page which means we get ENOSPC checking when writing into</div><div class='del'>- * holes and correct delalloc and unwritten extent mapping on filesystems that</div><div class='del'>- * support these features.</div><div class='del'>- *</div><div class='del'>- * We are not allowed to take the i_mutex here so we have to play games to</div><div class='del'>- * protect against truncate races as the page could now be beyond EOF.  Because</div><div class='del'>- * truncate_setsize() writes the inode size before removing pages, once we have</div><div class='del'>- * the page lock we can determine safely if the page is beyond EOF. If it is not</div><div class='del'>- * beyond EOF, then the page is guaranteed safe against truncation until we</div><div class='del'>- * unlock the page.</div><div class='del'>- */</div><div class='del'>-vm_fault_t btrfs_page_mkwrite(struct vm_fault *vmf)</div><div class='add'>+static int btrfs_truncate(struct btrfs_inode *inode, bool skip_writeback)</div><div class='ctx'> {</div><div class='del'>-	struct page *page = vmf-&gt;page;</div><div class='del'>-	struct inode *inode = file_inode(vmf-&gt;vma-&gt;vm_file);</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	struct extent_io_tree *io_tree = &amp;BTRFS_I(inode)-&gt;io_tree;</div><div class='del'>-	struct btrfs_ordered_extent *ordered;</div><div class='del'>-	struct extent_state *cached_state = NULL;</div><div class='del'>-	struct extent_changeset *data_reserved = NULL;</div><div class='del'>-	unsigned long zero_start;</div><div class='del'>-	loff_t size;</div><div class='del'>-	vm_fault_t ret;</div><div class='del'>-	int ret2;</div><div class='del'>-	int reserved = 0;</div><div class='del'>-	u64 reserved_space;</div><div class='del'>-	u64 page_start;</div><div class='del'>-	u64 page_end;</div><div class='del'>-	u64 end;</div><div class='del'>-</div><div class='del'>-	reserved_space = PAGE_SIZE;</div><div class='del'>-</div><div class='del'>-	sb_start_pagefault(inode-&gt;i_sb);</div><div class='del'>-	page_start = page_offset(page);</div><div class='del'>-	page_end = page_start + PAGE_SIZE - 1;</div><div class='del'>-	end = page_end;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Reserving delalloc space after obtaining the page lock can lead to</div><div class='del'>-	 * deadlock. For example, if a dirty page is locked by this function</div><div class='del'>-	 * and the call to btrfs_delalloc_reserve_space() ends up triggering</div><div class='del'>-	 * dirty page write out, then the btrfs_writepage() function could</div><div class='del'>-	 * end up waiting indefinitely to get a lock on the page currently</div><div class='del'>-	 * being processed by btrfs_page_mkwrite() function.</div><div class='del'>-	 */</div><div class='del'>-	ret2 = btrfs_delalloc_reserve_space(BTRFS_I(inode), &amp;data_reserved,</div><div class='del'>-					    page_start, reserved_space);</div><div class='del'>-	if (!ret2) {</div><div class='del'>-		ret2 = file_update_time(vmf-&gt;vma-&gt;vm_file);</div><div class='del'>-		reserved = 1;</div><div class='del'>-	}</div><div class='del'>-	if (ret2) {</div><div class='del'>-		ret = vmf_error(ret2);</div><div class='del'>-		if (reserved)</div><div class='del'>-			goto out;</div><div class='del'>-		goto out_noreserve;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = VM_FAULT_NOPAGE; /* make the VM retry the fault */</div><div class='del'>-again:</div><div class='del'>-	down_read(&amp;BTRFS_I(inode)-&gt;i_mmap_lock);</div><div class='del'>-	lock_page(page);</div><div class='del'>-	size = i_size_read(inode);</div><div class='del'>-</div><div class='del'>-	if ((page-&gt;mapping != inode-&gt;i_mapping) ||</div><div class='del'>-	    (page_start &gt;= size)) {</div><div class='del'>-		/* page got truncated out from underneath us */</div><div class='del'>-		goto out_unlock;</div><div class='del'>-	}</div><div class='del'>-	wait_on_page_writeback(page);</div><div class='del'>-</div><div class='del'>-	lock_extent_bits(io_tree, page_start, page_end, &amp;cached_state);</div><div class='del'>-	ret2 = set_page_extent_mapped(page);</div><div class='del'>-	if (ret2 &lt; 0) {</div><div class='del'>-		ret = vmf_error(ret2);</div><div class='del'>-		unlock_extent_cached(io_tree, page_start, page_end, &amp;cached_state);</div><div class='del'>-		goto out_unlock;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * we can't set the delalloc bits if there are pending ordered</div><div class='del'>-	 * extents.  Drop our locks and wait for them to finish</div><div class='del'>-	 */</div><div class='del'>-	ordered = btrfs_lookup_ordered_range(BTRFS_I(inode), page_start,</div><div class='del'>-			PAGE_SIZE);</div><div class='del'>-	if (ordered) {</div><div class='del'>-		unlock_extent_cached(io_tree, page_start, page_end,</div><div class='del'>-				     &amp;cached_state);</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		up_read(&amp;BTRFS_I(inode)-&gt;i_mmap_lock);</div><div class='del'>-		btrfs_start_ordered_extent(ordered, 1);</div><div class='del'>-		btrfs_put_ordered_extent(ordered);</div><div class='del'>-		goto again;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (page-&gt;index == ((size - 1) &gt;&gt; PAGE_SHIFT)) {</div><div class='del'>-		reserved_space = round_up(size - page_start,</div><div class='del'>-					  fs_info-&gt;sectorsize);</div><div class='del'>-		if (reserved_space &lt; PAGE_SIZE) {</div><div class='del'>-			end = page_start + reserved_space - 1;</div><div class='del'>-			btrfs_delalloc_release_space(BTRFS_I(inode),</div><div class='del'>-					data_reserved, page_start,</div><div class='del'>-					PAGE_SIZE - reserved_space, true);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * page_mkwrite gets called when the page is firstly dirtied after it's</div><div class='del'>-	 * faulted in, but write(2) could also dirty a page and set delalloc</div><div class='del'>-	 * bits, thus in this case for space account reason, we still need to</div><div class='del'>-	 * clear any delalloc bits within this page range since we have to</div><div class='del'>-	 * reserve data&amp;meta space before lock_page() (see above comments).</div><div class='del'>-	 */</div><div class='del'>-	clear_extent_bit(&amp;BTRFS_I(inode)-&gt;io_tree, page_start, end,</div><div class='del'>-			  EXTENT_DELALLOC | EXTENT_DO_ACCOUNTING |</div><div class='del'>-			  EXTENT_DEFRAG, 0, 0, &amp;cached_state);</div><div class='del'>-</div><div class='del'>-	ret2 = btrfs_set_extent_delalloc(BTRFS_I(inode), page_start, end, 0,</div><div class='del'>-					&amp;cached_state);</div><div class='del'>-	if (ret2) {</div><div class='del'>-		unlock_extent_cached(io_tree, page_start, page_end,</div><div class='del'>-				     &amp;cached_state);</div><div class='del'>-		ret = VM_FAULT_SIGBUS;</div><div class='del'>-		goto out_unlock;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* page is wholly or partially inside EOF */</div><div class='del'>-	if (page_start + PAGE_SIZE &gt; size)</div><div class='del'>-		zero_start = offset_in_page(size);</div><div class='del'>-	else</div><div class='del'>-		zero_start = PAGE_SIZE;</div><div class='del'>-</div><div class='del'>-	if (zero_start != PAGE_SIZE) {</div><div class='del'>-		memzero_page(page, zero_start, PAGE_SIZE - zero_start);</div><div class='del'>-		flush_dcache_page(page);</div><div class='del'>-	}</div><div class='del'>-	btrfs_page_clear_checked(fs_info, page, page_start, PAGE_SIZE);</div><div class='del'>-	btrfs_page_set_dirty(fs_info, page, page_start, end + 1 - page_start);</div><div class='del'>-	btrfs_page_set_uptodate(fs_info, page, page_start, end + 1 - page_start);</div><div class='del'>-</div><div class='del'>-	btrfs_set_inode_last_sub_trans(BTRFS_I(inode));</div><div class='del'>-</div><div class='del'>-	unlock_extent_cached(io_tree, page_start, page_end, &amp;cached_state);</div><div class='del'>-	up_read(&amp;BTRFS_I(inode)-&gt;i_mmap_lock);</div><div class='del'>-</div><div class='del'>-	btrfs_delalloc_release_extents(BTRFS_I(inode), PAGE_SIZE);</div><div class='del'>-	sb_end_pagefault(inode-&gt;i_sb);</div><div class='del'>-	extent_changeset_free(data_reserved);</div><div class='del'>-	return VM_FAULT_LOCKED;</div><div class='del'>-</div><div class='del'>-out_unlock:</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	up_read(&amp;BTRFS_I(inode)-&gt;i_mmap_lock);</div><div class='del'>-out:</div><div class='del'>-	btrfs_delalloc_release_extents(BTRFS_I(inode), PAGE_SIZE);</div><div class='del'>-	btrfs_delalloc_release_space(BTRFS_I(inode), data_reserved, page_start,</div><div class='del'>-				     reserved_space, (ret != 0));</div><div class='del'>-out_noreserve:</div><div class='del'>-	sb_end_pagefault(inode-&gt;i_sb);</div><div class='del'>-	extent_changeset_free(data_reserved);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int btrfs_truncate(struct inode *inode, bool skip_writeback)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='del'>-	struct btrfs_block_rsv *rsv;</div><div class='add'>+	struct btrfs_truncate_control control = {</div><div class='add'>+		.inode = inode,</div><div class='add'>+		.ino = btrfs_ino(inode),</div><div class='add'>+		.min_type = BTRFS_EXTENT_DATA_KEY,</div><div class='add'>+		.clear_extent_range = true,</div><div class='add'>+		.new_size = inode-&gt;vfs_inode.i_size,</div><div class='add'>+	};</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+	struct btrfs_block_rsv rsv;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='del'>-	u64 mask = fs_info-&gt;sectorsize - 1;</div><div class='del'>-	u64 min_size = btrfs_calc_metadata_size(fs_info, 1);</div><div class='del'>-	u64 extents_found = 0;</div><div class='add'>+	const u64 min_size = btrfs_calc_metadata_size(fs_info, 1);</div><div class='add'>+	const u64 lock_start = round_down(inode-&gt;vfs_inode.i_size, fs_info-&gt;sectorsize);</div><div class='add'>+	const u64 i_size_up = round_up(inode-&gt;vfs_inode.i_size, fs_info-&gt;sectorsize);</div><div class='add'>+</div><div class='add'>+	/* Our inode is locked and the i_size can't be changed concurrently. */</div><div class='add'>+	btrfs_assert_inode_locked(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (!skip_writeback) {</div><div class='del'>-		ret = btrfs_wait_ordered_range(inode, inode-&gt;i_size &amp; (~mask),</div><div class='del'>-					       (u64)-1);</div><div class='add'>+		ret = btrfs_wait_ordered_range(inode, lock_start, (u64)-1);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -8928,11 +7746,9 @@ static int btrfs_truncate(struct inode *inode, bool skip_writeback)</div><div class='ctx'> 	 * 2) fs_info-&gt;trans_block_rsv - this will have 1 items worth left for</div><div class='ctx'> 	 * updating the inode.</div><div class='ctx'> 	 */</div><div class='del'>-	rsv = btrfs_alloc_block_rsv(fs_info, BTRFS_BLOCK_RSV_TEMP);</div><div class='del'>-	if (!rsv)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	rsv-&gt;size = min_size;</div><div class='del'>-	rsv-&gt;failfast = 1;</div><div class='add'>+	btrfs_init_metadata_block_rsv(fs_info, &amp;rsv, BTRFS_BLOCK_RSV_TEMP);</div><div class='add'>+	rsv.size = min_size;</div><div class='add'>+	rsv.failfast = true;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * 1 for the truncate slack space</div><div class='hunk'>@@ -8945,22 +7761,43 @@ static int btrfs_truncate(struct inode *inode, bool skip_writeback)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Migrate the slack space for the truncate to our reserve */</div><div class='del'>-	ret = btrfs_block_rsv_migrate(&amp;fs_info-&gt;trans_block_rsv, rsv,</div><div class='add'>+	ret = btrfs_block_rsv_migrate(&amp;fs_info-&gt;trans_block_rsv, &amp;rsv,</div><div class='ctx'> 				      min_size, false);</div><div class='del'>-	BUG_ON(ret);</div><div class='add'>+	/*</div><div class='add'>+	 * We have reserved 2 metadata units when we started the transaction and</div><div class='add'>+	 * min_size matches 1 unit, so this should never fail, but if it does,</div><div class='add'>+	 * it's not critical we just fail truncation.</div><div class='add'>+	 */</div><div class='add'>+	if (WARN_ON(ret)) {</div><div class='add'>+		btrfs_end_transaction(trans);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	trans-&gt;block_rsv = rsv;</div><div class='add'>+	trans-&gt;block_rsv = &amp;rsv;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='del'>-		ret = btrfs_truncate_inode_items(trans, root, BTRFS_I(inode),</div><div class='del'>-						 inode-&gt;i_size,</div><div class='del'>-						 BTRFS_EXTENT_DATA_KEY,</div><div class='del'>-						 &amp;extents_found);</div><div class='add'>+		struct extent_state *cached_state = NULL;</div><div class='add'>+</div><div class='add'>+		btrfs_lock_extent(&amp;inode-&gt;io_tree, lock_start, (u64)-1, &amp;cached_state);</div><div class='add'>+		/*</div><div class='add'>+		 * We want to drop from the next block forward in case this new</div><div class='add'>+		 * size is not block aligned since we will be keeping the last</div><div class='add'>+		 * block of the extent just the way it is.</div><div class='add'>+		 */</div><div class='add'>+		btrfs_drop_extent_map_range(inode, i_size_up, (u64)-1, false);</div><div class='add'>+</div><div class='add'>+		ret = btrfs_truncate_inode_items(trans, root, &amp;control);</div><div class='add'>+</div><div class='add'>+		inode_sub_bytes(&amp;inode-&gt;vfs_inode, control.sub_bytes);</div><div class='add'>+		btrfs_inode_safe_disk_i_size_write(inode, control.last_size);</div><div class='add'>+</div><div class='add'>+		btrfs_unlock_extent(&amp;inode-&gt;io_tree, lock_start, (u64)-1, &amp;cached_state);</div><div class='add'>+</div><div class='ctx'> 		trans-&gt;block_rsv = &amp;fs_info-&gt;trans_block_rsv;</div><div class='ctx'> 		if (ret != -ENOSPC &amp;&amp; ret != -EAGAIN)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		ret = btrfs_update_inode(trans, root, BTRFS_I(inode));</div><div class='add'>+		ret = btrfs_update_inode(trans, inode);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='hunk'>@@ -8974,24 +7811,32 @@ static int btrfs_truncate(struct inode *inode, bool skip_writeback)</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		btrfs_block_rsv_release(fs_info, rsv, -1, NULL);</div><div class='add'>+		btrfs_block_rsv_release(fs_info, &amp;rsv, -1, NULL);</div><div class='ctx'> 		ret = btrfs_block_rsv_migrate(&amp;fs_info-&gt;trans_block_rsv,</div><div class='del'>-					      rsv, min_size, false);</div><div class='del'>-		BUG_ON(ret);	/* shouldn't happen */</div><div class='del'>-		trans-&gt;block_rsv = rsv;</div><div class='add'>+					      &amp;rsv, min_size, false);</div><div class='add'>+		/*</div><div class='add'>+		 * We have reserved 2 metadata units when we started the</div><div class='add'>+		 * transaction and min_size matches 1 unit, so this should never</div><div class='add'>+		 * fail, but if it does, it's not critical we just fail truncation.</div><div class='add'>+		 */</div><div class='add'>+		if (WARN_ON(ret))</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		trans-&gt;block_rsv = &amp;rsv;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We can't call btrfs_truncate_block inside a trans handle as we could</div><div class='del'>-	 * deadlock with freeze, if we got NEED_TRUNCATE_BLOCK then we know</div><div class='del'>-	 * we've truncated everything except the last little bit, and can do</div><div class='del'>-	 * btrfs_truncate_block and then update the disk_i_size.</div><div class='add'>+	 * deadlock with freeze, if we got BTRFS_NEED_TRUNCATE_BLOCK then we</div><div class='add'>+	 * know we've truncated everything except the last little bit, and can</div><div class='add'>+	 * do btrfs_truncate_block and then update the disk_i_size.</div><div class='ctx'> 	 */</div><div class='del'>-	if (ret == NEED_TRUNCATE_BLOCK) {</div><div class='add'>+	if (ret == BTRFS_NEED_TRUNCATE_BLOCK) {</div><div class='ctx'> 		btrfs_end_transaction(trans);</div><div class='ctx'> 		btrfs_btree_balance_dirty(fs_info);</div><div class='ctx'> </div><div class='del'>-		ret = btrfs_truncate_block(BTRFS_I(inode), inode-&gt;i_size, 0, 0);</div><div class='add'>+		ret = btrfs_truncate_block(inode, inode-&gt;vfs_inode.i_size,</div><div class='add'>+					   inode-&gt;vfs_inode.i_size, (u64)-1);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		trans = btrfs_start_transaction(root, 1);</div><div class='hunk'>@@ -8999,14 +7844,14 @@ static int btrfs_truncate(struct inode *inode, bool skip_writeback)</div><div class='ctx'> 			ret = PTR_ERR(trans);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='del'>-		btrfs_inode_safe_disk_i_size_write(BTRFS_I(inode), 0);</div><div class='add'>+		btrfs_inode_safe_disk_i_size_write(inode, 0);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (trans) {</div><div class='ctx'> 		int ret2;</div><div class='ctx'> </div><div class='ctx'> 		trans-&gt;block_rsv = &amp;fs_info-&gt;trans_block_rsv;</div><div class='del'>-		ret2 = btrfs_update_inode(trans, root, BTRFS_I(inode));</div><div class='add'>+		ret2 = btrfs_update_inode(trans, inode);</div><div class='ctx'> 		if (ret2 &amp;&amp; !ret)</div><div class='ctx'> 			ret = ret2;</div><div class='ctx'> </div><div class='hunk'>@@ -9016,7 +7861,7 @@ static int btrfs_truncate(struct inode *inode, bool skip_writeback)</div><div class='ctx'> 		btrfs_btree_balance_dirty(fs_info);</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='del'>-	btrfs_free_block_rsv(fs_info, rsv);</div><div class='add'>+	btrfs_block_rsv_release(fs_info, &amp;rsv, (u64)-1, NULL);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * So if we truncate and then write and fsync we normally would just</div><div class='ctx'> 	 * write the extents that changed, which is a problem if we need to</div><div class='hunk'>@@ -9031,52 +7876,29 @@ out:</div><div class='ctx'> 	 * between the old i_size and the new i_size, and there were no prealloc</div><div class='ctx'> 	 * extents beyond i_size to drop.</div><div class='ctx'> 	 */</div><div class='del'>-	if (extents_found &gt; 0)</div><div class='del'>-		set_bit(BTRFS_INODE_NEEDS_FULL_SYNC, &amp;BTRFS_I(inode)-&gt;runtime_flags);</div><div class='add'>+	if (control.extents_found &gt; 0)</div><div class='add'>+		btrfs_set_inode_full_sync(inode);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * create a new subvolume directory/inode (helper for the ioctl).</div><div class='del'>- */</div><div class='del'>-int btrfs_create_subvol_root(struct btrfs_trans_handle *trans,</div><div class='del'>-			     struct btrfs_root *new_root,</div><div class='del'>-			     struct btrfs_root *parent_root,</div><div class='del'>-			     struct user_namespace *mnt_userns)</div><div class='add'>+struct inode *btrfs_new_subvol_inode(struct mnt_idmap *idmap,</div><div class='add'>+				     struct inode *dir)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='del'>-	int err;</div><div class='del'>-	u64 index = 0;</div><div class='del'>-	u64 ino;</div><div class='del'>-</div><div class='del'>-	err = btrfs_get_free_objectid(new_root, &amp;ino);</div><div class='del'>-	if (err &lt; 0)</div><div class='del'>-		return err;</div><div class='del'>-</div><div class='del'>-	inode = btrfs_new_inode(trans, new_root, mnt_userns, NULL, "..", 2,</div><div class='del'>-				ino, ino,</div><div class='del'>-				S_IFDIR | (~current_umask() &amp; S_IRWXUGO),</div><div class='del'>-				&amp;index);</div><div class='del'>-	if (IS_ERR(inode))</div><div class='del'>-		return PTR_ERR(inode);</div><div class='del'>-	inode-&gt;i_op = &amp;btrfs_dir_inode_operations;</div><div class='del'>-	inode-&gt;i_fop = &amp;btrfs_dir_file_operations;</div><div class='del'>-</div><div class='del'>-	set_nlink(inode, 1);</div><div class='del'>-	btrfs_i_size_write(BTRFS_I(inode), 0);</div><div class='del'>-	unlock_new_inode(inode);</div><div class='ctx'> </div><div class='del'>-	err = btrfs_subvol_inherit_props(trans, new_root, parent_root);</div><div class='del'>-	if (err)</div><div class='del'>-		btrfs_err(new_root-&gt;fs_info,</div><div class='del'>-			  "error inheriting subvolume %llu properties: %d",</div><div class='del'>-			  new_root-&gt;root_key.objectid, err);</div><div class='del'>-</div><div class='del'>-	err = btrfs_update_inode(trans, new_root, BTRFS_I(inode));</div><div class='del'>-</div><div class='del'>-	iput(inode);</div><div class='del'>-	return err;</div><div class='add'>+	inode = new_inode(dir-&gt;i_sb);</div><div class='add'>+	if (inode) {</div><div class='add'>+		/*</div><div class='add'>+		 * Subvolumes don't inherit the sgid bit or the parent's gid if</div><div class='add'>+		 * the parent's sgid bit is set. This is probably a bug.</div><div class='add'>+		 */</div><div class='add'>+		inode_init_owner(idmap, inode, NULL,</div><div class='add'>+				 S_IFDIR | (~current_umask() &amp; S_IRWXUGO));</div><div class='add'>+		inode-&gt;i_op = &amp;btrfs_dir_inode_operations;</div><div class='add'>+		inode-&gt;i_fop = &amp;btrfs_dir_file_operations;</div><div class='add'>+	}</div><div class='add'>+	return inode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct inode *btrfs_alloc_inode(struct super_block *sb)</div><div class='hunk'>@@ -9085,7 +7907,7 @@ struct inode *btrfs_alloc_inode(struct super_block *sb)</div><div class='ctx'> 	struct btrfs_inode *ei;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> </div><div class='del'>-	ei = kmem_cache_alloc(btrfs_inode_cachep, GFP_KERNEL);</div><div class='add'>+	ei = alloc_inode_sb(sb, btrfs_inode_cachep, GFP_KERNEL);</div><div class='ctx'> 	if (!ei)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='hunk'>@@ -9095,13 +7917,18 @@ struct inode *btrfs_alloc_inode(struct super_block *sb)</div><div class='ctx'> 	ei-&gt;last_sub_trans = 0;</div><div class='ctx'> 	ei-&gt;logged_trans = 0;</div><div class='ctx'> 	ei-&gt;delalloc_bytes = 0;</div><div class='add'>+	/* new_delalloc_bytes and last_dir_index_offset are in a union. */</div><div class='ctx'> 	ei-&gt;new_delalloc_bytes = 0;</div><div class='ctx'> 	ei-&gt;defrag_bytes = 0;</div><div class='ctx'> 	ei-&gt;disk_i_size = 0;</div><div class='ctx'> 	ei-&gt;flags = 0;</div><div class='ctx'> 	ei-&gt;ro_flags = 0;</div><div class='add'>+	/*</div><div class='add'>+	 * -&gt;index_cnt will be properly initialized later when creating a new</div><div class='add'>+	 * inode (btrfs_create_new_inode()) or when reading an existing inode</div><div class='add'>+	 * from disk (btrfs_read_locked_inode()).</div><div class='add'>+	 */</div><div class='ctx'> 	ei-&gt;csum_bytes = 0;</div><div class='del'>-	ei-&gt;index_cnt = (u64)-1;</div><div class='ctx'> 	ei-&gt;dir_index = 0;</div><div class='ctx'> 	ei-&gt;last_unlink_trans = 0;</div><div class='ctx'> 	ei-&gt;last_reflink_trans = 0;</div><div class='hunk'>@@ -9118,24 +7945,24 @@ struct inode *btrfs_alloc_inode(struct super_block *sb)</div><div class='ctx'> </div><div class='ctx'> 	ei-&gt;delayed_node = NULL;</div><div class='ctx'> </div><div class='del'>-	ei-&gt;i_otime.tv_sec = 0;</div><div class='del'>-	ei-&gt;i_otime.tv_nsec = 0;</div><div class='add'>+	ei-&gt;i_otime_sec = 0;</div><div class='add'>+	ei-&gt;i_otime_nsec = 0;</div><div class='ctx'> </div><div class='ctx'> 	inode = &amp;ei-&gt;vfs_inode;</div><div class='del'>-	extent_map_tree_init(&amp;ei-&gt;extent_tree);</div><div class='del'>-	extent_io_tree_init(fs_info, &amp;ei-&gt;io_tree, IO_TREE_INODE_IO, inode);</div><div class='del'>-	extent_io_tree_init(fs_info, &amp;ei-&gt;io_failure_tree,</div><div class='del'>-			    IO_TREE_INODE_IO_FAILURE, inode);</div><div class='del'>-	extent_io_tree_init(fs_info, &amp;ei-&gt;file_extent_tree,</div><div class='del'>-			    IO_TREE_INODE_FILE_EXTENT, inode);</div><div class='del'>-	ei-&gt;io_tree.track_uptodate = true;</div><div class='del'>-	ei-&gt;io_failure_tree.track_uptodate = true;</div><div class='del'>-	atomic_set(&amp;ei-&gt;sync_writers, 0);</div><div class='add'>+	btrfs_extent_map_tree_init(&amp;ei-&gt;extent_tree);</div><div class='add'>+</div><div class='add'>+	/* This io tree sets the valid inode. */</div><div class='add'>+	btrfs_extent_io_tree_init(fs_info, &amp;ei-&gt;io_tree, IO_TREE_INODE_IO);</div><div class='add'>+	ei-&gt;io_tree.inode = ei;</div><div class='add'>+</div><div class='add'>+	ei-&gt;file_extent_tree = NULL;</div><div class='add'>+</div><div class='ctx'> 	mutex_init(&amp;ei-&gt;log_mutex);</div><div class='del'>-	btrfs_ordered_inode_tree_init(&amp;ei-&gt;ordered_tree);</div><div class='add'>+	spin_lock_init(&amp;ei-&gt;ordered_tree_lock);</div><div class='add'>+	ei-&gt;ordered_tree = RB_ROOT;</div><div class='add'>+	ei-&gt;ordered_tree_last = NULL;</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;ei-&gt;delalloc_inodes);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;ei-&gt;delayed_iput);</div><div class='del'>-	RB_CLEAR_NODE(&amp;ei-&gt;rb_node);</div><div class='ctx'> 	init_rwsem(&amp;ei-&gt;i_mmap_lock);</div><div class='ctx'> </div><div class='ctx'> 	return inode;</div><div class='hunk'>@@ -9144,13 +7971,15 @@ struct inode *btrfs_alloc_inode(struct super_block *sb)</div><div class='ctx'> #ifdef CONFIG_BTRFS_FS_RUN_SANITY_TESTS</div><div class='ctx'> void btrfs_test_destroy_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	btrfs_drop_extent_cache(BTRFS_I(inode), 0, (u64)-1, 0);</div><div class='add'>+	btrfs_drop_extent_map_range(BTRFS_I(inode), 0, (u64)-1, false);</div><div class='add'>+	kfree(BTRFS_I(inode)-&gt;file_extent_tree);</div><div class='ctx'> 	kmem_cache_free(btrfs_inode_cachep, BTRFS_I(inode));</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> void btrfs_free_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='add'>+	kfree(BTRFS_I(inode)-&gt;file_extent_tree);</div><div class='ctx'> 	kmem_cache_free(btrfs_inode_cachep, BTRFS_I(inode));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -9159,6 +7988,7 @@ void btrfs_destroy_inode(struct inode *vfs_inode)</div><div class='ctx'> 	struct btrfs_ordered_extent *ordered;</div><div class='ctx'> 	struct btrfs_inode *inode = BTRFS_I(vfs_inode);</div><div class='ctx'> 	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	bool freespace_inode;</div><div class='ctx'> </div><div class='ctx'> 	WARN_ON(!hlist_empty(&amp;vfs_inode-&gt;i_dentry));</div><div class='ctx'> 	WARN_ON(vfs_inode-&gt;i_data.nrpages);</div><div class='hunk'>@@ -9168,9 +7998,10 @@ void btrfs_destroy_inode(struct inode *vfs_inode)</div><div class='ctx'> 	if (!S_ISDIR(vfs_inode-&gt;i_mode)) {</div><div class='ctx'> 		WARN_ON(inode-&gt;delalloc_bytes);</div><div class='ctx'> 		WARN_ON(inode-&gt;new_delalloc_bytes);</div><div class='add'>+		WARN_ON(inode-&gt;csum_bytes);</div><div class='ctx'> 	}</div><div class='del'>-	WARN_ON(inode-&gt;csum_bytes);</div><div class='del'>-	WARN_ON(inode-&gt;defrag_bytes);</div><div class='add'>+	if (!root || !btrfs_is_data_reloc_root(root))</div><div class='add'>+		WARN_ON(inode-&gt;defrag_bytes);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * This can happen where we create an inode, but somebody else also</div><div class='hunk'>@@ -9180,6 +8011,12 @@ void btrfs_destroy_inode(struct inode *vfs_inode)</div><div class='ctx'> 	if (!root)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * If this is a free space inode do not take the ordered extents lockdep</div><div class='add'>+	 * map.</div><div class='add'>+	 */</div><div class='add'>+	freespace_inode = btrfs_is_free_space_inode(inode);</div><div class='add'>+</div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		ordered = btrfs_lookup_first_ordered_extent(inode, (u64)-1);</div><div class='ctx'> 		if (!ordered)</div><div class='hunk'>@@ -9188,14 +8025,18 @@ void btrfs_destroy_inode(struct inode *vfs_inode)</div><div class='ctx'> 			btrfs_err(root-&gt;fs_info,</div><div class='ctx'> 				  "found ordered extent %llu %llu on inode cleanup",</div><div class='ctx'> 				  ordered-&gt;file_offset, ordered-&gt;num_bytes);</div><div class='add'>+</div><div class='add'>+			if (!freespace_inode)</div><div class='add'>+				btrfs_lockdep_acquire(root-&gt;fs_info, btrfs_ordered_extent);</div><div class='add'>+</div><div class='ctx'> 			btrfs_remove_ordered_extent(inode, ordered);</div><div class='ctx'> 			btrfs_put_ordered_extent(ordered);</div><div class='ctx'> 			btrfs_put_ordered_extent(ordered);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	btrfs_qgroup_check_reserved_leak(inode);</div><div class='del'>-	inode_tree_del(inode);</div><div class='del'>-	btrfs_drop_extent_cache(inode, 0, (u64)-1, 0);</div><div class='add'>+	btrfs_del_inode_from_root(inode);</div><div class='add'>+	btrfs_drop_extent_map_range(inode, 0, (u64)-1, false);</div><div class='ctx'> 	btrfs_inode_clear_file_extent_range(inode, 0, (u64)-1);</div><div class='ctx'> 	btrfs_put_root(inode-&gt;root);</div><div class='ctx'> }</div><div class='hunk'>@@ -9211,14 +8052,17 @@ int btrfs_drop_inode(struct inode *inode)</div><div class='ctx'> 	if (btrfs_root_refs(&amp;root-&gt;root_item) == 0)</div><div class='ctx'> 		return 1;</div><div class='ctx'> 	else</div><div class='del'>-		return generic_drop_inode(inode);</div><div class='add'>+		return inode_generic_drop(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void init_once(void *foo)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_inode *ei = (struct btrfs_inode *) foo;</div><div class='add'>+	struct btrfs_inode *ei = foo;</div><div class='ctx'> </div><div class='ctx'> 	inode_init_once(&amp;ei-&gt;vfs_inode);</div><div class='add'>+#ifdef CONFIG_FS_VERITY</div><div class='add'>+	ei-&gt;i_verity_info = NULL;</div><div class='add'>+#endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void __cold btrfs_destroy_cachep(void)</div><div class='hunk'>@@ -9229,65 +8073,34 @@ void __cold btrfs_destroy_cachep(void)</div><div class='ctx'> 	 */</div><div class='ctx'> 	rcu_barrier();</div><div class='ctx'> 	kmem_cache_destroy(btrfs_inode_cachep);</div><div class='del'>-	kmem_cache_destroy(btrfs_trans_handle_cachep);</div><div class='del'>-	kmem_cache_destroy(btrfs_path_cachep);</div><div class='del'>-	kmem_cache_destroy(btrfs_free_space_cachep);</div><div class='del'>-	kmem_cache_destroy(btrfs_free_space_bitmap_cachep);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int __init btrfs_init_cachep(void)</div><div class='ctx'> {</div><div class='ctx'> 	btrfs_inode_cachep = kmem_cache_create("btrfs_inode",</div><div class='ctx'> 			sizeof(struct btrfs_inode), 0,</div><div class='del'>-			SLAB_RECLAIM_ACCOUNT | SLAB_MEM_SPREAD | SLAB_ACCOUNT,</div><div class='add'>+			SLAB_RECLAIM_ACCOUNT | SLAB_ACCOUNT,</div><div class='ctx'> 			init_once);</div><div class='ctx'> 	if (!btrfs_inode_cachep)</div><div class='del'>-		goto fail;</div><div class='del'>-</div><div class='del'>-	btrfs_trans_handle_cachep = kmem_cache_create("btrfs_trans_handle",</div><div class='del'>-			sizeof(struct btrfs_trans_handle), 0,</div><div class='del'>-			SLAB_TEMPORARY | SLAB_MEM_SPREAD, NULL);</div><div class='del'>-	if (!btrfs_trans_handle_cachep)</div><div class='del'>-		goto fail;</div><div class='del'>-</div><div class='del'>-	btrfs_path_cachep = kmem_cache_create("btrfs_path",</div><div class='del'>-			sizeof(struct btrfs_path), 0,</div><div class='del'>-			SLAB_MEM_SPREAD, NULL);</div><div class='del'>-	if (!btrfs_path_cachep)</div><div class='del'>-		goto fail;</div><div class='del'>-</div><div class='del'>-	btrfs_free_space_cachep = kmem_cache_create("btrfs_free_space",</div><div class='del'>-			sizeof(struct btrfs_free_space), 0,</div><div class='del'>-			SLAB_MEM_SPREAD, NULL);</div><div class='del'>-	if (!btrfs_free_space_cachep)</div><div class='del'>-		goto fail;</div><div class='del'>-</div><div class='del'>-	btrfs_free_space_bitmap_cachep = kmem_cache_create("btrfs_free_space_bitmap",</div><div class='del'>-							PAGE_SIZE, PAGE_SIZE,</div><div class='del'>-							SLAB_MEM_SPREAD, NULL);</div><div class='del'>-	if (!btrfs_free_space_bitmap_cachep)</div><div class='del'>-		goto fail;</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='del'>-fail:</div><div class='del'>-	btrfs_destroy_cachep();</div><div class='del'>-	return -ENOMEM;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btrfs_getattr(struct user_namespace *mnt_userns,</div><div class='add'>+static int btrfs_getattr(struct mnt_idmap *idmap,</div><div class='ctx'> 			 const struct path *path, struct kstat *stat,</div><div class='ctx'> 			 u32 request_mask, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	u64 delalloc_bytes;</div><div class='ctx'> 	u64 inode_bytes;</div><div class='ctx'> 	struct inode *inode = d_inode(path-&gt;dentry);</div><div class='del'>-	u32 blocksize = inode-&gt;i_sb-&gt;s_blocksize;</div><div class='add'>+	u32 blocksize = btrfs_sb(inode-&gt;i_sb)-&gt;sectorsize;</div><div class='ctx'> 	u32 bi_flags = BTRFS_I(inode)-&gt;flags;</div><div class='ctx'> 	u32 bi_ro_flags = BTRFS_I(inode)-&gt;ro_flags;</div><div class='ctx'> </div><div class='ctx'> 	stat-&gt;result_mask |= STATX_BTIME;</div><div class='del'>-	stat-&gt;btime.tv_sec = BTRFS_I(inode)-&gt;i_otime.tv_sec;</div><div class='del'>-	stat-&gt;btime.tv_nsec = BTRFS_I(inode)-&gt;i_otime.tv_nsec;</div><div class='add'>+	stat-&gt;btime.tv_sec = BTRFS_I(inode)-&gt;i_otime_sec;</div><div class='add'>+	stat-&gt;btime.tv_nsec = BTRFS_I(inode)-&gt;i_otime_nsec;</div><div class='ctx'> 	if (bi_flags &amp; BTRFS_INODE_APPEND)</div><div class='ctx'> 		stat-&gt;attributes |= STATX_ATTR_APPEND;</div><div class='ctx'> 	if (bi_flags &amp; BTRFS_INODE_COMPRESS)</div><div class='hunk'>@@ -9304,15 +8117,18 @@ static int btrfs_getattr(struct user_namespace *mnt_userns,</div><div class='ctx'> 				  STATX_ATTR_IMMUTABLE |</div><div class='ctx'> 				  STATX_ATTR_NODUMP);</div><div class='ctx'> </div><div class='del'>-	generic_fillattr(mnt_userns, inode, stat);</div><div class='add'>+	generic_fillattr(idmap, request_mask, inode, stat);</div><div class='ctx'> 	stat-&gt;dev = BTRFS_I(inode)-&gt;root-&gt;anon_dev;</div><div class='ctx'> </div><div class='add'>+	stat-&gt;subvol = btrfs_root_id(BTRFS_I(inode)-&gt;root);</div><div class='add'>+	stat-&gt;result_mask |= STATX_SUBVOL;</div><div class='add'>+</div><div class='ctx'> 	spin_lock(&amp;BTRFS_I(inode)-&gt;lock);</div><div class='ctx'> 	delalloc_bytes = BTRFS_I(inode)-&gt;new_delalloc_bytes;</div><div class='ctx'> 	inode_bytes = inode_get_bytes(inode);</div><div class='ctx'> 	spin_unlock(&amp;BTRFS_I(inode)-&gt;lock);</div><div class='ctx'> 	stat-&gt;blocks = (ALIGN(inode_bytes, blocksize) +</div><div class='del'>-			ALIGN(delalloc_bytes, blocksize)) &gt;&gt; 9;</div><div class='add'>+			ALIGN(delalloc_bytes, blocksize)) &gt;&gt; SECTOR_SHIFT;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -9321,22 +8137,25 @@ static int btrfs_rename_exchange(struct inode *old_dir,</div><div class='ctx'> 			      struct inode *new_dir,</div><div class='ctx'> 			      struct dentry *new_dentry)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(old_dir-&gt;i_sb);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(old_dir);</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='add'>+	unsigned int trans_num_items;</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(old_dir)-&gt;root;</div><div class='ctx'> 	struct btrfs_root *dest = BTRFS_I(new_dir)-&gt;root;</div><div class='ctx'> 	struct inode *new_inode = new_dentry-&gt;d_inode;</div><div class='ctx'> 	struct inode *old_inode = old_dentry-&gt;d_inode;</div><div class='del'>-	struct timespec64 ctime = current_time(old_inode);</div><div class='add'>+	struct btrfs_rename_ctx old_rename_ctx;</div><div class='add'>+	struct btrfs_rename_ctx new_rename_ctx;</div><div class='ctx'> 	u64 old_ino = btrfs_ino(BTRFS_I(old_inode));</div><div class='ctx'> 	u64 new_ino = btrfs_ino(BTRFS_I(new_inode));</div><div class='ctx'> 	u64 old_idx = 0;</div><div class='ctx'> 	u64 new_idx = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int ret2;</div><div class='del'>-	bool root_log_pinned = false;</div><div class='del'>-	bool dest_log_pinned = false;</div><div class='ctx'> 	bool need_abort = false;</div><div class='add'>+	bool logs_pinned = false;</div><div class='add'>+	struct fscrypt_name old_fname, new_fname;</div><div class='add'>+	struct fscrypt_str *old_name, *new_name;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * For non-subvolumes allow exchange only within one subvolume, in the</div><div class='hunk'>@@ -9348,20 +8167,56 @@ static int btrfs_rename_exchange(struct inode *old_dir,</div><div class='ctx'> 	     new_ino != BTRFS_FIRST_FREE_OBJECTID))</div><div class='ctx'> 		return -EXDEV;</div><div class='ctx'> </div><div class='add'>+	ret = fscrypt_setup_filename(old_dir, &amp;old_dentry-&gt;d_name, 0, &amp;old_fname);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	ret = fscrypt_setup_filename(new_dir, &amp;new_dentry-&gt;d_name, 0, &amp;new_fname);</div><div class='add'>+	if (ret) {</div><div class='add'>+		fscrypt_free_filename(&amp;old_fname);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	old_name = &amp;old_fname.disk_name;</div><div class='add'>+	new_name = &amp;new_fname.disk_name;</div><div class='add'>+</div><div class='ctx'> 	/* close the race window with snapshot create/destroy ioctl */</div><div class='ctx'> 	if (old_ino == BTRFS_FIRST_FREE_OBJECTID ||</div><div class='ctx'> 	    new_ino == BTRFS_FIRST_FREE_OBJECTID)</div><div class='ctx'> 		down_read(&amp;fs_info-&gt;subvol_sem);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * We want to reserve the absolute worst case amount of items.  So if</div><div class='del'>-	 * both inodes are subvols and we need to unlink them then that would</div><div class='del'>-	 * require 4 item modifications, but if they are both normal inodes it</div><div class='del'>-	 * would require 5 item modifications, so we'll assume their normal</div><div class='del'>-	 * inodes.  So 5 * 2 is 10, plus 2 for the new links, so 12 total items</div><div class='del'>-	 * should cover the worst case number of items we'll modify.</div><div class='add'>+	 * For each inode:</div><div class='add'>+	 * 1 to remove old dir item</div><div class='add'>+	 * 1 to remove old dir index</div><div class='add'>+	 * 1 to add new dir item</div><div class='add'>+	 * 1 to add new dir index</div><div class='add'>+	 * 1 to update parent inode</div><div class='add'>+	 *</div><div class='add'>+	 * If the parents are the same, we only need to account for one</div><div class='ctx'> 	 */</div><div class='del'>-	trans = btrfs_start_transaction(root, 12);</div><div class='add'>+	trans_num_items = (old_dir == new_dir ? 9 : 10);</div><div class='add'>+	if (old_ino == BTRFS_FIRST_FREE_OBJECTID) {</div><div class='add'>+		/*</div><div class='add'>+		 * 1 to remove old root ref</div><div class='add'>+		 * 1 to remove old root backref</div><div class='add'>+		 * 1 to add new root ref</div><div class='add'>+		 * 1 to add new root backref</div><div class='add'>+		 */</div><div class='add'>+		trans_num_items += 4;</div><div class='add'>+	} else {</div><div class='add'>+		/*</div><div class='add'>+		 * 1 to update inode item</div><div class='add'>+		 * 1 to remove old inode ref</div><div class='add'>+		 * 1 to add new inode ref</div><div class='add'>+		 */</div><div class='add'>+		trans_num_items += 3;</div><div class='add'>+	}</div><div class='add'>+	if (new_ino == BTRFS_FIRST_FREE_OBJECTID)</div><div class='add'>+		trans_num_items += 4;</div><div class='add'>+	else</div><div class='add'>+		trans_num_items += 3;</div><div class='add'>+	trans = btrfs_start_transaction(root, trans_num_items);</div><div class='ctx'> 	if (IS_ERR(trans)) {</div><div class='ctx'> 		ret = PTR_ERR(trans);</div><div class='ctx'> 		goto out_notrans;</div><div class='hunk'>@@ -9392,10 +8247,7 @@ static int btrfs_rename_exchange(struct inode *old_dir,</div><div class='ctx'> 		/* force full log commit if subvolume involved. */</div><div class='ctx'> 		btrfs_set_log_full_commit(trans);</div><div class='ctx'> 	} else {</div><div class='del'>-		ret = btrfs_insert_inode_ref(trans, dest,</div><div class='del'>-					     new_dentry-&gt;d_name.name,</div><div class='del'>-					     new_dentry-&gt;d_name.len,</div><div class='del'>-					     old_ino,</div><div class='add'>+		ret = btrfs_insert_inode_ref(trans, dest, new_name, old_ino,</div><div class='ctx'> 					     btrfs_ino(BTRFS_I(new_dir)),</div><div class='ctx'> 					     old_idx);</div><div class='ctx'> 		if (ret)</div><div class='hunk'>@@ -9408,14 +8260,11 @@ static int btrfs_rename_exchange(struct inode *old_dir,</div><div class='ctx'> 		/* force full log commit if subvolume involved. */</div><div class='ctx'> 		btrfs_set_log_full_commit(trans);</div><div class='ctx'> 	} else {</div><div class='del'>-		ret = btrfs_insert_inode_ref(trans, root,</div><div class='del'>-					     old_dentry-&gt;d_name.name,</div><div class='del'>-					     old_dentry-&gt;d_name.len,</div><div class='del'>-					     new_ino,</div><div class='add'>+		ret = btrfs_insert_inode_ref(trans, root, old_name, new_ino,</div><div class='ctx'> 					     btrfs_ino(BTRFS_I(old_dir)),</div><div class='ctx'> 					     new_idx);</div><div class='ctx'> 		if (ret) {</div><div class='del'>-			if (need_abort)</div><div class='add'>+			if (unlikely(need_abort))</div><div class='ctx'> 				btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out_fail;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -9426,85 +8275,94 @@ static int btrfs_rename_exchange(struct inode *old_dir,</div><div class='ctx'> 	inode_inc_iversion(new_dir);</div><div class='ctx'> 	inode_inc_iversion(old_inode);</div><div class='ctx'> 	inode_inc_iversion(new_inode);</div><div class='del'>-	old_dir-&gt;i_ctime = old_dir-&gt;i_mtime = ctime;</div><div class='del'>-	new_dir-&gt;i_ctime = new_dir-&gt;i_mtime = ctime;</div><div class='del'>-	old_inode-&gt;i_ctime = ctime;</div><div class='del'>-	new_inode-&gt;i_ctime = ctime;</div><div class='add'>+	simple_rename_timestamp(old_dir, old_dentry, new_dir, new_dentry);</div><div class='add'>+</div><div class='add'>+	if (old_ino != BTRFS_FIRST_FREE_OBJECTID &amp;&amp;</div><div class='add'>+	    new_ino != BTRFS_FIRST_FREE_OBJECTID) {</div><div class='add'>+		/*</div><div class='add'>+		 * If we are renaming in the same directory (and it's not for</div><div class='add'>+		 * root entries) pin the log early to prevent any concurrent</div><div class='add'>+		 * task from logging the directory after we removed the old</div><div class='add'>+		 * entries and before we add the new entries, otherwise that</div><div class='add'>+		 * task can sync a log without any entry for the inodes we are</div><div class='add'>+		 * renaming and therefore replaying that log, if a power failure</div><div class='add'>+		 * happens after syncing the log, would result in deleting the</div><div class='add'>+		 * inodes.</div><div class='add'>+		 *</div><div class='add'>+		 * If the rename affects two different directories, we want to</div><div class='add'>+		 * make sure the that there's no log commit that contains</div><div class='add'>+		 * updates for only one of the directories but not for the</div><div class='add'>+		 * other.</div><div class='add'>+		 *</div><div class='add'>+		 * If we are renaming an entry for a root, we don't care about</div><div class='add'>+		 * log updates since we called btrfs_set_log_full_commit().</div><div class='add'>+		 */</div><div class='add'>+		btrfs_pin_log_trans(root);</div><div class='add'>+		btrfs_pin_log_trans(dest);</div><div class='add'>+		logs_pinned = true;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (old_dentry-&gt;d_parent != new_dentry-&gt;d_parent) {</div><div class='ctx'> 		btrfs_record_unlink_dir(trans, BTRFS_I(old_dir),</div><div class='del'>-				BTRFS_I(old_inode), 1);</div><div class='add'>+					BTRFS_I(old_inode), true);</div><div class='ctx'> 		btrfs_record_unlink_dir(trans, BTRFS_I(new_dir),</div><div class='del'>-				BTRFS_I(new_inode), 1);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Now pin the logs of the roots. We do it to ensure that no other task</div><div class='del'>-	 * can sync the logs while we are in progress with the rename, because</div><div class='del'>-	 * that could result in an inconsistency in case any of the inodes that</div><div class='del'>-	 * are part of this rename operation were logged before.</div><div class='del'>-	 *</div><div class='del'>-	 * We pin the logs even if at this precise moment none of the inodes was</div><div class='del'>-	 * logged before. This is because right after we checked for that, some</div><div class='del'>-	 * other task fsyncing some other inode not involved with this rename</div><div class='del'>-	 * operation could log that one of our inodes exists.</div><div class='del'>-	 *</div><div class='del'>-	 * We don't need to pin the logs before the above calls to</div><div class='del'>-	 * btrfs_insert_inode_ref(), since those don't ever need to change a log.</div><div class='del'>-	 */</div><div class='del'>-	if (old_ino != BTRFS_FIRST_FREE_OBJECTID) {</div><div class='del'>-		btrfs_pin_log_trans(root);</div><div class='del'>-		root_log_pinned = true;</div><div class='del'>-	}</div><div class='del'>-	if (new_ino != BTRFS_FIRST_FREE_OBJECTID) {</div><div class='del'>-		btrfs_pin_log_trans(dest);</div><div class='del'>-		dest_log_pinned = true;</div><div class='add'>+					BTRFS_I(new_inode), true);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* src is a subvolume */</div><div class='ctx'> 	if (old_ino == BTRFS_FIRST_FREE_OBJECTID) {</div><div class='del'>-		ret = btrfs_unlink_subvol(trans, old_dir, old_dentry);</div><div class='add'>+		ret = btrfs_unlink_subvol(trans, BTRFS_I(old_dir), old_dentry);</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			goto out_fail;</div><div class='add'>+		}</div><div class='ctx'> 	} else { /* src is an inode */</div><div class='ctx'> 		ret = __btrfs_unlink_inode(trans, BTRFS_I(old_dir),</div><div class='ctx'> 					   BTRFS_I(old_dentry-&gt;d_inode),</div><div class='del'>-					   old_dentry-&gt;d_name.name,</div><div class='del'>-					   old_dentry-&gt;d_name.len);</div><div class='del'>-		if (!ret)</div><div class='del'>-			ret = btrfs_update_inode(trans, root, BTRFS_I(old_inode));</div><div class='del'>-	}</div><div class='del'>-	if (ret) {</div><div class='del'>-		btrfs_abort_transaction(trans, ret);</div><div class='del'>-		goto out_fail;</div><div class='add'>+					   old_name, &amp;old_rename_ctx);</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			goto out_fail;</div><div class='add'>+		}</div><div class='add'>+		ret = btrfs_update_inode(trans, BTRFS_I(old_inode));</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			goto out_fail;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* dest is a subvolume */</div><div class='ctx'> 	if (new_ino == BTRFS_FIRST_FREE_OBJECTID) {</div><div class='del'>-		ret = btrfs_unlink_subvol(trans, new_dir, new_dentry);</div><div class='add'>+		ret = btrfs_unlink_subvol(trans, BTRFS_I(new_dir), new_dentry);</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			goto out_fail;</div><div class='add'>+		}</div><div class='ctx'> 	} else { /* dest is an inode */</div><div class='ctx'> 		ret = __btrfs_unlink_inode(trans, BTRFS_I(new_dir),</div><div class='ctx'> 					   BTRFS_I(new_dentry-&gt;d_inode),</div><div class='del'>-					   new_dentry-&gt;d_name.name,</div><div class='del'>-					   new_dentry-&gt;d_name.len);</div><div class='del'>-		if (!ret)</div><div class='del'>-			ret = btrfs_update_inode(trans, dest, BTRFS_I(new_inode));</div><div class='del'>-	}</div><div class='del'>-	if (ret) {</div><div class='del'>-		btrfs_abort_transaction(trans, ret);</div><div class='del'>-		goto out_fail;</div><div class='add'>+					   new_name, &amp;new_rename_ctx);</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			goto out_fail;</div><div class='add'>+		}</div><div class='add'>+		ret = btrfs_update_inode(trans, BTRFS_I(new_inode));</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			goto out_fail;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_add_link(trans, BTRFS_I(new_dir), BTRFS_I(old_inode),</div><div class='del'>-			     new_dentry-&gt;d_name.name,</div><div class='del'>-			     new_dentry-&gt;d_name.len, 0, old_idx);</div><div class='del'>-	if (ret) {</div><div class='add'>+			     new_name, 0, old_idx);</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out_fail;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_add_link(trans, BTRFS_I(old_dir), BTRFS_I(new_inode),</div><div class='del'>-			     old_dentry-&gt;d_name.name,</div><div class='del'>-			     old_dentry-&gt;d_name.len, 0, new_idx);</div><div class='del'>-	if (ret) {</div><div class='add'>+			     old_name, 0, new_idx);</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out_fail;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -9514,45 +8372,23 @@ static int btrfs_rename_exchange(struct inode *old_dir,</div><div class='ctx'> 	if (new_inode-&gt;i_nlink == 1)</div><div class='ctx'> 		BTRFS_I(new_inode)-&gt;dir_index = new_idx;</div><div class='ctx'> </div><div class='del'>-	if (root_log_pinned) {</div><div class='del'>-		btrfs_log_new_name(trans, BTRFS_I(old_inode), BTRFS_I(old_dir),</div><div class='del'>-				   new_dentry-&gt;d_parent);</div><div class='del'>-		btrfs_end_log_trans(root);</div><div class='del'>-		root_log_pinned = false;</div><div class='del'>-	}</div><div class='del'>-	if (dest_log_pinned) {</div><div class='del'>-		btrfs_log_new_name(trans, BTRFS_I(new_inode), BTRFS_I(new_dir),</div><div class='del'>-				   old_dentry-&gt;d_parent);</div><div class='del'>-		btrfs_end_log_trans(dest);</div><div class='del'>-		dest_log_pinned = false;</div><div class='del'>-	}</div><div class='del'>-out_fail:</div><div class='ctx'> 	/*</div><div class='del'>-	 * If we have pinned a log and an error happened, we unpin tasks</div><div class='del'>-	 * trying to sync the log and force them to fallback to a transaction</div><div class='del'>-	 * commit if the log currently contains any of the inodes involved in</div><div class='del'>-	 * this rename operation (to ensure we do not persist a log with an</div><div class='del'>-	 * inconsistent state for any of these inodes or leading to any</div><div class='del'>-	 * inconsistencies when replayed). If the transaction was aborted, the</div><div class='del'>-	 * abortion reason is propagated to userspace when attempting to commit</div><div class='del'>-	 * the transaction. If the log does not contain any of these inodes, we</div><div class='del'>-	 * allow the tasks to sync it.</div><div class='add'>+	 * Do the log updates for all inodes.</div><div class='add'>+	 *</div><div class='add'>+	 * If either entry is for a root we don't need to update the logs since</div><div class='add'>+	 * we've called btrfs_set_log_full_commit() before.</div><div class='ctx'> 	 */</div><div class='del'>-	if (ret &amp;&amp; (root_log_pinned || dest_log_pinned)) {</div><div class='del'>-		if (btrfs_inode_in_log(BTRFS_I(old_dir), fs_info-&gt;generation) ||</div><div class='del'>-		    btrfs_inode_in_log(BTRFS_I(new_dir), fs_info-&gt;generation) ||</div><div class='del'>-		    btrfs_inode_in_log(BTRFS_I(old_inode), fs_info-&gt;generation) ||</div><div class='del'>-		    btrfs_inode_in_log(BTRFS_I(new_inode), fs_info-&gt;generation))</div><div class='del'>-			btrfs_set_log_full_commit(trans);</div><div class='add'>+	if (logs_pinned) {</div><div class='add'>+		btrfs_log_new_name(trans, old_dentry, BTRFS_I(old_dir),</div><div class='add'>+				   old_rename_ctx.index, new_dentry-&gt;d_parent);</div><div class='add'>+		btrfs_log_new_name(trans, new_dentry, BTRFS_I(new_dir),</div><div class='add'>+				   new_rename_ctx.index, old_dentry-&gt;d_parent);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		if (root_log_pinned) {</div><div class='del'>-			btrfs_end_log_trans(root);</div><div class='del'>-			root_log_pinned = false;</div><div class='del'>-		}</div><div class='del'>-		if (dest_log_pinned) {</div><div class='del'>-			btrfs_end_log_trans(dest);</div><div class='del'>-			dest_log_pinned = false;</div><div class='del'>-		}</div><div class='add'>+out_fail:</div><div class='add'>+	if (logs_pinned) {</div><div class='add'>+		btrfs_end_log_trans(root);</div><div class='add'>+		btrfs_end_log_trans(dest);</div><div class='ctx'> 	}</div><div class='ctx'> 	ret2 = btrfs_end_transaction(trans);</div><div class='ctx'> 	ret = ret ? ret : ret2;</div><div class='hunk'>@@ -9561,78 +8397,49 @@ out_notrans:</div><div class='ctx'> 	    old_ino == BTRFS_FIRST_FREE_OBJECTID)</div><div class='ctx'> 		up_read(&amp;fs_info-&gt;subvol_sem);</div><div class='ctx'> </div><div class='add'>+	fscrypt_free_filename(&amp;new_fname);</div><div class='add'>+	fscrypt_free_filename(&amp;old_fname);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btrfs_whiteout_for_rename(struct btrfs_trans_handle *trans,</div><div class='del'>-				     struct btrfs_root *root,</div><div class='del'>-				     struct user_namespace *mnt_userns,</div><div class='del'>-				     struct inode *dir,</div><div class='del'>-				     struct dentry *dentry)</div><div class='add'>+static struct inode *new_whiteout_inode(struct mnt_idmap *idmap,</div><div class='add'>+					struct inode *dir)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='ctx'> 	struct inode *inode;</div><div class='del'>-	u64 objectid;</div><div class='del'>-	u64 index;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_get_free_objectid(root, &amp;objectid);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	inode = btrfs_new_inode(trans, root, mnt_userns, dir,</div><div class='del'>-				dentry-&gt;d_name.name,</div><div class='del'>-				dentry-&gt;d_name.len,</div><div class='del'>-				btrfs_ino(BTRFS_I(dir)),</div><div class='del'>-				objectid,</div><div class='del'>-				S_IFCHR | WHITEOUT_MODE,</div><div class='del'>-				&amp;index);</div><div class='del'>-</div><div class='del'>-	if (IS_ERR(inode)) {</div><div class='del'>-		ret = PTR_ERR(inode);</div><div class='del'>-		return ret;</div><div class='add'>+	inode = new_inode(dir-&gt;i_sb);</div><div class='add'>+	if (inode) {</div><div class='add'>+		inode_init_owner(idmap, inode, dir,</div><div class='add'>+				 S_IFCHR | WHITEOUT_MODE);</div><div class='add'>+		inode-&gt;i_op = &amp;btrfs_special_inode_operations;</div><div class='add'>+		init_special_inode(inode, inode-&gt;i_mode, WHITEOUT_DEV);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	inode-&gt;i_op = &amp;btrfs_special_inode_operations;</div><div class='del'>-	init_special_inode(inode, inode-&gt;i_mode,</div><div class='del'>-		WHITEOUT_DEV);</div><div class='del'>-</div><div class='del'>-	ret = btrfs_init_inode_security(trans, inode, dir,</div><div class='del'>-				&amp;dentry-&gt;d_name);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	ret = btrfs_add_nondir(trans, BTRFS_I(dir), dentry,</div><div class='del'>-				BTRFS_I(inode), 0, index);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	ret = btrfs_update_inode(trans, root, BTRFS_I(inode));</div><div class='del'>-out:</div><div class='del'>-	unlock_new_inode(inode);</div><div class='del'>-	if (ret)</div><div class='del'>-		inode_dec_link_count(inode);</div><div class='del'>-	iput(inode);</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='add'>+	return inode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btrfs_rename(struct user_namespace *mnt_userns,</div><div class='add'>+static int btrfs_rename(struct mnt_idmap *idmap,</div><div class='ctx'> 			struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> 			struct inode *new_dir, struct dentry *new_dentry,</div><div class='ctx'> 			unsigned int flags)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(old_dir-&gt;i_sb);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(old_dir);</div><div class='add'>+	struct btrfs_new_inode_args whiteout_args = {</div><div class='add'>+		.dir = old_dir,</div><div class='add'>+		.dentry = old_dentry,</div><div class='add'>+	};</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	unsigned int trans_num_items;</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(old_dir)-&gt;root;</div><div class='ctx'> 	struct btrfs_root *dest = BTRFS_I(new_dir)-&gt;root;</div><div class='ctx'> 	struct inode *new_inode = d_inode(new_dentry);</div><div class='ctx'> 	struct inode *old_inode = d_inode(old_dentry);</div><div class='add'>+	struct btrfs_rename_ctx rename_ctx;</div><div class='ctx'> 	u64 index = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int ret2;</div><div class='ctx'> 	u64 old_ino = btrfs_ino(BTRFS_I(old_inode));</div><div class='del'>-	bool log_pinned = false;</div><div class='add'>+	struct fscrypt_name old_fname, new_fname;</div><div class='add'>+	bool logs_pinned = false;</div><div class='ctx'> </div><div class='ctx'> 	if (btrfs_ino(BTRFS_I(new_dir)) == BTRFS_EMPTY_SUBVOL_DIR_OBJECTID)</div><div class='ctx'> 		return -EPERM;</div><div class='hunk'>@@ -9649,22 +8456,28 @@ static int btrfs_rename(struct user_namespace *mnt_userns,</div><div class='ctx'> 	    new_inode-&gt;i_size &gt; BTRFS_EMPTY_DIR_SIZE)</div><div class='ctx'> 		return -ENOTEMPTY;</div><div class='ctx'> </div><div class='add'>+	ret = fscrypt_setup_filename(old_dir, &amp;old_dentry-&gt;d_name, 0, &amp;old_fname);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	/* check for collisions, even if the  name isn't there */</div><div class='del'>-	ret = btrfs_check_dir_item_collision(dest, new_dir-&gt;i_ino,</div><div class='del'>-			     new_dentry-&gt;d_name.name,</div><div class='del'>-			     new_dentry-&gt;d_name.len);</div><div class='add'>+	ret = fscrypt_setup_filename(new_dir, &amp;new_dentry-&gt;d_name, 0, &amp;new_fname);</div><div class='add'>+	if (ret) {</div><div class='add'>+		fscrypt_free_filename(&amp;old_fname);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='add'>+	/* check for collisions, even if the  name isn't there */</div><div class='add'>+	ret = btrfs_check_dir_item_collision(dest, new_dir-&gt;i_ino, &amp;new_fname.disk_name);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		if (ret == -EEXIST) {</div><div class='ctx'> 			/* we shouldn't get</div><div class='ctx'> 			 * eexist without a new_inode */</div><div class='ctx'> 			if (WARN_ON(!new_inode)) {</div><div class='del'>-				return ret;</div><div class='add'>+				goto out_fscrypt_names;</div><div class='ctx'> 			}</div><div class='ctx'> 		} else {</div><div class='ctx'> 			/* maybe -EOVERFLOW */</div><div class='del'>-			return ret;</div><div class='add'>+			goto out_fscrypt_names;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	ret = 0;</div><div class='hunk'>@@ -9676,23 +8489,58 @@ static int btrfs_rename(struct user_namespace *mnt_userns,</div><div class='ctx'> 	if (new_inode &amp;&amp; S_ISREG(old_inode-&gt;i_mode) &amp;&amp; new_inode-&gt;i_size)</div><div class='ctx'> 		filemap_flush(old_inode-&gt;i_mapping);</div><div class='ctx'> </div><div class='del'>-	/* close the racy window with snapshot create/destroy ioctl */</div><div class='del'>-	if (old_ino == BTRFS_FIRST_FREE_OBJECTID)</div><div class='add'>+	if (flags &amp; RENAME_WHITEOUT) {</div><div class='add'>+		whiteout_args.inode = new_whiteout_inode(idmap, old_dir);</div><div class='add'>+		if (!whiteout_args.inode) {</div><div class='add'>+			ret = -ENOMEM;</div><div class='add'>+			goto out_fscrypt_names;</div><div class='add'>+		}</div><div class='add'>+		ret = btrfs_new_inode_prepare(&amp;whiteout_args, &amp;trans_num_items);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out_whiteout_inode;</div><div class='add'>+	} else {</div><div class='add'>+		/* 1 to update the old parent inode. */</div><div class='add'>+		trans_num_items = 1;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (old_ino == BTRFS_FIRST_FREE_OBJECTID) {</div><div class='add'>+		/* Close the race window with snapshot create/destroy ioctl */</div><div class='ctx'> 		down_read(&amp;fs_info-&gt;subvol_sem);</div><div class='add'>+		/*</div><div class='add'>+		 * 1 to remove old root ref</div><div class='add'>+		 * 1 to remove old root backref</div><div class='add'>+		 * 1 to add new root ref</div><div class='add'>+		 * 1 to add new root backref</div><div class='add'>+		 */</div><div class='add'>+		trans_num_items += 4;</div><div class='add'>+	} else {</div><div class='add'>+		/*</div><div class='add'>+		 * 1 to update inode</div><div class='add'>+		 * 1 to remove old inode ref</div><div class='add'>+		 * 1 to add new inode ref</div><div class='add'>+		 */</div><div class='add'>+		trans_num_items += 3;</div><div class='add'>+	}</div><div class='ctx'> 	/*</div><div class='del'>-	 * We want to reserve the absolute worst case amount of items.  So if</div><div class='del'>-	 * both inodes are subvols and we need to unlink them then that would</div><div class='del'>-	 * require 4 item modifications, but if they are both normal inodes it</div><div class='del'>-	 * would require 5 item modifications, so we'll assume they are normal</div><div class='del'>-	 * inodes.  So 5 * 2 is 10, plus 1 for the new link, so 11 total items</div><div class='del'>-	 * should cover the worst case number of items we'll modify.</div><div class='del'>-	 * If our rename has the whiteout flag, we need more 5 units for the</div><div class='del'>-	 * new inode (1 inode item, 1 inode ref, 2 dir items and 1 xattr item</div><div class='del'>-	 * when selinux is enabled).</div><div class='del'>-	 */</div><div class='del'>-	trans_num_items = 11;</div><div class='del'>-	if (flags &amp; RENAME_WHITEOUT)</div><div class='add'>+	 * 1 to remove old dir item</div><div class='add'>+	 * 1 to remove old dir index</div><div class='add'>+	 * 1 to add new dir item</div><div class='add'>+	 * 1 to add new dir index</div><div class='add'>+	 */</div><div class='add'>+	trans_num_items += 4;</div><div class='add'>+	/* 1 to update new parent inode if it's not the same as the old parent */</div><div class='add'>+	if (new_dir != old_dir)</div><div class='add'>+		trans_num_items++;</div><div class='add'>+	if (new_inode) {</div><div class='add'>+		/*</div><div class='add'>+		 * 1 to update inode</div><div class='add'>+		 * 1 to remove inode ref</div><div class='add'>+		 * 1 to remove dir item</div><div class='add'>+		 * 1 to remove dir index</div><div class='add'>+		 * 1 to possibly add orphan item</div><div class='add'>+		 */</div><div class='ctx'> 		trans_num_items += 5;</div><div class='add'>+	}</div><div class='ctx'> 	trans = btrfs_start_transaction(root, trans_num_items);</div><div class='ctx'> 	if (IS_ERR(trans)) {</div><div class='ctx'> 		ret = PTR_ERR(trans);</div><div class='hunk'>@@ -9714,11 +8562,9 @@ static int btrfs_rename(struct user_namespace *mnt_userns,</div><div class='ctx'> 		/* force full log commit if subvolume involved. */</div><div class='ctx'> 		btrfs_set_log_full_commit(trans);</div><div class='ctx'> 	} else {</div><div class='del'>-		ret = btrfs_insert_inode_ref(trans, dest,</div><div class='del'>-					     new_dentry-&gt;d_name.name,</div><div class='del'>-					     new_dentry-&gt;d_name.len,</div><div class='del'>-					     old_ino,</div><div class='del'>-					     btrfs_ino(BTRFS_I(new_dir)), index);</div><div class='add'>+		ret = btrfs_insert_inode_ref(trans, dest, &amp;new_fname.disk_name,</div><div class='add'>+					     old_ino, btrfs_ino(BTRFS_I(new_dir)),</div><div class='add'>+					     index);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto out_fail;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -9726,74 +8572,88 @@ static int btrfs_rename(struct user_namespace *mnt_userns,</div><div class='ctx'> 	inode_inc_iversion(old_dir);</div><div class='ctx'> 	inode_inc_iversion(new_dir);</div><div class='ctx'> 	inode_inc_iversion(old_inode);</div><div class='del'>-	old_dir-&gt;i_ctime = old_dir-&gt;i_mtime =</div><div class='del'>-	new_dir-&gt;i_ctime = new_dir-&gt;i_mtime =</div><div class='del'>-	old_inode-&gt;i_ctime = current_time(old_dir);</div><div class='add'>+	simple_rename_timestamp(old_dir, old_dentry, new_dir, new_dentry);</div><div class='ctx'> </div><div class='del'>-	if (old_dentry-&gt;d_parent != new_dentry-&gt;d_parent)</div><div class='del'>-		btrfs_record_unlink_dir(trans, BTRFS_I(old_dir),</div><div class='del'>-				BTRFS_I(old_inode), 1);</div><div class='del'>-</div><div class='del'>-	if (unlikely(old_ino == BTRFS_FIRST_FREE_OBJECTID)) {</div><div class='del'>-		ret = btrfs_unlink_subvol(trans, old_dir, old_dentry);</div><div class='del'>-	} else {</div><div class='add'>+	if (old_ino != BTRFS_FIRST_FREE_OBJECTID) {</div><div class='ctx'> 		/*</div><div class='del'>-		 * Now pin the log. We do it to ensure that no other task can</div><div class='del'>-		 * sync the log while we are in progress with the rename, as</div><div class='del'>-		 * that could result in an inconsistency in case any of the</div><div class='del'>-		 * inodes that are part of this rename operation were logged</div><div class='del'>-		 * before.</div><div class='add'>+		 * If we are renaming in the same directory (and it's not a</div><div class='add'>+		 * root entry) pin the log to prevent any concurrent task from</div><div class='add'>+		 * logging the directory after we removed the old entry and</div><div class='add'>+		 * before we add the new entry, otherwise that task can sync</div><div class='add'>+		 * a log without any entry for the inode we are renaming and</div><div class='add'>+		 * therefore replaying that log, if a power failure happens</div><div class='add'>+		 * after syncing the log, would result in deleting the inode.</div><div class='ctx'> 		 *</div><div class='del'>-		 * We pin the log even if at this precise moment none of the</div><div class='del'>-		 * inodes was logged before. This is because right after we</div><div class='del'>-		 * checked for that, some other task fsyncing some other inode</div><div class='del'>-		 * not involved with this rename operation could log that one of</div><div class='del'>-		 * our inodes exists.</div><div class='add'>+		 * If the rename affects two different directories, we want to</div><div class='add'>+		 * make sure the that there's no log commit that contains</div><div class='add'>+		 * updates for only one of the directories but not for the</div><div class='add'>+		 * other.</div><div class='ctx'> 		 *</div><div class='del'>-		 * We don't need to pin the logs before the above call to</div><div class='del'>-		 * btrfs_insert_inode_ref(), since that does not need to change</div><div class='del'>-		 * a log.</div><div class='add'>+		 * If we are renaming an entry for a root, we don't care about</div><div class='add'>+		 * log updates since we called btrfs_set_log_full_commit().</div><div class='ctx'> 		 */</div><div class='ctx'> 		btrfs_pin_log_trans(root);</div><div class='del'>-		log_pinned = true;</div><div class='del'>-		ret = __btrfs_unlink_inode(trans, BTRFS_I(old_dir),</div><div class='del'>-					BTRFS_I(d_inode(old_dentry)),</div><div class='del'>-					old_dentry-&gt;d_name.name,</div><div class='del'>-					old_dentry-&gt;d_name.len);</div><div class='del'>-		if (!ret)</div><div class='del'>-			ret = btrfs_update_inode(trans, root, BTRFS_I(old_inode));</div><div class='add'>+		btrfs_pin_log_trans(dest);</div><div class='add'>+		logs_pinned = true;</div><div class='ctx'> 	}</div><div class='del'>-	if (ret) {</div><div class='del'>-		btrfs_abort_transaction(trans, ret);</div><div class='del'>-		goto out_fail;</div><div class='add'>+</div><div class='add'>+	if (old_dentry-&gt;d_parent != new_dentry-&gt;d_parent)</div><div class='add'>+		btrfs_record_unlink_dir(trans, BTRFS_I(old_dir),</div><div class='add'>+					BTRFS_I(old_inode), true);</div><div class='add'>+</div><div class='add'>+	if (unlikely(old_ino == BTRFS_FIRST_FREE_OBJECTID)) {</div><div class='add'>+		ret = btrfs_unlink_subvol(trans, BTRFS_I(old_dir), old_dentry);</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			goto out_fail;</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		ret = __btrfs_unlink_inode(trans, BTRFS_I(old_dir),</div><div class='add'>+					   BTRFS_I(d_inode(old_dentry)),</div><div class='add'>+					   &amp;old_fname.disk_name, &amp;rename_ctx);</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			goto out_fail;</div><div class='add'>+		}</div><div class='add'>+		ret = btrfs_update_inode(trans, BTRFS_I(old_inode));</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			goto out_fail;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (new_inode) {</div><div class='ctx'> 		inode_inc_iversion(new_inode);</div><div class='del'>-		new_inode-&gt;i_ctime = current_time(new_inode);</div><div class='ctx'> 		if (unlikely(btrfs_ino(BTRFS_I(new_inode)) ==</div><div class='ctx'> 			     BTRFS_EMPTY_SUBVOL_DIR_OBJECTID)) {</div><div class='del'>-			ret = btrfs_unlink_subvol(trans, new_dir, new_dentry);</div><div class='add'>+			ret = btrfs_unlink_subvol(trans, BTRFS_I(new_dir), new_dentry);</div><div class='add'>+			if (unlikely(ret)) {</div><div class='add'>+				btrfs_abort_transaction(trans, ret);</div><div class='add'>+				goto out_fail;</div><div class='add'>+			}</div><div class='ctx'> 			BUG_ON(new_inode-&gt;i_nlink == 0);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			ret = btrfs_unlink_inode(trans, BTRFS_I(new_dir),</div><div class='ctx'> 						 BTRFS_I(d_inode(new_dentry)),</div><div class='del'>-						 new_dentry-&gt;d_name.name,</div><div class='del'>-						 new_dentry-&gt;d_name.len);</div><div class='add'>+						 &amp;new_fname.disk_name);</div><div class='add'>+			if (unlikely(ret)) {</div><div class='add'>+				btrfs_abort_transaction(trans, ret);</div><div class='add'>+				goto out_fail;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='del'>-		if (!ret &amp;&amp; new_inode-&gt;i_nlink == 0)</div><div class='add'>+		if (new_inode-&gt;i_nlink == 0) {</div><div class='ctx'> 			ret = btrfs_orphan_add(trans,</div><div class='ctx'> 					BTRFS_I(d_inode(new_dentry)));</div><div class='del'>-		if (ret) {</div><div class='del'>-			btrfs_abort_transaction(trans, ret);</div><div class='del'>-			goto out_fail;</div><div class='add'>+			if (unlikely(ret)) {</div><div class='add'>+				btrfs_abort_transaction(trans, ret);</div><div class='add'>+				goto out_fail;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_add_link(trans, BTRFS_I(new_dir), BTRFS_I(old_inode),</div><div class='del'>-			     new_dentry-&gt;d_name.name,</div><div class='del'>-			     new_dentry-&gt;d_name.len, 0, index);</div><div class='del'>-	if (ret) {</div><div class='add'>+			     &amp;new_fname.disk_name, 0, index);</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out_fail;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -9801,67 +8661,61 @@ static int btrfs_rename(struct user_namespace *mnt_userns,</div><div class='ctx'> 	if (old_inode-&gt;i_nlink == 1)</div><div class='ctx'> 		BTRFS_I(old_inode)-&gt;dir_index = index;</div><div class='ctx'> </div><div class='del'>-	if (log_pinned) {</div><div class='del'>-		btrfs_log_new_name(trans, BTRFS_I(old_inode), BTRFS_I(old_dir),</div><div class='del'>-				   new_dentry-&gt;d_parent);</div><div class='del'>-		btrfs_end_log_trans(root);</div><div class='del'>-		log_pinned = false;</div><div class='del'>-	}</div><div class='add'>+	if (logs_pinned)</div><div class='add'>+		btrfs_log_new_name(trans, old_dentry, BTRFS_I(old_dir),</div><div class='add'>+				   rename_ctx.index, new_dentry-&gt;d_parent);</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; RENAME_WHITEOUT) {</div><div class='del'>-		ret = btrfs_whiteout_for_rename(trans, root, mnt_userns,</div><div class='del'>-						old_dir, old_dentry);</div><div class='del'>-</div><div class='del'>-		if (ret) {</div><div class='add'>+		ret = btrfs_create_new_inode(trans, &amp;whiteout_args);</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out_fail;</div><div class='add'>+		} else {</div><div class='add'>+			unlock_new_inode(whiteout_args.inode);</div><div class='add'>+			iput(whiteout_args.inode);</div><div class='add'>+			whiteout_args.inode = NULL;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> out_fail:</div><div class='del'>-	/*</div><div class='del'>-	 * If we have pinned the log and an error happened, we unpin tasks</div><div class='del'>-	 * trying to sync the log and force them to fallback to a transaction</div><div class='del'>-	 * commit if the log currently contains any of the inodes involved in</div><div class='del'>-	 * this rename operation (to ensure we do not persist a log with an</div><div class='del'>-	 * inconsistent state for any of these inodes or leading to any</div><div class='del'>-	 * inconsistencies when replayed). If the transaction was aborted, the</div><div class='del'>-	 * abortion reason is propagated to userspace when attempting to commit</div><div class='del'>-	 * the transaction. If the log does not contain any of these inodes, we</div><div class='del'>-	 * allow the tasks to sync it.</div><div class='del'>-	 */</div><div class='del'>-	if (ret &amp;&amp; log_pinned) {</div><div class='del'>-		if (btrfs_inode_in_log(BTRFS_I(old_dir), fs_info-&gt;generation) ||</div><div class='del'>-		    btrfs_inode_in_log(BTRFS_I(new_dir), fs_info-&gt;generation) ||</div><div class='del'>-		    btrfs_inode_in_log(BTRFS_I(old_inode), fs_info-&gt;generation) ||</div><div class='del'>-		    (new_inode &amp;&amp;</div><div class='del'>-		     btrfs_inode_in_log(BTRFS_I(new_inode), fs_info-&gt;generation)))</div><div class='del'>-			btrfs_set_log_full_commit(trans);</div><div class='del'>-</div><div class='add'>+	if (logs_pinned) {</div><div class='ctx'> 		btrfs_end_log_trans(root);</div><div class='del'>-		log_pinned = false;</div><div class='add'>+		btrfs_end_log_trans(dest);</div><div class='ctx'> 	}</div><div class='ctx'> 	ret2 = btrfs_end_transaction(trans);</div><div class='ctx'> 	ret = ret ? ret : ret2;</div><div class='ctx'> out_notrans:</div><div class='ctx'> 	if (old_ino == BTRFS_FIRST_FREE_OBJECTID)</div><div class='ctx'> 		up_read(&amp;fs_info-&gt;subvol_sem);</div><div class='del'>-</div><div class='add'>+	if (flags &amp; RENAME_WHITEOUT)</div><div class='add'>+		btrfs_new_inode_args_destroy(&amp;whiteout_args);</div><div class='add'>+out_whiteout_inode:</div><div class='add'>+	if (flags &amp; RENAME_WHITEOUT)</div><div class='add'>+		iput(whiteout_args.inode);</div><div class='add'>+out_fscrypt_names:</div><div class='add'>+	fscrypt_free_filename(&amp;old_fname);</div><div class='add'>+	fscrypt_free_filename(&amp;new_fname);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btrfs_rename2(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='add'>+static int btrfs_rename2(struct mnt_idmap *idmap, struct inode *old_dir,</div><div class='ctx'> 			 struct dentry *old_dentry, struct inode *new_dir,</div><div class='ctx'> 			 struct dentry *new_dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='ctx'> 	if (flags &amp; ~(RENAME_NOREPLACE | RENAME_EXCHANGE | RENAME_WHITEOUT))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; RENAME_EXCHANGE)</div><div class='del'>-		return btrfs_rename_exchange(old_dir, old_dentry, new_dir,</div><div class='del'>-					  new_dentry);</div><div class='add'>+		ret = btrfs_rename_exchange(old_dir, old_dentry, new_dir,</div><div class='add'>+					    new_dentry);</div><div class='add'>+	else</div><div class='add'>+		ret = btrfs_rename(idmap, old_dir, old_dentry, new_dir,</div><div class='add'>+				   new_dentry, flags);</div><div class='add'>+</div><div class='add'>+	btrfs_btree_balance_dirty(BTRFS_I(new_dir)-&gt;root-&gt;fs_info);</div><div class='ctx'> </div><div class='del'>-	return btrfs_rename(mnt_userns, old_dir, old_dentry, new_dir,</div><div class='del'>-			    new_dentry, flags);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct btrfs_delalloc_work {</div><div class='hunk'>@@ -9899,7 +8753,7 @@ static struct btrfs_delalloc_work *btrfs_alloc_delalloc_work(struct inode *inode</div><div class='ctx'> 	init_completion(&amp;work-&gt;completion);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;work-&gt;list);</div><div class='ctx'> 	work-&gt;inode = inode;</div><div class='del'>-	btrfs_init_work(&amp;work-&gt;work, btrfs_run_delalloc_work, NULL, NULL);</div><div class='add'>+	btrfs_init_work(&amp;work-&gt;work, btrfs_run_delalloc_work, NULL);</div><div class='ctx'> </div><div class='ctx'> 	return work;</div><div class='ctx'> }</div><div class='hunk'>@@ -9908,49 +8762,42 @@ static struct btrfs_delalloc_work *btrfs_alloc_delalloc_work(struct inode *inode</div><div class='ctx'>  * some fairly slow code that needs optimization. This walks the list</div><div class='ctx'>  * of all the inodes with pending delalloc and forces them to disk.</div><div class='ctx'>  */</div><div class='del'>-static int start_delalloc_inodes(struct btrfs_root *root,</div><div class='del'>-				 struct writeback_control *wbc, bool snapshot,</div><div class='del'>-				 bool in_reclaim_context)</div><div class='add'>+static int start_delalloc_inodes(struct btrfs_root *root, long *nr_to_write,</div><div class='add'>+				 bool snapshot, bool in_reclaim_context)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_inode *binode;</div><div class='del'>-	struct inode *inode;</div><div class='ctx'> 	struct btrfs_delalloc_work *work, *next;</div><div class='del'>-	struct list_head works;</div><div class='del'>-	struct list_head splice;</div><div class='add'>+	LIST_HEAD(works);</div><div class='add'>+	LIST_HEAD(splice);</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	bool full_flush = wbc-&gt;nr_to_write == LONG_MAX;</div><div class='del'>-</div><div class='del'>-	INIT_LIST_HEAD(&amp;works);</div><div class='del'>-	INIT_LIST_HEAD(&amp;splice);</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;root-&gt;delalloc_mutex);</div><div class='ctx'> 	spin_lock(&amp;root-&gt;delalloc_lock);</div><div class='ctx'> 	list_splice_init(&amp;root-&gt;delalloc_inodes, &amp;splice);</div><div class='ctx'> 	while (!list_empty(&amp;splice)) {</div><div class='del'>-		binode = list_entry(splice.next, struct btrfs_inode,</div><div class='del'>-				    delalloc_inodes);</div><div class='add'>+		struct btrfs_inode *inode;</div><div class='add'>+		struct inode *tmp_inode;</div><div class='ctx'> </div><div class='del'>-		list_move_tail(&amp;binode-&gt;delalloc_inodes,</div><div class='del'>-			       &amp;root-&gt;delalloc_inodes);</div><div class='add'>+		inode = list_first_entry(&amp;splice, struct btrfs_inode, delalloc_inodes);</div><div class='add'>+</div><div class='add'>+		list_move_tail(&amp;inode-&gt;delalloc_inodes, &amp;root-&gt;delalloc_inodes);</div><div class='ctx'> </div><div class='ctx'> 		if (in_reclaim_context &amp;&amp;</div><div class='del'>-		    test_bit(BTRFS_INODE_NO_DELALLOC_FLUSH, &amp;binode-&gt;runtime_flags))</div><div class='add'>+		    test_bit(BTRFS_INODE_NO_DELALLOC_FLUSH, &amp;inode-&gt;runtime_flags))</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		inode = igrab(&amp;binode-&gt;vfs_inode);</div><div class='del'>-		if (!inode) {</div><div class='add'>+		tmp_inode = igrab(&amp;inode-&gt;vfs_inode);</div><div class='add'>+		if (!tmp_inode) {</div><div class='ctx'> 			cond_resched_lock(&amp;root-&gt;delalloc_lock);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> 		spin_unlock(&amp;root-&gt;delalloc_lock);</div><div class='ctx'> </div><div class='ctx'> 		if (snapshot)</div><div class='del'>-			set_bit(BTRFS_INODE_SNAPSHOT_FLUSH,</div><div class='del'>-				&amp;binode-&gt;runtime_flags);</div><div class='del'>-		if (full_flush) {</div><div class='del'>-			work = btrfs_alloc_delalloc_work(inode);</div><div class='add'>+			set_bit(BTRFS_INODE_SNAPSHOT_FLUSH, &amp;inode-&gt;runtime_flags);</div><div class='add'>+		if (nr_to_write == NULL) {</div><div class='add'>+			work = btrfs_alloc_delalloc_work(tmp_inode);</div><div class='ctx'> 			if (!work) {</div><div class='del'>-				iput(inode);</div><div class='add'>+				iput(tmp_inode);</div><div class='ctx'> 				ret = -ENOMEM;</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -9958,9 +8805,11 @@ static int start_delalloc_inodes(struct btrfs_root *root,</div><div class='ctx'> 			btrfs_queue_work(root-&gt;fs_info-&gt;flush_workers,</div><div class='ctx'> 					 &amp;work-&gt;work);</div><div class='ctx'> 		} else {</div><div class='del'>-			ret = filemap_fdatawrite_wbc(inode-&gt;i_mapping, wbc);</div><div class='add'>+			ret = filemap_flush_nr(tmp_inode-&gt;i_mapping,</div><div class='add'>+					nr_to_write);</div><div class='ctx'> 			btrfs_add_delayed_iput(inode);</div><div class='del'>-			if (ret || wbc-&gt;nr_to_write &lt;= 0)</div><div class='add'>+</div><div class='add'>+			if (ret || *nr_to_write &lt;= 0)</div><div class='ctx'> 				goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 		cond_resched();</div><div class='hunk'>@@ -9986,49 +8835,28 @@ out:</div><div class='ctx'> </div><div class='ctx'> int btrfs_start_delalloc_snapshot(struct btrfs_root *root, bool in_reclaim_context)</div><div class='ctx'> {</div><div class='del'>-	struct writeback_control wbc = {</div><div class='del'>-		.nr_to_write = LONG_MAX,</div><div class='del'>-		.sync_mode = WB_SYNC_NONE,</div><div class='del'>-		.range_start = 0,</div><div class='del'>-		.range_end = LLONG_MAX,</div><div class='del'>-	};</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> </div><div class='ctx'> 	if (BTRFS_FS_ERROR(fs_info))</div><div class='ctx'> 		return -EROFS;</div><div class='del'>-</div><div class='del'>-	return start_delalloc_inodes(root, &amp;wbc, true, in_reclaim_context);</div><div class='add'>+	return start_delalloc_inodes(root, NULL, true, in_reclaim_context);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_start_delalloc_roots(struct btrfs_fs_info *fs_info, long nr,</div><div class='ctx'> 			       bool in_reclaim_context)</div><div class='ctx'> {</div><div class='del'>-	struct writeback_control wbc = {</div><div class='del'>-		.nr_to_write = nr,</div><div class='del'>-		.sync_mode = WB_SYNC_NONE,</div><div class='del'>-		.range_start = 0,</div><div class='del'>-		.range_end = LLONG_MAX,</div><div class='del'>-	};</div><div class='add'>+	long *nr_to_write = nr == LONG_MAX ? NULL : &amp;nr;</div><div class='ctx'> 	struct btrfs_root *root;</div><div class='del'>-	struct list_head splice;</div><div class='add'>+	LIST_HEAD(splice);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (BTRFS_FS_ERROR(fs_info))</div><div class='ctx'> 		return -EROFS;</div><div class='ctx'> </div><div class='del'>-	INIT_LIST_HEAD(&amp;splice);</div><div class='del'>-</div><div class='ctx'> 	mutex_lock(&amp;fs_info-&gt;delalloc_root_mutex);</div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;delalloc_root_lock);</div><div class='ctx'> 	list_splice_init(&amp;fs_info-&gt;delalloc_roots, &amp;splice);</div><div class='ctx'> 	while (!list_empty(&amp;splice)) {</div><div class='del'>-		/*</div><div class='del'>-		 * Reset nr_to_write here so we know that we're doing a full</div><div class='del'>-		 * flush.</div><div class='del'>-		 */</div><div class='del'>-		if (nr == LONG_MAX)</div><div class='del'>-			wbc.nr_to_write = LONG_MAX;</div><div class='del'>-</div><div class='ctx'> 		root = list_first_entry(&amp;splice, struct btrfs_root,</div><div class='ctx'> 					delalloc_root);</div><div class='ctx'> 		root = btrfs_grab_root(root);</div><div class='hunk'>@@ -10037,9 +8865,10 @@ int btrfs_start_delalloc_roots(struct btrfs_fs_info *fs_info, long nr,</div><div class='ctx'> 			       &amp;fs_info-&gt;delalloc_roots);</div><div class='ctx'> 		spin_unlock(&amp;fs_info-&gt;delalloc_root_lock);</div><div class='ctx'> </div><div class='del'>-		ret = start_delalloc_inodes(root, &amp;wbc, false, in_reclaim_context);</div><div class='add'>+		ret = start_delalloc_inodes(root, nr_to_write, false,</div><div class='add'>+				in_reclaim_context);</div><div class='ctx'> 		btrfs_put_root(root);</div><div class='del'>-		if (ret &lt; 0 || wbc.nr_to_write &lt;= 0)</div><div class='add'>+		if (ret &lt; 0 || nr &lt;= 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		spin_lock(&amp;fs_info-&gt;delalloc_root_lock);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -10056,18 +8885,21 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btrfs_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int btrfs_symlink(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 			 struct dentry *dentry, const char *symname)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(dir-&gt;i_sb);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(dir);</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(dir)-&gt;root;</div><div class='ctx'> 	struct btrfs_path *path;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='del'>-	struct inode *inode = NULL;</div><div class='del'>-	int err;</div><div class='del'>-	u64 objectid;</div><div class='del'>-	u64 index = 0;</div><div class='add'>+	struct inode *inode;</div><div class='add'>+	struct btrfs_new_inode_args new_inode_args = {</div><div class='add'>+		.dir = dir,</div><div class='add'>+		.dentry = dentry,</div><div class='add'>+	};</div><div class='add'>+	unsigned int trans_num_items;</div><div class='add'>+	int ret;</div><div class='ctx'> 	int name_len;</div><div class='ctx'> 	int datasize;</div><div class='ctx'> 	unsigned long ptr;</div><div class='hunk'>@@ -10075,62 +8907,60 @@ static int btrfs_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> </div><div class='ctx'> 	name_len = strlen(symname);</div><div class='del'>-	if (name_len &gt; BTRFS_MAX_INLINE_DATA_SIZE(fs_info))</div><div class='del'>-		return -ENAMETOOLONG;</div><div class='del'>-</div><div class='ctx'> 	/*</div><div class='del'>-	 * 2 items for inode item and ref</div><div class='del'>-	 * 2 items for dir items</div><div class='del'>-	 * 1 item for updating parent inode item</div><div class='del'>-	 * 1 item for the inline extent item</div><div class='del'>-	 * 1 item for xattr if selinux is on</div><div class='add'>+	 * Symlinks utilize uncompressed inline extent data, which should not</div><div class='add'>+	 * reach block size.</div><div class='ctx'> 	 */</div><div class='del'>-	trans = btrfs_start_transaction(root, 7);</div><div class='del'>-	if (IS_ERR(trans))</div><div class='del'>-		return PTR_ERR(trans);</div><div class='add'>+	if (name_len &gt; BTRFS_MAX_INLINE_DATA_SIZE(fs_info) ||</div><div class='add'>+	    name_len &gt;= fs_info-&gt;sectorsize)</div><div class='add'>+		return -ENAMETOOLONG;</div><div class='ctx'> </div><div class='del'>-	err = btrfs_get_free_objectid(root, &amp;objectid);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out_unlock;</div><div class='add'>+	inode = new_inode(dir-&gt;i_sb);</div><div class='add'>+	if (!inode)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	inode_init_owner(idmap, inode, dir, S_IFLNK | S_IRWXUGO);</div><div class='add'>+	inode-&gt;i_op = &amp;btrfs_symlink_inode_operations;</div><div class='add'>+	inode_nohighmem(inode);</div><div class='add'>+	inode-&gt;i_mapping-&gt;a_ops = &amp;btrfs_aops;</div><div class='add'>+	btrfs_i_size_write(BTRFS_I(inode), name_len);</div><div class='add'>+	inode_set_bytes(inode, name_len);</div><div class='ctx'> </div><div class='del'>-	inode = btrfs_new_inode(trans, root, mnt_userns, dir,</div><div class='del'>-				dentry-&gt;d_name.name, dentry-&gt;d_name.len,</div><div class='del'>-				btrfs_ino(BTRFS_I(dir)), objectid,</div><div class='del'>-				S_IFLNK | S_IRWXUGO, &amp;index);</div><div class='del'>-	if (IS_ERR(inode)) {</div><div class='del'>-		err = PTR_ERR(inode);</div><div class='del'>-		inode = NULL;</div><div class='del'>-		goto out_unlock;</div><div class='del'>-	}</div><div class='add'>+	new_inode_args.inode = inode;</div><div class='add'>+	ret = btrfs_new_inode_prepare(&amp;new_inode_args, &amp;trans_num_items);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_inode;</div><div class='add'>+	/* 1 additional item for the inline extent */</div><div class='add'>+	trans_num_items++;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	* If the active LSM wants to access the inode during</div><div class='del'>-	* d_instantiate it needs these. Smack checks to see</div><div class='del'>-	* if the filesystem supports xattrs by looking at the</div><div class='del'>-	* ops vector.</div><div class='del'>-	*/</div><div class='del'>-	inode-&gt;i_fop = &amp;btrfs_file_operations;</div><div class='del'>-	inode-&gt;i_op = &amp;btrfs_file_inode_operations;</div><div class='del'>-	inode-&gt;i_mapping-&gt;a_ops = &amp;btrfs_aops;</div><div class='add'>+	trans = btrfs_start_transaction(root, trans_num_items);</div><div class='add'>+	if (IS_ERR(trans)) {</div><div class='add'>+		ret = PTR_ERR(trans);</div><div class='add'>+		goto out_new_inode_args;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	err = btrfs_init_inode_security(trans, inode, dir, &amp;dentry-&gt;d_name);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out_unlock;</div><div class='add'>+	ret = btrfs_create_new_inode(trans, &amp;new_inode_args);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='del'>-	if (!path) {</div><div class='del'>-		err = -ENOMEM;</div><div class='del'>-		goto out_unlock;</div><div class='add'>+	if (unlikely(!path)) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		discard_new_inode(inode);</div><div class='add'>+		inode = NULL;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	key.objectid = btrfs_ino(BTRFS_I(inode));</div><div class='del'>-	key.offset = 0;</div><div class='ctx'> 	key.type = BTRFS_EXTENT_DATA_KEY;</div><div class='add'>+	key.offset = 0;</div><div class='ctx'> 	datasize = btrfs_file_extent_calc_inline_size(name_len);</div><div class='del'>-	err = btrfs_insert_empty_item(trans, root, path, &amp;key,</div><div class='del'>-				      datasize);</div><div class='del'>-	if (err) {</div><div class='add'>+	ret = btrfs_insert_empty_item(trans, root, path, &amp;key, datasize);</div><div class='add'>+	if (unlikely(ret)) {</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		btrfs_free_path(path);</div><div class='del'>-		goto out_unlock;</div><div class='add'>+		discard_new_inode(inode);</div><div class='add'>+		inode = NULL;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	ei = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='hunk'>@@ -10145,35 +8975,19 @@ static int btrfs_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> </div><div class='ctx'> 	ptr = btrfs_file_extent_inline_start(ei);</div><div class='ctx'> 	write_extent_buffer(leaf, symname, ptr, name_len);</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> 	btrfs_free_path(path);</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_op = &amp;btrfs_symlink_inode_operations;</div><div class='del'>-	inode_nohighmem(inode);</div><div class='del'>-	inode_set_bytes(inode, name_len);</div><div class='del'>-	btrfs_i_size_write(BTRFS_I(inode), name_len);</div><div class='del'>-	err = btrfs_update_inode(trans, root, BTRFS_I(inode));</div><div class='del'>-	/*</div><div class='del'>-	 * Last step, add directory indexes for our symlink inode. This is the</div><div class='del'>-	 * last step to avoid extra cleanup of these indexes if an error happens</div><div class='del'>-	 * elsewhere above.</div><div class='del'>-	 */</div><div class='del'>-	if (!err)</div><div class='del'>-		err = btrfs_add_nondir(trans, BTRFS_I(dir), dentry,</div><div class='del'>-				BTRFS_I(inode), 0, index);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out_unlock;</div><div class='del'>-</div><div class='ctx'> 	d_instantiate_new(dentry, inode);</div><div class='del'>-</div><div class='del'>-out_unlock:</div><div class='add'>+	ret = 0;</div><div class='add'>+out:</div><div class='ctx'> 	btrfs_end_transaction(trans);</div><div class='del'>-	if (err &amp;&amp; inode) {</div><div class='del'>-		inode_dec_link_count(inode);</div><div class='del'>-		discard_new_inode(inode);</div><div class='del'>-	}</div><div class='ctx'> 	btrfs_btree_balance_dirty(fs_info);</div><div class='del'>-	return err;</div><div class='add'>+out_new_inode_args:</div><div class='add'>+	btrfs_new_inode_args_destroy(&amp;new_inode_args);</div><div class='add'>+out_inode:</div><div class='add'>+	if (ret)</div><div class='add'>+		iput(inode);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct btrfs_trans_handle *insert_prealloc_file_extent(</div><div class='hunk'>@@ -10188,7 +9002,7 @@ static struct btrfs_trans_handle *insert_prealloc_file_extent(</div><div class='ctx'> 	struct btrfs_path *path;</div><div class='ctx'> 	u64 start = ins-&gt;objectid;</div><div class='ctx'> 	u64 len = ins-&gt;offset;</div><div class='del'>-	int qgroup_released;</div><div class='add'>+	u64 qgroup_released = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	memset(&amp;stack_fi, 0, sizeof(stack_fi));</div><div class='hunk'>@@ -10201,9 +9015,9 @@ static struct btrfs_trans_handle *insert_prealloc_file_extent(</div><div class='ctx'> 	btrfs_set_stack_file_extent_compression(&amp;stack_fi, BTRFS_COMPRESS_NONE);</div><div class='ctx'> 	/* Encryption and other encoding is reserved and all 0 */</div><div class='ctx'> </div><div class='del'>-	qgroup_released = btrfs_qgroup_release_data(inode, file_offset, len);</div><div class='del'>-	if (qgroup_released &lt; 0)</div><div class='del'>-		return ERR_PTR(qgroup_released);</div><div class='add'>+	ret = btrfs_qgroup_release_data(inode, file_offset, len, &amp;qgroup_released);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ERR_PTR(ret);</div><div class='ctx'> </div><div class='ctx'> 	if (trans) {</div><div class='ctx'> 		ret = insert_reserved_file_extent(trans, inode,</div><div class='hunk'>@@ -10221,6 +9035,7 @@ static struct btrfs_trans_handle *insert_prealloc_file_extent(</div><div class='ctx'> 	extent_info.file_offset = file_offset;</div><div class='ctx'> 	extent_info.extent_buf = (char *)&amp;stack_fi;</div><div class='ctx'> 	extent_info.is_new_extent = true;</div><div class='add'>+	extent_info.update_times = true;</div><div class='ctx'> 	extent_info.qgroup_reserved = qgroup_released;</div><div class='ctx'> 	extent_info.insertions = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -10247,7 +9062,7 @@ free_qgroup:</div><div class='ctx'> 	 * or we leak qgroup data reservation.</div><div class='ctx'> 	 */</div><div class='ctx'> 	btrfs_qgroup_free_refroot(inode-&gt;root-&gt;fs_info,</div><div class='del'>-			inode-&gt;root-&gt;root_key.objectid, qgroup_released,</div><div class='add'>+			btrfs_root_id(inode-&gt;root), qgroup_released,</div><div class='ctx'> 			BTRFS_QGROUP_RSV_DATA);</div><div class='ctx'> 	return ERR_PTR(ret);</div><div class='ctx'> }</div><div class='hunk'>@@ -10257,8 +9072,7 @@ static int __btrfs_prealloc_file_range(struct inode *inode, int mode,</div><div class='ctx'> 				       loff_t actual_len, u64 *alloc_hint,</div><div class='ctx'> 				       struct btrfs_trans_handle *trans)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	struct extent_map_tree *em_tree = &amp;BTRFS_I(inode)-&gt;extent_tree;</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='ctx'> 	struct extent_map *em;</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='ctx'> 	struct btrfs_key ins;</div><div class='hunk'>@@ -10284,7 +9098,7 @@ static int __btrfs_prealloc_file_range(struct inode *inode, int mode,</div><div class='ctx'> 		 */</div><div class='ctx'> 		cur_bytes = min(cur_bytes, last_alloc);</div><div class='ctx'> 		ret = btrfs_reserve_extent(root, cur_bytes, cur_bytes,</div><div class='del'>-				min_size, 0, *alloc_hint, &amp;ins, 1, 0);</div><div class='add'>+				min_size, 0, *alloc_hint, &amp;ins, true, false);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='hunk'>@@ -10310,48 +9124,36 @@ static int __btrfs_prealloc_file_range(struct inode *inode, int mode,</div><div class='ctx'> 		if (IS_ERR(trans)) {</div><div class='ctx'> 			ret = PTR_ERR(trans);</div><div class='ctx'> 			btrfs_free_reserved_extent(fs_info, ins.objectid,</div><div class='del'>-						   ins.offset, 0);</div><div class='add'>+						   ins.offset, false);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		btrfs_drop_extent_cache(BTRFS_I(inode), cur_offset,</div><div class='del'>-					cur_offset + ins.offset -1, 0);</div><div class='del'>-</div><div class='del'>-		em = alloc_extent_map();</div><div class='add'>+		em = btrfs_alloc_extent_map();</div><div class='ctx'> 		if (!em) {</div><div class='del'>-			set_bit(BTRFS_INODE_NEEDS_FULL_SYNC,</div><div class='del'>-				&amp;BTRFS_I(inode)-&gt;runtime_flags);</div><div class='add'>+			btrfs_drop_extent_map_range(BTRFS_I(inode), cur_offset,</div><div class='add'>+					    cur_offset + ins.offset - 1, false);</div><div class='add'>+			btrfs_set_inode_full_sync(BTRFS_I(inode));</div><div class='ctx'> 			goto next;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		em-&gt;start = cur_offset;</div><div class='del'>-		em-&gt;orig_start = cur_offset;</div><div class='ctx'> 		em-&gt;len = ins.offset;</div><div class='del'>-		em-&gt;block_start = ins.objectid;</div><div class='del'>-		em-&gt;block_len = ins.offset;</div><div class='del'>-		em-&gt;orig_block_len = ins.offset;</div><div class='add'>+		em-&gt;disk_bytenr = ins.objectid;</div><div class='add'>+		em-&gt;offset = 0;</div><div class='add'>+		em-&gt;disk_num_bytes = ins.offset;</div><div class='ctx'> 		em-&gt;ram_bytes = ins.offset;</div><div class='del'>-		set_bit(EXTENT_FLAG_PREALLOC, &amp;em-&gt;flags);</div><div class='add'>+		em-&gt;flags |= EXTENT_FLAG_PREALLOC;</div><div class='ctx'> 		em-&gt;generation = trans-&gt;transid;</div><div class='ctx'> </div><div class='del'>-		while (1) {</div><div class='del'>-			write_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-			ret = add_extent_mapping(em_tree, em, 1);</div><div class='del'>-			write_unlock(&amp;em_tree-&gt;lock);</div><div class='del'>-			if (ret != -EEXIST)</div><div class='del'>-				break;</div><div class='del'>-			btrfs_drop_extent_cache(BTRFS_I(inode), cur_offset,</div><div class='del'>-						cur_offset + ins.offset - 1,</div><div class='del'>-						0);</div><div class='del'>-		}</div><div class='del'>-		free_extent_map(em);</div><div class='add'>+		ret = btrfs_replace_extent_map_range(BTRFS_I(inode), em, true);</div><div class='add'>+		btrfs_free_extent_map(em);</div><div class='ctx'> next:</div><div class='ctx'> 		num_bytes -= ins.offset;</div><div class='ctx'> 		cur_offset += ins.offset;</div><div class='ctx'> 		*alloc_hint = ins.objectid + ins.offset;</div><div class='ctx'> </div><div class='ctx'> 		inode_inc_iversion(inode);</div><div class='del'>-		inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+		inode_set_ctime_current(inode);</div><div class='ctx'> 		BTRFS_I(inode)-&gt;flags |= BTRFS_INODE_PREALLOC;</div><div class='ctx'> 		if (!(mode &amp; FALLOC_FL_KEEP_SIZE) &amp;&amp;</div><div class='ctx'> 		    (actual_len &gt; inode-&gt;i_size) &amp;&amp;</div><div class='hunk'>@@ -10364,9 +9166,9 @@ next:</div><div class='ctx'> 			btrfs_inode_safe_disk_i_size_write(BTRFS_I(inode), 0);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		ret = btrfs_update_inode(trans, root, BTRFS_I(inode));</div><div class='add'>+		ret = btrfs_update_inode(trans, BTRFS_I(inode));</div><div class='ctx'> </div><div class='del'>-		if (ret) {</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			if (own_trans)</div><div class='ctx'> 				btrfs_end_transaction(trans);</div><div class='hunk'>@@ -10402,12 +9204,12 @@ int btrfs_prealloc_file_range_trans(struct inode *inode,</div><div class='ctx'> 					   min_size, actual_len, alloc_hint, trans);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btrfs_set_page_dirty(struct page *page)</div><div class='del'>-{</div><div class='del'>-	return __set_page_dirty_nobuffers(page);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int btrfs_permission(struct user_namespace *mnt_userns,</div><div class='add'>+/*</div><div class='add'>+ * NOTE: in case you are adding MAY_EXEC check for directories:</div><div class='add'>+ * we are marking them with IOP_FASTPERM_MAY_EXEC, allowing path lookup to</div><div class='add'>+ * elide calls here.</div><div class='add'>+ */</div><div class='add'>+static int btrfs_permission(struct mnt_idmap *idmap,</div><div class='ctx'> 			    struct inode *inode, int mask)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='hunk'>@@ -10420,92 +9222,762 @@ static int btrfs_permission(struct user_namespace *mnt_userns,</div><div class='ctx'> 		if (BTRFS_I(inode)-&gt;flags &amp; BTRFS_INODE_READONLY)</div><div class='ctx'> 			return -EACCES;</div><div class='ctx'> 	}</div><div class='del'>-	return generic_permission(mnt_userns, inode, mask);</div><div class='add'>+	return generic_permission(idmap, inode, mask);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btrfs_tmpfile(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-			 struct dentry *dentry, umode_t mode)</div><div class='add'>+static int btrfs_tmpfile(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+			 struct file *file, umode_t mode)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(dir-&gt;i_sb);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(dir);</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(dir)-&gt;root;</div><div class='del'>-	struct inode *inode = NULL;</div><div class='del'>-	u64 objectid;</div><div class='del'>-	u64 index;</div><div class='del'>-	int ret = 0;</div><div class='add'>+	struct inode *inode;</div><div class='add'>+	struct btrfs_new_inode_args new_inode_args = {</div><div class='add'>+		.dir = dir,</div><div class='add'>+		.dentry = file-&gt;f_path.dentry,</div><div class='add'>+		.orphan = true,</div><div class='add'>+	};</div><div class='add'>+	unsigned int trans_num_items;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	inode = new_inode(dir-&gt;i_sb);</div><div class='add'>+	if (!inode)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	inode_init_owner(idmap, inode, dir, mode);</div><div class='add'>+	inode-&gt;i_fop = &amp;btrfs_file_operations;</div><div class='add'>+	inode-&gt;i_op = &amp;btrfs_file_inode_operations;</div><div class='add'>+	inode-&gt;i_mapping-&gt;a_ops = &amp;btrfs_aops;</div><div class='add'>+</div><div class='add'>+	new_inode_args.inode = inode;</div><div class='add'>+	ret = btrfs_new_inode_prepare(&amp;new_inode_args, &amp;trans_num_items);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_inode;</div><div class='add'>+</div><div class='add'>+	trans = btrfs_start_transaction(root, trans_num_items);</div><div class='add'>+	if (IS_ERR(trans)) {</div><div class='add'>+		ret = PTR_ERR(trans);</div><div class='add'>+		goto out_new_inode_args;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_create_new_inode(trans, &amp;new_inode_args);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * 5 units required for adding orphan entry</div><div class='add'>+	 * We set number of links to 0 in btrfs_create_new_inode(), and here we</div><div class='add'>+	 * set it to 1 because d_tmpfile() will issue a warning if the count is</div><div class='add'>+	 * 0, through:</div><div class='add'>+	 *</div><div class='add'>+	 *    d_tmpfile() -&gt; inode_dec_link_count() -&gt; drop_nlink()</div><div class='ctx'> 	 */</div><div class='del'>-	trans = btrfs_start_transaction(root, 5);</div><div class='del'>-	if (IS_ERR(trans))</div><div class='del'>-		return PTR_ERR(trans);</div><div class='add'>+	set_nlink(inode, 1);</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_get_free_objectid(root, &amp;objectid);</div><div class='add'>+	if (!ret) {</div><div class='add'>+		d_tmpfile(file, inode);</div><div class='add'>+		unlock_new_inode(inode);</div><div class='add'>+		mark_inode_dirty(inode);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	btrfs_end_transaction(trans);</div><div class='add'>+	btrfs_btree_balance_dirty(fs_info);</div><div class='add'>+out_new_inode_args:</div><div class='add'>+	btrfs_new_inode_args_destroy(&amp;new_inode_args);</div><div class='add'>+out_inode:</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+		iput(inode);</div><div class='add'>+	return finish_open_simple(file, ret);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	inode = btrfs_new_inode(trans, root, mnt_userns, dir, NULL, 0,</div><div class='del'>-			btrfs_ino(BTRFS_I(dir)), objectid, mode, &amp;index);</div><div class='del'>-	if (IS_ERR(inode)) {</div><div class='del'>-		ret = PTR_ERR(inode);</div><div class='del'>-		inode = NULL;</div><div class='del'>-		goto out;</div><div class='add'>+int btrfs_encoded_io_compression_from_extent(struct btrfs_fs_info *fs_info,</div><div class='add'>+					     int compress_type)</div><div class='add'>+{</div><div class='add'>+	switch (compress_type) {</div><div class='add'>+	case BTRFS_COMPRESS_NONE:</div><div class='add'>+		return BTRFS_ENCODED_IO_COMPRESSION_NONE;</div><div class='add'>+	case BTRFS_COMPRESS_ZLIB:</div><div class='add'>+		return BTRFS_ENCODED_IO_COMPRESSION_ZLIB;</div><div class='add'>+	case BTRFS_COMPRESS_LZO:</div><div class='add'>+		/*</div><div class='add'>+		 * The LZO format depends on the sector size. 64K is the maximum</div><div class='add'>+		 * sector size that we support.</div><div class='add'>+		 */</div><div class='add'>+		if (fs_info-&gt;sectorsize &lt; SZ_4K || fs_info-&gt;sectorsize &gt; SZ_64K)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		return BTRFS_ENCODED_IO_COMPRESSION_LZO_4K +</div><div class='add'>+		       (fs_info-&gt;sectorsize_bits - 12);</div><div class='add'>+	case BTRFS_COMPRESS_ZSTD:</div><div class='add'>+		return BTRFS_ENCODED_IO_COMPRESSION_ZSTD;</div><div class='add'>+	default:</div><div class='add'>+		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_fop = &amp;btrfs_file_operations;</div><div class='del'>-	inode-&gt;i_op = &amp;btrfs_file_inode_operations;</div><div class='add'>+static ssize_t btrfs_encoded_read_inline(</div><div class='add'>+				struct kiocb *iocb,</div><div class='add'>+				struct iov_iter *iter, u64 start,</div><div class='add'>+				u64 lockend,</div><div class='add'>+				struct extent_state **cached_state,</div><div class='add'>+				u64 extent_start, size_t count,</div><div class='add'>+				struct btrfs_ioctl_encoded_io_args *encoded,</div><div class='add'>+				bool *unlocked)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_inode *inode = BTRFS_I(file_inode(iocb-&gt;ki_filp));</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+	struct extent_io_tree *io_tree = &amp;inode-&gt;io_tree;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='add'>+	struct extent_buffer *leaf;</div><div class='add'>+	struct btrfs_file_extent_item *item;</div><div class='add'>+	u64 ram_bytes;</div><div class='add'>+	unsigned long ptr;</div><div class='add'>+	void *tmp;</div><div class='add'>+	ssize_t ret;</div><div class='add'>+	const bool nowait = (iocb-&gt;ki_flags &amp; IOCB_NOWAIT);</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_mapping-&gt;a_ops = &amp;btrfs_aops;</div><div class='add'>+	path = btrfs_alloc_path();</div><div class='add'>+	if (!path)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_init_inode_security(trans, inode, dir, NULL);</div><div class='del'>-	if (ret)</div><div class='add'>+	path-&gt;nowait = nowait;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_lookup_file_extent(NULL, root, path, btrfs_ino(inode),</div><div class='add'>+				       extent_start, 0);</div><div class='add'>+	if (ret) {</div><div class='add'>+		if (unlikely(ret &gt; 0)) {</div><div class='add'>+			/* The extent item disappeared? */</div><div class='add'>+			return -EIO;</div><div class='add'>+		}</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+	leaf = path-&gt;nodes[0];</div><div class='add'>+	item = btrfs_item_ptr(leaf, path-&gt;slots[0], struct btrfs_file_extent_item);</div><div class='add'>+</div><div class='add'>+	ram_bytes = btrfs_file_extent_ram_bytes(leaf, item);</div><div class='add'>+	ptr = btrfs_file_extent_inline_start(item);</div><div class='add'>+</div><div class='add'>+	encoded-&gt;len = min_t(u64, extent_start + ram_bytes,</div><div class='add'>+			     inode-&gt;vfs_inode.i_size) - iocb-&gt;ki_pos;</div><div class='add'>+	ret = btrfs_encoded_io_compression_from_extent(fs_info,</div><div class='add'>+				 btrfs_file_extent_compression(leaf, item));</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+	encoded-&gt;compression = ret;</div><div class='add'>+	if (encoded-&gt;compression) {</div><div class='add'>+		size_t inline_size;</div><div class='add'>+</div><div class='add'>+		inline_size = btrfs_file_extent_inline_item_len(leaf,</div><div class='add'>+								path-&gt;slots[0]);</div><div class='add'>+		if (inline_size &gt; count)</div><div class='add'>+			return -ENOBUFS;</div><div class='add'>+</div><div class='add'>+		count = inline_size;</div><div class='add'>+		encoded-&gt;unencoded_len = ram_bytes;</div><div class='add'>+		encoded-&gt;unencoded_offset = iocb-&gt;ki_pos - extent_start;</div><div class='add'>+	} else {</div><div class='add'>+		count = min_t(u64, count, encoded-&gt;len);</div><div class='add'>+		encoded-&gt;len = count;</div><div class='add'>+		encoded-&gt;unencoded_len = count;</div><div class='add'>+		ptr += iocb-&gt;ki_pos - extent_start;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	tmp = kmalloc(count, GFP_NOFS);</div><div class='add'>+	if (!tmp)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	read_extent_buffer(leaf, tmp, ptr, count);</div><div class='add'>+	btrfs_release_path(path);</div><div class='add'>+	btrfs_unlock_extent(io_tree, start, lockend, cached_state);</div><div class='add'>+	btrfs_inode_unlock(inode, BTRFS_ILOCK_SHARED);</div><div class='add'>+	*unlocked = true;</div><div class='add'>+</div><div class='add'>+	ret = copy_to_iter(tmp, count, iter);</div><div class='add'>+	if (ret != count)</div><div class='add'>+		ret = -EFAULT;</div><div class='add'>+	kfree(tmp);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct btrfs_encoded_read_private {</div><div class='add'>+	struct completion *sync_reads;</div><div class='add'>+	void *uring_ctx;</div><div class='add'>+	refcount_t pending_refs;</div><div class='add'>+	blk_status_t status;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static void btrfs_encoded_read_endio(struct btrfs_bio *bbio)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_encoded_read_private *priv = bbio-&gt;private;</div><div class='add'>+</div><div class='add'>+	if (bbio-&gt;bio.bi_status) {</div><div class='add'>+		/*</div><div class='add'>+		 * The memory barrier implied by the refcount_dec_and_test() here</div><div class='add'>+		 * pairs with the memory barrier implied by the refcount_dec_and_test()</div><div class='add'>+		 * in btrfs_encoded_read_regular_fill_pages() to ensure that</div><div class='add'>+		 * this write is observed before the load of status in</div><div class='add'>+		 * btrfs_encoded_read_regular_fill_pages().</div><div class='add'>+		 */</div><div class='add'>+		WRITE_ONCE(priv-&gt;status, bbio-&gt;bio.bi_status);</div><div class='add'>+	}</div><div class='add'>+	if (refcount_dec_and_test(&amp;priv-&gt;pending_refs)) {</div><div class='add'>+		int err = blk_status_to_errno(READ_ONCE(priv-&gt;status));</div><div class='add'>+</div><div class='add'>+		if (priv-&gt;uring_ctx) {</div><div class='add'>+			btrfs_uring_read_extent_endio(priv-&gt;uring_ctx, err);</div><div class='add'>+			kfree(priv);</div><div class='add'>+		} else {</div><div class='add'>+			complete(priv-&gt;sync_reads);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	bio_put(&amp;bbio-&gt;bio);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_encoded_read_regular_fill_pages(struct btrfs_inode *inode,</div><div class='add'>+					  u64 disk_bytenr, u64 disk_io_size,</div><div class='add'>+					  struct page **pages, void *uring_ctx)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_encoded_read_private *priv, sync_priv;</div><div class='add'>+	struct completion sync_reads;</div><div class='add'>+	unsigned long i = 0;</div><div class='add'>+	struct btrfs_bio *bbio;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Fast path for synchronous reads which completes in this call, io_uring</div><div class='add'>+	 * needs longer time span.</div><div class='add'>+	 */</div><div class='add'>+	if (uring_ctx) {</div><div class='add'>+		priv = kmalloc(sizeof(struct btrfs_encoded_read_private), GFP_NOFS);</div><div class='add'>+		if (!priv)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+	} else {</div><div class='add'>+		priv = &amp;sync_priv;</div><div class='add'>+		init_completion(&amp;sync_reads);</div><div class='add'>+		priv-&gt;sync_reads = &amp;sync_reads;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	refcount_set(&amp;priv-&gt;pending_refs, 1);</div><div class='add'>+	priv-&gt;status = 0;</div><div class='add'>+	priv-&gt;uring_ctx = uring_ctx;</div><div class='add'>+</div><div class='add'>+	bbio = btrfs_bio_alloc(BIO_MAX_VECS, REQ_OP_READ, inode, 0,</div><div class='add'>+			       btrfs_encoded_read_endio, priv);</div><div class='add'>+	bbio-&gt;bio.bi_iter.bi_sector = disk_bytenr &gt;&gt; SECTOR_SHIFT;</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		size_t bytes = min_t(u64, disk_io_size, PAGE_SIZE);</div><div class='add'>+</div><div class='add'>+		if (bio_add_page(&amp;bbio-&gt;bio, pages[i], bytes, 0) &lt; bytes) {</div><div class='add'>+			refcount_inc(&amp;priv-&gt;pending_refs);</div><div class='add'>+			btrfs_submit_bbio(bbio, 0);</div><div class='add'>+</div><div class='add'>+			bbio = btrfs_bio_alloc(BIO_MAX_VECS, REQ_OP_READ, inode, 0,</div><div class='add'>+					       btrfs_encoded_read_endio, priv);</div><div class='add'>+			bbio-&gt;bio.bi_iter.bi_sector = disk_bytenr &gt;&gt; SECTOR_SHIFT;</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		i++;</div><div class='add'>+		disk_bytenr += bytes;</div><div class='add'>+		disk_io_size -= bytes;</div><div class='add'>+	} while (disk_io_size);</div><div class='add'>+</div><div class='add'>+	refcount_inc(&amp;priv-&gt;pending_refs);</div><div class='add'>+	btrfs_submit_bbio(bbio, 0);</div><div class='add'>+</div><div class='add'>+	if (uring_ctx) {</div><div class='add'>+		if (refcount_dec_and_test(&amp;priv-&gt;pending_refs)) {</div><div class='add'>+			ret = blk_status_to_errno(READ_ONCE(priv-&gt;status));</div><div class='add'>+			btrfs_uring_read_extent_endio(uring_ctx, ret);</div><div class='add'>+			kfree(priv);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		return -EIOCBQUEUED;</div><div class='add'>+	} else {</div><div class='add'>+		if (!refcount_dec_and_test(&amp;priv-&gt;pending_refs))</div><div class='add'>+			wait_for_completion_io(&amp;sync_reads);</div><div class='add'>+		/* See btrfs_encoded_read_endio() for ordering. */</div><div class='add'>+		return blk_status_to_errno(READ_ONCE(priv-&gt;status));</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+ssize_t btrfs_encoded_read_regular(struct kiocb *iocb, struct iov_iter *iter,</div><div class='add'>+				   u64 start, u64 lockend,</div><div class='add'>+				   struct extent_state **cached_state,</div><div class='add'>+				   u64 disk_bytenr, u64 disk_io_size,</div><div class='add'>+				   size_t count, bool compressed, bool *unlocked)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_inode *inode = BTRFS_I(file_inode(iocb-&gt;ki_filp));</div><div class='add'>+	struct extent_io_tree *io_tree = &amp;inode-&gt;io_tree;</div><div class='add'>+	struct page **pages;</div><div class='add'>+	unsigned long nr_pages, i;</div><div class='add'>+	u64 cur;</div><div class='add'>+	size_t page_offset;</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	nr_pages = DIV_ROUND_UP(disk_io_size, PAGE_SIZE);</div><div class='add'>+	pages = kcalloc(nr_pages, sizeof(struct page *), GFP_NOFS);</div><div class='add'>+	if (!pages)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	ret = btrfs_alloc_page_array(nr_pages, pages, false);</div><div class='add'>+	if (ret) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='ctx'> 		goto out;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_update_inode(trans, root, BTRFS_I(inode));</div><div class='add'>+	ret = btrfs_encoded_read_regular_fill_pages(inode, disk_bytenr,</div><div class='add'>+						    disk_io_size, pages, NULL);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='del'>-	ret = btrfs_orphan_add(trans, BTRFS_I(inode));</div><div class='add'>+</div><div class='add'>+	btrfs_unlock_extent(io_tree, start, lockend, cached_state);</div><div class='add'>+	btrfs_inode_unlock(inode, BTRFS_ILOCK_SHARED);</div><div class='add'>+	*unlocked = true;</div><div class='add'>+</div><div class='add'>+	if (compressed) {</div><div class='add'>+		i = 0;</div><div class='add'>+		page_offset = 0;</div><div class='add'>+	} else {</div><div class='add'>+		i = (iocb-&gt;ki_pos - start) &gt;&gt; PAGE_SHIFT;</div><div class='add'>+		page_offset = (iocb-&gt;ki_pos - start) &amp; (PAGE_SIZE - 1);</div><div class='add'>+	}</div><div class='add'>+	cur = 0;</div><div class='add'>+	while (cur &lt; count) {</div><div class='add'>+		size_t bytes = min_t(size_t, count - cur,</div><div class='add'>+				     PAGE_SIZE - page_offset);</div><div class='add'>+</div><div class='add'>+		if (copy_page_to_iter(pages[i], page_offset, bytes,</div><div class='add'>+				      iter) != bytes) {</div><div class='add'>+			ret = -EFAULT;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		i++;</div><div class='add'>+		cur += bytes;</div><div class='add'>+		page_offset = 0;</div><div class='add'>+	}</div><div class='add'>+	ret = count;</div><div class='add'>+out:</div><div class='add'>+	for (i = 0; i &lt; nr_pages; i++) {</div><div class='add'>+		if (pages[i])</div><div class='add'>+			__free_page(pages[i]);</div><div class='add'>+	}</div><div class='add'>+	kfree(pages);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+ssize_t btrfs_encoded_read(struct kiocb *iocb, struct iov_iter *iter,</div><div class='add'>+			   struct btrfs_ioctl_encoded_io_args *encoded,</div><div class='add'>+			   struct extent_state **cached_state,</div><div class='add'>+			   u64 *disk_bytenr, u64 *disk_io_size)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_inode *inode = BTRFS_I(file_inode(iocb-&gt;ki_filp));</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	struct extent_io_tree *io_tree = &amp;inode-&gt;io_tree;</div><div class='add'>+	ssize_t ret;</div><div class='add'>+	size_t count = iov_iter_count(iter);</div><div class='add'>+	u64 start, lockend;</div><div class='add'>+	struct extent_map *em;</div><div class='add'>+	const bool nowait = (iocb-&gt;ki_flags &amp; IOCB_NOWAIT);</div><div class='add'>+	bool unlocked = false;</div><div class='add'>+</div><div class='add'>+	file_accessed(iocb-&gt;ki_filp);</div><div class='add'>+</div><div class='add'>+	ret = btrfs_inode_lock(inode,</div><div class='add'>+			       BTRFS_ILOCK_SHARED | (nowait ? BTRFS_ILOCK_TRY : 0));</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='add'>+	if (iocb-&gt;ki_pos &gt;= inode-&gt;vfs_inode.i_size) {</div><div class='add'>+		btrfs_inode_unlock(inode, BTRFS_ILOCK_SHARED);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+	start = ALIGN_DOWN(iocb-&gt;ki_pos, fs_info-&gt;sectorsize);</div><div class='ctx'> 	/*</div><div class='del'>-	 * We set number of links to 0 in btrfs_new_inode(), and here we set</div><div class='del'>-	 * it to 1 because d_tmpfile() will issue a warning if the count is 0,</div><div class='del'>-	 * through:</div><div class='del'>-	 *</div><div class='del'>-	 *    d_tmpfile() -&gt; inode_dec_link_count() -&gt; drop_nlink()</div><div class='add'>+	 * We don't know how long the extent containing iocb-&gt;ki_pos is, but if</div><div class='add'>+	 * it's compressed we know that it won't be longer than this.</div><div class='ctx'> 	 */</div><div class='del'>-	set_nlink(inode, 1);</div><div class='del'>-	d_tmpfile(dentry, inode);</div><div class='del'>-	unlock_new_inode(inode);</div><div class='del'>-	mark_inode_dirty(inode);</div><div class='del'>-out:</div><div class='del'>-	btrfs_end_transaction(trans);</div><div class='del'>-	if (ret &amp;&amp; inode)</div><div class='del'>-		discard_new_inode(inode);</div><div class='del'>-	btrfs_btree_balance_dirty(fs_info);</div><div class='add'>+	lockend = start + BTRFS_MAX_UNCOMPRESSED - 1;</div><div class='add'>+</div><div class='add'>+	if (nowait) {</div><div class='add'>+		struct btrfs_ordered_extent *ordered;</div><div class='add'>+</div><div class='add'>+		if (filemap_range_needs_writeback(inode-&gt;vfs_inode.i_mapping,</div><div class='add'>+						  start, lockend)) {</div><div class='add'>+			ret = -EAGAIN;</div><div class='add'>+			goto out_unlock_inode;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (!btrfs_try_lock_extent(io_tree, start, lockend, cached_state)) {</div><div class='add'>+			ret = -EAGAIN;</div><div class='add'>+			goto out_unlock_inode;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		ordered = btrfs_lookup_ordered_range(inode, start,</div><div class='add'>+						     lockend - start + 1);</div><div class='add'>+		if (ordered) {</div><div class='add'>+			btrfs_put_ordered_extent(ordered);</div><div class='add'>+			btrfs_unlock_extent(io_tree, start, lockend, cached_state);</div><div class='add'>+			ret = -EAGAIN;</div><div class='add'>+			goto out_unlock_inode;</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		for (;;) {</div><div class='add'>+			struct btrfs_ordered_extent *ordered;</div><div class='add'>+</div><div class='add'>+			ret = btrfs_wait_ordered_range(inode, start,</div><div class='add'>+						       lockend - start + 1);</div><div class='add'>+			if (ret)</div><div class='add'>+				goto out_unlock_inode;</div><div class='add'>+</div><div class='add'>+			btrfs_lock_extent(io_tree, start, lockend, cached_state);</div><div class='add'>+			ordered = btrfs_lookup_ordered_range(inode, start,</div><div class='add'>+							     lockend - start + 1);</div><div class='add'>+			if (!ordered)</div><div class='add'>+				break;</div><div class='add'>+			btrfs_put_ordered_extent(ordered);</div><div class='add'>+			btrfs_unlock_extent(io_tree, start, lockend, cached_state);</div><div class='add'>+			cond_resched();</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	em = btrfs_get_extent(inode, NULL, start, lockend - start + 1);</div><div class='add'>+	if (IS_ERR(em)) {</div><div class='add'>+		ret = PTR_ERR(em);</div><div class='add'>+		goto out_unlock_extent;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (em-&gt;disk_bytenr == EXTENT_MAP_INLINE) {</div><div class='add'>+		u64 extent_start = em-&gt;start;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * For inline extents we get everything we need out of the</div><div class='add'>+		 * extent item.</div><div class='add'>+		 */</div><div class='add'>+		btrfs_free_extent_map(em);</div><div class='add'>+		em = NULL;</div><div class='add'>+		ret = btrfs_encoded_read_inline(iocb, iter, start, lockend,</div><div class='add'>+						cached_state, extent_start,</div><div class='add'>+						count, encoded, &amp;unlocked);</div><div class='add'>+		goto out_unlock_extent;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We only want to return up to EOF even if the extent extends beyond</div><div class='add'>+	 * that.</div><div class='add'>+	 */</div><div class='add'>+	encoded-&gt;len = min_t(u64, btrfs_extent_map_end(em),</div><div class='add'>+			     inode-&gt;vfs_inode.i_size) - iocb-&gt;ki_pos;</div><div class='add'>+	if (em-&gt;disk_bytenr == EXTENT_MAP_HOLE ||</div><div class='add'>+	    (em-&gt;flags &amp; EXTENT_FLAG_PREALLOC)) {</div><div class='add'>+		*disk_bytenr = EXTENT_MAP_HOLE;</div><div class='add'>+		count = min_t(u64, count, encoded-&gt;len);</div><div class='add'>+		encoded-&gt;len = count;</div><div class='add'>+		encoded-&gt;unencoded_len = count;</div><div class='add'>+	} else if (btrfs_extent_map_is_compressed(em)) {</div><div class='add'>+		*disk_bytenr = em-&gt;disk_bytenr;</div><div class='add'>+		/*</div><div class='add'>+		 * Bail if the buffer isn't large enough to return the whole</div><div class='add'>+		 * compressed extent.</div><div class='add'>+		 */</div><div class='add'>+		if (em-&gt;disk_num_bytes &gt; count) {</div><div class='add'>+			ret = -ENOBUFS;</div><div class='add'>+			goto out_em;</div><div class='add'>+		}</div><div class='add'>+		*disk_io_size = em-&gt;disk_num_bytes;</div><div class='add'>+		count = em-&gt;disk_num_bytes;</div><div class='add'>+		encoded-&gt;unencoded_len = em-&gt;ram_bytes;</div><div class='add'>+		encoded-&gt;unencoded_offset = iocb-&gt;ki_pos - (em-&gt;start - em-&gt;offset);</div><div class='add'>+		ret = btrfs_encoded_io_compression_from_extent(fs_info,</div><div class='add'>+					       btrfs_extent_map_compression(em));</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out_em;</div><div class='add'>+		encoded-&gt;compression = ret;</div><div class='add'>+	} else {</div><div class='add'>+		*disk_bytenr = btrfs_extent_map_block_start(em) + (start - em-&gt;start);</div><div class='add'>+		if (encoded-&gt;len &gt; count)</div><div class='add'>+			encoded-&gt;len = count;</div><div class='add'>+		/*</div><div class='add'>+		 * Don't read beyond what we locked. This also limits the page</div><div class='add'>+		 * allocations that we'll do.</div><div class='add'>+		 */</div><div class='add'>+		*disk_io_size = min(lockend + 1, iocb-&gt;ki_pos + encoded-&gt;len) - start;</div><div class='add'>+		count = start + *disk_io_size - iocb-&gt;ki_pos;</div><div class='add'>+		encoded-&gt;len = count;</div><div class='add'>+		encoded-&gt;unencoded_len = count;</div><div class='add'>+		*disk_io_size = ALIGN(*disk_io_size, fs_info-&gt;sectorsize);</div><div class='add'>+	}</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='add'>+	em = NULL;</div><div class='add'>+</div><div class='add'>+	if (*disk_bytenr == EXTENT_MAP_HOLE) {</div><div class='add'>+		btrfs_unlock_extent(io_tree, start, lockend, cached_state);</div><div class='add'>+		btrfs_inode_unlock(inode, BTRFS_ILOCK_SHARED);</div><div class='add'>+		unlocked = true;</div><div class='add'>+		ret = iov_iter_zero(count, iter);</div><div class='add'>+		if (ret != count)</div><div class='add'>+			ret = -EFAULT;</div><div class='add'>+	} else {</div><div class='add'>+		ret = -EIOCBQUEUED;</div><div class='add'>+		goto out_unlock_extent;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+out_em:</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='add'>+out_unlock_extent:</div><div class='add'>+	/* Leave inode and extent locked if we need to do a read. */</div><div class='add'>+	if (!unlocked &amp;&amp; ret != -EIOCBQUEUED)</div><div class='add'>+		btrfs_unlock_extent(io_tree, start, lockend, cached_state);</div><div class='add'>+out_unlock_inode:</div><div class='add'>+	if (!unlocked &amp;&amp; ret != -EIOCBQUEUED)</div><div class='add'>+		btrfs_inode_unlock(inode, BTRFS_ILOCK_SHARED);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_set_range_writeback(struct btrfs_inode *inode, u64 start, u64 end)</div><div class='add'>+ssize_t btrfs_do_encoded_write(struct kiocb *iocb, struct iov_iter *from,</div><div class='add'>+			       const struct btrfs_ioctl_encoded_io_args *encoded)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='del'>-	unsigned long index = start &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	unsigned long end_index = end &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	struct page *page;</div><div class='del'>-	u32 len;</div><div class='add'>+	struct btrfs_inode *inode = BTRFS_I(file_inode(iocb-&gt;ki_filp));</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+	struct extent_io_tree *io_tree = &amp;inode-&gt;io_tree;</div><div class='add'>+	struct extent_changeset *data_reserved = NULL;</div><div class='add'>+	struct extent_state *cached_state = NULL;</div><div class='add'>+	struct btrfs_ordered_extent *ordered;</div><div class='add'>+	struct btrfs_file_extent file_extent;</div><div class='add'>+	int compression;</div><div class='add'>+	size_t orig_count;</div><div class='add'>+	u64 start, end;</div><div class='add'>+	u64 num_bytes, ram_bytes, disk_num_bytes;</div><div class='add'>+	unsigned long nr_folios, i;</div><div class='add'>+	struct folio **folios;</div><div class='add'>+	struct btrfs_key ins;</div><div class='add'>+	bool extent_reserved = false;</div><div class='add'>+	struct extent_map *em;</div><div class='add'>+	ssize_t ret;</div><div class='ctx'> </div><div class='del'>-	ASSERT(end + 1 - start &lt;= U32_MAX);</div><div class='del'>-	len = end + 1 - start;</div><div class='del'>-	while (index &lt;= end_index) {</div><div class='del'>-		page = find_get_page(inode-&gt;vfs_inode.i_mapping, index);</div><div class='del'>-		ASSERT(page); /* Pages should be in the extent_io_tree */</div><div class='add'>+	switch (encoded-&gt;compression) {</div><div class='add'>+	case BTRFS_ENCODED_IO_COMPRESSION_ZLIB:</div><div class='add'>+		compression = BTRFS_COMPRESS_ZLIB;</div><div class='add'>+		break;</div><div class='add'>+	case BTRFS_ENCODED_IO_COMPRESSION_ZSTD:</div><div class='add'>+		compression = BTRFS_COMPRESS_ZSTD;</div><div class='add'>+		break;</div><div class='add'>+	case BTRFS_ENCODED_IO_COMPRESSION_LZO_4K:</div><div class='add'>+	case BTRFS_ENCODED_IO_COMPRESSION_LZO_8K:</div><div class='add'>+	case BTRFS_ENCODED_IO_COMPRESSION_LZO_16K:</div><div class='add'>+	case BTRFS_ENCODED_IO_COMPRESSION_LZO_32K:</div><div class='add'>+	case BTRFS_ENCODED_IO_COMPRESSION_LZO_64K:</div><div class='add'>+		/* The sector size must match for LZO. */</div><div class='add'>+		if (encoded-&gt;compression -</div><div class='add'>+		    BTRFS_ENCODED_IO_COMPRESSION_LZO_4K + 12 !=</div><div class='add'>+		    fs_info-&gt;sectorsize_bits)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		compression = BTRFS_COMPRESS_LZO;</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+	if (encoded-&gt;encryption != BTRFS_ENCODED_IO_ENCRYPTION_NONE)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Compressed extents should always have checksums, so error out if we</div><div class='add'>+	 * have a NOCOW file or inode was created while mounted with NODATASUM.</div><div class='add'>+	 */</div><div class='add'>+	if (inode-&gt;flags &amp; BTRFS_INODE_NODATASUM)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	orig_count = iov_iter_count(from);</div><div class='add'>+</div><div class='add'>+	/* The extent size must be sane. */</div><div class='add'>+	if (encoded-&gt;unencoded_len &gt; BTRFS_MAX_UNCOMPRESSED ||</div><div class='add'>+	    orig_count &gt; BTRFS_MAX_COMPRESSED || orig_count == 0)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The compressed data must be smaller than the decompressed data.</div><div class='add'>+	 *</div><div class='add'>+	 * It's of course possible for data to compress to larger or the same</div><div class='add'>+	 * size, but the buffered I/O path falls back to no compression for such</div><div class='add'>+	 * data, and we don't want to break any assumptions by creating these</div><div class='add'>+	 * extents.</div><div class='add'>+	 *</div><div class='add'>+	 * Note that this is less strict than the current check we have that the</div><div class='add'>+	 * compressed data must be at least one sector smaller than the</div><div class='add'>+	 * decompressed data. We only want to enforce the weaker requirement</div><div class='add'>+	 * from old kernels that it is at least one byte smaller.</div><div class='add'>+	 */</div><div class='add'>+	if (orig_count &gt;= encoded-&gt;unencoded_len)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	/* The extent must start on a sector boundary. */</div><div class='add'>+	start = iocb-&gt;ki_pos;</div><div class='add'>+	if (!IS_ALIGNED(start, fs_info-&gt;sectorsize))</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-		btrfs_page_set_writeback(fs_info, page, start, len);</div><div class='del'>-		put_page(page);</div><div class='del'>-		index++;</div><div class='add'>+	/*</div><div class='add'>+	 * The extent must end on a sector boundary. However, we allow a write</div><div class='add'>+	 * which ends at or extends i_size to have an unaligned length; we round</div><div class='add'>+	 * up the extent size and set i_size to the unaligned end.</div><div class='add'>+	 */</div><div class='add'>+	if (start + encoded-&gt;len &lt; inode-&gt;vfs_inode.i_size &amp;&amp;</div><div class='add'>+	    !IS_ALIGNED(start + encoded-&gt;len, fs_info-&gt;sectorsize))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	/* Finally, the offset in the unencoded data must be sector-aligned. */</div><div class='add'>+	if (!IS_ALIGNED(encoded-&gt;unencoded_offset, fs_info-&gt;sectorsize))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	num_bytes = ALIGN(encoded-&gt;len, fs_info-&gt;sectorsize);</div><div class='add'>+	ram_bytes = ALIGN(encoded-&gt;unencoded_len, fs_info-&gt;sectorsize);</div><div class='add'>+	end = start + num_bytes - 1;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If the extent cannot be inline, the compressed data on disk must be</div><div class='add'>+	 * sector-aligned. For convenience, we extend it with zeroes if it</div><div class='add'>+	 * isn't.</div><div class='add'>+	 */</div><div class='add'>+	disk_num_bytes = ALIGN(orig_count, fs_info-&gt;sectorsize);</div><div class='add'>+	nr_folios = DIV_ROUND_UP(disk_num_bytes, PAGE_SIZE);</div><div class='add'>+	folios = kvcalloc(nr_folios, sizeof(struct folio *), GFP_KERNEL_ACCOUNT);</div><div class='add'>+	if (!folios)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	for (i = 0; i &lt; nr_folios; i++) {</div><div class='add'>+		size_t bytes = min_t(size_t, PAGE_SIZE, iov_iter_count(from));</div><div class='add'>+		char *kaddr;</div><div class='add'>+</div><div class='add'>+		folios[i] = folio_alloc(GFP_KERNEL_ACCOUNT, 0);</div><div class='add'>+		if (!folios[i]) {</div><div class='add'>+			ret = -ENOMEM;</div><div class='add'>+			goto out_folios;</div><div class='add'>+		}</div><div class='add'>+		kaddr = kmap_local_folio(folios[i], 0);</div><div class='add'>+		if (copy_from_iter(kaddr, bytes, from) != bytes) {</div><div class='add'>+			kunmap_local(kaddr);</div><div class='add'>+			ret = -EFAULT;</div><div class='add'>+			goto out_folios;</div><div class='add'>+		}</div><div class='add'>+		if (bytes &lt; PAGE_SIZE)</div><div class='add'>+			memset(kaddr + bytes, 0, PAGE_SIZE - bytes);</div><div class='add'>+		kunmap_local(kaddr);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for (;;) {</div><div class='add'>+		ret = btrfs_wait_ordered_range(inode, start, num_bytes);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out_folios;</div><div class='add'>+		ret = invalidate_inode_pages2_range(inode-&gt;vfs_inode.i_mapping,</div><div class='add'>+						    start &gt;&gt; PAGE_SHIFT,</div><div class='add'>+						    end &gt;&gt; PAGE_SHIFT);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out_folios;</div><div class='add'>+		btrfs_lock_extent(io_tree, start, end, &amp;cached_state);</div><div class='add'>+		ordered = btrfs_lookup_ordered_range(inode, start, num_bytes);</div><div class='add'>+		if (!ordered &amp;&amp;</div><div class='add'>+		    !filemap_range_has_page(inode-&gt;vfs_inode.i_mapping, start, end))</div><div class='add'>+			break;</div><div class='add'>+		if (ordered)</div><div class='add'>+			btrfs_put_ordered_extent(ordered);</div><div class='add'>+		btrfs_unlock_extent(io_tree, start, end, &amp;cached_state);</div><div class='add'>+		cond_resched();</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We don't use the higher-level delalloc space functions because our</div><div class='add'>+	 * num_bytes and disk_num_bytes are different.</div><div class='add'>+	 */</div><div class='add'>+	ret = btrfs_alloc_data_chunk_ondemand(inode, disk_num_bytes);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	ret = btrfs_qgroup_reserve_data(inode, &amp;data_reserved, start, num_bytes);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_free_data_space;</div><div class='add'>+	ret = btrfs_delalloc_reserve_metadata(inode, num_bytes, disk_num_bytes,</div><div class='add'>+					      false);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_qgroup_free_data;</div><div class='add'>+</div><div class='add'>+	/* Try an inline extent first. */</div><div class='add'>+	if (encoded-&gt;unencoded_len == encoded-&gt;len &amp;&amp;</div><div class='add'>+	    encoded-&gt;unencoded_offset == 0 &amp;&amp;</div><div class='add'>+	    can_cow_file_range_inline(inode, start, encoded-&gt;len, orig_count)) {</div><div class='add'>+		ret = __cow_file_range_inline(inode, encoded-&gt;len,</div><div class='add'>+					      orig_count, compression, folios[0],</div><div class='add'>+					      true);</div><div class='add'>+		if (ret &lt;= 0) {</div><div class='add'>+			if (ret == 0)</div><div class='add'>+				ret = orig_count;</div><div class='add'>+			goto out_delalloc_release;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_reserve_extent(root, disk_num_bytes, disk_num_bytes,</div><div class='add'>+				   disk_num_bytes, 0, 0, &amp;ins, true, true);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_delalloc_release;</div><div class='add'>+	extent_reserved = true;</div><div class='add'>+</div><div class='add'>+	file_extent.disk_bytenr = ins.objectid;</div><div class='add'>+	file_extent.disk_num_bytes = ins.offset;</div><div class='add'>+	file_extent.num_bytes = num_bytes;</div><div class='add'>+	file_extent.ram_bytes = ram_bytes;</div><div class='add'>+	file_extent.offset = encoded-&gt;unencoded_offset;</div><div class='add'>+	file_extent.compression = compression;</div><div class='add'>+	em = btrfs_create_io_em(inode, start, &amp;file_extent, BTRFS_ORDERED_COMPRESSED);</div><div class='add'>+	if (IS_ERR(em)) {</div><div class='add'>+		ret = PTR_ERR(em);</div><div class='add'>+		goto out_free_reserved;</div><div class='add'>+	}</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='add'>+</div><div class='add'>+	ordered = btrfs_alloc_ordered_extent(inode, start, &amp;file_extent,</div><div class='add'>+				       (1U &lt;&lt; BTRFS_ORDERED_ENCODED) |</div><div class='add'>+				       (1U &lt;&lt; BTRFS_ORDERED_COMPRESSED));</div><div class='add'>+	if (IS_ERR(ordered)) {</div><div class='add'>+		btrfs_drop_extent_map_range(inode, start, end, false);</div><div class='add'>+		ret = PTR_ERR(ordered);</div><div class='add'>+		goto out_free_reserved;</div><div class='add'>+	}</div><div class='add'>+	btrfs_dec_block_group_reservations(fs_info, ins.objectid);</div><div class='add'>+</div><div class='add'>+	if (start + encoded-&gt;len &gt; inode-&gt;vfs_inode.i_size)</div><div class='add'>+		i_size_write(&amp;inode-&gt;vfs_inode, start + encoded-&gt;len);</div><div class='add'>+</div><div class='add'>+	btrfs_unlock_extent(io_tree, start, end, &amp;cached_state);</div><div class='add'>+</div><div class='add'>+	btrfs_delalloc_release_extents(inode, num_bytes);</div><div class='add'>+</div><div class='add'>+	btrfs_submit_compressed_write(ordered, folios, nr_folios, 0, false);</div><div class='add'>+	ret = orig_count;</div><div class='add'>+	goto out;</div><div class='add'>+</div><div class='add'>+out_free_reserved:</div><div class='add'>+	btrfs_dec_block_group_reservations(fs_info, ins.objectid);</div><div class='add'>+	btrfs_free_reserved_extent(fs_info, ins.objectid, ins.offset, true);</div><div class='add'>+out_delalloc_release:</div><div class='add'>+	btrfs_delalloc_release_extents(inode, num_bytes);</div><div class='add'>+	btrfs_delalloc_release_metadata(inode, disk_num_bytes, ret &lt; 0);</div><div class='add'>+out_qgroup_free_data:</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		btrfs_qgroup_free_data(inode, data_reserved, start, num_bytes, NULL);</div><div class='add'>+out_free_data_space:</div><div class='add'>+	/*</div><div class='add'>+	 * If btrfs_reserve_extent() succeeded, then we already decremented</div><div class='add'>+	 * bytes_may_use.</div><div class='add'>+	 */</div><div class='add'>+	if (!extent_reserved)</div><div class='add'>+		btrfs_free_reserved_data_space_noquota(inode, disk_num_bytes);</div><div class='add'>+out_unlock:</div><div class='add'>+	btrfs_unlock_extent(io_tree, start, end, &amp;cached_state);</div><div class='add'>+out_folios:</div><div class='add'>+	for (i = 0; i &lt; nr_folios; i++) {</div><div class='add'>+		if (folios[i])</div><div class='add'>+			folio_put(folios[i]);</div><div class='ctx'> 	}</div><div class='add'>+	kvfree(folios);</div><div class='add'>+out:</div><div class='add'>+	if (ret &gt;= 0)</div><div class='add'>+		iocb-&gt;ki_pos += encoded-&gt;len;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_SWAP</div><div class='hunk'>@@ -10595,16 +10067,26 @@ static int btrfs_add_swap_extent(struct swap_info_struct *sis,</div><div class='ctx'> 				 struct btrfs_swap_info *bsi)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned long nr_pages;</div><div class='add'>+	unsigned long max_pages;</div><div class='ctx'> 	u64 first_ppage, first_ppage_reported, next_ppage;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	first_ppage = ALIGN(bsi-&gt;block_start, PAGE_SIZE) &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	next_ppage = ALIGN_DOWN(bsi-&gt;block_start + bsi-&gt;block_len,</div><div class='del'>-				PAGE_SIZE) &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	/*</div><div class='add'>+	 * Our swapfile may have had its size extended after the swap header was</div><div class='add'>+	 * written. In that case activating the swapfile should not go beyond</div><div class='add'>+	 * the max size set in the swap header.</div><div class='add'>+	 */</div><div class='add'>+	if (bsi-&gt;nr_pages &gt;= sis-&gt;max)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	max_pages = sis-&gt;max - bsi-&gt;nr_pages;</div><div class='add'>+	first_ppage = PAGE_ALIGN(bsi-&gt;block_start) &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	next_ppage = PAGE_ALIGN_DOWN(bsi-&gt;block_start + bsi-&gt;block_len) &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> </div><div class='ctx'> 	if (first_ppage &gt;= next_ppage)</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	nr_pages = next_ppage - first_ppage;</div><div class='add'>+	nr_pages = min(nr_pages, max_pages);</div><div class='ctx'> </div><div class='ctx'> 	first_ppage_reported = first_ppage;</div><div class='ctx'> 	if (bsi-&gt;start == 0)</div><div class='hunk'>@@ -10638,38 +10120,59 @@ static int btrfs_swap_activate(struct swap_info_struct *sis, struct file *file,</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct extent_io_tree *io_tree = &amp;BTRFS_I(inode)-&gt;io_tree;</div><div class='ctx'> 	struct extent_state *cached_state = NULL;</div><div class='del'>-	struct extent_map *em = NULL;</div><div class='add'>+	struct btrfs_chunk_map *map = NULL;</div><div class='ctx'> 	struct btrfs_device *device = NULL;</div><div class='ctx'> 	struct btrfs_swap_info bsi = {</div><div class='ctx'> 		.lowest_ppage = (sector_t)-1ULL,</div><div class='ctx'> 	};</div><div class='add'>+	struct btrfs_backref_share_check_ctx *backref_ctx = NULL;</div><div class='add'>+	struct btrfs_path *path = NULL;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	u64 isize;</div><div class='del'>-	u64 start;</div><div class='add'>+	u64 prev_extent_end = 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Acquire the inode's mmap lock to prevent races with memory mapped</div><div class='add'>+	 * writes, as they could happen after we flush delalloc below and before</div><div class='add'>+	 * we lock the extent range further below. The inode was already locked</div><div class='add'>+	 * up in the call chain.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_assert_inode_locked(BTRFS_I(inode));</div><div class='add'>+	down_write(&amp;BTRFS_I(inode)-&gt;i_mmap_lock);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If the swap file was just created, make sure delalloc is done. If the</div><div class='ctx'> 	 * file changes again after this, the user is doing something stupid and</div><div class='ctx'> 	 * we don't really care.</div><div class='ctx'> 	 */</div><div class='del'>-	ret = btrfs_wait_ordered_range(inode, 0, (u64)-1);</div><div class='add'>+	ret = btrfs_wait_ordered_range(BTRFS_I(inode), 0, (u64)-1);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		return ret;</div><div class='add'>+		goto out_unlock_mmap;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The inode is locked, so these flags won't change after we check them.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (BTRFS_I(inode)-&gt;flags &amp; BTRFS_INODE_COMPRESS) {</div><div class='ctx'> 		btrfs_warn(fs_info, "swapfile must not be compressed");</div><div class='del'>-		return -EINVAL;</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out_unlock_mmap;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!(BTRFS_I(inode)-&gt;flags &amp; BTRFS_INODE_NODATACOW)) {</div><div class='ctx'> 		btrfs_warn(fs_info, "swapfile must not be copy-on-write");</div><div class='del'>-		return -EINVAL;</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out_unlock_mmap;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!(BTRFS_I(inode)-&gt;flags &amp; BTRFS_INODE_NODATASUM)) {</div><div class='ctx'> 		btrfs_warn(fs_info, "swapfile must not be checksummed");</div><div class='del'>-		return -EINVAL;</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out_unlock_mmap;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	path = btrfs_alloc_path();</div><div class='add'>+	backref_ctx = btrfs_alloc_backref_share_check_ctx();</div><div class='add'>+	if (!path || !backref_ctx) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out_unlock_mmap;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -10684,7 +10187,8 @@ static int btrfs_swap_activate(struct swap_info_struct *sis, struct file *file,</div><div class='ctx'> 	if (!btrfs_exclop_start(fs_info, BTRFS_EXCLOP_SWAP_ACTIVATE)) {</div><div class='ctx'> 		btrfs_warn(fs_info,</div><div class='ctx'> 	   "cannot activate swapfile while exclusive operation is running");</div><div class='del'>-		return -EBUSY;</div><div class='add'>+		ret = -EBUSY;</div><div class='add'>+		goto out_unlock_mmap;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -10698,37 +10202,70 @@ static int btrfs_swap_activate(struct swap_info_struct *sis, struct file *file,</div><div class='ctx'> 		btrfs_exclop_finish(fs_info);</div><div class='ctx'> 		btrfs_warn(fs_info,</div><div class='ctx'> 	   "cannot activate swapfile because snapshot creation is in progress");</div><div class='del'>-		return -EINVAL;</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out_unlock_mmap;</div><div class='ctx'> 	}</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Snapshots can create extents which require COW even if NODATACOW is</div><div class='ctx'> 	 * set. We use this counter to prevent snapshots. We must increment it</div><div class='ctx'> 	 * before walking the extents because we don't want a concurrent</div><div class='ctx'> 	 * snapshot to run after we've already checked the extents.</div><div class='add'>+	 *</div><div class='add'>+	 * It is possible that subvolume is marked for deletion but still not</div><div class='add'>+	 * removed yet. To prevent this race, we check the root status before</div><div class='add'>+	 * activating the swapfile.</div><div class='ctx'> 	 */</div><div class='add'>+	spin_lock(&amp;root-&gt;root_item_lock);</div><div class='add'>+	if (btrfs_root_dead(root)) {</div><div class='add'>+		spin_unlock(&amp;root-&gt;root_item_lock);</div><div class='add'>+</div><div class='add'>+		btrfs_drew_write_unlock(&amp;root-&gt;snapshot_lock);</div><div class='add'>+		btrfs_exclop_finish(fs_info);</div><div class='add'>+		btrfs_warn(fs_info,</div><div class='add'>+		"cannot activate swapfile because subvolume %llu is being deleted",</div><div class='add'>+			btrfs_root_id(root));</div><div class='add'>+		ret = -EPERM;</div><div class='add'>+		goto out_unlock_mmap;</div><div class='add'>+	}</div><div class='ctx'> 	atomic_inc(&amp;root-&gt;nr_swapfiles);</div><div class='add'>+	spin_unlock(&amp;root-&gt;root_item_lock);</div><div class='ctx'> </div><div class='ctx'> 	isize = ALIGN_DOWN(inode-&gt;i_size, fs_info-&gt;sectorsize);</div><div class='ctx'> </div><div class='del'>-	lock_extent_bits(io_tree, 0, isize - 1, &amp;cached_state);</div><div class='del'>-	start = 0;</div><div class='del'>-	while (start &lt; isize) {</div><div class='del'>-		u64 logical_block_start, physical_block_start;</div><div class='add'>+	btrfs_lock_extent(io_tree, 0, isize - 1, &amp;cached_state);</div><div class='add'>+	while (prev_extent_end &lt; isize) {</div><div class='add'>+		struct btrfs_key key;</div><div class='add'>+		struct extent_buffer *leaf;</div><div class='add'>+		struct btrfs_file_extent_item *ei;</div><div class='ctx'> 		struct btrfs_block_group *bg;</div><div class='del'>-		u64 len = isize - start;</div><div class='add'>+		u64 logical_block_start;</div><div class='add'>+		u64 physical_block_start;</div><div class='add'>+		u64 extent_gen;</div><div class='add'>+		u64 disk_bytenr;</div><div class='add'>+		u64 len;</div><div class='ctx'> </div><div class='del'>-		em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, start, len);</div><div class='del'>-		if (IS_ERR(em)) {</div><div class='del'>-			ret = PTR_ERR(em);</div><div class='add'>+		key.objectid = btrfs_ino(BTRFS_I(inode));</div><div class='add'>+		key.type = BTRFS_EXTENT_DATA_KEY;</div><div class='add'>+		key.offset = prev_extent_end;</div><div class='add'>+</div><div class='add'>+		ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='add'>+		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='del'>-		}</div><div class='ctx'> </div><div class='del'>-		if (em-&gt;block_start == EXTENT_MAP_HOLE) {</div><div class='add'>+		/*</div><div class='add'>+		 * If key not found it means we have an implicit hole (NO_HOLES</div><div class='add'>+		 * is enabled).</div><div class='add'>+		 */</div><div class='add'>+		if (ret &gt; 0) {</div><div class='ctx'> 			btrfs_warn(fs_info, "swapfile must not have holes");</div><div class='ctx'> 			ret = -EINVAL;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='del'>-		if (em-&gt;block_start == EXTENT_MAP_INLINE) {</div><div class='add'>+</div><div class='add'>+		leaf = path-&gt;nodes[0];</div><div class='add'>+		ei = btrfs_item_ptr(leaf, path-&gt;slots[0], struct btrfs_file_extent_item);</div><div class='add'>+</div><div class='add'>+		if (btrfs_file_extent_type(leaf, ei) == BTRFS_FILE_EXTENT_INLINE) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * It's unlikely we'll ever actually find ourselves</div><div class='ctx'> 			 * here, as a file small enough to fit inline won't be</div><div class='hunk'>@@ -10740,36 +10277,58 @@ static int btrfs_swap_activate(struct swap_info_struct *sis, struct file *file,</div><div class='ctx'> 			ret = -EINVAL;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='del'>-		if (test_bit(EXTENT_FLAG_COMPRESSED, &amp;em-&gt;flags)) {</div><div class='add'>+</div><div class='add'>+		if (btrfs_file_extent_compression(leaf, ei) != BTRFS_COMPRESS_NONE) {</div><div class='ctx'> 			btrfs_warn(fs_info, "swapfile must not be compressed");</div><div class='ctx'> 			ret = -EINVAL;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		logical_block_start = em-&gt;block_start + (start - em-&gt;start);</div><div class='del'>-		len = min(len, em-&gt;len - (start - em-&gt;start));</div><div class='del'>-		free_extent_map(em);</div><div class='del'>-		em = NULL;</div><div class='add'>+		disk_bytenr = btrfs_file_extent_disk_bytenr(leaf, ei);</div><div class='add'>+		if (disk_bytenr == 0) {</div><div class='add'>+			btrfs_warn(fs_info, "swapfile must not have holes");</div><div class='add'>+			ret = -EINVAL;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		logical_block_start = disk_bytenr + btrfs_file_extent_offset(leaf, ei);</div><div class='add'>+		extent_gen = btrfs_file_extent_generation(leaf, ei);</div><div class='add'>+		prev_extent_end = btrfs_file_extent_end(path);</div><div class='add'>+</div><div class='add'>+		if (prev_extent_end &gt; isize)</div><div class='add'>+			len = isize - key.offset;</div><div class='add'>+		else</div><div class='add'>+			len = btrfs_file_extent_num_bytes(leaf, ei);</div><div class='ctx'> </div><div class='del'>-		ret = can_nocow_extent(inode, start, &amp;len, NULL, NULL, NULL, true);</div><div class='add'>+		backref_ctx-&gt;curr_leaf_bytenr = leaf-&gt;start;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Don't need the path anymore, release to avoid deadlocks when</div><div class='add'>+		 * calling btrfs_is_data_extent_shared() because when joining a</div><div class='add'>+		 * transaction it can block waiting for the current one's commit</div><div class='add'>+		 * which in turn may be trying to lock the same leaf to flush</div><div class='add'>+		 * delayed items for example.</div><div class='add'>+		 */</div><div class='add'>+		btrfs_release_path(path);</div><div class='add'>+</div><div class='add'>+		ret = btrfs_is_data_extent_shared(BTRFS_I(inode), disk_bytenr,</div><div class='add'>+						  extent_gen, backref_ctx);</div><div class='ctx'> 		if (ret &lt; 0) {</div><div class='ctx'> 			goto out;</div><div class='del'>-		} else if (ret) {</div><div class='del'>-			ret = 0;</div><div class='del'>-		} else {</div><div class='add'>+		} else if (ret &gt; 0) {</div><div class='ctx'> 			btrfs_warn(fs_info,</div><div class='ctx'> 				   "swapfile must not be copy-on-write");</div><div class='ctx'> 			ret = -EINVAL;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		em = btrfs_get_chunk_map(fs_info, logical_block_start, len);</div><div class='del'>-		if (IS_ERR(em)) {</div><div class='del'>-			ret = PTR_ERR(em);</div><div class='add'>+		map = btrfs_get_chunk_map(fs_info, logical_block_start, len);</div><div class='add'>+		if (IS_ERR(map)) {</div><div class='add'>+			ret = PTR_ERR(map);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (em-&gt;map_lookup-&gt;type &amp; BTRFS_BLOCK_GROUP_PROFILE_MASK) {</div><div class='add'>+		if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_PROFILE_MASK) {</div><div class='ctx'> 			btrfs_warn(fs_info,</div><div class='ctx'> 				   "swapfile must have single data profile");</div><div class='ctx'> 			ret = -EINVAL;</div><div class='hunk'>@@ -10777,23 +10336,22 @@ static int btrfs_swap_activate(struct swap_info_struct *sis, struct file *file,</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (device == NULL) {</div><div class='del'>-			device = em-&gt;map_lookup-&gt;stripes[0].dev;</div><div class='add'>+			device = map-&gt;stripes[0].dev;</div><div class='ctx'> 			ret = btrfs_add_swapfile_pin(inode, device, false);</div><div class='ctx'> 			if (ret == 1)</div><div class='ctx'> 				ret = 0;</div><div class='ctx'> 			else if (ret)</div><div class='ctx'> 				goto out;</div><div class='del'>-		} else if (device != em-&gt;map_lookup-&gt;stripes[0].dev) {</div><div class='add'>+		} else if (device != map-&gt;stripes[0].dev) {</div><div class='ctx'> 			btrfs_warn(fs_info, "swapfile must be on one device");</div><div class='ctx'> 			ret = -EINVAL;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		physical_block_start = (em-&gt;map_lookup-&gt;stripes[0].physical +</div><div class='del'>-					(logical_block_start - em-&gt;start));</div><div class='del'>-		len = min(len, em-&gt;len - (logical_block_start - em-&gt;start));</div><div class='del'>-		free_extent_map(em);</div><div class='del'>-		em = NULL;</div><div class='add'>+		physical_block_start = (map-&gt;stripes[0].physical +</div><div class='add'>+					(logical_block_start - map-&gt;start));</div><div class='add'>+		btrfs_free_chunk_map(map);</div><div class='add'>+		map = NULL;</div><div class='ctx'> </div><div class='ctx'> 		bg = btrfs_lookup_block_group(fs_info, logical_block_start);</div><div class='ctx'> 		if (!bg) {</div><div class='hunk'>@@ -10832,22 +10390,27 @@ static int btrfs_swap_activate(struct swap_info_struct *sis, struct file *file,</div><div class='ctx'> 				if (ret)</div><div class='ctx'> 					goto out;</div><div class='ctx'> 			}</div><div class='del'>-			bsi.start = start;</div><div class='add'>+			bsi.start = key.offset;</div><div class='ctx'> 			bsi.block_start = physical_block_start;</div><div class='ctx'> 			bsi.block_len = len;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		start += len;</div><div class='add'>+		if (fatal_signal_pending(current)) {</div><div class='add'>+			ret = -EINTR;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		cond_resched();</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (bsi.block_len)</div><div class='ctx'> 		ret = btrfs_add_swap_extent(sis, &amp;bsi);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	if (!IS_ERR_OR_NULL(em))</div><div class='del'>-		free_extent_map(em);</div><div class='add'>+	if (!IS_ERR_OR_NULL(map))</div><div class='add'>+		btrfs_free_chunk_map(map);</div><div class='ctx'> </div><div class='del'>-	unlock_extent_cached(io_tree, 0, isize - 1, &amp;cached_state);</div><div class='add'>+	btrfs_unlock_extent(io_tree, 0, isize - 1, &amp;cached_state);</div><div class='ctx'> </div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		btrfs_swap_deactivate(file);</div><div class='hunk'>@@ -10856,6 +10419,10 @@ out:</div><div class='ctx'> </div><div class='ctx'> 	btrfs_exclop_finish(fs_info);</div><div class='ctx'> </div><div class='add'>+out_unlock_mmap:</div><div class='add'>+	up_write(&amp;BTRFS_I(inode)-&gt;i_mmap_lock);</div><div class='add'>+	btrfs_free_backref_share_ctx(backref_ctx);</div><div class='add'>+	btrfs_free_path(path);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='hunk'>@@ -10864,7 +10431,6 @@ out:</div><div class='ctx'> 	*span = bsi.highest_ppage - bsi.lowest_ppage + 1;</div><div class='ctx'> 	sis-&gt;max = bsi.nr_pages;</div><div class='ctx'> 	sis-&gt;pages = bsi.nr_pages - 1;</div><div class='del'>-	sis-&gt;highest_bit = bsi.nr_pages - 1;</div><div class='ctx'> 	return bsi.nr_extents;</div><div class='ctx'> }</div><div class='ctx'> #else</div><div class='hunk'>@@ -10900,6 +10466,71 @@ void btrfs_update_inode_bytes(struct btrfs_inode *inode,</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Verify that there are no ordered extents for a given file range.</div><div class='add'>+ *</div><div class='add'>+ * @inode:   The target inode.</div><div class='add'>+ * @start:   Start offset of the file range, should be sector size aligned.</div><div class='add'>+ * @end:     End offset (inclusive) of the file range, its value +1 should be</div><div class='add'>+ *           sector size aligned.</div><div class='add'>+ *</div><div class='add'>+ * This should typically be used for cases where we locked an inode's VFS lock in</div><div class='add'>+ * exclusive mode, we have also locked the inode's i_mmap_lock in exclusive mode,</div><div class='add'>+ * we have flushed all delalloc in the range, we have waited for all ordered</div><div class='add'>+ * extents in the range to complete and finally we have locked the file range in</div><div class='add'>+ * the inode's io_tree.</div><div class='add'>+ */</div><div class='add'>+void btrfs_assert_inode_range_clean(struct btrfs_inode *inode, u64 start, u64 end)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	struct btrfs_ordered_extent *ordered;</div><div class='add'>+</div><div class='add'>+	if (!IS_ENABLED(CONFIG_BTRFS_ASSERT))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	ordered = btrfs_lookup_first_ordered_range(inode, start, end + 1 - start);</div><div class='add'>+	if (ordered) {</div><div class='add'>+		btrfs_err(root-&gt;fs_info,</div><div class='add'>+"found unexpected ordered extent in file range [%llu, %llu] for inode %llu root %llu (ordered range [%llu, %llu])",</div><div class='add'>+			  start, end, btrfs_ino(inode), btrfs_root_id(root),</div><div class='add'>+			  ordered-&gt;file_offset,</div><div class='add'>+			  ordered-&gt;file_offset + ordered-&gt;num_bytes - 1);</div><div class='add'>+		btrfs_put_ordered_extent(ordered);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ASSERT(ordered == NULL);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Find the first inode with a minimum number.</div><div class='add'>+ *</div><div class='add'>+ * @root:	The root to search for.</div><div class='add'>+ * @min_ino:	The minimum inode number.</div><div class='add'>+ *</div><div class='add'>+ * Find the first inode in the @root with a number &gt;= @min_ino and return it.</div><div class='add'>+ * Returns NULL if no such inode found.</div><div class='add'>+ */</div><div class='add'>+struct btrfs_inode *btrfs_find_first_inode(struct btrfs_root *root, u64 min_ino)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_inode *inode;</div><div class='add'>+	unsigned long from = min_ino;</div><div class='add'>+</div><div class='add'>+	xa_lock(&amp;root-&gt;inodes);</div><div class='add'>+	while (true) {</div><div class='add'>+		inode = xa_find(&amp;root-&gt;inodes, &amp;from, ULONG_MAX, XA_PRESENT);</div><div class='add'>+		if (!inode)</div><div class='add'>+			break;</div><div class='add'>+		if (igrab(&amp;inode-&gt;vfs_inode))</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		from = btrfs_ino(inode) + 1;</div><div class='add'>+		cond_resched_lock(&amp;root-&gt;inodes.xa_lock);</div><div class='add'>+	}</div><div class='add'>+	xa_unlock(&amp;root-&gt;inodes);</div><div class='add'>+</div><div class='add'>+	return inode;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static const struct inode_operations btrfs_dir_inode_operations = {</div><div class='ctx'> 	.getattr	= btrfs_getattr,</div><div class='ctx'> 	.lookup		= btrfs_lookup,</div><div class='hunk'>@@ -10914,7 +10545,7 @@ static const struct inode_operations btrfs_dir_inode_operations = {</div><div class='ctx'> 	.mknod		= btrfs_mknod,</div><div class='ctx'> 	.listxattr	= btrfs_listxattr,</div><div class='ctx'> 	.permission	= btrfs_permission,</div><div class='del'>-	.get_acl	= btrfs_get_acl,</div><div class='add'>+	.get_inode_acl	= btrfs_get_acl,</div><div class='ctx'> 	.set_acl	= btrfs_set_acl,</div><div class='ctx'> 	.update_time	= btrfs_update_time,</div><div class='ctx'> 	.tmpfile        = btrfs_tmpfile,</div><div class='hunk'>@@ -10923,7 +10554,7 @@ static const struct inode_operations btrfs_dir_inode_operations = {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct file_operations btrfs_dir_file_operations = {</div><div class='del'>-	.llseek		= generic_file_llseek,</div><div class='add'>+	.llseek		= btrfs_dir_llseek,</div><div class='ctx'> 	.read		= generic_read_dir,</div><div class='ctx'> 	.iterate_shared	= btrfs_real_readdir,</div><div class='ctx'> 	.open		= btrfs_opendir,</div><div class='hunk'>@@ -10948,18 +10579,15 @@ static const struct file_operations btrfs_dir_file_operations = {</div><div class='ctx'>  * For now we're avoiding this by dropping bmap.</div><div class='ctx'>  */</div><div class='ctx'> static const struct address_space_operations btrfs_aops = {</div><div class='del'>-	.readpage	= btrfs_readpage,</div><div class='del'>-	.writepage	= btrfs_writepage,</div><div class='add'>+	.read_folio	= btrfs_read_folio,</div><div class='ctx'> 	.writepages	= btrfs_writepages,</div><div class='ctx'> 	.readahead	= btrfs_readahead,</div><div class='del'>-	.direct_IO	= noop_direct_IO,</div><div class='del'>-	.invalidatepage = btrfs_invalidatepage,</div><div class='del'>-	.releasepage	= btrfs_releasepage,</div><div class='del'>-#ifdef CONFIG_MIGRATION</div><div class='del'>-	.migratepage	= btrfs_migratepage,</div><div class='del'>-#endif</div><div class='del'>-	.set_page_dirty	= btrfs_set_page_dirty,</div><div class='del'>-	.error_remove_page = generic_error_remove_page,</div><div class='add'>+	.invalidate_folio = btrfs_invalidate_folio,</div><div class='add'>+	.launder_folio	= btrfs_launder_folio,</div><div class='add'>+	.release_folio	= btrfs_release_folio,</div><div class='add'>+	.migrate_folio	= btrfs_migrate_folio,</div><div class='add'>+	.dirty_folio	= filemap_dirty_folio,</div><div class='add'>+	.error_remove_folio = generic_error_remove_folio,</div><div class='ctx'> 	.swap_activate	= btrfs_swap_activate,</div><div class='ctx'> 	.swap_deactivate = btrfs_swap_deactivate,</div><div class='ctx'> };</div><div class='hunk'>@@ -10970,7 +10598,7 @@ static const struct inode_operations btrfs_file_inode_operations = {</div><div class='ctx'> 	.listxattr      = btrfs_listxattr,</div><div class='ctx'> 	.permission	= btrfs_permission,</div><div class='ctx'> 	.fiemap		= btrfs_fiemap,</div><div class='del'>-	.get_acl	= btrfs_get_acl,</div><div class='add'>+	.get_inode_acl	= btrfs_get_acl,</div><div class='ctx'> 	.set_acl	= btrfs_set_acl,</div><div class='ctx'> 	.update_time	= btrfs_update_time,</div><div class='ctx'> 	.fileattr_get	= btrfs_fileattr_get,</div><div class='hunk'>@@ -10981,7 +10609,7 @@ static const struct inode_operations btrfs_special_inode_operations = {</div><div class='ctx'> 	.setattr	= btrfs_setattr,</div><div class='ctx'> 	.permission	= btrfs_permission,</div><div class='ctx'> 	.listxattr	= btrfs_listxattr,</div><div class='del'>-	.get_acl	= btrfs_get_acl,</div><div class='add'>+	.get_inode_acl	= btrfs_get_acl,</div><div class='ctx'> 	.set_acl	= btrfs_set_acl,</div><div class='ctx'> 	.update_time	= btrfs_update_time,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/btrfs/ioctl.c b/fs/btrfs/ioctl.c<br/>index fb8cc9642ac4..acb484546b1d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/ioctl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/ioctl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/ioctl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/ioctl.c</a></div><div class='hunk'>@@ -28,16 +28,16 @@</div><div class='ctx'> #include &lt;linux/iversion.h&gt;</div><div class='ctx'> #include &lt;linux/fileattr.h&gt;</div><div class='ctx'> #include &lt;linux/fsverity.h&gt;</div><div class='add'>+#include &lt;linux/sched/xacct.h&gt;</div><div class='add'>+#include &lt;linux/io_uring/cmd.h&gt;</div><div class='ctx'> #include "ctree.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='ctx'> #include "export.h"</div><div class='ctx'> #include "transaction.h"</div><div class='ctx'> #include "btrfs_inode.h"</div><div class='del'>-#include "print-tree.h"</div><div class='ctx'> #include "volumes.h"</div><div class='ctx'> #include "locking.h"</div><div class='ctx'> #include "backref.h"</div><div class='del'>-#include "rcu-string.h"</div><div class='ctx'> #include "send.h"</div><div class='ctx'> #include "dev-replace.h"</div><div class='ctx'> #include "props.h"</div><div class='hunk'>@@ -46,9 +46,18 @@</div><div class='ctx'> #include "tree-log.h"</div><div class='ctx'> #include "compression.h"</div><div class='ctx'> #include "space-info.h"</div><div class='del'>-#include "delalloc-space.h"</div><div class='ctx'> #include "block-group.h"</div><div class='del'>-#include "subpage.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "extent-tree.h"</div><div class='add'>+#include "root-tree.h"</div><div class='add'>+#include "defrag.h"</div><div class='add'>+#include "dir-item.h"</div><div class='add'>+#include "uuid-tree.h"</div><div class='add'>+#include "ioctl.h"</div><div class='add'>+#include "file.h"</div><div class='add'>+#include "scrub.h"</div><div class='add'>+#include "super.h"</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_64BIT</div><div class='ctx'> /* If we have a 32-bit userspace and 64-bit kernel, then the UAPI</div><div class='hunk'>@@ -88,11 +97,29 @@ struct btrfs_ioctl_send_args_32 {</div><div class='ctx'> </div><div class='ctx'> #define BTRFS_IOC_SEND_32 _IOW(BTRFS_IOCTL_MAGIC, 38, \</div><div class='ctx'> 			       struct btrfs_ioctl_send_args_32)</div><div class='add'>+</div><div class='add'>+struct btrfs_ioctl_encoded_io_args_32 {</div><div class='add'>+	compat_uptr_t iov;</div><div class='add'>+	compat_ulong_t iovcnt;</div><div class='add'>+	__s64 offset;</div><div class='add'>+	__u64 flags;</div><div class='add'>+	__u64 len;</div><div class='add'>+	__u64 unencoded_len;</div><div class='add'>+	__u64 unencoded_offset;</div><div class='add'>+	__u32 compression;</div><div class='add'>+	__u32 encryption;</div><div class='add'>+	__u8 reserved[64];</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+#define BTRFS_IOC_ENCODED_READ_32 _IOR(BTRFS_IOCTL_MAGIC, 64, \</div><div class='add'>+				       struct btrfs_ioctl_encoded_io_args_32)</div><div class='add'>+#define BTRFS_IOC_ENCODED_WRITE_32 _IOW(BTRFS_IOCTL_MAGIC, 64, \</div><div class='add'>+					struct btrfs_ioctl_encoded_io_args_32)</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> /* Mask out flags that are inappropriate for the given type of inode. */</div><div class='del'>-static unsigned int btrfs_mask_fsflags_for_type(struct inode *inode,</div><div class='del'>-		unsigned int flags)</div><div class='add'>+static unsigned int btrfs_mask_fsflags_for_type(const struct inode *inode,</div><div class='add'>+						unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	if (S_ISDIR(inode-&gt;i_mode))</div><div class='ctx'> 		return flags;</div><div class='hunk'>@@ -106,11 +133,11 @@ static unsigned int btrfs_mask_fsflags_for_type(struct inode *inode,</div><div class='ctx'>  * Export internal inode flags to the format expected by the FS_IOC_GETFLAGS</div><div class='ctx'>  * ioctl.</div><div class='ctx'>  */</div><div class='del'>-static unsigned int btrfs_inode_flags_to_fsflags(struct btrfs_inode *binode)</div><div class='add'>+static unsigned int btrfs_inode_flags_to_fsflags(const struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int iflags = 0;</div><div class='del'>-	u32 flags = binode-&gt;flags;</div><div class='del'>-	u32 ro_flags = binode-&gt;ro_flags;</div><div class='add'>+	u32 flags = inode-&gt;flags;</div><div class='add'>+	u32 ro_flags = inode-&gt;ro_flags;</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; BTRFS_INODE_SYNC)</div><div class='ctx'> 		iflags |= FS_SYNC_FL;</div><div class='hunk'>@@ -140,25 +167,24 @@ static unsigned int btrfs_inode_flags_to_fsflags(struct btrfs_inode *binode)</div><div class='ctx'> /*</div><div class='ctx'>  * Update inode-&gt;i_flags based on the btrfs internal flags.</div><div class='ctx'>  */</div><div class='del'>-void btrfs_sync_inode_flags_to_i_flags(struct inode *inode)</div><div class='add'>+void btrfs_sync_inode_flags_to_i_flags(struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_inode *binode = BTRFS_I(inode);</div><div class='ctx'> 	unsigned int new_fl = 0;</div><div class='ctx'> </div><div class='del'>-	if (binode-&gt;flags &amp; BTRFS_INODE_SYNC)</div><div class='add'>+	if (inode-&gt;flags &amp; BTRFS_INODE_SYNC)</div><div class='ctx'> 		new_fl |= S_SYNC;</div><div class='del'>-	if (binode-&gt;flags &amp; BTRFS_INODE_IMMUTABLE)</div><div class='add'>+	if (inode-&gt;flags &amp; BTRFS_INODE_IMMUTABLE)</div><div class='ctx'> 		new_fl |= S_IMMUTABLE;</div><div class='del'>-	if (binode-&gt;flags &amp; BTRFS_INODE_APPEND)</div><div class='add'>+	if (inode-&gt;flags &amp; BTRFS_INODE_APPEND)</div><div class='ctx'> 		new_fl |= S_APPEND;</div><div class='del'>-	if (binode-&gt;flags &amp; BTRFS_INODE_NOATIME)</div><div class='add'>+	if (inode-&gt;flags &amp; BTRFS_INODE_NOATIME)</div><div class='ctx'> 		new_fl |= S_NOATIME;</div><div class='del'>-	if (binode-&gt;flags &amp; BTRFS_INODE_DIRSYNC)</div><div class='add'>+	if (inode-&gt;flags &amp; BTRFS_INODE_DIRSYNC)</div><div class='ctx'> 		new_fl |= S_DIRSYNC;</div><div class='del'>-	if (binode-&gt;ro_flags &amp; BTRFS_INODE_RO_VERITY)</div><div class='add'>+	if (inode-&gt;ro_flags &amp; BTRFS_INODE_RO_VERITY)</div><div class='ctx'> 		new_fl |= S_VERITY;</div><div class='ctx'> </div><div class='del'>-	set_mask_bits(&amp;inode-&gt;i_flags,</div><div class='add'>+	set_mask_bits(&amp;inode-&gt;vfs_inode.i_flags,</div><div class='ctx'> 		      S_SYNC | S_APPEND | S_IMMUTABLE | S_NOATIME | S_DIRSYNC |</div><div class='ctx'> 		      S_VERITY, new_fl);</div><div class='ctx'> }</div><div class='hunk'>@@ -192,7 +218,7 @@ static int check_fsflags(unsigned int old_flags, unsigned int flags)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int check_fsflags_compatible(struct btrfs_fs_info *fs_info,</div><div class='add'>+static int check_fsflags_compatible(const struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				    unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	if (btrfs_is_zoned(fs_info) &amp;&amp; (flags &amp; FS_NOCOW_FL))</div><div class='hunk'>@@ -201,30 +227,43 @@ static int check_fsflags_compatible(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+int btrfs_check_ioctl_vol_args_path(const struct btrfs_ioctl_vol_args *vol_args)</div><div class='add'>+{</div><div class='add'>+	if (memchr(vol_args-&gt;name, 0, sizeof(vol_args-&gt;name)) == NULL)</div><div class='add'>+		return -ENAMETOOLONG;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int btrfs_check_ioctl_vol_args2_subvol_name(const struct btrfs_ioctl_vol_args_v2 *vol_args2)</div><div class='add'>+{</div><div class='add'>+	if (memchr(vol_args2-&gt;name, 0, sizeof(vol_args2-&gt;name)) == NULL)</div><div class='add'>+		return -ENAMETOOLONG;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Set flags/xflags from the internal inode flags. The remaining items of</div><div class='ctx'>  * fsxattr are zeroed.</div><div class='ctx'>  */</div><div class='del'>-int btrfs_fileattr_get(struct dentry *dentry, struct fileattr *fa)</div><div class='add'>+int btrfs_fileattr_get(struct dentry *dentry, struct file_kattr *fa)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_inode *binode = BTRFS_I(d_inode(dentry));</div><div class='add'>+	const struct btrfs_inode *inode = BTRFS_I(d_inode(dentry));</div><div class='ctx'> </div><div class='del'>-	fileattr_fill_flags(fa, btrfs_inode_flags_to_fsflags(binode));</div><div class='add'>+	fileattr_fill_flags(fa, btrfs_inode_flags_to_fsflags(inode));</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_fileattr_set(struct user_namespace *mnt_userns,</div><div class='del'>-		       struct dentry *dentry, struct fileattr *fa)</div><div class='add'>+int btrfs_fileattr_set(struct mnt_idmap *idmap,</div><div class='add'>+		       struct dentry *dentry, struct file_kattr *fa)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = d_inode(dentry);</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	struct btrfs_inode *binode = BTRFS_I(inode);</div><div class='del'>-	struct btrfs_root *root = binode-&gt;root;</div><div class='add'>+	struct btrfs_inode *inode = BTRFS_I(d_inode(dentry));</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	unsigned int fsflags, old_fsflags;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	const char *comp = NULL;</div><div class='del'>-	u32 binode_flags;</div><div class='add'>+	u32 inode_flags;</div><div class='ctx'> </div><div class='ctx'> 	if (btrfs_root_readonly(root))</div><div class='ctx'> 		return -EROFS;</div><div class='hunk'>@@ -232,8 +271,8 @@ int btrfs_fileattr_set(struct user_namespace *mnt_userns,</div><div class='ctx'> 	if (fileattr_has_fsx(fa))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='del'>-	fsflags = btrfs_mask_fsflags_for_type(inode, fa-&gt;flags);</div><div class='del'>-	old_fsflags = btrfs_inode_flags_to_fsflags(binode);</div><div class='add'>+	fsflags = btrfs_mask_fsflags_for_type(&amp;inode-&gt;vfs_inode, fa-&gt;flags);</div><div class='add'>+	old_fsflags = btrfs_inode_flags_to_fsflags(inode);</div><div class='ctx'> 	ret = check_fsflags(old_fsflags, fsflags);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -242,27 +281,27 @@ int btrfs_fileattr_set(struct user_namespace *mnt_userns,</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	binode_flags = binode-&gt;flags;</div><div class='add'>+	inode_flags = inode-&gt;flags;</div><div class='ctx'> 	if (fsflags &amp; FS_SYNC_FL)</div><div class='del'>-		binode_flags |= BTRFS_INODE_SYNC;</div><div class='add'>+		inode_flags |= BTRFS_INODE_SYNC;</div><div class='ctx'> 	else</div><div class='del'>-		binode_flags &amp;= ~BTRFS_INODE_SYNC;</div><div class='add'>+		inode_flags &amp;= ~BTRFS_INODE_SYNC;</div><div class='ctx'> 	if (fsflags &amp; FS_IMMUTABLE_FL)</div><div class='del'>-		binode_flags |= BTRFS_INODE_IMMUTABLE;</div><div class='add'>+		inode_flags |= BTRFS_INODE_IMMUTABLE;</div><div class='ctx'> 	else</div><div class='del'>-		binode_flags &amp;= ~BTRFS_INODE_IMMUTABLE;</div><div class='add'>+		inode_flags &amp;= ~BTRFS_INODE_IMMUTABLE;</div><div class='ctx'> 	if (fsflags &amp; FS_APPEND_FL)</div><div class='del'>-		binode_flags |= BTRFS_INODE_APPEND;</div><div class='add'>+		inode_flags |= BTRFS_INODE_APPEND;</div><div class='ctx'> 	else</div><div class='del'>-		binode_flags &amp;= ~BTRFS_INODE_APPEND;</div><div class='add'>+		inode_flags &amp;= ~BTRFS_INODE_APPEND;</div><div class='ctx'> 	if (fsflags &amp; FS_NODUMP_FL)</div><div class='del'>-		binode_flags |= BTRFS_INODE_NODUMP;</div><div class='add'>+		inode_flags |= BTRFS_INODE_NODUMP;</div><div class='ctx'> 	else</div><div class='del'>-		binode_flags &amp;= ~BTRFS_INODE_NODUMP;</div><div class='add'>+		inode_flags &amp;= ~BTRFS_INODE_NODUMP;</div><div class='ctx'> 	if (fsflags &amp; FS_NOATIME_FL)</div><div class='del'>-		binode_flags |= BTRFS_INODE_NOATIME;</div><div class='add'>+		inode_flags |= BTRFS_INODE_NOATIME;</div><div class='ctx'> 	else</div><div class='del'>-		binode_flags &amp;= ~BTRFS_INODE_NOATIME;</div><div class='add'>+		inode_flags &amp;= ~BTRFS_INODE_NOATIME;</div><div class='ctx'> </div><div class='ctx'> 	/* If coming from FS_IOC_FSSETXATTR then skip unconverted flags */</div><div class='ctx'> 	if (!fa-&gt;flags_valid) {</div><div class='hunk'>@@ -274,32 +313,32 @@ int btrfs_fileattr_set(struct user_namespace *mnt_userns,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (fsflags &amp; FS_DIRSYNC_FL)</div><div class='del'>-		binode_flags |= BTRFS_INODE_DIRSYNC;</div><div class='add'>+		inode_flags |= BTRFS_INODE_DIRSYNC;</div><div class='ctx'> 	else</div><div class='del'>-		binode_flags &amp;= ~BTRFS_INODE_DIRSYNC;</div><div class='add'>+		inode_flags &amp;= ~BTRFS_INODE_DIRSYNC;</div><div class='ctx'> 	if (fsflags &amp; FS_NOCOW_FL) {</div><div class='del'>-		if (S_ISREG(inode-&gt;i_mode)) {</div><div class='add'>+		if (S_ISREG(inode-&gt;vfs_inode.i_mode)) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * It's safe to turn csums off here, no extents exist.</div><div class='ctx'> 			 * Otherwise we want the flag to reflect the real COW</div><div class='ctx'> 			 * status of the file and will not set it.</div><div class='ctx'> 			 */</div><div class='del'>-			if (inode-&gt;i_size == 0)</div><div class='del'>-				binode_flags |= BTRFS_INODE_NODATACOW |</div><div class='del'>-						BTRFS_INODE_NODATASUM;</div><div class='add'>+			if (inode-&gt;vfs_inode.i_size == 0)</div><div class='add'>+				inode_flags |= BTRFS_INODE_NODATACOW |</div><div class='add'>+					       BTRFS_INODE_NODATASUM;</div><div class='ctx'> 		} else {</div><div class='del'>-			binode_flags |= BTRFS_INODE_NODATACOW;</div><div class='add'>+			inode_flags |= BTRFS_INODE_NODATACOW;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Revert back under same assumptions as above</div><div class='ctx'> 		 */</div><div class='del'>-		if (S_ISREG(inode-&gt;i_mode)) {</div><div class='del'>-			if (inode-&gt;i_size == 0)</div><div class='del'>-				binode_flags &amp;= ~(BTRFS_INODE_NODATACOW |</div><div class='del'>-						  BTRFS_INODE_NODATASUM);</div><div class='add'>+		if (S_ISREG(inode-&gt;vfs_inode.i_mode)) {</div><div class='add'>+			if (inode-&gt;vfs_inode.i_size == 0)</div><div class='add'>+				inode_flags &amp;= ~(BTRFS_INODE_NODATACOW |</div><div class='add'>+						 BTRFS_INODE_NODATASUM);</div><div class='ctx'> 		} else {</div><div class='del'>-			binode_flags &amp;= ~BTRFS_INODE_NODATACOW;</div><div class='add'>+			inode_flags &amp;= ~BTRFS_INODE_NODATACOW;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -309,21 +348,21 @@ int btrfs_fileattr_set(struct user_namespace *mnt_userns,</div><div class='ctx'> 	 * things smaller.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (fsflags &amp; FS_NOCOMP_FL) {</div><div class='del'>-		binode_flags &amp;= ~BTRFS_INODE_COMPRESS;</div><div class='del'>-		binode_flags |= BTRFS_INODE_NOCOMPRESS;</div><div class='add'>+		inode_flags &amp;= ~BTRFS_INODE_COMPRESS;</div><div class='add'>+		inode_flags |= BTRFS_INODE_NOCOMPRESS;</div><div class='ctx'> 	} else if (fsflags &amp; FS_COMPR_FL) {</div><div class='ctx'> </div><div class='del'>-		if (IS_SWAPFILE(inode))</div><div class='add'>+		if (IS_SWAPFILE(&amp;inode-&gt;vfs_inode))</div><div class='ctx'> 			return -ETXTBSY;</div><div class='ctx'> </div><div class='del'>-		binode_flags |= BTRFS_INODE_COMPRESS;</div><div class='del'>-		binode_flags &amp;= ~BTRFS_INODE_NOCOMPRESS;</div><div class='add'>+		inode_flags |= BTRFS_INODE_COMPRESS;</div><div class='add'>+		inode_flags &amp;= ~BTRFS_INODE_NOCOMPRESS;</div><div class='ctx'> </div><div class='ctx'> 		comp = btrfs_compress_type2str(fs_info-&gt;compress_type);</div><div class='ctx'> 		if (!comp || comp[0] == 0)</div><div class='ctx'> 			comp = btrfs_compress_type2str(BTRFS_COMPRESS_ZLIB);</div><div class='ctx'> 	} else {</div><div class='del'>-		binode_flags &amp;= ~(BTRFS_INODE_COMPRESS | BTRFS_INODE_NOCOMPRESS);</div><div class='add'>+		inode_flags &amp;= ~(BTRFS_INODE_COMPRESS | BTRFS_INODE_NOCOMPRESS);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -335,89 +374,35 @@ int btrfs_fileattr_set(struct user_namespace *mnt_userns,</div><div class='ctx'> 		return PTR_ERR(trans);</div><div class='ctx'> </div><div class='ctx'> 	if (comp) {</div><div class='del'>-		ret = btrfs_set_prop(trans, inode, "btrfs.compression", comp,</div><div class='del'>-				     strlen(comp), 0);</div><div class='del'>-		if (ret) {</div><div class='add'>+		ret = btrfs_set_prop(trans, inode, "btrfs.compression",</div><div class='add'>+				     comp, strlen(comp), 0);</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out_end_trans;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='del'>-		ret = btrfs_set_prop(trans, inode, "btrfs.compression", NULL,</div><div class='del'>-				     0, 0);</div><div class='del'>-		if (ret &amp;&amp; ret != -ENODATA) {</div><div class='add'>+		ret = btrfs_set_prop(trans, inode, "btrfs.compression", NULL, 0, 0);</div><div class='add'>+		if (unlikely(ret &amp;&amp; ret != -ENODATA)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out_end_trans;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> update_flags:</div><div class='del'>-	binode-&gt;flags = binode_flags;</div><div class='add'>+	inode-&gt;flags = inode_flags;</div><div class='add'>+	btrfs_update_inode_mapping_flags(inode);</div><div class='ctx'> 	btrfs_sync_inode_flags_to_i_flags(inode);</div><div class='del'>-	inode_inc_iversion(inode);</div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='del'>-	ret = btrfs_update_inode(trans, root, BTRFS_I(inode));</div><div class='add'>+	inode_inc_iversion(&amp;inode-&gt;vfs_inode);</div><div class='add'>+	inode_set_ctime_current(&amp;inode-&gt;vfs_inode);</div><div class='add'>+	ret = btrfs_update_inode(trans, inode);</div><div class='ctx'> </div><div class='ctx'>  out_end_trans:</div><div class='ctx'> 	btrfs_end_transaction(trans);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Start exclusive operation @type, return true on success</div><div class='del'>- */</div><div class='del'>-bool btrfs_exclop_start(struct btrfs_fs_info *fs_info,</div><div class='del'>-			enum btrfs_exclusive_operation type)</div><div class='del'>-{</div><div class='del'>-	bool ret = false;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;fs_info-&gt;super_lock);</div><div class='del'>-	if (fs_info-&gt;exclusive_operation == BTRFS_EXCLOP_NONE) {</div><div class='del'>-		fs_info-&gt;exclusive_operation = type;</div><div class='del'>-		ret = true;</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;super_lock);</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Conditionally allow to enter the exclusive operation in case it's compatible</div><div class='del'>- * with the running one.  This must be paired with btrfs_exclop_start_unlock and</div><div class='del'>- * btrfs_exclop_finish.</div><div class='del'>- *</div><div class='del'>- * Compatibility:</div><div class='del'>- * - the same type is already running</div><div class='del'>- * - not BTRFS_EXCLOP_NONE - this is intentionally incompatible and the caller</div><div class='del'>- *   must check the condition first that would allow none -&gt; @type</div><div class='del'>- */</div><div class='del'>-bool btrfs_exclop_start_try_lock(struct btrfs_fs_info *fs_info,</div><div class='del'>-				 enum btrfs_exclusive_operation type)</div><div class='del'>-{</div><div class='del'>-	spin_lock(&amp;fs_info-&gt;super_lock);</div><div class='del'>-	if (fs_info-&gt;exclusive_operation == type)</div><div class='del'>-		return true;</div><div class='del'>-</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;super_lock);</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void btrfs_exclop_start_unlock(struct btrfs_fs_info *fs_info)</div><div class='add'>+static int btrfs_ioctl_getversion(const struct inode *inode, int __user *arg)</div><div class='ctx'> {</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;super_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void btrfs_exclop_finish(struct btrfs_fs_info *fs_info)</div><div class='del'>-{</div><div class='del'>-	spin_lock(&amp;fs_info-&gt;super_lock);</div><div class='del'>-	WRITE_ONCE(fs_info-&gt;exclusive_operation, BTRFS_EXCLOP_NONE);</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;super_lock);</div><div class='del'>-	sysfs_notify(&amp;fs_info-&gt;fs_devices-&gt;fsid_kobj, NULL, "exclusive_operation");</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int btrfs_ioctl_getversion(struct file *file, int __user *arg)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = file_inode(file);</div><div class='del'>-</div><div class='ctx'> 	return put_user(inode-&gt;i_generation, arg);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -425,7 +410,6 @@ static noinline int btrfs_ioctl_fitrim(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 					void __user *arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_device *device;</div><div class='del'>-	struct request_queue *q;</div><div class='ctx'> 	struct fstrim_range range;</div><div class='ctx'> 	u64 minlen = ULLONG_MAX;</div><div class='ctx'> 	u64 num_devices = 0;</div><div class='hunk'>@@ -455,14 +439,11 @@ static noinline int btrfs_ioctl_fitrim(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	rcu_read_lock();</div><div class='ctx'> 	list_for_each_entry_rcu(device, &amp;fs_info-&gt;fs_devices-&gt;devices,</div><div class='ctx'> 				dev_list) {</div><div class='del'>-		if (!device-&gt;bdev)</div><div class='add'>+		if (!device-&gt;bdev || !bdev_max_discard_sectors(device-&gt;bdev))</div><div class='ctx'> 			continue;</div><div class='del'>-		q = bdev_get_queue(device-&gt;bdev);</div><div class='del'>-		if (blk_queue_discard(q)) {</div><div class='del'>-			num_devices++;</div><div class='del'>-			minlen = min_t(u64, q-&gt;limits.discard_granularity,</div><div class='del'>-				     minlen);</div><div class='del'>-		}</div><div class='add'>+		num_devices++;</div><div class='add'>+		minlen = min_t(u64, bdev_discard_granularity(device-&gt;bdev),</div><div class='add'>+				    minlen);</div><div class='ctx'> 	}</div><div class='ctx'> 	rcu_read_unlock();</div><div class='ctx'> </div><div class='hunk'>@@ -476,52 +457,69 @@ static noinline int btrfs_ioctl_fitrim(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	 * block group is in the logical address space, which can be any</div><div class='ctx'> 	 * sectorsize aligned bytenr in  the range [0, U64_MAX].</div><div class='ctx'> 	 */</div><div class='del'>-	if (range.len &lt; fs_info-&gt;sb-&gt;s_blocksize)</div><div class='add'>+	if (range.len &lt; fs_info-&gt;sectorsize)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	range.minlen = max(range.minlen, minlen);</div><div class='ctx'> 	ret = btrfs_trim_fs(fs_info, &amp;range);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		return ret;</div><div class='ctx'> </div><div class='ctx'> 	if (copy_to_user(arg, &amp;range, sizeof(range)))</div><div class='ctx'> 		return -EFAULT;</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int __pure btrfs_is_empty_uuid(u8 *uuid)</div><div class='add'>+/*</div><div class='add'>+ * Calculate the number of transaction items to reserve for creating a subvolume</div><div class='add'>+ * or snapshot, not including the inode, directory entries, or parent directory.</div><div class='add'>+ */</div><div class='add'>+static unsigned int create_subvol_num_items(const struct btrfs_qgroup_inherit *inherit)</div><div class='ctx'> {</div><div class='del'>-	int i;</div><div class='add'>+	/*</div><div class='add'>+	 * 1 to add root block</div><div class='add'>+	 * 1 to add root item</div><div class='add'>+	 * 1 to add root ref</div><div class='add'>+	 * 1 to add root backref</div><div class='add'>+	 * 1 to add UUID item</div><div class='add'>+	 * 1 to add qgroup info</div><div class='add'>+	 * 1 to add qgroup limit</div><div class='add'>+	 *</div><div class='add'>+	 * Ideally the last two would only be accounted if qgroups are enabled,</div><div class='add'>+	 * but that can change between now and the time we would insert them.</div><div class='add'>+	 */</div><div class='add'>+	unsigned int num_items = 7;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; BTRFS_UUID_SIZE; i++) {</div><div class='del'>-		if (uuid[i])</div><div class='del'>-			return 0;</div><div class='add'>+	if (inherit) {</div><div class='add'>+		/* 2 to add qgroup relations for each inherited qgroup */</div><div class='add'>+		num_items += 2 * inherit-&gt;num_qgroups;</div><div class='ctx'> 	}</div><div class='del'>-	return 1;</div><div class='add'>+	return num_items;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline int create_subvol(struct user_namespace *mnt_userns,</div><div class='add'>+static noinline int create_subvol(struct mnt_idmap *idmap,</div><div class='ctx'> 				  struct inode *dir, struct dentry *dentry,</div><div class='del'>-				  const char *name, int namelen,</div><div class='ctx'> 				  struct btrfs_qgroup_inherit *inherit)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(dir-&gt;i_sb);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(dir);</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='del'>-	struct btrfs_root_item *root_item;</div><div class='add'>+	struct btrfs_root_item AUTO_KFREE(root_item);</div><div class='ctx'> 	struct btrfs_inode_item *inode_item;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(dir)-&gt;root;</div><div class='ctx'> 	struct btrfs_root *new_root;</div><div class='ctx'> 	struct btrfs_block_rsv block_rsv;</div><div class='ctx'> 	struct timespec64 cur_time = current_time(dir);</div><div class='del'>-	struct inode *inode;</div><div class='add'>+	struct btrfs_new_inode_args new_inode_args = {</div><div class='add'>+		.dir = dir,</div><div class='add'>+		.dentry = dentry,</div><div class='add'>+		.subvol = true,</div><div class='add'>+	};</div><div class='add'>+	unsigned int trans_num_items;</div><div class='ctx'> 	int ret;</div><div class='del'>-	int err;</div><div class='del'>-	dev_t anon_dev = 0;</div><div class='add'>+	dev_t anon_dev;</div><div class='ctx'> 	u64 objectid;</div><div class='del'>-	u64 index = 0;</div><div class='add'>+	u64 qgroup_reserved = 0;</div><div class='ctx'> </div><div class='ctx'> 	root_item = kzalloc(sizeof(*root_item), GFP_KERNEL);</div><div class='ctx'> 	if (!root_item)</div><div class='hunk'>@@ -529,51 +527,58 @@ static noinline int create_subvol(struct user_namespace *mnt_userns,</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_get_free_objectid(fs_info-&gt;tree_root, &amp;objectid);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto fail_free;</div><div class='del'>-</div><div class='del'>-	ret = get_anon_bdev(&amp;anon_dev);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto fail_free;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Don't create subvolume whose level is not zero. Or qgroup will be</div><div class='ctx'> 	 * screwed up since it assumes subvolume qgroup's level to be 0.</div><div class='ctx'> 	 */</div><div class='del'>-	if (btrfs_qgroup_level(objectid)) {</div><div class='del'>-		ret = -ENOSPC;</div><div class='del'>-		goto fail_free;</div><div class='add'>+	if (btrfs_qgroup_level(objectid))</div><div class='add'>+		return -ENOSPC;</div><div class='add'>+</div><div class='add'>+	ret = get_anon_bdev(&amp;anon_dev);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	new_inode_args.inode = btrfs_new_subvol_inode(idmap, dir);</div><div class='add'>+	if (!new_inode_args.inode) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out_anon_dev;</div><div class='ctx'> 	}</div><div class='add'>+	ret = btrfs_new_inode_prepare(&amp;new_inode_args, &amp;trans_num_items);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_inode;</div><div class='add'>+	trans_num_items += create_subvol_num_items(inherit);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_init_block_rsv(&amp;block_rsv, BTRFS_BLOCK_RSV_TEMP);</div><div class='del'>-	/*</div><div class='del'>-	 * The same as the snapshot creation, please see the comment</div><div class='del'>-	 * of create_snapshot().</div><div class='del'>-	 */</div><div class='del'>-	ret = btrfs_subvolume_reserve_metadata(root, &amp;block_rsv, 8, false);</div><div class='add'>+	ret = btrfs_subvolume_reserve_metadata(root, &amp;block_rsv,</div><div class='add'>+					       trans_num_items, false);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto fail_free;</div><div class='add'>+		goto out_new_inode_args;</div><div class='add'>+	qgroup_reserved = block_rsv.qgroup_rsv_reserved;</div><div class='ctx'> </div><div class='ctx'> 	trans = btrfs_start_transaction(root, 0);</div><div class='ctx'> 	if (IS_ERR(trans)) {</div><div class='ctx'> 		ret = PTR_ERR(trans);</div><div class='del'>-		btrfs_subvolume_release_metadata(root, &amp;block_rsv);</div><div class='del'>-		goto fail_free;</div><div class='add'>+		goto out_release_rsv;</div><div class='ctx'> 	}</div><div class='add'>+	btrfs_qgroup_convert_reserved_meta(root, qgroup_reserved);</div><div class='add'>+	qgroup_reserved = 0;</div><div class='ctx'> 	trans-&gt;block_rsv = &amp;block_rsv;</div><div class='ctx'> 	trans-&gt;bytes_reserved = block_rsv.size;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_qgroup_inherit(trans, 0, objectid, inherit);</div><div class='add'>+	ret = btrfs_qgroup_inherit(trans, 0, objectid, btrfs_root_id(root), inherit);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto fail;</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='ctx'> 	leaf = btrfs_alloc_tree_block(trans, root, 0, objectid, NULL, 0, 0, 0,</div><div class='del'>-				      BTRFS_NESTING_NORMAL);</div><div class='add'>+				      0, BTRFS_NESTING_NORMAL);</div><div class='ctx'> 	if (IS_ERR(leaf)) {</div><div class='ctx'> 		ret = PTR_ERR(leaf);</div><div class='del'>-		goto fail;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='add'>+	btrfs_mark_buffer_dirty(trans, leaf);</div><div class='ctx'> </div><div class='ctx'> 	inode_item = &amp;root_item-&gt;inode;</div><div class='ctx'> 	btrfs_set_stack_inode_generation(inode_item, 1);</div><div class='hunk'>@@ -608,110 +613,84 @@ static noinline int create_subvol(struct user_namespace *mnt_userns,</div><div class='ctx'> 	btrfs_set_root_dirid(root_item, BTRFS_FIRST_FREE_OBJECTID);</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = objectid;</div><div class='del'>-	key.offset = 0;</div><div class='ctx'> 	key.type = BTRFS_ROOT_ITEM_KEY;</div><div class='add'>+	key.offset = 0;</div><div class='ctx'> 	ret = btrfs_insert_root(trans, fs_info-&gt;tree_root, &amp;key,</div><div class='ctx'> 				root_item);</div><div class='ctx'> 	if (ret) {</div><div class='add'>+		int ret2;</div><div class='add'>+</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Since we don't abort the transaction in this case, free the</div><div class='ctx'> 		 * tree block so that we don't leak space and leave the</div><div class='ctx'> 		 * filesystem in an inconsistent state (an extent item in the</div><div class='del'>-		 * extent tree without backreferences). Also no need to have</div><div class='del'>-		 * the tree block locked since it is not in any tree at this</div><div class='del'>-		 * point, so no other task can find it and use it.</div><div class='add'>+		 * extent tree with a backreference for a root that does not</div><div class='add'>+		 * exists).</div><div class='ctx'> 		 */</div><div class='del'>-		btrfs_free_tree_block(trans, root, leaf, 0, 1);</div><div class='add'>+		btrfs_tree_lock(leaf);</div><div class='add'>+		btrfs_clear_buffer_dirty(trans, leaf);</div><div class='add'>+		btrfs_tree_unlock(leaf);</div><div class='add'>+		ret2 = btrfs_free_tree_block(trans, objectid, leaf, 0, 1);</div><div class='add'>+		if (unlikely(ret2 &lt; 0))</div><div class='add'>+			btrfs_abort_transaction(trans, ret2);</div><div class='ctx'> 		free_extent_buffer(leaf);</div><div class='del'>-		goto fail;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	free_extent_buffer(leaf);</div><div class='ctx'> 	leaf = NULL;</div><div class='ctx'> </div><div class='del'>-	key.offset = (u64)-1;</div><div class='del'>-	new_root = btrfs_get_new_fs_root(fs_info, objectid, anon_dev);</div><div class='add'>+	new_root = btrfs_get_new_fs_root(fs_info, objectid, &amp;anon_dev);</div><div class='ctx'> 	if (IS_ERR(new_root)) {</div><div class='del'>-		free_anon_bdev(anon_dev);</div><div class='ctx'> 		ret = PTR_ERR(new_root);</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='del'>-		goto fail;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	/* Freeing will be done in btrfs_put_root() of new_root */</div><div class='add'>+	/* anon_dev is owned by new_root now. */</div><div class='ctx'> 	anon_dev = 0;</div><div class='add'>+	BTRFS_I(new_inode_args.inode)-&gt;root = new_root;</div><div class='add'>+	/* ... and new_root is owned by new_inode_args.inode now. */</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_record_root_in_trans(trans, new_root);</div><div class='del'>-	if (ret) {</div><div class='del'>-		btrfs_put_root(new_root);</div><div class='del'>-		btrfs_abort_transaction(trans, ret);</div><div class='del'>-		goto fail;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = btrfs_create_subvol_root(trans, new_root, root, mnt_userns);</div><div class='del'>-	btrfs_put_root(new_root);</div><div class='del'>-	if (ret) {</div><div class='del'>-		/* We potentially lose an unused inode item here */</div><div class='del'>-		btrfs_abort_transaction(trans, ret);</div><div class='del'>-		goto fail;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * insert the directory item</div><div class='del'>-	 */</div><div class='del'>-	ret = btrfs_set_inode_index(BTRFS_I(dir), &amp;index);</div><div class='del'>-	if (ret) {</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='del'>-		goto fail;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_insert_dir_item(trans, name, namelen, BTRFS_I(dir), &amp;key,</div><div class='del'>-				    BTRFS_FT_DIR, index);</div><div class='del'>-	if (ret) {</div><div class='add'>+	ret = btrfs_uuid_tree_add(trans, root_item-&gt;uuid,</div><div class='add'>+				  BTRFS_UUID_KEY_SUBVOL, objectid);</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='del'>-		goto fail;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_i_size_write(BTRFS_I(dir), dir-&gt;i_size + namelen * 2);</div><div class='del'>-	ret = btrfs_update_inode(trans, root, BTRFS_I(dir));</div><div class='del'>-	if (ret) {</div><div class='del'>-		btrfs_abort_transaction(trans, ret);</div><div class='del'>-		goto fail;</div><div class='del'>-	}</div><div class='add'>+	btrfs_record_new_subvolume(trans, BTRFS_I(dir));</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_add_root_ref(trans, objectid, root-&gt;root_key.objectid,</div><div class='del'>-				 btrfs_ino(BTRFS_I(dir)), index, name, namelen);</div><div class='del'>-	if (ret) {</div><div class='add'>+	ret = btrfs_create_new_inode(trans, &amp;new_inode_args);</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='del'>-		goto fail;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_uuid_tree_add(trans, root_item-&gt;uuid,</div><div class='del'>-				  BTRFS_UUID_KEY_SUBVOL, objectid);</div><div class='del'>-	if (ret)</div><div class='del'>-		btrfs_abort_transaction(trans, ret);</div><div class='add'>+	d_instantiate_new(dentry, new_inode_args.inode);</div><div class='add'>+	new_inode_args.inode = NULL;</div><div class='ctx'> </div><div class='del'>-fail:</div><div class='del'>-	kfree(root_item);</div><div class='add'>+out:</div><div class='ctx'> 	trans-&gt;block_rsv = NULL;</div><div class='ctx'> 	trans-&gt;bytes_reserved = 0;</div><div class='del'>-	btrfs_subvolume_release_metadata(root, &amp;block_rsv);</div><div class='del'>-</div><div class='del'>-	err = btrfs_commit_transaction(trans);</div><div class='del'>-	if (err &amp;&amp; !ret)</div><div class='del'>-		ret = err;</div><div class='del'>-</div><div class='del'>-	if (!ret) {</div><div class='del'>-		inode = btrfs_lookup_dentry(dir, dentry);</div><div class='del'>-		if (IS_ERR(inode))</div><div class='del'>-			return PTR_ERR(inode);</div><div class='del'>-		d_instantiate(dentry, inode);</div><div class='del'>-	}</div><div class='del'>-	return ret;</div><div class='del'>-</div><div class='del'>-fail_free:</div><div class='add'>+	btrfs_end_transaction(trans);</div><div class='add'>+out_release_rsv:</div><div class='add'>+	btrfs_block_rsv_release(fs_info, &amp;block_rsv, (u64)-1, NULL);</div><div class='add'>+	if (qgroup_reserved)</div><div class='add'>+		btrfs_qgroup_free_meta_prealloc(root, qgroup_reserved);</div><div class='add'>+out_new_inode_args:</div><div class='add'>+	btrfs_new_inode_args_destroy(&amp;new_inode_args);</div><div class='add'>+out_inode:</div><div class='add'>+	iput(new_inode_args.inode);</div><div class='add'>+out_anon_dev:</div><div class='ctx'> 	if (anon_dev)</div><div class='ctx'> 		free_anon_bdev(anon_dev);</div><div class='del'>-	kfree(root_item);</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -719,12 +698,25 @@ static int create_snapshot(struct btrfs_root *root, struct inode *dir,</div><div class='ctx'> 			   struct dentry *dentry, bool readonly,</div><div class='ctx'> 			   struct btrfs_qgroup_inherit *inherit)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(dir-&gt;i_sb);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(dir);</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct btrfs_pending_snapshot *pending_snapshot;</div><div class='add'>+	unsigned int trans_num_items;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='add'>+	struct btrfs_block_rsv *block_rsv;</div><div class='add'>+	u64 qgroup_reserved = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='add'>+	/* We do not support snapshotting right now. */</div><div class='add'>+	if (btrfs_fs_incompat(fs_info, EXTENT_TREE_V2)) {</div><div class='add'>+		btrfs_warn(fs_info,</div><div class='add'>+			   "extent tree v2 doesn't support snapshotting yet");</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (btrfs_root_refs(&amp;root-&gt;root_item) == 0)</div><div class='add'>+		return -ENOENT;</div><div class='add'>+</div><div class='ctx'> 	if (!test_bit(BTRFS_ROOT_SHAREABLE, &amp;root-&gt;state))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='hunk'>@@ -749,26 +741,24 @@ static int create_snapshot(struct btrfs_root *root, struct inode *dir,</div><div class='ctx'> 		goto free_pending;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_init_block_rsv(&amp;pending_snapshot-&gt;block_rsv,</div><div class='del'>-			     BTRFS_BLOCK_RSV_TEMP);</div><div class='add'>+	block_rsv = &amp;pending_snapshot-&gt;block_rsv;</div><div class='add'>+	btrfs_init_block_rsv(block_rsv, BTRFS_BLOCK_RSV_TEMP);</div><div class='ctx'> 	/*</div><div class='del'>-	 * 1 - parent dir inode</div><div class='del'>-	 * 2 - dir entries</div><div class='del'>-	 * 1 - root item</div><div class='del'>-	 * 2 - root ref/backref</div><div class='del'>-	 * 1 - root of snapshot</div><div class='del'>-	 * 1 - UUID item</div><div class='add'>+	 * 1 to add dir item</div><div class='add'>+	 * 1 to add dir index</div><div class='add'>+	 * 1 to update parent inode item</div><div class='ctx'> 	 */</div><div class='del'>-	ret = btrfs_subvolume_reserve_metadata(BTRFS_I(dir)-&gt;root,</div><div class='del'>-					&amp;pending_snapshot-&gt;block_rsv, 8,</div><div class='del'>-					false);</div><div class='add'>+	trans_num_items = create_subvol_num_items(inherit) + 3;</div><div class='add'>+	ret = btrfs_subvolume_reserve_metadata(BTRFS_I(dir)-&gt;root, block_rsv,</div><div class='add'>+					       trans_num_items, false);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto free_pending;</div><div class='add'>+	qgroup_reserved = block_rsv-&gt;qgroup_rsv_reserved;</div><div class='ctx'> </div><div class='ctx'> 	pending_snapshot-&gt;dentry = dentry;</div><div class='ctx'> 	pending_snapshot-&gt;root = root;</div><div class='ctx'> 	pending_snapshot-&gt;readonly = readonly;</div><div class='del'>-	pending_snapshot-&gt;dir = dir;</div><div class='add'>+	pending_snapshot-&gt;dir = BTRFS_I(dir);</div><div class='ctx'> 	pending_snapshot-&gt;inherit = inherit;</div><div class='ctx'> </div><div class='ctx'> 	trans = btrfs_start_transaction(root, 0);</div><div class='hunk'>@@ -776,11 +766,15 @@ static int create_snapshot(struct btrfs_root *root, struct inode *dir,</div><div class='ctx'> 		ret = PTR_ERR(trans);</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='add'>+	ret = btrfs_record_root_in_trans(trans, BTRFS_I(dir)-&gt;root);</div><div class='add'>+	if (ret) {</div><div class='add'>+		btrfs_end_transaction(trans);</div><div class='add'>+		goto fail;</div><div class='add'>+	}</div><div class='add'>+	btrfs_qgroup_convert_reserved_meta(root, qgroup_reserved);</div><div class='add'>+	qgroup_reserved = 0;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;fs_info-&gt;trans_lock);</div><div class='del'>-	list_add(&amp;pending_snapshot-&gt;list,</div><div class='del'>-		 &amp;trans-&gt;transaction-&gt;pending_snapshots);</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='add'>+	trans-&gt;pending_snapshot = pending_snapshot;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_commit_transaction(trans);</div><div class='ctx'> 	if (ret)</div><div class='hunk'>@@ -808,7 +802,9 @@ fail:</div><div class='ctx'> 	if (ret &amp;&amp; pending_snapshot-&gt;snap)</div><div class='ctx'> 		pending_snapshot-&gt;snap-&gt;anon_dev = 0;</div><div class='ctx'> 	btrfs_put_root(pending_snapshot-&gt;snap);</div><div class='del'>-	btrfs_subvolume_release_metadata(root, &amp;pending_snapshot-&gt;block_rsv);</div><div class='add'>+	btrfs_block_rsv_release(fs_info, block_rsv, (u64)-1, NULL);</div><div class='add'>+	if (qgroup_reserved)</div><div class='add'>+		btrfs_qgroup_free_meta_prealloc(root, qgroup_reserved);</div><div class='ctx'> free_pending:</div><div class='ctx'> 	if (pending_snapshot-&gt;anon_dev)</div><div class='ctx'> 		free_anon_bdev(pending_snapshot-&gt;anon_dev);</div><div class='hunk'>@@ -839,23 +835,25 @@ free_pending:</div><div class='ctx'>  *     nfs_async_unlink().</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static int btrfs_may_delete(struct user_namespace *mnt_userns,</div><div class='add'>+static int btrfs_may_delete(struct mnt_idmap *idmap,</div><div class='ctx'> 			    struct inode *dir, struct dentry *victim, int isdir)</div><div class='ctx'> {</div><div class='del'>-	int error;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (d_really_is_negative(victim))</div><div class='ctx'> 		return -ENOENT;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(d_inode(victim-&gt;d_parent) != dir);</div><div class='add'>+	/* The @victim is not inside @dir. */</div><div class='add'>+	if (d_inode(victim-&gt;d_parent) != dir)</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	audit_inode_child(dir, victim, AUDIT_TYPE_CHILD_DELETE);</div><div class='ctx'> </div><div class='del'>-	error = inode_permission(mnt_userns, dir, MAY_WRITE | MAY_EXEC);</div><div class='del'>-	if (error)</div><div class='del'>-		return error;</div><div class='add'>+	ret = inode_permission(idmap, dir, MAY_WRITE | MAY_EXEC);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='ctx'> 	if (IS_APPEND(dir))</div><div class='ctx'> 		return -EPERM;</div><div class='del'>-	if (check_sticky(mnt_userns, dir, d_inode(victim)) ||</div><div class='add'>+	if (check_sticky(idmap, dir, d_inode(victim)) ||</div><div class='ctx'> 	    IS_APPEND(d_inode(victim)) || IS_IMMUTABLE(d_inode(victim)) ||</div><div class='ctx'> 	    IS_SWAPFILE(d_inode(victim)))</div><div class='ctx'> 		return -EPERM;</div><div class='hunk'>@@ -874,16 +872,16 @@ static int btrfs_may_delete(struct user_namespace *mnt_userns,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* copy of may_create in fs/namei.c() */</div><div class='del'>-static inline int btrfs_may_create(struct user_namespace *mnt_userns,</div><div class='del'>-				   struct inode *dir, struct dentry *child)</div><div class='add'>+static inline int btrfs_may_create(struct mnt_idmap *idmap,</div><div class='add'>+				   struct inode *dir, const struct dentry *child)</div><div class='ctx'> {</div><div class='ctx'> 	if (d_really_is_positive(child))</div><div class='ctx'> 		return -EEXIST;</div><div class='ctx'> 	if (IS_DEADDIR(dir))</div><div class='ctx'> 		return -ENOENT;</div><div class='del'>-	if (!fsuidgid_has_mapping(dir-&gt;i_sb, mnt_userns))</div><div class='add'>+	if (!fsuidgid_has_mapping(dir-&gt;i_sb, idmap))</div><div class='ctx'> 		return -EOVERFLOW;</div><div class='del'>-	return inode_permission(mnt_userns, dir, MAY_WRITE | MAY_EXEC);</div><div class='add'>+	return inode_permission(idmap, dir, MAY_WRITE | MAY_EXEC);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -891,39 +889,32 @@ static inline int btrfs_may_create(struct user_namespace *mnt_userns,</div><div class='ctx'>  * sys_mkdirat and vfs_mkdir, but we only do a single component lookup</div><div class='ctx'>  * inside this filesystem so it's quite a bit simpler.</div><div class='ctx'>  */</div><div class='del'>-static noinline int btrfs_mksubvol(const struct path *parent,</div><div class='del'>-				   struct user_namespace *mnt_userns,</div><div class='del'>-				   const char *name, int namelen,</div><div class='del'>-				   struct btrfs_root *snap_src,</div><div class='add'>+static noinline int btrfs_mksubvol(struct dentry *parent,</div><div class='add'>+				   struct mnt_idmap *idmap,</div><div class='add'>+				   struct qstr *qname, struct btrfs_root *snap_src,</div><div class='ctx'> 				   bool readonly,</div><div class='ctx'> 				   struct btrfs_qgroup_inherit *inherit)</div><div class='ctx'> {</div><div class='del'>-	struct inode *dir = d_inode(parent-&gt;dentry);</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(dir-&gt;i_sb);</div><div class='add'>+	struct inode *dir = d_inode(parent);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(dir);</div><div class='ctx'> 	struct dentry *dentry;</div><div class='del'>-	int error;</div><div class='del'>-</div><div class='del'>-	error = down_write_killable_nested(&amp;dir-&gt;i_rwsem, I_MUTEX_PARENT);</div><div class='del'>-	if (error == -EINTR)</div><div class='del'>-		return error;</div><div class='add'>+	struct fscrypt_str name_str = FSTR_INIT((char *)qname-&gt;name, qname-&gt;len);</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	dentry = lookup_one(mnt_userns, name, parent-&gt;dentry, namelen);</div><div class='del'>-	error = PTR_ERR(dentry);</div><div class='add'>+	dentry = start_creating_killable(idmap, parent, qname);</div><div class='ctx'> 	if (IS_ERR(dentry))</div><div class='del'>-		goto out_unlock;</div><div class='add'>+		return PTR_ERR(dentry);</div><div class='ctx'> </div><div class='del'>-	error = btrfs_may_create(mnt_userns, dir, dentry);</div><div class='del'>-	if (error)</div><div class='add'>+	ret = btrfs_may_create(idmap, dir, dentry);</div><div class='add'>+	if (ret)</div><div class='ctx'> 		goto out_dput;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * even if this name doesn't exist, we may get hash collisions.</div><div class='ctx'> 	 * check for them now when we can safely fail</div><div class='ctx'> 	 */</div><div class='del'>-	error = btrfs_check_dir_item_collision(BTRFS_I(dir)-&gt;root,</div><div class='del'>-					       dir-&gt;i_ino, name,</div><div class='del'>-					       namelen);</div><div class='del'>-	if (error)</div><div class='add'>+	ret = btrfs_check_dir_item_collision(BTRFS_I(dir)-&gt;root, dir-&gt;i_ino, &amp;name_str);</div><div class='add'>+	if (ret)</div><div class='ctx'> 		goto out_dput;</div><div class='ctx'> </div><div class='ctx'> 	down_read(&amp;fs_info-&gt;subvol_sem);</div><div class='hunk'>@@ -932,34 +923,31 @@ static noinline int btrfs_mksubvol(const struct path *parent,</div><div class='ctx'> 		goto out_up_read;</div><div class='ctx'> </div><div class='ctx'> 	if (snap_src)</div><div class='del'>-		error = create_snapshot(snap_src, dir, dentry, readonly, inherit);</div><div class='add'>+		ret = create_snapshot(snap_src, dir, dentry, readonly, inherit);</div><div class='ctx'> 	else</div><div class='del'>-		error = create_subvol(mnt_userns, dir, dentry, name, namelen, inherit);</div><div class='add'>+		ret = create_subvol(idmap, dir, dentry, inherit);</div><div class='ctx'> </div><div class='del'>-	if (!error)</div><div class='add'>+	if (!ret)</div><div class='ctx'> 		fsnotify_mkdir(dir, dentry);</div><div class='ctx'> out_up_read:</div><div class='ctx'> 	up_read(&amp;fs_info-&gt;subvol_sem);</div><div class='ctx'> out_dput:</div><div class='del'>-	dput(dentry);</div><div class='del'>-out_unlock:</div><div class='del'>-	btrfs_inode_unlock(dir, 0);</div><div class='del'>-	return error;</div><div class='add'>+	end_creating(dentry);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline int btrfs_mksnapshot(const struct path *parent,</div><div class='del'>-				   struct user_namespace *mnt_userns,</div><div class='del'>-				   const char *name, int namelen,</div><div class='add'>+static noinline int btrfs_mksnapshot(struct dentry *parent,</div><div class='add'>+				   struct mnt_idmap *idmap,</div><div class='add'>+				   struct qstr *qname,</div><div class='ctx'> 				   struct btrfs_root *root,</div><div class='ctx'> 				   bool readonly,</div><div class='ctx'> 				   struct btrfs_qgroup_inherit *inherit)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='del'>-	bool snapshot_force_cow = false;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Force new buffered writes to reserve space even when NOCOW is</div><div class='del'>-	 * possible. This is to avoid later writeback (running dealloc) to</div><div class='add'>+	 * possible. This is to avoid later writeback (running delalloc) to</div><div class='ctx'> 	 * fallback to COW mode and unexpectedly fail with ENOSPC.</div><div class='ctx'> 	 */</div><div class='ctx'> 	btrfs_drew_read_lock(&amp;root-&gt;snapshot_lock);</div><div class='hunk'>@@ -974,601 +962,14 @@ static noinline int btrfs_mksnapshot(const struct path *parent,</div><div class='ctx'> 	 * creation.</div><div class='ctx'> 	 */</div><div class='ctx'> 	atomic_inc(&amp;root-&gt;snapshot_force_cow);</div><div class='del'>-	snapshot_force_cow = true;</div><div class='del'>-</div><div class='del'>-	btrfs_wait_ordered_extents(root, U64_MAX, 0, (u64)-1);</div><div class='del'>-</div><div class='del'>-	ret = btrfs_mksubvol(parent, mnt_userns, name, namelen,</div><div class='del'>-			     root, readonly, inherit);</div><div class='del'>-out:</div><div class='del'>-	if (snapshot_force_cow)</div><div class='del'>-		atomic_dec(&amp;root-&gt;snapshot_force_cow);</div><div class='del'>-	btrfs_drew_read_unlock(&amp;root-&gt;snapshot_lock);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct extent_map *defrag_lookup_extent(struct inode *inode, u64 start,</div><div class='del'>-					       bool locked)</div><div class='del'>-{</div><div class='del'>-	struct extent_map_tree *em_tree = &amp;BTRFS_I(inode)-&gt;extent_tree;</div><div class='del'>-	struct extent_io_tree *io_tree = &amp;BTRFS_I(inode)-&gt;io_tree;</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	const u32 sectorsize = BTRFS_I(inode)-&gt;root-&gt;fs_info-&gt;sectorsize;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * hopefully we have this extent in the tree already, try without</div><div class='del'>-	 * the full extent lock</div><div class='del'>-	 */</div><div class='del'>-	read_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	em = lookup_extent_mapping(em_tree, start, sectorsize);</div><div class='del'>-	read_unlock(&amp;em_tree-&gt;lock);</div><div class='del'>-</div><div class='del'>-	if (!em) {</div><div class='del'>-		struct extent_state *cached = NULL;</div><div class='del'>-		u64 end = start + sectorsize - 1;</div><div class='del'>-</div><div class='del'>-		/* get the big lock and read metadata off disk */</div><div class='del'>-		if (!locked)</div><div class='del'>-			lock_extent_bits(io_tree, start, end, &amp;cached);</div><div class='del'>-		em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, start, sectorsize);</div><div class='del'>-		if (!locked)</div><div class='del'>-			unlock_extent_cached(io_tree, start, end, &amp;cached);</div><div class='del'>-</div><div class='del'>-		if (IS_ERR(em))</div><div class='del'>-			return NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return em;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool defrag_check_next_extent(struct inode *inode, struct extent_map *em,</div><div class='del'>-				     bool locked)</div><div class='del'>-{</div><div class='del'>-	struct extent_map *next;</div><div class='del'>-	bool ret = true;</div><div class='del'>-</div><div class='del'>-	/* this is the last extent */</div><div class='del'>-	if (em-&gt;start + em-&gt;len &gt;= i_size_read(inode))</div><div class='del'>-		return false;</div><div class='del'>-</div><div class='del'>-	next = defrag_lookup_extent(inode, em-&gt;start + em-&gt;len, locked);</div><div class='del'>-	if (!next || next-&gt;block_start &gt;= EXTENT_MAP_LAST_BYTE)</div><div class='del'>-		ret = false;</div><div class='del'>-	else if ((em-&gt;block_start + em-&gt;block_len == next-&gt;block_start) &amp;&amp;</div><div class='del'>-		 (em-&gt;block_len &gt; SZ_128K &amp;&amp; next-&gt;block_len &gt; SZ_128K))</div><div class='del'>-		ret = false;</div><div class='del'>-</div><div class='del'>-	free_extent_map(next);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Prepare one page to be defragged.</div><div class='del'>- *</div><div class='del'>- * This will ensure:</div><div class='del'>- *</div><div class='del'>- * - Returned page is locked and has been set up properly.</div><div class='del'>- * - No ordered extent exists in the page.</div><div class='del'>- * - The page is uptodate.</div><div class='del'>- *</div><div class='del'>- * NOTE: Caller should also wait for page writeback after the cluster is</div><div class='del'>- * prepared, here we don't do writeback wait for each page.</div><div class='del'>- */</div><div class='del'>-static struct page *defrag_prepare_one_page(struct btrfs_inode *inode,</div><div class='del'>-					    pgoff_t index)</div><div class='del'>-{</div><div class='del'>-	struct address_space *mapping = inode-&gt;vfs_inode.i_mapping;</div><div class='del'>-	gfp_t mask = btrfs_alloc_write_mask(mapping);</div><div class='del'>-	u64 page_start = (u64)index &lt;&lt; PAGE_SHIFT;</div><div class='del'>-	u64 page_end = page_start + PAGE_SIZE - 1;</div><div class='del'>-	struct extent_state *cached_state = NULL;</div><div class='del'>-	struct page *page;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-again:</div><div class='del'>-	page = find_or_create_page(mapping, index, mask);</div><div class='del'>-	if (!page)</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Since we can defragment files opened read-only, we can encounter</div><div class='del'>-	 * transparent huge pages here (see CONFIG_READ_ONLY_THP_FOR_FS). We</div><div class='del'>-	 * can't do I/O using huge pages yet, so return an error for now.</div><div class='del'>-	 * Filesystem transparent huge pages are typically only used for</div><div class='del'>-	 * executables that explicitly enable them, so this isn't very</div><div class='del'>-	 * restrictive.</div><div class='del'>-	 */</div><div class='del'>-	if (PageCompound(page)) {</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		put_page(page);</div><div class='del'>-		return ERR_PTR(-ETXTBSY);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = set_page_extent_mapped(page);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		put_page(page);</div><div class='del'>-		return ERR_PTR(ret);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Wait for any existing ordered extent in the range */</div><div class='del'>-	while (1) {</div><div class='del'>-		struct btrfs_ordered_extent *ordered;</div><div class='del'>-</div><div class='del'>-		lock_extent_bits(&amp;inode-&gt;io_tree, page_start, page_end, &amp;cached_state);</div><div class='del'>-		ordered = btrfs_lookup_ordered_range(inode, page_start, PAGE_SIZE);</div><div class='del'>-		unlock_extent_cached(&amp;inode-&gt;io_tree, page_start, page_end,</div><div class='del'>-				     &amp;cached_state);</div><div class='del'>-		if (!ordered)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		btrfs_start_ordered_extent(ordered, 1);</div><div class='del'>-		btrfs_put_ordered_extent(ordered);</div><div class='del'>-		lock_page(page);</div><div class='del'>-		/*</div><div class='del'>-		 * We unlocked the page above, so we need check if it was</div><div class='del'>-		 * released or not.</div><div class='del'>-		 */</div><div class='del'>-		if (page-&gt;mapping != mapping || !PagePrivate(page)) {</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			put_page(page);</div><div class='del'>-			goto again;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Now the page range has no ordered extent any more.  Read the page to</div><div class='del'>-	 * make it uptodate.</div><div class='del'>-	 */</div><div class='del'>-	if (!PageUptodate(page)) {</div><div class='del'>-		btrfs_readpage(NULL, page);</div><div class='del'>-		lock_page(page);</div><div class='del'>-		if (page-&gt;mapping != mapping || !PagePrivate(page)) {</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			put_page(page);</div><div class='del'>-			goto again;</div><div class='del'>-		}</div><div class='del'>-		if (!PageUptodate(page)) {</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			put_page(page);</div><div class='del'>-			return ERR_PTR(-EIO);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	return page;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct defrag_target_range {</div><div class='del'>-	struct list_head list;</div><div class='del'>-	u64 start;</div><div class='del'>-	u64 len;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Collect all valid target extents.</div><div class='del'>- *</div><div class='del'>- * @start:	   file offset to lookup</div><div class='del'>- * @len:	   length to lookup</div><div class='del'>- * @extent_thresh: file extent size threshold, any extent size &gt;= this value</div><div class='del'>- *		   will be ignored</div><div class='del'>- * @newer_than:    only defrag extents newer than this value</div><div class='del'>- * @do_compress:   whether the defrag is doing compression</div><div class='del'>- *		   if true, @extent_thresh will be ignored and all regular</div><div class='del'>- *		   file extents meeting @newer_than will be targets.</div><div class='del'>- * @locked:	   if the range has already held extent lock</div><div class='del'>- * @target_list:   list of targets file extents</div><div class='del'>- */</div><div class='del'>-static int defrag_collect_targets(struct btrfs_inode *inode,</div><div class='del'>-				  u64 start, u64 len, u32 extent_thresh,</div><div class='del'>-				  u64 newer_than, bool do_compress,</div><div class='del'>-				  bool locked, struct list_head *target_list)</div><div class='del'>-{</div><div class='del'>-	u64 cur = start;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	while (cur &lt; start + len) {</div><div class='del'>-		struct extent_map *em;</div><div class='del'>-		struct defrag_target_range *new;</div><div class='del'>-		bool next_mergeable = true;</div><div class='del'>-		u64 range_len;</div><div class='del'>-</div><div class='del'>-		em = defrag_lookup_extent(&amp;inode-&gt;vfs_inode, cur, locked);</div><div class='del'>-		if (!em)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		/* Skip hole/inline/preallocated extents */</div><div class='del'>-		if (em-&gt;block_start &gt;= EXTENT_MAP_LAST_BYTE ||</div><div class='del'>-		    test_bit(EXTENT_FLAG_PREALLOC, &amp;em-&gt;flags))</div><div class='del'>-			goto next;</div><div class='del'>-</div><div class='del'>-		/* Skip older extent */</div><div class='del'>-		if (em-&gt;generation &lt; newer_than)</div><div class='del'>-			goto next;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * For do_compress case, we want to compress all valid file</div><div class='del'>-		 * extents, thus no @extent_thresh or mergeable check.</div><div class='del'>-		 */</div><div class='del'>-		if (do_compress)</div><div class='del'>-			goto add;</div><div class='del'>-</div><div class='del'>-		/* Skip too large extent */</div><div class='del'>-		if (em-&gt;len &gt;= extent_thresh)</div><div class='del'>-			goto next;</div><div class='del'>-</div><div class='del'>-		next_mergeable = defrag_check_next_extent(&amp;inode-&gt;vfs_inode, em,</div><div class='del'>-							  locked);</div><div class='del'>-		if (!next_mergeable) {</div><div class='del'>-			struct defrag_target_range *last;</div><div class='del'>-</div><div class='del'>-			/* Empty target list, no way to merge with last entry */</div><div class='del'>-			if (list_empty(target_list))</div><div class='del'>-				goto next;</div><div class='del'>-			last = list_entry(target_list-&gt;prev,</div><div class='del'>-					  struct defrag_target_range, list);</div><div class='del'>-			/* Not mergeable with last entry */</div><div class='del'>-			if (last-&gt;start + last-&gt;len != cur)</div><div class='del'>-				goto next;</div><div class='del'>-</div><div class='del'>-			/* Mergeable, fall through to add it to @target_list. */</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-add:</div><div class='del'>-		range_len = min(extent_map_end(em), start + len) - cur;</div><div class='del'>-		/*</div><div class='del'>-		 * This one is a good target, check if it can be merged into</div><div class='del'>-		 * last range of the target list.</div><div class='del'>-		 */</div><div class='del'>-		if (!list_empty(target_list)) {</div><div class='del'>-			struct defrag_target_range *last;</div><div class='del'>-</div><div class='del'>-			last = list_entry(target_list-&gt;prev,</div><div class='del'>-					  struct defrag_target_range, list);</div><div class='del'>-			ASSERT(last-&gt;start + last-&gt;len &lt;= cur);</div><div class='del'>-			if (last-&gt;start + last-&gt;len == cur) {</div><div class='del'>-				/* Mergeable, enlarge the last entry */</div><div class='del'>-				last-&gt;len += range_len;</div><div class='del'>-				goto next;</div><div class='del'>-			}</div><div class='del'>-			/* Fall through to allocate a new entry */</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/* Allocate new defrag_target_range */</div><div class='del'>-		new = kmalloc(sizeof(*new), GFP_NOFS);</div><div class='del'>-		if (!new) {</div><div class='del'>-			free_extent_map(em);</div><div class='del'>-			ret = -ENOMEM;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		new-&gt;start = cur;</div><div class='del'>-		new-&gt;len = range_len;</div><div class='del'>-		list_add_tail(&amp;new-&gt;list, target_list);</div><div class='del'>-</div><div class='del'>-next:</div><div class='del'>-		cur = extent_map_end(em);</div><div class='del'>-		free_extent_map(em);</div><div class='del'>-	}</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		struct defrag_target_range *entry;</div><div class='del'>-		struct defrag_target_range *tmp;</div><div class='del'>-</div><div class='del'>-		list_for_each_entry_safe(entry, tmp, target_list, list) {</div><div class='del'>-			list_del_init(&amp;entry-&gt;list);</div><div class='del'>-			kfree(entry);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#define CLUSTER_SIZE	(SZ_256K)</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Defrag one contiguous target range.</div><div class='del'>- *</div><div class='del'>- * @inode:	target inode</div><div class='del'>- * @target:	target range to defrag</div><div class='del'>- * @pages:	locked pages covering the defrag range</div><div class='del'>- * @nr_pages:	number of locked pages</div><div class='del'>- *</div><div class='del'>- * Caller should ensure:</div><div class='del'>- *</div><div class='del'>- * - Pages are prepared</div><div class='del'>- *   Pages should be locked, no ordered extent in the pages range,</div><div class='del'>- *   no writeback.</div><div class='del'>- *</div><div class='del'>- * - Extent bits are locked</div><div class='del'>- */</div><div class='del'>-static int defrag_one_locked_target(struct btrfs_inode *inode,</div><div class='del'>-				    struct defrag_target_range *target,</div><div class='del'>-				    struct page **pages, int nr_pages,</div><div class='del'>-				    struct extent_state **cached_state)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='del'>-	struct extent_changeset *data_reserved = NULL;</div><div class='del'>-	const u64 start = target-&gt;start;</div><div class='del'>-	const u64 len = target-&gt;len;</div><div class='del'>-	unsigned long last_index = (start + len - 1) &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	unsigned long start_index = start &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	unsigned long first_index = page_index(pages[0]);</div><div class='del'>-	int ret = 0;</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	ASSERT(last_index - first_index + 1 &lt;= nr_pages);</div><div class='del'>-</div><div class='del'>-	ret = btrfs_delalloc_reserve_space(inode, &amp;data_reserved, start, len);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		return ret;</div><div class='del'>-	clear_extent_bit(&amp;inode-&gt;io_tree, start, start + len - 1,</div><div class='del'>-			 EXTENT_DELALLOC | EXTENT_DO_ACCOUNTING |</div><div class='del'>-			 EXTENT_DEFRAG, 0, 0, cached_state);</div><div class='del'>-	set_extent_defrag(&amp;inode-&gt;io_tree, start, start + len - 1, cached_state);</div><div class='del'>-</div><div class='del'>-	/* Update the page status */</div><div class='del'>-	for (i = start_index - first_index; i &lt;= last_index - first_index; i++) {</div><div class='del'>-		ClearPageChecked(pages[i]);</div><div class='del'>-		btrfs_page_clamp_set_dirty(fs_info, pages[i], start, len);</div><div class='del'>-	}</div><div class='del'>-	btrfs_delalloc_release_extents(inode, len);</div><div class='del'>-	extent_changeset_free(data_reserved);</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int defrag_one_range(struct btrfs_inode *inode, u64 start, u32 len,</div><div class='del'>-			    u32 extent_thresh, u64 newer_than, bool do_compress)</div><div class='del'>-{</div><div class='del'>-	struct extent_state *cached_state = NULL;</div><div class='del'>-	struct defrag_target_range *entry;</div><div class='del'>-	struct defrag_target_range *tmp;</div><div class='del'>-	LIST_HEAD(target_list);</div><div class='del'>-	struct page **pages;</div><div class='del'>-	const u32 sectorsize = inode-&gt;root-&gt;fs_info-&gt;sectorsize;</div><div class='del'>-	u64 last_index = (start + len - 1) &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	u64 start_index = start &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	unsigned int nr_pages = last_index - start_index + 1;</div><div class='del'>-	int ret = 0;</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	ASSERT(nr_pages &lt;= CLUSTER_SIZE / PAGE_SIZE);</div><div class='del'>-	ASSERT(IS_ALIGNED(start, sectorsize) &amp;&amp; IS_ALIGNED(len, sectorsize));</div><div class='del'>-</div><div class='del'>-	pages = kcalloc(nr_pages, sizeof(struct page *), GFP_NOFS);</div><div class='del'>-	if (!pages)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	/* Prepare all pages */</div><div class='del'>-	for (i = 0; i &lt; nr_pages; i++) {</div><div class='del'>-		pages[i] = defrag_prepare_one_page(inode, start_index + i);</div><div class='del'>-		if (IS_ERR(pages[i])) {</div><div class='del'>-			ret = PTR_ERR(pages[i]);</div><div class='del'>-			pages[i] = NULL;</div><div class='del'>-			goto free_pages;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	for (i = 0; i &lt; nr_pages; i++)</div><div class='del'>-		wait_on_page_writeback(pages[i]);</div><div class='del'>-</div><div class='del'>-	/* Lock the pages range */</div><div class='del'>-	lock_extent_bits(&amp;inode-&gt;io_tree, start_index &lt;&lt; PAGE_SHIFT,</div><div class='del'>-			 (last_index &lt;&lt; PAGE_SHIFT) + PAGE_SIZE - 1,</div><div class='del'>-			 &amp;cached_state);</div><div class='del'>-	/*</div><div class='del'>-	 * Now we have a consistent view about the extent map, re-check</div><div class='del'>-	 * which range really needs to be defragged.</div><div class='del'>-	 *</div><div class='del'>-	 * And this time we have extent locked already, pass @locked = true</div><div class='del'>-	 * so that we won't relock the extent range and cause deadlock.</div><div class='del'>-	 */</div><div class='del'>-	ret = defrag_collect_targets(inode, start, len, extent_thresh,</div><div class='del'>-				     newer_than, do_compress, true,</div><div class='del'>-				     &amp;target_list);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto unlock_extent;</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(entry, &amp;target_list, list) {</div><div class='del'>-		ret = defrag_one_locked_target(inode, entry, pages, nr_pages,</div><div class='del'>-					       &amp;cached_state);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	list_for_each_entry_safe(entry, tmp, &amp;target_list, list) {</div><div class='del'>-		list_del_init(&amp;entry-&gt;list);</div><div class='del'>-		kfree(entry);</div><div class='del'>-	}</div><div class='del'>-unlock_extent:</div><div class='del'>-	unlock_extent_cached(&amp;inode-&gt;io_tree, start_index &lt;&lt; PAGE_SHIFT,</div><div class='del'>-			     (last_index &lt;&lt; PAGE_SHIFT) + PAGE_SIZE - 1,</div><div class='del'>-			     &amp;cached_state);</div><div class='del'>-free_pages:</div><div class='del'>-	for (i = 0; i &lt; nr_pages; i++) {</div><div class='del'>-		if (pages[i]) {</div><div class='del'>-			unlock_page(pages[i]);</div><div class='del'>-			put_page(pages[i]);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	kfree(pages);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int defrag_one_cluster(struct btrfs_inode *inode,</div><div class='del'>-			      struct file_ra_state *ra,</div><div class='del'>-			      u64 start, u32 len, u32 extent_thresh,</div><div class='del'>-			      u64 newer_than, bool do_compress,</div><div class='del'>-			      unsigned long *sectors_defragged,</div><div class='del'>-			      unsigned long max_sectors)</div><div class='del'>-{</div><div class='del'>-	const u32 sectorsize = inode-&gt;root-&gt;fs_info-&gt;sectorsize;</div><div class='del'>-	struct defrag_target_range *entry;</div><div class='del'>-	struct defrag_target_range *tmp;</div><div class='del'>-	LIST_HEAD(target_list);</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	BUILD_BUG_ON(!IS_ALIGNED(CLUSTER_SIZE, PAGE_SIZE));</div><div class='del'>-	ret = defrag_collect_targets(inode, start, len, extent_thresh,</div><div class='del'>-				     newer_than, do_compress, false,</div><div class='del'>-				     &amp;target_list);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(entry, &amp;target_list, list) {</div><div class='del'>-		u32 range_len = entry-&gt;len;</div><div class='ctx'> </div><div class='del'>-		/* Reached the limit */</div><div class='del'>-		if (max_sectors &amp;&amp; max_sectors == *sectors_defragged)</div><div class='del'>-			break;</div><div class='add'>+	btrfs_wait_ordered_extents(root, U64_MAX, NULL);</div><div class='ctx'> </div><div class='del'>-		if (max_sectors)</div><div class='del'>-			range_len = min_t(u32, range_len,</div><div class='del'>-				(max_sectors - *sectors_defragged) * sectorsize);</div><div class='add'>+	ret = btrfs_mksubvol(parent, idmap, qname, root, readonly, inherit);</div><div class='ctx'> </div><div class='del'>-		if (ra)</div><div class='del'>-			page_cache_sync_readahead(inode-&gt;vfs_inode.i_mapping,</div><div class='del'>-				ra, NULL, entry-&gt;start &gt;&gt; PAGE_SHIFT,</div><div class='del'>-				((entry-&gt;start + range_len - 1) &gt;&gt; PAGE_SHIFT) -</div><div class='del'>-				(entry-&gt;start &gt;&gt; PAGE_SHIFT) + 1);</div><div class='del'>-		/*</div><div class='del'>-		 * Here we may not defrag any range if holes are punched before</div><div class='del'>-		 * we locked the pages.</div><div class='del'>-		 * But that's fine, it only affects the @sectors_defragged</div><div class='del'>-		 * accounting.</div><div class='del'>-		 */</div><div class='del'>-		ret = defrag_one_range(inode, entry-&gt;start, range_len,</div><div class='del'>-				       extent_thresh, newer_than, do_compress);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			break;</div><div class='del'>-		*sectors_defragged += range_len;</div><div class='del'>-	}</div><div class='add'>+	atomic_dec(&amp;root-&gt;snapshot_force_cow);</div><div class='ctx'> out:</div><div class='del'>-	list_for_each_entry_safe(entry, tmp, &amp;target_list, list) {</div><div class='del'>-		list_del_init(&amp;entry-&gt;list);</div><div class='del'>-		kfree(entry);</div><div class='del'>-	}</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Entry point to file defragmentation.</div><div class='del'>- *</div><div class='del'>- * @inode:	   inode to be defragged</div><div class='del'>- * @ra:		   readahead state (can be NUL)</div><div class='del'>- * @range:	   defrag options including range and flags</div><div class='del'>- * @newer_than:	   minimum transid to defrag</div><div class='del'>- * @max_to_defrag: max number of sectors to be defragged, if 0, the whole inode</div><div class='del'>- *		   will be defragged.</div><div class='del'>- */</div><div class='del'>-int btrfs_defrag_file(struct inode *inode, struct file_ra_state *ra,</div><div class='del'>-		      struct btrfs_ioctl_defrag_range_args *range,</div><div class='del'>-		      u64 newer_than, unsigned long max_to_defrag)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	unsigned long sectors_defragged = 0;</div><div class='del'>-	u64 isize = i_size_read(inode);</div><div class='del'>-	u64 cur;</div><div class='del'>-	u64 last_byte;</div><div class='del'>-	bool do_compress = range-&gt;flags &amp; BTRFS_DEFRAG_RANGE_COMPRESS;</div><div class='del'>-	bool ra_allocated = false;</div><div class='del'>-	int compress_type = BTRFS_COMPRESS_ZLIB;</div><div class='del'>-	int ret = 0;</div><div class='del'>-	u32 extent_thresh = range-&gt;extent_thresh;</div><div class='del'>-</div><div class='del'>-	if (isize == 0)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	if (range-&gt;start &gt;= isize)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	if (do_compress) {</div><div class='del'>-		if (range-&gt;compress_type &gt;= BTRFS_NR_COMPRESS_TYPES)</div><div class='del'>-			return -EINVAL;</div><div class='del'>-		if (range-&gt;compress_type)</div><div class='del'>-			compress_type = range-&gt;compress_type;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (extent_thresh == 0)</div><div class='del'>-		extent_thresh = SZ_256K;</div><div class='del'>-</div><div class='del'>-	if (range-&gt;start + range-&gt;len &gt; range-&gt;start) {</div><div class='del'>-		/* Got a specific range */</div><div class='del'>-		last_byte = min(isize, range-&gt;start + range-&gt;len) - 1;</div><div class='del'>-	} else {</div><div class='del'>-		/* Defrag until file end */</div><div class='del'>-		last_byte = isize - 1;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If we were not given a ra, allocate a readahead context. As</div><div class='del'>-	 * readahead is just an optimization, defrag will work without it so</div><div class='del'>-	 * we don't error out.</div><div class='del'>-	 */</div><div class='del'>-	if (!ra) {</div><div class='del'>-		ra_allocated = true;</div><div class='del'>-		ra = kzalloc(sizeof(*ra), GFP_KERNEL);</div><div class='del'>-		if (ra)</div><div class='del'>-			file_ra_state_init(ra, inode-&gt;i_mapping);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Align the range */</div><div class='del'>-	cur = round_down(range-&gt;start, fs_info-&gt;sectorsize);</div><div class='del'>-	last_byte = round_up(last_byte, fs_info-&gt;sectorsize) - 1;</div><div class='del'>-</div><div class='del'>-	while (cur &lt; last_byte) {</div><div class='del'>-		u64 cluster_end;</div><div class='del'>-</div><div class='del'>-		/* The cluster size 256K should always be page aligned */</div><div class='del'>-		BUILD_BUG_ON(!IS_ALIGNED(CLUSTER_SIZE, PAGE_SIZE));</div><div class='del'>-</div><div class='del'>-		/* We want the cluster end at page boundary when possible */</div><div class='del'>-		cluster_end = (((cur &gt;&gt; PAGE_SHIFT) +</div><div class='del'>-			       (SZ_256K &gt;&gt; PAGE_SHIFT)) &lt;&lt; PAGE_SHIFT) - 1;</div><div class='del'>-		cluster_end = min(cluster_end, last_byte);</div><div class='del'>-</div><div class='del'>-		btrfs_inode_lock(inode, 0);</div><div class='del'>-		if (IS_SWAPFILE(inode)) {</div><div class='del'>-			ret = -ETXTBSY;</div><div class='del'>-			btrfs_inode_unlock(inode, 0);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		if (!(inode-&gt;i_sb-&gt;s_flags &amp; SB_ACTIVE)) {</div><div class='del'>-			btrfs_inode_unlock(inode, 0);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		if (do_compress)</div><div class='del'>-			BTRFS_I(inode)-&gt;defrag_compress = compress_type;</div><div class='del'>-		ret = defrag_one_cluster(BTRFS_I(inode), ra, cur,</div><div class='del'>-				cluster_end + 1 - cur, extent_thresh,</div><div class='del'>-				newer_than, do_compress,</div><div class='del'>-				&amp;sectors_defragged, max_to_defrag);</div><div class='del'>-		btrfs_inode_unlock(inode, 0);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			break;</div><div class='del'>-		cur = cluster_end + 1;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (ra_allocated)</div><div class='del'>-		kfree(ra);</div><div class='del'>-	if (sectors_defragged) {</div><div class='del'>-		/*</div><div class='del'>-		 * We have defragged some sectors, for compression case they</div><div class='del'>-		 * need to be written back immediately.</div><div class='del'>-		 */</div><div class='del'>-		if (range-&gt;flags &amp; BTRFS_DEFRAG_RANGE_START_IO) {</div><div class='del'>-			filemap_flush(inode-&gt;i_mapping);</div><div class='del'>-			if (test_bit(BTRFS_INODE_HAS_ASYNC_EXTENT,</div><div class='del'>-				     &amp;BTRFS_I(inode)-&gt;runtime_flags))</div><div class='del'>-				filemap_flush(inode-&gt;i_mapping);</div><div class='del'>-		}</div><div class='del'>-		if (range-&gt;compress_type == BTRFS_COMPRESS_LZO)</div><div class='del'>-			btrfs_set_fs_incompat(fs_info, COMPRESS_LZO);</div><div class='del'>-		else if (range-&gt;compress_type == BTRFS_COMPRESS_ZSTD)</div><div class='del'>-			btrfs_set_fs_incompat(fs_info, COMPRESS_ZSTD);</div><div class='del'>-		ret = sectors_defragged;</div><div class='del'>-	}</div><div class='del'>-	if (do_compress) {</div><div class='del'>-		btrfs_inode_lock(inode, 0);</div><div class='del'>-		BTRFS_I(inode)-&gt;defrag_compress = BTRFS_COMPRESS_NONE;</div><div class='del'>-		btrfs_inode_unlock(inode, 0);</div><div class='del'>-	}</div><div class='add'>+	btrfs_drew_read_unlock(&amp;root-&gt;snapshot_lock);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1618,17 +1019,14 @@ static noinline int btrfs_ioctl_resize(struct file *file,</div><div class='ctx'> 					void __user *arg)</div><div class='ctx'> {</div><div class='ctx'> 	BTRFS_DEV_LOOKUP_ARGS(args);</div><div class='del'>-	struct inode *inode = file_inode(file);</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='add'>+	struct btrfs_root *root = BTRFS_I(file_inode(file))-&gt;root;</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	u64 new_size;</div><div class='ctx'> 	u64 old_size;</div><div class='ctx'> 	u64 devid = 1;</div><div class='del'>-	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='ctx'> 	struct btrfs_ioctl_vol_args *vol_args;</div><div class='del'>-	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	struct btrfs_device *device = NULL;</div><div class='ctx'> 	char *sizestr;</div><div class='del'>-	char *retptr;</div><div class='ctx'> 	char *devstr = NULL;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int mod = 0;</div><div class='hunk'>@@ -1650,7 +1048,10 @@ static noinline int btrfs_ioctl_resize(struct file *file,</div><div class='ctx'> 		ret = PTR_ERR(vol_args);</div><div class='ctx'> 		goto out_drop;</div><div class='ctx'> 	}</div><div class='del'>-	vol_args-&gt;name[BTRFS_PATH_NAME_MAX] = '\0';</div><div class='add'>+	ret = btrfs_check_ioctl_vol_args_path(vol_args);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out_free;</div><div class='add'>+</div><div class='ctx'> 	sizestr = vol_args-&gt;name;</div><div class='ctx'> 	cancel = (strcmp("cancel", sizestr) == 0);</div><div class='ctx'> 	ret = exclop_start_or_cancel_reloc(fs_info, BTRFS_EXCLOP_RESIZE, cancel);</div><div class='hunk'>@@ -1693,6 +1094,8 @@ static noinline int btrfs_ioctl_resize(struct file *file,</div><div class='ctx'> 	if (!strcmp(sizestr, "max"))</div><div class='ctx'> 		new_size = bdev_nr_bytes(device-&gt;bdev);</div><div class='ctx'> 	else {</div><div class='add'>+		char *retptr;</div><div class='add'>+</div><div class='ctx'> 		if (sizestr[0] == '-') {</div><div class='ctx'> 			mod = -1;</div><div class='ctx'> 			sizestr++;</div><div class='hunk'>@@ -1740,6 +1143,8 @@ static noinline int btrfs_ioctl_resize(struct file *file,</div><div class='ctx'> 	new_size = round_down(new_size, fs_info-&gt;sectorsize);</div><div class='ctx'> </div><div class='ctx'> 	if (new_size &gt; old_size) {</div><div class='add'>+		struct btrfs_trans_handle *trans;</div><div class='add'>+</div><div class='ctx'> 		trans = btrfs_start_transaction(root, 0);</div><div class='ctx'> 		if (IS_ERR(trans)) {</div><div class='ctx'> 			ret = PTR_ERR(trans);</div><div class='hunk'>@@ -1752,9 +1157,9 @@ static noinline int btrfs_ioctl_resize(struct file *file,</div><div class='ctx'> 	} /* equal, nothing need to do */</div><div class='ctx'> </div><div class='ctx'> 	if (ret == 0 &amp;&amp; new_size != old_size)</div><div class='del'>-		btrfs_info_in_rcu(fs_info,</div><div class='add'>+		btrfs_info(fs_info,</div><div class='ctx'> 			"resize device %s (devid %llu) from %llu to %llu",</div><div class='del'>-			rcu_str_deref(device-&gt;name), device-&gt;devid,</div><div class='add'>+			btrfs_dev_name(device), device-&gt;devid,</div><div class='ctx'> 			old_size, new_size);</div><div class='ctx'> out_finish:</div><div class='ctx'> 	btrfs_exclop_finish(fs_info);</div><div class='hunk'>@@ -1766,13 +1171,13 @@ out_drop:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static noinline int __btrfs_ioctl_snap_create(struct file *file,</div><div class='del'>-				struct user_namespace *mnt_userns,</div><div class='del'>-				const char *name, unsigned long fd, int subvol,</div><div class='add'>+				struct mnt_idmap *idmap,</div><div class='add'>+				const char *name, unsigned long fd, bool subvol,</div><div class='ctx'> 				bool readonly,</div><div class='ctx'> 				struct btrfs_qgroup_inherit *inherit)</div><div class='ctx'> {</div><div class='del'>-	int namelen;</div><div class='ctx'> 	int ret = 0;</div><div class='add'>+	struct qstr qname = QSTR_INIT(name, strlen(name));</div><div class='ctx'> </div><div class='ctx'> 	if (!S_ISDIR(file_inode(file)-&gt;i_mode))</div><div class='ctx'> 		return -ENOTDIR;</div><div class='hunk'>@@ -1781,47 +1186,53 @@ static noinline int __btrfs_ioctl_snap_create(struct file *file,</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	namelen = strlen(name);</div><div class='ctx'> 	if (strchr(name, '/')) {</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 		goto out_drop_write;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (name[0] == '.' &amp;&amp;</div><div class='del'>-	   (namelen == 1 || (name[1] == '.' &amp;&amp; namelen == 2))) {</div><div class='add'>+	if (qname.name[0] == '.' &amp;&amp;</div><div class='add'>+	   (qname.len == 1 || (qname.name[1] == '.' &amp;&amp; qname.len == 2))) {</div><div class='ctx'> 		ret = -EEXIST;</div><div class='ctx'> 		goto out_drop_write;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (subvol) {</div><div class='del'>-		ret = btrfs_mksubvol(&amp;file-&gt;f_path, mnt_userns, name,</div><div class='del'>-				     namelen, NULL, readonly, inherit);</div><div class='add'>+		ret = btrfs_mksubvol(file_dentry(file), idmap, &amp;qname, NULL,</div><div class='add'>+				     readonly, inherit);</div><div class='ctx'> 	} else {</div><div class='del'>-		struct fd src = fdget(fd);</div><div class='add'>+		CLASS(fd, src)(fd);</div><div class='ctx'> 		struct inode *src_inode;</div><div class='del'>-		if (!src.file) {</div><div class='add'>+		if (fd_empty(src)) {</div><div class='ctx'> 			ret = -EINVAL;</div><div class='ctx'> 			goto out_drop_write;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		src_inode = file_inode(src.file);</div><div class='add'>+		src_inode = file_inode(fd_file(src));</div><div class='ctx'> 		if (src_inode-&gt;i_sb != file_inode(file)-&gt;i_sb) {</div><div class='ctx'> 			btrfs_info(BTRFS_I(file_inode(file))-&gt;root-&gt;fs_info,</div><div class='ctx'> 				   "Snapshot src from another FS");</div><div class='ctx'> 			ret = -EXDEV;</div><div class='del'>-		} else if (!inode_owner_or_capable(mnt_userns, src_inode)) {</div><div class='add'>+		} else if (!inode_owner_or_capable(idmap, src_inode)) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Subvolume creation is not restricted, but snapshots</div><div class='ctx'> 			 * are limited to own subvolumes only</div><div class='ctx'> 			 */</div><div class='ctx'> 			ret = -EPERM;</div><div class='add'>+		} else if (btrfs_ino(BTRFS_I(src_inode)) != BTRFS_FIRST_FREE_OBJECTID) {</div><div class='add'>+			/*</div><div class='add'>+			 * Snapshots must be made with the src_inode referring</div><div class='add'>+			 * to the subvolume inode, otherwise the permission</div><div class='add'>+			 * checking above is useless because we may have</div><div class='add'>+			 * permission on a lower directory but not the subvol</div><div class='add'>+			 * itself.</div><div class='add'>+			 */</div><div class='add'>+			ret = -EINVAL;</div><div class='ctx'> 		} else {</div><div class='del'>-			ret = btrfs_mksnapshot(&amp;file-&gt;f_path, mnt_userns,</div><div class='del'>-					       name, namelen,</div><div class='add'>+			ret = btrfs_mksnapshot(file_dentry(file), idmap, &amp;qname,</div><div class='ctx'> 					       BTRFS_I(src_inode)-&gt;root,</div><div class='ctx'> 					       readonly, inherit);</div><div class='ctx'> 		}</div><div class='del'>-		fdput(src);</div><div class='ctx'> 	}</div><div class='ctx'> out_drop_write:</div><div class='ctx'> 	mnt_drop_write_file(file);</div><div class='hunk'>@@ -1830,7 +1241,7 @@ out:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static noinline int btrfs_ioctl_snap_create(struct file *file,</div><div class='del'>-					    void __user *arg, int subvol)</div><div class='add'>+					    void __user *arg, bool subvol)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_ioctl_vol_args *vol_args;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -1841,18 +1252,21 @@ static noinline int btrfs_ioctl_snap_create(struct file *file,</div><div class='ctx'> 	vol_args = memdup_user(arg, sizeof(*vol_args));</div><div class='ctx'> 	if (IS_ERR(vol_args))</div><div class='ctx'> 		return PTR_ERR(vol_args);</div><div class='del'>-	vol_args-&gt;name[BTRFS_PATH_NAME_MAX] = '\0';</div><div class='add'>+	ret = btrfs_check_ioctl_vol_args_path(vol_args);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='del'>-	ret = __btrfs_ioctl_snap_create(file, file_mnt_user_ns(file),</div><div class='add'>+	ret = __btrfs_ioctl_snap_create(file, file_mnt_idmap(file),</div><div class='ctx'> 					vol_args-&gt;name, vol_args-&gt;fd, subvol,</div><div class='ctx'> 					false, NULL);</div><div class='ctx'> </div><div class='add'>+out:</div><div class='ctx'> 	kfree(vol_args);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static noinline int btrfs_ioctl_snap_create_v2(struct file *file,</div><div class='del'>-					       void __user *arg, int subvol)</div><div class='add'>+					       void __user *arg, bool subvol)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_ioctl_vol_args_v2 *vol_args;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -1865,7 +1279,9 @@ static noinline int btrfs_ioctl_snap_create_v2(struct file *file,</div><div class='ctx'> 	vol_args = memdup_user(arg, sizeof(*vol_args));</div><div class='ctx'> 	if (IS_ERR(vol_args))</div><div class='ctx'> 		return PTR_ERR(vol_args);</div><div class='del'>-	vol_args-&gt;name[BTRFS_SUBVOL_NAME_MAX] = '\0';</div><div class='add'>+	ret = btrfs_check_ioctl_vol_args2_subvol_name(vol_args);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto free_args;</div><div class='ctx'> </div><div class='ctx'> 	if (vol_args-&gt;flags &amp; ~BTRFS_SUBVOL_CREATE_ARGS_MASK) {</div><div class='ctx'> 		ret = -EOPNOTSUPP;</div><div class='hunk'>@@ -1875,7 +1291,7 @@ static noinline int btrfs_ioctl_snap_create_v2(struct file *file,</div><div class='ctx'> 	if (vol_args-&gt;flags &amp; BTRFS_SUBVOL_RDONLY)</div><div class='ctx'> 		readonly = true;</div><div class='ctx'> 	if (vol_args-&gt;flags &amp; BTRFS_SUBVOL_QGROUP_INHERIT) {</div><div class='del'>-		u64 nums;</div><div class='add'>+		struct btrfs_fs_info *fs_info = inode_to_fs_info(file_inode(file));</div><div class='ctx'> </div><div class='ctx'> 		if (vol_args-&gt;size &lt; sizeof(*inherit) ||</div><div class='ctx'> 		    vol_args-&gt;size &gt; PAGE_SIZE) {</div><div class='hunk'>@@ -1888,22 +1304,12 @@ static noinline int btrfs_ioctl_snap_create_v2(struct file *file,</div><div class='ctx'> 			goto free_args;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (inherit-&gt;num_qgroups &gt; PAGE_SIZE ||</div><div class='del'>-		    inherit-&gt;num_ref_copies &gt; PAGE_SIZE ||</div><div class='del'>-		    inherit-&gt;num_excl_copies &gt; PAGE_SIZE) {</div><div class='del'>-			ret = -EINVAL;</div><div class='del'>-			goto free_inherit;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		nums = inherit-&gt;num_qgroups + 2 * inherit-&gt;num_ref_copies +</div><div class='del'>-		       2 * inherit-&gt;num_excl_copies;</div><div class='del'>-		if (vol_args-&gt;size != struct_size(inherit, qgroups, nums)) {</div><div class='del'>-			ret = -EINVAL;</div><div class='add'>+		ret = btrfs_qgroup_check_inherit(fs_info, inherit, vol_args-&gt;size);</div><div class='add'>+		if (ret &lt; 0)</div><div class='ctx'> 			goto free_inherit;</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = __btrfs_ioctl_snap_create(file, file_mnt_user_ns(file),</div><div class='add'>+	ret = __btrfs_ioctl_snap_create(file, file_mnt_idmap(file),</div><div class='ctx'> 					vol_args-&gt;name, vol_args-&gt;fd, subvol,</div><div class='ctx'> 					readonly, inherit);</div><div class='ctx'> 	if (ret)</div><div class='hunk'>@@ -1915,16 +1321,15 @@ free_args:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline int btrfs_ioctl_subvol_getflags(struct file *file,</div><div class='add'>+static noinline int btrfs_ioctl_subvol_getflags(struct btrfs_inode *inode,</div><div class='ctx'> 						void __user *arg)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = file_inode(file);</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	u64 flags = 0;</div><div class='ctx'> </div><div class='del'>-	if (btrfs_ino(BTRFS_I(inode)) != BTRFS_FIRST_FREE_OBJECTID)</div><div class='add'>+	if (btrfs_ino(inode) != BTRFS_FIRST_FREE_OBJECTID)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	down_read(&amp;fs_info-&gt;subvol_sem);</div><div class='hunk'>@@ -1942,14 +1347,14 @@ static noinline int btrfs_ioctl_subvol_setflags(struct file *file,</div><div class='ctx'> 					      void __user *arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	u64 root_flags;</div><div class='ctx'> 	u64 flags;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	if (!inode_owner_or_capable(file_mnt_user_ns(file), inode))</div><div class='add'>+	if (!inode_owner_or_capable(file_mnt_idmap(file), inode))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='ctx'> 	ret = mnt_want_write_file(file);</div><div class='hunk'>@@ -1995,7 +1400,7 @@ static noinline int btrfs_ioctl_subvol_setflags(struct file *file,</div><div class='ctx'> 			spin_unlock(&amp;root-&gt;root_item_lock);</div><div class='ctx'> 			btrfs_warn(fs_info,</div><div class='ctx'> 				   "Attempt to set subvolume %llu read-write during send",</div><div class='del'>-				   root-&gt;root_key.objectid);</div><div class='add'>+				   btrfs_root_id(root));</div><div class='ctx'> 			ret = -EPERM;</div><div class='ctx'> 			goto out_drop_sem;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2027,8 +1432,8 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline int key_in_sk(struct btrfs_key *key,</div><div class='del'>-			      struct btrfs_ioctl_search_key *sk)</div><div class='add'>+static noinline bool key_in_sk(const struct btrfs_key *key,</div><div class='add'>+			       const struct btrfs_ioctl_search_key *sk)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_key test;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -2039,7 +1444,7 @@ static noinline int key_in_sk(struct btrfs_key *key,</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_comp_cpu_keys(key, &amp;test);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	test.objectid = sk-&gt;max_objectid;</div><div class='ctx'> 	test.type = sk-&gt;max_type;</div><div class='hunk'>@@ -2047,14 +1452,14 @@ static noinline int key_in_sk(struct btrfs_key *key,</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_comp_cpu_keys(key, &amp;test);</div><div class='ctx'> 	if (ret &gt; 0)</div><div class='del'>-		return 0;</div><div class='del'>-	return 1;</div><div class='add'>+		return false;</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static noinline int copy_to_sk(struct btrfs_path *path,</div><div class='ctx'> 			       struct btrfs_key *key,</div><div class='del'>-			       struct btrfs_ioctl_search_key *sk,</div><div class='del'>-			       size_t *buf_size,</div><div class='add'>+			       const struct btrfs_ioctl_search_key *sk,</div><div class='add'>+			       u64 *buf_size,</div><div class='ctx'> 			       char __user *ubuf,</div><div class='ctx'> 			       unsigned long *sk_offset,</div><div class='ctx'> 			       int *num_found)</div><div class='hunk'>@@ -2082,7 +1487,7 @@ static noinline int copy_to_sk(struct btrfs_path *path,</div><div class='ctx'> </div><div class='ctx'> 	for (i = slot; i &lt; nritems; i++) {</div><div class='ctx'> 		item_off = btrfs_item_ptr_offset(leaf, i);</div><div class='del'>-		item_len = btrfs_item_size_nr(leaf, i);</div><div class='add'>+		item_len = btrfs_item_size(leaf, i);</div><div class='ctx'> </div><div class='ctx'> 		btrfs_item_key_to_cpu(leaf, key, i);</div><div class='ctx'> 		if (!key_in_sk(key, sk))</div><div class='hunk'>@@ -2110,8 +1515,8 @@ static noinline int copy_to_sk(struct btrfs_path *path,</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		sh.objectid = key-&gt;objectid;</div><div class='del'>-		sh.offset = key-&gt;offset;</div><div class='ctx'> 		sh.type = key-&gt;type;</div><div class='add'>+		sh.offset = key-&gt;offset;</div><div class='ctx'> 		sh.len = item_len;</div><div class='ctx'> 		sh.transid = found_transid;</div><div class='ctx'> </div><div class='hunk'>@@ -2184,15 +1589,14 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline int search_ioctl(struct inode *inode,</div><div class='add'>+static noinline int search_ioctl(struct btrfs_root *root,</div><div class='ctx'> 				 struct btrfs_ioctl_search_key *sk,</div><div class='del'>-				 size_t *buf_size,</div><div class='add'>+				 u64 *buf_size,</div><div class='ctx'> 				 char __user *ubuf)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	struct btrfs_root *root;</div><div class='add'>+	struct btrfs_fs_info *info = root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int num_found = 0;</div><div class='ctx'> 	unsigned long sk_offset = 0;</div><div class='hunk'>@@ -2207,14 +1611,13 @@ static noinline int search_ioctl(struct inode *inode,</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	if (sk-&gt;tree_id == 0) {</div><div class='del'>-		/* search the root of the inode that was passed */</div><div class='del'>-		root = btrfs_grab_root(BTRFS_I(inode)-&gt;root);</div><div class='add'>+		/* Search the root that we got passed. */</div><div class='add'>+		root = btrfs_grab_root(root);</div><div class='ctx'> 	} else {</div><div class='add'>+		/* Look up the root from the arguments. */</div><div class='ctx'> 		root = btrfs_get_fs_root(info, sk-&gt;tree_id, true);</div><div class='del'>-		if (IS_ERR(root)) {</div><div class='del'>-			btrfs_free_path(path);</div><div class='add'>+		if (IS_ERR(root))</div><div class='ctx'> 			return PTR_ERR(root);</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = sk-&gt;min_objectid;</div><div class='hunk'>@@ -2222,16 +1625,19 @@ static noinline int search_ioctl(struct inode *inode,</div><div class='ctx'> 	key.offset = sk-&gt;min_offset;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='del'>-		ret = -EFAULT;</div><div class='del'>-		if (fault_in_writeable(ubuf + sk_offset, *buf_size - sk_offset))</div><div class='add'>+		/*</div><div class='add'>+		 * Ensure that the whole user buffer is faulted in at sub-page</div><div class='add'>+		 * granularity, otherwise the loop may live-lock.</div><div class='add'>+		 */</div><div class='add'>+		if (fault_in_subpage_writeable(ubuf + sk_offset, *buf_size - sk_offset)) {</div><div class='add'>+			ret = -EFAULT;</div><div class='ctx'> 			break;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		ret = btrfs_search_forward(root, &amp;key, path, sk-&gt;min_transid);</div><div class='del'>-		if (ret != 0) {</div><div class='del'>-			if (ret &gt; 0)</div><div class='del'>-				ret = 0;</div><div class='del'>-			goto err;</div><div class='del'>-		}</div><div class='add'>+		if (ret)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='ctx'> 		ret = copy_to_sk(path, &amp;key, sk, buf_size, ubuf,</div><div class='ctx'> 				 &amp;sk_offset, &amp;num_found);</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='hunk'>@@ -2239,36 +1645,32 @@ static noinline int search_ioctl(struct inode *inode,</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='ctx'> 	}</div><div class='add'>+	/* Normalize return values from btrfs_search_forward() and copy_to_sk(). */</div><div class='ctx'> 	if (ret &gt; 0)</div><div class='ctx'> 		ret = 0;</div><div class='del'>-err:</div><div class='add'>+</div><div class='ctx'> 	sk-&gt;nr_items = num_found;</div><div class='ctx'> 	btrfs_put_root(root);</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline int btrfs_ioctl_tree_search(struct file *file,</div><div class='del'>-					   void __user *argp)</div><div class='add'>+static noinline int btrfs_ioctl_tree_search(struct btrfs_root *root,</div><div class='add'>+					    void __user *argp)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_ioctl_search_args __user *uargs;</div><div class='add'>+	struct btrfs_ioctl_search_args __user *uargs = argp;</div><div class='ctx'> 	struct btrfs_ioctl_search_key sk;</div><div class='del'>-	struct inode *inode;</div><div class='ctx'> 	int ret;</div><div class='del'>-	size_t buf_size;</div><div class='add'>+	u64 buf_size;</div><div class='ctx'> </div><div class='ctx'> 	if (!capable(CAP_SYS_ADMIN))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='del'>-	uargs = (struct btrfs_ioctl_search_args __user *)argp;</div><div class='del'>-</div><div class='ctx'> 	if (copy_from_user(&amp;sk, &amp;uargs-&gt;key, sizeof(sk)))</div><div class='ctx'> 		return -EFAULT;</div><div class='ctx'> </div><div class='ctx'> 	buf_size = sizeof(uargs-&gt;buf);</div><div class='ctx'> </div><div class='del'>-	inode = file_inode(file);</div><div class='del'>-	ret = search_ioctl(inode, &amp;sk, &amp;buf_size, uargs-&gt;buf);</div><div class='add'>+	ret = search_ioctl(root, &amp;sk, &amp;buf_size, uargs-&gt;buf);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * In the origin implementation an overflow is handled by returning a</div><div class='hunk'>@@ -2282,21 +1684,19 @@ static noinline int btrfs_ioctl_tree_search(struct file *file,</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline int btrfs_ioctl_tree_search_v2(struct file *file,</div><div class='add'>+static noinline int btrfs_ioctl_tree_search_v2(struct btrfs_root *root,</div><div class='ctx'> 					       void __user *argp)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_ioctl_search_args_v2 __user *uarg;</div><div class='add'>+	struct btrfs_ioctl_search_args_v2 __user *uarg = argp;</div><div class='ctx'> 	struct btrfs_ioctl_search_args_v2 args;</div><div class='del'>-	struct inode *inode;</div><div class='ctx'> 	int ret;</div><div class='del'>-	size_t buf_size;</div><div class='del'>-	const size_t buf_limit = SZ_16M;</div><div class='add'>+	u64 buf_size;</div><div class='add'>+	const u64 buf_limit = SZ_16M;</div><div class='ctx'> </div><div class='ctx'> 	if (!capable(CAP_SYS_ADMIN))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='ctx'> 	/* copy search header and buffer size */</div><div class='del'>-	uarg = (struct btrfs_ioctl_search_args_v2 __user *)argp;</div><div class='ctx'> 	if (copy_from_user(&amp;args, uarg, sizeof(args)))</div><div class='ctx'> 		return -EFAULT;</div><div class='ctx'> </div><div class='hunk'>@@ -2306,8 +1706,7 @@ static noinline int btrfs_ioctl_tree_search_v2(struct file *file,</div><div class='ctx'> 	if (buf_size &gt; buf_limit)</div><div class='ctx'> 		buf_size = buf_limit;</div><div class='ctx'> </div><div class='del'>-	inode = file_inode(file);</div><div class='del'>-	ret = search_ioctl(inode, &amp;args.key, &amp;buf_size,</div><div class='add'>+	ret = search_ioctl(root, &amp;args.key, &amp;buf_size,</div><div class='ctx'> 			   (char __user *)(&amp;uarg-&gt;buf[0]));</div><div class='ctx'> 	if (ret == 0 &amp;&amp; copy_to_user(&amp;uarg-&gt;key, &amp;args.key, sizeof(args.key)))</div><div class='ctx'> 		ret = -EFAULT;</div><div class='hunk'>@@ -2334,7 +1733,7 @@ static noinline int btrfs_search_path_in_tree(struct btrfs_fs_info *info,</div><div class='ctx'> 	int total_len = 0;</div><div class='ctx'> 	struct btrfs_inode_ref *iref;</div><div class='ctx'> 	struct extent_buffer *l;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> </div><div class='ctx'> 	if (dirid == BTRFS_FIRST_FREE_OBJECTID) {</div><div class='ctx'> 		name[0]='\0';</div><div class='hunk'>@@ -2395,28 +1794,25 @@ static noinline int btrfs_search_path_in_tree(struct btrfs_fs_info *info,</div><div class='ctx'> 	ret = 0;</div><div class='ctx'> out:</div><div class='ctx'> 	btrfs_put_root(root);</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btrfs_search_path_in_tree_user(struct user_namespace *mnt_userns,</div><div class='add'>+static int btrfs_search_path_in_tree_user(struct mnt_idmap *idmap,</div><div class='ctx'> 				struct inode *inode,</div><div class='ctx'> 				struct btrfs_ioctl_ino_lookup_user_args *args)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = BTRFS_I(inode)-&gt;root-&gt;fs_info;</div><div class='del'>-	struct super_block *sb = inode-&gt;i_sb;</div><div class='del'>-	struct btrfs_key upper_limit = BTRFS_I(inode)-&gt;location;</div><div class='del'>-	u64 treeid = BTRFS_I(inode)-&gt;root-&gt;root_key.objectid;</div><div class='add'>+	u64 upper_limit = btrfs_ino(BTRFS_I(inode));</div><div class='add'>+	u64 treeid = btrfs_root_id(BTRFS_I(inode)-&gt;root);</div><div class='ctx'> 	u64 dirid = args-&gt;dirid;</div><div class='ctx'> 	unsigned long item_off;</div><div class='ctx'> 	unsigned long item_len;</div><div class='ctx'> 	struct btrfs_inode_ref *iref;</div><div class='ctx'> 	struct btrfs_root_ref *rref;</div><div class='ctx'> 	struct btrfs_root *root = NULL;</div><div class='del'>-	struct btrfs_path *path;</div><div class='del'>-	struct btrfs_key key, key2;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='add'>+	struct btrfs_key key;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='del'>-	struct inode *temp_inode;</div><div class='ctx'> 	char *ptr;</div><div class='ctx'> 	int slot;</div><div class='ctx'> 	int len;</div><div class='hunk'>@@ -2431,19 +1827,19 @@ static int btrfs_search_path_in_tree_user(struct user_namespace *mnt_userns,</div><div class='ctx'> 	 * If the bottom subvolume does not exist directly under upper_limit,</div><div class='ctx'> 	 * construct the path in from the bottom up.</div><div class='ctx'> 	 */</div><div class='del'>-	if (dirid != upper_limit.objectid) {</div><div class='add'>+	if (dirid != upper_limit) {</div><div class='ctx'> 		ptr = &amp;args-&gt;path[BTRFS_INO_LOOKUP_USER_PATH_MAX - 1];</div><div class='ctx'> </div><div class='ctx'> 		root = btrfs_get_fs_root(fs_info, treeid, true);</div><div class='del'>-		if (IS_ERR(root)) {</div><div class='del'>-			ret = PTR_ERR(root);</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+		if (IS_ERR(root))</div><div class='add'>+			return PTR_ERR(root);</div><div class='ctx'> </div><div class='ctx'> 		key.objectid = dirid;</div><div class='ctx'> 		key.type = BTRFS_INODE_REF_KEY;</div><div class='ctx'> 		key.offset = (u64)-1;</div><div class='ctx'> 		while (1) {</div><div class='add'>+			struct btrfs_inode *temp_inode;</div><div class='add'>+</div><div class='ctx'> 			ret = btrfs_search_backwards(root, &amp;key, path);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='ctx'> 				goto out_put;</div><div class='hunk'>@@ -2468,45 +1864,32 @@ static int btrfs_search_path_in_tree_user(struct user_namespace *mnt_userns,</div><div class='ctx'> 			read_extent_buffer(leaf, ptr,</div><div class='ctx'> 					(unsigned long)(iref + 1), len);</div><div class='ctx'> </div><div class='del'>-			/* Check the read+exec permission of this directory */</div><div class='del'>-			ret = btrfs_previous_item(root, path, dirid,</div><div class='del'>-						  BTRFS_INODE_ITEM_KEY);</div><div class='del'>-			if (ret &lt; 0) {</div><div class='del'>-				goto out_put;</div><div class='del'>-			} else if (ret &gt; 0) {</div><div class='del'>-				ret = -ENOENT;</div><div class='del'>-				goto out_put;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			leaf = path-&gt;nodes[0];</div><div class='del'>-			slot = path-&gt;slots[0];</div><div class='del'>-			btrfs_item_key_to_cpu(leaf, &amp;key2, slot);</div><div class='del'>-			if (key2.objectid != dirid) {</div><div class='del'>-				ret = -ENOENT;</div><div class='del'>-				goto out_put;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			temp_inode = btrfs_iget(sb, key2.objectid, root);</div><div class='add'>+			/*</div><div class='add'>+			 * We don't need the path anymore, so release it and</div><div class='add'>+			 * avoid deadlocks and lockdep warnings in case</div><div class='add'>+			 * btrfs_iget() needs to lookup the inode from its root</div><div class='add'>+			 * btree and lock the same leaf.</div><div class='add'>+			 */</div><div class='add'>+			btrfs_release_path(path);</div><div class='add'>+			temp_inode = btrfs_iget(key.offset, root);</div><div class='ctx'> 			if (IS_ERR(temp_inode)) {</div><div class='ctx'> 				ret = PTR_ERR(temp_inode);</div><div class='ctx'> 				goto out_put;</div><div class='ctx'> 			}</div><div class='del'>-			ret = inode_permission(mnt_userns, temp_inode,</div><div class='add'>+			/* Check the read+exec permission of this directory. */</div><div class='add'>+			ret = inode_permission(idmap, &amp;temp_inode-&gt;vfs_inode,</div><div class='ctx'> 					       MAY_READ | MAY_EXEC);</div><div class='del'>-			iput(temp_inode);</div><div class='del'>-			if (ret) {</div><div class='del'>-				ret = -EACCES;</div><div class='add'>+			iput(&amp;temp_inode-&gt;vfs_inode);</div><div class='add'>+			if (ret)</div><div class='ctx'> 				goto out_put;</div><div class='del'>-			}</div><div class='ctx'> </div><div class='del'>-			if (key.offset == upper_limit.objectid)</div><div class='add'>+			if (key.offset == upper_limit)</div><div class='ctx'> 				break;</div><div class='ctx'> 			if (key.objectid == BTRFS_FIRST_FREE_OBJECTID) {</div><div class='ctx'> 				ret = -EACCES;</div><div class='ctx'> 				goto out_put;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			btrfs_release_path(path);</div><div class='ctx'> 			key.objectid = key.offset;</div><div class='ctx'> 			key.offset = (u64)-1;</div><div class='ctx'> 			dirid = key.objectid;</div><div class='hunk'>@@ -2524,25 +1907,21 @@ static int btrfs_search_path_in_tree_user(struct user_namespace *mnt_userns,</div><div class='ctx'> 	key.type = BTRFS_ROOT_REF_KEY;</div><div class='ctx'> 	key.offset = args-&gt;treeid;</div><div class='ctx'> 	ret = btrfs_search_slot(NULL, fs_info-&gt;tree_root, &amp;key, path, 0, 0);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		goto out;</div><div class='del'>-	} else if (ret &gt; 0) {</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+	else if (ret &gt; 0)</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	slot = path-&gt;slots[0];</div><div class='ctx'> 	btrfs_item_key_to_cpu(leaf, &amp;key, slot);</div><div class='ctx'> </div><div class='ctx'> 	item_off = btrfs_item_ptr_offset(leaf, slot);</div><div class='del'>-	item_len = btrfs_item_size_nr(leaf, slot);</div><div class='add'>+	item_len = btrfs_item_size(leaf, slot);</div><div class='ctx'> 	/* Check if dirid in ROOT_REF corresponds to passed dirid */</div><div class='ctx'> 	rref = btrfs_item_ptr(leaf, slot, struct btrfs_root_ref);</div><div class='del'>-	if (args-&gt;dirid != btrfs_root_ref_dirid(leaf, rref)) {</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (args-&gt;dirid != btrfs_root_ref_dirid(leaf, rref))</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	/* Copy subvolume's name */</div><div class='ctx'> 	item_off += sizeof(struct btrfs_root_ref);</div><div class='hunk'>@@ -2552,30 +1931,26 @@ static int btrfs_search_path_in_tree_user(struct user_namespace *mnt_userns,</div><div class='ctx'> </div><div class='ctx'> out_put:</div><div class='ctx'> 	btrfs_put_root(root);</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline int btrfs_ioctl_ino_lookup(struct file *file,</div><div class='add'>+static noinline int btrfs_ioctl_ino_lookup(struct btrfs_root *root,</div><div class='ctx'> 					   void __user *argp)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_ioctl_ino_lookup_args *args;</div><div class='del'>-	struct inode *inode;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	args = memdup_user(argp, sizeof(*args));</div><div class='ctx'> 	if (IS_ERR(args))</div><div class='ctx'> 		return PTR_ERR(args);</div><div class='ctx'> </div><div class='del'>-	inode = file_inode(file);</div><div class='del'>-</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Unprivileged query to obtain the containing subvolume root id. The</div><div class='ctx'> 	 * path is reset so it's consistent with btrfs_search_path_in_tree.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (args-&gt;treeid == 0)</div><div class='del'>-		args-&gt;treeid = BTRFS_I(inode)-&gt;root-&gt;root_key.objectid;</div><div class='add'>+		args-&gt;treeid = btrfs_root_id(root);</div><div class='ctx'> </div><div class='ctx'> 	if (args-&gt;objectid == BTRFS_FIRST_FREE_OBJECTID) {</div><div class='ctx'> 		args-&gt;name[0] = 0;</div><div class='hunk'>@@ -2587,7 +1962,7 @@ static noinline int btrfs_ioctl_ino_lookup(struct file *file,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_search_path_in_tree(BTRFS_I(inode)-&gt;root-&gt;fs_info,</div><div class='add'>+	ret = btrfs_search_path_in_tree(root-&gt;fs_info,</div><div class='ctx'> 					args-&gt;treeid, args-&gt;objectid,</div><div class='ctx'> 					args-&gt;name);</div><div class='ctx'> </div><div class='hunk'>@@ -2624,7 +1999,7 @@ static int btrfs_ioctl_ino_lookup_user(struct file *file, void __user *argp)</div><div class='ctx'> 	inode = file_inode(file);</div><div class='ctx'> </div><div class='ctx'> 	if (args-&gt;dirid == BTRFS_FIRST_FREE_OBJECTID &amp;&amp;</div><div class='del'>-	    BTRFS_I(inode)-&gt;location.objectid != BTRFS_FIRST_FREE_OBJECTID) {</div><div class='add'>+	    btrfs_ino(BTRFS_I(inode)) != BTRFS_FIRST_FREE_OBJECTID) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * The subvolume does not exist under fd with which this is</div><div class='ctx'> 		 * called</div><div class='hunk'>@@ -2633,7 +2008,7 @@ static int btrfs_ioctl_ino_lookup_user(struct file *file, void __user *argp)</div><div class='ctx'> 		return -EACCES;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_search_path_in_tree_user(file_mnt_user_ns(file), inode, args);</div><div class='add'>+	ret = btrfs_search_path_in_tree_user(file_mnt_idmap(file), inode, args);</div><div class='ctx'> </div><div class='ctx'> 	if (ret == 0 &amp;&amp; copy_to_user(argp, args, sizeof(*args)))</div><div class='ctx'> 		ret = -EFAULT;</div><div class='hunk'>@@ -2643,7 +2018,7 @@ static int btrfs_ioctl_ino_lookup_user(struct file *file, void __user *argp)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Get the subvolume information in BTRFS_ROOT_ITEM and BTRFS_ROOT_BACKREF */</div><div class='del'>-static int btrfs_ioctl_get_subvol_info(struct file *file, void __user *argp)</div><div class='add'>+static int btrfs_ioctl_get_subvol_info(struct inode *inode, void __user *argp)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_ioctl_get_subvol_info_args *subvol_info;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info;</div><div class='hunk'>@@ -2655,7 +2030,6 @@ static int btrfs_ioctl_get_subvol_info(struct file *file, void __user *argp)</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	unsigned long item_off;</div><div class='ctx'> 	unsigned long item_len;</div><div class='del'>-	struct inode *inode;</div><div class='ctx'> 	int slot;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -2669,11 +2043,10 @@ static int btrfs_ioctl_get_subvol_info(struct file *file, void __user *argp)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	inode = file_inode(file);</div><div class='ctx'> 	fs_info = BTRFS_I(inode)-&gt;root-&gt;fs_info;</div><div class='ctx'> </div><div class='ctx'> 	/* Get root_item of inode's subvolume */</div><div class='del'>-	key.objectid = BTRFS_I(inode)-&gt;root-&gt;root_key.objectid;</div><div class='add'>+	key.objectid = btrfs_root_id(BTRFS_I(inode)-&gt;root);</div><div class='ctx'> 	root = btrfs_get_fs_root(fs_info, key.objectid, true);</div><div class='ctx'> 	if (IS_ERR(root)) {</div><div class='ctx'> 		ret = PTR_ERR(root);</div><div class='hunk'>@@ -2720,7 +2093,7 @@ static int btrfs_ioctl_get_subvol_info(struct file *file, void __user *argp)</div><div class='ctx'> 			ret = btrfs_next_leaf(fs_info-&gt;tree_root, path);</div><div class='ctx'> 			if (ret &lt; 0) {</div><div class='ctx'> 				goto out;</div><div class='del'>-			} else if (ret &gt; 0) {</div><div class='add'>+			} else if (unlikely(ret &gt; 0)) {</div><div class='ctx'> 				ret = -EUCLEAN;</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -2738,7 +2111,7 @@ static int btrfs_ioctl_get_subvol_info(struct file *file, void __user *argp)</div><div class='ctx'> </div><div class='ctx'> 			item_off = btrfs_item_ptr_offset(leaf, slot)</div><div class='ctx'> 					+ sizeof(struct btrfs_root_ref);</div><div class='del'>-			item_len = btrfs_item_size_nr(leaf, slot)</div><div class='add'>+			item_len = btrfs_item_size(leaf, slot)</div><div class='ctx'> 					- sizeof(struct btrfs_root_ref);</div><div class='ctx'> 			read_extent_buffer(leaf, subvol_info-&gt;name,</div><div class='ctx'> 					   item_off, item_len);</div><div class='hunk'>@@ -2748,6 +2121,8 @@ static int btrfs_ioctl_get_subvol_info(struct file *file, void __user *argp)</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	btrfs_free_path(path);</div><div class='add'>+	path = NULL;</div><div class='ctx'> 	if (copy_to_user(argp, subvol_info, sizeof(*subvol_info)))</div><div class='ctx'> 		ret = -EFAULT;</div><div class='ctx'> </div><div class='hunk'>@@ -2763,15 +2138,14 @@ out_free:</div><div class='ctx'>  * Return ROOT_REF information of the subvolume containing this inode</div><div class='ctx'>  * except the subvolume name.</div><div class='ctx'>  */</div><div class='del'>-static int btrfs_ioctl_get_subvol_rootref(struct file *file, void __user *argp)</div><div class='add'>+static int btrfs_ioctl_get_subvol_rootref(struct btrfs_root *root,</div><div class='add'>+					  void __user *argp)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_ioctl_get_subvol_rootref_args *rootrefs;</div><div class='ctx'> 	struct btrfs_root_ref *rref;</div><div class='del'>-	struct btrfs_root *root;</div><div class='ctx'> 	struct btrfs_path *path;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='del'>-	struct inode *inode;</div><div class='ctx'> 	u64 objectid;</div><div class='ctx'> 	int slot;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -2787,15 +2161,13 @@ static int btrfs_ioctl_get_subvol_rootref(struct file *file, void __user *argp)</div><div class='ctx'> 		return PTR_ERR(rootrefs);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	inode = file_inode(file);</div><div class='del'>-	root = BTRFS_I(inode)-&gt;root-&gt;fs_info-&gt;tree_root;</div><div class='del'>-	objectid = BTRFS_I(inode)-&gt;root-&gt;root_key.objectid;</div><div class='del'>-</div><div class='add'>+	objectid = btrfs_root_id(root);</div><div class='ctx'> 	key.objectid = objectid;</div><div class='ctx'> 	key.type = BTRFS_ROOT_REF_KEY;</div><div class='ctx'> 	key.offset = rootrefs-&gt;min_treeid;</div><div class='ctx'> 	found = 0;</div><div class='ctx'> </div><div class='add'>+	root = root-&gt;fs_info-&gt;tree_root;</div><div class='ctx'> 	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -2804,7 +2176,7 @@ static int btrfs_ioctl_get_subvol_rootref(struct file *file, void __user *argp)</div><div class='ctx'> 		ret = btrfs_next_leaf(root, path);</div><div class='ctx'> 		if (ret &lt; 0) {</div><div class='ctx'> 			goto out;</div><div class='del'>-		} else if (ret &gt; 0) {</div><div class='add'>+		} else if (unlikely(ret &gt; 0)) {</div><div class='ctx'> 			ret = -EUCLEAN;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2833,13 +2205,15 @@ static int btrfs_ioctl_get_subvol_rootref(struct file *file, void __user *argp)</div><div class='ctx'> 		ret = btrfs_next_item(root, path);</div><div class='ctx'> 		if (ret &lt; 0) {</div><div class='ctx'> 			goto out;</div><div class='del'>-		} else if (ret &gt; 0) {</div><div class='add'>+		} else if (unlikely(ret &gt; 0)) {</div><div class='ctx'> 			ret = -EUCLEAN;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='add'>+	btrfs_free_path(path);</div><div class='add'>+</div><div class='ctx'> 	if (!ret || ret == -EOVERFLOW) {</div><div class='ctx'> 		rootrefs-&gt;num_items = found;</div><div class='ctx'> 		/* update min_treeid for next search */</div><div class='hunk'>@@ -2851,7 +2225,6 @@ out:</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	kfree(rootrefs);</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -2861,27 +2234,33 @@ static noinline int btrfs_ioctl_snap_destroy(struct file *file,</div><div class='ctx'> 					     bool destroy_v2)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *parent = file-&gt;f_path.dentry;</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(parent-&gt;d_sb);</div><div class='ctx'> 	struct dentry *dentry;</div><div class='ctx'> 	struct inode *dir = d_inode(parent);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(dir);</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(dir)-&gt;root;</div><div class='ctx'> 	struct btrfs_root *dest = NULL;</div><div class='ctx'> 	struct btrfs_ioctl_vol_args *vol_args = NULL;</div><div class='ctx'> 	struct btrfs_ioctl_vol_args_v2 *vol_args2 = NULL;</div><div class='del'>-	struct user_namespace *mnt_userns = file_mnt_user_ns(file);</div><div class='add'>+	struct mnt_idmap *idmap = file_mnt_idmap(file);</div><div class='ctx'> 	char *subvol_name, *subvol_name_ptr = NULL;</div><div class='del'>-	int subvol_namelen;</div><div class='del'>-	int err = 0;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> 	bool destroy_parent = false;</div><div class='ctx'> </div><div class='add'>+	/* We don't support snapshots with extent tree v2 yet. */</div><div class='add'>+	if (btrfs_fs_incompat(fs_info, EXTENT_TREE_V2)) {</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+			  "extent tree v2 doesn't support snapshot deletion yet");</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (destroy_v2) {</div><div class='ctx'> 		vol_args2 = memdup_user(arg, sizeof(*vol_args2));</div><div class='ctx'> 		if (IS_ERR(vol_args2))</div><div class='ctx'> 			return PTR_ERR(vol_args2);</div><div class='ctx'> </div><div class='ctx'> 		if (vol_args2-&gt;flags &amp; ~BTRFS_SUBVOL_DELETE_ARGS_MASK) {</div><div class='del'>-			err = -EOPNOTSUPP;</div><div class='add'>+			ret = -EOPNOTSUPP;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -2890,29 +2269,31 @@ static noinline int btrfs_ioctl_snap_destroy(struct file *file,</div><div class='ctx'> 		 * name, same as v1 currently does.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (!(vol_args2-&gt;flags &amp; BTRFS_SUBVOL_SPEC_BY_ID)) {</div><div class='del'>-			vol_args2-&gt;name[BTRFS_SUBVOL_NAME_MAX] = 0;</div><div class='add'>+			ret = btrfs_check_ioctl_vol_args2_subvol_name(vol_args2);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				goto out;</div><div class='ctx'> 			subvol_name = vol_args2-&gt;name;</div><div class='ctx'> </div><div class='del'>-			err = mnt_want_write_file(file);</div><div class='del'>-			if (err)</div><div class='add'>+			ret = mnt_want_write_file(file);</div><div class='add'>+			if (ret)</div><div class='ctx'> 				goto out;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			struct inode *old_dir;</div><div class='ctx'> </div><div class='ctx'> 			if (vol_args2-&gt;subvolid &lt; BTRFS_FIRST_FREE_OBJECTID) {</div><div class='del'>-				err = -EINVAL;</div><div class='add'>+				ret = -EINVAL;</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			err = mnt_want_write_file(file);</div><div class='del'>-			if (err)</div><div class='add'>+			ret = mnt_want_write_file(file);</div><div class='add'>+			if (ret)</div><div class='ctx'> 				goto out;</div><div class='ctx'> </div><div class='ctx'> 			dentry = btrfs_get_dentry(fs_info-&gt;sb,</div><div class='ctx'> 					BTRFS_FIRST_FREE_OBJECTID,</div><div class='del'>-					vol_args2-&gt;subvolid, 0, 0);</div><div class='add'>+					vol_args2-&gt;subvolid, 0);</div><div class='ctx'> 			if (IS_ERR(dentry)) {</div><div class='del'>-				err = PTR_ERR(dentry);</div><div class='add'>+				ret = PTR_ERR(dentry);</div><div class='ctx'> 				goto out_drop_write;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='hunk'>@@ -2932,7 +2313,7 @@ static noinline int btrfs_ioctl_snap_destroy(struct file *file,</div><div class='ctx'> 			 */</div><div class='ctx'> 			dput(dentry);</div><div class='ctx'> 			if (IS_ERR(parent)) {</div><div class='del'>-				err = PTR_ERR(parent);</div><div class='add'>+				ret = PTR_ERR(parent);</div><div class='ctx'> 				goto out_drop_write;</div><div class='ctx'> 			}</div><div class='ctx'> 			old_dir = dir;</div><div class='hunk'>@@ -2955,15 +2336,15 @@ static noinline int btrfs_ioctl_snap_destroy(struct file *file,</div><div class='ctx'> 			 * anywhere in the filesystem the user wouldn't be able</div><div class='ctx'> 			 * to delete without an idmapped mount.</div><div class='ctx'> 			 */</div><div class='del'>-			if (old_dir != dir &amp;&amp; mnt_userns != &amp;init_user_ns) {</div><div class='del'>-				err = -EOPNOTSUPP;</div><div class='add'>+			if (old_dir != dir &amp;&amp; idmap != &amp;nop_mnt_idmap) {</div><div class='add'>+				ret = -EOPNOTSUPP;</div><div class='ctx'> 				goto free_parent;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			subvol_name_ptr = btrfs_get_subvol_name_from_objectid(</div><div class='ctx'> 						fs_info, vol_args2-&gt;subvolid);</div><div class='ctx'> 			if (IS_ERR(subvol_name_ptr)) {</div><div class='del'>-				err = PTR_ERR(subvol_name_ptr);</div><div class='add'>+				ret = PTR_ERR(subvol_name_ptr);</div><div class='ctx'> 				goto free_parent;</div><div class='ctx'> 			}</div><div class='ctx'> 			/* subvol_name_ptr is already nul terminated */</div><div class='hunk'>@@ -2974,39 +2355,32 @@ static noinline int btrfs_ioctl_snap_destroy(struct file *file,</div><div class='ctx'> 		if (IS_ERR(vol_args))</div><div class='ctx'> 			return PTR_ERR(vol_args);</div><div class='ctx'> </div><div class='del'>-		vol_args-&gt;name[BTRFS_PATH_NAME_MAX] = 0;</div><div class='add'>+		ret = btrfs_check_ioctl_vol_args_path(vol_args);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out;</div><div class='add'>+</div><div class='ctx'> 		subvol_name = vol_args-&gt;name;</div><div class='ctx'> </div><div class='del'>-		err = mnt_want_write_file(file);</div><div class='del'>-		if (err)</div><div class='add'>+		ret = mnt_want_write_file(file);</div><div class='add'>+		if (ret)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	subvol_namelen = strlen(subvol_name);</div><div class='del'>-</div><div class='ctx'> 	if (strchr(subvol_name, '/') ||</div><div class='del'>-	    strncmp(subvol_name, "..", subvol_namelen) == 0) {</div><div class='del'>-		err = -EINVAL;</div><div class='add'>+	    strcmp(subvol_name, "..") == 0) {</div><div class='add'>+		ret = -EINVAL;</div><div class='ctx'> 		goto free_subvol_name;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!S_ISDIR(dir-&gt;i_mode)) {</div><div class='del'>-		err = -ENOTDIR;</div><div class='add'>+		ret = -ENOTDIR;</div><div class='ctx'> 		goto free_subvol_name;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = down_write_killable_nested(&amp;dir-&gt;i_rwsem, I_MUTEX_PARENT);</div><div class='del'>-	if (err == -EINTR)</div><div class='del'>-		goto free_subvol_name;</div><div class='del'>-	dentry = lookup_one(mnt_userns, subvol_name, parent, subvol_namelen);</div><div class='add'>+	dentry = start_removing_killable(idmap, parent, &amp;QSTR(subvol_name));</div><div class='ctx'> 	if (IS_ERR(dentry)) {</div><div class='del'>-		err = PTR_ERR(dentry);</div><div class='del'>-		goto out_unlock_dir;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (d_really_is_negative(dentry)) {</div><div class='del'>-		err = -ENOENT;</div><div class='del'>-		goto out_dput;</div><div class='add'>+		ret = PTR_ERR(dentry);</div><div class='add'>+		goto out_end_removing;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	inode = d_inode(dentry);</div><div class='hunk'>@@ -3025,9 +2399,9 @@ static noinline int btrfs_ioctl_snap_destroy(struct file *file,</div><div class='ctx'> 		 * Users who want to delete empty subvols should try</div><div class='ctx'> 		 * rmdir(2).</div><div class='ctx'> 		 */</div><div class='del'>-		err = -EPERM;</div><div class='add'>+		ret = -EPERM;</div><div class='ctx'> 		if (!btrfs_test_opt(fs_info, USER_SUBVOL_RM_ALLOWED))</div><div class='del'>-			goto out_dput;</div><div class='add'>+			goto out_end_removing;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Do not allow deletion if the parent dir is the same</div><div class='hunk'>@@ -3036,37 +2410,33 @@ static noinline int btrfs_ioctl_snap_destroy(struct file *file,</div><div class='ctx'> 		 * of the subvol, not a random directory contained</div><div class='ctx'> 		 * within it.</div><div class='ctx'> 		 */</div><div class='del'>-		err = -EINVAL;</div><div class='add'>+		ret = -EINVAL;</div><div class='ctx'> 		if (root == dest)</div><div class='del'>-			goto out_dput;</div><div class='add'>+			goto out_end_removing;</div><div class='ctx'> </div><div class='del'>-		err = inode_permission(mnt_userns, inode, MAY_WRITE | MAY_EXEC);</div><div class='del'>-		if (err)</div><div class='del'>-			goto out_dput;</div><div class='add'>+		ret = inode_permission(idmap, inode, MAY_WRITE | MAY_EXEC);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out_end_removing;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* check if subvolume may be deleted by a user */</div><div class='del'>-	err = btrfs_may_delete(mnt_userns, dir, dentry, 1);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out_dput;</div><div class='add'>+	ret = btrfs_may_delete(idmap, dir, dentry, 1);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_end_removing;</div><div class='ctx'> </div><div class='ctx'> 	if (btrfs_ino(BTRFS_I(inode)) != BTRFS_FIRST_FREE_OBJECTID) {</div><div class='del'>-		err = -EINVAL;</div><div class='del'>-		goto out_dput;</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out_end_removing;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_inode_lock(inode, 0);</div><div class='del'>-	err = btrfs_delete_subvolume(dir, dentry);</div><div class='del'>-	btrfs_inode_unlock(inode, 0);</div><div class='del'>-	if (!err) {</div><div class='del'>-		fsnotify_rmdir(dir, dentry);</div><div class='del'>-		d_delete(dentry);</div><div class='del'>-	}</div><div class='add'>+	btrfs_inode_lock(BTRFS_I(inode), 0);</div><div class='add'>+	ret = btrfs_delete_subvolume(BTRFS_I(dir), dentry);</div><div class='add'>+	btrfs_inode_unlock(BTRFS_I(inode), 0);</div><div class='add'>+	if (!ret)</div><div class='add'>+		d_delete_notify(dir, dentry);</div><div class='ctx'> </div><div class='del'>-out_dput:</div><div class='del'>-	dput(dentry);</div><div class='del'>-out_unlock_dir:</div><div class='del'>-	btrfs_inode_unlock(dir, 0);</div><div class='add'>+out_end_removing:</div><div class='add'>+	end_removing(dentry);</div><div class='ctx'> free_subvol_name:</div><div class='ctx'> 	kfree(subvol_name_ptr);</div><div class='ctx'> free_parent:</div><div class='hunk'>@@ -3077,7 +2447,7 @@ out_drop_write:</div><div class='ctx'> out:</div><div class='ctx'> 	kfree(vol_args2);</div><div class='ctx'> 	kfree(vol_args);</div><div class='del'>-	return err;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int btrfs_ioctl_defrag(struct file *file, void __user *argp)</div><div class='hunk'>@@ -3111,18 +2481,37 @@ static int btrfs_ioctl_defrag(struct file *file, void __user *argp)</div><div class='ctx'> 		 * running and allows defrag on files open in read-only mode.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (!capable(CAP_SYS_ADMIN) &amp;&amp;</div><div class='del'>-		    inode_permission(&amp;init_user_ns, inode, MAY_WRITE)) {</div><div class='add'>+		    inode_permission(&amp;nop_mnt_idmap, inode, MAY_WRITE)) {</div><div class='ctx'> 			ret = -EPERM;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		/*</div><div class='add'>+		 * Don't allow defrag on pre-content watched files, as it could</div><div class='add'>+		 * populate the page cache with 0's via readahead.</div><div class='add'>+		 */</div><div class='add'>+		if (unlikely(FMODE_FSNOTIFY_HSM(file-&gt;f_mode))) {</div><div class='add'>+			ret = -EINVAL;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		if (argp) {</div><div class='ctx'> 			if (copy_from_user(&amp;range, argp, sizeof(range))) {</div><div class='ctx'> 				ret = -EFAULT;</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='del'>-			/* compression requires us to start the IO */</div><div class='del'>-			if ((range.flags &amp; BTRFS_DEFRAG_RANGE_COMPRESS)) {</div><div class='add'>+			if (range.flags &amp; ~BTRFS_DEFRAG_RANGE_FLAGS_SUPP) {</div><div class='add'>+				ret = -EOPNOTSUPP;</div><div class='add'>+				goto out;</div><div class='add'>+			}</div><div class='add'>+			if ((range.flags &amp; BTRFS_DEFRAG_RANGE_COMPRESS) &amp;&amp;</div><div class='add'>+			    (range.flags &amp; BTRFS_DEFRAG_RANGE_NOCOMPRESS)) {</div><div class='add'>+				ret = -EINVAL;</div><div class='add'>+				goto out;</div><div class='add'>+			}</div><div class='add'>+			/* Compression or no-compression require to start the IO. */</div><div class='add'>+			if ((range.flags &amp; BTRFS_DEFRAG_RANGE_COMPRESS) ||</div><div class='add'>+			    (range.flags &amp; BTRFS_DEFRAG_RANGE_NOCOMPRESS)) {</div><div class='ctx'> 				range.flags |= BTRFS_DEFRAG_RANGE_START_IO;</div><div class='ctx'> 				range.extent_thresh = (u32)-1;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -3130,7 +2519,7 @@ static int btrfs_ioctl_defrag(struct file *file, void __user *argp)</div><div class='ctx'> 			/* the rest are all set to zero by kzalloc */</div><div class='ctx'> 			range.len = (u64)-1;</div><div class='ctx'> 		}</div><div class='del'>-		ret = btrfs_defrag_file(file_inode(file), &amp;file-&gt;f_ra,</div><div class='add'>+		ret = btrfs_defrag_file(BTRFS_I(file_inode(file)), &amp;file-&gt;f_ra,</div><div class='ctx'> 					&amp;range, BTRFS_OLDEST_GENERATION, 0);</div><div class='ctx'> 		if (ret &gt; 0)</div><div class='ctx'> 			ret = 0;</div><div class='hunk'>@@ -3146,13 +2535,36 @@ out:</div><div class='ctx'> static long btrfs_ioctl_add_dev(struct btrfs_fs_info *fs_info, void __user *arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_ioctl_vol_args *vol_args;</div><div class='add'>+	bool restore_op = false;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!capable(CAP_SYS_ADMIN))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='del'>-	if (!btrfs_exclop_start(fs_info, BTRFS_EXCLOP_DEV_ADD))</div><div class='del'>-		return BTRFS_ERROR_DEV_EXCL_RUN_IN_PROGRESS;</div><div class='add'>+	if (btrfs_fs_incompat(fs_info, EXTENT_TREE_V2)) {</div><div class='add'>+		btrfs_err(fs_info, "device add not supported on extent tree v2 yet");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (fs_info-&gt;fs_devices-&gt;temp_fsid) {</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+			  "device add not supported on cloned temp-fsid mount");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!btrfs_exclop_start(fs_info, BTRFS_EXCLOP_DEV_ADD)) {</div><div class='add'>+		if (!btrfs_exclop_start_try_lock(fs_info, BTRFS_EXCLOP_DEV_ADD))</div><div class='add'>+			return BTRFS_ERROR_DEV_EXCL_RUN_IN_PROGRESS;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * We can do the device add because we have a paused balanced,</div><div class='add'>+		 * change the exclusive op type and remember we should bring</div><div class='add'>+		 * back the paused balance</div><div class='add'>+		 */</div><div class='add'>+		fs_info-&gt;exclusive_operation = BTRFS_EXCLOP_DEV_ADD;</div><div class='add'>+		btrfs_exclop_start_unlock(fs_info);</div><div class='add'>+		restore_op = true;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	vol_args = memdup_user(arg, sizeof(*vol_args));</div><div class='ctx'> 	if (IS_ERR(vol_args)) {</div><div class='hunk'>@@ -3160,15 +2572,22 @@ static long btrfs_ioctl_add_dev(struct btrfs_fs_info *fs_info, void __user *arg)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	vol_args-&gt;name[BTRFS_PATH_NAME_MAX] = '\0';</div><div class='add'>+	ret = btrfs_check_ioctl_vol_args_path(vol_args);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out_free;</div><div class='add'>+</div><div class='ctx'> 	ret = btrfs_init_new_device(fs_info, vol_args-&gt;name);</div><div class='ctx'> </div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		btrfs_info(fs_info, "disk added %s", vol_args-&gt;name);</div><div class='ctx'> </div><div class='add'>+out_free:</div><div class='ctx'> 	kfree(vol_args);</div><div class='ctx'> out:</div><div class='del'>-	btrfs_exclop_finish(fs_info);</div><div class='add'>+	if (restore_op)</div><div class='add'>+		btrfs_exclop_balance(fs_info, BTRFS_EXCLOP_BALANCE_PAUSED);</div><div class='add'>+	else</div><div class='add'>+		btrfs_exclop_finish(fs_info);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3176,10 +2595,9 @@ static long btrfs_ioctl_rm_dev_v2(struct file *file, void __user *arg)</div><div class='ctx'> {</div><div class='ctx'> 	BTRFS_DEV_LOOKUP_ARGS(args);</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='ctx'> 	struct btrfs_ioctl_vol_args_v2 *vol_args;</div><div class='del'>-	struct block_device *bdev = NULL;</div><div class='del'>-	fmode_t mode;</div><div class='add'>+	struct file *bdev_file = NULL;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	bool cancel = false;</div><div class='ctx'> </div><div class='hunk'>@@ -3187,17 +2605,18 @@ static long btrfs_ioctl_rm_dev_v2(struct file *file, void __user *arg)</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='ctx'> 	vol_args = memdup_user(arg, sizeof(*vol_args));</div><div class='del'>-	if (IS_ERR(vol_args)) {</div><div class='del'>-		ret = PTR_ERR(vol_args);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (IS_ERR(vol_args))</div><div class='add'>+		return PTR_ERR(vol_args);</div><div class='ctx'> </div><div class='ctx'> 	if (vol_args-&gt;flags &amp; ~BTRFS_DEVICE_REMOVE_ARGS_MASK) {</div><div class='ctx'> 		ret = -EOPNOTSUPP;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	vol_args-&gt;name[BTRFS_SUBVOL_NAME_MAX] = '\0';</div><div class='add'>+	ret = btrfs_check_ioctl_vol_args2_subvol_name(vol_args);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='ctx'> 	if (vol_args-&gt;flags &amp; BTRFS_DEVICE_SPEC_BY_ID) {</div><div class='ctx'> 		args.devid = vol_args-&gt;devid;</div><div class='ctx'> 	} else if (!strcmp("cancel", vol_args-&gt;name)) {</div><div class='hunk'>@@ -3218,7 +2637,7 @@ static long btrfs_ioctl_rm_dev_v2(struct file *file, void __user *arg)</div><div class='ctx'> 		goto err_drop;</div><div class='ctx'> </div><div class='ctx'> 	/* Exclusive operation is now claimed */</div><div class='del'>-	ret = btrfs_rm_device(fs_info, &amp;args, &amp;bdev, &amp;mode);</div><div class='add'>+	ret = btrfs_rm_device(fs_info, &amp;args, &amp;bdev_file);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_exclop_finish(fs_info);</div><div class='ctx'> </div><div class='hunk'>@@ -3232,8 +2651,8 @@ static long btrfs_ioctl_rm_dev_v2(struct file *file, void __user *arg)</div><div class='ctx'> 	}</div><div class='ctx'> err_drop:</div><div class='ctx'> 	mnt_drop_write_file(file);</div><div class='del'>-	if (bdev)</div><div class='del'>-		blkdev_put(bdev, mode);</div><div class='add'>+	if (bdev_file)</div><div class='add'>+		bdev_fput(bdev_file);</div><div class='ctx'> out:</div><div class='ctx'> 	btrfs_put_dev_args_from_path(&amp;args);</div><div class='ctx'> 	kfree(vol_args);</div><div class='hunk'>@@ -3244,12 +2663,11 @@ static long btrfs_ioctl_rm_dev(struct file *file, void __user *arg)</div><div class='ctx'> {</div><div class='ctx'> 	BTRFS_DEV_LOOKUP_ARGS(args);</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='ctx'> 	struct btrfs_ioctl_vol_args *vol_args;</div><div class='del'>-	struct block_device *bdev = NULL;</div><div class='del'>-	fmode_t mode;</div><div class='add'>+	struct file *bdev_file = NULL;</div><div class='ctx'> 	int ret;</div><div class='del'>-	bool cancel;</div><div class='add'>+	bool cancel = false;</div><div class='ctx'> </div><div class='ctx'> 	if (!capable(CAP_SYS_ADMIN))</div><div class='ctx'> 		return -EPERM;</div><div class='hunk'>@@ -3258,7 +2676,10 @@ static long btrfs_ioctl_rm_dev(struct file *file, void __user *arg)</div><div class='ctx'> 	if (IS_ERR(vol_args))</div><div class='ctx'> 		return PTR_ERR(vol_args);</div><div class='ctx'> </div><div class='del'>-	vol_args-&gt;name[BTRFS_PATH_NAME_MAX] = '\0';</div><div class='add'>+	ret = btrfs_check_ioctl_vol_args_path(vol_args);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out_free;</div><div class='add'>+</div><div class='ctx'> 	if (!strcmp("cancel", vol_args-&gt;name)) {</div><div class='ctx'> 		cancel = true;</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -3274,22 +2695,23 @@ static long btrfs_ioctl_rm_dev(struct file *file, void __user *arg)</div><div class='ctx'> 	ret = exclop_start_or_cancel_reloc(fs_info, BTRFS_EXCLOP_DEV_REMOVE,</div><div class='ctx'> 					   cancel);</div><div class='ctx'> 	if (ret == 0) {</div><div class='del'>-		ret = btrfs_rm_device(fs_info, &amp;args, &amp;bdev, &amp;mode);</div><div class='add'>+		ret = btrfs_rm_device(fs_info, &amp;args, &amp;bdev_file);</div><div class='ctx'> 		if (!ret)</div><div class='ctx'> 			btrfs_info(fs_info, "disk deleted %s", vol_args-&gt;name);</div><div class='ctx'> 		btrfs_exclop_finish(fs_info);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	mnt_drop_write_file(file);</div><div class='del'>-	if (bdev)</div><div class='del'>-		blkdev_put(bdev, mode);</div><div class='add'>+	if (bdev_file)</div><div class='add'>+		bdev_fput(bdev_file);</div><div class='ctx'> out:</div><div class='ctx'> 	btrfs_put_dev_args_from_path(&amp;args);</div><div class='add'>+out_free:</div><div class='ctx'> 	kfree(vol_args);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static long btrfs_ioctl_fs_info(struct btrfs_fs_info *fs_info,</div><div class='add'>+static long btrfs_ioctl_fs_info(const struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				void __user *arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_ioctl_fs_info_args *fi_args;</div><div class='hunk'>@@ -3326,7 +2748,7 @@ static long btrfs_ioctl_fs_info(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (flags_in &amp; BTRFS_FS_INFO_FLAG_GENERATION) {</div><div class='del'>-		fi_args-&gt;generation = fs_info-&gt;generation;</div><div class='add'>+		fi_args-&gt;generation = btrfs_get_fs_generation(fs_info);</div><div class='ctx'> 		fi_args-&gt;flags |= BTRFS_FS_INFO_FLAG_GENERATION;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -3343,7 +2765,7 @@ static long btrfs_ioctl_fs_info(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static long btrfs_ioctl_dev_info(struct btrfs_fs_info *fs_info,</div><div class='add'>+static long btrfs_ioctl_dev_info(const struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				 void __user *arg)</div><div class='ctx'> {</div><div class='ctx'> 	BTRFS_DEV_LOOKUP_ARGS(args);</div><div class='hunk'>@@ -3370,13 +2792,11 @@ static long btrfs_ioctl_dev_info(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	di_args-&gt;bytes_used = btrfs_device_get_bytes_used(dev);</div><div class='ctx'> 	di_args-&gt;total_bytes = btrfs_device_get_total_bytes(dev);</div><div class='ctx'> 	memcpy(di_args-&gt;uuid, dev-&gt;uuid, sizeof(di_args-&gt;uuid));</div><div class='del'>-	if (dev-&gt;name) {</div><div class='del'>-		strncpy(di_args-&gt;path, rcu_str_deref(dev-&gt;name),</div><div class='del'>-				sizeof(di_args-&gt;path) - 1);</div><div class='del'>-		di_args-&gt;path[sizeof(di_args-&gt;path) - 1] = 0;</div><div class='del'>-	} else {</div><div class='add'>+	memcpy(di_args-&gt;fsid, dev-&gt;fs_devices-&gt;fsid, BTRFS_UUID_SIZE);</div><div class='add'>+	if (dev-&gt;name)</div><div class='add'>+		strscpy(di_args-&gt;path, btrfs_dev_name(dev), sizeof(di_args-&gt;path));</div><div class='add'>+	else</div><div class='ctx'> 		di_args-&gt;path[0] = '\0';</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	rcu_read_unlock();</div><div class='hunk'>@@ -3390,13 +2810,14 @@ out:</div><div class='ctx'> static long btrfs_ioctl_default_subvol(struct file *file, void __user *argp)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='ctx'> 	struct btrfs_root *new_root;</div><div class='ctx'> 	struct btrfs_dir_item *di;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	struct btrfs_path *path = NULL;</div><div class='ctx'> 	struct btrfs_disk_key disk_key;</div><div class='add'>+	struct fscrypt_str name = FSTR_INIT("default", 7);</div><div class='ctx'> 	u64 objectid = 0;</div><div class='ctx'> 	u64 dir_id;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -3421,7 +2842,7 @@ static long btrfs_ioctl_default_subvol(struct file *file, void __user *argp)</div><div class='ctx'> 		ret = PTR_ERR(new_root);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (!is_fstree(new_root-&gt;root_key.objectid)) {</div><div class='add'>+	if (!btrfs_is_fstree(btrfs_root_id(new_root))) {</div><div class='ctx'> 		ret = -ENOENT;</div><div class='ctx'> 		goto out_free;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3440,7 +2861,7 @@ static long btrfs_ioctl_default_subvol(struct file *file, void __user *argp)</div><div class='ctx'> </div><div class='ctx'> 	dir_id = btrfs_super_root_dir(fs_info-&gt;super_copy);</div><div class='ctx'> 	di = btrfs_lookup_dir_item(trans, fs_info-&gt;tree_root, path,</div><div class='del'>-				   dir_id, "default", 7, 1);</div><div class='add'>+				   dir_id, &amp;name, 1);</div><div class='ctx'> 	if (IS_ERR_OR_NULL(di)) {</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> 		btrfs_end_transaction(trans);</div><div class='hunk'>@@ -3452,7 +2873,6 @@ static long btrfs_ioctl_default_subvol(struct file *file, void __user *argp)</div><div class='ctx'> </div><div class='ctx'> 	btrfs_cpu_key_to_disk(&amp;disk_key, &amp;new_root-&gt;root_key);</div><div class='ctx'> 	btrfs_set_dir_item_key(path-&gt;nodes[0], di, &amp;disk_key);</div><div class='del'>-	btrfs_mark_buffer_dirty(path-&gt;nodes[0]);</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_set_fs_incompat(fs_info, DEFAULT_SUBVOL);</div><div class='hunk'>@@ -3483,10 +2903,10 @@ static void get_block_group_info(struct list_head *groups_list,</div><div class='ctx'> static long btrfs_ioctl_space_info(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				   void __user *arg)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_ioctl_space_args space_args;</div><div class='add'>+	struct btrfs_ioctl_space_args space_args = { 0 };</div><div class='ctx'> 	struct btrfs_ioctl_space_info space;</div><div class='ctx'> 	struct btrfs_ioctl_space_info *dest;</div><div class='del'>-	struct btrfs_ioctl_space_info *dest_orig;</div><div class='add'>+	struct btrfs_ioctl_space_info AUTO_KFREE(dest_orig);</div><div class='ctx'> 	struct btrfs_ioctl_space_info __user *user_dest;</div><div class='ctx'> 	struct btrfs_space_info *info;</div><div class='ctx'> 	static const u64 types[] = {</div><div class='hunk'>@@ -3607,9 +3027,8 @@ static long btrfs_ioctl_space_info(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		(arg + sizeof(struct btrfs_ioctl_space_args));</div><div class='ctx'> </div><div class='ctx'> 	if (copy_to_user(user_dest, dest_orig, alloc_size))</div><div class='del'>-		ret = -EFAULT;</div><div class='add'>+		return -EFAULT;</div><div class='ctx'> </div><div class='del'>-	kfree(dest_orig);</div><div class='ctx'> out:</div><div class='ctx'> 	if (ret == 0 &amp;&amp; copy_to_user(arg, &amp;space_args, sizeof(space_args)))</div><div class='ctx'> 		ret = -EFAULT;</div><div class='hunk'>@@ -3622,7 +3041,13 @@ static noinline long btrfs_ioctl_start_sync(struct btrfs_root *root,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	u64 transid;</div><div class='del'>-	int ret;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Start orphan cleanup here for the given root in case it hasn't been</div><div class='add'>+	 * started already by other means. Errors are handled in the other</div><div class='add'>+	 * functions during transaction commit.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_orphan_cleanup(root);</div><div class='ctx'> </div><div class='ctx'> 	trans = btrfs_attach_transaction_barrier(root);</div><div class='ctx'> 	if (IS_ERR(trans)) {</div><div class='hunk'>@@ -3630,15 +3055,11 @@ static noinline long btrfs_ioctl_start_sync(struct btrfs_root *root,</div><div class='ctx'> 			return PTR_ERR(trans);</div><div class='ctx'> </div><div class='ctx'> 		/* No running transaction, don't bother */</div><div class='del'>-		transid = root-&gt;fs_info-&gt;last_trans_committed;</div><div class='add'>+		transid = btrfs_get_last_trans_committed(root-&gt;fs_info);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	transid = trans-&gt;transid;</div><div class='del'>-	ret = btrfs_commit_transaction_async(trans);</div><div class='del'>-	if (ret) {</div><div class='del'>-		btrfs_end_transaction(trans);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='add'>+	btrfs_commit_transaction_async(trans);</div><div class='ctx'> out:</div><div class='ctx'> 	if (argp)</div><div class='ctx'> 		if (copy_to_user(argp, &amp;transid, sizeof(transid)))</div><div class='hunk'>@@ -3649,30 +3070,39 @@ out:</div><div class='ctx'> static noinline long btrfs_ioctl_wait_sync(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 					   void __user *argp)</div><div class='ctx'> {</div><div class='del'>-	u64 transid;</div><div class='add'>+	/* By default wait for the current transaction. */</div><div class='add'>+	u64 transid = 0;</div><div class='ctx'> </div><div class='del'>-	if (argp) {</div><div class='add'>+	if (argp)</div><div class='ctx'> 		if (copy_from_user(&amp;transid, argp, sizeof(transid)))</div><div class='ctx'> 			return -EFAULT;</div><div class='del'>-	} else {</div><div class='del'>-		transid = 0;  /* current trans */</div><div class='del'>-	}</div><div class='add'>+</div><div class='ctx'> 	return btrfs_wait_for_commit(fs_info, transid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static long btrfs_ioctl_scrub(struct file *file, void __user *arg)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(file_inode(file)-&gt;i_sb);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(file_inode(file));</div><div class='ctx'> 	struct btrfs_ioctl_scrub_args *sa;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!capable(CAP_SYS_ADMIN))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='add'>+	if (btrfs_fs_incompat(fs_info, EXTENT_TREE_V2)) {</div><div class='add'>+		btrfs_err(fs_info, "scrub: extent tree v2 not yet supported");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	sa = memdup_user(arg, sizeof(*sa));</div><div class='ctx'> 	if (IS_ERR(sa))</div><div class='ctx'> 		return PTR_ERR(sa);</div><div class='ctx'> </div><div class='add'>+	if (sa-&gt;flags &amp; ~BTRFS_SCRUB_SUPPORTED_FLAGS) {</div><div class='add'>+		ret = -EOPNOTSUPP;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (!(sa-&gt;flags &amp; BTRFS_SCRUB_READONLY)) {</div><div class='ctx'> 		ret = mnt_want_write_file(file);</div><div class='ctx'> 		if (ret)</div><div class='hunk'>@@ -3768,6 +3198,11 @@ static long btrfs_ioctl_dev_replace(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	if (!capable(CAP_SYS_ADMIN))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='add'>+	if (btrfs_fs_incompat(fs_info, EXTENT_TREE_V2)) {</div><div class='add'>+		btrfs_err(fs_info, "device replace not supported on extent tree v2 yet");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	p = memdup_user(arg, sizeof(*p));</div><div class='ctx'> 	if (IS_ERR(p))</div><div class='ctx'> 		return PTR_ERR(p);</div><div class='hunk'>@@ -3812,7 +3247,7 @@ static long btrfs_ioctl_ino_to_path(struct btrfs_root *root, void __user *arg)</div><div class='ctx'> 	u64 rel_ptr;</div><div class='ctx'> 	int size;</div><div class='ctx'> 	struct btrfs_ioctl_ino_path_args *ipa = NULL;</div><div class='del'>-	struct inode_fs_paths *ipath = NULL;</div><div class='add'>+	struct inode_fs_paths *ipath __free(inode_fs_paths) = NULL;</div><div class='ctx'> 	struct btrfs_path *path;</div><div class='ctx'> </div><div class='ctx'> 	if (!capable(CAP_DAC_READ_SEARCH))</div><div class='hunk'>@@ -3849,6 +3284,8 @@ static long btrfs_ioctl_ino_to_path(struct btrfs_root *root, void __user *arg)</div><div class='ctx'> 		ipath-&gt;fspath-&gt;val[i] = rel_ptr;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	btrfs_free_path(path);</div><div class='add'>+	path = NULL;</div><div class='ctx'> 	ret = copy_to_user((void __user *)(unsigned long)ipa-&gt;fspath,</div><div class='ctx'> 			   ipath-&gt;fspath, size);</div><div class='ctx'> 	if (ret) {</div><div class='hunk'>@@ -3858,32 +3295,11 @@ static long btrfs_ioctl_ino_to_path(struct btrfs_root *root, void __user *arg)</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	btrfs_free_path(path);</div><div class='del'>-	free_ipath(ipath);</div><div class='ctx'> 	kfree(ipa);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int build_ino_list(u64 inum, u64 offset, u64 root, void *ctx)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_data_container *inodes = ctx;</div><div class='del'>-	const size_t c = 3 * sizeof(u64);</div><div class='del'>-</div><div class='del'>-	if (inodes-&gt;bytes_left &gt;= c) {</div><div class='del'>-		inodes-&gt;bytes_left -= c;</div><div class='del'>-		inodes-&gt;val[inodes-&gt;elem_cnt] = inum;</div><div class='del'>-		inodes-&gt;val[inodes-&gt;elem_cnt + 1] = offset;</div><div class='del'>-		inodes-&gt;val[inodes-&gt;elem_cnt + 2] = root;</div><div class='del'>-		inodes-&gt;elem_cnt += 3;</div><div class='del'>-	} else {</div><div class='del'>-		inodes-&gt;bytes_missing += c - inodes-&gt;bytes_left;</div><div class='del'>-		inodes-&gt;bytes_left = 0;</div><div class='del'>-		inodes-&gt;elem_missed += 3;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static long btrfs_ioctl_logical_to_ino(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 					void __user *arg, int version)</div><div class='ctx'> {</div><div class='hunk'>@@ -3891,7 +3307,6 @@ static long btrfs_ioctl_logical_to_ino(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	int size;</div><div class='ctx'> 	struct btrfs_ioctl_logical_ino_args *loi;</div><div class='ctx'> 	struct btrfs_data_container *inodes = NULL;</div><div class='del'>-	struct btrfs_path *path = NULL;</div><div class='ctx'> 	bool ignore_offset;</div><div class='ctx'> </div><div class='ctx'> 	if (!capable(CAP_SYS_ADMIN))</div><div class='hunk'>@@ -3919,21 +3334,13 @@ static long btrfs_ioctl_logical_to_ino(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		size = min_t(u32, loi-&gt;size, SZ_16M);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	path = btrfs_alloc_path();</div><div class='del'>-	if (!path) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	inodes = init_data_container(size);</div><div class='ctx'> 	if (IS_ERR(inodes)) {</div><div class='ctx'> 		ret = PTR_ERR(inodes);</div><div class='del'>-		inodes = NULL;</div><div class='del'>-		goto out;</div><div class='add'>+		goto out_loi;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = iterate_inodes_from_logical(loi-&gt;logical, fs_info, path,</div><div class='del'>-					  build_ino_list, inodes, ignore_offset);</div><div class='add'>+	ret = iterate_inodes_from_logical(loi-&gt;logical, fs_info, inodes, ignore_offset);</div><div class='ctx'> 	if (ret == -EINVAL)</div><div class='ctx'> 		ret = -ENOENT;</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='hunk'>@@ -3945,7 +3352,6 @@ static long btrfs_ioctl_logical_to_ino(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		ret = -EFAULT;</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	kvfree(inodes);</div><div class='ctx'> out_loi:</div><div class='ctx'> 	kfree(loi);</div><div class='hunk'>@@ -3976,13 +3382,79 @@ void btrfs_update_ioctl_balance_args(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;balance_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Try to acquire fs_info::balance_mutex as well as set BTRFS_EXLCOP_BALANCE as</div><div class='add'>+ * required.</div><div class='add'>+ *</div><div class='add'>+ * @fs_info:       the filesystem</div><div class='add'>+ * @excl_acquired: ptr to boolean value which is set to false in case balance</div><div class='add'>+ *                 is being resumed</div><div class='add'>+ *</div><div class='add'>+ * Return 0 on success in which case both fs_info::balance is acquired as well</div><div class='add'>+ * as exclusive ops are blocked. In case of failure return an error code.</div><div class='add'>+ */</div><div class='add'>+static int btrfs_try_lock_balance(struct btrfs_fs_info *fs_info, bool *excl_acquired)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Exclusive operation is locked. Three possibilities:</div><div class='add'>+	 *   (1) some other op is running</div><div class='add'>+	 *   (2) balance is running</div><div class='add'>+	 *   (3) balance is paused -- special case (think resume)</div><div class='add'>+	 */</div><div class='add'>+	while (1) {</div><div class='add'>+		if (btrfs_exclop_start(fs_info, BTRFS_EXCLOP_BALANCE)) {</div><div class='add'>+			*excl_acquired = true;</div><div class='add'>+			mutex_lock(&amp;fs_info-&gt;balance_mutex);</div><div class='add'>+			return 0;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		mutex_lock(&amp;fs_info-&gt;balance_mutex);</div><div class='add'>+		if (fs_info-&gt;balance_ctl) {</div><div class='add'>+			/* This is either (2) or (3) */</div><div class='add'>+			if (test_bit(BTRFS_FS_BALANCE_RUNNING, &amp;fs_info-&gt;flags)) {</div><div class='add'>+				/* This is (2) */</div><div class='add'>+				ret = -EINPROGRESS;</div><div class='add'>+				goto out_failure;</div><div class='add'>+</div><div class='add'>+			} else {</div><div class='add'>+				mutex_unlock(&amp;fs_info-&gt;balance_mutex);</div><div class='add'>+				/*</div><div class='add'>+				 * Lock released to allow other waiters to</div><div class='add'>+				 * continue, we'll reexamine the status again.</div><div class='add'>+				 */</div><div class='add'>+				mutex_lock(&amp;fs_info-&gt;balance_mutex);</div><div class='add'>+</div><div class='add'>+				if (fs_info-&gt;balance_ctl &amp;&amp;</div><div class='add'>+				    !test_bit(BTRFS_FS_BALANCE_RUNNING, &amp;fs_info-&gt;flags)) {</div><div class='add'>+					/* This is (3) */</div><div class='add'>+					*excl_acquired = false;</div><div class='add'>+					return 0;</div><div class='add'>+				}</div><div class='add'>+			}</div><div class='add'>+		} else {</div><div class='add'>+			/* This is (1) */</div><div class='add'>+			ret = BTRFS_ERROR_DEV_EXCL_RUN_IN_PROGRESS;</div><div class='add'>+			goto out_failure;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		mutex_unlock(&amp;fs_info-&gt;balance_mutex);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+out_failure:</div><div class='add'>+	mutex_unlock(&amp;fs_info-&gt;balance_mutex);</div><div class='add'>+	*excl_acquired = false;</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static long btrfs_ioctl_balance(struct file *file, void __user *arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(file_inode(file))-&gt;root;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_ioctl_balance_args *bargs;</div><div class='ctx'> 	struct btrfs_balance_control *bctl;</div><div class='del'>-	bool need_unlock; /* for mut. excl. ops lock */</div><div class='add'>+	bool need_unlock = true;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!capable(CAP_SYS_ADMIN))</div><div class='hunk'>@@ -3992,105 +3464,55 @@ static long btrfs_ioctl_balance(struct file *file, void __user *arg)</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-again:</div><div class='del'>-	if (btrfs_exclop_start(fs_info, BTRFS_EXCLOP_BALANCE)) {</div><div class='del'>-		mutex_lock(&amp;fs_info-&gt;balance_mutex);</div><div class='del'>-		need_unlock = true;</div><div class='del'>-		goto locked;</div><div class='add'>+	bargs = memdup_user(arg, sizeof(*bargs));</div><div class='add'>+	if (IS_ERR(bargs)) {</div><div class='add'>+		ret = PTR_ERR(bargs);</div><div class='add'>+		bargs = NULL;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * mut. excl. ops lock is locked.  Three possibilities:</div><div class='del'>-	 *   (1) some other op is running</div><div class='del'>-	 *   (2) balance is running</div><div class='del'>-	 *   (3) balance is paused -- special case (think resume)</div><div class='del'>-	 */</div><div class='del'>-	mutex_lock(&amp;fs_info-&gt;balance_mutex);</div><div class='del'>-	if (fs_info-&gt;balance_ctl) {</div><div class='del'>-		/* this is either (2) or (3) */</div><div class='del'>-		if (!test_bit(BTRFS_FS_BALANCE_RUNNING, &amp;fs_info-&gt;flags)) {</div><div class='del'>-			mutex_unlock(&amp;fs_info-&gt;balance_mutex);</div><div class='del'>-			/*</div><div class='del'>-			 * Lock released to allow other waiters to continue,</div><div class='del'>-			 * we'll reexamine the status again.</div><div class='del'>-			 */</div><div class='del'>-			mutex_lock(&amp;fs_info-&gt;balance_mutex);</div><div class='del'>-</div><div class='del'>-			if (fs_info-&gt;balance_ctl &amp;&amp;</div><div class='del'>-			    !test_bit(BTRFS_FS_BALANCE_RUNNING, &amp;fs_info-&gt;flags)) {</div><div class='del'>-				/* this is (3) */</div><div class='del'>-				need_unlock = false;</div><div class='del'>-				goto locked;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			mutex_unlock(&amp;fs_info-&gt;balance_mutex);</div><div class='del'>-			goto again;</div><div class='del'>-		} else {</div><div class='del'>-			/* this is (2) */</div><div class='del'>-			mutex_unlock(&amp;fs_info-&gt;balance_mutex);</div><div class='del'>-			ret = -EINPROGRESS;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-		/* this is (1) */</div><div class='del'>-		mutex_unlock(&amp;fs_info-&gt;balance_mutex);</div><div class='del'>-		ret = BTRFS_ERROR_DEV_EXCL_RUN_IN_PROGRESS;</div><div class='add'>+	ret = btrfs_try_lock_balance(fs_info, &amp;need_unlock);</div><div class='add'>+	if (ret)</div><div class='ctx'> 		goto out;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-locked:</div><div class='add'>+	lockdep_assert_held(&amp;fs_info-&gt;balance_mutex);</div><div class='ctx'> </div><div class='del'>-	if (arg) {</div><div class='del'>-		bargs = memdup_user(arg, sizeof(*bargs));</div><div class='del'>-		if (IS_ERR(bargs)) {</div><div class='del'>-			ret = PTR_ERR(bargs);</div><div class='add'>+	if (bargs-&gt;flags &amp; BTRFS_BALANCE_RESUME) {</div><div class='add'>+		if (!fs_info-&gt;balance_ctl) {</div><div class='add'>+			ret = -ENOTCONN;</div><div class='ctx'> 			goto out_unlock;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (bargs-&gt;flags &amp; BTRFS_BALANCE_RESUME) {</div><div class='del'>-			if (!fs_info-&gt;balance_ctl) {</div><div class='del'>-				ret = -ENOTCONN;</div><div class='del'>-				goto out_bargs;</div><div class='del'>-			}</div><div class='add'>+		bctl = fs_info-&gt;balance_ctl;</div><div class='add'>+		spin_lock(&amp;fs_info-&gt;balance_lock);</div><div class='add'>+		bctl-&gt;flags |= BTRFS_BALANCE_RESUME;</div><div class='add'>+		spin_unlock(&amp;fs_info-&gt;balance_lock);</div><div class='add'>+		btrfs_exclop_balance(fs_info, BTRFS_EXCLOP_BALANCE);</div><div class='ctx'> </div><div class='del'>-			bctl = fs_info-&gt;balance_ctl;</div><div class='del'>-			spin_lock(&amp;fs_info-&gt;balance_lock);</div><div class='del'>-			bctl-&gt;flags |= BTRFS_BALANCE_RESUME;</div><div class='del'>-			spin_unlock(&amp;fs_info-&gt;balance_lock);</div><div class='add'>+		goto do_balance;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-			goto do_balance;</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-		bargs = NULL;</div><div class='add'>+	if (bargs-&gt;flags &amp; ~(BTRFS_BALANCE_ARGS_MASK | BTRFS_BALANCE_TYPE_MASK)) {</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (fs_info-&gt;balance_ctl) {</div><div class='ctx'> 		ret = -EINPROGRESS;</div><div class='del'>-		goto out_bargs;</div><div class='add'>+		goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	bctl = kzalloc(sizeof(*bctl), GFP_KERNEL);</div><div class='ctx'> 	if (!bctl) {</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='del'>-		goto out_bargs;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (arg) {</div><div class='del'>-		memcpy(&amp;bctl-&gt;data, &amp;bargs-&gt;data, sizeof(bctl-&gt;data));</div><div class='del'>-		memcpy(&amp;bctl-&gt;meta, &amp;bargs-&gt;meta, sizeof(bctl-&gt;meta));</div><div class='del'>-		memcpy(&amp;bctl-&gt;sys, &amp;bargs-&gt;sys, sizeof(bctl-&gt;sys));</div><div class='del'>-</div><div class='del'>-		bctl-&gt;flags = bargs-&gt;flags;</div><div class='del'>-	} else {</div><div class='del'>-		/* balance everything - no filters */</div><div class='del'>-		bctl-&gt;flags |= BTRFS_BALANCE_TYPE_MASK;</div><div class='add'>+		goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (bctl-&gt;flags &amp; ~(BTRFS_BALANCE_ARGS_MASK | BTRFS_BALANCE_TYPE_MASK)) {</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		goto out_bctl;</div><div class='del'>-	}</div><div class='add'>+	memcpy(&amp;bctl-&gt;data, &amp;bargs-&gt;data, sizeof(bctl-&gt;data));</div><div class='add'>+	memcpy(&amp;bctl-&gt;meta, &amp;bargs-&gt;meta, sizeof(bctl-&gt;meta));</div><div class='add'>+	memcpy(&amp;bctl-&gt;sys, &amp;bargs-&gt;sys, sizeof(bctl-&gt;sys));</div><div class='ctx'> </div><div class='add'>+	bctl-&gt;flags = bargs-&gt;flags;</div><div class='ctx'> do_balance:</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Ownership of bctl and exclusive operation goes to btrfs_balance.</div><div class='hunk'>@@ -4103,21 +3525,19 @@ do_balance:</div><div class='ctx'> 	ret = btrfs_balance(fs_info, bctl, bargs);</div><div class='ctx'> 	bctl = NULL;</div><div class='ctx'> </div><div class='del'>-	if ((ret == 0 || ret == -ECANCELED) &amp;&amp; arg) {</div><div class='add'>+	if (ret == 0 || ret == -ECANCELED) {</div><div class='ctx'> 		if (copy_to_user(arg, bargs, sizeof(*bargs)))</div><div class='ctx'> 			ret = -EFAULT;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-out_bctl:</div><div class='ctx'> 	kfree(bctl);</div><div class='del'>-out_bargs:</div><div class='del'>-	kfree(bargs);</div><div class='ctx'> out_unlock:</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;balance_mutex);</div><div class='ctx'> 	if (need_unlock)</div><div class='ctx'> 		btrfs_exclop_finish(fs_info);</div><div class='ctx'> out:</div><div class='ctx'> 	mnt_drop_write_file(file);</div><div class='add'>+	kfree(bargs);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -4139,7 +3559,7 @@ static long btrfs_ioctl_balance_ctl(struct btrfs_fs_info *fs_info, int cmd)</div><div class='ctx'> static long btrfs_ioctl_balance_progress(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 					 void __user *arg)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_ioctl_balance_args *bargs;</div><div class='add'>+	struct btrfs_ioctl_balance_args AUTO_KFREE(bargs);</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (!capable(CAP_SYS_ADMIN))</div><div class='hunk'>@@ -4161,8 +3581,6 @@ static long btrfs_ioctl_balance_progress(struct btrfs_fs_info *fs_info,</div><div class='ctx'> </div><div class='ctx'> 	if (copy_to_user(arg, bargs, sizeof(*bargs)))</div><div class='ctx'> 		ret = -EFAULT;</div><div class='del'>-</div><div class='del'>-	kfree(bargs);</div><div class='ctx'> out:</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;balance_mutex);</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -4171,7 +3589,7 @@ out:</div><div class='ctx'> static long btrfs_ioctl_quota_ctl(struct file *file, void __user *arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='ctx'> 	struct btrfs_ioctl_quota_ctl_args *sa;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -4188,14 +3606,43 @@ static long btrfs_ioctl_quota_ctl(struct file *file, void __user *arg)</div><div class='ctx'> 		goto drop_write;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;fs_info-&gt;subvol_sem);</div><div class='del'>-</div><div class='ctx'> 	switch (sa-&gt;cmd) {</div><div class='ctx'> 	case BTRFS_QUOTA_CTL_ENABLE:</div><div class='del'>-		ret = btrfs_quota_enable(fs_info);</div><div class='add'>+	case BTRFS_QUOTA_CTL_ENABLE_SIMPLE_QUOTA:</div><div class='add'>+		down_write(&amp;fs_info-&gt;subvol_sem);</div><div class='add'>+		ret = btrfs_quota_enable(fs_info, sa);</div><div class='add'>+		up_write(&amp;fs_info-&gt;subvol_sem);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case BTRFS_QUOTA_CTL_DISABLE:</div><div class='add'>+		/*</div><div class='add'>+		 * Lock the cleaner mutex to prevent races with concurrent</div><div class='add'>+		 * relocation, because relocation may be building backrefs for</div><div class='add'>+		 * blocks of the quota root while we are deleting the root. This</div><div class='add'>+		 * is like dropping fs roots of deleted snapshots/subvolumes, we</div><div class='add'>+		 * need the same protection.</div><div class='add'>+		 *</div><div class='add'>+		 * This also prevents races between concurrent tasks trying to</div><div class='add'>+		 * disable quotas, because we will unlock and relock</div><div class='add'>+		 * qgroup_ioctl_lock across BTRFS_FS_QUOTA_ENABLED changes.</div><div class='add'>+		 *</div><div class='add'>+		 * We take this here because we have the dependency of</div><div class='add'>+		 *</div><div class='add'>+		 * inode_lock -&gt; subvol_sem</div><div class='add'>+		 *</div><div class='add'>+		 * because of rename.  With relocation we can prealloc extents,</div><div class='add'>+		 * so that makes the dependency chain</div><div class='add'>+		 *</div><div class='add'>+		 * cleaner_mutex -&gt; inode_lock -&gt; subvol_sem</div><div class='add'>+		 *</div><div class='add'>+		 * so we must take the cleaner_mutex here before we take the</div><div class='add'>+		 * subvol_sem.  The deadlock can't actually happen, but this</div><div class='add'>+		 * quiets lockdep.</div><div class='add'>+		 */</div><div class='add'>+		mutex_lock(&amp;fs_info-&gt;cleaner_mutex);</div><div class='add'>+		down_write(&amp;fs_info-&gt;subvol_sem);</div><div class='ctx'> 		ret = btrfs_quota_disable(fs_info);</div><div class='add'>+		up_write(&amp;fs_info-&gt;subvol_sem);</div><div class='add'>+		mutex_unlock(&amp;fs_info-&gt;cleaner_mutex);</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		ret = -EINVAL;</div><div class='hunk'>@@ -4203,7 +3650,6 @@ static long btrfs_ioctl_quota_ctl(struct file *file, void __user *arg)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	kfree(sa);</div><div class='del'>-	up_write(&amp;fs_info-&gt;subvol_sem);</div><div class='ctx'> drop_write:</div><div class='ctx'> 	mnt_drop_write_file(file);</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -4212,9 +3658,10 @@ drop_write:</div><div class='ctx'> static long btrfs_ioctl_qgroup_assign(struct file *file, void __user *arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='ctx'> 	struct btrfs_ioctl_qgroup_assign_args *sa;</div><div class='add'>+	struct btrfs_qgroup_list *prealloc = NULL;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int err;</div><div class='hunk'>@@ -4222,6 +3669,9 @@ static long btrfs_ioctl_qgroup_assign(struct file *file, void __user *arg)</div><div class='ctx'> 	if (!capable(CAP_SYS_ADMIN))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='add'>+	if (!btrfs_qgroup_enabled(fs_info))</div><div class='add'>+		return -ENOTCONN;</div><div class='add'>+</div><div class='ctx'> 	ret = mnt_want_write_file(file);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -4232,28 +3682,45 @@ static long btrfs_ioctl_qgroup_assign(struct file *file, void __user *arg)</div><div class='ctx'> 		goto drop_write;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (sa-&gt;assign) {</div><div class='add'>+		prealloc = kzalloc(sizeof(*prealloc), GFP_KERNEL);</div><div class='add'>+		if (!prealloc) {</div><div class='add'>+			ret = -ENOMEM;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	trans = btrfs_join_transaction(root);</div><div class='ctx'> 	if (IS_ERR(trans)) {</div><div class='ctx'> 		ret = PTR_ERR(trans);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Prealloc ownership is moved to the relation handler, there it's used</div><div class='add'>+	 * or freed on error.</div><div class='add'>+	 */</div><div class='ctx'> 	if (sa-&gt;assign) {</div><div class='del'>-		ret = btrfs_add_qgroup_relation(trans, sa-&gt;src, sa-&gt;dst);</div><div class='add'>+		ret = btrfs_add_qgroup_relation(trans, sa-&gt;src, sa-&gt;dst, prealloc);</div><div class='add'>+		prealloc = NULL;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		ret = btrfs_del_qgroup_relation(trans, sa-&gt;src, sa-&gt;dst);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* update qgroup status and info */</div><div class='add'>+	mutex_lock(&amp;fs_info-&gt;qgroup_ioctl_lock);</div><div class='ctx'> 	err = btrfs_run_qgroups(trans);</div><div class='add'>+	mutex_unlock(&amp;fs_info-&gt;qgroup_ioctl_lock);</div><div class='ctx'> 	if (err &lt; 0)</div><div class='del'>-		btrfs_handle_fs_error(fs_info, err,</div><div class='del'>-				      "failed to update qgroup status and info");</div><div class='add'>+		btrfs_warn(fs_info,</div><div class='add'>+			   "qgroup status update failed after %s relation, marked as inconsistent",</div><div class='add'>+			   sa-&gt;assign ? "adding" : "deleting");</div><div class='ctx'> 	err = btrfs_end_transaction(trans);</div><div class='ctx'> 	if (err &amp;&amp; !ret)</div><div class='ctx'> 		ret = err;</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='add'>+	kfree(prealloc);</div><div class='ctx'> 	kfree(sa);</div><div class='ctx'> drop_write:</div><div class='ctx'> 	mnt_drop_write_file(file);</div><div class='hunk'>@@ -4272,6 +3739,9 @@ static long btrfs_ioctl_qgroup_create(struct file *file, void __user *arg)</div><div class='ctx'> 	if (!capable(CAP_SYS_ADMIN))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='add'>+	if (!btrfs_qgroup_enabled(root-&gt;fs_info))</div><div class='add'>+		return -ENOTCONN;</div><div class='add'>+</div><div class='ctx'> 	ret = mnt_want_write_file(file);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -4287,6 +3757,11 @@ static long btrfs_ioctl_qgroup_create(struct file *file, void __user *arg)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (sa-&gt;create &amp;&amp; btrfs_is_fstree(sa-&gt;qgroupid)) {</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	trans = btrfs_join_transaction(root);</div><div class='ctx'> 	if (IS_ERR(trans)) {</div><div class='ctx'> 		ret = PTR_ERR(trans);</div><div class='hunk'>@@ -4323,6 +3798,9 @@ static long btrfs_ioctl_qgroup_limit(struct file *file, void __user *arg)</div><div class='ctx'> 	if (!capable(CAP_SYS_ADMIN))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='add'>+	if (!btrfs_qgroup_enabled(root-&gt;fs_info))</div><div class='add'>+		return -ENOTCONN;</div><div class='add'>+</div><div class='ctx'> 	ret = mnt_want_write_file(file);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -4342,7 +3820,7 @@ static long btrfs_ioctl_qgroup_limit(struct file *file, void __user *arg)</div><div class='ctx'> 	qgroupid = sa-&gt;qgroupid;</div><div class='ctx'> 	if (!qgroupid) {</div><div class='ctx'> 		/* take the current subvol as qgroup */</div><div class='del'>-		qgroupid = root-&gt;root_key.objectid;</div><div class='add'>+		qgroupid = btrfs_root_id(root);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_limit_qgroup(trans, qgroupid, &amp;sa-&gt;lim);</div><div class='hunk'>@@ -4361,13 +3839,16 @@ drop_write:</div><div class='ctx'> static long btrfs_ioctl_quota_rescan(struct file *file, void __user *arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='ctx'> 	struct btrfs_ioctl_quota_rescan_args *qsa;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!capable(CAP_SYS_ADMIN))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='add'>+	if (!btrfs_qgroup_enabled(fs_info))</div><div class='add'>+		return -ENOTCONN;</div><div class='add'>+</div><div class='ctx'> 	ret = mnt_want_write_file(file);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -4411,8 +3892,7 @@ static long btrfs_ioctl_quota_rescan_status(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static long btrfs_ioctl_quota_rescan_wait(struct btrfs_fs_info *fs_info,</div><div class='del'>-						void __user *arg)</div><div class='add'>+static long btrfs_ioctl_quota_rescan_wait(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	if (!capable(CAP_SYS_ADMIN))</div><div class='ctx'> 		return -EPERM;</div><div class='hunk'>@@ -4421,11 +3901,11 @@ static long btrfs_ioctl_quota_rescan_wait(struct btrfs_fs_info *fs_info,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static long _btrfs_ioctl_set_received_subvol(struct file *file,</div><div class='del'>-					    struct user_namespace *mnt_userns,</div><div class='add'>+					    struct mnt_idmap *idmap,</div><div class='ctx'> 					    struct btrfs_ioctl_received_subvol_args *sa)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='ctx'> 	struct btrfs_root_item *root_item = &amp;root-&gt;root_item;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='hunk'>@@ -4433,7 +3913,7 @@ static long _btrfs_ioctl_set_received_subvol(struct file *file,</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int received_uuid_changed;</div><div class='ctx'> </div><div class='del'>-	if (!inode_owner_or_capable(mnt_userns, inode))</div><div class='add'>+	if (!inode_owner_or_capable(idmap, inode))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='ctx'> 	ret = mnt_want_write_file(file);</div><div class='hunk'>@@ -4473,8 +3953,8 @@ static long _btrfs_ioctl_set_received_subvol(struct file *file,</div><div class='ctx'> 	    !btrfs_is_empty_uuid(root_item-&gt;received_uuid)) {</div><div class='ctx'> 		ret = btrfs_uuid_tree_remove(trans, root_item-&gt;received_uuid,</div><div class='ctx'> 					  BTRFS_UUID_KEY_RECEIVED_SUBVOL,</div><div class='del'>-					  root-&gt;root_key.objectid);</div><div class='del'>-		if (ret &amp;&amp; ret != -ENOENT) {</div><div class='add'>+					  btrfs_root_id(root));</div><div class='add'>+		if (unlikely(ret &amp;&amp; ret != -ENOENT)) {</div><div class='ctx'> 		        btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		        btrfs_end_transaction(trans);</div><div class='ctx'> 		        goto out;</div><div class='hunk'>@@ -4497,8 +3977,8 @@ static long _btrfs_ioctl_set_received_subvol(struct file *file,</div><div class='ctx'> 	if (received_uuid_changed &amp;&amp; !btrfs_is_empty_uuid(sa-&gt;uuid)) {</div><div class='ctx'> 		ret = btrfs_uuid_tree_add(trans, sa-&gt;uuid,</div><div class='ctx'> 					  BTRFS_UUID_KEY_RECEIVED_SUBVOL,</div><div class='del'>-					  root-&gt;root_key.objectid);</div><div class='del'>-		if (ret &lt; 0 &amp;&amp; ret != -EEXIST) {</div><div class='add'>+					  btrfs_root_id(root));</div><div class='add'>+		if (unlikely(ret &lt; 0 &amp;&amp; ret != -EEXIST)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			btrfs_end_transaction(trans);</div><div class='ctx'> 			goto out;</div><div class='hunk'>@@ -4538,7 +4018,7 @@ static long btrfs_ioctl_set_received_subvol_32(struct file *file,</div><div class='ctx'> 	args64-&gt;rtime.nsec = args32-&gt;rtime.nsec;</div><div class='ctx'> 	args64-&gt;flags = args32-&gt;flags;</div><div class='ctx'> </div><div class='del'>-	ret = _btrfs_ioctl_set_received_subvol(file, file_mnt_user_ns(file), args64);</div><div class='add'>+	ret = _btrfs_ioctl_set_received_subvol(file, file_mnt_idmap(file), args64);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -4572,7 +4052,7 @@ static long btrfs_ioctl_set_received_subvol(struct file *file,</div><div class='ctx'> 	if (IS_ERR(sa))</div><div class='ctx'> 		return PTR_ERR(sa);</div><div class='ctx'> </div><div class='del'>-	ret = _btrfs_ioctl_set_received_subvol(file, file_mnt_user_ns(file), sa);</div><div class='add'>+	ret = _btrfs_ioctl_set_received_subvol(file, file_mnt_idmap(file), sa);</div><div class='ctx'> </div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -4613,7 +4093,7 @@ static int btrfs_ioctl_get_fslabel(struct btrfs_fs_info *fs_info,</div><div class='ctx'> static int btrfs_ioctl_set_fslabel(struct file *file, void __user *arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='ctx'> 	struct btrfs_super_block *super_block = fs_info-&gt;super_copy;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='hunk'>@@ -4644,7 +4124,7 @@ static int btrfs_ioctl_set_fslabel(struct file *file, void __user *arg)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;super_lock);</div><div class='del'>-	strcpy(super_block-&gt;label, label);</div><div class='add'>+	strscpy(super_block-&gt;label, label);</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;super_lock);</div><div class='ctx'> 	ret = btrfs_commit_transaction(trans);</div><div class='ctx'> </div><div class='hunk'>@@ -4688,13 +4168,13 @@ static int btrfs_ioctl_get_features(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int check_feature_bits(struct btrfs_fs_info *fs_info,</div><div class='add'>+static int check_feature_bits(const struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			      enum btrfs_feature_set set,</div><div class='ctx'> 			      u64 change_mask, u64 flags, u64 supported_flags,</div><div class='ctx'> 			      u64 safe_set, u64 safe_clear)</div><div class='ctx'> {</div><div class='ctx'> 	const char *type = btrfs_feature_set_name(set);</div><div class='del'>-	char *names;</div><div class='add'>+	const char AUTO_KFREE(names);</div><div class='ctx'> 	u64 disallowed, unsupported;</div><div class='ctx'> 	u64 set_mask = flags &amp; change_mask;</div><div class='ctx'> 	u64 clear_mask = ~flags &amp; change_mask;</div><div class='hunk'>@@ -4702,12 +4182,11 @@ static int check_feature_bits(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	unsupported = set_mask &amp; ~supported_flags;</div><div class='ctx'> 	if (unsupported) {</div><div class='ctx'> 		names = btrfs_printable_features(set, unsupported);</div><div class='del'>-		if (names) {</div><div class='add'>+		if (names)</div><div class='ctx'> 			btrfs_warn(fs_info,</div><div class='ctx'> 				   "this kernel does not support the %s feature bit%s",</div><div class='ctx'> 				   names, strchr(names, ',') ? "s" : "");</div><div class='del'>-			kfree(names);</div><div class='del'>-		} else</div><div class='add'>+		else</div><div class='ctx'> 			btrfs_warn(fs_info,</div><div class='ctx'> 				   "this kernel does not support %s bits 0x%llx",</div><div class='ctx'> 				   type, unsupported);</div><div class='hunk'>@@ -4717,12 +4196,11 @@ static int check_feature_bits(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	disallowed = set_mask &amp; ~safe_set;</div><div class='ctx'> 	if (disallowed) {</div><div class='ctx'> 		names = btrfs_printable_features(set, disallowed);</div><div class='del'>-		if (names) {</div><div class='add'>+		if (names)</div><div class='ctx'> 			btrfs_warn(fs_info,</div><div class='ctx'> 				   "can't set the %s feature bit%s while mounted",</div><div class='ctx'> 				   names, strchr(names, ',') ? "s" : "");</div><div class='del'>-			kfree(names);</div><div class='del'>-		} else</div><div class='add'>+		else</div><div class='ctx'> 			btrfs_warn(fs_info,</div><div class='ctx'> 				   "can't set %s bits 0x%llx while mounted",</div><div class='ctx'> 				   type, disallowed);</div><div class='hunk'>@@ -4732,12 +4210,11 @@ static int check_feature_bits(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	disallowed = clear_mask &amp; ~safe_clear;</div><div class='ctx'> 	if (disallowed) {</div><div class='ctx'> 		names = btrfs_printable_features(set, disallowed);</div><div class='del'>-		if (names) {</div><div class='add'>+		if (names)</div><div class='ctx'> 			btrfs_warn(fs_info,</div><div class='ctx'> 				   "can't clear the %s feature bit%s while mounted",</div><div class='ctx'> 				   names, strchr(names, ',') ? "s" : "");</div><div class='del'>-			kfree(names);</div><div class='del'>-		} else</div><div class='add'>+		else</div><div class='ctx'> 			btrfs_warn(fs_info,</div><div class='ctx'> 				   "can't clear %s bits 0x%llx while mounted",</div><div class='ctx'> 				   type, disallowed);</div><div class='hunk'>@@ -4756,7 +4233,7 @@ check_feature_bits(fs_info, FEAT_##mask_base, change_mask, flags,	\</div><div class='ctx'> static int btrfs_ioctl_set_features(struct file *file, void __user *arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='ctx'> 	struct btrfs_super_block *super_block = fs_info-&gt;super_copy;</div><div class='ctx'> 	struct btrfs_ioctl_feature_flags flags[2];</div><div class='hunk'>@@ -4824,14 +4301,14 @@ out_drop_write:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int _btrfs_ioctl_send(struct file *file, void __user *argp, bool compat)</div><div class='add'>+static int _btrfs_ioctl_send(struct btrfs_root *root, void __user *argp, bool compat)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_ioctl_send_args *arg;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (compat) {</div><div class='ctx'> #if defined(CONFIG_64BIT) &amp;&amp; defined(CONFIG_COMPAT)</div><div class='del'>-		struct btrfs_ioctl_send_args_32 args32;</div><div class='add'>+		struct btrfs_ioctl_send_args_32 args32 = { 0 };</div><div class='ctx'> </div><div class='ctx'> 		ret = copy_from_user(&amp;args32, argp, sizeof(args32));</div><div class='ctx'> 		if (ret)</div><div class='hunk'>@@ -4844,6 +4321,7 @@ static int _btrfs_ioctl_send(struct file *file, void __user *argp, bool compat)</div><div class='ctx'> 		arg-&gt;clone_sources = compat_ptr(args32.clone_sources);</div><div class='ctx'> 		arg-&gt;parent_root = args32.parent_root;</div><div class='ctx'> 		arg-&gt;flags = args32.flags;</div><div class='add'>+		arg-&gt;version = args32.version;</div><div class='ctx'> 		memcpy(arg-&gt;reserved, args32.reserved,</div><div class='ctx'> 		       sizeof(args32.reserved));</div><div class='ctx'> #else</div><div class='hunk'>@@ -4854,22 +4332,868 @@ static int _btrfs_ioctl_send(struct file *file, void __user *argp, bool compat)</div><div class='ctx'> 		if (IS_ERR(arg))</div><div class='ctx'> 			return PTR_ERR(arg);</div><div class='ctx'> 	}</div><div class='del'>-	ret = btrfs_ioctl_send(file, arg);</div><div class='add'>+	ret = btrfs_ioctl_send(root, arg);</div><div class='ctx'> 	kfree(arg);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int btrfs_ioctl_encoded_read(struct file *file, void __user *argp,</div><div class='add'>+				    bool compat)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_ioctl_encoded_io_args args = { 0 };</div><div class='add'>+	size_t copy_end_kernel = offsetofend(struct btrfs_ioctl_encoded_io_args,</div><div class='add'>+					     flags);</div><div class='add'>+	size_t copy_end;</div><div class='add'>+	struct btrfs_inode *inode = BTRFS_I(file_inode(file));</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	struct extent_io_tree *io_tree = &amp;inode-&gt;io_tree;</div><div class='add'>+	struct iovec iovstack[UIO_FASTIOV];</div><div class='add'>+	struct iovec *iov = iovstack;</div><div class='add'>+	struct iov_iter iter;</div><div class='add'>+	loff_t pos;</div><div class='add'>+	struct kiocb kiocb;</div><div class='add'>+	ssize_t ret;</div><div class='add'>+	u64 disk_bytenr, disk_io_size;</div><div class='add'>+	struct extent_state *cached_state = NULL;</div><div class='add'>+</div><div class='add'>+	if (!capable(CAP_SYS_ADMIN)) {</div><div class='add'>+		ret = -EPERM;</div><div class='add'>+		goto out_acct;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (compat) {</div><div class='add'>+#if defined(CONFIG_64BIT) &amp;&amp; defined(CONFIG_COMPAT)</div><div class='add'>+		struct btrfs_ioctl_encoded_io_args_32 args32;</div><div class='add'>+</div><div class='add'>+		copy_end = offsetofend(struct btrfs_ioctl_encoded_io_args_32,</div><div class='add'>+				       flags);</div><div class='add'>+		if (copy_from_user(&amp;args32, argp, copy_end)) {</div><div class='add'>+			ret = -EFAULT;</div><div class='add'>+			goto out_acct;</div><div class='add'>+		}</div><div class='add'>+		args.iov = compat_ptr(args32.iov);</div><div class='add'>+		args.iovcnt = args32.iovcnt;</div><div class='add'>+		args.offset = args32.offset;</div><div class='add'>+		args.flags = args32.flags;</div><div class='add'>+#else</div><div class='add'>+		return -ENOTTY;</div><div class='add'>+#endif</div><div class='add'>+	} else {</div><div class='add'>+		copy_end = copy_end_kernel;</div><div class='add'>+		if (copy_from_user(&amp;args, argp, copy_end)) {</div><div class='add'>+			ret = -EFAULT;</div><div class='add'>+			goto out_acct;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	if (args.flags != 0) {</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out_acct;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = import_iovec(ITER_DEST, args.iov, args.iovcnt, ARRAY_SIZE(iovstack),</div><div class='add'>+			   &amp;iov, &amp;iter);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out_acct;</div><div class='add'>+</div><div class='add'>+	if (iov_iter_count(&amp;iter) == 0) {</div><div class='add'>+		ret = 0;</div><div class='add'>+		goto out_iov;</div><div class='add'>+	}</div><div class='add'>+	pos = args.offset;</div><div class='add'>+	ret = rw_verify_area(READ, file, &amp;pos, args.len);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out_iov;</div><div class='add'>+</div><div class='add'>+	init_sync_kiocb(&amp;kiocb, file);</div><div class='add'>+	kiocb.ki_pos = pos;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_encoded_read(&amp;kiocb, &amp;iter, &amp;args, &amp;cached_state,</div><div class='add'>+				 &amp;disk_bytenr, &amp;disk_io_size);</div><div class='add'>+</div><div class='add'>+	if (ret == -EIOCBQUEUED) {</div><div class='add'>+		bool unlocked = false;</div><div class='add'>+		u64 start, lockend, count;</div><div class='add'>+</div><div class='add'>+		start = ALIGN_DOWN(kiocb.ki_pos, fs_info-&gt;sectorsize);</div><div class='add'>+		lockend = start + BTRFS_MAX_UNCOMPRESSED - 1;</div><div class='add'>+</div><div class='add'>+		if (args.compression)</div><div class='add'>+			count = disk_io_size;</div><div class='add'>+		else</div><div class='add'>+			count = args.len;</div><div class='add'>+</div><div class='add'>+		ret = btrfs_encoded_read_regular(&amp;kiocb, &amp;iter, start, lockend,</div><div class='add'>+						 &amp;cached_state, disk_bytenr,</div><div class='add'>+						 disk_io_size, count,</div><div class='add'>+						 args.compression, &amp;unlocked);</div><div class='add'>+</div><div class='add'>+		if (!unlocked) {</div><div class='add'>+			btrfs_unlock_extent(io_tree, start, lockend, &amp;cached_state);</div><div class='add'>+			btrfs_inode_unlock(inode, BTRFS_ILOCK_SHARED);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (ret &gt;= 0) {</div><div class='add'>+		fsnotify_access(file);</div><div class='add'>+		if (copy_to_user(argp + copy_end,</div><div class='add'>+				 (char *)&amp;args + copy_end_kernel,</div><div class='add'>+				 sizeof(args) - copy_end_kernel))</div><div class='add'>+			ret = -EFAULT;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+out_iov:</div><div class='add'>+	kfree(iov);</div><div class='add'>+out_acct:</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		add_rchar(current, ret);</div><div class='add'>+	inc_syscr(current);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int btrfs_ioctl_encoded_write(struct file *file, void __user *argp, bool compat)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_ioctl_encoded_io_args args;</div><div class='add'>+	struct iovec iovstack[UIO_FASTIOV];</div><div class='add'>+	struct iovec *iov = iovstack;</div><div class='add'>+	struct iov_iter iter;</div><div class='add'>+	loff_t pos;</div><div class='add'>+	struct kiocb kiocb;</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	if (!capable(CAP_SYS_ADMIN)) {</div><div class='add'>+		ret = -EPERM;</div><div class='add'>+		goto out_acct;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!(file-&gt;f_mode &amp; FMODE_WRITE)) {</div><div class='add'>+		ret = -EBADF;</div><div class='add'>+		goto out_acct;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (compat) {</div><div class='add'>+#if defined(CONFIG_64BIT) &amp;&amp; defined(CONFIG_COMPAT)</div><div class='add'>+		struct btrfs_ioctl_encoded_io_args_32 args32;</div><div class='add'>+</div><div class='add'>+		if (copy_from_user(&amp;args32, argp, sizeof(args32))) {</div><div class='add'>+			ret = -EFAULT;</div><div class='add'>+			goto out_acct;</div><div class='add'>+		}</div><div class='add'>+		args.iov = compat_ptr(args32.iov);</div><div class='add'>+		args.iovcnt = args32.iovcnt;</div><div class='add'>+		args.offset = args32.offset;</div><div class='add'>+		args.flags = args32.flags;</div><div class='add'>+		args.len = args32.len;</div><div class='add'>+		args.unencoded_len = args32.unencoded_len;</div><div class='add'>+		args.unencoded_offset = args32.unencoded_offset;</div><div class='add'>+		args.compression = args32.compression;</div><div class='add'>+		args.encryption = args32.encryption;</div><div class='add'>+		memcpy(args.reserved, args32.reserved, sizeof(args.reserved));</div><div class='add'>+#else</div><div class='add'>+		return -ENOTTY;</div><div class='add'>+#endif</div><div class='add'>+	} else {</div><div class='add'>+		if (copy_from_user(&amp;args, argp, sizeof(args))) {</div><div class='add'>+			ret = -EFAULT;</div><div class='add'>+			goto out_acct;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = -EINVAL;</div><div class='add'>+	if (args.flags != 0)</div><div class='add'>+		goto out_acct;</div><div class='add'>+	if (memchr_inv(args.reserved, 0, sizeof(args.reserved)))</div><div class='add'>+		goto out_acct;</div><div class='add'>+	if (args.compression == BTRFS_ENCODED_IO_COMPRESSION_NONE &amp;&amp;</div><div class='add'>+	    args.encryption == BTRFS_ENCODED_IO_ENCRYPTION_NONE)</div><div class='add'>+		goto out_acct;</div><div class='add'>+	if (args.compression &gt;= BTRFS_ENCODED_IO_COMPRESSION_TYPES ||</div><div class='add'>+	    args.encryption &gt;= BTRFS_ENCODED_IO_ENCRYPTION_TYPES)</div><div class='add'>+		goto out_acct;</div><div class='add'>+	if (args.unencoded_offset &gt; args.unencoded_len)</div><div class='add'>+		goto out_acct;</div><div class='add'>+	if (args.len &gt; args.unencoded_len - args.unencoded_offset)</div><div class='add'>+		goto out_acct;</div><div class='add'>+</div><div class='add'>+	ret = import_iovec(ITER_SOURCE, args.iov, args.iovcnt, ARRAY_SIZE(iovstack),</div><div class='add'>+			   &amp;iov, &amp;iter);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out_acct;</div><div class='add'>+</div><div class='add'>+	if (iov_iter_count(&amp;iter) == 0) {</div><div class='add'>+		ret = 0;</div><div class='add'>+		goto out_iov;</div><div class='add'>+	}</div><div class='add'>+	pos = args.offset;</div><div class='add'>+	ret = rw_verify_area(WRITE, file, &amp;pos, args.len);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out_iov;</div><div class='add'>+</div><div class='add'>+	init_sync_kiocb(&amp;kiocb, file);</div><div class='add'>+	ret = kiocb_set_rw_flags(&amp;kiocb, 0, WRITE);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_iov;</div><div class='add'>+	kiocb.ki_pos = pos;</div><div class='add'>+</div><div class='add'>+	file_start_write(file);</div><div class='add'>+</div><div class='add'>+	ret = btrfs_do_write_iter(&amp;kiocb, &amp;iter, &amp;args);</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		fsnotify_modify(file);</div><div class='add'>+</div><div class='add'>+	file_end_write(file);</div><div class='add'>+out_iov:</div><div class='add'>+	kfree(iov);</div><div class='add'>+out_acct:</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		add_wchar(current, ret);</div><div class='add'>+	inc_syscw(current);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct btrfs_uring_encoded_data {</div><div class='add'>+	struct btrfs_ioctl_encoded_io_args args;</div><div class='add'>+	struct iovec iovstack[UIO_FASTIOV];</div><div class='add'>+	struct iovec *iov;</div><div class='add'>+	struct iov_iter iter;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Context that's attached to an encoded read io_uring command, in cmd-&gt;pdu. It</div><div class='add'>+ * contains the fields in btrfs_uring_read_extent that are necessary to finish</div><div class='add'>+ * off and cleanup the I/O in btrfs_uring_read_finished.</div><div class='add'>+ */</div><div class='add'>+struct btrfs_uring_priv {</div><div class='add'>+	struct io_uring_cmd *cmd;</div><div class='add'>+	struct page **pages;</div><div class='add'>+	unsigned long nr_pages;</div><div class='add'>+	struct kiocb iocb;</div><div class='add'>+	struct iovec *iov;</div><div class='add'>+	struct iov_iter iter;</div><div class='add'>+	struct extent_state *cached_state;</div><div class='add'>+	u64 count;</div><div class='add'>+	u64 start;</div><div class='add'>+	u64 lockend;</div><div class='add'>+	int err;</div><div class='add'>+	bool compressed;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct io_btrfs_cmd {</div><div class='add'>+	struct btrfs_uring_encoded_data *data;</div><div class='add'>+	struct btrfs_uring_priv *priv;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static void btrfs_uring_read_finished(struct io_tw_req tw_req, io_tw_token_t tw)</div><div class='add'>+{</div><div class='add'>+	struct io_uring_cmd *cmd = io_uring_cmd_from_tw(tw_req);</div><div class='add'>+	struct io_btrfs_cmd *bc = io_uring_cmd_to_pdu(cmd, struct io_btrfs_cmd);</div><div class='add'>+	struct btrfs_uring_priv *priv = bc-&gt;priv;</div><div class='add'>+	struct btrfs_inode *inode = BTRFS_I(file_inode(priv-&gt;iocb.ki_filp));</div><div class='add'>+	struct extent_io_tree *io_tree = &amp;inode-&gt;io_tree;</div><div class='add'>+	pgoff_t index;</div><div class='add'>+	u64 cur;</div><div class='add'>+	size_t page_offset;</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	/* The inode lock has already been acquired in btrfs_uring_read_extent.  */</div><div class='add'>+	btrfs_lockdep_inode_acquire(inode, i_rwsem);</div><div class='add'>+</div><div class='add'>+	if (priv-&gt;err) {</div><div class='add'>+		ret = priv-&gt;err;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (priv-&gt;compressed) {</div><div class='add'>+		index = 0;</div><div class='add'>+		page_offset = 0;</div><div class='add'>+	} else {</div><div class='add'>+		index = (priv-&gt;iocb.ki_pos - priv-&gt;start) &gt;&gt; PAGE_SHIFT;</div><div class='add'>+		page_offset = offset_in_page(priv-&gt;iocb.ki_pos - priv-&gt;start);</div><div class='add'>+	}</div><div class='add'>+	cur = 0;</div><div class='add'>+	while (cur &lt; priv-&gt;count) {</div><div class='add'>+		size_t bytes = min_t(size_t, priv-&gt;count - cur, PAGE_SIZE - page_offset);</div><div class='add'>+</div><div class='add'>+		if (copy_page_to_iter(priv-&gt;pages[index], page_offset, bytes,</div><div class='add'>+				      &amp;priv-&gt;iter) != bytes) {</div><div class='add'>+			ret = -EFAULT;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		index++;</div><div class='add'>+		cur += bytes;</div><div class='add'>+		page_offset = 0;</div><div class='add'>+	}</div><div class='add'>+	ret = priv-&gt;count;</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	btrfs_unlock_extent(io_tree, priv-&gt;start, priv-&gt;lockend, &amp;priv-&gt;cached_state);</div><div class='add'>+	btrfs_inode_unlock(inode, BTRFS_ILOCK_SHARED);</div><div class='add'>+</div><div class='add'>+	io_uring_cmd_done(cmd, ret, IO_URING_CMD_TASK_WORK_ISSUE_FLAGS);</div><div class='add'>+	add_rchar(current, ret);</div><div class='add'>+</div><div class='add'>+	for (index = 0; index &lt; priv-&gt;nr_pages; index++)</div><div class='add'>+		__free_page(priv-&gt;pages[index]);</div><div class='add'>+</div><div class='add'>+	kfree(priv-&gt;pages);</div><div class='add'>+	kfree(priv-&gt;iov);</div><div class='add'>+	kfree(priv);</div><div class='add'>+	kfree(bc-&gt;data);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_uring_read_extent_endio(void *ctx, int err)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_uring_priv *priv = ctx;</div><div class='add'>+	struct io_btrfs_cmd *bc = io_uring_cmd_to_pdu(priv-&gt;cmd, struct io_btrfs_cmd);</div><div class='add'>+</div><div class='add'>+	priv-&gt;err = err;</div><div class='add'>+	bc-&gt;priv = priv;</div><div class='add'>+</div><div class='add'>+	io_uring_cmd_complete_in_task(priv-&gt;cmd, btrfs_uring_read_finished);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int btrfs_uring_read_extent(struct kiocb *iocb, struct iov_iter *iter,</div><div class='add'>+				   u64 start, u64 lockend,</div><div class='add'>+				   struct extent_state *cached_state,</div><div class='add'>+				   u64 disk_bytenr, u64 disk_io_size,</div><div class='add'>+				   size_t count, bool compressed,</div><div class='add'>+				   struct iovec *iov, struct io_uring_cmd *cmd)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_inode *inode = BTRFS_I(file_inode(iocb-&gt;ki_filp));</div><div class='add'>+	struct extent_io_tree *io_tree = &amp;inode-&gt;io_tree;</div><div class='add'>+	struct page **pages;</div><div class='add'>+	struct btrfs_uring_priv *priv = NULL;</div><div class='add'>+	unsigned long nr_pages;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	nr_pages = DIV_ROUND_UP(disk_io_size, PAGE_SIZE);</div><div class='add'>+	pages = kcalloc(nr_pages, sizeof(struct page *), GFP_NOFS);</div><div class='add'>+	if (!pages)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	ret = btrfs_alloc_page_array(nr_pages, pages, 0);</div><div class='add'>+	if (ret) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out_fail;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	priv = kmalloc(sizeof(*priv), GFP_NOFS);</div><div class='add'>+	if (!priv) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out_fail;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	priv-&gt;iocb = *iocb;</div><div class='add'>+	priv-&gt;iov = iov;</div><div class='add'>+	priv-&gt;iter = *iter;</div><div class='add'>+	priv-&gt;count = count;</div><div class='add'>+	priv-&gt;cmd = cmd;</div><div class='add'>+	priv-&gt;cached_state = cached_state;</div><div class='add'>+	priv-&gt;compressed = compressed;</div><div class='add'>+	priv-&gt;nr_pages = nr_pages;</div><div class='add'>+	priv-&gt;pages = pages;</div><div class='add'>+	priv-&gt;start = start;</div><div class='add'>+	priv-&gt;lockend = lockend;</div><div class='add'>+	priv-&gt;err = 0;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_encoded_read_regular_fill_pages(inode, disk_bytenr,</div><div class='add'>+						    disk_io_size, pages, priv);</div><div class='add'>+	if (ret &amp;&amp; ret != -EIOCBQUEUED)</div><div class='add'>+		goto out_fail;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If we return -EIOCBQUEUED, we're deferring the cleanup to</div><div class='add'>+	 * btrfs_uring_read_finished(), which will handle unlocking the extent</div><div class='add'>+	 * and inode and freeing the allocations.</div><div class='add'>+	 */</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We're returning to userspace with the inode lock held, and that's</div><div class='add'>+	 * okay - it'll get unlocked in a worker thread.  Call</div><div class='add'>+	 * btrfs_lockdep_inode_release() to avoid confusing lockdep.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_lockdep_inode_release(inode, i_rwsem);</div><div class='add'>+</div><div class='add'>+	return -EIOCBQUEUED;</div><div class='add'>+</div><div class='add'>+out_fail:</div><div class='add'>+	btrfs_unlock_extent(io_tree, start, lockend, &amp;cached_state);</div><div class='add'>+	btrfs_inode_unlock(inode, BTRFS_ILOCK_SHARED);</div><div class='add'>+	kfree(priv);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int btrfs_uring_encoded_read(struct io_uring_cmd *cmd, unsigned int issue_flags)</div><div class='add'>+{</div><div class='add'>+	struct file *file = cmd-&gt;file;</div><div class='add'>+	struct btrfs_inode *inode = BTRFS_I(file-&gt;f_inode);</div><div class='add'>+	struct extent_io_tree *io_tree = &amp;inode-&gt;io_tree;</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	size_t copy_end_kernel = offsetofend(struct btrfs_ioctl_encoded_io_args, flags);</div><div class='add'>+	size_t copy_end;</div><div class='add'>+	int ret;</div><div class='add'>+	u64 disk_bytenr, disk_io_size;</div><div class='add'>+	loff_t pos;</div><div class='add'>+	struct kiocb kiocb;</div><div class='add'>+	struct extent_state *cached_state = NULL;</div><div class='add'>+	u64 start, lockend;</div><div class='add'>+	void __user *sqe_addr;</div><div class='add'>+	struct io_btrfs_cmd *bc = io_uring_cmd_to_pdu(cmd, struct io_btrfs_cmd);</div><div class='add'>+	struct btrfs_uring_encoded_data *data = NULL;</div><div class='add'>+</div><div class='add'>+	if (cmd-&gt;flags &amp; IORING_URING_CMD_REISSUE)</div><div class='add'>+		data = bc-&gt;data;</div><div class='add'>+</div><div class='add'>+	if (!capable(CAP_SYS_ADMIN)) {</div><div class='add'>+		ret = -EPERM;</div><div class='add'>+		goto out_acct;</div><div class='add'>+	}</div><div class='add'>+	sqe_addr = u64_to_user_ptr(READ_ONCE(cmd-&gt;sqe-&gt;addr));</div><div class='add'>+</div><div class='add'>+	if (issue_flags &amp; IO_URING_F_COMPAT) {</div><div class='add'>+#if defined(CONFIG_64BIT) &amp;&amp; defined(CONFIG_COMPAT)</div><div class='add'>+		copy_end = offsetofend(struct btrfs_ioctl_encoded_io_args_32, flags);</div><div class='add'>+#else</div><div class='add'>+		ret = -ENOTTY;</div><div class='add'>+		goto out_acct;</div><div class='add'>+#endif</div><div class='add'>+	} else {</div><div class='add'>+		copy_end = copy_end_kernel;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!data) {</div><div class='add'>+		data = kzalloc(sizeof(*data), GFP_NOFS);</div><div class='add'>+		if (!data) {</div><div class='add'>+			ret = -ENOMEM;</div><div class='add'>+			goto out_acct;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		bc-&gt;data = data;</div><div class='add'>+</div><div class='add'>+		if (issue_flags &amp; IO_URING_F_COMPAT) {</div><div class='add'>+#if defined(CONFIG_64BIT) &amp;&amp; defined(CONFIG_COMPAT)</div><div class='add'>+			struct btrfs_ioctl_encoded_io_args_32 args32;</div><div class='add'>+</div><div class='add'>+			if (copy_from_user(&amp;args32, sqe_addr, copy_end)) {</div><div class='add'>+				ret = -EFAULT;</div><div class='add'>+				goto out_acct;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			data-&gt;args.iov = compat_ptr(args32.iov);</div><div class='add'>+			data-&gt;args.iovcnt = args32.iovcnt;</div><div class='add'>+			data-&gt;args.offset = args32.offset;</div><div class='add'>+			data-&gt;args.flags = args32.flags;</div><div class='add'>+#endif</div><div class='add'>+		} else {</div><div class='add'>+			if (copy_from_user(&amp;data-&gt;args, sqe_addr, copy_end)) {</div><div class='add'>+				ret = -EFAULT;</div><div class='add'>+				goto out_acct;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (data-&gt;args.flags != 0) {</div><div class='add'>+			ret = -EINVAL;</div><div class='add'>+			goto out_acct;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		data-&gt;iov = data-&gt;iovstack;</div><div class='add'>+		ret = import_iovec(ITER_DEST, data-&gt;args.iov, data-&gt;args.iovcnt,</div><div class='add'>+				   ARRAY_SIZE(data-&gt;iovstack), &amp;data-&gt;iov,</div><div class='add'>+				   &amp;data-&gt;iter);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out_acct;</div><div class='add'>+</div><div class='add'>+		if (iov_iter_count(&amp;data-&gt;iter) == 0) {</div><div class='add'>+			ret = 0;</div><div class='add'>+			goto out_free;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	pos = data-&gt;args.offset;</div><div class='add'>+	ret = rw_verify_area(READ, file, &amp;pos, data-&gt;args.len);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out_free;</div><div class='add'>+</div><div class='add'>+	init_sync_kiocb(&amp;kiocb, file);</div><div class='add'>+	kiocb.ki_pos = pos;</div><div class='add'>+</div><div class='add'>+	if (issue_flags &amp; IO_URING_F_NONBLOCK)</div><div class='add'>+		kiocb.ki_flags |= IOCB_NOWAIT;</div><div class='add'>+</div><div class='add'>+	start = ALIGN_DOWN(pos, fs_info-&gt;sectorsize);</div><div class='add'>+	lockend = start + BTRFS_MAX_UNCOMPRESSED - 1;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_encoded_read(&amp;kiocb, &amp;data-&gt;iter, &amp;data-&gt;args, &amp;cached_state,</div><div class='add'>+				 &amp;disk_bytenr, &amp;disk_io_size);</div><div class='add'>+	if (ret == -EAGAIN)</div><div class='add'>+		goto out_acct;</div><div class='add'>+	if (ret &lt; 0 &amp;&amp; ret != -EIOCBQUEUED)</div><div class='add'>+		goto out_free;</div><div class='add'>+</div><div class='add'>+	file_accessed(file);</div><div class='add'>+</div><div class='add'>+	if (copy_to_user(sqe_addr + copy_end,</div><div class='add'>+			 (const char *)&amp;data-&gt;args + copy_end_kernel,</div><div class='add'>+			 sizeof(data-&gt;args) - copy_end_kernel)) {</div><div class='add'>+		if (ret == -EIOCBQUEUED) {</div><div class='add'>+			btrfs_unlock_extent(io_tree, start, lockend, &amp;cached_state);</div><div class='add'>+			btrfs_inode_unlock(inode, BTRFS_ILOCK_SHARED);</div><div class='add'>+		}</div><div class='add'>+		ret = -EFAULT;</div><div class='add'>+		goto out_free;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (ret == -EIOCBQUEUED) {</div><div class='add'>+		u64 count = min_t(u64, iov_iter_count(&amp;data-&gt;iter), disk_io_size);</div><div class='add'>+</div><div class='add'>+		/* Match ioctl by not returning past EOF if uncompressed. */</div><div class='add'>+		if (!data-&gt;args.compression)</div><div class='add'>+			count = min_t(u64, count, data-&gt;args.len);</div><div class='add'>+</div><div class='add'>+		ret = btrfs_uring_read_extent(&amp;kiocb, &amp;data-&gt;iter, start, lockend,</div><div class='add'>+					      cached_state, disk_bytenr, disk_io_size,</div><div class='add'>+					      count, data-&gt;args.compression,</div><div class='add'>+					      data-&gt;iov, cmd);</div><div class='add'>+</div><div class='add'>+		goto out_acct;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+out_free:</div><div class='add'>+	kfree(data-&gt;iov);</div><div class='add'>+</div><div class='add'>+out_acct:</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		add_rchar(current, ret);</div><div class='add'>+	inc_syscr(current);</div><div class='add'>+</div><div class='add'>+	if (ret != -EIOCBQUEUED &amp;&amp; ret != -EAGAIN)</div><div class='add'>+		kfree(data);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int btrfs_uring_encoded_write(struct io_uring_cmd *cmd, unsigned int issue_flags)</div><div class='add'>+{</div><div class='add'>+	struct file *file = cmd-&gt;file;</div><div class='add'>+	loff_t pos;</div><div class='add'>+	struct kiocb kiocb;</div><div class='add'>+	ssize_t ret;</div><div class='add'>+	void __user *sqe_addr;</div><div class='add'>+	struct io_btrfs_cmd *bc = io_uring_cmd_to_pdu(cmd, struct io_btrfs_cmd);</div><div class='add'>+	struct btrfs_uring_encoded_data *data = NULL;</div><div class='add'>+</div><div class='add'>+	if (cmd-&gt;flags &amp; IORING_URING_CMD_REISSUE)</div><div class='add'>+		data = bc-&gt;data;</div><div class='add'>+</div><div class='add'>+	if (!capable(CAP_SYS_ADMIN)) {</div><div class='add'>+		ret = -EPERM;</div><div class='add'>+		goto out_acct;</div><div class='add'>+	}</div><div class='add'>+	sqe_addr = u64_to_user_ptr(READ_ONCE(cmd-&gt;sqe-&gt;addr));</div><div class='add'>+</div><div class='add'>+	if (!(file-&gt;f_mode &amp; FMODE_WRITE)) {</div><div class='add'>+		ret = -EBADF;</div><div class='add'>+		goto out_acct;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!data) {</div><div class='add'>+		data = kzalloc(sizeof(*data), GFP_NOFS);</div><div class='add'>+		if (!data) {</div><div class='add'>+			ret = -ENOMEM;</div><div class='add'>+			goto out_acct;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		bc-&gt;data = data;</div><div class='add'>+</div><div class='add'>+		if (issue_flags &amp; IO_URING_F_COMPAT) {</div><div class='add'>+#if defined(CONFIG_64BIT) &amp;&amp; defined(CONFIG_COMPAT)</div><div class='add'>+			struct btrfs_ioctl_encoded_io_args_32 args32;</div><div class='add'>+</div><div class='add'>+			if (copy_from_user(&amp;args32, sqe_addr, sizeof(args32))) {</div><div class='add'>+				ret = -EFAULT;</div><div class='add'>+				goto out_acct;</div><div class='add'>+			}</div><div class='add'>+			data-&gt;args.iov = compat_ptr(args32.iov);</div><div class='add'>+			data-&gt;args.iovcnt = args32.iovcnt;</div><div class='add'>+			data-&gt;args.offset = args32.offset;</div><div class='add'>+			data-&gt;args.flags = args32.flags;</div><div class='add'>+			data-&gt;args.len = args32.len;</div><div class='add'>+			data-&gt;args.unencoded_len = args32.unencoded_len;</div><div class='add'>+			data-&gt;args.unencoded_offset = args32.unencoded_offset;</div><div class='add'>+			data-&gt;args.compression = args32.compression;</div><div class='add'>+			data-&gt;args.encryption = args32.encryption;</div><div class='add'>+			memcpy(data-&gt;args.reserved, args32.reserved,</div><div class='add'>+			       sizeof(data-&gt;args.reserved));</div><div class='add'>+#else</div><div class='add'>+			ret = -ENOTTY;</div><div class='add'>+			goto out_acct;</div><div class='add'>+#endif</div><div class='add'>+		} else {</div><div class='add'>+			if (copy_from_user(&amp;data-&gt;args, sqe_addr, sizeof(data-&gt;args))) {</div><div class='add'>+				ret = -EFAULT;</div><div class='add'>+				goto out_acct;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		if (data-&gt;args.flags != 0)</div><div class='add'>+			goto out_acct;</div><div class='add'>+		if (memchr_inv(data-&gt;args.reserved, 0, sizeof(data-&gt;args.reserved)))</div><div class='add'>+			goto out_acct;</div><div class='add'>+		if (data-&gt;args.compression == BTRFS_ENCODED_IO_COMPRESSION_NONE &amp;&amp;</div><div class='add'>+		    data-&gt;args.encryption == BTRFS_ENCODED_IO_ENCRYPTION_NONE)</div><div class='add'>+			goto out_acct;</div><div class='add'>+		if (data-&gt;args.compression &gt;= BTRFS_ENCODED_IO_COMPRESSION_TYPES ||</div><div class='add'>+		    data-&gt;args.encryption &gt;= BTRFS_ENCODED_IO_ENCRYPTION_TYPES)</div><div class='add'>+			goto out_acct;</div><div class='add'>+		if (data-&gt;args.unencoded_offset &gt; data-&gt;args.unencoded_len)</div><div class='add'>+			goto out_acct;</div><div class='add'>+		if (data-&gt;args.len &gt; data-&gt;args.unencoded_len - data-&gt;args.unencoded_offset)</div><div class='add'>+			goto out_acct;</div><div class='add'>+</div><div class='add'>+		data-&gt;iov = data-&gt;iovstack;</div><div class='add'>+		ret = import_iovec(ITER_SOURCE, data-&gt;args.iov, data-&gt;args.iovcnt,</div><div class='add'>+				   ARRAY_SIZE(data-&gt;iovstack), &amp;data-&gt;iov,</div><div class='add'>+				   &amp;data-&gt;iter);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out_acct;</div><div class='add'>+</div><div class='add'>+		if (iov_iter_count(&amp;data-&gt;iter) == 0) {</div><div class='add'>+			ret = 0;</div><div class='add'>+			goto out_iov;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (issue_flags &amp; IO_URING_F_NONBLOCK) {</div><div class='add'>+		ret = -EAGAIN;</div><div class='add'>+		goto out_acct;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	pos = data-&gt;args.offset;</div><div class='add'>+	ret = rw_verify_area(WRITE, file, &amp;pos, data-&gt;args.len);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out_iov;</div><div class='add'>+</div><div class='add'>+	init_sync_kiocb(&amp;kiocb, file);</div><div class='add'>+	ret = kiocb_set_rw_flags(&amp;kiocb, 0, WRITE);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_iov;</div><div class='add'>+	kiocb.ki_pos = pos;</div><div class='add'>+</div><div class='add'>+	file_start_write(file);</div><div class='add'>+</div><div class='add'>+	ret = btrfs_do_write_iter(&amp;kiocb, &amp;data-&gt;iter, &amp;data-&gt;args);</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		fsnotify_modify(file);</div><div class='add'>+</div><div class='add'>+	file_end_write(file);</div><div class='add'>+out_iov:</div><div class='add'>+	kfree(data-&gt;iov);</div><div class='add'>+out_acct:</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		add_wchar(current, ret);</div><div class='add'>+	inc_syscw(current);</div><div class='add'>+</div><div class='add'>+	if (ret != -EAGAIN)</div><div class='add'>+		kfree(data);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_uring_cmd(struct io_uring_cmd *cmd, unsigned int issue_flags)</div><div class='add'>+{</div><div class='add'>+	if (unlikely(btrfs_is_shutdown(inode_to_fs_info(file_inode(cmd-&gt;file)))))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	switch (cmd-&gt;cmd_op) {</div><div class='add'>+	case BTRFS_IOC_ENCODED_READ:</div><div class='add'>+#if defined(CONFIG_64BIT) &amp;&amp; defined(CONFIG_COMPAT)</div><div class='add'>+	case BTRFS_IOC_ENCODED_READ_32:</div><div class='add'>+#endif</div><div class='add'>+		return btrfs_uring_encoded_read(cmd, issue_flags);</div><div class='add'>+</div><div class='add'>+	case BTRFS_IOC_ENCODED_WRITE:</div><div class='add'>+#if defined(CONFIG_64BIT) &amp;&amp; defined(CONFIG_COMPAT)</div><div class='add'>+	case BTRFS_IOC_ENCODED_WRITE_32:</div><div class='add'>+#endif</div><div class='add'>+		return btrfs_uring_encoded_write(cmd, issue_flags);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return -EINVAL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int btrfs_ioctl_subvol_sync(struct btrfs_fs_info *fs_info, void __user *argp)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_root *root;</div><div class='add'>+	struct btrfs_ioctl_subvol_wait args = { 0 };</div><div class='add'>+	signed long sched_ret;</div><div class='add'>+	int refs;</div><div class='add'>+	u64 root_flags;</div><div class='add'>+	bool wait_for_deletion = false;</div><div class='add'>+	bool found = false;</div><div class='add'>+</div><div class='add'>+	if (copy_from_user(&amp;args, argp, sizeof(args)))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+</div><div class='add'>+	switch (args.mode) {</div><div class='add'>+	case BTRFS_SUBVOL_SYNC_WAIT_FOR_QUEUED:</div><div class='add'>+		/*</div><div class='add'>+		 * Wait for the first one deleted that waits until all previous</div><div class='add'>+		 * are cleaned.</div><div class='add'>+		 */</div><div class='add'>+		spin_lock(&amp;fs_info-&gt;trans_lock);</div><div class='add'>+		if (!list_empty(&amp;fs_info-&gt;dead_roots)) {</div><div class='add'>+			root = list_last_entry(&amp;fs_info-&gt;dead_roots,</div><div class='add'>+					       struct btrfs_root, root_list);</div><div class='add'>+			args.subvolid = btrfs_root_id(root);</div><div class='add'>+			found = true;</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='add'>+		if (!found)</div><div class='add'>+			return -ENOENT;</div><div class='add'>+</div><div class='add'>+		fallthrough;</div><div class='add'>+	case BTRFS_SUBVOL_SYNC_WAIT_FOR_ONE:</div><div class='add'>+		if ((0 &lt; args.subvolid &amp;&amp; args.subvolid &lt; BTRFS_FIRST_FREE_OBJECTID) ||</div><div class='add'>+		    BTRFS_LAST_FREE_OBJECTID &lt; args.subvolid)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		break;</div><div class='add'>+	case BTRFS_SUBVOL_SYNC_COUNT:</div><div class='add'>+		spin_lock(&amp;fs_info-&gt;trans_lock);</div><div class='add'>+		args.count = list_count_nodes(&amp;fs_info-&gt;dead_roots);</div><div class='add'>+		spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='add'>+		if (copy_to_user(argp, &amp;args, sizeof(args)))</div><div class='add'>+			return -EFAULT;</div><div class='add'>+		return 0;</div><div class='add'>+	case BTRFS_SUBVOL_SYNC_PEEK_FIRST:</div><div class='add'>+		spin_lock(&amp;fs_info-&gt;trans_lock);</div><div class='add'>+		/* Last in the list was deleted first. */</div><div class='add'>+		if (!list_empty(&amp;fs_info-&gt;dead_roots)) {</div><div class='add'>+			root = list_last_entry(&amp;fs_info-&gt;dead_roots,</div><div class='add'>+					       struct btrfs_root, root_list);</div><div class='add'>+			args.subvolid = btrfs_root_id(root);</div><div class='add'>+		} else {</div><div class='add'>+			args.subvolid = 0;</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='add'>+		if (copy_to_user(argp, &amp;args, sizeof(args)))</div><div class='add'>+			return -EFAULT;</div><div class='add'>+		return 0;</div><div class='add'>+	case BTRFS_SUBVOL_SYNC_PEEK_LAST:</div><div class='add'>+		spin_lock(&amp;fs_info-&gt;trans_lock);</div><div class='add'>+		/* First in the list was deleted last. */</div><div class='add'>+		if (!list_empty(&amp;fs_info-&gt;dead_roots)) {</div><div class='add'>+			root = list_first_entry(&amp;fs_info-&gt;dead_roots,</div><div class='add'>+						struct btrfs_root, root_list);</div><div class='add'>+			args.subvolid = btrfs_root_id(root);</div><div class='add'>+		} else {</div><div class='add'>+			args.subvolid = 0;</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='add'>+		if (copy_to_user(argp, &amp;args, sizeof(args)))</div><div class='add'>+			return -EFAULT;</div><div class='add'>+		return 0;</div><div class='add'>+	default:</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* 32bit limitation: fs_roots_radix key is not wide enough. */</div><div class='add'>+	if (sizeof(unsigned long) != sizeof(u64) &amp;&amp; args.subvolid &gt; U32_MAX)</div><div class='add'>+		return -EOVERFLOW;</div><div class='add'>+</div><div class='add'>+	while (1) {</div><div class='add'>+		/* Wait for the specific one. */</div><div class='add'>+		if (down_read_interruptible(&amp;fs_info-&gt;subvol_sem) == -EINTR)</div><div class='add'>+			return -EINTR;</div><div class='add'>+		refs = -1;</div><div class='add'>+		spin_lock(&amp;fs_info-&gt;fs_roots_radix_lock);</div><div class='add'>+		root = radix_tree_lookup(&amp;fs_info-&gt;fs_roots_radix,</div><div class='add'>+					 (unsigned long)args.subvolid);</div><div class='add'>+		if (root) {</div><div class='add'>+			spin_lock(&amp;root-&gt;root_item_lock);</div><div class='add'>+			refs = btrfs_root_refs(&amp;root-&gt;root_item);</div><div class='add'>+			root_flags = btrfs_root_flags(&amp;root-&gt;root_item);</div><div class='add'>+			spin_unlock(&amp;root-&gt;root_item_lock);</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;fs_info-&gt;fs_roots_radix_lock);</div><div class='add'>+		up_read(&amp;fs_info-&gt;subvol_sem);</div><div class='add'>+</div><div class='add'>+		/* Subvolume does not exist. */</div><div class='add'>+		if (!root)</div><div class='add'>+			return -ENOENT;</div><div class='add'>+</div><div class='add'>+		/* Subvolume not deleted at all. */</div><div class='add'>+		if (refs &gt; 0)</div><div class='add'>+			return -EEXIST;</div><div class='add'>+		/* We've waited and now the subvolume is gone. */</div><div class='add'>+		if (wait_for_deletion &amp;&amp; refs == -1) {</div><div class='add'>+			/* Return the one we waited for as the last one. */</div><div class='add'>+			if (copy_to_user(argp, &amp;args, sizeof(args)))</div><div class='add'>+				return -EFAULT;</div><div class='add'>+			return 0;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* Subvolume not found on the first try (deleted or never existed). */</div><div class='add'>+		if (refs == -1)</div><div class='add'>+			return -ENOENT;</div><div class='add'>+</div><div class='add'>+		wait_for_deletion = true;</div><div class='add'>+		ASSERT(root_flags &amp; BTRFS_ROOT_SUBVOL_DEAD);</div><div class='add'>+		sched_ret = schedule_timeout_interruptible(HZ);</div><div class='add'>+		/* Early wake up or error. */</div><div class='add'>+		if (sched_ret != 0)</div><div class='add'>+			return -EINTR;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+static int btrfs_ioctl_shutdown(struct btrfs_fs_info *fs_info, unsigned long arg)</div><div class='add'>+{</div><div class='add'>+	int ret = 0;</div><div class='add'>+	u32 flags;</div><div class='add'>+</div><div class='add'>+	if (!capable(CAP_SYS_ADMIN))</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	if (get_user(flags, (u32 __user *)arg))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+</div><div class='add'>+	if (flags &gt;= BTRFS_SHUTDOWN_FLAGS_LAST)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	if (btrfs_is_shutdown(fs_info))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	switch (flags) {</div><div class='add'>+	case BTRFS_SHUTDOWN_FLAGS_LOGFLUSH:</div><div class='add'>+	case BTRFS_SHUTDOWN_FLAGS_DEFAULT:</div><div class='add'>+		ret = freeze_super(fs_info-&gt;sb, FREEZE_HOLDER_KERNEL, NULL);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		btrfs_force_shutdown(fs_info);</div><div class='add'>+		ret = thaw_super(fs_info-&gt;sb, FREEZE_HOLDER_KERNEL, NULL);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		break;</div><div class='add'>+	case BTRFS_SHUTDOWN_FLAGS_NOLOGFLUSH:</div><div class='add'>+		btrfs_force_shutdown(fs_info);</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> long btrfs_ioctl(struct file *file, unsigned int</div><div class='ctx'> 		cmd, unsigned long arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='ctx'> 	void __user *argp = (void __user *)arg;</div><div class='ctx'> </div><div class='ctx'> 	switch (cmd) {</div><div class='ctx'> 	case FS_IOC_GETVERSION:</div><div class='del'>-		return btrfs_ioctl_getversion(file, argp);</div><div class='add'>+		return btrfs_ioctl_getversion(inode, argp);</div><div class='ctx'> 	case FS_IOC_GETFSLABEL:</div><div class='ctx'> 		return btrfs_ioctl_get_fslabel(fs_info, argp);</div><div class='ctx'> 	case FS_IOC_SETFSLABEL:</div><div class='hunk'>@@ -4877,19 +5201,19 @@ long btrfs_ioctl(struct file *file, unsigned int</div><div class='ctx'> 	case FITRIM:</div><div class='ctx'> 		return btrfs_ioctl_fitrim(fs_info, argp);</div><div class='ctx'> 	case BTRFS_IOC_SNAP_CREATE:</div><div class='del'>-		return btrfs_ioctl_snap_create(file, argp, 0);</div><div class='add'>+		return btrfs_ioctl_snap_create(file, argp, false);</div><div class='ctx'> 	case BTRFS_IOC_SNAP_CREATE_V2:</div><div class='del'>-		return btrfs_ioctl_snap_create_v2(file, argp, 0);</div><div class='add'>+		return btrfs_ioctl_snap_create_v2(file, argp, false);</div><div class='ctx'> 	case BTRFS_IOC_SUBVOL_CREATE:</div><div class='del'>-		return btrfs_ioctl_snap_create(file, argp, 1);</div><div class='add'>+		return btrfs_ioctl_snap_create(file, argp, true);</div><div class='ctx'> 	case BTRFS_IOC_SUBVOL_CREATE_V2:</div><div class='del'>-		return btrfs_ioctl_snap_create_v2(file, argp, 1);</div><div class='add'>+		return btrfs_ioctl_snap_create_v2(file, argp, true);</div><div class='ctx'> 	case BTRFS_IOC_SNAP_DESTROY:</div><div class='ctx'> 		return btrfs_ioctl_snap_destroy(file, argp, false);</div><div class='ctx'> 	case BTRFS_IOC_SNAP_DESTROY_V2:</div><div class='ctx'> 		return btrfs_ioctl_snap_destroy(file, argp, true);</div><div class='ctx'> 	case BTRFS_IOC_SUBVOL_GETFLAGS:</div><div class='del'>-		return btrfs_ioctl_subvol_getflags(file, argp);</div><div class='add'>+		return btrfs_ioctl_subvol_getflags(BTRFS_I(inode), argp);</div><div class='ctx'> 	case BTRFS_IOC_SUBVOL_SETFLAGS:</div><div class='ctx'> 		return btrfs_ioctl_subvol_setflags(file, argp);</div><div class='ctx'> 	case BTRFS_IOC_DEFAULT_SUBVOL:</div><div class='hunk'>@@ -4910,14 +5234,12 @@ long btrfs_ioctl(struct file *file, unsigned int</div><div class='ctx'> 		return btrfs_ioctl_fs_info(fs_info, argp);</div><div class='ctx'> 	case BTRFS_IOC_DEV_INFO:</div><div class='ctx'> 		return btrfs_ioctl_dev_info(fs_info, argp);</div><div class='del'>-	case BTRFS_IOC_BALANCE:</div><div class='del'>-		return btrfs_ioctl_balance(file, NULL);</div><div class='ctx'> 	case BTRFS_IOC_TREE_SEARCH:</div><div class='del'>-		return btrfs_ioctl_tree_search(file, argp);</div><div class='add'>+		return btrfs_ioctl_tree_search(root, argp);</div><div class='ctx'> 	case BTRFS_IOC_TREE_SEARCH_V2:</div><div class='del'>-		return btrfs_ioctl_tree_search_v2(file, argp);</div><div class='add'>+		return btrfs_ioctl_tree_search_v2(root, argp);</div><div class='ctx'> 	case BTRFS_IOC_INO_LOOKUP:</div><div class='del'>-		return btrfs_ioctl_ino_lookup(file, argp);</div><div class='add'>+		return btrfs_ioctl_ino_lookup(root, argp);</div><div class='ctx'> 	case BTRFS_IOC_INO_PATHS:</div><div class='ctx'> 		return btrfs_ioctl_ino_to_path(root, argp);</div><div class='ctx'> 	case BTRFS_IOC_LOGICAL_INO:</div><div class='hunk'>@@ -4934,11 +5256,10 @@ long btrfs_ioctl(struct file *file, unsigned int</div><div class='ctx'> 			return ret;</div><div class='ctx'> 		ret = btrfs_sync_fs(inode-&gt;i_sb, 1);</div><div class='ctx'> 		/*</div><div class='del'>-		 * The transaction thread may want to do more work,</div><div class='del'>-		 * namely it pokes the cleaner kthread that will start</div><div class='del'>-		 * processing uncleaned subvols.</div><div class='add'>+		 * There may be work for the cleaner kthread to do (subvolume</div><div class='add'>+		 * deletion, delayed iputs, defrag inodes, etc), so wake it up.</div><div class='ctx'> 		 */</div><div class='del'>-		wake_up_process(fs_info-&gt;transaction_kthread);</div><div class='add'>+		wake_up_process(fs_info-&gt;cleaner_kthread);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> 	case BTRFS_IOC_START_SYNC:</div><div class='hunk'>@@ -4964,10 +5285,10 @@ long btrfs_ioctl(struct file *file, unsigned int</div><div class='ctx'> 		return btrfs_ioctl_set_received_subvol_32(file, argp);</div><div class='ctx'> #endif</div><div class='ctx'> 	case BTRFS_IOC_SEND:</div><div class='del'>-		return _btrfs_ioctl_send(file, argp, false);</div><div class='add'>+		return _btrfs_ioctl_send(root, argp, false);</div><div class='ctx'> #if defined(CONFIG_64BIT) &amp;&amp; defined(CONFIG_COMPAT)</div><div class='ctx'> 	case BTRFS_IOC_SEND_32:</div><div class='del'>-		return _btrfs_ioctl_send(file, argp, true);</div><div class='add'>+		return _btrfs_ioctl_send(root, argp, true);</div><div class='ctx'> #endif</div><div class='ctx'> 	case BTRFS_IOC_GET_DEV_STATS:</div><div class='ctx'> 		return btrfs_ioctl_get_dev_stats(fs_info, argp);</div><div class='hunk'>@@ -4984,7 +5305,7 @@ long btrfs_ioctl(struct file *file, unsigned int</div><div class='ctx'> 	case BTRFS_IOC_QUOTA_RESCAN_STATUS:</div><div class='ctx'> 		return btrfs_ioctl_quota_rescan_status(fs_info, argp);</div><div class='ctx'> 	case BTRFS_IOC_QUOTA_RESCAN_WAIT:</div><div class='del'>-		return btrfs_ioctl_quota_rescan_wait(fs_info, argp);</div><div class='add'>+		return btrfs_ioctl_quota_rescan_wait(fs_info);</div><div class='ctx'> 	case BTRFS_IOC_DEV_REPLACE:</div><div class='ctx'> 		return btrfs_ioctl_dev_replace(fs_info, argp);</div><div class='ctx'> 	case BTRFS_IOC_GET_SUPPORTED_FEATURES:</div><div class='hunk'>@@ -4994,15 +5315,33 @@ long btrfs_ioctl(struct file *file, unsigned int</div><div class='ctx'> 	case BTRFS_IOC_SET_FEATURES:</div><div class='ctx'> 		return btrfs_ioctl_set_features(file, argp);</div><div class='ctx'> 	case BTRFS_IOC_GET_SUBVOL_INFO:</div><div class='del'>-		return btrfs_ioctl_get_subvol_info(file, argp);</div><div class='add'>+		return btrfs_ioctl_get_subvol_info(inode, argp);</div><div class='ctx'> 	case BTRFS_IOC_GET_SUBVOL_ROOTREF:</div><div class='del'>-		return btrfs_ioctl_get_subvol_rootref(file, argp);</div><div class='add'>+		return btrfs_ioctl_get_subvol_rootref(root, argp);</div><div class='ctx'> 	case BTRFS_IOC_INO_LOOKUP_USER:</div><div class='ctx'> 		return btrfs_ioctl_ino_lookup_user(file, argp);</div><div class='ctx'> 	case FS_IOC_ENABLE_VERITY:</div><div class='ctx'> 		return fsverity_ioctl_enable(file, (const void __user *)argp);</div><div class='ctx'> 	case FS_IOC_MEASURE_VERITY:</div><div class='ctx'> 		return fsverity_ioctl_measure(file, argp);</div><div class='add'>+	case FS_IOC_READ_VERITY_METADATA:</div><div class='add'>+		return fsverity_ioctl_read_metadata(file, argp);</div><div class='add'>+	case BTRFS_IOC_ENCODED_READ:</div><div class='add'>+		return btrfs_ioctl_encoded_read(file, argp, false);</div><div class='add'>+	case BTRFS_IOC_ENCODED_WRITE:</div><div class='add'>+		return btrfs_ioctl_encoded_write(file, argp, false);</div><div class='add'>+#if defined(CONFIG_64BIT) &amp;&amp; defined(CONFIG_COMPAT)</div><div class='add'>+	case BTRFS_IOC_ENCODED_READ_32:</div><div class='add'>+		return btrfs_ioctl_encoded_read(file, argp, true);</div><div class='add'>+	case BTRFS_IOC_ENCODED_WRITE_32:</div><div class='add'>+		return btrfs_ioctl_encoded_write(file, argp, true);</div><div class='add'>+#endif</div><div class='add'>+	case BTRFS_IOC_SUBVOL_SYNC_WAIT:</div><div class='add'>+		return btrfs_ioctl_subvol_sync(fs_info, argp);</div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+	case BTRFS_IOC_SHUTDOWN:</div><div class='add'>+		return btrfs_ioctl_shutdown(fs_info, arg);</div><div class='add'>+#endif</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return -ENOTTY;</div><div class='head'>diff --git a/fs/btrfs/ioctl.h b/fs/btrfs/ioctl.h<br/>new file mode 100644<br/>index 000000000000..ccf6bed9cc24<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/ioctl.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/ioctl.h</a></div><div class='hunk'>@@ -0,0 +1,29 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+</div><div class='add'>+#ifndef BTRFS_IOCTL_H</div><div class='add'>+#define BTRFS_IOCTL_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+</div><div class='add'>+struct file;</div><div class='add'>+struct dentry;</div><div class='add'>+struct mnt_idmap;</div><div class='add'>+struct file_kattr;</div><div class='add'>+struct io_uring_cmd;</div><div class='add'>+struct btrfs_inode;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+struct btrfs_ioctl_balance_args;</div><div class='add'>+</div><div class='add'>+long btrfs_ioctl(struct file *file, unsigned int cmd, unsigned long arg);</div><div class='add'>+long btrfs_compat_ioctl(struct file *file, unsigned int cmd, unsigned long arg);</div><div class='add'>+int btrfs_fileattr_get(struct dentry *dentry, struct file_kattr *fa);</div><div class='add'>+int btrfs_fileattr_set(struct mnt_idmap *idmap,</div><div class='add'>+		       struct dentry *dentry, struct file_kattr *fa);</div><div class='add'>+int btrfs_ioctl_get_supported_features(void __user *arg);</div><div class='add'>+void btrfs_sync_inode_flags_to_i_flags(struct btrfs_inode *inode);</div><div class='add'>+void btrfs_update_ioctl_balance_args(struct btrfs_fs_info *fs_info,</div><div class='add'>+				     struct btrfs_ioctl_balance_args *bargs);</div><div class='add'>+int btrfs_uring_cmd(struct io_uring_cmd *cmd, unsigned int issue_flags);</div><div class='add'>+void btrfs_uring_read_extent_endio(void *ctx, int err);</div><div class='add'>+</div><div class='add'>+#endif</div><div class='head'>diff --git a/fs/btrfs/locking.c b/fs/btrfs/locking.c<br/>index 313d9d685adb..0035851d72b0 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/locking.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/locking.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/locking.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/locking.c</a></div><div class='hunk'>@@ -8,12 +8,110 @@</div><div class='ctx'> #include &lt;linux/spinlock.h&gt;</div><div class='ctx'> #include &lt;linux/page-flags.h&gt;</div><div class='ctx'> #include &lt;asm/bug.h&gt;</div><div class='del'>-#include "misc.h"</div><div class='add'>+#include &lt;trace/events/btrfs.h&gt;</div><div class='ctx'> #include "ctree.h"</div><div class='ctx'> #include "extent_io.h"</div><div class='ctx'> #include "locking.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * Lockdep class keys for extent_buffer-&gt;lock's in this root.  For a given</div><div class='add'>+ * eb, the lockdep key is determined by the btrfs_root it belongs to and</div><div class='add'>+ * the level the eb occupies in the tree.</div><div class='add'>+ *</div><div class='add'>+ * Different roots are used for different purposes and may nest inside each</div><div class='add'>+ * other and they require separate keysets.  As lockdep keys should be</div><div class='add'>+ * static, assign keysets according to the purpose of the root as indicated</div><div class='add'>+ * by btrfs_root-&gt;root_key.objectid.  This ensures that all special purpose</div><div class='add'>+ * roots have separate keysets.</div><div class='add'>+ *</div><div class='add'>+ * Lock-nesting across peer nodes is always done with the immediate parent</div><div class='add'>+ * node locked thus preventing deadlock.  As lockdep doesn't know this, use</div><div class='add'>+ * subclass to avoid triggering lockdep warning in such cases.</div><div class='add'>+ *</div><div class='add'>+ * The key is set by the readpage_end_io_hook after the buffer has passed</div><div class='add'>+ * csum validation but before the pages are unlocked.  It is also set by</div><div class='add'>+ * btrfs_init_new_buffer on freshly allocated blocks.</div><div class='add'>+ *</div><div class='add'>+ * We also add a check to make sure the highest level of the tree is the</div><div class='add'>+ * same as our lockdep setup here.  If BTRFS_MAX_LEVEL changes, this code</div><div class='add'>+ * needs update as well.</div><div class='add'>+ */</div><div class='add'>+#ifdef CONFIG_DEBUG_LOCK_ALLOC</div><div class='add'>+#if BTRFS_MAX_LEVEL != 8</div><div class='add'>+#error</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+#define DEFINE_LEVEL(stem, level)					\</div><div class='add'>+	.names[level] = "btrfs-" stem "-0" #level,</div><div class='add'>+</div><div class='add'>+#define DEFINE_NAME(stem)						\</div><div class='add'>+	DEFINE_LEVEL(stem, 0)						\</div><div class='add'>+	DEFINE_LEVEL(stem, 1)						\</div><div class='add'>+	DEFINE_LEVEL(stem, 2)						\</div><div class='add'>+	DEFINE_LEVEL(stem, 3)						\</div><div class='add'>+	DEFINE_LEVEL(stem, 4)						\</div><div class='add'>+	DEFINE_LEVEL(stem, 5)						\</div><div class='add'>+	DEFINE_LEVEL(stem, 6)						\</div><div class='add'>+	DEFINE_LEVEL(stem, 7)</div><div class='add'>+</div><div class='add'>+static struct btrfs_lockdep_keyset {</div><div class='add'>+	u64			id;		/* root objectid */</div><div class='add'>+	/* Longest entry: btrfs-block-group-00 */</div><div class='add'>+	char			names[BTRFS_MAX_LEVEL][24];</div><div class='add'>+	struct lock_class_key	keys[BTRFS_MAX_LEVEL];</div><div class='add'>+} btrfs_lockdep_keysets[] = {</div><div class='add'>+	{ .id = BTRFS_ROOT_TREE_OBJECTID,	DEFINE_NAME("root")	},</div><div class='add'>+	{ .id = BTRFS_EXTENT_TREE_OBJECTID,	DEFINE_NAME("extent")	},</div><div class='add'>+	{ .id = BTRFS_CHUNK_TREE_OBJECTID,	DEFINE_NAME("chunk")	},</div><div class='add'>+	{ .id = BTRFS_DEV_TREE_OBJECTID,	DEFINE_NAME("dev")	},</div><div class='add'>+	{ .id = BTRFS_CSUM_TREE_OBJECTID,	DEFINE_NAME("csum")	},</div><div class='add'>+	{ .id = BTRFS_QUOTA_TREE_OBJECTID,	DEFINE_NAME("quota")	},</div><div class='add'>+	{ .id = BTRFS_TREE_LOG_OBJECTID,	DEFINE_NAME("log")	},</div><div class='add'>+	{ .id = BTRFS_TREE_RELOC_OBJECTID,	DEFINE_NAME("treloc")	},</div><div class='add'>+	{ .id = BTRFS_DATA_RELOC_TREE_OBJECTID,	DEFINE_NAME("dreloc")	},</div><div class='add'>+	{ .id = BTRFS_UUID_TREE_OBJECTID,	DEFINE_NAME("uuid")	},</div><div class='add'>+	{ .id = BTRFS_FREE_SPACE_TREE_OBJECTID,	DEFINE_NAME("free-space") },</div><div class='add'>+	{ .id = BTRFS_BLOCK_GROUP_TREE_OBJECTID, DEFINE_NAME("block-group") },</div><div class='add'>+	{ .id = BTRFS_RAID_STRIPE_TREE_OBJECTID, DEFINE_NAME("raid-stripe") },</div><div class='add'>+	{ .id = 0,				DEFINE_NAME("tree")	},</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+#undef DEFINE_LEVEL</div><div class='add'>+#undef DEFINE_NAME</div><div class='add'>+</div><div class='add'>+void btrfs_set_buffer_lockdep_class(u64 objectid, struct extent_buffer *eb, int level)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_lockdep_keyset *ks;</div><div class='add'>+</div><div class='add'>+	ASSERT(level &lt; ARRAY_SIZE(ks-&gt;keys));</div><div class='add'>+</div><div class='add'>+	/* Find the matching keyset, id 0 is the default entry */</div><div class='add'>+	for (ks = btrfs_lockdep_keysets; ks-&gt;id; ks++)</div><div class='add'>+		if (ks-&gt;id == objectid)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+	lockdep_set_class_and_name(&amp;eb-&gt;lock, &amp;ks-&gt;keys[level], ks-&gt;names[level]);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_maybe_reset_lockdep_class(struct btrfs_root *root, struct extent_buffer *eb)</div><div class='add'>+{</div><div class='add'>+	if (test_bit(BTRFS_ROOT_RESET_LOCKDEP_CLASS, &amp;root-&gt;state))</div><div class='add'>+		btrfs_set_buffer_lockdep_class(btrfs_root_id(root),</div><div class='add'>+					       eb, btrfs_header_level(eb));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BTRFS_DEBUG</div><div class='add'>+static void btrfs_set_eb_lock_owner(struct extent_buffer *eb, pid_t owner)</div><div class='add'>+{</div><div class='add'>+	eb-&gt;lock_owner = owner;</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+static void btrfs_set_eb_lock_owner(struct extent_buffer *eb, pid_t owner) { }</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * Extent buffer locking</div><div class='ctx'>  * =====================</div><div class='ctx'>  *</div><div class='hunk'>@@ -30,14 +128,14 @@</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * __btrfs_tree_read_lock - lock extent buffer for read</div><div class='add'>+ * btrfs_tree_read_lock_nested - lock extent buffer for read</div><div class='ctx'>  * @eb:		the eb to be locked</div><div class='ctx'>  * @nest:	the nesting level to be used for lockdep</div><div class='ctx'>  *</div><div class='ctx'>  * This takes the read lock on the extent buffer, using the specified nesting</div><div class='ctx'>  * level for lockdep purposes.</div><div class='ctx'>  */</div><div class='del'>-void __btrfs_tree_read_lock(struct extent_buffer *eb, enum btrfs_lock_nesting nest)</div><div class='add'>+void btrfs_tree_read_lock_nested(struct extent_buffer *eb, enum btrfs_lock_nesting nest)</div><div class='ctx'> {</div><div class='ctx'> 	u64 start_ns = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -45,43 +143,21 @@ void __btrfs_tree_read_lock(struct extent_buffer *eb, enum btrfs_lock_nesting ne</div><div class='ctx'> 		start_ns = ktime_get_ns();</div><div class='ctx'> </div><div class='ctx'> 	down_read_nested(&amp;eb-&gt;lock, nest);</div><div class='del'>-	eb-&gt;lock_owner = current-&gt;pid;</div><div class='ctx'> 	trace_btrfs_tree_read_lock(eb, start_ns);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_tree_read_lock(struct extent_buffer *eb)</div><div class='del'>-{</div><div class='del'>-	__btrfs_tree_read_lock(eb, BTRFS_NESTING_NORMAL);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Try-lock for read.</div><div class='ctx'>  *</div><div class='del'>- * Return 1 if the rwlock has been taken, 0 otherwise</div><div class='add'>+ * Return true if the rwlock has been taken, false otherwise</div><div class='ctx'>  */</div><div class='del'>-int btrfs_try_tree_read_lock(struct extent_buffer *eb)</div><div class='add'>+bool btrfs_try_tree_read_lock(struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='ctx'> 	if (down_read_trylock(&amp;eb-&gt;lock)) {</div><div class='del'>-		eb-&gt;lock_owner = current-&gt;pid;</div><div class='ctx'> 		trace_btrfs_try_tree_read_lock(eb);</div><div class='del'>-		return 1;</div><div class='add'>+		return true;</div><div class='ctx'> 	}</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Try-lock for write.</div><div class='del'>- *</div><div class='del'>- * Return 1 if the rwlock has been taken, 0 otherwise</div><div class='del'>- */</div><div class='del'>-int btrfs_try_tree_write_lock(struct extent_buffer *eb)</div><div class='del'>-{</div><div class='del'>-	if (down_write_trylock(&amp;eb-&gt;lock)) {</div><div class='del'>-		eb-&gt;lock_owner = current-&gt;pid;</div><div class='del'>-		trace_btrfs_try_tree_write_lock(eb);</div><div class='del'>-		return 1;</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -90,18 +166,18 @@ int btrfs_try_tree_write_lock(struct extent_buffer *eb)</div><div class='ctx'> void btrfs_tree_read_unlock(struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='ctx'> 	trace_btrfs_tree_read_unlock(eb);</div><div class='del'>-	eb-&gt;lock_owner = 0;</div><div class='ctx'> 	up_read(&amp;eb-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * __btrfs_tree_lock - lock eb for write</div><div class='add'>+ * Lock eb for write.</div><div class='add'>+ *</div><div class='ctx'>  * @eb:		the eb to lock</div><div class='ctx'>  * @nest:	the nesting to use for the lock</div><div class='ctx'>  *</div><div class='ctx'>  * Returns with the eb-&gt;lock write locked.</div><div class='ctx'>  */</div><div class='del'>-void __btrfs_tree_lock(struct extent_buffer *eb, enum btrfs_lock_nesting nest)</div><div class='add'>+void btrfs_tree_lock_nested(struct extent_buffer *eb, enum btrfs_lock_nesting nest)</div><div class='ctx'> 	__acquires(&amp;eb-&gt;lock)</div><div class='ctx'> {</div><div class='ctx'> 	u64 start_ns = 0;</div><div class='hunk'>@@ -110,22 +186,17 @@ void __btrfs_tree_lock(struct extent_buffer *eb, enum btrfs_lock_nesting nest)</div><div class='ctx'> 		start_ns = ktime_get_ns();</div><div class='ctx'> </div><div class='ctx'> 	down_write_nested(&amp;eb-&gt;lock, nest);</div><div class='del'>-	eb-&gt;lock_owner = current-&gt;pid;</div><div class='add'>+	btrfs_set_eb_lock_owner(eb, current-&gt;pid);</div><div class='ctx'> 	trace_btrfs_tree_lock(eb, start_ns);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_tree_lock(struct extent_buffer *eb)</div><div class='del'>-{</div><div class='del'>-	__btrfs_tree_lock(eb, BTRFS_NESTING_NORMAL);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Release the write lock.</div><div class='ctx'>  */</div><div class='ctx'> void btrfs_tree_unlock(struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='ctx'> 	trace_btrfs_tree_unlock(eb);</div><div class='del'>-	eb-&gt;lock_owner = 0;</div><div class='add'>+	btrfs_set_eb_lock_owner(eb, 0);</div><div class='ctx'> 	up_write(&amp;eb-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -167,6 +238,8 @@ struct extent_buffer *btrfs_lock_root_node(struct btrfs_root *root)</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		eb = btrfs_root_node(root);</div><div class='add'>+</div><div class='add'>+		btrfs_maybe_reset_lockdep_class(root, eb);</div><div class='ctx'> 		btrfs_tree_lock(eb);</div><div class='ctx'> 		if (eb == root-&gt;node)</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -188,6 +261,8 @@ struct extent_buffer *btrfs_read_lock_root_node(struct btrfs_root *root)</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		eb = btrfs_root_node(root);</div><div class='add'>+</div><div class='add'>+		btrfs_maybe_reset_lockdep_class(root, eb);</div><div class='ctx'> 		btrfs_tree_read_lock(eb);</div><div class='ctx'> 		if (eb == root-&gt;node)</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -198,6 +273,31 @@ struct extent_buffer *btrfs_read_lock_root_node(struct btrfs_root *root)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * Loop around taking references on and locking the root node of the tree in</div><div class='add'>+ * nowait mode until we end up with a lock on the root node or returning to</div><div class='add'>+ * avoid blocking.</div><div class='add'>+ *</div><div class='add'>+ * Return: root extent buffer with read lock held or -EAGAIN.</div><div class='add'>+ */</div><div class='add'>+struct extent_buffer *btrfs_try_read_lock_root_node(struct btrfs_root *root)</div><div class='add'>+{</div><div class='add'>+	struct extent_buffer *eb;</div><div class='add'>+</div><div class='add'>+	while (1) {</div><div class='add'>+		eb = btrfs_root_node(root);</div><div class='add'>+		if (!btrfs_try_tree_read_lock(eb)) {</div><div class='add'>+			free_extent_buffer(eb);</div><div class='add'>+			return ERR_PTR(-EAGAIN);</div><div class='add'>+		}</div><div class='add'>+		if (eb == root-&gt;node)</div><div class='add'>+			break;</div><div class='add'>+		btrfs_tree_read_unlock(eb);</div><div class='add'>+		free_extent_buffer(eb);</div><div class='add'>+	}</div><div class='add'>+	return eb;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * DREW locks</div><div class='ctx'>  * ==========</div><div class='ctx'>  *</div><div class='hunk'>@@ -211,24 +311,12 @@ struct extent_buffer *btrfs_read_lock_root_node(struct btrfs_root *root)</div><div class='ctx'>  * acquire the lock.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-int btrfs_drew_lock_init(struct btrfs_drew_lock *lock)</div><div class='add'>+void btrfs_drew_lock_init(struct btrfs_drew_lock *lock)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ret = percpu_counter_init(&amp;lock-&gt;writers, 0, GFP_KERNEL);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='ctx'> 	atomic_set(&amp;lock-&gt;readers, 0);</div><div class='add'>+	atomic_set(&amp;lock-&gt;writers, 0);</div><div class='ctx'> 	init_waitqueue_head(&amp;lock-&gt;pending_readers);</div><div class='ctx'> 	init_waitqueue_head(&amp;lock-&gt;pending_writers);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void btrfs_drew_lock_destroy(struct btrfs_drew_lock *lock)</div><div class='del'>-{</div><div class='del'>-	percpu_counter_destroy(&amp;lock-&gt;writers);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Return true if acquisition is successful, false otherwise */</div><div class='hunk'>@@ -237,10 +325,10 @@ bool btrfs_drew_try_write_lock(struct btrfs_drew_lock *lock)</div><div class='ctx'> 	if (atomic_read(&amp;lock-&gt;readers))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	percpu_counter_inc(&amp;lock-&gt;writers);</div><div class='add'>+	atomic_inc(&amp;lock-&gt;writers);</div><div class='ctx'> </div><div class='ctx'> 	/* Ensure writers count is updated before we check for pending readers */</div><div class='del'>-	smp_mb();</div><div class='add'>+	smp_mb__after_atomic();</div><div class='ctx'> 	if (atomic_read(&amp;lock-&gt;readers)) {</div><div class='ctx'> 		btrfs_drew_write_unlock(lock);</div><div class='ctx'> 		return false;</div><div class='hunk'>@@ -260,8 +348,12 @@ void btrfs_drew_write_lock(struct btrfs_drew_lock *lock)</div><div class='ctx'> </div><div class='ctx'> void btrfs_drew_write_unlock(struct btrfs_drew_lock *lock)</div><div class='ctx'> {</div><div class='del'>-	percpu_counter_dec(&amp;lock-&gt;writers);</div><div class='del'>-	cond_wake_up(&amp;lock-&gt;pending_readers);</div><div class='add'>+	/*</div><div class='add'>+	 * atomic_dec_and_test() implies a full barrier, so woken up readers are</div><div class='add'>+	 * guaranteed to see the decrement.</div><div class='add'>+	 */</div><div class='add'>+	if (atomic_dec_and_test(&amp;lock-&gt;writers))</div><div class='add'>+		wake_up(&amp;lock-&gt;pending_readers);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_drew_read_lock(struct btrfs_drew_lock *lock)</div><div class='hunk'>@@ -269,15 +361,14 @@ void btrfs_drew_read_lock(struct btrfs_drew_lock *lock)</div><div class='ctx'> 	atomic_inc(&amp;lock-&gt;readers);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Ensure the pending reader count is perceieved BEFORE this reader</div><div class='add'>+	 * Ensure the pending reader count is perceived BEFORE this reader</div><div class='ctx'> 	 * goes to sleep in case of active writers. This guarantees new writers</div><div class='ctx'> 	 * won't be allowed and that the current reader will be woken up when</div><div class='ctx'> 	 * the last active writer finishes its jobs.</div><div class='ctx'> 	 */</div><div class='ctx'> 	smp_mb__after_atomic();</div><div class='ctx'> </div><div class='del'>-	wait_event(lock-&gt;pending_readers,</div><div class='del'>-		   percpu_counter_sum(&amp;lock-&gt;writers) == 0);</div><div class='add'>+	wait_event(lock-&gt;pending_readers, atomic_read(&amp;lock-&gt;writers) == 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_drew_read_unlock(struct btrfs_drew_lock *lock)</div><div class='head'>diff --git a/fs/btrfs/locking.h b/fs/btrfs/locking.h<br/>index bbc45534ae9a..a4673e7d95d7 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/locking.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/locking.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/locking.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/locking.h</a></div><div class='hunk'>@@ -8,9 +8,14 @@</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/atomic.h&gt;</div><div class='ctx'> #include &lt;linux/wait.h&gt;</div><div class='add'>+#include &lt;linux/lockdep.h&gt;</div><div class='ctx'> #include &lt;linux/percpu_counter.h&gt;</div><div class='ctx'> #include "extent_io.h"</div><div class='ctx'> </div><div class='add'>+struct extent_buffer;</div><div class='add'>+struct btrfs_path;</div><div class='add'>+struct btrfs_root;</div><div class='add'>+</div><div class='ctx'> #define BTRFS_WRITE_LOCK 1</div><div class='ctx'> #define BTRFS_READ_LOCK 2</div><div class='ctx'> </div><div class='hunk'>@@ -69,7 +74,7 @@ enum btrfs_lock_nesting {</div><div class='ctx'> 	BTRFS_NESTING_NEW_ROOT,</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * We are limited to MAX_LOCKDEP_SUBLCLASSES number of subclasses, so</div><div class='add'>+	 * We are limited to MAX_LOCKDEP_SUBCLASSES number of subclasses, so</div><div class='ctx'> 	 * add this in here and add a static_assert to keep us from going over</div><div class='ctx'> 	 * the limit.  As of this writing we're limited to 8, and we're</div><div class='ctx'> 	 * definitely using 8, hence this check to keep us from messing up in</div><div class='hunk'>@@ -78,30 +83,129 @@ enum btrfs_lock_nesting {</div><div class='ctx'> 	BTRFS_NESTING_MAX,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+enum btrfs_lockdep_trans_states {</div><div class='add'>+	BTRFS_LOCKDEP_TRANS_COMMIT_PREP,</div><div class='add'>+	BTRFS_LOCKDEP_TRANS_UNBLOCKED,</div><div class='add'>+	BTRFS_LOCKDEP_TRANS_SUPER_COMMITTED,</div><div class='add'>+	BTRFS_LOCKDEP_TRANS_COMPLETED,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Lockdep annotation for wait events.</div><div class='add'>+ *</div><div class='add'>+ * @owner:  The struct where the lockdep map is defined</div><div class='add'>+ * @lock:   The lockdep map corresponding to a wait event</div><div class='add'>+ *</div><div class='add'>+ * This macro is used to annotate a wait event. In this case a thread acquires</div><div class='add'>+ * the lockdep map as writer (exclusive lock) because it has to block until all</div><div class='add'>+ * the threads that hold the lock as readers signal the condition for the wait</div><div class='add'>+ * event and release their locks.</div><div class='add'>+ */</div><div class='add'>+#define btrfs_might_wait_for_event(owner, lock)					\</div><div class='add'>+	do {									\</div><div class='add'>+		rwsem_acquire(&amp;owner-&gt;lock##_map, 0, 0, _THIS_IP_);		\</div><div class='add'>+		rwsem_release(&amp;owner-&gt;lock##_map, _THIS_IP_);			\</div><div class='add'>+	} while (0)</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Protection for the resource/condition of a wait event.</div><div class='add'>+ *</div><div class='add'>+ * @owner:  The struct where the lockdep map is defined</div><div class='add'>+ * @lock:   The lockdep map corresponding to a wait event</div><div class='add'>+ *</div><div class='add'>+ * Many threads can modify the condition for the wait event at the same time</div><div class='add'>+ * and signal the threads that block on the wait event. The threads that modify</div><div class='add'>+ * the condition and do the signaling acquire the lock as readers (shared</div><div class='add'>+ * lock).</div><div class='add'>+ */</div><div class='add'>+#define btrfs_lockdep_acquire(owner, lock)					\</div><div class='add'>+	rwsem_acquire_read(&amp;owner-&gt;lock##_map, 0, 0, _THIS_IP_)</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Used after signaling the condition for a wait event to release the lockdep</div><div class='add'>+ * map held by a reader thread.</div><div class='add'>+ */</div><div class='add'>+#define btrfs_lockdep_release(owner, lock)					\</div><div class='add'>+	rwsem_release(&amp;owner-&gt;lock##_map, _THIS_IP_)</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Used to account for the fact that when doing io_uring encoded I/O, we can</div><div class='add'>+ * return to userspace with the inode lock still held.</div><div class='add'>+ */</div><div class='add'>+#define btrfs_lockdep_inode_acquire(owner, lock)				\</div><div class='add'>+	rwsem_acquire_read(&amp;owner-&gt;vfs_inode.lock.dep_map, 0, 0, _THIS_IP_)</div><div class='add'>+</div><div class='add'>+#define btrfs_lockdep_inode_release(owner, lock)				\</div><div class='add'>+	rwsem_release(&amp;owner-&gt;vfs_inode.lock.dep_map, _THIS_IP_)</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Macros for the transaction states wait events, similar to the generic wait</div><div class='add'>+ * event macros.</div><div class='add'>+ */</div><div class='add'>+#define btrfs_might_wait_for_state(owner, i)					\</div><div class='add'>+	do {									\</div><div class='add'>+		rwsem_acquire(&amp;owner-&gt;btrfs_state_change_map[i], 0, 0, _THIS_IP_); \</div><div class='add'>+		rwsem_release(&amp;owner-&gt;btrfs_state_change_map[i], _THIS_IP_);	\</div><div class='add'>+	} while (0)</div><div class='add'>+</div><div class='add'>+#define btrfs_trans_state_lockdep_acquire(owner, i)				\</div><div class='add'>+	rwsem_acquire_read(&amp;owner-&gt;btrfs_state_change_map[i], 0, 0, _THIS_IP_)</div><div class='add'>+</div><div class='add'>+#define btrfs_trans_state_lockdep_release(owner, i)				\</div><div class='add'>+	rwsem_release(&amp;owner-&gt;btrfs_state_change_map[i], _THIS_IP_)</div><div class='add'>+</div><div class='add'>+/* Initialization of the lockdep map */</div><div class='add'>+#define btrfs_lockdep_init_map(owner, lock)					\</div><div class='add'>+	do {									\</div><div class='add'>+		static struct lock_class_key lock##_key;			\</div><div class='add'>+		lockdep_init_map(&amp;owner-&gt;lock##_map, #lock, &amp;lock##_key, 0);	\</div><div class='add'>+	} while (0)</div><div class='add'>+</div><div class='add'>+/* Initialization of the transaction states lockdep maps. */</div><div class='add'>+#define btrfs_state_lockdep_init_map(owner, lock, state)			\</div><div class='add'>+	do {									\</div><div class='add'>+		static struct lock_class_key lock##_key;			\</div><div class='add'>+		lockdep_init_map(&amp;owner-&gt;btrfs_state_change_map[state], #lock,	\</div><div class='add'>+				 &amp;lock##_key, 0);				\</div><div class='add'>+	} while (0)</div><div class='add'>+</div><div class='ctx'> static_assert(BTRFS_NESTING_MAX &lt;= MAX_LOCKDEP_SUBCLASSES,</div><div class='ctx'> 	      "too many lock subclasses defined");</div><div class='ctx'> </div><div class='del'>-struct btrfs_path;</div><div class='add'>+void btrfs_tree_lock_nested(struct extent_buffer *eb, enum btrfs_lock_nesting nest);</div><div class='add'>+</div><div class='add'>+static inline void btrfs_tree_lock(struct extent_buffer *eb)</div><div class='add'>+{</div><div class='add'>+	btrfs_tree_lock_nested(eb, BTRFS_NESTING_NORMAL);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-void __btrfs_tree_lock(struct extent_buffer *eb, enum btrfs_lock_nesting nest);</div><div class='del'>-void btrfs_tree_lock(struct extent_buffer *eb);</div><div class='ctx'> void btrfs_tree_unlock(struct extent_buffer *eb);</div><div class='ctx'> </div><div class='del'>-void __btrfs_tree_read_lock(struct extent_buffer *eb, enum btrfs_lock_nesting nest);</div><div class='del'>-void btrfs_tree_read_lock(struct extent_buffer *eb);</div><div class='add'>+void btrfs_tree_read_lock_nested(struct extent_buffer *eb, enum btrfs_lock_nesting nest);</div><div class='add'>+</div><div class='add'>+static inline void btrfs_tree_read_lock(struct extent_buffer *eb)</div><div class='add'>+{</div><div class='add'>+	btrfs_tree_read_lock_nested(eb, BTRFS_NESTING_NORMAL);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> void btrfs_tree_read_unlock(struct extent_buffer *eb);</div><div class='del'>-int btrfs_try_tree_read_lock(struct extent_buffer *eb);</div><div class='del'>-int btrfs_try_tree_write_lock(struct extent_buffer *eb);</div><div class='add'>+bool btrfs_try_tree_read_lock(struct extent_buffer *eb);</div><div class='ctx'> struct extent_buffer *btrfs_lock_root_node(struct btrfs_root *root);</div><div class='ctx'> struct extent_buffer *btrfs_read_lock_root_node(struct btrfs_root *root);</div><div class='add'>+struct extent_buffer *btrfs_try_read_lock_root_node(struct btrfs_root *root);</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_BTRFS_DEBUG</div><div class='ctx'> static inline void btrfs_assert_tree_write_locked(struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='ctx'> 	lockdep_assert_held_write(&amp;eb-&gt;lock);</div><div class='ctx'> }</div><div class='add'>+static inline void btrfs_assert_tree_read_locked(struct extent_buffer *eb)</div><div class='add'>+{</div><div class='add'>+	lockdep_assert_held_read(&amp;eb-&gt;lock);</div><div class='add'>+}</div><div class='ctx'> #else</div><div class='ctx'> static inline void btrfs_assert_tree_write_locked(struct extent_buffer *eb) { }</div><div class='add'>+static inline void btrfs_assert_tree_read_locked(struct extent_buffer *eb) { }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> void btrfs_unlock_up_safe(struct btrfs_path *path, int level);</div><div class='hunk'>@@ -118,17 +222,30 @@ static inline void btrfs_tree_unlock_rw(struct extent_buffer *eb, int rw)</div><div class='ctx'> </div><div class='ctx'> struct btrfs_drew_lock {</div><div class='ctx'> 	atomic_t readers;</div><div class='del'>-	struct percpu_counter writers;</div><div class='add'>+	atomic_t writers;</div><div class='ctx'> 	wait_queue_head_t pending_writers;</div><div class='ctx'> 	wait_queue_head_t pending_readers;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-int btrfs_drew_lock_init(struct btrfs_drew_lock *lock);</div><div class='del'>-void btrfs_drew_lock_destroy(struct btrfs_drew_lock *lock);</div><div class='add'>+void btrfs_drew_lock_init(struct btrfs_drew_lock *lock);</div><div class='ctx'> void btrfs_drew_write_lock(struct btrfs_drew_lock *lock);</div><div class='ctx'> bool btrfs_drew_try_write_lock(struct btrfs_drew_lock *lock);</div><div class='ctx'> void btrfs_drew_write_unlock(struct btrfs_drew_lock *lock);</div><div class='ctx'> void btrfs_drew_read_lock(struct btrfs_drew_lock *lock);</div><div class='ctx'> void btrfs_drew_read_unlock(struct btrfs_drew_lock *lock);</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_DEBUG_LOCK_ALLOC</div><div class='add'>+void btrfs_set_buffer_lockdep_class(u64 objectid, struct extent_buffer *eb, int level);</div><div class='add'>+void btrfs_maybe_reset_lockdep_class(struct btrfs_root *root, struct extent_buffer *eb);</div><div class='add'>+#else</div><div class='add'>+static inline void btrfs_set_buffer_lockdep_class(u64 objectid,</div><div class='add'>+					struct extent_buffer *eb, int level)</div><div class='add'>+{</div><div class='add'>+}</div><div class='add'>+static inline void btrfs_maybe_reset_lockdep_class(struct btrfs_root *root,</div><div class='add'>+						   struct extent_buffer *eb)</div><div class='add'>+{</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/btrfs/lru_cache.c b/fs/btrfs/lru_cache.c<br/>new file mode 100644<br/>index 000000000000..fd88af17d8d9<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/lru_cache.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/lru_cache.c</a></div><div class='hunk'>@@ -0,0 +1,166 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+</div><div class='add'>+#include &lt;linux/mm.h&gt;</div><div class='add'>+#include "lru_cache.h"</div><div class='add'>+#include "messages.h"</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Initialize a cache object.</div><div class='add'>+ *</div><div class='add'>+ * @cache:      The cache.</div><div class='add'>+ * @max_size:   Maximum size (number of entries) for the cache.</div><div class='add'>+ *              Use 0 for unlimited size, it's the user's responsibility to</div><div class='add'>+ *              trim the cache in that case.</div><div class='add'>+ */</div><div class='add'>+void btrfs_lru_cache_init(struct btrfs_lru_cache *cache, unsigned int max_size)</div><div class='add'>+{</div><div class='add'>+	INIT_LIST_HEAD(&amp;cache-&gt;lru_list);</div><div class='add'>+	mt_init(&amp;cache-&gt;entries);</div><div class='add'>+	cache-&gt;size = 0;</div><div class='add'>+	cache-&gt;max_size = max_size;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct btrfs_lru_cache_entry *match_entry(struct list_head *head, u64 key,</div><div class='add'>+						 u64 gen)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_lru_cache_entry *entry;</div><div class='add'>+</div><div class='add'>+	list_for_each_entry(entry, head, list) {</div><div class='add'>+		if (entry-&gt;key == key &amp;&amp; entry-&gt;gen == gen)</div><div class='add'>+			return entry;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Lookup for an entry in the cache.</div><div class='add'>+ *</div><div class='add'>+ * @cache:      The cache.</div><div class='add'>+ * @key:        The key of the entry we are looking for.</div><div class='add'>+ * @gen:        Generation associated to the key.</div><div class='add'>+ *</div><div class='add'>+ * Returns the entry associated with the key or NULL if none found.</div><div class='add'>+ */</div><div class='add'>+struct btrfs_lru_cache_entry *btrfs_lru_cache_lookup(struct btrfs_lru_cache *cache,</div><div class='add'>+						     u64 key, u64 gen)</div><div class='add'>+{</div><div class='add'>+	struct list_head *head;</div><div class='add'>+	struct btrfs_lru_cache_entry *entry;</div><div class='add'>+</div><div class='add'>+	head = mtree_load(&amp;cache-&gt;entries, key);</div><div class='add'>+	if (!head)</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	entry = match_entry(head, key, gen);</div><div class='add'>+	if (entry)</div><div class='add'>+		list_move_tail(&amp;entry-&gt;lru_list, &amp;cache-&gt;lru_list);</div><div class='add'>+</div><div class='add'>+	return entry;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Remove an entry from the cache.</div><div class='add'>+ *</div><div class='add'>+ * @cache:     The cache to remove from.</div><div class='add'>+ * @entry:     The entry to remove from the cache.</div><div class='add'>+ *</div><div class='add'>+ * Note: this also frees the memory used by the entry.</div><div class='add'>+ */</div><div class='add'>+void btrfs_lru_cache_remove(struct btrfs_lru_cache *cache,</div><div class='add'>+			    struct btrfs_lru_cache_entry *entry)</div><div class='add'>+{</div><div class='add'>+	struct list_head *prev = entry-&gt;list.prev;</div><div class='add'>+</div><div class='add'>+	ASSERT(cache-&gt;size &gt; 0);</div><div class='add'>+	ASSERT(!mtree_empty(&amp;cache-&gt;entries));</div><div class='add'>+</div><div class='add'>+	list_del(&amp;entry-&gt;list);</div><div class='add'>+	list_del(&amp;entry-&gt;lru_list);</div><div class='add'>+</div><div class='add'>+	if (list_empty(prev)) {</div><div class='add'>+		struct list_head *head;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * If previous element in the list entry-&gt;list is now empty, it</div><div class='add'>+		 * means it's a head entry not pointing to any cached entries,</div><div class='add'>+		 * so remove it from the maple tree and free it.</div><div class='add'>+		 */</div><div class='add'>+		head = mtree_erase(&amp;cache-&gt;entries, entry-&gt;key);</div><div class='add'>+		ASSERT(head == prev);</div><div class='add'>+		kfree(head);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	kfree(entry);</div><div class='add'>+	cache-&gt;size--;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Store an entry in the cache.</div><div class='add'>+ *</div><div class='add'>+ * @cache:      The cache.</div><div class='add'>+ * @entry:      The entry to store.</div><div class='add'>+ *</div><div class='add'>+ * Returns 0 on success and &lt; 0 on error.</div><div class='add'>+ */</div><div class='add'>+int btrfs_lru_cache_store(struct btrfs_lru_cache *cache,</div><div class='add'>+			  struct btrfs_lru_cache_entry *new_entry,</div><div class='add'>+			  gfp_t gfp)</div><div class='add'>+{</div><div class='add'>+	const u64 key = new_entry-&gt;key;</div><div class='add'>+	struct list_head *head;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	head = kmalloc(sizeof(*head), gfp);</div><div class='add'>+	if (!head)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	ret = mtree_insert(&amp;cache-&gt;entries, key, head, gfp);</div><div class='add'>+	if (ret == 0) {</div><div class='add'>+		INIT_LIST_HEAD(head);</div><div class='add'>+		list_add_tail(&amp;new_entry-&gt;list, head);</div><div class='add'>+	} else if (ret == -EEXIST) {</div><div class='add'>+		kfree(head);</div><div class='add'>+		head = mtree_load(&amp;cache-&gt;entries, key);</div><div class='add'>+		ASSERT(head != NULL);</div><div class='add'>+		if (match_entry(head, key, new_entry-&gt;gen) != NULL)</div><div class='add'>+			return -EEXIST;</div><div class='add'>+		list_add_tail(&amp;new_entry-&gt;list, head);</div><div class='add'>+	} else if (ret &lt; 0) {</div><div class='add'>+		kfree(head);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (cache-&gt;max_size &gt; 0 &amp;&amp; cache-&gt;size == cache-&gt;max_size) {</div><div class='add'>+		struct btrfs_lru_cache_entry *lru_entry;</div><div class='add'>+</div><div class='add'>+		lru_entry = list_first_entry(&amp;cache-&gt;lru_list,</div><div class='add'>+					     struct btrfs_lru_cache_entry,</div><div class='add'>+					     lru_list);</div><div class='add'>+		btrfs_lru_cache_remove(cache, lru_entry);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	list_add_tail(&amp;new_entry-&gt;lru_list, &amp;cache-&gt;lru_list);</div><div class='add'>+	cache-&gt;size++;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Empty a cache.</div><div class='add'>+ *</div><div class='add'>+ * @cache:     The cache to empty.</div><div class='add'>+ *</div><div class='add'>+ * Removes all entries from the cache.</div><div class='add'>+ */</div><div class='add'>+void btrfs_lru_cache_clear(struct btrfs_lru_cache *cache)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_lru_cache_entry *entry;</div><div class='add'>+	struct btrfs_lru_cache_entry *tmp;</div><div class='add'>+</div><div class='add'>+	list_for_each_entry_safe(entry, tmp, &amp;cache-&gt;lru_list, lru_list)</div><div class='add'>+		btrfs_lru_cache_remove(cache, entry);</div><div class='add'>+</div><div class='add'>+	ASSERT(cache-&gt;size == 0);</div><div class='add'>+	ASSERT(mtree_empty(&amp;cache-&gt;entries));</div><div class='add'>+}</div><div class='head'>diff --git a/fs/btrfs/lru_cache.h b/fs/btrfs/lru_cache.h<br/>new file mode 100644<br/>index 000000000000..07f1bb1c6aa3<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/lru_cache.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/lru_cache.h</a></div><div class='hunk'>@@ -0,0 +1,71 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+</div><div class='add'>+#ifndef BTRFS_LRU_CACHE_H</div><div class='add'>+#define BTRFS_LRU_CACHE_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+#include &lt;linux/maple_tree.h&gt;</div><div class='add'>+#include &lt;linux/list.h&gt;</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * A cache entry. This is meant to be embedded in a structure of a user of</div><div class='add'>+ * this module. Similar to how struct list_head and struct rb_node are used.</div><div class='add'>+ *</div><div class='add'>+ * Note: it should be embedded as the first element in a struct (offset 0), and</div><div class='add'>+ * this module assumes it was allocated with kmalloc(), so it calls kfree() when</div><div class='add'>+ * it needs to free an entry.</div><div class='add'>+ */</div><div class='add'>+struct btrfs_lru_cache_entry {</div><div class='add'>+	struct list_head lru_list;</div><div class='add'>+	u64 key;</div><div class='add'>+	/*</div><div class='add'>+	 * Optional generation associated to a key. Use 0 if not needed/used.</div><div class='add'>+	 * Entries with the same key and different generations are stored in a</div><div class='add'>+	 * linked list, so use this only for cases where there's a small number</div><div class='add'>+	 * of different generations.</div><div class='add'>+	 */</div><div class='add'>+	u64 gen;</div><div class='add'>+	/*</div><div class='add'>+	 * The maple tree uses unsigned long type for the keys, which is 32 bits</div><div class='add'>+	 * on 32 bits systems, and 64 bits on 64 bits systems. So if we want to</div><div class='add'>+	 * use something like inode numbers as keys, which are always a u64, we</div><div class='add'>+	 * have to deal with this in a special way - we store the key in the</div><div class='add'>+	 * entry itself, as a u64, and the values inserted into the maple tree</div><div class='add'>+	 * are linked lists of entries - so in case we are on a 64 bits system,</div><div class='add'>+	 * that list always has a single entry, while on 32 bits systems it</div><div class='add'>+	 * may have more than one, with each entry having the same value for</div><div class='add'>+	 * their lower 32 bits of the u64 key.</div><div class='add'>+	 */</div><div class='add'>+	struct list_head list;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct btrfs_lru_cache {</div><div class='add'>+	struct list_head lru_list;</div><div class='add'>+	struct maple_tree entries;</div><div class='add'>+	/* Number of entries stored in the cache. */</div><div class='add'>+	unsigned int size;</div><div class='add'>+	/* Maximum number of entries the cache can have. */</div><div class='add'>+	unsigned int max_size;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+#define btrfs_lru_cache_for_each_entry_safe(cache, entry, tmp)		\</div><div class='add'>+	list_for_each_entry_safe_reverse((entry), (tmp), &amp;(cache)-&gt;lru_list, lru_list)</div><div class='add'>+</div><div class='add'>+static inline struct btrfs_lru_cache_entry *btrfs_lru_cache_lru_entry(</div><div class='add'>+					      struct btrfs_lru_cache *cache)</div><div class='add'>+{</div><div class='add'>+	return list_first_entry_or_null(&amp;cache-&gt;lru_list,</div><div class='add'>+					struct btrfs_lru_cache_entry, lru_list);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_lru_cache_init(struct btrfs_lru_cache *cache, unsigned int max_size);</div><div class='add'>+struct btrfs_lru_cache_entry *btrfs_lru_cache_lookup(struct btrfs_lru_cache *cache,</div><div class='add'>+						     u64 key, u64 gen);</div><div class='add'>+int btrfs_lru_cache_store(struct btrfs_lru_cache *cache,</div><div class='add'>+			  struct btrfs_lru_cache_entry *new_entry,</div><div class='add'>+			  gfp_t gfp);</div><div class='add'>+void btrfs_lru_cache_remove(struct btrfs_lru_cache *cache,</div><div class='add'>+			    struct btrfs_lru_cache_entry *entry);</div><div class='add'>+void btrfs_lru_cache_clear(struct btrfs_lru_cache *cache);</div><div class='add'>+</div><div class='add'>+#endif</div><div class='head'>diff --git a/fs/btrfs/lzo.c b/fs/btrfs/lzo.c<br/>index 65cb0766e62d..4758f66da449 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/lzo.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/lzo.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/lzo.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/lzo.c</a></div><div class='hunk'>@@ -13,8 +13,11 @@</div><div class='ctx'> #include &lt;linux/bio.h&gt;</div><div class='ctx'> #include &lt;linux/lzo.h&gt;</div><div class='ctx'> #include &lt;linux/refcount.h&gt;</div><div class='add'>+#include "messages.h"</div><div class='ctx'> #include "compression.h"</div><div class='ctx'> #include "ctree.h"</div><div class='add'>+#include "super.h"</div><div class='add'>+#include "btrfs_inode.h"</div><div class='ctx'> </div><div class='ctx'> #define LZO_LEN	4</div><div class='ctx'> </div><div class='hunk'>@@ -62,7 +65,14 @@ struct workspace {</div><div class='ctx'> 	struct list_head list;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static struct workspace_manager wsm;</div><div class='add'>+static u32 workspace_buf_length(const struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	return lzo1x_worst_compress(fs_info-&gt;sectorsize);</div><div class='add'>+}</div><div class='add'>+static u32 workspace_cbuf_length(const struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	return lzo1x_worst_compress(fs_info-&gt;sectorsize);</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> void lzo_free_workspace(struct list_head *ws)</div><div class='ctx'> {</div><div class='hunk'>@@ -74,7 +84,7 @@ void lzo_free_workspace(struct list_head *ws)</div><div class='ctx'> 	kfree(workspace);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct list_head *lzo_alloc_workspace(unsigned int level)</div><div class='add'>+struct list_head *lzo_alloc_workspace(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	struct workspace *workspace;</div><div class='ctx'> </div><div class='hunk'>@@ -82,9 +92,9 @@ struct list_head *lzo_alloc_workspace(unsigned int level)</div><div class='ctx'> 	if (!workspace)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='del'>-	workspace-&gt;mem = kvmalloc(LZO1X_MEM_COMPRESS, GFP_KERNEL);</div><div class='del'>-	workspace-&gt;buf = kvmalloc(lzo1x_worst_compress(PAGE_SIZE), GFP_KERNEL);</div><div class='del'>-	workspace-&gt;cbuf = kvmalloc(lzo1x_worst_compress(PAGE_SIZE), GFP_KERNEL);</div><div class='add'>+	workspace-&gt;mem = kvmalloc(LZO1X_MEM_COMPRESS, GFP_KERNEL | __GFP_NOWARN);</div><div class='add'>+	workspace-&gt;buf = kvmalloc(workspace_buf_length(fs_info), GFP_KERNEL | __GFP_NOWARN);</div><div class='add'>+	workspace-&gt;cbuf = kvmalloc(workspace_cbuf_length(fs_info), GFP_KERNEL | __GFP_NOWARN);</div><div class='ctx'> 	if (!workspace-&gt;mem || !workspace-&gt;buf || !workspace-&gt;cbuf)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> </div><div class='hunk'>@@ -122,35 +132,40 @@ static inline size_t read_compress_length(const char *buf)</div><div class='ctx'>  *</div><div class='ctx'>  * Will allocate new pages when needed.</div><div class='ctx'>  */</div><div class='del'>-static int copy_compressed_data_to_page(char *compressed_data,</div><div class='add'>+static int copy_compressed_data_to_page(struct btrfs_fs_info *fs_info,</div><div class='add'>+					char *compressed_data,</div><div class='ctx'> 					size_t compressed_size,</div><div class='del'>-					struct page **out_pages,</div><div class='del'>-					u32 *cur_out,</div><div class='del'>-					const u32 sectorsize)</div><div class='add'>+					struct folio **out_folios,</div><div class='add'>+					unsigned long max_nr_folio,</div><div class='add'>+					u32 *cur_out)</div><div class='ctx'> {</div><div class='add'>+	const u32 sectorsize = fs_info-&gt;sectorsize;</div><div class='add'>+	const u32 min_folio_shift = PAGE_SHIFT + fs_info-&gt;block_min_order;</div><div class='ctx'> 	u32 sector_bytes_left;</div><div class='ctx'> 	u32 orig_out;</div><div class='del'>-	struct page *cur_page;</div><div class='add'>+	struct folio *cur_folio;</div><div class='ctx'> 	char *kaddr;</div><div class='ctx'> </div><div class='add'>+	if ((*cur_out &gt;&gt; min_folio_shift) &gt;= max_nr_folio)</div><div class='add'>+		return -E2BIG;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We never allow a segment header crossing sector boundary, previous</div><div class='ctx'> 	 * run should ensure we have enough space left inside the sector.</div><div class='ctx'> 	 */</div><div class='ctx'> 	ASSERT((*cur_out / sectorsize) == (*cur_out + LZO_LEN - 1) / sectorsize);</div><div class='ctx'> </div><div class='del'>-	cur_page = out_pages[*cur_out / PAGE_SIZE];</div><div class='add'>+	cur_folio = out_folios[*cur_out &gt;&gt; min_folio_shift];</div><div class='ctx'> 	/* Allocate a new page */</div><div class='del'>-	if (!cur_page) {</div><div class='del'>-		cur_page = alloc_page(GFP_NOFS);</div><div class='del'>-		if (!cur_page)</div><div class='add'>+	if (!cur_folio) {</div><div class='add'>+		cur_folio = btrfs_alloc_compr_folio(fs_info);</div><div class='add'>+		if (!cur_folio)</div><div class='ctx'> 			return -ENOMEM;</div><div class='del'>-		out_pages[*cur_out / PAGE_SIZE] = cur_page;</div><div class='add'>+		out_folios[*cur_out &gt;&gt; min_folio_shift] = cur_folio;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	kaddr = kmap(cur_page);</div><div class='del'>-	write_compress_length(kaddr + offset_in_page(*cur_out),</div><div class='del'>-			      compressed_size);</div><div class='add'>+	kaddr = kmap_local_folio(cur_folio, offset_in_folio(cur_folio, *cur_out));</div><div class='add'>+	write_compress_length(kaddr, compressed_size);</div><div class='ctx'> 	*cur_out += LZO_LEN;</div><div class='ctx'> </div><div class='ctx'> 	orig_out = *cur_out;</div><div class='hunk'>@@ -160,18 +175,22 @@ static int copy_compressed_data_to_page(char *compressed_data,</div><div class='ctx'> 		u32 copy_len = min_t(u32, sectorsize - *cur_out % sectorsize,</div><div class='ctx'> 				     orig_out + compressed_size - *cur_out);</div><div class='ctx'> </div><div class='del'>-		kunmap(cur_page);</div><div class='del'>-		cur_page = out_pages[*cur_out / PAGE_SIZE];</div><div class='add'>+		kunmap_local(kaddr);</div><div class='add'>+</div><div class='add'>+		if ((*cur_out &gt;&gt; min_folio_shift) &gt;= max_nr_folio)</div><div class='add'>+			return -E2BIG;</div><div class='add'>+</div><div class='add'>+		cur_folio = out_folios[*cur_out &gt;&gt; min_folio_shift];</div><div class='ctx'> 		/* Allocate a new page */</div><div class='del'>-		if (!cur_page) {</div><div class='del'>-			cur_page = alloc_page(GFP_NOFS);</div><div class='del'>-			if (!cur_page)</div><div class='add'>+		if (!cur_folio) {</div><div class='add'>+			cur_folio = btrfs_alloc_compr_folio(fs_info);</div><div class='add'>+			if (!cur_folio)</div><div class='ctx'> 				return -ENOMEM;</div><div class='del'>-			out_pages[*cur_out / PAGE_SIZE] = cur_page;</div><div class='add'>+			out_folios[*cur_out &gt;&gt; min_folio_shift] = cur_folio;</div><div class='ctx'> 		}</div><div class='del'>-		kaddr = kmap(cur_page);</div><div class='add'>+		kaddr = kmap_local_folio(cur_folio, 0);</div><div class='ctx'> </div><div class='del'>-		memcpy(kaddr + offset_in_page(*cur_out),</div><div class='add'>+		memcpy(kaddr + offset_in_folio(cur_folio, *cur_out),</div><div class='ctx'> 		       compressed_data + *cur_out - orig_out, copy_len);</div><div class='ctx'> </div><div class='ctx'> 		*cur_out += copy_len;</div><div class='hunk'>@@ -191,18 +210,22 @@ static int copy_compressed_data_to_page(char *compressed_data,</div><div class='ctx'> 	*cur_out += sector_bytes_left;</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	kunmap(cur_page);</div><div class='add'>+	kunmap_local(kaddr);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int lzo_compress_pages(struct list_head *ws, struct address_space *mapping,</div><div class='del'>-		u64 start, struct page **pages, unsigned long *out_pages,</div><div class='del'>-		unsigned long *total_in, unsigned long *total_out)</div><div class='add'>+int lzo_compress_folios(struct list_head *ws, struct btrfs_inode *inode,</div><div class='add'>+			u64 start, struct folio **folios, unsigned long *out_folios,</div><div class='add'>+			unsigned long *total_in, unsigned long *total_out)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='ctx'> 	struct workspace *workspace = list_entry(ws, struct workspace, list);</div><div class='del'>-	const u32 sectorsize = btrfs_sb(mapping-&gt;host-&gt;i_sb)-&gt;sectorsize;</div><div class='del'>-	struct page *page_in = NULL;</div><div class='add'>+	const u32 sectorsize = fs_info-&gt;sectorsize;</div><div class='add'>+	const u32 min_folio_size = btrfs_min_folio_size(fs_info);</div><div class='add'>+	struct address_space *mapping = inode-&gt;vfs_inode.i_mapping;</div><div class='add'>+	struct folio *folio_in = NULL;</div><div class='ctx'> 	char *sizes_ptr;</div><div class='add'>+	const unsigned long max_nr_folio = *out_folios;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	/* Points to the file offset of input data */</div><div class='ctx'> 	u64 cur_in = start;</div><div class='hunk'>@@ -210,7 +233,8 @@ int lzo_compress_pages(struct list_head *ws, struct address_space *mapping,</div><div class='ctx'> 	u32 cur_out = 0;</div><div class='ctx'> 	u32 len = *total_out;</div><div class='ctx'> </div><div class='del'>-	*out_pages = 0;</div><div class='add'>+	ASSERT(max_nr_folio &gt; 0);</div><div class='add'>+	*out_folios = 0;</div><div class='ctx'> 	*total_out = 0;</div><div class='ctx'> 	*total_in = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -227,28 +251,29 @@ int lzo_compress_pages(struct list_head *ws, struct address_space *mapping,</div><div class='ctx'> 		size_t out_len;</div><div class='ctx'> </div><div class='ctx'> 		/* Get the input page first */</div><div class='del'>-		if (!page_in) {</div><div class='del'>-			page_in = find_get_page(mapping, cur_in &gt;&gt; PAGE_SHIFT);</div><div class='del'>-			ASSERT(page_in);</div><div class='add'>+		if (!folio_in) {</div><div class='add'>+			ret = btrfs_compress_filemap_get_folio(mapping, cur_in, &amp;folio_in);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* Compress at most one sector of data each time */</div><div class='ctx'> 		in_len = min_t(u32, start + len - cur_in, sectorsize - sector_off);</div><div class='ctx'> 		ASSERT(in_len);</div><div class='del'>-		data_in = kmap(page_in);</div><div class='del'>-		ret = lzo1x_1_compress(data_in +</div><div class='del'>-				       offset_in_page(cur_in), in_len,</div><div class='add'>+		data_in = kmap_local_folio(folio_in, offset_in_folio(folio_in, cur_in));</div><div class='add'>+		ret = lzo1x_1_compress(data_in, in_len,</div><div class='ctx'> 				       workspace-&gt;cbuf, &amp;out_len,</div><div class='ctx'> 				       workspace-&gt;mem);</div><div class='del'>-		kunmap(page_in);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			pr_debug("BTRFS: lzo in loop returned %d\n", ret);</div><div class='add'>+		kunmap_local(data_in);</div><div class='add'>+		if (unlikely(ret &lt; 0)) {</div><div class='add'>+			/* lzo1x_1_compress never fails. */</div><div class='ctx'> 			ret = -EIO;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		ret = copy_compressed_data_to_page(workspace-&gt;cbuf, out_len,</div><div class='del'>-						   pages, &amp;cur_out, sectorsize);</div><div class='add'>+		ret = copy_compressed_data_to_page(fs_info, workspace-&gt;cbuf, out_len,</div><div class='add'>+						   folios, max_nr_folio,</div><div class='add'>+						   &amp;cur_out);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -263,15 +288,15 @@ int lzo_compress_pages(struct list_head *ws, struct address_space *mapping,</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		/* Check if we have reached page boundary */</div><div class='del'>-		if (IS_ALIGNED(cur_in, PAGE_SIZE)) {</div><div class='del'>-			put_page(page_in);</div><div class='del'>-			page_in = NULL;</div><div class='add'>+		/* Check if we have reached folio boundary. */</div><div class='add'>+		if (IS_ALIGNED(cur_in, min_folio_size)) {</div><div class='add'>+			folio_put(folio_in);</div><div class='add'>+			folio_in = NULL;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Store the size of all chunks of compressed data */</div><div class='del'>-	sizes_ptr = kmap_local_page(pages[0]);</div><div class='add'>+	sizes_ptr = kmap_local_folio(folios[0], 0);</div><div class='ctx'> 	write_compress_length(sizes_ptr, cur_out);</div><div class='ctx'> 	kunmap_local(sizes_ptr);</div><div class='ctx'> </div><div class='hunk'>@@ -279,7 +304,9 @@ int lzo_compress_pages(struct list_head *ws, struct address_space *mapping,</div><div class='ctx'> 	*total_out = cur_out;</div><div class='ctx'> 	*total_in = cur_in - start;</div><div class='ctx'> out:</div><div class='del'>-	*out_pages = DIV_ROUND_UP(cur_out, PAGE_SIZE);</div><div class='add'>+	if (folio_in)</div><div class='add'>+		folio_put(folio_in);</div><div class='add'>+	*out_folios = DIV_ROUND_UP(cur_out, min_folio_size);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -291,22 +318,19 @@ out:</div><div class='ctx'> static void copy_compressed_segment(struct compressed_bio *cb,</div><div class='ctx'> 				    char *dest, u32 len, u32 *cur_in)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = cb_to_fs_info(cb);</div><div class='add'>+	const u32 min_folio_shift = PAGE_SHIFT + fs_info-&gt;block_min_order;</div><div class='ctx'> 	u32 orig_in = *cur_in;</div><div class='ctx'> </div><div class='ctx'> 	while (*cur_in &lt; orig_in + len) {</div><div class='del'>-		char *kaddr;</div><div class='del'>-		struct page *cur_page;</div><div class='del'>-		u32 copy_len = min_t(u32, PAGE_SIZE - offset_in_page(*cur_in),</div><div class='del'>-					  orig_in + len - *cur_in);</div><div class='add'>+		struct folio *cur_folio = cb-&gt;compressed_folios[*cur_in &gt;&gt; min_folio_shift];</div><div class='add'>+		u32 copy_len = min_t(u32, orig_in + len - *cur_in,</div><div class='add'>+				     folio_size(cur_folio) - offset_in_folio(cur_folio, *cur_in));</div><div class='ctx'> </div><div class='ctx'> 		ASSERT(copy_len);</div><div class='del'>-		cur_page = cb-&gt;compressed_pages[*cur_in / PAGE_SIZE];</div><div class='ctx'> </div><div class='del'>-		kaddr = kmap(cur_page);</div><div class='del'>-		memcpy(dest + *cur_in - orig_in,</div><div class='del'>-			kaddr + offset_in_page(*cur_in),</div><div class='del'>-			copy_len);</div><div class='del'>-		kunmap(cur_page);</div><div class='add'>+		memcpy_from_folio(dest + *cur_in - orig_in, cur_folio,</div><div class='add'>+				  offset_in_folio(cur_folio, *cur_in), copy_len);</div><div class='ctx'> </div><div class='ctx'> 		*cur_in += copy_len;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -315,8 +339,9 @@ static void copy_compressed_segment(struct compressed_bio *cb,</div><div class='ctx'> int lzo_decompress_bio(struct list_head *ws, struct compressed_bio *cb)</div><div class='ctx'> {</div><div class='ctx'> 	struct workspace *workspace = list_entry(ws, struct workspace, list);</div><div class='del'>-	const struct btrfs_fs_info *fs_info = btrfs_sb(cb-&gt;inode-&gt;i_sb);</div><div class='add'>+	const struct btrfs_fs_info *fs_info = cb-&gt;bbio.inode-&gt;root-&gt;fs_info;</div><div class='ctx'> 	const u32 sectorsize = fs_info-&gt;sectorsize;</div><div class='add'>+	const u32 min_folio_shift = PAGE_SHIFT + fs_info-&gt;block_min_order;</div><div class='ctx'> 	char *kaddr;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	/* Compressed data length, can be unaligned */</div><div class='hunk'>@@ -326,9 +351,9 @@ int lzo_decompress_bio(struct list_head *ws, struct compressed_bio *cb)</div><div class='ctx'> 	/* Bytes decompressed so far */</div><div class='ctx'> 	u32 cur_out = 0;</div><div class='ctx'> </div><div class='del'>-	kaddr = kmap(cb-&gt;compressed_pages[0]);</div><div class='add'>+	kaddr = kmap_local_folio(cb-&gt;compressed_folios[0], 0);</div><div class='ctx'> 	len_in = read_compress_length(kaddr);</div><div class='del'>-	kunmap(cb-&gt;compressed_pages[0]);</div><div class='add'>+	kunmap_local(kaddr);</div><div class='ctx'> 	cur_in += LZO_LEN;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -338,17 +363,20 @@ int lzo_decompress_bio(struct list_head *ws, struct compressed_bio *cb)</div><div class='ctx'> 	 * and all sectors should be used.</div><div class='ctx'> 	 * If this happens, it means the compressed extent is corrupted.</div><div class='ctx'> 	 */</div><div class='del'>-	if (len_in &gt; min_t(size_t, BTRFS_MAX_COMPRESSED, cb-&gt;compressed_len) ||</div><div class='del'>-	    round_up(len_in, sectorsize) &lt; cb-&gt;compressed_len) {</div><div class='add'>+	if (unlikely(len_in &gt; min_t(size_t, BTRFS_MAX_COMPRESSED, cb-&gt;compressed_len) ||</div><div class='add'>+		     round_up(len_in, sectorsize) &lt; cb-&gt;compressed_len)) {</div><div class='add'>+		struct btrfs_inode *inode = cb-&gt;bbio.inode;</div><div class='add'>+</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='del'>-			"invalid lzo header, lzo len %u compressed len %u",</div><div class='del'>-			len_in, cb-&gt;compressed_len);</div><div class='add'>+"lzo header invalid, root %llu inode %llu offset %llu lzo len %u compressed len %u",</div><div class='add'>+			  btrfs_root_id(inode-&gt;root), btrfs_ino(inode),</div><div class='add'>+			  cb-&gt;start, len_in, cb-&gt;compressed_len);</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Go through each lzo segment */</div><div class='ctx'> 	while (cur_in &lt; len_in) {</div><div class='del'>-		struct page *cur_page;</div><div class='add'>+		struct folio *cur_folio;</div><div class='ctx'> 		/* Length of the compressed segment */</div><div class='ctx'> 		u32 seg_len;</div><div class='ctx'> 		u32 sector_bytes_left;</div><div class='hunk'>@@ -360,23 +388,41 @@ int lzo_decompress_bio(struct list_head *ws, struct compressed_bio *cb)</div><div class='ctx'> 		 */</div><div class='ctx'> 		ASSERT(cur_in / sectorsize ==</div><div class='ctx'> 		       (cur_in + LZO_LEN - 1) / sectorsize);</div><div class='del'>-		cur_page = cb-&gt;compressed_pages[cur_in / PAGE_SIZE];</div><div class='del'>-		ASSERT(cur_page);</div><div class='del'>-		kaddr = kmap(cur_page);</div><div class='del'>-		seg_len = read_compress_length(kaddr + offset_in_page(cur_in));</div><div class='del'>-		kunmap(cur_page);</div><div class='add'>+		cur_folio = cb-&gt;compressed_folios[cur_in &gt;&gt; min_folio_shift];</div><div class='add'>+		ASSERT(cur_folio);</div><div class='add'>+		kaddr = kmap_local_folio(cur_folio, 0);</div><div class='add'>+		seg_len = read_compress_length(kaddr + offset_in_folio(cur_folio, cur_in));</div><div class='add'>+		kunmap_local(kaddr);</div><div class='ctx'> 		cur_in += LZO_LEN;</div><div class='ctx'> </div><div class='add'>+		if (unlikely(seg_len &gt; workspace_cbuf_length(fs_info))) {</div><div class='add'>+			struct btrfs_inode *inode = cb-&gt;bbio.inode;</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * seg_len shouldn't be larger than we have allocated</div><div class='add'>+			 * for workspace-&gt;cbuf</div><div class='add'>+			 */</div><div class='add'>+			btrfs_err(fs_info,</div><div class='add'>+			"lzo segment too big, root %llu inode %llu offset %llu len %u",</div><div class='add'>+				  btrfs_root_id(inode-&gt;root), btrfs_ino(inode),</div><div class='add'>+				  cb-&gt;start, seg_len);</div><div class='add'>+			return -EIO;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		/* Copy the compressed segment payload into workspace */</div><div class='ctx'> 		copy_compressed_segment(cb, workspace-&gt;cbuf, seg_len, &amp;cur_in);</div><div class='ctx'> </div><div class='ctx'> 		/* Decompress the data */</div><div class='ctx'> 		ret = lzo1x_decompress_safe(workspace-&gt;cbuf, seg_len,</div><div class='ctx'> 					    workspace-&gt;buf, &amp;out_len);</div><div class='del'>-		if (ret != LZO_E_OK) {</div><div class='del'>-			btrfs_err(fs_info, "failed to decompress");</div><div class='del'>-			ret = -EIO;</div><div class='del'>-			goto out;</div><div class='add'>+		if (unlikely(ret != LZO_E_OK)) {</div><div class='add'>+			struct btrfs_inode *inode = cb-&gt;bbio.inode;</div><div class='add'>+</div><div class='add'>+			btrfs_err(fs_info,</div><div class='add'>+		"lzo decompression failed, error %d root %llu inode %llu offset %llu",</div><div class='add'>+				  ret, btrfs_root_id(inode-&gt;root), btrfs_ino(inode),</div><div class='add'>+				  cb-&gt;start);</div><div class='add'>+			return -EIO;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* Copy the data into inode pages */</div><div class='hunk'>@@ -385,7 +431,7 @@ int lzo_decompress_bio(struct list_head *ws, struct compressed_bio *cb)</div><div class='ctx'> </div><div class='ctx'> 		/* All data read, exit */</div><div class='ctx'> 		if (ret == 0)</div><div class='del'>-			goto out;</div><div class='add'>+			return 0;</div><div class='ctx'> 		ret = 0;</div><div class='ctx'> </div><div class='ctx'> 		/* Check if the sector has enough space for a segment header */</div><div class='hunk'>@@ -396,76 +442,62 @@ int lzo_decompress_bio(struct list_head *ws, struct compressed_bio *cb)</div><div class='ctx'> 		/* Skip the padding zeros */</div><div class='ctx'> 		cur_in += sector_bytes_left;</div><div class='ctx'> 	}</div><div class='del'>-out:</div><div class='del'>-	if (!ret)</div><div class='del'>-		zero_fill_bio(cb-&gt;orig_bio);</div><div class='del'>-	return ret;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int lzo_decompress(struct list_head *ws, unsigned char *data_in,</div><div class='del'>-		struct page *dest_page, unsigned long start_byte, size_t srclen,</div><div class='add'>+int lzo_decompress(struct list_head *ws, const u8 *data_in,</div><div class='add'>+		struct folio *dest_folio, unsigned long dest_pgoff, size_t srclen,</div><div class='ctx'> 		size_t destlen)</div><div class='ctx'> {</div><div class='ctx'> 	struct workspace *workspace = list_entry(ws, struct workspace, list);</div><div class='add'>+	struct btrfs_fs_info *fs_info = folio_to_fs_info(dest_folio);</div><div class='add'>+	const u32 sectorsize = fs_info-&gt;sectorsize;</div><div class='ctx'> 	size_t in_len;</div><div class='ctx'> 	size_t out_len;</div><div class='del'>-	size_t max_segment_len = lzo1x_worst_compress(PAGE_SIZE);</div><div class='add'>+	size_t max_segment_len = workspace_buf_length(fs_info);</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	char *kaddr;</div><div class='del'>-	unsigned long bytes;</div><div class='ctx'> </div><div class='del'>-	if (srclen &lt; LZO_LEN || srclen &gt; max_segment_len + LZO_LEN * 2)</div><div class='add'>+	if (unlikely(srclen &lt; LZO_LEN || srclen &gt; max_segment_len + LZO_LEN * 2))</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> </div><div class='ctx'> 	in_len = read_compress_length(data_in);</div><div class='del'>-	if (in_len != srclen)</div><div class='add'>+	if (unlikely(in_len != srclen))</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> 	data_in += LZO_LEN;</div><div class='ctx'> </div><div class='ctx'> 	in_len = read_compress_length(data_in);</div><div class='del'>-	if (in_len != srclen - LZO_LEN * 2) {</div><div class='add'>+	if (unlikely(in_len != srclen - LZO_LEN * 2)) {</div><div class='ctx'> 		ret = -EUCLEAN;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	data_in += LZO_LEN;</div><div class='ctx'> </div><div class='del'>-	out_len = PAGE_SIZE;</div><div class='add'>+	out_len = sectorsize;</div><div class='ctx'> 	ret = lzo1x_decompress_safe(data_in, in_len, workspace-&gt;buf, &amp;out_len);</div><div class='del'>-	if (ret != LZO_E_OK) {</div><div class='del'>-		pr_warn("BTRFS: decompress failed!\n");</div><div class='add'>+	if (unlikely(ret != LZO_E_OK)) {</div><div class='add'>+		struct btrfs_inode *inode = folio_to_inode(dest_folio);</div><div class='add'>+</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+		"lzo decompression failed, error %d root %llu inode %llu offset %llu",</div><div class='add'>+			  ret, btrfs_root_id(inode-&gt;root), btrfs_ino(inode),</div><div class='add'>+			  folio_pos(dest_folio));</div><div class='ctx'> 		ret = -EIO;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (out_len &lt; start_byte) {</div><div class='add'>+	ASSERT(out_len &lt;= sectorsize);</div><div class='add'>+	memcpy_to_folio(dest_folio, dest_pgoff, workspace-&gt;buf, out_len);</div><div class='add'>+	/* Early end, considered as an error. */</div><div class='add'>+	if (unlikely(out_len &lt; destlen)) {</div><div class='ctx'> 		ret = -EIO;</div><div class='del'>-		goto out;</div><div class='add'>+		folio_zero_range(dest_folio, dest_pgoff + out_len, destlen - out_len);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * the caller is already checking against PAGE_SIZE, but lets</div><div class='del'>-	 * move this check closer to the memcpy/memset</div><div class='del'>-	 */</div><div class='del'>-	destlen = min_t(unsigned long, destlen, PAGE_SIZE);</div><div class='del'>-	bytes = min_t(unsigned long, destlen, out_len - start_byte);</div><div class='del'>-</div><div class='del'>-	kaddr = kmap_local_page(dest_page);</div><div class='del'>-	memcpy(kaddr, workspace-&gt;buf + start_byte, bytes);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * btrfs_getblock is doing a zero on the tail of the page too,</div><div class='del'>-	 * but this will cover anything missing from the decompressed</div><div class='del'>-	 * data.</div><div class='del'>-	 */</div><div class='del'>-	if (bytes &lt; destlen)</div><div class='del'>-		memset(kaddr+bytes, 0, destlen-bytes);</div><div class='del'>-	kunmap_local(kaddr);</div><div class='ctx'> out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-const struct btrfs_compress_op btrfs_lzo_compress = {</div><div class='del'>-	.workspace_manager	= &amp;wsm,</div><div class='add'>+const struct btrfs_compress_levels  btrfs_lzo_compress = {</div><div class='ctx'> 	.max_level		= 1,</div><div class='ctx'> 	.default_level		= 1,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/btrfs/messages.c b/fs/btrfs/messages.c<br/>new file mode 100644<br/>index 000000000000..2f853de44473<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/messages.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/messages.c</a></div><div class='hunk'>@@ -0,0 +1,315 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "messages.h"</div><div class='add'>+#include "discard.h"</div><div class='add'>+#include "super.h"</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_PRINTK</div><div class='add'>+</div><div class='add'>+#define STATE_STRING_PREFACE	" state "</div><div class='add'>+#define STATE_STRING_BUF_LEN	(sizeof(STATE_STRING_PREFACE) + BTRFS_FS_STATE_COUNT + 1)</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Characters to print to indicate error conditions or uncommon filesystem state.</div><div class='add'>+ * RO is not an error.</div><div class='add'>+ */</div><div class='add'>+static const char fs_state_chars[] = {</div><div class='add'>+	[BTRFS_FS_STATE_REMOUNTING]		= 'M',</div><div class='add'>+	[BTRFS_FS_STATE_RO]			= 0,</div><div class='add'>+	[BTRFS_FS_STATE_TRANS_ABORTED]		= 'A',</div><div class='add'>+	[BTRFS_FS_STATE_LOG_REPLAY_ABORTED]	= 'O',</div><div class='add'>+	[BTRFS_FS_STATE_DEV_REPLACING]		= 'R',</div><div class='add'>+	[BTRFS_FS_STATE_DUMMY_FS_INFO]		= 0,</div><div class='add'>+	[BTRFS_FS_STATE_NO_DATA_CSUMS]		= 'C',</div><div class='add'>+	[BTRFS_FS_STATE_SKIP_META_CSUMS]	= 'S',</div><div class='add'>+	[BTRFS_FS_STATE_LOG_CLEANUP_ERROR]	= 'L',</div><div class='add'>+	[BTRFS_FS_STATE_EMERGENCY_SHUTDOWN]	= 'E',</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static void btrfs_state_to_string(const struct btrfs_fs_info *info, char *buf)</div><div class='add'>+{</div><div class='add'>+	unsigned int bit;</div><div class='add'>+	bool states_printed = false;</div><div class='add'>+	unsigned long fs_state = READ_ONCE(info-&gt;fs_state);</div><div class='add'>+	char *curr = buf;</div><div class='add'>+</div><div class='add'>+	memcpy(curr, STATE_STRING_PREFACE, sizeof(STATE_STRING_PREFACE));</div><div class='add'>+	curr += sizeof(STATE_STRING_PREFACE) - 1;</div><div class='add'>+</div><div class='add'>+	if (BTRFS_FS_ERROR(info)) {</div><div class='add'>+		*curr++ = 'E';</div><div class='add'>+		states_printed = true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for_each_set_bit(bit, &amp;fs_state, sizeof(fs_state)) {</div><div class='add'>+		WARN_ON_ONCE(bit &gt;= BTRFS_FS_STATE_COUNT);</div><div class='add'>+		if ((bit &lt; BTRFS_FS_STATE_COUNT) &amp;&amp; fs_state_chars[bit]) {</div><div class='add'>+			*curr++ = fs_state_chars[bit];</div><div class='add'>+			states_printed = true;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* If no states were printed, reset the buffer */</div><div class='add'>+	if (!states_printed)</div><div class='add'>+		curr = buf;</div><div class='add'>+</div><div class='add'>+	*curr++ = 0;</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Generally the error codes correspond to their respective errors, but there</div><div class='add'>+ * are a few special cases.</div><div class='add'>+ *</div><div class='add'>+ * EUCLEAN: Any sort of corruption that we encounter.  The tree-checker for</div><div class='add'>+ *          instance will return EUCLEAN if any of the blocks are corrupted in</div><div class='add'>+ *          a way that is problematic.  We want to reserve EUCLEAN for these</div><div class='add'>+ *          sort of corruptions.</div><div class='add'>+ *</div><div class='add'>+ * EROFS: If we check BTRFS_FS_STATE_ERROR and fail out with a return error, we</div><div class='add'>+ *        need to use EROFS for this case.  We will have no idea of the</div><div class='add'>+ *        original failure, that will have been reported at the time we tripped</div><div class='add'>+ *        over the error.  Each subsequent error that doesn't have any context</div><div class='add'>+ *        of the original error should use EROFS when handling BTRFS_FS_STATE_ERROR.</div><div class='add'>+ */</div><div class='add'>+const char * __attribute_const__ btrfs_decode_error(int error)</div><div class='add'>+{</div><div class='add'>+	char *errstr = "unknown";</div><div class='add'>+</div><div class='add'>+	switch (error) {</div><div class='add'>+	case -ENOENT:		/* -2 */</div><div class='add'>+		errstr = "No such entry";</div><div class='add'>+		break;</div><div class='add'>+	case -EIO:		/* -5 */</div><div class='add'>+		errstr = "IO failure";</div><div class='add'>+		break;</div><div class='add'>+	case -ENOMEM:		/* -12*/</div><div class='add'>+		errstr = "Out of memory";</div><div class='add'>+		break;</div><div class='add'>+	case -EEXIST:		/* -17 */</div><div class='add'>+		errstr = "Object already exists";</div><div class='add'>+		break;</div><div class='add'>+	case -ENOSPC:		/* -28 */</div><div class='add'>+		errstr = "No space left";</div><div class='add'>+		break;</div><div class='add'>+	case -EROFS:		/* -30 */</div><div class='add'>+		errstr = "Readonly filesystem";</div><div class='add'>+		break;</div><div class='add'>+	case -EOPNOTSUPP:	/* -95 */</div><div class='add'>+		errstr = "Operation not supported";</div><div class='add'>+		break;</div><div class='add'>+	case -EUCLEAN:		/* -117 */</div><div class='add'>+		errstr = "Filesystem corrupted";</div><div class='add'>+		break;</div><div class='add'>+	case -EDQUOT:		/* -122 */</div><div class='add'>+		errstr = "Quota exceeded";</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return errstr;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Decodes expected errors from the caller and invokes the appropriate error</div><div class='add'>+ * response.</div><div class='add'>+ */</div><div class='add'>+__cold</div><div class='add'>+void __btrfs_handle_fs_error(struct btrfs_fs_info *fs_info, const char *function,</div><div class='add'>+		       unsigned int line, int error, const char *fmt, ...)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = fs_info-&gt;sb;</div><div class='add'>+#ifdef CONFIG_PRINTK</div><div class='add'>+	char statestr[STATE_STRING_BUF_LEN];</div><div class='add'>+	const char *errstr;</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_PRINTK_INDEX</div><div class='add'>+	printk_index_subsys_emit(</div><div class='add'>+		"BTRFS: error (device %s%s) in %s:%d: errno=%d %s", KERN_CRIT, fmt);</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Special case: if the error is EROFS, and we're already under</div><div class='add'>+	 * SB_RDONLY, then it is safe here.</div><div class='add'>+	 */</div><div class='add'>+	if (error == -EROFS &amp;&amp; sb_rdonly(sb))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_PRINTK</div><div class='add'>+	errstr = btrfs_decode_error(error);</div><div class='add'>+	btrfs_state_to_string(fs_info, statestr);</div><div class='add'>+	if (fmt) {</div><div class='add'>+		struct va_format vaf;</div><div class='add'>+		va_list args;</div><div class='add'>+</div><div class='add'>+		va_start(args, fmt);</div><div class='add'>+		vaf.fmt = fmt;</div><div class='add'>+		vaf.va = &amp;args;</div><div class='add'>+</div><div class='add'>+		pr_crit("BTRFS: error (device %s%s) in %s:%d: errno=%d %s (%pV)\n",</div><div class='add'>+			sb-&gt;s_id, statestr, function, line, error, errstr, &amp;vaf);</div><div class='add'>+		va_end(args);</div><div class='add'>+	} else {</div><div class='add'>+		pr_crit("BTRFS: error (device %s%s) in %s:%d: errno=%d %s\n",</div><div class='add'>+			sb-&gt;s_id, statestr, function, line, error, errstr);</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Today we only save the error info to memory.  Long term we'll also</div><div class='add'>+	 * send it down to the disk.</div><div class='add'>+	 */</div><div class='add'>+	WRITE_ONCE(fs_info-&gt;fs_error, error);</div><div class='add'>+</div><div class='add'>+	/* Don't go through full error handling during mount. */</div><div class='add'>+	if (!(sb-&gt;s_flags &amp; SB_BORN))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (sb_rdonly(sb))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	btrfs_discard_stop(fs_info);</div><div class='add'>+</div><div class='add'>+	/* Handle error by forcing the filesystem readonly. */</div><div class='add'>+	btrfs_set_sb_rdonly(sb);</div><div class='add'>+	btrfs_info(fs_info, "forced readonly");</div><div class='add'>+	/*</div><div class='add'>+	 * Note that a running device replace operation is not canceled here</div><div class='add'>+	 * although there is no way to update the progress. It would add the</div><div class='add'>+	 * risk of a deadlock, therefore the canceling is omitted. The only</div><div class='add'>+	 * penalty is that some I/O remains active until the procedure</div><div class='add'>+	 * completes. The next time when the filesystem is mounted writable</div><div class='add'>+	 * again, the device replace operation continues.</div><div class='add'>+	 */</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_PRINTK</div><div class='add'>+static const char * const logtypes[] = {</div><div class='add'>+	"emergency",</div><div class='add'>+	"alert",</div><div class='add'>+	"critical",</div><div class='add'>+	"error",</div><div class='add'>+	"warning",</div><div class='add'>+	"notice",</div><div class='add'>+	"info",</div><div class='add'>+	"debug",</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Use one ratelimit state per log level so that a flood of less important</div><div class='add'>+ * messages doesn't cause more important ones to be dropped.</div><div class='add'>+ */</div><div class='add'>+static struct ratelimit_state printk_limits[] = {</div><div class='add'>+	RATELIMIT_STATE_INIT(printk_limits[0], DEFAULT_RATELIMIT_INTERVAL, 100),</div><div class='add'>+	RATELIMIT_STATE_INIT(printk_limits[1], DEFAULT_RATELIMIT_INTERVAL, 100),</div><div class='add'>+	RATELIMIT_STATE_INIT(printk_limits[2], DEFAULT_RATELIMIT_INTERVAL, 100),</div><div class='add'>+	RATELIMIT_STATE_INIT(printk_limits[3], DEFAULT_RATELIMIT_INTERVAL, 100),</div><div class='add'>+	RATELIMIT_STATE_INIT(printk_limits[4], DEFAULT_RATELIMIT_INTERVAL, 100),</div><div class='add'>+	RATELIMIT_STATE_INIT(printk_limits[5], DEFAULT_RATELIMIT_INTERVAL, 100),</div><div class='add'>+	RATELIMIT_STATE_INIT(printk_limits[6], DEFAULT_RATELIMIT_INTERVAL, 100),</div><div class='add'>+	RATELIMIT_STATE_INIT(printk_limits[7], DEFAULT_RATELIMIT_INTERVAL, 100),</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+void __cold _btrfs_printk(const struct btrfs_fs_info *fs_info, const char *fmt, ...)</div><div class='add'>+{</div><div class='add'>+	char lvl[PRINTK_MAX_SINGLE_HEADER_LEN + 1] = "\0";</div><div class='add'>+	struct va_format vaf;</div><div class='add'>+	va_list args;</div><div class='add'>+	int kern_level;</div><div class='add'>+	const char *type = logtypes[4];</div><div class='add'>+	struct ratelimit_state *ratelimit = &amp;printk_limits[4];</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_PRINTK_INDEX</div><div class='add'>+	printk_index_subsys_emit("%sBTRFS %s (device %s): ", NULL, fmt);</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+	va_start(args, fmt);</div><div class='add'>+</div><div class='add'>+	while ((kern_level = printk_get_level(fmt)) != 0) {</div><div class='add'>+		size_t size = printk_skip_level(fmt) - fmt;</div><div class='add'>+</div><div class='add'>+		if (kern_level &gt;= '0' &amp;&amp; kern_level &lt;= '7') {</div><div class='add'>+			memcpy(lvl, fmt,  size);</div><div class='add'>+			lvl[size] = '\0';</div><div class='add'>+			type = logtypes[kern_level - '0'];</div><div class='add'>+			ratelimit = &amp;printk_limits[kern_level - '0'];</div><div class='add'>+		}</div><div class='add'>+		fmt += size;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	vaf.fmt = fmt;</div><div class='add'>+	vaf.va = &amp;args;</div><div class='add'>+</div><div class='add'>+	/* Do not ratelimit if CONFIG_BTRFS_DEBUG is enabled. */</div><div class='add'>+	if (IS_ENABLED(CONFIG_BTRFS_DEBUG) || __ratelimit(ratelimit)) {</div><div class='add'>+		if (fs_info) {</div><div class='add'>+			char statestr[STATE_STRING_BUF_LEN];</div><div class='add'>+</div><div class='add'>+			btrfs_state_to_string(fs_info, statestr);</div><div class='add'>+			_printk("%sBTRFS %s (device %s%s): %pV\n", lvl, type,</div><div class='add'>+				fs_info-&gt;sb-&gt;s_id, statestr, &amp;vaf);</div><div class='add'>+		} else {</div><div class='add'>+			_printk("%sBTRFS %s: %pV\n", lvl, type, &amp;vaf);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	va_end(args);</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+#if BITS_PER_LONG == 32</div><div class='add'>+void __cold btrfs_warn_32bit_limit(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	if (!test_and_set_bit(BTRFS_FS_32BIT_WARN, &amp;fs_info-&gt;flags)) {</div><div class='add'>+		btrfs_warn(fs_info, "reaching 32bit limit for logical addresses");</div><div class='add'>+		btrfs_warn(fs_info,</div><div class='add'>+"due to page cache limit on 32bit systems, btrfs can't access metadata at or beyond %lluT",</div><div class='add'>+			   BTRFS_32BIT_MAX_FILE_SIZE &gt;&gt; 40);</div><div class='add'>+		btrfs_warn(fs_info,</div><div class='add'>+			   "please consider upgrading to 64bit kernel/hardware");</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void __cold btrfs_err_32bit_limit(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	if (!test_and_set_bit(BTRFS_FS_32BIT_ERROR, &amp;fs_info-&gt;flags)) {</div><div class='add'>+		btrfs_err(fs_info, "reached 32bit limit for logical addresses");</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+"due to page cache limit on 32bit systems, metadata beyond %lluT can't be accessed",</div><div class='add'>+			  BTRFS_32BIT_MAX_FILE_SIZE &gt;&gt; 40);</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+			   "please consider upgrading to 64bit kernel/hardware");</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Decode unexpected, fatal errors from the caller, issue an alert, and either</div><div class='add'>+ * panic or BUGs, depending on mount options.</div><div class='add'>+ */</div><div class='add'>+__cold</div><div class='add'>+void __btrfs_panic(const struct btrfs_fs_info *fs_info, const char *function,</div><div class='add'>+		   unsigned int line, int error, const char *fmt, ...)</div><div class='add'>+{</div><div class='add'>+	char *s_id = "&lt;unknown&gt;";</div><div class='add'>+	const char *errstr;</div><div class='add'>+	struct va_format vaf = { .fmt = fmt };</div><div class='add'>+	va_list args;</div><div class='add'>+</div><div class='add'>+	if (fs_info)</div><div class='add'>+		s_id = fs_info-&gt;sb-&gt;s_id;</div><div class='add'>+</div><div class='add'>+	va_start(args, fmt);</div><div class='add'>+	vaf.va = &amp;args;</div><div class='add'>+</div><div class='add'>+	errstr = btrfs_decode_error(error);</div><div class='add'>+	if (fs_info &amp;&amp; (btrfs_test_opt(fs_info, PANIC_ON_FATAL_ERROR)))</div><div class='add'>+		panic(KERN_CRIT "BTRFS panic (device %s) in %s:%d: %pV (errno=%d %s)\n",</div><div class='add'>+			s_id, function, line, &amp;vaf, error, errstr);</div><div class='add'>+</div><div class='add'>+	btrfs_crit(fs_info, "panic in %s:%d: %pV (errno=%d %s)",</div><div class='add'>+		   function, line, &amp;vaf, error, errstr);</div><div class='add'>+	va_end(args);</div><div class='add'>+	/* Caller calls BUG() */</div><div class='add'>+}</div><div class='head'>diff --git a/fs/btrfs/messages.h b/fs/btrfs/messages.h<br/>new file mode 100644<br/>index 000000000000..d8c0bd17dcda<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/messages.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/messages.h</a></div><div class='hunk'>@@ -0,0 +1,220 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+</div><div class='add'>+#ifndef BTRFS_MESSAGES_H</div><div class='add'>+#define BTRFS_MESSAGES_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+#include &lt;linux/printk.h&gt;</div><div class='add'>+#include &lt;linux/bug.h&gt;</div><div class='add'>+</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * We want to be able to override this in btrfs-progs.</div><div class='add'>+ */</div><div class='add'>+#ifdef __KERNEL__</div><div class='add'>+</div><div class='add'>+static inline __printf(2, 3) __cold</div><div class='add'>+void btrfs_no_printk(const struct btrfs_fs_info *fs_info, const char *fmt, ...)</div><div class='add'>+{</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_PRINTK</div><div class='add'>+</div><div class='add'>+#define btrfs_printk(fs_info, fmt, args...)				\</div><div class='add'>+	_btrfs_printk(fs_info, fmt, ##args)</div><div class='add'>+</div><div class='add'>+__printf(2, 3)</div><div class='add'>+__cold</div><div class='add'>+void _btrfs_printk(const struct btrfs_fs_info *fs_info, const char *fmt, ...);</div><div class='add'>+</div><div class='add'>+#else</div><div class='add'>+</div><div class='add'>+#define btrfs_printk(fs_info, fmt, args...) \</div><div class='add'>+	btrfs_no_printk(fs_info, fmt, ##args)</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Print a message with filesystem info, enclosed in RCU protection.</div><div class='add'>+ */</div><div class='add'>+#define btrfs_crit(fs_info, fmt, args...) \</div><div class='add'>+	btrfs_printk_in_rcu(fs_info, KERN_CRIT fmt, ##args)</div><div class='add'>+#define btrfs_err(fs_info, fmt, args...) \</div><div class='add'>+	btrfs_printk_in_rcu(fs_info, KERN_ERR fmt, ##args)</div><div class='add'>+#define btrfs_warn(fs_info, fmt, args...) \</div><div class='add'>+	btrfs_printk_in_rcu(fs_info, KERN_WARNING fmt, ##args)</div><div class='add'>+#define btrfs_info(fs_info, fmt, args...) \</div><div class='add'>+	btrfs_printk_in_rcu(fs_info, KERN_INFO fmt, ##args)</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Wrappers that use a ratelimited printk</div><div class='add'>+ */</div><div class='add'>+#define btrfs_crit_rl(fs_info, fmt, args...) \</div><div class='add'>+	btrfs_printk_rl_in_rcu(fs_info, KERN_CRIT fmt, ##args)</div><div class='add'>+#define btrfs_err_rl(fs_info, fmt, args...) \</div><div class='add'>+	btrfs_printk_rl_in_rcu(fs_info, KERN_ERR fmt, ##args)</div><div class='add'>+#define btrfs_warn_rl(fs_info, fmt, args...) \</div><div class='add'>+	btrfs_printk_rl_in_rcu(fs_info, KERN_WARNING fmt, ##args)</div><div class='add'>+#define btrfs_info_rl(fs_info, fmt, args...) \</div><div class='add'>+	btrfs_printk_rl_in_rcu(fs_info, KERN_INFO fmt, ##args)</div><div class='add'>+</div><div class='add'>+#if defined(CONFIG_DYNAMIC_DEBUG)</div><div class='add'>+#define btrfs_debug(fs_info, fmt, args...)				\</div><div class='add'>+	_dynamic_func_call_no_desc(fmt, btrfs_printk_in_rcu,		\</div><div class='add'>+				   fs_info, KERN_DEBUG fmt, ##args)</div><div class='add'>+#define btrfs_debug_rl(fs_info, fmt, args...)				\</div><div class='add'>+	_dynamic_func_call_no_desc(fmt, btrfs_printk_rl_in_rcu,		\</div><div class='add'>+				   fs_info, KERN_DEBUG fmt, ##args)</div><div class='add'>+#elif defined(DEBUG)</div><div class='add'>+#define btrfs_debug(fs_info, fmt, args...) \</div><div class='add'>+	btrfs_printk_in_rcu(fs_info, KERN_DEBUG fmt, ##args)</div><div class='add'>+#define btrfs_debug_rl(fs_info, fmt, args...) \</div><div class='add'>+	btrfs_printk_rl_in_rcu(fs_info, KERN_DEBUG fmt, ##args)</div><div class='add'>+#else</div><div class='add'>+/* When printk() is no_printk(), expand to no-op. */</div><div class='add'>+#define btrfs_debug(fs_info, fmt, args...)	do { (void)(fs_info); } while(0)</div><div class='add'>+#define btrfs_debug_rl(fs_info, fmt, args...)	do { (void)(fs_info); } while(0)</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+#define btrfs_printk_in_rcu(fs_info, fmt, args...)	\</div><div class='add'>+do {							\</div><div class='add'>+	rcu_read_lock();				\</div><div class='add'>+	btrfs_printk(fs_info, fmt, ##args);		\</div><div class='add'>+	rcu_read_unlock();				\</div><div class='add'>+} while (0)</div><div class='add'>+</div><div class='add'>+#define btrfs_printk_rl_in_rcu(fs_info, fmt, args...)		\</div><div class='add'>+do {								\</div><div class='add'>+	static DEFINE_RATELIMIT_STATE(_rs,			\</div><div class='add'>+		DEFAULT_RATELIMIT_INTERVAL,			\</div><div class='add'>+		DEFAULT_RATELIMIT_BURST);			\</div><div class='add'>+								\</div><div class='add'>+	rcu_read_lock();					\</div><div class='add'>+	if (__ratelimit(&amp;_rs))					\</div><div class='add'>+		btrfs_printk(fs_info, fmt, ##args);		\</div><div class='add'>+	rcu_read_unlock();					\</div><div class='add'>+} while (0)</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BTRFS_ASSERT</div><div class='add'>+</div><div class='add'>+__printf(1, 2)</div><div class='add'>+static inline void verify_assert_printk_format(const char *fmt, ...) {</div><div class='add'>+	/* Stub to verify the assertion format string. */</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Take the first token if any. */</div><div class='add'>+#define __FIRST_ARG(_, ...) _</div><div class='add'>+/*</div><div class='add'>+ * Skip the first token and return the rest, if it's empty the comma is dropped.</div><div class='add'>+ * As ##__VA_ARGS__ cannot be at the beginning of the macro the __VA_OPT__ is needed</div><div class='add'>+ * and supported since GCC 8 and Clang 12.</div><div class='add'>+ */</div><div class='add'>+#define __REST_ARGS(_, ... ) __VA_OPT__(,) __VA_ARGS__</div><div class='add'>+</div><div class='add'>+#if defined(CONFIG_CC_IS_CLANG) || GCC_VERSION &gt;= 80000</div><div class='add'>+/*</div><div class='add'>+ * Assertion with optional printk() format.</div><div class='add'>+ *</div><div class='add'>+ * Accepted syntax:</div><div class='add'>+ * ASSERT(condition);</div><div class='add'>+ * ASSERT(condition, "string");</div><div class='add'>+ * ASSERT(condition, "variable=%d", variable);</div><div class='add'>+ *</div><div class='add'>+ * How it works:</div><div class='add'>+ * - if there's no format string, ""[0] evaluates at compile time to 0 and the</div><div class='add'>+ *   true branch is executed</div><div class='add'>+ * - any non-empty format string with the "" prefix evaluates to != 0 at</div><div class='add'>+ *   compile time and the false branch is executed</div><div class='add'>+ * - stringified condition is printed as %s so we don't accidentally mix format</div><div class='add'>+ *   strings (the % operator)</div><div class='add'>+ * - there can be only one printk() call, so the format strings and arguments are</div><div class='add'>+ *   spliced together:</div><div class='add'>+ *   DEFAULT_FMT [USER_FMT], DEFAULT_ARGS [, USER_ARGS]</div><div class='add'>+ * - comma between DEFAULT_ARGS and USER_ARGS is handled by preprocessor</div><div class='add'>+ *   (requires __VA_OPT__ support)</div><div class='add'>+ * - otherwise we could use __VA_OPT(,) __VA_ARGS__ for the 2nd+ argument of args,</div><div class='add'>+ */</div><div class='add'>+#define ASSERT(cond, args...)							\</div><div class='add'>+do {										\</div><div class='add'>+	verify_assert_printk_format("check the format string" args);		\</div><div class='add'>+	if (!likely(cond)) {							\</div><div class='add'>+		if (("" __FIRST_ARG(args) [0]) == 0) {				\</div><div class='add'>+			pr_err("assertion failed: %s :: %ld, in %s:%d\n",	\</div><div class='add'>+				#cond, (long)(cond), __FILE__, __LINE__);	\</div><div class='add'>+		} else {							\</div><div class='add'>+			pr_err("assertion failed: %s :: %ld, in %s:%d (" __FIRST_ARG(args) ")\n", \</div><div class='add'>+				#cond, (long)(cond), __FILE__, __LINE__ __REST_ARGS(args)); \</div><div class='add'>+		}								\</div><div class='add'>+		BUG();								\</div><div class='add'>+	}									\</div><div class='add'>+} while(0)</div><div class='add'>+</div><div class='add'>+#else</div><div class='add'>+</div><div class='add'>+/* For GCC &lt; 8.x only the simple output. */</div><div class='add'>+</div><div class='add'>+#define ASSERT(cond, args...)							\</div><div class='add'>+do {										\</div><div class='add'>+	verify_assert_printk_format("check the format string" args);		\</div><div class='add'>+	if (!likely(cond)) {							\</div><div class='add'>+		pr_err("assertion failed: %s :: %ld, in %s:%d\n",		\</div><div class='add'>+			#cond, (long)(cond), __FILE__, __LINE__);		\</div><div class='add'>+		BUG();								\</div><div class='add'>+	}									\</div><div class='add'>+} while(0)</div><div class='add'>+</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+#else</div><div class='add'>+/* Compile check the @cond expression but don't generate any code. */</div><div class='add'>+#define ASSERT(cond, args...)			BUILD_BUG_ON_INVALID(cond)</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BTRFS_DEBUG</div><div class='add'>+/* Verbose warning only under debug build. */</div><div class='add'>+#define DEBUG_WARN(args...)			WARN(1, KERN_ERR args)</div><div class='add'>+#else</div><div class='add'>+#define DEBUG_WARN(...)				do {} while(0)</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+__printf(5, 6)</div><div class='add'>+__cold</div><div class='add'>+void __btrfs_handle_fs_error(struct btrfs_fs_info *fs_info, const char *function,</div><div class='add'>+		     unsigned int line, int error, const char *fmt, ...);</div><div class='add'>+</div><div class='add'>+const char * __attribute_const__ btrfs_decode_error(int error);</div><div class='add'>+</div><div class='add'>+#define btrfs_handle_fs_error(fs_info, error, fmt, args...)		\</div><div class='add'>+	__btrfs_handle_fs_error((fs_info), __func__, __LINE__,		\</div><div class='add'>+				(error), fmt, ##args)</div><div class='add'>+</div><div class='add'>+__printf(5, 6)</div><div class='add'>+__cold</div><div class='add'>+void __btrfs_panic(const struct btrfs_fs_info *fs_info, const char *function,</div><div class='add'>+		   unsigned int line, int error, const char *fmt, ...);</div><div class='add'>+/*</div><div class='add'>+ * If BTRFS_MOUNT_PANIC_ON_FATAL_ERROR is in mount_opt, __btrfs_panic</div><div class='add'>+ * will panic().  Otherwise we BUG() here.</div><div class='add'>+ */</div><div class='add'>+#define btrfs_panic(fs_info, error, fmt, args...)			\</div><div class='add'>+do {									\</div><div class='add'>+	__btrfs_panic(fs_info, __func__, __LINE__, error, fmt, ##args);	\</div><div class='add'>+	BUG();								\</div><div class='add'>+} while (0)</div><div class='add'>+</div><div class='add'>+#if BITS_PER_LONG == 32</div><div class='add'>+#define BTRFS_32BIT_MAX_FILE_SIZE (((u64)ULONG_MAX + 1) &lt;&lt; PAGE_SHIFT)</div><div class='add'>+/*</div><div class='add'>+ * The warning threshold is 5/8th of the MAX_LFS_FILESIZE that limits the logical</div><div class='add'>+ * addresses of extents.</div><div class='add'>+ *</div><div class='add'>+ * For 4K page size it's about 10T, for 64K it's 160T.</div><div class='add'>+ */</div><div class='add'>+#define BTRFS_32BIT_EARLY_WARN_THRESHOLD (BTRFS_32BIT_MAX_FILE_SIZE * 5 / 8)</div><div class='add'>+void btrfs_warn_32bit_limit(struct btrfs_fs_info *fs_info);</div><div class='add'>+void btrfs_err_32bit_limit(struct btrfs_fs_info *fs_info);</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+#endif</div><div class='head'>diff --git a/fs/btrfs/misc.h b/fs/btrfs/misc.h<br/>index 340f995652f2..12c5a9d6564f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/misc.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/misc.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/misc.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/misc.h</a></div><div class='hunk'>@@ -3,12 +3,78 @@</div><div class='ctx'> #ifndef BTRFS_MISC_H</div><div class='ctx'> #define BTRFS_MISC_H</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+#include &lt;linux/bitmap.h&gt;</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='ctx'> #include &lt;linux/wait.h&gt;</div><div class='add'>+#include &lt;linux/mm.h&gt;</div><div class='add'>+#include &lt;linux/pagemap.h&gt;</div><div class='ctx'> #include &lt;linux/math64.h&gt;</div><div class='ctx'> #include &lt;linux/rbtree.h&gt;</div><div class='add'>+#include &lt;linux/bio.h&gt;</div><div class='ctx'> </div><div class='del'>-#define in_range(b, first, len) ((b) &gt;= (first) &amp;&amp; (b) &lt; (first) + (len))</div><div class='add'>+/*</div><div class='add'>+ * Convenience macros to define a pointer with the __free(kfree) and</div><div class='add'>+ * __free(kvfree) cleanup attributes and initialized to NULL.</div><div class='add'>+ */</div><div class='add'>+#define AUTO_KFREE(name)       *name __free(kfree) = NULL</div><div class='add'>+#define AUTO_KVFREE(name)      *name __free(kvfree) = NULL</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Enumerate bits using enum autoincrement. Define the @name as the n-th bit.</div><div class='add'>+ */</div><div class='add'>+#define ENUM_BIT(name)                                  \</div><div class='add'>+	__ ## name ## _BIT,                             \</div><div class='add'>+	name = (1U &lt;&lt; __ ## name ## _BIT),              \</div><div class='add'>+	__ ## name ## _SEQ = __ ## name ## _BIT</div><div class='add'>+</div><div class='add'>+static inline phys_addr_t bio_iter_phys(struct bio *bio, struct bvec_iter *iter)</div><div class='add'>+{</div><div class='add'>+	struct bio_vec bv = bio_iter_iovec(bio, *iter);</div><div class='add'>+</div><div class='add'>+	return bvec_phys(&amp;bv);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Iterate bio using btrfs block size.</div><div class='add'>+ *</div><div class='add'>+ * This will handle large folio and highmem.</div><div class='add'>+ *</div><div class='add'>+ * @paddr:	Physical memory address of each iteration</div><div class='add'>+ * @bio:	The bio to iterate</div><div class='add'>+ * @iter:	The bvec_iter (pointer) to use.</div><div class='add'>+ * @blocksize:	The blocksize to iterate.</div><div class='add'>+ *</div><div class='add'>+ * This requires all folios in the bio to cover at least one block.</div><div class='add'>+ */</div><div class='add'>+#define btrfs_bio_for_each_block(paddr, bio, iter, blocksize)		\</div><div class='add'>+	for (; (iter)-&gt;bi_size &amp;&amp;					\</div><div class='add'>+	     (paddr = bio_iter_phys((bio), (iter)), 1);			\</div><div class='add'>+	     bio_advance_iter_single((bio), (iter), (blocksize)))</div><div class='add'>+</div><div class='add'>+/* Initialize a bvec_iter to the size of the specified bio. */</div><div class='add'>+static inline struct bvec_iter init_bvec_iter_for_bio(struct bio *bio)</div><div class='add'>+{</div><div class='add'>+	struct bio_vec *bvec;</div><div class='add'>+	u32 bio_size = 0;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	bio_for_each_bvec_all(bvec, bio, i)</div><div class='add'>+		bio_size += bvec-&gt;bv_len;</div><div class='add'>+</div><div class='add'>+	return (struct bvec_iter) {</div><div class='add'>+		.bi_sector = 0,</div><div class='add'>+		.bi_size = bio_size,</div><div class='add'>+		.bi_idx = 0,</div><div class='add'>+		.bi_bvec_done = 0,</div><div class='add'>+	};</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define btrfs_bio_for_each_block_all(paddr, bio, blocksize)		\</div><div class='add'>+	for (struct bvec_iter iter = init_bvec_iter_for_bio(bio);	\</div><div class='add'>+	     (iter).bi_size &amp;&amp;						\</div><div class='add'>+	     (paddr = bio_iter_phys((bio), &amp;(iter)), 1);		\</div><div class='add'>+	     bio_advance_iter_single((bio), &amp;(iter), (blocksize)))</div><div class='ctx'> </div><div class='ctx'> static inline void cond_wake_up(struct wait_queue_head *wq)</div><div class='ctx'> {</div><div class='hunk'>@@ -32,22 +98,10 @@ static inline void cond_wake_up_nomb(struct wait_queue_head *wq)</div><div class='ctx'> 		wake_up(wq);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u64 div_factor(u64 num, int factor)</div><div class='add'>+static inline u64 mult_perc(u64 num, u32 percent)</div><div class='ctx'> {</div><div class='del'>-	if (factor == 10)</div><div class='del'>-		return num;</div><div class='del'>-	num *= factor;</div><div class='del'>-	return div_u64(num, 10);</div><div class='add'>+	return div_u64(num * percent, 100);</div><div class='ctx'> }</div><div class='del'>-</div><div class='del'>-static inline u64 div_factor_fine(u64 num, int factor)</div><div class='del'>-{</div><div class='del'>-	if (factor == 100)</div><div class='del'>-		return num;</div><div class='del'>-	num *= factor;</div><div class='del'>-	return div_u64(num, 100);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /* Copy of is_power_of_two that is 64bit safe */</div><div class='ctx'> static inline bool is_power_of_two_u64(u64 n)</div><div class='ctx'> {</div><div class='hunk'>@@ -70,7 +124,7 @@ struct rb_simple_node {</div><div class='ctx'> 	u64 bytenr;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static inline struct rb_node *rb_simple_search(struct rb_root *root, u64 bytenr)</div><div class='add'>+static inline struct rb_node *rb_simple_search(const struct rb_root *root, u64 bytenr)</div><div class='ctx'> {</div><div class='ctx'> 	struct rb_node *node = root-&gt;rb_node;</div><div class='ctx'> 	struct rb_simple_node *entry;</div><div class='hunk'>@@ -88,28 +142,78 @@ static inline struct rb_node *rb_simple_search(struct rb_root *root, u64 bytenr)</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline struct rb_node *rb_simple_insert(struct rb_root *root, u64 bytenr,</div><div class='del'>-					       struct rb_node *node)</div><div class='add'>+/*</div><div class='add'>+ * Search @root from an entry that starts or comes after @bytenr.</div><div class='add'>+ *</div><div class='add'>+ * @root:	the root to search.</div><div class='add'>+ * @bytenr:	bytenr to search from.</div><div class='add'>+ *</div><div class='add'>+ * Return the rb_node that start at or after @bytenr.  If there is no entry at</div><div class='add'>+ * or after @bytner return NULL.</div><div class='add'>+ */</div><div class='add'>+static inline struct rb_node *rb_simple_search_first(const struct rb_root *root,</div><div class='add'>+						     u64 bytenr)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node **p = &amp;root-&gt;rb_node;</div><div class='del'>-	struct rb_node *parent = NULL;</div><div class='del'>-	struct rb_simple_node *entry;</div><div class='add'>+	struct rb_node *node = root-&gt;rb_node, *ret = NULL;</div><div class='add'>+	struct rb_simple_node *entry, *ret_entry = NULL;</div><div class='ctx'> </div><div class='del'>-	while (*p) {</div><div class='del'>-		parent = *p;</div><div class='del'>-		entry = rb_entry(parent, struct rb_simple_node, rb_node);</div><div class='add'>+	while (node) {</div><div class='add'>+		entry = rb_entry(node, struct rb_simple_node, rb_node);</div><div class='ctx'> </div><div class='del'>-		if (bytenr &lt; entry-&gt;bytenr)</div><div class='del'>-			p = &amp;(*p)-&gt;rb_left;</div><div class='del'>-		else if (bytenr &gt; entry-&gt;bytenr)</div><div class='del'>-			p = &amp;(*p)-&gt;rb_right;</div><div class='del'>-		else</div><div class='del'>-			return parent;</div><div class='add'>+		if (bytenr &lt; entry-&gt;bytenr) {</div><div class='add'>+			if (!ret || entry-&gt;bytenr &lt; ret_entry-&gt;bytenr) {</div><div class='add'>+				ret = node;</div><div class='add'>+				ret_entry = entry;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			node = node-&gt;rb_left;</div><div class='add'>+		} else if (bytenr &gt; entry-&gt;bytenr) {</div><div class='add'>+			node = node-&gt;rb_right;</div><div class='add'>+		} else {</div><div class='add'>+			return node;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	rb_link_node(node, parent, p);</div><div class='del'>-	rb_insert_color(node, root);</div><div class='del'>-	return NULL;</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int rb_simple_node_bytenr_cmp(struct rb_node *new, const struct rb_node *existing)</div><div class='add'>+{</div><div class='add'>+	struct rb_simple_node *new_entry = rb_entry(new, struct rb_simple_node, rb_node);</div><div class='add'>+	struct rb_simple_node *existing_entry = rb_entry(existing, struct rb_simple_node, rb_node);</div><div class='add'>+</div><div class='add'>+	if (new_entry-&gt;bytenr &lt; existing_entry-&gt;bytenr)</div><div class='add'>+		return -1;</div><div class='add'>+	else if (new_entry-&gt;bytenr &gt; existing_entry-&gt;bytenr)</div><div class='add'>+		return 1;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline struct rb_node *rb_simple_insert(struct rb_root *root,</div><div class='add'>+					       struct rb_simple_node *simple_node)</div><div class='add'>+{</div><div class='add'>+	return rb_find_add(&amp;simple_node-&gt;rb_node, root, rb_simple_node_bytenr_cmp);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool bitmap_test_range_all_set(const unsigned long *addr,</div><div class='add'>+					     unsigned long start,</div><div class='add'>+					     unsigned long nbits)</div><div class='add'>+{</div><div class='add'>+	unsigned long found_zero;</div><div class='add'>+</div><div class='add'>+	found_zero = find_next_zero_bit(addr, start + nbits, start);</div><div class='add'>+	return (found_zero == start + nbits);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool bitmap_test_range_all_zero(const unsigned long *addr,</div><div class='add'>+					      unsigned long start,</div><div class='add'>+					      unsigned long nbits)</div><div class='add'>+{</div><div class='add'>+	unsigned long found_set;</div><div class='add'>+</div><div class='add'>+	found_set = find_next_bit(addr, start + nbits, start);</div><div class='add'>+	return (found_set == start + nbits);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/btrfs/ordered-data.c b/fs/btrfs/ordered-data.c<br/>index 6b51fd2ec5ac..5df02c707aee 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/ordered-data.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/ordered-data.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/ordered-data.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/ordered-data.c</a></div><div class='hunk'>@@ -7,6 +7,7 @@</div><div class='ctx'> #include &lt;linux/blkdev.h&gt;</div><div class='ctx'> #include &lt;linux/writeback.h&gt;</div><div class='ctx'> #include &lt;linux/sched/mm.h&gt;</div><div class='add'>+#include "messages.h"</div><div class='ctx'> #include "misc.h"</div><div class='ctx'> #include "ctree.h"</div><div class='ctx'> #include "transaction.h"</div><div class='hunk'>@@ -17,6 +18,8 @@</div><div class='ctx'> #include "delalloc-space.h"</div><div class='ctx'> #include "qgroup.h"</div><div class='ctx'> #include "subpage.h"</div><div class='add'>+#include "file.h"</div><div class='add'>+#include "block-group.h"</div><div class='ctx'> </div><div class='ctx'> static struct kmem_cache *btrfs_ordered_extent_cache;</div><div class='ctx'> </div><div class='hunk'>@@ -108,8 +111,8 @@ static struct rb_node *__tree_search(struct rb_root *root, u64 file_offset,</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int range_overlaps(struct btrfs_ordered_extent *entry, u64 file_offset,</div><div class='del'>-			  u64 len)</div><div class='add'>+static int btrfs_range_overlaps(struct btrfs_ordered_extent *entry, u64 file_offset,</div><div class='add'>+				u64 len)</div><div class='ctx'> {</div><div class='ctx'> 	if (file_offset + len &lt;= entry-&gt;file_offset ||</div><div class='ctx'> 	    entry-&gt;file_offset + entry-&gt;num_bytes &lt;= file_offset)</div><div class='hunk'>@@ -121,107 +124,127 @@ static int range_overlaps(struct btrfs_ordered_extent *entry, u64 file_offset,</div><div class='ctx'>  * look find the first ordered struct that has this offset, otherwise</div><div class='ctx'>  * the first one less than this offset</div><div class='ctx'>  */</div><div class='del'>-static inline struct rb_node *tree_search(struct btrfs_ordered_inode_tree *tree,</div><div class='del'>-					  u64 file_offset)</div><div class='add'>+static inline struct rb_node *ordered_tree_search(struct btrfs_inode *inode,</div><div class='add'>+						  u64 file_offset)</div><div class='ctx'> {</div><div class='del'>-	struct rb_root *root = &amp;tree-&gt;tree;</div><div class='ctx'> 	struct rb_node *prev = NULL;</div><div class='ctx'> 	struct rb_node *ret;</div><div class='ctx'> 	struct btrfs_ordered_extent *entry;</div><div class='ctx'> </div><div class='del'>-	if (tree-&gt;last) {</div><div class='del'>-		entry = rb_entry(tree-&gt;last, struct btrfs_ordered_extent,</div><div class='add'>+	if (inode-&gt;ordered_tree_last) {</div><div class='add'>+		entry = rb_entry(inode-&gt;ordered_tree_last, struct btrfs_ordered_extent,</div><div class='ctx'> 				 rb_node);</div><div class='ctx'> 		if (in_range(file_offset, entry-&gt;file_offset, entry-&gt;num_bytes))</div><div class='del'>-			return tree-&gt;last;</div><div class='add'>+			return inode-&gt;ordered_tree_last;</div><div class='ctx'> 	}</div><div class='del'>-	ret = __tree_search(root, file_offset, &amp;prev);</div><div class='add'>+	ret = __tree_search(&amp;inode-&gt;ordered_tree, file_offset, &amp;prev);</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		ret = prev;</div><div class='ctx'> 	if (ret)</div><div class='del'>-		tree-&gt;last = ret;</div><div class='add'>+		inode-&gt;ordered_tree_last = ret;</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Allocate and add a new ordered_extent into the per-inode tree.</div><div class='del'>- *</div><div class='del'>- * The tree is given a single reference on the ordered extent that was</div><div class='del'>- * inserted.</div><div class='del'>- */</div><div class='del'>-static int __btrfs_add_ordered_extent(struct btrfs_inode *inode, u64 file_offset,</div><div class='del'>-				      u64 disk_bytenr, u64 num_bytes,</div><div class='del'>-				      u64 disk_num_bytes, int type, int dio,</div><div class='del'>-				      int compress_type)</div><div class='add'>+static struct btrfs_ordered_extent *alloc_ordered_extent(</div><div class='add'>+			struct btrfs_inode *inode, u64 file_offset, u64 num_bytes,</div><div class='add'>+			u64 ram_bytes, u64 disk_bytenr, u64 disk_num_bytes,</div><div class='add'>+			u64 offset, unsigned long flags, int compress_type)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *root = inode-&gt;root;</div><div class='del'>-	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='del'>-	struct btrfs_ordered_inode_tree *tree = &amp;inode-&gt;ordered_tree;</div><div class='del'>-	struct rb_node *node;</div><div class='ctx'> 	struct btrfs_ordered_extent *entry;</div><div class='ctx'> 	int ret;</div><div class='add'>+	u64 qgroup_rsv = 0;</div><div class='add'>+	const bool is_nocow = (flags &amp;</div><div class='add'>+	       ((1U &lt;&lt; BTRFS_ORDERED_NOCOW) | (1U &lt;&lt; BTRFS_ORDERED_PREALLOC)));</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * For a NOCOW write we can free the qgroup reserve right now. For a COW</div><div class='add'>+	 * one we transfer the reserved space from the inode's iotree into the</div><div class='add'>+	 * ordered extent by calling btrfs_qgroup_release_data() and tracking</div><div class='add'>+	 * the qgroup reserved amount in the ordered extent, so that later after</div><div class='add'>+	 * completing the ordered extent, when running the data delayed ref it</div><div class='add'>+	 * creates, we free the reserved data with btrfs_qgroup_free_refroot().</div><div class='add'>+	 */</div><div class='add'>+	if (is_nocow)</div><div class='add'>+		ret = btrfs_qgroup_free_data(inode, NULL, file_offset, num_bytes, &amp;qgroup_rsv);</div><div class='add'>+	else</div><div class='add'>+		ret = btrfs_qgroup_release_data(inode, file_offset, num_bytes, &amp;qgroup_rsv);</div><div class='add'>+</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ERR_PTR(ret);</div><div class='ctx'> </div><div class='del'>-	if (type == BTRFS_ORDERED_NOCOW || type == BTRFS_ORDERED_PREALLOC) {</div><div class='del'>-		/* For nocow write, we can release the qgroup rsv right now */</div><div class='del'>-		ret = btrfs_qgroup_free_data(inode, NULL, file_offset, num_bytes);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			return ret;</div><div class='del'>-		ret = 0;</div><div class='del'>-	} else {</div><div class='del'>-		/*</div><div class='del'>-		 * The ordered extent has reserved qgroup space, release now</div><div class='del'>-		 * and pass the reserved number for qgroup_record to free.</div><div class='del'>-		 */</div><div class='del'>-		ret = btrfs_qgroup_release_data(inode, file_offset, num_bytes);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			return ret;</div><div class='del'>-	}</div><div class='ctx'> 	entry = kmem_cache_zalloc(btrfs_ordered_extent_cache, GFP_NOFS);</div><div class='del'>-	if (!entry)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	if (!entry) {</div><div class='add'>+		entry = ERR_PTR(-ENOMEM);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	entry-&gt;file_offset = file_offset;</div><div class='del'>-	entry-&gt;disk_bytenr = disk_bytenr;</div><div class='ctx'> 	entry-&gt;num_bytes = num_bytes;</div><div class='add'>+	entry-&gt;ram_bytes = ram_bytes;</div><div class='add'>+	entry-&gt;disk_bytenr = disk_bytenr;</div><div class='ctx'> 	entry-&gt;disk_num_bytes = disk_num_bytes;</div><div class='add'>+	entry-&gt;offset = offset;</div><div class='ctx'> 	entry-&gt;bytes_left = num_bytes;</div><div class='del'>-	entry-&gt;inode = igrab(&amp;inode-&gt;vfs_inode);</div><div class='add'>+	if (WARN_ON_ONCE(!igrab(&amp;inode-&gt;vfs_inode))) {</div><div class='add'>+		kmem_cache_free(btrfs_ordered_extent_cache, entry);</div><div class='add'>+		entry = ERR_PTR(-ESTALE);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	entry-&gt;inode = inode;</div><div class='ctx'> 	entry-&gt;compress_type = compress_type;</div><div class='ctx'> 	entry-&gt;truncated_len = (u64)-1;</div><div class='del'>-	entry-&gt;qgroup_rsv = ret;</div><div class='del'>-	entry-&gt;physical = (u64)-1;</div><div class='del'>-</div><div class='del'>-	ASSERT(type == BTRFS_ORDERED_REGULAR ||</div><div class='del'>-	       type == BTRFS_ORDERED_NOCOW ||</div><div class='del'>-	       type == BTRFS_ORDERED_PREALLOC ||</div><div class='del'>-	       type == BTRFS_ORDERED_COMPRESSED);</div><div class='del'>-	set_bit(type, &amp;entry-&gt;flags);</div><div class='del'>-</div><div class='del'>-	percpu_counter_add_batch(&amp;fs_info-&gt;ordered_bytes, num_bytes,</div><div class='del'>-				 fs_info-&gt;delalloc_batch);</div><div class='del'>-</div><div class='del'>-	if (dio)</div><div class='del'>-		set_bit(BTRFS_ORDERED_DIRECT, &amp;entry-&gt;flags);</div><div class='del'>-</div><div class='del'>-	/* one ref for the tree */</div><div class='add'>+	entry-&gt;qgroup_rsv = qgroup_rsv;</div><div class='add'>+	entry-&gt;flags = flags;</div><div class='ctx'> 	refcount_set(&amp;entry-&gt;refs, 1);</div><div class='ctx'> 	init_waitqueue_head(&amp;entry-&gt;wait);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;entry-&gt;list);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;entry-&gt;log_list);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;entry-&gt;root_extent_list);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;entry-&gt;work_list);</div><div class='add'>+	INIT_LIST_HEAD(&amp;entry-&gt;bioc_list);</div><div class='ctx'> 	init_completion(&amp;entry-&gt;completion);</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * We don't need the count_max_extents here, we can assume that all of</div><div class='add'>+	 * that work has been done at higher layers, so this is truly the</div><div class='add'>+	 * smallest the extent is going to get.</div><div class='add'>+	 */</div><div class='add'>+	spin_lock(&amp;inode-&gt;lock);</div><div class='add'>+	btrfs_mod_outstanding_extents(inode, 1);</div><div class='add'>+	spin_unlock(&amp;inode-&gt;lock);</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	if (IS_ERR(entry) &amp;&amp; !is_nocow)</div><div class='add'>+		btrfs_qgroup_free_refroot(inode-&gt;root-&gt;fs_info,</div><div class='add'>+					  btrfs_root_id(inode-&gt;root),</div><div class='add'>+					  qgroup_rsv, BTRFS_QGROUP_RSV_DATA);</div><div class='add'>+</div><div class='add'>+	return entry;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void insert_ordered_extent(struct btrfs_ordered_extent *entry)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_inode *inode = entry-&gt;inode;</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+	struct rb_node *node;</div><div class='add'>+</div><div class='ctx'> 	trace_btrfs_ordered_extent_add(inode, entry);</div><div class='ctx'> </div><div class='del'>-	spin_lock_irq(&amp;tree-&gt;lock);</div><div class='del'>-	node = tree_insert(&amp;tree-&gt;tree, file_offset,</div><div class='add'>+	percpu_counter_add_batch(&amp;fs_info-&gt;ordered_bytes, entry-&gt;num_bytes,</div><div class='add'>+				 fs_info-&gt;delalloc_batch);</div><div class='add'>+</div><div class='add'>+	/* One ref for the tree. */</div><div class='add'>+	refcount_inc(&amp;entry-&gt;refs);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;inode-&gt;ordered_tree_lock);</div><div class='add'>+	node = tree_insert(&amp;inode-&gt;ordered_tree, entry-&gt;file_offset,</div><div class='ctx'> 			   &amp;entry-&gt;rb_node);</div><div class='del'>-	if (node)</div><div class='add'>+	if (unlikely(node))</div><div class='ctx'> 		btrfs_panic(fs_info, -EEXIST,</div><div class='ctx'> 				"inconsistency in ordered tree at offset %llu",</div><div class='del'>-				file_offset);</div><div class='del'>-	spin_unlock_irq(&amp;tree-&gt;lock);</div><div class='add'>+				entry-&gt;file_offset);</div><div class='add'>+	spin_unlock(&amp;inode-&gt;ordered_tree_lock);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;root-&gt;ordered_extent_lock);</div><div class='ctx'> 	list_add_tail(&amp;entry-&gt;root_extent_list,</div><div class='hunk'>@@ -234,52 +257,65 @@ static int __btrfs_add_ordered_extent(struct btrfs_inode *inode, u64 file_offset</div><div class='ctx'> 		spin_unlock(&amp;fs_info-&gt;ordered_root_lock);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;root-&gt;ordered_extent_lock);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * We don't need the count_max_extents here, we can assume that all of</div><div class='del'>-	 * that work has been done at higher layers, so this is truly the</div><div class='del'>-	 * smallest the extent is going to get.</div><div class='del'>-	 */</div><div class='del'>-	spin_lock(&amp;inode-&gt;lock);</div><div class='del'>-	btrfs_mod_outstanding_extents(inode, 1);</div><div class='del'>-	spin_unlock(&amp;inode-&gt;lock);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_add_ordered_extent(struct btrfs_inode *inode, u64 file_offset,</div><div class='del'>-			     u64 disk_bytenr, u64 num_bytes, u64 disk_num_bytes,</div><div class='del'>-			     int type)</div><div class='add'>+/*</div><div class='add'>+ * Add an ordered extent to the per-inode tree.</div><div class='add'>+ *</div><div class='add'>+ * @inode:           Inode that this extent is for.</div><div class='add'>+ * @file_offset:     Logical offset in file where the extent starts.</div><div class='add'>+ * @num_bytes:       Logical length of extent in file.</div><div class='add'>+ * @ram_bytes:       Full length of unencoded data.</div><div class='add'>+ * @disk_bytenr:     Offset of extent on disk.</div><div class='add'>+ * @disk_num_bytes:  Size of extent on disk.</div><div class='add'>+ * @offset:          Offset into unencoded data where file data starts.</div><div class='add'>+ * @flags:           Flags specifying type of extent (1U &lt;&lt; BTRFS_ORDERED_*).</div><div class='add'>+ * @compress_type:   Compression algorithm used for data.</div><div class='add'>+ *</div><div class='add'>+ * Most of these parameters correspond to &amp;struct btrfs_file_extent_item. The</div><div class='add'>+ * tree is given a single reference on the ordered extent that was inserted, and</div><div class='add'>+ * the returned pointer is given a second reference.</div><div class='add'>+ *</div><div class='add'>+ * Return: the new ordered extent or error pointer.</div><div class='add'>+ */</div><div class='add'>+struct btrfs_ordered_extent *btrfs_alloc_ordered_extent(</div><div class='add'>+			struct btrfs_inode *inode, u64 file_offset,</div><div class='add'>+			const struct btrfs_file_extent *file_extent, unsigned long flags)</div><div class='ctx'> {</div><div class='del'>-	ASSERT(type == BTRFS_ORDERED_REGULAR ||</div><div class='del'>-	       type == BTRFS_ORDERED_NOCOW ||</div><div class='del'>-	       type == BTRFS_ORDERED_PREALLOC);</div><div class='del'>-	return __btrfs_add_ordered_extent(inode, file_offset, disk_bytenr,</div><div class='del'>-					  num_bytes, disk_num_bytes, type, 0,</div><div class='del'>-					  BTRFS_COMPRESS_NONE);</div><div class='del'>-}</div><div class='add'>+	struct btrfs_ordered_extent *entry;</div><div class='ctx'> </div><div class='del'>-int btrfs_add_ordered_extent_dio(struct btrfs_inode *inode, u64 file_offset,</div><div class='del'>-				 u64 disk_bytenr, u64 num_bytes,</div><div class='del'>-				 u64 disk_num_bytes, int type)</div><div class='del'>-{</div><div class='del'>-	ASSERT(type == BTRFS_ORDERED_REGULAR ||</div><div class='del'>-	       type == BTRFS_ORDERED_NOCOW ||</div><div class='del'>-	       type == BTRFS_ORDERED_PREALLOC);</div><div class='del'>-	return __btrfs_add_ordered_extent(inode, file_offset, disk_bytenr,</div><div class='del'>-					  num_bytes, disk_num_bytes, type, 1,</div><div class='del'>-					  BTRFS_COMPRESS_NONE);</div><div class='del'>-}</div><div class='add'>+	ASSERT((flags &amp; ~BTRFS_ORDERED_TYPE_FLAGS) == 0);</div><div class='ctx'> </div><div class='del'>-int btrfs_add_ordered_extent_compress(struct btrfs_inode *inode, u64 file_offset,</div><div class='del'>-				      u64 disk_bytenr, u64 num_bytes,</div><div class='del'>-				      u64 disk_num_bytes, int compress_type)</div><div class='del'>-{</div><div class='del'>-	ASSERT(compress_type != BTRFS_COMPRESS_NONE);</div><div class='del'>-	return __btrfs_add_ordered_extent(inode, file_offset, disk_bytenr,</div><div class='del'>-					  num_bytes, disk_num_bytes,</div><div class='del'>-					  BTRFS_ORDERED_COMPRESSED, 0,</div><div class='del'>-					  compress_type);</div><div class='add'>+	/*</div><div class='add'>+	 * For regular writes, we just use the members in @file_extent.</div><div class='add'>+	 *</div><div class='add'>+	 * For NOCOW, we don't really care about the numbers except @start and</div><div class='add'>+	 * file_extent-&gt;num_bytes, as we won't insert a file extent item at all.</div><div class='add'>+	 *</div><div class='add'>+	 * For PREALLOC, we do not use ordered extent members, but</div><div class='add'>+	 * btrfs_mark_extent_written() handles everything.</div><div class='add'>+	 *</div><div class='add'>+	 * So here we always pass 0 as offset for NOCOW/PREALLOC ordered extents,</div><div class='add'>+	 * or btrfs_split_ordered_extent() cannot handle it correctly.</div><div class='add'>+	 */</div><div class='add'>+	if (flags &amp; ((1U &lt;&lt; BTRFS_ORDERED_NOCOW) | (1U &lt;&lt; BTRFS_ORDERED_PREALLOC)))</div><div class='add'>+		entry = alloc_ordered_extent(inode, file_offset,</div><div class='add'>+					     file_extent-&gt;num_bytes,</div><div class='add'>+					     file_extent-&gt;num_bytes,</div><div class='add'>+					     file_extent-&gt;disk_bytenr + file_extent-&gt;offset,</div><div class='add'>+					     file_extent-&gt;num_bytes, 0, flags,</div><div class='add'>+					     file_extent-&gt;compression);</div><div class='add'>+	else</div><div class='add'>+		entry = alloc_ordered_extent(inode, file_offset,</div><div class='add'>+					     file_extent-&gt;num_bytes,</div><div class='add'>+					     file_extent-&gt;ram_bytes,</div><div class='add'>+					     file_extent-&gt;disk_bytenr,</div><div class='add'>+					     file_extent-&gt;disk_num_bytes,</div><div class='add'>+					     file_extent-&gt;offset, flags,</div><div class='add'>+					     file_extent-&gt;compression);</div><div class='add'>+	if (!IS_ERR(entry))</div><div class='add'>+		insert_ordered_extent(entry);</div><div class='add'>+	return entry;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -290,58 +326,172 @@ int btrfs_add_ordered_extent_compress(struct btrfs_inode *inode, u64 file_offset</div><div class='ctx'> void btrfs_add_ordered_sum(struct btrfs_ordered_extent *entry,</div><div class='ctx'> 			   struct btrfs_ordered_sum *sum)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_ordered_inode_tree *tree;</div><div class='add'>+	struct btrfs_inode *inode = entry-&gt;inode;</div><div class='ctx'> </div><div class='del'>-	tree = &amp;BTRFS_I(entry-&gt;inode)-&gt;ordered_tree;</div><div class='del'>-	spin_lock_irq(&amp;tree-&gt;lock);</div><div class='add'>+	spin_lock(&amp;inode-&gt;ordered_tree_lock);</div><div class='ctx'> 	list_add_tail(&amp;sum-&gt;list, &amp;entry-&gt;list);</div><div class='del'>-	spin_unlock_irq(&amp;tree-&gt;lock);</div><div class='add'>+	spin_unlock(&amp;inode-&gt;ordered_tree_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_mark_ordered_extent_error(struct btrfs_ordered_extent *ordered)</div><div class='add'>+{</div><div class='add'>+	if (!test_and_set_bit(BTRFS_ORDERED_IOERR, &amp;ordered-&gt;flags))</div><div class='add'>+		mapping_set_error(ordered-&gt;inode-&gt;vfs_inode.i_mapping, -EIO);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void finish_ordered_fn(struct btrfs_work *work)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_ordered_extent *ordered_extent;</div><div class='add'>+</div><div class='add'>+	ordered_extent = container_of(work, struct btrfs_ordered_extent, work);</div><div class='add'>+	btrfs_finish_ordered_io(ordered_extent);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool can_finish_ordered_extent(struct btrfs_ordered_extent *ordered,</div><div class='add'>+				      struct folio *folio, u64 file_offset,</div><div class='add'>+				      u64 len, bool uptodate)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_inode *inode = ordered-&gt;inode;</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held(&amp;inode-&gt;ordered_tree_lock);</div><div class='add'>+</div><div class='add'>+	if (folio) {</div><div class='add'>+		ASSERT(folio-&gt;mapping);</div><div class='add'>+		ASSERT(folio_pos(folio) &lt;= file_offset);</div><div class='add'>+		ASSERT(file_offset + len &lt;= folio_next_pos(folio));</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Ordered flag indicates whether we still have</div><div class='add'>+		 * pending io unfinished for the ordered extent.</div><div class='add'>+		 *</div><div class='add'>+		 * If it's not set, we need to skip to next range.</div><div class='add'>+		 */</div><div class='add'>+		if (!btrfs_folio_test_ordered(fs_info, folio, file_offset, len))</div><div class='add'>+			return false;</div><div class='add'>+		btrfs_folio_clear_ordered(fs_info, folio, file_offset, len);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Now we're fine to update the accounting. */</div><div class='add'>+	if (WARN_ON_ONCE(len &gt; ordered-&gt;bytes_left)) {</div><div class='add'>+		btrfs_crit(fs_info,</div><div class='add'>+"bad ordered extent accounting, root=%llu ino=%llu OE offset=%llu OE len=%llu to_dec=%llu left=%llu",</div><div class='add'>+			   btrfs_root_id(inode-&gt;root), btrfs_ino(inode),</div><div class='add'>+			   ordered-&gt;file_offset, ordered-&gt;num_bytes,</div><div class='add'>+			   len, ordered-&gt;bytes_left);</div><div class='add'>+		ordered-&gt;bytes_left = 0;</div><div class='add'>+	} else {</div><div class='add'>+		ordered-&gt;bytes_left -= len;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!uptodate)</div><div class='add'>+		set_bit(BTRFS_ORDERED_IOERR, &amp;ordered-&gt;flags);</div><div class='add'>+</div><div class='add'>+	if (ordered-&gt;bytes_left)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * All the IO of the ordered extent is finished, we need to queue</div><div class='add'>+	 * the finish_func to be executed.</div><div class='add'>+	 */</div><div class='add'>+	set_bit(BTRFS_ORDERED_IO_DONE, &amp;ordered-&gt;flags);</div><div class='add'>+	cond_wake_up(&amp;ordered-&gt;wait);</div><div class='add'>+	refcount_inc(&amp;ordered-&gt;refs);</div><div class='add'>+	trace_btrfs_ordered_extent_mark_finished(inode, ordered);</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void btrfs_queue_ordered_fn(struct btrfs_ordered_extent *ordered)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_inode *inode = ordered-&gt;inode;</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='add'>+	struct btrfs_workqueue *wq = btrfs_is_free_space_inode(inode) ?</div><div class='add'>+		fs_info-&gt;endio_freespace_worker : fs_info-&gt;endio_write_workers;</div><div class='add'>+</div><div class='add'>+	btrfs_init_work(&amp;ordered-&gt;work, finish_ordered_fn, NULL);</div><div class='add'>+	btrfs_queue_work(wq, &amp;ordered-&gt;work);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_finish_ordered_extent(struct btrfs_ordered_extent *ordered,</div><div class='add'>+				 struct folio *folio, u64 file_offset, u64 len,</div><div class='add'>+				 bool uptodate)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_inode *inode = ordered-&gt;inode;</div><div class='add'>+	bool ret;</div><div class='add'>+</div><div class='add'>+	trace_btrfs_finish_ordered_extent(inode, file_offset, len, uptodate);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;inode-&gt;ordered_tree_lock);</div><div class='add'>+	ret = can_finish_ordered_extent(ordered, folio, file_offset, len,</div><div class='add'>+					uptodate);</div><div class='add'>+	spin_unlock(&amp;inode-&gt;ordered_tree_lock);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If this is a COW write it means we created new extent maps for the</div><div class='add'>+	 * range and they point to unwritten locations if we got an error either</div><div class='add'>+	 * before submitting a bio or during IO.</div><div class='add'>+	 *</div><div class='add'>+	 * We have marked the ordered extent with BTRFS_ORDERED_IOERR, and we</div><div class='add'>+	 * are queuing its completion below. During completion, at</div><div class='add'>+	 * btrfs_finish_one_ordered(), we will drop the extent maps for the</div><div class='add'>+	 * unwritten extents.</div><div class='add'>+	 *</div><div class='add'>+	 * However because completion runs in a work queue we can end up having</div><div class='add'>+	 * a fast fsync running before that. In the case of direct IO, once we</div><div class='add'>+	 * unlock the inode the fsync might start, and we queue the completion</div><div class='add'>+	 * before unlocking the inode. In the case of buffered IO when writeback</div><div class='add'>+	 * finishes (end_bbio_data_write()) we queue the completion, so if the</div><div class='add'>+	 * writeback was triggered by a fast fsync, the fsync might start</div><div class='add'>+	 * logging before ordered extent completion runs in the work queue.</div><div class='add'>+	 *</div><div class='add'>+	 * The fast fsync will log file extent items based on the extent maps it</div><div class='add'>+	 * finds, so if by the time it collects extent maps the ordered extent</div><div class='add'>+	 * completion didn't happen yet, it will log file extent items that</div><div class='add'>+	 * point to unwritten extents, resulting in a corruption if a crash</div><div class='add'>+	 * happens and the log tree is replayed. Note that a fast fsync does not</div><div class='add'>+	 * wait for completion of ordered extents in order to reduce latency.</div><div class='add'>+	 *</div><div class='add'>+	 * Set a flag in the inode so that the next fast fsync will wait for</div><div class='add'>+	 * ordered extents to complete before starting to log.</div><div class='add'>+	 */</div><div class='add'>+	if (!uptodate &amp;&amp; !test_bit(BTRFS_ORDERED_NOCOW, &amp;ordered-&gt;flags))</div><div class='add'>+		set_bit(BTRFS_INODE_COW_WRITE_ERROR, &amp;inode-&gt;runtime_flags);</div><div class='add'>+</div><div class='add'>+	if (ret)</div><div class='add'>+		btrfs_queue_ordered_fn(ordered);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Mark all ordered extents io inside the specified range finished.</div><div class='ctx'>  *</div><div class='del'>- * @page:	 The invovled page for the opeartion.</div><div class='del'>- *		 For uncompressed buffered IO, the page status also needs to be</div><div class='add'>+ * @folio:	 The involved folio for the operation.</div><div class='add'>+ *		 For uncompressed buffered IO, the folio status also needs to be</div><div class='ctx'>  *		 updated to indicate whether the pending ordered io is finished.</div><div class='ctx'>  *		 Can be NULL for direct IO and compressed write.</div><div class='ctx'>  *		 For these cases, callers are ensured they won't execute the</div><div class='ctx'>  *		 endio function twice.</div><div class='del'>- * @finish_func: The function to be executed when all the IO of an ordered</div><div class='del'>- *		 extent are finished.</div><div class='ctx'>  *</div><div class='ctx'>  * This function is called for endio, thus the range must have ordered</div><div class='del'>- * extent(s) coveri it.</div><div class='add'>+ * extent(s) covering it.</div><div class='ctx'>  */</div><div class='ctx'> void btrfs_mark_ordered_io_finished(struct btrfs_inode *inode,</div><div class='del'>-				struct page *page, u64 file_offset,</div><div class='del'>-				u64 num_bytes, btrfs_func_t finish_func,</div><div class='del'>-				bool uptodate)</div><div class='add'>+				    struct folio *folio, u64 file_offset,</div><div class='add'>+				    u64 num_bytes, bool uptodate)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_ordered_inode_tree *tree = &amp;inode-&gt;ordered_tree;</div><div class='del'>-	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='del'>-	struct btrfs_workqueue *wq;</div><div class='ctx'> 	struct rb_node *node;</div><div class='ctx'> 	struct btrfs_ordered_extent *entry = NULL;</div><div class='del'>-	unsigned long flags;</div><div class='ctx'> 	u64 cur = file_offset;</div><div class='add'>+	const u64 end = file_offset + num_bytes;</div><div class='ctx'> </div><div class='del'>-	if (btrfs_is_free_space_inode(inode))</div><div class='del'>-		wq = fs_info-&gt;endio_freespace_worker;</div><div class='del'>-	else</div><div class='del'>-		wq = fs_info-&gt;endio_write_workers;</div><div class='add'>+	trace_btrfs_writepage_end_io_hook(inode, file_offset, end - 1, uptodate);</div><div class='ctx'> </div><div class='del'>-	if (page)</div><div class='del'>-		ASSERT(page-&gt;mapping &amp;&amp; page_offset(page) &lt;= file_offset &amp;&amp;</div><div class='del'>-		       file_offset + num_bytes &lt;= page_offset(page) + PAGE_SIZE);</div><div class='del'>-</div><div class='del'>-	spin_lock_irqsave(&amp;tree-&gt;lock, flags);</div><div class='del'>-	while (cur &lt; file_offset + num_bytes) {</div><div class='add'>+	spin_lock(&amp;inode-&gt;ordered_tree_lock);</div><div class='add'>+	while (cur &lt; end) {</div><div class='ctx'> 		u64 entry_end;</div><div class='del'>-		u64 end;</div><div class='del'>-		u32 len;</div><div class='add'>+		u64 this_end;</div><div class='add'>+		u64 len;</div><div class='ctx'> </div><div class='del'>-		node = tree_search(tree, cur);</div><div class='add'>+		node = ordered_tree_search(inode, cur);</div><div class='ctx'> 		/* No ordered extents at all */</div><div class='ctx'> 		if (!node)</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -382,59 +532,18 @@ void btrfs_mark_ordered_io_finished(struct btrfs_inode *inode,</div><div class='ctx'> 		 *	|</div><div class='ctx'> 		 *	cur</div><div class='ctx'> 		 */</div><div class='del'>-		end = min(entry-&gt;file_offset + entry-&gt;num_bytes,</div><div class='del'>-			  file_offset + num_bytes) - 1;</div><div class='del'>-		ASSERT(end + 1 - cur &lt; U32_MAX);</div><div class='del'>-		len = end + 1 - cur;</div><div class='del'>-</div><div class='del'>-		if (page) {</div><div class='del'>-			/*</div><div class='del'>-			 * Ordered (Private2) bit indicates whether we still</div><div class='del'>-			 * have pending io unfinished for the ordered extent.</div><div class='del'>-			 *</div><div class='del'>-			 * If there's no such bit, we need to skip to next range.</div><div class='del'>-			 */</div><div class='del'>-			if (!btrfs_page_test_ordered(fs_info, page, cur, len)) {</div><div class='del'>-				cur += len;</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='del'>-			btrfs_page_clear_ordered(fs_info, page, cur, len);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/* Now we're fine to update the accounting */</div><div class='del'>-		if (unlikely(len &gt; entry-&gt;bytes_left)) {</div><div class='del'>-			WARN_ON(1);</div><div class='del'>-			btrfs_crit(fs_info,</div><div class='del'>-"bad ordered extent accounting, root=%llu ino=%llu OE offset=%llu OE len=%llu to_dec=%u left=%llu",</div><div class='del'>-				   inode-&gt;root-&gt;root_key.objectid,</div><div class='del'>-				   btrfs_ino(inode),</div><div class='del'>-				   entry-&gt;file_offset,</div><div class='del'>-				   entry-&gt;num_bytes,</div><div class='del'>-				   len, entry-&gt;bytes_left);</div><div class='del'>-			entry-&gt;bytes_left = 0;</div><div class='del'>-		} else {</div><div class='del'>-			entry-&gt;bytes_left -= len;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (!uptodate)</div><div class='del'>-			set_bit(BTRFS_ORDERED_IOERR, &amp;entry-&gt;flags);</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * All the IO of the ordered extent is finished, we need to queue</div><div class='del'>-		 * the finish_func to be executed.</div><div class='del'>-		 */</div><div class='del'>-		if (entry-&gt;bytes_left == 0) {</div><div class='del'>-			set_bit(BTRFS_ORDERED_IO_DONE, &amp;entry-&gt;flags);</div><div class='del'>-			cond_wake_up(&amp;entry-&gt;wait);</div><div class='del'>-			refcount_inc(&amp;entry-&gt;refs);</div><div class='del'>-			spin_unlock_irqrestore(&amp;tree-&gt;lock, flags);</div><div class='del'>-			btrfs_init_work(&amp;entry-&gt;work, finish_func, NULL, NULL);</div><div class='del'>-			btrfs_queue_work(wq, &amp;entry-&gt;work);</div><div class='del'>-			spin_lock_irqsave(&amp;tree-&gt;lock, flags);</div><div class='add'>+		this_end = min(entry_end, end);</div><div class='add'>+		len = this_end - cur;</div><div class='add'>+		ASSERT(len &lt; U32_MAX);</div><div class='add'>+</div><div class='add'>+		if (can_finish_ordered_extent(entry, folio, cur, len, uptodate)) {</div><div class='add'>+			spin_unlock(&amp;inode-&gt;ordered_tree_lock);</div><div class='add'>+			btrfs_queue_ordered_fn(entry);</div><div class='add'>+			spin_lock(&amp;inode-&gt;ordered_tree_lock);</div><div class='ctx'> 		}</div><div class='ctx'> 		cur += len;</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock_irqrestore(&amp;tree-&gt;lock, flags);</div><div class='add'>+	spin_unlock(&amp;inode-&gt;ordered_tree_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -458,19 +567,17 @@ bool btrfs_dec_test_ordered_pending(struct btrfs_inode *inode,</div><div class='ctx'> 				    struct btrfs_ordered_extent **cached,</div><div class='ctx'> 				    u64 file_offset, u64 io_size)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_ordered_inode_tree *tree = &amp;inode-&gt;ordered_tree;</div><div class='ctx'> 	struct rb_node *node;</div><div class='ctx'> 	struct btrfs_ordered_extent *entry = NULL;</div><div class='del'>-	unsigned long flags;</div><div class='ctx'> 	bool finished = false;</div><div class='ctx'> </div><div class='del'>-	spin_lock_irqsave(&amp;tree-&gt;lock, flags);</div><div class='add'>+	spin_lock(&amp;inode-&gt;ordered_tree_lock);</div><div class='ctx'> 	if (cached &amp;&amp; *cached) {</div><div class='ctx'> 		entry = *cached;</div><div class='ctx'> 		goto have_entry;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	node = tree_search(tree, file_offset);</div><div class='add'>+	node = ordered_tree_search(inode, file_offset);</div><div class='ctx'> 	if (!node)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -499,8 +606,9 @@ out:</div><div class='ctx'> 	if (finished &amp;&amp; cached &amp;&amp; entry) {</div><div class='ctx'> 		*cached = entry;</div><div class='ctx'> 		refcount_inc(&amp;entry-&gt;refs);</div><div class='add'>+		trace_btrfs_ordered_extent_dec_test_pending(inode, entry);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock_irqrestore(&amp;tree-&gt;lock, flags);</div><div class='add'>+	spin_unlock(&amp;inode-&gt;ordered_tree_lock);</div><div class='ctx'> 	return finished;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -510,23 +618,18 @@ out:</div><div class='ctx'>  */</div><div class='ctx'> void btrfs_put_ordered_extent(struct btrfs_ordered_extent *entry)</div><div class='ctx'> {</div><div class='del'>-	struct list_head *cur;</div><div class='del'>-	struct btrfs_ordered_sum *sum;</div><div class='del'>-</div><div class='del'>-	trace_btrfs_ordered_extent_put(BTRFS_I(entry-&gt;inode), entry);</div><div class='add'>+	trace_btrfs_ordered_extent_put(entry-&gt;inode, entry);</div><div class='ctx'> </div><div class='ctx'> 	if (refcount_dec_and_test(&amp;entry-&gt;refs)) {</div><div class='add'>+		struct btrfs_ordered_sum *sum;</div><div class='add'>+		struct btrfs_ordered_sum *tmp;</div><div class='add'>+</div><div class='ctx'> 		ASSERT(list_empty(&amp;entry-&gt;root_extent_list));</div><div class='ctx'> 		ASSERT(list_empty(&amp;entry-&gt;log_list));</div><div class='ctx'> 		ASSERT(RB_EMPTY_NODE(&amp;entry-&gt;rb_node));</div><div class='del'>-		if (entry-&gt;inode)</div><div class='del'>-			btrfs_add_delayed_iput(entry-&gt;inode);</div><div class='del'>-		while (!list_empty(&amp;entry-&gt;list)) {</div><div class='del'>-			cur = entry-&gt;list.next;</div><div class='del'>-			sum = list_entry(cur, struct btrfs_ordered_sum, list);</div><div class='del'>-			list_del(&amp;sum-&gt;list);</div><div class='add'>+		btrfs_add_delayed_iput(entry-&gt;inode);</div><div class='add'>+		list_for_each_entry_safe(sum, tmp, &amp;entry-&gt;list, list)</div><div class='ctx'> 			kvfree(sum);</div><div class='del'>-		}</div><div class='ctx'> 		kmem_cache_free(btrfs_ordered_extent_cache, entry);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -538,33 +641,47 @@ void btrfs_put_ordered_extent(struct btrfs_ordered_extent *entry)</div><div class='ctx'> void btrfs_remove_ordered_extent(struct btrfs_inode *btrfs_inode,</div><div class='ctx'> 				 struct btrfs_ordered_extent *entry)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_ordered_inode_tree *tree;</div><div class='ctx'> 	struct btrfs_root *root = btrfs_inode-&gt;root;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct rb_node *node;</div><div class='ctx'> 	bool pending;</div><div class='add'>+	bool freespace_inode;</div><div class='ctx'> </div><div class='del'>-	/* This is paired with btrfs_add_ordered_extent. */</div><div class='add'>+	/*</div><div class='add'>+	 * If this is a free space inode the thread has not acquired the ordered</div><div class='add'>+	 * extents lockdep map.</div><div class='add'>+	 */</div><div class='add'>+	freespace_inode = btrfs_is_free_space_inode(btrfs_inode);</div><div class='add'>+</div><div class='add'>+	btrfs_lockdep_acquire(fs_info, btrfs_trans_pending_ordered);</div><div class='add'>+	/* This is paired with alloc_ordered_extent(). */</div><div class='ctx'> 	spin_lock(&amp;btrfs_inode-&gt;lock);</div><div class='ctx'> 	btrfs_mod_outstanding_extents(btrfs_inode, -1);</div><div class='ctx'> 	spin_unlock(&amp;btrfs_inode-&gt;lock);</div><div class='del'>-	if (root != fs_info-&gt;tree_root)</div><div class='del'>-		btrfs_delalloc_release_metadata(btrfs_inode, entry-&gt;num_bytes,</div><div class='del'>-						false);</div><div class='add'>+	if (root != fs_info-&gt;tree_root) {</div><div class='add'>+		u64 release;</div><div class='add'>+</div><div class='add'>+		if (test_bit(BTRFS_ORDERED_ENCODED, &amp;entry-&gt;flags))</div><div class='add'>+			release = entry-&gt;disk_num_bytes;</div><div class='add'>+		else</div><div class='add'>+			release = entry-&gt;num_bytes;</div><div class='add'>+		btrfs_delalloc_release_metadata(btrfs_inode, release,</div><div class='add'>+						test_bit(BTRFS_ORDERED_IOERR,</div><div class='add'>+							 &amp;entry-&gt;flags));</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	percpu_counter_add_batch(&amp;fs_info-&gt;ordered_bytes, -entry-&gt;num_bytes,</div><div class='ctx'> 				 fs_info-&gt;delalloc_batch);</div><div class='ctx'> </div><div class='del'>-	tree = &amp;btrfs_inode-&gt;ordered_tree;</div><div class='del'>-	spin_lock_irq(&amp;tree-&gt;lock);</div><div class='add'>+	spin_lock(&amp;btrfs_inode-&gt;ordered_tree_lock);</div><div class='ctx'> 	node = &amp;entry-&gt;rb_node;</div><div class='del'>-	rb_erase(node, &amp;tree-&gt;tree);</div><div class='add'>+	rb_erase(node, &amp;btrfs_inode-&gt;ordered_tree);</div><div class='ctx'> 	RB_CLEAR_NODE(node);</div><div class='del'>-	if (tree-&gt;last == node)</div><div class='del'>-		tree-&gt;last = NULL;</div><div class='add'>+	if (btrfs_inode-&gt;ordered_tree_last == node)</div><div class='add'>+		btrfs_inode-&gt;ordered_tree_last = NULL;</div><div class='ctx'> 	set_bit(BTRFS_ORDERED_COMPLETE, &amp;entry-&gt;flags);</div><div class='ctx'> 	pending = test_and_clear_bit(BTRFS_ORDERED_PENDING, &amp;entry-&gt;flags);</div><div class='del'>-	spin_unlock_irq(&amp;tree-&gt;lock);</div><div class='add'>+	spin_unlock(&amp;btrfs_inode-&gt;ordered_tree_lock);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The current running transaction is waiting on us, we need to let it</div><div class='hunk'>@@ -585,7 +702,7 @@ void btrfs_remove_ordered_extent(struct btrfs_inode *btrfs_inode,</div><div class='ctx'> 			refcount_inc(&amp;trans-&gt;use_count);</div><div class='ctx'> 		spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='ctx'> </div><div class='del'>-		ASSERT(trans);</div><div class='add'>+		ASSERT(trans || BTRFS_FS_ERROR(fs_info));</div><div class='ctx'> 		if (trans) {</div><div class='ctx'> 			if (atomic_dec_and_test(&amp;trans-&gt;pending_ordered))</div><div class='ctx'> 				wake_up(&amp;trans-&gt;pending_wait);</div><div class='hunk'>@@ -593,6 +710,8 @@ void btrfs_remove_ordered_extent(struct btrfs_inode *btrfs_inode,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	btrfs_lockdep_release(fs_info, btrfs_trans_pending_ordered);</div><div class='add'>+</div><div class='ctx'> 	spin_lock(&amp;root-&gt;ordered_extent_lock);</div><div class='ctx'> 	list_del_init(&amp;entry-&gt;root_extent_list);</div><div class='ctx'> 	root-&gt;nr_ordered_extents--;</div><div class='hunk'>@@ -607,6 +726,8 @@ void btrfs_remove_ordered_extent(struct btrfs_inode *btrfs_inode,</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;root-&gt;ordered_extent_lock);</div><div class='ctx'> 	wake_up(&amp;entry-&gt;wait);</div><div class='add'>+	if (!freespace_inode)</div><div class='add'>+		btrfs_lockdep_release(fs_info, btrfs_ordered_extent);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void btrfs_run_ordered_extent_work(struct btrfs_work *work)</div><div class='hunk'>@@ -614,16 +735,16 @@ static void btrfs_run_ordered_extent_work(struct btrfs_work *work)</div><div class='ctx'> 	struct btrfs_ordered_extent *ordered;</div><div class='ctx'> </div><div class='ctx'> 	ordered = container_of(work, struct btrfs_ordered_extent, flush_work);</div><div class='del'>-	btrfs_start_ordered_extent(ordered, 1);</div><div class='add'>+	btrfs_start_ordered_extent(ordered);</div><div class='ctx'> 	complete(&amp;ordered-&gt;completion);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * wait for all the ordered extents in a root.  This is done when balancing</div><div class='del'>- * space between drives.</div><div class='add'>+ * Wait for all the ordered extents in a root. Use @bg as range or do whole</div><div class='add'>+ * range if it's NULL.</div><div class='ctx'>  */</div><div class='ctx'> u64 btrfs_wait_ordered_extents(struct btrfs_root *root, u64 nr,</div><div class='del'>-			       const u64 range_start, const u64 range_len)</div><div class='add'>+			       const struct btrfs_block_group *bg)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	LIST_HEAD(splice);</div><div class='hunk'>@@ -631,7 +752,17 @@ u64 btrfs_wait_ordered_extents(struct btrfs_root *root, u64 nr,</div><div class='ctx'> 	LIST_HEAD(works);</div><div class='ctx'> 	struct btrfs_ordered_extent *ordered, *next;</div><div class='ctx'> 	u64 count = 0;</div><div class='del'>-	const u64 range_end = range_start + range_len;</div><div class='add'>+	u64 range_start, range_len;</div><div class='add'>+	u64 range_end;</div><div class='add'>+</div><div class='add'>+	if (bg) {</div><div class='add'>+		range_start = bg-&gt;start;</div><div class='add'>+		range_len = bg-&gt;length;</div><div class='add'>+	} else {</div><div class='add'>+		range_start = 0;</div><div class='add'>+		range_len = U64_MAX;</div><div class='add'>+	}</div><div class='add'>+	range_end = range_start + range_len;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;root-&gt;ordered_extent_mutex);</div><div class='ctx'> 	spin_lock(&amp;root-&gt;ordered_extent_lock);</div><div class='hunk'>@@ -653,15 +784,15 @@ u64 btrfs_wait_ordered_extents(struct btrfs_root *root, u64 nr,</div><div class='ctx'> 		spin_unlock(&amp;root-&gt;ordered_extent_lock);</div><div class='ctx'> </div><div class='ctx'> 		btrfs_init_work(&amp;ordered-&gt;flush_work,</div><div class='del'>-				btrfs_run_ordered_extent_work, NULL, NULL);</div><div class='add'>+				btrfs_run_ordered_extent_work, NULL);</div><div class='ctx'> 		list_add_tail(&amp;ordered-&gt;work_list, &amp;works);</div><div class='ctx'> 		btrfs_queue_work(fs_info-&gt;flush_workers, &amp;ordered-&gt;flush_work);</div><div class='ctx'> </div><div class='ctx'> 		cond_resched();</div><div class='del'>-		spin_lock(&amp;root-&gt;ordered_extent_lock);</div><div class='ctx'> 		if (nr != U64_MAX)</div><div class='ctx'> 			nr--;</div><div class='ctx'> 		count++;</div><div class='add'>+		spin_lock(&amp;root-&gt;ordered_extent_lock);</div><div class='ctx'> 	}</div><div class='ctx'> 	list_splice_tail(&amp;skipped, &amp;root-&gt;ordered_extents);</div><div class='ctx'> 	list_splice_tail(&amp;splice, &amp;root-&gt;ordered_extents);</div><div class='hunk'>@@ -678,15 +809,17 @@ u64 btrfs_wait_ordered_extents(struct btrfs_root *root, u64 nr,</div><div class='ctx'> 	return count;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Wait for @nr ordered extents that intersect the @bg, or the whole range of</div><div class='add'>+ * the filesystem if @bg is NULL.</div><div class='add'>+ */</div><div class='ctx'> void btrfs_wait_ordered_roots(struct btrfs_fs_info *fs_info, u64 nr,</div><div class='del'>-			     const u64 range_start, const u64 range_len)</div><div class='add'>+			      const struct btrfs_block_group *bg)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root;</div><div class='del'>-	struct list_head splice;</div><div class='add'>+	LIST_HEAD(splice);</div><div class='ctx'> 	u64 done;</div><div class='ctx'> </div><div class='del'>-	INIT_LIST_HEAD(&amp;splice);</div><div class='del'>-</div><div class='ctx'> 	mutex_lock(&amp;fs_info-&gt;ordered_operations_mutex);</div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;ordered_root_lock);</div><div class='ctx'> 	list_splice_init(&amp;fs_info-&gt;ordered_roots, &amp;splice);</div><div class='hunk'>@@ -699,14 +832,13 @@ void btrfs_wait_ordered_roots(struct btrfs_fs_info *fs_info, u64 nr,</div><div class='ctx'> 			       &amp;fs_info-&gt;ordered_roots);</div><div class='ctx'> 		spin_unlock(&amp;fs_info-&gt;ordered_root_lock);</div><div class='ctx'> </div><div class='del'>-		done = btrfs_wait_ordered_extents(root, nr,</div><div class='del'>-						  range_start, range_len);</div><div class='add'>+		done = btrfs_wait_ordered_extents(root, nr, bg);</div><div class='ctx'> 		btrfs_put_root(root);</div><div class='ctx'> </div><div class='del'>-		spin_lock(&amp;fs_info-&gt;ordered_root_lock);</div><div class='del'>-		if (nr != U64_MAX) {</div><div class='add'>+		if (nr != U64_MAX)</div><div class='ctx'> 			nr -= done;</div><div class='del'>-		}</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;fs_info-&gt;ordered_root_lock);</div><div class='ctx'> 	}</div><div class='ctx'> 	list_splice_tail(&amp;splice, &amp;fs_info-&gt;ordered_roots);</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;ordered_root_lock);</div><div class='hunk'>@@ -714,37 +846,56 @@ void btrfs_wait_ordered_roots(struct btrfs_fs_info *fs_info, u64 nr,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Used to start IO or wait for a given ordered extent to finish.</div><div class='add'>+ * Start IO and wait for a given ordered extent to finish.</div><div class='ctx'>  *</div><div class='del'>- * If wait is one, this effectively waits on page writeback for all the pages</div><div class='del'>- * in the extent, and it waits on the io completion code to insert</div><div class='del'>- * metadata into the btree corresponding to the extent</div><div class='add'>+ * Wait on page writeback for all the pages in the extent but not in</div><div class='add'>+ * [@nowriteback_start, @nowriteback_start + @nowriteback_len) and the</div><div class='add'>+ * IO completion code to insert metadata into the btree corresponding to the extent.</div><div class='ctx'>  */</div><div class='del'>-void btrfs_start_ordered_extent(struct btrfs_ordered_extent *entry, int wait)</div><div class='add'>+void btrfs_start_ordered_extent_nowriteback(struct btrfs_ordered_extent *entry,</div><div class='add'>+					    u64 nowriteback_start, u32 nowriteback_len)</div><div class='ctx'> {</div><div class='ctx'> 	u64 start = entry-&gt;file_offset;</div><div class='ctx'> 	u64 end = start + entry-&gt;num_bytes - 1;</div><div class='del'>-	struct btrfs_inode *inode = BTRFS_I(entry-&gt;inode);</div><div class='add'>+	struct btrfs_inode *inode = entry-&gt;inode;</div><div class='add'>+	bool freespace_inode;</div><div class='ctx'> </div><div class='ctx'> 	trace_btrfs_ordered_extent_start(inode, entry);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='add'>+	 * If this is a free space inode do not take the ordered extents lockdep</div><div class='add'>+	 * map.</div><div class='add'>+	 */</div><div class='add'>+	freespace_inode = btrfs_is_free_space_inode(inode);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='ctx'> 	 * pages in the range can be dirty, clean or writeback.  We</div><div class='ctx'> 	 * start IO on any dirty ones so the wait doesn't stall waiting</div><div class='ctx'> 	 * for the flusher thread to find them</div><div class='ctx'> 	 */</div><div class='del'>-	if (!test_bit(BTRFS_ORDERED_DIRECT, &amp;entry-&gt;flags))</div><div class='del'>-		filemap_fdatawrite_range(inode-&gt;vfs_inode.i_mapping, start, end);</div><div class='del'>-	if (wait) {</div><div class='del'>-		wait_event(entry-&gt;wait, test_bit(BTRFS_ORDERED_COMPLETE,</div><div class='del'>-						 &amp;entry-&gt;flags));</div><div class='add'>+	if (!test_bit(BTRFS_ORDERED_DIRECT, &amp;entry-&gt;flags)) {</div><div class='add'>+		if (!nowriteback_len) {</div><div class='add'>+			filemap_fdatawrite_range(inode-&gt;vfs_inode.i_mapping, start, end);</div><div class='add'>+		} else {</div><div class='add'>+			if (start &lt; nowriteback_start)</div><div class='add'>+				filemap_fdatawrite_range(inode-&gt;vfs_inode.i_mapping, start,</div><div class='add'>+							 nowriteback_start - 1);</div><div class='add'>+			if (nowriteback_start + nowriteback_len &lt; end)</div><div class='add'>+				filemap_fdatawrite_range(inode-&gt;vfs_inode.i_mapping,</div><div class='add'>+							 nowriteback_start + nowriteback_len,</div><div class='add'>+							 end);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	if (!freespace_inode)</div><div class='add'>+		btrfs_might_wait_for_event(inode-&gt;root-&gt;fs_info, btrfs_ordered_extent);</div><div class='add'>+	wait_event(entry-&gt;wait, test_bit(BTRFS_ORDERED_COMPLETE, &amp;entry-&gt;flags));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Used to wait on ordered extents across a large range of bytes.</div><div class='ctx'>  */</div><div class='del'>-int btrfs_wait_ordered_range(struct inode *inode, u64 start, u64 len)</div><div class='add'>+int btrfs_wait_ordered_range(struct btrfs_inode *inode, u64 start, u64 len)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int ret_wb = 0;</div><div class='hunk'>@@ -753,11 +904,11 @@ int btrfs_wait_ordered_range(struct inode *inode, u64 start, u64 len)</div><div class='ctx'> 	struct btrfs_ordered_extent *ordered;</div><div class='ctx'> </div><div class='ctx'> 	if (start + len &lt; start) {</div><div class='del'>-		orig_end = INT_LIMIT(loff_t);</div><div class='add'>+		orig_end = OFFSET_MAX;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		orig_end = start + len - 1;</div><div class='del'>-		if (orig_end &gt; INT_LIMIT(loff_t))</div><div class='del'>-			orig_end = INT_LIMIT(loff_t);</div><div class='add'>+		if (orig_end &gt; OFFSET_MAX)</div><div class='add'>+			orig_end = OFFSET_MAX;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* start IO across the range first to instantiate any delalloc</div><div class='hunk'>@@ -774,11 +925,11 @@ int btrfs_wait_ordered_range(struct inode *inode, u64 start, u64 len)</div><div class='ctx'> 	 * before the ordered extents complete - to avoid failures (-EEXIST)</div><div class='ctx'> 	 * when adding the new ordered extents to the ordered tree.</div><div class='ctx'> 	 */</div><div class='del'>-	ret_wb = filemap_fdatawait_range(inode-&gt;i_mapping, start, orig_end);</div><div class='add'>+	ret_wb = filemap_fdatawait_range(inode-&gt;vfs_inode.i_mapping, start, orig_end);</div><div class='ctx'> </div><div class='ctx'> 	end = orig_end;</div><div class='ctx'> 	while (1) {</div><div class='del'>-		ordered = btrfs_lookup_first_ordered_extent(BTRFS_I(inode), end);</div><div class='add'>+		ordered = btrfs_lookup_first_ordered_extent(inode, end);</div><div class='ctx'> 		if (!ordered)</div><div class='ctx'> 			break;</div><div class='ctx'> 		if (ordered-&gt;file_offset &gt; orig_end) {</div><div class='hunk'>@@ -789,7 +940,7 @@ int btrfs_wait_ordered_range(struct inode *inode, u64 start, u64 len)</div><div class='ctx'> 			btrfs_put_ordered_extent(ordered);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-		btrfs_start_ordered_extent(ordered, 1);</div><div class='add'>+		btrfs_start_ordered_extent(ordered);</div><div class='ctx'> 		end = ordered-&gt;file_offset;</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * If the ordered extent had an error save the error but don't</div><div class='hunk'>@@ -813,24 +964,23 @@ int btrfs_wait_ordered_range(struct inode *inode, u64 start, u64 len)</div><div class='ctx'> struct btrfs_ordered_extent *btrfs_lookup_ordered_extent(struct btrfs_inode *inode,</div><div class='ctx'> 							 u64 file_offset)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_ordered_inode_tree *tree;</div><div class='ctx'> 	struct rb_node *node;</div><div class='ctx'> 	struct btrfs_ordered_extent *entry = NULL;</div><div class='del'>-	unsigned long flags;</div><div class='ctx'> </div><div class='del'>-	tree = &amp;inode-&gt;ordered_tree;</div><div class='del'>-	spin_lock_irqsave(&amp;tree-&gt;lock, flags);</div><div class='del'>-	node = tree_search(tree, file_offset);</div><div class='add'>+	spin_lock(&amp;inode-&gt;ordered_tree_lock);</div><div class='add'>+	node = ordered_tree_search(inode, file_offset);</div><div class='ctx'> 	if (!node)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	entry = rb_entry(node, struct btrfs_ordered_extent, rb_node);</div><div class='ctx'> 	if (!in_range(file_offset, entry-&gt;file_offset, entry-&gt;num_bytes))</div><div class='ctx'> 		entry = NULL;</div><div class='del'>-	if (entry)</div><div class='add'>+	if (entry) {</div><div class='ctx'> 		refcount_inc(&amp;entry-&gt;refs);</div><div class='add'>+		trace_btrfs_ordered_extent_lookup(inode, entry);</div><div class='add'>+	}</div><div class='ctx'> out:</div><div class='del'>-	spin_unlock_irqrestore(&amp;tree-&gt;lock, flags);</div><div class='add'>+	spin_unlock(&amp;inode-&gt;ordered_tree_lock);</div><div class='ctx'> 	return entry;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -840,22 +990,20 @@ out:</div><div class='ctx'> struct btrfs_ordered_extent *btrfs_lookup_ordered_range(</div><div class='ctx'> 		struct btrfs_inode *inode, u64 file_offset, u64 len)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_ordered_inode_tree *tree;</div><div class='ctx'> 	struct rb_node *node;</div><div class='ctx'> 	struct btrfs_ordered_extent *entry = NULL;</div><div class='ctx'> </div><div class='del'>-	tree = &amp;inode-&gt;ordered_tree;</div><div class='del'>-	spin_lock_irq(&amp;tree-&gt;lock);</div><div class='del'>-	node = tree_search(tree, file_offset);</div><div class='add'>+	spin_lock(&amp;inode-&gt;ordered_tree_lock);</div><div class='add'>+	node = ordered_tree_search(inode, file_offset);</div><div class='ctx'> 	if (!node) {</div><div class='del'>-		node = tree_search(tree, file_offset + len);</div><div class='add'>+		node = ordered_tree_search(inode, file_offset + len);</div><div class='ctx'> 		if (!node)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		entry = rb_entry(node, struct btrfs_ordered_extent, rb_node);</div><div class='del'>-		if (range_overlaps(entry, file_offset, len))</div><div class='add'>+		if (btrfs_range_overlaps(entry, file_offset, len))</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='ctx'> 		if (entry-&gt;file_offset &gt;= file_offset + len) {</div><div class='hunk'>@@ -868,9 +1016,11 @@ struct btrfs_ordered_extent *btrfs_lookup_ordered_range(</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='del'>-	if (entry)</div><div class='add'>+	if (entry) {</div><div class='ctx'> 		refcount_inc(&amp;entry-&gt;refs);</div><div class='del'>-	spin_unlock_irq(&amp;tree-&gt;lock);</div><div class='add'>+		trace_btrfs_ordered_extent_lookup_range(inode, entry);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;inode-&gt;ordered_tree_lock);</div><div class='ctx'> 	return entry;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -881,13 +1031,12 @@ out:</div><div class='ctx'> void btrfs_get_ordered_extents_for_logging(struct btrfs_inode *inode,</div><div class='ctx'> 					   struct list_head *list)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_ordered_inode_tree *tree = &amp;inode-&gt;ordered_tree;</div><div class='ctx'> 	struct rb_node *n;</div><div class='ctx'> </div><div class='del'>-	ASSERT(inode_is_locked(&amp;inode-&gt;vfs_inode));</div><div class='add'>+	btrfs_assert_inode_locked(inode);</div><div class='ctx'> </div><div class='del'>-	spin_lock_irq(&amp;tree-&gt;lock);</div><div class='del'>-	for (n = rb_first(&amp;tree-&gt;tree); n; n = rb_next(n)) {</div><div class='add'>+	spin_lock(&amp;inode-&gt;ordered_tree_lock);</div><div class='add'>+	for (n = rb_first(&amp;inode-&gt;ordered_tree); n; n = rb_next(n)) {</div><div class='ctx'> 		struct btrfs_ordered_extent *ordered;</div><div class='ctx'> </div><div class='ctx'> 		ordered = rb_entry(n, struct btrfs_ordered_extent, rb_node);</div><div class='hunk'>@@ -898,8 +1047,9 @@ void btrfs_get_ordered_extents_for_logging(struct btrfs_inode *inode,</div><div class='ctx'> 		ASSERT(list_empty(&amp;ordered-&gt;log_list));</div><div class='ctx'> 		list_add_tail(&amp;ordered-&gt;log_list, list);</div><div class='ctx'> 		refcount_inc(&amp;ordered-&gt;refs);</div><div class='add'>+		trace_btrfs_ordered_extent_lookup_for_logging(inode, ordered);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock_irq(&amp;tree-&gt;lock);</div><div class='add'>+	spin_unlock(&amp;inode-&gt;ordered_tree_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -909,20 +1059,19 @@ void btrfs_get_ordered_extents_for_logging(struct btrfs_inode *inode,</div><div class='ctx'> struct btrfs_ordered_extent *</div><div class='ctx'> btrfs_lookup_first_ordered_extent(struct btrfs_inode *inode, u64 file_offset)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_ordered_inode_tree *tree;</div><div class='ctx'> 	struct rb_node *node;</div><div class='ctx'> 	struct btrfs_ordered_extent *entry = NULL;</div><div class='ctx'> </div><div class='del'>-	tree = &amp;inode-&gt;ordered_tree;</div><div class='del'>-	spin_lock_irq(&amp;tree-&gt;lock);</div><div class='del'>-	node = tree_search(tree, file_offset);</div><div class='add'>+	spin_lock(&amp;inode-&gt;ordered_tree_lock);</div><div class='add'>+	node = ordered_tree_search(inode, file_offset);</div><div class='ctx'> 	if (!node)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	entry = rb_entry(node, struct btrfs_ordered_extent, rb_node);</div><div class='ctx'> 	refcount_inc(&amp;entry-&gt;refs);</div><div class='add'>+	trace_btrfs_ordered_extent_lookup_first(inode, entry);</div><div class='ctx'> out:</div><div class='del'>-	spin_unlock_irq(&amp;tree-&gt;lock);</div><div class='add'>+	spin_unlock(&amp;inode-&gt;ordered_tree_lock);</div><div class='ctx'> 	return entry;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -938,15 +1087,14 @@ out:</div><div class='ctx'> struct btrfs_ordered_extent *btrfs_lookup_first_ordered_range(</div><div class='ctx'> 			struct btrfs_inode *inode, u64 file_offset, u64 len)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_ordered_inode_tree *tree = &amp;inode-&gt;ordered_tree;</div><div class='ctx'> 	struct rb_node *node;</div><div class='ctx'> 	struct rb_node *cur;</div><div class='ctx'> 	struct rb_node *prev;</div><div class='ctx'> 	struct rb_node *next;</div><div class='ctx'> 	struct btrfs_ordered_extent *entry = NULL;</div><div class='ctx'> </div><div class='del'>-	spin_lock_irq(&amp;tree-&gt;lock);</div><div class='del'>-	node = tree-&gt;tree.rb_node;</div><div class='add'>+	spin_lock(&amp;inode-&gt;ordered_tree_lock);</div><div class='add'>+	node = inode-&gt;ordered_tree.rb_node;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Here we don't want to use tree_search() which will use tree-&gt;last</div><div class='ctx'> 	 * and screw up the search order.</div><div class='hunk'>@@ -984,35 +1132,39 @@ struct btrfs_ordered_extent *btrfs_lookup_first_ordered_range(</div><div class='ctx'> 	}</div><div class='ctx'> 	if (prev) {</div><div class='ctx'> 		entry = rb_entry(prev, struct btrfs_ordered_extent, rb_node);</div><div class='del'>-		if (range_overlaps(entry, file_offset, len))</div><div class='add'>+		if (btrfs_range_overlaps(entry, file_offset, len))</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (next) {</div><div class='ctx'> 		entry = rb_entry(next, struct btrfs_ordered_extent, rb_node);</div><div class='del'>-		if (range_overlaps(entry, file_offset, len))</div><div class='add'>+		if (btrfs_range_overlaps(entry, file_offset, len))</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	/* No ordered extent in the range */</div><div class='ctx'> 	entry = NULL;</div><div class='ctx'> out:</div><div class='del'>-	if (entry)</div><div class='add'>+	if (entry) {</div><div class='ctx'> 		refcount_inc(&amp;entry-&gt;refs);</div><div class='del'>-	spin_unlock_irq(&amp;tree-&gt;lock);</div><div class='add'>+		trace_btrfs_ordered_extent_lookup_first_range(inode, entry);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_unlock(&amp;inode-&gt;ordered_tree_lock);</div><div class='ctx'> 	return entry;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * btrfs_flush_ordered_range - Lock the passed range and ensures all pending</div><div class='del'>- * ordered extents in it are run to completion.</div><div class='add'>+ * Lock the passed range and ensures all pending ordered extents in it are run</div><div class='add'>+ * to completion.</div><div class='ctx'>  *</div><div class='ctx'>  * @inode:        Inode whose ordered tree is to be searched</div><div class='ctx'>  * @start:        Beginning of range to flush</div><div class='ctx'>  * @end:          Last byte of range to lock</div><div class='ctx'>  * @cached_state: If passed, will return the extent state responsible for the</div><div class='del'>- * locked range. It's the caller's responsibility to free the cached state.</div><div class='add'>+ *                locked range. It's the caller's responsibility to free the</div><div class='add'>+ *                cached state.</div><div class='ctx'>  *</div><div class='del'>- * This function always returns with the given range locked, ensuring after it's</div><div class='del'>- * called no order extent can be pending.</div><div class='add'>+ * Always return with the given range locked, ensuring after it's called no</div><div class='add'>+ * order extent can be pending.</div><div class='ctx'>  */</div><div class='ctx'> void btrfs_lock_and_flush_ordered_range(struct btrfs_inode *inode, u64 start,</div><div class='ctx'> 					u64 end,</div><div class='hunk'>@@ -1026,7 +1178,7 @@ void btrfs_lock_and_flush_ordered_range(struct btrfs_inode *inode, u64 start,</div><div class='ctx'> 		cachedp = cached_state;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='del'>-		lock_extent_bits(&amp;inode-&gt;io_tree, start, end, cachedp);</div><div class='add'>+		btrfs_lock_extent(&amp;inode-&gt;io_tree, start, end, cachedp);</div><div class='ctx'> 		ordered = btrfs_lookup_ordered_range(inode, start,</div><div class='ctx'> 						     end - start + 1);</div><div class='ctx'> 		if (!ordered) {</div><div class='hunk'>@@ -1039,104 +1191,161 @@ void btrfs_lock_and_flush_ordered_range(struct btrfs_inode *inode, u64 start,</div><div class='ctx'> 				refcount_dec(&amp;cache-&gt;refs);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-		unlock_extent_cached(&amp;inode-&gt;io_tree, start, end, cachedp);</div><div class='del'>-		btrfs_start_ordered_extent(ordered, 1);</div><div class='add'>+		btrfs_unlock_extent(&amp;inode-&gt;io_tree, start, end, cachedp);</div><div class='add'>+		btrfs_start_ordered_extent(ordered);</div><div class='ctx'> 		btrfs_put_ordered_extent(ordered);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int clone_ordered_extent(struct btrfs_ordered_extent *ordered, u64 pos,</div><div class='del'>-				u64 len)</div><div class='add'>+/*</div><div class='add'>+ * Lock the passed range and ensure all pending ordered extents in it are run</div><div class='add'>+ * to completion in nowait mode.</div><div class='add'>+ *</div><div class='add'>+ * Return true if btrfs_lock_ordered_range does not return any extents,</div><div class='add'>+ * otherwise false.</div><div class='add'>+ */</div><div class='add'>+bool btrfs_try_lock_ordered_range(struct btrfs_inode *inode, u64 start, u64 end,</div><div class='add'>+				  struct extent_state **cached_state)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = ordered-&gt;inode;</div><div class='del'>-	struct btrfs_fs_info *fs_info = BTRFS_I(inode)-&gt;root-&gt;fs_info;</div><div class='del'>-	u64 file_offset = ordered-&gt;file_offset + pos;</div><div class='del'>-	u64 disk_bytenr = ordered-&gt;disk_bytenr + pos;</div><div class='del'>-	u64 num_bytes = len;</div><div class='del'>-	u64 disk_num_bytes = len;</div><div class='del'>-	int type;</div><div class='del'>-	unsigned long flags_masked = ordered-&gt;flags &amp; ~(1 &lt;&lt; BTRFS_ORDERED_DIRECT);</div><div class='del'>-	int compress_type = ordered-&gt;compress_type;</div><div class='del'>-	unsigned long weight;</div><div class='del'>-	int ret;</div><div class='add'>+	struct btrfs_ordered_extent *ordered;</div><div class='ctx'> </div><div class='del'>-	weight = hweight_long(flags_masked);</div><div class='del'>-	WARN_ON_ONCE(weight &gt; 1);</div><div class='del'>-	if (!weight)</div><div class='del'>-		type = 0;</div><div class='del'>-	else</div><div class='del'>-		type = __ffs(flags_masked);</div><div class='add'>+	if (!btrfs_try_lock_extent(&amp;inode-&gt;io_tree, start, end, cached_state))</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * The splitting extent is already counted and will be added again</div><div class='del'>-	 * in btrfs_add_ordered_extent_*(). Subtract num_bytes to avoid</div><div class='del'>-	 * double counting.</div><div class='del'>-	 */</div><div class='del'>-	percpu_counter_add_batch(&amp;fs_info-&gt;ordered_bytes, -num_bytes,</div><div class='del'>-				 fs_info-&gt;delalloc_batch);</div><div class='del'>-	if (test_bit(BTRFS_ORDERED_COMPRESSED, &amp;ordered-&gt;flags)) {</div><div class='del'>-		WARN_ON_ONCE(1);</div><div class='del'>-		ret = btrfs_add_ordered_extent_compress(BTRFS_I(inode),</div><div class='del'>-				file_offset, disk_bytenr, num_bytes,</div><div class='del'>-				disk_num_bytes, compress_type);</div><div class='del'>-	} else if (test_bit(BTRFS_ORDERED_DIRECT, &amp;ordered-&gt;flags)) {</div><div class='del'>-		ret = btrfs_add_ordered_extent_dio(BTRFS_I(inode), file_offset,</div><div class='del'>-				disk_bytenr, num_bytes, disk_num_bytes, type);</div><div class='del'>-	} else {</div><div class='del'>-		ret = btrfs_add_ordered_extent(BTRFS_I(inode), file_offset,</div><div class='del'>-				disk_bytenr, num_bytes, disk_num_bytes, type);</div><div class='del'>-	}</div><div class='add'>+	ordered = btrfs_lookup_ordered_range(inode, start, end - start + 1);</div><div class='add'>+	if (!ordered)</div><div class='add'>+		return true;</div><div class='ctx'> </div><div class='del'>-	return ret;</div><div class='add'>+	btrfs_put_ordered_extent(ordered);</div><div class='add'>+	btrfs_unlock_extent(&amp;inode-&gt;io_tree, start, end, cached_state);</div><div class='add'>+</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_split_ordered_extent(struct btrfs_ordered_extent *ordered, u64 pre,</div><div class='del'>-				u64 post)</div><div class='add'>+/* Split out a new ordered extent for this first @len bytes of @ordered. */</div><div class='add'>+struct btrfs_ordered_extent *btrfs_split_ordered_extent(</div><div class='add'>+			struct btrfs_ordered_extent *ordered, u64 len)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = ordered-&gt;inode;</div><div class='del'>-	struct btrfs_ordered_inode_tree *tree = &amp;BTRFS_I(inode)-&gt;ordered_tree;</div><div class='add'>+	struct btrfs_inode *inode = ordered-&gt;inode;</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+	u64 file_offset = ordered-&gt;file_offset;</div><div class='add'>+	u64 disk_bytenr = ordered-&gt;disk_bytenr;</div><div class='add'>+	unsigned long flags = ordered-&gt;flags;</div><div class='add'>+	struct btrfs_ordered_sum *sum, *tmpsum;</div><div class='add'>+	struct btrfs_ordered_extent *new;</div><div class='ctx'> 	struct rb_node *node;</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	int ret = 0;</div><div class='add'>+	u64 offset = 0;</div><div class='ctx'> </div><div class='del'>-	spin_lock_irq(&amp;tree-&gt;lock);</div><div class='del'>-	/* Remove from tree once */</div><div class='del'>-	node = &amp;ordered-&gt;rb_node;</div><div class='del'>-	rb_erase(node, &amp;tree-&gt;tree);</div><div class='del'>-	RB_CLEAR_NODE(node);</div><div class='del'>-	if (tree-&gt;last == node)</div><div class='del'>-		tree-&gt;last = NULL;</div><div class='del'>-</div><div class='del'>-	ordered-&gt;file_offset += pre;</div><div class='del'>-	ordered-&gt;disk_bytenr += pre;</div><div class='del'>-	ordered-&gt;num_bytes -= (pre + post);</div><div class='del'>-	ordered-&gt;disk_num_bytes -= (pre + post);</div><div class='del'>-	ordered-&gt;bytes_left -= (pre + post);</div><div class='del'>-</div><div class='del'>-	/* Re-insert the node */</div><div class='del'>-	node = tree_insert(&amp;tree-&gt;tree, ordered-&gt;file_offset, &amp;ordered-&gt;rb_node);</div><div class='del'>-	if (node)</div><div class='del'>-		btrfs_panic(fs_info, -EEXIST,</div><div class='del'>-			"zoned: inconsistency in ordered tree at offset %llu",</div><div class='del'>-			    ordered-&gt;file_offset);</div><div class='add'>+	trace_btrfs_ordered_extent_split(inode, ordered);</div><div class='ctx'> </div><div class='del'>-	spin_unlock_irq(&amp;tree-&gt;lock);</div><div class='add'>+	ASSERT(!(flags &amp; (1U &lt;&lt; BTRFS_ORDERED_COMPRESSED)));</div><div class='ctx'> </div><div class='del'>-	if (pre)</div><div class='del'>-		ret = clone_ordered_extent(ordered, 0, pre);</div><div class='del'>-	if (ret == 0 &amp;&amp; post)</div><div class='del'>-		ret = clone_ordered_extent(ordered, pre + ordered-&gt;disk_num_bytes,</div><div class='del'>-					   post);</div><div class='add'>+	/*</div><div class='add'>+	 * The entire bio must be covered by the ordered extent, but we can't</div><div class='add'>+	 * reduce the original extent to a zero length either.</div><div class='add'>+	 */</div><div class='add'>+	if (WARN_ON_ONCE(len &gt;= ordered-&gt;num_bytes))</div><div class='add'>+		return ERR_PTR(-EINVAL);</div><div class='add'>+	/*</div><div class='add'>+	 * If our ordered extent had an error there's no point in continuing.</div><div class='add'>+	 * The error may have come from a transaction abort done either by this</div><div class='add'>+	 * task or some other concurrent task, and the transaction abort path</div><div class='add'>+	 * iterates over all existing ordered extents and sets the flag</div><div class='add'>+	 * BTRFS_ORDERED_IOERR on them.</div><div class='add'>+	 */</div><div class='add'>+	if (unlikely(flags &amp; (1U &lt;&lt; BTRFS_ORDERED_IOERR))) {</div><div class='add'>+		const int fs_error = BTRFS_FS_ERROR(fs_info);</div><div class='ctx'> </div><div class='del'>-	return ret;</div><div class='add'>+		return fs_error ? ERR_PTR(fs_error) : ERR_PTR(-EIO);</div><div class='add'>+	}</div><div class='add'>+	/* We cannot split partially completed ordered extents. */</div><div class='add'>+	if (ordered-&gt;bytes_left) {</div><div class='add'>+		ASSERT(!(flags &amp; ~BTRFS_ORDERED_TYPE_FLAGS));</div><div class='add'>+		if (WARN_ON_ONCE(ordered-&gt;bytes_left != ordered-&gt;disk_num_bytes))</div><div class='add'>+			return ERR_PTR(-EINVAL);</div><div class='add'>+	}</div><div class='add'>+	/* We cannot split a compressed ordered extent. */</div><div class='add'>+	if (WARN_ON_ONCE(ordered-&gt;disk_num_bytes != ordered-&gt;num_bytes))</div><div class='add'>+		return ERR_PTR(-EINVAL);</div><div class='add'>+</div><div class='add'>+	new = alloc_ordered_extent(inode, file_offset, len, len, disk_bytenr,</div><div class='add'>+				   len, 0, flags, ordered-&gt;compress_type);</div><div class='add'>+	if (IS_ERR(new))</div><div class='add'>+		return new;</div><div class='add'>+</div><div class='add'>+	/* One ref for the tree. */</div><div class='add'>+	refcount_inc(&amp;new-&gt;refs);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Take the root's ordered_extent_lock to avoid a race with</div><div class='add'>+	 * btrfs_wait_ordered_extents() when updating the disk_bytenr and</div><div class='add'>+	 * disk_num_bytes fields of the ordered extent below.</div><div class='add'>+	 *</div><div class='add'>+	 * There's no concern about a previous caller of</div><div class='add'>+	 * btrfs_wait_ordered_extents() getting the trimmed ordered extent</div><div class='add'>+	 * before we insert the new one, because even if it gets the ordered</div><div class='add'>+	 * extent before it's trimmed and the new one inserted, right before it</div><div class='add'>+	 * uses it or during its use, the ordered extent might have been</div><div class='add'>+	 * trimmed in the meanwhile, and it missed the new ordered extent.</div><div class='add'>+	 * There's no way around this and it's harmless for current use cases,</div><div class='add'>+	 * so we take the root's ordered_extent_lock to fix that race during</div><div class='add'>+	 * trimming and silence tools like KCSAN.</div><div class='add'>+	 */</div><div class='add'>+	spin_lock_irq(&amp;root-&gt;ordered_extent_lock);</div><div class='add'>+	spin_lock(&amp;inode-&gt;ordered_tree_lock);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We don't have overlapping ordered extents (that would imply double</div><div class='add'>+	 * allocation of extents) and we checked above that the split length</div><div class='add'>+	 * does not cross the ordered extent's num_bytes field, so there's</div><div class='add'>+	 * no need to remove it and re-insert it in the tree.</div><div class='add'>+	 */</div><div class='add'>+	ordered-&gt;file_offset += len;</div><div class='add'>+	ordered-&gt;disk_bytenr += len;</div><div class='add'>+	ordered-&gt;num_bytes -= len;</div><div class='add'>+	ordered-&gt;disk_num_bytes -= len;</div><div class='add'>+	ordered-&gt;ram_bytes -= len;</div><div class='add'>+</div><div class='add'>+	if (test_bit(BTRFS_ORDERED_IO_DONE, &amp;ordered-&gt;flags)) {</div><div class='add'>+		ASSERT(ordered-&gt;bytes_left == 0);</div><div class='add'>+		new-&gt;bytes_left = 0;</div><div class='add'>+	} else {</div><div class='add'>+		ordered-&gt;bytes_left -= len;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (test_bit(BTRFS_ORDERED_TRUNCATED, &amp;ordered-&gt;flags)) {</div><div class='add'>+		if (ordered-&gt;truncated_len &gt; len) {</div><div class='add'>+			ordered-&gt;truncated_len -= len;</div><div class='add'>+		} else {</div><div class='add'>+			new-&gt;truncated_len = ordered-&gt;truncated_len;</div><div class='add'>+			ordered-&gt;truncated_len = 0;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	list_for_each_entry_safe(sum, tmpsum, &amp;ordered-&gt;list, list) {</div><div class='add'>+		if (offset == len)</div><div class='add'>+			break;</div><div class='add'>+		list_move_tail(&amp;sum-&gt;list, &amp;new-&gt;list);</div><div class='add'>+		offset += sum-&gt;len;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	node = tree_insert(&amp;inode-&gt;ordered_tree, new-&gt;file_offset, &amp;new-&gt;rb_node);</div><div class='add'>+	if (unlikely(node))</div><div class='add'>+		btrfs_panic(fs_info, -EEXIST,</div><div class='add'>+			"inconsistency in ordered tree at offset %llu after split",</div><div class='add'>+			new-&gt;file_offset);</div><div class='add'>+	spin_unlock(&amp;inode-&gt;ordered_tree_lock);</div><div class='add'>+</div><div class='add'>+	list_add_tail(&amp;new-&gt;root_extent_list, &amp;root-&gt;ordered_extents);</div><div class='add'>+	root-&gt;nr_ordered_extents++;</div><div class='add'>+	spin_unlock_irq(&amp;root-&gt;ordered_extent_lock);</div><div class='add'>+	return new;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int __init ordered_data_init(void)</div><div class='ctx'> {</div><div class='del'>-	btrfs_ordered_extent_cache = kmem_cache_create("btrfs_ordered_extent",</div><div class='del'>-				     sizeof(struct btrfs_ordered_extent), 0,</div><div class='del'>-				     SLAB_MEM_SPREAD,</div><div class='del'>-				     NULL);</div><div class='add'>+	btrfs_ordered_extent_cache = KMEM_CACHE(btrfs_ordered_extent, 0);</div><div class='ctx'> 	if (!btrfs_ordered_extent_cache)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='head'>diff --git a/fs/btrfs/ordered-data.h b/fs/btrfs/ordered-data.h<br/>index 4194e960ff61..1e6b0b182b29 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/ordered-data.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/ordered-data.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/ordered-data.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/ordered-data.h</a></div><div class='hunk'>@@ -6,21 +6,30 @@</div><div class='ctx'> #ifndef BTRFS_ORDERED_DATA_H</div><div class='ctx'> #define BTRFS_ORDERED_DATA_H</div><div class='ctx'> </div><div class='del'>-/* one of these per inode */</div><div class='del'>-struct btrfs_ordered_inode_tree {</div><div class='del'>-	spinlock_t lock;</div><div class='del'>-	struct rb_root tree;</div><div class='del'>-	struct rb_node *last;</div><div class='del'>-};</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+#include &lt;linux/list.h&gt;</div><div class='add'>+#include &lt;linux/refcount.h&gt;</div><div class='add'>+#include &lt;linux/completion.h&gt;</div><div class='add'>+#include &lt;linux/rbtree.h&gt;</div><div class='add'>+#include &lt;linux/wait.h&gt;</div><div class='add'>+#include "async-thread.h"</div><div class='add'>+</div><div class='add'>+struct inode;</div><div class='add'>+struct page;</div><div class='add'>+struct extent_state;</div><div class='add'>+struct btrfs_block_group;</div><div class='add'>+struct btrfs_inode;</div><div class='add'>+struct btrfs_root;</div><div class='add'>+struct btrfs_fs_info;</div><div class='ctx'> </div><div class='ctx'> struct btrfs_ordered_sum {</div><div class='del'>-	/* bytenr is the start of this extent on disk */</div><div class='del'>-	u64 bytenr;</div><div class='del'>-</div><div class='ctx'> 	/*</div><div class='del'>-	 * this is the length in bytes covered by the sums array below.</div><div class='add'>+	 * Logical start address and length for of the blocks covered by</div><div class='add'>+	 * the sums array.</div><div class='ctx'> 	 */</div><div class='del'>-	int len;</div><div class='add'>+	u64 logical;</div><div class='add'>+	u32 len;</div><div class='add'>+</div><div class='ctx'> 	struct list_head list;</div><div class='ctx'> 	/* last field is a variable length array of csums */</div><div class='ctx'> 	u8 sums[];</div><div class='hunk'>@@ -74,8 +83,18 @@ enum {</div><div class='ctx'> 	BTRFS_ORDERED_LOGGED_CSUM,</div><div class='ctx'> 	/* We wait for this extent to complete in the current transaction */</div><div class='ctx'> 	BTRFS_ORDERED_PENDING,</div><div class='add'>+	/* BTRFS_IOC_ENCODED_WRITE */</div><div class='add'>+	BTRFS_ORDERED_ENCODED,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+/* BTRFS_ORDERED_* flags that specify the type of the extent. */</div><div class='add'>+#define BTRFS_ORDERED_TYPE_FLAGS ((1UL &lt;&lt; BTRFS_ORDERED_REGULAR) |	\</div><div class='add'>+				  (1UL &lt;&lt; BTRFS_ORDERED_NOCOW) |	\</div><div class='add'>+				  (1UL &lt;&lt; BTRFS_ORDERED_PREALLOC) |	\</div><div class='add'>+				  (1UL &lt;&lt; BTRFS_ORDERED_COMPRESSED) |	\</div><div class='add'>+				  (1UL &lt;&lt; BTRFS_ORDERED_DIRECT) |	\</div><div class='add'>+				  (1UL &lt;&lt; BTRFS_ORDERED_ENCODED))</div><div class='add'>+</div><div class='ctx'> struct btrfs_ordered_extent {</div><div class='ctx'> 	/* logical offset in the file */</div><div class='ctx'> 	u64 file_offset;</div><div class='hunk'>@@ -84,21 +103,16 @@ struct btrfs_ordered_extent {</div><div class='ctx'> 	 * These fields directly correspond to the same fields in</div><div class='ctx'> 	 * btrfs_file_extent_item.</div><div class='ctx'> 	 */</div><div class='del'>-	u64 disk_bytenr;</div><div class='ctx'> 	u64 num_bytes;</div><div class='add'>+	u64 ram_bytes;</div><div class='add'>+	u64 disk_bytenr;</div><div class='ctx'> 	u64 disk_num_bytes;</div><div class='add'>+	u64 offset;</div><div class='ctx'> </div><div class='ctx'> 	/* number of bytes that still need writing */</div><div class='ctx'> 	u64 bytes_left;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * the end of the ordered extent which is behind it but</div><div class='del'>-	 * didn't update disk_i_size. Please see the comment of</div><div class='del'>-	 * btrfs_ordered_update_i_size();</div><div class='del'>-	 */</div><div class='del'>-	u64 outstanding_isize;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='ctx'> 	 * If we get truncated we need to adjust the file extent we enter for</div><div class='ctx'> 	 * this ordered extent so that we do not expose stale data.</div><div class='ctx'> 	 */</div><div class='hunk'>@@ -117,7 +131,7 @@ struct btrfs_ordered_extent {</div><div class='ctx'> 	refcount_t refs;</div><div class='ctx'> </div><div class='ctx'> 	/* the inode we belong to */</div><div class='del'>-	struct inode *inode;</div><div class='add'>+	struct btrfs_inode *inode;</div><div class='ctx'> </div><div class='ctx'> 	/* list of checksums for insertion when the extent io is done */</div><div class='ctx'> 	struct list_head list;</div><div class='hunk'>@@ -140,59 +154,52 @@ struct btrfs_ordered_extent {</div><div class='ctx'> 	struct btrfs_work flush_work;</div><div class='ctx'> 	struct list_head work_list;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Used to reverse-map physical address returned from ZONE_APPEND write</div><div class='del'>-	 * command in a workqueue context</div><div class='del'>-	 */</div><div class='del'>-	u64 physical;</div><div class='del'>-	struct block_device *bdev;</div><div class='add'>+	struct list_head bioc_list;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * calculates the total size you need to allocate for an ordered sum</div><div class='del'>- * structure spanning 'bytes' in the file</div><div class='del'>- */</div><div class='del'>-static inline int btrfs_ordered_sum_size(struct btrfs_fs_info *fs_info,</div><div class='del'>-					 unsigned long bytes)</div><div class='del'>-{</div><div class='del'>-	int num_sectors = (int)DIV_ROUND_UP(bytes, fs_info-&gt;sectorsize);</div><div class='del'>-</div><div class='del'>-	return sizeof(struct btrfs_ordered_sum) + num_sectors * fs_info-&gt;csum_size;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void</div><div class='del'>-btrfs_ordered_inode_tree_init(struct btrfs_ordered_inode_tree *t)</div><div class='del'>-{</div><div class='del'>-	spin_lock_init(&amp;t-&gt;lock);</div><div class='del'>-	t-&gt;tree = RB_ROOT;</div><div class='del'>-	t-&gt;last = NULL;</div><div class='del'>-}</div><div class='add'>+int btrfs_finish_one_ordered(struct btrfs_ordered_extent *ordered_extent);</div><div class='add'>+int btrfs_finish_ordered_io(struct btrfs_ordered_extent *ordered_extent);</div><div class='ctx'> </div><div class='ctx'> void btrfs_put_ordered_extent(struct btrfs_ordered_extent *entry);</div><div class='ctx'> void btrfs_remove_ordered_extent(struct btrfs_inode *btrfs_inode,</div><div class='ctx'> 				struct btrfs_ordered_extent *entry);</div><div class='add'>+void btrfs_finish_ordered_extent(struct btrfs_ordered_extent *ordered,</div><div class='add'>+				 struct folio *folio, u64 file_offset, u64 len,</div><div class='add'>+				 bool uptodate);</div><div class='ctx'> void btrfs_mark_ordered_io_finished(struct btrfs_inode *inode,</div><div class='del'>-				struct page *page, u64 file_offset,</div><div class='del'>-				u64 num_bytes, btrfs_func_t finish_func,</div><div class='del'>-				bool uptodate);</div><div class='add'>+				    struct folio *folio, u64 file_offset,</div><div class='add'>+				    u64 num_bytes, bool uptodate);</div><div class='ctx'> bool btrfs_dec_test_ordered_pending(struct btrfs_inode *inode,</div><div class='ctx'> 				    struct btrfs_ordered_extent **cached,</div><div class='ctx'> 				    u64 file_offset, u64 io_size);</div><div class='del'>-int btrfs_add_ordered_extent(struct btrfs_inode *inode, u64 file_offset,</div><div class='del'>-			     u64 disk_bytenr, u64 num_bytes, u64 disk_num_bytes,</div><div class='del'>-			     int type);</div><div class='del'>-int btrfs_add_ordered_extent_dio(struct btrfs_inode *inode, u64 file_offset,</div><div class='del'>-				 u64 disk_bytenr, u64 num_bytes,</div><div class='del'>-				 u64 disk_num_bytes, int type);</div><div class='del'>-int btrfs_add_ordered_extent_compress(struct btrfs_inode *inode, u64 file_offset,</div><div class='del'>-				      u64 disk_bytenr, u64 num_bytes,</div><div class='del'>-				      u64 disk_num_bytes, int compress_type);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * This represents details about the target file extent item of a write operation.</div><div class='add'>+ */</div><div class='add'>+struct btrfs_file_extent {</div><div class='add'>+	u64 disk_bytenr;</div><div class='add'>+	u64 disk_num_bytes;</div><div class='add'>+	u64 num_bytes;</div><div class='add'>+	u64 ram_bytes;</div><div class='add'>+	u64 offset;</div><div class='add'>+	u8 compression;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct btrfs_ordered_extent *btrfs_alloc_ordered_extent(</div><div class='add'>+			struct btrfs_inode *inode, u64 file_offset,</div><div class='add'>+			const struct btrfs_file_extent *file_extent, unsigned long flags);</div><div class='ctx'> void btrfs_add_ordered_sum(struct btrfs_ordered_extent *entry,</div><div class='ctx'> 			   struct btrfs_ordered_sum *sum);</div><div class='ctx'> struct btrfs_ordered_extent *btrfs_lookup_ordered_extent(struct btrfs_inode *inode,</div><div class='ctx'> 							 u64 file_offset);</div><div class='del'>-void btrfs_start_ordered_extent(struct btrfs_ordered_extent *entry, int wait);</div><div class='del'>-int btrfs_wait_ordered_range(struct inode *inode, u64 start, u64 len);</div><div class='add'>+void btrfs_start_ordered_extent_nowriteback(struct btrfs_ordered_extent *entry,</div><div class='add'>+				u64 nowriteback_start, u32 nowriteback_len);</div><div class='add'>+static inline void btrfs_start_ordered_extent(struct btrfs_ordered_extent *entry)</div><div class='add'>+{</div><div class='add'>+	return btrfs_start_ordered_extent_nowriteback(entry, 0, 0);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_wait_ordered_range(struct btrfs_inode *inode, u64 start, u64 len);</div><div class='ctx'> struct btrfs_ordered_extent *</div><div class='ctx'> btrfs_lookup_first_ordered_extent(struct btrfs_inode *inode, u64 file_offset);</div><div class='ctx'> struct btrfs_ordered_extent *btrfs_lookup_first_ordered_range(</div><div class='hunk'>@@ -204,14 +211,17 @@ struct btrfs_ordered_extent *btrfs_lookup_ordered_range(</div><div class='ctx'> void btrfs_get_ordered_extents_for_logging(struct btrfs_inode *inode,</div><div class='ctx'> 					   struct list_head *list);</div><div class='ctx'> u64 btrfs_wait_ordered_extents(struct btrfs_root *root, u64 nr,</div><div class='del'>-			       const u64 range_start, const u64 range_len);</div><div class='add'>+			       const struct btrfs_block_group *bg);</div><div class='ctx'> void btrfs_wait_ordered_roots(struct btrfs_fs_info *fs_info, u64 nr,</div><div class='del'>-			      const u64 range_start, const u64 range_len);</div><div class='add'>+			      const struct btrfs_block_group *bg);</div><div class='ctx'> void btrfs_lock_and_flush_ordered_range(struct btrfs_inode *inode, u64 start,</div><div class='ctx'> 					u64 end,</div><div class='ctx'> 					struct extent_state **cached_state);</div><div class='del'>-int btrfs_split_ordered_extent(struct btrfs_ordered_extent *ordered, u64 pre,</div><div class='del'>-			       u64 post);</div><div class='add'>+bool btrfs_try_lock_ordered_range(struct btrfs_inode *inode, u64 start, u64 end,</div><div class='add'>+				  struct extent_state **cached_state);</div><div class='add'>+struct btrfs_ordered_extent *btrfs_split_ordered_extent(</div><div class='add'>+			struct btrfs_ordered_extent *ordered, u64 len);</div><div class='add'>+void btrfs_mark_ordered_extent_error(struct btrfs_ordered_extent *ordered);</div><div class='ctx'> int __init ordered_data_init(void);</div><div class='ctx'> void __cold ordered_data_exit(void);</div><div class='ctx'> </div><div class='head'>diff --git a/fs/btrfs/orphan.c b/fs/btrfs/orphan.c<br/>index aa534108c1e2..9f3ad124104f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/orphan.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/orphan.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/orphan.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/orphan.c</a></div><div class='hunk'>@@ -4,14 +4,13 @@</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> #include "ctree.h"</div><div class='del'>-#include "disk-io.h"</div><div class='add'>+#include "orphan.h"</div><div class='ctx'> </div><div class='ctx'> int btrfs_insert_orphan_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			     struct btrfs_root *root, u64 offset)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='del'>-	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = BTRFS_ORPHAN_OBJECTID;</div><div class='ctx'> 	key.type = BTRFS_ORPHAN_ITEM_KEY;</div><div class='hunk'>@@ -21,16 +20,13 @@ int btrfs_insert_orphan_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_insert_empty_item(trans, root, path, &amp;key, 0);</div><div class='del'>-</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	return btrfs_insert_empty_item(trans, root, path, &amp;key, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_del_orphan_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			  struct btrfs_root *root, u64 offset)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -44,15 +40,9 @@ int btrfs_del_orphan_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_search_slot(trans, root, &amp;key, path, -1, 1);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-	if (ret) { /* JDM: Really? */</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = btrfs_del_item(trans, root, path);</div><div class='add'>+		return ret;</div><div class='add'>+	if (ret)</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	return btrfs_del_item(trans, root, path);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/btrfs/orphan.h b/fs/btrfs/orphan.h<br/>new file mode 100644<br/>index 000000000000..aa54a88a60de<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/orphan.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/orphan.h</a></div><div class='hunk'>@@ -0,0 +1,16 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+</div><div class='add'>+#ifndef BTRFS_ORPHAN_H</div><div class='add'>+#define BTRFS_ORPHAN_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+</div><div class='add'>+struct btrfs_trans_handle;</div><div class='add'>+struct btrfs_root;</div><div class='add'>+</div><div class='add'>+int btrfs_insert_orphan_item(struct btrfs_trans_handle *trans,</div><div class='add'>+			     struct btrfs_root *root, u64 offset);</div><div class='add'>+int btrfs_del_orphan_item(struct btrfs_trans_handle *trans,</div><div class='add'>+			  struct btrfs_root *root, u64 offset);</div><div class='add'>+</div><div class='add'>+#endif</div><div class='head'>diff --git a/fs/btrfs/print-tree.c b/fs/btrfs/print-tree.c<br/>index aae1027bd76a..f189bf09ce6a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/print-tree.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/print-tree.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/print-tree.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/print-tree.c</a></div><div class='hunk'>@@ -3,13 +3,25 @@</div><div class='ctx'>  * Copyright (C) 2007 Oracle.  All rights reserved.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='add'>+#include "messages.h"</div><div class='ctx'> #include "ctree.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='add'>+#include "file-item.h"</div><div class='ctx'> #include "print-tree.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "tree-checker.h"</div><div class='add'>+#include "volumes.h"</div><div class='add'>+#include "raid-stripe-tree.h"</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Large enough buffer size for the stringification of any key type yet short</div><div class='add'>+ * enough to use the stack and avoid allocations.</div><div class='add'>+ */</div><div class='add'>+#define KEY_TYPE_BUF_SIZE 32</div><div class='ctx'> </div><div class='ctx'> struct root_name_map {</div><div class='ctx'> 	u64 id;</div><div class='del'>-	char name[16];</div><div class='add'>+	const char *name;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct root_name_map root_map[] = {</div><div class='hunk'>@@ -23,7 +35,9 @@ static const struct root_name_map root_map[] = {</div><div class='ctx'> 	{ BTRFS_QUOTA_TREE_OBJECTID,		"QUOTA_TREE"		},</div><div class='ctx'> 	{ BTRFS_UUID_TREE_OBJECTID,		"UUID_TREE"		},</div><div class='ctx'> 	{ BTRFS_FREE_SPACE_TREE_OBJECTID,	"FREE_SPACE_TREE"	},</div><div class='add'>+	{ BTRFS_BLOCK_GROUP_TREE_OBJECTID,	"BLOCK_GROUP_TREE"	},</div><div class='ctx'> 	{ BTRFS_DATA_RELOC_TREE_OBJECTID,	"DATA_RELOC_TREE"	},</div><div class='add'>+	{ BTRFS_RAID_STRIPE_TREE_OBJECTID,	"RAID_STRIPE_TREE"	},</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const char *btrfs_root_name(const struct btrfs_key *key, char *buf)</div><div class='hunk'>@@ -45,7 +59,7 @@ const char *btrfs_root_name(const struct btrfs_key *key, char *buf)</div><div class='ctx'> 	return buf;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void print_chunk(struct extent_buffer *eb, struct btrfs_chunk *chunk)</div><div class='add'>+static void print_chunk(const struct extent_buffer *eb, struct btrfs_chunk *chunk)</div><div class='ctx'> {</div><div class='ctx'> 	int num_stripes = btrfs_chunk_num_stripes(eb, chunk);</div><div class='ctx'> 	int i;</div><div class='hunk'>@@ -58,7 +72,7 @@ static void print_chunk(struct extent_buffer *eb, struct btrfs_chunk *chunk)</div><div class='ctx'> 		      btrfs_stripe_offset_nr(eb, chunk, i));</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='del'>-static void print_dev_item(struct extent_buffer *eb,</div><div class='add'>+static void print_dev_item(const struct extent_buffer *eb,</div><div class='ctx'> 			   struct btrfs_dev_item *dev_item)</div><div class='ctx'> {</div><div class='ctx'> 	pr_info("\t\tdev item devid %llu total_bytes %llu bytes used %llu\n",</div><div class='hunk'>@@ -66,7 +80,7 @@ static void print_dev_item(struct extent_buffer *eb,</div><div class='ctx'> 	       btrfs_device_total_bytes(eb, dev_item),</div><div class='ctx'> 	       btrfs_device_bytes_used(eb, dev_item));</div><div class='ctx'> }</div><div class='del'>-static void print_extent_data_ref(struct extent_buffer *eb,</div><div class='add'>+static void print_extent_data_ref(const struct extent_buffer *eb,</div><div class='ctx'> 				  struct btrfs_extent_data_ref *ref)</div><div class='ctx'> {</div><div class='ctx'> 	pr_cont("extent data backref root %llu objectid %llu offset %llu count %u\n",</div><div class='hunk'>@@ -76,23 +90,33 @@ static void print_extent_data_ref(struct extent_buffer *eb,</div><div class='ctx'> 	       btrfs_extent_data_ref_count(eb, ref));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void print_extent_item(struct extent_buffer *eb, int slot, int type)</div><div class='add'>+static void print_extent_owner_ref(const struct extent_buffer *eb,</div><div class='add'>+				   const struct btrfs_extent_owner_ref *ref)</div><div class='add'>+{</div><div class='add'>+	ASSERT(btrfs_fs_incompat(eb-&gt;fs_info, SIMPLE_QUOTA));</div><div class='add'>+	pr_cont("extent data owner root %llu\n", btrfs_extent_owner_ref_root_id(eb, ref));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void print_extent_item(const struct extent_buffer *eb, int slot, int type)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_extent_item *ei;</div><div class='ctx'> 	struct btrfs_extent_inline_ref *iref;</div><div class='ctx'> 	struct btrfs_extent_data_ref *dref;</div><div class='ctx'> 	struct btrfs_shared_data_ref *sref;</div><div class='add'>+	struct btrfs_extent_owner_ref *oref;</div><div class='ctx'> 	struct btrfs_disk_key key;</div><div class='ctx'> 	unsigned long end;</div><div class='ctx'> 	unsigned long ptr;</div><div class='del'>-	u32 item_size = btrfs_item_size_nr(eb, slot);</div><div class='add'>+	u32 item_size = btrfs_item_size(eb, slot);</div><div class='ctx'> 	u64 flags;</div><div class='ctx'> 	u64 offset;</div><div class='ctx'> 	int ref_index = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(item_size &lt; sizeof(*ei))) {</div><div class='del'>-		btrfs_print_v0_err(eb-&gt;fs_info);</div><div class='del'>-		btrfs_handle_fs_error(eb-&gt;fs_info, -EINVAL, NULL);</div><div class='add'>+		btrfs_err(eb-&gt;fs_info,</div><div class='add'>+			  "unexpected extent item size, has %u expect &gt;= %zu",</div><div class='add'>+			  item_size, sizeof(*ei));</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ei = btrfs_item_ptr(eb, slot, struct btrfs_extent_item);</div><div class='hunk'>@@ -107,7 +131,7 @@ static void print_extent_item(struct extent_buffer *eb, int slot, int type)</div><div class='ctx'> 		struct btrfs_tree_block_info *info;</div><div class='ctx'> 		info = (struct btrfs_tree_block_info *)(ei + 1);</div><div class='ctx'> 		btrfs_tree_block_key(eb, info, &amp;key);</div><div class='del'>-		pr_info("\t\ttree block key (%llu %u %llu) level %d\n",</div><div class='add'>+		pr_info("\t\ttree block key " BTRFS_KEY_FMT " level %d\n",</div><div class='ctx'> 		       btrfs_disk_key_objectid(&amp;key), key.type,</div><div class='ctx'> 		       btrfs_disk_key_offset(&amp;key),</div><div class='ctx'> 		       btrfs_tree_block_level(eb, info));</div><div class='hunk'>@@ -147,14 +171,18 @@ static void print_extent_item(struct extent_buffer *eb, int slot, int type)</div><div class='ctx'> 			pr_cont("shared data backref parent %llu count %u\n",</div><div class='ctx'> 			       offset, btrfs_shared_data_ref_count(eb, sref));</div><div class='ctx'> 			/*</div><div class='del'>-			 * offset is supposed to be a tree block which</div><div class='del'>-			 * must be aligned to nodesize.</div><div class='add'>+			 * Offset is supposed to be a tree block which must be</div><div class='add'>+			 * aligned to sectorsize.</div><div class='ctx'> 			 */</div><div class='del'>-			if (!IS_ALIGNED(offset, eb-&gt;fs_info-&gt;nodesize))</div><div class='add'>+			if (!IS_ALIGNED(offset, eb-&gt;fs_info-&gt;sectorsize))</div><div class='ctx'> 				pr_info(</div><div class='ctx'> 			"\t\t\t(parent %llu not aligned to sectorsize %u)\n",</div><div class='ctx'> 				     offset, eb-&gt;fs_info-&gt;sectorsize);</div><div class='ctx'> 			break;</div><div class='add'>+		case BTRFS_EXTENT_OWNER_REF_KEY:</div><div class='add'>+			oref = (struct btrfs_extent_owner_ref *)(&amp;iref-&gt;offset);</div><div class='add'>+			print_extent_owner_ref(eb, oref);</div><div class='add'>+			break;</div><div class='ctx'> 		default:</div><div class='ctx'> 			pr_cont("(extent %llu has INVALID ref type %d)\n",</div><div class='ctx'> 				  eb-&gt;start, type);</div><div class='hunk'>@@ -165,11 +193,11 @@ static void print_extent_item(struct extent_buffer *eb, int slot, int type)</div><div class='ctx'> 	WARN_ON(ptr &gt; end);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void print_uuid_item(struct extent_buffer *l, unsigned long offset,</div><div class='add'>+static void print_uuid_item(const struct extent_buffer *l, unsigned long offset,</div><div class='ctx'> 			    u32 item_size)</div><div class='ctx'> {</div><div class='ctx'> 	if (!IS_ALIGNED(item_size, sizeof(u64))) {</div><div class='del'>-		pr_warn("BTRFS: uuid item with illegal size %lu!\n",</div><div class='add'>+		btrfs_warn(l-&gt;fs_info, "uuid item with illegal size %lu",</div><div class='ctx'> 			(unsigned long)item_size);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -183,34 +211,231 @@ static void print_uuid_item(struct extent_buffer *l, unsigned long offset,</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void print_raid_stripe_key(const struct extent_buffer *eb, u32 item_size,</div><div class='add'>+				  struct btrfs_stripe_extent *stripe)</div><div class='add'>+{</div><div class='add'>+	const int num_stripes = btrfs_num_raid_stripes(item_size);</div><div class='add'>+</div><div class='add'>+	for (int i = 0; i &lt; num_stripes; i++)</div><div class='add'>+		pr_info("\t\t\tstride %d devid %llu physical %llu\n",</div><div class='add'>+			i, btrfs_raid_stride_devid(eb, &amp;stripe-&gt;strides[i]),</div><div class='add'>+			btrfs_raid_stride_physical(eb, &amp;stripe-&gt;strides[i]));</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Helper to output refs and locking status of extent buffer.  Useful to debug</div><div class='ctx'>  * race condition related problems.</div><div class='ctx'>  */</div><div class='del'>-static void print_eb_refs_lock(struct extent_buffer *eb)</div><div class='add'>+static void print_eb_refs_lock(const struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='ctx'> #ifdef CONFIG_BTRFS_DEBUG</div><div class='ctx'> 	btrfs_info(eb-&gt;fs_info, "refs %u lock_owner %u current %u",</div><div class='del'>-		   atomic_read(&amp;eb-&gt;refs), eb-&gt;lock_owner, current-&gt;pid);</div><div class='add'>+		   refcount_read(&amp;eb-&gt;refs), eb-&gt;lock_owner, current-&gt;pid);</div><div class='ctx'> #endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_print_leaf(struct extent_buffer *l)</div><div class='add'>+static void print_timespec(const struct extent_buffer *eb,</div><div class='add'>+			   struct btrfs_timespec *timespec,</div><div class='add'>+			   const char *prefix, const char *suffix)</div><div class='add'>+{</div><div class='add'>+	const u64 secs = btrfs_timespec_sec(eb, timespec);</div><div class='add'>+	const u32 nsecs = btrfs_timespec_nsec(eb, timespec);</div><div class='add'>+</div><div class='add'>+	pr_info("%s%llu.%u%s", prefix, secs, nsecs, suffix);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void print_inode_item(const struct extent_buffer *eb, int i)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_inode_item *ii = btrfs_item_ptr(eb, i, struct btrfs_inode_item);</div><div class='add'>+</div><div class='add'>+	pr_info("\t\tinode generation %llu transid %llu size %llu nbytes %llu\n",</div><div class='add'>+		btrfs_inode_generation(eb, ii), btrfs_inode_transid(eb, ii),</div><div class='add'>+		btrfs_inode_size(eb, ii), btrfs_inode_nbytes(eb, ii));</div><div class='add'>+	pr_info("\t\tblock group %llu mode %o links %u uid %u gid %u\n",</div><div class='add'>+		btrfs_inode_block_group(eb, ii), btrfs_inode_mode(eb, ii),</div><div class='add'>+		btrfs_inode_nlink(eb, ii), btrfs_inode_uid(eb, ii),</div><div class='add'>+		btrfs_inode_gid(eb, ii));</div><div class='add'>+	pr_info("\t\trdev %llu sequence %llu flags 0x%llx\n",</div><div class='add'>+		btrfs_inode_rdev(eb, ii), btrfs_inode_sequence(eb, ii),</div><div class='add'>+		btrfs_inode_flags(eb, ii));</div><div class='add'>+	print_timespec(eb, &amp;ii-&gt;atime, "\t\tatime ", "\n");</div><div class='add'>+	print_timespec(eb, &amp;ii-&gt;ctime, "\t\tctime ", "\n");</div><div class='add'>+	print_timespec(eb, &amp;ii-&gt;mtime, "\t\tmtime ", "\n");</div><div class='add'>+	print_timespec(eb, &amp;ii-&gt;otime, "\t\totime ", "\n");</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void print_dir_item(const struct extent_buffer *eb, int i)</div><div class='add'>+{</div><div class='add'>+	const u32 size = btrfs_item_size(eb, i);</div><div class='add'>+	struct btrfs_dir_item *di = btrfs_item_ptr(eb, i, struct btrfs_dir_item);</div><div class='add'>+	u32 cur = 0;</div><div class='add'>+</div><div class='add'>+	while (cur &lt; size) {</div><div class='add'>+		const u32 name_len = btrfs_dir_name_len(eb, di);</div><div class='add'>+		const u32 data_len = btrfs_dir_data_len(eb, di);</div><div class='add'>+		const u32 len = sizeof(*di) + name_len + data_len;</div><div class='add'>+		struct btrfs_key location;</div><div class='add'>+</div><div class='add'>+		btrfs_dir_item_key_to_cpu(eb, di, &amp;location);</div><div class='add'>+		pr_info("\t\tlocation key " BTRFS_KEY_FMT " type %d\n",</div><div class='add'>+			BTRFS_KEY_FMT_VALUE(&amp;location), btrfs_dir_ftype(eb, di));</div><div class='add'>+		pr_info("\t\ttransid %llu data_len %u name_len %u\n",</div><div class='add'>+			btrfs_dir_transid(eb, di), data_len, name_len);</div><div class='add'>+		di = (struct btrfs_dir_item *)((char *)di + len);</div><div class='add'>+		cur += len;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void print_inode_ref_item(const struct extent_buffer *eb, int i)</div><div class='add'>+{</div><div class='add'>+	const u32 size = btrfs_item_size(eb, i);</div><div class='add'>+	struct btrfs_inode_ref *ref = btrfs_item_ptr(eb, i, struct btrfs_inode_ref);</div><div class='add'>+	u32 cur = 0;</div><div class='add'>+</div><div class='add'>+	while (cur &lt; size) {</div><div class='add'>+		const u64 index = btrfs_inode_ref_index(eb, ref);</div><div class='add'>+		const u32 name_len = btrfs_inode_ref_name_len(eb, ref);</div><div class='add'>+		const u32 len = sizeof(*ref) + name_len;</div><div class='add'>+</div><div class='add'>+		pr_info("\t\tindex %llu name_len %u\n", index, name_len);</div><div class='add'>+		ref = (struct btrfs_inode_ref *)((char *)ref + len);</div><div class='add'>+		cur += len;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void print_inode_extref_item(const struct extent_buffer *eb, int i)</div><div class='add'>+{</div><div class='add'>+	const u32 size = btrfs_item_size(eb, i);</div><div class='add'>+	struct btrfs_inode_extref *extref;</div><div class='add'>+	u32 cur = 0;</div><div class='add'>+</div><div class='add'>+	extref = btrfs_item_ptr(eb, i, struct btrfs_inode_extref);</div><div class='add'>+	while (cur &lt; size) {</div><div class='add'>+		const u64 index = btrfs_inode_extref_index(eb, extref);</div><div class='add'>+		const u32 name_len = btrfs_inode_extref_name_len(eb, extref);</div><div class='add'>+		const u64 parent = btrfs_inode_extref_parent(eb, extref);</div><div class='add'>+		const u32 len = sizeof(*extref) + name_len;</div><div class='add'>+</div><div class='add'>+		pr_info("\t\tindex %llu parent %llu name_len %u\n",</div><div class='add'>+			index, parent, name_len);</div><div class='add'>+		extref = (struct btrfs_inode_extref *)((char *)extref + len);</div><div class='add'>+		cur += len;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void print_dir_log_index_item(const struct extent_buffer *eb, int i)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_dir_log_item *dlog;</div><div class='add'>+</div><div class='add'>+	dlog = btrfs_item_ptr(eb, i, struct btrfs_dir_log_item);</div><div class='add'>+	pr_info("\t\tdir log end %llu\n", btrfs_dir_log_end(eb, dlog));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void print_extent_csum(const struct extent_buffer *eb, int i)</div><div class='add'>+{</div><div class='add'>+	const struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='add'>+	const u32 size = btrfs_item_size(eb, i);</div><div class='add'>+	const u32 csum_bytes = (size / fs_info-&gt;csum_size) * fs_info-&gt;sectorsize;</div><div class='add'>+	struct btrfs_key key;</div><div class='add'>+</div><div class='add'>+	btrfs_item_key_to_cpu(eb, &amp;key, i);</div><div class='add'>+	pr_info("\t\trange start %llu end %llu length %u\n",</div><div class='add'>+		key.offset, key.offset + csum_bytes, csum_bytes);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void print_file_extent_item(const struct extent_buffer *eb, int i)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_file_extent_item *fi;</div><div class='add'>+</div><div class='add'>+	fi = btrfs_item_ptr(eb, i, struct btrfs_file_extent_item);</div><div class='add'>+	pr_info("\t\tgeneration %llu type %hhu\n",</div><div class='add'>+		btrfs_file_extent_generation(eb, fi),</div><div class='add'>+		btrfs_file_extent_type(eb, fi));</div><div class='add'>+</div><div class='add'>+	if (btrfs_file_extent_type(eb, fi) == BTRFS_FILE_EXTENT_INLINE) {</div><div class='add'>+		pr_info("\t\tinline extent data size %u ram_bytes %llu compression %hhu\n",</div><div class='add'>+			btrfs_file_extent_inline_item_len(eb, i),</div><div class='add'>+			btrfs_file_extent_ram_bytes(eb, fi),</div><div class='add'>+			btrfs_file_extent_compression(eb, fi));</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	pr_info("\t\textent data disk bytenr %llu nr %llu\n",</div><div class='add'>+		btrfs_file_extent_disk_bytenr(eb, fi),</div><div class='add'>+		btrfs_file_extent_disk_num_bytes(eb, fi));</div><div class='add'>+	pr_info("\t\textent data offset %llu nr %llu ram %llu\n",</div><div class='add'>+		btrfs_file_extent_offset(eb, fi),</div><div class='add'>+		btrfs_file_extent_num_bytes(eb, fi),</div><div class='add'>+		btrfs_file_extent_ram_bytes(eb, fi));</div><div class='add'>+	pr_info("\t\textent compression %hhu\n",</div><div class='add'>+		btrfs_file_extent_compression(eb, fi));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void key_type_string(const struct btrfs_key *key, char *buf, int buf_size)</div><div class='add'>+{</div><div class='add'>+	static const char *key_to_str[256] = {</div><div class='add'>+		[BTRFS_INODE_ITEM_KEY]			= "INODE_ITEM",</div><div class='add'>+		[BTRFS_INODE_REF_KEY]			= "INODE_REF",</div><div class='add'>+		[BTRFS_INODE_EXTREF_KEY]		= "INODE_EXTREF",</div><div class='add'>+		[BTRFS_DIR_ITEM_KEY]			= "DIR_ITEM",</div><div class='add'>+		[BTRFS_DIR_INDEX_KEY]			= "DIR_INDEX",</div><div class='add'>+		[BTRFS_DIR_LOG_ITEM_KEY]		= "DIR_LOG_ITEM",</div><div class='add'>+		[BTRFS_DIR_LOG_INDEX_KEY]		= "DIR_LOG_INDEX",</div><div class='add'>+		[BTRFS_XATTR_ITEM_KEY]			= "XATTR_ITEM",</div><div class='add'>+		[BTRFS_VERITY_DESC_ITEM_KEY]		= "VERITY_DESC_ITEM",</div><div class='add'>+		[BTRFS_VERITY_MERKLE_ITEM_KEY]		= "VERITY_MERKLE_ITEM",</div><div class='add'>+		[BTRFS_ORPHAN_ITEM_KEY]			= "ORPHAN_ITEM",</div><div class='add'>+		[BTRFS_ROOT_ITEM_KEY]			= "ROOT_ITEM",</div><div class='add'>+		[BTRFS_ROOT_REF_KEY]			= "ROOT_REF",</div><div class='add'>+		[BTRFS_ROOT_BACKREF_KEY]		= "ROOT_BACKREF",</div><div class='add'>+		[BTRFS_EXTENT_ITEM_KEY]			= "EXTENT_ITEM",</div><div class='add'>+		[BTRFS_METADATA_ITEM_KEY]		= "METADATA_ITEM",</div><div class='add'>+		[BTRFS_TREE_BLOCK_REF_KEY]		= "TREE_BLOCK_REF",</div><div class='add'>+		[BTRFS_SHARED_BLOCK_REF_KEY]		= "SHARED_BLOCK_REF",</div><div class='add'>+		[BTRFS_EXTENT_DATA_REF_KEY]		= "EXTENT_DATA_REF",</div><div class='add'>+		[BTRFS_SHARED_DATA_REF_KEY]		= "SHARED_DATA_REF",</div><div class='add'>+		[BTRFS_EXTENT_OWNER_REF_KEY]		= "EXTENT_OWNER_REF",</div><div class='add'>+		[BTRFS_EXTENT_CSUM_KEY]			= "EXTENT_CSUM",</div><div class='add'>+		[BTRFS_EXTENT_DATA_KEY]			= "EXTENT_DATA",</div><div class='add'>+		[BTRFS_BLOCK_GROUP_ITEM_KEY]		= "BLOCK_GROUP_ITEM",</div><div class='add'>+		[BTRFS_FREE_SPACE_INFO_KEY]		= "FREE_SPACE_INFO",</div><div class='add'>+		[BTRFS_FREE_SPACE_EXTENT_KEY]		= "FREE_SPACE_EXTENT",</div><div class='add'>+		[BTRFS_FREE_SPACE_BITMAP_KEY]		= "FREE_SPACE_BITMAP",</div><div class='add'>+		[BTRFS_CHUNK_ITEM_KEY]			= "CHUNK_ITEM",</div><div class='add'>+		[BTRFS_DEV_ITEM_KEY]			= "DEV_ITEM",</div><div class='add'>+		[BTRFS_DEV_EXTENT_KEY]			= "DEV_EXTENT",</div><div class='add'>+		[BTRFS_TEMPORARY_ITEM_KEY]		= "TEMPORARY_ITEM",</div><div class='add'>+		[BTRFS_DEV_REPLACE_KEY]			= "DEV_REPLACE",</div><div class='add'>+		[BTRFS_STRING_ITEM_KEY]			= "STRING_ITEM",</div><div class='add'>+		[BTRFS_QGROUP_STATUS_KEY]		= "QGROUP_STATUS",</div><div class='add'>+		[BTRFS_QGROUP_RELATION_KEY]		= "QGROUP_RELATION",</div><div class='add'>+		[BTRFS_QGROUP_INFO_KEY]			= "QGROUP_INFO",</div><div class='add'>+		[BTRFS_QGROUP_LIMIT_KEY]		= "QGROUP_LIMIT",</div><div class='add'>+		[BTRFS_PERSISTENT_ITEM_KEY]		= "PERSISTENT_ITEM",</div><div class='add'>+		[BTRFS_UUID_KEY_SUBVOL]			= "UUID_KEY_SUBVOL",</div><div class='add'>+		[BTRFS_UUID_KEY_RECEIVED_SUBVOL]	= "UUID_KEY_RECEIVED_SUBVOL",</div><div class='add'>+		[BTRFS_RAID_STRIPE_KEY]			= "RAID_STRIPE",</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+	if (key-&gt;type == 0 &amp;&amp; key-&gt;objectid == BTRFS_FREE_SPACE_OBJECTID)</div><div class='add'>+		scnprintf(buf, buf_size, "UNTYPED");</div><div class='add'>+	else if (key_to_str[key-&gt;type])</div><div class='add'>+		scnprintf(buf, buf_size, "%s", key_to_str[key-&gt;type]);</div><div class='add'>+	else</div><div class='add'>+		scnprintf(buf, buf_size, "UNKNOWN.%d", key-&gt;type);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_print_leaf(const struct extent_buffer *l)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info;</div><div class='ctx'> 	int i;</div><div class='ctx'> 	u32 type, nr;</div><div class='del'>-	struct btrfs_item *item;</div><div class='ctx'> 	struct btrfs_root_item *ri;</div><div class='del'>-	struct btrfs_dir_item *di;</div><div class='del'>-	struct btrfs_inode_item *ii;</div><div class='ctx'> 	struct btrfs_block_group_item *bi;</div><div class='del'>-	struct btrfs_file_extent_item *fi;</div><div class='ctx'> 	struct btrfs_extent_data_ref *dref;</div><div class='ctx'> 	struct btrfs_shared_data_ref *sref;</div><div class='ctx'> 	struct btrfs_dev_extent *dev_extent;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='del'>-	struct btrfs_key found_key;</div><div class='ctx'> </div><div class='ctx'> 	if (!l)</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -224,26 +449,35 @@ void btrfs_print_leaf(struct extent_buffer *l)</div><div class='ctx'> 		   btrfs_leaf_free_space(l), btrfs_header_owner(l));</div><div class='ctx'> 	print_eb_refs_lock(l);</div><div class='ctx'> 	for (i = 0 ; i &lt; nr ; i++) {</div><div class='del'>-		item = btrfs_item_nr(i);</div><div class='add'>+		char key_buf[KEY_TYPE_BUF_SIZE];</div><div class='add'>+</div><div class='ctx'> 		btrfs_item_key_to_cpu(l, &amp;key, i);</div><div class='ctx'> 		type = key.type;</div><div class='del'>-		pr_info("\titem %d key (%llu %u %llu) itemoff %d itemsize %d\n",</div><div class='del'>-			i, key.objectid, type, key.offset,</div><div class='del'>-			btrfs_item_offset(l, item), btrfs_item_size(l, item));</div><div class='add'>+		key_type_string(&amp;key, key_buf, KEY_TYPE_BUF_SIZE);</div><div class='add'>+</div><div class='add'>+		pr_info("\titem %d key (%llu %s %llu) itemoff %d itemsize %d\n",</div><div class='add'>+			i, key.objectid, key_buf, key.offset,</div><div class='add'>+			btrfs_item_offset(l, i), btrfs_item_size(l, i));</div><div class='ctx'> 		switch (type) {</div><div class='ctx'> 		case BTRFS_INODE_ITEM_KEY:</div><div class='del'>-			ii = btrfs_item_ptr(l, i, struct btrfs_inode_item);</div><div class='del'>-			pr_info("\t\tinode generation %llu size %llu mode %o\n",</div><div class='del'>-			       btrfs_inode_generation(l, ii),</div><div class='del'>-			       btrfs_inode_size(l, ii),</div><div class='del'>-			       btrfs_inode_mode(l, ii));</div><div class='add'>+			print_inode_item(l, i);</div><div class='add'>+			break;</div><div class='add'>+		case BTRFS_INODE_REF_KEY:</div><div class='add'>+			print_inode_ref_item(l, i);</div><div class='add'>+			break;</div><div class='add'>+		case BTRFS_INODE_EXTREF_KEY:</div><div class='add'>+			print_inode_extref_item(l, i);</div><div class='ctx'> 			break;</div><div class='ctx'> 		case BTRFS_DIR_ITEM_KEY:</div><div class='del'>-			di = btrfs_item_ptr(l, i, struct btrfs_dir_item);</div><div class='del'>-			btrfs_dir_item_key_to_cpu(l, di, &amp;found_key);</div><div class='del'>-			pr_info("\t\tdir oid %llu type %u\n",</div><div class='del'>-				found_key.objectid,</div><div class='del'>-				btrfs_dir_type(l, di));</div><div class='add'>+		case BTRFS_DIR_INDEX_KEY:</div><div class='add'>+		case BTRFS_XATTR_ITEM_KEY:</div><div class='add'>+			print_dir_item(l, i);</div><div class='add'>+			break;</div><div class='add'>+		case BTRFS_DIR_LOG_INDEX_KEY:</div><div class='add'>+			print_dir_log_index_item(l, i);</div><div class='add'>+			break;</div><div class='add'>+		case BTRFS_EXTENT_CSUM_KEY:</div><div class='add'>+			print_extent_csum(l, i);</div><div class='ctx'> 			break;</div><div class='ctx'> 		case BTRFS_ROOT_ITEM_KEY:</div><div class='ctx'> 			ri = btrfs_item_ptr(l, i, struct btrfs_root_item);</div><div class='hunk'>@@ -273,25 +507,7 @@ void btrfs_print_leaf(struct extent_buffer *l)</div><div class='ctx'> 			       btrfs_shared_data_ref_count(l, sref));</div><div class='ctx'> 			break;</div><div class='ctx'> 		case BTRFS_EXTENT_DATA_KEY:</div><div class='del'>-			fi = btrfs_item_ptr(l, i,</div><div class='del'>-					    struct btrfs_file_extent_item);</div><div class='del'>-			if (btrfs_file_extent_type(l, fi) ==</div><div class='del'>-			    BTRFS_FILE_EXTENT_INLINE) {</div><div class='del'>-				pr_info("\t\tinline extent data size %llu\n",</div><div class='del'>-				       btrfs_file_extent_ram_bytes(l, fi));</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			pr_info("\t\textent data disk bytenr %llu nr %llu\n",</div><div class='del'>-			       btrfs_file_extent_disk_bytenr(l, fi),</div><div class='del'>-			       btrfs_file_extent_disk_num_bytes(l, fi));</div><div class='del'>-			pr_info("\t\textent data offset %llu nr %llu ram %llu\n",</div><div class='del'>-			       btrfs_file_extent_offset(l, fi),</div><div class='del'>-			       btrfs_file_extent_num_bytes(l, fi),</div><div class='del'>-			       btrfs_file_extent_ram_bytes(l, fi));</div><div class='del'>-			break;</div><div class='del'>-		case BTRFS_EXTENT_REF_V0_KEY:</div><div class='del'>-			btrfs_print_v0_err(fs_info);</div><div class='del'>-			btrfs_handle_fs_error(fs_info, -EINVAL, NULL);</div><div class='add'>+			print_file_extent_item(l, i);</div><div class='ctx'> 			break;</div><div class='ctx'> 		case BTRFS_BLOCK_GROUP_ITEM_KEY:</div><div class='ctx'> 			bi = btrfs_item_ptr(l, i,</div><div class='hunk'>@@ -347,13 +563,17 @@ void btrfs_print_leaf(struct extent_buffer *l)</div><div class='ctx'> 		case BTRFS_UUID_KEY_SUBVOL:</div><div class='ctx'> 		case BTRFS_UUID_KEY_RECEIVED_SUBVOL:</div><div class='ctx'> 			print_uuid_item(l, btrfs_item_ptr_offset(l, i),</div><div class='del'>-					btrfs_item_size_nr(l, i));</div><div class='add'>+					btrfs_item_size(l, i));</div><div class='add'>+			break;</div><div class='add'>+		case BTRFS_RAID_STRIPE_KEY:</div><div class='add'>+			print_raid_stripe_key(l, btrfs_item_size(l, i),</div><div class='add'>+				btrfs_item_ptr(l, i, struct btrfs_stripe_extent));</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_print_tree(struct extent_buffer *c, bool follow)</div><div class='add'>+void btrfs_print_tree(const struct extent_buffer *c, bool follow)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info;</div><div class='ctx'> 	int i; u32 nr;</div><div class='hunk'>@@ -377,25 +597,26 @@ void btrfs_print_tree(struct extent_buffer *c, bool follow)</div><div class='ctx'> 	print_eb_refs_lock(c);</div><div class='ctx'> 	for (i = 0; i &lt; nr; i++) {</div><div class='ctx'> 		btrfs_node_key_to_cpu(c, &amp;key, i);</div><div class='del'>-		pr_info("\tkey %d (%llu %u %llu) block %llu gen %llu\n",</div><div class='del'>-		       i, key.objectid, key.type, key.offset,</div><div class='del'>-		       btrfs_node_blockptr(c, i),</div><div class='del'>-		       btrfs_node_ptr_generation(c, i));</div><div class='add'>+		pr_info("\tkey %d " BTRFS_KEY_FMT " block %llu gen %llu\n",</div><div class='add'>+			i, BTRFS_KEY_FMT_VALUE(&amp;key), btrfs_node_blockptr(c, i),</div><div class='add'>+			btrfs_node_ptr_generation(c, i));</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!follow)</div><div class='ctx'> 		return;</div><div class='ctx'> 	for (i = 0; i &lt; nr; i++) {</div><div class='del'>-		struct btrfs_key first_key;</div><div class='add'>+		struct btrfs_tree_parent_check check = {</div><div class='add'>+			.level = level - 1,</div><div class='add'>+			.transid = btrfs_node_ptr_generation(c, i),</div><div class='add'>+			.owner_root = btrfs_header_owner(c),</div><div class='add'>+			.has_first_key = true</div><div class='add'>+		};</div><div class='ctx'> 		struct extent_buffer *next;</div><div class='ctx'> </div><div class='del'>-		btrfs_node_key_to_cpu(c, &amp;first_key, i);</div><div class='del'>-		next = read_tree_block(fs_info, btrfs_node_blockptr(c, i),</div><div class='del'>-				       btrfs_header_owner(c),</div><div class='del'>-				       btrfs_node_ptr_generation(c, i),</div><div class='del'>-				       level - 1, &amp;first_key);</div><div class='del'>-		if (IS_ERR(next)) {</div><div class='add'>+		btrfs_node_key_to_cpu(c, &amp;check.first_key, i);</div><div class='add'>+		next = read_tree_block(fs_info, btrfs_node_blockptr(c, i), &amp;check);</div><div class='add'>+		if (IS_ERR(next))</div><div class='ctx'> 			continue;</div><div class='del'>-		} else if (!extent_buffer_uptodate(next)) {</div><div class='add'>+		if (!extent_buffer_uptodate(next)) {</div><div class='ctx'> 			free_extent_buffer(next);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='head'>diff --git a/fs/btrfs/print-tree.h b/fs/btrfs/print-tree.h<br/>index 8c3e9319ec4e..d0e620bf5f5a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/print-tree.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/print-tree.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/print-tree.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/print-tree.h</a></div><div class='hunk'>@@ -6,11 +6,16 @@</div><div class='ctx'> #ifndef BTRFS_PRINT_TREE_H</div><div class='ctx'> #define BTRFS_PRINT_TREE_H</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+</div><div class='ctx'> /* Buffer size to contain tree name and possibly additional data (offset) */</div><div class='ctx'> #define BTRFS_ROOT_NAME_BUF_LEN				48</div><div class='ctx'> </div><div class='del'>-void btrfs_print_leaf(struct extent_buffer *l);</div><div class='del'>-void btrfs_print_tree(struct extent_buffer *c, bool follow);</div><div class='add'>+struct extent_buffer;</div><div class='add'>+struct btrfs_key;</div><div class='add'>+</div><div class='add'>+void btrfs_print_leaf(const struct extent_buffer *l);</div><div class='add'>+void btrfs_print_tree(const struct extent_buffer *c, bool follow);</div><div class='ctx'> const char *btrfs_root_name(const struct btrfs_key *key, char *buf);</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/btrfs/props.c b/fs/btrfs/props.c<br/>index b1cb5a8c2999..adc956432d2f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/props.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/props.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/props.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/props.c</a></div><div class='hunk'>@@ -4,12 +4,19 @@</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/hashtable.h&gt;</div><div class='add'>+#include &lt;linux/xattr.h&gt;</div><div class='add'>+#include "messages.h"</div><div class='ctx'> #include "props.h"</div><div class='ctx'> #include "btrfs_inode.h"</div><div class='ctx'> #include "transaction.h"</div><div class='ctx'> #include "ctree.h"</div><div class='ctx'> #include "xattr.h"</div><div class='ctx'> #include "compression.h"</div><div class='add'>+#include "space-info.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "super.h"</div><div class='add'>+#include "dir-item.h"</div><div class='ctx'> </div><div class='ctx'> #define BTRFS_PROP_HANDLERS_HT_BITS 8</div><div class='ctx'> static DEFINE_HASHTABLE(prop_handlers_ht, BTRFS_PROP_HANDLERS_HT_BITS);</div><div class='hunk'>@@ -17,9 +24,11 @@ static DEFINE_HASHTABLE(prop_handlers_ht, BTRFS_PROP_HANDLERS_HT_BITS);</div><div class='ctx'> struct prop_handler {</div><div class='ctx'> 	struct hlist_node node;</div><div class='ctx'> 	const char *xattr_name;</div><div class='del'>-	int (*validate)(const char *value, size_t len);</div><div class='del'>-	int (*apply)(struct inode *inode, const char *value, size_t len);</div><div class='del'>-	const char *(*extract)(struct inode *inode);</div><div class='add'>+	int (*validate)(const struct btrfs_inode *inode, const char *value,</div><div class='add'>+			size_t len);</div><div class='add'>+	int (*apply)(struct btrfs_inode *inode, const char *value, size_t len);</div><div class='add'>+	const char *(*extract)(const struct btrfs_inode *inode);</div><div class='add'>+	bool (*ignore)(const struct btrfs_inode *inode);</div><div class='ctx'> 	int inheritable;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -55,7 +64,8 @@ find_prop_handler(const char *name,</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_validate_prop(const char *name, const char *value, size_t value_len)</div><div class='add'>+int btrfs_validate_prop(const struct btrfs_inode *inode, const char *name,</div><div class='add'>+			const char *value, size_t value_len)</div><div class='ctx'> {</div><div class='ctx'> 	const struct prop_handler *handler;</div><div class='ctx'> </div><div class='hunk'>@@ -69,10 +79,32 @@ int btrfs_validate_prop(const char *name, const char *value, size_t value_len)</div><div class='ctx'> 	if (value_len == 0)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	return handler-&gt;validate(value, value_len);</div><div class='add'>+	return handler-&gt;validate(inode, value, value_len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_set_prop(struct btrfs_trans_handle *trans, struct inode *inode,</div><div class='add'>+/*</div><div class='add'>+ * Check if a property should be ignored (not set) for an inode.</div><div class='add'>+ *</div><div class='add'>+ * @inode:     The target inode.</div><div class='add'>+ * @name:      The property's name.</div><div class='add'>+ *</div><div class='add'>+ * The caller must be sure the given property name is valid, for example by</div><div class='add'>+ * having previously called btrfs_validate_prop().</div><div class='add'>+ *</div><div class='add'>+ * Returns:    true if the property should be ignored for the given inode</div><div class='add'>+ *             false if the property must not be ignored for the given inode</div><div class='add'>+ */</div><div class='add'>+bool btrfs_ignore_prop(const struct btrfs_inode *inode, const char *name)</div><div class='add'>+{</div><div class='add'>+	const struct prop_handler *handler;</div><div class='add'>+</div><div class='add'>+	handler = find_prop_handler(name, NULL);</div><div class='add'>+	ASSERT(handler != NULL);</div><div class='add'>+</div><div class='add'>+	return handler-&gt;ignore(inode);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_set_prop(struct btrfs_trans_handle *trans, struct btrfs_inode *inode,</div><div class='ctx'> 		   const char *name, const char *value, size_t value_len,</div><div class='ctx'> 		   int flags)</div><div class='ctx'> {</div><div class='hunk'>@@ -84,7 +116,7 @@ int btrfs_set_prop(struct btrfs_trans_handle *trans, struct inode *inode,</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	if (value_len == 0) {</div><div class='del'>-		ret = btrfs_setxattr(trans, inode, handler-&gt;xattr_name,</div><div class='add'>+		ret = btrfs_setxattr(trans, &amp;inode-&gt;vfs_inode, handler-&gt;xattr_name,</div><div class='ctx'> 				     NULL, 0, flags);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='hunk'>@@ -95,18 +127,18 @@ int btrfs_set_prop(struct btrfs_trans_handle *trans, struct inode *inode,</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_setxattr(trans, inode, handler-&gt;xattr_name, value,</div><div class='add'>+	ret = btrfs_setxattr(trans, &amp;inode-&gt;vfs_inode, handler-&gt;xattr_name, value,</div><div class='ctx'> 			     value_len, flags);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	ret = handler-&gt;apply(inode, value, value_len);</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		btrfs_setxattr(trans, inode, handler-&gt;xattr_name, NULL,</div><div class='add'>+		btrfs_setxattr(trans, &amp;inode-&gt;vfs_inode, handler-&gt;xattr_name, NULL,</div><div class='ctx'> 			       0, flags);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	set_bit(BTRFS_INODE_HAS_PROPS, &amp;BTRFS_I(inode)-&gt;runtime_flags);</div><div class='add'>+	set_bit(BTRFS_INODE_HAS_PROPS, &amp;inode-&gt;runtime_flags);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -158,7 +190,7 @@ static int iterate_object_props(struct btrfs_root *root,</div><div class='ctx'> </div><div class='ctx'> 		di = btrfs_item_ptr(leaf, slot, struct btrfs_dir_item);</div><div class='ctx'> 		cur = 0;</div><div class='del'>-		total_len = btrfs_item_size_nr(leaf, slot);</div><div class='add'>+		total_len = btrfs_item_size(leaf, slot);</div><div class='ctx'> </div><div class='ctx'> 		while (cur &lt; total_len) {</div><div class='ctx'> 			u32 name_len = btrfs_dir_name_len(leaf, di);</div><div class='hunk'>@@ -231,29 +263,31 @@ static void inode_prop_iterator(void *ctx,</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = handler-&gt;apply(inode, value, len);</div><div class='add'>+	ret = handler-&gt;apply(BTRFS_I(inode), value, len);</div><div class='ctx'> 	if (unlikely(ret))</div><div class='ctx'> 		btrfs_warn(root-&gt;fs_info,</div><div class='ctx'> 			   "error applying prop %s to ino %llu (root %llu): %d",</div><div class='ctx'> 			   handler-&gt;xattr_name, btrfs_ino(BTRFS_I(inode)),</div><div class='del'>-			   root-&gt;root_key.objectid, ret);</div><div class='add'>+			   btrfs_root_id(root), ret);</div><div class='ctx'> 	else</div><div class='ctx'> 		set_bit(BTRFS_INODE_HAS_PROPS, &amp;BTRFS_I(inode)-&gt;runtime_flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_load_inode_props(struct inode *inode, struct btrfs_path *path)</div><div class='add'>+int btrfs_load_inode_props(struct btrfs_inode *inode, struct btrfs_path *path)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='del'>-	u64 ino = btrfs_ino(BTRFS_I(inode));</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ret = iterate_object_props(root, path, ino, inode_prop_iterator, inode);</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	u64 ino = btrfs_ino(inode);</div><div class='ctx'> </div><div class='del'>-	return ret;</div><div class='add'>+	return iterate_object_props(root, path, ino, inode_prop_iterator,</div><div class='add'>+				    &amp;inode-&gt;vfs_inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int prop_compression_validate(const char *value, size_t len)</div><div class='add'>+static int prop_compression_validate(const struct btrfs_inode *inode,</div><div class='add'>+				     const char *value, size_t len)</div><div class='ctx'> {</div><div class='add'>+	if (!btrfs_inode_can_compress(inode))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='ctx'> 	if (!value)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='hunk'>@@ -267,26 +301,26 @@ static int prop_compression_validate(const char *value, size_t len)</div><div class='ctx'> 	return -EINVAL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int prop_compression_apply(struct inode *inode, const char *value,</div><div class='add'>+static int prop_compression_apply(struct btrfs_inode *inode, const char *value,</div><div class='ctx'> 				  size_t len)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='ctx'> 	int type;</div><div class='ctx'> </div><div class='ctx'> 	/* Reset to defaults */</div><div class='ctx'> 	if (len == 0) {</div><div class='del'>-		BTRFS_I(inode)-&gt;flags &amp;= ~BTRFS_INODE_COMPRESS;</div><div class='del'>-		BTRFS_I(inode)-&gt;flags &amp;= ~BTRFS_INODE_NOCOMPRESS;</div><div class='del'>-		BTRFS_I(inode)-&gt;prop_compress = BTRFS_COMPRESS_NONE;</div><div class='add'>+		inode-&gt;flags &amp;= ~BTRFS_INODE_COMPRESS;</div><div class='add'>+		inode-&gt;flags &amp;= ~BTRFS_INODE_NOCOMPRESS;</div><div class='add'>+		inode-&gt;prop_compress = BTRFS_COMPRESS_NONE;</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Set NOCOMPRESS flag */</div><div class='ctx'> 	if ((len == 2 &amp;&amp; strncmp("no", value, 2) == 0) ||</div><div class='ctx'> 	    (len == 4 &amp;&amp; strncmp("none", value, 4) == 0)) {</div><div class='del'>-		BTRFS_I(inode)-&gt;flags |= BTRFS_INODE_NOCOMPRESS;</div><div class='del'>-		BTRFS_I(inode)-&gt;flags &amp;= ~BTRFS_INODE_COMPRESS;</div><div class='del'>-		BTRFS_I(inode)-&gt;prop_compress = BTRFS_COMPRESS_NONE;</div><div class='add'>+		inode-&gt;flags |= BTRFS_INODE_NOCOMPRESS;</div><div class='add'>+		inode-&gt;flags &amp;= ~BTRFS_INODE_COMPRESS;</div><div class='add'>+		inode-&gt;prop_compress = BTRFS_COMPRESS_NONE;</div><div class='ctx'> </div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -303,20 +337,36 @@ static int prop_compression_apply(struct inode *inode, const char *value,</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	BTRFS_I(inode)-&gt;flags &amp;= ~BTRFS_INODE_NOCOMPRESS;</div><div class='del'>-	BTRFS_I(inode)-&gt;flags |= BTRFS_INODE_COMPRESS;</div><div class='del'>-	BTRFS_I(inode)-&gt;prop_compress = type;</div><div class='add'>+	inode-&gt;flags &amp;= ~BTRFS_INODE_NOCOMPRESS;</div><div class='add'>+	inode-&gt;flags |= BTRFS_INODE_COMPRESS;</div><div class='add'>+	inode-&gt;prop_compress = type;</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static const char *prop_compression_extract(struct inode *inode)</div><div class='add'>+static bool prop_compression_ignore(const struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='del'>-	switch (BTRFS_I(inode)-&gt;prop_compress) {</div><div class='add'>+	/*</div><div class='add'>+	 * Compression only has effect for regular files, and for directories</div><div class='add'>+	 * we set it just to propagate it to new files created inside them.</div><div class='add'>+	 * Everything else (symlinks, devices, sockets, fifos) is pointless as</div><div class='add'>+	 * it will do nothing, so don't waste metadata space on a compression</div><div class='add'>+	 * xattr for anything that is neither a file nor a directory.</div><div class='add'>+	 */</div><div class='add'>+	if (!S_ISREG(inode-&gt;vfs_inode.i_mode) &amp;&amp;</div><div class='add'>+	    !S_ISDIR(inode-&gt;vfs_inode.i_mode))</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const char *prop_compression_extract(const struct btrfs_inode *inode)</div><div class='add'>+{</div><div class='add'>+	switch (inode-&gt;prop_compress) {</div><div class='ctx'> 	case BTRFS_COMPRESS_ZLIB:</div><div class='ctx'> 	case BTRFS_COMPRESS_LZO:</div><div class='ctx'> 	case BTRFS_COMPRESS_ZSTD:</div><div class='del'>-		return btrfs_compress_type2str(BTRFS_I(inode)-&gt;prop_compress);</div><div class='add'>+		return btrfs_compress_type2str(inode-&gt;prop_compress);</div><div class='ctx'> 	default:</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -330,22 +380,22 @@ static struct prop_handler prop_handlers[] = {</div><div class='ctx'> 		.validate = prop_compression_validate,</div><div class='ctx'> 		.apply = prop_compression_apply,</div><div class='ctx'> 		.extract = prop_compression_extract,</div><div class='add'>+		.ignore = prop_compression_ignore,</div><div class='ctx'> 		.inheritable = 1</div><div class='ctx'> 	},</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int inherit_props(struct btrfs_trans_handle *trans,</div><div class='del'>-			 struct inode *inode,</div><div class='del'>-			 struct inode *parent)</div><div class='add'>+int btrfs_inode_inherit_props(struct btrfs_trans_handle *trans,</div><div class='add'>+			      struct btrfs_inode *inode,</div><div class='add'>+			      const struct btrfs_inode *parent)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int i;</div><div class='ctx'> 	bool need_reserve = false;</div><div class='ctx'> </div><div class='del'>-	if (!test_bit(BTRFS_INODE_HAS_PROPS,</div><div class='del'>-		      &amp;BTRFS_I(parent)-&gt;runtime_flags))</div><div class='add'>+	if (!test_bit(BTRFS_INODE_HAS_PROPS, &amp;parent-&gt;runtime_flags))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; ARRAY_SIZE(prop_handlers); i++) {</div><div class='hunk'>@@ -356,6 +406,9 @@ static int inherit_props(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		if (!h-&gt;inheritable)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='add'>+		if (h-&gt;ignore(inode))</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='ctx'> 		value = h-&gt;extract(parent);</div><div class='ctx'> 		if (!value)</div><div class='ctx'> 			continue;</div><div class='hunk'>@@ -364,7 +417,7 @@ static int inherit_props(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		 * This is not strictly necessary as the property should be</div><div class='ctx'> 		 * valid, but in case it isn't, don't propagate it further.</div><div class='ctx'> 		 */</div><div class='del'>-		ret = h-&gt;validate(value, strlen(value));</div><div class='add'>+		ret = h-&gt;validate(inode, value, strlen(value));</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='hunk'>@@ -377,22 +430,22 @@ static int inherit_props(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (need_reserve) {</div><div class='ctx'> 			num_bytes = btrfs_calc_insert_metadata_size(fs_info, 1);</div><div class='del'>-			ret = btrfs_block_rsv_add(root, trans-&gt;block_rsv,</div><div class='del'>-					num_bytes, BTRFS_RESERVE_NO_FLUSH);</div><div class='add'>+			ret = btrfs_block_rsv_add(fs_info, trans-&gt;block_rsv,</div><div class='add'>+						  num_bytes,</div><div class='add'>+						  BTRFS_RESERVE_NO_FLUSH);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				return ret;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		ret = btrfs_setxattr(trans, inode, h-&gt;xattr_name, value,</div><div class='add'>+		ret = btrfs_setxattr(trans, &amp;inode-&gt;vfs_inode, h-&gt;xattr_name, value,</div><div class='ctx'> 				     strlen(value), 0);</div><div class='ctx'> 		if (!ret) {</div><div class='ctx'> 			ret = h-&gt;apply(inode, value, strlen(value));</div><div class='ctx'> 			if (ret)</div><div class='del'>-				btrfs_setxattr(trans, inode, h-&gt;xattr_name,</div><div class='add'>+				btrfs_setxattr(trans, &amp;inode-&gt;vfs_inode, h-&gt;xattr_name,</div><div class='ctx'> 					       NULL, 0, 0);</div><div class='ctx'> 			else</div><div class='del'>-				set_bit(BTRFS_INODE_HAS_PROPS,</div><div class='del'>-					&amp;BTRFS_I(inode)-&gt;runtime_flags);</div><div class='add'>+				set_bit(BTRFS_INODE_HAS_PROPS, &amp;inode-&gt;runtime_flags);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (need_reserve) {</div><div class='hunk'>@@ -407,42 +460,7 @@ static int inherit_props(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_inode_inherit_props(struct btrfs_trans_handle *trans,</div><div class='del'>-			      struct inode *inode,</div><div class='del'>-			      struct inode *dir)</div><div class='del'>-{</div><div class='del'>-	if (!dir)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	return inherit_props(trans, inode, dir);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int btrfs_subvol_inherit_props(struct btrfs_trans_handle *trans,</div><div class='del'>-			       struct btrfs_root *root,</div><div class='del'>-			       struct btrfs_root *parent_root)</div><div class='del'>-{</div><div class='del'>-	struct super_block *sb = root-&gt;fs_info-&gt;sb;</div><div class='del'>-	struct inode *parent_inode, *child_inode;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	parent_inode = btrfs_iget(sb, BTRFS_FIRST_FREE_OBJECTID, parent_root);</div><div class='del'>-	if (IS_ERR(parent_inode))</div><div class='del'>-		return PTR_ERR(parent_inode);</div><div class='del'>-</div><div class='del'>-	child_inode = btrfs_iget(sb, BTRFS_FIRST_FREE_OBJECTID, root);</div><div class='del'>-	if (IS_ERR(child_inode)) {</div><div class='del'>-		iput(parent_inode);</div><div class='del'>-		return PTR_ERR(child_inode);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = inherit_props(trans, child_inode, parent_inode);</div><div class='del'>-	iput(child_inode);</div><div class='del'>-	iput(parent_inode);</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void __init btrfs_props_init(void)</div><div class='add'>+int __init btrfs_props_init(void)</div><div class='ctx'> {</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='hunk'>@@ -452,5 +470,6 @@ void __init btrfs_props_init(void)</div><div class='ctx'> </div><div class='ctx'> 		hash_add(prop_handlers_ht, &amp;p-&gt;node, h);</div><div class='ctx'> 	}</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/btrfs/props.h b/fs/btrfs/props.h<br/>index 40b2c65b518c..15d9a025c923 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/props.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/props.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/props.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/props.h</a></div><div class='hunk'>@@ -6,23 +6,26 @@</div><div class='ctx'> #ifndef BTRFS_PROPS_H</div><div class='ctx'> #define BTRFS_PROPS_H</div><div class='ctx'> </div><div class='del'>-#include "ctree.h"</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+#include &lt;linux/compiler_types.h&gt;</div><div class='ctx'> </div><div class='del'>-void __init btrfs_props_init(void);</div><div class='add'>+struct btrfs_inode;</div><div class='add'>+struct btrfs_path;</div><div class='add'>+struct btrfs_trans_handle;</div><div class='ctx'> </div><div class='del'>-int btrfs_set_prop(struct btrfs_trans_handle *trans, struct inode *inode,</div><div class='add'>+int __init btrfs_props_init(void);</div><div class='add'>+</div><div class='add'>+int btrfs_set_prop(struct btrfs_trans_handle *trans, struct btrfs_inode *inode,</div><div class='ctx'> 		   const char *name, const char *value, size_t value_len,</div><div class='ctx'> 		   int flags);</div><div class='del'>-int btrfs_validate_prop(const char *name, const char *value, size_t value_len);</div><div class='add'>+int btrfs_validate_prop(const struct btrfs_inode *inode, const char *name,</div><div class='add'>+			const char *value, size_t value_len);</div><div class='add'>+bool btrfs_ignore_prop(const struct btrfs_inode *inode, const char *name);</div><div class='ctx'> </div><div class='del'>-int btrfs_load_inode_props(struct inode *inode, struct btrfs_path *path);</div><div class='add'>+int btrfs_load_inode_props(struct btrfs_inode *inode, struct btrfs_path *path);</div><div class='ctx'> </div><div class='ctx'> int btrfs_inode_inherit_props(struct btrfs_trans_handle *trans,</div><div class='del'>-			      struct inode *inode,</div><div class='del'>-			      struct inode *dir);</div><div class='del'>-</div><div class='del'>-int btrfs_subvol_inherit_props(struct btrfs_trans_handle *trans,</div><div class='del'>-			       struct btrfs_root *root,</div><div class='del'>-			       struct btrfs_root *parent_root);</div><div class='add'>+			      struct btrfs_inode *inode,</div><div class='add'>+			      const struct btrfs_inode *dir);</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/btrfs/qgroup.c b/fs/btrfs/qgroup.c<br/>index db680f5be745..9e2b53e90dcb 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/qgroup.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/qgroup.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/qgroup.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/qgroup.c</a></div><div class='hunk'>@@ -24,18 +24,30 @@</div><div class='ctx'> #include "block-group.h"</div><div class='ctx'> #include "sysfs.h"</div><div class='ctx'> #include "tree-mod-log.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "extent-tree.h"</div><div class='add'>+#include "root-tree.h"</div><div class='add'>+#include "tree-checker.h"</div><div class='ctx'> </div><div class='del'>-/* TODO XXX FIXME</div><div class='del'>- *  - subvol delete -&gt; delete when ref goes to 0? delete limits also?</div><div class='del'>- *  - reorganize keys</div><div class='del'>- *  - compressed</div><div class='del'>- *  - sync</div><div class='del'>- *  - copy also limits on subvol creation</div><div class='del'>- *  - limit</div><div class='del'>- *  - caches for ulists</div><div class='del'>- *  - performance benchmarks</div><div class='del'>- *  - check all ioctl parameters</div><div class='del'>- */</div><div class='add'>+enum btrfs_qgroup_mode btrfs_qgroup_mode(const struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	if (!test_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags))</div><div class='add'>+		return BTRFS_QGROUP_MODE_DISABLED;</div><div class='add'>+	if (fs_info-&gt;qgroup_flags &amp; BTRFS_QGROUP_STATUS_FLAG_SIMPLE_MODE)</div><div class='add'>+		return BTRFS_QGROUP_MODE_SIMPLE;</div><div class='add'>+	return BTRFS_QGROUP_MODE_FULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool btrfs_qgroup_enabled(const struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	return btrfs_qgroup_mode(fs_info) != BTRFS_QGROUP_MODE_DISABLED;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool btrfs_qgroup_full_accounting(const struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	return btrfs_qgroup_mode(fs_info) == BTRFS_QGROUP_MODE_FULL;</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Helpers to access qgroup reservation</div><div class='hunk'>@@ -71,7 +83,7 @@ static void qgroup_rsv_add(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			   struct btrfs_qgroup *qgroup, u64 num_bytes,</div><div class='ctx'> 			   enum btrfs_qgroup_rsv_type type)</div><div class='ctx'> {</div><div class='del'>-	trace_qgroup_update_reserve(fs_info, qgroup, num_bytes, type);</div><div class='add'>+	trace_btrfs_qgroup_update_reserve(fs_info, qgroup, num_bytes, type);</div><div class='ctx'> 	qgroup-&gt;rsv.values[type] += num_bytes;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -79,7 +91,7 @@ static void qgroup_rsv_release(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			       struct btrfs_qgroup *qgroup, u64 num_bytes,</div><div class='ctx'> 			       enum btrfs_qgroup_rsv_type type)</div><div class='ctx'> {</div><div class='del'>-	trace_qgroup_update_reserve(fs_info, qgroup, -(s64)num_bytes, type);</div><div class='add'>+	trace_btrfs_qgroup_update_reserve(fs_info, qgroup, -(s64)num_bytes, type);</div><div class='ctx'> 	if (qgroup-&gt;rsv.values[type] &gt;= num_bytes) {</div><div class='ctx'> 		qgroup-&gt;rsv.values[type] -= num_bytes;</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -95,7 +107,7 @@ static void qgroup_rsv_release(struct btrfs_fs_info *fs_info,</div><div class='ctx'> </div><div class='ctx'> static void qgroup_rsv_add_by_qgroup(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				     struct btrfs_qgroup *dest,</div><div class='del'>-				     struct btrfs_qgroup *src)</div><div class='add'>+				     const struct btrfs_qgroup *src)</div><div class='ctx'> {</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='hunk'>@@ -105,7 +117,7 @@ static void qgroup_rsv_add_by_qgroup(struct btrfs_fs_info *fs_info,</div><div class='ctx'> </div><div class='ctx'> static void qgroup_rsv_release_by_qgroup(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 					 struct btrfs_qgroup *dest,</div><div class='del'>-					  struct btrfs_qgroup *src)</div><div class='add'>+					 const struct btrfs_qgroup *src)</div><div class='ctx'> {</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='hunk'>@@ -129,101 +141,89 @@ static void btrfs_qgroup_update_new_refcnt(struct btrfs_qgroup *qg, u64 seq,</div><div class='ctx'> 	qg-&gt;new_refcnt += mod;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u64 btrfs_qgroup_get_old_refcnt(struct btrfs_qgroup *qg, u64 seq)</div><div class='add'>+static inline u64 btrfs_qgroup_get_old_refcnt(const struct btrfs_qgroup *qg, u64 seq)</div><div class='ctx'> {</div><div class='ctx'> 	if (qg-&gt;old_refcnt &lt; seq)</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	return qg-&gt;old_refcnt - seq;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u64 btrfs_qgroup_get_new_refcnt(struct btrfs_qgroup *qg, u64 seq)</div><div class='add'>+static inline u64 btrfs_qgroup_get_new_refcnt(const struct btrfs_qgroup *qg, u64 seq)</div><div class='ctx'> {</div><div class='ctx'> 	if (qg-&gt;new_refcnt &lt; seq)</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	return qg-&gt;new_refcnt - seq;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * glue structure to represent the relations between qgroups.</div><div class='del'>- */</div><div class='del'>-struct btrfs_qgroup_list {</div><div class='del'>-	struct list_head next_group;</div><div class='del'>-	struct list_head next_member;</div><div class='del'>-	struct btrfs_qgroup *group;</div><div class='del'>-	struct btrfs_qgroup *member;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static inline u64 qgroup_to_aux(struct btrfs_qgroup *qg)</div><div class='del'>-{</div><div class='del'>-	return (u64)(uintptr_t)qg;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline struct btrfs_qgroup* unode_aux_to_qgroup(struct ulist_node *n)</div><div class='del'>-{</div><div class='del'>-	return (struct btrfs_qgroup *)(uintptr_t)n-&gt;aux;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int</div><div class='ctx'> qgroup_rescan_init(struct btrfs_fs_info *fs_info, u64 progress_objectid,</div><div class='ctx'> 		   int init_flags);</div><div class='ctx'> static void qgroup_rescan_zero_tracking(struct btrfs_fs_info *fs_info);</div><div class='ctx'> </div><div class='add'>+static int btrfs_qgroup_qgroupid_key_cmp(const void *key, const struct rb_node *node)</div><div class='add'>+{</div><div class='add'>+	const u64 *qgroupid = key;</div><div class='add'>+	const struct btrfs_qgroup *qgroup = rb_entry(node, struct btrfs_qgroup, node);</div><div class='add'>+</div><div class='add'>+	if (qgroup-&gt;qgroupid &lt; *qgroupid)</div><div class='add'>+		return -1;</div><div class='add'>+	else if (qgroup-&gt;qgroupid &gt; *qgroupid)</div><div class='add'>+		return 1;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /* must be called with qgroup_ioctl_lock held */</div><div class='del'>-static struct btrfs_qgroup *find_qgroup_rb(struct btrfs_fs_info *fs_info,</div><div class='add'>+static struct btrfs_qgroup *find_qgroup_rb(const struct btrfs_fs_info *fs_info,</div><div class='ctx'> 					   u64 qgroupid)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node *n = fs_info-&gt;qgroup_tree.rb_node;</div><div class='del'>-	struct btrfs_qgroup *qgroup;</div><div class='add'>+	struct rb_node *node;</div><div class='ctx'> </div><div class='del'>-	while (n) {</div><div class='del'>-		qgroup = rb_entry(n, struct btrfs_qgroup, node);</div><div class='del'>-		if (qgroup-&gt;qgroupid &lt; qgroupid)</div><div class='del'>-			n = n-&gt;rb_left;</div><div class='del'>-		else if (qgroup-&gt;qgroupid &gt; qgroupid)</div><div class='del'>-			n = n-&gt;rb_right;</div><div class='del'>-		else</div><div class='del'>-			return qgroup;</div><div class='del'>-	}</div><div class='del'>-	return NULL;</div><div class='add'>+	node = rb_find(&amp;qgroupid, &amp;fs_info-&gt;qgroup_tree, btrfs_qgroup_qgroupid_key_cmp);</div><div class='add'>+	return rb_entry_safe(node, struct btrfs_qgroup, node);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* must be called with qgroup_lock held */</div><div class='add'>+static int btrfs_qgroup_qgroupid_cmp(struct rb_node *new, const struct rb_node *existing)</div><div class='add'>+{</div><div class='add'>+	const struct btrfs_qgroup *new_qgroup = rb_entry(new, struct btrfs_qgroup, node);</div><div class='add'>+</div><div class='add'>+	return btrfs_qgroup_qgroupid_key_cmp(&amp;new_qgroup-&gt;qgroupid, existing);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Add qgroup to the filesystem's qgroup tree.</div><div class='add'>+ *</div><div class='add'>+ * Must be called with qgroup_lock held and @prealloc preallocated.</div><div class='add'>+ *</div><div class='add'>+ * The control on the lifespan of @prealloc would be transferred to this</div><div class='add'>+ * function, thus caller should no longer touch @prealloc.</div><div class='add'>+ */</div><div class='ctx'> static struct btrfs_qgroup *add_qgroup_rb(struct btrfs_fs_info *fs_info,</div><div class='add'>+					  struct btrfs_qgroup *prealloc,</div><div class='ctx'> 					  u64 qgroupid)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node **p = &amp;fs_info-&gt;qgroup_tree.rb_node;</div><div class='del'>-	struct rb_node *parent = NULL;</div><div class='del'>-	struct btrfs_qgroup *qgroup;</div><div class='add'>+	struct rb_node *node;</div><div class='ctx'> </div><div class='del'>-	while (*p) {</div><div class='del'>-		parent = *p;</div><div class='del'>-		qgroup = rb_entry(parent, struct btrfs_qgroup, node);</div><div class='add'>+	/* Caller must have pre-allocated @prealloc. */</div><div class='add'>+	ASSERT(prealloc);</div><div class='ctx'> </div><div class='del'>-		if (qgroup-&gt;qgroupid &lt; qgroupid)</div><div class='del'>-			p = &amp;(*p)-&gt;rb_left;</div><div class='del'>-		else if (qgroup-&gt;qgroupid &gt; qgroupid)</div><div class='del'>-			p = &amp;(*p)-&gt;rb_right;</div><div class='del'>-		else</div><div class='del'>-			return qgroup;</div><div class='add'>+	prealloc-&gt;qgroupid = qgroupid;</div><div class='add'>+	node = rb_find_add(&amp;prealloc-&gt;node, &amp;fs_info-&gt;qgroup_tree, btrfs_qgroup_qgroupid_cmp);</div><div class='add'>+	if (node) {</div><div class='add'>+		kfree(prealloc);</div><div class='add'>+		return rb_entry(node, struct btrfs_qgroup, node);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	qgroup = kzalloc(sizeof(*qgroup), GFP_ATOMIC);</div><div class='del'>-	if (!qgroup)</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='add'>+	INIT_LIST_HEAD(&amp;prealloc-&gt;groups);</div><div class='add'>+	INIT_LIST_HEAD(&amp;prealloc-&gt;members);</div><div class='add'>+	INIT_LIST_HEAD(&amp;prealloc-&gt;dirty);</div><div class='add'>+	INIT_LIST_HEAD(&amp;prealloc-&gt;iterator);</div><div class='add'>+	INIT_LIST_HEAD(&amp;prealloc-&gt;nested_iterator);</div><div class='ctx'> </div><div class='del'>-	qgroup-&gt;qgroupid = qgroupid;</div><div class='del'>-	INIT_LIST_HEAD(&amp;qgroup-&gt;groups);</div><div class='del'>-	INIT_LIST_HEAD(&amp;qgroup-&gt;members);</div><div class='del'>-	INIT_LIST_HEAD(&amp;qgroup-&gt;dirty);</div><div class='del'>-</div><div class='del'>-	rb_link_node(&amp;qgroup-&gt;node, parent, p);</div><div class='del'>-	rb_insert_color(&amp;qgroup-&gt;node, &amp;fs_info-&gt;qgroup_tree);</div><div class='del'>-</div><div class='del'>-	return qgroup;</div><div class='add'>+	return prealloc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void __del_qgroup_rb(struct btrfs_fs_info *fs_info,</div><div class='del'>-			    struct btrfs_qgroup *qgroup)</div><div class='add'>+static void __del_qgroup_rb(struct btrfs_qgroup *qgroup)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_qgroup_list *list;</div><div class='ctx'> </div><div class='hunk'>@@ -254,36 +254,60 @@ static int del_qgroup_rb(struct btrfs_fs_info *fs_info, u64 qgroupid)</div><div class='ctx'> 		return -ENOENT;</div><div class='ctx'> </div><div class='ctx'> 	rb_erase(&amp;qgroup-&gt;node, &amp;fs_info-&gt;qgroup_tree);</div><div class='del'>-	__del_qgroup_rb(fs_info, qgroup);</div><div class='add'>+	__del_qgroup_rb(qgroup);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* must be called with qgroup_lock held */</div><div class='add'>+/*</div><div class='add'>+ * Add relation specified by two qgroups.</div><div class='add'>+ *</div><div class='add'>+ * Must be called with qgroup_lock held, the ownership of @prealloc is</div><div class='add'>+ * transferred to this function and caller should not touch it anymore.</div><div class='add'>+ *</div><div class='add'>+ * Return: 0        on success</div><div class='add'>+ *         -ENOENT  if one of the qgroups is NULL</div><div class='add'>+ *         &lt;0       other errors</div><div class='add'>+ */</div><div class='add'>+static int __add_relation_rb(struct btrfs_qgroup_list *prealloc,</div><div class='add'>+			     struct btrfs_qgroup *member,</div><div class='add'>+			     struct btrfs_qgroup *parent)</div><div class='add'>+{</div><div class='add'>+	if (!member || !parent) {</div><div class='add'>+		kfree(prealloc);</div><div class='add'>+		return -ENOENT;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	prealloc-&gt;group = parent;</div><div class='add'>+	prealloc-&gt;member = member;</div><div class='add'>+	list_add_tail(&amp;prealloc-&gt;next_group, &amp;member-&gt;groups);</div><div class='add'>+	list_add_tail(&amp;prealloc-&gt;next_member, &amp;parent-&gt;members);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Add relation specified by two qgroup ids.</div><div class='add'>+ *</div><div class='add'>+ * Must be called with qgroup_lock held.</div><div class='add'>+ *</div><div class='add'>+ * Return: 0        on success</div><div class='add'>+ *         -ENOENT  if one of the ids does not exist</div><div class='add'>+ *         &lt;0       other errors</div><div class='add'>+ */</div><div class='ctx'> static int add_relation_rb(struct btrfs_fs_info *fs_info,</div><div class='add'>+			   struct btrfs_qgroup_list *prealloc,</div><div class='ctx'> 			   u64 memberid, u64 parentid)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_qgroup *member;</div><div class='ctx'> 	struct btrfs_qgroup *parent;</div><div class='del'>-	struct btrfs_qgroup_list *list;</div><div class='ctx'> </div><div class='ctx'> 	member = find_qgroup_rb(fs_info, memberid);</div><div class='ctx'> 	parent = find_qgroup_rb(fs_info, parentid);</div><div class='del'>-	if (!member || !parent)</div><div class='del'>-		return -ENOENT;</div><div class='del'>-</div><div class='del'>-	list = kzalloc(sizeof(*list), GFP_ATOMIC);</div><div class='del'>-	if (!list)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	list-&gt;group = parent;</div><div class='del'>-	list-&gt;member = member;</div><div class='del'>-	list_add_tail(&amp;list-&gt;next_group, &amp;member-&gt;groups);</div><div class='del'>-	list_add_tail(&amp;list-&gt;next_member, &amp;parent-&gt;members);</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+	return __add_relation_rb(prealloc, member, parent);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* must be called with qgroup_lock held */</div><div class='add'>+/* Must be called with qgroup_lock held */</div><div class='ctx'> static int del_relation_rb(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			   u64 memberid, u64 parentid)</div><div class='ctx'> {</div><div class='hunk'>@@ -308,7 +332,7 @@ static int del_relation_rb(struct btrfs_fs_info *fs_info,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_BTRFS_FS_RUN_SANITY_TESTS</div><div class='del'>-int btrfs_verify_qgroup_counts(struct btrfs_fs_info *fs_info, u64 qgroupid,</div><div class='add'>+int btrfs_verify_qgroup_counts(const struct btrfs_fs_info *fs_info, u64 qgroupid,</div><div class='ctx'> 			       u64 rfer, u64 excl)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_qgroup *qgroup;</div><div class='hunk'>@@ -322,6 +346,38 @@ int btrfs_verify_qgroup_counts(struct btrfs_fs_info *fs_info, u64 qgroupid,</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='add'>+__printf(2, 3)</div><div class='add'>+static void qgroup_mark_inconsistent(struct btrfs_fs_info *fs_info, const char *fmt, ...)</div><div class='add'>+{</div><div class='add'>+	const u64 old_flags = fs_info-&gt;qgroup_flags;</div><div class='add'>+</div><div class='add'>+	if (btrfs_qgroup_mode(fs_info) == BTRFS_QGROUP_MODE_SIMPLE)</div><div class='add'>+		return;</div><div class='add'>+	fs_info-&gt;qgroup_flags |= (BTRFS_QGROUP_STATUS_FLAG_INCONSISTENT |</div><div class='add'>+				  BTRFS_QGROUP_RUNTIME_FLAG_CANCEL_RESCAN |</div><div class='add'>+				  BTRFS_QGROUP_RUNTIME_FLAG_NO_ACCOUNTING);</div><div class='add'>+	if (!(old_flags &amp; BTRFS_QGROUP_STATUS_FLAG_INCONSISTENT)) {</div><div class='add'>+		struct va_format vaf;</div><div class='add'>+		va_list args;</div><div class='add'>+</div><div class='add'>+		va_start(args, fmt);</div><div class='add'>+		vaf.fmt = fmt;</div><div class='add'>+		vaf.va = &amp;args;</div><div class='add'>+</div><div class='add'>+		btrfs_warn_rl(fs_info, "qgroup marked inconsistent, %pV", &amp;vaf);</div><div class='add'>+		va_end(args);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void qgroup_read_enable_gen(struct btrfs_fs_info *fs_info,</div><div class='add'>+				   struct extent_buffer *leaf, int slot,</div><div class='add'>+				   struct btrfs_qgroup_status_item *ptr)</div><div class='add'>+{</div><div class='add'>+	ASSERT(btrfs_fs_incompat(fs_info, SIMPLE_QUOTA));</div><div class='add'>+	ASSERT(btrfs_item_size(leaf, slot) &gt;= sizeof(*ptr));</div><div class='add'>+	fs_info-&gt;qgroup_enable_gen = btrfs_qgroup_status_enable_gen(leaf, ptr);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * The full config is read in one go, only called from open_ctree()</div><div class='ctx'>  * It doesn't use any locking, as at this point we're still single-threaded</div><div class='hunk'>@@ -338,15 +394,9 @@ int btrfs_read_qgroup_config(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	u64 flags = 0;</div><div class='ctx'> 	u64 rescan_progress = 0;</div><div class='ctx'> </div><div class='del'>-	if (!test_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags))</div><div class='add'>+	if (!fs_info-&gt;quota_root)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	fs_info-&gt;qgroup_ulist = ulist_alloc(GFP_KERNEL);</div><div class='del'>-	if (!fs_info-&gt;qgroup_ulist) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path) {</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='hunk'>@@ -388,14 +438,11 @@ int btrfs_read_qgroup_config(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 				 "old qgroup version, quota disabled");</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='del'>-			if (btrfs_qgroup_status_generation(l, ptr) !=</div><div class='del'>-			    fs_info-&gt;generation) {</div><div class='del'>-				flags |= BTRFS_QGROUP_STATUS_FLAG_INCONSISTENT;</div><div class='del'>-				btrfs_err(fs_info,</div><div class='del'>-					"qgroup generation mismatch, marked as inconsistent");</div><div class='del'>-			}</div><div class='del'>-			fs_info-&gt;qgroup_flags = btrfs_qgroup_status_flags(l,</div><div class='del'>-									  ptr);</div><div class='add'>+			fs_info-&gt;qgroup_flags = btrfs_qgroup_status_flags(l, ptr);</div><div class='add'>+			if (fs_info-&gt;qgroup_flags &amp; BTRFS_QGROUP_STATUS_FLAG_SIMPLE_MODE)</div><div class='add'>+				qgroup_read_enable_gen(fs_info, l, slot, ptr);</div><div class='add'>+			else if (btrfs_qgroup_status_generation(l, ptr) != fs_info-&gt;generation)</div><div class='add'>+				qgroup_mark_inconsistent(fs_info, "qgroup generation mismatch");</div><div class='ctx'> 			rescan_progress = btrfs_qgroup_status_rescan(l, ptr);</div><div class='ctx'> 			goto next1;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -406,16 +453,37 @@ int btrfs_read_qgroup_config(struct btrfs_fs_info *fs_info)</div><div class='ctx'> </div><div class='ctx'> 		qgroup = find_qgroup_rb(fs_info, found_key.offset);</div><div class='ctx'> 		if ((qgroup &amp;&amp; found_key.type == BTRFS_QGROUP_INFO_KEY) ||</div><div class='del'>-		    (!qgroup &amp;&amp; found_key.type == BTRFS_QGROUP_LIMIT_KEY)) {</div><div class='del'>-			btrfs_err(fs_info, "inconsistent qgroup config");</div><div class='del'>-			flags |= BTRFS_QGROUP_STATUS_FLAG_INCONSISTENT;</div><div class='del'>-		}</div><div class='add'>+		    (!qgroup &amp;&amp; found_key.type == BTRFS_QGROUP_LIMIT_KEY))</div><div class='add'>+			qgroup_mark_inconsistent(fs_info, "inconsistent qgroup config");</div><div class='ctx'> 		if (!qgroup) {</div><div class='del'>-			qgroup = add_qgroup_rb(fs_info, found_key.offset);</div><div class='del'>-			if (IS_ERR(qgroup)) {</div><div class='del'>-				ret = PTR_ERR(qgroup);</div><div class='add'>+			struct btrfs_qgroup *prealloc;</div><div class='add'>+			struct btrfs_root *tree_root = fs_info-&gt;tree_root;</div><div class='add'>+</div><div class='add'>+			prealloc = kzalloc(sizeof(*prealloc), GFP_KERNEL);</div><div class='add'>+			if (!prealloc) {</div><div class='add'>+				ret = -ENOMEM;</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='add'>+			qgroup = add_qgroup_rb(fs_info, prealloc, found_key.offset);</div><div class='add'>+			/*</div><div class='add'>+			 * If a qgroup exists for a subvolume ID, it is possible</div><div class='add'>+			 * that subvolume has been deleted, in which case</div><div class='add'>+			 * reusing that ID would lead to incorrect accounting.</div><div class='add'>+			 *</div><div class='add'>+			 * Ensure that we skip any such subvol ids.</div><div class='add'>+			 *</div><div class='add'>+			 * We don't need to lock because this is only called</div><div class='add'>+			 * during mount before we start doing things like creating</div><div class='add'>+			 * subvolumes.</div><div class='add'>+			 */</div><div class='add'>+			if (btrfs_is_fstree(qgroup-&gt;qgroupid) &amp;&amp;</div><div class='add'>+			    qgroup-&gt;qgroupid &gt; tree_root-&gt;free_objectid)</div><div class='add'>+				/*</div><div class='add'>+				 * Don't need to check against BTRFS_LAST_FREE_OBJECTID,</div><div class='add'>+				 * as it will get checked on the next call to</div><div class='add'>+				 * btrfs_get_free_objectid.</div><div class='add'>+				 */</div><div class='add'>+				tree_root-&gt;free_objectid = qgroup-&gt;qgroupid + 1;</div><div class='ctx'> 		}</div><div class='ctx'> 		ret = btrfs_sysfs_add_one_qgroup(fs_info, qgroup);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='hunk'>@@ -466,6 +534,8 @@ next1:</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	while (1) {</div><div class='add'>+		struct btrfs_qgroup_list *list = NULL;</div><div class='add'>+</div><div class='ctx'> 		slot = path-&gt;slots[0];</div><div class='ctx'> 		l = path-&gt;nodes[0];</div><div class='ctx'> 		btrfs_item_key_to_cpu(l, &amp;found_key, slot);</div><div class='hunk'>@@ -479,8 +549,14 @@ next1:</div><div class='ctx'> 			goto next2;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		ret = add_relation_rb(fs_info, found_key.objectid,</div><div class='add'>+		list = kzalloc(sizeof(*list), GFP_KERNEL);</div><div class='add'>+		if (!list) {</div><div class='add'>+			ret = -ENOMEM;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		ret = add_relation_rb(fs_info, list, found_key.objectid,</div><div class='ctx'> 				      found_key.offset);</div><div class='add'>+		list = NULL;</div><div class='ctx'> 		if (ret == -ENOENT) {</div><div class='ctx'> 			btrfs_warn(fs_info,</div><div class='ctx'> 				"orphan qgroup relation 0x%llx-&gt;0x%llx",</div><div class='hunk'>@@ -499,15 +575,12 @@ next2:</div><div class='ctx'> out:</div><div class='ctx'> 	btrfs_free_path(path);</div><div class='ctx'> 	fs_info-&gt;qgroup_flags |= flags;</div><div class='del'>-	if (!(fs_info-&gt;qgroup_flags &amp; BTRFS_QGROUP_STATUS_FLAG_ON))</div><div class='del'>-		clear_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags);</div><div class='del'>-	else if (fs_info-&gt;qgroup_flags &amp; BTRFS_QGROUP_STATUS_FLAG_RESCAN &amp;&amp;</div><div class='del'>-		 ret &gt;= 0)</div><div class='del'>-		ret = qgroup_rescan_init(fs_info, rescan_progress, 0);</div><div class='del'>-</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		ulist_free(fs_info-&gt;qgroup_ulist);</div><div class='del'>-		fs_info-&gt;qgroup_ulist = NULL;</div><div class='add'>+	if (ret &gt;= 0) {</div><div class='add'>+		if (fs_info-&gt;qgroup_flags &amp; BTRFS_QGROUP_STATUS_FLAG_ON)</div><div class='add'>+			set_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags);</div><div class='add'>+		if (fs_info-&gt;qgroup_flags &amp; BTRFS_QGROUP_STATUS_FLAG_RESCAN)</div><div class='add'>+			ret = qgroup_rescan_init(fs_info, rescan_progress, 0);</div><div class='add'>+	} else {</div><div class='ctx'> 		fs_info-&gt;qgroup_flags &amp;= ~BTRFS_QGROUP_STATUS_FLAG_RESCAN;</div><div class='ctx'> 		btrfs_sysfs_del_qgroups(fs_info);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -522,12 +595,12 @@ out:</div><div class='ctx'>  * Return false if no reserved space is left.</div><div class='ctx'>  * Return true if some reserved space is leaked.</div><div class='ctx'>  */</div><div class='del'>-bool btrfs_check_quota_leak(struct btrfs_fs_info *fs_info)</div><div class='add'>+bool btrfs_check_quota_leak(const struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	struct rb_node *node;</div><div class='ctx'> 	bool ret = false;</div><div class='ctx'> </div><div class='del'>-	if (!test_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags))</div><div class='add'>+	if (btrfs_qgroup_mode(fs_info) == BTRFS_QGROUP_MODE_DISABLED)</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Since we're unmounting, there is no race and no need to grab qgroup</div><div class='hunk'>@@ -555,29 +628,30 @@ bool btrfs_check_quota_leak(struct btrfs_fs_info *fs_info)</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * This is called from close_ctree() or open_ctree() or btrfs_quota_disable(),</div><div class='del'>- * first two are in single-threaded paths.And for the third one, we have set</div><div class='del'>- * quota_root to be null with qgroup_lock held before, so it is safe to clean</div><div class='del'>- * up the in-memory structures without qgroup_lock held.</div><div class='add'>+ * first two are in single-threaded paths.</div><div class='ctx'>  */</div><div class='ctx'> void btrfs_free_qgroup_config(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	struct rb_node *n;</div><div class='ctx'> 	struct btrfs_qgroup *qgroup;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * btrfs_quota_disable() can be called concurrently with</div><div class='add'>+	 * btrfs_qgroup_rescan() -&gt; qgroup_rescan_zero_tracking(), so take the</div><div class='add'>+	 * lock.</div><div class='add'>+	 */</div><div class='add'>+	spin_lock(&amp;fs_info-&gt;qgroup_lock);</div><div class='ctx'> 	while ((n = rb_first(&amp;fs_info-&gt;qgroup_tree))) {</div><div class='ctx'> 		qgroup = rb_entry(n, struct btrfs_qgroup, node);</div><div class='ctx'> 		rb_erase(n, &amp;fs_info-&gt;qgroup_tree);</div><div class='del'>-		__del_qgroup_rb(fs_info, qgroup);</div><div class='add'>+		__del_qgroup_rb(qgroup);</div><div class='add'>+		spin_unlock(&amp;fs_info-&gt;qgroup_lock);</div><div class='ctx'> 		btrfs_sysfs_del_one_qgroup(fs_info, qgroup);</div><div class='ctx'> 		kfree(qgroup);</div><div class='add'>+		spin_lock(&amp;fs_info-&gt;qgroup_lock);</div><div class='ctx'> 	}</div><div class='del'>-	/*</div><div class='del'>-	 * We call btrfs_free_qgroup_config() when unmounting</div><div class='del'>-	 * filesystem and disabling quota, so we set qgroup_ulist</div><div class='del'>-	 * to be null here to avoid double free.</div><div class='del'>-	 */</div><div class='del'>-	ulist_free(fs_info-&gt;qgroup_ulist);</div><div class='del'>-	fs_info-&gt;qgroup_ulist = NULL;</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;qgroup_lock);</div><div class='add'>+</div><div class='ctx'> 	btrfs_sysfs_del_qgroups(fs_info);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -586,7 +660,7 @@ static int add_qgroup_relation_item(struct btrfs_trans_handle *trans, u64 src,</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct btrfs_root *quota_root = trans-&gt;fs_info-&gt;quota_root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='hunk'>@@ -598,10 +672,6 @@ static int add_qgroup_relation_item(struct btrfs_trans_handle *trans, u64 src,</div><div class='ctx'> 	key.offset = dst;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_insert_empty_item(trans, quota_root, path, &amp;key, 0);</div><div class='del'>-</div><div class='del'>-	btrfs_mark_buffer_dirty(path-&gt;nodes[0]);</div><div class='del'>-</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -610,7 +680,7 @@ static int del_qgroup_relation_item(struct btrfs_trans_handle *trans, u64 src,</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct btrfs_root *quota_root = trans-&gt;fs_info-&gt;quota_root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='hunk'>@@ -623,24 +693,19 @@ static int del_qgroup_relation_item(struct btrfs_trans_handle *trans, u64 src,</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_search_slot(trans, quota_root, &amp;key, path, -1, 1);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	if (ret &gt; 0) {</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_del_item(trans, quota_root, path);</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	return btrfs_del_item(trans, quota_root, path);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int add_qgroup_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			   struct btrfs_root *quota_root, u64 qgroupid)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_qgroup_info_item *qgroup_info;</div><div class='ctx'> 	struct btrfs_qgroup_limit_item *qgroup_limit;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='hunk'>@@ -666,7 +731,7 @@ static int add_qgroup_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	ret = btrfs_insert_empty_item(trans, quota_root, path, &amp;key,</div><div class='ctx'> 				      sizeof(*qgroup_info));</div><div class='ctx'> 	if (ret &amp;&amp; ret != -EEXIST)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	qgroup_info = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='hunk'>@@ -677,15 +742,13 @@ static int add_qgroup_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	btrfs_set_qgroup_info_excl(leaf, qgroup_info, 0);</div><div class='ctx'> 	btrfs_set_qgroup_info_excl_cmpr(leaf, qgroup_info, 0);</div><div class='ctx'> </div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='del'>-</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='ctx'> 	key.type = BTRFS_QGROUP_LIMIT_KEY;</div><div class='ctx'> 	ret = btrfs_insert_empty_item(trans, quota_root, path, &amp;key,</div><div class='ctx'> 				      sizeof(*qgroup_limit));</div><div class='ctx'> 	if (ret &amp;&amp; ret != -EEXIST)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	qgroup_limit = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='hunk'>@@ -696,19 +759,14 @@ static int add_qgroup_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	btrfs_set_qgroup_limit_rsv_rfer(leaf, qgroup_limit, 0);</div><div class='ctx'> 	btrfs_set_qgroup_limit_rsv_excl(leaf, qgroup_limit, 0);</div><div class='ctx'> </div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='del'>-</div><div class='del'>-	ret = 0;</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int del_qgroup_item(struct btrfs_trans_handle *trans, u64 qgroupid)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct btrfs_root *quota_root = trans-&gt;fs_info-&gt;quota_root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='hunk'>@@ -720,33 +778,27 @@ static int del_qgroup_item(struct btrfs_trans_handle *trans, u64 qgroupid)</div><div class='ctx'> 	key.offset = qgroupid;</div><div class='ctx'> 	ret = btrfs_search_slot(trans, quota_root, &amp;key, path, -1, 1);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	if (ret &gt; 0) {</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_del_item(trans, quota_root, path);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='ctx'> 	key.type = BTRFS_QGROUP_LIMIT_KEY;</div><div class='ctx'> 	ret = btrfs_search_slot(trans, quota_root, &amp;key, path, -1, 1);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	if (ret &gt; 0) {</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_del_item(trans, quota_root, path);</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -754,7 +806,7 @@ static int update_qgroup_limit_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				    struct btrfs_qgroup *qgroup)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *quota_root = trans-&gt;fs_info-&gt;quota_root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct extent_buffer *l;</div><div class='ctx'> 	struct btrfs_qgroup_limit_item *qgroup_limit;</div><div class='hunk'>@@ -774,7 +826,7 @@ static int update_qgroup_limit_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		ret = -ENOENT;</div><div class='ctx'> </div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	l = path-&gt;nodes[0];</div><div class='ctx'> 	slot = path-&gt;slots[0];</div><div class='hunk'>@@ -785,10 +837,6 @@ static int update_qgroup_limit_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	btrfs_set_qgroup_limit_rsv_rfer(l, qgroup_limit, qgroup-&gt;rsv_rfer);</div><div class='ctx'> 	btrfs_set_qgroup_limit_rsv_excl(l, qgroup_limit, qgroup-&gt;rsv_excl);</div><div class='ctx'> </div><div class='del'>-	btrfs_mark_buffer_dirty(l);</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -797,7 +845,7 @@ static int update_qgroup_info_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_root *quota_root = fs_info-&gt;quota_root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct extent_buffer *l;</div><div class='ctx'> 	struct btrfs_qgroup_info_item *qgroup_info;</div><div class='hunk'>@@ -820,7 +868,7 @@ static int update_qgroup_info_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		ret = -ENOENT;</div><div class='ctx'> </div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	l = path-&gt;nodes[0];</div><div class='ctx'> 	slot = path-&gt;slots[0];</div><div class='hunk'>@@ -831,10 +879,6 @@ static int update_qgroup_info_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	btrfs_set_qgroup_info_excl(l, qgroup_info, qgroup-&gt;excl);</div><div class='ctx'> 	btrfs_set_qgroup_info_excl_cmpr(l, qgroup_info, qgroup-&gt;excl_cmpr);</div><div class='ctx'> </div><div class='del'>-	btrfs_mark_buffer_dirty(l);</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -842,7 +886,7 @@ static int update_qgroup_status_item(struct btrfs_trans_handle *trans)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_root *quota_root = fs_info-&gt;quota_root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct extent_buffer *l;</div><div class='ctx'> 	struct btrfs_qgroup_status_item *ptr;</div><div class='hunk'>@@ -862,20 +906,17 @@ static int update_qgroup_status_item(struct btrfs_trans_handle *trans)</div><div class='ctx'> 		ret = -ENOENT;</div><div class='ctx'> </div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	l = path-&gt;nodes[0];</div><div class='ctx'> 	slot = path-&gt;slots[0];</div><div class='ctx'> 	ptr = btrfs_item_ptr(l, slot, struct btrfs_qgroup_status_item);</div><div class='del'>-	btrfs_set_qgroup_status_flags(l, ptr, fs_info-&gt;qgroup_flags);</div><div class='add'>+	btrfs_set_qgroup_status_flags(l, ptr, fs_info-&gt;qgroup_flags &amp;</div><div class='add'>+				      BTRFS_QGROUP_STATUS_FLAGS_MASK);</div><div class='ctx'> 	btrfs_set_qgroup_status_generation(l, ptr, trans-&gt;transid);</div><div class='ctx'> 	btrfs_set_qgroup_status_rescan(l, ptr,</div><div class='ctx'> 				fs_info-&gt;qgroup_rescan_progress.objectid);</div><div class='ctx'> </div><div class='del'>-	btrfs_mark_buffer_dirty(l);</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -885,7 +926,7 @@ out:</div><div class='ctx'> static int btrfs_clean_quota_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				  struct btrfs_root *root)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct extent_buffer *leaf = NULL;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -896,13 +937,13 @@ static int btrfs_clean_quota_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = 0;</div><div class='del'>-	key.offset = 0;</div><div class='ctx'> 	key.type = 0;</div><div class='add'>+	key.offset = 0;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		ret = btrfs_search_slot(trans, root, &amp;key, path, -1, 1);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 		leaf = path-&gt;nodes[0];</div><div class='ctx'> 		nr = btrfs_header_nritems(leaf);</div><div class='ctx'> 		if (!nr)</div><div class='hunk'>@@ -915,17 +956,16 @@ static int btrfs_clean_quota_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		path-&gt;slots[0] = 0;</div><div class='ctx'> 		ret = btrfs_del_items(trans, root, path, 0, nr);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> </div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> 	}</div><div class='del'>-	ret = 0;</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_quota_enable(struct btrfs_fs_info *fs_info)</div><div class='add'>+int btrfs_quota_enable(struct btrfs_fs_info *fs_info,</div><div class='add'>+		       struct btrfs_ioctl_quota_ctl_args *quota_ctl_args)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *quota_root;</div><div class='ctx'> 	struct btrfs_root *tree_root = fs_info-&gt;tree_root;</div><div class='hunk'>@@ -935,21 +975,30 @@ int btrfs_quota_enable(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_key found_key;</div><div class='ctx'> 	struct btrfs_qgroup *qgroup = NULL;</div><div class='add'>+	struct btrfs_qgroup *prealloc = NULL;</div><div class='ctx'> 	struct btrfs_trans_handle *trans = NULL;</div><div class='del'>-	struct ulist *ulist = NULL;</div><div class='add'>+	const bool simple = (quota_ctl_args-&gt;cmd == BTRFS_QUOTA_CTL_ENABLE_SIMPLE_QUOTA);</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int slot;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * We need to have subvol_sem write locked, to prevent races between</div><div class='add'>+	 * concurrent tasks trying to enable quotas, because we will unlock</div><div class='add'>+	 * and relock qgroup_ioctl_lock before setting fs_info-&gt;quota_root</div><div class='add'>+	 * and before setting BTRFS_FS_QUOTA_ENABLED.</div><div class='add'>+	 */</div><div class='add'>+	lockdep_assert_held_write(&amp;fs_info-&gt;subvol_sem);</div><div class='add'>+</div><div class='add'>+	if (btrfs_fs_incompat(fs_info, EXTENT_TREE_V2)) {</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+			  "qgroups are currently unsupported in extent tree v2");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	mutex_lock(&amp;fs_info-&gt;qgroup_ioctl_lock);</div><div class='ctx'> 	if (fs_info-&gt;quota_root)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	ulist = ulist_alloc(GFP_KERNEL);</div><div class='del'>-	if (!ulist) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	ret = btrfs_sysfs_add_qgroups(fs_info);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -989,9 +1038,6 @@ int btrfs_quota_enable(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	if (fs_info-&gt;quota_root)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	fs_info-&gt;qgroup_ulist = ulist;</div><div class='del'>-	ulist = NULL;</div><div class='del'>-</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * initially create the quota tree</div><div class='ctx'> 	 */</div><div class='hunk'>@@ -1003,7 +1049,7 @@ int btrfs_quota_enable(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='del'>-	if (!path) {</div><div class='add'>+	if (unlikely(!path)) {</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out_free_root;</div><div class='hunk'>@@ -1015,7 +1061,7 @@ int btrfs_quota_enable(struct btrfs_fs_info *fs_info)</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_insert_empty_item(trans, quota_root, path, &amp;key,</div><div class='ctx'> 				      sizeof(*ptr));</div><div class='del'>-	if (ret) {</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out_free_path;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1025,13 +1071,18 @@ int btrfs_quota_enable(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 				 struct btrfs_qgroup_status_item);</div><div class='ctx'> 	btrfs_set_qgroup_status_generation(leaf, ptr, trans-&gt;transid);</div><div class='ctx'> 	btrfs_set_qgroup_status_version(leaf, ptr, BTRFS_QGROUP_STATUS_VERSION);</div><div class='del'>-	fs_info-&gt;qgroup_flags = BTRFS_QGROUP_STATUS_FLAG_ON |</div><div class='del'>-				BTRFS_QGROUP_STATUS_FLAG_INCONSISTENT;</div><div class='del'>-	btrfs_set_qgroup_status_flags(leaf, ptr, fs_info-&gt;qgroup_flags);</div><div class='add'>+	fs_info-&gt;qgroup_flags = BTRFS_QGROUP_STATUS_FLAG_ON;</div><div class='add'>+	if (simple) {</div><div class='add'>+		fs_info-&gt;qgroup_flags |= BTRFS_QGROUP_STATUS_FLAG_SIMPLE_MODE;</div><div class='add'>+		btrfs_set_fs_incompat(fs_info, SIMPLE_QUOTA);</div><div class='add'>+		btrfs_set_qgroup_status_enable_gen(leaf, ptr, trans-&gt;transid);</div><div class='add'>+	} else {</div><div class='add'>+		fs_info-&gt;qgroup_flags |= BTRFS_QGROUP_STATUS_FLAG_INCONSISTENT;</div><div class='add'>+	}</div><div class='add'>+	btrfs_set_qgroup_status_flags(leaf, ptr, fs_info-&gt;qgroup_flags &amp;</div><div class='add'>+				      BTRFS_QGROUP_STATUS_FLAGS_MASK);</div><div class='ctx'> 	btrfs_set_qgroup_status_rescan(leaf, ptr, 0);</div><div class='ctx'> </div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='del'>-</div><div class='ctx'> 	key.objectid = 0;</div><div class='ctx'> 	key.type = BTRFS_ROOT_REF_KEY;</div><div class='ctx'> 	key.offset = 0;</div><div class='hunk'>@@ -1040,7 +1091,7 @@ int btrfs_quota_enable(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	ret = btrfs_search_slot_for_read(tree_root, &amp;key, path, 1, 0);</div><div class='ctx'> 	if (ret &gt; 0)</div><div class='ctx'> 		goto out_add_root;</div><div class='del'>-	if (ret &lt; 0) {</div><div class='add'>+	if (unlikely(ret &lt; 0)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out_free_path;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1055,27 +1106,32 @@ int btrfs_quota_enable(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 			/* Release locks on tree_root before we access quota_root */</div><div class='ctx'> 			btrfs_release_path(path);</div><div class='ctx'> </div><div class='del'>-			ret = add_qgroup_item(trans, quota_root,</div><div class='del'>-					      found_key.offset);</div><div class='del'>-			if (ret) {</div><div class='add'>+			/* We should not have a stray @prealloc pointer. */</div><div class='add'>+			ASSERT(prealloc == NULL);</div><div class='add'>+			prealloc = kzalloc(sizeof(*prealloc), GFP_NOFS);</div><div class='add'>+			if (unlikely(!prealloc)) {</div><div class='add'>+				ret = -ENOMEM;</div><div class='ctx'> 				btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 				goto out_free_path;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			qgroup = add_qgroup_rb(fs_info, found_key.offset);</div><div class='del'>-			if (IS_ERR(qgroup)) {</div><div class='del'>-				ret = PTR_ERR(qgroup);</div><div class='add'>+			ret = add_qgroup_item(trans, quota_root,</div><div class='add'>+					      found_key.offset);</div><div class='add'>+			if (unlikely(ret)) {</div><div class='ctx'> 				btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 				goto out_free_path;</div><div class='ctx'> 			}</div><div class='add'>+</div><div class='add'>+			qgroup = add_qgroup_rb(fs_info, prealloc, found_key.offset);</div><div class='add'>+			prealloc = NULL;</div><div class='ctx'> 			ret = btrfs_sysfs_add_one_qgroup(fs_info, qgroup);</div><div class='del'>-			if (ret &lt; 0) {</div><div class='add'>+			if (unlikely(ret &lt; 0)) {</div><div class='ctx'> 				btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 				goto out_free_path;</div><div class='ctx'> 			}</div><div class='ctx'> 			ret = btrfs_search_slot_for_read(tree_root, &amp;found_key,</div><div class='ctx'> 							 path, 1, 0);</div><div class='del'>-			if (ret &lt; 0) {</div><div class='add'>+			if (unlikely(ret &lt; 0)) {</div><div class='ctx'> 				btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 				goto out_free_path;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -1089,7 +1145,7 @@ int btrfs_quota_enable(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 		ret = btrfs_next_item(tree_root, path);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='add'>+		if (unlikely(ret &lt; 0)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out_free_path;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1100,25 +1156,40 @@ int btrfs_quota_enable(struct btrfs_fs_info *fs_info)</div><div class='ctx'> out_add_root:</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> 	ret = add_qgroup_item(trans, quota_root, BTRFS_FS_TREE_OBJECTID);</div><div class='del'>-	if (ret) {</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out_free_path;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	qgroup = add_qgroup_rb(fs_info, BTRFS_FS_TREE_OBJECTID);</div><div class='del'>-	if (IS_ERR(qgroup)) {</div><div class='del'>-		ret = PTR_ERR(qgroup);</div><div class='del'>-		btrfs_abort_transaction(trans, ret);</div><div class='add'>+	ASSERT(prealloc == NULL);</div><div class='add'>+	prealloc = kzalloc(sizeof(*prealloc), GFP_NOFS);</div><div class='add'>+	if (!prealloc) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='ctx'> 		goto out_free_path;</div><div class='ctx'> 	}</div><div class='add'>+	qgroup = add_qgroup_rb(fs_info, prealloc, BTRFS_FS_TREE_OBJECTID);</div><div class='add'>+	prealloc = NULL;</div><div class='ctx'> 	ret = btrfs_sysfs_add_one_qgroup(fs_info, qgroup);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='add'>+	if (unlikely(ret &lt; 0)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out_free_path;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	fs_info-&gt;qgroup_enable_gen = trans-&gt;transid;</div><div class='add'>+</div><div class='add'>+	mutex_unlock(&amp;fs_info-&gt;qgroup_ioctl_lock);</div><div class='add'>+	/*</div><div class='add'>+	 * Commit the transaction while not holding qgroup_ioctl_lock, to avoid</div><div class='add'>+	 * a deadlock with tasks concurrently doing other qgroup operations, such</div><div class='add'>+	 * adding/removing qgroups or adding/deleting qgroup relations for example,</div><div class='add'>+	 * because all qgroup operations first start or join a transaction and then</div><div class='add'>+	 * lock the qgroup_ioctl_lock mutex.</div><div class='add'>+	 * We are safe from a concurrent task trying to enable quotas, by calling</div><div class='add'>+	 * this function, since we are serialized by fs_info-&gt;subvol_sem.</div><div class='add'>+	 */</div><div class='ctx'> 	ret = btrfs_commit_transaction(trans);</div><div class='ctx'> 	trans = NULL;</div><div class='add'>+	mutex_lock(&amp;fs_info-&gt;qgroup_ioctl_lock);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out_free_path;</div><div class='ctx'> </div><div class='hunk'>@@ -1132,12 +1203,31 @@ out_add_root:</div><div class='ctx'> 	set_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags);</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;qgroup_lock);</div><div class='ctx'> </div><div class='add'>+	/* Skip rescan for simple qgroups. */</div><div class='add'>+	if (btrfs_qgroup_mode(fs_info) == BTRFS_QGROUP_MODE_SIMPLE)</div><div class='add'>+		goto out_free_path;</div><div class='add'>+</div><div class='ctx'> 	ret = qgroup_rescan_init(fs_info, 0, 1);</div><div class='ctx'> 	if (!ret) {</div><div class='ctx'> 	        qgroup_rescan_zero_tracking(fs_info);</div><div class='ctx'> 		fs_info-&gt;qgroup_rescan_running = true;</div><div class='ctx'> 	        btrfs_queue_work(fs_info-&gt;qgroup_rescan_workers,</div><div class='ctx'> 	                         &amp;fs_info-&gt;qgroup_rescan_work);</div><div class='add'>+	} else {</div><div class='add'>+		/*</div><div class='add'>+		 * We have set both BTRFS_FS_QUOTA_ENABLED and</div><div class='add'>+		 * BTRFS_QGROUP_STATUS_FLAG_ON, so we can only fail with</div><div class='add'>+		 * -EINPROGRESS. That can happen because someone started the</div><div class='add'>+		 * rescan worker by calling quota rescan ioctl before we</div><div class='add'>+		 * attempted to initialize the rescan worker. Failure due to</div><div class='add'>+		 * quotas disabled in the meanwhile is not possible, because</div><div class='add'>+		 * we are holding a write lock on fs_info-&gt;subvol_sem, which</div><div class='add'>+		 * is also acquired when disabling quotas.</div><div class='add'>+		 * Ignore such error, and any other error would need to undo</div><div class='add'>+		 * everything we did in the transaction we just committed.</div><div class='add'>+		 */</div><div class='add'>+		ASSERT(ret == -EINPROGRESS);</div><div class='add'>+		ret = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> out_free_path:</div><div class='hunk'>@@ -1146,32 +1236,101 @@ out_free_root:</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		btrfs_put_root(quota_root);</div><div class='ctx'> out:</div><div class='del'>-	if (ret) {</div><div class='del'>-		ulist_free(fs_info-&gt;qgroup_ulist);</div><div class='del'>-		fs_info-&gt;qgroup_ulist = NULL;</div><div class='add'>+	if (ret)</div><div class='ctx'> 		btrfs_sysfs_del_qgroups(fs_info);</div><div class='del'>-	}</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;qgroup_ioctl_lock);</div><div class='ctx'> 	if (ret &amp;&amp; trans)</div><div class='ctx'> 		btrfs_end_transaction(trans);</div><div class='ctx'> 	else if (trans)</div><div class='ctx'> 		ret = btrfs_end_transaction(trans);</div><div class='del'>-	ulist_free(ulist);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * At this point we either failed at allocating prealloc, or we</div><div class='add'>+	 * succeeded and passed the ownership to it to add_qgroup_rb(). In any</div><div class='add'>+	 * case, this needs to be NULL or there is something wrong.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(prealloc == NULL);</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * It is possible to have outstanding ordered extents which reserved bytes</div><div class='add'>+ * before we disabled. We need to fully flush delalloc, ordered extents, and a</div><div class='add'>+ * commit to ensure that we don't leak such reservations, only to have them</div><div class='add'>+ * come back if we re-enable.</div><div class='add'>+ *</div><div class='add'>+ * - enable simple quotas</div><div class='add'>+ * - reserve space</div><div class='add'>+ * - release it, store rsv_bytes in OE</div><div class='add'>+ * - disable quotas</div><div class='add'>+ * - enable simple quotas (qgroup rsv are all 0)</div><div class='add'>+ * - OE finishes</div><div class='add'>+ * - run delayed refs</div><div class='add'>+ * - free rsv_bytes, resulting in miscounting or even underflow</div><div class='add'>+ */</div><div class='add'>+static int flush_reservations(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_start_delalloc_roots(fs_info, LONG_MAX, false);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+	btrfs_wait_ordered_roots(fs_info, U64_MAX, NULL);</div><div class='add'>+</div><div class='add'>+	return btrfs_commit_current_transaction(fs_info-&gt;tree_root);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> int btrfs_quota_disable(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *quota_root;</div><div class='add'>+	struct btrfs_root *quota_root = NULL;</div><div class='ctx'> 	struct btrfs_trans_handle *trans = NULL;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * We need to have subvol_sem write locked to prevent races with</div><div class='add'>+	 * snapshot creation.</div><div class='add'>+	 */</div><div class='add'>+	lockdep_assert_held_write(&amp;fs_info-&gt;subvol_sem);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Relocation will mess with backrefs, so make sure we have the</div><div class='add'>+	 * cleaner_mutex held to protect us from relocate.</div><div class='add'>+	 */</div><div class='add'>+	lockdep_assert_held(&amp;fs_info-&gt;cleaner_mutex);</div><div class='add'>+</div><div class='ctx'> 	mutex_lock(&amp;fs_info-&gt;qgroup_ioctl_lock);</div><div class='ctx'> 	if (!fs_info-&gt;quota_root)</div><div class='ctx'> 		goto out;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Unlock the qgroup_ioctl_lock mutex before waiting for the rescan worker to</div><div class='add'>+	 * complete. Otherwise we can deadlock because btrfs_remove_qgroup() needs</div><div class='add'>+	 * to lock that mutex while holding a transaction handle and the rescan</div><div class='add'>+	 * worker needs to commit a transaction.</div><div class='add'>+	 */</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;qgroup_ioctl_lock);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='add'>+	 * Request qgroup rescan worker to complete and wait for it. This wait</div><div class='add'>+	 * must be done before transaction start for quota disable since it may</div><div class='add'>+	 * deadlock with transaction by the qgroup rescan worker.</div><div class='add'>+	 */</div><div class='add'>+	clear_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags);</div><div class='add'>+	btrfs_qgroup_wait_for_completion(fs_info, false);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We have nothing held here and no trans handle, just return the error</div><div class='add'>+	 * if there is one and set back the quota enabled bit since we didn't</div><div class='add'>+	 * actually disable quotas.</div><div class='add'>+	 */</div><div class='add'>+	ret = flush_reservations(fs_info);</div><div class='add'>+	if (ret) {</div><div class='add'>+		set_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='ctx'> 	 * 1 For the root item</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * We should also reserve enough items for the quota tree deletion in</div><div class='hunk'>@@ -1186,50 +1345,55 @@ int btrfs_quota_disable(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	if (IS_ERR(trans)) {</div><div class='ctx'> 		ret = PTR_ERR(trans);</div><div class='ctx'> 		trans = NULL;</div><div class='add'>+		set_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!fs_info-&gt;quota_root)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	clear_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags);</div><div class='del'>-	btrfs_qgroup_wait_for_completion(fs_info, false);</div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;qgroup_lock);</div><div class='ctx'> 	quota_root = fs_info-&gt;quota_root;</div><div class='ctx'> 	fs_info-&gt;quota_root = NULL;</div><div class='ctx'> 	fs_info-&gt;qgroup_flags &amp;= ~BTRFS_QGROUP_STATUS_FLAG_ON;</div><div class='add'>+	fs_info-&gt;qgroup_flags &amp;= ~BTRFS_QGROUP_STATUS_FLAG_SIMPLE_MODE;</div><div class='add'>+	fs_info-&gt;qgroup_drop_subtree_thres = BTRFS_QGROUP_DROP_SUBTREE_THRES_DEFAULT;</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;qgroup_lock);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_free_qgroup_config(fs_info);</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_clean_quota_tree(trans, quota_root);</div><div class='del'>-	if (ret) {</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_del_root(trans, &amp;quota_root-&gt;root_key);</div><div class='del'>-	if (ret) {</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	spin_lock(&amp;fs_info-&gt;trans_lock);</div><div class='ctx'> 	list_del(&amp;quota_root-&gt;dirty_list);</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_tree_lock(quota_root-&gt;node);</div><div class='del'>-	btrfs_clean_tree_block(quota_root-&gt;node);</div><div class='add'>+	btrfs_clear_buffer_dirty(trans, quota_root-&gt;node);</div><div class='ctx'> 	btrfs_tree_unlock(quota_root-&gt;node);</div><div class='del'>-	btrfs_free_tree_block(trans, quota_root, quota_root-&gt;node, 0, 1);</div><div class='add'>+	ret = btrfs_free_tree_block(trans, btrfs_root_id(quota_root),</div><div class='add'>+				    quota_root-&gt;node, 0, 1);</div><div class='ctx'> </div><div class='del'>-	btrfs_put_root(quota_root);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='add'>+	btrfs_put_root(quota_root);</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;qgroup_ioctl_lock);</div><div class='ctx'> 	if (ret &amp;&amp; trans)</div><div class='ctx'> 		btrfs_end_transaction(trans);</div><div class='ctx'> 	else if (trans)</div><div class='del'>-		ret = btrfs_end_transaction(trans);</div><div class='del'>-</div><div class='add'>+		ret = btrfs_commit_transaction(trans);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1240,6 +1404,24 @@ static void qgroup_dirty(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		list_add(&amp;qgroup-&gt;dirty, &amp;fs_info-&gt;dirty_qgroups);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void qgroup_iterator_add(struct list_head *head, struct btrfs_qgroup *qgroup)</div><div class='add'>+{</div><div class='add'>+	if (!list_empty(&amp;qgroup-&gt;iterator))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	list_add_tail(&amp;qgroup-&gt;iterator, head);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void qgroup_iterator_clean(struct list_head *head)</div><div class='add'>+{</div><div class='add'>+	while (!list_empty(head)) {</div><div class='add'>+		struct btrfs_qgroup *qgroup;</div><div class='add'>+</div><div class='add'>+		qgroup = list_first_entry(head, struct btrfs_qgroup, iterator);</div><div class='add'>+		list_del_init(&amp;qgroup-&gt;iterator);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * The easy accounting, we're updating qgroup relationship whose child qgroup</div><div class='ctx'>  * only has exclusive extents.</div><div class='hunk'>@@ -1254,68 +1436,44 @@ static void qgroup_dirty(struct btrfs_fs_info *fs_info,</div><div class='ctx'>  *</div><div class='ctx'>  * Caller should hold fs_info-&gt;qgroup_lock.</div><div class='ctx'>  */</div><div class='del'>-static int __qgroup_excl_accounting(struct btrfs_fs_info *fs_info,</div><div class='del'>-				    struct ulist *tmp, u64 ref_root,</div><div class='add'>+static int __qgroup_excl_accounting(struct btrfs_fs_info *fs_info, u64 ref_root,</div><div class='ctx'> 				    struct btrfs_qgroup *src, int sign)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_qgroup *qgroup;</div><div class='del'>-	struct btrfs_qgroup_list *glist;</div><div class='del'>-	struct ulist_node *unode;</div><div class='del'>-	struct ulist_iterator uiter;</div><div class='add'>+	LIST_HEAD(qgroup_list);</div><div class='ctx'> 	u64 num_bytes = src-&gt;excl;</div><div class='add'>+	u64 num_bytes_cmpr = src-&gt;excl_cmpr;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	qgroup = find_qgroup_rb(fs_info, ref_root);</div><div class='ctx'> 	if (!qgroup)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	qgroup-&gt;rfer += sign * num_bytes;</div><div class='del'>-	qgroup-&gt;rfer_cmpr += sign * num_bytes;</div><div class='del'>-</div><div class='del'>-	WARN_ON(sign &lt; 0 &amp;&amp; qgroup-&gt;excl &lt; num_bytes);</div><div class='del'>-	qgroup-&gt;excl += sign * num_bytes;</div><div class='del'>-	qgroup-&gt;excl_cmpr += sign * num_bytes;</div><div class='del'>-</div><div class='del'>-	if (sign &gt; 0)</div><div class='del'>-		qgroup_rsv_add_by_qgroup(fs_info, qgroup, src);</div><div class='del'>-	else</div><div class='del'>-		qgroup_rsv_release_by_qgroup(fs_info, qgroup, src);</div><div class='del'>-</div><div class='del'>-	qgroup_dirty(fs_info, qgroup);</div><div class='del'>-</div><div class='del'>-	/* Get all of the parent groups that contain this qgroup */</div><div class='del'>-	list_for_each_entry(glist, &amp;qgroup-&gt;groups, next_group) {</div><div class='del'>-		ret = ulist_add(tmp, glist-&gt;group-&gt;qgroupid,</div><div class='del'>-				qgroup_to_aux(glist-&gt;group), GFP_ATOMIC);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='del'>-	}</div><div class='add'>+	qgroup_iterator_add(&amp;qgroup_list, qgroup);</div><div class='add'>+	list_for_each_entry(qgroup, &amp;qgroup_list, iterator) {</div><div class='add'>+		struct btrfs_qgroup_list *glist;</div><div class='ctx'> </div><div class='del'>-	/* Iterate all of the parents and adjust their reference counts */</div><div class='del'>-	ULIST_ITER_INIT(&amp;uiter);</div><div class='del'>-	while ((unode = ulist_next(tmp, &amp;uiter))) {</div><div class='del'>-		qgroup = unode_aux_to_qgroup(unode);</div><div class='ctx'> 		qgroup-&gt;rfer += sign * num_bytes;</div><div class='del'>-		qgroup-&gt;rfer_cmpr += sign * num_bytes;</div><div class='add'>+		qgroup-&gt;rfer_cmpr += sign * num_bytes_cmpr;</div><div class='add'>+</div><div class='ctx'> 		WARN_ON(sign &lt; 0 &amp;&amp; qgroup-&gt;excl &lt; num_bytes);</div><div class='add'>+		WARN_ON(sign &lt; 0 &amp;&amp; qgroup-&gt;excl_cmpr &lt; num_bytes_cmpr);</div><div class='ctx'> 		qgroup-&gt;excl += sign * num_bytes;</div><div class='add'>+		qgroup-&gt;excl_cmpr += sign * num_bytes_cmpr;</div><div class='add'>+</div><div class='ctx'> 		if (sign &gt; 0)</div><div class='ctx'> 			qgroup_rsv_add_by_qgroup(fs_info, qgroup, src);</div><div class='ctx'> 		else</div><div class='ctx'> 			qgroup_rsv_release_by_qgroup(fs_info, qgroup, src);</div><div class='del'>-		qgroup-&gt;excl_cmpr += sign * num_bytes;</div><div class='ctx'> 		qgroup_dirty(fs_info, qgroup);</div><div class='ctx'> </div><div class='del'>-		/* Add any parents of the parents */</div><div class='del'>-		list_for_each_entry(glist, &amp;qgroup-&gt;groups, next_group) {</div><div class='del'>-			ret = ulist_add(tmp, glist-&gt;group-&gt;qgroupid,</div><div class='del'>-					qgroup_to_aux(glist-&gt;group), GFP_ATOMIC);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto out;</div><div class='del'>-		}</div><div class='add'>+		/* Append parent qgroups to @qgroup_list. */</div><div class='add'>+		list_for_each_entry(glist, &amp;qgroup-&gt;groups, next_group)</div><div class='add'>+			qgroup_iterator_add(&amp;qgroup_list, glist-&gt;group);</div><div class='ctx'> 	}</div><div class='ctx'> 	ret = 0;</div><div class='ctx'> out:</div><div class='add'>+	qgroup_iterator_clean(&amp;qgroup_list);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1332,24 +1490,19 @@ out:</div><div class='ctx'>  * Return &lt; 0 for other error.</div><div class='ctx'>  */</div><div class='ctx'> static int quick_update_accounting(struct btrfs_fs_info *fs_info,</div><div class='del'>-				   struct ulist *tmp, u64 src, u64 dst,</div><div class='del'>-				   int sign)</div><div class='add'>+				   u64 src, u64 dst, int sign)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_qgroup *qgroup;</div><div class='ctx'> 	int ret = 1;</div><div class='del'>-	int err = 0;</div><div class='ctx'> </div><div class='ctx'> 	qgroup = find_qgroup_rb(fs_info, src);</div><div class='ctx'> 	if (!qgroup)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	if (qgroup-&gt;excl == qgroup-&gt;rfer) {</div><div class='del'>-		ret = 0;</div><div class='del'>-		err = __qgroup_excl_accounting(fs_info, tmp, dst,</div><div class='del'>-					       qgroup, sign);</div><div class='del'>-		if (err &lt; 0) {</div><div class='del'>-			ret = err;</div><div class='add'>+		ret = __qgroup_excl_accounting(fs_info, dst, qgroup, sign);</div><div class='add'>+		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='del'>-		}</div><div class='add'>+		ret = 0;</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='ctx'> 	if (ret)</div><div class='hunk'>@@ -1357,27 +1510,26 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_add_qgroup_relation(struct btrfs_trans_handle *trans, u64 src,</div><div class='del'>-			      u64 dst)</div><div class='add'>+/*</div><div class='add'>+ * Add relation between @src and @dst qgroup. The @prealloc is allocated by the</div><div class='add'>+ * callers and transferred here (either used or freed on error).</div><div class='add'>+ */</div><div class='add'>+int btrfs_add_qgroup_relation(struct btrfs_trans_handle *trans, u64 src, u64 dst,</div><div class='add'>+			      struct btrfs_qgroup_list *prealloc)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_qgroup *parent;</div><div class='ctx'> 	struct btrfs_qgroup *member;</div><div class='ctx'> 	struct btrfs_qgroup_list *list;</div><div class='del'>-	struct ulist *tmp;</div><div class='del'>-	unsigned int nofs_flag;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='add'>+	ASSERT(prealloc);</div><div class='add'>+</div><div class='ctx'> 	/* Check the level of src and dst first */</div><div class='del'>-	if (btrfs_qgroup_level(src) &gt;= btrfs_qgroup_level(dst))</div><div class='add'>+	if (btrfs_qgroup_level(src) &gt;= btrfs_qgroup_level(dst)) {</div><div class='add'>+		kfree(prealloc);</div><div class='ctx'> 		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	/* We hold a transaction handle open, must do a NOFS allocation. */</div><div class='del'>-	nofs_flag = memalloc_nofs_save();</div><div class='del'>-	tmp = ulist_alloc(GFP_KERNEL);</div><div class='del'>-	memalloc_nofs_restore(nofs_flag);</div><div class='del'>-	if (!tmp)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;fs_info-&gt;qgroup_ioctl_lock);</div><div class='ctx'> 	if (!fs_info-&gt;quota_root) {</div><div class='hunk'>@@ -1410,16 +1562,17 @@ int btrfs_add_qgroup_relation(struct btrfs_trans_handle *trans, u64 src,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;qgroup_lock);</div><div class='del'>-	ret = add_relation_rb(fs_info, src, dst);</div><div class='add'>+	ret = __add_relation_rb(prealloc, member, parent);</div><div class='add'>+	prealloc = NULL;</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='ctx'> 		spin_unlock(&amp;fs_info-&gt;qgroup_lock);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	ret = quick_update_accounting(fs_info, tmp, src, dst, 1);</div><div class='add'>+	ret = quick_update_accounting(fs_info, src, dst, 1);</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;qgroup_lock);</div><div class='ctx'> out:</div><div class='add'>+	kfree(prealloc);</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;qgroup_ioctl_lock);</div><div class='del'>-	ulist_free(tmp);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1430,19 +1583,10 @@ static int __del_qgroup_relation(struct btrfs_trans_handle *trans, u64 src,</div><div class='ctx'> 	struct btrfs_qgroup *parent;</div><div class='ctx'> 	struct btrfs_qgroup *member;</div><div class='ctx'> 	struct btrfs_qgroup_list *list;</div><div class='del'>-	struct ulist *tmp;</div><div class='ctx'> 	bool found = false;</div><div class='del'>-	unsigned int nofs_flag;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int ret2;</div><div class='ctx'> </div><div class='del'>-	/* We hold a transaction handle open, must do a NOFS allocation. */</div><div class='del'>-	nofs_flag = memalloc_nofs_save();</div><div class='del'>-	tmp = ulist_alloc(GFP_KERNEL);</div><div class='del'>-	memalloc_nofs_restore(nofs_flag);</div><div class='del'>-	if (!tmp)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='ctx'> 	if (!fs_info-&gt;quota_root) {</div><div class='ctx'> 		ret = -ENOTCONN;</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -1480,11 +1624,10 @@ delete_item:</div><div class='ctx'> 	if (found) {</div><div class='ctx'> 		spin_lock(&amp;fs_info-&gt;qgroup_lock);</div><div class='ctx'> 		del_relation_rb(fs_info, src, dst);</div><div class='del'>-		ret = quick_update_accounting(fs_info, tmp, src, dst, -1);</div><div class='add'>+		ret = quick_update_accounting(fs_info, src, dst, -1);</div><div class='ctx'> 		spin_unlock(&amp;fs_info-&gt;qgroup_lock);</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='del'>-	ulist_free(tmp);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1506,6 +1649,7 @@ int btrfs_create_qgroup(struct btrfs_trans_handle *trans, u64 qgroupid)</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_root *quota_root;</div><div class='ctx'> 	struct btrfs_qgroup *qgroup;</div><div class='add'>+	struct btrfs_qgroup *prealloc = NULL;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;fs_info-&gt;qgroup_ioctl_lock);</div><div class='hunk'>@@ -1520,24 +1664,81 @@ int btrfs_create_qgroup(struct btrfs_trans_handle *trans, u64 qgroupid)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	prealloc = kzalloc(sizeof(*prealloc), GFP_NOFS);</div><div class='add'>+	if (!prealloc) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	ret = add_qgroup_item(trans, quota_root, qgroupid);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;qgroup_lock);</div><div class='del'>-	qgroup = add_qgroup_rb(fs_info, qgroupid);</div><div class='add'>+	qgroup = add_qgroup_rb(fs_info, prealloc, qgroupid);</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;qgroup_lock);</div><div class='add'>+	prealloc = NULL;</div><div class='ctx'> </div><div class='del'>-	if (IS_ERR(qgroup)) {</div><div class='del'>-		ret = PTR_ERR(qgroup);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='ctx'> 	ret = btrfs_sysfs_add_one_qgroup(fs_info, qgroup);</div><div class='ctx'> out:</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;qgroup_ioctl_lock);</div><div class='add'>+	/*</div><div class='add'>+	 * At this point we either failed at allocating prealloc, or we</div><div class='add'>+	 * succeeded and passed the ownership to it to add_qgroup_rb(). In any</div><div class='add'>+	 * case, this needs to be NULL or there is something wrong.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(prealloc == NULL);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Return 0 if we can not delete the qgroup (not empty or has children etc).</div><div class='add'>+ * Return &gt;0 if we can delete the qgroup.</div><div class='add'>+ * Return &lt;0 for other errors during tree search.</div><div class='add'>+ */</div><div class='add'>+static int can_delete_qgroup(struct btrfs_fs_info *fs_info, struct btrfs_qgroup *qgroup)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_key key;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Squota would never be inconsistent, but there can still be case</div><div class='add'>+	 * where a dropped subvolume still has qgroup numbers, and squota</div><div class='add'>+	 * relies on such qgroup for future accounting.</div><div class='add'>+	 *</div><div class='add'>+	 * So for squota, do not allow dropping any non-zero qgroup.</div><div class='add'>+	 */</div><div class='add'>+	if (btrfs_qgroup_mode(fs_info) == BTRFS_QGROUP_MODE_SIMPLE &amp;&amp;</div><div class='add'>+	    (qgroup-&gt;rfer || qgroup-&gt;excl || qgroup-&gt;excl_cmpr || qgroup-&gt;rfer_cmpr))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/* For higher level qgroup, we can only delete it if it has no child. */</div><div class='add'>+	if (btrfs_qgroup_level(qgroup-&gt;qgroupid)) {</div><div class='add'>+		if (!list_empty(&amp;qgroup-&gt;members))</div><div class='add'>+			return 0;</div><div class='add'>+		return 1;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * For level-0 qgroups, we can only delete it if it has no subvolume</div><div class='add'>+	 * for it.</div><div class='add'>+	 * This means even a subvolume is unlinked but not yet fully dropped,</div><div class='add'>+	 * we can not delete the qgroup.</div><div class='add'>+	 */</div><div class='add'>+	key.objectid = qgroup-&gt;qgroupid;</div><div class='add'>+	key.type = BTRFS_ROOT_ITEM_KEY;</div><div class='add'>+	key.offset = -1ULL;</div><div class='add'>+	path = btrfs_alloc_path();</div><div class='add'>+	if (!path)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The @ret from btrfs_find_root() exactly matches our definition for</div><div class='add'>+	 * the return value, thus can be returned directly.</div><div class='add'>+	 */</div><div class='add'>+	return btrfs_find_root(fs_info-&gt;tree_root, &amp;key, path, NULL, NULL);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> int btrfs_remove_qgroup(struct btrfs_trans_handle *trans, u64 qgroupid)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='hunk'>@@ -1557,6 +1758,14 @@ int btrfs_remove_qgroup(struct btrfs_trans_handle *trans, u64 qgroupid)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	ret = can_delete_qgroup(fs_info, qgroup);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+	if (ret == 0) {</div><div class='add'>+		ret = -EBUSY;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/* Check if there are no children of this qgroup */</div><div class='ctx'> 	if (!list_empty(&amp;qgroup-&gt;members)) {</div><div class='ctx'> 		ret = -EBUSY;</div><div class='hunk'>@@ -1577,6 +1786,44 @@ int btrfs_remove_qgroup(struct btrfs_trans_handle *trans, u64 qgroupid)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;qgroup_lock);</div><div class='add'>+	/*</div><div class='add'>+	 * Warn on reserved space. The subvolume should has no child nor</div><div class='add'>+	 * corresponding subvolume.</div><div class='add'>+	 * Thus its reserved space should all be zero, no matter if qgroup</div><div class='add'>+	 * is consistent or the mode.</div><div class='add'>+	 */</div><div class='add'>+	if (qgroup-&gt;rsv.values[BTRFS_QGROUP_RSV_DATA] ||</div><div class='add'>+	    qgroup-&gt;rsv.values[BTRFS_QGROUP_RSV_META_PREALLOC] ||</div><div class='add'>+	    qgroup-&gt;rsv.values[BTRFS_QGROUP_RSV_META_PERTRANS]) {</div><div class='add'>+		DEBUG_WARN();</div><div class='add'>+		btrfs_warn_rl(fs_info,</div><div class='add'>+"to be deleted qgroup %u/%llu has non-zero numbers, data %llu meta prealloc %llu meta pertrans %llu",</div><div class='add'>+			      btrfs_qgroup_level(qgroup-&gt;qgroupid),</div><div class='add'>+			      btrfs_qgroup_subvolid(qgroup-&gt;qgroupid),</div><div class='add'>+			      qgroup-&gt;rsv.values[BTRFS_QGROUP_RSV_DATA],</div><div class='add'>+			      qgroup-&gt;rsv.values[BTRFS_QGROUP_RSV_META_PREALLOC],</div><div class='add'>+			      qgroup-&gt;rsv.values[BTRFS_QGROUP_RSV_META_PERTRANS]);</div><div class='add'>+</div><div class='add'>+	}</div><div class='add'>+	/*</div><div class='add'>+	 * The same for rfer/excl numbers, but that's only if our qgroup is</div><div class='add'>+	 * consistent and if it's in regular qgroup mode.</div><div class='add'>+	 * For simple mode it's not as accurate thus we can hit non-zero values</div><div class='add'>+	 * very frequently.</div><div class='add'>+	 */</div><div class='add'>+	if (btrfs_qgroup_mode(fs_info) == BTRFS_QGROUP_MODE_FULL &amp;&amp;</div><div class='add'>+	    !(fs_info-&gt;qgroup_flags &amp; BTRFS_QGROUP_STATUS_FLAG_INCONSISTENT)) {</div><div class='add'>+		if (qgroup-&gt;rfer || qgroup-&gt;excl ||</div><div class='add'>+		    qgroup-&gt;rfer_cmpr || qgroup-&gt;excl_cmpr) {</div><div class='add'>+			DEBUG_WARN();</div><div class='add'>+			qgroup_mark_inconsistent(fs_info,</div><div class='add'>+				"to be deleted qgroup %u/%llu has non-zero numbers, rfer %llu rfer_cmpr %llu excl %llu excl_cmpr %llu",</div><div class='add'>+				btrfs_qgroup_level(qgroup-&gt;qgroupid),</div><div class='add'>+				btrfs_qgroup_subvolid(qgroup-&gt;qgroupid),</div><div class='add'>+				qgroup-&gt;rfer, qgroup-&gt;rfer_cmpr,</div><div class='add'>+				qgroup-&gt;excl, qgroup-&gt;excl_cmpr);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> 	del_qgroup_rb(fs_info, qgroupid);</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;qgroup_lock);</div><div class='ctx'> </div><div class='hunk'>@@ -1592,6 +1839,41 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+int btrfs_qgroup_cleanup_dropped_subvolume(struct btrfs_fs_info *fs_info, u64 subvolid)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_trans_handle *trans;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (!btrfs_is_fstree(subvolid) || !btrfs_qgroup_enabled(fs_info) ||</div><div class='add'>+	    !fs_info-&gt;quota_root)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Commit current transaction to make sure all the rfer/excl numbers</div><div class='add'>+	 * get updated.</div><div class='add'>+	 */</div><div class='add'>+	ret = btrfs_commit_current_transaction(fs_info-&gt;quota_root);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	/* Start new trans to delete the qgroup info and limit items. */</div><div class='add'>+	trans = btrfs_start_transaction(fs_info-&gt;quota_root, 2);</div><div class='add'>+	if (IS_ERR(trans))</div><div class='add'>+		return PTR_ERR(trans);</div><div class='add'>+	ret = btrfs_remove_qgroup(trans, subvolid);</div><div class='add'>+	btrfs_end_transaction(trans);</div><div class='add'>+	/*</div><div class='add'>+	 * It's squota and the subvolume still has numbers needed for future</div><div class='add'>+	 * accounting, in this case we can not delete it.  Just skip it.</div><div class='add'>+	 *</div><div class='add'>+	 * Or the qgroup is already removed by a qgroup rescan. For both cases we're</div><div class='add'>+	 * safe to ignore them.</div><div class='add'>+	 */</div><div class='add'>+	if (ret == -EBUSY || ret == -ENOENT)</div><div class='add'>+		ret = 0;</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> int btrfs_limit_qgroup(struct btrfs_trans_handle *trans, u64 qgroupid,</div><div class='ctx'> 		       struct btrfs_qgroup_limit *limit)</div><div class='ctx'> {</div><div class='hunk'>@@ -1658,59 +1940,103 @@ int btrfs_limit_qgroup(struct btrfs_trans_handle *trans, u64 qgroupid,</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;qgroup_lock);</div><div class='ctx'> </div><div class='ctx'> 	ret = update_qgroup_limit_item(trans, qgroup);</div><div class='del'>-	if (ret) {</div><div class='del'>-		fs_info-&gt;qgroup_flags |= BTRFS_QGROUP_STATUS_FLAG_INCONSISTENT;</div><div class='del'>-		btrfs_info(fs_info, "unable to update quota limit for %llu",</div><div class='del'>-		       qgroupid);</div><div class='del'>-	}</div><div class='add'>+	if (ret)</div><div class='add'>+		qgroup_mark_inconsistent(fs_info, "qgroup item update error %d", ret);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;qgroup_ioctl_lock);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Inform qgroup to trace one dirty extent, its info is recorded in @record.</div><div class='add'>+ * So qgroup can account it at transaction committing time.</div><div class='add'>+ *</div><div class='add'>+ * No lock version, caller must acquire delayed ref lock and allocated memory,</div><div class='add'>+ * then call btrfs_qgroup_trace_extent_post() after exiting lock context.</div><div class='add'>+ *</div><div class='add'>+ * Return 0 for success insert</div><div class='add'>+ * Return &gt;0 for existing record, caller can free @record safely.</div><div class='add'>+ * Return &lt;0 for insertion failure, caller can free @record safely.</div><div class='add'>+ */</div><div class='ctx'> int btrfs_qgroup_trace_extent_nolock(struct btrfs_fs_info *fs_info,</div><div class='del'>-				struct btrfs_delayed_ref_root *delayed_refs,</div><div class='del'>-				struct btrfs_qgroup_extent_record *record)</div><div class='add'>+				     struct btrfs_delayed_ref_root *delayed_refs,</div><div class='add'>+				     struct btrfs_qgroup_extent_record *record,</div><div class='add'>+				     u64 bytenr)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node **p = &amp;delayed_refs-&gt;dirty_extent_root.rb_node;</div><div class='del'>-	struct rb_node *parent_node = NULL;</div><div class='del'>-	struct btrfs_qgroup_extent_record *entry;</div><div class='del'>-	u64 bytenr = record-&gt;bytenr;</div><div class='del'>-</div><div class='del'>-	lockdep_assert_held(&amp;delayed_refs-&gt;lock);</div><div class='del'>-	trace_btrfs_qgroup_trace_extent(fs_info, record);</div><div class='del'>-</div><div class='del'>-	while (*p) {</div><div class='del'>-		parent_node = *p;</div><div class='del'>-		entry = rb_entry(parent_node, struct btrfs_qgroup_extent_record,</div><div class='del'>-				 node);</div><div class='del'>-		if (bytenr &lt; entry-&gt;bytenr) {</div><div class='del'>-			p = &amp;(*p)-&gt;rb_left;</div><div class='del'>-		} else if (bytenr &gt; entry-&gt;bytenr) {</div><div class='del'>-			p = &amp;(*p)-&gt;rb_right;</div><div class='del'>-		} else {</div><div class='del'>-			if (record-&gt;data_rsv &amp;&amp; !entry-&gt;data_rsv) {</div><div class='del'>-				entry-&gt;data_rsv = record-&gt;data_rsv;</div><div class='del'>-				entry-&gt;data_rsv_refroot =</div><div class='del'>-					record-&gt;data_rsv_refroot;</div><div class='del'>-			}</div><div class='del'>-			return 1;</div><div class='add'>+	struct btrfs_qgroup_extent_record *existing, *ret;</div><div class='add'>+	const unsigned long index = (bytenr &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+</div><div class='add'>+	if (!btrfs_qgroup_full_accounting(fs_info))</div><div class='add'>+		return 1;</div><div class='add'>+</div><div class='add'>+#if BITS_PER_LONG == 32</div><div class='add'>+	if (bytenr &gt;= MAX_LFS_FILESIZE) {</div><div class='add'>+		btrfs_err_rl(fs_info,</div><div class='add'>+"qgroup record for extent at %llu is beyond 32bit page cache and xarray index limit",</div><div class='add'>+			     bytenr);</div><div class='add'>+		btrfs_err_32bit_limit(fs_info);</div><div class='add'>+		return -EOVERFLOW;</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+	trace_btrfs_qgroup_trace_extent(fs_info, record, bytenr);</div><div class='add'>+</div><div class='add'>+	xa_lock(&amp;delayed_refs-&gt;dirty_extents);</div><div class='add'>+	existing = xa_load(&amp;delayed_refs-&gt;dirty_extents, index);</div><div class='add'>+	if (existing) {</div><div class='add'>+		if (record-&gt;data_rsv &amp;&amp; !existing-&gt;data_rsv) {</div><div class='add'>+			existing-&gt;data_rsv = record-&gt;data_rsv;</div><div class='add'>+			existing-&gt;data_rsv_refroot = record-&gt;data_rsv_refroot;</div><div class='ctx'> 		}</div><div class='add'>+		xa_unlock(&amp;delayed_refs-&gt;dirty_extents);</div><div class='add'>+		return 1;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = __xa_store(&amp;delayed_refs-&gt;dirty_extents, index, record, GFP_ATOMIC);</div><div class='add'>+	xa_unlock(&amp;delayed_refs-&gt;dirty_extents);</div><div class='add'>+	if (xa_is_err(ret)) {</div><div class='add'>+		qgroup_mark_inconsistent(fs_info, "xarray insert error: %d", xa_err(ret));</div><div class='add'>+		return xa_err(ret);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	rb_link_node(&amp;record-&gt;node, parent_node, p);</div><div class='del'>-	rb_insert_color(&amp;record-&gt;node, &amp;delayed_refs-&gt;dirty_extent_root);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Post handler after qgroup_trace_extent_nolock().</div><div class='add'>+ *</div><div class='add'>+ * NOTE: Current qgroup does the expensive backref walk at transaction</div><div class='add'>+ * committing time with TRANS_STATE_COMMIT_DOING, this blocks incoming</div><div class='add'>+ * new transaction.</div><div class='add'>+ * This is designed to allow btrfs_find_all_roots() to get correct new_roots</div><div class='add'>+ * result.</div><div class='add'>+ *</div><div class='add'>+ * However for old_roots there is no need to do backref walk at that time,</div><div class='add'>+ * since we search commit roots to walk backref and result will always be</div><div class='add'>+ * correct.</div><div class='add'>+ *</div><div class='add'>+ * Due to the nature of no lock version, we can't do backref there.</div><div class='add'>+ * So we must call btrfs_qgroup_trace_extent_post() after exiting</div><div class='add'>+ * spinlock context.</div><div class='add'>+ *</div><div class='add'>+ * TODO: If we can fix and prove btrfs_find_all_roots() can get correct result</div><div class='add'>+ * using current root, then we can move all expensive backref walk out of</div><div class='add'>+ * transaction committing, but not now as qgroup accounting will be wrong again.</div><div class='add'>+ */</div><div class='ctx'> int btrfs_qgroup_trace_extent_post(struct btrfs_trans_handle *trans,</div><div class='del'>-				   struct btrfs_qgroup_extent_record *qrecord)</div><div class='add'>+				   struct btrfs_qgroup_extent_record *qrecord,</div><div class='add'>+				   u64 bytenr)</div><div class='ctx'> {</div><div class='del'>-	struct ulist *old_root;</div><div class='del'>-	u64 bytenr = qrecord-&gt;bytenr;</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='add'>+	struct btrfs_backref_walk_ctx ctx = {</div><div class='add'>+		.bytenr = bytenr,</div><div class='add'>+		.fs_info = fs_info,</div><div class='add'>+	};</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='add'>+	if (!btrfs_qgroup_full_accounting(fs_info))</div><div class='add'>+		return 0;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We are always called in a context where we are already holding a</div><div class='ctx'> 	 * transaction handle. Often we are called when adding a data delayed</div><div class='hunk'>@@ -1732,13 +2058,13 @@ int btrfs_qgroup_trace_extent_post(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 */</div><div class='ctx'> 	ASSERT(trans != NULL);</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_find_all_roots(NULL, trans-&gt;fs_info, bytenr, 0, &amp;old_root,</div><div class='del'>-				   true);</div><div class='add'>+	if (fs_info-&gt;qgroup_flags &amp; BTRFS_QGROUP_RUNTIME_FLAG_NO_ACCOUNTING)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_find_all_roots(&amp;ctx, true);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='del'>-		trans-&gt;fs_info-&gt;qgroup_flags |= BTRFS_QGROUP_STATUS_FLAG_INCONSISTENT;</div><div class='del'>-		btrfs_warn(trans-&gt;fs_info,</div><div class='del'>-"error accounting new delayed refs extent (err code: %d), quota inconsistent",</div><div class='del'>-			ret);</div><div class='add'>+		qgroup_mark_inconsistent(fs_info,</div><div class='add'>+				"error accounting new delayed refs extent: %d", ret);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1749,40 +2075,61 @@ int btrfs_qgroup_trace_extent_post(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * So modifying qrecord-&gt;old_roots is safe here</div><div class='ctx'> 	 */</div><div class='del'>-	qrecord-&gt;old_roots = old_root;</div><div class='add'>+	qrecord-&gt;old_roots = ctx.roots;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Inform qgroup to trace one dirty extent, specified by @bytenr and</div><div class='add'>+ * @num_bytes.</div><div class='add'>+ * So qgroup can account it at commit trans time.</div><div class='add'>+ *</div><div class='add'>+ * Better encapsulated version, with memory allocation and backref walk for</div><div class='add'>+ * commit roots.</div><div class='add'>+ * So this can sleep.</div><div class='add'>+ *</div><div class='add'>+ * Return 0 if the operation is done.</div><div class='add'>+ * Return &lt;0 for error, like memory allocation failure or invalid parameter</div><div class='add'>+ * (NULL trans)</div><div class='add'>+ */</div><div class='ctx'> int btrfs_qgroup_trace_extent(struct btrfs_trans_handle *trans, u64 bytenr,</div><div class='del'>-			      u64 num_bytes, gfp_t gfp_flag)</div><div class='add'>+			      u64 num_bytes)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_qgroup_extent_record *record;</div><div class='del'>-	struct btrfs_delayed_ref_root *delayed_refs;</div><div class='add'>+	struct btrfs_delayed_ref_root *delayed_refs = &amp;trans-&gt;transaction-&gt;delayed_refs;</div><div class='add'>+	const unsigned long index = (bytenr &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (!test_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags)</div><div class='del'>-	    || bytenr == 0 || num_bytes == 0)</div><div class='add'>+	if (!btrfs_qgroup_full_accounting(fs_info) || bytenr == 0 || num_bytes == 0)</div><div class='ctx'> 		return 0;</div><div class='del'>-	record = kzalloc(sizeof(*record), gfp_flag);</div><div class='add'>+	record = kzalloc(sizeof(*record), GFP_NOFS);</div><div class='ctx'> 	if (!record)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	delayed_refs = &amp;trans-&gt;transaction-&gt;delayed_refs;</div><div class='del'>-	record-&gt;bytenr = bytenr;</div><div class='add'>+	if (xa_reserve(&amp;delayed_refs-&gt;dirty_extents, index, GFP_NOFS)) {</div><div class='add'>+		kfree(record);</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	record-&gt;num_bytes = num_bytes;</div><div class='del'>-	record-&gt;old_roots = NULL;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;delayed_refs-&gt;lock);</div><div class='del'>-	ret = btrfs_qgroup_trace_extent_nolock(fs_info, delayed_refs, record);</div><div class='del'>-	spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='del'>-	if (ret &gt; 0) {</div><div class='add'>+	ret = btrfs_qgroup_trace_extent_nolock(fs_info, delayed_refs, record, bytenr);</div><div class='add'>+	if (ret) {</div><div class='add'>+		/* Clean up if insertion fails or item exists. */</div><div class='add'>+		xa_release(&amp;delayed_refs-&gt;dirty_extents, index);</div><div class='ctx'> 		kfree(record);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='del'>-	return btrfs_qgroup_trace_extent_post(trans, record);</div><div class='add'>+	return btrfs_qgroup_trace_extent_post(trans, record, bytenr);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Inform qgroup to trace all leaf items of data</div><div class='add'>+ *</div><div class='add'>+ * Return 0 for success</div><div class='add'>+ * Return &lt;0 for error(ENOMEM)</div><div class='add'>+ */</div><div class='ctx'> int btrfs_qgroup_trace_leaf_items(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				  struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='hunk'>@@ -1794,7 +2141,7 @@ int btrfs_qgroup_trace_leaf_items(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	u64 bytenr, num_bytes;</div><div class='ctx'> </div><div class='ctx'> 	/* We can be called directly from walk_up_proc() */</div><div class='del'>-	if (!test_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags))</div><div class='add'>+	if (!btrfs_qgroup_full_accounting(fs_info))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; nr; i++) {</div><div class='hunk'>@@ -1816,8 +2163,7 @@ int btrfs_qgroup_trace_leaf_items(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 		num_bytes = btrfs_file_extent_disk_num_bytes(eb, fi);</div><div class='ctx'> </div><div class='del'>-		ret = btrfs_qgroup_trace_extent(trans, bytenr, num_bytes,</div><div class='del'>-						GFP_NOFS);</div><div class='add'>+		ret = btrfs_qgroup_trace_extent(trans, bytenr, num_bytes);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1939,7 +2285,7 @@ static int qgroup_trace_extent_swap(struct btrfs_trans_handle* trans,</div><div class='ctx'> 				    bool trace_leaf)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_key key;</div><div class='del'>-	struct btrfs_path *src_path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(src_path);</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	u32 nodesize = fs_info-&gt;nodesize;</div><div class='ctx'> 	int cur_level = root_level;</div><div class='hunk'>@@ -1951,10 +2297,8 @@ static int qgroup_trace_extent_swap(struct btrfs_trans_handle* trans,</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	src_path = btrfs_alloc_path();</div><div class='del'>-	if (!src_path) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (!src_path)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	if (dst_level)</div><div class='ctx'> 		btrfs_node_key_to_cpu(dst_path-&gt;nodes[dst_level], &amp;key, 0);</div><div class='hunk'>@@ -1962,7 +2306,7 @@ static int qgroup_trace_extent_swap(struct btrfs_trans_handle* trans,</div><div class='ctx'> 		btrfs_item_key_to_cpu(dst_path-&gt;nodes[dst_level], &amp;key, 0);</div><div class='ctx'> </div><div class='ctx'> 	/* For src_path */</div><div class='del'>-	atomic_inc(&amp;src_eb-&gt;refs);</div><div class='add'>+	refcount_inc(&amp;src_eb-&gt;refs);</div><div class='ctx'> 	src_path-&gt;nodes[root_level] = src_eb;</div><div class='ctx'> 	src_path-&gt;slots[root_level] = dst_path-&gt;slots[root_level];</div><div class='ctx'> 	src_path-&gt;locks[root_level] = 0;</div><div class='hunk'>@@ -1980,10 +2324,8 @@ static int qgroup_trace_extent_swap(struct btrfs_trans_handle* trans,</div><div class='ctx'> 			parent_slot = src_path-&gt;slots[cur_level + 1];</div><div class='ctx'> </div><div class='ctx'> 			eb = btrfs_read_node_slot(eb, parent_slot);</div><div class='del'>-			if (IS_ERR(eb)) {</div><div class='del'>-				ret = PTR_ERR(eb);</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='add'>+			if (IS_ERR(eb))</div><div class='add'>+				return PTR_ERR(eb);</div><div class='ctx'> </div><div class='ctx'> 			src_path-&gt;nodes[cur_level] = eb;</div><div class='ctx'> </div><div class='hunk'>@@ -2004,10 +2346,8 @@ static int qgroup_trace_extent_swap(struct btrfs_trans_handle* trans,</div><div class='ctx'> 					&amp;src_key, src_path-&gt;slots[cur_level]);</div><div class='ctx'> 		}</div><div class='ctx'> 		/* Content mismatch, something went wrong */</div><div class='del'>-		if (btrfs_comp_cpu_keys(&amp;dst_key, &amp;src_key)) {</div><div class='del'>-			ret = -ENOENT;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+		if (btrfs_comp_cpu_keys(&amp;dst_key, &amp;src_key))</div><div class='add'>+			return -ENOENT;</div><div class='ctx'> 		cur_level--;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -2016,24 +2356,22 @@ static int qgroup_trace_extent_swap(struct btrfs_trans_handle* trans,</div><div class='ctx'> 	 * blocks for qgroup accounting.</div><div class='ctx'> 	 */</div><div class='ctx'> 	ret = btrfs_qgroup_trace_extent(trans, src_path-&gt;nodes[dst_level]-&gt;start,</div><div class='del'>-			nodesize, GFP_NOFS);</div><div class='add'>+					nodesize);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-	ret = btrfs_qgroup_trace_extent(trans,</div><div class='del'>-			dst_path-&gt;nodes[dst_level]-&gt;start,</div><div class='del'>-			nodesize, GFP_NOFS);</div><div class='add'>+		return ret;</div><div class='add'>+	ret = btrfs_qgroup_trace_extent(trans, dst_path-&gt;nodes[dst_level]-&gt;start,</div><div class='add'>+					nodesize);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	/* Record leaf file extents */</div><div class='ctx'> 	if (dst_level == 0 &amp;&amp; trace_leaf) {</div><div class='ctx'> 		ret = btrfs_qgroup_trace_leaf_items(trans, src_path-&gt;nodes[0]);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 		ret = btrfs_qgroup_trace_leaf_items(trans, dst_path-&gt;nodes[0]);</div><div class='ctx'> 	}</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(src_path);</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2072,9 +2410,9 @@ static int qgroup_trace_new_subtree_blocks(struct btrfs_trans_handle* trans,</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='ctx'> 	/* Level sanity check */</div><div class='del'>-	if (cur_level &lt; 0 || cur_level &gt;= BTRFS_MAX_LEVEL - 1 ||</div><div class='del'>-	    root_level &lt; 0 || root_level &gt;= BTRFS_MAX_LEVEL - 1 ||</div><div class='del'>-	    root_level &lt; cur_level) {</div><div class='add'>+	if (unlikely(cur_level &lt; 0 || cur_level &gt;= BTRFS_MAX_LEVEL - 1 ||</div><div class='add'>+		     root_level &lt; 0 || root_level &gt;= BTRFS_MAX_LEVEL - 1 ||</div><div class='add'>+		     root_level &lt; cur_level)) {</div><div class='ctx'> 		btrfs_err_rl(fs_info,</div><div class='ctx'> 			"%s: bad levels, cur_level=%d root_level=%d",</div><div class='ctx'> 			__func__, cur_level, root_level);</div><div class='hunk'>@@ -2090,7 +2428,7 @@ static int qgroup_trace_new_subtree_blocks(struct btrfs_trans_handle* trans,</div><div class='ctx'> 		 * dst_path-&gt;nodes[root_level] must be initialized before</div><div class='ctx'> 		 * calling this function.</div><div class='ctx'> 		 */</div><div class='del'>-		if (cur_level == root_level) {</div><div class='add'>+		if (unlikely(cur_level == root_level)) {</div><div class='ctx'> 			btrfs_err_rl(fs_info,</div><div class='ctx'> 	"%s: dst_path-&gt;nodes[%d] not initialized, root_level=%d cur_level=%d",</div><div class='ctx'> 				__func__, root_level, root_level, cur_level);</div><div class='hunk'>@@ -2172,11 +2510,11 @@ static int qgroup_trace_subtree_swap(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	int level;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (!test_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags))</div><div class='add'>+	if (!btrfs_qgroup_full_accounting(fs_info))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/* Wrong parameter order */</div><div class='del'>-	if (btrfs_header_generation(src_eb) &gt; btrfs_header_generation(dst_eb)) {</div><div class='add'>+	if (unlikely(btrfs_header_generation(src_eb) &gt; btrfs_header_generation(dst_eb))) {</div><div class='ctx'> 		btrfs_err_rl(fs_info,</div><div class='ctx'> 		"%s: bad parameter order, src_gen=%llu dst_gen=%llu", __func__,</div><div class='ctx'> 			     btrfs_header_generation(src_eb),</div><div class='hunk'>@@ -2184,7 +2522,7 @@ static int qgroup_trace_subtree_swap(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!extent_buffer_uptodate(src_eb) || !extent_buffer_uptodate(dst_eb)) {</div><div class='add'>+	if (unlikely(!extent_buffer_uptodate(src_eb) || !extent_buffer_uptodate(dst_eb))) {</div><div class='ctx'> 		ret = -EIO;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2196,7 +2534,7 @@ static int qgroup_trace_subtree_swap(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	/* For dst_path */</div><div class='del'>-	atomic_inc(&amp;dst_eb-&gt;refs);</div><div class='add'>+	refcount_inc(&amp;dst_eb-&gt;refs);</div><div class='ctx'> 	dst_path-&gt;nodes[level] = dst_eb;</div><div class='ctx'> 	dst_path-&gt;slots[level] = 0;</div><div class='ctx'> 	dst_path-&gt;locks[level] = 0;</div><div class='hunk'>@@ -2211,10 +2549,20 @@ static int qgroup_trace_subtree_swap(struct btrfs_trans_handle *trans,</div><div class='ctx'> out:</div><div class='ctx'> 	btrfs_free_path(dst_path);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		fs_info-&gt;qgroup_flags |= BTRFS_QGROUP_STATUS_FLAG_INCONSISTENT;</div><div class='add'>+		qgroup_mark_inconsistent(fs_info, "%s error: %d", __func__, ret);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Inform qgroup to trace a whole subtree, including all its child tree</div><div class='add'>+ * blocks and data.</div><div class='add'>+ * The root tree block is specified by @root_eb.</div><div class='add'>+ *</div><div class='add'>+ * Normally used by relocation(tree block swap) and subvolume deletion.</div><div class='add'>+ *</div><div class='add'>+ * Return 0 for success</div><div class='add'>+ * Return &lt;0 for error(ENOMEM or tree search error)</div><div class='add'>+ */</div><div class='ctx'> int btrfs_qgroup_trace_subtree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			       struct extent_buffer *root_eb,</div><div class='ctx'> 			       u64 root_gen, int root_level)</div><div class='hunk'>@@ -2222,24 +2570,47 @@ int btrfs_qgroup_trace_subtree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int level;</div><div class='add'>+	u8 drop_subptree_thres;</div><div class='ctx'> 	struct extent_buffer *eb = root_eb;</div><div class='del'>-	struct btrfs_path *path = NULL;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> </div><div class='del'>-	BUG_ON(root_level &lt; 0 || root_level &gt;= BTRFS_MAX_LEVEL);</div><div class='del'>-	BUG_ON(root_eb == NULL);</div><div class='add'>+	ASSERT(0 &lt;= root_level &amp;&amp; root_level &lt; BTRFS_MAX_LEVEL);</div><div class='add'>+	ASSERT(root_eb != NULL);</div><div class='ctx'> </div><div class='del'>-	if (!test_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags))</div><div class='add'>+	if (!btrfs_qgroup_full_accounting(fs_info))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='add'>+	spin_lock(&amp;fs_info-&gt;qgroup_lock);</div><div class='add'>+	drop_subptree_thres = fs_info-&gt;qgroup_drop_subtree_thres;</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;qgroup_lock);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This function only gets called for snapshot drop, if we hit a high</div><div class='add'>+	 * node here, it means we are going to change ownership for quite a lot</div><div class='add'>+	 * of extents, which will greatly slow down btrfs_commit_transaction().</div><div class='add'>+	 *</div><div class='add'>+	 * So here if we find a high tree here, we just skip the accounting and</div><div class='add'>+	 * mark qgroup inconsistent.</div><div class='add'>+	 */</div><div class='add'>+	if (root_level &gt;= drop_subptree_thres) {</div><div class='add'>+		qgroup_mark_inconsistent(fs_info, "subtree level reached threshold");</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (!extent_buffer_uptodate(root_eb)) {</div><div class='del'>-		ret = btrfs_read_buffer(root_eb, root_gen, root_level, NULL);</div><div class='add'>+		struct btrfs_tree_parent_check check = {</div><div class='add'>+			.transid = root_gen,</div><div class='add'>+			.level = root_level</div><div class='add'>+		};</div><div class='add'>+</div><div class='add'>+		ret = btrfs_read_extent_buffer(root_eb, &amp;check);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (root_level == 0) {</div><div class='ctx'> 		ret = btrfs_qgroup_trace_leaf_items(trans, root_eb);</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='hunk'>@@ -2255,7 +2626,7 @@ int btrfs_qgroup_trace_subtree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * walk back up the tree (adjusting slot pointers as we go)</div><div class='ctx'> 	 * and restart the search process.</div><div class='ctx'> 	 */</div><div class='del'>-	atomic_inc(&amp;root_eb-&gt;refs);	/* For path */</div><div class='add'>+	refcount_inc(&amp;root_eb-&gt;refs);	/* For path */</div><div class='ctx'> 	path-&gt;nodes[root_level] = root_eb;</div><div class='ctx'> 	path-&gt;slots[root_level] = 0;</div><div class='ctx'> 	path-&gt;locks[root_level] = 0; /* so release_path doesn't try to unlock */</div><div class='hunk'>@@ -2275,10 +2646,8 @@ walk_down:</div><div class='ctx'> 			child_bytenr = btrfs_node_blockptr(eb, parent_slot);</div><div class='ctx'> </div><div class='ctx'> 			eb = btrfs_read_node_slot(eb, parent_slot);</div><div class='del'>-			if (IS_ERR(eb)) {</div><div class='del'>-				ret = PTR_ERR(eb);</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='add'>+			if (IS_ERR(eb))</div><div class='add'>+				return PTR_ERR(eb);</div><div class='ctx'> </div><div class='ctx'> 			path-&gt;nodes[level] = eb;</div><div class='ctx'> 			path-&gt;slots[level] = 0;</div><div class='hunk'>@@ -2287,17 +2656,16 @@ walk_down:</div><div class='ctx'> 			path-&gt;locks[level] = BTRFS_READ_LOCK;</div><div class='ctx'> </div><div class='ctx'> 			ret = btrfs_qgroup_trace_extent(trans, child_bytenr,</div><div class='del'>-							fs_info-&gt;nodesize,</div><div class='del'>-							GFP_NOFS);</div><div class='add'>+							fs_info-&gt;nodesize);</div><div class='ctx'> 			if (ret)</div><div class='del'>-				goto out;</div><div class='add'>+				return ret;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (level == 0) {</div><div class='ctx'> 			ret = btrfs_qgroup_trace_leaf_items(trans,</div><div class='ctx'> 							    path-&gt;nodes[level]);</div><div class='ctx'> 			if (ret)</div><div class='del'>-				goto out;</div><div class='add'>+				return ret;</div><div class='ctx'> </div><div class='ctx'> 			/* Nonzero return here means we completed our search */</div><div class='ctx'> 			ret = adjust_slots_upwards(path, root_level);</div><div class='hunk'>@@ -2311,11 +2679,25 @@ walk_down:</div><div class='ctx'> 		level--;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = 0;</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	return ret;</div><div class='add'>+static void qgroup_iterator_nested_add(struct list_head *head, struct btrfs_qgroup *qgroup)</div><div class='add'>+{</div><div class='add'>+	if (!list_empty(&amp;qgroup-&gt;nested_iterator))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	list_add_tail(&amp;qgroup-&gt;nested_iterator, head);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void qgroup_iterator_nested_clean(struct list_head *head)</div><div class='add'>+{</div><div class='add'>+	while (!list_empty(head)) {</div><div class='add'>+		struct btrfs_qgroup *qgroup;</div><div class='add'>+</div><div class='add'>+		qgroup = list_first_entry(head, struct btrfs_qgroup, nested_iterator);</div><div class='add'>+		list_del_init(&amp;qgroup-&gt;nested_iterator);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #define UPDATE_NEW	0</div><div class='hunk'>@@ -2323,57 +2705,41 @@ out:</div><div class='ctx'> /*</div><div class='ctx'>  * Walk all of the roots that points to the bytenr and adjust their refcnts.</div><div class='ctx'>  */</div><div class='del'>-static int qgroup_update_refcnt(struct btrfs_fs_info *fs_info,</div><div class='del'>-				struct ulist *roots, struct ulist *tmp,</div><div class='del'>-				struct ulist *qgroups, u64 seq, int update_old)</div><div class='add'>+static void qgroup_update_refcnt(struct btrfs_fs_info *fs_info,</div><div class='add'>+				 struct ulist *roots, struct list_head *qgroups,</div><div class='add'>+				 u64 seq, bool update_old)</div><div class='ctx'> {</div><div class='ctx'> 	struct ulist_node *unode;</div><div class='ctx'> 	struct ulist_iterator uiter;</div><div class='del'>-	struct ulist_node *tmp_unode;</div><div class='del'>-	struct ulist_iterator tmp_uiter;</div><div class='ctx'> 	struct btrfs_qgroup *qg;</div><div class='del'>-	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (!roots)</div><div class='del'>-		return 0;</div><div class='add'>+		return;</div><div class='ctx'> 	ULIST_ITER_INIT(&amp;uiter);</div><div class='ctx'> 	while ((unode = ulist_next(roots, &amp;uiter))) {</div><div class='add'>+		LIST_HEAD(tmp);</div><div class='add'>+</div><div class='ctx'> 		qg = find_qgroup_rb(fs_info, unode-&gt;val);</div><div class='ctx'> 		if (!qg)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		ulist_reinit(tmp);</div><div class='del'>-		ret = ulist_add(qgroups, qg-&gt;qgroupid, qgroup_to_aux(qg),</div><div class='del'>-				GFP_ATOMIC);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			return ret;</div><div class='del'>-		ret = ulist_add(tmp, qg-&gt;qgroupid, qgroup_to_aux(qg), GFP_ATOMIC);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			return ret;</div><div class='del'>-		ULIST_ITER_INIT(&amp;tmp_uiter);</div><div class='del'>-		while ((tmp_unode = ulist_next(tmp, &amp;tmp_uiter))) {</div><div class='add'>+		qgroup_iterator_nested_add(qgroups, qg);</div><div class='add'>+		qgroup_iterator_add(&amp;tmp, qg);</div><div class='add'>+		list_for_each_entry(qg, &amp;tmp, iterator) {</div><div class='ctx'> 			struct btrfs_qgroup_list *glist;</div><div class='ctx'> </div><div class='del'>-			qg = unode_aux_to_qgroup(tmp_unode);</div><div class='ctx'> 			if (update_old)</div><div class='ctx'> 				btrfs_qgroup_update_old_refcnt(qg, seq, 1);</div><div class='ctx'> 			else</div><div class='ctx'> 				btrfs_qgroup_update_new_refcnt(qg, seq, 1);</div><div class='add'>+</div><div class='ctx'> 			list_for_each_entry(glist, &amp;qg-&gt;groups, next_group) {</div><div class='del'>-				ret = ulist_add(qgroups, glist-&gt;group-&gt;qgroupid,</div><div class='del'>-						qgroup_to_aux(glist-&gt;group),</div><div class='del'>-						GFP_ATOMIC);</div><div class='del'>-				if (ret &lt; 0)</div><div class='del'>-					return ret;</div><div class='del'>-				ret = ulist_add(tmp, glist-&gt;group-&gt;qgroupid,</div><div class='del'>-						qgroup_to_aux(glist-&gt;group),</div><div class='del'>-						GFP_ATOMIC);</div><div class='del'>-				if (ret &lt; 0)</div><div class='del'>-					return ret;</div><div class='add'>+				qgroup_iterator_nested_add(qgroups, glist-&gt;group);</div><div class='add'>+				qgroup_iterator_add(&amp;tmp, glist-&gt;group);</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='add'>+		qgroup_iterator_clean(&amp;tmp);</div><div class='ctx'> 	}</div><div class='del'>-	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2412,27 +2778,21 @@ static int qgroup_update_refcnt(struct btrfs_fs_info *fs_info,</div><div class='ctx'>  * But this time we don't need to consider other things, the codes and logic</div><div class='ctx'>  * is easy to understand now.</div><div class='ctx'>  */</div><div class='del'>-static int qgroup_update_counters(struct btrfs_fs_info *fs_info,</div><div class='del'>-				  struct ulist *qgroups,</div><div class='del'>-				  u64 nr_old_roots,</div><div class='del'>-				  u64 nr_new_roots,</div><div class='del'>-				  u64 num_bytes, u64 seq)</div><div class='add'>+static void qgroup_update_counters(struct btrfs_fs_info *fs_info,</div><div class='add'>+				   struct list_head *qgroups, u64 nr_old_roots,</div><div class='add'>+				   u64 nr_new_roots, u64 num_bytes, u64 seq)</div><div class='ctx'> {</div><div class='del'>-	struct ulist_node *unode;</div><div class='del'>-	struct ulist_iterator uiter;</div><div class='ctx'> 	struct btrfs_qgroup *qg;</div><div class='del'>-	u64 cur_new_count, cur_old_count;</div><div class='ctx'> </div><div class='del'>-	ULIST_ITER_INIT(&amp;uiter);</div><div class='del'>-	while ((unode = ulist_next(qgroups, &amp;uiter))) {</div><div class='add'>+	list_for_each_entry(qg, qgroups, nested_iterator) {</div><div class='add'>+		u64 cur_new_count, cur_old_count;</div><div class='ctx'> 		bool dirty = false;</div><div class='ctx'> </div><div class='del'>-		qg = unode_aux_to_qgroup(unode);</div><div class='ctx'> 		cur_old_count = btrfs_qgroup_get_old_refcnt(qg, seq);</div><div class='ctx'> 		cur_new_count = btrfs_qgroup_get_new_refcnt(qg, seq);</div><div class='ctx'> </div><div class='del'>-		trace_qgroup_update_counters(fs_info, qg, cur_old_count,</div><div class='del'>-					     cur_new_count);</div><div class='add'>+		trace_btrfs_qgroup_update_counters(fs_info, qg, cur_old_count,</div><div class='add'>+						   cur_new_count);</div><div class='ctx'> </div><div class='ctx'> 		/* Rfer update part */</div><div class='ctx'> 		if (cur_old_count == 0 &amp;&amp; cur_new_count &gt; 0) {</div><div class='hunk'>@@ -2498,7 +2858,6 @@ static int qgroup_update_counters(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		if (dirty)</div><div class='ctx'> 			qgroup_dirty(fs_info, qg);</div><div class='ctx'> 	}</div><div class='del'>-	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2527,7 +2886,7 @@ static int maybe_fs_roots(struct ulist *roots)</div><div class='ctx'> 	 * trees.</div><div class='ctx'> 	 * If it contains a non-fs tree, it won't be shared with fs/subvol trees.</div><div class='ctx'> 	 */</div><div class='del'>-	return is_fstree(unode-&gt;val);</div><div class='add'>+	return btrfs_is_fstree(unode-&gt;val);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_qgroup_account_extent(struct btrfs_trans_handle *trans, u64 bytenr,</div><div class='hunk'>@@ -2535,8 +2894,7 @@ int btrfs_qgroup_account_extent(struct btrfs_trans_handle *trans, u64 bytenr,</div><div class='ctx'> 				struct ulist *new_roots)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='del'>-	struct ulist *qgroups = NULL;</div><div class='del'>-	struct ulist *tmp = NULL;</div><div class='add'>+	LIST_HEAD(qgroups);</div><div class='ctx'> 	u64 seq;</div><div class='ctx'> 	u64 nr_new_roots = 0;</div><div class='ctx'> 	u64 nr_old_roots = 0;</div><div class='hunk'>@@ -2546,7 +2904,8 @@ int btrfs_qgroup_account_extent(struct btrfs_trans_handle *trans, u64 bytenr,</div><div class='ctx'> 	 * If quotas get disabled meanwhile, the resources need to be freed and</div><div class='ctx'> 	 * we can't just exit here.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!test_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags))</div><div class='add'>+	if (!btrfs_qgroup_full_accounting(fs_info) ||</div><div class='add'>+	    fs_info-&gt;qgroup_flags &amp; BTRFS_QGROUP_RUNTIME_FLAG_NO_ACCOUNTING)</div><div class='ctx'> 		goto out_free;</div><div class='ctx'> </div><div class='ctx'> 	if (new_roots) {</div><div class='hunk'>@@ -2564,22 +2923,9 @@ int btrfs_qgroup_account_extent(struct btrfs_trans_handle *trans, u64 bytenr,</div><div class='ctx'> 	if (nr_old_roots == 0 &amp;&amp; nr_new_roots == 0)</div><div class='ctx'> 		goto out_free;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(!fs_info-&gt;quota_root);</div><div class='del'>-</div><div class='ctx'> 	trace_btrfs_qgroup_account_extent(fs_info, trans-&gt;transid, bytenr,</div><div class='ctx'> 					num_bytes, nr_old_roots, nr_new_roots);</div><div class='ctx'> </div><div class='del'>-	qgroups = ulist_alloc(GFP_NOFS);</div><div class='del'>-	if (!qgroups) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out_free;</div><div class='del'>-	}</div><div class='del'>-	tmp = ulist_alloc(GFP_NOFS);</div><div class='del'>-	if (!tmp) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out_free;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	mutex_lock(&amp;fs_info-&gt;qgroup_rescan_lock);</div><div class='ctx'> 	if (fs_info-&gt;qgroup_flags &amp; BTRFS_QGROUP_STATUS_FLAG_RESCAN) {</div><div class='ctx'> 		if (fs_info-&gt;qgroup_rescan_progress.objectid &lt;= bytenr) {</div><div class='hunk'>@@ -2594,29 +2940,27 @@ int btrfs_qgroup_account_extent(struct btrfs_trans_handle *trans, u64 bytenr,</div><div class='ctx'> 	seq = fs_info-&gt;qgroup_seq;</div><div class='ctx'> </div><div class='ctx'> 	/* Update old refcnts using old_roots */</div><div class='del'>-	ret = qgroup_update_refcnt(fs_info, old_roots, tmp, qgroups, seq,</div><div class='del'>-				   UPDATE_OLD);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+	qgroup_update_refcnt(fs_info, old_roots, &amp;qgroups, seq, UPDATE_OLD);</div><div class='ctx'> </div><div class='ctx'> 	/* Update new refcnts using new_roots */</div><div class='del'>-	ret = qgroup_update_refcnt(fs_info, new_roots, tmp, qgroups, seq,</div><div class='del'>-				   UPDATE_NEW);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+	qgroup_update_refcnt(fs_info, new_roots, &amp;qgroups, seq, UPDATE_NEW);</div><div class='ctx'> </div><div class='del'>-	qgroup_update_counters(fs_info, qgroups, nr_old_roots, nr_new_roots,</div><div class='add'>+	qgroup_update_counters(fs_info, &amp;qgroups, nr_old_roots, nr_new_roots,</div><div class='ctx'> 			       num_bytes, seq);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='add'>+	 * We're done using the iterator, release all its qgroups while holding</div><div class='add'>+	 * fs_info-&gt;qgroup_lock so that we don't race with btrfs_remove_qgroup()</div><div class='add'>+	 * and trigger use-after-free accesses to qgroups.</div><div class='add'>+	 */</div><div class='add'>+	qgroup_iterator_nested_clean(&amp;qgroups);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='ctx'> 	 * Bump qgroup_seq to avoid seq overlap</div><div class='ctx'> 	 */</div><div class='ctx'> 	fs_info-&gt;qgroup_seq += max(nr_old_roots, nr_new_roots) + 1;</div><div class='del'>-out:</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;qgroup_lock);</div><div class='ctx'> out_free:</div><div class='del'>-	ulist_free(tmp);</div><div class='del'>-	ulist_free(qgroups);</div><div class='ctx'> 	ulist_free(old_roots);</div><div class='ctx'> 	ulist_free(new_roots);</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -2628,81 +2972,109 @@ int btrfs_qgroup_account_extents(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	struct btrfs_qgroup_extent_record *record;</div><div class='ctx'> 	struct btrfs_delayed_ref_root *delayed_refs;</div><div class='ctx'> 	struct ulist *new_roots = NULL;</div><div class='del'>-	struct rb_node *node;</div><div class='add'>+	unsigned long index;</div><div class='ctx'> 	u64 num_dirty_extents = 0;</div><div class='ctx'> 	u64 qgroup_to_skip;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='add'>+	if (btrfs_qgroup_mode(fs_info) == BTRFS_QGROUP_MODE_SIMPLE)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='ctx'> 	delayed_refs = &amp;trans-&gt;transaction-&gt;delayed_refs;</div><div class='ctx'> 	qgroup_to_skip = delayed_refs-&gt;qgroup_to_skip;</div><div class='del'>-	while ((node = rb_first(&amp;delayed_refs-&gt;dirty_extent_root))) {</div><div class='del'>-		record = rb_entry(node, struct btrfs_qgroup_extent_record,</div><div class='del'>-				  node);</div><div class='add'>+	xa_for_each(&amp;delayed_refs-&gt;dirty_extents, index, record) {</div><div class='add'>+		const u64 bytenr = (((u64)index) &lt;&lt; fs_info-&gt;sectorsize_bits);</div><div class='ctx'> </div><div class='ctx'> 		num_dirty_extents++;</div><div class='del'>-		trace_btrfs_qgroup_account_extents(fs_info, record);</div><div class='add'>+		trace_btrfs_qgroup_account_extents(fs_info, record, bytenr);</div><div class='add'>+</div><div class='add'>+		if (!ret &amp;&amp; !(fs_info-&gt;qgroup_flags &amp;</div><div class='add'>+			      BTRFS_QGROUP_RUNTIME_FLAG_NO_ACCOUNTING)) {</div><div class='add'>+			struct btrfs_backref_walk_ctx ctx = { 0 };</div><div class='add'>+</div><div class='add'>+			ctx.bytenr = bytenr;</div><div class='add'>+			ctx.fs_info = fs_info;</div><div class='ctx'> </div><div class='del'>-		if (!ret) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Old roots should be searched when inserting qgroup</div><div class='del'>-			 * extent record</div><div class='add'>+			 * extent record.</div><div class='add'>+			 *</div><div class='add'>+			 * But for INCONSISTENT (NO_ACCOUNTING) -&gt; rescan case,</div><div class='add'>+			 * we may have some record inserted during</div><div class='add'>+			 * NO_ACCOUNTING (thus no old_roots populated), but</div><div class='add'>+			 * later we start rescan, which clears NO_ACCOUNTING,</div><div class='add'>+			 * leaving some inserted records without old_roots</div><div class='add'>+			 * populated.</div><div class='add'>+			 *</div><div class='add'>+			 * Those cases are rare and should not cause too much</div><div class='add'>+			 * time spent during commit_transaction().</div><div class='ctx'> 			 */</div><div class='del'>-			if (WARN_ON(!record-&gt;old_roots)) {</div><div class='add'>+			if (!record-&gt;old_roots) {</div><div class='ctx'> 				/* Search commit root to find old_roots */</div><div class='del'>-				ret = btrfs_find_all_roots(NULL, fs_info,</div><div class='del'>-						record-&gt;bytenr, 0,</div><div class='del'>-						&amp;record-&gt;old_roots, false);</div><div class='add'>+				ret = btrfs_find_all_roots(&amp;ctx, false);</div><div class='ctx'> 				if (ret &lt; 0)</div><div class='ctx'> 					goto cleanup;</div><div class='add'>+				record-&gt;old_roots = ctx.roots;</div><div class='add'>+				ctx.roots = NULL;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			/* Free the reserved data space */</div><div class='del'>-			btrfs_qgroup_free_refroot(fs_info,</div><div class='del'>-					record-&gt;data_rsv_refroot,</div><div class='del'>-					record-&gt;data_rsv,</div><div class='del'>-					BTRFS_QGROUP_RSV_DATA);</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Use BTRFS_SEQ_LAST as time_seq to do special search,</div><div class='ctx'> 			 * which doesn't lock tree or delayed_refs and search</div><div class='ctx'> 			 * current root. It's safe inside commit_transaction().</div><div class='ctx'> 			 */</div><div class='del'>-			ret = btrfs_find_all_roots(trans, fs_info,</div><div class='del'>-			   record-&gt;bytenr, BTRFS_SEQ_LAST, &amp;new_roots, false);</div><div class='add'>+			ctx.trans = trans;</div><div class='add'>+			ctx.time_seq = BTRFS_SEQ_LAST;</div><div class='add'>+			ret = btrfs_find_all_roots(&amp;ctx, false);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='ctx'> 				goto cleanup;</div><div class='add'>+			new_roots = ctx.roots;</div><div class='ctx'> 			if (qgroup_to_skip) {</div><div class='ctx'> 				ulist_del(new_roots, qgroup_to_skip, 0);</div><div class='ctx'> 				ulist_del(record-&gt;old_roots, qgroup_to_skip,</div><div class='ctx'> 					  0);</div><div class='ctx'> 			}</div><div class='del'>-			ret = btrfs_qgroup_account_extent(trans, record-&gt;bytenr,</div><div class='add'>+			ret = btrfs_qgroup_account_extent(trans, bytenr,</div><div class='ctx'> 							  record-&gt;num_bytes,</div><div class='ctx'> 							  record-&gt;old_roots,</div><div class='ctx'> 							  new_roots);</div><div class='ctx'> 			record-&gt;old_roots = NULL;</div><div class='ctx'> 			new_roots = NULL;</div><div class='ctx'> 		}</div><div class='add'>+		/* Free the reserved data space */</div><div class='add'>+		btrfs_qgroup_free_refroot(fs_info,</div><div class='add'>+				record-&gt;data_rsv_refroot,</div><div class='add'>+				record-&gt;data_rsv,</div><div class='add'>+				BTRFS_QGROUP_RSV_DATA);</div><div class='ctx'> cleanup:</div><div class='ctx'> 		ulist_free(record-&gt;old_roots);</div><div class='ctx'> 		ulist_free(new_roots);</div><div class='ctx'> 		new_roots = NULL;</div><div class='del'>-		rb_erase(node, &amp;delayed_refs-&gt;dirty_extent_root);</div><div class='add'>+		xa_erase(&amp;delayed_refs-&gt;dirty_extents, index);</div><div class='ctx'> 		kfree(record);</div><div class='ctx'> </div><div class='ctx'> 	}</div><div class='del'>-	trace_qgroup_num_dirty_extents(fs_info, trans-&gt;transid,</div><div class='del'>-				       num_dirty_extents);</div><div class='add'>+	trace_btrfs_qgroup_num_dirty_extents(fs_info, trans-&gt;transid, num_dirty_extents);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * called from commit_transaction. Writes all changed qgroups to disk.</div><div class='add'>+ * Writes all changed qgroups to disk.</div><div class='add'>+ * Called by the transaction commit path and the qgroup assign ioctl.</div><div class='ctx'>  */</div><div class='ctx'> int btrfs_run_qgroups(struct btrfs_trans_handle *trans)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * In case we are called from the qgroup assign ioctl, assert that we</div><div class='add'>+	 * are holding the qgroup_ioctl_lock, otherwise we can race with a quota</div><div class='add'>+	 * disable operation (ioctl) and access a freed quota root.</div><div class='add'>+	 */</div><div class='add'>+	if (trans-&gt;transaction-&gt;state != TRANS_STATE_COMMIT_DOING)</div><div class='add'>+		lockdep_assert_held(&amp;fs_info-&gt;qgroup_ioctl_lock);</div><div class='add'>+</div><div class='ctx'> 	if (!fs_info-&gt;quota_root)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='hunk'>@@ -2715,15 +3087,15 @@ int btrfs_run_qgroups(struct btrfs_trans_handle *trans)</div><div class='ctx'> 		spin_unlock(&amp;fs_info-&gt;qgroup_lock);</div><div class='ctx'> 		ret = update_qgroup_info_item(trans, qgroup);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			fs_info-&gt;qgroup_flags |=</div><div class='del'>-					BTRFS_QGROUP_STATUS_FLAG_INCONSISTENT;</div><div class='add'>+			qgroup_mark_inconsistent(fs_info,</div><div class='add'>+						 "qgroup info item update error %d", ret);</div><div class='ctx'> 		ret = update_qgroup_limit_item(trans, qgroup);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			fs_info-&gt;qgroup_flags |=</div><div class='del'>-					BTRFS_QGROUP_STATUS_FLAG_INCONSISTENT;</div><div class='add'>+			qgroup_mark_inconsistent(fs_info,</div><div class='add'>+						 "qgroup limit item update error %d", ret);</div><div class='ctx'> 		spin_lock(&amp;fs_info-&gt;qgroup_lock);</div><div class='ctx'> 	}</div><div class='del'>-	if (test_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags))</div><div class='add'>+	if (btrfs_qgroup_enabled(fs_info))</div><div class='ctx'> 		fs_info-&gt;qgroup_flags |= BTRFS_QGROUP_STATUS_FLAG_ON;</div><div class='ctx'> 	else</div><div class='ctx'> 		fs_info-&gt;qgroup_flags &amp;= ~BTRFS_QGROUP_STATUS_FLAG_ON;</div><div class='hunk'>@@ -2731,11 +3103,165 @@ int btrfs_run_qgroups(struct btrfs_trans_handle *trans)</div><div class='ctx'> </div><div class='ctx'> 	ret = update_qgroup_status_item(trans);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		fs_info-&gt;qgroup_flags |= BTRFS_QGROUP_STATUS_FLAG_INCONSISTENT;</div><div class='add'>+		qgroup_mark_inconsistent(fs_info,</div><div class='add'>+					 "qgroup status item update error %d", ret);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+int btrfs_qgroup_check_inherit(struct btrfs_fs_info *fs_info,</div><div class='add'>+			       struct btrfs_qgroup_inherit *inherit,</div><div class='add'>+			       size_t size)</div><div class='add'>+{</div><div class='add'>+	if (inherit-&gt;flags &amp; ~BTRFS_QGROUP_INHERIT_FLAGS_SUPP)</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+	if (size &lt; sizeof(*inherit) || size &gt; PAGE_SIZE)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * In the past we allowed btrfs_qgroup_inherit to specify to copy</div><div class='add'>+	 * rfer/excl numbers directly from other qgroups.  This behavior has</div><div class='add'>+	 * been disabled in userspace for a very long time, but here we should</div><div class='add'>+	 * also disable it in kernel, as this behavior is known to mark qgroup</div><div class='add'>+	 * inconsistent, and a rescan would wipe out the changes anyway.</div><div class='add'>+	 *</div><div class='add'>+	 * Reject any btrfs_qgroup_inherit with num_ref_copies or num_excl_copies.</div><div class='add'>+	 */</div><div class='add'>+	if (inherit-&gt;num_ref_copies &gt; 0 || inherit-&gt;num_excl_copies &gt; 0)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	if (size != struct_size(inherit, qgroups, inherit-&gt;num_qgroups))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Skip the inherit source qgroups check if qgroup is not enabled.</div><div class='add'>+	 * Qgroup can still be later enabled causing problems, but in that case</div><div class='add'>+	 * btrfs_qgroup_inherit() would just ignore those invalid ones.</div><div class='add'>+	 */</div><div class='add'>+	if (!btrfs_qgroup_enabled(fs_info))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Now check all the remaining qgroups, they should all:</div><div class='add'>+	 *</div><div class='add'>+	 * - Exist</div><div class='add'>+	 * - Be higher level qgroups.</div><div class='add'>+	 */</div><div class='add'>+	for (int i = 0; i &lt; inherit-&gt;num_qgroups; i++) {</div><div class='add'>+		struct btrfs_qgroup *qgroup;</div><div class='add'>+		u64 qgroupid = inherit-&gt;qgroups[i];</div><div class='add'>+</div><div class='add'>+		if (btrfs_qgroup_level(qgroupid) == 0)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;fs_info-&gt;qgroup_lock);</div><div class='add'>+		qgroup = find_qgroup_rb(fs_info, qgroupid);</div><div class='add'>+		if (!qgroup) {</div><div class='add'>+			spin_unlock(&amp;fs_info-&gt;qgroup_lock);</div><div class='add'>+			return -ENOENT;</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;fs_info-&gt;qgroup_lock);</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int qgroup_auto_inherit(struct btrfs_fs_info *fs_info,</div><div class='add'>+			       u64 inode_rootid,</div><div class='add'>+			       struct btrfs_qgroup_inherit **inherit)</div><div class='add'>+{</div><div class='add'>+	int i = 0;</div><div class='add'>+	u64 num_qgroups = 0;</div><div class='add'>+	struct btrfs_qgroup *inode_qg;</div><div class='add'>+	struct btrfs_qgroup_list *qg_list;</div><div class='add'>+	struct btrfs_qgroup_inherit *res;</div><div class='add'>+	size_t struct_sz;</div><div class='add'>+	u64 *qgids;</div><div class='add'>+</div><div class='add'>+	if (*inherit)</div><div class='add'>+		return -EEXIST;</div><div class='add'>+</div><div class='add'>+	inode_qg = find_qgroup_rb(fs_info, inode_rootid);</div><div class='add'>+	if (!inode_qg)</div><div class='add'>+		return -ENOENT;</div><div class='add'>+</div><div class='add'>+	num_qgroups = list_count_nodes(&amp;inode_qg-&gt;groups);</div><div class='add'>+</div><div class='add'>+	if (!num_qgroups)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	struct_sz = struct_size(res, qgroups, num_qgroups);</div><div class='add'>+	if (struct_sz == SIZE_MAX)</div><div class='add'>+		return -ERANGE;</div><div class='add'>+</div><div class='add'>+	res = kzalloc(struct_sz, GFP_NOFS);</div><div class='add'>+	if (!res)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	res-&gt;num_qgroups = num_qgroups;</div><div class='add'>+	qgids = res-&gt;qgroups;</div><div class='add'>+</div><div class='add'>+	list_for_each_entry(qg_list, &amp;inode_qg-&gt;groups, next_group)</div><div class='add'>+		qgids[i++] = qg_list-&gt;group-&gt;qgroupid;</div><div class='add'>+</div><div class='add'>+	*inherit = res;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Check if we can skip rescan when inheriting qgroups.  If @src has a single</div><div class='add'>+ * @parent, and that @parent is owning all its bytes exclusively, we can skip</div><div class='add'>+ * the full rescan, by just adding nodesize to the @parent's excl/rfer.</div><div class='add'>+ *</div><div class='add'>+ * Return &lt;0 for fatal errors (like srcid/parentid has no qgroup).</div><div class='add'>+ * Return 0 if a quick inherit is done.</div><div class='add'>+ * Return &gt;0 if a quick inherit is not possible, and a full rescan is needed.</div><div class='add'>+ */</div><div class='add'>+static int qgroup_snapshot_quick_inherit(struct btrfs_fs_info *fs_info,</div><div class='add'>+					 u64 srcid, u64 parentid)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_qgroup *src;</div><div class='add'>+	struct btrfs_qgroup *parent;</div><div class='add'>+	struct btrfs_qgroup_list *list;</div><div class='add'>+	int nr_parents = 0;</div><div class='add'>+</div><div class='add'>+	src = find_qgroup_rb(fs_info, srcid);</div><div class='add'>+	if (!src)</div><div class='add'>+		return -ENOENT;</div><div class='add'>+	parent = find_qgroup_rb(fs_info, parentid);</div><div class='add'>+	if (!parent)</div><div class='add'>+		return -ENOENT;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Source has no parent qgroup, but our new qgroup would have one.</div><div class='add'>+	 * Qgroup numbers would become inconsistent.</div><div class='add'>+	 */</div><div class='add'>+	if (list_empty(&amp;src-&gt;groups))</div><div class='add'>+		return 1;</div><div class='add'>+</div><div class='add'>+	list_for_each_entry(list, &amp;src-&gt;groups, next_group) {</div><div class='add'>+		/* The parent is not the same, quick update is not possible. */</div><div class='add'>+		if (list-&gt;group-&gt;qgroupid != parentid)</div><div class='add'>+			return 1;</div><div class='add'>+		nr_parents++;</div><div class='add'>+		/*</div><div class='add'>+		 * More than one parent qgroup, we can't be sure about accounting</div><div class='add'>+		 * consistency.</div><div class='add'>+		 */</div><div class='add'>+		if (nr_parents &gt; 1)</div><div class='add'>+			return 1;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The parent is not exclusively owning all its bytes.  We're not sure</div><div class='add'>+	 * if the source has any bytes not fully owned by the parent.</div><div class='add'>+	 */</div><div class='add'>+	if (parent-&gt;excl != parent-&gt;rfer)</div><div class='add'>+		return 1;</div><div class='add'>+</div><div class='add'>+	parent-&gt;excl += fs_info-&gt;nodesize;</div><div class='add'>+	parent-&gt;rfer += fs_info-&gt;nodesize;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Copy the accounting information between qgroups. This is necessary</div><div class='ctx'>  * when a snapshot or a subvolume is created. Throwing an error will</div><div class='hunk'>@@ -2743,20 +3269,30 @@ int btrfs_run_qgroups(struct btrfs_trans_handle *trans)</div><div class='ctx'>  * when a readonly fs is a reasonable outcome.</div><div class='ctx'>  */</div><div class='ctx'> int btrfs_qgroup_inherit(struct btrfs_trans_handle *trans, u64 srcid,</div><div class='del'>-			 u64 objectid, struct btrfs_qgroup_inherit *inherit)</div><div class='add'>+			 u64 objectid, u64 inode_rootid,</div><div class='add'>+			 struct btrfs_qgroup_inherit *inherit)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	int i;</div><div class='ctx'> 	u64 *i_qgroups;</div><div class='ctx'> 	bool committing = false;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_root *quota_root;</div><div class='ctx'> 	struct btrfs_qgroup *srcgroup;</div><div class='ctx'> 	struct btrfs_qgroup *dstgroup;</div><div class='add'>+	struct btrfs_qgroup *prealloc = NULL;</div><div class='add'>+	struct btrfs_qgroup_list **qlist_prealloc = NULL;</div><div class='add'>+	bool free_inherit = false;</div><div class='ctx'> 	bool need_rescan = false;</div><div class='ctx'> 	u32 level_size = 0;</div><div class='ctx'> 	u64 nums;</div><div class='ctx'> </div><div class='add'>+	if (!btrfs_qgroup_enabled(fs_info))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	prealloc = kzalloc(sizeof(*prealloc), GFP_NOFS);</div><div class='add'>+	if (!prealloc)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * There are only two callers of this function.</div><div class='ctx'> 	 *</div><div class='hunk'>@@ -2776,8 +3312,6 @@ int btrfs_qgroup_inherit(struct btrfs_trans_handle *trans, u64 srcid,</div><div class='ctx'> </div><div class='ctx'> 	if (!committing)</div><div class='ctx'> 		mutex_lock(&amp;fs_info-&gt;qgroup_ioctl_lock);</div><div class='del'>-	if (!test_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags))</div><div class='del'>-		goto out;</div><div class='ctx'> </div><div class='ctx'> 	quota_root = fs_info-&gt;quota_root;</div><div class='ctx'> 	if (!quota_root) {</div><div class='hunk'>@@ -2785,11 +3319,18 @@ int btrfs_qgroup_inherit(struct btrfs_trans_handle *trans, u64 srcid,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (btrfs_qgroup_mode(fs_info) == BTRFS_QGROUP_MODE_SIMPLE &amp;&amp; !inherit) {</div><div class='add'>+		ret = qgroup_auto_inherit(fs_info, inode_rootid, &amp;inherit);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out;</div><div class='add'>+		free_inherit = true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (inherit) {</div><div class='ctx'> 		i_qgroups = (u64 *)(inherit + 1);</div><div class='ctx'> 		nums = inherit-&gt;num_qgroups + 2 * inherit-&gt;num_ref_copies +</div><div class='ctx'> 		       2 * inherit-&gt;num_excl_copies;</div><div class='del'>-		for (i = 0; i &lt; nums; ++i) {</div><div class='add'>+		for (int i = 0; i &lt; nums; i++) {</div><div class='ctx'> 			srcgroup = find_qgroup_rb(fs_info, *i_qgroups);</div><div class='ctx'> </div><div class='ctx'> 			/*</div><div class='hunk'>@@ -2816,7 +3357,7 @@ int btrfs_qgroup_inherit(struct btrfs_trans_handle *trans, u64 srcid,</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (inherit) {</div><div class='ctx'> 		i_qgroups = (u64 *)(inherit + 1);</div><div class='del'>-		for (i = 0; i &lt; inherit-&gt;num_qgroups; ++i, ++i_qgroups) {</div><div class='add'>+		for (int i = 0; i &lt; inherit-&gt;num_qgroups; i++, i_qgroups++) {</div><div class='ctx'> 			if (*i_qgroups == 0)</div><div class='ctx'> 				continue;</div><div class='ctx'> 			ret = add_qgroup_relation_item(trans, objectid,</div><div class='hunk'>@@ -2829,16 +3370,28 @@ int btrfs_qgroup_inherit(struct btrfs_trans_handle *trans, u64 srcid,</div><div class='ctx'> 				goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 		ret = 0;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='add'>+		qlist_prealloc = kcalloc(inherit-&gt;num_qgroups,</div><div class='add'>+					 sizeof(struct btrfs_qgroup_list *),</div><div class='add'>+					 GFP_NOFS);</div><div class='add'>+		if (!qlist_prealloc) {</div><div class='add'>+			ret = -ENOMEM;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		for (int i = 0; i &lt; inherit-&gt;num_qgroups; i++) {</div><div class='add'>+			qlist_prealloc[i] = kzalloc(sizeof(struct btrfs_qgroup_list),</div><div class='add'>+						    GFP_NOFS);</div><div class='add'>+			if (!qlist_prealloc[i]) {</div><div class='add'>+				ret = -ENOMEM;</div><div class='add'>+				goto out;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;qgroup_lock);</div><div class='ctx'> </div><div class='del'>-	dstgroup = add_qgroup_rb(fs_info, objectid);</div><div class='del'>-	if (IS_ERR(dstgroup)) {</div><div class='del'>-		ret = PTR_ERR(dstgroup);</div><div class='del'>-		goto unlock;</div><div class='del'>-	}</div><div class='add'>+	dstgroup = add_qgroup_rb(fs_info, prealloc, objectid);</div><div class='add'>+	prealloc = NULL;</div><div class='ctx'> </div><div class='ctx'> 	if (inherit &amp;&amp; inherit-&gt;flags &amp; BTRFS_QGROUP_INHERIT_SET_LIMITS) {</div><div class='ctx'> 		dstgroup-&gt;lim_flags = inherit-&gt;lim.flags;</div><div class='hunk'>@@ -2847,17 +3400,10 @@ int btrfs_qgroup_inherit(struct btrfs_trans_handle *trans, u64 srcid,</div><div class='ctx'> 		dstgroup-&gt;rsv_rfer = inherit-&gt;lim.rsv_rfer;</div><div class='ctx'> 		dstgroup-&gt;rsv_excl = inherit-&gt;lim.rsv_excl;</div><div class='ctx'> </div><div class='del'>-		ret = update_qgroup_limit_item(trans, dstgroup);</div><div class='del'>-		if (ret) {</div><div class='del'>-			fs_info-&gt;qgroup_flags |= BTRFS_QGROUP_STATUS_FLAG_INCONSISTENT;</div><div class='del'>-			btrfs_info(fs_info,</div><div class='del'>-				   "unable to update quota limit for %llu",</div><div class='del'>-				   dstgroup-&gt;qgroupid);</div><div class='del'>-			goto unlock;</div><div class='del'>-		}</div><div class='add'>+		qgroup_dirty(fs_info, dstgroup);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (srcid) {</div><div class='add'>+	if (srcid &amp;&amp; btrfs_qgroup_mode(fs_info) == BTRFS_QGROUP_MODE_FULL) {</div><div class='ctx'> 		srcgroup = find_qgroup_rb(fs_info, srcid);</div><div class='ctx'> 		if (!srcgroup)</div><div class='ctx'> 			goto unlock;</div><div class='hunk'>@@ -2884,29 +3430,40 @@ int btrfs_qgroup_inherit(struct btrfs_trans_handle *trans, u64 srcid,</div><div class='ctx'> </div><div class='ctx'> 		qgroup_dirty(fs_info, dstgroup);</div><div class='ctx'> 		qgroup_dirty(fs_info, srcgroup);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * If the source qgroup has parent but the new one doesn't,</div><div class='add'>+		 * we need a full rescan.</div><div class='add'>+		 */</div><div class='add'>+		if (!inherit &amp;&amp; !list_empty(&amp;srcgroup-&gt;groups))</div><div class='add'>+			need_rescan = true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!inherit)</div><div class='ctx'> 		goto unlock;</div><div class='ctx'> </div><div class='ctx'> 	i_qgroups = (u64 *)(inherit + 1);</div><div class='del'>-	for (i = 0; i &lt; inherit-&gt;num_qgroups; ++i) {</div><div class='add'>+	for (int i = 0; i &lt; inherit-&gt;num_qgroups; i++) {</div><div class='ctx'> 		if (*i_qgroups) {</div><div class='del'>-			ret = add_relation_rb(fs_info, objectid, *i_qgroups);</div><div class='add'>+			ret = add_relation_rb(fs_info, qlist_prealloc[i], objectid,</div><div class='add'>+					      *i_qgroups);</div><div class='add'>+			qlist_prealloc[i] = NULL;</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				goto unlock;</div><div class='ctx'> 		}</div><div class='add'>+		if (srcid) {</div><div class='add'>+			/* Check if we can do a quick inherit. */</div><div class='add'>+			ret = qgroup_snapshot_quick_inherit(fs_info, srcid, *i_qgroups);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				goto unlock;</div><div class='add'>+			if (ret &gt; 0)</div><div class='add'>+				need_rescan = true;</div><div class='add'>+			ret = 0;</div><div class='add'>+		}</div><div class='ctx'> 		++i_qgroups;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * If we're doing a snapshot, and adding the snapshot to a new</div><div class='del'>-		 * qgroup, the numbers are guaranteed to be incorrect.</div><div class='del'>-		 */</div><div class='del'>-		if (srcid)</div><div class='del'>-			need_rescan = true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt;  inherit-&gt;num_ref_copies; ++i, i_qgroups += 2) {</div><div class='add'>+	for (int i = 0; i &lt; inherit-&gt;num_ref_copies; i++, i_qgroups += 2) {</div><div class='ctx'> 		struct btrfs_qgroup *src;</div><div class='ctx'> 		struct btrfs_qgroup *dst;</div><div class='ctx'> </div><div class='hunk'>@@ -2927,7 +3484,7 @@ int btrfs_qgroup_inherit(struct btrfs_trans_handle *trans, u64 srcid,</div><div class='ctx'> 		/* Manually tweaking numbers certainly needs a rescan */</div><div class='ctx'> 		need_rescan = true;</div><div class='ctx'> 	}</div><div class='del'>-	for (i = 0; i &lt;  inherit-&gt;num_excl_copies; ++i, i_qgroups += 2) {</div><div class='add'>+	for (int i = 0; i &lt; inherit-&gt;num_excl_copies; i++, i_qgroups += 2) {</div><div class='ctx'> 		struct btrfs_qgroup *src;</div><div class='ctx'> 		struct btrfs_qgroup *dst;</div><div class='ctx'> </div><div class='hunk'>@@ -2955,7 +3512,22 @@ out:</div><div class='ctx'> 	if (!committing)</div><div class='ctx'> 		mutex_unlock(&amp;fs_info-&gt;qgroup_ioctl_lock);</div><div class='ctx'> 	if (need_rescan)</div><div class='del'>-		fs_info-&gt;qgroup_flags |= BTRFS_QGROUP_STATUS_FLAG_INCONSISTENT;</div><div class='add'>+		qgroup_mark_inconsistent(fs_info, "qgroup inherit needs a rescan");</div><div class='add'>+	if (qlist_prealloc) {</div><div class='add'>+		for (int i = 0; i &lt; inherit-&gt;num_qgroups; i++)</div><div class='add'>+			kfree(qlist_prealloc[i]);</div><div class='add'>+		kfree(qlist_prealloc);</div><div class='add'>+	}</div><div class='add'>+	if (free_inherit)</div><div class='add'>+		kfree(inherit);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * At this point we either failed at allocating prealloc, or we</div><div class='add'>+	 * succeeded and passed the ownership to it to add_qgroup_rb(). In any</div><div class='add'>+	 * case, this needs to be NULL or there is something wrong.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(prealloc == NULL);</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2977,12 +3549,11 @@ static int qgroup_reserve(struct btrfs_root *root, u64 num_bytes, bool enforce,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_qgroup *qgroup;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='del'>-	u64 ref_root = root-&gt;root_key.objectid;</div><div class='add'>+	u64 ref_root = btrfs_root_id(root);</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	struct ulist_node *unode;</div><div class='del'>-	struct ulist_iterator uiter;</div><div class='add'>+	LIST_HEAD(qgroup_list);</div><div class='ctx'> </div><div class='del'>-	if (!is_fstree(ref_root))</div><div class='add'>+	if (!btrfs_is_fstree(ref_root))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	if (num_bytes == 0)</div><div class='hunk'>@@ -3000,49 +3571,28 @@ static int qgroup_reserve(struct btrfs_root *root, u64 num_bytes, bool enforce,</div><div class='ctx'> 	if (!qgroup)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * in a first step, we check all affected qgroups if any limits would</div><div class='del'>-	 * be exceeded</div><div class='del'>-	 */</div><div class='del'>-	ulist_reinit(fs_info-&gt;qgroup_ulist);</div><div class='del'>-	ret = ulist_add(fs_info-&gt;qgroup_ulist, qgroup-&gt;qgroupid,</div><div class='del'>-			qgroup_to_aux(qgroup), GFP_ATOMIC);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-	ULIST_ITER_INIT(&amp;uiter);</div><div class='del'>-	while ((unode = ulist_next(fs_info-&gt;qgroup_ulist, &amp;uiter))) {</div><div class='del'>-		struct btrfs_qgroup *qg;</div><div class='add'>+	qgroup_iterator_add(&amp;qgroup_list, qgroup);</div><div class='add'>+	list_for_each_entry(qgroup, &amp;qgroup_list, iterator) {</div><div class='ctx'> 		struct btrfs_qgroup_list *glist;</div><div class='ctx'> </div><div class='del'>-		qg = unode_aux_to_qgroup(unode);</div><div class='del'>-</div><div class='del'>-		if (enforce &amp;&amp; !qgroup_check_limits(qg, num_bytes)) {</div><div class='add'>+		if (enforce &amp;&amp; !qgroup_check_limits(qgroup, num_bytes)) {</div><div class='ctx'> 			ret = -EDQUOT;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		list_for_each_entry(glist, &amp;qg-&gt;groups, next_group) {</div><div class='del'>-			ret = ulist_add(fs_info-&gt;qgroup_ulist,</div><div class='del'>-					glist-&gt;group-&gt;qgroupid,</div><div class='del'>-					qgroup_to_aux(glist-&gt;group), GFP_ATOMIC);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto out;</div><div class='del'>-		}</div><div class='add'>+		list_for_each_entry(glist, &amp;qgroup-&gt;groups, next_group)</div><div class='add'>+			qgroup_iterator_add(&amp;qgroup_list, glist-&gt;group);</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> 	ret = 0;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * no limits exceeded, now record the reservation into all qgroups</div><div class='ctx'> 	 */</div><div class='del'>-	ULIST_ITER_INIT(&amp;uiter);</div><div class='del'>-	while ((unode = ulist_next(fs_info-&gt;qgroup_ulist, &amp;uiter))) {</div><div class='del'>-		struct btrfs_qgroup *qg;</div><div class='del'>-</div><div class='del'>-		qg = unode_aux_to_qgroup(unode);</div><div class='del'>-</div><div class='del'>-		qgroup_rsv_add(fs_info, qg, num_bytes, type);</div><div class='del'>-	}</div><div class='add'>+	list_for_each_entry(qgroup, &amp;qgroup_list, iterator)</div><div class='add'>+		qgroup_rsv_add(fs_info, qgroup, num_bytes, type);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='add'>+	qgroup_iterator_clean(&amp;qgroup_list);</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;qgroup_lock);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -3061,11 +3611,9 @@ void btrfs_qgroup_free_refroot(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			       enum btrfs_qgroup_rsv_type type)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_qgroup *qgroup;</div><div class='del'>-	struct ulist_node *unode;</div><div class='del'>-	struct ulist_iterator uiter;</div><div class='del'>-	int ret = 0;</div><div class='add'>+	LIST_HEAD(qgroup_list);</div><div class='ctx'> </div><div class='del'>-	if (!is_fstree(ref_root))</div><div class='add'>+	if (!btrfs_is_fstree(ref_root))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	if (num_bytes == 0)</div><div class='hunk'>@@ -3091,30 +3639,17 @@ void btrfs_qgroup_free_refroot(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		 */</div><div class='ctx'> 		num_bytes = qgroup-&gt;rsv.values[type];</div><div class='ctx'> </div><div class='del'>-	ulist_reinit(fs_info-&gt;qgroup_ulist);</div><div class='del'>-	ret = ulist_add(fs_info-&gt;qgroup_ulist, qgroup-&gt;qgroupid,</div><div class='del'>-			qgroup_to_aux(qgroup), GFP_ATOMIC);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-	ULIST_ITER_INIT(&amp;uiter);</div><div class='del'>-	while ((unode = ulist_next(fs_info-&gt;qgroup_ulist, &amp;uiter))) {</div><div class='del'>-		struct btrfs_qgroup *qg;</div><div class='add'>+	qgroup_iterator_add(&amp;qgroup_list, qgroup);</div><div class='add'>+	list_for_each_entry(qgroup, &amp;qgroup_list, iterator) {</div><div class='ctx'> 		struct btrfs_qgroup_list *glist;</div><div class='ctx'> </div><div class='del'>-		qg = unode_aux_to_qgroup(unode);</div><div class='del'>-</div><div class='del'>-		qgroup_rsv_release(fs_info, qg, num_bytes, type);</div><div class='del'>-</div><div class='del'>-		list_for_each_entry(glist, &amp;qg-&gt;groups, next_group) {</div><div class='del'>-			ret = ulist_add(fs_info-&gt;qgroup_ulist,</div><div class='del'>-					glist-&gt;group-&gt;qgroupid,</div><div class='del'>-					qgroup_to_aux(glist-&gt;group), GFP_ATOMIC);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto out;</div><div class='add'>+		qgroup_rsv_release(fs_info, qgroup, num_bytes, type);</div><div class='add'>+		list_for_each_entry(glist, &amp;qgroup-&gt;groups, next_group) {</div><div class='add'>+			qgroup_iterator_add(&amp;qgroup_list, glist-&gt;group);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='ctx'> out:</div><div class='add'>+	qgroup_iterator_clean(&amp;qgroup_list);</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;qgroup_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3141,24 +3676,27 @@ static int qgroup_rescan_leaf(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			      struct btrfs_path *path)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='add'>+	struct btrfs_root *extent_root;</div><div class='ctx'> 	struct btrfs_key found;</div><div class='ctx'> 	struct extent_buffer *scratch_leaf = NULL;</div><div class='del'>-	struct ulist *roots = NULL;</div><div class='ctx'> 	u64 num_bytes;</div><div class='ctx'> 	bool done;</div><div class='ctx'> 	int slot;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='add'>+	if (!btrfs_qgroup_full_accounting(fs_info))</div><div class='add'>+		return 1;</div><div class='add'>+</div><div class='ctx'> 	mutex_lock(&amp;fs_info-&gt;qgroup_rescan_lock);</div><div class='del'>-	ret = btrfs_search_slot_for_read(fs_info-&gt;extent_root,</div><div class='add'>+	extent_root = btrfs_extent_root(fs_info,</div><div class='add'>+				fs_info-&gt;qgroup_rescan_progress.objectid);</div><div class='add'>+	ret = btrfs_search_slot_for_read(extent_root,</div><div class='ctx'> 					 &amp;fs_info-&gt;qgroup_rescan_progress,</div><div class='ctx'> 					 path, 1, 0);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_debug(fs_info,</div><div class='del'>-		"current progress key (%llu %u %llu), search_slot ret %d",</div><div class='del'>-		fs_info-&gt;qgroup_rescan_progress.objectid,</div><div class='del'>-		fs_info-&gt;qgroup_rescan_progress.type,</div><div class='del'>-		fs_info-&gt;qgroup_rescan_progress.offset, ret);</div><div class='add'>+		    "current progress key " BTRFS_KEY_FMT ", search_slot ret %d",</div><div class='add'>+		    BTRFS_KEY_FMT_VALUE(&amp;fs_info-&gt;qgroup_rescan_progress), ret);</div><div class='ctx'> </div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -3191,6 +3729,8 @@ static int qgroup_rescan_leaf(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;qgroup_rescan_lock);</div><div class='ctx'> </div><div class='ctx'> 	for (; slot &lt; btrfs_header_nritems(scratch_leaf); ++slot) {</div><div class='add'>+		struct btrfs_backref_walk_ctx ctx = { 0 };</div><div class='add'>+</div><div class='ctx'> 		btrfs_item_key_to_cpu(scratch_leaf, &amp;found, slot);</div><div class='ctx'> 		if (found.type != BTRFS_EXTENT_ITEM_KEY &amp;&amp;</div><div class='ctx'> 		    found.type != BTRFS_METADATA_ITEM_KEY)</div><div class='hunk'>@@ -3200,13 +3740,15 @@ static int qgroup_rescan_leaf(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		else</div><div class='ctx'> 			num_bytes = found.offset;</div><div class='ctx'> </div><div class='del'>-		ret = btrfs_find_all_roots(NULL, fs_info, found.objectid, 0,</div><div class='del'>-					   &amp;roots, false);</div><div class='add'>+		ctx.bytenr = found.objectid;</div><div class='add'>+		ctx.fs_info = fs_info;</div><div class='add'>+</div><div class='add'>+		ret = btrfs_find_all_roots(&amp;ctx, false);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		/* For rescan, just pass old_roots as NULL */</div><div class='ctx'> 		ret = btrfs_qgroup_account_extent(trans, found.objectid,</div><div class='del'>-						  num_bytes, NULL, roots);</div><div class='add'>+						  num_bytes, NULL, ctx.roots);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3223,8 +3765,15 @@ out:</div><div class='ctx'> </div><div class='ctx'> static bool rescan_should_stop(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	return btrfs_fs_closing(fs_info) ||</div><div class='del'>-		test_bit(BTRFS_FS_STATE_REMOUNTING, &amp;fs_info-&gt;fs_state);</div><div class='add'>+	if (btrfs_fs_closing(fs_info))</div><div class='add'>+		return true;</div><div class='add'>+	if (test_bit(BTRFS_FS_STATE_REMOUNTING, &amp;fs_info-&gt;fs_state))</div><div class='add'>+		return true;</div><div class='add'>+	if (!btrfs_qgroup_enabled(fs_info))</div><div class='add'>+		return true;</div><div class='add'>+	if (fs_info-&gt;qgroup_flags &amp; BTRFS_QGROUP_RUNTIME_FLAG_CANCEL_RESCAN)</div><div class='add'>+		return true;</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void btrfs_qgroup_rescan_worker(struct btrfs_work *work)</div><div class='hunk'>@@ -3233,33 +3782,36 @@ static void btrfs_qgroup_rescan_worker(struct btrfs_work *work)</div><div class='ctx'> 						     qgroup_rescan_work);</div><div class='ctx'> 	struct btrfs_path *path;</div><div class='ctx'> 	struct btrfs_trans_handle *trans = NULL;</div><div class='del'>-	int err = -ENOMEM;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	bool stopped = false;</div><div class='add'>+	bool did_leaf_rescans = false;</div><div class='add'>+</div><div class='add'>+	if (btrfs_qgroup_mode(fs_info) == BTRFS_QGROUP_MODE_SIMPLE)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='del'>-	if (!path)</div><div class='add'>+	if (!path) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='ctx'> 		goto out;</div><div class='add'>+	}</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Rescan should only search for commit root, and any later difference</div><div class='ctx'> 	 * should be recorded by qgroup</div><div class='ctx'> 	 */</div><div class='del'>-	path-&gt;search_commit_root = 1;</div><div class='del'>-	path-&gt;skip_locking = 1;</div><div class='add'>+	path-&gt;search_commit_root = true;</div><div class='add'>+	path-&gt;skip_locking = true;</div><div class='ctx'> </div><div class='del'>-	err = 0;</div><div class='del'>-	while (!err &amp;&amp; !(stopped = rescan_should_stop(fs_info))) {</div><div class='add'>+	while (!ret &amp;&amp; !(stopped = rescan_should_stop(fs_info))) {</div><div class='ctx'> 		trans = btrfs_start_transaction(fs_info-&gt;fs_root, 0);</div><div class='ctx'> 		if (IS_ERR(trans)) {</div><div class='del'>-			err = PTR_ERR(trans);</div><div class='add'>+			ret = PTR_ERR(trans);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-		if (!test_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags)) {</div><div class='del'>-			err = -EINTR;</div><div class='del'>-		} else {</div><div class='del'>-			err = qgroup_rescan_leaf(trans, path);</div><div class='del'>-		}</div><div class='del'>-		if (err &gt; 0)</div><div class='add'>+</div><div class='add'>+		ret = qgroup_rescan_leaf(trans, path);</div><div class='add'>+		did_leaf_rescans = true;</div><div class='add'>+</div><div class='add'>+		if (ret &gt; 0)</div><div class='ctx'> 			btrfs_commit_transaction(trans);</div><div class='ctx'> 		else</div><div class='ctx'> 			btrfs_end_transaction(trans);</div><div class='hunk'>@@ -3269,39 +3821,48 @@ out:</div><div class='ctx'> 	btrfs_free_path(path);</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;fs_info-&gt;qgroup_rescan_lock);</div><div class='del'>-	if (err &gt; 0 &amp;&amp;</div><div class='add'>+	if (ret &gt; 0 &amp;&amp;</div><div class='ctx'> 	    fs_info-&gt;qgroup_flags &amp; BTRFS_QGROUP_STATUS_FLAG_INCONSISTENT) {</div><div class='ctx'> 		fs_info-&gt;qgroup_flags &amp;= ~BTRFS_QGROUP_STATUS_FLAG_INCONSISTENT;</div><div class='del'>-	} else if (err &lt; 0) {</div><div class='add'>+	} else if (ret &lt; 0 || stopped) {</div><div class='ctx'> 		fs_info-&gt;qgroup_flags |= BTRFS_QGROUP_STATUS_FLAG_INCONSISTENT;</div><div class='ctx'> 	}</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;qgroup_rescan_lock);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * only update status, since the previous part has already updated the</div><div class='del'>-	 * qgroup info.</div><div class='add'>+	 * Only update status, since the previous part has already updated the</div><div class='add'>+	 * qgroup info, and only if we did any actual work. This also prevents</div><div class='add'>+	 * race with a concurrent quota disable, which has already set</div><div class='add'>+	 * fs_info-&gt;quota_root to NULL and cleared BTRFS_FS_QUOTA_ENABLED at</div><div class='add'>+	 * btrfs_quota_disable().</div><div class='ctx'> 	 */</div><div class='del'>-	trans = btrfs_start_transaction(fs_info-&gt;quota_root, 1);</div><div class='del'>-	if (IS_ERR(trans)) {</div><div class='del'>-		err = PTR_ERR(trans);</div><div class='add'>+	if (did_leaf_rescans) {</div><div class='add'>+		trans = btrfs_start_transaction(fs_info-&gt;quota_root, 1);</div><div class='add'>+		if (IS_ERR(trans)) {</div><div class='add'>+			ret = PTR_ERR(trans);</div><div class='add'>+			trans = NULL;</div><div class='add'>+			btrfs_err(fs_info,</div><div class='add'>+				  "fail to start transaction for status update: %d",</div><div class='add'>+				  ret);</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='ctx'> 		trans = NULL;</div><div class='del'>-		btrfs_err(fs_info,</div><div class='del'>-			  "fail to start transaction for status update: %d",</div><div class='del'>-			  err);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;fs_info-&gt;qgroup_rescan_lock);</div><div class='del'>-	if (!stopped)</div><div class='add'>+	if (!stopped ||</div><div class='add'>+	    fs_info-&gt;qgroup_flags &amp; BTRFS_QGROUP_RUNTIME_FLAG_CANCEL_RESCAN)</div><div class='ctx'> 		fs_info-&gt;qgroup_flags &amp;= ~BTRFS_QGROUP_STATUS_FLAG_RESCAN;</div><div class='ctx'> 	if (trans) {</div><div class='del'>-		ret = update_qgroup_status_item(trans);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			err = ret;</div><div class='del'>-			btrfs_err(fs_info, "fail to update qgroup status: %d",</div><div class='del'>-				  err);</div><div class='add'>+		int ret2 = update_qgroup_status_item(trans);</div><div class='add'>+</div><div class='add'>+		if (ret2 &lt; 0) {</div><div class='add'>+			ret = ret2;</div><div class='add'>+			btrfs_err(fs_info, "fail to update qgroup status: %d", ret);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	fs_info-&gt;qgroup_rescan_running = false;</div><div class='add'>+	fs_info-&gt;qgroup_flags &amp;= ~BTRFS_QGROUP_RUNTIME_FLAG_CANCEL_RESCAN;</div><div class='ctx'> 	complete_all(&amp;fs_info-&gt;qgroup_rescan_completion);</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;qgroup_rescan_lock);</div><div class='ctx'> </div><div class='hunk'>@@ -3312,11 +3873,13 @@ out:</div><div class='ctx'> </div><div class='ctx'> 	if (stopped) {</div><div class='ctx'> 		btrfs_info(fs_info, "qgroup scan paused");</div><div class='del'>-	} else if (err &gt;= 0) {</div><div class='add'>+	} else if (fs_info-&gt;qgroup_flags &amp; BTRFS_QGROUP_RUNTIME_FLAG_CANCEL_RESCAN) {</div><div class='add'>+		btrfs_info(fs_info, "qgroup scan cancelled");</div><div class='add'>+	} else if (ret &gt;= 0) {</div><div class='ctx'> 		btrfs_info(fs_info, "qgroup scan completed%s",</div><div class='del'>-			err &gt; 0 ? " (inconsistency flag cleared)" : "");</div><div class='add'>+			ret &gt; 0 ? " (inconsistency flag cleared)" : "");</div><div class='ctx'> 	} else {</div><div class='del'>-		btrfs_err(fs_info, "qgroup scan failed with %d", err);</div><div class='add'>+		btrfs_err(fs_info, "qgroup scan failed with %d", ret);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3330,18 +3893,23 @@ qgroup_rescan_init(struct btrfs_fs_info *fs_info, u64 progress_objectid,</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='add'>+	if (btrfs_qgroup_mode(fs_info) == BTRFS_QGROUP_MODE_SIMPLE) {</div><div class='add'>+		btrfs_warn(fs_info, "qgroup rescan init failed, running in simple mode");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (!init_flags) {</div><div class='ctx'> 		/* we're resuming qgroup rescan at mount time */</div><div class='ctx'> 		if (!(fs_info-&gt;qgroup_flags &amp;</div><div class='ctx'> 		      BTRFS_QGROUP_STATUS_FLAG_RESCAN)) {</div><div class='del'>-			btrfs_warn(fs_info,</div><div class='add'>+			btrfs_debug(fs_info,</div><div class='ctx'> 			"qgroup rescan init failed, qgroup rescan is not queued");</div><div class='ctx'> 			ret = -EINVAL;</div><div class='ctx'> 		} else if (!(fs_info-&gt;qgroup_flags &amp;</div><div class='ctx'> 			     BTRFS_QGROUP_STATUS_FLAG_ON)) {</div><div class='del'>-			btrfs_warn(fs_info,</div><div class='add'>+			btrfs_debug(fs_info,</div><div class='ctx'> 			"qgroup rescan init failed, qgroup is not enabled");</div><div class='del'>-			ret = -EINVAL;</div><div class='add'>+			ret = -ENOTCONN;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (ret)</div><div class='hunk'>@@ -3352,14 +3920,15 @@ qgroup_rescan_init(struct btrfs_fs_info *fs_info, u64 progress_objectid,</div><div class='ctx'> </div><div class='ctx'> 	if (init_flags) {</div><div class='ctx'> 		if (fs_info-&gt;qgroup_flags &amp; BTRFS_QGROUP_STATUS_FLAG_RESCAN) {</div><div class='del'>-			btrfs_warn(fs_info,</div><div class='del'>-				   "qgroup rescan is already in progress");</div><div class='ctx'> 			ret = -EINPROGRESS;</div><div class='ctx'> 		} else if (!(fs_info-&gt;qgroup_flags &amp;</div><div class='ctx'> 			     BTRFS_QGROUP_STATUS_FLAG_ON)) {</div><div class='del'>-			btrfs_warn(fs_info,</div><div class='add'>+			btrfs_debug(fs_info,</div><div class='ctx'> 			"qgroup rescan init failed, qgroup is not enabled");</div><div class='del'>-			ret = -EINVAL;</div><div class='add'>+			ret = -ENOTCONN;</div><div class='add'>+		} else if (btrfs_qgroup_mode(fs_info) == BTRFS_QGROUP_MODE_DISABLED) {</div><div class='add'>+			/* Quota disable is in progress */</div><div class='add'>+			ret = -EBUSY;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (ret) {</div><div class='hunk'>@@ -3371,12 +3940,14 @@ qgroup_rescan_init(struct btrfs_fs_info *fs_info, u64 progress_objectid,</div><div class='ctx'> </div><div class='ctx'> 	memset(&amp;fs_info-&gt;qgroup_rescan_progress, 0,</div><div class='ctx'> 		sizeof(fs_info-&gt;qgroup_rescan_progress));</div><div class='add'>+	fs_info-&gt;qgroup_flags &amp;= ~(BTRFS_QGROUP_RUNTIME_FLAG_CANCEL_RESCAN |</div><div class='add'>+				   BTRFS_QGROUP_RUNTIME_FLAG_NO_ACCOUNTING);</div><div class='ctx'> 	fs_info-&gt;qgroup_rescan_progress.objectid = progress_objectid;</div><div class='ctx'> 	init_completion(&amp;fs_info-&gt;qgroup_rescan_completion);</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;qgroup_rescan_lock);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_init_work(&amp;fs_info-&gt;qgroup_rescan_work,</div><div class='del'>-			btrfs_qgroup_rescan_worker, NULL, NULL);</div><div class='add'>+			btrfs_qgroup_rescan_worker, NULL);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3403,7 +3974,6 @@ int</div><div class='ctx'> btrfs_qgroup_rescan(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	struct btrfs_trans_handle *trans;</div><div class='ctx'> </div><div class='ctx'> 	ret = qgroup_rescan_init(fs_info, 0, 1);</div><div class='ctx'> 	if (ret)</div><div class='hunk'>@@ -3420,12 +3990,7 @@ btrfs_qgroup_rescan(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	 * going to clear all tracking information for a clean start.</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='del'>-	trans = btrfs_join_transaction(fs_info-&gt;fs_root);</div><div class='del'>-	if (IS_ERR(trans)) {</div><div class='del'>-		fs_info-&gt;qgroup_flags &amp;= ~BTRFS_QGROUP_STATUS_FLAG_RESCAN;</div><div class='del'>-		return PTR_ERR(trans);</div><div class='del'>-	}</div><div class='del'>-	ret = btrfs_commit_transaction(trans);</div><div class='add'>+	ret = btrfs_commit_current_transaction(fs_info-&gt;fs_root);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		fs_info-&gt;qgroup_flags &amp;= ~BTRFS_QGROUP_STATUS_FLAG_RESCAN;</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -3434,12 +3999,21 @@ btrfs_qgroup_rescan(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	qgroup_rescan_zero_tracking(fs_info);</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;fs_info-&gt;qgroup_rescan_lock);</div><div class='del'>-	fs_info-&gt;qgroup_rescan_running = true;</div><div class='del'>-	btrfs_queue_work(fs_info-&gt;qgroup_rescan_workers,</div><div class='del'>-			 &amp;fs_info-&gt;qgroup_rescan_work);</div><div class='add'>+	/*</div><div class='add'>+	 * The rescan worker is only for full accounting qgroups, check if it's</div><div class='add'>+	 * enabled as it is pointless to queue it otherwise. A concurrent quota</div><div class='add'>+	 * disable may also have just cleared BTRFS_FS_QUOTA_ENABLED.</div><div class='add'>+	 */</div><div class='add'>+	if (btrfs_qgroup_full_accounting(fs_info)) {</div><div class='add'>+		fs_info-&gt;qgroup_rescan_running = true;</div><div class='add'>+		btrfs_queue_work(fs_info-&gt;qgroup_rescan_workers,</div><div class='add'>+				 &amp;fs_info-&gt;qgroup_rescan_work);</div><div class='add'>+	} else {</div><div class='add'>+		ret = -ENOTCONN;</div><div class='add'>+	}</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;qgroup_rescan_lock);</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_qgroup_wait_for_completion(struct btrfs_fs_info *fs_info,</div><div class='hunk'>@@ -3526,8 +4100,8 @@ static int qgroup_unreserve_range(struct btrfs_inode *inode,</div><div class='ctx'> 		 * Now the entry is in [start, start + len), revert the</div><div class='ctx'> 		 * EXTENT_QGROUP_RESERVED bit.</div><div class='ctx'> 		 */</div><div class='del'>-		clear_ret = clear_extent_bits(&amp;inode-&gt;io_tree, entry_start,</div><div class='del'>-					      entry_end, EXTENT_QGROUP_RESERVED);</div><div class='add'>+		clear_ret = btrfs_clear_extent_bit(&amp;inode-&gt;io_tree, entry_start, entry_end,</div><div class='add'>+						   EXTENT_QGROUP_RESERVED, NULL);</div><div class='ctx'> 		if (!ret &amp;&amp; clear_ret &lt; 0)</div><div class='ctx'> 			ret = clear_ret;</div><div class='ctx'> </div><div class='hunk'>@@ -3564,7 +4138,6 @@ static int qgroup_unreserve_range(struct btrfs_inode *inode,</div><div class='ctx'>  */</div><div class='ctx'> static int try_flush_qgroup(struct btrfs_root *root)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	/* Can't hold an open transaction or we run the risk of deadlocking. */</div><div class='hunk'>@@ -3585,15 +4158,18 @@ static int try_flush_qgroup(struct btrfs_root *root)</div><div class='ctx'> 	ret = btrfs_start_delalloc_snapshot(root, true);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='del'>-	btrfs_wait_ordered_extents(root, U64_MAX, 0, (u64)-1);</div><div class='add'>+	btrfs_wait_ordered_extents(root, U64_MAX, NULL);</div><div class='ctx'> </div><div class='del'>-	trans = btrfs_join_transaction(root);</div><div class='del'>-	if (IS_ERR(trans)) {</div><div class='del'>-		ret = PTR_ERR(trans);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	/*</div><div class='add'>+	 * After waiting for ordered extents run delayed iputs in order to free</div><div class='add'>+	 * space from unlinked files before committing the current transaction,</div><div class='add'>+	 * as ordered extents may have been holding the last reference of an</div><div class='add'>+	 * inode and they add a delayed iput when they complete.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_run_delayed_iputs(root-&gt;fs_info);</div><div class='add'>+	btrfs_wait_on_delayed_iputs(root-&gt;fs_info);</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_commit_transaction(trans);</div><div class='add'>+	ret = btrfs_commit_current_transaction(root);</div><div class='ctx'> out:</div><div class='ctx'> 	clear_bit(BTRFS_ROOT_QGROUP_FLUSHING, &amp;root-&gt;state);</div><div class='ctx'> 	wake_up(&amp;root-&gt;qgroup_flush_wait);</div><div class='hunk'>@@ -3611,8 +4187,8 @@ static int qgroup_reserve_data(struct btrfs_inode *inode,</div><div class='ctx'> 	u64 to_reserve;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (!test_bit(BTRFS_FS_QUOTA_ENABLED, &amp;root-&gt;fs_info-&gt;flags) ||</div><div class='del'>-	    !is_fstree(root-&gt;root_key.objectid) || len == 0)</div><div class='add'>+	if (btrfs_qgroup_mode(root-&gt;fs_info) == BTRFS_QGROUP_MODE_DISABLED ||</div><div class='add'>+	    !btrfs_is_fstree(btrfs_root_id(root)) || len == 0)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/* @reserved parameter is mandatory for qgroup */</div><div class='hunk'>@@ -3627,8 +4203,9 @@ static int qgroup_reserve_data(struct btrfs_inode *inode,</div><div class='ctx'> 	reserved = *reserved_ret;</div><div class='ctx'> 	/* Record already reserved space */</div><div class='ctx'> 	orig_reserved = reserved-&gt;bytes_changed;</div><div class='del'>-	ret = set_record_extent_bits(&amp;inode-&gt;io_tree, start,</div><div class='del'>-			start + len -1, EXTENT_QGROUP_RESERVED, reserved);</div><div class='add'>+	ret = btrfs_set_record_extent_bits(&amp;inode-&gt;io_tree, start,</div><div class='add'>+					   start + len - 1, EXTENT_QGROUP_RESERVED,</div><div class='add'>+					   reserved);</div><div class='ctx'> </div><div class='ctx'> 	/* Newly reserved space */</div><div class='ctx'> 	to_reserve = reserved-&gt;bytes_changed - orig_reserved;</div><div class='hunk'>@@ -3682,13 +4259,14 @@ int btrfs_qgroup_reserve_data(struct btrfs_inode *inode,</div><div class='ctx'> </div><div class='ctx'> /* Free ranges specified by @reserved, normally in error path */</div><div class='ctx'> static int qgroup_free_reserved_data(struct btrfs_inode *inode,</div><div class='del'>-			struct extent_changeset *reserved, u64 start, u64 len)</div><div class='add'>+				     struct extent_changeset *reserved,</div><div class='add'>+				     u64 start, u64 len, u64 *freed_ret)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	struct ulist_node *unode;</div><div class='ctx'> 	struct ulist_iterator uiter;</div><div class='ctx'> 	struct extent_changeset changeset;</div><div class='del'>-	int freed = 0;</div><div class='add'>+	u64 freed = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	extent_changeset_init(&amp;changeset);</div><div class='hunk'>@@ -3720,16 +4298,19 @@ static int qgroup_free_reserved_data(struct btrfs_inode *inode,</div><div class='ctx'> 		 * EXTENT_QGROUP_RESERVED, we won't double free.</div><div class='ctx'> 		 * So not need to rush.</div><div class='ctx'> 		 */</div><div class='del'>-		ret = clear_record_extent_bits(&amp;inode-&gt;io_tree, free_start,</div><div class='del'>-				free_start + free_len - 1,</div><div class='del'>-				EXTENT_QGROUP_RESERVED, &amp;changeset);</div><div class='add'>+		ret = btrfs_clear_record_extent_bits(&amp;inode-&gt;io_tree, free_start,</div><div class='add'>+						     free_start + free_len - 1,</div><div class='add'>+						     EXTENT_QGROUP_RESERVED,</div><div class='add'>+						     &amp;changeset);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		freed += changeset.bytes_changed;</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_qgroup_free_refroot(root-&gt;fs_info, root-&gt;root_key.objectid, freed,</div><div class='add'>+	btrfs_qgroup_free_refroot(root-&gt;fs_info, btrfs_root_id(root), freed,</div><div class='ctx'> 				  BTRFS_QGROUP_RSV_DATA);</div><div class='del'>-	ret = freed;</div><div class='add'>+	if (freed_ret)</div><div class='add'>+		*freed_ret = freed;</div><div class='add'>+	ret = 0;</div><div class='ctx'> out:</div><div class='ctx'> 	extent_changeset_release(&amp;changeset);</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -3737,22 +4318,25 @@ out:</div><div class='ctx'> </div><div class='ctx'> static int __btrfs_qgroup_release_data(struct btrfs_inode *inode,</div><div class='ctx'> 			struct extent_changeset *reserved, u64 start, u64 len,</div><div class='del'>-			int free)</div><div class='add'>+			u64 *released, int free)</div><div class='ctx'> {</div><div class='ctx'> 	struct extent_changeset changeset;</div><div class='ctx'> 	int trace_op = QGROUP_RELEASE;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (!test_bit(BTRFS_FS_QUOTA_ENABLED, &amp;inode-&gt;root-&gt;fs_info-&gt;flags))</div><div class='del'>-		return 0;</div><div class='add'>+	if (btrfs_qgroup_mode(inode-&gt;root-&gt;fs_info) == BTRFS_QGROUP_MODE_DISABLED) {</div><div class='add'>+		return btrfs_clear_record_extent_bits(&amp;inode-&gt;io_tree, start,</div><div class='add'>+						      start + len - 1,</div><div class='add'>+						      EXTENT_QGROUP_RESERVED, NULL);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* In release case, we shouldn't have @reserved */</div><div class='ctx'> 	WARN_ON(!free &amp;&amp; reserved);</div><div class='ctx'> 	if (free &amp;&amp; reserved)</div><div class='del'>-		return qgroup_free_reserved_data(inode, reserved, start, len);</div><div class='add'>+		return qgroup_free_reserved_data(inode, reserved, start, len, released);</div><div class='ctx'> 	extent_changeset_init(&amp;changeset);</div><div class='del'>-	ret = clear_record_extent_bits(&amp;inode-&gt;io_tree, start, start + len -1,</div><div class='del'>-				       EXTENT_QGROUP_RESERVED, &amp;changeset);</div><div class='add'>+	ret = btrfs_clear_record_extent_bits(&amp;inode-&gt;io_tree, start, start + len - 1,</div><div class='add'>+					     EXTENT_QGROUP_RESERVED, &amp;changeset);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -3762,9 +4346,10 @@ static int __btrfs_qgroup_release_data(struct btrfs_inode *inode,</div><div class='ctx'> 					changeset.bytes_changed, trace_op);</div><div class='ctx'> 	if (free)</div><div class='ctx'> 		btrfs_qgroup_free_refroot(inode-&gt;root-&gt;fs_info,</div><div class='del'>-				inode-&gt;root-&gt;root_key.objectid,</div><div class='add'>+				btrfs_root_id(inode-&gt;root),</div><div class='ctx'> 				changeset.bytes_changed, BTRFS_QGROUP_RSV_DATA);</div><div class='del'>-	ret = changeset.bytes_changed;</div><div class='add'>+	if (released)</div><div class='add'>+		*released = changeset.bytes_changed;</div><div class='ctx'> out:</div><div class='ctx'> 	extent_changeset_release(&amp;changeset);</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -3783,9 +4368,10 @@ out:</div><div class='ctx'>  * NOTE: This function may sleep for memory allocation.</div><div class='ctx'>  */</div><div class='ctx'> int btrfs_qgroup_free_data(struct btrfs_inode *inode,</div><div class='del'>-			struct extent_changeset *reserved, u64 start, u64 len)</div><div class='add'>+			   struct extent_changeset *reserved,</div><div class='add'>+			   u64 start, u64 len, u64 *freed)</div><div class='ctx'> {</div><div class='del'>-	return __btrfs_qgroup_release_data(inode, reserved, start, len, 1);</div><div class='add'>+	return __btrfs_qgroup_release_data(inode, reserved, start, len, freed, 1);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -3803,9 +4389,9 @@ int btrfs_qgroup_free_data(struct btrfs_inode *inode,</div><div class='ctx'>  *</div><div class='ctx'>  * NOTE: This function may sleep for memory allocation.</div><div class='ctx'>  */</div><div class='del'>-int btrfs_qgroup_release_data(struct btrfs_inode *inode, u64 start, u64 len)</div><div class='add'>+int btrfs_qgroup_release_data(struct btrfs_inode *inode, u64 start, u64 len, u64 *released)</div><div class='ctx'> {</div><div class='del'>-	return __btrfs_qgroup_release_data(inode, NULL, start, len, 0);</div><div class='add'>+	return __btrfs_qgroup_release_data(inode, NULL, start, len, released, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void add_root_meta_rsv(struct btrfs_root *root, int num_bytes,</div><div class='hunk'>@@ -3854,12 +4440,12 @@ int btrfs_qgroup_reserve_meta(struct btrfs_root *root, int num_bytes,</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (!test_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags) ||</div><div class='del'>-	    !is_fstree(root-&gt;root_key.objectid) || num_bytes == 0)</div><div class='add'>+	if (btrfs_qgroup_mode(fs_info) == BTRFS_QGROUP_MODE_DISABLED ||</div><div class='add'>+	    !btrfs_is_fstree(btrfs_root_id(root)) || num_bytes == 0)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(num_bytes != round_down(num_bytes, fs_info-&gt;nodesize));</div><div class='del'>-	trace_qgroup_meta_reserve(root, (s64)num_bytes, type);</div><div class='add'>+	trace_btrfs_qgroup_meta_reserve(root, (s64)num_bytes, type);</div><div class='ctx'> 	ret = qgroup_reserve(root, num_bytes, enforce, type);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -3876,12 +4462,13 @@ int btrfs_qgroup_reserve_meta(struct btrfs_root *root, int num_bytes,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int __btrfs_qgroup_reserve_meta(struct btrfs_root *root, int num_bytes,</div><div class='del'>-				enum btrfs_qgroup_rsv_type type, bool enforce)</div><div class='add'>+				enum btrfs_qgroup_rsv_type type, bool enforce,</div><div class='add'>+				bool noflush)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_qgroup_reserve_meta(root, num_bytes, type, enforce);</div><div class='del'>-	if (ret &lt;= 0 &amp;&amp; ret != -EDQUOT)</div><div class='add'>+	if ((ret &lt;= 0 &amp;&amp; ret != -EDQUOT) || noflush)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='ctx'> 	ret = try_flush_qgroup(root);</div><div class='hunk'>@@ -3890,18 +4477,22 @@ int __btrfs_qgroup_reserve_meta(struct btrfs_root *root, int num_bytes,</div><div class='ctx'> 	return btrfs_qgroup_reserve_meta(root, num_bytes, type, enforce);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Per-transaction meta reservation should be all freed at transaction commit</div><div class='add'>+ * time</div><div class='add'>+ */</div><div class='ctx'> void btrfs_qgroup_free_meta_all_pertrans(struct btrfs_root *root)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> </div><div class='del'>-	if (!test_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags) ||</div><div class='del'>-	    !is_fstree(root-&gt;root_key.objectid))</div><div class='add'>+	if (btrfs_qgroup_mode(fs_info) == BTRFS_QGROUP_MODE_DISABLED ||</div><div class='add'>+	    !btrfs_is_fstree(btrfs_root_id(root)))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	/* TODO: Update trace point to handle such free */</div><div class='del'>-	trace_qgroup_meta_free_all_pertrans(root);</div><div class='add'>+	trace_btrfs_qgroup_meta_free_all_pertrans(root);</div><div class='ctx'> 	/* Special value -1 means to free all reserved space */</div><div class='del'>-	btrfs_qgroup_free_refroot(fs_info, root-&gt;root_key.objectid, (u64)-1,</div><div class='add'>+	btrfs_qgroup_free_refroot(fs_info, btrfs_root_id(root), (u64)-1,</div><div class='ctx'> 				  BTRFS_QGROUP_RSV_META_PERTRANS);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3910,8 +4501,8 @@ void __btrfs_qgroup_free_meta(struct btrfs_root *root, int num_bytes,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> </div><div class='del'>-	if (!test_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags) ||</div><div class='del'>-	    !is_fstree(root-&gt;root_key.objectid))</div><div class='add'>+	if (btrfs_qgroup_mode(fs_info) == BTRFS_QGROUP_MODE_DISABLED ||</div><div class='add'>+	    !btrfs_is_fstree(btrfs_root_id(root)))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -3921,18 +4512,15 @@ void __btrfs_qgroup_free_meta(struct btrfs_root *root, int num_bytes,</div><div class='ctx'> 	 */</div><div class='ctx'> 	num_bytes = sub_root_meta_rsv(root, num_bytes, type);</div><div class='ctx'> 	BUG_ON(num_bytes != round_down(num_bytes, fs_info-&gt;nodesize));</div><div class='del'>-	trace_qgroup_meta_reserve(root, -(s64)num_bytes, type);</div><div class='del'>-	btrfs_qgroup_free_refroot(fs_info, root-&gt;root_key.objectid,</div><div class='del'>-				  num_bytes, type);</div><div class='add'>+	trace_btrfs_qgroup_meta_reserve(root, -(s64)num_bytes, type);</div><div class='add'>+	btrfs_qgroup_free_refroot(fs_info, btrfs_root_id(root), num_bytes, type);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void qgroup_convert_meta(struct btrfs_fs_info *fs_info, u64 ref_root,</div><div class='ctx'> 				int num_bytes)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_qgroup *qgroup;</div><div class='del'>-	struct ulist_node *unode;</div><div class='del'>-	struct ulist_iterator uiter;</div><div class='del'>-	int ret = 0;</div><div class='add'>+	LIST_HEAD(qgroup_list);</div><div class='ctx'> </div><div class='ctx'> 	if (num_bytes == 0)</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -3943,46 +4531,45 @@ static void qgroup_convert_meta(struct btrfs_fs_info *fs_info, u64 ref_root,</div><div class='ctx'> 	qgroup = find_qgroup_rb(fs_info, ref_root);</div><div class='ctx'> 	if (!qgroup)</div><div class='ctx'> 		goto out;</div><div class='del'>-	ulist_reinit(fs_info-&gt;qgroup_ulist);</div><div class='del'>-	ret = ulist_add(fs_info-&gt;qgroup_ulist, qgroup-&gt;qgroupid,</div><div class='del'>-		       qgroup_to_aux(qgroup), GFP_ATOMIC);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-	ULIST_ITER_INIT(&amp;uiter);</div><div class='del'>-	while ((unode = ulist_next(fs_info-&gt;qgroup_ulist, &amp;uiter))) {</div><div class='del'>-		struct btrfs_qgroup *qg;</div><div class='del'>-		struct btrfs_qgroup_list *glist;</div><div class='ctx'> </div><div class='del'>-		qg = unode_aux_to_qgroup(unode);</div><div class='add'>+	qgroup_iterator_add(&amp;qgroup_list, qgroup);</div><div class='add'>+	list_for_each_entry(qgroup, &amp;qgroup_list, iterator) {</div><div class='add'>+		struct btrfs_qgroup_list *glist;</div><div class='ctx'> </div><div class='del'>-		qgroup_rsv_release(fs_info, qg, num_bytes,</div><div class='add'>+		qgroup_rsv_release(fs_info, qgroup, num_bytes,</div><div class='ctx'> 				BTRFS_QGROUP_RSV_META_PREALLOC);</div><div class='del'>-		qgroup_rsv_add(fs_info, qg, num_bytes,</div><div class='del'>-				BTRFS_QGROUP_RSV_META_PERTRANS);</div><div class='del'>-		list_for_each_entry(glist, &amp;qg-&gt;groups, next_group) {</div><div class='del'>-			ret = ulist_add(fs_info-&gt;qgroup_ulist,</div><div class='del'>-					glist-&gt;group-&gt;qgroupid,</div><div class='del'>-					qgroup_to_aux(glist-&gt;group), GFP_ATOMIC);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto out;</div><div class='del'>-		}</div><div class='add'>+		if (!sb_rdonly(fs_info-&gt;sb))</div><div class='add'>+			qgroup_rsv_add(fs_info, qgroup, num_bytes,</div><div class='add'>+				       BTRFS_QGROUP_RSV_META_PERTRANS);</div><div class='add'>+</div><div class='add'>+		list_for_each_entry(glist, &amp;qgroup-&gt;groups, next_group)</div><div class='add'>+			qgroup_iterator_add(&amp;qgroup_list, glist-&gt;group);</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='add'>+	qgroup_iterator_clean(&amp;qgroup_list);</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;qgroup_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Convert @num_bytes of META_PREALLOCATED reservation to META_PERTRANS.</div><div class='add'>+ *</div><div class='add'>+ * This is called when preallocated meta reservation needs to be used.</div><div class='add'>+ * Normally after btrfs_join_transaction() call.</div><div class='add'>+ */</div><div class='ctx'> void btrfs_qgroup_convert_reserved_meta(struct btrfs_root *root, int num_bytes)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> </div><div class='del'>-	if (!test_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags) ||</div><div class='del'>-	    !is_fstree(root-&gt;root_key.objectid))</div><div class='add'>+	if (btrfs_qgroup_mode(fs_info) == BTRFS_QGROUP_MODE_DISABLED ||</div><div class='add'>+	    !btrfs_is_fstree(btrfs_root_id(root)))</div><div class='ctx'> 		return;</div><div class='ctx'> 	/* Same as btrfs_qgroup_free_meta_prealloc() */</div><div class='ctx'> 	num_bytes = sub_root_meta_rsv(root, num_bytes,</div><div class='ctx'> 				      BTRFS_QGROUP_RSV_META_PREALLOC);</div><div class='del'>-	trace_qgroup_meta_convert(root, num_bytes);</div><div class='del'>-	qgroup_convert_meta(fs_info, root-&gt;root_key.objectid, num_bytes);</div><div class='add'>+	trace_btrfs_qgroup_meta_convert(root, num_bytes);</div><div class='add'>+	qgroup_convert_meta(fs_info, btrfs_root_id(root), num_bytes);</div><div class='add'>+	if (!sb_rdonly(fs_info-&gt;sb))</div><div class='add'>+		add_root_meta_rsv(root, num_bytes, BTRFS_QGROUP_RSV_META_PERTRANS);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -3997,8 +4584,8 @@ void btrfs_qgroup_check_reserved_leak(struct btrfs_inode *inode)</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	extent_changeset_init(&amp;changeset);</div><div class='del'>-	ret = clear_record_extent_bits(&amp;inode-&gt;io_tree, 0, (u64)-1,</div><div class='del'>-			EXTENT_QGROUP_RESERVED, &amp;changeset);</div><div class='add'>+	ret = btrfs_clear_record_extent_bits(&amp;inode-&gt;io_tree, 0, (u64)-1,</div><div class='add'>+					     EXTENT_QGROUP_RESERVED, &amp;changeset);</div><div class='ctx'> </div><div class='ctx'> 	WARN_ON(ret &lt; 0);</div><div class='ctx'> 	if (WARN_ON(changeset.bytes_changed)) {</div><div class='hunk'>@@ -4009,7 +4596,7 @@ void btrfs_qgroup_check_reserved_leak(struct btrfs_inode *inode)</div><div class='ctx'> 				btrfs_ino(inode), unode-&gt;val, unode-&gt;aux);</div><div class='ctx'> 		}</div><div class='ctx'> 		btrfs_qgroup_free_refroot(inode-&gt;root-&gt;fs_info,</div><div class='del'>-				inode-&gt;root-&gt;root_key.objectid,</div><div class='add'>+				btrfs_root_id(inode-&gt;root),</div><div class='ctx'> 				changeset.bytes_changed, BTRFS_QGROUP_RSV_DATA);</div><div class='ctx'> </div><div class='ctx'> 	}</div><div class='hunk'>@@ -4058,6 +4645,28 @@ out:</div><div class='ctx'> 	spin_unlock(&amp;swapped_blocks-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int qgroup_swapped_block_bytenr_key_cmp(const void *key, const struct rb_node *node)</div><div class='add'>+{</div><div class='add'>+	const u64 *bytenr = key;</div><div class='add'>+	const struct btrfs_qgroup_swapped_block *block = rb_entry(node,</div><div class='add'>+					  struct btrfs_qgroup_swapped_block, node);</div><div class='add'>+</div><div class='add'>+	if (block-&gt;subvol_bytenr &lt; *bytenr)</div><div class='add'>+		return -1;</div><div class='add'>+	else if (block-&gt;subvol_bytenr &gt; *bytenr)</div><div class='add'>+		return 1;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int qgroup_swapped_block_bytenr_cmp(struct rb_node *new, const struct rb_node *existing)</div><div class='add'>+{</div><div class='add'>+	const struct btrfs_qgroup_swapped_block *new_block = rb_entry(new,</div><div class='add'>+					      struct btrfs_qgroup_swapped_block, node);</div><div class='add'>+</div><div class='add'>+	return qgroup_swapped_block_bytenr_key_cmp(&amp;new_block-&gt;subvol_bytenr, existing);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Add subtree roots record into @subvol_root.</div><div class='ctx'>  *</div><div class='hunk'>@@ -4068,8 +4677,7 @@ out:</div><div class='ctx'>  *			BOTH POINTERS ARE BEFORE TREE SWAP</div><div class='ctx'>  * @last_snapshot:	last snapshot generation of the subvolume tree</div><div class='ctx'>  */</div><div class='del'>-int btrfs_qgroup_add_swapped_blocks(struct btrfs_trans_handle *trans,</div><div class='del'>-		struct btrfs_root *subvol_root,</div><div class='add'>+int btrfs_qgroup_add_swapped_blocks(struct btrfs_root *subvol_root,</div><div class='ctx'> 		struct btrfs_block_group *bg,</div><div class='ctx'> 		struct extent_buffer *subvol_parent, int subvol_slot,</div><div class='ctx'> 		struct extent_buffer *reloc_parent, int reloc_slot,</div><div class='hunk'>@@ -4078,16 +4686,15 @@ int btrfs_qgroup_add_swapped_blocks(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = subvol_root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_qgroup_swapped_blocks *blocks = &amp;subvol_root-&gt;swapped_blocks;</div><div class='ctx'> 	struct btrfs_qgroup_swapped_block *block;</div><div class='del'>-	struct rb_node **cur;</div><div class='del'>-	struct rb_node *parent = NULL;</div><div class='add'>+	struct rb_node *node;</div><div class='ctx'> 	int level = btrfs_header_level(subvol_parent) - 1;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	if (!test_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags))</div><div class='add'>+	if (!btrfs_qgroup_full_accounting(fs_info))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	if (btrfs_node_ptr_generation(subvol_parent, subvol_slot) &gt;</div><div class='del'>-	    btrfs_node_ptr_generation(reloc_parent, reloc_slot)) {</div><div class='add'>+	if (unlikely(btrfs_node_ptr_generation(subvol_parent, subvol_slot) &gt;</div><div class='add'>+		     btrfs_node_ptr_generation(reloc_parent, reloc_slot))) {</div><div class='ctx'> 		btrfs_err_rl(fs_info,</div><div class='ctx'> 		"%s: bad parameter order, subvol_gen=%llu reloc_gen=%llu",</div><div class='ctx'> 			__func__,</div><div class='hunk'>@@ -4128,47 +4735,32 @@ int btrfs_qgroup_add_swapped_blocks(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	/* Insert @block into @blocks */</div><div class='ctx'> 	spin_lock(&amp;blocks-&gt;lock);</div><div class='del'>-	cur = &amp;blocks-&gt;blocks[level].rb_node;</div><div class='del'>-	while (*cur) {</div><div class='add'>+	node = rb_find_add(&amp;block-&gt;node, &amp;blocks-&gt;blocks[level], qgroup_swapped_block_bytenr_cmp);</div><div class='add'>+	if (node) {</div><div class='ctx'> 		struct btrfs_qgroup_swapped_block *entry;</div><div class='ctx'> </div><div class='del'>-		parent = *cur;</div><div class='del'>-		entry = rb_entry(parent, struct btrfs_qgroup_swapped_block,</div><div class='del'>-				 node);</div><div class='add'>+		entry = rb_entry(node, struct btrfs_qgroup_swapped_block, node);</div><div class='ctx'> </div><div class='del'>-		if (entry-&gt;subvol_bytenr &lt; block-&gt;subvol_bytenr) {</div><div class='del'>-			cur = &amp;(*cur)-&gt;rb_left;</div><div class='del'>-		} else if (entry-&gt;subvol_bytenr &gt; block-&gt;subvol_bytenr) {</div><div class='del'>-			cur = &amp;(*cur)-&gt;rb_right;</div><div class='del'>-		} else {</div><div class='del'>-			if (entry-&gt;subvol_generation !=</div><div class='del'>-					block-&gt;subvol_generation ||</div><div class='del'>-			    entry-&gt;reloc_bytenr != block-&gt;reloc_bytenr ||</div><div class='del'>-			    entry-&gt;reloc_generation !=</div><div class='del'>-					block-&gt;reloc_generation) {</div><div class='del'>-				/*</div><div class='del'>-				 * Duplicated but mismatch entry found.</div><div class='del'>-				 * Shouldn't happen.</div><div class='del'>-				 *</div><div class='del'>-				 * Marking qgroup inconsistent should be enough</div><div class='del'>-				 * for end users.</div><div class='del'>-				 */</div><div class='del'>-				WARN_ON(IS_ENABLED(CONFIG_BTRFS_DEBUG));</div><div class='del'>-				ret = -EEXIST;</div><div class='del'>-			}</div><div class='del'>-			kfree(block);</div><div class='del'>-			goto out_unlock;</div><div class='add'>+		if (entry-&gt;subvol_generation != block-&gt;subvol_generation ||</div><div class='add'>+		    entry-&gt;reloc_bytenr != block-&gt;reloc_bytenr ||</div><div class='add'>+		    entry-&gt;reloc_generation != block-&gt;reloc_generation) {</div><div class='add'>+			/*</div><div class='add'>+			 * Duplicated but mismatch entry found.  Shouldn't happen.</div><div class='add'>+			 * Marking qgroup inconsistent should be enough for end</div><div class='add'>+			 * users.</div><div class='add'>+			 */</div><div class='add'>+			DEBUG_WARN("duplicated but mismatched entry found");</div><div class='add'>+			ret = -EEXIST;</div><div class='ctx'> 		}</div><div class='add'>+		kfree(block);</div><div class='add'>+		goto out_unlock;</div><div class='ctx'> 	}</div><div class='del'>-	rb_link_node(&amp;block-&gt;node, parent, cur);</div><div class='del'>-	rb_insert_color(&amp;block-&gt;node, &amp;blocks-&gt;blocks[level]);</div><div class='ctx'> 	blocks-&gt;swapped = true;</div><div class='ctx'> out_unlock:</div><div class='ctx'> 	spin_unlock(&amp;blocks-&gt;lock);</div><div class='ctx'> out:</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		fs_info-&gt;qgroup_flags |=</div><div class='del'>-			BTRFS_QGROUP_STATUS_FLAG_INCONSISTENT;</div><div class='add'>+		qgroup_mark_inconsistent(fs_info, "%s error: %d", __func__, ret);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -4183,19 +4775,19 @@ int btrfs_qgroup_trace_subtree_after_cow(struct btrfs_trans_handle *trans,</div><div class='ctx'> 					 struct extent_buffer *subvol_eb)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+	struct btrfs_tree_parent_check check = { 0 };</div><div class='ctx'> 	struct btrfs_qgroup_swapped_blocks *blocks = &amp;root-&gt;swapped_blocks;</div><div class='del'>-	struct btrfs_qgroup_swapped_block *block;</div><div class='add'>+	struct btrfs_qgroup_swapped_block AUTO_KFREE(block);</div><div class='ctx'> 	struct extent_buffer *reloc_eb = NULL;</div><div class='ctx'> 	struct rb_node *node;</div><div class='del'>-	bool found = false;</div><div class='ctx'> 	bool swapped = false;</div><div class='ctx'> 	int level = btrfs_header_level(subvol_eb);</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	if (!test_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags))</div><div class='add'>+	if (!btrfs_qgroup_full_accounting(fs_info))</div><div class='ctx'> 		return 0;</div><div class='del'>-	if (!is_fstree(root-&gt;root_key.objectid) || !root-&gt;reloc_root)</div><div class='add'>+	if (!btrfs_is_fstree(btrfs_root_id(root)) || !root-&gt;reloc_root)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;blocks-&gt;lock);</div><div class='hunk'>@@ -4203,23 +4795,14 @@ int btrfs_qgroup_trace_subtree_after_cow(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		spin_unlock(&amp;blocks-&gt;lock);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='del'>-	node = blocks-&gt;blocks[level].rb_node;</div><div class='del'>-</div><div class='del'>-	while (node) {</div><div class='del'>-		block = rb_entry(node, struct btrfs_qgroup_swapped_block, node);</div><div class='del'>-		if (block-&gt;subvol_bytenr &lt; subvol_eb-&gt;start) {</div><div class='del'>-			node = node-&gt;rb_left;</div><div class='del'>-		} else if (block-&gt;subvol_bytenr &gt; subvol_eb-&gt;start) {</div><div class='del'>-			node = node-&gt;rb_right;</div><div class='del'>-		} else {</div><div class='del'>-			found = true;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	if (!found) {</div><div class='add'>+	node = rb_find(&amp;subvol_eb-&gt;start, &amp;blocks-&gt;blocks[level],</div><div class='add'>+			qgroup_swapped_block_bytenr_key_cmp);</div><div class='add'>+	if (!node) {</div><div class='ctx'> 		spin_unlock(&amp;blocks-&gt;lock);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='add'>+	block = rb_entry(node, struct btrfs_qgroup_swapped_block, node);</div><div class='add'>+</div><div class='ctx'> 	/* Found one, remove it from @blocks first and update blocks-&gt;swapped */</div><div class='ctx'> 	rb_erase(&amp;block-&gt;node, &amp;blocks-&gt;blocks[level]);</div><div class='ctx'> 	for (i = 0; i &lt; BTRFS_MAX_LEVEL; i++) {</div><div class='hunk'>@@ -4231,16 +4814,19 @@ int btrfs_qgroup_trace_subtree_after_cow(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	blocks-&gt;swapped = swapped;</div><div class='ctx'> 	spin_unlock(&amp;blocks-&gt;lock);</div><div class='ctx'> </div><div class='add'>+	check.level = block-&gt;level;</div><div class='add'>+	check.transid = block-&gt;reloc_generation;</div><div class='add'>+	check.has_first_key = true;</div><div class='add'>+	memcpy(&amp;check.first_key, &amp;block-&gt;first_key, sizeof(check.first_key));</div><div class='add'>+</div><div class='ctx'> 	/* Read out reloc subtree root */</div><div class='del'>-	reloc_eb = read_tree_block(fs_info, block-&gt;reloc_bytenr, 0,</div><div class='del'>-				   block-&gt;reloc_generation, block-&gt;level,</div><div class='del'>-				   &amp;block-&gt;first_key);</div><div class='add'>+	reloc_eb = read_tree_block(fs_info, block-&gt;reloc_bytenr, &amp;check);</div><div class='ctx'> 	if (IS_ERR(reloc_eb)) {</div><div class='ctx'> 		ret = PTR_ERR(reloc_eb);</div><div class='ctx'> 		reloc_eb = NULL;</div><div class='ctx'> 		goto free_out;</div><div class='ctx'> 	}</div><div class='del'>-	if (!extent_buffer_uptodate(reloc_eb)) {</div><div class='add'>+	if (unlikely(!extent_buffer_uptodate(reloc_eb))) {</div><div class='ctx'> 		ret = -EIO;</div><div class='ctx'> 		goto free_out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -4248,14 +4834,12 @@ int btrfs_qgroup_trace_subtree_after_cow(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	ret = qgroup_trace_subtree_swap(trans, reloc_eb, subvol_eb,</div><div class='ctx'> 			block-&gt;last_snapshot, block-&gt;trace_leaf);</div><div class='ctx'> free_out:</div><div class='del'>-	kfree(block);</div><div class='ctx'> 	free_extent_buffer(reloc_eb);</div><div class='ctx'> out:</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='del'>-		btrfs_err_rl(fs_info,</div><div class='del'>-			     "failed to account subtree at bytenr %llu: %d",</div><div class='del'>-			     subvol_eb-&gt;start, ret);</div><div class='del'>-		fs_info-&gt;qgroup_flags |= BTRFS_QGROUP_STATUS_FLAG_INCONSISTENT;</div><div class='add'>+		qgroup_mark_inconsistent(fs_info,</div><div class='add'>+				"failed to account subtree at bytenr %llu: %d",</div><div class='add'>+				subvol_eb-&gt;start, ret);</div><div class='ctx'> 	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -4263,12 +4847,58 @@ out:</div><div class='ctx'> void btrfs_qgroup_destroy_extent_records(struct btrfs_transaction *trans)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_qgroup_extent_record *entry;</div><div class='del'>-	struct btrfs_qgroup_extent_record *next;</div><div class='del'>-	struct rb_root *root;</div><div class='add'>+	unsigned long index;</div><div class='ctx'> </div><div class='del'>-	root = &amp;trans-&gt;delayed_refs.dirty_extent_root;</div><div class='del'>-	rbtree_postorder_for_each_entry_safe(entry, next, root, node) {</div><div class='add'>+	xa_for_each(&amp;trans-&gt;delayed_refs.dirty_extents, index, entry) {</div><div class='ctx'> 		ulist_free(entry-&gt;old_roots);</div><div class='ctx'> 		kfree(entry);</div><div class='ctx'> 	}</div><div class='add'>+	xa_destroy(&amp;trans-&gt;delayed_refs.dirty_extents);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_record_squota_delta(struct btrfs_fs_info *fs_info,</div><div class='add'>+			      const struct btrfs_squota_delta *delta)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+	struct btrfs_qgroup *qgroup;</div><div class='add'>+	struct btrfs_qgroup *qg;</div><div class='add'>+	LIST_HEAD(qgroup_list);</div><div class='add'>+	u64 root = delta-&gt;root;</div><div class='add'>+	u64 num_bytes = delta-&gt;num_bytes;</div><div class='add'>+	const int sign = (delta-&gt;is_inc ? 1 : -1);</div><div class='add'>+</div><div class='add'>+	if (btrfs_qgroup_mode(fs_info) != BTRFS_QGROUP_MODE_SIMPLE)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if (!btrfs_is_fstree(root))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/* If the extent predates enabling quotas, don't count it. */</div><div class='add'>+	if (delta-&gt;generation &lt; fs_info-&gt;qgroup_enable_gen)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fs_info-&gt;qgroup_lock);</div><div class='add'>+	qgroup = find_qgroup_rb(fs_info, root);</div><div class='add'>+	if (!qgroup) {</div><div class='add'>+		ret = -ENOENT;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = 0;</div><div class='add'>+	qgroup_iterator_add(&amp;qgroup_list, qgroup);</div><div class='add'>+	list_for_each_entry(qg, &amp;qgroup_list, iterator) {</div><div class='add'>+		struct btrfs_qgroup_list *glist;</div><div class='add'>+</div><div class='add'>+		qg-&gt;excl += num_bytes * sign;</div><div class='add'>+		qg-&gt;rfer += num_bytes * sign;</div><div class='add'>+		qgroup_dirty(fs_info, qg);</div><div class='add'>+</div><div class='add'>+		list_for_each_entry(glist, &amp;qg-&gt;groups, next_group)</div><div class='add'>+			qgroup_iterator_add(&amp;qgroup_list, glist-&gt;group);</div><div class='add'>+	}</div><div class='add'>+	qgroup_iterator_clean(&amp;qgroup_list);</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;qgroup_lock);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/btrfs/qgroup.h b/fs/btrfs/qgroup.h<br/>index 880e9df0dac1..a979fd59a4da 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/qgroup.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/qgroup.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/qgroup.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/qgroup.h</a></div><div class='hunk'>@@ -6,11 +6,25 @@</div><div class='ctx'> #ifndef BTRFS_QGROUP_H</div><div class='ctx'> #define BTRFS_QGROUP_H</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='ctx'> #include &lt;linux/spinlock.h&gt;</div><div class='ctx'> #include &lt;linux/rbtree.h&gt;</div><div class='ctx'> #include &lt;linux/kobject.h&gt;</div><div class='del'>-#include "ulist.h"</div><div class='del'>-#include "delayed-ref.h"</div><div class='add'>+#include &lt;linux/list.h&gt;</div><div class='add'>+#include &lt;uapi/linux/btrfs_tree.h&gt;</div><div class='add'>+</div><div class='add'>+struct extent_buffer;</div><div class='add'>+struct extent_changeset;</div><div class='add'>+struct btrfs_delayed_extent_op;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+struct btrfs_root;</div><div class='add'>+struct btrfs_ioctl_quota_ctl_args;</div><div class='add'>+struct btrfs_trans_handle;</div><div class='add'>+struct btrfs_delayed_ref_root;</div><div class='add'>+struct btrfs_inode;</div><div class='add'>+struct btrfs_transaction;</div><div class='add'>+struct btrfs_block_group;</div><div class='add'>+struct btrfs_qgroup_swapped_blocks;</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Btrfs qgroup overview</div><div class='hunk'>@@ -101,12 +115,27 @@</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * These flags share the flags field of the btrfs_qgroup_status_item with the</div><div class='add'>+ * persisted flags defined in btrfs_tree.h.</div><div class='add'>+ *</div><div class='add'>+ * To minimize the chance of collision with new persisted status flags, these</div><div class='add'>+ * count backwards from the MSB.</div><div class='add'>+ */</div><div class='add'>+#define BTRFS_QGROUP_RUNTIME_FLAG_CANCEL_RESCAN		(1ULL &lt;&lt; 63)</div><div class='add'>+#define BTRFS_QGROUP_RUNTIME_FLAG_NO_ACCOUNTING		(1ULL &lt;&lt; 62)</div><div class='add'>+</div><div class='add'>+#define BTRFS_QGROUP_DROP_SUBTREE_THRES_DEFAULT		(3)</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * Record a dirty extent, and info qgroup to update quota on it</div><div class='del'>- * TODO: Use kmem cache to alloc it.</div><div class='ctx'>  */</div><div class='ctx'> struct btrfs_qgroup_extent_record {</div><div class='del'>-	struct rb_node node;</div><div class='del'>-	u64 bytenr;</div><div class='add'>+	/*</div><div class='add'>+	 * The bytenr of the extent is given by its index in the dirty_extents</div><div class='add'>+	 * xarray of struct btrfs_delayed_ref_root left shifted by</div><div class='add'>+	 * fs_info-&gt;sectorsize_bits.</div><div class='add'>+	 */</div><div class='add'>+</div><div class='ctx'> 	u64 num_bytes;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -216,6 +245,33 @@ struct btrfs_qgroup {</div><div class='ctx'> 	struct list_head groups;  /* groups this group is member of */</div><div class='ctx'> 	struct list_head members; /* groups that are members of this group */</div><div class='ctx'> 	struct list_head dirty;   /* dirty groups */</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * For qgroup iteration usage.</div><div class='add'>+	 *</div><div class='add'>+	 * The iteration list should always be empty until qgroup_iterator_add()</div><div class='add'>+	 * is called.  And should be reset to empty after the iteration is</div><div class='add'>+	 * finished.</div><div class='add'>+	 */</div><div class='add'>+	struct list_head iterator;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * For nested iterator usage.</div><div class='add'>+	 *</div><div class='add'>+	 * Here we support at most one level of nested iterator calls like:</div><div class='add'>+	 *</div><div class='add'>+	 *	LIST_HEAD(all_qgroups);</div><div class='add'>+	 *	{</div><div class='add'>+	 *		LIST_HEAD(local_qgroups);</div><div class='add'>+	 *		qgroup_iterator_add(local_qgroups, qg);</div><div class='add'>+	 *		qgroup_iterator_nested_add(all_qgroups, qg);</div><div class='add'>+	 *		do_some_work(local_qgroups);</div><div class='add'>+	 *		qgroup_iterator_clean(local_qgroups);</div><div class='add'>+	 *	}</div><div class='add'>+	 *	do_some_work(all_qgroups);</div><div class='add'>+	 *	qgroup_iterator_nested_clean(all_qgroups);</div><div class='add'>+	 */</div><div class='add'>+	struct list_head nested_iterator;</div><div class='ctx'> 	struct rb_node node;	  /* tree of qgroups */</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -231,6 +287,27 @@ struct btrfs_qgroup {</div><div class='ctx'> 	struct kobject kobj;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+/* Glue structure to represent the relations between qgroups. */</div><div class='add'>+struct btrfs_qgroup_list {</div><div class='add'>+	struct list_head next_group;</div><div class='add'>+	struct list_head next_member;</div><div class='add'>+	struct btrfs_qgroup *group;</div><div class='add'>+	struct btrfs_qgroup *member;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct btrfs_squota_delta {</div><div class='add'>+	/* The fstree root this delta counts against. */</div><div class='add'>+	u64 root;</div><div class='add'>+	/* The number of bytes in the extent being counted. */</div><div class='add'>+	u64 num_bytes;</div><div class='add'>+	/* The generation the extent was created in. */</div><div class='add'>+	u64 generation;</div><div class='add'>+	/* Whether we are using or freeing the extent. */</div><div class='add'>+	bool is_inc;</div><div class='add'>+	/* Whether the extent is data or metadata. */</div><div class='add'>+	bool is_data;</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> static inline u64 btrfs_qgroup_subvolid(u64 qgroupid)</div><div class='ctx'> {</div><div class='ctx'> 	return (qgroupid &amp; ((1ULL &lt;&lt; BTRFS_QGROUP_LEVEL_SHIFT) - 1));</div><div class='hunk'>@@ -239,102 +316,52 @@ static inline u64 btrfs_qgroup_subvolid(u64 qgroupid)</div><div class='ctx'> /*</div><div class='ctx'>  * For qgroup event trace points only</div><div class='ctx'>  */</div><div class='del'>-#define QGROUP_RESERVE		(1&lt;&lt;0)</div><div class='del'>-#define QGROUP_RELEASE		(1&lt;&lt;1)</div><div class='del'>-#define QGROUP_FREE		(1&lt;&lt;2)</div><div class='add'>+enum {</div><div class='add'>+	ENUM_BIT(QGROUP_RESERVE),</div><div class='add'>+	ENUM_BIT(QGROUP_RELEASE),</div><div class='add'>+	ENUM_BIT(QGROUP_FREE),</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+enum btrfs_qgroup_mode {</div><div class='add'>+	BTRFS_QGROUP_MODE_DISABLED,</div><div class='add'>+	BTRFS_QGROUP_MODE_FULL,</div><div class='add'>+	BTRFS_QGROUP_MODE_SIMPLE</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-int btrfs_quota_enable(struct btrfs_fs_info *fs_info);</div><div class='add'>+enum btrfs_qgroup_mode btrfs_qgroup_mode(const struct btrfs_fs_info *fs_info);</div><div class='add'>+bool btrfs_qgroup_enabled(const struct btrfs_fs_info *fs_info);</div><div class='add'>+bool btrfs_qgroup_full_accounting(const struct btrfs_fs_info *fs_info);</div><div class='add'>+int btrfs_quota_enable(struct btrfs_fs_info *fs_info,</div><div class='add'>+		       struct btrfs_ioctl_quota_ctl_args *quota_ctl_args);</div><div class='ctx'> int btrfs_quota_disable(struct btrfs_fs_info *fs_info);</div><div class='ctx'> int btrfs_qgroup_rescan(struct btrfs_fs_info *fs_info);</div><div class='ctx'> void btrfs_qgroup_rescan_resume(struct btrfs_fs_info *fs_info);</div><div class='ctx'> int btrfs_qgroup_wait_for_completion(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				     bool interruptible);</div><div class='del'>-int btrfs_add_qgroup_relation(struct btrfs_trans_handle *trans, u64 src,</div><div class='del'>-			      u64 dst);</div><div class='add'>+int btrfs_add_qgroup_relation(struct btrfs_trans_handle *trans, u64 src, u64 dst,</div><div class='add'>+			      struct btrfs_qgroup_list *prealloc);</div><div class='ctx'> int btrfs_del_qgroup_relation(struct btrfs_trans_handle *trans, u64 src,</div><div class='ctx'> 			      u64 dst);</div><div class='ctx'> int btrfs_create_qgroup(struct btrfs_trans_handle *trans, u64 qgroupid);</div><div class='ctx'> int btrfs_remove_qgroup(struct btrfs_trans_handle *trans, u64 qgroupid);</div><div class='add'>+int btrfs_qgroup_cleanup_dropped_subvolume(struct btrfs_fs_info *fs_info, u64 subvolid);</div><div class='ctx'> int btrfs_limit_qgroup(struct btrfs_trans_handle *trans, u64 qgroupid,</div><div class='ctx'> 		       struct btrfs_qgroup_limit *limit);</div><div class='ctx'> int btrfs_read_qgroup_config(struct btrfs_fs_info *fs_info);</div><div class='ctx'> void btrfs_free_qgroup_config(struct btrfs_fs_info *fs_info);</div><div class='del'>-struct btrfs_delayed_extent_op;</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Inform qgroup to trace one dirty extent, its info is recorded in @record.</div><div class='del'>- * So qgroup can account it at transaction committing time.</div><div class='del'>- *</div><div class='del'>- * No lock version, caller must acquire delayed ref lock and allocated memory,</div><div class='del'>- * then call btrfs_qgroup_trace_extent_post() after exiting lock context.</div><div class='del'>- *</div><div class='del'>- * Return 0 for success insert</div><div class='del'>- * Return &gt;0 for existing record, caller can free @record safely.</div><div class='del'>- * Error is not possible</div><div class='del'>- */</div><div class='ctx'> int btrfs_qgroup_trace_extent_nolock(</div><div class='ctx'> 		struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		struct btrfs_delayed_ref_root *delayed_refs,</div><div class='del'>-		struct btrfs_qgroup_extent_record *record);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Post handler after qgroup_trace_extent_nolock().</div><div class='del'>- *</div><div class='del'>- * NOTE: Current qgroup does the expensive backref walk at transaction</div><div class='del'>- * committing time with TRANS_STATE_COMMIT_DOING, this blocks incoming</div><div class='del'>- * new transaction.</div><div class='del'>- * This is designed to allow btrfs_find_all_roots() to get correct new_roots</div><div class='del'>- * result.</div><div class='del'>- *</div><div class='del'>- * However for old_roots there is no need to do backref walk at that time,</div><div class='del'>- * since we search commit roots to walk backref and result will always be</div><div class='del'>- * correct.</div><div class='del'>- *</div><div class='del'>- * Due to the nature of no lock version, we can't do backref there.</div><div class='del'>- * So we must call btrfs_qgroup_trace_extent_post() after exiting</div><div class='del'>- * spinlock context.</div><div class='del'>- *</div><div class='del'>- * TODO: If we can fix and prove btrfs_find_all_roots() can get correct result</div><div class='del'>- * using current root, then we can move all expensive backref walk out of</div><div class='del'>- * transaction committing, but not now as qgroup accounting will be wrong again.</div><div class='del'>- */</div><div class='add'>+		struct btrfs_qgroup_extent_record *record,</div><div class='add'>+		u64 bytenr);</div><div class='ctx'> int btrfs_qgroup_trace_extent_post(struct btrfs_trans_handle *trans,</div><div class='del'>-				   struct btrfs_qgroup_extent_record *qrecord);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Inform qgroup to trace one dirty extent, specified by @bytenr and</div><div class='del'>- * @num_bytes.</div><div class='del'>- * So qgroup can account it at commit trans time.</div><div class='del'>- *</div><div class='del'>- * Better encapsulated version, with memory allocation and backref walk for</div><div class='del'>- * commit roots.</div><div class='del'>- * So this can sleep.</div><div class='del'>- *</div><div class='del'>- * Return 0 if the operation is done.</div><div class='del'>- * Return &lt;0 for error, like memory allocation failure or invalid parameter</div><div class='del'>- * (NULL trans)</div><div class='del'>- */</div><div class='add'>+				   struct btrfs_qgroup_extent_record *qrecord,</div><div class='add'>+				   u64 bytenr);</div><div class='ctx'> int btrfs_qgroup_trace_extent(struct btrfs_trans_handle *trans, u64 bytenr,</div><div class='del'>-			      u64 num_bytes, gfp_t gfp_flag);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Inform qgroup to trace all leaf items of data</div><div class='del'>- *</div><div class='del'>- * Return 0 for success</div><div class='del'>- * Return &lt;0 for error(ENOMEM)</div><div class='del'>- */</div><div class='add'>+			      u64 num_bytes);</div><div class='ctx'> int btrfs_qgroup_trace_leaf_items(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				  struct extent_buffer *eb);</div><div class='del'>-/*</div><div class='del'>- * Inform qgroup to trace a whole subtree, including all its child tree</div><div class='del'>- * blocks and data.</div><div class='del'>- * The root tree block is specified by @root_eb.</div><div class='del'>- *</div><div class='del'>- * Normally used by relocation(tree block swap) and subvolume deletion.</div><div class='del'>- *</div><div class='del'>- * Return 0 for success</div><div class='del'>- * Return &lt;0 for error(ENOMEM or tree search error)</div><div class='del'>- */</div><div class='ctx'> int btrfs_qgroup_trace_subtree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			       struct extent_buffer *root_eb,</div><div class='ctx'> 			       u64 root_gen, int root_level);</div><div class='hunk'>@@ -343,40 +370,48 @@ int btrfs_qgroup_account_extent(struct btrfs_trans_handle *trans, u64 bytenr,</div><div class='ctx'> 				struct ulist *new_roots);</div><div class='ctx'> int btrfs_qgroup_account_extents(struct btrfs_trans_handle *trans);</div><div class='ctx'> int btrfs_run_qgroups(struct btrfs_trans_handle *trans);</div><div class='add'>+int btrfs_qgroup_check_inherit(struct btrfs_fs_info *fs_info,</div><div class='add'>+			       struct btrfs_qgroup_inherit *inherit,</div><div class='add'>+			       size_t size);</div><div class='ctx'> int btrfs_qgroup_inherit(struct btrfs_trans_handle *trans, u64 srcid,</div><div class='del'>-			 u64 objectid, struct btrfs_qgroup_inherit *inherit);</div><div class='add'>+			 u64 objectid, u64 inode_rootid,</div><div class='add'>+			 struct btrfs_qgroup_inherit *inherit);</div><div class='ctx'> void btrfs_qgroup_free_refroot(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			       u64 ref_root, u64 num_bytes,</div><div class='ctx'> 			       enum btrfs_qgroup_rsv_type type);</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_BTRFS_FS_RUN_SANITY_TESTS</div><div class='del'>-int btrfs_verify_qgroup_counts(struct btrfs_fs_info *fs_info, u64 qgroupid,</div><div class='add'>+int btrfs_verify_qgroup_counts(const struct btrfs_fs_info *fs_info, u64 qgroupid,</div><div class='ctx'> 			       u64 rfer, u64 excl);</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> /* New io_tree based accurate qgroup reserve API */</div><div class='ctx'> int btrfs_qgroup_reserve_data(struct btrfs_inode *inode,</div><div class='ctx'> 			struct extent_changeset **reserved, u64 start, u64 len);</div><div class='del'>-int btrfs_qgroup_release_data(struct btrfs_inode *inode, u64 start, u64 len);</div><div class='add'>+int btrfs_qgroup_release_data(struct btrfs_inode *inode, u64 start, u64 len, u64 *released);</div><div class='ctx'> int btrfs_qgroup_free_data(struct btrfs_inode *inode,</div><div class='ctx'> 			   struct extent_changeset *reserved, u64 start,</div><div class='del'>-			   u64 len);</div><div class='add'>+			   u64 len, u64 *freed);</div><div class='ctx'> int btrfs_qgroup_reserve_meta(struct btrfs_root *root, int num_bytes,</div><div class='ctx'> 			      enum btrfs_qgroup_rsv_type type, bool enforce);</div><div class='ctx'> int __btrfs_qgroup_reserve_meta(struct btrfs_root *root, int num_bytes,</div><div class='del'>-				enum btrfs_qgroup_rsv_type type, bool enforce);</div><div class='add'>+				enum btrfs_qgroup_rsv_type type, bool enforce,</div><div class='add'>+				bool noflush);</div><div class='ctx'> /* Reserve metadata space for pertrans and prealloc type */</div><div class='ctx'> static inline int btrfs_qgroup_reserve_meta_pertrans(struct btrfs_root *root,</div><div class='ctx'> 				int num_bytes, bool enforce)</div><div class='ctx'> {</div><div class='ctx'> 	return __btrfs_qgroup_reserve_meta(root, num_bytes,</div><div class='del'>-			BTRFS_QGROUP_RSV_META_PERTRANS, enforce);</div><div class='add'>+					   BTRFS_QGROUP_RSV_META_PERTRANS,</div><div class='add'>+					   enforce, false);</div><div class='ctx'> }</div><div class='ctx'> static inline int btrfs_qgroup_reserve_meta_prealloc(struct btrfs_root *root,</div><div class='del'>-				int num_bytes, bool enforce)</div><div class='add'>+						     int num_bytes, bool enforce,</div><div class='add'>+						     bool noflush)</div><div class='ctx'> {</div><div class='ctx'> 	return __btrfs_qgroup_reserve_meta(root, num_bytes,</div><div class='del'>-			BTRFS_QGROUP_RSV_META_PREALLOC, enforce);</div><div class='add'>+					   BTRFS_QGROUP_RSV_META_PREALLOC,</div><div class='add'>+					   enforce, noflush);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void __btrfs_qgroup_free_meta(struct btrfs_root *root, int num_bytes,</div><div class='hunk'>@@ -398,20 +433,8 @@ static inline void btrfs_qgroup_free_meta_prealloc(struct btrfs_root *root,</div><div class='ctx'> 			BTRFS_QGROUP_RSV_META_PREALLOC);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Per-transaction meta reservation should be all freed at transaction commit</div><div class='del'>- * time</div><div class='del'>- */</div><div class='ctx'> void btrfs_qgroup_free_meta_all_pertrans(struct btrfs_root *root);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Convert @num_bytes of META_PREALLOCATED reservation to META_PERTRANS.</div><div class='del'>- *</div><div class='del'>- * This is called when preallocated meta reservation needs to be used.</div><div class='del'>- * Normally after btrfs_join_transaction() call.</div><div class='del'>- */</div><div class='ctx'> void btrfs_qgroup_convert_reserved_meta(struct btrfs_root *root, int num_bytes);</div><div class='del'>-</div><div class='ctx'> void btrfs_qgroup_check_reserved_leak(struct btrfs_inode *inode);</div><div class='ctx'> </div><div class='ctx'> /* btrfs_qgroup_swapped_blocks related functions */</div><div class='hunk'>@@ -419,8 +442,7 @@ void btrfs_qgroup_init_swapped_blocks(</div><div class='ctx'> 	struct btrfs_qgroup_swapped_blocks *swapped_blocks);</div><div class='ctx'> </div><div class='ctx'> void btrfs_qgroup_clean_swapped_blocks(struct btrfs_root *root);</div><div class='del'>-int btrfs_qgroup_add_swapped_blocks(struct btrfs_trans_handle *trans,</div><div class='del'>-		struct btrfs_root *subvol_root,</div><div class='add'>+int btrfs_qgroup_add_swapped_blocks(struct btrfs_root *subvol_root,</div><div class='ctx'> 		struct btrfs_block_group *bg,</div><div class='ctx'> 		struct extent_buffer *subvol_parent, int subvol_slot,</div><div class='ctx'> 		struct extent_buffer *reloc_parent, int reloc_slot,</div><div class='hunk'>@@ -428,6 +450,8 @@ int btrfs_qgroup_add_swapped_blocks(struct btrfs_trans_handle *trans,</div><div class='ctx'> int btrfs_qgroup_trace_subtree_after_cow(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		struct btrfs_root *root, struct extent_buffer *eb);</div><div class='ctx'> void btrfs_qgroup_destroy_extent_records(struct btrfs_transaction *trans);</div><div class='del'>-bool btrfs_check_quota_leak(struct btrfs_fs_info *fs_info);</div><div class='add'>+bool btrfs_check_quota_leak(const struct btrfs_fs_info *fs_info);</div><div class='add'>+int btrfs_record_squota_delta(struct btrfs_fs_info *fs_info,</div><div class='add'>+			      const struct btrfs_squota_delta *delta);</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/btrfs/raid-stripe-tree.c b/fs/btrfs/raid-stripe-tree.c<br/>new file mode 100644<br/>index 000000000000..2987cb7c686e<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/raid-stripe-tree.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/raid-stripe-tree.c</a></div><div class='hunk'>@@ -0,0 +1,470 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+/*</div><div class='add'>+ * Copyright (C) 2023 Western Digital Corporation or its affiliates.</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/btrfs_tree.h&gt;</div><div class='add'>+#include "ctree.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "transaction.h"</div><div class='add'>+#include "disk-io.h"</div><div class='add'>+#include "raid-stripe-tree.h"</div><div class='add'>+#include "volumes.h"</div><div class='add'>+#include "print-tree.h"</div><div class='add'>+</div><div class='add'>+static int btrfs_partially_delete_raid_extent(struct btrfs_trans_handle *trans,</div><div class='add'>+					       struct btrfs_path *path,</div><div class='add'>+					       const struct btrfs_key *oldkey,</div><div class='add'>+					       u64 newlen, u64 frontpad)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_root *stripe_root = trans-&gt;fs_info-&gt;stripe_root;</div><div class='add'>+	struct btrfs_stripe_extent *extent, AUTO_KFREE(newitem);</div><div class='add'>+	struct extent_buffer *leaf;</div><div class='add'>+	int slot;</div><div class='add'>+	size_t item_size;</div><div class='add'>+	struct btrfs_key newkey = {</div><div class='add'>+		.objectid = oldkey-&gt;objectid + frontpad,</div><div class='add'>+		.type = BTRFS_RAID_STRIPE_KEY,</div><div class='add'>+		.offset = newlen,</div><div class='add'>+	};</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ASSERT(newlen &gt; 0);</div><div class='add'>+	ASSERT(oldkey-&gt;type == BTRFS_RAID_STRIPE_KEY);</div><div class='add'>+</div><div class='add'>+	leaf = path-&gt;nodes[0];</div><div class='add'>+	slot = path-&gt;slots[0];</div><div class='add'>+	item_size = btrfs_item_size(leaf, slot);</div><div class='add'>+</div><div class='add'>+	newitem = kzalloc(item_size, GFP_NOFS);</div><div class='add'>+	if (!newitem)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	extent = btrfs_item_ptr(leaf, slot, struct btrfs_stripe_extent);</div><div class='add'>+</div><div class='add'>+	for (int i = 0; i &lt; btrfs_num_raid_stripes(item_size); i++) {</div><div class='add'>+		struct btrfs_raid_stride *stride = &amp;extent-&gt;strides[i];</div><div class='add'>+		u64 phys;</div><div class='add'>+</div><div class='add'>+		phys = btrfs_raid_stride_physical(leaf, stride) + frontpad;</div><div class='add'>+		btrfs_set_stack_raid_stride_physical(&amp;newitem-&gt;strides[i], phys);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_del_item(trans, stripe_root, path);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	btrfs_release_path(path);</div><div class='add'>+	return btrfs_insert_item(trans, stripe_root, &amp;newkey, newitem, item_size);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_delete_raid_extent(struct btrfs_trans_handle *trans, u64 start, u64 length)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='add'>+	struct btrfs_root *stripe_root = fs_info-&gt;stripe_root;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='add'>+	struct btrfs_key key;</div><div class='add'>+	struct extent_buffer *leaf;</div><div class='add'>+	u64 found_start;</div><div class='add'>+	u64 found_end;</div><div class='add'>+	u64 end = start + length;</div><div class='add'>+	int slot;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (!btrfs_fs_incompat(fs_info, RAID_STRIPE_TREE) || !stripe_root)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if (!btrfs_is_testing(fs_info)) {</div><div class='add'>+		struct btrfs_chunk_map *map;</div><div class='add'>+		bool use_rst;</div><div class='add'>+</div><div class='add'>+		map = btrfs_find_chunk_map(fs_info, start, length);</div><div class='add'>+		if (!map)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		use_rst = btrfs_need_stripe_tree_update(fs_info, map-&gt;type);</div><div class='add'>+		btrfs_free_chunk_map(map);</div><div class='add'>+		if (!use_rst)</div><div class='add'>+			return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	path = btrfs_alloc_path();</div><div class='add'>+	if (!path)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	while (1) {</div><div class='add'>+		key.objectid = start;</div><div class='add'>+		key.type = BTRFS_RAID_STRIPE_KEY;</div><div class='add'>+		key.offset = 0;</div><div class='add'>+</div><div class='add'>+		ret = btrfs_search_slot(trans, stripe_root, &amp;key, path, -1, 1);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		if (path-&gt;slots[0] == btrfs_header_nritems(path-&gt;nodes[0]))</div><div class='add'>+			path-&gt;slots[0]--;</div><div class='add'>+</div><div class='add'>+		leaf = path-&gt;nodes[0];</div><div class='add'>+		slot = path-&gt;slots[0];</div><div class='add'>+		btrfs_item_key_to_cpu(leaf, &amp;key, slot);</div><div class='add'>+		found_start = key.objectid;</div><div class='add'>+		found_end = found_start + key.offset;</div><div class='add'>+		ret = 0;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * The stripe extent starts before the range we want to delete,</div><div class='add'>+		 * but the range spans more than one stripe extent:</div><div class='add'>+		 *</div><div class='add'>+		 * |--- RAID Stripe Extent ---||--- RAID Stripe Extent ---|</div><div class='add'>+		 *        |--- keep  ---|--- drop ---|</div><div class='add'>+		 *</div><div class='add'>+		 * This means we have to get the previous item, truncate its</div><div class='add'>+		 * length and then restart the search.</div><div class='add'>+		 */</div><div class='add'>+		if (found_start &gt; start) {</div><div class='add'>+			if (slot == 0) {</div><div class='add'>+				ret = btrfs_previous_item(stripe_root, path, start,</div><div class='add'>+							  BTRFS_RAID_STRIPE_KEY);</div><div class='add'>+				if (ret) {</div><div class='add'>+					if (ret &gt; 0)</div><div class='add'>+						ret = -ENOENT;</div><div class='add'>+					break;</div><div class='add'>+				}</div><div class='add'>+			} else {</div><div class='add'>+				path-&gt;slots[0]--;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			leaf = path-&gt;nodes[0];</div><div class='add'>+			slot = path-&gt;slots[0];</div><div class='add'>+			btrfs_item_key_to_cpu(leaf, &amp;key, slot);</div><div class='add'>+			found_start = key.objectid;</div><div class='add'>+			found_end = found_start + key.offset;</div><div class='add'>+			ASSERT(found_start &lt;= start);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (key.type != BTRFS_RAID_STRIPE_KEY)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		/* That stripe ends before we start, we're done. */</div><div class='add'>+		if (found_end &lt;= start)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		trace_btrfs_raid_extent_delete(fs_info, start, end,</div><div class='add'>+					       found_start, found_end);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * The stripe extent starts before the range we want to delete</div><div class='add'>+		 * and ends after the range we want to delete, i.e. we're</div><div class='add'>+		 * punching a hole in the stripe extent:</div><div class='add'>+		 *</div><div class='add'>+		 *  |--- RAID Stripe Extent ---|</div><div class='add'>+		 *  | keep |--- drop ---| keep |</div><div class='add'>+		 *</div><div class='add'>+		 * This means we need to a) truncate the existing item and b)</div><div class='add'>+		 * create a second item for the remaining range.</div><div class='add'>+		 */</div><div class='add'>+		if (found_start &lt; start &amp;&amp; found_end &gt; end) {</div><div class='add'>+			size_t item_size;</div><div class='add'>+			u64 diff_start = start - found_start;</div><div class='add'>+			u64 diff_end = found_end - end;</div><div class='add'>+			struct btrfs_stripe_extent *extent;</div><div class='add'>+			struct btrfs_key newkey = {</div><div class='add'>+				.objectid = end,</div><div class='add'>+				.type = BTRFS_RAID_STRIPE_KEY,</div><div class='add'>+				.offset = diff_end,</div><div class='add'>+			};</div><div class='add'>+</div><div class='add'>+			/* The "right" item. */</div><div class='add'>+			ret = btrfs_duplicate_item(trans, stripe_root, path, &amp;newkey);</div><div class='add'>+			if (ret)</div><div class='add'>+				break;</div><div class='add'>+</div><div class='add'>+			item_size = btrfs_item_size(leaf, path-&gt;slots[0]);</div><div class='add'>+			extent = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='add'>+						struct btrfs_stripe_extent);</div><div class='add'>+</div><div class='add'>+			for (int i = 0; i &lt; btrfs_num_raid_stripes(item_size); i++) {</div><div class='add'>+				struct btrfs_raid_stride *stride = &amp;extent-&gt;strides[i];</div><div class='add'>+				u64 phys;</div><div class='add'>+</div><div class='add'>+				phys = btrfs_raid_stride_physical(leaf, stride);</div><div class='add'>+				phys += diff_start + length;</div><div class='add'>+				btrfs_set_raid_stride_physical(leaf, stride, phys);</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			/* The "left" item. */</div><div class='add'>+			path-&gt;slots[0]--;</div><div class='add'>+			btrfs_item_key_to_cpu(leaf, &amp;key, path-&gt;slots[0]);</div><div class='add'>+			btrfs_partially_delete_raid_extent(trans, path, &amp;key,</div><div class='add'>+							   diff_start, 0);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * The stripe extent starts before the range we want to delete:</div><div class='add'>+		 *</div><div class='add'>+		 * |--- RAID Stripe Extent ---|</div><div class='add'>+		 * |--- keep  ---|--- drop ---|</div><div class='add'>+		 *</div><div class='add'>+		 * This means we have to duplicate the tree item, truncate the</div><div class='add'>+		 * length to the new size and then re-insert the item.</div><div class='add'>+		 */</div><div class='add'>+		if (found_start &lt; start) {</div><div class='add'>+			u64 diff_start = start - found_start;</div><div class='add'>+</div><div class='add'>+			btrfs_partially_delete_raid_extent(trans, path, &amp;key,</div><div class='add'>+							   diff_start, 0);</div><div class='add'>+</div><div class='add'>+			start += (key.offset - diff_start);</div><div class='add'>+			length -= (key.offset - diff_start);</div><div class='add'>+			if (length == 0)</div><div class='add'>+				break;</div><div class='add'>+</div><div class='add'>+			btrfs_release_path(path);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * The stripe extent ends after the range we want to delete:</div><div class='add'>+		 *</div><div class='add'>+		 * |--- RAID Stripe Extent ---|</div><div class='add'>+		 * |--- drop  ---|--- keep ---|</div><div class='add'>+		 *</div><div class='add'>+		 * This means we have to duplicate the tree item, truncate the</div><div class='add'>+		 * length to the new size and then re-insert the item.</div><div class='add'>+		 */</div><div class='add'>+		if (found_end &gt; end) {</div><div class='add'>+			u64 diff_end = found_end - end;</div><div class='add'>+</div><div class='add'>+			btrfs_partially_delete_raid_extent(trans, path, &amp;key,</div><div class='add'>+							   key.offset - length,</div><div class='add'>+							   length);</div><div class='add'>+			ASSERT(key.offset - diff_end == length);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* Finally we can delete the whole item, no more special cases. */</div><div class='add'>+		ret = btrfs_del_item(trans, stripe_root, path);</div><div class='add'>+		if (ret)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		start += key.offset;</div><div class='add'>+		length -= key.offset;</div><div class='add'>+		if (length == 0)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		btrfs_release_path(path);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int update_raid_extent_item(struct btrfs_trans_handle *trans,</div><div class='add'>+				   struct btrfs_key *key,</div><div class='add'>+				   struct btrfs_stripe_extent *stripe_extent,</div><div class='add'>+				   const size_t item_size)</div><div class='add'>+{</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='add'>+	struct extent_buffer *leaf;</div><div class='add'>+	int ret;</div><div class='add'>+	int slot;</div><div class='add'>+</div><div class='add'>+	path = btrfs_alloc_path();</div><div class='add'>+	if (!path)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_search_slot(trans, trans-&gt;fs_info-&gt;stripe_root, key, path,</div><div class='add'>+				0, 1);</div><div class='add'>+	if (ret)</div><div class='add'>+		return (ret == 1 ? ret : -EINVAL);</div><div class='add'>+</div><div class='add'>+	leaf = path-&gt;nodes[0];</div><div class='add'>+	slot = path-&gt;slots[0];</div><div class='add'>+</div><div class='add'>+	write_extent_buffer(leaf, stripe_extent, btrfs_item_ptr_offset(leaf, slot),</div><div class='add'>+			    item_size);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+EXPORT_FOR_TESTS</div><div class='add'>+int btrfs_insert_one_raid_extent(struct btrfs_trans_handle *trans,</div><div class='add'>+				 struct btrfs_io_context *bioc)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='add'>+	struct btrfs_key stripe_key;</div><div class='add'>+	struct btrfs_root *stripe_root = fs_info-&gt;stripe_root;</div><div class='add'>+	const int num_stripes = btrfs_bg_type_to_factor(bioc-&gt;map_type);</div><div class='add'>+	struct btrfs_stripe_extent AUTO_KFREE(stripe_extent);</div><div class='add'>+	const size_t item_size = struct_size(stripe_extent, strides, num_stripes);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	stripe_extent = kzalloc(item_size, GFP_NOFS);</div><div class='add'>+	if (!unlikely(stripe_extent)) {</div><div class='add'>+		btrfs_abort_transaction(trans, -ENOMEM);</div><div class='add'>+		btrfs_end_transaction(trans);</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	trace_btrfs_insert_one_raid_extent(fs_info, bioc-&gt;logical, bioc-&gt;size,</div><div class='add'>+					   num_stripes);</div><div class='add'>+	for (int i = 0; i &lt; num_stripes; i++) {</div><div class='add'>+		u64 devid = bioc-&gt;stripes[i].dev-&gt;devid;</div><div class='add'>+		u64 physical = bioc-&gt;stripes[i].physical;</div><div class='add'>+		struct btrfs_raid_stride *raid_stride = &amp;stripe_extent-&gt;strides[i];</div><div class='add'>+</div><div class='add'>+		btrfs_set_stack_raid_stride_devid(raid_stride, devid);</div><div class='add'>+		btrfs_set_stack_raid_stride_physical(raid_stride, physical);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	stripe_key.objectid = bioc-&gt;logical;</div><div class='add'>+	stripe_key.type = BTRFS_RAID_STRIPE_KEY;</div><div class='add'>+	stripe_key.offset = bioc-&gt;size;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_insert_item(trans, stripe_root, &amp;stripe_key, stripe_extent,</div><div class='add'>+				item_size);</div><div class='add'>+	if (ret == -EEXIST) {</div><div class='add'>+		ret = update_raid_extent_item(trans, &amp;stripe_key, stripe_extent,</div><div class='add'>+					      item_size);</div><div class='add'>+		if (ret)</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+	} else if (ret) {</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_insert_raid_extent(struct btrfs_trans_handle *trans,</div><div class='add'>+			     struct btrfs_ordered_extent *ordered_extent)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_io_context *bioc;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (!btrfs_fs_incompat(trans-&gt;fs_info, RAID_STRIPE_TREE))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	list_for_each_entry(bioc, &amp;ordered_extent-&gt;bioc_list, rst_ordered_entry) {</div><div class='add'>+		ret = btrfs_insert_one_raid_extent(trans, bioc);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	while (!list_empty(&amp;ordered_extent-&gt;bioc_list)) {</div><div class='add'>+		bioc = list_first_entry(&amp;ordered_extent-&gt;bioc_list,</div><div class='add'>+					typeof(*bioc), rst_ordered_entry);</div><div class='add'>+		list_del(&amp;bioc-&gt;rst_ordered_entry);</div><div class='add'>+		btrfs_put_bioc(bioc);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_get_raid_extent_offset(struct btrfs_fs_info *fs_info,</div><div class='add'>+				 u64 logical, u64 *length, u64 map_type,</div><div class='add'>+				 u32 stripe_index, struct btrfs_io_stripe *stripe)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_root *stripe_root = fs_info-&gt;stripe_root;</div><div class='add'>+	struct btrfs_stripe_extent *stripe_extent;</div><div class='add'>+	struct btrfs_key stripe_key;</div><div class='add'>+	struct btrfs_key found_key;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='add'>+	struct extent_buffer *leaf;</div><div class='add'>+	const u64 end = logical + *length;</div><div class='add'>+	int num_stripes;</div><div class='add'>+	u64 offset;</div><div class='add'>+	u64 found_logical;</div><div class='add'>+	u64 found_length;</div><div class='add'>+	u64 found_end;</div><div class='add'>+	int slot;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	stripe_key.objectid = logical;</div><div class='add'>+	stripe_key.type = BTRFS_RAID_STRIPE_KEY;</div><div class='add'>+	stripe_key.offset = 0;</div><div class='add'>+</div><div class='add'>+	path = btrfs_alloc_path();</div><div class='add'>+	if (!path)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	if (stripe-&gt;rst_search_commit_root) {</div><div class='add'>+		path-&gt;skip_locking = true;</div><div class='add'>+		path-&gt;search_commit_root = true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_search_slot(NULL, stripe_root, &amp;stripe_key, path, 0, 0);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+	if (ret) {</div><div class='add'>+		if (path-&gt;slots[0] != 0)</div><div class='add'>+			path-&gt;slots[0]--;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	while (1) {</div><div class='add'>+		leaf = path-&gt;nodes[0];</div><div class='add'>+		slot = path-&gt;slots[0];</div><div class='add'>+</div><div class='add'>+		btrfs_item_key_to_cpu(leaf, &amp;found_key, slot);</div><div class='add'>+		found_logical = found_key.objectid;</div><div class='add'>+		found_length = found_key.offset;</div><div class='add'>+		found_end = found_logical + found_length;</div><div class='add'>+</div><div class='add'>+		if (found_logical &gt; end) {</div><div class='add'>+			ret = -ENODATA;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (in_range(logical, found_logical, found_length))</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		ret = btrfs_next_item(stripe_root, path);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	offset = logical - found_logical;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If we have a logically contiguous, but physically non-continuous</div><div class='add'>+	 * range, we need to split the bio. Record the length after which we</div><div class='add'>+	 * must split the bio.</div><div class='add'>+	 */</div><div class='add'>+	if (end &gt; found_end)</div><div class='add'>+		*length -= end - found_end;</div><div class='add'>+</div><div class='add'>+	num_stripes = btrfs_num_raid_stripes(btrfs_item_size(leaf, slot));</div><div class='add'>+	stripe_extent = btrfs_item_ptr(leaf, slot, struct btrfs_stripe_extent);</div><div class='add'>+</div><div class='add'>+	for (int i = 0; i &lt; num_stripes; i++) {</div><div class='add'>+		struct btrfs_raid_stride *stride = &amp;stripe_extent-&gt;strides[i];</div><div class='add'>+		u64 devid = btrfs_raid_stride_devid(leaf, stride);</div><div class='add'>+		u64 physical = btrfs_raid_stride_physical(leaf, stride);</div><div class='add'>+</div><div class='add'>+		if (devid != stripe-&gt;dev-&gt;devid)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		if ((map_type &amp; BTRFS_BLOCK_GROUP_DUP) &amp;&amp; stripe_index != i)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		stripe-&gt;physical = physical + offset;</div><div class='add'>+</div><div class='add'>+		trace_btrfs_get_raid_extent_offset(fs_info, logical, *length,</div><div class='add'>+						   stripe-&gt;physical, devid);</div><div class='add'>+</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* If we're here, we haven't found the requested devid in the stripe. */</div><div class='add'>+	ret = -ENODATA;</div><div class='add'>+out:</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		ret = -ENODATA;</div><div class='add'>+	if (ret &amp;&amp; ret != -EIO &amp;&amp; !stripe-&gt;rst_search_commit_root) {</div><div class='add'>+		btrfs_debug(fs_info,</div><div class='add'>+		"cannot find raid-stripe for logical [%llu, %llu] devid %llu, profile %s",</div><div class='add'>+			  logical, logical + *length, stripe-&gt;dev-&gt;devid,</div><div class='add'>+			  btrfs_bg_type_to_raid_name(map_type));</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/btrfs/raid-stripe-tree.h b/fs/btrfs/raid-stripe-tree.h<br/>new file mode 100644<br/>index 000000000000..69942ad43140<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/raid-stripe-tree.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/raid-stripe-tree.h</a></div><div class='hunk'>@@ -0,0 +1,60 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+/*</div><div class='add'>+ * Copyright (C) 2023 Western Digital Corporation or its affiliates.</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#ifndef BTRFS_RAID_STRIPE_TREE_H</div><div class='add'>+#define BTRFS_RAID_STRIPE_TREE_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+#include &lt;uapi/linux/btrfs_tree.h&gt;</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+</div><div class='add'>+#define BTRFS_RST_SUPP_BLOCK_GROUP_MASK    (BTRFS_BLOCK_GROUP_DUP |		\</div><div class='add'>+					    BTRFS_BLOCK_GROUP_RAID1_MASK |	\</div><div class='add'>+					    BTRFS_BLOCK_GROUP_RAID0 |		\</div><div class='add'>+					    BTRFS_BLOCK_GROUP_RAID10)</div><div class='add'>+</div><div class='add'>+struct btrfs_io_context;</div><div class='add'>+struct btrfs_io_stripe;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+struct btrfs_ordered_extent;</div><div class='add'>+struct btrfs_trans_handle;</div><div class='add'>+</div><div class='add'>+int btrfs_delete_raid_extent(struct btrfs_trans_handle *trans, u64 start, u64 length);</div><div class='add'>+int btrfs_get_raid_extent_offset(struct btrfs_fs_info *fs_info,</div><div class='add'>+				 u64 logical, u64 *length, u64 map_type,</div><div class='add'>+				 u32 stripe_index, struct btrfs_io_stripe *stripe);</div><div class='add'>+int btrfs_insert_raid_extent(struct btrfs_trans_handle *trans,</div><div class='add'>+			     struct btrfs_ordered_extent *ordered_extent);</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BTRFS_FS_RUN_SANITY_TESTS</div><div class='add'>+int btrfs_insert_one_raid_extent(struct btrfs_trans_handle *trans,</div><div class='add'>+				 struct btrfs_io_context *bioc);</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+static inline bool btrfs_need_stripe_tree_update(struct btrfs_fs_info *fs_info,</div><div class='add'>+						 u64 map_type)</div><div class='add'>+{</div><div class='add'>+	u64 type = map_type &amp; BTRFS_BLOCK_GROUP_TYPE_MASK;</div><div class='add'>+	u64 profile = map_type &amp; BTRFS_BLOCK_GROUP_PROFILE_MASK;</div><div class='add'>+</div><div class='add'>+	if (!btrfs_fs_incompat(fs_info, RAID_STRIPE_TREE))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	if (type != BTRFS_BLOCK_GROUP_DATA)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	if (profile &amp; BTRFS_RST_SUPP_BLOCK_GROUP_MASK)</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int btrfs_num_raid_stripes(u32 item_size)</div><div class='add'>+{</div><div class='add'>+	return item_size / sizeof(struct btrfs_raid_stride);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#endif</div><div class='head'>diff --git a/fs/btrfs/raid56.c b/fs/btrfs/raid56.c<br/>index 0e239a4c3b26..f38d8305e46d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/raid56.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/raid56.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/raid56.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/raid56.c</a></div><div class='hunk'>@@ -13,12 +13,14 @@</div><div class='ctx'> #include &lt;linux/list_sort.h&gt;</div><div class='ctx'> #include &lt;linux/raid/xor.h&gt;</div><div class='ctx'> #include &lt;linux/mm.h&gt;</div><div class='del'>-#include "misc.h"</div><div class='add'>+#include "messages.h"</div><div class='ctx'> #include "ctree.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='ctx'> #include "volumes.h"</div><div class='ctx'> #include "raid56.h"</div><div class='ctx'> #include "async-thread.h"</div><div class='add'>+#include "file-item.h"</div><div class='add'>+#include "btrfs_inode.h"</div><div class='ctx'> </div><div class='ctx'> /* set when additional merges to this rbio are not allowed */</div><div class='ctx'> #define RBIO_RMW_LOCKED_BIT	1</div><div class='hunk'>@@ -38,6 +40,85 @@</div><div class='ctx'> </div><div class='ctx'> #define BTRFS_STRIPE_HASH_TABLE_BITS				11</div><div class='ctx'> </div><div class='add'>+static void dump_bioc(const struct btrfs_fs_info *fs_info, const struct btrfs_io_context *bioc)</div><div class='add'>+{</div><div class='add'>+	if (unlikely(!bioc)) {</div><div class='add'>+		btrfs_crit(fs_info, "bioc=NULL");</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+	btrfs_crit(fs_info,</div><div class='add'>+"bioc logical=%llu full_stripe=%llu size=%llu map_type=0x%llx mirror=%u replace_nr_stripes=%u replace_stripe_src=%d num_stripes=%u",</div><div class='add'>+		bioc-&gt;logical, bioc-&gt;full_stripe_logical, bioc-&gt;size,</div><div class='add'>+		bioc-&gt;map_type, bioc-&gt;mirror_num, bioc-&gt;replace_nr_stripes,</div><div class='add'>+		bioc-&gt;replace_stripe_src, bioc-&gt;num_stripes);</div><div class='add'>+	for (int i = 0; i &lt; bioc-&gt;num_stripes; i++) {</div><div class='add'>+		btrfs_crit(fs_info, "    nr=%d devid=%llu physical=%llu",</div><div class='add'>+			   i, bioc-&gt;stripes[i].dev-&gt;devid,</div><div class='add'>+			   bioc-&gt;stripes[i].physical);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void btrfs_dump_rbio(const struct btrfs_fs_info *fs_info,</div><div class='add'>+			    const struct btrfs_raid_bio *rbio)</div><div class='add'>+{</div><div class='add'>+	if (!IS_ENABLED(CONFIG_BTRFS_ASSERT))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	dump_bioc(fs_info, rbio-&gt;bioc);</div><div class='add'>+	btrfs_crit(fs_info,</div><div class='add'>+"rbio flags=0x%lx nr_sectors=%u nr_data=%u real_stripes=%u stripe_nsectors=%u sector_nsteps=%u scrubp=%u dbitmap=0x%lx",</div><div class='add'>+		rbio-&gt;flags, rbio-&gt;nr_sectors, rbio-&gt;nr_data,</div><div class='add'>+		rbio-&gt;real_stripes, rbio-&gt;stripe_nsectors,</div><div class='add'>+		rbio-&gt;sector_nsteps, rbio-&gt;scrubp, rbio-&gt;dbitmap);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define ASSERT_RBIO(expr, rbio)						\</div><div class='add'>+({									\</div><div class='add'>+	if (IS_ENABLED(CONFIG_BTRFS_ASSERT) &amp;&amp; unlikely(!(expr))) {	\</div><div class='add'>+		const struct btrfs_fs_info *__fs_info = (rbio)-&gt;bioc ?	\</div><div class='add'>+					(rbio)-&gt;bioc-&gt;fs_info : NULL;	\</div><div class='add'>+									\</div><div class='add'>+		btrfs_dump_rbio(__fs_info, (rbio));			\</div><div class='add'>+	}								\</div><div class='add'>+	ASSERT((expr));							\</div><div class='add'>+})</div><div class='add'>+</div><div class='add'>+#define ASSERT_RBIO_STRIPE(expr, rbio, stripe_nr)			\</div><div class='add'>+({									\</div><div class='add'>+	if (IS_ENABLED(CONFIG_BTRFS_ASSERT) &amp;&amp; unlikely(!(expr))) {	\</div><div class='add'>+		const struct btrfs_fs_info *__fs_info = (rbio)-&gt;bioc ?	\</div><div class='add'>+					(rbio)-&gt;bioc-&gt;fs_info : NULL;	\</div><div class='add'>+									\</div><div class='add'>+		btrfs_dump_rbio(__fs_info, (rbio));			\</div><div class='add'>+		btrfs_crit(__fs_info, "stripe_nr=%d", (stripe_nr));	\</div><div class='add'>+	}								\</div><div class='add'>+	ASSERT((expr));							\</div><div class='add'>+})</div><div class='add'>+</div><div class='add'>+#define ASSERT_RBIO_SECTOR(expr, rbio, sector_nr)			\</div><div class='add'>+({									\</div><div class='add'>+	if (IS_ENABLED(CONFIG_BTRFS_ASSERT) &amp;&amp; unlikely(!(expr))) {	\</div><div class='add'>+		const struct btrfs_fs_info *__fs_info = (rbio)-&gt;bioc ?	\</div><div class='add'>+					(rbio)-&gt;bioc-&gt;fs_info : NULL;	\</div><div class='add'>+									\</div><div class='add'>+		btrfs_dump_rbio(__fs_info, (rbio));			\</div><div class='add'>+		btrfs_crit(__fs_info, "sector_nr=%d", (sector_nr));	\</div><div class='add'>+	}								\</div><div class='add'>+	ASSERT((expr));							\</div><div class='add'>+})</div><div class='add'>+</div><div class='add'>+#define ASSERT_RBIO_LOGICAL(expr, rbio, logical)			\</div><div class='add'>+({									\</div><div class='add'>+	if (IS_ENABLED(CONFIG_BTRFS_ASSERT) &amp;&amp; unlikely(!(expr))) {	\</div><div class='add'>+		const struct btrfs_fs_info *__fs_info = (rbio)-&gt;bioc ?	\</div><div class='add'>+					(rbio)-&gt;bioc-&gt;fs_info : NULL;	\</div><div class='add'>+									\</div><div class='add'>+		btrfs_dump_rbio(__fs_info, (rbio));			\</div><div class='add'>+		btrfs_crit(__fs_info, "logical=%llu", (logical));		\</div><div class='add'>+	}								\</div><div class='add'>+	ASSERT((expr));							\</div><div class='add'>+})</div><div class='add'>+</div><div class='ctx'> /* Used by the raid56 code to lock stripes for read/modify/write */</div><div class='ctx'> struct btrfs_stripe_hash {</div><div class='ctx'> 	struct list_head hash_list;</div><div class='hunk'>@@ -52,146 +133,56 @@ struct btrfs_stripe_hash_table {</div><div class='ctx'> 	struct btrfs_stripe_hash table[];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-enum btrfs_rbio_ops {</div><div class='del'>-	BTRFS_RBIO_WRITE,</div><div class='del'>-	BTRFS_RBIO_READ_REBUILD,</div><div class='del'>-	BTRFS_RBIO_PARITY_SCRUB,</div><div class='del'>-	BTRFS_RBIO_REBUILD_MISSING,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct btrfs_raid_bio {</div><div class='del'>-	struct btrfs_io_context *bioc;</div><div class='del'>-</div><div class='del'>-	/* while we're doing rmw on a stripe</div><div class='del'>-	 * we put it into a hash table so we can</div><div class='del'>-	 * lock the stripe and merge more rbios</div><div class='del'>-	 * into it.</div><div class='del'>-	 */</div><div class='del'>-	struct list_head hash_list;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * LRU list for the stripe cache</div><div class='del'>-	 */</div><div class='del'>-	struct list_head stripe_cache;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * for scheduling work in the helper threads</div><div class='del'>-	 */</div><div class='del'>-	struct btrfs_work work;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * bio list and bio_list_lock are used</div><div class='del'>-	 * to add more bios into the stripe</div><div class='del'>-	 * in hopes of avoiding the full rmw</div><div class='del'>-	 */</div><div class='del'>-	struct bio_list bio_list;</div><div class='del'>-	spinlock_t bio_list_lock;</div><div class='del'>-</div><div class='del'>-	/* also protected by the bio_list_lock, the</div><div class='del'>-	 * plug list is used by the plugging code</div><div class='del'>-	 * to collect partial bios while plugged.  The</div><div class='del'>-	 * stripe locking code also uses it to hand off</div><div class='del'>-	 * the stripe lock to the next pending IO</div><div class='del'>-	 */</div><div class='del'>-	struct list_head plug_list;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * flags that tell us if it is safe to</div><div class='del'>-	 * merge with this bio</div><div class='del'>-	 */</div><div class='del'>-	unsigned long flags;</div><div class='del'>-</div><div class='del'>-	/* size of each individual stripe on disk */</div><div class='del'>-	int stripe_len;</div><div class='del'>-</div><div class='del'>-	/* number of data stripes (no p/q) */</div><div class='del'>-	int nr_data;</div><div class='del'>-</div><div class='del'>-	int real_stripes;</div><div class='del'>-</div><div class='del'>-	int stripe_npages;</div><div class='del'>-	/*</div><div class='del'>-	 * set if we're doing a parity rebuild</div><div class='del'>-	 * for a read from higher up, which is handled</div><div class='del'>-	 * differently from a parity rebuild as part of</div><div class='del'>-	 * rmw</div><div class='del'>-	 */</div><div class='del'>-	enum btrfs_rbio_ops operation;</div><div class='del'>-</div><div class='del'>-	/* first bad stripe */</div><div class='del'>-	int faila;</div><div class='del'>-</div><div class='del'>-	/* second bad stripe (for raid6 use) */</div><div class='del'>-	int failb;</div><div class='del'>-</div><div class='del'>-	int scrubp;</div><div class='del'>-	/*</div><div class='del'>-	 * number of pages needed to represent the full</div><div class='del'>-	 * stripe</div><div class='del'>-	 */</div><div class='del'>-	int nr_pages;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * size of all the bios in the bio_list.  This</div><div class='del'>-	 * helps us decide if the rbio maps to a full</div><div class='del'>-	 * stripe or not</div><div class='del'>-	 */</div><div class='del'>-	int bio_list_bytes;</div><div class='del'>-</div><div class='del'>-	int generic_bio_cnt;</div><div class='del'>-</div><div class='del'>-	refcount_t refs;</div><div class='del'>-</div><div class='del'>-	atomic_t stripes_pending;</div><div class='add'>+/*</div><div class='add'>+ * The PFN may still be valid, but our paddrs should always be block size</div><div class='add'>+ * aligned, thus such -1 paddr is definitely not a valid one.</div><div class='add'>+ */</div><div class='add'>+#define INVALID_PADDR	(~(phys_addr_t)0)</div><div class='ctx'> </div><div class='del'>-	atomic_t error;</div><div class='del'>-	/*</div><div class='del'>-	 * these are two arrays of pointers.  We allocate the</div><div class='del'>-	 * rbio big enough to hold them both and setup their</div><div class='del'>-	 * locations when the rbio is allocated</div><div class='del'>-	 */</div><div class='add'>+static void rmw_rbio_work(struct work_struct *work);</div><div class='add'>+static void rmw_rbio_work_locked(struct work_struct *work);</div><div class='add'>+static void index_rbio_pages(struct btrfs_raid_bio *rbio);</div><div class='add'>+static int alloc_rbio_pages(struct btrfs_raid_bio *rbio);</div><div class='ctx'> </div><div class='del'>-	/* pointers to pages that we allocated for</div><div class='del'>-	 * reading/writing stripes directly from the disk (including P/Q)</div><div class='del'>-	 */</div><div class='del'>-	struct page **stripe_pages;</div><div class='add'>+static int finish_parity_scrub(struct btrfs_raid_bio *rbio);</div><div class='add'>+static void scrub_rbio_work_locked(struct work_struct *work);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * pointers to the pages in the bio_list.  Stored</div><div class='del'>-	 * here for faster lookup</div><div class='del'>-	 */</div><div class='del'>-	struct page **bio_pages;</div><div class='add'>+static void free_raid_bio_pointers(struct btrfs_raid_bio *rbio)</div><div class='add'>+{</div><div class='add'>+	bitmap_free(rbio-&gt;error_bitmap);</div><div class='add'>+	kfree(rbio-&gt;stripe_pages);</div><div class='add'>+	kfree(rbio-&gt;bio_paddrs);</div><div class='add'>+	kfree(rbio-&gt;stripe_paddrs);</div><div class='add'>+	kfree(rbio-&gt;finish_pointers);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * bitmap to record which horizontal stripe has data</div><div class='del'>-	 */</div><div class='del'>-	unsigned long *dbitmap;</div><div class='add'>+static void free_raid_bio(struct btrfs_raid_bio *rbio)</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='ctx'> </div><div class='del'>-	/* allocated with real_stripes-many pointers for finish_*() calls */</div><div class='del'>-	void **finish_pointers;</div><div class='add'>+	if (!refcount_dec_and_test(&amp;rbio-&gt;refs))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	/* allocated with stripe_npages-many bits for finish_*() calls */</div><div class='del'>-	unsigned long *finish_pbitmap;</div><div class='del'>-};</div><div class='add'>+	WARN_ON(!list_empty(&amp;rbio-&gt;stripe_cache));</div><div class='add'>+	WARN_ON(!list_empty(&amp;rbio-&gt;hash_list));</div><div class='add'>+	WARN_ON(!bio_list_empty(&amp;rbio-&gt;bio_list));</div><div class='ctx'> </div><div class='del'>-static int __raid56_parity_recover(struct btrfs_raid_bio *rbio);</div><div class='del'>-static noinline void finish_rmw(struct btrfs_raid_bio *rbio);</div><div class='del'>-static void rmw_work(struct btrfs_work *work);</div><div class='del'>-static void read_rebuild_work(struct btrfs_work *work);</div><div class='del'>-static int fail_bio_stripe(struct btrfs_raid_bio *rbio, struct bio *bio);</div><div class='del'>-static int fail_rbio_index(struct btrfs_raid_bio *rbio, int failed);</div><div class='del'>-static void __free_raid_bio(struct btrfs_raid_bio *rbio);</div><div class='del'>-static void index_rbio_pages(struct btrfs_raid_bio *rbio);</div><div class='del'>-static int alloc_rbio_pages(struct btrfs_raid_bio *rbio);</div><div class='add'>+	for (i = 0; i &lt; rbio-&gt;nr_pages; i++) {</div><div class='add'>+		if (rbio-&gt;stripe_pages[i]) {</div><div class='add'>+			__free_page(rbio-&gt;stripe_pages[i]);</div><div class='add'>+			rbio-&gt;stripe_pages[i] = NULL;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-static noinline void finish_parity_scrub(struct btrfs_raid_bio *rbio,</div><div class='del'>-					 int need_check);</div><div class='del'>-static void scrub_parity_work(struct btrfs_work *work);</div><div class='add'>+	btrfs_put_bioc(rbio-&gt;bioc);</div><div class='add'>+	free_raid_bio_pointers(rbio);</div><div class='add'>+	kfree(rbio);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-static void start_async_work(struct btrfs_raid_bio *rbio, btrfs_func_t work_func)</div><div class='add'>+static void start_async_work(struct btrfs_raid_bio *rbio, work_func_t work_func)</div><div class='ctx'> {</div><div class='del'>-	btrfs_init_work(&amp;rbio-&gt;work, work_func, NULL, NULL);</div><div class='del'>-	btrfs_queue_work(rbio-&gt;bioc-&gt;fs_info-&gt;rmw_workers, &amp;rbio-&gt;work);</div><div class='add'>+	INIT_WORK(&amp;rbio-&gt;work, work_func);</div><div class='add'>+	queue_work(rbio-&gt;bioc-&gt;fs_info-&gt;rmw_workers, &amp;rbio-&gt;work);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -204,8 +195,7 @@ int btrfs_alloc_stripe_hash_table(struct btrfs_fs_info *info)</div><div class='ctx'> 	struct btrfs_stripe_hash_table *x;</div><div class='ctx'> 	struct btrfs_stripe_hash *cur;</div><div class='ctx'> 	struct btrfs_stripe_hash *h;</div><div class='del'>-	int num_entries = 1 &lt;&lt; BTRFS_STRIPE_HASH_TABLE_BITS;</div><div class='del'>-	int i;</div><div class='add'>+	unsigned int num_entries = 1U &lt;&lt; BTRFS_STRIPE_HASH_TABLE_BITS;</div><div class='ctx'> </div><div class='ctx'> 	if (info-&gt;stripe_hash_table)</div><div class='ctx'> 		return 0;</div><div class='hunk'>@@ -226,7 +216,7 @@ int btrfs_alloc_stripe_hash_table(struct btrfs_fs_info *info)</div><div class='ctx'> </div><div class='ctx'> 	h = table-&gt;table;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; num_entries; i++) {</div><div class='add'>+	for (unsigned int i = 0; i &lt; num_entries; i++) {</div><div class='ctx'> 		cur = h + i;</div><div class='ctx'> 		INIT_LIST_HEAD(&amp;cur-&gt;hash_list);</div><div class='ctx'> 		spin_lock_init(&amp;cur-&gt;lock);</div><div class='hunk'>@@ -237,9 +227,27 @@ int btrfs_alloc_stripe_hash_table(struct btrfs_fs_info *info)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void memcpy_from_bio_to_stripe(struct btrfs_raid_bio *rbio, unsigned int sector_nr)</div><div class='add'>+{</div><div class='add'>+	const u32 step = min(rbio-&gt;bioc-&gt;fs_info-&gt;sectorsize, PAGE_SIZE);</div><div class='add'>+</div><div class='add'>+	ASSERT(sector_nr &lt; rbio-&gt;nr_sectors);</div><div class='add'>+	for (int i = 0; i &lt; rbio-&gt;sector_nsteps; i++) {</div><div class='add'>+		unsigned int index = sector_nr * rbio-&gt;sector_nsteps + i;</div><div class='add'>+		phys_addr_t dst = rbio-&gt;stripe_paddrs[index];</div><div class='add'>+		phys_addr_t src = rbio-&gt;bio_paddrs[index];</div><div class='add'>+</div><div class='add'>+		ASSERT(dst != INVALID_PADDR);</div><div class='add'>+		ASSERT(src != INVALID_PADDR);</div><div class='add'>+</div><div class='add'>+		memcpy_page(phys_to_page(dst), offset_in_page(dst),</div><div class='add'>+			    phys_to_page(src), offset_in_page(src), step);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * caching an rbio means to copy anything from the</div><div class='del'>- * bio_pages array into the stripe_pages array.  We</div><div class='add'>+ * bio_sectors array into the stripe_pages array.  We</div><div class='ctx'>  * use the page uptodate bit in the stripe cache array</div><div class='ctx'>  * to indicate if it has valid data</div><div class='ctx'>  *</div><div class='hunk'>@@ -255,12 +263,21 @@ static void cache_rbio_pages(struct btrfs_raid_bio *rbio)</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; rbio-&gt;nr_pages; i++) {</div><div class='del'>-		if (!rbio-&gt;bio_pages[i])</div><div class='add'>+	for (i = 0; i &lt; rbio-&gt;nr_sectors; i++) {</div><div class='add'>+		/* Some range not covered by bio (partial write), skip it */</div><div class='add'>+		if (rbio-&gt;bio_paddrs[i * rbio-&gt;sector_nsteps] == INVALID_PADDR) {</div><div class='add'>+			/*</div><div class='add'>+			 * Even if the sector is not covered by bio, if it is</div><div class='add'>+			 * a data sector it should still be uptodate as it is</div><div class='add'>+			 * read from disk.</div><div class='add'>+			 */</div><div class='add'>+			if (i &lt; rbio-&gt;nr_data * rbio-&gt;stripe_nsectors)</div><div class='add'>+				ASSERT(test_bit(i, rbio-&gt;stripe_uptodate_bitmap));</div><div class='ctx'> 			continue;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-		copy_highpage(rbio-&gt;stripe_pages[i], rbio-&gt;bio_pages[i]);</div><div class='del'>-		SetPageUptodate(rbio-&gt;stripe_pages[i]);</div><div class='add'>+		memcpy_from_bio_to_stripe(rbio, i);</div><div class='add'>+		set_bit(i, rbio-&gt;stripe_uptodate_bitmap);</div><div class='ctx'> 	}</div><div class='ctx'> 	set_bit(RBIO_CACHE_READY_BIT, &amp;rbio-&gt;flags);</div><div class='ctx'> }</div><div class='hunk'>@@ -270,7 +287,7 @@ static void cache_rbio_pages(struct btrfs_raid_bio *rbio)</div><div class='ctx'>  */</div><div class='ctx'> static int rbio_bucket(struct btrfs_raid_bio *rbio)</div><div class='ctx'> {</div><div class='del'>-	u64 num = rbio-&gt;bioc-&gt;raid_map[0];</div><div class='add'>+	u64 num = rbio-&gt;bioc-&gt;full_stripe_logical;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * we shift down quite a bit.  We're using byte</div><div class='hunk'>@@ -283,32 +300,143 @@ static int rbio_bucket(struct btrfs_raid_bio *rbio)</div><div class='ctx'> 	return hash_64(num &gt;&gt; 16, BTRFS_STRIPE_HASH_TABLE_BITS);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/* Get the sector number of the first sector covered by @page_nr. */</div><div class='add'>+static u32 page_nr_to_sector_nr(struct btrfs_raid_bio *rbio, unsigned int page_nr)</div><div class='add'>+{</div><div class='add'>+	u32 sector_nr;</div><div class='add'>+</div><div class='add'>+	ASSERT(page_nr &lt; rbio-&gt;nr_pages);</div><div class='add'>+</div><div class='add'>+	sector_nr = (page_nr &lt;&lt; PAGE_SHIFT) &gt;&gt; rbio-&gt;bioc-&gt;fs_info-&gt;sectorsize_bits;</div><div class='add'>+	ASSERT(sector_nr &lt; rbio-&gt;nr_sectors);</div><div class='add'>+	return sector_nr;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Get the number of sectors covered by @page_nr.</div><div class='add'>+ *</div><div class='add'>+ * For bs &gt; ps cases, the result will always be 1.</div><div class='add'>+ * For bs &lt;= ps cases, the result will be ps / bs.</div><div class='add'>+ */</div><div class='add'>+static u32 page_nr_to_num_sectors(struct btrfs_raid_bio *rbio, unsigned int page_nr)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = rbio-&gt;bioc-&gt;fs_info;</div><div class='add'>+	u32 nr_sectors;</div><div class='add'>+</div><div class='add'>+	ASSERT(page_nr &lt; rbio-&gt;nr_pages);</div><div class='add'>+</div><div class='add'>+	nr_sectors = round_up(PAGE_SIZE, fs_info-&gt;sectorsize) &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='add'>+	ASSERT(nr_sectors &gt; 0);</div><div class='add'>+	return nr_sectors;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __maybe_unused bool full_page_sectors_uptodate(struct btrfs_raid_bio *rbio,</div><div class='add'>+						      unsigned int page_nr)</div><div class='add'>+{</div><div class='add'>+	const u32 sector_nr = page_nr_to_sector_nr(rbio, page_nr);</div><div class='add'>+	const u32 nr_bits = page_nr_to_num_sectors(rbio, page_nr);</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	ASSERT(page_nr &lt; rbio-&gt;nr_pages);</div><div class='add'>+	ASSERT(sector_nr + nr_bits &lt; rbio-&gt;nr_sectors);</div><div class='add'>+</div><div class='add'>+	for (i = sector_nr; i &lt; sector_nr + nr_bits; i++) {</div><div class='add'>+		if (!test_bit(i, rbio-&gt;stripe_uptodate_bitmap))</div><div class='add'>+			return false;</div><div class='add'>+	}</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Update the stripe_sectors[] array to use correct page and pgoff</div><div class='add'>+ *</div><div class='add'>+ * Should be called every time any page pointer in stripes_pages[] got modified.</div><div class='add'>+ */</div><div class='add'>+static void index_stripe_sectors(struct btrfs_raid_bio *rbio)</div><div class='add'>+{</div><div class='add'>+	const u32 step = min(rbio-&gt;bioc-&gt;fs_info-&gt;sectorsize, PAGE_SIZE);</div><div class='add'>+	u32 offset;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	for (i = 0, offset = 0; i &lt; rbio-&gt;nr_sectors * rbio-&gt;sector_nsteps;</div><div class='add'>+	     i++, offset += step) {</div><div class='add'>+		int page_index = offset &gt;&gt; PAGE_SHIFT;</div><div class='add'>+</div><div class='add'>+		ASSERT(page_index &lt; rbio-&gt;nr_pages);</div><div class='add'>+		if (!rbio-&gt;stripe_pages[page_index])</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		rbio-&gt;stripe_paddrs[i] = page_to_phys(rbio-&gt;stripe_pages[page_index]) +</div><div class='add'>+					 offset_in_page(offset);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void steal_rbio_page(struct btrfs_raid_bio *src,</div><div class='add'>+			    struct btrfs_raid_bio *dest, int page_nr)</div><div class='add'>+{</div><div class='add'>+	const u32 sector_nr = page_nr_to_sector_nr(src, page_nr);</div><div class='add'>+	const u32 nr_bits = page_nr_to_num_sectors(src, page_nr);</div><div class='add'>+</div><div class='add'>+	ASSERT(page_nr &lt; src-&gt;nr_pages);</div><div class='add'>+	ASSERT(sector_nr + nr_bits &lt; src-&gt;nr_sectors);</div><div class='add'>+</div><div class='add'>+	if (dest-&gt;stripe_pages[page_nr])</div><div class='add'>+		__free_page(dest-&gt;stripe_pages[page_nr]);</div><div class='add'>+	dest-&gt;stripe_pages[page_nr] = src-&gt;stripe_pages[page_nr];</div><div class='add'>+	src-&gt;stripe_pages[page_nr] = NULL;</div><div class='add'>+</div><div class='add'>+	/* Also update the stripe_uptodate_bitmap bits. */</div><div class='add'>+	bitmap_set(dest-&gt;stripe_uptodate_bitmap, sector_nr, nr_bits);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool is_data_stripe_page(struct btrfs_raid_bio *rbio, int page_nr)</div><div class='add'>+{</div><div class='add'>+	const int sector_nr = page_nr_to_sector_nr(rbio, page_nr);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We have ensured PAGE_SIZE is aligned with sectorsize, thus</div><div class='add'>+	 * we won't have a page which is half data half parity.</div><div class='add'>+	 *</div><div class='add'>+	 * Thus if the first sector of the page belongs to data stripes, then</div><div class='add'>+	 * the full page belongs to data stripes.</div><div class='add'>+	 */</div><div class='add'>+	return (sector_nr &lt; rbio-&gt;nr_data * rbio-&gt;stripe_nsectors);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='del'>- * stealing an rbio means taking all the uptodate pages from the stripe</div><div class='del'>- * array in the source rbio and putting them into the destination rbio</div><div class='add'>+ * Stealing an rbio means taking all the uptodate pages from the stripe array</div><div class='add'>+ * in the source rbio and putting them into the destination rbio.</div><div class='add'>+ *</div><div class='add'>+ * This will also update the involved stripe_sectors[] which are referring to</div><div class='add'>+ * the old pages.</div><div class='ctx'>  */</div><div class='ctx'> static void steal_rbio(struct btrfs_raid_bio *src, struct btrfs_raid_bio *dest)</div><div class='ctx'> {</div><div class='ctx'> 	int i;</div><div class='del'>-	struct page *s;</div><div class='del'>-	struct page *d;</div><div class='ctx'> </div><div class='ctx'> 	if (!test_bit(RBIO_CACHE_READY_BIT, &amp;src-&gt;flags))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; dest-&gt;nr_pages; i++) {</div><div class='del'>-		s = src-&gt;stripe_pages[i];</div><div class='del'>-		if (!s || !PageUptodate(s)) {</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='add'>+		struct page *p = src-&gt;stripe_pages[i];</div><div class='ctx'> </div><div class='del'>-		d = dest-&gt;stripe_pages[i];</div><div class='del'>-		if (d)</div><div class='del'>-			__free_page(d);</div><div class='add'>+		/*</div><div class='add'>+		 * We don't need to steal P/Q pages as they will always be</div><div class='add'>+		 * regenerated for RMW or full write anyway.</div><div class='add'>+		 */</div><div class='add'>+		if (!is_data_stripe_page(src, i))</div><div class='add'>+			continue;</div><div class='ctx'> </div><div class='del'>-		dest-&gt;stripe_pages[i] = s;</div><div class='del'>-		src-&gt;stripe_pages[i] = NULL;</div><div class='add'>+		/*</div><div class='add'>+		 * If @src already has RBIO_CACHE_READY_BIT, it should have</div><div class='add'>+		 * all data stripe pages present and uptodate.</div><div class='add'>+		 */</div><div class='add'>+		ASSERT(p);</div><div class='add'>+		ASSERT(full_page_sectors_uptodate(src, i));</div><div class='add'>+		steal_rbio_page(src, dest, i);</div><div class='ctx'> 	}</div><div class='add'>+	index_stripe_sectors(dest);</div><div class='add'>+	index_stripe_sectors(src);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -321,10 +449,11 @@ static void steal_rbio(struct btrfs_raid_bio *src, struct btrfs_raid_bio *dest)</div><div class='ctx'> static void merge_rbio(struct btrfs_raid_bio *dest,</div><div class='ctx'> 		       struct btrfs_raid_bio *victim)</div><div class='ctx'> {</div><div class='del'>-	bio_list_merge(&amp;dest-&gt;bio_list, &amp;victim-&gt;bio_list);</div><div class='add'>+	bio_list_merge_init(&amp;dest-&gt;bio_list, &amp;victim-&gt;bio_list);</div><div class='ctx'> 	dest-&gt;bio_list_bytes += victim-&gt;bio_list_bytes;</div><div class='del'>-	dest-&gt;generic_bio_cnt += victim-&gt;generic_bio_cnt;</div><div class='del'>-	bio_list_init(&amp;victim-&gt;bio_list);</div><div class='add'>+	/* Also inherit the bitmaps from @victim. */</div><div class='add'>+	bitmap_or(&amp;dest-&gt;dbitmap, &amp;victim-&gt;dbitmap, &amp;dest-&gt;dbitmap,</div><div class='add'>+		  dest-&gt;stripe_nsectors);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -385,7 +514,7 @@ static void __remove_rbio_from_cache(struct btrfs_raid_bio *rbio)</div><div class='ctx'> 	spin_unlock(&amp;h-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	if (freeit)</div><div class='del'>-		__free_raid_bio(rbio);</div><div class='add'>+		free_raid_bio(rbio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -394,16 +523,15 @@ static void __remove_rbio_from_cache(struct btrfs_raid_bio *rbio)</div><div class='ctx'> static void remove_rbio_from_cache(struct btrfs_raid_bio *rbio)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_stripe_hash_table *table;</div><div class='del'>-	unsigned long flags;</div><div class='ctx'> </div><div class='ctx'> 	if (!test_bit(RBIO_CACHE_BIT, &amp;rbio-&gt;flags))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	table = rbio-&gt;bioc-&gt;fs_info-&gt;stripe_hash_table;</div><div class='ctx'> </div><div class='del'>-	spin_lock_irqsave(&amp;table-&gt;cache_lock, flags);</div><div class='add'>+	spin_lock(&amp;table-&gt;cache_lock);</div><div class='ctx'> 	__remove_rbio_from_cache(rbio);</div><div class='del'>-	spin_unlock_irqrestore(&amp;table-&gt;cache_lock, flags);</div><div class='add'>+	spin_unlock(&amp;table-&gt;cache_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -412,19 +540,17 @@ static void remove_rbio_from_cache(struct btrfs_raid_bio *rbio)</div><div class='ctx'> static void btrfs_clear_rbio_cache(struct btrfs_fs_info *info)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_stripe_hash_table *table;</div><div class='del'>-	unsigned long flags;</div><div class='ctx'> 	struct btrfs_raid_bio *rbio;</div><div class='ctx'> </div><div class='ctx'> 	table = info-&gt;stripe_hash_table;</div><div class='ctx'> </div><div class='del'>-	spin_lock_irqsave(&amp;table-&gt;cache_lock, flags);</div><div class='add'>+	spin_lock(&amp;table-&gt;cache_lock);</div><div class='ctx'> 	while (!list_empty(&amp;table-&gt;stripe_cache)) {</div><div class='del'>-		rbio = list_entry(table-&gt;stripe_cache.next,</div><div class='del'>-				  struct btrfs_raid_bio,</div><div class='del'>-				  stripe_cache);</div><div class='add'>+		rbio = list_first_entry(&amp;table-&gt;stripe_cache,</div><div class='add'>+					struct btrfs_raid_bio, stripe_cache);</div><div class='ctx'> 		__remove_rbio_from_cache(rbio);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock_irqrestore(&amp;table-&gt;cache_lock, flags);</div><div class='add'>+	spin_unlock(&amp;table-&gt;cache_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -454,14 +580,13 @@ void btrfs_free_stripe_hash_table(struct btrfs_fs_info *info)</div><div class='ctx'> static void cache_rbio(struct btrfs_raid_bio *rbio)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_stripe_hash_table *table;</div><div class='del'>-	unsigned long flags;</div><div class='ctx'> </div><div class='ctx'> 	if (!test_bit(RBIO_CACHE_READY_BIT, &amp;rbio-&gt;flags))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	table = rbio-&gt;bioc-&gt;fs_info-&gt;stripe_hash_table;</div><div class='ctx'> </div><div class='del'>-	spin_lock_irqsave(&amp;table-&gt;cache_lock, flags);</div><div class='add'>+	spin_lock(&amp;table-&gt;cache_lock);</div><div class='ctx'> 	spin_lock(&amp;rbio-&gt;bio_list_lock);</div><div class='ctx'> </div><div class='ctx'> 	/* bump our ref if we were not in the list before */</div><div class='hunk'>@@ -480,15 +605,15 @@ static void cache_rbio(struct btrfs_raid_bio *rbio)</div><div class='ctx'> 	if (table-&gt;cache_size &gt; RBIO_CACHE_SIZE) {</div><div class='ctx'> 		struct btrfs_raid_bio *found;</div><div class='ctx'> </div><div class='del'>-		found = list_entry(table-&gt;stripe_cache.prev,</div><div class='del'>-				  struct btrfs_raid_bio,</div><div class='del'>-				  stripe_cache);</div><div class='add'>+		found = list_last_entry(&amp;table-&gt;stripe_cache,</div><div class='add'>+					struct btrfs_raid_bio,</div><div class='add'>+					stripe_cache);</div><div class='ctx'> </div><div class='ctx'> 		if (found != rbio)</div><div class='ctx'> 			__remove_rbio_from_cache(found);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	spin_unlock_irqrestore(&amp;table-&gt;cache_lock, flags);</div><div class='add'>+	spin_unlock(&amp;table-&gt;cache_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -517,15 +642,14 @@ static void run_xor(void **pages, int src_cnt, ssize_t len)</div><div class='ctx'>  */</div><div class='ctx'> static int rbio_is_full(struct btrfs_raid_bio *rbio)</div><div class='ctx'> {</div><div class='del'>-	unsigned long flags;</div><div class='ctx'> 	unsigned long size = rbio-&gt;bio_list_bytes;</div><div class='ctx'> 	int ret = 1;</div><div class='ctx'> </div><div class='del'>-	spin_lock_irqsave(&amp;rbio-&gt;bio_list_lock, flags);</div><div class='del'>-	if (size != rbio-&gt;nr_data * rbio-&gt;stripe_len)</div><div class='add'>+	spin_lock(&amp;rbio-&gt;bio_list_lock);</div><div class='add'>+	if (size != rbio-&gt;nr_data * BTRFS_STRIPE_LEN)</div><div class='ctx'> 		ret = 0;</div><div class='del'>-	BUG_ON(size &gt; rbio-&gt;nr_data * rbio-&gt;stripe_len);</div><div class='del'>-	spin_unlock_irqrestore(&amp;rbio-&gt;bio_list_lock, flags);</div><div class='add'>+	BUG_ON(size &gt; rbio-&gt;nr_data * BTRFS_STRIPE_LEN);</div><div class='add'>+	spin_unlock(&amp;rbio-&gt;bio_list_lock);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -558,7 +682,7 @@ static int rbio_can_merge(struct btrfs_raid_bio *last,</div><div class='ctx'> 	    test_bit(RBIO_CACHE_BIT, &amp;cur-&gt;flags))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	if (last-&gt;bioc-&gt;raid_map[0] != cur-&gt;bioc-&gt;raid_map[0])</div><div class='add'>+	if (last-&gt;bioc-&gt;full_stripe_logical != cur-&gt;bioc-&gt;full_stripe_logical)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/* we can't merge with different operations */</div><div class='hunk'>@@ -575,64 +699,68 @@ static int rbio_can_merge(struct btrfs_raid_bio *last,</div><div class='ctx'> 	if (last-&gt;operation == BTRFS_RBIO_PARITY_SCRUB)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	if (last-&gt;operation == BTRFS_RBIO_REBUILD_MISSING)</div><div class='add'>+	if (last-&gt;operation == BTRFS_RBIO_READ_REBUILD)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	if (last-&gt;operation == BTRFS_RBIO_READ_REBUILD) {</div><div class='del'>-		int fa = last-&gt;faila;</div><div class='del'>-		int fb = last-&gt;failb;</div><div class='del'>-		int cur_fa = cur-&gt;faila;</div><div class='del'>-		int cur_fb = cur-&gt;failb;</div><div class='add'>+	return 1;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		if (last-&gt;faila &gt;= last-&gt;failb) {</div><div class='del'>-			fa = last-&gt;failb;</div><div class='del'>-			fb = last-&gt;faila;</div><div class='del'>-		}</div><div class='add'>+/* Return the sector index for @stripe_nr and @sector_nr. */</div><div class='add'>+static unsigned int rbio_sector_index(const struct btrfs_raid_bio *rbio,</div><div class='add'>+				      unsigned int stripe_nr,</div><div class='add'>+				      unsigned int sector_nr)</div><div class='add'>+{</div><div class='add'>+	unsigned int ret;</div><div class='ctx'> </div><div class='del'>-		if (cur-&gt;faila &gt;= cur-&gt;failb) {</div><div class='del'>-			cur_fa = cur-&gt;failb;</div><div class='del'>-			cur_fb = cur-&gt;faila;</div><div class='del'>-		}</div><div class='add'>+	ASSERT_RBIO_STRIPE(stripe_nr &lt; rbio-&gt;real_stripes, rbio, stripe_nr);</div><div class='add'>+	ASSERT_RBIO_SECTOR(sector_nr &lt; rbio-&gt;stripe_nsectors, rbio, sector_nr);</div><div class='ctx'> </div><div class='del'>-		if (fa != cur_fa || fb != cur_fb)</div><div class='del'>-			return 0;</div><div class='del'>-	}</div><div class='del'>-	return 1;</div><div class='add'>+	ret = stripe_nr * rbio-&gt;stripe_nsectors + sector_nr;</div><div class='add'>+	ASSERT(ret &lt; rbio-&gt;nr_sectors);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int rbio_stripe_page_index(struct btrfs_raid_bio *rbio, int stripe,</div><div class='del'>-				  int index)</div><div class='add'>+/* Return the paddr array index for @stripe_nr, @sector_nr and @step_nr. */</div><div class='add'>+static unsigned int rbio_paddr_index(const struct btrfs_raid_bio *rbio,</div><div class='add'>+				     unsigned int stripe_nr,</div><div class='add'>+				     unsigned int sector_nr,</div><div class='add'>+				     unsigned int step_nr)</div><div class='ctx'> {</div><div class='del'>-	return stripe * rbio-&gt;stripe_npages + index;</div><div class='add'>+	unsigned int ret;</div><div class='add'>+</div><div class='add'>+	ASSERT_RBIO_SECTOR(step_nr &lt; rbio-&gt;sector_nsteps, rbio, step_nr);</div><div class='add'>+</div><div class='add'>+	ret = rbio_sector_index(rbio, stripe_nr, sector_nr) * rbio-&gt;sector_nsteps + step_nr;</div><div class='add'>+	ASSERT(ret &lt; rbio-&gt;nr_sectors * rbio-&gt;sector_nsteps);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * these are just the pages from the rbio array, not from anything</div><div class='del'>- * the FS sent down to us</div><div class='del'>- */</div><div class='del'>-static struct page *rbio_stripe_page(struct btrfs_raid_bio *rbio, int stripe,</div><div class='del'>-				     int index)</div><div class='add'>+static phys_addr_t rbio_stripe_paddr(const struct btrfs_raid_bio *rbio,</div><div class='add'>+					  unsigned int stripe_nr, unsigned int sector_nr,</div><div class='add'>+					  unsigned int step_nr)</div><div class='ctx'> {</div><div class='del'>-	return rbio-&gt;stripe_pages[rbio_stripe_page_index(rbio, stripe, index)];</div><div class='add'>+	return rbio-&gt;stripe_paddrs[rbio_paddr_index(rbio, stripe_nr, sector_nr, step_nr)];</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * helper to index into the pstripe</div><div class='del'>- */</div><div class='del'>-static struct page *rbio_pstripe_page(struct btrfs_raid_bio *rbio, int index)</div><div class='add'>+static phys_addr_t rbio_pstripe_paddr(const struct btrfs_raid_bio *rbio,</div><div class='add'>+					   unsigned int sector_nr, unsigned int step_nr)</div><div class='ctx'> {</div><div class='del'>-	return rbio_stripe_page(rbio, rbio-&gt;nr_data, index);</div><div class='add'>+	return rbio_stripe_paddr(rbio, rbio-&gt;nr_data, sector_nr, step_nr);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * helper to index into the qstripe, returns null</div><div class='del'>- * if there is no qstripe</div><div class='del'>- */</div><div class='del'>-static struct page *rbio_qstripe_page(struct btrfs_raid_bio *rbio, int index)</div><div class='add'>+static phys_addr_t rbio_qstripe_paddr(const struct btrfs_raid_bio *rbio,</div><div class='add'>+					   unsigned int sector_nr, unsigned int step_nr)</div><div class='ctx'> {</div><div class='ctx'> 	if (rbio-&gt;nr_data + 1 == rbio-&gt;real_stripes)</div><div class='del'>-		return NULL;</div><div class='del'>-	return rbio_stripe_page(rbio, rbio-&gt;nr_data + 1, index);</div><div class='add'>+		return INVALID_PADDR;</div><div class='add'>+	return rbio_stripe_paddr(rbio, rbio-&gt;nr_data + 1, sector_nr, step_nr);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Return a paddr pointer into the rbio::stripe_paddrs[] for the specified sector. */</div><div class='add'>+static phys_addr_t *rbio_stripe_paddrs(const struct btrfs_raid_bio *rbio,</div><div class='add'>+				       unsigned int stripe_nr, unsigned int sector_nr)</div><div class='add'>+{</div><div class='add'>+	return &amp;rbio-&gt;stripe_paddrs[rbio_paddr_index(rbio, stripe_nr, sector_nr, 0)];</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -662,16 +790,15 @@ static noinline int lock_stripe_add(struct btrfs_raid_bio *rbio)</div><div class='ctx'> 	struct btrfs_stripe_hash *h;</div><div class='ctx'> 	struct btrfs_raid_bio *cur;</div><div class='ctx'> 	struct btrfs_raid_bio *pending;</div><div class='del'>-	unsigned long flags;</div><div class='ctx'> 	struct btrfs_raid_bio *freeit = NULL;</div><div class='ctx'> 	struct btrfs_raid_bio *cache_drop = NULL;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	h = rbio-&gt;bioc-&gt;fs_info-&gt;stripe_hash_table-&gt;table + rbio_bucket(rbio);</div><div class='ctx'> </div><div class='del'>-	spin_lock_irqsave(&amp;h-&gt;lock, flags);</div><div class='add'>+	spin_lock(&amp;h-&gt;lock);</div><div class='ctx'> 	list_for_each_entry(cur, &amp;h-&gt;hash_list, hash_list) {</div><div class='del'>-		if (cur-&gt;bioc-&gt;raid_map[0] != rbio-&gt;bioc-&gt;raid_map[0])</div><div class='add'>+		if (cur-&gt;bioc-&gt;full_stripe_logical != rbio-&gt;bioc-&gt;full_stripe_logical)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		spin_lock(&amp;cur-&gt;bio_list_lock);</div><div class='hunk'>@@ -729,14 +856,16 @@ lockit:</div><div class='ctx'> 	refcount_inc(&amp;rbio-&gt;refs);</div><div class='ctx'> 	list_add(&amp;rbio-&gt;hash_list, &amp;h-&gt;hash_list);</div><div class='ctx'> out:</div><div class='del'>-	spin_unlock_irqrestore(&amp;h-&gt;lock, flags);</div><div class='add'>+	spin_unlock(&amp;h-&gt;lock);</div><div class='ctx'> 	if (cache_drop)</div><div class='ctx'> 		remove_rbio_from_cache(cache_drop);</div><div class='ctx'> 	if (freeit)</div><div class='del'>-		__free_raid_bio(freeit);</div><div class='add'>+		free_raid_bio(freeit);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void recover_rbio_work_locked(struct work_struct *work);</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * called as rmw or parity rebuild is completed.  If the plug list has more</div><div class='ctx'>  * rbios waiting for this stripe, the next one on the list will be started</div><div class='hunk'>@@ -745,7 +874,6 @@ static noinline void unlock_stripe(struct btrfs_raid_bio *rbio)</div><div class='ctx'> {</div><div class='ctx'> 	int bucket;</div><div class='ctx'> 	struct btrfs_stripe_hash *h;</div><div class='del'>-	unsigned long flags;</div><div class='ctx'> 	int keep_cache = 0;</div><div class='ctx'> </div><div class='ctx'> 	bucket = rbio_bucket(rbio);</div><div class='hunk'>@@ -754,7 +882,7 @@ static noinline void unlock_stripe(struct btrfs_raid_bio *rbio)</div><div class='ctx'> 	if (list_empty(&amp;rbio-&gt;plug_list))</div><div class='ctx'> 		cache_rbio(rbio);</div><div class='ctx'> </div><div class='del'>-	spin_lock_irqsave(&amp;h-&gt;lock, flags);</div><div class='add'>+	spin_lock(&amp;h-&gt;lock);</div><div class='ctx'> 	spin_lock(&amp;rbio-&gt;bio_list_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (!list_empty(&amp;rbio-&gt;hash_list)) {</div><div class='hunk'>@@ -791,19 +919,16 @@ static noinline void unlock_stripe(struct btrfs_raid_bio *rbio)</div><div class='ctx'> 			list_add(&amp;next-&gt;hash_list, &amp;h-&gt;hash_list);</div><div class='ctx'> 			refcount_inc(&amp;next-&gt;refs);</div><div class='ctx'> 			spin_unlock(&amp;rbio-&gt;bio_list_lock);</div><div class='del'>-			spin_unlock_irqrestore(&amp;h-&gt;lock, flags);</div><div class='add'>+			spin_unlock(&amp;h-&gt;lock);</div><div class='ctx'> </div><div class='del'>-			if (next-&gt;operation == BTRFS_RBIO_READ_REBUILD)</div><div class='del'>-				start_async_work(next, read_rebuild_work);</div><div class='del'>-			else if (next-&gt;operation == BTRFS_RBIO_REBUILD_MISSING) {</div><div class='del'>-				steal_rbio(rbio, next);</div><div class='del'>-				start_async_work(next, read_rebuild_work);</div><div class='add'>+			if (next-&gt;operation == BTRFS_RBIO_READ_REBUILD) {</div><div class='add'>+				start_async_work(next, recover_rbio_work_locked);</div><div class='ctx'> 			} else if (next-&gt;operation == BTRFS_RBIO_WRITE) {</div><div class='ctx'> 				steal_rbio(rbio, next);</div><div class='del'>-				start_async_work(next, rmw_work);</div><div class='add'>+				start_async_work(next, rmw_rbio_work_locked);</div><div class='ctx'> 			} else if (next-&gt;operation == BTRFS_RBIO_PARITY_SCRUB) {</div><div class='ctx'> 				steal_rbio(rbio, next);</div><div class='del'>-				start_async_work(next, scrub_parity_work);</div><div class='add'>+				start_async_work(next, scrub_rbio_work_locked);</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			goto done_nolock;</div><div class='hunk'>@@ -811,43 +936,21 @@ static noinline void unlock_stripe(struct btrfs_raid_bio *rbio)</div><div class='ctx'> 	}</div><div class='ctx'> done:</div><div class='ctx'> 	spin_unlock(&amp;rbio-&gt;bio_list_lock);</div><div class='del'>-	spin_unlock_irqrestore(&amp;h-&gt;lock, flags);</div><div class='add'>+	spin_unlock(&amp;h-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> done_nolock:</div><div class='ctx'> 	if (!keep_cache)</div><div class='ctx'> 		remove_rbio_from_cache(rbio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void __free_raid_bio(struct btrfs_raid_bio *rbio)</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	if (!refcount_dec_and_test(&amp;rbio-&gt;refs))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	WARN_ON(!list_empty(&amp;rbio-&gt;stripe_cache));</div><div class='del'>-	WARN_ON(!list_empty(&amp;rbio-&gt;hash_list));</div><div class='del'>-	WARN_ON(!bio_list_empty(&amp;rbio-&gt;bio_list));</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; rbio-&gt;nr_pages; i++) {</div><div class='del'>-		if (rbio-&gt;stripe_pages[i]) {</div><div class='del'>-			__free_page(rbio-&gt;stripe_pages[i]);</div><div class='del'>-			rbio-&gt;stripe_pages[i] = NULL;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	btrfs_put_bioc(rbio-&gt;bioc);</div><div class='del'>-	kfree(rbio);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void rbio_endio_bio_list(struct bio *cur, blk_status_t err)</div><div class='add'>+static void rbio_endio_bio_list(struct bio *cur, blk_status_t status)</div><div class='ctx'> {</div><div class='ctx'> 	struct bio *next;</div><div class='ctx'> </div><div class='ctx'> 	while (cur) {</div><div class='ctx'> 		next = cur-&gt;bi_next;</div><div class='ctx'> 		cur-&gt;bi_next = NULL;</div><div class='del'>-		cur-&gt;bi_status = err;</div><div class='add'>+		cur-&gt;bi_status = status;</div><div class='ctx'> 		bio_endio(cur);</div><div class='ctx'> 		cur = next;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -857,13 +960,22 @@ static void rbio_endio_bio_list(struct bio *cur, blk_status_t err)</div><div class='ctx'>  * this frees the rbio and runs through all the bios in the</div><div class='ctx'>  * bio_list and calls end_io on them</div><div class='ctx'>  */</div><div class='del'>-static void rbio_orig_end_io(struct btrfs_raid_bio *rbio, blk_status_t err)</div><div class='add'>+static void rbio_orig_end_io(struct btrfs_raid_bio *rbio, blk_status_t status)</div><div class='ctx'> {</div><div class='ctx'> 	struct bio *cur = bio_list_get(&amp;rbio-&gt;bio_list);</div><div class='ctx'> 	struct bio *extra;</div><div class='ctx'> </div><div class='del'>-	if (rbio-&gt;generic_bio_cnt)</div><div class='del'>-		btrfs_bio_counter_sub(rbio-&gt;bioc-&gt;fs_info, rbio-&gt;generic_bio_cnt);</div><div class='add'>+	kfree(rbio-&gt;csum_buf);</div><div class='add'>+	bitmap_free(rbio-&gt;csum_bitmap);</div><div class='add'>+	rbio-&gt;csum_buf = NULL;</div><div class='add'>+	rbio-&gt;csum_bitmap = NULL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Clear the data bitmap, as the rbio may be cached for later usage.</div><div class='add'>+	 * do this before before unlock_stripe() so there will be no new bio</div><div class='add'>+	 * for this bio.</div><div class='add'>+	 */</div><div class='add'>+	bitmap_clear(&amp;rbio-&gt;dbitmap, 0, rbio-&gt;stripe_nsectors);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * At this moment, rbio-&gt;bio_list is empty, however since rbio does not</div><div class='hunk'>@@ -875,83 +987,70 @@ static void rbio_orig_end_io(struct btrfs_raid_bio *rbio, blk_status_t err)</div><div class='ctx'> 	 */</div><div class='ctx'> 	unlock_stripe(rbio);</div><div class='ctx'> 	extra = bio_list_get(&amp;rbio-&gt;bio_list);</div><div class='del'>-	__free_raid_bio(rbio);</div><div class='add'>+	free_raid_bio(rbio);</div><div class='ctx'> </div><div class='del'>-	rbio_endio_bio_list(cur, err);</div><div class='add'>+	rbio_endio_bio_list(cur, status);</div><div class='ctx'> 	if (extra)</div><div class='del'>-		rbio_endio_bio_list(extra, err);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * end io function used by finish_rmw.  When we finally</div><div class='del'>- * get here, we've written a full stripe</div><div class='del'>- */</div><div class='del'>-static void raid_write_end_io(struct bio *bio)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_raid_bio *rbio = bio-&gt;bi_private;</div><div class='del'>-	blk_status_t err = bio-&gt;bi_status;</div><div class='del'>-	int max_errors;</div><div class='del'>-</div><div class='del'>-	if (err)</div><div class='del'>-		fail_bio_stripe(rbio, bio);</div><div class='del'>-</div><div class='del'>-	bio_put(bio);</div><div class='del'>-</div><div class='del'>-	if (!atomic_dec_and_test(&amp;rbio-&gt;stripes_pending))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	err = BLK_STS_OK;</div><div class='del'>-</div><div class='del'>-	/* OK, we have read all the stripes we need to. */</div><div class='del'>-	max_errors = (rbio-&gt;operation == BTRFS_RBIO_PARITY_SCRUB) ?</div><div class='del'>-		     0 : rbio-&gt;bioc-&gt;max_errors;</div><div class='del'>-	if (atomic_read(&amp;rbio-&gt;error) &gt; max_errors)</div><div class='del'>-		err = BLK_STS_IOERR;</div><div class='del'>-</div><div class='del'>-	rbio_orig_end_io(rbio, err);</div><div class='add'>+		rbio_endio_bio_list(extra, status);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * the read/modify/write code wants to use the original bio for</div><div class='del'>- * any pages it included, and then use the rbio for everything</div><div class='del'>- * else.  This function decides if a given index (stripe number)</div><div class='del'>- * and page number in that stripe fall inside the original bio</div><div class='del'>- * or the rbio.</div><div class='add'>+ * Get paddr pointer for the sector specified by its @stripe_nr and @sector_nr.</div><div class='ctx'>  *</div><div class='del'>- * if you set bio_list_only, you'll get a NULL back for any ranges</div><div class='del'>- * that are outside the bio_list</div><div class='add'>+ * @rbio:               The raid bio</div><div class='add'>+ * @stripe_nr:          Stripe number, valid range [0, real_stripe)</div><div class='add'>+ * @sector_nr:		Sector number inside the stripe,</div><div class='add'>+ *			valid range [0, stripe_nsectors)</div><div class='add'>+ * @bio_list_only:      Whether to use sectors inside the bio list only.</div><div class='ctx'>  *</div><div class='del'>- * This doesn't take any refs on anything, you get a bare page pointer</div><div class='del'>- * and the caller must bump refs as required.</div><div class='add'>+ * The read/modify/write code wants to reuse the original bio page as much</div><div class='add'>+ * as possible, and only use stripe_sectors as fallback.</div><div class='ctx'>  *</div><div class='del'>- * You must call index_rbio_pages once before you can trust</div><div class='del'>- * the answers from this function.</div><div class='add'>+ * Return NULL if bio_list_only is set but the specified sector has no</div><div class='add'>+ * coresponding bio.</div><div class='ctx'>  */</div><div class='del'>-static struct page *page_in_rbio(struct btrfs_raid_bio *rbio,</div><div class='del'>-				 int index, int pagenr, int bio_list_only)</div><div class='add'>+static phys_addr_t *sector_paddrs_in_rbio(struct btrfs_raid_bio *rbio,</div><div class='add'>+					  int stripe_nr, int sector_nr,</div><div class='add'>+					  bool bio_list_only)</div><div class='ctx'> {</div><div class='del'>-	int chunk_page;</div><div class='del'>-	struct page *p = NULL;</div><div class='add'>+	phys_addr_t *ret = NULL;</div><div class='add'>+	const int index = rbio_paddr_index(rbio, stripe_nr, sector_nr, 0);</div><div class='ctx'> </div><div class='del'>-	chunk_page = index * (rbio-&gt;stripe_len &gt;&gt; PAGE_SHIFT) + pagenr;</div><div class='add'>+	ASSERT(index &gt;= 0 &amp;&amp; index &lt; rbio-&gt;nr_sectors * rbio-&gt;sector_nsteps);</div><div class='ctx'> </div><div class='del'>-	spin_lock_irq(&amp;rbio-&gt;bio_list_lock);</div><div class='del'>-	p = rbio-&gt;bio_pages[chunk_page];</div><div class='del'>-	spin_unlock_irq(&amp;rbio-&gt;bio_list_lock);</div><div class='del'>-</div><div class='del'>-	if (p || bio_list_only)</div><div class='del'>-		return p;</div><div class='del'>-</div><div class='del'>-	return rbio-&gt;stripe_pages[chunk_page];</div><div class='add'>+	scoped_guard(spinlock, &amp;rbio-&gt;bio_list_lock) {</div><div class='add'>+		if (rbio-&gt;bio_paddrs[index] != INVALID_PADDR || bio_list_only) {</div><div class='add'>+			/* Don't return sector without a valid page pointer */</div><div class='add'>+			if (rbio-&gt;bio_paddrs[index] != INVALID_PADDR)</div><div class='add'>+				ret = &amp;rbio-&gt;bio_paddrs[index];</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	return &amp;rbio-&gt;stripe_paddrs[index];</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * number of pages we need for the entire stripe across all the</div><div class='del'>- * drives</div><div class='add'>+ * Similar to sector_paddr_in_rbio(), but with extra consideration for</div><div class='add'>+ * bs &gt; ps cases, where we can have multiple steps for a fs block.</div><div class='ctx'>  */</div><div class='del'>-static unsigned long rbio_nr_pages(unsigned long stripe_len, int nr_stripes)</div><div class='add'>+static phys_addr_t sector_paddr_in_rbio(struct btrfs_raid_bio *rbio,</div><div class='add'>+					int stripe_nr, int sector_nr, int step_nr,</div><div class='add'>+					bool bio_list_only)</div><div class='ctx'> {</div><div class='del'>-	return DIV_ROUND_UP(stripe_len, PAGE_SIZE) * nr_stripes;</div><div class='add'>+	phys_addr_t ret = INVALID_PADDR;</div><div class='add'>+	const int index = rbio_paddr_index(rbio, stripe_nr, sector_nr, step_nr);</div><div class='add'>+</div><div class='add'>+	ASSERT(index &gt;= 0 &amp;&amp; index &lt; rbio-&gt;nr_sectors * rbio-&gt;sector_nsteps);</div><div class='add'>+</div><div class='add'>+	scoped_guard(spinlock, &amp;rbio-&gt;bio_list_lock) {</div><div class='add'>+		if (rbio-&gt;bio_paddrs[index] != INVALID_PADDR || bio_list_only) {</div><div class='add'>+			/* Don't return sector without a valid page pointer */</div><div class='add'>+			if (rbio-&gt;bio_paddrs[index] != INVALID_PADDR)</div><div class='add'>+				ret = rbio-&gt;bio_paddrs[index];</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	return rbio-&gt;stripe_paddrs[index];</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -959,134 +1058,223 @@ static unsigned long rbio_nr_pages(unsigned long stripe_len, int nr_stripes)</div><div class='ctx'>  * this does not allocate any pages for rbio-&gt;pages.</div><div class='ctx'>  */</div><div class='ctx'> static struct btrfs_raid_bio *alloc_rbio(struct btrfs_fs_info *fs_info,</div><div class='del'>-					 struct btrfs_io_context *bioc,</div><div class='del'>-					 u64 stripe_len)</div><div class='del'>-{</div><div class='add'>+					 struct btrfs_io_context *bioc)</div><div class='add'>+{</div><div class='add'>+	const unsigned int real_stripes = bioc-&gt;num_stripes - bioc-&gt;replace_nr_stripes;</div><div class='add'>+	const unsigned int stripe_npages = BTRFS_STRIPE_LEN &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	const unsigned int num_pages = stripe_npages * real_stripes;</div><div class='add'>+	const unsigned int stripe_nsectors =</div><div class='add'>+		BTRFS_STRIPE_LEN &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='add'>+	const unsigned int num_sectors = stripe_nsectors * real_stripes;</div><div class='add'>+	const unsigned int step = min(fs_info-&gt;sectorsize, PAGE_SIZE);</div><div class='add'>+	const unsigned int sector_nsteps = fs_info-&gt;sectorsize / step;</div><div class='ctx'> 	struct btrfs_raid_bio *rbio;</div><div class='del'>-	int nr_data = 0;</div><div class='del'>-	int real_stripes = bioc-&gt;num_stripes - bioc-&gt;num_tgtdevs;</div><div class='del'>-	int num_pages = rbio_nr_pages(stripe_len, real_stripes);</div><div class='del'>-	int stripe_npages = DIV_ROUND_UP(stripe_len, PAGE_SIZE);</div><div class='del'>-	void *p;</div><div class='del'>-</div><div class='del'>-	rbio = kzalloc(sizeof(*rbio) +</div><div class='del'>-		       sizeof(*rbio-&gt;stripe_pages) * num_pages +</div><div class='del'>-		       sizeof(*rbio-&gt;bio_pages) * num_pages +</div><div class='del'>-		       sizeof(*rbio-&gt;finish_pointers) * real_stripes +</div><div class='del'>-		       sizeof(*rbio-&gt;dbitmap) * BITS_TO_LONGS(stripe_npages) +</div><div class='del'>-		       sizeof(*rbio-&gt;finish_pbitmap) *</div><div class='del'>-				BITS_TO_LONGS(stripe_npages),</div><div class='del'>-		       GFP_NOFS);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * For bs &lt;= ps cases, ps must be aligned to bs.</div><div class='add'>+	 * For bs &gt; ps cases, bs must be aligned to ps.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(IS_ALIGNED(PAGE_SIZE, fs_info-&gt;sectorsize) ||</div><div class='add'>+	       IS_ALIGNED(fs_info-&gt;sectorsize, PAGE_SIZE));</div><div class='add'>+	/*</div><div class='add'>+	 * Our current stripe len should be fixed to 64k thus stripe_nsectors</div><div class='add'>+	 * (at most 16) should be no larger than BITS_PER_LONG.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(stripe_nsectors &lt;= BITS_PER_LONG);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Real stripes must be between 2 (2 disks RAID5, aka RAID1) and 256</div><div class='add'>+	 * (limited by u8).</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(real_stripes &gt;= 2);</div><div class='add'>+	ASSERT(real_stripes &lt;= U8_MAX);</div><div class='add'>+</div><div class='add'>+	rbio = kzalloc(sizeof(*rbio), GFP_NOFS);</div><div class='ctx'> 	if (!rbio)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='add'>+	rbio-&gt;stripe_pages = kcalloc(num_pages, sizeof(struct page *),</div><div class='add'>+				     GFP_NOFS);</div><div class='add'>+	rbio-&gt;bio_paddrs = kcalloc(num_sectors * sector_nsteps, sizeof(phys_addr_t), GFP_NOFS);</div><div class='add'>+	rbio-&gt;stripe_paddrs = kcalloc(num_sectors * sector_nsteps, sizeof(phys_addr_t), GFP_NOFS);</div><div class='add'>+	rbio-&gt;finish_pointers = kcalloc(real_stripes, sizeof(void *), GFP_NOFS);</div><div class='add'>+	rbio-&gt;error_bitmap = bitmap_zalloc(num_sectors, GFP_NOFS);</div><div class='add'>+	rbio-&gt;stripe_uptodate_bitmap = bitmap_zalloc(num_sectors, GFP_NOFS);</div><div class='add'>+</div><div class='add'>+	if (!rbio-&gt;stripe_pages || !rbio-&gt;bio_paddrs || !rbio-&gt;stripe_paddrs ||</div><div class='add'>+	    !rbio-&gt;finish_pointers || !rbio-&gt;error_bitmap || !rbio-&gt;stripe_uptodate_bitmap) {</div><div class='add'>+		free_raid_bio_pointers(rbio);</div><div class='add'>+		kfree(rbio);</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+	}</div><div class='add'>+	for (int i = 0; i &lt; num_sectors * sector_nsteps; i++) {</div><div class='add'>+		rbio-&gt;stripe_paddrs[i] = INVALID_PADDR;</div><div class='add'>+		rbio-&gt;bio_paddrs[i] = INVALID_PADDR;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	bio_list_init(&amp;rbio-&gt;bio_list);</div><div class='add'>+	init_waitqueue_head(&amp;rbio-&gt;io_wait);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;rbio-&gt;plug_list);</div><div class='ctx'> 	spin_lock_init(&amp;rbio-&gt;bio_list_lock);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;rbio-&gt;stripe_cache);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;rbio-&gt;hash_list);</div><div class='add'>+	btrfs_get_bioc(bioc);</div><div class='ctx'> 	rbio-&gt;bioc = bioc;</div><div class='del'>-	rbio-&gt;stripe_len = stripe_len;</div><div class='ctx'> 	rbio-&gt;nr_pages = num_pages;</div><div class='add'>+	rbio-&gt;nr_sectors = num_sectors;</div><div class='ctx'> 	rbio-&gt;real_stripes = real_stripes;</div><div class='ctx'> 	rbio-&gt;stripe_npages = stripe_npages;</div><div class='del'>-	rbio-&gt;faila = -1;</div><div class='del'>-	rbio-&gt;failb = -1;</div><div class='add'>+	rbio-&gt;stripe_nsectors = stripe_nsectors;</div><div class='add'>+	rbio-&gt;sector_nsteps = sector_nsteps;</div><div class='ctx'> 	refcount_set(&amp;rbio-&gt;refs, 1);</div><div class='del'>-	atomic_set(&amp;rbio-&gt;error, 0);</div><div class='ctx'> 	atomic_set(&amp;rbio-&gt;stripes_pending, 0);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * the stripe_pages, bio_pages, etc arrays point to the extra</div><div class='del'>-	 * memory we allocated past the end of the rbio</div><div class='del'>-	 */</div><div class='del'>-	p = rbio + 1;</div><div class='del'>-#define CONSUME_ALLOC(ptr, count)	do {				\</div><div class='del'>-		ptr = p;						\</div><div class='del'>-		p = (unsigned char *)p + sizeof(*(ptr)) * (count);	\</div><div class='del'>-	} while (0)</div><div class='del'>-	CONSUME_ALLOC(rbio-&gt;stripe_pages, num_pages);</div><div class='del'>-	CONSUME_ALLOC(rbio-&gt;bio_pages, num_pages);</div><div class='del'>-	CONSUME_ALLOC(rbio-&gt;finish_pointers, real_stripes);</div><div class='del'>-	CONSUME_ALLOC(rbio-&gt;dbitmap, BITS_TO_LONGS(stripe_npages));</div><div class='del'>-	CONSUME_ALLOC(rbio-&gt;finish_pbitmap, BITS_TO_LONGS(stripe_npages));</div><div class='del'>-#undef  CONSUME_ALLOC</div><div class='del'>-</div><div class='del'>-	if (bioc-&gt;map_type &amp; BTRFS_BLOCK_GROUP_RAID5)</div><div class='del'>-		nr_data = real_stripes - 1;</div><div class='del'>-	else if (bioc-&gt;map_type &amp; BTRFS_BLOCK_GROUP_RAID6)</div><div class='del'>-		nr_data = real_stripes - 2;</div><div class='del'>-	else</div><div class='del'>-		BUG();</div><div class='add'>+	ASSERT(btrfs_nr_parity_stripes(bioc-&gt;map_type));</div><div class='add'>+	rbio-&gt;nr_data = real_stripes - btrfs_nr_parity_stripes(bioc-&gt;map_type);</div><div class='add'>+	ASSERT(rbio-&gt;nr_data &gt; 0);</div><div class='ctx'> </div><div class='del'>-	rbio-&gt;nr_data = nr_data;</div><div class='ctx'> 	return rbio;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* allocate pages for all the stripes in the bio, including parity */</div><div class='ctx'> static int alloc_rbio_pages(struct btrfs_raid_bio *rbio)</div><div class='ctx'> {</div><div class='del'>-	int i;</div><div class='del'>-	struct page *page;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; rbio-&gt;nr_pages; i++) {</div><div class='del'>-		if (rbio-&gt;stripe_pages[i])</div><div class='del'>-			continue;</div><div class='del'>-		page = alloc_page(GFP_NOFS);</div><div class='del'>-		if (!page)</div><div class='del'>-			return -ENOMEM;</div><div class='del'>-		rbio-&gt;stripe_pages[i] = page;</div><div class='del'>-	}</div><div class='add'>+	ret = btrfs_alloc_page_array(rbio-&gt;nr_pages, rbio-&gt;stripe_pages, false);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+	/* Mapping all sectors */</div><div class='add'>+	index_stripe_sectors(rbio);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* only allocate pages for p/q stripes */</div><div class='ctx'> static int alloc_rbio_parity_pages(struct btrfs_raid_bio *rbio)</div><div class='ctx'> {</div><div class='del'>-	int i;</div><div class='del'>-	struct page *page;</div><div class='add'>+	const int data_pages = rbio-&gt;nr_data * rbio-&gt;stripe_npages;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_alloc_page_array(rbio-&gt;nr_pages - data_pages,</div><div class='add'>+				     rbio-&gt;stripe_pages + data_pages, false);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	i = rbio_stripe_page_index(rbio, rbio-&gt;nr_data, 0);</div><div class='add'>+	index_stripe_sectors(rbio);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	for (; i &lt; rbio-&gt;nr_pages; i++) {</div><div class='del'>-		if (rbio-&gt;stripe_pages[i])</div><div class='del'>-			continue;</div><div class='del'>-		page = alloc_page(GFP_NOFS);</div><div class='del'>-		if (!page)</div><div class='del'>-			return -ENOMEM;</div><div class='del'>-		rbio-&gt;stripe_pages[i] = page;</div><div class='add'>+/*</div><div class='add'>+ * Return the total number of errors found in the vertical stripe of @sector_nr.</div><div class='add'>+ *</div><div class='add'>+ * @faila and @failb will also be updated to the first and second stripe</div><div class='add'>+ * number of the errors.</div><div class='add'>+ */</div><div class='add'>+static int get_rbio_vertical_errors(struct btrfs_raid_bio *rbio, int sector_nr,</div><div class='add'>+				    int *faila, int *failb)</div><div class='add'>+{</div><div class='add'>+	int stripe_nr;</div><div class='add'>+	int found_errors = 0;</div><div class='add'>+</div><div class='add'>+	if (faila || failb) {</div><div class='add'>+		/*</div><div class='add'>+		 * Both @faila and @failb should be valid pointers if any of</div><div class='add'>+		 * them is specified.</div><div class='add'>+		 */</div><div class='add'>+		ASSERT(faila &amp;&amp; failb);</div><div class='add'>+		*faila = -1;</div><div class='add'>+		*failb = -1;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	for (stripe_nr = 0; stripe_nr &lt; rbio-&gt;real_stripes; stripe_nr++) {</div><div class='add'>+		int total_sector_nr = stripe_nr * rbio-&gt;stripe_nsectors + sector_nr;</div><div class='add'>+</div><div class='add'>+		if (test_bit(total_sector_nr, rbio-&gt;error_bitmap)) {</div><div class='add'>+			found_errors++;</div><div class='add'>+			if (faila) {</div><div class='add'>+				/* Update faila and failb. */</div><div class='add'>+				if (*faila &lt; 0)</div><div class='add'>+					*faila = stripe_nr;</div><div class='add'>+				else if (*failb &lt; 0)</div><div class='add'>+					*failb = stripe_nr;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	return found_errors;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int bio_add_paddrs(struct bio *bio, phys_addr_t *paddrs, unsigned int nr_steps,</div><div class='add'>+			  unsigned int step)</div><div class='add'>+{</div><div class='add'>+	int added = 0;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	for (int i = 0; i &lt; nr_steps; i++) {</div><div class='add'>+		ret = bio_add_page(bio, phys_to_page(paddrs[i]), step,</div><div class='add'>+				   offset_in_page(paddrs[i]));</div><div class='add'>+		if (ret != step)</div><div class='add'>+			goto revert;</div><div class='add'>+		added += ret;</div><div class='add'>+	}</div><div class='add'>+	return added;</div><div class='add'>+revert:</div><div class='add'>+	/*</div><div class='add'>+	 * We don't need to revert the bvec, as the bio will be submitted immediately,</div><div class='add'>+	 * as long as the size is reduced the extra bvec will not be accessed.</div><div class='add'>+	 */</div><div class='add'>+	bio-&gt;bi_iter.bi_size -= added;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * add a single page from a specific stripe into our list of bios for IO</div><div class='del'>- * this will try to merge into existing bios if possible, and returns</div><div class='del'>- * zero if all went well.</div><div class='add'>+ * Add a single sector @sector into our list of bios for IO.</div><div class='add'>+ *</div><div class='add'>+ * Return 0 if everything went well.</div><div class='add'>+ * Return &lt;0 for error, and no byte will be added to @rbio.</div><div class='ctx'>  */</div><div class='del'>-static int rbio_add_io_page(struct btrfs_raid_bio *rbio,</div><div class='del'>-			    struct bio_list *bio_list,</div><div class='del'>-			    struct page *page,</div><div class='del'>-			    int stripe_nr,</div><div class='del'>-			    unsigned long page_index,</div><div class='del'>-			    unsigned long bio_max_len)</div><div class='add'>+static int rbio_add_io_paddrs(struct btrfs_raid_bio *rbio, struct bio_list *bio_list,</div><div class='add'>+			      phys_addr_t *paddrs, unsigned int stripe_nr,</div><div class='add'>+			      unsigned int sector_nr, enum req_op op)</div><div class='ctx'> {</div><div class='add'>+	const u32 sectorsize = rbio-&gt;bioc-&gt;fs_info-&gt;sectorsize;</div><div class='add'>+	const u32 step = min(sectorsize, PAGE_SIZE);</div><div class='ctx'> 	struct bio *last = bio_list-&gt;tail;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct bio *bio;</div><div class='ctx'> 	struct btrfs_io_stripe *stripe;</div><div class='ctx'> 	u64 disk_start;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Note: here stripe_nr has taken device replace into consideration,</div><div class='add'>+	 * thus it can be larger than rbio-&gt;real_stripe.</div><div class='add'>+	 * So here we check against bioc-&gt;num_stripes, not rbio-&gt;real_stripes.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT_RBIO_STRIPE(stripe_nr &gt;= 0 &amp;&amp; stripe_nr &lt; rbio-&gt;bioc-&gt;num_stripes,</div><div class='add'>+			   rbio, stripe_nr);</div><div class='add'>+	ASSERT_RBIO_SECTOR(sector_nr &gt;= 0 &amp;&amp; sector_nr &lt; rbio-&gt;stripe_nsectors,</div><div class='add'>+			   rbio, sector_nr);</div><div class='add'>+	ASSERT(paddrs != NULL);</div><div class='add'>+</div><div class='ctx'> 	stripe = &amp;rbio-&gt;bioc-&gt;stripes[stripe_nr];</div><div class='del'>-	disk_start = stripe-&gt;physical + (page_index &lt;&lt; PAGE_SHIFT);</div><div class='add'>+	disk_start = stripe-&gt;physical + sector_nr * sectorsize;</div><div class='ctx'> </div><div class='ctx'> 	/* if the device is missing, just fail this stripe */</div><div class='del'>-	if (!stripe-&gt;dev-&gt;bdev)</div><div class='del'>-		return fail_rbio_index(rbio, stripe_nr);</div><div class='add'>+	if (!stripe-&gt;dev-&gt;bdev) {</div><div class='add'>+		int found_errors;</div><div class='add'>+</div><div class='add'>+		set_bit(stripe_nr * rbio-&gt;stripe_nsectors + sector_nr,</div><div class='add'>+			rbio-&gt;error_bitmap);</div><div class='add'>+</div><div class='add'>+		/* Check if we have reached tolerance early. */</div><div class='add'>+		found_errors = get_rbio_vertical_errors(rbio, sector_nr,</div><div class='add'>+							NULL, NULL);</div><div class='add'>+		if (unlikely(found_errors &gt; rbio-&gt;bioc-&gt;max_errors))</div><div class='add'>+			return -EIO;</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* see if we can add this page onto our existing bio */</div><div class='ctx'> 	if (last) {</div><div class='del'>-		u64 last_end = last-&gt;bi_iter.bi_sector &lt;&lt; 9;</div><div class='add'>+		u64 last_end = last-&gt;bi_iter.bi_sector &lt;&lt; SECTOR_SHIFT;</div><div class='ctx'> 		last_end += last-&gt;bi_iter.bi_size;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='hunk'>@@ -1095,38 +1283,40 @@ static int rbio_add_io_page(struct btrfs_raid_bio *rbio,</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (last_end == disk_start &amp;&amp; !last-&gt;bi_status &amp;&amp;</div><div class='ctx'> 		    last-&gt;bi_bdev == stripe-&gt;dev-&gt;bdev) {</div><div class='del'>-			ret = bio_add_page(last, page, PAGE_SIZE, 0);</div><div class='del'>-			if (ret == PAGE_SIZE)</div><div class='add'>+			ret = bio_add_paddrs(last, paddrs, rbio-&gt;sector_nsteps, step);</div><div class='add'>+			if (ret == sectorsize)</div><div class='ctx'> 				return 0;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* put a new bio on the list */</div><div class='del'>-	bio = btrfs_bio_alloc(bio_max_len &gt;&gt; PAGE_SHIFT ?: 1);</div><div class='del'>-	btrfs_bio(bio)-&gt;device = stripe-&gt;dev;</div><div class='del'>-	bio-&gt;bi_iter.bi_size = 0;</div><div class='del'>-	bio_set_dev(bio, stripe-&gt;dev-&gt;bdev);</div><div class='del'>-	bio-&gt;bi_iter.bi_sector = disk_start &gt;&gt; 9;</div><div class='del'>-</div><div class='del'>-	bio_add_page(bio, page, PAGE_SIZE, 0);</div><div class='add'>+	bio = bio_alloc(stripe-&gt;dev-&gt;bdev,</div><div class='add'>+			max(BTRFS_STRIPE_LEN &gt;&gt; PAGE_SHIFT, 1),</div><div class='add'>+			op, GFP_NOFS);</div><div class='add'>+	bio-&gt;bi_iter.bi_sector = disk_start &gt;&gt; SECTOR_SHIFT;</div><div class='add'>+	bio-&gt;bi_private = rbio;</div><div class='add'>+</div><div class='add'>+	ret = bio_add_paddrs(bio, paddrs, rbio-&gt;sector_nsteps, step);</div><div class='add'>+	ASSERT(ret == sectorsize);</div><div class='ctx'> 	bio_list_add(bio_list, bio);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * while we're doing the read/modify/write cycle, we could</div><div class='del'>- * have errors in reading pages off the disk.  This checks</div><div class='del'>- * for errors and if we're not able to read the page it'll</div><div class='del'>- * trigger parity reconstruction.  The rmw will be finished</div><div class='del'>- * after we've reconstructed the failed stripes</div><div class='del'>- */</div><div class='del'>-static void validate_rbio_for_rmw(struct btrfs_raid_bio *rbio)</div><div class='add'>+static void index_one_bio(struct btrfs_raid_bio *rbio, struct bio *bio)</div><div class='ctx'> {</div><div class='del'>-	if (rbio-&gt;faila &gt;= 0 || rbio-&gt;failb &gt;= 0) {</div><div class='del'>-		BUG_ON(rbio-&gt;faila == rbio-&gt;real_stripes - 1);</div><div class='del'>-		__raid56_parity_recover(rbio);</div><div class='del'>-	} else {</div><div class='del'>-		finish_rmw(rbio);</div><div class='add'>+	struct btrfs_fs_info *fs_info = rbio-&gt;bioc-&gt;fs_info;</div><div class='add'>+	const u32 step = min(fs_info-&gt;sectorsize, PAGE_SIZE);</div><div class='add'>+	const u32 step_bits = min(fs_info-&gt;sectorsize_bits, PAGE_SHIFT);</div><div class='add'>+	struct bvec_iter iter = bio-&gt;bi_iter;</div><div class='add'>+	phys_addr_t paddr;</div><div class='add'>+	u32 offset = (bio-&gt;bi_iter.bi_sector &lt;&lt; SECTOR_SHIFT) -</div><div class='add'>+		     rbio-&gt;bioc-&gt;full_stripe_logical;</div><div class='add'>+</div><div class='add'>+	btrfs_bio_for_each_block(paddr, bio, &amp;iter, step) {</div><div class='add'>+		unsigned int index = (offset &gt;&gt; step_bits);</div><div class='add'>+</div><div class='add'>+		rbio-&gt;bio_paddrs[index] = paddr;</div><div class='add'>+		offset += step;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1141,479 +1331,437 @@ static void validate_rbio_for_rmw(struct btrfs_raid_bio *rbio)</div><div class='ctx'> static void index_rbio_pages(struct btrfs_raid_bio *rbio)</div><div class='ctx'> {</div><div class='ctx'> 	struct bio *bio;</div><div class='del'>-	u64 start;</div><div class='del'>-	unsigned long stripe_offset;</div><div class='del'>-	unsigned long page_index;</div><div class='del'>-</div><div class='del'>-	spin_lock_irq(&amp;rbio-&gt;bio_list_lock);</div><div class='del'>-	bio_list_for_each(bio, &amp;rbio-&gt;bio_list) {</div><div class='del'>-		struct bio_vec bvec;</div><div class='del'>-		struct bvec_iter iter;</div><div class='del'>-		int i = 0;</div><div class='del'>-</div><div class='del'>-		start = bio-&gt;bi_iter.bi_sector &lt;&lt; 9;</div><div class='del'>-		stripe_offset = start - rbio-&gt;bioc-&gt;raid_map[0];</div><div class='del'>-		page_index = stripe_offset &gt;&gt; PAGE_SHIFT;</div><div class='del'>-</div><div class='del'>-		if (bio_flagged(bio, BIO_CLONED))</div><div class='del'>-			bio-&gt;bi_iter = btrfs_bio(bio)-&gt;iter;</div><div class='del'>-</div><div class='del'>-		bio_for_each_segment(bvec, bio, iter) {</div><div class='del'>-			rbio-&gt;bio_pages[page_index + i] = bvec.bv_page;</div><div class='del'>-			i++;</div><div class='del'>-		}</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;rbio-&gt;bio_list_lock);</div><div class='add'>+	bio_list_for_each(bio, &amp;rbio-&gt;bio_list)</div><div class='add'>+		index_one_bio(rbio, bio);</div><div class='add'>+</div><div class='add'>+	spin_unlock(&amp;rbio-&gt;bio_list_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void bio_get_trace_info(struct btrfs_raid_bio *rbio, struct bio *bio,</div><div class='add'>+			       struct raid56_bio_trace_info *trace_info)</div><div class='add'>+{</div><div class='add'>+	const struct btrfs_io_context *bioc = rbio-&gt;bioc;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	ASSERT(bioc);</div><div class='add'>+</div><div class='add'>+	/* We rely on bio-&gt;bi_bdev to find the stripe number. */</div><div class='add'>+	if (!bio-&gt;bi_bdev)</div><div class='add'>+		goto not_found;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; bioc-&gt;num_stripes; i++) {</div><div class='add'>+		if (bio-&gt;bi_bdev != bioc-&gt;stripes[i].dev-&gt;bdev)</div><div class='add'>+			continue;</div><div class='add'>+		trace_info-&gt;stripe_nr = i;</div><div class='add'>+		trace_info-&gt;devid = bioc-&gt;stripes[i].dev-&gt;devid;</div><div class='add'>+		trace_info-&gt;offset = (bio-&gt;bi_iter.bi_sector &lt;&lt; SECTOR_SHIFT) -</div><div class='add'>+				     bioc-&gt;stripes[i].physical;</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock_irq(&amp;rbio-&gt;bio_list_lock);</div><div class='add'>+</div><div class='add'>+not_found:</div><div class='add'>+	trace_info-&gt;devid = -1;</div><div class='add'>+	trace_info-&gt;offset = -1;</div><div class='add'>+	trace_info-&gt;stripe_nr = -1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * this is called from one of two situations.  We either</div><div class='del'>- * have a full stripe from the higher layers, or we've read all</div><div class='del'>- * the missing bits off disk.</div><div class='del'>- *</div><div class='del'>- * This will calculate the parity and then send down any</div><div class='del'>- * changed blocks.</div><div class='del'>- */</div><div class='del'>-static noinline void finish_rmw(struct btrfs_raid_bio *rbio)</div><div class='add'>+static inline void bio_list_put(struct bio_list *bio_list)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_io_context *bioc = rbio-&gt;bioc;</div><div class='del'>-	void **pointers = rbio-&gt;finish_pointers;</div><div class='del'>-	int nr_data = rbio-&gt;nr_data;</div><div class='del'>-	int stripe;</div><div class='del'>-	int pagenr;</div><div class='del'>-	bool has_qstripe;</div><div class='del'>-	struct bio_list bio_list;</div><div class='ctx'> 	struct bio *bio;</div><div class='del'>-	int ret;</div><div class='ctx'> </div><div class='del'>-	bio_list_init(&amp;bio_list);</div><div class='add'>+	while ((bio = bio_list_pop(bio_list)))</div><div class='add'>+		bio_put(bio);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if (rbio-&gt;real_stripes - rbio-&gt;nr_data == 1)</div><div class='del'>-		has_qstripe = false;</div><div class='del'>-	else if (rbio-&gt;real_stripes - rbio-&gt;nr_data == 2)</div><div class='del'>-		has_qstripe = true;</div><div class='del'>-	else</div><div class='del'>-		BUG();</div><div class='add'>+static void assert_rbio(struct btrfs_raid_bio *rbio)</div><div class='add'>+{</div><div class='add'>+	if (!IS_ENABLED(CONFIG_BTRFS_ASSERT))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	/* at this point we either have a full stripe,</div><div class='del'>-	 * or we've read the full stripe from the drive.</div><div class='del'>-	 * recalculate the parity and write the new results.</div><div class='del'>-	 *</div><div class='del'>-	 * We're not allowed to add any new bios to the</div><div class='del'>-	 * bio list here, anyone else that wants to</div><div class='del'>-	 * change this stripe needs to do their own rmw.</div><div class='add'>+	/*</div><div class='add'>+	 * At least two stripes (2 disks RAID5), and since real_stripes is U8,</div><div class='add'>+	 * we won't go beyond 256 disks anyway.</div><div class='ctx'> 	 */</div><div class='del'>-	spin_lock_irq(&amp;rbio-&gt;bio_list_lock);</div><div class='del'>-	set_bit(RBIO_RMW_LOCKED_BIT, &amp;rbio-&gt;flags);</div><div class='del'>-	spin_unlock_irq(&amp;rbio-&gt;bio_list_lock);</div><div class='del'>-</div><div class='del'>-	atomic_set(&amp;rbio-&gt;error, 0);</div><div class='add'>+	ASSERT_RBIO(rbio-&gt;real_stripes &gt;= 2, rbio);</div><div class='add'>+	ASSERT_RBIO(rbio-&gt;nr_data &gt; 0, rbio);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * now that we've set rmw_locked, run through the</div><div class='del'>-	 * bio list one last time and map the page pointers</div><div class='del'>-	 *</div><div class='del'>-	 * We don't cache full rbios because we're assuming</div><div class='del'>-	 * the higher layers are unlikely to use this area of</div><div class='del'>-	 * the disk again soon.  If they do use it again,</div><div class='del'>-	 * hopefully they will send another full bio.</div><div class='add'>+	 * This is another check to make sure nr data stripes is smaller</div><div class='add'>+	 * than total stripes.</div><div class='ctx'> 	 */</div><div class='del'>-	index_rbio_pages(rbio);</div><div class='del'>-	if (!rbio_is_full(rbio))</div><div class='del'>-		cache_rbio_pages(rbio);</div><div class='del'>-	else</div><div class='del'>-		clear_bit(RBIO_CACHE_READY_BIT, &amp;rbio-&gt;flags);</div><div class='add'>+	ASSERT_RBIO(rbio-&gt;nr_data &lt; rbio-&gt;real_stripes, rbio);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	for (pagenr = 0; pagenr &lt; rbio-&gt;stripe_npages; pagenr++) {</div><div class='del'>-		struct page *p;</div><div class='del'>-		/* first collect one page from each data stripe */</div><div class='del'>-		for (stripe = 0; stripe &lt; nr_data; stripe++) {</div><div class='del'>-			p = page_in_rbio(rbio, stripe, pagenr, 0);</div><div class='del'>-			pointers[stripe] = kmap_local_page(p);</div><div class='del'>-		}</div><div class='add'>+static inline void *kmap_local_paddr(phys_addr_t paddr)</div><div class='add'>+{</div><div class='add'>+	/* The sector pointer must have a page mapped to it. */</div><div class='add'>+	ASSERT(paddr != INVALID_PADDR);</div><div class='add'>+</div><div class='add'>+	return kmap_local_page(phys_to_page(paddr)) + offset_in_page(paddr);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		/* then add the parity stripe */</div><div class='del'>-		p = rbio_pstripe_page(rbio, pagenr);</div><div class='del'>-		SetPageUptodate(p);</div><div class='del'>-		pointers[stripe++] = kmap_local_page(p);</div><div class='add'>+static void generate_pq_vertical_step(struct btrfs_raid_bio *rbio, unsigned int sector_nr,</div><div class='add'>+				      unsigned int step_nr)</div><div class='add'>+{</div><div class='add'>+	void **pointers = rbio-&gt;finish_pointers;</div><div class='add'>+	const u32 step = min(rbio-&gt;bioc-&gt;fs_info-&gt;sectorsize, PAGE_SIZE);</div><div class='add'>+	int stripe;</div><div class='add'>+	const bool has_qstripe = rbio-&gt;bioc-&gt;map_type &amp; BTRFS_BLOCK_GROUP_RAID6;</div><div class='ctx'> </div><div class='del'>-		if (has_qstripe) {</div><div class='add'>+	/* First collect one sector from each data stripe */</div><div class='add'>+	for (stripe = 0; stripe &lt; rbio-&gt;nr_data; stripe++)</div><div class='add'>+		pointers[stripe] = kmap_local_paddr(</div><div class='add'>+				sector_paddr_in_rbio(rbio, stripe, sector_nr, step_nr, 0));</div><div class='ctx'> </div><div class='del'>-			/*</div><div class='del'>-			 * raid6, add the qstripe and call the</div><div class='del'>-			 * library function to fill in our p/q</div><div class='del'>-			 */</div><div class='del'>-			p = rbio_qstripe_page(rbio, pagenr);</div><div class='del'>-			SetPageUptodate(p);</div><div class='del'>-			pointers[stripe++] = kmap_local_page(p);</div><div class='add'>+	/* Then add the parity stripe */</div><div class='add'>+	pointers[stripe++] = kmap_local_paddr(rbio_pstripe_paddr(rbio, sector_nr, step_nr));</div><div class='ctx'> </div><div class='del'>-			raid6_call.gen_syndrome(rbio-&gt;real_stripes, PAGE_SIZE,</div><div class='del'>-						pointers);</div><div class='del'>-		} else {</div><div class='del'>-			/* raid5 */</div><div class='del'>-			copy_page(pointers[nr_data], pointers[0]);</div><div class='del'>-			run_xor(pointers + 1, nr_data - 1, PAGE_SIZE);</div><div class='del'>-		}</div><div class='del'>-		for (stripe = stripe - 1; stripe &gt;= 0; stripe--)</div><div class='del'>-			kunmap_local(pointers[stripe]);</div><div class='add'>+	if (has_qstripe) {</div><div class='add'>+		/*</div><div class='add'>+		 * RAID6, add the qstripe and call the library function</div><div class='add'>+		 * to fill in our p/q</div><div class='add'>+		 */</div><div class='add'>+		pointers[stripe++] = kmap_local_paddr(</div><div class='add'>+				rbio_qstripe_paddr(rbio, sector_nr, step_nr));</div><div class='add'>+</div><div class='add'>+		assert_rbio(rbio);</div><div class='add'>+		raid6_call.gen_syndrome(rbio-&gt;real_stripes, step, pointers);</div><div class='add'>+	} else {</div><div class='add'>+		/* raid5 */</div><div class='add'>+		memcpy(pointers[rbio-&gt;nr_data], pointers[0], step);</div><div class='add'>+		run_xor(pointers + 1, rbio-&gt;nr_data - 1, step);</div><div class='ctx'> 	}</div><div class='add'>+	for (stripe = stripe - 1; stripe &gt;= 0; stripe--)</div><div class='add'>+		kunmap_local(pointers[stripe]);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Generate PQ for one vertical stripe. */</div><div class='add'>+static void generate_pq_vertical(struct btrfs_raid_bio *rbio, int sectornr)</div><div class='add'>+{</div><div class='add'>+	const bool has_qstripe = (rbio-&gt;bioc-&gt;map_type &amp; BTRFS_BLOCK_GROUP_RAID6);</div><div class='add'>+</div><div class='add'>+	for (int i = 0; i &lt; rbio-&gt;sector_nsteps; i++)</div><div class='add'>+		generate_pq_vertical_step(rbio, sectornr, i);</div><div class='add'>+</div><div class='add'>+	set_bit(rbio_sector_index(rbio, rbio-&gt;nr_data, sectornr),</div><div class='add'>+		rbio-&gt;stripe_uptodate_bitmap);</div><div class='add'>+	if (has_qstripe)</div><div class='add'>+		set_bit(rbio_sector_index(rbio, rbio-&gt;nr_data + 1, sectornr),</div><div class='add'>+			rbio-&gt;stripe_uptodate_bitmap);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int rmw_assemble_write_bios(struct btrfs_raid_bio *rbio,</div><div class='add'>+				   struct bio_list *bio_list)</div><div class='add'>+{</div><div class='add'>+	/* The total sector number inside the full stripe. */</div><div class='add'>+	int total_sector_nr;</div><div class='add'>+	int sectornr;</div><div class='add'>+	int stripe;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ASSERT(bio_list_size(bio_list) == 0);</div><div class='add'>+</div><div class='add'>+	/* We should have at least one data sector. */</div><div class='add'>+	ASSERT(bitmap_weight(&amp;rbio-&gt;dbitmap, rbio-&gt;stripe_nsectors));</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * time to start writing.  Make bios for everything from the</div><div class='del'>-	 * higher layers (the bio_list in our rbio) and our p/q.  Ignore</div><div class='del'>-	 * everything else.</div><div class='add'>+	 * Reset errors, as we may have errors inherited from from degraded</div><div class='add'>+	 * write.</div><div class='ctx'> 	 */</div><div class='del'>-	for (stripe = 0; stripe &lt; rbio-&gt;real_stripes; stripe++) {</div><div class='del'>-		for (pagenr = 0; pagenr &lt; rbio-&gt;stripe_npages; pagenr++) {</div><div class='del'>-			struct page *page;</div><div class='del'>-			if (stripe &lt; rbio-&gt;nr_data) {</div><div class='del'>-				page = page_in_rbio(rbio, stripe, pagenr, 1);</div><div class='del'>-				if (!page)</div><div class='del'>-					continue;</div><div class='del'>-			} else {</div><div class='del'>-			       page = rbio_stripe_page(rbio, stripe, pagenr);</div><div class='del'>-			}</div><div class='add'>+	bitmap_clear(rbio-&gt;error_bitmap, 0, rbio-&gt;nr_sectors);</div><div class='ctx'> </div><div class='del'>-			ret = rbio_add_io_page(rbio, &amp;bio_list,</div><div class='del'>-				       page, stripe, pagenr, rbio-&gt;stripe_len);</div><div class='del'>-			if (ret)</div><div class='del'>-				goto cleanup;</div><div class='add'>+	/*</div><div class='add'>+	 * Start assembly.  Make bios for everything from the higher layers (the</div><div class='add'>+	 * bio_list in our rbio) and our P/Q.  Ignore everything else.</div><div class='add'>+	 */</div><div class='add'>+	for (total_sector_nr = 0; total_sector_nr &lt; rbio-&gt;nr_sectors;</div><div class='add'>+	     total_sector_nr++) {</div><div class='add'>+		phys_addr_t *paddrs;</div><div class='add'>+</div><div class='add'>+		stripe = total_sector_nr / rbio-&gt;stripe_nsectors;</div><div class='add'>+		sectornr = total_sector_nr % rbio-&gt;stripe_nsectors;</div><div class='add'>+</div><div class='add'>+		/* This vertical stripe has no data, skip it. */</div><div class='add'>+		if (!test_bit(sectornr, &amp;rbio-&gt;dbitmap))</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		if (stripe &lt; rbio-&gt;nr_data) {</div><div class='add'>+			paddrs = sector_paddrs_in_rbio(rbio, stripe, sectornr, 1);</div><div class='add'>+			if (paddrs == NULL)</div><div class='add'>+				continue;</div><div class='add'>+		} else {</div><div class='add'>+			paddrs = rbio_stripe_paddrs(rbio, stripe, sectornr);</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='add'>+		ret = rbio_add_io_paddrs(rbio, bio_list, paddrs, stripe,</div><div class='add'>+					 sectornr, REQ_OP_WRITE);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (likely(!bioc-&gt;num_tgtdevs))</div><div class='del'>-		goto write_data;</div><div class='add'>+	if (likely(!rbio-&gt;bioc-&gt;replace_nr_stripes))</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	for (stripe = 0; stripe &lt; rbio-&gt;real_stripes; stripe++) {</div><div class='del'>-		if (!bioc-&gt;tgtdev_map[stripe])</div><div class='del'>-			continue;</div><div class='add'>+	/*</div><div class='add'>+	 * Make a copy for the replace target device.</div><div class='add'>+	 *</div><div class='add'>+	 * Thus the source stripe number (in replace_stripe_src) should be valid.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(rbio-&gt;bioc-&gt;replace_stripe_src &gt;= 0);</div><div class='ctx'> </div><div class='del'>-		for (pagenr = 0; pagenr &lt; rbio-&gt;stripe_npages; pagenr++) {</div><div class='del'>-			struct page *page;</div><div class='del'>-			if (stripe &lt; rbio-&gt;nr_data) {</div><div class='del'>-				page = page_in_rbio(rbio, stripe, pagenr, 1);</div><div class='del'>-				if (!page)</div><div class='del'>-					continue;</div><div class='del'>-			} else {</div><div class='del'>-			       page = rbio_stripe_page(rbio, stripe, pagenr);</div><div class='del'>-			}</div><div class='add'>+	for (total_sector_nr = 0; total_sector_nr &lt; rbio-&gt;nr_sectors;</div><div class='add'>+	     total_sector_nr++) {</div><div class='add'>+		phys_addr_t *paddrs;</div><div class='ctx'> </div><div class='del'>-			ret = rbio_add_io_page(rbio, &amp;bio_list, page,</div><div class='del'>-					       rbio-&gt;bioc-&gt;tgtdev_map[stripe],</div><div class='del'>-					       pagenr, rbio-&gt;stripe_len);</div><div class='del'>-			if (ret)</div><div class='del'>-				goto cleanup;</div><div class='add'>+		stripe = total_sector_nr / rbio-&gt;stripe_nsectors;</div><div class='add'>+		sectornr = total_sector_nr % rbio-&gt;stripe_nsectors;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * For RAID56, there is only one device that can be replaced,</div><div class='add'>+		 * and replace_stripe_src[0] indicates the stripe number we</div><div class='add'>+		 * need to copy from.</div><div class='add'>+		 */</div><div class='add'>+		if (stripe != rbio-&gt;bioc-&gt;replace_stripe_src) {</div><div class='add'>+			/*</div><div class='add'>+			 * We can skip the whole stripe completely, note</div><div class='add'>+			 * total_sector_nr will be increased by one anyway.</div><div class='add'>+			 */</div><div class='add'>+			ASSERT(sectornr == 0);</div><div class='add'>+			total_sector_nr += rbio-&gt;stripe_nsectors - 1;</div><div class='add'>+			continue;</div><div class='ctx'> 		}</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-write_data:</div><div class='del'>-	atomic_set(&amp;rbio-&gt;stripes_pending, bio_list_size(&amp;bio_list));</div><div class='del'>-	BUG_ON(atomic_read(&amp;rbio-&gt;stripes_pending) == 0);</div><div class='add'>+		/* This vertical stripe has no data, skip it. */</div><div class='add'>+		if (!test_bit(sectornr, &amp;rbio-&gt;dbitmap))</div><div class='add'>+			continue;</div><div class='ctx'> </div><div class='del'>-	while ((bio = bio_list_pop(&amp;bio_list))) {</div><div class='del'>-		bio-&gt;bi_private = rbio;</div><div class='del'>-		bio-&gt;bi_end_io = raid_write_end_io;</div><div class='del'>-		bio-&gt;bi_opf = REQ_OP_WRITE;</div><div class='add'>+		if (stripe &lt; rbio-&gt;nr_data) {</div><div class='add'>+			paddrs = sector_paddrs_in_rbio(rbio, stripe, sectornr, 1);</div><div class='add'>+			if (paddrs == NULL)</div><div class='add'>+				continue;</div><div class='add'>+		} else {</div><div class='add'>+			paddrs = rbio_stripe_paddrs(rbio, stripe, sectornr);</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-		submit_bio(bio);</div><div class='add'>+		ret = rbio_add_io_paddrs(rbio, bio_list, paddrs,</div><div class='add'>+					 rbio-&gt;real_stripes,</div><div class='add'>+					 sectornr, REQ_OP_WRITE);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto error;</div><div class='ctx'> 	}</div><div class='del'>-	return;</div><div class='del'>-</div><div class='del'>-cleanup:</div><div class='del'>-	rbio_orig_end_io(rbio, BLK_STS_IOERR);</div><div class='ctx'> </div><div class='del'>-	while ((bio = bio_list_pop(&amp;bio_list)))</div><div class='del'>-		bio_put(bio);</div><div class='add'>+	return 0;</div><div class='add'>+error:</div><div class='add'>+	bio_list_put(bio_list);</div><div class='add'>+	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * helper to find the stripe number for a given bio.  Used to figure out which</div><div class='del'>- * stripe has failed.  This expects the bio to correspond to a physical disk,</div><div class='del'>- * so it looks up based on physical sector numbers.</div><div class='del'>- */</div><div class='del'>-static int find_bio_stripe(struct btrfs_raid_bio *rbio,</div><div class='del'>-			   struct bio *bio)</div><div class='add'>+static void set_rbio_range_error(struct btrfs_raid_bio *rbio, struct bio *bio)</div><div class='ctx'> {</div><div class='del'>-	u64 physical = bio-&gt;bi_iter.bi_sector;</div><div class='del'>-	int i;</div><div class='del'>-	struct btrfs_io_stripe *stripe;</div><div class='add'>+	struct btrfs_fs_info *fs_info = rbio-&gt;bioc-&gt;fs_info;</div><div class='add'>+	u32 offset = (bio-&gt;bi_iter.bi_sector &lt;&lt; SECTOR_SHIFT) -</div><div class='add'>+		     rbio-&gt;bioc-&gt;full_stripe_logical;</div><div class='add'>+	int total_nr_sector = offset &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='ctx'> </div><div class='del'>-	physical &lt;&lt;= 9;</div><div class='add'>+	ASSERT(total_nr_sector &lt; rbio-&gt;nr_data * rbio-&gt;stripe_nsectors);</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; rbio-&gt;bioc-&gt;num_stripes; i++) {</div><div class='del'>-		stripe = &amp;rbio-&gt;bioc-&gt;stripes[i];</div><div class='del'>-		if (in_range(physical, stripe-&gt;physical, rbio-&gt;stripe_len) &amp;&amp;</div><div class='del'>-		    stripe-&gt;dev-&gt;bdev &amp;&amp; bio-&gt;bi_bdev == stripe-&gt;dev-&gt;bdev) {</div><div class='del'>-			return i;</div><div class='add'>+	bitmap_set(rbio-&gt;error_bitmap, total_nr_sector,</div><div class='add'>+		   bio-&gt;bi_iter.bi_size &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Special handling for raid56_alloc_missing_rbio() used by</div><div class='add'>+	 * scrub/replace.  Unlike call path in raid56_parity_recover(), they</div><div class='add'>+	 * pass an empty bio here.  Thus we have to find out the missing device</div><div class='add'>+	 * and mark the stripe error instead.</div><div class='add'>+	 */</div><div class='add'>+	if (bio-&gt;bi_iter.bi_size == 0) {</div><div class='add'>+		bool found_missing = false;</div><div class='add'>+		int stripe_nr;</div><div class='add'>+</div><div class='add'>+		for (stripe_nr = 0; stripe_nr &lt; rbio-&gt;real_stripes; stripe_nr++) {</div><div class='add'>+			if (!rbio-&gt;bioc-&gt;stripes[stripe_nr].dev-&gt;bdev) {</div><div class='add'>+				found_missing = true;</div><div class='add'>+				bitmap_set(rbio-&gt;error_bitmap,</div><div class='add'>+					   stripe_nr * rbio-&gt;stripe_nsectors,</div><div class='add'>+					   rbio-&gt;stripe_nsectors);</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='add'>+		ASSERT(found_missing);</div><div class='ctx'> 	}</div><div class='del'>-	return -1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * helper to find the stripe number for a given</div><div class='del'>- * bio (before mapping).  Used to figure out which stripe has</div><div class='del'>- * failed.  This looks up based on logical block numbers.</div><div class='add'>+ * Return the index inside the rbio-&gt;stripe_sectors[] array.</div><div class='add'>+ *</div><div class='add'>+ * Return -1 if not found.</div><div class='ctx'>  */</div><div class='del'>-static int find_logical_bio_stripe(struct btrfs_raid_bio *rbio,</div><div class='del'>-				   struct bio *bio)</div><div class='add'>+static int find_stripe_sector_nr(struct btrfs_raid_bio *rbio, phys_addr_t paddr)</div><div class='ctx'> {</div><div class='del'>-	u64 logical = bio-&gt;bi_iter.bi_sector &lt;&lt; 9;</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; rbio-&gt;nr_data; i++) {</div><div class='del'>-		u64 stripe_start = rbio-&gt;bioc-&gt;raid_map[i];</div><div class='del'>-</div><div class='del'>-		if (in_range(logical, stripe_start, rbio-&gt;stripe_len))</div><div class='add'>+	for (int i = 0; i &lt; rbio-&gt;nr_sectors; i++) {</div><div class='add'>+		if (rbio-&gt;stripe_paddrs[i * rbio-&gt;sector_nsteps] == paddr)</div><div class='ctx'> 			return i;</div><div class='ctx'> 	}</div><div class='ctx'> 	return -1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * returns -EIO if we had too many failures</div><div class='add'>+ * this sets each page in the bio uptodate.  It should only be used on private</div><div class='add'>+ * rbio pages, nothing that comes in from the higher layers</div><div class='ctx'>  */</div><div class='del'>-static int fail_rbio_index(struct btrfs_raid_bio *rbio, int failed)</div><div class='add'>+static void set_bio_pages_uptodate(struct btrfs_raid_bio *rbio, struct bio *bio)</div><div class='ctx'> {</div><div class='del'>-	unsigned long flags;</div><div class='del'>-	int ret = 0;</div><div class='add'>+	const u32 sectorsize = rbio-&gt;bioc-&gt;fs_info-&gt;sectorsize;</div><div class='add'>+	const u32 step = min(sectorsize, PAGE_SIZE);</div><div class='add'>+	u32 offset = 0;</div><div class='add'>+	phys_addr_t paddr;</div><div class='ctx'> </div><div class='del'>-	spin_lock_irqsave(&amp;rbio-&gt;bio_list_lock, flags);</div><div class='add'>+	ASSERT(!bio_flagged(bio, BIO_CLONED));</div><div class='ctx'> </div><div class='del'>-	/* we already know this stripe is bad, move on */</div><div class='del'>-	if (rbio-&gt;faila == failed || rbio-&gt;failb == failed)</div><div class='del'>-		goto out;</div><div class='add'>+	btrfs_bio_for_each_block_all(paddr, bio, step) {</div><div class='add'>+		/* Hitting the first step of a sector. */</div><div class='add'>+		if (IS_ALIGNED(offset, sectorsize)) {</div><div class='add'>+			int sector_nr = find_stripe_sector_nr(rbio, paddr);</div><div class='ctx'> </div><div class='del'>-	if (rbio-&gt;faila == -1) {</div><div class='del'>-		/* first failure on this rbio */</div><div class='del'>-		rbio-&gt;faila = failed;</div><div class='del'>-		atomic_inc(&amp;rbio-&gt;error);</div><div class='del'>-	} else if (rbio-&gt;failb == -1) {</div><div class='del'>-		/* second failure on this rbio */</div><div class='del'>-		rbio-&gt;failb = failed;</div><div class='del'>-		atomic_inc(&amp;rbio-&gt;error);</div><div class='del'>-	} else {</div><div class='del'>-		ret = -EIO;</div><div class='add'>+			ASSERT(sector_nr &gt;= 0);</div><div class='add'>+			if (sector_nr &gt;= 0)</div><div class='add'>+				set_bit(sector_nr, rbio-&gt;stripe_uptodate_bitmap);</div><div class='add'>+		}</div><div class='add'>+		offset += step;</div><div class='ctx'> 	}</div><div class='del'>-out:</div><div class='del'>-	spin_unlock_irqrestore(&amp;rbio-&gt;bio_list_lock, flags);</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * helper to fail a stripe based on a physical disk</div><div class='del'>- * bio.</div><div class='del'>- */</div><div class='del'>-static int fail_bio_stripe(struct btrfs_raid_bio *rbio,</div><div class='del'>-			   struct bio *bio)</div><div class='add'>+static int get_bio_sector_nr(struct btrfs_raid_bio *rbio, struct bio *bio)</div><div class='ctx'> {</div><div class='del'>-	int failed = find_bio_stripe(rbio, bio);</div><div class='del'>-</div><div class='del'>-	if (failed &lt; 0)</div><div class='del'>-		return -EIO;</div><div class='add'>+	phys_addr_t bvec_paddr = bvec_phys(bio_first_bvec_all(bio));</div><div class='add'>+	int i;</div><div class='ctx'> </div><div class='del'>-	return fail_rbio_index(rbio, failed);</div><div class='add'>+	for (i = 0; i &lt; rbio-&gt;nr_sectors; i++) {</div><div class='add'>+		if (rbio-&gt;stripe_paddrs[i * rbio-&gt;sector_nsteps] == bvec_paddr)</div><div class='add'>+			break;</div><div class='add'>+		if (rbio-&gt;bio_paddrs[i * rbio-&gt;sector_nsteps] == bvec_paddr)</div><div class='add'>+			break;</div><div class='add'>+	}</div><div class='add'>+	ASSERT(i &lt; rbio-&gt;nr_sectors);</div><div class='add'>+	return i;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * this sets each page in the bio uptodate.  It should only be used on private</div><div class='del'>- * rbio pages, nothing that comes in from the higher layers</div><div class='del'>- */</div><div class='del'>-static void set_bio_pages_uptodate(struct bio *bio)</div><div class='add'>+static void rbio_update_error_bitmap(struct btrfs_raid_bio *rbio, struct bio *bio)</div><div class='ctx'> {</div><div class='add'>+	int total_sector_nr = get_bio_sector_nr(rbio, bio);</div><div class='add'>+	u32 bio_size = 0;</div><div class='ctx'> 	struct bio_vec *bvec;</div><div class='del'>-	struct bvec_iter_all iter_all;</div><div class='add'>+	int i;</div><div class='ctx'> </div><div class='del'>-	ASSERT(!bio_flagged(bio, BIO_CLONED));</div><div class='add'>+	bio_for_each_bvec_all(bvec, bio, i)</div><div class='add'>+		bio_size += bvec-&gt;bv_len;</div><div class='ctx'> </div><div class='del'>-	bio_for_each_segment_all(bvec, bio, iter_all)</div><div class='del'>-		SetPageUptodate(bvec-&gt;bv_page);</div><div class='add'>+	/*</div><div class='add'>+	 * Since we can have multiple bios touching the error_bitmap, we cannot</div><div class='add'>+	 * call bitmap_set() without protection.</div><div class='add'>+	 *</div><div class='add'>+	 * Instead use set_bit() for each bit, as set_bit() itself is atomic.</div><div class='add'>+	 */</div><div class='add'>+	for (i = total_sector_nr; i &lt; total_sector_nr +</div><div class='add'>+	     (bio_size &gt;&gt; rbio-&gt;bioc-&gt;fs_info-&gt;sectorsize_bits); i++)</div><div class='add'>+		set_bit(i, rbio-&gt;error_bitmap);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * end io for the read phase of the rmw cycle.  All the bios here are physical</div><div class='del'>- * stripe bios we've read from the disk so we can recalculate the parity of the</div><div class='del'>- * stripe.</div><div class='del'>- *</div><div class='del'>- * This will usually kick off finish_rmw once all the bios are read in, but it</div><div class='del'>- * may trigger parity reconstruction if we had any errors along the way</div><div class='del'>- */</div><div class='del'>-static void raid_rmw_end_io(struct bio *bio)</div><div class='add'>+/* Verify the data sectors at read time. */</div><div class='add'>+static void verify_bio_data_sectors(struct btrfs_raid_bio *rbio,</div><div class='add'>+				    struct bio *bio)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_raid_bio *rbio = bio-&gt;bi_private;</div><div class='add'>+	struct btrfs_fs_info *fs_info = rbio-&gt;bioc-&gt;fs_info;</div><div class='add'>+	const u32 step = min(fs_info-&gt;sectorsize, PAGE_SIZE);</div><div class='add'>+	const u32 nr_steps = rbio-&gt;sector_nsteps;</div><div class='add'>+	int total_sector_nr = get_bio_sector_nr(rbio, bio);</div><div class='add'>+	u32 offset = 0;</div><div class='add'>+	phys_addr_t paddrs[BTRFS_MAX_BLOCKSIZE / PAGE_SIZE];</div><div class='add'>+	phys_addr_t paddr;</div><div class='ctx'> </div><div class='del'>-	if (bio-&gt;bi_status)</div><div class='del'>-		fail_bio_stripe(rbio, bio);</div><div class='del'>-	else</div><div class='del'>-		set_bio_pages_uptodate(bio);</div><div class='del'>-</div><div class='del'>-	bio_put(bio);</div><div class='add'>+	/* No data csum for the whole stripe, no need to verify. */</div><div class='add'>+	if (!rbio-&gt;csum_bitmap || !rbio-&gt;csum_buf)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	if (!atomic_dec_and_test(&amp;rbio-&gt;stripes_pending))</div><div class='add'>+	/* P/Q stripes, they have no data csum to verify against. */</div><div class='add'>+	if (total_sector_nr &gt;= rbio-&gt;nr_data * rbio-&gt;stripe_nsectors)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	if (atomic_read(&amp;rbio-&gt;error) &gt; rbio-&gt;bioc-&gt;max_errors)</div><div class='del'>-		goto cleanup;</div><div class='add'>+	btrfs_bio_for_each_block_all(paddr, bio, step) {</div><div class='add'>+		u8 csum_buf[BTRFS_CSUM_SIZE];</div><div class='add'>+		u8 *expected_csum;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * this will normally call finish_rmw to start our write</div><div class='del'>-	 * but if there are any failed stripes we'll reconstruct</div><div class='del'>-	 * from parity first</div><div class='del'>-	 */</div><div class='del'>-	validate_rbio_for_rmw(rbio);</div><div class='del'>-	return;</div><div class='add'>+		paddrs[(offset / step) % nr_steps] = paddr;</div><div class='add'>+		offset += step;</div><div class='ctx'> </div><div class='del'>-cleanup:</div><div class='add'>+		/* Not yet covering the full fs block, continue to the next step. */</div><div class='add'>+		if (!IS_ALIGNED(offset, fs_info-&gt;sectorsize))</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		/* No csum for this sector, skip to the next sector. */</div><div class='add'>+		if (!test_bit(total_sector_nr, rbio-&gt;csum_bitmap))</div><div class='add'>+			continue;</div><div class='ctx'> </div><div class='del'>-	rbio_orig_end_io(rbio, BLK_STS_IOERR);</div><div class='add'>+		expected_csum = rbio-&gt;csum_buf + total_sector_nr * fs_info-&gt;csum_size;</div><div class='add'>+		btrfs_calculate_block_csum_pages(fs_info, paddrs, csum_buf);</div><div class='add'>+		if (unlikely(memcmp(csum_buf, expected_csum, fs_info-&gt;csum_size) != 0))</div><div class='add'>+			set_bit(total_sector_nr, rbio-&gt;error_bitmap);</div><div class='add'>+		total_sector_nr++;</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * the stripe must be locked by the caller.  It will</div><div class='del'>- * unlock after all the writes are done</div><div class='del'>- */</div><div class='del'>-static int raid56_rmw_stripe(struct btrfs_raid_bio *rbio)</div><div class='add'>+static void raid_wait_read_end_io(struct bio *bio)</div><div class='ctx'> {</div><div class='del'>-	int bios_to_read = 0;</div><div class='del'>-	struct bio_list bio_list;</div><div class='del'>-	int ret;</div><div class='del'>-	int pagenr;</div><div class='del'>-	int stripe;</div><div class='del'>-	struct bio *bio;</div><div class='add'>+	struct btrfs_raid_bio *rbio = bio-&gt;bi_private;</div><div class='ctx'> </div><div class='del'>-	bio_list_init(&amp;bio_list);</div><div class='add'>+	if (bio-&gt;bi_status) {</div><div class='add'>+		rbio_update_error_bitmap(rbio, bio);</div><div class='add'>+	} else {</div><div class='add'>+		set_bio_pages_uptodate(rbio, bio);</div><div class='add'>+		verify_bio_data_sectors(rbio, bio);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	ret = alloc_rbio_pages(rbio);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto cleanup;</div><div class='add'>+	bio_put(bio);</div><div class='add'>+	if (atomic_dec_and_test(&amp;rbio-&gt;stripes_pending))</div><div class='add'>+		wake_up(&amp;rbio-&gt;io_wait);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	index_rbio_pages(rbio);</div><div class='add'>+static void submit_read_wait_bio_list(struct btrfs_raid_bio *rbio,</div><div class='add'>+			     struct bio_list *bio_list)</div><div class='add'>+{</div><div class='add'>+	struct bio *bio;</div><div class='ctx'> </div><div class='del'>-	atomic_set(&amp;rbio-&gt;error, 0);</div><div class='del'>-	/*</div><div class='del'>-	 * build a list of bios to read all the missing parts of this</div><div class='del'>-	 * stripe</div><div class='del'>-	 */</div><div class='del'>-	for (stripe = 0; stripe &lt; rbio-&gt;nr_data; stripe++) {</div><div class='del'>-		for (pagenr = 0; pagenr &lt; rbio-&gt;stripe_npages; pagenr++) {</div><div class='del'>-			struct page *page;</div><div class='del'>-			/*</div><div class='del'>-			 * we want to find all the pages missing from</div><div class='del'>-			 * the rbio and read them from the disk.  If</div><div class='del'>-			 * page_in_rbio finds a page in the bio list</div><div class='del'>-			 * we don't need to read it off the stripe.</div><div class='del'>-			 */</div><div class='del'>-			page = page_in_rbio(rbio, stripe, pagenr, 1);</div><div class='del'>-			if (page)</div><div class='del'>-				continue;</div><div class='add'>+	atomic_set(&amp;rbio-&gt;stripes_pending, bio_list_size(bio_list));</div><div class='add'>+	while ((bio = bio_list_pop(bio_list))) {</div><div class='add'>+		bio-&gt;bi_end_io = raid_wait_read_end_io;</div><div class='ctx'> </div><div class='del'>-			page = rbio_stripe_page(rbio, stripe, pagenr);</div><div class='del'>-			/*</div><div class='del'>-			 * the bio cache may have handed us an uptodate</div><div class='del'>-			 * page.  If so, be happy and use it</div><div class='del'>-			 */</div><div class='del'>-			if (PageUptodate(page))</div><div class='del'>-				continue;</div><div class='add'>+		if (trace_raid56_read_enabled()) {</div><div class='add'>+			struct raid56_bio_trace_info trace_info = { 0 };</div><div class='ctx'> </div><div class='del'>-			ret = rbio_add_io_page(rbio, &amp;bio_list, page,</div><div class='del'>-				       stripe, pagenr, rbio-&gt;stripe_len);</div><div class='del'>-			if (ret)</div><div class='del'>-				goto cleanup;</div><div class='add'>+			bio_get_trace_info(rbio, bio, &amp;trace_info);</div><div class='add'>+			trace_raid56_read(rbio, bio, &amp;trace_info);</div><div class='ctx'> 		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	bios_to_read = bio_list_size(&amp;bio_list);</div><div class='del'>-	if (!bios_to_read) {</div><div class='del'>-		/*</div><div class='del'>-		 * this can happen if others have merged with</div><div class='del'>-		 * us, it means there is nothing left to read.</div><div class='del'>-		 * But if there are missing devices it may not be</div><div class='del'>-		 * safe to do the full stripe write yet.</div><div class='del'>-		 */</div><div class='del'>-		goto finish;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * The bioc may be freed once we submit the last bio. Make sure not to</div><div class='del'>-	 * touch it after that.</div><div class='del'>-	 */</div><div class='del'>-	atomic_set(&amp;rbio-&gt;stripes_pending, bios_to_read);</div><div class='del'>-	while ((bio = bio_list_pop(&amp;bio_list))) {</div><div class='del'>-		bio-&gt;bi_private = rbio;</div><div class='del'>-		bio-&gt;bi_end_io = raid_rmw_end_io;</div><div class='del'>-		bio-&gt;bi_opf = REQ_OP_READ;</div><div class='del'>-</div><div class='del'>-		btrfs_bio_wq_end_io(rbio-&gt;bioc-&gt;fs_info, bio, BTRFS_WQ_ENDIO_RAID56);</div><div class='del'>-</div><div class='ctx'> 		submit_bio(bio);</div><div class='ctx'> 	}</div><div class='del'>-	/* the actual write will happen once the reads are done */</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-cleanup:</div><div class='del'>-	rbio_orig_end_io(rbio, BLK_STS_IOERR);</div><div class='del'>-</div><div class='del'>-	while ((bio = bio_list_pop(&amp;bio_list)))</div><div class='del'>-		bio_put(bio);</div><div class='del'>-</div><div class='del'>-	return -EIO;</div><div class='ctx'> </div><div class='del'>-finish:</div><div class='del'>-	validate_rbio_for_rmw(rbio);</div><div class='del'>-	return 0;</div><div class='add'>+	wait_event(rbio-&gt;io_wait, atomic_read(&amp;rbio-&gt;stripes_pending) == 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * if the upper layers pass in a full stripe, we thank them by only allocating</div><div class='del'>- * enough pages to hold the parity, and sending it all down quickly.</div><div class='del'>- */</div><div class='del'>-static int full_stripe_write(struct btrfs_raid_bio *rbio)</div><div class='add'>+static int alloc_rbio_data_pages(struct btrfs_raid_bio *rbio)</div><div class='ctx'> {</div><div class='add'>+	const int data_pages = rbio-&gt;nr_data * rbio-&gt;stripe_npages;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = alloc_rbio_parity_pages(rbio);</div><div class='del'>-	if (ret) {</div><div class='del'>-		__free_raid_bio(rbio);</div><div class='add'>+	ret = btrfs_alloc_page_array(data_pages, rbio-&gt;stripe_pages, false);</div><div class='add'>+	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	ret = lock_stripe_add(rbio);</div><div class='del'>-	if (ret == 0)</div><div class='del'>-		finish_rmw(rbio);</div><div class='add'>+	index_stripe_sectors(rbio);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * partial stripe writes get handed over to async helpers.</div><div class='del'>- * We're really hoping to merge a few more writes into this</div><div class='del'>- * rbio before calculating new parity</div><div class='del'>- */</div><div class='del'>-static int partial_stripe_write(struct btrfs_raid_bio *rbio)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ret = lock_stripe_add(rbio);</div><div class='del'>-	if (ret == 0)</div><div class='del'>-		start_async_work(rbio, rmw_work);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * sometimes while we were reading from the drive to</div><div class='del'>- * recalculate parity, enough new bios come into create</div><div class='del'>- * a full stripe.  So we do a check here to see if we can</div><div class='del'>- * go directly to finish_rmw</div><div class='del'>- */</div><div class='del'>-static int __raid56_parity_write(struct btrfs_raid_bio *rbio)</div><div class='del'>-{</div><div class='del'>-	/* head off into rmw land if we don't have a full stripe */</div><div class='del'>-	if (!rbio_is_full(rbio))</div><div class='del'>-		return partial_stripe_write(rbio);</div><div class='del'>-	return full_stripe_write(rbio);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * We use plugging call backs to collect full stripes.</div><div class='ctx'>  * Any time we get a partial stripe write while plugged</div><div class='ctx'>  * we collect it into a list.  When the unplug comes down,</div><div class='hunk'>@@ -1624,7 +1772,6 @@ struct btrfs_plug_cb {</div><div class='ctx'> 	struct blk_plug_cb cb;</div><div class='ctx'> 	struct btrfs_fs_info *info;</div><div class='ctx'> 	struct list_head rbio_list;</div><div class='del'>-	struct btrfs_work work;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1647,465 +1794,466 @@ static int plug_cmp(void *priv, const struct list_head *a,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void run_plug(struct btrfs_plug_cb *plug)</div><div class='add'>+static void raid_unplug(struct blk_plug_cb *cb, bool from_schedule)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_plug_cb *plug = container_of(cb, struct btrfs_plug_cb, cb);</div><div class='ctx'> 	struct btrfs_raid_bio *cur;</div><div class='ctx'> 	struct btrfs_raid_bio *last = NULL;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * sort our plug list then try to merge</div><div class='del'>-	 * everything we can in hopes of creating full</div><div class='del'>-	 * stripes.</div><div class='del'>-	 */</div><div class='ctx'> 	list_sort(NULL, &amp;plug-&gt;rbio_list, plug_cmp);</div><div class='add'>+</div><div class='ctx'> 	while (!list_empty(&amp;plug-&gt;rbio_list)) {</div><div class='del'>-		cur = list_entry(plug-&gt;rbio_list.next,</div><div class='del'>-				 struct btrfs_raid_bio, plug_list);</div><div class='add'>+		cur = list_first_entry(&amp;plug-&gt;rbio_list,</div><div class='add'>+				       struct btrfs_raid_bio, plug_list);</div><div class='ctx'> 		list_del_init(&amp;cur-&gt;plug_list);</div><div class='ctx'> </div><div class='ctx'> 		if (rbio_is_full(cur)) {</div><div class='del'>-			int ret;</div><div class='del'>-</div><div class='del'>-			/* we have a full stripe, send it down */</div><div class='del'>-			ret = full_stripe_write(cur);</div><div class='del'>-			BUG_ON(ret);</div><div class='add'>+			/* We have a full stripe, queue it down. */</div><div class='add'>+			start_async_work(cur, rmw_rbio_work);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (last) {</div><div class='ctx'> 			if (rbio_can_merge(last, cur)) {</div><div class='ctx'> 				merge_rbio(last, cur);</div><div class='del'>-				__free_raid_bio(cur);</div><div class='add'>+				free_raid_bio(cur);</div><div class='ctx'> 				continue;</div><div class='del'>-</div><div class='ctx'> 			}</div><div class='del'>-			__raid56_parity_write(last);</div><div class='add'>+			start_async_work(last, rmw_rbio_work);</div><div class='ctx'> 		}</div><div class='ctx'> 		last = cur;</div><div class='ctx'> 	}</div><div class='del'>-	if (last) {</div><div class='del'>-		__raid56_parity_write(last);</div><div class='del'>-	}</div><div class='add'>+	if (last)</div><div class='add'>+		start_async_work(last, rmw_rbio_work);</div><div class='ctx'> 	kfree(plug);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * if the unplug comes from schedule, we have to push the</div><div class='del'>- * work off to a helper thread</div><div class='del'>- */</div><div class='del'>-static void unplug_work(struct btrfs_work *work)</div><div class='add'>+/* Add the original bio into rbio-&gt;bio_list, and update rbio::dbitmap. */</div><div class='add'>+static void rbio_add_bio(struct btrfs_raid_bio *rbio, struct bio *orig_bio)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_plug_cb *plug;</div><div class='del'>-	plug = container_of(work, struct btrfs_plug_cb, work);</div><div class='del'>-	run_plug(plug);</div><div class='del'>-}</div><div class='add'>+	const struct btrfs_fs_info *fs_info = rbio-&gt;bioc-&gt;fs_info;</div><div class='add'>+	const u64 orig_logical = orig_bio-&gt;bi_iter.bi_sector &lt;&lt; SECTOR_SHIFT;</div><div class='add'>+	const u64 full_stripe_start = rbio-&gt;bioc-&gt;full_stripe_logical;</div><div class='add'>+	const u32 orig_len = orig_bio-&gt;bi_iter.bi_size;</div><div class='add'>+	const u32 sectorsize = fs_info-&gt;sectorsize;</div><div class='add'>+	u64 cur_logical;</div><div class='ctx'> </div><div class='del'>-static void btrfs_raid_unplug(struct blk_plug_cb *cb, bool from_schedule)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_plug_cb *plug;</div><div class='del'>-	plug = container_of(cb, struct btrfs_plug_cb, cb);</div><div class='add'>+	ASSERT_RBIO_LOGICAL(orig_logical &gt;= full_stripe_start &amp;&amp;</div><div class='add'>+			    orig_logical + orig_len &lt;= full_stripe_start +</div><div class='add'>+			    rbio-&gt;nr_data * BTRFS_STRIPE_LEN,</div><div class='add'>+			    rbio, orig_logical);</div><div class='ctx'> </div><div class='del'>-	if (from_schedule) {</div><div class='del'>-		btrfs_init_work(&amp;plug-&gt;work, unplug_work, NULL, NULL);</div><div class='del'>-		btrfs_queue_work(plug-&gt;info-&gt;rmw_workers,</div><div class='del'>-				 &amp;plug-&gt;work);</div><div class='del'>-		return;</div><div class='add'>+	bio_list_add(&amp;rbio-&gt;bio_list, orig_bio);</div><div class='add'>+	rbio-&gt;bio_list_bytes += orig_bio-&gt;bi_iter.bi_size;</div><div class='add'>+</div><div class='add'>+	/* Update the dbitmap. */</div><div class='add'>+	for (cur_logical = orig_logical; cur_logical &lt; orig_logical + orig_len;</div><div class='add'>+	     cur_logical += sectorsize) {</div><div class='add'>+		int bit = ((u32)(cur_logical - full_stripe_start) &gt;&gt;</div><div class='add'>+			   fs_info-&gt;sectorsize_bits) % rbio-&gt;stripe_nsectors;</div><div class='add'>+</div><div class='add'>+		set_bit(bit, &amp;rbio-&gt;dbitmap);</div><div class='ctx'> 	}</div><div class='del'>-	run_plug(plug);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * our main entry point for writes from the rest of the FS.</div><div class='ctx'>  */</div><div class='del'>-int raid56_parity_write(struct bio *bio, struct btrfs_io_context *bioc,</div><div class='del'>-			u64 stripe_len)</div><div class='add'>+void raid56_parity_write(struct bio *bio, struct btrfs_io_context *bioc)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = bioc-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_raid_bio *rbio;</div><div class='ctx'> 	struct btrfs_plug_cb *plug = NULL;</div><div class='ctx'> 	struct blk_plug_cb *cb;</div><div class='del'>-	int ret;</div><div class='ctx'> </div><div class='del'>-	rbio = alloc_rbio(fs_info, bioc, stripe_len);</div><div class='add'>+	rbio = alloc_rbio(fs_info, bioc);</div><div class='ctx'> 	if (IS_ERR(rbio)) {</div><div class='del'>-		btrfs_put_bioc(bioc);</div><div class='del'>-		return PTR_ERR(rbio);</div><div class='add'>+		bio-&gt;bi_status = errno_to_blk_status(PTR_ERR(rbio));</div><div class='add'>+		bio_endio(bio);</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='del'>-	bio_list_add(&amp;rbio-&gt;bio_list, bio);</div><div class='del'>-	rbio-&gt;bio_list_bytes = bio-&gt;bi_iter.bi_size;</div><div class='ctx'> 	rbio-&gt;operation = BTRFS_RBIO_WRITE;</div><div class='del'>-</div><div class='del'>-	btrfs_bio_counter_inc_noblocked(fs_info);</div><div class='del'>-	rbio-&gt;generic_bio_cnt = 1;</div><div class='add'>+	rbio_add_bio(rbio, bio);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * don't plug on full rbios, just get them out the door</div><div class='add'>+	 * Don't plug on full rbios, just get them out the door</div><div class='ctx'> 	 * as quickly as we can</div><div class='ctx'> 	 */</div><div class='del'>-	if (rbio_is_full(rbio)) {</div><div class='del'>-		ret = full_stripe_write(rbio);</div><div class='del'>-		if (ret)</div><div class='del'>-			btrfs_bio_counter_dec(fs_info);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	cb = blk_check_plugged(btrfs_raid_unplug, fs_info, sizeof(*plug));</div><div class='del'>-	if (cb) {</div><div class='del'>-		plug = container_of(cb, struct btrfs_plug_cb, cb);</div><div class='del'>-		if (!plug-&gt;info) {</div><div class='del'>-			plug-&gt;info = fs_info;</div><div class='del'>-			INIT_LIST_HEAD(&amp;plug-&gt;rbio_list);</div><div class='add'>+	if (!rbio_is_full(rbio)) {</div><div class='add'>+		cb = blk_check_plugged(raid_unplug, fs_info, sizeof(*plug));</div><div class='add'>+		if (cb) {</div><div class='add'>+			plug = container_of(cb, struct btrfs_plug_cb, cb);</div><div class='add'>+			if (!plug-&gt;info) {</div><div class='add'>+				plug-&gt;info = fs_info;</div><div class='add'>+				INIT_LIST_HEAD(&amp;plug-&gt;rbio_list);</div><div class='add'>+			}</div><div class='add'>+			list_add_tail(&amp;rbio-&gt;plug_list, &amp;plug-&gt;rbio_list);</div><div class='add'>+			return;</div><div class='ctx'> 		}</div><div class='del'>-		list_add_tail(&amp;rbio-&gt;plug_list, &amp;plug-&gt;rbio_list);</div><div class='del'>-		ret = 0;</div><div class='del'>-	} else {</div><div class='del'>-		ret = __raid56_parity_write(rbio);</div><div class='del'>-		if (ret)</div><div class='del'>-			btrfs_bio_counter_dec(fs_info);</div><div class='ctx'> 	}</div><div class='del'>-	return ret;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Either we don't have any existing plug, or we're doing a full stripe,</div><div class='add'>+	 * queue the rmw work now.</div><div class='add'>+	 */</div><div class='add'>+	start_async_work(rbio, rmw_rbio_work);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * all parity reconstruction happens here.  We've read in everything</div><div class='del'>- * we can find from the drives and this does the heavy lifting of</div><div class='del'>- * sorting the good from the bad.</div><div class='del'>- */</div><div class='del'>-static void __raid_recover_end_io(struct btrfs_raid_bio *rbio)</div><div class='add'>+static int verify_one_sector(struct btrfs_raid_bio *rbio,</div><div class='add'>+			     int stripe_nr, int sector_nr)</div><div class='ctx'> {</div><div class='del'>-	int pagenr, stripe;</div><div class='del'>-	void **pointers;</div><div class='del'>-	void **unmap_array;</div><div class='del'>-	int faila = -1, failb = -1;</div><div class='del'>-	struct page *page;</div><div class='del'>-	blk_status_t err;</div><div class='del'>-	int i;</div><div class='add'>+	struct btrfs_fs_info *fs_info = rbio-&gt;bioc-&gt;fs_info;</div><div class='add'>+	phys_addr_t *paddrs;</div><div class='add'>+	u8 csum_buf[BTRFS_CSUM_SIZE];</div><div class='add'>+	u8 *csum_expected;</div><div class='ctx'> </div><div class='del'>-	pointers = kcalloc(rbio-&gt;real_stripes, sizeof(void *), GFP_NOFS);</div><div class='del'>-	if (!pointers) {</div><div class='del'>-		err = BLK_STS_RESOURCE;</div><div class='del'>-		goto cleanup_io;</div><div class='del'>-	}</div><div class='add'>+	if (!rbio-&gt;csum_bitmap || !rbio-&gt;csum_buf)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='add'>+	/* No way to verify P/Q as they are not covered by data csum. */</div><div class='add'>+	if (stripe_nr &gt;= rbio-&gt;nr_data)</div><div class='add'>+		return 0;</div><div class='ctx'> 	/*</div><div class='del'>-	 * Store copy of pointers that does not get reordered during</div><div class='del'>-	 * reconstruction so that kunmap_local works.</div><div class='add'>+	 * If we're rebuilding a read, we have to use pages from the</div><div class='add'>+	 * bio list if possible.</div><div class='ctx'> 	 */</div><div class='del'>-	unmap_array = kcalloc(rbio-&gt;real_stripes, sizeof(void *), GFP_NOFS);</div><div class='del'>-	if (!unmap_array) {</div><div class='del'>-		err = BLK_STS_RESOURCE;</div><div class='del'>-		goto cleanup_pointers;</div><div class='add'>+	if (rbio-&gt;operation == BTRFS_RBIO_READ_REBUILD) {</div><div class='add'>+		paddrs = sector_paddrs_in_rbio(rbio, stripe_nr, sector_nr, 0);</div><div class='add'>+	} else {</div><div class='add'>+		paddrs = rbio_stripe_paddrs(rbio, stripe_nr, sector_nr);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	faila = rbio-&gt;faila;</div><div class='del'>-	failb = rbio-&gt;failb;</div><div class='add'>+	csum_expected = rbio-&gt;csum_buf +</div><div class='add'>+			(stripe_nr * rbio-&gt;stripe_nsectors + sector_nr) *</div><div class='add'>+			fs_info-&gt;csum_size;</div><div class='add'>+	btrfs_calculate_block_csum_pages(fs_info, paddrs, csum_buf);</div><div class='add'>+	if (unlikely(memcmp(csum_buf, csum_expected, fs_info-&gt;csum_size) != 0))</div><div class='add'>+		return -EIO;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if (rbio-&gt;operation == BTRFS_RBIO_READ_REBUILD ||</div><div class='del'>-	    rbio-&gt;operation == BTRFS_RBIO_REBUILD_MISSING) {</div><div class='del'>-		spin_lock_irq(&amp;rbio-&gt;bio_list_lock);</div><div class='del'>-		set_bit(RBIO_RMW_LOCKED_BIT, &amp;rbio-&gt;flags);</div><div class='del'>-		spin_unlock_irq(&amp;rbio-&gt;bio_list_lock);</div><div class='del'>-	}</div><div class='add'>+static void recover_vertical_step(struct btrfs_raid_bio *rbio,</div><div class='add'>+				  unsigned int sector_nr,</div><div class='add'>+				  unsigned int step_nr,</div><div class='add'>+				  int faila, int failb,</div><div class='add'>+				  void **pointers, void **unmap_array)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = rbio-&gt;bioc-&gt;fs_info;</div><div class='add'>+	const u32 step = min(fs_info-&gt;sectorsize, PAGE_SIZE);</div><div class='add'>+	int stripe_nr;</div><div class='ctx'> </div><div class='del'>-	index_rbio_pages(rbio);</div><div class='add'>+	ASSERT(step_nr &lt; rbio-&gt;sector_nsteps);</div><div class='add'>+	ASSERT(sector_nr &lt; rbio-&gt;stripe_nsectors);</div><div class='ctx'> </div><div class='del'>-	for (pagenr = 0; pagenr &lt; rbio-&gt;stripe_npages; pagenr++) {</div><div class='del'>-		/*</div><div class='del'>-		 * Now we just use bitmap to mark the horizontal stripes in</div><div class='del'>-		 * which we have data when doing parity scrub.</div><div class='del'>-		 */</div><div class='del'>-		if (rbio-&gt;operation == BTRFS_RBIO_PARITY_SCRUB &amp;&amp;</div><div class='del'>-		    !test_bit(pagenr, rbio-&gt;dbitmap))</div><div class='del'>-			continue;</div><div class='add'>+	/*</div><div class='add'>+	 * Setup our array of pointers with sectors from each stripe</div><div class='add'>+	 *</div><div class='add'>+	 * NOTE: store a duplicate array of pointers to preserve the</div><div class='add'>+	 * pointer order.</div><div class='add'>+	 */</div><div class='add'>+	for (stripe_nr = 0; stripe_nr &lt; rbio-&gt;real_stripes; stripe_nr++) {</div><div class='add'>+		phys_addr_t paddr;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * Setup our array of pointers with pages from each stripe</div><div class='del'>-		 *</div><div class='del'>-		 * NOTE: store a duplicate array of pointers to preserve the</div><div class='del'>-		 * pointer order</div><div class='add'>+		 * If we're rebuilding a read, we have to use pages from the</div><div class='add'>+		 * bio list if possible.</div><div class='ctx'> 		 */</div><div class='del'>-		for (stripe = 0; stripe &lt; rbio-&gt;real_stripes; stripe++) {</div><div class='del'>-			/*</div><div class='del'>-			 * if we're rebuilding a read, we have to use</div><div class='del'>-			 * pages from the bio list</div><div class='del'>-			 */</div><div class='del'>-			if ((rbio-&gt;operation == BTRFS_RBIO_READ_REBUILD ||</div><div class='del'>-			     rbio-&gt;operation == BTRFS_RBIO_REBUILD_MISSING) &amp;&amp;</div><div class='del'>-			    (stripe == faila || stripe == failb)) {</div><div class='del'>-				page = page_in_rbio(rbio, stripe, pagenr, 0);</div><div class='del'>-			} else {</div><div class='del'>-				page = rbio_stripe_page(rbio, stripe, pagenr);</div><div class='del'>-			}</div><div class='del'>-			pointers[stripe] = kmap_local_page(page);</div><div class='del'>-			unmap_array[stripe] = pointers[stripe];</div><div class='add'>+		if (rbio-&gt;operation == BTRFS_RBIO_READ_REBUILD) {</div><div class='add'>+			paddr = sector_paddr_in_rbio(rbio, stripe_nr, sector_nr, step_nr, 0);</div><div class='add'>+		} else {</div><div class='add'>+			paddr = rbio_stripe_paddr(rbio, stripe_nr, sector_nr, step_nr);</div><div class='ctx'> 		}</div><div class='add'>+		pointers[stripe_nr] = kmap_local_paddr(paddr);</div><div class='add'>+		unmap_array[stripe_nr] = pointers[stripe_nr];</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		/* all raid6 handling here */</div><div class='del'>-		if (rbio-&gt;bioc-&gt;map_type &amp; BTRFS_BLOCK_GROUP_RAID6) {</div><div class='del'>-			/*</div><div class='del'>-			 * single failure, rebuild from parity raid5</div><div class='del'>-			 * style</div><div class='del'>-			 */</div><div class='del'>-			if (failb &lt; 0) {</div><div class='del'>-				if (faila == rbio-&gt;nr_data) {</div><div class='del'>-					/*</div><div class='del'>-					 * Just the P stripe has failed, without</div><div class='del'>-					 * a bad data or Q stripe.</div><div class='del'>-					 * TODO, we should redo the xor here.</div><div class='del'>-					 */</div><div class='del'>-					err = BLK_STS_IOERR;</div><div class='del'>-					goto cleanup;</div><div class='del'>-				}</div><div class='add'>+	/* All raid6 handling here */</div><div class='add'>+	if (rbio-&gt;bioc-&gt;map_type &amp; BTRFS_BLOCK_GROUP_RAID6) {</div><div class='add'>+		/* Single failure, rebuild from parity raid5 style */</div><div class='add'>+		if (failb &lt; 0) {</div><div class='add'>+			if (faila == rbio-&gt;nr_data)</div><div class='ctx'> 				/*</div><div class='del'>-				 * a single failure in raid6 is rebuilt</div><div class='del'>-				 * in the pstripe code below</div><div class='add'>+				 * Just the P stripe has failed, without</div><div class='add'>+				 * a bad data or Q stripe.</div><div class='add'>+				 * We have nothing to do, just skip the</div><div class='add'>+				 * recovery for this stripe.</div><div class='ctx'> 				 */</div><div class='del'>-				goto pstripe;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			/* make sure our ps and qs are in order */</div><div class='del'>-			if (faila &gt; failb)</div><div class='del'>-				swap(faila, failb);</div><div class='del'>-</div><div class='del'>-			/* if the q stripe is failed, do a pstripe reconstruction</div><div class='del'>-			 * from the xors.</div><div class='del'>-			 * If both the q stripe and the P stripe are failed, we're</div><div class='del'>-			 * here due to a crc mismatch and we can't give them the</div><div class='del'>-			 * data they want</div><div class='add'>+				goto cleanup;</div><div class='add'>+			/*</div><div class='add'>+			 * a single failure in raid6 is rebuilt</div><div class='add'>+			 * in the pstripe code below</div><div class='ctx'> 			 */</div><div class='del'>-			if (rbio-&gt;bioc-&gt;raid_map[failb] == RAID6_Q_STRIPE) {</div><div class='del'>-				if (rbio-&gt;bioc-&gt;raid_map[faila] ==</div><div class='del'>-				    RAID5_P_STRIPE) {</div><div class='del'>-					err = BLK_STS_IOERR;</div><div class='del'>-					goto cleanup;</div><div class='del'>-				}</div><div class='add'>+			goto pstripe;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * If the q stripe is failed, do a pstripe reconstruction from</div><div class='add'>+		 * the xors.</div><div class='add'>+		 * If both the q stripe and the P stripe are failed, we're</div><div class='add'>+		 * here due to a crc mismatch and we can't give them the</div><div class='add'>+		 * data they want.</div><div class='add'>+		 */</div><div class='add'>+		if (failb == rbio-&gt;real_stripes - 1) {</div><div class='add'>+			if (faila == rbio-&gt;real_stripes - 2)</div><div class='ctx'> 				/*</div><div class='del'>-				 * otherwise we have one bad data stripe and</div><div class='del'>-				 * a good P stripe.  raid5!</div><div class='add'>+				 * Only P and Q are corrupted.</div><div class='add'>+				 * We only care about data stripes recovery,</div><div class='add'>+				 * can skip this vertical stripe.</div><div class='ctx'> 				 */</div><div class='del'>-				goto pstripe;</div><div class='del'>-			}</div><div class='add'>+				goto cleanup;</div><div class='add'>+			/*</div><div class='add'>+			 * Otherwise we have one bad data stripe and</div><div class='add'>+			 * a good P stripe.  raid5!</div><div class='add'>+			 */</div><div class='add'>+			goto pstripe;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-			if (rbio-&gt;bioc-&gt;raid_map[failb] == RAID5_P_STRIPE) {</div><div class='del'>-				raid6_datap_recov(rbio-&gt;real_stripes,</div><div class='del'>-						  PAGE_SIZE, faila, pointers);</div><div class='del'>-			} else {</div><div class='del'>-				raid6_2data_recov(rbio-&gt;real_stripes,</div><div class='del'>-						  PAGE_SIZE, faila, failb,</div><div class='del'>-						  pointers);</div><div class='del'>-			}</div><div class='add'>+		if (failb == rbio-&gt;real_stripes - 2) {</div><div class='add'>+			raid6_datap_recov(rbio-&gt;real_stripes, step,</div><div class='add'>+					  faila, pointers);</div><div class='ctx'> 		} else {</div><div class='del'>-			void *p;</div><div class='add'>+			raid6_2data_recov(rbio-&gt;real_stripes, step,</div><div class='add'>+					  faila, failb, pointers);</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		void *p;</div><div class='ctx'> </div><div class='del'>-			/* rebuild from P stripe here (raid5 or raid6) */</div><div class='del'>-			BUG_ON(failb != -1);</div><div class='add'>+		/* Rebuild from P stripe here (raid5 or raid6). */</div><div class='add'>+		ASSERT(failb == -1);</div><div class='ctx'> pstripe:</div><div class='del'>-			/* Copy parity block into failed block to start with */</div><div class='del'>-			copy_page(pointers[faila], pointers[rbio-&gt;nr_data]);</div><div class='del'>-</div><div class='del'>-			/* rearrange the pointer array */</div><div class='del'>-			p = pointers[faila];</div><div class='del'>-			for (stripe = faila; stripe &lt; rbio-&gt;nr_data - 1; stripe++)</div><div class='del'>-				pointers[stripe] = pointers[stripe + 1];</div><div class='del'>-			pointers[rbio-&gt;nr_data - 1] = p;</div><div class='del'>-</div><div class='del'>-			/* xor in the rest */</div><div class='del'>-			run_xor(pointers, rbio-&gt;nr_data - 1, PAGE_SIZE);</div><div class='del'>-		}</div><div class='del'>-		/* if we're doing this rebuild as part of an rmw, go through</div><div class='del'>-		 * and set all of our private rbio pages in the</div><div class='del'>-		 * failed stripes as uptodate.  This way finish_rmw will</div><div class='del'>-		 * know they can be trusted.  If this was a read reconstruction,</div><div class='del'>-		 * other endio functions will fiddle the uptodate bits</div><div class='del'>-		 */</div><div class='del'>-		if (rbio-&gt;operation == BTRFS_RBIO_WRITE) {</div><div class='del'>-			for (i = 0;  i &lt; rbio-&gt;stripe_npages; i++) {</div><div class='del'>-				if (faila != -1) {</div><div class='del'>-					page = rbio_stripe_page(rbio, faila, i);</div><div class='del'>-					SetPageUptodate(page);</div><div class='del'>-				}</div><div class='del'>-				if (failb != -1) {</div><div class='del'>-					page = rbio_stripe_page(rbio, failb, i);</div><div class='del'>-					SetPageUptodate(page);</div><div class='del'>-				}</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-		for (stripe = rbio-&gt;real_stripes - 1; stripe &gt;= 0; stripe--)</div><div class='del'>-			kunmap_local(unmap_array[stripe]);</div><div class='add'>+		/* Copy parity block into failed block to start with */</div><div class='add'>+		memcpy(pointers[faila], pointers[rbio-&gt;nr_data], step);</div><div class='add'>+</div><div class='add'>+		/* Rearrange the pointer array */</div><div class='add'>+		p = pointers[faila];</div><div class='add'>+		for (stripe_nr = faila; stripe_nr &lt; rbio-&gt;nr_data - 1;</div><div class='add'>+		     stripe_nr++)</div><div class='add'>+			pointers[stripe_nr] = pointers[stripe_nr + 1];</div><div class='add'>+		pointers[rbio-&gt;nr_data - 1] = p;</div><div class='add'>+</div><div class='add'>+		/* Xor in the rest */</div><div class='add'>+		run_xor(pointers, rbio-&gt;nr_data - 1, step);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = BLK_STS_OK;</div><div class='ctx'> cleanup:</div><div class='del'>-	kfree(unmap_array);</div><div class='del'>-cleanup_pointers:</div><div class='del'>-	kfree(pointers);</div><div class='add'>+	for (stripe_nr = rbio-&gt;real_stripes - 1; stripe_nr &gt;= 0; stripe_nr--)</div><div class='add'>+		kunmap_local(unmap_array[stripe_nr]);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Recover a vertical stripe specified by @sector_nr.</div><div class='add'>+ * @*pointers are the pre-allocated pointers by the caller, so we don't</div><div class='add'>+ * need to allocate/free the pointers again and again.</div><div class='add'>+ */</div><div class='add'>+static int recover_vertical(struct btrfs_raid_bio *rbio, int sector_nr,</div><div class='add'>+			    void **pointers, void **unmap_array)</div><div class='add'>+{</div><div class='add'>+	int found_errors;</div><div class='add'>+	int faila;</div><div class='add'>+	int failb;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='del'>-cleanup_io:</div><div class='ctx'> 	/*</div><div class='del'>-	 * Similar to READ_REBUILD, REBUILD_MISSING at this point also has a</div><div class='del'>-	 * valid rbio which is consistent with ondisk content, thus such a</div><div class='del'>-	 * valid rbio can be cached to avoid further disk reads.</div><div class='add'>+	 * Now we just use bitmap to mark the horizontal stripes in</div><div class='add'>+	 * which we have data when doing parity scrub.</div><div class='ctx'> 	 */</div><div class='del'>-	if (rbio-&gt;operation == BTRFS_RBIO_READ_REBUILD ||</div><div class='del'>-	    rbio-&gt;operation == BTRFS_RBIO_REBUILD_MISSING) {</div><div class='del'>-		/*</div><div class='del'>-		 * - In case of two failures, where rbio-&gt;failb != -1:</div><div class='del'>-		 *</div><div class='del'>-		 *   Do not cache this rbio since the above read reconstruction</div><div class='del'>-		 *   (raid6_datap_recov() or raid6_2data_recov()) may have</div><div class='del'>-		 *   changed some content of stripes which are not identical to</div><div class='del'>-		 *   on-disk content any more, otherwise, a later write/recover</div><div class='del'>-		 *   may steal stripe_pages from this rbio and end up with</div><div class='del'>-		 *   corruptions or rebuild failures.</div><div class='del'>-		 *</div><div class='del'>-		 * - In case of single failure, where rbio-&gt;failb == -1:</div><div class='del'>-		 *</div><div class='del'>-		 *   Cache this rbio iff the above read reconstruction is</div><div class='del'>-		 *   executed without problems.</div><div class='del'>-		 */</div><div class='del'>-		if (err == BLK_STS_OK &amp;&amp; rbio-&gt;failb &lt; 0)</div><div class='del'>-			cache_rbio_pages(rbio);</div><div class='del'>-		else</div><div class='del'>-			clear_bit(RBIO_CACHE_READY_BIT, &amp;rbio-&gt;flags);</div><div class='del'>-</div><div class='del'>-		rbio_orig_end_io(rbio, err);</div><div class='del'>-	} else if (err == BLK_STS_OK) {</div><div class='del'>-		rbio-&gt;faila = -1;</div><div class='del'>-		rbio-&gt;failb = -1;</div><div class='del'>-</div><div class='del'>-		if (rbio-&gt;operation == BTRFS_RBIO_WRITE)</div><div class='del'>-			finish_rmw(rbio);</div><div class='del'>-		else if (rbio-&gt;operation == BTRFS_RBIO_PARITY_SCRUB)</div><div class='del'>-			finish_parity_scrub(rbio, 0);</div><div class='del'>-		else</div><div class='del'>-			BUG();</div><div class='del'>-	} else {</div><div class='del'>-		rbio_orig_end_io(rbio, err);</div><div class='add'>+	if (rbio-&gt;operation == BTRFS_RBIO_PARITY_SCRUB &amp;&amp;</div><div class='add'>+	    !test_bit(sector_nr, &amp;rbio-&gt;dbitmap))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	found_errors = get_rbio_vertical_errors(rbio, sector_nr, &amp;faila,</div><div class='add'>+						&amp;failb);</div><div class='add'>+	/*</div><div class='add'>+	 * No errors in the vertical stripe, skip it.  Can happen for recovery</div><div class='add'>+	 * which only part of a stripe failed csum check.</div><div class='add'>+	 */</div><div class='add'>+	if (!found_errors)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if (unlikely(found_errors &gt; rbio-&gt;bioc-&gt;max_errors))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	for (int i = 0; i &lt; rbio-&gt;sector_nsteps; i++)</div><div class='add'>+		recover_vertical_step(rbio, sector_nr, i, faila, failb,</div><div class='add'>+					    pointers, unmap_array);</div><div class='add'>+	if (faila &gt;= 0) {</div><div class='add'>+		ret = verify_one_sector(rbio, faila, sector_nr);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='add'>+</div><div class='add'>+		set_bit(rbio_sector_index(rbio, faila, sector_nr),</div><div class='add'>+			rbio-&gt;stripe_uptodate_bitmap);</div><div class='add'>+	}</div><div class='add'>+	if (failb &gt;= 0) {</div><div class='add'>+		ret = verify_one_sector(rbio, failb, sector_nr);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='add'>+</div><div class='add'>+		set_bit(rbio_sector_index(rbio, failb, sector_nr),</div><div class='add'>+			rbio-&gt;stripe_uptodate_bitmap);</div><div class='ctx'> 	}</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * This is called only for stripes we've read from disk to</div><div class='del'>- * reconstruct the parity.</div><div class='del'>- */</div><div class='del'>-static void raid_recover_end_io(struct bio *bio)</div><div class='add'>+static int recover_sectors(struct btrfs_raid_bio *rbio)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_raid_bio *rbio = bio-&gt;bi_private;</div><div class='add'>+	void **pointers = NULL;</div><div class='add'>+	void **unmap_array = NULL;</div><div class='add'>+	int sectornr;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * we only read stripe pages off the disk, set them</div><div class='del'>-	 * up to date if there were no errors</div><div class='add'>+	 * @pointers array stores the pointer for each sector.</div><div class='add'>+	 *</div><div class='add'>+	 * @unmap_array stores copy of pointers that does not get reordered</div><div class='add'>+	 * during reconstruction so that kunmap_local works.</div><div class='ctx'> 	 */</div><div class='del'>-	if (bio-&gt;bi_status)</div><div class='del'>-		fail_bio_stripe(rbio, bio);</div><div class='del'>-	else</div><div class='del'>-		set_bio_pages_uptodate(bio);</div><div class='del'>-	bio_put(bio);</div><div class='add'>+	pointers = kcalloc(rbio-&gt;real_stripes, sizeof(void *), GFP_NOFS);</div><div class='add'>+	unmap_array = kcalloc(rbio-&gt;real_stripes, sizeof(void *), GFP_NOFS);</div><div class='add'>+	if (!pointers || !unmap_array) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (!atomic_dec_and_test(&amp;rbio-&gt;stripes_pending))</div><div class='del'>-		return;</div><div class='add'>+	if (rbio-&gt;operation == BTRFS_RBIO_READ_REBUILD) {</div><div class='add'>+		spin_lock(&amp;rbio-&gt;bio_list_lock);</div><div class='add'>+		set_bit(RBIO_RMW_LOCKED_BIT, &amp;rbio-&gt;flags);</div><div class='add'>+		spin_unlock(&amp;rbio-&gt;bio_list_lock);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (atomic_read(&amp;rbio-&gt;error) &gt; rbio-&gt;bioc-&gt;max_errors)</div><div class='del'>-		rbio_orig_end_io(rbio, BLK_STS_IOERR);</div><div class='del'>-	else</div><div class='del'>-		__raid_recover_end_io(rbio);</div><div class='add'>+	index_rbio_pages(rbio);</div><div class='add'>+</div><div class='add'>+	for (sectornr = 0; sectornr &lt; rbio-&gt;stripe_nsectors; sectornr++) {</div><div class='add'>+		ret = recover_vertical(rbio, sectornr, pointers, unmap_array);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	kfree(pointers);</div><div class='add'>+	kfree(unmap_array);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * reads everything we need off the disk to reconstruct</div><div class='del'>- * the parity. endio handlers trigger final reconstruction</div><div class='del'>- * when the IO is done.</div><div class='del'>- *</div><div class='del'>- * This is used both for reads from the higher layers and for</div><div class='del'>- * parity construction required to finish a rmw cycle.</div><div class='del'>- */</div><div class='del'>-static int __raid56_parity_recover(struct btrfs_raid_bio *rbio)</div><div class='add'>+static void recover_rbio(struct btrfs_raid_bio *rbio)</div><div class='ctx'> {</div><div class='del'>-	int bios_to_read = 0;</div><div class='del'>-	struct bio_list bio_list;</div><div class='del'>-	int ret;</div><div class='del'>-	int pagenr;</div><div class='del'>-	int stripe;</div><div class='del'>-	struct bio *bio;</div><div class='add'>+	struct bio_list bio_list = BIO_EMPTY_LIST;</div><div class='add'>+	int total_sector_nr;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	bio_list_init(&amp;bio_list);</div><div class='add'>+	/*</div><div class='add'>+	 * Either we're doing recover for a read failure or degraded write,</div><div class='add'>+	 * caller should have set error bitmap correctly.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(bitmap_weight(rbio-&gt;error_bitmap, rbio-&gt;nr_sectors));</div><div class='ctx'> </div><div class='add'>+	/* For recovery, we need to read all sectors including P/Q. */</div><div class='ctx'> 	ret = alloc_rbio_pages(rbio);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto cleanup;</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='del'>-	atomic_set(&amp;rbio-&gt;error, 0);</div><div class='add'>+	index_rbio_pages(rbio);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * read everything that hasn't failed.  Thanks to the</div><div class='del'>-	 * stripe cache, it is possible that some or all of these</div><div class='del'>-	 * pages are going to be uptodate.</div><div class='add'>+	 * Read everything that hasn't failed. However this time we will</div><div class='add'>+	 * not trust any cached sector.</div><div class='add'>+	 * As we may read out some stale data but higher layer is not reading</div><div class='add'>+	 * that stale part.</div><div class='add'>+	 *</div><div class='add'>+	 * So here we always re-read everything in recovery path.</div><div class='ctx'> 	 */</div><div class='del'>-	for (stripe = 0; stripe &lt; rbio-&gt;real_stripes; stripe++) {</div><div class='del'>-		if (rbio-&gt;faila == stripe || rbio-&gt;failb == stripe) {</div><div class='del'>-			atomic_inc(&amp;rbio-&gt;error);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		for (pagenr = 0; pagenr &lt; rbio-&gt;stripe_npages; pagenr++) {</div><div class='del'>-			struct page *p;</div><div class='add'>+	for (total_sector_nr = 0; total_sector_nr &lt; rbio-&gt;nr_sectors;</div><div class='add'>+	     total_sector_nr++) {</div><div class='add'>+		int stripe = total_sector_nr / rbio-&gt;stripe_nsectors;</div><div class='add'>+		int sectornr = total_sector_nr % rbio-&gt;stripe_nsectors;</div><div class='add'>+		phys_addr_t *paddrs;</div><div class='ctx'> </div><div class='add'>+		/*</div><div class='add'>+		 * Skip the range which has error.  It can be a range which is</div><div class='add'>+		 * marked error (for csum mismatch), or it can be a missing</div><div class='add'>+		 * device.</div><div class='add'>+		 */</div><div class='add'>+		if (!rbio-&gt;bioc-&gt;stripes[stripe].dev-&gt;bdev ||</div><div class='add'>+		    test_bit(total_sector_nr, rbio-&gt;error_bitmap)) {</div><div class='ctx'> 			/*</div><div class='del'>-			 * the rmw code may have already read this</div><div class='del'>-			 * page in</div><div class='add'>+			 * Also set the error bit for missing device, which</div><div class='add'>+			 * may not yet have its error bit set.</div><div class='ctx'> 			 */</div><div class='del'>-			p = rbio_stripe_page(rbio, stripe, pagenr);</div><div class='del'>-			if (PageUptodate(p))</div><div class='del'>-				continue;</div><div class='del'>-</div><div class='del'>-			ret = rbio_add_io_page(rbio, &amp;bio_list,</div><div class='del'>-				       rbio_stripe_page(rbio, stripe, pagenr),</div><div class='del'>-				       stripe, pagenr, rbio-&gt;stripe_len);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto cleanup;</div><div class='add'>+			set_bit(total_sector_nr, rbio-&gt;error_bitmap);</div><div class='add'>+			continue;</div><div class='ctx'> 		}</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	bios_to_read = bio_list_size(&amp;bio_list);</div><div class='del'>-	if (!bios_to_read) {</div><div class='del'>-		/*</div><div class='del'>-		 * we might have no bios to read just because the pages</div><div class='del'>-		 * were up to date, or we might have no bios to read because</div><div class='del'>-		 * the devices were gone.</div><div class='del'>-		 */</div><div class='del'>-		if (atomic_read(&amp;rbio-&gt;error) &lt;= rbio-&gt;bioc-&gt;max_errors) {</div><div class='del'>-			__raid_recover_end_io(rbio);</div><div class='del'>-			return 0;</div><div class='del'>-		} else {</div><div class='del'>-			goto cleanup;</div><div class='add'>+		paddrs = rbio_stripe_paddrs(rbio, stripe, sectornr);</div><div class='add'>+		ret = rbio_add_io_paddrs(rbio, &amp;bio_list, paddrs, stripe,</div><div class='add'>+					 sectornr, REQ_OP_READ);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			bio_list_put(&amp;bio_list);</div><div class='add'>+			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * The bioc may be freed once we submit the last bio. Make sure not to</div><div class='del'>-	 * touch it after that.</div><div class='del'>-	 */</div><div class='del'>-	atomic_set(&amp;rbio-&gt;stripes_pending, bios_to_read);</div><div class='del'>-	while ((bio = bio_list_pop(&amp;bio_list))) {</div><div class='del'>-		bio-&gt;bi_private = rbio;</div><div class='del'>-		bio-&gt;bi_end_io = raid_recover_end_io;</div><div class='del'>-		bio-&gt;bi_opf = REQ_OP_READ;</div><div class='add'>+	submit_read_wait_bio_list(rbio, &amp;bio_list);</div><div class='add'>+	ret = recover_sectors(rbio);</div><div class='add'>+out:</div><div class='add'>+	rbio_orig_end_io(rbio, errno_to_blk_status(ret));</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		btrfs_bio_wq_end_io(rbio-&gt;bioc-&gt;fs_info, bio, BTRFS_WQ_ENDIO_RAID56);</div><div class='add'>+static void recover_rbio_work(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_raid_bio *rbio;</div><div class='ctx'> </div><div class='del'>-		submit_bio(bio);</div><div class='del'>-	}</div><div class='add'>+	rbio = container_of(work, struct btrfs_raid_bio, work);</div><div class='add'>+	if (!lock_stripe_add(rbio))</div><div class='add'>+		recover_rbio(rbio);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+static void recover_rbio_work_locked(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	recover_rbio(container_of(work, struct btrfs_raid_bio, work));</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-cleanup:</div><div class='del'>-	if (rbio-&gt;operation == BTRFS_RBIO_READ_REBUILD ||</div><div class='del'>-	    rbio-&gt;operation == BTRFS_RBIO_REBUILD_MISSING)</div><div class='del'>-		rbio_orig_end_io(rbio, BLK_STS_IOERR);</div><div class='add'>+static void set_rbio_raid6_extra_error(struct btrfs_raid_bio *rbio, int mirror_num)</div><div class='add'>+{</div><div class='add'>+	bool found = false;</div><div class='add'>+	int sector_nr;</div><div class='ctx'> </div><div class='del'>-	while ((bio = bio_list_pop(&amp;bio_list)))</div><div class='del'>-		bio_put(bio);</div><div class='add'>+	/*</div><div class='add'>+	 * This is for RAID6 extra recovery tries, thus mirror number should</div><div class='add'>+	 * be large than 2.</div><div class='add'>+	 * Mirror 1 means read from data stripes. Mirror 2 means rebuild using</div><div class='add'>+	 * RAID5 methods.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(mirror_num &gt; 2);</div><div class='add'>+	for (sector_nr = 0; sector_nr &lt; rbio-&gt;stripe_nsectors; sector_nr++) {</div><div class='add'>+		int found_errors;</div><div class='add'>+		int faila;</div><div class='add'>+		int failb;</div><div class='add'>+</div><div class='add'>+		found_errors = get_rbio_vertical_errors(rbio, sector_nr,</div><div class='add'>+							 &amp;faila, &amp;failb);</div><div class='add'>+		/* This vertical stripe doesn't have errors. */</div><div class='add'>+		if (!found_errors)</div><div class='add'>+			continue;</div><div class='ctx'> </div><div class='del'>-	return -EIO;</div><div class='add'>+		/*</div><div class='add'>+		 * If we found errors, there should be only one error marked</div><div class='add'>+		 * by previous set_rbio_range_error().</div><div class='add'>+		 */</div><div class='add'>+		ASSERT(found_errors == 1);</div><div class='add'>+		found = true;</div><div class='add'>+</div><div class='add'>+		/* Now select another stripe to mark as error. */</div><div class='add'>+		failb = rbio-&gt;real_stripes - (mirror_num - 1);</div><div class='add'>+		if (failb &lt;= faila)</div><div class='add'>+			failb--;</div><div class='add'>+</div><div class='add'>+		/* Set the extra bit in error bitmap. */</div><div class='add'>+		if (failb &gt;= 0)</div><div class='add'>+			set_bit(failb * rbio-&gt;stripe_nsectors + sector_nr,</div><div class='add'>+				rbio-&gt;error_bitmap);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* We should found at least one vertical stripe with error.*/</div><div class='add'>+	ASSERT(found);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2114,99 +2262,287 @@ cleanup:</div><div class='ctx'>  * so we assume the bio they send down corresponds to a failed part</div><div class='ctx'>  * of the drive.</div><div class='ctx'>  */</div><div class='del'>-int raid56_parity_recover(struct bio *bio, struct btrfs_io_context *bioc,</div><div class='del'>-			  u64 stripe_len, int mirror_num, int generic_io)</div><div class='add'>+void raid56_parity_recover(struct bio *bio, struct btrfs_io_context *bioc,</div><div class='add'>+			   int mirror_num)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = bioc-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_raid_bio *rbio;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (generic_io) {</div><div class='del'>-		ASSERT(bioc-&gt;mirror_num == mirror_num);</div><div class='del'>-		btrfs_bio(bio)-&gt;mirror_num = mirror_num;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	rbio = alloc_rbio(fs_info, bioc, stripe_len);</div><div class='add'>+	rbio = alloc_rbio(fs_info, bioc);</div><div class='ctx'> 	if (IS_ERR(rbio)) {</div><div class='del'>-		if (generic_io)</div><div class='del'>-			btrfs_put_bioc(bioc);</div><div class='del'>-		return PTR_ERR(rbio);</div><div class='add'>+		bio-&gt;bi_status = errno_to_blk_status(PTR_ERR(rbio));</div><div class='add'>+		bio_endio(bio);</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	rbio-&gt;operation = BTRFS_RBIO_READ_REBUILD;</div><div class='del'>-	bio_list_add(&amp;rbio-&gt;bio_list, bio);</div><div class='del'>-	rbio-&gt;bio_list_bytes = bio-&gt;bi_iter.bi_size;</div><div class='del'>-</div><div class='del'>-	rbio-&gt;faila = find_logical_bio_stripe(rbio, bio);</div><div class='del'>-	if (rbio-&gt;faila == -1) {</div><div class='del'>-		btrfs_warn(fs_info,</div><div class='del'>-"%s could not find the bad stripe in raid56 so that we cannot recover any more (bio has logical %llu len %llu, bioc has map_type %llu)",</div><div class='del'>-			   __func__, bio-&gt;bi_iter.bi_sector &lt;&lt; 9,</div><div class='del'>-			   (u64)bio-&gt;bi_iter.bi_size, bioc-&gt;map_type);</div><div class='del'>-		if (generic_io)</div><div class='del'>-			btrfs_put_bioc(bioc);</div><div class='del'>-		kfree(rbio);</div><div class='del'>-		return -EIO;</div><div class='del'>-	}</div><div class='add'>+	rbio_add_bio(rbio, bio);</div><div class='ctx'> </div><div class='del'>-	if (generic_io) {</div><div class='del'>-		btrfs_bio_counter_inc_noblocked(fs_info);</div><div class='del'>-		rbio-&gt;generic_bio_cnt = 1;</div><div class='del'>-	} else {</div><div class='del'>-		btrfs_get_bioc(bioc);</div><div class='del'>-	}</div><div class='add'>+	set_rbio_range_error(rbio, bio);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Loop retry:</div><div class='ctx'> 	 * for 'mirror == 2', reconstruct from all other stripes.</div><div class='ctx'> 	 * for 'mirror_num &gt; 2', select a stripe to fail on every retry.</div><div class='ctx'> 	 */</div><div class='del'>-	if (mirror_num &gt; 2) {</div><div class='add'>+	if (mirror_num &gt; 2)</div><div class='add'>+		set_rbio_raid6_extra_error(rbio, mirror_num);</div><div class='add'>+</div><div class='add'>+	start_async_work(rbio, recover_rbio_work);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fill_data_csums(struct btrfs_raid_bio *rbio)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = rbio-&gt;bioc-&gt;fs_info;</div><div class='add'>+	struct btrfs_root *csum_root = btrfs_csum_root(fs_info,</div><div class='add'>+						       rbio-&gt;bioc-&gt;full_stripe_logical);</div><div class='add'>+	const u64 start = rbio-&gt;bioc-&gt;full_stripe_logical;</div><div class='add'>+	const u32 len = (rbio-&gt;nr_data * rbio-&gt;stripe_nsectors) &lt;&lt;</div><div class='add'>+			fs_info-&gt;sectorsize_bits;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	/* The rbio should not have its csum buffer initialized. */</div><div class='add'>+	ASSERT(!rbio-&gt;csum_buf &amp;&amp; !rbio-&gt;csum_bitmap);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Skip the csum search if:</div><div class='add'>+	 *</div><div class='add'>+	 * - The rbio doesn't belong to data block groups</div><div class='add'>+	 *   Then we are doing IO for tree blocks, no need to search csums.</div><div class='add'>+	 *</div><div class='add'>+	 * - The rbio belongs to mixed block groups</div><div class='add'>+	 *   This is to avoid deadlock, as we're already holding the full</div><div class='add'>+	 *   stripe lock, if we trigger a metadata read, and it needs to do</div><div class='add'>+	 *   raid56 recovery, we will deadlock.</div><div class='add'>+	 */</div><div class='add'>+	if (!(rbio-&gt;bioc-&gt;map_type &amp; BTRFS_BLOCK_GROUP_DATA) ||</div><div class='add'>+	    rbio-&gt;bioc-&gt;map_type &amp; BTRFS_BLOCK_GROUP_METADATA)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	rbio-&gt;csum_buf = kzalloc(rbio-&gt;nr_data * rbio-&gt;stripe_nsectors *</div><div class='add'>+				 fs_info-&gt;csum_size, GFP_NOFS);</div><div class='add'>+	rbio-&gt;csum_bitmap = bitmap_zalloc(rbio-&gt;nr_data * rbio-&gt;stripe_nsectors,</div><div class='add'>+					  GFP_NOFS);</div><div class='add'>+	if (!rbio-&gt;csum_buf || !rbio-&gt;csum_bitmap) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto error;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_lookup_csums_bitmap(csum_root, NULL, start, start + len - 1,</div><div class='add'>+					rbio-&gt;csum_buf, rbio-&gt;csum_bitmap);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto error;</div><div class='add'>+	if (bitmap_empty(rbio-&gt;csum_bitmap, len &gt;&gt; fs_info-&gt;sectorsize_bits))</div><div class='add'>+		goto no_csum;</div><div class='add'>+	return;</div><div class='add'>+</div><div class='add'>+error:</div><div class='add'>+	/*</div><div class='add'>+	 * We failed to allocate memory or grab the csum, but it's not fatal,</div><div class='add'>+	 * we can still continue.  But better to warn users that RMW is no</div><div class='add'>+	 * longer safe for this particular sub-stripe write.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_warn_rl(fs_info,</div><div class='add'>+"sub-stripe write for full stripe %llu is not safe, failed to get csum: %d",</div><div class='add'>+			rbio-&gt;bioc-&gt;full_stripe_logical, ret);</div><div class='add'>+no_csum:</div><div class='add'>+	kfree(rbio-&gt;csum_buf);</div><div class='add'>+	bitmap_free(rbio-&gt;csum_bitmap);</div><div class='add'>+	rbio-&gt;csum_buf = NULL;</div><div class='add'>+	rbio-&gt;csum_bitmap = NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int rmw_read_wait_recover(struct btrfs_raid_bio *rbio)</div><div class='add'>+{</div><div class='add'>+	struct bio_list bio_list = BIO_EMPTY_LIST;</div><div class='add'>+	int total_sector_nr;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Fill the data csums we need for data verification.  We need to fill</div><div class='add'>+	 * the csum_bitmap/csum_buf first, as our endio function will try to</div><div class='add'>+	 * verify the data sectors.</div><div class='add'>+	 */</div><div class='add'>+	fill_data_csums(rbio);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Build a list of bios to read all sectors (including data and P/Q).</div><div class='add'>+	 *</div><div class='add'>+	 * This behavior is to compensate the later csum verification and recovery.</div><div class='add'>+	 */</div><div class='add'>+	for (total_sector_nr = 0; total_sector_nr &lt; rbio-&gt;nr_sectors;</div><div class='add'>+	     total_sector_nr++) {</div><div class='add'>+		int stripe = total_sector_nr / rbio-&gt;stripe_nsectors;</div><div class='add'>+		int sectornr = total_sector_nr % rbio-&gt;stripe_nsectors;</div><div class='add'>+		phys_addr_t *paddrs;</div><div class='add'>+</div><div class='add'>+		paddrs = rbio_stripe_paddrs(rbio, stripe, sectornr);</div><div class='add'>+		ret = rbio_add_io_paddrs(rbio, &amp;bio_list, paddrs, stripe,</div><div class='add'>+					 sectornr, REQ_OP_READ);</div><div class='add'>+		if (ret) {</div><div class='add'>+			bio_list_put(&amp;bio_list);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We may or may not have any corrupted sectors (including missing dev</div><div class='add'>+	 * and csum mismatch), just let recover_sectors() to handle them all.</div><div class='add'>+	 */</div><div class='add'>+	submit_read_wait_bio_list(rbio, &amp;bio_list);</div><div class='add'>+	return recover_sectors(rbio);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void raid_wait_write_end_io(struct bio *bio)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_raid_bio *rbio = bio-&gt;bi_private;</div><div class='add'>+</div><div class='add'>+	if (bio-&gt;bi_status)</div><div class='add'>+		rbio_update_error_bitmap(rbio, bio);</div><div class='add'>+	bio_put(bio);</div><div class='add'>+	if (atomic_dec_and_test(&amp;rbio-&gt;stripes_pending))</div><div class='add'>+		wake_up(&amp;rbio-&gt;io_wait);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void submit_write_bios(struct btrfs_raid_bio *rbio,</div><div class='add'>+			      struct bio_list *bio_list)</div><div class='add'>+{</div><div class='add'>+	struct bio *bio;</div><div class='add'>+</div><div class='add'>+	atomic_set(&amp;rbio-&gt;stripes_pending, bio_list_size(bio_list));</div><div class='add'>+	while ((bio = bio_list_pop(bio_list))) {</div><div class='add'>+		bio-&gt;bi_end_io = raid_wait_write_end_io;</div><div class='add'>+</div><div class='add'>+		if (trace_raid56_write_enabled()) {</div><div class='add'>+			struct raid56_bio_trace_info trace_info = { 0 };</div><div class='add'>+</div><div class='add'>+			bio_get_trace_info(rbio, bio, &amp;trace_info);</div><div class='add'>+			trace_raid56_write(rbio, bio, &amp;trace_info);</div><div class='add'>+		}</div><div class='add'>+		submit_bio(bio);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * To determine if we need to read any sector from the disk.</div><div class='add'>+ * Should only be utilized in RMW path, to skip cached rbio.</div><div class='add'>+ */</div><div class='add'>+static bool need_read_stripe_sectors(struct btrfs_raid_bio *rbio)</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; rbio-&gt;nr_data * rbio-&gt;stripe_nsectors; i++) {</div><div class='add'>+		phys_addr_t paddr = rbio-&gt;stripe_paddrs[i * rbio-&gt;sector_nsteps];</div><div class='add'>+</div><div class='ctx'> 		/*</div><div class='del'>-		 * 'mirror == 3' is to fail the p stripe and</div><div class='del'>-		 * reconstruct from the q stripe.  'mirror &gt; 3' is to</div><div class='del'>-		 * fail a data stripe and reconstruct from p+q stripe.</div><div class='add'>+		 * We have a sector which doesn't have page nor uptodate,</div><div class='add'>+		 * thus this rbio can not be cached one, as cached one must</div><div class='add'>+		 * have all its data sectors present and uptodate.</div><div class='ctx'> 		 */</div><div class='del'>-		rbio-&gt;failb = rbio-&gt;real_stripes - (mirror_num - 1);</div><div class='del'>-		ASSERT(rbio-&gt;failb &gt; 0);</div><div class='del'>-		if (rbio-&gt;failb &lt;= rbio-&gt;faila)</div><div class='del'>-			rbio-&gt;failb--;</div><div class='add'>+		if (paddr == INVALID_PADDR ||</div><div class='add'>+		    !test_bit(i, rbio-&gt;stripe_uptodate_bitmap))</div><div class='add'>+			return true;</div><div class='ctx'> 	}</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	ret = lock_stripe_add(rbio);</div><div class='add'>+static void rmw_rbio(struct btrfs_raid_bio *rbio)</div><div class='add'>+{</div><div class='add'>+	struct bio_list bio_list;</div><div class='add'>+	int sectornr;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * __raid56_parity_recover will end the bio with</div><div class='del'>-	 * any errors it hits.  We don't want to return</div><div class='del'>-	 * its error value up the stack because our caller</div><div class='del'>-	 * will end up calling bio_endio with any nonzero</div><div class='del'>-	 * return</div><div class='add'>+	 * Allocate the pages for parity first, as P/Q pages will always be</div><div class='add'>+	 * needed for both full-stripe and sub-stripe writes.</div><div class='ctx'> 	 */</div><div class='del'>-	if (ret == 0)</div><div class='del'>-		__raid56_parity_recover(rbio);</div><div class='add'>+	ret = alloc_rbio_parity_pages(rbio);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='del'>-	 * our rbio has been added to the list of</div><div class='del'>-	 * rbios that will be handled after the</div><div class='del'>-	 * currently lock owner is done</div><div class='add'>+	 * Either full stripe write, or we have every data sector already</div><div class='add'>+	 * cached, can go to write path immediately.</div><div class='ctx'> 	 */</div><div class='del'>-	return 0;</div><div class='add'>+	if (!rbio_is_full(rbio) &amp;&amp; need_read_stripe_sectors(rbio)) {</div><div class='add'>+		/*</div><div class='add'>+		 * Now we're doing sub-stripe write, also need all data stripes</div><div class='add'>+		 * to do the full RMW.</div><div class='add'>+		 */</div><div class='add'>+		ret = alloc_rbio_data_pages(rbio);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out;</div><div class='add'>+</div><div class='add'>+		index_rbio_pages(rbio);</div><div class='add'>+</div><div class='add'>+		ret = rmw_read_wait_recover(rbio);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * At this stage we're not allowed to add any new bios to the</div><div class='add'>+	 * bio list any more, anyone else that wants to change this stripe</div><div class='add'>+	 * needs to do their own rmw.</div><div class='add'>+	 */</div><div class='add'>+	spin_lock(&amp;rbio-&gt;bio_list_lock);</div><div class='add'>+	set_bit(RBIO_RMW_LOCKED_BIT, &amp;rbio-&gt;flags);</div><div class='add'>+	spin_unlock(&amp;rbio-&gt;bio_list_lock);</div><div class='add'>+</div><div class='add'>+	bitmap_clear(rbio-&gt;error_bitmap, 0, rbio-&gt;nr_sectors);</div><div class='add'>+</div><div class='add'>+	index_rbio_pages(rbio);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We don't cache full rbios because we're assuming</div><div class='add'>+	 * the higher layers are unlikely to use this area of</div><div class='add'>+	 * the disk again soon.  If they do use it again,</div><div class='add'>+	 * hopefully they will send another full bio.</div><div class='add'>+	 */</div><div class='add'>+	if (!rbio_is_full(rbio))</div><div class='add'>+		cache_rbio_pages(rbio);</div><div class='add'>+	else</div><div class='add'>+		clear_bit(RBIO_CACHE_READY_BIT, &amp;rbio-&gt;flags);</div><div class='ctx'> </div><div class='add'>+	for (sectornr = 0; sectornr &lt; rbio-&gt;stripe_nsectors; sectornr++)</div><div class='add'>+		generate_pq_vertical(rbio, sectornr);</div><div class='add'>+</div><div class='add'>+	bio_list_init(&amp;bio_list);</div><div class='add'>+	ret = rmw_assemble_write_bios(rbio, &amp;bio_list);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	/* We should have at least one bio assembled. */</div><div class='add'>+	ASSERT(bio_list_size(&amp;bio_list));</div><div class='add'>+	submit_write_bios(rbio, &amp;bio_list);</div><div class='add'>+	wait_event(rbio-&gt;io_wait, atomic_read(&amp;rbio-&gt;stripes_pending) == 0);</div><div class='add'>+</div><div class='add'>+	/* We may have more errors than our tolerance during the read. */</div><div class='add'>+	for (sectornr = 0; sectornr &lt; rbio-&gt;stripe_nsectors; sectornr++) {</div><div class='add'>+		int found_errors;</div><div class='add'>+</div><div class='add'>+		found_errors = get_rbio_vertical_errors(rbio, sectornr, NULL, NULL);</div><div class='add'>+		if (unlikely(found_errors &gt; rbio-&gt;bioc-&gt;max_errors)) {</div><div class='add'>+			ret = -EIO;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='add'>+	rbio_orig_end_io(rbio, errno_to_blk_status(ret));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void rmw_work(struct btrfs_work *work)</div><div class='add'>+static void rmw_rbio_work(struct work_struct *work)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_raid_bio *rbio;</div><div class='ctx'> </div><div class='ctx'> 	rbio = container_of(work, struct btrfs_raid_bio, work);</div><div class='del'>-	raid56_rmw_stripe(rbio);</div><div class='add'>+	if (lock_stripe_add(rbio) == 0)</div><div class='add'>+		rmw_rbio(rbio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void read_rebuild_work(struct btrfs_work *work)</div><div class='add'>+static void rmw_rbio_work_locked(struct work_struct *work)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_raid_bio *rbio;</div><div class='del'>-</div><div class='del'>-	rbio = container_of(work, struct btrfs_raid_bio, work);</div><div class='del'>-	__raid56_parity_recover(rbio);</div><div class='add'>+	rmw_rbio(container_of(work, struct btrfs_raid_bio, work));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2221,14 +2557,14 @@ static void read_rebuild_work(struct btrfs_work *work)</div><div class='ctx'> </div><div class='ctx'> struct btrfs_raid_bio *raid56_parity_alloc_scrub_rbio(struct bio *bio,</div><div class='ctx'> 				struct btrfs_io_context *bioc,</div><div class='del'>-				u64 stripe_len, struct btrfs_device *scrub_dev,</div><div class='add'>+				struct btrfs_device *scrub_dev,</div><div class='ctx'> 				unsigned long *dbitmap, int stripe_nsectors)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = bioc-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_raid_bio *rbio;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	rbio = alloc_rbio(fs_info, bioc, stripe_len);</div><div class='add'>+	rbio = alloc_rbio(fs_info, bioc);</div><div class='ctx'> 	if (IS_ERR(rbio))</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	bio_list_add(&amp;rbio-&gt;bio_list, bio);</div><div class='hunk'>@@ -2250,35 +2586,30 @@ struct btrfs_raid_bio *raid56_parity_alloc_scrub_rbio(struct bio *bio,</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	ASSERT(i &lt; rbio-&gt;real_stripes);</div><div class='del'>-</div><div class='del'>-	/* Now we just support the sectorsize equals to page size */</div><div class='del'>-	ASSERT(fs_info-&gt;sectorsize == PAGE_SIZE);</div><div class='del'>-	ASSERT(rbio-&gt;stripe_npages == stripe_nsectors);</div><div class='del'>-	bitmap_copy(rbio-&gt;dbitmap, dbitmap, stripe_nsectors);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * We have already increased bio_counter when getting bioc, record it</div><div class='del'>-	 * so we can free it at rbio_orig_end_io().</div><div class='del'>-	 */</div><div class='del'>-	rbio-&gt;generic_bio_cnt = 1;</div><div class='add'>+	ASSERT_RBIO_STRIPE(i &lt; rbio-&gt;real_stripes, rbio, i);</div><div class='ctx'> </div><div class='add'>+	bitmap_copy(&amp;rbio-&gt;dbitmap, dbitmap, stripe_nsectors);</div><div class='ctx'> 	return rbio;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Used for both parity scrub and missing. */</div><div class='del'>-void raid56_add_scrub_pages(struct btrfs_raid_bio *rbio, struct page *page,</div><div class='del'>-			    u64 logical)</div><div class='add'>+static int alloc_rbio_sector_pages(struct btrfs_raid_bio *rbio,</div><div class='add'>+				  int sector_nr)</div><div class='ctx'> {</div><div class='del'>-	int stripe_offset;</div><div class='del'>-	int index;</div><div class='add'>+	const u32 step = min(PAGE_SIZE, rbio-&gt;bioc-&gt;fs_info-&gt;sectorsize);</div><div class='add'>+	const u32 base = sector_nr * rbio-&gt;sector_nsteps;</div><div class='add'>+</div><div class='add'>+	for (int i = base; i &lt; base + rbio-&gt;sector_nsteps; i++) {</div><div class='add'>+		const unsigned int page_index = (i * step) &gt;&gt; PAGE_SHIFT;</div><div class='add'>+		struct page *page;</div><div class='ctx'> </div><div class='del'>-	ASSERT(logical &gt;= rbio-&gt;bioc-&gt;raid_map[0]);</div><div class='del'>-	ASSERT(logical + PAGE_SIZE &lt;= rbio-&gt;bioc-&gt;raid_map[0] +</div><div class='del'>-				rbio-&gt;stripe_len * rbio-&gt;nr_data);</div><div class='del'>-	stripe_offset = (int)(logical - rbio-&gt;bioc-&gt;raid_map[0]);</div><div class='del'>-	index = stripe_offset &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	rbio-&gt;bio_pages[index] = page;</div><div class='add'>+		if (rbio-&gt;stripe_pages[page_index])</div><div class='add'>+			continue;</div><div class='add'>+		page = alloc_page(GFP_NOFS);</div><div class='add'>+		if (!page)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+		rbio-&gt;stripe_pages[page_index] = page;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2287,40 +2618,96 @@ void raid56_add_scrub_pages(struct btrfs_raid_bio *rbio, struct page *page,</div><div class='ctx'>  */</div><div class='ctx'> static int alloc_rbio_essential_pages(struct btrfs_raid_bio *rbio)</div><div class='ctx'> {</div><div class='del'>-	int i;</div><div class='del'>-	int bit;</div><div class='del'>-	int index;</div><div class='del'>-	struct page *page;</div><div class='add'>+	int total_sector_nr;</div><div class='ctx'> </div><div class='del'>-	for_each_set_bit(bit, rbio-&gt;dbitmap, rbio-&gt;stripe_npages) {</div><div class='del'>-		for (i = 0; i &lt; rbio-&gt;real_stripes; i++) {</div><div class='del'>-			index = i * rbio-&gt;stripe_npages + bit;</div><div class='del'>-			if (rbio-&gt;stripe_pages[index])</div><div class='del'>-				continue;</div><div class='add'>+	for (total_sector_nr = 0; total_sector_nr &lt; rbio-&gt;nr_sectors;</div><div class='add'>+	     total_sector_nr++) {</div><div class='add'>+		int sectornr = total_sector_nr % rbio-&gt;stripe_nsectors;</div><div class='add'>+		int ret;</div><div class='ctx'> </div><div class='del'>-			page = alloc_page(GFP_NOFS);</div><div class='del'>-			if (!page)</div><div class='del'>-				return -ENOMEM;</div><div class='del'>-			rbio-&gt;stripe_pages[index] = page;</div><div class='del'>-		}</div><div class='add'>+		if (!test_bit(sectornr, &amp;rbio-&gt;dbitmap))</div><div class='add'>+			continue;</div><div class='add'>+		ret = alloc_rbio_sector_pages(rbio, total_sector_nr);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='ctx'> 	}</div><div class='add'>+	index_stripe_sectors(rbio);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline void finish_parity_scrub(struct btrfs_raid_bio *rbio,</div><div class='del'>-					 int need_check)</div><div class='add'>+/* Return true if the content of the step matches the caclulated one. */</div><div class='add'>+static bool verify_one_parity_step(struct btrfs_raid_bio *rbio,</div><div class='add'>+				   void *pointers[], unsigned int sector_nr,</div><div class='add'>+				   unsigned int step_nr)</div><div class='add'>+{</div><div class='add'>+	const unsigned int nr_data = rbio-&gt;nr_data;</div><div class='add'>+	const bool has_qstripe = (rbio-&gt;real_stripes - rbio-&gt;nr_data == 2);</div><div class='add'>+	const u32 step = min(rbio-&gt;bioc-&gt;fs_info-&gt;sectorsize, PAGE_SIZE);</div><div class='add'>+	void *parity;</div><div class='add'>+	bool ret = false;</div><div class='add'>+</div><div class='add'>+	ASSERT(step_nr &lt; rbio-&gt;sector_nsteps);</div><div class='add'>+</div><div class='add'>+	/* First collect one page from each data stripe. */</div><div class='add'>+	for (int stripe = 0; stripe &lt; nr_data; stripe++)</div><div class='add'>+		pointers[stripe] = kmap_local_paddr(</div><div class='add'>+				sector_paddr_in_rbio(rbio, stripe, sector_nr,</div><div class='add'>+						     step_nr, 0));</div><div class='add'>+</div><div class='add'>+	if (has_qstripe) {</div><div class='add'>+		assert_rbio(rbio);</div><div class='add'>+		/* RAID6, call the library function to fill in our P/Q. */</div><div class='add'>+		raid6_call.gen_syndrome(rbio-&gt;real_stripes, step, pointers);</div><div class='add'>+	} else {</div><div class='add'>+		/* RAID5. */</div><div class='add'>+		memcpy(pointers[nr_data], pointers[0], step);</div><div class='add'>+		run_xor(pointers + 1, nr_data - 1, step);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Check scrubbing parity and repair it. */</div><div class='add'>+	parity = kmap_local_paddr(rbio_stripe_paddr(rbio, rbio-&gt;scrubp, sector_nr, step_nr));</div><div class='add'>+	if (memcmp(parity, pointers[rbio-&gt;scrubp], step) != 0)</div><div class='add'>+		memcpy(parity, pointers[rbio-&gt;scrubp], step);</div><div class='add'>+	else</div><div class='add'>+		ret = true;</div><div class='add'>+	kunmap_local(parity);</div><div class='add'>+</div><div class='add'>+	for (int stripe = nr_data - 1; stripe &gt;= 0; stripe--)</div><div class='add'>+		kunmap_local(pointers[stripe]);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * The @pointers array should have the P/Q parity already mapped.</div><div class='add'>+ */</div><div class='add'>+static void verify_one_parity_sector(struct btrfs_raid_bio *rbio,</div><div class='add'>+				     void *pointers[], unsigned int sector_nr)</div><div class='add'>+{</div><div class='add'>+	bool found_error = false;</div><div class='add'>+</div><div class='add'>+	for (int step_nr = 0; step_nr &lt; rbio-&gt;sector_nsteps; step_nr++) {</div><div class='add'>+		bool match;</div><div class='add'>+</div><div class='add'>+		match = verify_one_parity_step(rbio, pointers, sector_nr, step_nr);</div><div class='add'>+		if (!match)</div><div class='add'>+			found_error = true;</div><div class='add'>+	}</div><div class='add'>+	if (!found_error)</div><div class='add'>+		bitmap_clear(&amp;rbio-&gt;dbitmap, sector_nr, 1);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int finish_parity_scrub(struct btrfs_raid_bio *rbio)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_io_context *bioc = rbio-&gt;bioc;</div><div class='ctx'> 	void **pointers = rbio-&gt;finish_pointers;</div><div class='del'>-	unsigned long *pbitmap = rbio-&gt;finish_pbitmap;</div><div class='add'>+	unsigned long *pbitmap = &amp;rbio-&gt;finish_pbitmap;</div><div class='ctx'> 	int nr_data = rbio-&gt;nr_data;</div><div class='del'>-	int stripe;</div><div class='del'>-	int pagenr;</div><div class='add'>+	int sectornr;</div><div class='ctx'> 	bool has_qstripe;</div><div class='del'>-	struct page *p_page = NULL;</div><div class='del'>-	struct page *q_page = NULL;</div><div class='add'>+	struct page *page;</div><div class='add'>+	phys_addr_t p_paddr = INVALID_PADDR;</div><div class='add'>+	phys_addr_t q_paddr = INVALID_PADDR;</div><div class='ctx'> 	struct bio_list bio_list;</div><div class='del'>-	struct bio *bio;</div><div class='ctx'> 	int is_replace = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -2333,9 +2720,13 @@ static noinline void finish_parity_scrub(struct btrfs_raid_bio *rbio,</div><div class='ctx'> 	else</div><div class='ctx'> 		BUG();</div><div class='ctx'> </div><div class='del'>-	if (bioc-&gt;num_tgtdevs &amp;&amp; bioc-&gt;tgtdev_map[rbio-&gt;scrubp]) {</div><div class='add'>+	/*</div><div class='add'>+	 * Replace is running and our P/Q stripe is being replaced, then we</div><div class='add'>+	 * need to duplicate the final write to replace target.</div><div class='add'>+	 */</div><div class='add'>+	if (bioc-&gt;replace_nr_stripes &amp;&amp; bioc-&gt;replace_stripe_src == rbio-&gt;scrubp) {</div><div class='ctx'> 		is_replace = 1;</div><div class='del'>-		bitmap_copy(pbitmap, rbio-&gt;dbitmap, rbio-&gt;stripe_npages);</div><div class='add'>+		bitmap_copy(pbitmap, &amp;rbio-&gt;dbitmap, rbio-&gt;stripe_nsectors);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -2345,82 +2736,52 @@ static noinline void finish_parity_scrub(struct btrfs_raid_bio *rbio,</div><div class='ctx'> 	 */</div><div class='ctx'> 	clear_bit(RBIO_CACHE_READY_BIT, &amp;rbio-&gt;flags);</div><div class='ctx'> </div><div class='del'>-	if (!need_check)</div><div class='del'>-		goto writeback;</div><div class='del'>-</div><div class='del'>-	p_page = alloc_page(GFP_NOFS);</div><div class='del'>-	if (!p_page)</div><div class='del'>-		goto cleanup;</div><div class='del'>-	SetPageUptodate(p_page);</div><div class='add'>+	page = alloc_page(GFP_NOFS);</div><div class='add'>+	if (!page)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	p_paddr = page_to_phys(page);</div><div class='add'>+	page = NULL;</div><div class='add'>+	pointers[nr_data] = kmap_local_paddr(p_paddr);</div><div class='ctx'> </div><div class='ctx'> 	if (has_qstripe) {</div><div class='ctx'> 		/* RAID6, allocate and map temp space for the Q stripe */</div><div class='del'>-		q_page = alloc_page(GFP_NOFS);</div><div class='del'>-		if (!q_page) {</div><div class='del'>-			__free_page(p_page);</div><div class='del'>-			goto cleanup;</div><div class='add'>+		page = alloc_page(GFP_NOFS);</div><div class='add'>+		if (!page) {</div><div class='add'>+			__free_page(phys_to_page(p_paddr));</div><div class='add'>+			p_paddr = INVALID_PADDR;</div><div class='add'>+			return -ENOMEM;</div><div class='ctx'> 		}</div><div class='del'>-		SetPageUptodate(q_page);</div><div class='del'>-		pointers[rbio-&gt;real_stripes - 1] = kmap_local_page(q_page);</div><div class='add'>+		q_paddr = page_to_phys(page);</div><div class='add'>+		page = NULL;</div><div class='add'>+		pointers[rbio-&gt;real_stripes - 1] = kmap_local_paddr(q_paddr);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	atomic_set(&amp;rbio-&gt;error, 0);</div><div class='add'>+	bitmap_clear(rbio-&gt;error_bitmap, 0, rbio-&gt;nr_sectors);</div><div class='ctx'> </div><div class='ctx'> 	/* Map the parity stripe just once */</div><div class='del'>-	pointers[nr_data] = kmap_local_page(p_page);</div><div class='del'>-</div><div class='del'>-	for_each_set_bit(pagenr, rbio-&gt;dbitmap, rbio-&gt;stripe_npages) {</div><div class='del'>-		struct page *p;</div><div class='del'>-		void *parity;</div><div class='del'>-		/* first collect one page from each data stripe */</div><div class='del'>-		for (stripe = 0; stripe &lt; nr_data; stripe++) {</div><div class='del'>-			p = page_in_rbio(rbio, stripe, pagenr, 0);</div><div class='del'>-			pointers[stripe] = kmap_local_page(p);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (has_qstripe) {</div><div class='del'>-			/* RAID6, call the library function to fill in our P/Q */</div><div class='del'>-			raid6_call.gen_syndrome(rbio-&gt;real_stripes, PAGE_SIZE,</div><div class='del'>-						pointers);</div><div class='del'>-		} else {</div><div class='del'>-			/* raid5 */</div><div class='del'>-			copy_page(pointers[nr_data], pointers[0]);</div><div class='del'>-			run_xor(pointers + 1, nr_data - 1, PAGE_SIZE);</div><div class='del'>-		}</div><div class='ctx'> </div><div class='del'>-		/* Check scrubbing parity and repair it */</div><div class='del'>-		p = rbio_stripe_page(rbio, rbio-&gt;scrubp, pagenr);</div><div class='del'>-		parity = kmap_local_page(p);</div><div class='del'>-		if (memcmp(parity, pointers[rbio-&gt;scrubp], PAGE_SIZE))</div><div class='del'>-			copy_page(parity, pointers[rbio-&gt;scrubp]);</div><div class='del'>-		else</div><div class='del'>-			/* Parity is right, needn't writeback */</div><div class='del'>-			bitmap_clear(rbio-&gt;dbitmap, pagenr, 1);</div><div class='del'>-		kunmap_local(parity);</div><div class='del'>-</div><div class='del'>-		for (stripe = nr_data - 1; stripe &gt;= 0; stripe--)</div><div class='del'>-			kunmap_local(pointers[stripe]);</div><div class='del'>-	}</div><div class='add'>+	for_each_set_bit(sectornr, &amp;rbio-&gt;dbitmap, rbio-&gt;stripe_nsectors)</div><div class='add'>+		verify_one_parity_sector(rbio, pointers, sectornr);</div><div class='ctx'> </div><div class='ctx'> 	kunmap_local(pointers[nr_data]);</div><div class='del'>-	__free_page(p_page);</div><div class='del'>-	if (q_page) {</div><div class='del'>-		kunmap_local(pointers[rbio-&gt;real_stripes - 1]);</div><div class='del'>-		__free_page(q_page);</div><div class='add'>+	__free_page(phys_to_page(p_paddr));</div><div class='add'>+	p_paddr = INVALID_PADDR;</div><div class='add'>+	if (q_paddr != INVALID_PADDR) {</div><div class='add'>+		__free_page(phys_to_page(q_paddr));</div><div class='add'>+		q_paddr = INVALID_PADDR;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-writeback:</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * time to start writing.  Make bios for everything from the</div><div class='ctx'> 	 * higher layers (the bio_list in our rbio) and our p/q.  Ignore</div><div class='ctx'> 	 * everything else.</div><div class='ctx'> 	 */</div><div class='del'>-	for_each_set_bit(pagenr, rbio-&gt;dbitmap, rbio-&gt;stripe_npages) {</div><div class='del'>-		struct page *page;</div><div class='add'>+	for_each_set_bit(sectornr, &amp;rbio-&gt;dbitmap, rbio-&gt;stripe_nsectors) {</div><div class='add'>+		phys_addr_t *paddrs;</div><div class='ctx'> </div><div class='del'>-		page = rbio_stripe_page(rbio, rbio-&gt;scrubp, pagenr);</div><div class='del'>-		ret = rbio_add_io_page(rbio, &amp;bio_list,</div><div class='del'>-			       page, rbio-&gt;scrubp, pagenr, rbio-&gt;stripe_len);</div><div class='add'>+		paddrs = rbio_stripe_paddrs(rbio, rbio-&gt;scrubp, sectornr);</div><div class='add'>+		ret = rbio_add_io_paddrs(rbio, &amp;bio_list, paddrs, rbio-&gt;scrubp,</div><div class='add'>+					 sectornr, REQ_OP_WRITE);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto cleanup;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2428,41 +2789,28 @@ writeback:</div><div class='ctx'> 	if (!is_replace)</div><div class='ctx'> 		goto submit_write;</div><div class='ctx'> </div><div class='del'>-	for_each_set_bit(pagenr, pbitmap, rbio-&gt;stripe_npages) {</div><div class='del'>-		struct page *page;</div><div class='add'>+	/*</div><div class='add'>+	 * Replace is running and our parity stripe needs to be duplicated to</div><div class='add'>+	 * the target device.  Check we have a valid source stripe number.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT_RBIO(rbio-&gt;bioc-&gt;replace_stripe_src &gt;= 0, rbio);</div><div class='add'>+	for_each_set_bit(sectornr, pbitmap, rbio-&gt;stripe_nsectors) {</div><div class='add'>+		phys_addr_t *paddrs;</div><div class='ctx'> </div><div class='del'>-		page = rbio_stripe_page(rbio, rbio-&gt;scrubp, pagenr);</div><div class='del'>-		ret = rbio_add_io_page(rbio, &amp;bio_list, page,</div><div class='del'>-				       bioc-&gt;tgtdev_map[rbio-&gt;scrubp],</div><div class='del'>-				       pagenr, rbio-&gt;stripe_len);</div><div class='add'>+		paddrs = rbio_stripe_paddrs(rbio, rbio-&gt;scrubp, sectornr);</div><div class='add'>+		ret = rbio_add_io_paddrs(rbio, &amp;bio_list, paddrs, rbio-&gt;real_stripes,</div><div class='add'>+					 sectornr, REQ_OP_WRITE);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto cleanup;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> submit_write:</div><div class='del'>-	nr_data = bio_list_size(&amp;bio_list);</div><div class='del'>-	if (!nr_data) {</div><div class='del'>-		/* Every parity is right */</div><div class='del'>-		rbio_orig_end_io(rbio, BLK_STS_OK);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	atomic_set(&amp;rbio-&gt;stripes_pending, nr_data);</div><div class='del'>-</div><div class='del'>-	while ((bio = bio_list_pop(&amp;bio_list))) {</div><div class='del'>-		bio-&gt;bi_private = rbio;</div><div class='del'>-		bio-&gt;bi_end_io = raid_write_end_io;</div><div class='del'>-		bio-&gt;bi_opf = REQ_OP_WRITE;</div><div class='del'>-</div><div class='del'>-		submit_bio(bio);</div><div class='del'>-	}</div><div class='del'>-	return;</div><div class='add'>+	submit_write_bios(rbio, &amp;bio_list);</div><div class='add'>+	return 0;</div><div class='ctx'> </div><div class='ctx'> cleanup:</div><div class='del'>-	rbio_orig_end_io(rbio, BLK_STS_IOERR);</div><div class='del'>-</div><div class='del'>-	while ((bio = bio_list_pop(&amp;bio_list)))</div><div class='del'>-		bio_put(bio);</div><div class='add'>+	bio_list_put(&amp;bio_list);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int is_data_stripe(struct btrfs_raid_bio *rbio, int stripe)</div><div class='hunk'>@@ -2472,238 +2820,238 @@ static inline int is_data_stripe(struct btrfs_raid_bio *rbio, int stripe)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * While we're doing the parity check and repair, we could have errors</div><div class='del'>- * in reading pages off the disk.  This checks for errors and if we're</div><div class='del'>- * not able to read the page it'll trigger parity reconstruction.  The</div><div class='del'>- * parity scrub will be finished after we've reconstructed the failed</div><div class='del'>- * stripes</div><div class='del'>- */</div><div class='del'>-static void validate_rbio_for_parity_scrub(struct btrfs_raid_bio *rbio)</div><div class='add'>+static int recover_scrub_rbio(struct btrfs_raid_bio *rbio)</div><div class='ctx'> {</div><div class='del'>-	if (atomic_read(&amp;rbio-&gt;error) &gt; rbio-&gt;bioc-&gt;max_errors)</div><div class='del'>-		goto cleanup;</div><div class='add'>+	void **pointers = NULL;</div><div class='add'>+	void **unmap_array = NULL;</div><div class='add'>+	int sector_nr;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	if (rbio-&gt;faila &gt;= 0 || rbio-&gt;failb &gt;= 0) {</div><div class='add'>+	/*</div><div class='add'>+	 * @pointers array stores the pointer for each sector.</div><div class='add'>+	 *</div><div class='add'>+	 * @unmap_array stores copy of pointers that does not get reordered</div><div class='add'>+	 * during reconstruction so that kunmap_local works.</div><div class='add'>+	 */</div><div class='add'>+	pointers = kcalloc(rbio-&gt;real_stripes, sizeof(void *), GFP_NOFS);</div><div class='add'>+	unmap_array = kcalloc(rbio-&gt;real_stripes, sizeof(void *), GFP_NOFS);</div><div class='add'>+	if (!pointers || !unmap_array) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for (sector_nr = 0; sector_nr &lt; rbio-&gt;stripe_nsectors; sector_nr++) {</div><div class='ctx'> 		int dfail = 0, failp = -1;</div><div class='add'>+		int faila;</div><div class='add'>+		int failb;</div><div class='add'>+		int found_errors;</div><div class='add'>+</div><div class='add'>+		found_errors = get_rbio_vertical_errors(rbio, sector_nr,</div><div class='add'>+							 &amp;faila, &amp;failb);</div><div class='add'>+		if (unlikely(found_errors &gt; rbio-&gt;bioc-&gt;max_errors)) {</div><div class='add'>+			ret = -EIO;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		if (found_errors == 0)</div><div class='add'>+			continue;</div><div class='ctx'> </div><div class='del'>-		if (is_data_stripe(rbio, rbio-&gt;faila))</div><div class='del'>-			dfail++;</div><div class='del'>-		else if (is_parity_stripe(rbio-&gt;faila))</div><div class='del'>-			failp = rbio-&gt;faila;</div><div class='add'>+		/* We should have at least one error here. */</div><div class='add'>+		ASSERT(faila &gt;= 0 || failb &gt;= 0);</div><div class='ctx'> </div><div class='del'>-		if (is_data_stripe(rbio, rbio-&gt;failb))</div><div class='add'>+		if (is_data_stripe(rbio, faila))</div><div class='ctx'> 			dfail++;</div><div class='del'>-		else if (is_parity_stripe(rbio-&gt;failb))</div><div class='del'>-			failp = rbio-&gt;failb;</div><div class='add'>+		else if (is_parity_stripe(faila))</div><div class='add'>+			failp = faila;</div><div class='ctx'> </div><div class='add'>+		if (is_data_stripe(rbio, failb))</div><div class='add'>+			dfail++;</div><div class='add'>+		else if (is_parity_stripe(failb))</div><div class='add'>+			failp = failb;</div><div class='ctx'> 		/*</div><div class='del'>-		 * Because we can not use a scrubbing parity to repair</div><div class='del'>-		 * the data, so the capability of the repair is declined.</div><div class='del'>-		 * (In the case of RAID5, we can not repair anything)</div><div class='add'>+		 * Because we can not use a scrubbing parity to repair the</div><div class='add'>+		 * data, so the capability of the repair is declined.  (In the</div><div class='add'>+		 * case of RAID5, we can not repair anything.)</div><div class='ctx'> 		 */</div><div class='del'>-		if (dfail &gt; rbio-&gt;bioc-&gt;max_errors - 1)</div><div class='del'>-			goto cleanup;</div><div class='del'>-</div><div class='add'>+		if (unlikely(dfail &gt; rbio-&gt;bioc-&gt;max_errors - 1)) {</div><div class='add'>+			ret = -EIO;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> 		/*</div><div class='del'>-		 * If all data is good, only parity is correctly, just</div><div class='del'>-		 * repair the parity.</div><div class='add'>+		 * If all data is good, only parity is correctly, just repair</div><div class='add'>+		 * the parity, no need to recover data stripes.</div><div class='ctx'> 		 */</div><div class='del'>-		if (dfail == 0) {</div><div class='del'>-			finish_parity_scrub(rbio, 0);</div><div class='del'>-			return;</div><div class='del'>-		}</div><div class='add'>+		if (dfail == 0)</div><div class='add'>+			continue;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Here means we got one corrupted data stripe and one</div><div class='del'>-		 * corrupted parity on RAID6, if the corrupted parity</div><div class='del'>-		 * is scrubbing parity, luckily, use the other one to repair</div><div class='del'>-		 * the data, or we can not repair the data stripe.</div><div class='add'>+		 * corrupted parity on RAID6, if the corrupted parity is</div><div class='add'>+		 * scrubbing parity, luckily, use the other one to repair the</div><div class='add'>+		 * data, or we can not repair the data stripe.</div><div class='ctx'> 		 */</div><div class='del'>-		if (failp != rbio-&gt;scrubp)</div><div class='del'>-			goto cleanup;</div><div class='add'>+		if (unlikely(failp != rbio-&gt;scrubp)) {</div><div class='add'>+			ret = -EIO;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-		__raid_recover_end_io(rbio);</div><div class='del'>-	} else {</div><div class='del'>-		finish_parity_scrub(rbio, 1);</div><div class='add'>+		ret = recover_vertical(rbio, sector_nr, pointers, unmap_array);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out;</div><div class='ctx'> 	}</div><div class='del'>-	return;</div><div class='del'>-</div><div class='del'>-cleanup:</div><div class='del'>-	rbio_orig_end_io(rbio, BLK_STS_IOERR);</div><div class='add'>+out:</div><div class='add'>+	kfree(pointers);</div><div class='add'>+	kfree(unmap_array);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * end io for the read phase of the rmw cycle.  All the bios here are physical</div><div class='del'>- * stripe bios we've read from the disk so we can recalculate the parity of the</div><div class='del'>- * stripe.</div><div class='del'>- *</div><div class='del'>- * This will usually kick off finish_rmw once all the bios are read in, but it</div><div class='del'>- * may trigger parity reconstruction if we had any errors along the way</div><div class='del'>- */</div><div class='del'>-static void raid56_parity_scrub_end_io(struct bio *bio)</div><div class='add'>+static int scrub_assemble_read_bios(struct btrfs_raid_bio *rbio)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_raid_bio *rbio = bio-&gt;bi_private;</div><div class='add'>+	struct bio_list bio_list = BIO_EMPTY_LIST;</div><div class='add'>+	int total_sector_nr;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	if (bio-&gt;bi_status)</div><div class='del'>-		fail_bio_stripe(rbio, bio);</div><div class='del'>-	else</div><div class='del'>-		set_bio_pages_uptodate(bio);</div><div class='add'>+	/* Build a list of bios to read all the missing parts. */</div><div class='add'>+	for (total_sector_nr = 0; total_sector_nr &lt; rbio-&gt;nr_sectors;</div><div class='add'>+	     total_sector_nr++) {</div><div class='add'>+		int sectornr = total_sector_nr % rbio-&gt;stripe_nsectors;</div><div class='add'>+		int stripe = total_sector_nr / rbio-&gt;stripe_nsectors;</div><div class='add'>+		phys_addr_t *paddrs;</div><div class='ctx'> </div><div class='del'>-	bio_put(bio);</div><div class='add'>+		/* No data in the vertical stripe, no need to read. */</div><div class='add'>+		if (!test_bit(sectornr, &amp;rbio-&gt;dbitmap))</div><div class='add'>+			continue;</div><div class='ctx'> </div><div class='del'>-	if (!atomic_dec_and_test(&amp;rbio-&gt;stripes_pending))</div><div class='del'>-		return;</div><div class='add'>+		/*</div><div class='add'>+		 * We want to find all the sectors missing from the rbio and</div><div class='add'>+		 * read them from the disk. If sector_paddr_in_rbio() finds a sector</div><div class='add'>+		 * in the bio list we don't need to read it off the stripe.</div><div class='add'>+		 */</div><div class='add'>+		paddrs = sector_paddrs_in_rbio(rbio, stripe, sectornr, 1);</div><div class='add'>+		if (paddrs == NULL)</div><div class='add'>+			continue;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * this will normally call finish_rmw to start our write</div><div class='del'>-	 * but if there are any failed stripes we'll reconstruct</div><div class='del'>-	 * from parity first</div><div class='del'>-	 */</div><div class='del'>-	validate_rbio_for_parity_scrub(rbio);</div><div class='add'>+		paddrs = rbio_stripe_paddrs(rbio, stripe, sectornr);</div><div class='add'>+		/*</div><div class='add'>+		 * The bio cache may have handed us an uptodate sector.  If so,</div><div class='add'>+		 * use it.</div><div class='add'>+		 */</div><div class='add'>+		if (test_bit(rbio_sector_index(rbio, stripe, sectornr),</div><div class='add'>+			     rbio-&gt;stripe_uptodate_bitmap))</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		ret = rbio_add_io_paddrs(rbio, &amp;bio_list, paddrs, stripe,</div><div class='add'>+					 sectornr, REQ_OP_READ);</div><div class='add'>+		if (ret) {</div><div class='add'>+			bio_list_put(&amp;bio_list);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	submit_read_wait_bio_list(rbio, &amp;bio_list);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void raid56_parity_scrub_stripe(struct btrfs_raid_bio *rbio)</div><div class='add'>+static void scrub_rbio(struct btrfs_raid_bio *rbio)</div><div class='ctx'> {</div><div class='del'>-	int bios_to_read = 0;</div><div class='del'>-	struct bio_list bio_list;</div><div class='add'>+	int sector_nr;</div><div class='ctx'> 	int ret;</div><div class='del'>-	int pagenr;</div><div class='del'>-	int stripe;</div><div class='del'>-	struct bio *bio;</div><div class='del'>-</div><div class='del'>-	bio_list_init(&amp;bio_list);</div><div class='ctx'> </div><div class='ctx'> 	ret = alloc_rbio_essential_pages(rbio);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto cleanup;</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='del'>-	atomic_set(&amp;rbio-&gt;error, 0);</div><div class='del'>-	/*</div><div class='del'>-	 * build a list of bios to read all the missing parts of this</div><div class='del'>-	 * stripe</div><div class='del'>-	 */</div><div class='del'>-	for (stripe = 0; stripe &lt; rbio-&gt;real_stripes; stripe++) {</div><div class='del'>-		for_each_set_bit(pagenr, rbio-&gt;dbitmap, rbio-&gt;stripe_npages) {</div><div class='del'>-			struct page *page;</div><div class='del'>-			/*</div><div class='del'>-			 * we want to find all the pages missing from</div><div class='del'>-			 * the rbio and read them from the disk.  If</div><div class='del'>-			 * page_in_rbio finds a page in the bio list</div><div class='del'>-			 * we don't need to read it off the stripe.</div><div class='del'>-			 */</div><div class='del'>-			page = page_in_rbio(rbio, stripe, pagenr, 1);</div><div class='del'>-			if (page)</div><div class='del'>-				continue;</div><div class='add'>+	bitmap_clear(rbio-&gt;error_bitmap, 0, rbio-&gt;nr_sectors);</div><div class='ctx'> </div><div class='del'>-			page = rbio_stripe_page(rbio, stripe, pagenr);</div><div class='del'>-			/*</div><div class='del'>-			 * the bio cache may have handed us an uptodate</div><div class='del'>-			 * page.  If so, be happy and use it</div><div class='del'>-			 */</div><div class='del'>-			if (PageUptodate(page))</div><div class='del'>-				continue;</div><div class='del'>-</div><div class='del'>-			ret = rbio_add_io_page(rbio, &amp;bio_list, page,</div><div class='del'>-				       stripe, pagenr, rbio-&gt;stripe_len);</div><div class='del'>-			if (ret)</div><div class='del'>-				goto cleanup;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	ret = scrub_assemble_read_bios(rbio);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='del'>-	bios_to_read = bio_list_size(&amp;bio_list);</div><div class='del'>-	if (!bios_to_read) {</div><div class='del'>-		/*</div><div class='del'>-		 * this can happen if others have merged with</div><div class='del'>-		 * us, it means there is nothing left to read.</div><div class='del'>-		 * But if there are missing devices it may not be</div><div class='del'>-		 * safe to do the full stripe write yet.</div><div class='del'>-		 */</div><div class='del'>-		goto finish;</div><div class='del'>-	}</div><div class='add'>+	/* We may have some failures, recover the failed sectors first. */</div><div class='add'>+	ret = recover_scrub_rbio(rbio);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * The bioc may be freed once we submit the last bio. Make sure not to</div><div class='del'>-	 * touch it after that.</div><div class='add'>+	 * We have every sector properly prepared. Can finish the scrub</div><div class='add'>+	 * and writeback the good content.</div><div class='ctx'> 	 */</div><div class='del'>-	atomic_set(&amp;rbio-&gt;stripes_pending, bios_to_read);</div><div class='del'>-	while ((bio = bio_list_pop(&amp;bio_list))) {</div><div class='del'>-		bio-&gt;bi_private = rbio;</div><div class='del'>-		bio-&gt;bi_end_io = raid56_parity_scrub_end_io;</div><div class='del'>-		bio-&gt;bi_opf = REQ_OP_READ;</div><div class='del'>-</div><div class='del'>-		btrfs_bio_wq_end_io(rbio-&gt;bioc-&gt;fs_info, bio, BTRFS_WQ_ENDIO_RAID56);</div><div class='del'>-</div><div class='del'>-		submit_bio(bio);</div><div class='add'>+	ret = finish_parity_scrub(rbio);</div><div class='add'>+	wait_event(rbio-&gt;io_wait, atomic_read(&amp;rbio-&gt;stripes_pending) == 0);</div><div class='add'>+	for (sector_nr = 0; sector_nr &lt; rbio-&gt;stripe_nsectors; sector_nr++) {</div><div class='add'>+		int found_errors;</div><div class='add'>+</div><div class='add'>+		found_errors = get_rbio_vertical_errors(rbio, sector_nr, NULL, NULL);</div><div class='add'>+		if (unlikely(found_errors &gt; rbio-&gt;bioc-&gt;max_errors)) {</div><div class='add'>+			ret = -EIO;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='del'>-	/* the actual write will happen once the reads are done */</div><div class='del'>-	return;</div><div class='del'>-</div><div class='del'>-cleanup:</div><div class='del'>-	rbio_orig_end_io(rbio, BLK_STS_IOERR);</div><div class='del'>-</div><div class='del'>-	while ((bio = bio_list_pop(&amp;bio_list)))</div><div class='del'>-		bio_put(bio);</div><div class='del'>-</div><div class='del'>-	return;</div><div class='del'>-</div><div class='del'>-finish:</div><div class='del'>-	validate_rbio_for_parity_scrub(rbio);</div><div class='add'>+out:</div><div class='add'>+	rbio_orig_end_io(rbio, errno_to_blk_status(ret));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void scrub_parity_work(struct btrfs_work *work)</div><div class='add'>+static void scrub_rbio_work_locked(struct work_struct *work)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_raid_bio *rbio;</div><div class='del'>-</div><div class='del'>-	rbio = container_of(work, struct btrfs_raid_bio, work);</div><div class='del'>-	raid56_parity_scrub_stripe(rbio);</div><div class='add'>+	scrub_rbio(container_of(work, struct btrfs_raid_bio, work));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void raid56_parity_submit_scrub_rbio(struct btrfs_raid_bio *rbio)</div><div class='ctx'> {</div><div class='ctx'> 	if (!lock_stripe_add(rbio))</div><div class='del'>-		start_async_work(rbio, scrub_parity_work);</div><div class='add'>+		start_async_work(rbio, scrub_rbio_work_locked);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* The following code is used for dev replace of a missing RAID 5/6 device. */</div><div class='del'>-</div><div class='del'>-struct btrfs_raid_bio *</div><div class='del'>-raid56_alloc_missing_rbio(struct bio *bio, struct btrfs_io_context *bioc,</div><div class='del'>-			  u64 length)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = bioc-&gt;fs_info;</div><div class='del'>-	struct btrfs_raid_bio *rbio;</div><div class='del'>-</div><div class='del'>-	rbio = alloc_rbio(fs_info, bioc, length);</div><div class='del'>-	if (IS_ERR(rbio))</div><div class='del'>-		return NULL;</div><div class='add'>+/*</div><div class='add'>+ * This is for scrub call sites where we already have correct data contents.</div><div class='add'>+ * This allows us to avoid reading data stripes again.</div><div class='add'>+ *</div><div class='add'>+ * Unfortunately here we have to do folio copy, other than reusing the pages.</div><div class='add'>+ * This is due to the fact rbio has its own page management for its cache.</div><div class='add'>+ */</div><div class='add'>+void raid56_parity_cache_data_folios(struct btrfs_raid_bio *rbio,</div><div class='add'>+				     struct folio **data_folios, u64 data_logical)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = rbio-&gt;bioc-&gt;fs_info;</div><div class='add'>+	const u64 offset_in_full_stripe = data_logical -</div><div class='add'>+					  rbio-&gt;bioc-&gt;full_stripe_logical;</div><div class='add'>+	unsigned int findex = 0;</div><div class='add'>+	unsigned int foffset = 0;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	rbio-&gt;operation = BTRFS_RBIO_REBUILD_MISSING;</div><div class='del'>-	bio_list_add(&amp;rbio-&gt;bio_list, bio);</div><div class='ctx'> 	/*</div><div class='del'>-	 * This is a special bio which is used to hold the completion handler</div><div class='del'>-	 * and make the scrub rbio is similar to the other types</div><div class='add'>+	 * If we hit ENOMEM temporarily, but later at</div><div class='add'>+	 * raid56_parity_submit_scrub_rbio() time it succeeded, we just do</div><div class='add'>+	 * the extra read, not a big deal.</div><div class='add'>+	 *</div><div class='add'>+	 * If we hit ENOMEM later at raid56_parity_submit_scrub_rbio() time,</div><div class='add'>+	 * the bio would got proper error number set.</div><div class='ctx'> 	 */</div><div class='del'>-	ASSERT(!bio-&gt;bi_iter.bi_size);</div><div class='add'>+	ret = alloc_rbio_data_pages(rbio);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	rbio-&gt;faila = find_logical_bio_stripe(rbio, bio);</div><div class='del'>-	if (rbio-&gt;faila == -1) {</div><div class='del'>-		BUG();</div><div class='del'>-		kfree(rbio);</div><div class='del'>-		return NULL;</div><div class='add'>+	/* data_logical must be at stripe boundary and inside the full stripe. */</div><div class='add'>+	ASSERT(IS_ALIGNED(offset_in_full_stripe, BTRFS_STRIPE_LEN));</div><div class='add'>+	ASSERT(offset_in_full_stripe &lt; (rbio-&gt;nr_data &lt;&lt; BTRFS_STRIPE_LEN_SHIFT));</div><div class='add'>+</div><div class='add'>+	for (unsigned int cur_off = offset_in_full_stripe;</div><div class='add'>+	     cur_off &lt; offset_in_full_stripe + BTRFS_STRIPE_LEN;</div><div class='add'>+	     cur_off += PAGE_SIZE) {</div><div class='add'>+		const unsigned int pindex = cur_off &gt;&gt; PAGE_SHIFT;</div><div class='add'>+		void *kaddr;</div><div class='add'>+</div><div class='add'>+		kaddr = kmap_local_page(rbio-&gt;stripe_pages[pindex]);</div><div class='add'>+		memcpy_from_folio(kaddr, data_folios[findex], foffset, PAGE_SIZE);</div><div class='add'>+		kunmap_local(kaddr);</div><div class='add'>+</div><div class='add'>+		foffset += PAGE_SIZE;</div><div class='add'>+		ASSERT(foffset &lt;= folio_size(data_folios[findex]));</div><div class='add'>+		if (foffset == folio_size(data_folios[findex])) {</div><div class='add'>+			findex++;</div><div class='add'>+			foffset = 0;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * When we get bioc, we have already increased bio_counter, record it</div><div class='del'>-	 * so we can free it at rbio_orig_end_io()</div><div class='del'>-	 */</div><div class='del'>-	rbio-&gt;generic_bio_cnt = 1;</div><div class='del'>-</div><div class='del'>-	return rbio;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void raid56_submit_missing_rbio(struct btrfs_raid_bio *rbio)</div><div class='del'>-{</div><div class='del'>-	if (!lock_stripe_add(rbio))</div><div class='del'>-		start_async_work(rbio, read_rebuild_work);</div><div class='add'>+	bitmap_set(rbio-&gt;stripe_uptodate_bitmap,</div><div class='add'>+		   offset_in_full_stripe &gt;&gt; fs_info-&gt;sectorsize_bits,</div><div class='add'>+		   BTRFS_STRIPE_LEN &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/btrfs/raid56.h b/fs/btrfs/raid56.h<br/>index 72c00fc284b5..1f463ecf7e41 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/raid56.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/raid56.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/raid56.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/raid56.h</a></div><div class='hunk'>@@ -7,47 +7,283 @@</div><div class='ctx'> #ifndef BTRFS_RAID56_H</div><div class='ctx'> #define BTRFS_RAID56_H</div><div class='ctx'> </div><div class='del'>-static inline int nr_parity_stripes(const struct map_lookup *map)</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+#include &lt;linux/list.h&gt;</div><div class='add'>+#include &lt;linux/spinlock.h&gt;</div><div class='add'>+#include &lt;linux/bio.h&gt;</div><div class='add'>+#include &lt;linux/refcount.h&gt;</div><div class='add'>+#include &lt;linux/workqueue.h&gt;</div><div class='add'>+#include "volumes.h"</div><div class='add'>+</div><div class='add'>+struct page;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+</div><div class='add'>+enum btrfs_rbio_ops {</div><div class='add'>+	BTRFS_RBIO_WRITE,</div><div class='add'>+	BTRFS_RBIO_READ_REBUILD,</div><div class='add'>+	BTRFS_RBIO_PARITY_SCRUB,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Overview of btrfs_raid_bio.</div><div class='add'>+ *</div><div class='add'>+ * One btrfs_raid_bio represents a full stripe of RAID56, including both data</div><div class='add'>+ * and P/Q stripes. For now, each data and P/Q stripe is of a fixed length (64K).</div><div class='add'>+ *</div><div class='add'>+ * One btrfs_raid_bio can have one or more bios from higher layer, covering</div><div class='add'>+ * part or all of the data stripes.</div><div class='add'>+ *</div><div class='add'>+ * [PAGES FROM HIGHER LAYER BIOS]</div><div class='add'>+ * Higher layer bios are in the btrfs_raid_bio::bio_list.</div><div class='add'>+ *</div><div class='add'>+ * Pages from the bio_list are represented like the following:</div><div class='add'>+ *</div><div class='add'>+ * bio_list:	     |&lt;- Bio 1 -&gt;|             |&lt;- Bio 2 -&gt;|  ...</div><div class='add'>+ * bio_paddrs:	    [0]   [1]   [2]    [3]    [4]    [5]      ...</div><div class='add'>+ *</div><div class='add'>+ * If there is a bio covering a sector (one btrfs fs block), the corresponding</div><div class='add'>+ * pointer in btrfs_raid_bio::bio_paddrs[] will point to the physical address</div><div class='add'>+ * (with the offset inside the page) of the corresponding bio.</div><div class='add'>+ *</div><div class='add'>+ * If there is no bio covering a sector, then btrfs_raid_bio::bio_paddrs[i] will</div><div class='add'>+ * be INVALID_PADDR.</div><div class='add'>+ *</div><div class='add'>+ * The length of each entry in bio_paddrs[] is a step (aka, min(sectorsize, PAGE_SIZE)).</div><div class='add'>+ *</div><div class='add'>+ * [PAGES FOR INTERNAL USAGES]</div><div class='add'>+ * Pages not covered by any bio or belonging to P/Q stripes are stored in</div><div class='add'>+ * btrfs_raid_bio::stripe_pages[] and stripe_paddrs[], like the following:</div><div class='add'>+ *</div><div class='add'>+ * stripe_pages:       |&lt;- Page 0 -&gt;|&lt;- Page 1 -&gt;|  ...</div><div class='add'>+ * stripe_paddrs:     [0]    [1]   [2]    [3]   [4] ...</div><div class='add'>+ *</div><div class='add'>+ * stripe_pages[] array stores all the pages covering the full stripe, including</div><div class='add'>+ * data and P/Q pages.</div><div class='add'>+ * stripe_pages[0] is the first page of the first data stripe.</div><div class='add'>+ * stripe_pages[BTRFS_STRIPE_LEN / PAGE_SIZE] is the first page of the second</div><div class='add'>+ * data stripe.</div><div class='add'>+ *</div><div class='add'>+ * Some pointers inside stripe_pages[] can be NULL, e.g. for a full stripe write</div><div class='add'>+ * (the bio covers all data stripes) there is no need to allocate pages for</div><div class='add'>+ * data stripes (can grab from bio_paddrs[]).</div><div class='add'>+ *</div><div class='add'>+ * If the corresponding page of stripe_paddrs[i] is not allocated, the value of</div><div class='add'>+ * stripe_paddrs[i] will be INVALID_PADDR.</div><div class='add'>+ *</div><div class='add'>+ * The length of each entry in stripe_paddrs[] is a step.</div><div class='add'>+ *</div><div class='add'>+ * [LOCATING A SECTOR]</div><div class='add'>+ * To locate a sector for IO, we need the following info:</div><div class='add'>+ *</div><div class='add'>+ * - stripe_nr</div><div class='add'>+ *   Starts from 0 (representing the first data stripe), ends at</div><div class='add'>+ *   @nr_data (RAID5, P stripe) or @nr_data + 1 (RAID6, Q stripe).</div><div class='add'>+ *</div><div class='add'>+ * - sector_nr</div><div class='add'>+ *   Starts from 0 (representing the first sector of the stripe), ends</div><div class='add'>+ *   at BTRFS_STRIPE_LEN / sectorsize - 1.</div><div class='add'>+ *</div><div class='add'>+ * - step_nr</div><div class='add'>+ *   A step is min(sector_size, PAGE_SIZE).</div><div class='add'>+ *</div><div class='add'>+ *   Starts from 0 (representing the first step of the sector), ends</div><div class='add'>+ *   at @sector_nsteps - 1.</div><div class='add'>+ *</div><div class='add'>+ *   For most call sites they do not need to bother this parameter.</div><div class='add'>+ *   It is for bs &gt; ps support and only for vertical stripe related works.</div><div class='add'>+ *   (e.g. RMW/recover)</div><div class='add'>+ *</div><div class='add'>+ * - from which array</div><div class='add'>+ *   Whether grabbing from stripe_paddrs[] (aka, internal pages) or from the</div><div class='add'>+ *   bio_paddrs[] (aka, from the higher layer bios).</div><div class='add'>+ *</div><div class='add'>+ * For IO, a physical address is returned, so that we can extract the page and</div><div class='add'>+ * the offset inside the page for IO.</div><div class='add'>+ * A special value INVALID_PADDR represents when the physical address is invalid,</div><div class='add'>+ * normally meaning there is no page allocated for the specified sector.</div><div class='add'>+ */</div><div class='add'>+struct btrfs_raid_bio {</div><div class='add'>+	struct btrfs_io_context *bioc;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * While we're doing RMW on a stripe we put it into a hash table so we</div><div class='add'>+	 * can lock the stripe and merge more rbios into it.</div><div class='add'>+	 */</div><div class='add'>+	struct list_head hash_list;</div><div class='add'>+</div><div class='add'>+	/* LRU list for the stripe cache */</div><div class='add'>+	struct list_head stripe_cache;</div><div class='add'>+</div><div class='add'>+	/* For scheduling work in the helper threads */</div><div class='add'>+	struct work_struct work;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * bio_list and bio_list_lock are used to add more bios into the stripe</div><div class='add'>+	 * in hopes of avoiding the full RMW</div><div class='add'>+	 */</div><div class='add'>+	struct bio_list bio_list;</div><div class='add'>+	spinlock_t bio_list_lock;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Also protected by the bio_list_lock, the plug list is used by the</div><div class='add'>+	 * plugging code to collect partial bios while plugged.  The stripe</div><div class='add'>+	 * locking code also uses it to hand off the stripe lock to the next</div><div class='add'>+	 * pending IO.</div><div class='add'>+	 */</div><div class='add'>+	struct list_head plug_list;</div><div class='add'>+</div><div class='add'>+	/* Flags that tell us if it is safe to merge with this bio. */</div><div class='add'>+	unsigned long flags;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Set if we're doing a parity rebuild for a read from higher up, which</div><div class='add'>+	 * is handled differently from a parity rebuild as part of RMW.</div><div class='add'>+	 */</div><div class='add'>+	enum btrfs_rbio_ops operation;</div><div class='add'>+</div><div class='add'>+	/* How many pages there are for the full stripe including P/Q */</div><div class='add'>+	u16 nr_pages;</div><div class='add'>+</div><div class='add'>+	/* How many sectors there are for the full stripe including P/Q */</div><div class='add'>+	u16 nr_sectors;</div><div class='add'>+</div><div class='add'>+	/* Number of data stripes (no p/q) */</div><div class='add'>+	u8 nr_data;</div><div class='add'>+</div><div class='add'>+	/* Number of all stripes (including P/Q) */</div><div class='add'>+	u8 real_stripes;</div><div class='add'>+</div><div class='add'>+	/* How many pages there are for each stripe */</div><div class='add'>+	u8 stripe_npages;</div><div class='add'>+</div><div class='add'>+	/* How many sectors there are for each stripe */</div><div class='add'>+	u8 stripe_nsectors;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * How many steps there are for one sector.</div><div class='add'>+	 *</div><div class='add'>+	 * For bs &gt; ps cases, it's sectorsize / PAGE_SIZE.</div><div class='add'>+	 * For bs &lt;= ps cases, it's always 1.</div><div class='add'>+	 */</div><div class='add'>+	u8 sector_nsteps;</div><div class='add'>+</div><div class='add'>+	/* Stripe number that we're scrubbing  */</div><div class='add'>+	u8 scrubp;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Size of all the bios in the bio_list.  This helps us decide if the</div><div class='add'>+	 * rbio maps to a full stripe or not.</div><div class='add'>+	 */</div><div class='add'>+	int bio_list_bytes;</div><div class='add'>+</div><div class='add'>+	refcount_t refs;</div><div class='add'>+</div><div class='add'>+	atomic_t stripes_pending;</div><div class='add'>+</div><div class='add'>+	wait_queue_head_t io_wait;</div><div class='add'>+</div><div class='add'>+	/* Bitmap to record which horizontal stripe has data */</div><div class='add'>+	unsigned long dbitmap;</div><div class='add'>+</div><div class='add'>+	/* Allocated with stripe_nsectors-many bits for finish_*() calls */</div><div class='add'>+	unsigned long finish_pbitmap;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * These are two arrays of pointers.  We allocate the rbio big enough</div><div class='add'>+	 * to hold them both and setup their locations when the rbio is</div><div class='add'>+	 * allocated.</div><div class='add'>+	 */</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Pointers to pages that we allocated for reading/writing stripes</div><div class='add'>+	 * directly from the disk (including P/Q).</div><div class='add'>+	 */</div><div class='add'>+	struct page **stripe_pages;</div><div class='add'>+</div><div class='add'>+	/* Pointers to the sectors in the bio_list, for faster lookup */</div><div class='add'>+	phys_addr_t *bio_paddrs;</div><div class='add'>+</div><div class='add'>+	/* Pointers to the sectors in the stripe_pages[]. */</div><div class='add'>+	phys_addr_t *stripe_paddrs;</div><div class='add'>+</div><div class='add'>+	/* Each set bit means the corresponding sector in stripe_sectors[] is uptodate. */</div><div class='add'>+	unsigned long *stripe_uptodate_bitmap;</div><div class='add'>+</div><div class='add'>+	/* Allocated with real_stripes-many pointers for finish_*() calls */</div><div class='add'>+	void **finish_pointers;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The bitmap recording where IO errors happened.</div><div class='add'>+	 * Each bit is corresponding to one sector in either bio_sectors[] or</div><div class='add'>+	 * stripe_sectors[] array.</div><div class='add'>+	 */</div><div class='add'>+	unsigned long *error_bitmap;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Checksum buffer if the rbio is for data.  The buffer should cover</div><div class='add'>+	 * all data sectors (excluding P/Q sectors).</div><div class='add'>+	 */</div><div class='add'>+	u8 *csum_buf;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Each bit represents if the corresponding sector has data csum found.</div><div class='add'>+	 * Should only cover data sectors (excluding P/Q sectors).</div><div class='add'>+	 */</div><div class='add'>+	unsigned long *csum_bitmap;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * For trace event usage only. Records useful debug info for each bio submitted</div><div class='add'>+ * by RAID56 to each physical device.</div><div class='add'>+ *</div><div class='add'>+ * No matter signed or not, (-1) is always the one indicating we can not grab</div><div class='add'>+ * the proper stripe number.</div><div class='add'>+ */</div><div class='add'>+struct raid56_bio_trace_info {</div><div class='add'>+	u64 devid;</div><div class='add'>+</div><div class='add'>+	/* The offset inside the stripe. (&lt;= STRIPE_LEN) */</div><div class='add'>+	u32 offset;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Stripe number.</div><div class='add'>+	 * 0 is the first data stripe, and nr_data for P stripe,</div><div class='add'>+	 * nr_data + 1 for Q stripe.</div><div class='add'>+	 * &gt;= real_stripes for</div><div class='add'>+	 */</div><div class='add'>+	u8 stripe_nr;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static inline int nr_data_stripes(const struct btrfs_chunk_map *map)</div><div class='ctx'> {</div><div class='del'>-	if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID5)</div><div class='del'>-		return 1;</div><div class='del'>-	else if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID6)</div><div class='del'>-		return 2;</div><div class='del'>-	else</div><div class='del'>-		return 0;</div><div class='add'>+	return map-&gt;num_stripes - btrfs_nr_parity_stripes(map-&gt;type);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int nr_data_stripes(const struct map_lookup *map)</div><div class='add'>+static inline int nr_bioc_data_stripes(const struct btrfs_io_context *bioc)</div><div class='ctx'> {</div><div class='del'>-	return map-&gt;num_stripes - nr_parity_stripes(map);</div><div class='add'>+	return bioc-&gt;num_stripes - btrfs_nr_parity_stripes(bioc-&gt;map_type);</div><div class='ctx'> }</div><div class='add'>+</div><div class='ctx'> #define RAID5_P_STRIPE ((u64)-2)</div><div class='ctx'> #define RAID6_Q_STRIPE ((u64)-1)</div><div class='ctx'> </div><div class='ctx'> #define is_parity_stripe(x) (((x) == RAID5_P_STRIPE) ||		\</div><div class='ctx'> 			     ((x) == RAID6_Q_STRIPE))</div><div class='ctx'> </div><div class='del'>-struct btrfs_raid_bio;</div><div class='ctx'> struct btrfs_device;</div><div class='ctx'> </div><div class='del'>-int raid56_parity_recover(struct bio *bio, struct btrfs_io_context *bioc,</div><div class='del'>-			  u64 stripe_len, int mirror_num, int generic_io);</div><div class='del'>-int raid56_parity_write(struct bio *bio, struct btrfs_io_context *bioc,</div><div class='del'>-			u64 stripe_len);</div><div class='del'>-</div><div class='del'>-void raid56_add_scrub_pages(struct btrfs_raid_bio *rbio, struct page *page,</div><div class='del'>-			    u64 logical);</div><div class='add'>+void raid56_parity_recover(struct bio *bio, struct btrfs_io_context *bioc,</div><div class='add'>+			   int mirror_num);</div><div class='add'>+void raid56_parity_write(struct bio *bio, struct btrfs_io_context *bioc);</div><div class='ctx'> </div><div class='ctx'> struct btrfs_raid_bio *raid56_parity_alloc_scrub_rbio(struct bio *bio,</div><div class='del'>-				struct btrfs_io_context *bioc, u64 stripe_len,</div><div class='add'>+				struct btrfs_io_context *bioc,</div><div class='ctx'> 				struct btrfs_device *scrub_dev,</div><div class='ctx'> 				unsigned long *dbitmap, int stripe_nsectors);</div><div class='ctx'> void raid56_parity_submit_scrub_rbio(struct btrfs_raid_bio *rbio);</div><div class='ctx'> </div><div class='del'>-struct btrfs_raid_bio *</div><div class='del'>-raid56_alloc_missing_rbio(struct bio *bio, struct btrfs_io_context *bioc,</div><div class='del'>-			  u64 length);</div><div class='del'>-void raid56_submit_missing_rbio(struct btrfs_raid_bio *rbio);</div><div class='add'>+void raid56_parity_cache_data_folios(struct btrfs_raid_bio *rbio,</div><div class='add'>+				     struct folio **data_folios, u64 data_logical);</div><div class='ctx'> </div><div class='ctx'> int btrfs_alloc_stripe_hash_table(struct btrfs_fs_info *info);</div><div class='ctx'> void btrfs_free_stripe_hash_table(struct btrfs_fs_info *info);</div><div class='head'>diff --git a/fs/btrfs/rcu-string.h b/fs/btrfs/rcu-string.h<br/>deleted file mode 100644<br/>index 5c1a617eb25d..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/rcu-string.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/rcu-string.h</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,48 +0,0 @@</div><div class='del'>-/* SPDX-License-Identifier: GPL-2.0 */</div><div class='del'>-/*</div><div class='del'>- * Copyright (C) 2012 Red Hat.  All rights reserved.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#ifndef BTRFS_RCU_STRING_H</div><div class='del'>-#define BTRFS_RCU_STRING_H</div><div class='del'>-</div><div class='del'>-struct rcu_string {</div><div class='del'>-	struct rcu_head rcu;</div><div class='del'>-	char str[];</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static inline struct rcu_string *rcu_string_strdup(const char *src, gfp_t mask)</div><div class='del'>-{</div><div class='del'>-	size_t len = strlen(src) + 1;</div><div class='del'>-	struct rcu_string *ret = kzalloc(sizeof(struct rcu_string) +</div><div class='del'>-					 (len * sizeof(char)), mask);</div><div class='del'>-	if (!ret)</div><div class='del'>-		return ret;</div><div class='del'>-	strncpy(ret-&gt;str, src, len);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void rcu_string_free(struct rcu_string *str)</div><div class='del'>-{</div><div class='del'>-	if (str)</div><div class='del'>-		kfree_rcu(str, rcu);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#define printk_in_rcu(fmt, ...) do {	\</div><div class='del'>-	rcu_read_lock();		\</div><div class='del'>-	printk(fmt, __VA_ARGS__);	\</div><div class='del'>-	rcu_read_unlock();		\</div><div class='del'>-} while (0)</div><div class='del'>-</div><div class='del'>-#define printk_ratelimited_in_rcu(fmt, ...) do {	\</div><div class='del'>-	rcu_read_lock();				\</div><div class='del'>-	printk_ratelimited(fmt, __VA_ARGS__);		\</div><div class='del'>-	rcu_read_unlock();				\</div><div class='del'>-} while (0)</div><div class='del'>-</div><div class='del'>-#define rcu_str_deref(rcu_str) ({				\</div><div class='del'>-	struct rcu_string *__str = rcu_dereference(rcu_str);	\</div><div class='del'>-	__str-&gt;str;						\</div><div class='del'>-})</div><div class='del'>-</div><div class='del'>-#endif</div><div class='head'>diff --git a/fs/btrfs/reada.c b/fs/btrfs/reada.c<br/>deleted file mode 100644<br/>index eb96fdc3be25..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/reada.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/reada.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,1086 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0</div><div class='del'>-/*</div><div class='del'>- * Copyright (C) 2011 STRATO.  All rights reserved.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#include &lt;linux/sched.h&gt;</div><div class='del'>-#include &lt;linux/pagemap.h&gt;</div><div class='del'>-#include &lt;linux/writeback.h&gt;</div><div class='del'>-#include &lt;linux/blkdev.h&gt;</div><div class='del'>-#include &lt;linux/slab.h&gt;</div><div class='del'>-#include &lt;linux/workqueue.h&gt;</div><div class='del'>-#include "ctree.h"</div><div class='del'>-#include "volumes.h"</div><div class='del'>-#include "disk-io.h"</div><div class='del'>-#include "transaction.h"</div><div class='del'>-#include "dev-replace.h"</div><div class='del'>-#include "block-group.h"</div><div class='del'>-</div><div class='del'>-#undef DEBUG</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * This is the implementation for the generic read ahead framework.</div><div class='del'>- *</div><div class='del'>- * To trigger a readahead, btrfs_reada_add must be called. It will start</div><div class='del'>- * a read ahead for the given range [start, end) on tree root. The returned</div><div class='del'>- * handle can either be used to wait on the readahead to finish</div><div class='del'>- * (btrfs_reada_wait), or to send it to the background (btrfs_reada_detach).</div><div class='del'>- *</div><div class='del'>- * The read ahead works as follows:</div><div class='del'>- * On btrfs_reada_add, the root of the tree is inserted into a radix_tree.</div><div class='del'>- * reada_start_machine will then search for extents to prefetch and trigger</div><div class='del'>- * some reads. When a read finishes for a node, all contained node/leaf</div><div class='del'>- * pointers that lie in the given range will also be enqueued. The reads will</div><div class='del'>- * be triggered in sequential order, thus giving a big win over a naive</div><div class='del'>- * enumeration. It will also make use of multi-device layouts. Each disk</div><div class='del'>- * will have its on read pointer and all disks will by utilized in parallel.</div><div class='del'>- * Also will no two disks read both sides of a mirror simultaneously, as this</div><div class='del'>- * would waste seeking capacity. Instead both disks will read different parts</div><div class='del'>- * of the filesystem.</div><div class='del'>- * Any number of readaheads can be started in parallel. The read order will be</div><div class='del'>- * determined globally, i.e. 2 parallel readaheads will normally finish faster</div><div class='del'>- * than the 2 started one after another.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#define MAX_IN_FLIGHT 6</div><div class='del'>-</div><div class='del'>-struct reada_extctl {</div><div class='del'>-	struct list_head	list;</div><div class='del'>-	struct reada_control	*rc;</div><div class='del'>-	u64			generation;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct reada_extent {</div><div class='del'>-	u64			logical;</div><div class='del'>-	u64			owner_root;</div><div class='del'>-	struct btrfs_key	top;</div><div class='del'>-	struct list_head	extctl;</div><div class='del'>-	int 			refcnt;</div><div class='del'>-	spinlock_t		lock;</div><div class='del'>-	struct reada_zone	*zones[BTRFS_MAX_MIRRORS];</div><div class='del'>-	int			nzones;</div><div class='del'>-	int			scheduled;</div><div class='del'>-	int			level;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct reada_zone {</div><div class='del'>-	u64			start;</div><div class='del'>-	u64			end;</div><div class='del'>-	u64			elems;</div><div class='del'>-	struct list_head	list;</div><div class='del'>-	spinlock_t		lock;</div><div class='del'>-	int			locked;</div><div class='del'>-	struct btrfs_device	*device;</div><div class='del'>-	struct btrfs_device	*devs[BTRFS_MAX_MIRRORS]; /* full list, incl</div><div class='del'>-							   * self */</div><div class='del'>-	int			ndevs;</div><div class='del'>-	struct kref		refcnt;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct reada_machine_work {</div><div class='del'>-	struct btrfs_work	work;</div><div class='del'>-	struct btrfs_fs_info	*fs_info;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static void reada_extent_put(struct btrfs_fs_info *, struct reada_extent *);</div><div class='del'>-static void reada_control_release(struct kref *kref);</div><div class='del'>-static void reada_zone_release(struct kref *kref);</div><div class='del'>-static void reada_start_machine(struct btrfs_fs_info *fs_info);</div><div class='del'>-static void __reada_start_machine(struct btrfs_fs_info *fs_info);</div><div class='del'>-</div><div class='del'>-static int reada_add_block(struct reada_control *rc, u64 logical,</div><div class='del'>-			   struct btrfs_key *top, u64 owner_root,</div><div class='del'>-			   u64 generation, int level);</div><div class='del'>-</div><div class='del'>-/* recurses */</div><div class='del'>-/* in case of err, eb might be NULL */</div><div class='del'>-static void __readahead_hook(struct btrfs_fs_info *fs_info,</div><div class='del'>-			     struct reada_extent *re, struct extent_buffer *eb,</div><div class='del'>-			     int err)</div><div class='del'>-{</div><div class='del'>-	int nritems;</div><div class='del'>-	int i;</div><div class='del'>-	u64 bytenr;</div><div class='del'>-	u64 generation;</div><div class='del'>-	struct list_head list;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;re-&gt;lock);</div><div class='del'>-	/*</div><div class='del'>-	 * just take the full list from the extent. afterwards we</div><div class='del'>-	 * don't need the lock anymore</div><div class='del'>-	 */</div><div class='del'>-	list_replace_init(&amp;re-&gt;extctl, &amp;list);</div><div class='del'>-	re-&gt;scheduled = 0;</div><div class='del'>-	spin_unlock(&amp;re-&gt;lock);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * this is the error case, the extent buffer has not been</div><div class='del'>-	 * read correctly. We won't access anything from it and</div><div class='del'>-	 * just cleanup our data structures. Effectively this will</div><div class='del'>-	 * cut the branch below this node from read ahead.</div><div class='del'>-	 */</div><div class='del'>-	if (err)</div><div class='del'>-		goto cleanup;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * FIXME: currently we just set nritems to 0 if this is a leaf,</div><div class='del'>-	 * effectively ignoring the content. In a next step we could</div><div class='del'>-	 * trigger more readahead depending from the content, e.g.</div><div class='del'>-	 * fetch the checksums for the extents in the leaf.</div><div class='del'>-	 */</div><div class='del'>-	if (!btrfs_header_level(eb))</div><div class='del'>-		goto cleanup;</div><div class='del'>-</div><div class='del'>-	nritems = btrfs_header_nritems(eb);</div><div class='del'>-	generation = btrfs_header_generation(eb);</div><div class='del'>-	for (i = 0; i &lt; nritems; i++) {</div><div class='del'>-		struct reada_extctl *rec;</div><div class='del'>-		u64 n_gen;</div><div class='del'>-		struct btrfs_key key;</div><div class='del'>-		struct btrfs_key next_key;</div><div class='del'>-</div><div class='del'>-		btrfs_node_key_to_cpu(eb, &amp;key, i);</div><div class='del'>-		if (i + 1 &lt; nritems)</div><div class='del'>-			btrfs_node_key_to_cpu(eb, &amp;next_key, i + 1);</div><div class='del'>-		else</div><div class='del'>-			next_key = re-&gt;top;</div><div class='del'>-		bytenr = btrfs_node_blockptr(eb, i);</div><div class='del'>-		n_gen = btrfs_node_ptr_generation(eb, i);</div><div class='del'>-</div><div class='del'>-		list_for_each_entry(rec, &amp;list, list) {</div><div class='del'>-			struct reada_control *rc = rec-&gt;rc;</div><div class='del'>-</div><div class='del'>-			/*</div><div class='del'>-			 * if the generation doesn't match, just ignore this</div><div class='del'>-			 * extctl. This will probably cut off a branch from</div><div class='del'>-			 * prefetch. Alternatively one could start a new (sub-)</div><div class='del'>-			 * prefetch for this branch, starting again from root.</div><div class='del'>-			 * FIXME: move the generation check out of this loop</div><div class='del'>-			 */</div><div class='del'>-#ifdef DEBUG</div><div class='del'>-			if (rec-&gt;generation != generation) {</div><div class='del'>-				btrfs_debug(fs_info,</div><div class='del'>-					    "generation mismatch for (%llu,%d,%llu) %llu != %llu",</div><div class='del'>-					    key.objectid, key.type, key.offset,</div><div class='del'>-					    rec-&gt;generation, generation);</div><div class='del'>-			}</div><div class='del'>-#endif</div><div class='del'>-			if (rec-&gt;generation == generation &amp;&amp;</div><div class='del'>-			    btrfs_comp_cpu_keys(&amp;key, &amp;rc-&gt;key_end) &lt; 0 &amp;&amp;</div><div class='del'>-			    btrfs_comp_cpu_keys(&amp;next_key, &amp;rc-&gt;key_start) &gt; 0)</div><div class='del'>-				reada_add_block(rc, bytenr, &amp;next_key,</div><div class='del'>-						btrfs_header_owner(eb), n_gen,</div><div class='del'>-						btrfs_header_level(eb) - 1);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-cleanup:</div><div class='del'>-	/*</div><div class='del'>-	 * free extctl records</div><div class='del'>-	 */</div><div class='del'>-	while (!list_empty(&amp;list)) {</div><div class='del'>-		struct reada_control *rc;</div><div class='del'>-		struct reada_extctl *rec;</div><div class='del'>-</div><div class='del'>-		rec = list_first_entry(&amp;list, struct reada_extctl, list);</div><div class='del'>-		list_del(&amp;rec-&gt;list);</div><div class='del'>-		rc = rec-&gt;rc;</div><div class='del'>-		kfree(rec);</div><div class='del'>-</div><div class='del'>-		kref_get(&amp;rc-&gt;refcnt);</div><div class='del'>-		if (atomic_dec_and_test(&amp;rc-&gt;elems)) {</div><div class='del'>-			kref_put(&amp;rc-&gt;refcnt, reada_control_release);</div><div class='del'>-			wake_up(&amp;rc-&gt;wait);</div><div class='del'>-		}</div><div class='del'>-		kref_put(&amp;rc-&gt;refcnt, reada_control_release);</div><div class='del'>-</div><div class='del'>-		reada_extent_put(fs_info, re);	/* one ref for each entry */</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int btree_readahead_hook(struct extent_buffer *eb, int err)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='del'>-	int ret = 0;</div><div class='del'>-	struct reada_extent *re;</div><div class='del'>-</div><div class='del'>-	/* find extent */</div><div class='del'>-	spin_lock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-	re = radix_tree_lookup(&amp;fs_info-&gt;reada_tree,</div><div class='del'>-			       eb-&gt;start &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='del'>-	if (re)</div><div class='del'>-		re-&gt;refcnt++;</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-	if (!re) {</div><div class='del'>-		ret = -1;</div><div class='del'>-		goto start_machine;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	__readahead_hook(fs_info, re, eb, err);</div><div class='del'>-	reada_extent_put(fs_info, re);	/* our ref */</div><div class='del'>-</div><div class='del'>-start_machine:</div><div class='del'>-	reada_start_machine(fs_info);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct reada_zone *reada_find_zone(struct btrfs_device *dev, u64 logical,</div><div class='del'>-					  struct btrfs_io_context *bioc)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = dev-&gt;fs_info;</div><div class='del'>-	int ret;</div><div class='del'>-	struct reada_zone *zone;</div><div class='del'>-	struct btrfs_block_group *cache = NULL;</div><div class='del'>-	u64 start;</div><div class='del'>-	u64 end;</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	zone = NULL;</div><div class='del'>-	spin_lock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-	ret = radix_tree_gang_lookup(&amp;dev-&gt;reada_zones, (void **)&amp;zone,</div><div class='del'>-				     logical &gt;&gt; fs_info-&gt;sectorsize_bits, 1);</div><div class='del'>-	if (ret == 1 &amp;&amp; logical &gt;= zone-&gt;start &amp;&amp; logical &lt;= zone-&gt;end) {</div><div class='del'>-		kref_get(&amp;zone-&gt;refcnt);</div><div class='del'>-		spin_unlock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-		return zone;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-</div><div class='del'>-	cache = btrfs_lookup_block_group(fs_info, logical);</div><div class='del'>-	if (!cache)</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	start = cache-&gt;start;</div><div class='del'>-	end = start + cache-&gt;length - 1;</div><div class='del'>-	btrfs_put_block_group(cache);</div><div class='del'>-</div><div class='del'>-	zone = kzalloc(sizeof(*zone), GFP_KERNEL);</div><div class='del'>-	if (!zone)</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	ret = radix_tree_preload(GFP_KERNEL);</div><div class='del'>-	if (ret) {</div><div class='del'>-		kfree(zone);</div><div class='del'>-		return NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	zone-&gt;start = start;</div><div class='del'>-	zone-&gt;end = end;</div><div class='del'>-	INIT_LIST_HEAD(&amp;zone-&gt;list);</div><div class='del'>-	spin_lock_init(&amp;zone-&gt;lock);</div><div class='del'>-	zone-&gt;locked = 0;</div><div class='del'>-	kref_init(&amp;zone-&gt;refcnt);</div><div class='del'>-	zone-&gt;elems = 0;</div><div class='del'>-	zone-&gt;device = dev; /* our device always sits at index 0 */</div><div class='del'>-	for (i = 0; i &lt; bioc-&gt;num_stripes; ++i) {</div><div class='del'>-		/* bounds have already been checked */</div><div class='del'>-		zone-&gt;devs[i] = bioc-&gt;stripes[i].dev;</div><div class='del'>-	}</div><div class='del'>-	zone-&gt;ndevs = bioc-&gt;num_stripes;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-	ret = radix_tree_insert(&amp;dev-&gt;reada_zones,</div><div class='del'>-			(unsigned long)(zone-&gt;end &gt;&gt; fs_info-&gt;sectorsize_bits),</div><div class='del'>-			zone);</div><div class='del'>-</div><div class='del'>-	if (ret == -EEXIST) {</div><div class='del'>-		kfree(zone);</div><div class='del'>-		ret = radix_tree_gang_lookup(&amp;dev-&gt;reada_zones, (void **)&amp;zone,</div><div class='del'>-					logical &gt;&gt; fs_info-&gt;sectorsize_bits, 1);</div><div class='del'>-		if (ret == 1 &amp;&amp; logical &gt;= zone-&gt;start &amp;&amp; logical &lt;= zone-&gt;end)</div><div class='del'>-			kref_get(&amp;zone-&gt;refcnt);</div><div class='del'>-		else</div><div class='del'>-			zone = NULL;</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-	radix_tree_preload_end();</div><div class='del'>-</div><div class='del'>-	return zone;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct reada_extent *reada_find_extent(struct btrfs_fs_info *fs_info,</div><div class='del'>-					      u64 logical,</div><div class='del'>-					      struct btrfs_key *top,</div><div class='del'>-					      u64 owner_root, int level)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-	struct reada_extent *re = NULL;</div><div class='del'>-	struct reada_extent *re_exist = NULL;</div><div class='del'>-	struct btrfs_io_context *bioc = NULL;</div><div class='del'>-	struct btrfs_device *dev;</div><div class='del'>-	struct btrfs_device *prev_dev;</div><div class='del'>-	u64 length;</div><div class='del'>-	int real_stripes;</div><div class='del'>-	int nzones = 0;</div><div class='del'>-	unsigned long index = logical &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='del'>-	int dev_replace_is_ongoing;</div><div class='del'>-	int have_zone = 0;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-	re = radix_tree_lookup(&amp;fs_info-&gt;reada_tree, index);</div><div class='del'>-	if (re)</div><div class='del'>-		re-&gt;refcnt++;</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-</div><div class='del'>-	if (re)</div><div class='del'>-		return re;</div><div class='del'>-</div><div class='del'>-	re = kzalloc(sizeof(*re), GFP_KERNEL);</div><div class='del'>-	if (!re)</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	re-&gt;logical = logical;</div><div class='del'>-	re-&gt;top = *top;</div><div class='del'>-	INIT_LIST_HEAD(&amp;re-&gt;extctl);</div><div class='del'>-	spin_lock_init(&amp;re-&gt;lock);</div><div class='del'>-	re-&gt;refcnt = 1;</div><div class='del'>-	re-&gt;owner_root = owner_root;</div><div class='del'>-	re-&gt;level = level;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * map block</div><div class='del'>-	 */</div><div class='del'>-	length = fs_info-&gt;nodesize;</div><div class='del'>-	ret = btrfs_map_block(fs_info, BTRFS_MAP_GET_READ_MIRRORS, logical,</div><div class='del'>-			      &amp;length, &amp;bioc, 0);</div><div class='del'>-	if (ret || !bioc || length &lt; fs_info-&gt;nodesize)</div><div class='del'>-		goto error;</div><div class='del'>-</div><div class='del'>-	if (bioc-&gt;num_stripes &gt; BTRFS_MAX_MIRRORS) {</div><div class='del'>-		btrfs_err(fs_info,</div><div class='del'>-			   "readahead: more than %d copies not supported",</div><div class='del'>-			   BTRFS_MAX_MIRRORS);</div><div class='del'>-		goto error;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	real_stripes = bioc-&gt;num_stripes - bioc-&gt;num_tgtdevs;</div><div class='del'>-	for (nzones = 0; nzones &lt; real_stripes; ++nzones) {</div><div class='del'>-		struct reada_zone *zone;</div><div class='del'>-</div><div class='del'>-		dev = bioc-&gt;stripes[nzones].dev;</div><div class='del'>-</div><div class='del'>-		/* cannot read ahead on missing device. */</div><div class='del'>-		if (!dev-&gt;bdev)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		zone = reada_find_zone(dev, logical, bioc);</div><div class='del'>-		if (!zone)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		re-&gt;zones[re-&gt;nzones++] = zone;</div><div class='del'>-		spin_lock(&amp;zone-&gt;lock);</div><div class='del'>-		if (!zone-&gt;elems)</div><div class='del'>-			kref_get(&amp;zone-&gt;refcnt);</div><div class='del'>-		++zone-&gt;elems;</div><div class='del'>-		spin_unlock(&amp;zone-&gt;lock);</div><div class='del'>-		spin_lock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-		kref_put(&amp;zone-&gt;refcnt, reada_zone_release);</div><div class='del'>-		spin_unlock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-	}</div><div class='del'>-	if (re-&gt;nzones == 0) {</div><div class='del'>-		/* not a single zone found, error and out */</div><div class='del'>-		goto error;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Insert extent in reada tree + all per-device trees, all or nothing */</div><div class='del'>-	down_read(&amp;fs_info-&gt;dev_replace.rwsem);</div><div class='del'>-	ret = radix_tree_preload(GFP_KERNEL);</div><div class='del'>-	if (ret) {</div><div class='del'>-		up_read(&amp;fs_info-&gt;dev_replace.rwsem);</div><div class='del'>-		goto error;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-	ret = radix_tree_insert(&amp;fs_info-&gt;reada_tree, index, re);</div><div class='del'>-	if (ret == -EEXIST) {</div><div class='del'>-		re_exist = radix_tree_lookup(&amp;fs_info-&gt;reada_tree, index);</div><div class='del'>-		re_exist-&gt;refcnt++;</div><div class='del'>-		spin_unlock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-		radix_tree_preload_end();</div><div class='del'>-		up_read(&amp;fs_info-&gt;dev_replace.rwsem);</div><div class='del'>-		goto error;</div><div class='del'>-	}</div><div class='del'>-	if (ret) {</div><div class='del'>-		spin_unlock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-		radix_tree_preload_end();</div><div class='del'>-		up_read(&amp;fs_info-&gt;dev_replace.rwsem);</div><div class='del'>-		goto error;</div><div class='del'>-	}</div><div class='del'>-	radix_tree_preload_end();</div><div class='del'>-	prev_dev = NULL;</div><div class='del'>-	dev_replace_is_ongoing = btrfs_dev_replace_is_ongoing(</div><div class='del'>-			&amp;fs_info-&gt;dev_replace);</div><div class='del'>-	for (nzones = 0; nzones &lt; re-&gt;nzones; ++nzones) {</div><div class='del'>-		dev = re-&gt;zones[nzones]-&gt;device;</div><div class='del'>-</div><div class='del'>-		if (dev == prev_dev) {</div><div class='del'>-			/*</div><div class='del'>-			 * in case of DUP, just add the first zone. As both</div><div class='del'>-			 * are on the same device, there's nothing to gain</div><div class='del'>-			 * from adding both.</div><div class='del'>-			 * Also, it wouldn't work, as the tree is per device</div><div class='del'>-			 * and adding would fail with EEXIST</div><div class='del'>-			 */</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-		if (!dev-&gt;bdev)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		if (test_bit(BTRFS_DEV_STATE_NO_READA, &amp;dev-&gt;dev_state))</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		if (dev_replace_is_ongoing &amp;&amp;</div><div class='del'>-		    dev == fs_info-&gt;dev_replace.tgtdev) {</div><div class='del'>-			/*</div><div class='del'>-			 * as this device is selected for reading only as</div><div class='del'>-			 * a last resort, skip it for read ahead.</div><div class='del'>-			 */</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-		prev_dev = dev;</div><div class='del'>-		ret = radix_tree_insert(&amp;dev-&gt;reada_extents, index, re);</div><div class='del'>-		if (ret) {</div><div class='del'>-			while (--nzones &gt;= 0) {</div><div class='del'>-				dev = re-&gt;zones[nzones]-&gt;device;</div><div class='del'>-				BUG_ON(dev == NULL);</div><div class='del'>-				/* ignore whether the entry was inserted */</div><div class='del'>-				radix_tree_delete(&amp;dev-&gt;reada_extents, index);</div><div class='del'>-			}</div><div class='del'>-			radix_tree_delete(&amp;fs_info-&gt;reada_tree, index);</div><div class='del'>-			spin_unlock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-			up_read(&amp;fs_info-&gt;dev_replace.rwsem);</div><div class='del'>-			goto error;</div><div class='del'>-		}</div><div class='del'>-		have_zone = 1;</div><div class='del'>-	}</div><div class='del'>-	if (!have_zone)</div><div class='del'>-		radix_tree_delete(&amp;fs_info-&gt;reada_tree, index);</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-	up_read(&amp;fs_info-&gt;dev_replace.rwsem);</div><div class='del'>-</div><div class='del'>-	if (!have_zone)</div><div class='del'>-		goto error;</div><div class='del'>-</div><div class='del'>-	btrfs_put_bioc(bioc);</div><div class='del'>-	return re;</div><div class='del'>-</div><div class='del'>-error:</div><div class='del'>-	for (nzones = 0; nzones &lt; re-&gt;nzones; ++nzones) {</div><div class='del'>-		struct reada_zone *zone;</div><div class='del'>-</div><div class='del'>-		zone = re-&gt;zones[nzones];</div><div class='del'>-		kref_get(&amp;zone-&gt;refcnt);</div><div class='del'>-		spin_lock(&amp;zone-&gt;lock);</div><div class='del'>-		--zone-&gt;elems;</div><div class='del'>-		if (zone-&gt;elems == 0) {</div><div class='del'>-			/*</div><div class='del'>-			 * no fs_info-&gt;reada_lock needed, as this can't be</div><div class='del'>-			 * the last ref</div><div class='del'>-			 */</div><div class='del'>-			kref_put(&amp;zone-&gt;refcnt, reada_zone_release);</div><div class='del'>-		}</div><div class='del'>-		spin_unlock(&amp;zone-&gt;lock);</div><div class='del'>-</div><div class='del'>-		spin_lock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-		kref_put(&amp;zone-&gt;refcnt, reada_zone_release);</div><div class='del'>-		spin_unlock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-	}</div><div class='del'>-	btrfs_put_bioc(bioc);</div><div class='del'>-	kfree(re);</div><div class='del'>-	return re_exist;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void reada_extent_put(struct btrfs_fs_info *fs_info,</div><div class='del'>-			     struct reada_extent *re)</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-	unsigned long index = re-&gt;logical &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-	if (--re-&gt;refcnt) {</div><div class='del'>-		spin_unlock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	radix_tree_delete(&amp;fs_info-&gt;reada_tree, index);</div><div class='del'>-	for (i = 0; i &lt; re-&gt;nzones; ++i) {</div><div class='del'>-		struct reada_zone *zone = re-&gt;zones[i];</div><div class='del'>-</div><div class='del'>-		radix_tree_delete(&amp;zone-&gt;device-&gt;reada_extents, index);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; re-&gt;nzones; ++i) {</div><div class='del'>-		struct reada_zone *zone = re-&gt;zones[i];</div><div class='del'>-</div><div class='del'>-		kref_get(&amp;zone-&gt;refcnt);</div><div class='del'>-		spin_lock(&amp;zone-&gt;lock);</div><div class='del'>-		--zone-&gt;elems;</div><div class='del'>-		if (zone-&gt;elems == 0) {</div><div class='del'>-			/* no fs_info-&gt;reada_lock needed, as this can't be</div><div class='del'>-			 * the last ref */</div><div class='del'>-			kref_put(&amp;zone-&gt;refcnt, reada_zone_release);</div><div class='del'>-		}</div><div class='del'>-		spin_unlock(&amp;zone-&gt;lock);</div><div class='del'>-</div><div class='del'>-		spin_lock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-		kref_put(&amp;zone-&gt;refcnt, reada_zone_release);</div><div class='del'>-		spin_unlock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	kfree(re);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void reada_zone_release(struct kref *kref)</div><div class='del'>-{</div><div class='del'>-	struct reada_zone *zone = container_of(kref, struct reada_zone, refcnt);</div><div class='del'>-	struct btrfs_fs_info *fs_info = zone-&gt;device-&gt;fs_info;</div><div class='del'>-</div><div class='del'>-	lockdep_assert_held(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-</div><div class='del'>-	radix_tree_delete(&amp;zone-&gt;device-&gt;reada_zones,</div><div class='del'>-			  zone-&gt;end &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='del'>-</div><div class='del'>-	kfree(zone);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void reada_control_release(struct kref *kref)</div><div class='del'>-{</div><div class='del'>-	struct reada_control *rc = container_of(kref, struct reada_control,</div><div class='del'>-						refcnt);</div><div class='del'>-</div><div class='del'>-	kfree(rc);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int reada_add_block(struct reada_control *rc, u64 logical,</div><div class='del'>-			   struct btrfs_key *top, u64 owner_root,</div><div class='del'>-			   u64 generation, int level)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = rc-&gt;fs_info;</div><div class='del'>-	struct reada_extent *re;</div><div class='del'>-	struct reada_extctl *rec;</div><div class='del'>-</div><div class='del'>-	/* takes one ref */</div><div class='del'>-	re = reada_find_extent(fs_info, logical, top, owner_root, level);</div><div class='del'>-	if (!re)</div><div class='del'>-		return -1;</div><div class='del'>-</div><div class='del'>-	rec = kzalloc(sizeof(*rec), GFP_KERNEL);</div><div class='del'>-	if (!rec) {</div><div class='del'>-		reada_extent_put(fs_info, re);</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rec-&gt;rc = rc;</div><div class='del'>-	rec-&gt;generation = generation;</div><div class='del'>-	atomic_inc(&amp;rc-&gt;elems);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;re-&gt;lock);</div><div class='del'>-	list_add_tail(&amp;rec-&gt;list, &amp;re-&gt;extctl);</div><div class='del'>-	spin_unlock(&amp;re-&gt;lock);</div><div class='del'>-</div><div class='del'>-	/* leave the ref on the extent */</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * called with fs_info-&gt;reada_lock held</div><div class='del'>- */</div><div class='del'>-static void reada_peer_zones_set_lock(struct reada_zone *zone, int lock)</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-	unsigned long index = zone-&gt;end &gt;&gt; zone-&gt;device-&gt;fs_info-&gt;sectorsize_bits;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; zone-&gt;ndevs; ++i) {</div><div class='del'>-		struct reada_zone *peer;</div><div class='del'>-		peer = radix_tree_lookup(&amp;zone-&gt;devs[i]-&gt;reada_zones, index);</div><div class='del'>-		if (peer &amp;&amp; peer-&gt;device != zone-&gt;device)</div><div class='del'>-			peer-&gt;locked = lock;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * called with fs_info-&gt;reada_lock held</div><div class='del'>- */</div><div class='del'>-static int reada_pick_zone(struct btrfs_device *dev)</div><div class='del'>-{</div><div class='del'>-	struct reada_zone *top_zone = NULL;</div><div class='del'>-	struct reada_zone *top_locked_zone = NULL;</div><div class='del'>-	u64 top_elems = 0;</div><div class='del'>-	u64 top_locked_elems = 0;</div><div class='del'>-	unsigned long index = 0;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (dev-&gt;reada_curr_zone) {</div><div class='del'>-		reada_peer_zones_set_lock(dev-&gt;reada_curr_zone, 0);</div><div class='del'>-		kref_put(&amp;dev-&gt;reada_curr_zone-&gt;refcnt, reada_zone_release);</div><div class='del'>-		dev-&gt;reada_curr_zone = NULL;</div><div class='del'>-	}</div><div class='del'>-	/* pick the zone with the most elements */</div><div class='del'>-	while (1) {</div><div class='del'>-		struct reada_zone *zone;</div><div class='del'>-</div><div class='del'>-		ret = radix_tree_gang_lookup(&amp;dev-&gt;reada_zones,</div><div class='del'>-					     (void **)&amp;zone, index, 1);</div><div class='del'>-		if (ret == 0)</div><div class='del'>-			break;</div><div class='del'>-		index = (zone-&gt;end &gt;&gt; dev-&gt;fs_info-&gt;sectorsize_bits) + 1;</div><div class='del'>-		if (zone-&gt;locked) {</div><div class='del'>-			if (zone-&gt;elems &gt; top_locked_elems) {</div><div class='del'>-				top_locked_elems = zone-&gt;elems;</div><div class='del'>-				top_locked_zone = zone;</div><div class='del'>-			}</div><div class='del'>-		} else {</div><div class='del'>-			if (zone-&gt;elems &gt; top_elems) {</div><div class='del'>-				top_elems = zone-&gt;elems;</div><div class='del'>-				top_zone = zone;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	if (top_zone)</div><div class='del'>-		dev-&gt;reada_curr_zone = top_zone;</div><div class='del'>-	else if (top_locked_zone)</div><div class='del'>-		dev-&gt;reada_curr_zone = top_locked_zone;</div><div class='del'>-	else</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	dev-&gt;reada_next = dev-&gt;reada_curr_zone-&gt;start;</div><div class='del'>-	kref_get(&amp;dev-&gt;reada_curr_zone-&gt;refcnt);</div><div class='del'>-	reada_peer_zones_set_lock(dev-&gt;reada_curr_zone, 1);</div><div class='del'>-</div><div class='del'>-	return 1;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int reada_tree_block_flagged(struct btrfs_fs_info *fs_info, u64 bytenr,</div><div class='del'>-				    u64 owner_root, int level, int mirror_num,</div><div class='del'>-				    struct extent_buffer **eb)</div><div class='del'>-{</div><div class='del'>-	struct extent_buffer *buf = NULL;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	buf = btrfs_find_create_tree_block(fs_info, bytenr, owner_root, level);</div><div class='del'>-	if (IS_ERR(buf))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	set_bit(EXTENT_BUFFER_READAHEAD, &amp;buf-&gt;bflags);</div><div class='del'>-</div><div class='del'>-	ret = read_extent_buffer_pages(buf, WAIT_PAGE_LOCK, mirror_num);</div><div class='del'>-	if (ret) {</div><div class='del'>-		free_extent_buffer_stale(buf);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (test_bit(EXTENT_BUFFER_CORRUPT, &amp;buf-&gt;bflags)) {</div><div class='del'>-		free_extent_buffer_stale(buf);</div><div class='del'>-		return -EIO;</div><div class='del'>-	} else if (extent_buffer_uptodate(buf)) {</div><div class='del'>-		*eb = buf;</div><div class='del'>-	} else {</div><div class='del'>-		free_extent_buffer(buf);</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int reada_start_machine_dev(struct btrfs_device *dev)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = dev-&gt;fs_info;</div><div class='del'>-	struct reada_extent *re = NULL;</div><div class='del'>-	int mirror_num = 0;</div><div class='del'>-	struct extent_buffer *eb = NULL;</div><div class='del'>-	u64 logical;</div><div class='del'>-	int ret;</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-	if (dev-&gt;reada_curr_zone == NULL) {</div><div class='del'>-		ret = reada_pick_zone(dev);</div><div class='del'>-		if (!ret) {</div><div class='del'>-			spin_unlock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-			return 0;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	/*</div><div class='del'>-	 * FIXME currently we issue the reads one extent at a time. If we have</div><div class='del'>-	 * a contiguous block of extents, we could also coagulate them or use</div><div class='del'>-	 * plugging to speed things up</div><div class='del'>-	 */</div><div class='del'>-	ret = radix_tree_gang_lookup(&amp;dev-&gt;reada_extents, (void **)&amp;re,</div><div class='del'>-				dev-&gt;reada_next &gt;&gt; fs_info-&gt;sectorsize_bits, 1);</div><div class='del'>-	if (ret == 0 || re-&gt;logical &gt; dev-&gt;reada_curr_zone-&gt;end) {</div><div class='del'>-		ret = reada_pick_zone(dev);</div><div class='del'>-		if (!ret) {</div><div class='del'>-			spin_unlock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-			return 0;</div><div class='del'>-		}</div><div class='del'>-		re = NULL;</div><div class='del'>-		ret = radix_tree_gang_lookup(&amp;dev-&gt;reada_extents, (void **)&amp;re,</div><div class='del'>-				dev-&gt;reada_next &gt;&gt; fs_info-&gt;sectorsize_bits, 1);</div><div class='del'>-	}</div><div class='del'>-	if (ret == 0) {</div><div class='del'>-		spin_unlock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-	dev-&gt;reada_next = re-&gt;logical + fs_info-&gt;nodesize;</div><div class='del'>-	re-&gt;refcnt++;</div><div class='del'>-</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;re-&gt;lock);</div><div class='del'>-	if (re-&gt;scheduled || list_empty(&amp;re-&gt;extctl)) {</div><div class='del'>-		spin_unlock(&amp;re-&gt;lock);</div><div class='del'>-		reada_extent_put(fs_info, re);</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-	re-&gt;scheduled = 1;</div><div class='del'>-	spin_unlock(&amp;re-&gt;lock);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * find mirror num</div><div class='del'>-	 */</div><div class='del'>-	for (i = 0; i &lt; re-&gt;nzones; ++i) {</div><div class='del'>-		if (re-&gt;zones[i]-&gt;device == dev) {</div><div class='del'>-			mirror_num = i + 1;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	logical = re-&gt;logical;</div><div class='del'>-</div><div class='del'>-	atomic_inc(&amp;dev-&gt;reada_in_flight);</div><div class='del'>-	ret = reada_tree_block_flagged(fs_info, logical, re-&gt;owner_root,</div><div class='del'>-				       re-&gt;level, mirror_num, &amp;eb);</div><div class='del'>-	if (ret)</div><div class='del'>-		__readahead_hook(fs_info, re, NULL, ret);</div><div class='del'>-	else if (eb)</div><div class='del'>-		__readahead_hook(fs_info, re, eb, ret);</div><div class='del'>-</div><div class='del'>-	if (eb)</div><div class='del'>-		free_extent_buffer(eb);</div><div class='del'>-</div><div class='del'>-	atomic_dec(&amp;dev-&gt;reada_in_flight);</div><div class='del'>-	reada_extent_put(fs_info, re);</div><div class='del'>-</div><div class='del'>-	return 1;</div><div class='del'>-</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void reada_start_machine_worker(struct btrfs_work *work)</div><div class='del'>-{</div><div class='del'>-	struct reada_machine_work *rmw;</div><div class='del'>-	int old_ioprio;</div><div class='del'>-</div><div class='del'>-	rmw = container_of(work, struct reada_machine_work, work);</div><div class='del'>-</div><div class='del'>-	old_ioprio = IOPRIO_PRIO_VALUE(task_nice_ioclass(current),</div><div class='del'>-				       task_nice_ioprio(current));</div><div class='del'>-	set_task_ioprio(current, BTRFS_IOPRIO_READA);</div><div class='del'>-	__reada_start_machine(rmw-&gt;fs_info);</div><div class='del'>-	set_task_ioprio(current, old_ioprio);</div><div class='del'>-</div><div class='del'>-	atomic_dec(&amp;rmw-&gt;fs_info-&gt;reada_works_cnt);</div><div class='del'>-</div><div class='del'>-	kfree(rmw);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* Try to start up to 10k READA requests for a group of devices */</div><div class='del'>-static int reada_start_for_fsdevs(struct btrfs_fs_devices *fs_devices)</div><div class='del'>-{</div><div class='del'>-	u64 enqueued;</div><div class='del'>-	u64 total = 0;</div><div class='del'>-	struct btrfs_device *device;</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		enqueued = 0;</div><div class='del'>-		list_for_each_entry(device, &amp;fs_devices-&gt;devices, dev_list) {</div><div class='del'>-			if (atomic_read(&amp;device-&gt;reada_in_flight) &lt;</div><div class='del'>-			    MAX_IN_FLIGHT)</div><div class='del'>-				enqueued += reada_start_machine_dev(device);</div><div class='del'>-		}</div><div class='del'>-		total += enqueued;</div><div class='del'>-	} while (enqueued &amp;&amp; total &lt; 10000);</div><div class='del'>-</div><div class='del'>-	return total;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void __reada_start_machine(struct btrfs_fs_info *fs_info)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_devices *fs_devices = fs_info-&gt;fs_devices, *seed_devs;</div><div class='del'>-	int i;</div><div class='del'>-	u64 enqueued = 0;</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='del'>-</div><div class='del'>-	enqueued += reada_start_for_fsdevs(fs_devices);</div><div class='del'>-	list_for_each_entry(seed_devs, &amp;fs_devices-&gt;seed_list, seed_list)</div><div class='del'>-		enqueued += reada_start_for_fsdevs(seed_devs);</div><div class='del'>-</div><div class='del'>-	mutex_unlock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='del'>-	if (enqueued == 0)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If everything is already in the cache, this is effectively single</div><div class='del'>-	 * threaded. To a) not hold the caller for too long and b) to utilize</div><div class='del'>-	 * more cores, we broke the loop above after 10000 iterations and now</div><div class='del'>-	 * enqueue to workers to finish it. This will distribute the load to</div><div class='del'>-	 * the cores.</div><div class='del'>-	 */</div><div class='del'>-	for (i = 0; i &lt; 2; ++i) {</div><div class='del'>-		reada_start_machine(fs_info);</div><div class='del'>-		if (atomic_read(&amp;fs_info-&gt;reada_works_cnt) &gt;</div><div class='del'>-		    BTRFS_MAX_MIRRORS * 2)</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void reada_start_machine(struct btrfs_fs_info *fs_info)</div><div class='del'>-{</div><div class='del'>-	struct reada_machine_work *rmw;</div><div class='del'>-</div><div class='del'>-	rmw = kzalloc(sizeof(*rmw), GFP_KERNEL);</div><div class='del'>-	if (!rmw) {</div><div class='del'>-		/* FIXME we cannot handle this properly right now */</div><div class='del'>-		BUG();</div><div class='del'>-	}</div><div class='del'>-	btrfs_init_work(&amp;rmw-&gt;work, reada_start_machine_worker, NULL, NULL);</div><div class='del'>-	rmw-&gt;fs_info = fs_info;</div><div class='del'>-</div><div class='del'>-	btrfs_queue_work(fs_info-&gt;readahead_workers, &amp;rmw-&gt;work);</div><div class='del'>-	atomic_inc(&amp;fs_info-&gt;reada_works_cnt);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#ifdef DEBUG</div><div class='del'>-static void dump_devs(struct btrfs_fs_info *fs_info, int all)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_device *device;</div><div class='del'>-	struct btrfs_fs_devices *fs_devices = fs_info-&gt;fs_devices;</div><div class='del'>-	unsigned long index;</div><div class='del'>-	int ret;</div><div class='del'>-	int i;</div><div class='del'>-	int j;</div><div class='del'>-	int cnt;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-	list_for_each_entry(device, &amp;fs_devices-&gt;devices, dev_list) {</div><div class='del'>-		btrfs_debug(fs_info, "dev %lld has %d in flight", device-&gt;devid,</div><div class='del'>-			atomic_read(&amp;device-&gt;reada_in_flight));</div><div class='del'>-		index = 0;</div><div class='del'>-		while (1) {</div><div class='del'>-			struct reada_zone *zone;</div><div class='del'>-			ret = radix_tree_gang_lookup(&amp;device-&gt;reada_zones,</div><div class='del'>-						     (void **)&amp;zone, index, 1);</div><div class='del'>-			if (ret == 0)</div><div class='del'>-				break;</div><div class='del'>-			pr_debug("  zone %llu-%llu elems %llu locked %d devs",</div><div class='del'>-				    zone-&gt;start, zone-&gt;end, zone-&gt;elems,</div><div class='del'>-				    zone-&gt;locked);</div><div class='del'>-			for (j = 0; j &lt; zone-&gt;ndevs; ++j) {</div><div class='del'>-				pr_cont(" %lld",</div><div class='del'>-					zone-&gt;devs[j]-&gt;devid);</div><div class='del'>-			}</div><div class='del'>-			if (device-&gt;reada_curr_zone == zone)</div><div class='del'>-				pr_cont(" curr off %llu",</div><div class='del'>-					device-&gt;reada_next - zone-&gt;start);</div><div class='del'>-			pr_cont("\n");</div><div class='del'>-			index = (zone-&gt;end &gt;&gt; fs_info-&gt;sectorsize_bits) + 1;</div><div class='del'>-		}</div><div class='del'>-		cnt = 0;</div><div class='del'>-		index = 0;</div><div class='del'>-		while (all) {</div><div class='del'>-			struct reada_extent *re = NULL;</div><div class='del'>-</div><div class='del'>-			ret = radix_tree_gang_lookup(&amp;device-&gt;reada_extents,</div><div class='del'>-						     (void **)&amp;re, index, 1);</div><div class='del'>-			if (ret == 0)</div><div class='del'>-				break;</div><div class='del'>-			pr_debug("  re: logical %llu size %u empty %d scheduled %d",</div><div class='del'>-				re-&gt;logical, fs_info-&gt;nodesize,</div><div class='del'>-				list_empty(&amp;re-&gt;extctl), re-&gt;scheduled);</div><div class='del'>-</div><div class='del'>-			for (i = 0; i &lt; re-&gt;nzones; ++i) {</div><div class='del'>-				pr_cont(" zone %llu-%llu devs",</div><div class='del'>-					re-&gt;zones[i]-&gt;start,</div><div class='del'>-					re-&gt;zones[i]-&gt;end);</div><div class='del'>-				for (j = 0; j &lt; re-&gt;zones[i]-&gt;ndevs; ++j) {</div><div class='del'>-					pr_cont(" %lld",</div><div class='del'>-						re-&gt;zones[i]-&gt;devs[j]-&gt;devid);</div><div class='del'>-				}</div><div class='del'>-			}</div><div class='del'>-			pr_cont("\n");</div><div class='del'>-			index = (re-&gt;logical &gt;&gt; fs_info-&gt;sectorsize_bits) + 1;</div><div class='del'>-			if (++cnt &gt; 15)</div><div class='del'>-				break;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	index = 0;</div><div class='del'>-	cnt = 0;</div><div class='del'>-	while (all) {</div><div class='del'>-		struct reada_extent *re = NULL;</div><div class='del'>-</div><div class='del'>-		ret = radix_tree_gang_lookup(&amp;fs_info-&gt;reada_tree, (void **)&amp;re,</div><div class='del'>-					     index, 1);</div><div class='del'>-		if (ret == 0)</div><div class='del'>-			break;</div><div class='del'>-		if (!re-&gt;scheduled) {</div><div class='del'>-			index = (re-&gt;logical &gt;&gt; fs_info-&gt;sectorsize_bits) + 1;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-		pr_debug("re: logical %llu size %u list empty %d scheduled %d",</div><div class='del'>-			re-&gt;logical, fs_info-&gt;nodesize,</div><div class='del'>-			list_empty(&amp;re-&gt;extctl), re-&gt;scheduled);</div><div class='del'>-		for (i = 0; i &lt; re-&gt;nzones; ++i) {</div><div class='del'>-			pr_cont(" zone %llu-%llu devs",</div><div class='del'>-				re-&gt;zones[i]-&gt;start,</div><div class='del'>-				re-&gt;zones[i]-&gt;end);</div><div class='del'>-			for (j = 0; j &lt; re-&gt;zones[i]-&gt;ndevs; ++j) {</div><div class='del'>-				pr_cont(" %lld",</div><div class='del'>-				       re-&gt;zones[i]-&gt;devs[j]-&gt;devid);</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-		pr_cont("\n");</div><div class='del'>-		index = (re-&gt;logical &gt;&gt; fs_info-&gt;sectorsize_bits) + 1;</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-}</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * interface</div><div class='del'>- */</div><div class='del'>-struct reada_control *btrfs_reada_add(struct btrfs_root *root,</div><div class='del'>-			struct btrfs_key *key_start, struct btrfs_key *key_end)</div><div class='del'>-{</div><div class='del'>-	struct reada_control *rc;</div><div class='del'>-	u64 start;</div><div class='del'>-	u64 generation;</div><div class='del'>-	int ret;</div><div class='del'>-	int level;</div><div class='del'>-	struct extent_buffer *node;</div><div class='del'>-	static struct btrfs_key max_key = {</div><div class='del'>-		.objectid = (u64)-1,</div><div class='del'>-		.type = (u8)-1,</div><div class='del'>-		.offset = (u64)-1</div><div class='del'>-	};</div><div class='del'>-</div><div class='del'>-	rc = kzalloc(sizeof(*rc), GFP_KERNEL);</div><div class='del'>-	if (!rc)</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='del'>-</div><div class='del'>-	rc-&gt;fs_info = root-&gt;fs_info;</div><div class='del'>-	rc-&gt;key_start = *key_start;</div><div class='del'>-	rc-&gt;key_end = *key_end;</div><div class='del'>-	atomic_set(&amp;rc-&gt;elems, 0);</div><div class='del'>-	init_waitqueue_head(&amp;rc-&gt;wait);</div><div class='del'>-	kref_init(&amp;rc-&gt;refcnt);</div><div class='del'>-	kref_get(&amp;rc-&gt;refcnt); /* one ref for having elements */</div><div class='del'>-</div><div class='del'>-	node = btrfs_root_node(root);</div><div class='del'>-	start = node-&gt;start;</div><div class='del'>-	generation = btrfs_header_generation(node);</div><div class='del'>-	level = btrfs_header_level(node);</div><div class='del'>-	free_extent_buffer(node);</div><div class='del'>-</div><div class='del'>-	ret = reada_add_block(rc, start, &amp;max_key, root-&gt;root_key.objectid,</div><div class='del'>-			      generation, level);</div><div class='del'>-	if (ret) {</div><div class='del'>-		kfree(rc);</div><div class='del'>-		return ERR_PTR(ret);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	reada_start_machine(root-&gt;fs_info);</div><div class='del'>-</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#ifdef DEBUG</div><div class='del'>-int btrfs_reada_wait(void *handle)</div><div class='del'>-{</div><div class='del'>-	struct reada_control *rc = handle;</div><div class='del'>-	struct btrfs_fs_info *fs_info = rc-&gt;fs_info;</div><div class='del'>-</div><div class='del'>-	while (atomic_read(&amp;rc-&gt;elems)) {</div><div class='del'>-		if (!atomic_read(&amp;fs_info-&gt;reada_works_cnt))</div><div class='del'>-			reada_start_machine(fs_info);</div><div class='del'>-		wait_event_timeout(rc-&gt;wait, atomic_read(&amp;rc-&gt;elems) == 0,</div><div class='del'>-				   5 * HZ);</div><div class='del'>-		dump_devs(fs_info, atomic_read(&amp;rc-&gt;elems) &lt; 10 ? 1 : 0);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	dump_devs(fs_info, atomic_read(&amp;rc-&gt;elems) &lt; 10 ? 1 : 0);</div><div class='del'>-</div><div class='del'>-	kref_put(&amp;rc-&gt;refcnt, reada_control_release);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-#else</div><div class='del'>-int btrfs_reada_wait(void *handle)</div><div class='del'>-{</div><div class='del'>-	struct reada_control *rc = handle;</div><div class='del'>-	struct btrfs_fs_info *fs_info = rc-&gt;fs_info;</div><div class='del'>-</div><div class='del'>-	while (atomic_read(&amp;rc-&gt;elems)) {</div><div class='del'>-		if (!atomic_read(&amp;fs_info-&gt;reada_works_cnt))</div><div class='del'>-			reada_start_machine(fs_info);</div><div class='del'>-		wait_event_timeout(rc-&gt;wait, atomic_read(&amp;rc-&gt;elems) == 0,</div><div class='del'>-				   (HZ + 9) / 10);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	kref_put(&amp;rc-&gt;refcnt, reada_control_release);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-void btrfs_reada_detach(void *handle)</div><div class='del'>-{</div><div class='del'>-	struct reada_control *rc = handle;</div><div class='del'>-</div><div class='del'>-	kref_put(&amp;rc-&gt;refcnt, reada_control_release);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Before removing a device (device replace or device remove ioctls), call this</div><div class='del'>- * function to wait for all existing readahead requests on the device and to</div><div class='del'>- * make sure no one queues more readahead requests for the device.</div><div class='del'>- *</div><div class='del'>- * Must be called without holding neither the device list mutex nor the device</div><div class='del'>- * replace semaphore, otherwise it will deadlock.</div><div class='del'>- */</div><div class='del'>-void btrfs_reada_remove_dev(struct btrfs_device *dev)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = dev-&gt;fs_info;</div><div class='del'>-</div><div class='del'>-	/* Serialize with readahead extent creation at reada_find_extent(). */</div><div class='del'>-	spin_lock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-	set_bit(BTRFS_DEV_STATE_NO_READA, &amp;dev-&gt;dev_state);</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;reada_lock);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * There might be readahead requests added to the radix trees which</div><div class='del'>-	 * were not yet added to the readahead work queue. We need to start</div><div class='del'>-	 * them and wait for their completion, otherwise we can end up with</div><div class='del'>-	 * use-after-free problems when dropping the last reference on the</div><div class='del'>-	 * readahead extents and their zones, as they need to access the</div><div class='del'>-	 * device structure.</div><div class='del'>-	 */</div><div class='del'>-	reada_start_machine(fs_info);</div><div class='del'>-	btrfs_flush_workqueue(fs_info-&gt;readahead_workers);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * If when removing a device (device replace or device remove ioctls) an error</div><div class='del'>- * happens after calling btrfs_reada_remove_dev(), call this to undo what that</div><div class='del'>- * function did. This is safe to call even if btrfs_reada_remove_dev() was not</div><div class='del'>- * called before.</div><div class='del'>- */</div><div class='del'>-void btrfs_reada_undo_remove_dev(struct btrfs_device *dev)</div><div class='del'>-{</div><div class='del'>-	spin_lock(&amp;dev-&gt;fs_info-&gt;reada_lock);</div><div class='del'>-	clear_bit(BTRFS_DEV_STATE_NO_READA, &amp;dev-&gt;dev_state);</div><div class='del'>-	spin_unlock(&amp;dev-&gt;fs_info-&gt;reada_lock);</div><div class='del'>-}</div><div class='head'>diff --git a/fs/btrfs/ref-verify.c b/fs/btrfs/ref-verify.c<br/>index e2b9f8616501..e9224145d754 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/ref-verify.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/ref-verify.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/ref-verify.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/ref-verify.c</a></div><div class='hunk'>@@ -5,11 +5,14 @@</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='ctx'> #include &lt;linux/stacktrace.h&gt;</div><div class='add'>+#include "messages.h"</div><div class='ctx'> #include "ctree.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='ctx'> #include "locking.h"</div><div class='ctx'> #include "delayed-ref.h"</div><div class='ctx'> #include "ref-verify.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Used to keep track the roots and number of refs each root has for a given</div><div class='hunk'>@@ -72,69 +75,70 @@ struct block_entry {</div><div class='ctx'> 	struct list_head actions;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+static int block_entry_bytenr_key_cmp(const void *key, const struct rb_node *node)</div><div class='add'>+{</div><div class='add'>+	const u64 *bytenr = key;</div><div class='add'>+	const struct block_entry *entry = rb_entry(node, struct block_entry, node);</div><div class='add'>+</div><div class='add'>+	if (entry-&gt;bytenr &lt; *bytenr)</div><div class='add'>+		return 1;</div><div class='add'>+	else if (entry-&gt;bytenr &gt; *bytenr)</div><div class='add'>+		return -1;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int block_entry_bytenr_cmp(struct rb_node *new, const struct rb_node *existing)</div><div class='add'>+{</div><div class='add'>+	const struct block_entry *new_entry = rb_entry(new, struct block_entry, node);</div><div class='add'>+</div><div class='add'>+	return block_entry_bytenr_key_cmp(&amp;new_entry-&gt;bytenr, existing);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static struct block_entry *insert_block_entry(struct rb_root *root,</div><div class='ctx'> 					      struct block_entry *be)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node **p = &amp;root-&gt;rb_node;</div><div class='del'>-	struct rb_node *parent_node = NULL;</div><div class='del'>-	struct block_entry *entry;</div><div class='del'>-</div><div class='del'>-	while (*p) {</div><div class='del'>-		parent_node = *p;</div><div class='del'>-		entry = rb_entry(parent_node, struct block_entry, node);</div><div class='del'>-		if (entry-&gt;bytenr &gt; be-&gt;bytenr)</div><div class='del'>-			p = &amp;(*p)-&gt;rb_left;</div><div class='del'>-		else if (entry-&gt;bytenr &lt; be-&gt;bytenr)</div><div class='del'>-			p = &amp;(*p)-&gt;rb_right;</div><div class='del'>-		else</div><div class='del'>-			return entry;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rb_link_node(&amp;be-&gt;node, parent_node, p);</div><div class='del'>-	rb_insert_color(&amp;be-&gt;node, root);</div><div class='del'>-	return NULL;</div><div class='add'>+	struct rb_node *node;</div><div class='add'>+</div><div class='add'>+	node = rb_find_add(&amp;be-&gt;node, root, block_entry_bytenr_cmp);</div><div class='add'>+	return rb_entry_safe(node, struct block_entry, node);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct block_entry *lookup_block_entry(struct rb_root *root, u64 bytenr)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node *n;</div><div class='del'>-	struct block_entry *entry = NULL;</div><div class='add'>+	struct rb_node *node;</div><div class='ctx'> </div><div class='del'>-	n = root-&gt;rb_node;</div><div class='del'>-	while (n) {</div><div class='del'>-		entry = rb_entry(n, struct block_entry, node);</div><div class='del'>-		if (entry-&gt;bytenr &lt; bytenr)</div><div class='del'>-			n = n-&gt;rb_right;</div><div class='del'>-		else if (entry-&gt;bytenr &gt; bytenr)</div><div class='del'>-			n = n-&gt;rb_left;</div><div class='del'>-		else</div><div class='del'>-			return entry;</div><div class='del'>-	}</div><div class='del'>-	return NULL;</div><div class='add'>+	node = rb_find(&amp;bytenr, root, block_entry_bytenr_key_cmp);</div><div class='add'>+	return rb_entry_safe(node, struct block_entry, node);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct root_entry *insert_root_entry(struct rb_root *root,</div><div class='del'>-					    struct root_entry *re)</div><div class='add'>+static int root_entry_root_objectid_key_cmp(const void *key, const struct rb_node *node)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node **p = &amp;root-&gt;rb_node;</div><div class='del'>-	struct rb_node *parent_node = NULL;</div><div class='del'>-	struct root_entry *entry;</div><div class='add'>+	const u64 *objectid = key;</div><div class='add'>+	const struct root_entry *entry = rb_entry(node, struct root_entry, node);</div><div class='ctx'> </div><div class='del'>-	while (*p) {</div><div class='del'>-		parent_node = *p;</div><div class='del'>-		entry = rb_entry(parent_node, struct root_entry, node);</div><div class='del'>-		if (entry-&gt;root_objectid &gt; re-&gt;root_objectid)</div><div class='del'>-			p = &amp;(*p)-&gt;rb_left;</div><div class='del'>-		else if (entry-&gt;root_objectid &lt; re-&gt;root_objectid)</div><div class='del'>-			p = &amp;(*p)-&gt;rb_right;</div><div class='del'>-		else</div><div class='del'>-			return entry;</div><div class='del'>-	}</div><div class='add'>+	if (entry-&gt;root_objectid &lt; *objectid)</div><div class='add'>+		return 1;</div><div class='add'>+	else if (entry-&gt;root_objectid &gt; *objectid)</div><div class='add'>+		return -1;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int root_entry_root_objectid_cmp(struct rb_node *new, const struct rb_node *existing)</div><div class='add'>+{</div><div class='add'>+	const struct root_entry *new_entry = rb_entry(new, struct root_entry, node);</div><div class='ctx'> </div><div class='del'>-	rb_link_node(&amp;re-&gt;node, parent_node, p);</div><div class='del'>-	rb_insert_color(&amp;re-&gt;node, root);</div><div class='del'>-	return NULL;</div><div class='add'>+	return root_entry_root_objectid_key_cmp(&amp;new_entry-&gt;root_objectid, existing);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct root_entry *insert_root_entry(struct rb_root *root,</div><div class='add'>+					    struct root_entry *re)</div><div class='add'>+{</div><div class='add'>+	struct rb_node *node;</div><div class='ctx'> </div><div class='add'>+	node = rb_find_add(&amp;re-&gt;node, root, root_entry_root_objectid_cmp);</div><div class='add'>+	return rb_entry_safe(node, struct root_entry, node);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int comp_refs(struct ref_entry *ref1, struct ref_entry *ref2)</div><div class='hunk'>@@ -158,48 +162,29 @@ static int comp_refs(struct ref_entry *ref1, struct ref_entry *ref2)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int ref_entry_cmp(struct rb_node *new, const struct rb_node *existing)</div><div class='add'>+{</div><div class='add'>+	struct ref_entry *new_entry = rb_entry(new, struct ref_entry, node);</div><div class='add'>+	struct ref_entry *existing_entry = rb_entry(existing, struct ref_entry, node);</div><div class='add'>+</div><div class='add'>+	return comp_refs(new_entry, existing_entry);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static struct ref_entry *insert_ref_entry(struct rb_root *root,</div><div class='ctx'> 					  struct ref_entry *ref)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node **p = &amp;root-&gt;rb_node;</div><div class='del'>-	struct rb_node *parent_node = NULL;</div><div class='del'>-	struct ref_entry *entry;</div><div class='del'>-	int cmp;</div><div class='del'>-</div><div class='del'>-	while (*p) {</div><div class='del'>-		parent_node = *p;</div><div class='del'>-		entry = rb_entry(parent_node, struct ref_entry, node);</div><div class='del'>-		cmp = comp_refs(entry, ref);</div><div class='del'>-		if (cmp &gt; 0)</div><div class='del'>-			p = &amp;(*p)-&gt;rb_left;</div><div class='del'>-		else if (cmp &lt; 0)</div><div class='del'>-			p = &amp;(*p)-&gt;rb_right;</div><div class='del'>-		else</div><div class='del'>-			return entry;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rb_link_node(&amp;ref-&gt;node, parent_node, p);</div><div class='del'>-	rb_insert_color(&amp;ref-&gt;node, root);</div><div class='del'>-	return NULL;</div><div class='add'>+	struct rb_node *node;</div><div class='ctx'> </div><div class='add'>+	node = rb_find_add(&amp;ref-&gt;node, root, ref_entry_cmp);</div><div class='add'>+	return rb_entry_safe(node, struct ref_entry, node);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct root_entry *lookup_root_entry(struct rb_root *root, u64 objectid)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node *n;</div><div class='del'>-	struct root_entry *entry = NULL;</div><div class='add'>+	struct rb_node *node;</div><div class='ctx'> </div><div class='del'>-	n = root-&gt;rb_node;</div><div class='del'>-	while (n) {</div><div class='del'>-		entry = rb_entry(n, struct root_entry, node);</div><div class='del'>-		if (entry-&gt;root_objectid &lt; objectid)</div><div class='del'>-			n = n-&gt;rb_right;</div><div class='del'>-		else if (entry-&gt;root_objectid &gt; objectid)</div><div class='del'>-			n = n-&gt;rb_left;</div><div class='del'>-		else</div><div class='del'>-			return entry;</div><div class='del'>-	}</div><div class='del'>-	return NULL;</div><div class='add'>+	node = rb_find(&amp;objectid, root, root_entry_root_objectid_key_cmp);</div><div class='add'>+	return rb_entry_safe(node, struct root_entry, node);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_STACKTRACE</div><div class='hunk'>@@ -435,10 +420,11 @@ static int process_extent_item(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	struct btrfs_extent_data_ref *dref;</div><div class='ctx'> 	struct btrfs_shared_data_ref *sref;</div><div class='ctx'> 	struct extent_buffer *leaf = path-&gt;nodes[0];</div><div class='del'>-	u32 item_size = btrfs_item_size_nr(leaf, slot);</div><div class='add'>+	u32 item_size = btrfs_item_size(leaf, slot);</div><div class='ctx'> 	unsigned long end, ptr;</div><div class='ctx'> 	u64 offset, flags, count;</div><div class='del'>-	int type, ret;</div><div class='add'>+	int type;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	ei = btrfs_item_ptr(leaf, slot, struct btrfs_extent_item);</div><div class='ctx'> 	flags = btrfs_extent_flags(leaf, ei);</div><div class='hunk'>@@ -482,6 +468,13 @@ static int process_extent_item(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			ret = add_shared_data_ref(fs_info, offset, count,</div><div class='ctx'> 						  key-&gt;objectid, key-&gt;offset);</div><div class='ctx'> 			break;</div><div class='add'>+		case BTRFS_EXTENT_OWNER_REF_KEY:</div><div class='add'>+			if (!btrfs_fs_incompat(fs_info, SIMPLE_QUOTA)) {</div><div class='add'>+				btrfs_err(fs_info,</div><div class='add'>+			  "found extent owner ref without simple quotas enabled");</div><div class='add'>+				ret = -EINVAL;</div><div class='add'>+			}</div><div class='add'>+			break;</div><div class='ctx'> 		default:</div><div class='ctx'> 			btrfs_err(fs_info, "invalid key type in iref");</div><div class='ctx'> 			ret = -EINVAL;</div><div class='hunk'>@@ -649,7 +642,7 @@ static void dump_block_entry(struct btrfs_fs_info *fs_info,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * btrfs_ref_tree_mod: called when we modify a ref for a bytenr</div><div class='add'>+ * Called when we modify a ref for a bytenr.</div><div class='ctx'>  *</div><div class='ctx'>  * This will add an action item to the given bytenr and do sanity checks to make</div><div class='ctx'>  * sure we haven't messed something up.  If we are making a new allocation and</div><div class='hunk'>@@ -657,7 +650,7 @@ static void dump_block_entry(struct btrfs_fs_info *fs_info,</div><div class='ctx'>  * our sanity checks pass as they are no longer needed.</div><div class='ctx'>  */</div><div class='ctx'> int btrfs_ref_tree_mod(struct btrfs_fs_info *fs_info,</div><div class='del'>-		       struct btrfs_ref *generic_ref)</div><div class='add'>+		       const struct btrfs_ref *generic_ref)</div><div class='ctx'> {</div><div class='ctx'> 	struct ref_entry *ref = NULL, *exist;</div><div class='ctx'> 	struct ref_action *ra = NULL;</div><div class='hunk'>@@ -667,7 +660,7 @@ int btrfs_ref_tree_mod(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	bool metadata;</div><div class='ctx'> 	u64 bytenr = generic_ref-&gt;bytenr;</div><div class='del'>-	u64 num_bytes = generic_ref-&gt;len;</div><div class='add'>+	u64 num_bytes = generic_ref-&gt;num_bytes;</div><div class='ctx'> 	u64 parent = generic_ref-&gt;parent;</div><div class='ctx'> 	u64 ref_root = 0;</div><div class='ctx'> 	u64 owner = 0;</div><div class='hunk'>@@ -678,11 +671,11 @@ int btrfs_ref_tree_mod(struct btrfs_fs_info *fs_info,</div><div class='ctx'> </div><div class='ctx'> 	if (generic_ref-&gt;type == BTRFS_REF_METADATA) {</div><div class='ctx'> 		if (!parent)</div><div class='del'>-			ref_root = generic_ref-&gt;tree_ref.owning_root;</div><div class='add'>+			ref_root = generic_ref-&gt;ref_root;</div><div class='ctx'> 		owner = generic_ref-&gt;tree_ref.level;</div><div class='ctx'> 	} else if (!parent) {</div><div class='del'>-		ref_root = generic_ref-&gt;data_ref.owning_root;</div><div class='del'>-		owner = generic_ref-&gt;data_ref.ino;</div><div class='add'>+		ref_root = generic_ref-&gt;ref_root;</div><div class='add'>+		owner = generic_ref-&gt;data_ref.objectid;</div><div class='ctx'> 		offset = generic_ref-&gt;data_ref.offset;</div><div class='ctx'> 	}</div><div class='ctx'> 	metadata = owner &lt; BTRFS_FIRST_FREE_OBJECTID;</div><div class='hunk'>@@ -788,6 +781,7 @@ int btrfs_ref_tree_mod(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			dump_ref_action(fs_info, ra);</div><div class='ctx'> 			kfree(ref);</div><div class='ctx'> 			kfree(ra);</div><div class='add'>+			kfree(re);</div><div class='ctx'> 			goto out_unlock;</div><div class='ctx'> 		} else if (be-&gt;num_refs == 0) {</div><div class='ctx'> 			btrfs_err(fs_info,</div><div class='hunk'>@@ -797,6 +791,7 @@ int btrfs_ref_tree_mod(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			dump_ref_action(fs_info, ra);</div><div class='ctx'> 			kfree(ref);</div><div class='ctx'> 			kfree(ra);</div><div class='add'>+			kfree(re);</div><div class='ctx'> 			goto out_unlock;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -844,6 +839,7 @@ int btrfs_ref_tree_mod(struct btrfs_fs_info *fs_info,</div><div class='ctx'> "dropping a ref for a root that doesn't have a ref on the block");</div><div class='ctx'> 			dump_block_entry(fs_info, be);</div><div class='ctx'> 			dump_ref_action(fs_info, ra);</div><div class='add'>+			rb_erase(&amp;ref-&gt;node, &amp;be-&gt;refs);</div><div class='ctx'> 			kfree(ref);</div><div class='ctx'> 			kfree(ra);</div><div class='ctx'> 			goto out_unlock;</div><div class='hunk'>@@ -881,8 +877,10 @@ int btrfs_ref_tree_mod(struct btrfs_fs_info *fs_info,</div><div class='ctx'> out_unlock:</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;ref_verify_lock);</div><div class='ctx'> out:</div><div class='del'>-	if (ret)</div><div class='add'>+	if (ret) {</div><div class='add'>+		btrfs_free_ref_cache(fs_info);</div><div class='ctx'> 		btrfs_clear_opt(fs_info-&gt;mount_opt, REF_VERIFY);</div><div class='add'>+	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -972,7 +970,8 @@ void btrfs_free_ref_tree_range(struct btrfs_fs_info *fs_info, u64 start,</div><div class='ctx'> /* Walk down all roots and build the ref tree, meant to be called at mount */</div><div class='ctx'> int btrfs_build_ref_tree(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	struct btrfs_root *extent_root;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='ctx'> 	int tree_block_level = 0;</div><div class='ctx'> 	u64 bytenr = 0, num_bytes = 0;</div><div class='hunk'>@@ -981,11 +980,19 @@ int btrfs_build_ref_tree(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	if (!btrfs_test_opt(fs_info, REF_VERIFY))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='add'>+	extent_root = btrfs_extent_root(fs_info, 0);</div><div class='add'>+	/* If the extent tree is damaged we cannot ignore it (IGNOREBADROOTS). */</div><div class='add'>+	if (!extent_root) {</div><div class='add'>+		btrfs_warn(fs_info, "ref-verify: extent tree not available, disabling");</div><div class='add'>+		btrfs_clear_opt(fs_info-&gt;mount_opt, REF_VERIFY);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	eb = btrfs_read_lock_root_node(fs_info-&gt;extent_root);</div><div class='add'>+	eb = btrfs_read_lock_root_node(extent_root);</div><div class='ctx'> 	level = btrfs_header_level(eb);</div><div class='ctx'> 	path-&gt;nodes[level] = eb;</div><div class='ctx'> 	path-&gt;slots[level] = 0;</div><div class='hunk'>@@ -998,7 +1005,7 @@ int btrfs_build_ref_tree(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 		 * would have had to added a ref key item which may appear on a</div><div class='ctx'> 		 * different leaf from the original extent item.</div><div class='ctx'> 		 */</div><div class='del'>-		ret = walk_down_tree(fs_info-&gt;extent_root, path, level,</div><div class='add'>+		ret = walk_down_tree(extent_root, path, level,</div><div class='ctx'> 				     &amp;bytenr, &amp;num_bytes, &amp;tree_block_level);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -1011,9 +1018,8 @@ int btrfs_build_ref_tree(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		btrfs_clear_opt(fs_info-&gt;mount_opt, REF_VERIFY);</div><div class='ctx'> 		btrfs_free_ref_cache(fs_info);</div><div class='add'>+		btrfs_clear_opt(fs_info-&gt;mount_opt, REF_VERIFY);</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/btrfs/ref-verify.h b/fs/btrfs/ref-verify.h<br/>index 855de37719b5..1ce544d53cc5 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/ref-verify.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/ref-verify.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/ref-verify.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/ref-verify.h</a></div><div class='hunk'>@@ -6,11 +6,20 @@</div><div class='ctx'> #ifndef BTRFS_REF_VERIFY_H</div><div class='ctx'> #define BTRFS_REF_VERIFY_H</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_BTRFS_FS_REF_VERIFY</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+#include &lt;linux/rbtree_types.h&gt;</div><div class='add'>+</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+struct btrfs_ref;</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BTRFS_DEBUG</div><div class='add'>+</div><div class='add'>+#include &lt;linux/spinlock.h&gt;</div><div class='add'>+</div><div class='ctx'> int btrfs_build_ref_tree(struct btrfs_fs_info *fs_info);</div><div class='ctx'> void btrfs_free_ref_cache(struct btrfs_fs_info *fs_info);</div><div class='ctx'> int btrfs_ref_tree_mod(struct btrfs_fs_info *fs_info,</div><div class='del'>-		       struct btrfs_ref *generic_ref);</div><div class='add'>+		       const struct btrfs_ref *generic_ref);</div><div class='ctx'> void btrfs_free_ref_tree_range(struct btrfs_fs_info *fs_info, u64 start,</div><div class='ctx'> 			       u64 len);</div><div class='ctx'> </div><div class='hunk'>@@ -30,7 +39,7 @@ static inline void btrfs_free_ref_cache(struct btrfs_fs_info *fs_info)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int btrfs_ref_tree_mod(struct btrfs_fs_info *fs_info,</div><div class='del'>-		       struct btrfs_ref *generic_ref)</div><div class='add'>+				     const struct btrfs_ref *generic_ref)</div><div class='ctx'> {</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -44,6 +53,6 @@ static inline void btrfs_init_ref_verify(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#endif /* CONFIG_BTRFS_FS_REF_VERIFY */</div><div class='add'>+#endif /* CONFIG_BTRFS_DEBUG */</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/btrfs/reflink.c b/fs/btrfs/reflink.c<br/>index e0f93b357548..b5fe95baf92e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/reflink.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/reflink.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/reflink.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/reflink.c</a></div><div class='hunk'>@@ -1,13 +1,21 @@</div><div class='ctx'> // SPDX-License-Identifier: GPL-2.0</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/blkdev.h&gt;</div><div class='add'>+#include &lt;linux/fscrypt.h&gt;</div><div class='ctx'> #include &lt;linux/iversion.h&gt;</div><div class='del'>-#include "compression.h"</div><div class='ctx'> #include "ctree.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "messages.h"</div><div class='add'>+#include "compression.h"</div><div class='ctx'> #include "delalloc-space.h"</div><div class='add'>+#include "disk-io.h"</div><div class='ctx'> #include "reflink.h"</div><div class='ctx'> #include "transaction.h"</div><div class='ctx'> #include "subpage.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "file-item.h"</div><div class='add'>+#include "file.h"</div><div class='add'>+#include "super.h"</div><div class='ctx'> </div><div class='ctx'> #define BTRFS_MAX_DEDUPE_LEN	SZ_16M</div><div class='ctx'> </div><div class='hunk'>@@ -16,14 +24,14 @@ static int clone_finish_inode_update(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				     u64 endoff,</div><div class='ctx'> 				     const u64 destoff,</div><div class='ctx'> 				     const u64 olen,</div><div class='del'>-				     int no_time_update)</div><div class='add'>+				     bool no_time_update)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	inode_inc_iversion(inode);</div><div class='del'>-	if (!no_time_update)</div><div class='del'>-		inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	if (!no_time_update) {</div><div class='add'>+		inode_set_mtime_to_ts(inode, inode_set_ctime_current(inode));</div><div class='add'>+	}</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We round up to the block size at eof when determining which</div><div class='ctx'> 	 * extents to clone above, but shouldn't round up the file size.</div><div class='hunk'>@@ -35,15 +43,13 @@ static int clone_finish_inode_update(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		btrfs_inode_safe_disk_i_size_write(BTRFS_I(inode), 0);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_update_inode(trans, root, BTRFS_I(inode));</div><div class='del'>-	if (ret) {</div><div class='add'>+	ret = btrfs_update_inode(trans, BTRFS_I(inode));</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		btrfs_end_transaction(trans);</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='del'>-	ret = btrfs_end_transaction(trans);</div><div class='del'>-out:</div><div class='del'>-	return ret;</div><div class='add'>+	return btrfs_end_transaction(trans);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int copy_inline_to_page(struct btrfs_inode *inode,</div><div class='hunk'>@@ -59,7 +65,7 @@ static int copy_inline_to_page(struct btrfs_inode *inode,</div><div class='ctx'> 	const size_t inline_size = size - btrfs_file_extent_calc_inline_size(0);</div><div class='ctx'> 	char *data_start = inline_data + btrfs_file_extent_calc_inline_size(0);</div><div class='ctx'> 	struct extent_changeset *data_reserved = NULL;</div><div class='del'>-	struct page *page = NULL;</div><div class='add'>+	struct folio *folio = NULL;</div><div class='ctx'> 	struct address_space *mapping = inode-&gt;vfs_inode.i_mapping;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -76,20 +82,20 @@ static int copy_inline_to_page(struct btrfs_inode *inode,</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	page = find_or_create_page(mapping, file_offset &gt;&gt; PAGE_SHIFT,</div><div class='del'>-				   btrfs_alloc_write_mask(mapping));</div><div class='del'>-	if (!page) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='add'>+	folio = __filemap_get_folio(mapping, file_offset &gt;&gt; PAGE_SHIFT,</div><div class='add'>+					FGP_LOCK | FGP_ACCESSED | FGP_CREAT,</div><div class='add'>+					btrfs_alloc_write_mask(mapping));</div><div class='add'>+	if (IS_ERR(folio)) {</div><div class='add'>+		ret = PTR_ERR(folio);</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = set_page_extent_mapped(page);</div><div class='add'>+	ret = set_folio_extent_mapped(folio);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='del'>-	clear_extent_bit(&amp;inode-&gt;io_tree, file_offset, range_end,</div><div class='del'>-			 EXTENT_DELALLOC | EXTENT_DO_ACCOUNTING | EXTENT_DEFRAG,</div><div class='del'>-			 0, 0, NULL);</div><div class='add'>+	btrfs_clear_extent_bit(&amp;inode-&gt;io_tree, file_offset, range_end,</div><div class='add'>+			       EXTENT_DELALLOC | EXTENT_DO_ACCOUNTING | EXTENT_DEFRAG, NULL);</div><div class='ctx'> 	ret = btrfs_set_extent_delalloc(inode, file_offset, range_end, 0, NULL);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out_unlock;</div><div class='hunk'>@@ -108,16 +114,15 @@ static int copy_inline_to_page(struct btrfs_inode *inode,</div><div class='ctx'> 	set_bit(BTRFS_INODE_NO_DELALLOC_FLUSH, &amp;inode-&gt;runtime_flags);</div><div class='ctx'> </div><div class='ctx'> 	if (comp_type == BTRFS_COMPRESS_NONE) {</div><div class='del'>-		memcpy_to_page(page, offset_in_page(file_offset), data_start,</div><div class='del'>-			       datal);</div><div class='del'>-		flush_dcache_page(page);</div><div class='add'>+		memcpy_to_folio(folio, offset_in_folio(folio, file_offset), data_start,</div><div class='add'>+					datal);</div><div class='ctx'> 	} else {</div><div class='del'>-		ret = btrfs_decompress(comp_type, data_start, page,</div><div class='del'>-				       offset_in_page(file_offset),</div><div class='add'>+		ret = btrfs_decompress(comp_type, data_start, folio,</div><div class='add'>+				       offset_in_folio(folio, file_offset),</div><div class='ctx'> 				       inline_size, datal);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto out_unlock;</div><div class='del'>-		flush_dcache_page(page);</div><div class='add'>+		flush_dcache_folio(folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -132,18 +137,16 @@ static int copy_inline_to_page(struct btrfs_inode *inode,</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * So what's in the range [500, 4095] corresponds to zeroes.</div><div class='ctx'> 	 */</div><div class='del'>-	if (datal &lt; block_size) {</div><div class='del'>-		memzero_page(page, datal, block_size - datal);</div><div class='del'>-		flush_dcache_page(page);</div><div class='del'>-	}</div><div class='add'>+	if (datal &lt; block_size)</div><div class='add'>+		folio_zero_range(folio, datal, block_size - datal);</div><div class='ctx'> </div><div class='del'>-	btrfs_page_set_uptodate(fs_info, page, file_offset, block_size);</div><div class='del'>-	btrfs_page_clear_checked(fs_info, page, file_offset, block_size);</div><div class='del'>-	btrfs_page_set_dirty(fs_info, page, file_offset, block_size);</div><div class='add'>+	btrfs_folio_set_uptodate(fs_info, folio, file_offset, block_size);</div><div class='add'>+	btrfs_folio_clear_checked(fs_info, folio, file_offset, block_size);</div><div class='add'>+	btrfs_folio_set_dirty(fs_info, folio, file_offset, block_size);</div><div class='ctx'> out_unlock:</div><div class='del'>-	if (page) {</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		put_page(page);</div><div class='add'>+	if (!IS_ERR(folio)) {</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		btrfs_delalloc_release_space(inode, data_reserved, file_offset,</div><div class='hunk'>@@ -160,7 +163,7 @@ out:</div><div class='ctx'>  * the source inode to destination inode when possible. When not possible we</div><div class='ctx'>  * copy the inline extent's data into the respective page of the inode.</div><div class='ctx'>  */</div><div class='del'>-static int clone_copy_inline_extent(struct inode *dst,</div><div class='add'>+static int clone_copy_inline_extent(struct btrfs_inode *inode,</div><div class='ctx'> 				    struct btrfs_path *path,</div><div class='ctx'> 				    struct btrfs_key *new_key,</div><div class='ctx'> 				    const u64 drop_start,</div><div class='hunk'>@@ -170,8 +173,8 @@ static int clone_copy_inline_extent(struct inode *dst,</div><div class='ctx'> 				    char *inline_data,</div><div class='ctx'> 				    struct btrfs_trans_handle **trans_out)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(dst-&gt;i_sb);</div><div class='del'>-	struct btrfs_root *root = BTRFS_I(dst)-&gt;root;</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	const u64 aligned_end = ALIGN(new_key-&gt;offset + datal,</div><div class='ctx'> 				      fs_info-&gt;sectorsize);</div><div class='ctx'> 	struct btrfs_trans_handle *trans = NULL;</div><div class='hunk'>@@ -180,12 +183,12 @@ static int clone_copy_inline_extent(struct inode *dst,</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> </div><div class='ctx'> 	if (new_key-&gt;offset &gt; 0) {</div><div class='del'>-		ret = copy_inline_to_page(BTRFS_I(dst), new_key-&gt;offset,</div><div class='add'>+		ret = copy_inline_to_page(inode, new_key-&gt;offset,</div><div class='ctx'> 					  inline_data, size, datal, comp_type);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	key.objectid = btrfs_ino(BTRFS_I(dst));</div><div class='add'>+	key.objectid = btrfs_ino(inode);</div><div class='ctx'> 	key.type = BTRFS_EXTENT_DATA_KEY;</div><div class='ctx'> 	key.offset = 0;</div><div class='ctx'> 	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='hunk'>@@ -200,7 +203,7 @@ static int clone_copy_inline_extent(struct inode *dst,</div><div class='ctx'> 				goto copy_inline_extent;</div><div class='ctx'> 		}</div><div class='ctx'> 		btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, path-&gt;slots[0]);</div><div class='del'>-		if (key.objectid == btrfs_ino(BTRFS_I(dst)) &amp;&amp;</div><div class='add'>+		if (key.objectid == btrfs_ino(inode) &amp;&amp;</div><div class='ctx'> 		    key.type == BTRFS_EXTENT_DATA_KEY) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * There's an implicit hole at file offset 0, copy the</div><div class='hunk'>@@ -209,7 +212,7 @@ static int clone_copy_inline_extent(struct inode *dst,</div><div class='ctx'> 			ASSERT(key.offset &gt; 0);</div><div class='ctx'> 			goto copy_to_page;</div><div class='ctx'> 		}</div><div class='del'>-	} else if (i_size_read(dst) &lt;= datal) {</div><div class='add'>+	} else if (i_size_read(&amp;inode-&gt;vfs_inode) &lt;= datal) {</div><div class='ctx'> 		struct btrfs_file_extent_item *ei;</div><div class='ctx'> </div><div class='ctx'> 		ei = btrfs_item_ptr(path-&gt;nodes[0], path-&gt;slots[0],</div><div class='hunk'>@@ -231,7 +234,7 @@ copy_inline_extent:</div><div class='ctx'> 	 * We have no extent items, or we have an extent at offset 0 which may</div><div class='ctx'> 	 * or may not be inlined. All these cases are dealt the same way.</div><div class='ctx'> 	 */</div><div class='del'>-	if (i_size_read(dst) &gt; datal) {</div><div class='add'>+	if (i_size_read(&amp;inode-&gt;vfs_inode) &gt; datal) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * At the destination offset 0 we have either a hole, a regular</div><div class='ctx'> 		 * extent or an inline extent larger then the one we want to</div><div class='hunk'>@@ -265,20 +268,26 @@ copy_inline_extent:</div><div class='ctx'> 	drop_args.start = drop_start;</div><div class='ctx'> 	drop_args.end = aligned_end;</div><div class='ctx'> 	drop_args.drop_cache = true;</div><div class='del'>-	ret = btrfs_drop_extents(trans, root, BTRFS_I(dst), &amp;drop_args);</div><div class='del'>-	if (ret)</div><div class='add'>+	ret = btrfs_drop_extents(trans, root, inode, &amp;drop_args);</div><div class='add'>+	if (unlikely(ret)) {</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='add'>+	}</div><div class='ctx'> 	ret = btrfs_insert_empty_item(trans, root, path, new_key, size);</div><div class='del'>-	if (ret)</div><div class='add'>+	if (unlikely(ret)) {</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	write_extent_buffer(path-&gt;nodes[0], inline_data,</div><div class='ctx'> 			    btrfs_item_ptr_offset(path-&gt;nodes[0],</div><div class='ctx'> 						  path-&gt;slots[0]),</div><div class='ctx'> 			    size);</div><div class='del'>-	btrfs_update_inode_bytes(BTRFS_I(dst), datal, drop_args.bytes_found);</div><div class='del'>-	set_bit(BTRFS_INODE_NEEDS_FULL_SYNC, &amp;BTRFS_I(dst)-&gt;runtime_flags);</div><div class='del'>-	ret = btrfs_inode_set_file_extent_range(BTRFS_I(dst), 0, aligned_end);</div><div class='add'>+	btrfs_update_inode_bytes(inode, datal, drop_args.bytes_found);</div><div class='add'>+	btrfs_set_inode_full_sync(inode);</div><div class='add'>+	ret = btrfs_inode_set_file_extent_range(inode, 0, aligned_end);</div><div class='add'>+	if (unlikely(ret))</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> out:</div><div class='ctx'> 	if (!ret &amp;&amp; !trans) {</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -293,10 +302,8 @@ out:</div><div class='ctx'> 			trans = NULL;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	if (ret &amp;&amp; trans) {</div><div class='del'>-		btrfs_abort_transaction(trans, ret);</div><div class='add'>+	if (ret &amp;&amp; trans)</div><div class='ctx'> 		btrfs_end_transaction(trans);</div><div class='del'>-	}</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		*trans_out = trans;</div><div class='ctx'> </div><div class='hunk'>@@ -313,37 +320,38 @@ copy_to_page:</div><div class='ctx'> 	 */</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='del'>-	ret = copy_inline_to_page(BTRFS_I(dst), new_key-&gt;offset,</div><div class='add'>+	ret = copy_inline_to_page(inode, new_key-&gt;offset,</div><div class='ctx'> 				  inline_data, size, datal, comp_type);</div><div class='ctx'> 	goto out;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * btrfs_clone() - clone a range from inode file to another</div><div class='add'>+/*</div><div class='add'>+ * Clone a range from inode file to another.</div><div class='ctx'>  *</div><div class='del'>- * @src: Inode to clone from</div><div class='del'>- * @inode: Inode to clone to</div><div class='del'>- * @off: Offset within source to start clone from</div><div class='del'>- * @olen: Original length, passed by user, of range to clone</div><div class='del'>- * @olen_aligned: Block-aligned value of olen</div><div class='del'>- * @destoff: Offset within @inode to start clone</div><div class='del'>- * @no_time_update: Whether to update mtime/ctime on the target inode</div><div class='add'>+ * @src:             Inode to clone from</div><div class='add'>+ * @inode:           Inode to clone to</div><div class='add'>+ * @off:             Offset within source to start clone from</div><div class='add'>+ * @olen:            Original length, passed by user, of range to clone</div><div class='add'>+ * @olen_aligned:    Block-aligned value of olen</div><div class='add'>+ * @destoff:         Offset within @inode to start clone</div><div class='add'>+ * @no_time_update:  Whether to update mtime/ctime on the target inode</div><div class='ctx'>  */</div><div class='ctx'> static int btrfs_clone(struct inode *src, struct inode *inode,</div><div class='ctx'> 		       const u64 off, const u64 olen, const u64 olen_aligned,</div><div class='del'>-		       const u64 destoff, int no_time_update)</div><div class='add'>+		       const u64 destoff, bool no_time_update)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	struct btrfs_path *path = NULL;</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='del'>-	char *buf = NULL;</div><div class='add'>+	char AUTO_KVFREE(buf);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	u32 nritems;</div><div class='ctx'> 	int slot;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	const u64 len = olen_aligned;</div><div class='ctx'> 	u64 last_dest_end = destoff;</div><div class='add'>+	u64 prev_extent_end = off;</div><div class='ctx'> </div><div class='ctx'> 	ret = -ENOMEM;</div><div class='ctx'> 	buf = kvmalloc(fs_info-&gt;nodesize, GFP_KERNEL);</div><div class='hunk'>@@ -351,10 +359,8 @@ static int btrfs_clone(struct inode *src, struct inode *inode,</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='del'>-	if (!path) {</div><div class='del'>-		kvfree(buf);</div><div class='add'>+	if (!path)</div><div class='ctx'> 		return ret;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	path-&gt;reada = READA_FORWARD;</div><div class='ctx'> 	/* Clone data */</div><div class='hunk'>@@ -363,7 +369,6 @@ static int btrfs_clone(struct inode *src, struct inode *inode,</div><div class='ctx'> 	key.offset = off;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='del'>-		u64 next_key_min_offset = key.offset + 1;</div><div class='ctx'> 		struct btrfs_file_extent_item *extent;</div><div class='ctx'> 		u64 extent_gen;</div><div class='ctx'> 		int type;</div><div class='hunk'>@@ -431,15 +436,22 @@ process_slot:</div><div class='ctx'> 		 * The first search might have left us at an extent item that</div><div class='ctx'> 		 * ends before our target range's start, can happen if we have</div><div class='ctx'> 		 * holes and NO_HOLES feature enabled.</div><div class='add'>+		 *</div><div class='add'>+		 * Subsequent searches may leave us on a file range we have</div><div class='add'>+		 * processed before - this happens due to a race with ordered</div><div class='add'>+		 * extent completion for a file range that is outside our source</div><div class='add'>+		 * range, but that range was part of a file extent item that</div><div class='add'>+		 * also covered a leading part of our source range.</div><div class='ctx'> 		 */</div><div class='del'>-		if (key.offset + datal &lt;= off) {</div><div class='add'>+		if (key.offset + datal &lt;= prev_extent_end) {</div><div class='ctx'> 			path-&gt;slots[0]++;</div><div class='ctx'> 			goto process_slot;</div><div class='ctx'> 		} else if (key.offset &gt;= off + len) {</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-		next_key_min_offset = key.offset + datal;</div><div class='del'>-		size = btrfs_item_size_nr(leaf, slot);</div><div class='add'>+</div><div class='add'>+		prev_extent_end = key.offset + datal;</div><div class='add'>+		size = btrfs_item_size(leaf, slot);</div><div class='ctx'> 		read_extent_buffer(leaf, buf, btrfs_item_ptr_offset(leaf, slot),</div><div class='ctx'> 				   size);</div><div class='ctx'> </div><div class='hunk'>@@ -489,12 +501,14 @@ process_slot:</div><div class='ctx'> 			clone_info.file_offset = new_key.offset;</div><div class='ctx'> 			clone_info.extent_buf = buf;</div><div class='ctx'> 			clone_info.is_new_extent = false;</div><div class='add'>+			clone_info.update_times = !no_time_update;</div><div class='ctx'> 			ret = btrfs_replace_file_extents(BTRFS_I(inode), path,</div><div class='ctx'> 					drop_start, new_key.offset + datal - 1,</div><div class='ctx'> 					&amp;clone_info, &amp;trans);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				goto out;</div><div class='del'>-		} else if (type == BTRFS_FILE_EXTENT_INLINE) {</div><div class='add'>+		} else {</div><div class='add'>+			ASSERT(type == BTRFS_FILE_EXTENT_INLINE);</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Inline extents always have to start at file offset 0</div><div class='ctx'> 			 * and can never be bigger then the sector size. We can</div><div class='hunk'>@@ -505,10 +519,14 @@ process_slot:</div><div class='ctx'> 			 */</div><div class='ctx'> 			ASSERT(key.offset == 0);</div><div class='ctx'> 			ASSERT(datal &lt;= fs_info-&gt;sectorsize);</div><div class='del'>-			if (key.offset != 0 || datal &gt; fs_info-&gt;sectorsize)</div><div class='del'>-				return -EUCLEAN;</div><div class='add'>+			if (WARN_ON(type != BTRFS_FILE_EXTENT_INLINE) ||</div><div class='add'>+			    WARN_ON(key.offset != 0) ||</div><div class='add'>+			    WARN_ON(datal &gt; fs_info-&gt;sectorsize)) {</div><div class='add'>+				ret = -EUCLEAN;</div><div class='add'>+				goto out;</div><div class='add'>+			}</div><div class='ctx'> </div><div class='del'>-			ret = clone_copy_inline_extent(inode, path, &amp;new_key,</div><div class='add'>+			ret = clone_copy_inline_extent(BTRFS_I(inode), path, &amp;new_key,</div><div class='ctx'> 						       drop_start, datal, size,</div><div class='ctx'> 						       comp, buf, &amp;trans);</div><div class='ctx'> 			if (ret)</div><div class='hunk'>@@ -518,17 +536,22 @@ process_slot:</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * If this is a new extent update the last_reflink_trans of both</div><div class='del'>-		 * inodes. This is used by fsync to make sure it does not log</div><div class='del'>-		 * multiple checksum items with overlapping ranges. For older</div><div class='del'>-		 * extents we don't need to do it since inode logging skips the</div><div class='del'>-		 * checksums for older extents. Also ignore holes and inline</div><div class='del'>-		 * extents because they don't have checksums in the csum tree.</div><div class='add'>+		 * Whenever we share an extent we update the last_reflink_trans</div><div class='add'>+		 * of each inode to the current transaction. This is needed to</div><div class='add'>+		 * make sure fsync does not log multiple checksum items with</div><div class='add'>+		 * overlapping ranges (because some extent items might refer</div><div class='add'>+		 * only to sections of the original extent). For the destination</div><div class='add'>+		 * inode we do this regardless of the generation of the extents</div><div class='add'>+		 * or even if they are inline extents or explicit holes, to make</div><div class='add'>+		 * sure a full fsync does not skip them. For the source inode,</div><div class='add'>+		 * we only need to update last_reflink_trans in case it's a new</div><div class='add'>+		 * extent that is not a hole or an inline extent, to deal with</div><div class='add'>+		 * the checksums problem on fsync.</div><div class='ctx'> 		 */</div><div class='del'>-		if (extent_gen == trans-&gt;transid &amp;&amp; disko &gt; 0) {</div><div class='add'>+		if (extent_gen == trans-&gt;transid &amp;&amp; disko &gt; 0)</div><div class='ctx'> 			BTRFS_I(src)-&gt;last_reflink_trans = trans-&gt;transid;</div><div class='del'>-			BTRFS_I(inode)-&gt;last_reflink_trans = trans-&gt;transid;</div><div class='del'>-		}</div><div class='add'>+</div><div class='add'>+		BTRFS_I(inode)-&gt;last_reflink_trans = trans-&gt;transid;</div><div class='ctx'> </div><div class='ctx'> 		last_dest_end = ALIGN(new_key.offset + datal,</div><div class='ctx'> 				      fs_info-&gt;sectorsize);</div><div class='hunk'>@@ -540,7 +563,7 @@ process_slot:</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='ctx'> 		btrfs_release_path(path);</div><div class='del'>-		key.offset = next_key_min_offset;</div><div class='add'>+		key.offset = prev_extent_end;</div><div class='ctx'> </div><div class='ctx'> 		if (fatal_signal_pending(current)) {</div><div class='ctx'> 			ret = -EINTR;</div><div class='hunk'>@@ -575,8 +598,7 @@ process_slot:</div><div class='ctx'> 		 * replaced file extent items.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (last_dest_end &gt;= i_size_read(inode))</div><div class='del'>-			set_bit(BTRFS_INODE_NEEDS_FULL_SYNC,</div><div class='del'>-				&amp;BTRFS_I(inode)-&gt;runtime_flags);</div><div class='add'>+			btrfs_set_inode_full_sync(BTRFS_I(inode));</div><div class='ctx'> </div><div class='ctx'> 		ret = btrfs_replace_file_extents(BTRFS_I(inode), path,</div><div class='ctx'> 				last_dest_end, destoff + len - 1, NULL, &amp;trans);</div><div class='hunk'>@@ -588,60 +610,46 @@ process_slot:</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	kvfree(buf);</div><div class='ctx'> 	clear_bit(BTRFS_INODE_NO_DELALLOC_FLUSH, &amp;BTRFS_I(inode)-&gt;runtime_flags);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void btrfs_double_extent_unlock(struct inode *inode1, u64 loff1,</div><div class='del'>-				       struct inode *inode2, u64 loff2, u64 len)</div><div class='del'>-{</div><div class='del'>-	unlock_extent(&amp;BTRFS_I(inode1)-&gt;io_tree, loff1, loff1 + len - 1);</div><div class='del'>-	unlock_extent(&amp;BTRFS_I(inode2)-&gt;io_tree, loff2, loff2 + len - 1);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfs_double_extent_lock(struct inode *inode1, u64 loff1,</div><div class='del'>-				     struct inode *inode2, u64 loff2, u64 len)</div><div class='del'>-{</div><div class='del'>-	if (inode1 &lt; inode2) {</div><div class='del'>-		swap(inode1, inode2);</div><div class='del'>-		swap(loff1, loff2);</div><div class='del'>-	} else if (inode1 == inode2 &amp;&amp; loff2 &lt; loff1) {</div><div class='del'>-		swap(loff1, loff2);</div><div class='del'>-	}</div><div class='del'>-	lock_extent(&amp;BTRFS_I(inode1)-&gt;io_tree, loff1, loff1 + len - 1);</div><div class='del'>-	lock_extent(&amp;BTRFS_I(inode2)-&gt;io_tree, loff2, loff2 + len - 1);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfs_double_mmap_lock(struct inode *inode1, struct inode *inode2)</div><div class='add'>+static void btrfs_double_mmap_lock(struct btrfs_inode *inode1, struct btrfs_inode *inode2)</div><div class='ctx'> {</div><div class='ctx'> 	if (inode1 &lt; inode2)</div><div class='ctx'> 		swap(inode1, inode2);</div><div class='del'>-	down_write(&amp;BTRFS_I(inode1)-&gt;i_mmap_lock);</div><div class='del'>-	down_write_nested(&amp;BTRFS_I(inode2)-&gt;i_mmap_lock, SINGLE_DEPTH_NESTING);</div><div class='add'>+	down_write(&amp;inode1-&gt;i_mmap_lock);</div><div class='add'>+	down_write_nested(&amp;inode2-&gt;i_mmap_lock, SINGLE_DEPTH_NESTING);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void btrfs_double_mmap_unlock(struct inode *inode1, struct inode *inode2)</div><div class='add'>+static void btrfs_double_mmap_unlock(struct btrfs_inode *inode1, struct btrfs_inode *inode2)</div><div class='ctx'> {</div><div class='del'>-	up_write(&amp;BTRFS_I(inode1)-&gt;i_mmap_lock);</div><div class='del'>-	up_write(&amp;BTRFS_I(inode2)-&gt;i_mmap_lock);</div><div class='add'>+	up_write(&amp;inode1-&gt;i_mmap_lock);</div><div class='add'>+	up_write(&amp;inode2-&gt;i_mmap_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btrfs_extent_same_range(struct inode *src, u64 loff, u64 len,</div><div class='del'>-				   struct inode *dst, u64 dst_loff)</div><div class='add'>+static int btrfs_extent_same_range(struct btrfs_inode *src, u64 loff, u64 len,</div><div class='add'>+				   struct btrfs_inode *dst, u64 dst_loff)</div><div class='ctx'> {</div><div class='del'>-	const u64 bs = BTRFS_I(src)-&gt;root-&gt;fs_info-&gt;sb-&gt;s_blocksize;</div><div class='add'>+	const u64 end = dst_loff + len - 1;</div><div class='add'>+	struct extent_state *cached_state = NULL;</div><div class='add'>+	struct btrfs_fs_info *fs_info = src-&gt;root-&gt;fs_info;</div><div class='add'>+	const u64 bs = fs_info-&gt;sectorsize;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Lock destination range to serialize with concurrent readpages() and</div><div class='del'>-	 * source range to serialize with relocation.</div><div class='add'>+	 * Lock destination range to serialize with concurrent readahead(), and</div><div class='add'>+	 * we are safe from concurrency with relocation of source extents</div><div class='add'>+	 * because we have already locked the inode's i_mmap_lock in exclusive</div><div class='add'>+	 * mode.</div><div class='ctx'> 	 */</div><div class='del'>-	btrfs_double_extent_lock(src, loff, dst, dst_loff, len);</div><div class='del'>-	ret = btrfs_clone(src, dst, loff, len, ALIGN(len, bs), dst_loff, 1);</div><div class='del'>-	btrfs_double_extent_unlock(src, loff, dst, dst_loff, len);</div><div class='add'>+	btrfs_lock_extent(&amp;dst-&gt;io_tree, dst_loff, end, &amp;cached_state);</div><div class='add'>+	ret = btrfs_clone(&amp;src-&gt;vfs_inode, &amp;dst-&gt;vfs_inode, loff, len,</div><div class='add'>+			  ALIGN(len, bs), dst_loff, 1);</div><div class='add'>+	btrfs_unlock_extent(&amp;dst-&gt;io_tree, dst_loff, end, &amp;cached_state);</div><div class='add'>+</div><div class='add'>+	btrfs_btree_balance_dirty(fs_info);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -657,7 +665,7 @@ static int btrfs_extent_same(struct inode *src, u64 loff, u64 olen,</div><div class='ctx'> 	if (root_dst-&gt;send_in_progress) {</div><div class='ctx'> 		btrfs_warn_rl(root_dst-&gt;fs_info,</div><div class='ctx'> "cannot deduplicate to root %llu while send operations are using it (%d in progress)",</div><div class='del'>-			      root_dst-&gt;root_key.objectid,</div><div class='add'>+			      btrfs_root_id(root_dst),</div><div class='ctx'> 			      root_dst-&gt;send_in_progress);</div><div class='ctx'> 		spin_unlock(&amp;root_dst-&gt;root_item_lock);</div><div class='ctx'> 		return -EAGAIN;</div><div class='hunk'>@@ -669,8 +677,8 @@ static int btrfs_extent_same(struct inode *src, u64 loff, u64 olen,</div><div class='ctx'> 	chunk_count = div_u64(olen, BTRFS_MAX_DEDUPE_LEN);</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; chunk_count; i++) {</div><div class='del'>-		ret = btrfs_extent_same_range(src, loff, BTRFS_MAX_DEDUPE_LEN,</div><div class='del'>-					      dst, dst_loff);</div><div class='add'>+		ret = btrfs_extent_same_range(BTRFS_I(src), loff, BTRFS_MAX_DEDUPE_LEN,</div><div class='add'>+					      BTRFS_I(dst), dst_loff);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -679,7 +687,8 @@ static int btrfs_extent_same(struct inode *src, u64 loff, u64 olen,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (tail_len &gt; 0)</div><div class='del'>-		ret = btrfs_extent_same_range(src, loff, tail_len, dst, dst_loff);</div><div class='add'>+		ret = btrfs_extent_same_range(BTRFS_I(src), loff, tail_len,</div><div class='add'>+					      BTRFS_I(dst), dst_loff);</div><div class='ctx'> out:</div><div class='ctx'> 	spin_lock(&amp;root_dst-&gt;root_item_lock);</div><div class='ctx'> 	root_dst-&gt;dedupe_in_progress--;</div><div class='hunk'>@@ -691,13 +700,15 @@ out:</div><div class='ctx'> static noinline int btrfs_clone_files(struct file *file, struct file *file_src,</div><div class='ctx'> 					u64 off, u64 olen, u64 destoff)</div><div class='ctx'> {</div><div class='add'>+	struct extent_state *cached_state = NULL;</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='ctx'> 	struct inode *src = file_inode(file_src);</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int wb_ret;</div><div class='ctx'> 	u64 len = olen;</div><div class='del'>-	u64 bs = fs_info-&gt;sb-&gt;s_blocksize;</div><div class='add'>+	u64 bs = fs_info-&gt;sectorsize;</div><div class='add'>+	u64 end;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * VFS's generic_remap_file_range_prep() protects us from cloning the</div><div class='hunk'>@@ -723,26 +734,29 @@ static noinline int btrfs_clone_files(struct file *file, struct file *file_src,</div><div class='ctx'> 		 * we found the previous extent covering eof and before we</div><div class='ctx'> 		 * attempted to increment its reference count).</div><div class='ctx'> 		 */</div><div class='del'>-		ret = btrfs_wait_ordered_range(inode, wb_start,</div><div class='add'>+		ret = btrfs_wait_ordered_range(BTRFS_I(inode), wb_start,</div><div class='ctx'> 					       destoff - wb_start);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Lock destination range to serialize with concurrent readpages() and</div><div class='del'>-	 * source range to serialize with relocation.</div><div class='add'>+	 * Lock destination range to serialize with concurrent readahead(), and</div><div class='add'>+	 * we are safe from concurrency with relocation of source extents</div><div class='add'>+	 * because we have already locked the inode's i_mmap_lock in exclusive</div><div class='add'>+	 * mode.</div><div class='ctx'> 	 */</div><div class='del'>-	btrfs_double_extent_lock(src, off, inode, destoff, len);</div><div class='add'>+	end = destoff + len - 1;</div><div class='add'>+	btrfs_lock_extent(&amp;BTRFS_I(inode)-&gt;io_tree, destoff, end, &amp;cached_state);</div><div class='ctx'> 	ret = btrfs_clone(src, inode, off, olen, len, destoff, 0);</div><div class='del'>-	btrfs_double_extent_unlock(src, off, inode, destoff, len);</div><div class='add'>+	btrfs_unlock_extent(&amp;BTRFS_I(inode)-&gt;io_tree, destoff, end, &amp;cached_state);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We may have copied an inline extent into a page of the destination</div><div class='ctx'> 	 * range, so wait for writeback to complete before truncating pages</div><div class='ctx'> 	 * from the page cache. This is a rare case.</div><div class='ctx'> 	 */</div><div class='del'>-	wb_ret = btrfs_wait_ordered_range(inode, destoff, len);</div><div class='add'>+	wb_ret = btrfs_wait_ordered_range(BTRFS_I(inode), destoff, len);</div><div class='ctx'> 	ret = ret ? ret : wb_ret;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Truncate page cache pages so that future reads will see the cloned</div><div class='hunk'>@@ -752,6 +766,8 @@ static noinline int btrfs_clone_files(struct file *file, struct file *file_src,</div><div class='ctx'> 				round_down(destoff, PAGE_SIZE),</div><div class='ctx'> 				round_up(destoff + len, PAGE_SIZE) - 1);</div><div class='ctx'> </div><div class='add'>+	btrfs_btree_balance_dirty(fs_info);</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -759,27 +775,28 @@ static int btrfs_remap_file_range_prep(struct file *file_in, loff_t pos_in,</div><div class='ctx'> 				       struct file *file_out, loff_t pos_out,</div><div class='ctx'> 				       loff_t *len, unsigned int remap_flags)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode_in = file_inode(file_in);</div><div class='del'>-	struct inode *inode_out = file_inode(file_out);</div><div class='del'>-	u64 bs = BTRFS_I(inode_out)-&gt;root-&gt;fs_info-&gt;sb-&gt;s_blocksize;</div><div class='del'>-	bool same_inode = inode_out == inode_in;</div><div class='add'>+	struct btrfs_inode *inode_in = BTRFS_I(file_inode(file_in));</div><div class='add'>+	struct btrfs_inode *inode_out = BTRFS_I(file_inode(file_out));</div><div class='add'>+	u64 bs = inode_out-&gt;root-&gt;fs_info-&gt;sectorsize;</div><div class='ctx'> 	u64 wb_len;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!(remap_flags &amp; REMAP_FILE_DEDUP)) {</div><div class='del'>-		struct btrfs_root *root_out = BTRFS_I(inode_out)-&gt;root;</div><div class='add'>+		struct btrfs_root *root_out = inode_out-&gt;root;</div><div class='ctx'> </div><div class='ctx'> 		if (btrfs_root_readonly(root_out))</div><div class='ctx'> 			return -EROFS;</div><div class='ctx'> </div><div class='del'>-		if (file_in-&gt;f_path.mnt != file_out-&gt;f_path.mnt ||</div><div class='del'>-		    inode_in-&gt;i_sb != inode_out-&gt;i_sb)</div><div class='del'>-			return -EXDEV;</div><div class='add'>+		ASSERT(inode_in-&gt;vfs_inode.i_sb == inode_out-&gt;vfs_inode.i_sb);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/* Can only reflink encrypted files if both files are encrypted. */</div><div class='add'>+	if (IS_ENCRYPTED(&amp;inode_in-&gt;vfs_inode) != IS_ENCRYPTED(&amp;inode_out-&gt;vfs_inode))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='ctx'> 	/* Don't make the dst file partly checksummed */</div><div class='del'>-	if ((BTRFS_I(inode_in)-&gt;flags &amp; BTRFS_INODE_NODATASUM) !=</div><div class='del'>-	    (BTRFS_I(inode_out)-&gt;flags &amp; BTRFS_INODE_NODATASUM)) {</div><div class='add'>+	if ((inode_in-&gt;flags &amp; BTRFS_INODE_NODATASUM) !=</div><div class='add'>+	    (inode_out-&gt;flags &amp; BTRFS_INODE_NODATASUM)) {</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -798,20 +815,11 @@ static int btrfs_remap_file_range_prep(struct file *file_in, loff_t pos_in,</div><div class='ctx'> 	 *    to complete so that new file extent items are in the fs tree.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (*len == 0 &amp;&amp; !(remap_flags &amp; REMAP_FILE_DEDUP))</div><div class='del'>-		wb_len = ALIGN(inode_in-&gt;i_size, bs) - ALIGN_DOWN(pos_in, bs);</div><div class='add'>+		wb_len = ALIGN(inode_in-&gt;vfs_inode.i_size, bs) - ALIGN_DOWN(pos_in, bs);</div><div class='ctx'> 	else</div><div class='ctx'> 		wb_len = ALIGN(*len, bs);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Since we don't lock ranges, wait for ongoing lockless dio writes (as</div><div class='del'>-	 * any in progress could create its ordered extents after we wait for</div><div class='del'>-	 * existing ordered extents below).</div><div class='del'>-	 */</div><div class='del'>-	inode_dio_wait(inode_in);</div><div class='del'>-	if (!same_inode)</div><div class='del'>-		inode_dio_wait(inode_out);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='ctx'> 	 * Workaround to make sure NOCOW buffered write reach disk as NOCOW.</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * Btrfs' back references do not have a block level granularity, they</div><div class='hunk'>@@ -828,16 +836,14 @@ static int btrfs_remap_file_range_prep(struct file *file_in, loff_t pos_in,</div><div class='ctx'> 	 * Also we don't need to check ASYNC_EXTENT, as async extent will be</div><div class='ctx'> 	 * CoWed anyway, not affecting nocow part.</div><div class='ctx'> 	 */</div><div class='del'>-	ret = filemap_flush(inode_in-&gt;i_mapping);</div><div class='add'>+	ret = filemap_flush(inode_in-&gt;vfs_inode.i_mapping);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_wait_ordered_range(inode_in, ALIGN_DOWN(pos_in, bs),</div><div class='del'>-				       wb_len);</div><div class='add'>+	ret = btrfs_wait_ordered_range(inode_in, ALIGN_DOWN(pos_in, bs), wb_len);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='del'>-	ret = btrfs_wait_ordered_range(inode_out, ALIGN_DOWN(pos_out, bs),</div><div class='del'>-				       wb_len);</div><div class='add'>+	ret = btrfs_wait_ordered_range(inode_out, ALIGN_DOWN(pos_out, bs), wb_len);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='hunk'>@@ -859,18 +865,21 @@ loff_t btrfs_remap_file_range(struct file *src_file, loff_t off,</div><div class='ctx'> 		struct file *dst_file, loff_t destoff, loff_t len,</div><div class='ctx'> 		unsigned int remap_flags)</div><div class='ctx'> {</div><div class='del'>-	struct inode *src_inode = file_inode(src_file);</div><div class='del'>-	struct inode *dst_inode = file_inode(dst_file);</div><div class='add'>+	struct btrfs_inode *src_inode = BTRFS_I(file_inode(src_file));</div><div class='add'>+	struct btrfs_inode *dst_inode = BTRFS_I(file_inode(dst_file));</div><div class='ctx'> 	bool same_inode = dst_inode == src_inode;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='add'>+	if (unlikely(btrfs_is_shutdown(inode_to_fs_info(file_inode(src_file)))))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='ctx'> 	if (remap_flags &amp; ~(REMAP_FILE_DEDUP | REMAP_FILE_ADVISORY))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	if (same_inode) {</div><div class='ctx'> 		btrfs_inode_lock(src_inode, BTRFS_ILOCK_MMAP);</div><div class='ctx'> 	} else {</div><div class='del'>-		lock_two_nondirectories(src_inode, dst_inode);</div><div class='add'>+		lock_two_nondirectories(&amp;src_inode-&gt;vfs_inode, &amp;dst_inode-&gt;vfs_inode);</div><div class='ctx'> 		btrfs_double_mmap_lock(src_inode, dst_inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -880,7 +889,8 @@ loff_t btrfs_remap_file_range(struct file *src_file, loff_t off,</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='ctx'> 	if (remap_flags &amp; REMAP_FILE_DEDUP)</div><div class='del'>-		ret = btrfs_extent_same(src_inode, off, len, dst_inode, destoff);</div><div class='add'>+		ret = btrfs_extent_same(&amp;src_inode-&gt;vfs_inode, off, len,</div><div class='add'>+					&amp;dst_inode-&gt;vfs_inode, destoff);</div><div class='ctx'> 	else</div><div class='ctx'> 		ret = btrfs_clone_files(dst_file, src_file, off, len, destoff);</div><div class='ctx'> </div><div class='hunk'>@@ -889,7 +899,8 @@ out_unlock:</div><div class='ctx'> 		btrfs_inode_unlock(src_inode, BTRFS_ILOCK_MMAP);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		btrfs_double_mmap_unlock(src_inode, dst_inode);</div><div class='del'>-		unlock_two_nondirectories(src_inode, dst_inode);</div><div class='add'>+		unlock_two_nondirectories(&amp;src_inode-&gt;vfs_inode,</div><div class='add'>+					  &amp;dst_inode-&gt;vfs_inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='head'>diff --git a/fs/btrfs/reflink.h b/fs/btrfs/reflink.h<br/>index ecb309b4dad0..1e291f7d85c4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/reflink.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/reflink.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/reflink.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/reflink.h</a></div><div class='hunk'>@@ -3,7 +3,9 @@</div><div class='ctx'> #ifndef BTRFS_REFLINK_H</div><div class='ctx'> #define BTRFS_REFLINK_H</div><div class='ctx'> </div><div class='del'>-#include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+</div><div class='add'>+struct file;</div><div class='ctx'> </div><div class='ctx'> loff_t btrfs_remap_file_range(struct file *file_in, loff_t pos_in,</div><div class='ctx'> 			      struct file *file_out, loff_t pos_out,</div><div class='head'>diff --git a/fs/btrfs/relocation.c b/fs/btrfs/relocation.c<br/>index 33a0ee7ac590..5bfefc3e9c06 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/relocation.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/relocation.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/relocation.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/relocation.c</a></div><div class='hunk'>@@ -26,6 +26,17 @@</div><div class='ctx'> #include "misc.h"</div><div class='ctx'> #include "subpage.h"</div><div class='ctx'> #include "zoned.h"</div><div class='add'>+#include "inode-item.h"</div><div class='add'>+#include "space-info.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "extent-tree.h"</div><div class='add'>+#include "root-tree.h"</div><div class='add'>+#include "file-item.h"</div><div class='add'>+#include "relocation.h"</div><div class='add'>+#include "super.h"</div><div class='add'>+#include "tree-checker.h"</div><div class='add'>+#include "raid-stripe-tree.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Relocation overview</div><div class='hunk'>@@ -79,10 +90,15 @@</div><div class='ctx'>  * map address of tree root to tree</div><div class='ctx'>  */</div><div class='ctx'> struct mapping_node {</div><div class='del'>-	struct {</div><div class='del'>-		struct rb_node rb_node;</div><div class='del'>-		u64 bytenr;</div><div class='del'>-	}; /* Use rb_simle_node for search/insert */</div><div class='add'>+	union {</div><div class='add'>+		/* Use rb_simple_node for search/insert */</div><div class='add'>+		struct {</div><div class='add'>+			struct rb_node rb_node;</div><div class='add'>+			u64 bytenr;</div><div class='add'>+		};</div><div class='add'>+</div><div class='add'>+		struct rb_simple_node simple_node;</div><div class='add'>+	};</div><div class='ctx'> 	void *data;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -95,14 +111,19 @@ struct mapping_tree {</div><div class='ctx'>  * present a tree block to process</div><div class='ctx'>  */</div><div class='ctx'> struct tree_block {</div><div class='del'>-	struct {</div><div class='del'>-		struct rb_node rb_node;</div><div class='del'>-		u64 bytenr;</div><div class='del'>-	}; /* Use rb_simple_node for search/insert */</div><div class='add'>+	union {</div><div class='add'>+		/* Use rb_simple_node for search/insert */</div><div class='add'>+		struct {</div><div class='add'>+			struct rb_node rb_node;</div><div class='add'>+			u64 bytenr;</div><div class='add'>+		};</div><div class='add'>+</div><div class='add'>+		struct rb_simple_node simple_node;</div><div class='add'>+	};</div><div class='ctx'> 	u64 owner;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='del'>-	unsigned int level:8;</div><div class='del'>-	unsigned int key_ready:1;</div><div class='add'>+	u8 level;</div><div class='add'>+	bool key_ready;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> #define MAX_EXTENTS 128</div><div class='hunk'>@@ -112,6 +133,13 @@ struct file_extent_cluster {</div><div class='ctx'> 	u64 end;</div><div class='ctx'> 	u64 boundary[MAX_EXTENTS];</div><div class='ctx'> 	unsigned int nr;</div><div class='add'>+	u64 owning_root;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/* Stages of data relocation. */</div><div class='add'>+enum reloc_stage {</div><div class='add'>+	MOVE_DATA_EXTENTS,</div><div class='add'>+	UPDATE_DATA_PTRS</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct reloc_control {</div><div class='hunk'>@@ -145,16 +173,12 @@ struct reloc_control {</div><div class='ctx'> 	u64 search_start;</div><div class='ctx'> 	u64 extents_found;</div><div class='ctx'> </div><div class='del'>-	unsigned int stage:8;</div><div class='del'>-	unsigned int create_reloc_tree:1;</div><div class='del'>-	unsigned int merge_reloc_tree:1;</div><div class='del'>-	unsigned int found_file_extent:1;</div><div class='add'>+	enum reloc_stage stage;</div><div class='add'>+	bool create_reloc_tree;</div><div class='add'>+	bool merge_reloc_tree;</div><div class='add'>+	bool found_file_extent;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/* stages of data relocation */</div><div class='del'>-#define MOVE_DATA_EXTENTS	0</div><div class='del'>-#define UPDATE_DATA_PTRS	1</div><div class='del'>-</div><div class='ctx'> static void mark_block_processed(struct reloc_control *rc,</div><div class='ctx'> 				 struct btrfs_backref_node *node)</div><div class='ctx'> {</div><div class='hunk'>@@ -164,19 +188,13 @@ static void mark_block_processed(struct reloc_control *rc,</div><div class='ctx'> 	    in_range(node-&gt;bytenr, rc-&gt;block_group-&gt;start,</div><div class='ctx'> 		     rc-&gt;block_group-&gt;length)) {</div><div class='ctx'> 		blocksize = rc-&gt;extent_root-&gt;fs_info-&gt;nodesize;</div><div class='del'>-		set_extent_bits(&amp;rc-&gt;processed_blocks, node-&gt;bytenr,</div><div class='del'>-				node-&gt;bytenr + blocksize - 1, EXTENT_DIRTY);</div><div class='add'>+		btrfs_set_extent_bit(&amp;rc-&gt;processed_blocks, node-&gt;bytenr,</div><div class='add'>+				     node-&gt;bytenr + blocksize - 1, EXTENT_DIRTY,</div><div class='add'>+				     NULL);</div><div class='ctx'> 	}</div><div class='ctx'> 	node-&gt;processed = 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-</div><div class='del'>-static void mapping_tree_init(struct mapping_tree *tree)</div><div class='del'>-{</div><div class='del'>-	tree-&gt;rb_root = RB_ROOT;</div><div class='del'>-	spin_lock_init(&amp;tree-&gt;lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * walk up backref nodes until reach node presents tree root</div><div class='ctx'>  */</div><div class='hunk'>@@ -188,8 +206,8 @@ static struct btrfs_backref_node *walk_up_backref(</div><div class='ctx'> 	int idx = *index;</div><div class='ctx'> </div><div class='ctx'> 	while (!list_empty(&amp;node-&gt;upper)) {</div><div class='del'>-		edge = list_entry(node-&gt;upper.next,</div><div class='del'>-				  struct btrfs_backref_edge, list[LOWER]);</div><div class='add'>+		edge = list_first_entry(&amp;node-&gt;upper, struct btrfs_backref_edge,</div><div class='add'>+					list[LOWER]);</div><div class='ctx'> 		edges[idx++] = edge;</div><div class='ctx'> 		node = edge-&gt;node[UPPER];</div><div class='ctx'> 	}</div><div class='hunk'>@@ -215,8 +233,8 @@ static struct btrfs_backref_node *walk_down_backref(</div><div class='ctx'> 			idx--;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='del'>-		edge = list_entry(edge-&gt;list[LOWER].next,</div><div class='del'>-				  struct btrfs_backref_edge, list[LOWER]);</div><div class='add'>+		edge = list_first_entry(&amp;edge-&gt;list[LOWER], struct btrfs_backref_edge,</div><div class='add'>+					list[LOWER]);</div><div class='ctx'> 		edges[idx - 1] = edge;</div><div class='ctx'> 		*index = idx;</div><div class='ctx'> 		return edge-&gt;node[UPPER];</div><div class='hunk'>@@ -225,71 +243,7 @@ static struct btrfs_backref_node *walk_down_backref(</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void update_backref_node(struct btrfs_backref_cache *cache,</div><div class='del'>-				struct btrfs_backref_node *node, u64 bytenr)</div><div class='del'>-{</div><div class='del'>-	struct rb_node *rb_node;</div><div class='del'>-	rb_erase(&amp;node-&gt;rb_node, &amp;cache-&gt;rb_root);</div><div class='del'>-	node-&gt;bytenr = bytenr;</div><div class='del'>-	rb_node = rb_simple_insert(&amp;cache-&gt;rb_root, node-&gt;bytenr, &amp;node-&gt;rb_node);</div><div class='del'>-	if (rb_node)</div><div class='del'>-		btrfs_backref_panic(cache-&gt;fs_info, bytenr, -EEXIST);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * update backref cache after a transaction commit</div><div class='del'>- */</div><div class='del'>-static int update_backref_cache(struct btrfs_trans_handle *trans,</div><div class='del'>-				struct btrfs_backref_cache *cache)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_backref_node *node;</div><div class='del'>-	int level = 0;</div><div class='del'>-</div><div class='del'>-	if (cache-&gt;last_trans == 0) {</div><div class='del'>-		cache-&gt;last_trans = trans-&gt;transid;</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (cache-&gt;last_trans == trans-&gt;transid)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * detached nodes are used to avoid unnecessary backref</div><div class='del'>-	 * lookup. transaction commit changes the extent tree.</div><div class='del'>-	 * so the detached nodes are no longer useful.</div><div class='del'>-	 */</div><div class='del'>-	while (!list_empty(&amp;cache-&gt;detached)) {</div><div class='del'>-		node = list_entry(cache-&gt;detached.next,</div><div class='del'>-				  struct btrfs_backref_node, list);</div><div class='del'>-		btrfs_backref_cleanup_node(cache, node);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	while (!list_empty(&amp;cache-&gt;changed)) {</div><div class='del'>-		node = list_entry(cache-&gt;changed.next,</div><div class='del'>-				  struct btrfs_backref_node, list);</div><div class='del'>-		list_del_init(&amp;node-&gt;list);</div><div class='del'>-		BUG_ON(node-&gt;pending);</div><div class='del'>-		update_backref_node(cache, node, node-&gt;new_bytenr);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * some nodes can be left in the pending list if there were</div><div class='del'>-	 * errors during processing the pending nodes.</div><div class='del'>-	 */</div><div class='del'>-	for (level = 0; level &lt; BTRFS_MAX_LEVEL; level++) {</div><div class='del'>-		list_for_each_entry(node, &amp;cache-&gt;pending[level], list) {</div><div class='del'>-			BUG_ON(!node-&gt;pending);</div><div class='del'>-			if (node-&gt;bytenr == node-&gt;new_bytenr)</div><div class='del'>-				continue;</div><div class='del'>-			update_backref_node(cache, node, node-&gt;new_bytenr);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	cache-&gt;last_trans = 0;</div><div class='del'>-	return 1;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool reloc_root_is_dead(struct btrfs_root *root)</div><div class='add'>+static bool reloc_root_is_dead(const struct btrfs_root *root)</div><div class='ctx'> {</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Pair with set_bit/clear_bit in clean_dirty_subvols and</div><div class='hunk'>@@ -310,7 +264,7 @@ static bool reloc_root_is_dead(struct btrfs_root *root)</div><div class='ctx'>  * from no reloc root.  But btrfs_should_ignore_reloc_root() below is a</div><div class='ctx'>  * special case.</div><div class='ctx'>  */</div><div class='del'>-static bool have_reloc_root(struct btrfs_root *root)</div><div class='add'>+static bool have_reloc_root(const struct btrfs_root *root)</div><div class='ctx'> {</div><div class='ctx'> 	if (reloc_root_is_dead(root))</div><div class='ctx'> 		return false;</div><div class='hunk'>@@ -319,31 +273,30 @@ static bool have_reloc_root(struct btrfs_root *root)</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_should_ignore_reloc_root(struct btrfs_root *root)</div><div class='add'>+bool btrfs_should_ignore_reloc_root(const struct btrfs_root *root)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *reloc_root;</div><div class='ctx'> </div><div class='ctx'> 	if (!test_bit(BTRFS_ROOT_SHAREABLE, &amp;root-&gt;state))</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	/* This root has been merged with its reloc tree, we can ignore it */</div><div class='ctx'> 	if (reloc_root_is_dead(root))</div><div class='del'>-		return 1;</div><div class='add'>+		return true;</div><div class='ctx'> </div><div class='ctx'> 	reloc_root = root-&gt;reloc_root;</div><div class='ctx'> 	if (!reloc_root)</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	if (btrfs_header_generation(reloc_root-&gt;commit_root) ==</div><div class='ctx'> 	    root-&gt;fs_info-&gt;running_transaction-&gt;transid)</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> 	/*</div><div class='del'>-	 * if there is reloc tree and it was created in previous</div><div class='del'>-	 * transaction backref lookup can find the reloc tree,</div><div class='del'>-	 * so backref node for the fs tree root is useless for</div><div class='del'>-	 * relocation.</div><div class='add'>+	 * If there is reloc tree and it was created in previous transaction</div><div class='add'>+	 * backref lookup can find the reloc tree, so backref node for the fs</div><div class='add'>+	 * tree root is useless for relocation.</div><div class='ctx'> 	 */</div><div class='del'>-	return 1;</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -361,7 +314,7 @@ struct btrfs_root *find_reloc_root(struct btrfs_fs_info *fs_info, u64 bytenr)</div><div class='ctx'> 	rb_node = rb_simple_search(&amp;rc-&gt;reloc_root_tree.rb_root, bytenr);</div><div class='ctx'> 	if (rb_node) {</div><div class='ctx'> 		node = rb_entry(rb_node, struct mapping_node, rb_node);</div><div class='del'>-		root = (struct btrfs_root *)node-&gt;data;</div><div class='add'>+		root = node-&gt;data;</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;rc-&gt;reloc_root_tree.lock);</div><div class='ctx'> 	return btrfs_grab_root(root);</div><div class='hunk'>@@ -400,19 +353,13 @@ static bool handle_useless_nodes(struct reloc_control *rc,</div><div class='ctx'> 		if (cur == node)</div><div class='ctx'> 			ret = true;</div><div class='ctx'> </div><div class='del'>-		/* The node is the lowest node */</div><div class='del'>-		if (cur-&gt;lowest) {</div><div class='del'>-			list_del_init(&amp;cur-&gt;lower);</div><div class='del'>-			cur-&gt;lowest = 0;</div><div class='del'>-		}</div><div class='del'>-</div><div class='ctx'> 		/* Cleanup the lower edges */</div><div class='ctx'> 		while (!list_empty(&amp;cur-&gt;lower)) {</div><div class='ctx'> 			struct btrfs_backref_edge *edge;</div><div class='ctx'> 			struct btrfs_backref_node *lower;</div><div class='ctx'> </div><div class='del'>-			edge = list_entry(cur-&gt;lower.next,</div><div class='del'>-					struct btrfs_backref_edge, list[UPPER]);</div><div class='add'>+			edge = list_first_entry(&amp;cur-&gt;lower, struct btrfs_backref_edge,</div><div class='add'>+						list[UPPER]);</div><div class='ctx'> 			list_del(&amp;edge-&gt;list[UPPER]);</div><div class='ctx'> 			list_del(&amp;edge-&gt;list[LOWER]);</div><div class='ctx'> 			lower = edge-&gt;node[LOWER];</div><div class='hunk'>@@ -431,7 +378,6 @@ static bool handle_useless_nodes(struct reloc_control *rc,</div><div class='ctx'> 		 * cache to avoid unnecessary backref lookup.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (cur-&gt;level &gt; 0) {</div><div class='del'>-			list_add(&amp;cur-&gt;list, &amp;cache-&gt;detached);</div><div class='ctx'> 			cur-&gt;detached = 1;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			rb_erase(&amp;cur-&gt;rb_node, &amp;cache-&gt;rb_root);</div><div class='hunk'>@@ -456,6 +402,7 @@ static bool handle_useless_nodes(struct reloc_control *rc,</div><div class='ctx'>  * cached.</div><div class='ctx'>  */</div><div class='ctx'> static noinline_for_stack struct btrfs_backref_node *build_backref_tree(</div><div class='add'>+			struct btrfs_trans_handle *trans,</div><div class='ctx'> 			struct reloc_control *rc, struct btrfs_key *node_key,</div><div class='ctx'> 			int level, u64 bytenr)</div><div class='ctx'> {</div><div class='hunk'>@@ -467,34 +414,31 @@ static noinline_for_stack struct btrfs_backref_node *build_backref_tree(</div><div class='ctx'> 	struct btrfs_backref_node *node = NULL;</div><div class='ctx'> 	struct btrfs_backref_edge *edge;</div><div class='ctx'> 	int ret;</div><div class='del'>-	int err = 0;</div><div class='ctx'> </div><div class='del'>-	iter = btrfs_backref_iter_alloc(rc-&gt;extent_root-&gt;fs_info, GFP_NOFS);</div><div class='add'>+	iter = btrfs_backref_iter_alloc(rc-&gt;extent_root-&gt;fs_info);</div><div class='ctx'> 	if (!iter)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path) {</div><div class='del'>-		err = -ENOMEM;</div><div class='add'>+		ret = -ENOMEM;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	node = btrfs_backref_alloc_node(cache, bytenr, level);</div><div class='ctx'> 	if (!node) {</div><div class='del'>-		err = -ENOMEM;</div><div class='add'>+		ret = -ENOMEM;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	node-&gt;lowest = 1;</div><div class='ctx'> 	cur = node;</div><div class='ctx'> </div><div class='ctx'> 	/* Breadth-first search to build backref cache */</div><div class='ctx'> 	do {</div><div class='del'>-		ret = btrfs_backref_add_tree_node(cache, path, iter, node_key,</div><div class='del'>-						  cur);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			err = ret;</div><div class='add'>+		ret = btrfs_backref_add_tree_node(trans, cache, path, iter,</div><div class='add'>+						  node_key, cur);</div><div class='add'>+		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='del'>-		}</div><div class='add'>+</div><div class='ctx'> 		edge = list_first_entry_or_null(&amp;cache-&gt;pending_edge,</div><div class='ctx'> 				struct btrfs_backref_edge, list[UPPER]);</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -509,19 +453,18 @@ static noinline_for_stack struct btrfs_backref_node *build_backref_tree(</div><div class='ctx'> </div><div class='ctx'> 	/* Finish the upper linkage of newly added edges/nodes */</div><div class='ctx'> 	ret = btrfs_backref_finish_upper_links(cache, node);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		err = ret;</div><div class='add'>+	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	if (handle_useless_nodes(rc, node))</div><div class='ctx'> 		node = NULL;</div><div class='ctx'> out:</div><div class='del'>-	btrfs_backref_iter_free(iter);</div><div class='add'>+	btrfs_free_path(iter-&gt;path);</div><div class='add'>+	kfree(iter);</div><div class='ctx'> 	btrfs_free_path(path);</div><div class='del'>-	if (err) {</div><div class='add'>+	if (ret) {</div><div class='ctx'> 		btrfs_backref_error_cleanup(cache, node);</div><div class='del'>-		return ERR_PTR(err);</div><div class='add'>+		return ERR_PTR(ret);</div><div class='ctx'> 	}</div><div class='ctx'> 	ASSERT(!node || !node-&gt;detached);</div><div class='ctx'> 	ASSERT(list_empty(&amp;cache-&gt;useless_node) &amp;&amp;</div><div class='hunk'>@@ -530,98 +473,9 @@ out:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * helper to add backref node for the newly created snapshot.</div><div class='del'>- * the backref node is created by cloning backref node that</div><div class='del'>- * corresponds to root of source tree</div><div class='del'>- */</div><div class='del'>-static int clone_backref_node(struct btrfs_trans_handle *trans,</div><div class='del'>-			      struct reloc_control *rc,</div><div class='del'>-			      struct btrfs_root *src,</div><div class='del'>-			      struct btrfs_root *dest)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_root *reloc_root = src-&gt;reloc_root;</div><div class='del'>-	struct btrfs_backref_cache *cache = &amp;rc-&gt;backref_cache;</div><div class='del'>-	struct btrfs_backref_node *node = NULL;</div><div class='del'>-	struct btrfs_backref_node *new_node;</div><div class='del'>-	struct btrfs_backref_edge *edge;</div><div class='del'>-	struct btrfs_backref_edge *new_edge;</div><div class='del'>-	struct rb_node *rb_node;</div><div class='del'>-</div><div class='del'>-	if (cache-&gt;last_trans &gt; 0)</div><div class='del'>-		update_backref_cache(trans, cache);</div><div class='del'>-</div><div class='del'>-	rb_node = rb_simple_search(&amp;cache-&gt;rb_root, src-&gt;commit_root-&gt;start);</div><div class='del'>-	if (rb_node) {</div><div class='del'>-		node = rb_entry(rb_node, struct btrfs_backref_node, rb_node);</div><div class='del'>-		if (node-&gt;detached)</div><div class='del'>-			node = NULL;</div><div class='del'>-		else</div><div class='del'>-			BUG_ON(node-&gt;new_bytenr != reloc_root-&gt;node-&gt;start);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!node) {</div><div class='del'>-		rb_node = rb_simple_search(&amp;cache-&gt;rb_root,</div><div class='del'>-					   reloc_root-&gt;commit_root-&gt;start);</div><div class='del'>-		if (rb_node) {</div><div class='del'>-			node = rb_entry(rb_node, struct btrfs_backref_node,</div><div class='del'>-					rb_node);</div><div class='del'>-			BUG_ON(node-&gt;detached);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!node)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	new_node = btrfs_backref_alloc_node(cache, dest-&gt;node-&gt;start,</div><div class='del'>-					    node-&gt;level);</div><div class='del'>-	if (!new_node)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	new_node-&gt;lowest = node-&gt;lowest;</div><div class='del'>-	new_node-&gt;checked = 1;</div><div class='del'>-	new_node-&gt;root = btrfs_grab_root(dest);</div><div class='del'>-	ASSERT(new_node-&gt;root);</div><div class='del'>-</div><div class='del'>-	if (!node-&gt;lowest) {</div><div class='del'>-		list_for_each_entry(edge, &amp;node-&gt;lower, list[UPPER]) {</div><div class='del'>-			new_edge = btrfs_backref_alloc_edge(cache);</div><div class='del'>-			if (!new_edge)</div><div class='del'>-				goto fail;</div><div class='del'>-</div><div class='del'>-			btrfs_backref_link_edge(new_edge, edge-&gt;node[LOWER],</div><div class='del'>-						new_node, LINK_UPPER);</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-		list_add_tail(&amp;new_node-&gt;lower, &amp;cache-&gt;leaves);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rb_node = rb_simple_insert(&amp;cache-&gt;rb_root, new_node-&gt;bytenr,</div><div class='del'>-				   &amp;new_node-&gt;rb_node);</div><div class='del'>-	if (rb_node)</div><div class='del'>-		btrfs_backref_panic(trans-&gt;fs_info, new_node-&gt;bytenr, -EEXIST);</div><div class='del'>-</div><div class='del'>-	if (!new_node-&gt;lowest) {</div><div class='del'>-		list_for_each_entry(new_edge, &amp;new_node-&gt;lower, list[UPPER]) {</div><div class='del'>-			list_add_tail(&amp;new_edge-&gt;list[LOWER],</div><div class='del'>-				      &amp;new_edge-&gt;node[LOWER]-&gt;upper);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='del'>-fail:</div><div class='del'>-	while (!list_empty(&amp;new_node-&gt;lower)) {</div><div class='del'>-		new_edge = list_entry(new_node-&gt;lower.next,</div><div class='del'>-				      struct btrfs_backref_edge, list[UPPER]);</div><div class='del'>-		list_del(&amp;new_edge-&gt;list[UPPER]);</div><div class='del'>-		btrfs_backref_free_edge(cache, new_edge);</div><div class='del'>-	}</div><div class='del'>-	btrfs_backref_free_node(cache, new_node);</div><div class='del'>-	return -ENOMEM;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * helper to add 'address of tree root -&gt; reloc tree' mapping</div><div class='ctx'>  */</div><div class='del'>-static int __must_check __add_reloc_root(struct btrfs_root *root)</div><div class='add'>+static int __add_reloc_root(struct btrfs_root *root)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct rb_node *rb_node;</div><div class='hunk'>@@ -636,8 +490,7 @@ static int __must_check __add_reloc_root(struct btrfs_root *root)</div><div class='ctx'> 	node-&gt;data = root;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;rc-&gt;reloc_root_tree.lock);</div><div class='del'>-	rb_node = rb_simple_insert(&amp;rc-&gt;reloc_root_tree.rb_root,</div><div class='del'>-				   node-&gt;bytenr, &amp;node-&gt;rb_node);</div><div class='add'>+	rb_node = rb_simple_insert(&amp;rc-&gt;reloc_root_tree.rb_root, &amp;node-&gt;simple_node);</div><div class='ctx'> 	spin_unlock(&amp;rc-&gt;reloc_root_tree.lock);</div><div class='ctx'> 	if (rb_node) {</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='hunk'>@@ -658,7 +511,7 @@ static void __del_reloc_root(struct btrfs_root *root)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct rb_node *rb_node;</div><div class='del'>-	struct mapping_node *node = NULL;</div><div class='add'>+	struct mapping_node AUTO_KFREE(node);</div><div class='ctx'> 	struct reloc_control *rc = fs_info-&gt;reloc_ctl;</div><div class='ctx'> 	bool put_ref = false;</div><div class='ctx'> </div><div class='hunk'>@@ -691,7 +544,6 @@ static void __del_reloc_root(struct btrfs_root *root)</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='ctx'> 	if (put_ref)</div><div class='ctx'> 		btrfs_put_root(root);</div><div class='del'>-	kfree(node);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -720,8 +572,7 @@ static int __update_reloc_root(struct btrfs_root *root)</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;rc-&gt;reloc_root_tree.lock);</div><div class='ctx'> 	node-&gt;bytenr = root-&gt;node-&gt;start;</div><div class='del'>-	rb_node = rb_simple_insert(&amp;rc-&gt;reloc_root_tree.rb_root,</div><div class='del'>-				   node-&gt;bytenr, &amp;node-&gt;rb_node);</div><div class='add'>+	rb_node = rb_simple_insert(&amp;rc-&gt;reloc_root_tree.rb_root, &amp;node-&gt;simple_node);</div><div class='ctx'> 	spin_unlock(&amp;rc-&gt;reloc_root_tree.lock);</div><div class='ctx'> 	if (rb_node)</div><div class='ctx'> 		btrfs_backref_panic(fs_info, node-&gt;bytenr, -EEXIST);</div><div class='hunk'>@@ -734,10 +585,9 @@ static struct btrfs_root *create_reloc_root(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_root *reloc_root;</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='del'>-	struct btrfs_root_item *root_item;</div><div class='add'>+	struct btrfs_root_item AUTO_KFREE(root_item);</div><div class='ctx'> 	struct btrfs_key root_key;</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	bool must_abort = false;</div><div class='ctx'> </div><div class='ctx'> 	root_item = kmalloc(sizeof(*root_item), GFP_NOFS);</div><div class='ctx'> 	if (!root_item)</div><div class='hunk'>@@ -747,14 +597,32 @@ static struct btrfs_root *create_reloc_root(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	root_key.type = BTRFS_ROOT_ITEM_KEY;</div><div class='ctx'> 	root_key.offset = objectid;</div><div class='ctx'> </div><div class='del'>-	if (root-&gt;root_key.objectid == objectid) {</div><div class='add'>+	if (btrfs_root_id(root) == objectid) {</div><div class='ctx'> 		u64 commit_root_gen;</div><div class='ctx'> </div><div class='add'>+		/*</div><div class='add'>+		 * Relocation will wait for cleaner thread, and any half-dropped</div><div class='add'>+		 * subvolume will be fully cleaned up at mount time.</div><div class='add'>+		 * So here we shouldn't hit a subvolume with non-zero drop_progress.</div><div class='add'>+		 *</div><div class='add'>+		 * If this isn't the case, error out since it can make us attempt to</div><div class='add'>+		 * drop references for extents that were already dropped before.</div><div class='add'>+		 */</div><div class='add'>+		if (unlikely(btrfs_disk_key_objectid(&amp;root-&gt;root_item.drop_progress))) {</div><div class='add'>+			struct btrfs_key cpu_key;</div><div class='add'>+</div><div class='add'>+			btrfs_disk_key_to_cpu(&amp;cpu_key, &amp;root-&gt;root_item.drop_progress);</div><div class='add'>+			btrfs_err(fs_info,</div><div class='add'>+	"cannot relocate partially dropped subvolume %llu, drop progress key " BTRFS_KEY_FMT,</div><div class='add'>+				  objectid, BTRFS_KEY_FMT_VALUE(&amp;cpu_key));</div><div class='add'>+			return ERR_PTR(-EUCLEAN);</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		/* called by btrfs_init_reloc_root */</div><div class='ctx'> 		ret = btrfs_copy_root(trans, root, root-&gt;commit_root, &amp;eb,</div><div class='ctx'> 				      BTRFS_TREE_RELOC_OBJECTID);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			goto fail;</div><div class='add'>+			return ERR_PTR(ret);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Set the last_snapshot field to the generation of the commit</div><div class='hunk'>@@ -777,21 +645,20 @@ static struct btrfs_root *create_reloc_root(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		ret = btrfs_copy_root(trans, root, root-&gt;node, &amp;eb,</div><div class='ctx'> 				      BTRFS_TREE_RELOC_OBJECTID);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			goto fail;</div><div class='add'>+			return ERR_PTR(ret);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We have changed references at this point, we must abort the</div><div class='del'>-	 * transaction if anything fails.</div><div class='add'>+	 * transaction if anything fails (i.e. 'goto abort').</div><div class='ctx'> 	 */</div><div class='del'>-	must_abort = true;</div><div class='ctx'> </div><div class='ctx'> 	memcpy(root_item, &amp;root-&gt;root_item, sizeof(*root_item));</div><div class='ctx'> 	btrfs_set_root_bytenr(root_item, eb-&gt;start);</div><div class='ctx'> 	btrfs_set_root_level(root_item, btrfs_header_level(eb));</div><div class='ctx'> 	btrfs_set_root_generation(root_item, trans-&gt;transid);</div><div class='ctx'> </div><div class='del'>-	if (root-&gt;root_key.objectid == objectid) {</div><div class='add'>+	if (btrfs_root_id(root) == objectid) {</div><div class='ctx'> 		btrfs_set_root_refs(root_item, 0);</div><div class='ctx'> 		memset(&amp;root_item-&gt;drop_progress, 0,</div><div class='ctx'> 		       sizeof(struct btrfs_disk_key));</div><div class='hunk'>@@ -804,9 +671,7 @@ static struct btrfs_root *create_reloc_root(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	ret = btrfs_insert_root(trans, fs_info-&gt;tree_root,</div><div class='ctx'> 				&amp;root_key, root_item);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto fail;</div><div class='del'>-</div><div class='del'>-	kfree(root_item);</div><div class='add'>+		goto abort;</div><div class='ctx'> </div><div class='ctx'> 	reloc_root = btrfs_read_tree_root(fs_info-&gt;tree_root, &amp;root_key);</div><div class='ctx'> 	if (IS_ERR(reloc_root)) {</div><div class='hunk'>@@ -814,13 +679,11 @@ static struct btrfs_root *create_reloc_root(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		goto abort;</div><div class='ctx'> 	}</div><div class='ctx'> 	set_bit(BTRFS_ROOT_SHAREABLE, &amp;reloc_root-&gt;state);</div><div class='del'>-	reloc_root-&gt;last_trans = trans-&gt;transid;</div><div class='add'>+	btrfs_set_root_last_trans(reloc_root, trans-&gt;transid);</div><div class='ctx'> 	return reloc_root;</div><div class='del'>-fail:</div><div class='del'>-	kfree(root_item);</div><div class='add'>+</div><div class='ctx'> abort:</div><div class='del'>-	if (must_abort)</div><div class='del'>-		btrfs_abort_transaction(trans, ret);</div><div class='add'>+	btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 	return ERR_PTR(ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -861,7 +724,7 @@ int btrfs_init_reloc_root(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (root-&gt;reloc_root) {</div><div class='ctx'> 		reloc_root = root-&gt;reloc_root;</div><div class='del'>-		reloc_root-&gt;last_trans = trans-&gt;transid;</div><div class='add'>+		btrfs_set_root_last_trans(reloc_root, trans-&gt;transid);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -869,8 +732,7 @@ int btrfs_init_reloc_root(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * We are merging reloc roots, we do not need new reloc trees.  Also</div><div class='ctx'> 	 * reloc trees never need their own reloc tree.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!rc-&gt;create_reloc_tree ||</div><div class='del'>-	    root-&gt;root_key.objectid == BTRFS_TREE_RELOC_OBJECTID)</div><div class='add'>+	if (!rc-&gt;create_reloc_tree || btrfs_root_id(root) == BTRFS_TREE_RELOC_OBJECTID)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	if (!trans-&gt;reloc_reserved) {</div><div class='hunk'>@@ -878,7 +740,7 @@ int btrfs_init_reloc_root(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		trans-&gt;block_rsv = rc-&gt;block_rsv;</div><div class='ctx'> 		clear_rsv = 1;</div><div class='ctx'> 	}</div><div class='del'>-	reloc_root = create_reloc_root(trans, root, root-&gt;root_key.objectid);</div><div class='add'>+	reloc_root = create_reloc_root(trans, root, btrfs_root_id(root));</div><div class='ctx'> 	if (clear_rsv)</div><div class='ctx'> 		trans-&gt;block_rsv = rsv;</div><div class='ctx'> 	if (IS_ERR(reloc_root))</div><div class='hunk'>@@ -920,7 +782,7 @@ int btrfs_update_reloc_root(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	btrfs_grab_root(reloc_root);</div><div class='ctx'> </div><div class='ctx'> 	/* root-&gt;reloc_root will stay until current relocation finished */</div><div class='del'>-	if (fs_info-&gt;reloc_ctl-&gt;merge_reloc_tree &amp;&amp;</div><div class='add'>+	if (fs_info-&gt;reloc_ctl &amp;&amp; fs_info-&gt;reloc_ctl-&gt;merge_reloc_tree &amp;&amp;</div><div class='ctx'> 	    btrfs_root_refs(root_item) == 0) {</div><div class='ctx'> 		set_bit(BTRFS_ROOT_DEAD_RELOC_TREE, &amp;root-&gt;state);</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -945,67 +807,13 @@ int btrfs_update_reloc_root(struct btrfs_trans_handle *trans,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * helper to find first cached inode with inode number &gt;= objectid</div><div class='del'>- * in a subvolume</div><div class='del'>- */</div><div class='del'>-static struct inode *find_next_inode(struct btrfs_root *root, u64 objectid)</div><div class='del'>-{</div><div class='del'>-	struct rb_node *node;</div><div class='del'>-	struct rb_node *prev;</div><div class='del'>-	struct btrfs_inode *entry;</div><div class='del'>-	struct inode *inode;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;root-&gt;inode_lock);</div><div class='del'>-again:</div><div class='del'>-	node = root-&gt;inode_tree.rb_node;</div><div class='del'>-	prev = NULL;</div><div class='del'>-	while (node) {</div><div class='del'>-		prev = node;</div><div class='del'>-		entry = rb_entry(node, struct btrfs_inode, rb_node);</div><div class='del'>-</div><div class='del'>-		if (objectid &lt; btrfs_ino(entry))</div><div class='del'>-			node = node-&gt;rb_left;</div><div class='del'>-		else if (objectid &gt; btrfs_ino(entry))</div><div class='del'>-			node = node-&gt;rb_right;</div><div class='del'>-		else</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-	if (!node) {</div><div class='del'>-		while (prev) {</div><div class='del'>-			entry = rb_entry(prev, struct btrfs_inode, rb_node);</div><div class='del'>-			if (objectid &lt;= btrfs_ino(entry)) {</div><div class='del'>-				node = prev;</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			prev = rb_next(prev);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	while (node) {</div><div class='del'>-		entry = rb_entry(node, struct btrfs_inode, rb_node);</div><div class='del'>-		inode = igrab(&amp;entry-&gt;vfs_inode);</div><div class='del'>-		if (inode) {</div><div class='del'>-			spin_unlock(&amp;root-&gt;inode_lock);</div><div class='del'>-			return inode;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		objectid = btrfs_ino(entry) + 1;</div><div class='del'>-		if (cond_resched_lock(&amp;root-&gt;inode_lock))</div><div class='del'>-			goto again;</div><div class='del'>-</div><div class='del'>-		node = rb_next(node);</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;root-&gt;inode_lock);</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * get new location of data</div><div class='ctx'>  */</div><div class='ctx'> static int get_new_location(struct inode *reloc_inode, u64 *new_bytenr,</div><div class='ctx'> 			    u64 bytenr, u64 num_bytes)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(reloc_inode)-&gt;root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_file_extent_item *fi;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -1014,15 +822,13 @@ static int get_new_location(struct inode *reloc_inode, u64 *new_bytenr,</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	bytenr -= BTRFS_I(reloc_inode)-&gt;index_cnt;</div><div class='add'>+	bytenr -= BTRFS_I(reloc_inode)-&gt;reloc_block_group_start;</div><div class='ctx'> 	ret = btrfs_lookup_file_extent(NULL, root, path,</div><div class='ctx'> 			btrfs_ino(BTRFS_I(reloc_inode)), bytenr, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-	if (ret &gt; 0) {</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+		return ret;</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	fi = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='hunk'>@@ -1033,16 +839,11 @@ static int get_new_location(struct inode *reloc_inode, u64 *new_bytenr,</div><div class='ctx'> 	       btrfs_file_extent_encryption(leaf, fi) ||</div><div class='ctx'> 	       btrfs_file_extent_other_encoding(leaf, fi));</div><div class='ctx'> </div><div class='del'>-	if (num_bytes != btrfs_file_extent_disk_num_bytes(leaf, fi)) {</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (num_bytes != btrfs_file_extent_disk_num_bytes(leaf, fi))</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	*new_bytenr = btrfs_file_extent_disk_bytenr(leaf, fi);</div><div class='del'>-	ret = 0;</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1058,7 +859,7 @@ int replace_file_extents(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_file_extent_item *fi;</div><div class='del'>-	struct inode *inode = NULL;</div><div class='add'>+	struct btrfs_inode *inode = NULL;</div><div class='ctx'> 	u64 parent;</div><div class='ctx'> 	u64 bytenr;</div><div class='ctx'> 	u64 new_bytenr = 0;</div><div class='hunk'>@@ -1068,13 +869,12 @@ int replace_file_extents(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	u32 i;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int first = 1;</div><div class='del'>-	int dirty = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (rc-&gt;stage != UPDATE_DATA_PTRS)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/* reloc trees always use full backref */</div><div class='del'>-	if (root-&gt;root_key.objectid == BTRFS_TREE_RELOC_OBJECTID)</div><div class='add'>+	if (btrfs_root_id(root) == BTRFS_TREE_RELOC_OBJECTID)</div><div class='ctx'> 		parent = leaf-&gt;start;</div><div class='ctx'> 	else</div><div class='ctx'> 		parent = 0;</div><div class='hunk'>@@ -1100,33 +900,40 @@ int replace_file_extents(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * if we are modifying block in fs tree, wait for readpage</div><div class='add'>+		 * if we are modifying block in fs tree, wait for read_folio</div><div class='ctx'> 		 * to complete and drop the extent cache</div><div class='ctx'> 		 */</div><div class='del'>-		if (root-&gt;root_key.objectid != BTRFS_TREE_RELOC_OBJECTID) {</div><div class='add'>+		if (btrfs_root_id(root) != BTRFS_TREE_RELOC_OBJECTID) {</div><div class='ctx'> 			if (first) {</div><div class='del'>-				inode = find_next_inode(root, key.objectid);</div><div class='add'>+				inode = btrfs_find_first_inode(root, key.objectid);</div><div class='ctx'> 				first = 0;</div><div class='del'>-			} else if (inode &amp;&amp; btrfs_ino(BTRFS_I(inode)) &lt; key.objectid) {</div><div class='add'>+			} else if (inode &amp;&amp; btrfs_ino(inode) &lt; key.objectid) {</div><div class='ctx'> 				btrfs_add_delayed_iput(inode);</div><div class='del'>-				inode = find_next_inode(root, key.objectid);</div><div class='add'>+				inode = btrfs_find_first_inode(root, key.objectid);</div><div class='ctx'> 			}</div><div class='del'>-			if (inode &amp;&amp; btrfs_ino(BTRFS_I(inode)) == key.objectid) {</div><div class='add'>+			if (inode &amp;&amp; btrfs_ino(inode) == key.objectid) {</div><div class='add'>+				struct extent_state *cached_state = NULL;</div><div class='add'>+</div><div class='ctx'> 				end = key.offset +</div><div class='ctx'> 				      btrfs_file_extent_num_bytes(leaf, fi);</div><div class='ctx'> 				WARN_ON(!IS_ALIGNED(key.offset,</div><div class='ctx'> 						    fs_info-&gt;sectorsize));</div><div class='ctx'> 				WARN_ON(!IS_ALIGNED(end, fs_info-&gt;sectorsize));</div><div class='ctx'> 				end--;</div><div class='del'>-				ret = try_lock_extent(&amp;BTRFS_I(inode)-&gt;io_tree,</div><div class='del'>-						      key.offset, end);</div><div class='del'>-				if (!ret)</div><div class='add'>+				/* Take mmap lock to serialize with reflinks. */</div><div class='add'>+				if (!down_read_trylock(&amp;inode-&gt;i_mmap_lock))</div><div class='add'>+					continue;</div><div class='add'>+				ret = btrfs_try_lock_extent(&amp;inode-&gt;io_tree, key.offset,</div><div class='add'>+							    end, &amp;cached_state);</div><div class='add'>+				if (!ret) {</div><div class='add'>+					up_read(&amp;inode-&gt;i_mmap_lock);</div><div class='ctx'> 					continue;</div><div class='add'>+				}</div><div class='ctx'> </div><div class='del'>-				btrfs_drop_extent_cache(BTRFS_I(inode),</div><div class='del'>-						key.offset,	end, 1);</div><div class='del'>-				unlock_extent(&amp;BTRFS_I(inode)-&gt;io_tree,</div><div class='del'>-					      key.offset, end);</div><div class='add'>+				btrfs_drop_extent_map_range(inode, key.offset, end, true);</div><div class='add'>+				btrfs_unlock_extent(&amp;inode-&gt;io_tree, key.offset, end,</div><div class='add'>+						    &amp;cached_state);</div><div class='add'>+				up_read(&amp;inode-&gt;i_mmap_lock);</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -1141,41 +948,44 @@ int replace_file_extents(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		btrfs_set_file_extent_disk_bytenr(leaf, fi, new_bytenr);</div><div class='del'>-		dirty = 1;</div><div class='ctx'> </div><div class='ctx'> 		key.offset -= btrfs_file_extent_offset(leaf, fi);</div><div class='del'>-		btrfs_init_generic_ref(&amp;ref, BTRFS_ADD_DELAYED_REF, new_bytenr,</div><div class='del'>-				       num_bytes, parent);</div><div class='del'>-		btrfs_init_data_ref(&amp;ref, btrfs_header_owner(leaf),</div><div class='del'>-				    key.objectid, key.offset,</div><div class='del'>-				    root-&gt;root_key.objectid, false);</div><div class='add'>+		ref.action = BTRFS_ADD_DELAYED_REF;</div><div class='add'>+		ref.bytenr = new_bytenr;</div><div class='add'>+		ref.num_bytes = num_bytes;</div><div class='add'>+		ref.parent = parent;</div><div class='add'>+		ref.owning_root = btrfs_root_id(root);</div><div class='add'>+		ref.ref_root = btrfs_header_owner(leaf);</div><div class='add'>+		btrfs_init_data_ref(&amp;ref, key.objectid, key.offset,</div><div class='add'>+				    btrfs_root_id(root), false);</div><div class='ctx'> 		ret = btrfs_inc_extent_ref(trans, &amp;ref);</div><div class='del'>-		if (ret) {</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		btrfs_init_generic_ref(&amp;ref, BTRFS_DROP_DELAYED_REF, bytenr,</div><div class='del'>-				       num_bytes, parent);</div><div class='del'>-		btrfs_init_data_ref(&amp;ref, btrfs_header_owner(leaf),</div><div class='del'>-				    key.objectid, key.offset,</div><div class='del'>-				    root-&gt;root_key.objectid, false);</div><div class='add'>+		ref.action = BTRFS_DROP_DELAYED_REF;</div><div class='add'>+		ref.bytenr = bytenr;</div><div class='add'>+		ref.num_bytes = num_bytes;</div><div class='add'>+		ref.parent = parent;</div><div class='add'>+		ref.owning_root = btrfs_root_id(root);</div><div class='add'>+		ref.ref_root = btrfs_header_owner(leaf);</div><div class='add'>+		btrfs_init_data_ref(&amp;ref, key.objectid, key.offset,</div><div class='add'>+				    btrfs_root_id(root), false);</div><div class='ctx'> 		ret = btrfs_free_extent(trans, &amp;ref);</div><div class='del'>-		if (ret) {</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	if (dirty)</div><div class='del'>-		btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> 	if (inode)</div><div class='ctx'> 		btrfs_add_delayed_iput(inode);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline_for_stack</div><div class='del'>-int memcmp_node_keys(struct extent_buffer *eb, int slot,</div><div class='del'>-		     struct btrfs_path *path, int level)</div><div class='add'>+static noinline_for_stack int memcmp_node_keys(const struct extent_buffer *eb,</div><div class='add'>+					       int slot, const struct btrfs_path *path,</div><div class='add'>+					       int level)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_disk_key key1;</div><div class='ctx'> 	struct btrfs_disk_key key2;</div><div class='hunk'>@@ -1215,8 +1025,8 @@ int replace_path(struct btrfs_trans_handle *trans, struct reloc_control *rc,</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int slot;</div><div class='ctx'> </div><div class='del'>-	ASSERT(src-&gt;root_key.objectid == BTRFS_TREE_RELOC_OBJECTID);</div><div class='del'>-	ASSERT(dest-&gt;root_key.objectid != BTRFS_TREE_RELOC_OBJECTID);</div><div class='add'>+	ASSERT(btrfs_root_id(src) == BTRFS_TREE_RELOC_OBJECTID);</div><div class='add'>+	ASSERT(btrfs_root_id(dest) != BTRFS_TREE_RELOC_OBJECTID);</div><div class='ctx'> </div><div class='ctx'> 	last_snapshot = btrfs_root_last_snapshot(&amp;src-&gt;root_item);</div><div class='ctx'> again:</div><div class='hunk'>@@ -1253,7 +1063,7 @@ again:</div><div class='ctx'> 		level = btrfs_header_level(parent);</div><div class='ctx'> 		ASSERT(level &gt;= lowest_level);</div><div class='ctx'> </div><div class='del'>-		ret = btrfs_bin_search(parent, &amp;key, &amp;slot);</div><div class='add'>+		ret = btrfs_bin_search(parent, 0, &amp;key, &amp;slot);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			break;</div><div class='ctx'> 		if (ret &amp;&amp; slot &gt; 0)</div><div class='hunk'>@@ -1325,7 +1135,9 @@ again:</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> </div><div class='ctx'> 		path-&gt;lowest_level = level;</div><div class='add'>+		set_bit(BTRFS_ROOT_RESET_LOCKDEP_CLASS, &amp;src-&gt;state);</div><div class='ctx'> 		ret = btrfs_search_slot(trans, src, &amp;key, path, 0, 1);</div><div class='add'>+		clear_bit(BTRFS_ROOT_RESET_LOCKDEP_CLASS, &amp;src-&gt;state);</div><div class='ctx'> 		path-&gt;lowest_level = 0;</div><div class='ctx'> 		if (ret) {</div><div class='ctx'> 			if (ret &gt; 0)</div><div class='hunk'>@@ -1347,7 +1159,7 @@ again:</div><div class='ctx'> 		 * The real subtree rescan is delayed until we have new</div><div class='ctx'> 		 * CoW on the subtree root node before transaction commit.</div><div class='ctx'> 		 */</div><div class='del'>-		ret = btrfs_qgroup_add_swapped_blocks(trans, dest,</div><div class='add'>+		ret = btrfs_qgroup_add_swapped_blocks(dest,</div><div class='ctx'> 				rc-&gt;block_group, parent, slot,</div><div class='ctx'> 				path-&gt;nodes[level], path-&gt;slots[level],</div><div class='ctx'> 				last_snapshot);</div><div class='hunk'>@@ -1358,49 +1170,62 @@ again:</div><div class='ctx'> 		 */</div><div class='ctx'> 		btrfs_set_node_blockptr(parent, slot, new_bytenr);</div><div class='ctx'> 		btrfs_set_node_ptr_generation(parent, slot, new_ptr_gen);</div><div class='del'>-		btrfs_mark_buffer_dirty(parent);</div><div class='ctx'> </div><div class='ctx'> 		btrfs_set_node_blockptr(path-&gt;nodes[level],</div><div class='ctx'> 					path-&gt;slots[level], old_bytenr);</div><div class='ctx'> 		btrfs_set_node_ptr_generation(path-&gt;nodes[level],</div><div class='ctx'> 					      path-&gt;slots[level], old_ptr_gen);</div><div class='del'>-		btrfs_mark_buffer_dirty(path-&gt;nodes[level]);</div><div class='ctx'> </div><div class='del'>-		btrfs_init_generic_ref(&amp;ref, BTRFS_ADD_DELAYED_REF, old_bytenr,</div><div class='del'>-				       blocksize, path-&gt;nodes[level]-&gt;start);</div><div class='del'>-		btrfs_init_tree_ref(&amp;ref, level - 1, src-&gt;root_key.objectid,</div><div class='del'>-				    0, true);</div><div class='add'>+		ref.action = BTRFS_ADD_DELAYED_REF;</div><div class='add'>+		ref.bytenr = old_bytenr;</div><div class='add'>+		ref.num_bytes = blocksize;</div><div class='add'>+		ref.parent = path-&gt;nodes[level]-&gt;start;</div><div class='add'>+		ref.owning_root = btrfs_root_id(src);</div><div class='add'>+		ref.ref_root = btrfs_root_id(src);</div><div class='add'>+		btrfs_init_tree_ref(&amp;ref, level - 1, 0, true);</div><div class='ctx'> 		ret = btrfs_inc_extent_ref(trans, &amp;ref);</div><div class='del'>-		if (ret) {</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-		btrfs_init_generic_ref(&amp;ref, BTRFS_ADD_DELAYED_REF, new_bytenr,</div><div class='del'>-				       blocksize, 0);</div><div class='del'>-		btrfs_init_tree_ref(&amp;ref, level - 1, dest-&gt;root_key.objectid, 0,</div><div class='del'>-				    true);</div><div class='add'>+</div><div class='add'>+		ref.action = BTRFS_ADD_DELAYED_REF;</div><div class='add'>+		ref.bytenr = new_bytenr;</div><div class='add'>+		ref.num_bytes = blocksize;</div><div class='add'>+		ref.parent = 0;</div><div class='add'>+		ref.owning_root = btrfs_root_id(dest);</div><div class='add'>+		ref.ref_root = btrfs_root_id(dest);</div><div class='add'>+		btrfs_init_tree_ref(&amp;ref, level - 1, 0, true);</div><div class='ctx'> 		ret = btrfs_inc_extent_ref(trans, &amp;ref);</div><div class='del'>-		if (ret) {</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		btrfs_init_generic_ref(&amp;ref, BTRFS_DROP_DELAYED_REF, new_bytenr,</div><div class='del'>-				       blocksize, path-&gt;nodes[level]-&gt;start);</div><div class='del'>-		btrfs_init_tree_ref(&amp;ref, level - 1, src-&gt;root_key.objectid,</div><div class='del'>-				    0, true);</div><div class='add'>+		/* We don't know the real owning_root, use 0. */</div><div class='add'>+		ref.action = BTRFS_DROP_DELAYED_REF;</div><div class='add'>+		ref.bytenr = new_bytenr;</div><div class='add'>+		ref.num_bytes = blocksize;</div><div class='add'>+		ref.parent = path-&gt;nodes[level]-&gt;start;</div><div class='add'>+		ref.owning_root = 0;</div><div class='add'>+		ref.ref_root = btrfs_root_id(src);</div><div class='add'>+		btrfs_init_tree_ref(&amp;ref, level - 1, 0, true);</div><div class='ctx'> 		ret = btrfs_free_extent(trans, &amp;ref);</div><div class='del'>-		if (ret) {</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		btrfs_init_generic_ref(&amp;ref, BTRFS_DROP_DELAYED_REF, old_bytenr,</div><div class='del'>-				       blocksize, 0);</div><div class='del'>-		btrfs_init_tree_ref(&amp;ref, level - 1, dest-&gt;root_key.objectid,</div><div class='del'>-				    0, true);</div><div class='add'>+		/* We don't know the real owning_root, use 0. */</div><div class='add'>+		ref.action = BTRFS_DROP_DELAYED_REF;</div><div class='add'>+		ref.bytenr = old_bytenr;</div><div class='add'>+		ref.num_bytes = blocksize;</div><div class='add'>+		ref.parent = 0;</div><div class='add'>+		ref.owning_root = 0;</div><div class='add'>+		ref.ref_root = btrfs_root_id(dest);</div><div class='add'>+		btrfs_init_tree_ref(&amp;ref, level - 1, 0, true);</div><div class='ctx'> 		ret = btrfs_free_extent(trans, &amp;ref);</div><div class='del'>-		if (ret) {</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1502,35 +1327,38 @@ int walk_down_reloc_tree(struct btrfs_root *root, struct btrfs_path *path,</div><div class='ctx'>  * [min_key, max_key)</div><div class='ctx'>  */</div><div class='ctx'> static int invalidate_extent_cache(struct btrfs_root *root,</div><div class='del'>-				   struct btrfs_key *min_key,</div><div class='del'>-				   struct btrfs_key *max_key)</div><div class='add'>+				   const struct btrfs_key *min_key,</div><div class='add'>+				   const struct btrfs_key *max_key)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='del'>-	struct inode *inode = NULL;</div><div class='add'>+	struct btrfs_inode *inode = NULL;</div><div class='ctx'> 	u64 objectid;</div><div class='ctx'> 	u64 start, end;</div><div class='ctx'> 	u64 ino;</div><div class='ctx'> </div><div class='ctx'> 	objectid = min_key-&gt;objectid;</div><div class='ctx'> 	while (1) {</div><div class='add'>+		struct extent_state *cached_state = NULL;</div><div class='add'>+</div><div class='ctx'> 		cond_resched();</div><div class='del'>-		iput(inode);</div><div class='add'>+		if (inode)</div><div class='add'>+			iput(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> </div><div class='ctx'> 		if (objectid &gt; max_key-&gt;objectid)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		inode = find_next_inode(root, objectid);</div><div class='add'>+		inode = btrfs_find_first_inode(root, objectid);</div><div class='ctx'> 		if (!inode)</div><div class='ctx'> 			break;</div><div class='del'>-		ino = btrfs_ino(BTRFS_I(inode));</div><div class='add'>+		ino = btrfs_ino(inode);</div><div class='ctx'> </div><div class='ctx'> 		if (ino &gt; max_key-&gt;objectid) {</div><div class='del'>-			iput(inode);</div><div class='add'>+			iput(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		objectid = ino + 1;</div><div class='del'>-		if (!S_ISREG(inode-&gt;i_mode))</div><div class='add'>+		if (!S_ISREG(inode-&gt;vfs_inode.i_mode))</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		if (unlikely(min_key-&gt;objectid == ino)) {</div><div class='hunk'>@@ -1562,10 +1390,10 @@ static int invalidate_extent_cache(struct btrfs_root *root,</div><div class='ctx'> 			end = (u64)-1;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		/* the lock_extent waits for readpage to complete */</div><div class='del'>-		lock_extent(&amp;BTRFS_I(inode)-&gt;io_tree, start, end);</div><div class='del'>-		btrfs_drop_extent_cache(BTRFS_I(inode), start, end, 1);</div><div class='del'>-		unlock_extent(&amp;BTRFS_I(inode)-&gt;io_tree, start, end);</div><div class='add'>+		/* the lock_extent waits for read_folio to complete */</div><div class='add'>+		btrfs_lock_extent(&amp;inode-&gt;io_tree, start, end, &amp;cached_state);</div><div class='add'>+		btrfs_drop_extent_map_range(inode, start, end, true);</div><div class='add'>+		btrfs_unlock_extent(&amp;inode-&gt;io_tree, start, end, &amp;cached_state);</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -1600,7 +1428,7 @@ static int insert_dirty_subvol(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	/* @root must be a subvolume tree root with a valid reloc tree */</div><div class='del'>-	ASSERT(root-&gt;root_key.objectid != BTRFS_TREE_RELOC_OBJECTID);</div><div class='add'>+	ASSERT(btrfs_root_id(root) != BTRFS_TREE_RELOC_OBJECTID);</div><div class='ctx'> 	ASSERT(reloc_root);</div><div class='ctx'> </div><div class='ctx'> 	reloc_root_item = &amp;reloc_root-&gt;root_item;</div><div class='hunk'>@@ -1629,7 +1457,7 @@ static int clean_dirty_subvols(struct reloc_control *rc)</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry_safe(root, next, &amp;rc-&gt;dirty_subvol_roots,</div><div class='ctx'> 				 reloc_dirty_list) {</div><div class='del'>-		if (root-&gt;root_key.objectid != BTRFS_TREE_RELOC_OBJECTID) {</div><div class='add'>+		if (btrfs_root_id(root) != BTRFS_TREE_RELOC_OBJECTID) {</div><div class='ctx'> 			/* Merged subvolume, cleanup its reloc root */</div><div class='ctx'> 			struct btrfs_root *reloc_root = root-&gt;reloc_root;</div><div class='ctx'> </div><div class='hunk'>@@ -1647,7 +1475,7 @@ static int clean_dirty_subvols(struct reloc_control *rc)</div><div class='ctx'> 				 * -&gt;reloc_root.  If it fails however we must</div><div class='ctx'> 				 * drop the ref ourselves.</div><div class='ctx'> 				 */</div><div class='del'>-				ret2 = btrfs_drop_snapshot(reloc_root, 0, 1);</div><div class='add'>+				ret2 = btrfs_drop_snapshot(reloc_root, false, true);</div><div class='ctx'> 				if (ret2 &lt; 0) {</div><div class='ctx'> 					btrfs_put_root(reloc_root);</div><div class='ctx'> 					if (!ret)</div><div class='hunk'>@@ -1657,7 +1485,7 @@ static int clean_dirty_subvols(struct reloc_control *rc)</div><div class='ctx'> 			btrfs_put_root(root);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			/* Orphan reloc tree, just clean it up */</div><div class='del'>-			ret2 = btrfs_drop_snapshot(root, 0, 1);</div><div class='add'>+			ret2 = btrfs_drop_snapshot(root, false, true);</div><div class='ctx'> 			if (ret2 &lt; 0) {</div><div class='ctx'> 				btrfs_put_root(root);</div><div class='ctx'> 				if (!ret)</div><div class='hunk'>@@ -1700,7 +1528,7 @@ static noinline_for_stack int merge_reloc_root(struct reloc_control *rc,</div><div class='ctx'> </div><div class='ctx'> 	if (btrfs_disk_key_objectid(&amp;root_item-&gt;drop_progress) == 0) {</div><div class='ctx'> 		level = btrfs_root_level(root_item);</div><div class='del'>-		atomic_inc(&amp;reloc_root-&gt;node-&gt;refs);</div><div class='add'>+		refcount_inc(&amp;reloc_root-&gt;node-&gt;refs);</div><div class='ctx'> 		path-&gt;nodes[level] = reloc_root-&gt;node;</div><div class='ctx'> 		path-&gt;slots[level] = 0;</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -1736,7 +1564,8 @@ static noinline_for_stack int merge_reloc_root(struct reloc_control *rc,</div><div class='ctx'> 	memset(&amp;next_key, 0, sizeof(next_key));</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='del'>-		ret = btrfs_block_rsv_refill(root, rc-&gt;block_rsv, min_reserved,</div><div class='add'>+		ret = btrfs_block_rsv_refill(fs_info, rc-&gt;block_rsv,</div><div class='add'>+					     min_reserved,</div><div class='ctx'> 					     BTRFS_RESERVE_FLUSH_LIMIT);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto out;</div><div class='hunk'>@@ -1757,7 +1586,7 @@ static noinline_for_stack int merge_reloc_root(struct reloc_control *rc,</div><div class='ctx'> 		 * btrfs_update_reloc_root() and update our root item</div><div class='ctx'> 		 * appropriately.</div><div class='ctx'> 		 */</div><div class='del'>-		reloc_root-&gt;last_trans = trans-&gt;transid;</div><div class='add'>+		btrfs_set_root_last_trans(reloc_root, trans-&gt;transid);</div><div class='ctx'> 		trans-&gt;block_rsv = rc-&gt;block_rsv;</div><div class='ctx'> </div><div class='ctx'> 		replaced = 0;</div><div class='hunk'>@@ -1855,7 +1684,7 @@ int prepare_to_merge(struct reloc_control *rc, int err)</div><div class='ctx'> again:</div><div class='ctx'> 	if (!err) {</div><div class='ctx'> 		num_bytes = rc-&gt;merging_rsv_size;</div><div class='del'>-		ret = btrfs_block_rsv_add(root, rc-&gt;block_rsv, num_bytes,</div><div class='add'>+		ret = btrfs_block_rsv_add(fs_info, rc-&gt;block_rsv, num_bytes,</div><div class='ctx'> 					  BTRFS_RESERVE_FLUSH_ALL);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			err = ret;</div><div class='hunk'>@@ -1878,11 +1707,11 @@ again:</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	rc-&gt;merge_reloc_tree = 1;</div><div class='add'>+	rc-&gt;merge_reloc_tree = true;</div><div class='ctx'> </div><div class='ctx'> 	while (!list_empty(&amp;rc-&gt;reloc_roots)) {</div><div class='del'>-		reloc_root = list_entry(rc-&gt;reloc_roots.next,</div><div class='del'>-					struct btrfs_root, root_list);</div><div class='add'>+		reloc_root = list_first_entry(&amp;rc-&gt;reloc_roots,</div><div class='add'>+					      struct btrfs_root, root_list);</div><div class='ctx'> 		list_del_init(&amp;reloc_root-&gt;root_list);</div><div class='ctx'> </div><div class='ctx'> 		root = btrfs_get_fs_root(fs_info, reloc_root-&gt;root_key.offset,</div><div class='hunk'>@@ -1898,7 +1727,39 @@ again:</div><div class='ctx'> 				err = PTR_ERR(root);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-		ASSERT(root-&gt;reloc_root == reloc_root);</div><div class='add'>+</div><div class='add'>+		if (unlikely(root-&gt;reloc_root != reloc_root)) {</div><div class='add'>+			if (root-&gt;reloc_root) {</div><div class='add'>+				btrfs_err(fs_info,</div><div class='add'>+"reloc tree mismatch, root %lld has reloc root key (%lld %u %llu) gen %llu, expect reloc root key (%lld %u %llu) gen %llu",</div><div class='add'>+					  btrfs_root_id(root),</div><div class='add'>+					  btrfs_root_id(root-&gt;reloc_root),</div><div class='add'>+					  root-&gt;reloc_root-&gt;root_key.type,</div><div class='add'>+					  root-&gt;reloc_root-&gt;root_key.offset,</div><div class='add'>+					  btrfs_root_generation(</div><div class='add'>+						  &amp;root-&gt;reloc_root-&gt;root_item),</div><div class='add'>+					  btrfs_root_id(reloc_root),</div><div class='add'>+					  reloc_root-&gt;root_key.type,</div><div class='add'>+					  reloc_root-&gt;root_key.offset,</div><div class='add'>+					  btrfs_root_generation(</div><div class='add'>+						  &amp;reloc_root-&gt;root_item));</div><div class='add'>+			} else {</div><div class='add'>+				btrfs_err(fs_info,</div><div class='add'>+"reloc tree mismatch, root %lld has no reloc root, expect reloc root key (%lld %u %llu) gen %llu",</div><div class='add'>+					  btrfs_root_id(root),</div><div class='add'>+					  btrfs_root_id(reloc_root),</div><div class='add'>+					  reloc_root-&gt;root_key.type,</div><div class='add'>+					  reloc_root-&gt;root_key.offset,</div><div class='add'>+					  btrfs_root_generation(</div><div class='add'>+						  &amp;reloc_root-&gt;root_item));</div><div class='add'>+			}</div><div class='add'>+			list_add(&amp;reloc_root-&gt;root_list, &amp;reloc_roots);</div><div class='add'>+			btrfs_put_root(root);</div><div class='add'>+			btrfs_abort_transaction(trans, -EUCLEAN);</div><div class='add'>+			if (!err)</div><div class='add'>+				err = -EUCLEAN;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * set reference count to 1, so btrfs_recover_relocation</div><div class='hunk'>@@ -1915,7 +1776,7 @@ again:</div><div class='ctx'> 		list_add(&amp;reloc_root-&gt;root_list, &amp;reloc_roots);</div><div class='ctx'> 		btrfs_put_root(root);</div><div class='ctx'> </div><div class='del'>-		if (ret) {</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			if (!err)</div><div class='ctx'> 				err = ret;</div><div class='hunk'>@@ -1965,13 +1826,12 @@ again:</div><div class='ctx'> </div><div class='ctx'> 	while (!list_empty(&amp;reloc_roots)) {</div><div class='ctx'> 		found = 1;</div><div class='del'>-		reloc_root = list_entry(reloc_roots.next,</div><div class='del'>-					struct btrfs_root, root_list);</div><div class='add'>+		reloc_root = list_first_entry(&amp;reloc_roots, struct btrfs_root, root_list);</div><div class='ctx'> </div><div class='ctx'> 		root = btrfs_get_fs_root(fs_info, reloc_root-&gt;root_key.offset,</div><div class='ctx'> 					 false);</div><div class='ctx'> 		if (btrfs_root_refs(&amp;reloc_root-&gt;root_item) &gt; 0) {</div><div class='del'>-			if (IS_ERR(root)) {</div><div class='add'>+			if (WARN_ON(IS_ERR(root))) {</div><div class='ctx'> 				/*</div><div class='ctx'> 				 * For recovery we read the fs roots on mount,</div><div class='ctx'> 				 * and if we didn't find the root then we marked</div><div class='hunk'>@@ -1980,17 +1840,14 @@ again:</div><div class='ctx'> 				 * memory.  However there's no reason we can't</div><div class='ctx'> 				 * handle the error properly here just in case.</div><div class='ctx'> 				 */</div><div class='del'>-				ASSERT(0);</div><div class='ctx'> 				ret = PTR_ERR(root);</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='del'>-			if (root-&gt;reloc_root != reloc_root) {</div><div class='add'>+			if (WARN_ON(root-&gt;reloc_root != reloc_root)) {</div><div class='ctx'> 				/*</div><div class='del'>-				 * This is actually impossible without something</div><div class='del'>-				 * going really wrong (like weird race condition</div><div class='del'>-				 * or cosmic rays).</div><div class='add'>+				 * This can happen if on-disk metadata has some</div><div class='add'>+				 * corruption, e.g. bad reloc tree key offset.</div><div class='ctx'> 				 */</div><div class='del'>-				ASSERT(0);</div><div class='ctx'> 				ret = -EINVAL;</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -2071,7 +1928,7 @@ static int record_reloc_root_in_trans(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	struct btrfs_root *root;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (reloc_root-&gt;last_trans == trans-&gt;transid)</div><div class='add'>+	if (btrfs_get_root_last_trans(reloc_root) == trans-&gt;transid)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	root = btrfs_get_fs_root(fs_info, reloc_root-&gt;root_key.offset, false);</div><div class='hunk'>@@ -2085,11 +1942,11 @@ static int record_reloc_root_in_trans(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * reloc root without a corresponding root this could return ENOENT.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (IS_ERR(root)) {</div><div class='del'>-		ASSERT(0);</div><div class='add'>+		DEBUG_WARN("error %ld reading root for reloc root", PTR_ERR(root));</div><div class='ctx'> 		return PTR_ERR(root);</div><div class='ctx'> 	}</div><div class='del'>-	if (root-&gt;reloc_root != reloc_root) {</div><div class='del'>-		ASSERT(0);</div><div class='add'>+	if (unlikely(root-&gt;reloc_root != reloc_root)) {</div><div class='add'>+		DEBUG_WARN("unexpected reloc root found");</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='ctx'> 			  "root %llu has two reloc roots associated with it",</div><div class='ctx'> 			  reloc_root-&gt;root_key.offset);</div><div class='hunk'>@@ -2113,100 +1970,72 @@ struct btrfs_root *select_reloc_root(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	int index = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	next = node;</div><div class='del'>-	while (1) {</div><div class='del'>-		cond_resched();</div><div class='del'>-		next = walk_up_backref(next, edges, &amp;index);</div><div class='del'>-		root = next-&gt;root;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * If there is no root, then our references for this block are</div><div class='del'>-		 * incomplete, as we should be able to walk all the way up to a</div><div class='del'>-		 * block that is owned by a root.</div><div class='del'>-		 *</div><div class='del'>-		 * This path is only for SHAREABLE roots, so if we come upon a</div><div class='del'>-		 * non-SHAREABLE root then we have backrefs that resolve</div><div class='del'>-		 * improperly.</div><div class='del'>-		 *</div><div class='del'>-		 * Both of these cases indicate file system corruption, or a bug</div><div class='del'>-		 * in the backref walking code.</div><div class='del'>-		 */</div><div class='del'>-		if (!root) {</div><div class='del'>-			ASSERT(0);</div><div class='del'>-			btrfs_err(trans-&gt;fs_info,</div><div class='del'>-		"bytenr %llu doesn't have a backref path ending in a root",</div><div class='del'>-				  node-&gt;bytenr);</div><div class='del'>-			return ERR_PTR(-EUCLEAN);</div><div class='del'>-		}</div><div class='del'>-		if (!test_bit(BTRFS_ROOT_SHAREABLE, &amp;root-&gt;state)) {</div><div class='del'>-			ASSERT(0);</div><div class='del'>-			btrfs_err(trans-&gt;fs_info,</div><div class='del'>-	"bytenr %llu has multiple refs with one ending in a non-shareable root",</div><div class='del'>-				  node-&gt;bytenr);</div><div class='del'>-			return ERR_PTR(-EUCLEAN);</div><div class='del'>-		}</div><div class='add'>+	next = walk_up_backref(node, edges, &amp;index);</div><div class='add'>+	root = next-&gt;root;</div><div class='ctx'> </div><div class='del'>-		if (root-&gt;root_key.objectid == BTRFS_TREE_RELOC_OBJECTID) {</div><div class='del'>-			ret = record_reloc_root_in_trans(trans, root);</div><div class='del'>-			if (ret)</div><div class='del'>-				return ERR_PTR(ret);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='add'>+	/*</div><div class='add'>+	 * If there is no root, then our references for this block are</div><div class='add'>+	 * incomplete, as we should be able to walk all the way up to a block</div><div class='add'>+	 * that is owned by a root.</div><div class='add'>+	 *</div><div class='add'>+	 * This path is only for SHAREABLE roots, so if we come upon a</div><div class='add'>+	 * non-SHAREABLE root then we have backrefs that resolve improperly.</div><div class='add'>+	 *</div><div class='add'>+	 * Both of these cases indicate file system corruption, or a bug in the</div><div class='add'>+	 * backref walking code.</div><div class='add'>+	 */</div><div class='add'>+	if (unlikely(!root)) {</div><div class='add'>+		btrfs_err(trans-&gt;fs_info,</div><div class='add'>+			  "bytenr %llu doesn't have a backref path ending in a root",</div><div class='add'>+			  node-&gt;bytenr);</div><div class='add'>+		return ERR_PTR(-EUCLEAN);</div><div class='add'>+	}</div><div class='add'>+	if (unlikely(!test_bit(BTRFS_ROOT_SHAREABLE, &amp;root-&gt;state))) {</div><div class='add'>+		btrfs_err(trans-&gt;fs_info,</div><div class='add'>+			  "bytenr %llu has multiple refs with one ending in a non-shareable root",</div><div class='add'>+			  node-&gt;bytenr);</div><div class='add'>+		return ERR_PTR(-EUCLEAN);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		ret = btrfs_record_root_in_trans(trans, root);</div><div class='add'>+	if (btrfs_root_id(root) == BTRFS_TREE_RELOC_OBJECTID) {</div><div class='add'>+		ret = record_reloc_root_in_trans(trans, root);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ERR_PTR(ret);</div><div class='del'>-		root = root-&gt;reloc_root;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * We could have raced with another thread which failed, so</div><div class='del'>-		 * root-&gt;reloc_root may not be set, return ENOENT in this case.</div><div class='del'>-		 */</div><div class='del'>-		if (!root)</div><div class='del'>-			return ERR_PTR(-ENOENT);</div><div class='add'>+		goto found;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		if (next-&gt;new_bytenr != root-&gt;node-&gt;start) {</div><div class='del'>-			/*</div><div class='del'>-			 * We just created the reloc root, so we shouldn't have</div><div class='del'>-			 * -&gt;new_bytenr set and this shouldn't be in the changed</div><div class='del'>-			 *  list.  If it is then we have multiple roots pointing</div><div class='del'>-			 *  at the same bytenr which indicates corruption, or</div><div class='del'>-			 *  we've made a mistake in the backref walking code.</div><div class='del'>-			 */</div><div class='del'>-			ASSERT(next-&gt;new_bytenr == 0);</div><div class='del'>-			ASSERT(list_empty(&amp;next-&gt;list));</div><div class='del'>-			if (next-&gt;new_bytenr || !list_empty(&amp;next-&gt;list)) {</div><div class='del'>-				btrfs_err(trans-&gt;fs_info,</div><div class='del'>-	"bytenr %llu possibly has multiple roots pointing at the same bytenr %llu",</div><div class='del'>-					  node-&gt;bytenr, next-&gt;bytenr);</div><div class='del'>-				return ERR_PTR(-EUCLEAN);</div><div class='del'>-			}</div><div class='add'>+	ret = btrfs_record_root_in_trans(trans, root);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ERR_PTR(ret);</div><div class='add'>+	root = root-&gt;reloc_root;</div><div class='ctx'> </div><div class='del'>-			next-&gt;new_bytenr = root-&gt;node-&gt;start;</div><div class='del'>-			btrfs_put_root(next-&gt;root);</div><div class='del'>-			next-&gt;root = btrfs_grab_root(root);</div><div class='del'>-			ASSERT(next-&gt;root);</div><div class='del'>-			list_add_tail(&amp;next-&gt;list,</div><div class='del'>-				      &amp;rc-&gt;backref_cache.changed);</div><div class='del'>-			mark_block_processed(rc, next);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='add'>+	/*</div><div class='add'>+	 * We could have raced with another thread which failed, so</div><div class='add'>+	 * root-&gt;reloc_root may not be set, return ENOENT in this case.</div><div class='add'>+	 */</div><div class='add'>+	if (!root)</div><div class='add'>+		return ERR_PTR(-ENOENT);</div><div class='ctx'> </div><div class='del'>-		WARN_ON(1);</div><div class='del'>-		root = NULL;</div><div class='del'>-		next = walk_down_backref(edges, &amp;index);</div><div class='del'>-		if (!next || next-&gt;level &lt;= node-&gt;level)</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-	if (!root) {</div><div class='add'>+	if (unlikely(next-&gt;new_bytenr)) {</div><div class='ctx'> 		/*</div><div class='del'>-		 * This can happen if there's fs corruption or if there's a bug</div><div class='del'>-		 * in the backref lookup code.</div><div class='add'>+		 * We just created the reloc root, so we shouldn't have</div><div class='add'>+		 * -&gt;new_bytenr set yet. If it is then we have multiple roots</div><div class='add'>+		 *  pointing at the same bytenr which indicates corruption, or</div><div class='add'>+		 *  we've made a mistake in the backref walking code.</div><div class='ctx'> 		 */</div><div class='del'>-		ASSERT(0);</div><div class='del'>-		return ERR_PTR(-ENOENT);</div><div class='add'>+		ASSERT(next-&gt;new_bytenr == 0);</div><div class='add'>+		btrfs_err(trans-&gt;fs_info,</div><div class='add'>+			  "bytenr %llu possibly has multiple roots pointing at the same bytenr %llu",</div><div class='add'>+			  node-&gt;bytenr, next-&gt;bytenr);</div><div class='add'>+		return ERR_PTR(-EUCLEAN);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	next-&gt;new_bytenr = root-&gt;node-&gt;start;</div><div class='add'>+	btrfs_put_root(next-&gt;root);</div><div class='add'>+	next-&gt;root = btrfs_grab_root(root);</div><div class='add'>+	ASSERT(next-&gt;root);</div><div class='add'>+	mark_block_processed(rc, next);</div><div class='add'>+found:</div><div class='ctx'> 	next = node;</div><div class='ctx'> 	/* setup backref node path for btrfs_reloc_cow_block */</div><div class='ctx'> 	while (1) {</div><div class='hunk'>@@ -2246,14 +2075,14 @@ struct btrfs_root *select_one_root(struct btrfs_backref_node *node)</div><div class='ctx'> 		 * This can occur if we have incomplete extent refs leading all</div><div class='ctx'> 		 * the way up a particular path, in this case return -EUCLEAN.</div><div class='ctx'> 		 */</div><div class='del'>-		if (!root)</div><div class='add'>+		if (unlikely(!root))</div><div class='ctx'> 			return ERR_PTR(-EUCLEAN);</div><div class='ctx'> </div><div class='ctx'> 		/* No other choice for non-shareable tree */</div><div class='ctx'> 		if (!test_bit(BTRFS_ROOT_SHAREABLE, &amp;root-&gt;state))</div><div class='ctx'> 			return root;</div><div class='ctx'> </div><div class='del'>-		if (root-&gt;root_key.objectid != BTRFS_TREE_RELOC_OBJECTID)</div><div class='add'>+		if (btrfs_root_id(root) != BTRFS_TREE_RELOC_OBJECTID)</div><div class='ctx'> 			fs_root = root;</div><div class='ctx'> </div><div class='ctx'> 		if (next != node)</div><div class='hunk'>@@ -2269,9 +2098,8 @@ struct btrfs_root *select_one_root(struct btrfs_backref_node *node)</div><div class='ctx'> 	return fs_root;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline_for_stack</div><div class='del'>-u64 calcu_metadata_size(struct reloc_control *rc,</div><div class='del'>-			struct btrfs_backref_node *node, int reserve)</div><div class='add'>+static noinline_for_stack u64 calcu_metadata_size(struct reloc_control *rc,</div><div class='add'>+						  struct btrfs_backref_node *node)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = rc-&gt;extent_root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_backref_node *next = node;</div><div class='hunk'>@@ -2280,12 +2108,12 @@ u64 calcu_metadata_size(struct reloc_control *rc,</div><div class='ctx'> 	u64 num_bytes = 0;</div><div class='ctx'> 	int index = 0;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(reserve &amp;&amp; node-&gt;processed);</div><div class='add'>+	BUG_ON(node-&gt;processed);</div><div class='ctx'> </div><div class='ctx'> 	while (next) {</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 		while (1) {</div><div class='del'>-			if (next-&gt;processed &amp;&amp; (reserve || next != node))</div><div class='add'>+			if (next-&gt;processed)</div><div class='ctx'> 				break;</div><div class='ctx'> </div><div class='ctx'> 			num_bytes += fs_info-&gt;nodesize;</div><div class='hunk'>@@ -2293,8 +2121,8 @@ u64 calcu_metadata_size(struct reloc_control *rc,</div><div class='ctx'> 			if (list_empty(&amp;next-&gt;upper))</div><div class='ctx'> 				break;</div><div class='ctx'> </div><div class='del'>-			edge = list_entry(next-&gt;upper.next,</div><div class='del'>-					struct btrfs_backref_edge, list[LOWER]);</div><div class='add'>+			edge = list_first_entry(&amp;next-&gt;upper, struct btrfs_backref_edge,</div><div class='add'>+						list[LOWER]);</div><div class='ctx'> 			edges[index++] = edge;</div><div class='ctx'> 			next = edge-&gt;node[UPPER];</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2303,17 +2131,11 @@ u64 calcu_metadata_size(struct reloc_control *rc,</div><div class='ctx'> 	return num_bytes;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int reserve_metadata_space(struct btrfs_trans_handle *trans,</div><div class='del'>-				  struct reloc_control *rc,</div><div class='del'>-				  struct btrfs_backref_node *node)</div><div class='add'>+static int refill_metadata_space(struct btrfs_trans_handle *trans,</div><div class='add'>+				 struct reloc_control *rc, u64 num_bytes)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *root = rc-&gt;extent_root;</div><div class='del'>-	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='del'>-	u64 num_bytes;</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	int ret;</div><div class='del'>-	u64 tmp;</div><div class='del'>-</div><div class='del'>-	num_bytes = calcu_metadata_size(rc, node, 1) * 2;</div><div class='ctx'> </div><div class='ctx'> 	trans-&gt;block_rsv = rc-&gt;block_rsv;</div><div class='ctx'> 	rc-&gt;reserved_bytes += num_bytes;</div><div class='hunk'>@@ -2323,10 +2145,11 @@ static int reserve_metadata_space(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * If we get an enospc just kick back -EAGAIN so we know to drop the</div><div class='ctx'> 	 * transaction and try to refill when we can flush all the things.</div><div class='ctx'> 	 */</div><div class='del'>-	ret = btrfs_block_rsv_refill(root, rc-&gt;block_rsv, num_bytes,</div><div class='del'>-				BTRFS_RESERVE_FLUSH_LIMIT);</div><div class='add'>+	ret = btrfs_block_rsv_refill(fs_info, rc-&gt;block_rsv, num_bytes,</div><div class='add'>+				     BTRFS_RESERVE_FLUSH_LIMIT);</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		tmp = fs_info-&gt;nodesize * RELOCATION_RESERVED_NODES;</div><div class='add'>+		u64 tmp = fs_info-&gt;nodesize * RELOCATION_RESERVED_NODES;</div><div class='add'>+</div><div class='ctx'> 		while (tmp &lt;= rc-&gt;reserved_bytes)</div><div class='ctx'> 			tmp &lt;&lt;= 1;</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -2344,6 +2167,16 @@ static int reserve_metadata_space(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int reserve_metadata_space(struct btrfs_trans_handle *trans,</div><div class='add'>+				  struct reloc_control *rc,</div><div class='add'>+				  struct btrfs_backref_node *node)</div><div class='add'>+{</div><div class='add'>+	u64 num_bytes;</div><div class='add'>+</div><div class='add'>+	num_bytes = calcu_metadata_size(rc, node) * 2;</div><div class='add'>+	return refill_metadata_space(trans, rc, num_bytes);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * relocate a block tree, and then update pointers in upper level</div><div class='ctx'>  * blocks that reference the block to point to the new location.</div><div class='hunk'>@@ -2376,8 +2209,6 @@ static int do_relocation(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	path-&gt;lowest_level = node-&gt;level + 1;</div><div class='ctx'> 	rc-&gt;backref_cache.path[node-&gt;level] = node;</div><div class='ctx'> 	list_for_each_entry(edge, &amp;node-&gt;upper, list[LOWER]) {</div><div class='del'>-		struct btrfs_ref ref = { 0 };</div><div class='del'>-</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> </div><div class='ctx'> 		upper = edge-&gt;node[UPPER];</div><div class='hunk'>@@ -2389,7 +2220,7 @@ static int do_relocation(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 		if (upper-&gt;eb &amp;&amp; !upper-&gt;locked) {</div><div class='ctx'> 			if (!lowest) {</div><div class='del'>-				ret = btrfs_bin_search(upper-&gt;eb, key, &amp;slot);</div><div class='add'>+				ret = btrfs_bin_search(upper-&gt;eb, 0, key, &amp;slot);</div><div class='ctx'> 				if (ret &lt; 0)</div><div class='ctx'> 					goto next;</div><div class='ctx'> 				BUG_ON(ret);</div><div class='hunk'>@@ -2423,7 +2254,7 @@ static int do_relocation(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			slot = path-&gt;slots[upper-&gt;level];</div><div class='ctx'> 			btrfs_release_path(path);</div><div class='ctx'> 		} else {</div><div class='del'>-			ret = btrfs_bin_search(upper-&gt;eb, key, &amp;slot);</div><div class='add'>+			ret = btrfs_bin_search(upper-&gt;eb, 0, key, &amp;slot);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='ctx'> 				goto next;</div><div class='ctx'> 			BUG_ON(ret);</div><div class='hunk'>@@ -2431,7 +2262,7 @@ static int do_relocation(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 		bytenr = btrfs_node_blockptr(upper-&gt;eb, slot);</div><div class='ctx'> 		if (lowest) {</div><div class='del'>-			if (bytenr != node-&gt;bytenr) {</div><div class='add'>+			if (unlikely(bytenr != node-&gt;bytenr)) {</div><div class='ctx'> 				btrfs_err(root-&gt;fs_info,</div><div class='ctx'> 		"lowest leaf/node mismatch: bytenr %llu node-&gt;bytenr %llu slot %d upper %llu",</div><div class='ctx'> 					  bytenr, node-&gt;bytenr, slot,</div><div class='hunk'>@@ -2465,23 +2296,28 @@ static int do_relocation(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			 */</div><div class='ctx'> 			ASSERT(node-&gt;eb == eb);</div><div class='ctx'> 		} else {</div><div class='add'>+			struct btrfs_ref ref = {</div><div class='add'>+				.action = BTRFS_ADD_DELAYED_REF,</div><div class='add'>+				.bytenr = node-&gt;eb-&gt;start,</div><div class='add'>+				.num_bytes = blocksize,</div><div class='add'>+				.parent = upper-&gt;eb-&gt;start,</div><div class='add'>+				.owning_root = btrfs_header_owner(upper-&gt;eb),</div><div class='add'>+				.ref_root = btrfs_header_owner(upper-&gt;eb),</div><div class='add'>+			};</div><div class='add'>+</div><div class='ctx'> 			btrfs_set_node_blockptr(upper-&gt;eb, slot,</div><div class='ctx'> 						node-&gt;eb-&gt;start);</div><div class='ctx'> 			btrfs_set_node_ptr_generation(upper-&gt;eb, slot,</div><div class='ctx'> 						      trans-&gt;transid);</div><div class='del'>-			btrfs_mark_buffer_dirty(upper-&gt;eb);</div><div class='add'>+			btrfs_mark_buffer_dirty(trans, upper-&gt;eb);</div><div class='ctx'> </div><div class='del'>-			btrfs_init_generic_ref(&amp;ref, BTRFS_ADD_DELAYED_REF,</div><div class='del'>-					       node-&gt;eb-&gt;start, blocksize,</div><div class='del'>-					       upper-&gt;eb-&gt;start);</div><div class='ctx'> 			btrfs_init_tree_ref(&amp;ref, node-&gt;level,</div><div class='del'>-					    btrfs_header_owner(upper-&gt;eb),</div><div class='del'>-					    root-&gt;root_key.objectid, false);</div><div class='add'>+					    btrfs_root_id(root), false);</div><div class='ctx'> 			ret = btrfs_inc_extent_ref(trans, &amp;ref);</div><div class='ctx'> 			if (!ret)</div><div class='ctx'> 				ret = btrfs_drop_subtree(trans, root, eb,</div><div class='ctx'> 							 upper-&gt;eb);</div><div class='del'>-			if (ret)</div><div class='add'>+			if (unlikely(ret))</div><div class='ctx'> 				btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		}</div><div class='ctx'> next:</div><div class='hunk'>@@ -2495,7 +2331,7 @@ next:</div><div class='ctx'> </div><div class='ctx'> 	if (!ret &amp;&amp; node-&gt;pending) {</div><div class='ctx'> 		btrfs_backref_drop_node_buffer(node);</div><div class='del'>-		list_move_tail(&amp;node-&gt;list, &amp;rc-&gt;backref_cache.changed);</div><div class='add'>+		list_del_init(&amp;node-&gt;list);</div><div class='ctx'> 		node-&gt;pending = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -2532,8 +2368,8 @@ static int finish_pending_nodes(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	for (level = 0; level &lt; BTRFS_MAX_LEVEL; level++) {</div><div class='ctx'> 		while (!list_empty(&amp;cache-&gt;pending[level])) {</div><div class='del'>-			node = list_entry(cache-&gt;pending[level].next,</div><div class='del'>-					  struct btrfs_backref_node, list);</div><div class='add'>+			node = list_first_entry(&amp;cache-&gt;pending[level],</div><div class='add'>+						struct btrfs_backref_node, list);</div><div class='ctx'> 			list_move_tail(&amp;node-&gt;list, &amp;list);</div><div class='ctx'> 			BUG_ON(!node-&gt;pending);</div><div class='ctx'> </div><div class='hunk'>@@ -2571,8 +2407,8 @@ static void update_processed_blocks(struct reloc_control *rc,</div><div class='ctx'> 			if (list_empty(&amp;next-&gt;upper))</div><div class='ctx'> 				break;</div><div class='ctx'> </div><div class='del'>-			edge = list_entry(next-&gt;upper.next,</div><div class='del'>-					struct btrfs_backref_edge, list[LOWER]);</div><div class='add'>+			edge = list_first_entry(&amp;next-&gt;upper, struct btrfs_backref_edge,</div><div class='add'>+						list[LOWER]);</div><div class='ctx'> 			edges[index++] = edge;</div><div class='ctx'> 			next = edge-&gt;node[UPPER];</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2584,8 +2420,8 @@ static int tree_block_processed(u64 bytenr, struct reloc_control *rc)</div><div class='ctx'> {</div><div class='ctx'> 	u32 blocksize = rc-&gt;extent_root-&gt;fs_info-&gt;nodesize;</div><div class='ctx'> </div><div class='del'>-	if (test_range_bit(&amp;rc-&gt;processed_blocks, bytenr,</div><div class='del'>-			   bytenr + blocksize - 1, EXTENT_DIRTY, 1, NULL))</div><div class='add'>+	if (btrfs_test_range_bit(&amp;rc-&gt;processed_blocks, bytenr,</div><div class='add'>+				 bytenr + blocksize - 1, EXTENT_DIRTY, NULL))</div><div class='ctx'> 		return 1;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -2593,13 +2429,17 @@ static int tree_block_processed(u64 bytenr, struct reloc_control *rc)</div><div class='ctx'> static int get_tree_block_key(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			      struct tree_block *block)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_tree_parent_check check = {</div><div class='add'>+		.level = block-&gt;level,</div><div class='add'>+		.owner_root = block-&gt;owner,</div><div class='add'>+		.transid = block-&gt;key.offset</div><div class='add'>+	};</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='ctx'> </div><div class='del'>-	eb = read_tree_block(fs_info, block-&gt;bytenr, block-&gt;owner,</div><div class='del'>-			     block-&gt;key.offset, block-&gt;level, NULL);</div><div class='del'>-	if (IS_ERR(eb)) {</div><div class='add'>+	eb = read_tree_block(fs_info, block-&gt;bytenr, &amp;check);</div><div class='add'>+	if (IS_ERR(eb))</div><div class='ctx'> 		return PTR_ERR(eb);</div><div class='del'>-	} else if (!extent_buffer_uptodate(eb)) {</div><div class='add'>+	if (unlikely(!extent_buffer_uptodate(eb))) {</div><div class='ctx'> 		free_extent_buffer(eb);</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2608,7 +2448,7 @@ static int get_tree_block_key(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	else</div><div class='ctx'> 		btrfs_node_key_to_cpu(eb, &amp;block-&gt;key, 0);</div><div class='ctx'> 	free_extent_buffer(eb);</div><div class='del'>-	block-&gt;key_ready = 1;</div><div class='add'>+	block-&gt;key_ready = true;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2654,8 +2494,7 @@ static int relocate_tree_block(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * This block was the root block of a root, and this is</div><div class='ctx'> 			 * the first time we're processing the block and thus it</div><div class='del'>-			 * should not have had the -&gt;new_bytenr modified and</div><div class='del'>-			 * should have not been included on the changed list.</div><div class='add'>+			 * should not have had the -&gt;new_bytenr modified.</div><div class='ctx'> 			 *</div><div class='ctx'> 			 * However in the case of corruption we could have</div><div class='ctx'> 			 * multiple refs pointing to the same block improperly,</div><div class='hunk'>@@ -2665,8 +2504,7 @@ static int relocate_tree_block(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			 * normal user in the case of corruption.</div><div class='ctx'> 			 */</div><div class='ctx'> 			ASSERT(node-&gt;new_bytenr == 0);</div><div class='del'>-			ASSERT(list_empty(&amp;node-&gt;list));</div><div class='del'>-			if (node-&gt;new_bytenr || !list_empty(&amp;node-&gt;list)) {</div><div class='add'>+			if (unlikely(node-&gt;new_bytenr)) {</div><div class='ctx'> 				btrfs_err(root-&gt;fs_info,</div><div class='ctx'> 				  "bytenr %llu has improper references to it",</div><div class='ctx'> 					  node-&gt;bytenr);</div><div class='hunk'>@@ -2689,17 +2527,12 @@ static int relocate_tree_block(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			btrfs_put_root(node-&gt;root);</div><div class='ctx'> 			node-&gt;root = btrfs_grab_root(root);</div><div class='ctx'> 			ASSERT(node-&gt;root);</div><div class='del'>-			list_add_tail(&amp;node-&gt;list, &amp;rc-&gt;backref_cache.changed);</div><div class='ctx'> 		} else {</div><div class='del'>-			path-&gt;lowest_level = node-&gt;level;</div><div class='del'>-			if (root == root-&gt;fs_info-&gt;chunk_root)</div><div class='del'>-				btrfs_reserve_chunk_metadata(trans, false);</div><div class='del'>-			ret = btrfs_search_slot(trans, root, key, path, 0, 1);</div><div class='del'>-			btrfs_release_path(path);</div><div class='del'>-			if (root == root-&gt;fs_info-&gt;chunk_root)</div><div class='del'>-				btrfs_trans_release_chunk_metadata(trans);</div><div class='del'>-			if (ret &gt; 0)</div><div class='del'>-				ret = 0;</div><div class='add'>+			btrfs_err(root-&gt;fs_info,</div><div class='add'>+				  "bytenr %llu resolved to a non-shareable root",</div><div class='add'>+				  node-&gt;bytenr);</div><div class='add'>+			ret = -EUCLEAN;</div><div class='add'>+			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (!ret)</div><div class='ctx'> 			update_processed_blocks(rc, node);</div><div class='hunk'>@@ -2707,11 +2540,50 @@ static int relocate_tree_block(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		ret = do_relocation(trans, rc, node, key, path, 1);</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='del'>-	if (ret || node-&gt;level == 0 || node-&gt;cowonly)</div><div class='add'>+	if (ret || node-&gt;level == 0)</div><div class='ctx'> 		btrfs_backref_cleanup_node(&amp;rc-&gt;backref_cache, node);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int relocate_cowonly_block(struct btrfs_trans_handle *trans,</div><div class='add'>+				  struct reloc_control *rc, struct tree_block *block,</div><div class='add'>+				  struct btrfs_path *path)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='add'>+	struct btrfs_root *root;</div><div class='add'>+	u64 num_bytes;</div><div class='add'>+	int nr_levels;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	root = btrfs_get_fs_root(fs_info, block-&gt;owner, true);</div><div class='add'>+	if (IS_ERR(root))</div><div class='add'>+		return PTR_ERR(root);</div><div class='add'>+</div><div class='add'>+	nr_levels = max(btrfs_header_level(root-&gt;node) - block-&gt;level, 0) + 1;</div><div class='add'>+</div><div class='add'>+	num_bytes = fs_info-&gt;nodesize * nr_levels;</div><div class='add'>+	ret = refill_metadata_space(trans, rc, num_bytes);</div><div class='add'>+	if (ret) {</div><div class='add'>+		btrfs_put_root(root);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+	path-&gt;lowest_level = block-&gt;level;</div><div class='add'>+	if (root == root-&gt;fs_info-&gt;chunk_root)</div><div class='add'>+		btrfs_reserve_chunk_metadata(trans, false);</div><div class='add'>+</div><div class='add'>+	ret = btrfs_search_slot(trans, root, &amp;block-&gt;key, path, 0, 1);</div><div class='add'>+	path-&gt;lowest_level = 0;</div><div class='add'>+	btrfs_release_path(path);</div><div class='add'>+</div><div class='add'>+	if (root == root-&gt;fs_info-&gt;chunk_root)</div><div class='add'>+		btrfs_trans_release_chunk_metadata(trans);</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		ret = 0;</div><div class='add'>+	btrfs_put_root(root);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * relocate a list of blocks</div><div class='ctx'>  */</div><div class='hunk'>@@ -2724,12 +2596,11 @@ int relocate_tree_blocks(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	struct btrfs_path *path;</div><div class='ctx'> 	struct tree_block *block;</div><div class='ctx'> 	struct tree_block *next;</div><div class='del'>-	int ret;</div><div class='del'>-	int err = 0;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path) {</div><div class='del'>-		err = -ENOMEM;</div><div class='add'>+		ret = -ENOMEM;</div><div class='ctx'> 		goto out_free_blocks;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -2744,112 +2615,79 @@ int relocate_tree_blocks(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	/* Get first keys */</div><div class='ctx'> 	rbtree_postorder_for_each_entry_safe(block, next, blocks, rb_node) {</div><div class='ctx'> 		if (!block-&gt;key_ready) {</div><div class='del'>-			err = get_tree_block_key(fs_info, block);</div><div class='del'>-			if (err)</div><div class='add'>+			ret = get_tree_block_key(fs_info, block);</div><div class='add'>+			if (ret)</div><div class='ctx'> 				goto out_free_path;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Do tree relocation */</div><div class='ctx'> 	rbtree_postorder_for_each_entry_safe(block, next, blocks, rb_node) {</div><div class='del'>-		node = build_backref_tree(rc, &amp;block-&gt;key,</div><div class='add'>+		/*</div><div class='add'>+		 * For COWonly blocks, or the data reloc tree, we only need to</div><div class='add'>+		 * COW down to the block, there's no need to generate a backref</div><div class='add'>+		 * tree.</div><div class='add'>+		 */</div><div class='add'>+		if (block-&gt;owner &amp;&amp;</div><div class='add'>+		    (!btrfs_is_fstree(block-&gt;owner) ||</div><div class='add'>+		     block-&gt;owner == BTRFS_DATA_RELOC_TREE_OBJECTID)) {</div><div class='add'>+			ret = relocate_cowonly_block(trans, rc, block, path);</div><div class='add'>+			if (ret)</div><div class='add'>+				break;</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		node = build_backref_tree(trans, rc, &amp;block-&gt;key,</div><div class='ctx'> 					  block-&gt;level, block-&gt;bytenr);</div><div class='ctx'> 		if (IS_ERR(node)) {</div><div class='del'>-			err = PTR_ERR(node);</div><div class='add'>+			ret = PTR_ERR(node);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		ret = relocate_tree_block(trans, rc, node, &amp;block-&gt;key,</div><div class='ctx'> 					  path);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			err = ret;</div><div class='add'>+		if (ret &lt; 0)</div><div class='ctx'> 			break;</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='del'>-	err = finish_pending_nodes(trans, rc, path, err);</div><div class='add'>+	ret = finish_pending_nodes(trans, rc, path, ret);</div><div class='ctx'> </div><div class='ctx'> out_free_path:</div><div class='ctx'> 	btrfs_free_path(path);</div><div class='ctx'> out_free_blocks:</div><div class='ctx'> 	free_block_list(blocks);</div><div class='del'>-	return err;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline_for_stack int prealloc_file_extent_cluster(</div><div class='del'>-				struct btrfs_inode *inode,</div><div class='del'>-				struct file_extent_cluster *cluster)</div><div class='add'>+static noinline_for_stack int prealloc_file_extent_cluster(struct reloc_control *rc)</div><div class='ctx'> {</div><div class='add'>+	const struct file_extent_cluster *cluster = &amp;rc-&gt;cluster;</div><div class='add'>+	struct btrfs_inode *inode = BTRFS_I(rc-&gt;data_inode);</div><div class='ctx'> 	u64 alloc_hint = 0;</div><div class='ctx'> 	u64 start;</div><div class='ctx'> 	u64 end;</div><div class='del'>-	u64 offset = inode-&gt;index_cnt;</div><div class='add'>+	u64 offset = inode-&gt;reloc_block_group_start;</div><div class='ctx'> 	u64 num_bytes;</div><div class='ctx'> 	int nr;</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	u64 i_size = i_size_read(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> 	u64 prealloc_start = cluster-&gt;start - offset;</div><div class='ctx'> 	u64 prealloc_end = cluster-&gt;end - offset;</div><div class='ctx'> 	u64 cur_offset = prealloc_start;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * For subpage case, previous i_size may not be aligned to PAGE_SIZE.</div><div class='del'>-	 * This means the range [i_size, PAGE_END + 1) is filled with zeros by</div><div class='del'>-	 * btrfs_do_readpage() call of previously relocated file cluster.</div><div class='add'>+	 * For blocksize &lt; folio size case (either bs &lt; page size or large folios),</div><div class='add'>+	 * beyond i_size, all blocks are filled with zero.</div><div class='ctx'> 	 *</div><div class='del'>-	 * If the current cluster starts in the above range, btrfs_do_readpage()</div><div class='del'>-	 * will skip the read, and relocate_one_page() will later writeback</div><div class='add'>+	 * If the current cluster covers the above range, btrfs_do_readpage()</div><div class='add'>+	 * will skip the read, and relocate_one_folio() will later writeback</div><div class='ctx'> 	 * the padding zeros as new data, causing data corruption.</div><div class='ctx'> 	 *</div><div class='del'>-	 * Here we have to manually invalidate the range (i_size, PAGE_END + 1).</div><div class='add'>+	 * Here we have to invalidate the cache covering our cluster.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!IS_ALIGNED(i_size, PAGE_SIZE)) {</div><div class='del'>-		struct address_space *mapping = inode-&gt;vfs_inode.i_mapping;</div><div class='del'>-		struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='del'>-		const u32 sectorsize = fs_info-&gt;sectorsize;</div><div class='del'>-		struct page *page;</div><div class='del'>-</div><div class='del'>-		ASSERT(sectorsize &lt; PAGE_SIZE);</div><div class='del'>-		ASSERT(IS_ALIGNED(i_size, sectorsize));</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Subpage can't handle page with DIRTY but without UPTODATE</div><div class='del'>-		 * bit as it can lead to the following deadlock:</div><div class='del'>-		 *</div><div class='del'>-		 * btrfs_readpage()</div><div class='del'>-		 * | Page already *locked*</div><div class='del'>-		 * |- btrfs_lock_and_flush_ordered_range()</div><div class='del'>-		 *    |- btrfs_start_ordered_extent()</div><div class='del'>-		 *       |- extent_write_cache_pages()</div><div class='del'>-		 *          |- lock_page()</div><div class='del'>-		 *             We try to lock the page we already hold.</div><div class='del'>-		 *</div><div class='del'>-		 * Here we just writeback the whole data reloc inode, so that</div><div class='del'>-		 * we will be ensured to have no dirty range in the page, and</div><div class='del'>-		 * are safe to clear the uptodate bits.</div><div class='del'>-		 *</div><div class='del'>-		 * This shouldn't cause too much overhead, as we need to write</div><div class='del'>-		 * the data back anyway.</div><div class='del'>-		 */</div><div class='del'>-		ret = filemap_write_and_wait(mapping);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			return ret;</div><div class='del'>-</div><div class='del'>-		clear_extent_bits(&amp;inode-&gt;io_tree, i_size,</div><div class='del'>-				  round_up(i_size, PAGE_SIZE) - 1,</div><div class='del'>-				  EXTENT_UPTODATE);</div><div class='del'>-		page = find_lock_page(mapping, i_size &gt;&gt; PAGE_SHIFT);</div><div class='del'>-		/*</div><div class='del'>-		 * If page is freed we don't need to do anything then, as we</div><div class='del'>-		 * will re-read the whole page anyway.</div><div class='del'>-		 */</div><div class='del'>-		if (page) {</div><div class='del'>-			btrfs_subpage_clear_uptodate(fs_info, page, i_size,</div><div class='del'>-					round_up(i_size, PAGE_SIZE) - i_size);</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			put_page(page);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	ret = filemap_invalidate_inode(&amp;inode-&gt;vfs_inode, true, prealloc_start,</div><div class='add'>+				       prealloc_end);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(cluster-&gt;start != cluster-&gt;boundary[0]);</div><div class='ctx'> 	ret = btrfs_alloc_data_chunk_ondemand(inode,</div><div class='hunk'>@@ -2857,68 +2695,67 @@ static noinline_for_stack int prealloc_file_extent_cluster(</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	btrfs_inode_lock(&amp;inode-&gt;vfs_inode, 0);</div><div class='add'>+	btrfs_inode_lock(inode, 0);</div><div class='ctx'> 	for (nr = 0; nr &lt; cluster-&gt;nr; nr++) {</div><div class='add'>+		struct extent_state *cached_state = NULL;</div><div class='add'>+</div><div class='ctx'> 		start = cluster-&gt;boundary[nr] - offset;</div><div class='ctx'> 		if (nr + 1 &lt; cluster-&gt;nr)</div><div class='ctx'> 			end = cluster-&gt;boundary[nr + 1] - 1 - offset;</div><div class='ctx'> 		else</div><div class='ctx'> 			end = cluster-&gt;end - offset;</div><div class='ctx'> </div><div class='del'>-		lock_extent(&amp;inode-&gt;io_tree, start, end);</div><div class='add'>+		btrfs_lock_extent(&amp;inode-&gt;io_tree, start, end, &amp;cached_state);</div><div class='ctx'> 		num_bytes = end + 1 - start;</div><div class='ctx'> 		ret = btrfs_prealloc_file_range(&amp;inode-&gt;vfs_inode, 0, start,</div><div class='ctx'> 						num_bytes, num_bytes,</div><div class='ctx'> 						end + 1, &amp;alloc_hint);</div><div class='ctx'> 		cur_offset = end + 1;</div><div class='del'>-		unlock_extent(&amp;inode-&gt;io_tree, start, end);</div><div class='add'>+		btrfs_unlock_extent(&amp;inode-&gt;io_tree, start, end, &amp;cached_state);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_inode_unlock(&amp;inode-&gt;vfs_inode, 0);</div><div class='add'>+	btrfs_inode_unlock(inode, 0);</div><div class='ctx'> </div><div class='ctx'> 	if (cur_offset &lt; prealloc_end)</div><div class='del'>-		btrfs_free_reserved_data_space_noquota(inode-&gt;root-&gt;fs_info,</div><div class='del'>-					       prealloc_end + 1 - cur_offset);</div><div class='add'>+		btrfs_free_reserved_data_space_noquota(inode,</div><div class='add'>+						       prealloc_end + 1 - cur_offset);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline_for_stack int setup_relocation_extent_mapping(struct inode *inode,</div><div class='del'>-				u64 start, u64 end, u64 block_start)</div><div class='add'>+static noinline_for_stack int setup_relocation_extent_mapping(struct reloc_control *rc)</div><div class='ctx'> {</div><div class='del'>-	struct extent_map_tree *em_tree = &amp;BTRFS_I(inode)-&gt;extent_tree;</div><div class='add'>+	struct btrfs_inode *inode = BTRFS_I(rc-&gt;data_inode);</div><div class='ctx'> 	struct extent_map *em;</div><div class='add'>+	struct extent_state *cached_state = NULL;</div><div class='add'>+	u64 offset = inode-&gt;reloc_block_group_start;</div><div class='add'>+	u64 start = rc-&gt;cluster.start - offset;</div><div class='add'>+	u64 end = rc-&gt;cluster.end - offset;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	em = alloc_extent_map();</div><div class='add'>+	em = btrfs_alloc_extent_map();</div><div class='ctx'> 	if (!em)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	em-&gt;start = start;</div><div class='ctx'> 	em-&gt;len = end + 1 - start;</div><div class='del'>-	em-&gt;block_len = em-&gt;len;</div><div class='del'>-	em-&gt;block_start = block_start;</div><div class='del'>-	set_bit(EXTENT_FLAG_PINNED, &amp;em-&gt;flags);</div><div class='add'>+	em-&gt;disk_bytenr = rc-&gt;cluster.start;</div><div class='add'>+	em-&gt;disk_num_bytes = em-&gt;len;</div><div class='add'>+	em-&gt;ram_bytes = em-&gt;len;</div><div class='add'>+	em-&gt;flags |= EXTENT_FLAG_PINNED;</div><div class='add'>+</div><div class='add'>+	btrfs_lock_extent(&amp;inode-&gt;io_tree, start, end, &amp;cached_state);</div><div class='add'>+	ret = btrfs_replace_extent_map_range(inode, em, false);</div><div class='add'>+	btrfs_unlock_extent(&amp;inode-&gt;io_tree, start, end, &amp;cached_state);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='del'>-	lock_extent(&amp;BTRFS_I(inode)-&gt;io_tree, start, end);</div><div class='del'>-	while (1) {</div><div class='del'>-		write_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-		ret = add_extent_mapping(em_tree, em, 0);</div><div class='del'>-		write_unlock(&amp;em_tree-&gt;lock);</div><div class='del'>-		if (ret != -EEXIST) {</div><div class='del'>-			free_extent_map(em);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		btrfs_drop_extent_cache(BTRFS_I(inode), start, end, 0);</div><div class='del'>-	}</div><div class='del'>-	unlock_extent(&amp;BTRFS_I(inode)-&gt;io_tree, start, end);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Allow error injection to test balance/relocation cancellation</div><div class='ctx'>  */</div><div class='del'>-noinline int btrfs_should_cancel_balance(struct btrfs_fs_info *fs_info)</div><div class='add'>+noinline int btrfs_should_cancel_balance(const struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	return atomic_read(&amp;fs_info-&gt;balance_cancel_req) ||</div><div class='ctx'> 		atomic_read(&amp;fs_info-&gt;reloc_cancel_req) ||</div><div class='hunk'>@@ -2926,7 +2763,7 @@ noinline int btrfs_should_cancel_balance(struct btrfs_fs_info *fs_info)</div><div class='ctx'> }</div><div class='ctx'> ALLOW_ERROR_INJECTION(btrfs_should_cancel_balance, TRUE);</div><div class='ctx'> </div><div class='del'>-static u64 get_cluster_boundary_end(struct file_extent_cluster *cluster,</div><div class='add'>+static u64 get_cluster_boundary_end(const struct file_extent_cluster *cluster,</div><div class='ctx'> 				    int cluster_nr)</div><div class='ctx'> {</div><div class='ctx'> 	/* Last extent, use cluster end directly */</div><div class='hunk'>@@ -2937,103 +2774,138 @@ static u64 get_cluster_boundary_end(struct file_extent_cluster *cluster,</div><div class='ctx'> 	return cluster-&gt;boundary[cluster_nr + 1] - 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int relocate_one_page(struct inode *inode, struct file_ra_state *ra,</div><div class='del'>-			     struct file_extent_cluster *cluster,</div><div class='del'>-			     int *cluster_nr, unsigned long page_index)</div><div class='add'>+static int relocate_one_folio(struct reloc_control *rc,</div><div class='add'>+			      struct file_ra_state *ra,</div><div class='add'>+			      int *cluster_nr, u64 *file_offset_ret)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(inode-&gt;i_sb);</div><div class='del'>-	u64 offset = BTRFS_I(inode)-&gt;index_cnt;</div><div class='del'>-	const unsigned long last_index = (cluster-&gt;end - offset) &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	const struct file_extent_cluster *cluster = &amp;rc-&gt;cluster;</div><div class='add'>+	struct inode *inode = rc-&gt;data_inode;</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode_to_fs_info(inode);</div><div class='add'>+	const u64 orig_file_offset = *file_offset_ret;</div><div class='add'>+	u64 offset = BTRFS_I(inode)-&gt;reloc_block_group_start;</div><div class='add'>+	const pgoff_t last_index = (cluster-&gt;end - offset) &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	const pgoff_t index = orig_file_offset &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> 	gfp_t mask = btrfs_alloc_write_mask(inode-&gt;i_mapping);</div><div class='del'>-	struct page *page;</div><div class='del'>-	u64 page_start;</div><div class='del'>-	u64 page_end;</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	u64 folio_start;</div><div class='add'>+	u64 folio_end;</div><div class='ctx'> 	u64 cur;</div><div class='ctx'> 	int ret;</div><div class='add'>+	const bool use_rst = btrfs_need_stripe_tree_update(fs_info, rc-&gt;block_group-&gt;flags);</div><div class='add'>+</div><div class='add'>+	ASSERT(index &lt;= last_index);</div><div class='add'>+again:</div><div class='add'>+	folio = filemap_lock_folio(inode-&gt;i_mapping, index);</div><div class='add'>+	if (IS_ERR(folio)) {</div><div class='ctx'> </div><div class='del'>-	ASSERT(page_index &lt;= last_index);</div><div class='del'>-	page = find_lock_page(inode-&gt;i_mapping, page_index);</div><div class='del'>-	if (!page) {</div><div class='del'>-		page_cache_sync_readahead(inode-&gt;i_mapping, ra, NULL,</div><div class='del'>-				page_index, last_index + 1 - page_index);</div><div class='del'>-		page = find_or_create_page(inode-&gt;i_mapping, page_index, mask);</div><div class='del'>-		if (!page)</div><div class='del'>-			return -ENOMEM;</div><div class='add'>+		/*</div><div class='add'>+		 * On relocation we're doing readahead on the relocation inode,</div><div class='add'>+		 * but if the filesystem is backed by a RAID stripe tree we can</div><div class='add'>+		 * get ENOENT (e.g. due to preallocated extents not being</div><div class='add'>+		 * mapped in the RST) from the lookup.</div><div class='add'>+		 *</div><div class='add'>+		 * But readahead doesn't handle the error and submits invalid</div><div class='add'>+		 * reads to the device, causing a assertion failures.</div><div class='add'>+		 */</div><div class='add'>+		if (!use_rst)</div><div class='add'>+			page_cache_sync_readahead(inode-&gt;i_mapping, ra, NULL,</div><div class='add'>+						  index, last_index + 1 - index);</div><div class='add'>+		folio = __filemap_get_folio(inode-&gt;i_mapping, index,</div><div class='add'>+					    FGP_LOCK | FGP_ACCESSED | FGP_CREAT,</div><div class='add'>+					    mask);</div><div class='add'>+		if (IS_ERR(folio))</div><div class='add'>+			return PTR_ERR(folio);</div><div class='ctx'> 	}</div><div class='del'>-	ret = set_page_extent_mapped(page);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto release_page;</div><div class='ctx'> </div><div class='del'>-	if (PageReadahead(page))</div><div class='del'>-		page_cache_async_readahead(inode-&gt;i_mapping, ra, NULL, page,</div><div class='del'>-				   page_index, last_index + 1 - page_index);</div><div class='add'>+	if (folio_test_readahead(folio) &amp;&amp; !use_rst)</div><div class='add'>+		page_cache_async_readahead(inode-&gt;i_mapping, ra, NULL,</div><div class='add'>+					   folio, last_index + 1 - index);</div><div class='ctx'> </div><div class='del'>-	if (!PageUptodate(page)) {</div><div class='del'>-		btrfs_readpage(NULL, page);</div><div class='del'>-		lock_page(page);</div><div class='del'>-		if (!PageUptodate(page)) {</div><div class='add'>+	if (!folio_test_uptodate(folio)) {</div><div class='add'>+		btrfs_read_folio(NULL, folio);</div><div class='add'>+		folio_lock(folio);</div><div class='add'>+		if (unlikely(!folio_test_uptodate(folio))) {</div><div class='ctx'> 			ret = -EIO;</div><div class='del'>-			goto release_page;</div><div class='add'>+			goto release_folio;</div><div class='add'>+		}</div><div class='add'>+		if (folio-&gt;mapping != inode-&gt;i_mapping) {</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+			folio_put(folio);</div><div class='add'>+			goto again;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	page_start = page_offset(page);</div><div class='del'>-	page_end = page_start + PAGE_SIZE - 1;</div><div class='add'>+	/*</div><div class='add'>+	 * We could have lost folio private when we dropped the lock to read the</div><div class='add'>+	 * folio above, make sure we set_folio_extent_mapped() here so we have any</div><div class='add'>+	 * of the subpage blocksize stuff we need in place.</div><div class='add'>+	 */</div><div class='add'>+	ret = set_folio_extent_mapped(folio);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto release_folio;</div><div class='add'>+</div><div class='add'>+	folio_start = folio_pos(folio);</div><div class='add'>+	folio_end = folio_start + folio_size(folio) - 1;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Start from the cluster, as for subpage case, the cluster can start</div><div class='del'>-	 * inside the page.</div><div class='add'>+	 * inside the folio.</div><div class='ctx'> 	 */</div><div class='del'>-	cur = max(page_start, cluster-&gt;boundary[*cluster_nr] - offset);</div><div class='del'>-	while (cur &lt;= page_end) {</div><div class='add'>+	cur = max(folio_start, cluster-&gt;boundary[*cluster_nr] - offset);</div><div class='add'>+	while (cur &lt;= folio_end) {</div><div class='add'>+		struct extent_state *cached_state = NULL;</div><div class='ctx'> 		u64 extent_start = cluster-&gt;boundary[*cluster_nr] - offset;</div><div class='ctx'> 		u64 extent_end = get_cluster_boundary_end(cluster,</div><div class='ctx'> 						*cluster_nr) - offset;</div><div class='del'>-		u64 clamped_start = max(page_start, extent_start);</div><div class='del'>-		u64 clamped_end = min(page_end, extent_end);</div><div class='add'>+		u64 clamped_start = max(folio_start, extent_start);</div><div class='add'>+		u64 clamped_end = min(folio_end, extent_end);</div><div class='ctx'> 		u32 clamped_len = clamped_end + 1 - clamped_start;</div><div class='ctx'> </div><div class='ctx'> 		/* Reserve metadata for this range */</div><div class='ctx'> 		ret = btrfs_delalloc_reserve_metadata(BTRFS_I(inode),</div><div class='del'>-						      clamped_len);</div><div class='add'>+						      clamped_len, clamped_len,</div><div class='add'>+						      false);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			goto release_page;</div><div class='add'>+			goto release_folio;</div><div class='ctx'> </div><div class='ctx'> 		/* Mark the range delalloc and dirty for later writeback */</div><div class='del'>-		lock_extent(&amp;BTRFS_I(inode)-&gt;io_tree, clamped_start, clamped_end);</div><div class='add'>+		btrfs_lock_extent(&amp;BTRFS_I(inode)-&gt;io_tree, clamped_start,</div><div class='add'>+				  clamped_end, &amp;cached_state);</div><div class='ctx'> 		ret = btrfs_set_extent_delalloc(BTRFS_I(inode), clamped_start,</div><div class='del'>-						clamped_end, 0, NULL);</div><div class='add'>+						clamped_end, 0, &amp;cached_state);</div><div class='ctx'> 		if (ret) {</div><div class='del'>-			clear_extent_bits(&amp;BTRFS_I(inode)-&gt;io_tree,</div><div class='del'>-					clamped_start, clamped_end,</div><div class='del'>-					EXTENT_LOCKED | EXTENT_BOUNDARY);</div><div class='add'>+			btrfs_clear_extent_bit(&amp;BTRFS_I(inode)-&gt;io_tree,</div><div class='add'>+					       clamped_start, clamped_end,</div><div class='add'>+					       EXTENT_LOCKED | EXTENT_BOUNDARY,</div><div class='add'>+					       &amp;cached_state);</div><div class='ctx'> 			btrfs_delalloc_release_metadata(BTRFS_I(inode),</div><div class='ctx'> 							clamped_len, true);</div><div class='ctx'> 			btrfs_delalloc_release_extents(BTRFS_I(inode),</div><div class='ctx'> 						       clamped_len);</div><div class='del'>-			goto release_page;</div><div class='add'>+			goto release_folio;</div><div class='ctx'> 		}</div><div class='del'>-		btrfs_page_set_dirty(fs_info, page, clamped_start, clamped_len);</div><div class='add'>+		btrfs_folio_set_dirty(fs_info, folio, clamped_start, clamped_len);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * Set the boundary if it's inside the page.</div><div class='add'>+		 * Set the boundary if it's inside the folio.</div><div class='ctx'> 		 * Data relocation requires the destination extents to have the</div><div class='ctx'> 		 * same size as the source.</div><div class='ctx'> 		 * EXTENT_BOUNDARY bit prevents current extent from being merged</div><div class='ctx'> 		 * with previous extent.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (in_range(cluster-&gt;boundary[*cluster_nr] - offset,</div><div class='del'>-			     page_start, PAGE_SIZE)) {</div><div class='add'>+			     folio_start, folio_size(folio))) {</div><div class='ctx'> 			u64 boundary_start = cluster-&gt;boundary[*cluster_nr] -</div><div class='ctx'> 						offset;</div><div class='ctx'> 			u64 boundary_end = boundary_start +</div><div class='ctx'> 					   fs_info-&gt;sectorsize - 1;</div><div class='ctx'> </div><div class='del'>-			set_extent_bits(&amp;BTRFS_I(inode)-&gt;io_tree,</div><div class='del'>-					boundary_start, boundary_end,</div><div class='del'>-					EXTENT_BOUNDARY);</div><div class='add'>+			btrfs_set_extent_bit(&amp;BTRFS_I(inode)-&gt;io_tree,</div><div class='add'>+					     boundary_start, boundary_end,</div><div class='add'>+					     EXTENT_BOUNDARY, NULL);</div><div class='ctx'> 		}</div><div class='del'>-		unlock_extent(&amp;BTRFS_I(inode)-&gt;io_tree, clamped_start, clamped_end);</div><div class='add'>+		btrfs_unlock_extent(&amp;BTRFS_I(inode)-&gt;io_tree, clamped_start, clamped_end,</div><div class='add'>+				    &amp;cached_state);</div><div class='ctx'> 		btrfs_delalloc_release_extents(BTRFS_I(inode), clamped_len);</div><div class='ctx'> 		cur += clamped_len;</div><div class='ctx'> </div><div class='hunk'>@@ -3045,28 +2917,29 @@ static int relocate_one_page(struct inode *inode, struct file_ra_state *ra,</div><div class='ctx'> 				break;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> </div><div class='ctx'> 	balance_dirty_pages_ratelimited(inode-&gt;i_mapping);</div><div class='ctx'> 	btrfs_throttle(fs_info);</div><div class='ctx'> 	if (btrfs_should_cancel_balance(fs_info))</div><div class='ctx'> 		ret = -ECANCELED;</div><div class='add'>+	*file_offset_ret = folio_end + 1;</div><div class='ctx'> 	return ret;</div><div class='ctx'> </div><div class='del'>-release_page:</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='add'>+release_folio:</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int relocate_file_extent_cluster(struct inode *inode,</div><div class='del'>-					struct file_extent_cluster *cluster)</div><div class='add'>+static int relocate_file_extent_cluster(struct reloc_control *rc)</div><div class='ctx'> {</div><div class='del'>-	u64 offset = BTRFS_I(inode)-&gt;index_cnt;</div><div class='del'>-	unsigned long index;</div><div class='del'>-	unsigned long last_index;</div><div class='del'>-	struct file_ra_state *ra;</div><div class='add'>+	struct inode *inode = rc-&gt;data_inode;</div><div class='add'>+	const struct file_extent_cluster *cluster = &amp;rc-&gt;cluster;</div><div class='add'>+	u64 offset = BTRFS_I(inode)-&gt;reloc_block_group_start;</div><div class='add'>+	u64 cur_file_offset = cluster-&gt;start - offset;</div><div class='add'>+	struct file_ra_state AUTO_KFREE(ra);</div><div class='ctx'> 	int cluster_nr = 0;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -3077,43 +2950,73 @@ static int relocate_file_extent_cluster(struct inode *inode,</div><div class='ctx'> 	if (!ra)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	ret = prealloc_file_extent_cluster(BTRFS_I(inode), cluster);</div><div class='add'>+	ret = prealloc_file_extent_cluster(rc);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	file_ra_state_init(ra, inode-&gt;i_mapping);</div><div class='ctx'> </div><div class='del'>-	ret = setup_relocation_extent_mapping(inode, cluster-&gt;start - offset,</div><div class='del'>-				   cluster-&gt;end - offset, cluster-&gt;start);</div><div class='add'>+	ret = setup_relocation_extent_mapping(rc);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	last_index = (cluster-&gt;end - offset) &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	for (index = (cluster-&gt;start - offset) &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	     index &lt;= last_index &amp;&amp; !ret; index++)</div><div class='del'>-		ret = relocate_one_page(inode, ra, cluster, &amp;cluster_nr, index);</div><div class='add'>+	while (cur_file_offset &lt; cluster-&gt;end - offset) {</div><div class='add'>+		ret = relocate_one_folio(rc, ra, &amp;cluster_nr, &amp;cur_file_offset);</div><div class='add'>+		if (ret)</div><div class='add'>+			break;</div><div class='add'>+	}</div><div class='ctx'> 	if (ret == 0)</div><div class='ctx'> 		WARN_ON(cluster_nr != cluster-&gt;nr);</div><div class='del'>-out:</div><div class='del'>-	kfree(ra);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline_for_stack</div><div class='del'>-int relocate_data_extent(struct inode *inode, struct btrfs_key *extent_key,</div><div class='del'>-			 struct file_extent_cluster *cluster)</div><div class='add'>+static noinline_for_stack int relocate_data_extent(struct reloc_control *rc,</div><div class='add'>+					   const struct btrfs_key *extent_key)</div><div class='ctx'> {</div><div class='add'>+	struct inode *inode = rc-&gt;data_inode;</div><div class='add'>+	struct file_extent_cluster *cluster = &amp;rc-&gt;cluster;</div><div class='ctx'> 	int ret;</div><div class='add'>+	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='ctx'> </div><div class='ctx'> 	if (cluster-&gt;nr &gt; 0 &amp;&amp; extent_key-&gt;objectid != cluster-&gt;end + 1) {</div><div class='del'>-		ret = relocate_file_extent_cluster(inode, cluster);</div><div class='add'>+		ret = relocate_file_extent_cluster(rc);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 		cluster-&gt;nr = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!cluster-&gt;nr)</div><div class='add'>+	/*</div><div class='add'>+	 * Under simple quotas, we set root-&gt;relocation_src_root when we find</div><div class='add'>+	 * the extent. If adjacent extents have different owners, we can't merge</div><div class='add'>+	 * them while relocating. Handle this by storing the owning root that</div><div class='add'>+	 * started a cluster and if we see an extent from a different root break</div><div class='add'>+	 * cluster formation (just like the above case of non-adjacent extents).</div><div class='add'>+	 *</div><div class='add'>+	 * Without simple quotas, relocation_src_root is always 0, so we should</div><div class='add'>+	 * never see a mismatch, and it should have no effect on relocation</div><div class='add'>+	 * clusters.</div><div class='add'>+	 */</div><div class='add'>+	if (cluster-&gt;nr &gt; 0 &amp;&amp; cluster-&gt;owning_root != root-&gt;relocation_src_root) {</div><div class='add'>+		u64 tmp = root-&gt;relocation_src_root;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * root-&gt;relocation_src_root is the state that actually affects</div><div class='add'>+		 * the preallocation we do here, so set it to the root owning</div><div class='add'>+		 * the cluster we need to relocate.</div><div class='add'>+		 */</div><div class='add'>+		root-&gt;relocation_src_root = cluster-&gt;owning_root;</div><div class='add'>+		ret = relocate_file_extent_cluster(rc);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		cluster-&gt;nr = 0;</div><div class='add'>+		/* And reset it back for the current extent's owning root. */</div><div class='add'>+		root-&gt;relocation_src_root = tmp;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!cluster-&gt;nr) {</div><div class='ctx'> 		cluster-&gt;start = extent_key-&gt;objectid;</div><div class='add'>+		cluster-&gt;owning_root = root-&gt;relocation_src_root;</div><div class='add'>+	}</div><div class='ctx'> 	else</div><div class='ctx'> 		BUG_ON(cluster-&gt;nr &gt;= MAX_EXTENTS);</div><div class='ctx'> 	cluster-&gt;end = extent_key-&gt;objectid + extent_key-&gt;offset - 1;</div><div class='hunk'>@@ -3121,7 +3024,7 @@ int relocate_data_extent(struct inode *inode, struct btrfs_key *extent_key,</div><div class='ctx'> 	cluster-&gt;nr++;</div><div class='ctx'> </div><div class='ctx'> 	if (cluster-&gt;nr &gt;= MAX_EXTENTS) {</div><div class='del'>-		ret = relocate_file_extent_cluster(inode, cluster);</div><div class='add'>+		ret = relocate_file_extent_cluster(rc);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 		cluster-&gt;nr = 0;</div><div class='hunk'>@@ -3134,7 +3037,7 @@ int relocate_data_extent(struct inode *inode, struct btrfs_key *extent_key,</div><div class='ctx'>  * the major work is getting the generation and level of the block</div><div class='ctx'>  */</div><div class='ctx'> static int add_tree_block(struct reloc_control *rc,</div><div class='del'>-			  struct btrfs_key *extent_key,</div><div class='add'>+			  const struct btrfs_key *extent_key,</div><div class='ctx'> 			  struct btrfs_path *path,</div><div class='ctx'> 			  struct rb_root *blocks)</div><div class='ctx'> {</div><div class='hunk'>@@ -3149,7 +3052,7 @@ static int add_tree_block(struct reloc_control *rc,</div><div class='ctx'> 	u64 owner = 0;</div><div class='ctx'> </div><div class='ctx'> 	eb =  path-&gt;nodes[0];</div><div class='del'>-	item_size = btrfs_item_size_nr(eb, path-&gt;slots[0]);</div><div class='add'>+	item_size = btrfs_item_size(eb, path-&gt;slots[0]);</div><div class='ctx'> </div><div class='ctx'> 	if (extent_key-&gt;type == BTRFS_METADATA_ITEM_KEY ||</div><div class='ctx'> 	    item_size &gt;= sizeof(*ei) + sizeof(*bi)) {</div><div class='hunk'>@@ -3198,12 +3101,13 @@ static int add_tree_block(struct reloc_control *rc,</div><div class='ctx'> 			if (type == BTRFS_TREE_BLOCK_REF_KEY)</div><div class='ctx'> 				owner = btrfs_extent_inline_ref_offset(eb, iref);</div><div class='ctx'> 		}</div><div class='del'>-	} else if (unlikely(item_size == sizeof(struct btrfs_extent_item_v0))) {</div><div class='del'>-		btrfs_print_v0_err(eb-&gt;fs_info);</div><div class='del'>-		btrfs_handle_fs_error(eb-&gt;fs_info, -EINVAL, NULL);</div><div class='del'>-		return -EINVAL;</div><div class='ctx'> 	} else {</div><div class='del'>-		BUG();</div><div class='add'>+		btrfs_print_leaf(eb);</div><div class='add'>+		btrfs_err(rc-&gt;block_group-&gt;fs_info,</div><div class='add'>+			  "unrecognized tree backref at tree block %llu slot %u",</div><div class='add'>+			  eb-&gt;start, path-&gt;slots[0]);</div><div class='add'>+		btrfs_release_path(path);</div><div class='add'>+		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	btrfs_release_path(path);</div><div class='hunk'>@@ -3218,10 +3122,10 @@ static int add_tree_block(struct reloc_control *rc,</div><div class='ctx'> 	block-&gt;key.objectid = rc-&gt;extent_root-&gt;fs_info-&gt;nodesize;</div><div class='ctx'> 	block-&gt;key.offset = generation;</div><div class='ctx'> 	block-&gt;level = level;</div><div class='del'>-	block-&gt;key_ready = 0;</div><div class='add'>+	block-&gt;key_ready = false;</div><div class='ctx'> 	block-&gt;owner = owner;</div><div class='ctx'> </div><div class='del'>-	rb_node = rb_simple_insert(blocks, block-&gt;bytenr, &amp;block-&gt;rb_node);</div><div class='add'>+	rb_node = rb_simple_insert(blocks, &amp;block-&gt;simple_node);</div><div class='ctx'> 	if (rb_node)</div><div class='ctx'> 		btrfs_backref_panic(rc-&gt;extent_root-&gt;fs_info, block-&gt;bytenr,</div><div class='ctx'> 				    -EEXIST);</div><div class='hunk'>@@ -3237,7 +3141,7 @@ static int __add_tree_block(struct reloc_control *rc,</div><div class='ctx'> 			    struct rb_root *blocks)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = rc-&gt;extent_root-&gt;fs_info;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	bool skinny = btrfs_fs_incompat(fs_info, SKINNY_METADATA);</div><div class='hunk'>@@ -3261,11 +3165,11 @@ again:</div><div class='ctx'> 		key.offset = blocksize;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	path-&gt;search_commit_root = 1;</div><div class='del'>-	path-&gt;skip_locking = 1;</div><div class='add'>+	path-&gt;search_commit_root = true;</div><div class='add'>+	path-&gt;skip_locking = true;</div><div class='ctx'> 	ret = btrfs_search_slot(NULL, rc-&gt;extent_root, &amp;key, path, 0, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	if (ret &gt; 0 &amp;&amp; skinny) {</div><div class='ctx'> 		if (path-&gt;slots[0]) {</div><div class='hunk'>@@ -3292,31 +3196,29 @@ again:</div><div class='ctx'> 	     "tree block extent item (%llu) is not found in extent tree",</div><div class='ctx'> 		     bytenr);</div><div class='ctx'> 		WARN_ON(1);</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		goto out;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = add_tree_block(rc, &amp;key, path, blocks);</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	return add_tree_block(rc, &amp;key, path, blocks);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int delete_block_group_cache(struct btrfs_fs_info *fs_info,</div><div class='del'>-				    struct btrfs_block_group *block_group,</div><div class='add'>+static int delete_block_group_cache(struct btrfs_block_group *block_group,</div><div class='ctx'> 				    struct inode *inode,</div><div class='ctx'> 				    u64 ino)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = block_group-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_root *root = fs_info-&gt;tree_root;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='add'>+	struct btrfs_inode *btrfs_inode;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (inode)</div><div class='ctx'> 		goto truncate;</div><div class='ctx'> </div><div class='del'>-	inode = btrfs_iget(fs_info-&gt;sb, ino, root);</div><div class='del'>-	if (IS_ERR(inode))</div><div class='add'>+	btrfs_inode = btrfs_iget(ino, root);</div><div class='add'>+	if (IS_ERR(btrfs_inode))</div><div class='ctx'> 		return -ENOENT;</div><div class='add'>+	inode = &amp;btrfs_inode-&gt;vfs_inode;</div><div class='ctx'> </div><div class='ctx'> truncate:</div><div class='ctx'> 	ret = btrfs_check_trunc_cache_free_space(fs_info,</div><div class='hunk'>@@ -3376,38 +3278,40 @@ static int delete_v1_space_cache(struct extent_buffer *leaf,</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!found)</div><div class='ctx'> 		return -ENOENT;</div><div class='del'>-	ret = delete_block_group_cache(leaf-&gt;fs_info, block_group, NULL,</div><div class='del'>-					space_cache_ino);</div><div class='add'>+	ret = delete_block_group_cache(block_group, NULL, space_cache_ino);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * helper to find all tree blocks that reference a given data extent</div><div class='ctx'>  */</div><div class='del'>-static noinline_for_stack</div><div class='del'>-int add_data_references(struct reloc_control *rc,</div><div class='del'>-			struct btrfs_key *extent_key,</div><div class='del'>-			struct btrfs_path *path,</div><div class='del'>-			struct rb_root *blocks)</div><div class='add'>+static noinline_for_stack int add_data_references(struct reloc_control *rc,</div><div class='add'>+						  const struct btrfs_key *extent_key,</div><div class='add'>+						  struct btrfs_path *path,</div><div class='add'>+						  struct rb_root *blocks)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = rc-&gt;extent_root-&gt;fs_info;</div><div class='del'>-	struct ulist *leaves = NULL;</div><div class='add'>+	struct btrfs_backref_walk_ctx ctx = { 0 };</div><div class='ctx'> 	struct ulist_iterator leaf_uiter;</div><div class='ctx'> 	struct ulist_node *ref_node = NULL;</div><div class='del'>-	const u32 blocksize = fs_info-&gt;nodesize;</div><div class='add'>+	const u32 blocksize = rc-&gt;extent_root-&gt;fs_info-&gt;nodesize;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	btrfs_release_path(path);</div><div class='del'>-	ret = btrfs_find_all_leafs(NULL, fs_info, extent_key-&gt;objectid,</div><div class='del'>-				   0, &amp;leaves, NULL, true);</div><div class='add'>+</div><div class='add'>+	ctx.bytenr = extent_key-&gt;objectid;</div><div class='add'>+	ctx.skip_inode_ref_list = true;</div><div class='add'>+	ctx.fs_info = rc-&gt;extent_root-&gt;fs_info;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_find_all_leafs(&amp;ctx);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='ctx'> 	ULIST_ITER_INIT(&amp;leaf_uiter);</div><div class='del'>-	while ((ref_node = ulist_next(leaves, &amp;leaf_uiter))) {</div><div class='add'>+	while ((ref_node = ulist_next(ctx.refs, &amp;leaf_uiter))) {</div><div class='add'>+		struct btrfs_tree_parent_check check = { 0 };</div><div class='ctx'> 		struct extent_buffer *eb;</div><div class='ctx'> </div><div class='del'>-		eb = read_tree_block(fs_info, ref_node-&gt;val, 0, 0, 0, NULL);</div><div class='add'>+		eb = read_tree_block(ctx.fs_info, ref_node-&gt;val, &amp;check);</div><div class='ctx'> 		if (IS_ERR(eb)) {</div><div class='ctx'> 			ret = PTR_ERR(eb);</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -3423,7 +3327,7 @@ int add_data_references(struct reloc_control *rc,</div><div class='ctx'> 	}</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		free_block_list(blocks);</div><div class='del'>-	ulist_free(leaves);</div><div class='add'>+	ulist_free(ctx.refs);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3442,6 +3346,8 @@ int find_next_extent(struct reloc_control *rc, struct btrfs_path *path,</div><div class='ctx'> </div><div class='ctx'> 	last = rc-&gt;block_group-&gt;start + rc-&gt;block_group-&gt;length;</div><div class='ctx'> 	while (1) {</div><div class='add'>+		bool block_found;</div><div class='add'>+</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 		if (rc-&gt;search_start &gt;= last) {</div><div class='ctx'> 			ret = 1;</div><div class='hunk'>@@ -3452,8 +3358,8 @@ int find_next_extent(struct reloc_control *rc, struct btrfs_path *path,</div><div class='ctx'> 		key.type = BTRFS_EXTENT_ITEM_KEY;</div><div class='ctx'> 		key.offset = 0;</div><div class='ctx'> </div><div class='del'>-		path-&gt;search_commit_root = 1;</div><div class='del'>-		path-&gt;skip_locking = 1;</div><div class='add'>+		path-&gt;search_commit_root = true;</div><div class='add'>+		path-&gt;skip_locking = true;</div><div class='ctx'> 		ret = btrfs_search_slot(NULL, rc-&gt;extent_root, &amp;key, path,</div><div class='ctx'> 					0, 0);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='hunk'>@@ -3492,11 +3398,11 @@ next:</div><div class='ctx'> 			goto next;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		ret = find_first_extent_bit(&amp;rc-&gt;processed_blocks,</div><div class='del'>-					    key.objectid, &amp;start, &amp;end,</div><div class='del'>-					    EXTENT_DIRTY, NULL);</div><div class='add'>+		block_found = btrfs_find_first_extent_bit(&amp;rc-&gt;processed_blocks,</div><div class='add'>+							  key.objectid, &amp;start, &amp;end,</div><div class='add'>+							  EXTENT_DIRTY, NULL);</div><div class='ctx'> </div><div class='del'>-		if (ret == 0 &amp;&amp; start &lt;= key.objectid) {</div><div class='add'>+		if (block_found &amp;&amp; start &lt;= key.objectid) {</div><div class='ctx'> 			btrfs_release_path(path);</div><div class='ctx'> 			rc-&gt;search_start = end + 1;</div><div class='ctx'> 		} else {</div><div class='hunk'>@@ -3550,13 +3456,13 @@ int prepare_to_relocate(struct reloc_control *rc)</div><div class='ctx'> 	rc-&gt;reserved_bytes = 0;</div><div class='ctx'> 	rc-&gt;block_rsv-&gt;size = rc-&gt;extent_root-&gt;fs_info-&gt;nodesize *</div><div class='ctx'> 			      RELOCATION_RESERVED_NODES;</div><div class='del'>-	ret = btrfs_block_rsv_refill(rc-&gt;extent_root,</div><div class='add'>+	ret = btrfs_block_rsv_refill(rc-&gt;extent_root-&gt;fs_info,</div><div class='ctx'> 				     rc-&gt;block_rsv, rc-&gt;block_rsv-&gt;size,</div><div class='ctx'> 				     BTRFS_RESERVE_FLUSH_ALL);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	rc-&gt;create_reloc_tree = 1;</div><div class='add'>+	rc-&gt;create_reloc_tree = true;</div><div class='ctx'> 	set_reloc_control(rc);</div><div class='ctx'> </div><div class='ctx'> 	trans = btrfs_join_transaction(rc-&gt;extent_root);</div><div class='hunk'>@@ -3569,7 +3475,12 @@ int prepare_to_relocate(struct reloc_control *rc)</div><div class='ctx'> 		 */</div><div class='ctx'> 		return PTR_ERR(trans);</div><div class='ctx'> 	}</div><div class='del'>-	return btrfs_commit_transaction(trans);</div><div class='add'>+</div><div class='add'>+	ret = btrfs_commit_transaction(trans);</div><div class='add'>+	if (ret)</div><div class='add'>+		unset_reloc_control(rc);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static noinline_for_stack int relocate_block_group(struct reloc_control *rc)</div><div class='hunk'>@@ -3578,7 +3489,7 @@ static noinline_for_stack int relocate_block_group(struct reloc_control *rc)</div><div class='ctx'> 	struct rb_root blocks = RB_ROOT;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_trans_handle *trans = NULL;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_extent_item *ei;</div><div class='ctx'> 	u64 flags;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -3598,9 +3509,9 @@ static noinline_for_stack int relocate_block_group(struct reloc_control *rc)</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		rc-&gt;reserved_bytes = 0;</div><div class='del'>-		ret = btrfs_block_rsv_refill(rc-&gt;extent_root,</div><div class='del'>-					rc-&gt;block_rsv, rc-&gt;block_rsv-&gt;size,</div><div class='del'>-					BTRFS_RESERVE_FLUSH_ALL);</div><div class='add'>+		ret = btrfs_block_rsv_refill(fs_info, rc-&gt;block_rsv,</div><div class='add'>+					     rc-&gt;block_rsv-&gt;size,</div><div class='add'>+					     BTRFS_RESERVE_FLUSH_ALL);</div><div class='ctx'> 		if (ret) {</div><div class='ctx'> 			err = ret;</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -3613,11 +3524,9 @@ static noinline_for_stack int relocate_block_group(struct reloc_control *rc)</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> restart:</div><div class='del'>-		if (update_backref_cache(trans, &amp;rc-&gt;backref_cache)) {</div><div class='del'>-			btrfs_end_transaction(trans);</div><div class='del'>-			trans = NULL;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='add'>+		if (rc-&gt;backref_cache.last_trans != trans-&gt;transid)</div><div class='add'>+			btrfs_backref_release_cache(&amp;rc-&gt;backref_cache);</div><div class='add'>+		rc-&gt;backref_cache.last_trans = trans-&gt;transid;</div><div class='ctx'> </div><div class='ctx'> 		ret = find_next_extent(rc, path, &amp;key);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='hunk'>@@ -3631,6 +3540,21 @@ restart:</div><div class='ctx'> 				    struct btrfs_extent_item);</div><div class='ctx'> 		flags = btrfs_extent_flags(path-&gt;nodes[0], ei);</div><div class='ctx'> </div><div class='add'>+		/*</div><div class='add'>+		 * If we are relocating a simple quota owned extent item, we</div><div class='add'>+		 * need to note the owner on the reloc data root so that when</div><div class='add'>+		 * we allocate the replacement item, we can attribute it to the</div><div class='add'>+		 * correct eventual owner (rather than the reloc data root).</div><div class='add'>+		 */</div><div class='add'>+		if (btrfs_qgroup_mode(fs_info) == BTRFS_QGROUP_MODE_SIMPLE) {</div><div class='add'>+			struct btrfs_root *root = BTRFS_I(rc-&gt;data_inode)-&gt;root;</div><div class='add'>+			u64 owning_root_id = btrfs_get_extent_owner_root(fs_info,</div><div class='add'>+								 path-&gt;nodes[0],</div><div class='add'>+								 path-&gt;slots[0]);</div><div class='add'>+</div><div class='add'>+			root-&gt;relocation_src_root = owning_root_id;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		if (flags &amp; BTRFS_EXTENT_FLAG_TREE_BLOCK) {</div><div class='ctx'> 			ret = add_tree_block(rc, &amp;key, path, &amp;blocks);</div><div class='ctx'> 		} else if (rc-&gt;stage == UPDATE_DATA_PTRS &amp;&amp;</div><div class='hunk'>@@ -3663,9 +3587,8 @@ restart:</div><div class='ctx'> </div><div class='ctx'> 		if (rc-&gt;stage == MOVE_DATA_EXTENTS &amp;&amp;</div><div class='ctx'> 		    (flags &amp; BTRFS_EXTENT_FLAG_DATA)) {</div><div class='del'>-			rc-&gt;found_file_extent = 1;</div><div class='del'>-			ret = relocate_data_extent(rc-&gt;data_inode,</div><div class='del'>-						   &amp;key, &amp;rc-&gt;cluster);</div><div class='add'>+			rc-&gt;found_file_extent = true;</div><div class='add'>+			ret = relocate_data_extent(rc, &amp;key);</div><div class='ctx'> 			if (ret &lt; 0) {</div><div class='ctx'> 				err = ret;</div><div class='ctx'> 				break;</div><div class='hunk'>@@ -3686,7 +3609,7 @@ restart:</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	btrfs_release_path(path);</div><div class='del'>-	clear_extent_bits(&amp;rc-&gt;processed_blocks, 0, (u64)-1, EXTENT_DIRTY);</div><div class='add'>+	btrfs_clear_extent_bit(&amp;rc-&gt;processed_blocks, 0, (u64)-1, EXTENT_DIRTY, NULL);</div><div class='ctx'> </div><div class='ctx'> 	if (trans) {</div><div class='ctx'> 		btrfs_end_transaction_throttle(trans);</div><div class='hunk'>@@ -3694,13 +3617,12 @@ restart:</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!err) {</div><div class='del'>-		ret = relocate_file_extent_cluster(rc-&gt;data_inode,</div><div class='del'>-						   &amp;rc-&gt;cluster);</div><div class='add'>+		ret = relocate_file_extent_cluster(rc);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			err = ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	rc-&gt;create_reloc_tree = 0;</div><div class='add'>+	rc-&gt;create_reloc_tree = false;</div><div class='ctx'> 	set_reloc_control(rc);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_backref_release_cache(&amp;rc-&gt;backref_cache);</div><div class='hunk'>@@ -3718,7 +3640,7 @@ restart:</div><div class='ctx'> </div><div class='ctx'> 	merge_reloc_roots(rc);</div><div class='ctx'> </div><div class='del'>-	rc-&gt;merge_reloc_tree = 0;</div><div class='add'>+	rc-&gt;merge_reloc_tree = false;</div><div class='ctx'> 	unset_reloc_control(rc);</div><div class='ctx'> 	btrfs_block_rsv_release(fs_info, rc-&gt;block_rsv, (u64)-1, NULL);</div><div class='ctx'> </div><div class='hunk'>@@ -3736,14 +3658,13 @@ out_free:</div><div class='ctx'> 	if (ret &lt; 0 &amp;&amp; !err)</div><div class='ctx'> 		err = ret;</div><div class='ctx'> 	btrfs_free_block_rsv(fs_info, rc-&gt;block_rsv);</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int __insert_orphan_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				 struct btrfs_root *root, u64 objectid)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_inode_item *item;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -3754,7 +3675,7 @@ static int __insert_orphan_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_insert_empty_inode(trans, root, path, objectid);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	item = btrfs_item_ptr(leaf, path-&gt;slots[0], struct btrfs_inode_item);</div><div class='hunk'>@@ -3764,16 +3685,13 @@ static int __insert_orphan_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	btrfs_set_inode_mode(leaf, item, S_IFREG | 0600);</div><div class='ctx'> 	btrfs_set_inode_flags(leaf, item, BTRFS_INODE_NOCOMPRESS |</div><div class='ctx'> 					  BTRFS_INODE_PREALLOC);</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void delete_orphan_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				struct btrfs_root *root, u64 objectid)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -3796,22 +3714,21 @@ static void delete_orphan_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> out:</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * helper to create inode for data relocation.</div><div class='ctx'>  * the inode is in data relocation tree and its link count is 0</div><div class='ctx'>  */</div><div class='del'>-static noinline_for_stack</div><div class='del'>-struct inode *create_reloc_inode(struct btrfs_fs_info *fs_info,</div><div class='del'>-				 struct btrfs_block_group *group)</div><div class='add'>+static noinline_for_stack struct inode *create_reloc_inode(</div><div class='add'>+					const struct btrfs_block_group *group)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = NULL;</div><div class='add'>+	struct btrfs_fs_info *fs_info = group-&gt;fs_info;</div><div class='add'>+	struct btrfs_inode *inode = NULL;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	struct btrfs_root *root;</div><div class='ctx'> 	u64 objectid;</div><div class='del'>-	int err = 0;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	root = btrfs_grab_root(fs_info-&gt;data_reloc_root);</div><div class='ctx'> 	trans = btrfs_start_transaction(root, 6);</div><div class='hunk'>@@ -3820,70 +3737,58 @@ struct inode *create_reloc_inode(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		return ERR_CAST(trans);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = btrfs_get_free_objectid(root, &amp;objectid);</div><div class='del'>-	if (err)</div><div class='add'>+	ret = btrfs_get_free_objectid(root, &amp;objectid);</div><div class='add'>+	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	err = __insert_orphan_inode(trans, root, objectid);</div><div class='del'>-	if (err)</div><div class='add'>+	ret = __insert_orphan_inode(trans, root, objectid);</div><div class='add'>+	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	inode = btrfs_iget(fs_info-&gt;sb, objectid, root);</div><div class='add'>+	inode = btrfs_iget(objectid, root);</div><div class='ctx'> 	if (IS_ERR(inode)) {</div><div class='ctx'> 		delete_orphan_inode(trans, root, objectid);</div><div class='del'>-		err = PTR_ERR(inode);</div><div class='add'>+		ret = PTR_ERR(inode);</div><div class='ctx'> 		inode = NULL;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	BTRFS_I(inode)-&gt;index_cnt = group-&gt;start;</div><div class='add'>+	inode-&gt;reloc_block_group_start = group-&gt;start;</div><div class='ctx'> </div><div class='del'>-	err = btrfs_orphan_add(trans, BTRFS_I(inode));</div><div class='add'>+	ret = btrfs_orphan_add(trans, inode);</div><div class='ctx'> out:</div><div class='ctx'> 	btrfs_put_root(root);</div><div class='ctx'> 	btrfs_end_transaction(trans);</div><div class='ctx'> 	btrfs_btree_balance_dirty(fs_info);</div><div class='del'>-	if (err) {</div><div class='add'>+	if (ret) {</div><div class='ctx'> 		if (inode)</div><div class='del'>-			iput(inode);</div><div class='del'>-		inode = ERR_PTR(err);</div><div class='add'>+			iput(&amp;inode-&gt;vfs_inode);</div><div class='add'>+		return ERR_PTR(ret);</div><div class='ctx'> 	}</div><div class='del'>-	return inode;</div><div class='add'>+	return &amp;inode-&gt;vfs_inode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Mark start of chunk relocation that is cancellable. Check if the cancellation</div><div class='ctx'>  * has been requested meanwhile and don't start in that case.</div><div class='add'>+ * NOTE: if this returns an error, reloc_chunk_end() must not be called.</div><div class='ctx'>  *</div><div class='ctx'>  * Return:</div><div class='ctx'>  *   0             success</div><div class='ctx'>  *   -EINPROGRESS  operation is already in progress, that's probably a bug</div><div class='ctx'>  *   -ECANCELED    cancellation request was set before the operation started</div><div class='del'>- *   -EAGAIN       can not start because there are ongoing send operations</div><div class='ctx'>  */</div><div class='ctx'> static int reloc_chunk_start(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	spin_lock(&amp;fs_info-&gt;send_reloc_lock);</div><div class='del'>-	if (fs_info-&gt;send_in_progress) {</div><div class='del'>-		btrfs_warn_rl(fs_info,</div><div class='del'>-"cannot run relocation while send operations are in progress (%d in progress)",</div><div class='del'>-			      fs_info-&gt;send_in_progress);</div><div class='del'>-		spin_unlock(&amp;fs_info-&gt;send_reloc_lock);</div><div class='del'>-		return -EAGAIN;</div><div class='del'>-	}</div><div class='ctx'> 	if (test_and_set_bit(BTRFS_FS_RELOC_RUNNING, &amp;fs_info-&gt;flags)) {</div><div class='ctx'> 		/* This should not happen */</div><div class='del'>-		spin_unlock(&amp;fs_info-&gt;send_reloc_lock);</div><div class='ctx'> 		btrfs_err(fs_info, "reloc already running, cannot start");</div><div class='ctx'> 		return -EINPROGRESS;</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;send_reloc_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (atomic_read(&amp;fs_info-&gt;reloc_cancel_req) &gt; 0) {</div><div class='ctx'> 		btrfs_info(fs_info, "chunk relocation canceled on start");</div><div class='del'>-		/*</div><div class='del'>-		 * On cancel, clear all requests but let the caller mark</div><div class='del'>-		 * the end after cleanup operations.</div><div class='del'>-		 */</div><div class='add'>+		/* On cancel, clear all requests. */</div><div class='add'>+		clear_and_wake_up_bit(BTRFS_FS_RELOC_RUNNING, &amp;fs_info-&gt;flags);</div><div class='ctx'> 		atomic_set(&amp;fs_info-&gt;reloc_cancel_req, 0);</div><div class='ctx'> 		return -ECANCELED;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3892,15 +3797,15 @@ static int reloc_chunk_start(struct btrfs_fs_info *fs_info)</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Mark end of chunk relocation that is cancellable and wake any waiters.</div><div class='add'>+ * NOTE: call only if a previous call to reloc_chunk_start() succeeded.</div><div class='ctx'>  */</div><div class='ctx'> static void reloc_chunk_end(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='add'>+	ASSERT(test_bit(BTRFS_FS_RELOC_RUNNING, &amp;fs_info-&gt;flags));</div><div class='ctx'> 	/* Requested after start, clear bit first so any waiters can continue */</div><div class='ctx'> 	if (atomic_read(&amp;fs_info-&gt;reloc_cancel_req) &gt; 0)</div><div class='ctx'> 		btrfs_info(fs_info, "chunk relocation canceled during operation");</div><div class='del'>-	spin_lock(&amp;fs_info-&gt;send_reloc_lock);</div><div class='ctx'> 	clear_and_wake_up_bit(BTRFS_FS_RELOC_RUNNING, &amp;fs_info-&gt;flags);</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;send_reloc_lock);</div><div class='ctx'> 	atomic_set(&amp;fs_info-&gt;reloc_cancel_req, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3914,10 +3819,10 @@ static struct reloc_control *alloc_reloc_control(struct btrfs_fs_info *fs_info)</div><div class='ctx'> </div><div class='ctx'> 	INIT_LIST_HEAD(&amp;rc-&gt;reloc_roots);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;rc-&gt;dirty_subvol_roots);</div><div class='del'>-	btrfs_backref_init_cache(fs_info, &amp;rc-&gt;backref_cache, 1);</div><div class='del'>-	mapping_tree_init(&amp;rc-&gt;reloc_root_tree);</div><div class='del'>-	extent_io_tree_init(fs_info, &amp;rc-&gt;processed_blocks,</div><div class='del'>-			    IO_TREE_RELOC_BLOCKS, NULL);</div><div class='add'>+	btrfs_backref_init_cache(fs_info, &amp;rc-&gt;backref_cache, true);</div><div class='add'>+	rc-&gt;reloc_root_tree.rb_root = RB_ROOT;</div><div class='add'>+	spin_lock_init(&amp;rc-&gt;reloc_root_tree.lock);</div><div class='add'>+	btrfs_extent_io_tree_init(fs_info, &amp;rc-&gt;processed_blocks, IO_TREE_RELOC_BLOCKS);</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3936,19 +3841,17 @@ static void free_reloc_control(struct reloc_control *rc)</div><div class='ctx'> /*</div><div class='ctx'>  * Print the block group being relocated</div><div class='ctx'>  */</div><div class='del'>-static void describe_relocation(struct btrfs_fs_info *fs_info,</div><div class='del'>-				struct btrfs_block_group *block_group)</div><div class='add'>+static void describe_relocation(struct btrfs_block_group *block_group)</div><div class='ctx'> {</div><div class='del'>-	char buf[128] = {'\0'};</div><div class='add'>+	char buf[128] = "NONE";</div><div class='ctx'> </div><div class='ctx'> 	btrfs_describe_block_groups(block_group-&gt;flags, buf, sizeof(buf));</div><div class='ctx'> </div><div class='del'>-	btrfs_info(fs_info,</div><div class='del'>-		   "relocating block group %llu flags %s",</div><div class='add'>+	btrfs_info(block_group-&gt;fs_info, "relocating block group %llu flags %s",</div><div class='ctx'> 		   block_group-&gt;start, buf);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static const char *stage_to_string(int stage)</div><div class='add'>+static const char *stage_to_string(enum reloc_stage stage)</div><div class='ctx'> {</div><div class='ctx'> 	if (stage == MOVE_DATA_EXTENTS)</div><div class='ctx'> 		return "move data extents";</div><div class='hunk'>@@ -3960,21 +3863,45 @@ static const char *stage_to_string(int stage)</div><div class='ctx'> /*</div><div class='ctx'>  * function to relocate all extents in a block group.</div><div class='ctx'>  */</div><div class='del'>-int btrfs_relocate_block_group(struct btrfs_fs_info *fs_info, u64 group_start)</div><div class='add'>+int btrfs_relocate_block_group(struct btrfs_fs_info *fs_info, u64 group_start,</div><div class='add'>+			       bool verbose)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_block_group *bg;</div><div class='del'>-	struct btrfs_root *extent_root = fs_info-&gt;extent_root;</div><div class='add'>+	struct btrfs_root *extent_root = btrfs_extent_root(fs_info, group_start);</div><div class='ctx'> 	struct reloc_control *rc;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct btrfs_path *path;</div><div class='ctx'> 	int ret;</div><div class='del'>-	int rw = 0;</div><div class='del'>-	int err = 0;</div><div class='add'>+	bool bg_is_ro = false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This only gets set if we had a half-deleted snapshot on mount.  We</div><div class='add'>+	 * cannot allow relocation to start while we're still trying to clean up</div><div class='add'>+	 * these pending deletions.</div><div class='add'>+	 */</div><div class='add'>+	ret = wait_on_bit(&amp;fs_info-&gt;flags, BTRFS_FS_UNFINISHED_DROPS, TASK_INTERRUPTIBLE);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	/* We may have been woken up by close_ctree, so bail if we're closing. */</div><div class='add'>+	if (btrfs_fs_closing(fs_info))</div><div class='add'>+		return -EINTR;</div><div class='ctx'> </div><div class='ctx'> 	bg = btrfs_lookup_block_group(fs_info, group_start);</div><div class='ctx'> 	if (!bg)</div><div class='ctx'> 		return -ENOENT;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Relocation of a data block group creates ordered extents.  Without</div><div class='add'>+	 * sb_start_write(), we can freeze the filesystem while unfinished</div><div class='add'>+	 * ordered extents are left. Such ordered extents can cause a deadlock</div><div class='add'>+	 * e.g. when syncfs() is waiting for their completion but they can't</div><div class='add'>+	 * finish because they block when joining a transaction, due to the</div><div class='add'>+	 * fact that the freeze locks are being held in write mode.</div><div class='add'>+	 */</div><div class='add'>+	if (bg-&gt;flags &amp; BTRFS_BLOCK_GROUP_DATA)</div><div class='add'>+		ASSERT(sb_write_started(fs_info-&gt;sb));</div><div class='add'>+</div><div class='ctx'> 	if (btrfs_pinned_by_swapfile(fs_info, bg)) {</div><div class='ctx'> 		btrfs_put_block_group(bg);</div><div class='ctx'> 		return -ETXTBSY;</div><div class='hunk'>@@ -3987,24 +3914,20 @@ int btrfs_relocate_block_group(struct btrfs_fs_info *fs_info, u64 group_start)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = reloc_chunk_start(fs_info);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		err = ret;</div><div class='add'>+	if (ret &lt; 0)</div><div class='ctx'> 		goto out_put_bg;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	rc-&gt;extent_root = extent_root;</div><div class='ctx'> 	rc-&gt;block_group = bg;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_inc_block_group_ro(rc-&gt;block_group, true);</div><div class='del'>-	if (ret) {</div><div class='del'>-		err = ret;</div><div class='add'>+	if (ret)</div><div class='ctx'> 		goto out;</div><div class='del'>-	}</div><div class='del'>-	rw = 1;</div><div class='add'>+	bg_is_ro = true;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path) {</div><div class='del'>-		err = -ENOMEM;</div><div class='add'>+		ret = -ENOMEM;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -4012,41 +3935,36 @@ int btrfs_relocate_block_group(struct btrfs_fs_info *fs_info, u64 group_start)</div><div class='ctx'> 	btrfs_free_path(path);</div><div class='ctx'> </div><div class='ctx'> 	if (!IS_ERR(inode))</div><div class='del'>-		ret = delete_block_group_cache(fs_info, rc-&gt;block_group, inode, 0);</div><div class='add'>+		ret = delete_block_group_cache(rc-&gt;block_group, inode, 0);</div><div class='ctx'> 	else</div><div class='ctx'> 		ret = PTR_ERR(inode);</div><div class='ctx'> </div><div class='del'>-	if (ret &amp;&amp; ret != -ENOENT) {</div><div class='del'>-		err = ret;</div><div class='add'>+	if (ret &amp;&amp; ret != -ENOENT)</div><div class='ctx'> 		goto out;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	rc-&gt;data_inode = create_reloc_inode(fs_info, rc-&gt;block_group);</div><div class='add'>+	rc-&gt;data_inode = create_reloc_inode(rc-&gt;block_group);</div><div class='ctx'> 	if (IS_ERR(rc-&gt;data_inode)) {</div><div class='del'>-		err = PTR_ERR(rc-&gt;data_inode);</div><div class='add'>+		ret = PTR_ERR(rc-&gt;data_inode);</div><div class='ctx'> 		rc-&gt;data_inode = NULL;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	describe_relocation(fs_info, rc-&gt;block_group);</div><div class='add'>+	if (verbose)</div><div class='add'>+		describe_relocation(rc-&gt;block_group);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_wait_block_group_reservations(rc-&gt;block_group);</div><div class='ctx'> 	btrfs_wait_nocow_writers(rc-&gt;block_group);</div><div class='del'>-	btrfs_wait_ordered_roots(fs_info, U64_MAX,</div><div class='del'>-				 rc-&gt;block_group-&gt;start,</div><div class='del'>-				 rc-&gt;block_group-&gt;length);</div><div class='add'>+	btrfs_wait_ordered_roots(fs_info, U64_MAX, rc-&gt;block_group);</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_zone_finish(rc-&gt;block_group);</div><div class='ctx'> 	WARN_ON(ret &amp;&amp; ret != -EAGAIN);</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='del'>-		int finishes_stage;</div><div class='add'>+		enum reloc_stage finishes_stage;</div><div class='ctx'> </div><div class='ctx'> 		mutex_lock(&amp;fs_info-&gt;cleaner_mutex);</div><div class='ctx'> 		ret = relocate_block_group(rc);</div><div class='ctx'> 		mutex_unlock(&amp;fs_info-&gt;cleaner_mutex);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			err = ret;</div><div class='ctx'> </div><div class='ctx'> 		finishes_stage = rc-&gt;stage;</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -4059,37 +3977,41 @@ int btrfs_relocate_block_group(struct btrfs_fs_info *fs_info, u64 group_start)</div><div class='ctx'> 		 * out of the loop if we hit an error.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (rc-&gt;stage == MOVE_DATA_EXTENTS &amp;&amp; rc-&gt;found_file_extent) {</div><div class='del'>-			ret = btrfs_wait_ordered_range(rc-&gt;data_inode, 0,</div><div class='del'>-						       (u64)-1);</div><div class='del'>-			if (ret)</div><div class='del'>-				err = ret;</div><div class='add'>+			int wb_ret;</div><div class='add'>+</div><div class='add'>+			wb_ret = btrfs_wait_ordered_range(BTRFS_I(rc-&gt;data_inode), 0,</div><div class='add'>+							  (u64)-1);</div><div class='add'>+			if (wb_ret &amp;&amp; ret == 0)</div><div class='add'>+				ret = wb_ret;</div><div class='ctx'> 			invalidate_mapping_pages(rc-&gt;data_inode-&gt;i_mapping,</div><div class='ctx'> 						 0, -1);</div><div class='ctx'> 			rc-&gt;stage = UPDATE_DATA_PTRS;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (err &lt; 0)</div><div class='add'>+		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='ctx'> 		if (rc-&gt;extents_found == 0)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		btrfs_info(fs_info, "found %llu extents, stage: %s",</div><div class='del'>-			   rc-&gt;extents_found, stage_to_string(finishes_stage));</div><div class='add'>+		if (verbose)</div><div class='add'>+			btrfs_info(fs_info, "found %llu extents, stage: %s",</div><div class='add'>+				   rc-&gt;extents_found,</div><div class='add'>+				   stage_to_string(finishes_stage));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	WARN_ON(rc-&gt;block_group-&gt;pinned &gt; 0);</div><div class='ctx'> 	WARN_ON(rc-&gt;block_group-&gt;reserved &gt; 0);</div><div class='ctx'> 	WARN_ON(rc-&gt;block_group-&gt;used &gt; 0);</div><div class='ctx'> out:</div><div class='del'>-	if (err &amp;&amp; rw)</div><div class='add'>+	if (ret &amp;&amp; bg_is_ro)</div><div class='ctx'> 		btrfs_dec_block_group_ro(rc-&gt;block_group);</div><div class='ctx'> 	iput(rc-&gt;data_inode);</div><div class='add'>+	reloc_chunk_end(fs_info);</div><div class='ctx'> out_put_bg:</div><div class='ctx'> 	btrfs_put_block_group(bg);</div><div class='del'>-	reloc_chunk_end(fs_info);</div><div class='ctx'> 	free_reloc_control(rc);</div><div class='del'>-	return err;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static noinline_for_stack int mark_garbage_root(struct btrfs_root *root)</div><div class='hunk'>@@ -4121,9 +4043,8 @@ static noinline_for_stack int mark_garbage_root(struct btrfs_root *root)</div><div class='ctx'>  * this function resumes merging reloc trees with corresponding fs trees.</div><div class='ctx'>  * this is important for keeping the sharing of tree blocks</div><div class='ctx'>  */</div><div class='del'>-int btrfs_recover_relocation(struct btrfs_root *root)</div><div class='add'>+int btrfs_recover_relocation(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	LIST_HEAD(reloc_roots);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_root *fs_root;</div><div class='hunk'>@@ -4132,8 +4053,8 @@ int btrfs_recover_relocation(struct btrfs_root *root)</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct reloc_control *rc = NULL;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='del'>-	int ret;</div><div class='del'>-	int err = 0;</div><div class='add'>+	int ret2;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='hunk'>@@ -4147,15 +4068,14 @@ int btrfs_recover_relocation(struct btrfs_root *root)</div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		ret = btrfs_search_slot(NULL, fs_info-&gt;tree_root, &amp;key,</div><div class='ctx'> 					path, 0, 0);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			err = ret;</div><div class='add'>+		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='del'>-		}</div><div class='ctx'> 		if (ret &gt; 0) {</div><div class='ctx'> 			if (path-&gt;slots[0] == 0)</div><div class='ctx'> 				break;</div><div class='ctx'> 			path-&gt;slots[0]--;</div><div class='ctx'> 		}</div><div class='add'>+		ret = 0;</div><div class='ctx'> 		leaf = path-&gt;nodes[0];</div><div class='ctx'> 		btrfs_item_key_to_cpu(leaf, &amp;key, path-&gt;slots[0]);</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='hunk'>@@ -4164,9 +4084,9 @@ int btrfs_recover_relocation(struct btrfs_root *root)</div><div class='ctx'> 		    key.type != BTRFS_ROOT_ITEM_KEY)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		reloc_root = btrfs_read_tree_root(root, &amp;key);</div><div class='add'>+		reloc_root = btrfs_read_tree_root(fs_info-&gt;tree_root, &amp;key);</div><div class='ctx'> 		if (IS_ERR(reloc_root)) {</div><div class='del'>-			err = PTR_ERR(reloc_root);</div><div class='add'>+			ret = PTR_ERR(reloc_root);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -4178,15 +4098,12 @@ int btrfs_recover_relocation(struct btrfs_root *root)</div><div class='ctx'> 					reloc_root-&gt;root_key.offset, false);</div><div class='ctx'> 			if (IS_ERR(fs_root)) {</div><div class='ctx'> 				ret = PTR_ERR(fs_root);</div><div class='del'>-				if (ret != -ENOENT) {</div><div class='del'>-					err = ret;</div><div class='add'>+				if (ret != -ENOENT)</div><div class='ctx'> 					goto out;</div><div class='del'>-				}</div><div class='ctx'> 				ret = mark_garbage_root(reloc_root);</div><div class='del'>-				if (ret &lt; 0) {</div><div class='del'>-					err = ret;</div><div class='add'>+				if (ret &lt; 0)</div><div class='ctx'> 					goto out;</div><div class='del'>-				}</div><div class='add'>+				ret = 0;</div><div class='ctx'> 			} else {</div><div class='ctx'> 				btrfs_put_root(fs_root);</div><div class='ctx'> 			}</div><div class='hunk'>@@ -4204,31 +4121,28 @@ int btrfs_recover_relocation(struct btrfs_root *root)</div><div class='ctx'> </div><div class='ctx'> 	rc = alloc_reloc_control(fs_info);</div><div class='ctx'> 	if (!rc) {</div><div class='del'>-		err = -ENOMEM;</div><div class='add'>+		ret = -ENOMEM;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = reloc_chunk_start(fs_info);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		err = ret;</div><div class='add'>+	if (ret &lt; 0)</div><div class='ctx'> 		goto out_end;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	rc-&gt;extent_root = fs_info-&gt;extent_root;</div><div class='add'>+	rc-&gt;extent_root = btrfs_extent_root(fs_info, 0);</div><div class='ctx'> </div><div class='ctx'> 	set_reloc_control(rc);</div><div class='ctx'> </div><div class='ctx'> 	trans = btrfs_join_transaction(rc-&gt;extent_root);</div><div class='ctx'> 	if (IS_ERR(trans)) {</div><div class='del'>-		err = PTR_ERR(trans);</div><div class='add'>+		ret = PTR_ERR(trans);</div><div class='ctx'> 		goto out_unset;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	rc-&gt;merge_reloc_tree = 1;</div><div class='add'>+	rc-&gt;merge_reloc_tree = true;</div><div class='ctx'> </div><div class='ctx'> 	while (!list_empty(&amp;reloc_roots)) {</div><div class='del'>-		reloc_root = list_entry(reloc_roots.next,</div><div class='del'>-					struct btrfs_root, root_list);</div><div class='add'>+		reloc_root = list_first_entry(&amp;reloc_roots, struct btrfs_root, root_list);</div><div class='ctx'> 		list_del(&amp;reloc_root-&gt;root_list);</div><div class='ctx'> </div><div class='ctx'> 		if (btrfs_root_refs(&amp;reloc_root-&gt;root_item) == 0) {</div><div class='hunk'>@@ -4240,15 +4154,15 @@ int btrfs_recover_relocation(struct btrfs_root *root)</div><div class='ctx'> 		fs_root = btrfs_get_fs_root(fs_info, reloc_root-&gt;root_key.offset,</div><div class='ctx'> 					    false);</div><div class='ctx'> 		if (IS_ERR(fs_root)) {</div><div class='del'>-			err = PTR_ERR(fs_root);</div><div class='add'>+			ret = PTR_ERR(fs_root);</div><div class='ctx'> 			list_add_tail(&amp;reloc_root-&gt;root_list, &amp;reloc_roots);</div><div class='ctx'> 			btrfs_end_transaction(trans);</div><div class='ctx'> 			goto out_unset;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		err = __add_reloc_root(reloc_root);</div><div class='del'>-		ASSERT(err != -EEXIST);</div><div class='del'>-		if (err) {</div><div class='add'>+		ret = __add_reloc_root(reloc_root);</div><div class='add'>+		ASSERT(ret != -EEXIST);</div><div class='add'>+		if (ret) {</div><div class='ctx'> 			list_add_tail(&amp;reloc_root-&gt;root_list, &amp;reloc_roots);</div><div class='ctx'> 			btrfs_put_root(fs_root);</div><div class='ctx'> 			btrfs_end_transaction(trans);</div><div class='hunk'>@@ -4258,8 +4172,8 @@ int btrfs_recover_relocation(struct btrfs_root *root)</div><div class='ctx'> 		btrfs_put_root(fs_root);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = btrfs_commit_transaction(trans);</div><div class='del'>-	if (err)</div><div class='add'>+	ret = btrfs_commit_transaction(trans);</div><div class='add'>+	if (ret)</div><div class='ctx'> 		goto out_unset;</div><div class='ctx'> </div><div class='ctx'> 	merge_reloc_roots(rc);</div><div class='hunk'>@@ -4268,32 +4182,32 @@ int btrfs_recover_relocation(struct btrfs_root *root)</div><div class='ctx'> </div><div class='ctx'> 	trans = btrfs_join_transaction(rc-&gt;extent_root);</div><div class='ctx'> 	if (IS_ERR(trans)) {</div><div class='del'>-		err = PTR_ERR(trans);</div><div class='add'>+		ret = PTR_ERR(trans);</div><div class='ctx'> 		goto out_clean;</div><div class='ctx'> 	}</div><div class='del'>-	err = btrfs_commit_transaction(trans);</div><div class='add'>+	ret = btrfs_commit_transaction(trans);</div><div class='ctx'> out_clean:</div><div class='del'>-	ret = clean_dirty_subvols(rc);</div><div class='del'>-	if (ret &lt; 0 &amp;&amp; !err)</div><div class='del'>-		err = ret;</div><div class='add'>+	ret2 = clean_dirty_subvols(rc);</div><div class='add'>+	if (ret2 &lt; 0 &amp;&amp; !ret)</div><div class='add'>+		ret = ret2;</div><div class='ctx'> out_unset:</div><div class='ctx'> 	unset_reloc_control(rc);</div><div class='del'>-out_end:</div><div class='ctx'> 	reloc_chunk_end(fs_info);</div><div class='add'>+out_end:</div><div class='ctx'> 	free_reloc_control(rc);</div><div class='ctx'> out:</div><div class='ctx'> 	free_reloc_roots(&amp;reloc_roots);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_free_path(path);</div><div class='ctx'> </div><div class='del'>-	if (err == 0) {</div><div class='add'>+	if (ret == 0) {</div><div class='ctx'> 		/* cleanup orphan inode in data relocation tree */</div><div class='ctx'> 		fs_root = btrfs_grab_root(fs_info-&gt;data_reloc_root);</div><div class='ctx'> 		ASSERT(fs_root);</div><div class='del'>-		err = btrfs_orphan_cleanup(fs_root);</div><div class='add'>+		ret = btrfs_orphan_cleanup(fs_root);</div><div class='ctx'> 		btrfs_put_root(fs_root);</div><div class='ctx'> 	}</div><div class='del'>-	return err;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -4302,27 +4216,27 @@ out:</div><div class='ctx'>  * cloning checksum properly handles the nodatasum extents.</div><div class='ctx'>  * it also saves CPU time to re-calculate the checksum.</div><div class='ctx'>  */</div><div class='del'>-int btrfs_reloc_clone_csums(struct btrfs_inode *inode, u64 file_pos, u64 len)</div><div class='add'>+int btrfs_reloc_clone_csums(struct btrfs_ordered_extent *ordered)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_inode *inode = ordered-&gt;inode;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='del'>-	struct btrfs_ordered_sum *sums;</div><div class='del'>-	struct btrfs_ordered_extent *ordered;</div><div class='del'>-	int ret;</div><div class='del'>-	u64 disk_bytenr;</div><div class='del'>-	u64 new_bytenr;</div><div class='add'>+	u64 disk_bytenr = ordered-&gt;file_offset + inode-&gt;reloc_block_group_start;</div><div class='add'>+	struct btrfs_root *csum_root = btrfs_csum_root(fs_info, disk_bytenr);</div><div class='ctx'> 	LIST_HEAD(list);</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	ordered = btrfs_lookup_ordered_extent(inode, file_pos);</div><div class='del'>-	BUG_ON(ordered-&gt;file_offset != file_pos || ordered-&gt;num_bytes != len);</div><div class='del'>-</div><div class='del'>-	disk_bytenr = file_pos + inode-&gt;index_cnt;</div><div class='del'>-	ret = btrfs_lookup_csums_range(fs_info-&gt;csum_root, disk_bytenr,</div><div class='del'>-				       disk_bytenr + len - 1, &amp;list, 0);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+	ret = btrfs_lookup_csums_list(csum_root, disk_bytenr,</div><div class='add'>+				      disk_bytenr + ordered-&gt;num_bytes - 1,</div><div class='add'>+				      &amp;list, false);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		btrfs_mark_ordered_extent_error(ordered);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	while (!list_empty(&amp;list)) {</div><div class='del'>-		sums = list_entry(list.next, struct btrfs_ordered_sum, list);</div><div class='add'>+		struct btrfs_ordered_sum *sums =</div><div class='add'>+			list_first_entry(&amp;list, struct btrfs_ordered_sum, list);</div><div class='add'>+</div><div class='ctx'> 		list_del_init(&amp;sums-&gt;list);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='hunk'>@@ -4337,18 +4251,16 @@ int btrfs_reloc_clone_csums(struct btrfs_inode *inode, u64 file_pos, u64 len)</div><div class='ctx'> 		 * disk_len vs real len like with real inodes since it's all</div><div class='ctx'> 		 * disk length.</div><div class='ctx'> 		 */</div><div class='del'>-		new_bytenr = ordered-&gt;disk_bytenr + sums-&gt;bytenr - disk_bytenr;</div><div class='del'>-		sums-&gt;bytenr = new_bytenr;</div><div class='del'>-</div><div class='add'>+		sums-&gt;logical = ordered-&gt;disk_bytenr + sums-&gt;logical - disk_bytenr;</div><div class='ctx'> 		btrfs_add_ordered_sum(ordered, sums);</div><div class='ctx'> 	}</div><div class='del'>-out:</div><div class='del'>-	btrfs_put_ordered_extent(ordered);</div><div class='del'>-	return ret;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_reloc_cow_block(struct btrfs_trans_handle *trans,</div><div class='del'>-			  struct btrfs_root *root, struct extent_buffer *buf,</div><div class='add'>+			  struct btrfs_root *root,</div><div class='add'>+			  const struct extent_buffer *buf,</div><div class='ctx'> 			  struct extent_buffer *cow)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='hunk'>@@ -4369,16 +4281,25 @@ int btrfs_reloc_cow_block(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	    btrfs_root_last_snapshot(&amp;root-&gt;root_item))</div><div class='ctx'> 		first_cow = 1;</div><div class='ctx'> </div><div class='del'>-	if (root-&gt;root_key.objectid == BTRFS_TREE_RELOC_OBJECTID &amp;&amp;</div><div class='del'>-	    rc-&gt;create_reloc_tree) {</div><div class='add'>+	if (btrfs_root_id(root) == BTRFS_TREE_RELOC_OBJECTID &amp;&amp; rc-&gt;create_reloc_tree) {</div><div class='ctx'> 		WARN_ON(!first_cow &amp;&amp; level == 0);</div><div class='ctx'> </div><div class='ctx'> 		node = rc-&gt;backref_cache.path[level];</div><div class='del'>-		BUG_ON(node-&gt;bytenr != buf-&gt;start &amp;&amp;</div><div class='del'>-		       node-&gt;new_bytenr != buf-&gt;start);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * If node-&gt;bytenr != buf-&gt;start and node-&gt;new_bytenr !=</div><div class='add'>+		 * buf-&gt;start then we've got the wrong backref node for what we</div><div class='add'>+		 * expected to see here and the cache is incorrect.</div><div class='add'>+		 */</div><div class='add'>+		if (unlikely(node-&gt;bytenr != buf-&gt;start &amp;&amp; node-&gt;new_bytenr != buf-&gt;start)) {</div><div class='add'>+			btrfs_err(fs_info,</div><div class='add'>+"bytenr %llu was found but our backref cache was expecting %llu or %llu",</div><div class='add'>+				  buf-&gt;start, node-&gt;bytenr, node-&gt;new_bytenr);</div><div class='add'>+			return -EUCLEAN;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		btrfs_backref_drop_node_buffer(node);</div><div class='del'>-		atomic_inc(&amp;cow-&gt;refs);</div><div class='add'>+		refcount_inc(&amp;cow-&gt;refs);</div><div class='ctx'> 		node-&gt;eb = cow;</div><div class='ctx'> 		node-&gt;new_bytenr = cow-&gt;start;</div><div class='ctx'> </div><div class='hunk'>@@ -4463,8 +4384,7 @@ int btrfs_reloc_post_snapshot(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	new_root = pending-&gt;snap;</div><div class='del'>-	reloc_root = create_reloc_root(trans, root-&gt;reloc_root,</div><div class='del'>-				       new_root-&gt;root_key.objectid);</div><div class='add'>+	reloc_root = create_reloc_root(trans, root-&gt;reloc_root, btrfs_root_id(new_root));</div><div class='ctx'> 	if (IS_ERR(reloc_root))</div><div class='ctx'> 		return PTR_ERR(reloc_root);</div><div class='ctx'> </div><div class='hunk'>@@ -4476,8 +4396,21 @@ int btrfs_reloc_post_snapshot(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> 	new_root-&gt;reloc_root = btrfs_grab_root(reloc_root);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if (rc-&gt;create_reloc_tree)</div><div class='del'>-		ret = clone_backref_node(trans, rc, root, reloc_root);</div><div class='del'>-	return ret;</div><div class='add'>+/*</div><div class='add'>+ * Get the current bytenr for the block group which is being relocated.</div><div class='add'>+ *</div><div class='add'>+ * Return U64_MAX if no running relocation.</div><div class='add'>+ */</div><div class='add'>+u64 btrfs_get_reloc_bg_bytenr(const struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	u64 logical = U64_MAX;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held(&amp;fs_info-&gt;reloc_mutex);</div><div class='add'>+</div><div class='add'>+	if (fs_info-&gt;reloc_ctl &amp;&amp; fs_info-&gt;reloc_ctl-&gt;block_group)</div><div class='add'>+		logical = fs_info-&gt;reloc_ctl-&gt;block_group-&gt;start;</div><div class='add'>+	return logical;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/btrfs/relocation.h b/fs/btrfs/relocation.h<br/>new file mode 100644<br/>index 000000000000..5c36b3f84b57<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/relocation.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/relocation.h</a></div><div class='hunk'>@@ -0,0 +1,35 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+</div><div class='add'>+#ifndef BTRFS_RELOCATION_H</div><div class='add'>+#define BTRFS_RELOCATION_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+</div><div class='add'>+struct extent_buffer;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+struct btrfs_root;</div><div class='add'>+struct btrfs_trans_handle;</div><div class='add'>+struct btrfs_ordered_extent;</div><div class='add'>+struct btrfs_pending_snapshot;</div><div class='add'>+</div><div class='add'>+int btrfs_relocate_block_group(struct btrfs_fs_info *fs_info, u64 group_start,</div><div class='add'>+			       bool verbose);</div><div class='add'>+int btrfs_init_reloc_root(struct btrfs_trans_handle *trans, struct btrfs_root *root);</div><div class='add'>+int btrfs_update_reloc_root(struct btrfs_trans_handle *trans,</div><div class='add'>+			    struct btrfs_root *root);</div><div class='add'>+int btrfs_recover_relocation(struct btrfs_fs_info *fs_info);</div><div class='add'>+int btrfs_reloc_clone_csums(struct btrfs_ordered_extent *ordered);</div><div class='add'>+int btrfs_reloc_cow_block(struct btrfs_trans_handle *trans,</div><div class='add'>+			  struct btrfs_root *root,</div><div class='add'>+			  const struct extent_buffer *buf,</div><div class='add'>+			  struct extent_buffer *cow);</div><div class='add'>+void btrfs_reloc_pre_snapshot(struct btrfs_pending_snapshot *pending,</div><div class='add'>+			      u64 *bytes_to_reserve);</div><div class='add'>+int btrfs_reloc_post_snapshot(struct btrfs_trans_handle *trans,</div><div class='add'>+			      struct btrfs_pending_snapshot *pending);</div><div class='add'>+int btrfs_should_cancel_balance(const struct btrfs_fs_info *fs_info);</div><div class='add'>+struct btrfs_root *find_reloc_root(struct btrfs_fs_info *fs_info, u64 bytenr);</div><div class='add'>+bool btrfs_should_ignore_reloc_root(const struct btrfs_root *root);</div><div class='add'>+u64 btrfs_get_reloc_bg_bytenr(const struct btrfs_fs_info *fs_info);</div><div class='add'>+</div><div class='add'>+#endif</div><div class='head'>diff --git a/fs/btrfs/root-tree.c b/fs/btrfs/root-tree.c<br/>index 12ceb14a1141..6a7e297ab0a7 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/root-tree.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/root-tree.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/root-tree.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/root-tree.c</a></div><div class='hunk'>@@ -6,11 +6,15 @@</div><div class='ctx'> #include &lt;linux/err.h&gt;</div><div class='ctx'> #include &lt;linux/uuid.h&gt;</div><div class='ctx'> #include "ctree.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "messages.h"</div><div class='ctx'> #include "transaction.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='del'>-#include "print-tree.h"</div><div class='ctx'> #include "qgroup.h"</div><div class='ctx'> #include "space-info.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "root-tree.h"</div><div class='add'>+#include "orphan.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Read a root item from the tree. In case we detect a root item smaller then</div><div class='hunk'>@@ -25,7 +29,7 @@ static void btrfs_read_root_item(struct extent_buffer *eb, int slot,</div><div class='ctx'> 	u32 len;</div><div class='ctx'> 	int need_reset = 0;</div><div class='ctx'> </div><div class='del'>-	len = btrfs_item_size_nr(eb, slot);</div><div class='add'>+	len = btrfs_item_size(eb, slot);</div><div class='ctx'> 	read_extent_buffer(eb, item, btrfs_item_ptr_offset(eb, slot),</div><div class='ctx'> 			   min_t(u32, len, sizeof(*item)));</div><div class='ctx'> 	if (len &lt; sizeof(*item))</div><div class='hunk'>@@ -46,7 +50,8 @@ static void btrfs_read_root_item(struct extent_buffer *eb, int slot,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * btrfs_find_root - lookup the root by the key.</div><div class='add'>+ * Lookup the root by the key.</div><div class='add'>+ *</div><div class='ctx'>  * root: the root of the root tree</div><div class='ctx'>  * search_key: the key to search</div><div class='ctx'>  * path: the path we search</div><div class='hunk'>@@ -76,7 +81,14 @@ int btrfs_find_root(struct btrfs_root *root, const struct btrfs_key *search_key,</div><div class='ctx'> 		if (ret &gt; 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	} else {</div><div class='del'>-		BUG_ON(ret == 0);		/* Logical error */</div><div class='add'>+		/*</div><div class='add'>+		 * Key with offset -1 found, there would have to exist a root</div><div class='add'>+		 * with such id, but this is out of the valid range.</div><div class='add'>+		 */</div><div class='add'>+		if (unlikely(ret == 0)) {</div><div class='add'>+			ret = -EUCLEAN;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> 		if (path-&gt;slots[0] == 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		path-&gt;slots[0]--;</div><div class='hunk'>@@ -118,7 +130,7 @@ int btrfs_update_root(struct btrfs_trans_handle *trans, struct btrfs_root</div><div class='ctx'> 		      *item)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct extent_buffer *l;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int slot;</div><div class='hunk'>@@ -131,22 +143,21 @@ int btrfs_update_root(struct btrfs_trans_handle *trans, struct btrfs_root</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_search_slot(trans, root, key, path, 0, 1);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	if (ret &gt; 0) {</div><div class='add'>+	if (unlikely(ret &gt; 0)) {</div><div class='ctx'> 		btrfs_crit(fs_info,</div><div class='del'>-			"unable to find root key (%llu %u %llu) in tree %llu",</div><div class='del'>-			key-&gt;objectid, key-&gt;type, key-&gt;offset,</div><div class='del'>-			root-&gt;root_key.objectid);</div><div class='add'>+			   "unable to find root key " BTRFS_KEY_FMT " in tree %llu",</div><div class='add'>+			   BTRFS_KEY_FMT_VALUE(key), btrfs_root_id(root));</div><div class='ctx'> 		ret = -EUCLEAN;</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	l = path-&gt;nodes[0];</div><div class='ctx'> 	slot = path-&gt;slots[0];</div><div class='ctx'> 	ptr = btrfs_item_ptr_offset(l, slot);</div><div class='del'>-	old_len = btrfs_item_size_nr(l, slot);</div><div class='add'>+	old_len = btrfs_item_size(l, slot);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If this is the first time we update the root item which originated</div><div class='hunk'>@@ -157,22 +168,22 @@ int btrfs_update_root(struct btrfs_trans_handle *trans, struct btrfs_root</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> 		ret = btrfs_search_slot(trans, root, key, path,</div><div class='ctx'> 				-1, 1);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='add'>+		if (unlikely(ret &lt; 0)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		ret = btrfs_del_item(trans, root, path);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='add'>+		if (unlikely(ret &lt; 0)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 		}</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> 		ret = btrfs_insert_empty_item(trans, root, path,</div><div class='ctx'> 				key, sizeof(*item));</div><div class='del'>-		if (ret &lt; 0) {</div><div class='add'>+		if (unlikely(ret &lt; 0)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 		}</div><div class='ctx'> 		l = path-&gt;nodes[0];</div><div class='ctx'> 		slot = path-&gt;slots[0];</div><div class='hunk'>@@ -186,9 +197,6 @@ int btrfs_update_root(struct btrfs_trans_handle *trans, struct btrfs_root</div><div class='ctx'> 	btrfs_set_root_generation_v2(item, btrfs_root_generation(item));</div><div class='ctx'> </div><div class='ctx'> 	write_extent_buffer(l, item, ptr, sizeof(*item));</div><div class='del'>-	btrfs_mark_buffer_dirty(path-&gt;nodes[0]);</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -206,7 +214,7 @@ int btrfs_find_orphan_roots(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *tree_root = fs_info-&gt;tree_root;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_root *root;</div><div class='ctx'> 	int err = 0;</div><div class='hunk'>@@ -278,13 +286,27 @@ int btrfs_find_orphan_roots(struct btrfs_fs_info *fs_info)</div><div class='ctx'> </div><div class='ctx'> 		WARN_ON(!test_bit(BTRFS_ROOT_ORPHAN_ITEM_INSERTED, &amp;root-&gt;state));</div><div class='ctx'> 		if (btrfs_root_refs(&amp;root-&gt;root_item) == 0) {</div><div class='add'>+			struct btrfs_key drop_key;</div><div class='add'>+</div><div class='add'>+			btrfs_disk_key_to_cpu(&amp;drop_key, &amp;root-&gt;root_item.drop_progress);</div><div class='add'>+			/*</div><div class='add'>+			 * If we have a non-zero drop_progress then we know we</div><div class='add'>+			 * made it partly through deleting this snapshot, and</div><div class='add'>+			 * thus we need to make sure we block any balance from</div><div class='add'>+			 * happening until this snapshot is completely dropped.</div><div class='add'>+			 */</div><div class='add'>+			if (drop_key.objectid != 0 || drop_key.type != 0 ||</div><div class='add'>+			    drop_key.offset != 0) {</div><div class='add'>+				set_bit(BTRFS_FS_UNFINISHED_DROPS, &amp;fs_info-&gt;flags);</div><div class='add'>+				set_bit(BTRFS_ROOT_UNFINISHED_DROP, &amp;root-&gt;state);</div><div class='add'>+			}</div><div class='add'>+</div><div class='ctx'> 			set_bit(BTRFS_ROOT_DEAD_TREE, &amp;root-&gt;state);</div><div class='ctx'> 			btrfs_add_dead_root(root);</div><div class='ctx'> 		}</div><div class='ctx'> 		btrfs_put_root(root);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -293,7 +315,7 @@ int btrfs_del_root(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		   const struct btrfs_key *key)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root = trans-&gt;fs_info-&gt;tree_root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='hunk'>@@ -301,28 +323,24 @@ int btrfs_del_root(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	ret = btrfs_search_slot(trans, root, key, path, -1, 1);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	BUG_ON(ret != 0);</div><div class='add'>+		return ret;</div><div class='add'>+	if (unlikely(ret &gt; 0))</div><div class='add'>+		/* The root must exist but we did not find it by the key. */</div><div class='add'>+		return -EUCLEAN;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_del_item(trans, root, path);</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	return btrfs_del_item(trans, root, path);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_del_root_ref(struct btrfs_trans_handle *trans, u64 root_id,</div><div class='del'>-		       u64 ref_id, u64 dirid, u64 *sequence, const char *name,</div><div class='del'>-		       int name_len)</div><div class='del'>-</div><div class='add'>+		       u64 ref_id, u64 dirid, u64 *sequence,</div><div class='add'>+		       const struct fscrypt_str *name)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *tree_root = trans-&gt;fs_info-&gt;tree_root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_root_ref *ref;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	unsigned long ptr;</div><div class='del'>-	int err = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='hunk'>@@ -334,27 +352,26 @@ int btrfs_del_root_ref(struct btrfs_trans_handle *trans, u64 root_id,</div><div class='ctx'> 	key.offset = ref_id;</div><div class='ctx'> again:</div><div class='ctx'> 	ret = btrfs_search_slot(trans, tree_root, &amp;key, path, -1, 1);</div><div class='del'>-	BUG_ON(ret &lt; 0);</div><div class='del'>-	if (ret == 0) {</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		return ret;</div><div class='add'>+	} else if (ret == 0) {</div><div class='ctx'> 		leaf = path-&gt;nodes[0];</div><div class='ctx'> 		ref = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='ctx'> 				     struct btrfs_root_ref);</div><div class='ctx'> 		ptr = (unsigned long)(ref + 1);</div><div class='ctx'> 		if ((btrfs_root_ref_dirid(leaf, ref) != dirid) ||</div><div class='del'>-		    (btrfs_root_ref_name_len(leaf, ref) != name_len) ||</div><div class='del'>-		    memcmp_extent_buffer(leaf, name, ptr, name_len)) {</div><div class='del'>-			err = -ENOENT;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+		    (btrfs_root_ref_name_len(leaf, ref) != name-&gt;len) ||</div><div class='add'>+		    memcmp_extent_buffer(leaf, name-&gt;name, ptr, name-&gt;len))</div><div class='add'>+			return -ENOENT;</div><div class='add'>+</div><div class='ctx'> 		*sequence = btrfs_root_ref_sequence(leaf, ref);</div><div class='ctx'> </div><div class='ctx'> 		ret = btrfs_del_item(trans, tree_root, path);</div><div class='del'>-		if (ret) {</div><div class='del'>-			err = ret;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-	} else</div><div class='del'>-		err = -ENOENT;</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+	} else {</div><div class='add'>+		return -ENOENT;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (key.type == BTRFS_ROOT_BACKREF_KEY) {</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='hunk'>@@ -364,9 +381,7 @@ again:</div><div class='ctx'> 		goto again;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return err;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -385,13 +400,13 @@ out:</div><div class='ctx'>  * Will return 0, -ENOMEM, or anything from the CoW path</div><div class='ctx'>  */</div><div class='ctx'> int btrfs_add_root_ref(struct btrfs_trans_handle *trans, u64 root_id,</div><div class='del'>-		       u64 ref_id, u64 dirid, u64 sequence, const char *name,</div><div class='del'>-		       int name_len)</div><div class='add'>+		       u64 ref_id, u64 dirid, u64 sequence,</div><div class='add'>+		       const struct fscrypt_str *name)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *tree_root = trans-&gt;fs_info-&gt;tree_root;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	int ret;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_root_ref *ref;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	unsigned long ptr;</div><div class='hunk'>@@ -405,10 +420,9 @@ int btrfs_add_root_ref(struct btrfs_trans_handle *trans, u64 root_id,</div><div class='ctx'> 	key.offset = ref_id;</div><div class='ctx'> again:</div><div class='ctx'> 	ret = btrfs_insert_empty_item(trans, tree_root, path, &amp;key,</div><div class='del'>-				      sizeof(*ref) + name_len);</div><div class='del'>-	if (ret) {</div><div class='add'>+				      sizeof(*ref) + name-&gt;len);</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='del'>-		btrfs_free_path(path);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -416,10 +430,9 @@ again:</div><div class='ctx'> 	ref = btrfs_item_ptr(leaf, path-&gt;slots[0], struct btrfs_root_ref);</div><div class='ctx'> 	btrfs_set_root_ref_dirid(leaf, ref, dirid);</div><div class='ctx'> 	btrfs_set_root_ref_sequence(leaf, ref, sequence);</div><div class='del'>-	btrfs_set_root_ref_name_len(leaf, ref, name_len);</div><div class='add'>+	btrfs_set_root_ref_name_len(leaf, ref, name-&gt;len);</div><div class='ctx'> 	ptr = (unsigned long)(ref + 1);</div><div class='del'>-	write_extent_buffer(leaf, name, ptr, name_len);</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='add'>+	write_extent_buffer(leaf, name-&gt;name, ptr, name-&gt;len);</div><div class='ctx'> </div><div class='ctx'> 	if (key.type == BTRFS_ROOT_BACKREF_KEY) {</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='hunk'>@@ -429,7 +442,6 @@ again:</div><div class='ctx'> 		goto again;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -466,7 +478,8 @@ void btrfs_update_root_times(struct btrfs_trans_handle *trans,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * btrfs_subvolume_reserve_metadata() - reserve space for subvolume operation</div><div class='add'>+ * Reserve space for subvolume operation.</div><div class='add'>+ *</div><div class='ctx'>  * root: the root of the parent directory</div><div class='ctx'>  * rsv: block reservation</div><div class='ctx'>  * items: the number of items that we need do reservation</div><div class='hunk'>@@ -489,11 +502,12 @@ int btrfs_subvolume_reserve_metadata(struct btrfs_root *root,</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_block_rsv *global_rsv = &amp;fs_info-&gt;global_block_rsv;</div><div class='ctx'> </div><div class='del'>-	if (test_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags)) {</div><div class='add'>+	if (btrfs_qgroup_enabled(fs_info)) {</div><div class='ctx'> 		/* One for parent inode, two for dir entries */</div><div class='ctx'> 		qgroup_num_bytes = 3 * fs_info-&gt;nodesize;</div><div class='ctx'> 		ret = btrfs_qgroup_reserve_meta_prealloc(root,</div><div class='del'>-				qgroup_num_bytes, true);</div><div class='add'>+							 qgroup_num_bytes, true,</div><div class='add'>+							 false);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -501,7 +515,7 @@ int btrfs_subvolume_reserve_metadata(struct btrfs_root *root,</div><div class='ctx'> 	num_bytes = btrfs_calc_insert_metadata_size(fs_info, items);</div><div class='ctx'> 	rsv-&gt;space_info = btrfs_find_space_info(fs_info,</div><div class='ctx'> 					    BTRFS_BLOCK_GROUP_METADATA);</div><div class='del'>-	ret = btrfs_block_rsv_add(root, rsv, num_bytes,</div><div class='add'>+	ret = btrfs_block_rsv_add(fs_info, rsv, num_bytes,</div><div class='ctx'> 				  BTRFS_RESERVE_FLUSH_ALL);</div><div class='ctx'> </div><div class='ctx'> 	if (ret == -ENOSPC &amp;&amp; use_global_rsv)</div><div class='hunk'>@@ -517,13 +531,3 @@ int btrfs_subvolume_reserve_metadata(struct btrfs_root *root,</div><div class='ctx'> 	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='del'>-</div><div class='del'>-void btrfs_subvolume_release_metadata(struct btrfs_root *root,</div><div class='del'>-				      struct btrfs_block_rsv *rsv)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='del'>-	u64 qgroup_to_release;</div><div class='del'>-</div><div class='del'>-	btrfs_block_rsv_release(fs_info, rsv, (u64)-1, &amp;qgroup_to_release);</div><div class='del'>-	btrfs_qgroup_convert_reserved_meta(root, qgroup_to_release);</div><div class='del'>-}</div><div class='head'>diff --git a/fs/btrfs/root-tree.h b/fs/btrfs/root-tree.h<br/>new file mode 100644<br/>index 000000000000..8f5739e732b9<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/root-tree.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/root-tree.h</a></div><div class='hunk'>@@ -0,0 +1,42 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+</div><div class='add'>+#ifndef BTRFS_ROOT_TREE_H</div><div class='add'>+#define BTRFS_ROOT_TREE_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+</div><div class='add'>+struct fscrypt_str;</div><div class='add'>+struct extent_buffer;</div><div class='add'>+struct btrfs_key;</div><div class='add'>+struct btrfs_root;</div><div class='add'>+struct btrfs_root_item;</div><div class='add'>+struct btrfs_path;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+struct btrfs_block_rsv;</div><div class='add'>+struct btrfs_trans_handle;</div><div class='add'>+</div><div class='add'>+int btrfs_subvolume_reserve_metadata(struct btrfs_root *root,</div><div class='add'>+				     struct btrfs_block_rsv *rsv,</div><div class='add'>+				     int nitems, bool use_global_rsv);</div><div class='add'>+int btrfs_add_root_ref(struct btrfs_trans_handle *trans, u64 root_id,</div><div class='add'>+		       u64 ref_id, u64 dirid, u64 sequence,</div><div class='add'>+		       const struct fscrypt_str *name);</div><div class='add'>+int btrfs_del_root_ref(struct btrfs_trans_handle *trans, u64 root_id,</div><div class='add'>+		       u64 ref_id, u64 dirid, u64 *sequence,</div><div class='add'>+		       const struct fscrypt_str *name);</div><div class='add'>+int btrfs_del_root(struct btrfs_trans_handle *trans, const struct btrfs_key *key);</div><div class='add'>+int btrfs_insert_root(struct btrfs_trans_handle *trans, struct btrfs_root *root,</div><div class='add'>+		      const struct btrfs_key *key,</div><div class='add'>+		      struct btrfs_root_item *item);</div><div class='add'>+int btrfs_update_root(struct btrfs_trans_handle *trans, struct btrfs_root *root,</div><div class='add'>+		      struct btrfs_key *key, struct btrfs_root_item *item);</div><div class='add'>+int btrfs_find_root(struct btrfs_root *root, const struct btrfs_key *search_key,</div><div class='add'>+		    struct btrfs_path *path, struct btrfs_root_item *root_item,</div><div class='add'>+		    struct btrfs_key *root_key);</div><div class='add'>+int btrfs_find_orphan_roots(struct btrfs_fs_info *fs_info);</div><div class='add'>+void btrfs_set_root_node(struct btrfs_root_item *item,</div><div class='add'>+			 struct extent_buffer *node);</div><div class='add'>+void btrfs_check_and_init_root_item(struct btrfs_root_item *item);</div><div class='add'>+void btrfs_update_root_times(struct btrfs_trans_handle *trans, struct btrfs_root *root);</div><div class='add'>+</div><div class='add'>+#endif</div><div class='head'>diff --git a/fs/btrfs/scrub.c b/fs/btrfs/scrub.c<br/>index cf82ea6f54fb..a40ee41f42c6 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/scrub.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/scrub.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/scrub.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/scrub.c</a></div><div class='hunk'>@@ -16,11 +16,14 @@</div><div class='ctx'> #include "backref.h"</div><div class='ctx'> #include "extent_io.h"</div><div class='ctx'> #include "dev-replace.h"</div><div class='del'>-#include "check-integrity.h"</div><div class='del'>-#include "rcu-string.h"</div><div class='ctx'> #include "raid56.h"</div><div class='ctx'> #include "block-group.h"</div><div class='ctx'> #include "zoned.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "file-item.h"</div><div class='add'>+#include "scrub.h"</div><div class='add'>+#include "raid-stripe-tree.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * This is only the first step towards a full-features scrub. It reads all</div><div class='hunk'>@@ -35,148 +38,179 @@</div><div class='ctx'>  *  - add a mode to also read unallocated space</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-struct scrub_block;</div><div class='ctx'> struct scrub_ctx;</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * the following three values only influence the performance.</div><div class='del'>- * The last one configures the number of parallel and outstanding I/O</div><div class='del'>- * operations. The first two values configure an upper limit for the number</div><div class='del'>- * of (dynamically allocated) pages that are added to a bio.</div><div class='add'>+ * The following value only influences the performance.</div><div class='add'>+ *</div><div class='add'>+ * This determines how many stripes would be submitted in one go,</div><div class='add'>+ * which is 512KiB (BTRFS_STRIPE_LEN * SCRUB_STRIPES_PER_GROUP).</div><div class='add'>+ */</div><div class='add'>+#define SCRUB_STRIPES_PER_GROUP		8</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * How many groups we have for each sctx.</div><div class='add'>+ *</div><div class='add'>+ * This would be 8M per device, the same value as the old scrub in-flight bios</div><div class='add'>+ * size limit.</div><div class='ctx'>  */</div><div class='del'>-#define SCRUB_PAGES_PER_RD_BIO	32	/* 128k per bio */</div><div class='del'>-#define SCRUB_PAGES_PER_WR_BIO	32	/* 128k per bio */</div><div class='del'>-#define SCRUB_BIOS_PER_SCTX	64	/* 8MB per device in flight */</div><div class='add'>+#define SCRUB_GROUPS_PER_SCTX		16</div><div class='add'>+</div><div class='add'>+#define SCRUB_TOTAL_STRIPES		(SCRUB_GROUPS_PER_SCTX * SCRUB_STRIPES_PER_GROUP)</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * the following value times PAGE_SIZE needs to be large enough to match the</div><div class='add'>+ * The following value times PAGE_SIZE needs to be large enough to match the</div><div class='ctx'>  * largest node/leaf/sector size that shall be supported.</div><div class='del'>- * Values larger than BTRFS_STRIPE_LEN are not supported.</div><div class='ctx'>  */</div><div class='del'>-#define SCRUB_MAX_PAGES_PER_BLOCK	16	/* 64k per node/leaf/sector */</div><div class='add'>+#define SCRUB_MAX_SECTORS_PER_BLOCK	(BTRFS_MAX_METADATA_BLOCKSIZE / SZ_4K)</div><div class='ctx'> </div><div class='del'>-struct scrub_recover {</div><div class='del'>-	refcount_t		refs;</div><div class='del'>-	struct btrfs_io_context	*bioc;</div><div class='del'>-	u64			map_length;</div><div class='del'>-};</div><div class='add'>+/* Represent one sector and its needed info to verify the content. */</div><div class='add'>+struct scrub_sector_verification {</div><div class='add'>+	union {</div><div class='add'>+		/*</div><div class='add'>+		 * Csum pointer for data csum verification.  Should point to a</div><div class='add'>+		 * sector csum inside scrub_stripe::csums.</div><div class='add'>+		 *</div><div class='add'>+		 * NULL if this data sector has no csum.</div><div class='add'>+		 */</div><div class='add'>+		u8 *csum;</div><div class='ctx'> </div><div class='del'>-struct scrub_page {</div><div class='del'>-	struct scrub_block	*sblock;</div><div class='del'>-	struct page		*page;</div><div class='del'>-	struct btrfs_device	*dev;</div><div class='del'>-	struct list_head	list;</div><div class='del'>-	u64			flags;  /* extent flags */</div><div class='del'>-	u64			generation;</div><div class='del'>-	u64			logical;</div><div class='del'>-	u64			physical;</div><div class='del'>-	u64			physical_for_dev_replace;</div><div class='del'>-	atomic_t		refs;</div><div class='del'>-	u8			mirror_num;</div><div class='del'>-	int			have_csum:1;</div><div class='del'>-	int			io_error:1;</div><div class='del'>-	u8			csum[BTRFS_CSUM_SIZE];</div><div class='del'>-</div><div class='del'>-	struct scrub_recover	*recover;</div><div class='add'>+		/*</div><div class='add'>+		 * Extra info for metadata verification.  All sectors inside a</div><div class='add'>+		 * tree block share the same generation.</div><div class='add'>+		 */</div><div class='add'>+		u64 generation;</div><div class='add'>+	};</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-struct scrub_bio {</div><div class='del'>-	int			index;</div><div class='del'>-	struct scrub_ctx	*sctx;</div><div class='del'>-	struct btrfs_device	*dev;</div><div class='del'>-	struct bio		*bio;</div><div class='del'>-	blk_status_t		status;</div><div class='del'>-	u64			logical;</div><div class='del'>-	u64			physical;</div><div class='del'>-#if SCRUB_PAGES_PER_WR_BIO &gt;= SCRUB_PAGES_PER_RD_BIO</div><div class='del'>-	struct scrub_page	*pagev[SCRUB_PAGES_PER_WR_BIO];</div><div class='del'>-#else</div><div class='del'>-	struct scrub_page	*pagev[SCRUB_PAGES_PER_RD_BIO];</div><div class='del'>-#endif</div><div class='del'>-	int			page_count;</div><div class='del'>-	int			next_free;</div><div class='del'>-	struct btrfs_work	work;</div><div class='add'>+enum scrub_stripe_flags {</div><div class='add'>+	/* Set when @mirror_num, @dev, @physical and @logical are set. */</div><div class='add'>+	SCRUB_STRIPE_FLAG_INITIALIZED,</div><div class='add'>+</div><div class='add'>+	/* Set when the read-repair is finished. */</div><div class='add'>+	SCRUB_STRIPE_FLAG_REPAIR_DONE,</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Set for data stripes if it's triggered from P/Q stripe.</div><div class='add'>+	 * During such scrub, we should not report errors in data stripes, nor</div><div class='add'>+	 * update the accounting.</div><div class='add'>+	 */</div><div class='add'>+	SCRUB_STRIPE_FLAG_NO_REPORT,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-struct scrub_block {</div><div class='del'>-	struct scrub_page	*pagev[SCRUB_MAX_PAGES_PER_BLOCK];</div><div class='del'>-	int			page_count;</div><div class='del'>-	atomic_t		outstanding_pages;</div><div class='del'>-	refcount_t		refs; /* free mem on transition to zero */</div><div class='del'>-	struct scrub_ctx	*sctx;</div><div class='del'>-	struct scrub_parity	*sparity;</div><div class='del'>-	struct {</div><div class='del'>-		unsigned int	header_error:1;</div><div class='del'>-		unsigned int	checksum_error:1;</div><div class='del'>-		unsigned int	no_io_error_seen:1;</div><div class='del'>-		unsigned int	generation_error:1; /* also sets header_error */</div><div class='del'>-</div><div class='del'>-		/* The following is for the data used to check parity */</div><div class='del'>-		/* It is for the data with checksum */</div><div class='del'>-		unsigned int	data_corrected:1;</div><div class='del'>-	};</div><div class='del'>-	struct btrfs_work	work;</div><div class='add'>+/*</div><div class='add'>+ * We have multiple bitmaps for one scrub_stripe.</div><div class='add'>+ * However each bitmap has at most (BTRFS_STRIPE_LEN / blocksize) bits,</div><div class='add'>+ * which is normally 16, and much smaller than BITS_PER_LONG (32 or 64).</div><div class='add'>+ *</div><div class='add'>+ * So to reduce memory usage for each scrub_stripe, we pack those bitmaps</div><div class='add'>+ * into a larger one.</div><div class='add'>+ *</div><div class='add'>+ * These enum records where the sub-bitmap are inside the larger one.</div><div class='add'>+ * Each subbitmap starts at scrub_bitmap_nr_##name * nr_sectors bit.</div><div class='add'>+ */</div><div class='add'>+enum {</div><div class='add'>+	/* Which blocks are covered by extent items. */</div><div class='add'>+	scrub_bitmap_nr_has_extent = 0,</div><div class='add'>+</div><div class='add'>+	/* Which blocks are metadata. */</div><div class='add'>+	scrub_bitmap_nr_is_metadata,</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Which blocks have errors, including IO, csum, and metadata</div><div class='add'>+	 * errors.</div><div class='add'>+	 * This sub-bitmap is the OR results of the next few error related</div><div class='add'>+	 * sub-bitmaps.</div><div class='add'>+	 */</div><div class='add'>+	scrub_bitmap_nr_error,</div><div class='add'>+	scrub_bitmap_nr_io_error,</div><div class='add'>+	scrub_bitmap_nr_csum_error,</div><div class='add'>+	scrub_bitmap_nr_meta_error,</div><div class='add'>+	scrub_bitmap_nr_meta_gen_error,</div><div class='add'>+	scrub_bitmap_nr_last,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/* Used for the chunks with parity stripe such RAID5/6 */</div><div class='del'>-struct scrub_parity {</div><div class='del'>-	struct scrub_ctx	*sctx;</div><div class='add'>+#define SCRUB_STRIPE_MAX_FOLIOS		(BTRFS_STRIPE_LEN / PAGE_SIZE)</div><div class='ctx'> </div><div class='del'>-	struct btrfs_device	*scrub_dev;</div><div class='add'>+/*</div><div class='add'>+ * Represent one contiguous range with a length of BTRFS_STRIPE_LEN.</div><div class='add'>+ */</div><div class='add'>+struct scrub_stripe {</div><div class='add'>+	struct scrub_ctx *sctx;</div><div class='add'>+	struct btrfs_block_group *bg;</div><div class='ctx'> </div><div class='del'>-	u64			logic_start;</div><div class='add'>+	struct folio *folios[SCRUB_STRIPE_MAX_FOLIOS];</div><div class='add'>+	struct scrub_sector_verification *sectors;</div><div class='ctx'> </div><div class='del'>-	u64			logic_end;</div><div class='add'>+	struct btrfs_device *dev;</div><div class='add'>+	u64 logical;</div><div class='add'>+	u64 physical;</div><div class='ctx'> </div><div class='del'>-	int			nsectors;</div><div class='add'>+	u16 mirror_num;</div><div class='ctx'> </div><div class='del'>-	u32			stripe_len;</div><div class='add'>+	/* Should be BTRFS_STRIPE_LEN / sectorsize. */</div><div class='add'>+	u16 nr_sectors;</div><div class='ctx'> </div><div class='del'>-	refcount_t		refs;</div><div class='add'>+	/*</div><div class='add'>+	 * How many data/meta extents are in this stripe.  Only for scrub status</div><div class='add'>+	 * reporting purposes.</div><div class='add'>+	 */</div><div class='add'>+	u16 nr_data_extents;</div><div class='add'>+	u16 nr_meta_extents;</div><div class='ctx'> </div><div class='del'>-	struct list_head	spages;</div><div class='add'>+	atomic_t pending_io;</div><div class='add'>+	wait_queue_head_t io_wait;</div><div class='add'>+	wait_queue_head_t repair_wait;</div><div class='ctx'> </div><div class='del'>-	/* Work of parity check and repair */</div><div class='del'>-	struct btrfs_work	work;</div><div class='add'>+	/*</div><div class='add'>+	 * Indicate the states of the stripe.  Bits are defined in</div><div class='add'>+	 * scrub_stripe_flags enum.</div><div class='add'>+	 */</div><div class='add'>+	unsigned long state;</div><div class='ctx'> </div><div class='del'>-	/* Mark the parity blocks which have data */</div><div class='del'>-	unsigned long		*dbitmap;</div><div class='add'>+	/* The large bitmap contains all the sub-bitmaps. */</div><div class='add'>+	unsigned long bitmaps[BITS_TO_LONGS(scrub_bitmap_nr_last *</div><div class='add'>+					    (BTRFS_STRIPE_LEN / BTRFS_MIN_BLOCKSIZE))];</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Mark the parity blocks which have data, but errors happen when</div><div class='del'>-	 * read data or check data</div><div class='add'>+	 * For writeback (repair or replace) error reporting.</div><div class='add'>+	 * This one is protected by a spinlock, thus can not be packed into</div><div class='add'>+	 * the larger bitmap.</div><div class='ctx'> 	 */</div><div class='del'>-	unsigned long		*ebitmap;</div><div class='add'>+	unsigned long write_error_bitmap;</div><div class='add'>+</div><div class='add'>+	/* Writeback can be concurrent, thus we need to protect the bitmap. */</div><div class='add'>+	spinlock_t write_error_lock;</div><div class='ctx'> </div><div class='del'>-	unsigned long		bitmap[];</div><div class='add'>+	/*</div><div class='add'>+	 * Checksum for the whole stripe if this stripe is inside a data block</div><div class='add'>+	 * group.</div><div class='add'>+	 */</div><div class='add'>+	u8 *csums;</div><div class='add'>+</div><div class='add'>+	struct work_struct work;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct scrub_ctx {</div><div class='del'>-	struct scrub_bio	*bios[SCRUB_BIOS_PER_SCTX];</div><div class='add'>+	struct scrub_stripe	stripes[SCRUB_TOTAL_STRIPES];</div><div class='add'>+	struct scrub_stripe	*raid56_data_stripes;</div><div class='ctx'> 	struct btrfs_fs_info	*fs_info;</div><div class='add'>+	struct btrfs_path	extent_path;</div><div class='add'>+	struct btrfs_path	csum_path;</div><div class='ctx'> 	int			first_free;</div><div class='del'>-	int			curr;</div><div class='del'>-	atomic_t		bios_in_flight;</div><div class='del'>-	atomic_t		workers_pending;</div><div class='del'>-	spinlock_t		list_lock;</div><div class='del'>-	wait_queue_head_t	list_wait;</div><div class='del'>-	struct list_head	csum_list;</div><div class='add'>+	int			cur_stripe;</div><div class='ctx'> 	atomic_t		cancel_req;</div><div class='ctx'> 	int			readonly;</div><div class='del'>-	int			pages_per_rd_bio;</div><div class='ctx'> </div><div class='ctx'> 	/* State of IO submission throttling affecting the associated device */</div><div class='ctx'> 	ktime_t			throttle_deadline;</div><div class='ctx'> 	u64			throttle_sent;</div><div class='ctx'> </div><div class='del'>-	int			is_dev_replace;</div><div class='add'>+	bool			is_dev_replace;</div><div class='ctx'> 	u64			write_pointer;</div><div class='ctx'> </div><div class='del'>-	struct scrub_bio        *wr_curr_bio;</div><div class='ctx'> 	struct mutex            wr_lock;</div><div class='del'>-	int                     pages_per_wr_bio; /* &lt;= SCRUB_PAGES_PER_WR_BIO */</div><div class='ctx'> 	struct btrfs_device     *wr_tgtdev;</div><div class='del'>-	bool                    flush_all_writes;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * statistics</div><div class='hunk'>@@ -194,6 +228,90 @@ struct scrub_ctx {</div><div class='ctx'> 	refcount_t              refs;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+#define scrub_calc_start_bit(stripe, name, block_nr)			\</div><div class='add'>+({									\</div><div class='add'>+	unsigned int __start_bit;					\</div><div class='add'>+									\</div><div class='add'>+	ASSERT(block_nr &lt; stripe-&gt;nr_sectors,				\</div><div class='add'>+		"nr_sectors=%u block_nr=%u", stripe-&gt;nr_sectors, block_nr); \</div><div class='add'>+	__start_bit = scrub_bitmap_nr_##name * stripe-&gt;nr_sectors + block_nr; \</div><div class='add'>+	__start_bit;							\</div><div class='add'>+})</div><div class='add'>+</div><div class='add'>+#define IMPLEMENT_SCRUB_BITMAP_OPS(name)				\</div><div class='add'>+static inline void scrub_bitmap_set_##name(struct scrub_stripe *stripe,	\</div><div class='add'>+				    unsigned int block_nr,		\</div><div class='add'>+				    unsigned int nr_blocks)		\</div><div class='add'>+{									\</div><div class='add'>+	const unsigned int start_bit = scrub_calc_start_bit(stripe,	\</div><div class='add'>+							    name, block_nr); \</div><div class='add'>+									\</div><div class='add'>+	bitmap_set(stripe-&gt;bitmaps, start_bit, nr_blocks);		\</div><div class='add'>+}									\</div><div class='add'>+static inline void scrub_bitmap_clear_##name(struct scrub_stripe *stripe, \</div><div class='add'>+				      unsigned int block_nr,		\</div><div class='add'>+				      unsigned int nr_blocks)		\</div><div class='add'>+{									\</div><div class='add'>+	const unsigned int start_bit = scrub_calc_start_bit(stripe, name, \</div><div class='add'>+							    block_nr);	\</div><div class='add'>+									\</div><div class='add'>+	bitmap_clear(stripe-&gt;bitmaps, start_bit, nr_blocks);		\</div><div class='add'>+}									\</div><div class='add'>+static inline bool scrub_bitmap_test_bit_##name(struct scrub_stripe *stripe, \</div><div class='add'>+				     unsigned int block_nr)		\</div><div class='add'>+{									\</div><div class='add'>+	const unsigned int start_bit = scrub_calc_start_bit(stripe, name, \</div><div class='add'>+							    block_nr);	\</div><div class='add'>+									\</div><div class='add'>+	return test_bit(start_bit, stripe-&gt;bitmaps);			\</div><div class='add'>+}									\</div><div class='add'>+static inline void scrub_bitmap_set_bit_##name(struct scrub_stripe *stripe, \</div><div class='add'>+				     unsigned int block_nr)		\</div><div class='add'>+{									\</div><div class='add'>+	const unsigned int start_bit = scrub_calc_start_bit(stripe, name, \</div><div class='add'>+							    block_nr);	\</div><div class='add'>+									\</div><div class='add'>+	set_bit(start_bit, stripe-&gt;bitmaps);				\</div><div class='add'>+}									\</div><div class='add'>+static inline void scrub_bitmap_clear_bit_##name(struct scrub_stripe *stripe, \</div><div class='add'>+				     unsigned int block_nr)		\</div><div class='add'>+{									\</div><div class='add'>+	const unsigned int start_bit = scrub_calc_start_bit(stripe, name, \</div><div class='add'>+							    block_nr);	\</div><div class='add'>+									\</div><div class='add'>+	clear_bit(start_bit, stripe-&gt;bitmaps);				\</div><div class='add'>+}									\</div><div class='add'>+static inline unsigned long scrub_bitmap_read_##name(struct scrub_stripe *stripe) \</div><div class='add'>+{									\</div><div class='add'>+	const unsigned int nr_blocks = stripe-&gt;nr_sectors;		\</div><div class='add'>+									\</div><div class='add'>+	ASSERT(nr_blocks &gt; 0 &amp;&amp; nr_blocks &lt;= BITS_PER_LONG,		\</div><div class='add'>+	       "nr_blocks=%u BITS_PER_LONG=%u",				\</div><div class='add'>+	       nr_blocks, BITS_PER_LONG);				\</div><div class='add'>+									\</div><div class='add'>+	return bitmap_read(stripe-&gt;bitmaps, nr_blocks * scrub_bitmap_nr_##name, \</div><div class='add'>+			   stripe-&gt;nr_sectors);				\</div><div class='add'>+}									\</div><div class='add'>+static inline bool scrub_bitmap_empty_##name(struct scrub_stripe *stripe) \</div><div class='add'>+{									\</div><div class='add'>+	unsigned long bitmap = scrub_bitmap_read_##name(stripe);	\</div><div class='add'>+									\</div><div class='add'>+	return bitmap_empty(&amp;bitmap, stripe-&gt;nr_sectors);		\</div><div class='add'>+}									\</div><div class='add'>+static inline unsigned int scrub_bitmap_weight_##name(struct scrub_stripe *stripe) \</div><div class='add'>+{									\</div><div class='add'>+	unsigned long bitmap = scrub_bitmap_read_##name(stripe);	\</div><div class='add'>+									\</div><div class='add'>+	return bitmap_weight(&amp;bitmap, stripe-&gt;nr_sectors);		\</div><div class='add'>+}</div><div class='add'>+IMPLEMENT_SCRUB_BITMAP_OPS(has_extent);</div><div class='add'>+IMPLEMENT_SCRUB_BITMAP_OPS(is_metadata);</div><div class='add'>+IMPLEMENT_SCRUB_BITMAP_OPS(error);</div><div class='add'>+IMPLEMENT_SCRUB_BITMAP_OPS(io_error);</div><div class='add'>+IMPLEMENT_SCRUB_BITMAP_OPS(csum_error);</div><div class='add'>+IMPLEMENT_SCRUB_BITMAP_OPS(meta_error);</div><div class='add'>+IMPLEMENT_SCRUB_BITMAP_OPS(meta_gen_error);</div><div class='add'>+</div><div class='ctx'> struct scrub_warning {</div><div class='ctx'> 	struct btrfs_path	*path;</div><div class='ctx'> 	u64			extent_item_size;</div><div class='hunk'>@@ -203,73 +321,82 @@ struct scrub_warning {</div><div class='ctx'> 	struct btrfs_device	*dev;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-struct full_stripe_lock {</div><div class='del'>-	struct rb_node node;</div><div class='del'>-	u64 logical;</div><div class='del'>-	u64 refs;</div><div class='del'>-	struct mutex mutex;</div><div class='del'>-};</div><div class='add'>+struct scrub_error_records {</div><div class='add'>+	/*</div><div class='add'>+	 * Bitmap recording which blocks hit errors (IO/csum/...) during the</div><div class='add'>+	 * initial read.</div><div class='add'>+	 */</div><div class='add'>+	unsigned long init_error_bitmap;</div><div class='ctx'> </div><div class='del'>-static int scrub_setup_recheck_block(struct scrub_block *original_sblock,</div><div class='del'>-				     struct scrub_block *sblocks_for_recheck);</div><div class='del'>-static void scrub_recheck_block(struct btrfs_fs_info *fs_info,</div><div class='del'>-				struct scrub_block *sblock,</div><div class='del'>-				int retry_failed_mirror);</div><div class='del'>-static void scrub_recheck_block_checksum(struct scrub_block *sblock);</div><div class='del'>-static int scrub_repair_block_from_good_copy(struct scrub_block *sblock_bad,</div><div class='del'>-					     struct scrub_block *sblock_good);</div><div class='del'>-static int scrub_repair_page_from_good_copy(struct scrub_block *sblock_bad,</div><div class='del'>-					    struct scrub_block *sblock_good,</div><div class='del'>-					    int page_num, int force_write);</div><div class='del'>-static void scrub_write_block_to_dev_replace(struct scrub_block *sblock);</div><div class='del'>-static int scrub_write_page_to_dev_replace(struct scrub_block *sblock,</div><div class='del'>-					   int page_num);</div><div class='del'>-static int scrub_checksum_data(struct scrub_block *sblock);</div><div class='del'>-static int scrub_checksum_tree_block(struct scrub_block *sblock);</div><div class='del'>-static int scrub_checksum_super(struct scrub_block *sblock);</div><div class='del'>-static void scrub_block_put(struct scrub_block *sblock);</div><div class='del'>-static void scrub_page_get(struct scrub_page *spage);</div><div class='del'>-static void scrub_page_put(struct scrub_page *spage);</div><div class='del'>-static void scrub_parity_get(struct scrub_parity *sparity);</div><div class='del'>-static void scrub_parity_put(struct scrub_parity *sparity);</div><div class='del'>-static int scrub_pages(struct scrub_ctx *sctx, u64 logical, u32 len,</div><div class='del'>-		       u64 physical, struct btrfs_device *dev, u64 flags,</div><div class='del'>-		       u64 gen, int mirror_num, u8 *csum,</div><div class='del'>-		       u64 physical_for_dev_replace);</div><div class='del'>-static void scrub_bio_end_io(struct bio *bio);</div><div class='del'>-static void scrub_bio_end_io_worker(struct btrfs_work *work);</div><div class='del'>-static void scrub_block_complete(struct scrub_block *sblock);</div><div class='del'>-static void scrub_remap_extent(struct btrfs_fs_info *fs_info,</div><div class='del'>-			       u64 extent_logical, u32 extent_len,</div><div class='del'>-			       u64 *extent_physical,</div><div class='del'>-			       struct btrfs_device **extent_dev,</div><div class='del'>-			       int *extent_mirror_num);</div><div class='del'>-static int scrub_add_page_to_wr_bio(struct scrub_ctx *sctx,</div><div class='del'>-				    struct scrub_page *spage);</div><div class='del'>-static void scrub_wr_submit(struct scrub_ctx *sctx);</div><div class='del'>-static void scrub_wr_bio_end_io(struct bio *bio);</div><div class='del'>-static void scrub_wr_bio_end_io_worker(struct btrfs_work *work);</div><div class='del'>-static void scrub_put_ctx(struct scrub_ctx *sctx);</div><div class='add'>+	unsigned int nr_io_errors;</div><div class='add'>+	unsigned int nr_csum_errors;</div><div class='add'>+	unsigned int nr_meta_errors;</div><div class='add'>+	unsigned int nr_meta_gen_errors;</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-static inline int scrub_is_page_on_raid56(struct scrub_page *spage)</div><div class='add'>+static void release_scrub_stripe(struct scrub_stripe *stripe)</div><div class='ctx'> {</div><div class='del'>-	return spage-&gt;recover &amp;&amp;</div><div class='del'>-	       (spage-&gt;recover-&gt;bioc-&gt;map_type &amp; BTRFS_BLOCK_GROUP_RAID56_MASK);</div><div class='add'>+	if (!stripe)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	for (int i = 0; i &lt; SCRUB_STRIPE_MAX_FOLIOS; i++) {</div><div class='add'>+		if (stripe-&gt;folios[i])</div><div class='add'>+			folio_put(stripe-&gt;folios[i]);</div><div class='add'>+		stripe-&gt;folios[i] = NULL;</div><div class='add'>+	}</div><div class='add'>+	kfree(stripe-&gt;sectors);</div><div class='add'>+	kfree(stripe-&gt;csums);</div><div class='add'>+	stripe-&gt;sectors = NULL;</div><div class='add'>+	stripe-&gt;csums = NULL;</div><div class='add'>+	stripe-&gt;sctx = NULL;</div><div class='add'>+	stripe-&gt;state = 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void scrub_pending_bio_inc(struct scrub_ctx *sctx)</div><div class='add'>+static int init_scrub_stripe(struct btrfs_fs_info *fs_info,</div><div class='add'>+			     struct scrub_stripe *stripe)</div><div class='ctx'> {</div><div class='del'>-	refcount_inc(&amp;sctx-&gt;refs);</div><div class='del'>-	atomic_inc(&amp;sctx-&gt;bios_in_flight);</div><div class='add'>+	const u32 min_folio_shift = PAGE_SHIFT + fs_info-&gt;block_min_order;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	memset(stripe, 0, sizeof(*stripe));</div><div class='add'>+</div><div class='add'>+	stripe-&gt;nr_sectors = BTRFS_STRIPE_LEN &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='add'>+	stripe-&gt;state = 0;</div><div class='add'>+</div><div class='add'>+	init_waitqueue_head(&amp;stripe-&gt;io_wait);</div><div class='add'>+	init_waitqueue_head(&amp;stripe-&gt;repair_wait);</div><div class='add'>+	atomic_set(&amp;stripe-&gt;pending_io, 0);</div><div class='add'>+	spin_lock_init(&amp;stripe-&gt;write_error_lock);</div><div class='add'>+</div><div class='add'>+	ASSERT(BTRFS_STRIPE_LEN &gt;&gt; min_folio_shift &lt;= SCRUB_STRIPE_MAX_FOLIOS);</div><div class='add'>+	ret = btrfs_alloc_folio_array(BTRFS_STRIPE_LEN &gt;&gt; min_folio_shift,</div><div class='add'>+				      fs_info-&gt;block_min_order, stripe-&gt;folios);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto error;</div><div class='add'>+</div><div class='add'>+	stripe-&gt;sectors = kcalloc(stripe-&gt;nr_sectors,</div><div class='add'>+				  sizeof(struct scrub_sector_verification),</div><div class='add'>+				  GFP_KERNEL);</div><div class='add'>+	if (!stripe-&gt;sectors)</div><div class='add'>+		goto error;</div><div class='add'>+</div><div class='add'>+	stripe-&gt;csums = kcalloc(BTRFS_STRIPE_LEN &gt;&gt; fs_info-&gt;sectorsize_bits,</div><div class='add'>+				fs_info-&gt;csum_size, GFP_KERNEL);</div><div class='add'>+	if (!stripe-&gt;csums)</div><div class='add'>+		goto error;</div><div class='add'>+	return 0;</div><div class='add'>+error:</div><div class='add'>+	release_scrub_stripe(stripe);</div><div class='add'>+	return -ENOMEM;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void scrub_pending_bio_dec(struct scrub_ctx *sctx)</div><div class='add'>+static void wait_scrub_stripe_io(struct scrub_stripe *stripe)</div><div class='ctx'> {</div><div class='del'>-	atomic_dec(&amp;sctx-&gt;bios_in_flight);</div><div class='del'>-	wake_up(&amp;sctx-&gt;list_wait);</div><div class='del'>-	scrub_put_ctx(sctx);</div><div class='add'>+	wait_event(stripe-&gt;io_wait, atomic_read(&amp;stripe-&gt;pending_io) == 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void scrub_put_ctx(struct scrub_ctx *sctx);</div><div class='add'>+</div><div class='ctx'> static void __scrub_blocked_if_needed(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	while (atomic_read(&amp;fs_info-&gt;scrub_pause_req)) {</div><div class='hunk'>@@ -302,234 +429,6 @@ static void scrub_blocked_if_needed(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	scrub_pause_off(fs_info);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Insert new full stripe lock into full stripe locks tree</div><div class='del'>- *</div><div class='del'>- * Return pointer to existing or newly inserted full_stripe_lock structure if</div><div class='del'>- * everything works well.</div><div class='del'>- * Return ERR_PTR(-ENOMEM) if we failed to allocate memory</div><div class='del'>- *</div><div class='del'>- * NOTE: caller must hold full_stripe_locks_root-&gt;lock before calling this</div><div class='del'>- * function</div><div class='del'>- */</div><div class='del'>-static struct full_stripe_lock *insert_full_stripe_lock(</div><div class='del'>-		struct btrfs_full_stripe_locks_tree *locks_root,</div><div class='del'>-		u64 fstripe_logical)</div><div class='del'>-{</div><div class='del'>-	struct rb_node **p;</div><div class='del'>-	struct rb_node *parent = NULL;</div><div class='del'>-	struct full_stripe_lock *entry;</div><div class='del'>-	struct full_stripe_lock *ret;</div><div class='del'>-</div><div class='del'>-	lockdep_assert_held(&amp;locks_root-&gt;lock);</div><div class='del'>-</div><div class='del'>-	p = &amp;locks_root-&gt;root.rb_node;</div><div class='del'>-	while (*p) {</div><div class='del'>-		parent = *p;</div><div class='del'>-		entry = rb_entry(parent, struct full_stripe_lock, node);</div><div class='del'>-		if (fstripe_logical &lt; entry-&gt;logical) {</div><div class='del'>-			p = &amp;(*p)-&gt;rb_left;</div><div class='del'>-		} else if (fstripe_logical &gt; entry-&gt;logical) {</div><div class='del'>-			p = &amp;(*p)-&gt;rb_right;</div><div class='del'>-		} else {</div><div class='del'>-			entry-&gt;refs++;</div><div class='del'>-			return entry;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Insert new lock.</div><div class='del'>-	 */</div><div class='del'>-	ret = kmalloc(sizeof(*ret), GFP_KERNEL);</div><div class='del'>-	if (!ret)</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='del'>-	ret-&gt;logical = fstripe_logical;</div><div class='del'>-	ret-&gt;refs = 1;</div><div class='del'>-	mutex_init(&amp;ret-&gt;mutex);</div><div class='del'>-</div><div class='del'>-	rb_link_node(&amp;ret-&gt;node, parent, p);</div><div class='del'>-	rb_insert_color(&amp;ret-&gt;node, &amp;locks_root-&gt;root);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Search for a full stripe lock of a block group</div><div class='del'>- *</div><div class='del'>- * Return pointer to existing full stripe lock if found</div><div class='del'>- * Return NULL if not found</div><div class='del'>- */</div><div class='del'>-static struct full_stripe_lock *search_full_stripe_lock(</div><div class='del'>-		struct btrfs_full_stripe_locks_tree *locks_root,</div><div class='del'>-		u64 fstripe_logical)</div><div class='del'>-{</div><div class='del'>-	struct rb_node *node;</div><div class='del'>-	struct full_stripe_lock *entry;</div><div class='del'>-</div><div class='del'>-	lockdep_assert_held(&amp;locks_root-&gt;lock);</div><div class='del'>-</div><div class='del'>-	node = locks_root-&gt;root.rb_node;</div><div class='del'>-	while (node) {</div><div class='del'>-		entry = rb_entry(node, struct full_stripe_lock, node);</div><div class='del'>-		if (fstripe_logical &lt; entry-&gt;logical)</div><div class='del'>-			node = node-&gt;rb_left;</div><div class='del'>-		else if (fstripe_logical &gt; entry-&gt;logical)</div><div class='del'>-			node = node-&gt;rb_right;</div><div class='del'>-		else</div><div class='del'>-			return entry;</div><div class='del'>-	}</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Helper to get full stripe logical from a normal bytenr.</div><div class='del'>- *</div><div class='del'>- * Caller must ensure @cache is a RAID56 block group.</div><div class='del'>- */</div><div class='del'>-static u64 get_full_stripe_logical(struct btrfs_block_group *cache, u64 bytenr)</div><div class='del'>-{</div><div class='del'>-	u64 ret;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Due to chunk item size limit, full stripe length should not be</div><div class='del'>-	 * larger than U32_MAX. Just a sanity check here.</div><div class='del'>-	 */</div><div class='del'>-	WARN_ON_ONCE(cache-&gt;full_stripe_len &gt;= U32_MAX);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * round_down() can only handle power of 2, while RAID56 full</div><div class='del'>-	 * stripe length can be 64KiB * n, so we need to manually round down.</div><div class='del'>-	 */</div><div class='del'>-	ret = div64_u64(bytenr - cache-&gt;start, cache-&gt;full_stripe_len) *</div><div class='del'>-			cache-&gt;full_stripe_len + cache-&gt;start;</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Lock a full stripe to avoid concurrency of recovery and read</div><div class='del'>- *</div><div class='del'>- * It's only used for profiles with parities (RAID5/6), for other profiles it</div><div class='del'>- * does nothing.</div><div class='del'>- *</div><div class='del'>- * Return 0 if we locked full stripe covering @bytenr, with a mutex held.</div><div class='del'>- * So caller must call unlock_full_stripe() at the same context.</div><div class='del'>- *</div><div class='del'>- * Return &lt;0 if encounters error.</div><div class='del'>- */</div><div class='del'>-static int lock_full_stripe(struct btrfs_fs_info *fs_info, u64 bytenr,</div><div class='del'>-			    bool *locked_ret)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_block_group *bg_cache;</div><div class='del'>-	struct btrfs_full_stripe_locks_tree *locks_root;</div><div class='del'>-	struct full_stripe_lock *existing;</div><div class='del'>-	u64 fstripe_start;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	*locked_ret = false;</div><div class='del'>-	bg_cache = btrfs_lookup_block_group(fs_info, bytenr);</div><div class='del'>-	if (!bg_cache) {</div><div class='del'>-		ASSERT(0);</div><div class='del'>-		return -ENOENT;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Profiles not based on parity don't need full stripe lock */</div><div class='del'>-	if (!(bg_cache-&gt;flags &amp; BTRFS_BLOCK_GROUP_RAID56_MASK))</div><div class='del'>-		goto out;</div><div class='del'>-	locks_root = &amp;bg_cache-&gt;full_stripe_locks_root;</div><div class='del'>-</div><div class='del'>-	fstripe_start = get_full_stripe_logical(bg_cache, bytenr);</div><div class='del'>-</div><div class='del'>-	/* Now insert the full stripe lock */</div><div class='del'>-	mutex_lock(&amp;locks_root-&gt;lock);</div><div class='del'>-	existing = insert_full_stripe_lock(locks_root, fstripe_start);</div><div class='del'>-	mutex_unlock(&amp;locks_root-&gt;lock);</div><div class='del'>-	if (IS_ERR(existing)) {</div><div class='del'>-		ret = PTR_ERR(existing);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	mutex_lock(&amp;existing-&gt;mutex);</div><div class='del'>-	*locked_ret = true;</div><div class='del'>-out:</div><div class='del'>-	btrfs_put_block_group(bg_cache);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Unlock a full stripe.</div><div class='del'>- *</div><div class='del'>- * NOTE: Caller must ensure it's the same context calling corresponding</div><div class='del'>- * lock_full_stripe().</div><div class='del'>- *</div><div class='del'>- * Return 0 if we unlock full stripe without problem.</div><div class='del'>- * Return &lt;0 for error</div><div class='del'>- */</div><div class='del'>-static int unlock_full_stripe(struct btrfs_fs_info *fs_info, u64 bytenr,</div><div class='del'>-			      bool locked)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_block_group *bg_cache;</div><div class='del'>-	struct btrfs_full_stripe_locks_tree *locks_root;</div><div class='del'>-	struct full_stripe_lock *fstripe_lock;</div><div class='del'>-	u64 fstripe_start;</div><div class='del'>-	bool freeit = false;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	/* If we didn't acquire full stripe lock, no need to continue */</div><div class='del'>-	if (!locked)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	bg_cache = btrfs_lookup_block_group(fs_info, bytenr);</div><div class='del'>-	if (!bg_cache) {</div><div class='del'>-		ASSERT(0);</div><div class='del'>-		return -ENOENT;</div><div class='del'>-	}</div><div class='del'>-	if (!(bg_cache-&gt;flags &amp; BTRFS_BLOCK_GROUP_RAID56_MASK))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	locks_root = &amp;bg_cache-&gt;full_stripe_locks_root;</div><div class='del'>-	fstripe_start = get_full_stripe_logical(bg_cache, bytenr);</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;locks_root-&gt;lock);</div><div class='del'>-	fstripe_lock = search_full_stripe_lock(locks_root, fstripe_start);</div><div class='del'>-	/* Unpaired unlock_full_stripe() detected */</div><div class='del'>-	if (!fstripe_lock) {</div><div class='del'>-		WARN_ON(1);</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-		mutex_unlock(&amp;locks_root-&gt;lock);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (fstripe_lock-&gt;refs == 0) {</div><div class='del'>-		WARN_ON(1);</div><div class='del'>-		btrfs_warn(fs_info, "full stripe lock at %llu refcount underflow",</div><div class='del'>-			fstripe_lock-&gt;logical);</div><div class='del'>-	} else {</div><div class='del'>-		fstripe_lock-&gt;refs--;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (fstripe_lock-&gt;refs == 0) {</div><div class='del'>-		rb_erase(&amp;fstripe_lock-&gt;node, &amp;locks_root-&gt;root);</div><div class='del'>-		freeit = true;</div><div class='del'>-	}</div><div class='del'>-	mutex_unlock(&amp;locks_root-&gt;lock);</div><div class='del'>-</div><div class='del'>-	mutex_unlock(&amp;fstripe_lock-&gt;mutex);</div><div class='del'>-	if (freeit)</div><div class='del'>-		kfree(fstripe_lock);</div><div class='del'>-out:</div><div class='del'>-	btrfs_put_block_group(bg_cache);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void scrub_free_csums(struct scrub_ctx *sctx)</div><div class='del'>-{</div><div class='del'>-	while (!list_empty(&amp;sctx-&gt;csum_list)) {</div><div class='del'>-		struct btrfs_ordered_sum *sum;</div><div class='del'>-		sum = list_first_entry(&amp;sctx-&gt;csum_list,</div><div class='del'>-				       struct btrfs_ordered_sum, list);</div><div class='del'>-		list_del(&amp;sum-&gt;list);</div><div class='del'>-		kfree(sum);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static noinline_for_stack void scrub_free_ctx(struct scrub_ctx *sctx)</div><div class='ctx'> {</div><div class='ctx'> 	int i;</div><div class='hunk'>@@ -537,28 +436,10 @@ static noinline_for_stack void scrub_free_ctx(struct scrub_ctx *sctx)</div><div class='ctx'> 	if (!sctx)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	/* this can happen when scrub is cancelled */</div><div class='del'>-	if (sctx-&gt;curr != -1) {</div><div class='del'>-		struct scrub_bio *sbio = sctx-&gt;bios[sctx-&gt;curr];</div><div class='del'>-</div><div class='del'>-		for (i = 0; i &lt; sbio-&gt;page_count; i++) {</div><div class='del'>-			WARN_ON(!sbio-&gt;pagev[i]-&gt;page);</div><div class='del'>-			scrub_block_put(sbio-&gt;pagev[i]-&gt;sblock);</div><div class='del'>-		}</div><div class='del'>-		bio_put(sbio-&gt;bio);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; SCRUB_BIOS_PER_SCTX; ++i) {</div><div class='del'>-		struct scrub_bio *sbio = sctx-&gt;bios[i];</div><div class='add'>+	for (i = 0; i &lt; SCRUB_TOTAL_STRIPES; i++)</div><div class='add'>+		release_scrub_stripe(&amp;sctx-&gt;stripes[i]);</div><div class='ctx'> </div><div class='del'>-		if (!sbio)</div><div class='del'>-			break;</div><div class='del'>-		kfree(sbio);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	kfree(sctx-&gt;wr_curr_bio);</div><div class='del'>-	scrub_free_csums(sctx);</div><div class='del'>-	kfree(sctx);</div><div class='add'>+	kvfree(sctx);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void scrub_put_ctx(struct scrub_ctx *sctx)</div><div class='hunk'>@@ -568,57 +449,42 @@ static void scrub_put_ctx(struct scrub_ctx *sctx)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static noinline_for_stack struct scrub_ctx *scrub_setup_ctx(</div><div class='del'>-		struct btrfs_fs_info *fs_info, int is_dev_replace)</div><div class='add'>+		struct btrfs_fs_info *fs_info, bool is_dev_replace)</div><div class='ctx'> {</div><div class='ctx'> 	struct scrub_ctx *sctx;</div><div class='ctx'> 	int		i;</div><div class='ctx'> </div><div class='del'>-	sctx = kzalloc(sizeof(*sctx), GFP_KERNEL);</div><div class='add'>+	/* Since sctx has inline 128 stripes, it can go beyond 64K easily.  Use</div><div class='add'>+	 * kvzalloc().</div><div class='add'>+	 */</div><div class='add'>+	sctx = kvzalloc(sizeof(*sctx), GFP_KERNEL);</div><div class='ctx'> 	if (!sctx)</div><div class='ctx'> 		goto nomem;</div><div class='ctx'> 	refcount_set(&amp;sctx-&gt;refs, 1);</div><div class='ctx'> 	sctx-&gt;is_dev_replace = is_dev_replace;</div><div class='del'>-	sctx-&gt;pages_per_rd_bio = SCRUB_PAGES_PER_RD_BIO;</div><div class='del'>-	sctx-&gt;curr = -1;</div><div class='ctx'> 	sctx-&gt;fs_info = fs_info;</div><div class='del'>-	INIT_LIST_HEAD(&amp;sctx-&gt;csum_list);</div><div class='del'>-	for (i = 0; i &lt; SCRUB_BIOS_PER_SCTX; ++i) {</div><div class='del'>-		struct scrub_bio *sbio;</div><div class='add'>+	sctx-&gt;extent_path.search_commit_root = true;</div><div class='add'>+	sctx-&gt;extent_path.skip_locking = true;</div><div class='add'>+	sctx-&gt;csum_path.search_commit_root = true;</div><div class='add'>+	sctx-&gt;csum_path.skip_locking = true;</div><div class='add'>+	for (i = 0; i &lt; SCRUB_TOTAL_STRIPES; i++) {</div><div class='add'>+		int ret;</div><div class='ctx'> </div><div class='del'>-		sbio = kzalloc(sizeof(*sbio), GFP_KERNEL);</div><div class='del'>-		if (!sbio)</div><div class='add'>+		ret = init_scrub_stripe(fs_info, &amp;sctx-&gt;stripes[i]);</div><div class='add'>+		if (ret &lt; 0)</div><div class='ctx'> 			goto nomem;</div><div class='del'>-		sctx-&gt;bios[i] = sbio;</div><div class='del'>-</div><div class='del'>-		sbio-&gt;index = i;</div><div class='del'>-		sbio-&gt;sctx = sctx;</div><div class='del'>-		sbio-&gt;page_count = 0;</div><div class='del'>-		btrfs_init_work(&amp;sbio-&gt;work, scrub_bio_end_io_worker, NULL,</div><div class='del'>-				NULL);</div><div class='del'>-</div><div class='del'>-		if (i != SCRUB_BIOS_PER_SCTX - 1)</div><div class='del'>-			sctx-&gt;bios[i]-&gt;next_free = i + 1;</div><div class='del'>-		else</div><div class='del'>-			sctx-&gt;bios[i]-&gt;next_free = -1;</div><div class='add'>+		sctx-&gt;stripes[i].sctx = sctx;</div><div class='ctx'> 	}</div><div class='ctx'> 	sctx-&gt;first_free = 0;</div><div class='del'>-	atomic_set(&amp;sctx-&gt;bios_in_flight, 0);</div><div class='del'>-	atomic_set(&amp;sctx-&gt;workers_pending, 0);</div><div class='ctx'> 	atomic_set(&amp;sctx-&gt;cancel_req, 0);</div><div class='ctx'> </div><div class='del'>-	spin_lock_init(&amp;sctx-&gt;list_lock);</div><div class='ctx'> 	spin_lock_init(&amp;sctx-&gt;stat_lock);</div><div class='del'>-	init_waitqueue_head(&amp;sctx-&gt;list_wait);</div><div class='ctx'> 	sctx-&gt;throttle_deadline = 0;</div><div class='ctx'> </div><div class='del'>-	WARN_ON(sctx-&gt;wr_curr_bio != NULL);</div><div class='ctx'> 	mutex_init(&amp;sctx-&gt;wr_lock);</div><div class='del'>-	sctx-&gt;wr_curr_bio = NULL;</div><div class='ctx'> 	if (is_dev_replace) {</div><div class='ctx'> 		WARN_ON(!fs_info-&gt;dev_replace.tgtdev);</div><div class='del'>-		sctx-&gt;pages_per_wr_bio = SCRUB_PAGES_PER_WR_BIO;</div><div class='ctx'> 		sctx-&gt;wr_tgtdev = fs_info-&gt;dev_replace.tgtdev;</div><div class='del'>-		sctx-&gt;flush_all_writes = false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return sctx;</div><div class='hunk'>@@ -628,8 +494,8 @@ nomem:</div><div class='ctx'> 	return ERR_PTR(-ENOMEM);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int scrub_print_warning_inode(u64 inum, u64 offset, u64 root,</div><div class='del'>-				     void *warn_ctx)</div><div class='add'>+static int scrub_print_warning_inode(u64 inum, u64 offset, u64 num_bytes,</div><div class='add'>+				     u64 root, void *warn_ctx)</div><div class='ctx'> {</div><div class='ctx'> 	u32 nlink;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -639,7 +505,7 @@ static int scrub_print_warning_inode(u64 inum, u64 offset, u64 root,</div><div class='ctx'> 	struct btrfs_inode_item *inode_item;</div><div class='ctx'> 	struct scrub_warning *swarn = warn_ctx;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = swarn-&gt;dev-&gt;fs_info;</div><div class='del'>-	struct inode_fs_paths *ipath = NULL;</div><div class='add'>+	struct inode_fs_paths *ipath __free(inode_fs_paths) = NULL;</div><div class='ctx'> 	struct btrfs_root *local_root;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> </div><div class='hunk'>@@ -693,1322 +559,834 @@ static int scrub_print_warning_inode(u64 inum, u64 offset, u64 root,</div><div class='ctx'> 	 * hold all of the paths here</div><div class='ctx'> 	 */</div><div class='ctx'> 	for (i = 0; i &lt; ipath-&gt;fspath-&gt;elem_cnt; ++i)</div><div class='del'>-		btrfs_warn_in_rcu(fs_info,</div><div class='del'>-"%s at logical %llu on dev %s, physical %llu, root %llu, inode %llu, offset %llu, length %u, links %u (path: %s)",</div><div class='add'>+		btrfs_warn(fs_info,</div><div class='add'>+"scrub: %s at logical %llu on dev %s, physical %llu root %llu inode %llu offset %llu length %u links %u (path: %s)",</div><div class='ctx'> 				  swarn-&gt;errstr, swarn-&gt;logical,</div><div class='del'>-				  rcu_str_deref(swarn-&gt;dev-&gt;name),</div><div class='add'>+				  btrfs_dev_name(swarn-&gt;dev),</div><div class='ctx'> 				  swarn-&gt;physical,</div><div class='ctx'> 				  root, inum, offset,</div><div class='ctx'> 				  fs_info-&gt;sectorsize, nlink,</div><div class='ctx'> 				  (char *)(unsigned long)ipath-&gt;fspath-&gt;val[i]);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_put_root(local_root);</div><div class='del'>-	free_ipath(ipath);</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> err:</div><div class='del'>-	btrfs_warn_in_rcu(fs_info,</div><div class='del'>-			  "%s at logical %llu on dev %s, physical %llu, root %llu, inode %llu, offset %llu: path resolving failed with ret=%d",</div><div class='add'>+	btrfs_warn(fs_info,</div><div class='add'>+			  "scrub: %s at logical %llu on dev %s, physical %llu root %llu inode %llu offset %llu: path resolving failed with ret=%d",</div><div class='ctx'> 			  swarn-&gt;errstr, swarn-&gt;logical,</div><div class='del'>-			  rcu_str_deref(swarn-&gt;dev-&gt;name),</div><div class='add'>+			  btrfs_dev_name(swarn-&gt;dev),</div><div class='ctx'> 			  swarn-&gt;physical,</div><div class='ctx'> 			  root, inum, offset, ret);</div><div class='ctx'> </div><div class='del'>-	free_ipath(ipath);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void scrub_print_warning(const char *errstr, struct scrub_block *sblock)</div><div class='add'>+static void scrub_print_common_warning(const char *errstr, struct btrfs_device *dev,</div><div class='add'>+				       bool is_super, u64 logical, u64 physical)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_device *dev;</div><div class='del'>-	struct btrfs_fs_info *fs_info;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	struct btrfs_fs_info *fs_info = dev-&gt;fs_info;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key found_key;</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='ctx'> 	struct btrfs_extent_item *ei;</div><div class='ctx'> 	struct scrub_warning swarn;</div><div class='del'>-	unsigned long ptr = 0;</div><div class='del'>-	u64 extent_item_pos;</div><div class='ctx'> 	u64 flags = 0;</div><div class='del'>-	u64 ref_root;</div><div class='ctx'> 	u32 item_size;</div><div class='del'>-	u8 ref_level = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	WARN_ON(sblock-&gt;page_count &lt; 1);</div><div class='del'>-	dev = sblock-&gt;pagev[0]-&gt;dev;</div><div class='del'>-	fs_info = sblock-&gt;sctx-&gt;fs_info;</div><div class='del'>-</div><div class='add'>+	/* Super block error, no need to search extent tree. */</div><div class='add'>+	if (is_super) {</div><div class='add'>+		btrfs_warn(fs_info, "scrub: %s on device %s, physical %llu",</div><div class='add'>+				  errstr, btrfs_dev_name(dev), physical);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	swarn.physical = sblock-&gt;pagev[0]-&gt;physical;</div><div class='del'>-	swarn.logical = sblock-&gt;pagev[0]-&gt;logical;</div><div class='add'>+	swarn.physical = physical;</div><div class='add'>+	swarn.logical = logical;</div><div class='ctx'> 	swarn.errstr = errstr;</div><div class='ctx'> 	swarn.dev = NULL;</div><div class='ctx'> </div><div class='ctx'> 	ret = extent_from_logical(fs_info, swarn.logical, path, &amp;found_key,</div><div class='ctx'> 				  &amp;flags);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	extent_item_pos = swarn.logical - found_key.objectid;</div><div class='ctx'> 	swarn.extent_item_size = found_key.offset;</div><div class='ctx'> </div><div class='ctx'> 	eb = path-&gt;nodes[0];</div><div class='ctx'> 	ei = btrfs_item_ptr(eb, path-&gt;slots[0], struct btrfs_extent_item);</div><div class='del'>-	item_size = btrfs_item_size_nr(eb, path-&gt;slots[0]);</div><div class='add'>+	item_size = btrfs_item_size(eb, path-&gt;slots[0]);</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; BTRFS_EXTENT_FLAG_TREE_BLOCK) {</div><div class='del'>-		do {</div><div class='add'>+		unsigned long ptr = 0;</div><div class='add'>+		u8 ref_level;</div><div class='add'>+		u64 ref_root;</div><div class='add'>+</div><div class='add'>+		while (true) {</div><div class='ctx'> 			ret = tree_backref_for_extent(&amp;ptr, eb, &amp;found_key, ei,</div><div class='ctx'> 						      item_size, &amp;ref_root,</div><div class='ctx'> 						      &amp;ref_level);</div><div class='del'>-			btrfs_warn_in_rcu(fs_info,</div><div class='del'>-"%s at logical %llu on dev %s, physical %llu: metadata %s (level %d) in tree %llu",</div><div class='del'>-				errstr, swarn.logical,</div><div class='del'>-				rcu_str_deref(dev-&gt;name),</div><div class='del'>-				swarn.physical,</div><div class='del'>-				ref_level ? "node" : "leaf",</div><div class='del'>-				ret &lt; 0 ? -1 : ref_level,</div><div class='del'>-				ret &lt; 0 ? -1 : ref_root);</div><div class='del'>-		} while (ret != 1);</div><div class='add'>+			if (ret &lt; 0) {</div><div class='add'>+				btrfs_warn(fs_info,</div><div class='add'>+		   "scrub: failed to resolve tree backref for logical %llu: %d",</div><div class='add'>+					   swarn.logical, ret);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+			if (ret &gt; 0)</div><div class='add'>+				break;</div><div class='add'>+			btrfs_warn(fs_info,</div><div class='add'>+"scrub: %s at logical %llu on dev %s, physical %llu: metadata %s (level %d) in tree %llu",</div><div class='add'>+				errstr, swarn.logical, btrfs_dev_name(dev),</div><div class='add'>+				swarn.physical, (ref_level ? "node" : "leaf"),</div><div class='add'>+				ref_level, ref_root);</div><div class='add'>+		}</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> 	} else {</div><div class='add'>+		struct btrfs_backref_walk_ctx ctx = { 0 };</div><div class='add'>+</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='del'>-		swarn.path = path;</div><div class='del'>-		swarn.dev = dev;</div><div class='del'>-		iterate_extent_inodes(fs_info, found_key.objectid,</div><div class='del'>-					extent_item_pos, 1,</div><div class='del'>-					scrub_print_warning_inode, &amp;swarn, false);</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-}</div><div class='add'>+		ctx.bytenr = found_key.objectid;</div><div class='add'>+		ctx.extent_item_pos = swarn.logical - found_key.objectid;</div><div class='add'>+		ctx.fs_info = fs_info;</div><div class='ctx'> </div><div class='del'>-static inline void scrub_get_recover(struct scrub_recover *recover)</div><div class='del'>-{</div><div class='del'>-	refcount_inc(&amp;recover-&gt;refs);</div><div class='del'>-}</div><div class='add'>+		swarn.path = path;</div><div class='add'>+		swarn.dev = dev;</div><div class='ctx'> </div><div class='del'>-static inline void scrub_put_recover(struct btrfs_fs_info *fs_info,</div><div class='del'>-				     struct scrub_recover *recover)</div><div class='del'>-{</div><div class='del'>-	if (refcount_dec_and_test(&amp;recover-&gt;refs)) {</div><div class='del'>-		btrfs_bio_counter_dec(fs_info);</div><div class='del'>-		btrfs_put_bioc(recover-&gt;bioc);</div><div class='del'>-		kfree(recover);</div><div class='add'>+		iterate_extent_inodes(&amp;ctx, true, scrub_print_warning_inode, &amp;swarn);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * scrub_handle_errored_block gets called when either verification of the</div><div class='del'>- * pages failed or the bio failed to read, e.g. with EIO. In the latter</div><div class='del'>- * case, this function handles all pages in the bio, even though only one</div><div class='del'>- * may be bad.</div><div class='del'>- * The goal of this function is to repair the errored block by using the</div><div class='del'>- * contents of one of the mirrors.</div><div class='del'>- */</div><div class='del'>-static int scrub_handle_errored_block(struct scrub_block *sblock_to_check)</div><div class='add'>+static int fill_writer_pointer_gap(struct scrub_ctx *sctx, u64 physical)</div><div class='ctx'> {</div><div class='del'>-	struct scrub_ctx *sctx = sblock_to_check-&gt;sctx;</div><div class='del'>-	struct btrfs_device *dev;</div><div class='del'>-	struct btrfs_fs_info *fs_info;</div><div class='del'>-	u64 logical;</div><div class='del'>-	unsigned int failed_mirror_index;</div><div class='del'>-	unsigned int is_metadata;</div><div class='del'>-	unsigned int have_csum;</div><div class='del'>-	struct scrub_block *sblocks_for_recheck; /* holds one for each mirror */</div><div class='del'>-	struct scrub_block *sblock_bad;</div><div class='del'>-	int ret;</div><div class='del'>-	int mirror_index;</div><div class='del'>-	int page_num;</div><div class='del'>-	int success;</div><div class='del'>-	bool full_stripe_locked;</div><div class='del'>-	unsigned int nofs_flag;</div><div class='del'>-	static DEFINE_RATELIMIT_STATE(rs, DEFAULT_RATELIMIT_INTERVAL,</div><div class='del'>-				      DEFAULT_RATELIMIT_BURST);</div><div class='add'>+	int ret = 0;</div><div class='add'>+	u64 length;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(sblock_to_check-&gt;page_count &lt; 1);</div><div class='del'>-	fs_info = sctx-&gt;fs_info;</div><div class='del'>-	if (sblock_to_check-&gt;pagev[0]-&gt;flags &amp; BTRFS_EXTENT_FLAG_SUPER) {</div><div class='del'>-		/*</div><div class='del'>-		 * if we find an error in a super block, we just report it.</div><div class='del'>-		 * They will get written with the next transaction commit</div><div class='del'>-		 * anyway</div><div class='del'>-		 */</div><div class='del'>-		spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		++sctx-&gt;stat.super_errors;</div><div class='del'>-		spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='add'>+	if (!btrfs_is_zoned(sctx-&gt;fs_info))</div><div class='ctx'> 		return 0;</div><div class='del'>-	}</div><div class='del'>-	logical = sblock_to_check-&gt;pagev[0]-&gt;logical;</div><div class='del'>-	BUG_ON(sblock_to_check-&gt;pagev[0]-&gt;mirror_num &lt; 1);</div><div class='del'>-	failed_mirror_index = sblock_to_check-&gt;pagev[0]-&gt;mirror_num - 1;</div><div class='del'>-	is_metadata = !(sblock_to_check-&gt;pagev[0]-&gt;flags &amp;</div><div class='del'>-			BTRFS_EXTENT_FLAG_DATA);</div><div class='del'>-	have_csum = sblock_to_check-&gt;pagev[0]-&gt;have_csum;</div><div class='del'>-	dev = sblock_to_check-&gt;pagev[0]-&gt;dev;</div><div class='del'>-</div><div class='del'>-	if (btrfs_is_zoned(fs_info) &amp;&amp; !sctx-&gt;is_dev_replace)</div><div class='del'>-		return btrfs_repair_one_zone(fs_info, logical);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * We must use GFP_NOFS because the scrub task might be waiting for a</div><div class='del'>-	 * worker task executing this function and in turn a transaction commit</div><div class='del'>-	 * might be waiting the scrub task to pause (which needs to wait for all</div><div class='del'>-	 * the worker tasks to complete before pausing).</div><div class='del'>-	 * We do allocations in the workers through insert_full_stripe_lock()</div><div class='del'>-	 * and scrub_add_page_to_wr_bio(), which happens down the call chain of</div><div class='del'>-	 * this function.</div><div class='del'>-	 */</div><div class='del'>-	nofs_flag = memalloc_nofs_save();</div><div class='del'>-	/*</div><div class='del'>-	 * For RAID5/6, race can happen for a different device scrub thread.</div><div class='del'>-	 * For data corruption, Parity and Data threads will both try</div><div class='del'>-	 * to recovery the data.</div><div class='del'>-	 * Race can lead to doubly added csum error, or even unrecoverable</div><div class='del'>-	 * error.</div><div class='del'>-	 */</div><div class='del'>-	ret = lock_full_stripe(fs_info, logical, &amp;full_stripe_locked);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		memalloc_nofs_restore(nofs_flag);</div><div class='del'>-		spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		if (ret == -ENOMEM)</div><div class='del'>-			sctx-&gt;stat.malloc_errors++;</div><div class='del'>-		sctx-&gt;stat.read_errors++;</div><div class='del'>-		sctx-&gt;stat.uncorrectable_errors++;</div><div class='del'>-		spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * read all mirrors one after the other. This includes to</div><div class='del'>-	 * re-read the extent or metadata block that failed (that was</div><div class='del'>-	 * the cause that this fixup code is called) another time,</div><div class='del'>-	 * sector by sector this time in order to know which sectors</div><div class='del'>-	 * caused I/O errors and which ones are good (for all mirrors).</div><div class='del'>-	 * It is the goal to handle the situation when more than one</div><div class='del'>-	 * mirror contains I/O errors, but the errors do not</div><div class='del'>-	 * overlap, i.e. the data can be repaired by selecting the</div><div class='del'>-	 * sectors from those mirrors without I/O error on the</div><div class='del'>-	 * particular sectors. One example (with blocks &gt;= 2 * sectorsize)</div><div class='del'>-	 * would be that mirror #1 has an I/O error on the first sector,</div><div class='del'>-	 * the second sector is good, and mirror #2 has an I/O error on</div><div class='del'>-	 * the second sector, but the first sector is good.</div><div class='del'>-	 * Then the first sector of the first mirror can be repaired by</div><div class='del'>-	 * taking the first sector of the second mirror, and the</div><div class='del'>-	 * second sector of the second mirror can be repaired by</div><div class='del'>-	 * copying the contents of the 2nd sector of the 1st mirror.</div><div class='del'>-	 * One more note: if the sectors of one mirror contain I/O</div><div class='del'>-	 * errors, the checksum cannot be verified. In order to get</div><div class='del'>-	 * the best data for repairing, the first attempt is to find</div><div class='del'>-	 * a mirror without I/O errors and with a validated checksum.</div><div class='del'>-	 * Only if this is not possible, the sectors are picked from</div><div class='del'>-	 * mirrors with I/O errors without considering the checksum.</div><div class='del'>-	 * If the latter is the case, at the end, the checksum of the</div><div class='del'>-	 * repaired area is verified in order to correctly maintain</div><div class='del'>-	 * the statistics.</div><div class='del'>-	 */</div><div class='del'>-</div><div class='del'>-	sblocks_for_recheck = kcalloc(BTRFS_MAX_MIRRORS,</div><div class='del'>-				      sizeof(*sblocks_for_recheck), GFP_KERNEL);</div><div class='del'>-	if (!sblocks_for_recheck) {</div><div class='del'>-		spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		sctx-&gt;stat.malloc_errors++;</div><div class='del'>-		sctx-&gt;stat.read_errors++;</div><div class='del'>-		sctx-&gt;stat.uncorrectable_errors++;</div><div class='del'>-		spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		btrfs_dev_stat_inc_and_print(dev, BTRFS_DEV_STAT_READ_ERRS);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* setup the context, map the logical blocks and alloc the pages */</div><div class='del'>-	ret = scrub_setup_recheck_block(sblock_to_check, sblocks_for_recheck);</div><div class='del'>-	if (ret) {</div><div class='del'>-		spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		sctx-&gt;stat.read_errors++;</div><div class='del'>-		sctx-&gt;stat.uncorrectable_errors++;</div><div class='del'>-		spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		btrfs_dev_stat_inc_and_print(dev, BTRFS_DEV_STAT_READ_ERRS);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	BUG_ON(failed_mirror_index &gt;= BTRFS_MAX_MIRRORS);</div><div class='del'>-	sblock_bad = sblocks_for_recheck + failed_mirror_index;</div><div class='del'>-</div><div class='del'>-	/* build and submit the bios for the failed mirror, check checksums */</div><div class='del'>-	scrub_recheck_block(fs_info, sblock_bad, 1);</div><div class='del'>-</div><div class='del'>-	if (!sblock_bad-&gt;header_error &amp;&amp; !sblock_bad-&gt;checksum_error &amp;&amp;</div><div class='del'>-	    sblock_bad-&gt;no_io_error_seen) {</div><div class='del'>-		/*</div><div class='del'>-		 * the error disappeared after reading page by page, or</div><div class='del'>-		 * the area was part of a huge bio and other parts of the</div><div class='del'>-		 * bio caused I/O errors, or the block layer merged several</div><div class='del'>-		 * read requests into one and the error is caused by a</div><div class='del'>-		 * different bio (usually one of the two latter cases is</div><div class='del'>-		 * the cause)</div><div class='del'>-		 */</div><div class='del'>-		spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		sctx-&gt;stat.unverified_errors++;</div><div class='del'>-		sblock_to_check-&gt;data_corrected = 1;</div><div class='del'>-		spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-</div><div class='del'>-		if (sctx-&gt;is_dev_replace)</div><div class='del'>-			scrub_write_block_to_dev_replace(sblock_bad);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (!btrfs_dev_is_sequential(sctx-&gt;wr_tgtdev, physical))</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	if (!sblock_bad-&gt;no_io_error_seen) {</div><div class='del'>-		spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		sctx-&gt;stat.read_errors++;</div><div class='del'>-		spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		if (__ratelimit(&amp;rs))</div><div class='del'>-			scrub_print_warning("i/o error", sblock_to_check);</div><div class='del'>-		btrfs_dev_stat_inc_and_print(dev, BTRFS_DEV_STAT_READ_ERRS);</div><div class='del'>-	} else if (sblock_bad-&gt;checksum_error) {</div><div class='del'>-		spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		sctx-&gt;stat.csum_errors++;</div><div class='del'>-		spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		if (__ratelimit(&amp;rs))</div><div class='del'>-			scrub_print_warning("checksum error", sblock_to_check);</div><div class='del'>-		btrfs_dev_stat_inc_and_print(dev,</div><div class='del'>-					     BTRFS_DEV_STAT_CORRUPTION_ERRS);</div><div class='del'>-	} else if (sblock_bad-&gt;header_error) {</div><div class='del'>-		spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		sctx-&gt;stat.verify_errors++;</div><div class='del'>-		spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		if (__ratelimit(&amp;rs))</div><div class='del'>-			scrub_print_warning("checksum/header error",</div><div class='del'>-					    sblock_to_check);</div><div class='del'>-		if (sblock_bad-&gt;generation_error)</div><div class='del'>-			btrfs_dev_stat_inc_and_print(dev,</div><div class='del'>-				BTRFS_DEV_STAT_GENERATION_ERRS);</div><div class='del'>-		else</div><div class='del'>-			btrfs_dev_stat_inc_and_print(dev,</div><div class='del'>-				BTRFS_DEV_STAT_CORRUPTION_ERRS);</div><div class='del'>-	}</div><div class='add'>+	if (sctx-&gt;write_pointer &lt; physical) {</div><div class='add'>+		length = physical - sctx-&gt;write_pointer;</div><div class='ctx'> </div><div class='del'>-	if (sctx-&gt;readonly) {</div><div class='del'>-		ASSERT(!sctx-&gt;is_dev_replace);</div><div class='del'>-		goto out;</div><div class='add'>+		ret = btrfs_zoned_issue_zeroout(sctx-&gt;wr_tgtdev,</div><div class='add'>+						sctx-&gt;write_pointer, length);</div><div class='add'>+		if (!ret)</div><div class='add'>+			sctx-&gt;write_pointer = physical;</div><div class='ctx'> 	}</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * now build and submit the bios for the other mirrors, check</div><div class='del'>-	 * checksums.</div><div class='del'>-	 * First try to pick the mirror which is completely without I/O</div><div class='del'>-	 * errors and also does not have a checksum error.</div><div class='del'>-	 * If one is found, and if a checksum is present, the full block</div><div class='del'>-	 * that is known to contain an error is rewritten. Afterwards</div><div class='del'>-	 * the block is known to be corrected.</div><div class='del'>-	 * If a mirror is found which is completely correct, and no</div><div class='del'>-	 * checksum is present, only those pages are rewritten that had</div><div class='del'>-	 * an I/O error in the block to be repaired, since it cannot be</div><div class='del'>-	 * determined, which copy of the other pages is better (and it</div><div class='del'>-	 * could happen otherwise that a correct page would be</div><div class='del'>-	 * overwritten by a bad one).</div><div class='del'>-	 */</div><div class='del'>-	for (mirror_index = 0; ;mirror_index++) {</div><div class='del'>-		struct scrub_block *sblock_other;</div><div class='del'>-</div><div class='del'>-		if (mirror_index == failed_mirror_index)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		/* raid56's mirror can be more than BTRFS_MAX_MIRRORS */</div><div class='del'>-		if (!scrub_is_page_on_raid56(sblock_bad-&gt;pagev[0])) {</div><div class='del'>-			if (mirror_index &gt;= BTRFS_MAX_MIRRORS)</div><div class='del'>-				break;</div><div class='del'>-			if (!sblocks_for_recheck[mirror_index].page_count)</div><div class='del'>-				break;</div><div class='del'>-</div><div class='del'>-			sblock_other = sblocks_for_recheck + mirror_index;</div><div class='del'>-		} else {</div><div class='del'>-			struct scrub_recover *r = sblock_bad-&gt;pagev[0]-&gt;recover;</div><div class='del'>-			int max_allowed = r-&gt;bioc-&gt;num_stripes - r-&gt;bioc-&gt;num_tgtdevs;</div><div class='del'>-</div><div class='del'>-			if (mirror_index &gt;= max_allowed)</div><div class='del'>-				break;</div><div class='del'>-			if (!sblocks_for_recheck[1].page_count)</div><div class='del'>-				break;</div><div class='add'>+static void *scrub_stripe_get_kaddr(struct scrub_stripe *stripe, int sector_nr)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = stripe-&gt;bg-&gt;fs_info;</div><div class='add'>+	const u32 min_folio_shift = PAGE_SHIFT + fs_info-&gt;block_min_order;</div><div class='add'>+	u32 offset = (sector_nr &lt;&lt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+	const struct folio *folio = stripe-&gt;folios[offset &gt;&gt; min_folio_shift];</div><div class='ctx'> </div><div class='del'>-			ASSERT(failed_mirror_index == 0);</div><div class='del'>-			sblock_other = sblocks_for_recheck + 1;</div><div class='del'>-			sblock_other-&gt;pagev[0]-&gt;mirror_num = 1 + mirror_index;</div><div class='del'>-		}</div><div class='add'>+	/* stripe-&gt;folios[] is allocated by us and no highmem is allowed. */</div><div class='add'>+	ASSERT(folio);</div><div class='add'>+	ASSERT(!folio_test_highmem(folio));</div><div class='add'>+	return folio_address(folio) + offset_in_folio(folio, offset);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		/* build and submit the bios, check checksums */</div><div class='del'>-		scrub_recheck_block(fs_info, sblock_other, 0);</div><div class='add'>+static phys_addr_t scrub_stripe_get_paddr(struct scrub_stripe *stripe, int sector_nr)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = stripe-&gt;bg-&gt;fs_info;</div><div class='add'>+	const u32 min_folio_shift = PAGE_SHIFT + fs_info-&gt;block_min_order;</div><div class='add'>+	u32 offset = (sector_nr &lt;&lt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+	const struct folio *folio = stripe-&gt;folios[offset &gt;&gt; min_folio_shift];</div><div class='ctx'> </div><div class='del'>-		if (!sblock_other-&gt;header_error &amp;&amp;</div><div class='del'>-		    !sblock_other-&gt;checksum_error &amp;&amp;</div><div class='del'>-		    sblock_other-&gt;no_io_error_seen) {</div><div class='del'>-			if (sctx-&gt;is_dev_replace) {</div><div class='del'>-				scrub_write_block_to_dev_replace(sblock_other);</div><div class='del'>-				goto corrected_error;</div><div class='del'>-			} else {</div><div class='del'>-				ret = scrub_repair_block_from_good_copy(</div><div class='del'>-						sblock_bad, sblock_other);</div><div class='del'>-				if (!ret)</div><div class='del'>-					goto corrected_error;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	/* stripe-&gt;folios[] is allocated by us and no highmem is allowed. */</div><div class='add'>+	ASSERT(folio);</div><div class='add'>+	ASSERT(!folio_test_highmem(folio));</div><div class='add'>+	/* And the range must be contained inside the folio. */</div><div class='add'>+	ASSERT(offset_in_folio(folio, offset) + fs_info-&gt;sectorsize &lt;= folio_size(folio));</div><div class='add'>+	return page_to_phys(folio_page(folio, 0)) + offset_in_folio(folio, offset);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if (sblock_bad-&gt;no_io_error_seen &amp;&amp; !sctx-&gt;is_dev_replace)</div><div class='del'>-		goto did_not_correct_error;</div><div class='add'>+static void scrub_verify_one_metadata(struct scrub_stripe *stripe, int sector_nr)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = stripe-&gt;bg-&gt;fs_info;</div><div class='add'>+	const u32 sectors_per_tree = fs_info-&gt;nodesize &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='add'>+	const u64 logical = stripe-&gt;logical + (sector_nr &lt;&lt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+	void *first_kaddr = scrub_stripe_get_kaddr(stripe, sector_nr);</div><div class='add'>+	struct btrfs_header *header = first_kaddr;</div><div class='add'>+	SHASH_DESC_ON_STACK(shash, fs_info-&gt;csum_shash);</div><div class='add'>+	u8 on_disk_csum[BTRFS_CSUM_SIZE];</div><div class='add'>+	u8 calculated_csum[BTRFS_CSUM_SIZE];</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * In case of I/O errors in the area that is supposed to be</div><div class='del'>-	 * repaired, continue by picking good copies of those sectors.</div><div class='del'>-	 * Select the good sectors from mirrors to rewrite bad sectors from</div><div class='del'>-	 * the area to fix. Afterwards verify the checksum of the block</div><div class='del'>-	 * that is supposed to be repaired. This verification step is</div><div class='del'>-	 * only done for the purpose of statistic counting and for the</div><div class='del'>-	 * final scrub report, whether errors remain.</div><div class='del'>-	 * A perfect algorithm could make use of the checksum and try</div><div class='del'>-	 * all possible combinations of sectors from the different mirrors</div><div class='del'>-	 * until the checksum verification succeeds. For example, when</div><div class='del'>-	 * the 2nd sector of mirror #1 faces I/O errors, and the 2nd sector</div><div class='del'>-	 * of mirror #2 is readable but the final checksum test fails,</div><div class='del'>-	 * then the 2nd sector of mirror #3 could be tried, whether now</div><div class='del'>-	 * the final checksum succeeds. But this would be a rare</div><div class='del'>-	 * exception and is therefore not implemented. At least it is</div><div class='del'>-	 * avoided that the good copy is overwritten.</div><div class='del'>-	 * A more useful improvement would be to pick the sectors</div><div class='del'>-	 * without I/O error based on sector sizes (512 bytes on legacy</div><div class='del'>-	 * disks) instead of on sectorsize. Then maybe 512 byte of one</div><div class='del'>-	 * mirror could be repaired by taking 512 byte of a different</div><div class='del'>-	 * mirror, even if other 512 byte sectors in the same sectorsize</div><div class='del'>-	 * area are unreadable.</div><div class='add'>+	 * Here we don't have a good way to attach the pages (and subpages)</div><div class='add'>+	 * to a dummy extent buffer, thus we have to directly grab the members</div><div class='add'>+	 * from pages.</div><div class='ctx'> 	 */</div><div class='del'>-	success = 1;</div><div class='del'>-	for (page_num = 0; page_num &lt; sblock_bad-&gt;page_count;</div><div class='del'>-	     page_num++) {</div><div class='del'>-		struct scrub_page *spage_bad = sblock_bad-&gt;pagev[page_num];</div><div class='del'>-		struct scrub_block *sblock_other = NULL;</div><div class='del'>-</div><div class='del'>-		/* skip no-io-error page in scrub */</div><div class='del'>-		if (!spage_bad-&gt;io_error &amp;&amp; !sctx-&gt;is_dev_replace)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		if (scrub_is_page_on_raid56(sblock_bad-&gt;pagev[0])) {</div><div class='del'>-			/*</div><div class='del'>-			 * In case of dev replace, if raid56 rebuild process</div><div class='del'>-			 * didn't work out correct data, then copy the content</div><div class='del'>-			 * in sblock_bad to make sure target device is identical</div><div class='del'>-			 * to source device, instead of writing garbage data in</div><div class='del'>-			 * sblock_for_recheck array to target device.</div><div class='del'>-			 */</div><div class='del'>-			sblock_other = NULL;</div><div class='del'>-		} else if (spage_bad-&gt;io_error) {</div><div class='del'>-			/* try to find no-io-error page in mirrors */</div><div class='del'>-			for (mirror_index = 0;</div><div class='del'>-			     mirror_index &lt; BTRFS_MAX_MIRRORS &amp;&amp;</div><div class='del'>-			     sblocks_for_recheck[mirror_index].page_count &gt; 0;</div><div class='del'>-			     mirror_index++) {</div><div class='del'>-				if (!sblocks_for_recheck[mirror_index].</div><div class='del'>-				    pagev[page_num]-&gt;io_error) {</div><div class='del'>-					sblock_other = sblocks_for_recheck +</div><div class='del'>-						       mirror_index;</div><div class='del'>-					break;</div><div class='del'>-				}</div><div class='del'>-			}</div><div class='del'>-			if (!sblock_other)</div><div class='del'>-				success = 0;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (sctx-&gt;is_dev_replace) {</div><div class='del'>-			/*</div><div class='del'>-			 * did not find a mirror to fetch the page</div><div class='del'>-			 * from. scrub_write_page_to_dev_replace()</div><div class='del'>-			 * handles this case (page-&gt;io_error), by</div><div class='del'>-			 * filling the block with zeros before</div><div class='del'>-			 * submitting the write request</div><div class='del'>-			 */</div><div class='del'>-			if (!sblock_other)</div><div class='del'>-				sblock_other = sblock_bad;</div><div class='del'>-</div><div class='del'>-			if (scrub_write_page_to_dev_replace(sblock_other,</div><div class='del'>-							    page_num) != 0) {</div><div class='del'>-				atomic64_inc(</div><div class='del'>-					&amp;fs_info-&gt;dev_replace.num_write_errors);</div><div class='del'>-				success = 0;</div><div class='del'>-			}</div><div class='del'>-		} else if (sblock_other) {</div><div class='del'>-			ret = scrub_repair_page_from_good_copy(sblock_bad,</div><div class='del'>-							       sblock_other,</div><div class='del'>-							       page_num, 0);</div><div class='del'>-			if (0 == ret)</div><div class='del'>-				spage_bad-&gt;io_error = 0;</div><div class='del'>-			else</div><div class='del'>-				success = 0;</div><div class='del'>-		}</div><div class='add'>+	memcpy(on_disk_csum, header-&gt;csum, fs_info-&gt;csum_size);</div><div class='add'>+</div><div class='add'>+	if (logical != btrfs_stack_header_bytenr(header)) {</div><div class='add'>+		scrub_bitmap_set_meta_error(stripe, sector_nr, sectors_per_tree);</div><div class='add'>+		scrub_bitmap_set_error(stripe, sector_nr, sectors_per_tree);</div><div class='add'>+		btrfs_warn_rl(fs_info,</div><div class='add'>+	  "scrub: tree block %llu mirror %u has bad bytenr, has %llu want %llu",</div><div class='add'>+			      logical, stripe-&gt;mirror_num,</div><div class='add'>+			      btrfs_stack_header_bytenr(header), logical);</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	if (success &amp;&amp; !sctx-&gt;is_dev_replace) {</div><div class='del'>-		if (is_metadata || have_csum) {</div><div class='del'>-			/*</div><div class='del'>-			 * need to verify the checksum now that all</div><div class='del'>-			 * sectors on disk are repaired (the write</div><div class='del'>-			 * request for data to be repaired is on its way).</div><div class='del'>-			 * Just be lazy and use scrub_recheck_block()</div><div class='del'>-			 * which re-reads the data before the checksum</div><div class='del'>-			 * is verified, but most likely the data comes out</div><div class='del'>-			 * of the page cache.</div><div class='del'>-			 */</div><div class='del'>-			scrub_recheck_block(fs_info, sblock_bad, 1);</div><div class='del'>-			if (!sblock_bad-&gt;header_error &amp;&amp;</div><div class='del'>-			    !sblock_bad-&gt;checksum_error &amp;&amp;</div><div class='del'>-			    sblock_bad-&gt;no_io_error_seen)</div><div class='del'>-				goto corrected_error;</div><div class='del'>-			else</div><div class='del'>-				goto did_not_correct_error;</div><div class='del'>-		} else {</div><div class='del'>-corrected_error:</div><div class='del'>-			spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-			sctx-&gt;stat.corrected_errors++;</div><div class='del'>-			sblock_to_check-&gt;data_corrected = 1;</div><div class='del'>-			spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-			btrfs_err_rl_in_rcu(fs_info,</div><div class='del'>-				"fixed up error at logical %llu on dev %s",</div><div class='del'>-				logical, rcu_str_deref(dev-&gt;name));</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-did_not_correct_error:</div><div class='del'>-		spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		sctx-&gt;stat.uncorrectable_errors++;</div><div class='del'>-		spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		btrfs_err_rl_in_rcu(fs_info,</div><div class='del'>-			"unable to fixup (regular) error at logical %llu on dev %s",</div><div class='del'>-			logical, rcu_str_deref(dev-&gt;name));</div><div class='add'>+	if (memcmp(header-&gt;fsid, fs_info-&gt;fs_devices-&gt;metadata_uuid,</div><div class='add'>+		   BTRFS_FSID_SIZE) != 0) {</div><div class='add'>+		scrub_bitmap_set_meta_error(stripe, sector_nr, sectors_per_tree);</div><div class='add'>+		scrub_bitmap_set_error(stripe, sector_nr, sectors_per_tree);</div><div class='add'>+		btrfs_warn_rl(fs_info,</div><div class='add'>+	      "scrub: tree block %llu mirror %u has bad fsid, has %pU want %pU",</div><div class='add'>+			      logical, stripe-&gt;mirror_num,</div><div class='add'>+			      header-&gt;fsid, fs_info-&gt;fs_devices-&gt;fsid);</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	if (sblocks_for_recheck) {</div><div class='del'>-		for (mirror_index = 0; mirror_index &lt; BTRFS_MAX_MIRRORS;</div><div class='del'>-		     mirror_index++) {</div><div class='del'>-			struct scrub_block *sblock = sblocks_for_recheck +</div><div class='del'>-						     mirror_index;</div><div class='del'>-			struct scrub_recover *recover;</div><div class='del'>-			int page_index;</div><div class='del'>-</div><div class='del'>-			for (page_index = 0; page_index &lt; sblock-&gt;page_count;</div><div class='del'>-			     page_index++) {</div><div class='del'>-				sblock-&gt;pagev[page_index]-&gt;sblock = NULL;</div><div class='del'>-				recover = sblock-&gt;pagev[page_index]-&gt;recover;</div><div class='del'>-				if (recover) {</div><div class='del'>-					scrub_put_recover(fs_info, recover);</div><div class='del'>-					sblock-&gt;pagev[page_index]-&gt;recover =</div><div class='del'>-									NULL;</div><div class='del'>-				}</div><div class='del'>-				scrub_page_put(sblock-&gt;pagev[page_index]);</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-		kfree(sblocks_for_recheck);</div><div class='add'>+	if (memcmp(header-&gt;chunk_tree_uuid, fs_info-&gt;chunk_tree_uuid,</div><div class='add'>+		   BTRFS_UUID_SIZE) != 0) {</div><div class='add'>+		scrub_bitmap_set_meta_error(stripe, sector_nr, sectors_per_tree);</div><div class='add'>+		scrub_bitmap_set_error(stripe, sector_nr, sectors_per_tree);</div><div class='add'>+		btrfs_warn_rl(fs_info,</div><div class='add'>+   "scrub: tree block %llu mirror %u has bad chunk tree uuid, has %pU want %pU",</div><div class='add'>+			      logical, stripe-&gt;mirror_num,</div><div class='add'>+			      header-&gt;chunk_tree_uuid, fs_info-&gt;chunk_tree_uuid);</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = unlock_full_stripe(fs_info, logical, full_stripe_locked);</div><div class='del'>-	memalloc_nofs_restore(nofs_flag);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		return ret;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline int scrub_nr_raid_mirrors(struct btrfs_io_context *bioc)</div><div class='del'>-{</div><div class='del'>-	if (bioc-&gt;map_type &amp; BTRFS_BLOCK_GROUP_RAID5)</div><div class='del'>-		return 2;</div><div class='del'>-	else if (bioc-&gt;map_type &amp; BTRFS_BLOCK_GROUP_RAID6)</div><div class='del'>-		return 3;</div><div class='del'>-	else</div><div class='del'>-		return (int)bioc-&gt;num_stripes;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void scrub_stripe_index_and_offset(u64 logical, u64 map_type,</div><div class='del'>-						 u64 *raid_map,</div><div class='del'>-						 u64 mapped_length,</div><div class='del'>-						 int nstripes, int mirror,</div><div class='del'>-						 int *stripe_index,</div><div class='del'>-						 u64 *stripe_offset)</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	if (map_type &amp; BTRFS_BLOCK_GROUP_RAID56_MASK) {</div><div class='del'>-		/* RAID5/6 */</div><div class='del'>-		for (i = 0; i &lt; nstripes; i++) {</div><div class='del'>-			if (raid_map[i] == RAID6_Q_STRIPE ||</div><div class='del'>-			    raid_map[i] == RAID5_P_STRIPE)</div><div class='del'>-				continue;</div><div class='add'>+	/* Now check tree block csum. */</div><div class='add'>+	shash-&gt;tfm = fs_info-&gt;csum_shash;</div><div class='add'>+	crypto_shash_init(shash);</div><div class='add'>+	crypto_shash_update(shash, first_kaddr + BTRFS_CSUM_SIZE,</div><div class='add'>+			    fs_info-&gt;sectorsize - BTRFS_CSUM_SIZE);</div><div class='ctx'> </div><div class='del'>-			if (logical &gt;= raid_map[i] &amp;&amp;</div><div class='del'>-			    logical &lt; raid_map[i] + mapped_length)</div><div class='del'>-				break;</div><div class='del'>-		}</div><div class='add'>+	for (int i = sector_nr + 1; i &lt; sector_nr + sectors_per_tree; i++) {</div><div class='add'>+		crypto_shash_update(shash, scrub_stripe_get_kaddr(stripe, i),</div><div class='add'>+				    fs_info-&gt;sectorsize);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		*stripe_index = i;</div><div class='del'>-		*stripe_offset = logical - raid_map[i];</div><div class='del'>-	} else {</div><div class='del'>-		/* The other RAID type */</div><div class='del'>-		*stripe_index = mirror;</div><div class='del'>-		*stripe_offset = 0;</div><div class='add'>+	crypto_shash_final(shash, calculated_csum);</div><div class='add'>+	if (memcmp(calculated_csum, on_disk_csum, fs_info-&gt;csum_size) != 0) {</div><div class='add'>+		scrub_bitmap_set_meta_error(stripe, sector_nr, sectors_per_tree);</div><div class='add'>+		scrub_bitmap_set_error(stripe, sector_nr, sectors_per_tree);</div><div class='add'>+		btrfs_warn_rl(fs_info,</div><div class='add'>+"scrub: tree block %llu mirror %u has bad csum, has " BTRFS_CSUM_FMT " want " BTRFS_CSUM_FMT,</div><div class='add'>+			      logical, stripe-&gt;mirror_num,</div><div class='add'>+			      BTRFS_CSUM_FMT_VALUE(fs_info-&gt;csum_size, on_disk_csum),</div><div class='add'>+			      BTRFS_CSUM_FMT_VALUE(fs_info-&gt;csum_size, calculated_csum));</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='add'>+	if (stripe-&gt;sectors[sector_nr].generation !=</div><div class='add'>+	    btrfs_stack_header_generation(header)) {</div><div class='add'>+		scrub_bitmap_set_meta_gen_error(stripe, sector_nr, sectors_per_tree);</div><div class='add'>+		scrub_bitmap_set_error(stripe, sector_nr, sectors_per_tree);</div><div class='add'>+		btrfs_warn_rl(fs_info,</div><div class='add'>+      "scrub: tree block %llu mirror %u has bad generation, has %llu want %llu",</div><div class='add'>+			      logical, stripe-&gt;mirror_num,</div><div class='add'>+			      btrfs_stack_header_generation(header),</div><div class='add'>+			      stripe-&gt;sectors[sector_nr].generation);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+	scrub_bitmap_clear_error(stripe, sector_nr, sectors_per_tree);</div><div class='add'>+	scrub_bitmap_clear_csum_error(stripe, sector_nr, sectors_per_tree);</div><div class='add'>+	scrub_bitmap_clear_meta_error(stripe, sector_nr, sectors_per_tree);</div><div class='add'>+	scrub_bitmap_clear_meta_gen_error(stripe, sector_nr, sectors_per_tree);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int scrub_setup_recheck_block(struct scrub_block *original_sblock,</div><div class='del'>-				     struct scrub_block *sblocks_for_recheck)</div><div class='add'>+static void scrub_verify_one_sector(struct scrub_stripe *stripe, int sector_nr)</div><div class='ctx'> {</div><div class='del'>-	struct scrub_ctx *sctx = original_sblock-&gt;sctx;</div><div class='del'>-	struct btrfs_fs_info *fs_info = sctx-&gt;fs_info;</div><div class='del'>-	u64 length = original_sblock-&gt;page_count * fs_info-&gt;sectorsize;</div><div class='del'>-	u64 logical = original_sblock-&gt;pagev[0]-&gt;logical;</div><div class='del'>-	u64 generation = original_sblock-&gt;pagev[0]-&gt;generation;</div><div class='del'>-	u64 flags = original_sblock-&gt;pagev[0]-&gt;flags;</div><div class='del'>-	u64 have_csum = original_sblock-&gt;pagev[0]-&gt;have_csum;</div><div class='del'>-	struct scrub_recover *recover;</div><div class='del'>-	struct btrfs_io_context *bioc;</div><div class='del'>-	u64 sublen;</div><div class='del'>-	u64 mapped_length;</div><div class='del'>-	u64 stripe_offset;</div><div class='del'>-	int stripe_index;</div><div class='del'>-	int page_index = 0;</div><div class='del'>-	int mirror_index;</div><div class='del'>-	int nmirrors;</div><div class='add'>+	struct btrfs_fs_info *fs_info = stripe-&gt;bg-&gt;fs_info;</div><div class='add'>+	struct scrub_sector_verification *sector = &amp;stripe-&gt;sectors[sector_nr];</div><div class='add'>+	const u32 sectors_per_tree = fs_info-&gt;nodesize &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='add'>+	phys_addr_t paddr = scrub_stripe_get_paddr(stripe, sector_nr);</div><div class='add'>+	u8 csum_buf[BTRFS_CSUM_SIZE];</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * note: the two members refs and outstanding_pages</div><div class='del'>-	 * are not used (and not set) in the blocks that are used for</div><div class='del'>-	 * the recheck procedure</div><div class='del'>-	 */</div><div class='add'>+	ASSERT(sector_nr &gt;= 0 &amp;&amp; sector_nr &lt; stripe-&gt;nr_sectors);</div><div class='add'>+</div><div class='add'>+	/* Sector not utilized, skip it. */</div><div class='add'>+	if (!scrub_bitmap_test_bit_has_extent(stripe, sector_nr))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	while (length &gt; 0) {</div><div class='del'>-		sublen = min_t(u64, length, fs_info-&gt;sectorsize);</div><div class='del'>-		mapped_length = sublen;</div><div class='del'>-		bioc = NULL;</div><div class='add'>+	/* IO error, no need to check. */</div><div class='add'>+	if (scrub_bitmap_test_bit_io_error(stripe, sector_nr))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='add'>+	/* Metadata, verify the full tree block. */</div><div class='add'>+	if (scrub_bitmap_test_bit_is_metadata(stripe, sector_nr)) {</div><div class='ctx'> 		/*</div><div class='del'>-		 * With a length of sectorsize, each returned stripe represents</div><div class='del'>-		 * one mirror</div><div class='add'>+		 * Check if the tree block crosses the stripe boundary.  If</div><div class='add'>+		 * crossed the boundary, we cannot verify it but only give a</div><div class='add'>+		 * warning.</div><div class='add'>+		 *</div><div class='add'>+		 * This can only happen on a very old filesystem where chunks</div><div class='add'>+		 * are not ensured to be stripe aligned.</div><div class='ctx'> 		 */</div><div class='del'>-		btrfs_bio_counter_inc_blocked(fs_info);</div><div class='del'>-		ret = btrfs_map_sblock(fs_info, BTRFS_MAP_GET_READ_MIRRORS,</div><div class='del'>-				       logical, &amp;mapped_length, &amp;bioc);</div><div class='del'>-		if (ret || !bioc || mapped_length &lt; sublen) {</div><div class='del'>-			btrfs_put_bioc(bioc);</div><div class='del'>-			btrfs_bio_counter_dec(fs_info);</div><div class='del'>-			return -EIO;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		recover = kzalloc(sizeof(struct scrub_recover), GFP_NOFS);</div><div class='del'>-		if (!recover) {</div><div class='del'>-			btrfs_put_bioc(bioc);</div><div class='del'>-			btrfs_bio_counter_dec(fs_info);</div><div class='del'>-			return -ENOMEM;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		refcount_set(&amp;recover-&gt;refs, 1);</div><div class='del'>-		recover-&gt;bioc = bioc;</div><div class='del'>-		recover-&gt;map_length = mapped_length;</div><div class='del'>-</div><div class='del'>-		BUG_ON(page_index &gt;= SCRUB_MAX_PAGES_PER_BLOCK);</div><div class='del'>-</div><div class='del'>-		nmirrors = min(scrub_nr_raid_mirrors(bioc), BTRFS_MAX_MIRRORS);</div><div class='del'>-</div><div class='del'>-		for (mirror_index = 0; mirror_index &lt; nmirrors;</div><div class='del'>-		     mirror_index++) {</div><div class='del'>-			struct scrub_block *sblock;</div><div class='del'>-			struct scrub_page *spage;</div><div class='del'>-</div><div class='del'>-			sblock = sblocks_for_recheck + mirror_index;</div><div class='del'>-			sblock-&gt;sctx = sctx;</div><div class='del'>-</div><div class='del'>-			spage = kzalloc(sizeof(*spage), GFP_NOFS);</div><div class='del'>-			if (!spage) {</div><div class='del'>-leave_nomem:</div><div class='del'>-				spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-				sctx-&gt;stat.malloc_errors++;</div><div class='del'>-				spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-				scrub_put_recover(fs_info, recover);</div><div class='del'>-				return -ENOMEM;</div><div class='del'>-			}</div><div class='del'>-			scrub_page_get(spage);</div><div class='del'>-			sblock-&gt;pagev[page_index] = spage;</div><div class='del'>-			spage-&gt;sblock = sblock;</div><div class='del'>-			spage-&gt;flags = flags;</div><div class='del'>-			spage-&gt;generation = generation;</div><div class='del'>-			spage-&gt;logical = logical;</div><div class='del'>-			spage-&gt;have_csum = have_csum;</div><div class='del'>-			if (have_csum)</div><div class='del'>-				memcpy(spage-&gt;csum,</div><div class='del'>-				       original_sblock-&gt;pagev[0]-&gt;csum,</div><div class='del'>-				       sctx-&gt;fs_info-&gt;csum_size);</div><div class='del'>-</div><div class='del'>-			scrub_stripe_index_and_offset(logical,</div><div class='del'>-						      bioc-&gt;map_type,</div><div class='del'>-						      bioc-&gt;raid_map,</div><div class='del'>-						      mapped_length,</div><div class='del'>-						      bioc-&gt;num_stripes -</div><div class='del'>-						      bioc-&gt;num_tgtdevs,</div><div class='del'>-						      mirror_index,</div><div class='del'>-						      &amp;stripe_index,</div><div class='del'>-						      &amp;stripe_offset);</div><div class='del'>-			spage-&gt;physical = bioc-&gt;stripes[stripe_index].physical +</div><div class='del'>-					 stripe_offset;</div><div class='del'>-			spage-&gt;dev = bioc-&gt;stripes[stripe_index].dev;</div><div class='del'>-</div><div class='del'>-			BUG_ON(page_index &gt;= original_sblock-&gt;page_count);</div><div class='del'>-			spage-&gt;physical_for_dev_replace =</div><div class='del'>-				original_sblock-&gt;pagev[page_index]-&gt;</div><div class='del'>-				physical_for_dev_replace;</div><div class='del'>-			/* for missing devices, dev-&gt;bdev is NULL */</div><div class='del'>-			spage-&gt;mirror_num = mirror_index + 1;</div><div class='del'>-			sblock-&gt;page_count++;</div><div class='del'>-			spage-&gt;page = alloc_page(GFP_NOFS);</div><div class='del'>-			if (!spage-&gt;page)</div><div class='del'>-				goto leave_nomem;</div><div class='del'>-</div><div class='del'>-			scrub_get_recover(recover);</div><div class='del'>-			spage-&gt;recover = recover;</div><div class='add'>+		if (unlikely(sector_nr + sectors_per_tree &gt; stripe-&gt;nr_sectors)) {</div><div class='add'>+			btrfs_warn_rl(fs_info,</div><div class='add'>+			"scrub: tree block at %llu crosses stripe boundary %llu",</div><div class='add'>+				      stripe-&gt;logical +</div><div class='add'>+				      (sector_nr &lt;&lt; fs_info-&gt;sectorsize_bits),</div><div class='add'>+				      stripe-&gt;logical);</div><div class='add'>+			return;</div><div class='ctx'> 		}</div><div class='del'>-		scrub_put_recover(fs_info, recover);</div><div class='del'>-		length -= sublen;</div><div class='del'>-		logical += sublen;</div><div class='del'>-		page_index++;</div><div class='add'>+		scrub_verify_one_metadata(stripe, sector_nr);</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='add'>+	/*</div><div class='add'>+	 * Data is easier, we just verify the data csum (if we have it).  For</div><div class='add'>+	 * cases without csum, we have no other choice but to trust it.</div><div class='add'>+	 */</div><div class='add'>+	if (!sector-&gt;csum) {</div><div class='add'>+		scrub_bitmap_clear_bit_error(stripe, sector_nr);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-static void scrub_bio_wait_endio(struct bio *bio)</div><div class='del'>-{</div><div class='del'>-	complete(bio-&gt;bi_private);</div><div class='add'>+	ret = btrfs_check_block_csum(fs_info, paddr, csum_buf, sector-&gt;csum);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		scrub_bitmap_set_bit_csum_error(stripe, sector_nr);</div><div class='add'>+		scrub_bitmap_set_bit_error(stripe, sector_nr);</div><div class='add'>+	} else {</div><div class='add'>+		scrub_bitmap_clear_bit_csum_error(stripe, sector_nr);</div><div class='add'>+		scrub_bitmap_clear_bit_error(stripe, sector_nr);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int scrub_submit_raid56_bio_wait(struct btrfs_fs_info *fs_info,</div><div class='del'>-					struct bio *bio,</div><div class='del'>-					struct scrub_page *spage)</div><div class='add'>+/* Verify specified sectors of a stripe. */</div><div class='add'>+static void scrub_verify_one_stripe(struct scrub_stripe *stripe, unsigned long bitmap)</div><div class='ctx'> {</div><div class='del'>-	DECLARE_COMPLETION_ONSTACK(done);</div><div class='del'>-	int ret;</div><div class='del'>-	int mirror_num;</div><div class='add'>+	struct btrfs_fs_info *fs_info = stripe-&gt;bg-&gt;fs_info;</div><div class='add'>+	const u32 sectors_per_tree = fs_info-&gt;nodesize &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='add'>+	int sector_nr;</div><div class='ctx'> </div><div class='del'>-	bio-&gt;bi_iter.bi_sector = spage-&gt;logical &gt;&gt; 9;</div><div class='del'>-	bio-&gt;bi_private = &amp;done;</div><div class='del'>-	bio-&gt;bi_end_io = scrub_bio_wait_endio;</div><div class='del'>-</div><div class='del'>-	mirror_num = spage-&gt;sblock-&gt;pagev[0]-&gt;mirror_num;</div><div class='del'>-	ret = raid56_parity_recover(bio, spage-&gt;recover-&gt;bioc,</div><div class='del'>-				    spage-&gt;recover-&gt;map_length,</div><div class='del'>-				    mirror_num, 0);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	wait_for_completion_io(&amp;done);</div><div class='del'>-	return blk_status_to_errno(bio-&gt;bi_status);</div><div class='add'>+	for_each_set_bit(sector_nr, &amp;bitmap, stripe-&gt;nr_sectors) {</div><div class='add'>+		scrub_verify_one_sector(stripe, sector_nr);</div><div class='add'>+		if (scrub_bitmap_test_bit_is_metadata(stripe, sector_nr))</div><div class='add'>+			sector_nr += sectors_per_tree - 1;</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void scrub_recheck_block_on_raid56(struct btrfs_fs_info *fs_info,</div><div class='del'>-					  struct scrub_block *sblock)</div><div class='add'>+static int calc_sector_number(struct scrub_stripe *stripe, struct bio_vec *first_bvec)</div><div class='ctx'> {</div><div class='del'>-	struct scrub_page *first_page = sblock-&gt;pagev[0];</div><div class='del'>-	struct bio *bio;</div><div class='del'>-	int page_num;</div><div class='del'>-</div><div class='del'>-	/* All pages in sblock belong to the same stripe on the same device. */</div><div class='del'>-	ASSERT(first_page-&gt;dev);</div><div class='del'>-	if (!first_page-&gt;dev-&gt;bdev)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	bio = btrfs_bio_alloc(BIO_MAX_VECS);</div><div class='del'>-	bio_set_dev(bio, first_page-&gt;dev-&gt;bdev);</div><div class='del'>-</div><div class='del'>-	for (page_num = 0; page_num &lt; sblock-&gt;page_count; page_num++) {</div><div class='del'>-		struct scrub_page *spage = sblock-&gt;pagev[page_num];</div><div class='del'>-</div><div class='del'>-		WARN_ON(!spage-&gt;page);</div><div class='del'>-		bio_add_page(bio, spage-&gt;page, PAGE_SIZE, 0);</div><div class='del'>-	}</div><div class='add'>+	int i;</div><div class='ctx'> </div><div class='del'>-	if (scrub_submit_raid56_bio_wait(fs_info, bio, first_page)) {</div><div class='del'>-		bio_put(bio);</div><div class='del'>-		goto out;</div><div class='add'>+	for (i = 0; i &lt; stripe-&gt;nr_sectors; i++) {</div><div class='add'>+		if (scrub_stripe_get_kaddr(stripe, i) == bvec_virt(first_bvec))</div><div class='add'>+			break;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	bio_put(bio);</div><div class='del'>-</div><div class='del'>-	scrub_recheck_block_checksum(sblock);</div><div class='del'>-</div><div class='del'>-	return;</div><div class='del'>-out:</div><div class='del'>-	for (page_num = 0; page_num &lt; sblock-&gt;page_count; page_num++)</div><div class='del'>-		sblock-&gt;pagev[page_num]-&gt;io_error = 1;</div><div class='del'>-</div><div class='del'>-	sblock-&gt;no_io_error_seen = 0;</div><div class='add'>+	ASSERT(i &lt; stripe-&gt;nr_sectors);</div><div class='add'>+	return i;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * this function will check the on disk data for checksum errors, header</div><div class='del'>- * errors and read I/O errors. If any I/O errors happen, the exact pages</div><div class='del'>- * which are errored are marked as being bad. The goal is to enable scrub</div><div class='del'>- * to take those pages that are not errored from all the mirrors so that</div><div class='del'>- * the pages that are errored in the just handled mirror can be repaired.</div><div class='add'>+ * Repair read is different to the regular read:</div><div class='add'>+ *</div><div class='add'>+ * - Only reads the failed sectors</div><div class='add'>+ * - May have extra blocksize limits</div><div class='ctx'>  */</div><div class='del'>-static void scrub_recheck_block(struct btrfs_fs_info *fs_info,</div><div class='del'>-				struct scrub_block *sblock,</div><div class='del'>-				int retry_failed_mirror)</div><div class='add'>+static void scrub_repair_read_endio(struct btrfs_bio *bbio)</div><div class='ctx'> {</div><div class='del'>-	int page_num;</div><div class='del'>-</div><div class='del'>-	sblock-&gt;no_io_error_seen = 1;</div><div class='del'>-</div><div class='del'>-	/* short cut for raid56 */</div><div class='del'>-	if (!retry_failed_mirror &amp;&amp; scrub_is_page_on_raid56(sblock-&gt;pagev[0]))</div><div class='del'>-		return scrub_recheck_block_on_raid56(fs_info, sblock);</div><div class='del'>-</div><div class='del'>-	for (page_num = 0; page_num &lt; sblock-&gt;page_count; page_num++) {</div><div class='del'>-		struct bio *bio;</div><div class='del'>-		struct scrub_page *spage = sblock-&gt;pagev[page_num];</div><div class='del'>-</div><div class='del'>-		if (spage-&gt;dev-&gt;bdev == NULL) {</div><div class='del'>-			spage-&gt;io_error = 1;</div><div class='del'>-			sblock-&gt;no_io_error_seen = 0;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		WARN_ON(!spage-&gt;page);</div><div class='del'>-		bio = btrfs_bio_alloc(1);</div><div class='del'>-		bio_set_dev(bio, spage-&gt;dev-&gt;bdev);</div><div class='add'>+	struct scrub_stripe *stripe = bbio-&gt;private;</div><div class='add'>+	struct btrfs_fs_info *fs_info = stripe-&gt;bg-&gt;fs_info;</div><div class='add'>+	struct bio_vec *bvec;</div><div class='add'>+	int sector_nr = calc_sector_number(stripe, bio_first_bvec_all(&amp;bbio-&gt;bio));</div><div class='add'>+	u32 bio_size = 0;</div><div class='add'>+	int i;</div><div class='ctx'> </div><div class='del'>-		bio_add_page(bio, spage-&gt;page, fs_info-&gt;sectorsize, 0);</div><div class='del'>-		bio-&gt;bi_iter.bi_sector = spage-&gt;physical &gt;&gt; 9;</div><div class='del'>-		bio-&gt;bi_opf = REQ_OP_READ;</div><div class='add'>+	ASSERT(sector_nr &lt; stripe-&gt;nr_sectors);</div><div class='ctx'> </div><div class='del'>-		if (btrfsic_submit_bio_wait(bio)) {</div><div class='del'>-			spage-&gt;io_error = 1;</div><div class='del'>-			sblock-&gt;no_io_error_seen = 0;</div><div class='del'>-		}</div><div class='add'>+	bio_for_each_bvec_all(bvec, &amp;bbio-&gt;bio, i)</div><div class='add'>+		bio_size += bvec-&gt;bv_len;</div><div class='ctx'> </div><div class='del'>-		bio_put(bio);</div><div class='add'>+	if (bbio-&gt;bio.bi_status) {</div><div class='add'>+		scrub_bitmap_set_io_error(stripe, sector_nr,</div><div class='add'>+					  bio_size &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+		scrub_bitmap_set_error(stripe, sector_nr,</div><div class='add'>+				       bio_size &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+	} else {</div><div class='add'>+		scrub_bitmap_clear_io_error(stripe, sector_nr,</div><div class='add'>+					  bio_size &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	if (sblock-&gt;no_io_error_seen)</div><div class='del'>-		scrub_recheck_block_checksum(sblock);</div><div class='add'>+	bio_put(&amp;bbio-&gt;bio);</div><div class='add'>+	if (atomic_dec_and_test(&amp;stripe-&gt;pending_io))</div><div class='add'>+		wake_up(&amp;stripe-&gt;io_wait);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int scrub_check_fsid(u8 fsid[],</div><div class='del'>-				   struct scrub_page *spage)</div><div class='add'>+static int calc_next_mirror(int mirror, int num_copies)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_devices *fs_devices = spage-&gt;dev-&gt;fs_devices;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ret = memcmp(fsid, fs_devices-&gt;fsid, BTRFS_FSID_SIZE);</div><div class='del'>-	return !ret;</div><div class='add'>+	ASSERT(mirror &lt;= num_copies);</div><div class='add'>+	return (mirror + 1 &gt; num_copies) ? 1 : mirror + 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void scrub_recheck_block_checksum(struct scrub_block *sblock)</div><div class='add'>+static void scrub_bio_add_sector(struct btrfs_bio *bbio, struct scrub_stripe *stripe,</div><div class='add'>+				 int sector_nr)</div><div class='ctx'> {</div><div class='del'>-	sblock-&gt;header_error = 0;</div><div class='del'>-	sblock-&gt;checksum_error = 0;</div><div class='del'>-	sblock-&gt;generation_error = 0;</div><div class='add'>+	struct btrfs_fs_info *fs_info = bbio-&gt;inode-&gt;root-&gt;fs_info;</div><div class='add'>+	void *kaddr = scrub_stripe_get_kaddr(stripe, sector_nr);</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	if (sblock-&gt;pagev[0]-&gt;flags &amp; BTRFS_EXTENT_FLAG_DATA)</div><div class='del'>-		scrub_checksum_data(sblock);</div><div class='del'>-	else</div><div class='del'>-		scrub_checksum_tree_block(sblock);</div><div class='add'>+	ret = bio_add_page(&amp;bbio-&gt;bio, virt_to_page(kaddr), fs_info-&gt;sectorsize,</div><div class='add'>+			   offset_in_page(kaddr));</div><div class='add'>+	/*</div><div class='add'>+	 * Caller should ensure the bbio has enough size.</div><div class='add'>+	 * And we cannot use __bio_add_page(), which doesn't do any merge.</div><div class='add'>+	 *</div><div class='add'>+	 * Meanwhile for scrub_submit_initial_read() we fully rely on the merge</div><div class='add'>+	 * to create the minimal amount of bio vectors, for fs block size &lt; page</div><div class='add'>+	 * size cases.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(ret == fs_info-&gt;sectorsize);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int scrub_repair_block_from_good_copy(struct scrub_block *sblock_bad,</div><div class='del'>-					     struct scrub_block *sblock_good)</div><div class='add'>+static struct btrfs_bio *alloc_scrub_bbio(struct btrfs_fs_info *fs_info,</div><div class='add'>+					  unsigned int nr_vecs, blk_opf_t opf,</div><div class='add'>+					  u64 logical,</div><div class='add'>+					  btrfs_bio_end_io_t end_io, void *private)</div><div class='ctx'> {</div><div class='del'>-	int page_num;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	for (page_num = 0; page_num &lt; sblock_bad-&gt;page_count; page_num++) {</div><div class='del'>-		int ret_sub;</div><div class='del'>-</div><div class='del'>-		ret_sub = scrub_repair_page_from_good_copy(sblock_bad,</div><div class='del'>-							   sblock_good,</div><div class='del'>-							   page_num, 1);</div><div class='del'>-		if (ret_sub)</div><div class='del'>-			ret = ret_sub;</div><div class='del'>-	}</div><div class='add'>+	struct btrfs_bio *bbio;</div><div class='ctx'> </div><div class='del'>-	return ret;</div><div class='add'>+	bbio = btrfs_bio_alloc(nr_vecs, opf, BTRFS_I(fs_info-&gt;btree_inode),</div><div class='add'>+			       logical, end_io, private);</div><div class='add'>+	bbio-&gt;is_scrub = true;</div><div class='add'>+	bbio-&gt;bio.bi_iter.bi_sector = logical &gt;&gt; SECTOR_SHIFT;</div><div class='add'>+	return bbio;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int scrub_repair_page_from_good_copy(struct scrub_block *sblock_bad,</div><div class='del'>-					    struct scrub_block *sblock_good,</div><div class='del'>-					    int page_num, int force_write)</div><div class='add'>+static void scrub_stripe_submit_repair_read(struct scrub_stripe *stripe,</div><div class='add'>+					    int mirror, int blocksize, bool wait)</div><div class='ctx'> {</div><div class='del'>-	struct scrub_page *spage_bad = sblock_bad-&gt;pagev[page_num];</div><div class='del'>-	struct scrub_page *spage_good = sblock_good-&gt;pagev[page_num];</div><div class='del'>-	struct btrfs_fs_info *fs_info = sblock_bad-&gt;sctx-&gt;fs_info;</div><div class='del'>-	const u32 sectorsize = fs_info-&gt;sectorsize;</div><div class='del'>-</div><div class='del'>-	BUG_ON(spage_bad-&gt;page == NULL);</div><div class='del'>-	BUG_ON(spage_good-&gt;page == NULL);</div><div class='del'>-	if (force_write || sblock_bad-&gt;header_error ||</div><div class='del'>-	    sblock_bad-&gt;checksum_error || spage_bad-&gt;io_error) {</div><div class='del'>-		struct bio *bio;</div><div class='del'>-		int ret;</div><div class='add'>+	struct btrfs_fs_info *fs_info = stripe-&gt;bg-&gt;fs_info;</div><div class='add'>+	struct btrfs_bio *bbio = NULL;</div><div class='add'>+	const unsigned long old_error_bitmap = scrub_bitmap_read_error(stripe);</div><div class='add'>+	int i;</div><div class='ctx'> </div><div class='del'>-		if (!spage_bad-&gt;dev-&gt;bdev) {</div><div class='del'>-			btrfs_warn_rl(fs_info,</div><div class='del'>-				"scrub_repair_page_from_good_copy(bdev == NULL) is unexpected");</div><div class='del'>-			return -EIO;</div><div class='add'>+	ASSERT(stripe-&gt;mirror_num &gt;= 1, "stripe-&gt;mirror_num=%d", stripe-&gt;mirror_num);</div><div class='add'>+	ASSERT(atomic_read(&amp;stripe-&gt;pending_io) == 0,</div><div class='add'>+	       "atomic_read(&amp;stripe-&gt;pending_io)=%d", atomic_read(&amp;stripe-&gt;pending_io));</div><div class='add'>+</div><div class='add'>+	for_each_set_bit(i, &amp;old_error_bitmap, stripe-&gt;nr_sectors) {</div><div class='add'>+		/* The current sector cannot be merged, submit the bio. */</div><div class='add'>+		if (bbio &amp;&amp; ((i &gt; 0 &amp;&amp; !test_bit(i - 1, &amp;old_error_bitmap)) ||</div><div class='add'>+			     bbio-&gt;bio.bi_iter.bi_size &gt;= blocksize)) {</div><div class='add'>+			ASSERT(bbio-&gt;bio.bi_iter.bi_size);</div><div class='add'>+			atomic_inc(&amp;stripe-&gt;pending_io);</div><div class='add'>+			btrfs_submit_bbio(bbio, mirror);</div><div class='add'>+			if (wait)</div><div class='add'>+				wait_scrub_stripe_io(stripe);</div><div class='add'>+			bbio = NULL;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		bio = btrfs_bio_alloc(1);</div><div class='del'>-		bio_set_dev(bio, spage_bad-&gt;dev-&gt;bdev);</div><div class='del'>-		bio-&gt;bi_iter.bi_sector = spage_bad-&gt;physical &gt;&gt; 9;</div><div class='del'>-		bio-&gt;bi_opf = REQ_OP_WRITE;</div><div class='del'>-</div><div class='del'>-		ret = bio_add_page(bio, spage_good-&gt;page, sectorsize, 0);</div><div class='del'>-		if (ret != sectorsize) {</div><div class='del'>-			bio_put(bio);</div><div class='del'>-			return -EIO;</div><div class='del'>-		}</div><div class='add'>+		if (!bbio)</div><div class='add'>+			bbio = alloc_scrub_bbio(fs_info, stripe-&gt;nr_sectors, REQ_OP_READ,</div><div class='add'>+						stripe-&gt;logical + (i &lt;&lt; fs_info-&gt;sectorsize_bits),</div><div class='add'>+						scrub_repair_read_endio, stripe);</div><div class='ctx'> </div><div class='del'>-		if (btrfsic_submit_bio_wait(bio)) {</div><div class='del'>-			btrfs_dev_stat_inc_and_print(spage_bad-&gt;dev,</div><div class='del'>-				BTRFS_DEV_STAT_WRITE_ERRS);</div><div class='del'>-			atomic64_inc(&amp;fs_info-&gt;dev_replace.num_write_errors);</div><div class='del'>-			bio_put(bio);</div><div class='del'>-			return -EIO;</div><div class='del'>-		}</div><div class='del'>-		bio_put(bio);</div><div class='add'>+		scrub_bio_add_sector(bbio, stripe, i);</div><div class='add'>+	}</div><div class='add'>+	if (bbio) {</div><div class='add'>+		ASSERT(bbio-&gt;bio.bi_iter.bi_size);</div><div class='add'>+		atomic_inc(&amp;stripe-&gt;pending_io);</div><div class='add'>+		btrfs_submit_bbio(bbio, mirror);</div><div class='add'>+		if (wait)</div><div class='add'>+			wait_scrub_stripe_io(stripe);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void scrub_write_block_to_dev_replace(struct scrub_block *sblock)</div><div class='add'>+static void scrub_stripe_report_errors(struct scrub_ctx *sctx,</div><div class='add'>+				       struct scrub_stripe *stripe,</div><div class='add'>+				       const struct scrub_error_records *errors)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = sblock-&gt;sctx-&gt;fs_info;</div><div class='del'>-	int page_num;</div><div class='add'>+	static DEFINE_RATELIMIT_STATE(rs, DEFAULT_RATELIMIT_INTERVAL,</div><div class='add'>+				      DEFAULT_RATELIMIT_BURST);</div><div class='add'>+	struct btrfs_fs_info *fs_info = sctx-&gt;fs_info;</div><div class='add'>+	struct btrfs_device *dev = NULL;</div><div class='add'>+	const unsigned long extent_bitmap = scrub_bitmap_read_has_extent(stripe);</div><div class='add'>+	const unsigned long error_bitmap = scrub_bitmap_read_error(stripe);</div><div class='add'>+	u64 physical = 0;</div><div class='add'>+	int nr_data_sectors = 0;</div><div class='add'>+	int nr_meta_sectors = 0;</div><div class='add'>+	int nr_nodatacsum_sectors = 0;</div><div class='add'>+	int nr_repaired_sectors = 0;</div><div class='add'>+	int sector_nr;</div><div class='add'>+</div><div class='add'>+	if (test_bit(SCRUB_STRIPE_FLAG_NO_REPORT, &amp;stripe-&gt;state))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * This block is used for the check of the parity on the source device,</div><div class='del'>-	 * so the data needn't be written into the destination device.</div><div class='add'>+	 * Init needed infos for error reporting.</div><div class='add'>+	 *</div><div class='add'>+	 * Although our scrub_stripe infrastructure is mostly based on btrfs_submit_bio()</div><div class='add'>+	 * thus no need for dev/physical, error reporting still needs dev and physical.</div><div class='ctx'> 	 */</div><div class='del'>-	if (sblock-&gt;sparity)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	for (page_num = 0; page_num &lt; sblock-&gt;page_count; page_num++) {</div><div class='add'>+	if (!bitmap_empty(&amp;errors-&gt;init_error_bitmap, stripe-&gt;nr_sectors)) {</div><div class='add'>+		u64 mapped_len = fs_info-&gt;sectorsize;</div><div class='add'>+		struct btrfs_io_context *bioc = NULL;</div><div class='add'>+		int stripe_index = stripe-&gt;mirror_num - 1;</div><div class='ctx'> 		int ret;</div><div class='ctx'> </div><div class='del'>-		ret = scrub_write_page_to_dev_replace(sblock, page_num);</div><div class='del'>-		if (ret)</div><div class='del'>-			atomic64_inc(&amp;fs_info-&gt;dev_replace.num_write_errors);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int scrub_write_page_to_dev_replace(struct scrub_block *sblock,</div><div class='del'>-					   int page_num)</div><div class='del'>-{</div><div class='del'>-	struct scrub_page *spage = sblock-&gt;pagev[page_num];</div><div class='del'>-</div><div class='del'>-	BUG_ON(spage-&gt;page == NULL);</div><div class='del'>-	if (spage-&gt;io_error)</div><div class='del'>-		clear_page(page_address(spage-&gt;page));</div><div class='del'>-</div><div class='del'>-	return scrub_add_page_to_wr_bio(sblock-&gt;sctx, spage);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int fill_writer_pointer_gap(struct scrub_ctx *sctx, u64 physical)</div><div class='del'>-{</div><div class='del'>-	int ret = 0;</div><div class='del'>-	u64 length;</div><div class='del'>-</div><div class='del'>-	if (!btrfs_is_zoned(sctx-&gt;fs_info))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	if (!btrfs_dev_is_sequential(sctx-&gt;wr_tgtdev, physical))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	if (sctx-&gt;write_pointer &lt; physical) {</div><div class='del'>-		length = physical - sctx-&gt;write_pointer;</div><div class='del'>-</div><div class='del'>-		ret = btrfs_zoned_issue_zeroout(sctx-&gt;wr_tgtdev,</div><div class='del'>-						sctx-&gt;write_pointer, length);</div><div class='del'>-		if (!ret)</div><div class='del'>-			sctx-&gt;write_pointer = physical;</div><div class='add'>+		/* For scrub, our mirror_num should always start at 1. */</div><div class='add'>+		ASSERT(stripe-&gt;mirror_num &gt;= 1, "stripe-&gt;mirror_num=%d", stripe-&gt;mirror_num);</div><div class='add'>+		ret = btrfs_map_block(fs_info, BTRFS_MAP_GET_READ_MIRRORS,</div><div class='add'>+				      stripe-&gt;logical, &amp;mapped_len, &amp;bioc,</div><div class='add'>+				      NULL, NULL);</div><div class='add'>+		/*</div><div class='add'>+		 * If we failed, dev will be NULL, and later detailed reports</div><div class='add'>+		 * will just be skipped.</div><div class='add'>+		 */</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto skip;</div><div class='add'>+		physical = bioc-&gt;stripes[stripe_index].physical;</div><div class='add'>+		dev = bioc-&gt;stripes[stripe_index].dev;</div><div class='add'>+		btrfs_put_bioc(bioc);</div><div class='ctx'> 	}</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int scrub_add_page_to_wr_bio(struct scrub_ctx *sctx,</div><div class='del'>-				    struct scrub_page *spage)</div><div class='del'>-{</div><div class='del'>-	struct scrub_bio *sbio;</div><div class='del'>-	int ret;</div><div class='del'>-	const u32 sectorsize = sctx-&gt;fs_info-&gt;sectorsize;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;sctx-&gt;wr_lock);</div><div class='del'>-again:</div><div class='del'>-	if (!sctx-&gt;wr_curr_bio) {</div><div class='del'>-		sctx-&gt;wr_curr_bio = kzalloc(sizeof(*sctx-&gt;wr_curr_bio),</div><div class='del'>-					      GFP_KERNEL);</div><div class='del'>-		if (!sctx-&gt;wr_curr_bio) {</div><div class='del'>-			mutex_unlock(&amp;sctx-&gt;wr_lock);</div><div class='del'>-			return -ENOMEM;</div><div class='del'>-		}</div><div class='del'>-		sctx-&gt;wr_curr_bio-&gt;sctx = sctx;</div><div class='del'>-		sctx-&gt;wr_curr_bio-&gt;page_count = 0;</div><div class='del'>-	}</div><div class='del'>-	sbio = sctx-&gt;wr_curr_bio;</div><div class='del'>-	if (sbio-&gt;page_count == 0) {</div><div class='del'>-		struct bio *bio;</div><div class='add'>+skip:</div><div class='add'>+	for_each_set_bit(sector_nr, &amp;extent_bitmap, stripe-&gt;nr_sectors) {</div><div class='add'>+		bool repaired = false;</div><div class='ctx'> </div><div class='del'>-		ret = fill_writer_pointer_gap(sctx,</div><div class='del'>-					      spage-&gt;physical_for_dev_replace);</div><div class='del'>-		if (ret) {</div><div class='del'>-			mutex_unlock(&amp;sctx-&gt;wr_lock);</div><div class='del'>-			return ret;</div><div class='add'>+		if (scrub_bitmap_test_bit_is_metadata(stripe, sector_nr)) {</div><div class='add'>+			nr_meta_sectors++;</div><div class='add'>+		} else {</div><div class='add'>+			nr_data_sectors++;</div><div class='add'>+			if (!stripe-&gt;sectors[sector_nr].csum)</div><div class='add'>+				nr_nodatacsum_sectors++;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		sbio-&gt;physical = spage-&gt;physical_for_dev_replace;</div><div class='del'>-		sbio-&gt;logical = spage-&gt;logical;</div><div class='del'>-		sbio-&gt;dev = sctx-&gt;wr_tgtdev;</div><div class='del'>-		bio = sbio-&gt;bio;</div><div class='del'>-		if (!bio) {</div><div class='del'>-			bio = btrfs_bio_alloc(sctx-&gt;pages_per_wr_bio);</div><div class='del'>-			sbio-&gt;bio = bio;</div><div class='add'>+		if (test_bit(sector_nr, &amp;errors-&gt;init_error_bitmap) &amp;&amp;</div><div class='add'>+		    !test_bit(sector_nr, &amp;error_bitmap)) {</div><div class='add'>+			nr_repaired_sectors++;</div><div class='add'>+			repaired = true;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		bio-&gt;bi_private = sbio;</div><div class='del'>-		bio-&gt;bi_end_io = scrub_wr_bio_end_io;</div><div class='del'>-		bio_set_dev(bio, sbio-&gt;dev-&gt;bdev);</div><div class='del'>-		bio-&gt;bi_iter.bi_sector = sbio-&gt;physical &gt;&gt; 9;</div><div class='del'>-		bio-&gt;bi_opf = REQ_OP_WRITE;</div><div class='del'>-		sbio-&gt;status = 0;</div><div class='del'>-	} else if (sbio-&gt;physical + sbio-&gt;page_count * sectorsize !=</div><div class='del'>-		   spage-&gt;physical_for_dev_replace ||</div><div class='del'>-		   sbio-&gt;logical + sbio-&gt;page_count * sectorsize !=</div><div class='del'>-		   spage-&gt;logical) {</div><div class='del'>-		scrub_wr_submit(sctx);</div><div class='del'>-		goto again;</div><div class='del'>-	}</div><div class='add'>+		/* Good sector from the beginning, nothing need to be done. */</div><div class='add'>+		if (!test_bit(sector_nr, &amp;errors-&gt;init_error_bitmap))</div><div class='add'>+			continue;</div><div class='ctx'> </div><div class='del'>-	ret = bio_add_page(sbio-&gt;bio, spage-&gt;page, sectorsize, 0);</div><div class='del'>-	if (ret != sectorsize) {</div><div class='del'>-		if (sbio-&gt;page_count &lt; 1) {</div><div class='del'>-			bio_put(sbio-&gt;bio);</div><div class='del'>-			sbio-&gt;bio = NULL;</div><div class='del'>-			mutex_unlock(&amp;sctx-&gt;wr_lock);</div><div class='del'>-			return -EIO;</div><div class='add'>+		/*</div><div class='add'>+		 * Report error for the corrupted sectors.  If repaired, just</div><div class='add'>+		 * output the message of repaired message.</div><div class='add'>+		 */</div><div class='add'>+		if (repaired) {</div><div class='add'>+			if (dev) {</div><div class='add'>+				btrfs_err_rl(fs_info,</div><div class='add'>+		"scrub: fixed up error at logical %llu on dev %s physical %llu",</div><div class='add'>+					    stripe-&gt;logical, btrfs_dev_name(dev),</div><div class='add'>+					    physical);</div><div class='add'>+			} else {</div><div class='add'>+				btrfs_err_rl(fs_info,</div><div class='add'>+			   "scrub: fixed up error at logical %llu on mirror %u",</div><div class='add'>+					    stripe-&gt;logical, stripe-&gt;mirror_num);</div><div class='add'>+			}</div><div class='add'>+			continue;</div><div class='ctx'> 		}</div><div class='del'>-		scrub_wr_submit(sctx);</div><div class='del'>-		goto again;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	sbio-&gt;pagev[sbio-&gt;page_count] = spage;</div><div class='del'>-	scrub_page_get(spage);</div><div class='del'>-	sbio-&gt;page_count++;</div><div class='del'>-	if (sbio-&gt;page_count == sctx-&gt;pages_per_wr_bio)</div><div class='del'>-		scrub_wr_submit(sctx);</div><div class='del'>-	mutex_unlock(&amp;sctx-&gt;wr_lock);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='ctx'> </div><div class='del'>-static void scrub_wr_submit(struct scrub_ctx *sctx)</div><div class='del'>-{</div><div class='del'>-	struct scrub_bio *sbio;</div><div class='add'>+		/* The remaining are all for unrepaired. */</div><div class='add'>+		if (dev) {</div><div class='add'>+			btrfs_err_rl(fs_info,</div><div class='add'>+"scrub: unable to fixup (regular) error at logical %llu on dev %s physical %llu",</div><div class='add'>+					    stripe-&gt;logical, btrfs_dev_name(dev),</div><div class='add'>+					    physical);</div><div class='add'>+		} else {</div><div class='add'>+			btrfs_err_rl(fs_info,</div><div class='add'>+	  "scrub: unable to fixup (regular) error at logical %llu on mirror %u",</div><div class='add'>+					    stripe-&gt;logical, stripe-&gt;mirror_num);</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	if (!sctx-&gt;wr_curr_bio)</div><div class='del'>-		return;</div><div class='add'>+		if (scrub_bitmap_test_bit_io_error(stripe, sector_nr))</div><div class='add'>+			if (__ratelimit(&amp;rs) &amp;&amp; dev)</div><div class='add'>+				scrub_print_common_warning("i/o error", dev, false,</div><div class='add'>+						     stripe-&gt;logical, physical);</div><div class='add'>+		if (scrub_bitmap_test_bit_csum_error(stripe, sector_nr))</div><div class='add'>+			if (__ratelimit(&amp;rs) &amp;&amp; dev)</div><div class='add'>+				scrub_print_common_warning("checksum error", dev, false,</div><div class='add'>+						     stripe-&gt;logical, physical);</div><div class='add'>+		if (scrub_bitmap_test_bit_meta_error(stripe, sector_nr))</div><div class='add'>+			if (__ratelimit(&amp;rs) &amp;&amp; dev)</div><div class='add'>+				scrub_print_common_warning("header error", dev, false,</div><div class='add'>+						     stripe-&gt;logical, physical);</div><div class='add'>+		if (scrub_bitmap_test_bit_meta_gen_error(stripe, sector_nr))</div><div class='add'>+			if (__ratelimit(&amp;rs) &amp;&amp; dev)</div><div class='add'>+				scrub_print_common_warning("generation error", dev, false,</div><div class='add'>+						     stripe-&gt;logical, physical);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Update the device stats. */</div><div class='add'>+	for (int i = 0; i &lt; errors-&gt;nr_io_errors; i++)</div><div class='add'>+		btrfs_dev_stat_inc_and_print(stripe-&gt;dev, BTRFS_DEV_STAT_READ_ERRS);</div><div class='add'>+	for (int i = 0; i &lt; errors-&gt;nr_csum_errors; i++)</div><div class='add'>+		btrfs_dev_stat_inc_and_print(stripe-&gt;dev, BTRFS_DEV_STAT_CORRUPTION_ERRS);</div><div class='add'>+	/* Generation mismatch error is based on each metadata, not each block. */</div><div class='add'>+	for (int i = 0; i &lt; errors-&gt;nr_meta_gen_errors;</div><div class='add'>+	     i += (fs_info-&gt;nodesize &gt;&gt; fs_info-&gt;sectorsize_bits))</div><div class='add'>+		btrfs_dev_stat_inc_and_print(stripe-&gt;dev, BTRFS_DEV_STAT_GENERATION_ERRS);</div><div class='ctx'> </div><div class='del'>-	sbio = sctx-&gt;wr_curr_bio;</div><div class='del'>-	sctx-&gt;wr_curr_bio = NULL;</div><div class='del'>-	WARN_ON(!sbio-&gt;bio-&gt;bi_bdev);</div><div class='del'>-	scrub_pending_bio_inc(sctx);</div><div class='del'>-	/* process all writes in a single worker thread. Then the block layer</div><div class='del'>-	 * orders the requests before sending them to the driver which</div><div class='del'>-	 * doubled the write performance on spinning disks when measured</div><div class='del'>-	 * with Linux 3.5 */</div><div class='del'>-	btrfsic_submit_bio(sbio-&gt;bio);</div><div class='del'>-</div><div class='del'>-	if (btrfs_is_zoned(sctx-&gt;fs_info))</div><div class='del'>-		sctx-&gt;write_pointer = sbio-&gt;physical + sbio-&gt;page_count *</div><div class='del'>-			sctx-&gt;fs_info-&gt;sectorsize;</div><div class='add'>+	spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='add'>+	sctx-&gt;stat.data_extents_scrubbed += stripe-&gt;nr_data_extents;</div><div class='add'>+	sctx-&gt;stat.tree_extents_scrubbed += stripe-&gt;nr_meta_extents;</div><div class='add'>+	sctx-&gt;stat.data_bytes_scrubbed += nr_data_sectors &lt;&lt; fs_info-&gt;sectorsize_bits;</div><div class='add'>+	sctx-&gt;stat.tree_bytes_scrubbed += nr_meta_sectors &lt;&lt; fs_info-&gt;sectorsize_bits;</div><div class='add'>+	sctx-&gt;stat.no_csum += nr_nodatacsum_sectors;</div><div class='add'>+	sctx-&gt;stat.read_errors += errors-&gt;nr_io_errors;</div><div class='add'>+	sctx-&gt;stat.csum_errors += errors-&gt;nr_csum_errors;</div><div class='add'>+	sctx-&gt;stat.verify_errors += errors-&gt;nr_meta_errors +</div><div class='add'>+				    errors-&gt;nr_meta_gen_errors;</div><div class='add'>+	sctx-&gt;stat.uncorrectable_errors +=</div><div class='add'>+		bitmap_weight(&amp;error_bitmap, stripe-&gt;nr_sectors);</div><div class='add'>+	sctx-&gt;stat.corrected_errors += nr_repaired_sectors;</div><div class='add'>+	spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void scrub_wr_bio_end_io(struct bio *bio)</div><div class='del'>-{</div><div class='del'>-	struct scrub_bio *sbio = bio-&gt;bi_private;</div><div class='del'>-	struct btrfs_fs_info *fs_info = sbio-&gt;dev-&gt;fs_info;</div><div class='del'>-</div><div class='del'>-	sbio-&gt;status = bio-&gt;bi_status;</div><div class='del'>-	sbio-&gt;bio = bio;</div><div class='del'>-</div><div class='del'>-	btrfs_init_work(&amp;sbio-&gt;work, scrub_wr_bio_end_io_worker, NULL, NULL);</div><div class='del'>-	btrfs_queue_work(fs_info-&gt;scrub_wr_completion_workers, &amp;sbio-&gt;work);</div><div class='del'>-}</div><div class='add'>+static void scrub_write_sectors(struct scrub_ctx *sctx, struct scrub_stripe *stripe,</div><div class='add'>+				unsigned long write_bitmap, bool dev_replace);</div><div class='ctx'> </div><div class='del'>-static void scrub_wr_bio_end_io_worker(struct btrfs_work *work)</div><div class='add'>+/*</div><div class='add'>+ * The main entrance for all read related scrub work, including:</div><div class='add'>+ *</div><div class='add'>+ * - Wait for the initial read to finish</div><div class='add'>+ * - Verify and locate any bad sectors</div><div class='add'>+ * - Go through the remaining mirrors and try to read as large blocksize as</div><div class='add'>+ *   possible</div><div class='add'>+ * - Go through all mirrors (including the failed mirror) sector-by-sector</div><div class='add'>+ * - Submit writeback for repaired sectors</div><div class='add'>+ *</div><div class='add'>+ * Writeback for dev-replace does not happen here, it needs extra</div><div class='add'>+ * synchronization for zoned devices.</div><div class='add'>+ */</div><div class='add'>+static void scrub_stripe_read_repair_worker(struct work_struct *work)</div><div class='ctx'> {</div><div class='del'>-	struct scrub_bio *sbio = container_of(work, struct scrub_bio, work);</div><div class='del'>-	struct scrub_ctx *sctx = sbio-&gt;sctx;</div><div class='add'>+	struct scrub_stripe *stripe = container_of(work, struct scrub_stripe, work);</div><div class='add'>+	struct scrub_ctx *sctx = stripe-&gt;sctx;</div><div class='add'>+	struct btrfs_fs_info *fs_info = sctx-&gt;fs_info;</div><div class='add'>+	struct scrub_error_records errors = { 0 };</div><div class='add'>+	int num_copies = btrfs_num_copies(fs_info, stripe-&gt;bg-&gt;start,</div><div class='add'>+					  stripe-&gt;bg-&gt;length);</div><div class='add'>+	unsigned long repaired;</div><div class='add'>+	unsigned long error;</div><div class='add'>+	int mirror;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	WARN_ON(sbio-&gt;page_count &gt; SCRUB_PAGES_PER_WR_BIO);</div><div class='del'>-	if (sbio-&gt;status) {</div><div class='del'>-		struct btrfs_dev_replace *dev_replace =</div><div class='del'>-			&amp;sbio-&gt;sctx-&gt;fs_info-&gt;dev_replace;</div><div class='add'>+	ASSERT(stripe-&gt;mirror_num &gt;= 1, "stripe-&gt;mirror_num=%d", stripe-&gt;mirror_num);</div><div class='ctx'> </div><div class='del'>-		for (i = 0; i &lt; sbio-&gt;page_count; i++) {</div><div class='del'>-			struct scrub_page *spage = sbio-&gt;pagev[i];</div><div class='add'>+	wait_scrub_stripe_io(stripe);</div><div class='add'>+	scrub_verify_one_stripe(stripe, scrub_bitmap_read_has_extent(stripe));</div><div class='add'>+	/* Save the initial failed bitmap for later repair and report usage. */</div><div class='add'>+	errors.init_error_bitmap = scrub_bitmap_read_error(stripe);</div><div class='add'>+	errors.nr_io_errors = scrub_bitmap_weight_io_error(stripe);</div><div class='add'>+	errors.nr_csum_errors = scrub_bitmap_weight_csum_error(stripe);</div><div class='add'>+	errors.nr_meta_errors = scrub_bitmap_weight_meta_error(stripe);</div><div class='add'>+	errors.nr_meta_gen_errors = scrub_bitmap_weight_meta_gen_error(stripe);</div><div class='ctx'> </div><div class='del'>-			spage-&gt;io_error = 1;</div><div class='del'>-			atomic64_inc(&amp;dev_replace-&gt;num_write_errors);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; sbio-&gt;page_count; i++)</div><div class='del'>-		scrub_page_put(sbio-&gt;pagev[i]);</div><div class='del'>-</div><div class='del'>-	bio_put(sbio-&gt;bio);</div><div class='del'>-	kfree(sbio);</div><div class='del'>-	scrub_pending_bio_dec(sctx);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int scrub_checksum(struct scrub_block *sblock)</div><div class='del'>-{</div><div class='del'>-	u64 flags;</div><div class='del'>-	int ret;</div><div class='add'>+	if (bitmap_empty(&amp;errors.init_error_bitmap, stripe-&gt;nr_sectors))</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * No need to initialize these stats currently,</div><div class='del'>-	 * because this function only use return value</div><div class='del'>-	 * instead of these stats value.</div><div class='add'>+	 * Try all remaining mirrors.</div><div class='ctx'> 	 *</div><div class='del'>-	 * Todo:</div><div class='del'>-	 * always use stats</div><div class='add'>+	 * Here we still try to read as large block as possible, as this is</div><div class='add'>+	 * faster and we have extra safety nets to rely on.</div><div class='ctx'> 	 */</div><div class='del'>-	sblock-&gt;header_error = 0;</div><div class='del'>-	sblock-&gt;generation_error = 0;</div><div class='del'>-	sblock-&gt;checksum_error = 0;</div><div class='del'>-</div><div class='del'>-	WARN_ON(sblock-&gt;page_count &lt; 1);</div><div class='del'>-	flags = sblock-&gt;pagev[0]-&gt;flags;</div><div class='del'>-	ret = 0;</div><div class='del'>-	if (flags &amp; BTRFS_EXTENT_FLAG_DATA)</div><div class='del'>-		ret = scrub_checksum_data(sblock);</div><div class='del'>-	else if (flags &amp; BTRFS_EXTENT_FLAG_TREE_BLOCK)</div><div class='del'>-		ret = scrub_checksum_tree_block(sblock);</div><div class='del'>-	else if (flags &amp; BTRFS_EXTENT_FLAG_SUPER)</div><div class='del'>-		(void)scrub_checksum_super(sblock);</div><div class='del'>-	else</div><div class='del'>-		WARN_ON(1);</div><div class='del'>-	if (ret)</div><div class='del'>-		scrub_handle_errored_block(sblock);</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int scrub_checksum_data(struct scrub_block *sblock)</div><div class='del'>-{</div><div class='del'>-	struct scrub_ctx *sctx = sblock-&gt;sctx;</div><div class='del'>-	struct btrfs_fs_info *fs_info = sctx-&gt;fs_info;</div><div class='del'>-	SHASH_DESC_ON_STACK(shash, fs_info-&gt;csum_shash);</div><div class='del'>-	u8 csum[BTRFS_CSUM_SIZE];</div><div class='del'>-	struct scrub_page *spage;</div><div class='del'>-	char *kaddr;</div><div class='del'>-</div><div class='del'>-	BUG_ON(sblock-&gt;page_count &lt; 1);</div><div class='del'>-	spage = sblock-&gt;pagev[0];</div><div class='del'>-	if (!spage-&gt;have_csum)</div><div class='del'>-		return 0;</div><div class='add'>+	for (mirror = calc_next_mirror(stripe-&gt;mirror_num, num_copies);</div><div class='add'>+	     mirror != stripe-&gt;mirror_num;</div><div class='add'>+	     mirror = calc_next_mirror(mirror, num_copies)) {</div><div class='add'>+		const unsigned long old_error_bitmap = scrub_bitmap_read_error(stripe);</div><div class='add'>+</div><div class='add'>+		scrub_stripe_submit_repair_read(stripe, mirror,</div><div class='add'>+						BTRFS_STRIPE_LEN, false);</div><div class='add'>+		wait_scrub_stripe_io(stripe);</div><div class='add'>+		scrub_verify_one_stripe(stripe, old_error_bitmap);</div><div class='add'>+		if (scrub_bitmap_empty_error(stripe))</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	kaddr = page_address(spage-&gt;page);</div><div class='add'>+	/*</div><div class='add'>+	 * Last safety net, try re-checking all mirrors, including the failed</div><div class='add'>+	 * one, sector-by-sector.</div><div class='add'>+	 *</div><div class='add'>+	 * As if one sector failed the drive's internal csum, the whole read</div><div class='add'>+	 * containing the offending sector would be marked as error.</div><div class='add'>+	 * Thus here we do sector-by-sector read.</div><div class='add'>+	 *</div><div class='add'>+	 * This can be slow, thus we only try it as the last resort.</div><div class='add'>+	 */</div><div class='ctx'> </div><div class='del'>-	shash-&gt;tfm = fs_info-&gt;csum_shash;</div><div class='del'>-	crypto_shash_init(shash);</div><div class='add'>+	for (i = 0, mirror = stripe-&gt;mirror_num;</div><div class='add'>+	     i &lt; num_copies;</div><div class='add'>+	     i++, mirror = calc_next_mirror(mirror, num_copies)) {</div><div class='add'>+		const unsigned long old_error_bitmap = scrub_bitmap_read_error(stripe);</div><div class='ctx'> </div><div class='add'>+		scrub_stripe_submit_repair_read(stripe, mirror,</div><div class='add'>+						fs_info-&gt;sectorsize, true);</div><div class='add'>+		wait_scrub_stripe_io(stripe);</div><div class='add'>+		scrub_verify_one_stripe(stripe, old_error_bitmap);</div><div class='add'>+		if (scrub_bitmap_empty_error(stripe))</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='add'>+	error = scrub_bitmap_read_error(stripe);</div><div class='ctx'> 	/*</div><div class='del'>-	 * In scrub_pages() and scrub_pages_for_parity() we ensure each spage</div><div class='del'>-	 * only contains one sector of data.</div><div class='add'>+	 * Submit the repaired sectors.  For zoned case, we cannot do repair</div><div class='add'>+	 * in-place, but queue the bg to be relocated.</div><div class='ctx'> 	 */</div><div class='del'>-	crypto_shash_digest(shash, kaddr, fs_info-&gt;sectorsize, csum);</div><div class='add'>+	bitmap_andnot(&amp;repaired, &amp;errors.init_error_bitmap, &amp;error,</div><div class='add'>+		      stripe-&gt;nr_sectors);</div><div class='add'>+	if (!sctx-&gt;readonly &amp;&amp; !bitmap_empty(&amp;repaired, stripe-&gt;nr_sectors)) {</div><div class='add'>+		if (btrfs_is_zoned(fs_info)) {</div><div class='add'>+			btrfs_repair_one_zone(fs_info, sctx-&gt;stripes[0].bg-&gt;start);</div><div class='add'>+		} else {</div><div class='add'>+			scrub_write_sectors(sctx, stripe, repaired, false);</div><div class='add'>+			wait_scrub_stripe_io(stripe);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (memcmp(csum, spage-&gt;csum, fs_info-&gt;csum_size))</div><div class='del'>-		sblock-&gt;checksum_error = 1;</div><div class='del'>-	return sblock-&gt;checksum_error;</div><div class='add'>+	scrub_stripe_report_errors(sctx, stripe, &amp;errors);</div><div class='add'>+	set_bit(SCRUB_STRIPE_FLAG_REPAIR_DONE, &amp;stripe-&gt;state);</div><div class='add'>+	wake_up(&amp;stripe-&gt;repair_wait);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int scrub_checksum_tree_block(struct scrub_block *sblock)</div><div class='add'>+static void scrub_read_endio(struct btrfs_bio *bbio)</div><div class='ctx'> {</div><div class='del'>-	struct scrub_ctx *sctx = sblock-&gt;sctx;</div><div class='del'>-	struct btrfs_header *h;</div><div class='del'>-	struct btrfs_fs_info *fs_info = sctx-&gt;fs_info;</div><div class='del'>-	SHASH_DESC_ON_STACK(shash, fs_info-&gt;csum_shash);</div><div class='del'>-	u8 calculated_csum[BTRFS_CSUM_SIZE];</div><div class='del'>-	u8 on_disk_csum[BTRFS_CSUM_SIZE];</div><div class='del'>-	/*</div><div class='del'>-	 * This is done in sectorsize steps even for metadata as there's a</div><div class='del'>-	 * constraint for nodesize to be aligned to sectorsize. This will need</div><div class='del'>-	 * to change so we don't misuse data and metadata units like that.</div><div class='del'>-	 */</div><div class='del'>-	const u32 sectorsize = sctx-&gt;fs_info-&gt;sectorsize;</div><div class='del'>-	const int num_sectors = fs_info-&gt;nodesize &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='add'>+	struct scrub_stripe *stripe = bbio-&gt;private;</div><div class='add'>+	struct bio_vec *bvec;</div><div class='add'>+	int sector_nr = calc_sector_number(stripe, bio_first_bvec_all(&amp;bbio-&gt;bio));</div><div class='add'>+	int num_sectors;</div><div class='add'>+	u32 bio_size = 0;</div><div class='ctx'> 	int i;</div><div class='del'>-	struct scrub_page *spage;</div><div class='del'>-	char *kaddr;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(sblock-&gt;page_count &lt; 1);</div><div class='del'>-</div><div class='del'>-	/* Each member in pagev is just one block, not a full page */</div><div class='del'>-	ASSERT(sblock-&gt;page_count == num_sectors);</div><div class='del'>-</div><div class='del'>-	spage = sblock-&gt;pagev[0];</div><div class='del'>-	kaddr = page_address(spage-&gt;page);</div><div class='del'>-	h = (struct btrfs_header *)kaddr;</div><div class='del'>-	memcpy(on_disk_csum, h-&gt;csum, sctx-&gt;fs_info-&gt;csum_size);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * we don't use the getter functions here, as we</div><div class='del'>-	 * a) don't have an extent buffer and</div><div class='del'>-	 * b) the page is already kmapped</div><div class='del'>-	 */</div><div class='del'>-	if (spage-&gt;logical != btrfs_stack_header_bytenr(h))</div><div class='del'>-		sblock-&gt;header_error = 1;</div><div class='add'>+	ASSERT(sector_nr &lt; stripe-&gt;nr_sectors);</div><div class='add'>+	bio_for_each_bvec_all(bvec, &amp;bbio-&gt;bio, i)</div><div class='add'>+		bio_size += bvec-&gt;bv_len;</div><div class='add'>+	num_sectors = bio_size &gt;&gt; stripe-&gt;bg-&gt;fs_info-&gt;sectorsize_bits;</div><div class='ctx'> </div><div class='del'>-	if (spage-&gt;generation != btrfs_stack_header_generation(h)) {</div><div class='del'>-		sblock-&gt;header_error = 1;</div><div class='del'>-		sblock-&gt;generation_error = 1;</div><div class='add'>+	if (bbio-&gt;bio.bi_status) {</div><div class='add'>+		scrub_bitmap_set_io_error(stripe, sector_nr, num_sectors);</div><div class='add'>+		scrub_bitmap_set_error(stripe, sector_nr, num_sectors);</div><div class='add'>+	} else {</div><div class='add'>+		scrub_bitmap_clear_io_error(stripe, sector_nr, num_sectors);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	if (!scrub_check_fsid(h-&gt;fsid, spage))</div><div class='del'>-		sblock-&gt;header_error = 1;</div><div class='del'>-</div><div class='del'>-	if (memcmp(h-&gt;chunk_tree_uuid, fs_info-&gt;chunk_tree_uuid,</div><div class='del'>-		   BTRFS_UUID_SIZE))</div><div class='del'>-		sblock-&gt;header_error = 1;</div><div class='del'>-</div><div class='del'>-	shash-&gt;tfm = fs_info-&gt;csum_shash;</div><div class='del'>-	crypto_shash_init(shash);</div><div class='del'>-	crypto_shash_update(shash, kaddr + BTRFS_CSUM_SIZE,</div><div class='del'>-			    sectorsize - BTRFS_CSUM_SIZE);</div><div class='del'>-</div><div class='del'>-	for (i = 1; i &lt; num_sectors; i++) {</div><div class='del'>-		kaddr = page_address(sblock-&gt;pagev[i]-&gt;page);</div><div class='del'>-		crypto_shash_update(shash, kaddr, sectorsize);</div><div class='add'>+	bio_put(&amp;bbio-&gt;bio);</div><div class='add'>+	if (atomic_dec_and_test(&amp;stripe-&gt;pending_io)) {</div><div class='add'>+		wake_up(&amp;stripe-&gt;io_wait);</div><div class='add'>+		INIT_WORK(&amp;stripe-&gt;work, scrub_stripe_read_repair_worker);</div><div class='add'>+		queue_work(stripe-&gt;bg-&gt;fs_info-&gt;scrub_workers, &amp;stripe-&gt;work);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	crypto_shash_final(shash, calculated_csum);</div><div class='del'>-	if (memcmp(calculated_csum, on_disk_csum, sctx-&gt;fs_info-&gt;csum_size))</div><div class='del'>-		sblock-&gt;checksum_error = 1;</div><div class='del'>-</div><div class='del'>-	return sblock-&gt;header_error || sblock-&gt;checksum_error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int scrub_checksum_super(struct scrub_block *sblock)</div><div class='add'>+static void scrub_write_endio(struct btrfs_bio *bbio)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_super_block *s;</div><div class='del'>-	struct scrub_ctx *sctx = sblock-&gt;sctx;</div><div class='del'>-	struct btrfs_fs_info *fs_info = sctx-&gt;fs_info;</div><div class='del'>-	SHASH_DESC_ON_STACK(shash, fs_info-&gt;csum_shash);</div><div class='del'>-	u8 calculated_csum[BTRFS_CSUM_SIZE];</div><div class='del'>-	struct scrub_page *spage;</div><div class='del'>-	char *kaddr;</div><div class='del'>-	int fail_gen = 0;</div><div class='del'>-	int fail_cor = 0;</div><div class='del'>-</div><div class='del'>-	BUG_ON(sblock-&gt;page_count &lt; 1);</div><div class='del'>-	spage = sblock-&gt;pagev[0];</div><div class='del'>-	kaddr = page_address(spage-&gt;page);</div><div class='del'>-	s = (struct btrfs_super_block *)kaddr;</div><div class='del'>-</div><div class='del'>-	if (spage-&gt;logical != btrfs_super_bytenr(s))</div><div class='del'>-		++fail_cor;</div><div class='del'>-</div><div class='del'>-	if (spage-&gt;generation != btrfs_super_generation(s))</div><div class='del'>-		++fail_gen;</div><div class='add'>+	struct scrub_stripe *stripe = bbio-&gt;private;</div><div class='add'>+	struct btrfs_fs_info *fs_info = stripe-&gt;bg-&gt;fs_info;</div><div class='add'>+	struct bio_vec *bvec;</div><div class='add'>+	int sector_nr = calc_sector_number(stripe, bio_first_bvec_all(&amp;bbio-&gt;bio));</div><div class='add'>+	u32 bio_size = 0;</div><div class='add'>+	int i;</div><div class='ctx'> </div><div class='del'>-	if (!scrub_check_fsid(s-&gt;fsid, spage))</div><div class='del'>-		++fail_cor;</div><div class='add'>+	bio_for_each_bvec_all(bvec, &amp;bbio-&gt;bio, i)</div><div class='add'>+		bio_size += bvec-&gt;bv_len;</div><div class='ctx'> </div><div class='del'>-	shash-&gt;tfm = fs_info-&gt;csum_shash;</div><div class='del'>-	crypto_shash_init(shash);</div><div class='del'>-	crypto_shash_digest(shash, kaddr + BTRFS_CSUM_SIZE,</div><div class='del'>-			BTRFS_SUPER_INFO_SIZE - BTRFS_CSUM_SIZE, calculated_csum);</div><div class='add'>+	if (bbio-&gt;bio.bi_status) {</div><div class='add'>+		unsigned long flags;</div><div class='ctx'> </div><div class='del'>-	if (memcmp(calculated_csum, s-&gt;csum, sctx-&gt;fs_info-&gt;csum_size))</div><div class='del'>-		++fail_cor;</div><div class='del'>-</div><div class='del'>-	if (fail_cor + fail_gen) {</div><div class='del'>-		/*</div><div class='del'>-		 * if we find an error in a super block, we just report it.</div><div class='del'>-		 * They will get written with the next transaction commit</div><div class='del'>-		 * anyway</div><div class='del'>-		 */</div><div class='del'>-		spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		++sctx-&gt;stat.super_errors;</div><div class='del'>-		spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		if (fail_cor)</div><div class='del'>-			btrfs_dev_stat_inc_and_print(spage-&gt;dev,</div><div class='del'>-				BTRFS_DEV_STAT_CORRUPTION_ERRS);</div><div class='del'>-		else</div><div class='del'>-			btrfs_dev_stat_inc_and_print(spage-&gt;dev,</div><div class='del'>-				BTRFS_DEV_STAT_GENERATION_ERRS);</div><div class='add'>+		spin_lock_irqsave(&amp;stripe-&gt;write_error_lock, flags);</div><div class='add'>+		bitmap_set(&amp;stripe-&gt;write_error_bitmap, sector_nr,</div><div class='add'>+			   bio_size &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+		spin_unlock_irqrestore(&amp;stripe-&gt;write_error_lock, flags);</div><div class='add'>+		for (i = 0; i &lt; (bio_size &gt;&gt; fs_info-&gt;sectorsize_bits); i++)</div><div class='add'>+			btrfs_dev_stat_inc_and_print(stripe-&gt;dev,</div><div class='add'>+						     BTRFS_DEV_STAT_WRITE_ERRS);</div><div class='ctx'> 	}</div><div class='add'>+	bio_put(&amp;bbio-&gt;bio);</div><div class='ctx'> </div><div class='del'>-	return fail_cor + fail_gen;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void scrub_block_get(struct scrub_block *sblock)</div><div class='del'>-{</div><div class='del'>-	refcount_inc(&amp;sblock-&gt;refs);</div><div class='add'>+	if (atomic_dec_and_test(&amp;stripe-&gt;pending_io))</div><div class='add'>+		wake_up(&amp;stripe-&gt;io_wait);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void scrub_block_put(struct scrub_block *sblock)</div><div class='add'>+static void scrub_submit_write_bio(struct scrub_ctx *sctx,</div><div class='add'>+				   struct scrub_stripe *stripe,</div><div class='add'>+				   struct btrfs_bio *bbio, bool dev_replace)</div><div class='ctx'> {</div><div class='del'>-	if (refcount_dec_and_test(&amp;sblock-&gt;refs)) {</div><div class='del'>-		int i;</div><div class='add'>+	struct btrfs_fs_info *fs_info = sctx-&gt;fs_info;</div><div class='add'>+	u32 bio_len = bbio-&gt;bio.bi_iter.bi_size;</div><div class='add'>+	u32 bio_off = (bbio-&gt;bio.bi_iter.bi_sector &lt;&lt; SECTOR_SHIFT) -</div><div class='add'>+		      stripe-&gt;logical;</div><div class='ctx'> </div><div class='del'>-		if (sblock-&gt;sparity)</div><div class='del'>-			scrub_parity_put(sblock-&gt;sparity);</div><div class='add'>+	fill_writer_pointer_gap(sctx, stripe-&gt;physical + bio_off);</div><div class='add'>+	atomic_inc(&amp;stripe-&gt;pending_io);</div><div class='add'>+	btrfs_submit_repair_write(bbio, stripe-&gt;mirror_num, dev_replace);</div><div class='add'>+	if (!btrfs_is_zoned(fs_info))</div><div class='add'>+		return;</div><div class='add'>+	/*</div><div class='add'>+	 * For zoned writeback, queue depth must be 1, thus we must wait for</div><div class='add'>+	 * the write to finish before the next write.</div><div class='add'>+	 */</div><div class='add'>+	wait_scrub_stripe_io(stripe);</div><div class='ctx'> </div><div class='del'>-		for (i = 0; i &lt; sblock-&gt;page_count; i++)</div><div class='del'>-			scrub_page_put(sblock-&gt;pagev[i]);</div><div class='del'>-		kfree(sblock);</div><div class='del'>-	}</div><div class='add'>+	/*</div><div class='add'>+	 * And also need to update the write pointer if write finished</div><div class='add'>+	 * successfully.</div><div class='add'>+	 */</div><div class='add'>+	if (!test_bit(bio_off &gt;&gt; fs_info-&gt;sectorsize_bits,</div><div class='add'>+		      &amp;stripe-&gt;write_error_bitmap))</div><div class='add'>+		sctx-&gt;write_pointer += bio_len;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void scrub_page_get(struct scrub_page *spage)</div><div class='add'>+/*</div><div class='add'>+ * Submit the write bio(s) for the sectors specified by @write_bitmap.</div><div class='add'>+ *</div><div class='add'>+ * Here we utilize btrfs_submit_repair_write(), which has some extra benefits:</div><div class='add'>+ *</div><div class='add'>+ * - Only needs logical bytenr and mirror_num</div><div class='add'>+ *   Just like the scrub read path</div><div class='add'>+ *</div><div class='add'>+ * - Would only result in writes to the specified mirror</div><div class='add'>+ *   Unlike the regular writeback path, which would write back to all stripes</div><div class='add'>+ *</div><div class='add'>+ * - Handle dev-replace and read-repair writeback differently</div><div class='add'>+ */</div><div class='add'>+static void scrub_write_sectors(struct scrub_ctx *sctx, struct scrub_stripe *stripe,</div><div class='add'>+				unsigned long write_bitmap, bool dev_replace)</div><div class='ctx'> {</div><div class='del'>-	atomic_inc(&amp;spage-&gt;refs);</div><div class='del'>-}</div><div class='add'>+	struct btrfs_fs_info *fs_info = stripe-&gt;bg-&gt;fs_info;</div><div class='add'>+	struct btrfs_bio *bbio = NULL;</div><div class='add'>+	int sector_nr;</div><div class='ctx'> </div><div class='del'>-static void scrub_page_put(struct scrub_page *spage)</div><div class='del'>-{</div><div class='del'>-	if (atomic_dec_and_test(&amp;spage-&gt;refs)) {</div><div class='del'>-		if (spage-&gt;page)</div><div class='del'>-			__free_page(spage-&gt;page);</div><div class='del'>-		kfree(spage);</div><div class='add'>+	for_each_set_bit(sector_nr, &amp;write_bitmap, stripe-&gt;nr_sectors) {</div><div class='add'>+		/* We should only writeback sectors covered by an extent. */</div><div class='add'>+		ASSERT(scrub_bitmap_test_bit_has_extent(stripe, sector_nr));</div><div class='add'>+</div><div class='add'>+		/* Cannot merge with previous sector, submit the current one. */</div><div class='add'>+		if (bbio &amp;&amp; sector_nr &amp;&amp; !test_bit(sector_nr - 1, &amp;write_bitmap)) {</div><div class='add'>+			scrub_submit_write_bio(sctx, stripe, bbio, dev_replace);</div><div class='add'>+			bbio = NULL;</div><div class='add'>+		}</div><div class='add'>+		if (!bbio)</div><div class='add'>+			bbio = alloc_scrub_bbio(fs_info, stripe-&gt;nr_sectors, REQ_OP_WRITE,</div><div class='add'>+					stripe-&gt;logical + (sector_nr &lt;&lt; fs_info-&gt;sectorsize_bits),</div><div class='add'>+					scrub_write_endio, stripe);</div><div class='add'>+		scrub_bio_add_sector(bbio, stripe, sector_nr);</div><div class='ctx'> 	}</div><div class='add'>+	if (bbio)</div><div class='add'>+		scrub_submit_write_bio(sctx, stripe, bbio, dev_replace);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Throttling of IO submission, bandwidth-limit based, the timeslice is 1</div><div class='ctx'>  * second.  Limit can be set via /sys/fs/UUID/devinfo/devid/scrub_speed_max.</div><div class='ctx'>  */</div><div class='del'>-static void scrub_throttle(struct scrub_ctx *sctx)</div><div class='add'>+static void scrub_throttle_dev_io(struct scrub_ctx *sctx, struct btrfs_device *device,</div><div class='add'>+				  unsigned int bio_size)</div><div class='ctx'> {</div><div class='ctx'> 	const int time_slice = 1000;</div><div class='del'>-	struct scrub_bio *sbio;</div><div class='del'>-	struct btrfs_device *device;</div><div class='ctx'> 	s64 delta;</div><div class='ctx'> 	ktime_t now;</div><div class='ctx'> 	u32 div;</div><div class='ctx'> 	u64 bwlimit;</div><div class='ctx'> </div><div class='del'>-	sbio = sctx-&gt;bios[sctx-&gt;curr];</div><div class='del'>-	device = sbio-&gt;dev;</div><div class='ctx'> 	bwlimit = READ_ONCE(device-&gt;scrub_speed_max);</div><div class='ctx'> 	if (bwlimit == 0)</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -2017,8 +1395,7 @@ static void scrub_throttle(struct scrub_ctx *sctx)</div><div class='ctx'> 	 * Slice is divided into intervals when the IO is submitted, adjust by</div><div class='ctx'> 	 * bwlimit and maximum of 64 intervals.</div><div class='ctx'> 	 */</div><div class='del'>-	div = max_t(u32, 1, (u32)(bwlimit / (16 * 1024 * 1024)));</div><div class='del'>-	div = min_t(u32, 64, div);</div><div class='add'>+	div = clamp(bwlimit / (16 * 1024 * 1024), 1, 64);</div><div class='ctx'> </div><div class='ctx'> 	/* Start new epoch, set deadline */</div><div class='ctx'> 	now = ktime_get();</div><div class='hunk'>@@ -2030,7 +1407,7 @@ static void scrub_throttle(struct scrub_ctx *sctx)</div><div class='ctx'> 	/* Still in the time to send? */</div><div class='ctx'> 	if (ktime_before(now, sctx-&gt;throttle_deadline)) {</div><div class='ctx'> 		/* If current bio is within the limit, send it */</div><div class='del'>-		sctx-&gt;throttle_sent += sbio-&gt;bio-&gt;bi_iter.bi_size;</div><div class='add'>+		sctx-&gt;throttle_sent += bio_size;</div><div class='ctx'> 		if (sctx-&gt;throttle_sent &lt;= div_u64(bwlimit, div))</div><div class='ctx'> 			return;</div><div class='ctx'> </div><div class='hunk'>@@ -2052,1522 +1429,1177 @@ static void scrub_throttle(struct scrub_ctx *sctx)</div><div class='ctx'> 	sctx-&gt;throttle_deadline = 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void scrub_submit(struct scrub_ctx *sctx)</div><div class='add'>+/*</div><div class='add'>+ * Given a physical address, this will calculate it's</div><div class='add'>+ * logical offset. if this is a parity stripe, it will return</div><div class='add'>+ * the most left data stripe's logical offset.</div><div class='add'>+ *</div><div class='add'>+ * return 0 if it is a data stripe, 1 means parity stripe.</div><div class='add'>+ */</div><div class='add'>+static int get_raid56_logic_offset(u64 physical, int num,</div><div class='add'>+				   struct btrfs_chunk_map *map, u64 *offset,</div><div class='add'>+				   u64 *stripe_start)</div><div class='ctx'> {</div><div class='del'>-	struct scrub_bio *sbio;</div><div class='del'>-</div><div class='del'>-	if (sctx-&gt;curr == -1)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	scrub_throttle(sctx);</div><div class='add'>+	int i;</div><div class='add'>+	int j = 0;</div><div class='add'>+	u64 last_offset;</div><div class='add'>+	const int data_stripes = nr_data_stripes(map);</div><div class='ctx'> </div><div class='del'>-	sbio = sctx-&gt;bios[sctx-&gt;curr];</div><div class='del'>-	sctx-&gt;curr = -1;</div><div class='del'>-	scrub_pending_bio_inc(sctx);</div><div class='del'>-	btrfsic_submit_bio(sbio-&gt;bio);</div><div class='del'>-}</div><div class='add'>+	last_offset = (physical - map-&gt;stripes[num].physical) * data_stripes;</div><div class='add'>+	if (stripe_start)</div><div class='add'>+		*stripe_start = last_offset;</div><div class='ctx'> </div><div class='del'>-static int scrub_add_page_to_rd_bio(struct scrub_ctx *sctx,</div><div class='del'>-				    struct scrub_page *spage)</div><div class='del'>-{</div><div class='del'>-	struct scrub_block *sblock = spage-&gt;sblock;</div><div class='del'>-	struct scrub_bio *sbio;</div><div class='del'>-	const u32 sectorsize = sctx-&gt;fs_info-&gt;sectorsize;</div><div class='del'>-	int ret;</div><div class='add'>+	*offset = last_offset;</div><div class='add'>+	for (i = 0; i &lt; data_stripes; i++) {</div><div class='add'>+		u32 stripe_nr;</div><div class='add'>+		u32 stripe_index;</div><div class='add'>+		u32 rot;</div><div class='ctx'> </div><div class='del'>-again:</div><div class='del'>-	/*</div><div class='del'>-	 * grab a fresh bio or wait for one to become available</div><div class='del'>-	 */</div><div class='del'>-	while (sctx-&gt;curr == -1) {</div><div class='del'>-		spin_lock(&amp;sctx-&gt;list_lock);</div><div class='del'>-		sctx-&gt;curr = sctx-&gt;first_free;</div><div class='del'>-		if (sctx-&gt;curr != -1) {</div><div class='del'>-			sctx-&gt;first_free = sctx-&gt;bios[sctx-&gt;curr]-&gt;next_free;</div><div class='del'>-			sctx-&gt;bios[sctx-&gt;curr]-&gt;next_free = -1;</div><div class='del'>-			sctx-&gt;bios[sctx-&gt;curr]-&gt;page_count = 0;</div><div class='del'>-			spin_unlock(&amp;sctx-&gt;list_lock);</div><div class='del'>-		} else {</div><div class='del'>-			spin_unlock(&amp;sctx-&gt;list_lock);</div><div class='del'>-			wait_event(sctx-&gt;list_wait, sctx-&gt;first_free != -1);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	sbio = sctx-&gt;bios[sctx-&gt;curr];</div><div class='del'>-	if (sbio-&gt;page_count == 0) {</div><div class='del'>-		struct bio *bio;</div><div class='del'>-</div><div class='del'>-		sbio-&gt;physical = spage-&gt;physical;</div><div class='del'>-		sbio-&gt;logical = spage-&gt;logical;</div><div class='del'>-		sbio-&gt;dev = spage-&gt;dev;</div><div class='del'>-		bio = sbio-&gt;bio;</div><div class='del'>-		if (!bio) {</div><div class='del'>-			bio = btrfs_bio_alloc(sctx-&gt;pages_per_rd_bio);</div><div class='del'>-			sbio-&gt;bio = bio;</div><div class='del'>-		}</div><div class='add'>+		*offset = last_offset + btrfs_stripe_nr_to_offset(i);</div><div class='ctx'> </div><div class='del'>-		bio-&gt;bi_private = sbio;</div><div class='del'>-		bio-&gt;bi_end_io = scrub_bio_end_io;</div><div class='del'>-		bio_set_dev(bio, sbio-&gt;dev-&gt;bdev);</div><div class='del'>-		bio-&gt;bi_iter.bi_sector = sbio-&gt;physical &gt;&gt; 9;</div><div class='del'>-		bio-&gt;bi_opf = REQ_OP_READ;</div><div class='del'>-		sbio-&gt;status = 0;</div><div class='del'>-	} else if (sbio-&gt;physical + sbio-&gt;page_count * sectorsize !=</div><div class='del'>-		   spage-&gt;physical ||</div><div class='del'>-		   sbio-&gt;logical + sbio-&gt;page_count * sectorsize !=</div><div class='del'>-		   spage-&gt;logical ||</div><div class='del'>-		   sbio-&gt;dev != spage-&gt;dev) {</div><div class='del'>-		scrub_submit(sctx);</div><div class='del'>-		goto again;</div><div class='del'>-	}</div><div class='add'>+		stripe_nr = (u32)(*offset &gt;&gt; BTRFS_STRIPE_LEN_SHIFT) / data_stripes;</div><div class='ctx'> </div><div class='del'>-	sbio-&gt;pagev[sbio-&gt;page_count] = spage;</div><div class='del'>-	ret = bio_add_page(sbio-&gt;bio, spage-&gt;page, sectorsize, 0);</div><div class='del'>-	if (ret != sectorsize) {</div><div class='del'>-		if (sbio-&gt;page_count &lt; 1) {</div><div class='del'>-			bio_put(sbio-&gt;bio);</div><div class='del'>-			sbio-&gt;bio = NULL;</div><div class='del'>-			return -EIO;</div><div class='del'>-		}</div><div class='del'>-		scrub_submit(sctx);</div><div class='del'>-		goto again;</div><div class='add'>+		/* Work out the disk rotation on this stripe-set */</div><div class='add'>+		rot = stripe_nr % map-&gt;num_stripes;</div><div class='add'>+		/* calculate which stripe this data locates */</div><div class='add'>+		rot += i;</div><div class='add'>+		stripe_index = rot % map-&gt;num_stripes;</div><div class='add'>+		if (stripe_index == num)</div><div class='add'>+			return 0;</div><div class='add'>+		if (stripe_index &lt; num)</div><div class='add'>+			j++;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	scrub_block_get(sblock); /* one for the page added to the bio */</div><div class='del'>-	atomic_inc(&amp;sblock-&gt;outstanding_pages);</div><div class='del'>-	sbio-&gt;page_count++;</div><div class='del'>-	if (sbio-&gt;page_count == sctx-&gt;pages_per_rd_bio)</div><div class='del'>-		scrub_submit(sctx);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='add'>+	*offset = last_offset + btrfs_stripe_nr_to_offset(j);</div><div class='add'>+	return 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void scrub_missing_raid56_end_io(struct bio *bio)</div><div class='add'>+/*</div><div class='add'>+ * Return 0 if the extent item range covers any byte of the range.</div><div class='add'>+ * Return &lt;0 if the extent item is before @search_start.</div><div class='add'>+ * Return &gt;0 if the extent item is after @start_start + @search_len.</div><div class='add'>+ */</div><div class='add'>+static int compare_extent_item_range(struct btrfs_path *path,</div><div class='add'>+				     u64 search_start, u64 search_len)</div><div class='ctx'> {</div><div class='del'>-	struct scrub_block *sblock = bio-&gt;bi_private;</div><div class='del'>-	struct btrfs_fs_info *fs_info = sblock-&gt;sctx-&gt;fs_info;</div><div class='del'>-</div><div class='del'>-	if (bio-&gt;bi_status)</div><div class='del'>-		sblock-&gt;no_io_error_seen = 0;</div><div class='add'>+	struct btrfs_fs_info *fs_info = path-&gt;nodes[0]-&gt;fs_info;</div><div class='add'>+	u64 len;</div><div class='add'>+	struct btrfs_key key;</div><div class='ctx'> </div><div class='del'>-	bio_put(bio);</div><div class='add'>+	btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, path-&gt;slots[0]);</div><div class='add'>+	ASSERT(key.type == BTRFS_EXTENT_ITEM_KEY ||</div><div class='add'>+	       key.type == BTRFS_METADATA_ITEM_KEY, "key.type=%u", key.type);</div><div class='add'>+	if (key.type == BTRFS_METADATA_ITEM_KEY)</div><div class='add'>+		len = fs_info-&gt;nodesize;</div><div class='add'>+	else</div><div class='add'>+		len = key.offset;</div><div class='ctx'> </div><div class='del'>-	btrfs_queue_work(fs_info-&gt;scrub_workers, &amp;sblock-&gt;work);</div><div class='add'>+	if (key.objectid + len &lt;= search_start)</div><div class='add'>+		return -1;</div><div class='add'>+	if (key.objectid &gt;= search_start + search_len)</div><div class='add'>+		return 1;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void scrub_missing_raid56_worker(struct btrfs_work *work)</div><div class='add'>+/*</div><div class='add'>+ * Locate one extent item which covers any byte in range</div><div class='add'>+ * [@search_start, @search_start + @search_length)</div><div class='add'>+ *</div><div class='add'>+ * If the path is not initialized, we will initialize the search by doing</div><div class='add'>+ * a btrfs_search_slot().</div><div class='add'>+ * If the path is already initialized, we will use the path as the initial</div><div class='add'>+ * slot, to avoid duplicated btrfs_search_slot() calls.</div><div class='add'>+ *</div><div class='add'>+ * NOTE: If an extent item starts before @search_start, we will still</div><div class='add'>+ * return the extent item. This is for data extent crossing stripe boundary.</div><div class='add'>+ *</div><div class='add'>+ * Return 0 if we found such extent item, and @path will point to the extent item.</div><div class='add'>+ * Return &gt;0 if no such extent item can be found, and @path will be released.</div><div class='add'>+ * Return &lt;0 if hit fatal error, and @path will be released.</div><div class='add'>+ */</div><div class='add'>+static int find_first_extent_item(struct btrfs_root *extent_root,</div><div class='add'>+				  struct btrfs_path *path,</div><div class='add'>+				  u64 search_start, u64 search_len)</div><div class='ctx'> {</div><div class='del'>-	struct scrub_block *sblock = container_of(work, struct scrub_block, work);</div><div class='del'>-	struct scrub_ctx *sctx = sblock-&gt;sctx;</div><div class='del'>-	struct btrfs_fs_info *fs_info = sctx-&gt;fs_info;</div><div class='del'>-	u64 logical;</div><div class='del'>-	struct btrfs_device *dev;</div><div class='add'>+	struct btrfs_fs_info *fs_info = extent_root-&gt;fs_info;</div><div class='add'>+	struct btrfs_key key;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	logical = sblock-&gt;pagev[0]-&gt;logical;</div><div class='del'>-	dev = sblock-&gt;pagev[0]-&gt;dev;</div><div class='add'>+	/* Continue using the existing path */</div><div class='add'>+	if (path-&gt;nodes[0])</div><div class='add'>+		goto search_forward;</div><div class='ctx'> </div><div class='del'>-	if (sblock-&gt;no_io_error_seen)</div><div class='del'>-		scrub_recheck_block_checksum(sblock);</div><div class='add'>+	key.objectid = search_start;</div><div class='add'>+	if (btrfs_fs_incompat(fs_info, SKINNY_METADATA))</div><div class='add'>+		key.type = BTRFS_METADATA_ITEM_KEY;</div><div class='add'>+	else</div><div class='add'>+		key.type = BTRFS_EXTENT_ITEM_KEY;</div><div class='add'>+	key.offset = (u64)-1;</div><div class='ctx'> </div><div class='del'>-	if (!sblock-&gt;no_io_error_seen) {</div><div class='del'>-		spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		sctx-&gt;stat.read_errors++;</div><div class='del'>-		spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		btrfs_err_rl_in_rcu(fs_info,</div><div class='del'>-			"IO error rebuilding logical %llu for dev %s",</div><div class='del'>-			logical, rcu_str_deref(dev-&gt;name));</div><div class='del'>-	} else if (sblock-&gt;header_error || sblock-&gt;checksum_error) {</div><div class='del'>-		spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		sctx-&gt;stat.uncorrectable_errors++;</div><div class='del'>-		spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		btrfs_err_rl_in_rcu(fs_info,</div><div class='del'>-			"failed to rebuild valid logical %llu for dev %s",</div><div class='del'>-			logical, rcu_str_deref(dev-&gt;name));</div><div class='del'>-	} else {</div><div class='del'>-		scrub_write_block_to_dev_replace(sblock);</div><div class='add'>+	ret = btrfs_search_slot(NULL, extent_root, &amp;key, path, 0, 0);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+	if (unlikely(ret == 0)) {</div><div class='add'>+		/*</div><div class='add'>+		 * Key with offset -1 found, there would have to exist an extent</div><div class='add'>+		 * item with such offset, but this is out of the valid range.</div><div class='add'>+		 */</div><div class='add'>+		btrfs_release_path(path);</div><div class='add'>+		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (sctx-&gt;is_dev_replace &amp;&amp; sctx-&gt;flush_all_writes) {</div><div class='del'>-		mutex_lock(&amp;sctx-&gt;wr_lock);</div><div class='del'>-		scrub_wr_submit(sctx);</div><div class='del'>-		mutex_unlock(&amp;sctx-&gt;wr_lock);</div><div class='add'>+	/*</div><div class='add'>+	 * Here we intentionally pass 0 as @min_objectid, as there could be</div><div class='add'>+	 * an extent item starting before @search_start.</div><div class='add'>+	 */</div><div class='add'>+	ret = btrfs_previous_extent_item(extent_root, path, 0);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+	/*</div><div class='add'>+	 * No matter whether we have found an extent item, the next loop will</div><div class='add'>+	 * properly do every check on the key.</div><div class='add'>+	 */</div><div class='add'>+search_forward:</div><div class='add'>+	while (true) {</div><div class='add'>+		btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, path-&gt;slots[0]);</div><div class='add'>+		if (key.objectid &gt;= search_start + search_len)</div><div class='add'>+			break;</div><div class='add'>+		if (key.type != BTRFS_METADATA_ITEM_KEY &amp;&amp;</div><div class='add'>+		    key.type != BTRFS_EXTENT_ITEM_KEY)</div><div class='add'>+			goto next;</div><div class='add'>+</div><div class='add'>+		ret = compare_extent_item_range(path, search_start, search_len);</div><div class='add'>+		if (ret == 0)</div><div class='add'>+			return ret;</div><div class='add'>+		if (ret &gt; 0)</div><div class='add'>+			break;</div><div class='add'>+next:</div><div class='add'>+		ret = btrfs_next_item(extent_root, path);</div><div class='add'>+		if (ret) {</div><div class='add'>+			/* Either no more items or a fatal error. */</div><div class='add'>+			btrfs_release_path(path);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='add'>+	btrfs_release_path(path);</div><div class='add'>+	return 1;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void get_extent_info(struct btrfs_path *path, u64 *extent_start_ret,</div><div class='add'>+			    u64 *size_ret, u64 *flags_ret, u64 *generation_ret)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_key key;</div><div class='add'>+	struct btrfs_extent_item *ei;</div><div class='ctx'> </div><div class='del'>-	scrub_block_put(sblock);</div><div class='del'>-	scrub_pending_bio_dec(sctx);</div><div class='add'>+	btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, path-&gt;slots[0]);</div><div class='add'>+	ASSERT(key.type == BTRFS_METADATA_ITEM_KEY ||</div><div class='add'>+	       key.type == BTRFS_EXTENT_ITEM_KEY, "key.type=%u", key.type);</div><div class='add'>+	*extent_start_ret = key.objectid;</div><div class='add'>+	if (key.type == BTRFS_METADATA_ITEM_KEY)</div><div class='add'>+		*size_ret = path-&gt;nodes[0]-&gt;fs_info-&gt;nodesize;</div><div class='add'>+	else</div><div class='add'>+		*size_ret = key.offset;</div><div class='add'>+	ei = btrfs_item_ptr(path-&gt;nodes[0], path-&gt;slots[0], struct btrfs_extent_item);</div><div class='add'>+	*flags_ret = btrfs_extent_flags(path-&gt;nodes[0], ei);</div><div class='add'>+	*generation_ret = btrfs_extent_generation(path-&gt;nodes[0], ei);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void scrub_missing_raid56_pages(struct scrub_block *sblock)</div><div class='add'>+static int sync_write_pointer_for_zoned(struct scrub_ctx *sctx, u64 logical,</div><div class='add'>+					u64 physical, u64 physical_end)</div><div class='ctx'> {</div><div class='del'>-	struct scrub_ctx *sctx = sblock-&gt;sctx;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = sctx-&gt;fs_info;</div><div class='del'>-	u64 length = sblock-&gt;page_count * PAGE_SIZE;</div><div class='del'>-	u64 logical = sblock-&gt;pagev[0]-&gt;logical;</div><div class='del'>-	struct btrfs_io_context *bioc = NULL;</div><div class='del'>-	struct bio *bio;</div><div class='del'>-	struct btrfs_raid_bio *rbio;</div><div class='del'>-	int ret;</div><div class='del'>-	int i;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	btrfs_bio_counter_inc_blocked(fs_info);</div><div class='del'>-	ret = btrfs_map_sblock(fs_info, BTRFS_MAP_GET_READ_MIRRORS, logical,</div><div class='del'>-			       &amp;length, &amp;bioc);</div><div class='del'>-	if (ret || !bioc || !bioc-&gt;raid_map)</div><div class='del'>-		goto bioc_out;</div><div class='add'>+	if (!btrfs_is_zoned(fs_info))</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	if (WARN_ON(!sctx-&gt;is_dev_replace ||</div><div class='del'>-		    !(bioc-&gt;map_type &amp; BTRFS_BLOCK_GROUP_RAID56_MASK))) {</div><div class='del'>-		/*</div><div class='del'>-		 * We shouldn't be scrubbing a missing device. Even for dev</div><div class='del'>-		 * replace, we should only get here for RAID 5/6. We either</div><div class='del'>-		 * managed to mount something with no mirrors remaining or</div><div class='del'>-		 * there's a bug in scrub_remap_extent()/btrfs_map_block().</div><div class='del'>-		 */</div><div class='del'>-		goto bioc_out;</div><div class='add'>+	mutex_lock(&amp;sctx-&gt;wr_lock);</div><div class='add'>+	if (sctx-&gt;write_pointer &lt; physical_end) {</div><div class='add'>+		ret = btrfs_sync_zone_write_pointer(sctx-&gt;wr_tgtdev, logical,</div><div class='add'>+						    physical,</div><div class='add'>+						    sctx-&gt;write_pointer);</div><div class='add'>+		if (ret)</div><div class='add'>+			btrfs_err(fs_info, "scrub: zoned: failed to recover write pointer");</div><div class='ctx'> 	}</div><div class='add'>+	mutex_unlock(&amp;sctx-&gt;wr_lock);</div><div class='add'>+	btrfs_dev_clear_zone_empty(sctx-&gt;wr_tgtdev, physical);</div><div class='ctx'> </div><div class='del'>-	bio = btrfs_bio_alloc(BIO_MAX_VECS);</div><div class='del'>-	bio-&gt;bi_iter.bi_sector = logical &gt;&gt; 9;</div><div class='del'>-	bio-&gt;bi_private = sblock;</div><div class='del'>-	bio-&gt;bi_end_io = scrub_missing_raid56_end_io;</div><div class='del'>-</div><div class='del'>-	rbio = raid56_alloc_missing_rbio(bio, bioc, length);</div><div class='del'>-	if (!rbio)</div><div class='del'>-		goto rbio_out;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; sblock-&gt;page_count; i++) {</div><div class='del'>-		struct scrub_page *spage = sblock-&gt;pagev[i];</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		raid56_add_scrub_pages(rbio, spage-&gt;page, spage-&gt;logical);</div><div class='add'>+static void fill_one_extent_info(struct btrfs_fs_info *fs_info,</div><div class='add'>+				 struct scrub_stripe *stripe,</div><div class='add'>+				 u64 extent_start, u64 extent_len,</div><div class='add'>+				 u64 extent_flags, u64 extent_gen)</div><div class='add'>+{</div><div class='add'>+	for (u64 cur_logical = max(stripe-&gt;logical, extent_start);</div><div class='add'>+	     cur_logical &lt; min(stripe-&gt;logical + BTRFS_STRIPE_LEN,</div><div class='add'>+			       extent_start + extent_len);</div><div class='add'>+	     cur_logical += fs_info-&gt;sectorsize) {</div><div class='add'>+		const int nr_sector = (cur_logical - stripe-&gt;logical) &gt;&gt;</div><div class='add'>+				      fs_info-&gt;sectorsize_bits;</div><div class='add'>+		struct scrub_sector_verification *sector =</div><div class='add'>+						&amp;stripe-&gt;sectors[nr_sector];</div><div class='add'>+</div><div class='add'>+		scrub_bitmap_set_bit_has_extent(stripe, nr_sector);</div><div class='add'>+		if (extent_flags &amp; BTRFS_EXTENT_FLAG_TREE_BLOCK) {</div><div class='add'>+			scrub_bitmap_set_bit_is_metadata(stripe, nr_sector);</div><div class='add'>+			sector-&gt;generation = extent_gen;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	btrfs_init_work(&amp;sblock-&gt;work, scrub_missing_raid56_worker, NULL, NULL);</div><div class='del'>-	scrub_block_get(sblock);</div><div class='del'>-	scrub_pending_bio_inc(sctx);</div><div class='del'>-	raid56_submit_missing_rbio(rbio);</div><div class='del'>-	return;</div><div class='del'>-</div><div class='del'>-rbio_out:</div><div class='del'>-	bio_put(bio);</div><div class='del'>-bioc_out:</div><div class='del'>-	btrfs_bio_counter_dec(fs_info);</div><div class='del'>-	btrfs_put_bioc(bioc);</div><div class='del'>-	spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-	sctx-&gt;stat.malloc_errors++;</div><div class='del'>-	spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int scrub_pages(struct scrub_ctx *sctx, u64 logical, u32 len,</div><div class='del'>-		       u64 physical, struct btrfs_device *dev, u64 flags,</div><div class='del'>-		       u64 gen, int mirror_num, u8 *csum,</div><div class='del'>-		       u64 physical_for_dev_replace)</div><div class='add'>+static void scrub_stripe_reset_bitmaps(struct scrub_stripe *stripe)</div><div class='ctx'> {</div><div class='del'>-	struct scrub_block *sblock;</div><div class='del'>-	const u32 sectorsize = sctx-&gt;fs_info-&gt;sectorsize;</div><div class='del'>-	int index;</div><div class='add'>+	ASSERT(stripe-&gt;nr_sectors);</div><div class='add'>+	bitmap_zero(stripe-&gt;bitmaps, scrub_bitmap_nr_last * stripe-&gt;nr_sectors);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	sblock = kzalloc(sizeof(*sblock), GFP_KERNEL);</div><div class='del'>-	if (!sblock) {</div><div class='del'>-		spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		sctx-&gt;stat.malloc_errors++;</div><div class='del'>-		spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+/*</div><div class='add'>+ * Locate one stripe which has at least one extent in its range.</div><div class='add'>+ *</div><div class='add'>+ * Return 0 if found such stripe, and store its info into @stripe.</div><div class='add'>+ * Return &gt;0 if there is no such stripe in the specified range.</div><div class='add'>+ * Return &lt;0 for error.</div><div class='add'>+ */</div><div class='add'>+static int scrub_find_fill_first_stripe(struct btrfs_block_group *bg,</div><div class='add'>+					struct btrfs_path *extent_path,</div><div class='add'>+					struct btrfs_path *csum_path,</div><div class='add'>+					struct btrfs_device *dev, u64 physical,</div><div class='add'>+					int mirror_num, u64 logical_start,</div><div class='add'>+					u32 logical_len,</div><div class='add'>+					struct scrub_stripe *stripe)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = bg-&gt;fs_info;</div><div class='add'>+	struct btrfs_root *extent_root = btrfs_extent_root(fs_info, bg-&gt;start);</div><div class='add'>+	struct btrfs_root *csum_root = btrfs_csum_root(fs_info, bg-&gt;start);</div><div class='add'>+	const u64 logical_end = logical_start + logical_len;</div><div class='add'>+	u64 cur_logical = logical_start;</div><div class='add'>+	u64 stripe_end;</div><div class='add'>+	u64 extent_start;</div><div class='add'>+	u64 extent_len;</div><div class='add'>+	u64 extent_flags;</div><div class='add'>+	u64 extent_gen;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (unlikely(!extent_root || !csum_root)) {</div><div class='add'>+		btrfs_err(fs_info, "scrub: no valid extent or csum root found");</div><div class='add'>+		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='add'>+	memset(stripe-&gt;sectors, 0, sizeof(struct scrub_sector_verification) *</div><div class='add'>+				   stripe-&gt;nr_sectors);</div><div class='add'>+	scrub_stripe_reset_bitmaps(stripe);</div><div class='ctx'> </div><div class='del'>-	/* one ref inside this function, plus one for each page added to</div><div class='del'>-	 * a bio later on */</div><div class='del'>-	refcount_set(&amp;sblock-&gt;refs, 1);</div><div class='del'>-	sblock-&gt;sctx = sctx;</div><div class='del'>-	sblock-&gt;no_io_error_seen = 1;</div><div class='add'>+	/* The range must be inside the bg. */</div><div class='add'>+	ASSERT(logical_start &gt;= bg-&gt;start &amp;&amp; logical_end &lt;= bg-&gt;start + bg-&gt;length,</div><div class='add'>+	       "bg-&gt;start=%llu logical_start=%llu logical_end=%llu end=%llu",</div><div class='add'>+	       bg-&gt;start, logical_start, logical_end, bg-&gt;start + bg-&gt;length);</div><div class='ctx'> </div><div class='del'>-	for (index = 0; len &gt; 0; index++) {</div><div class='del'>-		struct scrub_page *spage;</div><div class='del'>-		/*</div><div class='del'>-		 * Here we will allocate one page for one sector to scrub.</div><div class='del'>-		 * This is fine if PAGE_SIZE == sectorsize, but will cost</div><div class='del'>-		 * more memory for PAGE_SIZE &gt; sectorsize case.</div><div class='del'>-		 */</div><div class='del'>-		u32 l = min(sectorsize, len);</div><div class='add'>+	ret = find_first_extent_item(extent_root, extent_path, logical_start,</div><div class='add'>+				     logical_len);</div><div class='add'>+	/* Either error or not found. */</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+	get_extent_info(extent_path, &amp;extent_start, &amp;extent_len, &amp;extent_flags,</div><div class='add'>+			&amp;extent_gen);</div><div class='add'>+	if (extent_flags &amp; BTRFS_EXTENT_FLAG_TREE_BLOCK)</div><div class='add'>+		stripe-&gt;nr_meta_extents++;</div><div class='add'>+	if (extent_flags &amp; BTRFS_EXTENT_FLAG_DATA)</div><div class='add'>+		stripe-&gt;nr_data_extents++;</div><div class='add'>+	cur_logical = max(extent_start, cur_logical);</div><div class='ctx'> </div><div class='del'>-		spage = kzalloc(sizeof(*spage), GFP_KERNEL);</div><div class='del'>-		if (!spage) {</div><div class='del'>-leave_nomem:</div><div class='del'>-			spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-			sctx-&gt;stat.malloc_errors++;</div><div class='del'>-			spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-			scrub_block_put(sblock);</div><div class='del'>-			return -ENOMEM;</div><div class='del'>-		}</div><div class='del'>-		BUG_ON(index &gt;= SCRUB_MAX_PAGES_PER_BLOCK);</div><div class='del'>-		scrub_page_get(spage);</div><div class='del'>-		sblock-&gt;pagev[index] = spage;</div><div class='del'>-		spage-&gt;sblock = sblock;</div><div class='del'>-		spage-&gt;dev = dev;</div><div class='del'>-		spage-&gt;flags = flags;</div><div class='del'>-		spage-&gt;generation = gen;</div><div class='del'>-		spage-&gt;logical = logical;</div><div class='del'>-		spage-&gt;physical = physical;</div><div class='del'>-		spage-&gt;physical_for_dev_replace = physical_for_dev_replace;</div><div class='del'>-		spage-&gt;mirror_num = mirror_num;</div><div class='del'>-		if (csum) {</div><div class='del'>-			spage-&gt;have_csum = 1;</div><div class='del'>-			memcpy(spage-&gt;csum, csum, sctx-&gt;fs_info-&gt;csum_size);</div><div class='del'>-		} else {</div><div class='del'>-			spage-&gt;have_csum = 0;</div><div class='add'>+	/*</div><div class='add'>+	 * Round down to stripe boundary.</div><div class='add'>+	 *</div><div class='add'>+	 * The extra calculation against bg-&gt;start is to handle block groups</div><div class='add'>+	 * whose logical bytenr is not BTRFS_STRIPE_LEN aligned.</div><div class='add'>+	 */</div><div class='add'>+	stripe-&gt;logical = round_down(cur_logical - bg-&gt;start, BTRFS_STRIPE_LEN) +</div><div class='add'>+			  bg-&gt;start;</div><div class='add'>+	stripe-&gt;physical = physical + stripe-&gt;logical - logical_start;</div><div class='add'>+	stripe-&gt;dev = dev;</div><div class='add'>+	stripe-&gt;bg = bg;</div><div class='add'>+	stripe-&gt;mirror_num = mirror_num;</div><div class='add'>+	stripe_end = stripe-&gt;logical + BTRFS_STRIPE_LEN - 1;</div><div class='add'>+</div><div class='add'>+	/* Fill the first extent info into stripe-&gt;sectors[] array. */</div><div class='add'>+	fill_one_extent_info(fs_info, stripe, extent_start, extent_len,</div><div class='add'>+			     extent_flags, extent_gen);</div><div class='add'>+	cur_logical = extent_start + extent_len;</div><div class='add'>+</div><div class='add'>+	/* Fill the extent info for the remaining sectors. */</div><div class='add'>+	while (cur_logical &lt;= stripe_end) {</div><div class='add'>+		ret = find_first_extent_item(extent_root, extent_path, cur_logical,</div><div class='add'>+					     stripe_end - cur_logical + 1);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out;</div><div class='add'>+		if (ret &gt; 0) {</div><div class='add'>+			ret = 0;</div><div class='add'>+			break;</div><div class='ctx'> 		}</div><div class='del'>-		sblock-&gt;page_count++;</div><div class='del'>-		spage-&gt;page = alloc_page(GFP_KERNEL);</div><div class='del'>-		if (!spage-&gt;page)</div><div class='del'>-			goto leave_nomem;</div><div class='del'>-		len -= l;</div><div class='del'>-		logical += l;</div><div class='del'>-		physical += l;</div><div class='del'>-		physical_for_dev_replace += l;</div><div class='add'>+		get_extent_info(extent_path, &amp;extent_start, &amp;extent_len,</div><div class='add'>+				&amp;extent_flags, &amp;extent_gen);</div><div class='add'>+		if (extent_flags &amp; BTRFS_EXTENT_FLAG_TREE_BLOCK)</div><div class='add'>+			stripe-&gt;nr_meta_extents++;</div><div class='add'>+		if (extent_flags &amp; BTRFS_EXTENT_FLAG_DATA)</div><div class='add'>+			stripe-&gt;nr_data_extents++;</div><div class='add'>+		fill_one_extent_info(fs_info, stripe, extent_start, extent_len,</div><div class='add'>+				     extent_flags, extent_gen);</div><div class='add'>+		cur_logical = extent_start + extent_len;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	WARN_ON(sblock-&gt;page_count == 0);</div><div class='del'>-	if (test_bit(BTRFS_DEV_STATE_MISSING, &amp;dev-&gt;dev_state)) {</div><div class='add'>+	/* Now fill the data csum. */</div><div class='add'>+	if (bg-&gt;flags &amp; BTRFS_BLOCK_GROUP_DATA) {</div><div class='add'>+		int sector_nr;</div><div class='add'>+		unsigned long csum_bitmap = 0;</div><div class='add'>+</div><div class='add'>+		/* Csum space should have already been allocated. */</div><div class='add'>+		ASSERT(stripe-&gt;csums);</div><div class='add'>+</div><div class='ctx'> 		/*</div><div class='del'>-		 * This case should only be hit for RAID 5/6 device replace. See</div><div class='del'>-		 * the comment in scrub_missing_raid56_pages() for details.</div><div class='add'>+		 * Our csum bitmap should be large enough, as BTRFS_STRIPE_LEN</div><div class='add'>+		 * should contain at most 16 sectors.</div><div class='ctx'> 		 */</div><div class='del'>-		scrub_missing_raid56_pages(sblock);</div><div class='del'>-	} else {</div><div class='del'>-		for (index = 0; index &lt; sblock-&gt;page_count; index++) {</div><div class='del'>-			struct scrub_page *spage = sblock-&gt;pagev[index];</div><div class='del'>-			int ret;</div><div class='add'>+		ASSERT(BITS_PER_LONG &gt;= BTRFS_STRIPE_LEN &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='ctx'> </div><div class='del'>-			ret = scrub_add_page_to_rd_bio(sctx, spage);</div><div class='del'>-			if (ret) {</div><div class='del'>-				scrub_block_put(sblock);</div><div class='del'>-				return ret;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='add'>+		ret = btrfs_lookup_csums_bitmap(csum_root, csum_path,</div><div class='add'>+						stripe-&gt;logical, stripe_end,</div><div class='add'>+						stripe-&gt;csums, &amp;csum_bitmap);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out;</div><div class='add'>+		if (ret &gt; 0)</div><div class='add'>+			ret = 0;</div><div class='ctx'> </div><div class='del'>-		if (flags &amp; BTRFS_EXTENT_FLAG_SUPER)</div><div class='del'>-			scrub_submit(sctx);</div><div class='add'>+		for_each_set_bit(sector_nr, &amp;csum_bitmap, stripe-&gt;nr_sectors) {</div><div class='add'>+			stripe-&gt;sectors[sector_nr].csum = stripe-&gt;csums +</div><div class='add'>+				sector_nr * fs_info-&gt;csum_size;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	/* last one frees, either here or in bio completion for last page */</div><div class='del'>-	scrub_block_put(sblock);</div><div class='del'>-	return 0;</div><div class='add'>+	set_bit(SCRUB_STRIPE_FLAG_INITIALIZED, &amp;stripe-&gt;state);</div><div class='add'>+out:</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void scrub_bio_end_io(struct bio *bio)</div><div class='add'>+static void scrub_reset_stripe(struct scrub_stripe *stripe)</div><div class='ctx'> {</div><div class='del'>-	struct scrub_bio *sbio = bio-&gt;bi_private;</div><div class='del'>-	struct btrfs_fs_info *fs_info = sbio-&gt;dev-&gt;fs_info;</div><div class='add'>+	scrub_stripe_reset_bitmaps(stripe);</div><div class='ctx'> </div><div class='del'>-	sbio-&gt;status = bio-&gt;bi_status;</div><div class='del'>-	sbio-&gt;bio = bio;</div><div class='add'>+	stripe-&gt;nr_meta_extents = 0;</div><div class='add'>+	stripe-&gt;nr_data_extents = 0;</div><div class='add'>+	stripe-&gt;state = 0;</div><div class='ctx'> </div><div class='del'>-	btrfs_queue_work(fs_info-&gt;scrub_workers, &amp;sbio-&gt;work);</div><div class='add'>+	for (int i = 0; i &lt; stripe-&gt;nr_sectors; i++) {</div><div class='add'>+		stripe-&gt;sectors[i].csum = NULL;</div><div class='add'>+		stripe-&gt;sectors[i].generation = 0;</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void scrub_bio_end_io_worker(struct btrfs_work *work)</div><div class='add'>+static u32 stripe_length(const struct scrub_stripe *stripe)</div><div class='ctx'> {</div><div class='del'>-	struct scrub_bio *sbio = container_of(work, struct scrub_bio, work);</div><div class='del'>-	struct scrub_ctx *sctx = sbio-&gt;sctx;</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	BUG_ON(sbio-&gt;page_count &gt; SCRUB_PAGES_PER_RD_BIO);</div><div class='del'>-	if (sbio-&gt;status) {</div><div class='del'>-		for (i = 0; i &lt; sbio-&gt;page_count; i++) {</div><div class='del'>-			struct scrub_page *spage = sbio-&gt;pagev[i];</div><div class='del'>-</div><div class='del'>-			spage-&gt;io_error = 1;</div><div class='del'>-			spage-&gt;sblock-&gt;no_io_error_seen = 0;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* now complete the scrub_block items that have all pages completed */</div><div class='del'>-	for (i = 0; i &lt; sbio-&gt;page_count; i++) {</div><div class='del'>-		struct scrub_page *spage = sbio-&gt;pagev[i];</div><div class='del'>-		struct scrub_block *sblock = spage-&gt;sblock;</div><div class='del'>-</div><div class='del'>-		if (atomic_dec_and_test(&amp;sblock-&gt;outstanding_pages))</div><div class='del'>-			scrub_block_complete(sblock);</div><div class='del'>-		scrub_block_put(sblock);</div><div class='del'>-	}</div><div class='add'>+	ASSERT(stripe-&gt;bg);</div><div class='ctx'> </div><div class='del'>-	bio_put(sbio-&gt;bio);</div><div class='del'>-	sbio-&gt;bio = NULL;</div><div class='del'>-	spin_lock(&amp;sctx-&gt;list_lock);</div><div class='del'>-	sbio-&gt;next_free = sctx-&gt;first_free;</div><div class='del'>-	sctx-&gt;first_free = sbio-&gt;index;</div><div class='del'>-	spin_unlock(&amp;sctx-&gt;list_lock);</div><div class='del'>-</div><div class='del'>-	if (sctx-&gt;is_dev_replace &amp;&amp; sctx-&gt;flush_all_writes) {</div><div class='del'>-		mutex_lock(&amp;sctx-&gt;wr_lock);</div><div class='del'>-		scrub_wr_submit(sctx);</div><div class='del'>-		mutex_unlock(&amp;sctx-&gt;wr_lock);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	scrub_pending_bio_dec(sctx);</div><div class='add'>+	return min(BTRFS_STRIPE_LEN,</div><div class='add'>+		   stripe-&gt;bg-&gt;start + stripe-&gt;bg-&gt;length - stripe-&gt;logical);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void __scrub_mark_bitmap(struct scrub_parity *sparity,</div><div class='del'>-				       unsigned long *bitmap,</div><div class='del'>-				       u64 start, u32 len)</div><div class='add'>+static void scrub_submit_extent_sector_read(struct scrub_stripe *stripe)</div><div class='ctx'> {</div><div class='del'>-	u64 offset;</div><div class='del'>-	u32 nsectors;</div><div class='del'>-	u32 sectorsize_bits = sparity-&gt;sctx-&gt;fs_info-&gt;sectorsize_bits;</div><div class='del'>-</div><div class='del'>-	if (len &gt;= sparity-&gt;stripe_len) {</div><div class='del'>-		bitmap_set(bitmap, 0, sparity-&gt;nsectors);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='add'>+	struct btrfs_fs_info *fs_info = stripe-&gt;bg-&gt;fs_info;</div><div class='add'>+	struct btrfs_bio *bbio = NULL;</div><div class='add'>+	unsigned int nr_sectors = stripe_length(stripe) &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='add'>+	const unsigned long has_extent = scrub_bitmap_read_has_extent(stripe);</div><div class='add'>+	u64 stripe_len = BTRFS_STRIPE_LEN;</div><div class='add'>+	int mirror = stripe-&gt;mirror_num;</div><div class='add'>+	int i;</div><div class='ctx'> </div><div class='del'>-	start -= sparity-&gt;logic_start;</div><div class='del'>-	start = div64_u64_rem(start, sparity-&gt;stripe_len, &amp;offset);</div><div class='del'>-	offset = offset &gt;&gt; sectorsize_bits;</div><div class='del'>-	nsectors = len &gt;&gt; sectorsize_bits;</div><div class='add'>+	atomic_inc(&amp;stripe-&gt;pending_io);</div><div class='ctx'> </div><div class='del'>-	if (offset + nsectors &lt;= sparity-&gt;nsectors) {</div><div class='del'>-		bitmap_set(bitmap, offset, nsectors);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='add'>+	for_each_set_bit(i, &amp;has_extent, stripe-&gt;nr_sectors) {</div><div class='add'>+		/* We're beyond the chunk boundary, no need to read anymore. */</div><div class='add'>+		if (i &gt;= nr_sectors)</div><div class='add'>+			break;</div><div class='ctx'> </div><div class='del'>-	bitmap_set(bitmap, offset, sparity-&gt;nsectors - offset);</div><div class='del'>-	bitmap_set(bitmap, 0, nsectors - (sparity-&gt;nsectors - offset));</div><div class='del'>-}</div><div class='add'>+		/* The current sector cannot be merged, submit the bio. */</div><div class='add'>+		if (bbio &amp;&amp;</div><div class='add'>+		    ((i &gt; 0 &amp;&amp; !test_bit(i - 1, &amp;has_extent)) ||</div><div class='add'>+		     bbio-&gt;bio.bi_iter.bi_size &gt;= stripe_len)) {</div><div class='add'>+			ASSERT(bbio-&gt;bio.bi_iter.bi_size);</div><div class='add'>+			atomic_inc(&amp;stripe-&gt;pending_io);</div><div class='add'>+			btrfs_submit_bbio(bbio, mirror);</div><div class='add'>+			bbio = NULL;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-static inline void scrub_parity_mark_sectors_error(struct scrub_parity *sparity,</div><div class='del'>-						   u64 start, u32 len)</div><div class='del'>-{</div><div class='del'>-	__scrub_mark_bitmap(sparity, sparity-&gt;ebitmap, start, len);</div><div class='del'>-}</div><div class='add'>+		if (!bbio) {</div><div class='add'>+			struct btrfs_io_stripe io_stripe = {};</div><div class='add'>+			struct btrfs_io_context *bioc = NULL;</div><div class='add'>+			const u64 logical = stripe-&gt;logical +</div><div class='add'>+					    (i &lt;&lt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+			int ret;</div><div class='ctx'> </div><div class='del'>-static inline void scrub_parity_mark_sectors_data(struct scrub_parity *sparity,</div><div class='del'>-						  u64 start, u32 len)</div><div class='del'>-{</div><div class='del'>-	__scrub_mark_bitmap(sparity, sparity-&gt;dbitmap, start, len);</div><div class='del'>-}</div><div class='add'>+			io_stripe.rst_search_commit_root = true;</div><div class='add'>+			stripe_len = (nr_sectors - i) &lt;&lt; fs_info-&gt;sectorsize_bits;</div><div class='add'>+			/*</div><div class='add'>+			 * For RST cases, we need to manually split the bbio to</div><div class='add'>+			 * follow the RST boundary.</div><div class='add'>+			 */</div><div class='add'>+			ret = btrfs_map_block(fs_info, BTRFS_MAP_READ, logical,</div><div class='add'>+					      &amp;stripe_len, &amp;bioc, &amp;io_stripe, &amp;mirror);</div><div class='add'>+			btrfs_put_bioc(bioc);</div><div class='add'>+			if (ret &lt; 0) {</div><div class='add'>+				if (ret != -ENODATA) {</div><div class='add'>+					/*</div><div class='add'>+					 * Earlier btrfs_get_raid_extent_offset()</div><div class='add'>+					 * returned -ENODATA, which means there's</div><div class='add'>+					 * no entry for the corresponding range</div><div class='add'>+					 * in the stripe tree.  But if it's in</div><div class='add'>+					 * the extent tree, then it's a preallocated</div><div class='add'>+					 * extent and not an error.</div><div class='add'>+					 */</div><div class='add'>+					scrub_bitmap_set_bit_io_error(stripe, i);</div><div class='add'>+					scrub_bitmap_set_bit_error(stripe, i);</div><div class='add'>+				}</div><div class='add'>+				continue;</div><div class='add'>+			}</div><div class='ctx'> </div><div class='del'>-static void scrub_block_complete(struct scrub_block *sblock)</div><div class='del'>-{</div><div class='del'>-	int corrupted = 0;</div><div class='add'>+			bbio = alloc_scrub_bbio(fs_info, stripe-&gt;nr_sectors, REQ_OP_READ,</div><div class='add'>+						logical, scrub_read_endio, stripe);</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	if (!sblock-&gt;no_io_error_seen) {</div><div class='del'>-		corrupted = 1;</div><div class='del'>-		scrub_handle_errored_block(sblock);</div><div class='del'>-	} else {</div><div class='del'>-		/*</div><div class='del'>-		 * if has checksum error, write via repair mechanism in</div><div class='del'>-		 * dev replace case, otherwise write here in dev replace</div><div class='del'>-		 * case.</div><div class='del'>-		 */</div><div class='del'>-		corrupted = scrub_checksum(sblock);</div><div class='del'>-		if (!corrupted &amp;&amp; sblock-&gt;sctx-&gt;is_dev_replace)</div><div class='del'>-			scrub_write_block_to_dev_replace(sblock);</div><div class='add'>+		scrub_bio_add_sector(bbio, stripe, i);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (sblock-&gt;sparity &amp;&amp; corrupted &amp;&amp; !sblock-&gt;data_corrected) {</div><div class='del'>-		u64 start = sblock-&gt;pagev[0]-&gt;logical;</div><div class='del'>-		u64 end = sblock-&gt;pagev[sblock-&gt;page_count - 1]-&gt;logical +</div><div class='del'>-			  sblock-&gt;sctx-&gt;fs_info-&gt;sectorsize;</div><div class='add'>+	if (bbio) {</div><div class='add'>+		ASSERT(bbio-&gt;bio.bi_iter.bi_size);</div><div class='add'>+		atomic_inc(&amp;stripe-&gt;pending_io);</div><div class='add'>+		btrfs_submit_bbio(bbio, mirror);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		ASSERT(end - start &lt;= U32_MAX);</div><div class='del'>-		scrub_parity_mark_sectors_error(sblock-&gt;sparity,</div><div class='del'>-						start, end - start);</div><div class='add'>+	if (atomic_dec_and_test(&amp;stripe-&gt;pending_io)) {</div><div class='add'>+		wake_up(&amp;stripe-&gt;io_wait);</div><div class='add'>+		INIT_WORK(&amp;stripe-&gt;work, scrub_stripe_read_repair_worker);</div><div class='add'>+		queue_work(stripe-&gt;bg-&gt;fs_info-&gt;scrub_workers, &amp;stripe-&gt;work);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void drop_csum_range(struct scrub_ctx *sctx, struct btrfs_ordered_sum *sum)</div><div class='add'>+static void scrub_submit_initial_read(struct scrub_ctx *sctx,</div><div class='add'>+				      struct scrub_stripe *stripe)</div><div class='ctx'> {</div><div class='del'>-	sctx-&gt;stat.csum_discards += sum-&gt;len &gt;&gt; sctx-&gt;fs_info-&gt;sectorsize_bits;</div><div class='del'>-	list_del(&amp;sum-&gt;list);</div><div class='del'>-	kfree(sum);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Find the desired csum for range [logical, logical + sectorsize), and store</div><div class='del'>- * the csum into @csum.</div><div class='del'>- *</div><div class='del'>- * The search source is sctx-&gt;csum_list, which is a pre-populated list</div><div class='del'>- * storing bytenr ordered csum ranges.  We're responsible to cleanup any range</div><div class='del'>- * that is before @logical.</div><div class='del'>- *</div><div class='del'>- * Return 0 if there is no csum for the range.</div><div class='del'>- * Return 1 if there is csum for the range and copied to @csum.</div><div class='del'>- */</div><div class='del'>-static int scrub_find_csum(struct scrub_ctx *sctx, u64 logical, u8 *csum)</div><div class='del'>-{</div><div class='del'>-	bool found = false;</div><div class='del'>-</div><div class='del'>-	while (!list_empty(&amp;sctx-&gt;csum_list)) {</div><div class='del'>-		struct btrfs_ordered_sum *sum = NULL;</div><div class='del'>-		unsigned long index;</div><div class='del'>-		unsigned long num_sectors;</div><div class='add'>+	struct btrfs_fs_info *fs_info = sctx-&gt;fs_info;</div><div class='add'>+	struct btrfs_bio *bbio;</div><div class='add'>+	const u32 min_folio_shift = PAGE_SHIFT + fs_info-&gt;block_min_order;</div><div class='add'>+	unsigned int nr_sectors = stripe_length(stripe) &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='add'>+	int mirror = stripe-&gt;mirror_num;</div><div class='ctx'> </div><div class='del'>-		sum = list_first_entry(&amp;sctx-&gt;csum_list,</div><div class='del'>-				       struct btrfs_ordered_sum, list);</div><div class='del'>-		/* The current csum range is beyond our range, no csum found */</div><div class='del'>-		if (sum-&gt;bytenr &gt; logical)</div><div class='del'>-			break;</div><div class='add'>+	ASSERT(stripe-&gt;bg);</div><div class='add'>+	ASSERT(stripe-&gt;mirror_num &gt; 0);</div><div class='add'>+	ASSERT(test_bit(SCRUB_STRIPE_FLAG_INITIALIZED, &amp;stripe-&gt;state));</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * The current sum is before our bytenr, since scrub is always</div><div class='del'>-		 * done in bytenr order, the csum will never be used anymore,</div><div class='del'>-		 * clean it up so that later calls won't bother with the range,</div><div class='del'>-		 * and continue search the next range.</div><div class='del'>-		 */</div><div class='del'>-		if (sum-&gt;bytenr + sum-&gt;len &lt;= logical) {</div><div class='del'>-			drop_csum_range(sctx, sum);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='add'>+	if (btrfs_need_stripe_tree_update(fs_info, stripe-&gt;bg-&gt;flags)) {</div><div class='add'>+		scrub_submit_extent_sector_read(stripe);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		/* Now the csum range covers our bytenr, copy the csum */</div><div class='del'>-		found = true;</div><div class='del'>-		index = (logical - sum-&gt;bytenr) &gt;&gt; sctx-&gt;fs_info-&gt;sectorsize_bits;</div><div class='del'>-		num_sectors = sum-&gt;len &gt;&gt; sctx-&gt;fs_info-&gt;sectorsize_bits;</div><div class='add'>+	bbio = alloc_scrub_bbio(fs_info, BTRFS_STRIPE_LEN &gt;&gt; min_folio_shift, REQ_OP_READ,</div><div class='add'>+				stripe-&gt;logical, scrub_read_endio, stripe);</div><div class='add'>+	/* Read the whole range inside the chunk boundary. */</div><div class='add'>+	for (unsigned int cur = 0; cur &lt; nr_sectors; cur++)</div><div class='add'>+		scrub_bio_add_sector(bbio, stripe, cur);</div><div class='add'>+	atomic_inc(&amp;stripe-&gt;pending_io);</div><div class='ctx'> </div><div class='del'>-		memcpy(csum, sum-&gt;sums + index * sctx-&gt;fs_info-&gt;csum_size,</div><div class='del'>-		       sctx-&gt;fs_info-&gt;csum_size);</div><div class='add'>+	/*</div><div class='add'>+	 * For dev-replace, either user asks to avoid the source dev, or</div><div class='add'>+	 * the device is missing, we try the next mirror instead.</div><div class='add'>+	 */</div><div class='add'>+	if (sctx-&gt;is_dev_replace &amp;&amp;</div><div class='add'>+	    (fs_info-&gt;dev_replace.cont_reading_from_srcdev_mode ==</div><div class='add'>+	     BTRFS_DEV_REPLACE_ITEM_CONT_READING_FROM_SRCDEV_MODE_AVOID ||</div><div class='add'>+	     !stripe-&gt;dev-&gt;bdev)) {</div><div class='add'>+		int num_copies = btrfs_num_copies(fs_info, stripe-&gt;bg-&gt;start,</div><div class='add'>+						  stripe-&gt;bg-&gt;length);</div><div class='ctx'> </div><div class='del'>-		/* Cleanup the range if we're at the end of the csum range */</div><div class='del'>-		if (index == num_sectors - 1)</div><div class='del'>-			drop_csum_range(sctx, sum);</div><div class='del'>-		break;</div><div class='add'>+		mirror = calc_next_mirror(mirror, num_copies);</div><div class='ctx'> 	}</div><div class='del'>-	if (!found)</div><div class='del'>-		return 0;</div><div class='del'>-	return 1;</div><div class='add'>+	btrfs_submit_bbio(bbio, mirror);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* scrub extent tries to collect up to 64 kB for each bio */</div><div class='del'>-static int scrub_extent(struct scrub_ctx *sctx, struct map_lookup *map,</div><div class='del'>-			u64 logical, u32 len,</div><div class='del'>-			u64 physical, struct btrfs_device *dev, u64 flags,</div><div class='del'>-			u64 gen, int mirror_num, u64 physical_for_dev_replace)</div><div class='add'>+static bool stripe_has_metadata_error(struct scrub_stripe *stripe)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='del'>-	u8 csum[BTRFS_CSUM_SIZE];</div><div class='del'>-	u32 blocksize;</div><div class='del'>-</div><div class='del'>-	if (flags &amp; BTRFS_EXTENT_FLAG_DATA) {</div><div class='del'>-		if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID56_MASK)</div><div class='del'>-			blocksize = map-&gt;stripe_len;</div><div class='del'>-		else</div><div class='del'>-			blocksize = sctx-&gt;fs_info-&gt;sectorsize;</div><div class='del'>-		spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		sctx-&gt;stat.data_extents_scrubbed++;</div><div class='del'>-		sctx-&gt;stat.data_bytes_scrubbed += len;</div><div class='del'>-		spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-	} else if (flags &amp; BTRFS_EXTENT_FLAG_TREE_BLOCK) {</div><div class='del'>-		if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID56_MASK)</div><div class='del'>-			blocksize = map-&gt;stripe_len;</div><div class='del'>-		else</div><div class='del'>-			blocksize = sctx-&gt;fs_info-&gt;nodesize;</div><div class='del'>-		spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		sctx-&gt;stat.tree_extents_scrubbed++;</div><div class='del'>-		sctx-&gt;stat.tree_bytes_scrubbed += len;</div><div class='del'>-		spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-	} else {</div><div class='del'>-		blocksize = sctx-&gt;fs_info-&gt;sectorsize;</div><div class='del'>-		WARN_ON(1);</div><div class='del'>-	}</div><div class='add'>+	const unsigned long error = scrub_bitmap_read_error(stripe);</div><div class='add'>+	int i;</div><div class='ctx'> </div><div class='del'>-	while (len) {</div><div class='del'>-		u32 l = min(len, blocksize);</div><div class='del'>-		int have_csum = 0;</div><div class='add'>+	for_each_set_bit(i, &amp;error, stripe-&gt;nr_sectors) {</div><div class='add'>+		if (scrub_bitmap_test_bit_is_metadata(stripe, i)) {</div><div class='add'>+			struct btrfs_fs_info *fs_info = stripe-&gt;bg-&gt;fs_info;</div><div class='ctx'> </div><div class='del'>-		if (flags &amp; BTRFS_EXTENT_FLAG_DATA) {</div><div class='del'>-			/* push csums to sbio */</div><div class='del'>-			have_csum = scrub_find_csum(sctx, logical, csum);</div><div class='del'>-			if (have_csum == 0)</div><div class='del'>-				++sctx-&gt;stat.no_csum;</div><div class='add'>+			btrfs_err(fs_info,</div><div class='add'>+		    "scrub: stripe %llu has unrepaired metadata sector at logical %llu",</div><div class='add'>+				  stripe-&gt;logical,</div><div class='add'>+				  stripe-&gt;logical + (i &lt;&lt; fs_info-&gt;sectorsize_bits));</div><div class='add'>+			return true;</div><div class='ctx'> 		}</div><div class='del'>-		ret = scrub_pages(sctx, logical, l, physical, dev, flags, gen,</div><div class='del'>-				  mirror_num, have_csum ? csum : NULL,</div><div class='del'>-				  physical_for_dev_replace);</div><div class='del'>-		if (ret)</div><div class='del'>-			return ret;</div><div class='del'>-		len -= l;</div><div class='del'>-		logical += l;</div><div class='del'>-		physical += l;</div><div class='del'>-		physical_for_dev_replace += l;</div><div class='ctx'> 	}</div><div class='del'>-	return 0;</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int scrub_pages_for_parity(struct scrub_parity *sparity,</div><div class='del'>-				  u64 logical, u32 len,</div><div class='del'>-				  u64 physical, struct btrfs_device *dev,</div><div class='del'>-				  u64 flags, u64 gen, int mirror_num, u8 *csum)</div><div class='add'>+static void submit_initial_group_read(struct scrub_ctx *sctx,</div><div class='add'>+				      unsigned int first_slot,</div><div class='add'>+				      unsigned int nr_stripes)</div><div class='ctx'> {</div><div class='del'>-	struct scrub_ctx *sctx = sparity-&gt;sctx;</div><div class='del'>-	struct scrub_block *sblock;</div><div class='del'>-	const u32 sectorsize = sctx-&gt;fs_info-&gt;sectorsize;</div><div class='del'>-	int index;</div><div class='add'>+	struct blk_plug plug;</div><div class='ctx'> </div><div class='del'>-	ASSERT(IS_ALIGNED(len, sectorsize));</div><div class='add'>+	ASSERT(first_slot &lt; SCRUB_TOTAL_STRIPES);</div><div class='add'>+	ASSERT(first_slot + nr_stripes &lt;= SCRUB_TOTAL_STRIPES);</div><div class='ctx'> </div><div class='del'>-	sblock = kzalloc(sizeof(*sblock), GFP_KERNEL);</div><div class='del'>-	if (!sblock) {</div><div class='del'>-		spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		sctx-&gt;stat.malloc_errors++;</div><div class='del'>-		spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	scrub_throttle_dev_io(sctx, sctx-&gt;stripes[0].dev,</div><div class='add'>+			      btrfs_stripe_nr_to_offset(nr_stripes));</div><div class='add'>+	blk_start_plug(&amp;plug);</div><div class='add'>+	for (int i = 0; i &lt; nr_stripes; i++) {</div><div class='add'>+		struct scrub_stripe *stripe = &amp;sctx-&gt;stripes[first_slot + i];</div><div class='add'>+</div><div class='add'>+		/* Those stripes should be initialized. */</div><div class='add'>+		ASSERT(test_bit(SCRUB_STRIPE_FLAG_INITIALIZED, &amp;stripe-&gt;state));</div><div class='add'>+		scrub_submit_initial_read(sctx, stripe);</div><div class='ctx'> 	}</div><div class='add'>+	blk_finish_plug(&amp;plug);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	/* one ref inside this function, plus one for each page added to</div><div class='del'>-	 * a bio later on */</div><div class='del'>-	refcount_set(&amp;sblock-&gt;refs, 1);</div><div class='del'>-	sblock-&gt;sctx = sctx;</div><div class='del'>-	sblock-&gt;no_io_error_seen = 1;</div><div class='del'>-	sblock-&gt;sparity = sparity;</div><div class='del'>-	scrub_parity_get(sparity);</div><div class='add'>+static int flush_scrub_stripes(struct scrub_ctx *sctx)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = sctx-&gt;fs_info;</div><div class='add'>+	struct scrub_stripe *stripe;</div><div class='add'>+	const int nr_stripes = sctx-&gt;cur_stripe;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	for (index = 0; len &gt; 0; index++) {</div><div class='del'>-		struct scrub_page *spage;</div><div class='add'>+	if (!nr_stripes)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-		spage = kzalloc(sizeof(*spage), GFP_KERNEL);</div><div class='del'>-		if (!spage) {</div><div class='del'>-leave_nomem:</div><div class='del'>-			spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-			sctx-&gt;stat.malloc_errors++;</div><div class='del'>-			spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-			scrub_block_put(sblock);</div><div class='del'>-			return -ENOMEM;</div><div class='del'>-		}</div><div class='del'>-		BUG_ON(index &gt;= SCRUB_MAX_PAGES_PER_BLOCK);</div><div class='del'>-		/* For scrub block */</div><div class='del'>-		scrub_page_get(spage);</div><div class='del'>-		sblock-&gt;pagev[index] = spage;</div><div class='del'>-		/* For scrub parity */</div><div class='del'>-		scrub_page_get(spage);</div><div class='del'>-		list_add_tail(&amp;spage-&gt;list, &amp;sparity-&gt;spages);</div><div class='del'>-		spage-&gt;sblock = sblock;</div><div class='del'>-		spage-&gt;dev = dev;</div><div class='del'>-		spage-&gt;flags = flags;</div><div class='del'>-		spage-&gt;generation = gen;</div><div class='del'>-		spage-&gt;logical = logical;</div><div class='del'>-		spage-&gt;physical = physical;</div><div class='del'>-		spage-&gt;mirror_num = mirror_num;</div><div class='del'>-		if (csum) {</div><div class='del'>-			spage-&gt;have_csum = 1;</div><div class='del'>-			memcpy(spage-&gt;csum, csum, sctx-&gt;fs_info-&gt;csum_size);</div><div class='del'>-		} else {</div><div class='del'>-			spage-&gt;have_csum = 0;</div><div class='del'>-		}</div><div class='del'>-		sblock-&gt;page_count++;</div><div class='del'>-		spage-&gt;page = alloc_page(GFP_KERNEL);</div><div class='del'>-		if (!spage-&gt;page)</div><div class='del'>-			goto leave_nomem;</div><div class='add'>+	ASSERT(test_bit(SCRUB_STRIPE_FLAG_INITIALIZED, &amp;sctx-&gt;stripes[0].state));</div><div class='ctx'> </div><div class='add'>+	/* Submit the stripes which are populated but not submitted. */</div><div class='add'>+	if (nr_stripes % SCRUB_STRIPES_PER_GROUP) {</div><div class='add'>+		const int first_slot = round_down(nr_stripes, SCRUB_STRIPES_PER_GROUP);</div><div class='ctx'> </div><div class='del'>-		/* Iterate over the stripe range in sectorsize steps */</div><div class='del'>-		len -= sectorsize;</div><div class='del'>-		logical += sectorsize;</div><div class='del'>-		physical += sectorsize;</div><div class='add'>+		submit_initial_group_read(sctx, first_slot, nr_stripes - first_slot);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	WARN_ON(sblock-&gt;page_count == 0);</div><div class='del'>-	for (index = 0; index &lt; sblock-&gt;page_count; index++) {</div><div class='del'>-		struct scrub_page *spage = sblock-&gt;pagev[index];</div><div class='del'>-		int ret;</div><div class='add'>+	for (int i = 0; i &lt; nr_stripes; i++) {</div><div class='add'>+		stripe = &amp;sctx-&gt;stripes[i];</div><div class='ctx'> </div><div class='del'>-		ret = scrub_add_page_to_rd_bio(sctx, spage);</div><div class='del'>-		if (ret) {</div><div class='del'>-			scrub_block_put(sblock);</div><div class='del'>-			return ret;</div><div class='del'>-		}</div><div class='add'>+		wait_event(stripe-&gt;repair_wait,</div><div class='add'>+			   test_bit(SCRUB_STRIPE_FLAG_REPAIR_DONE, &amp;stripe-&gt;state));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* last one frees, either here or in bio completion for last page */</div><div class='del'>-	scrub_block_put(sblock);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='add'>+	/* Submit for dev-replace. */</div><div class='add'>+	if (sctx-&gt;is_dev_replace) {</div><div class='add'>+		/*</div><div class='add'>+		 * For dev-replace, if we know there is something wrong with</div><div class='add'>+		 * metadata, we should immediately abort.</div><div class='add'>+		 */</div><div class='add'>+		for (int i = 0; i &lt; nr_stripes; i++) {</div><div class='add'>+			if (unlikely(stripe_has_metadata_error(&amp;sctx-&gt;stripes[i]))) {</div><div class='add'>+				ret = -EIO;</div><div class='add'>+				goto out;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+		for (int i = 0; i &lt; nr_stripes; i++) {</div><div class='add'>+			unsigned long good;</div><div class='add'>+			unsigned long has_extent;</div><div class='add'>+			unsigned long error;</div><div class='ctx'> </div><div class='del'>-static int scrub_extent_for_parity(struct scrub_parity *sparity,</div><div class='del'>-				   u64 logical, u32 len,</div><div class='del'>-				   u64 physical, struct btrfs_device *dev,</div><div class='del'>-				   u64 flags, u64 gen, int mirror_num)</div><div class='del'>-{</div><div class='del'>-	struct scrub_ctx *sctx = sparity-&gt;sctx;</div><div class='del'>-	int ret;</div><div class='del'>-	u8 csum[BTRFS_CSUM_SIZE];</div><div class='del'>-	u32 blocksize;</div><div class='add'>+			stripe = &amp;sctx-&gt;stripes[i];</div><div class='ctx'> </div><div class='del'>-	if (test_bit(BTRFS_DEV_STATE_MISSING, &amp;dev-&gt;dev_state)) {</div><div class='del'>-		scrub_parity_mark_sectors_error(sparity, logical, len);</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='add'>+			ASSERT(stripe-&gt;dev == fs_info-&gt;dev_replace.srcdev);</div><div class='ctx'> </div><div class='del'>-	if (flags &amp; BTRFS_EXTENT_FLAG_DATA) {</div><div class='del'>-		blocksize = sparity-&gt;stripe_len;</div><div class='del'>-	} else if (flags &amp; BTRFS_EXTENT_FLAG_TREE_BLOCK) {</div><div class='del'>-		blocksize = sparity-&gt;stripe_len;</div><div class='del'>-	} else {</div><div class='del'>-		blocksize = sctx-&gt;fs_info-&gt;sectorsize;</div><div class='del'>-		WARN_ON(1);</div><div class='add'>+			has_extent = scrub_bitmap_read_has_extent(stripe);</div><div class='add'>+			error = scrub_bitmap_read_error(stripe);</div><div class='add'>+			bitmap_andnot(&amp;good, &amp;has_extent, &amp;error, stripe-&gt;nr_sectors);</div><div class='add'>+			scrub_write_sectors(sctx, stripe, good, true);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	while (len) {</div><div class='del'>-		u32 l = min(len, blocksize);</div><div class='del'>-		int have_csum = 0;</div><div class='add'>+	/* Wait for the above writebacks to finish. */</div><div class='add'>+	for (int i = 0; i &lt; nr_stripes; i++) {</div><div class='add'>+		stripe = &amp;sctx-&gt;stripes[i];</div><div class='ctx'> </div><div class='del'>-		if (flags &amp; BTRFS_EXTENT_FLAG_DATA) {</div><div class='del'>-			/* push csums to sbio */</div><div class='del'>-			have_csum = scrub_find_csum(sctx, logical, csum);</div><div class='del'>-			if (have_csum == 0)</div><div class='del'>-				goto skip;</div><div class='del'>-		}</div><div class='del'>-		ret = scrub_pages_for_parity(sparity, logical, l, physical, dev,</div><div class='del'>-					     flags, gen, mirror_num,</div><div class='del'>-					     have_csum ? csum : NULL);</div><div class='del'>-		if (ret)</div><div class='del'>-			return ret;</div><div class='del'>-skip:</div><div class='del'>-		len -= l;</div><div class='del'>-		logical += l;</div><div class='del'>-		physical += l;</div><div class='add'>+		wait_scrub_stripe_io(stripe);</div><div class='add'>+		spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='add'>+		sctx-&gt;stat.last_physical = stripe-&gt;physical + stripe_length(stripe);</div><div class='add'>+		spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='add'>+		scrub_reset_stripe(stripe);</div><div class='ctx'> 	}</div><div class='del'>-	return 0;</div><div class='add'>+out:</div><div class='add'>+	sctx-&gt;cur_stripe = 0;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Given a physical address, this will calculate it's</div><div class='del'>- * logical offset. if this is a parity stripe, it will return</div><div class='del'>- * the most left data stripe's logical offset.</div><div class='del'>- *</div><div class='del'>- * return 0 if it is a data stripe, 1 means parity stripe.</div><div class='del'>- */</div><div class='del'>-static int get_raid56_logic_offset(u64 physical, int num,</div><div class='del'>-				   struct map_lookup *map, u64 *offset,</div><div class='del'>-				   u64 *stripe_start)</div><div class='add'>+static void raid56_scrub_wait_endio(struct bio *bio)</div><div class='ctx'> {</div><div class='del'>-	int i;</div><div class='del'>-	int j = 0;</div><div class='del'>-	u64 stripe_nr;</div><div class='del'>-	u64 last_offset;</div><div class='del'>-	u32 stripe_index;</div><div class='del'>-	u32 rot;</div><div class='del'>-	const int data_stripes = nr_data_stripes(map);</div><div class='del'>-</div><div class='del'>-	last_offset = (physical - map-&gt;stripes[num].physical) * data_stripes;</div><div class='del'>-	if (stripe_start)</div><div class='del'>-		*stripe_start = last_offset;</div><div class='del'>-</div><div class='del'>-	*offset = last_offset;</div><div class='del'>-	for (i = 0; i &lt; data_stripes; i++) {</div><div class='del'>-		*offset = last_offset + i * map-&gt;stripe_len;</div><div class='del'>-</div><div class='del'>-		stripe_nr = div64_u64(*offset, map-&gt;stripe_len);</div><div class='del'>-		stripe_nr = div_u64(stripe_nr, data_stripes);</div><div class='del'>-</div><div class='del'>-		/* Work out the disk rotation on this stripe-set */</div><div class='del'>-		stripe_nr = div_u64_rem(stripe_nr, map-&gt;num_stripes, &amp;rot);</div><div class='del'>-		/* calculate which stripe this data locates */</div><div class='del'>-		rot += i;</div><div class='del'>-		stripe_index = rot % map-&gt;num_stripes;</div><div class='del'>-		if (stripe_index == num)</div><div class='del'>-			return 0;</div><div class='del'>-		if (stripe_index &lt; num)</div><div class='del'>-			j++;</div><div class='del'>-	}</div><div class='del'>-	*offset = last_offset + j * map-&gt;stripe_len;</div><div class='del'>-	return 1;</div><div class='add'>+	complete(bio-&gt;bi_private);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void scrub_free_parity(struct scrub_parity *sparity)</div><div class='add'>+static int queue_scrub_stripe(struct scrub_ctx *sctx, struct btrfs_block_group *bg,</div><div class='add'>+			      struct btrfs_device *dev, int mirror_num,</div><div class='add'>+			      u64 logical, u32 length, u64 physical,</div><div class='add'>+			      u64 *found_logical_ret)</div><div class='ctx'> {</div><div class='del'>-	struct scrub_ctx *sctx = sparity-&gt;sctx;</div><div class='del'>-	struct scrub_page *curr, *next;</div><div class='del'>-	int nbits;</div><div class='add'>+	struct scrub_stripe *stripe;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	nbits = bitmap_weight(sparity-&gt;ebitmap, sparity-&gt;nsectors);</div><div class='del'>-	if (nbits) {</div><div class='del'>-		spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		sctx-&gt;stat.read_errors += nbits;</div><div class='del'>-		sctx-&gt;stat.uncorrectable_errors += nbits;</div><div class='del'>-		spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-	}</div><div class='add'>+	/*</div><div class='add'>+	 * There should always be one slot left, as caller filling the last</div><div class='add'>+	 * slot should flush them all.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(sctx-&gt;cur_stripe &lt; SCRUB_TOTAL_STRIPES);</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry_safe(curr, next, &amp;sparity-&gt;spages, list) {</div><div class='del'>-		list_del_init(&amp;curr-&gt;list);</div><div class='del'>-		scrub_page_put(curr);</div><div class='del'>-	}</div><div class='add'>+	/* @found_logical_ret must be specified. */</div><div class='add'>+	ASSERT(found_logical_ret);</div><div class='ctx'> </div><div class='del'>-	kfree(sparity);</div><div class='del'>-}</div><div class='add'>+	stripe = &amp;sctx-&gt;stripes[sctx-&gt;cur_stripe];</div><div class='add'>+	scrub_reset_stripe(stripe);</div><div class='add'>+	ret = scrub_find_fill_first_stripe(bg, &amp;sctx-&gt;extent_path,</div><div class='add'>+					   &amp;sctx-&gt;csum_path, dev, physical,</div><div class='add'>+					   mirror_num, logical, length, stripe);</div><div class='add'>+	/* Either &gt;0 as no more extents or &lt;0 for error. */</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+	*found_logical_ret = stripe-&gt;logical;</div><div class='add'>+	sctx-&gt;cur_stripe++;</div><div class='ctx'> </div><div class='del'>-static void scrub_parity_bio_endio_worker(struct btrfs_work *work)</div><div class='del'>-{</div><div class='del'>-	struct scrub_parity *sparity = container_of(work, struct scrub_parity,</div><div class='del'>-						    work);</div><div class='del'>-	struct scrub_ctx *sctx = sparity-&gt;sctx;</div><div class='add'>+	/* We filled one group, submit it. */</div><div class='add'>+	if (sctx-&gt;cur_stripe % SCRUB_STRIPES_PER_GROUP == 0) {</div><div class='add'>+		const int first_slot = sctx-&gt;cur_stripe - SCRUB_STRIPES_PER_GROUP;</div><div class='add'>+</div><div class='add'>+		submit_initial_group_read(sctx, first_slot, SCRUB_STRIPES_PER_GROUP);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	scrub_free_parity(sparity);</div><div class='del'>-	scrub_pending_bio_dec(sctx);</div><div class='add'>+	/* Last slot used, flush them all. */</div><div class='add'>+	if (sctx-&gt;cur_stripe == SCRUB_TOTAL_STRIPES)</div><div class='add'>+		return flush_scrub_stripes(sctx);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void scrub_parity_bio_endio(struct bio *bio)</div><div class='add'>+/*</div><div class='add'>+ * Return 0 if we should not cancel the scrub.</div><div class='add'>+ * Return &lt;0 if we need to cancel the scrub, returned value will</div><div class='add'>+ * indicate the reason:</div><div class='add'>+ * - -ECANCELED - Being explicitly canceled through ioctl.</div><div class='add'>+ * - -EINTR     - Being interrupted by signal or fs/process freezing.</div><div class='add'>+ */</div><div class='add'>+static int should_cancel_scrub(const struct scrub_ctx *sctx)</div><div class='ctx'> {</div><div class='del'>-	struct scrub_parity *sparity = (struct scrub_parity *)bio-&gt;bi_private;</div><div class='del'>-	struct btrfs_fs_info *fs_info = sparity-&gt;sctx-&gt;fs_info;</div><div class='del'>-</div><div class='del'>-	if (bio-&gt;bi_status)</div><div class='del'>-		bitmap_or(sparity-&gt;ebitmap, sparity-&gt;ebitmap, sparity-&gt;dbitmap,</div><div class='del'>-			  sparity-&gt;nsectors);</div><div class='add'>+	struct btrfs_fs_info *fs_info = sctx-&gt;fs_info;</div><div class='ctx'> </div><div class='del'>-	bio_put(bio);</div><div class='add'>+	if (atomic_read(&amp;fs_info-&gt;scrub_cancel_req) ||</div><div class='add'>+	    atomic_read(&amp;sctx-&gt;cancel_req))</div><div class='add'>+		return -ECANCELED;</div><div class='ctx'> </div><div class='del'>-	btrfs_init_work(&amp;sparity-&gt;work, scrub_parity_bio_endio_worker, NULL,</div><div class='del'>-			NULL);</div><div class='del'>-	btrfs_queue_work(fs_info-&gt;scrub_parity_workers, &amp;sparity-&gt;work);</div><div class='add'>+	/*</div><div class='add'>+	 * The user (e.g. fsfreeze command) or power management (PM)</div><div class='add'>+	 * suspend/hibernate can freeze the fs.  And PM suspend/hibernate will</div><div class='add'>+	 * also freeze all user processes.</div><div class='add'>+	 *</div><div class='add'>+	 * A user process can only be frozen when it is in user space, thus we</div><div class='add'>+	 * have to cancel the run so that the process can return to the user</div><div class='add'>+	 * space.</div><div class='add'>+	 *</div><div class='add'>+	 * Furthermore we have to check both filesystem and process freezing,</div><div class='add'>+	 * as PM can be configured to freeze the filesystems before processes.</div><div class='add'>+	 *</div><div class='add'>+	 * If we only check fs freezing, then suspend without fs freezing</div><div class='add'>+	 * will timeout, as the process is still in kernel space.</div><div class='add'>+	 *</div><div class='add'>+	 * If we only check process freezing, then suspend with fs freezing</div><div class='add'>+	 * will timeout, as the running scrub will prevent the fs from being frozen.</div><div class='add'>+	 */</div><div class='add'>+	if (fs_info-&gt;sb-&gt;s_writers.frozen &gt; SB_UNFROZEN ||</div><div class='add'>+	    freezing(current) || signal_pending(current))</div><div class='add'>+		return -EINTR;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void scrub_parity_check_and_repair(struct scrub_parity *sparity)</div><div class='add'>+static int scrub_raid56_cached_parity(struct scrub_ctx *sctx,</div><div class='add'>+				      struct btrfs_device *scrub_dev,</div><div class='add'>+				      struct btrfs_chunk_map *map,</div><div class='add'>+				      u64 full_stripe_start,</div><div class='add'>+				      unsigned long *extent_bitmap)</div><div class='ctx'> {</div><div class='del'>-	struct scrub_ctx *sctx = sparity-&gt;sctx;</div><div class='add'>+	DECLARE_COMPLETION_ONSTACK(io_done);</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = sctx-&gt;fs_info;</div><div class='del'>-	struct bio *bio;</div><div class='del'>-	struct btrfs_raid_bio *rbio;</div><div class='ctx'> 	struct btrfs_io_context *bioc = NULL;</div><div class='del'>-	u64 length;</div><div class='add'>+	struct btrfs_raid_bio *rbio;</div><div class='add'>+	struct bio bio;</div><div class='add'>+	const int data_stripes = nr_data_stripes(map);</div><div class='add'>+	u64 length = btrfs_stripe_nr_to_offset(data_stripes);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (!bitmap_andnot(sparity-&gt;dbitmap, sparity-&gt;dbitmap, sparity-&gt;ebitmap,</div><div class='del'>-			   sparity-&gt;nsectors))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	length = sparity-&gt;logic_end - sparity-&gt;logic_start;</div><div class='add'>+	bio_init(&amp;bio, NULL, NULL, 0, REQ_OP_READ);</div><div class='add'>+	bio.bi_iter.bi_sector = full_stripe_start &gt;&gt; SECTOR_SHIFT;</div><div class='add'>+	bio.bi_private = &amp;io_done;</div><div class='add'>+	bio.bi_end_io = raid56_scrub_wait_endio;</div><div class='ctx'> </div><div class='ctx'> 	btrfs_bio_counter_inc_blocked(fs_info);</div><div class='del'>-	ret = btrfs_map_sblock(fs_info, BTRFS_MAP_WRITE, sparity-&gt;logic_start,</div><div class='del'>-			       &amp;length, &amp;bioc);</div><div class='del'>-	if (ret || !bioc || !bioc-&gt;raid_map)</div><div class='del'>-		goto bioc_out;</div><div class='del'>-</div><div class='del'>-	bio = btrfs_bio_alloc(BIO_MAX_VECS);</div><div class='del'>-	bio-&gt;bi_iter.bi_sector = sparity-&gt;logic_start &gt;&gt; 9;</div><div class='del'>-	bio-&gt;bi_private = sparity;</div><div class='del'>-	bio-&gt;bi_end_io = scrub_parity_bio_endio;</div><div class='del'>-</div><div class='del'>-	rbio = raid56_parity_alloc_scrub_rbio(bio, bioc, length,</div><div class='del'>-					      sparity-&gt;scrub_dev,</div><div class='del'>-					      sparity-&gt;dbitmap,</div><div class='del'>-					      sparity-&gt;nsectors);</div><div class='del'>-	if (!rbio)</div><div class='del'>-		goto rbio_out;</div><div class='del'>-</div><div class='del'>-	scrub_pending_bio_inc(sctx);</div><div class='del'>-	raid56_parity_submit_scrub_rbio(rbio);</div><div class='del'>-	return;</div><div class='del'>-</div><div class='del'>-rbio_out:</div><div class='del'>-	bio_put(bio);</div><div class='del'>-bioc_out:</div><div class='del'>-	btrfs_bio_counter_dec(fs_info);</div><div class='add'>+	ret = btrfs_map_block(fs_info, BTRFS_MAP_WRITE, full_stripe_start,</div><div class='add'>+			      &amp;length, &amp;bioc, NULL, NULL);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+	/* For RAID56 write there must be an @bioc allocated. */</div><div class='add'>+	ASSERT(bioc);</div><div class='add'>+	rbio = raid56_parity_alloc_scrub_rbio(&amp;bio, bioc, scrub_dev, extent_bitmap,</div><div class='add'>+				BTRFS_STRIPE_LEN &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='ctx'> 	btrfs_put_bioc(bioc);</div><div class='del'>-	bitmap_or(sparity-&gt;ebitmap, sparity-&gt;ebitmap, sparity-&gt;dbitmap,</div><div class='del'>-		  sparity-&gt;nsectors);</div><div class='del'>-	spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-	sctx-&gt;stat.malloc_errors++;</div><div class='del'>-	spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='add'>+	if (!rbio) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	/* Use the recovered stripes as cache to avoid read them from disk again. */</div><div class='add'>+	for (int i = 0; i &lt; data_stripes; i++) {</div><div class='add'>+		struct scrub_stripe *stripe = &amp;sctx-&gt;raid56_data_stripes[i];</div><div class='add'>+</div><div class='add'>+		raid56_parity_cache_data_folios(rbio, stripe-&gt;folios,</div><div class='add'>+				full_stripe_start + (i &lt;&lt; BTRFS_STRIPE_LEN_SHIFT));</div><div class='add'>+	}</div><div class='add'>+	raid56_parity_submit_scrub_rbio(rbio);</div><div class='add'>+	wait_for_completion_io(&amp;io_done);</div><div class='add'>+	ret = blk_status_to_errno(bio.bi_status);</div><div class='ctx'> out:</div><div class='del'>-	scrub_free_parity(sparity);</div><div class='add'>+	btrfs_bio_counter_dec(fs_info);</div><div class='add'>+	bio_uninit(&amp;bio);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int scrub_calc_parity_bitmap_len(int nsectors)</div><div class='add'>+static int scrub_raid56_parity_stripe(struct scrub_ctx *sctx,</div><div class='add'>+				      struct btrfs_device *scrub_dev,</div><div class='add'>+				      struct btrfs_block_group *bg,</div><div class='add'>+				      struct btrfs_chunk_map *map,</div><div class='add'>+				      u64 full_stripe_start)</div><div class='ctx'> {</div><div class='del'>-	return DIV_ROUND_UP(nsectors, BITS_PER_LONG) * sizeof(long);</div><div class='del'>-}</div><div class='add'>+	struct btrfs_fs_info *fs_info = sctx-&gt;fs_info;</div><div class='add'>+	struct btrfs_path extent_path = { 0 };</div><div class='add'>+	struct btrfs_path csum_path = { 0 };</div><div class='add'>+	struct scrub_stripe *stripe;</div><div class='add'>+	bool all_empty = true;</div><div class='add'>+	const int data_stripes = nr_data_stripes(map);</div><div class='add'>+	unsigned long extent_bitmap = 0;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-static void scrub_parity_get(struct scrub_parity *sparity)</div><div class='del'>-{</div><div class='del'>-	refcount_inc(&amp;sparity-&gt;refs);</div><div class='del'>-}</div><div class='add'>+	ASSERT(sctx-&gt;raid56_data_stripes);</div><div class='ctx'> </div><div class='del'>-static void scrub_parity_put(struct scrub_parity *sparity)</div><div class='del'>-{</div><div class='del'>-	if (!refcount_dec_and_test(&amp;sparity-&gt;refs))</div><div class='del'>-		return;</div><div class='add'>+	ret = should_cancel_scrub(sctx);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	scrub_parity_check_and_repair(sparity);</div><div class='del'>-}</div><div class='add'>+	if (atomic_read(&amp;fs_info-&gt;scrub_pause_req))</div><div class='add'>+		scrub_blocked_if_needed(fs_info);</div><div class='ctx'> </div><div class='del'>-static noinline_for_stack int scrub_raid56_parity(struct scrub_ctx *sctx,</div><div class='del'>-						  struct map_lookup *map,</div><div class='del'>-						  struct btrfs_device *sdev,</div><div class='del'>-						  struct btrfs_path *path,</div><div class='del'>-						  u64 logic_start,</div><div class='del'>-						  u64 logic_end)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = sctx-&gt;fs_info;</div><div class='del'>-	struct btrfs_root *root = fs_info-&gt;extent_root;</div><div class='del'>-	struct btrfs_root *csum_root = fs_info-&gt;csum_root;</div><div class='del'>-	struct btrfs_extent_item *extent;</div><div class='del'>-	struct btrfs_io_context *bioc = NULL;</div><div class='del'>-	u64 flags;</div><div class='del'>-	int ret;</div><div class='del'>-	int slot;</div><div class='del'>-	struct extent_buffer *l;</div><div class='del'>-	struct btrfs_key key;</div><div class='del'>-	u64 generation;</div><div class='del'>-	u64 extent_logical;</div><div class='del'>-	u64 extent_physical;</div><div class='del'>-	/* Check the comment in scrub_stripe() for why u32 is enough here */</div><div class='del'>-	u32 extent_len;</div><div class='del'>-	u64 mapped_length;</div><div class='del'>-	struct btrfs_device *extent_dev;</div><div class='del'>-	struct scrub_parity *sparity;</div><div class='del'>-	int nsectors;</div><div class='del'>-	int bitmap_len;</div><div class='del'>-	int extent_mirror_num;</div><div class='del'>-	int stop_loop = 0;</div><div class='del'>-</div><div class='del'>-	ASSERT(map-&gt;stripe_len &lt;= U32_MAX);</div><div class='del'>-	nsectors = map-&gt;stripe_len &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='del'>-	bitmap_len = scrub_calc_parity_bitmap_len(nsectors);</div><div class='del'>-	sparity = kzalloc(sizeof(struct scrub_parity) + 2 * bitmap_len,</div><div class='del'>-			  GFP_NOFS);</div><div class='del'>-	if (!sparity) {</div><div class='del'>-		spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		sctx-&gt;stat.malloc_errors++;</div><div class='del'>-		spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	spin_lock(&amp;bg-&gt;lock);</div><div class='add'>+	if (test_bit(BLOCK_GROUP_FLAG_REMOVED, &amp;bg-&gt;runtime_flags)) {</div><div class='add'>+		spin_unlock(&amp;bg-&gt;lock);</div><div class='add'>+		return 0;</div><div class='ctx'> 	}</div><div class='add'>+	spin_unlock(&amp;bg-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	ASSERT(map-&gt;stripe_len &lt;= U32_MAX);</div><div class='del'>-	sparity-&gt;stripe_len = map-&gt;stripe_len;</div><div class='del'>-	sparity-&gt;nsectors = nsectors;</div><div class='del'>-	sparity-&gt;sctx = sctx;</div><div class='del'>-	sparity-&gt;scrub_dev = sdev;</div><div class='del'>-	sparity-&gt;logic_start = logic_start;</div><div class='del'>-	sparity-&gt;logic_end = logic_end;</div><div class='del'>-	refcount_set(&amp;sparity-&gt;refs, 1);</div><div class='del'>-	INIT_LIST_HEAD(&amp;sparity-&gt;spages);</div><div class='del'>-	sparity-&gt;dbitmap = sparity-&gt;bitmap;</div><div class='del'>-	sparity-&gt;ebitmap = (void *)sparity-&gt;bitmap + bitmap_len;</div><div class='del'>-</div><div class='del'>-	ret = 0;</div><div class='del'>-	while (logic_start &lt; logic_end) {</div><div class='del'>-		if (btrfs_fs_incompat(fs_info, SKINNY_METADATA))</div><div class='del'>-			key.type = BTRFS_METADATA_ITEM_KEY;</div><div class='del'>-		else</div><div class='del'>-			key.type = BTRFS_EXTENT_ITEM_KEY;</div><div class='del'>-		key.objectid = logic_start;</div><div class='del'>-		key.offset = (u64)-1;</div><div class='del'>-</div><div class='del'>-		ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='add'>+	/*</div><div class='add'>+	 * For data stripe search, we cannot reuse the same extent/csum paths,</div><div class='add'>+	 * as the data stripe bytenr may be smaller than previous extent.  Thus</div><div class='add'>+	 * we have to use our own extent/csum paths.</div><div class='add'>+	 */</div><div class='add'>+	extent_path.search_commit_root = true;</div><div class='add'>+	extent_path.skip_locking = true;</div><div class='add'>+	csum_path.search_commit_root = true;</div><div class='add'>+	csum_path.skip_locking = true;</div><div class='add'>+</div><div class='add'>+	for (int i = 0; i &lt; data_stripes; i++) {</div><div class='add'>+		int stripe_index;</div><div class='add'>+		int rot;</div><div class='add'>+		u64 physical;</div><div class='add'>+</div><div class='add'>+		stripe = &amp;sctx-&gt;raid56_data_stripes[i];</div><div class='add'>+		rot = div_u64(full_stripe_start - bg-&gt;start,</div><div class='add'>+			      data_stripes) &gt;&gt; BTRFS_STRIPE_LEN_SHIFT;</div><div class='add'>+		stripe_index = (i + rot) % map-&gt;num_stripes;</div><div class='add'>+		physical = map-&gt;stripes[stripe_index].physical +</div><div class='add'>+			   btrfs_stripe_nr_to_offset(rot);</div><div class='add'>+</div><div class='add'>+		scrub_reset_stripe(stripe);</div><div class='add'>+		set_bit(SCRUB_STRIPE_FLAG_NO_REPORT, &amp;stripe-&gt;state);</div><div class='add'>+		ret = scrub_find_fill_first_stripe(bg, &amp;extent_path, &amp;csum_path,</div><div class='add'>+				map-&gt;stripes[stripe_index].dev, physical, 1,</div><div class='add'>+				full_stripe_start + btrfs_stripe_nr_to_offset(i),</div><div class='add'>+				BTRFS_STRIPE_LEN, stripe);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='del'>-</div><div class='add'>+		/*</div><div class='add'>+		 * No extent in this data stripe, need to manually mark them</div><div class='add'>+		 * initialized to make later read submission happy.</div><div class='add'>+		 */</div><div class='ctx'> 		if (ret &gt; 0) {</div><div class='del'>-			ret = btrfs_previous_extent_item(root, path, 0);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto out;</div><div class='del'>-			if (ret &gt; 0) {</div><div class='del'>-				btrfs_release_path(path);</div><div class='del'>-				ret = btrfs_search_slot(NULL, root, &amp;key,</div><div class='del'>-							path, 0, 0);</div><div class='del'>-				if (ret &lt; 0)</div><div class='del'>-					goto out;</div><div class='del'>-			}</div><div class='add'>+			stripe-&gt;logical = full_stripe_start +</div><div class='add'>+					  btrfs_stripe_nr_to_offset(i);</div><div class='add'>+			stripe-&gt;dev = map-&gt;stripes[stripe_index].dev;</div><div class='add'>+			stripe-&gt;mirror_num = 1;</div><div class='add'>+			set_bit(SCRUB_STRIPE_FLAG_INITIALIZED, &amp;stripe-&gt;state);</div><div class='ctx'> 		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		stop_loop = 0;</div><div class='del'>-		while (1) {</div><div class='del'>-			u64 bytes;</div><div class='del'>-</div><div class='del'>-			l = path-&gt;nodes[0];</div><div class='del'>-			slot = path-&gt;slots[0];</div><div class='del'>-			if (slot &gt;= btrfs_header_nritems(l)) {</div><div class='del'>-				ret = btrfs_next_leaf(root, path);</div><div class='del'>-				if (ret == 0)</div><div class='del'>-					continue;</div><div class='del'>-				if (ret &lt; 0)</div><div class='del'>-					goto out;</div><div class='del'>-</div><div class='del'>-				stop_loop = 1;</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			btrfs_item_key_to_cpu(l, &amp;key, slot);</div><div class='add'>+	/* Check if all data stripes are empty. */</div><div class='add'>+	for (int i = 0; i &lt; data_stripes; i++) {</div><div class='add'>+		stripe = &amp;sctx-&gt;raid56_data_stripes[i];</div><div class='add'>+		if (!scrub_bitmap_empty_has_extent(stripe)) {</div><div class='add'>+			all_empty = false;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	if (all_empty) {</div><div class='add'>+		ret = 0;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-			if (key.type != BTRFS_EXTENT_ITEM_KEY &amp;&amp;</div><div class='del'>-			    key.type != BTRFS_METADATA_ITEM_KEY)</div><div class='del'>-				goto next;</div><div class='add'>+	for (int i = 0; i &lt; data_stripes; i++) {</div><div class='add'>+		stripe = &amp;sctx-&gt;raid56_data_stripes[i];</div><div class='add'>+		scrub_submit_initial_read(sctx, stripe);</div><div class='add'>+	}</div><div class='add'>+	for (int i = 0; i &lt; data_stripes; i++) {</div><div class='add'>+		stripe = &amp;sctx-&gt;raid56_data_stripes[i];</div><div class='ctx'> </div><div class='del'>-			if (key.type == BTRFS_METADATA_ITEM_KEY)</div><div class='del'>-				bytes = fs_info-&gt;nodesize;</div><div class='del'>-			else</div><div class='del'>-				bytes = key.offset;</div><div class='add'>+		wait_event(stripe-&gt;repair_wait,</div><div class='add'>+			   test_bit(SCRUB_STRIPE_FLAG_REPAIR_DONE, &amp;stripe-&gt;state));</div><div class='add'>+	}</div><div class='add'>+	/* For now, no zoned support for RAID56. */</div><div class='add'>+	ASSERT(!btrfs_is_zoned(sctx-&gt;fs_info));</div><div class='ctx'> </div><div class='del'>-			if (key.objectid + bytes &lt;= logic_start)</div><div class='del'>-				goto next;</div><div class='add'>+	/*</div><div class='add'>+	 * Now all data stripes are properly verified. Check if we have any</div><div class='add'>+	 * unrepaired, if so abort immediately or we could further corrupt the</div><div class='add'>+	 * P/Q stripes.</div><div class='add'>+	 *</div><div class='add'>+	 * During the loop, also populate extent_bitmap.</div><div class='add'>+	 */</div><div class='add'>+	for (int i = 0; i &lt; data_stripes; i++) {</div><div class='add'>+		unsigned long error;</div><div class='add'>+		unsigned long has_extent;</div><div class='ctx'> </div><div class='del'>-			if (key.objectid &gt;= logic_end) {</div><div class='del'>-				stop_loop = 1;</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='add'>+		stripe = &amp;sctx-&gt;raid56_data_stripes[i];</div><div class='ctx'> </div><div class='del'>-			while (key.objectid &gt;= logic_start + map-&gt;stripe_len)</div><div class='del'>-				logic_start += map-&gt;stripe_len;</div><div class='del'>-</div><div class='del'>-			extent = btrfs_item_ptr(l, slot,</div><div class='del'>-						struct btrfs_extent_item);</div><div class='del'>-			flags = btrfs_extent_flags(l, extent);</div><div class='del'>-			generation = btrfs_extent_generation(l, extent);</div><div class='del'>-</div><div class='del'>-			if ((flags &amp; BTRFS_EXTENT_FLAG_TREE_BLOCK) &amp;&amp;</div><div class='del'>-			    (key.objectid &lt; logic_start ||</div><div class='del'>-			     key.objectid + bytes &gt;</div><div class='del'>-			     logic_start + map-&gt;stripe_len)) {</div><div class='del'>-				btrfs_err(fs_info,</div><div class='del'>-					  "scrub: tree block %llu spanning stripes, ignored. logical=%llu",</div><div class='del'>-					  key.objectid, logic_start);</div><div class='del'>-				spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-				sctx-&gt;stat.uncorrectable_errors++;</div><div class='del'>-				spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-				goto next;</div><div class='del'>-			}</div><div class='del'>-again:</div><div class='del'>-			extent_logical = key.objectid;</div><div class='del'>-			ASSERT(bytes &lt;= U32_MAX);</div><div class='del'>-			extent_len = bytes;</div><div class='del'>-</div><div class='del'>-			if (extent_logical &lt; logic_start) {</div><div class='del'>-				extent_len -= logic_start - extent_logical;</div><div class='del'>-				extent_logical = logic_start;</div><div class='del'>-			}</div><div class='add'>+		error = scrub_bitmap_read_error(stripe);</div><div class='add'>+		has_extent = scrub_bitmap_read_has_extent(stripe);</div><div class='ctx'> </div><div class='del'>-			if (extent_logical + extent_len &gt;</div><div class='del'>-			    logic_start + map-&gt;stripe_len)</div><div class='del'>-				extent_len = logic_start + map-&gt;stripe_len -</div><div class='del'>-					     extent_logical;</div><div class='del'>-</div><div class='del'>-			scrub_parity_mark_sectors_data(sparity, extent_logical,</div><div class='del'>-						       extent_len);</div><div class='del'>-</div><div class='del'>-			mapped_length = extent_len;</div><div class='del'>-			bioc = NULL;</div><div class='del'>-			ret = btrfs_map_block(fs_info, BTRFS_MAP_READ,</div><div class='del'>-					extent_logical, &amp;mapped_length, &amp;bioc,</div><div class='del'>-					0);</div><div class='del'>-			if (!ret) {</div><div class='del'>-				if (!bioc || mapped_length &lt; extent_len)</div><div class='del'>-					ret = -EIO;</div><div class='del'>-			}</div><div class='del'>-			if (ret) {</div><div class='del'>-				btrfs_put_bioc(bioc);</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-			extent_physical = bioc-&gt;stripes[0].physical;</div><div class='del'>-			extent_mirror_num = bioc-&gt;mirror_num;</div><div class='del'>-			extent_dev = bioc-&gt;stripes[0].dev;</div><div class='del'>-			btrfs_put_bioc(bioc);</div><div class='add'>+		/*</div><div class='add'>+		 * We should only check the errors where there is an extent.</div><div class='add'>+		 * As we may hit an empty data stripe while it's missing.</div><div class='add'>+		 */</div><div class='add'>+		bitmap_and(&amp;error, &amp;error, &amp;has_extent, stripe-&gt;nr_sectors);</div><div class='add'>+		if (unlikely(!bitmap_empty(&amp;error, stripe-&gt;nr_sectors))) {</div><div class='add'>+			btrfs_err(fs_info,</div><div class='add'>+"scrub: unrepaired sectors detected, full stripe %llu data stripe %u errors %*pbl",</div><div class='add'>+				  full_stripe_start, i, stripe-&gt;nr_sectors,</div><div class='add'>+				  &amp;error);</div><div class='add'>+			ret = -EIO;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		bitmap_or(&amp;extent_bitmap, &amp;extent_bitmap, &amp;has_extent,</div><div class='add'>+			  stripe-&gt;nr_sectors);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-			ret = btrfs_lookup_csums_range(csum_root,</div><div class='del'>-						extent_logical,</div><div class='del'>-						extent_logical + extent_len - 1,</div><div class='del'>-						&amp;sctx-&gt;csum_list, 1);</div><div class='del'>-			if (ret)</div><div class='del'>-				goto out;</div><div class='add'>+	/* Now we can check and regenerate the P/Q stripe. */</div><div class='add'>+	ret = scrub_raid56_cached_parity(sctx, scrub_dev, map, full_stripe_start,</div><div class='add'>+					 &amp;extent_bitmap);</div><div class='add'>+out:</div><div class='add'>+	btrfs_release_path(&amp;extent_path);</div><div class='add'>+	btrfs_release_path(&amp;csum_path);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-			ret = scrub_extent_for_parity(sparity, extent_logical,</div><div class='del'>-						      extent_len,</div><div class='del'>-						      extent_physical,</div><div class='del'>-						      extent_dev, flags,</div><div class='del'>-						      generation,</div><div class='del'>-						      extent_mirror_num);</div><div class='add'>+/*</div><div class='add'>+ * Scrub one range which can only has simple mirror based profile.</div><div class='add'>+ * (Including all range in SINGLE/DUP/RAID1/RAID1C*, and each stripe in</div><div class='add'>+ *  RAID0/RAID10).</div><div class='add'>+ *</div><div class='add'>+ * Since we may need to handle a subset of block group, we need @logical_start</div><div class='add'>+ * and @logical_length parameter.</div><div class='add'>+ */</div><div class='add'>+static int scrub_simple_mirror(struct scrub_ctx *sctx,</div><div class='add'>+			       struct btrfs_block_group *bg,</div><div class='add'>+			       u64 logical_start, u64 logical_length,</div><div class='add'>+			       struct btrfs_device *device,</div><div class='add'>+			       u64 physical, int mirror_num)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = sctx-&gt;fs_info;</div><div class='add'>+	const u64 logical_end = logical_start + logical_length;</div><div class='add'>+	u64 cur_logical = logical_start;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='del'>-			scrub_free_csums(sctx);</div><div class='add'>+	/* The range must be inside the bg */</div><div class='add'>+	ASSERT(logical_start &gt;= bg-&gt;start &amp;&amp; logical_end &lt;= bg-&gt;start + bg-&gt;length);</div><div class='ctx'> </div><div class='del'>-			if (ret)</div><div class='del'>-				goto out;</div><div class='add'>+	/* Go through each extent items inside the logical range */</div><div class='add'>+	while (cur_logical &lt; logical_end) {</div><div class='add'>+		u64 found_logical = U64_MAX;</div><div class='add'>+		u64 cur_physical = physical + cur_logical - logical_start;</div><div class='ctx'> </div><div class='del'>-			if (extent_logical + extent_len &lt;</div><div class='del'>-			    key.objectid + bytes) {</div><div class='del'>-				logic_start += map-&gt;stripe_len;</div><div class='add'>+		ret = should_cancel_scrub(sctx);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			break;</div><div class='ctx'> </div><div class='del'>-				if (logic_start &gt;= logic_end) {</div><div class='del'>-					stop_loop = 1;</div><div class='del'>-					break;</div><div class='del'>-				}</div><div class='add'>+		if (atomic_read(&amp;fs_info-&gt;scrub_pause_req))</div><div class='add'>+			scrub_blocked_if_needed(fs_info);</div><div class='ctx'> </div><div class='del'>-				if (logic_start &lt; key.objectid + bytes) {</div><div class='del'>-					cond_resched();</div><div class='del'>-					goto again;</div><div class='del'>-				}</div><div class='del'>-			}</div><div class='del'>-next:</div><div class='del'>-			path-&gt;slots[0]++;</div><div class='add'>+		spin_lock(&amp;bg-&gt;lock);</div><div class='add'>+		if (test_bit(BLOCK_GROUP_FLAG_REMOVED, &amp;bg-&gt;runtime_flags)) {</div><div class='add'>+			spin_unlock(&amp;bg-&gt;lock);</div><div class='add'>+			ret = 0;</div><div class='add'>+			break;</div><div class='ctx'> 		}</div><div class='add'>+		spin_unlock(&amp;bg-&gt;lock);</div><div class='ctx'> </div><div class='del'>-		btrfs_release_path(path);</div><div class='del'>-</div><div class='del'>-		if (stop_loop)</div><div class='add'>+		ret = queue_scrub_stripe(sctx, bg, device, mirror_num,</div><div class='add'>+					 cur_logical, logical_end - cur_logical,</div><div class='add'>+					 cur_physical, &amp;found_logical);</div><div class='add'>+		if (ret &gt; 0) {</div><div class='add'>+			/* No more extent, just update the accounting */</div><div class='add'>+			spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='add'>+			sctx-&gt;stat.last_physical = physical + logical_length;</div><div class='add'>+			spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='add'>+			ret = 0;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		if (ret &lt; 0)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		logic_start += map-&gt;stripe_len;</div><div class='del'>-	}</div><div class='del'>-out:</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		ASSERT(logic_end - logic_start &lt;= U32_MAX);</div><div class='del'>-		scrub_parity_mark_sectors_error(sparity, logic_start,</div><div class='del'>-						logic_end - logic_start);</div><div class='del'>-	}</div><div class='del'>-	scrub_parity_put(sparity);</div><div class='del'>-	scrub_submit(sctx);</div><div class='del'>-	mutex_lock(&amp;sctx-&gt;wr_lock);</div><div class='del'>-	scrub_wr_submit(sctx);</div><div class='del'>-	mutex_unlock(&amp;sctx-&gt;wr_lock);</div><div class='add'>+		/* queue_scrub_stripe() returned 0, @found_logical must be updated. */</div><div class='add'>+		ASSERT(found_logical != U64_MAX);</div><div class='add'>+		cur_logical = found_logical + BTRFS_STRIPE_LEN;</div><div class='ctx'> </div><div class='del'>-	btrfs_release_path(path);</div><div class='del'>-	return ret &lt; 0 ? ret : 0;</div><div class='add'>+		/* Don't hold CPU for too long time */</div><div class='add'>+		cond_resched();</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void sync_replace_for_zoned(struct scrub_ctx *sctx)</div><div class='add'>+/* Calculate the full stripe length for simple stripe based profiles */</div><div class='add'>+static u64 simple_stripe_full_stripe_len(const struct btrfs_chunk_map *map)</div><div class='ctx'> {</div><div class='del'>-	if (!btrfs_is_zoned(sctx-&gt;fs_info))</div><div class='del'>-		return;</div><div class='add'>+	ASSERT(map-&gt;type &amp; (BTRFS_BLOCK_GROUP_RAID0 |</div><div class='add'>+			    BTRFS_BLOCK_GROUP_RAID10));</div><div class='ctx'> </div><div class='del'>-	sctx-&gt;flush_all_writes = true;</div><div class='del'>-	scrub_submit(sctx);</div><div class='del'>-	mutex_lock(&amp;sctx-&gt;wr_lock);</div><div class='del'>-	scrub_wr_submit(sctx);</div><div class='del'>-	mutex_unlock(&amp;sctx-&gt;wr_lock);</div><div class='add'>+	return btrfs_stripe_nr_to_offset(map-&gt;num_stripes / map-&gt;sub_stripes);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Get the logical bytenr for the stripe */</div><div class='add'>+static u64 simple_stripe_get_logical(struct btrfs_chunk_map *map,</div><div class='add'>+				     struct btrfs_block_group *bg,</div><div class='add'>+				     int stripe_index)</div><div class='add'>+{</div><div class='add'>+	ASSERT(map-&gt;type &amp; (BTRFS_BLOCK_GROUP_RAID0 |</div><div class='add'>+			    BTRFS_BLOCK_GROUP_RAID10));</div><div class='add'>+	ASSERT(stripe_index &lt; map-&gt;num_stripes);</div><div class='ctx'> </div><div class='del'>-	wait_event(sctx-&gt;list_wait, atomic_read(&amp;sctx-&gt;bios_in_flight) == 0);</div><div class='add'>+	/*</div><div class='add'>+	 * (stripe_index / sub_stripes) gives how many data stripes we need to</div><div class='add'>+	 * skip.</div><div class='add'>+	 */</div><div class='add'>+	return btrfs_stripe_nr_to_offset(stripe_index / map-&gt;sub_stripes) +</div><div class='add'>+	       bg-&gt;start;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int sync_write_pointer_for_zoned(struct scrub_ctx *sctx, u64 logical,</div><div class='del'>-					u64 physical, u64 physical_end)</div><div class='add'>+/* Get the mirror number for the stripe */</div><div class='add'>+static int simple_stripe_mirror_num(struct btrfs_chunk_map *map, int stripe_index)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = sctx-&gt;fs_info;</div><div class='del'>-	int ret = 0;</div><div class='add'>+	ASSERT(map-&gt;type &amp; (BTRFS_BLOCK_GROUP_RAID0 |</div><div class='add'>+			    BTRFS_BLOCK_GROUP_RAID10));</div><div class='add'>+	ASSERT(stripe_index &lt; map-&gt;num_stripes);</div><div class='ctx'> </div><div class='del'>-	if (!btrfs_is_zoned(fs_info))</div><div class='del'>-		return 0;</div><div class='add'>+	/* For RAID0, it's fixed to 1, for RAID10 it's 0,1,0,1... */</div><div class='add'>+	return stripe_index % map-&gt;sub_stripes + 1;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	wait_event(sctx-&gt;list_wait, atomic_read(&amp;sctx-&gt;bios_in_flight) == 0);</div><div class='add'>+static int scrub_simple_stripe(struct scrub_ctx *sctx,</div><div class='add'>+			       struct btrfs_block_group *bg,</div><div class='add'>+			       struct btrfs_chunk_map *map,</div><div class='add'>+			       struct btrfs_device *device,</div><div class='add'>+			       int stripe_index)</div><div class='add'>+{</div><div class='add'>+	const u64 logical_increment = simple_stripe_full_stripe_len(map);</div><div class='add'>+	const u64 orig_logical = simple_stripe_get_logical(map, bg, stripe_index);</div><div class='add'>+	const u64 orig_physical = map-&gt;stripes[stripe_index].physical;</div><div class='add'>+	const int mirror_num = simple_stripe_mirror_num(map, stripe_index);</div><div class='add'>+	u64 cur_logical = orig_logical;</div><div class='add'>+	u64 cur_physical = orig_physical;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;sctx-&gt;wr_lock);</div><div class='del'>-	if (sctx-&gt;write_pointer &lt; physical_end) {</div><div class='del'>-		ret = btrfs_sync_zone_write_pointer(sctx-&gt;wr_tgtdev, logical,</div><div class='del'>-						    physical,</div><div class='del'>-						    sctx-&gt;write_pointer);</div><div class='add'>+	while (cur_logical &lt; bg-&gt;start + bg-&gt;length) {</div><div class='add'>+		/*</div><div class='add'>+		 * Inside each stripe, RAID0 is just SINGLE, and RAID10 is</div><div class='add'>+		 * just RAID1, so we can reuse scrub_simple_mirror() to scrub</div><div class='add'>+		 * this stripe.</div><div class='add'>+		 */</div><div class='add'>+		ret = scrub_simple_mirror(sctx, bg, cur_logical,</div><div class='add'>+					  BTRFS_STRIPE_LEN, device, cur_physical,</div><div class='add'>+					  mirror_num);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			btrfs_err(fs_info,</div><div class='del'>-				  "zoned: failed to recover write pointer");</div><div class='add'>+			return ret;</div><div class='add'>+		/* Skip to next stripe which belongs to the target device */</div><div class='add'>+		cur_logical += logical_increment;</div><div class='add'>+		/* For physical offset, we just go to next stripe */</div><div class='add'>+		cur_physical += BTRFS_STRIPE_LEN;</div><div class='ctx'> 	}</div><div class='del'>-	mutex_unlock(&amp;sctx-&gt;wr_lock);</div><div class='del'>-	btrfs_dev_clear_zone_empty(sctx-&gt;wr_tgtdev, physical);</div><div class='del'>-</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static noinline_for_stack int scrub_stripe(struct scrub_ctx *sctx,</div><div class='del'>-					   struct map_lookup *map,</div><div class='add'>+					   struct btrfs_block_group *bg,</div><div class='add'>+					   struct btrfs_chunk_map *map,</div><div class='ctx'> 					   struct btrfs_device *scrub_dev,</div><div class='del'>-					   int num, u64 base, u64 length,</div><div class='del'>-					   struct btrfs_block_group *cache)</div><div class='add'>+					   int stripe_index)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_path *path, *ppath;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = sctx-&gt;fs_info;</div><div class='del'>-	struct btrfs_root *root = fs_info-&gt;extent_root;</div><div class='del'>-	struct btrfs_root *csum_root = fs_info-&gt;csum_root;</div><div class='del'>-	struct btrfs_extent_item *extent;</div><div class='del'>-	struct blk_plug plug;</div><div class='del'>-	u64 flags;</div><div class='add'>+	const u64 profile = map-&gt;type &amp; BTRFS_BLOCK_GROUP_PROFILE_MASK;</div><div class='add'>+	const u64 chunk_logical = bg-&gt;start;</div><div class='ctx'> 	int ret;</div><div class='del'>-	int slot;</div><div class='del'>-	u64 nstripes;</div><div class='del'>-	struct extent_buffer *l;</div><div class='del'>-	u64 physical;</div><div class='add'>+	int ret2;</div><div class='add'>+	u64 physical = map-&gt;stripes[stripe_index].physical;</div><div class='add'>+	const u64 dev_stripe_len = btrfs_calc_stripe_length(map);</div><div class='add'>+	const u64 physical_end = physical + dev_stripe_len;</div><div class='ctx'> 	u64 logical;</div><div class='ctx'> 	u64 logic_end;</div><div class='del'>-	u64 physical_end;</div><div class='del'>-	u64 generation;</div><div class='del'>-	int mirror_num;</div><div class='del'>-	struct reada_control *reada1;</div><div class='del'>-	struct reada_control *reada2;</div><div class='del'>-	struct btrfs_key key;</div><div class='del'>-	struct btrfs_key key_end;</div><div class='del'>-	u64 increment = map-&gt;stripe_len;</div><div class='add'>+	/* The logical increment after finishing one stripe */</div><div class='add'>+	u64 increment;</div><div class='add'>+	/* Offset inside the chunk */</div><div class='ctx'> 	u64 offset;</div><div class='del'>-	u64 extent_logical;</div><div class='del'>-	u64 extent_physical;</div><div class='del'>-	/*</div><div class='del'>-	 * Unlike chunk length, extent length should never go beyond</div><div class='del'>-	 * BTRFS_MAX_EXTENT_SIZE, thus u32 is enough here.</div><div class='del'>-	 */</div><div class='del'>-	u32 extent_len;</div><div class='ctx'> 	u64 stripe_logical;</div><div class='del'>-	u64 stripe_end;</div><div class='del'>-	struct btrfs_device *extent_dev;</div><div class='del'>-	int extent_mirror_num;</div><div class='del'>-	int stop_loop = 0;</div><div class='del'>-</div><div class='del'>-	physical = map-&gt;stripes[num].physical;</div><div class='del'>-	offset = 0;</div><div class='del'>-	nstripes = div64_u64(length, map-&gt;stripe_len);</div><div class='del'>-	mirror_num = 1;</div><div class='del'>-	increment = map-&gt;stripe_len;</div><div class='del'>-	if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID0) {</div><div class='del'>-		offset = map-&gt;stripe_len * num;</div><div class='del'>-		increment = map-&gt;stripe_len * map-&gt;num_stripes;</div><div class='del'>-	} else if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID10) {</div><div class='del'>-		int factor = map-&gt;num_stripes / map-&gt;sub_stripes;</div><div class='del'>-		offset = map-&gt;stripe_len * (num / map-&gt;sub_stripes);</div><div class='del'>-		increment = map-&gt;stripe_len * factor;</div><div class='del'>-		mirror_num = num % map-&gt;sub_stripes + 1;</div><div class='del'>-	} else if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID1_MASK) {</div><div class='del'>-		mirror_num = num % map-&gt;num_stripes + 1;</div><div class='del'>-	} else if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_DUP) {</div><div class='del'>-		mirror_num = num % map-&gt;num_stripes + 1;</div><div class='del'>-	} else if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID56_MASK) {</div><div class='del'>-		get_raid56_logic_offset(physical, num, map, &amp;offset, NULL);</div><div class='del'>-		increment = map-&gt;stripe_len * nr_data_stripes(map);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	path = btrfs_alloc_path();</div><div class='del'>-	if (!path)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	ppath = btrfs_alloc_path();</div><div class='del'>-	if (!ppath) {</div><div class='del'>-		btrfs_free_path(path);</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * work on commit root. The related disk blocks are static as</div><div class='del'>-	 * long as COW is applied. This means, it is save to rewrite</div><div class='del'>-	 * them to repair disk errors without any race conditions</div><div class='del'>-	 */</div><div class='del'>-	path-&gt;search_commit_root = 1;</div><div class='del'>-	path-&gt;skip_locking = 1;</div><div class='add'>+	/* Extent_path should be released by now. */</div><div class='add'>+	ASSERT(sctx-&gt;extent_path.nodes[0] == NULL);</div><div class='ctx'> </div><div class='del'>-	ppath-&gt;search_commit_root = 1;</div><div class='del'>-	ppath-&gt;skip_locking = 1;</div><div class='del'>-	/*</div><div class='del'>-	 * trigger the readahead for extent tree csum tree and wait for</div><div class='del'>-	 * completion. During readahead, the scrub is officially paused</div><div class='del'>-	 * to not hold off transaction commits</div><div class='del'>-	 */</div><div class='del'>-	logical = base + offset;</div><div class='del'>-	physical_end = physical + nstripes * map-&gt;stripe_len;</div><div class='del'>-	if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID56_MASK) {</div><div class='del'>-		get_raid56_logic_offset(physical_end, num,</div><div class='del'>-					map, &amp;logic_end, NULL);</div><div class='del'>-		logic_end += base;</div><div class='del'>-	} else {</div><div class='del'>-		logic_end = logical + increment * nstripes;</div><div class='del'>-	}</div><div class='del'>-	wait_event(sctx-&gt;list_wait,</div><div class='del'>-		   atomic_read(&amp;sctx-&gt;bios_in_flight) == 0);</div><div class='ctx'> 	scrub_blocked_if_needed(fs_info);</div><div class='ctx'> </div><div class='del'>-	/* FIXME it might be better to start readahead at commit root */</div><div class='del'>-	key.objectid = logical;</div><div class='del'>-	key.type = BTRFS_EXTENT_ITEM_KEY;</div><div class='del'>-	key.offset = (u64)0;</div><div class='del'>-	key_end.objectid = logic_end;</div><div class='del'>-	key_end.type = BTRFS_METADATA_ITEM_KEY;</div><div class='del'>-	key_end.offset = (u64)-1;</div><div class='del'>-	reada1 = btrfs_reada_add(root, &amp;key, &amp;key_end);</div><div class='del'>-</div><div class='del'>-	if (cache-&gt;flags &amp; BTRFS_BLOCK_GROUP_DATA) {</div><div class='del'>-		key.objectid = BTRFS_EXTENT_CSUM_OBJECTID;</div><div class='del'>-		key.type = BTRFS_EXTENT_CSUM_KEY;</div><div class='del'>-		key.offset = logical;</div><div class='del'>-		key_end.objectid = BTRFS_EXTENT_CSUM_OBJECTID;</div><div class='del'>-		key_end.type = BTRFS_EXTENT_CSUM_KEY;</div><div class='del'>-		key_end.offset = logic_end;</div><div class='del'>-		reada2 = btrfs_reada_add(csum_root, &amp;key, &amp;key_end);</div><div class='del'>-	} else {</div><div class='del'>-		reada2 = NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!IS_ERR(reada1))</div><div class='del'>-		btrfs_reada_wait(reada1);</div><div class='del'>-	if (!IS_ERR_OR_NULL(reada2))</div><div class='del'>-		btrfs_reada_wait(reada2);</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * collect all data csums for the stripe to avoid seeking during</div><div class='del'>-	 * the scrub. This might currently (crc32) end up to be about 1MB</div><div class='del'>-	 */</div><div class='del'>-	blk_start_plug(&amp;plug);</div><div class='del'>-</div><div class='ctx'> 	if (sctx-&gt;is_dev_replace &amp;&amp;</div><div class='ctx'> 	    btrfs_dev_is_sequential(sctx-&gt;wr_tgtdev, physical)) {</div><div class='ctx'> 		mutex_lock(&amp;sctx-&gt;wr_lock);</div><div class='ctx'> 		sctx-&gt;write_pointer = physical;</div><div class='ctx'> 		mutex_unlock(&amp;sctx-&gt;wr_lock);</div><div class='del'>-		sctx-&gt;flush_all_writes = true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * now find all extents for each stripe and scrub them</div><div class='del'>-	 */</div><div class='del'>-	ret = 0;</div><div class='del'>-	while (physical &lt; physical_end) {</div><div class='del'>-		/*</div><div class='del'>-		 * canceled?</div><div class='del'>-		 */</div><div class='del'>-		if (atomic_read(&amp;fs_info-&gt;scrub_cancel_req) ||</div><div class='del'>-		    atomic_read(&amp;sctx-&gt;cancel_req)) {</div><div class='del'>-			ret = -ECANCELED;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		/*</div><div class='del'>-		 * check to see if we have to pause</div><div class='del'>-		 */</div><div class='del'>-		if (atomic_read(&amp;fs_info-&gt;scrub_pause_req)) {</div><div class='del'>-			/* push queued extents */</div><div class='del'>-			sctx-&gt;flush_all_writes = true;</div><div class='del'>-			scrub_submit(sctx);</div><div class='del'>-			mutex_lock(&amp;sctx-&gt;wr_lock);</div><div class='del'>-			scrub_wr_submit(sctx);</div><div class='del'>-			mutex_unlock(&amp;sctx-&gt;wr_lock);</div><div class='del'>-			wait_event(sctx-&gt;list_wait,</div><div class='del'>-				   atomic_read(&amp;sctx-&gt;bios_in_flight) == 0);</div><div class='del'>-			sctx-&gt;flush_all_writes = false;</div><div class='del'>-			scrub_blocked_if_needed(fs_info);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID56_MASK) {</div><div class='del'>-			ret = get_raid56_logic_offset(physical, num, map,</div><div class='del'>-						      &amp;logical,</div><div class='del'>-						      &amp;stripe_logical);</div><div class='del'>-			logical += base;</div><div class='del'>-			if (ret) {</div><div class='del'>-				/* it is parity strip */</div><div class='del'>-				stripe_logical += base;</div><div class='del'>-				stripe_end = stripe_logical + increment;</div><div class='del'>-				ret = scrub_raid56_parity(sctx, map, scrub_dev,</div><div class='del'>-							  ppath, stripe_logical,</div><div class='del'>-							  stripe_end);</div><div class='del'>-				if (ret)</div><div class='del'>-					goto out;</div><div class='del'>-				goto skip;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (btrfs_fs_incompat(fs_info, SKINNY_METADATA))</div><div class='del'>-			key.type = BTRFS_METADATA_ITEM_KEY;</div><div class='del'>-		else</div><div class='del'>-			key.type = BTRFS_EXTENT_ITEM_KEY;</div><div class='del'>-		key.objectid = logical;</div><div class='del'>-		key.offset = (u64)-1;</div><div class='add'>+	/* Prepare the extra data stripes used by RAID56. */</div><div class='add'>+	if (profile &amp; BTRFS_BLOCK_GROUP_RAID56_MASK) {</div><div class='add'>+		ASSERT(sctx-&gt;raid56_data_stripes == NULL);</div><div class='ctx'> </div><div class='del'>-		ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='del'>-		if (ret &lt; 0)</div><div class='add'>+		sctx-&gt;raid56_data_stripes = kcalloc(nr_data_stripes(map),</div><div class='add'>+						    sizeof(struct scrub_stripe),</div><div class='add'>+						    GFP_KERNEL);</div><div class='add'>+		if (!sctx-&gt;raid56_data_stripes) {</div><div class='add'>+			ret = -ENOMEM;</div><div class='ctx'> 			goto out;</div><div class='del'>-</div><div class='del'>-		if (ret &gt; 0) {</div><div class='del'>-			ret = btrfs_previous_extent_item(root, path, 0);</div><div class='add'>+		}</div><div class='add'>+		for (int i = 0; i &lt; nr_data_stripes(map); i++) {</div><div class='add'>+			ret = init_scrub_stripe(fs_info,</div><div class='add'>+						&amp;sctx-&gt;raid56_data_stripes[i]);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='ctx'> 				goto out;</div><div class='del'>-			if (ret &gt; 0) {</div><div class='del'>-				/* there's no smaller item, so stick with the</div><div class='del'>-				 * larger one */</div><div class='del'>-				btrfs_release_path(path);</div><div class='del'>-				ret = btrfs_search_slot(NULL, root, &amp;key,</div><div class='del'>-							path, 0, 0);</div><div class='del'>-				if (ret &lt; 0)</div><div class='del'>-					goto out;</div><div class='del'>-			}</div><div class='add'>+			sctx-&gt;raid56_data_stripes[i].bg = bg;</div><div class='add'>+			sctx-&gt;raid56_data_stripes[i].sctx = sctx;</div><div class='ctx'> 		}</div><div class='add'>+	}</div><div class='add'>+	/*</div><div class='add'>+	 * There used to be a big double loop to handle all profiles using the</div><div class='add'>+	 * same routine, which grows larger and more gross over time.</div><div class='add'>+	 *</div><div class='add'>+	 * So here we handle each profile differently, so simpler profiles</div><div class='add'>+	 * have simpler scrubbing function.</div><div class='add'>+	 */</div><div class='add'>+	if (!(profile &amp; (BTRFS_BLOCK_GROUP_RAID0 | BTRFS_BLOCK_GROUP_RAID10 |</div><div class='add'>+			 BTRFS_BLOCK_GROUP_RAID56_MASK))) {</div><div class='add'>+		/*</div><div class='add'>+		 * Above check rules out all complex profile, the remaining</div><div class='add'>+		 * profiles are SINGLE|DUP|RAID1|RAID1C*, which is simple</div><div class='add'>+		 * mirrored duplication without stripe.</div><div class='add'>+		 *</div><div class='add'>+		 * Only @physical and @mirror_num needs to calculated using</div><div class='add'>+		 * @stripe_index.</div><div class='add'>+		 */</div><div class='add'>+		ret = scrub_simple_mirror(sctx, bg, bg-&gt;start, bg-&gt;length,</div><div class='add'>+				scrub_dev, map-&gt;stripes[stripe_index].physical,</div><div class='add'>+				stripe_index + 1);</div><div class='add'>+		offset = 0;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	if (profile &amp; (BTRFS_BLOCK_GROUP_RAID0 | BTRFS_BLOCK_GROUP_RAID10)) {</div><div class='add'>+		ret = scrub_simple_stripe(sctx, bg, map, scrub_dev, stripe_index);</div><div class='add'>+		offset = btrfs_stripe_nr_to_offset(stripe_index / map-&gt;sub_stripes);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		stop_loop = 0;</div><div class='del'>-		while (1) {</div><div class='del'>-			u64 bytes;</div><div class='del'>-</div><div class='del'>-			l = path-&gt;nodes[0];</div><div class='del'>-			slot = path-&gt;slots[0];</div><div class='del'>-			if (slot &gt;= btrfs_header_nritems(l)) {</div><div class='del'>-				ret = btrfs_next_leaf(root, path);</div><div class='del'>-				if (ret == 0)</div><div class='del'>-					continue;</div><div class='del'>-				if (ret &lt; 0)</div><div class='del'>-					goto out;</div><div class='del'>-</div><div class='del'>-				stop_loop = 1;</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			btrfs_item_key_to_cpu(l, &amp;key, slot);</div><div class='del'>-</div><div class='del'>-			if (key.type != BTRFS_EXTENT_ITEM_KEY &amp;&amp;</div><div class='del'>-			    key.type != BTRFS_METADATA_ITEM_KEY)</div><div class='del'>-				goto next;</div><div class='del'>-</div><div class='del'>-			if (key.type == BTRFS_METADATA_ITEM_KEY)</div><div class='del'>-				bytes = fs_info-&gt;nodesize;</div><div class='del'>-			else</div><div class='del'>-				bytes = key.offset;</div><div class='del'>-</div><div class='del'>-			if (key.objectid + bytes &lt;= logical)</div><div class='del'>-				goto next;</div><div class='del'>-</div><div class='del'>-			if (key.objectid &gt;= logical + map-&gt;stripe_len) {</div><div class='del'>-				/* out of this device extent */</div><div class='del'>-				if (key.objectid &gt;= logic_end)</div><div class='del'>-					stop_loop = 1;</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			/*</div><div class='del'>-			 * If our block group was removed in the meanwhile, just</div><div class='del'>-			 * stop scrubbing since there is no point in continuing.</div><div class='del'>-			 * Continuing would prevent reusing its device extents</div><div class='del'>-			 * for new block groups for a long time.</div><div class='del'>-			 */</div><div class='del'>-			spin_lock(&amp;cache-&gt;lock);</div><div class='del'>-			if (cache-&gt;removed) {</div><div class='del'>-				spin_unlock(&amp;cache-&gt;lock);</div><div class='del'>-				ret = 0;</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-			spin_unlock(&amp;cache-&gt;lock);</div><div class='del'>-</div><div class='del'>-			extent = btrfs_item_ptr(l, slot,</div><div class='del'>-						struct btrfs_extent_item);</div><div class='del'>-			flags = btrfs_extent_flags(l, extent);</div><div class='del'>-			generation = btrfs_extent_generation(l, extent);</div><div class='del'>-</div><div class='del'>-			if ((flags &amp; BTRFS_EXTENT_FLAG_TREE_BLOCK) &amp;&amp;</div><div class='del'>-			    (key.objectid &lt; logical ||</div><div class='del'>-			     key.objectid + bytes &gt;</div><div class='del'>-			     logical + map-&gt;stripe_len)) {</div><div class='del'>-				btrfs_err(fs_info,</div><div class='del'>-					   "scrub: tree block %llu spanning stripes, ignored. logical=%llu",</div><div class='del'>-				       key.objectid, logical);</div><div class='del'>-				spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-				sctx-&gt;stat.uncorrectable_errors++;</div><div class='del'>-				spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-				goto next;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-again:</div><div class='del'>-			extent_logical = key.objectid;</div><div class='del'>-			ASSERT(bytes &lt;= U32_MAX);</div><div class='del'>-			extent_len = bytes;</div><div class='del'>-</div><div class='del'>-			/*</div><div class='del'>-			 * trim extent to this stripe</div><div class='del'>-			 */</div><div class='del'>-			if (extent_logical &lt; logical) {</div><div class='del'>-				extent_len -= logical - extent_logical;</div><div class='del'>-				extent_logical = logical;</div><div class='del'>-			}</div><div class='del'>-			if (extent_logical + extent_len &gt;</div><div class='del'>-			    logical + map-&gt;stripe_len) {</div><div class='del'>-				extent_len = logical + map-&gt;stripe_len -</div><div class='del'>-					     extent_logical;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			extent_physical = extent_logical - logical + physical;</div><div class='del'>-			extent_dev = scrub_dev;</div><div class='del'>-			extent_mirror_num = mirror_num;</div><div class='del'>-			if (sctx-&gt;is_dev_replace)</div><div class='del'>-				scrub_remap_extent(fs_info, extent_logical,</div><div class='del'>-						   extent_len, &amp;extent_physical,</div><div class='del'>-						   &amp;extent_dev,</div><div class='del'>-						   &amp;extent_mirror_num);</div><div class='del'>-</div><div class='del'>-			if (flags &amp; BTRFS_EXTENT_FLAG_DATA) {</div><div class='del'>-				ret = btrfs_lookup_csums_range(csum_root,</div><div class='del'>-						extent_logical,</div><div class='del'>-						extent_logical + extent_len - 1,</div><div class='del'>-						&amp;sctx-&gt;csum_list, 1);</div><div class='del'>-				if (ret)</div><div class='del'>-					goto out;</div><div class='del'>-			}</div><div class='add'>+	/* Only RAID56 goes through the old code */</div><div class='add'>+	ASSERT(map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID56_MASK);</div><div class='add'>+	ret = 0;</div><div class='ctx'> </div><div class='del'>-			ret = scrub_extent(sctx, map, extent_logical, extent_len,</div><div class='del'>-					   extent_physical, extent_dev, flags,</div><div class='del'>-					   generation, extent_mirror_num,</div><div class='del'>-					   extent_logical - logical + physical);</div><div class='add'>+	/* Calculate the logical end of the stripe */</div><div class='add'>+	get_raid56_logic_offset(physical_end, stripe_index,</div><div class='add'>+				map, &amp;logic_end, NULL);</div><div class='add'>+	logic_end += chunk_logical;</div><div class='ctx'> </div><div class='del'>-			scrub_free_csums(sctx);</div><div class='add'>+	/* Initialize @offset in case we need to go to out: label */</div><div class='add'>+	get_raid56_logic_offset(physical, stripe_index, map, &amp;offset, NULL);</div><div class='add'>+	increment = btrfs_stripe_nr_to_offset(nr_data_stripes(map));</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Due to the rotation, for RAID56 it's better to iterate each stripe</div><div class='add'>+	 * using their physical offset.</div><div class='add'>+	 */</div><div class='add'>+	while (physical &lt; physical_end) {</div><div class='add'>+		ret = get_raid56_logic_offset(physical, stripe_index, map,</div><div class='add'>+					      &amp;logical, &amp;stripe_logical);</div><div class='add'>+		logical += chunk_logical;</div><div class='add'>+		if (ret) {</div><div class='add'>+			/* it is parity strip */</div><div class='add'>+			stripe_logical += chunk_logical;</div><div class='add'>+			ret = scrub_raid56_parity_stripe(sctx, scrub_dev, bg,</div><div class='add'>+							 map, stripe_logical);</div><div class='add'>+			spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='add'>+			sctx-&gt;stat.last_physical = min(physical + BTRFS_STRIPE_LEN,</div><div class='add'>+						       physical_end);</div><div class='add'>+			spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				goto out;</div><div class='add'>+			goto next;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-			if (sctx-&gt;is_dev_replace)</div><div class='del'>-				sync_replace_for_zoned(sctx);</div><div class='del'>-</div><div class='del'>-			if (extent_logical + extent_len &lt;</div><div class='del'>-			    key.objectid + bytes) {</div><div class='del'>-				if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID56_MASK) {</div><div class='del'>-					/*</div><div class='del'>-					 * loop until we find next data stripe</div><div class='del'>-					 * or we have finished all stripes.</div><div class='del'>-					 */</div><div class='del'>-loop:</div><div class='del'>-					physical += map-&gt;stripe_len;</div><div class='del'>-					ret = get_raid56_logic_offset(physical,</div><div class='del'>-							num, map, &amp;logical,</div><div class='del'>-							&amp;stripe_logical);</div><div class='del'>-					logical += base;</div><div class='del'>-</div><div class='del'>-					if (ret &amp;&amp; physical &lt; physical_end) {</div><div class='del'>-						stripe_logical += base;</div><div class='del'>-						stripe_end = stripe_logical +</div><div class='del'>-								increment;</div><div class='del'>-						ret = scrub_raid56_parity(sctx,</div><div class='del'>-							map, scrub_dev, ppath,</div><div class='del'>-							stripe_logical,</div><div class='del'>-							stripe_end);</div><div class='del'>-						if (ret)</div><div class='del'>-							goto out;</div><div class='del'>-						goto loop;</div><div class='del'>-					}</div><div class='del'>-				} else {</div><div class='del'>-					physical += map-&gt;stripe_len;</div><div class='del'>-					logical += increment;</div><div class='del'>-				}</div><div class='del'>-				if (logical &lt; key.objectid + bytes) {</div><div class='del'>-					cond_resched();</div><div class='del'>-					goto again;</div><div class='del'>-				}</div><div class='del'>-</div><div class='del'>-				if (physical &gt;= physical_end) {</div><div class='del'>-					stop_loop = 1;</div><div class='del'>-					break;</div><div class='del'>-				}</div><div class='del'>-			}</div><div class='add'>+		/*</div><div class='add'>+		 * Now we're at a data stripe, scrub each extents in the range.</div><div class='add'>+		 *</div><div class='add'>+		 * At this stage, if we ignore the repair part, inside each data</div><div class='add'>+		 * stripe it is no different than SINGLE profile.</div><div class='add'>+		 * We can reuse scrub_simple_mirror() here, as the repair part</div><div class='add'>+		 * is still based on @mirror_num.</div><div class='add'>+		 */</div><div class='add'>+		ret = scrub_simple_mirror(sctx, bg, logical, BTRFS_STRIPE_LEN,</div><div class='add'>+					  scrub_dev, physical, 1);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out;</div><div class='ctx'> next:</div><div class='del'>-			path-&gt;slots[0]++;</div><div class='del'>-		}</div><div class='del'>-		btrfs_release_path(path);</div><div class='del'>-skip:</div><div class='ctx'> 		logical += increment;</div><div class='del'>-		physical += map-&gt;stripe_len;</div><div class='add'>+		physical += BTRFS_STRIPE_LEN;</div><div class='ctx'> 		spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		if (stop_loop)</div><div class='del'>-			sctx-&gt;stat.last_physical = map-&gt;stripes[num].physical +</div><div class='del'>-						   length;</div><div class='del'>-		else</div><div class='del'>-			sctx-&gt;stat.last_physical = physical;</div><div class='add'>+		sctx-&gt;stat.last_physical = physical;</div><div class='ctx'> 		spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='del'>-		if (stop_loop)</div><div class='del'>-			break;</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='del'>-	/* push queued extents */</div><div class='del'>-	scrub_submit(sctx);</div><div class='del'>-	mutex_lock(&amp;sctx-&gt;wr_lock);</div><div class='del'>-	scrub_wr_submit(sctx);</div><div class='del'>-	mutex_unlock(&amp;sctx-&gt;wr_lock);</div><div class='add'>+	ret2 = flush_scrub_stripes(sctx);</div><div class='add'>+	if (!ret)</div><div class='add'>+		ret = ret2;</div><div class='add'>+	btrfs_release_path(&amp;sctx-&gt;extent_path);</div><div class='add'>+	btrfs_release_path(&amp;sctx-&gt;csum_path);</div><div class='ctx'> </div><div class='del'>-	blk_finish_plug(&amp;plug);</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	btrfs_free_path(ppath);</div><div class='add'>+	if (sctx-&gt;raid56_data_stripes) {</div><div class='add'>+		for (int i = 0; i &lt; nr_data_stripes(map); i++)</div><div class='add'>+			release_scrub_stripe(&amp;sctx-&gt;raid56_data_stripes[i]);</div><div class='add'>+		kfree(sctx-&gt;raid56_data_stripes);</div><div class='add'>+		sctx-&gt;raid56_data_stripes = NULL;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (sctx-&gt;is_dev_replace &amp;&amp; ret &gt;= 0) {</div><div class='del'>-		int ret2;</div><div class='del'>-</div><div class='del'>-		ret2 = sync_write_pointer_for_zoned(sctx, base + offset,</div><div class='del'>-						    map-&gt;stripes[num].physical,</div><div class='del'>-						    physical_end);</div><div class='add'>+		ret2 = sync_write_pointer_for_zoned(sctx,</div><div class='add'>+				chunk_logical + offset,</div><div class='add'>+				map-&gt;stripes[stripe_index].physical,</div><div class='add'>+				physical_end);</div><div class='ctx'> 		if (ret2)</div><div class='ctx'> 			ret = ret2;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3576,53 +2608,44 @@ out:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static noinline_for_stack int scrub_chunk(struct scrub_ctx *sctx,</div><div class='add'>+					  struct btrfs_block_group *bg,</div><div class='ctx'> 					  struct btrfs_device *scrub_dev,</div><div class='del'>-					  u64 chunk_offset, u64 length,</div><div class='ctx'> 					  u64 dev_offset,</div><div class='del'>-					  struct btrfs_block_group *cache)</div><div class='add'>+					  u64 dev_extent_len)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = sctx-&gt;fs_info;</div><div class='del'>-	struct extent_map_tree *map_tree = &amp;fs_info-&gt;mapping_tree;</div><div class='del'>-	struct map_lookup *map;</div><div class='del'>-	struct extent_map *em;</div><div class='add'>+	struct btrfs_chunk_map *map;</div><div class='ctx'> 	int i;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	read_lock(&amp;map_tree-&gt;lock);</div><div class='del'>-	em = lookup_extent_mapping(map_tree, chunk_offset, 1);</div><div class='del'>-	read_unlock(&amp;map_tree-&gt;lock);</div><div class='del'>-</div><div class='del'>-	if (!em) {</div><div class='add'>+	map = btrfs_find_chunk_map(fs_info, bg-&gt;start, bg-&gt;length);</div><div class='add'>+	if (!map) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Might have been an unused block group deleted by the cleaner</div><div class='ctx'> 		 * kthread or relocation.</div><div class='ctx'> 		 */</div><div class='del'>-		spin_lock(&amp;cache-&gt;lock);</div><div class='del'>-		if (!cache-&gt;removed)</div><div class='add'>+		spin_lock(&amp;bg-&gt;lock);</div><div class='add'>+		if (!test_bit(BLOCK_GROUP_FLAG_REMOVED, &amp;bg-&gt;runtime_flags))</div><div class='ctx'> 			ret = -EINVAL;</div><div class='del'>-		spin_unlock(&amp;cache-&gt;lock);</div><div class='add'>+		spin_unlock(&amp;bg-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	map = em-&gt;map_lookup;</div><div class='del'>-	if (em-&gt;start != chunk_offset)</div><div class='add'>+	if (map-&gt;start != bg-&gt;start)</div><div class='ctx'> 		goto out;</div><div class='del'>-</div><div class='del'>-	if (em-&gt;len &lt; length)</div><div class='add'>+	if (map-&gt;chunk_len &lt; dev_extent_len)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; map-&gt;num_stripes; ++i) {</div><div class='ctx'> 		if (map-&gt;stripes[i].dev-&gt;bdev == scrub_dev-&gt;bdev &amp;&amp;</div><div class='ctx'> 		    map-&gt;stripes[i].physical == dev_offset) {</div><div class='del'>-			ret = scrub_stripe(sctx, map, scrub_dev, i,</div><div class='del'>-					   chunk_offset, length, cache);</div><div class='add'>+			ret = scrub_stripe(sctx, bg, map, scrub_dev, i);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_chunk_map(map);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -3631,19 +2654,15 @@ static int finish_extent_writes_for_zoned(struct btrfs_root *root,</div><div class='ctx'> 					  struct btrfs_block_group *cache)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = cache-&gt;fs_info;</div><div class='del'>-	struct btrfs_trans_handle *trans;</div><div class='ctx'> </div><div class='ctx'> 	if (!btrfs_is_zoned(fs_info))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	btrfs_wait_block_group_reservations(cache);</div><div class='ctx'> 	btrfs_wait_nocow_writers(cache);</div><div class='del'>-	btrfs_wait_ordered_roots(fs_info, U64_MAX, cache-&gt;start, cache-&gt;length);</div><div class='add'>+	btrfs_wait_ordered_roots(fs_info, U64_MAX, cache);</div><div class='ctx'> </div><div class='del'>-	trans = btrfs_join_transaction(root);</div><div class='del'>-	if (IS_ERR(trans))</div><div class='del'>-		return PTR_ERR(trans);</div><div class='del'>-	return btrfs_commit_transaction(trans);</div><div class='add'>+	return btrfs_commit_current_transaction(root);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static noinline_for_stack</div><div class='hunk'>@@ -3651,10 +2670,9 @@ int scrub_enumerate_chunks(struct scrub_ctx *sctx,</div><div class='ctx'> 			   struct btrfs_device *scrub_dev, u64 start, u64 end)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_dev_extent *dev_extent = NULL;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = sctx-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_root *root = fs_info-&gt;dev_root;</div><div class='del'>-	u64 length;</div><div class='ctx'> 	u64 chunk_offset;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int ro_set;</div><div class='hunk'>@@ -3670,14 +2688,16 @@ int scrub_enumerate_chunks(struct scrub_ctx *sctx,</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	path-&gt;reada = READA_FORWARD;</div><div class='del'>-	path-&gt;search_commit_root = 1;</div><div class='del'>-	path-&gt;skip_locking = 1;</div><div class='add'>+	path-&gt;search_commit_root = true;</div><div class='add'>+	path-&gt;skip_locking = true;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = scrub_dev-&gt;devid;</div><div class='del'>-	key.offset = 0ull;</div><div class='ctx'> 	key.type = BTRFS_DEV_EXTENT_KEY;</div><div class='add'>+	key.offset = 0ull;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='add'>+		u64 dev_extent_len;</div><div class='add'>+</div><div class='ctx'> 		ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -3714,9 +2734,9 @@ int scrub_enumerate_chunks(struct scrub_ctx *sctx,</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='ctx'> 		dev_extent = btrfs_item_ptr(l, slot, struct btrfs_dev_extent);</div><div class='del'>-		length = btrfs_dev_extent_length(l, dev_extent);</div><div class='add'>+		dev_extent_len = btrfs_dev_extent_length(l, dev_extent);</div><div class='ctx'> </div><div class='del'>-		if (found_key.offset + length &lt;= start)</div><div class='add'>+		if (found_key.offset + dev_extent_len &lt;= start)</div><div class='ctx'> 			goto skip;</div><div class='ctx'> </div><div class='ctx'> 		chunk_offset = btrfs_dev_extent_chunk_offset(l, dev_extent);</div><div class='hunk'>@@ -3732,14 +2752,36 @@ int scrub_enumerate_chunks(struct scrub_ctx *sctx,</div><div class='ctx'> 		if (!cache)</div><div class='ctx'> 			goto skip;</div><div class='ctx'> </div><div class='add'>+		ASSERT(cache-&gt;start &lt;= chunk_offset);</div><div class='add'>+		/*</div><div class='add'>+		 * We are using the commit root to search for device extents, so</div><div class='add'>+		 * that means we could have found a device extent item from a</div><div class='add'>+		 * block group that was deleted in the current transaction. The</div><div class='add'>+		 * logical start offset of the deleted block group, stored at</div><div class='add'>+		 * @chunk_offset, might be part of the logical address range of</div><div class='add'>+		 * a new block group (which uses different physical extents).</div><div class='add'>+		 * In this case btrfs_lookup_block_group() has returned the new</div><div class='add'>+		 * block group, and its start address is less than @chunk_offset.</div><div class='add'>+		 *</div><div class='add'>+		 * We skip such new block groups, because it's pointless to</div><div class='add'>+		 * process them, as we won't find their extents because we search</div><div class='add'>+		 * for them using the commit root of the extent tree. For a device</div><div class='add'>+		 * replace it's also fine to skip it, we won't miss copying them</div><div class='add'>+		 * to the target device because we have the write duplication</div><div class='add'>+		 * setup through the regular write path (by btrfs_map_block()),</div><div class='add'>+		 * and we have committed a transaction when we started the device</div><div class='add'>+		 * replace, right after setting up the device replace state.</div><div class='add'>+		 */</div><div class='add'>+		if (cache-&gt;start &lt; chunk_offset) {</div><div class='add'>+			btrfs_put_block_group(cache);</div><div class='add'>+			goto skip;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		if (sctx-&gt;is_dev_replace &amp;&amp; btrfs_is_zoned(fs_info)) {</div><div class='del'>-			spin_lock(&amp;cache-&gt;lock);</div><div class='del'>-			if (!cache-&gt;to_copy) {</div><div class='del'>-				spin_unlock(&amp;cache-&gt;lock);</div><div class='add'>+			if (!test_bit(BLOCK_GROUP_FLAG_TO_COPY, &amp;cache-&gt;runtime_flags)) {</div><div class='ctx'> 				btrfs_put_block_group(cache);</div><div class='ctx'> 				goto skip;</div><div class='ctx'> 			}</div><div class='del'>-			spin_unlock(&amp;cache-&gt;lock);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='hunk'>@@ -3751,7 +2793,7 @@ int scrub_enumerate_chunks(struct scrub_ctx *sctx,</div><div class='ctx'> 		 * repair extents.</div><div class='ctx'> 		 */</div><div class='ctx'> 		spin_lock(&amp;cache-&gt;lock);</div><div class='del'>-		if (cache-&gt;removed) {</div><div class='add'>+		if (test_bit(BLOCK_GROUP_FLAG_REMOVED, &amp;cache-&gt;runtime_flags)) {</div><div class='ctx'> 			spin_unlock(&amp;cache-&gt;lock);</div><div class='ctx'> 			btrfs_put_block_group(cache);</div><div class='ctx'> 			goto skip;</div><div class='hunk'>@@ -3812,25 +2854,32 @@ int scrub_enumerate_chunks(struct scrub_ctx *sctx,</div><div class='ctx'> </div><div class='ctx'> 		if (ret == 0) {</div><div class='ctx'> 			ro_set = 1;</div><div class='del'>-		} else if (ret == -ENOSPC &amp;&amp; !sctx-&gt;is_dev_replace) {</div><div class='add'>+		} else if (ret == -ENOSPC &amp;&amp; !sctx-&gt;is_dev_replace &amp;&amp;</div><div class='add'>+			   !(cache-&gt;flags &amp; BTRFS_BLOCK_GROUP_RAID56_MASK)) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * btrfs_inc_block_group_ro return -ENOSPC when it</div><div class='ctx'> 			 * failed in creating new chunk for metadata.</div><div class='ctx'> 			 * It is not a problem for scrub, because</div><div class='ctx'> 			 * metadata are always cowed, and our scrub paused</div><div class='ctx'> 			 * commit_transactions.</div><div class='add'>+			 *</div><div class='add'>+			 * For RAID56 chunks, we have to mark them read-only</div><div class='add'>+			 * for scrub, as later we would use our own cache</div><div class='add'>+			 * out of RAID56 realm.</div><div class='add'>+			 * Thus we want the RAID56 bg to be marked RO to</div><div class='add'>+			 * prevent RMW from screwing up out cache.</div><div class='ctx'> 			 */</div><div class='ctx'> 			ro_set = 0;</div><div class='ctx'> 		} else if (ret == -ETXTBSY) {</div><div class='ctx'> 			btrfs_warn(fs_info,</div><div class='del'>-		   "skipping scrub of block group %llu due to active swapfile",</div><div class='add'>+	     "scrub: skipping scrub of block group %llu due to active swapfile",</div><div class='ctx'> 				   cache-&gt;start);</div><div class='ctx'> 			scrub_pause_off(fs_info);</div><div class='ctx'> 			ret = 0;</div><div class='ctx'> 			goto skip_unfreeze;</div><div class='ctx'> 		} else {</div><div class='del'>-			btrfs_warn(fs_info,</div><div class='del'>-				   "failed setting block group ro: %d", ret);</div><div class='add'>+			btrfs_warn(fs_info, "scrub: failed setting block group ro: %d",</div><div class='add'>+				   ret);</div><div class='ctx'> 			btrfs_unfreeze_block_group(cache);</div><div class='ctx'> 			btrfs_put_block_group(cache);</div><div class='ctx'> 			scrub_pause_off(fs_info);</div><div class='hunk'>@@ -3844,52 +2893,18 @@ int scrub_enumerate_chunks(struct scrub_ctx *sctx,</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (sctx-&gt;is_dev_replace) {</div><div class='ctx'> 			btrfs_wait_nocow_writers(cache);</div><div class='del'>-			btrfs_wait_ordered_roots(fs_info, U64_MAX, cache-&gt;start,</div><div class='del'>-					cache-&gt;length);</div><div class='add'>+			btrfs_wait_ordered_roots(fs_info, U64_MAX, cache);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		scrub_pause_off(fs_info);</div><div class='ctx'> 		down_write(&amp;dev_replace-&gt;rwsem);</div><div class='del'>-		dev_replace-&gt;cursor_right = found_key.offset + length;</div><div class='add'>+		dev_replace-&gt;cursor_right = found_key.offset + dev_extent_len;</div><div class='ctx'> 		dev_replace-&gt;cursor_left = found_key.offset;</div><div class='ctx'> 		dev_replace-&gt;item_needs_writeback = 1;</div><div class='ctx'> 		up_write(&amp;dev_replace-&gt;rwsem);</div><div class='ctx'> </div><div class='del'>-		ret = scrub_chunk(sctx, scrub_dev, chunk_offset, length,</div><div class='del'>-				  found_key.offset, cache);</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * flush, submit all pending read and write bios, afterwards</div><div class='del'>-		 * wait for them.</div><div class='del'>-		 * Note that in the dev replace case, a read request causes</div><div class='del'>-		 * write requests that are submitted in the read completion</div><div class='del'>-		 * worker. Therefore in the current situation, it is required</div><div class='del'>-		 * that all write requests are flushed, so that all read and</div><div class='del'>-		 * write requests are really completed when bios_in_flight</div><div class='del'>-		 * changes to 0.</div><div class='del'>-		 */</div><div class='del'>-		sctx-&gt;flush_all_writes = true;</div><div class='del'>-		scrub_submit(sctx);</div><div class='del'>-		mutex_lock(&amp;sctx-&gt;wr_lock);</div><div class='del'>-		scrub_wr_submit(sctx);</div><div class='del'>-		mutex_unlock(&amp;sctx-&gt;wr_lock);</div><div class='del'>-</div><div class='del'>-		wait_event(sctx-&gt;list_wait,</div><div class='del'>-			   atomic_read(&amp;sctx-&gt;bios_in_flight) == 0);</div><div class='del'>-</div><div class='del'>-		scrub_pause_on(fs_info);</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * must be called before we decrease @scrub_paused.</div><div class='del'>-		 * make sure we don't block transaction commit while</div><div class='del'>-		 * we are waiting pending workers finished.</div><div class='del'>-		 */</div><div class='del'>-		wait_event(sctx-&gt;list_wait,</div><div class='del'>-			   atomic_read(&amp;sctx-&gt;workers_pending) == 0);</div><div class='del'>-		sctx-&gt;flush_all_writes = false;</div><div class='del'>-</div><div class='del'>-		scrub_pause_off(fs_info);</div><div class='del'>-</div><div class='add'>+		ret = scrub_chunk(sctx, cache, scrub_dev, found_key.offset,</div><div class='add'>+				  dev_extent_len);</div><div class='ctx'> 		if (sctx-&gt;is_dev_replace &amp;&amp;</div><div class='ctx'> 		    !btrfs_finish_block_group_to_copy(dev_replace-&gt;srcdev,</div><div class='ctx'> 						      cache, found_key.offset))</div><div class='hunk'>@@ -3911,8 +2926,8 @@ int scrub_enumerate_chunks(struct scrub_ctx *sctx,</div><div class='ctx'> 		 * balance is triggered or it becomes used and unused again.</div><div class='ctx'> 		 */</div><div class='ctx'> 		spin_lock(&amp;cache-&gt;lock);</div><div class='del'>-		if (!cache-&gt;removed &amp;&amp; !cache-&gt;ro &amp;&amp; cache-&gt;reserved == 0 &amp;&amp;</div><div class='del'>-		    cache-&gt;used == 0) {</div><div class='add'>+		if (!test_bit(BLOCK_GROUP_FLAG_REMOVED, &amp;cache-&gt;runtime_flags) &amp;&amp;</div><div class='add'>+		    !cache-&gt;ro &amp;&amp; cache-&gt;reserved == 0 &amp;&amp; cache-&gt;used == 0) {</div><div class='ctx'> 			spin_unlock(&amp;cache-&gt;lock);</div><div class='ctx'> 			if (btrfs_test_opt(fs_info, DISCARD_ASYNC))</div><div class='ctx'> 				btrfs_discard_queue_work(&amp;fs_info-&gt;discard_ctl,</div><div class='hunk'>@@ -3927,8 +2942,8 @@ skip_unfreeze:</div><div class='ctx'> 		btrfs_put_block_group(cache);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			break;</div><div class='del'>-		if (sctx-&gt;is_dev_replace &amp;&amp;</div><div class='del'>-		    atomic64_read(&amp;dev_replace-&gt;num_write_errors) &gt; 0) {</div><div class='add'>+		if (unlikely(sctx-&gt;is_dev_replace &amp;&amp;</div><div class='add'>+			     atomic64_read(&amp;dev_replace-&gt;num_write_errors) &gt; 0)) {</div><div class='ctx'> 			ret = -EIO;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -3937,49 +2952,95 @@ skip_unfreeze:</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> skip:</div><div class='del'>-		key.offset = found_key.offset + length;</div><div class='add'>+		key.offset = found_key.offset + dev_extent_len;</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int scrub_one_super(struct scrub_ctx *sctx, struct btrfs_device *dev,</div><div class='add'>+			   struct page *page, u64 physical, u64 generation)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = sctx-&gt;fs_info;</div><div class='add'>+	struct btrfs_super_block *sb = page_address(page);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = bdev_rw_virt(dev-&gt;bdev, physical &gt;&gt; SECTOR_SHIFT, sb,</div><div class='add'>+			BTRFS_SUPER_INFO_SIZE, REQ_OP_READ);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+	ret = btrfs_check_super_csum(fs_info, sb);</div><div class='add'>+	if (unlikely(ret != 0)) {</div><div class='add'>+		btrfs_err_rl(fs_info,</div><div class='add'>+		  "scrub: super block at physical %llu devid %llu has bad csum",</div><div class='add'>+			physical, dev-&gt;devid);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+	if (unlikely(btrfs_super_generation(sb) != generation)) {</div><div class='add'>+		btrfs_err_rl(fs_info,</div><div class='add'>+"scrub: super block at physical %llu devid %llu has bad generation %llu expect %llu",</div><div class='add'>+			     physical, dev-&gt;devid,</div><div class='add'>+			     btrfs_super_generation(sb), generation);</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return btrfs_validate_super(fs_info, sb, -1);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static noinline_for_stack int scrub_supers(struct scrub_ctx *sctx,</div><div class='ctx'> 					   struct btrfs_device *scrub_dev)</div><div class='ctx'> {</div><div class='ctx'> 	int	i;</div><div class='ctx'> 	u64	bytenr;</div><div class='ctx'> 	u64	gen;</div><div class='del'>-	int	ret;</div><div class='add'>+	int ret = 0;</div><div class='add'>+	struct page *page;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = sctx-&gt;fs_info;</div><div class='ctx'> </div><div class='ctx'> 	if (BTRFS_FS_ERROR(fs_info))</div><div class='ctx'> 		return -EROFS;</div><div class='ctx'> </div><div class='add'>+	page = alloc_page(GFP_KERNEL);</div><div class='add'>+	if (!page) {</div><div class='add'>+		spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='add'>+		sctx-&gt;stat.malloc_errors++;</div><div class='add'>+		spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/* Seed devices of a new filesystem has their own generation. */</div><div class='ctx'> 	if (scrub_dev-&gt;fs_devices != fs_info-&gt;fs_devices)</div><div class='ctx'> 		gen = scrub_dev-&gt;generation;</div><div class='ctx'> 	else</div><div class='del'>-		gen = fs_info-&gt;last_trans_committed;</div><div class='add'>+		gen = btrfs_get_last_trans_committed(fs_info);</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; BTRFS_SUPER_MIRROR_MAX; i++) {</div><div class='del'>-		bytenr = btrfs_sb_offset(i);</div><div class='add'>+		ret = btrfs_sb_log_location(scrub_dev, i, 0, &amp;bytenr);</div><div class='add'>+		if (ret == -ENOENT)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		if (ret) {</div><div class='add'>+			spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='add'>+			sctx-&gt;stat.super_errors++;</div><div class='add'>+			spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		if (bytenr + BTRFS_SUPER_INFO_SIZE &gt;</div><div class='ctx'> 		    scrub_dev-&gt;commit_total_bytes)</div><div class='ctx'> 			break;</div><div class='ctx'> 		if (!btrfs_check_super_location(scrub_dev, bytenr))</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		ret = scrub_pages(sctx, bytenr, BTRFS_SUPER_INFO_SIZE, bytenr,</div><div class='del'>-				  scrub_dev, BTRFS_EXTENT_FLAG_SUPER, gen, i,</div><div class='del'>-				  NULL, bytenr);</div><div class='del'>-		if (ret)</div><div class='del'>-			return ret;</div><div class='add'>+		ret = scrub_one_super(sctx, scrub_dev, page, bytenr, gen);</div><div class='add'>+		if (ret) {</div><div class='add'>+			spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='add'>+			sctx-&gt;stat.super_errors++;</div><div class='add'>+			spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='del'>-	wait_event(sctx-&gt;list_wait, atomic_read(&amp;sctx-&gt;bios_in_flight) == 0);</div><div class='del'>-</div><div class='add'>+	__free_page(page);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3987,34 +3048,22 @@ static void scrub_workers_put(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	if (refcount_dec_and_mutex_lock(&amp;fs_info-&gt;scrub_workers_refcnt,</div><div class='ctx'> 					&amp;fs_info-&gt;scrub_lock)) {</div><div class='del'>-		struct btrfs_workqueue *scrub_workers = NULL;</div><div class='del'>-		struct btrfs_workqueue *scrub_wr_comp = NULL;</div><div class='del'>-		struct btrfs_workqueue *scrub_parity = NULL;</div><div class='del'>-</div><div class='del'>-		scrub_workers = fs_info-&gt;scrub_workers;</div><div class='del'>-		scrub_wr_comp = fs_info-&gt;scrub_wr_completion_workers;</div><div class='del'>-		scrub_parity = fs_info-&gt;scrub_parity_workers;</div><div class='add'>+		struct workqueue_struct *scrub_workers = fs_info-&gt;scrub_workers;</div><div class='ctx'> </div><div class='ctx'> 		fs_info-&gt;scrub_workers = NULL;</div><div class='del'>-		fs_info-&gt;scrub_wr_completion_workers = NULL;</div><div class='del'>-		fs_info-&gt;scrub_parity_workers = NULL;</div><div class='ctx'> 		mutex_unlock(&amp;fs_info-&gt;scrub_lock);</div><div class='ctx'> </div><div class='del'>-		btrfs_destroy_workqueue(scrub_workers);</div><div class='del'>-		btrfs_destroy_workqueue(scrub_wr_comp);</div><div class='del'>-		btrfs_destroy_workqueue(scrub_parity);</div><div class='add'>+		if (scrub_workers)</div><div class='add'>+			destroy_workqueue(scrub_workers);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * get a reference count on fs_info-&gt;scrub_workers. start worker if necessary</div><div class='ctx'>  */</div><div class='del'>-static noinline_for_stack int scrub_workers_get(struct btrfs_fs_info *fs_info,</div><div class='del'>-						int is_dev_replace)</div><div class='add'>+static noinline_for_stack int scrub_workers_get(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_workqueue *scrub_workers = NULL;</div><div class='del'>-	struct btrfs_workqueue *scrub_wr_comp = NULL;</div><div class='del'>-	struct btrfs_workqueue *scrub_parity = NULL;</div><div class='add'>+	struct workqueue_struct *scrub_workers = NULL;</div><div class='ctx'> 	unsigned int flags = WQ_FREEZABLE | WQ_UNBOUND;</div><div class='ctx'> 	int max_active = fs_info-&gt;thread_pool_size;</div><div class='ctx'> 	int ret = -ENOMEM;</div><div class='hunk'>@@ -4022,29 +3071,14 @@ static noinline_for_stack int scrub_workers_get(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	if (refcount_inc_not_zero(&amp;fs_info-&gt;scrub_workers_refcnt))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	scrub_workers = btrfs_alloc_workqueue(fs_info, "scrub", flags,</div><div class='del'>-					      is_dev_replace ? 1 : max_active, 4);</div><div class='add'>+	scrub_workers = alloc_workqueue("btrfs-scrub", flags, max_active);</div><div class='ctx'> 	if (!scrub_workers)</div><div class='del'>-		goto fail_scrub_workers;</div><div class='del'>-</div><div class='del'>-	scrub_wr_comp = btrfs_alloc_workqueue(fs_info, "scrubwrc", flags,</div><div class='del'>-					      max_active, 2);</div><div class='del'>-	if (!scrub_wr_comp)</div><div class='del'>-		goto fail_scrub_wr_completion_workers;</div><div class='del'>-</div><div class='del'>-	scrub_parity = btrfs_alloc_workqueue(fs_info, "scrubparity", flags,</div><div class='del'>-					     max_active, 2);</div><div class='del'>-	if (!scrub_parity)</div><div class='del'>-		goto fail_scrub_parity_workers;</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;fs_info-&gt;scrub_lock);</div><div class='ctx'> 	if (refcount_read(&amp;fs_info-&gt;scrub_workers_refcnt) == 0) {</div><div class='del'>-		ASSERT(fs_info-&gt;scrub_workers == NULL &amp;&amp;</div><div class='del'>-		       fs_info-&gt;scrub_wr_completion_workers == NULL &amp;&amp;</div><div class='del'>-		       fs_info-&gt;scrub_parity_workers == NULL);</div><div class='add'>+		ASSERT(fs_info-&gt;scrub_workers == NULL);</div><div class='ctx'> 		fs_info-&gt;scrub_workers = scrub_workers;</div><div class='del'>-		fs_info-&gt;scrub_wr_completion_workers = scrub_wr_comp;</div><div class='del'>-		fs_info-&gt;scrub_parity_workers = scrub_parity;</div><div class='ctx'> 		refcount_set(&amp;fs_info-&gt;scrub_workers_refcnt, 1);</div><div class='ctx'> 		mutex_unlock(&amp;fs_info-&gt;scrub_lock);</div><div class='ctx'> 		return 0;</div><div class='hunk'>@@ -4054,63 +3088,47 @@ static noinline_for_stack int scrub_workers_get(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;scrub_lock);</div><div class='ctx'> </div><div class='ctx'> 	ret = 0;</div><div class='del'>-	btrfs_destroy_workqueue(scrub_parity);</div><div class='del'>-fail_scrub_parity_workers:</div><div class='del'>-	btrfs_destroy_workqueue(scrub_wr_comp);</div><div class='del'>-fail_scrub_wr_completion_workers:</div><div class='del'>-	btrfs_destroy_workqueue(scrub_workers);</div><div class='del'>-fail_scrub_workers:</div><div class='add'>+</div><div class='add'>+	destroy_workqueue(scrub_workers);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_scrub_dev(struct btrfs_fs_info *fs_info, u64 devid, u64 start,</div><div class='ctx'> 		    u64 end, struct btrfs_scrub_progress *progress,</div><div class='del'>-		    int readonly, int is_dev_replace)</div><div class='add'>+		    bool readonly, bool is_dev_replace)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_dev_lookup_args args = { .devid = devid };</div><div class='ctx'> 	struct scrub_ctx *sctx;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct btrfs_device *dev;</div><div class='ctx'> 	unsigned int nofs_flag;</div><div class='add'>+	bool need_commit = false;</div><div class='add'>+</div><div class='add'>+	/* Set the basic fallback @last_physical before we got a sctx. */</div><div class='add'>+	if (progress)</div><div class='add'>+		progress-&gt;last_physical = start;</div><div class='ctx'> </div><div class='ctx'> 	if (btrfs_fs_closing(fs_info))</div><div class='ctx'> 		return -EAGAIN;</div><div class='ctx'> </div><div class='del'>-	if (fs_info-&gt;nodesize &gt; BTRFS_STRIPE_LEN) {</div><div class='del'>-		/*</div><div class='del'>-		 * in this case scrub is unable to calculate the checksum</div><div class='del'>-		 * the way scrub is implemented. Do not handle this</div><div class='del'>-		 * situation at all because it won't ever happen.</div><div class='del'>-		 */</div><div class='del'>-		btrfs_err(fs_info,</div><div class='del'>-			   "scrub: size assumption nodesize &lt;= BTRFS_STRIPE_LEN (%d &lt;= %d) fails",</div><div class='del'>-		       fs_info-&gt;nodesize,</div><div class='del'>-		       BTRFS_STRIPE_LEN);</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='add'>+	/* At mount time we have ensured nodesize is in the range of [4K, 64K]. */</div><div class='add'>+	ASSERT(fs_info-&gt;nodesize &lt;= BTRFS_STRIPE_LEN);</div><div class='ctx'> </div><div class='del'>-	if (fs_info-&gt;nodesize &gt;</div><div class='del'>-	    PAGE_SIZE * SCRUB_MAX_PAGES_PER_BLOCK ||</div><div class='del'>-	    fs_info-&gt;sectorsize &gt; PAGE_SIZE * SCRUB_MAX_PAGES_PER_BLOCK) {</div><div class='del'>-		/*</div><div class='del'>-		 * would exhaust the array bounds of pagev member in</div><div class='del'>-		 * struct scrub_block</div><div class='del'>-		 */</div><div class='del'>-		btrfs_err(fs_info,</div><div class='del'>-			  "scrub: size assumption nodesize and sectorsize &lt;= SCRUB_MAX_PAGES_PER_BLOCK (%d &lt;= %d &amp;&amp; %d &lt;= %d) fails",</div><div class='del'>-		       fs_info-&gt;nodesize,</div><div class='del'>-		       SCRUB_MAX_PAGES_PER_BLOCK,</div><div class='del'>-		       fs_info-&gt;sectorsize,</div><div class='del'>-		       SCRUB_MAX_PAGES_PER_BLOCK);</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='add'>+	/*</div><div class='add'>+	 * SCRUB_MAX_SECTORS_PER_BLOCK is calculated using the largest possible</div><div class='add'>+	 * value (max nodesize / min sectorsize), thus nodesize should always</div><div class='add'>+	 * be fine.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(fs_info-&gt;nodesize &lt;=</div><div class='add'>+	       SCRUB_MAX_SECTORS_PER_BLOCK &lt;&lt; fs_info-&gt;sectorsize_bits);</div><div class='ctx'> </div><div class='ctx'> 	/* Allocate outside of device_list_mutex */</div><div class='ctx'> 	sctx = scrub_setup_ctx(fs_info, is_dev_replace);</div><div class='ctx'> 	if (IS_ERR(sctx))</div><div class='ctx'> 		return PTR_ERR(sctx);</div><div class='add'>+	sctx-&gt;stat.last_physical = start;</div><div class='ctx'> </div><div class='del'>-	ret = scrub_workers_get(fs_info, is_dev_replace);</div><div class='add'>+	ret = scrub_workers_get(fs_info);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out_free_ctx;</div><div class='ctx'> </div><div class='hunk'>@@ -4126,16 +3144,16 @@ int btrfs_scrub_dev(struct btrfs_fs_info *fs_info, u64 devid, u64 start,</div><div class='ctx'> 	if (!is_dev_replace &amp;&amp; !readonly &amp;&amp;</div><div class='ctx'> 	    !test_bit(BTRFS_DEV_STATE_WRITEABLE, &amp;dev-&gt;dev_state)) {</div><div class='ctx'> 		mutex_unlock(&amp;fs_info-&gt;fs_devices-&gt;device_list_mutex);</div><div class='del'>-		btrfs_err_in_rcu(fs_info,</div><div class='del'>-			"scrub on devid %llu: filesystem on %s is not writable",</div><div class='del'>-				 devid, rcu_str_deref(dev-&gt;name));</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+			"scrub: devid %llu: filesystem on %s is not writable",</div><div class='add'>+				 devid, btrfs_dev_name(dev));</div><div class='ctx'> 		ret = -EROFS;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;fs_info-&gt;scrub_lock);</div><div class='del'>-	if (!test_bit(BTRFS_DEV_STATE_IN_FS_METADATA, &amp;dev-&gt;dev_state) ||</div><div class='del'>-	    test_bit(BTRFS_DEV_STATE_REPLACE_TGT, &amp;dev-&gt;dev_state)) {</div><div class='add'>+	if (unlikely(!test_bit(BTRFS_DEV_STATE_IN_FS_METADATA, &amp;dev-&gt;dev_state) ||</div><div class='add'>+		     test_bit(BTRFS_DEV_STATE_REPLACE_TGT, &amp;dev-&gt;dev_state))) {</div><div class='ctx'> 		mutex_unlock(&amp;fs_info-&gt;scrub_lock);</div><div class='ctx'> 		mutex_unlock(&amp;fs_info-&gt;fs_devices-&gt;device_list_mutex);</div><div class='ctx'> 		ret = -EIO;</div><div class='hunk'>@@ -4169,7 +3187,7 @@ int btrfs_scrub_dev(struct btrfs_fs_info *fs_info, u64 devid, u64 start,</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * In order to avoid deadlock with reclaim when there is a transaction</div><div class='ctx'> 	 * trying to pause scrub, make sure we use GFP_NOFS for all the</div><div class='del'>-	 * allocations done at btrfs_scrub_pages() and scrub_pages_for_parity()</div><div class='add'>+	 * allocations done at btrfs_scrub_sectors() and scrub_sectors_for_parity()</div><div class='ctx'> 	 * invoked by our callees. The pausing request is done when the</div><div class='ctx'> 	 * transaction commit starts, and it blocks the transaction until scrub</div><div class='ctx'> 	 * is paused (done at specific points at scrub_stripe() or right above</div><div class='hunk'>@@ -4177,6 +3195,12 @@ int btrfs_scrub_dev(struct btrfs_fs_info *fs_info, u64 devid, u64 start,</div><div class='ctx'> 	 */</div><div class='ctx'> 	nofs_flag = memalloc_nofs_save();</div><div class='ctx'> 	if (!is_dev_replace) {</div><div class='add'>+		u64 old_super_errors;</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='add'>+		old_super_errors = sctx-&gt;stat.super_errors;</div><div class='add'>+		spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='add'>+</div><div class='ctx'> 		btrfs_info(fs_info, "scrub: started on devid %llu", devid);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * by holding device list mutex, we can</div><div class='hunk'>@@ -4185,18 +3209,25 @@ int btrfs_scrub_dev(struct btrfs_fs_info *fs_info, u64 devid, u64 start,</div><div class='ctx'> 		mutex_lock(&amp;fs_info-&gt;fs_devices-&gt;device_list_mutex);</div><div class='ctx'> 		ret = scrub_supers(sctx, dev);</div><div class='ctx'> 		mutex_unlock(&amp;fs_info-&gt;fs_devices-&gt;device_list_mutex);</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;sctx-&gt;stat_lock);</div><div class='add'>+		/*</div><div class='add'>+		 * Super block errors found, but we can not commit transaction</div><div class='add'>+		 * at current context, since btrfs_commit_transaction() needs</div><div class='add'>+		 * to pause the current running scrub (hold by ourselves).</div><div class='add'>+		 */</div><div class='add'>+		if (sctx-&gt;stat.super_errors &gt; old_super_errors &amp;&amp; !sctx-&gt;readonly)</div><div class='add'>+			need_commit = true;</div><div class='add'>+		spin_unlock(&amp;sctx-&gt;stat_lock);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		ret = scrub_enumerate_chunks(sctx, dev, start, end);</div><div class='ctx'> 	memalloc_nofs_restore(nofs_flag);</div><div class='ctx'> </div><div class='del'>-	wait_event(sctx-&gt;list_wait, atomic_read(&amp;sctx-&gt;bios_in_flight) == 0);</div><div class='ctx'> 	atomic_dec(&amp;fs_info-&gt;scrubs_running);</div><div class='ctx'> 	wake_up(&amp;fs_info-&gt;scrub_pause_wait);</div><div class='ctx'> </div><div class='del'>-	wait_event(sctx-&gt;list_wait, atomic_read(&amp;sctx-&gt;workers_pending) == 0);</div><div class='del'>-</div><div class='ctx'> 	if (progress)</div><div class='ctx'> 		memcpy(progress, &amp;sctx-&gt;stat, sizeof(*progress));</div><div class='ctx'> </div><div class='hunk'>@@ -4211,6 +3242,25 @@ int btrfs_scrub_dev(struct btrfs_fs_info *fs_info, u64 devid, u64 start,</div><div class='ctx'> 	scrub_workers_put(fs_info);</div><div class='ctx'> 	scrub_put_ctx(sctx);</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * We found some super block errors before, now try to force a</div><div class='add'>+	 * transaction commit, as scrub has finished.</div><div class='add'>+	 */</div><div class='add'>+	if (need_commit) {</div><div class='add'>+		struct btrfs_trans_handle *trans;</div><div class='add'>+</div><div class='add'>+		trans = btrfs_start_transaction(fs_info-&gt;tree_root, 0);</div><div class='add'>+		if (IS_ERR(trans)) {</div><div class='add'>+			ret = PTR_ERR(trans);</div><div class='add'>+			btrfs_err(fs_info,</div><div class='add'>+	"scrub: failed to start transaction to fix super block errors: %d", ret);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='add'>+		ret = btrfs_commit_transaction(trans);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			btrfs_err(fs_info,</div><div class='add'>+	"scrub: failed to commit transaction to fix super block errors: %d", ret);</div><div class='add'>+	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> out:</div><div class='ctx'> 	scrub_workers_put(fs_info);</div><div class='hunk'>@@ -4302,28 +3352,3 @@ int btrfs_scrub_progress(struct btrfs_fs_info *fs_info, u64 devid,</div><div class='ctx'> </div><div class='ctx'> 	return dev ? (sctx ? 0 : -ENOTCONN) : -ENODEV;</div><div class='ctx'> }</div><div class='del'>-</div><div class='del'>-static void scrub_remap_extent(struct btrfs_fs_info *fs_info,</div><div class='del'>-			       u64 extent_logical, u32 extent_len,</div><div class='del'>-			       u64 *extent_physical,</div><div class='del'>-			       struct btrfs_device **extent_dev,</div><div class='del'>-			       int *extent_mirror_num)</div><div class='del'>-{</div><div class='del'>-	u64 mapped_length;</div><div class='del'>-	struct btrfs_io_context *bioc = NULL;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	mapped_length = extent_len;</div><div class='del'>-	ret = btrfs_map_block(fs_info, BTRFS_MAP_READ, extent_logical,</div><div class='del'>-			      &amp;mapped_length, &amp;bioc, 0);</div><div class='del'>-	if (ret || !bioc || mapped_length &lt; extent_len ||</div><div class='del'>-	    !bioc-&gt;stripes[0].dev-&gt;bdev) {</div><div class='del'>-		btrfs_put_bioc(bioc);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	*extent_physical = bioc-&gt;stripes[0].physical;</div><div class='del'>-	*extent_mirror_num = bioc-&gt;mirror_num;</div><div class='del'>-	*extent_dev = bioc-&gt;stripes[0].dev;</div><div class='del'>-	btrfs_put_bioc(bioc);</div><div class='del'>-}</div><div class='head'>diff --git a/fs/btrfs/scrub.h b/fs/btrfs/scrub.h<br/>new file mode 100644<br/>index 000000000000..aa68b6ebaf55<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/scrub.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/scrub.h</a></div><div class='hunk'>@@ -0,0 +1,22 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+</div><div class='add'>+#ifndef BTRFS_SCRUB_H</div><div class='add'>+#define BTRFS_SCRUB_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+struct btrfs_device;</div><div class='add'>+struct btrfs_scrub_progress;</div><div class='add'>+</div><div class='add'>+int btrfs_scrub_dev(struct btrfs_fs_info *fs_info, u64 devid, u64 start,</div><div class='add'>+		    u64 end, struct btrfs_scrub_progress *progress,</div><div class='add'>+		    bool readonly, bool is_dev_replace);</div><div class='add'>+void btrfs_scrub_pause(struct btrfs_fs_info *fs_info);</div><div class='add'>+void btrfs_scrub_continue(struct btrfs_fs_info *fs_info);</div><div class='add'>+int btrfs_scrub_cancel(struct btrfs_fs_info *info);</div><div class='add'>+int btrfs_scrub_cancel_dev(struct btrfs_device *dev);</div><div class='add'>+int btrfs_scrub_progress(struct btrfs_fs_info *fs_info, u64 devid,</div><div class='add'>+			 struct btrfs_scrub_progress *progress);</div><div class='add'>+</div><div class='add'>+#endif</div><div class='head'>diff --git a/fs/btrfs/send.c b/fs/btrfs/send.c<br/>index 040324d71118..2522faa97478 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/send.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/send.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/send.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/send.c</a></div><div class='hunk'>@@ -4,6 +4,7 @@</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/bsearch.h&gt;</div><div class='add'>+#include &lt;linux/falloc.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/file.h&gt;</div><div class='ctx'> #include &lt;linux/sort.h&gt;</div><div class='hunk'>@@ -15,15 +16,22 @@</div><div class='ctx'> #include &lt;linux/string.h&gt;</div><div class='ctx'> #include &lt;linux/compat.h&gt;</div><div class='ctx'> #include &lt;linux/crc32c.h&gt;</div><div class='del'>-</div><div class='add'>+#include &lt;linux/fsverity.h&gt;</div><div class='ctx'> #include "send.h"</div><div class='add'>+#include "ctree.h"</div><div class='ctx'> #include "backref.h"</div><div class='ctx'> #include "locking.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='ctx'> #include "btrfs_inode.h"</div><div class='ctx'> #include "transaction.h"</div><div class='ctx'> #include "compression.h"</div><div class='del'>-#include "xattr.h"</div><div class='add'>+#include "print-tree.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "dir-item.h"</div><div class='add'>+#include "file-item.h"</div><div class='add'>+#include "ioctl.h"</div><div class='add'>+#include "verity.h"</div><div class='add'>+#include "lru_cache.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Maximum number of references an extent can have in order for us to attempt to</div><div class='hunk'>@@ -31,7 +39,7 @@</div><div class='ctx'>  * avoid hitting limitations of the backreference walking code (taking a lot of</div><div class='ctx'>  * time and using too much memory for extents with large number of references).</div><div class='ctx'>  */</div><div class='del'>-#define SEND_MAX_EXTENT_REFS	64</div><div class='add'>+#define SEND_MAX_EXTENT_REFS	1024</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * A fs_path is a helper to dynamically build path names with unknown size.</div><div class='hunk'>@@ -39,28 +47,30 @@</div><div class='ctx'>  * It allows fast adding of path elements on the right side (normal path) and</div><div class='ctx'>  * fast adding to the left side (reversed path). A reversed path can also be</div><div class='ctx'>  * unreversed if needed.</div><div class='add'>+ *</div><div class='add'>+ * The definition of struct fs_path relies on -fms-extensions to allow</div><div class='add'>+ * including a tagged struct as an anonymous member.</div><div class='ctx'>  */</div><div class='add'>+struct __fs_path {</div><div class='add'>+	char *start;</div><div class='add'>+	char *end;</div><div class='add'>+</div><div class='add'>+	char *buf;</div><div class='add'>+	unsigned short buf_len:15;</div><div class='add'>+	unsigned short reversed:1;</div><div class='add'>+};</div><div class='add'>+static_assert(sizeof(struct __fs_path) &lt; 256);</div><div class='ctx'> struct fs_path {</div><div class='del'>-	union {</div><div class='del'>-		struct {</div><div class='del'>-			char *start;</div><div class='del'>-			char *end;</div><div class='del'>-</div><div class='del'>-			char *buf;</div><div class='del'>-			unsigned short buf_len:15;</div><div class='del'>-			unsigned short reversed:1;</div><div class='del'>-			char inline_buf[];</div><div class='del'>-		};</div><div class='del'>-		/*</div><div class='del'>-		 * Average path length does not exceed 200 bytes, we'll have</div><div class='del'>-		 * better packing in the slab and higher chance to satisfy</div><div class='del'>-		 * a allocation later during send.</div><div class='del'>-		 */</div><div class='del'>-		char pad[256];</div><div class='del'>-	};</div><div class='add'>+	struct __fs_path;</div><div class='add'>+	/*</div><div class='add'>+	 * Average path length does not exceed 200 bytes, we'll have</div><div class='add'>+	 * better packing in the slab and higher chance to satisfy</div><div class='add'>+	 * an allocation later during send.</div><div class='add'>+	 */</div><div class='add'>+	char inline_buf[256 - sizeof(struct __fs_path)];</div><div class='ctx'> };</div><div class='ctx'> #define FS_PATH_INLINE_SIZE \</div><div class='del'>-	(sizeof(struct fs_path) - offsetof(struct fs_path, inline_buf))</div><div class='add'>+	sizeof_field(struct fs_path, inline_buf)</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> /* reused for each extent */</div><div class='hunk'>@@ -68,12 +78,61 @@ struct clone_root {</div><div class='ctx'> 	struct btrfs_root *root;</div><div class='ctx'> 	u64 ino;</div><div class='ctx'> 	u64 offset;</div><div class='add'>+	u64 num_bytes;</div><div class='add'>+	bool found_ref;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+#define SEND_MAX_NAME_CACHE_SIZE			256</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Limit the root_ids array of struct backref_cache_entry to 17 elements.</div><div class='add'>+ * This makes the size of a cache entry to be exactly 192 bytes on x86_64, which</div><div class='add'>+ * can be satisfied from the kmalloc-192 slab, without wasting any space.</div><div class='add'>+ * The most common case is to have a single root for cloning, which corresponds</div><div class='add'>+ * to the send root. Having the user specify more than 16 clone roots is not</div><div class='add'>+ * common, and in such rare cases we simply don't use caching if the number of</div><div class='add'>+ * cloning roots that lead down to a leaf is more than 17.</div><div class='add'>+ */</div><div class='add'>+#define SEND_MAX_BACKREF_CACHE_ROOTS			17</div><div class='ctx'> </div><div class='del'>-	u64 found_refs;</div><div class='add'>+/*</div><div class='add'>+ * Max number of entries in the cache.</div><div class='add'>+ * With SEND_MAX_BACKREF_CACHE_ROOTS as 17, the size in bytes, excluding</div><div class='add'>+ * maple tree's internal nodes, is 24K.</div><div class='add'>+ */</div><div class='add'>+#define SEND_MAX_BACKREF_CACHE_SIZE 128</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * A backref cache entry maps a leaf to a list of IDs of roots from which the</div><div class='add'>+ * leaf is accessible and we can use for clone operations.</div><div class='add'>+ * With SEND_MAX_BACKREF_CACHE_ROOTS as 12, each cache entry is 128 bytes (on</div><div class='add'>+ * x86_64).</div><div class='add'>+ */</div><div class='add'>+struct backref_cache_entry {</div><div class='add'>+	struct btrfs_lru_cache_entry entry;</div><div class='add'>+	u64 root_ids[SEND_MAX_BACKREF_CACHE_ROOTS];</div><div class='add'>+	/* Number of valid elements in the root_ids array. */</div><div class='add'>+	int num_roots;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-#define SEND_CTX_MAX_NAME_CACHE_SIZE 128</div><div class='del'>-#define SEND_CTX_NAME_CACHE_CLEAN_SIZE (SEND_CTX_MAX_NAME_CACHE_SIZE * 2)</div><div class='add'>+/* See the comment at lru_cache.h about struct btrfs_lru_cache_entry. */</div><div class='add'>+static_assert(offsetof(struct backref_cache_entry, entry) == 0);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Max number of entries in the cache that stores directories that were already</div><div class='add'>+ * created. The cache uses raw struct btrfs_lru_cache_entry entries, so it uses</div><div class='add'>+ * at most 4096 bytes - sizeof(struct btrfs_lru_cache_entry) is 48 bytes, but</div><div class='add'>+ * the kmalloc-64 slab is used, so we get 4096 bytes (64 bytes * 64).</div><div class='add'>+ */</div><div class='add'>+#define SEND_MAX_DIR_CREATED_CACHE_SIZE			64</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Max number of entries in the cache that stores directories that were already</div><div class='add'>+ * created. The cache uses raw struct btrfs_lru_cache_entry entries, so it uses</div><div class='add'>+ * at most 4096 bytes - sizeof(struct btrfs_lru_cache_entry) is 48 bytes, but</div><div class='add'>+ * the kmalloc-64 slab is used, so we get 4096 bytes (64 bytes * 64).</div><div class='add'>+ */</div><div class='add'>+#define SEND_MAX_DIR_UTIMES_CACHE_SIZE			64</div><div class='ctx'> </div><div class='ctx'> struct send_ctx {</div><div class='ctx'> 	struct file *send_filp;</div><div class='hunk'>@@ -81,8 +140,12 @@ struct send_ctx {</div><div class='ctx'> 	char *send_buf;</div><div class='ctx'> 	u32 send_size;</div><div class='ctx'> 	u32 send_max_size;</div><div class='del'>-	u64 total_send_size;</div><div class='del'>-	u64 cmd_send_size[BTRFS_SEND_C_MAX + 1];</div><div class='add'>+	/*</div><div class='add'>+	 * Whether BTRFS_SEND_A_DATA attribute was already added to current</div><div class='add'>+	 * command (since protocol v2, data must be the last attribute).</div><div class='add'>+	 */</div><div class='add'>+	bool put_data;</div><div class='add'>+	struct page **send_buf_pages;</div><div class='ctx'> 	u64 flags;	/* 'flags' member of btrfs_ioctl_send_args is u64 */</div><div class='ctx'> 	/* Protocol version compatibility requested */</div><div class='ctx'> 	u32 proto;</div><div class='hunk'>@@ -98,31 +161,47 @@ struct send_ctx {</div><div class='ctx'> 	struct btrfs_key *cmp_key;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='add'>+	 * Keep track of the generation of the last transaction that was used</div><div class='add'>+	 * for relocating a block group. This is periodically checked in order</div><div class='add'>+	 * to detect if a relocation happened since the last check, so that we</div><div class='add'>+	 * don't operate on stale extent buffers for nodes (level &gt;= 1) or on</div><div class='add'>+	 * stale disk_bytenr values of file extent items.</div><div class='add'>+	 */</div><div class='add'>+	u64 last_reloc_trans;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='ctx'> 	 * infos of the currently processed inode. In case of deleted inodes,</div><div class='ctx'> 	 * these are the values from the deleted inode.</div><div class='ctx'> 	 */</div><div class='ctx'> 	u64 cur_ino;</div><div class='ctx'> 	u64 cur_inode_gen;</div><div class='del'>-	int cur_inode_new;</div><div class='del'>-	int cur_inode_new_gen;</div><div class='del'>-	int cur_inode_deleted;</div><div class='ctx'> 	u64 cur_inode_size;</div><div class='ctx'> 	u64 cur_inode_mode;</div><div class='ctx'> 	u64 cur_inode_rdev;</div><div class='ctx'> 	u64 cur_inode_last_extent;</div><div class='ctx'> 	u64 cur_inode_next_write_offset;</div><div class='add'>+	bool cur_inode_new;</div><div class='add'>+	bool cur_inode_new_gen;</div><div class='add'>+	bool cur_inode_deleted;</div><div class='ctx'> 	bool ignore_cur_inode;</div><div class='add'>+	bool cur_inode_needs_verity;</div><div class='add'>+	void *verity_descriptor;</div><div class='ctx'> </div><div class='ctx'> 	u64 send_progress;</div><div class='ctx'> </div><div class='ctx'> 	struct list_head new_refs;</div><div class='ctx'> 	struct list_head deleted_refs;</div><div class='ctx'> </div><div class='del'>-	struct radix_tree_root name_cache;</div><div class='del'>-	struct list_head name_cache_list;</div><div class='del'>-	int name_cache_size;</div><div class='add'>+	struct btrfs_lru_cache name_cache;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * The inode we are currently processing. It's not NULL only when we</div><div class='add'>+	 * need to issue write commands for data extents from this inode.</div><div class='add'>+	 */</div><div class='add'>+	struct inode *cur_inode;</div><div class='ctx'> 	struct file_ra_state ra;</div><div class='add'>+	u64 page_cache_clear_start;</div><div class='add'>+	bool clean_page_cache;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We process inodes by their increasing order, so if before an</div><div class='hunk'>@@ -218,6 +297,17 @@ struct send_ctx {</div><div class='ctx'> 	 * Indexed by the inode number of the directory to be deleted.</div><div class='ctx'> 	 */</div><div class='ctx'> 	struct rb_root orphan_dirs;</div><div class='add'>+</div><div class='add'>+	struct rb_root rbtree_new_refs;</div><div class='add'>+	struct rb_root rbtree_deleted_refs;</div><div class='add'>+</div><div class='add'>+	struct btrfs_lru_cache backref_cache;</div><div class='add'>+	u64 backref_cache_last_reloc_trans;</div><div class='add'>+</div><div class='add'>+	struct btrfs_lru_cache dir_created_cache;</div><div class='add'>+	struct btrfs_lru_cache dir_utimes_cache;</div><div class='add'>+</div><div class='add'>+	struct fs_path cur_inode_path;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct pending_dir_move {</div><div class='hunk'>@@ -247,29 +337,28 @@ struct orphan_dir_info {</div><div class='ctx'> 	u64 ino;</div><div class='ctx'> 	u64 gen;</div><div class='ctx'> 	u64 last_dir_index_offset;</div><div class='add'>+	u64 dir_high_seq_ino;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct name_cache_entry {</div><div class='del'>-	struct list_head list;</div><div class='ctx'> 	/*</div><div class='del'>-	 * radix_tree has only 32bit entries but we need to handle 64bit inums.</div><div class='del'>-	 * We use the lower 32bit of the 64bit inum to store it in the tree. If</div><div class='del'>-	 * more then one inum would fall into the same entry, we use radix_list</div><div class='del'>-	 * to store the additional entries. radix_list is also used to store</div><div class='del'>-	 * entries where two entries have the same inum but different</div><div class='del'>-	 * generations.</div><div class='add'>+	 * The key in the entry is an inode number, and the generation matches</div><div class='add'>+	 * the inode's generation.</div><div class='ctx'> 	 */</div><div class='del'>-	struct list_head radix_list;</div><div class='del'>-	u64 ino;</div><div class='del'>-	u64 gen;</div><div class='add'>+	struct btrfs_lru_cache_entry entry;</div><div class='ctx'> 	u64 parent_ino;</div><div class='ctx'> 	u64 parent_gen;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int need_later_update;</div><div class='add'>+	/* Name length without NUL terminator. */</div><div class='ctx'> 	int name_len;</div><div class='del'>-	char name[];</div><div class='add'>+	/* Not NUL terminated. */</div><div class='add'>+	char name[] __counted_by(name_len) __nonstring;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+/* See the comment at lru_cache.h about struct btrfs_lru_cache_entry. */</div><div class='add'>+static_assert(offsetof(struct name_cache_entry, entry) == 0);</div><div class='add'>+</div><div class='ctx'> #define ADVANCE							1</div><div class='ctx'> #define ADVANCE_ONLY_NEXT					-1</div><div class='ctx'> </div><div class='hunk'>@@ -298,28 +387,28 @@ static void inconsistent_snapshot_error(struct send_ctx *sctx,</div><div class='ctx'> 		result_string = "updated";</div><div class='ctx'> 		break;</div><div class='ctx'> 	case BTRFS_COMPARE_TREE_SAME:</div><div class='del'>-		ASSERT(0);</div><div class='add'>+		DEBUG_WARN("no change between trees");</div><div class='ctx'> 		result_string = "unchanged";</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='del'>-		ASSERT(0);</div><div class='add'>+		DEBUG_WARN("unexpected comparison result %d", result);</div><div class='ctx'> 		result_string = "unexpected";</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	btrfs_err(sctx-&gt;send_root-&gt;fs_info,</div><div class='ctx'> 		  "Send: inconsistent snapshot, found %s %s for inode %llu without updated inode item, send root is %llu, parent root is %llu",</div><div class='ctx'> 		  result_string, what, sctx-&gt;cmp_key-&gt;objectid,</div><div class='del'>-		  sctx-&gt;send_root-&gt;root_key.objectid,</div><div class='del'>-		  (sctx-&gt;parent_root ?</div><div class='del'>-		   sctx-&gt;parent_root-&gt;root_key.objectid : 0));</div><div class='add'>+		  btrfs_root_id(sctx-&gt;send_root),</div><div class='add'>+		  (sctx-&gt;parent_root ?  btrfs_root_id(sctx-&gt;parent_root) : 0));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> __maybe_unused</div><div class='ctx'> static bool proto_cmd_ok(const struct send_ctx *sctx, int cmd)</div><div class='ctx'> {</div><div class='ctx'> 	switch (sctx-&gt;proto) {</div><div class='del'>-	case 1:	 return cmd &lt; __BTRFS_SEND_C_MAX_V1;</div><div class='del'>-	case 2:	 return cmd &lt; __BTRFS_SEND_C_MAX_V2;</div><div class='add'>+	case 1:	 return cmd &lt;= BTRFS_SEND_C_MAX_V1;</div><div class='add'>+	case 2:	 return cmd &lt;= BTRFS_SEND_C_MAX_V2;</div><div class='add'>+	case 3:	 return cmd &lt;= BTRFS_SEND_C_MAX_V3;</div><div class='ctx'> 	default: return false;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -340,15 +429,21 @@ static int need_send_hole(struct send_ctx *sctx)</div><div class='ctx'> </div><div class='ctx'> static void fs_path_reset(struct fs_path *p)</div><div class='ctx'> {</div><div class='del'>-	if (p-&gt;reversed) {</div><div class='add'>+	if (p-&gt;reversed)</div><div class='ctx'> 		p-&gt;start = p-&gt;buf + p-&gt;buf_len - 1;</div><div class='del'>-		p-&gt;end = p-&gt;start;</div><div class='del'>-		*p-&gt;start = 0;</div><div class='del'>-	} else {</div><div class='add'>+	else</div><div class='ctx'> 		p-&gt;start = p-&gt;buf;</div><div class='del'>-		p-&gt;end = p-&gt;start;</div><div class='del'>-		*p-&gt;start = 0;</div><div class='del'>-	}</div><div class='add'>+</div><div class='add'>+	p-&gt;end = p-&gt;start;</div><div class='add'>+	*p-&gt;start = 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void init_path(struct fs_path *p)</div><div class='add'>+{</div><div class='add'>+	p-&gt;reversed = 0;</div><div class='add'>+	p-&gt;buf = p-&gt;inline_buf;</div><div class='add'>+	p-&gt;buf_len = FS_PATH_INLINE_SIZE;</div><div class='add'>+	fs_path_reset(p);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct fs_path *fs_path_alloc(void)</div><div class='hunk'>@@ -358,10 +453,7 @@ static struct fs_path *fs_path_alloc(void)</div><div class='ctx'> 	p = kmalloc(sizeof(*p), GFP_KERNEL);</div><div class='ctx'> 	if (!p)</div><div class='ctx'> 		return NULL;</div><div class='del'>-	p-&gt;reversed = 0;</div><div class='del'>-	p-&gt;buf = p-&gt;inline_buf;</div><div class='del'>-	p-&gt;buf_len = FS_PATH_INLINE_SIZE;</div><div class='del'>-	fs_path_reset(p);</div><div class='add'>+	init_path(p);</div><div class='ctx'> 	return p;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -386,7 +478,7 @@ static void fs_path_free(struct fs_path *p)</div><div class='ctx'> 	kfree(p);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fs_path_len(struct fs_path *p)</div><div class='add'>+static inline int fs_path_len(const struct fs_path *p)</div><div class='ctx'> {</div><div class='ctx'> 	return p-&gt;end - p-&gt;start;</div><div class='ctx'> }</div><div class='hunk'>@@ -402,15 +494,18 @@ static int fs_path_ensure_buf(struct fs_path *p, int len)</div><div class='ctx'> 	if (p-&gt;buf_len &gt;= len)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	if (len &gt; PATH_MAX) {</div><div class='del'>-		WARN_ON(1);</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	}</div><div class='add'>+	if (WARN_ON(len &gt; PATH_MAX))</div><div class='add'>+		return -ENAMETOOLONG;</div><div class='ctx'> </div><div class='del'>-	path_len = p-&gt;end - p-&gt;start;</div><div class='add'>+	path_len = fs_path_len(p);</div><div class='ctx'> 	old_buf_len = p-&gt;buf_len;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='add'>+	 * Allocate to the next largest kmalloc bucket size, to let</div><div class='add'>+	 * the fast path happen most of the time.</div><div class='add'>+	 */</div><div class='add'>+	len = kmalloc_size_roundup(len);</div><div class='add'>+	/*</div><div class='ctx'> 	 * First time the inline_buf does not suffice</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (p-&gt;buf == p-&gt;inline_buf) {</div><div class='hunk'>@@ -423,11 +518,7 @@ static int fs_path_ensure_buf(struct fs_path *p, int len)</div><div class='ctx'> 	if (!tmp_buf)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	p-&gt;buf = tmp_buf;</div><div class='del'>-	/*</div><div class='del'>-	 * The real size of the buffer is bigger, this will let the fast path</div><div class='del'>-	 * happen most of the time</div><div class='del'>-	 */</div><div class='del'>-	p-&gt;buf_len = ksize(p-&gt;buf);</div><div class='add'>+	p-&gt;buf_len = len;</div><div class='ctx'> </div><div class='ctx'> 	if (p-&gt;reversed) {</div><div class='ctx'> 		tmp_buf = p-&gt;buf + old_buf_len - path_len - 1;</div><div class='hunk'>@@ -447,12 +538,12 @@ static int fs_path_prepare_for_add(struct fs_path *p, int name_len,</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int new_len;</div><div class='ctx'> </div><div class='del'>-	new_len = p-&gt;end - p-&gt;start + name_len;</div><div class='add'>+	new_len = fs_path_len(p) + name_len;</div><div class='ctx'> 	if (p-&gt;start != p-&gt;end)</div><div class='ctx'> 		new_len++;</div><div class='ctx'> 	ret = fs_path_ensure_buf(p, new_len);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	if (p-&gt;reversed) {</div><div class='ctx'> 		if (p-&gt;start != p-&gt;end)</div><div class='hunk'>@@ -467,8 +558,7 @@ static int fs_path_prepare_for_add(struct fs_path *p, int name_len,</div><div class='ctx'> 		*p-&gt;end = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int fs_path_add(struct fs_path *p, const char *name, int name_len)</div><div class='hunk'>@@ -478,25 +568,15 @@ static int fs_path_add(struct fs_path *p, const char *name, int name_len)</div><div class='ctx'> </div><div class='ctx'> 	ret = fs_path_prepare_for_add(p, name_len, &amp;prepared);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> 	memcpy(prepared, name, name_len);</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fs_path_add_path(struct fs_path *p, struct fs_path *p2)</div><div class='add'>+static inline int fs_path_add_path(struct fs_path *p, const struct fs_path *p2)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='del'>-	char *prepared;</div><div class='del'>-</div><div class='del'>-	ret = fs_path_prepare_for_add(p, p2-&gt;end - p2-&gt;start, &amp;prepared);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-	memcpy(prepared, p2-&gt;start, p2-&gt;end - p2-&gt;start);</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	return ret;</div><div class='add'>+	return fs_path_add(p, p2-&gt;start, fs_path_len(p2));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int fs_path_add_from_extent_buffer(struct fs_path *p,</div><div class='hunk'>@@ -508,27 +588,21 @@ static int fs_path_add_from_extent_buffer(struct fs_path *p,</div><div class='ctx'> </div><div class='ctx'> 	ret = fs_path_prepare_for_add(p, len, &amp;prepared);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	read_extent_buffer(eb, prepared, off, len);</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int fs_path_copy(struct fs_path *p, struct fs_path *from)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='ctx'> 	p-&gt;reversed = from-&gt;reversed;</div><div class='ctx'> 	fs_path_reset(p);</div><div class='ctx'> </div><div class='del'>-	ret = fs_path_add_path(p, from);</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='add'>+	return fs_path_add_path(p, from);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-</div><div class='ctx'> static void fs_path_unreverse(struct fs_path *p)</div><div class='ctx'> {</div><div class='ctx'> 	char *tmp;</div><div class='hunk'>@@ -538,13 +612,21 @@ static void fs_path_unreverse(struct fs_path *p)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	tmp = p-&gt;start;</div><div class='del'>-	len = p-&gt;end - p-&gt;start;</div><div class='add'>+	len = fs_path_len(p);</div><div class='ctx'> 	p-&gt;start = p-&gt;buf;</div><div class='ctx'> 	p-&gt;end = p-&gt;start + len;</div><div class='ctx'> 	memmove(p-&gt;start, tmp, len + 1);</div><div class='ctx'> 	p-&gt;reversed = 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline bool is_current_inode_path(const struct send_ctx *sctx,</div><div class='add'>+					 const struct fs_path *path)</div><div class='add'>+{</div><div class='add'>+	const struct fs_path *cur = &amp;sctx-&gt;cur_inode_path;</div><div class='add'>+</div><div class='add'>+	return (strncmp(path-&gt;start, cur-&gt;start, fs_path_len(cur)) == 0);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static struct btrfs_path *alloc_path_for_send(void)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_path *path;</div><div class='hunk'>@@ -552,9 +634,9 @@ static struct btrfs_path *alloc_path_for_send(void)</div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return NULL;</div><div class='del'>-	path-&gt;search_commit_root = 1;</div><div class='del'>-	path-&gt;skip_locking = 1;</div><div class='del'>-	path-&gt;need_commit_sem = 1;</div><div class='add'>+	path-&gt;search_commit_root = true;</div><div class='add'>+	path-&gt;skip_locking = true;</div><div class='add'>+	path-&gt;need_commit_sem = true;</div><div class='ctx'> 	return path;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -565,15 +647,10 @@ static int write_buf(struct file *filp, const void *buf, u32 len, loff_t *off)</div><div class='ctx'> </div><div class='ctx'> 	while (pos &lt; len) {</div><div class='ctx'> 		ret = kernel_write(filp, buf + pos, len - pos, off);</div><div class='del'>-		/* TODO handle that correctly */</div><div class='del'>-		/*if (ret == -ERESTARTSYS) {</div><div class='del'>-			continue;</div><div class='del'>-		}*/</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			return ret;</div><div class='del'>-		if (ret == 0) {</div><div class='add'>+		if (unlikely(ret == 0))</div><div class='ctx'> 			return -EIO;</div><div class='del'>-		}</div><div class='ctx'> 		pos += ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -586,6 +663,9 @@ static int tlv_put(struct send_ctx *sctx, u16 attr, const void *data, int len)</div><div class='ctx'> 	int total_len = sizeof(*hdr) + len;</div><div class='ctx'> 	int left = sctx-&gt;send_max_size - sctx-&gt;send_size;</div><div class='ctx'> </div><div class='add'>+	if (WARN_ON_ONCE(sctx-&gt;put_data))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='ctx'> 	if (unlikely(left &lt; total_len))</div><div class='ctx'> 		return -EOVERFLOW;</div><div class='ctx'> </div><div class='hunk'>@@ -606,6 +686,8 @@ static int tlv_put(struct send_ctx *sctx, u16 attr, const void *data, int len)</div><div class='ctx'> 		return tlv_put(sctx, attr, &amp;__tmp, sizeof(__tmp));	\</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+TLV_PUT_DEFINE_INT(8)</div><div class='add'>+TLV_PUT_DEFINE_INT(32)</div><div class='ctx'> TLV_PUT_DEFINE_INT(64)</div><div class='ctx'> </div><div class='ctx'> static int tlv_put_string(struct send_ctx *sctx, u16 attr,</div><div class='hunk'>@@ -659,7 +741,7 @@ static int tlv_put_btrfs_timespec(struct send_ctx *sctx, u16 attr,</div><div class='ctx'> #define TLV_PUT_PATH(sctx, attrtype, p) \</div><div class='ctx'> 	do { \</div><div class='ctx'> 		ret = tlv_put_string(sctx, attrtype, p-&gt;start, \</div><div class='del'>-			p-&gt;end - p-&gt;start); \</div><div class='add'>+				     fs_path_len((p)));	       \</div><div class='ctx'> 		if (ret &lt; 0) \</div><div class='ctx'> 			goto tlv_put_failure; \</div><div class='ctx'> 	} while(0)</div><div class='hunk'>@@ -680,9 +762,8 @@ static int send_header(struct send_ctx *sctx)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_stream_header hdr;</div><div class='ctx'> </div><div class='del'>-	strcpy(hdr.magic, BTRFS_SEND_STREAM_MAGIC);</div><div class='del'>-	hdr.version = cpu_to_le32(BTRFS_SEND_STREAM_VERSION);</div><div class='del'>-</div><div class='add'>+	strscpy(hdr.magic, BTRFS_SEND_STREAM_MAGIC);</div><div class='add'>+	hdr.version = cpu_to_le32(sctx-&gt;proto);</div><div class='ctx'> 	return write_buf(sctx-&gt;send_filp, &amp;hdr, sizeof(hdr),</div><div class='ctx'> 					&amp;sctx-&gt;send_off);</div><div class='ctx'> }</div><div class='hunk'>@@ -697,7 +778,12 @@ static int begin_cmd(struct send_ctx *sctx, int cmd)</div><div class='ctx'> 	if (WARN_ON(!sctx-&gt;send_buf))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(sctx-&gt;send_size);</div><div class='add'>+	if (unlikely(sctx-&gt;send_size != 0)) {</div><div class='add'>+		btrfs_err(sctx-&gt;send_root-&gt;fs_info,</div><div class='add'>+			  "send: command header buffer not empty cmd %d offset %llu",</div><div class='add'>+			  cmd, sctx-&gt;send_off);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	sctx-&gt;send_size += sizeof(*hdr);</div><div class='ctx'> 	hdr = (struct btrfs_cmd_header *)sctx-&gt;send_buf;</div><div class='hunk'>@@ -716,15 +802,14 @@ static int send_cmd(struct send_ctx *sctx)</div><div class='ctx'> 	put_unaligned_le32(sctx-&gt;send_size - sizeof(*hdr), &amp;hdr-&gt;len);</div><div class='ctx'> 	put_unaligned_le32(0, &amp;hdr-&gt;crc);</div><div class='ctx'> </div><div class='del'>-	crc = btrfs_crc32c(0, (unsigned char *)sctx-&gt;send_buf, sctx-&gt;send_size);</div><div class='add'>+	crc = crc32c(0, (unsigned char *)sctx-&gt;send_buf, sctx-&gt;send_size);</div><div class='ctx'> 	put_unaligned_le32(crc, &amp;hdr-&gt;crc);</div><div class='ctx'> </div><div class='ctx'> 	ret = write_buf(sctx-&gt;send_filp, sctx-&gt;send_buf, sctx-&gt;send_size,</div><div class='ctx'> 					&amp;sctx-&gt;send_off);</div><div class='ctx'> </div><div class='del'>-	sctx-&gt;total_send_size += sctx-&gt;send_size;</div><div class='del'>-	sctx-&gt;cmd_send_size[get_unaligned_le16(&amp;hdr-&gt;cmd)] += sctx-&gt;send_size;</div><div class='ctx'> 	sctx-&gt;send_size = 0;</div><div class='add'>+	sctx-&gt;put_data = false;</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -735,14 +820,11 @@ static int send_cmd(struct send_ctx *sctx)</div><div class='ctx'> static int send_rename(struct send_ctx *sctx,</div><div class='ctx'> 		     struct fs_path *from, struct fs_path *to)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = sctx-&gt;send_root-&gt;fs_info;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	btrfs_debug(fs_info, "send_rename %s -&gt; %s", from-&gt;start, to-&gt;start);</div><div class='del'>-</div><div class='ctx'> 	ret = begin_cmd(sctx, BTRFS_SEND_C_RENAME);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	TLV_PUT_PATH(sctx, BTRFS_SEND_A_PATH, from);</div><div class='ctx'> 	TLV_PUT_PATH(sctx, BTRFS_SEND_A_PATH_TO, to);</div><div class='hunk'>@@ -750,7 +832,6 @@ static int send_rename(struct send_ctx *sctx,</div><div class='ctx'> 	ret = send_cmd(sctx);</div><div class='ctx'> </div><div class='ctx'> tlv_put_failure:</div><div class='del'>-out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -760,14 +841,11 @@ out:</div><div class='ctx'> static int send_link(struct send_ctx *sctx,</div><div class='ctx'> 		     struct fs_path *path, struct fs_path *lnk)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = sctx-&gt;send_root-&gt;fs_info;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	btrfs_debug(fs_info, "send_link %s -&gt; %s", path-&gt;start, lnk-&gt;start);</div><div class='del'>-</div><div class='ctx'> 	ret = begin_cmd(sctx, BTRFS_SEND_C_LINK);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	TLV_PUT_PATH(sctx, BTRFS_SEND_A_PATH, path);</div><div class='ctx'> 	TLV_PUT_PATH(sctx, BTRFS_SEND_A_PATH_LINK, lnk);</div><div class='hunk'>@@ -775,7 +853,6 @@ static int send_link(struct send_ctx *sctx,</div><div class='ctx'> 	ret = send_cmd(sctx);</div><div class='ctx'> </div><div class='ctx'> tlv_put_failure:</div><div class='del'>-out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -784,21 +861,17 @@ out:</div><div class='ctx'>  */</div><div class='ctx'> static int send_unlink(struct send_ctx *sctx, struct fs_path *path)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = sctx-&gt;send_root-&gt;fs_info;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	btrfs_debug(fs_info, "send_unlink %s", path-&gt;start);</div><div class='del'>-</div><div class='ctx'> 	ret = begin_cmd(sctx, BTRFS_SEND_C_UNLINK);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	TLV_PUT_PATH(sctx, BTRFS_SEND_A_PATH, path);</div><div class='ctx'> </div><div class='ctx'> 	ret = send_cmd(sctx);</div><div class='ctx'> </div><div class='ctx'> tlv_put_failure:</div><div class='del'>-out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -807,35 +880,46 @@ out:</div><div class='ctx'>  */</div><div class='ctx'> static int send_rmdir(struct send_ctx *sctx, struct fs_path *path)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = sctx-&gt;send_root-&gt;fs_info;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	btrfs_debug(fs_info, "send_rmdir %s", path-&gt;start);</div><div class='del'>-</div><div class='ctx'> 	ret = begin_cmd(sctx, BTRFS_SEND_C_RMDIR);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	TLV_PUT_PATH(sctx, BTRFS_SEND_A_PATH, path);</div><div class='ctx'> </div><div class='ctx'> 	ret = send_cmd(sctx);</div><div class='ctx'> </div><div class='ctx'> tlv_put_failure:</div><div class='del'>-out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+struct btrfs_inode_info {</div><div class='add'>+	u64 size;</div><div class='add'>+	u64 gen;</div><div class='add'>+	u64 mode;</div><div class='add'>+	u64 uid;</div><div class='add'>+	u64 gid;</div><div class='add'>+	u64 rdev;</div><div class='add'>+	u64 fileattr;</div><div class='add'>+	u64 nlink;</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Helper function to retrieve some fields from an inode item.</div><div class='ctx'>  */</div><div class='del'>-static int __get_inode_info(struct btrfs_root *root, struct btrfs_path *path,</div><div class='del'>-			  u64 ino, u64 *size, u64 *gen, u64 *mode, u64 *uid,</div><div class='del'>-			  u64 *gid, u64 *rdev)</div><div class='add'>+static int get_inode_info(struct btrfs_root *root, u64 ino,</div><div class='add'>+			  struct btrfs_inode_info *info)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_inode_item *ii;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> </div><div class='add'>+	path = alloc_path_for_send();</div><div class='add'>+	if (!path)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='ctx'> 	key.objectid = ino;</div><div class='ctx'> 	key.type = BTRFS_INODE_ITEM_KEY;</div><div class='ctx'> 	key.offset = 0;</div><div class='hunk'>@@ -846,44 +930,40 @@ static int __get_inode_info(struct btrfs_root *root, struct btrfs_path *path,</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (!info)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='ctx'> 	ii = btrfs_item_ptr(path-&gt;nodes[0], path-&gt;slots[0],</div><div class='ctx'> 			struct btrfs_inode_item);</div><div class='del'>-	if (size)</div><div class='del'>-		*size = btrfs_inode_size(path-&gt;nodes[0], ii);</div><div class='del'>-	if (gen)</div><div class='del'>-		*gen = btrfs_inode_generation(path-&gt;nodes[0], ii);</div><div class='del'>-	if (mode)</div><div class='del'>-		*mode = btrfs_inode_mode(path-&gt;nodes[0], ii);</div><div class='del'>-	if (uid)</div><div class='del'>-		*uid = btrfs_inode_uid(path-&gt;nodes[0], ii);</div><div class='del'>-	if (gid)</div><div class='del'>-		*gid = btrfs_inode_gid(path-&gt;nodes[0], ii);</div><div class='del'>-	if (rdev)</div><div class='del'>-		*rdev = btrfs_inode_rdev(path-&gt;nodes[0], ii);</div><div class='add'>+	info-&gt;size = btrfs_inode_size(path-&gt;nodes[0], ii);</div><div class='add'>+	info-&gt;gen = btrfs_inode_generation(path-&gt;nodes[0], ii);</div><div class='add'>+	info-&gt;mode = btrfs_inode_mode(path-&gt;nodes[0], ii);</div><div class='add'>+	info-&gt;uid = btrfs_inode_uid(path-&gt;nodes[0], ii);</div><div class='add'>+	info-&gt;gid = btrfs_inode_gid(path-&gt;nodes[0], ii);</div><div class='add'>+	info-&gt;rdev = btrfs_inode_rdev(path-&gt;nodes[0], ii);</div><div class='add'>+	info-&gt;nlink = btrfs_inode_nlink(path-&gt;nodes[0], ii);</div><div class='add'>+	/*</div><div class='add'>+	 * Transfer the unchanged u64 value of btrfs_inode_item::flags, that's</div><div class='add'>+	 * otherwise logically split to 32/32 parts.</div><div class='add'>+	 */</div><div class='add'>+	info-&gt;fileattr = btrfs_inode_flags(path-&gt;nodes[0], ii);</div><div class='ctx'> </div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int get_inode_info(struct btrfs_root *root,</div><div class='del'>-			  u64 ino, u64 *size, u64 *gen,</div><div class='del'>-			  u64 *mode, u64 *uid, u64 *gid,</div><div class='del'>-			  u64 *rdev)</div><div class='add'>+static int get_inode_gen(struct btrfs_root *root, u64 ino, u64 *gen)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_path *path;</div><div class='ctx'> 	int ret;</div><div class='add'>+	struct btrfs_inode_info info = { 0 };</div><div class='ctx'> </div><div class='del'>-	path = alloc_path_for_send();</div><div class='del'>-	if (!path)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	ret = __get_inode_info(root, path, ino, size, gen, mode, uid, gid,</div><div class='del'>-			       rdev);</div><div class='del'>-	btrfs_free_path(path);</div><div class='add'>+	ASSERT(gen);</div><div class='add'>+</div><div class='add'>+	ret = get_inode_info(root, ino, &amp;info);</div><div class='add'>+	*gen = info.gen;</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-typedef int (*iterate_inode_ref_t)(int num, u64 dir, int index,</div><div class='del'>-				   struct fs_path *p,</div><div class='del'>-				   void *ctx);</div><div class='add'>+typedef int (*iterate_inode_ref_t)(u64 dir, struct fs_path *p, void *ctx);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Helper function to iterate the entries in ONE btrfs_inode_ref or</div><div class='hunk'>@@ -894,14 +974,13 @@ typedef int (*iterate_inode_ref_t)(int num, u64 dir, int index,</div><div class='ctx'>  * path must point to the INODE_REF or INODE_EXTREF when called.</div><div class='ctx'>  */</div><div class='ctx'> static int iterate_inode_ref(struct btrfs_root *root, struct btrfs_path *path,</div><div class='del'>-			     struct btrfs_key *found_key, int resolve,</div><div class='add'>+			     struct btrfs_key *found_key, bool resolve,</div><div class='ctx'> 			     iterate_inode_ref_t iterate, void *ctx)</div><div class='ctx'> {</div><div class='ctx'> 	struct extent_buffer *eb = path-&gt;nodes[0];</div><div class='del'>-	struct btrfs_item *item;</div><div class='ctx'> 	struct btrfs_inode_ref *iref;</div><div class='ctx'> 	struct btrfs_inode_extref *extref;</div><div class='del'>-	struct btrfs_path *tmp_path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(tmp_path);</div><div class='ctx'> 	struct fs_path *p;</div><div class='ctx'> 	u32 cur = 0;</div><div class='ctx'> 	u32 total;</div><div class='hunk'>@@ -909,8 +988,6 @@ static int iterate_inode_ref(struct btrfs_root *root, struct btrfs_path *path,</div><div class='ctx'> 	u32 name_len;</div><div class='ctx'> 	char *start;</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	int num = 0;</div><div class='del'>-	int index;</div><div class='ctx'> 	u64 dir;</div><div class='ctx'> 	unsigned long name_off;</div><div class='ctx'> 	unsigned long elem_size;</div><div class='hunk'>@@ -930,12 +1007,11 @@ static int iterate_inode_ref(struct btrfs_root *root, struct btrfs_path *path,</div><div class='ctx'> 	if (found_key-&gt;type == BTRFS_INODE_REF_KEY) {</div><div class='ctx'> 		ptr = (unsigned long)btrfs_item_ptr(eb, slot,</div><div class='ctx'> 						    struct btrfs_inode_ref);</div><div class='del'>-		item = btrfs_item_nr(slot);</div><div class='del'>-		total = btrfs_item_size(eb, item);</div><div class='add'>+		total = btrfs_item_size(eb, slot);</div><div class='ctx'> 		elem_size = sizeof(*iref);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		ptr = btrfs_item_ptr_offset(eb, slot);</div><div class='del'>-		total = btrfs_item_size_nr(eb, slot);</div><div class='add'>+		total = btrfs_item_size(eb, slot);</div><div class='ctx'> 		elem_size = sizeof(*extref);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -946,13 +1022,11 @@ static int iterate_inode_ref(struct btrfs_root *root, struct btrfs_path *path,</div><div class='ctx'> 			iref = (struct btrfs_inode_ref *)(ptr + cur);</div><div class='ctx'> 			name_len = btrfs_inode_ref_name_len(eb, iref);</div><div class='ctx'> 			name_off = (unsigned long)(iref + 1);</div><div class='del'>-			index = btrfs_inode_ref_index(eb, iref);</div><div class='ctx'> 			dir = found_key-&gt;offset;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			extref = (struct btrfs_inode_extref *)(ptr + cur);</div><div class='ctx'> 			name_len = btrfs_inode_extref_name_len(eb, extref);</div><div class='ctx'> 			name_off = (unsigned long)&amp;extref-&gt;name;</div><div class='del'>-			index = btrfs_inode_extref_index(eb, extref);</div><div class='ctx'> 			dir = btrfs_inode_extref_parent(eb, extref);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -978,7 +1052,13 @@ static int iterate_inode_ref(struct btrfs_root *root, struct btrfs_path *path,</div><div class='ctx'> 					ret = PTR_ERR(start);</div><div class='ctx'> 					goto out;</div><div class='ctx'> 				}</div><div class='del'>-				BUG_ON(start &lt; p-&gt;buf);</div><div class='add'>+				if (unlikely(start &lt; p-&gt;buf)) {</div><div class='add'>+					btrfs_err(root-&gt;fs_info,</div><div class='add'>+			  "send: path ref buffer underflow for key " BTRFS_KEY_FMT,</div><div class='add'>+						  BTRFS_KEY_FMT_VALUE(found_key));</div><div class='add'>+					ret = -EINVAL;</div><div class='add'>+					goto out;</div><div class='add'>+				}</div><div class='ctx'> 			}</div><div class='ctx'> 			p-&gt;start = start;</div><div class='ctx'> 		} else {</div><div class='hunk'>@@ -989,14 +1069,12 @@ static int iterate_inode_ref(struct btrfs_root *root, struct btrfs_path *path,</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		cur += elem_size + name_len;</div><div class='del'>-		ret = iterate(num, dir, index, p, ctx);</div><div class='add'>+		ret = iterate(dir, p, ctx);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto out;</div><div class='del'>-		num++;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	btrfs_free_path(tmp_path);</div><div class='ctx'> 	fs_path_free(p);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -1004,7 +1082,7 @@ out:</div><div class='ctx'> typedef int (*iterate_dir_item_t)(int num, struct btrfs_key *di_key,</div><div class='ctx'> 				  const char *name, int name_len,</div><div class='ctx'> 				  const char *data, int data_len,</div><div class='del'>-				  u8 type, void *ctx);</div><div class='add'>+				  void *ctx);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Helper function to iterate the entries in ONE btrfs_dir_item.</div><div class='hunk'>@@ -1018,7 +1096,6 @@ static int iterate_dir_item(struct btrfs_root *root, struct btrfs_path *path,</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='del'>-	struct btrfs_item *item;</div><div class='ctx'> 	struct btrfs_dir_item *di;</div><div class='ctx'> 	struct btrfs_key di_key;</div><div class='ctx'> 	char *buf = NULL;</div><div class='hunk'>@@ -1030,12 +1107,11 @@ static int iterate_dir_item(struct btrfs_root *root, struct btrfs_path *path,</div><div class='ctx'> 	u32 total;</div><div class='ctx'> 	int slot;</div><div class='ctx'> 	int num;</div><div class='del'>-	u8 type;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Start with a small buffer (1 page). If later we end up needing more</div><div class='ctx'> 	 * space, which can happen for xattrs on a fs with a leaf size greater</div><div class='del'>-	 * then the page size, attempt to increase the buffer. Typically xattr</div><div class='add'>+	 * than the page size, attempt to increase the buffer. Typically xattr</div><div class='ctx'> 	 * values are small.</div><div class='ctx'> 	 */</div><div class='ctx'> 	buf_len = PATH_MAX;</div><div class='hunk'>@@ -1047,26 +1123,24 @@ static int iterate_dir_item(struct btrfs_root *root, struct btrfs_path *path,</div><div class='ctx'> </div><div class='ctx'> 	eb = path-&gt;nodes[0];</div><div class='ctx'> 	slot = path-&gt;slots[0];</div><div class='del'>-	item = btrfs_item_nr(slot);</div><div class='ctx'> 	di = btrfs_item_ptr(eb, slot, struct btrfs_dir_item);</div><div class='ctx'> 	cur = 0;</div><div class='ctx'> 	len = 0;</div><div class='del'>-	total = btrfs_item_size(eb, item);</div><div class='add'>+	total = btrfs_item_size(eb, slot);</div><div class='ctx'> </div><div class='ctx'> 	num = 0;</div><div class='ctx'> 	while (cur &lt; total) {</div><div class='ctx'> 		name_len = btrfs_dir_name_len(eb, di);</div><div class='ctx'> 		data_len = btrfs_dir_data_len(eb, di);</div><div class='del'>-		type = btrfs_dir_type(eb, di);</div><div class='ctx'> 		btrfs_dir_item_key_to_cpu(eb, di, &amp;di_key);</div><div class='ctx'> </div><div class='del'>-		if (type == BTRFS_FT_XATTR) {</div><div class='del'>-			if (name_len &gt; XATTR_NAME_MAX) {</div><div class='add'>+		if (btrfs_dir_ftype(eb, di) == BTRFS_FT_XATTR) {</div><div class='add'>+			if (unlikely(name_len &gt; XATTR_NAME_MAX)) {</div><div class='ctx'> 				ret = -ENAMETOOLONG;</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='del'>-			if (name_len + data_len &gt;</div><div class='del'>-					BTRFS_MAX_XATTR_SIZE(root-&gt;fs_info)) {</div><div class='add'>+			if (unlikely(name_len + data_len &gt;</div><div class='add'>+				     BTRFS_MAX_XATTR_SIZE(root-&gt;fs_info))) {</div><div class='ctx'> 				ret = -E2BIG;</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -1074,7 +1148,7 @@ static int iterate_dir_item(struct btrfs_root *root, struct btrfs_path *path,</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Path too long</div><div class='ctx'> 			 */</div><div class='del'>-			if (name_len + data_len &gt; PATH_MAX) {</div><div class='add'>+			if (unlikely(name_len + data_len &gt; PATH_MAX)) {</div><div class='ctx'> 				ret = -ENAMETOOLONG;</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -1110,7 +1184,7 @@ static int iterate_dir_item(struct btrfs_root *root, struct btrfs_path *path,</div><div class='ctx'> 		cur += len;</div><div class='ctx'> </div><div class='ctx'> 		ret = iterate(num, &amp;di_key, buf, name_len, buf + name_len,</div><div class='del'>-				data_len, type, ctx);</div><div class='add'>+			      data_len, ctx);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		if (ret) {</div><div class='hunk'>@@ -1126,8 +1200,7 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __copy_first_ref(int num, u64 dir, int index,</div><div class='del'>-			    struct fs_path *p, void *ctx)</div><div class='add'>+static int __copy_first_ref(u64 dir, struct fs_path *p, void *ctx)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct fs_path *pt = ctx;</div><div class='hunk'>@@ -1149,7 +1222,7 @@ static int get_inode_path(struct btrfs_root *root,</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct btrfs_key key, found_key;</div><div class='del'>-	struct btrfs_path *p;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(p);</div><div class='ctx'> </div><div class='ctx'> 	p = alloc_path_for_send();</div><div class='ctx'> 	if (!p)</div><div class='hunk'>@@ -1163,28 +1236,20 @@ static int get_inode_path(struct btrfs_root *root,</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_search_slot_for_read(root, &amp;key, p, 1, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-	if (ret) {</div><div class='del'>-		ret = 1;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+		return ret;</div><div class='add'>+	if (ret)</div><div class='add'>+		return 1;</div><div class='add'>+</div><div class='ctx'> 	btrfs_item_key_to_cpu(p-&gt;nodes[0], &amp;found_key, p-&gt;slots[0]);</div><div class='ctx'> 	if (found_key.objectid != ino ||</div><div class='ctx'> 	    (found_key.type != BTRFS_INODE_REF_KEY &amp;&amp;</div><div class='del'>-	     found_key.type != BTRFS_INODE_EXTREF_KEY)) {</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	     found_key.type != BTRFS_INODE_EXTREF_KEY))</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> </div><div class='del'>-	ret = iterate_inode_ref(root, p, &amp;found_key, 1,</div><div class='del'>-				__copy_first_ref, path);</div><div class='add'>+	ret = iterate_inode_ref(root, p, &amp;found_key, true, __copy_first_ref, path);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-	ret = 0;</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(p);</div><div class='del'>-	return ret;</div><div class='add'>+		return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct backref_ctx {</div><div class='hunk'>@@ -1203,8 +1268,12 @@ struct backref_ctx {</div><div class='ctx'> 	/* may be truncated in case it's the last extent in a file */</div><div class='ctx'> 	u64 extent_len;</div><div class='ctx'> </div><div class='del'>-	/* Just to check for bugs in backref resolving */</div><div class='del'>-	int found_itself;</div><div class='add'>+	/* The bytenr the file extent item we are processing refers to. */</div><div class='add'>+	u64 bytenr;</div><div class='add'>+	/* The owner (root id) of the data backref for the current extent. */</div><div class='add'>+	u64 backref_owner;</div><div class='add'>+	/* The offset of the data backref for the current extent. */</div><div class='add'>+	u64 backref_offset;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static int __clone_root_cmp_bsearch(const void *key, const void *elt)</div><div class='hunk'>@@ -1212,9 +1281,9 @@ static int __clone_root_cmp_bsearch(const void *key, const void *elt)</div><div class='ctx'> 	u64 root = (u64)(uintptr_t)key;</div><div class='ctx'> 	const struct clone_root *cr = elt;</div><div class='ctx'> </div><div class='del'>-	if (root &lt; cr-&gt;root-&gt;root_key.objectid)</div><div class='add'>+	if (root &lt; btrfs_root_id(cr-&gt;root))</div><div class='ctx'> 		return -1;</div><div class='del'>-	if (root &gt; cr-&gt;root-&gt;root_key.objectid)</div><div class='add'>+	if (root &gt; btrfs_root_id(cr-&gt;root))</div><div class='ctx'> 		return 1;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -1224,41 +1293,42 @@ static int __clone_root_cmp_sort(const void *e1, const void *e2)</div><div class='ctx'> 	const struct clone_root *cr1 = e1;</div><div class='ctx'> 	const struct clone_root *cr2 = e2;</div><div class='ctx'> </div><div class='del'>-	if (cr1-&gt;root-&gt;root_key.objectid &lt; cr2-&gt;root-&gt;root_key.objectid)</div><div class='add'>+	if (btrfs_root_id(cr1-&gt;root) &lt; btrfs_root_id(cr2-&gt;root))</div><div class='ctx'> 		return -1;</div><div class='del'>-	if (cr1-&gt;root-&gt;root_key.objectid &gt; cr2-&gt;root-&gt;root_key.objectid)</div><div class='add'>+	if (btrfs_root_id(cr1-&gt;root) &gt; btrfs_root_id(cr2-&gt;root))</div><div class='ctx'> 		return 1;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Called for every backref that is found for the current extent.</div><div class='del'>- * Results are collected in sctx-&gt;clone_roots-&gt;ino/offset/found_refs</div><div class='add'>+ * Results are collected in sctx-&gt;clone_roots-&gt;ino/offset.</div><div class='ctx'>  */</div><div class='del'>-static int __iterate_backrefs(u64 ino, u64 offset, u64 root, void *ctx_)</div><div class='add'>+static int iterate_backrefs(u64 ino, u64 offset, u64 num_bytes, u64 root_id,</div><div class='add'>+			    void *ctx_)</div><div class='ctx'> {</div><div class='ctx'> 	struct backref_ctx *bctx = ctx_;</div><div class='del'>-	struct clone_root *found;</div><div class='add'>+	struct clone_root *clone_root;</div><div class='ctx'> </div><div class='ctx'> 	/* First check if the root is in the list of accepted clone sources */</div><div class='del'>-	found = bsearch((void *)(uintptr_t)root, bctx-&gt;sctx-&gt;clone_roots,</div><div class='del'>-			bctx-&gt;sctx-&gt;clone_roots_cnt,</div><div class='del'>-			sizeof(struct clone_root),</div><div class='del'>-			__clone_root_cmp_bsearch);</div><div class='del'>-	if (!found)</div><div class='add'>+	clone_root = bsearch((void *)(uintptr_t)root_id, bctx-&gt;sctx-&gt;clone_roots,</div><div class='add'>+			     bctx-&gt;sctx-&gt;clone_roots_cnt,</div><div class='add'>+			     sizeof(struct clone_root),</div><div class='add'>+			     __clone_root_cmp_bsearch);</div><div class='add'>+	if (!clone_root)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	if (found-&gt;root == bctx-&gt;sctx-&gt;send_root &amp;&amp;</div><div class='add'>+	/* This is our own reference, bail out as we can't clone from it. */</div><div class='add'>+	if (clone_root-&gt;root == bctx-&gt;sctx-&gt;send_root &amp;&amp;</div><div class='ctx'> 	    ino == bctx-&gt;cur_objectid &amp;&amp;</div><div class='del'>-	    offset == bctx-&gt;cur_offset) {</div><div class='del'>-		bctx-&gt;found_itself = 1;</div><div class='del'>-	}</div><div class='add'>+	    offset == bctx-&gt;cur_offset)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Make sure we don't consider clones from send_root that are</div><div class='ctx'> 	 * behind the current inode/offset.</div><div class='ctx'> 	 */</div><div class='del'>-	if (found-&gt;root == bctx-&gt;sctx-&gt;send_root) {</div><div class='add'>+	if (clone_root-&gt;root == bctx-&gt;sctx-&gt;send_root) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * If the source inode was not yet processed we can't issue a</div><div class='ctx'> 		 * clone operation, as the source extent does not exist yet at</div><div class='hunk'>@@ -1279,21 +1349,191 @@ static int __iterate_backrefs(u64 ino, u64 offset, u64 root, void *ctx_)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	bctx-&gt;found++;</div><div class='del'>-	found-&gt;found_refs++;</div><div class='del'>-	if (ino &lt; found-&gt;ino) {</div><div class='del'>-		found-&gt;ino = ino;</div><div class='del'>-		found-&gt;offset = offset;</div><div class='del'>-	} else if (found-&gt;ino == ino) {</div><div class='add'>+	clone_root-&gt;found_ref = true;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If the given backref refers to a file extent item with a larger</div><div class='add'>+	 * number of bytes than what we found before, use the new one so that</div><div class='add'>+	 * we clone more optimally and end up doing less writes and getting</div><div class='add'>+	 * less exclusive, non-shared extents at the destination.</div><div class='add'>+	 */</div><div class='add'>+	if (num_bytes &gt; clone_root-&gt;num_bytes) {</div><div class='add'>+		clone_root-&gt;ino = ino;</div><div class='add'>+		clone_root-&gt;offset = offset;</div><div class='add'>+		clone_root-&gt;num_bytes = num_bytes;</div><div class='add'>+</div><div class='ctx'> 		/*</div><div class='del'>-		 * same extent found more then once in the same file.</div><div class='add'>+		 * Found a perfect candidate, so there's no need to continue</div><div class='add'>+		 * backref walking.</div><div class='ctx'> 		 */</div><div class='del'>-		if (found-&gt;offset &gt; offset + bctx-&gt;extent_len)</div><div class='del'>-			found-&gt;offset = offset;</div><div class='add'>+		if (num_bytes &gt;= bctx-&gt;extent_len)</div><div class='add'>+			return BTRFS_ITERATE_EXTENT_INODES_STOP;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool lookup_backref_cache(u64 leaf_bytenr, void *ctx,</div><div class='add'>+				 const u64 **root_ids_ret, int *root_count_ret)</div><div class='add'>+{</div><div class='add'>+	struct backref_ctx *bctx = ctx;</div><div class='add'>+	struct send_ctx *sctx = bctx-&gt;sctx;</div><div class='add'>+	struct btrfs_fs_info *fs_info = sctx-&gt;send_root-&gt;fs_info;</div><div class='add'>+	const u64 key = leaf_bytenr &gt;&gt; fs_info-&gt;nodesize_bits;</div><div class='add'>+	struct btrfs_lru_cache_entry *raw_entry;</div><div class='add'>+	struct backref_cache_entry *entry;</div><div class='add'>+</div><div class='add'>+	if (sctx-&gt;backref_cache.size == 0)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If relocation happened since we first filled the cache, then we must</div><div class='add'>+	 * empty the cache and can not use it, because even though we operate on</div><div class='add'>+	 * read-only roots, their leaves and nodes may have been reallocated and</div><div class='add'>+	 * now be used for different nodes/leaves of the same tree or some other</div><div class='add'>+	 * tree.</div><div class='add'>+	 *</div><div class='add'>+	 * We are called from iterate_extent_inodes() while either holding a</div><div class='add'>+	 * transaction handle or holding fs_info-&gt;commit_root_sem, so no need</div><div class='add'>+	 * to take any lock here.</div><div class='add'>+	 */</div><div class='add'>+	if (fs_info-&gt;last_reloc_trans &gt; sctx-&gt;backref_cache_last_reloc_trans) {</div><div class='add'>+		btrfs_lru_cache_clear(&amp;sctx-&gt;backref_cache);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	raw_entry = btrfs_lru_cache_lookup(&amp;sctx-&gt;backref_cache, key, 0);</div><div class='add'>+	if (!raw_entry)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	entry = container_of(raw_entry, struct backref_cache_entry, entry);</div><div class='add'>+	*root_ids_ret = entry-&gt;root_ids;</div><div class='add'>+	*root_count_ret = entry-&gt;num_roots;</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void store_backref_cache(u64 leaf_bytenr, const struct ulist *root_ids,</div><div class='add'>+				void *ctx)</div><div class='add'>+{</div><div class='add'>+	struct backref_ctx *bctx = ctx;</div><div class='add'>+	struct send_ctx *sctx = bctx-&gt;sctx;</div><div class='add'>+	struct btrfs_fs_info *fs_info = sctx-&gt;send_root-&gt;fs_info;</div><div class='add'>+	struct backref_cache_entry *new_entry;</div><div class='add'>+	struct ulist_iterator uiter;</div><div class='add'>+	struct ulist_node *node;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We're called while holding a transaction handle or while holding</div><div class='add'>+	 * fs_info-&gt;commit_root_sem (at iterate_extent_inodes()), so must do a</div><div class='add'>+	 * NOFS allocation.</div><div class='add'>+	 */</div><div class='add'>+	new_entry = kmalloc(sizeof(struct backref_cache_entry), GFP_NOFS);</div><div class='add'>+	/* No worries, cache is optional. */</div><div class='add'>+	if (!new_entry)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	new_entry-&gt;entry.key = leaf_bytenr &gt;&gt; fs_info-&gt;nodesize_bits;</div><div class='add'>+	new_entry-&gt;entry.gen = 0;</div><div class='add'>+	new_entry-&gt;num_roots = 0;</div><div class='add'>+	ULIST_ITER_INIT(&amp;uiter);</div><div class='add'>+	while ((node = ulist_next(root_ids, &amp;uiter)) != NULL) {</div><div class='add'>+		const u64 root_id = node-&gt;val;</div><div class='add'>+		struct clone_root *root;</div><div class='add'>+</div><div class='add'>+		root = bsearch((void *)(uintptr_t)root_id, sctx-&gt;clone_roots,</div><div class='add'>+			       sctx-&gt;clone_roots_cnt, sizeof(struct clone_root),</div><div class='add'>+			       __clone_root_cmp_bsearch);</div><div class='add'>+		if (!root)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		/* Too many roots, just exit, no worries as caching is optional. */</div><div class='add'>+		if (new_entry-&gt;num_roots &gt;= SEND_MAX_BACKREF_CACHE_ROOTS) {</div><div class='add'>+			kfree(new_entry);</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		new_entry-&gt;root_ids[new_entry-&gt;num_roots] = root_id;</div><div class='add'>+		new_entry-&gt;num_roots++;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We may have not added any roots to the new cache entry, which means</div><div class='add'>+	 * none of the roots is part of the list of roots from which we are</div><div class='add'>+	 * allowed to clone. Cache the new entry as it's still useful to avoid</div><div class='add'>+	 * backref walking to determine which roots have a path to the leaf.</div><div class='add'>+	 *</div><div class='add'>+	 * Also use GFP_NOFS because we're called while holding a transaction</div><div class='add'>+	 * handle or while holding fs_info-&gt;commit_root_sem.</div><div class='add'>+	 */</div><div class='add'>+	ret = btrfs_lru_cache_store(&amp;sctx-&gt;backref_cache, &amp;new_entry-&gt;entry,</div><div class='add'>+				    GFP_NOFS);</div><div class='add'>+	ASSERT(ret == 0 || ret == -ENOMEM);</div><div class='add'>+	if (ret) {</div><div class='add'>+		/* Caching is optional, no worries. */</div><div class='add'>+		kfree(new_entry);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We are called from iterate_extent_inodes() while either holding a</div><div class='add'>+	 * transaction handle or holding fs_info-&gt;commit_root_sem, so no need</div><div class='add'>+	 * to take any lock here.</div><div class='add'>+	 */</div><div class='add'>+	if (sctx-&gt;backref_cache.size == 1)</div><div class='add'>+		sctx-&gt;backref_cache_last_reloc_trans = fs_info-&gt;last_reloc_trans;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int check_extent_item(u64 bytenr, const struct btrfs_extent_item *ei,</div><div class='add'>+			     const struct extent_buffer *leaf, void *ctx)</div><div class='add'>+{</div><div class='add'>+	const u64 refs = btrfs_extent_refs(leaf, ei);</div><div class='add'>+	const struct backref_ctx *bctx = ctx;</div><div class='add'>+	const struct send_ctx *sctx = bctx-&gt;sctx;</div><div class='add'>+</div><div class='add'>+	if (bytenr == bctx-&gt;bytenr) {</div><div class='add'>+		const u64 flags = btrfs_extent_flags(leaf, ei);</div><div class='add'>+</div><div class='add'>+		if (WARN_ON(flags &amp; BTRFS_EXTENT_FLAG_TREE_BLOCK))</div><div class='add'>+			return -EUCLEAN;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * If we have only one reference and only the send root as a</div><div class='add'>+		 * clone source - meaning no clone roots were given in the</div><div class='add'>+		 * struct btrfs_ioctl_send_args passed to the send ioctl - then</div><div class='add'>+		 * it's our reference and there's no point in doing backref</div><div class='add'>+		 * walking which is expensive, so exit early.</div><div class='add'>+		 */</div><div class='add'>+		if (refs == 1 &amp;&amp; sctx-&gt;clone_roots_cnt == 1)</div><div class='add'>+			return -ENOENT;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Backreference walking (iterate_extent_inodes() below) is currently</div><div class='add'>+	 * too expensive when an extent has a large number of references, both</div><div class='add'>+	 * in time spent and used memory. So for now just fallback to write</div><div class='add'>+	 * operations instead of clone operations when an extent has more than</div><div class='add'>+	 * a certain amount of references.</div><div class='add'>+	 */</div><div class='add'>+	if (refs &gt; SEND_MAX_EXTENT_REFS)</div><div class='add'>+		return -ENOENT;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool skip_self_data_ref(u64 root, u64 ino, u64 offset, void *ctx)</div><div class='add'>+{</div><div class='add'>+	const struct backref_ctx *bctx = ctx;</div><div class='add'>+</div><div class='add'>+	if (ino == bctx-&gt;cur_objectid &amp;&amp;</div><div class='add'>+	    root == bctx-&gt;backref_owner &amp;&amp;</div><div class='add'>+	    offset == bctx-&gt;backref_offset)</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Given an inode, offset and extent item, it finds a good clone for a clone</div><div class='ctx'>  * instruction. Returns -ENOENT when none could be found. The function makes</div><div class='hunk'>@@ -1312,81 +1552,36 @@ static int find_extent_clone(struct send_ctx *sctx,</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = sctx-&gt;send_root-&gt;fs_info;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int extent_type;</div><div class='del'>-	u64 logical;</div><div class='ctx'> 	u64 disk_byte;</div><div class='ctx'> 	u64 num_bytes;</div><div class='del'>-	u64 extent_item_pos;</div><div class='del'>-	u64 flags = 0;</div><div class='ctx'> 	struct btrfs_file_extent_item *fi;</div><div class='ctx'> 	struct extent_buffer *eb = path-&gt;nodes[0];</div><div class='del'>-	struct backref_ctx backref_ctx = {0};</div><div class='add'>+	struct backref_ctx backref_ctx = { 0 };</div><div class='add'>+	struct btrfs_backref_walk_ctx backref_walk_ctx = { 0 };</div><div class='ctx'> 	struct clone_root *cur_clone_root;</div><div class='del'>-	struct btrfs_key found_key;</div><div class='del'>-	struct btrfs_path *tmp_path;</div><div class='del'>-	struct btrfs_extent_item *ei;</div><div class='ctx'> 	int compressed;</div><div class='ctx'> 	u32 i;</div><div class='ctx'> </div><div class='del'>-	tmp_path = alloc_path_for_send();</div><div class='del'>-	if (!tmp_path)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	/* We only use this path under the commit sem */</div><div class='del'>-	tmp_path-&gt;need_commit_sem = 0;</div><div class='del'>-</div><div class='del'>-	if (data_offset &gt;= ino_size) {</div><div class='del'>-		/*</div><div class='del'>-		 * There may be extents that lie behind the file's size.</div><div class='del'>-		 * I at least had this in combination with snapshotting while</div><div class='del'>-		 * writing large files.</div><div class='del'>-		 */</div><div class='del'>-		ret = 0;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	/*</div><div class='add'>+	 * With fallocate we can get prealloc extents beyond the inode's i_size,</div><div class='add'>+	 * so we don't do anything here because clone operations can not clone</div><div class='add'>+	 * to a range beyond i_size without increasing the i_size of the</div><div class='add'>+	 * destination inode.</div><div class='add'>+	 */</div><div class='add'>+	if (data_offset &gt;= ino_size)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	fi = btrfs_item_ptr(eb, path-&gt;slots[0],</div><div class='del'>-			struct btrfs_file_extent_item);</div><div class='add'>+	fi = btrfs_item_ptr(eb, path-&gt;slots[0], struct btrfs_file_extent_item);</div><div class='ctx'> 	extent_type = btrfs_file_extent_type(eb, fi);</div><div class='del'>-	if (extent_type == BTRFS_FILE_EXTENT_INLINE) {</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	compressed = btrfs_file_extent_compression(eb, fi);</div><div class='add'>+	if (extent_type == BTRFS_FILE_EXTENT_INLINE)</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> </div><div class='del'>-	num_bytes = btrfs_file_extent_num_bytes(eb, fi);</div><div class='ctx'> 	disk_byte = btrfs_file_extent_disk_bytenr(eb, fi);</div><div class='del'>-	if (disk_byte == 0) {</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	logical = disk_byte + btrfs_file_extent_offset(eb, fi);</div><div class='del'>-</div><div class='del'>-	down_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='del'>-	ret = extent_from_logical(fs_info, disk_byte, tmp_path,</div><div class='del'>-				  &amp;found_key, &amp;flags);</div><div class='del'>-	up_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='del'>-</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-	if (flags &amp; BTRFS_EXTENT_FLAG_TREE_BLOCK) {</div><div class='del'>-		ret = -EIO;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (disk_byte == 0)</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> </div><div class='del'>-	ei = btrfs_item_ptr(tmp_path-&gt;nodes[0], tmp_path-&gt;slots[0],</div><div class='del'>-			    struct btrfs_extent_item);</div><div class='del'>-	/*</div><div class='del'>-	 * Backreference walking (iterate_extent_inodes() below) is currently</div><div class='del'>-	 * too expensive when an extent has a large number of references, both</div><div class='del'>-	 * in time spent and used memory. So for now just fallback to write</div><div class='del'>-	 * operations instead of clone operations when an extent has more than</div><div class='del'>-	 * a certain amount of references.</div><div class='del'>-	 */</div><div class='del'>-	if (btrfs_extent_refs(tmp_path-&gt;nodes[0], ei) &gt; SEND_MAX_EXTENT_REFS) {</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	btrfs_release_path(tmp_path);</div><div class='add'>+	compressed = btrfs_file_extent_compression(eb, fi);</div><div class='add'>+	num_bytes = btrfs_file_extent_num_bytes(eb, fi);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Setup the clone roots.</div><div class='hunk'>@@ -1395,64 +1590,105 @@ static int find_extent_clone(struct send_ctx *sctx,</div><div class='ctx'> 		cur_clone_root = sctx-&gt;clone_roots + i;</div><div class='ctx'> 		cur_clone_root-&gt;ino = (u64)-1;</div><div class='ctx'> 		cur_clone_root-&gt;offset = 0;</div><div class='del'>-		cur_clone_root-&gt;found_refs = 0;</div><div class='add'>+		cur_clone_root-&gt;num_bytes = 0;</div><div class='add'>+		cur_clone_root-&gt;found_ref = false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	backref_ctx.sctx = sctx;</div><div class='del'>-	backref_ctx.found = 0;</div><div class='ctx'> 	backref_ctx.cur_objectid = ino;</div><div class='ctx'> 	backref_ctx.cur_offset = data_offset;</div><div class='del'>-	backref_ctx.found_itself = 0;</div><div class='del'>-	backref_ctx.extent_len = num_bytes;</div><div class='add'>+	backref_ctx.bytenr = disk_byte;</div><div class='add'>+	/*</div><div class='add'>+	 * Use the header owner and not the send root's id, because in case of a</div><div class='add'>+	 * snapshot we can have shared subtrees.</div><div class='add'>+	 */</div><div class='add'>+	backref_ctx.backref_owner = btrfs_header_owner(eb);</div><div class='add'>+	backref_ctx.backref_offset = data_offset - btrfs_file_extent_offset(eb, fi);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The last extent of a file may be too large due to page alignment.</div><div class='ctx'> 	 * We need to adjust extent_len in this case so that the checks in</div><div class='del'>-	 * __iterate_backrefs work.</div><div class='add'>+	 * iterate_backrefs() work.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (data_offset + num_bytes &gt;= ino_size)</div><div class='ctx'> 		backref_ctx.extent_len = ino_size - data_offset;</div><div class='add'>+	else</div><div class='add'>+		backref_ctx.extent_len = num_bytes;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Now collect all backrefs.</div><div class='ctx'> 	 */</div><div class='add'>+	backref_walk_ctx.bytenr = disk_byte;</div><div class='ctx'> 	if (compressed == BTRFS_COMPRESS_NONE)</div><div class='del'>-		extent_item_pos = logical - found_key.objectid;</div><div class='del'>-	else</div><div class='del'>-		extent_item_pos = 0;</div><div class='del'>-	ret = iterate_extent_inodes(fs_info, found_key.objectid,</div><div class='del'>-				    extent_item_pos, 1, __iterate_backrefs,</div><div class='del'>-				    &amp;backref_ctx, false);</div><div class='add'>+		backref_walk_ctx.extent_item_pos = btrfs_file_extent_offset(eb, fi);</div><div class='add'>+	backref_walk_ctx.fs_info = fs_info;</div><div class='add'>+	backref_walk_ctx.cache_lookup = lookup_backref_cache;</div><div class='add'>+	backref_walk_ctx.cache_store = store_backref_cache;</div><div class='add'>+	backref_walk_ctx.indirect_ref_iterator = iterate_backrefs;</div><div class='add'>+	backref_walk_ctx.check_extent_item = check_extent_item;</div><div class='add'>+	backref_walk_ctx.user_ctx = &amp;backref_ctx;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If have a single clone root, then it's the send root and we can tell</div><div class='add'>+	 * the backref walking code to skip our own backref and not resolve it,</div><div class='add'>+	 * since we can not use it for cloning - the source and destination</div><div class='add'>+	 * ranges can't overlap and in case the leaf is shared through a subtree</div><div class='add'>+	 * due to snapshots, we can't use those other roots since they are not</div><div class='add'>+	 * in the list of clone roots.</div><div class='add'>+	 */</div><div class='add'>+	if (sctx-&gt;clone_roots_cnt == 1)</div><div class='add'>+		backref_walk_ctx.skip_data_ref = skip_self_data_ref;</div><div class='ctx'> </div><div class='add'>+	ret = iterate_extent_inodes(&amp;backref_walk_ctx, true, iterate_backrefs,</div><div class='add'>+				    &amp;backref_ctx);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	if (!backref_ctx.found_itself) {</div><div class='del'>-		/* found a bug in backref code? */</div><div class='del'>-		ret = -EIO;</div><div class='del'>-		btrfs_err(fs_info,</div><div class='del'>-			  "did not find backref in send_root. inode=%llu, offset=%llu, disk_byte=%llu found extent=%llu",</div><div class='del'>-			  ino, data_offset, disk_byte, found_key.objectid);</div><div class='del'>-		goto out;</div><div class='add'>+	down_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='add'>+	if (fs_info-&gt;last_reloc_trans &gt; sctx-&gt;last_reloc_trans) {</div><div class='add'>+		/*</div><div class='add'>+		 * A transaction commit for a transaction in which block group</div><div class='add'>+		 * relocation was done just happened.</div><div class='add'>+		 * The disk_bytenr of the file extent item we processed is</div><div class='add'>+		 * possibly stale, referring to the extent's location before</div><div class='add'>+		 * relocation. So act as if we haven't found any clone sources</div><div class='add'>+		 * and fallback to write commands, which will read the correct</div><div class='add'>+		 * data from the new extent location. Otherwise we will fail</div><div class='add'>+		 * below because we haven't found our own back reference or we</div><div class='add'>+		 * could be getting incorrect sources in case the old extent</div><div class='add'>+		 * was already reallocated after the relocation.</div><div class='add'>+		 */</div><div class='add'>+		up_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	btrfs_debug(fs_info,</div><div class='del'>-		    "find_extent_clone: data_offset=%llu, ino=%llu, num_bytes=%llu, logical=%llu",</div><div class='del'>-		    data_offset, ino, num_bytes, logical);</div><div class='add'>+	up_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='ctx'> </div><div class='ctx'> 	if (!backref_ctx.found)</div><div class='del'>-		btrfs_debug(fs_info, "no clones found");</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> </div><div class='ctx'> 	cur_clone_root = NULL;</div><div class='ctx'> 	for (i = 0; i &lt; sctx-&gt;clone_roots_cnt; i++) {</div><div class='del'>-		if (sctx-&gt;clone_roots[i].found_refs) {</div><div class='del'>-			if (!cur_clone_root)</div><div class='del'>-				cur_clone_root = sctx-&gt;clone_roots + i;</div><div class='del'>-			else if (sctx-&gt;clone_roots[i].root == sctx-&gt;send_root)</div><div class='del'>-				/* prefer clones from send_root over others */</div><div class='del'>-				cur_clone_root = sctx-&gt;clone_roots + i;</div><div class='del'>-		}</div><div class='add'>+		struct clone_root *clone_root = &amp;sctx-&gt;clone_roots[i];</div><div class='add'>+</div><div class='add'>+		if (!clone_root-&gt;found_ref)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Choose the root from which we can clone more bytes, to</div><div class='add'>+		 * minimize write operations and therefore have more extent</div><div class='add'>+		 * sharing at the destination (the same as in the source).</div><div class='add'>+		 */</div><div class='add'>+		if (!cur_clone_root ||</div><div class='add'>+		    clone_root-&gt;num_bytes &gt; cur_clone_root-&gt;num_bytes) {</div><div class='add'>+			cur_clone_root = clone_root;</div><div class='ctx'> </div><div class='add'>+			/*</div><div class='add'>+			 * We found an optimal clone candidate (any inode from</div><div class='add'>+			 * any root is fine), so we're done.</div><div class='add'>+			 */</div><div class='add'>+			if (clone_root-&gt;num_bytes &gt;= backref_ctx.extent_len)</div><div class='add'>+				break;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (cur_clone_root) {</div><div class='hunk'>@@ -1462,8 +1698,6 @@ static int find_extent_clone(struct send_ctx *sctx,</div><div class='ctx'> 		ret = -ENOENT;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(tmp_path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1472,7 +1706,7 @@ static int read_symlink(struct btrfs_root *root,</div><div class='ctx'> 			struct fs_path *dest)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_file_extent_item *ei;</div><div class='ctx'> 	u8 type;</div><div class='hunk'>@@ -1489,38 +1723,45 @@ static int read_symlink(struct btrfs_root *root,</div><div class='ctx'> 	key.offset = 0;</div><div class='ctx'> 	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-	if (ret) {</div><div class='add'>+		return ret;</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * An empty symlink inode. Can happen in rare error paths when</div><div class='ctx'> 		 * creating a symlink (transaction committed before the inode</div><div class='ctx'> 		 * eviction handler removed the symlink inode items and a crash</div><div class='del'>-		 * happened in between or the subvol was snapshoted in between).</div><div class='add'>+		 * happened in between or the subvol was snapshotted in between).</div><div class='ctx'> 		 * Print an informative message to dmesg/syslog so that the user</div><div class='ctx'> 		 * can delete the symlink.</div><div class='ctx'> 		 */</div><div class='ctx'> 		btrfs_err(root-&gt;fs_info,</div><div class='ctx'> 			  "Found empty symlink inode %llu at root %llu",</div><div class='del'>-			  ino, root-&gt;root_key.objectid);</div><div class='del'>-		ret = -EIO;</div><div class='del'>-		goto out;</div><div class='add'>+			  ino, btrfs_root_id(root));</div><div class='add'>+		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ei = btrfs_item_ptr(path-&gt;nodes[0], path-&gt;slots[0],</div><div class='ctx'> 			struct btrfs_file_extent_item);</div><div class='ctx'> 	type = btrfs_file_extent_type(path-&gt;nodes[0], ei);</div><div class='add'>+	if (unlikely(type != BTRFS_FILE_EXTENT_INLINE)) {</div><div class='add'>+		ret = -EUCLEAN;</div><div class='add'>+		btrfs_crit(root-&gt;fs_info,</div><div class='add'>+"send: found symlink extent that is not inline, ino %llu root %llu extent type %d",</div><div class='add'>+			   ino, btrfs_root_id(root), type);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='ctx'> 	compression = btrfs_file_extent_compression(path-&gt;nodes[0], ei);</div><div class='del'>-	BUG_ON(type != BTRFS_FILE_EXTENT_INLINE);</div><div class='del'>-	BUG_ON(compression);</div><div class='add'>+	if (unlikely(compression != BTRFS_COMPRESS_NONE)) {</div><div class='add'>+		ret = -EUCLEAN;</div><div class='add'>+		btrfs_crit(root-&gt;fs_info,</div><div class='add'>+"send: found symlink extent with compression, ino %llu root %llu compression type %d",</div><div class='add'>+			   ino, btrfs_root_id(root), compression);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	off = btrfs_file_extent_inline_start(ei);</div><div class='ctx'> 	len = btrfs_file_extent_ram_bytes(path-&gt;nodes[0], ei);</div><div class='ctx'> </div><div class='del'>-	ret = fs_path_add_from_extent_buffer(dest, path-&gt;nodes[0], off, len);</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	return fs_path_add_from_extent_buffer(dest, path-&gt;nodes[0], off, len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1531,8 +1772,7 @@ static int gen_unique_name(struct send_ctx *sctx,</div><div class='ctx'> 			   u64 ino, u64 gen,</div><div class='ctx'> 			   struct fs_path *dest)</div><div class='ctx'> {</div><div class='del'>-	int ret = 0;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_dir_item *di;</div><div class='ctx'> 	char tmp[64];</div><div class='ctx'> 	int len;</div><div class='hunk'>@@ -1543,18 +1783,21 @@ static int gen_unique_name(struct send_ctx *sctx,</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='add'>+		struct fscrypt_str tmp_name;</div><div class='add'>+</div><div class='ctx'> 		len = snprintf(tmp, sizeof(tmp), "o%llu-%llu-%llu",</div><div class='ctx'> 				ino, gen, idx);</div><div class='ctx'> 		ASSERT(len &lt; sizeof(tmp));</div><div class='add'>+		tmp_name.name = tmp;</div><div class='add'>+		tmp_name.len = len;</div><div class='ctx'> </div><div class='ctx'> 		di = btrfs_lookup_dir_item(NULL, sctx-&gt;send_root,</div><div class='ctx'> 				path, BTRFS_FIRST_FREE_OBJECTID,</div><div class='del'>-				tmp, strlen(tmp), 0);</div><div class='add'>+				&amp;tmp_name, 0);</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='del'>-		if (IS_ERR(di)) {</div><div class='del'>-			ret = PTR_ERR(di);</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+		if (IS_ERR(di))</div><div class='add'>+			return PTR_ERR(di);</div><div class='add'>+</div><div class='ctx'> 		if (di) {</div><div class='ctx'> 			/* not unique, try again */</div><div class='ctx'> 			idx++;</div><div class='hunk'>@@ -1563,18 +1806,16 @@ static int gen_unique_name(struct send_ctx *sctx,</div><div class='ctx'> </div><div class='ctx'> 		if (!sctx-&gt;parent_root) {</div><div class='ctx'> 			/* unique */</div><div class='del'>-			ret = 0;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		di = btrfs_lookup_dir_item(NULL, sctx-&gt;parent_root,</div><div class='ctx'> 				path, BTRFS_FIRST_FREE_OBJECTID,</div><div class='del'>-				tmp, strlen(tmp), 0);</div><div class='add'>+				&amp;tmp_name, 0);</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='del'>-		if (IS_ERR(di)) {</div><div class='del'>-			ret = PTR_ERR(di);</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+		if (IS_ERR(di))</div><div class='add'>+			return PTR_ERR(di);</div><div class='add'>+</div><div class='ctx'> 		if (di) {</div><div class='ctx'> 			/* not unique, try again */</div><div class='ctx'> 			idx++;</div><div class='hunk'>@@ -1584,11 +1825,7 @@ static int gen_unique_name(struct send_ctx *sctx,</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = fs_path_add(dest, tmp, strlen(tmp));</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	return fs_path_add(dest, tmp, len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> enum inode_state {</div><div class='hunk'>@@ -1599,28 +1836,34 @@ enum inode_state {</div><div class='ctx'> 	inode_state_did_delete,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int get_cur_inode_state(struct send_ctx *sctx, u64 ino, u64 gen)</div><div class='add'>+static int get_cur_inode_state(struct send_ctx *sctx, u64 ino, u64 gen,</div><div class='add'>+			       u64 *send_gen, u64 *parent_gen)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int left_ret;</div><div class='ctx'> 	int right_ret;</div><div class='ctx'> 	u64 left_gen;</div><div class='del'>-	u64 right_gen;</div><div class='add'>+	u64 right_gen = 0;</div><div class='add'>+	struct btrfs_inode_info info;</div><div class='ctx'> </div><div class='del'>-	ret = get_inode_info(sctx-&gt;send_root, ino, NULL, &amp;left_gen, NULL, NULL,</div><div class='del'>-			NULL, NULL);</div><div class='add'>+	ret = get_inode_info(sctx-&gt;send_root, ino, &amp;info);</div><div class='ctx'> 	if (ret &lt; 0 &amp;&amp; ret != -ENOENT)</div><div class='del'>-		goto out;</div><div class='del'>-	left_ret = ret;</div><div class='add'>+		return ret;</div><div class='add'>+	left_ret = (info.nlink == 0) ? -ENOENT : ret;</div><div class='add'>+	left_gen = info.gen;</div><div class='add'>+	if (send_gen)</div><div class='add'>+		*send_gen = ((left_ret == -ENOENT) ? 0 : info.gen);</div><div class='ctx'> </div><div class='ctx'> 	if (!sctx-&gt;parent_root) {</div><div class='ctx'> 		right_ret = -ENOENT;</div><div class='ctx'> 	} else {</div><div class='del'>-		ret = get_inode_info(sctx-&gt;parent_root, ino, NULL, &amp;right_gen,</div><div class='del'>-				NULL, NULL, NULL, NULL);</div><div class='add'>+		ret = get_inode_info(sctx-&gt;parent_root, ino, &amp;info);</div><div class='ctx'> 		if (ret &lt; 0 &amp;&amp; ret != -ENOENT)</div><div class='del'>-			goto out;</div><div class='del'>-		right_ret = ret;</div><div class='add'>+			return ret;</div><div class='add'>+		right_ret = (info.nlink == 0) ? -ENOENT : ret;</div><div class='add'>+		right_gen = info.gen;</div><div class='add'>+		if (parent_gen)</div><div class='add'>+			*parent_gen = ((right_ret == -ENOENT) ? 0 : info.gen);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!left_ret &amp;&amp; !right_ret) {</div><div class='hunk'>@@ -1661,30 +1904,27 @@ static int get_cur_inode_state(struct send_ctx *sctx, u64 ino, u64 gen)</div><div class='ctx'> 		ret = -ENOENT;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int is_inode_existent(struct send_ctx *sctx, u64 ino, u64 gen)</div><div class='add'>+static int is_inode_existent(struct send_ctx *sctx, u64 ino, u64 gen,</div><div class='add'>+			     u64 *send_gen, u64 *parent_gen)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (ino == BTRFS_FIRST_FREE_OBJECTID)</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='del'>-	ret = get_cur_inode_state(sctx, ino, gen);</div><div class='add'>+	ret = get_cur_inode_state(sctx, ino, gen, send_gen, parent_gen);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	if (ret == inode_state_no_change ||</div><div class='ctx'> 	    ret == inode_state_did_create ||</div><div class='ctx'> 	    ret == inode_state_will_delete)</div><div class='del'>-		ret = 1;</div><div class='del'>-	else</div><div class='del'>-		ret = 0;</div><div class='add'>+		return 1;</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1692,34 +1932,28 @@ out:</div><div class='ctx'>  */</div><div class='ctx'> static int lookup_dir_item_inode(struct btrfs_root *root,</div><div class='ctx'> 				 u64 dir, const char *name, int name_len,</div><div class='del'>-				 u64 *found_inode,</div><div class='del'>-				 u8 *found_type)</div><div class='add'>+				 u64 *found_inode)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	struct btrfs_dir_item *di;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='add'>+	struct fscrypt_str name_str = FSTR_INIT((char *)name, name_len);</div><div class='ctx'> </div><div class='ctx'> 	path = alloc_path_for_send();</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	di = btrfs_lookup_dir_item(NULL, root, path,</div><div class='del'>-			dir, name, name_len, 0);</div><div class='del'>-	if (IS_ERR_OR_NULL(di)) {</div><div class='del'>-		ret = di ? PTR_ERR(di) : -ENOENT;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	di = btrfs_lookup_dir_item(NULL, root, path, dir, &amp;name_str, 0);</div><div class='add'>+	if (IS_ERR_OR_NULL(di))</div><div class='add'>+		return di ? PTR_ERR(di) : -ENOENT;</div><div class='add'>+</div><div class='ctx'> 	btrfs_dir_item_key_to_cpu(path-&gt;nodes[0], di, &amp;key);</div><div class='del'>-	if (key.type == BTRFS_ROOT_ITEM_KEY) {</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (key.type == BTRFS_ROOT_ITEM_KEY)</div><div class='add'>+		return -ENOENT;</div><div class='add'>+</div><div class='ctx'> 	*found_inode = key.objectid;</div><div class='del'>-	*found_type = btrfs_dir_type(path-&gt;nodes[0], di);</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1733,7 +1967,7 @@ static int get_first_ref(struct btrfs_root *root, u64 ino,</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_key found_key;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	int len;</div><div class='ctx'> 	u64 parent_dir;</div><div class='ctx'> </div><div class='hunk'>@@ -1747,16 +1981,14 @@ static int get_first_ref(struct btrfs_root *root, u64 ino,</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_search_slot_for_read(root, &amp;key, path, 1, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;found_key,</div><div class='ctx'> 				path-&gt;slots[0]);</div><div class='ctx'> 	if (ret || found_key.objectid != ino ||</div><div class='ctx'> 	    (found_key.type != BTRFS_INODE_REF_KEY &amp;&amp;</div><div class='del'>-	     found_key.type != BTRFS_INODE_EXTREF_KEY)) {</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	     found_key.type != BTRFS_INODE_EXTREF_KEY))</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> </div><div class='ctx'> 	if (found_key.type == BTRFS_INODE_REF_KEY) {</div><div class='ctx'> 		struct btrfs_inode_ref *iref;</div><div class='hunk'>@@ -1777,20 +2009,17 @@ static int get_first_ref(struct btrfs_root *root, u64 ino,</div><div class='ctx'> 		parent_dir = btrfs_inode_extref_parent(path-&gt;nodes[0], extref);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='ctx'> 	if (dir_gen) {</div><div class='del'>-		ret = get_inode_info(root, parent_dir, NULL, dir_gen, NULL,</div><div class='del'>-				     NULL, NULL, NULL);</div><div class='add'>+		ret = get_inode_gen(root, parent_dir, dir_gen);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	*dir = parent_dir;</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1836,44 +2065,36 @@ static int will_overwrite_ref(struct send_ctx *sctx, u64 dir, u64 dir_gen,</div><div class='ctx'> 			      const char *name, int name_len,</div><div class='ctx'> 			      u64 *who_ino, u64 *who_gen, u64 *who_mode)</div><div class='ctx'> {</div><div class='del'>-	int ret = 0;</div><div class='del'>-	u64 gen;</div><div class='add'>+	int ret;</div><div class='add'>+	u64 parent_root_dir_gen;</div><div class='ctx'> 	u64 other_inode = 0;</div><div class='del'>-	u8 other_type = 0;</div><div class='add'>+	struct btrfs_inode_info info;</div><div class='ctx'> </div><div class='ctx'> 	if (!sctx-&gt;parent_root)</div><div class='del'>-		goto out;</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	ret = is_inode_existent(sctx, dir, dir_gen);</div><div class='add'>+	ret = is_inode_existent(sctx, dir, dir_gen, NULL, &amp;parent_root_dir_gen);</div><div class='ctx'> 	if (ret &lt;= 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If we have a parent root we need to verify that the parent dir was</div><div class='ctx'> 	 * not deleted and then re-created, if it was then we have no overwrite</div><div class='ctx'> 	 * and we can just unlink this entry.</div><div class='add'>+	 *</div><div class='add'>+	 * @parent_root_dir_gen was set to 0 if the inode does not exist in the</div><div class='add'>+	 * parent root.</div><div class='ctx'> 	 */</div><div class='del'>-	if (sctx-&gt;parent_root &amp;&amp; dir != BTRFS_FIRST_FREE_OBJECTID) {</div><div class='del'>-		ret = get_inode_info(sctx-&gt;parent_root, dir, NULL, &amp;gen, NULL,</div><div class='del'>-				     NULL, NULL, NULL);</div><div class='del'>-		if (ret &lt; 0 &amp;&amp; ret != -ENOENT)</div><div class='del'>-			goto out;</div><div class='del'>-		if (ret) {</div><div class='del'>-			ret = 0;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		if (gen != dir_gen)</div><div class='del'>-			goto out;</div><div class='del'>-	}</div><div class='add'>+	if (sctx-&gt;parent_root &amp;&amp; dir != BTRFS_FIRST_FREE_OBJECTID &amp;&amp;</div><div class='add'>+	    parent_root_dir_gen != dir_gen)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> 	ret = lookup_dir_item_inode(sctx-&gt;parent_root, dir, name, name_len,</div><div class='del'>-			&amp;other_inode, &amp;other_type);</div><div class='del'>-	if (ret &lt; 0 &amp;&amp; ret != -ENOENT)</div><div class='del'>-		goto out;</div><div class='del'>-	if (ret) {</div><div class='del'>-		ret = 0;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+				    &amp;other_inode);</div><div class='add'>+	if (ret == -ENOENT)</div><div class='add'>+		return 0;</div><div class='add'>+	else if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Check if the overwritten ref was already processed. If yes, the ref</div><div class='hunk'>@@ -1882,19 +2103,17 @@ static int will_overwrite_ref(struct send_ctx *sctx, u64 dir, u64 dir_gen,</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (other_inode &gt; sctx-&gt;send_progress ||</div><div class='ctx'> 	    is_waiting_for_move(sctx, other_inode)) {</div><div class='del'>-		ret = get_inode_info(sctx-&gt;parent_root, other_inode, NULL,</div><div class='del'>-				who_gen, who_mode, NULL, NULL, NULL);</div><div class='add'>+		ret = get_inode_info(sctx-&gt;parent_root, other_inode, &amp;info);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> </div><div class='del'>-		ret = 1;</div><div class='ctx'> 		*who_ino = other_inode;</div><div class='del'>-	} else {</div><div class='del'>-		ret = 0;</div><div class='add'>+		*who_gen = info.gen;</div><div class='add'>+		*who_mode = info.mode;</div><div class='add'>+		return 1;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1909,50 +2128,43 @@ static int did_overwrite_ref(struct send_ctx *sctx,</div><div class='ctx'> 			    u64 ino, u64 ino_gen,</div><div class='ctx'> 			    const char *name, int name_len)</div><div class='ctx'> {</div><div class='del'>-	int ret = 0;</div><div class='del'>-	u64 gen;</div><div class='add'>+	int ret;</div><div class='ctx'> 	u64 ow_inode;</div><div class='del'>-	u8 other_type;</div><div class='add'>+	u64 ow_gen = 0;</div><div class='add'>+	u64 send_root_dir_gen;</div><div class='ctx'> </div><div class='ctx'> 	if (!sctx-&gt;parent_root)</div><div class='del'>-		goto out;</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	ret = is_inode_existent(sctx, dir, dir_gen);</div><div class='add'>+	ret = is_inode_existent(sctx, dir, dir_gen, &amp;send_root_dir_gen, NULL);</div><div class='ctx'> 	if (ret &lt;= 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	if (dir != BTRFS_FIRST_FREE_OBJECTID) {</div><div class='del'>-		ret = get_inode_info(sctx-&gt;send_root, dir, NULL, &amp;gen, NULL,</div><div class='del'>-				     NULL, NULL, NULL);</div><div class='del'>-		if (ret &lt; 0 &amp;&amp; ret != -ENOENT)</div><div class='del'>-			goto out;</div><div class='del'>-		if (ret) {</div><div class='del'>-			ret = 0;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		if (gen != dir_gen)</div><div class='del'>-			goto out;</div><div class='del'>-	}</div><div class='add'>+	/*</div><div class='add'>+	 * @send_root_dir_gen was set to 0 if the inode does not exist in the</div><div class='add'>+	 * send root.</div><div class='add'>+	 */</div><div class='add'>+	if (dir != BTRFS_FIRST_FREE_OBJECTID &amp;&amp; send_root_dir_gen != dir_gen)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/* check if the ref was overwritten by another ref */</div><div class='ctx'> 	ret = lookup_dir_item_inode(sctx-&gt;send_root, dir, name, name_len,</div><div class='del'>-			&amp;ow_inode, &amp;other_type);</div><div class='del'>-	if (ret &lt; 0 &amp;&amp; ret != -ENOENT)</div><div class='del'>-		goto out;</div><div class='del'>-	if (ret) {</div><div class='add'>+				    &amp;ow_inode);</div><div class='add'>+	if (ret == -ENOENT) {</div><div class='ctx'> 		/* was never and will never be overwritten */</div><div class='del'>-		ret = 0;</div><div class='del'>-		goto out;</div><div class='add'>+		return 0;</div><div class='add'>+	} else if (ret &lt; 0) {</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = get_inode_info(sctx-&gt;send_root, ow_inode, NULL, &amp;gen, NULL, NULL,</div><div class='del'>-			NULL, NULL);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+	if (ow_inode == ino) {</div><div class='add'>+		ret = get_inode_gen(sctx-&gt;send_root, ow_inode, &amp;ow_gen);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='ctx'> </div><div class='del'>-	if (ow_inode == ino &amp;&amp; gen == ino_gen) {</div><div class='del'>-		ret = 0;</div><div class='del'>-		goto out;</div><div class='add'>+		/* It's the same inode, so no overwrite happened. */</div><div class='add'>+		if (ow_gen == ino_gen)</div><div class='add'>+			return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1961,15 +2173,20 @@ static int did_overwrite_ref(struct send_ctx *sctx,</div><div class='ctx'> 	 * inode 'ino' to be orphanized, therefore check if ow_inode matches</div><div class='ctx'> 	 * the current inode being processed.</div><div class='ctx'> 	 */</div><div class='del'>-	if ((ow_inode &lt; sctx-&gt;send_progress) ||</div><div class='del'>-	    (ino != sctx-&gt;cur_ino &amp;&amp; ow_inode == sctx-&gt;cur_ino &amp;&amp;</div><div class='del'>-	     gen == sctx-&gt;cur_inode_gen))</div><div class='del'>-		ret = 1;</div><div class='del'>-	else</div><div class='del'>-		ret = 0;</div><div class='add'>+	if (ow_inode &lt; sctx-&gt;send_progress)</div><div class='add'>+		return 1;</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	return ret;</div><div class='add'>+	if (ino != sctx-&gt;cur_ino &amp;&amp; ow_inode == sctx-&gt;cur_ino) {</div><div class='add'>+		if (ow_gen == 0) {</div><div class='add'>+			ret = get_inode_gen(sctx-&gt;send_root, ow_inode, &amp;ow_gen);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				return ret;</div><div class='add'>+		}</div><div class='add'>+		if (ow_gen == sctx-&gt;cur_inode_gen)</div><div class='add'>+			return 1;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2003,113 +2220,16 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Insert a name cache entry. On 32bit kernels the radix tree index is 32bit,</div><div class='del'>- * so we need to do some special handling in case we have clashes. This function</div><div class='del'>- * takes care of this with the help of name_cache_entry::radix_list.</div><div class='del'>- * In case of error, nce is kfreed.</div><div class='del'>- */</div><div class='del'>-static int name_cache_insert(struct send_ctx *sctx,</div><div class='del'>-			     struct name_cache_entry *nce)</div><div class='add'>+static inline struct name_cache_entry *name_cache_search(struct send_ctx *sctx,</div><div class='add'>+							 u64 ino, u64 gen)</div><div class='ctx'> {</div><div class='del'>-	int ret = 0;</div><div class='del'>-	struct list_head *nce_head;</div><div class='del'>-</div><div class='del'>-	nce_head = radix_tree_lookup(&amp;sctx-&gt;name_cache,</div><div class='del'>-			(unsigned long)nce-&gt;ino);</div><div class='del'>-	if (!nce_head) {</div><div class='del'>-		nce_head = kmalloc(sizeof(*nce_head), GFP_KERNEL);</div><div class='del'>-		if (!nce_head) {</div><div class='del'>-			kfree(nce);</div><div class='del'>-			return -ENOMEM;</div><div class='del'>-		}</div><div class='del'>-		INIT_LIST_HEAD(nce_head);</div><div class='del'>-</div><div class='del'>-		ret = radix_tree_insert(&amp;sctx-&gt;name_cache, nce-&gt;ino, nce_head);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			kfree(nce_head);</div><div class='del'>-			kfree(nce);</div><div class='del'>-			return ret;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	list_add_tail(&amp;nce-&gt;radix_list, nce_head);</div><div class='del'>-	list_add_tail(&amp;nce-&gt;list, &amp;sctx-&gt;name_cache_list);</div><div class='del'>-	sctx-&gt;name_cache_size++;</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void name_cache_delete(struct send_ctx *sctx,</div><div class='del'>-			      struct name_cache_entry *nce)</div><div class='del'>-{</div><div class='del'>-	struct list_head *nce_head;</div><div class='del'>-</div><div class='del'>-	nce_head = radix_tree_lookup(&amp;sctx-&gt;name_cache,</div><div class='del'>-			(unsigned long)nce-&gt;ino);</div><div class='del'>-	if (!nce_head) {</div><div class='del'>-		btrfs_err(sctx-&gt;send_root-&gt;fs_info,</div><div class='del'>-	      "name_cache_delete lookup failed ino %llu cache size %d, leaking memory",</div><div class='del'>-			nce-&gt;ino, sctx-&gt;name_cache_size);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	list_del(&amp;nce-&gt;radix_list);</div><div class='del'>-	list_del(&amp;nce-&gt;list);</div><div class='del'>-	sctx-&gt;name_cache_size--;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * We may not get to the final release of nce_head if the lookup fails</div><div class='del'>-	 */</div><div class='del'>-	if (nce_head &amp;&amp; list_empty(nce_head)) {</div><div class='del'>-		radix_tree_delete(&amp;sctx-&gt;name_cache, (unsigned long)nce-&gt;ino);</div><div class='del'>-		kfree(nce_head);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='add'>+	struct btrfs_lru_cache_entry *entry;</div><div class='ctx'> </div><div class='del'>-static struct name_cache_entry *name_cache_search(struct send_ctx *sctx,</div><div class='del'>-						    u64 ino, u64 gen)</div><div class='del'>-{</div><div class='del'>-	struct list_head *nce_head;</div><div class='del'>-	struct name_cache_entry *cur;</div><div class='del'>-</div><div class='del'>-	nce_head = radix_tree_lookup(&amp;sctx-&gt;name_cache, (unsigned long)ino);</div><div class='del'>-	if (!nce_head)</div><div class='add'>+	entry = btrfs_lru_cache_lookup(&amp;sctx-&gt;name_cache, ino, gen);</div><div class='add'>+	if (!entry)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry(cur, nce_head, radix_list) {</div><div class='del'>-		if (cur-&gt;ino == ino &amp;&amp; cur-&gt;gen == gen)</div><div class='del'>-			return cur;</div><div class='del'>-	}</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Remove some entries from the beginning of name_cache_list.</div><div class='del'>- */</div><div class='del'>-static void name_cache_clean_unused(struct send_ctx *sctx)</div><div class='del'>-{</div><div class='del'>-	struct name_cache_entry *nce;</div><div class='del'>-</div><div class='del'>-	if (sctx-&gt;name_cache_size &lt; SEND_CTX_NAME_CACHE_CLEAN_SIZE)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	while (sctx-&gt;name_cache_size &gt; SEND_CTX_MAX_NAME_CACHE_SIZE) {</div><div class='del'>-		nce = list_entry(sctx-&gt;name_cache_list.next,</div><div class='del'>-				struct name_cache_entry, list);</div><div class='del'>-		name_cache_delete(sctx, nce);</div><div class='del'>-		kfree(nce);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void name_cache_free(struct send_ctx *sctx)</div><div class='del'>-{</div><div class='del'>-	struct name_cache_entry *nce;</div><div class='del'>-</div><div class='del'>-	while (!list_empty(&amp;sctx-&gt;name_cache_list)) {</div><div class='del'>-		nce = list_entry(sctx-&gt;name_cache_list.next,</div><div class='del'>-				struct name_cache_entry, list);</div><div class='del'>-		name_cache_delete(sctx, nce);</div><div class='del'>-		kfree(nce);</div><div class='del'>-	}</div><div class='add'>+	return container_of(entry, struct name_cache_entry, entry);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2128,7 +2248,7 @@ static int __get_cur_name_and_parent(struct send_ctx *sctx,</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int nce_ret;</div><div class='del'>-	struct name_cache_entry *nce = NULL;</div><div class='add'>+	struct name_cache_entry *nce;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * First check if we already did a call to this function with the same</div><div class='hunk'>@@ -2138,40 +2258,31 @@ static int __get_cur_name_and_parent(struct send_ctx *sctx,</div><div class='ctx'> 	nce = name_cache_search(sctx, ino, gen);</div><div class='ctx'> 	if (nce) {</div><div class='ctx'> 		if (ino &lt; sctx-&gt;send_progress &amp;&amp; nce-&gt;need_later_update) {</div><div class='del'>-			name_cache_delete(sctx, nce);</div><div class='del'>-			kfree(nce);</div><div class='add'>+			btrfs_lru_cache_remove(&amp;sctx-&gt;name_cache, &amp;nce-&gt;entry);</div><div class='ctx'> 			nce = NULL;</div><div class='ctx'> 		} else {</div><div class='del'>-			/*</div><div class='del'>-			 * Removes the entry from the list and adds it back to</div><div class='del'>-			 * the end.  This marks the entry as recently used so</div><div class='del'>-			 * that name_cache_clean_unused does not remove it.</div><div class='del'>-			 */</div><div class='del'>-			list_move_tail(&amp;nce-&gt;list, &amp;sctx-&gt;name_cache_list);</div><div class='del'>-</div><div class='ctx'> 			*parent_ino = nce-&gt;parent_ino;</div><div class='ctx'> 			*parent_gen = nce-&gt;parent_gen;</div><div class='ctx'> 			ret = fs_path_add(dest, nce-&gt;name, nce-&gt;name_len);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='del'>-				goto out;</div><div class='del'>-			ret = nce-&gt;ret;</div><div class='del'>-			goto out;</div><div class='add'>+				return ret;</div><div class='add'>+			return nce-&gt;ret;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If the inode is not existent yet, add the orphan name and return 1.</div><div class='ctx'> 	 * This should only happen for the parent dir that we determine in</div><div class='del'>-	 * __record_new_ref</div><div class='add'>+	 * record_new_ref_if_needed().</div><div class='ctx'> 	 */</div><div class='del'>-	ret = is_inode_existent(sctx, ino, gen);</div><div class='add'>+	ret = is_inode_existent(sctx, ino, gen, NULL, NULL);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!ret) {</div><div class='ctx'> 		ret = gen_unique_name(sctx, ino, gen, dest);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 		ret = 1;</div><div class='ctx'> 		goto out_cache;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2187,21 +2298,21 @@ static int __get_cur_name_and_parent(struct send_ctx *sctx,</div><div class='ctx'> 		ret = get_first_ref(sctx-&gt;parent_root, ino,</div><div class='ctx'> 				    parent_ino, parent_gen, dest);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Check if the ref was overwritten by an inode's ref that was processed</div><div class='ctx'> 	 * earlier. If yes, treat as orphan and return 1.</div><div class='ctx'> 	 */</div><div class='ctx'> 	ret = did_overwrite_ref(sctx, *parent_ino, *parent_gen, ino, gen,</div><div class='del'>-			dest-&gt;start, dest-&gt;end - dest-&gt;start);</div><div class='add'>+				dest-&gt;start, fs_path_len(dest));</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		fs_path_reset(dest);</div><div class='ctx'> 		ret = gen_unique_name(sctx, ino, gen, dest);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 		ret = 1;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -2209,31 +2320,29 @@ out_cache:</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Store the result of the lookup in the name cache.</div><div class='ctx'> 	 */</div><div class='del'>-	nce = kmalloc(sizeof(*nce) + fs_path_len(dest) + 1, GFP_KERNEL);</div><div class='del'>-	if (!nce) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	nce = kmalloc(sizeof(*nce) + fs_path_len(dest), GFP_KERNEL);</div><div class='add'>+	if (!nce)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	nce-&gt;ino = ino;</div><div class='del'>-	nce-&gt;gen = gen;</div><div class='add'>+	nce-&gt;entry.key = ino;</div><div class='add'>+	nce-&gt;entry.gen = gen;</div><div class='ctx'> 	nce-&gt;parent_ino = *parent_ino;</div><div class='ctx'> 	nce-&gt;parent_gen = *parent_gen;</div><div class='ctx'> 	nce-&gt;name_len = fs_path_len(dest);</div><div class='ctx'> 	nce-&gt;ret = ret;</div><div class='del'>-	strcpy(nce-&gt;name, dest-&gt;start);</div><div class='add'>+	memcpy(nce-&gt;name, dest-&gt;start, nce-&gt;name_len);</div><div class='ctx'> </div><div class='ctx'> 	if (ino &lt; sctx-&gt;send_progress)</div><div class='ctx'> 		nce-&gt;need_later_update = 0;</div><div class='ctx'> 	else</div><div class='ctx'> 		nce-&gt;need_later_update = 1;</div><div class='ctx'> </div><div class='del'>-	nce_ret = name_cache_insert(sctx, nce);</div><div class='del'>-	if (nce_ret &lt; 0)</div><div class='del'>-		ret = nce_ret;</div><div class='del'>-	name_cache_clean_unused(sctx);</div><div class='add'>+	nce_ret = btrfs_lru_cache_store(&amp;sctx-&gt;name_cache, &amp;nce-&gt;entry, GFP_KERNEL);</div><div class='add'>+	if (nce_ret &lt; 0) {</div><div class='add'>+		kfree(nce);</div><div class='add'>+		return nce_ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2270,6 +2379,14 @@ static int get_cur_path(struct send_ctx *sctx, u64 ino, u64 gen,</div><div class='ctx'> 	u64 parent_inode = 0;</div><div class='ctx'> 	u64 parent_gen = 0;</div><div class='ctx'> 	int stop = 0;</div><div class='add'>+	const bool is_cur_inode = (ino == sctx-&gt;cur_ino &amp;&amp; gen == sctx-&gt;cur_inode_gen);</div><div class='add'>+</div><div class='add'>+	if (is_cur_inode &amp;&amp; fs_path_len(&amp;sctx-&gt;cur_inode_path) &gt; 0) {</div><div class='add'>+		if (dest != &amp;sctx-&gt;cur_inode_path)</div><div class='add'>+			return fs_path_copy(dest, &amp;sctx-&gt;cur_inode_path);</div><div class='add'>+</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	name = fs_path_alloc();</div><div class='ctx'> 	if (!name) {</div><div class='hunk'>@@ -2321,8 +2438,12 @@ static int get_cur_path(struct send_ctx *sctx, u64 ino, u64 gen,</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	fs_path_free(name);</div><div class='del'>-	if (!ret)</div><div class='add'>+	if (!ret) {</div><div class='ctx'> 		fs_path_unreverse(dest);</div><div class='add'>+		if (is_cur_inode &amp;&amp; dest != &amp;sctx-&gt;cur_inode_path)</div><div class='add'>+			ret = fs_path_copy(&amp;sctx-&gt;cur_inode_path, dest);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2334,11 +2455,11 @@ static int send_subvol_begin(struct send_ctx *sctx)</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct btrfs_root *send_root = sctx-&gt;send_root;</div><div class='ctx'> 	struct btrfs_root *parent_root = sctx-&gt;parent_root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_root_ref *ref;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='del'>-	char *name = NULL;</div><div class='add'>+	char AUTO_KFREE(name);</div><div class='ctx'> 	int namelen;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='hunk'>@@ -2346,30 +2467,25 @@ static int send_subvol_begin(struct send_ctx *sctx)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	name = kmalloc(BTRFS_PATH_NAME_MAX, GFP_KERNEL);</div><div class='del'>-	if (!name) {</div><div class='del'>-		btrfs_free_path(path);</div><div class='add'>+	if (!name)</div><div class='ctx'> 		return -ENOMEM;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	key.objectid = send_root-&gt;root_key.objectid;</div><div class='add'>+	key.objectid = btrfs_root_id(send_root);</div><div class='ctx'> 	key.type = BTRFS_ROOT_BACKREF_KEY;</div><div class='ctx'> 	key.offset = 0;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_search_slot_for_read(send_root-&gt;fs_info-&gt;tree_root,</div><div class='ctx'> 				&amp;key, path, 1, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-	if (ret) {</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+		return ret;</div><div class='add'>+	if (ret)</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	btrfs_item_key_to_cpu(leaf, &amp;key, path-&gt;slots[0]);</div><div class='ctx'> 	if (key.type != BTRFS_ROOT_BACKREF_KEY ||</div><div class='del'>-	    key.objectid != send_root-&gt;root_key.objectid) {</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-		goto out;</div><div class='add'>+	    key.objectid != btrfs_root_id(send_root)) {</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> 	}</div><div class='ctx'> 	ref = btrfs_item_ptr(leaf, path-&gt;slots[0], struct btrfs_root_ref);</div><div class='ctx'> 	namelen = btrfs_root_ref_name_len(leaf, ref);</div><div class='hunk'>@@ -2379,11 +2495,11 @@ static int send_subvol_begin(struct send_ctx *sctx)</div><div class='ctx'> 	if (parent_root) {</div><div class='ctx'> 		ret = begin_cmd(sctx, BTRFS_SEND_C_SNAPSHOT);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		ret = begin_cmd(sctx, BTRFS_SEND_C_SUBVOL);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	TLV_PUT_STRING(sctx, BTRFS_SEND_A_PATH, name, namelen);</div><div class='hunk'>@@ -2411,31 +2527,63 @@ static int send_subvol_begin(struct send_ctx *sctx)</div><div class='ctx'> 	ret = send_cmd(sctx);</div><div class='ctx'> </div><div class='ctx'> tlv_put_failure:</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	kfree(name);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static struct fs_path *get_cur_inode_path(struct send_ctx *sctx)</div><div class='add'>+{</div><div class='add'>+	if (fs_path_len(&amp;sctx-&gt;cur_inode_path) == 0) {</div><div class='add'>+		int ret;</div><div class='add'>+</div><div class='add'>+		ret = get_cur_path(sctx, sctx-&gt;cur_ino, sctx-&gt;cur_inode_gen,</div><div class='add'>+				   &amp;sctx-&gt;cur_inode_path);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ERR_PTR(ret);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return &amp;sctx-&gt;cur_inode_path;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct fs_path *get_path_for_command(struct send_ctx *sctx, u64 ino, u64 gen)</div><div class='add'>+{</div><div class='add'>+	struct fs_path *path;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (ino == sctx-&gt;cur_ino &amp;&amp; gen == sctx-&gt;cur_inode_gen)</div><div class='add'>+		return get_cur_inode_path(sctx);</div><div class='add'>+</div><div class='add'>+	path = fs_path_alloc();</div><div class='add'>+	if (!path)</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+</div><div class='add'>+	ret = get_cur_path(sctx, ino, gen, path);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		fs_path_free(path);</div><div class='add'>+		return ERR_PTR(ret);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return path;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void free_path_for_command(const struct send_ctx *sctx, struct fs_path *path)</div><div class='add'>+{</div><div class='add'>+	if (path != &amp;sctx-&gt;cur_inode_path)</div><div class='add'>+		fs_path_free(path);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int send_truncate(struct send_ctx *sctx, u64 ino, u64 gen, u64 size)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = sctx-&gt;send_root-&gt;fs_info;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	struct fs_path *p;</div><div class='ctx'> </div><div class='del'>-	btrfs_debug(fs_info, "send_truncate %llu size=%llu", ino, size);</div><div class='del'>-</div><div class='del'>-	p = fs_path_alloc();</div><div class='del'>-	if (!p)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	p = get_path_for_command(sctx, ino, gen);</div><div class='add'>+	if (IS_ERR(p))</div><div class='add'>+		return PTR_ERR(p);</div><div class='ctx'> </div><div class='ctx'> 	ret = begin_cmd(sctx, BTRFS_SEND_C_TRUNCATE);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	ret = get_cur_path(sctx, ino, gen, p);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='ctx'> 	TLV_PUT_PATH(sctx, BTRFS_SEND_A_PATH, p);</div><div class='ctx'> 	TLV_PUT_U64(sctx, BTRFS_SEND_A_SIZE, size);</div><div class='ctx'> </div><div class='hunk'>@@ -2443,29 +2591,23 @@ static int send_truncate(struct send_ctx *sctx, u64 ino, u64 gen, u64 size)</div><div class='ctx'> </div><div class='ctx'> tlv_put_failure:</div><div class='ctx'> out:</div><div class='del'>-	fs_path_free(p);</div><div class='add'>+	free_path_for_command(sctx, p);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int send_chmod(struct send_ctx *sctx, u64 ino, u64 gen, u64 mode)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = sctx-&gt;send_root-&gt;fs_info;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	struct fs_path *p;</div><div class='ctx'> </div><div class='del'>-	btrfs_debug(fs_info, "send_chmod %llu mode=%llu", ino, mode);</div><div class='del'>-</div><div class='del'>-	p = fs_path_alloc();</div><div class='del'>-	if (!p)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	p = get_path_for_command(sctx, ino, gen);</div><div class='add'>+	if (IS_ERR(p))</div><div class='add'>+		return PTR_ERR(p);</div><div class='ctx'> </div><div class='ctx'> 	ret = begin_cmd(sctx, BTRFS_SEND_C_CHMOD);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	ret = get_cur_path(sctx, ino, gen, p);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='ctx'> 	TLV_PUT_PATH(sctx, BTRFS_SEND_A_PATH, p);</div><div class='ctx'> 	TLV_PUT_U64(sctx, BTRFS_SEND_A_MODE, mode &amp; 07777);</div><div class='ctx'> </div><div class='hunk'>@@ -2473,30 +2615,50 @@ static int send_chmod(struct send_ctx *sctx, u64 ino, u64 gen, u64 mode)</div><div class='ctx'> </div><div class='ctx'> tlv_put_failure:</div><div class='ctx'> out:</div><div class='del'>-	fs_path_free(p);</div><div class='add'>+	free_path_for_command(sctx, p);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int send_chown(struct send_ctx *sctx, u64 ino, u64 gen, u64 uid, u64 gid)</div><div class='add'>+static int send_fileattr(struct send_ctx *sctx, u64 ino, u64 gen, u64 fileattr)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = sctx-&gt;send_root-&gt;fs_info;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	struct fs_path *p;</div><div class='ctx'> </div><div class='del'>-	btrfs_debug(fs_info, "send_chown %llu uid=%llu, gid=%llu",</div><div class='del'>-		    ino, uid, gid);</div><div class='add'>+	if (sctx-&gt;proto &lt; 2)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	p = fs_path_alloc();</div><div class='del'>-	if (!p)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	p = get_path_for_command(sctx, ino, gen);</div><div class='add'>+	if (IS_ERR(p))</div><div class='add'>+		return PTR_ERR(p);</div><div class='ctx'> </div><div class='del'>-	ret = begin_cmd(sctx, BTRFS_SEND_C_CHOWN);</div><div class='add'>+	ret = begin_cmd(sctx, BTRFS_SEND_C_FILEATTR);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	ret = get_cur_path(sctx, ino, gen, p);</div><div class='add'>+	TLV_PUT_PATH(sctx, BTRFS_SEND_A_PATH, p);</div><div class='add'>+	TLV_PUT_U64(sctx, BTRFS_SEND_A_FILEATTR, fileattr);</div><div class='add'>+</div><div class='add'>+	ret = send_cmd(sctx);</div><div class='add'>+</div><div class='add'>+tlv_put_failure:</div><div class='add'>+out:</div><div class='add'>+	free_path_for_command(sctx, p);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int send_chown(struct send_ctx *sctx, u64 ino, u64 gen, u64 uid, u64 gid)</div><div class='add'>+{</div><div class='add'>+	int ret = 0;</div><div class='add'>+	struct fs_path *p;</div><div class='add'>+</div><div class='add'>+	p = get_path_for_command(sctx, ino, gen);</div><div class='add'>+	if (IS_ERR(p))</div><div class='add'>+		return PTR_ERR(p);</div><div class='add'>+</div><div class='add'>+	ret = begin_cmd(sctx, BTRFS_SEND_C_CHOWN);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='add'>+</div><div class='ctx'> 	TLV_PUT_PATH(sctx, BTRFS_SEND_A_PATH, p);</div><div class='ctx'> 	TLV_PUT_U64(sctx, BTRFS_SEND_A_UID, uid);</div><div class='ctx'> 	TLV_PUT_U64(sctx, BTRFS_SEND_A_GID, gid);</div><div class='hunk'>@@ -2505,26 +2667,23 @@ static int send_chown(struct send_ctx *sctx, u64 ino, u64 gen, u64 uid, u64 gid)</div><div class='ctx'> </div><div class='ctx'> tlv_put_failure:</div><div class='ctx'> out:</div><div class='del'>-	fs_path_free(p);</div><div class='add'>+	free_path_for_command(sctx, p);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int send_utimes(struct send_ctx *sctx, u64 ino, u64 gen)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = sctx-&gt;send_root-&gt;fs_info;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	struct fs_path *p = NULL;</div><div class='ctx'> 	struct btrfs_inode_item *ii;</div><div class='del'>-	struct btrfs_path *path = NULL;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	int slot;</div><div class='ctx'> </div><div class='del'>-	btrfs_debug(fs_info, "send_utimes %llu", ino);</div><div class='del'>-</div><div class='del'>-	p = fs_path_alloc();</div><div class='del'>-	if (!p)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	p = get_path_for_command(sctx, ino, gen);</div><div class='add'>+	if (IS_ERR(p))</div><div class='add'>+		return PTR_ERR(p);</div><div class='ctx'> </div><div class='ctx'> 	path = alloc_path_for_send();</div><div class='ctx'> 	if (!path) {</div><div class='hunk'>@@ -2549,50 +2708,103 @@ static int send_utimes(struct send_ctx *sctx, u64 ino, u64 gen)</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	ret = get_cur_path(sctx, ino, gen, p);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='ctx'> 	TLV_PUT_PATH(sctx, BTRFS_SEND_A_PATH, p);</div><div class='ctx'> 	TLV_PUT_BTRFS_TIMESPEC(sctx, BTRFS_SEND_A_ATIME, eb, &amp;ii-&gt;atime);</div><div class='ctx'> 	TLV_PUT_BTRFS_TIMESPEC(sctx, BTRFS_SEND_A_MTIME, eb, &amp;ii-&gt;mtime);</div><div class='ctx'> 	TLV_PUT_BTRFS_TIMESPEC(sctx, BTRFS_SEND_A_CTIME, eb, &amp;ii-&gt;ctime);</div><div class='del'>-	/* TODO Add otime support when the otime patches get into upstream */</div><div class='add'>+	if (sctx-&gt;proto &gt;= 2)</div><div class='add'>+		TLV_PUT_BTRFS_TIMESPEC(sctx, BTRFS_SEND_A_OTIME, eb, &amp;ii-&gt;otime);</div><div class='ctx'> </div><div class='ctx'> 	ret = send_cmd(sctx);</div><div class='ctx'> </div><div class='ctx'> tlv_put_failure:</div><div class='ctx'> out:</div><div class='del'>-	fs_path_free(p);</div><div class='del'>-	btrfs_free_path(path);</div><div class='add'>+	free_path_for_command(sctx, p);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * If the cache is full, we can't remove entries from it and do a call to</div><div class='add'>+ * send_utimes() for each respective inode, because we might be finishing</div><div class='add'>+ * processing an inode that is a directory and it just got renamed, and existing</div><div class='add'>+ * entries in the cache may refer to inodes that have the directory in their</div><div class='add'>+ * full path - in which case we would generate outdated paths (pre-rename)</div><div class='add'>+ * for the inodes that the cache entries point to. Instead of pruning the</div><div class='add'>+ * cache when inserting, do it after we finish processing each inode at</div><div class='add'>+ * finish_inode_if_needed().</div><div class='add'>+ */</div><div class='add'>+static int cache_dir_utimes(struct send_ctx *sctx, u64 dir, u64 gen)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_lru_cache_entry *entry;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	entry = btrfs_lru_cache_lookup(&amp;sctx-&gt;dir_utimes_cache, dir, gen);</div><div class='add'>+	if (entry != NULL)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/* Caching is optional, don't fail if we can't allocate memory. */</div><div class='add'>+	entry = kmalloc(sizeof(*entry), GFP_KERNEL);</div><div class='add'>+	if (!entry)</div><div class='add'>+		return send_utimes(sctx, dir, gen);</div><div class='add'>+</div><div class='add'>+	entry-&gt;key = dir;</div><div class='add'>+	entry-&gt;gen = gen;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_lru_cache_store(&amp;sctx-&gt;dir_utimes_cache, entry, GFP_KERNEL);</div><div class='add'>+	ASSERT(ret != -EEXIST);</div><div class='add'>+	if (ret) {</div><div class='add'>+		kfree(entry);</div><div class='add'>+		return send_utimes(sctx, dir, gen);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int trim_dir_utimes_cache(struct send_ctx *sctx)</div><div class='add'>+{</div><div class='add'>+	while (sctx-&gt;dir_utimes_cache.size &gt; SEND_MAX_DIR_UTIMES_CACHE_SIZE) {</div><div class='add'>+		struct btrfs_lru_cache_entry *lru;</div><div class='add'>+		int ret;</div><div class='add'>+</div><div class='add'>+		lru = btrfs_lru_cache_lru_entry(&amp;sctx-&gt;dir_utimes_cache);</div><div class='add'>+		ASSERT(lru != NULL);</div><div class='add'>+</div><div class='add'>+		ret = send_utimes(sctx, lru-&gt;key, lru-&gt;gen);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+</div><div class='add'>+		btrfs_lru_cache_remove(&amp;sctx-&gt;dir_utimes_cache, lru);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * Sends a BTRFS_SEND_C_MKXXX or SYMLINK command to user space. We don't have</div><div class='ctx'>  * a valid path yet because we did not process the refs yet. So, the inode</div><div class='ctx'>  * is created as orphan.</div><div class='ctx'>  */</div><div class='ctx'> static int send_create_inode(struct send_ctx *sctx, u64 ino)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = sctx-&gt;send_root-&gt;fs_info;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	struct fs_path *p;</div><div class='ctx'> 	int cmd;</div><div class='add'>+	struct btrfs_inode_info info;</div><div class='ctx'> 	u64 gen;</div><div class='ctx'> 	u64 mode;</div><div class='ctx'> 	u64 rdev;</div><div class='ctx'> </div><div class='del'>-	btrfs_debug(fs_info, "send_create_inode %llu", ino);</div><div class='del'>-</div><div class='ctx'> 	p = fs_path_alloc();</div><div class='ctx'> 	if (!p)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	if (ino != sctx-&gt;cur_ino) {</div><div class='del'>-		ret = get_inode_info(sctx-&gt;send_root, ino, NULL, &amp;gen, &amp;mode,</div><div class='del'>-				     NULL, NULL, &amp;rdev);</div><div class='add'>+		ret = get_inode_info(sctx-&gt;send_root, ino, &amp;info);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='add'>+		gen = info.gen;</div><div class='add'>+		mode = info.mode;</div><div class='add'>+		rdev = info.rdev;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		gen = sctx-&gt;cur_inode_gen;</div><div class='ctx'> 		mode = sctx-&gt;cur_inode_mode;</div><div class='hunk'>@@ -2652,6 +2864,23 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void cache_dir_created(struct send_ctx *sctx, u64 dir)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_lru_cache_entry *entry;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	/* Caching is optional, ignore any failures. */</div><div class='add'>+	entry = kmalloc(sizeof(*entry), GFP_KERNEL);</div><div class='add'>+	if (!entry)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	entry-&gt;key = dir;</div><div class='add'>+	entry-&gt;gen = 0;</div><div class='add'>+	ret = btrfs_lru_cache_store(&amp;sctx-&gt;dir_created_cache, entry, GFP_KERNEL);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		kfree(entry);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * We need some special handling for inodes that get processed before the parent</div><div class='ctx'>  * directory got created. See process_recorded_refs for details.</div><div class='hunk'>@@ -2660,62 +2889,47 @@ out:</div><div class='ctx'> static int did_create_dir(struct send_ctx *sctx, u64 dir)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	struct btrfs_path *path = NULL;</div><div class='add'>+	int iter_ret = 0;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_key found_key;</div><div class='ctx'> 	struct btrfs_key di_key;</div><div class='del'>-	struct extent_buffer *eb;</div><div class='ctx'> 	struct btrfs_dir_item *di;</div><div class='del'>-	int slot;</div><div class='add'>+</div><div class='add'>+	if (btrfs_lru_cache_lookup(&amp;sctx-&gt;dir_created_cache, dir, 0))</div><div class='add'>+		return 1;</div><div class='ctx'> </div><div class='ctx'> 	path = alloc_path_for_send();</div><div class='del'>-	if (!path) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (!path)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = dir;</div><div class='ctx'> 	key.type = BTRFS_DIR_INDEX_KEY;</div><div class='ctx'> 	key.offset = 0;</div><div class='del'>-	ret = btrfs_search_slot(NULL, sctx-&gt;send_root, &amp;key, path, 0, 0);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='ctx'> </div><div class='del'>-	while (1) {</div><div class='del'>-		eb = path-&gt;nodes[0];</div><div class='del'>-		slot = path-&gt;slots[0];</div><div class='del'>-		if (slot &gt;= btrfs_header_nritems(eb)) {</div><div class='del'>-			ret = btrfs_next_leaf(sctx-&gt;send_root, path);</div><div class='del'>-			if (ret &lt; 0) {</div><div class='del'>-				goto out;</div><div class='del'>-			} else if (ret &gt; 0) {</div><div class='del'>-				ret = 0;</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='add'>+	btrfs_for_each_slot(sctx-&gt;send_root, &amp;key, &amp;found_key, path, iter_ret) {</div><div class='add'>+		struct extent_buffer *eb = path-&gt;nodes[0];</div><div class='ctx'> </div><div class='del'>-		btrfs_item_key_to_cpu(eb, &amp;found_key, slot);</div><div class='ctx'> 		if (found_key.objectid != key.objectid ||</div><div class='ctx'> 		    found_key.type != key.type) {</div><div class='ctx'> 			ret = 0;</div><div class='del'>-			goto out;</div><div class='add'>+			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		di = btrfs_item_ptr(eb, slot, struct btrfs_dir_item);</div><div class='add'>+		di = btrfs_item_ptr(eb, path-&gt;slots[0], struct btrfs_dir_item);</div><div class='ctx'> 		btrfs_dir_item_key_to_cpu(eb, di, &amp;di_key);</div><div class='ctx'> </div><div class='ctx'> 		if (di_key.type != BTRFS_ROOT_ITEM_KEY &amp;&amp;</div><div class='ctx'> 		    di_key.objectid &lt; sctx-&gt;send_progress) {</div><div class='ctx'> 			ret = 1;</div><div class='del'>-			goto out;</div><div class='add'>+			cache_dir_created(sctx, dir);</div><div class='add'>+			break;</div><div class='ctx'> 		}</div><div class='del'>-</div><div class='del'>-		path-&gt;slots[0]++;</div><div class='ctx'> 	}</div><div class='add'>+	/* Catch error found during iteration */</div><div class='add'>+	if (iter_ret &lt; 0)</div><div class='add'>+		ret = iter_ret;</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2737,7 +2951,12 @@ static int send_create_inode_if_needed(struct send_ctx *sctx)</div><div class='ctx'> 			return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return send_create_inode(sctx, sctx-&gt;cur_ino);</div><div class='add'>+	ret = send_create_inode(sctx, sctx-&gt;cur_ino);</div><div class='add'>+</div><div class='add'>+	if (ret == 0 &amp;&amp; S_ISDIR(sctx-&gt;cur_inode_mode))</div><div class='add'>+		cache_dir_created(sctx, sctx-&gt;cur_ino);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct recorded_ref {</div><div class='hunk'>@@ -2747,48 +2966,50 @@ struct recorded_ref {</div><div class='ctx'> 	u64 dir;</div><div class='ctx'> 	u64 dir_gen;</div><div class='ctx'> 	int name_len;</div><div class='add'>+	struct rb_node node;</div><div class='add'>+	struct rb_root *root;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static void set_ref_path(struct recorded_ref *ref, struct fs_path *path)</div><div class='add'>+static struct recorded_ref *recorded_ref_alloc(void)</div><div class='ctx'> {</div><div class='del'>-	ref-&gt;full_path = path;</div><div class='del'>-	ref-&gt;name = (char *)kbasename(ref-&gt;full_path-&gt;start);</div><div class='del'>-	ref-&gt;name_len = ref-&gt;full_path-&gt;end - ref-&gt;name;</div><div class='add'>+	struct recorded_ref *ref;</div><div class='add'>+</div><div class='add'>+	ref = kzalloc(sizeof(*ref), GFP_KERNEL);</div><div class='add'>+	if (!ref)</div><div class='add'>+		return NULL;</div><div class='add'>+	RB_CLEAR_NODE(&amp;ref-&gt;node);</div><div class='add'>+	INIT_LIST_HEAD(&amp;ref-&gt;list);</div><div class='add'>+	return ref;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * We need to process new refs before deleted refs, but compare_tree gives us</div><div class='del'>- * everything mixed. So we first record all refs and later process them.</div><div class='del'>- * This function is a helper to record one ref.</div><div class='del'>- */</div><div class='del'>-static int __record_ref(struct list_head *head, u64 dir,</div><div class='del'>-		      u64 dir_gen, struct fs_path *path)</div><div class='add'>+static void recorded_ref_free(struct recorded_ref *ref)</div><div class='ctx'> {</div><div class='del'>-	struct recorded_ref *ref;</div><div class='del'>-</div><div class='del'>-	ref = kmalloc(sizeof(*ref), GFP_KERNEL);</div><div class='ctx'> 	if (!ref)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+		return;</div><div class='add'>+	if (!RB_EMPTY_NODE(&amp;ref-&gt;node))</div><div class='add'>+		rb_erase(&amp;ref-&gt;node, ref-&gt;root);</div><div class='add'>+	list_del(&amp;ref-&gt;list);</div><div class='add'>+	fs_path_free(ref-&gt;full_path);</div><div class='add'>+	kfree(ref);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	ref-&gt;dir = dir;</div><div class='del'>-	ref-&gt;dir_gen = dir_gen;</div><div class='del'>-	set_ref_path(ref, path);</div><div class='del'>-	list_add_tail(&amp;ref-&gt;list, head);</div><div class='del'>-	return 0;</div><div class='add'>+static void set_ref_path(struct recorded_ref *ref, struct fs_path *path)</div><div class='add'>+{</div><div class='add'>+	ref-&gt;full_path = path;</div><div class='add'>+	ref-&gt;name = (char *)kbasename(ref-&gt;full_path-&gt;start);</div><div class='add'>+	ref-&gt;name_len = ref-&gt;full_path-&gt;end - ref-&gt;name;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int dup_ref(struct recorded_ref *ref, struct list_head *list)</div><div class='ctx'> {</div><div class='ctx'> 	struct recorded_ref *new;</div><div class='ctx'> </div><div class='del'>-	new = kmalloc(sizeof(*ref), GFP_KERNEL);</div><div class='add'>+	new = recorded_ref_alloc();</div><div class='ctx'> 	if (!new)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	new-&gt;dir = ref-&gt;dir;</div><div class='ctx'> 	new-&gt;dir_gen = ref-&gt;dir_gen;</div><div class='del'>-	new-&gt;full_path = NULL;</div><div class='del'>-	INIT_LIST_HEAD(&amp;new-&gt;list);</div><div class='ctx'> 	list_add_tail(&amp;new-&gt;list, list);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -2798,10 +3019,8 @@ static void __free_recorded_refs(struct list_head *head)</div><div class='ctx'> 	struct recorded_ref *cur;</div><div class='ctx'> </div><div class='ctx'> 	while (!list_empty(head)) {</div><div class='del'>-		cur = list_entry(head-&gt;next, struct recorded_ref, list);</div><div class='del'>-		fs_path_free(cur-&gt;full_path);</div><div class='del'>-		list_del(&amp;cur-&gt;list);</div><div class='del'>-		kfree(cur);</div><div class='add'>+		cur = list_first_entry(head, struct recorded_ref, list);</div><div class='add'>+		recorded_ref_free(cur);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2831,6 +3050,11 @@ static int orphanize_inode(struct send_ctx *sctx, u64 ino, u64 gen,</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	ret = send_rename(sctx, path, orphan);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	if (ino == sctx-&gt;cur_ino &amp;&amp; gen == sctx-&gt;cur_inode_gen)</div><div class='add'>+		ret = fs_path_copy(&amp;sctx-&gt;cur_inode_path, orphan);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	fs_path_free(orphan);</div><div class='hunk'>@@ -2865,6 +3089,7 @@ static struct orphan_dir_info *add_orphan_dir_info(struct send_ctx *sctx,</div><div class='ctx'> 	odi-&gt;ino = dir_ino;</div><div class='ctx'> 	odi-&gt;gen = dir_gen;</div><div class='ctx'> 	odi-&gt;last_dir_index_offset = 0;</div><div class='add'>+	odi-&gt;dir_high_seq_ino = 0;</div><div class='ctx'> </div><div class='ctx'> 	rb_link_node(&amp;odi-&gt;node, parent, p);</div><div class='ctx'> 	rb_insert_color(&amp;odi-&gt;node, &amp;sctx-&gt;orphan_dirs);</div><div class='hunk'>@@ -2914,10 +3139,10 @@ static void free_orphan_dir_info(struct send_ctx *sctx,</div><div class='ctx'>  * We check this by iterating all dir items and checking if the inode behind</div><div class='ctx'>  * the dir item was already processed.</div><div class='ctx'>  */</div><div class='del'>-static int can_rmdir(struct send_ctx *sctx, u64 dir, u64 dir_gen,</div><div class='del'>-		     u64 send_progress)</div><div class='add'>+static int can_rmdir(struct send_ctx *sctx, u64 dir, u64 dir_gen)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='add'>+	int iter_ret = 0;</div><div class='ctx'> 	struct btrfs_root *root = sctx-&gt;parent_root;</div><div class='ctx'> 	struct btrfs_path *path;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='hunk'>@@ -2925,6 +3150,8 @@ static int can_rmdir(struct send_ctx *sctx, u64 dir, u64 dir_gen,</div><div class='ctx'> 	struct btrfs_key loc;</div><div class='ctx'> 	struct btrfs_dir_item *di;</div><div class='ctx'> 	struct orphan_dir_info *odi = NULL;</div><div class='add'>+	u64 dir_high_seq_ino = 0;</div><div class='add'>+	u64 last_dir_index_offset = 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Don't try to rmdir the top/root subvolume dir.</div><div class='hunk'>@@ -2932,35 +3159,66 @@ static int can_rmdir(struct send_ctx *sctx, u64 dir, u64 dir_gen,</div><div class='ctx'> 	if (dir == BTRFS_FIRST_FREE_OBJECTID)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='add'>+	odi = get_orphan_dir_info(sctx, dir, dir_gen);</div><div class='add'>+	if (odi &amp;&amp; sctx-&gt;cur_ino &lt; odi-&gt;dir_high_seq_ino)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='ctx'> 	path = alloc_path_for_send();</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	key.objectid = dir;</div><div class='del'>-	key.type = BTRFS_DIR_INDEX_KEY;</div><div class='del'>-	key.offset = 0;</div><div class='add'>+	if (!odi) {</div><div class='add'>+		/*</div><div class='add'>+		 * Find the inode number associated with the last dir index</div><div class='add'>+		 * entry. This is very likely the inode with the highest number</div><div class='add'>+		 * of all inodes that have an entry in the directory. We can</div><div class='add'>+		 * then use it to avoid future calls to can_rmdir(), when</div><div class='add'>+		 * processing inodes with a lower number, from having to search</div><div class='add'>+		 * the parent root b+tree for dir index keys.</div><div class='add'>+		 */</div><div class='add'>+		key.objectid = dir;</div><div class='add'>+		key.type = BTRFS_DIR_INDEX_KEY;</div><div class='add'>+		key.offset = (u64)-1;</div><div class='ctx'> </div><div class='del'>-	odi = get_orphan_dir_info(sctx, dir, dir_gen);</div><div class='del'>-	if (odi)</div><div class='del'>-		key.offset = odi-&gt;last_dir_index_offset;</div><div class='add'>+		ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			goto out;</div><div class='add'>+		} else if (ret &gt; 0) {</div><div class='add'>+			/* Can't happen, the root is never empty. */</div><div class='add'>+			ASSERT(path-&gt;slots[0] &gt; 0);</div><div class='add'>+			if (WARN_ON(path-&gt;slots[0] == 0)) {</div><div class='add'>+				ret = -EUCLEAN;</div><div class='add'>+				goto out;</div><div class='add'>+			}</div><div class='add'>+			path-&gt;slots[0]--;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, path-&gt;slots[0]);</div><div class='add'>+		if (key.objectid != dir || key.type != BTRFS_DIR_INDEX_KEY) {</div><div class='add'>+			/* No index keys, dir can be removed. */</div><div class='add'>+			ret = 1;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	while (1) {</div><div class='add'>+		di = btrfs_item_ptr(path-&gt;nodes[0], path-&gt;slots[0],</div><div class='add'>+				    struct btrfs_dir_item);</div><div class='add'>+		btrfs_dir_item_key_to_cpu(path-&gt;nodes[0], di, &amp;loc);</div><div class='add'>+		dir_high_seq_ino = loc.objectid;</div><div class='add'>+		if (sctx-&gt;cur_ino &lt; dir_high_seq_ino) {</div><div class='add'>+			ret = 0;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		btrfs_release_path(path);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	key.objectid = dir;</div><div class='add'>+	key.type = BTRFS_DIR_INDEX_KEY;</div><div class='add'>+	key.offset = (odi ? odi-&gt;last_dir_index_offset : 0);</div><div class='add'>+</div><div class='add'>+	btrfs_for_each_slot(root, &amp;key, &amp;found_key, path, iter_ret) {</div><div class='ctx'> 		struct waiting_dir_move *dm;</div><div class='ctx'> </div><div class='del'>-		if (path-&gt;slots[0] &gt;= btrfs_header_nritems(path-&gt;nodes[0])) {</div><div class='del'>-			ret = btrfs_next_leaf(root, path);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto out;</div><div class='del'>-			else if (ret &gt; 0)</div><div class='del'>-				break;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-		btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;found_key,</div><div class='del'>-				      path-&gt;slots[0]);</div><div class='ctx'> 		if (found_key.objectid != key.objectid ||</div><div class='ctx'> 		    found_key.type != key.type)</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -2969,34 +3227,25 @@ static int can_rmdir(struct send_ctx *sctx, u64 dir, u64 dir_gen,</div><div class='ctx'> 				struct btrfs_dir_item);</div><div class='ctx'> 		btrfs_dir_item_key_to_cpu(path-&gt;nodes[0], di, &amp;loc);</div><div class='ctx'> </div><div class='add'>+		dir_high_seq_ino = max(dir_high_seq_ino, loc.objectid);</div><div class='add'>+		last_dir_index_offset = found_key.offset;</div><div class='add'>+</div><div class='ctx'> 		dm = get_waiting_dir_move(sctx, loc.objectid);</div><div class='ctx'> 		if (dm) {</div><div class='del'>-			odi = add_orphan_dir_info(sctx, dir, dir_gen);</div><div class='del'>-			if (IS_ERR(odi)) {</div><div class='del'>-				ret = PTR_ERR(odi);</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-			odi-&gt;gen = dir_gen;</div><div class='del'>-			odi-&gt;last_dir_index_offset = found_key.offset;</div><div class='ctx'> 			dm-&gt;rmdir_ino = dir;</div><div class='ctx'> 			dm-&gt;rmdir_gen = dir_gen;</div><div class='ctx'> 			ret = 0;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (loc.objectid &gt; send_progress) {</div><div class='del'>-			odi = add_orphan_dir_info(sctx, dir, dir_gen);</div><div class='del'>-			if (IS_ERR(odi)) {</div><div class='del'>-				ret = PTR_ERR(odi);</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-			odi-&gt;gen = dir_gen;</div><div class='del'>-			odi-&gt;last_dir_index_offset = found_key.offset;</div><div class='add'>+		if (loc.objectid &gt; sctx-&gt;cur_ino) {</div><div class='ctx'> 			ret = 0;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='del'>-</div><div class='del'>-		path-&gt;slots[0]++;</div><div class='add'>+	}</div><div class='add'>+	if (iter_ret &lt; 0) {</div><div class='add'>+		ret = iter_ret;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	free_orphan_dir_info(sctx, odi);</div><div class='ctx'> </div><div class='hunk'>@@ -3004,7 +3253,22 @@ static int can_rmdir(struct send_ctx *sctx, u64 dir, u64 dir_gen,</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	if (!odi) {</div><div class='add'>+		odi = add_orphan_dir_info(sctx, dir, dir_gen);</div><div class='add'>+		if (IS_ERR(odi))</div><div class='add'>+			return PTR_ERR(odi);</div><div class='add'>+</div><div class='add'>+		odi-&gt;gen = dir_gen;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	odi-&gt;last_dir_index_offset = last_dir_index_offset;</div><div class='add'>+	odi-&gt;dir_high_seq_ino = max(odi-&gt;dir_high_seq_ino, dir_high_seq_ino);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int is_waiting_for_move(struct send_ctx *sctx, u64 ino)</div><div class='hunk'>@@ -3289,7 +3553,7 @@ static int apply_dir_move(struct send_ctx *sctx, struct pending_dir_move *pm)</div><div class='ctx'> 		}</div><div class='ctx'> 		gen = odi-&gt;gen;</div><div class='ctx'> </div><div class='del'>-		ret = can_rmdir(sctx, rmdir_ino, gen, sctx-&gt;cur_ino);</div><div class='add'>+		ret = can_rmdir(sctx, rmdir_ino, gen);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		if (!ret)</div><div class='hunk'>@@ -3309,7 +3573,7 @@ static int apply_dir_move(struct send_ctx *sctx, struct pending_dir_move *pm)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> finish:</div><div class='del'>-	ret = send_utimes(sctx, pm-&gt;ino, pm-&gt;gen);</div><div class='add'>+	ret = cache_dir_utimes(sctx, pm-&gt;ino, pm-&gt;gen);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -3321,8 +3585,7 @@ finish:</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * The parent inode might have been deleted in the send snapshot</div><div class='ctx'> 		 */</div><div class='del'>-		ret = get_inode_info(sctx-&gt;send_root, cur-&gt;dir, NULL,</div><div class='del'>-				     NULL, NULL, NULL, NULL, NULL);</div><div class='add'>+		ret = get_inode_info(sctx-&gt;send_root, cur-&gt;dir, NULL);</div><div class='ctx'> 		if (ret == -ENOENT) {</div><div class='ctx'> 			ret = 0;</div><div class='ctx'> 			continue;</div><div class='hunk'>@@ -3330,7 +3593,7 @@ finish:</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='del'>-		ret = send_utimes(sctx, cur-&gt;dir, cur-&gt;dir_gen);</div><div class='add'>+		ret = cache_dir_utimes(sctx, cur-&gt;dir, cur-&gt;dir_gen);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3375,7 +3638,7 @@ static void tail_append_pending_moves(struct send_ctx *sctx,</div><div class='ctx'> static int apply_children_dir_moves(struct send_ctx *sctx)</div><div class='ctx'> {</div><div class='ctx'> 	struct pending_dir_move *pm;</div><div class='del'>-	struct list_head stack;</div><div class='add'>+	LIST_HEAD(stack);</div><div class='ctx'> 	u64 parent_ino = sctx-&gt;cur_ino;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -3383,7 +3646,6 @@ static int apply_children_dir_moves(struct send_ctx *sctx)</div><div class='ctx'> 	if (!pm)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	INIT_LIST_HEAD(&amp;stack);</div><div class='ctx'> 	tail_append_pending_moves(sctx, pm, &amp;stack);</div><div class='ctx'> </div><div class='ctx'> 	while (!list_empty(&amp;stack)) {</div><div class='hunk'>@@ -3447,8 +3709,7 @@ static int wait_for_dest_dir_move(struct send_ctx *sctx,</div><div class='ctx'> 				  struct recorded_ref *parent_ref,</div><div class='ctx'> 				  const bool is_orphan)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = sctx-&gt;parent_root-&gt;fs_info;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_key di_key;</div><div class='ctx'> 	struct btrfs_dir_item *di;</div><div class='hunk'>@@ -3469,19 +3730,15 @@ static int wait_for_dest_dir_move(struct send_ctx *sctx,</div><div class='ctx'> 	key.offset = btrfs_name_hash(parent_ref-&gt;name, parent_ref-&gt;name_len);</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_search_slot(NULL, sctx-&gt;parent_root, &amp;key, path, 0, 0);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		goto out;</div><div class='del'>-	} else if (ret &gt; 0) {</div><div class='del'>-		ret = 0;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	di = btrfs_match_dir_item_name(fs_info, path, parent_ref-&gt;name,</div><div class='add'>+	di = btrfs_match_dir_item_name(path, parent_ref-&gt;name,</div><div class='ctx'> 				       parent_ref-&gt;name_len);</div><div class='del'>-	if (!di) {</div><div class='del'>-		ret = 0;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (!di)</div><div class='add'>+		return 0;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * di_key.objectid has the number of the inode that has a dentry in the</div><div class='ctx'> 	 * parent directory with the same name that sctx-&gt;cur_ino is being</div><div class='hunk'>@@ -3491,28 +3748,22 @@ static int wait_for_dest_dir_move(struct send_ctx *sctx,</div><div class='ctx'> 	 * that it happens after that other inode is renamed.</div><div class='ctx'> 	 */</div><div class='ctx'> 	btrfs_dir_item_key_to_cpu(path-&gt;nodes[0], di, &amp;di_key);</div><div class='del'>-	if (di_key.type != BTRFS_INODE_ITEM_KEY) {</div><div class='del'>-		ret = 0;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (di_key.type != BTRFS_INODE_ITEM_KEY)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	ret = get_inode_info(sctx-&gt;parent_root, di_key.objectid, NULL,</div><div class='del'>-			     &amp;left_gen, NULL, NULL, NULL, NULL);</div><div class='add'>+	ret = get_inode_gen(sctx-&gt;parent_root, di_key.objectid, &amp;left_gen);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-	ret = get_inode_info(sctx-&gt;send_root, di_key.objectid, NULL,</div><div class='del'>-			     &amp;right_gen, NULL, NULL, NULL, NULL);</div><div class='add'>+		return ret;</div><div class='add'>+	ret = get_inode_gen(sctx-&gt;send_root, di_key.objectid, &amp;right_gen);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='ctx'> 		if (ret == -ENOENT)</div><div class='ctx'> 			ret = 0;</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Different inode, no need to delay the rename of sctx-&gt;cur_ino */</div><div class='del'>-	if (right_gen != left_gen) {</div><div class='del'>-		ret = 0;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (right_gen != left_gen)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> 	wdm = get_waiting_dir_move(sctx, di_key.objectid);</div><div class='ctx'> 	if (wdm &amp;&amp; !wdm-&gt;orphanized) {</div><div class='hunk'>@@ -3526,8 +3777,6 @@ static int wait_for_dest_dir_move(struct send_ctx *sctx,</div><div class='ctx'> 		if (!ret)</div><div class='ctx'> 			ret = 1;</div><div class='ctx'> 	}</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3564,7 +3813,7 @@ static int check_ino_in_path(struct btrfs_root *root,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Check if ino ino1 is an ancestor of inode ino2 in the given root for any</div><div class='add'>+ * Check if inode ino1 is an ancestor of inode ino2 in the given root for any</div><div class='ctx'>  * possible path (in case ino2 is not a directory and has multiple hard links).</div><div class='ctx'>  * Return 1 if true, 0 if false and &lt; 0 on error.</div><div class='ctx'>  */</div><div class='hunk'>@@ -3576,7 +3825,8 @@ static int is_ancestor(struct btrfs_root *root,</div><div class='ctx'> {</div><div class='ctx'> 	bool free_fs_path = false;</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	struct btrfs_path *path = NULL;</div><div class='add'>+	int iter_ret = 0;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> </div><div class='ctx'> 	if (!fs_path) {</div><div class='hunk'>@@ -3596,33 +3846,19 @@ static int is_ancestor(struct btrfs_root *root,</div><div class='ctx'> 	key.type = BTRFS_INODE_REF_KEY;</div><div class='ctx'> 	key.offset = 0;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	while (true) {</div><div class='add'>+	btrfs_for_each_slot(root, &amp;key, &amp;key, path, iter_ret) {</div><div class='ctx'> 		struct extent_buffer *leaf = path-&gt;nodes[0];</div><div class='ctx'> 		int slot = path-&gt;slots[0];</div><div class='ctx'> 		u32 cur_offset = 0;</div><div class='ctx'> 		u32 item_size;</div><div class='ctx'> </div><div class='del'>-		if (slot &gt;= btrfs_header_nritems(leaf)) {</div><div class='del'>-			ret = btrfs_next_leaf(root, path);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto out;</div><div class='del'>-			if (ret &gt; 0)</div><div class='del'>-				break;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		btrfs_item_key_to_cpu(leaf, &amp;key, slot);</div><div class='ctx'> 		if (key.objectid != ino2)</div><div class='ctx'> 			break;</div><div class='ctx'> 		if (key.type != BTRFS_INODE_REF_KEY &amp;&amp;</div><div class='ctx'> 		    key.type != BTRFS_INODE_EXTREF_KEY)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		item_size = btrfs_item_size_nr(leaf, slot);</div><div class='add'>+		item_size = btrfs_item_size(leaf, slot);</div><div class='ctx'> 		while (cur_offset &lt; item_size) {</div><div class='ctx'> 			u64 parent;</div><div class='ctx'> 			u64 parent_gen;</div><div class='hunk'>@@ -3644,8 +3880,7 @@ static int is_ancestor(struct btrfs_root *root,</div><div class='ctx'> 				cur_offset = item_size;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			ret = get_inode_info(root, parent, NULL, &amp;parent_gen,</div><div class='del'>-					     NULL, NULL, NULL, NULL);</div><div class='add'>+			ret = get_inode_gen(root, parent, &amp;parent_gen);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			ret = check_ino_in_path(root, ino1, ino1_gen,</div><div class='hunk'>@@ -3653,11 +3888,12 @@ static int is_ancestor(struct btrfs_root *root,</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				goto out;</div><div class='ctx'> 		}</div><div class='del'>-		path-&gt;slots[0]++;</div><div class='ctx'> 	}</div><div class='ctx'> 	ret = 0;</div><div class='del'>- out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='add'>+	if (iter_ret &lt; 0)</div><div class='add'>+		ret = iter_ret;</div><div class='add'>+</div><div class='add'>+out:</div><div class='ctx'> 	if (free_fs_path)</div><div class='ctx'> 		fs_path_free(fs_path);</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -3733,9 +3969,7 @@ static int wait_for_parent_move(struct send_ctx *sctx,</div><div class='ctx'> 		     memcmp(path_before-&gt;start, path_after-&gt;start, len1))) {</div><div class='ctx'> 			u64 parent_ino_gen;</div><div class='ctx'> </div><div class='del'>-			ret = get_inode_info(sctx-&gt;parent_root, ino, NULL,</div><div class='del'>-					     &amp;parent_ino_gen, NULL, NULL, NULL,</div><div class='del'>-					     NULL);</div><div class='add'>+			ret = get_inode_gen(sctx-&gt;parent_root, ino, &amp;parent_ino_gen);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			if (ino_gen == parent_ino_gen) {</div><div class='hunk'>@@ -3839,7 +4073,7 @@ static int update_ref_path(struct send_ctx *sctx, struct recorded_ref *ref)</div><div class='ctx'>  */</div><div class='ctx'> static int refresh_ref_path(struct send_ctx *sctx, struct recorded_ref *ref)</div><div class='ctx'> {</div><div class='del'>-	char *name;</div><div class='add'>+	char AUTO_KFREE(name);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	name = kmemdup(ref-&gt;name, ref-&gt;name_len, GFP_KERNEL);</div><div class='hunk'>@@ -3849,17 +4083,75 @@ static int refresh_ref_path(struct send_ctx *sctx, struct recorded_ref *ref)</div><div class='ctx'> 	fs_path_reset(ref-&gt;full_path);</div><div class='ctx'> 	ret = get_cur_path(sctx, ref-&gt;dir, ref-&gt;dir_gen, ref-&gt;full_path);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	ret = fs_path_add(ref-&gt;full_path, name, ref-&gt;name_len);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	/* Update the reference's base name pointer. */</div><div class='ctx'> 	set_ref_path(ref, ref-&gt;full_path);</div><div class='del'>-out:</div><div class='del'>-	kfree(name);</div><div class='del'>-	return ret;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int rbtree_check_dir_ref_comp(const void *k, const struct rb_node *node)</div><div class='add'>+{</div><div class='add'>+	const struct recorded_ref *data = k;</div><div class='add'>+	const struct recorded_ref *ref = rb_entry(node, struct recorded_ref, node);</div><div class='add'>+</div><div class='add'>+	if (data-&gt;dir &gt; ref-&gt;dir)</div><div class='add'>+		return 1;</div><div class='add'>+	if (data-&gt;dir &lt; ref-&gt;dir)</div><div class='add'>+		return -1;</div><div class='add'>+	if (data-&gt;dir_gen &gt; ref-&gt;dir_gen)</div><div class='add'>+		return 1;</div><div class='add'>+	if (data-&gt;dir_gen &lt; ref-&gt;dir_gen)</div><div class='add'>+		return -1;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool rbtree_check_dir_ref_less(struct rb_node *node, const struct rb_node *parent)</div><div class='add'>+{</div><div class='add'>+	const struct recorded_ref *entry = rb_entry(node, struct recorded_ref, node);</div><div class='add'>+</div><div class='add'>+	return rbtree_check_dir_ref_comp(entry, parent) &lt; 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int record_check_dir_ref_in_tree(struct rb_root *root,</div><div class='add'>+			struct recorded_ref *ref, struct list_head *list)</div><div class='add'>+{</div><div class='add'>+	struct recorded_ref *tmp_ref;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (rb_find(ref, root, rbtree_check_dir_ref_comp))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	ret = dup_ref(ref, list);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	tmp_ref = list_last_entry(list, struct recorded_ref, list);</div><div class='add'>+	rb_add(&amp;tmp_ref-&gt;node, root, rbtree_check_dir_ref_less);</div><div class='add'>+	tmp_ref-&gt;root = root;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int rename_current_inode(struct send_ctx *sctx,</div><div class='add'>+				struct fs_path *current_path,</div><div class='add'>+				struct fs_path *new_path)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = send_rename(sctx, current_path, new_path);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	ret = fs_path_copy(&amp;sctx-&gt;cur_inode_path, new_path);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	return fs_path_copy(current_path, new_path);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -3871,26 +4163,29 @@ static int process_recorded_refs(struct send_ctx *sctx, int *pending_move)</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	struct recorded_ref *cur;</div><div class='ctx'> 	struct recorded_ref *cur2;</div><div class='del'>-	struct list_head check_dirs;</div><div class='add'>+	LIST_HEAD(check_dirs);</div><div class='add'>+	struct rb_root rbtree_check_dirs = RB_ROOT;</div><div class='ctx'> 	struct fs_path *valid_path = NULL;</div><div class='ctx'> 	u64 ow_inode = 0;</div><div class='ctx'> 	u64 ow_gen;</div><div class='ctx'> 	u64 ow_mode;</div><div class='del'>-	int did_overwrite = 0;</div><div class='del'>-	int is_orphan = 0;</div><div class='del'>-	u64 last_dir_ino_rm = 0;</div><div class='add'>+	bool did_overwrite = false;</div><div class='add'>+	bool is_orphan = false;</div><div class='ctx'> 	bool can_rename = true;</div><div class='ctx'> 	bool orphanized_dir = false;</div><div class='ctx'> 	bool orphanized_ancestor = false;</div><div class='ctx'> </div><div class='del'>-	btrfs_debug(fs_info, "process_recorded_refs %llu", sctx-&gt;cur_ino);</div><div class='del'>-</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * This should never happen as the root dir always has the same ref</div><div class='ctx'> 	 * which is always '..'</div><div class='ctx'> 	 */</div><div class='del'>-	BUG_ON(sctx-&gt;cur_ino &lt;= BTRFS_FIRST_FREE_OBJECTID);</div><div class='del'>-	INIT_LIST_HEAD(&amp;check_dirs);</div><div class='add'>+	if (unlikely(sctx-&gt;cur_ino &lt;= BTRFS_FIRST_FREE_OBJECTID)) {</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+			  "send: unexpected inode %llu in process_recorded_refs()",</div><div class='add'>+			  sctx-&gt;cur_ino);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	valid_path = fs_path_alloc();</div><div class='ctx'> 	if (!valid_path) {</div><div class='hunk'>@@ -3915,14 +4210,14 @@ static int process_recorded_refs(struct send_ctx *sctx, int *pending_move)</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		if (ret)</div><div class='del'>-			did_overwrite = 1;</div><div class='add'>+			did_overwrite = true;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (sctx-&gt;cur_inode_new || did_overwrite) {</div><div class='ctx'> 		ret = gen_unique_name(sctx, sctx-&gt;cur_ino,</div><div class='ctx'> 				sctx-&gt;cur_inode_gen, valid_path);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='del'>-		is_orphan = 1;</div><div class='add'>+		is_orphan = true;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		ret = get_cur_path(sctx, sctx-&gt;cur_ino, sctx-&gt;cur_inode_gen,</div><div class='ctx'> 				valid_path);</div><div class='hunk'>@@ -3969,7 +4264,7 @@ static int process_recorded_refs(struct send_ctx *sctx, int *pending_move)</div><div class='ctx'> 	 * "testdir_2".</div><div class='ctx'> 	 */</div><div class='ctx'> 	list_for_each_entry(cur, &amp;sctx-&gt;new_refs, list) {</div><div class='del'>-		ret = get_cur_inode_state(sctx, cur-&gt;dir, cur-&gt;dir_gen);</div><div class='add'>+		ret = get_cur_inode_state(sctx, cur-&gt;dir, cur-&gt;dir_gen, NULL, NULL);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		if (ret == inode_state_will_create)</div><div class='hunk'>@@ -4015,12 +4310,9 @@ static int process_recorded_refs(struct send_ctx *sctx, int *pending_move)</div><div class='ctx'> 				 * the source path when performing its rename</div><div class='ctx'> 				 * operation.</div><div class='ctx'> 				 */</div><div class='del'>-				if (is_waiting_for_move(sctx, ow_inode)) {</div><div class='del'>-					wdm = get_waiting_dir_move(sctx,</div><div class='del'>-								   ow_inode);</div><div class='del'>-					ASSERT(wdm);</div><div class='add'>+				wdm = get_waiting_dir_move(sctx, ow_inode);</div><div class='add'>+				if (wdm)</div><div class='ctx'> 					wdm-&gt;orphanized = true;</div><div class='del'>-				}</div><div class='ctx'> </div><div class='ctx'> 				/*</div><div class='ctx'> 				 * Make sure we clear our orphanized inode's</div><div class='hunk'>@@ -4033,10 +4325,9 @@ static int process_recorded_refs(struct send_ctx *sctx, int *pending_move)</div><div class='ctx'> 				 * and get instead the orphan name.</div><div class='ctx'> 				 */</div><div class='ctx'> 				nce = name_cache_search(sctx, ow_inode, ow_gen);</div><div class='del'>-				if (nce) {</div><div class='del'>-					name_cache_delete(sctx, nce);</div><div class='del'>-					kfree(nce);</div><div class='del'>-				}</div><div class='add'>+				if (nce)</div><div class='add'>+					btrfs_lru_cache_remove(&amp;sctx-&gt;name_cache,</div><div class='add'>+							       &amp;nce-&gt;entry);</div><div class='ctx'> </div><div class='ctx'> 				/*</div><div class='ctx'> 				 * ow_inode might currently be an ancestor of</div><div class='hunk'>@@ -4051,6 +4342,7 @@ static int process_recorded_refs(struct send_ctx *sctx, int *pending_move)</div><div class='ctx'> 				if (ret &gt; 0) {</div><div class='ctx'> 					orphanized_ancestor = true;</div><div class='ctx'> 					fs_path_reset(valid_path);</div><div class='add'>+					fs_path_reset(&amp;sctx-&gt;cur_inode_path);</div><div class='ctx'> 					ret = get_cur_path(sctx, sctx-&gt;cur_ino,</div><div class='ctx'> 							   sctx-&gt;cur_inode_gen,</div><div class='ctx'> 							   valid_path);</div><div class='hunk'>@@ -4085,7 +4377,7 @@ static int process_recorded_refs(struct send_ctx *sctx, int *pending_move)</div><div class='ctx'> 		 * parent directory out of order. But we need to check if this</div><div class='ctx'> 		 * did already happen before due to other refs in the same dir.</div><div class='ctx'> 		 */</div><div class='del'>-		ret = get_cur_inode_state(sctx, cur-&gt;dir, cur-&gt;dir_gen);</div><div class='add'>+		ret = get_cur_inode_state(sctx, cur-&gt;dir, cur-&gt;dir_gen, NULL, NULL);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		if (ret == inode_state_will_create) {</div><div class='hunk'>@@ -4115,6 +4407,7 @@ static int process_recorded_refs(struct send_ctx *sctx, int *pending_move)</div><div class='ctx'> 				ret = send_create_inode(sctx, cur-&gt;dir);</div><div class='ctx'> 				if (ret &lt; 0)</div><div class='ctx'> 					goto out;</div><div class='add'>+				cache_dir_created(sctx, cur-&gt;dir);</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -4145,13 +4438,10 @@ static int process_recorded_refs(struct send_ctx *sctx, int *pending_move)</div><div class='ctx'> 		 * it depending on the inode mode.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (is_orphan &amp;&amp; can_rename) {</div><div class='del'>-			ret = send_rename(sctx, valid_path, cur-&gt;full_path);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto out;</div><div class='del'>-			is_orphan = 0;</div><div class='del'>-			ret = fs_path_copy(valid_path, cur-&gt;full_path);</div><div class='add'>+			ret = rename_current_inode(sctx, valid_path, cur-&gt;full_path);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='ctx'> 				goto out;</div><div class='add'>+			is_orphan = false;</div><div class='ctx'> 		} else if (can_rename) {</div><div class='ctx'> 			if (S_ISDIR(sctx-&gt;cur_inode_mode)) {</div><div class='ctx'> 				/*</div><div class='hunk'>@@ -4159,10 +4449,7 @@ static int process_recorded_refs(struct send_ctx *sctx, int *pending_move)</div><div class='ctx'> 				 * dirs, we always have one new and one deleted</div><div class='ctx'> 				 * ref. The deleted ref is ignored later.</div><div class='ctx'> 				 */</div><div class='del'>-				ret = send_rename(sctx, valid_path,</div><div class='del'>-						  cur-&gt;full_path);</div><div class='del'>-				if (!ret)</div><div class='del'>-					ret = fs_path_copy(valid_path,</div><div class='add'>+				ret = rename_current_inode(sctx, valid_path,</div><div class='ctx'> 							   cur-&gt;full_path);</div><div class='ctx'> 				if (ret &lt; 0)</div><div class='ctx'> 					goto out;</div><div class='hunk'>@@ -4185,7 +4472,7 @@ static int process_recorded_refs(struct send_ctx *sctx, int *pending_move)</div><div class='ctx'> 					goto out;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		ret = dup_ref(cur, &amp;check_dirs);</div><div class='add'>+		ret = record_check_dir_ref_in_tree(&amp;rbtree_check_dirs, cur, &amp;check_dirs);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -4197,8 +4484,7 @@ static int process_recorded_refs(struct send_ctx *sctx, int *pending_move)</div><div class='ctx'> 		 * later, we do this check again and rmdir it then if possible.</div><div class='ctx'> 		 * See the use of check_dirs for more details.</div><div class='ctx'> 		 */</div><div class='del'>-		ret = can_rmdir(sctx, sctx-&gt;cur_ino, sctx-&gt;cur_inode_gen,</div><div class='del'>-				sctx-&gt;cur_ino);</div><div class='add'>+		ret = can_rmdir(sctx, sctx-&gt;cur_ino, sctx-&gt;cur_inode_gen);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		if (ret) {</div><div class='hunk'>@@ -4210,11 +4496,11 @@ static int process_recorded_refs(struct send_ctx *sctx, int *pending_move)</div><div class='ctx'> 					sctx-&gt;cur_inode_gen, valid_path);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='ctx'> 				goto out;</div><div class='del'>-			is_orphan = 1;</div><div class='add'>+			is_orphan = true;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		list_for_each_entry(cur, &amp;sctx-&gt;deleted_refs, list) {</div><div class='del'>-			ret = dup_ref(cur, &amp;check_dirs);</div><div class='add'>+			ret = record_check_dir_ref_in_tree(&amp;rbtree_check_dirs, cur, &amp;check_dirs);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='ctx'> 				goto out;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -4223,9 +4509,8 @@ static int process_recorded_refs(struct send_ctx *sctx, int *pending_move)</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We have a moved dir. Add the old parent to check_dirs</div><div class='ctx'> 		 */</div><div class='del'>-		cur = list_entry(sctx-&gt;deleted_refs.next, struct recorded_ref,</div><div class='del'>-				list);</div><div class='del'>-		ret = dup_ref(cur, &amp;check_dirs);</div><div class='add'>+		cur = list_first_entry(&amp;sctx-&gt;deleted_refs, struct recorded_ref, list);</div><div class='add'>+		ret = record_check_dir_ref_in_tree(&amp;rbtree_check_dirs, cur, &amp;check_dirs);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	} else if (!S_ISDIR(sctx-&gt;cur_inode_mode)) {</div><div class='hunk'>@@ -4256,8 +4541,10 @@ static int process_recorded_refs(struct send_ctx *sctx, int *pending_move)</div><div class='ctx'> 				ret = send_unlink(sctx, cur-&gt;full_path);</div><div class='ctx'> 				if (ret &lt; 0)</div><div class='ctx'> 					goto out;</div><div class='add'>+				if (is_current_inode_path(sctx, cur-&gt;full_path))</div><div class='add'>+					fs_path_reset(&amp;sctx-&gt;cur_inode_path);</div><div class='ctx'> 			}</div><div class='del'>-			ret = dup_ref(cur, &amp;check_dirs);</div><div class='add'>+			ret = record_check_dir_ref_in_tree(&amp;rbtree_check_dirs, cur, &amp;check_dirs);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='ctx'> 				goto out;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -4291,20 +4578,17 @@ static int process_recorded_refs(struct send_ctx *sctx, int *pending_move)</div><div class='ctx'> 		if (cur-&gt;dir &gt; sctx-&gt;cur_ino)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		ret = get_cur_inode_state(sctx, cur-&gt;dir, cur-&gt;dir_gen);</div><div class='add'>+		ret = get_cur_inode_state(sctx, cur-&gt;dir, cur-&gt;dir_gen, NULL, NULL);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='ctx'> 		if (ret == inode_state_did_create ||</div><div class='ctx'> 		    ret == inode_state_no_change) {</div><div class='del'>-			/* TODO delayed utimes */</div><div class='del'>-			ret = send_utimes(sctx, cur-&gt;dir, cur-&gt;dir_gen);</div><div class='add'>+			ret = cache_dir_utimes(sctx, cur-&gt;dir, cur-&gt;dir_gen);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='ctx'> 				goto out;</div><div class='del'>-		} else if (ret == inode_state_did_delete &amp;&amp;</div><div class='del'>-			   cur-&gt;dir != last_dir_ino_rm) {</div><div class='del'>-			ret = can_rmdir(sctx, cur-&gt;dir, cur-&gt;dir_gen,</div><div class='del'>-					sctx-&gt;cur_ino);</div><div class='add'>+		} else if (ret == inode_state_did_delete) {</div><div class='add'>+			ret = can_rmdir(sctx, cur-&gt;dir, cur-&gt;dir_gen);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			if (ret) {</div><div class='hunk'>@@ -4315,7 +4599,6 @@ static int process_recorded_refs(struct send_ctx *sctx, int *pending_move)</div><div class='ctx'> 				ret = send_rmdir(sctx, valid_path);</div><div class='ctx'> 				if (ret &lt; 0)</div><div class='ctx'> 					goto out;</div><div class='del'>-				last_dir_ino_rm = cur-&gt;dir;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -4329,204 +4612,171 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int record_ref(struct btrfs_root *root, u64 dir, struct fs_path *name,</div><div class='del'>-		      void *ctx, struct list_head *refs)</div><div class='add'>+static int rbtree_ref_comp(const void *k, const struct rb_node *node)</div><div class='ctx'> {</div><div class='del'>-	int ret = 0;</div><div class='del'>-	struct send_ctx *sctx = ctx;</div><div class='del'>-	struct fs_path *p;</div><div class='del'>-	u64 gen;</div><div class='del'>-</div><div class='del'>-	p = fs_path_alloc();</div><div class='del'>-	if (!p)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	ret = get_inode_info(root, dir, NULL, &amp;gen, NULL, NULL,</div><div class='del'>-			NULL, NULL);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	ret = get_cur_path(sctx, dir, gen, p);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-	ret = fs_path_add_path(p, name);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+	const struct recorded_ref *data = k;</div><div class='add'>+	const struct recorded_ref *ref = rb_entry(node, struct recorded_ref, node);</div><div class='ctx'> </div><div class='del'>-	ret = __record_ref(refs, dir, gen, p);</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	if (ret)</div><div class='del'>-		fs_path_free(p);</div><div class='del'>-	return ret;</div><div class='add'>+	if (data-&gt;dir &gt; ref-&gt;dir)</div><div class='add'>+		return 1;</div><div class='add'>+	if (data-&gt;dir &lt; ref-&gt;dir)</div><div class='add'>+		return -1;</div><div class='add'>+	if (data-&gt;dir_gen &gt; ref-&gt;dir_gen)</div><div class='add'>+		return 1;</div><div class='add'>+	if (data-&gt;dir_gen &lt; ref-&gt;dir_gen)</div><div class='add'>+		return -1;</div><div class='add'>+	if (data-&gt;name_len &gt; ref-&gt;name_len)</div><div class='add'>+		return 1;</div><div class='add'>+	if (data-&gt;name_len &lt; ref-&gt;name_len)</div><div class='add'>+		return -1;</div><div class='add'>+	return strcmp(data-&gt;name, ref-&gt;name);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __record_new_ref(int num, u64 dir, int index,</div><div class='del'>-			    struct fs_path *name,</div><div class='del'>-			    void *ctx)</div><div class='add'>+static bool rbtree_ref_less(struct rb_node *node, const struct rb_node *parent)</div><div class='ctx'> {</div><div class='del'>-	struct send_ctx *sctx = ctx;</div><div class='del'>-	return record_ref(sctx-&gt;send_root, dir, name, ctx, &amp;sctx-&gt;new_refs);</div><div class='del'>-}</div><div class='del'>-</div><div class='add'>+	const struct recorded_ref *entry = rb_entry(node, struct recorded_ref, node);</div><div class='ctx'> </div><div class='del'>-static int __record_deleted_ref(int num, u64 dir, int index,</div><div class='del'>-				struct fs_path *name,</div><div class='del'>-				void *ctx)</div><div class='del'>-{</div><div class='del'>-	struct send_ctx *sctx = ctx;</div><div class='del'>-	return record_ref(sctx-&gt;parent_root, dir, name, ctx,</div><div class='del'>-			  &amp;sctx-&gt;deleted_refs);</div><div class='add'>+	return rbtree_ref_comp(entry, parent) &lt; 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int record_new_ref(struct send_ctx *sctx)</div><div class='add'>+static int record_ref_in_tree(struct rb_root *root, struct list_head *refs,</div><div class='add'>+			      struct fs_path *name, u64 dir, u64 dir_gen,</div><div class='add'>+			      struct send_ctx *sctx)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='add'>+	int ret = 0;</div><div class='add'>+	struct fs_path *path = NULL;</div><div class='add'>+	struct recorded_ref *ref = NULL;</div><div class='ctx'> </div><div class='del'>-	ret = iterate_inode_ref(sctx-&gt;send_root, sctx-&gt;left_path,</div><div class='del'>-				sctx-&gt;cmp_key, 0, __record_new_ref, sctx);</div><div class='del'>-	if (ret &lt; 0)</div><div class='add'>+	path = fs_path_alloc();</div><div class='add'>+	if (!path) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='ctx'> 		goto out;</div><div class='del'>-	ret = 0;</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-static int record_deleted_ref(struct send_ctx *sctx)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='add'>+	ref = recorded_ref_alloc();</div><div class='add'>+	if (!ref) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	ret = iterate_inode_ref(sctx-&gt;parent_root, sctx-&gt;right_path,</div><div class='del'>-				sctx-&gt;cmp_key, 0, __record_deleted_ref, sctx);</div><div class='add'>+	ret = get_cur_path(sctx, dir, dir_gen, path);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+	ret = fs_path_add_path(path, name);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='del'>-	ret = 0;</div><div class='ctx'> </div><div class='add'>+	ref-&gt;dir = dir;</div><div class='add'>+	ref-&gt;dir_gen = dir_gen;</div><div class='add'>+	set_ref_path(ref, path);</div><div class='add'>+	list_add_tail(&amp;ref-&gt;list, refs);</div><div class='add'>+	rb_add(&amp;ref-&gt;node, root, rbtree_ref_less);</div><div class='add'>+	ref-&gt;root = root;</div><div class='ctx'> out:</div><div class='add'>+	if (ret) {</div><div class='add'>+		if (path &amp;&amp; (!ref || !ref-&gt;full_path))</div><div class='add'>+			fs_path_free(path);</div><div class='add'>+		recorded_ref_free(ref);</div><div class='add'>+	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct find_ref_ctx {</div><div class='del'>-	u64 dir;</div><div class='del'>-	u64 dir_gen;</div><div class='del'>-	struct btrfs_root *root;</div><div class='del'>-	struct fs_path *name;</div><div class='del'>-	int found_idx;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static int __find_iref(int num, u64 dir, int index,</div><div class='del'>-		       struct fs_path *name,</div><div class='del'>-		       void *ctx_)</div><div class='add'>+static int record_new_ref_if_needed(u64 dir, struct fs_path *name, void *ctx)</div><div class='ctx'> {</div><div class='del'>-	struct find_ref_ctx *ctx = ctx_;</div><div class='del'>-	u64 dir_gen;</div><div class='ctx'> 	int ret;</div><div class='add'>+	struct send_ctx *sctx = ctx;</div><div class='add'>+	struct rb_node *node = NULL;</div><div class='add'>+	struct recorded_ref data;</div><div class='add'>+	struct recorded_ref *ref;</div><div class='add'>+	u64 dir_gen;</div><div class='ctx'> </div><div class='del'>-	if (dir == ctx-&gt;dir &amp;&amp; fs_path_len(name) == fs_path_len(ctx-&gt;name) &amp;&amp;</div><div class='del'>-	    strncmp(name-&gt;start, ctx-&gt;name-&gt;start, fs_path_len(name)) == 0) {</div><div class='del'>-		/*</div><div class='del'>-		 * To avoid doing extra lookups we'll only do this if everything</div><div class='del'>-		 * else matches.</div><div class='del'>-		 */</div><div class='del'>-		ret = get_inode_info(ctx-&gt;root, dir, NULL, &amp;dir_gen, NULL,</div><div class='del'>-				     NULL, NULL, NULL);</div><div class='del'>-		if (ret)</div><div class='del'>-			return ret;</div><div class='del'>-		if (dir_gen != ctx-&gt;dir_gen)</div><div class='del'>-			return 0;</div><div class='del'>-		ctx-&gt;found_idx = num;</div><div class='del'>-		return 1;</div><div class='add'>+	ret = get_inode_gen(sctx-&gt;send_root, dir, &amp;dir_gen);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	data.dir = dir;</div><div class='add'>+	data.dir_gen = dir_gen;</div><div class='add'>+	set_ref_path(&amp;data, name);</div><div class='add'>+	node = rb_find(&amp;data, &amp;sctx-&gt;rbtree_deleted_refs, rbtree_ref_comp);</div><div class='add'>+	if (node) {</div><div class='add'>+		ref = rb_entry(node, struct recorded_ref, node);</div><div class='add'>+		recorded_ref_free(ref);</div><div class='add'>+	} else {</div><div class='add'>+		ret = record_ref_in_tree(&amp;sctx-&gt;rbtree_new_refs,</div><div class='add'>+					 &amp;sctx-&gt;new_refs, name, dir, dir_gen,</div><div class='add'>+					 sctx);</div><div class='ctx'> 	}</div><div class='del'>-	return 0;</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int find_iref(struct btrfs_root *root,</div><div class='del'>-		     struct btrfs_path *path,</div><div class='del'>-		     struct btrfs_key *key,</div><div class='del'>-		     u64 dir, u64 dir_gen, struct fs_path *name)</div><div class='add'>+static int record_deleted_ref_if_needed(u64 dir, struct fs_path *name, void *ctx)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='del'>-	struct find_ref_ctx ctx;</div><div class='del'>-</div><div class='del'>-	ctx.dir = dir;</div><div class='del'>-	ctx.name = name;</div><div class='del'>-	ctx.dir_gen = dir_gen;</div><div class='del'>-	ctx.found_idx = -1;</div><div class='del'>-	ctx.root = root;</div><div class='add'>+	struct send_ctx *sctx = ctx;</div><div class='add'>+	struct rb_node *node = NULL;</div><div class='add'>+	struct recorded_ref data;</div><div class='add'>+	struct recorded_ref *ref;</div><div class='add'>+	u64 dir_gen;</div><div class='ctx'> </div><div class='del'>-	ret = iterate_inode_ref(root, path, key, 0, __find_iref, &amp;ctx);</div><div class='add'>+	ret = get_inode_gen(sctx-&gt;parent_root, dir, &amp;dir_gen);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	if (ctx.found_idx == -1)</div><div class='del'>-		return -ENOENT;</div><div class='add'>+	data.dir = dir;</div><div class='add'>+	data.dir_gen = dir_gen;</div><div class='add'>+	set_ref_path(&amp;data, name);</div><div class='add'>+	node = rb_find(&amp;data, &amp;sctx-&gt;rbtree_new_refs, rbtree_ref_comp);</div><div class='add'>+	if (node) {</div><div class='add'>+		ref = rb_entry(node, struct recorded_ref, node);</div><div class='add'>+		recorded_ref_free(ref);</div><div class='add'>+	} else {</div><div class='add'>+		ret = record_ref_in_tree(&amp;sctx-&gt;rbtree_deleted_refs,</div><div class='add'>+					 &amp;sctx-&gt;deleted_refs, name, dir,</div><div class='add'>+					 dir_gen, sctx);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	return ctx.found_idx;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __record_changed_new_ref(int num, u64 dir, int index,</div><div class='del'>-				    struct fs_path *name,</div><div class='del'>-				    void *ctx)</div><div class='add'>+static int record_new_ref(struct send_ctx *sctx)</div><div class='ctx'> {</div><div class='del'>-	u64 dir_gen;</div><div class='ctx'> 	int ret;</div><div class='del'>-	struct send_ctx *sctx = ctx;</div><div class='ctx'> </div><div class='del'>-	ret = get_inode_info(sctx-&gt;send_root, dir, NULL, &amp;dir_gen, NULL,</div><div class='del'>-			     NULL, NULL, NULL);</div><div class='del'>-	if (ret)</div><div class='add'>+	ret = iterate_inode_ref(sctx-&gt;send_root, sctx-&gt;left_path, sctx-&gt;cmp_key,</div><div class='add'>+				false, record_new_ref_if_needed, sctx);</div><div class='add'>+	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	ret = find_iref(sctx-&gt;parent_root, sctx-&gt;right_path,</div><div class='del'>-			sctx-&gt;cmp_key, dir, dir_gen, name);</div><div class='del'>-	if (ret == -ENOENT)</div><div class='del'>-		ret = __record_new_ref(num, dir, index, name, sctx);</div><div class='del'>-	else if (ret &gt; 0)</div><div class='del'>-		ret = 0;</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __record_changed_deleted_ref(int num, u64 dir, int index,</div><div class='del'>-					struct fs_path *name,</div><div class='del'>-					void *ctx)</div><div class='add'>+static int record_deleted_ref(struct send_ctx *sctx)</div><div class='ctx'> {</div><div class='del'>-	u64 dir_gen;</div><div class='ctx'> 	int ret;</div><div class='del'>-	struct send_ctx *sctx = ctx;</div><div class='ctx'> </div><div class='del'>-	ret = get_inode_info(sctx-&gt;parent_root, dir, NULL, &amp;dir_gen, NULL,</div><div class='del'>-			     NULL, NULL, NULL);</div><div class='del'>-	if (ret)</div><div class='add'>+	ret = iterate_inode_ref(sctx-&gt;parent_root, sctx-&gt;right_path, sctx-&gt;cmp_key,</div><div class='add'>+				false, record_deleted_ref_if_needed, sctx);</div><div class='add'>+	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	ret = find_iref(sctx-&gt;send_root, sctx-&gt;left_path, sctx-&gt;cmp_key,</div><div class='del'>-			dir, dir_gen, name);</div><div class='del'>-	if (ret == -ENOENT)</div><div class='del'>-		ret = __record_deleted_ref(num, dir, index, name, sctx);</div><div class='del'>-	else if (ret &gt; 0)</div><div class='del'>-		ret = 0;</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int record_changed_ref(struct send_ctx *sctx)</div><div class='ctx'> {</div><div class='del'>-	int ret = 0;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = iterate_inode_ref(sctx-&gt;send_root, sctx-&gt;left_path,</div><div class='del'>-			sctx-&gt;cmp_key, 0, __record_changed_new_ref, sctx);</div><div class='add'>+	ret = iterate_inode_ref(sctx-&gt;send_root, sctx-&gt;left_path, sctx-&gt;cmp_key,</div><div class='add'>+				false, record_new_ref_if_needed, sctx);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-	ret = iterate_inode_ref(sctx-&gt;parent_root, sctx-&gt;right_path,</div><div class='del'>-			sctx-&gt;cmp_key, 0, __record_changed_deleted_ref, sctx);</div><div class='add'>+		return ret;</div><div class='add'>+	ret = iterate_inode_ref(sctx-&gt;parent_root, sctx-&gt;right_path, sctx-&gt;cmp_key,</div><div class='add'>+				false, record_deleted_ref_if_needed, sctx);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-	ret = 0;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -4536,13 +4786,12 @@ out:</div><div class='ctx'> static int process_all_refs(struct send_ctx *sctx,</div><div class='ctx'> 			    enum btrfs_compare_tree_result cmd)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='add'>+	int ret = 0;</div><div class='add'>+	int iter_ret = 0;</div><div class='ctx'> 	struct btrfs_root *root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_key found_key;</div><div class='del'>-	struct extent_buffer *eb;</div><div class='del'>-	int slot;</div><div class='ctx'> 	iterate_inode_ref_t cb;</div><div class='ctx'> 	int pending_move = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -4552,49 +4801,33 @@ static int process_all_refs(struct send_ctx *sctx,</div><div class='ctx'> </div><div class='ctx'> 	if (cmd == BTRFS_COMPARE_TREE_NEW) {</div><div class='ctx'> 		root = sctx-&gt;send_root;</div><div class='del'>-		cb = __record_new_ref;</div><div class='add'>+		cb = record_new_ref_if_needed;</div><div class='ctx'> 	} else if (cmd == BTRFS_COMPARE_TREE_DELETED) {</div><div class='ctx'> 		root = sctx-&gt;parent_root;</div><div class='del'>-		cb = __record_deleted_ref;</div><div class='add'>+		cb = record_deleted_ref_if_needed;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		btrfs_err(sctx-&gt;send_root-&gt;fs_info,</div><div class='ctx'> 				"Wrong command %d in process_all_refs", cmd);</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		goto out;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = sctx-&gt;cmp_key-&gt;objectid;</div><div class='ctx'> 	key.type = BTRFS_INODE_REF_KEY;</div><div class='ctx'> 	key.offset = 0;</div><div class='del'>-	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	while (1) {</div><div class='del'>-		eb = path-&gt;nodes[0];</div><div class='del'>-		slot = path-&gt;slots[0];</div><div class='del'>-		if (slot &gt;= btrfs_header_nritems(eb)) {</div><div class='del'>-			ret = btrfs_next_leaf(root, path);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto out;</div><div class='del'>-			else if (ret &gt; 0)</div><div class='del'>-				break;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		btrfs_item_key_to_cpu(eb, &amp;found_key, slot);</div><div class='del'>-</div><div class='add'>+	btrfs_for_each_slot(root, &amp;key, &amp;found_key, path, iter_ret) {</div><div class='ctx'> 		if (found_key.objectid != key.objectid ||</div><div class='ctx'> 		    (found_key.type != BTRFS_INODE_REF_KEY &amp;&amp;</div><div class='ctx'> 		     found_key.type != BTRFS_INODE_EXTREF_KEY))</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		ret = iterate_inode_ref(root, path, &amp;found_key, 0, cb, sctx);</div><div class='add'>+		ret = iterate_inode_ref(root, path, &amp;found_key, false, cb, sctx);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='del'>-</div><div class='del'>-		path-&gt;slots[0]++;</div><div class='add'>+			return ret;</div><div class='ctx'> 	}</div><div class='add'>+	/* Catch error found during iteration */</div><div class='add'>+	if (iter_ret &lt; 0)</div><div class='add'>+		return iter_ret;</div><div class='add'>+</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -4602,22 +4835,23 @@ static int process_all_refs(struct send_ctx *sctx,</div><div class='ctx'> 	 * re-creating this inode and will be rename'ing it into place once we</div><div class='ctx'> 	 * rename the parent directory.</div><div class='ctx'> 	 */</div><div class='del'>-	ret = process_recorded_refs(sctx, &amp;pending_move);</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	return process_recorded_refs(sctx, &amp;pending_move);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int send_set_xattr(struct send_ctx *sctx,</div><div class='del'>-			  struct fs_path *path,</div><div class='ctx'> 			  const char *name, int name_len,</div><div class='ctx'> 			  const char *data, int data_len)</div><div class='ctx'> {</div><div class='del'>-	int ret = 0;</div><div class='add'>+	struct fs_path *path;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	path = get_cur_inode_path(sctx);</div><div class='add'>+	if (IS_ERR(path))</div><div class='add'>+		return PTR_ERR(path);</div><div class='ctx'> </div><div class='ctx'> 	ret = begin_cmd(sctx, BTRFS_SEND_C_SET_XATTR);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	TLV_PUT_PATH(sctx, BTRFS_SEND_A_PATH, path);</div><div class='ctx'> 	TLV_PUT_STRING(sctx, BTRFS_SEND_A_XATTR_NAME, name, name_len);</div><div class='hunk'>@@ -4626,7 +4860,6 @@ static int send_set_xattr(struct send_ctx *sctx,</div><div class='ctx'> 	ret = send_cmd(sctx);</div><div class='ctx'> </div><div class='ctx'> tlv_put_failure:</div><div class='del'>-out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -4634,11 +4867,11 @@ static int send_remove_xattr(struct send_ctx *sctx,</div><div class='ctx'> 			  struct fs_path *path,</div><div class='ctx'> 			  const char *name, int name_len)</div><div class='ctx'> {</div><div class='del'>-	int ret = 0;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	ret = begin_cmd(sctx, BTRFS_SEND_C_REMOVE_XATTR);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	TLV_PUT_PATH(sctx, BTRFS_SEND_A_PATH, path);</div><div class='ctx'> 	TLV_PUT_STRING(sctx, BTRFS_SEND_A_XATTR_NAME, name, name_len);</div><div class='hunk'>@@ -4646,28 +4879,20 @@ static int send_remove_xattr(struct send_ctx *sctx,</div><div class='ctx'> 	ret = send_cmd(sctx);</div><div class='ctx'> </div><div class='ctx'> tlv_put_failure:</div><div class='del'>-out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int __process_new_xattr(int num, struct btrfs_key *di_key,</div><div class='del'>-			       const char *name, int name_len,</div><div class='del'>-			       const char *data, int data_len,</div><div class='del'>-			       u8 type, void *ctx)</div><div class='add'>+			       const char *name, int name_len, const char *data,</div><div class='add'>+			       int data_len, void *ctx)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='ctx'> 	struct send_ctx *sctx = ctx;</div><div class='del'>-	struct fs_path *p;</div><div class='ctx'> 	struct posix_acl_xattr_header dummy_acl;</div><div class='ctx'> </div><div class='ctx'> 	/* Capabilities are emitted by finish_inode_if_needed */</div><div class='ctx'> 	if (!strncmp(name, XATTR_NAME_CAPS, name_len))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	p = fs_path_alloc();</div><div class='del'>-	if (!p)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * This hack is needed because empty acls are stored as zero byte</div><div class='ctx'> 	 * data in xattrs. Problem with that is, that receiving these zero byte</div><div class='hunk'>@@ -4684,49 +4909,27 @@ static int __process_new_xattr(int num, struct btrfs_key *di_key,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = get_cur_path(sctx, sctx-&gt;cur_ino, sctx-&gt;cur_inode_gen, p);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	ret = send_set_xattr(sctx, p, name, name_len, data, data_len);</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	fs_path_free(p);</div><div class='del'>-	return ret;</div><div class='add'>+	return send_set_xattr(sctx, name, name_len, data, data_len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int __process_deleted_xattr(int num, struct btrfs_key *di_key,</div><div class='ctx'> 				   const char *name, int name_len,</div><div class='del'>-				   const char *data, int data_len,</div><div class='del'>-				   u8 type, void *ctx)</div><div class='add'>+				   const char *data, int data_len, void *ctx)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='ctx'> 	struct send_ctx *sctx = ctx;</div><div class='ctx'> 	struct fs_path *p;</div><div class='ctx'> </div><div class='del'>-	p = fs_path_alloc();</div><div class='del'>-	if (!p)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	ret = get_cur_path(sctx, sctx-&gt;cur_ino, sctx-&gt;cur_inode_gen, p);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	ret = send_remove_xattr(sctx, p, name, name_len);</div><div class='add'>+	p = get_cur_inode_path(sctx);</div><div class='add'>+	if (IS_ERR(p))</div><div class='add'>+		return PTR_ERR(p);</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	fs_path_free(p);</div><div class='del'>-	return ret;</div><div class='add'>+	return send_remove_xattr(sctx, p, name, name_len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int process_new_xattr(struct send_ctx *sctx)</div><div class='ctx'> {</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	ret = iterate_dir_item(sctx-&gt;send_root, sctx-&gt;left_path,</div><div class='del'>-			       __process_new_xattr, sctx);</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='add'>+	return iterate_dir_item(sctx-&gt;send_root, sctx-&gt;left_path,</div><div class='add'>+				__process_new_xattr, sctx);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int process_deleted_xattr(struct send_ctx *sctx)</div><div class='hunk'>@@ -4741,12 +4944,11 @@ struct find_xattr_ctx {</div><div class='ctx'> 	int found_idx;</div><div class='ctx'> 	char *found_data;</div><div class='ctx'> 	int found_data_len;</div><div class='add'>+	bool copy_data;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int __find_xattr(int num, struct btrfs_key *di_key,</div><div class='del'>-			const char *name, int name_len,</div><div class='del'>-			const char *data, int data_len,</div><div class='del'>-			u8 type, void *vctx)</div><div class='add'>+static int __find_xattr(int num, struct btrfs_key *di_key, const char *name,</div><div class='add'>+			int name_len, const char *data, int data_len, void *vctx)</div><div class='ctx'> {</div><div class='ctx'> 	struct find_xattr_ctx *ctx = vctx;</div><div class='ctx'> </div><div class='hunk'>@@ -4754,9 +4956,11 @@ static int __find_xattr(int num, struct btrfs_key *di_key,</div><div class='ctx'> 	    strncmp(name, ctx-&gt;name, name_len) == 0) {</div><div class='ctx'> 		ctx-&gt;found_idx = num;</div><div class='ctx'> 		ctx-&gt;found_data_len = data_len;</div><div class='del'>-		ctx-&gt;found_data = kmemdup(data, data_len, GFP_KERNEL);</div><div class='del'>-		if (!ctx-&gt;found_data)</div><div class='del'>-			return -ENOMEM;</div><div class='add'>+		if (ctx-&gt;copy_data) {</div><div class='add'>+			ctx-&gt;found_data = kmemdup(data, data_len, GFP_KERNEL);</div><div class='add'>+			if (!ctx-&gt;found_data)</div><div class='add'>+				return -ENOMEM;</div><div class='add'>+		}</div><div class='ctx'> 		return 1;</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -4776,6 +4980,7 @@ static int find_xattr(struct btrfs_root *root,</div><div class='ctx'> 	ctx.found_idx = -1;</div><div class='ctx'> 	ctx.found_data = NULL;</div><div class='ctx'> 	ctx.found_data_len = 0;</div><div class='add'>+	ctx.copy_data = (data != NULL);</div><div class='ctx'> </div><div class='ctx'> 	ret = iterate_dir_item(root, path, __find_xattr, &amp;ctx);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='hunk'>@@ -4787,7 +4992,7 @@ static int find_xattr(struct btrfs_root *root,</div><div class='ctx'> 		*data = ctx.found_data;</div><div class='ctx'> 		*data_len = ctx.found_data_len;</div><div class='ctx'> 	} else {</div><div class='del'>-		kfree(ctx.found_data);</div><div class='add'>+		ASSERT(ctx.found_data == NULL);</div><div class='ctx'> 	}</div><div class='ctx'> 	return ctx.found_idx;</div><div class='ctx'> }</div><div class='hunk'>@@ -4796,37 +5001,36 @@ static int find_xattr(struct btrfs_root *root,</div><div class='ctx'> static int __process_changed_new_xattr(int num, struct btrfs_key *di_key,</div><div class='ctx'> 				       const char *name, int name_len,</div><div class='ctx'> 				       const char *data, int data_len,</div><div class='del'>-				       u8 type, void *ctx)</div><div class='add'>+				       void *ctx)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct send_ctx *sctx = ctx;</div><div class='del'>-	char *found_data = NULL;</div><div class='del'>-	int found_data_len  = 0;</div><div class='add'>+	char AUTO_KFREE(found_data);</div><div class='add'>+	int found_data_len = 0;</div><div class='ctx'> </div><div class='ctx'> 	ret = find_xattr(sctx-&gt;parent_root, sctx-&gt;right_path,</div><div class='ctx'> 			 sctx-&gt;cmp_key, name, name_len, &amp;found_data,</div><div class='ctx'> 			 &amp;found_data_len);</div><div class='ctx'> 	if (ret == -ENOENT) {</div><div class='ctx'> 		ret = __process_new_xattr(num, di_key, name, name_len, data,</div><div class='del'>-				data_len, type, ctx);</div><div class='add'>+					  data_len, ctx);</div><div class='ctx'> 	} else if (ret &gt;= 0) {</div><div class='ctx'> 		if (data_len != found_data_len ||</div><div class='ctx'> 		    memcmp(data, found_data, data_len)) {</div><div class='ctx'> 			ret = __process_new_xattr(num, di_key, name, name_len,</div><div class='del'>-					data, data_len, type, ctx);</div><div class='add'>+						  data, data_len, ctx);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			ret = 0;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	kfree(found_data);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int __process_changed_deleted_xattr(int num, struct btrfs_key *di_key,</div><div class='ctx'> 					   const char *name, int name_len,</div><div class='ctx'> 					   const char *data, int data_len,</div><div class='del'>-					   u8 type, void *ctx)</div><div class='add'>+					   void *ctx)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct send_ctx *sctx = ctx;</div><div class='hunk'>@@ -4835,7 +5039,7 @@ static int __process_changed_deleted_xattr(int num, struct btrfs_key *di_key,</div><div class='ctx'> 			 name, name_len, NULL, NULL);</div><div class='ctx'> 	if (ret == -ENOENT)</div><div class='ctx'> 		ret = __process_deleted_xattr(num, di_key, name, name_len, data,</div><div class='del'>-				data_len, type, ctx);</div><div class='add'>+					      data_len, ctx);</div><div class='ctx'> 	else if (ret &gt;= 0)</div><div class='ctx'> 		ret = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -4844,28 +5048,25 @@ static int __process_changed_deleted_xattr(int num, struct btrfs_key *di_key,</div><div class='ctx'> </div><div class='ctx'> static int process_changed_xattr(struct send_ctx *sctx)</div><div class='ctx'> {</div><div class='del'>-	int ret = 0;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	ret = iterate_dir_item(sctx-&gt;send_root, sctx-&gt;left_path,</div><div class='ctx'> 			__process_changed_new_xattr, sctx);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-	ret = iterate_dir_item(sctx-&gt;parent_root, sctx-&gt;right_path,</div><div class='del'>-			__process_changed_deleted_xattr, sctx);</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	return ret;</div><div class='add'>+	return iterate_dir_item(sctx-&gt;parent_root, sctx-&gt;right_path,</div><div class='add'>+				__process_changed_deleted_xattr, sctx);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int process_all_new_xattrs(struct send_ctx *sctx)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='add'>+	int ret = 0;</div><div class='add'>+	int iter_ret = 0;</div><div class='ctx'> 	struct btrfs_root *root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_key found_key;</div><div class='del'>-	struct extent_buffer *eb;</div><div class='del'>-	int slot;</div><div class='ctx'> </div><div class='ctx'> 	path = alloc_path_for_send();</div><div class='ctx'> 	if (!path)</div><div class='hunk'>@@ -4876,40 +5077,89 @@ static int process_all_new_xattrs(struct send_ctx *sctx)</div><div class='ctx'> 	key.objectid = sctx-&gt;cmp_key-&gt;objectid;</div><div class='ctx'> 	key.type = BTRFS_XATTR_ITEM_KEY;</div><div class='ctx'> 	key.offset = 0;</div><div class='del'>-	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	while (1) {</div><div class='del'>-		eb = path-&gt;nodes[0];</div><div class='del'>-		slot = path-&gt;slots[0];</div><div class='del'>-		if (slot &gt;= btrfs_header_nritems(eb)) {</div><div class='del'>-			ret = btrfs_next_leaf(root, path);</div><div class='del'>-			if (ret &lt; 0) {</div><div class='del'>-				goto out;</div><div class='del'>-			} else if (ret &gt; 0) {</div><div class='del'>-				ret = 0;</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		btrfs_item_key_to_cpu(eb, &amp;found_key, slot);</div><div class='add'>+	btrfs_for_each_slot(root, &amp;key, &amp;found_key, path, iter_ret) {</div><div class='ctx'> 		if (found_key.objectid != key.objectid ||</div><div class='ctx'> 		    found_key.type != key.type) {</div><div class='ctx'> 			ret = 0;</div><div class='del'>-			goto out;</div><div class='add'>+			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		ret = iterate_dir_item(root, path, __process_new_xattr, sctx);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='add'>+			break;</div><div class='add'>+	}</div><div class='add'>+	/* Catch error found during iteration */</div><div class='add'>+	if (iter_ret &lt; 0)</div><div class='add'>+		ret = iter_ret;</div><div class='ctx'> </div><div class='del'>-		path-&gt;slots[0]++;</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int send_verity(struct send_ctx *sctx, struct fs_path *path,</div><div class='add'>+		       struct fsverity_descriptor *desc)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = begin_cmd(sctx, BTRFS_SEND_C_ENABLE_VERITY);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	TLV_PUT_PATH(sctx, BTRFS_SEND_A_PATH, path);</div><div class='add'>+	TLV_PUT_U8(sctx, BTRFS_SEND_A_VERITY_ALGORITHM,</div><div class='add'>+			le8_to_cpu(desc-&gt;hash_algorithm));</div><div class='add'>+	TLV_PUT_U32(sctx, BTRFS_SEND_A_VERITY_BLOCK_SIZE,</div><div class='add'>+			1U &lt;&lt; le8_to_cpu(desc-&gt;log_blocksize));</div><div class='add'>+	TLV_PUT(sctx, BTRFS_SEND_A_VERITY_SALT_DATA, desc-&gt;salt,</div><div class='add'>+			le8_to_cpu(desc-&gt;salt_size));</div><div class='add'>+	TLV_PUT(sctx, BTRFS_SEND_A_VERITY_SIG_DATA, desc-&gt;signature,</div><div class='add'>+			le32_to_cpu(desc-&gt;sig_size));</div><div class='add'>+</div><div class='add'>+	ret = send_cmd(sctx);</div><div class='add'>+</div><div class='add'>+tlv_put_failure:</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int process_verity(struct send_ctx *sctx)</div><div class='add'>+{</div><div class='add'>+	int ret = 0;</div><div class='add'>+	struct btrfs_inode *inode;</div><div class='add'>+	struct fs_path *p;</div><div class='add'>+</div><div class='add'>+	inode = btrfs_iget(sctx-&gt;cur_ino, sctx-&gt;send_root);</div><div class='add'>+	if (IS_ERR(inode))</div><div class='add'>+		return PTR_ERR(inode);</div><div class='add'>+</div><div class='add'>+	ret = btrfs_get_verity_descriptor(&amp;inode-&gt;vfs_inode, NULL, 0);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto iput;</div><div class='add'>+</div><div class='add'>+	if (unlikely(ret &gt; FS_VERITY_MAX_DESCRIPTOR_SIZE)) {</div><div class='add'>+		ret = -EMSGSIZE;</div><div class='add'>+		goto iput;</div><div class='add'>+	}</div><div class='add'>+	if (!sctx-&gt;verity_descriptor) {</div><div class='add'>+		sctx-&gt;verity_descriptor = kvmalloc(FS_VERITY_MAX_DESCRIPTOR_SIZE,</div><div class='add'>+						   GFP_KERNEL);</div><div class='add'>+		if (!sctx-&gt;verity_descriptor) {</div><div class='add'>+			ret = -ENOMEM;</div><div class='add'>+			goto iput;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='add'>+	ret = btrfs_get_verity_descriptor(&amp;inode-&gt;vfs_inode, sctx-&gt;verity_descriptor, ret);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto iput;</div><div class='add'>+</div><div class='add'>+	p = get_cur_inode_path(sctx);</div><div class='add'>+	if (IS_ERR(p)) {</div><div class='add'>+		ret = PTR_ERR(p);</div><div class='add'>+		goto iput;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = send_verity(sctx, p, sctx-&gt;verity_descriptor);</div><div class='add'>+iput:</div><div class='add'>+	iput(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -4920,14 +5170,28 @@ static inline u64 max_send_read_size(const struct send_ctx *sctx)</div><div class='ctx'> </div><div class='ctx'> static int put_data_header(struct send_ctx *sctx, u32 len)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_tlv_header *hdr;</div><div class='add'>+	if (WARN_ON_ONCE(sctx-&gt;put_data))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	sctx-&gt;put_data = true;</div><div class='add'>+	if (sctx-&gt;proto &gt;= 2) {</div><div class='add'>+		/*</div><div class='add'>+		 * Since v2, the data attribute header doesn't include a length,</div><div class='add'>+		 * it is implicitly to the end of the command.</div><div class='add'>+		 */</div><div class='add'>+		if (unlikely(sctx-&gt;send_max_size - sctx-&gt;send_size &lt; sizeof(__le16) + len))</div><div class='add'>+			return -EOVERFLOW;</div><div class='add'>+		put_unaligned_le16(BTRFS_SEND_A_DATA, sctx-&gt;send_buf + sctx-&gt;send_size);</div><div class='add'>+		sctx-&gt;send_size += sizeof(__le16);</div><div class='add'>+	} else {</div><div class='add'>+		struct btrfs_tlv_header *hdr;</div><div class='ctx'> </div><div class='del'>-	if (sctx-&gt;send_max_size - sctx-&gt;send_size &lt; sizeof(*hdr) + len)</div><div class='del'>-		return -EOVERFLOW;</div><div class='del'>-	hdr = (struct btrfs_tlv_header *)(sctx-&gt;send_buf + sctx-&gt;send_size);</div><div class='del'>-	put_unaligned_le16(BTRFS_SEND_A_DATA, &amp;hdr-&gt;tlv_type);</div><div class='del'>-	put_unaligned_le16(len, &amp;hdr-&gt;tlv_len);</div><div class='del'>-	sctx-&gt;send_size += sizeof(*hdr);</div><div class='add'>+		if (unlikely(sctx-&gt;send_max_size - sctx-&gt;send_size &lt; sizeof(*hdr) + len))</div><div class='add'>+			return -EOVERFLOW;</div><div class='add'>+		hdr = (struct btrfs_tlv_header *)(sctx-&gt;send_buf + sctx-&gt;send_size);</div><div class='add'>+		put_unaligned_le16(BTRFS_SEND_A_DATA, &amp;hdr-&gt;tlv_type);</div><div class='add'>+		put_unaligned_le16(len, &amp;hdr-&gt;tlv_len);</div><div class='add'>+		sctx-&gt;send_size += sizeof(*hdr);</div><div class='add'>+	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -4935,70 +5199,69 @@ static int put_file_data(struct send_ctx *sctx, u64 offset, u32 len)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root = sctx-&gt;send_root;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	struct page *page;</div><div class='del'>-	pgoff_t index = offset &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	pgoff_t last_index;</div><div class='del'>-	unsigned pg_offset = offset_in_page(offset);</div><div class='add'>+	u64 cur = offset;</div><div class='add'>+	const u64 end = offset + len;</div><div class='add'>+	const pgoff_t last_index = ((end - 1) &gt;&gt; PAGE_SHIFT);</div><div class='add'>+	struct address_space *mapping = sctx-&gt;cur_inode-&gt;i_mapping;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	ret = put_data_header(sctx, len);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	inode = btrfs_iget(fs_info-&gt;sb, sctx-&gt;cur_ino, root);</div><div class='del'>-	if (IS_ERR(inode))</div><div class='del'>-		return PTR_ERR(inode);</div><div class='del'>-</div><div class='del'>-	last_index = (offset + len - 1) &gt;&gt; PAGE_SHIFT;</div><div class='del'>-</div><div class='del'>-	/* initial readahead */</div><div class='del'>-	memset(&amp;sctx-&gt;ra, 0, sizeof(struct file_ra_state));</div><div class='del'>-	file_ra_state_init(&amp;sctx-&gt;ra, inode-&gt;i_mapping);</div><div class='del'>-</div><div class='del'>-	while (index &lt;= last_index) {</div><div class='del'>-		unsigned cur_len = min_t(unsigned, len,</div><div class='del'>-					 PAGE_SIZE - pg_offset);</div><div class='del'>-</div><div class='del'>-		page = find_lock_page(inode-&gt;i_mapping, index);</div><div class='del'>-		if (!page) {</div><div class='del'>-			page_cache_sync_readahead(inode-&gt;i_mapping, &amp;sctx-&gt;ra,</div><div class='del'>-				NULL, index, last_index + 1 - index);</div><div class='del'>-</div><div class='del'>-			page = find_or_create_page(inode-&gt;i_mapping, index,</div><div class='del'>-					GFP_KERNEL);</div><div class='del'>-			if (!page) {</div><div class='del'>-				ret = -ENOMEM;</div><div class='add'>+	while (cur &lt; end) {</div><div class='add'>+		pgoff_t index = (cur &gt;&gt; PAGE_SHIFT);</div><div class='add'>+		unsigned int cur_len;</div><div class='add'>+		unsigned int pg_offset;</div><div class='add'>+		struct folio *folio;</div><div class='add'>+</div><div class='add'>+		folio = filemap_lock_folio(mapping, index);</div><div class='add'>+		if (IS_ERR(folio)) {</div><div class='add'>+			page_cache_sync_readahead(mapping,</div><div class='add'>+						  &amp;sctx-&gt;ra, NULL, index,</div><div class='add'>+						  last_index + 1 - index);</div><div class='add'>+</div><div class='add'>+	                folio = filemap_grab_folio(mapping, index);</div><div class='add'>+			if (IS_ERR(folio)) {</div><div class='add'>+				ret = PTR_ERR(folio);</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-</div><div class='del'>-		if (PageReadahead(page)) {</div><div class='del'>-			page_cache_async_readahead(inode-&gt;i_mapping, &amp;sctx-&gt;ra,</div><div class='del'>-				NULL, page, index, last_index + 1 - index);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (!PageUptodate(page)) {</div><div class='del'>-			btrfs_readpage(NULL, page);</div><div class='del'>-			lock_page(page);</div><div class='del'>-			if (!PageUptodate(page)) {</div><div class='del'>-				unlock_page(page);</div><div class='del'>-				put_page(page);</div><div class='add'>+		pg_offset = offset_in_folio(folio, cur);</div><div class='add'>+		cur_len = min_t(unsigned int, end - cur, folio_size(folio) - pg_offset);</div><div class='add'>+</div><div class='add'>+		if (folio_test_readahead(folio))</div><div class='add'>+			page_cache_async_readahead(mapping, &amp;sctx-&gt;ra, NULL, folio,</div><div class='add'>+						   last_index + 1 - index);</div><div class='add'>+</div><div class='add'>+		if (!folio_test_uptodate(folio)) {</div><div class='add'>+			btrfs_read_folio(NULL, folio);</div><div class='add'>+			folio_lock(folio);</div><div class='add'>+			if (unlikely(!folio_test_uptodate(folio))) {</div><div class='add'>+				folio_unlock(folio);</div><div class='add'>+				btrfs_err(fs_info,</div><div class='add'>+			"send: IO error at offset %llu for inode %llu root %llu",</div><div class='add'>+					folio_pos(folio), sctx-&gt;cur_ino,</div><div class='add'>+					btrfs_root_id(sctx-&gt;send_root));</div><div class='add'>+				folio_put(folio);</div><div class='ctx'> 				ret = -EIO;</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='add'>+			if (folio-&gt;mapping != mapping) {</div><div class='add'>+				folio_unlock(folio);</div><div class='add'>+				folio_put(folio);</div><div class='add'>+				continue;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		memcpy_from_page(sctx-&gt;send_buf + sctx-&gt;send_size, page,</div><div class='del'>-				 pg_offset, cur_len);</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		put_page(page);</div><div class='del'>-		index++;</div><div class='del'>-		pg_offset = 0;</div><div class='del'>-		len -= cur_len;</div><div class='add'>+		memcpy_from_folio(sctx-&gt;send_buf + sctx-&gt;send_size, folio,</div><div class='add'>+				  pg_offset, cur_len);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='add'>+		cur += cur_len;</div><div class='ctx'> 		sctx-&gt;send_size += cur_len;</div><div class='ctx'> 	}</div><div class='del'>-	iput(inode);</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5008,35 +5271,26 @@ static int put_file_data(struct send_ctx *sctx, u64 offset, u32 len)</div><div class='ctx'>  */</div><div class='ctx'> static int send_write(struct send_ctx *sctx, u64 offset, u32 len)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = sctx-&gt;send_root-&gt;fs_info;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	struct fs_path *p;</div><div class='ctx'> </div><div class='del'>-	p = fs_path_alloc();</div><div class='del'>-	if (!p)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	btrfs_debug(fs_info, "send_write offset=%llu, len=%d", offset, len);</div><div class='add'>+	p = get_cur_inode_path(sctx);</div><div class='add'>+	if (IS_ERR(p))</div><div class='add'>+		return PTR_ERR(p);</div><div class='ctx'> </div><div class='ctx'> 	ret = begin_cmd(sctx, BTRFS_SEND_C_WRITE);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	ret = get_cur_path(sctx, sctx-&gt;cur_ino, sctx-&gt;cur_inode_gen, p);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	TLV_PUT_PATH(sctx, BTRFS_SEND_A_PATH, p);</div><div class='ctx'> 	TLV_PUT_U64(sctx, BTRFS_SEND_A_FILE_OFFSET, offset);</div><div class='ctx'> 	ret = put_file_data(sctx, offset, len);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	ret = send_cmd(sctx);</div><div class='ctx'> </div><div class='ctx'> tlv_put_failure:</div><div class='del'>-out:</div><div class='del'>-	fs_path_free(p);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5049,12 +5303,12 @@ static int send_clone(struct send_ctx *sctx,</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	struct fs_path *p;</div><div class='add'>+	struct fs_path *cur_inode_path;</div><div class='ctx'> 	u64 gen;</div><div class='ctx'> </div><div class='del'>-	btrfs_debug(sctx-&gt;send_root-&gt;fs_info,</div><div class='del'>-		    "send_clone offset=%llu, len=%d, clone_root=%llu, clone_inode=%llu, clone_offset=%llu",</div><div class='del'>-		    offset, len, clone_root-&gt;root-&gt;root_key.objectid,</div><div class='del'>-		    clone_root-&gt;ino, clone_root-&gt;offset);</div><div class='add'>+	cur_inode_path = get_cur_inode_path(sctx);</div><div class='add'>+	if (IS_ERR(cur_inode_path))</div><div class='add'>+		return PTR_ERR(cur_inode_path);</div><div class='ctx'> </div><div class='ctx'> 	p = fs_path_alloc();</div><div class='ctx'> 	if (!p)</div><div class='hunk'>@@ -5064,17 +5318,12 @@ static int send_clone(struct send_ctx *sctx,</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	ret = get_cur_path(sctx, sctx-&gt;cur_ino, sctx-&gt;cur_inode_gen, p);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='ctx'> 	TLV_PUT_U64(sctx, BTRFS_SEND_A_FILE_OFFSET, offset);</div><div class='ctx'> 	TLV_PUT_U64(sctx, BTRFS_SEND_A_CLONE_LEN, len);</div><div class='del'>-	TLV_PUT_PATH(sctx, BTRFS_SEND_A_PATH, p);</div><div class='add'>+	TLV_PUT_PATH(sctx, BTRFS_SEND_A_PATH, cur_inode_path);</div><div class='ctx'> </div><div class='ctx'> 	if (clone_root-&gt;root == sctx-&gt;send_root) {</div><div class='del'>-		ret = get_inode_info(sctx-&gt;send_root, clone_root-&gt;ino, NULL,</div><div class='del'>-				&amp;gen, NULL, NULL, NULL, NULL);</div><div class='add'>+		ret = get_inode_gen(sctx-&gt;send_root, clone_root-&gt;ino, &amp;gen);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		ret = get_cur_path(sctx, clone_root-&gt;ino, gen, p);</div><div class='hunk'>@@ -5122,27 +5371,45 @@ static int send_update_extent(struct send_ctx *sctx,</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	struct fs_path *p;</div><div class='ctx'> </div><div class='del'>-	p = fs_path_alloc();</div><div class='del'>-	if (!p)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	p = get_cur_inode_path(sctx);</div><div class='add'>+	if (IS_ERR(p))</div><div class='add'>+		return PTR_ERR(p);</div><div class='ctx'> </div><div class='ctx'> 	ret = begin_cmd(sctx, BTRFS_SEND_C_UPDATE_EXTENT);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	ret = get_cur_path(sctx, sctx-&gt;cur_ino, sctx-&gt;cur_inode_gen, p);</div><div class='add'>+	TLV_PUT_PATH(sctx, BTRFS_SEND_A_PATH, p);</div><div class='add'>+	TLV_PUT_U64(sctx, BTRFS_SEND_A_FILE_OFFSET, offset);</div><div class='add'>+	TLV_PUT_U64(sctx, BTRFS_SEND_A_SIZE, len);</div><div class='add'>+</div><div class='add'>+	ret = send_cmd(sctx);</div><div class='add'>+</div><div class='add'>+tlv_put_failure:</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int send_fallocate(struct send_ctx *sctx, u32 mode, u64 offset, u64 len)</div><div class='add'>+{</div><div class='add'>+	struct fs_path *path;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	path = get_cur_inode_path(sctx);</div><div class='add'>+	if (IS_ERR(path))</div><div class='add'>+		return PTR_ERR(path);</div><div class='add'>+</div><div class='add'>+	ret = begin_cmd(sctx, BTRFS_SEND_C_FALLOCATE);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	TLV_PUT_PATH(sctx, BTRFS_SEND_A_PATH, p);</div><div class='add'>+	TLV_PUT_PATH(sctx, BTRFS_SEND_A_PATH, path);</div><div class='add'>+	TLV_PUT_U32(sctx, BTRFS_SEND_A_FALLOCATE_MODE, mode);</div><div class='ctx'> 	TLV_PUT_U64(sctx, BTRFS_SEND_A_FILE_OFFSET, offset);</div><div class='ctx'> 	TLV_PUT_U64(sctx, BTRFS_SEND_A_SIZE, len);</div><div class='ctx'> </div><div class='ctx'> 	ret = send_cmd(sctx);</div><div class='ctx'> </div><div class='ctx'> tlv_put_failure:</div><div class='del'>-out:</div><div class='del'>-	fs_path_free(p);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5154,6 +5421,14 @@ static int send_hole(struct send_ctx *sctx, u64 end)</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='add'>+	 * Starting with send stream v2 we have fallocate and can use it to</div><div class='add'>+	 * punch holes instead of sending writes full of zeroes.</div><div class='add'>+	 */</div><div class='add'>+	if (proto_cmd_ok(sctx, BTRFS_SEND_C_FALLOCATE))</div><div class='add'>+		return send_fallocate(sctx, FALLOC_FL_PUNCH_HOLE | FALLOC_FL_KEEP_SIZE,</div><div class='add'>+				      offset, end - offset);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='ctx'> 	 * A hole that starts at EOF or beyond it. Since we do not yet support</div><div class='ctx'> 	 * fallocate (for extent preallocation and hole punching), sending a</div><div class='ctx'> 	 * write of zeroes starting at EOF or beyond would later require issuing</div><div class='hunk'>@@ -5171,12 +5446,10 @@ static int send_hole(struct send_ctx *sctx, u64 end)</div><div class='ctx'> 	if (sctx-&gt;flags &amp; BTRFS_SEND_FLAG_NO_FILE_DATA)</div><div class='ctx'> 		return send_update_extent(sctx, offset, end - offset);</div><div class='ctx'> </div><div class='del'>-	p = fs_path_alloc();</div><div class='del'>-	if (!p)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	ret = get_cur_path(sctx, sctx-&gt;cur_ino, sctx-&gt;cur_inode_gen, p);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto tlv_put_failure;</div><div class='add'>+	p = get_cur_inode_path(sctx);</div><div class='add'>+	if (IS_ERR(p))</div><div class='add'>+		return PTR_ERR(p);</div><div class='add'>+</div><div class='ctx'> 	while (offset &lt; end) {</div><div class='ctx'> 		u64 len = min(end - offset, read_size);</div><div class='ctx'> </div><div class='hunk'>@@ -5197,20 +5470,233 @@ static int send_hole(struct send_ctx *sctx, u64 end)</div><div class='ctx'> 	}</div><div class='ctx'> 	sctx-&gt;cur_inode_next_write_offset = offset;</div><div class='ctx'> tlv_put_failure:</div><div class='del'>-	fs_path_free(p);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int send_extent_data(struct send_ctx *sctx,</div><div class='del'>-			    const u64 offset,</div><div class='del'>-			    const u64 len)</div><div class='add'>+static int send_encoded_inline_extent(struct send_ctx *sctx,</div><div class='add'>+				      struct btrfs_path *path, u64 offset,</div><div class='add'>+				      u64 len)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = sctx-&gt;send_root-&gt;fs_info;</div><div class='add'>+	struct fs_path *fspath;</div><div class='add'>+	struct extent_buffer *leaf = path-&gt;nodes[0];</div><div class='add'>+	struct btrfs_key key;</div><div class='add'>+	struct btrfs_file_extent_item *ei;</div><div class='add'>+	u64 ram_bytes;</div><div class='add'>+	size_t inline_size;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	fspath = get_cur_inode_path(sctx);</div><div class='add'>+	if (IS_ERR(fspath))</div><div class='add'>+		return PTR_ERR(fspath);</div><div class='add'>+</div><div class='add'>+	ret = begin_cmd(sctx, BTRFS_SEND_C_ENCODED_WRITE);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	btrfs_item_key_to_cpu(leaf, &amp;key, path-&gt;slots[0]);</div><div class='add'>+	ei = btrfs_item_ptr(leaf, path-&gt;slots[0], struct btrfs_file_extent_item);</div><div class='add'>+	ram_bytes = btrfs_file_extent_ram_bytes(leaf, ei);</div><div class='add'>+	inline_size = btrfs_file_extent_inline_item_len(leaf, path-&gt;slots[0]);</div><div class='add'>+</div><div class='add'>+	TLV_PUT_PATH(sctx, BTRFS_SEND_A_PATH, fspath);</div><div class='add'>+	TLV_PUT_U64(sctx, BTRFS_SEND_A_FILE_OFFSET, offset);</div><div class='add'>+	TLV_PUT_U64(sctx, BTRFS_SEND_A_UNENCODED_FILE_LEN,</div><div class='add'>+		    min(key.offset + ram_bytes - offset, len));</div><div class='add'>+	TLV_PUT_U64(sctx, BTRFS_SEND_A_UNENCODED_LEN, ram_bytes);</div><div class='add'>+	TLV_PUT_U64(sctx, BTRFS_SEND_A_UNENCODED_OFFSET, offset - key.offset);</div><div class='add'>+	ret = btrfs_encoded_io_compression_from_extent(fs_info,</div><div class='add'>+				btrfs_file_extent_compression(leaf, ei));</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+	TLV_PUT_U32(sctx, BTRFS_SEND_A_COMPRESSION, ret);</div><div class='add'>+</div><div class='add'>+	ret = put_data_header(sctx, inline_size);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+	read_extent_buffer(leaf, sctx-&gt;send_buf + sctx-&gt;send_size,</div><div class='add'>+			   btrfs_file_extent_inline_start(ei), inline_size);</div><div class='add'>+	sctx-&gt;send_size += inline_size;</div><div class='add'>+</div><div class='add'>+	ret = send_cmd(sctx);</div><div class='add'>+</div><div class='add'>+tlv_put_failure:</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int send_encoded_extent(struct send_ctx *sctx, struct btrfs_path *path,</div><div class='add'>+			       u64 offset, u64 len)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_root *root = sctx-&gt;send_root;</div><div class='add'>+	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+	struct btrfs_inode *inode;</div><div class='add'>+	struct fs_path *fspath;</div><div class='add'>+	struct extent_buffer *leaf = path-&gt;nodes[0];</div><div class='add'>+	struct btrfs_key key;</div><div class='add'>+	struct btrfs_file_extent_item *ei;</div><div class='add'>+	u64 disk_bytenr, disk_num_bytes;</div><div class='add'>+	u32 data_offset;</div><div class='add'>+	struct btrfs_cmd_header *hdr;</div><div class='add'>+	u32 crc;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	inode = btrfs_iget(sctx-&gt;cur_ino, root);</div><div class='add'>+	if (IS_ERR(inode))</div><div class='add'>+		return PTR_ERR(inode);</div><div class='add'>+</div><div class='add'>+	fspath = get_cur_inode_path(sctx);</div><div class='add'>+	if (IS_ERR(fspath)) {</div><div class='add'>+		ret = PTR_ERR(fspath);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = begin_cmd(sctx, BTRFS_SEND_C_ENCODED_WRITE);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	btrfs_item_key_to_cpu(leaf, &amp;key, path-&gt;slots[0]);</div><div class='add'>+	ei = btrfs_item_ptr(leaf, path-&gt;slots[0], struct btrfs_file_extent_item);</div><div class='add'>+	disk_bytenr = btrfs_file_extent_disk_bytenr(leaf, ei);</div><div class='add'>+	disk_num_bytes = btrfs_file_extent_disk_num_bytes(leaf, ei);</div><div class='add'>+</div><div class='add'>+	TLV_PUT_PATH(sctx, BTRFS_SEND_A_PATH, fspath);</div><div class='add'>+	TLV_PUT_U64(sctx, BTRFS_SEND_A_FILE_OFFSET, offset);</div><div class='add'>+	TLV_PUT_U64(sctx, BTRFS_SEND_A_UNENCODED_FILE_LEN,</div><div class='add'>+		    min(key.offset + btrfs_file_extent_num_bytes(leaf, ei) - offset,</div><div class='add'>+			len));</div><div class='add'>+	TLV_PUT_U64(sctx, BTRFS_SEND_A_UNENCODED_LEN,</div><div class='add'>+		    btrfs_file_extent_ram_bytes(leaf, ei));</div><div class='add'>+	TLV_PUT_U64(sctx, BTRFS_SEND_A_UNENCODED_OFFSET,</div><div class='add'>+		    offset - key.offset + btrfs_file_extent_offset(leaf, ei));</div><div class='add'>+	ret = btrfs_encoded_io_compression_from_extent(fs_info,</div><div class='add'>+				btrfs_file_extent_compression(leaf, ei));</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+	TLV_PUT_U32(sctx, BTRFS_SEND_A_COMPRESSION, ret);</div><div class='add'>+	TLV_PUT_U32(sctx, BTRFS_SEND_A_ENCRYPTION, 0);</div><div class='add'>+</div><div class='add'>+	ret = put_data_header(sctx, disk_num_bytes);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We want to do I/O directly into the send buffer, so get the next page</div><div class='add'>+	 * boundary in the send buffer. This means that there may be a gap</div><div class='add'>+	 * between the beginning of the command and the file data.</div><div class='add'>+	 */</div><div class='add'>+	data_offset = PAGE_ALIGN(sctx-&gt;send_size);</div><div class='add'>+	if (unlikely(data_offset &gt; sctx-&gt;send_max_size ||</div><div class='add'>+		     sctx-&gt;send_max_size - data_offset &lt; disk_num_bytes)) {</div><div class='add'>+		ret = -EOVERFLOW;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Note that send_buf is a mapping of send_buf_pages, so this is really</div><div class='add'>+	 * reading into send_buf.</div><div class='add'>+	 */</div><div class='add'>+	ret = btrfs_encoded_read_regular_fill_pages(inode,</div><div class='add'>+						    disk_bytenr, disk_num_bytes,</div><div class='add'>+						    sctx-&gt;send_buf_pages +</div><div class='add'>+						    (data_offset &gt;&gt; PAGE_SHIFT),</div><div class='add'>+						    NULL);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	hdr = (struct btrfs_cmd_header *)sctx-&gt;send_buf;</div><div class='add'>+	hdr-&gt;len = cpu_to_le32(sctx-&gt;send_size + disk_num_bytes - sizeof(*hdr));</div><div class='add'>+	hdr-&gt;crc = 0;</div><div class='add'>+	crc = crc32c(0, sctx-&gt;send_buf, sctx-&gt;send_size);</div><div class='add'>+	crc = crc32c(crc, sctx-&gt;send_buf + data_offset, disk_num_bytes);</div><div class='add'>+	hdr-&gt;crc = cpu_to_le32(crc);</div><div class='add'>+</div><div class='add'>+	ret = write_buf(sctx-&gt;send_filp, sctx-&gt;send_buf, sctx-&gt;send_size,</div><div class='add'>+			&amp;sctx-&gt;send_off);</div><div class='add'>+	if (!ret) {</div><div class='add'>+		ret = write_buf(sctx-&gt;send_filp, sctx-&gt;send_buf + data_offset,</div><div class='add'>+				disk_num_bytes, &amp;sctx-&gt;send_off);</div><div class='add'>+	}</div><div class='add'>+	sctx-&gt;send_size = 0;</div><div class='add'>+	sctx-&gt;put_data = false;</div><div class='add'>+</div><div class='add'>+tlv_put_failure:</div><div class='add'>+out:</div><div class='add'>+	iput(&amp;inode-&gt;vfs_inode);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int send_extent_data(struct send_ctx *sctx, struct btrfs_path *path,</div><div class='add'>+			    const u64 offset, const u64 len)</div><div class='add'>+{</div><div class='add'>+	const u64 end = offset + len;</div><div class='add'>+	struct extent_buffer *leaf = path-&gt;nodes[0];</div><div class='add'>+	struct btrfs_file_extent_item *ei;</div><div class='ctx'> 	u64 read_size = max_send_read_size(sctx);</div><div class='ctx'> 	u64 sent = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (sctx-&gt;flags &amp; BTRFS_SEND_FLAG_NO_FILE_DATA)</div><div class='ctx'> 		return send_update_extent(sctx, offset, len);</div><div class='ctx'> </div><div class='add'>+	ei = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='add'>+			    struct btrfs_file_extent_item);</div><div class='add'>+	if ((sctx-&gt;flags &amp; BTRFS_SEND_FLAG_COMPRESSED) &amp;&amp;</div><div class='add'>+	    btrfs_file_extent_compression(leaf, ei) != BTRFS_COMPRESS_NONE) {</div><div class='add'>+		bool is_inline = (btrfs_file_extent_type(leaf, ei) ==</div><div class='add'>+				  BTRFS_FILE_EXTENT_INLINE);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Send the compressed extent unless the compressed data is</div><div class='add'>+		 * larger than the decompressed data. This can happen if we're</div><div class='add'>+		 * not sending the entire extent, either because it has been</div><div class='add'>+		 * partially overwritten/truncated or because this is a part of</div><div class='add'>+		 * the extent that we couldn't clone in clone_range().</div><div class='add'>+		 */</div><div class='add'>+		if (is_inline &amp;&amp;</div><div class='add'>+		    btrfs_file_extent_inline_item_len(leaf,</div><div class='add'>+						      path-&gt;slots[0]) &lt;= len) {</div><div class='add'>+			return send_encoded_inline_extent(sctx, path, offset,</div><div class='add'>+							  len);</div><div class='add'>+		} else if (!is_inline &amp;&amp;</div><div class='add'>+			   btrfs_file_extent_disk_num_bytes(leaf, ei) &lt;= len) {</div><div class='add'>+			return send_encoded_extent(sctx, path, offset, len);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (sctx-&gt;cur_inode == NULL) {</div><div class='add'>+		struct btrfs_inode *btrfs_inode;</div><div class='add'>+		struct btrfs_root *root = sctx-&gt;send_root;</div><div class='add'>+</div><div class='add'>+		btrfs_inode = btrfs_iget(sctx-&gt;cur_ino, root);</div><div class='add'>+		if (IS_ERR(btrfs_inode))</div><div class='add'>+			return PTR_ERR(btrfs_inode);</div><div class='add'>+</div><div class='add'>+		sctx-&gt;cur_inode = &amp;btrfs_inode-&gt;vfs_inode;</div><div class='add'>+		memset(&amp;sctx-&gt;ra, 0, sizeof(struct file_ra_state));</div><div class='add'>+		file_ra_state_init(&amp;sctx-&gt;ra, sctx-&gt;cur_inode-&gt;i_mapping);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * It's very likely there are no pages from this inode in the page</div><div class='add'>+		 * cache, so after reading extents and sending their data, we clean</div><div class='add'>+		 * the page cache to avoid trashing the page cache (adding pressure</div><div class='add'>+		 * to the page cache and forcing eviction of other data more useful</div><div class='add'>+		 * for applications).</div><div class='add'>+		 *</div><div class='add'>+		 * We decide if we should clean the page cache simply by checking</div><div class='add'>+		 * if the inode's mapping nrpages is 0 when we first open it, and</div><div class='add'>+		 * not by using something like filemap_range_has_page() before</div><div class='add'>+		 * reading an extent because when we ask the readahead code to</div><div class='add'>+		 * read a given file range, it may (and almost always does) read</div><div class='add'>+		 * pages from beyond that range (see the documentation for</div><div class='add'>+		 * page_cache_sync_readahead()), so it would not be reliable,</div><div class='add'>+		 * because after reading the first extent future calls to</div><div class='add'>+		 * filemap_range_has_page() would return true because the readahead</div><div class='add'>+		 * on the previous extent resulted in reading pages of the current</div><div class='add'>+		 * extent as well.</div><div class='add'>+		 */</div><div class='add'>+		sctx-&gt;clean_page_cache = (sctx-&gt;cur_inode-&gt;i_mapping-&gt;nrpages == 0);</div><div class='add'>+		sctx-&gt;page_cache_clear_start = round_down(offset, PAGE_SIZE);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	while (sent &lt; len) {</div><div class='ctx'> 		u64 size = min(len - sent, read_size);</div><div class='ctx'> 		int ret;</div><div class='hunk'>@@ -5220,6 +5706,37 @@ static int send_extent_data(struct send_ctx *sctx,</div><div class='ctx'> 			return ret;</div><div class='ctx'> 		sent += size;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	if (sctx-&gt;clean_page_cache &amp;&amp; PAGE_ALIGNED(end)) {</div><div class='add'>+		/*</div><div class='add'>+		 * Always operate only on ranges that are a multiple of the page</div><div class='add'>+		 * size. This is not only to prevent zeroing parts of a page in</div><div class='add'>+		 * the case of subpage sector size, but also to guarantee we evict</div><div class='add'>+		 * pages, as passing a range that is smaller than page size does</div><div class='add'>+		 * not evict the respective page (only zeroes part of its content).</div><div class='add'>+		 *</div><div class='add'>+		 * Always start from the end offset of the last range cleared.</div><div class='add'>+		 * This is because the readahead code may (and very often does)</div><div class='add'>+		 * reads pages beyond the range we request for readahead. So if</div><div class='add'>+		 * we have an extent layout like this:</div><div class='add'>+		 *</div><div class='add'>+		 *            [ extent A ] [ extent B ] [ extent C ]</div><div class='add'>+		 *</div><div class='add'>+		 * When we ask page_cache_sync_readahead() to read extent A, it</div><div class='add'>+		 * may also trigger reads for pages of extent B. If we are doing</div><div class='add'>+		 * an incremental send and extent B has not changed between the</div><div class='add'>+		 * parent and send snapshots, some or all of its pages may end</div><div class='add'>+		 * up being read and placed in the page cache. So when truncating</div><div class='add'>+		 * the page cache we always start from the end offset of the</div><div class='add'>+		 * previously processed extent up to the end of the current</div><div class='add'>+		 * extent.</div><div class='add'>+		 */</div><div class='add'>+		truncate_inode_pages_range(&amp;sctx-&gt;cur_inode-&gt;i_data,</div><div class='add'>+					   sctx-&gt;page_cache_clear_start,</div><div class='add'>+					   end - 1);</div><div class='add'>+		sctx-&gt;page_cache_clear_start = end;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5232,12 +5749,11 @@ static int send_extent_data(struct send_ctx *sctx,</div><div class='ctx'>  */</div><div class='ctx'> static int send_capabilities(struct send_ctx *sctx)</div><div class='ctx'> {</div><div class='del'>-	struct fs_path *fspath = NULL;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_dir_item *di;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	unsigned long data_ptr;</div><div class='del'>-	char *buf = NULL;</div><div class='add'>+	char AUTO_KFREE(buf);</div><div class='ctx'> 	int buf_len;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -5249,48 +5765,34 @@ static int send_capabilities(struct send_ctx *sctx)</div><div class='ctx'> 				XATTR_NAME_CAPS, strlen(XATTR_NAME_CAPS), 0);</div><div class='ctx'> 	if (!di) {</div><div class='ctx'> 		/* There is no xattr for this inode */</div><div class='del'>-		goto out;</div><div class='add'>+		return 0;</div><div class='ctx'> 	} else if (IS_ERR(di)) {</div><div class='del'>-		ret = PTR_ERR(di);</div><div class='del'>-		goto out;</div><div class='add'>+		return PTR_ERR(di);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	buf_len = btrfs_dir_data_len(leaf, di);</div><div class='ctx'> </div><div class='del'>-	fspath = fs_path_alloc();</div><div class='ctx'> 	buf = kmalloc(buf_len, GFP_KERNEL);</div><div class='del'>-	if (!fspath || !buf) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = get_cur_path(sctx, sctx-&gt;cur_ino, sctx-&gt;cur_inode_gen, fspath);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+	if (!buf)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	data_ptr = (unsigned long)(di + 1) + btrfs_dir_name_len(leaf, di);</div><div class='ctx'> 	read_extent_buffer(leaf, buf, data_ptr, buf_len);</div><div class='ctx'> </div><div class='del'>-	ret = send_set_xattr(sctx, fspath, XATTR_NAME_CAPS,</div><div class='add'>+	ret = send_set_xattr(sctx, XATTR_NAME_CAPS,</div><div class='ctx'> 			strlen(XATTR_NAME_CAPS), buf, buf_len);</div><div class='del'>-out:</div><div class='del'>-	kfree(buf);</div><div class='del'>-	fs_path_free(fspath);</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int clone_range(struct send_ctx *sctx,</div><div class='del'>-		       struct clone_root *clone_root,</div><div class='del'>-		       const u64 disk_byte,</div><div class='del'>-		       u64 data_offset,</div><div class='del'>-		       u64 offset,</div><div class='del'>-		       u64 len)</div><div class='add'>+static int clone_range(struct send_ctx *sctx, struct btrfs_path *dst_path,</div><div class='add'>+		       struct clone_root *clone_root, const u64 disk_byte,</div><div class='add'>+		       u64 data_offset, u64 offset, u64 len)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	int ret;</div><div class='add'>+	struct btrfs_inode_info info;</div><div class='ctx'> 	u64 clone_src_i_size = 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -5310,7 +5812,7 @@ static int clone_range(struct send_ctx *sctx,</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (clone_root-&gt;offset == 0 &amp;&amp;</div><div class='ctx'> 	    len == sctx-&gt;send_root-&gt;fs_info-&gt;sectorsize)</div><div class='del'>-		return send_extent_data(sctx, offset, len);</div><div class='add'>+		return send_extent_data(sctx, dst_path, offset, len);</div><div class='ctx'> </div><div class='ctx'> 	path = alloc_path_for_send();</div><div class='ctx'> 	if (!path)</div><div class='hunk'>@@ -5320,11 +5822,11 @@ static int clone_range(struct send_ctx *sctx,</div><div class='ctx'> 	 * There are inodes that have extents that lie behind its i_size. Don't</div><div class='ctx'> 	 * accept clones from these extents.</div><div class='ctx'> 	 */</div><div class='del'>-	ret = __get_inode_info(clone_root-&gt;root, path, clone_root-&gt;ino,</div><div class='del'>-			       &amp;clone_src_i_size, NULL, NULL, NULL, NULL, NULL);</div><div class='add'>+	ret = get_inode_info(clone_root-&gt;root, clone_root-&gt;ino, &amp;info);</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='add'>+	clone_src_i_size = info.size;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We can't send a clone operation for the entire range if we find</div><div class='hunk'>@@ -5353,7 +5855,7 @@ static int clone_range(struct send_ctx *sctx,</div><div class='ctx'> 	key.offset = clone_root-&gt;offset;</div><div class='ctx'> 	ret = btrfs_search_slot(NULL, clone_root-&gt;root, &amp;key, path, 0, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> 	if (ret &gt; 0 &amp;&amp; path-&gt;slots[0] &gt; 0) {</div><div class='ctx'> 		btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, path-&gt;slots[0] - 1);</div><div class='ctx'> 		if (key.objectid == clone_root-&gt;ino &amp;&amp;</div><div class='hunk'>@@ -5369,11 +5871,12 @@ static int clone_range(struct send_ctx *sctx,</div><div class='ctx'> 		u64 ext_len;</div><div class='ctx'> 		u64 clone_len;</div><div class='ctx'> 		u64 clone_data_offset;</div><div class='add'>+		bool crossed_src_i_size = false;</div><div class='ctx'> </div><div class='ctx'> 		if (slot &gt;= btrfs_header_nritems(leaf)) {</div><div class='ctx'> 			ret = btrfs_next_leaf(clone_root-&gt;root, path);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='del'>-				goto out;</div><div class='add'>+				return ret;</div><div class='ctx'> 			else if (ret &gt; 0)</div><div class='ctx'> 				break;</div><div class='ctx'> 			continue;</div><div class='hunk'>@@ -5407,9 +5910,10 @@ static int clone_range(struct send_ctx *sctx,</div><div class='ctx'> </div><div class='ctx'> 			if (hole_len &gt; len)</div><div class='ctx'> 				hole_len = len;</div><div class='del'>-			ret = send_extent_data(sctx, offset, hole_len);</div><div class='add'>+			ret = send_extent_data(sctx, dst_path, offset,</div><div class='add'>+					       hole_len);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='del'>-				goto out;</div><div class='add'>+				return ret;</div><div class='ctx'> </div><div class='ctx'> 			len -= hole_len;</div><div class='ctx'> 			if (len == 0)</div><div class='hunk'>@@ -5425,8 +5929,10 @@ static int clone_range(struct send_ctx *sctx,</div><div class='ctx'> 		if (key.offset &gt;= clone_src_i_size)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		if (key.offset + ext_len &gt; clone_src_i_size)</div><div class='add'>+		if (key.offset + ext_len &gt; clone_src_i_size) {</div><div class='ctx'> 			ext_len = clone_src_i_size - key.offset;</div><div class='add'>+			crossed_src_i_size = true;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		clone_data_offset = btrfs_file_extent_offset(leaf, ei);</div><div class='ctx'> 		if (btrfs_file_extent_disk_bytenr(leaf, ei) == disk_byte) {</div><div class='hunk'>@@ -5478,20 +5984,41 @@ static int clone_range(struct send_ctx *sctx,</div><div class='ctx'> 					ret = send_clone(sctx, offset, slen,</div><div class='ctx'> 							 clone_root);</div><div class='ctx'> 					if (ret &lt; 0)</div><div class='del'>-						goto out;</div><div class='add'>+						return ret;</div><div class='ctx'> 				}</div><div class='del'>-				ret = send_extent_data(sctx, offset + slen,</div><div class='add'>+				ret = send_extent_data(sctx, dst_path,</div><div class='add'>+						       offset + slen,</div><div class='ctx'> 						       clone_len - slen);</div><div class='ctx'> 			} else {</div><div class='ctx'> 				ret = send_clone(sctx, offset, clone_len,</div><div class='ctx'> 						 clone_root);</div><div class='ctx'> 			}</div><div class='add'>+		} else if (crossed_src_i_size &amp;&amp; clone_len &lt; len) {</div><div class='add'>+			/*</div><div class='add'>+			 * If we are at i_size of the clone source inode and we</div><div class='add'>+			 * can not clone from it, terminate the loop. This is</div><div class='add'>+			 * to avoid sending two write operations, one with a</div><div class='add'>+			 * length matching clone_len and the final one after</div><div class='add'>+			 * this loop with a length of len - clone_len.</div><div class='add'>+			 *</div><div class='add'>+			 * When using encoded writes (BTRFS_SEND_FLAG_COMPRESSED</div><div class='add'>+			 * was passed to the send ioctl), this helps avoid</div><div class='add'>+			 * sending an encoded write for an offset that is not</div><div class='add'>+			 * sector size aligned, in case the i_size of the source</div><div class='add'>+			 * inode is not sector size aligned. That will make the</div><div class='add'>+			 * receiver fallback to decompression of the data and</div><div class='add'>+			 * writing it using regular buffered IO, therefore while</div><div class='add'>+			 * not incorrect, it's not optimal due decompression and</div><div class='add'>+			 * possible re-compression at the receiver.</div><div class='add'>+			 */</div><div class='add'>+			break;</div><div class='ctx'> 		} else {</div><div class='del'>-			ret = send_extent_data(sctx, offset, clone_len);</div><div class='add'>+			ret = send_extent_data(sctx, dst_path, offset,</div><div class='add'>+					       clone_len);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> </div><div class='ctx'> 		len -= clone_len;</div><div class='ctx'> 		if (len == 0)</div><div class='hunk'>@@ -5519,11 +6046,9 @@ next:</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (len &gt; 0)</div><div class='del'>-		ret = send_extent_data(sctx, offset, len);</div><div class='add'>+		ret = send_extent_data(sctx, dst_path, offset, len);</div><div class='ctx'> 	else</div><div class='ctx'> 		ret = 0;</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5535,26 +6060,73 @@ static int send_write_or_clone(struct send_ctx *sctx,</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	u64 offset = key-&gt;offset;</div><div class='ctx'> 	u64 end;</div><div class='del'>-	u64 bs = sctx-&gt;send_root-&gt;fs_info-&gt;sb-&gt;s_blocksize;</div><div class='add'>+	u64 bs = sctx-&gt;send_root-&gt;fs_info-&gt;sectorsize;</div><div class='add'>+	struct btrfs_file_extent_item *ei;</div><div class='add'>+	u64 disk_byte;</div><div class='add'>+	u64 data_offset;</div><div class='add'>+	u64 num_bytes;</div><div class='add'>+	struct btrfs_inode_info info = { 0 };</div><div class='ctx'> </div><div class='ctx'> 	end = min_t(u64, btrfs_file_extent_end(path), sctx-&gt;cur_inode_size);</div><div class='ctx'> 	if (offset &gt;= end)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	if (clone_root &amp;&amp; IS_ALIGNED(end, bs)) {</div><div class='del'>-		struct btrfs_file_extent_item *ei;</div><div class='del'>-		u64 disk_byte;</div><div class='del'>-		u64 data_offset;</div><div class='add'>+	num_bytes = end - offset;</div><div class='ctx'> </div><div class='del'>-		ei = btrfs_item_ptr(path-&gt;nodes[0], path-&gt;slots[0],</div><div class='del'>-				    struct btrfs_file_extent_item);</div><div class='del'>-		disk_byte = btrfs_file_extent_disk_bytenr(path-&gt;nodes[0], ei);</div><div class='del'>-		data_offset = btrfs_file_extent_offset(path-&gt;nodes[0], ei);</div><div class='del'>-		ret = clone_range(sctx, clone_root, disk_byte, data_offset,</div><div class='del'>-				  offset, end - offset);</div><div class='del'>-	} else {</div><div class='del'>-		ret = send_extent_data(sctx, offset, end - offset);</div><div class='add'>+	if (!clone_root)</div><div class='add'>+		goto write_data;</div><div class='add'>+</div><div class='add'>+	if (IS_ALIGNED(end, bs))</div><div class='add'>+		goto clone_data;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If the extent end is not aligned, we can clone if the extent ends at</div><div class='add'>+	 * the i_size of the inode and the clone range ends at the i_size of the</div><div class='add'>+	 * source inode, otherwise the clone operation fails with -EINVAL.</div><div class='add'>+	 */</div><div class='add'>+	if (end != sctx-&gt;cur_inode_size)</div><div class='add'>+		goto write_data;</div><div class='add'>+</div><div class='add'>+	ret = get_inode_info(clone_root-&gt;root, clone_root-&gt;ino, &amp;info);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	if (clone_root-&gt;offset + num_bytes == info.size) {</div><div class='add'>+		/*</div><div class='add'>+		 * The final size of our file matches the end offset, but it may</div><div class='add'>+		 * be that its current size is larger, so we have to truncate it</div><div class='add'>+		 * to any value between the start offset of the range and the</div><div class='add'>+		 * final i_size, otherwise the clone operation is invalid</div><div class='add'>+		 * because it's unaligned and it ends before the current EOF.</div><div class='add'>+		 * We do this truncate to the final i_size when we finish</div><div class='add'>+		 * processing the inode, but it's too late by then. And here we</div><div class='add'>+		 * truncate to the start offset of the range because it's always</div><div class='add'>+		 * sector size aligned while if it were the final i_size it</div><div class='add'>+		 * would result in dirtying part of a page, filling part of a</div><div class='add'>+		 * page with zeroes and then having the clone operation at the</div><div class='add'>+		 * receiver trigger IO and wait for it due to the dirty page.</div><div class='add'>+		 */</div><div class='add'>+		if (sctx-&gt;parent_root != NULL) {</div><div class='add'>+			ret = send_truncate(sctx, sctx-&gt;cur_ino,</div><div class='add'>+					    sctx-&gt;cur_inode_gen, offset);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				return ret;</div><div class='add'>+		}</div><div class='add'>+		goto clone_data;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+write_data:</div><div class='add'>+	ret = send_extent_data(sctx, path, offset, num_bytes);</div><div class='add'>+	sctx-&gt;cur_inode_next_write_offset = end;</div><div class='add'>+	return ret;</div><div class='add'>+</div><div class='add'>+clone_data:</div><div class='add'>+	ei = btrfs_item_ptr(path-&gt;nodes[0], path-&gt;slots[0],</div><div class='add'>+			    struct btrfs_file_extent_item);</div><div class='add'>+	disk_byte = btrfs_file_extent_disk_bytenr(path-&gt;nodes[0], ei);</div><div class='add'>+	data_offset = btrfs_file_extent_offset(path-&gt;nodes[0], ei);</div><div class='add'>+	ret = clone_range(sctx, path, clone_root, disk_byte, data_offset, offset,</div><div class='add'>+			  num_bytes);</div><div class='ctx'> 	sctx-&gt;cur_inode_next_write_offset = end;</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -5565,7 +6137,7 @@ static int is_extent_unchanged(struct send_ctx *sctx,</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='del'>-	struct btrfs_path *path = NULL;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='ctx'> 	int slot;</div><div class='ctx'> 	struct btrfs_key found_key;</div><div class='hunk'>@@ -5591,10 +6163,9 @@ static int is_extent_unchanged(struct send_ctx *sctx,</div><div class='ctx'> 	ei = btrfs_item_ptr(eb, slot, struct btrfs_file_extent_item);</div><div class='ctx'> 	left_type = btrfs_file_extent_type(eb, ei);</div><div class='ctx'> </div><div class='del'>-	if (left_type != BTRFS_FILE_EXTENT_REG) {</div><div class='del'>-		ret = 0;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (left_type != BTRFS_FILE_EXTENT_REG)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='ctx'> 	left_disknr = btrfs_file_extent_disk_bytenr(eb, ei);</div><div class='ctx'> 	left_len = btrfs_file_extent_num_bytes(eb, ei);</div><div class='ctx'> 	left_offset = btrfs_file_extent_offset(eb, ei);</div><div class='hunk'>@@ -5626,11 +6197,9 @@ static int is_extent_unchanged(struct send_ctx *sctx,</div><div class='ctx'> 	key.offset = ekey-&gt;offset;</div><div class='ctx'> 	ret = btrfs_search_slot_for_read(sctx-&gt;parent_root, &amp;key, path, 0, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-	if (ret) {</div><div class='del'>-		ret = 0;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+		return ret;</div><div class='add'>+	if (ret)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Handle special case where the right side has no extents at all.</div><div class='hunk'>@@ -5639,11 +6208,9 @@ static int is_extent_unchanged(struct send_ctx *sctx,</div><div class='ctx'> 	slot = path-&gt;slots[0];</div><div class='ctx'> 	btrfs_item_key_to_cpu(eb, &amp;found_key, slot);</div><div class='ctx'> 	if (found_key.objectid != key.objectid ||</div><div class='del'>-	    found_key.type != key.type) {</div><div class='add'>+	    found_key.type != key.type)</div><div class='ctx'> 		/* If we're a hole then just pretend nothing changed */</div><div class='del'>-		ret = (left_disknr) ? 0 : 1;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+		return (left_disknr ? 0 : 1);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We're now on 2a, 2b or 7.</div><div class='hunk'>@@ -5653,10 +6220,8 @@ static int is_extent_unchanged(struct send_ctx *sctx,</div><div class='ctx'> 		ei = btrfs_item_ptr(eb, slot, struct btrfs_file_extent_item);</div><div class='ctx'> 		right_type = btrfs_file_extent_type(eb, ei);</div><div class='ctx'> 		if (right_type != BTRFS_FILE_EXTENT_REG &amp;&amp;</div><div class='del'>-		    right_type != BTRFS_FILE_EXTENT_INLINE) {</div><div class='del'>-			ret = 0;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+		    right_type != BTRFS_FILE_EXTENT_INLINE)</div><div class='add'>+			return 0;</div><div class='ctx'> </div><div class='ctx'> 		if (right_type == BTRFS_FILE_EXTENT_INLINE) {</div><div class='ctx'> 			right_len = btrfs_file_extent_ram_bytes(eb, ei);</div><div class='hunk'>@@ -5669,11 +6234,9 @@ static int is_extent_unchanged(struct send_ctx *sctx,</div><div class='ctx'> 		 * Are we at extent 8? If yes, we know the extent is changed.</div><div class='ctx'> 		 * This may only happen on the first iteration.</div><div class='ctx'> 		 */</div><div class='del'>-		if (found_key.offset + right_len &lt;= ekey-&gt;offset) {</div><div class='add'>+		if (found_key.offset + right_len &lt;= ekey-&gt;offset)</div><div class='ctx'> 			/* If we're a hole just pretend nothing changed */</div><div class='del'>-			ret = (left_disknr) ? 0 : 1;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+			return (left_disknr ? 0 : 1);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We just wanted to see if when we have an inline extent, what</div><div class='hunk'>@@ -5683,10 +6246,8 @@ static int is_extent_unchanged(struct send_ctx *sctx,</div><div class='ctx'> 		 * compressed extent representing data with a size matching</div><div class='ctx'> 		 * the page size (currently the same as sector size).</div><div class='ctx'> 		 */</div><div class='del'>-		if (right_type == BTRFS_FILE_EXTENT_INLINE) {</div><div class='del'>-			ret = 0;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+		if (right_type == BTRFS_FILE_EXTENT_INLINE)</div><div class='add'>+			return 0;</div><div class='ctx'> </div><div class='ctx'> 		right_disknr = btrfs_file_extent_disk_bytenr(eb, ei);</div><div class='ctx'> 		right_offset = btrfs_file_extent_offset(eb, ei);</div><div class='hunk'>@@ -5706,17 +6267,15 @@ static int is_extent_unchanged(struct send_ctx *sctx,</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (left_disknr != right_disknr ||</div><div class='ctx'> 		    left_offset_fixed != right_offset ||</div><div class='del'>-		    left_gen != right_gen) {</div><div class='del'>-			ret = 0;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+		    left_gen != right_gen)</div><div class='add'>+			return 0;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Go to the next extent.</div><div class='ctx'> 		 */</div><div class='ctx'> 		ret = btrfs_next_item(sctx-&gt;parent_root, path);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 		if (!ret) {</div><div class='ctx'> 			eb = path-&gt;nodes[0];</div><div class='ctx'> 			slot = path-&gt;slots[0];</div><div class='hunk'>@@ -5727,10 +6286,9 @@ static int is_extent_unchanged(struct send_ctx *sctx,</div><div class='ctx'> 			key.offset += right_len;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-		if (found_key.offset != key.offset + right_len) {</div><div class='del'>-			ret = 0;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+		if (found_key.offset != key.offset + right_len)</div><div class='add'>+			return 0;</div><div class='add'>+</div><div class='ctx'> 		key = found_key;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -5743,15 +6301,12 @@ static int is_extent_unchanged(struct send_ctx *sctx,</div><div class='ctx'> 	else</div><div class='ctx'> 		ret = 0;</div><div class='ctx'> </div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int get_last_extent(struct send_ctx *sctx, u64 offset)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_root *root = sctx-&gt;send_root;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -5767,15 +6322,13 @@ static int get_last_extent(struct send_ctx *sctx, u64 offset)</div><div class='ctx'> 	key.offset = offset;</div><div class='ctx'> 	ret = btrfs_search_slot_for_read(root, &amp;key, path, 0, 1);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> 	ret = 0;</div><div class='ctx'> 	btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, path-&gt;slots[0]);</div><div class='ctx'> 	if (key.objectid != sctx-&gt;cur_ino || key.type != BTRFS_EXTENT_DATA_KEY)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	sctx-&gt;cur_inode_last_extent = btrfs_file_extent_end(path);</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5783,7 +6336,7 @@ static int range_is_hole_in_parent(struct send_ctx *sctx,</div><div class='ctx'> 				   const u64 start,</div><div class='ctx'> 				   const u64 end)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_root *root = sctx-&gt;parent_root;</div><div class='ctx'> 	u64 search_start = start;</div><div class='hunk'>@@ -5798,7 +6351,7 @@ static int range_is_hole_in_parent(struct send_ctx *sctx,</div><div class='ctx'> 	key.offset = search_start;</div><div class='ctx'> 	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> 	if (ret &gt; 0 &amp;&amp; path-&gt;slots[0] &gt; 0)</div><div class='ctx'> 		path-&gt;slots[0]--;</div><div class='ctx'> </div><div class='hunk'>@@ -5811,8 +6364,8 @@ static int range_is_hole_in_parent(struct send_ctx *sctx,</div><div class='ctx'> 		if (slot &gt;= btrfs_header_nritems(leaf)) {</div><div class='ctx'> 			ret = btrfs_next_leaf(root, path);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='del'>-				goto out;</div><div class='del'>-			else if (ret &gt; 0)</div><div class='add'>+				return ret;</div><div class='add'>+			if (ret &gt; 0)</div><div class='ctx'> 				break;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -5834,15 +6387,11 @@ static int range_is_hole_in_parent(struct send_ctx *sctx,</div><div class='ctx'> 			search_start = extent_end;</div><div class='ctx'> 			goto next;</div><div class='ctx'> 		}</div><div class='del'>-		ret = 0;</div><div class='del'>-		goto out;</div><div class='add'>+		return 0;</div><div class='ctx'> next:</div><div class='ctx'> 		path-&gt;slots[0]++;</div><div class='ctx'> 	}</div><div class='del'>-	ret = 1;</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	return 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int maybe_send_hole(struct send_ctx *sctx, struct btrfs_path *path,</div><div class='hunk'>@@ -5853,21 +6402,18 @@ static int maybe_send_hole(struct send_ctx *sctx, struct btrfs_path *path,</div><div class='ctx'> 	if (sctx-&gt;cur_ino != key-&gt;objectid || !need_send_hole(sctx))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	if (sctx-&gt;cur_inode_last_extent == (u64)-1) {</div><div class='del'>-		ret = get_last_extent(sctx, key-&gt;offset - 1);</div><div class='del'>-		if (ret)</div><div class='del'>-			return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (path-&gt;slots[0] == 0 &amp;&amp;</div><div class='del'>-	    sctx-&gt;cur_inode_last_extent &lt; key-&gt;offset) {</div><div class='del'>-		/*</div><div class='del'>-		 * We might have skipped entire leafs that contained only</div><div class='del'>-		 * file extent items for our current inode. These leafs have</div><div class='del'>-		 * a generation number smaller (older) than the one in the</div><div class='del'>-		 * current leaf and the leaf our last extent came from, and</div><div class='del'>-		 * are located between these 2 leafs.</div><div class='del'>-		 */</div><div class='add'>+	/*</div><div class='add'>+	 * Get last extent's end offset (exclusive) if we haven't determined it</div><div class='add'>+	 * yet (we're processing the first file extent item that is new), or if</div><div class='add'>+	 * we're at the first slot of a leaf and the last extent's end is less</div><div class='add'>+	 * than the current extent's offset, because we might have skipped</div><div class='add'>+	 * entire leaves that contained only file extent items for our current</div><div class='add'>+	 * inode. These leaves have a generation number smaller (older) than the</div><div class='add'>+	 * one in the current leaf and the leaf our last extent came from, and</div><div class='add'>+	 * are located between these 2 leaves.</div><div class='add'>+	 */</div><div class='add'>+	if ((sctx-&gt;cur_inode_last_extent == (u64)-1) ||</div><div class='add'>+	    (path-&gt;slots[0] == 0 &amp;&amp; sctx-&gt;cur_inode_last_extent &lt; key-&gt;offset)) {</div><div class='ctx'> 		ret = get_last_extent(sctx, key-&gt;offset - 1);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='hunk'>@@ -5950,13 +6496,12 @@ out:</div><div class='ctx'> </div><div class='ctx'> static int process_all_extents(struct send_ctx *sctx)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='add'>+	int ret = 0;</div><div class='add'>+	int iter_ret = 0;</div><div class='ctx'> 	struct btrfs_root *root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_key found_key;</div><div class='del'>-	struct extent_buffer *eb;</div><div class='del'>-	int slot;</div><div class='ctx'> </div><div class='ctx'> 	root = sctx-&gt;send_root;</div><div class='ctx'> 	path = alloc_path_for_send();</div><div class='hunk'>@@ -5966,46 +6511,25 @@ static int process_all_extents(struct send_ctx *sctx)</div><div class='ctx'> 	key.objectid = sctx-&gt;cmp_key-&gt;objectid;</div><div class='ctx'> 	key.type = BTRFS_EXTENT_DATA_KEY;</div><div class='ctx'> 	key.offset = 0;</div><div class='del'>-	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	while (1) {</div><div class='del'>-		eb = path-&gt;nodes[0];</div><div class='del'>-		slot = path-&gt;slots[0];</div><div class='del'>-</div><div class='del'>-		if (slot &gt;= btrfs_header_nritems(eb)) {</div><div class='del'>-			ret = btrfs_next_leaf(root, path);</div><div class='del'>-			if (ret &lt; 0) {</div><div class='del'>-				goto out;</div><div class='del'>-			} else if (ret &gt; 0) {</div><div class='del'>-				ret = 0;</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		btrfs_item_key_to_cpu(eb, &amp;found_key, slot);</div><div class='del'>-</div><div class='add'>+	btrfs_for_each_slot(root, &amp;key, &amp;found_key, path, iter_ret) {</div><div class='ctx'> 		if (found_key.objectid != key.objectid ||</div><div class='ctx'> 		    found_key.type != key.type) {</div><div class='ctx'> 			ret = 0;</div><div class='del'>-			goto out;</div><div class='add'>+			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		ret = process_extent(sctx, path, &amp;found_key);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='del'>-</div><div class='del'>-		path-&gt;slots[0]++;</div><div class='add'>+			break;</div><div class='ctx'> 	}</div><div class='add'>+	/* Catch error found during iteration */</div><div class='add'>+	if (iter_ret &lt; 0)</div><div class='add'>+		ret = iter_ret;</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int process_recorded_refs_if_needed(struct send_ctx *sctx, int at_end,</div><div class='add'>+static int process_recorded_refs_if_needed(struct send_ctx *sctx, bool at_end,</div><div class='ctx'> 					   int *pending_move,</div><div class='ctx'> 					   int *refs_processed)</div><div class='ctx'> {</div><div class='hunk'>@@ -6028,17 +6552,21 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int finish_inode_if_needed(struct send_ctx *sctx, int at_end)</div><div class='add'>+static int finish_inode_if_needed(struct send_ctx *sctx, bool at_end)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='add'>+	struct btrfs_inode_info info;</div><div class='ctx'> 	u64 left_mode;</div><div class='ctx'> 	u64 left_uid;</div><div class='ctx'> 	u64 left_gid;</div><div class='add'>+	u64 left_fileattr;</div><div class='ctx'> 	u64 right_mode;</div><div class='ctx'> 	u64 right_uid;</div><div class='ctx'> 	u64 right_gid;</div><div class='add'>+	u64 right_fileattr;</div><div class='ctx'> 	int need_chmod = 0;</div><div class='ctx'> 	int need_chown = 0;</div><div class='add'>+	bool need_fileattr = false;</div><div class='ctx'> 	int need_truncate = 1;</div><div class='ctx'> 	int pending_move = 0;</div><div class='ctx'> 	int refs_processed = 0;</div><div class='hunk'>@@ -6070,11 +6598,13 @@ static int finish_inode_if_needed(struct send_ctx *sctx, int at_end)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	if (!at_end &amp;&amp; sctx-&gt;cmp_key-&gt;objectid == sctx-&gt;cur_ino)</div><div class='ctx'> 		goto out;</div><div class='del'>-</div><div class='del'>-	ret = get_inode_info(sctx-&gt;send_root, sctx-&gt;cur_ino, NULL, NULL,</div><div class='del'>-			&amp;left_mode, &amp;left_uid, &amp;left_gid, NULL);</div><div class='add'>+	ret = get_inode_info(sctx-&gt;send_root, sctx-&gt;cur_ino, &amp;info);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='add'>+	left_mode = info.mode;</div><div class='add'>+	left_uid = info.uid;</div><div class='add'>+	left_gid = info.gid;</div><div class='add'>+	left_fileattr = info.fileattr;</div><div class='ctx'> </div><div class='ctx'> 	if (!sctx-&gt;parent_root || sctx-&gt;cur_inode_new) {</div><div class='ctx'> 		need_chown = 1;</div><div class='hunk'>@@ -6085,16 +6615,21 @@ static int finish_inode_if_needed(struct send_ctx *sctx, int at_end)</div><div class='ctx'> 	} else {</div><div class='ctx'> 		u64 old_size;</div><div class='ctx'> </div><div class='del'>-		ret = get_inode_info(sctx-&gt;parent_root, sctx-&gt;cur_ino,</div><div class='del'>-				&amp;old_size, NULL, &amp;right_mode, &amp;right_uid,</div><div class='del'>-				&amp;right_gid, NULL);</div><div class='add'>+		ret = get_inode_info(sctx-&gt;parent_root, sctx-&gt;cur_ino, &amp;info);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='add'>+		old_size = info.size;</div><div class='add'>+		right_mode = info.mode;</div><div class='add'>+		right_uid = info.uid;</div><div class='add'>+		right_gid = info.gid;</div><div class='add'>+		right_fileattr = info.fileattr;</div><div class='ctx'> </div><div class='ctx'> 		if (left_uid != right_uid || left_gid != right_gid)</div><div class='ctx'> 			need_chown = 1;</div><div class='ctx'> 		if (!S_ISLNK(sctx-&gt;cur_inode_mode) &amp;&amp; left_mode != right_mode)</div><div class='ctx'> 			need_chmod = 1;</div><div class='add'>+		if (!S_ISLNK(sctx-&gt;cur_inode_mode) &amp;&amp; left_fileattr != right_fileattr)</div><div class='add'>+			need_fileattr = true;</div><div class='ctx'> 		if ((old_size == sctx-&gt;cur_inode_size) ||</div><div class='ctx'> 		    (sctx-&gt;cur_inode_size &gt; old_size &amp;&amp;</div><div class='ctx'> 		     sctx-&gt;cur_inode_next_write_offset == sctx-&gt;cur_inode_size))</div><div class='hunk'>@@ -6110,11 +6645,20 @@ static int finish_inode_if_needed(struct send_ctx *sctx, int at_end)</div><div class='ctx'> 				if (ret)</div><div class='ctx'> 					goto out;</div><div class='ctx'> 			}</div><div class='del'>-			if (sctx-&gt;cur_inode_last_extent &lt;</div><div class='del'>-			    sctx-&gt;cur_inode_size) {</div><div class='del'>-				ret = send_hole(sctx, sctx-&gt;cur_inode_size);</div><div class='del'>-				if (ret)</div><div class='add'>+			if (sctx-&gt;cur_inode_last_extent &lt; sctx-&gt;cur_inode_size) {</div><div class='add'>+				ret = range_is_hole_in_parent(sctx,</div><div class='add'>+						      sctx-&gt;cur_inode_last_extent,</div><div class='add'>+						      sctx-&gt;cur_inode_size);</div><div class='add'>+				if (ret &lt; 0) {</div><div class='ctx'> 					goto out;</div><div class='add'>+				} else if (ret == 0) {</div><div class='add'>+					ret = send_hole(sctx, sctx-&gt;cur_inode_size);</div><div class='add'>+					if (ret &lt; 0)</div><div class='add'>+						goto out;</div><div class='add'>+				} else {</div><div class='add'>+					/* Range is already a hole, skip. */</div><div class='add'>+					ret = 0;</div><div class='add'>+				}</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 		if (need_truncate) {</div><div class='hunk'>@@ -6138,6 +6682,19 @@ static int finish_inode_if_needed(struct send_ctx *sctx, int at_end)</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='add'>+	if (need_fileattr) {</div><div class='add'>+		ret = send_fileattr(sctx, sctx-&gt;cur_ino, sctx-&gt;cur_inode_gen,</div><div class='add'>+				    left_fileattr);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (proto_cmd_ok(sctx, BTRFS_SEND_C_ENABLE_VERITY)</div><div class='add'>+	    &amp;&amp; sctx-&gt;cur_inode_needs_verity) {</div><div class='add'>+		ret = process_verity(sctx);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	ret = send_capabilities(sctx);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='hunk'>@@ -6159,100 +6716,51 @@ static int finish_inode_if_needed(struct send_ctx *sctx, int at_end)</div><div class='ctx'> 		 * it's moved/renamed, therefore we don't need to do it here.</div><div class='ctx'> 		 */</div><div class='ctx'> 		sctx-&gt;send_progress = sctx-&gt;cur_ino + 1;</div><div class='del'>-		ret = send_utimes(sctx, sctx-&gt;cur_ino, sctx-&gt;cur_inode_gen);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * If the current inode is a non-empty directory, delay issuing</div><div class='add'>+		 * the utimes command for it, as it's very likely we have inodes</div><div class='add'>+		 * with an higher number inside it. We want to issue the utimes</div><div class='add'>+		 * command only after adding all dentries to it.</div><div class='add'>+		 */</div><div class='add'>+		if (S_ISDIR(sctx-&gt;cur_inode_mode) &amp;&amp; sctx-&gt;cur_inode_size &gt; 0)</div><div class='add'>+			ret = cache_dir_utimes(sctx, sctx-&gt;cur_ino, sctx-&gt;cur_inode_gen);</div><div class='add'>+		else</div><div class='add'>+			ret = send_utimes(sctx, sctx-&gt;cur_ino, sctx-&gt;cur_inode_gen);</div><div class='add'>+</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct parent_paths_ctx {</div><div class='del'>-	struct list_head *refs;</div><div class='del'>-	struct send_ctx *sctx;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static int record_parent_ref(int num, u64 dir, int index, struct fs_path *name,</div><div class='del'>-			     void *ctx)</div><div class='del'>-{</div><div class='del'>-	struct parent_paths_ctx *ppctx = ctx;</div><div class='add'>+	if (!ret)</div><div class='add'>+		ret = trim_dir_utimes_cache(sctx);</div><div class='ctx'> </div><div class='del'>-	return record_ref(ppctx-&gt;sctx-&gt;parent_root, dir, name, ppctx-&gt;sctx,</div><div class='del'>-			  ppctx-&gt;refs);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Issue unlink operations for all paths of the current inode found in the</div><div class='del'>- * parent snapshot.</div><div class='del'>- */</div><div class='del'>-static int btrfs_unlink_all_paths(struct send_ctx *sctx)</div><div class='add'>+static void close_current_inode(struct send_ctx *sctx)</div><div class='ctx'> {</div><div class='del'>-	LIST_HEAD(deleted_refs);</div><div class='del'>-	struct btrfs_path *path;</div><div class='del'>-	struct btrfs_key key;</div><div class='del'>-	struct parent_paths_ctx ctx;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	path = alloc_path_for_send();</div><div class='del'>-	if (!path)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	key.objectid = sctx-&gt;cur_ino;</div><div class='del'>-	key.type = BTRFS_INODE_REF_KEY;</div><div class='del'>-	key.offset = 0;</div><div class='del'>-	ret = btrfs_search_slot(NULL, sctx-&gt;parent_root, &amp;key, path, 0, 0);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	ctx.refs = &amp;deleted_refs;</div><div class='del'>-	ctx.sctx = sctx;</div><div class='del'>-</div><div class='del'>-	while (true) {</div><div class='del'>-		struct extent_buffer *eb = path-&gt;nodes[0];</div><div class='del'>-		int slot = path-&gt;slots[0];</div><div class='del'>-</div><div class='del'>-		if (slot &gt;= btrfs_header_nritems(eb)) {</div><div class='del'>-			ret = btrfs_next_leaf(sctx-&gt;parent_root, path);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto out;</div><div class='del'>-			else if (ret &gt; 0)</div><div class='del'>-				break;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		btrfs_item_key_to_cpu(eb, &amp;key, slot);</div><div class='del'>-		if (key.objectid != sctx-&gt;cur_ino)</div><div class='del'>-			break;</div><div class='del'>-		if (key.type != BTRFS_INODE_REF_KEY &amp;&amp;</div><div class='del'>-		    key.type != BTRFS_INODE_EXTREF_KEY)</div><div class='del'>-			break;</div><div class='add'>+	u64 i_size;</div><div class='ctx'> </div><div class='del'>-		ret = iterate_inode_ref(sctx-&gt;parent_root, path, &amp;key, 1,</div><div class='del'>-					record_parent_ref, &amp;ctx);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='add'>+	if (sctx-&gt;cur_inode == NULL)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-		path-&gt;slots[0]++;</div><div class='del'>-	}</div><div class='add'>+	i_size = i_size_read(sctx-&gt;cur_inode);</div><div class='ctx'> </div><div class='del'>-	while (!list_empty(&amp;deleted_refs)) {</div><div class='del'>-		struct recorded_ref *ref;</div><div class='add'>+	/*</div><div class='add'>+	 * If we are doing an incremental send, we may have extents between the</div><div class='add'>+	 * last processed extent and the i_size that have not been processed</div><div class='add'>+	 * because they haven't changed but we may have read some of their pages</div><div class='add'>+	 * through readahead, see the comments at send_extent_data().</div><div class='add'>+	 */</div><div class='add'>+	if (sctx-&gt;clean_page_cache &amp;&amp; sctx-&gt;page_cache_clear_start &lt; i_size)</div><div class='add'>+		truncate_inode_pages_range(&amp;sctx-&gt;cur_inode-&gt;i_data,</div><div class='add'>+					   sctx-&gt;page_cache_clear_start,</div><div class='add'>+					   round_up(i_size, PAGE_SIZE) - 1);</div><div class='ctx'> </div><div class='del'>-		ref = list_first_entry(&amp;deleted_refs, struct recorded_ref, list);</div><div class='del'>-		ret = send_unlink(sctx, ref-&gt;full_path);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='del'>-		fs_path_free(ref-&gt;full_path);</div><div class='del'>-		list_del(&amp;ref-&gt;list);</div><div class='del'>-		kfree(ref);</div><div class='del'>-	}</div><div class='del'>-	ret = 0;</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	if (ret)</div><div class='del'>-		__free_recorded_refs(&amp;deleted_refs);</div><div class='del'>-	return ret;</div><div class='add'>+	iput(sctx-&gt;cur_inode);</div><div class='add'>+	sctx-&gt;cur_inode = NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int changed_inode(struct send_ctx *sctx,</div><div class='hunk'>@@ -6265,11 +6773,14 @@ static int changed_inode(struct send_ctx *sctx,</div><div class='ctx'> 	u64 left_gen = 0;</div><div class='ctx'> 	u64 right_gen = 0;</div><div class='ctx'> </div><div class='add'>+	close_current_inode(sctx);</div><div class='add'>+</div><div class='ctx'> 	sctx-&gt;cur_ino = key-&gt;objectid;</div><div class='del'>-	sctx-&gt;cur_inode_new_gen = 0;</div><div class='add'>+	sctx-&gt;cur_inode_new_gen = false;</div><div class='ctx'> 	sctx-&gt;cur_inode_last_extent = (u64)-1;</div><div class='ctx'> 	sctx-&gt;cur_inode_next_write_offset = 0;</div><div class='ctx'> 	sctx-&gt;ignore_cur_inode = false;</div><div class='add'>+	fs_path_reset(&amp;sctx-&gt;cur_inode_path);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Set send_progress to current inode. This will tell all get_cur_xxx</div><div class='hunk'>@@ -6307,7 +6818,7 @@ static int changed_inode(struct send_ctx *sctx,</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (left_gen != right_gen &amp;&amp;</div><div class='ctx'> 		    sctx-&gt;cur_ino != BTRFS_FIRST_FREE_OBJECTID)</div><div class='del'>-			sctx-&gt;cur_inode_new_gen = 1;</div><div class='add'>+			sctx-&gt;cur_inode_new_gen = true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -6319,28 +6830,39 @@ static int changed_inode(struct send_ctx *sctx,</div><div class='ctx'> 	 * file descriptor against it or turning a RO snapshot into RW mode,</div><div class='ctx'> 	 * keep an open file descriptor against a file, delete it and then</div><div class='ctx'> 	 * turn the snapshot back to RO mode before using it for a send</div><div class='del'>-	 * operation. So if we find such cases, ignore the inode and all its</div><div class='del'>-	 * items completely if it's a new inode, or if it's a changed inode</div><div class='del'>-	 * make sure all its previous paths (from the parent snapshot) are all</div><div class='del'>-	 * unlinked and all other the inode items are ignored.</div><div class='add'>+	 * operation. The former is what the receiver operation does.</div><div class='add'>+	 * Therefore, if we want to send these snapshots soon after they're</div><div class='add'>+	 * received, we need to handle orphan inodes as well. Moreover, orphans</div><div class='add'>+	 * can appear not only in the send snapshot but also in the parent</div><div class='add'>+	 * snapshot. Here are several cases:</div><div class='add'>+	 *</div><div class='add'>+	 * Case 1: BTRFS_COMPARE_TREE_NEW</div><div class='add'>+	 *       |  send snapshot  | action</div><div class='add'>+	 * --------------------------------</div><div class='add'>+	 * nlink |        0        | ignore</div><div class='add'>+	 *</div><div class='add'>+	 * Case 2: BTRFS_COMPARE_TREE_DELETED</div><div class='add'>+	 *       | parent snapshot | action</div><div class='add'>+	 * ----------------------------------</div><div class='add'>+	 * nlink |        0        | as usual</div><div class='add'>+	 * Note: No unlinks will be sent because there're no paths for it.</div><div class='add'>+	 *</div><div class='add'>+	 * Case 3: BTRFS_COMPARE_TREE_CHANGED</div><div class='add'>+	 *           |       | parent snapshot | send snapshot | action</div><div class='add'>+	 * -----------------------------------------------------------------------</div><div class='add'>+	 * subcase 1 | nlink |        0        |       0       | ignore</div><div class='add'>+	 * subcase 2 | nlink |       &gt;0        |       0       | new_gen(deletion)</div><div class='add'>+	 * subcase 3 | nlink |        0        |      &gt;0       | new_gen(creation)</div><div class='add'>+	 *</div><div class='ctx'> 	 */</div><div class='del'>-	if (result == BTRFS_COMPARE_TREE_NEW ||</div><div class='del'>-	    result == BTRFS_COMPARE_TREE_CHANGED) {</div><div class='del'>-		u32 nlinks;</div><div class='del'>-</div><div class='del'>-		nlinks = btrfs_inode_nlink(sctx-&gt;left_path-&gt;nodes[0], left_ii);</div><div class='del'>-		if (nlinks == 0) {</div><div class='add'>+	if (result == BTRFS_COMPARE_TREE_NEW) {</div><div class='add'>+		if (btrfs_inode_nlink(sctx-&gt;left_path-&gt;nodes[0], left_ii) == 0) {</div><div class='ctx'> 			sctx-&gt;ignore_cur_inode = true;</div><div class='del'>-			if (result == BTRFS_COMPARE_TREE_CHANGED)</div><div class='del'>-				ret = btrfs_unlink_all_paths(sctx);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (result == BTRFS_COMPARE_TREE_NEW) {</div><div class='ctx'> 		sctx-&gt;cur_inode_gen = left_gen;</div><div class='del'>-		sctx-&gt;cur_inode_new = 1;</div><div class='del'>-		sctx-&gt;cur_inode_deleted = 0;</div><div class='add'>+		sctx-&gt;cur_inode_new = true;</div><div class='add'>+		sctx-&gt;cur_inode_deleted = false;</div><div class='ctx'> 		sctx-&gt;cur_inode_size = btrfs_inode_size(</div><div class='ctx'> 				sctx-&gt;left_path-&gt;nodes[0], left_ii);</div><div class='ctx'> 		sctx-&gt;cur_inode_mode = btrfs_inode_mode(</div><div class='hunk'>@@ -6351,13 +6873,23 @@ static int changed_inode(struct send_ctx *sctx,</div><div class='ctx'> 			ret = send_create_inode_if_needed(sctx);</div><div class='ctx'> 	} else if (result == BTRFS_COMPARE_TREE_DELETED) {</div><div class='ctx'> 		sctx-&gt;cur_inode_gen = right_gen;</div><div class='del'>-		sctx-&gt;cur_inode_new = 0;</div><div class='del'>-		sctx-&gt;cur_inode_deleted = 1;</div><div class='add'>+		sctx-&gt;cur_inode_new = false;</div><div class='add'>+		sctx-&gt;cur_inode_deleted = true;</div><div class='ctx'> 		sctx-&gt;cur_inode_size = btrfs_inode_size(</div><div class='ctx'> 				sctx-&gt;right_path-&gt;nodes[0], right_ii);</div><div class='ctx'> 		sctx-&gt;cur_inode_mode = btrfs_inode_mode(</div><div class='ctx'> 				sctx-&gt;right_path-&gt;nodes[0], right_ii);</div><div class='ctx'> 	} else if (result == BTRFS_COMPARE_TREE_CHANGED) {</div><div class='add'>+		u32 new_nlinks, old_nlinks;</div><div class='add'>+</div><div class='add'>+		new_nlinks = btrfs_inode_nlink(sctx-&gt;left_path-&gt;nodes[0], left_ii);</div><div class='add'>+		old_nlinks = btrfs_inode_nlink(sctx-&gt;right_path-&gt;nodes[0], right_ii);</div><div class='add'>+		if (new_nlinks == 0 &amp;&amp; old_nlinks == 0) {</div><div class='add'>+			sctx-&gt;ignore_cur_inode = true;</div><div class='add'>+			goto out;</div><div class='add'>+		} else if (new_nlinks == 0 || old_nlinks == 0) {</div><div class='add'>+			sctx-&gt;cur_inode_new_gen = 1;</div><div class='add'>+		}</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We need to do some special handling in case the inode was</div><div class='ctx'> 		 * reported as changed with a changed generation number. This</div><div class='hunk'>@@ -6369,58 +6901,66 @@ static int changed_inode(struct send_ctx *sctx,</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * First, process the inode as if it was deleted.</div><div class='ctx'> 			 */</div><div class='del'>-			sctx-&gt;cur_inode_gen = right_gen;</div><div class='del'>-			sctx-&gt;cur_inode_new = 0;</div><div class='del'>-			sctx-&gt;cur_inode_deleted = 1;</div><div class='del'>-			sctx-&gt;cur_inode_size = btrfs_inode_size(</div><div class='del'>-					sctx-&gt;right_path-&gt;nodes[0], right_ii);</div><div class='del'>-			sctx-&gt;cur_inode_mode = btrfs_inode_mode(</div><div class='del'>-					sctx-&gt;right_path-&gt;nodes[0], right_ii);</div><div class='del'>-			ret = process_all_refs(sctx,</div><div class='del'>-					BTRFS_COMPARE_TREE_DELETED);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto out;</div><div class='add'>+			if (old_nlinks &gt; 0) {</div><div class='add'>+				sctx-&gt;cur_inode_gen = right_gen;</div><div class='add'>+				sctx-&gt;cur_inode_new = false;</div><div class='add'>+				sctx-&gt;cur_inode_deleted = true;</div><div class='add'>+				sctx-&gt;cur_inode_size = btrfs_inode_size(</div><div class='add'>+						sctx-&gt;right_path-&gt;nodes[0], right_ii);</div><div class='add'>+				sctx-&gt;cur_inode_mode = btrfs_inode_mode(</div><div class='add'>+						sctx-&gt;right_path-&gt;nodes[0], right_ii);</div><div class='add'>+				ret = process_all_refs(sctx,</div><div class='add'>+						BTRFS_COMPARE_TREE_DELETED);</div><div class='add'>+				if (ret &lt; 0)</div><div class='add'>+					goto out;</div><div class='add'>+			}</div><div class='ctx'> </div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Now process the inode as if it was new.</div><div class='ctx'> 			 */</div><div class='del'>-			sctx-&gt;cur_inode_gen = left_gen;</div><div class='del'>-			sctx-&gt;cur_inode_new = 1;</div><div class='del'>-			sctx-&gt;cur_inode_deleted = 0;</div><div class='del'>-			sctx-&gt;cur_inode_size = btrfs_inode_size(</div><div class='del'>-					sctx-&gt;left_path-&gt;nodes[0], left_ii);</div><div class='del'>-			sctx-&gt;cur_inode_mode = btrfs_inode_mode(</div><div class='del'>-					sctx-&gt;left_path-&gt;nodes[0], left_ii);</div><div class='del'>-			sctx-&gt;cur_inode_rdev = btrfs_inode_rdev(</div><div class='del'>-					sctx-&gt;left_path-&gt;nodes[0], left_ii);</div><div class='del'>-			ret = send_create_inode_if_needed(sctx);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto out;</div><div class='add'>+			if (new_nlinks &gt; 0) {</div><div class='add'>+				sctx-&gt;cur_inode_gen = left_gen;</div><div class='add'>+				sctx-&gt;cur_inode_new = true;</div><div class='add'>+				sctx-&gt;cur_inode_deleted = false;</div><div class='add'>+				sctx-&gt;cur_inode_size = btrfs_inode_size(</div><div class='add'>+						sctx-&gt;left_path-&gt;nodes[0],</div><div class='add'>+						left_ii);</div><div class='add'>+				sctx-&gt;cur_inode_mode = btrfs_inode_mode(</div><div class='add'>+						sctx-&gt;left_path-&gt;nodes[0],</div><div class='add'>+						left_ii);</div><div class='add'>+				sctx-&gt;cur_inode_rdev = btrfs_inode_rdev(</div><div class='add'>+						sctx-&gt;left_path-&gt;nodes[0],</div><div class='add'>+						left_ii);</div><div class='add'>+				ret = send_create_inode_if_needed(sctx);</div><div class='add'>+				if (ret &lt; 0)</div><div class='add'>+					goto out;</div><div class='ctx'> </div><div class='del'>-			ret = process_all_refs(sctx, BTRFS_COMPARE_TREE_NEW);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto out;</div><div class='del'>-			/*</div><div class='del'>-			 * Advance send_progress now as we did not get into</div><div class='del'>-			 * process_recorded_refs_if_needed in the new_gen case.</div><div class='del'>-			 */</div><div class='del'>-			sctx-&gt;send_progress = sctx-&gt;cur_ino + 1;</div><div class='add'>+				ret = process_all_refs(sctx, BTRFS_COMPARE_TREE_NEW);</div><div class='add'>+				if (ret &lt; 0)</div><div class='add'>+					goto out;</div><div class='add'>+				/*</div><div class='add'>+				 * Advance send_progress now as we did not get</div><div class='add'>+				 * into process_recorded_refs_if_needed in the</div><div class='add'>+				 * new_gen case.</div><div class='add'>+				 */</div><div class='add'>+				sctx-&gt;send_progress = sctx-&gt;cur_ino + 1;</div><div class='ctx'> </div><div class='del'>-			/*</div><div class='del'>-			 * Now process all extents and xattrs of the inode as if</div><div class='del'>-			 * they were all new.</div><div class='del'>-			 */</div><div class='del'>-			ret = process_all_extents(sctx);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto out;</div><div class='del'>-			ret = process_all_new_xattrs(sctx);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto out;</div><div class='add'>+				/*</div><div class='add'>+				 * Now process all extents and xattrs of the</div><div class='add'>+				 * inode as if they were all new.</div><div class='add'>+				 */</div><div class='add'>+				ret = process_all_extents(sctx);</div><div class='add'>+				if (ret &lt; 0)</div><div class='add'>+					goto out;</div><div class='add'>+				ret = process_all_new_xattrs(sctx);</div><div class='add'>+				if (ret &lt; 0)</div><div class='add'>+					goto out;</div><div class='add'>+			}</div><div class='ctx'> 		} else {</div><div class='ctx'> 			sctx-&gt;cur_inode_gen = left_gen;</div><div class='del'>-			sctx-&gt;cur_inode_new = 0;</div><div class='del'>-			sctx-&gt;cur_inode_new_gen = 0;</div><div class='del'>-			sctx-&gt;cur_inode_deleted = 0;</div><div class='add'>+			sctx-&gt;cur_inode_new = false;</div><div class='add'>+			sctx-&gt;cur_inode_new_gen = false;</div><div class='add'>+			sctx-&gt;cur_inode_deleted = false;</div><div class='ctx'> 			sctx-&gt;cur_inode_size = btrfs_inode_size(</div><div class='ctx'> 					sctx-&gt;left_path-&gt;nodes[0], left_ii);</div><div class='ctx'> 			sctx-&gt;cur_inode_mode = btrfs_inode_mode(</div><div class='hunk'>@@ -6447,7 +6987,7 @@ static int changed_ref(struct send_ctx *sctx,</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	if (sctx-&gt;cur_ino != sctx-&gt;cmp_key-&gt;objectid) {</div><div class='add'>+	if (unlikely(sctx-&gt;cur_ino != sctx-&gt;cmp_key-&gt;objectid)) {</div><div class='ctx'> 		inconsistent_snapshot_error(sctx, result, "reference");</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -6475,7 +7015,7 @@ static int changed_xattr(struct send_ctx *sctx,</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	if (sctx-&gt;cur_ino != sctx-&gt;cmp_key-&gt;objectid) {</div><div class='add'>+	if (unlikely(sctx-&gt;cur_ino != sctx-&gt;cmp_key-&gt;objectid)) {</div><div class='ctx'> 		inconsistent_snapshot_error(sctx, result, "xattr");</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -6527,18 +7067,25 @@ static int changed_extent(struct send_ctx *sctx,</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int changed_verity(struct send_ctx *sctx, enum btrfs_compare_tree_result result)</div><div class='add'>+{</div><div class='add'>+	if (!sctx-&gt;cur_inode_new_gen &amp;&amp; !sctx-&gt;cur_inode_deleted) {</div><div class='add'>+		if (result == BTRFS_COMPARE_TREE_NEW)</div><div class='add'>+			sctx-&gt;cur_inode_needs_verity = true;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int dir_changed(struct send_ctx *sctx, u64 dir)</div><div class='ctx'> {</div><div class='ctx'> 	u64 orig_gen, new_gen;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = get_inode_info(sctx-&gt;send_root, dir, NULL, &amp;new_gen, NULL, NULL,</div><div class='del'>-			     NULL, NULL);</div><div class='add'>+	ret = get_inode_gen(sctx-&gt;send_root, dir, &amp;new_gen);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	ret = get_inode_info(sctx-&gt;parent_root, dir, NULL, &amp;orig_gen, NULL,</div><div class='del'>-			     NULL, NULL, NULL);</div><div class='add'>+	ret = get_inode_gen(sctx-&gt;parent_root, dir, &amp;orig_gen);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='hunk'>@@ -6566,7 +7113,7 @@ static int compare_refs(struct send_ctx *sctx, struct btrfs_path *path,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='del'>-	item_size = btrfs_item_size_nr(leaf, path-&gt;slots[0]);</div><div class='add'>+	item_size = btrfs_item_size(leaf, path-&gt;slots[0]);</div><div class='ctx'> 	ptr = btrfs_item_ptr_offset(leaf, path-&gt;slots[0]);</div><div class='ctx'> 	while (cur_offset &lt; item_size) {</div><div class='ctx'> 		extref = (struct btrfs_inode_extref *)(ptr +</div><div class='hunk'>@@ -6595,7 +7142,51 @@ static int changed_cb(struct btrfs_path *left_path,</div><div class='ctx'> 		      enum btrfs_compare_tree_result result,</div><div class='ctx'> 		      struct send_ctx *sctx)</div><div class='ctx'> {</div><div class='del'>-	int ret = 0;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We can not hold the commit root semaphore here. This is because in</div><div class='add'>+	 * the case of sending and receiving to the same filesystem, using a</div><div class='add'>+	 * pipe, could result in a deadlock:</div><div class='add'>+	 *</div><div class='add'>+	 * 1) The task running send blocks on the pipe because it's full;</div><div class='add'>+	 *</div><div class='add'>+	 * 2) The task running receive, which is the only consumer of the pipe,</div><div class='add'>+	 *    is waiting for a transaction commit (for example due to a space</div><div class='add'>+	 *    reservation when doing a write or triggering a transaction commit</div><div class='add'>+	 *    when creating a subvolume);</div><div class='add'>+	 *</div><div class='add'>+	 * 3) The transaction is waiting to write lock the commit root semaphore,</div><div class='add'>+	 *    but can not acquire it since it's being held at 1).</div><div class='add'>+	 *</div><div class='add'>+	 * Down this call chain we write to the pipe through kernel_write().</div><div class='add'>+	 * The same type of problem can also happen when sending to a file that</div><div class='add'>+	 * is stored in the same filesystem - when reserving space for a write</div><div class='add'>+	 * into the file, we can trigger a transaction commit.</div><div class='add'>+	 *</div><div class='add'>+	 * Our caller has supplied us with clones of leaves from the send and</div><div class='add'>+	 * parent roots, so we're safe here from a concurrent relocation and</div><div class='add'>+	 * further reallocation of metadata extents while we are here. Below we</div><div class='add'>+	 * also assert that the leaves are clones.</div><div class='add'>+	 */</div><div class='add'>+	lockdep_assert_not_held(&amp;sctx-&gt;send_root-&gt;fs_info-&gt;commit_root_sem);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We always have a send root, so left_path is never NULL. We will not</div><div class='add'>+	 * have a leaf when we have reached the end of the send root but have</div><div class='add'>+	 * not yet reached the end of the parent root.</div><div class='add'>+	 */</div><div class='add'>+	if (left_path-&gt;nodes[0])</div><div class='add'>+		ASSERT(test_bit(EXTENT_BUFFER_UNMAPPED,</div><div class='add'>+				&amp;left_path-&gt;nodes[0]-&gt;bflags));</div><div class='add'>+	/*</div><div class='add'>+	 * When doing a full send we don't have a parent root, so right_path is</div><div class='add'>+	 * NULL. When doing an incremental send, we may have reached the end of</div><div class='add'>+	 * the parent root already, so we don't have a leaf at right_path.</div><div class='add'>+	 */</div><div class='add'>+	if (right_path &amp;&amp; right_path-&gt;nodes[0])</div><div class='add'>+		ASSERT(test_bit(EXTENT_BUFFER_UNMAPPED,</div><div class='add'>+				&amp;right_path-&gt;nodes[0]-&gt;bflags));</div><div class='ctx'> </div><div class='ctx'> 	if (result == BTRFS_COMPARE_TREE_SAME) {</div><div class='ctx'> 		if (key-&gt;type == BTRFS_INODE_REF_KEY ||</div><div class='hunk'>@@ -6611,7 +7202,6 @@ static int changed_cb(struct btrfs_path *left_path,</div><div class='ctx'> 			return 0;</div><div class='ctx'> 		}</div><div class='ctx'> 		result = BTRFS_COMPARE_TREE_CHANGED;</div><div class='del'>-		ret = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	sctx-&gt;left_path = left_path;</div><div class='hunk'>@@ -6637,20 +7227,55 @@ static int changed_cb(struct btrfs_path *left_path,</div><div class='ctx'> 			ret = changed_xattr(sctx, result);</div><div class='ctx'> 		else if (key-&gt;type == BTRFS_EXTENT_DATA_KEY)</div><div class='ctx'> 			ret = changed_extent(sctx, result);</div><div class='add'>+		else if (key-&gt;type == BTRFS_VERITY_DESC_ITEM_KEY &amp;&amp;</div><div class='add'>+			 key-&gt;offset == 0)</div><div class='add'>+			ret = changed_verity(sctx, result);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int search_key_again(const struct send_ctx *sctx,</div><div class='add'>+			    struct btrfs_root *root,</div><div class='add'>+			    struct btrfs_path *path,</div><div class='add'>+			    const struct btrfs_key *key)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (!path-&gt;need_commit_sem)</div><div class='add'>+		lockdep_assert_held_read(&amp;root-&gt;fs_info-&gt;commit_root_sem);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Roots used for send operations are readonly and no one can add,</div><div class='add'>+	 * update or remove keys from them, so we should be able to find our</div><div class='add'>+	 * key again. The only exception is deduplication, which can operate on</div><div class='add'>+	 * readonly roots and add, update or remove keys to/from them - but at</div><div class='add'>+	 * the moment we don't allow it to run in parallel with send.</div><div class='add'>+	 */</div><div class='add'>+	ret = btrfs_search_slot(NULL, root, key, path, 0, 0);</div><div class='add'>+	ASSERT(ret &lt;= 0);</div><div class='add'>+	if (unlikely(ret &gt; 0)) {</div><div class='add'>+		btrfs_print_tree(path-&gt;nodes[path-&gt;lowest_level], false);</div><div class='add'>+		btrfs_err(root-&gt;fs_info,</div><div class='add'>+"send: key " BTRFS_KEY_FMT" not found in %s root %llu, lowest_level %d, slot %d",</div><div class='add'>+			  BTRFS_KEY_FMT_VALUE(key),</div><div class='add'>+			  (root == sctx-&gt;parent_root ? "parent" : "send"),</div><div class='add'>+			  btrfs_root_id(root), path-&gt;lowest_level,</div><div class='add'>+			  path-&gt;slots[path-&gt;lowest_level]);</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int full_send_tree(struct send_ctx *sctx)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct btrfs_root *send_root = sctx-&gt;send_root;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='del'>-	struct btrfs_path *path;</div><div class='del'>-	struct extent_buffer *eb;</div><div class='del'>-	int slot;</div><div class='add'>+	struct btrfs_fs_info *fs_info = send_root-&gt;fs_info;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> </div><div class='ctx'> 	path = alloc_path_for_send();</div><div class='ctx'> 	if (!path)</div><div class='hunk'>@@ -6661,25 +7286,49 @@ static int full_send_tree(struct send_ctx *sctx)</div><div class='ctx'> 	key.type = BTRFS_INODE_ITEM_KEY;</div><div class='ctx'> 	key.offset = 0;</div><div class='ctx'> </div><div class='add'>+	down_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='add'>+	sctx-&gt;last_reloc_trans = fs_info-&gt;last_reloc_trans;</div><div class='add'>+	up_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='add'>+</div><div class='ctx'> 	ret = btrfs_search_slot_for_read(send_root, &amp;key, path, 1, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out_finish;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='del'>-		eb = path-&gt;nodes[0];</div><div class='del'>-		slot = path-&gt;slots[0];</div><div class='del'>-		btrfs_item_key_to_cpu(eb, &amp;key, slot);</div><div class='add'>+		btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, path-&gt;slots[0]);</div><div class='ctx'> </div><div class='ctx'> 		ret = changed_cb(path, NULL, &amp;key,</div><div class='ctx'> 				 BTRFS_COMPARE_TREE_NEW, sctx);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='add'>+</div><div class='add'>+		down_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='add'>+		if (fs_info-&gt;last_reloc_trans &gt; sctx-&gt;last_reloc_trans) {</div><div class='add'>+			sctx-&gt;last_reloc_trans = fs_info-&gt;last_reloc_trans;</div><div class='add'>+			up_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='add'>+			/*</div><div class='add'>+			 * A transaction used for relocating a block group was</div><div class='add'>+			 * committed or is about to finish its commit. Release</div><div class='add'>+			 * our path (leaf) and restart the search, so that we</div><div class='add'>+			 * avoid operating on any file extent items that are</div><div class='add'>+			 * stale, with a disk_bytenr that reflects a pre</div><div class='add'>+			 * relocation value. This way we avoid as much as</div><div class='add'>+			 * possible to fallback to regular writes when checking</div><div class='add'>+			 * if we can clone file ranges.</div><div class='add'>+			 */</div><div class='add'>+			btrfs_release_path(path);</div><div class='add'>+			ret = search_key_again(sctx, send_root, path, &amp;key);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				return ret;</div><div class='add'>+		} else {</div><div class='add'>+			up_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		ret = btrfs_next_item(send_root, path);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 		if (ret) {</div><div class='ctx'> 			ret  = 0;</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -6687,11 +7336,21 @@ static int full_send_tree(struct send_ctx *sctx)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> out_finish:</div><div class='del'>-	ret = finish_inode_if_needed(sctx, 1);</div><div class='add'>+	return finish_inode_if_needed(sctx, 1);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+static int replace_node_with_clone(struct btrfs_path *path, int level)</div><div class='add'>+{</div><div class='add'>+	struct extent_buffer *clone;</div><div class='add'>+</div><div class='add'>+	clone = btrfs_clone_extent_buffer(path-&gt;nodes[level]);</div><div class='add'>+	if (!clone)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	free_extent_buffer(path-&gt;nodes[level]);</div><div class='add'>+	path-&gt;nodes[level] = clone;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int tree_move_down(struct btrfs_path *path, int *level, u64 reada_min_gen)</div><div class='hunk'>@@ -6703,7 +7362,9 @@ static int tree_move_down(struct btrfs_path *path, int *level, u64 reada_min_gen</div><div class='ctx'> 	u64 reada_max;</div><div class='ctx'> 	u64 reada_done = 0;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(*level == 0);</div><div class='add'>+	lockdep_assert_held_read(&amp;parent-&gt;fs_info-&gt;commit_root_sem);</div><div class='add'>+	ASSERT(*level != 0);</div><div class='add'>+</div><div class='ctx'> 	eb = btrfs_read_node_slot(parent, slot);</div><div class='ctx'> 	if (IS_ERR(eb))</div><div class='ctx'> 		return PTR_ERR(eb);</div><div class='hunk'>@@ -6726,6 +7387,10 @@ static int tree_move_down(struct btrfs_path *path, int *level, u64 reada_min_gen</div><div class='ctx'> 	path-&gt;nodes[*level - 1] = eb;</div><div class='ctx'> 	path-&gt;slots[*level - 1] = 0;</div><div class='ctx'> 	(*level)--;</div><div class='add'>+</div><div class='add'>+	if (*level == 0)</div><div class='add'>+		return replace_node_with_clone(path, 0);</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -6739,8 +7404,10 @@ static int tree_move_next_or_upnext(struct btrfs_path *path,</div><div class='ctx'> 	path-&gt;slots[*level]++;</div><div class='ctx'> </div><div class='ctx'> 	while (path-&gt;slots[*level] &gt;= nritems) {</div><div class='del'>-		if (*level == root_level)</div><div class='add'>+		if (*level == root_level) {</div><div class='add'>+			path-&gt;slots[*level] = nritems - 1;</div><div class='ctx'> 			return -1;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		/* move upnext */</div><div class='ctx'> 		path-&gt;slots[*level] = 0;</div><div class='hunk'>@@ -6772,14 +7439,20 @@ static int tree_advance(struct btrfs_path *path,</div><div class='ctx'> 	} else {</div><div class='ctx'> 		ret = tree_move_down(path, level, reada_min_gen);</div><div class='ctx'> 	}</div><div class='del'>-	if (ret &gt;= 0) {</div><div class='del'>-		if (*level == 0)</div><div class='del'>-			btrfs_item_key_to_cpu(path-&gt;nodes[*level], key,</div><div class='del'>-					path-&gt;slots[*level]);</div><div class='del'>-		else</div><div class='del'>-			btrfs_node_key_to_cpu(path-&gt;nodes[*level], key,</div><div class='del'>-					path-&gt;slots[*level]);</div><div class='del'>-	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Even if we have reached the end of a tree, ret is -1, update the key</div><div class='add'>+	 * anyway, so that in case we need to restart due to a block group</div><div class='add'>+	 * relocation, we can assert that the last key of the root node still</div><div class='add'>+	 * exists in the tree.</div><div class='add'>+	 */</div><div class='add'>+	if (*level == 0)</div><div class='add'>+		btrfs_item_key_to_cpu(path-&gt;nodes[*level], key,</div><div class='add'>+				      path-&gt;slots[*level]);</div><div class='add'>+	else</div><div class='add'>+		btrfs_node_key_to_cpu(path-&gt;nodes[*level], key,</div><div class='add'>+				      path-&gt;slots[*level]);</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -6791,8 +7464,8 @@ static int tree_compare_item(struct btrfs_path *left_path,</div><div class='ctx'> 	int len1, len2;</div><div class='ctx'> 	unsigned long off1, off2;</div><div class='ctx'> </div><div class='del'>-	len1 = btrfs_item_size_nr(left_path-&gt;nodes[0], left_path-&gt;slots[0]);</div><div class='del'>-	len2 = btrfs_item_size_nr(right_path-&gt;nodes[0], right_path-&gt;slots[0]);</div><div class='add'>+	len1 = btrfs_item_size(left_path-&gt;nodes[0], left_path-&gt;slots[0]);</div><div class='add'>+	len2 = btrfs_item_size(right_path-&gt;nodes[0], right_path-&gt;slots[0]);</div><div class='ctx'> 	if (len1 != len2)</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='hunk'>@@ -6809,6 +7482,97 @@ static int tree_compare_item(struct btrfs_path *left_path,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * A transaction used for relocating a block group was committed or is about to</div><div class='add'>+ * finish its commit. Release our paths and restart the search, so that we are</div><div class='add'>+ * not using stale extent buffers:</div><div class='add'>+ *</div><div class='add'>+ * 1) For levels &gt; 0, we are only holding references of extent buffers, without</div><div class='add'>+ *    any locks on them, which does not prevent them from having been relocated</div><div class='add'>+ *    and reallocated after the last time we released the commit root semaphore.</div><div class='add'>+ *    The exception are the root nodes, for which we always have a clone, see</div><div class='add'>+ *    the comment at btrfs_compare_trees();</div><div class='add'>+ *</div><div class='add'>+ * 2) For leaves, level 0, we are holding copies (clones) of extent buffers, so</div><div class='add'>+ *    we are safe from the concurrent relocation and reallocation. However they</div><div class='add'>+ *    can have file extent items with a pre relocation disk_bytenr value, so we</div><div class='add'>+ *    restart the start from the current commit roots and clone the new leaves so</div><div class='add'>+ *    that we get the post relocation disk_bytenr values. Not doing so, could</div><div class='add'>+ *    make us clone the wrong data in case there are new extents using the old</div><div class='add'>+ *    disk_bytenr that happen to be shared.</div><div class='add'>+ */</div><div class='add'>+static int restart_after_relocation(struct btrfs_path *left_path,</div><div class='add'>+				    struct btrfs_path *right_path,</div><div class='add'>+				    const struct btrfs_key *left_key,</div><div class='add'>+				    const struct btrfs_key *right_key,</div><div class='add'>+				    int left_level,</div><div class='add'>+				    int right_level,</div><div class='add'>+				    const struct send_ctx *sctx)</div><div class='add'>+{</div><div class='add'>+	int root_level;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held_read(&amp;sctx-&gt;send_root-&gt;fs_info-&gt;commit_root_sem);</div><div class='add'>+</div><div class='add'>+	btrfs_release_path(left_path);</div><div class='add'>+	btrfs_release_path(right_path);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Since keys can not be added or removed to/from our roots because they</div><div class='add'>+	 * are readonly and we do not allow deduplication to run in parallel</div><div class='add'>+	 * (which can add, remove or change keys), the layout of the trees should</div><div class='add'>+	 * not change.</div><div class='add'>+	 */</div><div class='add'>+	left_path-&gt;lowest_level = left_level;</div><div class='add'>+	ret = search_key_again(sctx, sctx-&gt;send_root, left_path, left_key);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	right_path-&gt;lowest_level = right_level;</div><div class='add'>+	ret = search_key_again(sctx, sctx-&gt;parent_root, right_path, right_key);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If the lowest level nodes are leaves, clone them so that they can be</div><div class='add'>+	 * safely used by changed_cb() while not under the protection of the</div><div class='add'>+	 * commit root semaphore, even if relocation and reallocation happens in</div><div class='add'>+	 * parallel.</div><div class='add'>+	 */</div><div class='add'>+	if (left_level == 0) {</div><div class='add'>+		ret = replace_node_with_clone(left_path, 0);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (right_level == 0) {</div><div class='add'>+		ret = replace_node_with_clone(right_path, 0);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Now clone the root nodes (unless they happen to be the leaves we have</div><div class='add'>+	 * already cloned). This is to protect against concurrent snapshotting of</div><div class='add'>+	 * the send and parent roots (see the comment at btrfs_compare_trees()).</div><div class='add'>+	 */</div><div class='add'>+	root_level = btrfs_header_level(sctx-&gt;send_root-&gt;commit_root);</div><div class='add'>+	if (root_level &gt; 0) {</div><div class='add'>+		ret = replace_node_with_clone(left_path, root_level);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	root_level = btrfs_header_level(sctx-&gt;parent_root-&gt;commit_root);</div><div class='add'>+	if (root_level &gt; 0) {</div><div class='add'>+		ret = replace_node_with_clone(right_path, root_level);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * This function compares two trees and calls the provided callback for</div><div class='ctx'>  * every changed/new/deleted item it finds.</div><div class='ctx'>  * If shared tree blocks are encountered, whole subtrees are skipped, making</div><div class='hunk'>@@ -6827,8 +7591,8 @@ static int btrfs_compare_trees(struct btrfs_root *left_root,</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = left_root-&gt;fs_info;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int cmp;</div><div class='del'>-	struct btrfs_path *left_path = NULL;</div><div class='del'>-	struct btrfs_path *right_path = NULL;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(left_path);</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(right_path);</div><div class='ctx'> 	struct btrfs_key left_key;</div><div class='ctx'> 	struct btrfs_key right_key;</div><div class='ctx'> 	char *tmp_buf = NULL;</div><div class='hunk'>@@ -6836,10 +7600,10 @@ static int btrfs_compare_trees(struct btrfs_root *left_root,</div><div class='ctx'> 	int right_root_level;</div><div class='ctx'> 	int left_level;</div><div class='ctx'> 	int right_level;</div><div class='del'>-	int left_end_reached;</div><div class='del'>-	int right_end_reached;</div><div class='del'>-	int advance_left;</div><div class='del'>-	int advance_right;</div><div class='add'>+	int left_end_reached = 0;</div><div class='add'>+	int right_end_reached = 0;</div><div class='add'>+	int advance_left = 0;</div><div class='add'>+	int advance_right = 0;</div><div class='ctx'> 	u64 left_blockptr;</div><div class='ctx'> 	u64 right_blockptr;</div><div class='ctx'> 	u64 left_gen;</div><div class='hunk'>@@ -6863,10 +7627,10 @@ static int btrfs_compare_trees(struct btrfs_root *left_root,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	left_path-&gt;search_commit_root = 1;</div><div class='del'>-	left_path-&gt;skip_locking = 1;</div><div class='del'>-	right_path-&gt;search_commit_root = 1;</div><div class='del'>-	right_path-&gt;skip_locking = 1;</div><div class='add'>+	left_path-&gt;search_commit_root = true;</div><div class='add'>+	left_path-&gt;skip_locking = true;</div><div class='add'>+	right_path-&gt;search_commit_root = true;</div><div class='add'>+	right_path-&gt;skip_locking = true;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Strategy: Go to the first items of both trees. Then do</div><div class='hunk'>@@ -6907,12 +7671,18 @@ static int btrfs_compare_trees(struct btrfs_root *left_root,</div><div class='ctx'> 	down_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='ctx'> 	left_level = btrfs_header_level(left_root-&gt;commit_root);</div><div class='ctx'> 	left_root_level = left_level;</div><div class='add'>+	/*</div><div class='add'>+	 * We clone the root node of the send and parent roots to prevent races</div><div class='add'>+	 * with snapshot creation of these roots. Snapshot creation COWs the</div><div class='add'>+	 * root node of a tree, so after the transaction is committed the old</div><div class='add'>+	 * extent can be reallocated while this send operation is still ongoing.</div><div class='add'>+	 * So we clone them, under the commit root semaphore, to be race free.</div><div class='add'>+	 */</div><div class='ctx'> 	left_path-&gt;nodes[left_level] =</div><div class='ctx'> 			btrfs_clone_extent_buffer(left_root-&gt;commit_root);</div><div class='ctx'> 	if (!left_path-&gt;nodes[left_level]) {</div><div class='del'>-		up_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='add'>+		goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	right_level = btrfs_header_level(right_root-&gt;commit_root);</div><div class='hunk'>@@ -6920,9 +7690,8 @@ static int btrfs_compare_trees(struct btrfs_root *left_root,</div><div class='ctx'> 	right_path-&gt;nodes[right_level] =</div><div class='ctx'> 			btrfs_clone_extent_buffer(right_root-&gt;commit_root);</div><div class='ctx'> 	if (!right_path-&gt;nodes[right_level]) {</div><div class='del'>-		up_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='add'>+		goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Our right root is the parent root, while the left root is the "send"</div><div class='hunk'>@@ -6932,7 +7701,6 @@ static int btrfs_compare_trees(struct btrfs_root *left_root,</div><div class='ctx'> 	 * will need to read them at some point.</div><div class='ctx'> 	 */</div><div class='ctx'> 	reada_min_gen = btrfs_header_generation(right_root-&gt;commit_root);</div><div class='del'>-	up_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='ctx'> </div><div class='ctx'> 	if (left_level == 0)</div><div class='ctx'> 		btrfs_item_key_to_cpu(left_path-&gt;nodes[left_level],</div><div class='hunk'>@@ -6947,11 +7715,26 @@ static int btrfs_compare_trees(struct btrfs_root *left_root,</div><div class='ctx'> 		btrfs_node_key_to_cpu(right_path-&gt;nodes[right_level],</div><div class='ctx'> 				&amp;right_key, right_path-&gt;slots[right_level]);</div><div class='ctx'> </div><div class='del'>-	left_end_reached = right_end_reached = 0;</div><div class='del'>-	advance_left = advance_right = 0;</div><div class='add'>+	sctx-&gt;last_reloc_trans = fs_info-&gt;last_reloc_trans;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='del'>-		cond_resched();</div><div class='add'>+		if (need_resched() ||</div><div class='add'>+		    rwsem_is_contended(&amp;fs_info-&gt;commit_root_sem)) {</div><div class='add'>+			up_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='add'>+			cond_resched();</div><div class='add'>+			down_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (fs_info-&gt;last_reloc_trans &gt; sctx-&gt;last_reloc_trans) {</div><div class='add'>+			ret = restart_after_relocation(left_path, right_path,</div><div class='add'>+						       &amp;left_key, &amp;right_key,</div><div class='add'>+						       left_level, right_level,</div><div class='add'>+						       sctx);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				goto out_unlock;</div><div class='add'>+			sctx-&gt;last_reloc_trans = fs_info-&gt;last_reloc_trans;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		if (advance_left &amp;&amp; !left_end_reached) {</div><div class='ctx'> 			ret = tree_advance(left_path, &amp;left_level,</div><div class='ctx'> 					left_root_level,</div><div class='hunk'>@@ -6960,7 +7743,7 @@ static int btrfs_compare_trees(struct btrfs_root *left_root,</div><div class='ctx'> 			if (ret == -1)</div><div class='ctx'> 				left_end_reached = ADVANCE;</div><div class='ctx'> 			else if (ret &lt; 0)</div><div class='del'>-				goto out;</div><div class='add'>+				goto out_unlock;</div><div class='ctx'> 			advance_left = 0;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (advance_right &amp;&amp; !right_end_reached) {</div><div class='hunk'>@@ -6971,54 +7754,55 @@ static int btrfs_compare_trees(struct btrfs_root *left_root,</div><div class='ctx'> 			if (ret == -1)</div><div class='ctx'> 				right_end_reached = ADVANCE;</div><div class='ctx'> 			else if (ret &lt; 0)</div><div class='del'>-				goto out;</div><div class='add'>+				goto out_unlock;</div><div class='ctx'> 			advance_right = 0;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (left_end_reached &amp;&amp; right_end_reached) {</div><div class='ctx'> 			ret = 0;</div><div class='del'>-			goto out;</div><div class='add'>+			goto out_unlock;</div><div class='ctx'> 		} else if (left_end_reached) {</div><div class='ctx'> 			if (right_level == 0) {</div><div class='add'>+				up_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='ctx'> 				ret = changed_cb(left_path, right_path,</div><div class='ctx'> 						&amp;right_key,</div><div class='ctx'> 						BTRFS_COMPARE_TREE_DELETED,</div><div class='ctx'> 						sctx);</div><div class='ctx'> 				if (ret &lt; 0)</div><div class='ctx'> 					goto out;</div><div class='add'>+				down_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='ctx'> 			}</div><div class='ctx'> 			advance_right = ADVANCE;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		} else if (right_end_reached) {</div><div class='ctx'> 			if (left_level == 0) {</div><div class='add'>+				up_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='ctx'> 				ret = changed_cb(left_path, right_path,</div><div class='ctx'> 						&amp;left_key,</div><div class='ctx'> 						BTRFS_COMPARE_TREE_NEW,</div><div class='ctx'> 						sctx);</div><div class='ctx'> 				if (ret &lt; 0)</div><div class='ctx'> 					goto out;</div><div class='add'>+				down_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='ctx'> 			}</div><div class='ctx'> 			advance_left = ADVANCE;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (left_level == 0 &amp;&amp; right_level == 0) {</div><div class='add'>+			up_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='ctx'> 			cmp = btrfs_comp_cpu_keys(&amp;left_key, &amp;right_key);</div><div class='ctx'> 			if (cmp &lt; 0) {</div><div class='ctx'> 				ret = changed_cb(left_path, right_path,</div><div class='ctx'> 						&amp;left_key,</div><div class='ctx'> 						BTRFS_COMPARE_TREE_NEW,</div><div class='ctx'> 						sctx);</div><div class='del'>-				if (ret &lt; 0)</div><div class='del'>-					goto out;</div><div class='ctx'> 				advance_left = ADVANCE;</div><div class='ctx'> 			} else if (cmp &gt; 0) {</div><div class='ctx'> 				ret = changed_cb(left_path, right_path,</div><div class='ctx'> 						&amp;right_key,</div><div class='ctx'> 						BTRFS_COMPARE_TREE_DELETED,</div><div class='ctx'> 						sctx);</div><div class='del'>-				if (ret &lt; 0)</div><div class='del'>-					goto out;</div><div class='ctx'> 				advance_right = ADVANCE;</div><div class='ctx'> 			} else {</div><div class='ctx'> 				enum btrfs_compare_tree_result result;</div><div class='hunk'>@@ -7032,11 +7816,13 @@ static int btrfs_compare_trees(struct btrfs_root *left_root,</div><div class='ctx'> 					result = BTRFS_COMPARE_TREE_SAME;</div><div class='ctx'> 				ret = changed_cb(left_path, right_path,</div><div class='ctx'> 						 &amp;left_key, result, sctx);</div><div class='del'>-				if (ret &lt; 0)</div><div class='del'>-					goto out;</div><div class='ctx'> 				advance_left = ADVANCE;</div><div class='ctx'> 				advance_right = ADVANCE;</div><div class='ctx'> 			}</div><div class='add'>+</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				goto out;</div><div class='add'>+			down_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='ctx'> 		} else if (left_level == right_level) {</div><div class='ctx'> 			cmp = btrfs_comp_cpu_keys(&amp;left_key, &amp;right_key);</div><div class='ctx'> 			if (cmp &lt; 0) {</div><div class='hunk'>@@ -7076,9 +7862,9 @@ static int btrfs_compare_trees(struct btrfs_root *left_root,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+out_unlock:</div><div class='add'>+	up_read(&amp;fs_info-&gt;commit_root_sem);</div><div class='ctx'> out:</div><div class='del'>-	btrfs_free_path(left_path);</div><div class='del'>-	btrfs_free_path(right_path);</div><div class='ctx'> 	kvfree(tmp_buf);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -7130,38 +7916,22 @@ out:</div><div class='ctx'>  */</div><div class='ctx'> static int ensure_commit_roots_uptodate(struct send_ctx *sctx)</div><div class='ctx'> {</div><div class='del'>-	int i;</div><div class='del'>-	struct btrfs_trans_handle *trans = NULL;</div><div class='del'>-</div><div class='del'>-again:</div><div class='del'>-	if (sctx-&gt;parent_root &amp;&amp;</div><div class='del'>-	    sctx-&gt;parent_root-&gt;node != sctx-&gt;parent_root-&gt;commit_root)</div><div class='del'>-		goto commit_trans;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; sctx-&gt;clone_roots_cnt; i++)</div><div class='del'>-		if (sctx-&gt;clone_roots[i].root-&gt;node !=</div><div class='del'>-		    sctx-&gt;clone_roots[i].root-&gt;commit_root)</div><div class='del'>-			goto commit_trans;</div><div class='del'>-</div><div class='del'>-	if (trans)</div><div class='del'>-		return btrfs_end_transaction(trans);</div><div class='add'>+	struct btrfs_root *root = sctx-&gt;parent_root;</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+	if (root &amp;&amp; root-&gt;node != root-&gt;commit_root)</div><div class='add'>+		return btrfs_commit_current_transaction(root);</div><div class='ctx'> </div><div class='del'>-commit_trans:</div><div class='del'>-	/* Use any root, all fs roots will get their commit roots updated. */</div><div class='del'>-	if (!trans) {</div><div class='del'>-		trans = btrfs_join_transaction(sctx-&gt;send_root);</div><div class='del'>-		if (IS_ERR(trans))</div><div class='del'>-			return PTR_ERR(trans);</div><div class='del'>-		goto again;</div><div class='add'>+	for (int i = 0; i &lt; sctx-&gt;clone_roots_cnt; i++) {</div><div class='add'>+		root = sctx-&gt;clone_roots[i].root;</div><div class='add'>+		if (root-&gt;node != root-&gt;commit_root)</div><div class='add'>+			return btrfs_commit_current_transaction(root);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return btrfs_commit_transaction(trans);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Make sure any existing dellaloc is flushed for any root used by a send</div><div class='add'>+ * Make sure any existing delalloc is flushed for any root used by a send</div><div class='ctx'>  * operation so that we do not miss any data and we do not race with writeback</div><div class='ctx'>  * finishing and changing a tree while send is using the tree. This could</div><div class='ctx'>  * happen if a subvolume is in RW mode, has delalloc, is turned to RO mode and</div><div class='hunk'>@@ -7178,7 +7948,7 @@ static int flush_delalloc_roots(struct send_ctx *sctx)</div><div class='ctx'> 		ret = btrfs_start_delalloc_snapshot(root, false);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='del'>-		btrfs_wait_ordered_extents(root, U64_MAX, 0, U64_MAX);</div><div class='add'>+		btrfs_wait_ordered_extents(root, U64_MAX, NULL);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; sctx-&gt;clone_roots_cnt; i++) {</div><div class='hunk'>@@ -7186,7 +7956,7 @@ static int flush_delalloc_roots(struct send_ctx *sctx)</div><div class='ctx'> 		ret = btrfs_start_delalloc_snapshot(root, false);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='del'>-		btrfs_wait_ordered_extents(root, U64_MAX, 0, U64_MAX);</div><div class='add'>+		btrfs_wait_ordered_extents(root, U64_MAX, NULL);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -7203,7 +7973,7 @@ static void btrfs_root_dec_send_in_progress(struct btrfs_root* root)</div><div class='ctx'> 	if (root-&gt;send_in_progress &lt; 0)</div><div class='ctx'> 		btrfs_err(root-&gt;fs_info,</div><div class='ctx'> 			  "send_in_progress unbalanced %d root %llu",</div><div class='del'>-			  root-&gt;send_in_progress, root-&gt;root_key.objectid);</div><div class='add'>+			  root-&gt;send_in_progress, btrfs_root_id(root));</div><div class='ctx'> 	spin_unlock(&amp;root-&gt;root_item_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -7211,13 +7981,12 @@ static void dedupe_in_progress_warn(const struct btrfs_root *root)</div><div class='ctx'> {</div><div class='ctx'> 	btrfs_warn_rl(root-&gt;fs_info,</div><div class='ctx'> "cannot use root %llu for send while deduplications on it are in progress (%d in progress)",</div><div class='del'>-		      root-&gt;root_key.objectid, root-&gt;dedupe_in_progress);</div><div class='add'>+		      btrfs_root_id(root), root-&gt;dedupe_in_progress);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-long btrfs_ioctl_send(struct file *mnt_file, struct btrfs_ioctl_send_args *arg)</div><div class='add'>+long btrfs_ioctl_send(struct btrfs_root *send_root, const struct btrfs_ioctl_send_args *arg)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	struct btrfs_root *send_root = BTRFS_I(file_inode(mnt_file))-&gt;root;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = send_root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_root *clone_root;</div><div class='ctx'> 	struct send_ctx *sctx = NULL;</div><div class='hunk'>@@ -7226,6 +7995,8 @@ long btrfs_ioctl_send(struct file *mnt_file, struct btrfs_ioctl_send_args *arg)</div><div class='ctx'> 	int clone_sources_to_rollback = 0;</div><div class='ctx'> 	size_t alloc_size;</div><div class='ctx'> 	int sort_clone_roots = 0;</div><div class='add'>+	struct btrfs_lru_cache_entry *entry;</div><div class='add'>+	struct btrfs_lru_cache_entry *tmp;</div><div class='ctx'> </div><div class='ctx'> 	if (!capable(CAP_SYS_ADMIN))</div><div class='ctx'> 		return -EPERM;</div><div class='hunk'>@@ -7235,7 +8006,20 @@ long btrfs_ioctl_send(struct file *mnt_file, struct btrfs_ioctl_send_args *arg)</div><div class='ctx'> 	 * making it RW. This also protects against deletion.</div><div class='ctx'> 	 */</div><div class='ctx'> 	spin_lock(&amp;send_root-&gt;root_item_lock);</div><div class='del'>-	if (btrfs_root_readonly(send_root) &amp;&amp; send_root-&gt;dedupe_in_progress) {</div><div class='add'>+	/*</div><div class='add'>+	 * Unlikely but possible, if the subvolume is marked for deletion but</div><div class='add'>+	 * is slow to remove the directory entry, send can still be started.</div><div class='add'>+	 */</div><div class='add'>+	if (btrfs_root_dead(send_root)) {</div><div class='add'>+		spin_unlock(&amp;send_root-&gt;root_item_lock);</div><div class='add'>+		return -EPERM;</div><div class='add'>+	}</div><div class='add'>+	/* Userspace tools do the checks and warn the user if it's not RO. */</div><div class='add'>+	if (!btrfs_root_readonly(send_root)) {</div><div class='add'>+		spin_unlock(&amp;send_root-&gt;root_item_lock);</div><div class='add'>+		return -EPERM;</div><div class='add'>+	}</div><div class='add'>+	if (send_root-&gt;dedupe_in_progress) {</div><div class='ctx'> 		dedupe_in_progress_warn(send_root);</div><div class='ctx'> 		spin_unlock(&amp;send_root-&gt;root_item_lock);</div><div class='ctx'> 		return -EAGAIN;</div><div class='hunk'>@@ -7244,27 +8028,18 @@ long btrfs_ioctl_send(struct file *mnt_file, struct btrfs_ioctl_send_args *arg)</div><div class='ctx'> 	spin_unlock(&amp;send_root-&gt;root_item_lock);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Userspace tools do the checks and warn the user if it's</div><div class='del'>-	 * not RO.</div><div class='del'>-	 */</div><div class='del'>-	if (!btrfs_root_readonly(send_root)) {</div><div class='del'>-		ret = -EPERM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='ctx'> 	 * Check that we don't overflow at later allocations, we request</div><div class='ctx'> 	 * clone_sources_count + 1 items, and compare to unsigned long inside</div><div class='del'>-	 * access_ok.</div><div class='add'>+	 * access_ok. Also set an upper limit for allocation size so this can't</div><div class='add'>+	 * easily exhaust memory. Max number of clone sources is about 200K.</div><div class='ctx'> 	 */</div><div class='del'>-	if (arg-&gt;clone_sources_count &gt;</div><div class='del'>-	    ULONG_MAX / sizeof(struct clone_root) - 1) {</div><div class='add'>+	if (arg-&gt;clone_sources_count &gt; SZ_8M / sizeof(struct clone_root)) {</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (arg-&gt;flags &amp; ~BTRFS_SEND_FLAG_MASK) {</div><div class='del'>-		ret = -EINVAL;</div><div class='add'>+		ret = -EOPNOTSUPP;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -7274,10 +8049,25 @@ long btrfs_ioctl_send(struct file *mnt_file, struct btrfs_ioctl_send_args *arg)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	init_path(&amp;sctx-&gt;cur_inode_path);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;sctx-&gt;new_refs);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;sctx-&gt;deleted_refs);</div><div class='del'>-	INIT_RADIX_TREE(&amp;sctx-&gt;name_cache, GFP_KERNEL);</div><div class='del'>-	INIT_LIST_HEAD(&amp;sctx-&gt;name_cache_list);</div><div class='add'>+</div><div class='add'>+	btrfs_lru_cache_init(&amp;sctx-&gt;name_cache, SEND_MAX_NAME_CACHE_SIZE);</div><div class='add'>+	btrfs_lru_cache_init(&amp;sctx-&gt;backref_cache, SEND_MAX_BACKREF_CACHE_SIZE);</div><div class='add'>+	btrfs_lru_cache_init(&amp;sctx-&gt;dir_created_cache,</div><div class='add'>+			     SEND_MAX_DIR_CREATED_CACHE_SIZE);</div><div class='add'>+	/*</div><div class='add'>+	 * This cache is periodically trimmed to a fixed size elsewhere, see</div><div class='add'>+	 * cache_dir_utimes() and trim_dir_utimes_cache().</div><div class='add'>+	 */</div><div class='add'>+	btrfs_lru_cache_init(&amp;sctx-&gt;dir_utimes_cache, 0);</div><div class='add'>+</div><div class='add'>+	sctx-&gt;pending_dir_moves = RB_ROOT;</div><div class='add'>+	sctx-&gt;waiting_dir_moves = RB_ROOT;</div><div class='add'>+	sctx-&gt;orphan_dirs = RB_ROOT;</div><div class='add'>+	sctx-&gt;rbtree_new_refs = RB_ROOT;</div><div class='add'>+	sctx-&gt;rbtree_deleted_refs = RB_ROOT;</div><div class='ctx'> </div><div class='ctx'> 	sctx-&gt;flags = arg-&gt;flags;</div><div class='ctx'> </div><div class='hunk'>@@ -7291,38 +8081,52 @@ long btrfs_ioctl_send(struct file *mnt_file, struct btrfs_ioctl_send_args *arg)</div><div class='ctx'> 	} else {</div><div class='ctx'> 		sctx-&gt;proto = 1;</div><div class='ctx'> 	}</div><div class='add'>+	if ((arg-&gt;flags &amp; BTRFS_SEND_FLAG_COMPRESSED) &amp;&amp; sctx-&gt;proto &lt; 2) {</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	sctx-&gt;send_filp = fget(arg-&gt;send_fd);</div><div class='del'>-	if (!sctx-&gt;send_filp) {</div><div class='add'>+	if (!sctx-&gt;send_filp || !(sctx-&gt;send_filp-&gt;f_mode &amp; FMODE_WRITE)) {</div><div class='ctx'> 		ret = -EBADF;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	sctx-&gt;send_root = send_root;</div><div class='del'>-	/*</div><div class='del'>-	 * Unlikely but possible, if the subvolume is marked for deletion but</div><div class='del'>-	 * is slow to remove the directory entry, send can still be started</div><div class='del'>-	 */</div><div class='del'>-	if (btrfs_root_dead(sctx-&gt;send_root)) {</div><div class='del'>-		ret = -EPERM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	sctx-&gt;clone_roots_cnt = arg-&gt;clone_sources_count;</div><div class='ctx'> </div><div class='del'>-	sctx-&gt;send_max_size = BTRFS_SEND_BUF_SIZE;</div><div class='del'>-	sctx-&gt;send_buf = kvmalloc(sctx-&gt;send_max_size, GFP_KERNEL);</div><div class='add'>+	if (sctx-&gt;proto &gt;= 2) {</div><div class='add'>+		u32 send_buf_num_pages;</div><div class='add'>+</div><div class='add'>+		sctx-&gt;send_max_size = BTRFS_SEND_BUF_SIZE_V2;</div><div class='add'>+		sctx-&gt;send_buf = vmalloc(sctx-&gt;send_max_size);</div><div class='add'>+		if (!sctx-&gt;send_buf) {</div><div class='add'>+			ret = -ENOMEM;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		send_buf_num_pages = sctx-&gt;send_max_size &gt;&gt; PAGE_SHIFT;</div><div class='add'>+		sctx-&gt;send_buf_pages = kcalloc(send_buf_num_pages,</div><div class='add'>+					       sizeof(*sctx-&gt;send_buf_pages),</div><div class='add'>+					       GFP_KERNEL);</div><div class='add'>+		if (!sctx-&gt;send_buf_pages) {</div><div class='add'>+			ret = -ENOMEM;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		for (i = 0; i &lt; send_buf_num_pages; i++) {</div><div class='add'>+			sctx-&gt;send_buf_pages[i] =</div><div class='add'>+				vmalloc_to_page(sctx-&gt;send_buf + (i &lt;&lt; PAGE_SHIFT));</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		sctx-&gt;send_max_size = BTRFS_SEND_BUF_SIZE_V1;</div><div class='add'>+		sctx-&gt;send_buf = kvmalloc(sctx-&gt;send_max_size, GFP_KERNEL);</div><div class='add'>+	}</div><div class='ctx'> 	if (!sctx-&gt;send_buf) {</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	sctx-&gt;pending_dir_moves = RB_ROOT;</div><div class='del'>-	sctx-&gt;waiting_dir_moves = RB_ROOT;</div><div class='del'>-	sctx-&gt;orphan_dirs = RB_ROOT;</div><div class='del'>-</div><div class='del'>-	sctx-&gt;clone_roots = kvcalloc(sizeof(*sctx-&gt;clone_roots),</div><div class='del'>-				     arg-&gt;clone_sources_count + 1,</div><div class='add'>+	sctx-&gt;clone_roots = kvcalloc(arg-&gt;clone_sources_count + 1,</div><div class='add'>+				     sizeof(*sctx-&gt;clone_roots),</div><div class='ctx'> 				     GFP_KERNEL);</div><div class='ctx'> 	if (!sctx-&gt;clone_roots) {</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='hunk'>@@ -7425,24 +8229,17 @@ long btrfs_ioctl_send(struct file *mnt_file, struct btrfs_ioctl_send_args *arg)</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;fs_info-&gt;send_reloc_lock);</div><div class='del'>-	if (test_bit(BTRFS_FS_RELOC_RUNNING, &amp;fs_info-&gt;flags)) {</div><div class='del'>-		spin_unlock(&amp;fs_info-&gt;send_reloc_lock);</div><div class='del'>-		btrfs_warn_rl(fs_info,</div><div class='del'>-		"cannot run send because a relocation operation is in progress");</div><div class='del'>-		ret = -EAGAIN;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	fs_info-&gt;send_in_progress++;</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;send_reloc_lock);</div><div class='del'>-</div><div class='ctx'> 	ret = send_subvol(sctx);</div><div class='del'>-	spin_lock(&amp;fs_info-&gt;send_reloc_lock);</div><div class='del'>-	fs_info-&gt;send_in_progress--;</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;send_reloc_lock);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='add'>+	btrfs_lru_cache_for_each_entry_safe(&amp;sctx-&gt;dir_utimes_cache, entry, tmp) {</div><div class='add'>+		ret = send_utimes(sctx, entry-&gt;key, entry-&gt;gen);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out;</div><div class='add'>+		btrfs_lru_cache_remove(&amp;sctx-&gt;dir_utimes_cache, entry);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (!(sctx-&gt;flags &amp; BTRFS_SEND_FLAG_OMIT_END_CMD)) {</div><div class='ctx'> 		ret = begin_cmd(sctx, BTRFS_SEND_C_END);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='hunk'>@@ -7518,9 +8315,19 @@ out:</div><div class='ctx'> 			fput(sctx-&gt;send_filp);</div><div class='ctx'> </div><div class='ctx'> 		kvfree(sctx-&gt;clone_roots);</div><div class='add'>+		kfree(sctx-&gt;send_buf_pages);</div><div class='ctx'> 		kvfree(sctx-&gt;send_buf);</div><div class='add'>+		kvfree(sctx-&gt;verity_descriptor);</div><div class='add'>+</div><div class='add'>+		close_current_inode(sctx);</div><div class='add'>+</div><div class='add'>+		btrfs_lru_cache_clear(&amp;sctx-&gt;name_cache);</div><div class='add'>+		btrfs_lru_cache_clear(&amp;sctx-&gt;backref_cache);</div><div class='add'>+		btrfs_lru_cache_clear(&amp;sctx-&gt;dir_created_cache);</div><div class='add'>+		btrfs_lru_cache_clear(&amp;sctx-&gt;dir_utimes_cache);</div><div class='ctx'> </div><div class='del'>-		name_cache_free(sctx);</div><div class='add'>+		if (sctx-&gt;cur_inode_path.buf != sctx-&gt;cur_inode_path.inline_buf)</div><div class='add'>+			kfree(sctx-&gt;cur_inode_path.buf);</div><div class='ctx'> </div><div class='ctx'> 		kfree(sctx);</div><div class='ctx'> 	}</div><div class='head'>diff --git a/fs/btrfs/send.h b/fs/btrfs/send.h<br/>index 23bcefc84e49..652bb28f63d4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/send.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/send.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/send.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/send.h</a></div><div class='hunk'>@@ -7,12 +7,28 @@</div><div class='ctx'> #ifndef BTRFS_SEND_H</div><div class='ctx'> #define BTRFS_SEND_H</div><div class='ctx'> </div><div class='del'>-#include "ctree.h"</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+#include &lt;linux/sizes.h&gt;</div><div class='add'>+#include &lt;linux/align.h&gt;</div><div class='add'>+</div><div class='add'>+struct btrfs_root;</div><div class='add'>+struct btrfs_ioctl_send_args;</div><div class='ctx'> </div><div class='ctx'> #define BTRFS_SEND_STREAM_MAGIC "btrfs-stream"</div><div class='del'>-#define BTRFS_SEND_STREAM_VERSION 1</div><div class='add'>+/* Conditional support for the upcoming protocol version. */</div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+#define BTRFS_SEND_STREAM_VERSION 3</div><div class='add'>+#else</div><div class='add'>+#define BTRFS_SEND_STREAM_VERSION 2</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='del'>-#define BTRFS_SEND_BUF_SIZE SZ_64K</div><div class='add'>+/*</div><div class='add'>+ * In send stream v1, no command is larger than 64K. In send stream v2, no</div><div class='add'>+ * limit should be assumed, the buffer size is set to be a header with</div><div class='add'>+ * compressed extent size.</div><div class='add'>+ */</div><div class='add'>+#define BTRFS_SEND_BUF_SIZE_V1				SZ_64K</div><div class='add'>+#define BTRFS_SEND_BUF_SIZE_V2	ALIGN(SZ_16K + BTRFS_MAX_COMPRESSED, PAGE_SIZE)</div><div class='ctx'> </div><div class='ctx'> enum btrfs_tlv_type {</div><div class='ctx'> 	BTRFS_TLV_U8,</div><div class='hunk'>@@ -46,87 +62,126 @@ struct btrfs_tlv_header {</div><div class='ctx'> </div><div class='ctx'> /* commands */</div><div class='ctx'> enum btrfs_send_cmd {</div><div class='del'>-	BTRFS_SEND_C_UNSPEC,</div><div class='add'>+	BTRFS_SEND_C_UNSPEC		= 0,</div><div class='ctx'> </div><div class='ctx'> 	/* Version 1 */</div><div class='del'>-	BTRFS_SEND_C_SUBVOL,</div><div class='del'>-	BTRFS_SEND_C_SNAPSHOT,</div><div class='add'>+	BTRFS_SEND_C_SUBVOL		= 1,</div><div class='add'>+	BTRFS_SEND_C_SNAPSHOT		= 2,</div><div class='ctx'> </div><div class='del'>-	BTRFS_SEND_C_MKFILE,</div><div class='del'>-	BTRFS_SEND_C_MKDIR,</div><div class='del'>-	BTRFS_SEND_C_MKNOD,</div><div class='del'>-	BTRFS_SEND_C_MKFIFO,</div><div class='del'>-	BTRFS_SEND_C_MKSOCK,</div><div class='del'>-	BTRFS_SEND_C_SYMLINK,</div><div class='add'>+	BTRFS_SEND_C_MKFILE		= 3,</div><div class='add'>+	BTRFS_SEND_C_MKDIR		= 4,</div><div class='add'>+	BTRFS_SEND_C_MKNOD		= 5,</div><div class='add'>+	BTRFS_SEND_C_MKFIFO		= 6,</div><div class='add'>+	BTRFS_SEND_C_MKSOCK		= 7,</div><div class='add'>+	BTRFS_SEND_C_SYMLINK		= 8,</div><div class='ctx'> </div><div class='del'>-	BTRFS_SEND_C_RENAME,</div><div class='del'>-	BTRFS_SEND_C_LINK,</div><div class='del'>-	BTRFS_SEND_C_UNLINK,</div><div class='del'>-	BTRFS_SEND_C_RMDIR,</div><div class='add'>+	BTRFS_SEND_C_RENAME		= 9,</div><div class='add'>+	BTRFS_SEND_C_LINK		= 10,</div><div class='add'>+	BTRFS_SEND_C_UNLINK		= 11,</div><div class='add'>+	BTRFS_SEND_C_RMDIR		= 12,</div><div class='ctx'> </div><div class='del'>-	BTRFS_SEND_C_SET_XATTR,</div><div class='del'>-	BTRFS_SEND_C_REMOVE_XATTR,</div><div class='add'>+	BTRFS_SEND_C_SET_XATTR		= 13,</div><div class='add'>+	BTRFS_SEND_C_REMOVE_XATTR	= 14,</div><div class='ctx'> </div><div class='del'>-	BTRFS_SEND_C_WRITE,</div><div class='del'>-	BTRFS_SEND_C_CLONE,</div><div class='add'>+	BTRFS_SEND_C_WRITE		= 15,</div><div class='add'>+	BTRFS_SEND_C_CLONE		= 16,</div><div class='ctx'> </div><div class='del'>-	BTRFS_SEND_C_TRUNCATE,</div><div class='del'>-	BTRFS_SEND_C_CHMOD,</div><div class='del'>-	BTRFS_SEND_C_CHOWN,</div><div class='del'>-	BTRFS_SEND_C_UTIMES,</div><div class='add'>+	BTRFS_SEND_C_TRUNCATE		= 17,</div><div class='add'>+	BTRFS_SEND_C_CHMOD		= 18,</div><div class='add'>+	BTRFS_SEND_C_CHOWN		= 19,</div><div class='add'>+	BTRFS_SEND_C_UTIMES		= 20,</div><div class='ctx'> </div><div class='del'>-	BTRFS_SEND_C_END,</div><div class='del'>-	BTRFS_SEND_C_UPDATE_EXTENT,</div><div class='del'>-	__BTRFS_SEND_C_MAX_V1,</div><div class='add'>+	BTRFS_SEND_C_END		= 21,</div><div class='add'>+	BTRFS_SEND_C_UPDATE_EXTENT	= 22,</div><div class='add'>+	BTRFS_SEND_C_MAX_V1		= 22,</div><div class='ctx'> </div><div class='ctx'> 	/* Version 2 */</div><div class='del'>-	__BTRFS_SEND_C_MAX_V2,</div><div class='del'>-</div><div class='add'>+	BTRFS_SEND_C_FALLOCATE		= 23,</div><div class='add'>+	BTRFS_SEND_C_FILEATTR		= 24,</div><div class='add'>+	BTRFS_SEND_C_ENCODED_WRITE	= 25,</div><div class='add'>+	BTRFS_SEND_C_MAX_V2		= 25,</div><div class='add'>+</div><div class='add'>+	/* Version 3 */</div><div class='add'>+	BTRFS_SEND_C_ENABLE_VERITY	= 26,</div><div class='add'>+	BTRFS_SEND_C_MAX_V3		= 26,</div><div class='ctx'> 	/* End */</div><div class='del'>-	__BTRFS_SEND_C_MAX,</div><div class='add'>+	BTRFS_SEND_C_MAX		= 26,</div><div class='ctx'> };</div><div class='del'>-#define BTRFS_SEND_C_MAX (__BTRFS_SEND_C_MAX - 1)</div><div class='ctx'> </div><div class='ctx'> /* attributes in send stream */</div><div class='ctx'> enum {</div><div class='del'>-	BTRFS_SEND_A_UNSPEC,</div><div class='del'>-</div><div class='del'>-	BTRFS_SEND_A_UUID,</div><div class='del'>-	BTRFS_SEND_A_CTRANSID,</div><div class='del'>-</div><div class='del'>-	BTRFS_SEND_A_INO,</div><div class='del'>-	BTRFS_SEND_A_SIZE,</div><div class='del'>-	BTRFS_SEND_A_MODE,</div><div class='del'>-	BTRFS_SEND_A_UID,</div><div class='del'>-	BTRFS_SEND_A_GID,</div><div class='del'>-	BTRFS_SEND_A_RDEV,</div><div class='del'>-	BTRFS_SEND_A_CTIME,</div><div class='del'>-	BTRFS_SEND_A_MTIME,</div><div class='del'>-	BTRFS_SEND_A_ATIME,</div><div class='del'>-	BTRFS_SEND_A_OTIME,</div><div class='del'>-</div><div class='del'>-	BTRFS_SEND_A_XATTR_NAME,</div><div class='del'>-	BTRFS_SEND_A_XATTR_DATA,</div><div class='del'>-</div><div class='del'>-	BTRFS_SEND_A_PATH,</div><div class='del'>-	BTRFS_SEND_A_PATH_TO,</div><div class='del'>-	BTRFS_SEND_A_PATH_LINK,</div><div class='del'>-</div><div class='del'>-	BTRFS_SEND_A_FILE_OFFSET,</div><div class='del'>-	BTRFS_SEND_A_DATA,</div><div class='del'>-</div><div class='del'>-	BTRFS_SEND_A_CLONE_UUID,</div><div class='del'>-	BTRFS_SEND_A_CLONE_CTRANSID,</div><div class='del'>-	BTRFS_SEND_A_CLONE_PATH,</div><div class='del'>-	BTRFS_SEND_A_CLONE_OFFSET,</div><div class='del'>-	BTRFS_SEND_A_CLONE_LEN,</div><div class='del'>-</div><div class='del'>-	__BTRFS_SEND_A_MAX,</div><div class='add'>+	BTRFS_SEND_A_UNSPEC		= 0,</div><div class='add'>+</div><div class='add'>+	/* Version 1 */</div><div class='add'>+	BTRFS_SEND_A_UUID		= 1,</div><div class='add'>+	BTRFS_SEND_A_CTRANSID		= 2,</div><div class='add'>+</div><div class='add'>+	BTRFS_SEND_A_INO		= 3,</div><div class='add'>+	BTRFS_SEND_A_SIZE		= 4,</div><div class='add'>+	BTRFS_SEND_A_MODE		= 5,</div><div class='add'>+	BTRFS_SEND_A_UID		= 6,</div><div class='add'>+	BTRFS_SEND_A_GID		= 7,</div><div class='add'>+	BTRFS_SEND_A_RDEV		= 8,</div><div class='add'>+	BTRFS_SEND_A_CTIME		= 9,</div><div class='add'>+	BTRFS_SEND_A_MTIME		= 10,</div><div class='add'>+	BTRFS_SEND_A_ATIME		= 11,</div><div class='add'>+	BTRFS_SEND_A_OTIME		= 12,</div><div class='add'>+</div><div class='add'>+	BTRFS_SEND_A_XATTR_NAME		= 13,</div><div class='add'>+	BTRFS_SEND_A_XATTR_DATA		= 14,</div><div class='add'>+</div><div class='add'>+	BTRFS_SEND_A_PATH		= 15,</div><div class='add'>+	BTRFS_SEND_A_PATH_TO		= 16,</div><div class='add'>+	BTRFS_SEND_A_PATH_LINK		= 17,</div><div class='add'>+</div><div class='add'>+	BTRFS_SEND_A_FILE_OFFSET	= 18,</div><div class='add'>+	/*</div><div class='add'>+	 * As of send stream v2, this attribute is special: it must be the last</div><div class='add'>+	 * attribute in a command, its header contains only the type, and its</div><div class='add'>+	 * length is implicitly the remaining length of the command.</div><div class='add'>+	 */</div><div class='add'>+	BTRFS_SEND_A_DATA		= 19,</div><div class='add'>+</div><div class='add'>+	BTRFS_SEND_A_CLONE_UUID		= 20,</div><div class='add'>+	BTRFS_SEND_A_CLONE_CTRANSID	= 21,</div><div class='add'>+	BTRFS_SEND_A_CLONE_PATH		= 22,</div><div class='add'>+	BTRFS_SEND_A_CLONE_OFFSET	= 23,</div><div class='add'>+	BTRFS_SEND_A_CLONE_LEN		= 24,</div><div class='add'>+</div><div class='add'>+	BTRFS_SEND_A_MAX_V1		= 24,</div><div class='add'>+</div><div class='add'>+	/* Version 2 */</div><div class='add'>+	BTRFS_SEND_A_FALLOCATE_MODE	= 25,</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * File attributes from the FS_*_FL namespace (i_flags, xflags),</div><div class='add'>+	 * translated to BTRFS_INODE_* bits (BTRFS_INODE_FLAG_MASK) and stored</div><div class='add'>+	 * in btrfs_inode_item::flags (represented by btrfs_inode::flags and</div><div class='add'>+	 * btrfs_inode::ro_flags).</div><div class='add'>+	 */</div><div class='add'>+	BTRFS_SEND_A_FILEATTR		= 26,</div><div class='add'>+</div><div class='add'>+	BTRFS_SEND_A_UNENCODED_FILE_LEN	= 27,</div><div class='add'>+	BTRFS_SEND_A_UNENCODED_LEN	= 28,</div><div class='add'>+	BTRFS_SEND_A_UNENCODED_OFFSET	= 29,</div><div class='add'>+	/*</div><div class='add'>+	 * COMPRESSION and ENCRYPTION default to NONE (0) if omitted from</div><div class='add'>+	 * BTRFS_SEND_C_ENCODED_WRITE.</div><div class='add'>+	 */</div><div class='add'>+	BTRFS_SEND_A_COMPRESSION	= 30,</div><div class='add'>+	BTRFS_SEND_A_ENCRYPTION		= 31,</div><div class='add'>+	BTRFS_SEND_A_MAX_V2		= 31,</div><div class='add'>+</div><div class='add'>+	/* Version 3 */</div><div class='add'>+	BTRFS_SEND_A_VERITY_ALGORITHM	= 32,</div><div class='add'>+	BTRFS_SEND_A_VERITY_BLOCK_SIZE	= 33,</div><div class='add'>+	BTRFS_SEND_A_VERITY_SALT_DATA	= 34,</div><div class='add'>+	BTRFS_SEND_A_VERITY_SIG_DATA	= 35,</div><div class='add'>+	BTRFS_SEND_A_MAX_V3		= 35,</div><div class='add'>+</div><div class='add'>+	__BTRFS_SEND_A_MAX		= 35,</div><div class='ctx'> };</div><div class='del'>-#define BTRFS_SEND_A_MAX (__BTRFS_SEND_A_MAX - 1)</div><div class='ctx'> </div><div class='del'>-#ifdef __KERNEL__</div><div class='del'>-long btrfs_ioctl_send(struct file *mnt_file, struct btrfs_ioctl_send_args *arg);</div><div class='del'>-#endif</div><div class='add'>+long btrfs_ioctl_send(struct btrfs_root *send_root, const struct btrfs_ioctl_send_args *arg);</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/btrfs/space-info.c b/fs/btrfs/space-info.c<br/>index 48d77f360a24..6babbe333741 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/space-info.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/space-info.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/space-info.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/space-info.c</a></div><div class='hunk'>@@ -1,5 +1,7 @@</div><div class='ctx'> // SPDX-License-Identifier: GPL-2.0</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/spinlock.h&gt;</div><div class='add'>+#include &lt;linux/minmax.h&gt;</div><div class='ctx'> #include "misc.h"</div><div class='ctx'> #include "ctree.h"</div><div class='ctx'> #include "space-info.h"</div><div class='hunk'>@@ -9,6 +11,11 @@</div><div class='ctx'> #include "ordered-data.h"</div><div class='ctx'> #include "transaction.h"</div><div class='ctx'> #include "block-group.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "extent-tree.h"</div><div class='add'>+#include "zoned.h"</div><div class='add'>+#include "delayed-inode.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * HOW DOES SPACE RESERVATION WORK</div><div class='hunk'>@@ -44,11 +51,11 @@</div><div class='ctx'>  *   num_bytes we want to reserve.</div><div class='ctx'>  *</div><div class='ctx'>  *   -&gt;reserve</div><div class='del'>- *     space_info-&gt;bytes_may_reserve += num_bytes</div><div class='add'>+ *     space_info-&gt;bytes_may_use += num_bytes</div><div class='ctx'>  *</div><div class='ctx'>  *   -&gt;extent allocation</div><div class='ctx'>  *     Call btrfs_add_reserved_bytes() which does</div><div class='del'>- *     space_info-&gt;bytes_may_reserve -= num_bytes</div><div class='add'>+ *     space_info-&gt;bytes_may_use -= num_bytes</div><div class='ctx'>  *     space_info-&gt;bytes_reserved += extent_bytes</div><div class='ctx'>  *</div><div class='ctx'>  *   -&gt;insert reference</div><div class='hunk'>@@ -61,7 +68,7 @@</div><div class='ctx'>  *   Assume we are unable to simply make the reservation because we do not have</div><div class='ctx'>  *   enough space</div><div class='ctx'>  *</div><div class='del'>- *   -&gt; __reserve_bytes</div><div class='add'>+ *   -&gt; reserve_bytes</div><div class='ctx'>  *     create a reserve_ticket with -&gt;bytes set to our reservation, add it to</div><div class='ctx'>  *     the tail of space_info-&gt;tickets, kick async flush thread</div><div class='ctx'>  *</div><div class='hunk'>@@ -122,6 +129,14 @@</div><div class='ctx'>  *     churn a lot and we can avoid making some extent tree modifications if we</div><div class='ctx'>  *     are able to delay for as long as possible.</div><div class='ctx'>  *</div><div class='add'>+ *   RESET_ZONES</div><div class='add'>+ *     This state works only for the zoned mode. On the zoned mode, we cannot</div><div class='add'>+ *     reuse once allocated then freed region until we reset the zone, due to</div><div class='add'>+ *     the sequential write zone requirement. The RESET_ZONES state resets the</div><div class='add'>+ *     zones of an unused block group and let us reuse the space. The reusing</div><div class='add'>+ *     is faster than removing the block group and allocating another block</div><div class='add'>+ *     group on the zones.</div><div class='add'>+ *</div><div class='ctx'>  *   ALLOC_CHUNK</div><div class='ctx'>  *     We will skip this the first time through space reservation, because of</div><div class='ctx'>  *     overcommit and we don't want to have a lot of useless metadata space when</div><div class='hunk'>@@ -158,15 +173,14 @@</div><div class='ctx'>  *   thing with or without extra unallocated space.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-u64 __pure btrfs_space_info_used(struct btrfs_space_info *s_info,</div><div class='del'>-			  bool may_use_included)</div><div class='del'>-{</div><div class='del'>-	ASSERT(s_info);</div><div class='del'>-	return s_info-&gt;bytes_used + s_info-&gt;bytes_reserved +</div><div class='del'>-		s_info-&gt;bytes_pinned + s_info-&gt;bytes_readonly +</div><div class='del'>-		s_info-&gt;bytes_zone_unusable +</div><div class='del'>-		(may_use_included ? s_info-&gt;bytes_may_use : 0);</div><div class='del'>-}</div><div class='add'>+struct reserve_ticket {</div><div class='add'>+	u64 bytes;</div><div class='add'>+	int error;</div><div class='add'>+	bool steal;</div><div class='add'>+	struct list_head list;</div><div class='add'>+	wait_queue_head_t wait;</div><div class='add'>+	spinlock_t lock;</div><div class='add'>+};</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * after adding space to the filesystem, we need to clear the full flags</div><div class='hunk'>@@ -178,21 +192,53 @@ void btrfs_clear_space_info_full(struct btrfs_fs_info *info)</div><div class='ctx'> 	struct btrfs_space_info *found;</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(found, head, list)</div><div class='del'>-		found-&gt;full = 0;</div><div class='add'>+		found-&gt;full = false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int create_space_info(struct btrfs_fs_info *info, u64 flags)</div><div class='add'>+/*</div><div class='add'>+ * Block groups with more than this value (percents) of unusable space will be</div><div class='add'>+ * scheduled for background reclaim.</div><div class='add'>+ */</div><div class='add'>+#define BTRFS_DEFAULT_ZONED_RECLAIM_THRESH			(75)</div><div class='add'>+</div><div class='add'>+#define BTRFS_UNALLOC_BLOCK_GROUP_TARGET			(10ULL)</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Calculate chunk size depending on volume type (regular or zoned).</div><div class='add'>+ */</div><div class='add'>+static u64 calc_chunk_size(const struct btrfs_fs_info *fs_info, u64 flags)</div><div class='ctx'> {</div><div class='add'>+	if (btrfs_is_zoned(fs_info))</div><div class='add'>+		return fs_info-&gt;zone_size;</div><div class='ctx'> </div><div class='del'>-	struct btrfs_space_info *space_info;</div><div class='del'>-	int i;</div><div class='del'>-	int ret;</div><div class='add'>+	ASSERT(flags &amp; BTRFS_BLOCK_GROUP_TYPE_MASK, "flags=%llu", flags);</div><div class='ctx'> </div><div class='del'>-	space_info = kzalloc(sizeof(*space_info), GFP_NOFS);</div><div class='del'>-	if (!space_info)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	if (flags &amp; BTRFS_BLOCK_GROUP_DATA)</div><div class='add'>+		return BTRFS_MAX_DATA_CHUNK_SIZE;</div><div class='add'>+	else if (flags &amp; BTRFS_BLOCK_GROUP_SYSTEM)</div><div class='add'>+		return SZ_32M;</div><div class='add'>+</div><div class='add'>+	/* Handle BTRFS_BLOCK_GROUP_METADATA */</div><div class='add'>+	if (fs_info-&gt;fs_devices-&gt;total_rw_bytes &gt; 50ULL * SZ_1G)</div><div class='add'>+		return SZ_1G;</div><div class='add'>+</div><div class='add'>+	return SZ_256M;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; BTRFS_NR_RAID_TYPES; i++)</div><div class='add'>+/*</div><div class='add'>+ * Update default chunk size.</div><div class='add'>+ */</div><div class='add'>+void btrfs_update_space_info_chunk_size(struct btrfs_space_info *space_info,</div><div class='add'>+					u64 chunk_size)</div><div class='add'>+{</div><div class='add'>+	WRITE_ONCE(space_info-&gt;chunk_size, chunk_size);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void init_space_info(struct btrfs_fs_info *info,</div><div class='add'>+			    struct btrfs_space_info *space_info, u64 flags)</div><div class='add'>+{</div><div class='add'>+	space_info-&gt;fs_info = info;</div><div class='add'>+	for (int i = 0; i &lt; BTRFS_NR_RAID_TYPES; i++)</div><div class='ctx'> 		INIT_LIST_HEAD(&amp;space_info-&gt;block_groups[i]);</div><div class='ctx'> 	init_rwsem(&amp;space_info-&gt;groups_sem);</div><div class='ctx'> 	spin_lock_init(&amp;space_info-&gt;lock);</div><div class='hunk'>@@ -202,8 +248,68 @@ static int create_space_info(struct btrfs_fs_info *info, u64 flags)</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;space_info-&gt;tickets);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;space_info-&gt;priority_tickets);</div><div class='ctx'> 	space_info-&gt;clamp = 1;</div><div class='add'>+	btrfs_update_space_info_chunk_size(space_info, calc_chunk_size(info, flags));</div><div class='add'>+	space_info-&gt;subgroup_id = BTRFS_SUB_GROUP_PRIMARY;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_sysfs_add_space_info_type(info, space_info);</div><div class='add'>+	if (btrfs_is_zoned(info))</div><div class='add'>+		space_info-&gt;bg_reclaim_threshold = BTRFS_DEFAULT_ZONED_RECLAIM_THRESH;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int create_space_info_sub_group(struct btrfs_space_info *parent, u64 flags,</div><div class='add'>+				       enum btrfs_space_info_sub_group id, int index)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = parent-&gt;fs_info;</div><div class='add'>+	struct btrfs_space_info *sub_group;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ASSERT(parent-&gt;subgroup_id == BTRFS_SUB_GROUP_PRIMARY,</div><div class='add'>+	       "parent-&gt;subgroup_id=%d", parent-&gt;subgroup_id);</div><div class='add'>+	ASSERT(id != BTRFS_SUB_GROUP_PRIMARY, "id=%d", id);</div><div class='add'>+</div><div class='add'>+	sub_group = kzalloc(sizeof(*sub_group), GFP_NOFS);</div><div class='add'>+	if (!sub_group)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	init_space_info(fs_info, sub_group, flags);</div><div class='add'>+	parent-&gt;sub_group[index] = sub_group;</div><div class='add'>+	sub_group-&gt;parent = parent;</div><div class='add'>+	sub_group-&gt;subgroup_id = id;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_sysfs_add_space_info_type(sub_group);</div><div class='add'>+	if (ret) {</div><div class='add'>+		kfree(sub_group);</div><div class='add'>+		parent-&gt;sub_group[index] = NULL;</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int create_space_info(struct btrfs_fs_info *info, u64 flags)</div><div class='add'>+{</div><div class='add'>+</div><div class='add'>+	struct btrfs_space_info *space_info;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	space_info = kzalloc(sizeof(*space_info), GFP_NOFS);</div><div class='add'>+	if (!space_info)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	init_space_info(info, space_info, flags);</div><div class='add'>+</div><div class='add'>+	if (btrfs_is_zoned(info)) {</div><div class='add'>+		if (flags &amp; BTRFS_BLOCK_GROUP_DATA)</div><div class='add'>+			ret = create_space_info_sub_group(space_info, flags,</div><div class='add'>+							  BTRFS_SUB_GROUP_DATA_RELOC,</div><div class='add'>+							  0);</div><div class='add'>+		else if (flags &amp; BTRFS_BLOCK_GROUP_METADATA)</div><div class='add'>+			ret = create_space_info_sub_group(space_info, flags,</div><div class='add'>+							  BTRFS_SUB_GROUP_TREELOG,</div><div class='add'>+							  0);</div><div class='add'>+</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_sysfs_add_space_info_type(space_info);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='hunk'>@@ -251,30 +357,32 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_update_space_info(struct btrfs_fs_info *info, u64 flags,</div><div class='del'>-			     u64 total_bytes, u64 bytes_used,</div><div class='del'>-			     u64 bytes_readonly, u64 bytes_zone_unusable,</div><div class='del'>-			     struct btrfs_space_info **space_info)</div><div class='add'>+void btrfs_add_bg_to_space_info(struct btrfs_fs_info *info,</div><div class='add'>+				struct btrfs_block_group *block_group)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_space_info *found;</div><div class='del'>-	int factor;</div><div class='add'>+	struct btrfs_space_info *space_info = block_group-&gt;space_info;</div><div class='add'>+	int factor, index;</div><div class='ctx'> </div><div class='del'>-	factor = btrfs_bg_type_to_factor(flags);</div><div class='del'>-</div><div class='del'>-	found = btrfs_find_space_info(info, flags);</div><div class='del'>-	ASSERT(found);</div><div class='del'>-	spin_lock(&amp;found-&gt;lock);</div><div class='del'>-	found-&gt;total_bytes += total_bytes;</div><div class='del'>-	found-&gt;disk_total += total_bytes * factor;</div><div class='del'>-	found-&gt;bytes_used += bytes_used;</div><div class='del'>-	found-&gt;disk_used += bytes_used * factor;</div><div class='del'>-	found-&gt;bytes_readonly += bytes_readonly;</div><div class='del'>-	found-&gt;bytes_zone_unusable += bytes_zone_unusable;</div><div class='del'>-	if (total_bytes &gt; 0)</div><div class='del'>-		found-&gt;full = 0;</div><div class='del'>-	btrfs_try_granting_tickets(info, found);</div><div class='del'>-	spin_unlock(&amp;found-&gt;lock);</div><div class='del'>-	*space_info = found;</div><div class='add'>+	factor = btrfs_bg_type_to_factor(block_group-&gt;flags);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;space_info-&gt;lock);</div><div class='add'>+	space_info-&gt;total_bytes += block_group-&gt;length;</div><div class='add'>+	space_info-&gt;disk_total += block_group-&gt;length * factor;</div><div class='add'>+	space_info-&gt;bytes_used += block_group-&gt;used;</div><div class='add'>+	space_info-&gt;disk_used += block_group-&gt;used * factor;</div><div class='add'>+	space_info-&gt;bytes_readonly += block_group-&gt;bytes_super;</div><div class='add'>+	btrfs_space_info_update_bytes_zone_unusable(space_info, block_group-&gt;zone_unusable);</div><div class='add'>+	if (block_group-&gt;length &gt; 0)</div><div class='add'>+		space_info-&gt;full = false;</div><div class='add'>+	btrfs_try_granting_tickets(space_info);</div><div class='add'>+	spin_unlock(&amp;space_info-&gt;lock);</div><div class='add'>+</div><div class='add'>+	block_group-&gt;space_info = space_info;</div><div class='add'>+</div><div class='add'>+	index = btrfs_bg_flags_to_raid_index(block_group-&gt;flags);</div><div class='add'>+	down_write(&amp;space_info-&gt;groups_sem);</div><div class='add'>+	list_add_tail(&amp;block_group-&gt;list, &amp;space_info-&gt;block_groups[index]);</div><div class='add'>+	up_write(&amp;space_info-&gt;groups_sem);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct btrfs_space_info *btrfs_find_space_info(struct btrfs_fs_info *info,</div><div class='hunk'>@@ -292,12 +400,35 @@ struct btrfs_space_info *btrfs_find_space_info(struct btrfs_fs_info *info,</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static u64 calc_available_free_space(struct btrfs_fs_info *fs_info,</div><div class='del'>-			  struct btrfs_space_info *space_info,</div><div class='del'>-			  enum btrfs_reserve_flush_enum flush)</div><div class='add'>+static u64 calc_effective_data_chunk_size(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_space_info *data_sinfo;</div><div class='add'>+	u64 data_chunk_size;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Calculate the data_chunk_size, space_info-&gt;chunk_size is the</div><div class='add'>+	 * "optimal" chunk size based on the fs size.  However when we actually</div><div class='add'>+	 * allocate the chunk we will strip this down further, making it no</div><div class='add'>+	 * more than 10% of the disk or 1G, whichever is smaller.</div><div class='add'>+	 *</div><div class='add'>+	 * On the zoned mode, we need to use zone_size (= data_sinfo-&gt;chunk_size)</div><div class='add'>+	 * as it is.</div><div class='add'>+	 */</div><div class='add'>+	data_sinfo = btrfs_find_space_info(fs_info, BTRFS_BLOCK_GROUP_DATA);</div><div class='add'>+	if (btrfs_is_zoned(fs_info))</div><div class='add'>+		return data_sinfo-&gt;chunk_size;</div><div class='add'>+	data_chunk_size = min(data_sinfo-&gt;chunk_size,</div><div class='add'>+			      mult_perc(fs_info-&gt;fs_devices-&gt;total_rw_bytes, 10));</div><div class='add'>+	return min_t(u64, data_chunk_size, SZ_1G);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static u64 calc_available_free_space(const struct btrfs_space_info *space_info,</div><div class='add'>+				     enum btrfs_reserve_flush_enum flush)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = space_info-&gt;fs_info;</div><div class='ctx'> 	u64 profile;</div><div class='ctx'> 	u64 avail;</div><div class='add'>+	u64 data_chunk_size;</div><div class='ctx'> 	int factor;</div><div class='ctx'> </div><div class='ctx'> 	if (space_info-&gt;flags &amp; BTRFS_BLOCK_GROUP_SYSTEM)</div><div class='hunk'>@@ -315,6 +446,27 @@ static u64 calc_available_free_space(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	 */</div><div class='ctx'> 	factor = btrfs_bg_type_to_factor(profile);</div><div class='ctx'> 	avail = div_u64(avail, factor);</div><div class='add'>+	if (avail == 0)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	data_chunk_size = calc_effective_data_chunk_size(fs_info);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Since data allocations immediately use block groups as part of the</div><div class='add'>+	 * reservation, because we assume that data reservations will == actual</div><div class='add'>+	 * usage, we could potentially overcommit and then immediately have that</div><div class='add'>+	 * available space used by a data allocation, which could put us in a</div><div class='add'>+	 * bind when we get close to filling the file system.</div><div class='add'>+	 *</div><div class='add'>+	 * To handle this simply remove the data_chunk_size from the available</div><div class='add'>+	 * space.  If we are relatively empty this won't affect our ability to</div><div class='add'>+	 * overcommit much, and if we're very close to full it'll keep us from</div><div class='add'>+	 * getting into a position where we've given ourselves very little</div><div class='add'>+	 * metadata wiggle room.</div><div class='add'>+	 */</div><div class='add'>+	if (avail &lt;= data_chunk_size)</div><div class='add'>+		return 0;</div><div class='add'>+	avail -= data_chunk_size;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If we aren't flushing all things, let us overcommit up to</div><div class='hunk'>@@ -325,47 +477,91 @@ static u64 calc_available_free_space(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		avail &gt;&gt;= 3;</div><div class='ctx'> 	else</div><div class='ctx'> 		avail &gt;&gt;= 1;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * On the zoned mode, we always allocate one zone as one chunk.</div><div class='add'>+	 * Returning non-zone size aligned bytes here will result in</div><div class='add'>+	 * less pressure for the async metadata reclaim process, and it</div><div class='add'>+	 * will over-commit too much leading to ENOSPC. Align down to the</div><div class='add'>+	 * zone size to avoid that.</div><div class='add'>+	 */</div><div class='add'>+	if (btrfs_is_zoned(fs_info))</div><div class='add'>+		avail = ALIGN_DOWN(avail, fs_info-&gt;zone_size);</div><div class='add'>+</div><div class='ctx'> 	return avail;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_can_overcommit(struct btrfs_fs_info *fs_info,</div><div class='del'>-			 struct btrfs_space_info *space_info, u64 bytes,</div><div class='del'>-			 enum btrfs_reserve_flush_enum flush)</div><div class='add'>+static inline bool check_can_overcommit(const struct btrfs_space_info *space_info,</div><div class='add'>+					u64 space_info_used_bytes, u64 bytes,</div><div class='add'>+					enum btrfs_reserve_flush_enum flush)</div><div class='add'>+{</div><div class='add'>+	const u64 avail = calc_available_free_space(space_info, flush);</div><div class='add'>+</div><div class='add'>+	return (space_info_used_bytes + bytes &lt; space_info-&gt;total_bytes + avail);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool can_overcommit(const struct btrfs_space_info *space_info,</div><div class='add'>+				  u64 space_info_used_bytes, u64 bytes,</div><div class='add'>+				  enum btrfs_reserve_flush_enum flush)</div><div class='add'>+{</div><div class='add'>+	/* Don't overcommit when in mixed mode. */</div><div class='add'>+	if (space_info-&gt;flags &amp; BTRFS_BLOCK_GROUP_DATA)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	return check_can_overcommit(space_info, space_info_used_bytes, bytes, flush);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool btrfs_can_overcommit(const struct btrfs_space_info *space_info, u64 bytes,</div><div class='add'>+			  enum btrfs_reserve_flush_enum flush)</div><div class='ctx'> {</div><div class='del'>-	u64 avail;</div><div class='ctx'> 	u64 used;</div><div class='ctx'> </div><div class='ctx'> 	/* Don't overcommit when in mixed mode */</div><div class='ctx'> 	if (space_info-&gt;flags &amp; BTRFS_BLOCK_GROUP_DATA)</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	used = btrfs_space_info_used(space_info, true);</div><div class='del'>-	avail = calc_available_free_space(fs_info, space_info, flush);</div><div class='ctx'> </div><div class='del'>-	if (used + bytes &lt; space_info-&gt;total_bytes + avail)</div><div class='del'>-		return 1;</div><div class='del'>-	return 0;</div><div class='add'>+	return check_can_overcommit(space_info, used, bytes, flush);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void remove_ticket(struct btrfs_space_info *space_info,</div><div class='del'>-			  struct reserve_ticket *ticket)</div><div class='add'>+			  struct reserve_ticket *ticket, int error)</div><div class='ctx'> {</div><div class='add'>+	lockdep_assert_held(&amp;space_info-&gt;lock);</div><div class='add'>+</div><div class='ctx'> 	if (!list_empty(&amp;ticket-&gt;list)) {</div><div class='ctx'> 		list_del_init(&amp;ticket-&gt;list);</div><div class='del'>-		ASSERT(space_info-&gt;reclaim_size &gt;= ticket-&gt;bytes);</div><div class='add'>+		ASSERT(space_info-&gt;reclaim_size &gt;= ticket-&gt;bytes,</div><div class='add'>+		       "space_info-&gt;reclaim_size=%llu ticket-&gt;bytes=%llu",</div><div class='add'>+		       space_info-&gt;reclaim_size, ticket-&gt;bytes);</div><div class='ctx'> 		space_info-&gt;reclaim_size -= ticket-&gt;bytes;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;ticket-&gt;lock);</div><div class='add'>+	/*</div><div class='add'>+	 * If we are called from a task waiting on the ticket, it may happen</div><div class='add'>+	 * that before it sets an error on the ticket, a reclaim task was able</div><div class='add'>+	 * to satisfy the ticket. In that case ignore the error.</div><div class='add'>+	 */</div><div class='add'>+	if (error &amp;&amp; ticket-&gt;bytes &gt; 0)</div><div class='add'>+		ticket-&gt;error = error;</div><div class='add'>+	else</div><div class='add'>+		ticket-&gt;bytes = 0;</div><div class='add'>+</div><div class='add'>+	wake_up(&amp;ticket-&gt;wait);</div><div class='add'>+	spin_unlock(&amp;ticket-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * This is for space we already have accounted in space_info-&gt;bytes_may_use, so</div><div class='ctx'>  * basically when we're returning space from block_rsv's.</div><div class='ctx'>  */</div><div class='del'>-void btrfs_try_granting_tickets(struct btrfs_fs_info *fs_info,</div><div class='del'>-				struct btrfs_space_info *space_info)</div><div class='add'>+void btrfs_try_granting_tickets(struct btrfs_space_info *space_info)</div><div class='ctx'> {</div><div class='ctx'> 	struct list_head *head;</div><div class='ctx'> 	enum btrfs_reserve_flush_enum flush = BTRFS_RESERVE_NO_FLUSH;</div><div class='add'>+	u64 used = btrfs_space_info_used(space_info, true);</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;space_info-&gt;lock);</div><div class='ctx'> </div><div class='hunk'>@@ -373,21 +569,18 @@ void btrfs_try_granting_tickets(struct btrfs_fs_info *fs_info,</div><div class='ctx'> again:</div><div class='ctx'> 	while (!list_empty(head)) {</div><div class='ctx'> 		struct reserve_ticket *ticket;</div><div class='del'>-		u64 used = btrfs_space_info_used(space_info, true);</div><div class='add'>+		u64 used_after;</div><div class='ctx'> </div><div class='ctx'> 		ticket = list_first_entry(head, struct reserve_ticket, list);</div><div class='add'>+		used_after = used + ticket-&gt;bytes;</div><div class='ctx'> </div><div class='ctx'> 		/* Check and see if our ticket can be satisfied now. */</div><div class='del'>-		if ((used + ticket-&gt;bytes &lt;= space_info-&gt;total_bytes) ||</div><div class='del'>-		    btrfs_can_overcommit(fs_info, space_info, ticket-&gt;bytes,</div><div class='del'>-					 flush)) {</div><div class='del'>-			btrfs_space_info_update_bytes_may_use(fs_info,</div><div class='del'>-							      space_info,</div><div class='del'>-							      ticket-&gt;bytes);</div><div class='del'>-			remove_ticket(space_info, ticket);</div><div class='del'>-			ticket-&gt;bytes = 0;</div><div class='add'>+		if (used_after &lt;= space_info-&gt;total_bytes ||</div><div class='add'>+		    can_overcommit(space_info, used, ticket-&gt;bytes, flush)) {</div><div class='add'>+			btrfs_space_info_update_bytes_may_use(space_info, ticket-&gt;bytes);</div><div class='add'>+			remove_ticket(space_info, ticket, 0);</div><div class='ctx'> 			space_info-&gt;tickets_id++;</div><div class='del'>-			wake_up(&amp;ticket-&gt;wait);</div><div class='add'>+			used = used_after;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -409,39 +602,61 @@ do {									\</div><div class='ctx'> 	spin_unlock(&amp;__rsv-&gt;lock);					\</div><div class='ctx'> } while (0)</div><div class='ctx'> </div><div class='del'>-static void __btrfs_dump_space_info(struct btrfs_fs_info *fs_info,</div><div class='del'>-				    struct btrfs_space_info *info)</div><div class='add'>+static const char *space_info_flag_to_str(const struct btrfs_space_info *space_info)</div><div class='ctx'> {</div><div class='add'>+	switch (space_info-&gt;flags) {</div><div class='add'>+	case BTRFS_BLOCK_GROUP_SYSTEM:</div><div class='add'>+		return "SYSTEM";</div><div class='add'>+	case BTRFS_BLOCK_GROUP_METADATA | BTRFS_BLOCK_GROUP_DATA:</div><div class='add'>+		return "DATA+METADATA";</div><div class='add'>+	case BTRFS_BLOCK_GROUP_DATA:</div><div class='add'>+		return "DATA";</div><div class='add'>+	case BTRFS_BLOCK_GROUP_METADATA:</div><div class='add'>+		return "METADATA";</div><div class='add'>+	default:</div><div class='add'>+		return "UNKNOWN";</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void dump_global_block_rsv(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	DUMP_BLOCK_RSV(fs_info, global_block_rsv);</div><div class='add'>+	DUMP_BLOCK_RSV(fs_info, trans_block_rsv);</div><div class='add'>+	DUMP_BLOCK_RSV(fs_info, chunk_block_rsv);</div><div class='add'>+	DUMP_BLOCK_RSV(fs_info, delayed_block_rsv);</div><div class='add'>+	DUMP_BLOCK_RSV(fs_info, delayed_refs_rsv);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void __btrfs_dump_space_info(const struct btrfs_space_info *info)</div><div class='add'>+{</div><div class='add'>+	const struct btrfs_fs_info *fs_info = info-&gt;fs_info;</div><div class='add'>+	const char *flag_str = space_info_flag_to_str(info);</div><div class='ctx'> 	lockdep_assert_held(&amp;info-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	/* The free space could be negative in case of overcommit */</div><div class='del'>-	btrfs_info(fs_info, "space_info %llu has %lld free, is %sfull",</div><div class='del'>-		   info-&gt;flags,</div><div class='add'>+	btrfs_info(fs_info,</div><div class='add'>+		   "space_info %s (sub-group id %d) has %lld free, is %sfull",</div><div class='add'>+		   flag_str, info-&gt;subgroup_id,</div><div class='ctx'> 		   (s64)(info-&gt;total_bytes - btrfs_space_info_used(info, true)),</div><div class='ctx'> 		   info-&gt;full ? "" : "not ");</div><div class='ctx'> 	btrfs_info(fs_info,</div><div class='del'>-		"space_info total=%llu, used=%llu, pinned=%llu, reserved=%llu, may_use=%llu, readonly=%llu zone_unusable=%llu",</div><div class='add'>+"space_info total=%llu, used=%llu, pinned=%llu, reserved=%llu, may_use=%llu, readonly=%llu zone_unusable=%llu",</div><div class='ctx'> 		info-&gt;total_bytes, info-&gt;bytes_used, info-&gt;bytes_pinned,</div><div class='ctx'> 		info-&gt;bytes_reserved, info-&gt;bytes_may_use,</div><div class='ctx'> 		info-&gt;bytes_readonly, info-&gt;bytes_zone_unusable);</div><div class='del'>-</div><div class='del'>-	DUMP_BLOCK_RSV(fs_info, global_block_rsv);</div><div class='del'>-	DUMP_BLOCK_RSV(fs_info, trans_block_rsv);</div><div class='del'>-	DUMP_BLOCK_RSV(fs_info, chunk_block_rsv);</div><div class='del'>-	DUMP_BLOCK_RSV(fs_info, delayed_block_rsv);</div><div class='del'>-	DUMP_BLOCK_RSV(fs_info, delayed_refs_rsv);</div><div class='del'>-</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_dump_space_info(struct btrfs_fs_info *fs_info,</div><div class='del'>-			   struct btrfs_space_info *info, u64 bytes,</div><div class='del'>-			   int dump_block_groups)</div><div class='add'>+void btrfs_dump_space_info(struct btrfs_space_info *info, u64 bytes,</div><div class='add'>+			   bool dump_block_groups)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = info-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_block_group *cache;</div><div class='add'>+	u64 total_avail = 0;</div><div class='ctx'> 	int index = 0;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;info-&gt;lock);</div><div class='del'>-	__btrfs_dump_space_info(fs_info, info);</div><div class='add'>+	__btrfs_dump_space_info(info);</div><div class='add'>+	dump_global_block_rsv(fs_info);</div><div class='ctx'> 	spin_unlock(&amp;info-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	if (!dump_block_groups)</div><div class='hunk'>@@ -450,21 +665,29 @@ void btrfs_dump_space_info(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	down_read(&amp;info-&gt;groups_sem);</div><div class='ctx'> again:</div><div class='ctx'> 	list_for_each_entry(cache, &amp;info-&gt;block_groups[index], list) {</div><div class='add'>+		u64 avail;</div><div class='add'>+</div><div class='ctx'> 		spin_lock(&amp;cache-&gt;lock);</div><div class='add'>+		avail = cache-&gt;length - cache-&gt;used - cache-&gt;pinned -</div><div class='add'>+			cache-&gt;reserved - cache-&gt;bytes_super - cache-&gt;zone_unusable;</div><div class='ctx'> 		btrfs_info(fs_info,</div><div class='del'>-			"block group %llu has %llu bytes, %llu used %llu pinned %llu reserved %llu zone_unusable %s",</div><div class='del'>-			cache-&gt;start, cache-&gt;length, cache-&gt;used, cache-&gt;pinned,</div><div class='del'>-			cache-&gt;reserved, cache-&gt;zone_unusable,</div><div class='del'>-			cache-&gt;ro ? "[readonly]" : "");</div><div class='add'>+"block group %llu has %llu bytes, %llu used %llu pinned %llu reserved %llu delalloc %llu super %llu zone_unusable (%llu bytes available) %s",</div><div class='add'>+			   cache-&gt;start, cache-&gt;length, cache-&gt;used, cache-&gt;pinned,</div><div class='add'>+			   cache-&gt;reserved, cache-&gt;delalloc_bytes,</div><div class='add'>+			   cache-&gt;bytes_super, cache-&gt;zone_unusable,</div><div class='add'>+			   avail, cache-&gt;ro ? "[readonly]" : "");</div><div class='ctx'> 		spin_unlock(&amp;cache-&gt;lock);</div><div class='ctx'> 		btrfs_dump_free_space(cache, bytes);</div><div class='add'>+		total_avail += avail;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (++index &lt; BTRFS_NR_RAID_TYPES)</div><div class='ctx'> 		goto again;</div><div class='ctx'> 	up_read(&amp;info-&gt;groups_sem);</div><div class='add'>+</div><div class='add'>+	btrfs_info(fs_info, "%llu bytes available across all block groups", total_avail);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u64 calc_reclaim_items_nr(struct btrfs_fs_info *fs_info,</div><div class='add'>+static inline u64 calc_reclaim_items_nr(const struct btrfs_fs_info *fs_info,</div><div class='ctx'> 					u64 to_reclaim)</div><div class='ctx'> {</div><div class='ctx'> 	u64 bytes;</div><div class='hunk'>@@ -477,16 +700,14 @@ static inline u64 calc_reclaim_items_nr(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	return nr;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#define EXTENT_SIZE_PER_ITEM	SZ_256K</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * shrink metadata reservation for delalloc</div><div class='ctx'>  */</div><div class='del'>-static void shrink_delalloc(struct btrfs_fs_info *fs_info,</div><div class='del'>-			    struct btrfs_space_info *space_info,</div><div class='add'>+static void shrink_delalloc(struct btrfs_space_info *space_info,</div><div class='ctx'> 			    u64 to_reclaim, bool wait_ordered,</div><div class='ctx'> 			    bool for_preempt)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = space_info-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	u64 delalloc_bytes;</div><div class='ctx'> 	u64 ordered_bytes;</div><div class='hunk'>@@ -519,7 +740,7 @@ static void shrink_delalloc(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		items = calc_reclaim_items_nr(fs_info, to_reclaim) * 2;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	trans = (struct btrfs_trans_handle *)current-&gt;journal_info;</div><div class='add'>+	trans = current-&gt;journal_info;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If we are doing more ordered than delalloc we need to just wait on</div><div class='hunk'>@@ -578,7 +799,7 @@ static void shrink_delalloc(struct btrfs_fs_info *fs_info,</div><div class='ctx'> skip_async:</div><div class='ctx'> 		loops++;</div><div class='ctx'> 		if (wait_ordered &amp;&amp; !trans) {</div><div class='del'>-			btrfs_wait_ordered_roots(fs_info, items, 0, (u64)-1);</div><div class='add'>+			btrfs_wait_ordered_roots(fs_info, items, NULL);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			time_left = schedule_timeout_killable(1);</div><div class='ctx'> 			if (time_left)</div><div class='hunk'>@@ -613,11 +834,11 @@ skip_async:</div><div class='ctx'>  * and may fail for various reasons. The caller is supposed to examine the</div><div class='ctx'>  * state of @space_info to detect the outcome.</div><div class='ctx'>  */</div><div class='del'>-static void flush_space(struct btrfs_fs_info *fs_info,</div><div class='del'>-		       struct btrfs_space_info *space_info, u64 num_bytes,</div><div class='del'>-		       enum btrfs_flush_state state, bool for_preempt)</div><div class='add'>+static void flush_space(struct btrfs_space_info *space_info, u64 num_bytes,</div><div class='add'>+			enum btrfs_flush_state state, bool for_preempt)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *root = fs_info-&gt;extent_root;</div><div class='add'>+	struct btrfs_fs_info *fs_info = space_info-&gt;fs_info;</div><div class='add'>+	struct btrfs_root *root = fs_info-&gt;tree_root;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	int nr;</div><div class='ctx'> 	int ret = 0;</div><div class='hunk'>@@ -630,9 +851,11 @@ static void flush_space(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		else</div><div class='ctx'> 			nr = -1;</div><div class='ctx'> </div><div class='del'>-		trans = btrfs_join_transaction(root);</div><div class='add'>+		trans = btrfs_join_transaction_nostart(root);</div><div class='ctx'> 		if (IS_ERR(trans)) {</div><div class='ctx'> 			ret = PTR_ERR(trans);</div><div class='add'>+			if (ret == -ENOENT)</div><div class='add'>+				ret = 0;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 		ret = btrfs_run_delayed_items_nr(trans, nr);</div><div class='hunk'>@@ -643,21 +866,22 @@ static void flush_space(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	case FLUSH_DELALLOC_FULL:</div><div class='ctx'> 		if (state == FLUSH_DELALLOC_FULL)</div><div class='ctx'> 			num_bytes = U64_MAX;</div><div class='del'>-		shrink_delalloc(fs_info, space_info, num_bytes,</div><div class='add'>+		shrink_delalloc(space_info, num_bytes,</div><div class='ctx'> 				state != FLUSH_DELALLOC, for_preempt);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case FLUSH_DELAYED_REFS_NR:</div><div class='ctx'> 	case FLUSH_DELAYED_REFS:</div><div class='del'>-		trans = btrfs_join_transaction(root);</div><div class='add'>+		trans = btrfs_join_transaction_nostart(root);</div><div class='ctx'> 		if (IS_ERR(trans)) {</div><div class='ctx'> 			ret = PTR_ERR(trans);</div><div class='add'>+			if (ret == -ENOENT)</div><div class='add'>+				ret = 0;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (state == FLUSH_DELAYED_REFS_NR)</div><div class='del'>-			nr = calc_reclaim_items_nr(fs_info, num_bytes);</div><div class='add'>+			btrfs_run_delayed_refs(trans, num_bytes);</div><div class='ctx'> 		else</div><div class='del'>-			nr = 0;</div><div class='del'>-		btrfs_run_delayed_refs(trans, nr);</div><div class='add'>+			btrfs_run_delayed_refs(trans, 0);</div><div class='ctx'> 		btrfs_end_transaction(trans);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case ALLOC_CHUNK:</div><div class='hunk'>@@ -667,11 +891,12 @@ static void flush_space(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			ret = PTR_ERR(trans);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-		ret = btrfs_chunk_alloc(trans,</div><div class='add'>+		ret = btrfs_chunk_alloc(trans, space_info,</div><div class='ctx'> 				btrfs_get_alloc_profile(fs_info, space_info-&gt;flags),</div><div class='ctx'> 				(state == ALLOC_CHUNK) ? CHUNK_ALLOC_NO_FORCE :</div><div class='ctx'> 					CHUNK_ALLOC_FORCE);</div><div class='ctx'> 		btrfs_end_transaction(trans);</div><div class='add'>+</div><div class='ctx'> 		if (ret &gt; 0 || ret == -ENOSPC)</div><div class='ctx'> 			ret = 0;</div><div class='ctx'> 		break;</div><div class='hunk'>@@ -686,12 +911,17 @@ static void flush_space(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		break;</div><div class='ctx'> 	case COMMIT_TRANS:</div><div class='ctx'> 		ASSERT(current-&gt;journal_info == NULL);</div><div class='del'>-		trans = btrfs_join_transaction(root);</div><div class='del'>-		if (IS_ERR(trans)) {</div><div class='del'>-			ret = PTR_ERR(trans);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		ret = btrfs_commit_transaction(trans);</div><div class='add'>+		/*</div><div class='add'>+		 * We don't want to start a new transaction, just attach to the</div><div class='add'>+		 * current one or wait it fully commits in case its commit is</div><div class='add'>+		 * happening at the moment. Note: we don't use a nostart join</div><div class='add'>+		 * because that does not wait for a transaction to fully commit</div><div class='add'>+		 * (only for it to be unblocked, state TRANS_STATE_UNBLOCKED).</div><div class='add'>+		 */</div><div class='add'>+		ret = btrfs_commit_current_transaction(root);</div><div class='add'>+		break;</div><div class='add'>+	case RESET_ZONES:</div><div class='add'>+		ret = btrfs_reset_unused_block_groups(space_info, num_bytes);</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		ret = -ENOSPC;</div><div class='hunk'>@@ -703,9 +933,7 @@ static void flush_space(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	return;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u64</div><div class='del'>-btrfs_calc_reclaim_metadata_size(struct btrfs_fs_info *fs_info,</div><div class='del'>-				 struct btrfs_space_info *space_info)</div><div class='add'>+static u64 btrfs_calc_reclaim_metadata_size(const struct btrfs_space_info *space_info)</div><div class='ctx'> {</div><div class='ctx'> 	u64 used;</div><div class='ctx'> 	u64 avail;</div><div class='hunk'>@@ -713,8 +941,7 @@ btrfs_calc_reclaim_metadata_size(struct btrfs_fs_info *fs_info,</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;space_info-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	avail = calc_available_free_space(fs_info, space_info,</div><div class='del'>-					  BTRFS_RESERVE_FLUSH_ALL);</div><div class='add'>+	avail = calc_available_free_space(space_info, BTRFS_RESERVE_FLUSH_ALL);</div><div class='ctx'> 	used = btrfs_space_info_used(space_info, true);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -729,14 +956,25 @@ btrfs_calc_reclaim_metadata_size(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	return to_reclaim;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool need_preemptive_reclaim(struct btrfs_fs_info *fs_info,</div><div class='del'>-				    struct btrfs_space_info *space_info)</div><div class='add'>+static bool need_preemptive_reclaim(const struct btrfs_space_info *space_info)</div><div class='ctx'> {</div><div class='del'>-	u64 global_rsv_size = fs_info-&gt;global_block_rsv.reserved;</div><div class='add'>+	struct btrfs_fs_info *fs_info = space_info-&gt;fs_info;</div><div class='add'>+	const u64 global_rsv_size = btrfs_block_rsv_reserved(&amp;fs_info-&gt;global_block_rsv);</div><div class='ctx'> 	u64 ordered, delalloc;</div><div class='del'>-	u64 thresh = div_factor_fine(space_info-&gt;total_bytes, 90);</div><div class='add'>+	u64 thresh;</div><div class='ctx'> 	u64 used;</div><div class='ctx'> </div><div class='add'>+	lockdep_assert_held(&amp;space_info-&gt;lock);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We have tickets queued, bail so we don't compete with the async</div><div class='add'>+	 * flushers.</div><div class='add'>+	 */</div><div class='add'>+	if (space_info-&gt;reclaim_size)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	thresh = mult_perc(space_info-&gt;total_bytes, 90);</div><div class='add'>+</div><div class='ctx'> 	/* If we're just plain full then async reclaim just slows us down. */</div><div class='ctx'> 	if ((space_info-&gt;bytes_used + space_info-&gt;bytes_reserved +</div><div class='ctx'> 	     global_rsv_size) &gt;= thresh)</div><div class='hunk'>@@ -757,13 +995,6 @@ static bool need_preemptive_reclaim(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * We have tickets queued, bail so we don't compete with the async</div><div class='del'>-	 * flushers.</div><div class='del'>-	 */</div><div class='del'>-	if (space_info-&gt;reclaim_size)</div><div class='del'>-		return false;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='ctx'> 	 * If we have over half of the free space occupied by reservations or</div><div class='ctx'> 	 * pinned then we want to start flushing.</div><div class='ctx'> 	 *</div><div class='hunk'>@@ -792,8 +1023,7 @@ static bool need_preemptive_reclaim(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	 * much delalloc we need for the background flusher to kick in.</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='del'>-	thresh = calc_available_free_space(fs_info, space_info,</div><div class='del'>-					   BTRFS_RESERVE_FLUSH_ALL);</div><div class='add'>+	thresh = calc_available_free_space(space_info, BTRFS_RESERVE_FLUSH_ALL);</div><div class='ctx'> 	used = space_info-&gt;bytes_used + space_info-&gt;bytes_reserved +</div><div class='ctx'> 	       space_info-&gt;bytes_readonly + global_rsv_size;</div><div class='ctx'> 	if (used &lt; space_info-&gt;total_bytes)</div><div class='hunk'>@@ -828,8 +1058,8 @@ static bool need_preemptive_reclaim(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	ordered = percpu_counter_read_positive(&amp;fs_info-&gt;ordered_bytes) &gt;&gt; 1;</div><div class='ctx'> 	delalloc = percpu_counter_read_positive(&amp;fs_info-&gt;delalloc_bytes);</div><div class='ctx'> 	if (ordered &gt;= delalloc)</div><div class='del'>-		used += fs_info-&gt;delayed_refs_rsv.reserved +</div><div class='del'>-			fs_info-&gt;delayed_block_rsv.reserved;</div><div class='add'>+		used += btrfs_block_rsv_reserved(&amp;fs_info-&gt;delayed_refs_rsv) +</div><div class='add'>+			btrfs_block_rsv_reserved(&amp;fs_info-&gt;delayed_block_rsv);</div><div class='ctx'> 	else</div><div class='ctx'> 		used += space_info-&gt;bytes_may_use - global_rsv_size;</div><div class='ctx'> </div><div class='hunk'>@@ -837,37 +1067,41 @@ static bool need_preemptive_reclaim(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		!test_bit(BTRFS_FS_STATE_REMOUNTING, &amp;fs_info-&gt;fs_state));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool steal_from_global_rsv(struct btrfs_fs_info *fs_info,</div><div class='del'>-				  struct btrfs_space_info *space_info,</div><div class='add'>+static bool steal_from_global_rsv(struct btrfs_space_info *space_info,</div><div class='ctx'> 				  struct reserve_ticket *ticket)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = space_info-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_block_rsv *global_rsv = &amp;fs_info-&gt;global_block_rsv;</div><div class='ctx'> 	u64 min_bytes;</div><div class='ctx'> </div><div class='add'>+	lockdep_assert_held(&amp;space_info-&gt;lock);</div><div class='add'>+</div><div class='add'>+	if (!ticket-&gt;steal)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='ctx'> 	if (global_rsv-&gt;space_info != space_info)</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;global_rsv-&gt;lock);</div><div class='del'>-	min_bytes = div_factor(global_rsv-&gt;size, 1);</div><div class='add'>+	min_bytes = mult_perc(global_rsv-&gt;size, 10);</div><div class='ctx'> 	if (global_rsv-&gt;reserved &lt; min_bytes + ticket-&gt;bytes) {</div><div class='ctx'> 		spin_unlock(&amp;global_rsv-&gt;lock);</div><div class='ctx'> 		return false;</div><div class='ctx'> 	}</div><div class='ctx'> 	global_rsv-&gt;reserved -= ticket-&gt;bytes;</div><div class='del'>-	remove_ticket(space_info, ticket);</div><div class='del'>-	ticket-&gt;bytes = 0;</div><div class='del'>-	wake_up(&amp;ticket-&gt;wait);</div><div class='del'>-	space_info-&gt;tickets_id++;</div><div class='ctx'> 	if (global_rsv-&gt;reserved &lt; global_rsv-&gt;size)</div><div class='del'>-		global_rsv-&gt;full = 0;</div><div class='add'>+		global_rsv-&gt;full = false;</div><div class='ctx'> 	spin_unlock(&amp;global_rsv-&gt;lock);</div><div class='ctx'> </div><div class='add'>+	remove_ticket(space_info, ticket, 0);</div><div class='add'>+	space_info-&gt;tickets_id++;</div><div class='add'>+</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * maybe_fail_all_tickets - we've exhausted our flushing, start failing tickets</div><div class='del'>- * @fs_info - fs_info for this fs</div><div class='add'>+ * We've exhausted our flushing, start failing tickets.</div><div class='add'>+ *</div><div class='ctx'>  * @space_info - the space info we were flushing</div><div class='ctx'>  *</div><div class='ctx'>  * We call this when we've exhausted our flushing ability and haven't made</div><div class='hunk'>@@ -880,73 +1114,66 @@ static bool steal_from_global_rsv(struct btrfs_fs_info *fs_info,</div><div class='ctx'>  * other tickets, or if it stumbles across a ticket that was smaller than the</div><div class='ctx'>  * first ticket.</div><div class='ctx'>  */</div><div class='del'>-static bool maybe_fail_all_tickets(struct btrfs_fs_info *fs_info,</div><div class='del'>-				   struct btrfs_space_info *space_info)</div><div class='add'>+static bool maybe_fail_all_tickets(struct btrfs_space_info *space_info)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = space_info-&gt;fs_info;</div><div class='ctx'> 	struct reserve_ticket *ticket;</div><div class='ctx'> 	u64 tickets_id = space_info-&gt;tickets_id;</div><div class='del'>-	const bool aborted = BTRFS_FS_ERROR(fs_info);</div><div class='add'>+	const int abort_error = BTRFS_FS_ERROR(fs_info);</div><div class='ctx'> </div><div class='ctx'> 	trace_btrfs_fail_all_tickets(fs_info, space_info);</div><div class='ctx'> </div><div class='ctx'> 	if (btrfs_test_opt(fs_info, ENOSPC_DEBUG)) {</div><div class='ctx'> 		btrfs_info(fs_info, "cannot satisfy tickets, dumping space info");</div><div class='del'>-		__btrfs_dump_space_info(fs_info, space_info);</div><div class='add'>+		__btrfs_dump_space_info(space_info);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	while (!list_empty(&amp;space_info-&gt;tickets) &amp;&amp;</div><div class='ctx'> 	       tickets_id == space_info-&gt;tickets_id) {</div><div class='ctx'> 		ticket = list_first_entry(&amp;space_info-&gt;tickets,</div><div class='ctx'> 					  struct reserve_ticket, list);</div><div class='add'>+		if (unlikely(abort_error)) {</div><div class='add'>+			remove_ticket(space_info, ticket, abort_error);</div><div class='add'>+		} else {</div><div class='add'>+			if (steal_from_global_rsv(space_info, ticket))</div><div class='add'>+				return true;</div><div class='ctx'> </div><div class='del'>-		if (!aborted &amp;&amp; ticket-&gt;steal &amp;&amp;</div><div class='del'>-		    steal_from_global_rsv(fs_info, space_info, ticket))</div><div class='del'>-			return true;</div><div class='del'>-</div><div class='del'>-		if (!aborted &amp;&amp; btrfs_test_opt(fs_info, ENOSPC_DEBUG))</div><div class='del'>-			btrfs_info(fs_info, "failing ticket with %llu bytes",</div><div class='del'>-				   ticket-&gt;bytes);</div><div class='add'>+			if (btrfs_test_opt(fs_info, ENOSPC_DEBUG))</div><div class='add'>+				btrfs_info(fs_info, "failing ticket with %llu bytes",</div><div class='add'>+					   ticket-&gt;bytes);</div><div class='ctx'> </div><div class='del'>-		remove_ticket(space_info, ticket);</div><div class='del'>-		if (aborted)</div><div class='del'>-			ticket-&gt;error = -EIO;</div><div class='del'>-		else</div><div class='del'>-			ticket-&gt;error = -ENOSPC;</div><div class='del'>-		wake_up(&amp;ticket-&gt;wait);</div><div class='add'>+			remove_ticket(space_info, ticket, -ENOSPC);</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * We're just throwing tickets away, so more flushing may not</div><div class='del'>-		 * trip over btrfs_try_granting_tickets, so we need to call it</div><div class='del'>-		 * here to see if we can make progress with the next ticket in</div><div class='del'>-		 * the list.</div><div class='del'>-		 */</div><div class='del'>-		if (!aborted)</div><div class='del'>-			btrfs_try_granting_tickets(fs_info, space_info);</div><div class='add'>+			/*</div><div class='add'>+			 * We're just throwing tickets away, so more flushing may</div><div class='add'>+			 * not trip over btrfs_try_granting_tickets, so we need</div><div class='add'>+			 * to call it here to see if we can make progress with</div><div class='add'>+			 * the next ticket in the list.</div><div class='add'>+			 */</div><div class='add'>+			btrfs_try_granting_tickets(space_info);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> 	return (tickets_id != space_info-&gt;tickets_id);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * This is for normal flushers, we can wait all goddamned day if we want to.  We</div><div class='del'>- * will loop and continuously try to flush as long as we are making progress.</div><div class='del'>- * We count progress as clearing off tickets each time we have to loop.</div><div class='del'>- */</div><div class='del'>-static void btrfs_async_reclaim_metadata_space(struct work_struct *work)</div><div class='add'>+static void do_async_reclaim_metadata_space(struct btrfs_space_info *space_info)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info;</div><div class='del'>-	struct btrfs_space_info *space_info;</div><div class='add'>+	struct btrfs_fs_info *fs_info = space_info-&gt;fs_info;</div><div class='ctx'> 	u64 to_reclaim;</div><div class='ctx'> 	enum btrfs_flush_state flush_state;</div><div class='ctx'> 	int commit_cycles = 0;</div><div class='ctx'> 	u64 last_tickets_id;</div><div class='add'>+	enum btrfs_flush_state final_state;</div><div class='ctx'> </div><div class='del'>-	fs_info = container_of(work, struct btrfs_fs_info, async_reclaim_work);</div><div class='del'>-	space_info = btrfs_find_space_info(fs_info, BTRFS_BLOCK_GROUP_METADATA);</div><div class='add'>+	if (btrfs_is_zoned(fs_info))</div><div class='add'>+		final_state = RESET_ZONES;</div><div class='add'>+	else</div><div class='add'>+		final_state = COMMIT_TRANS;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;space_info-&gt;lock);</div><div class='del'>-	to_reclaim = btrfs_calc_reclaim_metadata_size(fs_info, space_info);</div><div class='add'>+	to_reclaim = btrfs_calc_reclaim_metadata_size(space_info);</div><div class='ctx'> 	if (!to_reclaim) {</div><div class='del'>-		space_info-&gt;flush = 0;</div><div class='add'>+		space_info-&gt;flush = false;</div><div class='ctx'> 		spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -955,15 +1182,14 @@ static void btrfs_async_reclaim_metadata_space(struct work_struct *work)</div><div class='ctx'> </div><div class='ctx'> 	flush_state = FLUSH_DELAYED_ITEMS_NR;</div><div class='ctx'> 	do {</div><div class='del'>-		flush_space(fs_info, space_info, to_reclaim, flush_state, false);</div><div class='add'>+		flush_space(space_info, to_reclaim, flush_state, false);</div><div class='ctx'> 		spin_lock(&amp;space_info-&gt;lock);</div><div class='ctx'> 		if (list_empty(&amp;space_info-&gt;tickets)) {</div><div class='del'>-			space_info-&gt;flush = 0;</div><div class='add'>+			space_info-&gt;flush = false;</div><div class='ctx'> 			spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> 			return;</div><div class='ctx'> 		}</div><div class='del'>-		to_reclaim = btrfs_calc_reclaim_metadata_size(fs_info,</div><div class='del'>-							      space_info);</div><div class='add'>+		to_reclaim = btrfs_calc_reclaim_metadata_size(space_info);</div><div class='ctx'> 		if (last_tickets_id == space_info-&gt;tickets_id) {</div><div class='ctx'> 			flush_state++;</div><div class='ctx'> 		} else {</div><div class='hunk'>@@ -994,21 +1220,40 @@ static void btrfs_async_reclaim_metadata_space(struct work_struct *work)</div><div class='ctx'> 		if (flush_state == ALLOC_CHUNK_FORCE &amp;&amp; !commit_cycles)</div><div class='ctx'> 			flush_state++;</div><div class='ctx'> </div><div class='del'>-		if (flush_state &gt; COMMIT_TRANS) {</div><div class='add'>+		if (flush_state &gt; final_state) {</div><div class='ctx'> 			commit_cycles++;</div><div class='ctx'> 			if (commit_cycles &gt; 2) {</div><div class='del'>-				if (maybe_fail_all_tickets(fs_info, space_info)) {</div><div class='add'>+				if (maybe_fail_all_tickets(space_info)) {</div><div class='ctx'> 					flush_state = FLUSH_DELAYED_ITEMS_NR;</div><div class='ctx'> 					commit_cycles--;</div><div class='ctx'> 				} else {</div><div class='del'>-					space_info-&gt;flush = 0;</div><div class='add'>+					space_info-&gt;flush = false;</div><div class='ctx'> 				}</div><div class='ctx'> 			} else {</div><div class='ctx'> 				flush_state = FLUSH_DELAYED_ITEMS_NR;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 		spin_unlock(&amp;space_info-&gt;lock);</div><div class='del'>-	} while (flush_state &lt;= COMMIT_TRANS);</div><div class='add'>+	} while (flush_state &lt;= final_state);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * This is for normal flushers, it can wait as much time as needed. We will</div><div class='add'>+ * loop and continuously try to flush as long as we are making progress.  We</div><div class='add'>+ * count progress as clearing off tickets each time we have to loop.</div><div class='add'>+ */</div><div class='add'>+static void btrfs_async_reclaim_metadata_space(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info;</div><div class='add'>+	struct btrfs_space_info *space_info;</div><div class='add'>+</div><div class='add'>+	fs_info = container_of(work, struct btrfs_fs_info, async_reclaim_work);</div><div class='add'>+	space_info = btrfs_find_space_info(fs_info, BTRFS_BLOCK_GROUP_METADATA);</div><div class='add'>+	do_async_reclaim_metadata_space(space_info);</div><div class='add'>+	for (int i = 0; i &lt; BTRFS_SPACE_INFO_SUB_GROUP_MAX; i++) {</div><div class='add'>+		if (space_info-&gt;sub_group[i])</div><div class='add'>+			do_async_reclaim_metadata_space(space_info-&gt;sub_group[i]);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1038,14 +1283,15 @@ static void btrfs_preempt_reclaim_metadata_space(struct work_struct *work)</div><div class='ctx'> 	trans_rsv = &amp;fs_info-&gt;trans_block_rsv;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;space_info-&gt;lock);</div><div class='del'>-	while (need_preemptive_reclaim(fs_info, space_info)) {</div><div class='add'>+	while (need_preemptive_reclaim(space_info)) {</div><div class='ctx'> 		enum btrfs_flush_state flush;</div><div class='ctx'> 		u64 delalloc_size = 0;</div><div class='ctx'> 		u64 to_reclaim, block_rsv_size;</div><div class='del'>-		u64 global_rsv_size = global_rsv-&gt;reserved;</div><div class='del'>-</div><div class='del'>-		loops++;</div><div class='add'>+		const u64 global_rsv_size = btrfs_block_rsv_reserved(global_rsv);</div><div class='add'>+		const u64 bytes_may_use = space_info-&gt;bytes_may_use;</div><div class='add'>+		const u64 bytes_pinned = space_info-&gt;bytes_pinned;</div><div class='ctx'> </div><div class='add'>+		spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We don't have a precise counter for the metadata being</div><div class='ctx'> 		 * reserved for delalloc, so we'll approximate it by subtracting</div><div class='hunk'>@@ -1054,12 +1300,11 @@ static void btrfs_preempt_reclaim_metadata_space(struct work_struct *work)</div><div class='ctx'> 		 * assume it's tied up in delalloc reservations.</div><div class='ctx'> 		 */</div><div class='ctx'> 		block_rsv_size = global_rsv_size +</div><div class='del'>-			delayed_block_rsv-&gt;reserved +</div><div class='del'>-			delayed_refs_rsv-&gt;reserved +</div><div class='del'>-			trans_rsv-&gt;reserved;</div><div class='del'>-		if (block_rsv_size &lt; space_info-&gt;bytes_may_use)</div><div class='del'>-			delalloc_size = space_info-&gt;bytes_may_use - block_rsv_size;</div><div class='del'>-		spin_unlock(&amp;space_info-&gt;lock);</div><div class='add'>+			btrfs_block_rsv_reserved(delayed_block_rsv) +</div><div class='add'>+			btrfs_block_rsv_reserved(delayed_refs_rsv) +</div><div class='add'>+			btrfs_block_rsv_reserved(trans_rsv);</div><div class='add'>+		if (block_rsv_size &lt; bytes_may_use)</div><div class='add'>+			delalloc_size = bytes_may_use - block_rsv_size;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We don't want to include the global_rsv in our calculation,</div><div class='hunk'>@@ -1076,20 +1321,22 @@ static void btrfs_preempt_reclaim_metadata_space(struct work_struct *work)</div><div class='ctx'> 		if (delalloc_size &gt; block_rsv_size) {</div><div class='ctx'> 			to_reclaim = delalloc_size;</div><div class='ctx'> 			flush = FLUSH_DELALLOC;</div><div class='del'>-		} else if (space_info-&gt;bytes_pinned &gt;</div><div class='del'>-			   (delayed_block_rsv-&gt;reserved +</div><div class='del'>-			    delayed_refs_rsv-&gt;reserved)) {</div><div class='del'>-			to_reclaim = space_info-&gt;bytes_pinned;</div><div class='add'>+		} else if (bytes_pinned &gt;</div><div class='add'>+			   (btrfs_block_rsv_reserved(delayed_block_rsv) +</div><div class='add'>+			    btrfs_block_rsv_reserved(delayed_refs_rsv))) {</div><div class='add'>+			to_reclaim = bytes_pinned;</div><div class='ctx'> 			flush = COMMIT_TRANS;</div><div class='del'>-		} else if (delayed_block_rsv-&gt;reserved &gt;</div><div class='del'>-			   delayed_refs_rsv-&gt;reserved) {</div><div class='del'>-			to_reclaim = delayed_block_rsv-&gt;reserved;</div><div class='add'>+		} else if (btrfs_block_rsv_reserved(delayed_block_rsv) &gt;</div><div class='add'>+			   btrfs_block_rsv_reserved(delayed_refs_rsv)) {</div><div class='add'>+			to_reclaim = btrfs_block_rsv_reserved(delayed_block_rsv);</div><div class='ctx'> 			flush = FLUSH_DELAYED_ITEMS_NR;</div><div class='ctx'> 		} else {</div><div class='del'>-			to_reclaim = delayed_refs_rsv-&gt;reserved;</div><div class='add'>+			to_reclaim = btrfs_block_rsv_reserved(delayed_refs_rsv);</div><div class='ctx'> 			flush = FLUSH_DELAYED_REFS_NR;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		loops++;</div><div class='add'>+</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We don't want to reclaim everything, just a portion, so scale</div><div class='ctx'> 		 * down the to_reclaim by 1/4.  If it takes us down to 0,</div><div class='hunk'>@@ -1098,7 +1345,7 @@ static void btrfs_preempt_reclaim_metadata_space(struct work_struct *work)</div><div class='ctx'> 		to_reclaim &gt;&gt;= 2;</div><div class='ctx'> 		if (!to_reclaim)</div><div class='ctx'> 			to_reclaim = btrfs_calc_insert_metadata_size(fs_info, 1);</div><div class='del'>-		flush_space(fs_info, space_info, to_reclaim, flush, true);</div><div class='add'>+		flush_space(space_info, to_reclaim, flush, true);</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 		spin_lock(&amp;space_info-&gt;lock);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1131,13 +1378,17 @@ static void btrfs_preempt_reclaim_metadata_space(struct work_struct *work)</div><div class='ctx'>  *   If we are freeing inodes, we want to make sure all delayed iputs have</div><div class='ctx'>  *   completed, because they could have been on an inode with i_nlink == 0, and</div><div class='ctx'>  *   thus have been truncated and freed up space.  But again this space is not</div><div class='del'>- *   immediately re-usable, it comes in the form of a delayed ref, which must be</div><div class='add'>+ *   immediately reusable, it comes in the form of a delayed ref, which must be</div><div class='ctx'>  *   run and then the transaction must be committed.</div><div class='ctx'>  *</div><div class='ctx'>  * COMMIT_TRANS</div><div class='ctx'>  *   This is where we reclaim all of the pinned space generated by running the</div><div class='ctx'>  *   iputs</div><div class='ctx'>  *</div><div class='add'>+ * RESET_ZONES</div><div class='add'>+ *   This state works only for the zoned mode. We scan the unused block group</div><div class='add'>+ *   list and reset the zones and reuse the block group.</div><div class='add'>+ *</div><div class='ctx'>  * ALLOC_CHUNK_FORCE</div><div class='ctx'>  *   For data we start with alloc chunk force, however we could have been full</div><div class='ctx'>  *   before, and then the transaction commit could have freed new block groups,</div><div class='hunk'>@@ -1147,22 +1398,19 @@ static const enum btrfs_flush_state data_flush_states[] = {</div><div class='ctx'> 	FLUSH_DELALLOC_FULL,</div><div class='ctx'> 	RUN_DELAYED_IPUTS,</div><div class='ctx'> 	COMMIT_TRANS,</div><div class='add'>+	RESET_ZONES,</div><div class='ctx'> 	ALLOC_CHUNK_FORCE,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static void btrfs_async_reclaim_data_space(struct work_struct *work)</div><div class='add'>+static void do_async_reclaim_data_space(struct btrfs_space_info *space_info)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info;</div><div class='del'>-	struct btrfs_space_info *space_info;</div><div class='add'>+	struct btrfs_fs_info *fs_info = space_info-&gt;fs_info;</div><div class='ctx'> 	u64 last_tickets_id;</div><div class='ctx'> 	enum btrfs_flush_state flush_state = 0;</div><div class='ctx'> </div><div class='del'>-	fs_info = container_of(work, struct btrfs_fs_info, async_data_reclaim_work);</div><div class='del'>-	space_info = fs_info-&gt;data_sinfo;</div><div class='del'>-</div><div class='ctx'> 	spin_lock(&amp;space_info-&gt;lock);</div><div class='ctx'> 	if (list_empty(&amp;space_info-&gt;tickets)) {</div><div class='del'>-		space_info-&gt;flush = 0;</div><div class='add'>+		space_info-&gt;flush = false;</div><div class='ctx'> 		spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1170,27 +1418,27 @@ static void btrfs_async_reclaim_data_space(struct work_struct *work)</div><div class='ctx'> 	spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	while (!space_info-&gt;full) {</div><div class='del'>-		flush_space(fs_info, space_info, U64_MAX, ALLOC_CHUNK_FORCE, false);</div><div class='add'>+		flush_space(space_info, U64_MAX, ALLOC_CHUNK_FORCE, false);</div><div class='ctx'> 		spin_lock(&amp;space_info-&gt;lock);</div><div class='ctx'> 		if (list_empty(&amp;space_info-&gt;tickets)) {</div><div class='del'>-			space_info-&gt;flush = 0;</div><div class='add'>+			space_info-&gt;flush = false;</div><div class='ctx'> 			spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> 			return;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* Something happened, fail everything and bail. */</div><div class='del'>-		if (BTRFS_FS_ERROR(fs_info))</div><div class='add'>+		if (unlikely(BTRFS_FS_ERROR(fs_info)))</div><div class='ctx'> 			goto aborted_fs;</div><div class='ctx'> 		last_tickets_id = space_info-&gt;tickets_id;</div><div class='ctx'> 		spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	while (flush_state &lt; ARRAY_SIZE(data_flush_states)) {</div><div class='del'>-		flush_space(fs_info, space_info, U64_MAX,</div><div class='add'>+		flush_space(space_info, U64_MAX,</div><div class='ctx'> 			    data_flush_states[flush_state], false);</div><div class='ctx'> 		spin_lock(&amp;space_info-&gt;lock);</div><div class='ctx'> 		if (list_empty(&amp;space_info-&gt;tickets)) {</div><div class='del'>-			space_info-&gt;flush = 0;</div><div class='add'>+			space_info-&gt;flush = false;</div><div class='ctx'> 			spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> 			return;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1204,16 +1452,16 @@ static void btrfs_async_reclaim_data_space(struct work_struct *work)</div><div class='ctx'> </div><div class='ctx'> 		if (flush_state &gt;= ARRAY_SIZE(data_flush_states)) {</div><div class='ctx'> 			if (space_info-&gt;full) {</div><div class='del'>-				if (maybe_fail_all_tickets(fs_info, space_info))</div><div class='add'>+				if (maybe_fail_all_tickets(space_info))</div><div class='ctx'> 					flush_state = 0;</div><div class='ctx'> 				else</div><div class='del'>-					space_info-&gt;flush = 0;</div><div class='add'>+					space_info-&gt;flush = false;</div><div class='ctx'> 			} else {</div><div class='ctx'> 				flush_state = 0;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			/* Something happened, fail everything and bail. */</div><div class='del'>-			if (BTRFS_FS_ERROR(fs_info))</div><div class='add'>+			if (unlikely(BTRFS_FS_ERROR(fs_info)))</div><div class='ctx'> 				goto aborted_fs;</div><div class='ctx'> </div><div class='ctx'> 		}</div><div class='hunk'>@@ -1222,11 +1470,24 @@ static void btrfs_async_reclaim_data_space(struct work_struct *work)</div><div class='ctx'> 	return;</div><div class='ctx'> </div><div class='ctx'> aborted_fs:</div><div class='del'>-	maybe_fail_all_tickets(fs_info, space_info);</div><div class='del'>-	space_info-&gt;flush = 0;</div><div class='add'>+	maybe_fail_all_tickets(space_info);</div><div class='add'>+	space_info-&gt;flush = false;</div><div class='ctx'> 	spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void btrfs_async_reclaim_data_space(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info;</div><div class='add'>+	struct btrfs_space_info *space_info;</div><div class='add'>+</div><div class='add'>+	fs_info = container_of(work, struct btrfs_fs_info, async_data_reclaim_work);</div><div class='add'>+	space_info = fs_info-&gt;data_sinfo;</div><div class='add'>+	do_async_reclaim_data_space(space_info);</div><div class='add'>+	for (int i = 0; i &lt; BTRFS_SPACE_INFO_SUB_GROUP_MAX; i++)</div><div class='add'>+		if (space_info-&gt;sub_group[i])</div><div class='add'>+			do_async_reclaim_data_space(space_info-&gt;sub_group[i]);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> void btrfs_init_async_reclaim_work(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	INIT_WORK(&amp;fs_info-&gt;async_reclaim_work, btrfs_async_reclaim_metadata_space);</div><div class='hunk'>@@ -1238,6 +1499,7 @@ void btrfs_init_async_reclaim_work(struct btrfs_fs_info *fs_info)</div><div class='ctx'> static const enum btrfs_flush_state priority_flush_states[] = {</div><div class='ctx'> 	FLUSH_DELAYED_ITEMS_NR,</div><div class='ctx'> 	FLUSH_DELAYED_ITEMS,</div><div class='add'>+	RESET_ZONES,</div><div class='ctx'> 	ALLOC_CHUNK,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -1251,65 +1513,105 @@ static const enum btrfs_flush_state evict_flush_states[] = {</div><div class='ctx'> 	FLUSH_DELALLOC_FULL,</div><div class='ctx'> 	ALLOC_CHUNK,</div><div class='ctx'> 	COMMIT_TRANS,</div><div class='add'>+	RESET_ZONES,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static void priority_reclaim_metadata_space(struct btrfs_fs_info *fs_info,</div><div class='del'>-				struct btrfs_space_info *space_info,</div><div class='del'>-				struct reserve_ticket *ticket,</div><div class='del'>-				const enum btrfs_flush_state *states,</div><div class='del'>-				int states_nr)</div><div class='add'>+static bool is_ticket_served(struct reserve_ticket *ticket)</div><div class='add'>+{</div><div class='add'>+	bool ret;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;ticket-&gt;lock);</div><div class='add'>+	ret = (ticket-&gt;bytes == 0);</div><div class='add'>+	spin_unlock(&amp;ticket-&gt;lock);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void priority_reclaim_metadata_space(struct btrfs_space_info *space_info,</div><div class='add'>+					    struct reserve_ticket *ticket,</div><div class='add'>+					    const enum btrfs_flush_state *states,</div><div class='add'>+					    int states_nr)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = space_info-&gt;fs_info;</div><div class='ctx'> 	u64 to_reclaim;</div><div class='del'>-	int flush_state;</div><div class='add'>+	int flush_state = 0;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;space_info-&gt;lock);</div><div class='del'>-	to_reclaim = btrfs_calc_reclaim_metadata_size(fs_info, space_info);</div><div class='del'>-	if (!to_reclaim) {</div><div class='del'>-		spin_unlock(&amp;space_info-&gt;lock);</div><div class='add'>+	/*</div><div class='add'>+	 * This is the priority reclaim path, so to_reclaim could be &gt;0 still</div><div class='add'>+	 * because we may have only satisfied the priority tickets and still</div><div class='add'>+	 * left non priority tickets on the list.  We would then have</div><div class='add'>+	 * to_reclaim but -&gt;bytes == 0.</div><div class='add'>+	 */</div><div class='add'>+	if (is_ticket_served(ticket))</div><div class='ctx'> 		return;</div><div class='del'>-	}</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;space_info-&gt;lock);</div><div class='add'>+	to_reclaim = btrfs_calc_reclaim_metadata_size(space_info);</div><div class='ctx'> 	spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	flush_state = 0;</div><div class='del'>-	do {</div><div class='del'>-		flush_space(fs_info, space_info, to_reclaim, states[flush_state],</div><div class='del'>-			    false);</div><div class='del'>-		flush_state++;</div><div class='del'>-		spin_lock(&amp;space_info-&gt;lock);</div><div class='del'>-		if (ticket-&gt;bytes == 0) {</div><div class='del'>-			spin_unlock(&amp;space_info-&gt;lock);</div><div class='add'>+	while (flush_state &lt; states_nr) {</div><div class='add'>+		flush_space(space_info, to_reclaim, states[flush_state], false);</div><div class='add'>+		if (is_ticket_served(ticket))</div><div class='ctx'> 			return;</div><div class='del'>-		}</div><div class='del'>-		spin_unlock(&amp;space_info-&gt;lock);</div><div class='del'>-	} while (flush_state &lt; states_nr);</div><div class='add'>+		flush_state++;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;space_info-&gt;lock);</div><div class='add'>+	/*</div><div class='add'>+	 * Attempt to steal from the global rsv if we can, except if the fs was</div><div class='add'>+	 * turned into error mode due to a transaction abort when flushing space</div><div class='add'>+	 * above, in that case fail with the abort error instead of returning</div><div class='add'>+	 * success to the caller if we can steal from the global rsv - this is</div><div class='add'>+	 * just to have caller fail immediately instead of later when trying to</div><div class='add'>+	 * modify the fs, making it easier to debug -ENOSPC problems.</div><div class='add'>+	 */</div><div class='add'>+	if (unlikely(BTRFS_FS_ERROR(fs_info)))</div><div class='add'>+		remove_ticket(space_info, ticket, BTRFS_FS_ERROR(fs_info));</div><div class='add'>+	else if (!steal_from_global_rsv(space_info, ticket))</div><div class='add'>+		remove_ticket(space_info, ticket, -ENOSPC);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We must run try_granting_tickets here because we could be a large</div><div class='add'>+	 * ticket in front of a smaller ticket that can now be satisfied with</div><div class='add'>+	 * the available space.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_try_granting_tickets(space_info);</div><div class='add'>+	spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void priority_reclaim_data_space(struct btrfs_fs_info *fs_info,</div><div class='del'>-					struct btrfs_space_info *space_info,</div><div class='add'>+static void priority_reclaim_data_space(struct btrfs_space_info *space_info,</div><div class='ctx'> 					struct reserve_ticket *ticket)</div><div class='ctx'> {</div><div class='add'>+	/* We could have been granted before we got here. */</div><div class='add'>+	if (is_ticket_served(ticket))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;space_info-&gt;lock);</div><div class='ctx'> 	while (!space_info-&gt;full) {</div><div class='del'>-		flush_space(fs_info, space_info, U64_MAX, ALLOC_CHUNK_FORCE, false);</div><div class='del'>-		spin_lock(&amp;space_info-&gt;lock);</div><div class='del'>-		if (ticket-&gt;bytes == 0) {</div><div class='del'>-			spin_unlock(&amp;space_info-&gt;lock);</div><div class='del'>-			return;</div><div class='del'>-		}</div><div class='ctx'> 		spin_unlock(&amp;space_info-&gt;lock);</div><div class='add'>+		flush_space(space_info, U64_MAX, ALLOC_CHUNK_FORCE, false);</div><div class='add'>+		if (is_ticket_served(ticket))</div><div class='add'>+			return;</div><div class='add'>+		spin_lock(&amp;space_info-&gt;lock);</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	remove_ticket(space_info, ticket, -ENOSPC);</div><div class='add'>+	btrfs_try_granting_tickets(space_info);</div><div class='add'>+	spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void wait_reserve_ticket(struct btrfs_fs_info *fs_info,</div><div class='del'>-				struct btrfs_space_info *space_info,</div><div class='add'>+static void wait_reserve_ticket(struct btrfs_space_info *space_info,</div><div class='ctx'> 				struct reserve_ticket *ticket)</div><div class='ctx'> </div><div class='ctx'> {</div><div class='ctx'> 	DEFINE_WAIT(wait);</div><div class='del'>-	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;space_info-&gt;lock);</div><div class='add'>+	spin_lock(&amp;ticket-&gt;lock);</div><div class='ctx'> 	while (ticket-&gt;bytes &gt; 0 &amp;&amp; ticket-&gt;error == 0) {</div><div class='add'>+		int ret;</div><div class='add'>+</div><div class='ctx'> 		ret = prepare_to_wait_event(&amp;ticket-&gt;wait, &amp;wait, TASK_KILLABLE);</div><div class='add'>+		spin_unlock(&amp;ticket-&gt;lock);</div><div class='ctx'> 		if (ret) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Delete us from the list. After we unlock the space</div><div class='hunk'>@@ -1319,24 +1621,23 @@ static void wait_reserve_ticket(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			 * despite getting an error, resulting in a space leak</div><div class='ctx'> 			 * (bytes_may_use counter of our space_info).</div><div class='ctx'> 			 */</div><div class='del'>-			remove_ticket(space_info, ticket);</div><div class='del'>-			ticket-&gt;error = -EINTR;</div><div class='del'>-			break;</div><div class='add'>+			spin_lock(&amp;space_info-&gt;lock);</div><div class='add'>+			remove_ticket(space_info, ticket, -EINTR);</div><div class='add'>+			spin_unlock(&amp;space_info-&gt;lock);</div><div class='add'>+			return;</div><div class='ctx'> 		}</div><div class='del'>-		spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 		schedule();</div><div class='ctx'> </div><div class='ctx'> 		finish_wait(&amp;ticket-&gt;wait, &amp;wait);</div><div class='del'>-		spin_lock(&amp;space_info-&gt;lock);</div><div class='add'>+		spin_lock(&amp;ticket-&gt;lock);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;space_info-&gt;lock);</div><div class='add'>+	spin_unlock(&amp;ticket-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * Do the appropriate flushing and waiting for a ticket</div><div class='add'>+/*</div><div class='add'>+ * Do the appropriate flushing and waiting for a ticket.</div><div class='ctx'>  *</div><div class='del'>- * @fs_info:    the filesystem</div><div class='ctx'>  * @space_info: space info for the reservation</div><div class='ctx'>  * @ticket:     ticket for the reservation</div><div class='ctx'>  * @start_ns:   timestamp when the reservation started</div><div class='hunk'>@@ -1346,8 +1647,7 @@ static void wait_reserve_ticket(struct btrfs_fs_info *fs_info,</div><div class='ctx'>  * This does the work of figuring out how to flush for the ticket, waiting for</div><div class='ctx'>  * the reservation, and returning the appropriate error if there is one.</div><div class='ctx'>  */</div><div class='del'>-static int handle_reserve_ticket(struct btrfs_fs_info *fs_info,</div><div class='del'>-				 struct btrfs_space_info *space_info,</div><div class='add'>+static int handle_reserve_ticket(struct btrfs_space_info *space_info,</div><div class='ctx'> 				 struct reserve_ticket *ticket,</div><div class='ctx'> 				 u64 start_ns, u64 orig_bytes,</div><div class='ctx'> 				 enum btrfs_reserve_flush_enum flush)</div><div class='hunk'>@@ -1358,45 +1658,27 @@ static int handle_reserve_ticket(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	case BTRFS_RESERVE_FLUSH_DATA:</div><div class='ctx'> 	case BTRFS_RESERVE_FLUSH_ALL:</div><div class='ctx'> 	case BTRFS_RESERVE_FLUSH_ALL_STEAL:</div><div class='del'>-		wait_reserve_ticket(fs_info, space_info, ticket);</div><div class='add'>+		wait_reserve_ticket(space_info, ticket);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case BTRFS_RESERVE_FLUSH_LIMIT:</div><div class='del'>-		priority_reclaim_metadata_space(fs_info, space_info, ticket,</div><div class='add'>+		priority_reclaim_metadata_space(space_info, ticket,</div><div class='ctx'> 						priority_flush_states,</div><div class='ctx'> 						ARRAY_SIZE(priority_flush_states));</div><div class='ctx'> 		break;</div><div class='ctx'> 	case BTRFS_RESERVE_FLUSH_EVICT:</div><div class='del'>-		priority_reclaim_metadata_space(fs_info, space_info, ticket,</div><div class='add'>+		priority_reclaim_metadata_space(space_info, ticket,</div><div class='ctx'> 						evict_flush_states,</div><div class='ctx'> 						ARRAY_SIZE(evict_flush_states));</div><div class='ctx'> 		break;</div><div class='ctx'> 	case BTRFS_RESERVE_FLUSH_FREE_SPACE_INODE:</div><div class='del'>-		priority_reclaim_data_space(fs_info, space_info, ticket);</div><div class='add'>+		priority_reclaim_data_space(space_info, ticket);</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='del'>-		ASSERT(0);</div><div class='add'>+		ASSERT(0, "flush=%d", flush);</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;space_info-&gt;lock);</div><div class='ctx'> 	ret = ticket-&gt;error;</div><div class='del'>-	if (ticket-&gt;bytes || ticket-&gt;error) {</div><div class='del'>-		/*</div><div class='del'>-		 * We were a priority ticket, so we need to delete ourselves</div><div class='del'>-		 * from the list.  Because we could have other priority tickets</div><div class='del'>-		 * behind us that require less space, run</div><div class='del'>-		 * btrfs_try_granting_tickets() to see if their reservations can</div><div class='del'>-		 * now be made.</div><div class='del'>-		 */</div><div class='del'>-		if (!list_empty(&amp;ticket-&gt;list)) {</div><div class='del'>-			remove_ticket(space_info, ticket);</div><div class='del'>-			btrfs_try_granting_tickets(fs_info, space_info);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (!ret)</div><div class='del'>-			ret = -ENOSPC;</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> 	ASSERT(list_empty(&amp;ticket-&gt;list));</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Check that we can't have an error set if the reservation succeeded,</div><div class='hunk'>@@ -1404,9 +1686,10 @@ static int handle_reserve_ticket(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	 * releasing reserved space (if an error happens the expectation is that</div><div class='ctx'> 	 * space wasn't reserved at all).</div><div class='ctx'> 	 */</div><div class='del'>-	ASSERT(!(ticket-&gt;bytes == 0 &amp;&amp; ticket-&gt;error));</div><div class='del'>-	trace_btrfs_reserve_ticket(fs_info, space_info-&gt;flags, orig_bytes,</div><div class='del'>-				   start_ns, flush, ticket-&gt;error);</div><div class='add'>+	ASSERT(!(ticket-&gt;bytes == 0 &amp;&amp; ticket-&gt;error),</div><div class='add'>+	       "ticket-&gt;bytes=%llu ticket-&gt;error=%d", ticket-&gt;bytes, ticket-&gt;error);</div><div class='add'>+	trace_btrfs_reserve_ticket(space_info-&gt;fs_info, space_info-&gt;flags,</div><div class='add'>+				   orig_bytes, start_ns, flush, ticket-&gt;error);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1420,9 +1703,9 @@ static inline bool is_normal_flushing(enum btrfs_reserve_flush_enum flush)</div><div class='ctx'> 		(flush == BTRFS_RESERVE_FLUSH_ALL_STEAL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void maybe_clamp_preempt(struct btrfs_fs_info *fs_info,</div><div class='del'>-				       struct btrfs_space_info *space_info)</div><div class='add'>+static inline void maybe_clamp_preempt(struct btrfs_space_info *space_info)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = space_info-&gt;fs_info;</div><div class='ctx'> 	u64 ordered = percpu_counter_sum_positive(&amp;fs_info-&gt;ordered_bytes);</div><div class='ctx'> 	u64 delalloc = percpu_counter_sum_positive(&amp;fs_info-&gt;delalloc_bytes);</div><div class='ctx'> </div><div class='hunk'>@@ -1438,10 +1721,25 @@ static inline void maybe_clamp_preempt(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		space_info-&gt;clamp = min(space_info-&gt;clamp + 1, 8);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * Try to reserve bytes from the block_rsv's space</div><div class='add'>+static inline bool can_steal(enum btrfs_reserve_flush_enum flush)</div><div class='add'>+{</div><div class='add'>+	return (flush == BTRFS_RESERVE_FLUSH_ALL_STEAL ||</div><div class='add'>+		flush == BTRFS_RESERVE_FLUSH_EVICT);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * NO_FLUSH and FLUSH_EMERGENCY don't want to create a ticket, they just want to</div><div class='add'>+ * fail as quickly as possible.</div><div class='add'>+ */</div><div class='add'>+static inline bool can_ticket(enum btrfs_reserve_flush_enum flush)</div><div class='add'>+{</div><div class='add'>+	return (flush != BTRFS_RESERVE_NO_FLUSH &amp;&amp;</div><div class='add'>+		flush != BTRFS_RESERVE_FLUSH_EMERGENCY);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Try to reserve bytes from the block_rsv's space.</div><div class='ctx'>  *</div><div class='del'>- * @fs_info:    the filesystem</div><div class='ctx'>  * @space_info: space info we want to allocate from</div><div class='ctx'>  * @orig_bytes: number of bytes we want</div><div class='ctx'>  * @flush:      whether or not we can flush to make our reservation</div><div class='hunk'>@@ -1453,19 +1751,30 @@ static inline void maybe_clamp_preempt(struct btrfs_fs_info *fs_info,</div><div class='ctx'>  * regain reservations will be made and this will fail if there is not enough</div><div class='ctx'>  * space already.</div><div class='ctx'>  */</div><div class='del'>-static int __reserve_bytes(struct btrfs_fs_info *fs_info,</div><div class='del'>-			   struct btrfs_space_info *space_info, u64 orig_bytes,</div><div class='del'>-			   enum btrfs_reserve_flush_enum flush)</div><div class='add'>+static int reserve_bytes(struct btrfs_space_info *space_info, u64 orig_bytes,</div><div class='add'>+			 enum btrfs_reserve_flush_enum flush)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = space_info-&gt;fs_info;</div><div class='ctx'> 	struct work_struct *async_work;</div><div class='ctx'> 	struct reserve_ticket ticket;</div><div class='ctx'> 	u64 start_ns = 0;</div><div class='ctx'> 	u64 used;</div><div class='del'>-	int ret = 0;</div><div class='add'>+	int ret = -ENOSPC;</div><div class='ctx'> 	bool pending_tickets;</div><div class='ctx'> </div><div class='del'>-	ASSERT(orig_bytes);</div><div class='del'>-	ASSERT(!current-&gt;journal_info || flush != BTRFS_RESERVE_FLUSH_ALL);</div><div class='add'>+	ASSERT(orig_bytes, "orig_bytes=%llu", orig_bytes);</div><div class='add'>+	/*</div><div class='add'>+	 * If have a transaction handle (current-&gt;journal_info != NULL), then</div><div class='add'>+	 * the flush method can not be neither BTRFS_RESERVE_FLUSH_ALL* nor</div><div class='add'>+	 * BTRFS_RESERVE_FLUSH_EVICT, as we could deadlock because those</div><div class='add'>+	 * flushing methods can trigger transaction commits.</div><div class='add'>+	 */</div><div class='add'>+	if (current-&gt;journal_info) {</div><div class='add'>+		/* One assert per line for easier debugging. */</div><div class='add'>+		ASSERT(flush != BTRFS_RESERVE_FLUSH_ALL, "flush=%d", flush);</div><div class='add'>+		ASSERT(flush != BTRFS_RESERVE_FLUSH_ALL_STEAL, "flush=%d", flush);</div><div class='add'>+		ASSERT(flush != BTRFS_RESERVE_FLUSH_EVICT, "flush=%d", flush);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (flush == BTRFS_RESERVE_FLUSH_DATA)</div><div class='ctx'> 		async_work = &amp;fs_info-&gt;async_data_reclaim_work;</div><div class='hunk'>@@ -1473,7 +1782,6 @@ static int __reserve_bytes(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		async_work = &amp;fs_info-&gt;async_reclaim_work;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;space_info-&gt;lock);</div><div class='del'>-	ret = -ENOSPC;</div><div class='ctx'> 	used = btrfs_space_info_used(space_info, true);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1493,25 +1801,38 @@ static int __reserve_bytes(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (!pending_tickets &amp;&amp;</div><div class='ctx'> 	    ((used + orig_bytes &lt;= space_info-&gt;total_bytes) ||</div><div class='del'>-	     btrfs_can_overcommit(fs_info, space_info, orig_bytes, flush))) {</div><div class='del'>-		btrfs_space_info_update_bytes_may_use(fs_info, space_info,</div><div class='del'>-						      orig_bytes);</div><div class='add'>+	     can_overcommit(space_info, used, orig_bytes, flush))) {</div><div class='add'>+		btrfs_space_info_update_bytes_may_use(space_info, orig_bytes);</div><div class='ctx'> 		ret = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='add'>+	 * Things are dire, we need to make a reservation so we don't abort.  We</div><div class='add'>+	 * will let this reservation go through as long as we have actual space</div><div class='add'>+	 * left to allocate for the block.</div><div class='add'>+	 */</div><div class='add'>+	if (ret &amp;&amp; unlikely(flush == BTRFS_RESERVE_FLUSH_EMERGENCY)) {</div><div class='add'>+		used -= space_info-&gt;bytes_may_use;</div><div class='add'>+		if (used + orig_bytes &lt;= space_info-&gt;total_bytes) {</div><div class='add'>+			btrfs_space_info_update_bytes_may_use(space_info, orig_bytes);</div><div class='add'>+			ret = 0;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='ctx'> 	 * If we couldn't make a reservation then setup our reservation ticket</div><div class='ctx'> 	 * and kick the async worker if it's not already running.</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * If we are a priority flusher then we just need to add our ticket to</div><div class='ctx'> 	 * the list and we will do our own flushing further down.</div><div class='ctx'> 	 */</div><div class='del'>-	if (ret &amp;&amp; flush != BTRFS_RESERVE_NO_FLUSH) {</div><div class='add'>+	if (ret &amp;&amp; can_ticket(flush)) {</div><div class='ctx'> 		ticket.bytes = orig_bytes;</div><div class='ctx'> 		ticket.error = 0;</div><div class='ctx'> 		space_info-&gt;reclaim_size += ticket.bytes;</div><div class='ctx'> 		init_waitqueue_head(&amp;ticket.wait);</div><div class='del'>-		ticket.steal = (flush == BTRFS_RESERVE_FLUSH_ALL_STEAL);</div><div class='add'>+		spin_lock_init(&amp;ticket.lock);</div><div class='add'>+		ticket.steal = can_steal(flush);</div><div class='ctx'> 		if (trace_btrfs_reserve_ticket_enabled())</div><div class='ctx'> 			start_ns = ktime_get_ns();</div><div class='ctx'> </div><div class='hunk'>@@ -1527,21 +1848,20 @@ static int __reserve_bytes(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				 * preemptive flushing in order to keep up with</div><div class='ctx'> 				 * the workload.</div><div class='ctx'> 				 */</div><div class='del'>-				maybe_clamp_preempt(fs_info, space_info);</div><div class='add'>+				maybe_clamp_preempt(space_info);</div><div class='ctx'> </div><div class='del'>-				space_info-&gt;flush = 1;</div><div class='add'>+				space_info-&gt;flush = true;</div><div class='ctx'> 				trace_btrfs_trigger_flush(fs_info,</div><div class='ctx'> 							  space_info-&gt;flags,</div><div class='ctx'> 							  orig_bytes, flush,</div><div class='ctx'> 							  "enospc");</div><div class='del'>-				queue_work(system_unbound_wq, async_work);</div><div class='add'>+				queue_work(system_dfl_wq, async_work);</div><div class='ctx'> 			}</div><div class='ctx'> 		} else {</div><div class='ctx'> 			list_add_tail(&amp;ticket.list,</div><div class='ctx'> 				      &amp;space_info-&gt;priority_tickets);</div><div class='ctx'> 		}</div><div class='ctx'> 	} else if (!ret &amp;&amp; space_info-&gt;flags &amp; BTRFS_BLOCK_GROUP_METADATA) {</div><div class='del'>-		used += orig_bytes;</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We will do the space reservation dance during log replay,</div><div class='ctx'> 		 * which means we won't have fs_info-&gt;fs_root set, so don't do</div><div class='hunk'>@@ -1549,26 +1869,24 @@ static int __reserve_bytes(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (!test_bit(BTRFS_FS_LOG_RECOVERING, &amp;fs_info-&gt;flags) &amp;&amp;</div><div class='ctx'> 		    !work_busy(&amp;fs_info-&gt;preempt_reclaim_work) &amp;&amp;</div><div class='del'>-		    need_preemptive_reclaim(fs_info, space_info)) {</div><div class='add'>+		    need_preemptive_reclaim(space_info)) {</div><div class='ctx'> 			trace_btrfs_trigger_flush(fs_info, space_info-&gt;flags,</div><div class='ctx'> 						  orig_bytes, flush, "preempt");</div><div class='del'>-			queue_work(system_unbound_wq,</div><div class='add'>+			queue_work(system_dfl_wq,</div><div class='ctx'> 				   &amp;fs_info-&gt;preempt_reclaim_work);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;space_info-&gt;lock);</div><div class='del'>-	if (!ret || flush == BTRFS_RESERVE_NO_FLUSH)</div><div class='add'>+	if (!ret || !can_ticket(flush))</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	return handle_reserve_ticket(fs_info, space_info, &amp;ticket, start_ns,</div><div class='del'>-				     orig_bytes, flush);</div><div class='add'>+	return handle_reserve_ticket(space_info, &amp;ticket, start_ns, orig_bytes, flush);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * Trye to reserve metadata bytes from the block_rsv's space</div><div class='add'>+/*</div><div class='add'>+ * Try to reserve metadata bytes from the block_rsv's space.</div><div class='ctx'>  *</div><div class='del'>- * @root:       the root we're allocating for</div><div class='del'>- * @block_rsv:  block_rsv we're allocating for</div><div class='add'>+ * @space_info: the space_info we're allocating for</div><div class='ctx'>  * @orig_bytes: number of bytes we want</div><div class='ctx'>  * @flush:      whether or not we can flush to make our reservation</div><div class='ctx'>  *</div><div class='hunk'>@@ -1579,60 +1897,329 @@ static int __reserve_bytes(struct btrfs_fs_info *fs_info,</div><div class='ctx'>  * regain reservations will be made and this will fail if there is not enough</div><div class='ctx'>  * space already.</div><div class='ctx'>  */</div><div class='del'>-int btrfs_reserve_metadata_bytes(struct btrfs_root *root,</div><div class='del'>-				 struct btrfs_block_rsv *block_rsv,</div><div class='add'>+int btrfs_reserve_metadata_bytes(struct btrfs_space_info *space_info,</div><div class='ctx'> 				 u64 orig_bytes,</div><div class='ctx'> 				 enum btrfs_reserve_flush_enum flush)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='del'>-	struct btrfs_block_rsv *global_rsv = &amp;fs_info-&gt;global_block_rsv;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = __reserve_bytes(fs_info, block_rsv-&gt;space_info, orig_bytes, flush);</div><div class='del'>-	if (ret == -ENOSPC &amp;&amp;</div><div class='del'>-	    unlikely(root-&gt;orphan_cleanup_state == ORPHAN_CLEANUP_STARTED)) {</div><div class='del'>-		if (block_rsv != global_rsv &amp;&amp;</div><div class='del'>-		    !btrfs_block_rsv_use_bytes(global_rsv, orig_bytes))</div><div class='del'>-			ret = 0;</div><div class='del'>-	}</div><div class='add'>+	ret = reserve_bytes(space_info, orig_bytes, flush);</div><div class='ctx'> 	if (ret == -ENOSPC) {</div><div class='add'>+		struct btrfs_fs_info *fs_info = space_info-&gt;fs_info;</div><div class='add'>+</div><div class='ctx'> 		trace_btrfs_space_reservation(fs_info, "space_info:enospc",</div><div class='del'>-					      block_rsv-&gt;space_info-&gt;flags,</div><div class='del'>-					      orig_bytes, 1);</div><div class='add'>+					      space_info-&gt;flags, orig_bytes, 1);</div><div class='ctx'> </div><div class='ctx'> 		if (btrfs_test_opt(fs_info, ENOSPC_DEBUG))</div><div class='del'>-			btrfs_dump_space_info(fs_info, block_rsv-&gt;space_info,</div><div class='del'>-					      orig_bytes, 0);</div><div class='add'>+			btrfs_dump_space_info(space_info, orig_bytes, false);</div><div class='ctx'> 	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * Try to reserve data bytes for an allocation</div><div class='add'>+/*</div><div class='add'>+ * Try to reserve data bytes for an allocation.</div><div class='ctx'>  *</div><div class='del'>- * @fs_info: the filesystem</div><div class='add'>+ * @space_info: the space_info we're allocating for</div><div class='ctx'>  * @bytes:   number of bytes we need</div><div class='ctx'>  * @flush:   how we are allowed to flush</div><div class='ctx'>  *</div><div class='ctx'>  * This will reserve bytes from the data space info.  If there is not enough</div><div class='ctx'>  * space then we will attempt to flush space as specified by flush.</div><div class='ctx'>  */</div><div class='del'>-int btrfs_reserve_data_bytes(struct btrfs_fs_info *fs_info, u64 bytes,</div><div class='add'>+int btrfs_reserve_data_bytes(struct btrfs_space_info *space_info, u64 bytes,</div><div class='ctx'> 			     enum btrfs_reserve_flush_enum flush)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_space_info *data_sinfo = fs_info-&gt;data_sinfo;</div><div class='add'>+	struct btrfs_fs_info *fs_info = space_info-&gt;fs_info;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	ASSERT(flush == BTRFS_RESERVE_FLUSH_DATA ||</div><div class='del'>-	       flush == BTRFS_RESERVE_FLUSH_FREE_SPACE_INODE);</div><div class='del'>-	ASSERT(!current-&gt;journal_info || flush != BTRFS_RESERVE_FLUSH_DATA);</div><div class='add'>+	       flush == BTRFS_RESERVE_FLUSH_FREE_SPACE_INODE ||</div><div class='add'>+	       flush == BTRFS_RESERVE_NO_FLUSH, "flush=%d", flush);</div><div class='add'>+	ASSERT(!current-&gt;journal_info || flush != BTRFS_RESERVE_FLUSH_DATA,</div><div class='add'>+	       "current-&gt;journal_info=0x%lx flush=%d",</div><div class='add'>+	       (unsigned long)current-&gt;journal_info, flush);</div><div class='ctx'> </div><div class='del'>-	ret = __reserve_bytes(fs_info, data_sinfo, bytes, flush);</div><div class='add'>+	ret = reserve_bytes(space_info, bytes, flush);</div><div class='ctx'> 	if (ret == -ENOSPC) {</div><div class='ctx'> 		trace_btrfs_space_reservation(fs_info, "space_info:enospc",</div><div class='del'>-					      data_sinfo-&gt;flags, bytes, 1);</div><div class='add'>+					      space_info-&gt;flags, bytes, 1);</div><div class='ctx'> 		if (btrfs_test_opt(fs_info, ENOSPC_DEBUG))</div><div class='del'>-			btrfs_dump_space_info(fs_info, data_sinfo, bytes, 0);</div><div class='add'>+			btrfs_dump_space_info(space_info, bytes, false);</div><div class='ctx'> 	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+/* Dump all the space infos when we abort a transaction due to ENOSPC. */</div><div class='add'>+__cold void btrfs_dump_space_info_for_trans_abort(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_space_info *space_info;</div><div class='add'>+</div><div class='add'>+	btrfs_info(fs_info, "dumping space info:");</div><div class='add'>+	list_for_each_entry(space_info, &amp;fs_info-&gt;space_info, list) {</div><div class='add'>+		spin_lock(&amp;space_info-&gt;lock);</div><div class='add'>+		__btrfs_dump_space_info(space_info);</div><div class='add'>+		spin_unlock(&amp;space_info-&gt;lock);</div><div class='add'>+	}</div><div class='add'>+	dump_global_block_rsv(fs_info);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Account the unused space of all the readonly block group in the space_info.</div><div class='add'>+ * takes mirrors into account.</div><div class='add'>+ */</div><div class='add'>+u64 btrfs_account_ro_block_groups_free_space(struct btrfs_space_info *sinfo)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_block_group *block_group;</div><div class='add'>+	u64 free_bytes = 0;</div><div class='add'>+	int factor;</div><div class='add'>+</div><div class='add'>+	/* It's df, we don't care if it's racy */</div><div class='add'>+	if (data_race(list_empty(&amp;sinfo-&gt;ro_bgs)))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;sinfo-&gt;lock);</div><div class='add'>+	list_for_each_entry(block_group, &amp;sinfo-&gt;ro_bgs, ro_list) {</div><div class='add'>+		spin_lock(&amp;block_group-&gt;lock);</div><div class='add'>+</div><div class='add'>+		if (!block_group-&gt;ro) {</div><div class='add'>+			spin_unlock(&amp;block_group-&gt;lock);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		factor = btrfs_bg_type_to_factor(block_group-&gt;flags);</div><div class='add'>+		free_bytes += (block_group-&gt;length -</div><div class='add'>+			       block_group-&gt;used) * factor;</div><div class='add'>+</div><div class='add'>+		spin_unlock(&amp;block_group-&gt;lock);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;sinfo-&gt;lock);</div><div class='add'>+</div><div class='add'>+	return free_bytes;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static u64 calc_pct_ratio(u64 x, u64 y)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (!y)</div><div class='add'>+		return 0;</div><div class='add'>+again:</div><div class='add'>+	ret = check_mul_overflow(100, x, &amp;x);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto lose_precision;</div><div class='add'>+	return div64_u64(x, y);</div><div class='add'>+lose_precision:</div><div class='add'>+	x &gt;&gt;= 10;</div><div class='add'>+	y &gt;&gt;= 10;</div><div class='add'>+	if (!y)</div><div class='add'>+		y = 1;</div><div class='add'>+	goto again;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * A reasonable buffer for unallocated space is 10 data block_groups.</div><div class='add'>+ * If we claw this back repeatedly, we can still achieve efficient</div><div class='add'>+ * utilization when near full, and not do too much reclaim while</div><div class='add'>+ * always maintaining a solid buffer for workloads that quickly</div><div class='add'>+ * allocate and pressure the unallocated space.</div><div class='add'>+ */</div><div class='add'>+static u64 calc_unalloc_target(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	u64 chunk_sz = calc_effective_data_chunk_size(fs_info);</div><div class='add'>+</div><div class='add'>+	return BTRFS_UNALLOC_BLOCK_GROUP_TARGET * chunk_sz;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * The fundamental goal of automatic reclaim is to protect the filesystem's</div><div class='add'>+ * unallocated space and thus minimize the probability of the filesystem going</div><div class='add'>+ * read only when a metadata allocation failure causes a transaction abort.</div><div class='add'>+ *</div><div class='add'>+ * However, relocations happen into the space_info's unused space, therefore</div><div class='add'>+ * automatic reclaim must also back off as that space runs low. There is no</div><div class='add'>+ * value in doing trivial "relocations" of re-writing the same block group</div><div class='add'>+ * into a fresh one.</div><div class='add'>+ *</div><div class='add'>+ * Furthermore, we want to avoid doing too much reclaim even if there are good</div><div class='add'>+ * candidates. This is because the allocator is pretty good at filling up the</div><div class='add'>+ * holes with writes. So we want to do just enough reclaim to try and stay</div><div class='add'>+ * safe from running out of unallocated space but not be wasteful about it.</div><div class='add'>+ *</div><div class='add'>+ * Therefore, the dynamic reclaim threshold is calculated as follows:</div><div class='add'>+ * - calculate a target unallocated amount of 5 block group sized chunks</div><div class='add'>+ * - ratchet up the intensity of reclaim depending on how far we are from</div><div class='add'>+ *   that target by using a formula of unalloc / target to set the threshold.</div><div class='add'>+ *</div><div class='add'>+ * Typically with 10 block groups as the target, the discrete values this comes</div><div class='add'>+ * out to are 0, 10, 20, ... , 80, 90, and 99.</div><div class='add'>+ */</div><div class='add'>+static int calc_dynamic_reclaim_threshold(const struct btrfs_space_info *space_info)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = space_info-&gt;fs_info;</div><div class='add'>+	u64 unalloc = atomic64_read(&amp;fs_info-&gt;free_chunk_space);</div><div class='add'>+	u64 target = calc_unalloc_target(fs_info);</div><div class='add'>+	u64 alloc = space_info-&gt;total_bytes;</div><div class='add'>+	u64 used = btrfs_space_info_used(space_info, false);</div><div class='add'>+	u64 unused = alloc - used;</div><div class='add'>+	u64 want = target &gt; unalloc ? target - unalloc : 0;</div><div class='add'>+	u64 data_chunk_size = calc_effective_data_chunk_size(fs_info);</div><div class='add'>+</div><div class='add'>+	/* If we have no unused space, don't bother, it won't work anyway. */</div><div class='add'>+	if (unused &lt; data_chunk_size)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/* Cast to int is OK because want &lt;= target. */</div><div class='add'>+	return calc_pct_ratio(want, target);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_calc_reclaim_threshold(const struct btrfs_space_info *space_info)</div><div class='add'>+{</div><div class='add'>+	lockdep_assert_held(&amp;space_info-&gt;lock);</div><div class='add'>+</div><div class='add'>+	if (READ_ONCE(space_info-&gt;dynamic_reclaim))</div><div class='add'>+		return calc_dynamic_reclaim_threshold(space_info);</div><div class='add'>+	return READ_ONCE(space_info-&gt;bg_reclaim_threshold);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Under "urgent" reclaim, we will reclaim even fresh block groups that have</div><div class='add'>+ * recently seen successful allocations, as we are desperate to reclaim</div><div class='add'>+ * whatever we can to avoid ENOSPC in a transaction leading to a readonly fs.</div><div class='add'>+ */</div><div class='add'>+static bool is_reclaim_urgent(struct btrfs_space_info *space_info)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = space_info-&gt;fs_info;</div><div class='add'>+	u64 unalloc = atomic64_read(&amp;fs_info-&gt;free_chunk_space);</div><div class='add'>+	u64 data_chunk_size = calc_effective_data_chunk_size(fs_info);</div><div class='add'>+</div><div class='add'>+	return unalloc &lt; data_chunk_size;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void do_reclaim_sweep(struct btrfs_space_info *space_info, int raid)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_block_group *bg;</div><div class='add'>+	int thresh_pct;</div><div class='add'>+	bool try_again = true;</div><div class='add'>+	bool urgent;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;space_info-&gt;lock);</div><div class='add'>+	urgent = is_reclaim_urgent(space_info);</div><div class='add'>+	thresh_pct = btrfs_calc_reclaim_threshold(space_info);</div><div class='add'>+	spin_unlock(&amp;space_info-&gt;lock);</div><div class='add'>+</div><div class='add'>+	down_read(&amp;space_info-&gt;groups_sem);</div><div class='add'>+again:</div><div class='add'>+	list_for_each_entry(bg, &amp;space_info-&gt;block_groups[raid], list) {</div><div class='add'>+		u64 thresh;</div><div class='add'>+		bool reclaim = false;</div><div class='add'>+</div><div class='add'>+		btrfs_get_block_group(bg);</div><div class='add'>+		spin_lock(&amp;bg-&gt;lock);</div><div class='add'>+		thresh = mult_perc(bg-&gt;length, thresh_pct);</div><div class='add'>+		if (bg-&gt;used &lt; thresh &amp;&amp; bg-&gt;reclaim_mark) {</div><div class='add'>+			try_again = false;</div><div class='add'>+			reclaim = true;</div><div class='add'>+		}</div><div class='add'>+		bg-&gt;reclaim_mark++;</div><div class='add'>+		spin_unlock(&amp;bg-&gt;lock);</div><div class='add'>+		if (reclaim)</div><div class='add'>+			btrfs_mark_bg_to_reclaim(bg);</div><div class='add'>+		btrfs_put_block_group(bg);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * In situations where we are very motivated to reclaim (low unalloc)</div><div class='add'>+	 * use two passes to make the reclaim mark check best effort.</div><div class='add'>+	 *</div><div class='add'>+	 * If we have any staler groups, we don't touch the fresher ones, but if we</div><div class='add'>+	 * really need a block group, do take a fresh one.</div><div class='add'>+	 */</div><div class='add'>+	if (try_again &amp;&amp; urgent) {</div><div class='add'>+		try_again = false;</div><div class='add'>+		goto again;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	up_read(&amp;space_info-&gt;groups_sem);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_space_info_update_reclaimable(struct btrfs_space_info *space_info, s64 bytes)</div><div class='add'>+{</div><div class='add'>+	u64 chunk_sz = calc_effective_data_chunk_size(space_info-&gt;fs_info);</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held(&amp;space_info-&gt;lock);</div><div class='add'>+	space_info-&gt;reclaimable_bytes += bytes;</div><div class='add'>+</div><div class='add'>+	if (space_info-&gt;reclaimable_bytes &gt;= chunk_sz)</div><div class='add'>+		btrfs_set_periodic_reclaim_ready(space_info, true);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_set_periodic_reclaim_ready(struct btrfs_space_info *space_info, bool ready)</div><div class='add'>+{</div><div class='add'>+	lockdep_assert_held(&amp;space_info-&gt;lock);</div><div class='add'>+	if (!READ_ONCE(space_info-&gt;periodic_reclaim))</div><div class='add'>+		return;</div><div class='add'>+	if (ready != space_info-&gt;periodic_reclaim_ready) {</div><div class='add'>+		space_info-&gt;periodic_reclaim_ready = ready;</div><div class='add'>+		if (!ready)</div><div class='add'>+			space_info-&gt;reclaimable_bytes = 0;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool btrfs_should_periodic_reclaim(struct btrfs_space_info *space_info)</div><div class='add'>+{</div><div class='add'>+	bool ret;</div><div class='add'>+</div><div class='add'>+	if (space_info-&gt;flags &amp; BTRFS_BLOCK_GROUP_SYSTEM)</div><div class='add'>+		return false;</div><div class='add'>+	if (!READ_ONCE(space_info-&gt;periodic_reclaim))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;space_info-&gt;lock);</div><div class='add'>+	ret = space_info-&gt;periodic_reclaim_ready;</div><div class='add'>+	btrfs_set_periodic_reclaim_ready(space_info, false);</div><div class='add'>+	spin_unlock(&amp;space_info-&gt;lock);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_reclaim_sweep(const struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	int raid;</div><div class='add'>+	struct btrfs_space_info *space_info;</div><div class='add'>+</div><div class='add'>+	list_for_each_entry(space_info, &amp;fs_info-&gt;space_info, list) {</div><div class='add'>+		if (!btrfs_should_periodic_reclaim(space_info))</div><div class='add'>+			continue;</div><div class='add'>+		for (raid = 0; raid &lt; BTRFS_NR_RAID_TYPES; raid++)</div><div class='add'>+			do_reclaim_sweep(space_info, raid);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_return_free_space(struct btrfs_space_info *space_info, u64 len)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = space_info-&gt;fs_info;</div><div class='add'>+	struct btrfs_block_rsv *global_rsv = &amp;fs_info-&gt;global_block_rsv;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held(&amp;space_info-&gt;lock);</div><div class='add'>+</div><div class='add'>+	/* Prioritize the global reservation to receive the freed space. */</div><div class='add'>+	if (global_rsv-&gt;space_info != space_info)</div><div class='add'>+		goto grant;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;global_rsv-&gt;lock);</div><div class='add'>+	if (!global_rsv-&gt;full) {</div><div class='add'>+		u64 to_add = min(len, global_rsv-&gt;size - global_rsv-&gt;reserved);</div><div class='add'>+</div><div class='add'>+		global_rsv-&gt;reserved += to_add;</div><div class='add'>+		btrfs_space_info_update_bytes_may_use(space_info, to_add);</div><div class='add'>+		if (global_rsv-&gt;reserved &gt;= global_rsv-&gt;size)</div><div class='add'>+			global_rsv-&gt;full = true;</div><div class='add'>+		len -= to_add;</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;global_rsv-&gt;lock);</div><div class='add'>+</div><div class='add'>+grant:</div><div class='add'>+	/* Add to any tickets we may have. */</div><div class='add'>+	if (len)</div><div class='add'>+		btrfs_try_granting_tickets(space_info);</div><div class='add'>+}</div><div class='head'>diff --git a/fs/btrfs/space-info.h b/fs/btrfs/space-info.h<br/>index cb5056472e79..446c0614ad4a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/space-info.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/space-info.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/space-info.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/space-info.h</a></div><div class='hunk'>@@ -3,7 +3,113 @@</div><div class='ctx'> #ifndef BTRFS_SPACE_INFO_H</div><div class='ctx'> #define BTRFS_SPACE_INFO_H</div><div class='ctx'> </div><div class='add'>+#include &lt;trace/events/btrfs.h&gt;</div><div class='add'>+#include &lt;linux/spinlock.h&gt;</div><div class='add'>+#include &lt;linux/list.h&gt;</div><div class='add'>+#include &lt;linux/kobject.h&gt;</div><div class='add'>+#include &lt;linux/lockdep.h&gt;</div><div class='add'>+#include &lt;linux/wait.h&gt;</div><div class='add'>+#include &lt;linux/rwsem.h&gt;</div><div class='add'>+#include "volumes.h"</div><div class='add'>+</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+struct btrfs_block_group;</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Different levels for to flush space when doing space reservations.</div><div class='add'>+ *</div><div class='add'>+ * The higher the level, the more methods we try to reclaim space.</div><div class='add'>+ */</div><div class='add'>+enum btrfs_reserve_flush_enum {</div><div class='add'>+	/* If we are in the transaction, we can't flush anything.*/</div><div class='add'>+	BTRFS_RESERVE_NO_FLUSH,</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Flush space by:</div><div class='add'>+	 * - Running delayed inode items</div><div class='add'>+	 * - Allocating a new chunk</div><div class='add'>+	 */</div><div class='add'>+	BTRFS_RESERVE_FLUSH_LIMIT,</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Flush space by:</div><div class='add'>+	 * - Running delayed inode items</div><div class='add'>+	 * - Running delayed refs</div><div class='add'>+	 * - Running delalloc and waiting for ordered extents</div><div class='add'>+	 * - Allocating a new chunk</div><div class='add'>+	 * - Committing transaction</div><div class='add'>+	 */</div><div class='add'>+	BTRFS_RESERVE_FLUSH_EVICT,</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Flush space by above mentioned methods and by:</div><div class='add'>+	 * - Running delayed iputs</div><div class='add'>+	 * - Committing transaction</div><div class='add'>+	 *</div><div class='add'>+	 * Can be interrupted by a fatal signal.</div><div class='add'>+	 */</div><div class='add'>+	BTRFS_RESERVE_FLUSH_DATA,</div><div class='add'>+	BTRFS_RESERVE_FLUSH_FREE_SPACE_INODE,</div><div class='add'>+	BTRFS_RESERVE_FLUSH_ALL,</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Pretty much the same as FLUSH_ALL, but can also steal space from</div><div class='add'>+	 * global rsv.</div><div class='add'>+	 *</div><div class='add'>+	 * Can be interrupted by a fatal signal.</div><div class='add'>+	 */</div><div class='add'>+	BTRFS_RESERVE_FLUSH_ALL_STEAL,</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This is for btrfs_use_block_rsv only.  We have exhausted our block</div><div class='add'>+	 * rsv and our global block rsv.  This can happen for things like</div><div class='add'>+	 * delalloc where we are overwriting a lot of extents with a single</div><div class='add'>+	 * extent and didn't reserve enough space.  Alternatively it can happen</div><div class='add'>+	 * with delalloc where we reserve 1 extents worth for a large extent but</div><div class='add'>+	 * fragmentation leads to multiple extents being created.  This will</div><div class='add'>+	 * give us the reservation in the case of</div><div class='add'>+	 *</div><div class='add'>+	 * if (num_bytes &lt; (space_info-&gt;total_bytes -</div><div class='add'>+	 *		    btrfs_space_info_used(space_info, false))</div><div class='add'>+	 *</div><div class='add'>+	 * Which ignores bytes_may_use.  This is potentially dangerous, but our</div><div class='add'>+	 * reservation system is generally pessimistic so is able to absorb this</div><div class='add'>+	 * style of mistake.</div><div class='add'>+	 */</div><div class='add'>+	BTRFS_RESERVE_FLUSH_EMERGENCY,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Please be aware that the order of enum values will be the order of the reclaim</div><div class='add'>+ * process in btrfs_async_reclaim_metadata_space().</div><div class='add'>+ */</div><div class='add'>+enum btrfs_flush_state {</div><div class='add'>+	FLUSH_DELAYED_ITEMS_NR	= 1,</div><div class='add'>+	FLUSH_DELAYED_ITEMS	= 2,</div><div class='add'>+	FLUSH_DELAYED_REFS_NR	= 3,</div><div class='add'>+	FLUSH_DELAYED_REFS	= 4,</div><div class='add'>+	FLUSH_DELALLOC		= 5,</div><div class='add'>+	FLUSH_DELALLOC_WAIT	= 6,</div><div class='add'>+	FLUSH_DELALLOC_FULL	= 7,</div><div class='add'>+	ALLOC_CHUNK		= 8,</div><div class='add'>+	ALLOC_CHUNK_FORCE	= 9,</div><div class='add'>+	RUN_DELAYED_IPUTS	= 10,</div><div class='add'>+	COMMIT_TRANS		= 11,</div><div class='add'>+	RESET_ZONES		= 12,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+enum btrfs_space_info_sub_group {</div><div class='add'>+	BTRFS_SUB_GROUP_PRIMARY,</div><div class='add'>+	BTRFS_SUB_GROUP_DATA_RELOC,</div><div class='add'>+	BTRFS_SUB_GROUP_TREELOG,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+#define BTRFS_SPACE_INFO_SUB_GROUP_MAX 1</div><div class='ctx'> struct btrfs_space_info {</div><div class='add'>+	struct btrfs_fs_info *fs_info;</div><div class='add'>+	struct btrfs_space_info *parent;</div><div class='add'>+	struct btrfs_space_info *sub_group[BTRFS_SPACE_INFO_SUB_GROUP_MAX];</div><div class='add'>+	int subgroup_id;</div><div class='ctx'> 	spinlock_t lock;</div><div class='ctx'> </div><div class='ctx'> 	u64 total_bytes;	/* total bytes in the space,</div><div class='hunk'>@@ -23,16 +129,24 @@ struct btrfs_space_info {</div><div class='ctx'> 	u64 max_extent_size;	/* This will hold the maximum extent size of</div><div class='ctx'> 				   the space info if we had an ENOSPC in the</div><div class='ctx'> 				   allocator. */</div><div class='add'>+	/* Chunk size in bytes */</div><div class='add'>+	u64 chunk_size;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Once a block group drops below this threshold (percents) we'll</div><div class='add'>+	 * schedule it for reclaim.</div><div class='add'>+	 */</div><div class='add'>+	int bg_reclaim_threshold;</div><div class='ctx'> </div><div class='ctx'> 	int clamp;		/* Used to scale our threshold for preemptive</div><div class='ctx'> 				   flushing. The value is &gt;&gt; clamp, so turns</div><div class='ctx'> 				   out to be a 2^clamp divisor. */</div><div class='ctx'> </div><div class='del'>-	unsigned int full:1;	/* indicates that we cannot allocate any more</div><div class='add'>+	bool full;		/* indicates that we cannot allocate any more</div><div class='ctx'> 				   chunks for this space */</div><div class='del'>-	unsigned int chunk_alloc:1;	/* set if we are allocating a chunk */</div><div class='add'>+	bool chunk_alloc;	/* set if we are allocating a chunk */</div><div class='ctx'> </div><div class='del'>-	unsigned int flush:1;		/* set if we are trying to make space */</div><div class='add'>+	bool flush;		/* set if we are trying to make space */</div><div class='ctx'> </div><div class='ctx'> 	unsigned int force_alloc;	/* set if we need to force a chunk</div><div class='ctx'> 					   alloc for this space */</div><div class='hunk'>@@ -67,17 +181,50 @@ struct btrfs_space_info {</div><div class='ctx'> </div><div class='ctx'> 	struct kobject kobj;</div><div class='ctx'> 	struct kobject *block_group_kobjs[BTRFS_NR_RAID_TYPES];</div><div class='del'>-};</div><div class='ctx'> </div><div class='del'>-struct reserve_ticket {</div><div class='del'>-	u64 bytes;</div><div class='del'>-	int error;</div><div class='del'>-	bool steal;</div><div class='del'>-	struct list_head list;</div><div class='del'>-	wait_queue_head_t wait;</div><div class='add'>+	/*</div><div class='add'>+	 * Monotonically increasing counter of block group reclaim attempts</div><div class='add'>+	 * Exposed in /sys/fs/&lt;uuid&gt;/allocation/&lt;type&gt;/reclaim_count</div><div class='add'>+	 */</div><div class='add'>+	u64 reclaim_count;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Monotonically increasing counter of reclaimed bytes</div><div class='add'>+	 * Exposed in /sys/fs/&lt;uuid&gt;/allocation/&lt;type&gt;/reclaim_bytes</div><div class='add'>+	 */</div><div class='add'>+	u64 reclaim_bytes;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Monotonically increasing counter of reclaim errors</div><div class='add'>+	 * Exposed in /sys/fs/&lt;uuid&gt;/allocation/&lt;type&gt;/reclaim_errors</div><div class='add'>+	 */</div><div class='add'>+	u64 reclaim_errors;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If true, use the dynamic relocation threshold, instead of the</div><div class='add'>+	 * fixed bg_reclaim_threshold.</div><div class='add'>+	 */</div><div class='add'>+	bool dynamic_reclaim;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Periodically check all block groups against the reclaim</div><div class='add'>+	 * threshold in the cleaner thread.</div><div class='add'>+	 */</div><div class='add'>+	bool periodic_reclaim;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Periodic reclaim should be a no-op if a space_info hasn't</div><div class='add'>+	 * freed any space since the last time we tried.</div><div class='add'>+	 */</div><div class='add'>+	bool periodic_reclaim_ready;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Net bytes freed or allocated since the last reclaim pass.</div><div class='add'>+	 */</div><div class='add'>+	s64 reclaimable_bytes;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static inline bool btrfs_mixed_space_info(struct btrfs_space_info *space_info)</div><div class='add'>+static inline bool btrfs_mixed_space_info(const struct btrfs_space_info *space_info)</div><div class='ctx'> {</div><div class='ctx'> 	return ((space_info-&gt;flags &amp; BTRFS_BLOCK_GROUP_METADATA) &amp;&amp;</div><div class='ctx'> 		(space_info-&gt;flags &amp; BTRFS_BLOCK_GROUP_DATA));</div><div class='hunk'>@@ -89,10 +236,10 @@ static inline bool btrfs_mixed_space_info(struct btrfs_space_info *space_info)</div><div class='ctx'>  */</div><div class='ctx'> #define DECLARE_SPACE_INFO_UPDATE(name, trace_name)			\</div><div class='ctx'> static inline void							\</div><div class='del'>-btrfs_space_info_update_##name(struct btrfs_fs_info *fs_info,		\</div><div class='del'>-			       struct btrfs_space_info *sinfo,		\</div><div class='add'>+btrfs_space_info_update_##name(struct btrfs_space_info *sinfo,		\</div><div class='ctx'> 			       s64 bytes)				\</div><div class='ctx'> {									\</div><div class='add'>+	struct btrfs_fs_info *fs_info = sinfo-&gt;fs_info;			\</div><div class='ctx'> 	const u64 abs_bytes = (bytes &lt; 0) ? -bytes : bytes;		\</div><div class='ctx'> 	lockdep_assert_held(&amp;sinfo-&gt;lock);				\</div><div class='ctx'> 	trace_update_##name(fs_info, sinfo, sinfo-&gt;name, bytes);	\</div><div class='hunk'>@@ -109,40 +256,55 @@ btrfs_space_info_update_##name(struct btrfs_fs_info *fs_info,		\</div><div class='ctx'> </div><div class='ctx'> DECLARE_SPACE_INFO_UPDATE(bytes_may_use, "space_info");</div><div class='ctx'> DECLARE_SPACE_INFO_UPDATE(bytes_pinned, "pinned");</div><div class='add'>+DECLARE_SPACE_INFO_UPDATE(bytes_zone_unusable, "zone_unusable");</div><div class='add'>+</div><div class='add'>+static inline u64 btrfs_space_info_used(const struct btrfs_space_info *s_info,</div><div class='add'>+					bool may_use_included)</div><div class='add'>+{</div><div class='add'>+	lockdep_assert_held(&amp;s_info-&gt;lock);</div><div class='add'>+</div><div class='add'>+	return s_info-&gt;bytes_used + s_info-&gt;bytes_reserved +</div><div class='add'>+		s_info-&gt;bytes_pinned + s_info-&gt;bytes_readonly +</div><div class='add'>+		s_info-&gt;bytes_zone_unusable +</div><div class='add'>+		(may_use_included ? s_info-&gt;bytes_may_use : 0);</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> int btrfs_init_space_info(struct btrfs_fs_info *fs_info);</div><div class='del'>-void btrfs_update_space_info(struct btrfs_fs_info *info, u64 flags,</div><div class='del'>-			     u64 total_bytes, u64 bytes_used,</div><div class='del'>-			     u64 bytes_readonly, u64 bytes_zone_unusable,</div><div class='del'>-			     struct btrfs_space_info **space_info);</div><div class='add'>+void btrfs_add_bg_to_space_info(struct btrfs_fs_info *info,</div><div class='add'>+				struct btrfs_block_group *block_group);</div><div class='add'>+void btrfs_update_space_info_chunk_size(struct btrfs_space_info *space_info,</div><div class='add'>+					u64 chunk_size);</div><div class='ctx'> struct btrfs_space_info *btrfs_find_space_info(struct btrfs_fs_info *info,</div><div class='ctx'> 					       u64 flags);</div><div class='del'>-u64 __pure btrfs_space_info_used(struct btrfs_space_info *s_info,</div><div class='del'>-			  bool may_use_included);</div><div class='ctx'> void btrfs_clear_space_info_full(struct btrfs_fs_info *info);</div><div class='del'>-void btrfs_dump_space_info(struct btrfs_fs_info *fs_info,</div><div class='del'>-			   struct btrfs_space_info *info, u64 bytes,</div><div class='del'>-			   int dump_block_groups);</div><div class='del'>-int btrfs_reserve_metadata_bytes(struct btrfs_root *root,</div><div class='del'>-				 struct btrfs_block_rsv *block_rsv,</div><div class='add'>+void btrfs_dump_space_info(struct btrfs_space_info *info, u64 bytes,</div><div class='add'>+			   bool dump_block_groups);</div><div class='add'>+int btrfs_reserve_metadata_bytes(struct btrfs_space_info *space_info,</div><div class='ctx'> 				 u64 orig_bytes,</div><div class='ctx'> 				 enum btrfs_reserve_flush_enum flush);</div><div class='del'>-void btrfs_try_granting_tickets(struct btrfs_fs_info *fs_info,</div><div class='del'>-				struct btrfs_space_info *space_info);</div><div class='del'>-int btrfs_can_overcommit(struct btrfs_fs_info *fs_info,</div><div class='del'>-			 struct btrfs_space_info *space_info, u64 bytes,</div><div class='del'>-			 enum btrfs_reserve_flush_enum flush);</div><div class='add'>+void btrfs_try_granting_tickets(struct btrfs_space_info *space_info);</div><div class='add'>+bool btrfs_can_overcommit(const struct btrfs_space_info *space_info, u64 bytes,</div><div class='add'>+			  enum btrfs_reserve_flush_enum flush);</div><div class='ctx'> </div><div class='ctx'> static inline void btrfs_space_info_free_bytes_may_use(</div><div class='del'>-				struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				struct btrfs_space_info *space_info,</div><div class='ctx'> 				u64 num_bytes)</div><div class='ctx'> {</div><div class='ctx'> 	spin_lock(&amp;space_info-&gt;lock);</div><div class='del'>-	btrfs_space_info_update_bytes_may_use(fs_info, space_info, -num_bytes);</div><div class='del'>-	btrfs_try_granting_tickets(fs_info, space_info);</div><div class='add'>+	btrfs_space_info_update_bytes_may_use(space_info, -num_bytes);</div><div class='add'>+	btrfs_try_granting_tickets(space_info);</div><div class='ctx'> 	spin_unlock(&amp;space_info-&gt;lock);</div><div class='ctx'> }</div><div class='del'>-int btrfs_reserve_data_bytes(struct btrfs_fs_info *fs_info, u64 bytes,</div><div class='add'>+int btrfs_reserve_data_bytes(struct btrfs_space_info *space_info, u64 bytes,</div><div class='ctx'> 			     enum btrfs_reserve_flush_enum flush);</div><div class='add'>+void btrfs_dump_space_info_for_trans_abort(struct btrfs_fs_info *fs_info);</div><div class='add'>+void btrfs_init_async_reclaim_work(struct btrfs_fs_info *fs_info);</div><div class='add'>+u64 btrfs_account_ro_block_groups_free_space(struct btrfs_space_info *sinfo);</div><div class='add'>+</div><div class='add'>+void btrfs_space_info_update_reclaimable(struct btrfs_space_info *space_info, s64 bytes);</div><div class='add'>+void btrfs_set_periodic_reclaim_ready(struct btrfs_space_info *space_info, bool ready);</div><div class='add'>+int btrfs_calc_reclaim_threshold(const struct btrfs_space_info *space_info);</div><div class='add'>+void btrfs_reclaim_sweep(const struct btrfs_fs_info *fs_info);</div><div class='add'>+void btrfs_return_free_space(struct btrfs_space_info *space_info, u64 len);</div><div class='add'>+</div><div class='ctx'> #endif /* BTRFS_SPACE_INFO_H */</div><div class='head'>diff --git a/fs/btrfs/struct-funcs.c b/fs/btrfs/struct-funcs.c<br/>deleted file mode 100644<br/>index f429256f56db..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/struct-funcs.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/struct-funcs.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,171 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0</div><div class='del'>-/*</div><div class='del'>- * Copyright (C) 2007 Oracle.  All rights reserved.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#include &lt;asm/unaligned.h&gt;</div><div class='del'>-</div><div class='del'>-#include "ctree.h"</div><div class='del'>-</div><div class='del'>-static bool check_setget_bounds(const struct extent_buffer *eb,</div><div class='del'>-				const void *ptr, unsigned off, int size)</div><div class='del'>-{</div><div class='del'>-	const unsigned long member_offset = (unsigned long)ptr + off;</div><div class='del'>-</div><div class='del'>-	if (member_offset &gt; eb-&gt;len) {</div><div class='del'>-		btrfs_warn(eb-&gt;fs_info,</div><div class='del'>-	"bad eb member start: ptr 0x%lx start %llu member offset %lu size %d",</div><div class='del'>-			(unsigned long)ptr, eb-&gt;start, member_offset, size);</div><div class='del'>-		return false;</div><div class='del'>-	}</div><div class='del'>-	if (member_offset + size &gt; eb-&gt;len) {</div><div class='del'>-		btrfs_warn(eb-&gt;fs_info,</div><div class='del'>-	"bad eb member end: ptr 0x%lx start %llu member offset %lu size %d",</div><div class='del'>-			(unsigned long)ptr, eb-&gt;start, member_offset, size);</div><div class='del'>-		return false;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Macro templates that define helpers to read/write extent buffer data of a</div><div class='del'>- * given size, that are also used via ctree.h for access to item members by</div><div class='del'>- * specialized helpers.</div><div class='del'>- *</div><div class='del'>- * Generic helpers:</div><div class='del'>- * - btrfs_set_8 (for 8/16/32/64)</div><div class='del'>- * - btrfs_get_8 (for 8/16/32/64)</div><div class='del'>- *</div><div class='del'>- * Generic helpers with a token (cached address of the most recently accessed</div><div class='del'>- * page):</div><div class='del'>- * - btrfs_set_token_8 (for 8/16/32/64)</div><div class='del'>- * - btrfs_get_token_8 (for 8/16/32/64)</div><div class='del'>- *</div><div class='del'>- * The set/get functions handle data spanning two pages transparently, in case</div><div class='del'>- * metadata block size is larger than page.  Every pointer to metadata items is</div><div class='del'>- * an offset into the extent buffer page array, cast to a specific type.  This</div><div class='del'>- * gives us all the type checking.</div><div class='del'>- *</div><div class='del'>- * The extent buffer pages stored in the array pages do not form a contiguous</div><div class='del'>- * phyusical range, but the API functions assume the linear offset to the range</div><div class='del'>- * from 0 to metadata node size.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#define DEFINE_BTRFS_SETGET_BITS(bits)					\</div><div class='del'>-u##bits btrfs_get_token_##bits(struct btrfs_map_token *token,		\</div><div class='del'>-			       const void *ptr, unsigned long off)	\</div><div class='del'>-{									\</div><div class='del'>-	const unsigned long member_offset = (unsigned long)ptr + off;	\</div><div class='del'>-	const unsigned long idx = get_eb_page_index(member_offset);	\</div><div class='del'>-	const unsigned long oip = get_eb_offset_in_page(token-&gt;eb,	\</div><div class='del'>-							member_offset);	\</div><div class='del'>-	const int size = sizeof(u##bits);				\</div><div class='del'>-	u8 lebytes[sizeof(u##bits)];					\</div><div class='del'>-	const int part = PAGE_SIZE - oip;				\</div><div class='del'>-									\</div><div class='del'>-	ASSERT(token);							\</div><div class='del'>-	ASSERT(token-&gt;kaddr);						\</div><div class='del'>-	ASSERT(check_setget_bounds(token-&gt;eb, ptr, off, size));		\</div><div class='del'>-	if (token-&gt;offset &lt;= member_offset &amp;&amp;				\</div><div class='del'>-	    member_offset + size &lt;= token-&gt;offset + PAGE_SIZE) {	\</div><div class='del'>-		return get_unaligned_le##bits(token-&gt;kaddr + oip);	\</div><div class='del'>-	}								\</div><div class='del'>-	token-&gt;kaddr = page_address(token-&gt;eb-&gt;pages[idx]);		\</div><div class='del'>-	token-&gt;offset = idx &lt;&lt; PAGE_SHIFT;				\</div><div class='del'>-	if (INLINE_EXTENT_BUFFER_PAGES == 1 || oip + size &lt;= PAGE_SIZE ) \</div><div class='del'>-		return get_unaligned_le##bits(token-&gt;kaddr + oip);	\</div><div class='del'>-									\</div><div class='del'>-	memcpy(lebytes, token-&gt;kaddr + oip, part);			\</div><div class='del'>-	token-&gt;kaddr = page_address(token-&gt;eb-&gt;pages[idx + 1]);		\</div><div class='del'>-	token-&gt;offset = (idx + 1) &lt;&lt; PAGE_SHIFT;			\</div><div class='del'>-	memcpy(lebytes + part, token-&gt;kaddr, size - part);		\</div><div class='del'>-	return get_unaligned_le##bits(lebytes);				\</div><div class='del'>-}									\</div><div class='del'>-u##bits btrfs_get_##bits(const struct extent_buffer *eb,		\</div><div class='del'>-			 const void *ptr, unsigned long off)		\</div><div class='del'>-{									\</div><div class='del'>-	const unsigned long member_offset = (unsigned long)ptr + off;	\</div><div class='del'>-	const unsigned long oip = get_eb_offset_in_page(eb, member_offset); \</div><div class='del'>-	const unsigned long idx = get_eb_page_index(member_offset);	\</div><div class='del'>-	char *kaddr = page_address(eb-&gt;pages[idx]);			\</div><div class='del'>-	const int size = sizeof(u##bits);				\</div><div class='del'>-	const int part = PAGE_SIZE - oip;				\</div><div class='del'>-	u8 lebytes[sizeof(u##bits)];					\</div><div class='del'>-									\</div><div class='del'>-	ASSERT(check_setget_bounds(eb, ptr, off, size));		\</div><div class='del'>-	if (INLINE_EXTENT_BUFFER_PAGES == 1 || oip + size &lt;= PAGE_SIZE)	\</div><div class='del'>-		return get_unaligned_le##bits(kaddr + oip);		\</div><div class='del'>-									\</div><div class='del'>-	memcpy(lebytes, kaddr + oip, part);				\</div><div class='del'>-	kaddr = page_address(eb-&gt;pages[idx + 1]);			\</div><div class='del'>-	memcpy(lebytes + part, kaddr, size - part);			\</div><div class='del'>-	return get_unaligned_le##bits(lebytes);				\</div><div class='del'>-}									\</div><div class='del'>-void btrfs_set_token_##bits(struct btrfs_map_token *token,		\</div><div class='del'>-			    const void *ptr, unsigned long off,		\</div><div class='del'>-			    u##bits val)				\</div><div class='del'>-{									\</div><div class='del'>-	const unsigned long member_offset = (unsigned long)ptr + off;	\</div><div class='del'>-	const unsigned long idx = get_eb_page_index(member_offset);	\</div><div class='del'>-	const unsigned long oip = get_eb_offset_in_page(token-&gt;eb,	\</div><div class='del'>-							member_offset);	\</div><div class='del'>-	const int size = sizeof(u##bits);				\</div><div class='del'>-	u8 lebytes[sizeof(u##bits)];					\</div><div class='del'>-	const int part = PAGE_SIZE - oip;				\</div><div class='del'>-									\</div><div class='del'>-	ASSERT(token);							\</div><div class='del'>-	ASSERT(token-&gt;kaddr);						\</div><div class='del'>-	ASSERT(check_setget_bounds(token-&gt;eb, ptr, off, size));		\</div><div class='del'>-	if (token-&gt;offset &lt;= member_offset &amp;&amp;				\</div><div class='del'>-	    member_offset + size &lt;= token-&gt;offset + PAGE_SIZE) {	\</div><div class='del'>-		put_unaligned_le##bits(val, token-&gt;kaddr + oip);	\</div><div class='del'>-		return;							\</div><div class='del'>-	}								\</div><div class='del'>-	token-&gt;kaddr = page_address(token-&gt;eb-&gt;pages[idx]);		\</div><div class='del'>-	token-&gt;offset = idx &lt;&lt; PAGE_SHIFT;				\</div><div class='del'>-	if (INLINE_EXTENT_BUFFER_PAGES == 1 || oip + size &lt;= PAGE_SIZE) { \</div><div class='del'>-		put_unaligned_le##bits(val, token-&gt;kaddr + oip);	\</div><div class='del'>-		return;							\</div><div class='del'>-	}								\</div><div class='del'>-	put_unaligned_le##bits(val, lebytes);				\</div><div class='del'>-	memcpy(token-&gt;kaddr + oip, lebytes, part);			\</div><div class='del'>-	token-&gt;kaddr = page_address(token-&gt;eb-&gt;pages[idx + 1]);		\</div><div class='del'>-	token-&gt;offset = (idx + 1) &lt;&lt; PAGE_SHIFT;			\</div><div class='del'>-	memcpy(token-&gt;kaddr, lebytes + part, size - part);		\</div><div class='del'>-}									\</div><div class='del'>-void btrfs_set_##bits(const struct extent_buffer *eb, void *ptr,	\</div><div class='del'>-		      unsigned long off, u##bits val)			\</div><div class='del'>-{									\</div><div class='del'>-	const unsigned long member_offset = (unsigned long)ptr + off;	\</div><div class='del'>-	const unsigned long oip = get_eb_offset_in_page(eb, member_offset); \</div><div class='del'>-	const unsigned long idx = get_eb_page_index(member_offset);	\</div><div class='del'>-	char *kaddr = page_address(eb-&gt;pages[idx]);			\</div><div class='del'>-	const int size = sizeof(u##bits);				\</div><div class='del'>-	const int part = PAGE_SIZE - oip;				\</div><div class='del'>-	u8 lebytes[sizeof(u##bits)];					\</div><div class='del'>-									\</div><div class='del'>-	ASSERT(check_setget_bounds(eb, ptr, off, size));		\</div><div class='del'>-	if (INLINE_EXTENT_BUFFER_PAGES == 1 || oip + size &lt;= PAGE_SIZE) { \</div><div class='del'>-		put_unaligned_le##bits(val, kaddr + oip);		\</div><div class='del'>-		return;							\</div><div class='del'>-	}								\</div><div class='del'>-									\</div><div class='del'>-	put_unaligned_le##bits(val, lebytes);				\</div><div class='del'>-	memcpy(kaddr + oip, lebytes, part);				\</div><div class='del'>-	kaddr = page_address(eb-&gt;pages[idx + 1]);			\</div><div class='del'>-	memcpy(kaddr, lebytes + part, size - part);			\</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-DEFINE_BTRFS_SETGET_BITS(8)</div><div class='del'>-DEFINE_BTRFS_SETGET_BITS(16)</div><div class='del'>-DEFINE_BTRFS_SETGET_BITS(32)</div><div class='del'>-DEFINE_BTRFS_SETGET_BITS(64)</div><div class='del'>-</div><div class='del'>-void btrfs_node_key(const struct extent_buffer *eb,</div><div class='del'>-		    struct btrfs_disk_key *disk_key, int nr)</div><div class='del'>-{</div><div class='del'>-	unsigned long ptr = btrfs_node_key_ptr_offset(nr);</div><div class='del'>-	read_eb_member(eb, (struct btrfs_key_ptr *)ptr,</div><div class='del'>-		       struct btrfs_key_ptr, key, disk_key);</div><div class='del'>-}</div><div class='head'>diff --git a/fs/btrfs/subpage.c b/fs/btrfs/subpage.c<br/>index 29bd8c7a7706..f82e71f5d88b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/subpage.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/subpage.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/subpage.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/subpage.c</a></div><div class='hunk'>@@ -1,12 +1,12 @@</div><div class='ctx'> // SPDX-License-Identifier: GPL-2.0</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='del'>-#include "ctree.h"</div><div class='add'>+#include "messages.h"</div><div class='ctx'> #include "subpage.h"</div><div class='ctx'> #include "btrfs_inode.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Subpage (sectorsize &lt; PAGE_SIZE) support overview:</div><div class='add'>+ * Subpage (block size &lt; folio size) support overview:</div><div class='ctx'>  *</div><div class='ctx'>  * Limitations:</div><div class='ctx'>  *</div><div class='hunk'>@@ -49,7 +49,7 @@</div><div class='ctx'>  * Implementation:</div><div class='ctx'>  *</div><div class='ctx'>  * - Common</div><div class='del'>- *   Both metadata and data will use a new structure, btrfs_subpage, to</div><div class='add'>+ *   Both metadata and data will use a new structure, btrfs_folio_state, to</div><div class='ctx'>  *   record the status of each sector inside a page.  This provides the extra</div><div class='ctx'>  *   granularity needed.</div><div class='ctx'>  *</div><div class='hunk'>@@ -63,398 +63,342 @@</div><div class='ctx'>  *   This means a slightly higher tree locking latency.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-void btrfs_init_subpage_info(struct btrfs_subpage_info *subpage_info, u32 sectorsize)</div><div class='add'>+int btrfs_attach_folio_state(const struct btrfs_fs_info *fs_info,</div><div class='add'>+			     struct folio *folio, enum btrfs_folio_type type)</div><div class='ctx'> {</div><div class='del'>-	unsigned int cur = 0;</div><div class='del'>-	unsigned int nr_bits;</div><div class='add'>+	struct btrfs_folio_state *bfs;</div><div class='ctx'> </div><div class='del'>-	ASSERT(IS_ALIGNED(PAGE_SIZE, sectorsize));</div><div class='del'>-</div><div class='del'>-	nr_bits = PAGE_SIZE / sectorsize;</div><div class='del'>-	subpage_info-&gt;bitmap_nr_bits = nr_bits;</div><div class='del'>-</div><div class='del'>-	subpage_info-&gt;uptodate_offset = cur;</div><div class='del'>-	cur += nr_bits;</div><div class='del'>-</div><div class='del'>-	subpage_info-&gt;error_offset = cur;</div><div class='del'>-	cur += nr_bits;</div><div class='del'>-</div><div class='del'>-	subpage_info-&gt;dirty_offset = cur;</div><div class='del'>-	cur += nr_bits;</div><div class='del'>-</div><div class='del'>-	subpage_info-&gt;writeback_offset = cur;</div><div class='del'>-	cur += nr_bits;</div><div class='del'>-</div><div class='del'>-	subpage_info-&gt;ordered_offset = cur;</div><div class='del'>-	cur += nr_bits;</div><div class='del'>-</div><div class='del'>-	subpage_info-&gt;checked_offset = cur;</div><div class='del'>-	cur += nr_bits;</div><div class='del'>-</div><div class='del'>-	subpage_info-&gt;total_nr_bits = cur;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int btrfs_attach_subpage(const struct btrfs_fs_info *fs_info,</div><div class='del'>-			 struct page *page, enum btrfs_subpage_type type)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_subpage *subpage;</div><div class='add'>+	/* For metadata we don't support large folio yet. */</div><div class='add'>+	if (type == BTRFS_SUBPAGE_METADATA)</div><div class='add'>+		ASSERT(!folio_test_large(folio));</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * We have cases like a dummy extent buffer page, which is not mappped</div><div class='add'>+	 * We have cases like a dummy extent buffer page, which is not mapped</div><div class='ctx'> 	 * and doesn't need to be locked.</div><div class='ctx'> 	 */</div><div class='del'>-	if (page-&gt;mapping)</div><div class='del'>-		ASSERT(PageLocked(page));</div><div class='add'>+	if (folio-&gt;mapping)</div><div class='add'>+		ASSERT(folio_test_locked(folio));</div><div class='ctx'> </div><div class='del'>-	/* Either not subpage, or the page already has private attached */</div><div class='del'>-	if (fs_info-&gt;sectorsize == PAGE_SIZE || PagePrivate(page))</div><div class='add'>+	/* Either not subpage, or the folio already has private attached. */</div><div class='add'>+	if (folio_test_private(folio))</div><div class='add'>+		return 0;</div><div class='add'>+	if (type == BTRFS_SUBPAGE_METADATA &amp;&amp; !btrfs_meta_is_subpage(fs_info))</div><div class='add'>+		return 0;</div><div class='add'>+	if (type == BTRFS_SUBPAGE_DATA &amp;&amp; !btrfs_is_subpage(fs_info, folio))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	subpage = btrfs_alloc_subpage(fs_info, type);</div><div class='del'>-	if (IS_ERR(subpage))</div><div class='del'>-		return  PTR_ERR(subpage);</div><div class='add'>+	bfs = btrfs_alloc_folio_state(fs_info, folio_size(folio), type);</div><div class='add'>+	if (IS_ERR(bfs))</div><div class='add'>+		return PTR_ERR(bfs);</div><div class='ctx'> </div><div class='del'>-	attach_page_private(page, subpage);</div><div class='add'>+	folio_attach_private(folio, bfs);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_detach_subpage(const struct btrfs_fs_info *fs_info,</div><div class='del'>-			  struct page *page)</div><div class='add'>+void btrfs_detach_folio_state(const struct btrfs_fs_info *fs_info, struct folio *folio,</div><div class='add'>+			      enum btrfs_folio_type type)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_subpage *subpage;</div><div class='add'>+	struct btrfs_folio_state *bfs;</div><div class='ctx'> </div><div class='del'>-	/* Either not subpage, or already detached */</div><div class='del'>-	if (fs_info-&gt;sectorsize == PAGE_SIZE || !PagePrivate(page))</div><div class='add'>+	/* Either not subpage, or the folio already has private attached. */</div><div class='add'>+	if (!folio_test_private(folio))</div><div class='add'>+		return;</div><div class='add'>+	if (type == BTRFS_SUBPAGE_METADATA &amp;&amp; !btrfs_meta_is_subpage(fs_info))</div><div class='add'>+		return;</div><div class='add'>+	if (type == BTRFS_SUBPAGE_DATA &amp;&amp; !btrfs_is_subpage(fs_info, folio))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	subpage = (struct btrfs_subpage *)detach_page_private(page);</div><div class='del'>-	ASSERT(subpage);</div><div class='del'>-	btrfs_free_subpage(subpage);</div><div class='add'>+	bfs = folio_detach_private(folio);</div><div class='add'>+	ASSERT(bfs);</div><div class='add'>+	btrfs_free_folio_state(bfs);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct btrfs_subpage *btrfs_alloc_subpage(const struct btrfs_fs_info *fs_info,</div><div class='del'>-					  enum btrfs_subpage_type type)</div><div class='add'>+struct btrfs_folio_state *btrfs_alloc_folio_state(const struct btrfs_fs_info *fs_info,</div><div class='add'>+						  size_t fsize, enum btrfs_folio_type type)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_subpage *ret;</div><div class='add'>+	struct btrfs_folio_state *ret;</div><div class='ctx'> 	unsigned int real_size;</div><div class='ctx'> </div><div class='del'>-	ASSERT(fs_info-&gt;sectorsize &lt; PAGE_SIZE);</div><div class='add'>+	ASSERT(fs_info-&gt;sectorsize &lt; fsize);</div><div class='ctx'> </div><div class='ctx'> 	real_size = struct_size(ret, bitmaps,</div><div class='del'>-			BITS_TO_LONGS(fs_info-&gt;subpage_info-&gt;total_nr_bits));</div><div class='add'>+			BITS_TO_LONGS(btrfs_bitmap_nr_max *</div><div class='add'>+				      (fsize &gt;&gt; fs_info-&gt;sectorsize_bits)));</div><div class='ctx'> 	ret = kzalloc(real_size, GFP_NOFS);</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock_init(&amp;ret-&gt;lock);</div><div class='del'>-	if (type == BTRFS_SUBPAGE_METADATA) {</div><div class='add'>+	if (type == BTRFS_SUBPAGE_METADATA)</div><div class='ctx'> 		atomic_set(&amp;ret-&gt;eb_refs, 0);</div><div class='del'>-	} else {</div><div class='del'>-		atomic_set(&amp;ret-&gt;readers, 0);</div><div class='del'>-		atomic_set(&amp;ret-&gt;writers, 0);</div><div class='del'>-	}</div><div class='add'>+	else</div><div class='add'>+		atomic_set(&amp;ret-&gt;nr_locked, 0);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_free_subpage(struct btrfs_subpage *subpage)</div><div class='del'>-{</div><div class='del'>-	kfree(subpage);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Increase the eb_refs of current subpage.</div><div class='ctx'>  *</div><div class='ctx'>  * This is important for eb allocation, to prevent race with last eb freeing</div><div class='ctx'>  * of the same page.</div><div class='ctx'>  * With the eb_refs increased before the eb inserted into radix tree,</div><div class='del'>- * detach_extent_buffer_page() won't detach the page private while we're still</div><div class='add'>+ * detach_extent_buffer_page() won't detach the folio private while we're still</div><div class='ctx'>  * allocating the extent buffer.</div><div class='ctx'>  */</div><div class='del'>-void btrfs_page_inc_eb_refs(const struct btrfs_fs_info *fs_info,</div><div class='del'>-			    struct page *page)</div><div class='add'>+void btrfs_folio_inc_eb_refs(const struct btrfs_fs_info *fs_info, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_subpage *subpage;</div><div class='add'>+	struct btrfs_folio_state *bfs;</div><div class='ctx'> </div><div class='del'>-	if (fs_info-&gt;sectorsize == PAGE_SIZE)</div><div class='add'>+	if (!btrfs_meta_is_subpage(fs_info))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	ASSERT(PagePrivate(page) &amp;&amp; page-&gt;mapping);</div><div class='del'>-	lockdep_assert_held(&amp;page-&gt;mapping-&gt;private_lock);</div><div class='add'>+	ASSERT(folio_test_private(folio) &amp;&amp; folio-&gt;mapping);</div><div class='add'>+	lockdep_assert_held(&amp;folio-&gt;mapping-&gt;i_private_lock);</div><div class='ctx'> </div><div class='del'>-	subpage = (struct btrfs_subpage *)page-&gt;private;</div><div class='del'>-	atomic_inc(&amp;subpage-&gt;eb_refs);</div><div class='add'>+	bfs = folio_get_private(folio);</div><div class='add'>+	atomic_inc(&amp;bfs-&gt;eb_refs);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_page_dec_eb_refs(const struct btrfs_fs_info *fs_info,</div><div class='del'>-			    struct page *page)</div><div class='add'>+void btrfs_folio_dec_eb_refs(const struct btrfs_fs_info *fs_info, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_subpage *subpage;</div><div class='add'>+	struct btrfs_folio_state *bfs;</div><div class='ctx'> </div><div class='del'>-	if (fs_info-&gt;sectorsize == PAGE_SIZE)</div><div class='add'>+	if (!btrfs_meta_is_subpage(fs_info))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	ASSERT(PagePrivate(page) &amp;&amp; page-&gt;mapping);</div><div class='del'>-	lockdep_assert_held(&amp;page-&gt;mapping-&gt;private_lock);</div><div class='add'>+	ASSERT(folio_test_private(folio) &amp;&amp; folio-&gt;mapping);</div><div class='add'>+	lockdep_assert_held(&amp;folio-&gt;mapping-&gt;i_private_lock);</div><div class='ctx'> </div><div class='del'>-	subpage = (struct btrfs_subpage *)page-&gt;private;</div><div class='del'>-	ASSERT(atomic_read(&amp;subpage-&gt;eb_refs));</div><div class='del'>-	atomic_dec(&amp;subpage-&gt;eb_refs);</div><div class='add'>+	bfs = folio_get_private(folio);</div><div class='add'>+	ASSERT(atomic_read(&amp;bfs-&gt;eb_refs));</div><div class='add'>+	atomic_dec(&amp;bfs-&gt;eb_refs);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void btrfs_subpage_assert(const struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct page *page, u64 start, u32 len)</div><div class='add'>+				 struct folio *folio, u64 start, u32 len)</div><div class='ctx'> {</div><div class='ctx'> 	/* Basic checks */</div><div class='del'>-	ASSERT(PagePrivate(page) &amp;&amp; page-&gt;private);</div><div class='add'>+	ASSERT(folio_test_private(folio) &amp;&amp; folio_get_private(folio));</div><div class='ctx'> 	ASSERT(IS_ALIGNED(start, fs_info-&gt;sectorsize) &amp;&amp;</div><div class='del'>-	       IS_ALIGNED(len, fs_info-&gt;sectorsize));</div><div class='add'>+	       IS_ALIGNED(len, fs_info-&gt;sectorsize), "start=%llu len=%u", start, len);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The range check only works for mapped page, we can still have</div><div class='ctx'> 	 * unmapped page like dummy extent buffer pages.</div><div class='ctx'> 	 */</div><div class='del'>-	if (page-&gt;mapping)</div><div class='del'>-		ASSERT(page_offset(page) &lt;= start &amp;&amp;</div><div class='del'>-		       start + len &lt;= page_offset(page) + PAGE_SIZE);</div><div class='add'>+	if (folio-&gt;mapping)</div><div class='add'>+		ASSERT(folio_pos(folio) &lt;= start &amp;&amp;</div><div class='add'>+		       start + len &lt;= folio_next_pos(folio),</div><div class='add'>+		       "start=%llu len=%u folio_pos=%llu folio_size=%zu",</div><div class='add'>+		       start, len, folio_pos(folio), folio_size(folio));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_subpage_start_reader(const struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct page *page, u64 start, u32 len)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page-&gt;private;</div><div class='del'>-	const int nbits = len &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='del'>-</div><div class='del'>-	btrfs_subpage_assert(fs_info, page, start, len);</div><div class='del'>-</div><div class='del'>-	atomic_add(nbits, &amp;subpage-&gt;readers);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void btrfs_subpage_end_reader(const struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct page *page, u64 start, u32 len)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page-&gt;private;</div><div class='del'>-	const int nbits = len &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='del'>-	bool is_data;</div><div class='del'>-	bool last;</div><div class='del'>-</div><div class='del'>-	btrfs_subpage_assert(fs_info, page, start, len);</div><div class='del'>-	is_data = is_data_inode(page-&gt;mapping-&gt;host);</div><div class='del'>-	ASSERT(atomic_read(&amp;subpage-&gt;readers) &gt;= nbits);</div><div class='del'>-	last = atomic_sub_and_test(nbits, &amp;subpage-&gt;readers);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * For data we need to unlock the page if the last read has finished.</div><div class='del'>-	 *</div><div class='del'>-	 * And please don't replace @last with atomic_sub_and_test() call</div><div class='del'>-	 * inside if () condition.</div><div class='del'>-	 * As we want the atomic_sub_and_test() to be always executed.</div><div class='del'>-	 */</div><div class='del'>-	if (is_data &amp;&amp; last)</div><div class='del'>-		unlock_page(page);</div><div class='del'>-}</div><div class='add'>+#define subpage_calc_start_bit(fs_info, folio, name, start, len)	\</div><div class='add'>+({									\</div><div class='add'>+	unsigned int __start_bit;					\</div><div class='add'>+	const unsigned int __bpf = btrfs_blocks_per_folio(fs_info, folio); \</div><div class='add'>+									\</div><div class='add'>+	btrfs_subpage_assert(fs_info, folio, start, len);		\</div><div class='add'>+	__start_bit = offset_in_folio(folio, start) &gt;&gt; fs_info-&gt;sectorsize_bits; \</div><div class='add'>+	__start_bit += __bpf * btrfs_bitmap_nr_##name;			\</div><div class='add'>+	__start_bit;							\</div><div class='add'>+})</div><div class='ctx'> </div><div class='del'>-static void btrfs_subpage_clamp_range(struct page *page, u64 *start, u32 *len)</div><div class='add'>+static void btrfs_subpage_clamp_range(struct folio *folio, u64 *start, u32 *len)</div><div class='ctx'> {</div><div class='ctx'> 	u64 orig_start = *start;</div><div class='ctx'> 	u32 orig_len = *len;</div><div class='ctx'> </div><div class='del'>-	*start = max_t(u64, page_offset(page), orig_start);</div><div class='add'>+	*start = max_t(u64, folio_pos(folio), orig_start);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * For certain call sites like btrfs_drop_pages(), we may have pages</div><div class='ctx'> 	 * beyond the target range. In that case, just set @len to 0, subpage</div><div class='ctx'> 	 * helpers can handle @len == 0 without any problem.</div><div class='ctx'> 	 */</div><div class='del'>-	if (page_offset(page) &gt;= orig_start + orig_len)</div><div class='add'>+	if (folio_pos(folio) &gt;= orig_start + orig_len)</div><div class='ctx'> 		*len = 0;</div><div class='ctx'> 	else</div><div class='del'>-		*len = min_t(u64, page_offset(page) + PAGE_SIZE,</div><div class='del'>-			     orig_start + orig_len) - *start;</div><div class='add'>+		*len = min_t(u64, folio_next_pos(folio), orig_start + orig_len) - *start;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_subpage_start_writer(const struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct page *page, u64 start, u32 len)</div><div class='add'>+static bool btrfs_subpage_end_and_test_lock(const struct btrfs_fs_info *fs_info,</div><div class='add'>+					    struct folio *folio, u64 start, u32 len)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page-&gt;private;</div><div class='del'>-	const int nbits = (len &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	btrfs_subpage_assert(fs_info, page, start, len);</div><div class='del'>-</div><div class='del'>-	ASSERT(atomic_read(&amp;subpage-&gt;readers) == 0);</div><div class='del'>-	ret = atomic_add_return(nbits, &amp;subpage-&gt;writers);</div><div class='del'>-	ASSERT(ret == nbits);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-bool btrfs_subpage_end_and_test_writer(const struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct page *page, u64 start, u32 len)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page-&gt;private;</div><div class='add'>+	struct btrfs_folio_state *bfs = folio_get_private(folio);</div><div class='add'>+	const int start_bit = subpage_calc_start_bit(fs_info, folio, locked, start, len);</div><div class='ctx'> 	const int nbits = (len &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+	unsigned long flags;</div><div class='add'>+	unsigned int cleared = 0;</div><div class='add'>+	int bit = start_bit;</div><div class='add'>+	bool last;</div><div class='ctx'> </div><div class='del'>-	btrfs_subpage_assert(fs_info, page, start, len);</div><div class='add'>+	btrfs_subpage_assert(fs_info, folio, start, len);</div><div class='ctx'> </div><div class='add'>+	spin_lock_irqsave(&amp;bfs-&gt;lock, flags);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We have call sites passing @lock_page into</div><div class='ctx'> 	 * extent_clear_unlock_delalloc() for compression path.</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * This @locked_page is locked by plain lock_page(), thus its</div><div class='del'>-	 * subpage::writers is 0.  Handle them in a special way.</div><div class='add'>+	 * subpage::locked is 0.  Handle them in a special way.</div><div class='ctx'> 	 */</div><div class='del'>-	if (atomic_read(&amp;subpage-&gt;writers) == 0)</div><div class='add'>+	if (atomic_read(&amp;bfs-&gt;nr_locked) == 0) {</div><div class='add'>+		spin_unlock_irqrestore(&amp;bfs-&gt;lock, flags);</div><div class='ctx'> 		return true;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	ASSERT(atomic_read(&amp;subpage-&gt;writers) &gt;= nbits);</div><div class='del'>-	return atomic_sub_and_test(nbits, &amp;subpage-&gt;writers);</div><div class='add'>+	for_each_set_bit_from(bit, bfs-&gt;bitmaps, start_bit + nbits) {</div><div class='add'>+		clear_bit(bit, bfs-&gt;bitmaps);</div><div class='add'>+		cleared++;</div><div class='add'>+	}</div><div class='add'>+	ASSERT(atomic_read(&amp;bfs-&gt;nr_locked) &gt;= cleared,</div><div class='add'>+	       "atomic_read(&amp;bfs-&gt;nr_locked)=%d cleared=%d",</div><div class='add'>+	       atomic_read(&amp;bfs-&gt;nr_locked), cleared);</div><div class='add'>+	last = atomic_sub_and_test(cleared, &amp;bfs-&gt;nr_locked);</div><div class='add'>+	spin_unlock_irqrestore(&amp;bfs-&gt;lock, flags);</div><div class='add'>+	return last;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Lock a page for delalloc page writeback.</div><div class='add'>+ * Handle different locked folios:</div><div class='ctx'>  *</div><div class='del'>- * Return -EAGAIN if the page is not properly initialized.</div><div class='del'>- * Return 0 with the page locked, and writer counter updated.</div><div class='add'>+ * - Non-subpage folio</div><div class='add'>+ *   Just unlock it.</div><div class='ctx'>  *</div><div class='del'>- * Even with 0 returned, the page still need extra check to make sure</div><div class='del'>- * it's really the correct page, as the caller is using</div><div class='del'>- * find_get_pages_contig(), which can race with page invalidating.</div><div class='add'>+ * - folio locked but without any subpage locked</div><div class='add'>+ *   This happens either before writepage_delalloc() or the delalloc range is</div><div class='add'>+ *   already handled by previous folio.</div><div class='add'>+ *   We can simple unlock it.</div><div class='add'>+ *</div><div class='add'>+ * - folio locked with subpage range locked.</div><div class='add'>+ *   We go through the locked sectors inside the range and clear their locked</div><div class='add'>+ *   bitmap, reduce the writer lock number, and unlock the page if that's</div><div class='add'>+ *   the last locked range.</div><div class='ctx'>  */</div><div class='del'>-int btrfs_page_start_writer_lock(const struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct page *page, u64 start, u32 len)</div><div class='add'>+void btrfs_folio_end_lock(const struct btrfs_fs_info *fs_info,</div><div class='add'>+			  struct folio *folio, u64 start, u32 len)</div><div class='ctx'> {</div><div class='del'>-	if (unlikely(!fs_info) || fs_info-&gt;sectorsize == PAGE_SIZE) {</div><div class='del'>-		lock_page(page);</div><div class='del'>-		return 0;</div><div class='add'>+	struct btrfs_folio_state *bfs = folio_get_private(folio);</div><div class='add'>+</div><div class='add'>+	ASSERT(folio_test_locked(folio));</div><div class='add'>+</div><div class='add'>+	if (unlikely(!fs_info) || !btrfs_is_subpage(fs_info, folio)) {</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='del'>-	lock_page(page);</div><div class='del'>-	if (!PagePrivate(page) || !page-&gt;private) {</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		return -EAGAIN;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * For subpage case, there are two types of locked page.  With or</div><div class='add'>+	 * without locked number.</div><div class='add'>+	 *</div><div class='add'>+	 * Since we own the page lock, no one else could touch subpage::locked</div><div class='add'>+	 * and we are safe to do several atomic operations without spinlock.</div><div class='add'>+	 */</div><div class='add'>+	if (atomic_read(&amp;bfs-&gt;nr_locked) == 0) {</div><div class='add'>+		/* No subpage lock, locked by plain lock_page(). */</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_subpage_clamp_range(page, &amp;start, &amp;len);</div><div class='del'>-	btrfs_subpage_start_writer(fs_info, page, start, len);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='ctx'> </div><div class='del'>-void btrfs_page_end_writer_lock(const struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct page *page, u64 start, u32 len)</div><div class='del'>-{</div><div class='del'>-	if (unlikely(!fs_info) || fs_info-&gt;sectorsize == PAGE_SIZE)</div><div class='del'>-		return unlock_page(page);</div><div class='del'>-	btrfs_subpage_clamp_range(page, &amp;start, &amp;len);</div><div class='del'>-	if (btrfs_subpage_end_and_test_writer(fs_info, page, start, len))</div><div class='del'>-		unlock_page(page);</div><div class='add'>+	btrfs_subpage_clamp_range(folio, &amp;start, &amp;len);</div><div class='add'>+	if (btrfs_subpage_end_and_test_lock(fs_info, folio, start, len))</div><div class='add'>+		folio_unlock(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool bitmap_test_range_all_set(unsigned long *addr, unsigned int start,</div><div class='del'>-				      unsigned int nbits)</div><div class='add'>+void btrfs_folio_end_lock_bitmap(const struct btrfs_fs_info *fs_info,</div><div class='add'>+				 struct folio *folio, unsigned long bitmap)</div><div class='ctx'> {</div><div class='del'>-	unsigned int found_zero;</div><div class='add'>+	struct btrfs_folio_state *bfs = folio_get_private(folio);</div><div class='add'>+	const unsigned int blocks_per_folio = btrfs_blocks_per_folio(fs_info, folio);</div><div class='add'>+	const int start_bit = blocks_per_folio * btrfs_bitmap_nr_locked;</div><div class='add'>+	unsigned long flags;</div><div class='add'>+	bool last = false;</div><div class='add'>+	int cleared = 0;</div><div class='add'>+	int bit;</div><div class='ctx'> </div><div class='del'>-	found_zero = find_next_zero_bit(addr, start + nbits, start);</div><div class='del'>-	if (found_zero == start + nbits)</div><div class='del'>-		return true;</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='add'>+	if (!btrfs_is_subpage(fs_info, folio)) {</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-static bool bitmap_test_range_all_zero(unsigned long *addr, unsigned int start,</div><div class='del'>-				       unsigned int nbits)</div><div class='del'>-{</div><div class='del'>-	unsigned int found_set;</div><div class='add'>+	if (atomic_read(&amp;bfs-&gt;nr_locked) == 0) {</div><div class='add'>+		/* No subpage lock, locked by plain lock_page(). */</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	found_set = find_next_bit(addr, start + nbits, start);</div><div class='del'>-	if (found_set == start + nbits)</div><div class='del'>-		return true;</div><div class='del'>-	return false;</div><div class='add'>+	spin_lock_irqsave(&amp;bfs-&gt;lock, flags);</div><div class='add'>+	for_each_set_bit(bit, &amp;bitmap, blocks_per_folio) {</div><div class='add'>+		if (test_and_clear_bit(bit + start_bit, bfs-&gt;bitmaps))</div><div class='add'>+			cleared++;</div><div class='add'>+	}</div><div class='add'>+	ASSERT(atomic_read(&amp;bfs-&gt;nr_locked) &gt;= cleared,</div><div class='add'>+	       "atomic_read(&amp;bfs-&gt;nr_locked)=%d cleared=%d",</div><div class='add'>+	       atomic_read(&amp;bfs-&gt;nr_locked), cleared);</div><div class='add'>+	last = atomic_sub_and_test(cleared, &amp;bfs-&gt;nr_locked);</div><div class='add'>+	spin_unlock_irqrestore(&amp;bfs-&gt;lock, flags);</div><div class='add'>+	if (last)</div><div class='add'>+		folio_unlock(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#define subpage_calc_start_bit(fs_info, page, name, start, len)		\</div><div class='add'>+#define subpage_test_bitmap_all_set(fs_info, folio, name)		\</div><div class='ctx'> ({									\</div><div class='del'>-	unsigned int start_bit;						\</div><div class='add'>+	struct btrfs_folio_state *__bfs = folio_get_private(folio);	\</div><div class='add'>+	const unsigned int __bpf = btrfs_blocks_per_folio(fs_info, folio); \</div><div class='ctx'> 									\</div><div class='del'>-	btrfs_subpage_assert(fs_info, page, start, len);		\</div><div class='del'>-	start_bit = offset_in_page(start) &gt;&gt; fs_info-&gt;sectorsize_bits;	\</div><div class='del'>-	start_bit += fs_info-&gt;subpage_info-&gt;name##_offset;		\</div><div class='del'>-	start_bit;							\</div><div class='add'>+	bitmap_test_range_all_set(__bfs-&gt;bitmaps,			\</div><div class='add'>+				  __bpf * btrfs_bitmap_nr_##name, __bpf); \</div><div class='ctx'> })</div><div class='ctx'> </div><div class='del'>-#define subpage_test_bitmap_all_set(fs_info, subpage, name)		\</div><div class='del'>-	bitmap_test_range_all_set(subpage-&gt;bitmaps,			\</div><div class='del'>-			fs_info-&gt;subpage_info-&gt;name##_offset,		\</div><div class='del'>-			fs_info-&gt;subpage_info-&gt;bitmap_nr_bits)</div><div class='del'>-</div><div class='del'>-#define subpage_test_bitmap_all_zero(fs_info, subpage, name)		\</div><div class='del'>-	bitmap_test_range_all_zero(subpage-&gt;bitmaps,			\</div><div class='del'>-			fs_info-&gt;subpage_info-&gt;name##_offset,		\</div><div class='del'>-			fs_info-&gt;subpage_info-&gt;bitmap_nr_bits)</div><div class='add'>+#define subpage_test_bitmap_all_zero(fs_info, folio, name)		\</div><div class='add'>+({									\</div><div class='add'>+	struct btrfs_folio_state *__bfs = folio_get_private(folio);	\</div><div class='add'>+	const unsigned int __bpf = btrfs_blocks_per_folio(fs_info, folio); \</div><div class='add'>+									\</div><div class='add'>+	bitmap_test_range_all_zero(__bfs-&gt;bitmaps,			\</div><div class='add'>+				   __bpf * btrfs_bitmap_nr_##name, __bpf); \</div><div class='add'>+})</div><div class='ctx'> </div><div class='ctx'> void btrfs_subpage_set_uptodate(const struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct page *page, u64 start, u32 len)</div><div class='add'>+				struct folio *folio, u64 start, u32 len)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page-&gt;private;</div><div class='del'>-	unsigned int start_bit = subpage_calc_start_bit(fs_info, page,</div><div class='add'>+	struct btrfs_folio_state *bfs = folio_get_private(folio);</div><div class='add'>+	unsigned int start_bit = subpage_calc_start_bit(fs_info, folio,</div><div class='ctx'> 							uptodate, start, len);</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> </div><div class='del'>-	spin_lock_irqsave(&amp;subpage-&gt;lock, flags);</div><div class='del'>-	bitmap_set(subpage-&gt;bitmaps, start_bit, len &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='del'>-	if (subpage_test_bitmap_all_set(fs_info, subpage, uptodate))</div><div class='del'>-		SetPageUptodate(page);</div><div class='del'>-	spin_unlock_irqrestore(&amp;subpage-&gt;lock, flags);</div><div class='add'>+	spin_lock_irqsave(&amp;bfs-&gt;lock, flags);</div><div class='add'>+	bitmap_set(bfs-&gt;bitmaps, start_bit, len &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+	if (subpage_test_bitmap_all_set(fs_info, folio, uptodate))</div><div class='add'>+		folio_mark_uptodate(folio);</div><div class='add'>+	spin_unlock_irqrestore(&amp;bfs-&gt;lock, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_subpage_clear_uptodate(const struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct page *page, u64 start, u32 len)</div><div class='add'>+				  struct folio *folio, u64 start, u32 len)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page-&gt;private;</div><div class='del'>-	unsigned int start_bit = subpage_calc_start_bit(fs_info, page,</div><div class='add'>+	struct btrfs_folio_state *bfs = folio_get_private(folio);</div><div class='add'>+	unsigned int start_bit = subpage_calc_start_bit(fs_info, folio,</div><div class='ctx'> 							uptodate, start, len);</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> </div><div class='del'>-	spin_lock_irqsave(&amp;subpage-&gt;lock, flags);</div><div class='del'>-	bitmap_clear(subpage-&gt;bitmaps, start_bit, len &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='del'>-	ClearPageUptodate(page);</div><div class='del'>-	spin_unlock_irqrestore(&amp;subpage-&gt;lock, flags);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void btrfs_subpage_set_error(const struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct page *page, u64 start, u32 len)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page-&gt;private;</div><div class='del'>-	unsigned int start_bit = subpage_calc_start_bit(fs_info, page,</div><div class='del'>-							error, start, len);</div><div class='del'>-	unsigned long flags;</div><div class='del'>-</div><div class='del'>-	spin_lock_irqsave(&amp;subpage-&gt;lock, flags);</div><div class='del'>-	bitmap_set(subpage-&gt;bitmaps, start_bit, len &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='del'>-	SetPageError(page);</div><div class='del'>-	spin_unlock_irqrestore(&amp;subpage-&gt;lock, flags);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void btrfs_subpage_clear_error(const struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct page *page, u64 start, u32 len)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page-&gt;private;</div><div class='del'>-	unsigned int start_bit = subpage_calc_start_bit(fs_info, page,</div><div class='del'>-							error, start, len);</div><div class='del'>-	unsigned long flags;</div><div class='del'>-</div><div class='del'>-	spin_lock_irqsave(&amp;subpage-&gt;lock, flags);</div><div class='del'>-	bitmap_clear(subpage-&gt;bitmaps, start_bit, len &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='del'>-	if (subpage_test_bitmap_all_zero(fs_info, subpage, error))</div><div class='del'>-		ClearPageError(page);</div><div class='del'>-	spin_unlock_irqrestore(&amp;subpage-&gt;lock, flags);</div><div class='add'>+	spin_lock_irqsave(&amp;bfs-&gt;lock, flags);</div><div class='add'>+	bitmap_clear(bfs-&gt;bitmaps, start_bit, len &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+	folio_clear_uptodate(folio);</div><div class='add'>+	spin_unlock_irqrestore(&amp;bfs-&gt;lock, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_subpage_set_dirty(const struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct page *page, u64 start, u32 len)</div><div class='add'>+			     struct folio *folio, u64 start, u32 len)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page-&gt;private;</div><div class='del'>-	unsigned int start_bit = subpage_calc_start_bit(fs_info, page,</div><div class='add'>+	struct btrfs_folio_state *bfs = folio_get_private(folio);</div><div class='add'>+	unsigned int start_bit = subpage_calc_start_bit(fs_info, folio,</div><div class='ctx'> 							dirty, start, len);</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> </div><div class='del'>-	spin_lock_irqsave(&amp;subpage-&gt;lock, flags);</div><div class='del'>-	bitmap_set(subpage-&gt;bitmaps, start_bit, len &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='del'>-	spin_unlock_irqrestore(&amp;subpage-&gt;lock, flags);</div><div class='del'>-	set_page_dirty(page);</div><div class='add'>+	spin_lock_irqsave(&amp;bfs-&gt;lock, flags);</div><div class='add'>+	bitmap_set(bfs-&gt;bitmaps, start_bit, len &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+	spin_unlock_irqrestore(&amp;bfs-&gt;lock, flags);</div><div class='add'>+	folio_mark_dirty(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -468,119 +412,129 @@ void btrfs_subpage_set_dirty(const struct btrfs_fs_info *fs_info,</div><div class='ctx'>  * extra handling for tree blocks.</div><div class='ctx'>  */</div><div class='ctx'> bool btrfs_subpage_clear_and_test_dirty(const struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct page *page, u64 start, u32 len)</div><div class='add'>+					struct folio *folio, u64 start, u32 len)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page-&gt;private;</div><div class='del'>-	unsigned int start_bit = subpage_calc_start_bit(fs_info, page,</div><div class='add'>+	struct btrfs_folio_state *bfs = folio_get_private(folio);</div><div class='add'>+	unsigned int start_bit = subpage_calc_start_bit(fs_info, folio,</div><div class='ctx'> 							dirty, start, len);</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> 	bool last = false;</div><div class='ctx'> </div><div class='del'>-	spin_lock_irqsave(&amp;subpage-&gt;lock, flags);</div><div class='del'>-	bitmap_clear(subpage-&gt;bitmaps, start_bit, len &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='del'>-	if (subpage_test_bitmap_all_zero(fs_info, subpage, dirty))</div><div class='add'>+	spin_lock_irqsave(&amp;bfs-&gt;lock, flags);</div><div class='add'>+	bitmap_clear(bfs-&gt;bitmaps, start_bit, len &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+	if (subpage_test_bitmap_all_zero(fs_info, folio, dirty))</div><div class='ctx'> 		last = true;</div><div class='del'>-	spin_unlock_irqrestore(&amp;subpage-&gt;lock, flags);</div><div class='add'>+	spin_unlock_irqrestore(&amp;bfs-&gt;lock, flags);</div><div class='ctx'> 	return last;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_subpage_clear_dirty(const struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct page *page, u64 start, u32 len)</div><div class='add'>+			       struct folio *folio, u64 start, u32 len)</div><div class='ctx'> {</div><div class='ctx'> 	bool last;</div><div class='ctx'> </div><div class='del'>-	last = btrfs_subpage_clear_and_test_dirty(fs_info, page, start, len);</div><div class='add'>+	last = btrfs_subpage_clear_and_test_dirty(fs_info, folio, start, len);</div><div class='ctx'> 	if (last)</div><div class='del'>-		clear_page_dirty_for_io(page);</div><div class='add'>+		folio_clear_dirty_for_io(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_subpage_set_writeback(const struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct page *page, u64 start, u32 len)</div><div class='add'>+				 struct folio *folio, u64 start, u32 len)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page-&gt;private;</div><div class='del'>-	unsigned int start_bit = subpage_calc_start_bit(fs_info, page,</div><div class='add'>+	struct btrfs_folio_state *bfs = folio_get_private(folio);</div><div class='add'>+	unsigned int start_bit = subpage_calc_start_bit(fs_info, folio,</div><div class='ctx'> 							writeback, start, len);</div><div class='ctx'> 	unsigned long flags;</div><div class='add'>+	bool keep_write;</div><div class='add'>+</div><div class='add'>+	spin_lock_irqsave(&amp;bfs-&gt;lock, flags);</div><div class='add'>+	bitmap_set(bfs-&gt;bitmaps, start_bit, len &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='ctx'> </div><div class='del'>-	spin_lock_irqsave(&amp;subpage-&gt;lock, flags);</div><div class='del'>-	bitmap_set(subpage-&gt;bitmaps, start_bit, len &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='del'>-	set_page_writeback(page);</div><div class='del'>-	spin_unlock_irqrestore(&amp;subpage-&gt;lock, flags);</div><div class='add'>+	/*</div><div class='add'>+	 * Don't clear the TOWRITE tag when starting writeback on a still-dirty</div><div class='add'>+	 * folio. Doing so can cause WB_SYNC_ALL writepages() to overlook it,</div><div class='add'>+	 * assume writeback is complete, and exit too early — violating sync</div><div class='add'>+	 * ordering guarantees.</div><div class='add'>+	 */</div><div class='add'>+	keep_write = folio_test_dirty(folio);</div><div class='add'>+	if (!folio_test_writeback(folio))</div><div class='add'>+		__folio_start_writeback(folio, keep_write);</div><div class='add'>+	spin_unlock_irqrestore(&amp;bfs-&gt;lock, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_subpage_clear_writeback(const struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct page *page, u64 start, u32 len)</div><div class='add'>+				   struct folio *folio, u64 start, u32 len)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page-&gt;private;</div><div class='del'>-	unsigned int start_bit = subpage_calc_start_bit(fs_info, page,</div><div class='add'>+	struct btrfs_folio_state *bfs = folio_get_private(folio);</div><div class='add'>+	unsigned int start_bit = subpage_calc_start_bit(fs_info, folio,</div><div class='ctx'> 							writeback, start, len);</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> </div><div class='del'>-	spin_lock_irqsave(&amp;subpage-&gt;lock, flags);</div><div class='del'>-	bitmap_clear(subpage-&gt;bitmaps, start_bit, len &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='del'>-	if (subpage_test_bitmap_all_zero(fs_info, subpage, writeback)) {</div><div class='del'>-		ASSERT(PageWriteback(page));</div><div class='del'>-		end_page_writeback(page);</div><div class='add'>+	spin_lock_irqsave(&amp;bfs-&gt;lock, flags);</div><div class='add'>+	bitmap_clear(bfs-&gt;bitmaps, start_bit, len &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+	if (subpage_test_bitmap_all_zero(fs_info, folio, writeback)) {</div><div class='add'>+		ASSERT(folio_test_writeback(folio));</div><div class='add'>+		folio_end_writeback(folio);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock_irqrestore(&amp;subpage-&gt;lock, flags);</div><div class='add'>+	spin_unlock_irqrestore(&amp;bfs-&gt;lock, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_subpage_set_ordered(const struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct page *page, u64 start, u32 len)</div><div class='add'>+			       struct folio *folio, u64 start, u32 len)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page-&gt;private;</div><div class='del'>-	unsigned int start_bit = subpage_calc_start_bit(fs_info, page,</div><div class='add'>+	struct btrfs_folio_state *bfs = folio_get_private(folio);</div><div class='add'>+	unsigned int start_bit = subpage_calc_start_bit(fs_info, folio,</div><div class='ctx'> 							ordered, start, len);</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> </div><div class='del'>-	spin_lock_irqsave(&amp;subpage-&gt;lock, flags);</div><div class='del'>-	bitmap_set(subpage-&gt;bitmaps, start_bit, len &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='del'>-	SetPageOrdered(page);</div><div class='del'>-	spin_unlock_irqrestore(&amp;subpage-&gt;lock, flags);</div><div class='add'>+	spin_lock_irqsave(&amp;bfs-&gt;lock, flags);</div><div class='add'>+	bitmap_set(bfs-&gt;bitmaps, start_bit, len &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+	folio_set_ordered(folio);</div><div class='add'>+	spin_unlock_irqrestore(&amp;bfs-&gt;lock, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_subpage_clear_ordered(const struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct page *page, u64 start, u32 len)</div><div class='add'>+				 struct folio *folio, u64 start, u32 len)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page-&gt;private;</div><div class='del'>-	unsigned int start_bit = subpage_calc_start_bit(fs_info, page,</div><div class='add'>+	struct btrfs_folio_state *bfs = folio_get_private(folio);</div><div class='add'>+	unsigned int start_bit = subpage_calc_start_bit(fs_info, folio,</div><div class='ctx'> 							ordered, start, len);</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> </div><div class='del'>-	spin_lock_irqsave(&amp;subpage-&gt;lock, flags);</div><div class='del'>-	bitmap_clear(subpage-&gt;bitmaps, start_bit, len &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='del'>-	if (subpage_test_bitmap_all_zero(fs_info, subpage, ordered))</div><div class='del'>-		ClearPageOrdered(page);</div><div class='del'>-	spin_unlock_irqrestore(&amp;subpage-&gt;lock, flags);</div><div class='add'>+	spin_lock_irqsave(&amp;bfs-&gt;lock, flags);</div><div class='add'>+	bitmap_clear(bfs-&gt;bitmaps, start_bit, len &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+	if (subpage_test_bitmap_all_zero(fs_info, folio, ordered))</div><div class='add'>+		folio_clear_ordered(folio);</div><div class='add'>+	spin_unlock_irqrestore(&amp;bfs-&gt;lock, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_subpage_set_checked(const struct btrfs_fs_info *fs_info,</div><div class='del'>-			       struct page *page, u64 start, u32 len)</div><div class='add'>+			       struct folio *folio, u64 start, u32 len)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page-&gt;private;</div><div class='del'>-	unsigned int start_bit = subpage_calc_start_bit(fs_info, page,</div><div class='add'>+	struct btrfs_folio_state *bfs = folio_get_private(folio);</div><div class='add'>+	unsigned int start_bit = subpage_calc_start_bit(fs_info, folio,</div><div class='ctx'> 							checked, start, len);</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> </div><div class='del'>-	spin_lock_irqsave(&amp;subpage-&gt;lock, flags);</div><div class='del'>-	bitmap_set(subpage-&gt;bitmaps, start_bit, len &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='del'>-	if (subpage_test_bitmap_all_set(fs_info, subpage, checked))</div><div class='del'>-		SetPageChecked(page);</div><div class='del'>-	spin_unlock_irqrestore(&amp;subpage-&gt;lock, flags);</div><div class='add'>+	spin_lock_irqsave(&amp;bfs-&gt;lock, flags);</div><div class='add'>+	bitmap_set(bfs-&gt;bitmaps, start_bit, len &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+	if (subpage_test_bitmap_all_set(fs_info, folio, checked))</div><div class='add'>+		folio_set_checked(folio);</div><div class='add'>+	spin_unlock_irqrestore(&amp;bfs-&gt;lock, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_subpage_clear_checked(const struct btrfs_fs_info *fs_info,</div><div class='del'>-				 struct page *page, u64 start, u32 len)</div><div class='add'>+				 struct folio *folio, u64 start, u32 len)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page-&gt;private;</div><div class='del'>-	unsigned int start_bit = subpage_calc_start_bit(fs_info, page,</div><div class='add'>+	struct btrfs_folio_state *bfs = folio_get_private(folio);</div><div class='add'>+	unsigned int start_bit = subpage_calc_start_bit(fs_info, folio,</div><div class='ctx'> 							checked, start, len);</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> </div><div class='del'>-	spin_lock_irqsave(&amp;subpage-&gt;lock, flags);</div><div class='del'>-	bitmap_clear(subpage-&gt;bitmaps, start_bit, len &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='del'>-	ClearPageChecked(page);</div><div class='del'>-	spin_unlock_irqrestore(&amp;subpage-&gt;lock, flags);</div><div class='add'>+	spin_lock_irqsave(&amp;bfs-&gt;lock, flags);</div><div class='add'>+	bitmap_clear(bfs-&gt;bitmaps, start_bit, len &gt;&gt; fs_info-&gt;sectorsize_bits);</div><div class='add'>+	folio_clear_checked(folio);</div><div class='add'>+	spin_unlock_irqrestore(&amp;bfs-&gt;lock, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -589,22 +543,21 @@ void btrfs_subpage_clear_checked(const struct btrfs_fs_info *fs_info,</div><div class='ctx'>  */</div><div class='ctx'> #define IMPLEMENT_BTRFS_SUBPAGE_TEST_OP(name)				\</div><div class='ctx'> bool btrfs_subpage_test_##name(const struct btrfs_fs_info *fs_info,	\</div><div class='del'>-		struct page *page, u64 start, u32 len)			\</div><div class='add'>+			       struct folio *folio, u64 start, u32 len)	\</div><div class='ctx'> {									\</div><div class='del'>-	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page-&gt;private; \</div><div class='del'>-	unsigned int start_bit = subpage_calc_start_bit(fs_info, page,	\</div><div class='add'>+	struct btrfs_folio_state *bfs = folio_get_private(folio);	\</div><div class='add'>+	unsigned int start_bit = subpage_calc_start_bit(fs_info, folio,	\</div><div class='ctx'> 						name, start, len);	\</div><div class='ctx'> 	unsigned long flags;						\</div><div class='ctx'> 	bool ret;							\</div><div class='ctx'> 									\</div><div class='del'>-	spin_lock_irqsave(&amp;subpage-&gt;lock, flags);			\</div><div class='del'>-	ret = bitmap_test_range_all_set(subpage-&gt;bitmaps, start_bit,	\</div><div class='add'>+	spin_lock_irqsave(&amp;bfs-&gt;lock, flags);			\</div><div class='add'>+	ret = bitmap_test_range_all_set(bfs-&gt;bitmaps, start_bit,	\</div><div class='ctx'> 				len &gt;&gt; fs_info-&gt;sectorsize_bits);	\</div><div class='del'>-	spin_unlock_irqrestore(&amp;subpage-&gt;lock, flags);			\</div><div class='add'>+	spin_unlock_irqrestore(&amp;bfs-&gt;lock, flags);			\</div><div class='ctx'> 	return ret;							\</div><div class='ctx'> }</div><div class='ctx'> IMPLEMENT_BTRFS_SUBPAGE_TEST_OP(uptodate);</div><div class='del'>-IMPLEMENT_BTRFS_SUBPAGE_TEST_OP(error);</div><div class='ctx'> IMPLEMENT_BTRFS_SUBPAGE_TEST_OP(dirty);</div><div class='ctx'> IMPLEMENT_BTRFS_SUBPAGE_TEST_OP(writeback);</div><div class='ctx'> IMPLEMENT_BTRFS_SUBPAGE_TEST_OP(ordered);</div><div class='hunk'>@@ -615,131 +568,261 @@ IMPLEMENT_BTRFS_SUBPAGE_TEST_OP(checked);</div><div class='ctx'>  * in.  We only test sectorsize == PAGE_SIZE cases so far, thus we can fall</div><div class='ctx'>  * back to regular sectorsize branch.</div><div class='ctx'>  */</div><div class='del'>-#define IMPLEMENT_BTRFS_PAGE_OPS(name, set_page_func, clear_page_func,	\</div><div class='del'>-			       test_page_func)				\</div><div class='del'>-void btrfs_page_set_##name(const struct btrfs_fs_info *fs_info,		\</div><div class='del'>-		struct page *page, u64 start, u32 len)			\</div><div class='add'>+#define IMPLEMENT_BTRFS_PAGE_OPS(name, folio_set_func,			\</div><div class='add'>+				 folio_clear_func, folio_test_func)	\</div><div class='add'>+void btrfs_folio_set_##name(const struct btrfs_fs_info *fs_info,	\</div><div class='add'>+			    struct folio *folio, u64 start, u32 len)	\</div><div class='ctx'> {									\</div><div class='del'>-	if (unlikely(!fs_info) || fs_info-&gt;sectorsize == PAGE_SIZE) {	\</div><div class='del'>-		set_page_func(page);					\</div><div class='add'>+	if (unlikely(!fs_info) ||					\</div><div class='add'>+	    !btrfs_is_subpage(fs_info, folio)) {			\</div><div class='add'>+		folio_set_func(folio);					\</div><div class='ctx'> 		return;							\</div><div class='ctx'> 	}								\</div><div class='del'>-	btrfs_subpage_set_##name(fs_info, page, start, len);		\</div><div class='add'>+	btrfs_subpage_set_##name(fs_info, folio, start, len);		\</div><div class='ctx'> }									\</div><div class='del'>-void btrfs_page_clear_##name(const struct btrfs_fs_info *fs_info,	\</div><div class='del'>-		struct page *page, u64 start, u32 len)			\</div><div class='add'>+void btrfs_folio_clear_##name(const struct btrfs_fs_info *fs_info,	\</div><div class='add'>+			      struct folio *folio, u64 start, u32 len)	\</div><div class='ctx'> {									\</div><div class='del'>-	if (unlikely(!fs_info) || fs_info-&gt;sectorsize == PAGE_SIZE) {	\</div><div class='del'>-		clear_page_func(page);					\</div><div class='add'>+	if (unlikely(!fs_info) ||					\</div><div class='add'>+	    !btrfs_is_subpage(fs_info, folio)) {			\</div><div class='add'>+		folio_clear_func(folio);				\</div><div class='ctx'> 		return;							\</div><div class='ctx'> 	}								\</div><div class='del'>-	btrfs_subpage_clear_##name(fs_info, page, start, len);		\</div><div class='add'>+	btrfs_subpage_clear_##name(fs_info, folio, start, len);		\</div><div class='ctx'> }									\</div><div class='del'>-bool btrfs_page_test_##name(const struct btrfs_fs_info *fs_info,	\</div><div class='del'>-		struct page *page, u64 start, u32 len)			\</div><div class='add'>+bool btrfs_folio_test_##name(const struct btrfs_fs_info *fs_info,	\</div><div class='add'>+			     struct folio *folio, u64 start, u32 len)	\</div><div class='ctx'> {									\</div><div class='del'>-	if (unlikely(!fs_info) || fs_info-&gt;sectorsize == PAGE_SIZE)	\</div><div class='del'>-		return test_page_func(page);				\</div><div class='del'>-	return btrfs_subpage_test_##name(fs_info, page, start, len);	\</div><div class='add'>+	if (unlikely(!fs_info) ||					\</div><div class='add'>+	    !btrfs_is_subpage(fs_info, folio))				\</div><div class='add'>+		return folio_test_func(folio);				\</div><div class='add'>+	return btrfs_subpage_test_##name(fs_info, folio, start, len);	\</div><div class='ctx'> }									\</div><div class='del'>-void btrfs_page_clamp_set_##name(const struct btrfs_fs_info *fs_info,	\</div><div class='del'>-		struct page *page, u64 start, u32 len)			\</div><div class='add'>+void btrfs_folio_clamp_set_##name(const struct btrfs_fs_info *fs_info,	\</div><div class='add'>+				  struct folio *folio, u64 start, u32 len) \</div><div class='ctx'> {									\</div><div class='del'>-	if (unlikely(!fs_info) || fs_info-&gt;sectorsize == PAGE_SIZE) {	\</div><div class='del'>-		set_page_func(page);					\</div><div class='add'>+	if (unlikely(!fs_info) ||					\</div><div class='add'>+	    !btrfs_is_subpage(fs_info, folio)) {			\</div><div class='add'>+		folio_set_func(folio);					\</div><div class='ctx'> 		return;							\</div><div class='ctx'> 	}								\</div><div class='del'>-	btrfs_subpage_clamp_range(page, &amp;start, &amp;len);			\</div><div class='del'>-	btrfs_subpage_set_##name(fs_info, page, start, len);		\</div><div class='add'>+	btrfs_subpage_clamp_range(folio, &amp;start, &amp;len);			\</div><div class='add'>+	btrfs_subpage_set_##name(fs_info, folio, start, len);		\</div><div class='ctx'> }									\</div><div class='del'>-void btrfs_page_clamp_clear_##name(const struct btrfs_fs_info *fs_info, \</div><div class='del'>-		struct page *page, u64 start, u32 len)			\</div><div class='add'>+void btrfs_folio_clamp_clear_##name(const struct btrfs_fs_info *fs_info, \</div><div class='add'>+				    struct folio *folio, u64 start, u32 len) \</div><div class='ctx'> {									\</div><div class='del'>-	if (unlikely(!fs_info) || fs_info-&gt;sectorsize == PAGE_SIZE) {	\</div><div class='del'>-		clear_page_func(page);					\</div><div class='add'>+	if (unlikely(!fs_info) ||					\</div><div class='add'>+	    !btrfs_is_subpage(fs_info, folio)) {			\</div><div class='add'>+		folio_clear_func(folio);				\</div><div class='ctx'> 		return;							\</div><div class='ctx'> 	}								\</div><div class='del'>-	btrfs_subpage_clamp_range(page, &amp;start, &amp;len);			\</div><div class='del'>-	btrfs_subpage_clear_##name(fs_info, page, start, len);		\</div><div class='add'>+	btrfs_subpage_clamp_range(folio, &amp;start, &amp;len);			\</div><div class='add'>+	btrfs_subpage_clear_##name(fs_info, folio, start, len);		\</div><div class='ctx'> }									\</div><div class='del'>-bool btrfs_page_clamp_test_##name(const struct btrfs_fs_info *fs_info,	\</div><div class='del'>-		struct page *page, u64 start, u32 len)			\</div><div class='add'>+bool btrfs_folio_clamp_test_##name(const struct btrfs_fs_info *fs_info,	\</div><div class='add'>+				   struct folio *folio, u64 start, u32 len) \</div><div class='add'>+{									\</div><div class='add'>+	if (unlikely(!fs_info) ||					\</div><div class='add'>+	    !btrfs_is_subpage(fs_info, folio))				\</div><div class='add'>+		return folio_test_func(folio);				\</div><div class='add'>+	btrfs_subpage_clamp_range(folio, &amp;start, &amp;len);			\</div><div class='add'>+	return btrfs_subpage_test_##name(fs_info, folio, start, len);	\</div><div class='add'>+}									\</div><div class='add'>+void btrfs_meta_folio_set_##name(struct folio *folio, const struct extent_buffer *eb) \</div><div class='add'>+{									\</div><div class='add'>+	if (!btrfs_meta_is_subpage(eb-&gt;fs_info)) {			\</div><div class='add'>+		folio_set_func(folio);					\</div><div class='add'>+		return;							\</div><div class='add'>+	}								\</div><div class='add'>+	btrfs_subpage_set_##name(eb-&gt;fs_info, folio, eb-&gt;start, eb-&gt;len); \</div><div class='add'>+}									\</div><div class='add'>+void btrfs_meta_folio_clear_##name(struct folio *folio, const struct extent_buffer *eb) \</div><div class='add'>+{									\</div><div class='add'>+	if (!btrfs_meta_is_subpage(eb-&gt;fs_info)) {			\</div><div class='add'>+		folio_clear_func(folio);				\</div><div class='add'>+		return;							\</div><div class='add'>+	}								\</div><div class='add'>+	btrfs_subpage_clear_##name(eb-&gt;fs_info, folio, eb-&gt;start, eb-&gt;len); \</div><div class='add'>+}									\</div><div class='add'>+bool btrfs_meta_folio_test_##name(struct folio *folio, const struct extent_buffer *eb) \</div><div class='add'>+{									\</div><div class='add'>+	if (!btrfs_meta_is_subpage(eb-&gt;fs_info))			\</div><div class='add'>+		return folio_test_func(folio);				\</div><div class='add'>+	return btrfs_subpage_test_##name(eb-&gt;fs_info, folio, eb-&gt;start, eb-&gt;len); \</div><div class='add'>+}</div><div class='add'>+IMPLEMENT_BTRFS_PAGE_OPS(uptodate, folio_mark_uptodate, folio_clear_uptodate,</div><div class='add'>+			 folio_test_uptodate);</div><div class='add'>+IMPLEMENT_BTRFS_PAGE_OPS(dirty, folio_mark_dirty, folio_clear_dirty_for_io,</div><div class='add'>+			 folio_test_dirty);</div><div class='add'>+IMPLEMENT_BTRFS_PAGE_OPS(writeback, folio_start_writeback, folio_end_writeback,</div><div class='add'>+			 folio_test_writeback);</div><div class='add'>+IMPLEMENT_BTRFS_PAGE_OPS(ordered, folio_set_ordered, folio_clear_ordered,</div><div class='add'>+			 folio_test_ordered);</div><div class='add'>+IMPLEMENT_BTRFS_PAGE_OPS(checked, folio_set_checked, folio_clear_checked,</div><div class='add'>+			 folio_test_checked);</div><div class='add'>+</div><div class='add'>+#define GET_SUBPAGE_BITMAP(fs_info, folio, name, dst)			\</div><div class='add'>+{									\</div><div class='add'>+	const unsigned int __bpf = btrfs_blocks_per_folio(fs_info, folio); \</div><div class='add'>+	const struct btrfs_folio_state *__bfs = folio_get_private(folio); \</div><div class='add'>+									\</div><div class='add'>+	ASSERT(__bpf &lt;= BITS_PER_LONG);					\</div><div class='add'>+	*dst = bitmap_read(__bfs-&gt;bitmaps,				\</div><div class='add'>+			   __bpf * btrfs_bitmap_nr_##name, __bpf);	\</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define SUBPAGE_DUMP_BITMAP(fs_info, folio, name, start, len)		\</div><div class='ctx'> {									\</div><div class='del'>-	if (unlikely(!fs_info) || fs_info-&gt;sectorsize == PAGE_SIZE)	\</div><div class='del'>-		return test_page_func(page);				\</div><div class='del'>-	btrfs_subpage_clamp_range(page, &amp;start, &amp;len);			\</div><div class='del'>-	return btrfs_subpage_test_##name(fs_info, page, start, len);	\</div><div class='add'>+	unsigned long bitmap;						\</div><div class='add'>+	const unsigned int __bpf = btrfs_blocks_per_folio(fs_info, folio); \</div><div class='add'>+									\</div><div class='add'>+	GET_SUBPAGE_BITMAP(fs_info, folio, name, &amp;bitmap);		\</div><div class='add'>+	btrfs_warn(fs_info,						\</div><div class='add'>+	"dumping bitmap start=%llu len=%u folio=%llu " #name "_bitmap=%*pbl", \</div><div class='add'>+		   start, len, folio_pos(folio), __bpf, &amp;bitmap);	\</div><div class='ctx'> }</div><div class='del'>-IMPLEMENT_BTRFS_PAGE_OPS(uptodate, SetPageUptodate, ClearPageUptodate,</div><div class='del'>-			 PageUptodate);</div><div class='del'>-IMPLEMENT_BTRFS_PAGE_OPS(error, SetPageError, ClearPageError, PageError);</div><div class='del'>-IMPLEMENT_BTRFS_PAGE_OPS(dirty, set_page_dirty, clear_page_dirty_for_io,</div><div class='del'>-			 PageDirty);</div><div class='del'>-IMPLEMENT_BTRFS_PAGE_OPS(writeback, set_page_writeback, end_page_writeback,</div><div class='del'>-			 PageWriteback);</div><div class='del'>-IMPLEMENT_BTRFS_PAGE_OPS(ordered, SetPageOrdered, ClearPageOrdered,</div><div class='del'>-			 PageOrdered);</div><div class='del'>-IMPLEMENT_BTRFS_PAGE_OPS(checked, SetPageChecked, ClearPageChecked, PageChecked);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Make sure not only the page dirty bit is cleared, but also subpage dirty bit</div><div class='ctx'>  * is cleared.</div><div class='ctx'>  */</div><div class='del'>-void btrfs_page_assert_not_dirty(const struct btrfs_fs_info *fs_info,</div><div class='del'>-				 struct page *page)</div><div class='add'>+void btrfs_folio_assert_not_dirty(const struct btrfs_fs_info *fs_info,</div><div class='add'>+				  struct folio *folio, u64 start, u32 len)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page-&gt;private;</div><div class='add'>+	struct btrfs_folio_state *bfs;</div><div class='add'>+	unsigned int start_bit;</div><div class='add'>+	unsigned int nbits;</div><div class='add'>+	unsigned long flags;</div><div class='ctx'> </div><div class='ctx'> 	if (!IS_ENABLED(CONFIG_BTRFS_ASSERT))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	ASSERT(!PageDirty(page));</div><div class='del'>-	if (fs_info-&gt;sectorsize == PAGE_SIZE)</div><div class='add'>+	if (!btrfs_is_subpage(fs_info, folio)) {</div><div class='add'>+		ASSERT(!folio_test_dirty(folio));</div><div class='ctx'> 		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	ASSERT(PagePrivate(page) &amp;&amp; page-&gt;private);</div><div class='del'>-	ASSERT(subpage_test_bitmap_all_zero(fs_info, subpage, dirty));</div><div class='add'>+	start_bit = subpage_calc_start_bit(fs_info, folio, dirty, start, len);</div><div class='add'>+	nbits = len &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='add'>+	bfs = folio_get_private(folio);</div><div class='add'>+	ASSERT(bfs);</div><div class='add'>+	spin_lock_irqsave(&amp;bfs-&gt;lock, flags);</div><div class='add'>+	if (unlikely(!bitmap_test_range_all_zero(bfs-&gt;bitmaps, start_bit, nbits))) {</div><div class='add'>+		SUBPAGE_DUMP_BITMAP(fs_info, folio, dirty, start, len);</div><div class='add'>+		ASSERT(bitmap_test_range_all_zero(bfs-&gt;bitmaps, start_bit, nbits));</div><div class='add'>+	}</div><div class='add'>+	ASSERT(bitmap_test_range_all_zero(bfs-&gt;bitmaps, start_bit, nbits));</div><div class='add'>+	spin_unlock_irqrestore(&amp;bfs-&gt;lock, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Handle different locked pages with different page sizes:</div><div class='add'>+ * This is for folio already locked by plain lock_page()/folio_lock(), which</div><div class='add'>+ * doesn't have any subpage awareness.</div><div class='ctx'>  *</div><div class='del'>- * - Page locked by plain lock_page()</div><div class='del'>- *   It should not have any subpage::writers count.</div><div class='del'>- *   Can be unlocked by unlock_page().</div><div class='del'>- *   This is the most common locked page for __extent_writepage() called</div><div class='del'>- *   inside extent_write_cache_pages() or extent_write_full_page().</div><div class='del'>- *   Rarer cases include the @locked_page from extent_write_locked_range().</div><div class='add'>+ * This populates the involved subpage ranges so that subpage helpers can</div><div class='add'>+ * properly unlock them.</div><div class='add'>+ */</div><div class='add'>+void btrfs_folio_set_lock(const struct btrfs_fs_info *fs_info,</div><div class='add'>+			  struct folio *folio, u64 start, u32 len)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_folio_state *bfs;</div><div class='add'>+	unsigned long flags;</div><div class='add'>+	unsigned int start_bit;</div><div class='add'>+	unsigned int nbits;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ASSERT(folio_test_locked(folio));</div><div class='add'>+	if (unlikely(!fs_info) || !btrfs_is_subpage(fs_info, folio))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	bfs = folio_get_private(folio);</div><div class='add'>+	start_bit = subpage_calc_start_bit(fs_info, folio, locked, start, len);</div><div class='add'>+	nbits = len &gt;&gt; fs_info-&gt;sectorsize_bits;</div><div class='add'>+	spin_lock_irqsave(&amp;bfs-&gt;lock, flags);</div><div class='add'>+	/* Target range should not yet be locked. */</div><div class='add'>+	if (unlikely(!bitmap_test_range_all_zero(bfs-&gt;bitmaps, start_bit, nbits))) {</div><div class='add'>+		SUBPAGE_DUMP_BITMAP(fs_info, folio, locked, start, len);</div><div class='add'>+		ASSERT(bitmap_test_range_all_zero(bfs-&gt;bitmaps, start_bit, nbits));</div><div class='add'>+	}</div><div class='add'>+	bitmap_set(bfs-&gt;bitmaps, start_bit, nbits);</div><div class='add'>+	ret = atomic_add_return(nbits, &amp;bfs-&gt;nr_locked);</div><div class='add'>+	ASSERT(ret &lt;= btrfs_blocks_per_folio(fs_info, folio));</div><div class='add'>+	spin_unlock_irqrestore(&amp;bfs-&gt;lock, flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Clear the dirty flag for the folio.</div><div class='ctx'>  *</div><div class='del'>- * - Page locked by lock_delalloc_pages()</div><div class='del'>- *   There is only one caller, all pages except @locked_page for</div><div class='del'>- *   extent_write_locked_range().</div><div class='del'>- *   In this case, we have to call subpage helper to handle the case.</div><div class='add'>+ * If the affected folio is no longer dirty, return true. Otherwise return false.</div><div class='ctx'>  */</div><div class='del'>-void btrfs_page_unlock_writer(struct btrfs_fs_info *fs_info, struct page *page,</div><div class='del'>-			      u64 start, u32 len)</div><div class='add'>+bool btrfs_meta_folio_clear_and_test_dirty(struct folio *folio, const struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_subpage *subpage;</div><div class='add'>+	bool last;</div><div class='ctx'> </div><div class='del'>-	ASSERT(PageLocked(page));</div><div class='del'>-	/* For regular page size case, we just unlock the page */</div><div class='del'>-	if (fs_info-&gt;sectorsize == PAGE_SIZE)</div><div class='del'>-		return unlock_page(page);</div><div class='add'>+	if (!btrfs_meta_is_subpage(eb-&gt;fs_info)) {</div><div class='add'>+		folio_clear_dirty_for_io(folio);</div><div class='add'>+		return true;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	ASSERT(PagePrivate(page) &amp;&amp; page-&gt;private);</div><div class='del'>-	subpage = (struct btrfs_subpage *)page-&gt;private;</div><div class='add'>+	last = btrfs_subpage_clear_and_test_dirty(eb-&gt;fs_info, folio, eb-&gt;start, eb-&gt;len);</div><div class='add'>+	if (last) {</div><div class='add'>+		folio_clear_dirty_for_io(folio);</div><div class='add'>+		return true;</div><div class='add'>+	}</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * For subpage case, there are two types of locked page.  With or</div><div class='del'>-	 * without writers number.</div><div class='del'>-	 *</div><div class='del'>-	 * Since we own the page lock, no one else could touch subpage::writers</div><div class='del'>-	 * and we are safe to do several atomic operations without spinlock.</div><div class='del'>-	 */</div><div class='del'>-	if (atomic_read(&amp;subpage-&gt;writers))</div><div class='del'>-		/* No writers, locked by plain lock_page() */</div><div class='del'>-		return unlock_page(page);</div><div class='add'>+void __cold btrfs_subpage_dump_bitmap(const struct btrfs_fs_info *fs_info,</div><div class='add'>+				      struct folio *folio, u64 start, u32 len)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_folio_state *bfs;</div><div class='add'>+	const unsigned int blocks_per_folio = btrfs_blocks_per_folio(fs_info, folio);</div><div class='add'>+	unsigned long uptodate_bitmap;</div><div class='add'>+	unsigned long dirty_bitmap;</div><div class='add'>+	unsigned long writeback_bitmap;</div><div class='add'>+	unsigned long ordered_bitmap;</div><div class='add'>+	unsigned long checked_bitmap;</div><div class='add'>+	unsigned long locked_bitmap;</div><div class='add'>+	unsigned long flags;</div><div class='add'>+</div><div class='add'>+	ASSERT(folio_test_private(folio) &amp;&amp; folio_get_private(folio));</div><div class='add'>+	ASSERT(blocks_per_folio &gt; 1);</div><div class='add'>+	bfs = folio_get_private(folio);</div><div class='add'>+</div><div class='add'>+	spin_lock_irqsave(&amp;bfs-&gt;lock, flags);</div><div class='add'>+	GET_SUBPAGE_BITMAP(fs_info, folio, uptodate, &amp;uptodate_bitmap);</div><div class='add'>+	GET_SUBPAGE_BITMAP(fs_info, folio, dirty, &amp;dirty_bitmap);</div><div class='add'>+	GET_SUBPAGE_BITMAP(fs_info, folio, writeback, &amp;writeback_bitmap);</div><div class='add'>+	GET_SUBPAGE_BITMAP(fs_info, folio, ordered, &amp;ordered_bitmap);</div><div class='add'>+	GET_SUBPAGE_BITMAP(fs_info, folio, checked, &amp;checked_bitmap);</div><div class='add'>+	GET_SUBPAGE_BITMAP(fs_info, folio, locked, &amp;locked_bitmap);</div><div class='add'>+	spin_unlock_irqrestore(&amp;bfs-&gt;lock, flags);</div><div class='add'>+</div><div class='add'>+	dump_page(folio_page(folio, 0), "btrfs folio state dump");</div><div class='add'>+	btrfs_warn(fs_info,</div><div class='add'>+"start=%llu len=%u page=%llu, bitmaps uptodate=%*pbl dirty=%*pbl locked=%*pbl writeback=%*pbl ordered=%*pbl checked=%*pbl",</div><div class='add'>+		    start, len, folio_pos(folio),</div><div class='add'>+		    blocks_per_folio, &amp;uptodate_bitmap,</div><div class='add'>+		    blocks_per_folio, &amp;dirty_bitmap,</div><div class='add'>+		    blocks_per_folio, &amp;locked_bitmap,</div><div class='add'>+		    blocks_per_folio, &amp;writeback_bitmap,</div><div class='add'>+		    blocks_per_folio, &amp;ordered_bitmap,</div><div class='add'>+		    blocks_per_folio, &amp;checked_bitmap);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_get_subpage_dirty_bitmap(struct btrfs_fs_info *fs_info,</div><div class='add'>+				    struct folio *folio,</div><div class='add'>+				    unsigned long *ret_bitmap)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_folio_state *bfs;</div><div class='add'>+	unsigned long flags;</div><div class='add'>+</div><div class='add'>+	ASSERT(folio_test_private(folio) &amp;&amp; folio_get_private(folio));</div><div class='add'>+	ASSERT(btrfs_blocks_per_folio(fs_info, folio) &gt; 1);</div><div class='add'>+	bfs = folio_get_private(folio);</div><div class='ctx'> </div><div class='del'>-	/* Have writers, use proper subpage helper to end it */</div><div class='del'>-	btrfs_page_end_writer_lock(fs_info, page, start, len);</div><div class='add'>+	spin_lock_irqsave(&amp;bfs-&gt;lock, flags);</div><div class='add'>+	GET_SUBPAGE_BITMAP(fs_info, folio, dirty, ret_bitmap);</div><div class='add'>+	spin_unlock_irqrestore(&amp;bfs-&gt;lock, flags);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/btrfs/subpage.h b/fs/btrfs/subpage.h<br/>index 7accb5c40d33..d81a0ade559f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/subpage.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/subpage.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/subpage.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/subpage.h</a></div><div class='hunk'>@@ -4,153 +4,209 @@</div><div class='ctx'> #define BTRFS_SUBPAGE_H</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/spinlock.h&gt;</div><div class='add'>+#include &lt;linux/atomic.h&gt;</div><div class='add'>+#include &lt;linux/sizes.h&gt;</div><div class='add'>+#include "btrfs_inode.h"</div><div class='add'>+</div><div class='add'>+struct address_space;</div><div class='add'>+struct folio;</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Extra info for subpapge bitmap.</div><div class='add'>+ * Extra info for subpage bitmap.</div><div class='ctx'>  *</div><div class='del'>- * For subpage we pack all uptodate/error/dirty/writeback/ordered bitmaps into</div><div class='add'>+ * For subpage we pack all uptodate/dirty/writeback/ordered bitmaps into</div><div class='ctx'>  * one larger bitmap.</div><div class='ctx'>  *</div><div class='ctx'>  * This structure records how they are organized in the bitmap:</div><div class='ctx'>  *</div><div class='del'>- * /- uptodate_offset	/- error_offset	/- dirty_offset</div><div class='add'>+ * /- uptodate          /- dirty        /- ordered</div><div class='ctx'>  * |			|		|</div><div class='ctx'>  * v			v		v</div><div class='del'>- * |u|u|u|u|........|u|u|e|e|.......|e|e| ...	|o|o|</div><div class='del'>- * |&lt;- bitmap_nr_bits -&gt;|</div><div class='del'>- * |&lt;--------------- total_nr_bits ----------------&gt;|</div><div class='add'>+ * |u|u|u|u|........|u|u|d|d|.......|d|d|o|o|.......|o|o|</div><div class='add'>+ * |&lt; sectors_per_page &gt;|</div><div class='add'>+ *</div><div class='add'>+ * Unlike regular macro-like enums, here we do not go upper-case names, as</div><div class='add'>+ * these names will be utilized in various macros to define function names.</div><div class='ctx'>  */</div><div class='del'>-struct btrfs_subpage_info {</div><div class='del'>-	/* Number of bits for each bitmap */</div><div class='del'>-	unsigned int bitmap_nr_bits;</div><div class='add'>+enum {</div><div class='add'>+	btrfs_bitmap_nr_uptodate = 0,</div><div class='add'>+	btrfs_bitmap_nr_dirty,</div><div class='ctx'> </div><div class='del'>-	/* Total number of bits for the whole bitmap */</div><div class='del'>-	unsigned int total_nr_bits;</div><div class='add'>+	/*</div><div class='add'>+	 * This can be changed to atomic eventually.  But this change will rely</div><div class='add'>+	 * on the async delalloc range rework for locked bitmap.  As async</div><div class='add'>+	 * delalloc can unlock its range and mark blocks writeback at random</div><div class='add'>+	 * timing.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_bitmap_nr_writeback,</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * *_start indicates where the bitmap starts, the length is always</div><div class='del'>-	 * @bitmap_size, which is calculated from PAGE_SIZE / sectorsize.</div><div class='add'>+	 * The ordered and checked flags are for COW fixup, already marked</div><div class='add'>+	 * deprecated, and will be removed eventually.</div><div class='ctx'> 	 */</div><div class='del'>-	unsigned int uptodate_offset;</div><div class='del'>-	unsigned int error_offset;</div><div class='del'>-	unsigned int dirty_offset;</div><div class='del'>-	unsigned int writeback_offset;</div><div class='del'>-	unsigned int ordered_offset;</div><div class='del'>-	unsigned int checked_offset;</div><div class='add'>+	btrfs_bitmap_nr_ordered,</div><div class='add'>+	btrfs_bitmap_nr_checked,</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The locked bit is for async delalloc range (compression), currently</div><div class='add'>+	 * async extent is queued with the range locked, until the compression</div><div class='add'>+	 * is done.</div><div class='add'>+	 * So an async extent can unlock the range at any random timing.</div><div class='add'>+	 *</div><div class='add'>+	 * This will need a rework on the async extent lifespan (mark writeback</div><div class='add'>+	 * and do compression) before deprecating this flag.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_bitmap_nr_locked,</div><div class='add'>+	btrfs_bitmap_nr_max</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Structure to trace status of each sector inside a page, attached to</div><div class='ctx'>  * page::private for both data and metadata inodes.</div><div class='ctx'>  */</div><div class='del'>-struct btrfs_subpage {</div><div class='add'>+struct btrfs_folio_state {</div><div class='ctx'> 	/* Common members for both data and metadata pages */</div><div class='ctx'> 	spinlock_t lock;</div><div class='del'>-	/*</div><div class='del'>-	 * Both data and metadata needs to track how many readers are for the</div><div class='del'>-	 * page.</div><div class='del'>-	 * Data relies on @readers to unlock the page when last reader finished.</div><div class='del'>-	 * While metadata doesn't need page unlock, it needs to prevent</div><div class='del'>-	 * page::private get cleared before the last end_page_read().</div><div class='del'>-	 */</div><div class='del'>-	atomic_t readers;</div><div class='ctx'> 	union {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Structures only used by metadata</div><div class='ctx'> 		 *</div><div class='ctx'> 		 * @eb_refs should only be operated under private_lock, as it</div><div class='del'>-		 * manages whether the subpage can be detached.</div><div class='add'>+		 * manages whether the btrfs_folio_state can be detached.</div><div class='ctx'> 		 */</div><div class='ctx'> 		atomic_t eb_refs;</div><div class='ctx'> </div><div class='del'>-		/* Structures only used by data */</div><div class='del'>-		atomic_t writers;</div><div class='add'>+		/*</div><div class='add'>+		 * Structures only used by data,</div><div class='add'>+		 *</div><div class='add'>+		 * How many sectors inside the page is locked.</div><div class='add'>+		 */</div><div class='add'>+		atomic_t nr_locked;</div><div class='ctx'> 	};</div><div class='ctx'> 	unsigned long bitmaps[];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-enum btrfs_subpage_type {</div><div class='add'>+enum btrfs_folio_type {</div><div class='ctx'> 	BTRFS_SUBPAGE_METADATA,</div><div class='ctx'> 	BTRFS_SUBPAGE_DATA,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-void btrfs_init_subpage_info(struct btrfs_subpage_info *subpage_info, u32 sectorsize);</div><div class='del'>-int btrfs_attach_subpage(const struct btrfs_fs_info *fs_info,</div><div class='del'>-			 struct page *page, enum btrfs_subpage_type type);</div><div class='del'>-void btrfs_detach_subpage(const struct btrfs_fs_info *fs_info,</div><div class='del'>-			  struct page *page);</div><div class='add'>+/*</div><div class='add'>+ * Subpage support for metadata is more complex, as we can have dummy extent</div><div class='add'>+ * buffers, where folios have no mapping to determine the owning inode.</div><div class='add'>+ *</div><div class='add'>+ * Thankfully we only need to check if node size is smaller than page size.</div><div class='add'>+ * Even with larger folio support, we will only allocate a folio as large as</div><div class='add'>+ * node size.</div><div class='add'>+ * Thus if nodesize &lt; PAGE_SIZE, we know metadata needs need to subpage routine.</div><div class='add'>+ */</div><div class='add'>+static inline bool btrfs_meta_is_subpage(const struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	return fs_info-&gt;nodesize &lt; PAGE_SIZE;</div><div class='add'>+}</div><div class='add'>+static inline bool btrfs_is_subpage(const struct btrfs_fs_info *fs_info,</div><div class='add'>+				    struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	if (folio-&gt;mapping &amp;&amp; folio-&gt;mapping-&gt;host)</div><div class='add'>+		ASSERT(is_data_inode(BTRFS_I(folio-&gt;mapping-&gt;host)));</div><div class='add'>+	return fs_info-&gt;sectorsize &lt; folio_size(folio);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_attach_folio_state(const struct btrfs_fs_info *fs_info,</div><div class='add'>+			     struct folio *folio, enum btrfs_folio_type type);</div><div class='add'>+void btrfs_detach_folio_state(const struct btrfs_fs_info *fs_info, struct folio *folio,</div><div class='add'>+			      enum btrfs_folio_type type);</div><div class='ctx'> </div><div class='ctx'> /* Allocate additional data where page represents more than one sector */</div><div class='del'>-struct btrfs_subpage *btrfs_alloc_subpage(const struct btrfs_fs_info *fs_info,</div><div class='del'>-					  enum btrfs_subpage_type type);</div><div class='del'>-void btrfs_free_subpage(struct btrfs_subpage *subpage);</div><div class='del'>-</div><div class='del'>-void btrfs_page_inc_eb_refs(const struct btrfs_fs_info *fs_info,</div><div class='del'>-			    struct page *page);</div><div class='del'>-void btrfs_page_dec_eb_refs(const struct btrfs_fs_info *fs_info,</div><div class='del'>-			    struct page *page);</div><div class='del'>-</div><div class='del'>-void btrfs_subpage_start_reader(const struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct page *page, u64 start, u32 len);</div><div class='del'>-void btrfs_subpage_end_reader(const struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct page *page, u64 start, u32 len);</div><div class='del'>-</div><div class='del'>-void btrfs_subpage_start_writer(const struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct page *page, u64 start, u32 len);</div><div class='del'>-bool btrfs_subpage_end_and_test_writer(const struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct page *page, u64 start, u32 len);</div><div class='del'>-int btrfs_page_start_writer_lock(const struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct page *page, u64 start, u32 len);</div><div class='del'>-void btrfs_page_end_writer_lock(const struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct page *page, u64 start, u32 len);</div><div class='del'>-</div><div class='add'>+struct btrfs_folio_state *btrfs_alloc_folio_state(const struct btrfs_fs_info *fs_info,</div><div class='add'>+						  size_t fsize, enum btrfs_folio_type type);</div><div class='add'>+static inline void btrfs_free_folio_state(struct btrfs_folio_state *bfs)</div><div class='add'>+{</div><div class='add'>+	kfree(bfs);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_folio_inc_eb_refs(const struct btrfs_fs_info *fs_info, struct folio *folio);</div><div class='add'>+void btrfs_folio_dec_eb_refs(const struct btrfs_fs_info *fs_info, struct folio *folio);</div><div class='add'>+</div><div class='add'>+void btrfs_folio_end_lock(const struct btrfs_fs_info *fs_info,</div><div class='add'>+			  struct folio *folio, u64 start, u32 len);</div><div class='add'>+void btrfs_folio_set_lock(const struct btrfs_fs_info *fs_info,</div><div class='add'>+			  struct folio *folio, u64 start, u32 len);</div><div class='add'>+void btrfs_folio_end_lock_bitmap(const struct btrfs_fs_info *fs_info,</div><div class='add'>+				 struct folio *folio, unsigned long bitmap);</div><div class='ctx'> /*</div><div class='ctx'>  * Template for subpage related operations.</div><div class='ctx'>  *</div><div class='del'>- * btrfs_subpage_*() are for call sites where the page has subpage attached and</div><div class='del'>- * the range is ensured to be inside the page.</div><div class='add'>+ * btrfs_subpage_*() are for call sites where the folio has subpage attached and</div><div class='add'>+ * the range is ensured to be inside the folio's single page.</div><div class='ctx'>  *</div><div class='del'>- * btrfs_page_*() are for call sites where the page can either be subpage</div><div class='del'>- * specific or regular page. The function will handle both cases.</div><div class='del'>- * But the range still needs to be inside the page.</div><div class='add'>+ * btrfs_folio_*() are for call sites where the page can either be subpage</div><div class='add'>+ * specific or regular folios. The function will handle both cases.</div><div class='add'>+ * But the range still needs to be inside one single page.</div><div class='ctx'>  *</div><div class='del'>- * btrfs_page_clamp_*() are similar to btrfs_page_*(), except the range doesn't</div><div class='add'>+ * btrfs_folio_clamp_*() are similar to btrfs_folio_*(), except the range doesn't</div><div class='ctx'>  * need to be inside the page. Those functions will truncate the range</div><div class='ctx'>  * automatically.</div><div class='add'>+ *</div><div class='add'>+ * Both btrfs_folio_*() and btrfs_folio_clamp_*() are for data folios.</div><div class='add'>+ *</div><div class='add'>+ * For metadata, one should use btrfs_meta_folio_*() helpers instead, and there</div><div class='add'>+ * is no clamp version for metadata helpers, as we either go subpage</div><div class='add'>+ * (nodesize &lt; PAGE_SIZE) or go regular folio helpers (nodesize &gt;= PAGE_SIZE,</div><div class='add'>+ * and our folio is never larger than nodesize).</div><div class='ctx'>  */</div><div class='ctx'> #define DECLARE_BTRFS_SUBPAGE_OPS(name)					\</div><div class='ctx'> void btrfs_subpage_set_##name(const struct btrfs_fs_info *fs_info,	\</div><div class='del'>-		struct page *page, u64 start, u32 len);			\</div><div class='add'>+		struct folio *folio, u64 start, u32 len);			\</div><div class='ctx'> void btrfs_subpage_clear_##name(const struct btrfs_fs_info *fs_info,	\</div><div class='del'>-		struct page *page, u64 start, u32 len);			\</div><div class='add'>+		struct folio *folio, u64 start, u32 len);			\</div><div class='ctx'> bool btrfs_subpage_test_##name(const struct btrfs_fs_info *fs_info,	\</div><div class='del'>-		struct page *page, u64 start, u32 len);			\</div><div class='del'>-void btrfs_page_set_##name(const struct btrfs_fs_info *fs_info,		\</div><div class='del'>-		struct page *page, u64 start, u32 len);			\</div><div class='del'>-void btrfs_page_clear_##name(const struct btrfs_fs_info *fs_info,	\</div><div class='del'>-		struct page *page, u64 start, u32 len);			\</div><div class='del'>-bool btrfs_page_test_##name(const struct btrfs_fs_info *fs_info,	\</div><div class='del'>-		struct page *page, u64 start, u32 len);			\</div><div class='del'>-void btrfs_page_clamp_set_##name(const struct btrfs_fs_info *fs_info,	\</div><div class='del'>-		struct page *page, u64 start, u32 len);			\</div><div class='del'>-void btrfs_page_clamp_clear_##name(const struct btrfs_fs_info *fs_info,	\</div><div class='del'>-		struct page *page, u64 start, u32 len);			\</div><div class='del'>-bool btrfs_page_clamp_test_##name(const struct btrfs_fs_info *fs_info,	\</div><div class='del'>-		struct page *page, u64 start, u32 len);</div><div class='add'>+		struct folio *folio, u64 start, u32 len);			\</div><div class='add'>+void btrfs_folio_set_##name(const struct btrfs_fs_info *fs_info,	\</div><div class='add'>+		struct folio *folio, u64 start, u32 len);			\</div><div class='add'>+void btrfs_folio_clear_##name(const struct btrfs_fs_info *fs_info,	\</div><div class='add'>+		struct folio *folio, u64 start, u32 len);			\</div><div class='add'>+bool btrfs_folio_test_##name(const struct btrfs_fs_info *fs_info,	\</div><div class='add'>+		struct folio *folio, u64 start, u32 len);			\</div><div class='add'>+void btrfs_folio_clamp_set_##name(const struct btrfs_fs_info *fs_info,	\</div><div class='add'>+		struct folio *folio, u64 start, u32 len);			\</div><div class='add'>+void btrfs_folio_clamp_clear_##name(const struct btrfs_fs_info *fs_info,	\</div><div class='add'>+		struct folio *folio, u64 start, u32 len);			\</div><div class='add'>+bool btrfs_folio_clamp_test_##name(const struct btrfs_fs_info *fs_info,	\</div><div class='add'>+		struct folio *folio, u64 start, u32 len);		\</div><div class='add'>+void btrfs_meta_folio_set_##name(struct folio *folio, const struct extent_buffer *eb); \</div><div class='add'>+void btrfs_meta_folio_clear_##name(struct folio *folio, const struct extent_buffer *eb); \</div><div class='add'>+bool btrfs_meta_folio_test_##name(struct folio *folio, const struct extent_buffer *eb);</div><div class='ctx'> </div><div class='ctx'> DECLARE_BTRFS_SUBPAGE_OPS(uptodate);</div><div class='del'>-DECLARE_BTRFS_SUBPAGE_OPS(error);</div><div class='ctx'> DECLARE_BTRFS_SUBPAGE_OPS(dirty);</div><div class='ctx'> DECLARE_BTRFS_SUBPAGE_OPS(writeback);</div><div class='ctx'> DECLARE_BTRFS_SUBPAGE_OPS(ordered);</div><div class='ctx'> DECLARE_BTRFS_SUBPAGE_OPS(checked);</div><div class='ctx'> </div><div class='del'>-bool btrfs_subpage_clear_and_test_dirty(const struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct page *page, u64 start, u32 len);</div><div class='add'>+/*</div><div class='add'>+ * Helper for error cleanup, where a folio will have its dirty flag cleared,</div><div class='add'>+ * with writeback started and finished.</div><div class='add'>+ */</div><div class='add'>+static inline void btrfs_folio_clamp_finish_io(struct btrfs_fs_info *fs_info,</div><div class='add'>+					       struct folio *locked_folio,</div><div class='add'>+					       u64 start, u32 len)</div><div class='add'>+{</div><div class='add'>+	btrfs_folio_clamp_clear_dirty(fs_info, locked_folio, start, len);</div><div class='add'>+	btrfs_folio_clamp_set_writeback(fs_info, locked_folio, start, len);</div><div class='add'>+	btrfs_folio_clamp_clear_writeback(fs_info, locked_folio, start, len);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-void btrfs_page_assert_not_dirty(const struct btrfs_fs_info *fs_info,</div><div class='del'>-				 struct page *page);</div><div class='del'>-void btrfs_page_unlock_writer(struct btrfs_fs_info *fs_info, struct page *page,</div><div class='del'>-			      u64 start, u32 len);</div><div class='add'>+bool btrfs_subpage_clear_and_test_dirty(const struct btrfs_fs_info *fs_info,</div><div class='add'>+					struct folio *folio, u64 start, u32 len);</div><div class='add'>+</div><div class='add'>+void btrfs_folio_assert_not_dirty(const struct btrfs_fs_info *fs_info,</div><div class='add'>+				  struct folio *folio, u64 start, u32 len);</div><div class='add'>+bool btrfs_meta_folio_clear_and_test_dirty(struct folio *folio, const struct extent_buffer *eb);</div><div class='add'>+void btrfs_get_subpage_dirty_bitmap(struct btrfs_fs_info *fs_info,</div><div class='add'>+				    struct folio *folio,</div><div class='add'>+				    unsigned long *ret_bitmap);</div><div class='add'>+void __cold btrfs_subpage_dump_bitmap(const struct btrfs_fs_info *fs_info,</div><div class='add'>+				      struct folio *folio, u64 start, u32 len);</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/btrfs/super.c b/fs/btrfs/super.c<br/>index a1c54a2c787c..1999533b52be 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/super.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/super.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/super.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/super.c</a></div><div class='hunk'>@@ -23,22 +23,23 @@</div><div class='ctx'> #include &lt;linux/miscdevice.h&gt;</div><div class='ctx'> #include &lt;linux/magic.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='del'>-#include &lt;linux/cleancache.h&gt;</div><div class='ctx'> #include &lt;linux/ratelimit.h&gt;</div><div class='ctx'> #include &lt;linux/crc32c.h&gt;</div><div class='ctx'> #include &lt;linux/btrfs.h&gt;</div><div class='add'>+#include &lt;linux/security.h&gt;</div><div class='add'>+#include &lt;linux/fs_parser.h&gt;</div><div class='add'>+#include "messages.h"</div><div class='ctx'> #include "delayed-inode.h"</div><div class='ctx'> #include "ctree.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='ctx'> #include "transaction.h"</div><div class='ctx'> #include "btrfs_inode.h"</div><div class='del'>-#include "print-tree.h"</div><div class='add'>+#include "direct-io.h"</div><div class='ctx'> #include "props.h"</div><div class='ctx'> #include "xattr.h"</div><div class='del'>-#include "volumes.h"</div><div class='add'>+#include "bio.h"</div><div class='ctx'> #include "export.h"</div><div class='ctx'> #include "compression.h"</div><div class='del'>-#include "rcu-string.h"</div><div class='ctx'> #include "dev-replace.h"</div><div class='ctx'> #include "free-space-cache.h"</div><div class='ctx'> #include "backref.h"</div><div class='hunk'>@@ -49,299 +50,49 @@</div><div class='ctx'> #include "block-group.h"</div><div class='ctx'> #include "discard.h"</div><div class='ctx'> #include "qgroup.h"</div><div class='add'>+#include "raid56.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "defrag.h"</div><div class='add'>+#include "dir-item.h"</div><div class='add'>+#include "ioctl.h"</div><div class='add'>+#include "scrub.h"</div><div class='add'>+#include "verity.h"</div><div class='add'>+#include "super.h"</div><div class='add'>+#include "extent-tree.h"</div><div class='ctx'> #define CREATE_TRACE_POINTS</div><div class='ctx'> #include &lt;trace/events/btrfs.h&gt;</div><div class='ctx'> </div><div class='ctx'> static const struct super_operations btrfs_super_ops;</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Types for mounting the default subvolume and a subvolume explicitly</div><div class='del'>- * requested by subvol=/path. That way the callchain is straightforward and we</div><div class='del'>- * don't have to play tricks with the mount options and recursive calls to</div><div class='del'>- * btrfs_mount.</div><div class='del'>- *</div><div class='del'>- * The new btrfs_root_fs_type also servers as a tag for the bdev_holder.</div><div class='del'>- */</div><div class='ctx'> static struct file_system_type btrfs_fs_type;</div><div class='del'>-static struct file_system_type btrfs_root_fs_type;</div><div class='del'>-</div><div class='del'>-static int btrfs_remount(struct super_block *sb, int *flags, char *data);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Generally the error codes correspond to their respective errors, but there</div><div class='del'>- * are a few special cases.</div><div class='del'>- *</div><div class='del'>- * EUCLEAN: Any sort of corruption that we encounter.  The tree-checker for</div><div class='del'>- *          instance will return EUCLEAN if any of the blocks are corrupted in</div><div class='del'>- *          a way that is problematic.  We want to reserve EUCLEAN for these</div><div class='del'>- *          sort of corruptions.</div><div class='del'>- *</div><div class='del'>- * EROFS: If we check BTRFS_FS_STATE_ERROR and fail out with a return error, we</div><div class='del'>- *        need to use EROFS for this case.  We will have no idea of the</div><div class='del'>- *        original failure, that will have been reported at the time we tripped</div><div class='del'>- *        over the error.  Each subsequent error that doesn't have any context</div><div class='del'>- *        of the original error should use EROFS when handling BTRFS_FS_STATE_ERROR.</div><div class='del'>- */</div><div class='del'>-const char * __attribute_const__ btrfs_decode_error(int errno)</div><div class='del'>-{</div><div class='del'>-	char *errstr = "unknown";</div><div class='del'>-</div><div class='del'>-	switch (errno) {</div><div class='del'>-	case -ENOENT:		/* -2 */</div><div class='del'>-		errstr = "No such entry";</div><div class='del'>-		break;</div><div class='del'>-	case -EIO:		/* -5 */</div><div class='del'>-		errstr = "IO failure";</div><div class='del'>-		break;</div><div class='del'>-	case -ENOMEM:		/* -12*/</div><div class='del'>-		errstr = "Out of memory";</div><div class='del'>-		break;</div><div class='del'>-	case -EEXIST:		/* -17 */</div><div class='del'>-		errstr = "Object already exists";</div><div class='del'>-		break;</div><div class='del'>-	case -ENOSPC:		/* -28 */</div><div class='del'>-		errstr = "No space left";</div><div class='del'>-		break;</div><div class='del'>-	case -EROFS:		/* -30 */</div><div class='del'>-		errstr = "Readonly filesystem";</div><div class='del'>-		break;</div><div class='del'>-	case -EOPNOTSUPP:	/* -95 */</div><div class='del'>-		errstr = "Operation not supported";</div><div class='del'>-		break;</div><div class='del'>-	case -EUCLEAN:		/* -117 */</div><div class='del'>-		errstr = "Filesystem corrupted";</div><div class='del'>-		break;</div><div class='del'>-	case -EDQUOT:		/* -122 */</div><div class='del'>-		errstr = "Quota exceeded";</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return errstr;</div><div class='del'>-}</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * __btrfs_handle_fs_error decodes expected errors from the caller and</div><div class='del'>- * invokes the appropriate error response.</div><div class='del'>- */</div><div class='del'>-__cold</div><div class='del'>-void __btrfs_handle_fs_error(struct btrfs_fs_info *fs_info, const char *function,</div><div class='del'>-		       unsigned int line, int errno, const char *fmt, ...)</div><div class='add'>+static void btrfs_put_super(struct super_block *sb)</div><div class='ctx'> {</div><div class='del'>-	struct super_block *sb = fs_info-&gt;sb;</div><div class='del'>-#ifdef CONFIG_PRINTK</div><div class='del'>-	const char *errstr;</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Special case: if the error is EROFS, and we're already</div><div class='del'>-	 * under SB_RDONLY, then it is safe here.</div><div class='del'>-	 */</div><div class='del'>-	if (errno == -EROFS &amp;&amp; sb_rdonly(sb))</div><div class='del'>-  		return;</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_PRINTK</div><div class='del'>-	errstr = btrfs_decode_error(errno);</div><div class='del'>-	if (fmt) {</div><div class='del'>-		struct va_format vaf;</div><div class='del'>-		va_list args;</div><div class='del'>-</div><div class='del'>-		va_start(args, fmt);</div><div class='del'>-		vaf.fmt = fmt;</div><div class='del'>-		vaf.va = &amp;args;</div><div class='del'>-</div><div class='del'>-		pr_crit("BTRFS: error (device %s) in %s:%d: errno=%d %s (%pV)\n",</div><div class='del'>-			sb-&gt;s_id, function, line, errno, errstr, &amp;vaf);</div><div class='del'>-		va_end(args);</div><div class='del'>-	} else {</div><div class='del'>-		pr_crit("BTRFS: error (device %s) in %s:%d: errno=%d %s\n",</div><div class='del'>-			sb-&gt;s_id, function, line, errno, errstr);</div><div class='del'>-	}</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Today we only save the error info to memory.  Long term we'll</div><div class='del'>-	 * also send it down to the disk</div><div class='del'>-	 */</div><div class='del'>-	set_bit(BTRFS_FS_STATE_ERROR, &amp;fs_info-&gt;fs_state);</div><div class='del'>-</div><div class='del'>-	/* Don't go through full error handling during mount */</div><div class='del'>-	if (!(sb-&gt;s_flags &amp; SB_BORN))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	if (sb_rdonly(sb))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	btrfs_discard_stop(fs_info);</div><div class='add'>+	struct btrfs_fs_info *fs_info = btrfs_sb(sb);</div><div class='ctx'> </div><div class='del'>-	/* btrfs handle error by forcing the filesystem readonly */</div><div class='del'>-	btrfs_set_sb_rdonly(sb);</div><div class='del'>-	btrfs_info(fs_info, "forced readonly");</div><div class='del'>-	/*</div><div class='del'>-	 * Note that a running device replace operation is not canceled here</div><div class='del'>-	 * although there is no way to update the progress. It would add the</div><div class='del'>-	 * risk of a deadlock, therefore the canceling is omitted. The only</div><div class='del'>-	 * penalty is that some I/O remains active until the procedure</div><div class='del'>-	 * completes. The next time when the filesystem is mounted writable</div><div class='del'>-	 * again, the device replace operation continues.</div><div class='del'>-	 */</div><div class='add'>+	btrfs_info(fs_info, "last unmount of filesystem %pU", fs_info-&gt;fs_devices-&gt;fsid);</div><div class='add'>+	close_ctree(fs_info);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_PRINTK</div><div class='del'>-static const char * const logtypes[] = {</div><div class='del'>-	"emergency",</div><div class='del'>-	"alert",</div><div class='del'>-	"critical",</div><div class='del'>-	"error",</div><div class='del'>-	"warning",</div><div class='del'>-	"notice",</div><div class='del'>-	"info",</div><div class='del'>-	"debug",</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Use one ratelimit state per log level so that a flood of less important</div><div class='del'>- * messages doesn't cause more important ones to be dropped.</div><div class='del'>- */</div><div class='del'>-static struct ratelimit_state printk_limits[] = {</div><div class='del'>-	RATELIMIT_STATE_INIT(printk_limits[0], DEFAULT_RATELIMIT_INTERVAL, 100),</div><div class='del'>-	RATELIMIT_STATE_INIT(printk_limits[1], DEFAULT_RATELIMIT_INTERVAL, 100),</div><div class='del'>-	RATELIMIT_STATE_INIT(printk_limits[2], DEFAULT_RATELIMIT_INTERVAL, 100),</div><div class='del'>-	RATELIMIT_STATE_INIT(printk_limits[3], DEFAULT_RATELIMIT_INTERVAL, 100),</div><div class='del'>-	RATELIMIT_STATE_INIT(printk_limits[4], DEFAULT_RATELIMIT_INTERVAL, 100),</div><div class='del'>-	RATELIMIT_STATE_INIT(printk_limits[5], DEFAULT_RATELIMIT_INTERVAL, 100),</div><div class='del'>-	RATELIMIT_STATE_INIT(printk_limits[6], DEFAULT_RATELIMIT_INTERVAL, 100),</div><div class='del'>-	RATELIMIT_STATE_INIT(printk_limits[7], DEFAULT_RATELIMIT_INTERVAL, 100),</div><div class='add'>+/* Store the mount options related information. */</div><div class='add'>+struct btrfs_fs_context {</div><div class='add'>+	char *subvol_name;</div><div class='add'>+	u64 subvol_objectid;</div><div class='add'>+	u64 max_inline;</div><div class='add'>+	u32 commit_interval;</div><div class='add'>+	u32 metadata_ratio;</div><div class='add'>+	u32 thread_pool_size;</div><div class='add'>+	unsigned long long mount_opt;</div><div class='add'>+	unsigned long compress_type:4;</div><div class='add'>+	int compress_level;</div><div class='add'>+	refcount_t refs;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-void __cold btrfs_printk(const struct btrfs_fs_info *fs_info, const char *fmt, ...)</div><div class='del'>-{</div><div class='del'>-	char lvl[PRINTK_MAX_SINGLE_HEADER_LEN + 1] = "\0";</div><div class='del'>-	struct va_format vaf;</div><div class='del'>-	va_list args;</div><div class='del'>-	int kern_level;</div><div class='del'>-	const char *type = logtypes[4];</div><div class='del'>-	struct ratelimit_state *ratelimit = &amp;printk_limits[4];</div><div class='del'>-</div><div class='del'>-	va_start(args, fmt);</div><div class='del'>-</div><div class='del'>-	while ((kern_level = printk_get_level(fmt)) != 0) {</div><div class='del'>-		size_t size = printk_skip_level(fmt) - fmt;</div><div class='del'>-</div><div class='del'>-		if (kern_level &gt;= '0' &amp;&amp; kern_level &lt;= '7') {</div><div class='del'>-			memcpy(lvl, fmt,  size);</div><div class='del'>-			lvl[size] = '\0';</div><div class='del'>-			type = logtypes[kern_level - '0'];</div><div class='del'>-			ratelimit = &amp;printk_limits[kern_level - '0'];</div><div class='del'>-		}</div><div class='del'>-		fmt += size;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	vaf.fmt = fmt;</div><div class='del'>-	vaf.va = &amp;args;</div><div class='del'>-</div><div class='del'>-	if (__ratelimit(ratelimit)) {</div><div class='del'>-		if (fs_info)</div><div class='del'>-			printk("%sBTRFS %s (device %s): %pV\n", lvl, type,</div><div class='del'>-				fs_info-&gt;sb-&gt;s_id, &amp;vaf);</div><div class='del'>-		else</div><div class='del'>-			printk("%sBTRFS %s: %pV\n", lvl, type, &amp;vaf);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	va_end(args);</div><div class='del'>-}</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-#if BITS_PER_LONG == 32</div><div class='del'>-void __cold btrfs_warn_32bit_limit(struct btrfs_fs_info *fs_info)</div><div class='del'>-{</div><div class='del'>-	if (!test_and_set_bit(BTRFS_FS_32BIT_WARN, &amp;fs_info-&gt;flags)) {</div><div class='del'>-		btrfs_warn(fs_info, "reaching 32bit limit for logical addresses");</div><div class='del'>-		btrfs_warn(fs_info,</div><div class='del'>-"due to page cache limit on 32bit systems, btrfs can't access metadata at or beyond %lluT",</div><div class='del'>-			   BTRFS_32BIT_MAX_FILE_SIZE &gt;&gt; 40);</div><div class='del'>-		btrfs_warn(fs_info,</div><div class='del'>-			   "please consider upgrading to 64bit kernel/hardware");</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void __cold btrfs_err_32bit_limit(struct btrfs_fs_info *fs_info)</div><div class='del'>-{</div><div class='del'>-	if (!test_and_set_bit(BTRFS_FS_32BIT_ERROR, &amp;fs_info-&gt;flags)) {</div><div class='del'>-		btrfs_err(fs_info, "reached 32bit limit for logical addresses");</div><div class='del'>-		btrfs_err(fs_info,</div><div class='del'>-"due to page cache limit on 32bit systems, metadata beyond %lluT can't be accessed",</div><div class='del'>-			  BTRFS_32BIT_MAX_FILE_SIZE &gt;&gt; 40);</div><div class='del'>-		btrfs_err(fs_info,</div><div class='del'>-			   "please consider upgrading to 64bit kernel/hardware");</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * We only mark the transaction aborted and then set the file system read-only.</div><div class='del'>- * This will prevent new transactions from starting or trying to join this</div><div class='del'>- * one.</div><div class='del'>- *</div><div class='del'>- * This means that error recovery at the call site is limited to freeing</div><div class='del'>- * any local memory allocations and passing the error code up without</div><div class='del'>- * further cleanup. The transaction should complete as it normally would</div><div class='del'>- * in the call path but will return -EIO.</div><div class='del'>- *</div><div class='del'>- * We'll complete the cleanup in btrfs_end_transaction and</div><div class='del'>- * btrfs_commit_transaction.</div><div class='del'>- */</div><div class='del'>-__cold</div><div class='del'>-void __btrfs_abort_transaction(struct btrfs_trans_handle *trans,</div><div class='del'>-			       const char *function,</div><div class='del'>-			       unsigned int line, int errno)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='del'>-</div><div class='del'>-	WRITE_ONCE(trans-&gt;aborted, errno);</div><div class='del'>-	WRITE_ONCE(trans-&gt;transaction-&gt;aborted, errno);</div><div class='del'>-	/* Wake up anybody who may be waiting on this transaction */</div><div class='del'>-	wake_up(&amp;fs_info-&gt;transaction_wait);</div><div class='del'>-	wake_up(&amp;fs_info-&gt;transaction_blocked_wait);</div><div class='del'>-	__btrfs_handle_fs_error(fs_info, function, line, errno, NULL);</div><div class='del'>-}</div><div class='del'>-/*</div><div class='del'>- * __btrfs_panic decodes unexpected, fatal errors from the caller,</div><div class='del'>- * issues an alert, and either panics or BUGs, depending on mount options.</div><div class='del'>- */</div><div class='del'>-__cold</div><div class='del'>-void __btrfs_panic(struct btrfs_fs_info *fs_info, const char *function,</div><div class='del'>-		   unsigned int line, int errno, const char *fmt, ...)</div><div class='del'>-{</div><div class='del'>-	char *s_id = "&lt;unknown&gt;";</div><div class='del'>-	const char *errstr;</div><div class='del'>-	struct va_format vaf = { .fmt = fmt };</div><div class='del'>-	va_list args;</div><div class='del'>-</div><div class='del'>-	if (fs_info)</div><div class='del'>-		s_id = fs_info-&gt;sb-&gt;s_id;</div><div class='del'>-</div><div class='del'>-	va_start(args, fmt);</div><div class='del'>-	vaf.va = &amp;args;</div><div class='del'>-</div><div class='del'>-	errstr = btrfs_decode_error(errno);</div><div class='del'>-	if (fs_info &amp;&amp; (btrfs_test_opt(fs_info, PANIC_ON_FATAL_ERROR)))</div><div class='del'>-		panic(KERN_CRIT "BTRFS panic (device %s) in %s:%d: %pV (errno=%d %s)\n",</div><div class='del'>-			s_id, function, line, &amp;vaf, errno, errstr);</div><div class='del'>-</div><div class='del'>-	btrfs_crit(fs_info, "panic in %s:%d: %pV (errno=%d %s)",</div><div class='del'>-		   function, line, &amp;vaf, errno, errstr);</div><div class='del'>-	va_end(args);</div><div class='del'>-	/* Caller calls BUG() */</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfs_put_super(struct super_block *sb)</div><div class='del'>-{</div><div class='del'>-	close_ctree(btrfs_sb(sb));</div><div class='del'>-}</div><div class='add'>+static void btrfs_emit_options(struct btrfs_fs_info *info,</div><div class='add'>+			       struct btrfs_fs_context *old);</div><div class='ctx'> </div><div class='ctx'> enum {</div><div class='del'>-	Opt_acl, Opt_noacl,</div><div class='add'>+	Opt_acl,</div><div class='ctx'> 	Opt_clear_cache,</div><div class='ctx'> 	Opt_commit_interval,</div><div class='ctx'> 	Opt_compress,</div><div class='hunk'>@@ -351,817 +102,701 @@ enum {</div><div class='ctx'> 	Opt_degraded,</div><div class='ctx'> 	Opt_device,</div><div class='ctx'> 	Opt_fatal_errors,</div><div class='del'>-	Opt_flushoncommit, Opt_noflushoncommit,</div><div class='add'>+	Opt_flushoncommit,</div><div class='ctx'> 	Opt_max_inline,</div><div class='del'>-	Opt_barrier, Opt_nobarrier,</div><div class='del'>-	Opt_datacow, Opt_nodatacow,</div><div class='del'>-	Opt_datasum, Opt_nodatasum,</div><div class='del'>-	Opt_defrag, Opt_nodefrag,</div><div class='del'>-	Opt_discard, Opt_nodiscard,</div><div class='add'>+	Opt_barrier,</div><div class='add'>+	Opt_datacow,</div><div class='add'>+	Opt_datasum,</div><div class='add'>+	Opt_defrag,</div><div class='add'>+	Opt_discard,</div><div class='ctx'> 	Opt_discard_mode,</div><div class='del'>-	Opt_norecovery,</div><div class='ctx'> 	Opt_ratio,</div><div class='ctx'> 	Opt_rescan_uuid_tree,</div><div class='ctx'> 	Opt_skip_balance,</div><div class='del'>-	Opt_space_cache, Opt_no_space_cache,</div><div class='add'>+	Opt_space_cache,</div><div class='ctx'> 	Opt_space_cache_version,</div><div class='del'>-	Opt_ssd, Opt_nossd,</div><div class='del'>-	Opt_ssd_spread, Opt_nossd_spread,</div><div class='add'>+	Opt_ssd,</div><div class='add'>+	Opt_ssd_spread,</div><div class='ctx'> 	Opt_subvol,</div><div class='ctx'> 	Opt_subvol_empty,</div><div class='ctx'> 	Opt_subvolid,</div><div class='ctx'> 	Opt_thread_pool,</div><div class='del'>-	Opt_treelog, Opt_notreelog,</div><div class='add'>+	Opt_treelog,</div><div class='ctx'> 	Opt_user_subvol_rm_allowed,</div><div class='add'>+	Opt_norecovery,</div><div class='ctx'> </div><div class='ctx'> 	/* Rescue options */</div><div class='ctx'> 	Opt_rescue,</div><div class='ctx'> 	Opt_usebackuproot,</div><div class='del'>-	Opt_nologreplay,</div><div class='del'>-	Opt_ignorebadroots,</div><div class='del'>-	Opt_ignoredatacsums,</div><div class='del'>-	Opt_rescue_all,</div><div class='del'>-</div><div class='del'>-	/* Deprecated options */</div><div class='del'>-	Opt_recovery,</div><div class='del'>-	Opt_inode_cache, Opt_noinode_cache,</div><div class='ctx'> </div><div class='ctx'> 	/* Debugging options */</div><div class='del'>-	Opt_check_integrity,</div><div class='del'>-	Opt_check_integrity_including_extent_data,</div><div class='del'>-	Opt_check_integrity_print_mask,</div><div class='del'>-	Opt_enospc_debug, Opt_noenospc_debug,</div><div class='add'>+	Opt_enospc_debug,</div><div class='ctx'> #ifdef CONFIG_BTRFS_DEBUG</div><div class='del'>-	Opt_fragment_data, Opt_fragment_metadata, Opt_fragment_all,</div><div class='del'>-#endif</div><div class='del'>-#ifdef CONFIG_BTRFS_FS_REF_VERIFY</div><div class='add'>+	Opt_fragment, Opt_fragment_data, Opt_fragment_metadata, Opt_fragment_all,</div><div class='ctx'> 	Opt_ref_verify,</div><div class='add'>+	Opt_ref_tracker,</div><div class='ctx'> #endif</div><div class='ctx'> 	Opt_err,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static const match_table_t tokens = {</div><div class='del'>-	{Opt_acl, "acl"},</div><div class='del'>-	{Opt_noacl, "noacl"},</div><div class='del'>-	{Opt_clear_cache, "clear_cache"},</div><div class='del'>-	{Opt_commit_interval, "commit=%u"},</div><div class='del'>-	{Opt_compress, "compress"},</div><div class='del'>-	{Opt_compress_type, "compress=%s"},</div><div class='del'>-	{Opt_compress_force, "compress-force"},</div><div class='del'>-	{Opt_compress_force_type, "compress-force=%s"},</div><div class='del'>-	{Opt_degraded, "degraded"},</div><div class='del'>-	{Opt_device, "device=%s"},</div><div class='del'>-	{Opt_fatal_errors, "fatal_errors=%s"},</div><div class='del'>-	{Opt_flushoncommit, "flushoncommit"},</div><div class='del'>-	{Opt_noflushoncommit, "noflushoncommit"},</div><div class='del'>-	{Opt_inode_cache, "inode_cache"},</div><div class='del'>-	{Opt_noinode_cache, "noinode_cache"},</div><div class='del'>-	{Opt_max_inline, "max_inline=%s"},</div><div class='del'>-	{Opt_barrier, "barrier"},</div><div class='del'>-	{Opt_nobarrier, "nobarrier"},</div><div class='del'>-	{Opt_datacow, "datacow"},</div><div class='del'>-	{Opt_nodatacow, "nodatacow"},</div><div class='del'>-	{Opt_datasum, "datasum"},</div><div class='del'>-	{Opt_nodatasum, "nodatasum"},</div><div class='del'>-	{Opt_defrag, "autodefrag"},</div><div class='del'>-	{Opt_nodefrag, "noautodefrag"},</div><div class='del'>-	{Opt_discard, "discard"},</div><div class='del'>-	{Opt_discard_mode, "discard=%s"},</div><div class='del'>-	{Opt_nodiscard, "nodiscard"},</div><div class='del'>-	{Opt_norecovery, "norecovery"},</div><div class='del'>-	{Opt_ratio, "metadata_ratio=%u"},</div><div class='del'>-	{Opt_rescan_uuid_tree, "rescan_uuid_tree"},</div><div class='del'>-	{Opt_skip_balance, "skip_balance"},</div><div class='del'>-	{Opt_space_cache, "space_cache"},</div><div class='del'>-	{Opt_no_space_cache, "nospace_cache"},</div><div class='del'>-	{Opt_space_cache_version, "space_cache=%s"},</div><div class='del'>-	{Opt_ssd, "ssd"},</div><div class='del'>-	{Opt_nossd, "nossd"},</div><div class='del'>-	{Opt_ssd_spread, "ssd_spread"},</div><div class='del'>-	{Opt_nossd_spread, "nossd_spread"},</div><div class='del'>-	{Opt_subvol, "subvol=%s"},</div><div class='del'>-	{Opt_subvol_empty, "subvol="},</div><div class='del'>-	{Opt_subvolid, "subvolid=%s"},</div><div class='del'>-	{Opt_thread_pool, "thread_pool=%u"},</div><div class='del'>-	{Opt_treelog, "treelog"},</div><div class='del'>-	{Opt_notreelog, "notreelog"},</div><div class='del'>-	{Opt_user_subvol_rm_allowed, "user_subvol_rm_allowed"},</div><div class='add'>+enum {</div><div class='add'>+	Opt_fatal_errors_panic,</div><div class='add'>+	Opt_fatal_errors_bug,</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-	/* Rescue options */</div><div class='del'>-	{Opt_rescue, "rescue=%s"},</div><div class='del'>-	/* Deprecated, with alias rescue=nologreplay */</div><div class='del'>-	{Opt_nologreplay, "nologreplay"},</div><div class='del'>-	/* Deprecated, with alias rescue=usebackuproot */</div><div class='del'>-	{Opt_usebackuproot, "usebackuproot"},</div><div class='add'>+static const struct constant_table btrfs_parameter_fatal_errors[] = {</div><div class='add'>+	{ "panic", Opt_fatal_errors_panic },</div><div class='add'>+	{ "bug", Opt_fatal_errors_bug },</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+enum {</div><div class='add'>+	Opt_discard_sync,</div><div class='add'>+	Opt_discard_async,</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-	/* Deprecated options */</div><div class='del'>-	{Opt_recovery, "recovery"},</div><div class='add'>+static const struct constant_table btrfs_parameter_discard[] = {</div><div class='add'>+	{ "sync", Opt_discard_sync },</div><div class='add'>+	{ "async", Opt_discard_async },</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+enum {</div><div class='add'>+	Opt_space_cache_v1,</div><div class='add'>+	Opt_space_cache_v2,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct constant_table btrfs_parameter_space_cache[] = {</div><div class='add'>+	{ "v1", Opt_space_cache_v1 },</div><div class='add'>+	{ "v2", Opt_space_cache_v2 },</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+enum {</div><div class='add'>+	Opt_rescue_usebackuproot,</div><div class='add'>+	Opt_rescue_nologreplay,</div><div class='add'>+	Opt_rescue_ignorebadroots,</div><div class='add'>+	Opt_rescue_ignoredatacsums,</div><div class='add'>+	Opt_rescue_ignoremetacsums,</div><div class='add'>+	Opt_rescue_ignoresuperflags,</div><div class='add'>+	Opt_rescue_parameter_all,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct constant_table btrfs_parameter_rescue[] = {</div><div class='add'>+	{ "usebackuproot", Opt_rescue_usebackuproot },</div><div class='add'>+	{ "nologreplay", Opt_rescue_nologreplay },</div><div class='add'>+	{ "ignorebadroots", Opt_rescue_ignorebadroots },</div><div class='add'>+	{ "ibadroots", Opt_rescue_ignorebadroots },</div><div class='add'>+	{ "ignoredatacsums", Opt_rescue_ignoredatacsums },</div><div class='add'>+	{ "ignoremetacsums", Opt_rescue_ignoremetacsums},</div><div class='add'>+	{ "ignoresuperflags", Opt_rescue_ignoresuperflags},</div><div class='add'>+	{ "idatacsums", Opt_rescue_ignoredatacsums },</div><div class='add'>+	{ "imetacsums", Opt_rescue_ignoremetacsums},</div><div class='add'>+	{ "isuperflags", Opt_rescue_ignoresuperflags},</div><div class='add'>+	{ "all", Opt_rescue_parameter_all },</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-	/* Debugging options */</div><div class='del'>-	{Opt_check_integrity, "check_int"},</div><div class='del'>-	{Opt_check_integrity_including_extent_data, "check_int_data"},</div><div class='del'>-	{Opt_check_integrity_print_mask, "check_int_print_mask=%u"},</div><div class='del'>-	{Opt_enospc_debug, "enospc_debug"},</div><div class='del'>-	{Opt_noenospc_debug, "noenospc_debug"},</div><div class='ctx'> #ifdef CONFIG_BTRFS_DEBUG</div><div class='del'>-	{Opt_fragment_data, "fragment=data"},</div><div class='del'>-	{Opt_fragment_metadata, "fragment=metadata"},</div><div class='del'>-	{Opt_fragment_all, "fragment=all"},</div><div class='del'>-#endif</div><div class='del'>-#ifdef CONFIG_BTRFS_FS_REF_VERIFY</div><div class='del'>-	{Opt_ref_verify, "ref_verify"},</div><div class='del'>-#endif</div><div class='del'>-	{Opt_err, NULL},</div><div class='add'>+enum {</div><div class='add'>+	Opt_fragment_parameter_data,</div><div class='add'>+	Opt_fragment_parameter_metadata,</div><div class='add'>+	Opt_fragment_parameter_all,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static const match_table_t rescue_tokens = {</div><div class='del'>-	{Opt_usebackuproot, "usebackuproot"},</div><div class='del'>-	{Opt_nologreplay, "nologreplay"},</div><div class='del'>-	{Opt_ignorebadroots, "ignorebadroots"},</div><div class='del'>-	{Opt_ignorebadroots, "ibadroots"},</div><div class='del'>-	{Opt_ignoredatacsums, "ignoredatacsums"},</div><div class='del'>-	{Opt_ignoredatacsums, "idatacsums"},</div><div class='del'>-	{Opt_rescue_all, "all"},</div><div class='del'>-	{Opt_err, NULL},</div><div class='add'>+static const struct constant_table btrfs_parameter_fragment[] = {</div><div class='add'>+	{ "data", Opt_fragment_parameter_data },</div><div class='add'>+	{ "metadata", Opt_fragment_parameter_metadata },</div><div class='add'>+	{ "all", Opt_fragment_parameter_all },</div><div class='add'>+	{}</div><div class='ctx'> };</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='del'>-static bool check_ro_option(struct btrfs_fs_info *fs_info, unsigned long opt,</div><div class='del'>-			    const char *opt_name)</div><div class='del'>-{</div><div class='del'>-	if (fs_info-&gt;mount_opt &amp; opt) {</div><div class='del'>-		btrfs_err(fs_info, "%s must be used with ro mount option",</div><div class='del'>-			  opt_name);</div><div class='del'>-		return true;</div><div class='del'>-	}</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='add'>+static const struct fs_parameter_spec btrfs_fs_parameters[] = {</div><div class='add'>+	fsparam_flag_no("acl", Opt_acl),</div><div class='add'>+	fsparam_flag_no("autodefrag", Opt_defrag),</div><div class='add'>+	fsparam_flag_no("barrier", Opt_barrier),</div><div class='add'>+	fsparam_flag("clear_cache", Opt_clear_cache),</div><div class='add'>+	fsparam_u32("commit", Opt_commit_interval),</div><div class='add'>+	fsparam_flag("compress", Opt_compress),</div><div class='add'>+	fsparam_string("compress", Opt_compress_type),</div><div class='add'>+	fsparam_flag("compress-force", Opt_compress_force),</div><div class='add'>+	fsparam_string("compress-force", Opt_compress_force_type),</div><div class='add'>+	fsparam_flag_no("datacow", Opt_datacow),</div><div class='add'>+	fsparam_flag_no("datasum", Opt_datasum),</div><div class='add'>+	fsparam_flag("degraded", Opt_degraded),</div><div class='add'>+	fsparam_string("device", Opt_device),</div><div class='add'>+	fsparam_flag_no("discard", Opt_discard),</div><div class='add'>+	fsparam_enum("discard", Opt_discard_mode, btrfs_parameter_discard),</div><div class='add'>+	fsparam_enum("fatal_errors", Opt_fatal_errors, btrfs_parameter_fatal_errors),</div><div class='add'>+	fsparam_flag_no("flushoncommit", Opt_flushoncommit),</div><div class='add'>+	fsparam_string("max_inline", Opt_max_inline),</div><div class='add'>+	fsparam_u32("metadata_ratio", Opt_ratio),</div><div class='add'>+	fsparam_flag("rescan_uuid_tree", Opt_rescan_uuid_tree),</div><div class='add'>+	fsparam_flag("skip_balance", Opt_skip_balance),</div><div class='add'>+	fsparam_flag_no("space_cache", Opt_space_cache),</div><div class='add'>+	fsparam_enum("space_cache", Opt_space_cache_version, btrfs_parameter_space_cache),</div><div class='add'>+	fsparam_flag_no("ssd", Opt_ssd),</div><div class='add'>+	fsparam_flag_no("ssd_spread", Opt_ssd_spread),</div><div class='add'>+	fsparam_string("subvol", Opt_subvol),</div><div class='add'>+	fsparam_flag("subvol=", Opt_subvol_empty),</div><div class='add'>+	fsparam_u64("subvolid", Opt_subvolid),</div><div class='add'>+	fsparam_u32("thread_pool", Opt_thread_pool),</div><div class='add'>+	fsparam_flag_no("treelog", Opt_treelog),</div><div class='add'>+	fsparam_flag("user_subvol_rm_allowed", Opt_user_subvol_rm_allowed),</div><div class='add'>+</div><div class='add'>+	/* Rescue options. */</div><div class='add'>+	fsparam_enum("rescue", Opt_rescue, btrfs_parameter_rescue),</div><div class='add'>+	/* Deprecated, with alias rescue=usebackuproot */</div><div class='add'>+	__fsparam(NULL, "usebackuproot", Opt_usebackuproot, fs_param_deprecated, NULL),</div><div class='add'>+	/* For compatibility only, alias for "rescue=nologreplay". */</div><div class='add'>+	fsparam_flag("norecovery", Opt_norecovery),</div><div class='ctx'> </div><div class='del'>-static int parse_rescue_options(struct btrfs_fs_info *info, const char *options)</div><div class='del'>-{</div><div class='del'>-	char *opts;</div><div class='del'>-	char *orig;</div><div class='del'>-	char *p;</div><div class='del'>-	substring_t args[MAX_OPT_ARGS];</div><div class='del'>-	int ret = 0;</div><div class='add'>+	/* Debugging options. */</div><div class='add'>+	fsparam_flag_no("enospc_debug", Opt_enospc_debug),</div><div class='add'>+#ifdef CONFIG_BTRFS_DEBUG</div><div class='add'>+	fsparam_enum("fragment", Opt_fragment, btrfs_parameter_fragment),</div><div class='add'>+	fsparam_flag("ref_tracker", Opt_ref_tracker),</div><div class='add'>+	fsparam_flag("ref_verify", Opt_ref_verify),</div><div class='add'>+#endif</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-	opts = kstrdup(options, GFP_KERNEL);</div><div class='del'>-	if (!opts)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	orig = opts;</div><div class='add'>+static bool btrfs_match_compress_type(const char *string, const char *type, bool may_have_level)</div><div class='add'>+{</div><div class='add'>+	const int len = strlen(type);</div><div class='ctx'> </div><div class='del'>-	while ((p = strsep(&amp;opts, ":")) != NULL) {</div><div class='del'>-		int token;</div><div class='add'>+	return (strncmp(string, type, len) == 0) &amp;&amp;</div><div class='add'>+		((may_have_level &amp;&amp; string[len] == ':') || string[len] == '\0');</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		if (!*p)</div><div class='del'>-			continue;</div><div class='del'>-		token = match_token(p, rescue_tokens, args);</div><div class='del'>-		switch (token){</div><div class='del'>-		case Opt_usebackuproot:</div><div class='del'>-			btrfs_info(info,</div><div class='del'>-				   "trying to use backup root at mount time");</div><div class='del'>-			btrfs_set_opt(info-&gt;mount_opt, USEBACKUPROOT);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_nologreplay:</div><div class='del'>-			btrfs_set_and_info(info, NOLOGREPLAY,</div><div class='del'>-					   "disabling log replay at mount time");</div><div class='del'>-			break;</div><div class='del'>-		case Opt_ignorebadroots:</div><div class='del'>-			btrfs_set_and_info(info, IGNOREBADROOTS,</div><div class='del'>-					   "ignoring bad roots");</div><div class='del'>-			break;</div><div class='del'>-		case Opt_ignoredatacsums:</div><div class='del'>-			btrfs_set_and_info(info, IGNOREDATACSUMS,</div><div class='del'>-					   "ignoring data csums");</div><div class='del'>-			break;</div><div class='del'>-		case Opt_rescue_all:</div><div class='del'>-			btrfs_info(info, "enabling all of the rescue options");</div><div class='del'>-			btrfs_set_and_info(info, IGNOREDATACSUMS,</div><div class='del'>-					   "ignoring data csums");</div><div class='del'>-			btrfs_set_and_info(info, IGNOREBADROOTS,</div><div class='del'>-					   "ignoring bad roots");</div><div class='del'>-			btrfs_set_and_info(info, NOLOGREPLAY,</div><div class='del'>-					   "disabling log replay at mount time");</div><div class='del'>-			break;</div><div class='del'>-		case Opt_err:</div><div class='del'>-			btrfs_info(info, "unrecognized rescue option '%s'", p);</div><div class='del'>-			ret = -EINVAL;</div><div class='del'>-			goto out;</div><div class='del'>-		default:</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='add'>+static int btrfs_parse_compress(struct btrfs_fs_context *ctx,</div><div class='add'>+				const struct fs_parameter *param, int opt)</div><div class='add'>+{</div><div class='add'>+	const char *string = param-&gt;string;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Provide the same semantics as older kernels that don't use fs</div><div class='add'>+	 * context, specifying the "compress" option clears "force-compress"</div><div class='add'>+	 * without the need to pass "compress-force=[no|none]" before</div><div class='add'>+	 * specifying "compress".</div><div class='add'>+	 */</div><div class='add'>+	if (opt != Opt_compress_force &amp;&amp; opt != Opt_compress_force_type)</div><div class='add'>+		btrfs_clear_opt(ctx-&gt;mount_opt, FORCE_COMPRESS);</div><div class='add'>+</div><div class='add'>+	if (opt == Opt_compress || opt == Opt_compress_force) {</div><div class='add'>+		ctx-&gt;compress_type = BTRFS_COMPRESS_ZLIB;</div><div class='add'>+		ctx-&gt;compress_level = BTRFS_ZLIB_DEFAULT_LEVEL;</div><div class='add'>+		btrfs_set_opt(ctx-&gt;mount_opt, COMPRESS);</div><div class='add'>+		btrfs_clear_opt(ctx-&gt;mount_opt, NODATACOW);</div><div class='add'>+		btrfs_clear_opt(ctx-&gt;mount_opt, NODATASUM);</div><div class='add'>+	} else if (btrfs_match_compress_type(string, "zlib", true)) {</div><div class='add'>+		ctx-&gt;compress_type = BTRFS_COMPRESS_ZLIB;</div><div class='add'>+		ret = btrfs_compress_str2level(BTRFS_COMPRESS_ZLIB, string + 4,</div><div class='add'>+					       &amp;ctx-&gt;compress_level);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto error;</div><div class='add'>+		btrfs_set_opt(ctx-&gt;mount_opt, COMPRESS);</div><div class='add'>+		btrfs_clear_opt(ctx-&gt;mount_opt, NODATACOW);</div><div class='add'>+		btrfs_clear_opt(ctx-&gt;mount_opt, NODATASUM);</div><div class='add'>+	} else if (btrfs_match_compress_type(string, "lzo", true)) {</div><div class='add'>+		ctx-&gt;compress_type = BTRFS_COMPRESS_LZO;</div><div class='add'>+		ret = btrfs_compress_str2level(BTRFS_COMPRESS_LZO, string + 3,</div><div class='add'>+					       &amp;ctx-&gt;compress_level);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto error;</div><div class='add'>+		if (string[3] == ':' &amp;&amp; string[4])</div><div class='add'>+			btrfs_warn(NULL, "Compression level ignored for LZO");</div><div class='add'>+		btrfs_set_opt(ctx-&gt;mount_opt, COMPRESS);</div><div class='add'>+		btrfs_clear_opt(ctx-&gt;mount_opt, NODATACOW);</div><div class='add'>+		btrfs_clear_opt(ctx-&gt;mount_opt, NODATASUM);</div><div class='add'>+	} else if (btrfs_match_compress_type(string, "zstd", true)) {</div><div class='add'>+		ctx-&gt;compress_type = BTRFS_COMPRESS_ZSTD;</div><div class='add'>+		ret = btrfs_compress_str2level(BTRFS_COMPRESS_ZSTD, string + 4,</div><div class='add'>+					       &amp;ctx-&gt;compress_level);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto error;</div><div class='add'>+		btrfs_set_opt(ctx-&gt;mount_opt, COMPRESS);</div><div class='add'>+		btrfs_clear_opt(ctx-&gt;mount_opt, NODATACOW);</div><div class='add'>+		btrfs_clear_opt(ctx-&gt;mount_opt, NODATASUM);</div><div class='add'>+	} else if (btrfs_match_compress_type(string, "no", false) ||</div><div class='add'>+		   btrfs_match_compress_type(string, "none", false)) {</div><div class='add'>+		ctx-&gt;compress_level = 0;</div><div class='add'>+		ctx-&gt;compress_type = 0;</div><div class='add'>+		btrfs_clear_opt(ctx-&gt;mount_opt, COMPRESS);</div><div class='add'>+		btrfs_clear_opt(ctx-&gt;mount_opt, FORCE_COMPRESS);</div><div class='add'>+	} else {</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto error;</div><div class='ctx'> 	}</div><div class='del'>-out:</div><div class='del'>-	kfree(orig);</div><div class='add'>+	return 0;</div><div class='add'>+error:</div><div class='add'>+	btrfs_err(NULL, "failed to parse compression option '%s'", string);</div><div class='ctx'> 	return ret;</div><div class='add'>+</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Regular mount options parser.  Everything that is needed only when</div><div class='del'>- * reading in a new superblock is parsed here.</div><div class='del'>- * XXX JDM: This needs to be cleaned up for remount.</div><div class='del'>- */</div><div class='del'>-int btrfs_parse_options(struct btrfs_fs_info *info, char *options,</div><div class='del'>-			unsigned long new_flags)</div><div class='add'>+static int btrfs_parse_param(struct fs_context *fc, struct fs_parameter *param)</div><div class='ctx'> {</div><div class='del'>-	substring_t args[MAX_OPT_ARGS];</div><div class='del'>-	char *p, *num;</div><div class='del'>-	int intarg;</div><div class='del'>-	int ret = 0;</div><div class='del'>-	char *compress_type;</div><div class='del'>-	bool compress_force = false;</div><div class='del'>-	enum btrfs_compression_type saved_compress_type;</div><div class='del'>-	int saved_compress_level;</div><div class='del'>-	bool saved_compress_force;</div><div class='del'>-	int no_compress = 0;</div><div class='del'>-</div><div class='del'>-	if (btrfs_fs_compat_ro(info, FREE_SPACE_TREE))</div><div class='del'>-		btrfs_set_opt(info-&gt;mount_opt, FREE_SPACE_TREE);</div><div class='del'>-	else if (btrfs_free_space_cache_v1_active(info)) {</div><div class='del'>-		if (btrfs_is_zoned(info)) {</div><div class='del'>-			btrfs_info(info,</div><div class='del'>-			"zoned: clearing existing space cache");</div><div class='del'>-			btrfs_set_super_cache_generation(info-&gt;super_copy, 0);</div><div class='del'>-		} else {</div><div class='del'>-			btrfs_set_opt(info-&gt;mount_opt, SPACE_CACHE);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	struct btrfs_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct fs_parse_result result;</div><div class='add'>+	int opt;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Even the options are empty, we still need to do extra check</div><div class='del'>-	 * against new flags</div><div class='del'>-	 */</div><div class='del'>-	if (!options)</div><div class='del'>-		goto check;</div><div class='add'>+	opt = fs_parse(fc, btrfs_fs_parameters, param, &amp;result);</div><div class='add'>+	if (opt &lt; 0)</div><div class='add'>+		return opt;</div><div class='ctx'> </div><div class='del'>-	while ((p = strsep(&amp;options, ",")) != NULL) {</div><div class='del'>-		int token;</div><div class='del'>-		if (!*p)</div><div class='del'>-			continue;</div><div class='add'>+	switch (opt) {</div><div class='add'>+	case Opt_degraded:</div><div class='add'>+		btrfs_set_opt(ctx-&gt;mount_opt, DEGRADED);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_subvol_empty:</div><div class='add'>+		/*</div><div class='add'>+		 * This exists because we used to allow it on accident, so we're</div><div class='add'>+		 * keeping it to maintain ABI.  See 37becec95ac3 ("Btrfs: allow</div><div class='add'>+		 * empty subvol= again").</div><div class='add'>+		 */</div><div class='add'>+		break;</div><div class='add'>+	case Opt_subvol:</div><div class='add'>+		kfree(ctx-&gt;subvol_name);</div><div class='add'>+		ctx-&gt;subvol_name = kstrdup(param-&gt;string, GFP_KERNEL);</div><div class='add'>+		if (!ctx-&gt;subvol_name)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_subvolid:</div><div class='add'>+		ctx-&gt;subvol_objectid = result.uint_64;</div><div class='ctx'> </div><div class='del'>-		token = match_token(p, tokens, args);</div><div class='del'>-		switch (token) {</div><div class='del'>-		case Opt_degraded:</div><div class='del'>-			btrfs_info(info, "allowing degraded mounts");</div><div class='del'>-			btrfs_set_opt(info-&gt;mount_opt, DEGRADED);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_subvol:</div><div class='del'>-		case Opt_subvol_empty:</div><div class='del'>-		case Opt_subvolid:</div><div class='del'>-		case Opt_device:</div><div class='del'>-			/*</div><div class='del'>-			 * These are parsed by btrfs_parse_subvol_options or</div><div class='del'>-			 * btrfs_parse_device_options and can be ignored here.</div><div class='del'>-			 */</div><div class='del'>-			break;</div><div class='del'>-		case Opt_nodatasum:</div><div class='del'>-			btrfs_set_and_info(info, NODATASUM,</div><div class='del'>-					   "setting nodatasum");</div><div class='del'>-			break;</div><div class='del'>-		case Opt_datasum:</div><div class='del'>-			if (btrfs_test_opt(info, NODATASUM)) {</div><div class='del'>-				if (btrfs_test_opt(info, NODATACOW))</div><div class='del'>-					btrfs_info(info,</div><div class='del'>-						   "setting datasum, datacow enabled");</div><div class='del'>-				else</div><div class='del'>-					btrfs_info(info, "setting datasum");</div><div class='del'>-			}</div><div class='del'>-			btrfs_clear_opt(info-&gt;mount_opt, NODATACOW);</div><div class='del'>-			btrfs_clear_opt(info-&gt;mount_opt, NODATASUM);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_nodatacow:</div><div class='del'>-			if (!btrfs_test_opt(info, NODATACOW)) {</div><div class='del'>-				if (!btrfs_test_opt(info, COMPRESS) ||</div><div class='del'>-				    !btrfs_test_opt(info, FORCE_COMPRESS)) {</div><div class='del'>-					btrfs_info(info,</div><div class='del'>-						   "setting nodatacow, compression disabled");</div><div class='del'>-				} else {</div><div class='del'>-					btrfs_info(info, "setting nodatacow");</div><div class='del'>-				}</div><div class='del'>-			}</div><div class='del'>-			btrfs_clear_opt(info-&gt;mount_opt, COMPRESS);</div><div class='del'>-			btrfs_clear_opt(info-&gt;mount_opt, FORCE_COMPRESS);</div><div class='del'>-			btrfs_set_opt(info-&gt;mount_opt, NODATACOW);</div><div class='del'>-			btrfs_set_opt(info-&gt;mount_opt, NODATASUM);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_datacow:</div><div class='del'>-			btrfs_clear_and_info(info, NODATACOW,</div><div class='del'>-					     "setting datacow");</div><div class='del'>-			break;</div><div class='del'>-		case Opt_compress_force:</div><div class='del'>-		case Opt_compress_force_type:</div><div class='del'>-			compress_force = true;</div><div class='del'>-			fallthrough;</div><div class='del'>-		case Opt_compress:</div><div class='del'>-		case Opt_compress_type:</div><div class='del'>-			saved_compress_type = btrfs_test_opt(info,</div><div class='del'>-							     COMPRESS) ?</div><div class='del'>-				info-&gt;compress_type : BTRFS_COMPRESS_NONE;</div><div class='del'>-			saved_compress_force =</div><div class='del'>-				btrfs_test_opt(info, FORCE_COMPRESS);</div><div class='del'>-			saved_compress_level = info-&gt;compress_level;</div><div class='del'>-			if (token == Opt_compress ||</div><div class='del'>-			    token == Opt_compress_force ||</div><div class='del'>-			    strncmp(args[0].from, "zlib", 4) == 0) {</div><div class='del'>-				compress_type = "zlib";</div><div class='del'>-</div><div class='del'>-				info-&gt;compress_type = BTRFS_COMPRESS_ZLIB;</div><div class='del'>-				info-&gt;compress_level = BTRFS_ZLIB_DEFAULT_LEVEL;</div><div class='del'>-				/*</div><div class='del'>-				 * args[0] contains uninitialized data since</div><div class='del'>-				 * for these tokens we don't expect any</div><div class='del'>-				 * parameter.</div><div class='del'>-				 */</div><div class='del'>-				if (token != Opt_compress &amp;&amp;</div><div class='del'>-				    token != Opt_compress_force)</div><div class='del'>-					info-&gt;compress_level =</div><div class='del'>-					  btrfs_compress_str2level(</div><div class='del'>-							BTRFS_COMPRESS_ZLIB,</div><div class='del'>-							args[0].from + 4);</div><div class='del'>-				btrfs_set_opt(info-&gt;mount_opt, COMPRESS);</div><div class='del'>-				btrfs_clear_opt(info-&gt;mount_opt, NODATACOW);</div><div class='del'>-				btrfs_clear_opt(info-&gt;mount_opt, NODATASUM);</div><div class='del'>-				no_compress = 0;</div><div class='del'>-			} else if (strncmp(args[0].from, "lzo", 3) == 0) {</div><div class='del'>-				compress_type = "lzo";</div><div class='del'>-				info-&gt;compress_type = BTRFS_COMPRESS_LZO;</div><div class='del'>-				info-&gt;compress_level = 0;</div><div class='del'>-				btrfs_set_opt(info-&gt;mount_opt, COMPRESS);</div><div class='del'>-				btrfs_clear_opt(info-&gt;mount_opt, NODATACOW);</div><div class='del'>-				btrfs_clear_opt(info-&gt;mount_opt, NODATASUM);</div><div class='del'>-				btrfs_set_fs_incompat(info, COMPRESS_LZO);</div><div class='del'>-				no_compress = 0;</div><div class='del'>-			} else if (strncmp(args[0].from, "zstd", 4) == 0) {</div><div class='del'>-				compress_type = "zstd";</div><div class='del'>-				info-&gt;compress_type = BTRFS_COMPRESS_ZSTD;</div><div class='del'>-				info-&gt;compress_level =</div><div class='del'>-					btrfs_compress_str2level(</div><div class='del'>-							 BTRFS_COMPRESS_ZSTD,</div><div class='del'>-							 args[0].from + 4);</div><div class='del'>-				btrfs_set_opt(info-&gt;mount_opt, COMPRESS);</div><div class='del'>-				btrfs_clear_opt(info-&gt;mount_opt, NODATACOW);</div><div class='del'>-				btrfs_clear_opt(info-&gt;mount_opt, NODATASUM);</div><div class='del'>-				btrfs_set_fs_incompat(info, COMPRESS_ZSTD);</div><div class='del'>-				no_compress = 0;</div><div class='del'>-			} else if (strncmp(args[0].from, "no", 2) == 0) {</div><div class='del'>-				compress_type = "no";</div><div class='del'>-				info-&gt;compress_level = 0;</div><div class='del'>-				info-&gt;compress_type = 0;</div><div class='del'>-				btrfs_clear_opt(info-&gt;mount_opt, COMPRESS);</div><div class='del'>-				btrfs_clear_opt(info-&gt;mount_opt, FORCE_COMPRESS);</div><div class='del'>-				compress_force = false;</div><div class='del'>-				no_compress++;</div><div class='del'>-			} else {</div><div class='del'>-				ret = -EINVAL;</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='add'>+		/* subvolid=0 means give me the original fs_tree. */</div><div class='add'>+		if (!ctx-&gt;subvol_objectid)</div><div class='add'>+			ctx-&gt;subvol_objectid = BTRFS_FS_TREE_OBJECTID;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_device: {</div><div class='add'>+		struct btrfs_device *device;</div><div class='ctx'> </div><div class='del'>-			if (compress_force) {</div><div class='del'>-				btrfs_set_opt(info-&gt;mount_opt, FORCE_COMPRESS);</div><div class='del'>-			} else {</div><div class='del'>-				/*</div><div class='del'>-				 * If we remount from compress-force=xxx to</div><div class='del'>-				 * compress=xxx, we need clear FORCE_COMPRESS</div><div class='del'>-				 * flag, otherwise, there is no way for users</div><div class='del'>-				 * to disable forcible compression separately.</div><div class='del'>-				 */</div><div class='del'>-				btrfs_clear_opt(info-&gt;mount_opt, FORCE_COMPRESS);</div><div class='del'>-			}</div><div class='del'>-			if (no_compress == 1) {</div><div class='del'>-				btrfs_info(info, "use no compression");</div><div class='del'>-			} else if ((info-&gt;compress_type != saved_compress_type) ||</div><div class='del'>-				   (compress_force != saved_compress_force) ||</div><div class='del'>-				   (info-&gt;compress_level != saved_compress_level)) {</div><div class='del'>-				btrfs_info(info, "%s %s compression, level %d",</div><div class='del'>-					   (compress_force) ? "force" : "use",</div><div class='del'>-					   compress_type, info-&gt;compress_level);</div><div class='del'>-			}</div><div class='del'>-			compress_force = false;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_ssd:</div><div class='del'>-			btrfs_set_and_info(info, SSD,</div><div class='del'>-					   "enabling ssd optimizations");</div><div class='del'>-			btrfs_clear_opt(info-&gt;mount_opt, NOSSD);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_ssd_spread:</div><div class='del'>-			btrfs_set_and_info(info, SSD,</div><div class='del'>-					   "enabling ssd optimizations");</div><div class='del'>-			btrfs_set_and_info(info, SSD_SPREAD,</div><div class='del'>-					   "using spread ssd allocation scheme");</div><div class='del'>-			btrfs_clear_opt(info-&gt;mount_opt, NOSSD);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_nossd:</div><div class='del'>-			btrfs_set_opt(info-&gt;mount_opt, NOSSD);</div><div class='del'>-			btrfs_clear_and_info(info, SSD,</div><div class='del'>-					     "not using ssd optimizations");</div><div class='del'>-			fallthrough;</div><div class='del'>-		case Opt_nossd_spread:</div><div class='del'>-			btrfs_clear_and_info(info, SSD_SPREAD,</div><div class='del'>-					     "not using spread ssd allocation scheme");</div><div class='del'>-			break;</div><div class='del'>-		case Opt_barrier:</div><div class='del'>-			btrfs_clear_and_info(info, NOBARRIER,</div><div class='del'>-					     "turning on barriers");</div><div class='del'>-			break;</div><div class='del'>-		case Opt_nobarrier:</div><div class='del'>-			btrfs_set_and_info(info, NOBARRIER,</div><div class='del'>-					   "turning off barriers");</div><div class='del'>-			break;</div><div class='del'>-		case Opt_thread_pool:</div><div class='del'>-			ret = match_int(&amp;args[0], &amp;intarg);</div><div class='del'>-			if (ret) {</div><div class='del'>-				goto out;</div><div class='del'>-			} else if (intarg == 0) {</div><div class='del'>-				ret = -EINVAL;</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-			info-&gt;thread_pool_size = intarg;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_max_inline:</div><div class='del'>-			num = match_strdup(&amp;args[0]);</div><div class='del'>-			if (num) {</div><div class='del'>-				info-&gt;max_inline = memparse(num, NULL);</div><div class='del'>-				kfree(num);</div><div class='del'>-</div><div class='del'>-				if (info-&gt;max_inline) {</div><div class='del'>-					info-&gt;max_inline = min_t(u64,</div><div class='del'>-						info-&gt;max_inline,</div><div class='del'>-						info-&gt;sectorsize);</div><div class='del'>-				}</div><div class='del'>-				btrfs_info(info, "max_inline at %llu",</div><div class='del'>-					   info-&gt;max_inline);</div><div class='del'>-			} else {</div><div class='del'>-				ret = -ENOMEM;</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		case Opt_acl:</div><div class='add'>+		mutex_lock(&amp;uuid_mutex);</div><div class='add'>+		device = btrfs_scan_one_device(param-&gt;string, false);</div><div class='add'>+		mutex_unlock(&amp;uuid_mutex);</div><div class='add'>+		if (IS_ERR(device))</div><div class='add'>+			return PTR_ERR(device);</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+	case Opt_datasum:</div><div class='add'>+		if (result.negated) {</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, NODATASUM);</div><div class='add'>+		} else {</div><div class='add'>+			btrfs_clear_opt(ctx-&gt;mount_opt, NODATACOW);</div><div class='add'>+			btrfs_clear_opt(ctx-&gt;mount_opt, NODATASUM);</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='add'>+	case Opt_datacow:</div><div class='add'>+		if (result.negated) {</div><div class='add'>+			btrfs_clear_opt(ctx-&gt;mount_opt, COMPRESS);</div><div class='add'>+			btrfs_clear_opt(ctx-&gt;mount_opt, FORCE_COMPRESS);</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, NODATACOW);</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, NODATASUM);</div><div class='add'>+		} else {</div><div class='add'>+			btrfs_clear_opt(ctx-&gt;mount_opt, NODATACOW);</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='add'>+	case Opt_compress_force:</div><div class='add'>+	case Opt_compress_force_type:</div><div class='add'>+		btrfs_set_opt(ctx-&gt;mount_opt, FORCE_COMPRESS);</div><div class='add'>+		fallthrough;</div><div class='add'>+	case Opt_compress:</div><div class='add'>+	case Opt_compress_type:</div><div class='add'>+		if (btrfs_parse_compress(ctx, param, opt))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_ssd:</div><div class='add'>+		if (result.negated) {</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, NOSSD);</div><div class='add'>+			btrfs_clear_opt(ctx-&gt;mount_opt, SSD);</div><div class='add'>+			btrfs_clear_opt(ctx-&gt;mount_opt, SSD_SPREAD);</div><div class='add'>+		} else {</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, SSD);</div><div class='add'>+			btrfs_clear_opt(ctx-&gt;mount_opt, NOSSD);</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='add'>+	case Opt_ssd_spread:</div><div class='add'>+		if (result.negated) {</div><div class='add'>+			btrfs_clear_opt(ctx-&gt;mount_opt, SSD_SPREAD);</div><div class='add'>+		} else {</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, SSD);</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, SSD_SPREAD);</div><div class='add'>+			btrfs_clear_opt(ctx-&gt;mount_opt, NOSSD);</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='add'>+	case Opt_barrier:</div><div class='add'>+		if (result.negated)</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, NOBARRIER);</div><div class='add'>+		else</div><div class='add'>+			btrfs_clear_opt(ctx-&gt;mount_opt, NOBARRIER);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_thread_pool:</div><div class='add'>+		if (result.uint_32 == 0) {</div><div class='add'>+			btrfs_err(NULL, "invalid value 0 for thread_pool");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		ctx-&gt;thread_pool_size = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_max_inline:</div><div class='add'>+		ctx-&gt;max_inline = memparse(param-&gt;string, NULL);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_acl:</div><div class='add'>+		if (result.negated) {</div><div class='add'>+			fc-&gt;sb_flags &amp;= ~SB_POSIXACL;</div><div class='add'>+		} else {</div><div class='ctx'> #ifdef CONFIG_BTRFS_FS_POSIX_ACL</div><div class='del'>-			info-&gt;sb-&gt;s_flags |= SB_POSIXACL;</div><div class='del'>-			break;</div><div class='add'>+			fc-&gt;sb_flags |= SB_POSIXACL;</div><div class='ctx'> #else</div><div class='del'>-			btrfs_err(info, "support for ACL not compiled in!");</div><div class='del'>-			ret = -EINVAL;</div><div class='del'>-			goto out;</div><div class='add'>+			btrfs_err(NULL, "support for ACL not compiled in");</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> #endif</div><div class='del'>-		case Opt_noacl:</div><div class='del'>-			info-&gt;sb-&gt;s_flags &amp;= ~SB_POSIXACL;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_notreelog:</div><div class='del'>-			btrfs_set_and_info(info, NOTREELOG,</div><div class='del'>-					   "disabling tree log");</div><div class='del'>-			break;</div><div class='del'>-		case Opt_treelog:</div><div class='del'>-			btrfs_clear_and_info(info, NOTREELOG,</div><div class='del'>-					     "enabling tree log");</div><div class='del'>-			break;</div><div class='del'>-		case Opt_norecovery:</div><div class='del'>-		case Opt_nologreplay:</div><div class='del'>-			btrfs_warn(info,</div><div class='del'>-		"'nologreplay' is deprecated, use 'rescue=nologreplay' instead");</div><div class='del'>-			btrfs_set_and_info(info, NOLOGREPLAY,</div><div class='del'>-					   "disabling log replay at mount time");</div><div class='del'>-			break;</div><div class='del'>-		case Opt_flushoncommit:</div><div class='del'>-			btrfs_set_and_info(info, FLUSHONCOMMIT,</div><div class='del'>-					   "turning on flush-on-commit");</div><div class='del'>-			break;</div><div class='del'>-		case Opt_noflushoncommit:</div><div class='del'>-			btrfs_clear_and_info(info, FLUSHONCOMMIT,</div><div class='del'>-					     "turning off flush-on-commit");</div><div class='del'>-			break;</div><div class='del'>-		case Opt_ratio:</div><div class='del'>-			ret = match_int(&amp;args[0], &amp;intarg);</div><div class='del'>-			if (ret)</div><div class='del'>-				goto out;</div><div class='del'>-			info-&gt;metadata_ratio = intarg;</div><div class='del'>-			btrfs_info(info, "metadata ratio %u",</div><div class='del'>-				   info-&gt;metadata_ratio);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_discard:</div><div class='del'>-		case Opt_discard_mode:</div><div class='del'>-			if (token == Opt_discard ||</div><div class='del'>-			    strcmp(args[0].from, "sync") == 0) {</div><div class='del'>-				btrfs_clear_opt(info-&gt;mount_opt, DISCARD_ASYNC);</div><div class='del'>-				btrfs_set_and_info(info, DISCARD_SYNC,</div><div class='del'>-						   "turning on sync discard");</div><div class='del'>-			} else if (strcmp(args[0].from, "async") == 0) {</div><div class='del'>-				btrfs_clear_opt(info-&gt;mount_opt, DISCARD_SYNC);</div><div class='del'>-				btrfs_set_and_info(info, DISCARD_ASYNC,</div><div class='del'>-						   "turning on async discard");</div><div class='del'>-			} else {</div><div class='del'>-				ret = -EINVAL;</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		case Opt_nodiscard:</div><div class='del'>-			btrfs_clear_and_info(info, DISCARD_SYNC,</div><div class='del'>-					     "turning off discard");</div><div class='del'>-			btrfs_clear_and_info(info, DISCARD_ASYNC,</div><div class='del'>-					     "turning off async discard");</div><div class='del'>-			break;</div><div class='del'>-		case Opt_space_cache:</div><div class='del'>-		case Opt_space_cache_version:</div><div class='del'>-			if (token == Opt_space_cache ||</div><div class='del'>-			    strcmp(args[0].from, "v1") == 0) {</div><div class='del'>-				btrfs_clear_opt(info-&gt;mount_opt,</div><div class='del'>-						FREE_SPACE_TREE);</div><div class='del'>-				btrfs_set_and_info(info, SPACE_CACHE,</div><div class='del'>-					   "enabling disk space caching");</div><div class='del'>-			} else if (strcmp(args[0].from, "v2") == 0) {</div><div class='del'>-				btrfs_clear_opt(info-&gt;mount_opt,</div><div class='del'>-						SPACE_CACHE);</div><div class='del'>-				btrfs_set_and_info(info, FREE_SPACE_TREE,</div><div class='del'>-						   "enabling free space tree");</div><div class='del'>-			} else {</div><div class='del'>-				ret = -EINVAL;</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		case Opt_rescan_uuid_tree:</div><div class='del'>-			btrfs_set_opt(info-&gt;mount_opt, RESCAN_UUID_TREE);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_no_space_cache:</div><div class='del'>-			if (btrfs_test_opt(info, SPACE_CACHE)) {</div><div class='del'>-				btrfs_clear_and_info(info, SPACE_CACHE,</div><div class='del'>-					     "disabling disk space caching");</div><div class='del'>-			}</div><div class='del'>-			if (btrfs_test_opt(info, FREE_SPACE_TREE)) {</div><div class='del'>-				btrfs_clear_and_info(info, FREE_SPACE_TREE,</div><div class='del'>-					     "disabling free space tree");</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		case Opt_inode_cache:</div><div class='del'>-		case Opt_noinode_cache:</div><div class='del'>-			btrfs_warn(info,</div><div class='del'>-	"the 'inode_cache' option is deprecated and has no effect since 5.11");</div><div class='del'>-			break;</div><div class='del'>-		case Opt_clear_cache:</div><div class='del'>-			btrfs_set_and_info(info, CLEAR_CACHE,</div><div class='del'>-					   "force clearing of disk cache");</div><div class='del'>-			break;</div><div class='del'>-		case Opt_user_subvol_rm_allowed:</div><div class='del'>-			btrfs_set_opt(info-&gt;mount_opt, USER_SUBVOL_RM_ALLOWED);</div><div class='add'>+		}</div><div class='add'>+		/*</div><div class='add'>+		 * VFS limits the ability to toggle ACL on and off via remount,</div><div class='add'>+		 * despite every file system allowing this.  This seems to be</div><div class='add'>+		 * an oversight since we all do, but it'll fail if we're</div><div class='add'>+		 * remounting.  So don't set the mask here, we'll check it in</div><div class='add'>+		 * btrfs_reconfigure and do the toggling ourselves.</div><div class='add'>+		 */</div><div class='add'>+		if (fc-&gt;purpose != FS_CONTEXT_FOR_RECONFIGURE)</div><div class='add'>+			fc-&gt;sb_flags_mask |= SB_POSIXACL;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_treelog:</div><div class='add'>+		if (result.negated)</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, NOTREELOG);</div><div class='add'>+		else</div><div class='add'>+			btrfs_clear_opt(ctx-&gt;mount_opt, NOTREELOG);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_norecovery:</div><div class='add'>+		btrfs_info(NULL,</div><div class='add'>+"'norecovery' is for compatibility only, recommended to use 'rescue=nologreplay'");</div><div class='add'>+		btrfs_set_opt(ctx-&gt;mount_opt, NOLOGREPLAY);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_flushoncommit:</div><div class='add'>+		if (result.negated)</div><div class='add'>+			btrfs_clear_opt(ctx-&gt;mount_opt, FLUSHONCOMMIT);</div><div class='add'>+		else</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, FLUSHONCOMMIT);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_ratio:</div><div class='add'>+		ctx-&gt;metadata_ratio = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_discard:</div><div class='add'>+		if (result.negated) {</div><div class='add'>+			btrfs_clear_opt(ctx-&gt;mount_opt, DISCARD_SYNC);</div><div class='add'>+			btrfs_clear_opt(ctx-&gt;mount_opt, DISCARD_ASYNC);</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, NODISCARD);</div><div class='add'>+		} else {</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, DISCARD_SYNC);</div><div class='add'>+			btrfs_clear_opt(ctx-&gt;mount_opt, DISCARD_ASYNC);</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='add'>+	case Opt_discard_mode:</div><div class='add'>+		switch (result.uint_32) {</div><div class='add'>+		case Opt_discard_sync:</div><div class='add'>+			btrfs_clear_opt(ctx-&gt;mount_opt, DISCARD_ASYNC);</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, DISCARD_SYNC);</div><div class='ctx'> 			break;</div><div class='del'>-		case Opt_enospc_debug:</div><div class='del'>-			btrfs_set_opt(info-&gt;mount_opt, ENOSPC_DEBUG);</div><div class='add'>+		case Opt_discard_async:</div><div class='add'>+			btrfs_clear_opt(ctx-&gt;mount_opt, DISCARD_SYNC);</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, DISCARD_ASYNC);</div><div class='ctx'> 			break;</div><div class='del'>-		case Opt_noenospc_debug:</div><div class='del'>-			btrfs_clear_opt(info-&gt;mount_opt, ENOSPC_DEBUG);</div><div class='add'>+		default:</div><div class='add'>+			btrfs_err(NULL, "unrecognized discard mode value %s",</div><div class='add'>+				  param-&gt;key);</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		btrfs_clear_opt(ctx-&gt;mount_opt, NODISCARD);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_space_cache:</div><div class='add'>+		if (result.negated) {</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, NOSPACECACHE);</div><div class='add'>+			btrfs_clear_opt(ctx-&gt;mount_opt, SPACE_CACHE);</div><div class='add'>+			btrfs_clear_opt(ctx-&gt;mount_opt, FREE_SPACE_TREE);</div><div class='add'>+		} else {</div><div class='add'>+			btrfs_clear_opt(ctx-&gt;mount_opt, FREE_SPACE_TREE);</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, SPACE_CACHE);</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='add'>+	case Opt_space_cache_version:</div><div class='add'>+		switch (result.uint_32) {</div><div class='add'>+		case Opt_space_cache_v1:</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, SPACE_CACHE);</div><div class='add'>+			btrfs_clear_opt(ctx-&gt;mount_opt, FREE_SPACE_TREE);</div><div class='ctx'> 			break;</div><div class='del'>-		case Opt_defrag:</div><div class='del'>-			btrfs_set_and_info(info, AUTO_DEFRAG,</div><div class='del'>-					   "enabling auto defrag");</div><div class='add'>+		case Opt_space_cache_v2:</div><div class='add'>+			btrfs_clear_opt(ctx-&gt;mount_opt, SPACE_CACHE);</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, FREE_SPACE_TREE);</div><div class='ctx'> 			break;</div><div class='del'>-		case Opt_nodefrag:</div><div class='del'>-			btrfs_clear_and_info(info, AUTO_DEFRAG,</div><div class='del'>-					     "disabling auto defrag");</div><div class='add'>+		default:</div><div class='add'>+			btrfs_err(NULL, "unrecognized space_cache value %s",</div><div class='add'>+				  param-&gt;key);</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='add'>+	case Opt_rescan_uuid_tree:</div><div class='add'>+		btrfs_set_opt(ctx-&gt;mount_opt, RESCAN_UUID_TREE);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_clear_cache:</div><div class='add'>+		btrfs_set_opt(ctx-&gt;mount_opt, CLEAR_CACHE);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_user_subvol_rm_allowed:</div><div class='add'>+		btrfs_set_opt(ctx-&gt;mount_opt, USER_SUBVOL_RM_ALLOWED);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_enospc_debug:</div><div class='add'>+		if (result.negated)</div><div class='add'>+			btrfs_clear_opt(ctx-&gt;mount_opt, ENOSPC_DEBUG);</div><div class='add'>+		else</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, ENOSPC_DEBUG);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_defrag:</div><div class='add'>+		if (result.negated)</div><div class='add'>+			btrfs_clear_opt(ctx-&gt;mount_opt, AUTO_DEFRAG);</div><div class='add'>+		else</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, AUTO_DEFRAG);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_usebackuproot:</div><div class='add'>+		btrfs_warn(NULL,</div><div class='add'>+			   "'usebackuproot' is deprecated, use 'rescue=usebackuproot' instead");</div><div class='add'>+		btrfs_set_opt(ctx-&gt;mount_opt, USEBACKUPROOT);</div><div class='add'>+</div><div class='add'>+		/* If we're loading the backup roots we can't trust the space cache. */</div><div class='add'>+		btrfs_set_opt(ctx-&gt;mount_opt, CLEAR_CACHE);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_skip_balance:</div><div class='add'>+		btrfs_set_opt(ctx-&gt;mount_opt, SKIP_BALANCE);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_fatal_errors:</div><div class='add'>+		switch (result.uint_32) {</div><div class='add'>+		case Opt_fatal_errors_panic:</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, PANIC_ON_FATAL_ERROR);</div><div class='ctx'> 			break;</div><div class='del'>-		case Opt_recovery:</div><div class='del'>-		case Opt_usebackuproot:</div><div class='del'>-			btrfs_warn(info,</div><div class='del'>-			"'%s' is deprecated, use 'rescue=usebackuproot' instead",</div><div class='del'>-				   token == Opt_recovery ? "recovery" :</div><div class='del'>-				   "usebackuproot");</div><div class='del'>-			btrfs_info(info,</div><div class='del'>-				   "trying to use backup root at mount time");</div><div class='del'>-			btrfs_set_opt(info-&gt;mount_opt, USEBACKUPROOT);</div><div class='add'>+		case Opt_fatal_errors_bug:</div><div class='add'>+			btrfs_clear_opt(ctx-&gt;mount_opt, PANIC_ON_FATAL_ERROR);</div><div class='ctx'> 			break;</div><div class='del'>-		case Opt_skip_balance:</div><div class='del'>-			btrfs_set_opt(info-&gt;mount_opt, SKIP_BALANCE);</div><div class='add'>+		default:</div><div class='add'>+			btrfs_err(NULL, "unrecognized fatal_errors value %s",</div><div class='add'>+				  param-&gt;key);</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='add'>+	case Opt_commit_interval:</div><div class='add'>+		ctx-&gt;commit_interval = result.uint_32;</div><div class='add'>+		if (ctx-&gt;commit_interval &gt; BTRFS_WARNING_COMMIT_INTERVAL) {</div><div class='add'>+			btrfs_warn(NULL, "excessive commit interval %u, use with care",</div><div class='add'>+				   ctx-&gt;commit_interval);</div><div class='add'>+		}</div><div class='add'>+		if (ctx-&gt;commit_interval == 0)</div><div class='add'>+			ctx-&gt;commit_interval = BTRFS_DEFAULT_COMMIT_INTERVAL;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_rescue:</div><div class='add'>+		switch (result.uint_32) {</div><div class='add'>+		case Opt_rescue_usebackuproot:</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, USEBACKUPROOT);</div><div class='ctx'> 			break;</div><div class='del'>-#ifdef CONFIG_BTRFS_FS_CHECK_INTEGRITY</div><div class='del'>-		case Opt_check_integrity_including_extent_data:</div><div class='del'>-			btrfs_info(info,</div><div class='del'>-				   "enabling check integrity including extent data");</div><div class='del'>-			btrfs_set_opt(info-&gt;mount_opt, CHECK_INTEGRITY_DATA);</div><div class='del'>-			btrfs_set_opt(info-&gt;mount_opt, CHECK_INTEGRITY);</div><div class='add'>+		case Opt_rescue_nologreplay:</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, NOLOGREPLAY);</div><div class='ctx'> 			break;</div><div class='del'>-		case Opt_check_integrity:</div><div class='del'>-			btrfs_info(info, "enabling check integrity");</div><div class='del'>-			btrfs_set_opt(info-&gt;mount_opt, CHECK_INTEGRITY);</div><div class='add'>+		case Opt_rescue_ignorebadroots:</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, IGNOREBADROOTS);</div><div class='ctx'> 			break;</div><div class='del'>-		case Opt_check_integrity_print_mask:</div><div class='del'>-			ret = match_int(&amp;args[0], &amp;intarg);</div><div class='del'>-			if (ret)</div><div class='del'>-				goto out;</div><div class='del'>-			info-&gt;check_integrity_print_mask = intarg;</div><div class='del'>-			btrfs_info(info, "check_integrity_print_mask 0x%x",</div><div class='del'>-				   info-&gt;check_integrity_print_mask);</div><div class='add'>+		case Opt_rescue_ignoredatacsums:</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, IGNOREDATACSUMS);</div><div class='ctx'> 			break;</div><div class='del'>-#else</div><div class='del'>-		case Opt_check_integrity_including_extent_data:</div><div class='del'>-		case Opt_check_integrity:</div><div class='del'>-		case Opt_check_integrity_print_mask:</div><div class='del'>-			btrfs_err(info,</div><div class='del'>-				  "support for check_integrity* not compiled in!");</div><div class='del'>-			ret = -EINVAL;</div><div class='del'>-			goto out;</div><div class='del'>-#endif</div><div class='del'>-		case Opt_fatal_errors:</div><div class='del'>-			if (strcmp(args[0].from, "panic") == 0)</div><div class='del'>-				btrfs_set_opt(info-&gt;mount_opt,</div><div class='del'>-					      PANIC_ON_FATAL_ERROR);</div><div class='del'>-			else if (strcmp(args[0].from, "bug") == 0)</div><div class='del'>-				btrfs_clear_opt(info-&gt;mount_opt,</div><div class='del'>-					      PANIC_ON_FATAL_ERROR);</div><div class='del'>-			else {</div><div class='del'>-				ret = -EINVAL;</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='add'>+		case Opt_rescue_ignoremetacsums:</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, IGNOREMETACSUMS);</div><div class='ctx'> 			break;</div><div class='del'>-		case Opt_commit_interval:</div><div class='del'>-			intarg = 0;</div><div class='del'>-			ret = match_int(&amp;args[0], &amp;intarg);</div><div class='del'>-			if (ret)</div><div class='del'>-				goto out;</div><div class='del'>-			if (intarg == 0) {</div><div class='del'>-				btrfs_info(info,</div><div class='del'>-					   "using default commit interval %us",</div><div class='del'>-					   BTRFS_DEFAULT_COMMIT_INTERVAL);</div><div class='del'>-				intarg = BTRFS_DEFAULT_COMMIT_INTERVAL;</div><div class='del'>-			} else if (intarg &gt; 300) {</div><div class='del'>-				btrfs_warn(info, "excessive commit interval %d",</div><div class='del'>-					   intarg);</div><div class='del'>-			}</div><div class='del'>-			info-&gt;commit_interval = intarg;</div><div class='add'>+		case Opt_rescue_ignoresuperflags:</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, IGNORESUPERFLAGS);</div><div class='ctx'> 			break;</div><div class='del'>-		case Opt_rescue:</div><div class='del'>-			ret = parse_rescue_options(info, args[0].from);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto out;</div><div class='add'>+		case Opt_rescue_parameter_all:</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, IGNOREDATACSUMS);</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, IGNOREMETACSUMS);</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, IGNORESUPERFLAGS);</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, IGNOREBADROOTS);</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, NOLOGREPLAY);</div><div class='ctx'> 			break;</div><div class='add'>+		default:</div><div class='add'>+			btrfs_info(NULL, "unrecognized rescue option '%s'",</div><div class='add'>+				   param-&gt;key);</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='ctx'> #ifdef CONFIG_BTRFS_DEBUG</div><div class='del'>-		case Opt_fragment_all:</div><div class='del'>-			btrfs_info(info, "fragmenting all space");</div><div class='del'>-			btrfs_set_opt(info-&gt;mount_opt, FRAGMENT_DATA);</div><div class='del'>-			btrfs_set_opt(info-&gt;mount_opt, FRAGMENT_METADATA);</div><div class='add'>+	case Opt_fragment:</div><div class='add'>+		switch (result.uint_32) {</div><div class='add'>+		case Opt_fragment_parameter_all:</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, FRAGMENT_DATA);</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, FRAGMENT_METADATA);</div><div class='ctx'> 			break;</div><div class='del'>-		case Opt_fragment_metadata:</div><div class='del'>-			btrfs_info(info, "fragmenting metadata");</div><div class='del'>-			btrfs_set_opt(info-&gt;mount_opt,</div><div class='del'>-				      FRAGMENT_METADATA);</div><div class='add'>+		case Opt_fragment_parameter_metadata:</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, FRAGMENT_METADATA);</div><div class='ctx'> 			break;</div><div class='del'>-		case Opt_fragment_data:</div><div class='del'>-			btrfs_info(info, "fragmenting data");</div><div class='del'>-			btrfs_set_opt(info-&gt;mount_opt, FRAGMENT_DATA);</div><div class='add'>+		case Opt_fragment_parameter_data:</div><div class='add'>+			btrfs_set_opt(ctx-&gt;mount_opt, FRAGMENT_DATA);</div><div class='ctx'> 			break;</div><div class='del'>-#endif</div><div class='del'>-#ifdef CONFIG_BTRFS_FS_REF_VERIFY</div><div class='del'>-		case Opt_ref_verify:</div><div class='del'>-			btrfs_info(info, "doing ref verification");</div><div class='del'>-			btrfs_set_opt(info-&gt;mount_opt, REF_VERIFY);</div><div class='del'>-			break;</div><div class='del'>-#endif</div><div class='del'>-		case Opt_err:</div><div class='del'>-			btrfs_err(info, "unrecognized mount option '%s'", p);</div><div class='del'>-			ret = -EINVAL;</div><div class='del'>-			goto out;</div><div class='ctx'> 		default:</div><div class='del'>-			break;</div><div class='add'>+			btrfs_info(NULL, "unrecognized fragment option '%s'",</div><div class='add'>+				   param-&gt;key);</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 		}</div><div class='add'>+		break;</div><div class='add'>+	case Opt_ref_verify:</div><div class='add'>+		btrfs_set_opt(ctx-&gt;mount_opt, REF_VERIFY);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_ref_tracker:</div><div class='add'>+		btrfs_set_opt(ctx-&gt;mount_opt, REF_TRACKER);</div><div class='add'>+		break;</div><div class='add'>+#endif</div><div class='add'>+	default:</div><div class='add'>+		btrfs_err(NULL, "unrecognized mount option '%s'", param-&gt;key);</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-check:</div><div class='del'>-	/* We're read-only, don't have to check. */</div><div class='del'>-	if (new_flags &amp; SB_RDONLY)</div><div class='del'>-		goto out;</div><div class='ctx'> </div><div class='del'>-	if (check_ro_option(info, BTRFS_MOUNT_NOLOGREPLAY, "nologreplay") ||</div><div class='del'>-	    check_ro_option(info, BTRFS_MOUNT_IGNOREBADROOTS, "ignorebadroots") ||</div><div class='del'>-	    check_ro_option(info, BTRFS_MOUNT_IGNOREDATACSUMS, "ignoredatacsums"))</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-out:</div><div class='del'>-	if (btrfs_fs_compat_ro(info, FREE_SPACE_TREE) &amp;&amp;</div><div class='del'>-	    !btrfs_test_opt(info, FREE_SPACE_TREE) &amp;&amp;</div><div class='del'>-	    !btrfs_test_opt(info, CLEAR_CACHE)) {</div><div class='del'>-		btrfs_err(info, "cannot disable free space tree");</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-</div><div class='del'>-	}</div><div class='del'>-	if (!ret)</div><div class='del'>-		ret = btrfs_check_mountopts_zoned(info);</div><div class='del'>-	if (!ret &amp;&amp; btrfs_test_opt(info, SPACE_CACHE))</div><div class='del'>-		btrfs_info(info, "disk space caching is enabled");</div><div class='del'>-	if (!ret &amp;&amp; btrfs_test_opt(info, FREE_SPACE_TREE))</div><div class='del'>-		btrfs_info(info, "using free space tree");</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Parse mount options that are required early in the mount process.</div><div class='del'>- *</div><div class='del'>- * All other options will be parsed on much later in the mount process and</div><div class='del'>- * only when we need to allocate a new super block.</div><div class='add'>+ * Some options only have meaning at mount time and shouldn't persist across</div><div class='add'>+ * remounts, or be displayed. Clear these at the end of mount and remount code</div><div class='add'>+ * paths.</div><div class='ctx'>  */</div><div class='del'>-static int btrfs_parse_device_options(const char *options, fmode_t flags,</div><div class='del'>-				      void *holder)</div><div class='add'>+static void btrfs_clear_oneshot_options(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	substring_t args[MAX_OPT_ARGS];</div><div class='del'>-	char *device_name, *opts, *orig, *p;</div><div class='del'>-	struct btrfs_device *device = NULL;</div><div class='del'>-	int error = 0;</div><div class='add'>+	btrfs_clear_opt(fs_info-&gt;mount_opt, USEBACKUPROOT);</div><div class='add'>+	btrfs_clear_opt(fs_info-&gt;mount_opt, CLEAR_CACHE);</div><div class='add'>+	btrfs_clear_opt(fs_info-&gt;mount_opt, NOSPACECACHE);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	lockdep_assert_held(&amp;uuid_mutex);</div><div class='add'>+static bool check_ro_option(const struct btrfs_fs_info *fs_info,</div><div class='add'>+			    unsigned long long mount_opt, unsigned long long opt,</div><div class='add'>+			    const char *opt_name)</div><div class='add'>+{</div><div class='add'>+	if (mount_opt &amp; opt) {</div><div class='add'>+		btrfs_err(fs_info, "%s must be used with ro mount option",</div><div class='add'>+			  opt_name);</div><div class='add'>+		return true;</div><div class='add'>+	}</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if (!options)</div><div class='del'>-		return 0;</div><div class='add'>+bool btrfs_check_options(const struct btrfs_fs_info *info,</div><div class='add'>+			 unsigned long long *mount_opt,</div><div class='add'>+			 unsigned long flags)</div><div class='add'>+{</div><div class='add'>+	bool ret = true;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * strsep changes the string, duplicate it because btrfs_parse_options</div><div class='del'>-	 * gets called later</div><div class='del'>-	 */</div><div class='del'>-	opts = kstrdup(options, GFP_KERNEL);</div><div class='del'>-	if (!opts)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	orig = opts;</div><div class='add'>+	if (!(flags &amp; SB_RDONLY) &amp;&amp;</div><div class='add'>+	    (check_ro_option(info, *mount_opt, BTRFS_MOUNT_NOLOGREPLAY, "nologreplay") ||</div><div class='add'>+	     check_ro_option(info, *mount_opt, BTRFS_MOUNT_IGNOREBADROOTS, "ignorebadroots") ||</div><div class='add'>+	     check_ro_option(info, *mount_opt, BTRFS_MOUNT_IGNOREDATACSUMS, "ignoredatacsums") ||</div><div class='add'>+	     check_ro_option(info, *mount_opt, BTRFS_MOUNT_IGNOREMETACSUMS, "ignoremetacsums") ||</div><div class='add'>+	     check_ro_option(info, *mount_opt, BTRFS_MOUNT_IGNORESUPERFLAGS, "ignoresuperflags")))</div><div class='add'>+		ret = false;</div><div class='ctx'> </div><div class='del'>-	while ((p = strsep(&amp;opts, ",")) != NULL) {</div><div class='del'>-		int token;</div><div class='add'>+	if (btrfs_fs_compat_ro(info, FREE_SPACE_TREE) &amp;&amp;</div><div class='add'>+	    !btrfs_raw_test_opt(*mount_opt, FREE_SPACE_TREE) &amp;&amp;</div><div class='add'>+	    !btrfs_raw_test_opt(*mount_opt, CLEAR_CACHE)) {</div><div class='add'>+		btrfs_err(info, "cannot disable free-space-tree");</div><div class='add'>+		ret = false;</div><div class='add'>+	}</div><div class='add'>+	if (btrfs_fs_compat_ro(info, BLOCK_GROUP_TREE) &amp;&amp;</div><div class='add'>+	     !btrfs_raw_test_opt(*mount_opt, FREE_SPACE_TREE)) {</div><div class='add'>+		btrfs_err(info, "cannot disable free-space-tree with block-group-tree feature");</div><div class='add'>+		ret = false;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		if (!*p)</div><div class='del'>-			continue;</div><div class='add'>+	if (btrfs_check_mountopts_zoned(info, mount_opt))</div><div class='add'>+		ret = false;</div><div class='ctx'> </div><div class='del'>-		token = match_token(p, tokens, args);</div><div class='del'>-		if (token == Opt_device) {</div><div class='del'>-			device_name = match_strdup(&amp;args[0]);</div><div class='del'>-			if (!device_name) {</div><div class='del'>-				error = -ENOMEM;</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-			device = btrfs_scan_one_device(device_name, flags,</div><div class='del'>-					holder);</div><div class='del'>-			kfree(device_name);</div><div class='del'>-			if (IS_ERR(device)) {</div><div class='del'>-				error = PTR_ERR(device);</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='add'>+	if (!test_bit(BTRFS_FS_STATE_REMOUNTING, &amp;info-&gt;fs_state)) {</div><div class='add'>+		if (btrfs_raw_test_opt(*mount_opt, SPACE_CACHE)) {</div><div class='add'>+			btrfs_warn(info,</div><div class='add'>+"space cache v1 is being deprecated and will be removed in a future release, please use -o space_cache=v2");</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	kfree(orig);</div><div class='del'>-	return error;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Parse mount options that are related to subvolume id</div><div class='add'>+ * This is subtle, we only call this during open_ctree().  We need to pre-load</div><div class='add'>+ * the mount options with the on-disk settings.  Before the new mount API took</div><div class='add'>+ * effect we would do this on mount and remount.  With the new mount API we'll</div><div class='add'>+ * only do this on the initial mount.</div><div class='ctx'>  *</div><div class='del'>- * The value is later passed to mount_subvol()</div><div class='add'>+ * This isn't a change in behavior, because we're using the current state of the</div><div class='add'>+ * file system to set the current mount options.  If you mounted with special</div><div class='add'>+ * options to disable these features and then remounted we wouldn't revert the</div><div class='add'>+ * settings, because mounting without these features cleared the on-disk</div><div class='add'>+ * settings, so this being called on re-mount is not needed.</div><div class='ctx'>  */</div><div class='del'>-static int btrfs_parse_subvol_options(const char *options, char **subvol_name,</div><div class='del'>-		u64 *subvol_objectid)</div><div class='add'>+void btrfs_set_free_space_cache_settings(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	substring_t args[MAX_OPT_ARGS];</div><div class='del'>-	char *opts, *orig, *p;</div><div class='del'>-	int error = 0;</div><div class='del'>-	u64 subvolid;</div><div class='del'>-</div><div class='del'>-	if (!options)</div><div class='del'>-		return 0;</div><div class='add'>+	if (fs_info-&gt;sectorsize &lt; PAGE_SIZE) {</div><div class='add'>+		btrfs_clear_opt(fs_info-&gt;mount_opt, SPACE_CACHE);</div><div class='add'>+		if (!btrfs_test_opt(fs_info, FREE_SPACE_TREE)) {</div><div class='add'>+			btrfs_info(fs_info,</div><div class='add'>+				   "forcing free space tree for sector size %u with page size %lu",</div><div class='add'>+				   fs_info-&gt;sectorsize, PAGE_SIZE);</div><div class='add'>+			btrfs_set_opt(fs_info-&gt;mount_opt, FREE_SPACE_TREE);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * strsep changes the string, duplicate it because</div><div class='del'>-	 * btrfs_parse_device_options gets called later</div><div class='add'>+	 * At this point our mount options are populated, so we only mess with</div><div class='add'>+	 * these settings if we don't have any settings already.</div><div class='ctx'> 	 */</div><div class='del'>-	opts = kstrdup(options, GFP_KERNEL);</div><div class='del'>-	if (!opts)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	orig = opts;</div><div class='add'>+	if (btrfs_test_opt(fs_info, FREE_SPACE_TREE))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	while ((p = strsep(&amp;opts, ",")) != NULL) {</div><div class='del'>-		int token;</div><div class='del'>-		if (!*p)</div><div class='del'>-			continue;</div><div class='add'>+	if (btrfs_is_zoned(fs_info) &amp;&amp;</div><div class='add'>+	    btrfs_free_space_cache_v1_active(fs_info)) {</div><div class='add'>+		btrfs_info(fs_info, "zoned: clearing existing space cache");</div><div class='add'>+		btrfs_set_super_cache_generation(fs_info-&gt;super_copy, 0);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		token = match_token(p, tokens, args);</div><div class='del'>-		switch (token) {</div><div class='del'>-		case Opt_subvol:</div><div class='del'>-			kfree(*subvol_name);</div><div class='del'>-			*subvol_name = match_strdup(&amp;args[0]);</div><div class='del'>-			if (!*subvol_name) {</div><div class='del'>-				error = -ENOMEM;</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		case Opt_subvolid:</div><div class='del'>-			error = match_u64(&amp;args[0], &amp;subvolid);</div><div class='del'>-			if (error)</div><div class='del'>-				goto out;</div><div class='add'>+	if (btrfs_test_opt(fs_info, SPACE_CACHE))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-			/* we want the original fs_tree */</div><div class='del'>-			if (subvolid == 0)</div><div class='del'>-				subvolid = BTRFS_FS_TREE_OBJECTID;</div><div class='add'>+	if (btrfs_test_opt(fs_info, NOSPACECACHE))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-			*subvol_objectid = subvolid;</div><div class='del'>-			break;</div><div class='del'>-		default:</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	/*</div><div class='add'>+	 * At this point we don't have explicit options set by the user, set</div><div class='add'>+	 * them ourselves based on the state of the file system.</div><div class='add'>+	 */</div><div class='add'>+	if (btrfs_fs_compat_ro(fs_info, FREE_SPACE_TREE))</div><div class='add'>+		btrfs_set_opt(fs_info-&gt;mount_opt, FREE_SPACE_TREE);</div><div class='add'>+	else if (btrfs_free_space_cache_v1_active(fs_info))</div><div class='add'>+		btrfs_set_opt(fs_info-&gt;mount_opt, SPACE_CACHE);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	kfree(orig);</div><div class='del'>-	return error;</div><div class='add'>+static void set_device_specific_options(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	if (!btrfs_test_opt(fs_info, NOSSD) &amp;&amp;</div><div class='add'>+	    !fs_info-&gt;fs_devices-&gt;rotating)</div><div class='add'>+		btrfs_set_opt(fs_info-&gt;mount_opt, SSD);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * For devices supporting discard turn on discard=async automatically,</div><div class='add'>+	 * unless it's already set or disabled. This could be turned off by</div><div class='add'>+	 * nodiscard for the same mount.</div><div class='add'>+	 *</div><div class='add'>+	 * The zoned mode piggy backs on the discard functionality for</div><div class='add'>+	 * resetting a zone. There is no reason to delay the zone reset as it is</div><div class='add'>+	 * fast enough. So, do not enable async discard for zoned mode.</div><div class='add'>+	 */</div><div class='add'>+	if (!(btrfs_test_opt(fs_info, DISCARD_SYNC) ||</div><div class='add'>+	      btrfs_test_opt(fs_info, DISCARD_ASYNC) ||</div><div class='add'>+	      btrfs_test_opt(fs_info, NODISCARD)) &amp;&amp;</div><div class='add'>+	    fs_info-&gt;fs_devices-&gt;discardable &amp;&amp;</div><div class='add'>+	    !btrfs_is_zoned(fs_info))</div><div class='add'>+		btrfs_set_opt(fs_info-&gt;mount_opt, DISCARD_ASYNC);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> char *btrfs_get_subvol_name_from_objectid(struct btrfs_fs_info *fs_info,</div><div class='hunk'>@@ -1172,17 +807,15 @@ char *btrfs_get_subvol_name_from_objectid(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	struct btrfs_root_ref *root_ref;</div><div class='ctx'> 	struct btrfs_inode_ref *inode_ref;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='del'>-	struct btrfs_path *path = NULL;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	char *name = NULL, *ptr;</div><div class='ctx'> 	u64 dirid;</div><div class='ctx'> 	int len;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='del'>-	if (!path) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto err;</div><div class='del'>-	}</div><div class='add'>+	if (!path)</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='ctx'> 	name = kmalloc(PATH_MAX, GFP_KERNEL);</div><div class='ctx'> 	if (!name) {</div><div class='hunk'>@@ -1270,7 +903,6 @@ char *btrfs_get_subvol_name_from_objectid(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		fs_root = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	if (ptr == name + PATH_MAX - 1) {</div><div class='ctx'> 		name[0] = '/';</div><div class='ctx'> 		name[1] = '\0';</div><div class='hunk'>@@ -1281,7 +913,6 @@ char *btrfs_get_subvol_name_from_objectid(struct btrfs_fs_info *fs_info,</div><div class='ctx'> </div><div class='ctx'> err:</div><div class='ctx'> 	btrfs_put_root(fs_root);</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	kfree(name);</div><div class='ctx'> 	return ERR_PTR(ret);</div><div class='ctx'> }</div><div class='hunk'>@@ -1290,8 +921,9 @@ static int get_default_subvol_objectid(struct btrfs_fs_info *fs_info, u64 *objec</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root = fs_info-&gt;tree_root;</div><div class='ctx'> 	struct btrfs_dir_item *di;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key location;</div><div class='add'>+	struct fscrypt_str name = FSTR_INIT("default", 7);</div><div class='ctx'> 	u64 dir_id;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='hunk'>@@ -1304,9 +936,8 @@ static int get_default_subvol_objectid(struct btrfs_fs_info *fs_info, u64 *objec</div><div class='ctx'> 	 * to mount.</div><div class='ctx'> 	 */</div><div class='ctx'> 	dir_id = btrfs_super_root_dir(fs_info-&gt;super_copy);</div><div class='del'>-	di = btrfs_lookup_dir_item(NULL, root, path, dir_id, "default", 7, 0);</div><div class='add'>+	di = btrfs_lookup_dir_item(NULL, root, path, dir_id, &amp;name, 0);</div><div class='ctx'> 	if (IS_ERR(di)) {</div><div class='del'>-		btrfs_free_path(path);</div><div class='ctx'> 		return PTR_ERR(di);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!di) {</div><div class='hunk'>@@ -1315,72 +946,67 @@ static int get_default_subvol_objectid(struct btrfs_fs_info *fs_info, u64 *objec</div><div class='ctx'> 		 * it's always been there, but don't freak out, just try and</div><div class='ctx'> 		 * mount the top-level subvolume.</div><div class='ctx'> 		 */</div><div class='del'>-		btrfs_free_path(path);</div><div class='ctx'> 		*objectid = BTRFS_FS_TREE_OBJECTID;</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	btrfs_dir_item_key_to_cpu(path-&gt;nodes[0], di, &amp;location);</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	*objectid = location.objectid;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int btrfs_fill_super(struct super_block *sb,</div><div class='del'>-			    struct btrfs_fs_devices *fs_devices,</div><div class='del'>-			    void *data)</div><div class='add'>+			    struct btrfs_fs_devices *fs_devices)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode;</div><div class='add'>+	struct btrfs_inode *inode;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = btrfs_sb(sb);</div><div class='del'>-	int err;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	sb-&gt;s_maxbytes = MAX_LFS_FILESIZE;</div><div class='ctx'> 	sb-&gt;s_magic = BTRFS_SUPER_MAGIC;</div><div class='ctx'> 	sb-&gt;s_op = &amp;btrfs_super_ops;</div><div class='del'>-	sb-&gt;s_d_op = &amp;btrfs_dentry_operations;</div><div class='add'>+	set_default_d_op(sb, &amp;btrfs_dentry_operations);</div><div class='ctx'> 	sb-&gt;s_export_op = &amp;btrfs_export_ops;</div><div class='ctx'> #ifdef CONFIG_FS_VERITY</div><div class='ctx'> 	sb-&gt;s_vop = &amp;btrfs_verityops;</div><div class='ctx'> #endif</div><div class='ctx'> 	sb-&gt;s_xattr = btrfs_xattr_handlers;</div><div class='ctx'> 	sb-&gt;s_time_gran = 1;</div><div class='del'>-#ifdef CONFIG_BTRFS_FS_POSIX_ACL</div><div class='del'>-	sb-&gt;s_flags |= SB_POSIXACL;</div><div class='del'>-#endif</div><div class='del'>-	sb-&gt;s_flags |= SB_I_VERSION;</div><div class='del'>-	sb-&gt;s_iflags |= SB_I_CGROUPWB;</div><div class='add'>+	sb-&gt;s_iflags |= SB_I_CGROUPWB | SB_I_ALLOW_HSM;</div><div class='ctx'> </div><div class='del'>-	err = super_setup_bdi(sb);</div><div class='del'>-	if (err) {</div><div class='add'>+	ret = super_setup_bdi(sb);</div><div class='add'>+	if (ret) {</div><div class='ctx'> 		btrfs_err(fs_info, "super_setup_bdi failed");</div><div class='del'>-		return err;</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = open_ctree(sb, fs_devices, (char *)data);</div><div class='del'>-	if (err) {</div><div class='del'>-		btrfs_err(fs_info, "open_ctree failed");</div><div class='del'>-		return err;</div><div class='add'>+	ret = open_ctree(sb, fs_devices);</div><div class='add'>+	if (ret) {</div><div class='add'>+		btrfs_err(fs_info, "open_ctree failed: %d", ret);</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	inode = btrfs_iget(sb, BTRFS_FIRST_FREE_OBJECTID, fs_info-&gt;fs_root);</div><div class='add'>+	btrfs_emit_options(fs_info, NULL);</div><div class='add'>+</div><div class='add'>+	inode = btrfs_iget(BTRFS_FIRST_FREE_OBJECTID, fs_info-&gt;fs_root);</div><div class='ctx'> 	if (IS_ERR(inode)) {</div><div class='del'>-		err = PTR_ERR(inode);</div><div class='add'>+		ret = PTR_ERR(inode);</div><div class='add'>+		btrfs_handle_fs_error(fs_info, ret, NULL);</div><div class='ctx'> 		goto fail_close;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	sb-&gt;s_root = d_make_root(inode);</div><div class='add'>+	sb-&gt;s_root = d_make_root(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> 	if (!sb-&gt;s_root) {</div><div class='del'>-		err = -ENOMEM;</div><div class='add'>+		ret = -ENOMEM;</div><div class='ctx'> 		goto fail_close;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	cleancache_init_fs(sb);</div><div class='ctx'> 	sb-&gt;s_flags |= SB_ACTIVE;</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> fail_close:</div><div class='ctx'> 	close_ctree(fs_info);</div><div class='del'>-	return err;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_sync_fs(struct super_block *sb, int wait)</div><div class='hunk'>@@ -1396,7 +1022,7 @@ int btrfs_sync_fs(struct super_block *sb, int wait)</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_wait_ordered_roots(fs_info, U64_MAX, 0, (u64)-1);</div><div class='add'>+	btrfs_wait_ordered_roots(fs_info, U64_MAX, NULL);</div><div class='ctx'> </div><div class='ctx'> 	trans = btrfs_attach_transaction_barrier(root);</div><div class='ctx'> 	if (IS_ERR(trans)) {</div><div class='hunk'>@@ -1406,7 +1032,8 @@ int btrfs_sync_fs(struct super_block *sb, int wait)</div><div class='ctx'> 			 * Exit unless we have some pending changes</div><div class='ctx'> 			 * that need to go through commit</div><div class='ctx'> 			 */</div><div class='del'>-			if (fs_info-&gt;pending_changes == 0)</div><div class='add'>+			if (!test_bit(BTRFS_FS_NEED_TRANS_COMMIT,</div><div class='add'>+				      &amp;fs_info-&gt;flags))</div><div class='ctx'> 				return 0;</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * A non-blocking test if the fs is frozen. We must not</div><div class='hunk'>@@ -1458,7 +1085,7 @@ static int btrfs_show_options(struct seq_file *seq, struct dentry *dentry)</div><div class='ctx'> 			seq_printf(seq, ",compress-force=%s", compress_type);</div><div class='ctx'> 		else</div><div class='ctx'> 			seq_printf(seq, ",compress=%s", compress_type);</div><div class='del'>-		if (info-&gt;compress_level)</div><div class='add'>+		if (info-&gt;compress_level &amp;&amp; info-&gt;compress_type != BTRFS_COMPRESS_LZO)</div><div class='ctx'> 			seq_printf(seq, ":%d", info-&gt;compress_level);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (btrfs_test_opt(info, NOSSD))</div><div class='hunk'>@@ -1477,6 +1104,10 @@ static int btrfs_show_options(struct seq_file *seq, struct dentry *dentry)</div><div class='ctx'> 		print_rescue_option(seq, "ignorebadroots", &amp;printed);</div><div class='ctx'> 	if (btrfs_test_opt(info, IGNOREDATACSUMS))</div><div class='ctx'> 		print_rescue_option(seq, "ignoredatacsums", &amp;printed);</div><div class='add'>+	if (btrfs_test_opt(info, IGNOREMETACSUMS))</div><div class='add'>+		print_rescue_option(seq, "ignoremetacsums", &amp;printed);</div><div class='add'>+	if (btrfs_test_opt(info, IGNORESUPERFLAGS))</div><div class='add'>+		print_rescue_option(seq, "ignoresuperflags", &amp;printed);</div><div class='ctx'> 	if (btrfs_test_opt(info, FLUSHONCOMMIT))</div><div class='ctx'> 		seq_puts(seq, ",flushoncommit");</div><div class='ctx'> 	if (btrfs_test_opt(info, DISCARD_SYNC))</div><div class='hunk'>@@ -1503,15 +1134,6 @@ static int btrfs_show_options(struct seq_file *seq, struct dentry *dentry)</div><div class='ctx'> 		seq_puts(seq, ",autodefrag");</div><div class='ctx'> 	if (btrfs_test_opt(info, SKIP_BALANCE))</div><div class='ctx'> 		seq_puts(seq, ",skip_balance");</div><div class='del'>-#ifdef CONFIG_BTRFS_FS_CHECK_INTEGRITY</div><div class='del'>-	if (btrfs_test_opt(info, CHECK_INTEGRITY_DATA))</div><div class='del'>-		seq_puts(seq, ",check_int_data");</div><div class='del'>-	else if (btrfs_test_opt(info, CHECK_INTEGRITY))</div><div class='del'>-		seq_puts(seq, ",check_int");</div><div class='del'>-	if (info-&gt;check_integrity_print_mask)</div><div class='del'>-		seq_printf(seq, ",check_int_print_mask=%d",</div><div class='del'>-				info-&gt;check_integrity_print_mask);</div><div class='del'>-#endif</div><div class='ctx'> 	if (info-&gt;metadata_ratio)</div><div class='ctx'> 		seq_printf(seq, ",metadata_ratio=%u", info-&gt;metadata_ratio);</div><div class='ctx'> 	if (btrfs_test_opt(info, PANIC_ON_FATAL_ERROR))</div><div class='hunk'>@@ -1526,42 +1148,26 @@ static int btrfs_show_options(struct seq_file *seq, struct dentry *dentry)</div><div class='ctx'> #endif</div><div class='ctx'> 	if (btrfs_test_opt(info, REF_VERIFY))</div><div class='ctx'> 		seq_puts(seq, ",ref_verify");</div><div class='del'>-	seq_printf(seq, ",subvolid=%llu",</div><div class='del'>-		  BTRFS_I(d_inode(dentry))-&gt;root-&gt;root_key.objectid);</div><div class='add'>+	if (btrfs_test_opt(info, REF_TRACKER))</div><div class='add'>+		seq_puts(seq, ",ref_tracker");</div><div class='add'>+	seq_printf(seq, ",subvolid=%llu", btrfs_root_id(BTRFS_I(d_inode(dentry))-&gt;root));</div><div class='ctx'> 	subvol_name = btrfs_get_subvol_name_from_objectid(info,</div><div class='del'>-			BTRFS_I(d_inode(dentry))-&gt;root-&gt;root_key.objectid);</div><div class='add'>+			btrfs_root_id(BTRFS_I(d_inode(dentry))-&gt;root));</div><div class='ctx'> 	if (!IS_ERR(subvol_name)) {</div><div class='del'>-		seq_puts(seq, ",subvol=");</div><div class='del'>-		seq_escape(seq, subvol_name, " \t\n\\");</div><div class='add'>+		seq_show_option(seq, "subvol", subvol_name);</div><div class='ctx'> 		kfree(subvol_name);</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btrfs_test_super(struct super_block *s, void *data)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *p = data;</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(s);</div><div class='del'>-</div><div class='del'>-	return fs_info-&gt;fs_devices == p-&gt;fs_devices;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int btrfs_set_super(struct super_block *s, void *data)</div><div class='del'>-{</div><div class='del'>-	int err = set_anon_super(s, data);</div><div class='del'>-	if (!err)</div><div class='del'>-		s-&gt;s_fs_info = data;</div><div class='del'>-	return err;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * subvolumes are identified by ino 256</div><div class='ctx'>  */</div><div class='del'>-static inline int is_subvolume_inode(struct inode *inode)</div><div class='add'>+static inline bool is_subvolume_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	if (inode &amp;&amp; inode-&gt;i_ino == BTRFS_FIRST_FREE_OBJECTID)</div><div class='del'>-		return 1;</div><div class='del'>-	return 0;</div><div class='add'>+		return true;</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct dentry *mount_subvol(const char *subvol_name, u64 subvol_objectid,</div><div class='hunk'>@@ -1597,7 +1203,7 @@ static struct dentry *mount_subvol(const char *subvol_name, u64 subvol_objectid,</div><div class='ctx'> 		struct super_block *s = root-&gt;d_sb;</div><div class='ctx'> 		struct btrfs_fs_info *fs_info = btrfs_sb(s);</div><div class='ctx'> 		struct inode *root_inode = d_inode(root);</div><div class='del'>-		u64 root_objectid = BTRFS_I(root_inode)-&gt;root-&gt;root_key.objectid;</div><div class='add'>+		u64 root_objectid = btrfs_root_id(BTRFS_I(root_inode)-&gt;root);</div><div class='ctx'> </div><div class='ctx'> 		ret = 0;</div><div class='ctx'> 		if (!is_subvolume_inode(root_inode)) {</div><div class='hunk'>@@ -1629,198 +1235,6 @@ out:</div><div class='ctx'> 	return root;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Find a superblock for the given device / mount point.</div><div class='del'>- *</div><div class='del'>- * Note: This is based on mount_bdev from fs/super.c with a few additions</div><div class='del'>- *       for multiple device setup.  Make sure to keep it in sync.</div><div class='del'>- */</div><div class='del'>-static struct dentry *btrfs_mount_root(struct file_system_type *fs_type,</div><div class='del'>-		int flags, const char *device_name, void *data)</div><div class='del'>-{</div><div class='del'>-	struct block_device *bdev = NULL;</div><div class='del'>-	struct super_block *s;</div><div class='del'>-	struct btrfs_device *device = NULL;</div><div class='del'>-	struct btrfs_fs_devices *fs_devices = NULL;</div><div class='del'>-	struct btrfs_fs_info *fs_info = NULL;</div><div class='del'>-	void *new_sec_opts = NULL;</div><div class='del'>-	fmode_t mode = FMODE_READ;</div><div class='del'>-	int error = 0;</div><div class='del'>-</div><div class='del'>-	if (!(flags &amp; SB_RDONLY))</div><div class='del'>-		mode |= FMODE_WRITE;</div><div class='del'>-</div><div class='del'>-	if (data) {</div><div class='del'>-		error = security_sb_eat_lsm_opts(data, &amp;new_sec_opts);</div><div class='del'>-		if (error)</div><div class='del'>-			return ERR_PTR(error);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Setup a dummy root and fs_info for test/set super.  This is because</div><div class='del'>-	 * we don't actually fill this stuff out until open_ctree, but we need</div><div class='del'>-	 * then open_ctree will properly initialize the file system specific</div><div class='del'>-	 * settings later.  btrfs_init_fs_info initializes the static elements</div><div class='del'>-	 * of the fs_info (locks and such) to make cleanup easier if we find a</div><div class='del'>-	 * superblock with our given fs_devices later on at sget() time.</div><div class='del'>-	 */</div><div class='del'>-	fs_info = kvzalloc(sizeof(struct btrfs_fs_info), GFP_KERNEL);</div><div class='del'>-	if (!fs_info) {</div><div class='del'>-		error = -ENOMEM;</div><div class='del'>-		goto error_sec_opts;</div><div class='del'>-	}</div><div class='del'>-	btrfs_init_fs_info(fs_info);</div><div class='del'>-</div><div class='del'>-	fs_info-&gt;super_copy = kzalloc(BTRFS_SUPER_INFO_SIZE, GFP_KERNEL);</div><div class='del'>-	fs_info-&gt;super_for_commit = kzalloc(BTRFS_SUPER_INFO_SIZE, GFP_KERNEL);</div><div class='del'>-	if (!fs_info-&gt;super_copy || !fs_info-&gt;super_for_commit) {</div><div class='del'>-		error = -ENOMEM;</div><div class='del'>-		goto error_fs_info;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;uuid_mutex);</div><div class='del'>-	error = btrfs_parse_device_options(data, mode, fs_type);</div><div class='del'>-	if (error) {</div><div class='del'>-		mutex_unlock(&amp;uuid_mutex);</div><div class='del'>-		goto error_fs_info;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	device = btrfs_scan_one_device(device_name, mode, fs_type);</div><div class='del'>-	if (IS_ERR(device)) {</div><div class='del'>-		mutex_unlock(&amp;uuid_mutex);</div><div class='del'>-		error = PTR_ERR(device);</div><div class='del'>-		goto error_fs_info;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	fs_devices = device-&gt;fs_devices;</div><div class='del'>-	fs_info-&gt;fs_devices = fs_devices;</div><div class='del'>-</div><div class='del'>-	error = btrfs_open_devices(fs_devices, mode, fs_type);</div><div class='del'>-	mutex_unlock(&amp;uuid_mutex);</div><div class='del'>-	if (error)</div><div class='del'>-		goto error_fs_info;</div><div class='del'>-</div><div class='del'>-	if (!(flags &amp; SB_RDONLY) &amp;&amp; fs_devices-&gt;rw_devices == 0) {</div><div class='del'>-		error = -EACCES;</div><div class='del'>-		goto error_close_devices;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	bdev = fs_devices-&gt;latest_dev-&gt;bdev;</div><div class='del'>-	s = sget(fs_type, btrfs_test_super, btrfs_set_super, flags | SB_NOSEC,</div><div class='del'>-		 fs_info);</div><div class='del'>-	if (IS_ERR(s)) {</div><div class='del'>-		error = PTR_ERR(s);</div><div class='del'>-		goto error_close_devices;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (s-&gt;s_root) {</div><div class='del'>-		btrfs_close_devices(fs_devices);</div><div class='del'>-		btrfs_free_fs_info(fs_info);</div><div class='del'>-		if ((flags ^ s-&gt;s_flags) &amp; SB_RDONLY)</div><div class='del'>-			error = -EBUSY;</div><div class='del'>-	} else {</div><div class='del'>-		snprintf(s-&gt;s_id, sizeof(s-&gt;s_id), "%pg", bdev);</div><div class='del'>-		btrfs_sb(s)-&gt;bdev_holder = fs_type;</div><div class='del'>-		if (!strstr(crc32c_impl(), "generic"))</div><div class='del'>-			set_bit(BTRFS_FS_CSUM_IMPL_FAST, &amp;fs_info-&gt;flags);</div><div class='del'>-		error = btrfs_fill_super(s, fs_devices, data);</div><div class='del'>-	}</div><div class='del'>-	if (!error)</div><div class='del'>-		error = security_sb_set_mnt_opts(s, new_sec_opts, 0, NULL);</div><div class='del'>-	security_free_mnt_opts(&amp;new_sec_opts);</div><div class='del'>-	if (error) {</div><div class='del'>-		deactivate_locked_super(s);</div><div class='del'>-		return ERR_PTR(error);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return dget(s-&gt;s_root);</div><div class='del'>-</div><div class='del'>-error_close_devices:</div><div class='del'>-	btrfs_close_devices(fs_devices);</div><div class='del'>-error_fs_info:</div><div class='del'>-	btrfs_free_fs_info(fs_info);</div><div class='del'>-error_sec_opts:</div><div class='del'>-	security_free_mnt_opts(&amp;new_sec_opts);</div><div class='del'>-	return ERR_PTR(error);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Mount function which is called by VFS layer.</div><div class='del'>- *</div><div class='del'>- * In order to allow mounting a subvolume directly, btrfs uses mount_subtree()</div><div class='del'>- * which needs vfsmount* of device's root (/).  This means device's root has to</div><div class='del'>- * be mounted internally in any case.</div><div class='del'>- *</div><div class='del'>- * Operation flow:</div><div class='del'>- *   1. Parse subvol id related options for later use in mount_subvol().</div><div class='del'>- *</div><div class='del'>- *   2. Mount device's root (/) by calling vfs_kern_mount().</div><div class='del'>- *</div><div class='del'>- *      NOTE: vfs_kern_mount() is used by VFS to call btrfs_mount() in the</div><div class='del'>- *      first place. In order to avoid calling btrfs_mount() again, we use</div><div class='del'>- *      different file_system_type which is not registered to VFS by</div><div class='del'>- *      register_filesystem() (btrfs_root_fs_type). As a result,</div><div class='del'>- *      btrfs_mount_root() is called. The return value will be used by</div><div class='del'>- *      mount_subtree() in mount_subvol().</div><div class='del'>- *</div><div class='del'>- *   3. Call mount_subvol() to get the dentry of subvolume. Since there is</div><div class='del'>- *      "btrfs subvolume set-default", mount_subvol() is called always.</div><div class='del'>- */</div><div class='del'>-static struct dentry *btrfs_mount(struct file_system_type *fs_type, int flags,</div><div class='del'>-		const char *device_name, void *data)</div><div class='del'>-{</div><div class='del'>-	struct vfsmount *mnt_root;</div><div class='del'>-	struct dentry *root;</div><div class='del'>-	char *subvol_name = NULL;</div><div class='del'>-	u64 subvol_objectid = 0;</div><div class='del'>-	int error = 0;</div><div class='del'>-</div><div class='del'>-	error = btrfs_parse_subvol_options(data, &amp;subvol_name,</div><div class='del'>-					&amp;subvol_objectid);</div><div class='del'>-	if (error) {</div><div class='del'>-		kfree(subvol_name);</div><div class='del'>-		return ERR_PTR(error);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* mount device's root (/) */</div><div class='del'>-	mnt_root = vfs_kern_mount(&amp;btrfs_root_fs_type, flags, device_name, data);</div><div class='del'>-	if (PTR_ERR_OR_ZERO(mnt_root) == -EBUSY) {</div><div class='del'>-		if (flags &amp; SB_RDONLY) {</div><div class='del'>-			mnt_root = vfs_kern_mount(&amp;btrfs_root_fs_type,</div><div class='del'>-				flags &amp; ~SB_RDONLY, device_name, data);</div><div class='del'>-		} else {</div><div class='del'>-			mnt_root = vfs_kern_mount(&amp;btrfs_root_fs_type,</div><div class='del'>-				flags | SB_RDONLY, device_name, data);</div><div class='del'>-			if (IS_ERR(mnt_root)) {</div><div class='del'>-				root = ERR_CAST(mnt_root);</div><div class='del'>-				kfree(subvol_name);</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			down_write(&amp;mnt_root-&gt;mnt_sb-&gt;s_umount);</div><div class='del'>-			error = btrfs_remount(mnt_root-&gt;mnt_sb, &amp;flags, NULL);</div><div class='del'>-			up_write(&amp;mnt_root-&gt;mnt_sb-&gt;s_umount);</div><div class='del'>-			if (error &lt; 0) {</div><div class='del'>-				root = ERR_PTR(error);</div><div class='del'>-				mntput(mnt_root);</div><div class='del'>-				kfree(subvol_name);</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	if (IS_ERR(mnt_root)) {</div><div class='del'>-		root = ERR_CAST(mnt_root);</div><div class='del'>-		kfree(subvol_name);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* mount_subvol() will free subvol_name and mnt_root */</div><div class='del'>-	root = mount_subvol(subvol_name, subvol_objectid, mnt_root);</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	return root;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static void btrfs_resize_thread_pool(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				     u32 new_pool_size, u32 old_pool_size)</div><div class='ctx'> {</div><div class='hunk'>@@ -1835,20 +1249,15 @@ static void btrfs_resize_thread_pool(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	btrfs_workqueue_set_max(fs_info-&gt;workers, new_pool_size);</div><div class='ctx'> 	btrfs_workqueue_set_max(fs_info-&gt;delalloc_workers, new_pool_size);</div><div class='ctx'> 	btrfs_workqueue_set_max(fs_info-&gt;caching_workers, new_pool_size);</div><div class='del'>-	btrfs_workqueue_set_max(fs_info-&gt;endio_workers, new_pool_size);</div><div class='del'>-	btrfs_workqueue_set_max(fs_info-&gt;endio_meta_workers, new_pool_size);</div><div class='del'>-	btrfs_workqueue_set_max(fs_info-&gt;endio_meta_write_workers,</div><div class='del'>-				new_pool_size);</div><div class='add'>+	workqueue_set_max_active(fs_info-&gt;endio_workers, new_pool_size);</div><div class='add'>+	workqueue_set_max_active(fs_info-&gt;endio_meta_workers, new_pool_size);</div><div class='ctx'> 	btrfs_workqueue_set_max(fs_info-&gt;endio_write_workers, new_pool_size);</div><div class='ctx'> 	btrfs_workqueue_set_max(fs_info-&gt;endio_freespace_worker, new_pool_size);</div><div class='ctx'> 	btrfs_workqueue_set_max(fs_info-&gt;delayed_workers, new_pool_size);</div><div class='del'>-	btrfs_workqueue_set_max(fs_info-&gt;readahead_workers, new_pool_size);</div><div class='del'>-	btrfs_workqueue_set_max(fs_info-&gt;scrub_wr_completion_workers,</div><div class='del'>-				new_pool_size);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void btrfs_remount_begin(struct btrfs_fs_info *fs_info,</div><div class='del'>-				       unsigned long old_opts, int flags)</div><div class='add'>+				       unsigned long long old_opts, int flags)</div><div class='ctx'> {</div><div class='ctx'> 	if (btrfs_raw_test_opt(old_opts, AUTO_DEFRAG) &amp;&amp;</div><div class='ctx'> 	    (!btrfs_raw_test_opt(fs_info-&gt;mount_opt, AUTO_DEFRAG) ||</div><div class='hunk'>@@ -1862,12 +1271,12 @@ static inline void btrfs_remount_begin(struct btrfs_fs_info *fs_info,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void btrfs_remount_cleanup(struct btrfs_fs_info *fs_info,</div><div class='del'>-					 unsigned long old_opts)</div><div class='add'>+					 unsigned long long old_opts)</div><div class='ctx'> {</div><div class='ctx'> 	const bool cache_opt = btrfs_test_opt(fs_info, SPACE_CACHE);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * We need to cleanup all defragable inodes if the autodefragment is</div><div class='add'>+	 * We need to cleanup all defraggable inodes if the autodefragment is</div><div class='ctx'> 	 * close or the filesystem is read only.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (btrfs_raw_test_opt(old_opts, AUTO_DEFRAG) &amp;&amp;</div><div class='hunk'>@@ -1888,192 +1297,284 @@ static inline void btrfs_remount_cleanup(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		btrfs_set_free_space_cache_v1_active(fs_info, cache_opt);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btrfs_remount(struct super_block *sb, int *flags, char *data)</div><div class='add'>+static int btrfs_remount_rw(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = btrfs_sb(sb);</div><div class='del'>-	unsigned old_flags = sb-&gt;s_flags;</div><div class='del'>-	unsigned long old_opts = fs_info-&gt;mount_opt;</div><div class='del'>-	unsigned long old_compress_type = fs_info-&gt;compress_type;</div><div class='del'>-	u64 old_max_inline = fs_info-&gt;max_inline;</div><div class='del'>-	u32 old_thread_pool_size = fs_info-&gt;thread_pool_size;</div><div class='del'>-	u32 old_metadata_ratio = fs_info-&gt;metadata_ratio;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	sync_filesystem(sb);</div><div class='del'>-	set_bit(BTRFS_FS_STATE_REMOUNTING, &amp;fs_info-&gt;fs_state);</div><div class='add'>+	if (BTRFS_FS_ERROR(fs_info)) {</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+			  "remounting read-write after error is not allowed");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (fs_info-&gt;fs_devices-&gt;rw_devices == 0)</div><div class='add'>+		return -EACCES;</div><div class='ctx'> </div><div class='del'>-	if (data) {</div><div class='del'>-		void *new_sec_opts = NULL;</div><div class='add'>+	if (!btrfs_check_rw_degradable(fs_info, NULL)) {</div><div class='add'>+		btrfs_warn(fs_info,</div><div class='add'>+			   "too many missing devices, writable remount is not allowed");</div><div class='add'>+		return -EACCES;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		ret = security_sb_eat_lsm_opts(data, &amp;new_sec_opts);</div><div class='del'>-		if (!ret)</div><div class='del'>-			ret = security_sb_remount(sb, new_sec_opts);</div><div class='del'>-		security_free_mnt_opts(&amp;new_sec_opts);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto restore;</div><div class='add'>+	if (btrfs_super_log_root(fs_info-&gt;super_copy) != 0) {</div><div class='add'>+		btrfs_warn(fs_info,</div><div class='add'>+			   "mount required to replay tree-log, cannot remount read-write");</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_parse_options(fs_info, data, *flags);</div><div class='add'>+	/*</div><div class='add'>+	 * NOTE: when remounting with a change that does writes, don't put it</div><div class='add'>+	 * anywhere above this point, as we are not sure to be safe to write</div><div class='add'>+	 * until we pass the above checks.</div><div class='add'>+	 */</div><div class='add'>+	ret = btrfs_start_pre_rw_mount(fs_info);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto restore;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	btrfs_remount_begin(fs_info, old_opts, *flags);</div><div class='del'>-	btrfs_resize_thread_pool(fs_info,</div><div class='del'>-		fs_info-&gt;thread_pool_size, old_thread_pool_size);</div><div class='add'>+	btrfs_clear_sb_rdonly(fs_info-&gt;sb);</div><div class='ctx'> </div><div class='del'>-	if ((bool)btrfs_test_opt(fs_info, FREE_SPACE_TREE) !=</div><div class='del'>-	    (bool)btrfs_fs_compat_ro(fs_info, FREE_SPACE_TREE) &amp;&amp;</div><div class='del'>-	    (!sb_rdonly(sb) || (*flags &amp; SB_RDONLY))) {</div><div class='del'>-		btrfs_warn(fs_info,</div><div class='del'>-		"remount supports changing free space tree only from ro to rw");</div><div class='del'>-		/* Make sure free space cache options match the state on disk */</div><div class='del'>-		if (btrfs_fs_compat_ro(fs_info, FREE_SPACE_TREE)) {</div><div class='del'>-			btrfs_set_opt(fs_info-&gt;mount_opt, FREE_SPACE_TREE);</div><div class='del'>-			btrfs_clear_opt(fs_info-&gt;mount_opt, SPACE_CACHE);</div><div class='del'>-		}</div><div class='del'>-		if (btrfs_free_space_cache_v1_active(fs_info)) {</div><div class='del'>-			btrfs_clear_opt(fs_info-&gt;mount_opt, FREE_SPACE_TREE);</div><div class='del'>-			btrfs_set_opt(fs_info-&gt;mount_opt, SPACE_CACHE);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	set_bit(BTRFS_FS_OPEN, &amp;fs_info-&gt;flags);</div><div class='ctx'> </div><div class='del'>-	if ((bool)(*flags &amp; SB_RDONLY) == sb_rdonly(sb))</div><div class='del'>-		goto out;</div><div class='add'>+	/*</div><div class='add'>+	 * If we've gone from readonly -&gt; read-write, we need to get our</div><div class='add'>+	 * sync/async discard lists in the right state.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_discard_resume(fs_info);</div><div class='ctx'> </div><div class='del'>-	if (*flags &amp; SB_RDONLY) {</div><div class='del'>-		/*</div><div class='del'>-		 * this also happens on 'umount -rf' or on shutdown, when</div><div class='del'>-		 * the filesystem is busy.</div><div class='del'>-		 */</div><div class='del'>-		cancel_work_sync(&amp;fs_info-&gt;async_reclaim_work);</div><div class='del'>-		cancel_work_sync(&amp;fs_info-&gt;async_data_reclaim_work);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		btrfs_discard_cleanup(fs_info);</div><div class='add'>+static int btrfs_remount_ro(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	/*</div><div class='add'>+	 * This also happens on 'umount -rf' or on shutdown, when the</div><div class='add'>+	 * filesystem is busy.</div><div class='add'>+	 */</div><div class='add'>+	cancel_work_sync(&amp;fs_info-&gt;async_reclaim_work);</div><div class='add'>+	cancel_work_sync(&amp;fs_info-&gt;async_data_reclaim_work);</div><div class='ctx'> </div><div class='del'>-		/* wait for the uuid_scan task to finish */</div><div class='del'>-		down(&amp;fs_info-&gt;uuid_tree_rescan_sem);</div><div class='del'>-		/* avoid complains from lockdep et al. */</div><div class='del'>-		up(&amp;fs_info-&gt;uuid_tree_rescan_sem);</div><div class='add'>+	btrfs_discard_cleanup(fs_info);</div><div class='ctx'> </div><div class='del'>-		btrfs_set_sb_rdonly(sb);</div><div class='add'>+	/* Wait for the uuid_scan task to finish */</div><div class='add'>+	down(&amp;fs_info-&gt;uuid_tree_rescan_sem);</div><div class='add'>+	/* Avoid complains from lockdep et al. */</div><div class='add'>+	up(&amp;fs_info-&gt;uuid_tree_rescan_sem);</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * Setting SB_RDONLY will put the cleaner thread to</div><div class='del'>-		 * sleep at the next loop if it's already active.</div><div class='del'>-		 * If it's already asleep, we'll leave unused block</div><div class='del'>-		 * groups on disk until we're mounted read-write again</div><div class='del'>-		 * unless we clean them up here.</div><div class='del'>-		 */</div><div class='del'>-		btrfs_delete_unused_bgs(fs_info);</div><div class='add'>+	btrfs_set_sb_rdonly(fs_info-&gt;sb);</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * The cleaner task could be already running before we set the</div><div class='del'>-		 * flag BTRFS_FS_STATE_RO (and SB_RDONLY in the superblock).</div><div class='del'>-		 * We must make sure that after we finish the remount, i.e. after</div><div class='del'>-		 * we call btrfs_commit_super(), the cleaner can no longer start</div><div class='del'>-		 * a transaction - either because it was dropping a dead root,</div><div class='del'>-		 * running delayed iputs or deleting an unused block group (the</div><div class='del'>-		 * cleaner picked a block group from the list of unused block</div><div class='del'>-		 * groups before we were able to in the previous call to</div><div class='del'>-		 * btrfs_delete_unused_bgs()).</div><div class='del'>-		 */</div><div class='del'>-		wait_on_bit(&amp;fs_info-&gt;flags, BTRFS_FS_CLEANER_RUNNING,</div><div class='del'>-			    TASK_UNINTERRUPTIBLE);</div><div class='add'>+	/*</div><div class='add'>+	 * Setting SB_RDONLY will put the cleaner thread to sleep at the next</div><div class='add'>+	 * loop if it's already active.  If it's already asleep, we'll leave</div><div class='add'>+	 * unused block groups on disk until we're mounted read-write again</div><div class='add'>+	 * unless we clean them up here.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_delete_unused_bgs(fs_info);</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * We've set the superblock to RO mode, so we might have made</div><div class='del'>-		 * the cleaner task sleep without running all pending delayed</div><div class='del'>-		 * iputs. Go through all the delayed iputs here, so that if an</div><div class='del'>-		 * unmount happens without remounting RW we don't end up at</div><div class='del'>-		 * finishing close_ctree() with a non-empty list of delayed</div><div class='del'>-		 * iputs.</div><div class='del'>-		 */</div><div class='del'>-		btrfs_run_delayed_iputs(fs_info);</div><div class='add'>+	/*</div><div class='add'>+	 * The cleaner task could be already running before we set the flag</div><div class='add'>+	 * BTRFS_FS_STATE_RO (and SB_RDONLY in the superblock).  We must make</div><div class='add'>+	 * sure that after we finish the remount, i.e. after we call</div><div class='add'>+	 * btrfs_commit_super(), the cleaner can no longer start a transaction</div><div class='add'>+	 * - either because it was dropping a dead root, running delayed iputs</div><div class='add'>+	 *   or deleting an unused block group (the cleaner picked a block</div><div class='add'>+	 *   group from the list of unused block groups before we were able to</div><div class='add'>+	 *   in the previous call to btrfs_delete_unused_bgs()).</div><div class='add'>+	 */</div><div class='add'>+	wait_on_bit(&amp;fs_info-&gt;flags, BTRFS_FS_CLEANER_RUNNING, TASK_UNINTERRUPTIBLE);</div><div class='ctx'> </div><div class='del'>-		btrfs_dev_replace_suspend_for_unmount(fs_info);</div><div class='del'>-		btrfs_scrub_cancel(fs_info);</div><div class='del'>-		btrfs_pause_balance(fs_info);</div><div class='add'>+	/*</div><div class='add'>+	 * We've set the superblock to RO mode, so we might have made the</div><div class='add'>+	 * cleaner task sleep without running all pending delayed iputs. Go</div><div class='add'>+	 * through all the delayed iputs here, so that if an unmount happens</div><div class='add'>+	 * without remounting RW we don't end up at finishing close_ctree()</div><div class='add'>+	 * with a non-empty list of delayed iputs.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_run_delayed_iputs(fs_info);</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * Pause the qgroup rescan worker if it is running. We don't want</div><div class='del'>-		 * it to be still running after we are in RO mode, as after that,</div><div class='del'>-		 * by the time we unmount, it might have left a transaction open,</div><div class='del'>-		 * so we would leak the transaction and/or crash.</div><div class='del'>-		 */</div><div class='del'>-		btrfs_qgroup_wait_for_completion(fs_info, false);</div><div class='add'>+	btrfs_dev_replace_suspend_for_unmount(fs_info);</div><div class='add'>+	btrfs_scrub_cancel(fs_info);</div><div class='add'>+	btrfs_pause_balance(fs_info);</div><div class='ctx'> </div><div class='del'>-		ret = btrfs_commit_super(fs_info);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto restore;</div><div class='del'>-	} else {</div><div class='del'>-		if (BTRFS_FS_ERROR(fs_info)) {</div><div class='del'>-			btrfs_err(fs_info,</div><div class='del'>-				"Remounting read-write after error is not allowed");</div><div class='del'>-			ret = -EINVAL;</div><div class='del'>-			goto restore;</div><div class='del'>-		}</div><div class='del'>-		if (fs_info-&gt;fs_devices-&gt;rw_devices == 0) {</div><div class='del'>-			ret = -EACCES;</div><div class='del'>-			goto restore;</div><div class='del'>-		}</div><div class='add'>+	/*</div><div class='add'>+	 * Pause the qgroup rescan worker if it is running. We don't want it to</div><div class='add'>+	 * be still running after we are in RO mode, as after that, by the time</div><div class='add'>+	 * we unmount, it might have left a transaction open, so we would leak</div><div class='add'>+	 * the transaction and/or crash.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_qgroup_wait_for_completion(fs_info, false);</div><div class='ctx'> </div><div class='del'>-		if (!btrfs_check_rw_degradable(fs_info, NULL)) {</div><div class='del'>-			btrfs_warn(fs_info,</div><div class='del'>-		"too many missing devices, writable remount is not allowed");</div><div class='del'>-			ret = -EACCES;</div><div class='del'>-			goto restore;</div><div class='del'>-		}</div><div class='add'>+	return btrfs_commit_super(fs_info);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		if (btrfs_super_log_root(fs_info-&gt;super_copy) != 0) {</div><div class='del'>-			btrfs_warn(fs_info,</div><div class='del'>-		"mount required to replay tree-log, cannot remount read-write");</div><div class='del'>-			ret = -EINVAL;</div><div class='del'>-			goto restore;</div><div class='del'>-		}</div><div class='add'>+static void btrfs_ctx_to_info(struct btrfs_fs_info *fs_info, struct btrfs_fs_context *ctx)</div><div class='add'>+{</div><div class='add'>+	fs_info-&gt;max_inline = ctx-&gt;max_inline;</div><div class='add'>+	fs_info-&gt;commit_interval = ctx-&gt;commit_interval;</div><div class='add'>+	fs_info-&gt;metadata_ratio = ctx-&gt;metadata_ratio;</div><div class='add'>+	fs_info-&gt;thread_pool_size = ctx-&gt;thread_pool_size;</div><div class='add'>+	fs_info-&gt;mount_opt = ctx-&gt;mount_opt;</div><div class='add'>+	fs_info-&gt;compress_type = ctx-&gt;compress_type;</div><div class='add'>+	fs_info-&gt;compress_level = ctx-&gt;compress_level;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * NOTE: when remounting with a change that does writes, don't</div><div class='del'>-		 * put it anywhere above this point, as we are not sure to be</div><div class='del'>-		 * safe to write until we pass the above checks.</div><div class='del'>-		 */</div><div class='del'>-		ret = btrfs_start_pre_rw_mount(fs_info);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto restore;</div><div class='add'>+static void btrfs_info_to_ctx(struct btrfs_fs_info *fs_info, struct btrfs_fs_context *ctx)</div><div class='add'>+{</div><div class='add'>+	ctx-&gt;max_inline = fs_info-&gt;max_inline;</div><div class='add'>+	ctx-&gt;commit_interval = fs_info-&gt;commit_interval;</div><div class='add'>+	ctx-&gt;metadata_ratio = fs_info-&gt;metadata_ratio;</div><div class='add'>+	ctx-&gt;thread_pool_size = fs_info-&gt;thread_pool_size;</div><div class='add'>+	ctx-&gt;mount_opt = fs_info-&gt;mount_opt;</div><div class='add'>+	ctx-&gt;compress_type = fs_info-&gt;compress_type;</div><div class='add'>+	ctx-&gt;compress_level = fs_info-&gt;compress_level;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define btrfs_info_if_set(fs_info, old_ctx, opt, fmt, args...)			\</div><div class='add'>+do {										\</div><div class='add'>+	if ((!old_ctx || !btrfs_raw_test_opt(old_ctx-&gt;mount_opt, opt)) &amp;&amp;	\</div><div class='add'>+	    btrfs_raw_test_opt(fs_info-&gt;mount_opt, opt))			\</div><div class='add'>+		btrfs_info(fs_info, fmt, ##args);				\</div><div class='add'>+} while (0)</div><div class='add'>+</div><div class='add'>+#define btrfs_info_if_unset(fs_info, old_ctx, opt, fmt, args...)	\</div><div class='add'>+do {									\</div><div class='add'>+	if ((old_ctx &amp;&amp; btrfs_raw_test_opt(old_ctx-&gt;mount_opt, opt)) &amp;&amp;	\</div><div class='add'>+	    !btrfs_raw_test_opt(fs_info-&gt;mount_opt, opt))		\</div><div class='add'>+		btrfs_info(fs_info, fmt, ##args);			\</div><div class='add'>+} while (0)</div><div class='add'>+</div><div class='add'>+static void btrfs_emit_options(struct btrfs_fs_info *info,</div><div class='add'>+			       struct btrfs_fs_context *old)</div><div class='add'>+{</div><div class='add'>+	btrfs_info_if_set(info, old, NODATASUM, "setting nodatasum");</div><div class='add'>+	btrfs_info_if_set(info, old, DEGRADED, "allowing degraded mounts");</div><div class='add'>+	btrfs_info_if_set(info, old, NODATACOW, "setting nodatacow");</div><div class='add'>+	btrfs_info_if_set(info, old, SSD, "enabling ssd optimizations");</div><div class='add'>+	btrfs_info_if_set(info, old, SSD_SPREAD, "using spread ssd allocation scheme");</div><div class='add'>+	btrfs_info_if_set(info, old, NOBARRIER, "turning off barriers");</div><div class='add'>+	btrfs_info_if_set(info, old, NOTREELOG, "disabling tree log");</div><div class='add'>+	btrfs_info_if_set(info, old, NOLOGREPLAY, "disabling log replay at mount time");</div><div class='add'>+	btrfs_info_if_set(info, old, FLUSHONCOMMIT, "turning on flush-on-commit");</div><div class='add'>+	btrfs_info_if_set(info, old, DISCARD_SYNC, "turning on sync discard");</div><div class='add'>+	btrfs_info_if_set(info, old, DISCARD_ASYNC, "turning on async discard");</div><div class='add'>+	btrfs_info_if_set(info, old, FREE_SPACE_TREE, "enabling free space tree");</div><div class='add'>+	btrfs_info_if_set(info, old, SPACE_CACHE, "enabling disk space caching");</div><div class='add'>+	btrfs_info_if_set(info, old, CLEAR_CACHE, "force clearing of disk cache");</div><div class='add'>+	btrfs_info_if_set(info, old, AUTO_DEFRAG, "enabling auto defrag");</div><div class='add'>+	btrfs_info_if_set(info, old, FRAGMENT_DATA, "fragmenting data");</div><div class='add'>+	btrfs_info_if_set(info, old, FRAGMENT_METADATA, "fragmenting metadata");</div><div class='add'>+	btrfs_info_if_set(info, old, REF_VERIFY, "doing ref verification");</div><div class='add'>+	btrfs_info_if_set(info, old, USEBACKUPROOT, "trying to use backup root at mount time");</div><div class='add'>+	btrfs_info_if_set(info, old, IGNOREBADROOTS, "ignoring bad roots");</div><div class='add'>+	btrfs_info_if_set(info, old, IGNOREDATACSUMS, "ignoring data csums");</div><div class='add'>+	btrfs_info_if_set(info, old, IGNOREMETACSUMS, "ignoring meta csums");</div><div class='add'>+	btrfs_info_if_set(info, old, IGNORESUPERFLAGS, "ignoring unknown super block flags");</div><div class='add'>+</div><div class='add'>+	btrfs_info_if_unset(info, old, NODATASUM, "setting datasum");</div><div class='add'>+	btrfs_info_if_unset(info, old, NODATACOW, "setting datacow");</div><div class='add'>+	btrfs_info_if_unset(info, old, SSD, "not using ssd optimizations");</div><div class='add'>+	btrfs_info_if_unset(info, old, SSD_SPREAD, "not using spread ssd allocation scheme");</div><div class='add'>+	btrfs_info_if_unset(info, old, NOBARRIER, "turning on barriers");</div><div class='add'>+	btrfs_info_if_unset(info, old, NOTREELOG, "enabling tree log");</div><div class='add'>+	btrfs_info_if_unset(info, old, SPACE_CACHE, "disabling disk space caching");</div><div class='add'>+	btrfs_info_if_unset(info, old, FREE_SPACE_TREE, "disabling free space tree");</div><div class='add'>+	btrfs_info_if_unset(info, old, AUTO_DEFRAG, "disabling auto defrag");</div><div class='add'>+	btrfs_info_if_unset(info, old, COMPRESS, "use no compression");</div><div class='add'>+</div><div class='add'>+	/* Did the compression settings change? */</div><div class='add'>+	if (btrfs_test_opt(info, COMPRESS) &amp;&amp;</div><div class='add'>+	    (!old ||</div><div class='add'>+	     old-&gt;compress_type != info-&gt;compress_type ||</div><div class='add'>+	     old-&gt;compress_level != info-&gt;compress_level ||</div><div class='add'>+	     (!btrfs_raw_test_opt(old-&gt;mount_opt, FORCE_COMPRESS) &amp;&amp;</div><div class='add'>+	      btrfs_raw_test_opt(info-&gt;mount_opt, FORCE_COMPRESS)))) {</div><div class='add'>+		const char *compress_type = btrfs_compress_type2str(info-&gt;compress_type);</div><div class='add'>+</div><div class='add'>+		btrfs_info(info, "%s %s compression, level %d",</div><div class='add'>+			   btrfs_test_opt(info, FORCE_COMPRESS) ? "force" : "use",</div><div class='add'>+			   compress_type, info-&gt;compress_level);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (info-&gt;max_inline != BTRFS_DEFAULT_MAX_INLINE)</div><div class='add'>+		btrfs_info(info, "max_inline set to %llu", info-&gt;max_inline);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int btrfs_reconfigure(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = fc-&gt;root-&gt;d_sb;</div><div class='add'>+	struct btrfs_fs_info *fs_info = btrfs_sb(sb);</div><div class='add'>+	struct btrfs_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct btrfs_fs_context old_ctx;</div><div class='add'>+	int ret = 0;</div><div class='add'>+	bool mount_reconfigure = (fc-&gt;s_fs_info != NULL);</div><div class='add'>+</div><div class='add'>+	btrfs_info_to_ctx(fs_info, &amp;old_ctx);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This is our "bind mount" trick, we don't want to allow the user to do</div><div class='add'>+	 * anything other than mount a different ro/rw and a different subvol,</div><div class='add'>+	 * all of the mount options should be maintained.</div><div class='add'>+	 */</div><div class='add'>+	if (mount_reconfigure)</div><div class='add'>+		ctx-&gt;mount_opt = old_ctx.mount_opt;</div><div class='add'>+</div><div class='add'>+	sync_filesystem(sb);</div><div class='add'>+	set_bit(BTRFS_FS_STATE_REMOUNTING, &amp;fs_info-&gt;fs_state);</div><div class='add'>+</div><div class='add'>+	if (!btrfs_check_options(fs_info, &amp;ctx-&gt;mount_opt, fc-&gt;sb_flags))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_check_features(fs_info, !(fc-&gt;sb_flags &amp; SB_RDONLY));</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-		btrfs_clear_sb_rdonly(sb);</div><div class='add'>+	btrfs_ctx_to_info(fs_info, ctx);</div><div class='add'>+	btrfs_remount_begin(fs_info, old_ctx.mount_opt, fc-&gt;sb_flags);</div><div class='add'>+	btrfs_resize_thread_pool(fs_info, fs_info-&gt;thread_pool_size,</div><div class='add'>+				 old_ctx.thread_pool_size);</div><div class='ctx'> </div><div class='del'>-		set_bit(BTRFS_FS_OPEN, &amp;fs_info-&gt;flags);</div><div class='add'>+	if ((bool)btrfs_test_opt(fs_info, FREE_SPACE_TREE) !=</div><div class='add'>+	    (bool)btrfs_fs_compat_ro(fs_info, FREE_SPACE_TREE) &amp;&amp;</div><div class='add'>+	    (!sb_rdonly(sb) || (fc-&gt;sb_flags &amp; SB_RDONLY))) {</div><div class='add'>+		btrfs_warn(fs_info,</div><div class='add'>+		"remount supports changing free space tree only from RO to RW");</div><div class='add'>+		/* Make sure free space cache options match the state on disk. */</div><div class='add'>+		if (btrfs_fs_compat_ro(fs_info, FREE_SPACE_TREE)) {</div><div class='add'>+			btrfs_set_opt(fs_info-&gt;mount_opt, FREE_SPACE_TREE);</div><div class='add'>+			btrfs_clear_opt(fs_info-&gt;mount_opt, SPACE_CACHE);</div><div class='add'>+		}</div><div class='add'>+		if (btrfs_free_space_cache_v1_active(fs_info)) {</div><div class='add'>+			btrfs_clear_opt(fs_info-&gt;mount_opt, FREE_SPACE_TREE);</div><div class='add'>+			btrfs_set_opt(fs_info-&gt;mount_opt, SPACE_CACHE);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='del'>-out:</div><div class='add'>+</div><div class='add'>+	ret = 0;</div><div class='add'>+	if (!sb_rdonly(sb) &amp;&amp; (fc-&gt;sb_flags &amp; SB_RDONLY))</div><div class='add'>+		ret = btrfs_remount_ro(fs_info);</div><div class='add'>+	else if (sb_rdonly(sb) &amp;&amp; !(fc-&gt;sb_flags &amp; SB_RDONLY))</div><div class='add'>+		ret = btrfs_remount_rw(fs_info);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto restore;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='del'>-	 * We need to set SB_I_VERSION here otherwise it'll get cleared by VFS,</div><div class='del'>-	 * since the absence of the flag means it can be toggled off by remount.</div><div class='add'>+	 * If we set the mask during the parameter parsing VFS would reject the</div><div class='add'>+	 * remount.  Here we can set the mask and the value will be updated</div><div class='add'>+	 * appropriately.</div><div class='ctx'> 	 */</div><div class='del'>-	*flags |= SB_I_VERSION;</div><div class='add'>+	if ((fc-&gt;sb_flags &amp; SB_POSIXACL) != (sb-&gt;s_flags &amp; SB_POSIXACL))</div><div class='add'>+		fc-&gt;sb_flags_mask |= SB_POSIXACL;</div><div class='ctx'> </div><div class='add'>+	btrfs_emit_options(fs_info, &amp;old_ctx);</div><div class='ctx'> 	wake_up_process(fs_info-&gt;transaction_kthread);</div><div class='del'>-	btrfs_remount_cleanup(fs_info, old_opts);</div><div class='add'>+	btrfs_remount_cleanup(fs_info, old_ctx.mount_opt);</div><div class='ctx'> 	btrfs_clear_oneshot_options(fs_info);</div><div class='ctx'> 	clear_bit(BTRFS_FS_STATE_REMOUNTING, &amp;fs_info-&gt;fs_state);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='del'>-</div><div class='ctx'> restore:</div><div class='del'>-	/* We've hit an error - don't reset SB_RDONLY */</div><div class='del'>-	if (sb_rdonly(sb))</div><div class='del'>-		old_flags |= SB_RDONLY;</div><div class='del'>-	if (!(old_flags &amp; SB_RDONLY))</div><div class='del'>-		clear_bit(BTRFS_FS_STATE_RO, &amp;fs_info-&gt;fs_state);</div><div class='del'>-	sb-&gt;s_flags = old_flags;</div><div class='del'>-	fs_info-&gt;mount_opt = old_opts;</div><div class='del'>-	fs_info-&gt;compress_type = old_compress_type;</div><div class='del'>-	fs_info-&gt;max_inline = old_max_inline;</div><div class='del'>-	btrfs_resize_thread_pool(fs_info,</div><div class='del'>-		old_thread_pool_size, fs_info-&gt;thread_pool_size);</div><div class='del'>-	fs_info-&gt;metadata_ratio = old_metadata_ratio;</div><div class='del'>-	btrfs_remount_cleanup(fs_info, old_opts);</div><div class='add'>+	btrfs_ctx_to_info(fs_info, &amp;old_ctx);</div><div class='add'>+	btrfs_remount_cleanup(fs_info, old_ctx.mount_opt);</div><div class='ctx'> 	clear_bit(BTRFS_FS_STATE_REMOUNTING, &amp;fs_info-&gt;fs_state);</div><div class='del'>-</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2109,7 +1610,7 @@ static inline void btrfs_descending_sort_devices(</div><div class='ctx'> static inline int btrfs_calc_avail_data_space(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 					      u64 *free_bytes)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_device_info *devices_info;</div><div class='add'>+	struct btrfs_device_info AUTO_KFREE(devices_info);</div><div class='ctx'> 	struct btrfs_fs_devices *fs_devices = fs_info-&gt;fs_devices;</div><div class='ctx'> 	struct btrfs_device *device;</div><div class='ctx'> 	u64 type;</div><div class='hunk'>@@ -2145,12 +1646,8 @@ static inline int btrfs_calc_avail_data_space(struct btrfs_fs_info *fs_info,</div><div class='ctx'> </div><div class='ctx'> 	if (type &amp; BTRFS_BLOCK_GROUP_RAID0)</div><div class='ctx'> 		num_stripes = nr_devices;</div><div class='del'>-	else if (type &amp; BTRFS_BLOCK_GROUP_RAID1)</div><div class='del'>-		num_stripes = 2;</div><div class='del'>-	else if (type &amp; BTRFS_BLOCK_GROUP_RAID1C3)</div><div class='del'>-		num_stripes = 3;</div><div class='del'>-	else if (type &amp; BTRFS_BLOCK_GROUP_RAID1C4)</div><div class='del'>-		num_stripes = 4;</div><div class='add'>+	else if (type &amp; BTRFS_BLOCK_GROUP_RAID1_MASK)</div><div class='add'>+		num_stripes = rattr-&gt;ncopies;</div><div class='ctx'> 	else if (type &amp; BTRFS_BLOCK_GROUP_RAID10)</div><div class='ctx'> 		num_stripes = 4;</div><div class='ctx'> </div><div class='hunk'>@@ -2174,17 +1671,13 @@ static inline int btrfs_calc_avail_data_space(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		avail_space = rounddown(avail_space, BTRFS_STRIPE_LEN);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * In order to avoid overwriting the superblock on the drive,</div><div class='del'>-		 * btrfs starts at an offset of at least 1MB when doing chunk</div><div class='del'>-		 * allocation.</div><div class='del'>-		 *</div><div class='del'>-		 * This ensures we have at least min_stripe_size free space</div><div class='del'>-		 * after excluding 1MB.</div><div class='add'>+		 * Ensure we have at least min_stripe_size on top of the</div><div class='add'>+		 * reserved space on the device.</div><div class='ctx'> 		 */</div><div class='del'>-		if (avail_space &lt;= SZ_1M + min_stripe_size)</div><div class='add'>+		if (avail_space &lt;= BTRFS_DEVICE_RANGE_RESERVED + min_stripe_size)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		avail_space -= SZ_1M;</div><div class='add'>+		avail_space -= BTRFS_DEVICE_RANGE_RESERVED;</div><div class='ctx'> </div><div class='ctx'> 		devices_info[i].dev = device;</div><div class='ctx'> 		devices_info[i].max_avail = avail_space;</div><div class='hunk'>@@ -2215,7 +1708,6 @@ static inline int btrfs_calc_avail_data_space(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		nr_devices--;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	kfree(devices_info);</div><div class='ctx'> 	*free_bytes = avail_space;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -2265,7 +1757,7 @@ static int btrfs_statfs(struct dentry *dentry, struct kstatfs *buf)</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * Metadata in mixed block goup profiles are accounted in data</div><div class='add'>+		 * Metadata in mixed block group profiles are accounted in data</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (!mixed &amp;&amp; found-&gt;flags &amp; BTRFS_BLOCK_GROUP_METADATA) {</div><div class='ctx'> 			if (found-&gt;flags &amp; BTRFS_BLOCK_GROUP_DATA)</div><div class='hunk'>@@ -2321,11 +1813,11 @@ static int btrfs_statfs(struct dentry *dentry, struct kstatfs *buf)</div><div class='ctx'> 	 * calculated f_bavail.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (!mixed &amp;&amp; block_rsv-&gt;space_info-&gt;full &amp;&amp;</div><div class='del'>-	    total_free_meta - thresh &lt; block_rsv-&gt;size)</div><div class='add'>+	    (total_free_meta &lt; thresh || total_free_meta - thresh &lt; block_rsv-&gt;size))</div><div class='ctx'> 		buf-&gt;f_bavail = 0;</div><div class='ctx'> </div><div class='ctx'> 	buf-&gt;f_type = BTRFS_SUPER_MAGIC;</div><div class='del'>-	buf-&gt;f_bsize = dentry-&gt;d_sb-&gt;s_blocksize;</div><div class='add'>+	buf-&gt;f_bsize = fs_info-&gt;sectorsize;</div><div class='ctx'> 	buf-&gt;f_namelen = BTRFS_NAME_LEN;</div><div class='ctx'> </div><div class='ctx'> 	/* We treat it as constant endianness (it doesn't matter _which_)</div><div class='hunk'>@@ -2334,14 +1826,303 @@ static int btrfs_statfs(struct dentry *dentry, struct kstatfs *buf)</div><div class='ctx'> 	buf-&gt;f_fsid.val[0] = be32_to_cpu(fsid[0]) ^ be32_to_cpu(fsid[2]);</div><div class='ctx'> 	buf-&gt;f_fsid.val[1] = be32_to_cpu(fsid[1]) ^ be32_to_cpu(fsid[3]);</div><div class='ctx'> 	/* Mask in the root object ID too, to disambiguate subvols */</div><div class='del'>-	buf-&gt;f_fsid.val[0] ^=</div><div class='del'>-		BTRFS_I(d_inode(dentry))-&gt;root-&gt;root_key.objectid &gt;&gt; 32;</div><div class='del'>-	buf-&gt;f_fsid.val[1] ^=</div><div class='del'>-		BTRFS_I(d_inode(dentry))-&gt;root-&gt;root_key.objectid;</div><div class='add'>+	buf-&gt;f_fsid.val[0] ^= btrfs_root_id(BTRFS_I(d_inode(dentry))-&gt;root) &gt;&gt; 32;</div><div class='add'>+	buf-&gt;f_fsid.val[1] ^= btrfs_root_id(BTRFS_I(d_inode(dentry))-&gt;root);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int btrfs_fc_test_super(struct super_block *sb, struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *p = fc-&gt;s_fs_info;</div><div class='add'>+	struct btrfs_fs_info *fs_info = btrfs_sb(sb);</div><div class='add'>+</div><div class='add'>+	return fs_info-&gt;fs_devices == p-&gt;fs_devices;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int btrfs_get_tree_super(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = fc-&gt;s_fs_info;</div><div class='add'>+	struct btrfs_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct btrfs_fs_devices *fs_devices = NULL;</div><div class='add'>+	struct btrfs_device *device;</div><div class='add'>+	struct super_block *sb;</div><div class='add'>+	blk_mode_t mode = sb_open_mode(fc-&gt;sb_flags);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	btrfs_ctx_to_info(fs_info, ctx);</div><div class='add'>+	mutex_lock(&amp;uuid_mutex);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * With 'true' passed to btrfs_scan_one_device() (mount time) we expect</div><div class='add'>+	 * either a valid device or an error.</div><div class='add'>+	 */</div><div class='add'>+	device = btrfs_scan_one_device(fc-&gt;source, true);</div><div class='add'>+	ASSERT(device != NULL);</div><div class='add'>+	if (IS_ERR(device)) {</div><div class='add'>+		mutex_unlock(&amp;uuid_mutex);</div><div class='add'>+		return PTR_ERR(device);</div><div class='add'>+	}</div><div class='add'>+	fs_devices = device-&gt;fs_devices;</div><div class='add'>+	/*</div><div class='add'>+	 * We cannot hold uuid_mutex calling sget_fc(), it will lead to a</div><div class='add'>+	 * locking order reversal with s_umount.</div><div class='add'>+	 *</div><div class='add'>+	 * So here we increase the holding number of fs_devices, this will ensure</div><div class='add'>+	 * the fs_devices itself won't be freed.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_fs_devices_inc_holding(fs_devices);</div><div class='add'>+	fs_info-&gt;fs_devices = fs_devices;</div><div class='add'>+	mutex_unlock(&amp;uuid_mutex);</div><div class='add'>+</div><div class='add'>+</div><div class='add'>+	sb = sget_fc(fc, btrfs_fc_test_super, set_anon_super_fc);</div><div class='add'>+	if (IS_ERR(sb)) {</div><div class='add'>+		mutex_lock(&amp;uuid_mutex);</div><div class='add'>+		btrfs_fs_devices_dec_holding(fs_devices);</div><div class='add'>+		/*</div><div class='add'>+		 * Since the fs_devices is not opened, it can be freed at any</div><div class='add'>+		 * time after unlocking uuid_mutex.  We need to avoid double</div><div class='add'>+		 * free through put_fs_context()-&gt;btrfs_free_fs_info().</div><div class='add'>+		 * So here we reset fs_info-&gt;fs_devices to NULL, and let the</div><div class='add'>+		 * regular fs_devices reclaim path to handle it.</div><div class='add'>+		 *</div><div class='add'>+		 * This applies to all later branches where no fs_devices is</div><div class='add'>+		 * opened.</div><div class='add'>+		 */</div><div class='add'>+		fs_info-&gt;fs_devices = NULL;</div><div class='add'>+		mutex_unlock(&amp;uuid_mutex);</div><div class='add'>+		return PTR_ERR(sb);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (sb-&gt;s_root) {</div><div class='add'>+		/*</div><div class='add'>+		 * Not the first mount of the fs thus got an existing super block.</div><div class='add'>+		 * Will reuse the returned super block, fs_info and fs_devices.</div><div class='add'>+		 *</div><div class='add'>+		 * fc-&gt;s_fs_info is not touched and will be later freed by</div><div class='add'>+		 * put_fs_context() through btrfs_free_fs_context().</div><div class='add'>+		 */</div><div class='add'>+		ASSERT(fc-&gt;s_fs_info == fs_info);</div><div class='add'>+</div><div class='add'>+		mutex_lock(&amp;uuid_mutex);</div><div class='add'>+		btrfs_fs_devices_dec_holding(fs_devices);</div><div class='add'>+		fs_info-&gt;fs_devices = NULL;</div><div class='add'>+		mutex_unlock(&amp;uuid_mutex);</div><div class='add'>+		/*</div><div class='add'>+		 * At this stage we may have RO flag mismatch between</div><div class='add'>+		 * fc-&gt;sb_flags and sb-&gt;s_flags.  Caller should detect such</div><div class='add'>+		 * mismatch and reconfigure with sb-&gt;s_umount rwsem held if</div><div class='add'>+		 * needed.</div><div class='add'>+		 */</div><div class='add'>+	} else {</div><div class='add'>+		struct block_device *bdev;</div><div class='ctx'> </div><div class='add'>+		/*</div><div class='add'>+		 * The first mount of the fs thus a new superblock, fc-&gt;s_fs_info</div><div class='add'>+		 * must be NULL, and the ownership of our fs_info and fs_devices is</div><div class='add'>+		 * transferred to the super block.</div><div class='add'>+		 */</div><div class='add'>+		ASSERT(fc-&gt;s_fs_info == NULL);</div><div class='add'>+</div><div class='add'>+		mutex_lock(&amp;uuid_mutex);</div><div class='add'>+		btrfs_fs_devices_dec_holding(fs_devices);</div><div class='add'>+		ret = btrfs_open_devices(fs_devices, mode, sb);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			fs_info-&gt;fs_devices = NULL;</div><div class='add'>+		mutex_unlock(&amp;uuid_mutex);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			deactivate_locked_super(sb);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='add'>+		if (!(fc-&gt;sb_flags &amp; SB_RDONLY) &amp;&amp; fs_devices-&gt;rw_devices == 0) {</div><div class='add'>+			deactivate_locked_super(sb);</div><div class='add'>+			return -EACCES;</div><div class='add'>+		}</div><div class='add'>+		set_device_specific_options(fs_info);</div><div class='add'>+		bdev = fs_devices-&gt;latest_dev-&gt;bdev;</div><div class='add'>+		snprintf(sb-&gt;s_id, sizeof(sb-&gt;s_id), "%pg", bdev);</div><div class='add'>+		shrinker_debugfs_rename(sb-&gt;s_shrink, "sb-btrfs:%s", sb-&gt;s_id);</div><div class='add'>+		ret = btrfs_fill_super(sb, fs_devices);</div><div class='add'>+		if (ret) {</div><div class='add'>+			deactivate_locked_super(sb);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	btrfs_clear_oneshot_options(fs_info);</div><div class='add'>+</div><div class='add'>+	fc-&gt;root = dget(sb-&gt;s_root);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Ever since commit 0723a0473fb4 ("btrfs: allow mounting btrfs subvolumes</div><div class='add'>+ * with different ro/rw options") the following works:</div><div class='add'>+ *</div><div class='add'>+ *        (i) mount /dev/sda3 -o subvol=foo,ro /mnt/foo</div><div class='add'>+ *       (ii) mount /dev/sda3 -o subvol=bar,rw /mnt/bar</div><div class='add'>+ *</div><div class='add'>+ * which looks nice and innocent but is actually pretty intricate and deserves</div><div class='add'>+ * a long comment.</div><div class='add'>+ *</div><div class='add'>+ * On another filesystem a subvolume mount is close to something like:</div><div class='add'>+ *</div><div class='add'>+ *	(iii) # create rw superblock + initial mount</div><div class='add'>+ *	      mount -t xfs /dev/sdb /opt/</div><div class='add'>+ *</div><div class='add'>+ *	      # create ro bind mount</div><div class='add'>+ *	      mount --bind -o ro /opt/foo /mnt/foo</div><div class='add'>+ *</div><div class='add'>+ *	      # unmount initial mount</div><div class='add'>+ *	      umount /opt</div><div class='add'>+ *</div><div class='add'>+ * Of course, there's some special subvolume sauce and there's the fact that the</div><div class='add'>+ * sb-&gt;s_root dentry is really swapped after mount_subtree(). But conceptually</div><div class='add'>+ * it's very close and will help us understand the issue.</div><div class='add'>+ *</div><div class='add'>+ * The old mount API didn't cleanly distinguish between a mount being made ro</div><div class='add'>+ * and a superblock being made ro.  The only way to change the ro state of</div><div class='add'>+ * either object was by passing ms_rdonly. If a new mount was created via</div><div class='add'>+ * mount(2) such as:</div><div class='add'>+ *</div><div class='add'>+ *      mount("/dev/sdb", "/mnt", "xfs", ms_rdonly, null);</div><div class='add'>+ *</div><div class='add'>+ * the MS_RDONLY flag being specified had two effects:</div><div class='add'>+ *</div><div class='add'>+ * (1) MNT_READONLY was raised -&gt; the resulting mount got</div><div class='add'>+ *     @mnt-&gt;mnt_flags |= MNT_READONLY raised.</div><div class='add'>+ *</div><div class='add'>+ * (2) MS_RDONLY was passed to the filesystem's mount method and the filesystems</div><div class='add'>+ *     made the superblock ro. Note, how SB_RDONLY has the same value as</div><div class='add'>+ *     ms_rdonly and is raised whenever MS_RDONLY is passed through mount(2).</div><div class='add'>+ *</div><div class='add'>+ * Creating a subtree mount via (iii) ends up leaving a rw superblock with a</div><div class='add'>+ * subtree mounted ro.</div><div class='add'>+ *</div><div class='add'>+ * But consider the effect on the old mount API on btrfs subvolume mounting</div><div class='add'>+ * which combines the distinct step in (iii) into a single step.</div><div class='add'>+ *</div><div class='add'>+ * By issuing (i) both the mount and the superblock are turned ro. Now when (ii)</div><div class='add'>+ * is issued the superblock is ro and thus even if the mount created for (ii) is</div><div class='add'>+ * rw it wouldn't help. Hence, btrfs needed to transition the superblock from ro</div><div class='add'>+ * to rw for (ii) which it did using an internal remount call.</div><div class='add'>+ *</div><div class='add'>+ * IOW, subvolume mounting was inherently complicated due to the ambiguity of</div><div class='add'>+ * MS_RDONLY in mount(2). Note, this ambiguity has mount(8) always translate</div><div class='add'>+ * "ro" to MS_RDONLY. IOW, in both (i) and (ii) "ro" becomes MS_RDONLY when</div><div class='add'>+ * passed by mount(8) to mount(2).</div><div class='add'>+ *</div><div class='add'>+ * Enter the new mount API. The new mount API disambiguates making a mount ro</div><div class='add'>+ * and making a superblock ro.</div><div class='add'>+ *</div><div class='add'>+ * (3) To turn a mount ro the MOUNT_ATTR_ONLY flag can be used with either</div><div class='add'>+ *     fsmount() or mount_setattr() this is a pure VFS level change for a</div><div class='add'>+ *     specific mount or mount tree that is never seen by the filesystem itself.</div><div class='add'>+ *</div><div class='add'>+ * (4) To turn a superblock ro the "ro" flag must be used with</div><div class='add'>+ *     fsconfig(FSCONFIG_SET_FLAG, "ro"). This option is seen by the filesystem</div><div class='add'>+ *     in fc-&gt;sb_flags.</div><div class='add'>+ *</div><div class='add'>+ * But, currently the util-linux mount command already utilizes the new mount</div><div class='add'>+ * API and is still setting fsconfig(FSCONFIG_SET_FLAG, "ro") no matter if it's</div><div class='add'>+ * btrfs or not, setting the whole super block RO.  To make per-subvolume mounting</div><div class='add'>+ * work with different options work we need to keep backward compatibility.</div><div class='add'>+ */</div><div class='add'>+static int btrfs_reconfigure_for_mount(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	if (!(fc-&gt;sb_flags &amp; SB_RDONLY) &amp;&amp; (fc-&gt;root-&gt;d_sb-&gt;s_flags &amp; SB_RDONLY))</div><div class='add'>+		ret = btrfs_reconfigure(fc);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int btrfs_get_tree_subvol(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = NULL;</div><div class='add'>+	struct btrfs_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct fs_context *dup_fc;</div><div class='add'>+	struct dentry *dentry;</div><div class='add'>+	struct vfsmount *mnt;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Setup a dummy root and fs_info for test/set super.  This is because</div><div class='add'>+	 * we don't actually fill this stuff out until open_ctree, but we need</div><div class='add'>+	 * then open_ctree will properly initialize the file system specific</div><div class='add'>+	 * settings later.  btrfs_init_fs_info initializes the static elements</div><div class='add'>+	 * of the fs_info (locks and such) to make cleanup easier if we find a</div><div class='add'>+	 * superblock with our given fs_devices later on at sget() time.</div><div class='add'>+	 */</div><div class='add'>+	fs_info = kvzalloc(sizeof(struct btrfs_fs_info), GFP_KERNEL);</div><div class='add'>+	if (!fs_info)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	fs_info-&gt;super_copy = kzalloc(BTRFS_SUPER_INFO_SIZE, GFP_KERNEL);</div><div class='add'>+	fs_info-&gt;super_for_commit = kzalloc(BTRFS_SUPER_INFO_SIZE, GFP_KERNEL);</div><div class='add'>+	if (!fs_info-&gt;super_copy || !fs_info-&gt;super_for_commit) {</div><div class='add'>+		/*</div><div class='add'>+		 * Dont call btrfs_free_fs_info() to free it as it's still</div><div class='add'>+		 * initialized partially.</div><div class='add'>+		 */</div><div class='add'>+		kfree(fs_info-&gt;super_copy);</div><div class='add'>+		kfree(fs_info-&gt;super_for_commit);</div><div class='add'>+		kvfree(fs_info);</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+	btrfs_init_fs_info(fs_info);</div><div class='add'>+</div><div class='add'>+	dup_fc = vfs_dup_fs_context(fc);</div><div class='add'>+	if (IS_ERR(dup_fc)) {</div><div class='add'>+		btrfs_free_fs_info(fs_info);</div><div class='add'>+		return PTR_ERR(dup_fc);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * When we do the sget_fc this gets transferred to the sb, so we only</div><div class='add'>+	 * need to set it on the dup_fc as this is what creates the super block.</div><div class='add'>+	 */</div><div class='add'>+	dup_fc-&gt;s_fs_info = fs_info;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_get_tree_super(dup_fc);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto error;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_reconfigure_for_mount(dup_fc);</div><div class='add'>+	up_write(&amp;dup_fc-&gt;root-&gt;d_sb-&gt;s_umount);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto error;</div><div class='add'>+	mnt = vfs_create_mount(dup_fc);</div><div class='add'>+	put_fs_context(dup_fc);</div><div class='add'>+	if (IS_ERR(mnt))</div><div class='add'>+		return PTR_ERR(mnt);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This free's -&gt;subvol_name, because if it isn't set we have to</div><div class='add'>+	 * allocate a buffer to hold the subvol_name, so we just drop our</div><div class='add'>+	 * reference to it here.</div><div class='add'>+	 */</div><div class='add'>+	dentry = mount_subvol(ctx-&gt;subvol_name, ctx-&gt;subvol_objectid, mnt);</div><div class='add'>+	ctx-&gt;subvol_name = NULL;</div><div class='add'>+	if (IS_ERR(dentry))</div><div class='add'>+		return PTR_ERR(dentry);</div><div class='add'>+</div><div class='add'>+	fc-&gt;root = dentry;</div><div class='add'>+	return 0;</div><div class='add'>+error:</div><div class='add'>+	put_fs_context(dup_fc);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int btrfs_get_tree(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	ASSERT(fc-&gt;s_fs_info == NULL);</div><div class='add'>+</div><div class='add'>+	return btrfs_get_tree_subvol(fc);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void btrfs_kill_super(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = btrfs_sb(sb);</div><div class='hunk'>@@ -2349,22 +2130,86 @@ static void btrfs_kill_super(struct super_block *sb)</div><div class='ctx'> 	btrfs_free_fs_info(fs_info);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct file_system_type btrfs_fs_type = {</div><div class='del'>-	.owner		= THIS_MODULE,</div><div class='del'>-	.name		= "btrfs",</div><div class='del'>-	.mount		= btrfs_mount,</div><div class='del'>-	.kill_sb	= btrfs_kill_super,</div><div class='del'>-	.fs_flags	= FS_REQUIRES_DEV | FS_BINARY_MOUNTDATA,</div><div class='del'>-};</div><div class='add'>+static void btrfs_free_fs_context(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct btrfs_fs_info *fs_info = fc-&gt;s_fs_info;</div><div class='add'>+</div><div class='add'>+	if (fs_info)</div><div class='add'>+		btrfs_free_fs_info(fs_info);</div><div class='add'>+</div><div class='add'>+	if (ctx &amp;&amp; refcount_dec_and_test(&amp;ctx-&gt;refs)) {</div><div class='add'>+		kfree(ctx-&gt;subvol_name);</div><div class='add'>+		kfree(ctx);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int btrfs_dup_fs_context(struct fs_context *fc, struct fs_context *src_fc)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_context *ctx = src_fc-&gt;fs_private;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Give a ref to our ctx to this dup, as we want to keep it around for</div><div class='add'>+	 * our original fc so we can have the subvolume name or objectid.</div><div class='add'>+	 *</div><div class='add'>+	 * We unset -&gt;source in the original fc because the dup needs it for</div><div class='add'>+	 * mounting, and then once we free the dup it'll free -&gt;source, so we</div><div class='add'>+	 * need to make sure we're only pointing to it in one fc.</div><div class='add'>+	 */</div><div class='add'>+	refcount_inc(&amp;ctx-&gt;refs);</div><div class='add'>+	fc-&gt;fs_private = ctx;</div><div class='add'>+	fc-&gt;source = src_fc-&gt;source;</div><div class='add'>+	src_fc-&gt;source = NULL;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-static struct file_system_type btrfs_root_fs_type = {</div><div class='del'>-	.owner		= THIS_MODULE,</div><div class='del'>-	.name		= "btrfs",</div><div class='del'>-	.mount		= btrfs_mount_root,</div><div class='del'>-	.kill_sb	= btrfs_kill_super,</div><div class='del'>-	.fs_flags	= FS_REQUIRES_DEV | FS_BINARY_MOUNTDATA | FS_ALLOW_IDMAP,</div><div class='add'>+static const struct fs_context_operations btrfs_fs_context_ops = {</div><div class='add'>+	.parse_param	= btrfs_parse_param,</div><div class='add'>+	.reconfigure	= btrfs_reconfigure,</div><div class='add'>+	.get_tree	= btrfs_get_tree,</div><div class='add'>+	.dup		= btrfs_dup_fs_context,</div><div class='add'>+	.free		= btrfs_free_fs_context,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+static int btrfs_init_fs_context(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_context *ctx;</div><div class='add'>+</div><div class='add'>+	ctx = kzalloc(sizeof(struct btrfs_fs_context), GFP_KERNEL);</div><div class='add'>+	if (!ctx)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	refcount_set(&amp;ctx-&gt;refs, 1);</div><div class='add'>+	fc-&gt;fs_private = ctx;</div><div class='add'>+	fc-&gt;ops = &amp;btrfs_fs_context_ops;</div><div class='add'>+</div><div class='add'>+	if (fc-&gt;purpose == FS_CONTEXT_FOR_RECONFIGURE) {</div><div class='add'>+		btrfs_info_to_ctx(btrfs_sb(fc-&gt;root-&gt;d_sb), ctx);</div><div class='add'>+	} else {</div><div class='add'>+		ctx-&gt;thread_pool_size =</div><div class='add'>+			min_t(unsigned long, num_online_cpus() + 2, 8);</div><div class='add'>+		ctx-&gt;max_inline = BTRFS_DEFAULT_MAX_INLINE;</div><div class='add'>+		ctx-&gt;commit_interval = BTRFS_DEFAULT_COMMIT_INTERVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BTRFS_FS_POSIX_ACL</div><div class='add'>+	fc-&gt;sb_flags |= SB_POSIXACL;</div><div class='add'>+#endif</div><div class='add'>+	fc-&gt;sb_flags |= SB_I_VERSION;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct file_system_type btrfs_fs_type = {</div><div class='add'>+	.owner			= THIS_MODULE,</div><div class='add'>+	.name			= "btrfs",</div><div class='add'>+	.init_fs_context	= btrfs_init_fs_context,</div><div class='add'>+	.parameters		= btrfs_fs_parameters,</div><div class='add'>+	.kill_sb		= btrfs_kill_super,</div><div class='add'>+	.fs_flags		= FS_REQUIRES_DEV | FS_BINARY_MOUNTDATA |</div><div class='add'>+				  FS_ALLOW_IDMAP | FS_MGTIME,</div><div class='add'>+ };</div><div class='add'>+</div><div class='ctx'> MODULE_ALIAS_FS("btrfs");</div><div class='ctx'> </div><div class='ctx'> static int btrfs_control_open(struct inode *inode, struct file *file)</div><div class='hunk'>@@ -2386,6 +2231,7 @@ static long btrfs_control_ioctl(struct file *file, unsigned int cmd,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_ioctl_vol_args *vol;</div><div class='ctx'> 	struct btrfs_device *device = NULL;</div><div class='add'>+	dev_t devt = 0;</div><div class='ctx'> 	int ret = -ENOTTY;</div><div class='ctx'> </div><div class='ctx'> 	if (!capable(CAP_SYS_ADMIN))</div><div class='hunk'>@@ -2394,26 +2240,39 @@ static long btrfs_control_ioctl(struct file *file, unsigned int cmd,</div><div class='ctx'> 	vol = memdup_user((void __user *)arg, sizeof(*vol));</div><div class='ctx'> 	if (IS_ERR(vol))</div><div class='ctx'> 		return PTR_ERR(vol);</div><div class='del'>-	vol-&gt;name[BTRFS_PATH_NAME_MAX] = '\0';</div><div class='add'>+	ret = btrfs_check_ioctl_vol_args_path(vol);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='ctx'> 	switch (cmd) {</div><div class='ctx'> 	case BTRFS_IOC_SCAN_DEV:</div><div class='ctx'> 		mutex_lock(&amp;uuid_mutex);</div><div class='del'>-		device = btrfs_scan_one_device(vol-&gt;name, FMODE_READ,</div><div class='del'>-					       &amp;btrfs_root_fs_type);</div><div class='add'>+		/*</div><div class='add'>+		 * Scanning outside of mount can return NULL which would turn</div><div class='add'>+		 * into 0 error code.</div><div class='add'>+		 */</div><div class='add'>+		device = btrfs_scan_one_device(vol-&gt;name, false);</div><div class='ctx'> 		ret = PTR_ERR_OR_ZERO(device);</div><div class='ctx'> 		mutex_unlock(&amp;uuid_mutex);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case BTRFS_IOC_FORGET_DEV:</div><div class='del'>-		ret = btrfs_forget_devices(vol-&gt;name);</div><div class='add'>+		if (vol-&gt;name[0] != 0) {</div><div class='add'>+			ret = lookup_bdev(vol-&gt;name, &amp;devt);</div><div class='add'>+			if (ret)</div><div class='add'>+				break;</div><div class='add'>+		}</div><div class='add'>+		ret = btrfs_forget_devices(devt);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case BTRFS_IOC_DEVICES_READY:</div><div class='ctx'> 		mutex_lock(&amp;uuid_mutex);</div><div class='del'>-		device = btrfs_scan_one_device(vol-&gt;name, FMODE_READ,</div><div class='del'>-					       &amp;btrfs_root_fs_type);</div><div class='del'>-		if (IS_ERR(device)) {</div><div class='add'>+		/*</div><div class='add'>+		 * Scanning outside of mount can return NULL which would turn</div><div class='add'>+		 * into 0 error code.</div><div class='add'>+		 */</div><div class='add'>+		device = btrfs_scan_one_device(vol-&gt;name, false);</div><div class='add'>+		if (IS_ERR_OR_NULL(device)) {</div><div class='ctx'> 			mutex_unlock(&amp;uuid_mutex);</div><div class='del'>-			ret = PTR_ERR(device);</div><div class='add'>+			ret = PTR_ERR_OR_ZERO(device);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 		ret = !(device-&gt;fs_devices-&gt;num_devices ==</div><div class='hunk'>@@ -2425,15 +2284,14 @@ static long btrfs_control_ioctl(struct file *file, unsigned int cmd,</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+out:</div><div class='ctx'> 	kfree(vol);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int btrfs_freeze(struct super_block *sb)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = btrfs_sb(sb);</div><div class='del'>-	struct btrfs_root *root = fs_info-&gt;tree_root;</div><div class='ctx'> </div><div class='ctx'> 	set_bit(BTRFS_FS_FROZEN, &amp;fs_info-&gt;flags);</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -2442,21 +2300,91 @@ static int btrfs_freeze(struct super_block *sb)</div><div class='ctx'> 	 * we want to avoid on a frozen filesystem), or do the commit</div><div class='ctx'> 	 * ourselves.</div><div class='ctx'> 	 */</div><div class='del'>-	trans = btrfs_attach_transaction_barrier(root);</div><div class='del'>-	if (IS_ERR(trans)) {</div><div class='del'>-		/* no transaction, don't bother */</div><div class='del'>-		if (PTR_ERR(trans) == -ENOENT)</div><div class='del'>-			return 0;</div><div class='del'>-		return PTR_ERR(trans);</div><div class='add'>+	return btrfs_commit_current_transaction(fs_info-&gt;tree_root);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int check_dev_super(struct btrfs_device *dev)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = dev-&gt;fs_info;</div><div class='add'>+	struct btrfs_super_block *sb;</div><div class='add'>+	u64 last_trans;</div><div class='add'>+	u16 csum_type;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	/* This should be called with fs still frozen. */</div><div class='add'>+	ASSERT(test_bit(BTRFS_FS_FROZEN, &amp;fs_info-&gt;flags));</div><div class='add'>+</div><div class='add'>+	/* Missing dev, no need to check. */</div><div class='add'>+	if (!dev-&gt;bdev)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/* Only need to check the primary super block. */</div><div class='add'>+	sb = btrfs_read_disk_super(dev-&gt;bdev, 0, true);</div><div class='add'>+	if (IS_ERR(sb))</div><div class='add'>+		return PTR_ERR(sb);</div><div class='add'>+</div><div class='add'>+	/* Verify the checksum. */</div><div class='add'>+	csum_type = btrfs_super_csum_type(sb);</div><div class='add'>+	if (unlikely(csum_type != btrfs_super_csum_type(fs_info-&gt;super_copy))) {</div><div class='add'>+		btrfs_err(fs_info, "csum type changed, has %u expect %u",</div><div class='add'>+			  csum_type, btrfs_super_csum_type(fs_info-&gt;super_copy));</div><div class='add'>+		ret = -EUCLEAN;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	return btrfs_commit_transaction(trans);</div><div class='add'>+</div><div class='add'>+	if (unlikely(btrfs_check_super_csum(fs_info, sb))) {</div><div class='add'>+		btrfs_err(fs_info, "csum for on-disk super block no longer matches");</div><div class='add'>+		ret = -EUCLEAN;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Btrfs_validate_super() includes fsid check against super-&gt;fsid. */</div><div class='add'>+	ret = btrfs_validate_super(fs_info, sb, 0);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	last_trans = btrfs_get_last_trans_committed(fs_info);</div><div class='add'>+	if (unlikely(btrfs_super_generation(sb) != last_trans)) {</div><div class='add'>+		btrfs_err(fs_info, "transid mismatch, has %llu expect %llu",</div><div class='add'>+			  btrfs_super_generation(sb), last_trans);</div><div class='add'>+		ret = -EUCLEAN;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='add'>+	btrfs_release_disk_super(sb);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int btrfs_unfreeze(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = btrfs_sb(sb);</div><div class='add'>+	struct btrfs_device *device;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Make sure the fs is not changed by accident (like hibernation then</div><div class='add'>+	 * modified by other OS).</div><div class='add'>+	 * If we found anything wrong, we mark the fs error immediately.</div><div class='add'>+	 *</div><div class='add'>+	 * And since the fs is frozen, no one can modify the fs yet, thus</div><div class='add'>+	 * we don't need to hold device_list_mutex.</div><div class='add'>+	 */</div><div class='add'>+	list_for_each_entry(device, &amp;fs_info-&gt;fs_devices-&gt;devices, dev_list) {</div><div class='add'>+		ret = check_dev_super(device);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			btrfs_handle_fs_error(fs_info, ret,</div><div class='add'>+				"super block on devid %llu got modified unexpectedly",</div><div class='add'>+				device-&gt;devid);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> 	clear_bit(BTRFS_FS_FROZEN, &amp;fs_info-&gt;flags);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We still return 0, to allow VFS layer to unfreeze the fs even the</div><div class='add'>+	 * above checks failed. Since the fs is either fine or read-only, we're</div><div class='add'>+	 * safe to continue, without causing further damage.</div><div class='add'>+	 */</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2470,12 +2398,93 @@ static int btrfs_show_devname(struct seq_file *m, struct dentry *root)</div><div class='ctx'> 	 * the end of RCU grace period.</div><div class='ctx'> 	 */</div><div class='ctx'> 	rcu_read_lock();</div><div class='del'>-	seq_escape(m, rcu_str_deref(fs_info-&gt;fs_devices-&gt;latest_dev-&gt;name), " \t\n\\");</div><div class='add'>+	seq_escape(m, btrfs_dev_name(fs_info-&gt;fs_devices-&gt;latest_dev), " \t\n\\");</div><div class='ctx'> 	rcu_read_unlock();</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static long btrfs_nr_cached_objects(struct super_block *sb, struct shrink_control *sc)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = btrfs_sb(sb);</div><div class='add'>+	const s64 nr = percpu_counter_sum_positive(&amp;fs_info-&gt;evictable_extent_maps);</div><div class='add'>+</div><div class='add'>+	trace_btrfs_extent_map_shrinker_count(fs_info, nr);</div><div class='add'>+</div><div class='add'>+	return nr;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static long btrfs_free_cached_objects(struct super_block *sb, struct shrink_control *sc)</div><div class='add'>+{</div><div class='add'>+	const long nr_to_scan = min_t(unsigned long, LONG_MAX, sc-&gt;nr_to_scan);</div><div class='add'>+	struct btrfs_fs_info *fs_info = btrfs_sb(sb);</div><div class='add'>+</div><div class='add'>+	btrfs_free_extent_maps(fs_info, nr_to_scan);</div><div class='add'>+</div><div class='add'>+	/* The extent map shrinker runs asynchronously, so always return 0. */</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+static int btrfs_remove_bdev(struct super_block *sb, struct block_device *bdev)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = btrfs_sb(sb);</div><div class='add'>+	struct btrfs_device *device;</div><div class='add'>+	struct btrfs_dev_lookup_args lookup_args = { .devt = bdev-&gt;bd_dev };</div><div class='add'>+	bool can_rw;</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;fs_info-&gt;fs_devices-&gt;device_list_mutex);</div><div class='add'>+	device = btrfs_find_device(fs_info-&gt;fs_devices, &amp;lookup_args);</div><div class='add'>+	if (!device) {</div><div class='add'>+		mutex_unlock(&amp;fs_info-&gt;fs_devices-&gt;device_list_mutex);</div><div class='add'>+		/* Device not found, should not affect the running fs, just give a warning. */</div><div class='add'>+		btrfs_warn(fs_info, "unable to find btrfs device for block device '%pg'", bdev);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+	/*</div><div class='add'>+	 * The to-be-removed device is already missing?</div><div class='add'>+	 *</div><div class='add'>+	 * That's weird but no special handling needed and can exit right now.</div><div class='add'>+	 */</div><div class='add'>+	if (unlikely(test_and_set_bit(BTRFS_DEV_STATE_MISSING, &amp;device-&gt;dev_state))) {</div><div class='add'>+		mutex_unlock(&amp;fs_info-&gt;fs_devices-&gt;device_list_mutex);</div><div class='add'>+		btrfs_warn(fs_info, "btrfs device id %llu is already missing", device-&gt;devid);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	device-&gt;fs_devices-&gt;missing_devices++;</div><div class='add'>+	if (test_and_clear_bit(BTRFS_DEV_STATE_WRITEABLE, &amp;device-&gt;dev_state)) {</div><div class='add'>+		list_del_init(&amp;device-&gt;dev_alloc_list);</div><div class='add'>+		WARN_ON(device-&gt;fs_devices-&gt;rw_devices &lt; 1);</div><div class='add'>+		device-&gt;fs_devices-&gt;rw_devices--;</div><div class='add'>+	}</div><div class='add'>+	can_rw = btrfs_check_rw_degradable(fs_info, device);</div><div class='add'>+	mutex_unlock(&amp;fs_info-&gt;fs_devices-&gt;device_list_mutex);</div><div class='add'>+	/*</div><div class='add'>+	 * Now device is considered missing, btrfs_device_name() won't give a</div><div class='add'>+	 * meaningful result anymore, so only output the devid.</div><div class='add'>+	 */</div><div class='add'>+	if (unlikely(!can_rw)) {</div><div class='add'>+		btrfs_crit(fs_info,</div><div class='add'>+		"btrfs device id %llu has gone missing, can not maintain read-write",</div><div class='add'>+			   device-&gt;devid);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+	btrfs_warn(fs_info,</div><div class='add'>+		   "btrfs device id %llu has gone missing, continue as degraded",</div><div class='add'>+		   device-&gt;devid);</div><div class='add'>+	btrfs_set_opt(fs_info-&gt;mount_opt, DEGRADED);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void btrfs_shutdown(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = btrfs_sb(sb);</div><div class='add'>+</div><div class='add'>+	btrfs_force_shutdown(fs_info);</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> static const struct super_operations btrfs_super_ops = {</div><div class='ctx'> 	.drop_inode	= btrfs_drop_inode,</div><div class='ctx'> 	.evict_inode	= btrfs_evict_inode,</div><div class='hunk'>@@ -2487,9 +2496,14 @@ static const struct super_operations btrfs_super_ops = {</div><div class='ctx'> 	.destroy_inode	= btrfs_destroy_inode,</div><div class='ctx'> 	.free_inode	= btrfs_free_inode,</div><div class='ctx'> 	.statfs		= btrfs_statfs,</div><div class='del'>-	.remount_fs	= btrfs_remount,</div><div class='ctx'> 	.freeze_fs	= btrfs_freeze,</div><div class='ctx'> 	.unfreeze_fs	= btrfs_unfreeze,</div><div class='add'>+	.nr_cached_objects = btrfs_nr_cached_objects,</div><div class='add'>+	.free_cached_objects = btrfs_free_cached_objects,</div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+	.remove_bdev	= btrfs_remove_bdev,</div><div class='add'>+	.shutdown	= btrfs_shutdown,</div><div class='add'>+#endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct file_operations btrfs_ctl_fops = {</div><div class='hunk'>@@ -2519,21 +2533,18 @@ static __cold void btrfs_interface_exit(void)</div><div class='ctx'> 	misc_deregister(&amp;btrfs_misc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void __init btrfs_print_mod_info(void)</div><div class='add'>+static int __init btrfs_print_mod_info(void)</div><div class='ctx'> {</div><div class='ctx'> 	static const char options[] = ""</div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+			", experimental=on"</div><div class='add'>+#endif</div><div class='ctx'> #ifdef CONFIG_BTRFS_DEBUG</div><div class='ctx'> 			", debug=on"</div><div class='ctx'> #endif</div><div class='ctx'> #ifdef CONFIG_BTRFS_ASSERT</div><div class='ctx'> 			", assert=on"</div><div class='ctx'> #endif</div><div class='del'>-#ifdef CONFIG_BTRFS_FS_CHECK_INTEGRITY</div><div class='del'>-			", integrity-checker=on"</div><div class='del'>-#endif</div><div class='del'>-#ifdef CONFIG_BTRFS_FS_REF_VERIFY</div><div class='del'>-			", ref-verify=on"</div><div class='del'>-#endif</div><div class='ctx'> #ifdef CONFIG_BLK_DEV_ZONED</div><div class='ctx'> 			", zoned=yes"</div><div class='ctx'> #else</div><div class='hunk'>@@ -2545,128 +2556,151 @@ static void __init btrfs_print_mod_info(void)</div><div class='ctx'> 			", fsverity=no"</div><div class='ctx'> #endif</div><div class='ctx'> 			;</div><div class='del'>-	pr_info("Btrfs loaded, crc32c=%s%s\n", crc32c_impl(), options);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int __init init_btrfs_fs(void)</div><div class='del'>-{</div><div class='del'>-	int err;</div><div class='del'>-</div><div class='del'>-	btrfs_props_init();</div><div class='del'>-</div><div class='del'>-	err = btrfs_init_sysfs();</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='del'>-</div><div class='del'>-	btrfs_init_compress();</div><div class='del'>-</div><div class='del'>-	err = btrfs_init_cachep();</div><div class='del'>-	if (err)</div><div class='del'>-		goto free_compress;</div><div class='del'>-</div><div class='del'>-	err = extent_io_init();</div><div class='del'>-	if (err)</div><div class='del'>-		goto free_cachep;</div><div class='ctx'> </div><div class='del'>-	err = extent_state_cache_init();</div><div class='del'>-	if (err)</div><div class='del'>-		goto free_extent_io;</div><div class='del'>-</div><div class='del'>-	err = extent_map_init();</div><div class='del'>-	if (err)</div><div class='del'>-		goto free_extent_state_cache;</div><div class='del'>-</div><div class='del'>-	err = ordered_data_init();</div><div class='del'>-	if (err)</div><div class='del'>-		goto free_extent_map;</div><div class='del'>-</div><div class='del'>-	err = btrfs_delayed_inode_init();</div><div class='del'>-	if (err)</div><div class='del'>-		goto free_ordered_data;</div><div class='del'>-</div><div class='del'>-	err = btrfs_auto_defrag_init();</div><div class='del'>-	if (err)</div><div class='del'>-		goto free_delayed_inode;</div><div class='del'>-</div><div class='del'>-	err = btrfs_delayed_ref_init();</div><div class='del'>-	if (err)</div><div class='del'>-		goto free_auto_defrag;</div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+	if (btrfs_get_mod_read_policy() == NULL)</div><div class='add'>+		pr_info("Btrfs loaded%s\n", options);</div><div class='add'>+	else</div><div class='add'>+		pr_info("Btrfs loaded%s, read_policy=%s\n",</div><div class='add'>+			 options, btrfs_get_mod_read_policy());</div><div class='add'>+#else</div><div class='add'>+	pr_info("Btrfs loaded%s\n", options);</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='del'>-	err = btrfs_prelim_ref_init();</div><div class='del'>-	if (err)</div><div class='del'>-		goto free_delayed_ref;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	err = btrfs_end_io_wq_init();</div><div class='del'>-	if (err)</div><div class='del'>-		goto free_prelim_ref;</div><div class='add'>+static int register_btrfs(void)</div><div class='add'>+{</div><div class='add'>+	return register_filesystem(&amp;btrfs_fs_type);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	err = btrfs_interface_init();</div><div class='del'>-	if (err)</div><div class='del'>-		goto free_end_io_wq;</div><div class='add'>+static void unregister_btrfs(void)</div><div class='add'>+{</div><div class='add'>+	unregister_filesystem(&amp;btrfs_fs_type);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	btrfs_print_mod_info();</div><div class='add'>+/* Helper structure for long init/exit functions. */</div><div class='add'>+struct init_sequence {</div><div class='add'>+	int (*init_func)(void);</div><div class='add'>+	/* Can be NULL if the init_func doesn't need cleanup. */</div><div class='add'>+	void (*exit_func)(void);</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-	err = btrfs_run_sanity_tests();</div><div class='del'>-	if (err)</div><div class='del'>-		goto unregister_ioctl;</div><div class='add'>+static const struct init_sequence mod_init_seq[] = {</div><div class='add'>+	{</div><div class='add'>+		.init_func = btrfs_props_init,</div><div class='add'>+		.exit_func = NULL,</div><div class='add'>+	}, {</div><div class='add'>+		.init_func = btrfs_init_sysfs,</div><div class='add'>+		.exit_func = btrfs_exit_sysfs,</div><div class='add'>+	}, {</div><div class='add'>+		.init_func = btrfs_init_compress,</div><div class='add'>+		.exit_func = btrfs_exit_compress,</div><div class='add'>+	}, {</div><div class='add'>+		.init_func = btrfs_init_cachep,</div><div class='add'>+		.exit_func = btrfs_destroy_cachep,</div><div class='add'>+	}, {</div><div class='add'>+		.init_func = btrfs_init_dio,</div><div class='add'>+		.exit_func = btrfs_destroy_dio,</div><div class='add'>+	}, {</div><div class='add'>+		.init_func = btrfs_transaction_init,</div><div class='add'>+		.exit_func = btrfs_transaction_exit,</div><div class='add'>+	}, {</div><div class='add'>+		.init_func = btrfs_ctree_init,</div><div class='add'>+		.exit_func = btrfs_ctree_exit,</div><div class='add'>+	}, {</div><div class='add'>+		.init_func = btrfs_free_space_init,</div><div class='add'>+		.exit_func = btrfs_free_space_exit,</div><div class='add'>+	}, {</div><div class='add'>+		.init_func = btrfs_extent_state_init_cachep,</div><div class='add'>+		.exit_func = btrfs_extent_state_free_cachep,</div><div class='add'>+	}, {</div><div class='add'>+		.init_func = extent_buffer_init_cachep,</div><div class='add'>+		.exit_func = extent_buffer_free_cachep,</div><div class='add'>+	}, {</div><div class='add'>+		.init_func = btrfs_bioset_init,</div><div class='add'>+		.exit_func = btrfs_bioset_exit,</div><div class='add'>+	}, {</div><div class='add'>+		.init_func = btrfs_extent_map_init,</div><div class='add'>+		.exit_func = btrfs_extent_map_exit,</div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+	}, {</div><div class='add'>+		.init_func = btrfs_read_policy_init,</div><div class='add'>+		.exit_func = NULL,</div><div class='add'>+#endif</div><div class='add'>+	}, {</div><div class='add'>+		.init_func = ordered_data_init,</div><div class='add'>+		.exit_func = ordered_data_exit,</div><div class='add'>+	}, {</div><div class='add'>+		.init_func = btrfs_delayed_inode_init,</div><div class='add'>+		.exit_func = btrfs_delayed_inode_exit,</div><div class='add'>+	}, {</div><div class='add'>+		.init_func = btrfs_auto_defrag_init,</div><div class='add'>+		.exit_func = btrfs_auto_defrag_exit,</div><div class='add'>+	}, {</div><div class='add'>+		.init_func = btrfs_delayed_ref_init,</div><div class='add'>+		.exit_func = btrfs_delayed_ref_exit,</div><div class='add'>+	}, {</div><div class='add'>+		.init_func = btrfs_prelim_ref_init,</div><div class='add'>+		.exit_func = btrfs_prelim_ref_exit,</div><div class='add'>+	}, {</div><div class='add'>+		.init_func = btrfs_interface_init,</div><div class='add'>+		.exit_func = btrfs_interface_exit,</div><div class='add'>+	}, {</div><div class='add'>+		.init_func = btrfs_print_mod_info,</div><div class='add'>+		.exit_func = NULL,</div><div class='add'>+	}, {</div><div class='add'>+		.init_func = btrfs_run_sanity_tests,</div><div class='add'>+		.exit_func = NULL,</div><div class='add'>+	}, {</div><div class='add'>+		.init_func = register_btrfs,</div><div class='add'>+		.exit_func = unregister_btrfs,</div><div class='add'>+	}</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-	err = register_filesystem(&amp;btrfs_fs_type);</div><div class='del'>-	if (err)</div><div class='del'>-		goto unregister_ioctl;</div><div class='add'>+static bool mod_init_result[ARRAY_SIZE(mod_init_seq)];</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+static __always_inline void btrfs_exit_btrfs_fs(void)</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='ctx'> </div><div class='del'>-unregister_ioctl:</div><div class='del'>-	btrfs_interface_exit();</div><div class='del'>-free_end_io_wq:</div><div class='del'>-	btrfs_end_io_wq_exit();</div><div class='del'>-free_prelim_ref:</div><div class='del'>-	btrfs_prelim_ref_exit();</div><div class='del'>-free_delayed_ref:</div><div class='del'>-	btrfs_delayed_ref_exit();</div><div class='del'>-free_auto_defrag:</div><div class='del'>-	btrfs_auto_defrag_exit();</div><div class='del'>-free_delayed_inode:</div><div class='del'>-	btrfs_delayed_inode_exit();</div><div class='del'>-free_ordered_data:</div><div class='del'>-	ordered_data_exit();</div><div class='del'>-free_extent_map:</div><div class='del'>-	extent_map_exit();</div><div class='del'>-free_extent_state_cache:</div><div class='del'>-	extent_state_cache_exit();</div><div class='del'>-free_extent_io:</div><div class='del'>-	extent_io_exit();</div><div class='del'>-free_cachep:</div><div class='del'>-	btrfs_destroy_cachep();</div><div class='del'>-free_compress:</div><div class='del'>-	btrfs_exit_compress();</div><div class='del'>-	btrfs_exit_sysfs();</div><div class='del'>-</div><div class='del'>-	return err;</div><div class='add'>+	for (i = ARRAY_SIZE(mod_init_seq) - 1; i &gt;= 0; i--) {</div><div class='add'>+		if (!mod_init_result[i])</div><div class='add'>+			continue;</div><div class='add'>+		if (mod_init_seq[i].exit_func)</div><div class='add'>+			mod_init_seq[i].exit_func();</div><div class='add'>+		mod_init_result[i] = false;</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void __exit exit_btrfs_fs(void)</div><div class='ctx'> {</div><div class='del'>-	btrfs_destroy_cachep();</div><div class='del'>-	btrfs_delayed_ref_exit();</div><div class='del'>-	btrfs_auto_defrag_exit();</div><div class='del'>-	btrfs_delayed_inode_exit();</div><div class='del'>-	btrfs_prelim_ref_exit();</div><div class='del'>-	ordered_data_exit();</div><div class='del'>-	extent_map_exit();</div><div class='del'>-	extent_state_cache_exit();</div><div class='del'>-	extent_io_exit();</div><div class='del'>-	btrfs_interface_exit();</div><div class='del'>-	btrfs_end_io_wq_exit();</div><div class='del'>-	unregister_filesystem(&amp;btrfs_fs_type);</div><div class='del'>-	btrfs_exit_sysfs();</div><div class='add'>+	btrfs_exit_btrfs_fs();</div><div class='ctx'> 	btrfs_cleanup_fs_uuids();</div><div class='del'>-	btrfs_exit_compress();</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int __init init_btrfs_fs(void)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; ARRAY_SIZE(mod_init_seq); i++) {</div><div class='add'>+		ASSERT(!mod_init_result[i]);</div><div class='add'>+		ret = mod_init_seq[i].init_func();</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			btrfs_exit_btrfs_fs();</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='add'>+		mod_init_result[i] = true;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> late_initcall(init_btrfs_fs);</div><div class='ctx'> module_exit(exit_btrfs_fs)</div><div class='ctx'> </div><div class='add'>+MODULE_DESCRIPTION("B-Tree File System (BTRFS)");</div><div class='ctx'> MODULE_LICENSE("GPL");</div><div class='ctx'> MODULE_SOFTDEP("pre: crc32c");</div><div class='ctx'> MODULE_SOFTDEP("pre: xxhash64");</div><div class='head'>diff --git a/fs/btrfs/super.h b/fs/btrfs/super.h<br/>new file mode 100644<br/>index 000000000000..d80a86acfbbe<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/super.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/super.h</a></div><div class='hunk'>@@ -0,0 +1,38 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+</div><div class='add'>+#ifndef BTRFS_SUPER_H</div><div class='add'>+#define BTRFS_SUPER_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+#include &lt;linux/fs.h&gt;</div><div class='add'>+#include "fs.h"</div><div class='add'>+</div><div class='add'>+struct super_block;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+</div><div class='add'>+bool btrfs_check_options(const struct btrfs_fs_info *info,</div><div class='add'>+			 unsigned long long *mount_opt,</div><div class='add'>+			 unsigned long flags);</div><div class='add'>+int btrfs_sync_fs(struct super_block *sb, int wait);</div><div class='add'>+char *btrfs_get_subvol_name_from_objectid(struct btrfs_fs_info *fs_info,</div><div class='add'>+					  u64 subvol_objectid);</div><div class='add'>+void btrfs_set_free_space_cache_settings(struct btrfs_fs_info *fs_info);</div><div class='add'>+</div><div class='add'>+static inline struct btrfs_fs_info *btrfs_sb(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	return sb-&gt;s_fs_info;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_set_sb_rdonly(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	sb-&gt;s_flags |= SB_RDONLY;</div><div class='add'>+	set_bit(BTRFS_FS_STATE_RO, &amp;btrfs_sb(sb)-&gt;fs_state);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_clear_sb_rdonly(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	sb-&gt;s_flags &amp;= ~SB_RDONLY;</div><div class='add'>+	clear_bit(BTRFS_FS_STATE_RO, &amp;btrfs_sb(sb)-&gt;fs_state);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#endif</div><div class='head'>diff --git a/fs/btrfs/sysfs.c b/fs/btrfs/sysfs.c<br/>index f9eff3b0f77c..1f64c132b387 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/sysfs.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/sysfs.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/sysfs.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/sysfs.c</a></div><div class='hunk'>@@ -9,8 +9,10 @@</div><div class='ctx'> #include &lt;linux/spinlock.h&gt;</div><div class='ctx'> #include &lt;linux/completion.h&gt;</div><div class='ctx'> #include &lt;linux/bug.h&gt;</div><div class='add'>+#include &lt;linux/list.h&gt;</div><div class='add'>+#include &lt;linux/string_choices.h&gt;</div><div class='ctx'> #include &lt;crypto/hash.h&gt;</div><div class='del'>-</div><div class='add'>+#include "messages.h"</div><div class='ctx'> #include "ctree.h"</div><div class='ctx'> #include "discard.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='hunk'>@@ -21,6 +23,10 @@</div><div class='ctx'> #include "space-info.h"</div><div class='ctx'> #include "block-group.h"</div><div class='ctx'> #include "qgroup.h"</div><div class='add'>+#include "misc.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "zoned.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Structure name                       Path</div><div class='hunk'>@@ -34,12 +40,12 @@</div><div class='ctx'>  * qgroup_attrs				/sys/fs/btrfs/&lt;uuid&gt;/qgroups/&lt;level&gt;_&lt;qgroupid&gt;</div><div class='ctx'>  * space_info_attrs			/sys/fs/btrfs/&lt;uuid&gt;/allocation/&lt;bg-type&gt;</div><div class='ctx'>  * raid_attrs				/sys/fs/btrfs/&lt;uuid&gt;/allocation/&lt;bg-type&gt;/&lt;bg-profile&gt;</div><div class='add'>+ * discard_attrs			/sys/fs/btrfs/&lt;uuid&gt;/discard</div><div class='ctx'>  *</div><div class='ctx'>  * When built with BTRFS_CONFIG_DEBUG:</div><div class='ctx'>  *</div><div class='ctx'>  * btrfs_debug_feature_attrs		/sys/fs/btrfs/debug</div><div class='ctx'>  * btrfs_debug_mount_attrs		/sys/fs/btrfs/&lt;uuid&gt;/debug</div><div class='del'>- * discard_debug_attrs			/sys/fs/btrfs/&lt;uuid&gt;/debug/discard</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> struct btrfs_feature_attr {</div><div class='hunk'>@@ -61,6 +67,10 @@ struct raid_kobject {</div><div class='ctx'> 	.store	= _store,						\</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#define BTRFS_ATTR_W(_prefix, _name, _store)			        \</div><div class='add'>+	static struct kobj_attribute btrfs_attr_##_prefix##_##_name =	\</div><div class='add'>+			__INIT_KOBJ_ATTR(_name, 0200, NULL, _store)</div><div class='add'>+</div><div class='ctx'> #define BTRFS_ATTR_RW(_prefix, _name, _show, _store)			\</div><div class='ctx'> 	static struct kobj_attribute btrfs_attr_##_prefix##_##_name =	\</div><div class='ctx'> 			__INIT_KOBJ_ATTR(_name, 0644, _show, _store)</div><div class='hunk'>@@ -92,6 +102,7 @@ static struct btrfs_feature_attr btrfs_attr_features_##_name = {	     \</div><div class='ctx'> </div><div class='ctx'> static inline struct btrfs_fs_info *to_fs_info(struct kobject *kobj);</div><div class='ctx'> static inline struct btrfs_fs_devices *to_fs_devs(struct kobject *kobj);</div><div class='add'>+static struct kobject *get_btrfs_kobj(struct kobject *kobj);</div><div class='ctx'> </div><div class='ctx'> static struct btrfs_feature_attr *to_btrfs_feature_attr(struct kobj_attribute *a)</div><div class='ctx'> {</div><div class='hunk'>@@ -151,8 +162,7 @@ static int can_modify_feature(struct btrfs_feature_attr *fa)</div><div class='ctx'> 		clear = BTRFS_FEATURE_INCOMPAT_SAFE_CLEAR;</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='del'>-		pr_warn("btrfs: sysfs: unknown feature set %d\n",</div><div class='del'>-				fa-&gt;feature_set);</div><div class='add'>+		btrfs_warn(NULL, "sysfs: unknown feature set %d", fa-&gt;feature_set);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -242,7 +252,7 @@ static ssize_t btrfs_feature_attr_store(struct kobject *kobj,</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We don't want to do full transaction commit from inside sysfs</div><div class='ctx'> 	 */</div><div class='del'>-	btrfs_set_pending(fs_info, COMMIT);</div><div class='add'>+	set_bit(BTRFS_FS_NEED_TRANS_COMMIT, &amp;fs_info-&gt;flags);</div><div class='ctx'> 	wake_up_process(fs_info-&gt;transaction_kthread);</div><div class='ctx'> </div><div class='ctx'> 	return count;</div><div class='hunk'>@@ -270,23 +280,28 @@ static umode_t btrfs_feature_visible(struct kobject *kobj,</div><div class='ctx'> 	return mode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-BTRFS_FEAT_ATTR_INCOMPAT(mixed_backref, MIXED_BACKREF);</div><div class='ctx'> BTRFS_FEAT_ATTR_INCOMPAT(default_subvol, DEFAULT_SUBVOL);</div><div class='ctx'> BTRFS_FEAT_ATTR_INCOMPAT(mixed_groups, MIXED_GROUPS);</div><div class='ctx'> BTRFS_FEAT_ATTR_INCOMPAT(compress_lzo, COMPRESS_LZO);</div><div class='ctx'> BTRFS_FEAT_ATTR_INCOMPAT(compress_zstd, COMPRESS_ZSTD);</div><div class='del'>-BTRFS_FEAT_ATTR_INCOMPAT(big_metadata, BIG_METADATA);</div><div class='ctx'> BTRFS_FEAT_ATTR_INCOMPAT(extended_iref, EXTENDED_IREF);</div><div class='ctx'> BTRFS_FEAT_ATTR_INCOMPAT(raid56, RAID56);</div><div class='ctx'> BTRFS_FEAT_ATTR_INCOMPAT(skinny_metadata, SKINNY_METADATA);</div><div class='ctx'> BTRFS_FEAT_ATTR_INCOMPAT(no_holes, NO_HOLES);</div><div class='ctx'> BTRFS_FEAT_ATTR_INCOMPAT(metadata_uuid, METADATA_UUID);</div><div class='ctx'> BTRFS_FEAT_ATTR_COMPAT_RO(free_space_tree, FREE_SPACE_TREE);</div><div class='add'>+BTRFS_FEAT_ATTR_COMPAT_RO(block_group_tree, BLOCK_GROUP_TREE);</div><div class='ctx'> BTRFS_FEAT_ATTR_INCOMPAT(raid1c34, RAID1C34);</div><div class='del'>-/* Remove once support for zoned allocation is feature complete */</div><div class='del'>-#ifdef CONFIG_BTRFS_DEBUG</div><div class='add'>+BTRFS_FEAT_ATTR_INCOMPAT(simple_quota, SIMPLE_QUOTA);</div><div class='add'>+#ifdef CONFIG_BLK_DEV_ZONED</div><div class='ctx'> BTRFS_FEAT_ATTR_INCOMPAT(zoned, ZONED);</div><div class='ctx'> #endif</div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+/* Remove once support for extent tree v2 is feature complete */</div><div class='add'>+BTRFS_FEAT_ATTR_INCOMPAT(extent_tree_v2, EXTENT_TREE_V2);</div><div class='add'>+/* Remove once support for raid stripe tree is feature complete. */</div><div class='add'>+BTRFS_FEAT_ATTR_INCOMPAT(raid_stripe_tree, RAID_STRIPE_TREE);</div><div class='add'>+#endif</div><div class='ctx'> #ifdef CONFIG_FS_VERITY</div><div class='ctx'> BTRFS_FEAT_ATTR_COMPAT_RO(verity, VERITY);</div><div class='ctx'> #endif</div><div class='hunk'>@@ -294,17 +309,15 @@ BTRFS_FEAT_ATTR_COMPAT_RO(verity, VERITY);</div><div class='ctx'> /*</div><div class='ctx'>  * Features which depend on feature bits and may differ between each fs.</div><div class='ctx'>  *</div><div class='del'>- * /sys/fs/btrfs/features      - all available features implemeted by this version</div><div class='add'>+ * /sys/fs/btrfs/features      - all available features implemented by this version</div><div class='ctx'>  * /sys/fs/btrfs/UUID/features - features of the fs which are enabled or</div><div class='ctx'>  *                               can be changed on a mounted filesystem.</div><div class='ctx'>  */</div><div class='ctx'> static struct attribute *btrfs_supported_feature_attrs[] = {</div><div class='del'>-	BTRFS_FEAT_ATTR_PTR(mixed_backref),</div><div class='ctx'> 	BTRFS_FEAT_ATTR_PTR(default_subvol),</div><div class='ctx'> 	BTRFS_FEAT_ATTR_PTR(mixed_groups),</div><div class='ctx'> 	BTRFS_FEAT_ATTR_PTR(compress_lzo),</div><div class='ctx'> 	BTRFS_FEAT_ATTR_PTR(compress_zstd),</div><div class='del'>-	BTRFS_FEAT_ATTR_PTR(big_metadata),</div><div class='ctx'> 	BTRFS_FEAT_ATTR_PTR(extended_iref),</div><div class='ctx'> 	BTRFS_FEAT_ATTR_PTR(raid56),</div><div class='ctx'> 	BTRFS_FEAT_ATTR_PTR(skinny_metadata),</div><div class='hunk'>@@ -312,9 +325,15 @@ static struct attribute *btrfs_supported_feature_attrs[] = {</div><div class='ctx'> 	BTRFS_FEAT_ATTR_PTR(metadata_uuid),</div><div class='ctx'> 	BTRFS_FEAT_ATTR_PTR(free_space_tree),</div><div class='ctx'> 	BTRFS_FEAT_ATTR_PTR(raid1c34),</div><div class='del'>-#ifdef CONFIG_BTRFS_DEBUG</div><div class='add'>+	BTRFS_FEAT_ATTR_PTR(block_group_tree),</div><div class='add'>+	BTRFS_FEAT_ATTR_PTR(simple_quota),</div><div class='add'>+#ifdef CONFIG_BLK_DEV_ZONED</div><div class='ctx'> 	BTRFS_FEAT_ATTR_PTR(zoned),</div><div class='ctx'> #endif</div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+	BTRFS_FEAT_ATTR_PTR(extent_tree_v2),</div><div class='add'>+	BTRFS_FEAT_ATTR_PTR(raid_stripe_tree),</div><div class='add'>+#endif</div><div class='ctx'> #ifdef CONFIG_FS_VERITY</div><div class='ctx'> 	BTRFS_FEAT_ATTR_PTR(verity),</div><div class='ctx'> #endif</div><div class='hunk'>@@ -367,6 +386,8 @@ static const char *rescue_opts[] = {</div><div class='ctx'> 	"nologreplay",</div><div class='ctx'> 	"ignorebadroots",</div><div class='ctx'> 	"ignoredatacsums",</div><div class='add'>+	"ignoremetacsums",</div><div class='add'>+	"ignoresuperflags",</div><div class='ctx'> 	"all",</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -390,19 +411,35 @@ static ssize_t supported_sectorsizes_show(struct kobject *kobj,</div><div class='ctx'> 					  char *buf)</div><div class='ctx'> {</div><div class='ctx'> 	ssize_t ret = 0;</div><div class='add'>+	bool has_output = false;</div><div class='ctx'> </div><div class='del'>-	/* 4K sector size is also supported with 64K page size */</div><div class='del'>-	if (PAGE_SIZE == SZ_64K)</div><div class='del'>-		ret += sysfs_emit_at(buf, ret, "%u ", SZ_4K);</div><div class='del'>-</div><div class='del'>-	/* Only sectorsize == PAGE_SIZE is now supported */</div><div class='del'>-	ret += sysfs_emit_at(buf, ret, "%lu\n", PAGE_SIZE);</div><div class='del'>-</div><div class='add'>+	for (u32 cur = BTRFS_MIN_BLOCKSIZE; cur &lt;= BTRFS_MAX_BLOCKSIZE; cur *= 2) {</div><div class='add'>+		if (!btrfs_supported_blocksize(cur))</div><div class='add'>+			continue;</div><div class='add'>+		if (has_output)</div><div class='add'>+			ret += sysfs_emit_at(buf, ret, " ");</div><div class='add'>+		ret += sysfs_emit_at(buf, ret, "%u", cur);</div><div class='add'>+		has_output = true;</div><div class='add'>+	}</div><div class='add'>+	ret += sysfs_emit_at(buf, ret, "\n");</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> BTRFS_ATTR(static_feature, supported_sectorsizes,</div><div class='ctx'> 	   supported_sectorsizes_show);</div><div class='ctx'> </div><div class='add'>+static ssize_t acl_show(struct kobject *kobj, struct kobj_attribute *a, char *buf)</div><div class='add'>+{</div><div class='add'>+	return sysfs_emit(buf, "%d\n", IS_ENABLED(CONFIG_BTRFS_FS_POSIX_ACL));</div><div class='add'>+}</div><div class='add'>+BTRFS_ATTR(static_feature, acl, acl_show);</div><div class='add'>+</div><div class='add'>+static ssize_t temp_fsid_supported_show(struct kobject *kobj,</div><div class='add'>+					struct kobj_attribute *a, char *buf)</div><div class='add'>+{</div><div class='add'>+	return sysfs_emit(buf, "0\n");</div><div class='add'>+}</div><div class='add'>+BTRFS_ATTR(static_feature, temp_fsid, temp_fsid_supported_show);</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Features which only depend on kernel version.</div><div class='ctx'>  *</div><div class='hunk'>@@ -410,11 +447,13 @@ BTRFS_ATTR(static_feature, supported_sectorsizes,</div><div class='ctx'>  * btrfs_supported_feature_attrs.</div><div class='ctx'>  */</div><div class='ctx'> static struct attribute *btrfs_supported_static_feature_attrs[] = {</div><div class='add'>+	BTRFS_ATTR_PTR(static_feature, acl),</div><div class='ctx'> 	BTRFS_ATTR_PTR(static_feature, rmdir_subvol),</div><div class='ctx'> 	BTRFS_ATTR_PTR(static_feature, supported_checksums),</div><div class='ctx'> 	BTRFS_ATTR_PTR(static_feature, send_stream_version),</div><div class='ctx'> 	BTRFS_ATTR_PTR(static_feature, supported_rescue_options),</div><div class='ctx'> 	BTRFS_ATTR_PTR(static_feature, supported_sectorsizes),</div><div class='add'>+	BTRFS_ATTR_PTR(static_feature, temp_fsid),</div><div class='ctx'> 	NULL</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -423,12 +462,10 @@ static const struct attribute_group btrfs_static_feature_attr_group = {</div><div class='ctx'> 	.attrs = btrfs_supported_static_feature_attrs,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_BTRFS_DEBUG</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Discard statistics and tunables</div><div class='ctx'>  */</div><div class='del'>-#define discard_to_fs_info(_kobj)	to_fs_info((_kobj)-&gt;parent-&gt;parent)</div><div class='add'>+#define discard_to_fs_info(_kobj)	to_fs_info(get_btrfs_kobj(_kobj))</div><div class='ctx'> </div><div class='ctx'> static ssize_t btrfs_discardable_bytes_show(struct kobject *kobj,</div><div class='ctx'> 					    struct kobj_attribute *a,</div><div class='hunk'>@@ -577,11 +614,11 @@ BTRFS_ATTR_RW(discard, max_discard_size, btrfs_discard_max_discard_size_show,</div><div class='ctx'> 	      btrfs_discard_max_discard_size_store);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Per-filesystem debugging of discard (when mounted with discard=async).</div><div class='add'>+ * Per-filesystem stats for discard (when mounted with discard=async).</div><div class='ctx'>  *</div><div class='del'>- * Path: /sys/fs/btrfs/&lt;uuid&gt;/debug/discard/</div><div class='add'>+ * Path: /sys/fs/btrfs/&lt;uuid&gt;/discard/</div><div class='ctx'>  */</div><div class='del'>-static const struct attribute *discard_debug_attrs[] = {</div><div class='add'>+static const struct attribute *discard_attrs[] = {</div><div class='ctx'> 	BTRFS_ATTR_PTR(discard, discardable_bytes),</div><div class='ctx'> 	BTRFS_ATTR_PTR(discard, discardable_extents),</div><div class='ctx'> 	BTRFS_ATTR_PTR(discard, discard_bitmap_bytes),</div><div class='hunk'>@@ -593,6 +630,8 @@ static const struct attribute *discard_debug_attrs[] = {</div><div class='ctx'> 	NULL,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_BTRFS_DEBUG</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Per-filesystem runtime debugging exported via sysfs.</div><div class='ctx'>  *</div><div class='hunk'>@@ -692,7 +731,7 @@ static void release_raid_kobj(struct kobject *kobj)</div><div class='ctx'> 	kfree(to_raid_kobj(kobj));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct kobj_type btrfs_raid_ktype = {</div><div class='add'>+static const struct kobj_type btrfs_raid_ktype = {</div><div class='ctx'> 	.sysfs_ops = &amp;kobj_sysfs_ops,</div><div class='ctx'> 	.release = release_raid_kobj,</div><div class='ctx'> 	.default_groups = raid_groups,</div><div class='hunk'>@@ -708,6 +747,151 @@ static ssize_t btrfs_space_info_show_##field(struct kobject *kobj,	\</div><div class='ctx'> }									\</div><div class='ctx'> BTRFS_ATTR(space_info, field, btrfs_space_info_show_##field)</div><div class='ctx'> </div><div class='add'>+static ssize_t btrfs_chunk_size_show(struct kobject *kobj,</div><div class='add'>+				     struct kobj_attribute *a, char *buf)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_space_info *sinfo = to_space_info(kobj);</div><div class='add'>+</div><div class='add'>+	return sysfs_emit(buf, "%llu\n", READ_ONCE(sinfo-&gt;chunk_size));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Store new chunk size in space info. Can be called on a read-only filesystem.</div><div class='add'>+ *</div><div class='add'>+ * If the new chunk size value is larger than 10% of free space it is reduced</div><div class='add'>+ * to match that limit. Alignment must be to 256M and the system chunk size</div><div class='add'>+ * cannot be set.</div><div class='add'>+ */</div><div class='add'>+static ssize_t btrfs_chunk_size_store(struct kobject *kobj,</div><div class='add'>+				      struct kobj_attribute *a,</div><div class='add'>+				      const char *buf, size_t len)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_space_info *space_info = to_space_info(kobj);</div><div class='add'>+	struct btrfs_fs_info *fs_info = to_fs_info(get_btrfs_kobj(kobj));</div><div class='add'>+	char *retptr;</div><div class='add'>+	u64 val;</div><div class='add'>+</div><div class='add'>+	if (!capable(CAP_SYS_ADMIN))</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	if (!fs_info-&gt;fs_devices)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	if (btrfs_is_zoned(fs_info))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	/* System block type must not be changed. */</div><div class='add'>+	if (space_info-&gt;flags &amp; BTRFS_BLOCK_GROUP_SYSTEM)</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	val = memparse(buf, &amp;retptr);</div><div class='add'>+	/* There could be trailing '\n', also catch any typos after the value */</div><div class='add'>+	retptr = skip_spaces(retptr);</div><div class='add'>+	if (*retptr != 0 || val == 0)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	val = min(val, BTRFS_MAX_DATA_CHUNK_SIZE);</div><div class='add'>+</div><div class='add'>+	/* Limit stripe size to 10% of available space. */</div><div class='add'>+	val = min(mult_perc(fs_info-&gt;fs_devices-&gt;total_rw_bytes, 10), val);</div><div class='add'>+</div><div class='add'>+	/* Must be multiple of 256M. */</div><div class='add'>+	val &amp;= ~((u64)SZ_256M - 1);</div><div class='add'>+</div><div class='add'>+	/* Must be at least 256M. */</div><div class='add'>+	if (val &lt; SZ_256M)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	btrfs_update_space_info_chunk_size(space_info, val);</div><div class='add'>+</div><div class='add'>+	return len;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t btrfs_size_classes_show(struct kobject *kobj,</div><div class='add'>+				       struct kobj_attribute *a, char *buf)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_space_info *sinfo = to_space_info(kobj);</div><div class='add'>+	struct btrfs_block_group *bg;</div><div class='add'>+	u32 none = 0;</div><div class='add'>+	u32 small = 0;</div><div class='add'>+	u32 medium = 0;</div><div class='add'>+	u32 large = 0;</div><div class='add'>+</div><div class='add'>+	for (int i = 0; i &lt; BTRFS_NR_RAID_TYPES; ++i) {</div><div class='add'>+		down_read(&amp;sinfo-&gt;groups_sem);</div><div class='add'>+		list_for_each_entry(bg, &amp;sinfo-&gt;block_groups[i], list) {</div><div class='add'>+			if (!btrfs_block_group_should_use_size_class(bg))</div><div class='add'>+				continue;</div><div class='add'>+			switch (bg-&gt;size_class) {</div><div class='add'>+			case BTRFS_BG_SZ_NONE:</div><div class='add'>+				none++;</div><div class='add'>+				break;</div><div class='add'>+			case BTRFS_BG_SZ_SMALL:</div><div class='add'>+				small++;</div><div class='add'>+				break;</div><div class='add'>+			case BTRFS_BG_SZ_MEDIUM:</div><div class='add'>+				medium++;</div><div class='add'>+				break;</div><div class='add'>+			case BTRFS_BG_SZ_LARGE:</div><div class='add'>+				large++;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+		up_read(&amp;sinfo-&gt;groups_sem);</div><div class='add'>+	}</div><div class='add'>+	return sysfs_emit(buf, "none %u\n"</div><div class='add'>+			       "small %u\n"</div><div class='add'>+			       "medium %u\n"</div><div class='add'>+			       "large %u\n",</div><div class='add'>+			       none, small, medium, large);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BTRFS_DEBUG</div><div class='add'>+/*</div><div class='add'>+ * Request chunk allocation with current chunk size.</div><div class='add'>+ */</div><div class='add'>+static ssize_t btrfs_force_chunk_alloc_store(struct kobject *kobj,</div><div class='add'>+					     struct kobj_attribute *a,</div><div class='add'>+					     const char *buf, size_t len)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_space_info *space_info = to_space_info(kobj);</div><div class='add'>+	struct btrfs_fs_info *fs_info = to_fs_info(get_btrfs_kobj(kobj));</div><div class='add'>+	struct btrfs_trans_handle *trans;</div><div class='add'>+	bool val;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (!capable(CAP_SYS_ADMIN))</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	if (sb_rdonly(fs_info-&gt;sb))</div><div class='add'>+		return -EROFS;</div><div class='add'>+</div><div class='add'>+	ret = kstrtobool(buf, &amp;val);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	if (!val)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This is unsafe to be called from sysfs context and may cause</div><div class='add'>+	 * unexpected problems.</div><div class='add'>+	 */</div><div class='add'>+	trans = btrfs_start_transaction(fs_info-&gt;tree_root, 0);</div><div class='add'>+	if (IS_ERR(trans))</div><div class='add'>+		return PTR_ERR(trans);</div><div class='add'>+	ret = btrfs_force_chunk_alloc(trans, space_info-&gt;flags);</div><div class='add'>+	btrfs_end_transaction(trans);</div><div class='add'>+</div><div class='add'>+	if (ret == 1)</div><div class='add'>+		return len;</div><div class='add'>+</div><div class='add'>+	return -ENOSPC;</div><div class='add'>+}</div><div class='add'>+BTRFS_ATTR_W(space_info, force_chunk_alloc, btrfs_force_chunk_alloc_store);</div><div class='add'>+</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> SPACE_INFO_ATTR(flags);</div><div class='ctx'> SPACE_INFO_ATTR(total_bytes);</div><div class='ctx'> SPACE_INFO_ATTR(bytes_used);</div><div class='hunk'>@@ -718,6 +902,117 @@ SPACE_INFO_ATTR(bytes_readonly);</div><div class='ctx'> SPACE_INFO_ATTR(bytes_zone_unusable);</div><div class='ctx'> SPACE_INFO_ATTR(disk_used);</div><div class='ctx'> SPACE_INFO_ATTR(disk_total);</div><div class='add'>+SPACE_INFO_ATTR(reclaim_count);</div><div class='add'>+SPACE_INFO_ATTR(reclaim_bytes);</div><div class='add'>+SPACE_INFO_ATTR(reclaim_errors);</div><div class='add'>+BTRFS_ATTR_RW(space_info, chunk_size, btrfs_chunk_size_show, btrfs_chunk_size_store);</div><div class='add'>+BTRFS_ATTR(space_info, size_classes, btrfs_size_classes_show);</div><div class='add'>+</div><div class='add'>+static ssize_t btrfs_sinfo_bg_reclaim_threshold_show(struct kobject *kobj,</div><div class='add'>+						     struct kobj_attribute *a,</div><div class='add'>+						     char *buf)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_space_info *space_info = to_space_info(kobj);</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;space_info-&gt;lock);</div><div class='add'>+	ret = sysfs_emit(buf, "%d\n", btrfs_calc_reclaim_threshold(space_info));</div><div class='add'>+	spin_unlock(&amp;space_info-&gt;lock);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t btrfs_sinfo_bg_reclaim_threshold_store(struct kobject *kobj,</div><div class='add'>+						      struct kobj_attribute *a,</div><div class='add'>+						      const char *buf, size_t len)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_space_info *space_info = to_space_info(kobj);</div><div class='add'>+	int thresh;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (READ_ONCE(space_info-&gt;dynamic_reclaim))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	ret = kstrtoint(buf, 10, &amp;thresh);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	if (thresh &lt; 0 || thresh &gt; 100)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	WRITE_ONCE(space_info-&gt;bg_reclaim_threshold, thresh);</div><div class='add'>+</div><div class='add'>+	return len;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+BTRFS_ATTR_RW(space_info, bg_reclaim_threshold,</div><div class='add'>+	      btrfs_sinfo_bg_reclaim_threshold_show,</div><div class='add'>+	      btrfs_sinfo_bg_reclaim_threshold_store);</div><div class='add'>+</div><div class='add'>+static ssize_t btrfs_sinfo_dynamic_reclaim_show(struct kobject *kobj,</div><div class='add'>+						struct kobj_attribute *a,</div><div class='add'>+						char *buf)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_space_info *space_info = to_space_info(kobj);</div><div class='add'>+</div><div class='add'>+	return sysfs_emit(buf, "%d\n", READ_ONCE(space_info-&gt;dynamic_reclaim));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t btrfs_sinfo_dynamic_reclaim_store(struct kobject *kobj,</div><div class='add'>+						 struct kobj_attribute *a,</div><div class='add'>+						 const char *buf, size_t len)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_space_info *space_info = to_space_info(kobj);</div><div class='add'>+	int dynamic_reclaim;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = kstrtoint(buf, 10, &amp;dynamic_reclaim);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	if (dynamic_reclaim &lt; 0)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	WRITE_ONCE(space_info-&gt;dynamic_reclaim, dynamic_reclaim != 0);</div><div class='add'>+</div><div class='add'>+	return len;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+BTRFS_ATTR_RW(space_info, dynamic_reclaim,</div><div class='add'>+	      btrfs_sinfo_dynamic_reclaim_show,</div><div class='add'>+	      btrfs_sinfo_dynamic_reclaim_store);</div><div class='add'>+</div><div class='add'>+static ssize_t btrfs_sinfo_periodic_reclaim_show(struct kobject *kobj,</div><div class='add'>+						struct kobj_attribute *a,</div><div class='add'>+						char *buf)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_space_info *space_info = to_space_info(kobj);</div><div class='add'>+</div><div class='add'>+	return sysfs_emit(buf, "%d\n", READ_ONCE(space_info-&gt;periodic_reclaim));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t btrfs_sinfo_periodic_reclaim_store(struct kobject *kobj,</div><div class='add'>+						 struct kobj_attribute *a,</div><div class='add'>+						 const char *buf, size_t len)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_space_info *space_info = to_space_info(kobj);</div><div class='add'>+	int periodic_reclaim;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = kstrtoint(buf, 10, &amp;periodic_reclaim);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	if (periodic_reclaim &lt; 0)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	WRITE_ONCE(space_info-&gt;periodic_reclaim, periodic_reclaim != 0);</div><div class='add'>+</div><div class='add'>+	return len;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+BTRFS_ATTR_RW(space_info, periodic_reclaim,</div><div class='add'>+	      btrfs_sinfo_periodic_reclaim_show,</div><div class='add'>+	      btrfs_sinfo_periodic_reclaim_store);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Allocation information about block group types.</div><div class='hunk'>@@ -735,6 +1030,17 @@ static struct attribute *space_info_attrs[] = {</div><div class='ctx'> 	BTRFS_ATTR_PTR(space_info, bytes_zone_unusable),</div><div class='ctx'> 	BTRFS_ATTR_PTR(space_info, disk_used),</div><div class='ctx'> 	BTRFS_ATTR_PTR(space_info, disk_total),</div><div class='add'>+	BTRFS_ATTR_PTR(space_info, bg_reclaim_threshold),</div><div class='add'>+	BTRFS_ATTR_PTR(space_info, dynamic_reclaim),</div><div class='add'>+	BTRFS_ATTR_PTR(space_info, chunk_size),</div><div class='add'>+	BTRFS_ATTR_PTR(space_info, size_classes),</div><div class='add'>+	BTRFS_ATTR_PTR(space_info, reclaim_count),</div><div class='add'>+	BTRFS_ATTR_PTR(space_info, reclaim_bytes),</div><div class='add'>+	BTRFS_ATTR_PTR(space_info, reclaim_errors),</div><div class='add'>+	BTRFS_ATTR_PTR(space_info, periodic_reclaim),</div><div class='add'>+#ifdef CONFIG_BTRFS_DEBUG</div><div class='add'>+	BTRFS_ATTR_PTR(space_info, force_chunk_alloc),</div><div class='add'>+#endif</div><div class='ctx'> 	NULL,</div><div class='ctx'> };</div><div class='ctx'> ATTRIBUTE_GROUPS(space_info);</div><div class='hunk'>@@ -745,7 +1051,7 @@ static void space_info_release(struct kobject *kobj)</div><div class='ctx'> 	kfree(sinfo);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct kobj_type space_info_ktype = {</div><div class='add'>+static const struct kobj_type space_info_ktype = {</div><div class='ctx'> 	.sysfs_ops = &amp;kobj_sysfs_ops,</div><div class='ctx'> 	.release = space_info_release,</div><div class='ctx'> 	.default_groups = space_info_groups,</div><div class='hunk'>@@ -806,7 +1112,7 @@ static ssize_t btrfs_label_store(struct kobject *kobj,</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We don't want to do full transaction commit from inside sysfs</div><div class='ctx'> 	 */</div><div class='del'>-	btrfs_set_pending(fs_info, COMMIT);</div><div class='add'>+	set_bit(BTRFS_FS_NEED_TRANS_COMMIT, &amp;fs_info-&gt;flags);</div><div class='ctx'> 	wake_up_process(fs_info-&gt;transaction_kthread);</div><div class='ctx'> </div><div class='ctx'> 	return len;</div><div class='hunk'>@@ -818,7 +1124,7 @@ static ssize_t btrfs_nodesize_show(struct kobject *kobj,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = to_fs_info(kobj);</div><div class='ctx'> </div><div class='del'>-	return sysfs_emit(buf, "%u\n", fs_info-&gt;super_copy-&gt;nodesize);</div><div class='add'>+	return sysfs_emit(buf, "%u\n", fs_info-&gt;nodesize);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> BTRFS_ATTR(, nodesize, btrfs_nodesize_show);</div><div class='hunk'>@@ -828,17 +1134,117 @@ static ssize_t btrfs_sectorsize_show(struct kobject *kobj,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = to_fs_info(kobj);</div><div class='ctx'> </div><div class='del'>-	return sysfs_emit(buf, "%u\n", fs_info-&gt;super_copy-&gt;sectorsize);</div><div class='add'>+	return sysfs_emit(buf, "%u\n", fs_info-&gt;sectorsize);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> BTRFS_ATTR(, sectorsize, btrfs_sectorsize_show);</div><div class='ctx'> </div><div class='add'>+static ssize_t btrfs_commit_stats_show(struct kobject *kobj,</div><div class='add'>+				       struct kobj_attribute *a, char *buf)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = to_fs_info(kobj);</div><div class='add'>+	u64 now = ktime_get_ns();</div><div class='add'>+	u64 start_time = fs_info-&gt;commit_stats.critical_section_start_time;</div><div class='add'>+	u64 pending = 0;</div><div class='add'>+</div><div class='add'>+	if (start_time)</div><div class='add'>+		pending = now - start_time;</div><div class='add'>+</div><div class='add'>+	return sysfs_emit(buf,</div><div class='add'>+		"commits %llu\n"</div><div class='add'>+		"cur_commit_ms %llu\n"</div><div class='add'>+		"last_commit_ms %llu\n"</div><div class='add'>+		"max_commit_ms %llu\n"</div><div class='add'>+		"total_commit_ms %llu\n",</div><div class='add'>+		fs_info-&gt;commit_stats.commit_count,</div><div class='add'>+		div_u64(pending, NSEC_PER_MSEC),</div><div class='add'>+		div_u64(fs_info-&gt;commit_stats.last_commit_dur, NSEC_PER_MSEC),</div><div class='add'>+		div_u64(fs_info-&gt;commit_stats.max_commit_dur, NSEC_PER_MSEC),</div><div class='add'>+		div_u64(fs_info-&gt;commit_stats.total_commit_dur, NSEC_PER_MSEC));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t btrfs_commit_stats_store(struct kobject *kobj,</div><div class='add'>+					struct kobj_attribute *a,</div><div class='add'>+					const char *buf, size_t len)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = to_fs_info(kobj);</div><div class='add'>+	unsigned long val;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (!fs_info)</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	if (!capable(CAP_SYS_RESOURCE))</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	ret = kstrtoul(buf, 10, &amp;val);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+	if (val)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	WRITE_ONCE(fs_info-&gt;commit_stats.max_commit_dur, 0);</div><div class='add'>+</div><div class='add'>+	return len;</div><div class='add'>+}</div><div class='add'>+BTRFS_ATTR_RW(, commit_stats, btrfs_commit_stats_show, btrfs_commit_stats_store);</div><div class='add'>+</div><div class='add'>+static ssize_t btrfs_zoned_stats_show(struct kobject *kobj,</div><div class='add'>+				      struct kobj_attribute *a, char *buf)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = to_fs_info(kobj);</div><div class='add'>+	struct btrfs_block_group *bg;</div><div class='add'>+	size_t ret = 0;</div><div class='add'>+</div><div class='add'>+</div><div class='add'>+	if (!btrfs_is_zoned(fs_info))</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fs_info-&gt;zone_active_bgs_lock);</div><div class='add'>+	ret += sysfs_emit_at(buf, ret, "active block-groups: %zu\n",</div><div class='add'>+			     list_count_nodes(&amp;fs_info-&gt;zone_active_bgs));</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;zone_active_bgs_lock);</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;fs_info-&gt;reclaim_bgs_lock);</div><div class='add'>+	spin_lock(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='add'>+	ret += sysfs_emit_at(buf, ret, "\treclaimable: %zu\n",</div><div class='add'>+			     list_count_nodes(&amp;fs_info-&gt;reclaim_bgs));</div><div class='add'>+	ret += sysfs_emit_at(buf, ret, "\tunused: %zu\n",</div><div class='add'>+			     list_count_nodes(&amp;fs_info-&gt;unused_bgs));</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='add'>+	mutex_unlock(&amp;fs_info-&gt;reclaim_bgs_lock);</div><div class='add'>+</div><div class='add'>+	ret += sysfs_emit_at(buf, ret, "\tneed reclaim: %s\n",</div><div class='add'>+			     str_true_false(btrfs_zoned_should_reclaim(fs_info)));</div><div class='add'>+</div><div class='add'>+	if (fs_info-&gt;data_reloc_bg)</div><div class='add'>+		ret += sysfs_emit_at(buf, ret,</div><div class='add'>+				     "data relocation block-group: %llu\n",</div><div class='add'>+				     fs_info-&gt;data_reloc_bg);</div><div class='add'>+	if (fs_info-&gt;treelog_bg)</div><div class='add'>+		ret += sysfs_emit_at(buf, ret,</div><div class='add'>+				     "tree-log block-group: %llu\n",</div><div class='add'>+				     fs_info-&gt;treelog_bg);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fs_info-&gt;zone_active_bgs_lock);</div><div class='add'>+	ret += sysfs_emit_at(buf, ret, "active zones:\n");</div><div class='add'>+	list_for_each_entry(bg, &amp;fs_info-&gt;zone_active_bgs, active_bg_list) {</div><div class='add'>+		ret += sysfs_emit_at(buf, ret,</div><div class='add'>+				     "\tstart: %llu, wp: %llu used: %llu, reserved: %llu, unusable: %llu\n",</div><div class='add'>+				     bg-&gt;start, bg-&gt;alloc_offset, bg-&gt;used,</div><div class='add'>+				     bg-&gt;reserved, bg-&gt;zone_unusable);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;zone_active_bgs_lock);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+BTRFS_ATTR(, zoned_stats, btrfs_zoned_stats_show);</div><div class='add'>+</div><div class='ctx'> static ssize_t btrfs_clone_alignment_show(struct kobject *kobj,</div><div class='ctx'> 				struct kobj_attribute *a, char *buf)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = to_fs_info(kobj);</div><div class='ctx'> </div><div class='del'>-	return sysfs_emit(buf, "%u\n", fs_info-&gt;super_copy-&gt;sectorsize);</div><div class='add'>+	return sysfs_emit(buf, "%u\n", fs_info-&gt;sectorsize);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> BTRFS_ATTR(, clone_alignment, btrfs_clone_alignment_show);</div><div class='hunk'>@@ -859,7 +1265,7 @@ static ssize_t quota_override_store(struct kobject *kobj,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = to_fs_info(kobj);</div><div class='ctx'> 	unsigned long knob;</div><div class='del'>-	int err;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!fs_info)</div><div class='ctx'> 		return -EPERM;</div><div class='hunk'>@@ -867,9 +1273,9 @@ static ssize_t quota_override_store(struct kobject *kobj,</div><div class='ctx'> 	if (!capable(CAP_SYS_RESOURCE))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='del'>-	err = kstrtoul(buf, 10, &amp;knob);</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='add'>+	ret = kstrtoul(buf, 10, &amp;knob);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='ctx'> 	if (knob &gt; 1)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='hunk'>@@ -919,6 +1325,9 @@ static ssize_t btrfs_exclusive_operation_show(struct kobject *kobj,</div><div class='ctx'> 		case BTRFS_EXCLOP_BALANCE:</div><div class='ctx'> 			str = "balance\n";</div><div class='ctx'> 			break;</div><div class='add'>+		case BTRFS_EXCLOP_BALANCE_PAUSED:</div><div class='add'>+			str = "balance paused\n";</div><div class='add'>+			break;</div><div class='ctx'> 		case BTRFS_EXCLOP_DEV_ADD:</div><div class='ctx'> 			str = "device add\n";</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -947,50 +1356,119 @@ static ssize_t btrfs_generation_show(struct kobject *kobj,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = to_fs_info(kobj);</div><div class='ctx'> </div><div class='del'>-	return sysfs_emit(buf, "%llu\n", fs_info-&gt;generation);</div><div class='add'>+	return sysfs_emit(buf, "%llu\n", btrfs_get_fs_generation(fs_info));</div><div class='ctx'> }</div><div class='ctx'> BTRFS_ATTR(, generation, btrfs_generation_show);</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Look for an exact string @string in @buffer with possible leading or</div><div class='del'>- * trailing whitespace</div><div class='del'>- */</div><div class='del'>-static bool strmatch(const char *buffer, const char *string)</div><div class='add'>+static ssize_t btrfs_temp_fsid_show(struct kobject *kobj,</div><div class='add'>+				    struct kobj_attribute *a, char *buf)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = to_fs_info(kobj);</div><div class='add'>+</div><div class='add'>+	return sysfs_emit(buf, "%d\n", fs_info-&gt;fs_devices-&gt;temp_fsid);</div><div class='add'>+}</div><div class='add'>+BTRFS_ATTR(, temp_fsid, btrfs_temp_fsid_show);</div><div class='add'>+</div><div class='add'>+static const char *btrfs_read_policy_name[] = {</div><div class='add'>+	"pid",</div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+	"round-robin",</div><div class='add'>+	"devid",</div><div class='add'>+#endif</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+</div><div class='add'>+/* Global module configuration parameters. */</div><div class='add'>+static char *read_policy;</div><div class='add'>+char *btrfs_get_mod_read_policy(void)</div><div class='ctx'> {</div><div class='del'>-	const size_t len = strlen(string);</div><div class='add'>+	return read_policy;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Set perms to 0, disable /sys/module/btrfs/parameter/read_policy interface. */</div><div class='add'>+module_param(read_policy, charp, 0);</div><div class='add'>+MODULE_PARM_DESC(read_policy,</div><div class='add'>+"Global read policy: pid (default), round-robin[:&lt;min_contig_read&gt;], devid[:&lt;devid&gt;]");</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+int btrfs_read_policy_to_enum(const char *str, s64 *value_ret)</div><div class='add'>+{</div><div class='add'>+	char param[32];</div><div class='add'>+	char __maybe_unused *value_str;</div><div class='add'>+</div><div class='add'>+	if (!str || strlen(str) == 0)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	strscpy(param, str);</div><div class='ctx'> </div><div class='del'>-	/* Skip leading whitespace */</div><div class='del'>-	buffer = skip_spaces(buffer);</div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+	/* Separate value from input in policy:value format. */</div><div class='add'>+	value_str = strchr(param, ':');</div><div class='add'>+	if (value_str) {</div><div class='add'>+		char *retptr;</div><div class='ctx'> </div><div class='del'>-	/* Match entire string, check if the rest is whitespace or empty */</div><div class='del'>-	if (strncmp(string, buffer, len) == 0 &amp;&amp;</div><div class='del'>-	    strlen(skip_spaces(buffer + len)) == 0)</div><div class='del'>-		return true;</div><div class='add'>+		*value_str = 0;</div><div class='add'>+		value_str++;</div><div class='add'>+		if (!value_ret)</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	return false;</div><div class='add'>+		*value_ret = memparse(value_str, &amp;retptr);</div><div class='add'>+		/* There could be any trailing typos after the value. */</div><div class='add'>+		retptr = skip_spaces(retptr);</div><div class='add'>+		if (*retptr != 0 || *value_ret &lt;= 0)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+	return sysfs_match_string(btrfs_read_policy_name, param);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static const char * const btrfs_read_policy_name[] = { "pid" };</div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+int __init btrfs_read_policy_init(void)</div><div class='add'>+{</div><div class='add'>+	s64 value;</div><div class='add'>+</div><div class='add'>+	if (btrfs_read_policy_to_enum(read_policy, &amp;value) == -EINVAL) {</div><div class='add'>+		btrfs_err(NULL, "invalid read policy or value %s", read_policy);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='ctx'> static ssize_t btrfs_read_policy_show(struct kobject *kobj,</div><div class='ctx'> 				      struct kobj_attribute *a, char *buf)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_devices *fs_devices = to_fs_devs(kobj);</div><div class='add'>+	const enum btrfs_read_policy policy = READ_ONCE(fs_devices-&gt;read_policy);</div><div class='ctx'> 	ssize_t ret = 0;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; BTRFS_NR_READ_POLICY; i++) {</div><div class='del'>-		if (fs_devices-&gt;read_policy == i)</div><div class='del'>-			ret += scnprintf(buf + ret, PAGE_SIZE - ret, "%s[%s]",</div><div class='del'>-					 (ret == 0 ? "" : " "),</div><div class='del'>-					 btrfs_read_policy_name[i]);</div><div class='del'>-		else</div><div class='del'>-			ret += scnprintf(buf + ret, PAGE_SIZE - ret, "%s%s",</div><div class='del'>-					 (ret == 0 ? "" : " "),</div><div class='del'>-					 btrfs_read_policy_name[i]);</div><div class='add'>+		if (ret != 0)</div><div class='add'>+			ret += sysfs_emit_at(buf, ret, " ");</div><div class='add'>+</div><div class='add'>+		if (i == policy)</div><div class='add'>+			ret += sysfs_emit_at(buf, ret, "[");</div><div class='add'>+</div><div class='add'>+		ret += sysfs_emit_at(buf, ret, "%s", btrfs_read_policy_name[i]);</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+		if (i == BTRFS_READ_POLICY_RR)</div><div class='add'>+			ret += sysfs_emit_at(buf, ret, ":%u",</div><div class='add'>+					     READ_ONCE(fs_devices-&gt;rr_min_contig_read));</div><div class='add'>+</div><div class='add'>+		if (i == BTRFS_READ_POLICY_DEVID)</div><div class='add'>+			ret += sysfs_emit_at(buf, ret, ":%llu",</div><div class='add'>+					     READ_ONCE(fs_devices-&gt;read_devid));</div><div class='add'>+#endif</div><div class='add'>+		if (i == policy)</div><div class='add'>+			ret += sysfs_emit_at(buf, ret, "]");</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret += scnprintf(buf + ret, PAGE_SIZE - ret, "\n");</div><div class='add'>+	ret += sysfs_emit_at(buf, ret, "\n");</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -1000,21 +1478,80 @@ static ssize_t btrfs_read_policy_store(struct kobject *kobj,</div><div class='ctx'> 				       const char *buf, size_t len)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_devices *fs_devices = to_fs_devs(kobj);</div><div class='del'>-	int i;</div><div class='add'>+	int index;</div><div class='add'>+	s64 value = -1;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; BTRFS_NR_READ_POLICY; i++) {</div><div class='del'>-		if (strmatch(buf, btrfs_read_policy_name[i])) {</div><div class='del'>-			if (i != fs_devices-&gt;read_policy) {</div><div class='del'>-				fs_devices-&gt;read_policy = i;</div><div class='del'>-				btrfs_info(fs_devices-&gt;fs_info,</div><div class='del'>-					   "read policy set to '%s'",</div><div class='del'>-					   btrfs_read_policy_name[i]);</div><div class='add'>+	index = btrfs_read_policy_to_enum(buf, &amp;value);</div><div class='add'>+	if (index &lt; 0)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+	/* If moving from RR then disable collecting fs stats. */</div><div class='add'>+	if (fs_devices-&gt;read_policy == BTRFS_READ_POLICY_RR &amp;&amp; index != BTRFS_READ_POLICY_RR)</div><div class='add'>+		fs_devices-&gt;collect_fs_stats = false;</div><div class='add'>+</div><div class='add'>+	if (index == BTRFS_READ_POLICY_RR) {</div><div class='add'>+		if (value != -1) {</div><div class='add'>+			const u32 sectorsize = fs_devices-&gt;fs_info-&gt;sectorsize;</div><div class='add'>+</div><div class='add'>+			if (!IS_ALIGNED(value, sectorsize)) {</div><div class='add'>+				u64 temp_value = round_up(value, sectorsize);</div><div class='add'>+</div><div class='add'>+				btrfs_debug(fs_devices-&gt;fs_info,</div><div class='add'>+"read_policy: min contig read %lld should be multiple of sectorsize %u, rounded to %llu",</div><div class='add'>+					  value, sectorsize, temp_value);</div><div class='add'>+				value = temp_value;</div><div class='ctx'> 			}</div><div class='del'>-			return len;</div><div class='add'>+		} else {</div><div class='add'>+			value = BTRFS_DEFAULT_RR_MIN_CONTIG_READ;</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='add'>+		if (index != READ_ONCE(fs_devices-&gt;read_policy) ||</div><div class='add'>+		    value != READ_ONCE(fs_devices-&gt;rr_min_contig_read)) {</div><div class='add'>+			WRITE_ONCE(fs_devices-&gt;read_policy, index);</div><div class='add'>+			WRITE_ONCE(fs_devices-&gt;rr_min_contig_read, value);</div><div class='add'>+</div><div class='add'>+			btrfs_info(fs_devices-&gt;fs_info, "read policy set to '%s:%lld'",</div><div class='add'>+				   btrfs_read_policy_name[index], value);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		fs_devices-&gt;collect_fs_stats = true;</div><div class='add'>+</div><div class='add'>+		return len;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (index == BTRFS_READ_POLICY_DEVID) {</div><div class='add'>+		if (value != -1) {</div><div class='add'>+			BTRFS_DEV_LOOKUP_ARGS(args);</div><div class='add'>+</div><div class='add'>+			/* Validate input devid. */</div><div class='add'>+			args.devid = value;</div><div class='add'>+			if (btrfs_find_device(fs_devices, &amp;args) == NULL)</div><div class='add'>+				return -EINVAL;</div><div class='add'>+		} else {</div><div class='add'>+			/* Set default devid to the devid of the latest device. */</div><div class='add'>+			value = fs_devices-&gt;latest_dev-&gt;devid;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (index != READ_ONCE(fs_devices-&gt;read_policy) ||</div><div class='add'>+		    value != READ_ONCE(fs_devices-&gt;read_devid)) {</div><div class='add'>+			WRITE_ONCE(fs_devices-&gt;read_policy, index);</div><div class='add'>+			WRITE_ONCE(fs_devices-&gt;read_devid, value);</div><div class='add'>+</div><div class='add'>+			btrfs_info(fs_devices-&gt;fs_info, "read policy set to '%s:%llu'",</div><div class='add'>+				   btrfs_read_policy_name[index], value);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		return len;</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='add'>+	if (index != READ_ONCE(fs_devices-&gt;read_policy)) {</div><div class='add'>+		WRITE_ONCE(fs_devices-&gt;read_policy, index);</div><div class='add'>+		btrfs_info(fs_devices-&gt;fs_info, "read policy set to '%s'",</div><div class='add'>+			   btrfs_read_policy_name[index]);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return -EINVAL;</div><div class='add'>+	return len;</div><div class='ctx'> }</div><div class='ctx'> BTRFS_ATTR_RW(, read_policy, btrfs_read_policy_show, btrfs_read_policy_store);</div><div class='ctx'> </div><div class='hunk'>@@ -1023,11 +1560,8 @@ static ssize_t btrfs_bg_reclaim_threshold_show(struct kobject *kobj,</div><div class='ctx'> 					       char *buf)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = to_fs_info(kobj);</div><div class='del'>-	ssize_t ret;</div><div class='ctx'> </div><div class='del'>-	ret = sysfs_emit(buf, "%d\n", READ_ONCE(fs_info-&gt;bg_reclaim_threshold));</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='add'>+	return sysfs_emit(buf, "%d\n", READ_ONCE(fs_info-&gt;bg_reclaim_threshold));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t btrfs_bg_reclaim_threshold_store(struct kobject *kobj,</div><div class='hunk'>@@ -1042,8 +1576,13 @@ static ssize_t btrfs_bg_reclaim_threshold_store(struct kobject *kobj,</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_BTRFS_DEBUG</div><div class='add'>+	if (thresh != 0 &amp;&amp; (thresh &gt; 100))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+#else</div><div class='ctx'> 	if (thresh != 0 &amp;&amp; (thresh &lt;= 50 || thresh &gt; 100))</div><div class='ctx'> 		return -EINVAL;</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='ctx'> 	WRITE_ONCE(fs_info-&gt;bg_reclaim_threshold, thresh);</div><div class='ctx'> </div><div class='hunk'>@@ -1052,6 +1591,47 @@ static ssize_t btrfs_bg_reclaim_threshold_store(struct kobject *kobj,</div><div class='ctx'> BTRFS_ATTR_RW(, bg_reclaim_threshold, btrfs_bg_reclaim_threshold_show,</div><div class='ctx'> 	      btrfs_bg_reclaim_threshold_store);</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+static ssize_t btrfs_offload_csum_show(struct kobject *kobj,</div><div class='add'>+				       struct kobj_attribute *a, char *buf)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_devices *fs_devices = to_fs_devs(kobj);</div><div class='add'>+</div><div class='add'>+	switch (READ_ONCE(fs_devices-&gt;offload_csum_mode)) {</div><div class='add'>+	case BTRFS_OFFLOAD_CSUM_AUTO:</div><div class='add'>+		return sysfs_emit(buf, "auto\n");</div><div class='add'>+	case BTRFS_OFFLOAD_CSUM_FORCE_ON:</div><div class='add'>+		return sysfs_emit(buf, "1\n");</div><div class='add'>+	case BTRFS_OFFLOAD_CSUM_FORCE_OFF:</div><div class='add'>+		return sysfs_emit(buf, "0\n");</div><div class='add'>+	default:</div><div class='add'>+		WARN_ON(1);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t btrfs_offload_csum_store(struct kobject *kobj,</div><div class='add'>+					struct kobj_attribute *a, const char *buf,</div><div class='add'>+					size_t len)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_devices *fs_devices = to_fs_devs(kobj);</div><div class='add'>+	int ret;</div><div class='add'>+	bool val;</div><div class='add'>+</div><div class='add'>+	ret = kstrtobool(buf, &amp;val);</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		WRITE_ONCE(fs_devices-&gt;offload_csum_mode,</div><div class='add'>+			   val ? BTRFS_OFFLOAD_CSUM_FORCE_ON : BTRFS_OFFLOAD_CSUM_FORCE_OFF);</div><div class='add'>+	else if (ret == -EINVAL &amp;&amp; sysfs_streq(buf, "auto"))</div><div class='add'>+		WRITE_ONCE(fs_devices-&gt;offload_csum_mode, BTRFS_OFFLOAD_CSUM_AUTO);</div><div class='add'>+	else</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	return len;</div><div class='add'>+}</div><div class='add'>+BTRFS_ATTR_RW(, offload_csum, btrfs_offload_csum_show, btrfs_offload_csum_store);</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Per-filesystem information and stats.</div><div class='ctx'>  *</div><div class='hunk'>@@ -1069,6 +1649,12 @@ static const struct attribute *btrfs_attrs[] = {</div><div class='ctx'> 	BTRFS_ATTR_PTR(, generation),</div><div class='ctx'> 	BTRFS_ATTR_PTR(, read_policy),</div><div class='ctx'> 	BTRFS_ATTR_PTR(, bg_reclaim_threshold),</div><div class='add'>+	BTRFS_ATTR_PTR(, commit_stats),</div><div class='add'>+	BTRFS_ATTR_PTR(, temp_fsid),</div><div class='add'>+	BTRFS_ATTR_PTR(, zoned_stats),</div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+	BTRFS_ATTR_PTR(, offload_csum),</div><div class='add'>+#endif</div><div class='ctx'> 	NULL,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -1080,7 +1666,7 @@ static void btrfs_release_fsid_kobj(struct kobject *kobj)</div><div class='ctx'> 	complete(&amp;fs_devs-&gt;kobj_unregister);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct kobj_type btrfs_ktype = {</div><div class='add'>+static const struct kobj_type btrfs_ktype = {</div><div class='ctx'> 	.sysfs_ops	= &amp;kobj_sysfs_ops,</div><div class='ctx'> 	.release	= btrfs_release_fsid_kobj,</div><div class='ctx'> };</div><div class='hunk'>@@ -1099,11 +1685,26 @@ static inline struct btrfs_fs_info *to_fs_info(struct kobject *kobj)</div><div class='ctx'> 	return to_fs_devs(kobj)-&gt;fs_info;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static struct kobject *get_btrfs_kobj(struct kobject *kobj)</div><div class='add'>+{</div><div class='add'>+	while (kobj) {</div><div class='add'>+		if (kobj-&gt;ktype == &amp;btrfs_ktype)</div><div class='add'>+			return kobj;</div><div class='add'>+		kobj = kobj-&gt;parent;</div><div class='add'>+	}</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> #define NUM_FEATURE_BITS 64</div><div class='ctx'> #define BTRFS_FEATURE_NAME_MAX 13</div><div class='ctx'> static char btrfs_unknown_feature_names[FEAT_MAX][NUM_FEATURE_BITS][BTRFS_FEATURE_NAME_MAX];</div><div class='ctx'> static struct btrfs_feature_attr btrfs_feature_attrs[FEAT_MAX][NUM_FEATURE_BITS];</div><div class='ctx'> </div><div class='add'>+static_assert(ARRAY_SIZE(btrfs_unknown_feature_names) ==</div><div class='add'>+	      ARRAY_SIZE(btrfs_feature_attrs));</div><div class='add'>+static_assert(ARRAY_SIZE(btrfs_unknown_feature_names[0]) ==</div><div class='add'>+	      ARRAY_SIZE(btrfs_feature_attrs[0]));</div><div class='add'>+</div><div class='ctx'> static const u64 supported_feature_masks[FEAT_MAX] = {</div><div class='ctx'> 	[FEAT_COMPAT]    = BTRFS_FEATURE_COMPAT_SUPP,</div><div class='ctx'> 	[FEAT_COMPAT_RO] = BTRFS_FEATURE_COMPAT_RO_SUPP,</div><div class='hunk'>@@ -1212,13 +1813,12 @@ void btrfs_sysfs_remove_mounted(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 		kobject_del(fs_info-&gt;space_info_kobj);</div><div class='ctx'> 		kobject_put(fs_info-&gt;space_info_kobj);</div><div class='ctx'> 	}</div><div class='del'>-#ifdef CONFIG_BTRFS_DEBUG</div><div class='del'>-	if (fs_info-&gt;discard_debug_kobj) {</div><div class='del'>-		sysfs_remove_files(fs_info-&gt;discard_debug_kobj,</div><div class='del'>-				   discard_debug_attrs);</div><div class='del'>-		kobject_del(fs_info-&gt;discard_debug_kobj);</div><div class='del'>-		kobject_put(fs_info-&gt;discard_debug_kobj);</div><div class='add'>+	if (fs_info-&gt;discard_kobj) {</div><div class='add'>+		sysfs_remove_files(fs_info-&gt;discard_kobj, discard_attrs);</div><div class='add'>+		kobject_del(fs_info-&gt;discard_kobj);</div><div class='add'>+		kobject_put(fs_info-&gt;discard_kobj);</div><div class='ctx'> 	}</div><div class='add'>+#ifdef CONFIG_BTRFS_DEBUG</div><div class='ctx'> 	if (fs_info-&gt;debug_kobj) {</div><div class='ctx'> 		sysfs_remove_files(fs_info-&gt;debug_kobj, btrfs_debug_mount_attrs);</div><div class='ctx'> 		kobject_del(fs_info-&gt;debug_kobj);</div><div class='hunk'>@@ -1272,11 +1872,6 @@ static void init_feature_attrs(void)</div><div class='ctx'> 	struct btrfs_feature_attr *fa;</div><div class='ctx'> 	int set, i;</div><div class='ctx'> </div><div class='del'>-	BUILD_BUG_ON(ARRAY_SIZE(btrfs_unknown_feature_names) !=</div><div class='del'>-		     ARRAY_SIZE(btrfs_feature_attrs));</div><div class='del'>-	BUILD_BUG_ON(ARRAY_SIZE(btrfs_unknown_feature_names[0]) !=</div><div class='del'>-		     ARRAY_SIZE(btrfs_feature_attrs[0]));</div><div class='del'>-</div><div class='ctx'> 	memset(btrfs_feature_attrs, 0, sizeof(btrfs_feature_attrs));</div><div class='ctx'> 	memset(btrfs_unknown_feature_names, 0,</div><div class='ctx'> 	       sizeof(btrfs_unknown_feature_names));</div><div class='hunk'>@@ -1399,16 +1994,35 @@ void btrfs_sysfs_remove_space_info(struct btrfs_space_info *space_info)</div><div class='ctx'> 	kobject_put(&amp;space_info-&gt;kobj);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static const char *alloc_name(u64 flags)</div><div class='add'>+static const char *alloc_name(struct btrfs_space_info *space_info)</div><div class='ctx'> {</div><div class='add'>+	u64 flags = space_info-&gt;flags;</div><div class='add'>+</div><div class='ctx'> 	switch (flags) {</div><div class='ctx'> 	case BTRFS_BLOCK_GROUP_METADATA | BTRFS_BLOCK_GROUP_DATA:</div><div class='ctx'> 		return "mixed";</div><div class='ctx'> 	case BTRFS_BLOCK_GROUP_METADATA:</div><div class='del'>-		return "metadata";</div><div class='add'>+		switch (space_info-&gt;subgroup_id) {</div><div class='add'>+		case BTRFS_SUB_GROUP_PRIMARY:</div><div class='add'>+			return "metadata";</div><div class='add'>+		case BTRFS_SUB_GROUP_TREELOG:</div><div class='add'>+			return "metadata-treelog";</div><div class='add'>+		default:</div><div class='add'>+			WARN_ON_ONCE(1);</div><div class='add'>+			return "metadata (unknown sub-group)";</div><div class='add'>+		}</div><div class='ctx'> 	case BTRFS_BLOCK_GROUP_DATA:</div><div class='del'>-		return "data";</div><div class='add'>+		switch (space_info-&gt;subgroup_id) {</div><div class='add'>+		case BTRFS_SUB_GROUP_PRIMARY:</div><div class='add'>+			return "data";</div><div class='add'>+		case BTRFS_SUB_GROUP_DATA_RELOC:</div><div class='add'>+			return "data-reloc";</div><div class='add'>+		default:</div><div class='add'>+			WARN_ON_ONCE(1);</div><div class='add'>+			return "data (unknown sub-group)";</div><div class='add'>+		}</div><div class='ctx'> 	case BTRFS_BLOCK_GROUP_SYSTEM:</div><div class='add'>+		ASSERT(space_info-&gt;subgroup_id == BTRFS_SUB_GROUP_PRIMARY);</div><div class='ctx'> 		return "system";</div><div class='ctx'> 	default:</div><div class='ctx'> 		WARN_ON(1);</div><div class='hunk'>@@ -1420,14 +2034,13 @@ static const char *alloc_name(u64 flags)</div><div class='ctx'>  * Create a sysfs entry for a space info type at path</div><div class='ctx'>  * /sys/fs/btrfs/UUID/allocation/TYPE</div><div class='ctx'>  */</div><div class='del'>-int btrfs_sysfs_add_space_info_type(struct btrfs_fs_info *fs_info,</div><div class='del'>-				    struct btrfs_space_info *space_info)</div><div class='add'>+int btrfs_sysfs_add_space_info_type(struct btrfs_space_info *space_info)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	ret = kobject_init_and_add(&amp;space_info-&gt;kobj, &amp;space_info_ktype,</div><div class='del'>-				   fs_info-&gt;space_info_kobj, "%s",</div><div class='del'>-				   alloc_name(space_info-&gt;flags));</div><div class='add'>+				   space_info-&gt;fs_info-&gt;space_info_kobj, "%s",</div><div class='add'>+				   alloc_name(space_info));</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		kobject_put(&amp;space_info-&gt;kobj);</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -1518,6 +2131,10 @@ static ssize_t btrfs_devinfo_scrub_speed_max_store(struct kobject *kobj,</div><div class='ctx'> 	unsigned long long limit;</div><div class='ctx'> </div><div class='ctx'> 	limit = memparse(buf, &amp;endptr);</div><div class='add'>+	/* There could be trailing '\n', also catch any typos after the value. */</div><div class='add'>+	endptr = skip_spaces(endptr);</div><div class='add'>+	if (*endptr != 0)</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	WRITE_ONCE(device-&gt;scrub_speed_max, limit);</div><div class='ctx'> 	return len;</div><div class='ctx'> }</div><div class='hunk'>@@ -1537,6 +2154,16 @@ static ssize_t btrfs_devinfo_writeable_show(struct kobject *kobj,</div><div class='ctx'> }</div><div class='ctx'> BTRFS_ATTR(devid, writeable, btrfs_devinfo_writeable_show);</div><div class='ctx'> </div><div class='add'>+static ssize_t btrfs_devinfo_fsid_show(struct kobject *kobj,</div><div class='add'>+				       struct kobj_attribute *a, char *buf)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_device *device = container_of(kobj, struct btrfs_device,</div><div class='add'>+						   devid_kobj);</div><div class='add'>+</div><div class='add'>+	return sysfs_emit(buf, "%pU\n", device-&gt;fs_devices-&gt;fsid);</div><div class='add'>+}</div><div class='add'>+BTRFS_ATTR(devid, fsid, btrfs_devinfo_fsid_show);</div><div class='add'>+</div><div class='ctx'> static ssize_t btrfs_devinfo_error_stats_show(struct kobject *kobj,</div><div class='ctx'> 		struct kobj_attribute *a, char *buf)</div><div class='ctx'> {</div><div class='hunk'>@@ -1572,6 +2199,7 @@ BTRFS_ATTR(devid, error_stats, btrfs_devinfo_error_stats_show);</div><div class='ctx'>  */</div><div class='ctx'> static struct attribute *devid_attrs[] = {</div><div class='ctx'> 	BTRFS_ATTR_PTR(devid, error_stats),</div><div class='add'>+	BTRFS_ATTR_PTR(devid, fsid),</div><div class='ctx'> 	BTRFS_ATTR_PTR(devid, in_fs_metadata),</div><div class='ctx'> 	BTRFS_ATTR_PTR(devid, missing),</div><div class='ctx'> 	BTRFS_ATTR_PTR(devid, replace_target),</div><div class='hunk'>@@ -1590,7 +2218,7 @@ static void btrfs_release_devid_kobj(struct kobject *kobj)</div><div class='ctx'> 	complete(&amp;device-&gt;kobj_unregister);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct kobj_type devid_ktype = {</div><div class='add'>+static const struct kobj_type devid_ktype = {</div><div class='ctx'> 	.sysfs_ops	= &amp;kobj_sysfs_ops,</div><div class='ctx'> 	.default_groups = devid_groups,</div><div class='ctx'> 	.release	= btrfs_release_devid_kobj,</div><div class='hunk'>@@ -1674,7 +2302,7 @@ void btrfs_kobject_uevent(struct block_device *bdev, enum kobject_action action)</div><div class='ctx'> </div><div class='ctx'> 	ret = kobject_uevent(&amp;disk_to_dev(bdev-&gt;bd_disk)-&gt;kobj, action);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		pr_warn("BTRFS: Sending event '%d' to kobject: '%s' (%p): failed\n",</div><div class='add'>+		btrfs_warn(NULL, "sending event %d to kobject: '%s' (%p): failed",</div><div class='ctx'> 			action, kobject_name(&amp;disk_to_dev(bdev-&gt;bd_disk)-&gt;kobj),</div><div class='ctx'> 			&amp;disk_to_dev(bdev-&gt;bd_disk)-&gt;kobj);</div><div class='ctx'> }</div><div class='hunk'>@@ -1717,15 +2345,15 @@ static struct kset *btrfs_kset;</div><div class='ctx'>  */</div><div class='ctx'> int btrfs_sysfs_add_fsid(struct btrfs_fs_devices *fs_devs)</div><div class='ctx'> {</div><div class='del'>-	int error;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	init_completion(&amp;fs_devs-&gt;kobj_unregister);</div><div class='ctx'> 	fs_devs-&gt;fsid_kobj.kset = btrfs_kset;</div><div class='del'>-	error = kobject_init_and_add(&amp;fs_devs-&gt;fsid_kobj, &amp;btrfs_ktype, NULL,</div><div class='del'>-				     "%pU", fs_devs-&gt;fsid);</div><div class='del'>-	if (error) {</div><div class='add'>+	ret = kobject_init_and_add(&amp;fs_devs-&gt;fsid_kobj, &amp;btrfs_ktype, NULL,</div><div class='add'>+				   "%pU", fs_devs-&gt;fsid);</div><div class='add'>+	if (ret) {</div><div class='ctx'> 		kobject_put(&amp;fs_devs-&gt;fsid_kobj);</div><div class='del'>-		return error;</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	fs_devs-&gt;devices_kobj = kobject_create_and_add("devices",</div><div class='hunk'>@@ -1751,75 +2379,192 @@ int btrfs_sysfs_add_fsid(struct btrfs_fs_devices *fs_devs)</div><div class='ctx'> </div><div class='ctx'> int btrfs_sysfs_add_mounted(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	int error;</div><div class='add'>+	int ret;</div><div class='ctx'> 	struct btrfs_fs_devices *fs_devs = fs_info-&gt;fs_devices;</div><div class='ctx'> 	struct kobject *fsid_kobj = &amp;fs_devs-&gt;fsid_kobj;</div><div class='ctx'> </div><div class='del'>-	error = btrfs_sysfs_add_fs_devices(fs_devs);</div><div class='del'>-	if (error)</div><div class='del'>-		return error;</div><div class='add'>+	ret = btrfs_sysfs_add_fs_devices(fs_devs);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	error = sysfs_create_files(fsid_kobj, btrfs_attrs);</div><div class='del'>-	if (error) {</div><div class='add'>+	ret = sysfs_create_files(fsid_kobj, btrfs_attrs);</div><div class='add'>+	if (ret) {</div><div class='ctx'> 		btrfs_sysfs_remove_fs_devices(fs_devs);</div><div class='del'>-		return error;</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	error = sysfs_create_group(fsid_kobj,</div><div class='del'>-				   &amp;btrfs_feature_attr_group);</div><div class='del'>-	if (error)</div><div class='add'>+	ret = sysfs_create_group(fsid_kobj, &amp;btrfs_feature_attr_group);</div><div class='add'>+	if (ret)</div><div class='ctx'> 		goto failure;</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_BTRFS_DEBUG</div><div class='ctx'> 	fs_info-&gt;debug_kobj = kobject_create_and_add("debug", fsid_kobj);</div><div class='ctx'> 	if (!fs_info-&gt;debug_kobj) {</div><div class='del'>-		error = -ENOMEM;</div><div class='add'>+		ret = -ENOMEM;</div><div class='ctx'> 		goto failure;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	error = sysfs_create_files(fs_info-&gt;debug_kobj, btrfs_debug_mount_attrs);</div><div class='del'>-	if (error)</div><div class='add'>+	ret = sysfs_create_files(fs_info-&gt;debug_kobj, btrfs_debug_mount_attrs);</div><div class='add'>+	if (ret)</div><div class='ctx'> 		goto failure;</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='ctx'> 	/* Discard directory */</div><div class='del'>-	fs_info-&gt;discard_debug_kobj = kobject_create_and_add("discard",</div><div class='del'>-						     fs_info-&gt;debug_kobj);</div><div class='del'>-	if (!fs_info-&gt;discard_debug_kobj) {</div><div class='del'>-		error = -ENOMEM;</div><div class='add'>+	fs_info-&gt;discard_kobj = kobject_create_and_add("discard", fsid_kobj);</div><div class='add'>+	if (!fs_info-&gt;discard_kobj) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='ctx'> 		goto failure;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	error = sysfs_create_files(fs_info-&gt;discard_debug_kobj,</div><div class='del'>-				   discard_debug_attrs);</div><div class='del'>-	if (error)</div><div class='add'>+	ret = sysfs_create_files(fs_info-&gt;discard_kobj, discard_attrs);</div><div class='add'>+	if (ret)</div><div class='ctx'> 		goto failure;</div><div class='del'>-#endif</div><div class='ctx'> </div><div class='del'>-	error = addrm_unknown_feature_attrs(fs_info, true);</div><div class='del'>-	if (error)</div><div class='add'>+	ret = addrm_unknown_feature_attrs(fs_info, true);</div><div class='add'>+	if (ret)</div><div class='ctx'> 		goto failure;</div><div class='ctx'> </div><div class='del'>-	error = sysfs_create_link(fsid_kobj, &amp;fs_info-&gt;sb-&gt;s_bdi-&gt;dev-&gt;kobj, "bdi");</div><div class='del'>-	if (error)</div><div class='add'>+	ret = sysfs_create_link(fsid_kobj, &amp;fs_info-&gt;sb-&gt;s_bdi-&gt;dev-&gt;kobj, "bdi");</div><div class='add'>+	if (ret)</div><div class='ctx'> 		goto failure;</div><div class='ctx'> </div><div class='ctx'> 	fs_info-&gt;space_info_kobj = kobject_create_and_add("allocation",</div><div class='ctx'> 						  fsid_kobj);</div><div class='ctx'> 	if (!fs_info-&gt;space_info_kobj) {</div><div class='del'>-		error = -ENOMEM;</div><div class='add'>+		ret = -ENOMEM;</div><div class='ctx'> 		goto failure;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	error = sysfs_create_files(fs_info-&gt;space_info_kobj, allocation_attrs);</div><div class='del'>-	if (error)</div><div class='add'>+	ret = sysfs_create_files(fs_info-&gt;space_info_kobj, allocation_attrs);</div><div class='add'>+	if (ret)</div><div class='ctx'> 		goto failure;</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> failure:</div><div class='ctx'> 	btrfs_sysfs_remove_mounted(fs_info);</div><div class='del'>-	return error;</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t qgroup_enabled_show(struct kobject *qgroups_kobj,</div><div class='add'>+				   struct kobj_attribute *a,</div><div class='add'>+				   char *buf)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = to_fs_info(qgroups_kobj-&gt;parent);</div><div class='add'>+	bool enabled;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fs_info-&gt;qgroup_lock);</div><div class='add'>+	enabled = fs_info-&gt;qgroup_flags &amp; BTRFS_QGROUP_STATUS_FLAG_ON;</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;qgroup_lock);</div><div class='add'>+</div><div class='add'>+	return sysfs_emit(buf, "%d\n", enabled);</div><div class='add'>+}</div><div class='add'>+BTRFS_ATTR(qgroups, enabled, qgroup_enabled_show);</div><div class='add'>+</div><div class='add'>+static ssize_t qgroup_mode_show(struct kobject *qgroups_kobj,</div><div class='add'>+				struct kobj_attribute *a,</div><div class='add'>+				char *buf)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = to_fs_info(qgroups_kobj-&gt;parent);</div><div class='add'>+	ssize_t ret = 0;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fs_info-&gt;qgroup_lock);</div><div class='add'>+	ASSERT(btrfs_qgroup_enabled(fs_info));</div><div class='add'>+	switch (btrfs_qgroup_mode(fs_info)) {</div><div class='add'>+	case BTRFS_QGROUP_MODE_FULL:</div><div class='add'>+		ret = sysfs_emit(buf, "qgroup\n");</div><div class='add'>+		break;</div><div class='add'>+	case BTRFS_QGROUP_MODE_SIMPLE:</div><div class='add'>+		ret = sysfs_emit(buf, "squota\n");</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		btrfs_warn(fs_info, "unexpected qgroup mode %d\n",</div><div class='add'>+			   btrfs_qgroup_mode(fs_info));</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;qgroup_lock);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+BTRFS_ATTR(qgroups, mode, qgroup_mode_show);</div><div class='add'>+</div><div class='add'>+static ssize_t qgroup_inconsistent_show(struct kobject *qgroups_kobj,</div><div class='add'>+					struct kobj_attribute *a,</div><div class='add'>+					char *buf)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = to_fs_info(qgroups_kobj-&gt;parent);</div><div class='add'>+	bool inconsistent;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fs_info-&gt;qgroup_lock);</div><div class='add'>+	inconsistent = (fs_info-&gt;qgroup_flags &amp; BTRFS_QGROUP_STATUS_FLAG_INCONSISTENT);</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;qgroup_lock);</div><div class='add'>+</div><div class='add'>+	return sysfs_emit(buf, "%d\n", inconsistent);</div><div class='add'>+}</div><div class='add'>+BTRFS_ATTR(qgroups, inconsistent, qgroup_inconsistent_show);</div><div class='add'>+</div><div class='add'>+static ssize_t qgroup_drop_subtree_thres_show(struct kobject *qgroups_kobj,</div><div class='add'>+					      struct kobj_attribute *a,</div><div class='add'>+					      char *buf)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = to_fs_info(qgroups_kobj-&gt;parent);</div><div class='add'>+	u8 result;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fs_info-&gt;qgroup_lock);</div><div class='add'>+	result = fs_info-&gt;qgroup_drop_subtree_thres;</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;qgroup_lock);</div><div class='add'>+</div><div class='add'>+	return sysfs_emit(buf, "%d\n", result);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static ssize_t qgroup_drop_subtree_thres_store(struct kobject *qgroups_kobj,</div><div class='add'>+					       struct kobj_attribute *a,</div><div class='add'>+					       const char *buf, size_t len)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = to_fs_info(qgroups_kobj-&gt;parent);</div><div class='add'>+	u8 new_thres;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = kstrtou8(buf, 10, &amp;new_thres);</div><div class='add'>+	if (ret)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	if (new_thres &gt; BTRFS_MAX_LEVEL)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fs_info-&gt;qgroup_lock);</div><div class='add'>+	fs_info-&gt;qgroup_drop_subtree_thres = new_thres;</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;qgroup_lock);</div><div class='add'>+</div><div class='add'>+	return len;</div><div class='add'>+}</div><div class='add'>+BTRFS_ATTR_RW(qgroups, drop_subtree_threshold, qgroup_drop_subtree_thres_show,</div><div class='add'>+	      qgroup_drop_subtree_thres_store);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Qgroups global info</div><div class='add'>+ *</div><div class='add'>+ * Path: /sys/fs/btrfs/&lt;uuid&gt;/qgroups/</div><div class='add'>+ */</div><div class='add'>+static struct attribute *qgroups_attrs[] = {</div><div class='add'>+	BTRFS_ATTR_PTR(qgroups, enabled),</div><div class='add'>+	BTRFS_ATTR_PTR(qgroups, inconsistent),</div><div class='add'>+	BTRFS_ATTR_PTR(qgroups, drop_subtree_threshold),</div><div class='add'>+	BTRFS_ATTR_PTR(qgroups, mode),</div><div class='add'>+	NULL</div><div class='add'>+};</div><div class='add'>+ATTRIBUTE_GROUPS(qgroups);</div><div class='add'>+</div><div class='add'>+static void qgroups_release(struct kobject *kobj)</div><div class='add'>+{</div><div class='add'>+	kfree(kobj);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct kobj_type qgroups_ktype = {</div><div class='add'>+	.sysfs_ops = &amp;kobj_sysfs_ops,</div><div class='add'>+	.default_groups = qgroups_groups,</div><div class='add'>+	.release = qgroups_release,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> static inline struct btrfs_fs_info *qgroup_kobj_to_fs_info(struct kobject *kobj)</div><div class='ctx'> {</div><div class='ctx'> 	return to_fs_info(kobj-&gt;parent-&gt;parent);</div><div class='hunk'>@@ -1884,7 +2629,7 @@ static void qgroup_release(struct kobject *kobj)</div><div class='ctx'> 	memset(&amp;qgroup-&gt;kobj, 0, sizeof(*kobj));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct kobj_type qgroup_ktype = {</div><div class='add'>+static const struct kobj_type qgroup_ktype = {</div><div class='ctx'> 	.sysfs_ops = &amp;kobj_sysfs_ops,</div><div class='ctx'> 	.release = qgroup_release,</div><div class='ctx'> 	.default_groups = qgroup_groups,</div><div class='hunk'>@@ -1896,7 +2641,7 @@ int btrfs_sysfs_add_one_qgroup(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	struct kobject *qgroups_kobj = fs_info-&gt;qgroups_kobj;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (test_bit(BTRFS_FS_STATE_DUMMY_FS_INFO, &amp;fs_info-&gt;fs_state))</div><div class='add'>+	if (btrfs_is_testing(fs_info))</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	if (qgroup-&gt;kobj.state_initialized)</div><div class='ctx'> 		return 0;</div><div class='hunk'>@@ -1917,7 +2662,7 @@ void btrfs_sysfs_del_qgroups(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	struct btrfs_qgroup *qgroup;</div><div class='ctx'> 	struct btrfs_qgroup *next;</div><div class='ctx'> </div><div class='del'>-	if (test_bit(BTRFS_FS_STATE_DUMMY_FS_INFO, &amp;fs_info-&gt;fs_state))</div><div class='add'>+	if (btrfs_is_testing(fs_info))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	rbtree_postorder_for_each_entry_safe(qgroup, next,</div><div class='hunk'>@@ -1938,18 +2683,22 @@ int btrfs_sysfs_add_qgroups(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	struct btrfs_qgroup *next;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	if (test_bit(BTRFS_FS_STATE_DUMMY_FS_INFO, &amp;fs_info-&gt;fs_state))</div><div class='add'>+	if (btrfs_is_testing(fs_info))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	ASSERT(fsid_kobj);</div><div class='ctx'> 	if (fs_info-&gt;qgroups_kobj)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	fs_info-&gt;qgroups_kobj = kobject_create_and_add("qgroups", fsid_kobj);</div><div class='del'>-	if (!fs_info-&gt;qgroups_kobj) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='add'>+	fs_info-&gt;qgroups_kobj = kzalloc(sizeof(struct kobject), GFP_KERNEL);</div><div class='add'>+	if (!fs_info-&gt;qgroups_kobj)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	ret = kobject_init_and_add(fs_info-&gt;qgroups_kobj, &amp;qgroups_ktype,</div><div class='add'>+				   fsid_kobj, "qgroups");</div><div class='add'>+	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='del'>-	}</div><div class='add'>+</div><div class='ctx'> 	rbtree_postorder_for_each_entry_safe(qgroup, next,</div><div class='ctx'> 					     &amp;fs_info-&gt;qgroup_tree, node) {</div><div class='ctx'> 		ret = btrfs_sysfs_add_one_qgroup(fs_info, qgroup);</div><div class='hunk'>@@ -1966,7 +2715,7 @@ out:</div><div class='ctx'> void btrfs_sysfs_del_one_qgroup(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				struct btrfs_qgroup *qgroup)</div><div class='ctx'> {</div><div class='del'>-	if (test_bit(BTRFS_FS_STATE_DUMMY_FS_INFO, &amp;fs_info-&gt;fs_state))</div><div class='add'>+	if (btrfs_is_testing(fs_info))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	if (qgroup-&gt;kobj.state_initialized) {</div><div class='hunk'>@@ -1979,36 +2728,23 @@ void btrfs_sysfs_del_one_qgroup(struct btrfs_fs_info *fs_info,</div><div class='ctx'>  * Change per-fs features in /sys/fs/btrfs/UUID/features to match current</div><div class='ctx'>  * values in superblock. Call after any changes to incompat/compat_ro flags</div><div class='ctx'>  */</div><div class='del'>-void btrfs_sysfs_feature_update(struct btrfs_fs_info *fs_info,</div><div class='del'>-		u64 bit, enum btrfs_feature_set set)</div><div class='add'>+void btrfs_sysfs_feature_update(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_devices *fs_devs;</div><div class='ctx'> 	struct kobject *fsid_kobj;</div><div class='del'>-	u64 __maybe_unused features;</div><div class='del'>-	int __maybe_unused ret;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!fs_info)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * See 14e46e04958df74 and e410e34fad913dd, feature bit updates are not</div><div class='del'>-	 * safe when called from some contexts (eg. balance)</div><div class='del'>-	 */</div><div class='del'>-	features = get_features(fs_info, set);</div><div class='del'>-	ASSERT(bit &amp; supported_feature_masks[set]);</div><div class='del'>-</div><div class='del'>-	fs_devs = fs_info-&gt;fs_devices;</div><div class='del'>-	fsid_kobj = &amp;fs_devs-&gt;fsid_kobj;</div><div class='del'>-</div><div class='add'>+	fsid_kobj = &amp;fs_info-&gt;fs_devices-&gt;fsid_kobj;</div><div class='ctx'> 	if (!fsid_kobj-&gt;state_initialized)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * FIXME: this is too heavy to update just one value, ideally we'd like</div><div class='del'>-	 * to use sysfs_update_group but some refactoring is needed first.</div><div class='del'>-	 */</div><div class='del'>-	sysfs_remove_group(fsid_kobj, &amp;btrfs_feature_attr_group);</div><div class='del'>-	ret = sysfs_create_group(fsid_kobj, &amp;btrfs_feature_attr_group);</div><div class='add'>+	ret = sysfs_update_group(fsid_kobj, &amp;btrfs_feature_attr_group);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		btrfs_warn(fs_info,</div><div class='add'>+			   "failed to update /sys/fs/btrfs/%pU/features: %d",</div><div class='add'>+			   fs_info-&gt;fs_devices-&gt;fsid, ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int __init btrfs_init_sysfs(void)</div><div class='hunk'>@@ -2030,8 +2766,11 @@ int __init btrfs_init_sysfs(void)</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_BTRFS_DEBUG</div><div class='ctx'> 	ret = sysfs_create_group(&amp;btrfs_kset-&gt;kobj, &amp;btrfs_debug_feature_attr_group);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto out2;</div><div class='add'>+	if (ret) {</div><div class='add'>+		sysfs_unmerge_group(&amp;btrfs_kset-&gt;kobj,</div><div class='add'>+				    &amp;btrfs_static_feature_attr_group);</div><div class='add'>+		goto out_remove_group;</div><div class='add'>+	}</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -2054,4 +2793,3 @@ void __cold btrfs_exit_sysfs(void)</div><div class='ctx'> #endif</div><div class='ctx'> 	kset_unregister(btrfs_kset);</div><div class='ctx'> }</div><div class='del'>-</div><div class='head'>diff --git a/fs/btrfs/sysfs.h b/fs/btrfs/sysfs.h<br/>index bacef43f7267..05498e5346c3 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/sysfs.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/sysfs.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/sysfs.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/sysfs.h</a></div><div class='hunk'>@@ -3,8 +3,18 @@</div><div class='ctx'> #ifndef BTRFS_SYSFS_H</div><div class='ctx'> #define BTRFS_SYSFS_H</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+#include &lt;linux/compiler_types.h&gt;</div><div class='ctx'> #include &lt;linux/kobject.h&gt;</div><div class='ctx'> </div><div class='add'>+struct block_device;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+struct btrfs_device;</div><div class='add'>+struct btrfs_fs_devices;</div><div class='add'>+struct btrfs_block_group;</div><div class='add'>+struct btrfs_space_info;</div><div class='add'>+struct btrfs_qgroup;</div><div class='add'>+</div><div class='ctx'> enum btrfs_feature_set {</div><div class='ctx'> 	FEAT_COMPAT,</div><div class='ctx'> 	FEAT_COMPAT_RO,</div><div class='hunk'>@@ -19,8 +29,7 @@ void btrfs_sysfs_remove_device(struct btrfs_device *device);</div><div class='ctx'> int btrfs_sysfs_add_fsid(struct btrfs_fs_devices *fs_devs);</div><div class='ctx'> void btrfs_sysfs_remove_fsid(struct btrfs_fs_devices *fs_devs);</div><div class='ctx'> void btrfs_sysfs_update_sprout_fsid(struct btrfs_fs_devices *fs_devices);</div><div class='del'>-void btrfs_sysfs_feature_update(struct btrfs_fs_info *fs_info,</div><div class='del'>-		u64 bit, enum btrfs_feature_set set);</div><div class='add'>+void btrfs_sysfs_feature_update(struct btrfs_fs_info *fs_info);</div><div class='ctx'> void btrfs_kobject_uevent(struct block_device *bdev, enum kobject_action action);</div><div class='ctx'> </div><div class='ctx'> int __init btrfs_init_sysfs(void);</div><div class='hunk'>@@ -28,8 +37,7 @@ void __cold btrfs_exit_sysfs(void);</div><div class='ctx'> int btrfs_sysfs_add_mounted(struct btrfs_fs_info *fs_info);</div><div class='ctx'> void btrfs_sysfs_remove_mounted(struct btrfs_fs_info *fs_info);</div><div class='ctx'> void btrfs_sysfs_add_block_group_type(struct btrfs_block_group *cache);</div><div class='del'>-int btrfs_sysfs_add_space_info_type(struct btrfs_fs_info *fs_info,</div><div class='del'>-				    struct btrfs_space_info *space_info);</div><div class='add'>+int btrfs_sysfs_add_space_info_type(struct btrfs_space_info *space_info);</div><div class='ctx'> void btrfs_sysfs_remove_space_info(struct btrfs_space_info *space_info);</div><div class='ctx'> void btrfs_sysfs_update_devid(struct btrfs_device *device);</div><div class='ctx'> </div><div class='hunk'>@@ -39,5 +47,11 @@ void btrfs_sysfs_del_qgroups(struct btrfs_fs_info *fs_info);</div><div class='ctx'> int btrfs_sysfs_add_qgroups(struct btrfs_fs_info *fs_info);</div><div class='ctx'> void btrfs_sysfs_del_one_qgroup(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				struct btrfs_qgroup *qgroup);</div><div class='add'>+int btrfs_read_policy_to_enum(const char *str, s64 *value);</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+int __init btrfs_read_policy_init(void);</div><div class='add'>+char *btrfs_get_mod_read_policy(void);</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/btrfs/tests/btrfs-tests.c b/fs/btrfs/tests/btrfs-tests.c<br/>index 3a4099a2bf05..b576897d71cc 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tests/btrfs-tests.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tests/btrfs-tests.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tests/btrfs-tests.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/tests/btrfs-tests.c</a></div><div class='hunk'>@@ -16,6 +16,7 @@</div><div class='ctx'> #include "../disk-io.h"</div><div class='ctx'> #include "../qgroup.h"</div><div class='ctx'> #include "../block-group.h"</div><div class='add'>+#include "../fs.h"</div><div class='ctx'> </div><div class='ctx'> static struct vfsmount *test_mnt = NULL;</div><div class='ctx'> </div><div class='hunk'>@@ -27,6 +28,9 @@ const char *test_error[] = {</div><div class='ctx'> 	[TEST_ALLOC_INODE]	     = "cannot allocate inode",</div><div class='ctx'> 	[TEST_ALLOC_BLOCK_GROUP]     = "cannot allocate block group",</div><div class='ctx'> 	[TEST_ALLOC_EXTENT_MAP]      = "cannot allocate extent map",</div><div class='add'>+	[TEST_ALLOC_CHUNK_MAP]       = "cannot allocate chunk map",</div><div class='add'>+	[TEST_ALLOC_IO_CONTEXT]	     = "cannot allocate io context",</div><div class='add'>+	[TEST_ALLOC_TRANSACTION]     = "cannot allocate transaction",</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct super_operations btrfs_test_super_ops = {</div><div class='hunk'>@@ -59,10 +63,8 @@ struct inode *btrfs_new_test_inode(void)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_mode = S_IFREG;</div><div class='del'>-	BTRFS_I(inode)-&gt;location.type = BTRFS_INODE_ITEM_KEY;</div><div class='del'>-	BTRFS_I(inode)-&gt;location.objectid = BTRFS_FIRST_FREE_OBJECTID;</div><div class='del'>-	BTRFS_I(inode)-&gt;location.offset = 0;</div><div class='del'>-	inode_init_owner(&amp;init_user_ns, inode, NULL, S_IFREG);</div><div class='add'>+	btrfs_set_inode_number(BTRFS_I(inode), BTRFS_FIRST_FREE_OBJECTID);</div><div class='add'>+	inode_init_owner(&amp;nop_mnt_idmap, inode, NULL, S_IFREG);</div><div class='ctx'> </div><div class='ctx'> 	return inode;</div><div class='ctx'> }</div><div class='hunk'>@@ -100,7 +102,7 @@ struct btrfs_device *btrfs_alloc_dummy_device(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	if (!dev)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='del'>-	extent_io_tree_init(NULL, &amp;dev-&gt;alloc_state, 0, NULL);</div><div class='add'>+	btrfs_extent_io_tree_init(fs_info, &amp;dev-&gt;alloc_state, 0);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;dev-&gt;dev_list);</div><div class='ctx'> 	list_add(&amp;dev-&gt;dev_list, &amp;fs_info-&gt;fs_devices-&gt;devices);</div><div class='ctx'> </div><div class='hunk'>@@ -109,7 +111,7 @@ struct btrfs_device *btrfs_alloc_dummy_device(struct btrfs_fs_info *fs_info)</div><div class='ctx'> </div><div class='ctx'> static void btrfs_free_dummy_device(struct btrfs_device *dev)</div><div class='ctx'> {</div><div class='del'>-	extent_io_tree_release(&amp;dev-&gt;alloc_state);</div><div class='add'>+	btrfs_extent_io_tree_release(&amp;dev-&gt;alloc_state);</div><div class='ctx'> 	kfree(dev);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -141,6 +143,11 @@ struct btrfs_fs_info *btrfs_alloc_dummy_fs_info(u32 nodesize, u32 sectorsize)</div><div class='ctx'> 	fs_info-&gt;nodesize = nodesize;</div><div class='ctx'> 	fs_info-&gt;sectorsize = sectorsize;</div><div class='ctx'> 	fs_info-&gt;sectorsize_bits = ilog2(sectorsize);</div><div class='add'>+</div><div class='add'>+	/* CRC32C csum size. */</div><div class='add'>+	fs_info-&gt;csum_size = 4;</div><div class='add'>+	fs_info-&gt;csums_per_leaf = BTRFS_MAX_ITEM_SIZE(fs_info) /</div><div class='add'>+		fs_info-&gt;csum_size;</div><div class='ctx'> 	set_bit(BTRFS_FS_STATE_DUMMY_FS_INFO, &amp;fs_info-&gt;fs_state);</div><div class='ctx'> </div><div class='ctx'> 	test_mnt-&gt;mnt_sb-&gt;s_fs_info = fs_info;</div><div class='hunk'>@@ -150,40 +157,27 @@ struct btrfs_fs_info *btrfs_alloc_dummy_fs_info(u32 nodesize, u32 sectorsize)</div><div class='ctx'> </div><div class='ctx'> void btrfs_free_dummy_fs_info(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	struct radix_tree_iter iter;</div><div class='del'>-	void **slot;</div><div class='ctx'> 	struct btrfs_device *dev, *tmp;</div><div class='add'>+	struct extent_buffer *eb;</div><div class='add'>+	unsigned long index;</div><div class='ctx'> </div><div class='ctx'> 	if (!fs_info)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	if (WARN_ON(!test_bit(BTRFS_FS_STATE_DUMMY_FS_INFO,</div><div class='del'>-			      &amp;fs_info-&gt;fs_state)))</div><div class='add'>+	if (WARN_ON(!btrfs_is_testing(fs_info)))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	test_mnt-&gt;mnt_sb-&gt;s_fs_info = NULL;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;fs_info-&gt;buffer_lock);</div><div class='del'>-	radix_tree_for_each_slot(slot, &amp;fs_info-&gt;buffer_radix, &amp;iter, 0) {</div><div class='del'>-		struct extent_buffer *eb;</div><div class='del'>-</div><div class='del'>-		eb = radix_tree_deref_slot_protected(slot, &amp;fs_info-&gt;buffer_lock);</div><div class='del'>-		if (!eb)</div><div class='del'>-			continue;</div><div class='del'>-		/* Shouldn't happen but that kind of thinking creates CVE's */</div><div class='del'>-		if (radix_tree_exception(eb)) {</div><div class='del'>-			if (radix_tree_deref_retry(eb))</div><div class='del'>-				slot = radix_tree_iter_retry(&amp;iter);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-		slot = radix_tree_iter_resume(slot, &amp;iter);</div><div class='del'>-		spin_unlock(&amp;fs_info-&gt;buffer_lock);</div><div class='del'>-		free_extent_buffer_stale(eb);</div><div class='del'>-		spin_lock(&amp;fs_info-&gt;buffer_lock);</div><div class='add'>+	xa_lock_irq(&amp;fs_info-&gt;buffer_tree);</div><div class='add'>+	xa_for_each(&amp;fs_info-&gt;buffer_tree, index, eb) {</div><div class='add'>+		xa_unlock_irq(&amp;fs_info-&gt;buffer_tree);</div><div class='add'>+		free_extent_buffer(eb);</div><div class='add'>+		xa_lock_irq(&amp;fs_info-&gt;buffer_tree);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;buffer_lock);</div><div class='add'>+	xa_unlock_irq(&amp;fs_info-&gt;buffer_tree);</div><div class='ctx'> </div><div class='del'>-	btrfs_mapping_tree_free(&amp;fs_info-&gt;mapping_tree);</div><div class='add'>+	btrfs_mapping_tree_free(fs_info);</div><div class='ctx'> 	list_for_each_entry_safe(dev, tmp, &amp;fs_info-&gt;fs_devices-&gt;devices,</div><div class='ctx'> 				 dev_list) {</div><div class='ctx'> 		btrfs_free_dummy_device(dev);</div><div class='hunk'>@@ -199,11 +193,12 @@ void btrfs_free_dummy_fs_info(struct btrfs_fs_info *fs_info)</div><div class='ctx'> </div><div class='ctx'> void btrfs_free_dummy_root(struct btrfs_root *root)</div><div class='ctx'> {</div><div class='del'>-	if (!root)</div><div class='add'>+	if (IS_ERR_OR_NULL(root))</div><div class='ctx'> 		return;</div><div class='ctx'> 	/* Will be freed by btrfs_free_fs_roots */</div><div class='ctx'> 	if (WARN_ON(test_bit(BTRFS_ROOT_IN_RADIX, &amp;root-&gt;state)))</div><div class='ctx'> 		return;</div><div class='add'>+	btrfs_global_root_delete(root);</div><div class='ctx'> 	btrfs_put_root(root);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -241,11 +236,20 @@ void btrfs_free_dummy_block_group(struct btrfs_block_group *cache)</div><div class='ctx'> {</div><div class='ctx'> 	if (!cache)</div><div class='ctx'> 		return;</div><div class='del'>-	__btrfs_remove_free_space_cache(cache-&gt;free_space_ctl);</div><div class='add'>+	btrfs_remove_free_space_cache(cache);</div><div class='ctx'> 	kfree(cache-&gt;free_space_ctl);</div><div class='ctx'> 	kfree(cache);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void btrfs_init_dummy_transaction(struct btrfs_transaction *trans, struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	memset(trans, 0, sizeof(*trans));</div><div class='add'>+	trans-&gt;fs_info = fs_info;</div><div class='add'>+	xa_init(&amp;trans-&gt;delayed_refs.head_refs);</div><div class='add'>+	xa_init(&amp;trans-&gt;delayed_refs.dirty_extents);</div><div class='add'>+	spin_lock_init(&amp;trans-&gt;delayed_refs.lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> void btrfs_init_dummy_trans(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			    struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='hunk'>@@ -291,6 +295,12 @@ int btrfs_run_sanity_tests(void)</div><div class='ctx'> 			ret = btrfs_test_free_space_tree(sectorsize, nodesize);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				goto out;</div><div class='add'>+			ret = btrfs_test_raid_stripe_tree(sectorsize, nodesize);</div><div class='add'>+			if (ret)</div><div class='add'>+				goto out;</div><div class='add'>+			ret = btrfs_test_delayed_refs(sectorsize, nodesize);</div><div class='add'>+			if (ret)</div><div class='add'>+				goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	ret = btrfs_test_extent_map();</div><div class='head'>diff --git a/fs/btrfs/tests/btrfs-tests.h b/fs/btrfs/tests/btrfs-tests.h<br/>index 7a2d7ffbe30e..4307bdaa6749 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tests/btrfs-tests.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tests/btrfs-tests.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tests/btrfs-tests.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/tests/btrfs-tests.h</a></div><div class='hunk'>@@ -6,6 +6,8 @@</div><div class='ctx'> #ifndef BTRFS_TESTS_H</div><div class='ctx'> #define BTRFS_TESTS_H</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+</div><div class='ctx'> #ifdef CONFIG_BTRFS_FS_RUN_SANITY_TESTS</div><div class='ctx'> int btrfs_run_sanity_tests(void);</div><div class='ctx'> </div><div class='hunk'>@@ -23,12 +25,16 @@ enum {</div><div class='ctx'> 	TEST_ALLOC_INODE,</div><div class='ctx'> 	TEST_ALLOC_BLOCK_GROUP,</div><div class='ctx'> 	TEST_ALLOC_EXTENT_MAP,</div><div class='add'>+	TEST_ALLOC_CHUNK_MAP,</div><div class='add'>+	TEST_ALLOC_IO_CONTEXT,</div><div class='add'>+	TEST_ALLOC_TRANSACTION,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> extern const char *test_error[];</div><div class='ctx'> </div><div class='ctx'> struct btrfs_root;</div><div class='ctx'> struct btrfs_trans_handle;</div><div class='add'>+struct btrfs_transaction;</div><div class='ctx'> </div><div class='ctx'> int btrfs_test_extent_buffer_operations(u32 sectorsize, u32 nodesize);</div><div class='ctx'> int btrfs_test_free_space_cache(u32 sectorsize, u32 nodesize);</div><div class='hunk'>@@ -36,7 +42,9 @@ int btrfs_test_extent_io(u32 sectorsize, u32 nodesize);</div><div class='ctx'> int btrfs_test_inodes(u32 sectorsize, u32 nodesize);</div><div class='ctx'> int btrfs_test_qgroups(u32 sectorsize, u32 nodesize);</div><div class='ctx'> int btrfs_test_free_space_tree(u32 sectorsize, u32 nodesize);</div><div class='add'>+int btrfs_test_raid_stripe_tree(u32 sectorsize, u32 nodesize);</div><div class='ctx'> int btrfs_test_extent_map(void);</div><div class='add'>+int btrfs_test_delayed_refs(u32 sectorsize, u32 nodesize);</div><div class='ctx'> struct inode *btrfs_new_test_inode(void);</div><div class='ctx'> struct btrfs_fs_info *btrfs_alloc_dummy_fs_info(u32 nodesize, u32 sectorsize);</div><div class='ctx'> void btrfs_free_dummy_fs_info(struct btrfs_fs_info *fs_info);</div><div class='hunk'>@@ -46,6 +54,7 @@ btrfs_alloc_dummy_block_group(struct btrfs_fs_info *fs_info, unsigned long lengt</div><div class='ctx'> void btrfs_free_dummy_block_group(struct btrfs_block_group *cache);</div><div class='ctx'> void btrfs_init_dummy_trans(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			    struct btrfs_fs_info *fs_info);</div><div class='add'>+void btrfs_init_dummy_transaction(struct btrfs_transaction *trans, struct btrfs_fs_info *fs_info);</div><div class='ctx'> struct btrfs_device *btrfs_alloc_dummy_device(struct btrfs_fs_info *fs_info);</div><div class='ctx'> #else</div><div class='ctx'> static inline int btrfs_run_sanity_tests(void)</div><div class='head'>diff --git a/fs/btrfs/tests/delayed-refs-tests.c b/fs/btrfs/tests/delayed-refs-tests.c<br/>new file mode 100644<br/>index 000000000000..e2248acb906b<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tests/delayed-refs-tests.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/tests/delayed-refs-tests.c</a></div><div class='hunk'>@@ -0,0 +1,1016 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+#include &lt;linux/sizes.h&gt;</div><div class='add'>+#include "btrfs-tests.h"</div><div class='add'>+#include "../transaction.h"</div><div class='add'>+#include "../delayed-ref.h"</div><div class='add'>+#include "../extent-tree.h"</div><div class='add'>+</div><div class='add'>+#define FAKE_ROOT_OBJECTID 256</div><div class='add'>+#define FAKE_BYTENR 0</div><div class='add'>+#define FAKE_LEVEL 1</div><div class='add'>+#define FAKE_INO 256</div><div class='add'>+#define FAKE_FILE_OFFSET 0</div><div class='add'>+#define FAKE_PARENT SZ_1M</div><div class='add'>+</div><div class='add'>+struct ref_head_check {</div><div class='add'>+	u64 bytenr;</div><div class='add'>+	u64 num_bytes;</div><div class='add'>+	int ref_mod;</div><div class='add'>+	int total_ref_mod;</div><div class='add'>+	int must_insert;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct ref_node_check {</div><div class='add'>+	u64 bytenr;</div><div class='add'>+	u64 num_bytes;</div><div class='add'>+	int ref_mod;</div><div class='add'>+	enum btrfs_delayed_ref_action action;</div><div class='add'>+	u8 type;</div><div class='add'>+	u64 parent;</div><div class='add'>+	u64 root;</div><div class='add'>+	u64 owner;</div><div class='add'>+	u64 offset;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static enum btrfs_ref_type ref_type_from_disk_ref_type(u8 type)</div><div class='add'>+{</div><div class='add'>+	if ((type == BTRFS_TREE_BLOCK_REF_KEY) ||</div><div class='add'>+	    (type == BTRFS_SHARED_BLOCK_REF_KEY))</div><div class='add'>+		return BTRFS_REF_METADATA;</div><div class='add'>+	return BTRFS_REF_DATA;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void delete_delayed_ref_head(struct btrfs_trans_handle *trans,</div><div class='add'>+				    struct btrfs_delayed_ref_head *head)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='add'>+	struct btrfs_delayed_ref_root *delayed_refs =</div><div class='add'>+		&amp;trans-&gt;transaction-&gt;delayed_refs;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;delayed_refs-&gt;lock);</div><div class='add'>+	spin_lock(&amp;head-&gt;lock);</div><div class='add'>+	btrfs_delete_ref_head(fs_info, delayed_refs, head);</div><div class='add'>+	spin_unlock(&amp;head-&gt;lock);</div><div class='add'>+	spin_unlock(&amp;delayed_refs-&gt;lock);</div><div class='add'>+</div><div class='add'>+	btrfs_delayed_ref_unlock(head);</div><div class='add'>+	btrfs_put_delayed_ref_head(head);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void delete_delayed_ref_node(struct btrfs_delayed_ref_head *head,</div><div class='add'>+				    struct btrfs_delayed_ref_node *node)</div><div class='add'>+{</div><div class='add'>+	rb_erase_cached(&amp;node-&gt;ref_node, &amp;head-&gt;ref_tree);</div><div class='add'>+	RB_CLEAR_NODE(&amp;node-&gt;ref_node);</div><div class='add'>+	if (!list_empty(&amp;node-&gt;add_list))</div><div class='add'>+		list_del_init(&amp;node-&gt;add_list);</div><div class='add'>+	btrfs_put_delayed_ref(node);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int validate_ref_head(struct btrfs_delayed_ref_head *head,</div><div class='add'>+			     struct ref_head_check *check)</div><div class='add'>+{</div><div class='add'>+	if (head-&gt;bytenr != check-&gt;bytenr) {</div><div class='add'>+		test_err("invalid bytenr have: %llu want: %llu", head-&gt;bytenr,</div><div class='add'>+			 check-&gt;bytenr);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (head-&gt;num_bytes != check-&gt;num_bytes) {</div><div class='add'>+		test_err("invalid num_bytes have: %llu want: %llu",</div><div class='add'>+			 head-&gt;num_bytes, check-&gt;num_bytes);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (head-&gt;ref_mod != check-&gt;ref_mod) {</div><div class='add'>+		test_err("invalid ref_mod have: %d want: %d", head-&gt;ref_mod,</div><div class='add'>+			 check-&gt;ref_mod);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (head-&gt;total_ref_mod != check-&gt;total_ref_mod) {</div><div class='add'>+		test_err("invalid total_ref_mod have: %d want: %d",</div><div class='add'>+			 head-&gt;total_ref_mod, check-&gt;total_ref_mod);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (head-&gt;must_insert_reserved != check-&gt;must_insert) {</div><div class='add'>+		test_err("invalid must_insert have: %d want: %d",</div><div class='add'>+			 head-&gt;must_insert_reserved, check-&gt;must_insert);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int validate_ref_node(struct btrfs_delayed_ref_node *node,</div><div class='add'>+			     struct ref_node_check *check)</div><div class='add'>+{</div><div class='add'>+	if (node-&gt;bytenr != check-&gt;bytenr) {</div><div class='add'>+		test_err("invalid bytenr have: %llu want: %llu", node-&gt;bytenr,</div><div class='add'>+			 check-&gt;bytenr);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (node-&gt;num_bytes != check-&gt;num_bytes) {</div><div class='add'>+		test_err("invalid num_bytes have: %llu want: %llu",</div><div class='add'>+			 node-&gt;num_bytes, check-&gt;num_bytes);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (node-&gt;ref_mod != check-&gt;ref_mod) {</div><div class='add'>+		test_err("invalid ref_mod have: %d want: %d", node-&gt;ref_mod,</div><div class='add'>+			 check-&gt;ref_mod);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (node-&gt;action != check-&gt;action) {</div><div class='add'>+		test_err("invalid action have: %d want: %d", node-&gt;action,</div><div class='add'>+			 check-&gt;action);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (node-&gt;parent != check-&gt;parent) {</div><div class='add'>+		test_err("invalid parent have: %llu want: %llu", node-&gt;parent,</div><div class='add'>+			 check-&gt;parent);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (node-&gt;ref_root != check-&gt;root) {</div><div class='add'>+		test_err("invalid root have: %llu want: %llu", node-&gt;ref_root,</div><div class='add'>+			 check-&gt;root);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (node-&gt;type != check-&gt;type) {</div><div class='add'>+		test_err("invalid type have: %d want: %d", node-&gt;type,</div><div class='add'>+			 check-&gt;type);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (btrfs_delayed_ref_owner(node) != check-&gt;owner) {</div><div class='add'>+		test_err("invalid owner have: %llu want: %llu",</div><div class='add'>+			 btrfs_delayed_ref_owner(node), check-&gt;owner);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (btrfs_delayed_ref_offset(node) != check-&gt;offset) {</div><div class='add'>+		test_err("invalid offset have: %llu want: %llu",</div><div class='add'>+			 btrfs_delayed_ref_offset(node), check-&gt;offset);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int simple_test(struct btrfs_trans_handle *trans,</div><div class='add'>+		       struct ref_head_check *head_check,</div><div class='add'>+		       struct ref_node_check *node_check)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_delayed_ref_root *delayed_refs =</div><div class='add'>+		&amp;trans-&gt;transaction-&gt;delayed_refs;</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='add'>+	struct btrfs_delayed_ref_head *head;</div><div class='add'>+	struct btrfs_delayed_ref_node *node;</div><div class='add'>+	struct btrfs_ref ref = {</div><div class='add'>+		.type = ref_type_from_disk_ref_type(node_check-&gt;type),</div><div class='add'>+		.action = node_check-&gt;action,</div><div class='add'>+		.parent = node_check-&gt;parent,</div><div class='add'>+		.ref_root = node_check-&gt;root,</div><div class='add'>+		.bytenr = node_check-&gt;bytenr,</div><div class='add'>+		.num_bytes = fs_info-&gt;nodesize,</div><div class='add'>+	};</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (ref.type == BTRFS_REF_METADATA)</div><div class='add'>+		btrfs_init_tree_ref(&amp;ref, node_check-&gt;owner, node_check-&gt;root,</div><div class='add'>+				    false);</div><div class='add'>+	else</div><div class='add'>+		btrfs_init_data_ref(&amp;ref, node_check-&gt;owner, node_check-&gt;offset,</div><div class='add'>+				    node_check-&gt;root, true);</div><div class='add'>+</div><div class='add'>+	if (ref.type == BTRFS_REF_METADATA)</div><div class='add'>+		ret = btrfs_add_delayed_tree_ref(trans, &amp;ref, NULL);</div><div class='add'>+	else</div><div class='add'>+		ret = btrfs_add_delayed_data_ref(trans, &amp;ref, 0);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("failed ref action %d", ret);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	head = btrfs_select_ref_head(fs_info, delayed_refs);</div><div class='add'>+	if (IS_ERR_OR_NULL(head)) {</div><div class='add'>+		if (IS_ERR(head))</div><div class='add'>+			test_err("failed to select delayed ref head: %ld",</div><div class='add'>+				 PTR_ERR(head));</div><div class='add'>+		else</div><div class='add'>+			test_err("failed to find delayed ref head");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = -EINVAL;</div><div class='add'>+	if (validate_ref_head(head, head_check))</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;head-&gt;lock);</div><div class='add'>+	node = btrfs_select_delayed_ref(head);</div><div class='add'>+	spin_unlock(&amp;head-&gt;lock);</div><div class='add'>+	if (!node) {</div><div class='add'>+		test_err("failed to select delayed ref");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (validate_ref_node(node, node_check))</div><div class='add'>+		goto out;</div><div class='add'>+	ret = 0;</div><div class='add'>+out:</div><div class='add'>+	btrfs_unselect_ref_head(delayed_refs, head);</div><div class='add'>+	btrfs_destroy_delayed_refs(trans-&gt;transaction);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * These are simple tests, make sure that our btrfs_ref's get turned into the</div><div class='add'>+ * appropriate btrfs_delayed_ref_node based on their settings and action.</div><div class='add'>+ */</div><div class='add'>+static int simple_tests(struct btrfs_trans_handle *trans)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='add'>+	struct ref_head_check head_check = {</div><div class='add'>+		.bytenr = FAKE_BYTENR,</div><div class='add'>+		.num_bytes = fs_info-&gt;nodesize,</div><div class='add'>+		.ref_mod = 1,</div><div class='add'>+		.total_ref_mod = 1,</div><div class='add'>+	};</div><div class='add'>+	struct ref_node_check node_check = {</div><div class='add'>+		.bytenr = FAKE_BYTENR,</div><div class='add'>+		.num_bytes = fs_info-&gt;nodesize,</div><div class='add'>+		.ref_mod = 1,</div><div class='add'>+		.action = BTRFS_ADD_DELAYED_REF,</div><div class='add'>+		.type = BTRFS_TREE_BLOCK_REF_KEY,</div><div class='add'>+		.parent = 0,</div><div class='add'>+		.root = FAKE_ROOT_OBJECTID,</div><div class='add'>+		.owner = FAKE_LEVEL,</div><div class='add'>+		.offset = 0,</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+	if (simple_test(trans, &amp;head_check, &amp;node_check)) {</div><div class='add'>+		test_err("single add tree block failed");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	node_check.type = BTRFS_EXTENT_DATA_REF_KEY;</div><div class='add'>+	node_check.owner = FAKE_INO;</div><div class='add'>+	node_check.offset = FAKE_FILE_OFFSET;</div><div class='add'>+</div><div class='add'>+	if (simple_test(trans, &amp;head_check, &amp;node_check)) {</div><div class='add'>+		test_err("single add extent data failed");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	node_check.parent = FAKE_PARENT;</div><div class='add'>+	node_check.type = BTRFS_SHARED_BLOCK_REF_KEY;</div><div class='add'>+	node_check.owner = FAKE_LEVEL;</div><div class='add'>+	node_check.offset = 0;</div><div class='add'>+</div><div class='add'>+	if (simple_test(trans, &amp;head_check, &amp;node_check)) {</div><div class='add'>+		test_err("single add shared block failed");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	node_check.type = BTRFS_SHARED_DATA_REF_KEY;</div><div class='add'>+	node_check.owner = FAKE_INO;</div><div class='add'>+	node_check.offset = FAKE_FILE_OFFSET;</div><div class='add'>+</div><div class='add'>+	if (simple_test(trans, &amp;head_check, &amp;node_check)) {</div><div class='add'>+		test_err("single add shared data failed");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	head_check.ref_mod = -1;</div><div class='add'>+	head_check.total_ref_mod = -1;</div><div class='add'>+	node_check.action = BTRFS_DROP_DELAYED_REF;</div><div class='add'>+	node_check.type = BTRFS_TREE_BLOCK_REF_KEY;</div><div class='add'>+	node_check.owner = FAKE_LEVEL;</div><div class='add'>+	node_check.offset = 0;</div><div class='add'>+	node_check.parent = 0;</div><div class='add'>+</div><div class='add'>+	if (simple_test(trans, &amp;head_check, &amp;node_check)) {</div><div class='add'>+		test_err("single drop tree block failed");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	node_check.type = BTRFS_EXTENT_DATA_REF_KEY;</div><div class='add'>+	node_check.owner = FAKE_INO;</div><div class='add'>+	node_check.offset = FAKE_FILE_OFFSET;</div><div class='add'>+</div><div class='add'>+	if (simple_test(trans, &amp;head_check, &amp;node_check)) {</div><div class='add'>+		test_err("single drop extent data failed");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	node_check.parent = FAKE_PARENT;</div><div class='add'>+	node_check.type = BTRFS_SHARED_BLOCK_REF_KEY;</div><div class='add'>+	node_check.owner = FAKE_LEVEL;</div><div class='add'>+	node_check.offset = 0;</div><div class='add'>+	if (simple_test(trans, &amp;head_check, &amp;node_check)) {</div><div class='add'>+		test_err("single drop shared block failed");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	node_check.type = BTRFS_SHARED_DATA_REF_KEY;</div><div class='add'>+	node_check.owner = FAKE_INO;</div><div class='add'>+	node_check.offset = FAKE_FILE_OFFSET;</div><div class='add'>+	if (simple_test(trans, &amp;head_check, &amp;node_check)) {</div><div class='add'>+		test_err("single drop shared data failed");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Merge tests, validate that we do delayed ref merging properly, the ref counts</div><div class='add'>+ * all end up properly, and delayed refs are deleted once they're no longer</div><div class='add'>+ * needed.</div><div class='add'>+ */</div><div class='add'>+static int merge_tests(struct btrfs_trans_handle *trans,</div><div class='add'>+		       enum btrfs_ref_type type)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='add'>+	struct btrfs_delayed_ref_head *head = NULL;</div><div class='add'>+	struct btrfs_delayed_ref_node *node;</div><div class='add'>+	struct btrfs_ref ref = {</div><div class='add'>+		.type = type,</div><div class='add'>+		.action = BTRFS_ADD_DELAYED_REF,</div><div class='add'>+		.parent = 0,</div><div class='add'>+		.ref_root = FAKE_ROOT_OBJECTID,</div><div class='add'>+		.bytenr = FAKE_BYTENR,</div><div class='add'>+		.num_bytes = fs_info-&gt;nodesize,</div><div class='add'>+	};</div><div class='add'>+	struct ref_head_check head_check = {</div><div class='add'>+		.bytenr = FAKE_BYTENR,</div><div class='add'>+		.num_bytes = fs_info-&gt;nodesize,</div><div class='add'>+		.ref_mod = 0,</div><div class='add'>+		.total_ref_mod = 0,</div><div class='add'>+	};</div><div class='add'>+	struct ref_node_check node_check = {</div><div class='add'>+		.bytenr = FAKE_BYTENR,</div><div class='add'>+		.num_bytes = fs_info-&gt;nodesize,</div><div class='add'>+		.ref_mod = 2,</div><div class='add'>+		.action = BTRFS_ADD_DELAYED_REF,</div><div class='add'>+		.parent = 0,</div><div class='add'>+		.root = FAKE_ROOT_OBJECTID,</div><div class='add'>+	};</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * First add a ref and then drop it, make sure we get a head ref with a</div><div class='add'>+	 * 0 total ref mod and no nodes.</div><div class='add'>+	 */</div><div class='add'>+	if (type == BTRFS_REF_METADATA) {</div><div class='add'>+		node_check.type = BTRFS_TREE_BLOCK_REF_KEY;</div><div class='add'>+		node_check.owner = FAKE_LEVEL;</div><div class='add'>+		btrfs_init_tree_ref(&amp;ref, FAKE_LEVEL, FAKE_ROOT_OBJECTID, false);</div><div class='add'>+	} else {</div><div class='add'>+		node_check.type = BTRFS_EXTENT_DATA_REF_KEY;</div><div class='add'>+		node_check.owner = FAKE_INO;</div><div class='add'>+		node_check.offset = FAKE_FILE_OFFSET;</div><div class='add'>+		btrfs_init_data_ref(&amp;ref, FAKE_INO, FAKE_FILE_OFFSET,</div><div class='add'>+				    FAKE_ROOT_OBJECTID, true);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (type == BTRFS_REF_METADATA)</div><div class='add'>+		ret = btrfs_add_delayed_tree_ref(trans, &amp;ref, NULL);</div><div class='add'>+	else</div><div class='add'>+		ret = btrfs_add_delayed_data_ref(trans, &amp;ref, 0);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("failed ref action %d", ret);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ref.action = BTRFS_DROP_DELAYED_REF;</div><div class='add'>+	if (type == BTRFS_REF_METADATA)</div><div class='add'>+		ret = btrfs_add_delayed_tree_ref(trans, &amp;ref, NULL);</div><div class='add'>+	else</div><div class='add'>+		ret = btrfs_add_delayed_data_ref(trans, &amp;ref, 0);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("failed ref action %d", ret);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	head = btrfs_select_ref_head(fs_info, &amp;trans-&gt;transaction-&gt;delayed_refs);</div><div class='add'>+	if (IS_ERR_OR_NULL(head)) {</div><div class='add'>+		if (IS_ERR(head))</div><div class='add'>+			test_err("failed to select delayed ref head: %ld",</div><div class='add'>+				 PTR_ERR(head));</div><div class='add'>+		else</div><div class='add'>+			test_err("failed to find delayed ref head");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = -EINVAL;</div><div class='add'>+	if (validate_ref_head(head, &amp;head_check)) {</div><div class='add'>+		test_err("single add and drop failed");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;head-&gt;lock);</div><div class='add'>+	node = btrfs_select_delayed_ref(head);</div><div class='add'>+	spin_unlock(&amp;head-&gt;lock);</div><div class='add'>+	if (node) {</div><div class='add'>+		test_err("found node when none should exist");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	delete_delayed_ref_head(trans, head);</div><div class='add'>+	head = NULL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Add a ref, then add another ref, make sure we get a head ref with a</div><div class='add'>+	 * 2 total ref mod and 1 node.</div><div class='add'>+	 */</div><div class='add'>+	ref.action = BTRFS_ADD_DELAYED_REF;</div><div class='add'>+	if (type == BTRFS_REF_METADATA)</div><div class='add'>+		ret = btrfs_add_delayed_tree_ref(trans, &amp;ref, NULL);</div><div class='add'>+	else</div><div class='add'>+		ret = btrfs_add_delayed_data_ref(trans, &amp;ref, 0);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("failed ref action %d", ret);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (type == BTRFS_REF_METADATA)</div><div class='add'>+		ret = btrfs_add_delayed_tree_ref(trans, &amp;ref, NULL);</div><div class='add'>+	else</div><div class='add'>+		ret = btrfs_add_delayed_data_ref(trans, &amp;ref, 0);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("failed ref action %d", ret);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	head = btrfs_select_ref_head(fs_info, &amp;trans-&gt;transaction-&gt;delayed_refs);</div><div class='add'>+	if (IS_ERR_OR_NULL(head)) {</div><div class='add'>+		if (IS_ERR(head))</div><div class='add'>+			test_err("failed to select delayed ref head: %ld",</div><div class='add'>+				 PTR_ERR(head));</div><div class='add'>+		else</div><div class='add'>+			test_err("failed to find delayed ref head");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	head_check.ref_mod = 2;</div><div class='add'>+	head_check.total_ref_mod = 2;</div><div class='add'>+	ret = -EINVAL;</div><div class='add'>+	if (validate_ref_head(head, &amp;head_check)) {</div><div class='add'>+		test_err("double add failed");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;head-&gt;lock);</div><div class='add'>+	node = btrfs_select_delayed_ref(head);</div><div class='add'>+	spin_unlock(&amp;head-&gt;lock);</div><div class='add'>+	if (!node) {</div><div class='add'>+		test_err("failed to select delayed ref");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (validate_ref_node(node, &amp;node_check)) {</div><div class='add'>+		test_err("node check failed");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	delete_delayed_ref_node(head, node);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;head-&gt;lock);</div><div class='add'>+	node = btrfs_select_delayed_ref(head);</div><div class='add'>+	spin_unlock(&amp;head-&gt;lock);</div><div class='add'>+	if (node) {</div><div class='add'>+		test_err("found node when none should exist");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	delete_delayed_ref_head(trans, head);</div><div class='add'>+	head = NULL;</div><div class='add'>+</div><div class='add'>+	/* Add two drop refs, make sure they are merged properly. */</div><div class='add'>+	ref.action = BTRFS_DROP_DELAYED_REF;</div><div class='add'>+	if (type == BTRFS_REF_METADATA)</div><div class='add'>+		ret = btrfs_add_delayed_tree_ref(trans, &amp;ref, NULL);</div><div class='add'>+	else</div><div class='add'>+		ret = btrfs_add_delayed_data_ref(trans, &amp;ref, 0);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("failed ref action %d", ret);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (type == BTRFS_REF_METADATA)</div><div class='add'>+		ret = btrfs_add_delayed_tree_ref(trans, &amp;ref, NULL);</div><div class='add'>+	else</div><div class='add'>+		ret = btrfs_add_delayed_data_ref(trans, &amp;ref, 0);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("failed ref action %d", ret);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	head = btrfs_select_ref_head(fs_info, &amp;trans-&gt;transaction-&gt;delayed_refs);</div><div class='add'>+	if (IS_ERR_OR_NULL(head)) {</div><div class='add'>+		if (IS_ERR(head))</div><div class='add'>+			test_err("failed to select delayed ref head: %ld",</div><div class='add'>+				 PTR_ERR(head));</div><div class='add'>+		else</div><div class='add'>+			test_err("failed to find delayed ref head");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	head_check.ref_mod = -2;</div><div class='add'>+	head_check.total_ref_mod = -2;</div><div class='add'>+	ret = -EINVAL;</div><div class='add'>+	if (validate_ref_head(head, &amp;head_check)) {</div><div class='add'>+		test_err("double drop failed");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	node_check.action = BTRFS_DROP_DELAYED_REF;</div><div class='add'>+	spin_lock(&amp;head-&gt;lock);</div><div class='add'>+	node = btrfs_select_delayed_ref(head);</div><div class='add'>+	spin_unlock(&amp;head-&gt;lock);</div><div class='add'>+	if (!node) {</div><div class='add'>+		test_err("failed to select delayed ref");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (validate_ref_node(node, &amp;node_check)) {</div><div class='add'>+		test_err("node check failed");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	delete_delayed_ref_node(head, node);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;head-&gt;lock);</div><div class='add'>+	node = btrfs_select_delayed_ref(head);</div><div class='add'>+	spin_unlock(&amp;head-&gt;lock);</div><div class='add'>+	if (node) {</div><div class='add'>+		test_err("found node when none should exist");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	delete_delayed_ref_head(trans, head);</div><div class='add'>+	head = NULL;</div><div class='add'>+</div><div class='add'>+	/* Add multiple refs, then drop until we go negative again. */</div><div class='add'>+	ref.action = BTRFS_ADD_DELAYED_REF;</div><div class='add'>+	for (int i = 0; i &lt; 10; i++) {</div><div class='add'>+		if (type == BTRFS_REF_METADATA)</div><div class='add'>+			ret = btrfs_add_delayed_tree_ref(trans, &amp;ref, NULL);</div><div class='add'>+		else</div><div class='add'>+			ret = btrfs_add_delayed_data_ref(trans, &amp;ref, 0);</div><div class='add'>+		if (ret) {</div><div class='add'>+			test_err("failed ref action %d", ret);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ref.action = BTRFS_DROP_DELAYED_REF;</div><div class='add'>+	for (int i = 0; i &lt; 12; i++) {</div><div class='add'>+		if (type == BTRFS_REF_METADATA)</div><div class='add'>+			ret = btrfs_add_delayed_tree_ref(trans, &amp;ref, NULL);</div><div class='add'>+		else</div><div class='add'>+			ret = btrfs_add_delayed_data_ref(trans, &amp;ref, 0);</div><div class='add'>+		if (ret) {</div><div class='add'>+			test_err("failed ref action %d", ret);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	head = btrfs_select_ref_head(fs_info, &amp;trans-&gt;transaction-&gt;delayed_refs);</div><div class='add'>+	if (IS_ERR_OR_NULL(head)) {</div><div class='add'>+		if (IS_ERR(head))</div><div class='add'>+			test_err("failed to select delayed ref head: %ld",</div><div class='add'>+				 PTR_ERR(head));</div><div class='add'>+		else</div><div class='add'>+			test_err("failed to find delayed ref head");</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	head_check.ref_mod = -2;</div><div class='add'>+	head_check.total_ref_mod = -2;</div><div class='add'>+	ret = -EINVAL;</div><div class='add'>+	if (validate_ref_head(head, &amp;head_check)) {</div><div class='add'>+		test_err("double drop failed");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;head-&gt;lock);</div><div class='add'>+	node = btrfs_select_delayed_ref(head);</div><div class='add'>+	spin_unlock(&amp;head-&gt;lock);</div><div class='add'>+	if (!node) {</div><div class='add'>+		test_err("failed to select delayed ref");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (validate_ref_node(node, &amp;node_check)) {</div><div class='add'>+		test_err("node check failed");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	delete_delayed_ref_node(head, node);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;head-&gt;lock);</div><div class='add'>+	node = btrfs_select_delayed_ref(head);</div><div class='add'>+	spin_unlock(&amp;head-&gt;lock);</div><div class='add'>+	if (node) {</div><div class='add'>+		test_err("found node when none should exist");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	delete_delayed_ref_head(trans, head);</div><div class='add'>+	head = NULL;</div><div class='add'>+</div><div class='add'>+	/* Drop multiple refs, then add until we go positive again. */</div><div class='add'>+	ref.action = BTRFS_DROP_DELAYED_REF;</div><div class='add'>+	for (int i = 0; i &lt; 10; i++) {</div><div class='add'>+		if (type == BTRFS_REF_METADATA)</div><div class='add'>+			ret = btrfs_add_delayed_tree_ref(trans, &amp;ref, NULL);</div><div class='add'>+		else</div><div class='add'>+			ret = btrfs_add_delayed_data_ref(trans, &amp;ref, 0);</div><div class='add'>+		if (ret) {</div><div class='add'>+			test_err("failed ref action %d", ret);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ref.action = BTRFS_ADD_DELAYED_REF;</div><div class='add'>+	for (int i = 0; i &lt; 12; i++) {</div><div class='add'>+		if (type == BTRFS_REF_METADATA)</div><div class='add'>+			ret = btrfs_add_delayed_tree_ref(trans, &amp;ref, NULL);</div><div class='add'>+		else</div><div class='add'>+			ret = btrfs_add_delayed_data_ref(trans, &amp;ref, 0);</div><div class='add'>+		if (ret) {</div><div class='add'>+			test_err("failed ref action %d", ret);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	head = btrfs_select_ref_head(fs_info, &amp;trans-&gt;transaction-&gt;delayed_refs);</div><div class='add'>+	if (IS_ERR_OR_NULL(head)) {</div><div class='add'>+		if (IS_ERR(head))</div><div class='add'>+			test_err("failed to select delayed ref head: %ld",</div><div class='add'>+				 PTR_ERR(head));</div><div class='add'>+		else</div><div class='add'>+			test_err("failed to find delayed ref head");</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	head_check.ref_mod = 2;</div><div class='add'>+	head_check.total_ref_mod = 2;</div><div class='add'>+	ret = -EINVAL;</div><div class='add'>+	if (validate_ref_head(head, &amp;head_check)) {</div><div class='add'>+		test_err("add and drop to positive failed");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	node_check.action = BTRFS_ADD_DELAYED_REF;</div><div class='add'>+	spin_lock(&amp;head-&gt;lock);</div><div class='add'>+	node = btrfs_select_delayed_ref(head);</div><div class='add'>+	spin_unlock(&amp;head-&gt;lock);</div><div class='add'>+	if (!node) {</div><div class='add'>+		test_err("failed to select delayed ref");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (validate_ref_node(node, &amp;node_check)) {</div><div class='add'>+		test_err("node check failed");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	delete_delayed_ref_node(head, node);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;head-&gt;lock);</div><div class='add'>+	node = btrfs_select_delayed_ref(head);</div><div class='add'>+	spin_unlock(&amp;head-&gt;lock);</div><div class='add'>+	if (node) {</div><div class='add'>+		test_err("found node when none should exist");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	delete_delayed_ref_head(trans, head);</div><div class='add'>+	head = NULL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Add a bunch of refs with different roots and parents, then drop them</div><div class='add'>+	 * all, make sure everything is properly merged.</div><div class='add'>+	 */</div><div class='add'>+	ref.action = BTRFS_ADD_DELAYED_REF;</div><div class='add'>+	for (int i = 0; i &lt; 50; i++) {</div><div class='add'>+		if (!(i % 2)) {</div><div class='add'>+			ref.parent = 0;</div><div class='add'>+			ref.ref_root = FAKE_ROOT_OBJECTID + i;</div><div class='add'>+		} else {</div><div class='add'>+			ref.parent = FAKE_PARENT + (i * fs_info-&gt;nodesize);</div><div class='add'>+		}</div><div class='add'>+		if (type == BTRFS_REF_METADATA)</div><div class='add'>+			ret = btrfs_add_delayed_tree_ref(trans, &amp;ref, NULL);</div><div class='add'>+		else</div><div class='add'>+			ret = btrfs_add_delayed_data_ref(trans, &amp;ref, 0);</div><div class='add'>+		if (ret) {</div><div class='add'>+			test_err("failed ref action %d", ret);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ref.action = BTRFS_DROP_DELAYED_REF;</div><div class='add'>+	for (int i = 0; i &lt; 50; i++) {</div><div class='add'>+		if (!(i % 2)) {</div><div class='add'>+			ref.parent = 0;</div><div class='add'>+			ref.ref_root = FAKE_ROOT_OBJECTID + i;</div><div class='add'>+		} else {</div><div class='add'>+			ref.parent = FAKE_PARENT + (i * fs_info-&gt;nodesize);</div><div class='add'>+		}</div><div class='add'>+		if (type == BTRFS_REF_METADATA)</div><div class='add'>+			ret = btrfs_add_delayed_tree_ref(trans, &amp;ref, NULL);</div><div class='add'>+		else</div><div class='add'>+			ret = btrfs_add_delayed_data_ref(trans, &amp;ref, 0);</div><div class='add'>+		if (ret) {</div><div class='add'>+			test_err("failed ref action %d", ret);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	head = btrfs_select_ref_head(fs_info, &amp;trans-&gt;transaction-&gt;delayed_refs);</div><div class='add'>+	if (IS_ERR_OR_NULL(head)) {</div><div class='add'>+		if (IS_ERR(head))</div><div class='add'>+			test_err("failed to select delayed ref head: %ld",</div><div class='add'>+				 PTR_ERR(head));</div><div class='add'>+		else</div><div class='add'>+			test_err("failed to find delayed ref head");</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	head_check.ref_mod = 0;</div><div class='add'>+	head_check.total_ref_mod = 0;</div><div class='add'>+	ret = -EINVAL;</div><div class='add'>+	if (validate_ref_head(head, &amp;head_check)) {</div><div class='add'>+		test_err("add and drop multiple failed");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;head-&gt;lock);</div><div class='add'>+	node = btrfs_select_delayed_ref(head);</div><div class='add'>+	spin_unlock(&amp;head-&gt;lock);</div><div class='add'>+	if (node) {</div><div class='add'>+		test_err("found node when none should exist");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	ret = 0;</div><div class='add'>+out:</div><div class='add'>+	if (!IS_ERR_OR_NULL(head))</div><div class='add'>+		btrfs_unselect_ref_head(&amp;trans-&gt;transaction-&gt;delayed_refs, head);</div><div class='add'>+	btrfs_destroy_delayed_refs(trans-&gt;transaction);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Basic test to validate we always get the add operations first followed by any</div><div class='add'>+ * delete operations.</div><div class='add'>+ */</div><div class='add'>+static int select_delayed_refs_test(struct btrfs_trans_handle *trans)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_delayed_ref_root *delayed_refs =</div><div class='add'>+		&amp;trans-&gt;transaction-&gt;delayed_refs;</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='add'>+	struct btrfs_delayed_ref_head *head = NULL;</div><div class='add'>+	struct btrfs_delayed_ref_node *node;</div><div class='add'>+	struct btrfs_ref ref = {</div><div class='add'>+		.type = BTRFS_REF_METADATA,</div><div class='add'>+		.action = BTRFS_DROP_DELAYED_REF,</div><div class='add'>+		.parent = 0,</div><div class='add'>+		.ref_root = FAKE_ROOT_OBJECTID,</div><div class='add'>+		.bytenr = FAKE_BYTENR,</div><div class='add'>+		.num_bytes = fs_info-&gt;nodesize,</div><div class='add'>+	};</div><div class='add'>+	struct ref_head_check head_check = {</div><div class='add'>+		.bytenr = FAKE_BYTENR,</div><div class='add'>+		.num_bytes = fs_info-&gt;nodesize,</div><div class='add'>+		.ref_mod = 0,</div><div class='add'>+		.total_ref_mod = 0,</div><div class='add'>+	};</div><div class='add'>+	struct ref_node_check node_check = {</div><div class='add'>+		.bytenr = FAKE_BYTENR,</div><div class='add'>+		.num_bytes = fs_info-&gt;nodesize,</div><div class='add'>+		.ref_mod = 1,</div><div class='add'>+		.action = BTRFS_ADD_DELAYED_REF,</div><div class='add'>+		.type = BTRFS_TREE_BLOCK_REF_KEY,</div><div class='add'>+		.parent = 0,</div><div class='add'>+		.owner = FAKE_LEVEL,</div><div class='add'>+		.offset = 0,</div><div class='add'>+	};</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	/* Add the drop first. */</div><div class='add'>+	btrfs_init_tree_ref(&amp;ref, FAKE_LEVEL, FAKE_ROOT_OBJECTID, false);</div><div class='add'>+	ret = btrfs_add_delayed_tree_ref(trans, &amp;ref, NULL);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("failed ref action %d", ret);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Now add the add, and make it a different root so it's logically later</div><div class='add'>+	 * in the rb tree.</div><div class='add'>+	 */</div><div class='add'>+	ref.action = BTRFS_ADD_DELAYED_REF;</div><div class='add'>+	ref.ref_root = FAKE_ROOT_OBJECTID + 1;</div><div class='add'>+	ret = btrfs_add_delayed_tree_ref(trans, &amp;ref, NULL);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("failed ref action %d", ret);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	head = btrfs_select_ref_head(fs_info, delayed_refs);</div><div class='add'>+	if (IS_ERR_OR_NULL(head)) {</div><div class='add'>+		if (IS_ERR(head))</div><div class='add'>+			test_err("failed to select delayed ref head: %ld",</div><div class='add'>+				 PTR_ERR(head));</div><div class='add'>+		else</div><div class='add'>+			test_err("failed to find delayed ref head");</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		head = NULL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = -EINVAL;</div><div class='add'>+	if (validate_ref_head(head, &amp;head_check)) {</div><div class='add'>+		test_err("head check failed");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;head-&gt;lock);</div><div class='add'>+	node = btrfs_select_delayed_ref(head);</div><div class='add'>+	spin_unlock(&amp;head-&gt;lock);</div><div class='add'>+	if (!node) {</div><div class='add'>+		test_err("failed to select delayed ref");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	node_check.root = FAKE_ROOT_OBJECTID + 1;</div><div class='add'>+	if (validate_ref_node(node, &amp;node_check)) {</div><div class='add'>+		test_err("node check failed");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	delete_delayed_ref_node(head, node);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;head-&gt;lock);</div><div class='add'>+	node = btrfs_select_delayed_ref(head);</div><div class='add'>+	spin_unlock(&amp;head-&gt;lock);</div><div class='add'>+	if (!node) {</div><div class='add'>+		test_err("failed to select delayed ref");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	node_check.action = BTRFS_DROP_DELAYED_REF;</div><div class='add'>+	node_check.root = FAKE_ROOT_OBJECTID;</div><div class='add'>+	if (validate_ref_node(node, &amp;node_check)) {</div><div class='add'>+		test_err("node check failed");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	delete_delayed_ref_node(head, node);</div><div class='add'>+	delete_delayed_ref_head(trans, head);</div><div class='add'>+	head = NULL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Now we're going to do the same thing, but we're going to have an add</div><div class='add'>+	 * that gets deleted because of a merge, and make sure we still have</div><div class='add'>+	 * another add in place.</div><div class='add'>+	 */</div><div class='add'>+	ref.action = BTRFS_DROP_DELAYED_REF;</div><div class='add'>+	ref.ref_root = FAKE_ROOT_OBJECTID;</div><div class='add'>+	ret = btrfs_add_delayed_tree_ref(trans, &amp;ref, NULL);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("failed ref action %d", ret);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ref.action = BTRFS_ADD_DELAYED_REF;</div><div class='add'>+	ref.ref_root = FAKE_ROOT_OBJECTID + 1;</div><div class='add'>+	ret = btrfs_add_delayed_tree_ref(trans, &amp;ref, NULL);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("failed ref action %d", ret);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ref.action = BTRFS_DROP_DELAYED_REF;</div><div class='add'>+	ret = btrfs_add_delayed_tree_ref(trans, &amp;ref, NULL);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("failed ref action %d", ret);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ref.action = BTRFS_ADD_DELAYED_REF;</div><div class='add'>+	ref.ref_root = FAKE_ROOT_OBJECTID + 2;</div><div class='add'>+	ret = btrfs_add_delayed_tree_ref(trans, &amp;ref, NULL);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("failed ref action %d", ret);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	head = btrfs_select_ref_head(fs_info, delayed_refs);</div><div class='add'>+	if (IS_ERR_OR_NULL(head)) {</div><div class='add'>+		if (IS_ERR(head))</div><div class='add'>+			test_err("failed to select delayed ref head: %ld",</div><div class='add'>+				 PTR_ERR(head));</div><div class='add'>+		else</div><div class='add'>+			test_err("failed to find delayed ref head");</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		head = NULL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = -EINVAL;</div><div class='add'>+	if (validate_ref_head(head, &amp;head_check)) {</div><div class='add'>+		test_err("head check failed");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;head-&gt;lock);</div><div class='add'>+	node = btrfs_select_delayed_ref(head);</div><div class='add'>+	spin_unlock(&amp;head-&gt;lock);</div><div class='add'>+	if (!node) {</div><div class='add'>+		test_err("failed to select delayed ref");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	node_check.action = BTRFS_ADD_DELAYED_REF;</div><div class='add'>+	node_check.root = FAKE_ROOT_OBJECTID + 2;</div><div class='add'>+	if (validate_ref_node(node, &amp;node_check)) {</div><div class='add'>+		test_err("node check failed");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	delete_delayed_ref_node(head, node);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;head-&gt;lock);</div><div class='add'>+	node = btrfs_select_delayed_ref(head);</div><div class='add'>+	spin_unlock(&amp;head-&gt;lock);</div><div class='add'>+	if (!node) {</div><div class='add'>+		test_err("failed to select delayed ref");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	node_check.action = BTRFS_DROP_DELAYED_REF;</div><div class='add'>+	node_check.root = FAKE_ROOT_OBJECTID;</div><div class='add'>+	if (validate_ref_node(node, &amp;node_check)) {</div><div class='add'>+		test_err("node check failed");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	delete_delayed_ref_node(head, node);</div><div class='add'>+	ret = 0;</div><div class='add'>+out:</div><div class='add'>+	if (head)</div><div class='add'>+		btrfs_unselect_ref_head(delayed_refs, head);</div><div class='add'>+	btrfs_destroy_delayed_refs(trans-&gt;transaction);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_test_delayed_refs(u32 sectorsize, u32 nodesize)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_transaction *transaction;</div><div class='add'>+	struct btrfs_trans_handle trans;</div><div class='add'>+	struct btrfs_fs_info *fs_info;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	test_msg("running delayed refs tests");</div><div class='add'>+</div><div class='add'>+	fs_info = btrfs_alloc_dummy_fs_info(nodesize, sectorsize);</div><div class='add'>+	if (!fs_info) {</div><div class='add'>+		test_std_err(TEST_ALLOC_FS_INFO);</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+	transaction = kmalloc(sizeof(*transaction), GFP_KERNEL);</div><div class='add'>+	if (!transaction) {</div><div class='add'>+		test_std_err(TEST_ALLOC_TRANSACTION);</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out_free_fs_info;</div><div class='add'>+	}</div><div class='add'>+	btrfs_init_dummy_trans(&amp;trans, fs_info);</div><div class='add'>+	btrfs_init_dummy_transaction(transaction, fs_info);</div><div class='add'>+	trans.transaction = transaction;</div><div class='add'>+</div><div class='add'>+	ret = simple_tests(&amp;trans);</div><div class='add'>+	if (!ret) {</div><div class='add'>+		test_msg("running delayed refs merge tests on metadata refs");</div><div class='add'>+		ret = merge_tests(&amp;trans, BTRFS_REF_METADATA);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!ret) {</div><div class='add'>+		test_msg("running delayed refs merge tests on data refs");</div><div class='add'>+		ret = merge_tests(&amp;trans, BTRFS_REF_DATA);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!ret)</div><div class='add'>+		ret = select_delayed_refs_test(&amp;trans);</div><div class='add'>+</div><div class='add'>+	kfree(transaction);</div><div class='add'>+out_free_fs_info:</div><div class='add'>+	btrfs_free_dummy_fs_info(fs_info);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/btrfs/tests/extent-buffer-tests.c b/fs/btrfs/tests/extent-buffer-tests.c<br/>index 2a95f7224e18..6a43a64ba55a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tests/extent-buffer-tests.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tests/extent-buffer-tests.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tests/extent-buffer-tests.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/tests/extent-buffer-tests.c</a></div><div class='hunk'>@@ -8,6 +8,7 @@</div><div class='ctx'> #include "../ctree.h"</div><div class='ctx'> #include "../extent_io.h"</div><div class='ctx'> #include "../disk-io.h"</div><div class='add'>+#include "../accessors.h"</div><div class='ctx'> </div><div class='ctx'> static int test_btrfs_split_item(u32 sectorsize, u32 nodesize)</div><div class='ctx'> {</div><div class='hunk'>@@ -15,7 +16,6 @@ static int test_btrfs_split_item(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 	struct btrfs_path *path = NULL;</div><div class='ctx'> 	struct btrfs_root *root = NULL;</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='del'>-	struct btrfs_item *item;</div><div class='ctx'> 	char *value = "mary had a little lamb";</div><div class='ctx'> 	char *split1 = "mary had a little";</div><div class='ctx'> 	char *split2 = " lamb";</div><div class='hunk'>@@ -48,7 +48,8 @@ static int test_btrfs_split_item(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	path-&gt;nodes[0] = eb = alloc_dummy_extent_buffer(fs_info, nodesize);</div><div class='add'>+	eb = alloc_dummy_extent_buffer(fs_info, nodesize);</div><div class='add'>+	path-&gt;nodes[0] = eb;</div><div class='ctx'> 	if (!eb) {</div><div class='ctx'> 		test_std_err(TEST_ALLOC_EXTENT_BUFFER);</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='hunk'>@@ -60,8 +61,11 @@ static int test_btrfs_split_item(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 	key.type = BTRFS_EXTENT_CSUM_KEY;</div><div class='ctx'> 	key.offset = 0;</div><div class='ctx'> </div><div class='del'>-	btrfs_setup_item_for_insert(root, path, &amp;key, value_len);</div><div class='del'>-	item = btrfs_item_nr(0);</div><div class='add'>+	/*</div><div class='add'>+	 * Passing a NULL trans handle is fine here, we have a dummy root eb</div><div class='add'>+	 * and the tree is a single node (level 0).</div><div class='add'>+	 */</div><div class='add'>+	btrfs_setup_item_for_insert(NULL, root, path, &amp;key, value_len);</div><div class='ctx'> 	write_extent_buffer(eb, value, btrfs_item_ptr_offset(eb, 0),</div><div class='ctx'> 			    value_len);</div><div class='ctx'> </div><div class='hunk'>@@ -90,8 +94,7 @@ static int test_btrfs_split_item(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	item = btrfs_item_nr(0);</div><div class='del'>-	if (btrfs_item_size(eb, item) != strlen(split1)) {</div><div class='add'>+	if (btrfs_item_size(eb, 0) != strlen(split1)) {</div><div class='ctx'> 		test_err("invalid len in the first split");</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -115,8 +118,7 @@ static int test_btrfs_split_item(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	item = btrfs_item_nr(1);</div><div class='del'>-	if (btrfs_item_size(eb, item) != strlen(split2)) {</div><div class='add'>+	if (btrfs_item_size(eb, 1) != strlen(split2)) {</div><div class='ctx'> 		test_err("invalid len in the second split");</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -147,8 +149,7 @@ static int test_btrfs_split_item(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	item = btrfs_item_nr(0);</div><div class='del'>-	if (btrfs_item_size(eb, item) != strlen(split3)) {</div><div class='add'>+	if (btrfs_item_size(eb, 0) != strlen(split3)) {</div><div class='ctx'> 		test_err("invalid len in the first split");</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -171,8 +172,7 @@ static int test_btrfs_split_item(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	item = btrfs_item_nr(1);</div><div class='del'>-	if (btrfs_item_size(eb, item) != strlen(split4)) {</div><div class='add'>+	if (btrfs_item_size(eb, 1) != strlen(split4)) {</div><div class='ctx'> 		test_err("invalid len in the second split");</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -195,8 +195,7 @@ static int test_btrfs_split_item(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	item = btrfs_item_nr(2);</div><div class='del'>-	if (btrfs_item_size(eb, item) != strlen(split2)) {</div><div class='add'>+	if (btrfs_item_size(eb, 2) != strlen(split2)) {</div><div class='ctx'> 		test_err("invalid len in the second split");</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 		goto out;</div><div class='head'>diff --git a/fs/btrfs/tests/extent-io-tests.c b/fs/btrfs/tests/extent-io-tests.c<br/>index c2e72e7a8ff0..a0187d6163df 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tests/extent-io-tests.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tests/extent-io-tests.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tests/extent-io-tests.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/tests/extent-io-tests.c</a></div><div class='hunk'>@@ -4,65 +4,116 @@</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='add'>+#include &lt;linux/pagevec.h&gt;</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/sizes.h&gt;</div><div class='ctx'> #include "btrfs-tests.h"</div><div class='ctx'> #include "../ctree.h"</div><div class='ctx'> #include "../extent_io.h"</div><div class='add'>+#include "../disk-io.h"</div><div class='ctx'> #include "../btrfs_inode.h"</div><div class='ctx'> </div><div class='del'>-#define PROCESS_UNLOCK		(1 &lt;&lt; 0)</div><div class='del'>-#define PROCESS_RELEASE		(1 &lt;&lt; 1)</div><div class='del'>-#define PROCESS_TEST_LOCKED	(1 &lt;&lt; 2)</div><div class='add'>+#define PROCESS_UNLOCK		(1U &lt;&lt; 0)</div><div class='add'>+#define PROCESS_RELEASE		(1U &lt;&lt; 1)</div><div class='add'>+#define PROCESS_TEST_LOCKED	(1U &lt;&lt; 2)</div><div class='ctx'> </div><div class='ctx'> static noinline int process_page_range(struct inode *inode, u64 start, u64 end,</div><div class='ctx'> 				       unsigned long flags)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='del'>-	struct page *pages[16];</div><div class='del'>-	unsigned long index = start &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	unsigned long end_index = end &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	unsigned long nr_pages = end_index - index + 1;</div><div class='add'>+	struct folio_batch fbatch;</div><div class='add'>+	pgoff_t index = start &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	pgoff_t end_index = end &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> 	int i;</div><div class='ctx'> 	int count = 0;</div><div class='ctx'> 	int loops = 0;</div><div class='ctx'> </div><div class='del'>-	while (nr_pages &gt; 0) {</div><div class='del'>-		ret = find_get_pages_contig(inode-&gt;i_mapping, index,</div><div class='del'>-				     min_t(unsigned long, nr_pages,</div><div class='del'>-				     ARRAY_SIZE(pages)), pages);</div><div class='add'>+	folio_batch_init(&amp;fbatch);</div><div class='add'>+</div><div class='add'>+	while (index &lt;= end_index) {</div><div class='add'>+		ret = filemap_get_folios_contig(inode-&gt;i_mapping, &amp;index,</div><div class='add'>+				end_index, &amp;fbatch);</div><div class='ctx'> 		for (i = 0; i &lt; ret; i++) {</div><div class='add'>+			struct folio *folio = fbatch.folios[i];</div><div class='add'>+</div><div class='ctx'> 			if (flags &amp; PROCESS_TEST_LOCKED &amp;&amp;</div><div class='del'>-			    !PageLocked(pages[i]))</div><div class='add'>+			    !folio_test_locked(folio))</div><div class='ctx'> 				count++;</div><div class='del'>-			if (flags &amp; PROCESS_UNLOCK &amp;&amp; PageLocked(pages[i]))</div><div class='del'>-				unlock_page(pages[i]);</div><div class='del'>-			put_page(pages[i]);</div><div class='add'>+			if (flags &amp; PROCESS_UNLOCK &amp;&amp; folio_test_locked(folio))</div><div class='add'>+				folio_unlock(folio);</div><div class='ctx'> 			if (flags &amp; PROCESS_RELEASE)</div><div class='del'>-				put_page(pages[i]);</div><div class='add'>+				folio_put(folio);</div><div class='ctx'> 		}</div><div class='del'>-		nr_pages -= ret;</div><div class='del'>-		index += ret;</div><div class='add'>+		folio_batch_release(&amp;fbatch);</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 		loops++;</div><div class='ctx'> 		if (loops &gt; 100000) {</div><div class='ctx'> 			printk(KERN_ERR</div><div class='del'>-		"stuck in a loop, start %llu, end %llu, nr_pages %lu, ret %d\n",</div><div class='del'>-				start, end, nr_pages, ret);</div><div class='add'>+		"stuck in a loop, start %llu, end %llu, ret %d\n",</div><div class='add'>+				start, end, ret);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> 	return count;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int test_find_delalloc(u32 sectorsize)</div><div class='add'>+#define STATE_FLAG_STR_LEN			256</div><div class='add'>+</div><div class='add'>+#define PRINT_ONE_FLAG(state, dest, cur, name)				\</div><div class='add'>+({									\</div><div class='add'>+	if (state-&gt;state &amp; EXTENT_##name)				\</div><div class='add'>+		cur += scnprintf(dest + cur, STATE_FLAG_STR_LEN - cur,	\</div><div class='add'>+				 "%s" #name, cur == 0 ? "" : "|");	\</div><div class='add'>+})</div><div class='add'>+</div><div class='add'>+static void extent_flag_to_str(const struct extent_state *state, char *dest)</div><div class='add'>+{</div><div class='add'>+	int cur = 0;</div><div class='add'>+</div><div class='add'>+	dest[0] = 0;</div><div class='add'>+	PRINT_ONE_FLAG(state, dest, cur, DIRTY);</div><div class='add'>+	PRINT_ONE_FLAG(state, dest, cur, LOCKED);</div><div class='add'>+	PRINT_ONE_FLAG(state, dest, cur, DIRTY_LOG1);</div><div class='add'>+	PRINT_ONE_FLAG(state, dest, cur, DIRTY_LOG2);</div><div class='add'>+	PRINT_ONE_FLAG(state, dest, cur, DELALLOC);</div><div class='add'>+	PRINT_ONE_FLAG(state, dest, cur, DEFRAG);</div><div class='add'>+	PRINT_ONE_FLAG(state, dest, cur, BOUNDARY);</div><div class='add'>+	PRINT_ONE_FLAG(state, dest, cur, NODATASUM);</div><div class='add'>+	PRINT_ONE_FLAG(state, dest, cur, CLEAR_META_RESV);</div><div class='add'>+	PRINT_ONE_FLAG(state, dest, cur, NEED_WAIT);</div><div class='add'>+	PRINT_ONE_FLAG(state, dest, cur, NORESERVE);</div><div class='add'>+	PRINT_ONE_FLAG(state, dest, cur, QGROUP_RESERVED);</div><div class='add'>+	PRINT_ONE_FLAG(state, dest, cur, CLEAR_DATA_RESV);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void dump_extent_io_tree(const struct extent_io_tree *tree)</div><div class='add'>+{</div><div class='add'>+	struct rb_node *node;</div><div class='add'>+	char flags_str[STATE_FLAG_STR_LEN];</div><div class='add'>+</div><div class='add'>+	node = rb_first(&amp;tree-&gt;state);</div><div class='add'>+	test_msg("io tree content:");</div><div class='add'>+	while (node) {</div><div class='add'>+		struct extent_state *state;</div><div class='add'>+</div><div class='add'>+		state = rb_entry(node, struct extent_state, rb_node);</div><div class='add'>+		extent_flag_to_str(state, flags_str);</div><div class='add'>+		test_msg("  start=%llu len=%llu flags=%s", state-&gt;start,</div><div class='add'>+			 state-&gt;end + 1 - state-&gt;start, flags_str);</div><div class='add'>+		node = rb_next(node);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int test_find_delalloc(u32 sectorsize, u32 nodesize)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode;</div><div class='add'>+	struct btrfs_fs_info *fs_info;</div><div class='add'>+	struct btrfs_root *root = NULL;</div><div class='add'>+	struct inode *inode = NULL;</div><div class='ctx'> 	struct extent_io_tree *tmp;</div><div class='ctx'> 	struct page *page;</div><div class='ctx'> 	struct page *locked_page = NULL;</div><div class='del'>-	unsigned long index = 0;</div><div class='ctx'> 	/* In this test we need at least 2 file extents at its maximum size */</div><div class='ctx'> 	u64 max_bytes = BTRFS_MAX_EXTENT_SIZE;</div><div class='ctx'> 	u64 total_dirty = 2 * max_bytes;</div><div class='hunk'>@@ -72,25 +123,40 @@ static int test_find_delalloc(u32 sectorsize)</div><div class='ctx'> </div><div class='ctx'> 	test_msg("running find delalloc tests");</div><div class='ctx'> </div><div class='add'>+	fs_info = btrfs_alloc_dummy_fs_info(nodesize, sectorsize);</div><div class='add'>+	if (!fs_info) {</div><div class='add'>+		test_std_err(TEST_ALLOC_FS_INFO);</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	root = btrfs_alloc_dummy_root(fs_info);</div><div class='add'>+	if (IS_ERR(root)) {</div><div class='add'>+		test_std_err(TEST_ALLOC_ROOT);</div><div class='add'>+		ret = PTR_ERR(root);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	inode = btrfs_new_test_inode();</div><div class='ctx'> 	if (!inode) {</div><div class='ctx'> 		test_std_err(TEST_ALLOC_INODE);</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	tmp = &amp;BTRFS_I(inode)-&gt;io_tree;</div><div class='add'>+	BTRFS_I(inode)-&gt;root = root;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Passing NULL as we don't have fs_info but tracepoints are not used</div><div class='ctx'> 	 * at this point</div><div class='ctx'> 	 */</div><div class='del'>-	extent_io_tree_init(NULL, tmp, IO_TREE_SELFTEST, NULL);</div><div class='add'>+	btrfs_extent_io_tree_init(NULL, tmp, IO_TREE_SELFTEST);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * First go through and create and mark all of our pages dirty, we pin</div><div class='ctx'> 	 * everything to make sure our pages don't get evicted and screw up our</div><div class='ctx'> 	 * test.</div><div class='ctx'> 	 */</div><div class='del'>-	for (index = 0; index &lt; (total_dirty &gt;&gt; PAGE_SHIFT); index++) {</div><div class='add'>+	for (pgoff_t index = 0; index &lt; (total_dirty &gt;&gt; PAGE_SHIFT); index++) {</div><div class='ctx'> 		page = find_or_create_page(inode-&gt;i_mapping, index, GFP_KERNEL);</div><div class='ctx'> 		if (!page) {</div><div class='ctx'> 			test_err("failed to allocate test page");</div><div class='hunk'>@@ -110,10 +176,10 @@ static int test_find_delalloc(u32 sectorsize)</div><div class='ctx'> 	 * |--- delalloc ---|</div><div class='ctx'> 	 * |---  search  ---|</div><div class='ctx'> 	 */</div><div class='del'>-	set_extent_delalloc(tmp, 0, sectorsize - 1, 0, NULL);</div><div class='add'>+	btrfs_set_extent_bit(tmp, 0, sectorsize - 1, EXTENT_DELALLOC, NULL);</div><div class='ctx'> 	start = 0;</div><div class='ctx'> 	end = start + PAGE_SIZE - 1;</div><div class='del'>-	found = find_lock_delalloc_range(inode, locked_page, &amp;start,</div><div class='add'>+	found = find_lock_delalloc_range(inode, page_folio(locked_page), &amp;start,</div><div class='ctx'> 					 &amp;end);</div><div class='ctx'> 	if (!found) {</div><div class='ctx'> 		test_err("should have found at least one delalloc");</div><div class='hunk'>@@ -124,7 +190,7 @@ static int test_find_delalloc(u32 sectorsize)</div><div class='ctx'> 			sectorsize - 1, start, end);</div><div class='ctx'> 		goto out_bits;</div><div class='ctx'> 	}</div><div class='del'>-	unlock_extent(tmp, start, end);</div><div class='add'>+	btrfs_unlock_extent(tmp, start, end, NULL);</div><div class='ctx'> 	unlock_page(locked_page);</div><div class='ctx'> 	put_page(locked_page);</div><div class='ctx'> </div><div class='hunk'>@@ -141,10 +207,10 @@ static int test_find_delalloc(u32 sectorsize)</div><div class='ctx'> 		test_err("couldn't find the locked page");</div><div class='ctx'> 		goto out_bits;</div><div class='ctx'> 	}</div><div class='del'>-	set_extent_delalloc(tmp, sectorsize, max_bytes - 1, 0, NULL);</div><div class='add'>+	btrfs_set_extent_bit(tmp, sectorsize, max_bytes - 1, EXTENT_DELALLOC, NULL);</div><div class='ctx'> 	start = test_start;</div><div class='ctx'> 	end = start + PAGE_SIZE - 1;</div><div class='del'>-	found = find_lock_delalloc_range(inode, locked_page, &amp;start,</div><div class='add'>+	found = find_lock_delalloc_range(inode, page_folio(locked_page), &amp;start,</div><div class='ctx'> 					 &amp;end);</div><div class='ctx'> 	if (!found) {</div><div class='ctx'> 		test_err("couldn't find delalloc in our range");</div><div class='hunk'>@@ -160,7 +226,7 @@ static int test_find_delalloc(u32 sectorsize)</div><div class='ctx'> 		test_err("there were unlocked pages in the range");</div><div class='ctx'> 		goto out_bits;</div><div class='ctx'> 	}</div><div class='del'>-	unlock_extent(tmp, start, end);</div><div class='add'>+	btrfs_unlock_extent(tmp, start, end, NULL);</div><div class='ctx'> 	/* locked_page was unlocked above */</div><div class='ctx'> 	put_page(locked_page);</div><div class='ctx'> </div><div class='hunk'>@@ -178,7 +244,7 @@ static int test_find_delalloc(u32 sectorsize)</div><div class='ctx'> 	}</div><div class='ctx'> 	start = test_start;</div><div class='ctx'> 	end = start + PAGE_SIZE - 1;</div><div class='del'>-	found = find_lock_delalloc_range(inode, locked_page, &amp;start,</div><div class='add'>+	found = find_lock_delalloc_range(inode, page_folio(locked_page), &amp;start,</div><div class='ctx'> 					 &amp;end);</div><div class='ctx'> 	if (found) {</div><div class='ctx'> 		test_err("found range when we shouldn't have");</div><div class='hunk'>@@ -196,10 +262,10 @@ static int test_find_delalloc(u32 sectorsize)</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * We are re-using our test_start from above since it works out well.</div><div class='ctx'> 	 */</div><div class='del'>-	set_extent_delalloc(tmp, max_bytes, total_dirty - 1, 0, NULL);</div><div class='add'>+	btrfs_set_extent_bit(tmp, max_bytes, total_dirty - 1, EXTENT_DELALLOC, NULL);</div><div class='ctx'> 	start = test_start;</div><div class='ctx'> 	end = start + PAGE_SIZE - 1;</div><div class='del'>-	found = find_lock_delalloc_range(inode, locked_page, &amp;start,</div><div class='add'>+	found = find_lock_delalloc_range(inode, page_folio(locked_page), &amp;start,</div><div class='ctx'> 					 &amp;end);</div><div class='ctx'> 	if (!found) {</div><div class='ctx'> 		test_err("didn't find our range");</div><div class='hunk'>@@ -215,7 +281,7 @@ static int test_find_delalloc(u32 sectorsize)</div><div class='ctx'> 		test_err("pages in range were not all locked");</div><div class='ctx'> 		goto out_bits;</div><div class='ctx'> 	}</div><div class='del'>-	unlock_extent(tmp, start, end);</div><div class='add'>+	btrfs_unlock_extent(tmp, start, end, NULL);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Now to test where we run into a page that is no longer dirty in the</div><div class='hunk'>@@ -240,7 +306,7 @@ static int test_find_delalloc(u32 sectorsize)</div><div class='ctx'> 	 * this changes at any point in the future we will need to fix this</div><div class='ctx'> 	 * tests expected behavior.</div><div class='ctx'> 	 */</div><div class='del'>-	found = find_lock_delalloc_range(inode, locked_page, &amp;start,</div><div class='add'>+	found = find_lock_delalloc_range(inode, page_folio(locked_page), &amp;start,</div><div class='ctx'> 					 &amp;end);</div><div class='ctx'> 	if (!found) {</div><div class='ctx'> 		test_err("didn't find our range");</div><div class='hunk'>@@ -258,96 +324,153 @@ static int test_find_delalloc(u32 sectorsize)</div><div class='ctx'> 	}</div><div class='ctx'> 	ret = 0;</div><div class='ctx'> out_bits:</div><div class='del'>-	clear_extent_bits(tmp, 0, total_dirty - 1, (unsigned)-1);</div><div class='add'>+	if (ret)</div><div class='add'>+		dump_extent_io_tree(tmp);</div><div class='add'>+	btrfs_clear_extent_bit(tmp, 0, total_dirty - 1, (unsigned)-1, NULL);</div><div class='ctx'> out:</div><div class='ctx'> 	if (locked_page)</div><div class='ctx'> 		put_page(locked_page);</div><div class='ctx'> 	process_page_range(inode, 0, total_dirty - 1,</div><div class='ctx'> 			   PROCESS_UNLOCK | PROCESS_RELEASE);</div><div class='ctx'> 	iput(inode);</div><div class='add'>+	btrfs_free_dummy_root(root);</div><div class='add'>+	btrfs_free_dummy_fs_info(fs_info);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int check_eb_bitmap(unsigned long *bitmap, struct extent_buffer *eb,</div><div class='del'>-			   unsigned long len)</div><div class='add'>+static int check_eb_bitmap(unsigned long *bitmap, struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned long i;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; len * BITS_PER_BYTE; i++) {</div><div class='del'>-		int bit, bit1;</div><div class='add'>+	for (i = 0; i &lt; eb-&gt;len * BITS_PER_BYTE; i++) {</div><div class='add'>+		bool bit_set, bit1_set;</div><div class='add'>+</div><div class='add'>+		bit_set = test_bit(i, bitmap);</div><div class='add'>+		bit1_set = extent_buffer_test_bit(eb, 0, i);</div><div class='add'>+		if (bit1_set != bit_set) {</div><div class='add'>+			u8 has;</div><div class='add'>+			u8 expect;</div><div class='ctx'> </div><div class='del'>-		bit = !!test_bit(i, bitmap);</div><div class='del'>-		bit1 = !!extent_buffer_test_bit(eb, 0, i);</div><div class='del'>-		if (bit1 != bit) {</div><div class='del'>-			test_err("bits do not match");</div><div class='add'>+			read_extent_buffer(eb, &amp;has, i / BITS_PER_BYTE, 1);</div><div class='add'>+			expect = bitmap_get_value8(bitmap, ALIGN(i, BITS_PER_BYTE));</div><div class='add'>+</div><div class='add'>+			test_err(</div><div class='add'>+		"bits do not match, start byte 0 bit %lu, byte %lu has 0x%02x expect 0x%02x",</div><div class='add'>+				 i, i / BITS_PER_BYTE, has, expect);</div><div class='ctx'> 			return -EINVAL;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		bit1 = !!extent_buffer_test_bit(eb, i / BITS_PER_BYTE,</div><div class='del'>-						i % BITS_PER_BYTE);</div><div class='del'>-		if (bit1 != bit) {</div><div class='del'>-			test_err("offset bits do not match");</div><div class='add'>+		bit1_set = extent_buffer_test_bit(eb, i / BITS_PER_BYTE,</div><div class='add'>+						  i % BITS_PER_BYTE);</div><div class='add'>+		if (bit1_set != bit_set) {</div><div class='add'>+			u8 has;</div><div class='add'>+			u8 expect;</div><div class='add'>+</div><div class='add'>+			read_extent_buffer(eb, &amp;has, i / BITS_PER_BYTE, 1);</div><div class='add'>+			expect = bitmap_get_value8(bitmap, ALIGN(i, BITS_PER_BYTE));</div><div class='add'>+</div><div class='add'>+			test_err(</div><div class='add'>+		"bits do not match, start byte %lu bit %lu, byte %lu has 0x%02x expect 0x%02x",</div><div class='add'>+				 i / BITS_PER_BYTE, i % BITS_PER_BYTE,</div><div class='add'>+				 i / BITS_PER_BYTE, has, expect);</div><div class='ctx'> 			return -EINVAL;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __test_eb_bitmaps(unsigned long *bitmap, struct extent_buffer *eb,</div><div class='del'>-			     unsigned long len)</div><div class='add'>+static int test_bitmap_set(const char *name, unsigned long *bitmap,</div><div class='add'>+			   struct extent_buffer *eb,</div><div class='add'>+			   unsigned long byte_start, unsigned long bit_start,</div><div class='add'>+			   unsigned long bit_len)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	bitmap_set(bitmap, byte_start * BITS_PER_BYTE + bit_start, bit_len);</div><div class='add'>+	extent_buffer_bitmap_set(eb, byte_start, bit_start, bit_len);</div><div class='add'>+	ret = check_eb_bitmap(bitmap, eb);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		test_err("%s test failed", name);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int test_bitmap_clear(const char *name, unsigned long *bitmap,</div><div class='add'>+			     struct extent_buffer *eb,</div><div class='add'>+			     unsigned long byte_start, unsigned long bit_start,</div><div class='add'>+			     unsigned long bit_len)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	bitmap_clear(bitmap, byte_start * BITS_PER_BYTE + bit_start, bit_len);</div><div class='add'>+	extent_buffer_bitmap_clear(eb, byte_start, bit_start, bit_len);</div><div class='add'>+	ret = check_eb_bitmap(bitmap, eb);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		test_err("%s test failed", name);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+static int __test_eb_bitmaps(unsigned long *bitmap, struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned long i, j;</div><div class='add'>+	unsigned long byte_len = eb-&gt;len;</div><div class='ctx'> 	u32 x;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	memset(bitmap, 0, len);</div><div class='del'>-	memzero_extent_buffer(eb, 0, len);</div><div class='del'>-	if (memcmp_extent_buffer(eb, bitmap, 0, len) != 0) {</div><div class='del'>-		test_err("bitmap was not zeroed");</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='add'>+	ret = test_bitmap_clear("clear all run 1", bitmap, eb, 0, 0,</div><div class='add'>+				byte_len * BITS_PER_BYTE);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	bitmap_set(bitmap, 0, len * BITS_PER_BYTE);</div><div class='del'>-	extent_buffer_bitmap_set(eb, 0, 0, len * BITS_PER_BYTE);</div><div class='del'>-	ret = check_eb_bitmap(bitmap, eb, len);</div><div class='del'>-	if (ret) {</div><div class='del'>-		test_err("setting all bits failed");</div><div class='add'>+	ret = test_bitmap_set("set all", bitmap, eb, 0, 0, byte_len * BITS_PER_BYTE);</div><div class='add'>+	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	bitmap_clear(bitmap, 0, len * BITS_PER_BYTE);</div><div class='del'>-	extent_buffer_bitmap_clear(eb, 0, 0, len * BITS_PER_BYTE);</div><div class='del'>-	ret = check_eb_bitmap(bitmap, eb, len);</div><div class='del'>-	if (ret) {</div><div class='del'>-		test_err("clearing all bits failed");</div><div class='add'>+	ret = test_bitmap_clear("clear all run 2", bitmap, eb, 0, 0,</div><div class='add'>+				byte_len * BITS_PER_BYTE);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	ret = test_bitmap_set("same byte set", bitmap, eb, 0, 2, 4);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	ret = test_bitmap_clear("same byte partial clear", bitmap, eb, 0, 4, 1);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	ret = test_bitmap_set("cross byte set", bitmap, eb, 2, 4, 8);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	ret = test_bitmap_set("cross multi byte set", bitmap, eb, 4, 4, 24);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	ret = test_bitmap_clear("cross byte clear", bitmap, eb, 2, 6, 4);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	ret = test_bitmap_clear("cross multi byte clear", bitmap, eb, 4, 6, 20);</div><div class='add'>+	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	/* Straddling pages test */</div><div class='del'>-	if (len &gt; PAGE_SIZE) {</div><div class='del'>-		bitmap_set(bitmap,</div><div class='del'>-			(PAGE_SIZE - sizeof(long) / 2) * BITS_PER_BYTE,</div><div class='del'>-			sizeof(long) * BITS_PER_BYTE);</div><div class='del'>-		extent_buffer_bitmap_set(eb, PAGE_SIZE - sizeof(long) / 2, 0,</div><div class='del'>-					sizeof(long) * BITS_PER_BYTE);</div><div class='del'>-		ret = check_eb_bitmap(bitmap, eb, len);</div><div class='del'>-		if (ret) {</div><div class='del'>-			test_err("setting straddling pages failed");</div><div class='add'>+	if (byte_len &gt; PAGE_SIZE) {</div><div class='add'>+		ret = test_bitmap_set("cross page set", bitmap, eb,</div><div class='add'>+				      PAGE_SIZE - sizeof(long) / 2, 0,</div><div class='add'>+				      sizeof(long) * BITS_PER_BYTE);</div><div class='add'>+		if (ret &lt; 0)</div><div class='ctx'> 			return ret;</div><div class='del'>-		}</div><div class='ctx'> </div><div class='del'>-		bitmap_set(bitmap, 0, len * BITS_PER_BYTE);</div><div class='del'>-		bitmap_clear(bitmap,</div><div class='del'>-			(PAGE_SIZE - sizeof(long) / 2) * BITS_PER_BYTE,</div><div class='del'>-			sizeof(long) * BITS_PER_BYTE);</div><div class='del'>-		extent_buffer_bitmap_set(eb, 0, 0, len * BITS_PER_BYTE);</div><div class='del'>-		extent_buffer_bitmap_clear(eb, PAGE_SIZE - sizeof(long) / 2, 0,</div><div class='add'>+		ret = test_bitmap_set("cross page set all", bitmap, eb, 0, 0,</div><div class='add'>+				      byte_len * BITS_PER_BYTE);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='add'>+</div><div class='add'>+		ret = test_bitmap_clear("cross page clear", bitmap, eb,</div><div class='add'>+					PAGE_SIZE - sizeof(long) / 2, 0,</div><div class='ctx'> 					sizeof(long) * BITS_PER_BYTE);</div><div class='del'>-		ret = check_eb_bitmap(bitmap, eb, len);</div><div class='del'>-		if (ret) {</div><div class='del'>-			test_err("clearing straddling pages failed");</div><div class='add'>+		if (ret &lt; 0)</div><div class='ctx'> 			return ret;</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -355,9 +478,12 @@ static int __test_eb_bitmaps(unsigned long *bitmap, struct extent_buffer *eb,</div><div class='ctx'> 	 * something repetitive that could miss some hypothetical off-by-n bug.</div><div class='ctx'> 	 */</div><div class='ctx'> 	x = 0;</div><div class='del'>-	bitmap_clear(bitmap, 0, len * BITS_PER_BYTE);</div><div class='del'>-	extent_buffer_bitmap_clear(eb, 0, 0, len * BITS_PER_BYTE);</div><div class='del'>-	for (i = 0; i &lt; len * BITS_PER_BYTE / 32; i++) {</div><div class='add'>+	ret = test_bitmap_clear("clear all run 3", bitmap, eb, 0, 0,</div><div class='add'>+				byte_len * BITS_PER_BYTE);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; byte_len * BITS_PER_BYTE / 32; i++) {</div><div class='ctx'> 		x = (0x19660dULL * (u64)x + 0x3c6ef35fULL) &amp; 0xffffffffU;</div><div class='ctx'> 		for (j = 0; j &lt; 32; j++) {</div><div class='ctx'> 			if (x &amp; (1U &lt;&lt; j)) {</div><div class='hunk'>@@ -367,7 +493,7 @@ static int __test_eb_bitmaps(unsigned long *bitmap, struct extent_buffer *eb,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = check_eb_bitmap(bitmap, eb, len);</div><div class='add'>+	ret = check_eb_bitmap(bitmap, eb);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("random bit pattern failed");</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -379,7 +505,7 @@ static int __test_eb_bitmaps(unsigned long *bitmap, struct extent_buffer *eb,</div><div class='ctx'> static int test_eb_bitmaps(u32 sectorsize, u32 nodesize)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info;</div><div class='del'>-	unsigned long *bitmap = NULL;</div><div class='add'>+	unsigned long AUTO_KFREE(bitmap);</div><div class='ctx'> 	struct extent_buffer *eb = NULL;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -398,14 +524,14 @@ static int test_eb_bitmaps(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	eb = __alloc_dummy_extent_buffer(fs_info, 0, nodesize);</div><div class='add'>+	eb = alloc_dummy_extent_buffer(fs_info, 0);</div><div class='ctx'> 	if (!eb) {</div><div class='ctx'> 		test_std_err(TEST_ALLOC_ROOT);</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = __test_eb_bitmaps(bitmap, eb, nodesize);</div><div class='add'>+	ret = __test_eb_bitmaps(bitmap, eb);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -415,17 +541,16 @@ static int test_eb_bitmaps(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 	 * Test again for case where the tree block is sectorsize aligned but</div><div class='ctx'> 	 * not nodesize aligned.</div><div class='ctx'> 	 */</div><div class='del'>-	eb = __alloc_dummy_extent_buffer(fs_info, sectorsize, nodesize);</div><div class='add'>+	eb = alloc_dummy_extent_buffer(fs_info, sectorsize);</div><div class='ctx'> 	if (!eb) {</div><div class='ctx'> 		test_std_err(TEST_ALLOC_ROOT);</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = __test_eb_bitmaps(bitmap, eb, nodesize);</div><div class='add'>+	ret = __test_eb_bitmaps(bitmap, eb);</div><div class='ctx'> out:</div><div class='ctx'> 	free_extent_buffer(eb);</div><div class='del'>-	kfree(bitmap);</div><div class='ctx'> 	btrfs_free_dummy_fs_info(fs_info);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -438,10 +563,10 @@ static int test_find_first_clear_extent_bit(void)</div><div class='ctx'> </div><div class='ctx'> 	test_msg("running find_first_clear_extent_bit test");</div><div class='ctx'> </div><div class='del'>-	extent_io_tree_init(NULL, &amp;tree, IO_TREE_SELFTEST, NULL);</div><div class='add'>+	btrfs_extent_io_tree_init(NULL, &amp;tree, IO_TREE_SELFTEST);</div><div class='ctx'> </div><div class='ctx'> 	/* Test correct handling of empty tree */</div><div class='del'>-	find_first_clear_extent_bit(&amp;tree, 0, &amp;start, &amp;end, CHUNK_TRIMMED);</div><div class='add'>+	btrfs_find_first_clear_extent_bit(&amp;tree, 0, &amp;start, &amp;end, CHUNK_TRIMMED);</div><div class='ctx'> 	if (start != 0 || end != -1) {</div><div class='ctx'> 		test_err(</div><div class='ctx'> 	"error getting a range from completely empty tree: start %llu end %llu",</div><div class='hunk'>@@ -452,11 +577,11 @@ static int test_find_first_clear_extent_bit(void)</div><div class='ctx'> 	 * Set 1M-4M alloc/discard and 32M-64M thus leaving a hole between</div><div class='ctx'> 	 * 4M-32M</div><div class='ctx'> 	 */</div><div class='del'>-	set_extent_bits(&amp;tree, SZ_1M, SZ_4M - 1,</div><div class='del'>-			CHUNK_TRIMMED | CHUNK_ALLOCATED);</div><div class='add'>+	btrfs_set_extent_bit(&amp;tree, SZ_1M, SZ_4M - 1,</div><div class='add'>+			     CHUNK_TRIMMED | CHUNK_ALLOCATED, NULL);</div><div class='ctx'> </div><div class='del'>-	find_first_clear_extent_bit(&amp;tree, SZ_512K, &amp;start, &amp;end,</div><div class='del'>-				    CHUNK_TRIMMED | CHUNK_ALLOCATED);</div><div class='add'>+	btrfs_find_first_clear_extent_bit(&amp;tree, SZ_512K, &amp;start, &amp;end,</div><div class='add'>+					  CHUNK_TRIMMED | CHUNK_ALLOCATED);</div><div class='ctx'> </div><div class='ctx'> 	if (start != 0 || end != SZ_1M - 1) {</div><div class='ctx'> 		test_err("error finding beginning range: start %llu end %llu",</div><div class='hunk'>@@ -465,14 +590,14 @@ static int test_find_first_clear_extent_bit(void)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Now add 32M-64M so that we have a hole between 4M-32M */</div><div class='del'>-	set_extent_bits(&amp;tree, SZ_32M, SZ_64M - 1,</div><div class='del'>-			CHUNK_TRIMMED | CHUNK_ALLOCATED);</div><div class='add'>+	btrfs_set_extent_bit(&amp;tree, SZ_32M, SZ_64M - 1,</div><div class='add'>+			     CHUNK_TRIMMED | CHUNK_ALLOCATED, NULL);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Request first hole starting at 12M, we should get 4M-32M</div><div class='ctx'> 	 */</div><div class='del'>-	find_first_clear_extent_bit(&amp;tree, 12 * SZ_1M, &amp;start, &amp;end,</div><div class='del'>-				    CHUNK_TRIMMED | CHUNK_ALLOCATED);</div><div class='add'>+	btrfs_find_first_clear_extent_bit(&amp;tree, 12 * SZ_1M, &amp;start, &amp;end,</div><div class='add'>+					  CHUNK_TRIMMED | CHUNK_ALLOCATED);</div><div class='ctx'> </div><div class='ctx'> 	if (start != SZ_4M || end != SZ_32M - 1) {</div><div class='ctx'> 		test_err("error finding trimmed range: start %llu end %llu",</div><div class='hunk'>@@ -484,8 +609,8 @@ static int test_find_first_clear_extent_bit(void)</div><div class='ctx'> 	 * Search in the middle of allocated range, should get the next one</div><div class='ctx'> 	 * available, which happens to be unallocated -&gt; 4M-32M</div><div class='ctx'> 	 */</div><div class='del'>-	find_first_clear_extent_bit(&amp;tree, SZ_2M, &amp;start, &amp;end,</div><div class='del'>-				    CHUNK_TRIMMED | CHUNK_ALLOCATED);</div><div class='add'>+	btrfs_find_first_clear_extent_bit(&amp;tree, SZ_2M, &amp;start, &amp;end,</div><div class='add'>+					  CHUNK_TRIMMED | CHUNK_ALLOCATED);</div><div class='ctx'> </div><div class='ctx'> 	if (start != SZ_4M || end != SZ_32M - 1) {</div><div class='ctx'> 		test_err("error finding next unalloc range: start %llu end %llu",</div><div class='hunk'>@@ -497,9 +622,9 @@ static int test_find_first_clear_extent_bit(void)</div><div class='ctx'> 	 * Set 64M-72M with CHUNK_ALLOC flag, then search for CHUNK_TRIMMED flag</div><div class='ctx'> 	 * being unset in this range, we should get the entry in range 64M-72M</div><div class='ctx'> 	 */</div><div class='del'>-	set_extent_bits(&amp;tree, SZ_64M, SZ_64M + SZ_8M - 1, CHUNK_ALLOCATED);</div><div class='del'>-	find_first_clear_extent_bit(&amp;tree, SZ_64M + SZ_1M, &amp;start, &amp;end,</div><div class='del'>-				    CHUNK_TRIMMED);</div><div class='add'>+	btrfs_set_extent_bit(&amp;tree, SZ_64M, SZ_64M + SZ_8M - 1, CHUNK_ALLOCATED, NULL);</div><div class='add'>+	btrfs_find_first_clear_extent_bit(&amp;tree, SZ_64M + SZ_1M, &amp;start, &amp;end,</div><div class='add'>+					  CHUNK_TRIMMED);</div><div class='ctx'> </div><div class='ctx'> 	if (start != SZ_64M || end != SZ_64M + SZ_8M - 1) {</div><div class='ctx'> 		test_err("error finding exact range: start %llu end %llu",</div><div class='hunk'>@@ -507,8 +632,8 @@ static int test_find_first_clear_extent_bit(void)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	find_first_clear_extent_bit(&amp;tree, SZ_64M - SZ_8M, &amp;start, &amp;end,</div><div class='del'>-				    CHUNK_TRIMMED);</div><div class='add'>+	btrfs_find_first_clear_extent_bit(&amp;tree, SZ_64M - SZ_8M, &amp;start, &amp;end,</div><div class='add'>+					  CHUNK_TRIMMED);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Search in the middle of set range whose immediate neighbour doesn't</div><div class='hunk'>@@ -524,7 +649,7 @@ static int test_find_first_clear_extent_bit(void)</div><div class='ctx'> 	 * Search beyond any known range, shall return after last known range</div><div class='ctx'> 	 * and end should be -1</div><div class='ctx'> 	 */</div><div class='del'>-	find_first_clear_extent_bit(&amp;tree, -1, &amp;start, &amp;end, CHUNK_TRIMMED);</div><div class='add'>+	btrfs_find_first_clear_extent_bit(&amp;tree, -1, &amp;start, &amp;end, CHUNK_TRIMMED);</div><div class='ctx'> 	if (start != SZ_64M + SZ_8M || end != -1) {</div><div class='ctx'> 		test_err(</div><div class='ctx'> 		"error handling beyond end of range search: start %llu end %llu",</div><div class='hunk'>@@ -534,18 +659,160 @@ static int test_find_first_clear_extent_bit(void)</div><div class='ctx'> </div><div class='ctx'> 	ret = 0;</div><div class='ctx'> out:</div><div class='del'>-	clear_extent_bits(&amp;tree, 0, (u64)-1, CHUNK_TRIMMED | CHUNK_ALLOCATED);</div><div class='add'>+	if (ret)</div><div class='add'>+		dump_extent_io_tree(&amp;tree);</div><div class='add'>+	btrfs_clear_extent_bit(&amp;tree, 0, (u64)-1, CHUNK_TRIMMED | CHUNK_ALLOCATED, NULL);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void dump_eb_and_memory_contents(struct extent_buffer *eb, void *memory,</div><div class='add'>+					const char *test_name)</div><div class='add'>+{</div><div class='add'>+	for (int i = 0; i &lt; eb-&gt;len; i++) {</div><div class='add'>+		struct page *page = folio_page(eb-&gt;folios[i &gt;&gt; PAGE_SHIFT], 0);</div><div class='add'>+		void *addr = page_address(page) + offset_in_page(i);</div><div class='add'>+</div><div class='add'>+		if (memcmp(addr, memory + i, 1) != 0) {</div><div class='add'>+			test_err("%s failed", test_name);</div><div class='add'>+			test_err("eb and memory diffs at byte %u, eb has 0x%02x memory has 0x%02x",</div><div class='add'>+				 i, *(u8 *)addr, *(u8 *)(memory + i));</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int verify_eb_and_memory(struct extent_buffer *eb, void *memory,</div><div class='add'>+				const char *test_name)</div><div class='add'>+{</div><div class='add'>+	for (int i = 0; i &lt; (eb-&gt;len &gt;&gt; PAGE_SHIFT); i++) {</div><div class='add'>+		void *eb_addr = folio_address(eb-&gt;folios[i]);</div><div class='add'>+</div><div class='add'>+		if (memcmp(memory + (i &lt;&lt; PAGE_SHIFT), eb_addr, PAGE_SIZE) != 0) {</div><div class='add'>+			dump_eb_and_memory_contents(eb, memory, test_name);</div><div class='add'>+			return -EUCLEAN;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Init both memory and extent buffer contents to the same randomly generated</div><div class='add'>+ * contents.</div><div class='add'>+ */</div><div class='add'>+static void init_eb_and_memory(struct extent_buffer *eb, void *memory)</div><div class='add'>+{</div><div class='add'>+	get_random_bytes(memory, eb-&gt;len);</div><div class='add'>+	write_extent_buffer(eb, memory, 0, eb-&gt;len);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int test_eb_mem_ops(u32 sectorsize, u32 nodesize)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info;</div><div class='add'>+	struct extent_buffer *eb = NULL;</div><div class='add'>+	void *memory = NULL;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	test_msg("running extent buffer memory operation tests");</div><div class='add'>+</div><div class='add'>+	fs_info = btrfs_alloc_dummy_fs_info(nodesize, sectorsize);</div><div class='add'>+	if (!fs_info) {</div><div class='add'>+		test_std_err(TEST_ALLOC_FS_INFO);</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	memory = kvzalloc(nodesize, GFP_KERNEL);</div><div class='add'>+	if (!memory) {</div><div class='add'>+		test_err("failed to allocate memory");</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	eb = alloc_dummy_extent_buffer(fs_info, SZ_1M);</div><div class='add'>+	if (!eb) {</div><div class='add'>+		test_std_err(TEST_ALLOC_EXTENT_BUFFER);</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	init_eb_and_memory(eb, memory);</div><div class='add'>+	ret = verify_eb_and_memory(eb, memory, "full eb write");</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	memcpy(memory, memory + 16, 16);</div><div class='add'>+	memcpy_extent_buffer(eb, 0, 16, 16);</div><div class='add'>+	ret = verify_eb_and_memory(eb, memory, "same page non-overlapping memcpy 1");</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	memcpy(memory, memory + 2048, 16);</div><div class='add'>+	memcpy_extent_buffer(eb, 0, 2048, 16);</div><div class='add'>+	ret = verify_eb_and_memory(eb, memory, "same page non-overlapping memcpy 2");</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+	memcpy(memory, memory + 2048, 2048);</div><div class='add'>+	memcpy_extent_buffer(eb, 0, 2048, 2048);</div><div class='add'>+	ret = verify_eb_and_memory(eb, memory, "same page non-overlapping memcpy 3");</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	memmove(memory + 512, memory + 256, 512);</div><div class='add'>+	memmove_extent_buffer(eb, 512, 256, 512);</div><div class='add'>+	ret = verify_eb_and_memory(eb, memory, "same page overlapping memcpy 1");</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	memmove(memory + 2048, memory + 512, 2048);</div><div class='add'>+	memmove_extent_buffer(eb, 2048, 512, 2048);</div><div class='add'>+	ret = verify_eb_and_memory(eb, memory, "same page overlapping memcpy 2");</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+	memmove(memory + 512, memory + 2048, 2048);</div><div class='add'>+	memmove_extent_buffer(eb, 512, 2048, 2048);</div><div class='add'>+	ret = verify_eb_and_memory(eb, memory, "same page overlapping memcpy 3");</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	if (nodesize &gt; PAGE_SIZE) {</div><div class='add'>+		memcpy(memory, memory + 4096 - 128, 256);</div><div class='add'>+		memcpy_extent_buffer(eb, 0, 4096 - 128, 256);</div><div class='add'>+		ret = verify_eb_and_memory(eb, memory, "cross page non-overlapping memcpy 1");</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out;</div><div class='add'>+</div><div class='add'>+		memcpy(memory + 4096 - 128, memory + 4096 + 128, 256);</div><div class='add'>+		memcpy_extent_buffer(eb, 4096 - 128, 4096 + 128, 256);</div><div class='add'>+		ret = verify_eb_and_memory(eb, memory, "cross page non-overlapping memcpy 2");</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out;</div><div class='add'>+</div><div class='add'>+		memmove(memory + 4096 - 128, memory + 4096 - 64, 256);</div><div class='add'>+		memmove_extent_buffer(eb, 4096 - 128, 4096 - 64, 256);</div><div class='add'>+		ret = verify_eb_and_memory(eb, memory, "cross page overlapping memcpy 1");</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out;</div><div class='add'>+</div><div class='add'>+		memmove(memory + 4096 - 64, memory + 4096 - 128, 256);</div><div class='add'>+		memmove_extent_buffer(eb, 4096 - 64, 4096 - 128, 256);</div><div class='add'>+		ret = verify_eb_and_memory(eb, memory, "cross page overlapping memcpy 2");</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='add'>+	free_extent_buffer(eb);</div><div class='add'>+	kvfree(memory);</div><div class='add'>+	btrfs_free_dummy_fs_info(fs_info);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> int btrfs_test_extent_io(u32 sectorsize, u32 nodesize)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	test_msg("running extent I/O tests");</div><div class='ctx'> </div><div class='del'>-	ret = test_find_delalloc(sectorsize);</div><div class='add'>+	ret = test_find_delalloc(sectorsize, nodesize);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -554,6 +821,10 @@ int btrfs_test_extent_io(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	ret = test_eb_bitmaps(sectorsize, nodesize);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	ret = test_eb_mem_ops(sectorsize, nodesize);</div><div class='ctx'> out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/btrfs/tests/extent-map-tests.c b/fs/btrfs/tests/extent-map-tests.c<br/>index 319fed82d741..0b9f25dd1a68 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tests/extent-map-tests.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tests/extent-map-tests.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tests/extent-map-tests.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/tests/extent-map-tests.c</a></div><div class='hunk'>@@ -6,32 +6,41 @@</div><div class='ctx'> #include &lt;linux/types.h&gt;</div><div class='ctx'> #include "btrfs-tests.h"</div><div class='ctx'> #include "../ctree.h"</div><div class='add'>+#include "../btrfs_inode.h"</div><div class='ctx'> #include "../volumes.h"</div><div class='ctx'> #include "../disk-io.h"</div><div class='ctx'> #include "../block-group.h"</div><div class='ctx'> </div><div class='del'>-static void free_extent_map_tree(struct extent_map_tree *em_tree)</div><div class='add'>+static int free_extent_map_tree(struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='add'>+	struct extent_map_tree *em_tree = &amp;inode-&gt;extent_tree;</div><div class='ctx'> 	struct extent_map *em;</div><div class='ctx'> 	struct rb_node *node;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	while (!RB_EMPTY_ROOT(&amp;em_tree-&gt;map.rb_root)) {</div><div class='del'>-		node = rb_first_cached(&amp;em_tree-&gt;map);</div><div class='add'>+	write_lock(&amp;em_tree-&gt;lock);</div><div class='add'>+	while (!RB_EMPTY_ROOT(&amp;em_tree-&gt;root)) {</div><div class='add'>+		node = rb_first(&amp;em_tree-&gt;root);</div><div class='ctx'> 		em = rb_entry(node, struct extent_map, rb_node);</div><div class='del'>-		remove_extent_mapping(em_tree, em);</div><div class='add'>+		btrfs_remove_extent_mapping(inode, em);</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_BTRFS_DEBUG</div><div class='ctx'> 		if (refcount_read(&amp;em-&gt;refs) != 1) {</div><div class='add'>+			ret = -EINVAL;</div><div class='ctx'> 			test_err(</div><div class='del'>-"em leak: em (start 0x%llx len 0x%llx block_start 0x%llx block_len 0x%llx) refs %d",</div><div class='del'>-				 em-&gt;start, em-&gt;len, em-&gt;block_start,</div><div class='del'>-				 em-&gt;block_len, refcount_read(&amp;em-&gt;refs));</div><div class='add'>+"em leak: em (start %llu len %llu disk_bytenr %llu disk_num_bytes %llu offset %llu) refs %d",</div><div class='add'>+				 em-&gt;start, em-&gt;len, em-&gt;disk_bytenr,</div><div class='add'>+				 em-&gt;disk_num_bytes, em-&gt;offset,</div><div class='add'>+				 refcount_read(&amp;em-&gt;refs));</div><div class='ctx'> </div><div class='ctx'> 			refcount_set(&amp;em-&gt;refs, 1);</div><div class='ctx'> 		}</div><div class='ctx'> #endif</div><div class='del'>-		free_extent_map(em);</div><div class='add'>+		btrfs_free_extent_map(em);</div><div class='ctx'> 	}</div><div class='add'>+	write_unlock(&amp;em_tree-&gt;lock);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -50,15 +59,16 @@ static void free_extent_map_tree(struct extent_map_tree *em_tree)</div><div class='ctx'>  *                                    -&gt;add_extent_mapping(0, 16K)</div><div class='ctx'>  *                                    -&gt; #handle -EEXIST</div><div class='ctx'>  */</div><div class='del'>-static int test_case_1(struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct extent_map_tree *em_tree)</div><div class='add'>+static int test_case_1(struct btrfs_fs_info *fs_info, struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='add'>+	struct extent_map_tree *em_tree = &amp;inode-&gt;extent_tree;</div><div class='ctx'> 	struct extent_map *em;</div><div class='ctx'> 	u64 start = 0;</div><div class='ctx'> 	u64 len = SZ_8K;</div><div class='ctx'> 	int ret;</div><div class='add'>+	int ret2;</div><div class='ctx'> </div><div class='del'>-	em = alloc_extent_map();</div><div class='add'>+	em = btrfs_alloc_extent_map();</div><div class='ctx'> 	if (!em) {</div><div class='ctx'> 		test_std_err(TEST_ALLOC_EXTENT_MAP);</div><div class='ctx'> 		return -ENOMEM;</div><div class='hunk'>@@ -67,19 +77,20 @@ static int test_case_1(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	/* Add [0, 16K) */</div><div class='ctx'> 	em-&gt;start = 0;</div><div class='ctx'> 	em-&gt;len = SZ_16K;</div><div class='del'>-	em-&gt;block_start = 0;</div><div class='del'>-	em-&gt;block_len = SZ_16K;</div><div class='add'>+	em-&gt;disk_bytenr = 0;</div><div class='add'>+	em-&gt;disk_num_bytes = SZ_16K;</div><div class='add'>+	em-&gt;ram_bytes = SZ_16K;</div><div class='ctx'> 	write_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	ret = add_extent_mapping(em_tree, em, 0);</div><div class='add'>+	ret = btrfs_add_extent_mapping(inode, &amp;em, em-&gt;start, em-&gt;len);</div><div class='ctx'> 	write_unlock(&amp;em_tree-&gt;lock);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='ctx'> 		test_err("cannot add extent range [0, 16K)");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='ctx'> 	/* Add [16K, 20K) following [0, 16K)  */</div><div class='del'>-	em = alloc_extent_map();</div><div class='add'>+	em = btrfs_alloc_extent_map();</div><div class='ctx'> 	if (!em) {</div><div class='ctx'> 		test_std_err(TEST_ALLOC_EXTENT_MAP);</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='hunk'>@@ -88,18 +99,19 @@ static int test_case_1(struct btrfs_fs_info *fs_info,</div><div class='ctx'> </div><div class='ctx'> 	em-&gt;start = SZ_16K;</div><div class='ctx'> 	em-&gt;len = SZ_4K;</div><div class='del'>-	em-&gt;block_start = SZ_32K; /* avoid merging */</div><div class='del'>-	em-&gt;block_len = SZ_4K;</div><div class='add'>+	em-&gt;disk_bytenr = SZ_32K; /* avoid merging */</div><div class='add'>+	em-&gt;disk_num_bytes = SZ_4K;</div><div class='add'>+	em-&gt;ram_bytes = SZ_4K;</div><div class='ctx'> 	write_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	ret = add_extent_mapping(em_tree, em, 0);</div><div class='add'>+	ret = btrfs_add_extent_mapping(inode, &amp;em, em-&gt;start, em-&gt;len);</div><div class='ctx'> 	write_unlock(&amp;em_tree-&gt;lock);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='ctx'> 		test_err("cannot add extent range [16K, 20K)");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='del'>-	em = alloc_extent_map();</div><div class='add'>+	em = btrfs_alloc_extent_map();</div><div class='ctx'> 	if (!em) {</div><div class='ctx'> 		test_std_err(TEST_ALLOC_EXTENT_MAP);</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='hunk'>@@ -109,27 +121,35 @@ static int test_case_1(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	/* Add [0, 8K), should return [0, 16K) instead. */</div><div class='ctx'> 	em-&gt;start = start;</div><div class='ctx'> 	em-&gt;len = len;</div><div class='del'>-	em-&gt;block_start = start;</div><div class='del'>-	em-&gt;block_len = len;</div><div class='add'>+	em-&gt;disk_bytenr = start;</div><div class='add'>+	em-&gt;disk_num_bytes = len;</div><div class='add'>+	em-&gt;ram_bytes = len;</div><div class='ctx'> 	write_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	ret = btrfs_add_extent_mapping(fs_info, em_tree, &amp;em, em-&gt;start, em-&gt;len);</div><div class='add'>+	ret = btrfs_add_extent_mapping(inode, &amp;em, em-&gt;start, em-&gt;len);</div><div class='ctx'> 	write_unlock(&amp;em_tree-&gt;lock);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("case1 [%llu %llu]: ret %d", start, start + len, ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em &amp;&amp;</div><div class='del'>-	    (em-&gt;start != 0 || extent_map_end(em) != SZ_16K ||</div><div class='del'>-	     em-&gt;block_start != 0 || em-&gt;block_len != SZ_16K)) {</div><div class='add'>+	if (!em) {</div><div class='add'>+		test_err("case1 [%llu %llu]: no extent map returned",</div><div class='add'>+			 start, start + len);</div><div class='add'>+		ret = -ENOENT;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	if (em-&gt;start != 0 || btrfs_extent_map_end(em) != SZ_16K ||</div><div class='add'>+	    em-&gt;disk_bytenr != 0 || em-&gt;disk_num_bytes != SZ_16K) {</div><div class='ctx'> 		test_err(</div><div class='del'>-"case1 [%llu %llu]: ret %d return a wrong em (start %llu len %llu block_start %llu block_len %llu",</div><div class='add'>+"case1 [%llu %llu]: ret %d return a wrong em (start %llu len %llu disk_bytenr %llu disk_num_bytes %llu",</div><div class='ctx'> 			 start, start + len, ret, em-&gt;start, em-&gt;len,</div><div class='del'>-			 em-&gt;block_start, em-&gt;block_len);</div><div class='add'>+			 em-&gt;disk_bytenr, em-&gt;disk_num_bytes);</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> out:</div><div class='del'>-	free_extent_map_tree(em_tree);</div><div class='add'>+	ret2 = free_extent_map_tree(inode);</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		ret = ret2;</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -140,13 +160,14 @@ out:</div><div class='ctx'>  * Reading the inline ending up with EEXIST, ie. read an inline</div><div class='ctx'>  * extent and discard page cache and read it again.</div><div class='ctx'>  */</div><div class='del'>-static int test_case_2(struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct extent_map_tree *em_tree)</div><div class='add'>+static int test_case_2(struct btrfs_fs_info *fs_info, struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='add'>+	struct extent_map_tree *em_tree = &amp;inode-&gt;extent_tree;</div><div class='ctx'> 	struct extent_map *em;</div><div class='ctx'> 	int ret;</div><div class='add'>+	int ret2;</div><div class='ctx'> </div><div class='del'>-	em = alloc_extent_map();</div><div class='add'>+	em = btrfs_alloc_extent_map();</div><div class='ctx'> 	if (!em) {</div><div class='ctx'> 		test_std_err(TEST_ALLOC_EXTENT_MAP);</div><div class='ctx'> 		return -ENOMEM;</div><div class='hunk'>@@ -155,19 +176,20 @@ static int test_case_2(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	/* Add [0, 1K) */</div><div class='ctx'> 	em-&gt;start = 0;</div><div class='ctx'> 	em-&gt;len = SZ_1K;</div><div class='del'>-	em-&gt;block_start = EXTENT_MAP_INLINE;</div><div class='del'>-	em-&gt;block_len = (u64)-1;</div><div class='add'>+	em-&gt;disk_bytenr = EXTENT_MAP_INLINE;</div><div class='add'>+	em-&gt;disk_num_bytes = 0;</div><div class='add'>+	em-&gt;ram_bytes = SZ_1K;</div><div class='ctx'> 	write_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	ret = add_extent_mapping(em_tree, em, 0);</div><div class='add'>+	ret = btrfs_add_extent_mapping(inode, &amp;em, em-&gt;start, em-&gt;len);</div><div class='ctx'> 	write_unlock(&amp;em_tree-&gt;lock);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='ctx'> 		test_err("cannot add extent range [0, 1K)");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='ctx'> 	/* Add [4K, 8K) following [0, 1K)  */</div><div class='del'>-	em = alloc_extent_map();</div><div class='add'>+	em = btrfs_alloc_extent_map();</div><div class='ctx'> 	if (!em) {</div><div class='ctx'> 		test_std_err(TEST_ALLOC_EXTENT_MAP);</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='hunk'>@@ -176,18 +198,19 @@ static int test_case_2(struct btrfs_fs_info *fs_info,</div><div class='ctx'> </div><div class='ctx'> 	em-&gt;start = SZ_4K;</div><div class='ctx'> 	em-&gt;len = SZ_4K;</div><div class='del'>-	em-&gt;block_start = SZ_4K;</div><div class='del'>-	em-&gt;block_len = SZ_4K;</div><div class='add'>+	em-&gt;disk_bytenr = SZ_4K;</div><div class='add'>+	em-&gt;disk_num_bytes = SZ_4K;</div><div class='add'>+	em-&gt;ram_bytes = SZ_4K;</div><div class='ctx'> 	write_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	ret = add_extent_mapping(em_tree, em, 0);</div><div class='add'>+	ret = btrfs_add_extent_mapping(inode, &amp;em, em-&gt;start, em-&gt;len);</div><div class='ctx'> 	write_unlock(&amp;em_tree-&gt;lock);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='ctx'> 		test_err("cannot add extent range [4K, 8K)");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='del'>-	em = alloc_extent_map();</div><div class='add'>+	em = btrfs_alloc_extent_map();</div><div class='ctx'> 	if (!em) {</div><div class='ctx'> 		test_std_err(TEST_ALLOC_EXTENT_MAP);</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='hunk'>@@ -197,39 +220,47 @@ static int test_case_2(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	/* Add [0, 1K) */</div><div class='ctx'> 	em-&gt;start = 0;</div><div class='ctx'> 	em-&gt;len = SZ_1K;</div><div class='del'>-	em-&gt;block_start = EXTENT_MAP_INLINE;</div><div class='del'>-	em-&gt;block_len = (u64)-1;</div><div class='add'>+	em-&gt;disk_bytenr = EXTENT_MAP_INLINE;</div><div class='add'>+	em-&gt;disk_num_bytes = 0;</div><div class='add'>+	em-&gt;ram_bytes = SZ_1K;</div><div class='ctx'> 	write_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	ret = btrfs_add_extent_mapping(fs_info, em_tree, &amp;em, em-&gt;start, em-&gt;len);</div><div class='add'>+	ret = btrfs_add_extent_mapping(inode, &amp;em, em-&gt;start, em-&gt;len);</div><div class='ctx'> 	write_unlock(&amp;em_tree-&gt;lock);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("case2 [0 1K]: ret %d", ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em &amp;&amp;</div><div class='del'>-	    (em-&gt;start != 0 || extent_map_end(em) != SZ_1K ||</div><div class='del'>-	     em-&gt;block_start != EXTENT_MAP_INLINE || em-&gt;block_len != (u64)-1)) {</div><div class='add'>+	if (!em) {</div><div class='add'>+		test_err("case2 [0 1K]: no extent map returned");</div><div class='add'>+		ret = -ENOENT;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	if (em-&gt;start != 0 || btrfs_extent_map_end(em) != SZ_1K ||</div><div class='add'>+	    em-&gt;disk_bytenr != EXTENT_MAP_INLINE) {</div><div class='ctx'> 		test_err(</div><div class='del'>-"case2 [0 1K]: ret %d return a wrong em (start %llu len %llu block_start %llu block_len %llu",</div><div class='del'>-			 ret, em-&gt;start, em-&gt;len, em-&gt;block_start,</div><div class='del'>-			 em-&gt;block_len);</div><div class='add'>+"case2 [0 1K]: ret %d return a wrong em (start %llu len %llu disk_bytenr %llu",</div><div class='add'>+			 ret, em-&gt;start, em-&gt;len, em-&gt;disk_bytenr);</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> out:</div><div class='del'>-	free_extent_map_tree(em_tree);</div><div class='add'>+	ret2 = free_extent_map_tree(inode);</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		ret = ret2;</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int __test_case_3(struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct extent_map_tree *em_tree, u64 start)</div><div class='add'>+			 struct btrfs_inode *inode, u64 start)</div><div class='ctx'> {</div><div class='add'>+	struct extent_map_tree *em_tree = &amp;inode-&gt;extent_tree;</div><div class='ctx'> 	struct extent_map *em;</div><div class='ctx'> 	u64 len = SZ_4K;</div><div class='ctx'> 	int ret;</div><div class='add'>+	int ret2;</div><div class='ctx'> </div><div class='del'>-	em = alloc_extent_map();</div><div class='add'>+	em = btrfs_alloc_extent_map();</div><div class='ctx'> 	if (!em) {</div><div class='ctx'> 		test_std_err(TEST_ALLOC_EXTENT_MAP);</div><div class='ctx'> 		return -ENOMEM;</div><div class='hunk'>@@ -238,18 +269,19 @@ static int __test_case_3(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	/* Add [4K, 8K) */</div><div class='ctx'> 	em-&gt;start = SZ_4K;</div><div class='ctx'> 	em-&gt;len = SZ_4K;</div><div class='del'>-	em-&gt;block_start = SZ_4K;</div><div class='del'>-	em-&gt;block_len = SZ_4K;</div><div class='add'>+	em-&gt;disk_bytenr = SZ_4K;</div><div class='add'>+	em-&gt;disk_num_bytes = SZ_4K;</div><div class='add'>+	em-&gt;ram_bytes = SZ_4K;</div><div class='ctx'> 	write_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	ret = add_extent_mapping(em_tree, em, 0);</div><div class='add'>+	ret = btrfs_add_extent_mapping(inode, &amp;em, em-&gt;start, em-&gt;len);</div><div class='ctx'> 	write_unlock(&amp;em_tree-&gt;lock);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='ctx'> 		test_err("cannot add extent range [4K, 8K)");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='del'>-	em = alloc_extent_map();</div><div class='add'>+	em = btrfs_alloc_extent_map();</div><div class='ctx'> 	if (!em) {</div><div class='ctx'> 		test_std_err(TEST_ALLOC_EXTENT_MAP);</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='hunk'>@@ -259,32 +291,40 @@ static int __test_case_3(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	/* Add [0, 16K) */</div><div class='ctx'> 	em-&gt;start = 0;</div><div class='ctx'> 	em-&gt;len = SZ_16K;</div><div class='del'>-	em-&gt;block_start = 0;</div><div class='del'>-	em-&gt;block_len = SZ_16K;</div><div class='add'>+	em-&gt;disk_bytenr = 0;</div><div class='add'>+	em-&gt;disk_num_bytes = SZ_16K;</div><div class='add'>+	em-&gt;ram_bytes = SZ_16K;</div><div class='ctx'> 	write_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	ret = btrfs_add_extent_mapping(fs_info, em_tree, &amp;em, start, len);</div><div class='add'>+	ret = btrfs_add_extent_mapping(inode, &amp;em, start, len);</div><div class='ctx'> 	write_unlock(&amp;em_tree-&gt;lock);</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		test_err("case3 [0x%llx 0x%llx): ret %d",</div><div class='add'>+		test_err("case3 [%llu %llu): ret %d",</div><div class='ctx'> 			 start, start + len, ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='add'>+	if (!em) {</div><div class='add'>+		test_err("case3 [%llu %llu): no extent map returned",</div><div class='add'>+			 start, start + len);</div><div class='add'>+		ret = -ENOENT;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Since bytes within em are contiguous, em-&gt;block_start is identical to</div><div class='ctx'> 	 * em-&gt;start.</div><div class='ctx'> 	 */</div><div class='del'>-	if (em &amp;&amp;</div><div class='del'>-	    (start &lt; em-&gt;start || start + len &gt; extent_map_end(em) ||</div><div class='del'>-	     em-&gt;start != em-&gt;block_start || em-&gt;len != em-&gt;block_len)) {</div><div class='add'>+	if (start &lt; em-&gt;start || start + len &gt; btrfs_extent_map_end(em) ||</div><div class='add'>+	    em-&gt;start != btrfs_extent_map_block_start(em)) {</div><div class='ctx'> 		test_err(</div><div class='del'>-"case3 [0x%llx 0x%llx): ret %d em (start 0x%llx len 0x%llx block_start 0x%llx block_len 0x%llx)",</div><div class='add'>+"case3 [%llu %llu): ret %d em (start %llu len %llu disk_bytenr %llu block_len %llu)",</div><div class='ctx'> 			 start, start + len, ret, em-&gt;start, em-&gt;len,</div><div class='del'>-			 em-&gt;block_start, em-&gt;block_len);</div><div class='add'>+			 em-&gt;disk_bytenr, em-&gt;disk_num_bytes);</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> out:</div><div class='del'>-	free_extent_map_tree(em_tree);</div><div class='add'>+	ret2 = free_extent_map_tree(inode);</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		ret = ret2;</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -305,30 +345,31 @@ out:</div><div class='ctx'>  *   -&gt; add_extent_mapping()</div><div class='ctx'>  *                            -&gt; add_extent_mapping()</div><div class='ctx'>  */</div><div class='del'>-static int test_case_3(struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct extent_map_tree *em_tree)</div><div class='add'>+static int test_case_3(struct btrfs_fs_info *fs_info, struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = __test_case_3(fs_info, em_tree, 0);</div><div class='add'>+	ret = __test_case_3(fs_info, inode, 0);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='del'>-	ret = __test_case_3(fs_info, em_tree, SZ_8K);</div><div class='add'>+	ret = __test_case_3(fs_info, inode, SZ_8K);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='del'>-	ret = __test_case_3(fs_info, em_tree, (12 * SZ_1K));</div><div class='add'>+	ret = __test_case_3(fs_info, inode, (12 * SZ_1K));</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int __test_case_4(struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct extent_map_tree *em_tree, u64 start)</div><div class='add'>+			 struct btrfs_inode *inode, u64 start)</div><div class='ctx'> {</div><div class='add'>+	struct extent_map_tree *em_tree = &amp;inode-&gt;extent_tree;</div><div class='ctx'> 	struct extent_map *em;</div><div class='ctx'> 	u64 len = SZ_4K;</div><div class='ctx'> 	int ret;</div><div class='add'>+	int ret2;</div><div class='ctx'> </div><div class='del'>-	em = alloc_extent_map();</div><div class='add'>+	em = btrfs_alloc_extent_map();</div><div class='ctx'> 	if (!em) {</div><div class='ctx'> 		test_std_err(TEST_ALLOC_EXTENT_MAP);</div><div class='ctx'> 		return -ENOMEM;</div><div class='hunk'>@@ -337,18 +378,19 @@ static int __test_case_4(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	/* Add [0K, 8K) */</div><div class='ctx'> 	em-&gt;start = 0;</div><div class='ctx'> 	em-&gt;len = SZ_8K;</div><div class='del'>-	em-&gt;block_start = 0;</div><div class='del'>-	em-&gt;block_len = SZ_8K;</div><div class='add'>+	em-&gt;disk_bytenr = 0;</div><div class='add'>+	em-&gt;disk_num_bytes = SZ_8K;</div><div class='add'>+	em-&gt;ram_bytes = SZ_8K;</div><div class='ctx'> 	write_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	ret = add_extent_mapping(em_tree, em, 0);</div><div class='add'>+	ret = btrfs_add_extent_mapping(inode, &amp;em, em-&gt;start, em-&gt;len);</div><div class='ctx'> 	write_unlock(&amp;em_tree-&gt;lock);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='ctx'> 		test_err("cannot add extent range [0, 8K)");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='del'>-	em = alloc_extent_map();</div><div class='add'>+	em = btrfs_alloc_extent_map();</div><div class='ctx'> 	if (!em) {</div><div class='ctx'> 		test_std_err(TEST_ALLOC_EXTENT_MAP);</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='hunk'>@@ -358,18 +400,19 @@ static int __test_case_4(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	/* Add [8K, 32K) */</div><div class='ctx'> 	em-&gt;start = SZ_8K;</div><div class='ctx'> 	em-&gt;len = 24 * SZ_1K;</div><div class='del'>-	em-&gt;block_start = SZ_16K; /* avoid merging */</div><div class='del'>-	em-&gt;block_len = 24 * SZ_1K;</div><div class='add'>+	em-&gt;disk_bytenr = SZ_16K; /* avoid merging */</div><div class='add'>+	em-&gt;disk_num_bytes = 24 * SZ_1K;</div><div class='add'>+	em-&gt;ram_bytes = 24 * SZ_1K;</div><div class='ctx'> 	write_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	ret = add_extent_mapping(em_tree, em, 0);</div><div class='add'>+	ret = btrfs_add_extent_mapping(inode, &amp;em, em-&gt;start, em-&gt;len);</div><div class='ctx'> 	write_unlock(&amp;em_tree-&gt;lock);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='ctx'> 		test_err("cannot add extent range [8K, 32K)");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='del'>-	em = alloc_extent_map();</div><div class='add'>+	em = btrfs_alloc_extent_map();</div><div class='ctx'> 	if (!em) {</div><div class='ctx'> 		test_std_err(TEST_ALLOC_EXTENT_MAP);</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='hunk'>@@ -378,26 +421,35 @@ static int __test_case_4(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	/* Add [0K, 32K) */</div><div class='ctx'> 	em-&gt;start = 0;</div><div class='ctx'> 	em-&gt;len = SZ_32K;</div><div class='del'>-	em-&gt;block_start = 0;</div><div class='del'>-	em-&gt;block_len = SZ_32K;</div><div class='add'>+	em-&gt;disk_bytenr = 0;</div><div class='add'>+	em-&gt;disk_num_bytes = SZ_32K;</div><div class='add'>+	em-&gt;ram_bytes = SZ_32K;</div><div class='ctx'> 	write_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	ret = btrfs_add_extent_mapping(fs_info, em_tree, &amp;em, start, len);</div><div class='add'>+	ret = btrfs_add_extent_mapping(inode, &amp;em, start, len);</div><div class='ctx'> 	write_unlock(&amp;em_tree-&gt;lock);</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		test_err("case4 [0x%llx 0x%llx): ret %d",</div><div class='del'>-			 start, len, ret);</div><div class='add'>+		test_err("case4 [%llu %llu): ret %d",</div><div class='add'>+			 start, start + len, ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em &amp;&amp; (start &lt; em-&gt;start || start + len &gt; extent_map_end(em))) {</div><div class='add'>+	if (!em) {</div><div class='add'>+		test_err("case4 [%llu %llu): no extent map returned",</div><div class='add'>+			 start, start + len);</div><div class='add'>+		ret = -ENOENT;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	if (start &lt; em-&gt;start || start + len &gt; btrfs_extent_map_end(em)) {</div><div class='ctx'> 		test_err(</div><div class='del'>-"case4 [0x%llx 0x%llx): ret %d, added wrong em (start 0x%llx len 0x%llx block_start 0x%llx block_len 0x%llx)",</div><div class='del'>-			 start, len, ret, em-&gt;start, em-&gt;len, em-&gt;block_start,</div><div class='del'>-			 em-&gt;block_len);</div><div class='add'>+"case4 [%llu %llu): ret %d, added wrong em (start %llu len %llu disk_bytenr %llu disk_num_bytes %llu)",</div><div class='add'>+			 start, start + len, ret, em-&gt;start, em-&gt;len,</div><div class='add'>+			 em-&gt;disk_bytenr, em-&gt;disk_num_bytes);</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> out:</div><div class='del'>-	free_extent_map_tree(em_tree);</div><div class='add'>+	ret2 = free_extent_map_tree(inode);</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		ret = ret2;</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -427,15 +479,519 @@ out:</div><div class='ctx'>  *                                             # handle -EEXIST when adding</div><div class='ctx'>  *                                             # [0, 32K)</div><div class='ctx'>  */</div><div class='del'>-static int test_case_4(struct btrfs_fs_info *fs_info,</div><div class='del'>-		struct extent_map_tree *em_tree)</div><div class='add'>+static int test_case_4(struct btrfs_fs_info *fs_info, struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = __test_case_4(fs_info, em_tree, 0);</div><div class='add'>+	ret = __test_case_4(fs_info, inode, 0);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='del'>-	ret = __test_case_4(fs_info, em_tree, SZ_4K);</div><div class='add'>+	ret = __test_case_4(fs_info, inode, SZ_4K);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int add_compressed_extent(struct btrfs_inode *inode,</div><div class='add'>+				 u64 start, u64 len, u64 block_start)</div><div class='add'>+{</div><div class='add'>+	struct extent_map_tree *em_tree = &amp;inode-&gt;extent_tree;</div><div class='add'>+	struct extent_map *em;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	em = btrfs_alloc_extent_map();</div><div class='add'>+	if (!em) {</div><div class='add'>+		test_std_err(TEST_ALLOC_EXTENT_MAP);</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	em-&gt;start = start;</div><div class='add'>+	em-&gt;len = len;</div><div class='add'>+	em-&gt;disk_bytenr = block_start;</div><div class='add'>+	em-&gt;disk_num_bytes = SZ_4K;</div><div class='add'>+	em-&gt;ram_bytes = len;</div><div class='add'>+	em-&gt;flags |= EXTENT_FLAG_COMPRESS_ZLIB;</div><div class='add'>+	write_lock(&amp;em_tree-&gt;lock);</div><div class='add'>+	ret = btrfs_add_extent_mapping(inode, &amp;em, em-&gt;start, em-&gt;len);</div><div class='add'>+	write_unlock(&amp;em_tree-&gt;lock);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		test_err("cannot add extent map [%llu, %llu)", start, start + len);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct extent_range {</div><div class='add'>+	u64 start;</div><div class='add'>+	u64 len;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/* The valid states of the tree after every drop, as described below. */</div><div class='add'>+struct extent_range valid_ranges[][7] = {</div><div class='add'>+	{</div><div class='add'>+	  { .start = 0,			.len = SZ_8K },		/* [0, 8K) */</div><div class='add'>+	  { .start = SZ_4K * 3,		.len = SZ_4K * 3},	/* [12k, 24k) */</div><div class='add'>+	  { .start = SZ_4K * 6,		.len = SZ_4K * 3},	/* [24k, 36k) */</div><div class='add'>+	  { .start = SZ_32K + SZ_4K,	.len = SZ_4K},		/* [36k, 40k) */</div><div class='add'>+	  { .start = SZ_4K * 10,	.len = SZ_4K * 6},	/* [40k, 64k) */</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+	  { .start = 0,			.len = SZ_8K },		/* [0, 8K) */</div><div class='add'>+	  { .start = SZ_4K * 5,		.len = SZ_4K},		/* [20k, 24k) */</div><div class='add'>+	  { .start = SZ_4K * 6,		.len = SZ_4K * 3},	/* [24k, 36k) */</div><div class='add'>+	  { .start = SZ_32K + SZ_4K,	.len = SZ_4K},		/* [36k, 40k) */</div><div class='add'>+	  { .start = SZ_4K * 10,	.len = SZ_4K * 6},	/* [40k, 64k) */</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+	  { .start = 0,			.len = SZ_8K },		/* [0, 8K) */</div><div class='add'>+	  { .start = SZ_4K * 5,		.len = SZ_4K},		/* [20k, 24k) */</div><div class='add'>+	  { .start = SZ_4K * 6,		.len = SZ_4K},		/* [24k, 28k) */</div><div class='add'>+	  { .start = SZ_32K,		.len = SZ_4K},		/* [32k, 36k) */</div><div class='add'>+	  { .start = SZ_32K + SZ_4K,	.len = SZ_4K},		/* [36k, 40k) */</div><div class='add'>+	  { .start = SZ_4K * 10,	.len = SZ_4K * 6},	/* [40k, 64k) */</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+	  { .start = 0,			.len = SZ_8K},		/* [0, 8K) */</div><div class='add'>+	  { .start = SZ_4K * 5,		.len = SZ_4K},		/* [20k, 24k) */</div><div class='add'>+	  { .start = SZ_4K * 6,		.len = SZ_4K},		/* [24k, 28k) */</div><div class='add'>+	}</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int validate_range(struct extent_map_tree *em_tree, int index)</div><div class='add'>+{</div><div class='add'>+	struct rb_node *n;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	for (i = 0, n = rb_first(&amp;em_tree-&gt;root);</div><div class='add'>+	     valid_ranges[index][i].len &amp;&amp; n;</div><div class='add'>+	     i++, n = rb_next(n)) {</div><div class='add'>+		struct extent_map *entry = rb_entry(n, struct extent_map, rb_node);</div><div class='add'>+</div><div class='add'>+		if (entry-&gt;start != valid_ranges[index][i].start) {</div><div class='add'>+			test_err("mapping has start %llu expected %llu",</div><div class='add'>+				 entry-&gt;start, valid_ranges[index][i].start);</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (entry-&gt;len != valid_ranges[index][i].len) {</div><div class='add'>+			test_err("mapping has len %llu expected %llu",</div><div class='add'>+				 entry-&gt;len, valid_ranges[index][i].len);</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We exited because we don't have any more entries in the extent_map</div><div class='add'>+	 * but we still expect more valid entries.</div><div class='add'>+	 */</div><div class='add'>+	if (valid_ranges[index][i].len) {</div><div class='add'>+		test_err("missing an entry");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* We exited the loop but still have entries in the extent map. */</div><div class='add'>+	if (n) {</div><div class='add'>+		test_err("we have a left over entry in the extent map we didn't expect");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Test scenario:</div><div class='add'>+ *</div><div class='add'>+ * Test the various edge cases of btrfs_drop_extent_map_range, create the</div><div class='add'>+ * following ranges</div><div class='add'>+ *</div><div class='add'>+ * [0, 12k)[12k, 24k)[24k, 36k)[36k, 40k)[40k,64k)</div><div class='add'>+ *</div><div class='add'>+ * And then we'll drop:</div><div class='add'>+ *</div><div class='add'>+ * [8k, 12k) - test the single front split</div><div class='add'>+ * [12k, 20k) - test the single back split</div><div class='add'>+ * [28k, 32k) - test the double split</div><div class='add'>+ * [32k, 64k) - test whole em dropping</div><div class='add'>+ *</div><div class='add'>+ * They'll have the EXTENT_FLAG_COMPRESSED flag set to keep the em tree from</div><div class='add'>+ * merging the em's.</div><div class='add'>+ */</div><div class='add'>+static int test_case_5(struct btrfs_fs_info *fs_info, struct btrfs_inode *inode)</div><div class='add'>+{</div><div class='add'>+	u64 start, end;</div><div class='add'>+	int ret;</div><div class='add'>+	int ret2;</div><div class='add'>+</div><div class='add'>+	test_msg("Running btrfs_drop_extent_map_range tests");</div><div class='add'>+</div><div class='add'>+	/* [0, 12k) */</div><div class='add'>+	ret = add_compressed_extent(inode, 0, SZ_4K * 3, 0);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("cannot add extent range [0, 12K)");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* [12k, 24k) */</div><div class='add'>+	ret = add_compressed_extent(inode, SZ_4K * 3, SZ_4K * 3, SZ_4K);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("cannot add extent range [12k, 24k)");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* [24k, 36k) */</div><div class='add'>+	ret = add_compressed_extent(inode, SZ_4K * 6, SZ_4K * 3, SZ_8K);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("cannot add extent range [12k, 24k)");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* [36k, 40k) */</div><div class='add'>+	ret = add_compressed_extent(inode, SZ_32K + SZ_4K, SZ_4K, SZ_4K * 3);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("cannot add extent range [12k, 24k)");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* [40k, 64k) */</div><div class='add'>+	ret = add_compressed_extent(inode, SZ_4K * 10, SZ_4K * 6, SZ_16K);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("cannot add extent range [12k, 24k)");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Drop [8k, 12k) */</div><div class='add'>+	start = SZ_8K;</div><div class='add'>+	end = (3 * SZ_4K) - 1;</div><div class='add'>+	btrfs_drop_extent_map_range(inode, start, end, false);</div><div class='add'>+	ret = validate_range(&amp;inode-&gt;extent_tree, 0);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	/* Drop [12k, 20k) */</div><div class='add'>+	start = SZ_4K * 3;</div><div class='add'>+	end = SZ_16K + SZ_4K - 1;</div><div class='add'>+	btrfs_drop_extent_map_range(inode, start, end, false);</div><div class='add'>+	ret = validate_range(&amp;inode-&gt;extent_tree, 1);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	/* Drop [28k, 32k) */</div><div class='add'>+	start = SZ_32K - SZ_4K;</div><div class='add'>+	end = SZ_32K - 1;</div><div class='add'>+	btrfs_drop_extent_map_range(inode, start, end, false);</div><div class='add'>+	ret = validate_range(&amp;inode-&gt;extent_tree, 2);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	/* Drop [32k, 64k) */</div><div class='add'>+	start = SZ_32K;</div><div class='add'>+	end = SZ_64K - 1;</div><div class='add'>+	btrfs_drop_extent_map_range(inode, start, end, false);</div><div class='add'>+	ret = validate_range(&amp;inode-&gt;extent_tree, 3);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+out:</div><div class='add'>+	ret2 = free_extent_map_tree(inode);</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		ret = ret2;</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Test the btrfs_add_extent_mapping helper which will attempt to create an em</div><div class='add'>+ * for areas between two existing ems.  Validate it doesn't do this when there</div><div class='add'>+ * are two unmerged em's side by side.</div><div class='add'>+ */</div><div class='add'>+static int test_case_6(struct btrfs_fs_info *fs_info, struct btrfs_inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct extent_map_tree *em_tree = &amp;inode-&gt;extent_tree;</div><div class='add'>+	struct extent_map *em = NULL;</div><div class='add'>+	int ret;</div><div class='add'>+	int ret2;</div><div class='add'>+</div><div class='add'>+	ret = add_compressed_extent(inode, 0, SZ_4K, 0);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	ret = add_compressed_extent(inode, SZ_4K, SZ_4K, 0);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	em = btrfs_alloc_extent_map();</div><div class='add'>+	if (!em) {</div><div class='add'>+		test_std_err(TEST_ALLOC_EXTENT_MAP);</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	em-&gt;start = SZ_4K;</div><div class='add'>+	em-&gt;len = SZ_4K;</div><div class='add'>+	em-&gt;disk_bytenr = SZ_16K;</div><div class='add'>+	em-&gt;disk_num_bytes = SZ_16K;</div><div class='add'>+	em-&gt;ram_bytes = SZ_16K;</div><div class='add'>+	write_lock(&amp;em_tree-&gt;lock);</div><div class='add'>+	ret = btrfs_add_extent_mapping(inode, &amp;em, 0, SZ_8K);</div><div class='add'>+	write_unlock(&amp;em_tree-&gt;lock);</div><div class='add'>+</div><div class='add'>+	if (ret != 0) {</div><div class='add'>+		test_err("got an error when adding our em: %d", ret);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = -EINVAL;</div><div class='add'>+	if (em-&gt;start != 0) {</div><div class='add'>+		test_err("unexpected em-&gt;start at %llu, wanted 0", em-&gt;start);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	if (em-&gt;len != SZ_4K) {</div><div class='add'>+		test_err("unexpected em-&gt;len %llu, expected 4K", em-&gt;len);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	ret = 0;</div><div class='add'>+out:</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='add'>+	ret2 = free_extent_map_tree(inode);</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		ret = ret2;</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Regression test for btrfs_drop_extent_map_range.  Calling with skip_pinned ==</div><div class='add'>+ * true would mess up the start/end calculations and subsequent splits would be</div><div class='add'>+ * incorrect.</div><div class='add'>+ */</div><div class='add'>+static int test_case_7(struct btrfs_fs_info *fs_info, struct btrfs_inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct extent_map_tree *em_tree = &amp;inode-&gt;extent_tree;</div><div class='add'>+	struct extent_map *em;</div><div class='add'>+	int ret;</div><div class='add'>+	int ret2;</div><div class='add'>+</div><div class='add'>+	test_msg("Running btrfs_drop_extent_cache with pinned");</div><div class='add'>+</div><div class='add'>+	em = btrfs_alloc_extent_map();</div><div class='add'>+	if (!em) {</div><div class='add'>+		test_std_err(TEST_ALLOC_EXTENT_MAP);</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* [0, 16K), pinned */</div><div class='add'>+	em-&gt;start = 0;</div><div class='add'>+	em-&gt;len = SZ_16K;</div><div class='add'>+	em-&gt;disk_bytenr = 0;</div><div class='add'>+	em-&gt;disk_num_bytes = SZ_4K;</div><div class='add'>+	em-&gt;ram_bytes = SZ_16K;</div><div class='add'>+	em-&gt;flags |= (EXTENT_FLAG_PINNED | EXTENT_FLAG_COMPRESS_ZLIB);</div><div class='add'>+	write_lock(&amp;em_tree-&gt;lock);</div><div class='add'>+	ret = btrfs_add_extent_mapping(inode, &amp;em, em-&gt;start, em-&gt;len);</div><div class='add'>+	write_unlock(&amp;em_tree-&gt;lock);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		test_err("couldn't add extent map");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='add'>+</div><div class='add'>+	em = btrfs_alloc_extent_map();</div><div class='add'>+	if (!em) {</div><div class='add'>+		test_std_err(TEST_ALLOC_EXTENT_MAP);</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* [32K, 48K), not pinned */</div><div class='add'>+	em-&gt;start = SZ_32K;</div><div class='add'>+	em-&gt;len = SZ_16K;</div><div class='add'>+	em-&gt;disk_bytenr = SZ_32K;</div><div class='add'>+	em-&gt;disk_num_bytes = SZ_16K;</div><div class='add'>+	em-&gt;ram_bytes = SZ_16K;</div><div class='add'>+	write_lock(&amp;em_tree-&gt;lock);</div><div class='add'>+	ret = btrfs_add_extent_mapping(inode, &amp;em, em-&gt;start, em-&gt;len);</div><div class='add'>+	write_unlock(&amp;em_tree-&gt;lock);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		test_err("couldn't add extent map");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Drop [0, 36K) This should skip the [0, 4K) extent and then split the</div><div class='add'>+	 * [32K, 48K) extent.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_drop_extent_map_range(inode, 0, (36 * SZ_1K) - 1, true);</div><div class='add'>+</div><div class='add'>+	/* Make sure our extent maps look sane. */</div><div class='add'>+	ret = -EINVAL;</div><div class='add'>+</div><div class='add'>+	em = btrfs_lookup_extent_mapping(em_tree, 0, SZ_16K);</div><div class='add'>+	if (!em) {</div><div class='add'>+		test_err("didn't find an em at 0 as expected");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (em-&gt;start != 0) {</div><div class='add'>+		test_err("em-&gt;start is %llu, expected 0", em-&gt;start);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (em-&gt;len != SZ_16K) {</div><div class='add'>+		test_err("em-&gt;len is %llu, expected 16K", em-&gt;len);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='add'>+</div><div class='add'>+	read_lock(&amp;em_tree-&gt;lock);</div><div class='add'>+	em = btrfs_lookup_extent_mapping(em_tree, SZ_16K, SZ_16K);</div><div class='add'>+	read_unlock(&amp;em_tree-&gt;lock);</div><div class='add'>+	if (em) {</div><div class='add'>+		test_err("found an em when we weren't expecting one");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	read_lock(&amp;em_tree-&gt;lock);</div><div class='add'>+	em = btrfs_lookup_extent_mapping(em_tree, SZ_32K, SZ_16K);</div><div class='add'>+	read_unlock(&amp;em_tree-&gt;lock);</div><div class='add'>+	if (!em) {</div><div class='add'>+		test_err("didn't find an em at 32K as expected");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (em-&gt;start != (36 * SZ_1K)) {</div><div class='add'>+		test_err("em-&gt;start is %llu, expected 36K", em-&gt;start);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (em-&gt;len != (12 * SZ_1K)) {</div><div class='add'>+		test_err("em-&gt;len is %llu, expected 12K", em-&gt;len);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (btrfs_extent_map_block_start(em) != SZ_32K + SZ_4K) {</div><div class='add'>+		test_err("em-&gt;block_start is %llu, expected 36K",</div><div class='add'>+			 btrfs_extent_map_block_start(em));</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='add'>+</div><div class='add'>+	read_lock(&amp;em_tree-&gt;lock);</div><div class='add'>+	em = btrfs_lookup_extent_mapping(em_tree, 48 * SZ_1K, (u64)-1);</div><div class='add'>+	read_unlock(&amp;em_tree-&gt;lock);</div><div class='add'>+	if (em) {</div><div class='add'>+		test_err("found an unexpected em above 48K");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = 0;</div><div class='add'>+out:</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='add'>+	/* Unpin our extent to prevent warning when removing it below. */</div><div class='add'>+	ret2 = btrfs_unpin_extent_cache(inode, 0, SZ_16K, 0);</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		ret = ret2;</div><div class='add'>+	ret2 = free_extent_map_tree(inode);</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		ret = ret2;</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Test a regression for compressed extent map adjustment when we attempt to</div><div class='add'>+ * add an extent map that is partially overlapped by another existing extent</div><div class='add'>+ * map. The resulting extent map offset was left unchanged despite having</div><div class='add'>+ * incremented its start offset.</div><div class='add'>+ */</div><div class='add'>+static int test_case_8(struct btrfs_fs_info *fs_info, struct btrfs_inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct extent_map_tree *em_tree = &amp;inode-&gt;extent_tree;</div><div class='add'>+	struct extent_map *em;</div><div class='add'>+	int ret;</div><div class='add'>+	int ret2;</div><div class='add'>+</div><div class='add'>+	em = btrfs_alloc_extent_map();</div><div class='add'>+	if (!em) {</div><div class='add'>+		test_std_err(TEST_ALLOC_EXTENT_MAP);</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Compressed extent for the file range [120K, 128K). */</div><div class='add'>+	em-&gt;start = SZ_1K * 120;</div><div class='add'>+	em-&gt;len = SZ_8K;</div><div class='add'>+	em-&gt;disk_num_bytes = SZ_4K;</div><div class='add'>+	em-&gt;ram_bytes = SZ_8K;</div><div class='add'>+	em-&gt;flags |= EXTENT_FLAG_COMPRESS_ZLIB;</div><div class='add'>+	write_lock(&amp;em_tree-&gt;lock);</div><div class='add'>+	ret = btrfs_add_extent_mapping(inode, &amp;em, em-&gt;start, em-&gt;len);</div><div class='add'>+	write_unlock(&amp;em_tree-&gt;lock);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		test_err("couldn't add extent map for range [120K, 128K)");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	em = btrfs_alloc_extent_map();</div><div class='add'>+	if (!em) {</div><div class='add'>+		test_std_err(TEST_ALLOC_EXTENT_MAP);</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Compressed extent for the file range [108K, 144K), which overlaps</div><div class='add'>+	 * with the [120K, 128K) we previously inserted.</div><div class='add'>+	 */</div><div class='add'>+	em-&gt;start = SZ_1K * 108;</div><div class='add'>+	em-&gt;len = SZ_1K * 36;</div><div class='add'>+	em-&gt;disk_num_bytes = SZ_4K;</div><div class='add'>+	em-&gt;ram_bytes = SZ_1K * 36;</div><div class='add'>+	em-&gt;flags |= EXTENT_FLAG_COMPRESS_ZLIB;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Try to add the extent map but with a search range of [140K, 144K),</div><div class='add'>+	 * this should succeed and adjust the extent map to the range</div><div class='add'>+	 * [128K, 144K), with a length of 16K and an offset of 20K.</div><div class='add'>+	 *</div><div class='add'>+	 * This simulates a scenario where in the subvolume tree of an inode we</div><div class='add'>+	 * have a compressed file extent item for the range [108K, 144K) and we</div><div class='add'>+	 * have an overlapping compressed extent map for the range [120K, 128K),</div><div class='add'>+	 * which was created by an encoded write, but its ordered extent was not</div><div class='add'>+	 * yet completed, so the subvolume tree doesn't have yet the file extent</div><div class='add'>+	 * item for that range - we only have the extent map in the inode's</div><div class='add'>+	 * extent map tree.</div><div class='add'>+	 */</div><div class='add'>+	write_lock(&amp;em_tree-&gt;lock);</div><div class='add'>+	ret = btrfs_add_extent_mapping(inode, &amp;em, SZ_1K * 140, SZ_4K);</div><div class='add'>+	write_unlock(&amp;em_tree-&gt;lock);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		test_err("couldn't add extent map for range [108K, 144K)");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (em-&gt;start != SZ_128K) {</div><div class='add'>+		test_err("unexpected extent map start %llu (should be 128K)", em-&gt;start);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	if (em-&gt;len != SZ_16K) {</div><div class='add'>+		test_err("unexpected extent map length %llu (should be 16K)", em-&gt;len);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	if (em-&gt;offset != SZ_1K * 20) {</div><div class='add'>+		test_err("unexpected extent map offset %llu (should be 20K)", em-&gt;offset);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='add'>+	ret2 = free_extent_map_tree(inode);</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		ret = ret2;</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -456,35 +1012,22 @@ struct rmap_test_vector {</div><div class='ctx'> static int test_rmap_block(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			   struct rmap_test_vector *test)</div><div class='ctx'> {</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	struct map_lookup *map = NULL;</div><div class='del'>-	u64 *logical = NULL;</div><div class='add'>+	struct btrfs_chunk_map *map;</div><div class='add'>+	u64 AUTO_KFREE(logical);</div><div class='ctx'> 	int i, out_ndaddrs, out_stripe_len;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	em = alloc_extent_map();</div><div class='del'>-	if (!em) {</div><div class='del'>-		test_std_err(TEST_ALLOC_EXTENT_MAP);</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	map = kmalloc(map_lookup_size(test-&gt;num_stripes), GFP_KERNEL);</div><div class='add'>+	map = btrfs_alloc_chunk_map(test-&gt;num_stripes, GFP_KERNEL);</div><div class='ctx'> 	if (!map) {</div><div class='del'>-		kfree(em);</div><div class='del'>-		test_std_err(TEST_ALLOC_EXTENT_MAP);</div><div class='add'>+		test_std_err(TEST_ALLOC_CHUNK_MAP);</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	set_bit(EXTENT_FLAG_FS_MAPPING, &amp;em-&gt;flags);</div><div class='ctx'> 	/* Start at 4GiB logical address */</div><div class='del'>-	em-&gt;start = SZ_4G;</div><div class='del'>-	em-&gt;len = test-&gt;data_stripe_size * test-&gt;num_data_stripes;</div><div class='del'>-	em-&gt;block_len = em-&gt;len;</div><div class='del'>-	em-&gt;orig_block_len = test-&gt;data_stripe_size;</div><div class='del'>-	em-&gt;map_lookup = map;</div><div class='del'>-</div><div class='add'>+	map-&gt;start = SZ_4G;</div><div class='add'>+	map-&gt;chunk_len = test-&gt;data_stripe_size * test-&gt;num_data_stripes;</div><div class='add'>+	map-&gt;stripe_size = test-&gt;data_stripe_size;</div><div class='ctx'> 	map-&gt;num_stripes = test-&gt;num_stripes;</div><div class='del'>-	map-&gt;stripe_len = BTRFS_STRIPE_LEN;</div><div class='ctx'> 	map-&gt;type = test-&gt;raid_type;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; map-&gt;num_stripes; i++) {</div><div class='hunk'>@@ -499,15 +1042,14 @@ static int test_rmap_block(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		map-&gt;stripes[i].physical = test-&gt;data_stripe_phys_start[i];</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	write_lock(&amp;fs_info-&gt;mapping_tree.lock);</div><div class='del'>-	ret = add_extent_mapping(&amp;fs_info-&gt;mapping_tree, em, 0);</div><div class='del'>-	write_unlock(&amp;fs_info-&gt;mapping_tree.lock);</div><div class='add'>+	ret = btrfs_add_chunk_map(fs_info, map);</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		test_err("error adding block group mapping to mapping tree");</div><div class='del'>-		goto out_free;</div><div class='add'>+		test_err("error adding chunk map to mapping tree");</div><div class='add'>+		btrfs_free_chunk_map(map);</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_rmap_block(fs_info, em-&gt;start, NULL, btrfs_sb_offset(1),</div><div class='add'>+	ret = btrfs_rmap_block(fs_info, map-&gt;start, btrfs_sb_offset(1),</div><div class='ctx'> 			       &amp;logical, &amp;out_ndaddrs, &amp;out_stripe_len);</div><div class='ctx'> 	if (ret || (out_ndaddrs == 0 &amp;&amp; test-&gt;expected_mapped_addr)) {</div><div class='ctx'> 		test_err("didn't rmap anything but expected %d",</div><div class='hunk'>@@ -536,29 +1078,22 @@ static int test_rmap_block(struct btrfs_fs_info *fs_info,</div><div class='ctx'> </div><div class='ctx'> 	ret = 0;</div><div class='ctx'> out:</div><div class='del'>-	write_lock(&amp;fs_info-&gt;mapping_tree.lock);</div><div class='del'>-	remove_extent_mapping(&amp;fs_info-&gt;mapping_tree, em);</div><div class='del'>-	write_unlock(&amp;fs_info-&gt;mapping_tree.lock);</div><div class='del'>-	/* For us */</div><div class='del'>-	free_extent_map(em);</div><div class='del'>-out_free:</div><div class='del'>-	/* For the tree */</div><div class='del'>-	free_extent_map(em);</div><div class='del'>-	kfree(logical);</div><div class='add'>+	btrfs_remove_chunk_map(fs_info, map);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_test_extent_map(void)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = NULL;</div><div class='del'>-	struct extent_map_tree *em_tree;</div><div class='add'>+	struct inode *inode;</div><div class='add'>+	struct btrfs_root *root = NULL;</div><div class='ctx'> 	int ret = 0, i;</div><div class='ctx'> 	struct rmap_test_vector rmap_tests[] = {</div><div class='ctx'> 		{</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Test a chunk with 2 data stripes one of which</div><div class='ctx'> 			 * intersects the physical address of the super block</div><div class='del'>-			 * is correctly recognised.</div><div class='add'>+			 * is correctly recognized.</div><div class='ctx'> 			 */</div><div class='ctx'> 			.raid_type = BTRFS_BLOCK_GROUP_RAID1,</div><div class='ctx'> 			.physical_start = SZ_64M - SZ_4M,</div><div class='hunk'>@@ -600,24 +1135,47 @@ int btrfs_test_extent_map(void)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	em_tree = kzalloc(sizeof(*em_tree), GFP_KERNEL);</div><div class='del'>-	if (!em_tree) {</div><div class='add'>+	inode = btrfs_new_test_inode();</div><div class='add'>+	if (!inode) {</div><div class='add'>+		test_std_err(TEST_ALLOC_INODE);</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	extent_map_tree_init(em_tree);</div><div class='add'>+	root = btrfs_alloc_dummy_root(fs_info);</div><div class='add'>+	if (IS_ERR(root)) {</div><div class='add'>+		test_std_err(TEST_ALLOC_ROOT);</div><div class='add'>+		ret = PTR_ERR(root);</div><div class='add'>+		root = NULL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	BTRFS_I(inode)-&gt;root = root;</div><div class='ctx'> </div><div class='del'>-	ret = test_case_1(fs_info, em_tree);</div><div class='add'>+	ret = test_case_1(fs_info, BTRFS_I(inode));</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+	ret = test_case_2(fs_info, BTRFS_I(inode));</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+	ret = test_case_3(fs_info, BTRFS_I(inode));</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+	ret = test_case_4(fs_info, BTRFS_I(inode));</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+	ret = test_case_5(fs_info, BTRFS_I(inode));</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+	ret = test_case_6(fs_info, BTRFS_I(inode));</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='del'>-	ret = test_case_2(fs_info, em_tree);</div><div class='add'>+	ret = test_case_7(fs_info, BTRFS_I(inode));</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='del'>-	ret = test_case_3(fs_info, em_tree);</div><div class='add'>+	ret = test_case_8(fs_info, BTRFS_I(inode));</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='del'>-	ret = test_case_4(fs_info, em_tree);</div><div class='ctx'> </div><div class='ctx'> 	test_msg("running rmap tests");</div><div class='ctx'> 	for (i = 0; i &lt; ARRAY_SIZE(rmap_tests); i++) {</div><div class='hunk'>@@ -627,7 +1185,8 @@ int btrfs_test_extent_map(void)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	kfree(em_tree);</div><div class='add'>+	iput(inode);</div><div class='add'>+	btrfs_free_dummy_root(root);</div><div class='ctx'> 	btrfs_free_dummy_fs_info(fs_info);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='head'>diff --git a/fs/btrfs/tests/free-space-tests.c b/fs/btrfs/tests/free-space-tests.c<br/>index 8f05c1eb833f..ebf68fcd2149 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tests/free-space-tests.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tests/free-space-tests.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tests/free-space-tests.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/tests/free-space-tests.c</a></div><div class='hunk'>@@ -82,7 +82,7 @@ static int test_extents(struct btrfs_block_group *cache)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Cleanup */</div><div class='del'>-	__btrfs_remove_free_space_cache(cache-&gt;free_space_ctl);</div><div class='add'>+	btrfs_remove_free_space_cache(cache);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -149,7 +149,7 @@ static int test_bitmaps(struct btrfs_block_group *cache, u32 sectorsize)</div><div class='ctx'> 		return -1;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	__btrfs_remove_free_space_cache(cache-&gt;free_space_ctl);</div><div class='add'>+	btrfs_remove_free_space_cache(cache);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -230,7 +230,7 @@ static int test_bitmaps_and_extents(struct btrfs_block_group *cache,</div><div class='ctx'> 		return -1;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	__btrfs_remove_free_space_cache(cache-&gt;free_space_ctl);</div><div class='add'>+	btrfs_remove_free_space_cache(cache);</div><div class='ctx'> </div><div class='ctx'> 	/* Now with the extent entry offset into the bitmap */</div><div class='ctx'> 	ret = test_add_free_space_entry(cache, SZ_4M, SZ_4M, 1);</div><div class='hunk'>@@ -266,7 +266,7 @@ static int test_bitmaps_and_extents(struct btrfs_block_group *cache,</div><div class='ctx'> 	 *      [ bitmap ]</div><div class='ctx'> 	 *        [ del ]</div><div class='ctx'> 	 */</div><div class='del'>-	__btrfs_remove_free_space_cache(cache-&gt;free_space_ctl);</div><div class='add'>+	btrfs_remove_free_space_cache(cache);</div><div class='ctx'> 	ret = test_add_free_space_entry(cache, bitmap_offset + SZ_4M, SZ_4M, 1);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("couldn't add bitmap %d", ret);</div><div class='hunk'>@@ -291,7 +291,7 @@ static int test_bitmaps_and_extents(struct btrfs_block_group *cache,</div><div class='ctx'> 		return -1;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	__btrfs_remove_free_space_cache(cache-&gt;free_space_ctl);</div><div class='add'>+	btrfs_remove_free_space_cache(cache);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * This blew up before, we have part of the free space in a bitmap and</div><div class='hunk'>@@ -317,7 +317,7 @@ static int test_bitmaps_and_extents(struct btrfs_block_group *cache,</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	__btrfs_remove_free_space_cache(cache-&gt;free_space_ctl);</div><div class='add'>+	btrfs_remove_free_space_cache(cache);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -629,7 +629,7 @@ test_steal_space_from_bitmap_to_extent(struct btrfs_block_group *cache,</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	__btrfs_remove_free_space_cache(cache-&gt;free_space_ctl);</div><div class='add'>+	btrfs_remove_free_space_cache(cache);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Now test a similar scenario, but where our extent entry is located</div><div class='hunk'>@@ -819,11 +819,189 @@ test_steal_space_from_bitmap_to_extent(struct btrfs_block_group *cache,</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='ctx'> 	cache-&gt;free_space_ctl-&gt;op = orig_free_space_ops;</div><div class='del'>-	__btrfs_remove_free_space_cache(cache-&gt;free_space_ctl);</div><div class='add'>+	btrfs_remove_free_space_cache(cache);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool bytes_index_use_bitmap(struct btrfs_free_space_ctl *ctl,</div><div class='add'>+				   struct btrfs_free_space *info)</div><div class='add'>+{</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int test_bytes_index(struct btrfs_block_group *cache, u32 sectorsize)</div><div class='add'>+{</div><div class='add'>+	const struct btrfs_free_space_op test_free_space_ops = {</div><div class='add'>+		.use_bitmap = bytes_index_use_bitmap,</div><div class='add'>+	};</div><div class='add'>+	const struct btrfs_free_space_op *orig_free_space_ops;</div><div class='add'>+	struct btrfs_free_space_ctl *ctl = cache-&gt;free_space_ctl;</div><div class='add'>+	struct btrfs_free_space *entry;</div><div class='add'>+	struct rb_node *node;</div><div class='add'>+	u64 offset, max_extent_size, bytes;</div><div class='add'>+	int ret, i;</div><div class='add'>+</div><div class='add'>+	test_msg("running bytes index tests");</div><div class='add'>+</div><div class='add'>+	/* First just validate that it does everything in order. */</div><div class='add'>+	offset = 0;</div><div class='add'>+	for (i = 0; i &lt; 10; i++) {</div><div class='add'>+		bytes = (i + 1) * SZ_1M;</div><div class='add'>+		ret = test_add_free_space_entry(cache, offset, bytes, 0);</div><div class='add'>+		if (ret) {</div><div class='add'>+			test_err("couldn't add extent entry %d\n", ret);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='add'>+		offset += bytes + sectorsize;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for (node = rb_first_cached(&amp;ctl-&gt;free_space_bytes), i = 9; node;</div><div class='add'>+	     node = rb_next(node), i--) {</div><div class='add'>+		entry = rb_entry(node, struct btrfs_free_space, bytes_index);</div><div class='add'>+		bytes = (i + 1) * SZ_1M;</div><div class='add'>+		if (entry-&gt;bytes != bytes) {</div><div class='add'>+			test_err("invalid bytes index order, found %llu expected %llu",</div><div class='add'>+				 entry-&gt;bytes, bytes);</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Now validate bitmaps do the correct thing. */</div><div class='add'>+	btrfs_remove_free_space_cache(cache);</div><div class='add'>+	for (i = 0; i &lt; 2; i++) {</div><div class='add'>+		offset = i * BITS_PER_BITMAP * sectorsize;</div><div class='add'>+		bytes = (i + 1) * SZ_1M;</div><div class='add'>+		ret = test_add_free_space_entry(cache, offset, bytes, 1);</div><div class='add'>+		if (ret) {</div><div class='add'>+			test_err("couldn't add bitmap entry");</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for (node = rb_first_cached(&amp;ctl-&gt;free_space_bytes), i = 1; node;</div><div class='add'>+	     node = rb_next(node), i--) {</div><div class='add'>+		entry = rb_entry(node, struct btrfs_free_space, bytes_index);</div><div class='add'>+		bytes = (i + 1) * SZ_1M;</div><div class='add'>+		if (entry-&gt;bytes != bytes) {</div><div class='add'>+			test_err("invalid bytes index order, found %llu expected %llu",</div><div class='add'>+				 entry-&gt;bytes, bytes);</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Now validate bitmaps with different -&gt;max_extent_size. */</div><div class='add'>+	btrfs_remove_free_space_cache(cache);</div><div class='add'>+	orig_free_space_ops = cache-&gt;free_space_ctl-&gt;op;</div><div class='add'>+	cache-&gt;free_space_ctl-&gt;op = &amp;test_free_space_ops;</div><div class='add'>+</div><div class='add'>+	ret = test_add_free_space_entry(cache, 0, sectorsize, 1);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("couldn't add bitmap entry");</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	offset = BITS_PER_BITMAP * sectorsize;</div><div class='add'>+	ret = test_add_free_space_entry(cache, offset, sectorsize, 1);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("couldn't add bitmap_entry");</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Now set a bunch of sectorsize extents in the first entry so it's</div><div class='add'>+	 * -&gt;bytes is large.</div><div class='add'>+	 */</div><div class='add'>+	for (i = 2; i &lt; 20; i += 2) {</div><div class='add'>+		offset = sectorsize * i;</div><div class='add'>+		ret = btrfs_add_free_space(cache, offset, sectorsize);</div><div class='add'>+		if (ret) {</div><div class='add'>+			test_err("error populating sparse bitmap %d", ret);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Now set a contiguous extent in the second bitmap so its</div><div class='add'>+	 * -&gt;max_extent_size is larger than the first bitmaps.</div><div class='add'>+	 */</div><div class='add'>+	offset = (BITS_PER_BITMAP * sectorsize) + sectorsize;</div><div class='add'>+	ret = btrfs_add_free_space(cache, offset, sectorsize);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("error adding contiguous extent %d", ret);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Since we don't set -&gt;max_extent_size unless we search everything</div><div class='add'>+	 * should be indexed on bytes.</div><div class='add'>+	 */</div><div class='add'>+	entry = rb_entry(rb_first_cached(&amp;ctl-&gt;free_space_bytes),</div><div class='add'>+			 struct btrfs_free_space, bytes_index);</div><div class='add'>+	if (entry-&gt;bytes != (10 * sectorsize)) {</div><div class='add'>+		test_err("error, wrong entry in the first slot in bytes_index");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	max_extent_size = 0;</div><div class='add'>+	offset = btrfs_find_space_for_alloc(cache, cache-&gt;start, sectorsize * 3,</div><div class='add'>+					    0, &amp;max_extent_size);</div><div class='add'>+	if (offset != 0) {</div><div class='add'>+		test_err("found space to alloc even though we don't have enough space");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (max_extent_size != (2 * sectorsize)) {</div><div class='add'>+		test_err("got the wrong max_extent size %llu expected %llu",</div><div class='add'>+			 max_extent_size, (unsigned long long)(2 * sectorsize));</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The search should have re-arranged the bytes index to use the</div><div class='add'>+	 * -&gt;max_extent_size, validate it's now what we expect it to be.</div><div class='add'>+	 */</div><div class='add'>+	entry = rb_entry(rb_first_cached(&amp;ctl-&gt;free_space_bytes),</div><div class='add'>+			 struct btrfs_free_space, bytes_index);</div><div class='add'>+	if (entry-&gt;bytes != (2 * sectorsize)) {</div><div class='add'>+		test_err("error, the bytes index wasn't recalculated properly");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Add another sectorsize to re-arrange the tree back to -&gt;bytes. */</div><div class='add'>+	offset = (BITS_PER_BITMAP * sectorsize) - sectorsize;</div><div class='add'>+	ret = btrfs_add_free_space(cache, offset, sectorsize);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("error adding extent to the sparse entry %d", ret);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	entry = rb_entry(rb_first_cached(&amp;ctl-&gt;free_space_bytes),</div><div class='add'>+			 struct btrfs_free_space, bytes_index);</div><div class='add'>+	if (entry-&gt;bytes != (11 * sectorsize)) {</div><div class='add'>+		test_err("error, wrong entry in the first slot in bytes_index");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Now make sure we find our correct entry after searching that will</div><div class='add'>+	 * result in a re-arranging of the tree.</div><div class='add'>+	 */</div><div class='add'>+	max_extent_size = 0;</div><div class='add'>+	offset = btrfs_find_space_for_alloc(cache, cache-&gt;start, sectorsize * 2,</div><div class='add'>+					    0, &amp;max_extent_size);</div><div class='add'>+	if (offset != (BITS_PER_BITMAP * sectorsize)) {</div><div class='add'>+		test_err("error, found %llu instead of %llu for our alloc",</div><div class='add'>+			 offset,</div><div class='add'>+			 (unsigned long long)(BITS_PER_BITMAP * sectorsize));</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	cache-&gt;free_space_ctl-&gt;op = orig_free_space_ops;</div><div class='add'>+	btrfs_remove_free_space_cache(cache);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> int btrfs_test_free_space_cache(u32 sectorsize, u32 nodesize)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info;</div><div class='hunk'>@@ -858,7 +1036,10 @@ int btrfs_test_free_space_cache(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	root-&gt;fs_info-&gt;extent_root = root;</div><div class='add'>+	root-&gt;root_key.objectid = BTRFS_EXTENT_TREE_OBJECTID;</div><div class='add'>+	root-&gt;root_key.type = BTRFS_ROOT_ITEM_KEY;</div><div class='add'>+	root-&gt;root_key.offset = 0;</div><div class='add'>+	btrfs_global_root_insert(root);</div><div class='ctx'> </div><div class='ctx'> 	ret = test_extents(cache);</div><div class='ctx'> 	if (ret)</div><div class='hunk'>@@ -871,6 +1052,9 @@ int btrfs_test_free_space_cache(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	ret = test_steal_space_from_bitmap_to_extent(cache, sectorsize);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+	ret = test_bytes_index(cache, sectorsize);</div><div class='ctx'> out:</div><div class='ctx'> 	btrfs_free_dummy_block_group(cache);</div><div class='ctx'> 	btrfs_free_dummy_root(root);</div><div class='head'>diff --git a/fs/btrfs/tests/free-space-tree-tests.c b/fs/btrfs/tests/free-space-tree-tests.c<br/>index 2c783d2f5228..c8822edd32e2 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tests/free-space-tree-tests.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tests/free-space-tree-tests.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tests/free-space-tree-tests.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/tests/free-space-tree-tests.c</a></div><div class='hunk'>@@ -10,6 +10,7 @@</div><div class='ctx'> #include "../free-space-tree.h"</div><div class='ctx'> #include "../transaction.h"</div><div class='ctx'> #include "../block-group.h"</div><div class='add'>+#include "../accessors.h"</div><div class='ctx'> </div><div class='ctx'> struct free_space_extent {</div><div class='ctx'> 	u64 start;</div><div class='hunk'>@@ -31,7 +32,7 @@ static int __check_free_space_extents(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	unsigned int i;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	info = search_free_space_info(trans, cache, path, 0);</div><div class='add'>+	info = btrfs_search_free_space_info(trans, cache, path, 0);</div><div class='ctx'> 	if (IS_ERR(info)) {</div><div class='ctx'> 		test_err("could not find free space info");</div><div class='ctx'> 		ret = PTR_ERR(info);</div><div class='hunk'>@@ -56,7 +57,7 @@ static int __check_free_space_extents(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				goto invalid;</div><div class='ctx'> 			offset = key.objectid;</div><div class='ctx'> 			while (offset &lt; key.objectid + key.offset) {</div><div class='del'>-				bit = free_space_test_bit(cache, path, offset);</div><div class='add'>+				bit = btrfs_free_space_test_bit(cache, path, offset);</div><div class='ctx'> 				if (prev_bit == 0 &amp;&amp; bit == 1) {</div><div class='ctx'> 					extent_start = offset;</div><div class='ctx'> 				} else if (prev_bit == 1 &amp;&amp; bit == 0) {</div><div class='hunk'>@@ -114,7 +115,7 @@ static int check_free_space_extents(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	u32 flags;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	info = search_free_space_info(trans, cache, path, 0);</div><div class='add'>+	info = btrfs_search_free_space_info(trans, cache, path, 0);</div><div class='ctx'> 	if (IS_ERR(info)) {</div><div class='ctx'> 		test_err("could not find free space info");</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='hunk'>@@ -130,13 +131,13 @@ static int check_free_space_extents(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	/* Flip it to the other format and check that for good measure. */</div><div class='ctx'> 	if (flags &amp; BTRFS_FREE_SPACE_USING_BITMAPS) {</div><div class='del'>-		ret = convert_free_space_to_extents(trans, cache, path);</div><div class='add'>+		ret = btrfs_convert_free_space_to_extents(trans, cache, path);</div><div class='ctx'> 		if (ret) {</div><div class='ctx'> 			test_err("could not convert to extents");</div><div class='ctx'> 			return ret;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='del'>-		ret = convert_free_space_to_bitmaps(trans, cache, path);</div><div class='add'>+		ret = btrfs_convert_free_space_to_bitmaps(trans, cache, path);</div><div class='ctx'> 		if (ret) {</div><div class='ctx'> 			test_err("could not convert to bitmaps");</div><div class='ctx'> 			return ret;</div><div class='hunk'>@@ -169,9 +170,8 @@ static int test_remove_all(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	const struct free_space_extent extents[] = {};</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = __remove_from_free_space_tree(trans, cache, path,</div><div class='del'>-					    cache-&gt;start,</div><div class='del'>-					    cache-&gt;length);</div><div class='add'>+	ret = __btrfs_remove_from_free_space_tree(trans, cache, path,</div><div class='add'>+						  cache-&gt;start, cache-&gt;length);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("could not remove free space");</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -192,8 +192,8 @@ static int test_remove_beginning(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	};</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = __remove_from_free_space_tree(trans, cache, path,</div><div class='del'>-					    cache-&gt;start, alignment);</div><div class='add'>+	ret = __btrfs_remove_from_free_space_tree(trans, cache, path,</div><div class='add'>+						  cache-&gt;start, alignment);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("could not remove free space");</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -215,7 +215,7 @@ static int test_remove_end(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	};</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = __remove_from_free_space_tree(trans, cache, path,</div><div class='add'>+	ret = __btrfs_remove_from_free_space_tree(trans, cache, path,</div><div class='ctx'> 				    cache-&gt;start + cache-&gt;length - alignment,</div><div class='ctx'> 				    alignment);</div><div class='ctx'> 	if (ret) {</div><div class='hunk'>@@ -239,9 +239,9 @@ static int test_remove_middle(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	};</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = __remove_from_free_space_tree(trans, cache, path,</div><div class='del'>-					    cache-&gt;start + alignment,</div><div class='del'>-					    alignment);</div><div class='add'>+	ret = __btrfs_remove_from_free_space_tree(trans, cache, path,</div><div class='add'>+						  cache-&gt;start + alignment,</div><div class='add'>+						  alignment);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("could not remove free space");</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -262,23 +262,22 @@ static int test_merge_left(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	};</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = __remove_from_free_space_tree(trans, cache, path,</div><div class='del'>-					    cache-&gt;start, cache-&gt;length);</div><div class='add'>+	ret = __btrfs_remove_from_free_space_tree(trans, cache, path,</div><div class='add'>+						  cache-&gt;start, cache-&gt;length);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("could not remove free space");</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = __add_to_free_space_tree(trans, cache, path, cache-&gt;start,</div><div class='del'>-				       alignment);</div><div class='add'>+	ret = __btrfs_add_to_free_space_tree(trans, cache, path, cache-&gt;start,</div><div class='add'>+					     alignment);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("could not add free space");</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = __add_to_free_space_tree(trans, cache, path,</div><div class='del'>-				       cache-&gt;start + alignment,</div><div class='del'>-				       alignment);</div><div class='add'>+	ret = __btrfs_add_to_free_space_tree(trans, cache, path,</div><div class='add'>+					     cache-&gt;start + alignment, alignment);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("could not add free space");</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -299,24 +298,23 @@ static int test_merge_right(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	};</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = __remove_from_free_space_tree(trans, cache, path,</div><div class='del'>-					    cache-&gt;start, cache-&gt;length);</div><div class='add'>+	ret = __btrfs_remove_from_free_space_tree(trans, cache, path,</div><div class='add'>+						  cache-&gt;start, cache-&gt;length);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("could not remove free space");</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = __add_to_free_space_tree(trans, cache, path,</div><div class='del'>-				       cache-&gt;start + 2 * alignment,</div><div class='del'>-				       alignment);</div><div class='add'>+	ret = __btrfs_add_to_free_space_tree(trans, cache, path,</div><div class='add'>+					     cache-&gt;start + 2 * alignment,</div><div class='add'>+					     alignment);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("could not add free space");</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = __add_to_free_space_tree(trans, cache, path,</div><div class='del'>-				       cache-&gt;start + alignment,</div><div class='del'>-				       alignment);</div><div class='add'>+	ret = __btrfs_add_to_free_space_tree(trans, cache, path,</div><div class='add'>+					     cache-&gt;start + alignment, alignment);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("could not add free space");</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -337,29 +335,29 @@ static int test_merge_both(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	};</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = __remove_from_free_space_tree(trans, cache, path,</div><div class='del'>-					    cache-&gt;start, cache-&gt;length);</div><div class='add'>+	ret = __btrfs_remove_from_free_space_tree(trans, cache, path,</div><div class='add'>+						  cache-&gt;start, cache-&gt;length);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("could not remove free space");</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = __add_to_free_space_tree(trans, cache, path, cache-&gt;start,</div><div class='del'>-				       alignment);</div><div class='add'>+	ret = __btrfs_add_to_free_space_tree(trans, cache, path, cache-&gt;start,</div><div class='add'>+					     alignment);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("could not add free space");</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = __add_to_free_space_tree(trans, cache, path,</div><div class='del'>-				       cache-&gt;start + 2 * alignment, alignment);</div><div class='add'>+	ret = __btrfs_add_to_free_space_tree(trans, cache, path,</div><div class='add'>+					     cache-&gt;start + 2 * alignment, alignment);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("could not add free space");</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = __add_to_free_space_tree(trans, cache, path,</div><div class='del'>-				       cache-&gt;start + alignment, alignment);</div><div class='add'>+	ret = __btrfs_add_to_free_space_tree(trans, cache, path,</div><div class='add'>+					     cache-&gt;start + alignment, alignment);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("could not add free space");</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -382,29 +380,29 @@ static int test_merge_none(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	};</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = __remove_from_free_space_tree(trans, cache, path,</div><div class='del'>-					    cache-&gt;start, cache-&gt;length);</div><div class='add'>+	ret = __btrfs_remove_from_free_space_tree(trans, cache, path,</div><div class='add'>+						  cache-&gt;start, cache-&gt;length);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("could not remove free space");</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = __add_to_free_space_tree(trans, cache, path, cache-&gt;start,</div><div class='del'>-				       alignment);</div><div class='add'>+	ret = __btrfs_add_to_free_space_tree(trans, cache, path, cache-&gt;start,</div><div class='add'>+					     alignment);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("could not add free space");</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = __add_to_free_space_tree(trans, cache, path,</div><div class='del'>-				       cache-&gt;start + 4 * alignment, alignment);</div><div class='add'>+	ret = __btrfs_add_to_free_space_tree(trans, cache, path,</div><div class='add'>+					     cache-&gt;start + 4 * alignment, alignment);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("could not add free space");</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = __add_to_free_space_tree(trans, cache, path,</div><div class='del'>-				       cache-&gt;start + 2 * alignment, alignment);</div><div class='add'>+	ret = __btrfs_add_to_free_space_tree(trans, cache, path,</div><div class='add'>+					     cache-&gt;start + 2 * alignment, alignment);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("could not add free space");</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -446,7 +444,10 @@ static int run_test(test_func_t test_func, int bitmaps, u32 sectorsize,</div><div class='ctx'> </div><div class='ctx'> 	btrfs_set_super_compat_ro_flags(root-&gt;fs_info-&gt;super_copy,</div><div class='ctx'> 					BTRFS_FEATURE_COMPAT_RO_FREE_SPACE_TREE);</div><div class='del'>-	root-&gt;fs_info-&gt;free_space_root = root;</div><div class='add'>+	root-&gt;root_key.objectid = BTRFS_FREE_SPACE_TREE_OBJECTID;</div><div class='add'>+	root-&gt;root_key.type = BTRFS_ROOT_ITEM_KEY;</div><div class='add'>+	root-&gt;root_key.offset = 0;</div><div class='add'>+	btrfs_global_root_insert(root);</div><div class='ctx'> 	root-&gt;fs_info-&gt;tree_root = root;</div><div class='ctx'> </div><div class='ctx'> 	root-&gt;node = alloc_test_extent_buffer(root-&gt;fs_info, nodesize);</div><div class='hunk'>@@ -467,7 +468,7 @@ static int run_test(test_func_t test_func, int bitmaps, u32 sectorsize,</div><div class='ctx'> 	}</div><div class='ctx'> 	cache-&gt;bitmap_low_thresh = 0;</div><div class='ctx'> 	cache-&gt;bitmap_high_thresh = (u32)-1;</div><div class='del'>-	cache-&gt;needs_free_space = 1;</div><div class='add'>+	set_bit(BLOCK_GROUP_FLAG_NEEDS_FREE_SPACE, &amp;cache-&gt;runtime_flags);</div><div class='ctx'> 	cache-&gt;fs_info = root-&gt;fs_info;</div><div class='ctx'> </div><div class='ctx'> 	btrfs_init_dummy_trans(&amp;trans, root-&gt;fs_info);</div><div class='hunk'>@@ -479,14 +480,14 @@ static int run_test(test_func_t test_func, int bitmaps, u32 sectorsize,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = add_block_group_free_space(&amp;trans, cache);</div><div class='add'>+	ret = btrfs_add_block_group_free_space(&amp;trans, cache);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("could not add block group free space");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (bitmaps) {</div><div class='del'>-		ret = convert_free_space_to_bitmaps(&amp;trans, cache, path);</div><div class='add'>+		ret = btrfs_convert_free_space_to_bitmaps(&amp;trans, cache, path);</div><div class='ctx'> 		if (ret) {</div><div class='ctx'> 			test_err("could not convert block group to bitmaps");</div><div class='ctx'> 			goto out;</div><div class='hunk'>@@ -497,7 +498,7 @@ static int run_test(test_func_t test_func, int bitmaps, u32 sectorsize,</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	ret = remove_block_group_free_space(&amp;trans, cache);</div><div class='add'>+	ret = btrfs_remove_block_group_free_space(&amp;trans, cache);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("could not remove block group free space");</div><div class='ctx'> 		goto out;</div><div class='head'>diff --git a/fs/btrfs/tests/inode-tests.c b/fs/btrfs/tests/inode-tests.c<br/>index cac89c388131..a4c2b7748b95 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tests/inode-tests.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tests/inode-tests.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tests/inode-tests.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/tests/inode-tests.c</a></div><div class='hunk'>@@ -11,6 +11,7 @@</div><div class='ctx'> #include "../extent_io.h"</div><div class='ctx'> #include "../volumes.h"</div><div class='ctx'> #include "../compression.h"</div><div class='add'>+#include "../accessors.h"</div><div class='ctx'> </div><div class='ctx'> static void insert_extent(struct btrfs_root *root, u64 start, u64 len,</div><div class='ctx'> 			  u64 ram_bytes, u64 offset, u64 disk_bytenr,</div><div class='hunk'>@@ -33,7 +34,11 @@ static void insert_extent(struct btrfs_root *root, u64 start, u64 len,</div><div class='ctx'> 	key.type = BTRFS_EXTENT_DATA_KEY;</div><div class='ctx'> 	key.offset = start;</div><div class='ctx'> </div><div class='del'>-	btrfs_setup_item_for_insert(root, &amp;path, &amp;key, value_len);</div><div class='add'>+	/*</div><div class='add'>+	 * Passing a NULL trans handle is fine here, we have a dummy root eb</div><div class='add'>+	 * and the tree is a single node (level 0).</div><div class='add'>+	 */</div><div class='add'>+	btrfs_setup_item_for_insert(NULL, root, &amp;path, &amp;key, value_len);</div><div class='ctx'> 	fi = btrfs_item_ptr(leaf, slot, struct btrfs_file_extent_item);</div><div class='ctx'> 	btrfs_set_file_extent_generation(leaf, fi, 1);</div><div class='ctx'> 	btrfs_set_file_extent_type(leaf, fi, type);</div><div class='hunk'>@@ -63,7 +68,11 @@ static void insert_inode_item_key(struct btrfs_root *root)</div><div class='ctx'> 	key.type = BTRFS_INODE_ITEM_KEY;</div><div class='ctx'> 	key.offset = 0;</div><div class='ctx'> </div><div class='del'>-	btrfs_setup_item_for_insert(root, &amp;path, &amp;key, value_len);</div><div class='add'>+	/*</div><div class='add'>+	 * Passing a NULL trans handle is fine here, we have a dummy root eb</div><div class='add'>+	 * and the tree is a single node (level 0).</div><div class='add'>+	 */</div><div class='add'>+	btrfs_setup_item_for_insert(NULL, root, &amp;path, &amp;key, value_len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -72,8 +81,8 @@ static void insert_inode_item_key(struct btrfs_root *root)</div><div class='ctx'>  * diagram of how the extents will look though this may not be possible we still</div><div class='ctx'>  * want to make sure everything acts normally (the last number is not inclusive)</div><div class='ctx'>  *</div><div class='del'>- * [0 - 5][5 -  6][     6 - 4096     ][ 4096 - 4100][4100 - 8195][8195 - 12291]</div><div class='del'>- * [hole ][inline][hole but no extent][  hole   ][   regular ][regular1 split]</div><div class='add'>+ * [0  - 6][     6 - 4096     ][ 4096 - 4100][4100 - 8195][8195  -  12291]</div><div class='add'>+ * [inline][hole but no extent][    hole    ][   regular ][regular1 split]</div><div class='ctx'>  *</div><div class='ctx'>  * [12291 - 16387][16387 - 24579][24579 - 28675][ 28675 - 32771][32771 - 36867 ]</div><div class='ctx'>  * [    hole    ][regular1 split][   prealloc ][   prealloc1  ][prealloc1 written]</div><div class='hunk'>@@ -90,19 +99,12 @@ static void setup_file_extents(struct btrfs_root *root, u32 sectorsize)</div><div class='ctx'> 	u64 disk_bytenr = SZ_1M;</div><div class='ctx'> 	u64 offset = 0;</div><div class='ctx'> </div><div class='del'>-	/* First we want a hole */</div><div class='del'>-	insert_extent(root, offset, 5, 5, 0, 0, 0, BTRFS_FILE_EXTENT_REG, 0,</div><div class='del'>-		      slot);</div><div class='del'>-	slot++;</div><div class='del'>-	offset += 5;</div><div class='del'>-</div><div class='ctx'> 	/*</div><div class='del'>-	 * Now we want an inline extent, I don't think this is possible but hey</div><div class='del'>-	 * why not?  Also keep in mind if we have an inline extent it counts as</div><div class='del'>-	 * the whole first page.  If we were to expand it we would have to cow</div><div class='del'>-	 * and we wouldn't have an inline extent anymore.</div><div class='add'>+	 * Tree-checker has strict limits on inline extents that they can only</div><div class='add'>+	 * exist at file offset 0, thus we can only have one inline file extent</div><div class='add'>+	 * at most.</div><div class='ctx'> 	 */</div><div class='del'>-	insert_extent(root, offset, 1, 1, 0, 0, 0, BTRFS_FILE_EXTENT_INLINE, 0,</div><div class='add'>+	insert_extent(root, offset, 6, 6, 0, 0, 0, BTRFS_FILE_EXTENT_INLINE, 0,</div><div class='ctx'> 		      slot);</div><div class='ctx'> 	slot++;</div><div class='ctx'> 	offset = sectorsize;</div><div class='hunk'>@@ -115,7 +117,7 @@ static void setup_file_extents(struct btrfs_root *root, u32 sectorsize)</div><div class='ctx'> </div><div class='ctx'> 	/* Now for a regular extent */</div><div class='ctx'> 	insert_extent(root, offset, sectorsize - 1, sectorsize - 1, 0,</div><div class='del'>-		      disk_bytenr, sectorsize, BTRFS_FILE_EXTENT_REG, 0, slot);</div><div class='add'>+		      disk_bytenr, sectorsize - 1, BTRFS_FILE_EXTENT_REG, 0, slot);</div><div class='ctx'> 	slot++;</div><div class='ctx'> 	disk_bytenr += sectorsize;</div><div class='ctx'> 	offset += sectorsize - 1;</div><div class='hunk'>@@ -209,9 +211,9 @@ static void setup_file_extents(struct btrfs_root *root, u32 sectorsize)</div><div class='ctx'> 		      sectorsize, BTRFS_FILE_EXTENT_REG, 0, slot);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static unsigned long prealloc_only = 0;</div><div class='del'>-static unsigned long compressed_only = 0;</div><div class='del'>-static unsigned long vacancy_only = 0;</div><div class='add'>+static u32 prealloc_only = 0;</div><div class='add'>+static u32 compressed_only = 0;</div><div class='add'>+static u32 vacancy_only = 0;</div><div class='ctx'> </div><div class='ctx'> static noinline int test_btrfs_get_extent(u32 sectorsize, u32 nodesize)</div><div class='ctx'> {</div><div class='hunk'>@@ -256,18 +258,18 @@ static noinline int test_btrfs_get_extent(u32 sectorsize, u32 nodesize)</div><div class='ctx'> </div><div class='ctx'> 	/* First with no extents */</div><div class='ctx'> 	BTRFS_I(inode)-&gt;root = root;</div><div class='del'>-	em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, 0, sectorsize);</div><div class='add'>+	em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, sectorsize);</div><div class='ctx'> 	if (IS_ERR(em)) {</div><div class='ctx'> 		em = NULL;</div><div class='ctx'> 		test_err("got an error when we shouldn't have");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;block_start != EXTENT_MAP_HOLE) {</div><div class='del'>-		test_err("expected a hole, got %llu", em-&gt;block_start);</div><div class='add'>+	if (em-&gt;disk_bytenr != EXTENT_MAP_HOLE) {</div><div class='add'>+		test_err("expected a hole, got %llu", em-&gt;disk_bytenr);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	free_extent_map(em);</div><div class='del'>-	btrfs_drop_extent_cache(BTRFS_I(inode), 0, (u64)-1, 0);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='add'>+	btrfs_drop_extent_map_range(BTRFS_I(inode), 0, (u64)-1, false);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * All of the magic numbers are based on the mapping setup in</div><div class='hunk'>@@ -276,46 +278,34 @@ static noinline int test_btrfs_get_extent(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 	 */</div><div class='ctx'> 	setup_file_extents(root, sectorsize);</div><div class='ctx'> </div><div class='del'>-	em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, 0, (u64)-1);</div><div class='add'>+	em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, (u64)-1);</div><div class='ctx'> 	if (IS_ERR(em)) {</div><div class='ctx'> 		test_err("got an error when we shouldn't have");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;block_start != EXTENT_MAP_HOLE) {</div><div class='del'>-		test_err("expected a hole, got %llu", em-&gt;block_start);</div><div class='add'>+	if (em-&gt;disk_bytenr != EXTENT_MAP_INLINE) {</div><div class='add'>+		test_err("expected an inline, got %llu", em-&gt;disk_bytenr);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;start != 0 || em-&gt;len != 5) {</div><div class='del'>-		test_err(</div><div class='del'>-		"unexpected extent wanted start 0 len 5, got start %llu len %llu",</div><div class='del'>-			em-&gt;start, em-&gt;len);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	if (em-&gt;flags != 0) {</div><div class='del'>-		test_err("unexpected flags set, want 0 have %lu", em-&gt;flags);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	offset = em-&gt;start + em-&gt;len;</div><div class='del'>-	free_extent_map(em);</div><div class='ctx'> </div><div class='del'>-	em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, offset, sectorsize);</div><div class='del'>-	if (IS_ERR(em)) {</div><div class='del'>-		test_err("got an error when we shouldn't have");</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	if (em-&gt;block_start != EXTENT_MAP_INLINE) {</div><div class='del'>-		test_err("expected an inline, got %llu", em-&gt;block_start);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (em-&gt;start != offset || em-&gt;len != (sectorsize - 5)) {</div><div class='add'>+	/*</div><div class='add'>+	 * For inline extent, we always round up the em to sectorsize, as</div><div class='add'>+	 * they are either:</div><div class='add'>+	 *</div><div class='add'>+	 * a) a hidden hole</div><div class='add'>+	 *    The range will be zeroed at inline extent read time.</div><div class='add'>+	 *</div><div class='add'>+	 * b) a file extent with unaligned bytenr</div><div class='add'>+	 *    Tree checker will reject it.</div><div class='add'>+	 */</div><div class='add'>+	if (em-&gt;start != 0 || em-&gt;len != sectorsize) {</div><div class='ctx'> 		test_err(</div><div class='del'>-	"unexpected extent wanted start %llu len 1, got start %llu len %llu",</div><div class='del'>-			offset, em-&gt;start, em-&gt;len);</div><div class='add'>+	"unexpected extent wanted start 0 len %u, got start %llu len %llu",</div><div class='add'>+			sectorsize, em-&gt;start, em-&gt;len);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;flags != 0) {</div><div class='del'>-		test_err("unexpected flags set, want 0 have %lu", em-&gt;flags);</div><div class='add'>+		test_err("unexpected flags set, want 0 have %u", em-&gt;flags);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -324,15 +314,15 @@ static noinline int test_btrfs_get_extent(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 	 * this?</div><div class='ctx'> 	 */</div><div class='ctx'> 	offset = em-&gt;start + em-&gt;len;</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='del'>-	em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, offset, sectorsize);</div><div class='add'>+	em = btrfs_get_extent(BTRFS_I(inode), NULL, offset, sectorsize);</div><div class='ctx'> 	if (IS_ERR(em)) {</div><div class='ctx'> 		test_err("got an error when we shouldn't have");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;block_start != EXTENT_MAP_HOLE) {</div><div class='del'>-		test_err("expected a hole, got %llu", em-&gt;block_start);</div><div class='add'>+	if (em-&gt;disk_bytenr != EXTENT_MAP_HOLE) {</div><div class='add'>+		test_err("expected a hole, got %llu", em-&gt;disk_bytenr);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;start != offset || em-&gt;len != 4) {</div><div class='hunk'>@@ -342,20 +332,20 @@ static noinline int test_btrfs_get_extent(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;flags != 0) {</div><div class='del'>-		test_err("unexpected flags set, want 0 have %lu", em-&gt;flags);</div><div class='add'>+		test_err("unexpected flags set, want 0 have %u", em-&gt;flags);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	offset = em-&gt;start + em-&gt;len;</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='ctx'> 	/* Regular extent */</div><div class='del'>-	em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, offset, sectorsize);</div><div class='add'>+	em = btrfs_get_extent(BTRFS_I(inode), NULL, offset, sectorsize);</div><div class='ctx'> 	if (IS_ERR(em)) {</div><div class='ctx'> 		test_err("got an error when we shouldn't have");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;block_start &gt;= EXTENT_MAP_LAST_BYTE) {</div><div class='del'>-		test_err("expected a real extent, got %llu", em-&gt;block_start);</div><div class='add'>+	if (em-&gt;disk_bytenr &gt;= EXTENT_MAP_LAST_BYTE) {</div><div class='add'>+		test_err("expected a real extent, got %llu", em-&gt;disk_bytenr);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;start != offset || em-&gt;len != sectorsize - 1) {</div><div class='hunk'>@@ -365,25 +355,24 @@ static noinline int test_btrfs_get_extent(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;flags != 0) {</div><div class='del'>-		test_err("unexpected flags set, want 0 have %lu", em-&gt;flags);</div><div class='add'>+		test_err("unexpected flags set, want 0 have %u", em-&gt;flags);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;orig_start != em-&gt;start) {</div><div class='del'>-		test_err("wrong orig offset, want %llu, have %llu", em-&gt;start,</div><div class='del'>-			 em-&gt;orig_start);</div><div class='add'>+	if (em-&gt;offset != 0) {</div><div class='add'>+		test_err("wrong offset, want 0, have %llu", em-&gt;offset);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	offset = em-&gt;start + em-&gt;len;</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='ctx'> 	/* The next 3 are split extents */</div><div class='del'>-	em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, offset, sectorsize);</div><div class='add'>+	em = btrfs_get_extent(BTRFS_I(inode), NULL, offset, sectorsize);</div><div class='ctx'> 	if (IS_ERR(em)) {</div><div class='ctx'> 		test_err("got an error when we shouldn't have");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;block_start &gt;= EXTENT_MAP_LAST_BYTE) {</div><div class='del'>-		test_err("expected a real extent, got %llu", em-&gt;block_start);</div><div class='add'>+	if (em-&gt;disk_bytenr &gt;= EXTENT_MAP_LAST_BYTE) {</div><div class='add'>+		test_err("expected a real extent, got %llu", em-&gt;disk_bytenr);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;start != offset || em-&gt;len != sectorsize) {</div><div class='hunk'>@@ -393,26 +382,25 @@ static noinline int test_btrfs_get_extent(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;flags != 0) {</div><div class='del'>-		test_err("unexpected flags set, want 0 have %lu", em-&gt;flags);</div><div class='add'>+		test_err("unexpected flags set, want 0 have %u", em-&gt;flags);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;orig_start != em-&gt;start) {</div><div class='del'>-		test_err("wrong orig offset, want %llu, have %llu", em-&gt;start,</div><div class='del'>-			 em-&gt;orig_start);</div><div class='add'>+	if (em-&gt;offset != 0) {</div><div class='add'>+		test_err("wrong offset, want 0, have %llu", em-&gt;offset);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	disk_bytenr = em-&gt;block_start;</div><div class='add'>+	disk_bytenr = btrfs_extent_map_block_start(em);</div><div class='ctx'> 	orig_start = em-&gt;start;</div><div class='ctx'> 	offset = em-&gt;start + em-&gt;len;</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='del'>-	em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, offset, sectorsize);</div><div class='add'>+	em = btrfs_get_extent(BTRFS_I(inode), NULL, offset, sectorsize);</div><div class='ctx'> 	if (IS_ERR(em)) {</div><div class='ctx'> 		test_err("got an error when we shouldn't have");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;block_start != EXTENT_MAP_HOLE) {</div><div class='del'>-		test_err("expected a hole, got %llu", em-&gt;block_start);</div><div class='add'>+	if (em-&gt;disk_bytenr != EXTENT_MAP_HOLE) {</div><div class='add'>+		test_err("expected a hole, got %llu", em-&gt;disk_bytenr);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;start != offset || em-&gt;len != sectorsize) {</div><div class='hunk'>@@ -422,19 +410,19 @@ static noinline int test_btrfs_get_extent(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;flags != 0) {</div><div class='del'>-		test_err("unexpected flags set, want 0 have %lu", em-&gt;flags);</div><div class='add'>+		test_err("unexpected flags set, want 0 have %u", em-&gt;flags);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	offset = em-&gt;start + em-&gt;len;</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='del'>-	em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, offset, sectorsize);</div><div class='add'>+	em = btrfs_get_extent(BTRFS_I(inode), NULL, offset, sectorsize);</div><div class='ctx'> 	if (IS_ERR(em)) {</div><div class='ctx'> 		test_err("got an error when we shouldn't have");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;block_start &gt;= EXTENT_MAP_LAST_BYTE) {</div><div class='del'>-		test_err("expected a real extent, got %llu", em-&gt;block_start);</div><div class='add'>+	if (em-&gt;disk_bytenr &gt;= EXTENT_MAP_LAST_BYTE) {</div><div class='add'>+		test_err("expected a real extent, got %llu", em-&gt;disk_bytenr);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;start != offset || em-&gt;len != 2 * sectorsize) {</div><div class='hunk'>@@ -444,31 +432,31 @@ static noinline int test_btrfs_get_extent(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;flags != 0) {</div><div class='del'>-		test_err("unexpected flags set, want 0 have %lu", em-&gt;flags);</div><div class='add'>+		test_err("unexpected flags set, want 0 have %u", em-&gt;flags);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;orig_start != orig_start) {</div><div class='del'>-		test_err("wrong orig offset, want %llu, have %llu",</div><div class='del'>-			 orig_start, em-&gt;orig_start);</div><div class='add'>+	if (em-&gt;start - em-&gt;offset != orig_start) {</div><div class='add'>+		test_err("wrong offset, em-&gt;start=%llu em-&gt;offset=%llu orig_start=%llu",</div><div class='add'>+			 em-&gt;start, em-&gt;offset, orig_start);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	disk_bytenr += (em-&gt;start - orig_start);</div><div class='del'>-	if (em-&gt;block_start != disk_bytenr) {</div><div class='add'>+	if (btrfs_extent_map_block_start(em) != disk_bytenr) {</div><div class='ctx'> 		test_err("wrong block start, want %llu, have %llu",</div><div class='del'>-			 disk_bytenr, em-&gt;block_start);</div><div class='add'>+			 disk_bytenr, btrfs_extent_map_block_start(em));</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	offset = em-&gt;start + em-&gt;len;</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='ctx'> 	/* Prealloc extent */</div><div class='del'>-	em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, offset, sectorsize);</div><div class='add'>+	em = btrfs_get_extent(BTRFS_I(inode), NULL, offset, sectorsize);</div><div class='ctx'> 	if (IS_ERR(em)) {</div><div class='ctx'> 		test_err("got an error when we shouldn't have");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;block_start &gt;= EXTENT_MAP_LAST_BYTE) {</div><div class='del'>-		test_err("expected a real extent, got %llu", em-&gt;block_start);</div><div class='add'>+	if (em-&gt;disk_bytenr &gt;= EXTENT_MAP_LAST_BYTE) {</div><div class='add'>+		test_err("expected a real extent, got %llu", em-&gt;disk_bytenr);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;start != offset || em-&gt;len != sectorsize) {</div><div class='hunk'>@@ -478,26 +466,25 @@ static noinline int test_btrfs_get_extent(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;flags != prealloc_only) {</div><div class='del'>-		test_err("unexpected flags set, want %lu have %lu",</div><div class='add'>+		test_err("unexpected flags set, want %u have %u",</div><div class='ctx'> 			 prealloc_only, em-&gt;flags);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;orig_start != em-&gt;start) {</div><div class='del'>-		test_err("wrong orig offset, want %llu, have %llu", em-&gt;start,</div><div class='del'>-			 em-&gt;orig_start);</div><div class='add'>+	if (em-&gt;offset != 0) {</div><div class='add'>+		test_err("wrong offset, want 0, have %llu", em-&gt;offset);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	offset = em-&gt;start + em-&gt;len;</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='ctx'> 	/* The next 3 are a half written prealloc extent */</div><div class='del'>-	em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, offset, sectorsize);</div><div class='add'>+	em = btrfs_get_extent(BTRFS_I(inode), NULL, offset, sectorsize);</div><div class='ctx'> 	if (IS_ERR(em)) {</div><div class='ctx'> 		test_err("got an error when we shouldn't have");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;block_start &gt;= EXTENT_MAP_LAST_BYTE) {</div><div class='del'>-		test_err("expected a real extent, got %llu", em-&gt;block_start);</div><div class='add'>+	if (em-&gt;disk_bytenr &gt;= EXTENT_MAP_LAST_BYTE) {</div><div class='add'>+		test_err("expected a real extent, got %llu", em-&gt;disk_bytenr);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;start != offset || em-&gt;len != sectorsize) {</div><div class='hunk'>@@ -507,27 +494,26 @@ static noinline int test_btrfs_get_extent(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;flags != prealloc_only) {</div><div class='del'>-		test_err("unexpected flags set, want %lu have %lu",</div><div class='add'>+		test_err("unexpected flags set, want %u have %u",</div><div class='ctx'> 			 prealloc_only, em-&gt;flags);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;orig_start != em-&gt;start) {</div><div class='del'>-		test_err("wrong orig offset, want %llu, have %llu", em-&gt;start,</div><div class='del'>-			 em-&gt;orig_start);</div><div class='add'>+	if (em-&gt;offset != 0) {</div><div class='add'>+		test_err("wrong offset, want 0, have %llu", em-&gt;offset);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	disk_bytenr = em-&gt;block_start;</div><div class='add'>+	disk_bytenr = btrfs_extent_map_block_start(em);</div><div class='ctx'> 	orig_start = em-&gt;start;</div><div class='ctx'> 	offset = em-&gt;start + em-&gt;len;</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='del'>-	em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, offset, sectorsize);</div><div class='add'>+	em = btrfs_get_extent(BTRFS_I(inode), NULL, offset, sectorsize);</div><div class='ctx'> 	if (IS_ERR(em)) {</div><div class='ctx'> 		test_err("got an error when we shouldn't have");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;block_start &gt;= EXTENT_MAP_HOLE) {</div><div class='del'>-		test_err("expected a real extent, got %llu", em-&gt;block_start);</div><div class='add'>+	if (em-&gt;disk_bytenr &gt;= EXTENT_MAP_HOLE) {</div><div class='add'>+		test_err("expected a real extent, got %llu", em-&gt;disk_bytenr);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;start != offset || em-&gt;len != sectorsize) {</div><div class='hunk'>@@ -537,30 +523,29 @@ static noinline int test_btrfs_get_extent(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;flags != 0) {</div><div class='del'>-		test_err("unexpected flags set, want 0 have %lu", em-&gt;flags);</div><div class='add'>+		test_err("unexpected flags set, want 0 have %u", em-&gt;flags);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;orig_start != orig_start) {</div><div class='del'>-		test_err("unexpected orig offset, wanted %llu, have %llu",</div><div class='del'>-			 orig_start, em-&gt;orig_start);</div><div class='add'>+	if (em-&gt;start - em-&gt;offset != orig_start) {</div><div class='add'>+		test_err("unexpected offset, wanted %llu, have %llu",</div><div class='add'>+			 em-&gt;start - orig_start, em-&gt;offset);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;block_start != (disk_bytenr + (em-&gt;start - em-&gt;orig_start))) {</div><div class='add'>+	if (btrfs_extent_map_block_start(em) != disk_bytenr + em-&gt;offset) {</div><div class='ctx'> 		test_err("unexpected block start, wanted %llu, have %llu",</div><div class='del'>-			 disk_bytenr + (em-&gt;start - em-&gt;orig_start),</div><div class='del'>-			 em-&gt;block_start);</div><div class='add'>+			 disk_bytenr + em-&gt;offset, btrfs_extent_map_block_start(em));</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	offset = em-&gt;start + em-&gt;len;</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='del'>-	em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, offset, sectorsize);</div><div class='add'>+	em = btrfs_get_extent(BTRFS_I(inode), NULL, offset, sectorsize);</div><div class='ctx'> 	if (IS_ERR(em)) {</div><div class='ctx'> 		test_err("got an error when we shouldn't have");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;block_start &gt;= EXTENT_MAP_LAST_BYTE) {</div><div class='del'>-		test_err("expected a real extent, got %llu", em-&gt;block_start);</div><div class='add'>+	if (em-&gt;disk_bytenr &gt;= EXTENT_MAP_LAST_BYTE) {</div><div class='add'>+		test_err("expected a real extent, got %llu", em-&gt;disk_bytenr);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;start != offset || em-&gt;len != 2 * sectorsize) {</div><div class='hunk'>@@ -570,32 +555,31 @@ static noinline int test_btrfs_get_extent(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;flags != prealloc_only) {</div><div class='del'>-		test_err("unexpected flags set, want %lu have %lu",</div><div class='add'>+		test_err("unexpected flags set, want %u have %u",</div><div class='ctx'> 			 prealloc_only, em-&gt;flags);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;orig_start != orig_start) {</div><div class='del'>-		test_err("wrong orig offset, want %llu, have %llu", orig_start,</div><div class='del'>-			 em-&gt;orig_start);</div><div class='add'>+	if (em-&gt;start - em-&gt;offset != orig_start) {</div><div class='add'>+		test_err("wrong offset, em-&gt;start=%llu em-&gt;offset=%llu orig_start=%llu",</div><div class='add'>+			 em-&gt;start, em-&gt;offset, orig_start);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;block_start != (disk_bytenr + (em-&gt;start - em-&gt;orig_start))) {</div><div class='add'>+	if (btrfs_extent_map_block_start(em) != disk_bytenr + em-&gt;offset) {</div><div class='ctx'> 		test_err("unexpected block start, wanted %llu, have %llu",</div><div class='del'>-			 disk_bytenr + (em-&gt;start - em-&gt;orig_start),</div><div class='del'>-			 em-&gt;block_start);</div><div class='add'>+			 disk_bytenr + em-&gt;offset, btrfs_extent_map_block_start(em));</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	offset = em-&gt;start + em-&gt;len;</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='ctx'> 	/* Now for the compressed extent */</div><div class='del'>-	em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, offset, sectorsize);</div><div class='add'>+	em = btrfs_get_extent(BTRFS_I(inode), NULL, offset, sectorsize);</div><div class='ctx'> 	if (IS_ERR(em)) {</div><div class='ctx'> 		test_err("got an error when we shouldn't have");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;block_start &gt;= EXTENT_MAP_LAST_BYTE) {</div><div class='del'>-		test_err("expected a real extent, got %llu", em-&gt;block_start);</div><div class='add'>+	if (em-&gt;disk_bytenr &gt;= EXTENT_MAP_LAST_BYTE) {</div><div class='add'>+		test_err("expected a real extent, got %llu", em-&gt;disk_bytenr);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;start != offset || em-&gt;len != 2 * sectorsize) {</div><div class='hunk'>@@ -605,31 +589,30 @@ static noinline int test_btrfs_get_extent(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;flags != compressed_only) {</div><div class='del'>-		test_err("unexpected flags set, want %lu have %lu",</div><div class='add'>+		test_err("unexpected flags set, want %u have %u",</div><div class='ctx'> 			 compressed_only, em-&gt;flags);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;orig_start != em-&gt;start) {</div><div class='del'>-		test_err("wrong orig offset, want %llu, have %llu",</div><div class='del'>-			 em-&gt;start, em-&gt;orig_start);</div><div class='add'>+	if (em-&gt;offset != 0) {</div><div class='add'>+		test_err("wrong offset, want 0, have %llu", em-&gt;offset);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;compress_type != BTRFS_COMPRESS_ZLIB) {</div><div class='add'>+	if (btrfs_extent_map_compression(em) != BTRFS_COMPRESS_ZLIB) {</div><div class='ctx'> 		test_err("unexpected compress type, wanted %d, got %d",</div><div class='del'>-			 BTRFS_COMPRESS_ZLIB, em-&gt;compress_type);</div><div class='add'>+			 BTRFS_COMPRESS_ZLIB, btrfs_extent_map_compression(em));</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	offset = em-&gt;start + em-&gt;len;</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='ctx'> 	/* Split compressed extent */</div><div class='del'>-	em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, offset, sectorsize);</div><div class='add'>+	em = btrfs_get_extent(BTRFS_I(inode), NULL, offset, sectorsize);</div><div class='ctx'> 	if (IS_ERR(em)) {</div><div class='ctx'> 		test_err("got an error when we shouldn't have");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;block_start &gt;= EXTENT_MAP_LAST_BYTE) {</div><div class='del'>-		test_err("expected a real extent, got %llu", em-&gt;block_start);</div><div class='add'>+	if (em-&gt;disk_bytenr &gt;= EXTENT_MAP_LAST_BYTE) {</div><div class='add'>+		test_err("expected a real extent, got %llu", em-&gt;disk_bytenr);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;start != offset || em-&gt;len != sectorsize) {</div><div class='hunk'>@@ -639,32 +622,31 @@ static noinline int test_btrfs_get_extent(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;flags != compressed_only) {</div><div class='del'>-		test_err("unexpected flags set, want %lu have %lu",</div><div class='add'>+		test_err("unexpected flags set, want %u have %u",</div><div class='ctx'> 			 compressed_only, em-&gt;flags);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;orig_start != em-&gt;start) {</div><div class='del'>-		test_err("wrong orig offset, want %llu, have %llu",</div><div class='del'>-			 em-&gt;start, em-&gt;orig_start);</div><div class='add'>+	if (em-&gt;offset != 0) {</div><div class='add'>+		test_err("wrong offset, want 0, have %llu", em-&gt;offset);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;compress_type != BTRFS_COMPRESS_ZLIB) {</div><div class='add'>+	if (btrfs_extent_map_compression(em) != BTRFS_COMPRESS_ZLIB) {</div><div class='ctx'> 		test_err("unexpected compress type, wanted %d, got %d",</div><div class='del'>-			 BTRFS_COMPRESS_ZLIB, em-&gt;compress_type);</div><div class='add'>+			 BTRFS_COMPRESS_ZLIB, btrfs_extent_map_compression(em));</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	disk_bytenr = em-&gt;block_start;</div><div class='add'>+	disk_bytenr = btrfs_extent_map_block_start(em);</div><div class='ctx'> 	orig_start = em-&gt;start;</div><div class='ctx'> 	offset = em-&gt;start + em-&gt;len;</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='del'>-	em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, offset, sectorsize);</div><div class='add'>+	em = btrfs_get_extent(BTRFS_I(inode), NULL, offset, sectorsize);</div><div class='ctx'> 	if (IS_ERR(em)) {</div><div class='ctx'> 		test_err("got an error when we shouldn't have");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;block_start &gt;= EXTENT_MAP_LAST_BYTE) {</div><div class='del'>-		test_err("expected a real extent, got %llu", em-&gt;block_start);</div><div class='add'>+	if (em-&gt;disk_bytenr &gt;= EXTENT_MAP_LAST_BYTE) {</div><div class='add'>+		test_err("expected a real extent, got %llu", em-&gt;disk_bytenr);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;start != offset || em-&gt;len != sectorsize) {</div><div class='hunk'>@@ -674,25 +656,24 @@ static noinline int test_btrfs_get_extent(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;flags != 0) {</div><div class='del'>-		test_err("unexpected flags set, want 0 have %lu", em-&gt;flags);</div><div class='add'>+		test_err("unexpected flags set, want 0 have %u", em-&gt;flags);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;orig_start != em-&gt;start) {</div><div class='del'>-		test_err("wrong orig offset, want %llu, have %llu", em-&gt;start,</div><div class='del'>-			 em-&gt;orig_start);</div><div class='add'>+	if (em-&gt;offset != 0) {</div><div class='add'>+		test_err("wrong offset, want 0, have %llu", em-&gt;offset);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	offset = em-&gt;start + em-&gt;len;</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='del'>-	em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, offset, sectorsize);</div><div class='add'>+	em = btrfs_get_extent(BTRFS_I(inode), NULL, offset, sectorsize);</div><div class='ctx'> 	if (IS_ERR(em)) {</div><div class='ctx'> 		test_err("got an error when we shouldn't have");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;block_start != disk_bytenr) {</div><div class='add'>+	if (btrfs_extent_map_block_start(em) != disk_bytenr) {</div><div class='ctx'> 		test_err("block start does not match, want %llu got %llu",</div><div class='del'>-			 disk_bytenr, em-&gt;block_start);</div><div class='add'>+			 disk_bytenr, btrfs_extent_map_block_start(em));</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;start != offset || em-&gt;len != 2 * sectorsize) {</div><div class='hunk'>@@ -702,31 +683,31 @@ static noinline int test_btrfs_get_extent(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;flags != compressed_only) {</div><div class='del'>-		test_err("unexpected flags set, want %lu have %lu",</div><div class='add'>+		test_err("unexpected flags set, want %u have %u",</div><div class='ctx'> 			 compressed_only, em-&gt;flags);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;orig_start != orig_start) {</div><div class='del'>-		test_err("wrong orig offset, want %llu, have %llu",</div><div class='del'>-			 em-&gt;start, orig_start);</div><div class='add'>+	if (em-&gt;start - em-&gt;offset != orig_start) {</div><div class='add'>+		test_err("wrong offset, em-&gt;start=%llu em-&gt;offset=%llu orig_start=%llu",</div><div class='add'>+			 em-&gt;start, em-&gt;offset, orig_start);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;compress_type != BTRFS_COMPRESS_ZLIB) {</div><div class='add'>+	if (btrfs_extent_map_compression(em) != BTRFS_COMPRESS_ZLIB) {</div><div class='ctx'> 		test_err("unexpected compress type, wanted %d, got %d",</div><div class='del'>-			 BTRFS_COMPRESS_ZLIB, em-&gt;compress_type);</div><div class='add'>+			 BTRFS_COMPRESS_ZLIB, btrfs_extent_map_compression(em));</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	offset = em-&gt;start + em-&gt;len;</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='ctx'> 	/* A hole between regular extents but no hole extent */</div><div class='del'>-	em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, offset + 6, sectorsize);</div><div class='add'>+	em = btrfs_get_extent(BTRFS_I(inode), NULL, offset + 6, sectorsize);</div><div class='ctx'> 	if (IS_ERR(em)) {</div><div class='ctx'> 		test_err("got an error when we shouldn't have");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;block_start &gt;= EXTENT_MAP_LAST_BYTE) {</div><div class='del'>-		test_err("expected a real extent, got %llu", em-&gt;block_start);</div><div class='add'>+	if (em-&gt;disk_bytenr &gt;= EXTENT_MAP_LAST_BYTE) {</div><div class='add'>+		test_err("expected a real extent, got %llu", em-&gt;disk_bytenr);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;start != offset || em-&gt;len != sectorsize) {</div><div class='hunk'>@@ -736,24 +717,23 @@ static noinline int test_btrfs_get_extent(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;flags != 0) {</div><div class='del'>-		test_err("unexpected flags set, want 0 have %lu", em-&gt;flags);</div><div class='add'>+		test_err("unexpected flags set, want 0 have %u", em-&gt;flags);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;orig_start != em-&gt;start) {</div><div class='del'>-		test_err("wrong orig offset, want %llu, have %llu", em-&gt;start,</div><div class='del'>-			 em-&gt;orig_start);</div><div class='add'>+	if (em-&gt;offset != 0) {</div><div class='add'>+		test_err("wrong offset, want 0, have %llu", em-&gt;offset);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	offset = em-&gt;start + em-&gt;len;</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='del'>-	em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, offset, SZ_4M);</div><div class='add'>+	em = btrfs_get_extent(BTRFS_I(inode), NULL, offset, SZ_4M);</div><div class='ctx'> 	if (IS_ERR(em)) {</div><div class='ctx'> 		test_err("got an error when we shouldn't have");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;block_start != EXTENT_MAP_HOLE) {</div><div class='del'>-		test_err("expected a hole extent, got %llu", em-&gt;block_start);</div><div class='add'>+	if (em-&gt;disk_bytenr != EXTENT_MAP_HOLE) {</div><div class='add'>+		test_err("expected a hole extent, got %llu", em-&gt;disk_bytenr);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -768,25 +748,24 @@ static noinline int test_btrfs_get_extent(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;flags != vacancy_only) {</div><div class='del'>-		test_err("unexpected flags set, want %lu have %lu",</div><div class='add'>+		test_err("unexpected flags set, want %u have %u",</div><div class='ctx'> 			 vacancy_only, em-&gt;flags);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;orig_start != em-&gt;start) {</div><div class='del'>-		test_err("wrong orig offset, want %llu, have %llu", em-&gt;start,</div><div class='del'>-			 em-&gt;orig_start);</div><div class='add'>+	if (em-&gt;offset != 0) {</div><div class='add'>+		test_err("wrong offset, want 0, have %llu", em-&gt;offset);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	offset = em-&gt;start + em-&gt;len;</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='del'>-	em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, offset, sectorsize);</div><div class='add'>+	em = btrfs_get_extent(BTRFS_I(inode), NULL, offset, sectorsize);</div><div class='ctx'> 	if (IS_ERR(em)) {</div><div class='ctx'> 		test_err("got an error when we shouldn't have");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;block_start &gt;= EXTENT_MAP_LAST_BYTE) {</div><div class='del'>-		test_err("expected a real extent, got %llu", em-&gt;block_start);</div><div class='add'>+	if (em-&gt;disk_bytenr &gt;= EXTENT_MAP_LAST_BYTE) {</div><div class='add'>+		test_err("expected a real extent, got %llu", em-&gt;disk_bytenr);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;start != offset || em-&gt;len != sectorsize) {</div><div class='hunk'>@@ -796,18 +775,17 @@ static noinline int test_btrfs_get_extent(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;flags != 0) {</div><div class='del'>-		test_err("unexpected flags set, want 0 have %lu", em-&gt;flags);</div><div class='add'>+		test_err("unexpected flags set, want 0 have %u", em-&gt;flags);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;orig_start != em-&gt;start) {</div><div class='del'>-		test_err("wrong orig offset, want %llu, have %llu", em-&gt;start,</div><div class='del'>-			 em-&gt;orig_start);</div><div class='add'>+	if (em-&gt;offset != 0) {</div><div class='add'>+		test_err("wrong orig offset, want 0, have %llu", em-&gt;offset);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	ret = 0;</div><div class='ctx'> out:</div><div class='ctx'> 	if (!IS_ERR(em))</div><div class='del'>-		free_extent_map(em);</div><div class='add'>+		btrfs_free_extent_map(em);</div><div class='ctx'> 	iput(inode);</div><div class='ctx'> 	btrfs_free_dummy_root(root);</div><div class='ctx'> 	btrfs_free_dummy_fs_info(fs_info);</div><div class='hunk'>@@ -860,13 +838,13 @@ static int test_hole_first(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 	insert_inode_item_key(root);</div><div class='ctx'> 	insert_extent(root, sectorsize, sectorsize, sectorsize, 0, sectorsize,</div><div class='ctx'> 		      sectorsize, BTRFS_FILE_EXTENT_REG, 0, 1);</div><div class='del'>-	em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, 0, 2 * sectorsize);</div><div class='add'>+	em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, 2 * sectorsize);</div><div class='ctx'> 	if (IS_ERR(em)) {</div><div class='ctx'> 		test_err("got an error when we shouldn't have");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;block_start != EXTENT_MAP_HOLE) {</div><div class='del'>-		test_err("expected a hole, got %llu", em-&gt;block_start);</div><div class='add'>+	if (em-&gt;disk_bytenr != EXTENT_MAP_HOLE) {</div><div class='add'>+		test_err("expected a hole, got %llu", em-&gt;disk_bytenr);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;start != 0 || em-&gt;len != sectorsize) {</div><div class='hunk'>@@ -876,19 +854,20 @@ static int test_hole_first(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;flags != vacancy_only) {</div><div class='del'>-		test_err("wrong flags, wanted %lu, have %lu", vacancy_only,</div><div class='add'>+		test_err("wrong flags, wanted %u, have %u", vacancy_only,</div><div class='ctx'> 			 em-&gt;flags);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='ctx'> </div><div class='del'>-	em = btrfs_get_extent(BTRFS_I(inode), NULL, 0, sectorsize, 2 * sectorsize);</div><div class='add'>+	em = btrfs_get_extent(BTRFS_I(inode), NULL, sectorsize, 2 * sectorsize);</div><div class='ctx'> 	if (IS_ERR(em)) {</div><div class='ctx'> 		test_err("got an error when we shouldn't have");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (em-&gt;block_start != sectorsize) {</div><div class='del'>-		test_err("expected a real extent, got %llu", em-&gt;block_start);</div><div class='add'>+	if (btrfs_extent_map_block_start(em) != sectorsize) {</div><div class='add'>+		test_err("expected a real extent, got %llu",</div><div class='add'>+			 btrfs_extent_map_block_start(em));</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;start != sectorsize || em-&gt;len != sectorsize) {</div><div class='hunk'>@@ -898,14 +877,14 @@ static int test_hole_first(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (em-&gt;flags != 0) {</div><div class='del'>-		test_err("unexpected flags set, wanted 0 got %lu",</div><div class='add'>+		test_err("unexpected flags set, wanted 0 got %u",</div><div class='ctx'> 			 em-&gt;flags);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	ret = 0;</div><div class='ctx'> out:</div><div class='ctx'> 	if (!IS_ERR(em))</div><div class='del'>-		free_extent_map(em);</div><div class='add'>+		btrfs_free_extent_map(em);</div><div class='ctx'> 	iput(inode);</div><div class='ctx'> 	btrfs_free_dummy_root(root);</div><div class='ctx'> 	btrfs_free_dummy_fs_info(fs_info);</div><div class='hunk'>@@ -971,11 +950,10 @@ static int test_extent_accounting(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* [BTRFS_MAX_EXTENT_SIZE/2][sectorsize HOLE][the rest] */</div><div class='del'>-	ret = clear_extent_bit(&amp;BTRFS_I(inode)-&gt;io_tree,</div><div class='del'>-			       BTRFS_MAX_EXTENT_SIZE &gt;&gt; 1,</div><div class='del'>-			       (BTRFS_MAX_EXTENT_SIZE &gt;&gt; 1) + sectorsize - 1,</div><div class='del'>-			       EXTENT_DELALLOC | EXTENT_DELALLOC_NEW |</div><div class='del'>-			       EXTENT_UPTODATE, 0, 0, NULL);</div><div class='add'>+	ret = btrfs_clear_extent_bit(&amp;BTRFS_I(inode)-&gt;io_tree,</div><div class='add'>+				     BTRFS_MAX_EXTENT_SIZE &gt;&gt; 1,</div><div class='add'>+				     (BTRFS_MAX_EXTENT_SIZE &gt;&gt; 1) + sectorsize - 1,</div><div class='add'>+				     EXTENT_DELALLOC | EXTENT_DELALLOC_NEW, NULL);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("clear_extent_bit returned %d", ret);</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -1039,11 +1017,10 @@ static int test_extent_accounting(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* [BTRFS_MAX_EXTENT_SIZE+4k][4K HOLE][BTRFS_MAX_EXTENT_SIZE+4k] */</div><div class='del'>-	ret = clear_extent_bit(&amp;BTRFS_I(inode)-&gt;io_tree,</div><div class='del'>-			       BTRFS_MAX_EXTENT_SIZE + sectorsize,</div><div class='del'>-			       BTRFS_MAX_EXTENT_SIZE + 2 * sectorsize - 1,</div><div class='del'>-			       EXTENT_DELALLOC | EXTENT_DELALLOC_NEW |</div><div class='del'>-			       EXTENT_UPTODATE, 0, 0, NULL);</div><div class='add'>+	ret = btrfs_clear_extent_bit(&amp;BTRFS_I(inode)-&gt;io_tree,</div><div class='add'>+				     BTRFS_MAX_EXTENT_SIZE + sectorsize,</div><div class='add'>+				     BTRFS_MAX_EXTENT_SIZE + 2 * sectorsize - 1,</div><div class='add'>+				     EXTENT_DELALLOC | EXTENT_DELALLOC_NEW, NULL);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("clear_extent_bit returned %d", ret);</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -1074,9 +1051,8 @@ static int test_extent_accounting(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Empty */</div><div class='del'>-	ret = clear_extent_bit(&amp;BTRFS_I(inode)-&gt;io_tree, 0, (u64)-1,</div><div class='del'>-			       EXTENT_DELALLOC | EXTENT_DELALLOC_NEW |</div><div class='del'>-			       EXTENT_UPTODATE, 0, 0, NULL);</div><div class='add'>+	ret = btrfs_clear_extent_bit(&amp;BTRFS_I(inode)-&gt;io_tree, 0, (u64)-1,</div><div class='add'>+				     EXTENT_DELALLOC | EXTENT_DELALLOC_NEW, NULL);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("clear_extent_bit returned %d", ret);</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -1090,9 +1066,8 @@ static int test_extent_accounting(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 	ret = 0;</div><div class='ctx'> out:</div><div class='ctx'> 	if (ret)</div><div class='del'>-		clear_extent_bit(&amp;BTRFS_I(inode)-&gt;io_tree, 0, (u64)-1,</div><div class='del'>-				 EXTENT_DELALLOC | EXTENT_DELALLOC_NEW |</div><div class='del'>-				 EXTENT_UPTODATE, 0, 0, NULL);</div><div class='add'>+		btrfs_clear_extent_bit(&amp;BTRFS_I(inode)-&gt;io_tree, 0, (u64)-1,</div><div class='add'>+				       EXTENT_DELALLOC | EXTENT_DELALLOC_NEW, NULL);</div><div class='ctx'> 	iput(inode);</div><div class='ctx'> 	btrfs_free_dummy_root(root);</div><div class='ctx'> 	btrfs_free_dummy_fs_info(fs_info);</div><div class='hunk'>@@ -1105,8 +1080,8 @@ int btrfs_test_inodes(u32 sectorsize, u32 nodesize)</div><div class='ctx'> </div><div class='ctx'> 	test_msg("running inode tests");</div><div class='ctx'> </div><div class='del'>-	set_bit(EXTENT_FLAG_COMPRESSED, &amp;compressed_only);</div><div class='del'>-	set_bit(EXTENT_FLAG_PREALLOC, &amp;prealloc_only);</div><div class='add'>+	compressed_only |= EXTENT_FLAG_COMPRESS_ZLIB;</div><div class='add'>+	prealloc_only |= EXTENT_FLAG_PREALLOC;</div><div class='ctx'> </div><div class='ctx'> 	ret = test_btrfs_get_extent(sectorsize, nodesize);</div><div class='ctx'> 	if (ret)</div><div class='head'>diff --git a/fs/btrfs/tests/qgroup-tests.c b/fs/btrfs/tests/qgroup-tests.c<br/>index 19ba7d5b7d8f..05cfda8af422 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tests/qgroup-tests.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tests/qgroup-tests.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tests/qgroup-tests.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/tests/qgroup-tests.c</a></div><div class='hunk'>@@ -10,6 +10,8 @@</div><div class='ctx'> #include "../disk-io.h"</div><div class='ctx'> #include "../qgroup.h"</div><div class='ctx'> #include "../backref.h"</div><div class='add'>+#include "../fs.h"</div><div class='add'>+#include "../accessors.h"</div><div class='ctx'> </div><div class='ctx'> static int insert_normal_tree_ref(struct btrfs_root *root, u64 bytenr,</div><div class='ctx'> 				  u64 num_bytes, u64 parent, u64 root_objectid)</div><div class='hunk'>@@ -18,7 +20,7 @@ static int insert_normal_tree_ref(struct btrfs_root *root, u64 bytenr,</div><div class='ctx'> 	struct btrfs_extent_item *item;</div><div class='ctx'> 	struct btrfs_extent_inline_ref *iref;</div><div class='ctx'> 	struct btrfs_tree_block_info *block_info;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_key ins;</div><div class='ctx'> 	u32 size = sizeof(*item) + sizeof(*iref) + sizeof(*block_info);</div><div class='hunk'>@@ -39,7 +41,6 @@ static int insert_normal_tree_ref(struct btrfs_root *root, u64 bytenr,</div><div class='ctx'> 	ret = btrfs_insert_empty_item(&amp;trans, root, path, &amp;ins, size);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("couldn't insert ref %d", ret);</div><div class='del'>-		btrfs_free_path(path);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -59,7 +60,6 @@ static int insert_normal_tree_ref(struct btrfs_root *root, u64 bytenr,</div><div class='ctx'> 		btrfs_set_extent_inline_ref_type(leaf, iref, BTRFS_TREE_BLOCK_REF_KEY);</div><div class='ctx'> 		btrfs_set_extent_inline_ref_offset(leaf, iref, root_objectid);</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -68,7 +68,7 @@ static int add_tree_ref(struct btrfs_root *root, u64 bytenr, u64 num_bytes,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_trans_handle trans;</div><div class='ctx'> 	struct btrfs_extent_item *item;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	u64 refs;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -88,7 +88,6 @@ static int add_tree_ref(struct btrfs_root *root, u64 bytenr, u64 num_bytes,</div><div class='ctx'> 	ret = btrfs_search_slot(&amp;trans, root, &amp;key, path, 0, 1);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("couldn't find extent ref");</div><div class='del'>-		btrfs_free_path(path);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -110,7 +109,6 @@ static int add_tree_ref(struct btrfs_root *root, u64 bytenr, u64 num_bytes,</div><div class='ctx'> 	ret = btrfs_insert_empty_item(&amp;trans, root, path, &amp;key, 0);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		test_err("failed to insert backref");</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -119,7 +117,7 @@ static int remove_extent_item(struct btrfs_root *root, u64 bytenr,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_trans_handle trans;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	btrfs_init_dummy_trans(&amp;trans, NULL);</div><div class='hunk'>@@ -137,11 +135,9 @@ static int remove_extent_item(struct btrfs_root *root, u64 bytenr,</div><div class='ctx'> 	ret = btrfs_search_slot(&amp;trans, root, &amp;key, path, -1, 1);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("didn't find our key %d", ret);</div><div class='del'>-		btrfs_free_path(path);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> 	btrfs_del_item(&amp;trans, root, path);</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -150,7 +146,7 @@ static int remove_extent_ref(struct btrfs_root *root, u64 bytenr,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_trans_handle trans;</div><div class='ctx'> 	struct btrfs_extent_item *item;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	u64 refs;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -170,7 +166,6 @@ static int remove_extent_ref(struct btrfs_root *root, u64 bytenr,</div><div class='ctx'> 	ret = btrfs_search_slot(&amp;trans, root, &amp;key, path, 0, 1);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		test_err("couldn't find extent ref");</div><div class='del'>-		btrfs_free_path(path);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -196,13 +191,13 @@ static int remove_extent_ref(struct btrfs_root *root, u64 bytenr,</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> 	btrfs_del_item(&amp;trans, root, path);</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int test_no_shared_qgroup(struct btrfs_root *root,</div><div class='ctx'> 		u32 sectorsize, u32 nodesize)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_backref_walk_ctx ctx = { 0 };</div><div class='ctx'> 	struct btrfs_trans_handle trans;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct ulist *old_roots = NULL;</div><div class='hunk'>@@ -218,30 +213,38 @@ static int test_no_shared_qgroup(struct btrfs_root *root,</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	ctx.bytenr = nodesize;</div><div class='add'>+	ctx.trans = &amp;trans;</div><div class='add'>+	ctx.fs_info = fs_info;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Since the test trans doesn't have the complicated delayed refs,</div><div class='ctx'> 	 * we can only call btrfs_qgroup_account_extent() directly to test</div><div class='ctx'> 	 * quota.</div><div class='ctx'> 	 */</div><div class='del'>-	ret = btrfs_find_all_roots(&amp;trans, fs_info, nodesize, 0, &amp;old_roots, false);</div><div class='add'>+	ret = btrfs_find_all_roots(&amp;ctx, false);</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		ulist_free(old_roots);</div><div class='ctx'> 		test_err("couldn't find old roots: %d", ret);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='add'>+	old_roots = ctx.roots;</div><div class='add'>+	ctx.roots = NULL;</div><div class='ctx'> </div><div class='ctx'> 	ret = insert_normal_tree_ref(root, nodesize, nodesize, 0,</div><div class='ctx'> 				BTRFS_FS_TREE_OBJECTID);</div><div class='del'>-	if (ret)</div><div class='add'>+	if (ret) {</div><div class='add'>+		ulist_free(old_roots);</div><div class='ctx'> 		return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_find_all_roots(&amp;trans, fs_info, nodesize, 0, &amp;new_roots, false);</div><div class='add'>+	ret = btrfs_find_all_roots(&amp;ctx, false);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		ulist_free(old_roots);</div><div class='del'>-		ulist_free(new_roots);</div><div class='ctx'> 		test_err("couldn't find old roots: %d", ret);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='add'>+	new_roots = ctx.roots;</div><div class='add'>+	ctx.roots = NULL;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_qgroup_account_extent(&amp;trans, nodesize, nodesize, old_roots,</div><div class='ctx'> 					  new_roots);</div><div class='hunk'>@@ -250,32 +253,38 @@ static int test_no_shared_qgroup(struct btrfs_root *root,</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/* btrfs_qgroup_account_extent() always frees the ulists passed to it. */</div><div class='add'>+	old_roots = NULL;</div><div class='add'>+	new_roots = NULL;</div><div class='add'>+</div><div class='ctx'> 	if (btrfs_verify_qgroup_counts(fs_info, BTRFS_FS_TREE_OBJECTID,</div><div class='ctx'> 				nodesize, nodesize)) {</div><div class='ctx'> 		test_err("qgroup counts didn't match expected values");</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-	old_roots = NULL;</div><div class='del'>-	new_roots = NULL;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_find_all_roots(&amp;trans, fs_info, nodesize, 0, &amp;old_roots, false);</div><div class='add'>+	ret = btrfs_find_all_roots(&amp;ctx, false);</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		ulist_free(old_roots);</div><div class='ctx'> 		test_err("couldn't find old roots: %d", ret);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='add'>+	old_roots = ctx.roots;</div><div class='add'>+	ctx.roots = NULL;</div><div class='ctx'> </div><div class='ctx'> 	ret = remove_extent_item(root, nodesize, nodesize);</div><div class='del'>-	if (ret)</div><div class='add'>+	if (ret) {</div><div class='add'>+		ulist_free(old_roots);</div><div class='ctx'> 		return -EINVAL;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_find_all_roots(&amp;trans, fs_info, nodesize, 0, &amp;new_roots, false);</div><div class='add'>+	ret = btrfs_find_all_roots(&amp;ctx, false);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		ulist_free(old_roots);</div><div class='del'>-		ulist_free(new_roots);</div><div class='ctx'> 		test_err("couldn't find old roots: %d", ret);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='add'>+	new_roots = ctx.roots;</div><div class='add'>+	ctx.roots = NULL;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_qgroup_account_extent(&amp;trans, nodesize, nodesize, old_roots,</div><div class='ctx'> 					  new_roots);</div><div class='hunk'>@@ -300,6 +309,7 @@ static int test_no_shared_qgroup(struct btrfs_root *root,</div><div class='ctx'> static int test_multiple_refs(struct btrfs_root *root,</div><div class='ctx'> 		u32 sectorsize, u32 nodesize)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_backref_walk_ctx ctx = { 0 };</div><div class='ctx'> 	struct btrfs_trans_handle trans;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct ulist *old_roots = NULL;</div><div class='hunk'>@@ -320,25 +330,33 @@ static int test_multiple_refs(struct btrfs_root *root,</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_find_all_roots(&amp;trans, fs_info, nodesize, 0, &amp;old_roots, false);</div><div class='add'>+	ctx.bytenr = nodesize;</div><div class='add'>+	ctx.trans = &amp;trans;</div><div class='add'>+	ctx.fs_info = fs_info;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_find_all_roots(&amp;ctx, false);</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		ulist_free(old_roots);</div><div class='ctx'> 		test_err("couldn't find old roots: %d", ret);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='add'>+	old_roots = ctx.roots;</div><div class='add'>+	ctx.roots = NULL;</div><div class='ctx'> </div><div class='ctx'> 	ret = insert_normal_tree_ref(root, nodesize, nodesize, 0,</div><div class='ctx'> 				BTRFS_FS_TREE_OBJECTID);</div><div class='del'>-	if (ret)</div><div class='add'>+	if (ret) {</div><div class='add'>+		ulist_free(old_roots);</div><div class='ctx'> 		return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_find_all_roots(&amp;trans, fs_info, nodesize, 0, &amp;new_roots, false);</div><div class='add'>+	ret = btrfs_find_all_roots(&amp;ctx, false);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		ulist_free(old_roots);</div><div class='del'>-		ulist_free(new_roots);</div><div class='ctx'> 		test_err("couldn't find old roots: %d", ret);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='add'>+	new_roots = ctx.roots;</div><div class='add'>+	ctx.roots = NULL;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_qgroup_account_extent(&amp;trans, nodesize, nodesize, old_roots,</div><div class='ctx'> 					  new_roots);</div><div class='hunk'>@@ -353,25 +371,29 @@ static int test_multiple_refs(struct btrfs_root *root,</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_find_all_roots(&amp;trans, fs_info, nodesize, 0, &amp;old_roots, false);</div><div class='add'>+	ret = btrfs_find_all_roots(&amp;ctx, false);</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		ulist_free(old_roots);</div><div class='ctx'> 		test_err("couldn't find old roots: %d", ret);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='add'>+	old_roots = ctx.roots;</div><div class='add'>+	ctx.roots = NULL;</div><div class='ctx'> </div><div class='ctx'> 	ret = add_tree_ref(root, nodesize, nodesize, 0,</div><div class='ctx'> 			BTRFS_FIRST_FREE_OBJECTID);</div><div class='del'>-	if (ret)</div><div class='add'>+	if (ret) {</div><div class='add'>+		ulist_free(old_roots);</div><div class='ctx'> 		return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_find_all_roots(&amp;trans, fs_info, nodesize, 0, &amp;new_roots, false);</div><div class='add'>+	ret = btrfs_find_all_roots(&amp;ctx, false);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		ulist_free(old_roots);</div><div class='del'>-		ulist_free(new_roots);</div><div class='ctx'> 		test_err("couldn't find old roots: %d", ret);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='add'>+	new_roots = ctx.roots;</div><div class='add'>+	ctx.roots = NULL;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_qgroup_account_extent(&amp;trans, nodesize, nodesize, old_roots,</div><div class='ctx'> 					  new_roots);</div><div class='hunk'>@@ -392,25 +414,29 @@ static int test_multiple_refs(struct btrfs_root *root,</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_find_all_roots(&amp;trans, fs_info, nodesize, 0, &amp;old_roots, false);</div><div class='add'>+	ret = btrfs_find_all_roots(&amp;ctx, false);</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		ulist_free(old_roots);</div><div class='ctx'> 		test_err("couldn't find old roots: %d", ret);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='add'>+	old_roots = ctx.roots;</div><div class='add'>+	ctx.roots = NULL;</div><div class='ctx'> </div><div class='ctx'> 	ret = remove_extent_ref(root, nodesize, nodesize, 0,</div><div class='ctx'> 				BTRFS_FIRST_FREE_OBJECTID);</div><div class='del'>-	if (ret)</div><div class='add'>+	if (ret) {</div><div class='add'>+		ulist_free(old_roots);</div><div class='ctx'> 		return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_find_all_roots(&amp;trans, fs_info, nodesize, 0, &amp;new_roots, false);</div><div class='add'>+	ret = btrfs_find_all_roots(&amp;ctx, false);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		ulist_free(old_roots);</div><div class='del'>-		ulist_free(new_roots);</div><div class='ctx'> 		test_err("couldn't find old roots: %d", ret);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='add'>+	new_roots = ctx.roots;</div><div class='add'>+	ctx.roots = NULL;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_qgroup_account_extent(&amp;trans, nodesize, nodesize, old_roots,</div><div class='ctx'> 					  new_roots);</div><div class='hunk'>@@ -455,7 +481,10 @@ int btrfs_test_qgroups(u32 sectorsize, u32 nodesize)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* We are using this root as our extent root */</div><div class='del'>-	root-&gt;fs_info-&gt;extent_root = root;</div><div class='add'>+	root-&gt;root_key.objectid = BTRFS_EXTENT_TREE_OBJECTID;</div><div class='add'>+	root-&gt;root_key.type = BTRFS_ROOT_ITEM_KEY;</div><div class='add'>+	root-&gt;root_key.offset = 0;</div><div class='add'>+	btrfs_global_root_insert(root);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Some of the paths we test assume we have a filled out fs_info, so we</div><div class='head'>diff --git a/fs/btrfs/tests/raid-stripe-tree-tests.c b/fs/btrfs/tests/raid-stripe-tree-tests.c<br/>new file mode 100644<br/>index 000000000000..a7bc58a5c1e2<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tests/raid-stripe-tree-tests.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/tests/raid-stripe-tree-tests.c</a></div><div class='hunk'>@@ -0,0 +1,1161 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+/*</div><div class='add'>+ * Copyright (C) 2024 Western Digital Corporation or its affiliates.</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/sizes.h&gt;</div><div class='add'>+#include "../fs.h"</div><div class='add'>+#include "../disk-io.h"</div><div class='add'>+#include "../transaction.h"</div><div class='add'>+#include "../volumes.h"</div><div class='add'>+#include "../raid-stripe-tree.h"</div><div class='add'>+#include "btrfs-tests.h"</div><div class='add'>+</div><div class='add'>+#define RST_TEST_NUM_DEVICES	(2)</div><div class='add'>+#define RST_TEST_RAID1_TYPE	(BTRFS_BLOCK_GROUP_DATA | BTRFS_BLOCK_GROUP_RAID1)</div><div class='add'>+</div><div class='add'>+#define SZ_48K (SZ_32K + SZ_16K)</div><div class='add'>+</div><div class='add'>+typedef int (*test_func_t)(struct btrfs_trans_handle *trans);</div><div class='add'>+</div><div class='add'>+static struct btrfs_device *btrfs_device_by_devid(struct btrfs_fs_devices *fs_devices,</div><div class='add'>+						  u64 devid)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_device *dev;</div><div class='add'>+</div><div class='add'>+	list_for_each_entry(dev, &amp;fs_devices-&gt;devices, dev_list) {</div><div class='add'>+		if (dev-&gt;devid == devid)</div><div class='add'>+			return dev;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Test creating a range of three extents and then punch a hole in the middle,</div><div class='add'>+ * deleting all of the middle extents and partially deleting the "book ends".</div><div class='add'>+ */</div><div class='add'>+static int test_punch_hole_3extents(struct btrfs_trans_handle *trans)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='add'>+	struct btrfs_io_context *bioc;</div><div class='add'>+	struct btrfs_io_stripe io_stripe = { 0 };</div><div class='add'>+	u64 map_type = RST_TEST_RAID1_TYPE;</div><div class='add'>+	u64 logical1 = SZ_1M;</div><div class='add'>+	u64 len1 = SZ_1M;</div><div class='add'>+	u64 logical2 = logical1 + len1;</div><div class='add'>+	u64 len2 = SZ_1M;</div><div class='add'>+	u64 logical3 = logical2 + len2;</div><div class='add'>+	u64 len3 = SZ_1M;</div><div class='add'>+	u64 hole_start = logical1 + SZ_256K;</div><div class='add'>+	u64 hole_len = SZ_2M;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	bioc = alloc_btrfs_io_context(fs_info, logical1, RST_TEST_NUM_DEVICES);</div><div class='add'>+	if (!bioc) {</div><div class='add'>+		test_std_err(TEST_ALLOC_IO_CONTEXT);</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	io_stripe.dev = btrfs_device_by_devid(fs_info-&gt;fs_devices, 0);</div><div class='add'>+</div><div class='add'>+	/* Prepare for the test, 1st create 3 x 1M extents. */</div><div class='add'>+	bioc-&gt;map_type = map_type;</div><div class='add'>+	bioc-&gt;size = len1;</div><div class='add'>+</div><div class='add'>+	for (int i = 0; i &lt; RST_TEST_NUM_DEVICES; i++) {</div><div class='add'>+		struct btrfs_io_stripe *stripe = &amp;bioc-&gt;stripes[i];</div><div class='add'>+</div><div class='add'>+		stripe-&gt;dev = btrfs_device_by_devid(fs_info-&gt;fs_devices, i);</div><div class='add'>+		if (!stripe-&gt;dev) {</div><div class='add'>+			test_err("cannot find device with devid %d", i);</div><div class='add'>+			ret = -EINVAL;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		stripe-&gt;physical = logical1 + i * SZ_1G;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_insert_one_raid_extent(trans, bioc);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("inserting RAID extent failed: %d", ret);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	bioc-&gt;logical = logical2;</div><div class='add'>+	bioc-&gt;size = len2;</div><div class='add'>+	for (int i = 0; i &lt; RST_TEST_NUM_DEVICES; i++) {</div><div class='add'>+		struct btrfs_io_stripe *stripe = &amp;bioc-&gt;stripes[i];</div><div class='add'>+</div><div class='add'>+		stripe-&gt;dev = btrfs_device_by_devid(fs_info-&gt;fs_devices, i);</div><div class='add'>+		if (!stripe-&gt;dev) {</div><div class='add'>+			test_err("cannot find device with devid %d", i);</div><div class='add'>+			ret = -EINVAL;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		stripe-&gt;physical = logical2 + i * SZ_1G;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_insert_one_raid_extent(trans, bioc);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("inserting RAID extent failed: %d", ret);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	bioc-&gt;logical = logical3;</div><div class='add'>+	bioc-&gt;size = len3;</div><div class='add'>+	for (int i = 0; i &lt; RST_TEST_NUM_DEVICES; i++) {</div><div class='add'>+		struct btrfs_io_stripe *stripe = &amp;bioc-&gt;stripes[i];</div><div class='add'>+</div><div class='add'>+		stripe-&gt;dev = btrfs_device_by_devid(fs_info-&gt;fs_devices, i);</div><div class='add'>+		if (!stripe-&gt;dev) {</div><div class='add'>+			test_err("cannot find device with devid %d", i);</div><div class='add'>+			ret = -EINVAL;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		stripe-&gt;physical = logical3 + i * SZ_1G;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_insert_one_raid_extent(trans, bioc);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("inserting RAID extent failed: %d", ret);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Delete a range starting at logical1 + 256K and 2M in length. Extent</div><div class='add'>+	 * 1 is truncated to 256k length, extent 2 is completely dropped and</div><div class='add'>+	 * extent 3 is moved 256K to the right.</div><div class='add'>+	 */</div><div class='add'>+	ret = btrfs_delete_raid_extent(trans, hole_start, hole_len);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("deleting RAID extent [%llu, %llu] failed",</div><div class='add'>+			 hole_start, hole_start + hole_len);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Get the first extent and check its size. */</div><div class='add'>+	ret = btrfs_get_raid_extent_offset(fs_info, logical1, &amp;len1, map_type,</div><div class='add'>+					   0, &amp;io_stripe);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("lookup of RAID extent [%llu, %llu] failed",</div><div class='add'>+			 logical1, logical1 + len1);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (io_stripe.physical != logical1) {</div><div class='add'>+		test_err("invalid physical address, expected %llu, got %llu",</div><div class='add'>+			 logical1, io_stripe.physical);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (len1 != SZ_256K) {</div><div class='add'>+		test_err("invalid stripe length, expected %llu, got %llu",</div><div class='add'>+			 (u64)SZ_256K, len1);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Get the second extent and check it's absent. */</div><div class='add'>+	ret = btrfs_get_raid_extent_offset(fs_info, logical2, &amp;len2, map_type,</div><div class='add'>+					   0, &amp;io_stripe);</div><div class='add'>+	if (ret != -ENODATA) {</div><div class='add'>+		test_err("lookup of RAID extent [%llu, %llu] succeeded should fail",</div><div class='add'>+			 logical2, logical2 + len2);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Get the third extent and check its size. */</div><div class='add'>+	logical3 += SZ_256K;</div><div class='add'>+	ret = btrfs_get_raid_extent_offset(fs_info, logical3, &amp;len3, map_type,</div><div class='add'>+					   0, &amp;io_stripe);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("lookup of RAID extent [%llu, %llu] failed",</div><div class='add'>+			 logical3, logical3 + len3);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (io_stripe.physical != logical3) {</div><div class='add'>+		test_err("invalid physical address, expected %llu, got %llu",</div><div class='add'>+			 logical3 + SZ_256K, io_stripe.physical);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (len3 != SZ_1M - SZ_256K) {</div><div class='add'>+		test_err("invalid stripe length, expected %llu, got %llu",</div><div class='add'>+			 (u64)SZ_1M - SZ_256K, len3);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_delete_raid_extent(trans, logical1, len1);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("deleting RAID extent [%llu, %llu] failed",</div><div class='add'>+			 logical1, logical1 + len1);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_delete_raid_extent(trans, logical3, len3);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("deleting RAID extent [%llu, %llu] failed",</div><div class='add'>+			 logical1, logical1 + len1);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	btrfs_put_bioc(bioc);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int test_delete_two_extents(struct btrfs_trans_handle *trans)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='add'>+	struct btrfs_io_context *bioc;</div><div class='add'>+	struct btrfs_io_stripe io_stripe = { 0 };</div><div class='add'>+	u64 map_type = RST_TEST_RAID1_TYPE;</div><div class='add'>+	u64 logical1 = SZ_1M;</div><div class='add'>+	u64 len1 = SZ_1M;</div><div class='add'>+	u64 logical2 = logical1 + len1;</div><div class='add'>+	u64 len2 = SZ_1M;</div><div class='add'>+	u64 logical3 = logical2 + len2;</div><div class='add'>+	u64 len3 = SZ_1M;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	bioc = alloc_btrfs_io_context(fs_info, logical1, RST_TEST_NUM_DEVICES);</div><div class='add'>+	if (!bioc) {</div><div class='add'>+		test_std_err(TEST_ALLOC_IO_CONTEXT);</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	io_stripe.dev = btrfs_device_by_devid(fs_info-&gt;fs_devices, 0);</div><div class='add'>+</div><div class='add'>+	/* Prepare for the test, 1st create 3 x 1M extents. */</div><div class='add'>+	bioc-&gt;map_type = map_type;</div><div class='add'>+	bioc-&gt;size = len1;</div><div class='add'>+</div><div class='add'>+	for (int i = 0; i &lt; RST_TEST_NUM_DEVICES; i++) {</div><div class='add'>+		struct btrfs_io_stripe *stripe = &amp;bioc-&gt;stripes[i];</div><div class='add'>+</div><div class='add'>+		stripe-&gt;dev = btrfs_device_by_devid(fs_info-&gt;fs_devices, i);</div><div class='add'>+		if (!stripe-&gt;dev) {</div><div class='add'>+			test_err("cannot find device with devid %d", i);</div><div class='add'>+			ret = -EINVAL;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		stripe-&gt;physical = logical1 + i * SZ_1G;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_insert_one_raid_extent(trans, bioc);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("inserting RAID extent failed: %d", ret);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	bioc-&gt;logical = logical2;</div><div class='add'>+	bioc-&gt;size = len2;</div><div class='add'>+	for (int i = 0; i &lt; RST_TEST_NUM_DEVICES; i++) {</div><div class='add'>+		struct btrfs_io_stripe *stripe = &amp;bioc-&gt;stripes[i];</div><div class='add'>+</div><div class='add'>+		stripe-&gt;dev = btrfs_device_by_devid(fs_info-&gt;fs_devices, i);</div><div class='add'>+		if (!stripe-&gt;dev) {</div><div class='add'>+			test_err("cannot find device with devid %d", i);</div><div class='add'>+			ret = -EINVAL;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		stripe-&gt;physical = logical2 + i * SZ_1G;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_insert_one_raid_extent(trans, bioc);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("inserting RAID extent failed: %d", ret);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	bioc-&gt;logical = logical3;</div><div class='add'>+	bioc-&gt;size = len3;</div><div class='add'>+	for (int i = 0; i &lt; RST_TEST_NUM_DEVICES; i++) {</div><div class='add'>+		struct btrfs_io_stripe *stripe = &amp;bioc-&gt;stripes[i];</div><div class='add'>+</div><div class='add'>+		stripe-&gt;dev = btrfs_device_by_devid(fs_info-&gt;fs_devices, i);</div><div class='add'>+		if (!stripe-&gt;dev) {</div><div class='add'>+			test_err("cannot find device with devid %d", i);</div><div class='add'>+			ret = -EINVAL;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		stripe-&gt;physical = logical3 + i * SZ_1G;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_insert_one_raid_extent(trans, bioc);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("inserting RAID extent failed: %d", ret);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Delete a range starting at logical1 and 2M in length. Extents 1</div><div class='add'>+	 * and 2 are dropped and extent 3 is kept as is.</div><div class='add'>+	 */</div><div class='add'>+	ret = btrfs_delete_raid_extent(trans, logical1, len1 + len2);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("deleting RAID extent [%llu, %llu] failed",</div><div class='add'>+			 logical1, logical1 + len1 + len2);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_get_raid_extent_offset(fs_info, logical1, &amp;len1, map_type,</div><div class='add'>+					   0, &amp;io_stripe);</div><div class='add'>+	if (ret != -ENODATA) {</div><div class='add'>+		test_err("lookup of RAID extent [%llu, %llu] succeeded, should fail",</div><div class='add'>+			 logical1, len1);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_get_raid_extent_offset(fs_info, logical2, &amp;len2, map_type,</div><div class='add'>+					   0, &amp;io_stripe);</div><div class='add'>+	if (ret != -ENODATA) {</div><div class='add'>+		test_err("lookup of RAID extent [%llu, %llu] succeeded, should fail",</div><div class='add'>+			 logical2, len2);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_get_raid_extent_offset(fs_info, logical3, &amp;len3, map_type,</div><div class='add'>+					   0, &amp;io_stripe);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("lookup of RAID extent [%llu, %llu] failed",</div><div class='add'>+			 logical3, len3);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (io_stripe.physical != logical3) {</div><div class='add'>+		test_err("invalid physical address, expected %llu, got %llu",</div><div class='add'>+			 logical3, io_stripe.physical);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (len3 != SZ_1M) {</div><div class='add'>+		test_err("invalid stripe length, expected %llu, got %llu",</div><div class='add'>+			 (u64)SZ_1M, len3);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_delete_raid_extent(trans, logical3, len3);</div><div class='add'>+out:</div><div class='add'>+	btrfs_put_bioc(bioc);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test punching a hole into a single RAID stripe-extent. */</div><div class='add'>+static int test_punch_hole(struct btrfs_trans_handle *trans)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='add'>+	struct btrfs_io_context *bioc;</div><div class='add'>+	struct btrfs_io_stripe io_stripe = { 0 };</div><div class='add'>+	u64 map_type = RST_TEST_RAID1_TYPE;</div><div class='add'>+	u64 logical1 = SZ_1M;</div><div class='add'>+	u64 hole_start = logical1 + SZ_32K;</div><div class='add'>+	u64 hole_len = SZ_64K;</div><div class='add'>+	u64 logical2 = hole_start + hole_len;</div><div class='add'>+	u64 len = SZ_1M;</div><div class='add'>+	u64 len1 = SZ_32K;</div><div class='add'>+	u64 len2 = len - len1 - hole_len;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	bioc = alloc_btrfs_io_context(fs_info, logical1, RST_TEST_NUM_DEVICES);</div><div class='add'>+	if (!bioc) {</div><div class='add'>+		test_std_err(TEST_ALLOC_IO_CONTEXT);</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	io_stripe.dev = btrfs_device_by_devid(fs_info-&gt;fs_devices, 0);</div><div class='add'>+	bioc-&gt;map_type = map_type;</div><div class='add'>+	bioc-&gt;size = len;</div><div class='add'>+</div><div class='add'>+	for (int i = 0; i &lt; RST_TEST_NUM_DEVICES; i++) {</div><div class='add'>+		struct btrfs_io_stripe *stripe = &amp;bioc-&gt;stripes[i];</div><div class='add'>+</div><div class='add'>+		stripe-&gt;dev = btrfs_device_by_devid(fs_info-&gt;fs_devices, i);</div><div class='add'>+		if (!stripe-&gt;dev) {</div><div class='add'>+			test_err("cannot find device with devid %d", i);</div><div class='add'>+			ret = -EINVAL;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		stripe-&gt;physical = logical1 + i * SZ_1G;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_insert_one_raid_extent(trans, bioc);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("inserting RAID extent failed: %d", ret);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_get_raid_extent_offset(fs_info, logical1, &amp;len, map_type, 0,</div><div class='add'>+					   &amp;io_stripe);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("lookup of RAID extent [%llu, %llu] failed", logical1,</div><div class='add'>+			 logical1 + len);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (io_stripe.physical != logical1) {</div><div class='add'>+		test_err("invalid physical address, expected %llu got %llu",</div><div class='add'>+			 logical1, io_stripe.physical);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (len != SZ_1M) {</div><div class='add'>+		test_err("invalid stripe length, expected %llu got %llu",</div><div class='add'>+			 (u64)SZ_1M, len);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_delete_raid_extent(trans, hole_start, hole_len);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("deleting RAID extent [%llu, %llu] failed",</div><div class='add'>+			 hole_start, hole_start + hole_len);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_get_raid_extent_offset(fs_info, logical1, &amp;len1, map_type,</div><div class='add'>+					   0, &amp;io_stripe);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("lookup of RAID extent [%llu, %llu] failed",</div><div class='add'>+			 logical1, logical1 + len1);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (io_stripe.physical != logical1) {</div><div class='add'>+		test_err("invalid physical address, expected %llu, got %llu",</div><div class='add'>+			 logical1, io_stripe.physical);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (len1 != SZ_32K) {</div><div class='add'>+		test_err("invalid stripe length, expected %llu, got %llu",</div><div class='add'>+			 (u64)SZ_32K, len1);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_get_raid_extent_offset(fs_info, logical2, &amp;len2, map_type,</div><div class='add'>+					   0, &amp;io_stripe);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("lookup of RAID extent [%llu, %llu] failed", logical2,</div><div class='add'>+			 logical2 + len2);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (io_stripe.physical != logical2) {</div><div class='add'>+		test_err("invalid physical address, expected %llu, got %llu",</div><div class='add'>+			 logical2, io_stripe.physical);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (len2 != len - len1 - hole_len) {</div><div class='add'>+		test_err("invalid length, expected %llu, got %llu",</div><div class='add'>+			 len - len1 - hole_len, len2);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Check for the absence of the hole. */</div><div class='add'>+	ret = btrfs_get_raid_extent_offset(fs_info, hole_start, &amp;hole_len,</div><div class='add'>+					   map_type, 0, &amp;io_stripe);</div><div class='add'>+	if (ret != -ENODATA) {</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		test_err("lookup of RAID extent [%llu, %llu] succeeded, should fail",</div><div class='add'>+			 hole_start, hole_start + SZ_64K);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_delete_raid_extent(trans, logical1, len1);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_delete_raid_extent(trans, logical2, len2);</div><div class='add'>+out:</div><div class='add'>+	btrfs_put_bioc(bioc);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Test a 1M RST write that spans two adjacent RST items on disk and then</div><div class='add'>+ * delete a portion starting in the first item and spanning into the second</div><div class='add'>+ * item. This is similar to test_front_delete(), but spanning multiple items.</div><div class='add'>+ */</div><div class='add'>+static int test_front_delete_prev_item(struct btrfs_trans_handle *trans)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='add'>+	struct btrfs_io_context *bioc;</div><div class='add'>+	struct btrfs_io_stripe io_stripe = { 0 };</div><div class='add'>+	u64 map_type = RST_TEST_RAID1_TYPE;</div><div class='add'>+	u64 logical1 = SZ_1M;</div><div class='add'>+	u64 logical2 = SZ_2M;</div><div class='add'>+	u64 len = SZ_1M;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	bioc = alloc_btrfs_io_context(fs_info, logical1, RST_TEST_NUM_DEVICES);</div><div class='add'>+	if (!bioc) {</div><div class='add'>+		test_std_err(TEST_ALLOC_IO_CONTEXT);</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	io_stripe.dev = btrfs_device_by_devid(fs_info-&gt;fs_devices, 0);</div><div class='add'>+	bioc-&gt;map_type = map_type;</div><div class='add'>+	bioc-&gt;size = len;</div><div class='add'>+</div><div class='add'>+	/* Insert RAID extent 1. */</div><div class='add'>+	for (int i = 0; i &lt; RST_TEST_NUM_DEVICES; i++) {</div><div class='add'>+		struct btrfs_io_stripe *stripe = &amp;bioc-&gt;stripes[i];</div><div class='add'>+</div><div class='add'>+		stripe-&gt;dev = btrfs_device_by_devid(fs_info-&gt;fs_devices, i);</div><div class='add'>+		if (!stripe-&gt;dev) {</div><div class='add'>+			test_err("cannot find device with devid %d", i);</div><div class='add'>+			ret = -EINVAL;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		stripe-&gt;physical = logical1 + i * SZ_1G;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_insert_one_raid_extent(trans, bioc);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("inserting RAID extent failed: %d", ret);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	bioc-&gt;logical = logical2;</div><div class='add'>+	/* Insert RAID extent 2, directly adjacent to it. */</div><div class='add'>+	for (int i = 0; i &lt; RST_TEST_NUM_DEVICES; i++) {</div><div class='add'>+		struct btrfs_io_stripe *stripe = &amp;bioc-&gt;stripes[i];</div><div class='add'>+</div><div class='add'>+		stripe-&gt;dev = btrfs_device_by_devid(fs_info-&gt;fs_devices, i);</div><div class='add'>+		if (!stripe-&gt;dev) {</div><div class='add'>+			test_err("cannot find device with devid %d", i);</div><div class='add'>+			ret = -EINVAL;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		stripe-&gt;physical = logical2 + i * SZ_1G;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_insert_one_raid_extent(trans, bioc);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("inserting RAID extent failed: %d", ret);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_delete_raid_extent(trans, logical1 + SZ_512K, SZ_1M);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("deleting RAID extent [%llu, %llu] failed",</div><div class='add'>+			 logical1 + SZ_512K, (u64)SZ_1M);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Verify item 1 is truncated to 512K. */</div><div class='add'>+	ret = btrfs_get_raid_extent_offset(fs_info, logical1, &amp;len, map_type, 0,</div><div class='add'>+					   &amp;io_stripe);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("lookup of RAID extent [%llu, %llu] failed", logical1,</div><div class='add'>+			 logical1 + len);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (io_stripe.physical != logical1) {</div><div class='add'>+		test_err("invalid physical address, expected %llu got %llu",</div><div class='add'>+			 logical1, io_stripe.physical);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (len != SZ_512K) {</div><div class='add'>+		test_err("invalid stripe length, expected %llu got %llu",</div><div class='add'>+			 (u64)SZ_512K, len);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Verify item 2's start is moved by 512K. */</div><div class='add'>+	ret = btrfs_get_raid_extent_offset(fs_info, logical2 + SZ_512K, &amp;len,</div><div class='add'>+					   map_type, 0, &amp;io_stripe);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("lookup of RAID extent [%llu, %llu] failed",</div><div class='add'>+			 logical2 + SZ_512K, logical2 + len);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (io_stripe.physical != logical2 + SZ_512K) {</div><div class='add'>+		test_err("invalid physical address, expected %llu got %llu",</div><div class='add'>+			 logical2 + SZ_512K, io_stripe.physical);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (len != SZ_512K) {</div><div class='add'>+		test_err("invalid stripe length, expected %llu got %llu",</div><div class='add'>+			 (u64)SZ_512K, len);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Verify there's a hole at [1M+512K, 2M+512K] . */</div><div class='add'>+	len = SZ_1M;</div><div class='add'>+	ret = btrfs_get_raid_extent_offset(fs_info, logical1 + SZ_512K, &amp;len,</div><div class='add'>+					   map_type, 0, &amp;io_stripe);</div><div class='add'>+	if (ret != -ENODATA) {</div><div class='add'>+		test_err("lookup of RAID [%llu, %llu] succeeded, should fail",</div><div class='add'>+			 logical1 + SZ_512K, logical1 + SZ_512K + len);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Clean up after us. */</div><div class='add'>+	ret = btrfs_delete_raid_extent(trans, logical1, SZ_512K);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_delete_raid_extent(trans, logical2 + SZ_512K, SZ_512K);</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	btrfs_put_bioc(bioc);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Test a 64K RST write on a 2 disk RAID1 at a logical address of 1M and then</div><div class='add'>+ * delete the 1st 32K, making the new start address 1M+32K.</div><div class='add'>+ */</div><div class='add'>+static int test_front_delete(struct btrfs_trans_handle *trans)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='add'>+	struct btrfs_io_context *bioc;</div><div class='add'>+	struct btrfs_io_stripe io_stripe = { 0 };</div><div class='add'>+	u64 map_type = RST_TEST_RAID1_TYPE;</div><div class='add'>+	u64 logical = SZ_1M;</div><div class='add'>+	u64 len = SZ_64K;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	bioc = alloc_btrfs_io_context(fs_info, logical, RST_TEST_NUM_DEVICES);</div><div class='add'>+	if (!bioc) {</div><div class='add'>+		test_std_err(TEST_ALLOC_IO_CONTEXT);</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	io_stripe.dev = btrfs_device_by_devid(fs_info-&gt;fs_devices, 0);</div><div class='add'>+	bioc-&gt;map_type = map_type;</div><div class='add'>+	bioc-&gt;size = len;</div><div class='add'>+</div><div class='add'>+	for (int i = 0; i &lt; RST_TEST_NUM_DEVICES; i++) {</div><div class='add'>+		struct btrfs_io_stripe *stripe = &amp;bioc-&gt;stripes[i];</div><div class='add'>+</div><div class='add'>+		stripe-&gt;dev = btrfs_device_by_devid(fs_info-&gt;fs_devices, i);</div><div class='add'>+		if (!stripe-&gt;dev) {</div><div class='add'>+			test_err("cannot find device with devid %d", i);</div><div class='add'>+			ret = -EINVAL;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		stripe-&gt;physical = logical + i * SZ_1G;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_insert_one_raid_extent(trans, bioc);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("inserting RAID extent failed: %d", ret);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_get_raid_extent_offset(fs_info, logical, &amp;len, map_type, 0, &amp;io_stripe);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("lookup of RAID extent [%llu, %llu] failed", logical,</div><div class='add'>+			 logical + len);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (io_stripe.physical != logical) {</div><div class='add'>+		test_err("invalid physical address, expected %llu got %llu",</div><div class='add'>+			 logical, io_stripe.physical);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (len != SZ_64K) {</div><div class='add'>+		test_err("invalid stripe length, expected %llu got %llu",</div><div class='add'>+			 (u64)SZ_64K, len);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_delete_raid_extent(trans, logical, SZ_16K);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("deleting RAID extent [%llu, %llu] failed", logical,</div><div class='add'>+			 logical + SZ_16K);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	len -= SZ_16K;</div><div class='add'>+	ret = btrfs_get_raid_extent_offset(fs_info, logical + SZ_16K, &amp;len,</div><div class='add'>+					   map_type, 0, &amp;io_stripe);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("lookup of RAID extent [%llu, %llu] failed",</div><div class='add'>+			 logical + SZ_16K, logical + SZ_64K);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (io_stripe.physical != logical + SZ_16K) {</div><div class='add'>+		test_err("invalid physical address, expected %llu, got %llu",</div><div class='add'>+			 logical + SZ_16K, io_stripe.physical);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (len != SZ_48K) {</div><div class='add'>+		test_err("invalid stripe length, expected %llu, got %llu",</div><div class='add'>+			 (u64)SZ_48K, len);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_get_raid_extent_offset(fs_info, logical, &amp;len, map_type, 0, &amp;io_stripe);</div><div class='add'>+	if (ret != -ENODATA) {</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		test_err("lookup of RAID extent [%llu, %llu] succeeded, should fail",</div><div class='add'>+			 logical, logical + SZ_16K);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_delete_raid_extent(trans, logical + SZ_16K, SZ_48K);</div><div class='add'>+out:</div><div class='add'>+	btrfs_put_bioc(bioc);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Test a 64K RST write on a 2 disk RAID1 at a logical address of 1M and then</div><div class='add'>+ * truncate the stripe extent down to 32K.</div><div class='add'>+ */</div><div class='add'>+static int test_tail_delete(struct btrfs_trans_handle *trans)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='add'>+	struct btrfs_io_context *bioc;</div><div class='add'>+	struct btrfs_io_stripe io_stripe = { 0 };</div><div class='add'>+	u64 map_type = RST_TEST_RAID1_TYPE;</div><div class='add'>+	u64 logical = SZ_1M;</div><div class='add'>+	u64 len = SZ_64K;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	bioc = alloc_btrfs_io_context(fs_info, logical, RST_TEST_NUM_DEVICES);</div><div class='add'>+	if (!bioc) {</div><div class='add'>+		test_std_err(TEST_ALLOC_IO_CONTEXT);</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	io_stripe.dev = btrfs_device_by_devid(fs_info-&gt;fs_devices, 0);</div><div class='add'>+	bioc-&gt;map_type = map_type;</div><div class='add'>+	bioc-&gt;size = len;</div><div class='add'>+</div><div class='add'>+	for (int i = 0; i &lt; RST_TEST_NUM_DEVICES; i++) {</div><div class='add'>+		struct btrfs_io_stripe *stripe = &amp;bioc-&gt;stripes[i];</div><div class='add'>+</div><div class='add'>+		stripe-&gt;dev = btrfs_device_by_devid(fs_info-&gt;fs_devices, i);</div><div class='add'>+		if (!stripe-&gt;dev) {</div><div class='add'>+			test_err("cannot find device with devid %d", i);</div><div class='add'>+			ret = -EINVAL;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		stripe-&gt;physical = logical + i * SZ_1G;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_insert_one_raid_extent(trans, bioc);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("inserting RAID extent failed: %d", ret);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	io_stripe.dev = btrfs_device_by_devid(fs_info-&gt;fs_devices, 0);</div><div class='add'>+	if (!io_stripe.dev) {</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_get_raid_extent_offset(fs_info, logical, &amp;len, map_type, 0, &amp;io_stripe);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("lookup of RAID extent [%llu, %llu] failed", logical,</div><div class='add'>+			 logical + len);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (io_stripe.physical != logical) {</div><div class='add'>+		test_err("invalid physical address, expected %llu got %llu",</div><div class='add'>+			 logical, io_stripe.physical);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (len != SZ_64K) {</div><div class='add'>+		test_err("invalid stripe length, expected %llu got %llu",</div><div class='add'>+			 (u64)SZ_64K, len);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_delete_raid_extent(trans, logical + SZ_48K, SZ_16K);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("deleting RAID extent [%llu, %llu] failed",</div><div class='add'>+			 logical + SZ_48K, logical + SZ_64K);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	len = SZ_48K;</div><div class='add'>+	ret = btrfs_get_raid_extent_offset(fs_info, logical, &amp;len, map_type, 0, &amp;io_stripe);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("lookup of RAID extent [%llu, %llu] failed", logical,</div><div class='add'>+			 logical + len);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (io_stripe.physical != logical) {</div><div class='add'>+		test_err("invalid physical address, expected %llu, got %llu",</div><div class='add'>+			 logical, io_stripe.physical);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (len != SZ_48K) {</div><div class='add'>+		test_err("invalid stripe length, expected %llu, got %llu",</div><div class='add'>+			 (u64)SZ_48K, len);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	len = SZ_16K;</div><div class='add'>+	ret = btrfs_get_raid_extent_offset(fs_info, logical + SZ_48K, &amp;len,</div><div class='add'>+					   map_type, 0, &amp;io_stripe);</div><div class='add'>+	if (ret != -ENODATA) {</div><div class='add'>+		test_err("lookup of RAID extent [%llu, %llu] succeeded should fail",</div><div class='add'>+			 logical + SZ_48K, logical + SZ_64K);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_delete_raid_extent(trans, logical, len);</div><div class='add'>+	if (ret)</div><div class='add'>+		test_err("deleting RAID extent [%llu, %llu] failed", logical,</div><div class='add'>+			 logical + len);</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	btrfs_put_bioc(bioc);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Test a 64K RST write on a 2 disk RAID1 at a logical address of 1M and then</div><div class='add'>+ * overwrite the whole range giving it new physical address at an offset of 1G.</div><div class='add'>+ * The intent of this test is to exercise the 'update_raid_extent_item()'</div><div class='add'>+ * function called be btrfs_insert_one_raid_extent().</div><div class='add'>+ */</div><div class='add'>+static int test_create_update_delete(struct btrfs_trans_handle *trans)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='add'>+	struct btrfs_io_context *bioc;</div><div class='add'>+	struct btrfs_io_stripe io_stripe = { 0 };</div><div class='add'>+	u64 map_type = RST_TEST_RAID1_TYPE;</div><div class='add'>+	u64 logical = SZ_1M;</div><div class='add'>+	u64 len = SZ_64K;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	bioc = alloc_btrfs_io_context(fs_info, logical, RST_TEST_NUM_DEVICES);</div><div class='add'>+	if (!bioc) {</div><div class='add'>+		test_std_err(TEST_ALLOC_IO_CONTEXT);</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	io_stripe.dev = btrfs_device_by_devid(fs_info-&gt;fs_devices, 0);</div><div class='add'>+	bioc-&gt;map_type = map_type;</div><div class='add'>+	bioc-&gt;size = len;</div><div class='add'>+</div><div class='add'>+	for (int i = 0; i &lt; RST_TEST_NUM_DEVICES; i++) {</div><div class='add'>+		struct btrfs_io_stripe *stripe = &amp;bioc-&gt;stripes[i];</div><div class='add'>+</div><div class='add'>+		stripe-&gt;dev = btrfs_device_by_devid(fs_info-&gt;fs_devices, i);</div><div class='add'>+		if (!stripe-&gt;dev) {</div><div class='add'>+			test_err("cannot find device with devid %d", i);</div><div class='add'>+			ret = -EINVAL;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		stripe-&gt;physical = logical + i * SZ_1G;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_insert_one_raid_extent(trans, bioc);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("inserting RAID extent failed: %d", ret);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	io_stripe.dev = btrfs_device_by_devid(fs_info-&gt;fs_devices, 0);</div><div class='add'>+	if (!io_stripe.dev) {</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_get_raid_extent_offset(fs_info, logical, &amp;len, map_type, 0, &amp;io_stripe);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("lookup of RAID extent [%llu, %llu] failed", logical,</div><div class='add'>+			 logical + len);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (io_stripe.physical != logical) {</div><div class='add'>+		test_err("invalid physical address, expected %llu got %llu",</div><div class='add'>+			 logical, io_stripe.physical);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (len != SZ_64K) {</div><div class='add'>+		test_err("invalid stripe length, expected %llu got %llu",</div><div class='add'>+			 (u64)SZ_64K, len);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for (int i = 0; i &lt; RST_TEST_NUM_DEVICES; i++) {</div><div class='add'>+		struct btrfs_io_stripe *stripe = &amp;bioc-&gt;stripes[i];</div><div class='add'>+</div><div class='add'>+		stripe-&gt;dev = btrfs_device_by_devid(fs_info-&gt;fs_devices, i);</div><div class='add'>+		if (!stripe-&gt;dev) {</div><div class='add'>+			test_err("cannot find device with devid %d", i);</div><div class='add'>+			ret = -EINVAL;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		stripe-&gt;physical = SZ_1G + logical + i * SZ_1G;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_insert_one_raid_extent(trans, bioc);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("updating RAID extent failed: %d", ret);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_get_raid_extent_offset(fs_info, logical, &amp;len, map_type, 0, &amp;io_stripe);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("lookup of RAID extent [%llu, %llu] failed", logical,</div><div class='add'>+			 logical + len);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (io_stripe.physical != logical + SZ_1G) {</div><div class='add'>+		test_err("invalid physical address, expected %llu, got %llu",</div><div class='add'>+			 logical + SZ_1G, io_stripe.physical);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (len != SZ_64K) {</div><div class='add'>+		test_err("invalid stripe length, expected %llu, got %llu",</div><div class='add'>+			 (u64)SZ_64K, len);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_delete_raid_extent(trans, logical, len);</div><div class='add'>+	if (ret)</div><div class='add'>+		test_err("deleting RAID extent [%llu, %llu] failed", logical,</div><div class='add'>+			 logical + len);</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	btrfs_put_bioc(bioc);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Test a simple 64K RST write on a 2 disk RAID1 at a logical address of 1M.</div><div class='add'>+ * The "physical" copy on device 0 is at 1M, on device 1 it is at 1G+1M.</div><div class='add'>+ */</div><div class='add'>+static int test_simple_create_delete(struct btrfs_trans_handle *trans)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='add'>+	struct btrfs_io_context *bioc;</div><div class='add'>+	struct btrfs_io_stripe io_stripe = { 0 };</div><div class='add'>+	u64 map_type = RST_TEST_RAID1_TYPE;</div><div class='add'>+	u64 logical = SZ_1M;</div><div class='add'>+	u64 len = SZ_64K;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	bioc = alloc_btrfs_io_context(fs_info, logical, RST_TEST_NUM_DEVICES);</div><div class='add'>+	if (!bioc) {</div><div class='add'>+		test_std_err(TEST_ALLOC_IO_CONTEXT);</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	bioc-&gt;map_type = map_type;</div><div class='add'>+	bioc-&gt;size = SZ_64K;</div><div class='add'>+</div><div class='add'>+	for (int i = 0; i &lt; RST_TEST_NUM_DEVICES; i++) {</div><div class='add'>+		struct btrfs_io_stripe *stripe = &amp;bioc-&gt;stripes[i];</div><div class='add'>+</div><div class='add'>+		stripe-&gt;dev = btrfs_device_by_devid(fs_info-&gt;fs_devices, i);</div><div class='add'>+		if (!stripe-&gt;dev) {</div><div class='add'>+			test_err("cannot find device with devid %d", i);</div><div class='add'>+			ret = -EINVAL;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		stripe-&gt;physical = logical + i * SZ_1G;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_insert_one_raid_extent(trans, bioc);</div><div class='add'>+	if (ret) {</div><div class='add'>+		test_err("inserting RAID extent failed: %d", ret);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	io_stripe.dev = btrfs_device_by_devid(fs_info-&gt;fs_devices, 0);</div><div class='add'>+	if (!io_stripe.dev) {</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_get_raid_extent_offset(fs_info, logical, &amp;len, map_type, 0, &amp;io_stripe);</div><div class='add'>+	if (ret)  {</div><div class='add'>+		test_err("lookup of RAID extent [%llu, %llu] failed", logical,</div><div class='add'>+			 logical + len);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (io_stripe.physical != logical) {</div><div class='add'>+		test_err("invalid physical address, expected %llu got %llu",</div><div class='add'>+			 logical, io_stripe.physical);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (len != SZ_64K) {</div><div class='add'>+		test_err("invalid stripe length, expected %llu got %llu",</div><div class='add'>+			 (u64)SZ_64K, len);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_delete_raid_extent(trans, logical, len);</div><div class='add'>+	if (ret)</div><div class='add'>+		test_err("deleting RAID extent [%llu, %llu] failed", logical,</div><div class='add'>+			 logical + len);</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	btrfs_put_bioc(bioc);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const test_func_t tests[] = {</div><div class='add'>+	test_simple_create_delete,</div><div class='add'>+	test_create_update_delete,</div><div class='add'>+	test_tail_delete,</div><div class='add'>+	test_front_delete,</div><div class='add'>+	test_front_delete_prev_item,</div><div class='add'>+	test_punch_hole,</div><div class='add'>+	test_punch_hole_3extents,</div><div class='add'>+	test_delete_two_extents,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int run_test(test_func_t test, u32 sectorsize, u32 nodesize)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_trans_handle trans;</div><div class='add'>+	struct btrfs_fs_info *fs_info;</div><div class='add'>+	struct btrfs_root *root = NULL;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	fs_info = btrfs_alloc_dummy_fs_info(sectorsize, nodesize);</div><div class='add'>+	if (!fs_info) {</div><div class='add'>+		test_std_err(TEST_ALLOC_FS_INFO);</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	root = btrfs_alloc_dummy_root(fs_info);</div><div class='add'>+	if (IS_ERR(root)) {</div><div class='add'>+		test_std_err(TEST_ALLOC_ROOT);</div><div class='add'>+		ret = PTR_ERR(root);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	btrfs_set_super_incompat_flags(root-&gt;fs_info-&gt;super_copy,</div><div class='add'>+				       BTRFS_FEATURE_INCOMPAT_RAID_STRIPE_TREE);</div><div class='add'>+	root-&gt;root_key.objectid = BTRFS_RAID_STRIPE_TREE_OBJECTID;</div><div class='add'>+	root-&gt;root_key.type = BTRFS_ROOT_ITEM_KEY;</div><div class='add'>+	root-&gt;root_key.offset = 0;</div><div class='add'>+	fs_info-&gt;stripe_root = root;</div><div class='add'>+	root-&gt;fs_info-&gt;tree_root = root;</div><div class='add'>+</div><div class='add'>+	root-&gt;node = alloc_test_extent_buffer(root-&gt;fs_info, nodesize);</div><div class='add'>+	if (IS_ERR(root-&gt;node)) {</div><div class='add'>+		test_std_err(TEST_ALLOC_EXTENT_BUFFER);</div><div class='add'>+		ret = PTR_ERR(root-&gt;node);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	btrfs_set_header_level(root-&gt;node, 0);</div><div class='add'>+	btrfs_set_header_nritems(root-&gt;node, 0);</div><div class='add'>+	root-&gt;alloc_bytenr += 2 * nodesize;</div><div class='add'>+</div><div class='add'>+	for (int i = 0; i &lt; RST_TEST_NUM_DEVICES; i++) {</div><div class='add'>+		struct btrfs_device *dev;</div><div class='add'>+</div><div class='add'>+		dev = btrfs_alloc_dummy_device(fs_info);</div><div class='add'>+		if (IS_ERR(dev)) {</div><div class='add'>+			test_err("cannot allocate device");</div><div class='add'>+			ret = PTR_ERR(dev);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		dev-&gt;devid = i;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	btrfs_init_dummy_trans(&amp;trans, root-&gt;fs_info);</div><div class='add'>+	ret = test(&amp;trans);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	btrfs_free_dummy_root(root);</div><div class='add'>+	btrfs_free_dummy_fs_info(fs_info);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_test_raid_stripe_tree(u32 sectorsize, u32 nodesize)</div><div class='add'>+{</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	test_msg("running raid-stripe-tree tests");</div><div class='add'>+	for (int i = 0; i &lt; ARRAY_SIZE(tests); i++) {</div><div class='add'>+		ret = run_test(tests[i], sectorsize, nodesize);</div><div class='add'>+		if (ret) {</div><div class='add'>+			test_err("test-case %ps failed with %d\n", tests[i], ret);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/btrfs/transaction.c b/fs/btrfs/transaction.c<br/>index 1c3a1189c0bd..05ee4391c83a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/transaction.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/transaction.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/transaction.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/transaction.c</a></div><div class='hunk'>@@ -6,10 +6,12 @@</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='add'>+#include &lt;linux/sched/mm.h&gt;</div><div class='ctx'> #include &lt;linux/writeback.h&gt;</div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='ctx'> #include &lt;linux/blkdev.h&gt;</div><div class='ctx'> #include &lt;linux/uuid.h&gt;</div><div class='add'>+#include &lt;linux/timekeeping.h&gt;</div><div class='ctx'> #include "misc.h"</div><div class='ctx'> #include "ctree.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='hunk'>@@ -21,9 +23,19 @@</div><div class='ctx'> #include "qgroup.h"</div><div class='ctx'> #include "block-group.h"</div><div class='ctx'> #include "space-info.h"</div><div class='del'>-#include "zoned.h"</div><div class='del'>-</div><div class='del'>-#define BTRFS_ROOT_TRANS_TAG 0</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "extent-tree.h"</div><div class='add'>+#include "root-tree.h"</div><div class='add'>+#include "dir-item.h"</div><div class='add'>+#include "uuid-tree.h"</div><div class='add'>+#include "ioctl.h"</div><div class='add'>+#include "relocation.h"</div><div class='add'>+#include "scrub.h"</div><div class='add'>+#include "ordered-data.h"</div><div class='add'>+#include "delayed-inode.h"</div><div class='add'>+</div><div class='add'>+static struct kmem_cache *btrfs_trans_handle_cachep;</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Transaction states and transitions</div><div class='hunk'>@@ -42,12 +54,17 @@</div><div class='ctx'>  * |  Call btrfs_commit_transaction() on any trans handle attached to</div><div class='ctx'>  * |  transaction N</div><div class='ctx'>  * V</div><div class='del'>- * Transaction N [[TRANS_STATE_COMMIT_START]]</div><div class='add'>+ * Transaction N [[TRANS_STATE_COMMIT_PREP]]</div><div class='add'>+ * |</div><div class='add'>+ * | If there are simultaneous calls to btrfs_commit_transaction() one will win</div><div class='add'>+ * | the race and the rest will wait for the winner to commit the transaction.</div><div class='ctx'>  * |</div><div class='del'>- * | Will wait for previous running transaction to completely finish if there</div><div class='del'>- * | is one</div><div class='add'>+ * | The winner will wait for previous running transaction to completely finish</div><div class='add'>+ * | if there is one.</div><div class='ctx'>  * |</div><div class='del'>- * | Then one of the following happes:</div><div class='add'>+ * Transaction N [[TRANS_STATE_COMMIT_START]]</div><div class='add'>+ * |</div><div class='add'>+ * | Then one of the following happens:</div><div class='ctx'>  * | - Wait for all other trans handle holders to release.</div><div class='ctx'>  * |   The btrfs_commit_transaction() caller will do the commit work.</div><div class='ctx'>  * | - Wait for current transaction to be committed by others.</div><div class='hunk'>@@ -88,7 +105,7 @@</div><div class='ctx'>  * | attached to transid N+1.			    |</div><div class='ctx'>  * |						    |</div><div class='ctx'>  * | To next stage:				    |</div><div class='del'>- * |  Until all tree blocks are super blocks are    |</div><div class='add'>+ * |  Until all tree blocks and super blocks are    |</div><div class='ctx'>  * |  written to block devices			    |</div><div class='ctx'>  * V						    |</div><div class='ctx'>  * Transaction N [[TRANS_STATE_COMPLETED]]	    V</div><div class='hunk'>@@ -98,6 +115,7 @@</div><div class='ctx'>  */</div><div class='ctx'> static const unsigned int btrfs_blocked_trans_types[TRANS_STATE_MAX] = {</div><div class='ctx'> 	[TRANS_STATE_RUNNING]		= 0U,</div><div class='add'>+	[TRANS_STATE_COMMIT_PREP]	= 0U,</div><div class='ctx'> 	[TRANS_STATE_COMMIT_START]	= (__TRANS_START | __TRANS_ATTACH),</div><div class='ctx'> 	[TRANS_STATE_COMMIT_DOING]	= (__TRANS_START |</div><div class='ctx'> 					   __TRANS_ATTACH |</div><div class='hunk'>@@ -122,13 +140,10 @@ static const unsigned int btrfs_blocked_trans_types[TRANS_STATE_MAX] = {</div><div class='ctx'> </div><div class='ctx'> void btrfs_put_transaction(struct btrfs_transaction *transaction)</div><div class='ctx'> {</div><div class='del'>-	WARN_ON(refcount_read(&amp;transaction-&gt;use_count) == 0);</div><div class='ctx'> 	if (refcount_dec_and_test(&amp;transaction-&gt;use_count)) {</div><div class='ctx'> 		BUG_ON(!list_empty(&amp;transaction-&gt;list));</div><div class='del'>-		WARN_ON(!RB_EMPTY_ROOT(</div><div class='del'>-				&amp;transaction-&gt;delayed_refs.href_root.rb_root));</div><div class='del'>-		WARN_ON(!RB_EMPTY_ROOT(</div><div class='del'>-				&amp;transaction-&gt;delayed_refs.dirty_extent_root));</div><div class='add'>+		WARN_ON(!xa_empty(&amp;transaction-&gt;delayed_refs.head_refs));</div><div class='add'>+		WARN_ON(!xa_empty(&amp;transaction-&gt;delayed_refs.dirty_extents));</div><div class='ctx'> 		if (transaction-&gt;delayed_refs.pending_csums)</div><div class='ctx'> 			btrfs_err(transaction-&gt;fs_info,</div><div class='ctx'> 				  "pending csums is %llu",</div><div class='hunk'>@@ -146,7 +161,13 @@ void btrfs_put_transaction(struct btrfs_transaction *transaction)</div><div class='ctx'> 			cache = list_first_entry(&amp;transaction-&gt;deleted_bgs,</div><div class='ctx'> 						 struct btrfs_block_group,</div><div class='ctx'> 						 bg_list);</div><div class='add'>+			/*</div><div class='add'>+			 * Not strictly necessary to lock, as no other task will be using a</div><div class='add'>+			 * block_group on the deleted_bgs list during a transaction abort.</div><div class='add'>+			 */</div><div class='add'>+			spin_lock(&amp;transaction-&gt;fs_info-&gt;unused_bgs_lock);</div><div class='ctx'> 			list_del_init(&amp;cache-&gt;bg_list);</div><div class='add'>+			spin_unlock(&amp;transaction-&gt;fs_info-&gt;unused_bgs_lock);</div><div class='ctx'> 			btrfs_unfreeze_block_group(cache);</div><div class='ctx'> 			btrfs_put_block_group(cache);</div><div class='ctx'> 		}</div><div class='hunk'>@@ -160,15 +181,25 @@ static noinline void switch_commit_roots(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	struct btrfs_transaction *cur_trans = trans-&gt;transaction;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_root *root, *tmp;</div><div class='del'>-	struct btrfs_caching_control *caching_ctl, *next;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * At this point no one can be using this transaction to modify any tree</div><div class='add'>+	 * and no one can start another transaction to modify any tree either.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(cur_trans-&gt;state == TRANS_STATE_COMMIT_DOING,</div><div class='add'>+	       "cur_trans-&gt;state=%d", cur_trans-&gt;state);</div><div class='ctx'> </div><div class='ctx'> 	down_write(&amp;fs_info-&gt;commit_root_sem);</div><div class='add'>+</div><div class='add'>+	if (test_bit(BTRFS_FS_RELOC_RUNNING, &amp;fs_info-&gt;flags))</div><div class='add'>+		fs_info-&gt;last_reloc_trans = trans-&gt;transid;</div><div class='add'>+</div><div class='ctx'> 	list_for_each_entry_safe(root, tmp, &amp;cur_trans-&gt;switch_commits,</div><div class='ctx'> 				 dirty_list) {</div><div class='ctx'> 		list_del_init(&amp;root-&gt;dirty_list);</div><div class='ctx'> 		free_extent_buffer(root-&gt;commit_root);</div><div class='ctx'> 		root-&gt;commit_root = btrfs_root_node(root);</div><div class='del'>-		extent_io_tree_release(&amp;root-&gt;dirty_log_pages);</div><div class='add'>+		btrfs_extent_io_tree_release(&amp;root-&gt;dirty_log_pages);</div><div class='ctx'> 		btrfs_qgroup_clean_swapped_blocks(root);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -185,46 +216,6 @@ static noinline void switch_commit_roots(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;cur_trans-&gt;dropped_roots_lock);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * We have to update the last_byte_to_unpin under the commit_root_sem,</div><div class='del'>-	 * at the same time we swap out the commit roots.</div><div class='del'>-	 *</div><div class='del'>-	 * This is because we must have a real view of the last spot the caching</div><div class='del'>-	 * kthreads were while caching.  Consider the following views of the</div><div class='del'>-	 * extent tree for a block group</div><div class='del'>-	 *</div><div class='del'>-	 * commit root</div><div class='del'>-	 * +----+----+----+----+----+----+----+</div><div class='del'>-	 * |\\\\|    |\\\\|\\\\|    |\\\\|\\\\|</div><div class='del'>-	 * +----+----+----+----+----+----+----+</div><div class='del'>-	 * 0    1    2    3    4    5    6    7</div><div class='del'>-	 *</div><div class='del'>-	 * new commit root</div><div class='del'>-	 * +----+----+----+----+----+----+----+</div><div class='del'>-	 * |    |    |    |\\\\|    |    |\\\\|</div><div class='del'>-	 * +----+----+----+----+----+----+----+</div><div class='del'>-	 * 0    1    2    3    4    5    6    7</div><div class='del'>-	 *</div><div class='del'>-	 * If the cache_ctl-&gt;progress was at 3, then we are only allowed to</div><div class='del'>-	 * unpin [0,1) and [2,3], because the caching thread has already</div><div class='del'>-	 * processed those extents.  We are not allowed to unpin [5,6), because</div><div class='del'>-	 * the caching thread will re-start it's search from 3, and thus find</div><div class='del'>-	 * the hole from [4,6) to add to the free space cache.</div><div class='del'>-	 */</div><div class='del'>-	spin_lock(&amp;fs_info-&gt;block_group_cache_lock);</div><div class='del'>-	list_for_each_entry_safe(caching_ctl, next,</div><div class='del'>-				 &amp;fs_info-&gt;caching_block_groups, list) {</div><div class='del'>-		struct btrfs_block_group *cache = caching_ctl-&gt;block_group;</div><div class='del'>-</div><div class='del'>-		if (btrfs_block_group_done(cache)) {</div><div class='del'>-			cache-&gt;last_byte_to_unpin = (u64)-1;</div><div class='del'>-			list_del_init(&amp;caching_ctl-&gt;list);</div><div class='del'>-			btrfs_put_caching_control(caching_ctl);</div><div class='del'>-		} else {</div><div class='del'>-			cache-&gt;last_byte_to_unpin = caching_ctl-&gt;progress;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;block_group_cache_lock);</div><div class='ctx'> 	up_write(&amp;fs_info-&gt;commit_root_sem);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -291,8 +282,10 @@ loop:</div><div class='ctx'> 	cur_trans = fs_info-&gt;running_transaction;</div><div class='ctx'> 	if (cur_trans) {</div><div class='ctx'> 		if (TRANS_ABORTED(cur_trans)) {</div><div class='add'>+			const int abort_error = cur_trans-&gt;aborted;</div><div class='add'>+</div><div class='ctx'> 			spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='del'>-			return cur_trans-&gt;aborted;</div><div class='add'>+			return abort_error;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (btrfs_blocked_trans_types[cur_trans-&gt;state] &amp; type) {</div><div class='ctx'> 			spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='hunk'>@@ -302,15 +295,18 @@ loop:</div><div class='ctx'> 		atomic_inc(&amp;cur_trans-&gt;num_writers);</div><div class='ctx'> 		extwriter_counter_inc(cur_trans, type);</div><div class='ctx'> 		spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='add'>+		btrfs_lockdep_acquire(fs_info, btrfs_trans_num_writers);</div><div class='add'>+		btrfs_lockdep_acquire(fs_info, btrfs_trans_num_extwriters);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * If we are ATTACH, we just want to catch the current transaction,</div><div class='del'>-	 * and commit it. If there is no transaction, just return ENOENT.</div><div class='add'>+	 * If we are ATTACH or TRANS_JOIN_NOSTART, we just want to catch the</div><div class='add'>+	 * current transaction, and commit it. If there is no transaction, just</div><div class='add'>+	 * return ENOENT.</div><div class='ctx'> 	 */</div><div class='del'>-	if (type == TRANS_ATTACH)</div><div class='add'>+	if (type == TRANS_ATTACH || type == TRANS_JOIN_NOSTART)</div><div class='ctx'> 		return -ENOENT;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -323,16 +319,23 @@ loop:</div><div class='ctx'> 	if (!cur_trans)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='add'>+	btrfs_lockdep_acquire(fs_info, btrfs_trans_num_writers);</div><div class='add'>+	btrfs_lockdep_acquire(fs_info, btrfs_trans_num_extwriters);</div><div class='add'>+</div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;trans_lock);</div><div class='ctx'> 	if (fs_info-&gt;running_transaction) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * someone started a transaction after we unlocked.  Make sure</div><div class='ctx'> 		 * to redo the checks above</div><div class='ctx'> 		 */</div><div class='add'>+		btrfs_lockdep_release(fs_info, btrfs_trans_num_extwriters);</div><div class='add'>+		btrfs_lockdep_release(fs_info, btrfs_trans_num_writers);</div><div class='ctx'> 		kfree(cur_trans);</div><div class='ctx'> 		goto loop;</div><div class='ctx'> 	} else if (BTRFS_FS_ERROR(fs_info)) {</div><div class='ctx'> 		spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='add'>+		btrfs_lockdep_release(fs_info, btrfs_trans_num_extwriters);</div><div class='add'>+		btrfs_lockdep_release(fs_info, btrfs_trans_num_writers);</div><div class='ctx'> 		kfree(cur_trans);</div><div class='ctx'> 		return -EROFS;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -355,9 +358,8 @@ loop:</div><div class='ctx'> </div><div class='ctx'> 	memset(&amp;cur_trans-&gt;delayed_refs, 0, sizeof(cur_trans-&gt;delayed_refs));</div><div class='ctx'> </div><div class='del'>-	cur_trans-&gt;delayed_refs.href_root = RB_ROOT_CACHED;</div><div class='del'>-	cur_trans-&gt;delayed_refs.dirty_extent_root = RB_ROOT;</div><div class='del'>-	atomic_set(&amp;cur_trans-&gt;delayed_refs.num_entries, 0);</div><div class='add'>+	xa_init(&amp;cur_trans-&gt;delayed_refs.head_refs);</div><div class='add'>+	xa_init(&amp;cur_trans-&gt;delayed_refs.dirty_extents);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * although the tree mod log is per file system and not per transaction,</div><div class='hunk'>@@ -382,14 +384,12 @@ loop:</div><div class='ctx'> 	spin_lock_init(&amp;cur_trans-&gt;dirty_bgs_lock);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;cur_trans-&gt;deleted_bgs);</div><div class='ctx'> 	spin_lock_init(&amp;cur_trans-&gt;dropped_roots_lock);</div><div class='del'>-	INIT_LIST_HEAD(&amp;cur_trans-&gt;releasing_ebs);</div><div class='del'>-	spin_lock_init(&amp;cur_trans-&gt;releasing_ebs_lock);</div><div class='ctx'> 	list_add_tail(&amp;cur_trans-&gt;list, &amp;fs_info-&gt;trans_list);</div><div class='del'>-	extent_io_tree_init(fs_info, &amp;cur_trans-&gt;dirty_pages,</div><div class='del'>-			IO_TREE_TRANS_DIRTY_PAGES, fs_info-&gt;btree_inode);</div><div class='del'>-	extent_io_tree_init(fs_info, &amp;cur_trans-&gt;pinned_extents,</div><div class='del'>-			IO_TREE_FS_PINNED_EXTENTS, NULL);</div><div class='del'>-	fs_info-&gt;generation++;</div><div class='add'>+	btrfs_extent_io_tree_init(fs_info, &amp;cur_trans-&gt;dirty_pages,</div><div class='add'>+				  IO_TREE_TRANS_DIRTY_PAGES);</div><div class='add'>+	btrfs_extent_io_tree_init(fs_info, &amp;cur_trans-&gt;pinned_extents,</div><div class='add'>+				  IO_TREE_FS_PINNED_EXTENTS);</div><div class='add'>+	btrfs_set_fs_generation(fs_info, fs_info-&gt;generation + 1);</div><div class='ctx'> 	cur_trans-&gt;transid = fs_info-&gt;generation;</div><div class='ctx'> 	fs_info-&gt;running_transaction = cur_trans;</div><div class='ctx'> 	cur_trans-&gt;aborted = 0;</div><div class='hunk'>@@ -406,14 +406,13 @@ loop:</div><div class='ctx'>  */</div><div class='ctx'> static int record_root_in_trans(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			       struct btrfs_root *root,</div><div class='del'>-			       int force)</div><div class='add'>+			       bool force)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	if ((test_bit(BTRFS_ROOT_SHAREABLE, &amp;root-&gt;state) &amp;&amp;</div><div class='del'>-	    root-&gt;last_trans &lt; trans-&gt;transid) || force) {</div><div class='del'>-		WARN_ON(root == fs_info-&gt;extent_root);</div><div class='add'>+	    btrfs_get_root_last_trans(root) &lt; trans-&gt;transid) || force) {</div><div class='ctx'> 		WARN_ON(!force &amp;&amp; root-&gt;commit_root != root-&gt;node);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='hunk'>@@ -429,15 +428,15 @@ static int record_root_in_trans(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		smp_wmb();</div><div class='ctx'> </div><div class='ctx'> 		spin_lock(&amp;fs_info-&gt;fs_roots_radix_lock);</div><div class='del'>-		if (root-&gt;last_trans == trans-&gt;transid &amp;&amp; !force) {</div><div class='add'>+		if (btrfs_get_root_last_trans(root) == trans-&gt;transid &amp;&amp; !force) {</div><div class='ctx'> 			spin_unlock(&amp;fs_info-&gt;fs_roots_radix_lock);</div><div class='ctx'> 			return 0;</div><div class='ctx'> 		}</div><div class='ctx'> 		radix_tree_tag_set(&amp;fs_info-&gt;fs_roots_radix,</div><div class='del'>-				   (unsigned long)root-&gt;root_key.objectid,</div><div class='add'>+				   (unsigned long)btrfs_root_id(root),</div><div class='ctx'> 				   BTRFS_ROOT_TRANS_TAG);</div><div class='ctx'> 		spin_unlock(&amp;fs_info-&gt;fs_roots_radix_lock);</div><div class='del'>-		root-&gt;last_trans = trans-&gt;transid;</div><div class='add'>+		btrfs_set_root_last_trans(root, trans-&gt;transid);</div><div class='ctx'> </div><div class='ctx'> 		/* this is pretty tricky.  We don't want to</div><div class='ctx'> 		 * take the relocation lock in btrfs_record_root_in_trans</div><div class='hunk'>@@ -480,7 +479,7 @@ void btrfs_add_dropped_root(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	/* Make sure we don't try to update the root at commit time */</div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;fs_roots_radix_lock);</div><div class='ctx'> 	radix_tree_tag_clear(&amp;fs_info-&gt;fs_roots_radix,</div><div class='del'>-			     (unsigned long)root-&gt;root_key.objectid,</div><div class='add'>+			     (unsigned long)btrfs_root_id(root),</div><div class='ctx'> 			     BTRFS_ROOT_TRANS_TAG);</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;fs_roots_radix_lock);</div><div class='ctx'> }</div><div class='hunk'>@@ -499,7 +498,7 @@ int btrfs_record_root_in_trans(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * and barriers</div><div class='ctx'> 	 */</div><div class='ctx'> 	smp_rmb();</div><div class='del'>-	if (root-&gt;last_trans == trans-&gt;transid &amp;&amp;</div><div class='add'>+	if (btrfs_get_root_last_trans(root) == trans-&gt;transid &amp;&amp;</div><div class='ctx'> 	    !test_bit(BTRFS_ROOT_IN_TRANS_SETUP, &amp;root-&gt;state))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='hunk'>@@ -531,6 +530,7 @@ static void wait_current_trans(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 		refcount_inc(&amp;cur_trans-&gt;use_count);</div><div class='ctx'> 		spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='ctx'> </div><div class='add'>+		btrfs_might_wait_for_state(fs_info, BTRFS_LOCKDEP_TRANS_UNBLOCKED);</div><div class='ctx'> 		wait_event(fs_info-&gt;transaction_wait,</div><div class='ctx'> 			   cur_trans-&gt;state &gt;= TRANS_STATE_UNBLOCKED ||</div><div class='ctx'> 			   TRANS_ABORTED(cur_trans));</div><div class='hunk'>@@ -540,15 +540,15 @@ static void wait_current_trans(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int may_wait_transaction(struct btrfs_fs_info *fs_info, int type)</div><div class='add'>+static bool may_wait_transaction(struct btrfs_fs_info *fs_info, int type)</div><div class='ctx'> {</div><div class='ctx'> 	if (test_bit(BTRFS_FS_LOG_RECOVERING, &amp;fs_info-&gt;flags))</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	if (type == TRANS_START)</div><div class='del'>-		return 1;</div><div class='add'>+		return true;</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline bool need_reserve_reloc_root(struct btrfs_root *root)</div><div class='hunk'>@@ -557,13 +557,42 @@ static inline bool need_reserve_reloc_root(struct btrfs_root *root)</div><div class='ctx'> </div><div class='ctx'> 	if (!fs_info-&gt;reloc_ctl ||</div><div class='ctx'> 	    !test_bit(BTRFS_ROOT_SHAREABLE, &amp;root-&gt;state) ||</div><div class='del'>-	    root-&gt;root_key.objectid == BTRFS_TREE_RELOC_OBJECTID ||</div><div class='add'>+	    btrfs_root_id(root) == BTRFS_TREE_RELOC_OBJECTID ||</div><div class='ctx'> 	    root-&gt;reloc_root)</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int btrfs_reserve_trans_metadata(struct btrfs_fs_info *fs_info,</div><div class='add'>+					enum btrfs_reserve_flush_enum flush,</div><div class='add'>+					u64 num_bytes,</div><div class='add'>+					u64 *delayed_refs_bytes)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_space_info *si = fs_info-&gt;trans_block_rsv.space_info;</div><div class='add'>+	u64 bytes = num_bytes + *delayed_refs_bytes;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We want to reserve all the bytes we may need all at once, so we only</div><div class='add'>+	 * do 1 enospc flushing cycle per transaction start.</div><div class='add'>+	 */</div><div class='add'>+	ret = btrfs_reserve_metadata_bytes(si, bytes, flush);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If we are an emergency flush, which can steal from the global block</div><div class='add'>+	 * reserve, then attempt to not reserve space for the delayed refs, as</div><div class='add'>+	 * we will consume space for them from the global block reserve.</div><div class='add'>+	 */</div><div class='add'>+	if (ret &amp;&amp; flush == BTRFS_RESERVE_FLUSH_ALL_STEAL) {</div><div class='add'>+		bytes -= *delayed_refs_bytes;</div><div class='add'>+		*delayed_refs_bytes = 0;</div><div class='add'>+		ret = btrfs_reserve_metadata_bytes(si, bytes, flush);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static struct btrfs_trans_handle *</div><div class='ctx'> start_transaction(struct btrfs_root *root, unsigned int num_items,</div><div class='ctx'> 		  unsigned int type, enum btrfs_reserve_flush_enum flush,</div><div class='hunk'>@@ -571,10 +600,12 @@ start_transaction(struct btrfs_root *root, unsigned int num_items,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_block_rsv *delayed_refs_rsv = &amp;fs_info-&gt;delayed_refs_rsv;</div><div class='add'>+	struct btrfs_block_rsv *trans_rsv = &amp;fs_info-&gt;trans_block_rsv;</div><div class='ctx'> 	struct btrfs_trans_handle *h;</div><div class='ctx'> 	struct btrfs_transaction *cur_trans;</div><div class='ctx'> 	u64 num_bytes = 0;</div><div class='ctx'> 	u64 qgroup_reserved = 0;</div><div class='add'>+	u64 delayed_refs_bytes = 0;</div><div class='ctx'> 	bool reloc_reserved = false;</div><div class='ctx'> 	bool do_chunk_alloc = false;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -597,28 +628,27 @@ start_transaction(struct btrfs_root *root, unsigned int num_items,</div><div class='ctx'> 	 * the appropriate flushing if need be.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (num_items &amp;&amp; root != fs_info-&gt;chunk_root) {</div><div class='del'>-		struct btrfs_block_rsv *rsv = &amp;fs_info-&gt;trans_block_rsv;</div><div class='del'>-		u64 delayed_refs_bytes = 0;</div><div class='del'>-</div><div class='ctx'> 		qgroup_reserved = num_items * fs_info-&gt;nodesize;</div><div class='del'>-		ret = btrfs_qgroup_reserve_meta_pertrans(root, qgroup_reserved,</div><div class='del'>-				enforce_qgroups);</div><div class='add'>+		/*</div><div class='add'>+		 * Use prealloc for now, as there might be a currently running</div><div class='add'>+		 * transaction that could free this reserved space prematurely</div><div class='add'>+		 * by committing.</div><div class='add'>+		 */</div><div class='add'>+		ret = btrfs_qgroup_reserve_meta_prealloc(root, qgroup_reserved,</div><div class='add'>+							 enforce_qgroups, false);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ERR_PTR(ret);</div><div class='ctx'> </div><div class='add'>+		num_bytes = btrfs_calc_insert_metadata_size(fs_info, num_items);</div><div class='ctx'> 		/*</div><div class='del'>-		 * We want to reserve all the bytes we may need all at once, so</div><div class='del'>-		 * we only do 1 enospc flushing cycle per transaction start.  We</div><div class='del'>-		 * accomplish this by simply assuming we'll do 2 x num_items</div><div class='del'>-		 * worth of delayed refs updates in this trans handle, and</div><div class='del'>-		 * refill that amount for whatever is missing in the reserve.</div><div class='add'>+		 * If we plan to insert/update/delete "num_items" from a btree,</div><div class='add'>+		 * we will also generate delayed refs for extent buffers in the</div><div class='add'>+		 * respective btree paths, so reserve space for the delayed refs</div><div class='add'>+		 * that will be generated by the caller as it modifies btrees.</div><div class='add'>+		 * Try to reserve them to avoid excessive use of the global</div><div class='add'>+		 * block reserve.</div><div class='ctx'> 		 */</div><div class='del'>-		num_bytes = btrfs_calc_insert_metadata_size(fs_info, num_items);</div><div class='del'>-		if (flush == BTRFS_RESERVE_FLUSH_ALL &amp;&amp;</div><div class='del'>-		    delayed_refs_rsv-&gt;full == 0) {</div><div class='del'>-			delayed_refs_bytes = num_bytes;</div><div class='del'>-			num_bytes &lt;&lt;= 1;</div><div class='del'>-		}</div><div class='add'>+		delayed_refs_bytes = btrfs_calc_delayed_ref_bytes(fs_info, num_items);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Do the reservation for the relocation root creation</div><div class='hunk'>@@ -628,19 +658,17 @@ start_transaction(struct btrfs_root *root, unsigned int num_items,</div><div class='ctx'> 			reloc_reserved = true;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		ret = btrfs_block_rsv_add(root, rsv, num_bytes, flush);</div><div class='add'>+		ret = btrfs_reserve_trans_metadata(fs_info, flush, num_bytes,</div><div class='add'>+						   &amp;delayed_refs_bytes);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto reserve_fail;</div><div class='del'>-		if (delayed_refs_bytes) {</div><div class='del'>-			btrfs_migrate_to_delayed_refs_rsv(fs_info, rsv,</div><div class='del'>-							  delayed_refs_bytes);</div><div class='del'>-			num_bytes -= delayed_refs_bytes;</div><div class='del'>-		}</div><div class='ctx'> </div><div class='del'>-		if (rsv-&gt;space_info-&gt;force_alloc)</div><div class='add'>+		btrfs_block_rsv_add_bytes(trans_rsv, num_bytes, true);</div><div class='add'>+</div><div class='add'>+		if (trans_rsv-&gt;space_info-&gt;force_alloc)</div><div class='ctx'> 			do_chunk_alloc = true;</div><div class='ctx'> 	} else if (num_items == 0 &amp;&amp; flush == BTRFS_RESERVE_FLUSH_ALL &amp;&amp;</div><div class='del'>-		   !delayed_refs_rsv-&gt;full) {</div><div class='add'>+		   !btrfs_block_rsv_full(delayed_refs_rsv)) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Some people call with btrfs_start_transaction(root, 0)</div><div class='ctx'> 		 * because they can be throttled, but have some other mechanism</div><div class='hunk'>@@ -692,12 +720,12 @@ again:</div><div class='ctx'> </div><div class='ctx'> 	h-&gt;transid = cur_trans-&gt;transid;</div><div class='ctx'> 	h-&gt;transaction = cur_trans;</div><div class='del'>-	h-&gt;root = root;</div><div class='ctx'> 	refcount_set(&amp;h-&gt;use_count, 1);</div><div class='ctx'> 	h-&gt;fs_info = root-&gt;fs_info;</div><div class='ctx'> </div><div class='ctx'> 	h-&gt;type = type;</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;h-&gt;new_bgs);</div><div class='add'>+	btrfs_init_metadata_block_rsv(fs_info, &amp;h-&gt;delayed_rsv, BTRFS_BLOCK_RSV_DELOPS);</div><div class='ctx'> </div><div class='ctx'> 	smp_mb();</div><div class='ctx'> 	if (cur_trans-&gt;state &gt;= TRANS_STATE_COMMIT_START &amp;&amp;</div><div class='hunk'>@@ -710,8 +738,17 @@ again:</div><div class='ctx'> 	if (num_bytes) {</div><div class='ctx'> 		trace_btrfs_space_reservation(fs_info, "transaction",</div><div class='ctx'> 					      h-&gt;transid, num_bytes, 1);</div><div class='del'>-		h-&gt;block_rsv = &amp;fs_info-&gt;trans_block_rsv;</div><div class='add'>+		h-&gt;block_rsv = trans_rsv;</div><div class='ctx'> 		h-&gt;bytes_reserved = num_bytes;</div><div class='add'>+		if (delayed_refs_bytes &gt; 0) {</div><div class='add'>+			trace_btrfs_space_reservation(fs_info,</div><div class='add'>+						      "local_delayed_refs_rsv",</div><div class='add'>+						      h-&gt;transid,</div><div class='add'>+						      delayed_refs_bytes, 1);</div><div class='add'>+			h-&gt;delayed_refs_bytes_reserved = delayed_refs_bytes;</div><div class='add'>+			btrfs_block_rsv_add_bytes(&amp;h-&gt;delayed_rsv, delayed_refs_bytes, true);</div><div class='add'>+			delayed_refs_bytes = 0;</div><div class='add'>+		}</div><div class='ctx'> 		h-&gt;reloc_reserved = reloc_reserved;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -726,9 +763,10 @@ got_it:</div><div class='ctx'> 	 * value here.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (do_chunk_alloc &amp;&amp; num_bytes) {</div><div class='del'>-		u64 flags = h-&gt;block_rsv-&gt;space_info-&gt;flags;</div><div class='add'>+		struct btrfs_space_info *space_info = h-&gt;block_rsv-&gt;space_info;</div><div class='add'>+		u64 flags = space_info-&gt;flags;</div><div class='ctx'> </div><div class='del'>-		btrfs_chunk_alloc(h, btrfs_get_alloc_profile(fs_info, flags),</div><div class='add'>+		btrfs_chunk_alloc(h, space_info, btrfs_get_alloc_profile(fs_info, flags),</div><div class='ctx'> 				  CHUNK_ALLOC_NO_FORCE);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -748,8 +786,15 @@ got_it:</div><div class='ctx'> 		 * not just freed.</div><div class='ctx'> 		 */</div><div class='ctx'> 		btrfs_end_transaction(h);</div><div class='del'>-		return ERR_PTR(ret);</div><div class='add'>+		goto reserve_fail;</div><div class='ctx'> 	}</div><div class='add'>+	/*</div><div class='add'>+	 * Now that we have found a transaction to be a part of, convert the</div><div class='add'>+	 * qgroup reservation from prealloc to pertrans. A different transaction</div><div class='add'>+	 * can't race in and free our pertrans out from under us.</div><div class='add'>+	 */</div><div class='add'>+	if (qgroup_reserved)</div><div class='add'>+		btrfs_qgroup_convert_reserved_meta(root, qgroup_reserved);</div><div class='ctx'> </div><div class='ctx'> 	return h;</div><div class='ctx'> </div><div class='hunk'>@@ -759,10 +804,11 @@ join_fail:</div><div class='ctx'> 	kmem_cache_free(btrfs_trans_handle_cachep, h);</div><div class='ctx'> alloc_fail:</div><div class='ctx'> 	if (num_bytes)</div><div class='del'>-		btrfs_block_rsv_release(fs_info, &amp;fs_info-&gt;trans_block_rsv,</div><div class='del'>-					num_bytes, NULL);</div><div class='add'>+		btrfs_block_rsv_release(fs_info, trans_rsv, num_bytes, NULL);</div><div class='add'>+	if (delayed_refs_bytes)</div><div class='add'>+		btrfs_space_info_free_bytes_may_use(trans_rsv-&gt;space_info, delayed_refs_bytes);</div><div class='ctx'> reserve_fail:</div><div class='del'>-	btrfs_qgroup_free_meta_pertrans(root, qgroup_reserved);</div><div class='add'>+	btrfs_qgroup_free_meta_prealloc(root, qgroup_reserved);</div><div class='ctx'> 	return ERR_PTR(ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -795,7 +841,10 @@ struct btrfs_trans_handle *btrfs_join_transaction_spacecache(struct btrfs_root *</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Similar to regular join but it never starts a transaction when none is</div><div class='del'>- * running or after waiting for the current one to finish.</div><div class='add'>+ * running or when there's a running one at a state &gt;= TRANS_STATE_UNBLOCKED.</div><div class='add'>+ * This is similar to btrfs_attach_transaction() but it allows the join to</div><div class='add'>+ * happen if the transaction commit already started but it's not yet in the</div><div class='add'>+ * "doing" phase (the state is &lt; TRANS_STATE_COMMIT_DOING).</div><div class='ctx'>  */</div><div class='ctx'> struct btrfs_trans_handle *btrfs_join_transaction_nostart(struct btrfs_root *root)</div><div class='ctx'> {</div><div class='hunk'>@@ -804,7 +853,7 @@ struct btrfs_trans_handle *btrfs_join_transaction_nostart(struct btrfs_root *roo</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * btrfs_attach_transaction() - catch the running transaction</div><div class='add'>+ * Catch the running transaction.</div><div class='ctx'>  *</div><div class='ctx'>  * It is used when we want to commit the current the transaction, but</div><div class='ctx'>  * don't want to start a new one.</div><div class='hunk'>@@ -823,7 +872,7 @@ struct btrfs_trans_handle *btrfs_attach_transaction(struct btrfs_root *root)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * btrfs_attach_transaction_barrier() - catch the running transaction</div><div class='add'>+ * Catch the running transaction.</div><div class='ctx'>  *</div><div class='ctx'>  * It is similar to the above function, the difference is this one</div><div class='ctx'>  * will wait for all the inactive transactions until they fully</div><div class='hunk'>@@ -836,8 +885,13 @@ btrfs_attach_transaction_barrier(struct btrfs_root *root)</div><div class='ctx'> </div><div class='ctx'> 	trans = start_transaction(root, 0, TRANS_ATTACH,</div><div class='ctx'> 				  BTRFS_RESERVE_NO_FLUSH, true);</div><div class='del'>-	if (trans == ERR_PTR(-ENOENT))</div><div class='del'>-		btrfs_wait_for_commit(root-&gt;fs_info, 0);</div><div class='add'>+	if (trans == ERR_PTR(-ENOENT)) {</div><div class='add'>+		int ret;</div><div class='add'>+</div><div class='add'>+		ret = btrfs_wait_for_commit(root-&gt;fs_info, 0);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ERR_PTR(ret);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	return trans;</div><div class='ctx'> }</div><div class='hunk'>@@ -846,7 +900,46 @@ btrfs_attach_transaction_barrier(struct btrfs_root *root)</div><div class='ctx'> static noinline void wait_for_commit(struct btrfs_transaction *commit,</div><div class='ctx'> 				     const enum btrfs_trans_state min_state)</div><div class='ctx'> {</div><div class='del'>-	wait_event(commit-&gt;commit_wait, commit-&gt;state &gt;= min_state);</div><div class='add'>+	struct btrfs_fs_info *fs_info = commit-&gt;fs_info;</div><div class='add'>+	u64 transid = commit-&gt;transid;</div><div class='add'>+	bool put = false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * At the moment this function is called with min_state either being</div><div class='add'>+	 * TRANS_STATE_COMPLETED or TRANS_STATE_SUPER_COMMITTED.</div><div class='add'>+	 */</div><div class='add'>+	if (min_state == TRANS_STATE_COMPLETED)</div><div class='add'>+		btrfs_might_wait_for_state(fs_info, BTRFS_LOCKDEP_TRANS_COMPLETED);</div><div class='add'>+	else</div><div class='add'>+		btrfs_might_wait_for_state(fs_info, BTRFS_LOCKDEP_TRANS_SUPER_COMMITTED);</div><div class='add'>+</div><div class='add'>+	while (1) {</div><div class='add'>+		wait_event(commit-&gt;commit_wait, commit-&gt;state &gt;= min_state);</div><div class='add'>+		if (put)</div><div class='add'>+			btrfs_put_transaction(commit);</div><div class='add'>+</div><div class='add'>+		if (min_state &lt; TRANS_STATE_COMPLETED)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * A transaction isn't really completed until all of the</div><div class='add'>+		 * previous transactions are completed, but with fsync we can</div><div class='add'>+		 * end up with SUPER_COMMITTED transactions before a COMPLETED</div><div class='add'>+		 * transaction. Wait for those.</div><div class='add'>+		 */</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;fs_info-&gt;trans_lock);</div><div class='add'>+		commit = list_first_entry_or_null(&amp;fs_info-&gt;trans_list,</div><div class='add'>+						  struct btrfs_transaction,</div><div class='add'>+						  list);</div><div class='add'>+		if (!commit || commit-&gt;transid &gt; transid) {</div><div class='add'>+			spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		refcount_inc(&amp;commit-&gt;use_count);</div><div class='add'>+		put = true;</div><div class='add'>+		spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_wait_for_commit(struct btrfs_fs_info *fs_info, u64 transid)</div><div class='hunk'>@@ -855,7 +948,7 @@ int btrfs_wait_for_commit(struct btrfs_fs_info *fs_info, u64 transid)</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (transid) {</div><div class='del'>-		if (transid &lt;= fs_info-&gt;last_trans_committed)</div><div class='add'>+		if (transid &lt;= btrfs_get_last_trans_committed(fs_info))</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='ctx'> 		/* find specified transaction */</div><div class='hunk'>@@ -879,7 +972,7 @@ int btrfs_wait_for_commit(struct btrfs_fs_info *fs_info, u64 transid)</div><div class='ctx'> 		 * raced with btrfs_commit_transaction</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (!cur_trans) {</div><div class='del'>-			if (transid &gt; fs_info-&gt;last_trans_committed)</div><div class='add'>+			if (transid &gt; btrfs_get_last_trans_committed(fs_info))</div><div class='ctx'> 				ret = -EINVAL;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -902,6 +995,7 @@ int btrfs_wait_for_commit(struct btrfs_fs_info *fs_info, u64 transid)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	wait_for_commit(cur_trans, TRANS_STATE_COMPLETED);</div><div class='add'>+	ret = cur_trans-&gt;aborted;</div><div class='ctx'> 	btrfs_put_transaction(cur_trans);</div><div class='ctx'> out:</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -912,16 +1006,6 @@ void btrfs_throttle(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	wait_current_trans(fs_info);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool should_end_transaction(struct btrfs_trans_handle *trans)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='del'>-</div><div class='del'>-	if (btrfs_check_space_for_delayed_refs(fs_info))</div><div class='del'>-		return true;</div><div class='del'>-</div><div class='del'>-	return !!btrfs_block_rsv_check(&amp;fs_info-&gt;global_block_rsv, 5);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> bool btrfs_should_end_transaction(struct btrfs_trans_handle *trans)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_transaction *cur_trans = trans-&gt;transaction;</div><div class='hunk'>@@ -930,7 +1014,10 @@ bool btrfs_should_end_transaction(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	    test_bit(BTRFS_DELAYED_REFS_FLUSHING, &amp;cur_trans-&gt;delayed_refs.flags))</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='del'>-	return should_end_transaction(trans);</div><div class='add'>+	if (btrfs_check_space_for_delayed_refs(trans-&gt;fs_info))</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	return !!btrfs_block_rsv_check(&amp;trans-&gt;fs_info-&gt;global_block_rsv, 50);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void btrfs_trans_release_metadata(struct btrfs_trans_handle *trans)</div><div class='hunk'>@@ -939,12 +1026,20 @@ static void btrfs_trans_release_metadata(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> </div><div class='ctx'> 	if (!trans-&gt;block_rsv) {</div><div class='del'>-		ASSERT(!trans-&gt;bytes_reserved);</div><div class='add'>+		ASSERT(trans-&gt;bytes_reserved == 0,</div><div class='add'>+		       "trans-&gt;bytes_reserved=%llu", trans-&gt;bytes_reserved);</div><div class='add'>+		ASSERT(trans-&gt;delayed_refs_bytes_reserved == 0,</div><div class='add'>+		       "trans-&gt;delayed_refs_bytes_reserved=%llu",</div><div class='add'>+		       trans-&gt;delayed_refs_bytes_reserved);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!trans-&gt;bytes_reserved)</div><div class='add'>+	if (!trans-&gt;bytes_reserved) {</div><div class='add'>+		ASSERT(trans-&gt;delayed_refs_bytes_reserved == 0,</div><div class='add'>+		       "trans-&gt;delayed_refs_bytes_reserved=%llu",</div><div class='add'>+		       trans-&gt;delayed_refs_bytes_reserved);</div><div class='ctx'> 		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	ASSERT(trans-&gt;block_rsv == &amp;fs_info-&gt;trans_block_rsv);</div><div class='ctx'> 	trace_btrfs_space_reservation(fs_info, "transaction",</div><div class='hunk'>@@ -952,6 +1047,16 @@ static void btrfs_trans_release_metadata(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	btrfs_block_rsv_release(fs_info, trans-&gt;block_rsv,</div><div class='ctx'> 				trans-&gt;bytes_reserved, NULL);</div><div class='ctx'> 	trans-&gt;bytes_reserved = 0;</div><div class='add'>+</div><div class='add'>+	if (!trans-&gt;delayed_refs_bytes_reserved)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	trace_btrfs_space_reservation(fs_info, "local_delayed_refs_rsv",</div><div class='add'>+				      trans-&gt;transid,</div><div class='add'>+				      trans-&gt;delayed_refs_bytes_reserved, 0);</div><div class='add'>+	btrfs_block_rsv_release(fs_info, &amp;trans-&gt;delayed_rsv,</div><div class='add'>+				trans-&gt;delayed_refs_bytes_reserved, NULL);</div><div class='add'>+	trans-&gt;delayed_refs_bytes_reserved = 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int __btrfs_end_transaction(struct btrfs_trans_handle *trans,</div><div class='hunk'>@@ -959,7 +1064,7 @@ static int __btrfs_end_transaction(struct btrfs_trans_handle *trans,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_transaction *cur_trans = trans-&gt;transaction;</div><div class='del'>-	int err = 0;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (refcount_read(&amp;trans-&gt;use_count) &gt; 1) {</div><div class='ctx'> 		refcount_dec(&amp;trans-&gt;use_count);</div><div class='hunk'>@@ -983,6 +1088,10 @@ static int __btrfs_end_transaction(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	extwriter_counter_dec(cur_trans, trans-&gt;type);</div><div class='ctx'> </div><div class='ctx'> 	cond_wake_up(&amp;cur_trans-&gt;writer_wait);</div><div class='add'>+</div><div class='add'>+	btrfs_lockdep_release(info, btrfs_trans_num_extwriters);</div><div class='add'>+	btrfs_lockdep_release(info, btrfs_trans_num_writers);</div><div class='add'>+</div><div class='ctx'> 	btrfs_put_transaction(cur_trans);</div><div class='ctx'> </div><div class='ctx'> 	if (current-&gt;journal_info == trans)</div><div class='hunk'>@@ -994,13 +1103,13 @@ static int __btrfs_end_transaction(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	if (TRANS_ABORTED(trans) || BTRFS_FS_ERROR(info)) {</div><div class='ctx'> 		wake_up_process(info-&gt;transaction_kthread);</div><div class='ctx'> 		if (TRANS_ABORTED(trans))</div><div class='del'>-			err = trans-&gt;aborted;</div><div class='add'>+			ret = trans-&gt;aborted;</div><div class='ctx'> 		else</div><div class='del'>-			err = -EROFS;</div><div class='add'>+			ret = -EROFS;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	kmem_cache_free(btrfs_trans_handle_cachep, trans);</div><div class='del'>-	return err;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_end_transaction(struct btrfs_trans_handle *trans)</div><div class='hunk'>@@ -1021,21 +1130,19 @@ int btrfs_end_transaction_throttle(struct btrfs_trans_handle *trans)</div><div class='ctx'> int btrfs_write_marked_extents(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			       struct extent_io_tree *dirty_pages, int mark)</div><div class='ctx'> {</div><div class='del'>-	int err = 0;</div><div class='del'>-	int werr = 0;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> 	struct address_space *mapping = fs_info-&gt;btree_inode-&gt;i_mapping;</div><div class='ctx'> 	struct extent_state *cached_state = NULL;</div><div class='ctx'> 	u64 start = 0;</div><div class='ctx'> 	u64 end;</div><div class='ctx'> </div><div class='del'>-	atomic_inc(&amp;BTRFS_I(fs_info-&gt;btree_inode)-&gt;sync_writers);</div><div class='del'>-	while (!find_first_extent_bit(dirty_pages, start, &amp;start, &amp;end,</div><div class='del'>-				      mark, &amp;cached_state)) {</div><div class='add'>+	while (btrfs_find_first_extent_bit(dirty_pages, start, &amp;start, &amp;end,</div><div class='add'>+					   mark, &amp;cached_state)) {</div><div class='ctx'> 		bool wait_writeback = false;</div><div class='ctx'> </div><div class='del'>-		err = convert_extent_bit(dirty_pages, start, end,</div><div class='del'>-					 EXTENT_NEED_WAIT,</div><div class='del'>-					 mark, &amp;cached_state);</div><div class='add'>+		ret = btrfs_convert_extent_bit(dirty_pages, start, end,</div><div class='add'>+					       EXTENT_NEED_WAIT,</div><div class='add'>+					       mark, &amp;cached_state);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * convert_extent_bit can return -ENOMEM, which is most of the</div><div class='ctx'> 		 * time a temporary error. So when it happens, ignore the error</div><div class='hunk'>@@ -1049,23 +1156,22 @@ int btrfs_write_marked_extents(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		 * We cleanup any entries left in the io tree when committing</div><div class='ctx'> 		 * the transaction (through extent_io_tree_release()).</div><div class='ctx'> 		 */</div><div class='del'>-		if (err == -ENOMEM) {</div><div class='del'>-			err = 0;</div><div class='add'>+		if (ret == -ENOMEM) {</div><div class='add'>+			ret = 0;</div><div class='ctx'> 			wait_writeback = true;</div><div class='ctx'> 		}</div><div class='del'>-		if (!err)</div><div class='del'>-			err = filemap_fdatawrite_range(mapping, start, end);</div><div class='del'>-		if (err)</div><div class='del'>-			werr = err;</div><div class='del'>-		else if (wait_writeback)</div><div class='del'>-			werr = filemap_fdatawait_range(mapping, start, end);</div><div class='del'>-		free_extent_state(cached_state);</div><div class='add'>+		if (!ret)</div><div class='add'>+			ret = filemap_fdatawrite_range(mapping, start, end);</div><div class='add'>+		if (!ret &amp;&amp; wait_writeback)</div><div class='add'>+			btrfs_btree_wait_writeback_range(fs_info, start, end);</div><div class='add'>+		btrfs_free_extent_state(cached_state);</div><div class='add'>+		if (ret)</div><div class='add'>+			break;</div><div class='ctx'> 		cached_state = NULL;</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 		start = end + 1;</div><div class='ctx'> 	}</div><div class='del'>-	atomic_dec(&amp;BTRFS_I(fs_info-&gt;btree_inode)-&gt;sync_writers);</div><div class='del'>-	return werr;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1077,15 +1183,13 @@ int btrfs_write_marked_extents(struct btrfs_fs_info *fs_info,</div><div class='ctx'> static int __btrfs_wait_marked_extents(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				       struct extent_io_tree *dirty_pages)</div><div class='ctx'> {</div><div class='del'>-	int err = 0;</div><div class='del'>-	int werr = 0;</div><div class='del'>-	struct address_space *mapping = fs_info-&gt;btree_inode-&gt;i_mapping;</div><div class='ctx'> 	struct extent_state *cached_state = NULL;</div><div class='ctx'> 	u64 start = 0;</div><div class='ctx'> 	u64 end;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	while (!find_first_extent_bit(dirty_pages, start, &amp;start, &amp;end,</div><div class='del'>-				      EXTENT_NEED_WAIT, &amp;cached_state)) {</div><div class='add'>+	while (btrfs_find_first_extent_bit(dirty_pages, start, &amp;start, &amp;end,</div><div class='add'>+					   EXTENT_NEED_WAIT, &amp;cached_state)) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Ignore -ENOMEM errors returned by clear_extent_bit().</div><div class='ctx'> 		 * When committing the transaction, we'll remove any entries</div><div class='hunk'>@@ -1094,37 +1198,35 @@ static int __btrfs_wait_marked_extents(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		 * concurrently - we do it only at transaction commit time when</div><div class='ctx'> 		 * it's safe to do it (through extent_io_tree_release()).</div><div class='ctx'> 		 */</div><div class='del'>-		err = clear_extent_bit(dirty_pages, start, end,</div><div class='del'>-				       EXTENT_NEED_WAIT, 0, 0, &amp;cached_state);</div><div class='del'>-		if (err == -ENOMEM)</div><div class='del'>-			err = 0;</div><div class='del'>-		if (!err)</div><div class='del'>-			err = filemap_fdatawait_range(mapping, start, end);</div><div class='del'>-		if (err)</div><div class='del'>-			werr = err;</div><div class='del'>-		free_extent_state(cached_state);</div><div class='add'>+		ret = btrfs_clear_extent_bit(dirty_pages, start, end,</div><div class='add'>+					     EXTENT_NEED_WAIT, &amp;cached_state);</div><div class='add'>+		if (ret == -ENOMEM)</div><div class='add'>+			ret = 0;</div><div class='add'>+		if (!ret)</div><div class='add'>+			btrfs_btree_wait_writeback_range(fs_info, start, end);</div><div class='add'>+		btrfs_free_extent_state(cached_state);</div><div class='add'>+		if (ret)</div><div class='add'>+			break;</div><div class='ctx'> 		cached_state = NULL;</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 		start = end + 1;</div><div class='ctx'> 	}</div><div class='del'>-	if (err)</div><div class='del'>-		werr = err;</div><div class='del'>-	return werr;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int btrfs_wait_extents(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		       struct extent_io_tree *dirty_pages)</div><div class='ctx'> {</div><div class='ctx'> 	bool errors = false;</div><div class='del'>-	int err;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	err = __btrfs_wait_marked_extents(fs_info, dirty_pages);</div><div class='add'>+	ret = __btrfs_wait_marked_extents(fs_info, dirty_pages);</div><div class='ctx'> 	if (test_and_clear_bit(BTRFS_FS_BTREE_ERR, &amp;fs_info-&gt;flags))</div><div class='ctx'> 		errors = true;</div><div class='ctx'> </div><div class='del'>-	if (errors &amp;&amp; !err)</div><div class='del'>-		err = -EIO;</div><div class='del'>-	return err;</div><div class='add'>+	if (errors &amp;&amp; !ret)</div><div class='add'>+		ret = -EIO;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_wait_tree_log_extents(struct btrfs_root *log_root, int mark)</div><div class='hunk'>@@ -1132,22 +1234,23 @@ int btrfs_wait_tree_log_extents(struct btrfs_root *log_root, int mark)</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = log_root-&gt;fs_info;</div><div class='ctx'> 	struct extent_io_tree *dirty_pages = &amp;log_root-&gt;dirty_log_pages;</div><div class='ctx'> 	bool errors = false;</div><div class='del'>-	int err;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	ASSERT(log_root-&gt;root_key.objectid == BTRFS_TREE_LOG_OBJECTID);</div><div class='add'>+	ASSERT(btrfs_root_id(log_root) == BTRFS_TREE_LOG_OBJECTID,</div><div class='add'>+	       "root_id(log_root)=%llu", btrfs_root_id(log_root));</div><div class='ctx'> </div><div class='del'>-	err = __btrfs_wait_marked_extents(fs_info, dirty_pages);</div><div class='del'>-	if ((mark &amp; EXTENT_DIRTY) &amp;&amp;</div><div class='add'>+	ret = __btrfs_wait_marked_extents(fs_info, dirty_pages);</div><div class='add'>+	if ((mark &amp; EXTENT_DIRTY_LOG1) &amp;&amp;</div><div class='ctx'> 	    test_and_clear_bit(BTRFS_FS_LOG1_ERR, &amp;fs_info-&gt;flags))</div><div class='ctx'> 		errors = true;</div><div class='ctx'> </div><div class='del'>-	if ((mark &amp; EXTENT_NEW) &amp;&amp;</div><div class='add'>+	if ((mark &amp; EXTENT_DIRTY_LOG2) &amp;&amp;</div><div class='ctx'> 	    test_and_clear_bit(BTRFS_FS_LOG2_ERR, &amp;fs_info-&gt;flags))</div><div class='ctx'> 		errors = true;</div><div class='ctx'> </div><div class='del'>-	if (errors &amp;&amp; !err)</div><div class='del'>-		err = -EIO;</div><div class='del'>-	return err;</div><div class='add'>+	if (errors &amp;&amp; !ret)</div><div class='add'>+		ret = -EIO;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1170,7 +1273,7 @@ static int btrfs_write_and_wait_transaction(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	blk_finish_plug(&amp;plug);</div><div class='ctx'> 	ret2 = btrfs_wait_extents(fs_info, dirty_pages);</div><div class='ctx'> </div><div class='del'>-	extent_io_tree_release(&amp;trans-&gt;transaction-&gt;dirty_pages);</div><div class='add'>+	btrfs_extent_io_tree_release(&amp;trans-&gt;transaction-&gt;dirty_pages);</div><div class='ctx'> </div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -1232,10 +1335,16 @@ static noinline int commit_cowonly_roots(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct list_head *dirty_bgs = &amp;trans-&gt;transaction-&gt;dirty_bgs;</div><div class='ctx'> 	struct list_head *io_bgs = &amp;trans-&gt;transaction-&gt;io_bgs;</div><div class='del'>-	struct list_head *next;</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * At this point no one can be using this transaction to modify any tree</div><div class='add'>+	 * and no one can start another transaction to modify any tree either.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(trans-&gt;transaction-&gt;state == TRANS_STATE_COMMIT_DOING,</div><div class='add'>+	       "trans-&gt;transaction-&gt;state=%d", trans-&gt;transaction-&gt;state);</div><div class='add'>+</div><div class='ctx'> 	eb = btrfs_lock_root_node(fs_info-&gt;tree_root);</div><div class='ctx'> 	ret = btrfs_cow_block(trans, fs_info-&gt;tree_root, eb, NULL,</div><div class='ctx'> 			      0, &amp;eb, BTRFS_NESTING_COW);</div><div class='hunk'>@@ -1262,21 +1371,20 @@ static noinline int commit_cowonly_roots(struct btrfs_trans_handle *trans)</div><div class='ctx'> again:</div><div class='ctx'> 	while (!list_empty(&amp;fs_info-&gt;dirty_cowonly_roots)) {</div><div class='ctx'> 		struct btrfs_root *root;</div><div class='del'>-		next = fs_info-&gt;dirty_cowonly_roots.next;</div><div class='del'>-		list_del_init(next);</div><div class='del'>-		root = list_entry(next, struct btrfs_root, dirty_list);</div><div class='add'>+</div><div class='add'>+		root = list_first_entry(&amp;fs_info-&gt;dirty_cowonly_roots,</div><div class='add'>+					struct btrfs_root, dirty_list);</div><div class='ctx'> 		clear_bit(BTRFS_ROOT_DIRTY, &amp;root-&gt;state);</div><div class='add'>+		list_move_tail(&amp;root-&gt;dirty_list,</div><div class='add'>+			       &amp;trans-&gt;transaction-&gt;switch_commits);</div><div class='ctx'> </div><div class='del'>-		if (root != fs_info-&gt;extent_root)</div><div class='del'>-			list_add_tail(&amp;root-&gt;dirty_list,</div><div class='del'>-				      &amp;trans-&gt;transaction-&gt;switch_commits);</div><div class='ctx'> 		ret = update_cowonly_root(trans, root);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Now flush any delayed refs generated by updating all of the roots */</div><div class='del'>-	ret = btrfs_run_delayed_refs(trans, (unsigned long)-1);</div><div class='add'>+	ret = btrfs_run_delayed_refs(trans, U64_MAX);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='hunk'>@@ -1291,7 +1399,7 @@ again:</div><div class='ctx'> 		 * so we want to keep this flushing in this loop to make sure</div><div class='ctx'> 		 * everything gets run.</div><div class='ctx'> 		 */</div><div class='del'>-		ret = btrfs_run_delayed_refs(trans, (unsigned long)-1);</div><div class='add'>+		ret = btrfs_run_delayed_refs(trans, U64_MAX);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1299,9 +1407,6 @@ again:</div><div class='ctx'> 	if (!list_empty(&amp;fs_info-&gt;dirty_cowonly_roots))</div><div class='ctx'> 		goto again;</div><div class='ctx'> </div><div class='del'>-	list_add_tail(&amp;fs_info-&gt;extent_root-&gt;dirty_list,</div><div class='del'>-		      &amp;trans-&gt;transaction-&gt;switch_commits);</div><div class='del'>-</div><div class='ctx'> 	/* Update dev-replace pointer once everything is committed */</div><div class='ctx'> 	fs_info-&gt;dev_replace.committed_cursor_left =</div><div class='ctx'> 		fs_info-&gt;dev_replace.cursor_left_last_write_of_item;</div><div class='hunk'>@@ -1310,6 +1415,32 @@ again:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * If we had a pending drop we need to see if there are any others left in our</div><div class='add'>+ * dead roots list, and if not clear our bit and wake any waiters.</div><div class='add'>+ */</div><div class='add'>+void btrfs_maybe_wake_unfinished_drop(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	/*</div><div class='add'>+	 * We put the drop in progress roots at the front of the list, so if the</div><div class='add'>+	 * first entry doesn't have UNFINISHED_DROP set we can wake everybody</div><div class='add'>+	 * up.</div><div class='add'>+	 */</div><div class='add'>+	spin_lock(&amp;fs_info-&gt;trans_lock);</div><div class='add'>+	if (!list_empty(&amp;fs_info-&gt;dead_roots)) {</div><div class='add'>+		struct btrfs_root *root = list_first_entry(&amp;fs_info-&gt;dead_roots,</div><div class='add'>+							   struct btrfs_root,</div><div class='add'>+							   root_list);</div><div class='add'>+		if (test_bit(BTRFS_ROOT_UNFINISHED_DROP, &amp;root-&gt;state)) {</div><div class='add'>+			spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='add'>+</div><div class='add'>+	btrfs_wake_unfinished_drop(fs_info);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * dead roots are old snapshots that need to be deleted.  This allocates</div><div class='ctx'>  * a dirty root struct and adds it into the list of dead roots that need to</div><div class='ctx'>  * be deleted</div><div class='hunk'>@@ -1321,13 +1452,19 @@ void btrfs_add_dead_root(struct btrfs_root *root)</div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;trans_lock);</div><div class='ctx'> 	if (list_empty(&amp;root-&gt;root_list)) {</div><div class='ctx'> 		btrfs_grab_root(root);</div><div class='del'>-		list_add_tail(&amp;root-&gt;root_list, &amp;fs_info-&gt;dead_roots);</div><div class='add'>+</div><div class='add'>+		/* We want to process the partially complete drops first. */</div><div class='add'>+		if (test_bit(BTRFS_ROOT_UNFINISHED_DROP, &amp;root-&gt;state))</div><div class='add'>+			list_add(&amp;root-&gt;root_list, &amp;fs_info-&gt;dead_roots);</div><div class='add'>+		else</div><div class='add'>+			list_add_tail(&amp;root-&gt;root_list, &amp;fs_info-&gt;dead_roots);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * update all the cowonly tree roots on disk</div><div class='add'>+ * Update each subvolume root and its relocation root, if it exists, in the tree</div><div class='add'>+ * of tree roots. Also free log roots if they exist.</div><div class='ctx'>  */</div><div class='ctx'> static noinline int commit_fs_roots(struct btrfs_trans_handle *trans)</div><div class='ctx'> {</div><div class='hunk'>@@ -1336,6 +1473,13 @@ static noinline int commit_fs_roots(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	int i;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * At this point no one can be using this transaction to modify any tree</div><div class='add'>+	 * and no one can start another transaction to modify any tree either.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(trans-&gt;transaction-&gt;state == TRANS_STATE_COMMIT_DOING,</div><div class='add'>+	       "trans-&gt;transaction-&gt;state=%d", trans-&gt;transaction-&gt;state);</div><div class='add'>+</div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;fs_roots_radix_lock);</div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		ret = radix_tree_gang_lookup_tag(&amp;fs_info-&gt;fs_roots_radix,</div><div class='hunk'>@@ -1348,9 +1492,24 @@ static noinline int commit_fs_roots(struct btrfs_trans_handle *trans)</div><div class='ctx'> 			struct btrfs_root *root = gang[i];</div><div class='ctx'> 			int ret2;</div><div class='ctx'> </div><div class='add'>+			/*</div><div class='add'>+			 * At this point we can neither have tasks logging inodes</div><div class='add'>+			 * from a root nor trying to commit a log tree.</div><div class='add'>+			 */</div><div class='add'>+			ASSERT(atomic_read(&amp;root-&gt;log_writers) == 0,</div><div class='add'>+			       "atomic_read(&amp;root-&gt;log_writers)=%d",</div><div class='add'>+			       atomic_read(&amp;root-&gt;log_writers));</div><div class='add'>+			ASSERT(atomic_read(&amp;root-&gt;log_commit[0]) == 0,</div><div class='add'>+			       "atomic_read(&amp;root-&gt;log_commit[0])=%d",</div><div class='add'>+			       atomic_read(&amp;root-&gt;log_commit[0]));</div><div class='add'>+			ASSERT(atomic_read(&amp;root-&gt;log_commit[1]) == 0,</div><div class='add'>+			       "atomic_read(&amp;root-&gt;log_commit[1])=%d",</div><div class='add'>+			       atomic_read(&amp;root-&gt;log_commit[1]));</div><div class='add'>+</div><div class='ctx'> 			radix_tree_tag_clear(&amp;fs_info-&gt;fs_roots_radix,</div><div class='del'>-					(unsigned long)root-&gt;root_key.objectid,</div><div class='add'>+					(unsigned long)btrfs_root_id(root),</div><div class='ctx'> 					BTRFS_ROOT_TRANS_TAG);</div><div class='add'>+			btrfs_qgroup_free_meta_all_pertrans(root);</div><div class='ctx'> 			spin_unlock(&amp;fs_info-&gt;fs_roots_radix_lock);</div><div class='ctx'> </div><div class='ctx'> 			btrfs_free_log(trans, root);</div><div class='hunk'>@@ -1375,7 +1534,6 @@ static noinline int commit_fs_roots(struct btrfs_trans_handle *trans)</div><div class='ctx'> 			if (ret2)</div><div class='ctx'> 				return ret2;</div><div class='ctx'> 			spin_lock(&amp;fs_info-&gt;fs_roots_radix_lock);</div><div class='del'>-			btrfs_qgroup_free_meta_all_pertrans(root);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;fs_roots_radix_lock);</div><div class='hunk'>@@ -1383,45 +1541,6 @@ static noinline int commit_fs_roots(struct btrfs_trans_handle *trans)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * defrag a given btree.</div><div class='del'>- * Every leaf in the btree is read and defragged.</div><div class='del'>- */</div><div class='del'>-int btrfs_defrag_root(struct btrfs_root *root)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *info = root-&gt;fs_info;</div><div class='del'>-	struct btrfs_trans_handle *trans;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (test_and_set_bit(BTRFS_ROOT_DEFRAG_RUNNING, &amp;root-&gt;state))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	while (1) {</div><div class='del'>-		trans = btrfs_start_transaction(root, 0);</div><div class='del'>-		if (IS_ERR(trans)) {</div><div class='del'>-			ret = PTR_ERR(trans);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		ret = btrfs_defrag_leaves(trans, root);</div><div class='del'>-</div><div class='del'>-		btrfs_end_transaction(trans);</div><div class='del'>-		btrfs_btree_balance_dirty(info);</div><div class='del'>-		cond_resched();</div><div class='del'>-</div><div class='del'>-		if (btrfs_fs_closing(info) || ret != -EAGAIN)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		if (btrfs_defrag_cancelled(info)) {</div><div class='del'>-			btrfs_debug(info, "defrag_root cancelled");</div><div class='del'>-			ret = -EAGAIN;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	clear_bit(BTRFS_ROOT_DEFRAG_RUNNING, &amp;root-&gt;state);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * Do all special snapshot related qgroup dirty hack.</div><div class='ctx'>  *</div><div class='ctx'>  * Will do all needed qgroup inherit and dirty hack like switch commit</div><div class='hunk'>@@ -1438,11 +1557,10 @@ static int qgroup_account_snapshot(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Save some performance in the case that qgroups are not</div><div class='del'>-	 * enabled. If this check races with the ioctl, rescan will</div><div class='del'>-	 * kick in anyway.</div><div class='add'>+	 * Save some performance in the case that qgroups are not enabled. If</div><div class='add'>+	 * this check races with the ioctl, rescan will kick in anyway.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!test_bit(BTRFS_FS_QUOTA_ENABLED, &amp;fs_info-&gt;flags))</div><div class='add'>+	if (!btrfs_qgroup_full_accounting(fs_info))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1466,18 +1584,12 @@ static int qgroup_account_snapshot(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * for now flush the delayed refs to narrow the race window where the</div><div class='ctx'> 	 * qgroup counters could end up wrong.</div><div class='ctx'> 	 */</div><div class='del'>-	ret = btrfs_run_delayed_refs(trans, (unsigned long)-1);</div><div class='del'>-	if (ret) {</div><div class='add'>+	ret = btrfs_run_delayed_refs(trans, U64_MAX);</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * We are going to commit transaction, see btrfs_commit_transaction()</div><div class='del'>-	 * comment for reason locking tree_log_mutex</div><div class='del'>-	 */</div><div class='del'>-	mutex_lock(&amp;fs_info-&gt;tree_log_mutex);</div><div class='del'>-</div><div class='ctx'> 	ret = commit_fs_roots(trans);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -1486,8 +1598,8 @@ static int qgroup_account_snapshot(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	/* Now qgroup are all updated, we can inherit it to new qgroups */</div><div class='del'>-	ret = btrfs_qgroup_inherit(trans, src-&gt;root_key.objectid, dst_objectid,</div><div class='del'>-				   inherit);</div><div class='add'>+	ret = btrfs_qgroup_inherit(trans, btrfs_root_id(src), dst_objectid,</div><div class='add'>+				   btrfs_root_id(parent), inherit);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -1513,8 +1625,6 @@ static int qgroup_account_snapshot(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			"Error while writing out transaction for qgroup");</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	mutex_unlock(&amp;fs_info-&gt;tree_log_mutex);</div><div class='del'>-</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Force parent root to be updated, as we recorded it before so its</div><div class='ctx'> 	 * last_trans == cur_transid.</div><div class='hunk'>@@ -1546,10 +1656,9 @@ static noinline int create_pending_snapshot(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	struct btrfs_root *root = pending-&gt;root;</div><div class='ctx'> 	struct btrfs_root *parent_root;</div><div class='ctx'> 	struct btrfs_block_rsv *rsv;</div><div class='del'>-	struct inode *parent_inode;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	struct btrfs_inode *parent_inode = pending-&gt;dir;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_dir_item *dir_item;</div><div class='del'>-	struct dentry *dentry;</div><div class='ctx'> 	struct extent_buffer *tmp;</div><div class='ctx'> 	struct extent_buffer *old;</div><div class='ctx'> 	struct timespec64 cur_time;</div><div class='hunk'>@@ -1558,6 +1667,8 @@ static noinline int create_pending_snapshot(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	u64 index = 0;</div><div class='ctx'> 	u64 objectid;</div><div class='ctx'> 	u64 root_flags;</div><div class='add'>+	unsigned int nofs_flags;</div><div class='add'>+	struct fscrypt_name fname;</div><div class='ctx'> </div><div class='ctx'> 	ASSERT(pending-&gt;path);</div><div class='ctx'> 	path = pending-&gt;path;</div><div class='hunk'>@@ -1565,9 +1676,22 @@ static noinline int create_pending_snapshot(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	ASSERT(pending-&gt;root_item);</div><div class='ctx'> 	new_root_item = pending-&gt;root_item;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * We're inside a transaction and must make sure that any potential</div><div class='add'>+	 * allocations with GFP_KERNEL in fscrypt won't recurse back to</div><div class='add'>+	 * filesystem.</div><div class='add'>+	 */</div><div class='add'>+	nofs_flags = memalloc_nofs_save();</div><div class='add'>+	pending-&gt;error = fscrypt_setup_filename(&amp;parent_inode-&gt;vfs_inode,</div><div class='add'>+						&amp;pending-&gt;dentry-&gt;d_name, 0,</div><div class='add'>+						&amp;fname);</div><div class='add'>+	memalloc_nofs_restore(nofs_flags);</div><div class='add'>+	if (pending-&gt;error)</div><div class='add'>+		goto free_pending;</div><div class='add'>+</div><div class='ctx'> 	pending-&gt;error = btrfs_get_free_objectid(tree_root, &amp;objectid);</div><div class='ctx'> 	if (pending-&gt;error)</div><div class='del'>-		goto no_free_objectid;</div><div class='add'>+		goto free_fname;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Make qgroup to skip current new snapshot's qgroupid, as it is</div><div class='hunk'>@@ -1578,7 +1702,7 @@ static noinline int create_pending_snapshot(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	btrfs_reloc_pre_snapshot(pending, &amp;to_reserve);</div><div class='ctx'> </div><div class='ctx'> 	if (to_reserve &gt; 0) {</div><div class='del'>-		pending-&gt;error = btrfs_block_rsv_add(root,</div><div class='add'>+		pending-&gt;error = btrfs_block_rsv_add(fs_info,</div><div class='ctx'> 						     &amp;pending-&gt;block_rsv,</div><div class='ctx'> 						     to_reserve,</div><div class='ctx'> 						     BTRFS_RESERVE_NO_FLUSH);</div><div class='hunk'>@@ -1586,35 +1710,31 @@ static noinline int create_pending_snapshot(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			goto clear_skip_qgroup;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	key.objectid = objectid;</div><div class='del'>-	key.offset = (u64)-1;</div><div class='del'>-	key.type = BTRFS_ROOT_ITEM_KEY;</div><div class='del'>-</div><div class='ctx'> 	rsv = trans-&gt;block_rsv;</div><div class='ctx'> 	trans-&gt;block_rsv = &amp;pending-&gt;block_rsv;</div><div class='ctx'> 	trans-&gt;bytes_reserved = trans-&gt;block_rsv-&gt;reserved;</div><div class='ctx'> 	trace_btrfs_space_reservation(fs_info, "transaction",</div><div class='ctx'> 				      trans-&gt;transid,</div><div class='ctx'> 				      trans-&gt;bytes_reserved, 1);</div><div class='del'>-	dentry = pending-&gt;dentry;</div><div class='del'>-	parent_inode = pending-&gt;dir;</div><div class='del'>-	parent_root = BTRFS_I(parent_inode)-&gt;root;</div><div class='add'>+	parent_root = parent_inode-&gt;root;</div><div class='ctx'> 	ret = record_root_in_trans(trans, parent_root, 0);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto fail;</div><div class='del'>-	cur_time = current_time(parent_inode);</div><div class='add'>+	cur_time = current_time(&amp;parent_inode-&gt;vfs_inode);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * insert the directory item</div><div class='ctx'> 	 */</div><div class='del'>-	ret = btrfs_set_inode_index(BTRFS_I(parent_inode), &amp;index);</div><div class='del'>-	BUG_ON(ret); /* -ENOMEM */</div><div class='add'>+	ret = btrfs_set_inode_index(parent_inode, &amp;index);</div><div class='add'>+	if (unlikely(ret)) {</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		goto fail;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* check if there is a file/dir which has the same name. */</div><div class='ctx'> 	dir_item = btrfs_lookup_dir_item(NULL, parent_root, path,</div><div class='del'>-					 btrfs_ino(BTRFS_I(parent_inode)),</div><div class='del'>-					 dentry-&gt;d_name.name,</div><div class='del'>-					 dentry-&gt;d_name.len, 0);</div><div class='add'>+					 btrfs_ino(parent_inode),</div><div class='add'>+					 &amp;fname.disk_name, 0);</div><div class='ctx'> 	if (dir_item != NULL &amp;&amp; !IS_ERR(dir_item)) {</div><div class='ctx'> 		pending-&gt;error = -EEXIST;</div><div class='ctx'> 		goto dir_item_existed;</div><div class='hunk'>@@ -1625,6 +1745,14 @@ static noinline int create_pending_snapshot(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	}</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='add'>+	ret = btrfs_create_qgroup(trans, objectid);</div><div class='add'>+	if (ret &amp;&amp; ret != -EEXIST) {</div><div class='add'>+		if (unlikely(ret != -ENOTCONN || btrfs_qgroup_enabled(fs_info))) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			goto fail;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * pull in the delayed directory update</div><div class='ctx'> 	 * and the delayed inode item</div><div class='hunk'>@@ -1632,13 +1760,13 @@ static noinline int create_pending_snapshot(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * snapshot</div><div class='ctx'> 	 */</div><div class='ctx'> 	ret = btrfs_run_delayed_items(trans);</div><div class='del'>-	if (ret) {	/* Transaction aborted */</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = record_root_in_trans(trans, root, 0);</div><div class='del'>-	if (ret) {</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1673,7 +1801,7 @@ static noinline int create_pending_snapshot(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	old = btrfs_lock_root_node(root);</div><div class='ctx'> 	ret = btrfs_cow_block(trans, root, old, NULL, 0, &amp;old,</div><div class='ctx'> 			      BTRFS_NESTING_COW);</div><div class='del'>-	if (ret) {</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_tree_unlock(old);</div><div class='ctx'> 		free_extent_buffer(old);</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='hunk'>@@ -1684,21 +1812,23 @@ static noinline int create_pending_snapshot(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	/* clean up in any case */</div><div class='ctx'> 	btrfs_tree_unlock(old);</div><div class='ctx'> 	free_extent_buffer(old);</div><div class='del'>-	if (ret) {</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='ctx'> 	/* see comments in should_cow_block() */</div><div class='ctx'> 	set_bit(BTRFS_ROOT_FORCE_COW, &amp;root-&gt;state);</div><div class='del'>-	smp_wmb();</div><div class='add'>+	smp_mb__after_atomic();</div><div class='ctx'> </div><div class='ctx'> 	btrfs_set_root_node(new_root_item, tmp);</div><div class='ctx'> 	/* record when the snapshot was created in key.offset */</div><div class='add'>+	key.objectid = objectid;</div><div class='add'>+	key.type = BTRFS_ROOT_ITEM_KEY;</div><div class='ctx'> 	key.offset = trans-&gt;transid;</div><div class='ctx'> 	ret = btrfs_insert_root(trans, tree_root, &amp;key, new_root_item);</div><div class='ctx'> 	btrfs_tree_unlock(tmp);</div><div class='ctx'> 	free_extent_buffer(tmp);</div><div class='del'>-	if (ret) {</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1707,16 +1837,16 @@ static noinline int create_pending_snapshot(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * insert root back/forward references</div><div class='ctx'> 	 */</div><div class='ctx'> 	ret = btrfs_add_root_ref(trans, objectid,</div><div class='del'>-				 parent_root-&gt;root_key.objectid,</div><div class='del'>-				 btrfs_ino(BTRFS_I(parent_inode)), index,</div><div class='del'>-				 dentry-&gt;d_name.name, dentry-&gt;d_name.len);</div><div class='del'>-	if (ret) {</div><div class='add'>+				 btrfs_root_id(parent_root),</div><div class='add'>+				 btrfs_ino(parent_inode), index,</div><div class='add'>+				 &amp;fname.disk_name);</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	key.offset = (u64)-1;</div><div class='del'>-	pending-&gt;snap = btrfs_get_new_fs_root(fs_info, objectid, pending-&gt;anon_dev);</div><div class='add'>+	pending-&gt;snap = btrfs_get_new_fs_root(fs_info, objectid, &amp;pending-&gt;anon_dev);</div><div class='ctx'> 	if (IS_ERR(pending-&gt;snap)) {</div><div class='ctx'> 		ret = PTR_ERR(pending-&gt;snap);</div><div class='ctx'> 		pending-&gt;snap = NULL;</div><div class='hunk'>@@ -1725,7 +1855,7 @@ static noinline int create_pending_snapshot(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_reloc_post_snapshot(trans, pending);</div><div class='del'>-	if (ret) {</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1736,34 +1866,36 @@ static noinline int create_pending_snapshot(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * To co-operate with that hack, we do hack again.</div><div class='ctx'> 	 * Or snapshot will be greatly slowed down by a subtree qgroup rescan</div><div class='ctx'> 	 */</div><div class='del'>-	ret = qgroup_account_snapshot(trans, root, parent_root,</div><div class='del'>-				      pending-&gt;inherit, objectid);</div><div class='add'>+	if (btrfs_qgroup_mode(fs_info) == BTRFS_QGROUP_MODE_FULL)</div><div class='add'>+		ret = qgroup_account_snapshot(trans, root, parent_root,</div><div class='add'>+					      pending-&gt;inherit, objectid);</div><div class='add'>+	else if (btrfs_qgroup_mode(fs_info) == BTRFS_QGROUP_MODE_SIMPLE)</div><div class='add'>+		ret = btrfs_qgroup_inherit(trans, btrfs_root_id(root), objectid,</div><div class='add'>+					   btrfs_root_id(parent_root), pending-&gt;inherit);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_insert_dir_item(trans, dentry-&gt;d_name.name,</div><div class='del'>-				    dentry-&gt;d_name.len, BTRFS_I(parent_inode),</div><div class='del'>-				    &amp;key, BTRFS_FT_DIR, index);</div><div class='del'>-	/* We have check then name at the beginning, so it is impossible. */</div><div class='del'>-	BUG_ON(ret == -EEXIST || ret == -EOVERFLOW);</div><div class='del'>-	if (ret) {</div><div class='add'>+	ret = btrfs_insert_dir_item(trans, &amp;fname.disk_name,</div><div class='add'>+				    parent_inode, &amp;key, BTRFS_FT_DIR,</div><div class='add'>+				    index);</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_i_size_write(BTRFS_I(parent_inode), parent_inode-&gt;i_size +</div><div class='del'>-					 dentry-&gt;d_name.len * 2);</div><div class='del'>-	parent_inode-&gt;i_mtime = parent_inode-&gt;i_ctime =</div><div class='del'>-		current_time(parent_inode);</div><div class='del'>-	ret = btrfs_update_inode_fallback(trans, parent_root, BTRFS_I(parent_inode));</div><div class='del'>-	if (ret) {</div><div class='add'>+	btrfs_i_size_write(parent_inode, parent_inode-&gt;vfs_inode.i_size +</div><div class='add'>+						  fname.disk_name.len * 2);</div><div class='add'>+	inode_set_mtime_to_ts(&amp;parent_inode-&gt;vfs_inode,</div><div class='add'>+			      inode_set_ctime_current(&amp;parent_inode-&gt;vfs_inode));</div><div class='add'>+	ret = btrfs_update_inode_fallback(trans, parent_inode);</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='ctx'> 	ret = btrfs_uuid_tree_add(trans, new_root_item-&gt;uuid,</div><div class='ctx'> 				  BTRFS_UUID_KEY_SUBVOL,</div><div class='ctx'> 				  objectid);</div><div class='del'>-	if (ret) {</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1771,7 +1903,7 @@ static noinline int create_pending_snapshot(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		ret = btrfs_uuid_tree_add(trans, new_root_item-&gt;received_uuid,</div><div class='ctx'> 					  BTRFS_UUID_KEY_RECEIVED_SUBVOL,</div><div class='ctx'> 					  objectid);</div><div class='del'>-		if (ret &amp;&amp; ret != -EEXIST) {</div><div class='add'>+		if (unlikely(ret &amp;&amp; ret != -EEXIST)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto fail;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1784,10 +1916,11 @@ dir_item_existed:</div><div class='ctx'> 	trans-&gt;bytes_reserved = 0;</div><div class='ctx'> clear_skip_qgroup:</div><div class='ctx'> 	btrfs_clear_skip_qgroup(trans);</div><div class='del'>-no_free_objectid:</div><div class='add'>+free_fname:</div><div class='add'>+	fscrypt_free_filename(&amp;fname);</div><div class='add'>+free_pending:</div><div class='ctx'> 	kfree(new_root_item);</div><div class='ctx'> 	pending-&gt;root_item = NULL;</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	pending-&gt;path = NULL;</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -1835,19 +1968,6 @@ static void update_super_roots(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 		super-&gt;uuid_tree_generation = root_item-&gt;generation;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_transaction_in_commit(struct btrfs_fs_info *info)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_transaction *trans;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;info-&gt;trans_lock);</div><div class='del'>-	trans = info-&gt;running_transaction;</div><div class='del'>-	if (trans)</div><div class='del'>-		ret = (trans-&gt;state &gt;= TRANS_STATE_COMMIT_START);</div><div class='del'>-	spin_unlock(&amp;info-&gt;trans_lock);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> int btrfs_transaction_blocked(struct btrfs_fs_info *info)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_transaction *trans;</div><div class='hunk'>@@ -1861,50 +1981,14 @@ int btrfs_transaction_blocked(struct btrfs_fs_info *info)</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * commit transactions asynchronously. once btrfs_commit_transaction_async</div><div class='del'>- * returns, any subsequent transaction will not be allowed to join.</div><div class='del'>- */</div><div class='del'>-struct btrfs_async_commit {</div><div class='del'>-	struct btrfs_trans_handle *newtrans;</div><div class='del'>-	struct work_struct work;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static void do_async_commit(struct work_struct *work)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_async_commit *ac =</div><div class='del'>-		container_of(work, struct btrfs_async_commit, work);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * We've got freeze protection passed with the transaction.</div><div class='del'>-	 * Tell lockdep about it.</div><div class='del'>-	 */</div><div class='del'>-	if (ac-&gt;newtrans-&gt;type &amp; __TRANS_FREEZABLE)</div><div class='del'>-		__sb_writers_acquired(ac-&gt;newtrans-&gt;fs_info-&gt;sb, SB_FREEZE_FS);</div><div class='del'>-</div><div class='del'>-	current-&gt;journal_info = ac-&gt;newtrans;</div><div class='del'>-</div><div class='del'>-	btrfs_commit_transaction(ac-&gt;newtrans);</div><div class='del'>-	kfree(ac);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int btrfs_commit_transaction_async(struct btrfs_trans_handle *trans)</div><div class='add'>+void btrfs_commit_transaction_async(struct btrfs_trans_handle *trans)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='del'>-	struct btrfs_async_commit *ac;</div><div class='ctx'> 	struct btrfs_transaction *cur_trans;</div><div class='ctx'> </div><div class='del'>-	ac = kmalloc(sizeof(*ac), GFP_NOFS);</div><div class='del'>-	if (!ac)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	INIT_WORK(&amp;ac-&gt;work, do_async_commit);</div><div class='del'>-	ac-&gt;newtrans = btrfs_join_transaction(trans-&gt;root);</div><div class='del'>-	if (IS_ERR(ac-&gt;newtrans)) {</div><div class='del'>-		int err = PTR_ERR(ac-&gt;newtrans);</div><div class='del'>-		kfree(ac);</div><div class='del'>-		return err;</div><div class='del'>-	}</div><div class='add'>+	/* Kick the transaction kthread. */</div><div class='add'>+	set_bit(BTRFS_FS_COMMIT_TRANS, &amp;fs_info-&gt;flags);</div><div class='add'>+	wake_up_process(fs_info-&gt;transaction_kthread);</div><div class='ctx'> </div><div class='ctx'> 	/* take transaction reference */</div><div class='ctx'> 	cur_trans = trans-&gt;transaction;</div><div class='hunk'>@@ -1913,27 +1997,34 @@ int btrfs_commit_transaction_async(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	btrfs_end_transaction(trans);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Tell lockdep we've released the freeze rwsem, since the</div><div class='del'>-	 * async commit thread will be the one to unlock it.</div><div class='del'>-	 */</div><div class='del'>-	if (ac-&gt;newtrans-&gt;type &amp; __TRANS_FREEZABLE)</div><div class='del'>-		__sb_writers_release(fs_info-&gt;sb, SB_FREEZE_FS);</div><div class='del'>-</div><div class='del'>-	schedule_work(&amp;ac-&gt;work);</div><div class='del'>-	/*</div><div class='ctx'> 	 * Wait for the current transaction commit to start and block</div><div class='ctx'> 	 * subsequent transaction joins</div><div class='ctx'> 	 */</div><div class='add'>+	btrfs_might_wait_for_state(fs_info, BTRFS_LOCKDEP_TRANS_COMMIT_PREP);</div><div class='ctx'> 	wait_event(fs_info-&gt;transaction_blocked_wait,</div><div class='ctx'> 		   cur_trans-&gt;state &gt;= TRANS_STATE_COMMIT_START ||</div><div class='ctx'> 		   TRANS_ABORTED(cur_trans));</div><div class='del'>-	if (current-&gt;journal_info == trans)</div><div class='del'>-		current-&gt;journal_info = NULL;</div><div class='del'>-</div><div class='ctx'> 	btrfs_put_transaction(cur_trans);</div><div class='del'>-	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * If there is a running transaction commit it or if it's already committing,</div><div class='add'>+ * wait for its commit to complete. Does not start and commit a new transaction</div><div class='add'>+ * if there isn't any running.</div><div class='add'>+ */</div><div class='add'>+int btrfs_commit_current_transaction(struct btrfs_root *root)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_trans_handle *trans;</div><div class='add'>+</div><div class='add'>+	trans = btrfs_attach_transaction_barrier(root);</div><div class='add'>+	if (IS_ERR(trans)) {</div><div class='add'>+		int ret = PTR_ERR(trans);</div><div class='add'>+</div><div class='add'>+		return (ret == -ENOENT) ? 0 : ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return btrfs_commit_transaction(trans);</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> static void cleanup_transaction(struct btrfs_trans_handle *trans, int err)</div><div class='ctx'> {</div><div class='hunk'>@@ -1956,6 +2047,12 @@ static void cleanup_transaction(struct btrfs_trans_handle *trans, int err)</div><div class='ctx'> 	if (cur_trans == fs_info-&gt;running_transaction) {</div><div class='ctx'> 		cur_trans-&gt;state = TRANS_STATE_COMMIT_DOING;</div><div class='ctx'> 		spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * The thread has already released the lockdep map as reader</div><div class='add'>+		 * already in btrfs_commit_transaction().</div><div class='add'>+		 */</div><div class='add'>+		btrfs_might_wait_for_event(fs_info, btrfs_trans_num_writers);</div><div class='ctx'> 		wait_event(cur_trans-&gt;writer_wait,</div><div class='ctx'> 			   atomic_read(&amp;cur_trans-&gt;num_writers) == 1);</div><div class='ctx'> </div><div class='hunk'>@@ -1974,7 +2071,7 @@ static void cleanup_transaction(struct btrfs_trans_handle *trans, int err)</div><div class='ctx'> </div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='ctx'> </div><div class='del'>-	btrfs_cleanup_one_transaction(trans-&gt;transaction, fs_info);</div><div class='add'>+	btrfs_cleanup_one_transaction(trans-&gt;transaction);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;trans_lock);</div><div class='ctx'> 	if (cur_trans == fs_info-&gt;running_transaction)</div><div class='hunk'>@@ -1986,11 +2083,24 @@ static void cleanup_transaction(struct btrfs_trans_handle *trans, int err)</div><div class='ctx'> 	btrfs_put_transaction(cur_trans);</div><div class='ctx'> 	btrfs_put_transaction(cur_trans);</div><div class='ctx'> </div><div class='del'>-	trace_btrfs_transaction_commit(trans-&gt;root);</div><div class='add'>+	trace_btrfs_transaction_commit(fs_info);</div><div class='ctx'> </div><div class='ctx'> 	if (current-&gt;journal_info == trans)</div><div class='ctx'> 		current-&gt;journal_info = NULL;</div><div class='del'>-	btrfs_scrub_cancel(fs_info);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If relocation is running, we can't cancel scrub because that will</div><div class='add'>+	 * result in a deadlock. Before relocating a block group, relocation</div><div class='add'>+	 * pauses scrub, then starts and commits a transaction before unpausing</div><div class='add'>+	 * scrub. If the transaction commit is being done by the relocation</div><div class='add'>+	 * task or triggered by another task and the relocation task is waiting</div><div class='add'>+	 * for the commit, and we end up here due to an error in the commit</div><div class='add'>+	 * path, then calling btrfs_scrub_cancel() will deadlock, as we are</div><div class='add'>+	 * asking for scrub to stop while having it asked to be paused higher</div><div class='add'>+	 * above in relocation code.</div><div class='add'>+	 */</div><div class='add'>+	if (!test_bit(BTRFS_FS_RELOC_RUNNING, &amp;fs_info-&gt;flags))</div><div class='add'>+		btrfs_scrub_cancel(fs_info);</div><div class='ctx'> </div><div class='ctx'> 	kmem_cache_free(btrfs_trans_handle_cachep, trans);</div><div class='ctx'> }</div><div class='hunk'>@@ -2005,31 +2115,83 @@ static void btrfs_cleanup_pending_block_groups(struct btrfs_trans_handle *trans)</div><div class='ctx'>        struct btrfs_block_group *block_group, *tmp;</div><div class='ctx'> </div><div class='ctx'>        list_for_each_entry_safe(block_group, tmp, &amp;trans-&gt;new_bgs, bg_list) {</div><div class='del'>-               btrfs_delayed_refs_rsv_release(fs_info, 1);</div><div class='add'>+               btrfs_dec_delayed_refs_rsv_bg_inserts(fs_info);</div><div class='add'>+		/*</div><div class='add'>+		* Not strictly necessary to lock, as no other task will be using a</div><div class='add'>+		* block_group on the new_bgs list during a transaction abort.</div><div class='add'>+		*/</div><div class='add'>+	       spin_lock(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='ctx'>                list_del_init(&amp;block_group-&gt;bg_list);</div><div class='add'>+	       btrfs_put_block_group(block_group);</div><div class='add'>+	       spin_unlock(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='ctx'>        }</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int btrfs_start_delalloc_flush(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	/*</div><div class='del'>-	 * We use writeback_inodes_sb here because if we used</div><div class='add'>+	 * We use try_to_writeback_inodes_sb() here because if we used</div><div class='ctx'> 	 * btrfs_start_delalloc_roots we would deadlock with fs freeze.</div><div class='ctx'> 	 * Currently are holding the fs freeze lock, if we do an async flush</div><div class='ctx'> 	 * we'll do btrfs_join_transaction() and deadlock because we need to</div><div class='ctx'> 	 * wait for the fs freeze lock.  Using the direct flushing we benefit</div><div class='ctx'> 	 * from already being in a transaction and our join_transaction doesn't</div><div class='ctx'> 	 * have to re-take the fs freeze lock.</div><div class='add'>+	 *</div><div class='add'>+	 * Note that try_to_writeback_inodes_sb() will only trigger writeback</div><div class='add'>+	 * if it can read lock sb-&gt;s_umount. It will always be able to lock it,</div><div class='add'>+	 * except when the filesystem is being unmounted or being frozen, but in</div><div class='add'>+	 * those cases sync_filesystem() is called, which results in calling</div><div class='add'>+	 * writeback_inodes_sb() while holding a write lock on sb-&gt;s_umount.</div><div class='add'>+	 * Note that we don't call writeback_inodes_sb() directly, because it</div><div class='add'>+	 * will emit a warning if sb-&gt;s_umount is not locked.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (btrfs_test_opt(fs_info, FLUSHONCOMMIT))</div><div class='del'>-		writeback_inodes_sb(fs_info-&gt;sb, WB_REASON_SYNC);</div><div class='add'>+		try_to_writeback_inodes_sb(fs_info-&gt;sb, WB_REASON_SYNC);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void btrfs_wait_delalloc_flush(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	if (btrfs_test_opt(fs_info, FLUSHONCOMMIT))</div><div class='del'>-		btrfs_wait_ordered_roots(fs_info, U64_MAX, 0, (u64)-1);</div><div class='add'>+		btrfs_wait_ordered_roots(fs_info, U64_MAX, NULL);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Add a pending snapshot associated with the given transaction handle to the</div><div class='add'>+ * respective handle. This must be called after the transaction commit started</div><div class='add'>+ * and while holding fs_info-&gt;trans_lock.</div><div class='add'>+ * This serves to guarantee a caller of btrfs_commit_transaction() that it can</div><div class='add'>+ * safely free the pending snapshot pointer in case btrfs_commit_transaction()</div><div class='add'>+ * returns an error.</div><div class='add'>+ */</div><div class='add'>+static void add_pending_snapshot(struct btrfs_trans_handle *trans)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_transaction *cur_trans = trans-&gt;transaction;</div><div class='add'>+</div><div class='add'>+	if (!trans-&gt;pending_snapshot)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held(&amp;trans-&gt;fs_info-&gt;trans_lock);</div><div class='add'>+	ASSERT(cur_trans-&gt;state &gt;= TRANS_STATE_COMMIT_PREP,</div><div class='add'>+	       "cur_trans-&gt;state=%d", cur_trans-&gt;state);</div><div class='add'>+</div><div class='add'>+	list_add(&amp;trans-&gt;pending_snapshot-&gt;list, &amp;cur_trans-&gt;pending_snapshots);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void update_commit_stats(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	ktime_t now = ktime_get_ns();</div><div class='add'>+	ktime_t interval = now - fs_info-&gt;commit_stats.critical_section_start_time;</div><div class='add'>+</div><div class='add'>+	ASSERT(fs_info-&gt;commit_stats.critical_section_start_time);</div><div class='add'>+</div><div class='add'>+	fs_info-&gt;commit_stats.commit_count++;</div><div class='add'>+	fs_info-&gt;commit_stats.last_commit_dur = interval;</div><div class='add'>+	fs_info-&gt;commit_stats.max_commit_dur =</div><div class='add'>+			max_t(u64, fs_info-&gt;commit_stats.max_commit_dur, interval);</div><div class='add'>+	fs_info-&gt;commit_stats.total_commit_dur += interval;</div><div class='add'>+	fs_info-&gt;commit_stats.critical_section_start_time = 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_commit_transaction(struct btrfs_trans_handle *trans)</div><div class='hunk'>@@ -2039,13 +2201,16 @@ int btrfs_commit_transaction(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	struct btrfs_transaction *prev_trans = NULL;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ASSERT(refcount_read(&amp;trans-&gt;use_count) == 1);</div><div class='add'>+	ASSERT(refcount_read(&amp;trans-&gt;use_count) == 1,</div><div class='add'>+	       "refcount_read(&amp;trans-&gt;use_count)=%d", refcount_read(&amp;trans-&gt;use_count));</div><div class='add'>+	btrfs_trans_state_lockdep_acquire(fs_info, BTRFS_LOCKDEP_TRANS_COMMIT_PREP);</div><div class='add'>+</div><div class='add'>+	clear_bit(BTRFS_FS_NEED_TRANS_COMMIT, &amp;fs_info-&gt;flags);</div><div class='ctx'> </div><div class='ctx'> 	/* Stop the commit early if -&gt;aborted is set */</div><div class='ctx'> 	if (TRANS_ABORTED(cur_trans)) {</div><div class='ctx'> 		ret = cur_trans-&gt;aborted;</div><div class='del'>-		btrfs_end_transaction(trans);</div><div class='del'>-		return ret;</div><div class='add'>+		goto lockdep_trans_commit_start_release;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	btrfs_trans_release_metadata(trans);</div><div class='hunk'>@@ -2062,10 +2227,8 @@ int btrfs_commit_transaction(struct btrfs_trans_handle *trans)</div><div class='ctx'> 		 * Any running threads may add more while we are here.</div><div class='ctx'> 		 */</div><div class='ctx'> 		ret = btrfs_run_delayed_refs(trans, 0);</div><div class='del'>-		if (ret) {</div><div class='del'>-			btrfs_end_transaction(trans);</div><div class='del'>-			return ret;</div><div class='del'>-		}</div><div class='add'>+		if (ret)</div><div class='add'>+			goto lockdep_trans_commit_start_release;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	btrfs_create_pending_block_groups(trans);</div><div class='hunk'>@@ -2094,22 +2257,25 @@ int btrfs_commit_transaction(struct btrfs_trans_handle *trans)</div><div class='ctx'> </div><div class='ctx'> 		if (run_it) {</div><div class='ctx'> 			ret = btrfs_start_dirty_block_groups(trans);</div><div class='del'>-			if (ret) {</div><div class='del'>-				btrfs_end_transaction(trans);</div><div class='del'>-				return ret;</div><div class='del'>-			}</div><div class='add'>+			if (ret)</div><div class='add'>+				goto lockdep_trans_commit_start_release;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;trans_lock);</div><div class='del'>-	if (cur_trans-&gt;state &gt;= TRANS_STATE_COMMIT_START) {</div><div class='add'>+	if (cur_trans-&gt;state &gt;= TRANS_STATE_COMMIT_PREP) {</div><div class='ctx'> 		enum btrfs_trans_state want_state = TRANS_STATE_COMPLETED;</div><div class='ctx'> </div><div class='add'>+		add_pending_snapshot(trans);</div><div class='add'>+</div><div class='ctx'> 		spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='ctx'> 		refcount_inc(&amp;cur_trans-&gt;use_count);</div><div class='ctx'> </div><div class='ctx'> 		if (trans-&gt;in_fsync)</div><div class='ctx'> 			want_state = TRANS_STATE_SUPER_COMMITTED;</div><div class='add'>+</div><div class='add'>+		btrfs_trans_state_lockdep_release(fs_info,</div><div class='add'>+						  BTRFS_LOCKDEP_TRANS_COMMIT_PREP);</div><div class='ctx'> 		ret = btrfs_end_transaction(trans);</div><div class='ctx'> 		wait_for_commit(cur_trans, want_state);</div><div class='ctx'> </div><div class='hunk'>@@ -2121,17 +2287,17 @@ int btrfs_commit_transaction(struct btrfs_trans_handle *trans)</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	cur_trans-&gt;state = TRANS_STATE_COMMIT_START;</div><div class='add'>+	cur_trans-&gt;state = TRANS_STATE_COMMIT_PREP;</div><div class='ctx'> 	wake_up(&amp;fs_info-&gt;transaction_blocked_wait);</div><div class='add'>+	btrfs_trans_state_lockdep_release(fs_info, BTRFS_LOCKDEP_TRANS_COMMIT_PREP);</div><div class='ctx'> </div><div class='del'>-	if (cur_trans-&gt;list.prev != &amp;fs_info-&gt;trans_list) {</div><div class='add'>+	if (!list_is_first(&amp;cur_trans-&gt;list, &amp;fs_info-&gt;trans_list)) {</div><div class='ctx'> 		enum btrfs_trans_state want_state = TRANS_STATE_COMPLETED;</div><div class='ctx'> </div><div class='ctx'> 		if (trans-&gt;in_fsync)</div><div class='ctx'> 			want_state = TRANS_STATE_SUPER_COMMITTED;</div><div class='ctx'> </div><div class='del'>-		prev_trans = list_entry(cur_trans-&gt;list.prev,</div><div class='del'>-					struct btrfs_transaction, list);</div><div class='add'>+		prev_trans = list_prev_entry(cur_trans, list);</div><div class='ctx'> 		if (prev_trans-&gt;state &lt; want_state) {</div><div class='ctx'> 			refcount_inc(&amp;prev_trans-&gt;use_count);</div><div class='ctx'> 			spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='hunk'>@@ -2142,12 +2308,10 @@ int btrfs_commit_transaction(struct btrfs_trans_handle *trans)</div><div class='ctx'> </div><div class='ctx'> 			btrfs_put_transaction(prev_trans);</div><div class='ctx'> 			if (ret)</div><div class='del'>-				goto cleanup_transaction;</div><div class='del'>-		} else {</div><div class='del'>-			spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='add'>+				goto lockdep_release;</div><div class='add'>+			spin_lock(&amp;fs_info-&gt;trans_lock);</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='del'>-		spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * The previous transaction was aborted and was already removed</div><div class='ctx'> 		 * from the list of transactions at fs_info-&gt;trans_list. So we</div><div class='hunk'>@@ -2155,28 +2319,47 @@ int btrfs_commit_transaction(struct btrfs_trans_handle *trans)</div><div class='ctx'> 		 * corrupt state (pointing to trees with unwritten nodes/leafs).</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (BTRFS_FS_ERROR(fs_info)) {</div><div class='add'>+			spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='ctx'> 			ret = -EROFS;</div><div class='del'>-			goto cleanup_transaction;</div><div class='add'>+			goto lockdep_release;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	cur_trans-&gt;state = TRANS_STATE_COMMIT_START;</div><div class='add'>+	wake_up(&amp;fs_info-&gt;transaction_blocked_wait);</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Get the time spent on the work done by the commit thread and not</div><div class='add'>+	 * the time spent waiting on a previous commit</div><div class='add'>+	 */</div><div class='add'>+	fs_info-&gt;commit_stats.critical_section_start_time = ktime_get_ns();</div><div class='ctx'> 	extwriter_counter_dec(cur_trans, trans-&gt;type);</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_start_delalloc_flush(fs_info);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto cleanup_transaction;</div><div class='add'>+		goto lockdep_release;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_run_delayed_items(trans);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto cleanup_transaction;</div><div class='add'>+		goto lockdep_release;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * The thread has started/joined the transaction thus it holds the</div><div class='add'>+	 * lockdep map as a reader. It has to release it before acquiring the</div><div class='add'>+	 * lockdep map as a writer.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_lockdep_release(fs_info, btrfs_trans_num_extwriters);</div><div class='add'>+	btrfs_might_wait_for_event(fs_info, btrfs_trans_num_extwriters);</div><div class='ctx'> 	wait_event(cur_trans-&gt;writer_wait,</div><div class='ctx'> 		   extwriter_counter_read(cur_trans) == 0);</div><div class='ctx'> </div><div class='ctx'> 	/* some pending stuffs might be added after the previous flush. */</div><div class='ctx'> 	ret = btrfs_run_delayed_items(trans);</div><div class='del'>-	if (ret)</div><div class='add'>+	if (ret) {</div><div class='add'>+		btrfs_lockdep_release(fs_info, btrfs_trans_num_writers);</div><div class='ctx'> 		goto cleanup_transaction;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	btrfs_wait_delalloc_flush(fs_info);</div><div class='ctx'> </div><div class='hunk'>@@ -2185,6 +2368,7 @@ int btrfs_commit_transaction(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	 * transaction. Otherwise if this transaction commits before the ordered</div><div class='ctx'> 	 * extents complete we lose logged data after a power failure.</div><div class='ctx'> 	 */</div><div class='add'>+	btrfs_might_wait_for_event(fs_info, btrfs_trans_pending_ordered);</div><div class='ctx'> 	wait_event(cur_trans-&gt;pending_wait,</div><div class='ctx'> 		   atomic_read(&amp;cur_trans-&gt;pending_ordered) == 0);</div><div class='ctx'> </div><div class='hunk'>@@ -2195,13 +2379,40 @@ int btrfs_commit_transaction(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	 * COMMIT_DOING so make sure to wait for num_writers to == 1 again.</div><div class='ctx'> 	 */</div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;trans_lock);</div><div class='add'>+	add_pending_snapshot(trans);</div><div class='ctx'> 	cur_trans-&gt;state = TRANS_STATE_COMMIT_DOING;</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The thread has started/joined the transaction thus it holds the</div><div class='add'>+	 * lockdep map as a reader. It has to release it before acquiring the</div><div class='add'>+	 * lockdep map as a writer.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_lockdep_release(fs_info, btrfs_trans_num_writers);</div><div class='add'>+	btrfs_might_wait_for_event(fs_info, btrfs_trans_num_writers);</div><div class='ctx'> 	wait_event(cur_trans-&gt;writer_wait,</div><div class='ctx'> 		   atomic_read(&amp;cur_trans-&gt;num_writers) == 1);</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Make lockdep happy by acquiring the state locks after</div><div class='add'>+	 * btrfs_trans_num_writers is released. If we acquired the state locks</div><div class='add'>+	 * before releasing the btrfs_trans_num_writers lock then lockdep would</div><div class='add'>+	 * complain because we did not follow the reverse order unlocking rule.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_trans_state_lockdep_acquire(fs_info, BTRFS_LOCKDEP_TRANS_COMPLETED);</div><div class='add'>+	btrfs_trans_state_lockdep_acquire(fs_info, BTRFS_LOCKDEP_TRANS_SUPER_COMMITTED);</div><div class='add'>+	btrfs_trans_state_lockdep_acquire(fs_info, BTRFS_LOCKDEP_TRANS_UNBLOCKED);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We've started the commit, clear the flag in case we were triggered to</div><div class='add'>+	 * do an async commit but somebody else started before the transaction</div><div class='add'>+	 * kthread could do the work.</div><div class='add'>+	 */</div><div class='add'>+	clear_bit(BTRFS_FS_COMMIT_TRANS, &amp;fs_info-&gt;flags);</div><div class='add'>+</div><div class='ctx'> 	if (TRANS_ABORTED(cur_trans)) {</div><div class='ctx'> 		ret = cur_trans-&gt;aborted;</div><div class='add'>+		btrfs_trans_state_lockdep_release(fs_info, BTRFS_LOCKDEP_TRANS_UNBLOCKED);</div><div class='ctx'> 		goto scrub_continue;</div><div class='ctx'> 	}</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -2227,14 +2438,14 @@ int btrfs_commit_transaction(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	 * them.</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * We needn't worry that this operation will corrupt the snapshots,</div><div class='del'>-	 * because all the tree which are snapshoted will be forced to COW</div><div class='add'>+	 * because all the tree which are snapshotted will be forced to COW</div><div class='ctx'> 	 * the nodes and leaves.</div><div class='ctx'> 	 */</div><div class='ctx'> 	ret = btrfs_run_delayed_items(trans);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto unlock_reloc;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_run_delayed_refs(trans, (unsigned long)-1);</div><div class='add'>+	ret = btrfs_run_delayed_refs(trans, U64_MAX);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto unlock_reloc;</div><div class='ctx'> </div><div class='hunk'>@@ -2246,30 +2457,9 @@ int btrfs_commit_transaction(struct btrfs_trans_handle *trans)</div><div class='ctx'> </div><div class='ctx'> 	WARN_ON(cur_trans != trans-&gt;transaction);</div><div class='ctx'> </div><div class='del'>-	/* btrfs_commit_tree_roots is responsible for getting the</div><div class='del'>-	 * various roots consistent with each other.  Every pointer</div><div class='del'>-	 * in the tree of tree roots has to point to the most up to date</div><div class='del'>-	 * root for every subvolume and other tree.  So, we have to keep</div><div class='del'>-	 * the tree logging code from jumping in and changing any</div><div class='del'>-	 * of the trees.</div><div class='del'>-	 *</div><div class='del'>-	 * At this point in the commit, there can't be any tree-log</div><div class='del'>-	 * writers, but a little lower down we drop the trans mutex</div><div class='del'>-	 * and let new people in.  By holding the tree_log_mutex</div><div class='del'>-	 * from now until after the super is written, we avoid races</div><div class='del'>-	 * with the tree-log code.</div><div class='del'>-	 */</div><div class='del'>-	mutex_lock(&amp;fs_info-&gt;tree_log_mutex);</div><div class='del'>-</div><div class='ctx'> 	ret = commit_fs_roots(trans);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto unlock_tree_log;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Since the transaction is done, we can apply the pending changes</div><div class='del'>-	 * before the next transaction.</div><div class='del'>-	 */</div><div class='del'>-	btrfs_apply_pending_changes(fs_info);</div><div class='add'>+		goto unlock_reloc;</div><div class='ctx'> </div><div class='ctx'> 	/* commit_fs_roots gets rid of all the tree log roots, it is now</div><div class='ctx'> 	 * safe to free the root of tree log roots</div><div class='hunk'>@@ -2282,11 +2472,11 @@ int btrfs_commit_transaction(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	 */</div><div class='ctx'> 	ret = btrfs_qgroup_account_extents(trans);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto unlock_tree_log;</div><div class='add'>+		goto unlock_reloc;</div><div class='ctx'> </div><div class='ctx'> 	ret = commit_cowonly_roots(trans);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto unlock_tree_log;</div><div class='add'>+		goto unlock_reloc;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The tasks which save the space cache and inode cache may also</div><div class='hunk'>@@ -2294,7 +2484,7 @@ int btrfs_commit_transaction(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (TRANS_ABORTED(cur_trans)) {</div><div class='ctx'> 		ret = cur_trans-&gt;aborted;</div><div class='del'>-		goto unlock_tree_log;</div><div class='add'>+		goto unlock_reloc;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	cur_trans = fs_info-&gt;running_transaction;</div><div class='hunk'>@@ -2309,6 +2499,13 @@ int btrfs_commit_transaction(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	list_add_tail(&amp;fs_info-&gt;chunk_root-&gt;dirty_list,</div><div class='ctx'> 		      &amp;cur_trans-&gt;switch_commits);</div><div class='ctx'> </div><div class='add'>+	if (btrfs_fs_incompat(fs_info, EXTENT_TREE_V2)) {</div><div class='add'>+		btrfs_set_root_node(&amp;fs_info-&gt;block_group_root-&gt;root_item,</div><div class='add'>+				    fs_info-&gt;block_group_root-&gt;node);</div><div class='add'>+		list_add_tail(&amp;fs_info-&gt;block_group_root-&gt;dirty_list,</div><div class='add'>+			      &amp;cur_trans-&gt;switch_commits);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	switch_commit_roots(trans);</div><div class='ctx'> </div><div class='ctx'> 	ASSERT(list_empty(&amp;cur_trans-&gt;dirty_bgs));</div><div class='hunk'>@@ -2327,6 +2524,16 @@ int btrfs_commit_transaction(struct btrfs_trans_handle *trans)</div><div class='ctx'> </div><div class='ctx'> 	btrfs_trans_release_chunk_metadata(trans);</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Before changing the transaction state to TRANS_STATE_UNBLOCKED and</div><div class='add'>+	 * setting fs_info-&gt;running_transaction to NULL, lock tree_log_mutex to</div><div class='add'>+	 * make sure that before we commit our superblock, no other task can</div><div class='add'>+	 * start a new transaction and commit a log tree before we commit our</div><div class='add'>+	 * superblock. Anyone trying to commit a log tree locks this mutex before</div><div class='add'>+	 * writing its superblock.</div><div class='add'>+	 */</div><div class='add'>+	mutex_lock(&amp;fs_info-&gt;tree_log_mutex);</div><div class='add'>+</div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;trans_lock);</div><div class='ctx'> 	cur_trans-&gt;state = TRANS_STATE_UNBLOCKED;</div><div class='ctx'> 	fs_info-&gt;running_transaction = NULL;</div><div class='hunk'>@@ -2334,26 +2541,21 @@ int btrfs_commit_transaction(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;reloc_mutex);</div><div class='ctx'> </div><div class='ctx'> 	wake_up(&amp;fs_info-&gt;transaction_wait);</div><div class='add'>+	btrfs_trans_state_lockdep_release(fs_info, BTRFS_LOCKDEP_TRANS_UNBLOCKED);</div><div class='add'>+</div><div class='add'>+	/* If we have features changed, wake up the cleaner to update sysfs. */</div><div class='add'>+	if (test_bit(BTRFS_FS_FEATURE_CHANGED, &amp;fs_info-&gt;flags) &amp;&amp;</div><div class='add'>+	    fs_info-&gt;cleaner_kthread)</div><div class='add'>+		wake_up_process(fs_info-&gt;cleaner_kthread);</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_write_and_wait_transaction(trans);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		btrfs_handle_fs_error(fs_info, ret,</div><div class='ctx'> 				      "Error while writing out transaction");</div><div class='del'>-		/*</div><div class='del'>-		 * reloc_mutex has been unlocked, tree_log_mutex is still held</div><div class='del'>-		 * but we can't jump to unlock_tree_log causing double unlock</div><div class='del'>-		 */</div><div class='ctx'> 		mutex_unlock(&amp;fs_info-&gt;tree_log_mutex);</div><div class='ctx'> 		goto scrub_continue;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * At this point, we should have written all the tree blocks allocated</div><div class='del'>-	 * in this transaction. So it's now safe to free the redirtyied extent</div><div class='del'>-	 * buffers.</div><div class='del'>-	 */</div><div class='del'>-	btrfs_free_redirty_list(cur_trans);</div><div class='del'>-</div><div class='ctx'> 	ret = write_all_supers(fs_info, 0);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * the super is written, we can safely allow the tree-loggers</div><div class='hunk'>@@ -2363,25 +2565,30 @@ int btrfs_commit_transaction(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto scrub_continue;</div><div class='ctx'> </div><div class='add'>+	update_commit_stats(fs_info);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We needn't acquire the lock here because there is no other task</div><div class='ctx'> 	 * which can change it.</div><div class='ctx'> 	 */</div><div class='ctx'> 	cur_trans-&gt;state = TRANS_STATE_SUPER_COMMITTED;</div><div class='ctx'> 	wake_up(&amp;cur_trans-&gt;commit_wait);</div><div class='add'>+	btrfs_trans_state_lockdep_release(fs_info, BTRFS_LOCKDEP_TRANS_SUPER_COMMITTED);</div><div class='ctx'> </div><div class='del'>-	btrfs_finish_extent_commit(trans);</div><div class='add'>+	ret = btrfs_finish_extent_commit(trans);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto scrub_continue;</div><div class='ctx'> </div><div class='ctx'> 	if (test_bit(BTRFS_TRANS_HAVE_FREE_BGS, &amp;cur_trans-&gt;flags))</div><div class='ctx'> 		btrfs_clear_space_info_full(fs_info);</div><div class='ctx'> </div><div class='del'>-	fs_info-&gt;last_trans_committed = cur_trans-&gt;transid;</div><div class='add'>+	btrfs_set_last_trans_committed(fs_info, cur_trans-&gt;transid);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We needn't acquire the lock here because there is no other task</div><div class='ctx'> 	 * which can change it.</div><div class='ctx'> 	 */</div><div class='ctx'> 	cur_trans-&gt;state = TRANS_STATE_COMPLETED;</div><div class='ctx'> 	wake_up(&amp;cur_trans-&gt;commit_wait);</div><div class='add'>+	btrfs_trans_state_lockdep_release(fs_info, BTRFS_LOCKDEP_TRANS_COMPLETED);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;trans_lock);</div><div class='ctx'> 	list_del_init(&amp;cur_trans-&gt;list);</div><div class='hunk'>@@ -2393,7 +2600,7 @@ int btrfs_commit_transaction(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	if (trans-&gt;type &amp; __TRANS_FREEZABLE)</div><div class='ctx'> 		sb_end_intwrite(fs_info-&gt;sb);</div><div class='ctx'> </div><div class='del'>-	trace_btrfs_transaction_commit(trans-&gt;root);</div><div class='add'>+	trace_btrfs_transaction_commit(fs_info);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_scrub_continue(fs_info);</div><div class='ctx'> </div><div class='hunk'>@@ -2404,11 +2611,12 @@ int btrfs_commit_transaction(struct btrfs_trans_handle *trans)</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> </div><div class='del'>-unlock_tree_log:</div><div class='del'>-	mutex_unlock(&amp;fs_info-&gt;tree_log_mutex);</div><div class='ctx'> unlock_reloc:</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;reloc_mutex);</div><div class='add'>+	btrfs_trans_state_lockdep_release(fs_info, BTRFS_LOCKDEP_TRANS_UNBLOCKED);</div><div class='ctx'> scrub_continue:</div><div class='add'>+	btrfs_trans_state_lockdep_release(fs_info, BTRFS_LOCKDEP_TRANS_SUPER_COMMITTED);</div><div class='add'>+	btrfs_trans_state_lockdep_release(fs_info, BTRFS_LOCKDEP_TRANS_COMPLETED);</div><div class='ctx'> 	btrfs_scrub_continue(fs_info);</div><div class='ctx'> cleanup_transaction:</div><div class='ctx'> 	btrfs_trans_release_metadata(trans);</div><div class='hunk'>@@ -2421,6 +2629,16 @@ cleanup_transaction:</div><div class='ctx'> 	cleanup_transaction(trans, ret);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='add'>+</div><div class='add'>+lockdep_release:</div><div class='add'>+	btrfs_lockdep_release(fs_info, btrfs_trans_num_extwriters);</div><div class='add'>+	btrfs_lockdep_release(fs_info, btrfs_trans_num_writers);</div><div class='add'>+	goto cleanup_transaction;</div><div class='add'>+</div><div class='add'>+lockdep_trans_commit_start_release:</div><div class='add'>+	btrfs_trans_state_lockdep_release(fs_info, BTRFS_LOCKDEP_TRANS_COMMIT_PREP);</div><div class='add'>+	btrfs_end_transaction(trans);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2433,10 +2651,10 @@ cleanup_transaction:</div><div class='ctx'>  * because btrfs_commit_super will poke cleaner thread and it will process it a</div><div class='ctx'>  * few seconds later.</div><div class='ctx'>  */</div><div class='del'>-int btrfs_clean_one_deleted_snapshot(struct btrfs_root *root)</div><div class='add'>+int btrfs_clean_one_deleted_snapshot(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_root *root;</div><div class='ctx'> 	int ret;</div><div class='del'>-	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;trans_lock);</div><div class='ctx'> 	if (list_empty(&amp;fs_info-&gt;dead_roots)) {</div><div class='hunk'>@@ -2448,35 +2666,58 @@ int btrfs_clean_one_deleted_snapshot(struct btrfs_root *root)</div><div class='ctx'> 	list_del_init(&amp;root-&gt;root_list);</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;trans_lock);</div><div class='ctx'> </div><div class='del'>-	btrfs_debug(fs_info, "cleaner removing %llu", root-&gt;root_key.objectid);</div><div class='add'>+	btrfs_debug(fs_info, "cleaner removing %llu", btrfs_root_id(root));</div><div class='ctx'> </div><div class='ctx'> 	btrfs_kill_all_delayed_nodes(root);</div><div class='ctx'> </div><div class='ctx'> 	if (btrfs_header_backref_rev(root-&gt;node) &lt;</div><div class='ctx'> 			BTRFS_MIXED_BACKREF_REV)</div><div class='del'>-		ret = btrfs_drop_snapshot(root, 0, 0);</div><div class='add'>+		ret = btrfs_drop_snapshot(root, false, false);</div><div class='ctx'> 	else</div><div class='del'>-		ret = btrfs_drop_snapshot(root, 1, 0);</div><div class='add'>+		ret = btrfs_drop_snapshot(root, true, false);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_put_root(root);</div><div class='ctx'> 	return (ret &lt; 0) ? 0 : 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_apply_pending_changes(struct btrfs_fs_info *fs_info)</div><div class='add'>+/*</div><div class='add'>+ * We only mark the transaction aborted and then set the file system read-only.</div><div class='add'>+ * This will prevent new transactions from starting or trying to join this</div><div class='add'>+ * one.</div><div class='add'>+ *</div><div class='add'>+ * This means that error recovery at the call site is limited to freeing</div><div class='add'>+ * any local memory allocations and passing the error code up without</div><div class='add'>+ * further cleanup. The transaction should complete as it normally would</div><div class='add'>+ * in the call path but will return -EIO.</div><div class='add'>+ *</div><div class='add'>+ * We'll complete the cleanup in btrfs_end_transaction and</div><div class='add'>+ * btrfs_commit_transaction.</div><div class='add'>+ */</div><div class='add'>+void __cold __btrfs_abort_transaction(struct btrfs_trans_handle *trans,</div><div class='add'>+				      const char *function,</div><div class='add'>+				      unsigned int line, int error, bool first_hit)</div><div class='ctx'> {</div><div class='del'>-	unsigned long prev;</div><div class='del'>-	unsigned long bit;</div><div class='add'>+	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> </div><div class='del'>-	prev = xchg(&amp;fs_info-&gt;pending_changes, 0);</div><div class='del'>-	if (!prev)</div><div class='del'>-		return;</div><div class='add'>+	WRITE_ONCE(trans-&gt;aborted, error);</div><div class='add'>+	WRITE_ONCE(trans-&gt;transaction-&gt;aborted, error);</div><div class='add'>+	if (first_hit &amp;&amp; error == -ENOSPC)</div><div class='add'>+		btrfs_dump_space_info_for_trans_abort(fs_info);</div><div class='add'>+	/* Wake up anybody who may be waiting on this transaction */</div><div class='add'>+	wake_up(&amp;fs_info-&gt;transaction_wait);</div><div class='add'>+	wake_up(&amp;fs_info-&gt;transaction_blocked_wait);</div><div class='add'>+	__btrfs_handle_fs_error(fs_info, function, line, error, NULL);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	bit = 1 &lt;&lt; BTRFS_PENDING_COMMIT;</div><div class='del'>-	if (prev &amp; bit)</div><div class='del'>-		btrfs_debug(fs_info, "pending commit done");</div><div class='del'>-	prev &amp;= ~bit;</div><div class='add'>+int __init btrfs_transaction_init(void)</div><div class='add'>+{</div><div class='add'>+	btrfs_trans_handle_cachep = KMEM_CACHE(btrfs_trans_handle, SLAB_TEMPORARY);</div><div class='add'>+	if (!btrfs_trans_handle_cachep)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if (prev)</div><div class='del'>-		btrfs_warn(fs_info,</div><div class='del'>-			"unknown pending changes left 0x%lx, ignoring", prev);</div><div class='add'>+void __cold btrfs_transaction_exit(void)</div><div class='add'>+{</div><div class='add'>+	kmem_cache_destroy(btrfs_trans_handle_cachep);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/btrfs/transaction.h b/fs/btrfs/transaction.h<br/>index ba45065f9451..18ef069197e5 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/transaction.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/transaction.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/transaction.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/transaction.h</a></div><div class='hunk'>@@ -6,13 +6,35 @@</div><div class='ctx'> #ifndef BTRFS_TRANSACTION_H</div><div class='ctx'> #define BTRFS_TRANSACTION_H</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/atomic.h&gt;</div><div class='ctx'> #include &lt;linux/refcount.h&gt;</div><div class='add'>+#include &lt;linux/list.h&gt;</div><div class='add'>+#include &lt;linux/time64.h&gt;</div><div class='add'>+#include &lt;linux/mutex.h&gt;</div><div class='add'>+#include &lt;linux/wait.h&gt;</div><div class='ctx'> #include "btrfs_inode.h"</div><div class='ctx'> #include "delayed-ref.h"</div><div class='del'>-#include "ctree.h"</div><div class='add'>+</div><div class='add'>+struct dentry;</div><div class='add'>+struct inode;</div><div class='add'>+struct btrfs_pending_snapshot;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+struct btrfs_root_item;</div><div class='add'>+struct btrfs_root;</div><div class='add'>+struct btrfs_path;</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Signal that a direct IO write is in progress, to avoid deadlock for sync</div><div class='add'>+ * direct IO writes when fsync is called during the direct IO write path.</div><div class='add'>+ */</div><div class='add'>+#define BTRFS_TRANS_DIO_WRITE_STUB	((void *) 1)</div><div class='add'>+</div><div class='add'>+/* Radix-tree tag for roots that are part of the transaction. */</div><div class='add'>+#define BTRFS_ROOT_TRANS_TAG			0</div><div class='ctx'> </div><div class='ctx'> enum btrfs_trans_state {</div><div class='ctx'> 	TRANS_STATE_RUNNING,</div><div class='add'>+	TRANS_STATE_COMMIT_PREP,</div><div class='ctx'> 	TRANS_STATE_COMMIT_START,</div><div class='ctx'> 	TRANS_STATE_COMMIT_DOING,</div><div class='ctx'> 	TRANS_STATE_UNBLOCKED,</div><div class='hunk'>@@ -93,19 +115,17 @@ struct btrfs_transaction {</div><div class='ctx'> 	 */</div><div class='ctx'> 	atomic_t pending_ordered;</div><div class='ctx'> 	wait_queue_head_t pending_wait;</div><div class='del'>-</div><div class='del'>-	spinlock_t releasing_ebs_lock;</div><div class='del'>-	struct list_head releasing_ebs;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-#define __TRANS_FREEZABLE	(1U &lt;&lt; 0)</div><div class='del'>-</div><div class='del'>-#define __TRANS_START		(1U &lt;&lt; 9)</div><div class='del'>-#define __TRANS_ATTACH		(1U &lt;&lt; 10)</div><div class='del'>-#define __TRANS_JOIN		(1U &lt;&lt; 11)</div><div class='del'>-#define __TRANS_JOIN_NOLOCK	(1U &lt;&lt; 12)</div><div class='del'>-#define __TRANS_DUMMY		(1U &lt;&lt; 13)</div><div class='del'>-#define __TRANS_JOIN_NOSTART	(1U &lt;&lt; 14)</div><div class='add'>+enum {</div><div class='add'>+	ENUM_BIT(__TRANS_FREEZABLE),</div><div class='add'>+	ENUM_BIT(__TRANS_START),</div><div class='add'>+	ENUM_BIT(__TRANS_ATTACH),</div><div class='add'>+	ENUM_BIT(__TRANS_JOIN),</div><div class='add'>+	ENUM_BIT(__TRANS_JOIN_NOLOCK),</div><div class='add'>+	ENUM_BIT(__TRANS_DUMMY),</div><div class='add'>+	ENUM_BIT(__TRANS_JOIN_NOSTART),</div><div class='add'>+};</div><div class='ctx'> </div><div class='ctx'> #define TRANS_START		(__TRANS_START | __TRANS_FREEZABLE)</div><div class='ctx'> #define TRANS_ATTACH		(__TRANS_ATTACH)</div><div class='hunk'>@@ -118,11 +138,15 @@ struct btrfs_transaction {</div><div class='ctx'> struct btrfs_trans_handle {</div><div class='ctx'> 	u64 transid;</div><div class='ctx'> 	u64 bytes_reserved;</div><div class='add'>+	u64 delayed_refs_bytes_reserved;</div><div class='ctx'> 	u64 chunk_bytes_reserved;</div><div class='ctx'> 	unsigned long delayed_ref_updates;</div><div class='add'>+	unsigned long delayed_ref_csum_deletions;</div><div class='ctx'> 	struct btrfs_transaction *transaction;</div><div class='ctx'> 	struct btrfs_block_rsv *block_rsv;</div><div class='ctx'> 	struct btrfs_block_rsv *orig_rsv;</div><div class='add'>+	/* Set by a task that wants to create a snapshot. */</div><div class='add'>+	struct btrfs_pending_snapshot *pending_snapshot;</div><div class='ctx'> 	refcount_t use_count;</div><div class='ctx'> 	unsigned int type;</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -135,9 +159,9 @@ struct btrfs_trans_handle {</div><div class='ctx'> 	bool removing_chunk;</div><div class='ctx'> 	bool reloc_reserved;</div><div class='ctx'> 	bool in_fsync;</div><div class='del'>-	struct btrfs_root *root;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info;</div><div class='ctx'> 	struct list_head new_bgs;</div><div class='add'>+	struct btrfs_block_rsv delayed_rsv;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -150,7 +174,7 @@ struct btrfs_trans_handle {</div><div class='ctx'> </div><div class='ctx'> struct btrfs_pending_snapshot {</div><div class='ctx'> 	struct dentry *dentry;</div><div class='del'>-	struct inode *dir;</div><div class='add'>+	struct btrfs_inode *dir;</div><div class='ctx'> 	struct btrfs_root *root;</div><div class='ctx'> 	struct btrfs_root_item *root_item;</div><div class='ctx'> 	struct btrfs_root *snap;</div><div class='hunk'>@@ -171,7 +195,7 @@ static inline void btrfs_set_inode_last_trans(struct btrfs_trans_handle *trans,</div><div class='ctx'> {</div><div class='ctx'> 	spin_lock(&amp;inode-&gt;lock);</div><div class='ctx'> 	inode-&gt;last_trans = trans-&gt;transaction-&gt;transid;</div><div class='del'>-	inode-&gt;last_sub_trans = inode-&gt;root-&gt;log_transid;</div><div class='add'>+	inode-&gt;last_sub_trans = btrfs_get_root_log_transid(inode-&gt;root);</div><div class='ctx'> 	inode-&gt;last_log_commit = inode-&gt;last_sub_trans - 1;</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;lock);</div><div class='ctx'> }</div><div class='hunk'>@@ -199,6 +223,48 @@ static inline void btrfs_clear_skip_qgroup(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	delayed_refs-&gt;qgroup_to_skip = 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * We want the transaction abort to print stack trace only for errors where the</div><div class='add'>+ * cause could be a bug, eg. due to ENOSPC, and not for common errors that are</div><div class='add'>+ * caused by external factors.</div><div class='add'>+ */</div><div class='add'>+static inline bool btrfs_abort_should_print_stack(int error)</div><div class='add'>+{</div><div class='add'>+	switch (error) {</div><div class='add'>+	case -EIO:</div><div class='add'>+	case -EROFS:</div><div class='add'>+	case -ENOMEM:</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Call btrfs_abort_transaction as early as possible when an error condition is</div><div class='add'>+ * detected, that way the exact stack trace is reported for some errors.</div><div class='add'>+ */</div><div class='add'>+#define btrfs_abort_transaction(trans, error)		\</div><div class='add'>+do {								\</div><div class='add'>+	bool __first = false;					\</div><div class='add'>+	/* Report first abort since mount */			\</div><div class='add'>+	if (!test_and_set_bit(BTRFS_FS_STATE_TRANS_ABORTED,	\</div><div class='add'>+			&amp;((trans)-&gt;fs_info-&gt;fs_state))) {	\</div><div class='add'>+		__first = true;					\</div><div class='add'>+		if (WARN(btrfs_abort_should_print_stack(error),	\</div><div class='add'>+			KERN_ERR				\</div><div class='add'>+			"BTRFS: Transaction aborted (error %d)\n",	\</div><div class='add'>+			(error))) {					\</div><div class='add'>+			/* Stack trace printed. */			\</div><div class='add'>+		} else {						\</div><div class='add'>+			btrfs_err((trans)-&gt;fs_info,			\</div><div class='add'>+				  "Transaction aborted (error %d)",	\</div><div class='add'>+				  (error));			\</div><div class='add'>+		}						\</div><div class='add'>+	}							\</div><div class='add'>+	__btrfs_abort_transaction((trans), __func__,		\</div><div class='add'>+				  __LINE__, (error), __first);	\</div><div class='add'>+} while (0)</div><div class='add'>+</div><div class='ctx'> int btrfs_end_transaction(struct btrfs_trans_handle *trans);</div><div class='ctx'> struct btrfs_trans_handle *btrfs_start_transaction(struct btrfs_root *root,</div><div class='ctx'> 						   unsigned int num_items);</div><div class='hunk'>@@ -214,10 +280,11 @@ struct btrfs_trans_handle *btrfs_attach_transaction_barrier(</div><div class='ctx'> int btrfs_wait_for_commit(struct btrfs_fs_info *fs_info, u64 transid);</div><div class='ctx'> </div><div class='ctx'> void btrfs_add_dead_root(struct btrfs_root *root);</div><div class='del'>-int btrfs_defrag_root(struct btrfs_root *root);</div><div class='del'>-int btrfs_clean_one_deleted_snapshot(struct btrfs_root *root);</div><div class='add'>+void btrfs_maybe_wake_unfinished_drop(struct btrfs_fs_info *fs_info);</div><div class='add'>+int btrfs_clean_one_deleted_snapshot(struct btrfs_fs_info *fs_info);</div><div class='ctx'> int btrfs_commit_transaction(struct btrfs_trans_handle *trans);</div><div class='del'>-int btrfs_commit_transaction_async(struct btrfs_trans_handle *trans);</div><div class='add'>+void btrfs_commit_transaction_async(struct btrfs_trans_handle *trans);</div><div class='add'>+int btrfs_commit_current_transaction(struct btrfs_root *root);</div><div class='ctx'> int btrfs_end_transaction_throttle(struct btrfs_trans_handle *trans);</div><div class='ctx'> bool btrfs_should_end_transaction(struct btrfs_trans_handle *trans);</div><div class='ctx'> void btrfs_throttle(struct btrfs_fs_info *fs_info);</div><div class='hunk'>@@ -227,11 +294,15 @@ int btrfs_write_marked_extents(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				struct extent_io_tree *dirty_pages, int mark);</div><div class='ctx'> int btrfs_wait_tree_log_extents(struct btrfs_root *root, int mark);</div><div class='ctx'> int btrfs_transaction_blocked(struct btrfs_fs_info *info);</div><div class='del'>-int btrfs_transaction_in_commit(struct btrfs_fs_info *info);</div><div class='ctx'> void btrfs_put_transaction(struct btrfs_transaction *transaction);</div><div class='del'>-void btrfs_apply_pending_changes(struct btrfs_fs_info *fs_info);</div><div class='ctx'> void btrfs_add_dropped_root(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			    struct btrfs_root *root);</div><div class='ctx'> void btrfs_trans_release_chunk_metadata(struct btrfs_trans_handle *trans);</div><div class='add'>+void __cold __btrfs_abort_transaction(struct btrfs_trans_handle *trans,</div><div class='add'>+				      const char *function,</div><div class='add'>+				      unsigned int line, int error, bool first_hit);</div><div class='add'>+</div><div class='add'>+int __init btrfs_transaction_init(void);</div><div class='add'>+void __cold btrfs_transaction_exit(void);</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/btrfs/tree-checker.c b/fs/btrfs/tree-checker.c<br/>index 7733e8ac0a69..c21c21adf61e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tree-checker.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tree-checker.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tree-checker.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/tree-checker.c</a></div><div class='hunk'>@@ -18,13 +18,18 @@</div><div class='ctx'> #include &lt;linux/types.h&gt;</div><div class='ctx'> #include &lt;linux/stddef.h&gt;</div><div class='ctx'> #include &lt;linux/error-injection.h&gt;</div><div class='add'>+#include "messages.h"</div><div class='ctx'> #include "ctree.h"</div><div class='ctx'> #include "tree-checker.h"</div><div class='del'>-#include "disk-io.h"</div><div class='ctx'> #include "compression.h"</div><div class='ctx'> #include "volumes.h"</div><div class='ctx'> #include "misc.h"</div><div class='del'>-#include "btrfs_inode.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "file-item.h"</div><div class='add'>+#include "inode-item.h"</div><div class='add'>+#include "dir-item.h"</div><div class='add'>+#include "extent-tree.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Error message should follow the following format:</div><div class='hunk'>@@ -60,6 +65,7 @@ static void generic_err(const struct extent_buffer *eb, int slot,</div><div class='ctx'> 	vaf.fmt = fmt;</div><div class='ctx'> 	vaf.va = &amp;args;</div><div class='ctx'> </div><div class='add'>+	dump_page(folio_page(eb-&gt;folios[0], 0), "eb page dump");</div><div class='ctx'> 	btrfs_crit(fs_info,</div><div class='ctx'> 		"corrupt %s: root=%llu block=%llu slot=%d, %pV",</div><div class='ctx'> 		btrfs_header_level(eb) == 0 ? "leaf" : "node",</div><div class='hunk'>@@ -87,6 +93,7 @@ static void file_extent_err(const struct extent_buffer *eb, int slot,</div><div class='ctx'> 	vaf.fmt = fmt;</div><div class='ctx'> 	vaf.va = &amp;args;</div><div class='ctx'> </div><div class='add'>+	dump_page(folio_page(eb-&gt;folios[0], 0), "eb page dump");</div><div class='ctx'> 	btrfs_crit(fs_info,</div><div class='ctx'> 	"corrupt %s: root=%llu block=%llu slot=%d ino=%llu file_offset=%llu, %pV",</div><div class='ctx'> 		btrfs_header_level(eb) == 0 ? "leaf" : "node",</div><div class='hunk'>@@ -147,6 +154,7 @@ static void dir_item_err(const struct extent_buffer *eb, int slot,</div><div class='ctx'> 	vaf.fmt = fmt;</div><div class='ctx'> 	vaf.va = &amp;args;</div><div class='ctx'> </div><div class='add'>+	dump_page(folio_page(eb-&gt;folios[0], 0), "eb page dump");</div><div class='ctx'> 	btrfs_crit(fs_info,</div><div class='ctx'> 		"corrupt %s: root=%llu block=%llu slot=%d ino=%llu, %pV",</div><div class='ctx'> 		btrfs_header_level(eb) == 0 ? "leaf" : "node",</div><div class='hunk'>@@ -175,15 +183,16 @@ static bool check_prev_ino(struct extent_buffer *leaf,</div><div class='ctx'> 	/* Only these key-&gt;types needs to be checked */</div><div class='ctx'> 	ASSERT(key-&gt;type == BTRFS_XATTR_ITEM_KEY ||</div><div class='ctx'> 	       key-&gt;type == BTRFS_INODE_REF_KEY ||</div><div class='add'>+	       key-&gt;type == BTRFS_INODE_EXTREF_KEY ||</div><div class='ctx'> 	       key-&gt;type == BTRFS_DIR_INDEX_KEY ||</div><div class='ctx'> 	       key-&gt;type == BTRFS_DIR_ITEM_KEY ||</div><div class='del'>-	       key-&gt;type == BTRFS_EXTENT_DATA_KEY);</div><div class='add'>+	       key-&gt;type == BTRFS_EXTENT_DATA_KEY, "key-&gt;type=%u", key-&gt;type);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Only subvolume trees along with their reloc trees need this check.</div><div class='ctx'> 	 * Things like log tree doesn't follow this ino requirement.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!is_fstree(btrfs_header_owner(leaf)))</div><div class='add'>+	if (!btrfs_is_fstree(btrfs_header_owner(leaf)))</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='ctx'> 	if (key-&gt;objectid == prev_key-&gt;objectid)</div><div class='hunk'>@@ -202,7 +211,7 @@ static int check_extent_data_item(struct extent_buffer *leaf,</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = leaf-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_file_extent_item *fi;</div><div class='ctx'> 	u32 sectorsize = fs_info-&gt;sectorsize;</div><div class='del'>-	u32 item_size = btrfs_item_size_nr(leaf, slot);</div><div class='add'>+	u32 item_size = btrfs_item_size(leaf, slot);</div><div class='ctx'> 	u64 extent_end;</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(!IS_ALIGNED(key-&gt;offset, sectorsize))) {</div><div class='hunk'>@@ -332,6 +341,24 @@ static int check_extent_data_item(struct extent_buffer *leaf,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * For non-compressed data extents, ram_bytes should match its</div><div class='add'>+	 * disk_num_bytes.</div><div class='add'>+	 * However we do not really utilize ram_bytes in this case, so this check</div><div class='add'>+	 * is only optional for DEBUG builds for developers to catch the</div><div class='add'>+	 * unexpected behaviors.</div><div class='add'>+	 */</div><div class='add'>+	if (IS_ENABLED(CONFIG_BTRFS_DEBUG) &amp;&amp;</div><div class='add'>+	    btrfs_file_extent_compression(leaf, fi) == BTRFS_COMPRESS_NONE &amp;&amp;</div><div class='add'>+	    btrfs_file_extent_disk_bytenr(leaf, fi)) {</div><div class='add'>+		if (WARN_ON(btrfs_file_extent_ram_bytes(leaf, fi) !=</div><div class='add'>+			    btrfs_file_extent_disk_num_bytes(leaf, fi)))</div><div class='add'>+			file_extent_err(leaf, slot,</div><div class='add'>+"mismatch ram_bytes (%llu) and disk_num_bytes (%llu) for non-compressed extent",</div><div class='add'>+					btrfs_file_extent_ram_bytes(leaf, fi),</div><div class='add'>+					btrfs_file_extent_disk_num_bytes(leaf, fi));</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -354,17 +381,17 @@ static int check_csum_item(struct extent_buffer *leaf, struct btrfs_key *key,</div><div class='ctx'> 			key-&gt;offset, sectorsize);</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='del'>-	if (unlikely(!IS_ALIGNED(btrfs_item_size_nr(leaf, slot), csumsize))) {</div><div class='add'>+	if (unlikely(!IS_ALIGNED(btrfs_item_size(leaf, slot), csumsize))) {</div><div class='ctx'> 		generic_err(leaf, slot,</div><div class='ctx'> 	"unaligned item size for csum item, have %u should be aligned to %u",</div><div class='del'>-			btrfs_item_size_nr(leaf, slot), csumsize);</div><div class='add'>+			btrfs_item_size(leaf, slot), csumsize);</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (slot &gt; 0 &amp;&amp; prev_key-&gt;type == BTRFS_EXTENT_CSUM_KEY) {</div><div class='ctx'> 		u64 prev_csum_end;</div><div class='ctx'> 		u32 prev_item_size;</div><div class='ctx'> </div><div class='del'>-		prev_item_size = btrfs_item_size_nr(leaf, slot - 1);</div><div class='add'>+		prev_item_size = btrfs_item_size(leaf, slot - 1);</div><div class='ctx'> 		prev_csum_end = (prev_item_size / csumsize) * sectorsize;</div><div class='ctx'> 		prev_csum_end += prev_key-&gt;offset;</div><div class='ctx'> 		if (unlikely(prev_csum_end &gt; key-&gt;offset)) {</div><div class='hunk'>@@ -442,6 +469,20 @@ static int check_root_key(struct extent_buffer *leaf, struct btrfs_key *key,</div><div class='ctx'> 	btrfs_item_key_to_cpu(leaf, &amp;item_key, slot);</div><div class='ctx'> 	is_root_item = (item_key.type == BTRFS_ROOT_ITEM_KEY);</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Bad rootid for reloc trees.</div><div class='add'>+	 *</div><div class='add'>+	 * Reloc trees are only for subvolume trees, other trees only need</div><div class='add'>+	 * to be COWed to be relocated.</div><div class='add'>+	 */</div><div class='add'>+	if (unlikely(is_root_item &amp;&amp; key-&gt;objectid == BTRFS_TREE_RELOC_OBJECTID &amp;&amp;</div><div class='add'>+		     !btrfs_is_fstree(key-&gt;offset))) {</div><div class='add'>+		generic_err(leaf, slot,</div><div class='add'>+		"invalid reloc tree for root %lld, root id is not a subvolume tree",</div><div class='add'>+			    key-&gt;offset);</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/* No such tree id */</div><div class='ctx'> 	if (unlikely(key-&gt;objectid == 0)) {</div><div class='ctx'> 		if (is_root_item)</div><div class='hunk'>@@ -453,7 +494,7 @@ static int check_root_key(struct extent_buffer *leaf, struct btrfs_key *key,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* DIR_ITEM/INDEX/INODE_REF is not allowed to point to non-fs trees */</div><div class='del'>-	if (unlikely(!is_fstree(key-&gt;objectid) &amp;&amp; !is_root_item)) {</div><div class='add'>+	if (unlikely(!btrfs_is_fstree(key-&gt;objectid) &amp;&amp; !is_root_item)) {</div><div class='ctx'> 		dir_item_err(leaf, slot,</div><div class='ctx'> 		"invalid location key objectid, have %llu expect [%llu, %llu]",</div><div class='ctx'> 				key-&gt;objectid, BTRFS_FIRST_FREE_OBJECTID,</div><div class='hunk'>@@ -483,7 +524,7 @@ static int check_dir_item(struct extent_buffer *leaf,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = leaf-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_dir_item *di;</div><div class='del'>-	u32 item_size = btrfs_item_size_nr(leaf, slot);</div><div class='add'>+	u32 item_size = btrfs_item_size(leaf, slot);</div><div class='ctx'> 	u32 cur = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(!check_prev_ino(leaf, key, slot, prev_key)))</div><div class='hunk'>@@ -528,10 +569,11 @@ static int check_dir_item(struct extent_buffer *leaf,</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* dir type check */</div><div class='del'>-		dir_type = btrfs_dir_type(leaf, di);</div><div class='del'>-		if (unlikely(dir_type &gt;= BTRFS_FT_MAX)) {</div><div class='add'>+		dir_type = btrfs_dir_ftype(leaf, di);</div><div class='add'>+		if (unlikely(dir_type &lt;= BTRFS_FT_UNKNOWN ||</div><div class='add'>+			     dir_type &gt;= BTRFS_FT_MAX)) {</div><div class='ctx'> 			dir_item_err(leaf, slot,</div><div class='del'>-			"invalid dir item type, have %u expect [0, %u)",</div><div class='add'>+			"invalid dir item type, have %u expect (0, %u)",</div><div class='ctx'> 				dir_type, BTRFS_FT_MAX);</div><div class='ctx'> 			return -EUCLEAN;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -594,7 +636,7 @@ static int check_dir_item(struct extent_buffer *leaf,</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (key-&gt;type == BTRFS_DIR_ITEM_KEY ||</div><div class='ctx'> 		    key-&gt;type == BTRFS_XATTR_ITEM_KEY) {</div><div class='del'>-			char namebuf[max(BTRFS_NAME_LEN, XATTR_NAME_MAX)];</div><div class='add'>+			char namebuf[MAX(BTRFS_NAME_LEN, XATTR_NAME_MAX)];</div><div class='ctx'> </div><div class='ctx'> 			read_extent_buffer(leaf, namebuf,</div><div class='ctx'> 					(unsigned long)(di + 1), name_len);</div><div class='hunk'>@@ -628,6 +670,7 @@ static void block_group_err(const struct extent_buffer *eb, int slot,</div><div class='ctx'> 	vaf.fmt = fmt;</div><div class='ctx'> 	vaf.va = &amp;args;</div><div class='ctx'> </div><div class='add'>+	dump_page(folio_page(eb-&gt;folios[0], 0), "eb page dump");</div><div class='ctx'> 	btrfs_crit(fs_info,</div><div class='ctx'> 	"corrupt %s: root=%llu block=%llu slot=%d bg_start=%llu bg_len=%llu, %pV",</div><div class='ctx'> 		btrfs_header_level(eb) == 0 ? "leaf" : "node",</div><div class='hunk'>@@ -639,8 +682,10 @@ static void block_group_err(const struct extent_buffer *eb, int slot,</div><div class='ctx'> static int check_block_group_item(struct extent_buffer *leaf,</div><div class='ctx'> 				  struct btrfs_key *key, int slot)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = leaf-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_block_group_item bgi;</div><div class='del'>-	u32 item_size = btrfs_item_size_nr(leaf, slot);</div><div class='add'>+	u32 item_size = btrfs_item_size(leaf, slot);</div><div class='add'>+	u64 chunk_objectid;</div><div class='ctx'> 	u64 flags;</div><div class='ctx'> 	u64 type;</div><div class='ctx'> </div><div class='hunk'>@@ -663,8 +708,23 @@ static int check_block_group_item(struct extent_buffer *leaf,</div><div class='ctx'> </div><div class='ctx'> 	read_extent_buffer(leaf, &amp;bgi, btrfs_item_ptr_offset(leaf, slot),</div><div class='ctx'> 			   sizeof(bgi));</div><div class='del'>-	if (unlikely(btrfs_stack_block_group_chunk_objectid(&amp;bgi) !=</div><div class='del'>-		     BTRFS_FIRST_CHUNK_TREE_OBJECTID)) {</div><div class='add'>+	chunk_objectid = btrfs_stack_block_group_chunk_objectid(&amp;bgi);</div><div class='add'>+	if (btrfs_fs_incompat(fs_info, EXTENT_TREE_V2)) {</div><div class='add'>+		/*</div><div class='add'>+		 * We don't init the nr_global_roots until we load the global</div><div class='add'>+		 * roots, so this could be 0 at mount time.  If it's 0 we'll</div><div class='add'>+		 * just assume we're fine, and later we'll check against our</div><div class='add'>+		 * actual value.</div><div class='add'>+		 */</div><div class='add'>+		if (unlikely(fs_info-&gt;nr_global_roots &amp;&amp;</div><div class='add'>+			     chunk_objectid &gt;= fs_info-&gt;nr_global_roots)) {</div><div class='add'>+			block_group_err(leaf, slot,</div><div class='add'>+	"invalid block group global root id, have %llu, needs to be &lt;= %llu",</div><div class='add'>+					chunk_objectid,</div><div class='add'>+					fs_info-&gt;nr_global_roots);</div><div class='add'>+			return -EUCLEAN;</div><div class='add'>+		}</div><div class='add'>+	} else if (unlikely(chunk_objectid != BTRFS_FIRST_CHUNK_TREE_OBJECTID)) {</div><div class='ctx'> 		block_group_err(leaf, slot,</div><div class='ctx'> 		"invalid block group chunk objectid, have %llu expect %llu",</div><div class='ctx'> 				btrfs_stack_block_group_chunk_objectid(&amp;bgi),</div><div class='hunk'>@@ -705,22 +765,19 @@ static int check_block_group_item(struct extent_buffer *leaf,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-__printf(4, 5)</div><div class='add'>+__printf(5, 6)</div><div class='ctx'> __cold</div><div class='del'>-static void chunk_err(const struct extent_buffer *leaf,</div><div class='add'>+static void chunk_err(const struct btrfs_fs_info *fs_info,</div><div class='add'>+		      const struct extent_buffer *leaf,</div><div class='ctx'> 		      const struct btrfs_chunk *chunk, u64 logical,</div><div class='ctx'> 		      const char *fmt, ...)</div><div class='ctx'> {</div><div class='del'>-	const struct btrfs_fs_info *fs_info = leaf-&gt;fs_info;</div><div class='del'>-	bool is_sb;</div><div class='add'>+	bool is_sb = !leaf;</div><div class='ctx'> 	struct va_format vaf;</div><div class='ctx'> 	va_list args;</div><div class='ctx'> 	int i;</div><div class='ctx'> 	int slot = -1;</div><div class='ctx'> </div><div class='del'>-	/* Only superblock eb is able to have such small offset */</div><div class='del'>-	is_sb = (leaf-&gt;start == BTRFS_SUPER_INFO_OFFSET);</div><div class='del'>-</div><div class='ctx'> 	if (!is_sb) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Get the slot number by iterating through all slots, this</div><div class='hunk'>@@ -753,13 +810,17 @@ static void chunk_err(const struct extent_buffer *leaf,</div><div class='ctx'> /*</div><div class='ctx'>  * The common chunk check which could also work on super block sys chunk array.</div><div class='ctx'>  *</div><div class='add'>+ * If @leaf is NULL, then @chunk must be an on-stack chunk item.</div><div class='add'>+ * (For superblock sys_chunk array, and fs_info-&gt;sectorsize is unreliable)</div><div class='add'>+ *</div><div class='ctx'>  * Return -EUCLEAN if anything is corrupted.</div><div class='ctx'>  * Return 0 if everything is OK.</div><div class='ctx'>  */</div><div class='del'>-int btrfs_check_chunk_valid(struct extent_buffer *leaf,</div><div class='del'>-			    struct btrfs_chunk *chunk, u64 logical)</div><div class='add'>+int btrfs_check_chunk_valid(const struct btrfs_fs_info *fs_info,</div><div class='add'>+			    const struct extent_buffer *leaf,</div><div class='add'>+			    const struct btrfs_chunk *chunk, u64 logical,</div><div class='add'>+			    u32 sectorsize)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = leaf-&gt;fs_info;</div><div class='ctx'> 	u64 length;</div><div class='ctx'> 	u64 chunk_end;</div><div class='ctx'> 	u64 stripe_len;</div><div class='hunk'>@@ -767,86 +828,109 @@ int btrfs_check_chunk_valid(struct extent_buffer *leaf,</div><div class='ctx'> 	u16 sub_stripes;</div><div class='ctx'> 	u64 type;</div><div class='ctx'> 	u64 features;</div><div class='add'>+	u32 chunk_sector_size;</div><div class='ctx'> 	bool mixed = false;</div><div class='ctx'> 	int raid_index;</div><div class='ctx'> 	int nparity;</div><div class='ctx'> 	int ncopies;</div><div class='ctx'> </div><div class='del'>-	length = btrfs_chunk_length(leaf, chunk);</div><div class='del'>-	stripe_len = btrfs_chunk_stripe_len(leaf, chunk);</div><div class='del'>-	num_stripes = btrfs_chunk_num_stripes(leaf, chunk);</div><div class='del'>-	sub_stripes = btrfs_chunk_sub_stripes(leaf, chunk);</div><div class='del'>-	type = btrfs_chunk_type(leaf, chunk);</div><div class='add'>+	if (leaf) {</div><div class='add'>+		length = btrfs_chunk_length(leaf, chunk);</div><div class='add'>+		stripe_len = btrfs_chunk_stripe_len(leaf, chunk);</div><div class='add'>+		num_stripes = btrfs_chunk_num_stripes(leaf, chunk);</div><div class='add'>+		sub_stripes = btrfs_chunk_sub_stripes(leaf, chunk);</div><div class='add'>+		type = btrfs_chunk_type(leaf, chunk);</div><div class='add'>+		chunk_sector_size = btrfs_chunk_sector_size(leaf, chunk);</div><div class='add'>+	} else {</div><div class='add'>+		length = btrfs_stack_chunk_length(chunk);</div><div class='add'>+		stripe_len = btrfs_stack_chunk_stripe_len(chunk);</div><div class='add'>+		num_stripes = btrfs_stack_chunk_num_stripes(chunk);</div><div class='add'>+		sub_stripes = btrfs_stack_chunk_sub_stripes(chunk);</div><div class='add'>+		type = btrfs_stack_chunk_type(chunk);</div><div class='add'>+		chunk_sector_size = btrfs_stack_chunk_sector_size(chunk);</div><div class='add'>+	}</div><div class='ctx'> 	raid_index = btrfs_bg_flags_to_raid_index(type);</div><div class='ctx'> 	ncopies = btrfs_raid_array[raid_index].ncopies;</div><div class='ctx'> 	nparity = btrfs_raid_array[raid_index].nparity;</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(!num_stripes)) {</div><div class='del'>-		chunk_err(leaf, chunk, logical,</div><div class='add'>+		chunk_err(fs_info, leaf, chunk, logical,</div><div class='ctx'> 			  "invalid chunk num_stripes, have %u", num_stripes);</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (unlikely(num_stripes &lt; ncopies)) {</div><div class='del'>-		chunk_err(leaf, chunk, logical,</div><div class='add'>+		chunk_err(fs_info, leaf, chunk, logical,</div><div class='ctx'> 			  "invalid chunk num_stripes &lt; ncopies, have %u &lt; %d",</div><div class='ctx'> 			  num_stripes, ncopies);</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (unlikely(nparity &amp;&amp; num_stripes == nparity)) {</div><div class='del'>-		chunk_err(leaf, chunk, logical,</div><div class='add'>+		chunk_err(fs_info, leaf, chunk, logical,</div><div class='ctx'> 			  "invalid chunk num_stripes == nparity, have %u == %d",</div><div class='ctx'> 			  num_stripes, nparity);</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='del'>-	if (unlikely(!IS_ALIGNED(logical, fs_info-&gt;sectorsize))) {</div><div class='del'>-		chunk_err(leaf, chunk, logical,</div><div class='add'>+	if (unlikely(!IS_ALIGNED(logical, sectorsize))) {</div><div class='add'>+		chunk_err(fs_info, leaf, chunk, logical,</div><div class='ctx'> 		"invalid chunk logical, have %llu should aligned to %u",</div><div class='del'>-			  logical, fs_info-&gt;sectorsize);</div><div class='add'>+			  logical, sectorsize);</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='del'>-	if (unlikely(btrfs_chunk_sector_size(leaf, chunk) != fs_info-&gt;sectorsize)) {</div><div class='del'>-		chunk_err(leaf, chunk, logical,</div><div class='add'>+	if (unlikely(chunk_sector_size != sectorsize)) {</div><div class='add'>+		chunk_err(fs_info, leaf, chunk, logical,</div><div class='ctx'> 			  "invalid chunk sectorsize, have %u expect %u",</div><div class='del'>-			  btrfs_chunk_sector_size(leaf, chunk),</div><div class='del'>-			  fs_info-&gt;sectorsize);</div><div class='add'>+			  chunk_sector_size, sectorsize);</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='del'>-	if (unlikely(!length || !IS_ALIGNED(length, fs_info-&gt;sectorsize))) {</div><div class='del'>-		chunk_err(leaf, chunk, logical,</div><div class='add'>+	if (unlikely(!length || !IS_ALIGNED(length, sectorsize))) {</div><div class='add'>+		chunk_err(fs_info, leaf, chunk, logical,</div><div class='ctx'> 			  "invalid chunk length, have %llu", length);</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (unlikely(check_add_overflow(logical, length, &amp;chunk_end))) {</div><div class='del'>-		chunk_err(leaf, chunk, logical,</div><div class='add'>+		chunk_err(fs_info, leaf, chunk, logical,</div><div class='ctx'> "invalid chunk logical start and length, have logical start %llu length %llu",</div><div class='ctx'> 			  logical, length);</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (unlikely(!is_power_of_2(stripe_len) || stripe_len != BTRFS_STRIPE_LEN)) {</div><div class='del'>-		chunk_err(leaf, chunk, logical,</div><div class='add'>+		chunk_err(fs_info, leaf, chunk, logical,</div><div class='ctx'> 			  "invalid chunk stripe length: %llu",</div><div class='ctx'> 			  stripe_len);</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='add'>+	/*</div><div class='add'>+	 * We artificially limit the chunk size, so that the number of stripes</div><div class='add'>+	 * inside a chunk can be fit into a U32.  The current limit (256G) is</div><div class='add'>+	 * way too large for real world usage anyway, and it's also much larger</div><div class='add'>+	 * than our existing limit (10G).</div><div class='add'>+	 *</div><div class='add'>+	 * Thus it should be a good way to catch obvious bitflips.</div><div class='add'>+	 */</div><div class='add'>+	if (unlikely(length &gt;= btrfs_stripe_nr_to_offset(U32_MAX))) {</div><div class='add'>+		chunk_err(fs_info, leaf, chunk, logical,</div><div class='add'>+			  "chunk length too large: have %llu limit %llu",</div><div class='add'>+			  length, btrfs_stripe_nr_to_offset(U32_MAX));</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='ctx'> 	if (unlikely(type &amp; ~(BTRFS_BLOCK_GROUP_TYPE_MASK |</div><div class='ctx'> 			      BTRFS_BLOCK_GROUP_PROFILE_MASK))) {</div><div class='del'>-		chunk_err(leaf, chunk, logical,</div><div class='add'>+		chunk_err(fs_info, leaf, chunk, logical,</div><div class='ctx'> 			  "unrecognized chunk type: 0x%llx",</div><div class='ctx'> 			  ~(BTRFS_BLOCK_GROUP_TYPE_MASK |</div><div class='del'>-			    BTRFS_BLOCK_GROUP_PROFILE_MASK) &amp;</div><div class='del'>-			  btrfs_chunk_type(leaf, chunk));</div><div class='add'>+			    BTRFS_BLOCK_GROUP_PROFILE_MASK) &amp; type);</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(!has_single_bit_set(type &amp; BTRFS_BLOCK_GROUP_PROFILE_MASK) &amp;&amp;</div><div class='ctx'> 		     (type &amp; BTRFS_BLOCK_GROUP_PROFILE_MASK) != 0)) {</div><div class='del'>-		chunk_err(leaf, chunk, logical,</div><div class='add'>+		chunk_err(fs_info, leaf, chunk, logical,</div><div class='ctx'> 		"invalid chunk profile flag: 0x%llx, expect 0 or 1 bit set",</div><div class='ctx'> 			  type &amp; BTRFS_BLOCK_GROUP_PROFILE_MASK);</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (unlikely((type &amp; BTRFS_BLOCK_GROUP_TYPE_MASK) == 0)) {</div><div class='del'>-		chunk_err(leaf, chunk, logical,</div><div class='add'>+		chunk_err(fs_info, leaf, chunk, logical,</div><div class='ctx'> 	"missing chunk type flag, have 0x%llx one bit must be set in 0x%llx",</div><div class='ctx'> 			  type, BTRFS_BLOCK_GROUP_TYPE_MASK);</div><div class='ctx'> 		return -EUCLEAN;</div><div class='hunk'>@@ -855,7 +939,7 @@ int btrfs_check_chunk_valid(struct extent_buffer *leaf,</div><div class='ctx'> 	if (unlikely((type &amp; BTRFS_BLOCK_GROUP_SYSTEM) &amp;&amp;</div><div class='ctx'> 		     (type &amp; (BTRFS_BLOCK_GROUP_METADATA |</div><div class='ctx'> 			      BTRFS_BLOCK_GROUP_DATA)))) {</div><div class='del'>-		chunk_err(leaf, chunk, logical,</div><div class='add'>+		chunk_err(fs_info, leaf, chunk, logical,</div><div class='ctx'> 			  "system chunk with data or metadata type: 0x%llx",</div><div class='ctx'> 			  type);</div><div class='ctx'> 		return -EUCLEAN;</div><div class='hunk'>@@ -868,7 +952,7 @@ int btrfs_check_chunk_valid(struct extent_buffer *leaf,</div><div class='ctx'> 	if (!mixed) {</div><div class='ctx'> 		if (unlikely((type &amp; BTRFS_BLOCK_GROUP_METADATA) &amp;&amp;</div><div class='ctx'> 			     (type &amp; BTRFS_BLOCK_GROUP_DATA))) {</div><div class='del'>-			chunk_err(leaf, chunk, logical,</div><div class='add'>+			chunk_err(fs_info, leaf, chunk, logical,</div><div class='ctx'> 			"mixed chunk type in non-mixed mode: 0x%llx", type);</div><div class='ctx'> 			return -EUCLEAN;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -890,7 +974,7 @@ int btrfs_check_chunk_valid(struct extent_buffer *leaf,</div><div class='ctx'> 		      num_stripes != btrfs_raid_array[BTRFS_RAID_DUP].dev_stripes) ||</div><div class='ctx'> 		     ((type &amp; BTRFS_BLOCK_GROUP_PROFILE_MASK) == 0 &amp;&amp;</div><div class='ctx'> 		      num_stripes != btrfs_raid_array[BTRFS_RAID_SINGLE].dev_stripes))) {</div><div class='del'>-		chunk_err(leaf, chunk, logical,</div><div class='add'>+		chunk_err(fs_info, leaf, chunk, logical,</div><div class='ctx'> 			"invalid num_stripes:sub_stripes %u:%u for profile %llu",</div><div class='ctx'> 			num_stripes, sub_stripes,</div><div class='ctx'> 			type &amp; BTRFS_BLOCK_GROUP_PROFILE_MASK);</div><div class='hunk'>@@ -910,14 +994,15 @@ static int check_leaf_chunk_item(struct extent_buffer *leaf,</div><div class='ctx'> 				 struct btrfs_chunk *chunk,</div><div class='ctx'> 				 struct btrfs_key *key, int slot)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = leaf-&gt;fs_info;</div><div class='ctx'> 	int num_stripes;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(btrfs_item_size_nr(leaf, slot) &lt; sizeof(struct btrfs_chunk))) {</div><div class='del'>-		chunk_err(leaf, chunk, key-&gt;offset,</div><div class='add'>+	if (unlikely(btrfs_item_size(leaf, slot) &lt; sizeof(struct btrfs_chunk))) {</div><div class='add'>+		chunk_err(fs_info, leaf, chunk, key-&gt;offset,</div><div class='ctx'> 			"invalid chunk item size: have %u expect [%zu, %u)",</div><div class='del'>-			btrfs_item_size_nr(leaf, slot),</div><div class='add'>+			btrfs_item_size(leaf, slot),</div><div class='ctx'> 			sizeof(struct btrfs_chunk),</div><div class='del'>-			BTRFS_LEAF_DATA_SIZE(leaf-&gt;fs_info));</div><div class='add'>+			BTRFS_LEAF_DATA_SIZE(fs_info));</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -927,15 +1012,16 @@ static int check_leaf_chunk_item(struct extent_buffer *leaf,</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(btrfs_chunk_item_size(num_stripes) !=</div><div class='del'>-		     btrfs_item_size_nr(leaf, slot))) {</div><div class='del'>-		chunk_err(leaf, chunk, key-&gt;offset,</div><div class='add'>+		     btrfs_item_size(leaf, slot))) {</div><div class='add'>+		chunk_err(fs_info, leaf, chunk, key-&gt;offset,</div><div class='ctx'> 			"invalid chunk item size: have %u expect %lu",</div><div class='del'>-			btrfs_item_size_nr(leaf, slot),</div><div class='add'>+			btrfs_item_size(leaf, slot),</div><div class='ctx'> 			btrfs_chunk_item_size(num_stripes));</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='del'>-	return btrfs_check_chunk_valid(leaf, chunk, key-&gt;offset);</div><div class='add'>+	return btrfs_check_chunk_valid(fs_info, leaf, chunk, key-&gt;offset,</div><div class='add'>+				       fs_info-&gt;sectorsize);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> __printf(3, 4)</div><div class='hunk'>@@ -953,6 +1039,7 @@ static void dev_item_err(const struct extent_buffer *eb, int slot,</div><div class='ctx'> 	vaf.fmt = fmt;</div><div class='ctx'> 	vaf.va = &amp;args;</div><div class='ctx'> </div><div class='add'>+	dump_page(folio_page(eb-&gt;folios[0], 0), "eb page dump");</div><div class='ctx'> 	btrfs_crit(eb-&gt;fs_info,</div><div class='ctx'> 	"corrupt %s: root=%llu block=%llu slot=%d devid=%llu %pV",</div><div class='ctx'> 		btrfs_header_level(eb) == 0 ? "leaf" : "node",</div><div class='hunk'>@@ -965,6 +1052,7 @@ static int check_dev_item(struct extent_buffer *leaf,</div><div class='ctx'> 			  struct btrfs_key *key, int slot)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_dev_item *ditem;</div><div class='add'>+	const u32 item_size = btrfs_item_size(leaf, slot);</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(key-&gt;objectid != BTRFS_DEV_ITEMS_OBJECTID)) {</div><div class='ctx'> 		dev_item_err(leaf, slot,</div><div class='hunk'>@@ -972,6 +1060,13 @@ static int check_dev_item(struct extent_buffer *leaf,</div><div class='ctx'> 			     key-&gt;objectid, BTRFS_DEV_ITEMS_OBJECTID);</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	if (unlikely(item_size != sizeof(*ditem))) {</div><div class='add'>+		dev_item_err(leaf, slot, "invalid item size: has %u expect %zu",</div><div class='add'>+			     item_size, sizeof(*ditem));</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	ditem = btrfs_item_ptr(leaf, slot, struct btrfs_dev_item);</div><div class='ctx'> 	if (unlikely(btrfs_device_id(leaf, ditem) != key-&gt;offset)) {</div><div class='ctx'> 		dev_item_err(leaf, slot,</div><div class='hunk'>@@ -1007,6 +1102,7 @@ static int check_inode_item(struct extent_buffer *leaf,</div><div class='ctx'> 	struct btrfs_inode_item *iitem;</div><div class='ctx'> 	u64 super_gen = btrfs_super_generation(fs_info-&gt;super_copy);</div><div class='ctx'> 	u32 valid_mask = (S_IFMT | S_ISUID | S_ISGID | S_ISVTX | 0777);</div><div class='add'>+	const u32 item_size = btrfs_item_size(leaf, slot);</div><div class='ctx'> 	u32 mode;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	u32 flags;</div><div class='hunk'>@@ -1016,6 +1112,12 @@ static int check_inode_item(struct extent_buffer *leaf,</div><div class='ctx'> 	if (unlikely(ret &lt; 0))</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='add'>+	if (unlikely(item_size != sizeof(*iitem))) {</div><div class='add'>+		generic_err(leaf, slot, "invalid item size: has %u expect %zu",</div><div class='add'>+			    item_size, sizeof(*iitem));</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	iitem = btrfs_item_ptr(leaf, slot, struct btrfs_inode_item);</div><div class='ctx'> </div><div class='ctx'> 	/* Here we use super block generation + 1 to handle log tree */</div><div class='hunk'>@@ -1095,12 +1197,12 @@ static int check_root_item(struct extent_buffer *leaf, struct btrfs_key *key,</div><div class='ctx'> 	if (unlikely(ret &lt; 0))</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(btrfs_item_size_nr(leaf, slot) != sizeof(ri) &amp;&amp;</div><div class='del'>-		     btrfs_item_size_nr(leaf, slot) !=</div><div class='add'>+	if (unlikely(btrfs_item_size(leaf, slot) != sizeof(ri) &amp;&amp;</div><div class='add'>+		     btrfs_item_size(leaf, slot) !=</div><div class='ctx'> 		     btrfs_legacy_root_item_size())) {</div><div class='ctx'> 		generic_err(leaf, slot,</div><div class='ctx'> 			    "invalid root item size, have %u expect %zu or %u",</div><div class='del'>-			    btrfs_item_size_nr(leaf, slot), sizeof(ri),</div><div class='add'>+			    btrfs_item_size(leaf, slot), sizeof(ri),</div><div class='ctx'> 			    btrfs_legacy_root_item_size());</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1108,10 +1210,10 @@ static int check_root_item(struct extent_buffer *leaf, struct btrfs_key *key,</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * For legacy root item, the members starting at generation_v2 will be</div><div class='ctx'> 	 * all filled with 0.</div><div class='del'>-	 * And since we allow geneartion_v2 as 0, it will still pass the check.</div><div class='add'>+	 * And since we allow generation_v2 as 0, it will still pass the check.</div><div class='ctx'> 	 */</div><div class='ctx'> 	read_extent_buffer(leaf, &amp;ri, btrfs_item_ptr_offset(leaf, slot),</div><div class='del'>-			   btrfs_item_size_nr(leaf, slot));</div><div class='add'>+			   btrfs_item_size(leaf, slot));</div><div class='ctx'> </div><div class='ctx'> 	/* Generation related */</div><div class='ctx'> 	if (unlikely(btrfs_root_generation(&amp;ri) &gt;</div><div class='hunk'>@@ -1193,6 +1295,7 @@ static void extent_err(const struct extent_buffer *eb, int slot,</div><div class='ctx'> 	vaf.fmt = fmt;</div><div class='ctx'> 	vaf.va = &amp;args;</div><div class='ctx'> </div><div class='add'>+	dump_page(folio_page(eb-&gt;folios[0], 0), "eb page dump");</div><div class='ctx'> 	btrfs_crit(eb-&gt;fs_info,</div><div class='ctx'> 	"corrupt %s: block=%llu slot=%d extent bytenr=%llu len=%llu %pV",</div><div class='ctx'> 		btrfs_header_level(eb) == 0 ? "leaf" : "node",</div><div class='hunk'>@@ -1200,15 +1303,31 @@ static void extent_err(const struct extent_buffer *eb, int slot,</div><div class='ctx'> 	va_end(args);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool is_valid_dref_root(u64 rootid)</div><div class='add'>+{</div><div class='add'>+	/*</div><div class='add'>+	 * The following tree root objectids are allowed to have a data backref:</div><div class='add'>+	 * - subvolume trees</div><div class='add'>+	 * - data reloc tree</div><div class='add'>+	 * - tree root</div><div class='add'>+	 *   For v1 space cache</div><div class='add'>+	 */</div><div class='add'>+	return btrfs_is_fstree(rootid) || rootid == BTRFS_DATA_RELOC_TREE_OBJECTID ||</div><div class='add'>+	       rootid == BTRFS_ROOT_TREE_OBJECTID;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int check_extent_item(struct extent_buffer *leaf,</div><div class='del'>-			     struct btrfs_key *key, int slot)</div><div class='add'>+			     struct btrfs_key *key, int slot,</div><div class='add'>+			     struct btrfs_key *prev_key)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = leaf-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_extent_item *ei;</div><div class='ctx'> 	bool is_tree_block = false;</div><div class='ctx'> 	unsigned long ptr;	/* Current pointer inside inline refs */</div><div class='ctx'> 	unsigned long end;	/* Extent item end */</div><div class='del'>-	const u32 item_size = btrfs_item_size_nr(leaf, slot);</div><div class='add'>+	const u32 item_size = btrfs_item_size(leaf, slot);</div><div class='add'>+	u8 last_type = 0;</div><div class='add'>+	u64 last_seq = U64_MAX;</div><div class='ctx'> 	u64 flags;</div><div class='ctx'> 	u64 generation;</div><div class='ctx'> 	u64 total_refs;		/* Total refs in btrfs_extent_item */</div><div class='hunk'>@@ -1255,6 +1374,18 @@ static int check_extent_item(struct extent_buffer *leaf,</div><div class='ctx'> 	 *    2.2) Ref type specific data</div><div class='ctx'> 	 *         Either using btrfs_extent_inline_ref::offset, or specific</div><div class='ctx'> 	 *         data structure.</div><div class='add'>+	 *</div><div class='add'>+	 *    All above inline items should follow the order:</div><div class='add'>+	 *</div><div class='add'>+	 *    - All btrfs_extent_inline_ref::type should be in an ascending</div><div class='add'>+	 *      order</div><div class='add'>+	 *</div><div class='add'>+	 *    - Within the same type, the items should follow a descending</div><div class='add'>+	 *      order by their sequence number. The sequence number is</div><div class='add'>+	 *      determined by:</div><div class='add'>+	 *      * btrfs_extent_inline_ref::offset for all types  other than</div><div class='add'>+	 *        EXTENT_DATA_REF</div><div class='add'>+	 *      * hash_extent_data_ref() for EXTENT_DATA_REF</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (unlikely(item_size &lt; sizeof(*ei))) {</div><div class='ctx'> 		extent_err(leaf, slot,</div><div class='hunk'>@@ -1336,6 +1467,9 @@ static int check_extent_item(struct extent_buffer *leaf,</div><div class='ctx'> 		struct btrfs_extent_inline_ref *iref;</div><div class='ctx'> 		struct btrfs_extent_data_ref *dref;</div><div class='ctx'> 		struct btrfs_shared_data_ref *sref;</div><div class='add'>+		u64 seq;</div><div class='add'>+		u64 dref_root;</div><div class='add'>+		u64 dref_objectid;</div><div class='ctx'> 		u64 dref_offset;</div><div class='ctx'> 		u64 inline_offset;</div><div class='ctx'> 		u8 inline_type;</div><div class='hunk'>@@ -1349,10 +1483,11 @@ static int check_extent_item(struct extent_buffer *leaf,</div><div class='ctx'> 		iref = (struct btrfs_extent_inline_ref *)ptr;</div><div class='ctx'> 		inline_type = btrfs_extent_inline_ref_type(leaf, iref);</div><div class='ctx'> 		inline_offset = btrfs_extent_inline_ref_offset(leaf, iref);</div><div class='add'>+		seq = inline_offset;</div><div class='ctx'> 		if (unlikely(ptr + btrfs_extent_inline_ref_size(inline_type) &gt; end)) {</div><div class='ctx'> 			extent_err(leaf, slot,</div><div class='ctx'> "inline ref item overflows extent item, ptr %lu iref size %u end %lu",</div><div class='del'>-				   ptr, inline_type, end);</div><div class='add'>+				   ptr, btrfs_extent_inline_ref_size(inline_type), end);</div><div class='ctx'> 			return -EUCLEAN;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -1378,7 +1513,26 @@ static int check_extent_item(struct extent_buffer *leaf,</div><div class='ctx'> 		 */</div><div class='ctx'> 		case BTRFS_EXTENT_DATA_REF_KEY:</div><div class='ctx'> 			dref = (struct btrfs_extent_data_ref *)(&amp;iref-&gt;offset);</div><div class='add'>+			dref_root = btrfs_extent_data_ref_root(leaf, dref);</div><div class='add'>+			dref_objectid = btrfs_extent_data_ref_objectid(leaf, dref);</div><div class='ctx'> 			dref_offset = btrfs_extent_data_ref_offset(leaf, dref);</div><div class='add'>+			seq = hash_extent_data_ref(</div><div class='add'>+					btrfs_extent_data_ref_root(leaf, dref),</div><div class='add'>+					btrfs_extent_data_ref_objectid(leaf, dref),</div><div class='add'>+					btrfs_extent_data_ref_offset(leaf, dref));</div><div class='add'>+			if (unlikely(!is_valid_dref_root(dref_root))) {</div><div class='add'>+				extent_err(leaf, slot,</div><div class='add'>+					   "invalid data ref root value %llu",</div><div class='add'>+					   dref_root);</div><div class='add'>+				return -EUCLEAN;</div><div class='add'>+			}</div><div class='add'>+			if (unlikely(dref_objectid &lt; BTRFS_FIRST_FREE_OBJECTID ||</div><div class='add'>+				     dref_objectid &gt; BTRFS_LAST_FREE_OBJECTID)) {</div><div class='add'>+				extent_err(leaf, slot,</div><div class='add'>+					   "invalid data ref objectid value %llu",</div><div class='add'>+					   dref_objectid);</div><div class='add'>+				return -EUCLEAN;</div><div class='add'>+			}</div><div class='ctx'> 			if (unlikely(!IS_ALIGNED(dref_offset,</div><div class='ctx'> 						 fs_info-&gt;sectorsize))) {</div><div class='ctx'> 				extent_err(leaf, slot,</div><div class='hunk'>@@ -1386,6 +1540,11 @@ static int check_extent_item(struct extent_buffer *leaf,</div><div class='ctx'> 					   dref_offset, fs_info-&gt;sectorsize);</div><div class='ctx'> 				return -EUCLEAN;</div><div class='ctx'> 			}</div><div class='add'>+			if (unlikely(btrfs_extent_data_ref_count(leaf, dref) == 0)) {</div><div class='add'>+				extent_err(leaf, slot,</div><div class='add'>+			"invalid data ref count, should have non-zero value");</div><div class='add'>+				return -EUCLEAN;</div><div class='add'>+			}</div><div class='ctx'> 			inline_refs += btrfs_extent_data_ref_count(leaf, dref);</div><div class='ctx'> 			break;</div><div class='ctx'> 		/* Contains parent bytenr and ref count */</div><div class='hunk'>@@ -1398,13 +1557,39 @@ static int check_extent_item(struct extent_buffer *leaf,</div><div class='ctx'> 					   inline_offset, fs_info-&gt;sectorsize);</div><div class='ctx'> 				return -EUCLEAN;</div><div class='ctx'> 			}</div><div class='add'>+			if (unlikely(btrfs_shared_data_ref_count(leaf, sref) == 0)) {</div><div class='add'>+				extent_err(leaf, slot,</div><div class='add'>+			"invalid shared data ref count, should have non-zero value");</div><div class='add'>+				return -EUCLEAN;</div><div class='add'>+			}</div><div class='ctx'> 			inline_refs += btrfs_shared_data_ref_count(leaf, sref);</div><div class='ctx'> 			break;</div><div class='add'>+		case BTRFS_EXTENT_OWNER_REF_KEY:</div><div class='add'>+			WARN_ON(!btrfs_fs_incompat(fs_info, SIMPLE_QUOTA));</div><div class='add'>+			break;</div><div class='ctx'> 		default:</div><div class='ctx'> 			extent_err(leaf, slot, "unknown inline ref type: %u",</div><div class='ctx'> 				   inline_type);</div><div class='ctx'> 			return -EUCLEAN;</div><div class='ctx'> 		}</div><div class='add'>+		if (unlikely(inline_type &lt; last_type)) {</div><div class='add'>+			extent_err(leaf, slot,</div><div class='add'>+				   "inline ref out-of-order: has type %u, prev type %u",</div><div class='add'>+				   inline_type, last_type);</div><div class='add'>+			return -EUCLEAN;</div><div class='add'>+		}</div><div class='add'>+		/* Type changed, allow the sequence starts from U64_MAX again. */</div><div class='add'>+		if (inline_type &gt; last_type)</div><div class='add'>+			last_seq = U64_MAX;</div><div class='add'>+		if (unlikely(seq &gt; last_seq)) {</div><div class='add'>+			extent_err(leaf, slot,</div><div class='add'>+"inline ref out-of-order: has type %u offset %llu seq 0x%llx, prev type %u seq 0x%llx",</div><div class='add'>+				   inline_type, inline_offset, seq,</div><div class='add'>+				   last_type, last_seq);</div><div class='add'>+			return -EUCLEAN;</div><div class='add'>+		}</div><div class='add'>+		last_type = inline_type;</div><div class='add'>+		last_seq = seq;</div><div class='ctx'> 		ptr += btrfs_extent_inline_ref_size(inline_type);</div><div class='ctx'> 	}</div><div class='ctx'> 	/* No padding is allowed */</div><div class='hunk'>@@ -1421,6 +1606,25 @@ static int check_extent_item(struct extent_buffer *leaf,</div><div class='ctx'> 			   total_refs, inline_refs);</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	if ((prev_key-&gt;type == BTRFS_EXTENT_ITEM_KEY) ||</div><div class='add'>+	    (prev_key-&gt;type == BTRFS_METADATA_ITEM_KEY)) {</div><div class='add'>+		u64 prev_end = prev_key-&gt;objectid;</div><div class='add'>+</div><div class='add'>+		if (prev_key-&gt;type == BTRFS_METADATA_ITEM_KEY)</div><div class='add'>+			prev_end += fs_info-&gt;nodesize;</div><div class='add'>+		else</div><div class='add'>+			prev_end += prev_key-&gt;offset;</div><div class='add'>+</div><div class='add'>+		if (unlikely(prev_end &gt; key-&gt;objectid)) {</div><div class='add'>+			extent_err(leaf, slot,</div><div class='add'>+	"previous extent " BTRFS_KEY_FMT " overlaps current extent " BTRFS_KEY_FMT,</div><div class='add'>+				   BTRFS_KEY_FMT_VALUE(prev_key),</div><div class='add'>+				   BTRFS_KEY_FMT_VALUE(key));</div><div class='add'>+			return -EUCLEAN;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1429,13 +1633,23 @@ static int check_simple_keyed_refs(struct extent_buffer *leaf,</div><div class='ctx'> {</div><div class='ctx'> 	u32 expect_item_size = 0;</div><div class='ctx'> </div><div class='del'>-	if (key-&gt;type == BTRFS_SHARED_DATA_REF_KEY)</div><div class='add'>+	if (key-&gt;type == BTRFS_SHARED_DATA_REF_KEY) {</div><div class='add'>+		struct btrfs_shared_data_ref *sref;</div><div class='add'>+</div><div class='add'>+		sref = btrfs_item_ptr(leaf, slot, struct btrfs_shared_data_ref);</div><div class='add'>+		if (unlikely(btrfs_shared_data_ref_count(leaf, sref) == 0)) {</div><div class='add'>+			extent_err(leaf, slot,</div><div class='add'>+		"invalid shared data backref count, should have non-zero value");</div><div class='add'>+			return -EUCLEAN;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		expect_item_size = sizeof(struct btrfs_shared_data_ref);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (unlikely(btrfs_item_size_nr(leaf, slot) != expect_item_size)) {</div><div class='add'>+	if (unlikely(btrfs_item_size(leaf, slot) != expect_item_size)) {</div><div class='ctx'> 		generic_err(leaf, slot,</div><div class='ctx'> 		"invalid item size, have %u expect %u for key type %u",</div><div class='del'>-			    btrfs_item_size_nr(leaf, slot),</div><div class='add'>+			    btrfs_item_size(leaf, slot),</div><div class='ctx'> 			    expect_item_size, key-&gt;type);</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1460,12 +1674,12 @@ static int check_extent_data_ref(struct extent_buffer *leaf,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_extent_data_ref *dref;</div><div class='ctx'> 	unsigned long ptr = btrfs_item_ptr_offset(leaf, slot);</div><div class='del'>-	const unsigned long end = ptr + btrfs_item_size_nr(leaf, slot);</div><div class='add'>+	const unsigned long end = ptr + btrfs_item_size(leaf, slot);</div><div class='ctx'> </div><div class='del'>-	if (unlikely(btrfs_item_size_nr(leaf, slot) % sizeof(*dref) != 0)) {</div><div class='add'>+	if (unlikely(btrfs_item_size(leaf, slot) % sizeof(*dref) != 0)) {</div><div class='ctx'> 		generic_err(leaf, slot,</div><div class='ctx'> 	"invalid item size, have %u expect aligned to %zu for key type %u",</div><div class='del'>-			    btrfs_item_size_nr(leaf, slot),</div><div class='add'>+			    btrfs_item_size(leaf, slot),</div><div class='ctx'> 			    sizeof(*dref), key-&gt;type);</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1476,6 +1690,8 @@ static int check_extent_data_ref(struct extent_buffer *leaf,</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='ctx'> 	for (; ptr &lt; end; ptr += sizeof(*dref)) {</div><div class='add'>+		u64 root;</div><div class='add'>+		u64 objectid;</div><div class='ctx'> 		u64 offset;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='hunk'>@@ -1483,13 +1699,33 @@ static int check_extent_data_ref(struct extent_buffer *leaf,</div><div class='ctx'> 		 * overflow from the leaf due to hash collisions.</div><div class='ctx'> 		 */</div><div class='ctx'> 		dref = (struct btrfs_extent_data_ref *)ptr;</div><div class='add'>+		root = btrfs_extent_data_ref_root(leaf, dref);</div><div class='add'>+		objectid = btrfs_extent_data_ref_objectid(leaf, dref);</div><div class='ctx'> 		offset = btrfs_extent_data_ref_offset(leaf, dref);</div><div class='add'>+		if (unlikely(!is_valid_dref_root(root))) {</div><div class='add'>+			extent_err(leaf, slot,</div><div class='add'>+				   "invalid extent data backref root value %llu",</div><div class='add'>+				   root);</div><div class='add'>+			return -EUCLEAN;</div><div class='add'>+		}</div><div class='add'>+		if (unlikely(objectid &lt; BTRFS_FIRST_FREE_OBJECTID ||</div><div class='add'>+			     objectid &gt; BTRFS_LAST_FREE_OBJECTID)) {</div><div class='add'>+			extent_err(leaf, slot,</div><div class='add'>+				   "invalid extent data backref objectid value %llu",</div><div class='add'>+				   root);</div><div class='add'>+			return -EUCLEAN;</div><div class='add'>+		}</div><div class='ctx'> 		if (unlikely(!IS_ALIGNED(offset, leaf-&gt;fs_info-&gt;sectorsize))) {</div><div class='ctx'> 			extent_err(leaf, slot,</div><div class='ctx'> 	"invalid extent data backref offset, have %llu expect aligned to %u",</div><div class='ctx'> 				   offset, leaf-&gt;fs_info-&gt;sectorsize);</div><div class='ctx'> 			return -EUCLEAN;</div><div class='ctx'> 		}</div><div class='add'>+		if (unlikely(btrfs_extent_data_ref_count(leaf, dref) == 0)) {</div><div class='add'>+			extent_err(leaf, slot,</div><div class='add'>+	"invalid extent data backref count, should have non-zero value");</div><div class='add'>+			return -EUCLEAN;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -1507,23 +1743,23 @@ static int check_inode_ref(struct extent_buffer *leaf,</div><div class='ctx'> 	if (unlikely(!check_prev_ino(leaf, key, slot, prev_key)))</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> 	/* namelen can't be 0, so item_size == sizeof() is also invalid */</div><div class='del'>-	if (unlikely(btrfs_item_size_nr(leaf, slot) &lt;= sizeof(*iref))) {</div><div class='add'>+	if (unlikely(btrfs_item_size(leaf, slot) &lt;= sizeof(*iref))) {</div><div class='ctx'> 		inode_ref_err(leaf, slot,</div><div class='ctx'> 			"invalid item size, have %u expect (%zu, %u)",</div><div class='del'>-			btrfs_item_size_nr(leaf, slot),</div><div class='add'>+			btrfs_item_size(leaf, slot),</div><div class='ctx'> 			sizeof(*iref), BTRFS_LEAF_DATA_SIZE(leaf-&gt;fs_info));</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ptr = btrfs_item_ptr_offset(leaf, slot);</div><div class='del'>-	end = ptr + btrfs_item_size_nr(leaf, slot);</div><div class='add'>+	end = ptr + btrfs_item_size(leaf, slot);</div><div class='ctx'> 	while (ptr &lt; end) {</div><div class='ctx'> 		u16 namelen;</div><div class='ctx'> </div><div class='del'>-		if (unlikely(ptr + sizeof(iref) &gt; end)) {</div><div class='add'>+		if (unlikely(ptr + sizeof(*iref) &gt; end)) {</div><div class='ctx'> 			inode_ref_err(leaf, slot,</div><div class='ctx'> 			"inode ref overflow, ptr %lu end %lu inode_ref_size %zu",</div><div class='del'>-				ptr, end, sizeof(iref));</div><div class='add'>+				ptr, end, sizeof(*iref));</div><div class='ctx'> 			return -EUCLEAN;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -1546,12 +1782,131 @@ static int check_inode_ref(struct extent_buffer *leaf,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int check_inode_extref(struct extent_buffer *leaf,</div><div class='add'>+			      struct btrfs_key *key, struct btrfs_key *prev_key,</div><div class='add'>+			      int slot)</div><div class='add'>+{</div><div class='add'>+	unsigned long ptr = btrfs_item_ptr_offset(leaf, slot);</div><div class='add'>+	unsigned long end = ptr + btrfs_item_size(leaf, slot);</div><div class='add'>+</div><div class='add'>+	if (unlikely(!check_prev_ino(leaf, key, slot, prev_key)))</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+</div><div class='add'>+	while (ptr &lt; end) {</div><div class='add'>+		struct btrfs_inode_extref *extref = (struct btrfs_inode_extref *)ptr;</div><div class='add'>+		u16 namelen;</div><div class='add'>+</div><div class='add'>+		if (unlikely(ptr + sizeof(*extref) &gt; end)) {</div><div class='add'>+			inode_ref_err(leaf, slot,</div><div class='add'>+			"inode extref overflow, ptr %lu end %lu inode_extref size %zu",</div><div class='add'>+				      ptr, end, sizeof(*extref));</div><div class='add'>+			return -EUCLEAN;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		namelen = btrfs_inode_extref_name_len(leaf, extref);</div><div class='add'>+		if (unlikely(ptr + sizeof(*extref) + namelen &gt; end)) {</div><div class='add'>+			inode_ref_err(leaf, slot,</div><div class='add'>+				"inode extref overflow, ptr %lu end %lu namelen %u",</div><div class='add'>+				ptr, end, namelen);</div><div class='add'>+			return -EUCLEAN;</div><div class='add'>+		}</div><div class='add'>+		ptr += sizeof(*extref) + namelen;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int check_raid_stripe_extent(const struct extent_buffer *leaf,</div><div class='add'>+				    const struct btrfs_key *key, int slot)</div><div class='add'>+{</div><div class='add'>+	if (unlikely(!IS_ALIGNED(key-&gt;objectid, leaf-&gt;fs_info-&gt;sectorsize))) {</div><div class='add'>+		generic_err(leaf, slot,</div><div class='add'>+"invalid key objectid for raid stripe extent, have %llu expect aligned to %u",</div><div class='add'>+			    key-&gt;objectid, leaf-&gt;fs_info-&gt;sectorsize);</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (unlikely(!btrfs_fs_incompat(leaf-&gt;fs_info, RAID_STRIPE_TREE))) {</div><div class='add'>+		generic_err(leaf, slot,</div><div class='add'>+	"RAID_STRIPE_EXTENT present but RAID_STRIPE_TREE incompat bit unset");</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int check_dev_extent_item(const struct extent_buffer *leaf,</div><div class='add'>+				 const struct btrfs_key *key,</div><div class='add'>+				 int slot,</div><div class='add'>+				 struct btrfs_key *prev_key)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_dev_extent *de;</div><div class='add'>+	const u32 sectorsize = leaf-&gt;fs_info-&gt;sectorsize;</div><div class='add'>+</div><div class='add'>+	de = btrfs_item_ptr(leaf, slot, struct btrfs_dev_extent);</div><div class='add'>+	/* Basic fixed member checks. */</div><div class='add'>+	if (unlikely(btrfs_dev_extent_chunk_tree(leaf, de) !=</div><div class='add'>+		     BTRFS_CHUNK_TREE_OBJECTID)) {</div><div class='add'>+		generic_err(leaf, slot,</div><div class='add'>+			    "invalid dev extent chunk tree id, has %llu expect %llu",</div><div class='add'>+			    btrfs_dev_extent_chunk_tree(leaf, de),</div><div class='add'>+			    BTRFS_CHUNK_TREE_OBJECTID);</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='add'>+	if (unlikely(btrfs_dev_extent_chunk_objectid(leaf, de) !=</div><div class='add'>+		     BTRFS_FIRST_CHUNK_TREE_OBJECTID)) {</div><div class='add'>+		generic_err(leaf, slot,</div><div class='add'>+			    "invalid dev extent chunk objectid, has %llu expect %llu",</div><div class='add'>+			    btrfs_dev_extent_chunk_objectid(leaf, de),</div><div class='add'>+			    BTRFS_FIRST_CHUNK_TREE_OBJECTID);</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='add'>+	/* Alignment check. */</div><div class='add'>+	if (unlikely(!IS_ALIGNED(key-&gt;offset, sectorsize))) {</div><div class='add'>+		generic_err(leaf, slot,</div><div class='add'>+			    "invalid dev extent key.offset, has %llu not aligned to %u",</div><div class='add'>+			    key-&gt;offset, sectorsize);</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='add'>+	if (unlikely(!IS_ALIGNED(btrfs_dev_extent_chunk_offset(leaf, de),</div><div class='add'>+				 sectorsize))) {</div><div class='add'>+		generic_err(leaf, slot,</div><div class='add'>+			    "invalid dev extent chunk offset, has %llu not aligned to %u",</div><div class='add'>+			    btrfs_dev_extent_chunk_objectid(leaf, de),</div><div class='add'>+			    sectorsize);</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='add'>+	if (unlikely(!IS_ALIGNED(btrfs_dev_extent_length(leaf, de),</div><div class='add'>+				 sectorsize))) {</div><div class='add'>+		generic_err(leaf, slot,</div><div class='add'>+			    "invalid dev extent length, has %llu not aligned to %u",</div><div class='add'>+			    btrfs_dev_extent_length(leaf, de), sectorsize);</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='add'>+	/* Overlap check with previous dev extent. */</div><div class='add'>+	if (slot &amp;&amp; prev_key-&gt;objectid == key-&gt;objectid &amp;&amp;</div><div class='add'>+	    prev_key-&gt;type == key-&gt;type) {</div><div class='add'>+		struct btrfs_dev_extent *prev_de;</div><div class='add'>+		u64 prev_len;</div><div class='add'>+</div><div class='add'>+		prev_de = btrfs_item_ptr(leaf, slot - 1, struct btrfs_dev_extent);</div><div class='add'>+		prev_len = btrfs_dev_extent_length(leaf, prev_de);</div><div class='add'>+		if (unlikely(prev_key-&gt;offset + prev_len &gt; key-&gt;offset)) {</div><div class='add'>+			generic_err(leaf, slot,</div><div class='add'>+		"dev extent overlap, prev offset %llu len %llu current offset %llu",</div><div class='add'>+				    prev_key-&gt;objectid, prev_len, key-&gt;offset);</div><div class='add'>+			return -EUCLEAN;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Common point to switch the item-specific validation.</div><div class='ctx'>  */</div><div class='del'>-static int check_leaf_item(struct extent_buffer *leaf,</div><div class='del'>-			   struct btrfs_key *key, int slot,</div><div class='del'>-			   struct btrfs_key *prev_key)</div><div class='add'>+static enum btrfs_tree_block_status check_leaf_item(struct extent_buffer *leaf,</div><div class='add'>+						    struct btrfs_key *key,</div><div class='add'>+						    int slot,</div><div class='add'>+						    struct btrfs_key *prev_key)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	struct btrfs_chunk *chunk;</div><div class='hunk'>@@ -1571,6 +1926,9 @@ static int check_leaf_item(struct extent_buffer *leaf,</div><div class='ctx'> 	case BTRFS_INODE_REF_KEY:</div><div class='ctx'> 		ret = check_inode_ref(leaf, key, prev_key, slot);</div><div class='ctx'> 		break;</div><div class='add'>+	case BTRFS_INODE_EXTREF_KEY:</div><div class='add'>+		ret = check_inode_extref(leaf, key, prev_key, slot);</div><div class='add'>+		break;</div><div class='ctx'> 	case BTRFS_BLOCK_GROUP_ITEM_KEY:</div><div class='ctx'> 		ret = check_block_group_item(leaf, key, slot);</div><div class='ctx'> 		break;</div><div class='hunk'>@@ -1581,6 +1939,9 @@ static int check_leaf_item(struct extent_buffer *leaf,</div><div class='ctx'> 	case BTRFS_DEV_ITEM_KEY:</div><div class='ctx'> 		ret = check_dev_item(leaf, key, slot);</div><div class='ctx'> 		break;</div><div class='add'>+	case BTRFS_DEV_EXTENT_KEY:</div><div class='add'>+		ret = check_dev_extent_item(leaf, key, slot, prev_key);</div><div class='add'>+		break;</div><div class='ctx'> 	case BTRFS_INODE_ITEM_KEY:</div><div class='ctx'> 		ret = check_inode_item(leaf, key, slot);</div><div class='ctx'> 		break;</div><div class='hunk'>@@ -1589,7 +1950,7 @@ static int check_leaf_item(struct extent_buffer *leaf,</div><div class='ctx'> 		break;</div><div class='ctx'> 	case BTRFS_EXTENT_ITEM_KEY:</div><div class='ctx'> 	case BTRFS_METADATA_ITEM_KEY:</div><div class='del'>-		ret = check_extent_item(leaf, key, slot);</div><div class='add'>+		ret = check_extent_item(leaf, key, slot, prev_key);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case BTRFS_TREE_BLOCK_REF_KEY:</div><div class='ctx'> 	case BTRFS_SHARED_DATA_REF_KEY:</div><div class='hunk'>@@ -1599,11 +1960,17 @@ static int check_leaf_item(struct extent_buffer *leaf,</div><div class='ctx'> 	case BTRFS_EXTENT_DATA_REF_KEY:</div><div class='ctx'> 		ret = check_extent_data_ref(leaf, key, slot);</div><div class='ctx'> 		break;</div><div class='add'>+	case BTRFS_RAID_STRIPE_KEY:</div><div class='add'>+		ret = check_raid_stripe_extent(leaf, key, slot);</div><div class='add'>+		break;</div><div class='ctx'> 	}</div><div class='del'>-	return ret;</div><div class='add'>+</div><div class='add'>+	if (unlikely(ret))</div><div class='add'>+		return BTRFS_TREE_BLOCK_INVALID_ITEM;</div><div class='add'>+	return BTRFS_TREE_BLOCK_CLEAN;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int check_leaf(struct extent_buffer *leaf, bool check_item_data)</div><div class='add'>+enum btrfs_tree_block_status __btrfs_check_leaf(struct extent_buffer *leaf)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = leaf-&gt;fs_info;</div><div class='ctx'> 	/* No valid key type is 0, so all key should be larger than this key */</div><div class='hunk'>@@ -1616,7 +1983,12 @@ static int check_leaf(struct extent_buffer *leaf, bool check_item_data)</div><div class='ctx'> 		generic_err(leaf, 0,</div><div class='ctx'> 			"invalid level for leaf, have %d expect 0",</div><div class='ctx'> 			btrfs_header_level(leaf));</div><div class='del'>-		return -EUCLEAN;</div><div class='add'>+		return BTRFS_TREE_BLOCK_INVALID_LEVEL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (unlikely(!btrfs_header_flag(leaf, BTRFS_HEADER_FLAG_WRITTEN))) {</div><div class='add'>+		generic_err(leaf, 0, "invalid flag for leaf, WRITTEN not set");</div><div class='add'>+		return BTRFS_TREE_BLOCK_WRITTEN_NOT_SET;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1633,26 +2005,38 @@ static int check_leaf(struct extent_buffer *leaf, bool check_item_data)</div><div class='ctx'> 		/* These trees must never be empty */</div><div class='ctx'> 		if (unlikely(owner == BTRFS_ROOT_TREE_OBJECTID ||</div><div class='ctx'> 			     owner == BTRFS_CHUNK_TREE_OBJECTID ||</div><div class='del'>-			     owner == BTRFS_EXTENT_TREE_OBJECTID ||</div><div class='ctx'> 			     owner == BTRFS_DEV_TREE_OBJECTID ||</div><div class='ctx'> 			     owner == BTRFS_FS_TREE_OBJECTID ||</div><div class='ctx'> 			     owner == BTRFS_DATA_RELOC_TREE_OBJECTID)) {</div><div class='ctx'> 			generic_err(leaf, 0,</div><div class='ctx'> 			"invalid root, root %llu must never be empty",</div><div class='ctx'> 				    owner);</div><div class='del'>-			return -EUCLEAN;</div><div class='add'>+			return BTRFS_TREE_BLOCK_INVALID_NRITEMS;</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='ctx'> 		/* Unknown tree */</div><div class='ctx'> 		if (unlikely(owner == 0)) {</div><div class='ctx'> 			generic_err(leaf, 0,</div><div class='ctx'> 				"invalid owner, root 0 is not defined");</div><div class='del'>-			return -EUCLEAN;</div><div class='add'>+			return BTRFS_TREE_BLOCK_INVALID_OWNER;</div><div class='ctx'> 		}</div><div class='del'>-		return 0;</div><div class='add'>+</div><div class='add'>+		/* EXTENT_TREE_V2 can have empty extent trees. */</div><div class='add'>+		if (btrfs_fs_incompat(fs_info, EXTENT_TREE_V2))</div><div class='add'>+			return BTRFS_TREE_BLOCK_CLEAN;</div><div class='add'>+</div><div class='add'>+		if (unlikely(owner == BTRFS_EXTENT_TREE_OBJECTID)) {</div><div class='add'>+			generic_err(leaf, 0,</div><div class='add'>+			"invalid root, root %llu must never be empty",</div><div class='add'>+				    owner);</div><div class='add'>+			return BTRFS_TREE_BLOCK_INVALID_NRITEMS;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		return BTRFS_TREE_BLOCK_CLEAN;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(nritems == 0))</div><div class='del'>-		return 0;</div><div class='add'>+		return BTRFS_TREE_BLOCK_CLEAN;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Check the following things to make sure this is a good leaf, and</div><div class='hunk'>@@ -1667,20 +2051,22 @@ static int check_leaf(struct extent_buffer *leaf, bool check_item_data)</div><div class='ctx'> 	 */</div><div class='ctx'> 	for (slot = 0; slot &lt; nritems; slot++) {</div><div class='ctx'> 		u32 item_end_expected;</div><div class='del'>-		int ret;</div><div class='add'>+		u64 item_data_end;</div><div class='add'>+		enum btrfs_tree_block_status ret;</div><div class='ctx'> </div><div class='ctx'> 		btrfs_item_key_to_cpu(leaf, &amp;key, slot);</div><div class='ctx'> </div><div class='ctx'> 		/* Make sure the keys are in the right order */</div><div class='ctx'> 		if (unlikely(btrfs_comp_cpu_keys(&amp;prev_key, &amp;key) &gt;= 0)) {</div><div class='ctx'> 			generic_err(leaf, slot,</div><div class='del'>-	"bad key order, prev (%llu %u %llu) current (%llu %u %llu)",</div><div class='del'>-				prev_key.objectid, prev_key.type,</div><div class='del'>-				prev_key.offset, key.objectid, key.type,</div><div class='del'>-				key.offset);</div><div class='del'>-			return -EUCLEAN;</div><div class='add'>+	"bad key order, prev " BTRFS_KEY_FMT " current " BTRFS_KEY_FMT,</div><div class='add'>+				    BTRFS_KEY_FMT_VALUE(&amp;prev_key),</div><div class='add'>+				    BTRFS_KEY_FMT_VALUE(&amp;key));</div><div class='add'>+			return BTRFS_TREE_BLOCK_BAD_KEY_ORDER;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		item_data_end = (u64)btrfs_item_offset(leaf, slot) +</div><div class='add'>+				btrfs_item_size(leaf, slot);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Make sure the offset and ends are right, remember that the</div><div class='ctx'> 		 * item data starts at the end of the leaf and grows towards the</div><div class='hunk'>@@ -1689,14 +2075,13 @@ static int check_leaf(struct extent_buffer *leaf, bool check_item_data)</div><div class='ctx'> 		if (slot == 0)</div><div class='ctx'> 			item_end_expected = BTRFS_LEAF_DATA_SIZE(fs_info);</div><div class='ctx'> 		else</div><div class='del'>-			item_end_expected = btrfs_item_offset_nr(leaf,</div><div class='add'>+			item_end_expected = btrfs_item_offset(leaf,</div><div class='ctx'> 								 slot - 1);</div><div class='del'>-		if (unlikely(btrfs_item_end_nr(leaf, slot) != item_end_expected)) {</div><div class='add'>+		if (unlikely(item_data_end != item_end_expected)) {</div><div class='ctx'> 			generic_err(leaf, slot,</div><div class='del'>-				"unexpected item end, have %u expect %u",</div><div class='del'>-				btrfs_item_end_nr(leaf, slot),</div><div class='del'>-				item_end_expected);</div><div class='del'>-			return -EUCLEAN;</div><div class='add'>+				"unexpected item end, have %llu expect %u",</div><div class='add'>+				item_data_end, item_end_expected);</div><div class='add'>+			return BTRFS_TREE_BLOCK_INVALID_OFFSETS;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='hunk'>@@ -1704,56 +2089,49 @@ static int check_leaf(struct extent_buffer *leaf, bool check_item_data)</div><div class='ctx'> 		 * just in case all the items are consistent to each other, but</div><div class='ctx'> 		 * all point outside of the leaf.</div><div class='ctx'> 		 */</div><div class='del'>-		if (unlikely(btrfs_item_end_nr(leaf, slot) &gt;</div><div class='del'>-			     BTRFS_LEAF_DATA_SIZE(fs_info))) {</div><div class='add'>+		if (unlikely(item_data_end &gt; BTRFS_LEAF_DATA_SIZE(fs_info))) {</div><div class='ctx'> 			generic_err(leaf, slot,</div><div class='del'>-			"slot end outside of leaf, have %u expect range [0, %u]",</div><div class='del'>-				btrfs_item_end_nr(leaf, slot),</div><div class='del'>-				BTRFS_LEAF_DATA_SIZE(fs_info));</div><div class='del'>-			return -EUCLEAN;</div><div class='add'>+			"slot end outside of leaf, have %llu expect range [0, %u]",</div><div class='add'>+				item_data_end, BTRFS_LEAF_DATA_SIZE(fs_info));</div><div class='add'>+			return BTRFS_TREE_BLOCK_INVALID_OFFSETS;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* Also check if the item pointer overlaps with btrfs item. */</div><div class='ctx'> 		if (unlikely(btrfs_item_ptr_offset(leaf, slot) &lt;</div><div class='del'>-			     btrfs_item_nr_offset(slot) + sizeof(struct btrfs_item))) {</div><div class='add'>+			     btrfs_item_nr_offset(leaf, slot) + sizeof(struct btrfs_item))) {</div><div class='ctx'> 			generic_err(leaf, slot,</div><div class='ctx'> 		"slot overlaps with its data, item end %lu data start %lu",</div><div class='del'>-				btrfs_item_nr_offset(slot) +</div><div class='add'>+				btrfs_item_nr_offset(leaf, slot) +</div><div class='ctx'> 				sizeof(struct btrfs_item),</div><div class='ctx'> 				btrfs_item_ptr_offset(leaf, slot));</div><div class='del'>-			return -EUCLEAN;</div><div class='add'>+			return BTRFS_TREE_BLOCK_INVALID_OFFSETS;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (check_item_data) {</div><div class='del'>-			/*</div><div class='del'>-			 * Check if the item size and content meet other</div><div class='del'>-			 * criteria</div><div class='del'>-			 */</div><div class='del'>-			ret = check_leaf_item(leaf, &amp;key, slot, &amp;prev_key);</div><div class='del'>-			if (unlikely(ret &lt; 0))</div><div class='del'>-				return ret;</div><div class='del'>-		}</div><div class='add'>+		/* Check if the item size and content meet other criteria. */</div><div class='add'>+		ret = check_leaf_item(leaf, &amp;key, slot, &amp;prev_key);</div><div class='add'>+		if (unlikely(ret != BTRFS_TREE_BLOCK_CLEAN))</div><div class='add'>+			return ret;</div><div class='ctx'> </div><div class='ctx'> 		prev_key.objectid = key.objectid;</div><div class='ctx'> 		prev_key.type = key.type;</div><div class='ctx'> 		prev_key.offset = key.offset;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+	return BTRFS_TREE_BLOCK_CLEAN;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_check_leaf_full(struct extent_buffer *leaf)</div><div class='add'>+int btrfs_check_leaf(struct extent_buffer *leaf)</div><div class='ctx'> {</div><div class='del'>-	return check_leaf(leaf, true);</div><div class='del'>-}</div><div class='del'>-ALLOW_ERROR_INJECTION(btrfs_check_leaf_full, ERRNO);</div><div class='add'>+	enum btrfs_tree_block_status ret;</div><div class='ctx'> </div><div class='del'>-int btrfs_check_leaf_relaxed(struct extent_buffer *leaf)</div><div class='del'>-{</div><div class='del'>-	return check_leaf(leaf, false);</div><div class='add'>+	ret = __btrfs_check_leaf(leaf);</div><div class='add'>+	if (unlikely(ret != BTRFS_TREE_BLOCK_CLEAN))</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='add'>+ALLOW_ERROR_INJECTION(btrfs_check_leaf, ERRNO);</div><div class='ctx'> </div><div class='del'>-int btrfs_check_node(struct extent_buffer *node)</div><div class='add'>+enum btrfs_tree_block_status __btrfs_check_node(struct extent_buffer *node)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = node-&gt;fs_info;</div><div class='ctx'> 	unsigned long nr = btrfs_header_nritems(node);</div><div class='hunk'>@@ -1761,13 +2139,17 @@ int btrfs_check_node(struct extent_buffer *node)</div><div class='ctx'> 	int slot;</div><div class='ctx'> 	int level = btrfs_header_level(node);</div><div class='ctx'> 	u64 bytenr;</div><div class='del'>-	int ret = 0;</div><div class='add'>+</div><div class='add'>+	if (unlikely(!btrfs_header_flag(node, BTRFS_HEADER_FLAG_WRITTEN))) {</div><div class='add'>+		generic_err(node, 0, "invalid flag for node, WRITTEN not set");</div><div class='add'>+		return BTRFS_TREE_BLOCK_WRITTEN_NOT_SET;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(level &lt;= 0 || level &gt;= BTRFS_MAX_LEVEL)) {</div><div class='ctx'> 		generic_err(node, 0,</div><div class='ctx'> 			"invalid level for node, have %d expect [1, %d]",</div><div class='ctx'> 			level, BTRFS_MAX_LEVEL - 1);</div><div class='del'>-		return -EUCLEAN;</div><div class='add'>+		return BTRFS_TREE_BLOCK_INVALID_LEVEL;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (unlikely(nr == 0 || nr &gt; BTRFS_NODEPTRS_PER_BLOCK(fs_info))) {</div><div class='ctx'> 		btrfs_crit(fs_info,</div><div class='hunk'>@@ -1775,7 +2157,7 @@ int btrfs_check_node(struct extent_buffer *node)</div><div class='ctx'> 			   btrfs_header_owner(node), node-&gt;start,</div><div class='ctx'> 			   nr == 0 ? "small" : "large", nr,</div><div class='ctx'> 			   BTRFS_NODEPTRS_PER_BLOCK(fs_info));</div><div class='del'>-		return -EUCLEAN;</div><div class='add'>+		return BTRFS_TREE_BLOCK_INVALID_NRITEMS;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	for (slot = 0; slot &lt; nr - 1; slot++) {</div><div class='hunk'>@@ -1786,28 +2168,144 @@ int btrfs_check_node(struct extent_buffer *node)</div><div class='ctx'> 		if (unlikely(!bytenr)) {</div><div class='ctx'> 			generic_err(node, slot,</div><div class='ctx'> 				"invalid NULL node pointer");</div><div class='del'>-			ret = -EUCLEAN;</div><div class='del'>-			goto out;</div><div class='add'>+			return BTRFS_TREE_BLOCK_INVALID_BLOCKPTR;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (unlikely(!IS_ALIGNED(bytenr, fs_info-&gt;sectorsize))) {</div><div class='ctx'> 			generic_err(node, slot,</div><div class='ctx'> 			"unaligned pointer, have %llu should be aligned to %u",</div><div class='ctx'> 				bytenr, fs_info-&gt;sectorsize);</div><div class='del'>-			ret = -EUCLEAN;</div><div class='del'>-			goto out;</div><div class='add'>+			return BTRFS_TREE_BLOCK_INVALID_BLOCKPTR;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (unlikely(btrfs_comp_cpu_keys(&amp;key, &amp;next_key) &gt;= 0)) {</div><div class='ctx'> 			generic_err(node, slot,</div><div class='del'>-	"bad key order, current (%llu %u %llu) next (%llu %u %llu)",</div><div class='del'>-				key.objectid, key.type, key.offset,</div><div class='del'>-				next_key.objectid, next_key.type,</div><div class='del'>-				next_key.offset);</div><div class='del'>-			ret = -EUCLEAN;</div><div class='del'>-			goto out;</div><div class='add'>+	"bad key order, current " BTRFS_KEY_FMT " next " BTRFS_KEY_FMT,</div><div class='add'>+				    BTRFS_KEY_FMT_VALUE(&amp;key),</div><div class='add'>+				    BTRFS_KEY_FMT_VALUE(&amp;next_key));</div><div class='add'>+			return BTRFS_TREE_BLOCK_BAD_KEY_ORDER;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-out:</div><div class='del'>-	return ret;</div><div class='add'>+	return BTRFS_TREE_BLOCK_CLEAN;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_check_node(struct extent_buffer *node)</div><div class='add'>+{</div><div class='add'>+	enum btrfs_tree_block_status ret;</div><div class='add'>+</div><div class='add'>+	ret = __btrfs_check_node(node);</div><div class='add'>+	if (unlikely(ret != BTRFS_TREE_BLOCK_CLEAN))</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> ALLOW_ERROR_INJECTION(btrfs_check_node, ERRNO);</div><div class='add'>+</div><div class='add'>+int btrfs_check_eb_owner(const struct extent_buffer *eb, u64 root_owner)</div><div class='add'>+{</div><div class='add'>+	const bool is_subvol = btrfs_is_fstree(root_owner);</div><div class='add'>+	const u64 eb_owner = btrfs_header_owner(eb);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Skip dummy fs, as selftests don't create unique ebs for each dummy</div><div class='add'>+	 * root.</div><div class='add'>+	 */</div><div class='add'>+	if (btrfs_is_testing(eb-&gt;fs_info))</div><div class='add'>+		return 0;</div><div class='add'>+	/*</div><div class='add'>+	 * There are several call sites (backref walking, qgroup, and data</div><div class='add'>+	 * reloc) passing 0 as @root_owner, as they are not holding the</div><div class='add'>+	 * tree root.  In that case, we can not do a reliable ownership check,</div><div class='add'>+	 * so just exit.</div><div class='add'>+	 */</div><div class='add'>+	if (root_owner == 0)</div><div class='add'>+		return 0;</div><div class='add'>+	/*</div><div class='add'>+	 * These trees use key.offset as their owner, our callers don't have</div><div class='add'>+	 * the extra capacity to pass key.offset here.  So we just skip them.</div><div class='add'>+	 */</div><div class='add'>+	if (root_owner == BTRFS_TREE_LOG_OBJECTID ||</div><div class='add'>+	    root_owner == BTRFS_TREE_RELOC_OBJECTID)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if (!is_subvol) {</div><div class='add'>+		/* For non-subvolume trees, the eb owner should match root owner */</div><div class='add'>+		if (unlikely(root_owner != eb_owner)) {</div><div class='add'>+			btrfs_crit(eb-&gt;fs_info,</div><div class='add'>+"corrupted %s, root=%llu block=%llu owner mismatch, have %llu expect %llu",</div><div class='add'>+				btrfs_header_level(eb) == 0 ? "leaf" : "node",</div><div class='add'>+				root_owner, btrfs_header_bytenr(eb), eb_owner,</div><div class='add'>+				root_owner);</div><div class='add'>+			return -EUCLEAN;</div><div class='add'>+		}</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * For subvolume trees, owners can mismatch, but they should all belong</div><div class='add'>+	 * to subvolume trees.</div><div class='add'>+	 */</div><div class='add'>+	if (unlikely(is_subvol != btrfs_is_fstree(eb_owner))) {</div><div class='add'>+		btrfs_crit(eb-&gt;fs_info,</div><div class='add'>+"corrupted %s, root=%llu block=%llu owner mismatch, have %llu expect [%llu, %llu]",</div><div class='add'>+			btrfs_header_level(eb) == 0 ? "leaf" : "node",</div><div class='add'>+			root_owner, btrfs_header_bytenr(eb), eb_owner,</div><div class='add'>+			BTRFS_FIRST_FREE_OBJECTID, BTRFS_LAST_FREE_OBJECTID);</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_verify_level_key(struct extent_buffer *eb,</div><div class='add'>+			   const struct btrfs_tree_parent_check *check)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='add'>+	int found_level;</div><div class='add'>+	struct btrfs_key found_key;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	found_level = btrfs_header_level(eb);</div><div class='add'>+	if (unlikely(found_level != check-&gt;level)) {</div><div class='add'>+		DEBUG_WARN();</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+"tree level mismatch detected, bytenr=%llu level expected=%u has=%u",</div><div class='add'>+			  eb-&gt;start, check-&gt;level, found_level);</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!check-&gt;has_first_key)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * For live tree block (new tree blocks in current transaction),</div><div class='add'>+	 * we need proper lock context to avoid race, which is impossible here.</div><div class='add'>+	 * So we only checks tree blocks which is read from disk, whose</div><div class='add'>+	 * generation &lt;= fs_info-&gt;last_trans_committed.</div><div class='add'>+	 */</div><div class='add'>+	if (btrfs_header_generation(eb) &gt; btrfs_get_last_trans_committed(fs_info))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/* We have @first_key, so this @eb must have at least one item */</div><div class='add'>+	if (unlikely(btrfs_header_nritems(eb) == 0)) {</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+		"invalid tree nritems, bytenr=%llu nritems=0 expect &gt;0",</div><div class='add'>+			  eb-&gt;start);</div><div class='add'>+		DEBUG_WARN();</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (found_level)</div><div class='add'>+		btrfs_node_key_to_cpu(eb, &amp;found_key, 0);</div><div class='add'>+	else</div><div class='add'>+		btrfs_item_key_to_cpu(eb, &amp;found_key, 0);</div><div class='add'>+</div><div class='add'>+	ret = btrfs_comp_cpu_keys(&amp;check-&gt;first_key, &amp;found_key);</div><div class='add'>+	if (unlikely(ret)) {</div><div class='add'>+		DEBUG_WARN();</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+"tree first key mismatch detected, bytenr=%llu parent_transid=%llu key expected=(%llu,%u,%llu) has=(%llu,%u,%llu)",</div><div class='add'>+			  eb-&gt;start, check-&gt;transid, check-&gt;first_key.objectid,</div><div class='add'>+			  check-&gt;first_key.type, check-&gt;first_key.offset,</div><div class='add'>+			  found_key.objectid, found_key.type,</div><div class='add'>+			  found_key.offset);</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/btrfs/tree-checker.h b/fs/btrfs/tree-checker.h<br/>index 32fecc9dc1dd..eb201f4ec3c7 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tree-checker.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tree-checker.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tree-checker.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/tree-checker.h</a></div><div class='hunk'>@@ -6,24 +6,73 @@</div><div class='ctx'> #ifndef BTRFS_TREE_CHECKER_H</div><div class='ctx'> #define BTRFS_TREE_CHECKER_H</div><div class='ctx'> </div><div class='del'>-#include "ctree.h"</div><div class='del'>-#include "extent_io.h"</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+#include &lt;uapi/linux/btrfs_tree.h&gt;</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Comprehensive leaf checker.</div><div class='del'>- * Will check not only the item pointers, but also every possible member</div><div class='del'>- * in item data.</div><div class='del'>- */</div><div class='del'>-int btrfs_check_leaf_full(struct extent_buffer *leaf);</div><div class='add'>+struct extent_buffer;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+struct btrfs_chunk;</div><div class='add'>+struct btrfs_key;</div><div class='add'>+</div><div class='add'>+/* All the extra info needed to verify the parentness of a tree block. */</div><div class='add'>+struct btrfs_tree_parent_check {</div><div class='add'>+	/*</div><div class='add'>+	 * The owner check against the tree block.</div><div class='add'>+	 *</div><div class='add'>+	 * Can be 0 to skip the owner check.</div><div class='add'>+	 */</div><div class='add'>+	u64 owner_root;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Expected transid, can be 0 to skip the check, but such skip</div><div class='add'>+	 * should only be utilized for backref walk related code.</div><div class='add'>+	 */</div><div class='add'>+	u64 transid;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The expected first key.</div><div class='add'>+	 *</div><div class='add'>+	 * This check can be skipped if @has_first_key is false, such skip</div><div class='add'>+	 * can happen for case where we don't have the parent node key,</div><div class='add'>+	 * e.g. reading the tree root, doing backref walk.</div><div class='add'>+	 */</div><div class='add'>+	struct btrfs_key first_key;</div><div class='add'>+	bool has_first_key;</div><div class='add'>+</div><div class='add'>+	/* The expected level. Should always be set. */</div><div class='add'>+	u8 level;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+enum btrfs_tree_block_status {</div><div class='add'>+	BTRFS_TREE_BLOCK_CLEAN,</div><div class='add'>+	BTRFS_TREE_BLOCK_INVALID_NRITEMS,</div><div class='add'>+	BTRFS_TREE_BLOCK_INVALID_PARENT_KEY,</div><div class='add'>+	BTRFS_TREE_BLOCK_BAD_KEY_ORDER,</div><div class='add'>+	BTRFS_TREE_BLOCK_INVALID_LEVEL,</div><div class='add'>+	BTRFS_TREE_BLOCK_INVALID_FREE_SPACE,</div><div class='add'>+	BTRFS_TREE_BLOCK_INVALID_OFFSETS,</div><div class='add'>+	BTRFS_TREE_BLOCK_INVALID_BLOCKPTR,</div><div class='add'>+	BTRFS_TREE_BLOCK_INVALID_ITEM,</div><div class='add'>+	BTRFS_TREE_BLOCK_INVALID_OWNER,</div><div class='add'>+	BTRFS_TREE_BLOCK_WRITTEN_NOT_SET,</div><div class='add'>+};</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Less strict leaf checker.</div><div class='del'>- * Will only check item pointers, not reading item data.</div><div class='add'>+ * Exported simply for btrfs-progs which wants to have the</div><div class='add'>+ * btrfs_tree_block_status return codes.</div><div class='ctx'>  */</div><div class='del'>-int btrfs_check_leaf_relaxed(struct extent_buffer *leaf);</div><div class='add'>+enum btrfs_tree_block_status __btrfs_check_leaf(struct extent_buffer *leaf);</div><div class='add'>+enum btrfs_tree_block_status __btrfs_check_node(struct extent_buffer *node);</div><div class='add'>+</div><div class='add'>+int btrfs_check_leaf(struct extent_buffer *leaf);</div><div class='ctx'> int btrfs_check_node(struct extent_buffer *node);</div><div class='ctx'> </div><div class='del'>-int btrfs_check_chunk_valid(struct extent_buffer *leaf,</div><div class='del'>-			    struct btrfs_chunk *chunk, u64 logical);</div><div class='add'>+int btrfs_check_chunk_valid(const struct btrfs_fs_info *fs_info,</div><div class='add'>+			    const struct extent_buffer *leaf,</div><div class='add'>+			    const struct btrfs_chunk *chunk, u64 logical,</div><div class='add'>+			    u32 sectorsize);</div><div class='add'>+int btrfs_check_eb_owner(const struct extent_buffer *eb, u64 root_owner);</div><div class='add'>+int btrfs_verify_level_key(struct extent_buffer *eb,</div><div class='add'>+			   const struct btrfs_tree_parent_check *check);</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/btrfs/tree-defrag.c b/fs/btrfs/tree-defrag.c<br/>deleted file mode 100644<br/>index 7c45d960b53c..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tree-defrag.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tree-defrag.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,140 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0</div><div class='del'>-/*</div><div class='del'>- * Copyright (C) 2007 Oracle.  All rights reserved.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#include &lt;linux/sched.h&gt;</div><div class='del'>-#include "ctree.h"</div><div class='del'>-#include "disk-io.h"</div><div class='del'>-#include "print-tree.h"</div><div class='del'>-#include "transaction.h"</div><div class='del'>-#include "locking.h"</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Defrag all the leaves in a given btree.</div><div class='del'>- * Read all the leaves and try to get key order to</div><div class='del'>- * better reflect disk order</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-int btrfs_defrag_leaves(struct btrfs_trans_handle *trans,</div><div class='del'>-			struct btrfs_root *root)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_path *path = NULL;</div><div class='del'>-	struct btrfs_key key;</div><div class='del'>-	int ret = 0;</div><div class='del'>-	int wret;</div><div class='del'>-	int level;</div><div class='del'>-	int next_key_ret = 0;</div><div class='del'>-	u64 last_ret = 0;</div><div class='del'>-</div><div class='del'>-	if (root-&gt;fs_info-&gt;extent_root == root) {</div><div class='del'>-		/*</div><div class='del'>-		 * there's recursion here right now in the tree locking,</div><div class='del'>-		 * we can't defrag the extent root without deadlock</div><div class='del'>-		 */</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!test_bit(BTRFS_ROOT_SHAREABLE, &amp;root-&gt;state))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	path = btrfs_alloc_path();</div><div class='del'>-	if (!path)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	level = btrfs_header_level(root-&gt;node);</div><div class='del'>-</div><div class='del'>-	if (level == 0)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	if (root-&gt;defrag_progress.objectid == 0) {</div><div class='del'>-		struct extent_buffer *root_node;</div><div class='del'>-		u32 nritems;</div><div class='del'>-</div><div class='del'>-		root_node = btrfs_lock_root_node(root);</div><div class='del'>-		nritems = btrfs_header_nritems(root_node);</div><div class='del'>-		root-&gt;defrag_max.objectid = 0;</div><div class='del'>-		/* from above we know this is not a leaf */</div><div class='del'>-		btrfs_node_key_to_cpu(root_node, &amp;root-&gt;defrag_max,</div><div class='del'>-				      nritems - 1);</div><div class='del'>-		btrfs_tree_unlock(root_node);</div><div class='del'>-		free_extent_buffer(root_node);</div><div class='del'>-		memset(&amp;key, 0, sizeof(key));</div><div class='del'>-	} else {</div><div class='del'>-		memcpy(&amp;key, &amp;root-&gt;defrag_progress, sizeof(key));</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	path-&gt;keep_locks = 1;</div><div class='del'>-</div><div class='del'>-	ret = btrfs_search_forward(root, &amp;key, path, BTRFS_OLDEST_GENERATION);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-	if (ret &gt; 0) {</div><div class='del'>-		ret = 0;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	btrfs_release_path(path);</div><div class='del'>-	/*</div><div class='del'>-	 * We don't need a lock on a leaf. btrfs_realloc_node() will lock all</div><div class='del'>-	 * leafs from path-&gt;nodes[1], so set lowest_level to 1 to avoid later</div><div class='del'>-	 * a deadlock (attempting to write lock an already write locked leaf).</div><div class='del'>-	 */</div><div class='del'>-	path-&gt;lowest_level = 1;</div><div class='del'>-	wret = btrfs_search_slot(trans, root, &amp;key, path, 0, 1);</div><div class='del'>-</div><div class='del'>-	if (wret &lt; 0) {</div><div class='del'>-		ret = wret;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	if (!path-&gt;nodes[1]) {</div><div class='del'>-		ret = 0;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	/*</div><div class='del'>-	 * The node at level 1 must always be locked when our path has</div><div class='del'>-	 * keep_locks set and lowest_level is 1, regardless of the value of</div><div class='del'>-	 * path-&gt;slots[1].</div><div class='del'>-	 */</div><div class='del'>-	BUG_ON(path-&gt;locks[1] == 0);</div><div class='del'>-	ret = btrfs_realloc_node(trans, root,</div><div class='del'>-				 path-&gt;nodes[1], 0,</div><div class='del'>-				 &amp;last_ret,</div><div class='del'>-				 &amp;root-&gt;defrag_progress);</div><div class='del'>-	if (ret) {</div><div class='del'>-		WARN_ON(ret == -EAGAIN);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	/*</div><div class='del'>-	 * Now that we reallocated the node we can find the next key. Note that</div><div class='del'>-	 * btrfs_find_next_key() can release our path and do another search</div><div class='del'>-	 * without COWing, this is because even with path-&gt;keep_locks = 1,</div><div class='del'>-	 * btrfs_search_slot() / ctree.c:unlock_up() does not keeps a lock on a</div><div class='del'>-	 * node when path-&gt;slots[node_level - 1] does not point to the last</div><div class='del'>-	 * item or a slot beyond the last item (ctree.c:unlock_up()). Therefore</div><div class='del'>-	 * we search for the next key after reallocating our node.</div><div class='del'>-	 */</div><div class='del'>-	path-&gt;slots[1] = btrfs_header_nritems(path-&gt;nodes[1]);</div><div class='del'>-	next_key_ret = btrfs_find_next_key(root, path, &amp;key, 1,</div><div class='del'>-					   BTRFS_OLDEST_GENERATION);</div><div class='del'>-	if (next_key_ret == 0) {</div><div class='del'>-		memcpy(&amp;root-&gt;defrag_progress, &amp;key, sizeof(key));</div><div class='del'>-		ret = -EAGAIN;</div><div class='del'>-	}</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	if (ret == -EAGAIN) {</div><div class='del'>-		if (root-&gt;defrag_max.objectid &gt; root-&gt;defrag_progress.objectid)</div><div class='del'>-			goto done;</div><div class='del'>-		if (root-&gt;defrag_max.type &gt; root-&gt;defrag_progress.type)</div><div class='del'>-			goto done;</div><div class='del'>-		if (root-&gt;defrag_max.offset &gt; root-&gt;defrag_progress.offset)</div><div class='del'>-			goto done;</div><div class='del'>-		ret = 0;</div><div class='del'>-	}</div><div class='del'>-done:</div><div class='del'>-	if (ret != -EAGAIN)</div><div class='del'>-		memset(&amp;root-&gt;defrag_progress, 0,</div><div class='del'>-		       sizeof(root-&gt;defrag_progress));</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='head'>diff --git a/fs/btrfs/tree-log.c b/fs/btrfs/tree-log.c<br/>index 8ab33caf016f..fff37c8d96a4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tree-log.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tree-log.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tree-log.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/tree-log.c</a></div><div class='hunk'>@@ -13,13 +13,25 @@</div><div class='ctx'> #include "tree-log.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='ctx'> #include "locking.h"</div><div class='del'>-#include "print-tree.h"</div><div class='ctx'> #include "backref.h"</div><div class='ctx'> #include "compression.h"</div><div class='ctx'> #include "qgroup.h"</div><div class='ctx'> #include "block-group.h"</div><div class='ctx'> #include "space-info.h"</div><div class='del'>-#include "zoned.h"</div><div class='add'>+#include "inode-item.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "extent-tree.h"</div><div class='add'>+#include "root-tree.h"</div><div class='add'>+#include "dir-item.h"</div><div class='add'>+#include "file-item.h"</div><div class='add'>+#include "file.h"</div><div class='add'>+#include "orphan.h"</div><div class='add'>+#include "print-tree.h"</div><div class='add'>+#include "tree-checker.h"</div><div class='add'>+#include "delayed-inode.h"</div><div class='add'>+</div><div class='add'>+#define MAX_CONFLICT_INODES 10</div><div class='ctx'> </div><div class='ctx'> /* magic values for the inode_only field in btrfs_log_inode:</div><div class='ctx'>  *</div><div class='hunk'>@@ -30,8 +42,6 @@</div><div class='ctx'> enum {</div><div class='ctx'> 	LOG_INODE_ALL,</div><div class='ctx'> 	LOG_INODE_EXISTS,</div><div class='del'>-	LOG_OTHER_INODE,</div><div class='del'>-	LOG_OTHER_INODE_ALL,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -93,18 +103,135 @@ enum {</div><div class='ctx'> 	LOG_WALK_REPLAY_ALL,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * The walk control struct is used to pass state down the chain when processing</div><div class='add'>+ * the log tree. The stage field tells us which part of the log tree processing</div><div class='add'>+ * we are currently doing.</div><div class='add'>+ */</div><div class='add'>+struct walk_control {</div><div class='add'>+	/*</div><div class='add'>+	 * Signal that we are freeing the metadata extents of a log tree.</div><div class='add'>+	 * This is used at transaction commit time while freeing a log tree.</div><div class='add'>+	 */</div><div class='add'>+	bool free;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Signal that we are pinning the metadata extents of a log tree and the</div><div class='add'>+	 * data extents its leaves point to (if using mixed block groups).</div><div class='add'>+	 * This happens in the first stage of log replay to ensure that during</div><div class='add'>+	 * replay, while we are modifying subvolume trees, we don't overwrite</div><div class='add'>+	 * the metadata extents of log trees.</div><div class='add'>+	 */</div><div class='add'>+	bool pin;</div><div class='add'>+</div><div class='add'>+	/* What stage of the replay code we're currently in. */</div><div class='add'>+	int stage;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Ignore any items from the inode currently being processed. Needs</div><div class='add'>+	 * to be set every time we find a BTRFS_INODE_ITEM_KEY.</div><div class='add'>+	 */</div><div class='add'>+	bool ignore_cur_inode;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The root we are currently replaying to. This is NULL for the replay</div><div class='add'>+	 * stage LOG_WALK_PIN_ONLY.</div><div class='add'>+	 */</div><div class='add'>+	struct btrfs_root *root;</div><div class='add'>+</div><div class='add'>+	/* The log tree we are currently processing (not NULL for any stage). */</div><div class='add'>+	struct btrfs_root *log;</div><div class='add'>+</div><div class='add'>+	/* The transaction handle used for replaying all log trees. */</div><div class='add'>+	struct btrfs_trans_handle *trans;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The function that gets used to process blocks we find in the tree.</div><div class='add'>+	 * Note the extent_buffer might not be up to date when it is passed in,</div><div class='add'>+	 * and it must be checked or read if you need the data inside it.</div><div class='add'>+	 */</div><div class='add'>+	int (*process_func)(struct extent_buffer *eb,</div><div class='add'>+			    struct walk_control *wc, u64 gen, int level);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The following are used only when stage is &gt;= LOG_WALK_REPLAY_INODES</div><div class='add'>+	 * and by the replay_one_buffer() callback.</div><div class='add'>+	 */</div><div class='add'>+</div><div class='add'>+	/* The current log leaf being processed. */</div><div class='add'>+	struct extent_buffer *log_leaf;</div><div class='add'>+	/* The key being processed of the current log leaf. */</div><div class='add'>+	struct btrfs_key log_key;</div><div class='add'>+	/* The slot being processed of the current log leaf. */</div><div class='add'>+	int log_slot;</div><div class='add'>+</div><div class='add'>+	/* A path used for searches and modifications to subvolume trees. */</div><div class='add'>+	struct btrfs_path *subvol_path;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static void do_abort_log_replay(struct walk_control *wc, const char *function,</div><div class='add'>+				unsigned int line, int error, const char *fmt, ...)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = wc-&gt;trans-&gt;fs_info;</div><div class='add'>+	struct va_format vaf;</div><div class='add'>+	va_list args;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Do nothing if we already aborted, to avoid dumping leaves again which</div><div class='add'>+	 * can be verbose. Further more, only the first call is useful since it</div><div class='add'>+	 * is where we have a problem. Note that we do not use the flag</div><div class='add'>+	 * BTRFS_FS_STATE_TRANS_ABORTED because log replay calls functions that</div><div class='add'>+	 * are outside of tree-log.c that can abort transactions (such as</div><div class='add'>+	 * btrfs_add_link() for example), so if that happens we still want to</div><div class='add'>+	 * dump all log replay specific information below.</div><div class='add'>+	 */</div><div class='add'>+	if (test_and_set_bit(BTRFS_FS_STATE_LOG_REPLAY_ABORTED, &amp;fs_info-&gt;fs_state))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	btrfs_abort_transaction(wc-&gt;trans, error);</div><div class='add'>+</div><div class='add'>+	if (wc-&gt;subvol_path-&gt;nodes[0]) {</div><div class='add'>+		btrfs_crit(fs_info,</div><div class='add'>+			   "subvolume (root %llu) leaf currently being processed:",</div><div class='add'>+			   btrfs_root_id(wc-&gt;root));</div><div class='add'>+		btrfs_print_leaf(wc-&gt;subvol_path-&gt;nodes[0]);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (wc-&gt;log_leaf) {</div><div class='add'>+		btrfs_crit(fs_info,</div><div class='add'>+"log tree (for root %llu) leaf currently being processed (slot %d key " BTRFS_KEY_FMT "):",</div><div class='add'>+			   btrfs_root_id(wc-&gt;root), wc-&gt;log_slot,</div><div class='add'>+			   BTRFS_KEY_FMT_VALUE(&amp;wc-&gt;log_key));</div><div class='add'>+		btrfs_print_leaf(wc-&gt;log_leaf);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	va_start(args, fmt);</div><div class='add'>+	vaf.fmt = fmt;</div><div class='add'>+	vaf.va = &amp;args;</div><div class='add'>+</div><div class='add'>+	btrfs_crit(fs_info,</div><div class='add'>+	   "log replay failed in %s:%u for root %llu, stage %d, with error %d: %pV",</div><div class='add'>+		   function, line, btrfs_root_id(wc-&gt;root), wc-&gt;stage, error, &amp;vaf);</div><div class='add'>+</div><div class='add'>+	va_end(args);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Use this for aborting a transaction during log replay while we are down the</div><div class='add'>+ * call chain of replay_one_buffer(), so that we get a lot more useful</div><div class='add'>+ * information for debugging issues when compared to a plain call to</div><div class='add'>+ * btrfs_abort_transaction().</div><div class='add'>+ */</div><div class='add'>+#define btrfs_abort_log_replay(wc, error, fmt, args...) \</div><div class='add'>+	do_abort_log_replay((wc), __func__, __LINE__, (error), fmt, ##args)</div><div class='add'>+</div><div class='ctx'> static int btrfs_log_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			   struct btrfs_inode *inode,</div><div class='ctx'> 			   int inode_only,</div><div class='ctx'> 			   struct btrfs_log_ctx *ctx);</div><div class='del'>-static int link_to_fixup_dir(struct btrfs_trans_handle *trans,</div><div class='del'>-			     struct btrfs_root *root,</div><div class='del'>-			     struct btrfs_path *path, u64 objectid);</div><div class='del'>-static noinline int replay_dir_deletes(struct btrfs_trans_handle *trans,</div><div class='del'>-				       struct btrfs_root *root,</div><div class='del'>-				       struct btrfs_root *log,</div><div class='del'>-				       struct btrfs_path *path,</div><div class='del'>-				       u64 dirid, int del_all);</div><div class='add'>+static int link_to_fixup_dir(struct walk_control *wc, u64 objectid);</div><div class='add'>+static noinline int replay_dir_deletes(struct walk_control *wc,</div><div class='add'>+				       u64 dirid, bool del_all);</div><div class='ctx'> static void wait_log_commit(struct btrfs_root *root, int transid);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -130,6 +257,28 @@ static void wait_log_commit(struct btrfs_root *root, int transid);</div><div class='ctx'>  * and once to do all the other items.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='add'>+static struct btrfs_inode *btrfs_iget_logging(u64 objectid, struct btrfs_root *root)</div><div class='add'>+{</div><div class='add'>+	unsigned int nofs_flag;</div><div class='add'>+	struct btrfs_inode *inode;</div><div class='add'>+</div><div class='add'>+	/* Only meant to be called for subvolume roots and not for log roots. */</div><div class='add'>+	ASSERT(btrfs_is_fstree(btrfs_root_id(root)), "root_id=%llu", btrfs_root_id(root));</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We're holding a transaction handle whether we are logging or</div><div class='add'>+	 * replaying a log tree, so we must make sure NOFS semantics apply</div><div class='add'>+	 * because btrfs_alloc_inode() may be triggered and it uses GFP_KERNEL</div><div class='add'>+	 * to allocate an inode, which can recurse back into the filesystem and</div><div class='add'>+	 * attempt a transaction commit, resulting in a deadlock.</div><div class='add'>+	 */</div><div class='add'>+	nofs_flag = memalloc_nofs_save();</div><div class='add'>+	inode = btrfs_iget(objectid, root);</div><div class='add'>+	memalloc_nofs_restore(nofs_flag);</div><div class='add'>+</div><div class='add'>+	return inode;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * start a sub transaction and setup the log tree</div><div class='ctx'>  * this increments the log tree writer count to make the people</div><div class='hunk'>@@ -170,7 +319,7 @@ again:</div><div class='ctx'> 		int index = (root-&gt;log_transid + 1) % 2;</div><div class='ctx'> </div><div class='ctx'> 		if (btrfs_need_log_full_commit(trans)) {</div><div class='del'>-			ret = -EAGAIN;</div><div class='add'>+			ret = BTRFS_LOG_FORCE_COMMIT;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -193,7 +342,7 @@ again:</div><div class='ctx'> 		 * writing.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (zoned &amp;&amp; !created) {</div><div class='del'>-			ret = -EAGAIN;</div><div class='add'>+			ret = BTRFS_LOG_FORCE_COMMIT;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -269,77 +418,14 @@ void btrfs_end_log_trans(struct btrfs_root *root)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btrfs_write_tree_block(struct extent_buffer *buf)</div><div class='del'>-{</div><div class='del'>-	return filemap_fdatawrite_range(buf-&gt;pages[0]-&gt;mapping, buf-&gt;start,</div><div class='del'>-					buf-&gt;start + buf-&gt;len - 1);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void btrfs_wait_tree_block_writeback(struct extent_buffer *buf)</div><div class='del'>-{</div><div class='del'>-	filemap_fdatawait_range(buf-&gt;pages[0]-&gt;mapping,</div><div class='del'>-			        buf-&gt;start, buf-&gt;start + buf-&gt;len - 1);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * the walk control struct is used to pass state down the chain when</div><div class='del'>- * processing the log tree.  The stage field tells us which part</div><div class='del'>- * of the log tree processing we are currently doing.  The others</div><div class='del'>- * are state fields used for that specific part</div><div class='del'>- */</div><div class='del'>-struct walk_control {</div><div class='del'>-	/* should we free the extent on disk when done?  This is used</div><div class='del'>-	 * at transaction commit time while freeing a log tree</div><div class='del'>-	 */</div><div class='del'>-	int free;</div><div class='del'>-</div><div class='del'>-	/* should we write out the extent buffer?  This is used</div><div class='del'>-	 * while flushing the log tree to disk during a sync</div><div class='del'>-	 */</div><div class='del'>-	int write;</div><div class='del'>-</div><div class='del'>-	/* should we wait for the extent buffer io to finish?  Also used</div><div class='del'>-	 * while flushing the log tree to disk for a sync</div><div class='del'>-	 */</div><div class='del'>-	int wait;</div><div class='del'>-</div><div class='del'>-	/* pin only walk, we record which extents on disk belong to the</div><div class='del'>-	 * log trees</div><div class='del'>-	 */</div><div class='del'>-	int pin;</div><div class='del'>-</div><div class='del'>-	/* what stage of the replay code we're currently in */</div><div class='del'>-	int stage;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Ignore any items from the inode currently being processed. Needs</div><div class='del'>-	 * to be set every time we find a BTRFS_INODE_ITEM_KEY and we are in</div><div class='del'>-	 * the LOG_WALK_REPLAY_INODES stage.</div><div class='del'>-	 */</div><div class='del'>-	bool ignore_cur_inode;</div><div class='del'>-</div><div class='del'>-	/* the root we are currently replaying */</div><div class='del'>-	struct btrfs_root *replay_dest;</div><div class='del'>-</div><div class='del'>-	/* the trans handle for the current replay */</div><div class='del'>-	struct btrfs_trans_handle *trans;</div><div class='del'>-</div><div class='del'>-	/* the function that gets used to process blocks we find in the</div><div class='del'>-	 * tree.  Note the extent_buffer might not be up to date when it is</div><div class='del'>-	 * passed in, and it must be checked or read if you need the data</div><div class='del'>-	 * inside it</div><div class='del'>-	 */</div><div class='del'>-	int (*process_func)(struct btrfs_root *log, struct extent_buffer *eb,</div><div class='del'>-			    struct walk_control *wc, u64 gen, int level);</div><div class='del'>-};</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * process_func used to pin down extents, write them or wait on them</div><div class='ctx'>  */</div><div class='del'>-static int process_one_buffer(struct btrfs_root *log,</div><div class='del'>-			      struct extent_buffer *eb,</div><div class='add'>+static int process_one_buffer(struct extent_buffer *eb,</div><div class='ctx'> 			      struct walk_control *wc, u64 gen, int level)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_root *log = wc-&gt;log;</div><div class='add'>+	struct btrfs_trans_handle *trans = wc-&gt;trans;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = log-&gt;fs_info;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -348,93 +434,114 @@ static int process_one_buffer(struct btrfs_root *log,</div><div class='ctx'> 	 * pin down any logged extents, so we have to read the block.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (btrfs_fs_incompat(fs_info, MIXED_GROUPS)) {</div><div class='del'>-		ret = btrfs_read_buffer(eb, gen, level, NULL);</div><div class='del'>-		if (ret)</div><div class='add'>+		struct btrfs_tree_parent_check check = {</div><div class='add'>+			.level = level,</div><div class='add'>+			.transid = gen</div><div class='add'>+		};</div><div class='add'>+</div><div class='add'>+		ret = btrfs_read_extent_buffer(eb, &amp;check);</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			if (trans)</div><div class='add'>+				btrfs_abort_transaction(trans, ret);</div><div class='add'>+			else</div><div class='add'>+				btrfs_handle_fs_error(fs_info, ret, NULL);</div><div class='ctx'> 			return ret;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (wc-&gt;pin)</div><div class='del'>-		ret = btrfs_pin_extent_for_log_replay(wc-&gt;trans, eb-&gt;start,</div><div class='del'>-						      eb-&gt;len);</div><div class='add'>+	if (wc-&gt;pin) {</div><div class='add'>+		ASSERT(trans != NULL);</div><div class='add'>+		ret = btrfs_pin_extent_for_log_replay(trans, eb);</div><div class='add'>+		if (unlikely(ret)) {</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	if (!ret &amp;&amp; btrfs_buffer_uptodate(eb, gen, 0)) {</div><div class='del'>-		if (wc-&gt;pin &amp;&amp; btrfs_header_level(eb) == 0)</div><div class='add'>+		if (btrfs_buffer_uptodate(eb, gen, false) &amp;&amp; level == 0) {</div><div class='ctx'> 			ret = btrfs_exclude_logged_extents(eb);</div><div class='del'>-		if (wc-&gt;write)</div><div class='del'>-			btrfs_write_tree_block(eb);</div><div class='del'>-		if (wc-&gt;wait)</div><div class='del'>-			btrfs_wait_tree_block_writeback(eb);</div><div class='add'>+			if (ret)</div><div class='add'>+				btrfs_abort_transaction(trans, ret);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int do_overwrite_item(struct btrfs_trans_handle *trans,</div><div class='del'>-			     struct btrfs_root *root,</div><div class='del'>-			     struct btrfs_path *path,</div><div class='del'>-			     struct extent_buffer *eb, int slot,</div><div class='del'>-			     struct btrfs_key *key)</div><div class='add'>+/*</div><div class='add'>+ * Item overwrite used by log replay. The given log tree leaf, slot and key</div><div class='add'>+ * from the walk_control structure all refer to the source data we are copying</div><div class='add'>+ * out.</div><div class='add'>+ *</div><div class='add'>+ * The given root is for the tree we are copying into, and path is a scratch</div><div class='add'>+ * path for use in this function (it should be released on entry and will be</div><div class='add'>+ * released on exit).</div><div class='add'>+ *</div><div class='add'>+ * If the key is already in the destination tree the existing item is</div><div class='add'>+ * overwritten.  If the existing item isn't big enough, it is extended.</div><div class='add'>+ * If it is too large, it is truncated.</div><div class='add'>+ *</div><div class='add'>+ * If the key isn't in the destination yet, a new item is inserted.</div><div class='add'>+ */</div><div class='add'>+static int overwrite_item(struct walk_control *wc)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_trans_handle *trans = wc-&gt;trans;</div><div class='add'>+	struct btrfs_root *root = wc-&gt;root;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	u32 item_size;</div><div class='ctx'> 	u64 saved_i_size = 0;</div><div class='ctx'> 	int save_old_i_size = 0;</div><div class='ctx'> 	unsigned long src_ptr;</div><div class='ctx'> 	unsigned long dst_ptr;</div><div class='del'>-	int overwrite_root = 0;</div><div class='del'>-	bool inode_item = key-&gt;type == BTRFS_INODE_ITEM_KEY;</div><div class='del'>-</div><div class='del'>-	if (root-&gt;root_key.objectid != BTRFS_TREE_LOG_OBJECTID)</div><div class='del'>-		overwrite_root = 1;</div><div class='del'>-</div><div class='del'>-	item_size = btrfs_item_size_nr(eb, slot);</div><div class='del'>-	src_ptr = btrfs_item_ptr_offset(eb, slot);</div><div class='del'>-</div><div class='del'>-	/* Our caller must have done a search for the key for us. */</div><div class='del'>-	ASSERT(path-&gt;nodes[0] != NULL);</div><div class='add'>+	struct extent_buffer *dst_eb;</div><div class='add'>+	int dst_slot;</div><div class='add'>+	const bool is_inode_item = (wc-&gt;log_key.type == BTRFS_INODE_ITEM_KEY);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * And the slot must point to the exact key or the slot where the key</div><div class='del'>-	 * should be at (the first item with a key greater than 'key')</div><div class='add'>+	 * This is only used during log replay, so the root is always from a</div><div class='add'>+	 * fs/subvolume tree. In case we ever need to support a log root, then</div><div class='add'>+	 * we'll have to clone the leaf in the path, release the path and use</div><div class='add'>+	 * the leaf before writing into the log tree. See the comments at</div><div class='add'>+	 * copy_items() for more details.</div><div class='ctx'> 	 */</div><div class='del'>-	if (path-&gt;slots[0] &lt; btrfs_header_nritems(path-&gt;nodes[0])) {</div><div class='del'>-		struct btrfs_key found_key;</div><div class='add'>+	ASSERT(btrfs_root_id(root) != BTRFS_TREE_LOG_OBJECTID, "root_id=%llu", btrfs_root_id(root));</div><div class='ctx'> </div><div class='del'>-		btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;found_key, path-&gt;slots[0]);</div><div class='del'>-		ret = btrfs_comp_cpu_keys(&amp;found_key, key);</div><div class='del'>-		ASSERT(ret &gt;= 0);</div><div class='del'>-	} else {</div><div class='del'>-		ret = 1;</div><div class='add'>+	item_size = btrfs_item_size(wc-&gt;log_leaf, wc-&gt;log_slot);</div><div class='add'>+	src_ptr = btrfs_item_ptr_offset(wc-&gt;log_leaf, wc-&gt;log_slot);</div><div class='add'>+</div><div class='add'>+	/* Look for the key in the destination tree. */</div><div class='add'>+	ret = btrfs_search_slot(NULL, root, &amp;wc-&gt;log_key, wc-&gt;subvol_path, 0, 0);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+		"failed to search subvolume tree for key " BTRFS_KEY_FMT " root %llu",</div><div class='add'>+				       BTRFS_KEY_FMT_VALUE(&amp;wc-&gt;log_key),</div><div class='add'>+				       btrfs_root_id(root));</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	dst_eb = wc-&gt;subvol_path-&gt;nodes[0];</div><div class='add'>+	dst_slot = wc-&gt;subvol_path-&gt;slots[0];</div><div class='add'>+</div><div class='ctx'> 	if (ret == 0) {</div><div class='ctx'> 		char *src_copy;</div><div class='del'>-		char *dst_copy;</div><div class='del'>-		u32 dst_size = btrfs_item_size_nr(path-&gt;nodes[0],</div><div class='del'>-						  path-&gt;slots[0]);</div><div class='add'>+		const u32 dst_size = btrfs_item_size(dst_eb, dst_slot);</div><div class='add'>+</div><div class='ctx'> 		if (dst_size != item_size)</div><div class='ctx'> 			goto insert;</div><div class='ctx'> </div><div class='ctx'> 		if (item_size == 0) {</div><div class='del'>-			btrfs_release_path(path);</div><div class='add'>+			btrfs_release_path(wc-&gt;subvol_path);</div><div class='ctx'> 			return 0;</div><div class='ctx'> 		}</div><div class='del'>-		dst_copy = kmalloc(item_size, GFP_NOFS);</div><div class='ctx'> 		src_copy = kmalloc(item_size, GFP_NOFS);</div><div class='del'>-		if (!dst_copy || !src_copy) {</div><div class='del'>-			btrfs_release_path(path);</div><div class='del'>-			kfree(dst_copy);</div><div class='del'>-			kfree(src_copy);</div><div class='add'>+		if (!src_copy) {</div><div class='add'>+			btrfs_abort_log_replay(wc, -ENOMEM,</div><div class='add'>+			       "failed to allocate memory for log leaf item");</div><div class='ctx'> 			return -ENOMEM;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		read_extent_buffer(eb, src_copy, src_ptr, item_size);</div><div class='del'>-</div><div class='del'>-		dst_ptr = btrfs_item_ptr_offset(path-&gt;nodes[0], path-&gt;slots[0]);</div><div class='del'>-		read_extent_buffer(path-&gt;nodes[0], dst_copy, dst_ptr,</div><div class='del'>-				   item_size);</div><div class='del'>-		ret = memcmp(dst_copy, src_copy, item_size);</div><div class='add'>+		read_extent_buffer(wc-&gt;log_leaf, src_copy, src_ptr, item_size);</div><div class='add'>+		dst_ptr = btrfs_item_ptr_offset(dst_eb, dst_slot);</div><div class='add'>+		ret = memcmp_extent_buffer(dst_eb, src_copy, dst_ptr, item_size);</div><div class='ctx'> </div><div class='del'>-		kfree(dst_copy);</div><div class='ctx'> 		kfree(src_copy);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * they have the same contents, just return, this saves</div><div class='hunk'>@@ -443,7 +550,7 @@ static int do_overwrite_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		 * sync</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (ret == 0) {</div><div class='del'>-			btrfs_release_path(path);</div><div class='add'>+			btrfs_release_path(wc-&gt;subvol_path);</div><div class='ctx'> 			return 0;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -451,28 +558,28 @@ static int do_overwrite_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		 * We need to load the old nbytes into the inode so when we</div><div class='ctx'> 		 * replay the extents we've logged we get the right nbytes.</div><div class='ctx'> 		 */</div><div class='del'>-		if (inode_item) {</div><div class='add'>+		if (is_inode_item) {</div><div class='ctx'> 			struct btrfs_inode_item *item;</div><div class='ctx'> 			u64 nbytes;</div><div class='ctx'> 			u32 mode;</div><div class='ctx'> </div><div class='del'>-			item = btrfs_item_ptr(path-&gt;nodes[0], path-&gt;slots[0],</div><div class='add'>+			item = btrfs_item_ptr(dst_eb, dst_slot,</div><div class='ctx'> 					      struct btrfs_inode_item);</div><div class='del'>-			nbytes = btrfs_inode_nbytes(path-&gt;nodes[0], item);</div><div class='del'>-			item = btrfs_item_ptr(eb, slot,</div><div class='add'>+			nbytes = btrfs_inode_nbytes(dst_eb, item);</div><div class='add'>+			item = btrfs_item_ptr(wc-&gt;log_leaf, wc-&gt;log_slot,</div><div class='ctx'> 					      struct btrfs_inode_item);</div><div class='del'>-			btrfs_set_inode_nbytes(eb, item, nbytes);</div><div class='add'>+			btrfs_set_inode_nbytes(wc-&gt;log_leaf, item, nbytes);</div><div class='ctx'> </div><div class='ctx'> 			/*</div><div class='ctx'> 			 * If this is a directory we need to reset the i_size to</div><div class='ctx'> 			 * 0 so that we can set it up properly when replaying</div><div class='ctx'> 			 * the rest of the items in this log.</div><div class='ctx'> 			 */</div><div class='del'>-			mode = btrfs_inode_mode(eb, item);</div><div class='add'>+			mode = btrfs_inode_mode(wc-&gt;log_leaf, item);</div><div class='ctx'> 			if (S_ISDIR(mode))</div><div class='del'>-				btrfs_set_inode_size(eb, item, 0);</div><div class='add'>+				btrfs_set_inode_size(wc-&gt;log_leaf, item, 0);</div><div class='ctx'> 		}</div><div class='del'>-	} else if (inode_item) {</div><div class='add'>+	} else if (is_inode_item) {</div><div class='ctx'> 		struct btrfs_inode_item *item;</div><div class='ctx'> 		u32 mode;</div><div class='ctx'> </div><div class='hunk'>@@ -480,40 +587,43 @@ static int do_overwrite_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		 * New inode, set nbytes to 0 so that the nbytes comes out</div><div class='ctx'> 		 * properly when we replay the extents.</div><div class='ctx'> 		 */</div><div class='del'>-		item = btrfs_item_ptr(eb, slot, struct btrfs_inode_item);</div><div class='del'>-		btrfs_set_inode_nbytes(eb, item, 0);</div><div class='add'>+		item = btrfs_item_ptr(wc-&gt;log_leaf, wc-&gt;log_slot, struct btrfs_inode_item);</div><div class='add'>+		btrfs_set_inode_nbytes(wc-&gt;log_leaf, item, 0);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * If this is a directory we need to reset the i_size to 0 so</div><div class='ctx'> 		 * that we can set it up properly when replaying the rest of</div><div class='ctx'> 		 * the items in this log.</div><div class='ctx'> 		 */</div><div class='del'>-		mode = btrfs_inode_mode(eb, item);</div><div class='add'>+		mode = btrfs_inode_mode(wc-&gt;log_leaf, item);</div><div class='ctx'> 		if (S_ISDIR(mode))</div><div class='del'>-			btrfs_set_inode_size(eb, item, 0);</div><div class='add'>+			btrfs_set_inode_size(wc-&gt;log_leaf, item, 0);</div><div class='ctx'> 	}</div><div class='ctx'> insert:</div><div class='del'>-	btrfs_release_path(path);</div><div class='add'>+	btrfs_release_path(wc-&gt;subvol_path);</div><div class='ctx'> 	/* try to insert the key into the destination tree */</div><div class='del'>-	path-&gt;skip_release_on_error = 1;</div><div class='del'>-	ret = btrfs_insert_empty_item(trans, root, path,</div><div class='del'>-				      key, item_size);</div><div class='del'>-	path-&gt;skip_release_on_error = 0;</div><div class='add'>+	wc-&gt;subvol_path-&gt;skip_release_on_error = true;</div><div class='add'>+	ret = btrfs_insert_empty_item(trans, root, wc-&gt;subvol_path, &amp;wc-&gt;log_key, item_size);</div><div class='add'>+	wc-&gt;subvol_path-&gt;skip_release_on_error = false;</div><div class='add'>+</div><div class='add'>+	dst_eb = wc-&gt;subvol_path-&gt;nodes[0];</div><div class='add'>+	dst_slot = wc-&gt;subvol_path-&gt;slots[0];</div><div class='ctx'> </div><div class='ctx'> 	/* make sure any existing item is the correct size */</div><div class='ctx'> 	if (ret == -EEXIST || ret == -EOVERFLOW) {</div><div class='del'>-		u32 found_size;</div><div class='del'>-		found_size = btrfs_item_size_nr(path-&gt;nodes[0],</div><div class='del'>-						path-&gt;slots[0]);</div><div class='add'>+		const u32 found_size = btrfs_item_size(dst_eb, dst_slot);</div><div class='add'>+</div><div class='ctx'> 		if (found_size &gt; item_size)</div><div class='del'>-			btrfs_truncate_item(path, item_size, 1);</div><div class='add'>+			btrfs_truncate_item(trans, wc-&gt;subvol_path, item_size, 1);</div><div class='ctx'> 		else if (found_size &lt; item_size)</div><div class='del'>-			btrfs_extend_item(path, item_size - found_size);</div><div class='add'>+			btrfs_extend_item(trans, wc-&gt;subvol_path, item_size - found_size);</div><div class='ctx'> 	} else if (ret) {</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+				       "failed to insert item for key " BTRFS_KEY_FMT,</div><div class='add'>+				       BTRFS_KEY_FMT_VALUE(&amp;wc-&gt;log_key));</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='del'>-	dst_ptr = btrfs_item_ptr_offset(path-&gt;nodes[0],</div><div class='del'>-					path-&gt;slots[0]);</div><div class='add'>+	dst_ptr = btrfs_item_ptr_offset(dst_eb, dst_slot);</div><div class='ctx'> </div><div class='ctx'> 	/* don't overwrite an existing inode if the generation number</div><div class='ctx'> 	 * was logged as zero.  This is done when the tree logging code</div><div class='hunk'>@@ -524,16 +634,15 @@ insert:</div><div class='ctx'> 	 * state of the tree found in the subvolume, and i_size is modified</div><div class='ctx'> 	 * as it goes</div><div class='ctx'> 	 */</div><div class='del'>-	if (key-&gt;type == BTRFS_INODE_ITEM_KEY &amp;&amp; ret == -EEXIST) {</div><div class='add'>+	if (is_inode_item &amp;&amp; ret == -EEXIST) {</div><div class='ctx'> 		struct btrfs_inode_item *src_item;</div><div class='ctx'> 		struct btrfs_inode_item *dst_item;</div><div class='ctx'> </div><div class='ctx'> 		src_item = (struct btrfs_inode_item *)src_ptr;</div><div class='ctx'> 		dst_item = (struct btrfs_inode_item *)dst_ptr;</div><div class='ctx'> </div><div class='del'>-		if (btrfs_inode_generation(eb, src_item) == 0) {</div><div class='del'>-			struct extent_buffer *dst_eb = path-&gt;nodes[0];</div><div class='del'>-			const u64 ino_size = btrfs_inode_size(eb, src_item);</div><div class='add'>+		if (btrfs_inode_generation(wc-&gt;log_leaf, src_item) == 0) {</div><div class='add'>+			const u64 ino_size = btrfs_inode_size(wc-&gt;log_leaf, src_item);</div><div class='ctx'> </div><div class='ctx'> 			/*</div><div class='ctx'> 			 * For regular files an ino_size == 0 is used only when</div><div class='hunk'>@@ -542,89 +651,55 @@ insert:</div><div class='ctx'> 			 * case don't set the size of the inode in the fs/subvol</div><div class='ctx'> 			 * tree, otherwise we would be throwing valid data away.</div><div class='ctx'> 			 */</div><div class='del'>-			if (S_ISREG(btrfs_inode_mode(eb, src_item)) &amp;&amp;</div><div class='add'>+			if (S_ISREG(btrfs_inode_mode(wc-&gt;log_leaf, src_item)) &amp;&amp;</div><div class='ctx'> 			    S_ISREG(btrfs_inode_mode(dst_eb, dst_item)) &amp;&amp;</div><div class='ctx'> 			    ino_size != 0)</div><div class='ctx'> 				btrfs_set_inode_size(dst_eb, dst_item, ino_size);</div><div class='ctx'> 			goto no_copy;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (overwrite_root &amp;&amp;</div><div class='del'>-		    S_ISDIR(btrfs_inode_mode(eb, src_item)) &amp;&amp;</div><div class='del'>-		    S_ISDIR(btrfs_inode_mode(path-&gt;nodes[0], dst_item))) {</div><div class='add'>+		if (S_ISDIR(btrfs_inode_mode(wc-&gt;log_leaf, src_item)) &amp;&amp;</div><div class='add'>+		    S_ISDIR(btrfs_inode_mode(dst_eb, dst_item))) {</div><div class='ctx'> 			save_old_i_size = 1;</div><div class='del'>-			saved_i_size = btrfs_inode_size(path-&gt;nodes[0],</div><div class='del'>-							dst_item);</div><div class='add'>+			saved_i_size = btrfs_inode_size(dst_eb, dst_item);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	copy_extent_buffer(path-&gt;nodes[0], eb, dst_ptr,</div><div class='del'>-			   src_ptr, item_size);</div><div class='add'>+	copy_extent_buffer(dst_eb, wc-&gt;log_leaf, dst_ptr, src_ptr, item_size);</div><div class='ctx'> </div><div class='ctx'> 	if (save_old_i_size) {</div><div class='ctx'> 		struct btrfs_inode_item *dst_item;</div><div class='add'>+</div><div class='ctx'> 		dst_item = (struct btrfs_inode_item *)dst_ptr;</div><div class='del'>-		btrfs_set_inode_size(path-&gt;nodes[0], dst_item, saved_i_size);</div><div class='add'>+		btrfs_set_inode_size(dst_eb, dst_item, saved_i_size);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* make sure the generation is filled in */</div><div class='del'>-	if (key-&gt;type == BTRFS_INODE_ITEM_KEY) {</div><div class='add'>+	if (is_inode_item) {</div><div class='ctx'> 		struct btrfs_inode_item *dst_item;</div><div class='add'>+</div><div class='ctx'> 		dst_item = (struct btrfs_inode_item *)dst_ptr;</div><div class='del'>-		if (btrfs_inode_generation(path-&gt;nodes[0], dst_item) == 0) {</div><div class='del'>-			btrfs_set_inode_generation(path-&gt;nodes[0], dst_item,</div><div class='del'>-						   trans-&gt;transid);</div><div class='del'>-		}</div><div class='add'>+		if (btrfs_inode_generation(dst_eb, dst_item) == 0)</div><div class='add'>+			btrfs_set_inode_generation(dst_eb, dst_item, trans-&gt;transid);</div><div class='ctx'> 	}</div><div class='ctx'> no_copy:</div><div class='del'>-	btrfs_mark_buffer_dirty(path-&gt;nodes[0]);</div><div class='del'>-	btrfs_release_path(path);</div><div class='add'>+	btrfs_release_path(wc-&gt;subvol_path);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Item overwrite used by replay and tree logging.  eb, slot and key all refer</div><div class='del'>- * to the src data we are copying out.</div><div class='del'>- *</div><div class='del'>- * root is the tree we are copying into, and path is a scratch</div><div class='del'>- * path for use in this function (it should be released on entry and</div><div class='del'>- * will be released on exit).</div><div class='del'>- *</div><div class='del'>- * If the key is already in the destination tree the existing item is</div><div class='del'>- * overwritten.  If the existing item isn't big enough, it is extended.</div><div class='del'>- * If it is too large, it is truncated.</div><div class='del'>- *</div><div class='del'>- * If the key isn't in the destination yet, a new item is inserted.</div><div class='del'>- */</div><div class='del'>-static int overwrite_item(struct btrfs_trans_handle *trans,</div><div class='del'>-			  struct btrfs_root *root,</div><div class='del'>-			  struct btrfs_path *path,</div><div class='del'>-			  struct extent_buffer *eb, int slot,</div><div class='del'>-			  struct btrfs_key *key)</div><div class='add'>+static int read_alloc_one_name(struct extent_buffer *eb, void *start, int len,</div><div class='add'>+			       struct fscrypt_str *name)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='add'>+	char *buf;</div><div class='ctx'> </div><div class='del'>-	/* Look for the key in the destination tree. */</div><div class='del'>-	ret = btrfs_search_slot(NULL, root, key, path, 0, 0);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	return do_overwrite_item(trans, root, path, eb, slot, key);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * simple helper to read an inode off the disk from a given root</div><div class='del'>- * This can only be called for subvolume roots and not for the log</div><div class='del'>- */</div><div class='del'>-static noinline struct inode *read_one_inode(struct btrfs_root *root,</div><div class='del'>-					     u64 objectid)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode;</div><div class='add'>+	buf = kmalloc(len, GFP_NOFS);</div><div class='add'>+	if (!buf)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	inode = btrfs_iget(root-&gt;fs_info-&gt;sb, objectid, root);</div><div class='del'>-	if (IS_ERR(inode))</div><div class='del'>-		inode = NULL;</div><div class='del'>-	return inode;</div><div class='add'>+	read_extent_buffer(eb, buf, (unsigned long)start, len);</div><div class='add'>+	name-&gt;name = buf;</div><div class='add'>+	name-&gt;len = len;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* replays a single extent in 'eb' at 'slot' with 'key' into the</div><div class='hunk'>@@ -639,51 +714,53 @@ static noinline struct inode *read_one_inode(struct btrfs_root *root,</div><div class='ctx'>  * The extent is inserted into the file, dropping any existing extents</div><div class='ctx'>  * from the file that overlap the new one.</div><div class='ctx'>  */</div><div class='del'>-static noinline int replay_one_extent(struct btrfs_trans_handle *trans,</div><div class='del'>-				      struct btrfs_root *root,</div><div class='del'>-				      struct btrfs_path *path,</div><div class='del'>-				      struct extent_buffer *eb, int slot,</div><div class='del'>-				      struct btrfs_key *key)</div><div class='add'>+static noinline int replay_one_extent(struct walk_control *wc)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_trans_handle *trans = wc-&gt;trans;</div><div class='add'>+	struct btrfs_root *root = wc-&gt;root;</div><div class='ctx'> 	struct btrfs_drop_extents_args drop_args = { 0 };</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	int found_type;</div><div class='ctx'> 	u64 extent_end;</div><div class='del'>-	u64 start = key-&gt;offset;</div><div class='add'>+	const u64 start = wc-&gt;log_key.offset;</div><div class='ctx'> 	u64 nbytes = 0;</div><div class='add'>+	u64 csum_start;</div><div class='add'>+	u64 csum_end;</div><div class='add'>+	LIST_HEAD(ordered_sums);</div><div class='add'>+	u64 offset;</div><div class='add'>+	unsigned long dest_offset;</div><div class='add'>+	struct btrfs_key ins;</div><div class='ctx'> 	struct btrfs_file_extent_item *item;</div><div class='del'>-	struct inode *inode = NULL;</div><div class='del'>-	unsigned long size;</div><div class='add'>+	struct btrfs_inode *inode = NULL;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	item = btrfs_item_ptr(eb, slot, struct btrfs_file_extent_item);</div><div class='del'>-	found_type = btrfs_file_extent_type(eb, item);</div><div class='add'>+	item = btrfs_item_ptr(wc-&gt;log_leaf, wc-&gt;log_slot, struct btrfs_file_extent_item);</div><div class='add'>+	found_type = btrfs_file_extent_type(wc-&gt;log_leaf, item);</div><div class='ctx'> </div><div class='ctx'> 	if (found_type == BTRFS_FILE_EXTENT_REG ||</div><div class='ctx'> 	    found_type == BTRFS_FILE_EXTENT_PREALLOC) {</div><div class='del'>-		nbytes = btrfs_file_extent_num_bytes(eb, item);</div><div class='del'>-		extent_end = start + nbytes;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * We don't add to the inodes nbytes if we are prealloc or a</div><div class='del'>-		 * hole.</div><div class='del'>-		 */</div><div class='del'>-		if (btrfs_file_extent_disk_bytenr(eb, item) == 0)</div><div class='del'>-			nbytes = 0;</div><div class='add'>+		extent_end = start + btrfs_file_extent_num_bytes(wc-&gt;log_leaf, item);</div><div class='add'>+		/* Holes don't take up space. */</div><div class='add'>+		if (btrfs_file_extent_disk_bytenr(wc-&gt;log_leaf, item) != 0)</div><div class='add'>+			nbytes = btrfs_file_extent_num_bytes(wc-&gt;log_leaf, item);</div><div class='ctx'> 	} else if (found_type == BTRFS_FILE_EXTENT_INLINE) {</div><div class='del'>-		size = btrfs_file_extent_ram_bytes(eb, item);</div><div class='del'>-		nbytes = btrfs_file_extent_ram_bytes(eb, item);</div><div class='del'>-		extent_end = ALIGN(start + size,</div><div class='del'>-				   fs_info-&gt;sectorsize);</div><div class='add'>+		nbytes = btrfs_file_extent_ram_bytes(wc-&gt;log_leaf, item);</div><div class='add'>+		extent_end = ALIGN(start + nbytes, fs_info-&gt;sectorsize);</div><div class='ctx'> 	} else {</div><div class='del'>-		ret = 0;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	inode = read_one_inode(root, key-&gt;objectid);</div><div class='del'>-	if (!inode) {</div><div class='del'>-		ret = -EIO;</div><div class='del'>-		goto out;</div><div class='add'>+		btrfs_abort_log_replay(wc, -EUCLEAN,</div><div class='add'>+		       "unexpected extent type=%d root=%llu inode=%llu offset=%llu",</div><div class='add'>+				       found_type, btrfs_root_id(root),</div><div class='add'>+				       wc-&gt;log_key.objectid, wc-&gt;log_key.offset);</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	inode = btrfs_iget_logging(wc-&gt;log_key.objectid, root);</div><div class='add'>+	if (IS_ERR(inode)) {</div><div class='add'>+		ret = PTR_ERR(inode);</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+				       "failed to get inode %llu for root %llu",</div><div class='add'>+				       wc-&gt;log_key.objectid, btrfs_root_id(root));</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -691,224 +768,299 @@ static noinline int replay_one_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * file.  This must be done before the btrfs_drop_extents run</div><div class='ctx'> 	 * so we don't try to drop this extent.</div><div class='ctx'> 	 */</div><div class='del'>-	ret = btrfs_lookup_file_extent(trans, root, path,</div><div class='del'>-			btrfs_ino(BTRFS_I(inode)), start, 0);</div><div class='add'>+	ret = btrfs_lookup_file_extent(trans, root, wc-&gt;subvol_path,</div><div class='add'>+				       btrfs_ino(inode), start, 0);</div><div class='ctx'> </div><div class='ctx'> 	if (ret == 0 &amp;&amp;</div><div class='ctx'> 	    (found_type == BTRFS_FILE_EXTENT_REG ||</div><div class='ctx'> 	     found_type == BTRFS_FILE_EXTENT_PREALLOC)) {</div><div class='del'>-		struct btrfs_file_extent_item cmp1;</div><div class='del'>-		struct btrfs_file_extent_item cmp2;</div><div class='del'>-		struct btrfs_file_extent_item *existing;</div><div class='del'>-		struct extent_buffer *leaf;</div><div class='del'>-</div><div class='del'>-		leaf = path-&gt;nodes[0];</div><div class='del'>-		existing = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='del'>-					  struct btrfs_file_extent_item);</div><div class='add'>+		struct extent_buffer *leaf = wc-&gt;subvol_path-&gt;nodes[0];</div><div class='add'>+		struct btrfs_file_extent_item existing;</div><div class='add'>+		unsigned long ptr;</div><div class='ctx'> </div><div class='del'>-		read_extent_buffer(eb, &amp;cmp1, (unsigned long)item,</div><div class='del'>-				   sizeof(cmp1));</div><div class='del'>-		read_extent_buffer(leaf, &amp;cmp2, (unsigned long)existing,</div><div class='del'>-				   sizeof(cmp2));</div><div class='add'>+		ptr = btrfs_item_ptr_offset(leaf, wc-&gt;subvol_path-&gt;slots[0]);</div><div class='add'>+		read_extent_buffer(leaf, &amp;existing, ptr, sizeof(existing));</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * we already have a pointer to this exact extent,</div><div class='ctx'> 		 * we don't have to do anything</div><div class='ctx'> 		 */</div><div class='del'>-		if (memcmp(&amp;cmp1, &amp;cmp2, sizeof(cmp1)) == 0) {</div><div class='del'>-			btrfs_release_path(path);</div><div class='add'>+		if (memcmp_extent_buffer(wc-&gt;log_leaf, &amp;existing, (unsigned long)item,</div><div class='add'>+					 sizeof(existing)) == 0) {</div><div class='add'>+			btrfs_release_path(wc-&gt;subvol_path);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_release_path(path);</div><div class='add'>+	btrfs_release_path(wc-&gt;subvol_path);</div><div class='ctx'> </div><div class='ctx'> 	/* drop any overlapping extents */</div><div class='ctx'> 	drop_args.start = start;</div><div class='ctx'> 	drop_args.end = extent_end;</div><div class='ctx'> 	drop_args.drop_cache = true;</div><div class='del'>-	ret = btrfs_drop_extents(trans, root, BTRFS_I(inode), &amp;drop_args);</div><div class='del'>-	if (ret)</div><div class='add'>+	drop_args.path = wc-&gt;subvol_path;</div><div class='add'>+	ret = btrfs_drop_extents(trans, root, inode, &amp;drop_args);</div><div class='add'>+	if (ret) {</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+	       "failed to drop extents for inode %llu range [%llu, %llu) root %llu",</div><div class='add'>+				       wc-&gt;log_key.objectid, start, extent_end,</div><div class='add'>+				       btrfs_root_id(root));</div><div class='ctx'> 		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (found_type == BTRFS_FILE_EXTENT_REG ||</div><div class='del'>-	    found_type == BTRFS_FILE_EXTENT_PREALLOC) {</div><div class='del'>-		u64 offset;</div><div class='del'>-		unsigned long dest_offset;</div><div class='del'>-		struct btrfs_key ins;</div><div class='del'>-</div><div class='del'>-		if (btrfs_file_extent_disk_bytenr(eb, item) == 0 &amp;&amp;</div><div class='del'>-		    btrfs_fs_incompat(fs_info, NO_HOLES))</div><div class='del'>-			goto update_inode;</div><div class='del'>-</div><div class='del'>-		ret = btrfs_insert_empty_item(trans, root, path, key,</div><div class='del'>-					      sizeof(*item));</div><div class='add'>+	if (found_type == BTRFS_FILE_EXTENT_INLINE) {</div><div class='add'>+		/* inline extents are easy, we just overwrite them */</div><div class='add'>+		ret = overwrite_item(wc);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto out;</div><div class='del'>-		dest_offset = btrfs_item_ptr_offset(path-&gt;nodes[0],</div><div class='del'>-						    path-&gt;slots[0]);</div><div class='del'>-		copy_extent_buffer(path-&gt;nodes[0], eb, dest_offset,</div><div class='del'>-				(unsigned long)item,  sizeof(*item));</div><div class='add'>+		goto update_inode;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		ins.objectid = btrfs_file_extent_disk_bytenr(eb, item);</div><div class='del'>-		ins.offset = btrfs_file_extent_disk_num_bytes(eb, item);</div><div class='del'>-		ins.type = BTRFS_EXTENT_ITEM_KEY;</div><div class='del'>-		offset = key-&gt;offset - btrfs_file_extent_offset(eb, item);</div><div class='add'>+	/*</div><div class='add'>+	 * If not an inline extent, it can only be a regular or prealloc one.</div><div class='add'>+	 * We have checked that above and returned -EUCLEAN if not.</div><div class='add'>+	 */</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * Manually record dirty extent, as here we did a shallow</div><div class='del'>-		 * file extent item copy and skip normal backref update,</div><div class='del'>-		 * but modifying extent tree all by ourselves.</div><div class='del'>-		 * So need to manually record dirty extent for qgroup,</div><div class='del'>-		 * as the owner of the file extent changed from log tree</div><div class='del'>-		 * (doesn't affect qgroup) to fs/file tree(affects qgroup)</div><div class='del'>-		 */</div><div class='del'>-		ret = btrfs_qgroup_trace_extent(trans,</div><div class='del'>-				btrfs_file_extent_disk_bytenr(eb, item),</div><div class='del'>-				btrfs_file_extent_disk_num_bytes(eb, item),</div><div class='del'>-				GFP_NOFS);</div><div class='del'>-		if (ret &lt; 0)</div><div class='add'>+	/* A hole and NO_HOLES feature enabled, nothing else to do. */</div><div class='add'>+	if (btrfs_file_extent_disk_bytenr(wc-&gt;log_leaf, item) == 0 &amp;&amp;</div><div class='add'>+	    btrfs_fs_incompat(fs_info, NO_HOLES))</div><div class='add'>+		goto update_inode;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_insert_empty_item(trans, root, wc-&gt;subvol_path,</div><div class='add'>+				      &amp;wc-&gt;log_key, sizeof(*item));</div><div class='add'>+	if (ret) {</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+		       "failed to insert item with key " BTRFS_KEY_FMT " root %llu",</div><div class='add'>+				       BTRFS_KEY_FMT_VALUE(&amp;wc-&gt;log_key),</div><div class='add'>+				       btrfs_root_id(root));</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	dest_offset = btrfs_item_ptr_offset(wc-&gt;subvol_path-&gt;nodes[0],</div><div class='add'>+					    wc-&gt;subvol_path-&gt;slots[0]);</div><div class='add'>+	copy_extent_buffer(wc-&gt;subvol_path-&gt;nodes[0], wc-&gt;log_leaf, dest_offset,</div><div class='add'>+			   (unsigned long)item, sizeof(*item));</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We have an explicit hole and NO_HOLES is not enabled. We have added</div><div class='add'>+	 * the hole file extent item to the subvolume tree, so we don't have</div><div class='add'>+	 * anything else to do other than update the file extent item range and</div><div class='add'>+	 * update the inode item.</div><div class='add'>+	 */</div><div class='add'>+	if (btrfs_file_extent_disk_bytenr(wc-&gt;log_leaf, item) == 0) {</div><div class='add'>+		btrfs_release_path(wc-&gt;subvol_path);</div><div class='add'>+		goto update_inode;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ins.objectid = btrfs_file_extent_disk_bytenr(wc-&gt;log_leaf, item);</div><div class='add'>+	ins.type = BTRFS_EXTENT_ITEM_KEY;</div><div class='add'>+	ins.offset = btrfs_file_extent_disk_num_bytes(wc-&gt;log_leaf, item);</div><div class='add'>+	offset = wc-&gt;log_key.offset - btrfs_file_extent_offset(wc-&gt;log_leaf, item);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Manually record dirty extent, as here we did a shallow file extent</div><div class='add'>+	 * item copy and skip normal backref update, but modifying extent tree</div><div class='add'>+	 * all by ourselves. So need to manually record dirty extent for qgroup,</div><div class='add'>+	 * as the owner of the file extent changed from log tree (doesn't affect</div><div class='add'>+	 * qgroup) to fs/file tree (affects qgroup).</div><div class='add'>+	 */</div><div class='add'>+	ret = btrfs_qgroup_trace_extent(trans, ins.objectid, ins.offset);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+"failed to trace extent for bytenr %llu disk_num_bytes %llu inode %llu root %llu",</div><div class='add'>+				       ins.objectid, ins.offset,</div><div class='add'>+				       wc-&gt;log_key.objectid, btrfs_root_id(root));</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Is this extent already allocated in the extent tree?</div><div class='add'>+	 * If so, just add a reference.</div><div class='add'>+	 */</div><div class='add'>+	ret = btrfs_lookup_data_extent(fs_info, ins.objectid, ins.offset);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+"failed to lookup data extent for bytenr %llu disk_num_bytes %llu inode %llu root %llu",</div><div class='add'>+				       ins.objectid, ins.offset,</div><div class='add'>+				       wc-&gt;log_key.objectid, btrfs_root_id(root));</div><div class='add'>+		goto out;</div><div class='add'>+	} else if (ret == 0) {</div><div class='add'>+		struct btrfs_ref ref = {</div><div class='add'>+			.action = BTRFS_ADD_DELAYED_REF,</div><div class='add'>+			.bytenr = ins.objectid,</div><div class='add'>+			.num_bytes = ins.offset,</div><div class='add'>+			.owning_root = btrfs_root_id(root),</div><div class='add'>+			.ref_root = btrfs_root_id(root),</div><div class='add'>+		};</div><div class='add'>+</div><div class='add'>+		btrfs_init_data_ref(&amp;ref, wc-&gt;log_key.objectid, offset, 0, false);</div><div class='add'>+		ret = btrfs_inc_extent_ref(trans, &amp;ref);</div><div class='add'>+		if (ret) {</div><div class='add'>+			btrfs_abort_log_replay(wc, ret,</div><div class='add'>+"failed to increment data extent for bytenr %llu disk_num_bytes %llu inode %llu root %llu",</div><div class='add'>+					       ins.objectid, ins.offset,</div><div class='add'>+					       wc-&gt;log_key.objectid,</div><div class='add'>+					       btrfs_root_id(root));</div><div class='ctx'> 			goto out;</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		/* Insert the extent pointer in the extent tree. */</div><div class='add'>+		ret = btrfs_alloc_logged_file_extent(trans, btrfs_root_id(root),</div><div class='add'>+						     wc-&gt;log_key.objectid, offset, &amp;ins);</div><div class='add'>+		if (ret) {</div><div class='add'>+			btrfs_abort_log_replay(wc, ret,</div><div class='add'>+"failed to allocate logged data extent for bytenr %llu disk_num_bytes %llu offset %llu inode %llu root %llu",</div><div class='add'>+					       ins.objectid, ins.offset, offset,</div><div class='add'>+					       wc-&gt;log_key.objectid, btrfs_root_id(root));</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		if (ins.objectid &gt; 0) {</div><div class='del'>-			struct btrfs_ref ref = { 0 };</div><div class='del'>-			u64 csum_start;</div><div class='del'>-			u64 csum_end;</div><div class='del'>-			LIST_HEAD(ordered_sums);</div><div class='add'>+	btrfs_release_path(wc-&gt;subvol_path);</div><div class='ctx'> </div><div class='del'>-			/*</div><div class='del'>-			 * is this extent already allocated in the extent</div><div class='del'>-			 * allocation tree?  If so, just add a reference</div><div class='del'>-			 */</div><div class='del'>-			ret = btrfs_lookup_data_extent(fs_info, ins.objectid,</div><div class='del'>-						ins.offset);</div><div class='del'>-			if (ret &lt; 0) {</div><div class='del'>-				goto out;</div><div class='del'>-			} else if (ret == 0) {</div><div class='del'>-				btrfs_init_generic_ref(&amp;ref,</div><div class='del'>-						BTRFS_ADD_DELAYED_REF,</div><div class='del'>-						ins.objectid, ins.offset, 0);</div><div class='del'>-				btrfs_init_data_ref(&amp;ref,</div><div class='del'>-						root-&gt;root_key.objectid,</div><div class='del'>-						key-&gt;objectid, offset, 0, false);</div><div class='del'>-				ret = btrfs_inc_extent_ref(trans, &amp;ref);</div><div class='del'>-				if (ret)</div><div class='del'>-					goto out;</div><div class='del'>-			} else {</div><div class='del'>-				/*</div><div class='del'>-				 * insert the extent pointer in the extent</div><div class='del'>-				 * allocation tree</div><div class='del'>-				 */</div><div class='del'>-				ret = btrfs_alloc_logged_file_extent(trans,</div><div class='del'>-						root-&gt;root_key.objectid,</div><div class='del'>-						key-&gt;objectid, offset, &amp;ins);</div><div class='del'>-				if (ret)</div><div class='del'>-					goto out;</div><div class='del'>-			}</div><div class='del'>-			btrfs_release_path(path);</div><div class='add'>+	if (btrfs_file_extent_compression(wc-&gt;log_leaf, item)) {</div><div class='add'>+		csum_start = ins.objectid;</div><div class='add'>+		csum_end = csum_start + ins.offset;</div><div class='add'>+	} else {</div><div class='add'>+		csum_start = ins.objectid + btrfs_file_extent_offset(wc-&gt;log_leaf, item);</div><div class='add'>+		csum_end = csum_start + btrfs_file_extent_num_bytes(wc-&gt;log_leaf, item);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-			if (btrfs_file_extent_compression(eb, item)) {</div><div class='del'>-				csum_start = ins.objectid;</div><div class='del'>-				csum_end = csum_start + ins.offset;</div><div class='del'>-			} else {</div><div class='del'>-				csum_start = ins.objectid +</div><div class='del'>-					btrfs_file_extent_offset(eb, item);</div><div class='del'>-				csum_end = csum_start +</div><div class='del'>-					btrfs_file_extent_num_bytes(eb, item);</div><div class='del'>-			}</div><div class='add'>+	ret = btrfs_lookup_csums_list(root-&gt;log_root, csum_start, csum_end - 1,</div><div class='add'>+				      &amp;ordered_sums, false);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+	       "failed to lookups csums for range [%llu, %llu) inode %llu root %llu",</div><div class='add'>+				       csum_start, csum_end, wc-&gt;log_key.objectid,</div><div class='add'>+				       btrfs_root_id(root));</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	ret = 0;</div><div class='add'>+	/*</div><div class='add'>+	 * Now delete all existing cums in the csum root that cover our range.</div><div class='add'>+	 * We do this because we can have an extent that is completely</div><div class='add'>+	 * referenced by one file extent item and partially referenced by</div><div class='add'>+	 * another file extent item (like after using the clone or extent_same</div><div class='add'>+	 * ioctls). In this case if we end up doing the replay of the one that</div><div class='add'>+	 * partially references the extent first, and we do not do the csum</div><div class='add'>+	 * deletion below, we can get 2 csum items in the csum tree that overlap</div><div class='add'>+	 * each other. For example, imagine our log has the two following file</div><div class='add'>+	 * extent items:</div><div class='add'>+	 *</div><div class='add'>+	 * key (257 EXTENT_DATA 409600)</div><div class='add'>+	 *     extent data disk byte 12845056 nr 102400</div><div class='add'>+	 *     extent data offset 20480 nr 20480 ram 102400</div><div class='add'>+	 *</div><div class='add'>+	 * key (257 EXTENT_DATA 819200)</div><div class='add'>+	 *     extent data disk byte 12845056 nr 102400</div><div class='add'>+	 *     extent data offset 0 nr 102400 ram 102400</div><div class='add'>+	 *</div><div class='add'>+	 * Where the second one fully references the 100K extent that starts at</div><div class='add'>+	 * disk byte 12845056, and the log tree has a single csum item that</div><div class='add'>+	 * covers the entire range of the extent:</div><div class='add'>+	 *</div><div class='add'>+	 * key (EXTENT_CSUM EXTENT_CSUM 12845056) itemsize 100</div><div class='add'>+	 *</div><div class='add'>+	 * After the first file extent item is replayed, the csum tree gets the</div><div class='add'>+	 * following csum item:</div><div class='add'>+	 *</div><div class='add'>+	 * key (EXTENT_CSUM EXTENT_CSUM 12865536) itemsize 20</div><div class='add'>+	 *</div><div class='add'>+	 * Which covers the 20K sub-range starting at offset 20K of our extent.</div><div class='add'>+	 * Now when we replay the second file extent item, if we do not delete</div><div class='add'>+	 * existing csum items that cover any of its blocks, we end up getting</div><div class='add'>+	 * two csum items in our csum tree that overlap each other:</div><div class='add'>+	 *</div><div class='add'>+	 * key (EXTENT_CSUM EXTENT_CSUM 12845056) itemsize 100</div><div class='add'>+	 * key (EXTENT_CSUM EXTENT_CSUM 12865536) itemsize 20</div><div class='add'>+	 *</div><div class='add'>+	 * Which is a problem, because after this anyone trying to lookup for</div><div class='add'>+	 * the checksum of any block of our extent starting at an offset of 40K</div><div class='add'>+	 * or higher, will end up looking at the second csum item only, which</div><div class='add'>+	 * does not contain the checksum for any block starting at offset 40K or</div><div class='add'>+	 * higher of our extent.</div><div class='add'>+	 */</div><div class='add'>+	while (!list_empty(&amp;ordered_sums)) {</div><div class='add'>+		struct btrfs_ordered_sum *sums;</div><div class='add'>+		struct btrfs_root *csum_root;</div><div class='ctx'> </div><div class='del'>-			ret = btrfs_lookup_csums_range(root-&gt;log_root,</div><div class='del'>-						csum_start, csum_end - 1,</div><div class='del'>-						&amp;ordered_sums, 0);</div><div class='add'>+		sums = list_first_entry(&amp;ordered_sums, struct btrfs_ordered_sum, list);</div><div class='add'>+		csum_root = btrfs_csum_root(fs_info, sums-&gt;logical);</div><div class='add'>+		if (!ret) {</div><div class='add'>+			ret = btrfs_del_csums(trans, csum_root, sums-&gt;logical,</div><div class='add'>+					      sums-&gt;len);</div><div class='ctx'> 			if (ret)</div><div class='del'>-				goto out;</div><div class='del'>-			/*</div><div class='del'>-			 * Now delete all existing cums in the csum root that</div><div class='del'>-			 * cover our range. We do this because we can have an</div><div class='del'>-			 * extent that is completely referenced by one file</div><div class='del'>-			 * extent item and partially referenced by another</div><div class='del'>-			 * file extent item (like after using the clone or</div><div class='del'>-			 * extent_same ioctls). In this case if we end up doing</div><div class='del'>-			 * the replay of the one that partially references the</div><div class='del'>-			 * extent first, and we do not do the csum deletion</div><div class='del'>-			 * below, we can get 2 csum items in the csum tree that</div><div class='del'>-			 * overlap each other. For example, imagine our log has</div><div class='del'>-			 * the two following file extent items:</div><div class='del'>-			 *</div><div class='del'>-			 * key (257 EXTENT_DATA 409600)</div><div class='del'>-			 *     extent data disk byte 12845056 nr 102400</div><div class='del'>-			 *     extent data offset 20480 nr 20480 ram 102400</div><div class='del'>-			 *</div><div class='del'>-			 * key (257 EXTENT_DATA 819200)</div><div class='del'>-			 *     extent data disk byte 12845056 nr 102400</div><div class='del'>-			 *     extent data offset 0 nr 102400 ram 102400</div><div class='del'>-			 *</div><div class='del'>-			 * Where the second one fully references the 100K extent</div><div class='del'>-			 * that starts at disk byte 12845056, and the log tree</div><div class='del'>-			 * has a single csum item that covers the entire range</div><div class='del'>-			 * of the extent:</div><div class='del'>-			 *</div><div class='del'>-			 * key (EXTENT_CSUM EXTENT_CSUM 12845056) itemsize 100</div><div class='del'>-			 *</div><div class='del'>-			 * After the first file extent item is replayed, the</div><div class='del'>-			 * csum tree gets the following csum item:</div><div class='del'>-			 *</div><div class='del'>-			 * key (EXTENT_CSUM EXTENT_CSUM 12865536) itemsize 20</div><div class='del'>-			 *</div><div class='del'>-			 * Which covers the 20K sub-range starting at offset 20K</div><div class='del'>-			 * of our extent. Now when we replay the second file</div><div class='del'>-			 * extent item, if we do not delete existing csum items</div><div class='del'>-			 * that cover any of its blocks, we end up getting two</div><div class='del'>-			 * csum items in our csum tree that overlap each other:</div><div class='del'>-			 *</div><div class='del'>-			 * key (EXTENT_CSUM EXTENT_CSUM 12845056) itemsize 100</div><div class='del'>-			 * key (EXTENT_CSUM EXTENT_CSUM 12865536) itemsize 20</div><div class='del'>-			 *</div><div class='del'>-			 * Which is a problem, because after this anyone trying</div><div class='del'>-			 * to lookup up for the checksum of any block of our</div><div class='del'>-			 * extent starting at an offset of 40K or higher, will</div><div class='del'>-			 * end up looking at the second csum item only, which</div><div class='del'>-			 * does not contain the checksum for any block starting</div><div class='del'>-			 * at offset 40K or higher of our extent.</div><div class='del'>-			 */</div><div class='del'>-			while (!list_empty(&amp;ordered_sums)) {</div><div class='del'>-				struct btrfs_ordered_sum *sums;</div><div class='del'>-				sums = list_entry(ordered_sums.next,</div><div class='del'>-						struct btrfs_ordered_sum,</div><div class='del'>-						list);</div><div class='del'>-				if (!ret)</div><div class='del'>-					ret = btrfs_del_csums(trans,</div><div class='del'>-							      fs_info-&gt;csum_root,</div><div class='del'>-							      sums-&gt;bytenr,</div><div class='del'>-							      sums-&gt;len);</div><div class='del'>-				if (!ret)</div><div class='del'>-					ret = btrfs_csum_file_blocks(trans,</div><div class='del'>-						fs_info-&gt;csum_root, sums);</div><div class='del'>-				list_del(&amp;sums-&gt;list);</div><div class='del'>-				kfree(sums);</div><div class='del'>-			}</div><div class='add'>+				btrfs_abort_log_replay(wc, ret,</div><div class='add'>+	       "failed to delete csums for range [%llu, %llu) inode %llu root %llu",</div><div class='add'>+						       sums-&gt;logical,</div><div class='add'>+						       sums-&gt;logical + sums-&gt;len,</div><div class='add'>+						       wc-&gt;log_key.objectid,</div><div class='add'>+						       btrfs_root_id(root));</div><div class='add'>+		}</div><div class='add'>+		if (!ret) {</div><div class='add'>+			ret = btrfs_csum_file_blocks(trans, csum_root, sums);</div><div class='ctx'> 			if (ret)</div><div class='del'>-				goto out;</div><div class='del'>-		} else {</div><div class='del'>-			btrfs_release_path(path);</div><div class='add'>+				btrfs_abort_log_replay(wc, ret,</div><div class='add'>+	       "failed to add csums for range [%llu, %llu) inode %llu root %llu",</div><div class='add'>+						       sums-&gt;logical,</div><div class='add'>+						       sums-&gt;logical + sums-&gt;len,</div><div class='add'>+						       wc-&gt;log_key.objectid,</div><div class='add'>+						       btrfs_root_id(root));</div><div class='ctx'> 		}</div><div class='del'>-	} else if (found_type == BTRFS_FILE_EXTENT_INLINE) {</div><div class='del'>-		/* inline extents are easy, we just overwrite them */</div><div class='del'>-		ret = overwrite_item(trans, root, path, eb, slot, key);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto out;</div><div class='add'>+		list_del(&amp;sums-&gt;list);</div><div class='add'>+		kfree(sums);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	ret = btrfs_inode_set_file_extent_range(BTRFS_I(inode), start,</div><div class='del'>-						extent_end - start);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> update_inode:</div><div class='del'>-	btrfs_update_inode_bytes(BTRFS_I(inode), nbytes, drop_args.bytes_found);</div><div class='del'>-	ret = btrfs_update_inode(trans, root, BTRFS_I(inode));</div><div class='add'>+	ret = btrfs_inode_set_file_extent_range(inode, start, extent_end - start);</div><div class='add'>+	if (ret) {</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+	       "failed to set file extent range [%llu, %llu) inode %llu root %llu",</div><div class='add'>+				       start, extent_end, wc-&gt;log_key.objectid,</div><div class='add'>+				       btrfs_root_id(root));</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	btrfs_update_inode_bytes(inode, nbytes, drop_args.bytes_found);</div><div class='add'>+	ret = btrfs_update_inode(trans, inode);</div><div class='add'>+	if (ret)</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+				       "failed to update inode %llu root %llu",</div><div class='add'>+				       wc-&gt;log_key.objectid, btrfs_root_id(root));</div><div class='ctx'> out:</div><div class='del'>-	if (inode)</div><div class='del'>-		iput(inode);</div><div class='add'>+	iput(&amp;inode-&gt;vfs_inode);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int unlink_inode_for_log_replay(struct walk_control *wc,</div><div class='add'>+				       struct btrfs_inode *dir,</div><div class='add'>+				       struct btrfs_inode *inode,</div><div class='add'>+				       const struct fscrypt_str *name)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_trans_handle *trans = wc-&gt;trans;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_unlink_inode(trans, dir, inode, name);</div><div class='add'>+	if (ret) {</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+	       "failed to unlink inode %llu parent dir %llu name %.*s root %llu",</div><div class='add'>+				       btrfs_ino(inode), btrfs_ino(dir), name-&gt;len,</div><div class='add'>+				       name-&gt;name, btrfs_root_id(inode-&gt;root));</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+	/*</div><div class='add'>+	 * Whenever we need to check if a name exists or not, we check the</div><div class='add'>+	 * fs/subvolume tree. So after an unlink we must run delayed items, so</div><div class='add'>+	 * that future checks for a name during log replay see that the name</div><div class='add'>+	 * does not exists anymore.</div><div class='add'>+	 */</div><div class='add'>+	ret = btrfs_run_delayed_items(trans);</div><div class='add'>+	if (ret)</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+"failed to run delayed items current inode %llu parent dir %llu name %.*s root %llu",</div><div class='add'>+				       btrfs_ino(inode), btrfs_ino(dir), name-&gt;len,</div><div class='add'>+				       name-&gt;name, btrfs_root_id(inode-&gt;root));</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -920,49 +1072,48 @@ out:</div><div class='ctx'>  * This is a helper function to do the unlink of a specific directory</div><div class='ctx'>  * item</div><div class='ctx'>  */</div><div class='del'>-static noinline int drop_one_dir_item(struct btrfs_trans_handle *trans,</div><div class='del'>-				      struct btrfs_path *path,</div><div class='add'>+static noinline int drop_one_dir_item(struct walk_control *wc,</div><div class='ctx'> 				      struct btrfs_inode *dir,</div><div class='ctx'> 				      struct btrfs_dir_item *di)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root = dir-&gt;root;</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	char *name;</div><div class='del'>-	int name_len;</div><div class='del'>-	struct extent_buffer *leaf;</div><div class='add'>+	struct btrfs_inode *inode;</div><div class='add'>+	struct fscrypt_str name;</div><div class='add'>+	struct extent_buffer *leaf = wc-&gt;subvol_path-&gt;nodes[0];</div><div class='ctx'> 	struct btrfs_key location;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	leaf = path-&gt;nodes[0];</div><div class='del'>-</div><div class='ctx'> 	btrfs_dir_item_key_to_cpu(leaf, di, &amp;location);</div><div class='del'>-	name_len = btrfs_dir_name_len(leaf, di);</div><div class='del'>-	name = kmalloc(name_len, GFP_NOFS);</div><div class='del'>-	if (!name)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	ret = read_alloc_one_name(leaf, di + 1, btrfs_dir_name_len(leaf, di), &amp;name);</div><div class='add'>+	if (ret) {</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+				       "failed to allocate name for dir %llu root %llu",</div><div class='add'>+				       btrfs_ino(dir), btrfs_root_id(root));</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	read_extent_buffer(leaf, name, (unsigned long)(di + 1), name_len);</div><div class='del'>-	btrfs_release_path(path);</div><div class='add'>+	btrfs_release_path(wc-&gt;subvol_path);</div><div class='ctx'> </div><div class='del'>-	inode = read_one_inode(root, location.objectid);</div><div class='del'>-	if (!inode) {</div><div class='del'>-		ret = -EIO;</div><div class='add'>+	inode = btrfs_iget_logging(location.objectid, root);</div><div class='add'>+	if (IS_ERR(inode)) {</div><div class='add'>+		ret = PTR_ERR(inode);</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+		       "failed to open inode %llu parent dir %llu name %.*s root %llu",</div><div class='add'>+				       location.objectid, btrfs_ino(dir),</div><div class='add'>+				       name.len, name.name, btrfs_root_id(root));</div><div class='add'>+		inode = NULL;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = link_to_fixup_dir(trans, root, path, location.objectid);</div><div class='add'>+	ret = link_to_fixup_dir(wc, location.objectid);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_unlink_inode(trans, dir, BTRFS_I(inode), name,</div><div class='del'>-			name_len);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto out;</div><div class='del'>-	else</div><div class='del'>-		ret = btrfs_run_delayed_items(trans);</div><div class='add'>+	ret = unlink_inode_for_log_replay(wc, dir, inode, &amp;name);</div><div class='ctx'> out:</div><div class='del'>-	kfree(name);</div><div class='del'>-	iput(inode);</div><div class='add'>+	kfree(name.name);</div><div class='add'>+	if (inode)</div><div class='add'>+		iput(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -976,14 +1127,14 @@ out:</div><div class='ctx'> static noinline int inode_in_dir(struct btrfs_root *root,</div><div class='ctx'> 				 struct btrfs_path *path,</div><div class='ctx'> 				 u64 dirid, u64 objectid, u64 index,</div><div class='del'>-				 const char *name, int name_len)</div><div class='add'>+				 struct fscrypt_str *name)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_dir_item *di;</div><div class='ctx'> 	struct btrfs_key location;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	di = btrfs_lookup_dir_index_item(NULL, root, path, dirid,</div><div class='del'>-					 index, name, name_len, 0);</div><div class='add'>+					 index, name, 0);</div><div class='ctx'> 	if (IS_ERR(di)) {</div><div class='ctx'> 		ret = PTR_ERR(di);</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -996,7 +1147,7 @@ static noinline int inode_in_dir(struct btrfs_root *root,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	btrfs_release_path(path);</div><div class='del'>-	di = btrfs_lookup_dir_item(NULL, root, path, dirid, name, name_len, 0);</div><div class='add'>+	di = btrfs_lookup_dir_item(NULL, root, path, dirid, name, 0);</div><div class='ctx'> 	if (IS_ERR(di)) {</div><div class='ctx'> 		ret = PTR_ERR(di);</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -1023,9 +1174,9 @@ out:</div><div class='ctx'> static noinline int backref_in_log(struct btrfs_root *log,</div><div class='ctx'> 				   struct btrfs_key *key,</div><div class='ctx'> 				   u64 ref_objectid,</div><div class='del'>-				   const char *name, int namelen)</div><div class='add'>+				   const struct fscrypt_str *name)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='hunk'>@@ -1033,229 +1184,253 @@ static noinline int backref_in_log(struct btrfs_root *log,</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_search_slot(NULL, log, key, path, 0, 0);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		goto out;</div><div class='del'>-	} else if (ret == 1) {</div><div class='del'>-		ret = 0;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+	if (ret == 1)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> 	if (key-&gt;type == BTRFS_INODE_EXTREF_KEY)</div><div class='ctx'> 		ret = !!btrfs_find_name_in_ext_backref(path-&gt;nodes[0],</div><div class='ctx'> 						       path-&gt;slots[0],</div><div class='del'>-						       ref_objectid,</div><div class='del'>-						       name, namelen);</div><div class='add'>+						       ref_objectid, name);</div><div class='ctx'> 	else</div><div class='ctx'> 		ret = !!btrfs_find_name_in_backref(path-&gt;nodes[0],</div><div class='del'>-						   path-&gt;slots[0],</div><div class='del'>-						   name, namelen);</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='add'>+						   path-&gt;slots[0], name);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int __add_inode_ref(struct btrfs_trans_handle *trans,</div><div class='del'>-				  struct btrfs_root *root,</div><div class='del'>-				  struct btrfs_path *path,</div><div class='del'>-				  struct btrfs_root *log_root,</div><div class='add'>+static int unlink_refs_not_in_log(struct walk_control *wc,</div><div class='add'>+				  struct btrfs_key *search_key,</div><div class='ctx'> 				  struct btrfs_inode *dir,</div><div class='del'>-				  struct btrfs_inode *inode,</div><div class='del'>-				  u64 inode_objectid, u64 parent_objectid,</div><div class='del'>-				  u64 ref_index, char *name, int namelen,</div><div class='del'>-				  int *search_done)</div><div class='add'>+				  struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='del'>-	char *victim_name;</div><div class='del'>-	int victim_name_len;</div><div class='del'>-	struct extent_buffer *leaf;</div><div class='del'>-	struct btrfs_dir_item *di;</div><div class='del'>-	struct btrfs_key search_key;</div><div class='del'>-	struct btrfs_inode_extref *extref;</div><div class='add'>+	struct extent_buffer *leaf = wc-&gt;subvol_path-&gt;nodes[0];</div><div class='add'>+	unsigned long ptr;</div><div class='add'>+	unsigned long ptr_end;</div><div class='ctx'> </div><div class='del'>-again:</div><div class='del'>-	/* Search old style refs */</div><div class='del'>-	search_key.objectid = inode_objectid;</div><div class='del'>-	search_key.type = BTRFS_INODE_REF_KEY;</div><div class='del'>-	search_key.offset = parent_objectid;</div><div class='del'>-	ret = btrfs_search_slot(NULL, root, &amp;search_key, path, 0, 0);</div><div class='del'>-	if (ret == 0) {</div><div class='add'>+	/*</div><div class='add'>+	 * Check all the names in this back reference to see if they are in the</div><div class='add'>+	 * log. If so, we allow them to stay otherwise they must be unlinked as</div><div class='add'>+	 * a conflict.</div><div class='add'>+	 */</div><div class='add'>+	ptr = btrfs_item_ptr_offset(leaf, wc-&gt;subvol_path-&gt;slots[0]);</div><div class='add'>+	ptr_end = ptr + btrfs_item_size(leaf, wc-&gt;subvol_path-&gt;slots[0]);</div><div class='add'>+	while (ptr &lt; ptr_end) {</div><div class='add'>+		struct fscrypt_str victim_name;</div><div class='ctx'> 		struct btrfs_inode_ref *victim_ref;</div><div class='del'>-		unsigned long ptr;</div><div class='del'>-		unsigned long ptr_end;</div><div class='del'>-</div><div class='del'>-		leaf = path-&gt;nodes[0];</div><div class='del'>-</div><div class='del'>-		/* are we trying to overwrite a back ref for the root directory</div><div class='del'>-		 * if so, just jump out, we're done</div><div class='del'>-		 */</div><div class='del'>-		if (search_key.objectid == search_key.offset)</div><div class='del'>-			return 1;</div><div class='del'>-</div><div class='del'>-		/* check all the names in this back reference to see</div><div class='del'>-		 * if they are in the log.  if so, we allow them to stay</div><div class='del'>-		 * otherwise they must be unlinked as a conflict</div><div class='del'>-		 */</div><div class='del'>-		ptr = btrfs_item_ptr_offset(leaf, path-&gt;slots[0]);</div><div class='del'>-		ptr_end = ptr + btrfs_item_size_nr(leaf, path-&gt;slots[0]);</div><div class='del'>-		while (ptr &lt; ptr_end) {</div><div class='del'>-			victim_ref = (struct btrfs_inode_ref *)ptr;</div><div class='del'>-			victim_name_len = btrfs_inode_ref_name_len(leaf,</div><div class='del'>-								   victim_ref);</div><div class='del'>-			victim_name = kmalloc(victim_name_len, GFP_NOFS);</div><div class='del'>-			if (!victim_name)</div><div class='del'>-				return -ENOMEM;</div><div class='add'>+		int ret;</div><div class='ctx'> </div><div class='del'>-			read_extent_buffer(leaf, victim_name,</div><div class='del'>-					   (unsigned long)(victim_ref + 1),</div><div class='del'>-					   victim_name_len);</div><div class='add'>+		victim_ref = (struct btrfs_inode_ref *)ptr;</div><div class='add'>+		ret = read_alloc_one_name(leaf, (victim_ref + 1),</div><div class='add'>+					  btrfs_inode_ref_name_len(leaf, victim_ref),</div><div class='add'>+					  &amp;victim_name);</div><div class='add'>+		if (ret) {</div><div class='add'>+			btrfs_abort_log_replay(wc, ret,</div><div class='add'>+	       "failed to allocate name for inode %llu parent dir %llu root %llu",</div><div class='add'>+					       btrfs_ino(inode), btrfs_ino(dir),</div><div class='add'>+					       btrfs_root_id(inode-&gt;root));</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-			ret = backref_in_log(log_root, &amp;search_key,</div><div class='del'>-					     parent_objectid, victim_name,</div><div class='del'>-					     victim_name_len);</div><div class='add'>+		ret = backref_in_log(wc-&gt;log, search_key, btrfs_ino(dir), &amp;victim_name);</div><div class='add'>+		if (ret) {</div><div class='ctx'> 			if (ret &lt; 0) {</div><div class='del'>-				kfree(victim_name);</div><div class='add'>+				btrfs_abort_log_replay(wc, ret,</div><div class='add'>+"failed to check if backref is in log tree for inode %llu parent dir %llu name %.*s root %llu",</div><div class='add'>+						       btrfs_ino(inode), btrfs_ino(dir),</div><div class='add'>+						       victim_name.len, victim_name.name,</div><div class='add'>+						       btrfs_root_id(inode-&gt;root));</div><div class='add'>+				kfree(victim_name.name);</div><div class='ctx'> 				return ret;</div><div class='del'>-			} else if (!ret) {</div><div class='del'>-				inc_nlink(&amp;inode-&gt;vfs_inode);</div><div class='del'>-				btrfs_release_path(path);</div><div class='del'>-</div><div class='del'>-				ret = btrfs_unlink_inode(trans, dir, inode,</div><div class='del'>-						victim_name, victim_name_len);</div><div class='del'>-				kfree(victim_name);</div><div class='del'>-				if (ret)</div><div class='del'>-					return ret;</div><div class='del'>-				ret = btrfs_run_delayed_items(trans);</div><div class='del'>-				if (ret)</div><div class='del'>-					return ret;</div><div class='del'>-				*search_done = 1;</div><div class='del'>-				goto again;</div><div class='ctx'> 			}</div><div class='del'>-			kfree(victim_name);</div><div class='del'>-</div><div class='del'>-			ptr = (unsigned long)(victim_ref + 1) + victim_name_len;</div><div class='add'>+			kfree(victim_name.name);</div><div class='add'>+			ptr = (unsigned long)(victim_ref + 1) + victim_name.len;</div><div class='add'>+			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * NOTE: we have searched root tree and checked the</div><div class='del'>-		 * corresponding ref, it does not need to check again.</div><div class='del'>-		 */</div><div class='del'>-		*search_done = 1;</div><div class='add'>+		inc_nlink(&amp;inode-&gt;vfs_inode);</div><div class='add'>+		btrfs_release_path(wc-&gt;subvol_path);</div><div class='add'>+</div><div class='add'>+		ret = unlink_inode_for_log_replay(wc, dir, inode, &amp;victim_name);</div><div class='add'>+		kfree(victim_name.name);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		return -EAGAIN;</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_release_path(path);</div><div class='ctx'> </div><div class='del'>-	/* Same search but for extended refs */</div><div class='del'>-	extref = btrfs_lookup_inode_extref(NULL, root, path, name, namelen,</div><div class='del'>-					   inode_objectid, parent_objectid, 0,</div><div class='del'>-					   0);</div><div class='del'>-	if (!IS_ERR_OR_NULL(extref)) {</div><div class='del'>-		u32 item_size;</div><div class='del'>-		u32 cur_offset = 0;</div><div class='del'>-		unsigned long base;</div><div class='del'>-		struct inode *victim_parent;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		leaf = path-&gt;nodes[0];</div><div class='add'>+static int unlink_extrefs_not_in_log(struct walk_control *wc,</div><div class='add'>+				     struct btrfs_key *search_key,</div><div class='add'>+				     struct btrfs_inode *dir,</div><div class='add'>+				     struct btrfs_inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct extent_buffer *leaf = wc-&gt;subvol_path-&gt;nodes[0];</div><div class='add'>+	const unsigned long base = btrfs_item_ptr_offset(leaf, wc-&gt;subvol_path-&gt;slots[0]);</div><div class='add'>+	const u32 item_size = btrfs_item_size(leaf, wc-&gt;subvol_path-&gt;slots[0]);</div><div class='add'>+	u32 cur_offset = 0;</div><div class='ctx'> </div><div class='del'>-		item_size = btrfs_item_size_nr(leaf, path-&gt;slots[0]);</div><div class='del'>-		base = btrfs_item_ptr_offset(leaf, path-&gt;slots[0]);</div><div class='add'>+	while (cur_offset &lt; item_size) {</div><div class='add'>+		struct btrfs_root *log_root = wc-&gt;log;</div><div class='add'>+		struct btrfs_inode_extref *extref;</div><div class='add'>+		struct fscrypt_str victim_name;</div><div class='add'>+		int ret;</div><div class='ctx'> </div><div class='del'>-		while (cur_offset &lt; item_size) {</div><div class='del'>-			extref = (struct btrfs_inode_extref *)(base + cur_offset);</div><div class='add'>+		extref = (struct btrfs_inode_extref *)(base + cur_offset);</div><div class='add'>+		victim_name.len = btrfs_inode_extref_name_len(leaf, extref);</div><div class='ctx'> </div><div class='del'>-			victim_name_len = btrfs_inode_extref_name_len(leaf, extref);</div><div class='add'>+		if (btrfs_inode_extref_parent(leaf, extref) != btrfs_ino(dir))</div><div class='add'>+			goto next;</div><div class='ctx'> </div><div class='del'>-			if (btrfs_inode_extref_parent(leaf, extref) != parent_objectid)</div><div class='del'>-				goto next;</div><div class='add'>+		ret = read_alloc_one_name(leaf, &amp;extref-&gt;name, victim_name.len,</div><div class='add'>+					  &amp;victim_name);</div><div class='add'>+		if (ret) {</div><div class='add'>+			btrfs_abort_log_replay(wc, ret,</div><div class='add'>+	       "failed to allocate name for inode %llu parent dir %llu root %llu",</div><div class='add'>+					       btrfs_ino(inode), btrfs_ino(dir),</div><div class='add'>+					       btrfs_root_id(inode-&gt;root));</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-			victim_name = kmalloc(victim_name_len, GFP_NOFS);</div><div class='del'>-			if (!victim_name)</div><div class='del'>-				return -ENOMEM;</div><div class='del'>-			read_extent_buffer(leaf, victim_name, (unsigned long)&amp;extref-&gt;name,</div><div class='del'>-					   victim_name_len);</div><div class='del'>-</div><div class='del'>-			search_key.objectid = inode_objectid;</div><div class='del'>-			search_key.type = BTRFS_INODE_EXTREF_KEY;</div><div class='del'>-			search_key.offset = btrfs_extref_hash(parent_objectid,</div><div class='del'>-							      victim_name,</div><div class='del'>-							      victim_name_len);</div><div class='del'>-			ret = backref_in_log(log_root, &amp;search_key,</div><div class='del'>-					     parent_objectid, victim_name,</div><div class='del'>-					     victim_name_len);</div><div class='add'>+		search_key-&gt;objectid = btrfs_ino(inode);</div><div class='add'>+		search_key-&gt;type = BTRFS_INODE_EXTREF_KEY;</div><div class='add'>+		search_key-&gt;offset = btrfs_extref_hash(btrfs_ino(dir),</div><div class='add'>+						       victim_name.name,</div><div class='add'>+						       victim_name.len);</div><div class='add'>+		ret = backref_in_log(log_root, search_key, btrfs_ino(dir), &amp;victim_name);</div><div class='add'>+		if (ret) {</div><div class='ctx'> 			if (ret &lt; 0) {</div><div class='add'>+				btrfs_abort_log_replay(wc, ret,</div><div class='add'>+"failed to check if backref is in log tree for inode %llu parent dir %llu name %.*s root %llu",</div><div class='add'>+						       btrfs_ino(inode), btrfs_ino(dir),</div><div class='add'>+						       victim_name.len, victim_name.name,</div><div class='add'>+						       btrfs_root_id(inode-&gt;root));</div><div class='add'>+				kfree(victim_name.name);</div><div class='ctx'> 				return ret;</div><div class='del'>-			} else if (!ret) {</div><div class='del'>-				ret = -ENOENT;</div><div class='del'>-				victim_parent = read_one_inode(root,</div><div class='del'>-						parent_objectid);</div><div class='del'>-				if (victim_parent) {</div><div class='del'>-					inc_nlink(&amp;inode-&gt;vfs_inode);</div><div class='del'>-					btrfs_release_path(path);</div><div class='del'>-</div><div class='del'>-					ret = btrfs_unlink_inode(trans,</div><div class='del'>-							BTRFS_I(victim_parent),</div><div class='del'>-							inode,</div><div class='del'>-							victim_name,</div><div class='del'>-							victim_name_len);</div><div class='del'>-					if (!ret)</div><div class='del'>-						ret = btrfs_run_delayed_items(</div><div class='del'>-								  trans);</div><div class='del'>-				}</div><div class='del'>-				iput(victim_parent);</div><div class='del'>-				kfree(victim_name);</div><div class='del'>-				if (ret)</div><div class='del'>-					return ret;</div><div class='del'>-				*search_done = 1;</div><div class='del'>-				goto again;</div><div class='ctx'> 			}</div><div class='del'>-			kfree(victim_name);</div><div class='add'>+			kfree(victim_name.name);</div><div class='ctx'> next:</div><div class='del'>-			cur_offset += victim_name_len + sizeof(*extref);</div><div class='add'>+			cur_offset += victim_name.len + sizeof(*extref);</div><div class='add'>+			continue;</div><div class='ctx'> 		}</div><div class='del'>-		*search_done = 1;</div><div class='add'>+</div><div class='add'>+		inc_nlink(&amp;inode-&gt;vfs_inode);</div><div class='add'>+		btrfs_release_path(wc-&gt;subvol_path);</div><div class='add'>+</div><div class='add'>+		ret = unlink_inode_for_log_replay(wc, dir, inode, &amp;victim_name);</div><div class='add'>+		kfree(victim_name.name);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		return -EAGAIN;</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_release_path(path);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int __add_inode_ref(struct walk_control *wc,</div><div class='add'>+				  struct btrfs_inode *dir,</div><div class='add'>+				  struct btrfs_inode *inode,</div><div class='add'>+				  u64 ref_index, struct fscrypt_str *name)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+	struct btrfs_trans_handle *trans = wc-&gt;trans;</div><div class='add'>+	struct btrfs_root *root = wc-&gt;root;</div><div class='add'>+	struct btrfs_dir_item *di;</div><div class='add'>+	struct btrfs_key search_key;</div><div class='add'>+	struct btrfs_inode_extref *extref;</div><div class='add'>+</div><div class='add'>+again:</div><div class='add'>+	/* Search old style refs */</div><div class='add'>+	search_key.objectid = btrfs_ino(inode);</div><div class='add'>+	search_key.type = BTRFS_INODE_REF_KEY;</div><div class='add'>+	search_key.offset = btrfs_ino(dir);</div><div class='add'>+	ret = btrfs_search_slot(NULL, root, &amp;search_key, wc-&gt;subvol_path, 0, 0);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+	       "failed to search subvolume tree for key " BTRFS_KEY_FMT " root %llu",</div><div class='add'>+				       BTRFS_KEY_FMT_VALUE(&amp;search_key),</div><div class='add'>+				       btrfs_root_id(root));</div><div class='add'>+		return ret;</div><div class='add'>+	} else if (ret == 0) {</div><div class='add'>+		/*</div><div class='add'>+		 * Are we trying to overwrite a back ref for the root directory?</div><div class='add'>+		 * If so, we're done.</div><div class='add'>+		 */</div><div class='add'>+		if (search_key.objectid == search_key.offset)</div><div class='add'>+			return 1;</div><div class='add'>+</div><div class='add'>+		ret = unlink_refs_not_in_log(wc, &amp;search_key, dir, inode);</div><div class='add'>+		if (ret == -EAGAIN)</div><div class='add'>+			goto again;</div><div class='add'>+		else if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+	btrfs_release_path(wc-&gt;subvol_path);</div><div class='add'>+</div><div class='add'>+	/* Same search but for extended refs */</div><div class='add'>+	extref = btrfs_lookup_inode_extref(root, wc-&gt;subvol_path, name,</div><div class='add'>+					   btrfs_ino(inode), btrfs_ino(dir));</div><div class='add'>+	if (IS_ERR(extref)) {</div><div class='add'>+		return PTR_ERR(extref);</div><div class='add'>+	} else if (extref) {</div><div class='add'>+		ret = unlink_extrefs_not_in_log(wc, &amp;search_key, dir, inode);</div><div class='add'>+		if (ret == -EAGAIN)</div><div class='add'>+			goto again;</div><div class='add'>+		else if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+	btrfs_release_path(wc-&gt;subvol_path);</div><div class='ctx'> </div><div class='ctx'> 	/* look for a conflicting sequence number */</div><div class='del'>-	di = btrfs_lookup_dir_index_item(trans, root, path, btrfs_ino(dir),</div><div class='del'>-					 ref_index, name, namelen, 0);</div><div class='add'>+	di = btrfs_lookup_dir_index_item(trans, root, wc-&gt;subvol_path, btrfs_ino(dir),</div><div class='add'>+					 ref_index, name, 0);</div><div class='ctx'> 	if (IS_ERR(di)) {</div><div class='del'>-		return PTR_ERR(di);</div><div class='add'>+		ret = PTR_ERR(di);</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+"failed to lookup dir index item for dir %llu ref_index %llu name %.*s root %llu",</div><div class='add'>+				       btrfs_ino(dir), ref_index, name-&gt;len,</div><div class='add'>+				       name-&gt;name, btrfs_root_id(root));</div><div class='add'>+		return ret;</div><div class='ctx'> 	} else if (di) {</div><div class='del'>-		ret = drop_one_dir_item(trans, path, dir, di);</div><div class='add'>+		ret = drop_one_dir_item(wc, dir, di);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_release_path(path);</div><div class='add'>+	btrfs_release_path(wc-&gt;subvol_path);</div><div class='ctx'> </div><div class='ctx'> 	/* look for a conflicting name */</div><div class='del'>-	di = btrfs_lookup_dir_item(trans, root, path, btrfs_ino(dir),</div><div class='del'>-				   name, namelen, 0);</div><div class='add'>+	di = btrfs_lookup_dir_item(trans, root, wc-&gt;subvol_path, btrfs_ino(dir), name, 0);</div><div class='ctx'> 	if (IS_ERR(di)) {</div><div class='del'>-		return PTR_ERR(di);</div><div class='add'>+		ret = PTR_ERR(di);</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+	"failed to lookup dir item for dir %llu name %.*s root %llu",</div><div class='add'>+				       btrfs_ino(dir), name-&gt;len, name-&gt;name,</div><div class='add'>+				       btrfs_root_id(root));</div><div class='add'>+		return ret;</div><div class='ctx'> 	} else if (di) {</div><div class='del'>-		ret = drop_one_dir_item(trans, path, dir, di);</div><div class='add'>+		ret = drop_one_dir_item(wc, dir, di);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_release_path(path);</div><div class='add'>+	btrfs_release_path(wc-&gt;subvol_path);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int extref_get_fields(struct extent_buffer *eb, unsigned long ref_ptr,</div><div class='del'>-			     u32 *namelen, char **name, u64 *index,</div><div class='add'>+			     struct fscrypt_str *name, u64 *index,</div><div class='ctx'> 			     u64 *parent_objectid)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_inode_extref *extref;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	extref = (struct btrfs_inode_extref *)ref_ptr;</div><div class='ctx'> </div><div class='del'>-	*namelen = btrfs_inode_extref_name_len(eb, extref);</div><div class='del'>-	*name = kmalloc(*namelen, GFP_NOFS);</div><div class='del'>-	if (*name == NULL)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	read_extent_buffer(eb, *name, (unsigned long)&amp;extref-&gt;name,</div><div class='del'>-			   *namelen);</div><div class='add'>+	ret = read_alloc_one_name(eb, &amp;extref-&gt;name,</div><div class='add'>+				  btrfs_inode_extref_name_len(eb, extref), name);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	if (index)</div><div class='ctx'> 		*index = btrfs_inode_extref_index(eb, extref);</div><div class='hunk'>@@ -1266,18 +1441,17 @@ static int extref_get_fields(struct extent_buffer *eb, unsigned long ref_ptr,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ref_get_fields(struct extent_buffer *eb, unsigned long ref_ptr,</div><div class='del'>-			  u32 *namelen, char **name, u64 *index)</div><div class='add'>+			  struct fscrypt_str *name, u64 *index)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_inode_ref *ref;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	ref = (struct btrfs_inode_ref *)ref_ptr;</div><div class='ctx'> </div><div class='del'>-	*namelen = btrfs_inode_ref_name_len(eb, ref);</div><div class='del'>-	*name = kmalloc(*namelen, GFP_NOFS);</div><div class='del'>-	if (*name == NULL)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	read_extent_buffer(eb, *name, (unsigned long)(ref + 1), *namelen);</div><div class='add'>+	ret = read_alloc_one_name(eb, ref + 1, btrfs_inode_ref_name_len(eb, ref),</div><div class='add'>+				  name);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	if (index)</div><div class='ctx'> 		*index = btrfs_inode_ref_index(eb, ref);</div><div class='hunk'>@@ -1292,231 +1466,133 @@ static int ref_get_fields(struct extent_buffer *eb, unsigned long ref_ptr,</div><div class='ctx'>  * proper unlink of that name (that is, remove its entry from the inode</div><div class='ctx'>  * reference item and both dir index keys).</div><div class='ctx'>  */</div><div class='del'>-static int unlink_old_inode_refs(struct btrfs_trans_handle *trans,</div><div class='del'>-				 struct btrfs_root *root,</div><div class='del'>-				 struct btrfs_path *path,</div><div class='del'>-				 struct btrfs_inode *inode,</div><div class='del'>-				 struct extent_buffer *log_eb,</div><div class='del'>-				 int log_slot,</div><div class='del'>-				 struct btrfs_key *key)</div><div class='add'>+static int unlink_old_inode_refs(struct walk_control *wc, struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_root *root = wc-&gt;root;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	unsigned long ref_ptr;</div><div class='ctx'> 	unsigned long ref_end;</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='ctx'> </div><div class='ctx'> again:</div><div class='del'>-	btrfs_release_path(path);</div><div class='del'>-	ret = btrfs_search_slot(NULL, root, key, path, 0, 0);</div><div class='add'>+	btrfs_release_path(wc-&gt;subvol_path);</div><div class='add'>+	ret = btrfs_search_slot(NULL, root, &amp;wc-&gt;log_key, wc-&gt;subvol_path, 0, 0);</div><div class='ctx'> 	if (ret &gt; 0) {</div><div class='ctx'> 		ret = 0;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (ret &lt; 0)</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+	       "failed to search subvolume tree for key " BTRFS_KEY_FMT " root %llu",</div><div class='add'>+				       BTRFS_KEY_FMT_VALUE(&amp;wc-&gt;log_key),</div><div class='add'>+				       btrfs_root_id(root));</div><div class='ctx'> 		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	eb = path-&gt;nodes[0];</div><div class='del'>-	ref_ptr = btrfs_item_ptr_offset(eb, path-&gt;slots[0]);</div><div class='del'>-	ref_end = ref_ptr + btrfs_item_size_nr(eb, path-&gt;slots[0]);</div><div class='add'>+	eb = wc-&gt;subvol_path-&gt;nodes[0];</div><div class='add'>+	ref_ptr = btrfs_item_ptr_offset(eb, wc-&gt;subvol_path-&gt;slots[0]);</div><div class='add'>+	ref_end = ref_ptr + btrfs_item_size(eb, wc-&gt;subvol_path-&gt;slots[0]);</div><div class='ctx'> 	while (ref_ptr &lt; ref_end) {</div><div class='del'>-		char *name = NULL;</div><div class='del'>-		int namelen;</div><div class='add'>+		struct fscrypt_str name;</div><div class='ctx'> 		u64 parent_id;</div><div class='ctx'> </div><div class='del'>-		if (key-&gt;type == BTRFS_INODE_EXTREF_KEY) {</div><div class='del'>-			ret = extref_get_fields(eb, ref_ptr, &amp;namelen, &amp;name,</div><div class='add'>+		if (wc-&gt;log_key.type == BTRFS_INODE_EXTREF_KEY) {</div><div class='add'>+			ret = extref_get_fields(eb, ref_ptr, &amp;name,</div><div class='ctx'> 						NULL, &amp;parent_id);</div><div class='add'>+			if (ret) {</div><div class='add'>+				btrfs_abort_log_replay(wc, ret,</div><div class='add'>+			       "failed to get extref details for inode %llu root %llu",</div><div class='add'>+						       btrfs_ino(inode),</div><div class='add'>+						       btrfs_root_id(root));</div><div class='add'>+				goto out;</div><div class='add'>+			}</div><div class='ctx'> 		} else {</div><div class='del'>-			parent_id = key-&gt;offset;</div><div class='del'>-			ret = ref_get_fields(eb, ref_ptr, &amp;namelen, &amp;name,</div><div class='del'>-					     NULL);</div><div class='add'>+			parent_id = wc-&gt;log_key.offset;</div><div class='add'>+			ret = ref_get_fields(eb, ref_ptr, &amp;name, NULL);</div><div class='add'>+			if (ret) {</div><div class='add'>+				btrfs_abort_log_replay(wc, ret,</div><div class='add'>+	       "failed to get ref details for inode %llu parent_id %llu root %llu",</div><div class='add'>+						       btrfs_ino(inode), parent_id,</div><div class='add'>+						       btrfs_root_id(root));</div><div class='add'>+				goto out;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='del'>-		if (ret)</div><div class='del'>-			goto out;</div><div class='ctx'> </div><div class='del'>-		if (key-&gt;type == BTRFS_INODE_EXTREF_KEY)</div><div class='del'>-			ret = !!btrfs_find_name_in_ext_backref(log_eb, log_slot,</div><div class='del'>-							       parent_id, name,</div><div class='del'>-							       namelen);</div><div class='add'>+		if (wc-&gt;log_key.type == BTRFS_INODE_EXTREF_KEY)</div><div class='add'>+			ret = !!btrfs_find_name_in_ext_backref(wc-&gt;log_leaf, wc-&gt;log_slot,</div><div class='add'>+							       parent_id, &amp;name);</div><div class='ctx'> 		else</div><div class='del'>-			ret = !!btrfs_find_name_in_backref(log_eb, log_slot,</div><div class='del'>-							   name, namelen);</div><div class='add'>+			ret = !!btrfs_find_name_in_backref(wc-&gt;log_leaf, wc-&gt;log_slot,</div><div class='add'>+							   &amp;name);</div><div class='ctx'> </div><div class='ctx'> 		if (!ret) {</div><div class='del'>-			struct inode *dir;</div><div class='del'>-</div><div class='del'>-			btrfs_release_path(path);</div><div class='del'>-			dir = read_one_inode(root, parent_id);</div><div class='del'>-			if (!dir) {</div><div class='del'>-				ret = -ENOENT;</div><div class='del'>-				kfree(name);</div><div class='add'>+			struct btrfs_inode *dir;</div><div class='add'>+</div><div class='add'>+			btrfs_release_path(wc-&gt;subvol_path);</div><div class='add'>+			dir = btrfs_iget_logging(parent_id, root);</div><div class='add'>+			if (IS_ERR(dir)) {</div><div class='add'>+				ret = PTR_ERR(dir);</div><div class='add'>+				kfree(name.name);</div><div class='add'>+				btrfs_abort_log_replay(wc, ret,</div><div class='add'>+				       "failed to lookup dir inode %llu root %llu",</div><div class='add'>+						       parent_id, btrfs_root_id(root));</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='del'>-			ret = btrfs_unlink_inode(trans, BTRFS_I(dir),</div><div class='del'>-						 inode, name, namelen);</div><div class='del'>-			kfree(name);</div><div class='del'>-			iput(dir);</div><div class='add'>+			ret = unlink_inode_for_log_replay(wc, dir, inode, &amp;name);</div><div class='add'>+			kfree(name.name);</div><div class='add'>+			iput(&amp;dir-&gt;vfs_inode);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			goto again;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		kfree(name);</div><div class='del'>-		ref_ptr += namelen;</div><div class='del'>-		if (key-&gt;type == BTRFS_INODE_EXTREF_KEY)</div><div class='add'>+		kfree(name.name);</div><div class='add'>+		ref_ptr += name.len;</div><div class='add'>+		if (wc-&gt;log_key.type == BTRFS_INODE_EXTREF_KEY)</div><div class='ctx'> 			ref_ptr += sizeof(struct btrfs_inode_extref);</div><div class='ctx'> 		else</div><div class='ctx'> 			ref_ptr += sizeof(struct btrfs_inode_ref);</div><div class='ctx'> 	}</div><div class='ctx'> 	ret = 0;</div><div class='ctx'>  out:</div><div class='del'>-	btrfs_release_path(path);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int btrfs_inode_ref_exists(struct inode *inode, struct inode *dir,</div><div class='del'>-				  const u8 ref_type, const char *name,</div><div class='del'>-				  const int namelen)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_key key;</div><div class='del'>-	struct btrfs_path *path;</div><div class='del'>-	const u64 parent_id = btrfs_ino(BTRFS_I(dir));</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	path = btrfs_alloc_path();</div><div class='del'>-	if (!path)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	key.objectid = btrfs_ino(BTRFS_I(inode));</div><div class='del'>-	key.type = ref_type;</div><div class='del'>-	if (key.type == BTRFS_INODE_REF_KEY)</div><div class='del'>-		key.offset = parent_id;</div><div class='del'>-	else</div><div class='del'>-		key.offset = btrfs_extref_hash(parent_id, name, namelen);</div><div class='del'>-</div><div class='del'>-	ret = btrfs_search_slot(NULL, BTRFS_I(inode)-&gt;root, &amp;key, path, 0, 0);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-	if (ret &gt; 0) {</div><div class='del'>-		ret = 0;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	if (key.type == BTRFS_INODE_EXTREF_KEY)</div><div class='del'>-		ret = !!btrfs_find_name_in_ext_backref(path-&gt;nodes[0],</div><div class='del'>-				path-&gt;slots[0], parent_id, name, namelen);</div><div class='del'>-	else</div><div class='del'>-		ret = !!btrfs_find_name_in_backref(path-&gt;nodes[0], path-&gt;slots[0],</div><div class='del'>-						   name, namelen);</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int add_link(struct btrfs_trans_handle *trans,</div><div class='del'>-		    struct inode *dir, struct inode *inode, const char *name,</div><div class='del'>-		    int namelen, u64 ref_index)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_root *root = BTRFS_I(dir)-&gt;root;</div><div class='del'>-	struct btrfs_dir_item *dir_item;</div><div class='del'>-	struct btrfs_key key;</div><div class='del'>-	struct btrfs_path *path;</div><div class='del'>-	struct inode *other_inode = NULL;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	path = btrfs_alloc_path();</div><div class='del'>-	if (!path)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	dir_item = btrfs_lookup_dir_item(NULL, root, path,</div><div class='del'>-					 btrfs_ino(BTRFS_I(dir)),</div><div class='del'>-					 name, namelen, 0);</div><div class='del'>-	if (!dir_item) {</div><div class='del'>-		btrfs_release_path(path);</div><div class='del'>-		goto add_link;</div><div class='del'>-	} else if (IS_ERR(dir_item)) {</div><div class='del'>-		ret = PTR_ERR(dir_item);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Our inode's dentry collides with the dentry of another inode which is</div><div class='del'>-	 * in the log but not yet processed since it has a higher inode number.</div><div class='del'>-	 * So delete that other dentry.</div><div class='del'>-	 */</div><div class='del'>-	btrfs_dir_item_key_to_cpu(path-&gt;nodes[0], dir_item, &amp;key);</div><div class='del'>-	btrfs_release_path(path);</div><div class='del'>-	other_inode = read_one_inode(root, key.objectid);</div><div class='del'>-	if (!other_inode) {</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	ret = btrfs_unlink_inode(trans, BTRFS_I(dir), BTRFS_I(other_inode),</div><div class='del'>-				 name, namelen);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto out;</div><div class='del'>-	/*</div><div class='del'>-	 * If we dropped the link count to 0, bump it so that later the iput()</div><div class='del'>-	 * on the inode will not free it. We will fixup the link count later.</div><div class='del'>-	 */</div><div class='del'>-	if (other_inode-&gt;i_nlink == 0)</div><div class='del'>-		inc_nlink(other_inode);</div><div class='del'>-</div><div class='del'>-	ret = btrfs_run_delayed_items(trans);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto out;</div><div class='del'>-add_link:</div><div class='del'>-	ret = btrfs_add_link(trans, BTRFS_I(dir), BTRFS_I(inode),</div><div class='del'>-			     name, namelen, 0, ref_index);</div><div class='del'>-out:</div><div class='del'>-	iput(other_inode);</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-</div><div class='add'>+	btrfs_release_path(wc-&gt;subvol_path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * replay one inode back reference item found in the log tree.</div><div class='del'>- * eb, slot and key refer to the buffer and key found in the log tree.</div><div class='del'>- * root is the destination we are replaying into, and path is for temp</div><div class='del'>- * use by this function.  (it should be released on return).</div><div class='add'>+ * Replay one inode back reference item found in the log tree.</div><div class='add'>+ * Path is for temporary use by this function (it should be released on return).</div><div class='ctx'>  */</div><div class='del'>-static noinline int add_inode_ref(struct btrfs_trans_handle *trans,</div><div class='del'>-				  struct btrfs_root *root,</div><div class='del'>-				  struct btrfs_root *log,</div><div class='del'>-				  struct btrfs_path *path,</div><div class='del'>-				  struct extent_buffer *eb, int slot,</div><div class='del'>-				  struct btrfs_key *key)</div><div class='add'>+static noinline int add_inode_ref(struct walk_control *wc)</div><div class='ctx'> {</div><div class='del'>-	struct inode *dir = NULL;</div><div class='del'>-	struct inode *inode = NULL;</div><div class='add'>+	struct btrfs_trans_handle *trans = wc-&gt;trans;</div><div class='add'>+	struct btrfs_root *root = wc-&gt;root;</div><div class='add'>+	struct btrfs_inode *dir = NULL;</div><div class='add'>+	struct btrfs_inode *inode = NULL;</div><div class='ctx'> 	unsigned long ref_ptr;</div><div class='ctx'> 	unsigned long ref_end;</div><div class='del'>-	char *name = NULL;</div><div class='del'>-	int namelen;</div><div class='add'>+	struct fscrypt_str name = { 0 };</div><div class='ctx'> 	int ret;</div><div class='del'>-	int search_done = 0;</div><div class='del'>-	int log_ref_ver = 0;</div><div class='add'>+	const bool is_extref_item = (wc-&gt;log_key.type == BTRFS_INODE_EXTREF_KEY);</div><div class='ctx'> 	u64 parent_objectid;</div><div class='ctx'> 	u64 inode_objectid;</div><div class='ctx'> 	u64 ref_index = 0;</div><div class='ctx'> 	int ref_struct_size;</div><div class='ctx'> </div><div class='del'>-	ref_ptr = btrfs_item_ptr_offset(eb, slot);</div><div class='del'>-	ref_end = ref_ptr + btrfs_item_size_nr(eb, slot);</div><div class='add'>+	ref_ptr = btrfs_item_ptr_offset(wc-&gt;log_leaf, wc-&gt;log_slot);</div><div class='add'>+	ref_end = ref_ptr + btrfs_item_size(wc-&gt;log_leaf, wc-&gt;log_slot);</div><div class='ctx'> </div><div class='del'>-	if (key-&gt;type == BTRFS_INODE_EXTREF_KEY) {</div><div class='add'>+	if (is_extref_item) {</div><div class='ctx'> 		struct btrfs_inode_extref *r;</div><div class='ctx'> </div><div class='ctx'> 		ref_struct_size = sizeof(struct btrfs_inode_extref);</div><div class='del'>-		log_ref_ver = 1;</div><div class='ctx'> 		r = (struct btrfs_inode_extref *)ref_ptr;</div><div class='del'>-		parent_objectid = btrfs_inode_extref_parent(eb, r);</div><div class='add'>+		parent_objectid = btrfs_inode_extref_parent(wc-&gt;log_leaf, r);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		ref_struct_size = sizeof(struct btrfs_inode_ref);</div><div class='del'>-		parent_objectid = key-&gt;offset;</div><div class='add'>+		parent_objectid = wc-&gt;log_key.offset;</div><div class='ctx'> 	}</div><div class='del'>-	inode_objectid = key-&gt;objectid;</div><div class='add'>+	inode_objectid = wc-&gt;log_key.objectid;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * it is possible that we didn't log all the parent directories</div><div class='hunk'>@@ -1524,43 +1600,93 @@ static noinline int add_inode_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * copy the back ref in.  The link count fixup code will take</div><div class='ctx'> 	 * care of the rest</div><div class='ctx'> 	 */</div><div class='del'>-	dir = read_one_inode(root, parent_objectid);</div><div class='del'>-	if (!dir) {</div><div class='del'>-		ret = -ENOENT;</div><div class='add'>+	dir = btrfs_iget_logging(parent_objectid, root);</div><div class='add'>+	if (IS_ERR(dir)) {</div><div class='add'>+		ret = PTR_ERR(dir);</div><div class='add'>+		if (ret == -ENOENT)</div><div class='add'>+			ret = 0;</div><div class='add'>+		else</div><div class='add'>+			btrfs_abort_log_replay(wc, ret,</div><div class='add'>+			       "failed to lookup dir inode %llu root %llu",</div><div class='add'>+					       parent_objectid, btrfs_root_id(root));</div><div class='add'>+		dir = NULL;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	inode = read_one_inode(root, inode_objectid);</div><div class='del'>-	if (!inode) {</div><div class='del'>-		ret = -EIO;</div><div class='add'>+	inode = btrfs_iget_logging(inode_objectid, root);</div><div class='add'>+	if (IS_ERR(inode)) {</div><div class='add'>+		ret = PTR_ERR(inode);</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+				       "failed to lookup inode %llu root %llu",</div><div class='add'>+				       inode_objectid, btrfs_root_id(root));</div><div class='add'>+		inode = NULL;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	while (ref_ptr &lt; ref_end) {</div><div class='del'>-		if (log_ref_ver) {</div><div class='del'>-			ret = extref_get_fields(eb, ref_ptr, &amp;namelen, &amp;name,</div><div class='add'>+		if (is_extref_item) {</div><div class='add'>+			ret = extref_get_fields(wc-&gt;log_leaf, ref_ptr, &amp;name,</div><div class='ctx'> 						&amp;ref_index, &amp;parent_objectid);</div><div class='add'>+			if (ret) {</div><div class='add'>+				btrfs_abort_log_replay(wc, ret,</div><div class='add'>+			       "failed to get extref details for inode %llu root %llu",</div><div class='add'>+						       btrfs_ino(inode),</div><div class='add'>+						       btrfs_root_id(root));</div><div class='add'>+				goto out;</div><div class='add'>+			}</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * parent object can change from one array</div><div class='ctx'> 			 * item to another.</div><div class='ctx'> 			 */</div><div class='del'>-			if (!dir)</div><div class='del'>-				dir = read_one_inode(root, parent_objectid);</div><div class='ctx'> 			if (!dir) {</div><div class='del'>-				ret = -ENOENT;</div><div class='del'>-				goto out;</div><div class='add'>+				dir = btrfs_iget_logging(parent_objectid, root);</div><div class='add'>+				if (IS_ERR(dir)) {</div><div class='add'>+					ret = PTR_ERR(dir);</div><div class='add'>+					dir = NULL;</div><div class='add'>+					/*</div><div class='add'>+					 * A new parent dir may have not been</div><div class='add'>+					 * logged and not exist in the subvolume</div><div class='add'>+					 * tree, see the comment above before</div><div class='add'>+					 * the loop when getting the first</div><div class='add'>+					 * parent dir.</div><div class='add'>+					 */</div><div class='add'>+					if (ret == -ENOENT) {</div><div class='add'>+						/*</div><div class='add'>+						 * The next extref may refer to</div><div class='add'>+						 * another parent dir that</div><div class='add'>+						 * exists, so continue.</div><div class='add'>+						 */</div><div class='add'>+						ret = 0;</div><div class='add'>+						goto next;</div><div class='add'>+					} else {</div><div class='add'>+						btrfs_abort_log_replay(wc, ret,</div><div class='add'>+				       "failed to lookup dir inode %llu root %llu",</div><div class='add'>+								       parent_objectid,</div><div class='add'>+								       btrfs_root_id(root));</div><div class='add'>+					}</div><div class='add'>+					goto out;</div><div class='add'>+				}</div><div class='ctx'> 			}</div><div class='ctx'> 		} else {</div><div class='del'>-			ret = ref_get_fields(eb, ref_ptr, &amp;namelen, &amp;name,</div><div class='del'>-					     &amp;ref_index);</div><div class='add'>+			ret = ref_get_fields(wc-&gt;log_leaf, ref_ptr, &amp;name, &amp;ref_index);</div><div class='add'>+			if (ret) {</div><div class='add'>+				btrfs_abort_log_replay(wc, ret,</div><div class='add'>+	"failed to get ref details for inode %llu parent_objectid %llu root %llu",</div><div class='add'>+						       btrfs_ino(inode),</div><div class='add'>+						       parent_objectid,</div><div class='add'>+						       btrfs_root_id(root));</div><div class='add'>+				goto out;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='del'>-		if (ret)</div><div class='del'>-			goto out;</div><div class='ctx'> </div><div class='del'>-		ret = inode_in_dir(root, path, btrfs_ino(BTRFS_I(dir)),</div><div class='del'>-				   btrfs_ino(BTRFS_I(inode)), ref_index,</div><div class='del'>-				   name, namelen);</div><div class='add'>+		ret = inode_in_dir(root, wc-&gt;subvol_path, btrfs_ino(dir),</div><div class='add'>+				   btrfs_ino(inode), ref_index, &amp;name);</div><div class='ctx'> 		if (ret &lt; 0) {</div><div class='add'>+			btrfs_abort_log_replay(wc, ret,</div><div class='add'>+"failed to check if inode %llu is in dir %llu ref_index %llu name %.*s root %llu",</div><div class='add'>+					       btrfs_ino(inode), btrfs_ino(dir),</div><div class='add'>+					       ref_index, name.len, name.name,</div><div class='add'>+					       btrfs_root_id(root));</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		} else if (ret == 0) {</div><div class='ctx'> 			/*</div><div class='hunk'>@@ -1570,65 +1696,42 @@ static noinline int add_inode_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			 * overwrite any existing back reference, and we don't</div><div class='ctx'> 			 * want to create dangling pointers in the directory.</div><div class='ctx'> 			 */</div><div class='del'>-</div><div class='del'>-			if (!search_done) {</div><div class='del'>-				ret = __add_inode_ref(trans, root, path, log,</div><div class='del'>-						      BTRFS_I(dir),</div><div class='del'>-						      BTRFS_I(inode),</div><div class='del'>-						      inode_objectid,</div><div class='del'>-						      parent_objectid,</div><div class='del'>-						      ref_index, name, namelen,</div><div class='del'>-						      &amp;search_done);</div><div class='del'>-				if (ret) {</div><div class='del'>-					if (ret == 1)</div><div class='del'>-						ret = 0;</div><div class='del'>-					goto out;</div><div class='del'>-				}</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			/*</div><div class='del'>-			 * If a reference item already exists for this inode</div><div class='del'>-			 * with the same parent and name, but different index,</div><div class='del'>-			 * drop it and the corresponding directory index entries</div><div class='del'>-			 * from the parent before adding the new reference item</div><div class='del'>-			 * and dir index entries, otherwise we would fail with</div><div class='del'>-			 * -EEXIST returned from btrfs_add_link() below.</div><div class='del'>-			 */</div><div class='del'>-			ret = btrfs_inode_ref_exists(inode, dir, key-&gt;type,</div><div class='del'>-						     name, namelen);</div><div class='del'>-			if (ret &gt; 0) {</div><div class='del'>-				ret = btrfs_unlink_inode(trans,</div><div class='del'>-							 BTRFS_I(dir),</div><div class='del'>-							 BTRFS_I(inode),</div><div class='del'>-							 name, namelen);</div><div class='del'>-				/*</div><div class='del'>-				 * If we dropped the link count to 0, bump it so</div><div class='del'>-				 * that later the iput() on the inode will not</div><div class='del'>-				 * free it. We will fixup the link count later.</div><div class='del'>-				 */</div><div class='del'>-				if (!ret &amp;&amp; inode-&gt;i_nlink == 0)</div><div class='del'>-					inc_nlink(inode);</div><div class='del'>-			}</div><div class='del'>-			if (ret &lt; 0)</div><div class='add'>+			ret = __add_inode_ref(wc, dir, inode, ref_index, &amp;name);</div><div class='add'>+			if (ret) {</div><div class='add'>+				if (ret == 1)</div><div class='add'>+					ret = 0;</div><div class='ctx'> 				goto out;</div><div class='add'>+			}</div><div class='ctx'> </div><div class='ctx'> 			/* insert our name */</div><div class='del'>-			ret = add_link(trans, dir, inode, name, namelen,</div><div class='del'>-				       ref_index);</div><div class='del'>-			if (ret)</div><div class='add'>+			ret = btrfs_add_link(trans, dir, inode, &amp;name, 0, ref_index);</div><div class='add'>+			if (ret) {</div><div class='add'>+				btrfs_abort_log_replay(wc, ret,</div><div class='add'>+"failed to add link for inode %llu in dir %llu ref_index %llu name %.*s root %llu",</div><div class='add'>+						       btrfs_ino(inode),</div><div class='add'>+						       btrfs_ino(dir), ref_index,</div><div class='add'>+						       name.len, name.name,</div><div class='add'>+						       btrfs_root_id(root));</div><div class='ctx'> 				goto out;</div><div class='add'>+			}</div><div class='ctx'> </div><div class='del'>-			ret = btrfs_update_inode(trans, root, BTRFS_I(inode));</div><div class='del'>-			if (ret)</div><div class='add'>+			ret = btrfs_update_inode(trans, inode);</div><div class='add'>+			if (ret) {</div><div class='add'>+				btrfs_abort_log_replay(wc, ret,</div><div class='add'>+				       "failed to update inode %llu root %llu",</div><div class='add'>+						       btrfs_ino(inode),</div><div class='add'>+						       btrfs_root_id(root));</div><div class='ctx'> 				goto out;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> 		/* Else, ret == 1, we already have a perfect match, we're done. */</div><div class='ctx'> </div><div class='del'>-		ref_ptr = (unsigned long)(ref_ptr + ref_struct_size) + namelen;</div><div class='del'>-		kfree(name);</div><div class='del'>-		name = NULL;</div><div class='del'>-		if (log_ref_ver) {</div><div class='del'>-			iput(dir);</div><div class='add'>+next:</div><div class='add'>+		ref_ptr = (unsigned long)(ref_ptr + ref_struct_size) + name.len;</div><div class='add'>+		kfree(name.name);</div><div class='add'>+		name.name = NULL;</div><div class='add'>+		if (is_extref_item &amp;&amp; dir) {</div><div class='add'>+			iput(&amp;dir-&gt;vfs_inode);</div><div class='ctx'> 			dir = NULL;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1641,23 +1744,23 @@ static noinline int add_inode_ref(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * dir index entries exist for a name but there is no inode reference</div><div class='ctx'> 	 * item with the same name.</div><div class='ctx'> 	 */</div><div class='del'>-	ret = unlink_old_inode_refs(trans, root, path, BTRFS_I(inode), eb, slot,</div><div class='del'>-				    key);</div><div class='add'>+	ret = unlink_old_inode_refs(wc, inode);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	/* finally write the back reference in the inode */</div><div class='del'>-	ret = overwrite_item(trans, root, path, eb, slot, key);</div><div class='add'>+	ret = overwrite_item(wc);</div><div class='ctx'> out:</div><div class='del'>-	btrfs_release_path(path);</div><div class='del'>-	kfree(name);</div><div class='del'>-	iput(dir);</div><div class='del'>-	iput(inode);</div><div class='add'>+	btrfs_release_path(wc-&gt;subvol_path);</div><div class='add'>+	kfree(name.name);</div><div class='add'>+	if (dir)</div><div class='add'>+		iput(&amp;dir-&gt;vfs_inode);</div><div class='add'>+	if (inode)</div><div class='add'>+		iput(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int count_inode_extrefs(struct btrfs_root *root,</div><div class='del'>-		struct btrfs_inode *inode, struct btrfs_path *path)</div><div class='add'>+static int count_inode_extrefs(struct btrfs_inode *inode, struct btrfs_path *path)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int name_len;</div><div class='hunk'>@@ -1671,13 +1774,13 @@ static int count_inode_extrefs(struct btrfs_root *root,</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='del'>-		ret = btrfs_find_one_extref(root, inode_objectid, offset, path,</div><div class='del'>-					    &amp;extref, &amp;offset);</div><div class='add'>+		ret = btrfs_find_one_extref(inode-&gt;root, inode_objectid, offset,</div><div class='add'>+					    path, &amp;extref, &amp;offset);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='ctx'> 		leaf = path-&gt;nodes[0];</div><div class='del'>-		item_size = btrfs_item_size_nr(leaf, path-&gt;slots[0]);</div><div class='add'>+		item_size = btrfs_item_size(leaf, path-&gt;slots[0]);</div><div class='ctx'> 		ptr = btrfs_item_ptr_offset(leaf, path-&gt;slots[0]);</div><div class='ctx'> 		cur_offset = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -1700,8 +1803,7 @@ static int count_inode_extrefs(struct btrfs_root *root,</div><div class='ctx'> 	return nlink;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int count_inode_refs(struct btrfs_root *root,</div><div class='del'>-			struct btrfs_inode *inode, struct btrfs_path *path)</div><div class='add'>+static int count_inode_refs(struct btrfs_inode *inode, struct btrfs_path *path)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='hunk'>@@ -1716,7 +1818,7 @@ static int count_inode_refs(struct btrfs_root *root,</div><div class='ctx'> 	key.offset = (u64)-1;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='del'>-		ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='add'>+		ret = btrfs_search_slot(NULL, inode-&gt;root, &amp;key, path, 0, 0);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			break;</div><div class='ctx'> 		if (ret &gt; 0) {</div><div class='hunk'>@@ -1731,7 +1833,7 @@ process_slot:</div><div class='ctx'> 		    key.type != BTRFS_INODE_REF_KEY)</div><div class='ctx'> 			break;</div><div class='ctx'> 		ptr = btrfs_item_ptr_offset(path-&gt;nodes[0], path-&gt;slots[0]);</div><div class='del'>-		ptr_end = ptr + btrfs_item_size_nr(path-&gt;nodes[0],</div><div class='add'>+		ptr_end = ptr + btrfs_item_size(path-&gt;nodes[0],</div><div class='ctx'> 						   path-&gt;slots[0]);</div><div class='ctx'> 		while (ptr &lt; ptr_end) {</div><div class='ctx'> 			struct btrfs_inode_ref *ref;</div><div class='hunk'>@@ -1767,26 +1869,22 @@ process_slot:</div><div class='ctx'>  * number of back refs found.  If it goes down to zero, the iput</div><div class='ctx'>  * will free the inode.</div><div class='ctx'>  */</div><div class='del'>-static noinline int fixup_inode_link_count(struct btrfs_trans_handle *trans,</div><div class='del'>-					   struct btrfs_root *root,</div><div class='del'>-					   struct inode *inode)</div><div class='add'>+static noinline int fixup_inode_link_count(struct walk_control *wc,</div><div class='add'>+					   struct btrfs_inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	struct btrfs_trans_handle *trans = wc-&gt;trans;</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	u64 nlink = 0;</div><div class='del'>-	u64 ino = btrfs_ino(BTRFS_I(inode));</div><div class='del'>-</div><div class='del'>-	path = btrfs_alloc_path();</div><div class='del'>-	if (!path)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	const u64 ino = btrfs_ino(inode);</div><div class='ctx'> </div><div class='del'>-	ret = count_inode_refs(root, BTRFS_I(inode), path);</div><div class='add'>+	ret = count_inode_refs(inode, wc-&gt;subvol_path);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	nlink = ret;</div><div class='ctx'> </div><div class='del'>-	ret = count_inode_extrefs(root, BTRFS_I(inode), path);</div><div class='add'>+	ret = count_inode_extrefs(inode, wc-&gt;subvol_path);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -1794,18 +1892,18 @@ static noinline int fixup_inode_link_count(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	ret = 0;</div><div class='ctx'> </div><div class='del'>-	if (nlink != inode-&gt;i_nlink) {</div><div class='del'>-		set_nlink(inode, nlink);</div><div class='del'>-		ret = btrfs_update_inode(trans, root, BTRFS_I(inode));</div><div class='add'>+	if (nlink != inode-&gt;vfs_inode.i_nlink) {</div><div class='add'>+		set_nlink(&amp;inode-&gt;vfs_inode, nlink);</div><div class='add'>+		ret = btrfs_update_inode(trans, inode);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='del'>-	BTRFS_I(inode)-&gt;index_cnt = (u64)-1;</div><div class='add'>+	if (S_ISDIR(inode-&gt;vfs_inode.i_mode))</div><div class='add'>+		inode-&gt;index_cnt = (u64)-1;</div><div class='ctx'> </div><div class='del'>-	if (inode-&gt;i_nlink == 0) {</div><div class='del'>-		if (S_ISDIR(inode-&gt;i_mode)) {</div><div class='del'>-			ret = replay_dir_deletes(trans, root, NULL, path,</div><div class='del'>-						 ino, 1);</div><div class='add'>+	if (inode-&gt;vfs_inode.i_nlink == 0) {</div><div class='add'>+		if (S_ISDIR(inode-&gt;vfs_inode.i_mode)) {</div><div class='add'>+			ret = replay_dir_deletes(wc, ino, true);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				goto out;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1815,62 +1913,63 @@ static noinline int fixup_inode_link_count(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='add'>+	btrfs_release_path(wc-&gt;subvol_path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline int fixup_inode_link_counts(struct btrfs_trans_handle *trans,</div><div class='del'>-					    struct btrfs_root *root,</div><div class='del'>-					    struct btrfs_path *path)</div><div class='add'>+static noinline int fixup_inode_link_counts(struct walk_control *wc)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='del'>-	struct inode *inode;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = BTRFS_TREE_LOG_FIXUP_OBJECTID;</div><div class='ctx'> 	key.type = BTRFS_ORPHAN_ITEM_KEY;</div><div class='ctx'> 	key.offset = (u64)-1;</div><div class='ctx'> 	while (1) {</div><div class='del'>-		ret = btrfs_search_slot(trans, root, &amp;key, path, -1, 1);</div><div class='add'>+		struct btrfs_trans_handle *trans = wc-&gt;trans;</div><div class='add'>+		struct btrfs_root *root = wc-&gt;root;</div><div class='add'>+		struct btrfs_inode *inode;</div><div class='add'>+</div><div class='add'>+		ret = btrfs_search_slot(trans, root, &amp;key, wc-&gt;subvol_path, -1, 1);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='ctx'> 		if (ret == 1) {</div><div class='ctx'> 			ret = 0;</div><div class='del'>-			if (path-&gt;slots[0] == 0)</div><div class='add'>+			if (wc-&gt;subvol_path-&gt;slots[0] == 0)</div><div class='ctx'> 				break;</div><div class='del'>-			path-&gt;slots[0]--;</div><div class='add'>+			wc-&gt;subvol_path-&gt;slots[0]--;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, path-&gt;slots[0]);</div><div class='add'>+		btrfs_item_key_to_cpu(wc-&gt;subvol_path-&gt;nodes[0], &amp;key, wc-&gt;subvol_path-&gt;slots[0]);</div><div class='ctx'> 		if (key.objectid != BTRFS_TREE_LOG_FIXUP_OBJECTID ||</div><div class='ctx'> 		    key.type != BTRFS_ORPHAN_ITEM_KEY)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		ret = btrfs_del_item(trans, root, path);</div><div class='add'>+		ret = btrfs_del_item(trans, root, wc-&gt;subvol_path);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		btrfs_release_path(path);</div><div class='del'>-		inode = read_one_inode(root, key.offset);</div><div class='del'>-		if (!inode) {</div><div class='del'>-			ret = -EIO;</div><div class='add'>+		btrfs_release_path(wc-&gt;subvol_path);</div><div class='add'>+		inode = btrfs_iget_logging(key.offset, root);</div><div class='add'>+		if (IS_ERR(inode)) {</div><div class='add'>+			ret = PTR_ERR(inode);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		ret = fixup_inode_link_count(trans, root, inode);</div><div class='del'>-		iput(inode);</div><div class='add'>+		ret = fixup_inode_link_count(wc, inode);</div><div class='add'>+		iput(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * fixup on a directory may create new entries,</div><div class='del'>-		 * make sure we always look for the highset possible</div><div class='add'>+		 * make sure we always look for the highest possible</div><div class='ctx'> 		 * offset</div><div class='ctx'> 		 */</div><div class='ctx'> 		key.offset = (u64)-1;</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_release_path(path);</div><div class='add'>+	btrfs_release_path(wc-&gt;subvol_path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1880,36 +1979,50 @@ static noinline int fixup_inode_link_counts(struct btrfs_trans_handle *trans,</div><div class='ctx'>  * count when replay is done.  The link count is incremented here</div><div class='ctx'>  * so the inode won't go away until we check it</div><div class='ctx'>  */</div><div class='del'>-static noinline int link_to_fixup_dir(struct btrfs_trans_handle *trans,</div><div class='del'>-				      struct btrfs_root *root,</div><div class='del'>-				      struct btrfs_path *path,</div><div class='del'>-				      u64 objectid)</div><div class='add'>+static noinline int link_to_fixup_dir(struct walk_control *wc, u64 objectid)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_trans_handle *trans = wc-&gt;trans;</div><div class='add'>+	struct btrfs_root *root = wc-&gt;root;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	struct inode *inode;</div><div class='del'>-</div><div class='del'>-	inode = read_one_inode(root, objectid);</div><div class='del'>-	if (!inode)</div><div class='del'>-		return -EIO;</div><div class='add'>+	struct btrfs_inode *inode;</div><div class='add'>+	struct inode *vfs_inode;</div><div class='add'>+</div><div class='add'>+	inode = btrfs_iget_logging(objectid, root);</div><div class='add'>+	if (IS_ERR(inode)) {</div><div class='add'>+		ret = PTR_ERR(inode);</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+				       "failed to lookup inode %llu root %llu",</div><div class='add'>+				       objectid, btrfs_root_id(root));</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='add'>+	vfs_inode = &amp;inode-&gt;vfs_inode;</div><div class='ctx'> 	key.objectid = BTRFS_TREE_LOG_FIXUP_OBJECTID;</div><div class='ctx'> 	key.type = BTRFS_ORPHAN_ITEM_KEY;</div><div class='ctx'> 	key.offset = objectid;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_insert_empty_item(trans, root, path, &amp;key, 0);</div><div class='add'>+	ret = btrfs_insert_empty_item(trans, root, wc-&gt;subvol_path, &amp;key, 0);</div><div class='ctx'> </div><div class='del'>-	btrfs_release_path(path);</div><div class='add'>+	btrfs_release_path(wc-&gt;subvol_path);</div><div class='ctx'> 	if (ret == 0) {</div><div class='del'>-		if (!inode-&gt;i_nlink)</div><div class='del'>-			set_nlink(inode, 1);</div><div class='add'>+		if (!vfs_inode-&gt;i_nlink)</div><div class='add'>+			set_nlink(vfs_inode, 1);</div><div class='ctx'> 		else</div><div class='del'>-			inc_nlink(inode);</div><div class='del'>-		ret = btrfs_update_inode(trans, root, BTRFS_I(inode));</div><div class='add'>+			inc_nlink(vfs_inode);</div><div class='add'>+		ret = btrfs_update_inode(trans, inode);</div><div class='add'>+		if (ret)</div><div class='add'>+			btrfs_abort_log_replay(wc, ret,</div><div class='add'>+				       "failed to update inode %llu root %llu",</div><div class='add'>+					       objectid, btrfs_root_id(root));</div><div class='ctx'> 	} else if (ret == -EEXIST) {</div><div class='ctx'> 		ret = 0;</div><div class='add'>+	} else {</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+		       "failed to insert fixup item for inode %llu root %llu",</div><div class='add'>+				       objectid, btrfs_root_id(root));</div><div class='ctx'> 	}</div><div class='del'>-	iput(inode);</div><div class='add'>+	iput(vfs_inode);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -1922,33 +2035,59 @@ static noinline int link_to_fixup_dir(struct btrfs_trans_handle *trans,</div><div class='ctx'> static noinline int insert_one_name(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				    struct btrfs_root *root,</div><div class='ctx'> 				    u64 dirid, u64 index,</div><div class='del'>-				    char *name, int name_len,</div><div class='add'>+				    const struct fscrypt_str *name,</div><div class='ctx'> 				    struct btrfs_key *location)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	struct inode *dir;</div><div class='add'>+	struct btrfs_inode *inode;</div><div class='add'>+	struct btrfs_inode *dir;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	inode = read_one_inode(root, location-&gt;objectid);</div><div class='del'>-	if (!inode)</div><div class='del'>-		return -ENOENT;</div><div class='add'>+	inode = btrfs_iget_logging(location-&gt;objectid, root);</div><div class='add'>+	if (IS_ERR(inode))</div><div class='add'>+		return PTR_ERR(inode);</div><div class='ctx'> </div><div class='del'>-	dir = read_one_inode(root, dirid);</div><div class='del'>-	if (!dir) {</div><div class='del'>-		iput(inode);</div><div class='del'>-		return -EIO;</div><div class='add'>+	dir = btrfs_iget_logging(dirid, root);</div><div class='add'>+	if (IS_ERR(dir)) {</div><div class='add'>+		iput(&amp;inode-&gt;vfs_inode);</div><div class='add'>+		return PTR_ERR(dir);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_add_link(trans, BTRFS_I(dir), BTRFS_I(inode), name,</div><div class='del'>-			name_len, 1, index);</div><div class='add'>+	ret = btrfs_add_link(trans, dir, inode, name, 1, index);</div><div class='ctx'> </div><div class='ctx'> 	/* FIXME, put inode into FIXUP list */</div><div class='ctx'> </div><div class='del'>-	iput(inode);</div><div class='del'>-	iput(dir);</div><div class='add'>+	iput(&amp;inode-&gt;vfs_inode);</div><div class='add'>+	iput(&amp;dir-&gt;vfs_inode);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int delete_conflicting_dir_entry(struct walk_control *wc,</div><div class='add'>+					struct btrfs_inode *dir,</div><div class='add'>+					struct btrfs_dir_item *dst_di,</div><div class='add'>+					const struct btrfs_key *log_key,</div><div class='add'>+					u8 log_flags,</div><div class='add'>+					bool exists)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_key found_key;</div><div class='add'>+</div><div class='add'>+	btrfs_dir_item_key_to_cpu(wc-&gt;subvol_path-&gt;nodes[0], dst_di, &amp;found_key);</div><div class='add'>+	/* The existing dentry points to the same inode, don't delete it. */</div><div class='add'>+	if (found_key.objectid == log_key-&gt;objectid &amp;&amp;</div><div class='add'>+	    found_key.type == log_key-&gt;type &amp;&amp;</div><div class='add'>+	    found_key.offset == log_key-&gt;offset &amp;&amp;</div><div class='add'>+	    btrfs_dir_flags(wc-&gt;subvol_path-&gt;nodes[0], dst_di) == log_flags)</div><div class='add'>+		return 1;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Don't drop the conflicting directory entry if the inode for the new</div><div class='add'>+	 * entry doesn't exist.</div><div class='add'>+	 */</div><div class='add'>+	if (!exists)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	return drop_one_dir_item(wc, dir, dst_di);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * take a single entry in a log directory item and replay it into</div><div class='ctx'>  * the subvolume.</div><div class='hunk'>@@ -1965,119 +2104,123 @@ static noinline int insert_one_name(struct btrfs_trans_handle *trans,</div><div class='ctx'>  * Returns &lt; 0 on error, 0 if the name wasn't replayed (dentry points to a</div><div class='ctx'>  * non-existing inode) and 1 if the name was replayed.</div><div class='ctx'>  */</div><div class='del'>-static noinline int replay_one_name(struct btrfs_trans_handle *trans,</div><div class='del'>-				    struct btrfs_root *root,</div><div class='del'>-				    struct btrfs_path *path,</div><div class='del'>-				    struct extent_buffer *eb,</div><div class='del'>-				    struct btrfs_dir_item *di,</div><div class='del'>-				    struct btrfs_key *key)</div><div class='add'>+static noinline int replay_one_name(struct walk_control *wc, struct btrfs_dir_item *di)</div><div class='ctx'> {</div><div class='del'>-	char *name;</div><div class='del'>-	int name_len;</div><div class='del'>-	struct btrfs_dir_item *dst_di;</div><div class='del'>-	struct btrfs_key found_key;</div><div class='add'>+	struct btrfs_trans_handle *trans = wc-&gt;trans;</div><div class='add'>+	struct btrfs_root *root = wc-&gt;root;</div><div class='add'>+	struct fscrypt_str name = { 0 };</div><div class='add'>+	struct btrfs_dir_item *dir_dst_di;</div><div class='add'>+	struct btrfs_dir_item *index_dst_di;</div><div class='add'>+	bool dir_dst_matches = false;</div><div class='add'>+	bool index_dst_matches = false;</div><div class='ctx'> 	struct btrfs_key log_key;</div><div class='del'>-	struct inode *dir;</div><div class='del'>-	u8 log_type;</div><div class='add'>+	struct btrfs_key search_key;</div><div class='add'>+	struct btrfs_inode *dir;</div><div class='add'>+	u8 log_flags;</div><div class='ctx'> 	bool exists;</div><div class='ctx'> 	int ret;</div><div class='del'>-	bool update_size = (key-&gt;type == BTRFS_DIR_INDEX_KEY);</div><div class='add'>+	bool update_size = true;</div><div class='ctx'> 	bool name_added = false;</div><div class='ctx'> </div><div class='del'>-	dir = read_one_inode(root, key-&gt;objectid);</div><div class='del'>-	if (!dir)</div><div class='del'>-		return -EIO;</div><div class='add'>+	dir = btrfs_iget_logging(wc-&gt;log_key.objectid, root);</div><div class='add'>+	if (IS_ERR(dir)) {</div><div class='add'>+		ret = PTR_ERR(dir);</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+				       "failed to lookup dir inode %llu root %llu",</div><div class='add'>+				       wc-&gt;log_key.objectid, btrfs_root_id(root));</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	name_len = btrfs_dir_name_len(eb, di);</div><div class='del'>-	name = kmalloc(name_len, GFP_NOFS);</div><div class='del'>-	if (!name) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='add'>+	ret = read_alloc_one_name(wc-&gt;log_leaf, di + 1,</div><div class='add'>+				  btrfs_dir_name_len(wc-&gt;log_leaf, di), &amp;name);</div><div class='add'>+	if (ret) {</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+			       "failed to allocate name for dir %llu root %llu",</div><div class='add'>+				       btrfs_ino(dir), btrfs_root_id(root));</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	log_type = btrfs_dir_type(eb, di);</div><div class='del'>-	read_extent_buffer(eb, name, (unsigned long)(di + 1),</div><div class='del'>-		   name_len);</div><div class='del'>-</div><div class='del'>-	btrfs_dir_item_key_to_cpu(eb, di, &amp;log_key);</div><div class='del'>-	ret = btrfs_lookup_inode(trans, root, path, &amp;log_key, 0);</div><div class='del'>-	btrfs_release_path(path);</div><div class='del'>-	if (ret &lt; 0)</div><div class='add'>+	log_flags = btrfs_dir_flags(wc-&gt;log_leaf, di);</div><div class='add'>+	btrfs_dir_item_key_to_cpu(wc-&gt;log_leaf, di, &amp;log_key);</div><div class='add'>+	ret = btrfs_lookup_inode(trans, root, wc-&gt;subvol_path, &amp;log_key, 0);</div><div class='add'>+	btrfs_release_path(wc-&gt;subvol_path);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+				       "failed to lookup inode %llu root %llu",</div><div class='add'>+				       log_key.objectid, btrfs_root_id(root));</div><div class='ctx'> 		goto out;</div><div class='add'>+	}</div><div class='ctx'> 	exists = (ret == 0);</div><div class='ctx'> 	ret = 0;</div><div class='ctx'> </div><div class='del'>-	if (key-&gt;type == BTRFS_DIR_ITEM_KEY) {</div><div class='del'>-		dst_di = btrfs_lookup_dir_item(trans, root, path, key-&gt;objectid,</div><div class='del'>-				       name, name_len, 1);</div><div class='del'>-	} else if (key-&gt;type == BTRFS_DIR_INDEX_KEY) {</div><div class='del'>-		dst_di = btrfs_lookup_dir_index_item(trans, root, path,</div><div class='del'>-						     key-&gt;objectid,</div><div class='del'>-						     key-&gt;offset, name,</div><div class='del'>-						     name_len, 1);</div><div class='del'>-	} else {</div><div class='del'>-		/* Corruption */</div><div class='del'>-		ret = -EINVAL;</div><div class='add'>+	dir_dst_di = btrfs_lookup_dir_item(trans, root, wc-&gt;subvol_path,</div><div class='add'>+					   wc-&gt;log_key.objectid, &amp;name, 1);</div><div class='add'>+	if (IS_ERR(dir_dst_di)) {</div><div class='add'>+		ret = PTR_ERR(dir_dst_di);</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+		       "failed to lookup dir item for dir %llu name %.*s root %llu",</div><div class='add'>+				       wc-&gt;log_key.objectid, name.len, name.name,</div><div class='add'>+				       btrfs_root_id(root));</div><div class='ctx'> 		goto out;</div><div class='add'>+	} else if (dir_dst_di) {</div><div class='add'>+		ret = delete_conflicting_dir_entry(wc, dir, dir_dst_di,</div><div class='add'>+						   &amp;log_key, log_flags, exists);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			btrfs_abort_log_replay(wc, ret,</div><div class='add'>+	       "failed to delete conflicting entry for dir %llu name %.*s root %llu",</div><div class='add'>+					       btrfs_ino(dir), name.len, name.name,</div><div class='add'>+					       btrfs_root_id(root));</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		dir_dst_matches = (ret == 1);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (IS_ERR(dst_di)) {</div><div class='del'>-		ret = PTR_ERR(dst_di);</div><div class='add'>+	btrfs_release_path(wc-&gt;subvol_path);</div><div class='add'>+</div><div class='add'>+	index_dst_di = btrfs_lookup_dir_index_item(trans, root, wc-&gt;subvol_path,</div><div class='add'>+						   wc-&gt;log_key.objectid,</div><div class='add'>+						   wc-&gt;log_key.offset, &amp;name, 1);</div><div class='add'>+	if (IS_ERR(index_dst_di)) {</div><div class='add'>+		ret = PTR_ERR(index_dst_di);</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+	       "failed to lookup dir index item for dir %llu name %.*s root %llu",</div><div class='add'>+				       wc-&gt;log_key.objectid, name.len, name.name,</div><div class='add'>+				       btrfs_root_id(root));</div><div class='ctx'> 		goto out;</div><div class='del'>-	} else if (!dst_di) {</div><div class='del'>-		/* we need a sequence number to insert, so we only</div><div class='del'>-		 * do inserts for the BTRFS_DIR_INDEX_KEY types</div><div class='del'>-		 */</div><div class='del'>-		if (key-&gt;type != BTRFS_DIR_INDEX_KEY)</div><div class='add'>+	} else if (index_dst_di) {</div><div class='add'>+		ret = delete_conflicting_dir_entry(wc, dir, index_dst_di,</div><div class='add'>+						   &amp;log_key, log_flags, exists);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			btrfs_abort_log_replay(wc, ret,</div><div class='add'>+	       "failed to delete conflicting entry for dir %llu name %.*s root %llu",</div><div class='add'>+					       btrfs_ino(dir), name.len, name.name,</div><div class='add'>+					       btrfs_root_id(root));</div><div class='ctx'> 			goto out;</div><div class='del'>-		goto insert;</div><div class='add'>+		}</div><div class='add'>+		index_dst_matches = (ret == 1);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_dir_item_key_to_cpu(path-&gt;nodes[0], dst_di, &amp;found_key);</div><div class='del'>-	/* the existing item matches the logged item */</div><div class='del'>-	if (found_key.objectid == log_key.objectid &amp;&amp;</div><div class='del'>-	    found_key.type == log_key.type &amp;&amp;</div><div class='del'>-	    found_key.offset == log_key.offset &amp;&amp;</div><div class='del'>-	    btrfs_dir_type(path-&gt;nodes[0], dst_di) == log_type) {</div><div class='del'>-		update_size = false;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	btrfs_release_path(wc-&gt;subvol_path);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * don't drop the conflicting directory entry if the inode</div><div class='del'>-	 * for the new entry doesn't exist</div><div class='del'>-	 */</div><div class='del'>-	if (!exists)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	ret = drop_one_dir_item(trans, path, BTRFS_I(dir), dst_di);</div><div class='del'>-	if (ret)</div><div class='add'>+	if (dir_dst_matches &amp;&amp; index_dst_matches) {</div><div class='add'>+		ret = 0;</div><div class='add'>+		update_size = false;</div><div class='ctx'> 		goto out;</div><div class='del'>-</div><div class='del'>-	if (key-&gt;type == BTRFS_DIR_INDEX_KEY)</div><div class='del'>-		goto insert;</div><div class='del'>-out:</div><div class='del'>-	btrfs_release_path(path);</div><div class='del'>-	if (!ret &amp;&amp; update_size) {</div><div class='del'>-		btrfs_i_size_write(BTRFS_I(dir), dir-&gt;i_size + name_len * 2);</div><div class='del'>-		ret = btrfs_update_inode(trans, root, BTRFS_I(dir));</div><div class='ctx'> 	}</div><div class='del'>-	kfree(name);</div><div class='del'>-	iput(dir);</div><div class='del'>-	if (!ret &amp;&amp; name_added)</div><div class='del'>-		ret = 1;</div><div class='del'>-	return ret;</div><div class='ctx'> </div><div class='del'>-insert:</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Check if the inode reference exists in the log for the given name,</div><div class='ctx'> 	 * inode and parent inode</div><div class='ctx'> 	 */</div><div class='del'>-	found_key.objectid = log_key.objectid;</div><div class='del'>-	found_key.type = BTRFS_INODE_REF_KEY;</div><div class='del'>-	found_key.offset = key-&gt;objectid;</div><div class='del'>-	ret = backref_in_log(root-&gt;log_root, &amp;found_key, 0, name, name_len);</div><div class='add'>+	search_key.objectid = log_key.objectid;</div><div class='add'>+	search_key.type = BTRFS_INODE_REF_KEY;</div><div class='add'>+	search_key.offset = wc-&gt;log_key.objectid;</div><div class='add'>+	ret = backref_in_log(root-&gt;log_root, &amp;search_key, 0, &amp;name);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+"failed to check if ref item is logged for inode %llu dir %llu name %.*s root %llu",</div><div class='add'>+				       search_key.objectid, btrfs_ino(dir),</div><div class='add'>+				       name.len, name.name, btrfs_root_id(root));</div><div class='ctx'> 	        goto out;</div><div class='ctx'> 	} else if (ret) {</div><div class='ctx'> 	        /* The dentry will be added later. */</div><div class='hunk'>@@ -2086,12 +2229,15 @@ insert:</div><div class='ctx'> 	        goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	found_key.objectid = log_key.objectid;</div><div class='del'>-	found_key.type = BTRFS_INODE_EXTREF_KEY;</div><div class='del'>-	found_key.offset = key-&gt;objectid;</div><div class='del'>-	ret = backref_in_log(root-&gt;log_root, &amp;found_key, key-&gt;objectid, name,</div><div class='del'>-			     name_len);</div><div class='add'>+	search_key.objectid = log_key.objectid;</div><div class='add'>+	search_key.type = BTRFS_INODE_EXTREF_KEY;</div><div class='add'>+	search_key.offset = btrfs_extref_hash(wc-&gt;log_key.objectid, name.name, name.len);</div><div class='add'>+	ret = backref_in_log(root-&gt;log_root, &amp;search_key, wc-&gt;log_key.objectid, &amp;name);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+"failed to check if extref item is logged for inode %llu dir %llu name %.*s root %llu",</div><div class='add'>+				       search_key.objectid, btrfs_ino(dir),</div><div class='add'>+				       name.len, name.name, btrfs_root_id(root));</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	} else if (ret) {</div><div class='ctx'> 		/* The dentry will be added later. */</div><div class='hunk'>@@ -2099,96 +2245,84 @@ insert:</div><div class='ctx'> 		update_size = false;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_release_path(path);</div><div class='del'>-	ret = insert_one_name(trans, root, key-&gt;objectid, key-&gt;offset,</div><div class='del'>-			      name, name_len, &amp;log_key);</div><div class='del'>-	if (ret &amp;&amp; ret != -ENOENT &amp;&amp; ret != -EEXIST)</div><div class='add'>+	ret = insert_one_name(trans, root, wc-&gt;log_key.objectid, wc-&gt;log_key.offset,</div><div class='add'>+			      &amp;name, &amp;log_key);</div><div class='add'>+	if (ret &amp;&amp; ret != -ENOENT &amp;&amp; ret != -EEXIST) {</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+		       "failed to insert name %.*s for inode %llu dir %llu root %llu",</div><div class='add'>+				       name.len, name.name, log_key.objectid,</div><div class='add'>+				       btrfs_ino(dir), btrfs_root_id(root));</div><div class='ctx'> 		goto out;</div><div class='add'>+	}</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		name_added = true;</div><div class='ctx'> 	update_size = false;</div><div class='ctx'> 	ret = 0;</div><div class='del'>-	goto out;</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	if (!ret &amp;&amp; update_size) {</div><div class='add'>+		btrfs_i_size_write(dir, dir-&gt;vfs_inode.i_size + name.len * 2);</div><div class='add'>+		ret = btrfs_update_inode(trans, dir);</div><div class='add'>+		if (ret)</div><div class='add'>+			btrfs_abort_log_replay(wc, ret,</div><div class='add'>+				       "failed to update dir inode %llu root %llu",</div><div class='add'>+					       btrfs_ino(dir), btrfs_root_id(root));</div><div class='add'>+	}</div><div class='add'>+	kfree(name.name);</div><div class='add'>+	iput(&amp;dir-&gt;vfs_inode);</div><div class='add'>+	if (!ret &amp;&amp; name_added)</div><div class='add'>+		ret = 1;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * find all the names in a directory item and reconcile them into</div><div class='del'>- * the subvolume.  Only BTRFS_DIR_ITEM_KEY types will have more than</div><div class='del'>- * one name in a directory item, but the same code gets used for</div><div class='del'>- * both directory index types</div><div class='del'>- */</div><div class='del'>-static noinline int replay_one_dir_item(struct btrfs_trans_handle *trans,</div><div class='del'>-					struct btrfs_root *root,</div><div class='del'>-					struct btrfs_path *path,</div><div class='del'>-					struct extent_buffer *eb, int slot,</div><div class='del'>-					struct btrfs_key *key)</div><div class='add'>+/* Replay one dir item from a BTRFS_DIR_INDEX_KEY key. */</div><div class='add'>+static noinline int replay_one_dir_item(struct walk_control *wc)</div><div class='ctx'> {</div><div class='del'>-	int ret = 0;</div><div class='del'>-	u32 item_size = btrfs_item_size_nr(eb, slot);</div><div class='add'>+	int ret;</div><div class='ctx'> 	struct btrfs_dir_item *di;</div><div class='del'>-	int name_len;</div><div class='del'>-	unsigned long ptr;</div><div class='del'>-	unsigned long ptr_end;</div><div class='del'>-	struct btrfs_path *fixup_path = NULL;</div><div class='ctx'> </div><div class='del'>-	ptr = btrfs_item_ptr_offset(eb, slot);</div><div class='del'>-	ptr_end = ptr + item_size;</div><div class='del'>-	while (ptr &lt; ptr_end) {</div><div class='del'>-		di = (struct btrfs_dir_item *)ptr;</div><div class='del'>-		name_len = btrfs_dir_name_len(eb, di);</div><div class='del'>-		ret = replay_one_name(trans, root, path, eb, di, key);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			break;</div><div class='del'>-		ptr = (unsigned long)(di + 1);</div><div class='del'>-		ptr += name_len;</div><div class='add'>+	/* We only log dir index keys, which only contain a single dir item. */</div><div class='add'>+	ASSERT(wc-&gt;log_key.type == BTRFS_DIR_INDEX_KEY,</div><div class='add'>+	       "wc-&gt;log_key.type=%u", wc-&gt;log_key.type);</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * If this entry refers to a non-directory (directories can not</div><div class='del'>-		 * have a link count &gt; 1) and it was added in the transaction</div><div class='del'>-		 * that was not committed, make sure we fixup the link count of</div><div class='del'>-		 * the inode it the entry points to. Otherwise something like</div><div class='del'>-		 * the following would result in a directory pointing to an</div><div class='del'>-		 * inode with a wrong link that does not account for this dir</div><div class='del'>-		 * entry:</div><div class='del'>-		 *</div><div class='del'>-		 * mkdir testdir</div><div class='del'>-		 * touch testdir/foo</div><div class='del'>-		 * touch testdir/bar</div><div class='del'>-		 * sync</div><div class='del'>-		 *</div><div class='del'>-		 * ln testdir/bar testdir/bar_link</div><div class='del'>-		 * ln testdir/foo testdir/foo_link</div><div class='del'>-		 * xfs_io -c "fsync" testdir/bar</div><div class='del'>-		 *</div><div class='del'>-		 * &lt;power failure&gt;</div><div class='del'>-		 *</div><div class='del'>-		 * mount fs, log replay happens</div><div class='del'>-		 *</div><div class='del'>-		 * File foo would remain with a link count of 1 when it has two</div><div class='del'>-		 * entries pointing to it in the directory testdir. This would</div><div class='del'>-		 * make it impossible to ever delete the parent directory has</div><div class='del'>-		 * it would result in stale dentries that can never be deleted.</div><div class='del'>-		 */</div><div class='del'>-		if (ret == 1 &amp;&amp; btrfs_dir_type(eb, di) != BTRFS_FT_DIR) {</div><div class='del'>-			struct btrfs_key di_key;</div><div class='add'>+	di = btrfs_item_ptr(wc-&gt;log_leaf, wc-&gt;log_slot, struct btrfs_dir_item);</div><div class='add'>+	ret = replay_one_name(wc, di);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-			if (!fixup_path) {</div><div class='del'>-				fixup_path = btrfs_alloc_path();</div><div class='del'>-				if (!fixup_path) {</div><div class='del'>-					ret = -ENOMEM;</div><div class='del'>-					break;</div><div class='del'>-				}</div><div class='del'>-			}</div><div class='add'>+	/*</div><div class='add'>+	 * If this entry refers to a non-directory (directories can not have a</div><div class='add'>+	 * link count &gt; 1) and it was added in the transaction that was not</div><div class='add'>+	 * committed, make sure we fixup the link count of the inode the entry</div><div class='add'>+	 * points to. Otherwise something like the following would result in a</div><div class='add'>+	 * directory pointing to an inode with a wrong link that does not account</div><div class='add'>+	 * for this dir entry:</div><div class='add'>+	 *</div><div class='add'>+	 * mkdir testdir</div><div class='add'>+	 * touch testdir/foo</div><div class='add'>+	 * touch testdir/bar</div><div class='add'>+	 * sync</div><div class='add'>+	 *</div><div class='add'>+	 * ln testdir/bar testdir/bar_link</div><div class='add'>+	 * ln testdir/foo testdir/foo_link</div><div class='add'>+	 * xfs_io -c "fsync" testdir/bar</div><div class='add'>+	 *</div><div class='add'>+	 * &lt;power failure&gt;</div><div class='add'>+	 *</div><div class='add'>+	 * mount fs, log replay happens</div><div class='add'>+	 *</div><div class='add'>+	 * File foo would remain with a link count of 1 when it has two entries</div><div class='add'>+	 * pointing to it in the directory testdir. This would make it impossible</div><div class='add'>+	 * to ever delete the parent directory has it would result in stale</div><div class='add'>+	 * dentries that can never be deleted.</div><div class='add'>+	 */</div><div class='add'>+	if (ret == 1 &amp;&amp; btrfs_dir_ftype(wc-&gt;log_leaf, di) != BTRFS_FT_DIR) {</div><div class='add'>+		struct btrfs_key di_key;</div><div class='ctx'> </div><div class='del'>-			btrfs_dir_item_key_to_cpu(eb, di, &amp;di_key);</div><div class='del'>-			ret = link_to_fixup_dir(trans, root, fixup_path,</div><div class='del'>-						di_key.objectid);</div><div class='del'>-			if (ret)</div><div class='del'>-				break;</div><div class='del'>-		}</div><div class='del'>-		ret = 0;</div><div class='add'>+		btrfs_dir_item_key_to_cpu(wc-&gt;log_leaf, di, &amp;di_key);</div><div class='add'>+		ret = link_to_fixup_dir(wc, di_key.objectid);</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_free_path(fixup_path);</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2205,7 +2339,7 @@ static noinline int replay_one_dir_item(struct btrfs_trans_handle *trans,</div><div class='ctx'>  */</div><div class='ctx'> static noinline int find_dir_range(struct btrfs_root *root,</div><div class='ctx'> 				   struct btrfs_path *path,</div><div class='del'>-				   u64 dirid, int key_type,</div><div class='add'>+				   u64 dirid,</div><div class='ctx'> 				   u64 *start_ret, u64 *end_ret)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_key key;</div><div class='hunk'>@@ -2218,7 +2352,7 @@ static noinline int find_dir_range(struct btrfs_root *root,</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = dirid;</div><div class='del'>-	key.type = key_type;</div><div class='add'>+	key.type = BTRFS_DIR_LOG_INDEX_KEY;</div><div class='ctx'> 	key.offset = *start_ret;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='hunk'>@@ -2232,7 +2366,7 @@ static noinline int find_dir_range(struct btrfs_root *root,</div><div class='ctx'> 	if (ret != 0)</div><div class='ctx'> 		btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, path-&gt;slots[0]);</div><div class='ctx'> </div><div class='del'>-	if (key.type != key_type || key.objectid != dirid) {</div><div class='add'>+	if (key.type != BTRFS_DIR_LOG_INDEX_KEY || key.objectid != dirid) {</div><div class='ctx'> 		ret = 1;</div><div class='ctx'> 		goto next;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2259,7 +2393,7 @@ next:</div><div class='ctx'> </div><div class='ctx'> 	btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, path-&gt;slots[0]);</div><div class='ctx'> </div><div class='del'>-	if (key.type != key_type || key.objectid != dirid) {</div><div class='add'>+	if (key.type != BTRFS_DIR_LOG_INDEX_KEY || key.objectid != dirid) {</div><div class='ctx'> 		ret = 1;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2279,162 +2413,157 @@ out:</div><div class='ctx'>  * item is not in the log, the item is removed and the inode it points</div><div class='ctx'>  * to is unlinked</div><div class='ctx'>  */</div><div class='del'>-static noinline int check_item_in_log(struct btrfs_trans_handle *trans,</div><div class='del'>-				      struct btrfs_root *log,</div><div class='del'>-				      struct btrfs_path *path,</div><div class='add'>+static noinline int check_item_in_log(struct walk_control *wc,</div><div class='ctx'> 				      struct btrfs_path *log_path,</div><div class='del'>-				      struct inode *dir,</div><div class='del'>-				      struct btrfs_key *dir_key)</div><div class='add'>+				      struct btrfs_inode *dir,</div><div class='add'>+				      struct btrfs_key *dir_key,</div><div class='add'>+				      bool force_remove)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *root = BTRFS_I(dir)-&gt;root;</div><div class='add'>+	struct btrfs_trans_handle *trans = wc-&gt;trans;</div><div class='add'>+	struct btrfs_root *root = dir-&gt;root;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='ctx'> 	int slot;</div><div class='del'>-	u32 item_size;</div><div class='ctx'> 	struct btrfs_dir_item *di;</div><div class='del'>-	struct btrfs_dir_item *log_di;</div><div class='del'>-	int name_len;</div><div class='del'>-	unsigned long ptr;</div><div class='del'>-	unsigned long ptr_end;</div><div class='del'>-	char *name;</div><div class='del'>-	struct inode *inode;</div><div class='add'>+	struct fscrypt_str name = { 0 };</div><div class='add'>+	struct btrfs_inode *inode = NULL;</div><div class='ctx'> 	struct btrfs_key location;</div><div class='ctx'> </div><div class='del'>-again:</div><div class='del'>-	eb = path-&gt;nodes[0];</div><div class='del'>-	slot = path-&gt;slots[0];</div><div class='del'>-	item_size = btrfs_item_size_nr(eb, slot);</div><div class='del'>-	ptr = btrfs_item_ptr_offset(eb, slot);</div><div class='del'>-	ptr_end = ptr + item_size;</div><div class='del'>-	while (ptr &lt; ptr_end) {</div><div class='del'>-		di = (struct btrfs_dir_item *)ptr;</div><div class='del'>-		name_len = btrfs_dir_name_len(eb, di);</div><div class='del'>-		name = kmalloc(name_len, GFP_NOFS);</div><div class='del'>-		if (!name) {</div><div class='del'>-			ret = -ENOMEM;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		read_extent_buffer(eb, name, (unsigned long)(di + 1),</div><div class='del'>-				  name_len);</div><div class='del'>-		log_di = NULL;</div><div class='del'>-		if (log &amp;&amp; dir_key-&gt;type == BTRFS_DIR_ITEM_KEY) {</div><div class='del'>-			log_di = btrfs_lookup_dir_item(trans, log, log_path,</div><div class='del'>-						       dir_key-&gt;objectid,</div><div class='del'>-						       name, name_len, 0);</div><div class='del'>-		} else if (log &amp;&amp; dir_key-&gt;type == BTRFS_DIR_INDEX_KEY) {</div><div class='del'>-			log_di = btrfs_lookup_dir_index_item(trans, log,</div><div class='del'>-						     log_path,</div><div class='del'>-						     dir_key-&gt;objectid,</div><div class='del'>-						     dir_key-&gt;offset,</div><div class='del'>-						     name, name_len, 0);</div><div class='del'>-		}</div><div class='del'>-		if (!log_di) {</div><div class='del'>-			btrfs_dir_item_key_to_cpu(eb, di, &amp;location);</div><div class='del'>-			btrfs_release_path(path);</div><div class='del'>-			btrfs_release_path(log_path);</div><div class='del'>-			inode = read_one_inode(root, location.objectid);</div><div class='del'>-			if (!inode) {</div><div class='del'>-				kfree(name);</div><div class='del'>-				return -EIO;</div><div class='del'>-			}</div><div class='add'>+	/*</div><div class='add'>+	 * Currently we only log dir index keys. Even if we replay a log created</div><div class='add'>+	 * by an older kernel that logged both dir index and dir item keys, all</div><div class='add'>+	 * we need to do is process the dir index keys, we (and our caller) can</div><div class='add'>+	 * safely ignore dir item keys (key type BTRFS_DIR_ITEM_KEY).</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(dir_key-&gt;type == BTRFS_DIR_INDEX_KEY, "dir_key-&gt;type=%u", dir_key-&gt;type);</div><div class='ctx'> </div><div class='del'>-			ret = link_to_fixup_dir(trans, root,</div><div class='del'>-						path, location.objectid);</div><div class='del'>-			if (ret) {</div><div class='del'>-				kfree(name);</div><div class='del'>-				iput(inode);</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='add'>+	eb = wc-&gt;subvol_path-&gt;nodes[0];</div><div class='add'>+	slot = wc-&gt;subvol_path-&gt;slots[0];</div><div class='add'>+	di = btrfs_item_ptr(eb, slot, struct btrfs_dir_item);</div><div class='add'>+	ret = read_alloc_one_name(eb, di + 1, btrfs_dir_name_len(eb, di), &amp;name);</div><div class='add'>+	if (ret) {</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+		       "failed to allocate name for dir %llu index %llu root %llu",</div><div class='add'>+				       btrfs_ino(dir), dir_key-&gt;offset,</div><div class='add'>+				       btrfs_root_id(root));</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-			inc_nlink(inode);</div><div class='del'>-			ret = btrfs_unlink_inode(trans, BTRFS_I(dir),</div><div class='del'>-					BTRFS_I(inode), name, name_len);</div><div class='del'>-			if (!ret)</div><div class='del'>-				ret = btrfs_run_delayed_items(trans);</div><div class='del'>-			kfree(name);</div><div class='del'>-			iput(inode);</div><div class='del'>-			if (ret)</div><div class='del'>-				goto out;</div><div class='add'>+	if (!force_remove) {</div><div class='add'>+		struct btrfs_dir_item *log_di;</div><div class='ctx'> </div><div class='del'>-			/* there might still be more names under this key</div><div class='del'>-			 * check and repeat if required</div><div class='del'>-			 */</div><div class='del'>-			ret = btrfs_search_slot(NULL, root, dir_key, path,</div><div class='del'>-						0, 0);</div><div class='del'>-			if (ret == 0)</div><div class='del'>-				goto again;</div><div class='add'>+		log_di = btrfs_lookup_dir_index_item(trans, wc-&gt;log, log_path,</div><div class='add'>+						     dir_key-&gt;objectid,</div><div class='add'>+						     dir_key-&gt;offset, &amp;name, 0);</div><div class='add'>+		if (IS_ERR(log_di)) {</div><div class='add'>+			ret = PTR_ERR(log_di);</div><div class='add'>+			btrfs_abort_log_replay(wc, ret,</div><div class='add'>+	"failed to lookup dir index item for dir %llu index %llu name %.*s root %llu",</div><div class='add'>+					       btrfs_ino(dir), dir_key-&gt;offset,</div><div class='add'>+					       name.len, name.name,</div><div class='add'>+					       btrfs_root_id(root));</div><div class='add'>+			goto out;</div><div class='add'>+		} else if (log_di) {</div><div class='add'>+			/* The dentry exists in the log, we have nothing to do. */</div><div class='ctx'> 			ret = 0;</div><div class='ctx'> 			goto out;</div><div class='del'>-		} else if (IS_ERR(log_di)) {</div><div class='del'>-			kfree(name);</div><div class='del'>-			return PTR_ERR(log_di);</div><div class='ctx'> 		}</div><div class='del'>-		btrfs_release_path(log_path);</div><div class='del'>-		kfree(name);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		ptr = (unsigned long)(di + 1);</div><div class='del'>-		ptr += name_len;</div><div class='add'>+	btrfs_dir_item_key_to_cpu(eb, di, &amp;location);</div><div class='add'>+	btrfs_release_path(wc-&gt;subvol_path);</div><div class='add'>+	btrfs_release_path(log_path);</div><div class='add'>+	inode = btrfs_iget_logging(location.objectid, root);</div><div class='add'>+	if (IS_ERR(inode)) {</div><div class='add'>+		ret = PTR_ERR(inode);</div><div class='add'>+		inode = NULL;</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+				       "failed to lookup inode %llu root %llu",</div><div class='add'>+				       location.objectid, btrfs_root_id(root));</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	ret = 0;</div><div class='add'>+</div><div class='add'>+	ret = link_to_fixup_dir(wc, location.objectid);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	inc_nlink(&amp;inode-&gt;vfs_inode);</div><div class='add'>+	ret = unlink_inode_for_log_replay(wc, dir, inode, &amp;name);</div><div class='add'>+	/*</div><div class='add'>+	 * Unlike dir item keys, dir index keys can only have one name (entry) in</div><div class='add'>+	 * them, as there are no key collisions since each key has a unique offset</div><div class='add'>+	 * (an index number), so we're done.</div><div class='add'>+	 */</div><div class='ctx'> out:</div><div class='del'>-	btrfs_release_path(path);</div><div class='add'>+	btrfs_release_path(wc-&gt;subvol_path);</div><div class='ctx'> 	btrfs_release_path(log_path);</div><div class='add'>+	kfree(name.name);</div><div class='add'>+	if (inode)</div><div class='add'>+		iput(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int replay_xattr_deletes(struct btrfs_trans_handle *trans,</div><div class='del'>-			      struct btrfs_root *root,</div><div class='del'>-			      struct btrfs_root *log,</div><div class='del'>-			      struct btrfs_path *path,</div><div class='del'>-			      const u64 ino)</div><div class='add'>+static int replay_xattr_deletes(struct walk_control *wc)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_trans_handle *trans = wc-&gt;trans;</div><div class='add'>+	struct btrfs_root *root = wc-&gt;root;</div><div class='add'>+	struct btrfs_root *log = wc-&gt;log;</div><div class='ctx'> 	struct btrfs_key search_key;</div><div class='del'>-	struct btrfs_path *log_path;</div><div class='del'>-	int i;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(log_path);</div><div class='add'>+	const u64 ino = wc-&gt;log_key.objectid;</div><div class='ctx'> 	int nritems;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	log_path = btrfs_alloc_path();</div><div class='del'>-	if (!log_path)</div><div class='add'>+	if (!log_path) {</div><div class='add'>+		btrfs_abort_log_replay(wc, -ENOMEM, "failed to allocate path");</div><div class='ctx'> 		return -ENOMEM;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	search_key.objectid = ino;</div><div class='ctx'> 	search_key.type = BTRFS_XATTR_ITEM_KEY;</div><div class='ctx'> 	search_key.offset = 0;</div><div class='ctx'> again:</div><div class='del'>-	ret = btrfs_search_slot(NULL, root, &amp;search_key, path, 0, 0);</div><div class='del'>-	if (ret &lt; 0)</div><div class='add'>+	ret = btrfs_search_slot(NULL, root, &amp;search_key, wc-&gt;subvol_path, 0, 0);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+			       "failed to search xattrs for inode %llu root %llu",</div><div class='add'>+				       ino, btrfs_root_id(root));</div><div class='ctx'> 		goto out;</div><div class='add'>+	}</div><div class='ctx'> process_leaf:</div><div class='del'>-	nritems = btrfs_header_nritems(path-&gt;nodes[0]);</div><div class='del'>-	for (i = path-&gt;slots[0]; i &lt; nritems; i++) {</div><div class='add'>+	nritems = btrfs_header_nritems(wc-&gt;subvol_path-&gt;nodes[0]);</div><div class='add'>+	for (int i = wc-&gt;subvol_path-&gt;slots[0]; i &lt; nritems; i++) {</div><div class='ctx'> 		struct btrfs_key key;</div><div class='ctx'> 		struct btrfs_dir_item *di;</div><div class='ctx'> 		struct btrfs_dir_item *log_di;</div><div class='ctx'> 		u32 total_size;</div><div class='ctx'> 		u32 cur;</div><div class='ctx'> </div><div class='del'>-		btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, i);</div><div class='add'>+		btrfs_item_key_to_cpu(wc-&gt;subvol_path-&gt;nodes[0], &amp;key, i);</div><div class='ctx'> 		if (key.objectid != ino || key.type != BTRFS_XATTR_ITEM_KEY) {</div><div class='ctx'> 			ret = 0;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		di = btrfs_item_ptr(path-&gt;nodes[0], i, struct btrfs_dir_item);</div><div class='del'>-		total_size = btrfs_item_size_nr(path-&gt;nodes[0], i);</div><div class='add'>+		di = btrfs_item_ptr(wc-&gt;subvol_path-&gt;nodes[0], i, struct btrfs_dir_item);</div><div class='add'>+		total_size = btrfs_item_size(wc-&gt;subvol_path-&gt;nodes[0], i);</div><div class='ctx'> 		cur = 0;</div><div class='ctx'> 		while (cur &lt; total_size) {</div><div class='del'>-			u16 name_len = btrfs_dir_name_len(path-&gt;nodes[0], di);</div><div class='del'>-			u16 data_len = btrfs_dir_data_len(path-&gt;nodes[0], di);</div><div class='add'>+			u16 name_len = btrfs_dir_name_len(wc-&gt;subvol_path-&gt;nodes[0], di);</div><div class='add'>+			u16 data_len = btrfs_dir_data_len(wc-&gt;subvol_path-&gt;nodes[0], di);</div><div class='ctx'> 			u32 this_len = sizeof(*di) + name_len + data_len;</div><div class='ctx'> 			char *name;</div><div class='ctx'> </div><div class='ctx'> 			name = kmalloc(name_len, GFP_NOFS);</div><div class='ctx'> 			if (!name) {</div><div class='ctx'> 				ret = -ENOMEM;</div><div class='add'>+				btrfs_abort_log_replay(wc, ret,</div><div class='add'>+				       "failed to allocate memory for name of length %u",</div><div class='add'>+						       name_len);</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='del'>-			read_extent_buffer(path-&gt;nodes[0], name,</div><div class='add'>+			read_extent_buffer(wc-&gt;subvol_path-&gt;nodes[0], name,</div><div class='ctx'> 					   (unsigned long)(di + 1), name_len);</div><div class='ctx'> </div><div class='ctx'> 			log_di = btrfs_lookup_xattr(NULL, log, log_path, ino,</div><div class='hunk'>@@ -2442,40 +2571,59 @@ process_leaf:</div><div class='ctx'> 			btrfs_release_path(log_path);</div><div class='ctx'> 			if (!log_di) {</div><div class='ctx'> 				/* Doesn't exist in log tree, so delete it. */</div><div class='del'>-				btrfs_release_path(path);</div><div class='del'>-				di = btrfs_lookup_xattr(trans, root, path, ino,</div><div class='add'>+				btrfs_release_path(wc-&gt;subvol_path);</div><div class='add'>+				di = btrfs_lookup_xattr(trans, root, wc-&gt;subvol_path, ino,</div><div class='ctx'> 							name, name_len, -1);</div><div class='del'>-				kfree(name);</div><div class='ctx'> 				if (IS_ERR(di)) {</div><div class='ctx'> 					ret = PTR_ERR(di);</div><div class='add'>+					btrfs_abort_log_replay(wc, ret,</div><div class='add'>+		       "failed to lookup xattr with name %.*s for inode %llu root %llu",</div><div class='add'>+							       name_len, name, ino,</div><div class='add'>+							       btrfs_root_id(root));</div><div class='add'>+					kfree(name);</div><div class='ctx'> 					goto out;</div><div class='ctx'> 				}</div><div class='ctx'> 				ASSERT(di);</div><div class='ctx'> 				ret = btrfs_delete_one_dir_name(trans, root,</div><div class='del'>-								path, di);</div><div class='del'>-				if (ret)</div><div class='add'>+								wc-&gt;subvol_path, di);</div><div class='add'>+				if (ret) {</div><div class='add'>+					btrfs_abort_log_replay(wc, ret,</div><div class='add'>+		       "failed to delete xattr with name %.*s for inode %llu root %llu",</div><div class='add'>+							       name_len, name, ino,</div><div class='add'>+							       btrfs_root_id(root));</div><div class='add'>+					kfree(name);</div><div class='ctx'> 					goto out;</div><div class='del'>-				btrfs_release_path(path);</div><div class='add'>+				}</div><div class='add'>+				btrfs_release_path(wc-&gt;subvol_path);</div><div class='add'>+				kfree(name);</div><div class='ctx'> 				search_key = key;</div><div class='ctx'> 				goto again;</div><div class='ctx'> 			}</div><div class='del'>-			kfree(name);</div><div class='ctx'> 			if (IS_ERR(log_di)) {</div><div class='ctx'> 				ret = PTR_ERR(log_di);</div><div class='add'>+				btrfs_abort_log_replay(wc, ret,</div><div class='add'>+	"failed to lookup xattr in log tree with name %.*s for inode %llu root %llu",</div><div class='add'>+						       name_len, name, ino,</div><div class='add'>+						       btrfs_root_id(root));</div><div class='add'>+				kfree(name);</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='add'>+			kfree(name);</div><div class='ctx'> 			cur += this_len;</div><div class='ctx'> 			di = (struct btrfs_dir_item *)((char *)di + this_len);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	ret = btrfs_next_leaf(root, path);</div><div class='add'>+	ret = btrfs_next_leaf(root, wc-&gt;subvol_path);</div><div class='ctx'> 	if (ret &gt; 0)</div><div class='ctx'> 		ret = 0;</div><div class='ctx'> 	else if (ret == 0)</div><div class='ctx'> 		goto process_leaf;</div><div class='add'>+	else</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+			       "failed to get next leaf in subvolume root %llu",</div><div class='add'>+				       btrfs_root_id(root));</div><div class='ctx'> out:</div><div class='del'>-	btrfs_free_path(log_path);</div><div class='del'>-	btrfs_release_path(path);</div><div class='add'>+	btrfs_release_path(wc-&gt;subvol_path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2490,103 +2638,113 @@ out:</div><div class='ctx'>  * Anything we don't find in the log is unlinked and removed from the</div><div class='ctx'>  * directory.</div><div class='ctx'>  */</div><div class='del'>-static noinline int replay_dir_deletes(struct btrfs_trans_handle *trans,</div><div class='del'>-				       struct btrfs_root *root,</div><div class='del'>-				       struct btrfs_root *log,</div><div class='del'>-				       struct btrfs_path *path,</div><div class='del'>-				       u64 dirid, int del_all)</div><div class='add'>+static noinline int replay_dir_deletes(struct walk_control *wc,</div><div class='add'>+				       u64 dirid, bool del_all)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_root *root = wc-&gt;root;</div><div class='add'>+	struct btrfs_root *log = (del_all ? NULL : wc-&gt;log);</div><div class='ctx'> 	u64 range_start;</div><div class='ctx'> 	u64 range_end;</div><div class='del'>-	int key_type = BTRFS_DIR_LOG_ITEM_KEY;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	struct btrfs_key dir_key;</div><div class='ctx'> 	struct btrfs_key found_key;</div><div class='del'>-	struct btrfs_path *log_path;</div><div class='del'>-	struct inode *dir;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(log_path);</div><div class='add'>+	struct btrfs_inode *dir;</div><div class='ctx'> </div><div class='ctx'> 	dir_key.objectid = dirid;</div><div class='del'>-	dir_key.type = BTRFS_DIR_ITEM_KEY;</div><div class='add'>+	dir_key.type = BTRFS_DIR_INDEX_KEY;</div><div class='ctx'> 	log_path = btrfs_alloc_path();</div><div class='del'>-	if (!log_path)</div><div class='add'>+	if (!log_path) {</div><div class='add'>+		btrfs_abort_log_replay(wc, -ENOMEM, "failed to allocate path");</div><div class='ctx'> 		return -ENOMEM;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	dir = read_one_inode(root, dirid);</div><div class='del'>-	/* it isn't an error if the inode isn't there, that can happen</div><div class='del'>-	 * because we replay the deletes before we copy in the inode item</div><div class='del'>-	 * from the log</div><div class='add'>+	dir = btrfs_iget_logging(dirid, root);</div><div class='add'>+	/*</div><div class='add'>+	 * It isn't an error if the inode isn't there, that can happen because</div><div class='add'>+	 * we replay the deletes before we copy in the inode item from the log.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!dir) {</div><div class='del'>-		btrfs_free_path(log_path);</div><div class='del'>-		return 0;</div><div class='add'>+	if (IS_ERR(dir)) {</div><div class='add'>+		ret = PTR_ERR(dir);</div><div class='add'>+		if (ret == -ENOENT)</div><div class='add'>+			ret = 0;</div><div class='add'>+		else</div><div class='add'>+			btrfs_abort_log_replay(wc, ret,</div><div class='add'>+			       "failed to lookup dir inode %llu root %llu",</div><div class='add'>+					       dirid, btrfs_root_id(root));</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='del'>-again:</div><div class='add'>+</div><div class='ctx'> 	range_start = 0;</div><div class='ctx'> 	range_end = 0;</div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		if (del_all)</div><div class='ctx'> 			range_end = (u64)-1;</div><div class='ctx'> 		else {</div><div class='del'>-			ret = find_dir_range(log, path, dirid, key_type,</div><div class='add'>+			ret = find_dir_range(log, wc-&gt;subvol_path, dirid,</div><div class='ctx'> 					     &amp;range_start, &amp;range_end);</div><div class='del'>-			if (ret &lt; 0)</div><div class='add'>+			if (ret &lt; 0) {</div><div class='add'>+				btrfs_abort_log_replay(wc, ret,</div><div class='add'>+			       "failed to find range for dir %llu in log tree root %llu",</div><div class='add'>+						       dirid, btrfs_root_id(root));</div><div class='ctx'> 				goto out;</div><div class='del'>-			else if (ret &gt; 0)</div><div class='add'>+			} else if (ret &gt; 0) {</div><div class='ctx'> 				break;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		dir_key.offset = range_start;</div><div class='ctx'> 		while (1) {</div><div class='ctx'> 			int nritems;</div><div class='del'>-			ret = btrfs_search_slot(NULL, root, &amp;dir_key, path,</div><div class='del'>-						0, 0);</div><div class='del'>-			if (ret &lt; 0)</div><div class='add'>+			ret = btrfs_search_slot(NULL, root, &amp;dir_key,</div><div class='add'>+						wc-&gt;subvol_path, 0, 0);</div><div class='add'>+			if (ret &lt; 0) {</div><div class='add'>+				btrfs_abort_log_replay(wc, ret,</div><div class='add'>+			       "failed to search root %llu for key " BTRFS_KEY_FMT,</div><div class='add'>+						       btrfs_root_id(root),</div><div class='add'>+						       BTRFS_KEY_FMT_VALUE(&amp;dir_key));</div><div class='ctx'> 				goto out;</div><div class='add'>+			}</div><div class='ctx'> </div><div class='del'>-			nritems = btrfs_header_nritems(path-&gt;nodes[0]);</div><div class='del'>-			if (path-&gt;slots[0] &gt;= nritems) {</div><div class='del'>-				ret = btrfs_next_leaf(root, path);</div><div class='del'>-				if (ret == 1)</div><div class='add'>+			nritems = btrfs_header_nritems(wc-&gt;subvol_path-&gt;nodes[0]);</div><div class='add'>+			if (wc-&gt;subvol_path-&gt;slots[0] &gt;= nritems) {</div><div class='add'>+				ret = btrfs_next_leaf(root, wc-&gt;subvol_path);</div><div class='add'>+				if (ret == 1) {</div><div class='ctx'> 					break;</div><div class='del'>-				else if (ret &lt; 0)</div><div class='add'>+				} else if (ret &lt; 0) {</div><div class='add'>+					btrfs_abort_log_replay(wc, ret,</div><div class='add'>+				       "failed to get next leaf in subvolume root %llu",</div><div class='add'>+							       btrfs_root_id(root));</div><div class='ctx'> 					goto out;</div><div class='add'>+				}</div><div class='ctx'> 			}</div><div class='del'>-			btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;found_key,</div><div class='del'>-					      path-&gt;slots[0]);</div><div class='add'>+			btrfs_item_key_to_cpu(wc-&gt;subvol_path-&gt;nodes[0], &amp;found_key,</div><div class='add'>+					      wc-&gt;subvol_path-&gt;slots[0]);</div><div class='ctx'> 			if (found_key.objectid != dirid ||</div><div class='del'>-			    found_key.type != dir_key.type)</div><div class='del'>-				goto next_type;</div><div class='add'>+			    found_key.type != dir_key.type) {</div><div class='add'>+				ret = 0;</div><div class='add'>+				goto out;</div><div class='add'>+			}</div><div class='ctx'> </div><div class='ctx'> 			if (found_key.offset &gt; range_end)</div><div class='ctx'> 				break;</div><div class='ctx'> </div><div class='del'>-			ret = check_item_in_log(trans, log, path,</div><div class='del'>-						log_path, dir,</div><div class='del'>-						&amp;found_key);</div><div class='add'>+			ret = check_item_in_log(wc, log_path, dir, &amp;found_key, del_all);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			if (found_key.offset == (u64)-1)</div><div class='ctx'> 				break;</div><div class='ctx'> 			dir_key.offset = found_key.offset + 1;</div><div class='ctx'> 		}</div><div class='del'>-		btrfs_release_path(path);</div><div class='add'>+		btrfs_release_path(wc-&gt;subvol_path);</div><div class='ctx'> 		if (range_end == (u64)-1)</div><div class='ctx'> 			break;</div><div class='ctx'> 		range_start = range_end + 1;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-next_type:</div><div class='ctx'> 	ret = 0;</div><div class='del'>-	if (key_type == BTRFS_DIR_LOG_ITEM_KEY) {</div><div class='del'>-		key_type = BTRFS_DIR_LOG_INDEX_KEY;</div><div class='del'>-		dir_key.type = BTRFS_DIR_INDEX_KEY;</div><div class='del'>-		btrfs_release_path(path);</div><div class='del'>-		goto again;</div><div class='del'>-	}</div><div class='ctx'> out:</div><div class='del'>-	btrfs_release_path(path);</div><div class='del'>-	btrfs_free_path(log_path);</div><div class='del'>-	iput(dir);</div><div class='add'>+	btrfs_release_path(wc-&gt;subvol_path);</div><div class='add'>+	iput(&amp;dir-&gt;vfs_inode);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2601,48 +2759,70 @@ out:</div><div class='ctx'>  * only in the log (references come from either directory items or inode</div><div class='ctx'>  * back refs).</div><div class='ctx'>  */</div><div class='del'>-static int replay_one_buffer(struct btrfs_root *log, struct extent_buffer *eb,</div><div class='add'>+static int replay_one_buffer(struct extent_buffer *eb,</div><div class='ctx'> 			     struct walk_control *wc, u64 gen, int level)</div><div class='ctx'> {</div><div class='ctx'> 	int nritems;</div><div class='del'>-	struct btrfs_path *path;</div><div class='del'>-	struct btrfs_root *root = wc-&gt;replay_dest;</div><div class='del'>-	struct btrfs_key key;</div><div class='del'>-	int i;</div><div class='add'>+	struct btrfs_tree_parent_check check = {</div><div class='add'>+		.transid = gen,</div><div class='add'>+		.level = level</div><div class='add'>+	};</div><div class='add'>+	struct btrfs_root *root = wc-&gt;root;</div><div class='add'>+	struct btrfs_trans_handle *trans = wc-&gt;trans;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_read_buffer(eb, gen, level, NULL);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	level = btrfs_header_level(eb);</div><div class='del'>-</div><div class='ctx'> 	if (level != 0)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	path = btrfs_alloc_path();</div><div class='del'>-	if (!path)</div><div class='add'>+	/*</div><div class='add'>+	 * Set to NULL since it was not yet read and in case we abort log replay</div><div class='add'>+	 * on error, we have no valid log tree leaf to dump.</div><div class='add'>+	 */</div><div class='add'>+	wc-&gt;log_leaf = NULL;</div><div class='add'>+	ret = btrfs_read_extent_buffer(eb, &amp;check);</div><div class='add'>+	if (ret) {</div><div class='add'>+		btrfs_abort_log_replay(wc, ret,</div><div class='add'>+		       "failed to read log tree leaf %llu for root %llu",</div><div class='add'>+				       eb-&gt;start, btrfs_root_id(root));</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ASSERT(wc-&gt;subvol_path == NULL);</div><div class='add'>+	wc-&gt;subvol_path = btrfs_alloc_path();</div><div class='add'>+	if (!wc-&gt;subvol_path) {</div><div class='add'>+		btrfs_abort_log_replay(wc, -ENOMEM, "failed to allocate path");</div><div class='ctx'> 		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	wc-&gt;log_leaf = eb;</div><div class='ctx'> </div><div class='ctx'> 	nritems = btrfs_header_nritems(eb);</div><div class='del'>-	for (i = 0; i &lt; nritems; i++) {</div><div class='del'>-		btrfs_item_key_to_cpu(eb, &amp;key, i);</div><div class='add'>+	for (wc-&gt;log_slot = 0; wc-&gt;log_slot &lt; nritems; wc-&gt;log_slot++) {</div><div class='add'>+		struct btrfs_inode_item *inode_item;</div><div class='ctx'> </div><div class='del'>-		/* inode keys are done during the first stage */</div><div class='del'>-		if (key.type == BTRFS_INODE_ITEM_KEY &amp;&amp;</div><div class='del'>-		    wc-&gt;stage == LOG_WALK_REPLAY_INODES) {</div><div class='del'>-			struct btrfs_inode_item *inode_item;</div><div class='del'>-			u32 mode;</div><div class='add'>+		btrfs_item_key_to_cpu(eb, &amp;wc-&gt;log_key, wc-&gt;log_slot);</div><div class='ctx'> </div><div class='del'>-			inode_item = btrfs_item_ptr(eb, i,</div><div class='del'>-					    struct btrfs_inode_item);</div><div class='add'>+		if (wc-&gt;log_key.type == BTRFS_INODE_ITEM_KEY) {</div><div class='add'>+			inode_item = btrfs_item_ptr(eb, wc-&gt;log_slot,</div><div class='add'>+						    struct btrfs_inode_item);</div><div class='ctx'> 			/*</div><div class='del'>-			 * If we have a tmpfile (O_TMPFILE) that got fsync'ed</div><div class='del'>-			 * and never got linked before the fsync, skip it, as</div><div class='del'>-			 * replaying it is pointless since it would be deleted</div><div class='del'>-			 * later. We skip logging tmpfiles, but it's always</div><div class='del'>-			 * possible we are replaying a log created with a kernel</div><div class='del'>-			 * that used to log tmpfiles.</div><div class='add'>+			 * An inode with no links is either:</div><div class='add'>+			 *</div><div class='add'>+			 * 1) A tmpfile (O_TMPFILE) that got fsync'ed and never</div><div class='add'>+			 *    got linked before the fsync, skip it, as replaying</div><div class='add'>+			 *    it is pointless since it would be deleted later.</div><div class='add'>+			 *    We skip logging tmpfiles, but it's always possible</div><div class='add'>+			 *    we are replaying a log created with a kernel that</div><div class='add'>+			 *    used to log tmpfiles;</div><div class='add'>+			 *</div><div class='add'>+			 * 2) A non-tmpfile which got its last link deleted</div><div class='add'>+			 *    while holding an open fd on it and later got</div><div class='add'>+			 *    fsynced through that fd. We always log the</div><div class='add'>+			 *    parent inodes when inode-&gt;last_unlink_trans is</div><div class='add'>+			 *    set to the current transaction, so ignore all the</div><div class='add'>+			 *    inode items for this inode. We will delete the</div><div class='add'>+			 *    inode when processing the parent directory with</div><div class='add'>+			 *    replay_dir_deletes().</div><div class='ctx'> 			 */</div><div class='ctx'> 			if (btrfs_inode_nlink(eb, inode_item) == 0) {</div><div class='ctx'> 				wc-&gt;ignore_cur_inode = true;</div><div class='hunk'>@@ -2650,19 +2830,23 @@ static int replay_one_buffer(struct btrfs_root *log, struct extent_buffer *eb,</div><div class='ctx'> 			} else {</div><div class='ctx'> 				wc-&gt;ignore_cur_inode = false;</div><div class='ctx'> 			}</div><div class='del'>-			ret = replay_xattr_deletes(wc-&gt;trans, root, log,</div><div class='del'>-						   path, key.objectid);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* Inode keys are done during the first stage. */</div><div class='add'>+		if (wc-&gt;log_key.type == BTRFS_INODE_ITEM_KEY &amp;&amp;</div><div class='add'>+		    wc-&gt;stage == LOG_WALK_REPLAY_INODES) {</div><div class='add'>+			u32 mode;</div><div class='add'>+</div><div class='add'>+			ret = replay_xattr_deletes(wc);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				break;</div><div class='ctx'> 			mode = btrfs_inode_mode(eb, inode_item);</div><div class='ctx'> 			if (S_ISDIR(mode)) {</div><div class='del'>-				ret = replay_dir_deletes(wc-&gt;trans,</div><div class='del'>-					 root, log, path, key.objectid, 0);</div><div class='add'>+				ret = replay_dir_deletes(wc, wc-&gt;log_key.objectid, false);</div><div class='ctx'> 				if (ret)</div><div class='ctx'> 					break;</div><div class='ctx'> 			}</div><div class='del'>-			ret = overwrite_item(wc-&gt;trans, root, path,</div><div class='del'>-					     eb, i, &amp;key);</div><div class='add'>+			ret = overwrite_item(wc);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				break;</div><div class='ctx'> </div><div class='hunk'>@@ -2676,36 +2860,48 @@ static int replay_one_buffer(struct btrfs_root *log, struct extent_buffer *eb,</div><div class='ctx'> 			 */</div><div class='ctx'> 			if (S_ISREG(mode)) {</div><div class='ctx'> 				struct btrfs_drop_extents_args drop_args = { 0 };</div><div class='del'>-				struct inode *inode;</div><div class='add'>+				struct btrfs_inode *inode;</div><div class='ctx'> 				u64 from;</div><div class='ctx'> </div><div class='del'>-				inode = read_one_inode(root, key.objectid);</div><div class='del'>-				if (!inode) {</div><div class='del'>-					ret = -EIO;</div><div class='add'>+				inode = btrfs_iget_logging(wc-&gt;log_key.objectid, root);</div><div class='add'>+				if (IS_ERR(inode)) {</div><div class='add'>+					ret = PTR_ERR(inode);</div><div class='add'>+					btrfs_abort_log_replay(wc, ret,</div><div class='add'>+					       "failed to lookup inode %llu root %llu",</div><div class='add'>+							       wc-&gt;log_key.objectid,</div><div class='add'>+							       btrfs_root_id(root));</div><div class='ctx'> 					break;</div><div class='ctx'> 				}</div><div class='del'>-				from = ALIGN(i_size_read(inode),</div><div class='add'>+				from = ALIGN(i_size_read(&amp;inode-&gt;vfs_inode),</div><div class='ctx'> 					     root-&gt;fs_info-&gt;sectorsize);</div><div class='ctx'> 				drop_args.start = from;</div><div class='ctx'> 				drop_args.end = (u64)-1;</div><div class='ctx'> 				drop_args.drop_cache = true;</div><div class='del'>-				ret = btrfs_drop_extents(wc-&gt;trans, root,</div><div class='del'>-							 BTRFS_I(inode),</div><div class='del'>-							 &amp;drop_args);</div><div class='del'>-				if (!ret) {</div><div class='del'>-					inode_sub_bytes(inode,</div><div class='add'>+				drop_args.path = wc-&gt;subvol_path;</div><div class='add'>+				ret = btrfs_drop_extents(trans, root, inode,  &amp;drop_args);</div><div class='add'>+				if (ret) {</div><div class='add'>+					btrfs_abort_log_replay(wc, ret,</div><div class='add'>+		       "failed to drop extents for inode %llu root %llu offset %llu",</div><div class='add'>+							       btrfs_ino(inode),</div><div class='add'>+							       btrfs_root_id(root),</div><div class='add'>+							       from);</div><div class='add'>+				} else {</div><div class='add'>+					inode_sub_bytes(&amp;inode-&gt;vfs_inode,</div><div class='ctx'> 							drop_args.bytes_found);</div><div class='ctx'> 					/* Update the inode's nbytes. */</div><div class='del'>-					ret = btrfs_update_inode(wc-&gt;trans,</div><div class='del'>-							root, BTRFS_I(inode));</div><div class='add'>+					ret = btrfs_update_inode(trans, inode);</div><div class='add'>+					if (ret)</div><div class='add'>+						btrfs_abort_log_replay(wc, ret,</div><div class='add'>+					       "failed to update inode %llu root %llu",</div><div class='add'>+								       btrfs_ino(inode),</div><div class='add'>+								       btrfs_root_id(root));</div><div class='ctx'> 				}</div><div class='del'>-				iput(inode);</div><div class='add'>+				iput(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> 				if (ret)</div><div class='ctx'> 					break;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			ret = link_to_fixup_dir(wc-&gt;trans, root,</div><div class='del'>-						path, key.objectid);</div><div class='add'>+			ret = link_to_fixup_dir(wc, wc-&gt;log_key.objectid);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				break;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2713,10 +2909,9 @@ static int replay_one_buffer(struct btrfs_root *log, struct extent_buffer *eb,</div><div class='ctx'> 		if (wc-&gt;ignore_cur_inode)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		if (key.type == BTRFS_DIR_INDEX_KEY &amp;&amp;</div><div class='add'>+		if (wc-&gt;log_key.type == BTRFS_DIR_INDEX_KEY &amp;&amp;</div><div class='ctx'> 		    wc-&gt;stage == LOG_WALK_REPLAY_DIR_INDEX) {</div><div class='del'>-			ret = replay_one_dir_item(wc-&gt;trans, root, path,</div><div class='del'>-						  eb, i, &amp;key);</div><div class='add'>+			ret = replay_one_dir_item(wc);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				break;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2725,72 +2920,84 @@ static int replay_one_buffer(struct btrfs_root *log, struct extent_buffer *eb,</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		/* these keys are simply copied */</div><div class='del'>-		if (key.type == BTRFS_XATTR_ITEM_KEY) {</div><div class='del'>-			ret = overwrite_item(wc-&gt;trans, root, path,</div><div class='del'>-					     eb, i, &amp;key);</div><div class='add'>+		if (wc-&gt;log_key.type == BTRFS_XATTR_ITEM_KEY) {</div><div class='add'>+			ret = overwrite_item(wc);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				break;</div><div class='del'>-		} else if (key.type == BTRFS_INODE_REF_KEY ||</div><div class='del'>-			   key.type == BTRFS_INODE_EXTREF_KEY) {</div><div class='del'>-			ret = add_inode_ref(wc-&gt;trans, root, log, path,</div><div class='del'>-					    eb, i, &amp;key);</div><div class='del'>-			if (ret &amp;&amp; ret != -ENOENT)</div><div class='del'>-				break;</div><div class='del'>-			ret = 0;</div><div class='del'>-		} else if (key.type == BTRFS_EXTENT_DATA_KEY) {</div><div class='del'>-			ret = replay_one_extent(wc-&gt;trans, root, path,</div><div class='del'>-						eb, i, &amp;key);</div><div class='add'>+		} else if (wc-&gt;log_key.type == BTRFS_INODE_REF_KEY ||</div><div class='add'>+			   wc-&gt;log_key.type == BTRFS_INODE_EXTREF_KEY) {</div><div class='add'>+			ret = add_inode_ref(wc);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				break;</div><div class='del'>-		} else if (key.type == BTRFS_DIR_ITEM_KEY) {</div><div class='del'>-			ret = replay_one_dir_item(wc-&gt;trans, root, path,</div><div class='del'>-						  eb, i, &amp;key);</div><div class='add'>+		} else if (wc-&gt;log_key.type == BTRFS_EXTENT_DATA_KEY) {</div><div class='add'>+			ret = replay_one_extent(wc);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				break;</div><div class='ctx'> 		}</div><div class='add'>+		/*</div><div class='add'>+		 * We don't log BTRFS_DIR_ITEM_KEY keys anymore, only the</div><div class='add'>+		 * BTRFS_DIR_INDEX_KEY items which we use to derive the</div><div class='add'>+		 * BTRFS_DIR_ITEM_KEY items. If we are replaying a log from an</div><div class='add'>+		 * older kernel with such keys, ignore them.</div><div class='add'>+		 */</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_free_path(path);</div><div class='add'>+	btrfs_free_path(wc-&gt;subvol_path);</div><div class='add'>+	wc-&gt;subvol_path = NULL;</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Correctly adjust the reserved bytes occupied by a log tree extent buffer</div><div class='del'>- */</div><div class='del'>-static void unaccount_log_buffer(struct btrfs_fs_info *fs_info, u64 start)</div><div class='add'>+static int clean_log_buffer(struct btrfs_trans_handle *trans,</div><div class='add'>+			    struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_block_group *cache;</div><div class='add'>+	struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='add'>+	struct btrfs_block_group *bg;</div><div class='ctx'> </div><div class='del'>-	cache = btrfs_lookup_block_group(fs_info, start);</div><div class='del'>-	if (!cache) {</div><div class='del'>-		btrfs_err(fs_info, "unable to find block group for %llu", start);</div><div class='del'>-		return;</div><div class='add'>+	btrfs_tree_lock(eb);</div><div class='add'>+	btrfs_clear_buffer_dirty(trans, eb);</div><div class='add'>+	wait_on_extent_buffer_writeback(eb);</div><div class='add'>+	btrfs_tree_unlock(eb);</div><div class='add'>+</div><div class='add'>+	if (trans) {</div><div class='add'>+		int ret;</div><div class='add'>+</div><div class='add'>+		ret = btrfs_pin_reserved_extent(trans, eb);</div><div class='add'>+		if (ret)</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;cache-&gt;space_info-&gt;lock);</div><div class='del'>-	spin_lock(&amp;cache-&gt;lock);</div><div class='del'>-	cache-&gt;reserved -= fs_info-&gt;nodesize;</div><div class='del'>-	cache-&gt;space_info-&gt;bytes_reserved -= fs_info-&gt;nodesize;</div><div class='del'>-	spin_unlock(&amp;cache-&gt;lock);</div><div class='del'>-	spin_unlock(&amp;cache-&gt;space_info-&gt;lock);</div><div class='add'>+	bg = btrfs_lookup_block_group(fs_info, eb-&gt;start);</div><div class='add'>+	if (!bg) {</div><div class='add'>+		btrfs_err(fs_info, "unable to find block group for %llu", eb-&gt;start);</div><div class='add'>+		btrfs_handle_fs_error(fs_info, -ENOENT, NULL);</div><div class='add'>+		return -ENOENT;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;bg-&gt;space_info-&gt;lock);</div><div class='add'>+	spin_lock(&amp;bg-&gt;lock);</div><div class='add'>+	bg-&gt;reserved -= fs_info-&gt;nodesize;</div><div class='add'>+	bg-&gt;space_info-&gt;bytes_reserved -= fs_info-&gt;nodesize;</div><div class='add'>+	spin_unlock(&amp;bg-&gt;lock);</div><div class='add'>+	spin_unlock(&amp;bg-&gt;space_info-&gt;lock);</div><div class='add'>+</div><div class='add'>+	btrfs_put_block_group(bg);</div><div class='ctx'> </div><div class='del'>-	btrfs_put_block_group(cache);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline int walk_down_log_tree(struct btrfs_trans_handle *trans,</div><div class='del'>-				   struct btrfs_root *root,</div><div class='del'>-				   struct btrfs_path *path, int *level,</div><div class='del'>-				   struct walk_control *wc)</div><div class='add'>+static noinline int walk_down_log_tree(struct btrfs_path *path, int *level,</div><div class='add'>+				       struct walk_control *wc)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='add'>+	struct btrfs_trans_handle *trans = wc-&gt;trans;</div><div class='add'>+	struct btrfs_fs_info *fs_info = wc-&gt;log-&gt;fs_info;</div><div class='ctx'> 	u64 bytenr;</div><div class='ctx'> 	u64 ptr_gen;</div><div class='ctx'> 	struct extent_buffer *next;</div><div class='ctx'> 	struct extent_buffer *cur;</div><div class='del'>-	u32 blocksize;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	while (*level &gt; 0) {</div><div class='del'>-		struct btrfs_key first_key;</div><div class='add'>+		struct btrfs_tree_parent_check check = { 0 };</div><div class='ctx'> </div><div class='ctx'> 		cur = path-&gt;nodes[*level];</div><div class='ctx'> </div><div class='hunk'>@@ -2802,18 +3009,25 @@ static noinline int walk_down_log_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 		bytenr = btrfs_node_blockptr(cur, path-&gt;slots[*level]);</div><div class='ctx'> 		ptr_gen = btrfs_node_ptr_generation(cur, path-&gt;slots[*level]);</div><div class='del'>-		btrfs_node_key_to_cpu(cur, &amp;first_key, path-&gt;slots[*level]);</div><div class='del'>-		blocksize = fs_info-&gt;nodesize;</div><div class='add'>+		check.transid = ptr_gen;</div><div class='add'>+		check.level = *level - 1;</div><div class='add'>+		check.has_first_key = true;</div><div class='add'>+		btrfs_node_key_to_cpu(cur, &amp;check.first_key, path-&gt;slots[*level]);</div><div class='ctx'> </div><div class='ctx'> 		next = btrfs_find_create_tree_block(fs_info, bytenr,</div><div class='ctx'> 						    btrfs_header_owner(cur),</div><div class='ctx'> 						    *level - 1);</div><div class='del'>-		if (IS_ERR(next))</div><div class='del'>-			return PTR_ERR(next);</div><div class='add'>+		if (IS_ERR(next)) {</div><div class='add'>+			ret = PTR_ERR(next);</div><div class='add'>+			if (trans)</div><div class='add'>+				btrfs_abort_transaction(trans, ret);</div><div class='add'>+			else</div><div class='add'>+				btrfs_handle_fs_error(fs_info, ret, NULL);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		if (*level == 1) {</div><div class='del'>-			ret = wc-&gt;process_func(root, next, wc, ptr_gen,</div><div class='del'>-					       *level - 1);</div><div class='add'>+			ret = wc-&gt;process_func(next, wc, ptr_gen, *level - 1);</div><div class='ctx'> 			if (ret) {</div><div class='ctx'> 				free_extent_buffer(next);</div><div class='ctx'> 				return ret;</div><div class='hunk'>@@ -2821,38 +3035,32 @@ static noinline int walk_down_log_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 			path-&gt;slots[*level]++;</div><div class='ctx'> 			if (wc-&gt;free) {</div><div class='del'>-				ret = btrfs_read_buffer(next, ptr_gen,</div><div class='del'>-							*level - 1, &amp;first_key);</div><div class='add'>+				ret = btrfs_read_extent_buffer(next, &amp;check);</div><div class='ctx'> 				if (ret) {</div><div class='ctx'> 					free_extent_buffer(next);</div><div class='add'>+					if (trans)</div><div class='add'>+						btrfs_abort_transaction(trans, ret);</div><div class='add'>+					else</div><div class='add'>+						btrfs_handle_fs_error(fs_info, ret, NULL);</div><div class='ctx'> 					return ret;</div><div class='ctx'> 				}</div><div class='ctx'> </div><div class='del'>-				if (trans) {</div><div class='del'>-					btrfs_tree_lock(next);</div><div class='del'>-					btrfs_clean_tree_block(next);</div><div class='del'>-					btrfs_wait_tree_block_writeback(next);</div><div class='del'>-					btrfs_tree_unlock(next);</div><div class='del'>-					ret = btrfs_pin_reserved_extent(trans,</div><div class='del'>-							bytenr, blocksize);</div><div class='del'>-					if (ret) {</div><div class='del'>-						free_extent_buffer(next);</div><div class='del'>-						return ret;</div><div class='del'>-					}</div><div class='del'>-					btrfs_redirty_list_add(</div><div class='del'>-						trans-&gt;transaction, next);</div><div class='del'>-				} else {</div><div class='del'>-					if (test_and_clear_bit(EXTENT_BUFFER_DIRTY, &amp;next-&gt;bflags))</div><div class='del'>-						clear_extent_buffer_dirty(next);</div><div class='del'>-					unaccount_log_buffer(fs_info, bytenr);</div><div class='add'>+				ret = clean_log_buffer(trans, next);</div><div class='add'>+				if (ret) {</div><div class='add'>+					free_extent_buffer(next);</div><div class='add'>+					return ret;</div><div class='ctx'> 				}</div><div class='ctx'> 			}</div><div class='ctx'> 			free_extent_buffer(next);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='del'>-		ret = btrfs_read_buffer(next, ptr_gen, *level - 1, &amp;first_key);</div><div class='add'>+		ret = btrfs_read_extent_buffer(next, &amp;check);</div><div class='ctx'> 		if (ret) {</div><div class='ctx'> 			free_extent_buffer(next);</div><div class='add'>+			if (trans)</div><div class='add'>+				btrfs_abort_transaction(trans, ret);</div><div class='add'>+			else</div><div class='add'>+				btrfs_handle_fs_error(fs_info, ret, NULL);</div><div class='ctx'> 			return ret;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -2869,12 +3077,9 @@ static noinline int walk_down_log_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline int walk_up_log_tree(struct btrfs_trans_handle *trans,</div><div class='del'>-				 struct btrfs_root *root,</div><div class='del'>-				 struct btrfs_path *path, int *level,</div><div class='del'>-				 struct walk_control *wc)</div><div class='add'>+static noinline int walk_up_log_tree(struct btrfs_path *path, int *level,</div><div class='add'>+				     struct walk_control *wc)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	int i;</div><div class='ctx'> 	int slot;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -2887,34 +3092,16 @@ static noinline int walk_up_log_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			WARN_ON(*level == 0);</div><div class='ctx'> 			return 0;</div><div class='ctx'> 		} else {</div><div class='del'>-			ret = wc-&gt;process_func(root, path-&gt;nodes[*level], wc,</div><div class='add'>+			ret = wc-&gt;process_func(path-&gt;nodes[*level], wc,</div><div class='ctx'> 				 btrfs_header_generation(path-&gt;nodes[*level]),</div><div class='ctx'> 				 *level);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				return ret;</div><div class='ctx'> </div><div class='ctx'> 			if (wc-&gt;free) {</div><div class='del'>-				struct extent_buffer *next;</div><div class='del'>-</div><div class='del'>-				next = path-&gt;nodes[*level];</div><div class='del'>-</div><div class='del'>-				if (trans) {</div><div class='del'>-					btrfs_tree_lock(next);</div><div class='del'>-					btrfs_clean_tree_block(next);</div><div class='del'>-					btrfs_wait_tree_block_writeback(next);</div><div class='del'>-					btrfs_tree_unlock(next);</div><div class='del'>-					ret = btrfs_pin_reserved_extent(trans,</div><div class='del'>-						     path-&gt;nodes[*level]-&gt;start,</div><div class='del'>-						     path-&gt;nodes[*level]-&gt;len);</div><div class='del'>-					if (ret)</div><div class='del'>-						return ret;</div><div class='del'>-				} else {</div><div class='del'>-					if (test_and_clear_bit(EXTENT_BUFFER_DIRTY, &amp;next-&gt;bflags))</div><div class='del'>-						clear_extent_buffer_dirty(next);</div><div class='del'>-</div><div class='del'>-					unaccount_log_buffer(fs_info,</div><div class='del'>-						path-&gt;nodes[*level]-&gt;start);</div><div class='del'>-				}</div><div class='add'>+				ret = clean_log_buffer(wc-&gt;trans, path-&gt;nodes[*level]);</div><div class='add'>+				if (ret)</div><div class='add'>+					return ret;</div><div class='ctx'> 			}</div><div class='ctx'> 			free_extent_buffer(path-&gt;nodes[*level]);</div><div class='ctx'> 			path-&gt;nodes[*level] = NULL;</div><div class='hunk'>@@ -2929,14 +3116,13 @@ static noinline int walk_up_log_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'>  * the tree freeing any blocks that have a ref count of zero after being</div><div class='ctx'>  * decremented.</div><div class='ctx'>  */</div><div class='del'>-static int walk_log_tree(struct btrfs_trans_handle *trans,</div><div class='del'>-			 struct btrfs_root *log, struct walk_control *wc)</div><div class='add'>+static int walk_log_tree(struct walk_control *wc)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = log-&gt;fs_info;</div><div class='add'>+	struct btrfs_root *log = wc-&gt;log;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int wret;</div><div class='ctx'> 	int level;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	int orig_level;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='hunk'>@@ -2946,58 +3132,34 @@ static int walk_log_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	level = btrfs_header_level(log-&gt;node);</div><div class='ctx'> 	orig_level = level;</div><div class='ctx'> 	path-&gt;nodes[level] = log-&gt;node;</div><div class='del'>-	atomic_inc(&amp;log-&gt;node-&gt;refs);</div><div class='add'>+	refcount_inc(&amp;log-&gt;node-&gt;refs);</div><div class='ctx'> 	path-&gt;slots[level] = 0;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='del'>-		wret = walk_down_log_tree(trans, log, path, &amp;level, wc);</div><div class='add'>+		wret = walk_down_log_tree(path, &amp;level, wc);</div><div class='ctx'> 		if (wret &gt; 0)</div><div class='ctx'> 			break;</div><div class='del'>-		if (wret &lt; 0) {</div><div class='del'>-			ret = wret;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+		if (wret &lt; 0)</div><div class='add'>+			return wret;</div><div class='ctx'> </div><div class='del'>-		wret = walk_up_log_tree(trans, log, path, &amp;level, wc);</div><div class='add'>+		wret = walk_up_log_tree(path, &amp;level, wc);</div><div class='ctx'> 		if (wret &gt; 0)</div><div class='ctx'> 			break;</div><div class='del'>-		if (wret &lt; 0) {</div><div class='del'>-			ret = wret;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+		if (wret &lt; 0)</div><div class='add'>+			return wret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* was the root node processed? if not, catch it here */</div><div class='ctx'> 	if (path-&gt;nodes[orig_level]) {</div><div class='del'>-		ret = wc-&gt;process_func(log, path-&gt;nodes[orig_level], wc,</div><div class='add'>+		ret = wc-&gt;process_func(path-&gt;nodes[orig_level], wc,</div><div class='ctx'> 			 btrfs_header_generation(path-&gt;nodes[orig_level]),</div><div class='ctx'> 			 orig_level);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			goto out;</div><div class='del'>-		if (wc-&gt;free) {</div><div class='del'>-			struct extent_buffer *next;</div><div class='del'>-</div><div class='del'>-			next = path-&gt;nodes[orig_level];</div><div class='del'>-</div><div class='del'>-			if (trans) {</div><div class='del'>-				btrfs_tree_lock(next);</div><div class='del'>-				btrfs_clean_tree_block(next);</div><div class='del'>-				btrfs_wait_tree_block_writeback(next);</div><div class='del'>-				btrfs_tree_unlock(next);</div><div class='del'>-				ret = btrfs_pin_reserved_extent(trans,</div><div class='del'>-						next-&gt;start, next-&gt;len);</div><div class='del'>-				if (ret)</div><div class='del'>-					goto out;</div><div class='del'>-			} else {</div><div class='del'>-				if (test_and_clear_bit(EXTENT_BUFFER_DIRTY, &amp;next-&gt;bflags))</div><div class='del'>-					clear_extent_buffer_dirty(next);</div><div class='del'>-				unaccount_log_buffer(fs_info, next-&gt;start);</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='add'>+			return ret;</div><div class='add'>+		if (wc-&gt;free)</div><div class='add'>+			ret = clean_log_buffer(wc-&gt;trans, path-&gt;nodes[orig_level]);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3065,6 +3227,52 @@ static void wait_for_writer(struct btrfs_root *root)</div><div class='ctx'> 	finish_wait(&amp;root-&gt;log_writer_wait, &amp;wait);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void btrfs_init_log_ctx(struct btrfs_log_ctx *ctx, struct btrfs_inode *inode)</div><div class='add'>+{</div><div class='add'>+	ctx-&gt;log_ret = 0;</div><div class='add'>+	ctx-&gt;log_transid = 0;</div><div class='add'>+	ctx-&gt;log_new_dentries = false;</div><div class='add'>+	ctx-&gt;logging_new_name = false;</div><div class='add'>+	ctx-&gt;logging_new_delayed_dentries = false;</div><div class='add'>+	ctx-&gt;logged_before = false;</div><div class='add'>+	ctx-&gt;inode = inode;</div><div class='add'>+	INIT_LIST_HEAD(&amp;ctx-&gt;list);</div><div class='add'>+	INIT_LIST_HEAD(&amp;ctx-&gt;ordered_extents);</div><div class='add'>+	INIT_LIST_HEAD(&amp;ctx-&gt;conflict_inodes);</div><div class='add'>+	ctx-&gt;num_conflict_inodes = 0;</div><div class='add'>+	ctx-&gt;logging_conflict_inodes = false;</div><div class='add'>+	ctx-&gt;scratch_eb = NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_init_log_ctx_scratch_eb(struct btrfs_log_ctx *ctx)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_inode *inode = ctx-&gt;inode;</div><div class='add'>+</div><div class='add'>+	if (!test_bit(BTRFS_INODE_NEEDS_FULL_SYNC, &amp;inode-&gt;runtime_flags) &amp;&amp;</div><div class='add'>+	    !test_bit(BTRFS_INODE_COPY_EVERYTHING, &amp;inode-&gt;runtime_flags))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Don't care about allocation failure. This is just for optimization,</div><div class='add'>+	 * if we fail to allocate here, we will try again later if needed.</div><div class='add'>+	 */</div><div class='add'>+	ctx-&gt;scratch_eb = alloc_dummy_extent_buffer(inode-&gt;root-&gt;fs_info, 0);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_release_log_ctx_extents(struct btrfs_log_ctx *ctx)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_ordered_extent *ordered;</div><div class='add'>+	struct btrfs_ordered_extent *tmp;</div><div class='add'>+</div><div class='add'>+	btrfs_assert_inode_locked(ctx-&gt;inode);</div><div class='add'>+</div><div class='add'>+	list_for_each_entry_safe(ordered, tmp, &amp;ctx-&gt;ordered_extents, log_list) {</div><div class='add'>+		list_del_init(&amp;ordered-&gt;log_list);</div><div class='add'>+		btrfs_put_ordered_extent(ordered);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+</div><div class='ctx'> static inline void btrfs_remove_log_ctx(struct btrfs_root *root,</div><div class='ctx'> 					struct btrfs_log_ctx *ctx)</div><div class='ctx'> {</div><div class='hunk'>@@ -3090,10 +3298,9 @@ static inline void btrfs_remove_all_log_ctxs(struct btrfs_root *root,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * btrfs_sync_log does sends a given tree log down to the disk and</div><div class='del'>- * updates the super blocks to record it.  When this call is done,</div><div class='del'>- * you know that any inodes previously logged are safely on disk only</div><div class='del'>- * if it returns 0.</div><div class='add'>+ * Sends a given tree log down to the disk and updates the super blocks to</div><div class='add'>+ * record it.  When this call is done, you know that any inodes previously</div><div class='add'>+ * logged are safely on disk only if it returns 0.</div><div class='ctx'>  *</div><div class='ctx'>  * Any other return value means you need to call btrfs_commit_transaction.</div><div class='ctx'>  * Some of the edge cases for fsyncing directories that have had unlinks</div><div class='hunk'>@@ -3131,7 +3338,8 @@ int btrfs_sync_log(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		mutex_unlock(&amp;root-&gt;log_mutex);</div><div class='ctx'> 		return ctx-&gt;log_ret;</div><div class='ctx'> 	}</div><div class='del'>-	ASSERT(log_transid == root-&gt;log_transid);</div><div class='add'>+	ASSERT(log_transid == root-&gt;log_transid,</div><div class='add'>+	       "log_transid=%d root-&gt;log_transid=%d", log_transid, root-&gt;log_transid);</div><div class='ctx'> 	atomic_set(&amp;root-&gt;log_commit[index1], 1);</div><div class='ctx'> </div><div class='ctx'> 	/* wait for previous tree log sync to complete */</div><div class='hunk'>@@ -3154,15 +3362,15 @@ int btrfs_sync_log(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	/* bail out if we need to do a full commit */</div><div class='ctx'> 	if (btrfs_need_log_full_commit(trans)) {</div><div class='del'>-		ret = -EAGAIN;</div><div class='add'>+		ret = BTRFS_LOG_FORCE_COMMIT;</div><div class='ctx'> 		mutex_unlock(&amp;root-&gt;log_mutex);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (log_transid % 2 == 0)</div><div class='del'>-		mark = EXTENT_DIRTY;</div><div class='add'>+		mark = EXTENT_DIRTY_LOG1;</div><div class='ctx'> 	else</div><div class='del'>-		mark = EXTENT_NEW;</div><div class='add'>+		mark = EXTENT_DIRTY_LOG2;</div><div class='ctx'> </div><div class='ctx'> 	/* we start IO on  all the marked extents here, but we don't actually</div><div class='ctx'> 	 * wait for them until later.</div><div class='hunk'>@@ -3182,7 +3390,6 @@ int btrfs_sync_log(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		ret = 0;</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		blk_finish_plug(&amp;plug);</div><div class='del'>-		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		btrfs_set_log_full_commit(trans);</div><div class='ctx'> 		mutex_unlock(&amp;root-&gt;log_mutex);</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -3204,7 +3411,7 @@ int btrfs_sync_log(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	btrfs_set_root_node(&amp;log-&gt;root_item, log-&gt;node);</div><div class='ctx'> 	memcpy(&amp;new_root_item, &amp;log-&gt;root_item, sizeof(new_root_item));</div><div class='ctx'> </div><div class='del'>-	root-&gt;log_transid++;</div><div class='add'>+	btrfs_set_root_log_transid(root, root-&gt;log_transid + 1);</div><div class='ctx'> 	log-&gt;log_transid = root-&gt;log_transid;</div><div class='ctx'> 	root-&gt;log_start_pid = 0;</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -3220,6 +3427,7 @@ int btrfs_sync_log(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			ret = btrfs_alloc_log_tree_node(trans, log_root_tree);</div><div class='ctx'> 			if (ret) {</div><div class='ctx'> 				mutex_unlock(&amp;fs_info-&gt;tree_root-&gt;log_mutex);</div><div class='add'>+				blk_finish_plug(&amp;plug);</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='hunk'>@@ -3241,20 +3449,15 @@ int btrfs_sync_log(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 */</div><div class='ctx'> 	ret = update_log_root(trans, log, &amp;new_root_item);</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		if (!list_empty(&amp;root_log_ctx.list))</div><div class='del'>-			list_del_init(&amp;root_log_ctx.list);</div><div class='del'>-</div><div class='add'>+		list_del_init(&amp;root_log_ctx.list);</div><div class='ctx'> 		blk_finish_plug(&amp;plug);</div><div class='ctx'> 		btrfs_set_log_full_commit(trans);</div><div class='del'>-</div><div class='del'>-		if (ret != -ENOSPC) {</div><div class='del'>-			btrfs_abort_transaction(trans, ret);</div><div class='del'>-			mutex_unlock(&amp;log_root_tree-&gt;log_mutex);</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+		if (ret != -ENOSPC)</div><div class='add'>+			btrfs_err(fs_info,</div><div class='add'>+				  "failed to update log for root %llu ret %d",</div><div class='add'>+				  btrfs_root_id(root), ret);</div><div class='ctx'> 		btrfs_wait_tree_log_extents(log, mark);</div><div class='ctx'> 		mutex_unlock(&amp;log_root_tree-&gt;log_mutex);</div><div class='del'>-		ret = -EAGAIN;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -3266,7 +3469,6 @@ int btrfs_sync_log(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	index2 = root_log_ctx.log_transid % 2;</div><div class='ctx'> 	if (atomic_read(&amp;log_root_tree-&gt;log_commit[index2])) {</div><div class='ctx'> 		blk_finish_plug(&amp;plug);</div><div class='ctx'> 		ret = btrfs_wait_tree_log_extents(log, mark);</div><div class='hunk'>@@ -3277,7 +3479,9 @@ int btrfs_sync_log(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			ret = root_log_ctx.log_ret;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	ASSERT(root_log_ctx.log_transid == log_root_tree-&gt;log_transid);</div><div class='add'>+	ASSERT(root_log_ctx.log_transid == log_root_tree-&gt;log_transid,</div><div class='add'>+	       "root_log_ctx.log_transid=%d log_root_tree-&gt;log_transid=%d",</div><div class='add'>+		root_log_ctx.log_transid, log_root_tree-&gt;log_transid);</div><div class='ctx'> 	atomic_set(&amp;log_root_tree-&gt;log_commit[index2], 1);</div><div class='ctx'> </div><div class='ctx'> 	if (atomic_read(&amp;log_root_tree-&gt;log_commit[(index2 + 1) % 2])) {</div><div class='hunk'>@@ -3293,13 +3497,13 @@ int btrfs_sync_log(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		blk_finish_plug(&amp;plug);</div><div class='ctx'> 		btrfs_wait_tree_log_extents(log, mark);</div><div class='ctx'> 		mutex_unlock(&amp;log_root_tree-&gt;log_mutex);</div><div class='del'>-		ret = -EAGAIN;</div><div class='add'>+		ret = BTRFS_LOG_FORCE_COMMIT;</div><div class='ctx'> 		goto out_wake_log_root;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_write_marked_extents(fs_info,</div><div class='ctx'> 					 &amp;log_root_tree-&gt;dirty_log_pages,</div><div class='del'>-					 EXTENT_DIRTY | EXTENT_NEW);</div><div class='add'>+					 EXTENT_DIRTY_LOG1 | EXTENT_DIRTY_LOG2);</div><div class='ctx'> 	blk_finish_plug(&amp;plug);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * As described above, -EAGAIN indicates a hole in the extents. We</div><div class='hunk'>@@ -3313,14 +3517,13 @@ int btrfs_sync_log(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		goto out_wake_log_root;</div><div class='ctx'> 	} else if (ret) {</div><div class='ctx'> 		btrfs_set_log_full_commit(trans);</div><div class='del'>-		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		mutex_unlock(&amp;log_root_tree-&gt;log_mutex);</div><div class='ctx'> 		goto out_wake_log_root;</div><div class='ctx'> 	}</div><div class='ctx'> 	ret = btrfs_wait_tree_log_extents(log, mark);</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		ret = btrfs_wait_tree_log_extents(log_root_tree,</div><div class='del'>-						  EXTENT_NEW | EXTENT_DIRTY);</div><div class='add'>+						  EXTENT_DIRTY_LOG1 | EXTENT_DIRTY_LOG2);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		btrfs_set_log_full_commit(trans);</div><div class='ctx'> 		mutex_unlock(&amp;log_root_tree-&gt;log_mutex);</div><div class='hunk'>@@ -3368,7 +3571,7 @@ int btrfs_sync_log(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	btrfs_set_super_log_root_level(fs_info-&gt;super_for_commit, log_root_level);</div><div class='ctx'> 	ret = write_all_supers(fs_info, 1);</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;tree_log_mutex);</div><div class='del'>-	if (ret) {</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_set_log_full_commit(trans);</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out_wake_log_root;</div><div class='hunk'>@@ -3382,8 +3585,10 @@ int btrfs_sync_log(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * someone else already started it. We use &lt;= and not &lt; because the</div><div class='ctx'> 	 * first log transaction has an ID of 0.</div><div class='ctx'> 	 */</div><div class='del'>-	ASSERT(root-&gt;last_log_commit &lt;= log_transid);</div><div class='del'>-	root-&gt;last_log_commit = log_transid;</div><div class='add'>+	ASSERT(btrfs_get_root_last_log_commit(root) &lt;= log_transid,</div><div class='add'>+	       "last_log_commit(root)=%d log_transid=%d",</div><div class='add'>+	       btrfs_get_root_last_log_commit(root), log_transid);</div><div class='add'>+	btrfs_set_root_last_log_commit(root, log_transid);</div><div class='ctx'> </div><div class='ctx'> out_wake_log_root:</div><div class='ctx'> 	mutex_lock(&amp;log_root_tree-&gt;log_mutex);</div><div class='hunk'>@@ -3420,13 +3625,38 @@ static void free_log_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct walk_control wc = {</div><div class='del'>-		.free = 1,</div><div class='del'>-		.process_func = process_one_buffer</div><div class='add'>+		.free = true,</div><div class='add'>+		.process_func = process_one_buffer,</div><div class='add'>+		.log = log,</div><div class='add'>+		.trans = trans,</div><div class='ctx'> 	};</div><div class='ctx'> </div><div class='ctx'> 	if (log-&gt;node) {</div><div class='del'>-		ret = walk_log_tree(trans, log, &amp;wc);</div><div class='add'>+		ret = walk_log_tree(&amp;wc);</div><div class='ctx'> 		if (ret) {</div><div class='add'>+			/*</div><div class='add'>+			 * We weren't able to traverse the entire log tree, the</div><div class='add'>+			 * typical scenario is getting an -EIO when reading an</div><div class='add'>+			 * extent buffer of the tree, due to a previous writeback</div><div class='add'>+			 * failure of it.</div><div class='add'>+			 */</div><div class='add'>+			set_bit(BTRFS_FS_STATE_LOG_CLEANUP_ERROR,</div><div class='add'>+				&amp;log-&gt;fs_info-&gt;fs_state);</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * Some extent buffers of the log tree may still be dirty</div><div class='add'>+			 * and not yet written back to storage, because we may</div><div class='add'>+			 * have updates to a log tree without syncing a log tree,</div><div class='add'>+			 * such as during rename and link operations. So flush</div><div class='add'>+			 * them out and wait for their writeback to complete, so</div><div class='add'>+			 * that we properly cleanup their state and pages.</div><div class='add'>+			 */</div><div class='add'>+			btrfs_write_marked_extents(log-&gt;fs_info,</div><div class='add'>+						   &amp;log-&gt;dirty_log_pages,</div><div class='add'>+						   EXTENT_DIRTY_LOG1 | EXTENT_DIRTY_LOG2);</div><div class='add'>+			btrfs_wait_tree_log_extents(log,</div><div class='add'>+						    EXTENT_DIRTY_LOG1 | EXTENT_DIRTY_LOG2);</div><div class='add'>+</div><div class='ctx'> 			if (trans)</div><div class='ctx'> 				btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			else</div><div class='hunk'>@@ -3434,12 +3664,9 @@ static void free_log_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	clear_extent_bits(&amp;log-&gt;dirty_log_pages, 0, (u64)-1,</div><div class='del'>-			  EXTENT_DIRTY | EXTENT_NEW | EXTENT_NEED_WAIT);</div><div class='del'>-	extent_io_tree_release(&amp;log-&gt;log_csum_range);</div><div class='add'>+	btrfs_extent_io_tree_release(&amp;log-&gt;dirty_log_pages);</div><div class='add'>+	btrfs_extent_io_tree_release(&amp;log-&gt;log_csum_range);</div><div class='ctx'> </div><div class='del'>-	if (trans &amp;&amp; log-&gt;node)</div><div class='del'>-		btrfs_redirty_list_add(trans-&gt;transaction, log-&gt;node);</div><div class='ctx'> 	btrfs_put_root(log);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3468,36 +3695,185 @@ int btrfs_free_log_root_tree(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool mark_inode_as_not_logged(const struct btrfs_trans_handle *trans,</div><div class='add'>+				     struct btrfs_inode *inode)</div><div class='add'>+{</div><div class='add'>+	bool ret = false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Do this only if -&gt;logged_trans is still 0 to prevent races with</div><div class='add'>+	 * concurrent logging as we may see the inode not logged when</div><div class='add'>+	 * inode_logged() is called but it gets logged after inode_logged() did</div><div class='add'>+	 * not find it in the log tree and we end up setting -&gt;logged_trans to a</div><div class='add'>+	 * value less than trans-&gt;transid after the concurrent logging task has</div><div class='add'>+	 * set it to trans-&gt;transid. As a consequence, subsequent rename, unlink</div><div class='add'>+	 * and link operations may end up not logging new names and removing old</div><div class='add'>+	 * names from the log.</div><div class='add'>+	 */</div><div class='add'>+	spin_lock(&amp;inode-&gt;lock);</div><div class='add'>+	if (inode-&gt;logged_trans == 0)</div><div class='add'>+		inode-&gt;logged_trans = trans-&gt;transid - 1;</div><div class='add'>+	else if (inode-&gt;logged_trans == trans-&gt;transid)</div><div class='add'>+		ret = true;</div><div class='add'>+	spin_unlock(&amp;inode-&gt;lock);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='del'>- * Check if an inode was logged in the current transaction. This may often</div><div class='del'>- * return some false positives, because logged_trans is an in memory only field,</div><div class='del'>- * not persisted anywhere. This is meant to be used in contexts where a false</div><div class='del'>- * positive has no functional consequences.</div><div class='add'>+ * Check if an inode was logged in the current transaction. This correctly deals</div><div class='add'>+ * with the case where the inode was logged but has a logged_trans of 0, which</div><div class='add'>+ * happens if the inode is evicted and loaded again, as logged_trans is an in</div><div class='add'>+ * memory only field (not persisted).</div><div class='add'>+ *</div><div class='add'>+ * Returns 1 if the inode was logged before in the transaction, 0 if it was not,</div><div class='add'>+ * and &lt; 0 on error.</div><div class='ctx'>  */</div><div class='del'>-static bool inode_logged(struct btrfs_trans_handle *trans,</div><div class='del'>-			 struct btrfs_inode *inode)</div><div class='add'>+static int inode_logged(const struct btrfs_trans_handle *trans,</div><div class='add'>+			struct btrfs_inode *inode,</div><div class='add'>+			struct btrfs_path *path_in)</div><div class='ctx'> {</div><div class='del'>-	if (inode-&gt;logged_trans == trans-&gt;transid)</div><div class='del'>-		return true;</div><div class='add'>+	struct btrfs_path *path = path_in;</div><div class='add'>+	struct btrfs_key key;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Quick lockless call, since once -&gt;logged_trans is set to the current</div><div class='add'>+	 * transaction, we never set it to a lower value anywhere else.</div><div class='add'>+	 */</div><div class='add'>+	if (data_race(inode-&gt;logged_trans) == trans-&gt;transid)</div><div class='add'>+		return 1;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If logged_trans is not 0 and not trans-&gt;transid, then we know the</div><div class='add'>+	 * inode was not logged in this transaction, so we can return false</div><div class='add'>+	 * right away. We take the lock to avoid a race caused by load/store</div><div class='add'>+	 * tearing with a concurrent btrfs_log_inode() call or a concurrent task</div><div class='add'>+	 * in this function further below - an update to trans-&gt;transid can be</div><div class='add'>+	 * teared into two 32 bits updates for example, in which case we could</div><div class='add'>+	 * see a positive value that is not trans-&gt;transid and assume the inode</div><div class='add'>+	 * was not logged when it was.</div><div class='add'>+	 */</div><div class='add'>+	spin_lock(&amp;inode-&gt;lock);</div><div class='add'>+	if (inode-&gt;logged_trans == trans-&gt;transid) {</div><div class='add'>+		spin_unlock(&amp;inode-&gt;lock);</div><div class='add'>+		return 1;</div><div class='add'>+	} else if (inode-&gt;logged_trans &gt; 0) {</div><div class='add'>+		spin_unlock(&amp;inode-&gt;lock);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;inode-&gt;lock);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If no log tree was created for this root in this transaction, then</div><div class='add'>+	 * the inode can not have been logged in this transaction. In that case</div><div class='add'>+	 * set logged_trans to anything greater than 0 and less than the current</div><div class='add'>+	 * transaction's ID, to avoid the search below in a future call in case</div><div class='add'>+	 * a log tree gets created after this.</div><div class='add'>+	 */</div><div class='ctx'> 	if (!test_bit(BTRFS_ROOT_HAS_LOG_TREE, &amp;inode-&gt;root-&gt;state))</div><div class='del'>-		return false;</div><div class='add'>+		return mark_inode_as_not_logged(trans, inode);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * The inode's logged_trans is always 0 when we load it (because it is</div><div class='del'>-	 * not persisted in the inode item or elsewhere). So if it is 0, the</div><div class='del'>-	 * inode was last modified in the current transaction then the inode may</div><div class='del'>-	 * have been logged before in the current transaction, then evicted and</div><div class='del'>-	 * loaded again in the current transaction - or may have never been logged</div><div class='del'>-	 * in the current transaction, but since we can not be sure, we have to</div><div class='del'>-	 * assume it was, otherwise our callers can leave an inconsistent log.</div><div class='add'>+	 * We have a log tree and the inode's logged_trans is 0. We can't tell</div><div class='add'>+	 * for sure if the inode was logged before in this transaction by looking</div><div class='add'>+	 * only at logged_trans. We could be pessimistic and assume it was, but</div><div class='add'>+	 * that can lead to unnecessarily logging an inode during rename and link</div><div class='add'>+	 * operations, and then further updating the log in followup rename and</div><div class='add'>+	 * link operations, specially if it's a directory, which adds latency</div><div class='add'>+	 * visible to applications doing a series of rename or link operations.</div><div class='add'>+	 *</div><div class='add'>+	 * A logged_trans of 0 here can mean several things:</div><div class='add'>+	 *</div><div class='add'>+	 * 1) The inode was never logged since the filesystem was mounted, and may</div><div class='add'>+	 *    or may have not been evicted and loaded again;</div><div class='add'>+	 *</div><div class='add'>+	 * 2) The inode was logged in a previous transaction, then evicted and</div><div class='add'>+	 *    then loaded again;</div><div class='add'>+	 *</div><div class='add'>+	 * 3) The inode was logged in the current transaction, then evicted and</div><div class='add'>+	 *    then loaded again.</div><div class='add'>+	 *</div><div class='add'>+	 * For cases 1) and 2) we don't want to return true, but we need to detect</div><div class='add'>+	 * case 3) and return true. So we do a search in the log root for the inode</div><div class='add'>+	 * item.</div><div class='ctx'> 	 */</div><div class='del'>-	if (inode-&gt;logged_trans == 0 &amp;&amp;</div><div class='del'>-	    inode-&gt;last_trans == trans-&gt;transid &amp;&amp;</div><div class='del'>-	    !test_bit(BTRFS_FS_LOG_RECOVERING, &amp;trans-&gt;fs_info-&gt;flags))</div><div class='del'>-		return true;</div><div class='add'>+	key.objectid = btrfs_ino(inode);</div><div class='add'>+	key.type = BTRFS_INODE_ITEM_KEY;</div><div class='add'>+	key.offset = 0;</div><div class='add'>+</div><div class='add'>+	if (!path) {</div><div class='add'>+		path = btrfs_alloc_path();</div><div class='add'>+		if (!path)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_search_slot(NULL, inode-&gt;root-&gt;log_root, &amp;key, path, 0, 0);</div><div class='add'>+</div><div class='add'>+	if (path_in)</div><div class='add'>+		btrfs_release_path(path);</div><div class='add'>+	else</div><div class='add'>+		btrfs_free_path(path);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Logging an inode always results in logging its inode item. So if we</div><div class='add'>+	 * did not find the item we know the inode was not logged for sure.</div><div class='add'>+	 */</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		return ret;</div><div class='add'>+	} else if (ret &gt; 0) {</div><div class='add'>+		/*</div><div class='add'>+		 * Set logged_trans to a value greater than 0 and less then the</div><div class='add'>+		 * current transaction to avoid doing the search in future calls.</div><div class='add'>+		 */</div><div class='add'>+		return mark_inode_as_not_logged(trans, inode);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The inode was previously logged and then evicted, set logged_trans to</div><div class='add'>+	 * the current transaction's ID, to avoid future tree searches as long as</div><div class='add'>+	 * the inode is not evicted again.</div><div class='add'>+	 */</div><div class='add'>+	spin_lock(&amp;inode-&gt;lock);</div><div class='add'>+	inode-&gt;logged_trans = trans-&gt;transid;</div><div class='add'>+	spin_unlock(&amp;inode-&gt;lock);</div><div class='add'>+</div><div class='add'>+	return 1;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Delete a directory entry from the log if it exists.</div><div class='add'>+ *</div><div class='add'>+ * Returns &lt; 0 on error</div><div class='add'>+ *           1 if the entry does not exists</div><div class='add'>+ *           0 if the entry existed and was successfully deleted</div><div class='add'>+ */</div><div class='add'>+static int del_logged_dentry(struct btrfs_trans_handle *trans,</div><div class='add'>+			     struct btrfs_root *log,</div><div class='add'>+			     struct btrfs_path *path,</div><div class='add'>+			     u64 dir_ino,</div><div class='add'>+			     const struct fscrypt_str *name,</div><div class='add'>+			     u64 index)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_dir_item *di;</div><div class='ctx'> </div><div class='del'>-	return false;</div><div class='add'>+	/*</div><div class='add'>+	 * We only log dir index items of a directory, so we don't need to look</div><div class='add'>+	 * for dir item keys.</div><div class='add'>+	 */</div><div class='add'>+	di = btrfs_lookup_dir_index_item(trans, log, path, dir_ino,</div><div class='add'>+					 index, name, -1);</div><div class='add'>+	if (IS_ERR(di))</div><div class='add'>+		return PTR_ERR(di);</div><div class='add'>+	else if (!di)</div><div class='add'>+		return 1;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We do not need to update the size field of the directory's</div><div class='add'>+	 * inode item because on log replay we update the field to reflect</div><div class='add'>+	 * all existing entries in the directory (see overwrite_item()).</div><div class='add'>+	 */</div><div class='add'>+	return btrfs_del_item(trans, log, path);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -3522,96 +3898,67 @@ static bool inode_logged(struct btrfs_trans_handle *trans,</div><div class='ctx'>  * or the entire directory.</div><div class='ctx'>  */</div><div class='ctx'> void btrfs_del_dir_entries_in_log(struct btrfs_trans_handle *trans,</div><div class='del'>-				  struct btrfs_root *root,</div><div class='del'>-				  const char *name, int name_len,</div><div class='add'>+				  const struct fscrypt_str *name,</div><div class='ctx'> 				  struct btrfs_inode *dir, u64 index)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *log;</div><div class='del'>-	struct btrfs_dir_item *di;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	struct btrfs_root *root = dir-&gt;root;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	int ret;</div><div class='del'>-	int err = 0;</div><div class='del'>-	u64 dir_ino = btrfs_ino(dir);</div><div class='ctx'> </div><div class='del'>-	if (!inode_logged(trans, dir))</div><div class='add'>+	ret = inode_logged(trans, dir, NULL);</div><div class='add'>+	if (ret == 0)</div><div class='ctx'> 		return;</div><div class='del'>-</div><div class='del'>-	ret = join_running_log_trans(root);</div><div class='del'>-	if (ret)</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		btrfs_set_log_full_commit(trans);</div><div class='ctx'> 		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;dir-&gt;log_mutex);</div><div class='del'>-</div><div class='del'>-	log = root-&gt;log_root;</div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path) {</div><div class='del'>-		err = -ENOMEM;</div><div class='del'>-		goto out_unlock;</div><div class='add'>+		btrfs_set_log_full_commit(trans);</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	di = btrfs_lookup_dir_item(trans, log, path, dir_ino,</div><div class='del'>-				   name, name_len, -1);</div><div class='del'>-	if (IS_ERR(di)) {</div><div class='del'>-		err = PTR_ERR(di);</div><div class='del'>-		goto fail;</div><div class='del'>-	}</div><div class='del'>-	if (di) {</div><div class='del'>-		ret = btrfs_delete_one_dir_name(trans, log, path, di);</div><div class='del'>-		if (ret) {</div><div class='del'>-			err = ret;</div><div class='del'>-			goto fail;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	btrfs_release_path(path);</div><div class='del'>-	di = btrfs_lookup_dir_index_item(trans, log, path, dir_ino,</div><div class='del'>-					 index, name, name_len, -1);</div><div class='del'>-	if (IS_ERR(di)) {</div><div class='del'>-		err = PTR_ERR(di);</div><div class='del'>-		goto fail;</div><div class='del'>-	}</div><div class='del'>-	if (di) {</div><div class='del'>-		ret = btrfs_delete_one_dir_name(trans, log, path, di);</div><div class='del'>-		if (ret) {</div><div class='del'>-			err = ret;</div><div class='del'>-			goto fail;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	ret = join_running_log_trans(root);</div><div class='add'>+	ASSERT(ret == 0, "join_running_log_trans() ret=%d", ret);</div><div class='add'>+	if (WARN_ON(ret))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * We do not need to update the size field of the directory's inode item</div><div class='del'>-	 * because on log replay we update the field to reflect all existing</div><div class='del'>-	 * entries in the directory (see overwrite_item()).</div><div class='del'>-	 */</div><div class='del'>-fail:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-out_unlock:</div><div class='add'>+	mutex_lock(&amp;dir-&gt;log_mutex);</div><div class='add'>+</div><div class='add'>+	ret = del_logged_dentry(trans, root-&gt;log_root, path, btrfs_ino(dir),</div><div class='add'>+				name, index);</div><div class='ctx'> 	mutex_unlock(&amp;dir-&gt;log_mutex);</div><div class='del'>-	if (err &lt; 0)</div><div class='add'>+	if (ret &lt; 0)</div><div class='ctx'> 		btrfs_set_log_full_commit(trans);</div><div class='ctx'> 	btrfs_end_log_trans(root);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* see comments for btrfs_del_dir_entries_in_log */</div><div class='ctx'> void btrfs_del_inode_ref_in_log(struct btrfs_trans_handle *trans,</div><div class='del'>-				struct btrfs_root *root,</div><div class='del'>-				const char *name, int name_len,</div><div class='del'>-				struct btrfs_inode *inode, u64 dirid)</div><div class='add'>+				const struct fscrypt_str *name,</div><div class='add'>+				struct btrfs_inode *inode,</div><div class='add'>+				struct btrfs_inode *dir)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *log;</div><div class='del'>-	u64 index;</div><div class='add'>+	struct btrfs_root *root = dir-&gt;root;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (!inode_logged(trans, inode))</div><div class='add'>+	ret = inode_logged(trans, inode, NULL);</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		return;</div><div class='add'>+	else if (ret &lt; 0) {</div><div class='add'>+		btrfs_set_log_full_commit(trans);</div><div class='ctx'> 		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	ret = join_running_log_trans(root);</div><div class='del'>-	if (ret)</div><div class='add'>+	ASSERT(ret == 0, "join_running_log_trans() ret=%d", ret);</div><div class='add'>+	if (WARN_ON(ret))</div><div class='ctx'> 		return;</div><div class='del'>-	log = root-&gt;log_root;</div><div class='ctx'> 	mutex_lock(&amp;inode-&gt;log_mutex);</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_del_inode_ref(trans, log, name, name_len, btrfs_ino(inode),</div><div class='del'>-				  dirid, &amp;index);</div><div class='add'>+	ret = btrfs_del_inode_ref(trans, root-&gt;log_root, name, btrfs_ino(inode),</div><div class='add'>+				  btrfs_ino(dir), NULL);</div><div class='ctx'> 	mutex_unlock(&amp;inode-&gt;log_mutex);</div><div class='ctx'> 	if (ret &lt; 0 &amp;&amp; ret != -ENOENT)</div><div class='ctx'> 		btrfs_set_log_full_commit(trans);</div><div class='hunk'>@@ -3626,7 +3973,7 @@ void btrfs_del_inode_ref_in_log(struct btrfs_trans_handle *trans,</div><div class='ctx'> static noinline int insert_dir_log_key(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				       struct btrfs_root *log,</div><div class='ctx'> 				       struct btrfs_path *path,</div><div class='del'>-				       int key_type, u64 dirid,</div><div class='add'>+				       u64 dirid,</div><div class='ctx'> 				       u64 first_offset, u64 last_offset)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -3634,46 +3981,62 @@ static noinline int insert_dir_log_key(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	struct btrfs_dir_log_item *item;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = dirid;</div><div class='add'>+	key.type = BTRFS_DIR_LOG_INDEX_KEY;</div><div class='ctx'> 	key.offset = first_offset;</div><div class='del'>-	if (key_type == BTRFS_DIR_ITEM_KEY)</div><div class='del'>-		key.type = BTRFS_DIR_LOG_ITEM_KEY;</div><div class='del'>-	else</div><div class='del'>-		key.type = BTRFS_DIR_LOG_INDEX_KEY;</div><div class='ctx'> 	ret = btrfs_insert_empty_item(trans, log, path, &amp;key, sizeof(*item));</div><div class='del'>-	if (ret)</div><div class='add'>+	/*</div><div class='add'>+	 * -EEXIST is fine and can happen sporadically when we are logging a</div><div class='add'>+	 * directory and have concurrent insertions in the subvolume's tree for</div><div class='add'>+	 * items from other inodes and that result in pushing off some dir items</div><div class='add'>+	 * from one leaf to another in order to accommodate for the new items.</div><div class='add'>+	 * This results in logging the same dir index range key.</div><div class='add'>+	 */</div><div class='add'>+	if (ret &amp;&amp; ret != -EEXIST)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='ctx'> 	item = btrfs_item_ptr(path-&gt;nodes[0], path-&gt;slots[0],</div><div class='ctx'> 			      struct btrfs_dir_log_item);</div><div class='add'>+	if (ret == -EEXIST) {</div><div class='add'>+		const u64 curr_end = btrfs_dir_log_end(path-&gt;nodes[0], item);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * btrfs_del_dir_entries_in_log() might have been called during</div><div class='add'>+		 * an unlink between the initial insertion of this key and the</div><div class='add'>+		 * current update, or we might be logging a single entry deletion</div><div class='add'>+		 * during a rename, so set the new last_offset to the max value.</div><div class='add'>+		 */</div><div class='add'>+		last_offset = max(last_offset, curr_end);</div><div class='add'>+	}</div><div class='ctx'> 	btrfs_set_dir_log_end(path-&gt;nodes[0], item, last_offset);</div><div class='del'>-	btrfs_mark_buffer_dirty(path-&gt;nodes[0]);</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int flush_dir_items_batch(struct btrfs_trans_handle *trans,</div><div class='del'>-				 struct btrfs_root *log,</div><div class='add'>+				 struct btrfs_inode *inode,</div><div class='ctx'> 				 struct extent_buffer *src,</div><div class='ctx'> 				 struct btrfs_path *dst_path,</div><div class='ctx'> 				 int start_slot,</div><div class='ctx'> 				 int count)</div><div class='ctx'> {</div><div class='del'>-	char *ins_data = NULL;</div><div class='add'>+	struct btrfs_root *log = inode-&gt;root-&gt;log_root;</div><div class='add'>+	char AUTO_KFREE(ins_data);</div><div class='ctx'> 	struct btrfs_item_batch batch;</div><div class='ctx'> 	struct extent_buffer *dst;</div><div class='ctx'> 	unsigned long src_offset;</div><div class='ctx'> 	unsigned long dst_offset;</div><div class='add'>+	u64 last_index;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	u32 item_size;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	ASSERT(count &gt; 0);</div><div class='add'>+	ASSERT(count &gt; 0, "count=%d", count);</div><div class='ctx'> 	batch.nr = count;</div><div class='ctx'> </div><div class='ctx'> 	if (count == 1) {</div><div class='ctx'> 		btrfs_item_key_to_cpu(src, &amp;key, start_slot);</div><div class='del'>-		item_size = btrfs_item_size_nr(src, start_slot);</div><div class='add'>+		item_size = btrfs_item_size(src, start_slot);</div><div class='ctx'> 		batch.keys = &amp;key;</div><div class='ctx'> 		batch.data_sizes = &amp;item_size;</div><div class='ctx'> 		batch.total_data_size = item_size;</div><div class='hunk'>@@ -3681,8 +4044,7 @@ static int flush_dir_items_batch(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		struct btrfs_key *ins_keys;</div><div class='ctx'> 		u32 *ins_sizes;</div><div class='ctx'> </div><div class='del'>-		ins_data = kmalloc(count * sizeof(u32) +</div><div class='del'>-				   count * sizeof(struct btrfs_key), GFP_NOFS);</div><div class='add'>+		ins_data = kmalloc_array(count, sizeof(u32) + sizeof(struct btrfs_key), GFP_NOFS);</div><div class='ctx'> 		if (!ins_data)</div><div class='ctx'> 			return -ENOMEM;</div><div class='ctx'> </div><div class='hunk'>@@ -3696,14 +4058,14 @@ static int flush_dir_items_batch(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			const int slot = start_slot + i;</div><div class='ctx'> </div><div class='ctx'> 			btrfs_item_key_to_cpu(src, &amp;ins_keys[i], slot);</div><div class='del'>-			ins_sizes[i] = btrfs_item_size_nr(src, slot);</div><div class='add'>+			ins_sizes[i] = btrfs_item_size(src, slot);</div><div class='ctx'> 			batch.total_data_size += ins_sizes[i];</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_insert_empty_items(trans, log, dst_path, &amp;batch);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	dst = dst_path-&gt;nodes[0];</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -3720,47 +4082,114 @@ static int flush_dir_items_batch(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	src_offset = btrfs_item_ptr_offset(src, start_slot + count - 1);</div><div class='ctx'> 	copy_extent_buffer(dst, src, dst_offset, src_offset, batch.total_data_size);</div><div class='ctx'> 	btrfs_release_path(dst_path);</div><div class='del'>-out:</div><div class='del'>-	kfree(ins_data);</div><div class='add'>+</div><div class='add'>+	last_index = batch.keys[count - 1].offset;</div><div class='add'>+	ASSERT(last_index &gt; inode-&gt;last_dir_index_offset,</div><div class='add'>+	       "last_index=%llu inode-&gt;last_dir_index_offset=%llu",</div><div class='add'>+	       last_index, inode-&gt;last_dir_index_offset);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If for some unexpected reason the last item's index is not greater</div><div class='add'>+	 * than the last index we logged, warn and force a transaction commit.</div><div class='add'>+	 */</div><div class='add'>+	if (WARN_ON(last_index &lt;= inode-&gt;last_dir_index_offset))</div><div class='add'>+		ret = BTRFS_LOG_FORCE_COMMIT;</div><div class='add'>+	else</div><div class='add'>+		inode-&gt;last_dir_index_offset = last_index;</div><div class='add'>+</div><div class='add'>+	if (btrfs_get_first_dir_index_to_log(inode) == 0)</div><div class='add'>+		btrfs_set_first_dir_index_to_log(inode, batch.keys[0].offset);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int clone_leaf(struct btrfs_path *path, struct btrfs_log_ctx *ctx)</div><div class='add'>+{</div><div class='add'>+	const int slot = path-&gt;slots[0];</div><div class='add'>+</div><div class='add'>+	if (ctx-&gt;scratch_eb) {</div><div class='add'>+		copy_extent_buffer_full(ctx-&gt;scratch_eb, path-&gt;nodes[0]);</div><div class='add'>+	} else {</div><div class='add'>+		ctx-&gt;scratch_eb = btrfs_clone_extent_buffer(path-&gt;nodes[0]);</div><div class='add'>+		if (!ctx-&gt;scratch_eb)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	btrfs_release_path(path);</div><div class='add'>+	path-&gt;nodes[0] = ctx-&gt;scratch_eb;</div><div class='add'>+	path-&gt;slots[0] = slot;</div><div class='add'>+	/*</div><div class='add'>+	 * Add extra ref to scratch eb so that it is not freed when callers</div><div class='add'>+	 * release the path, so we can reuse it later if needed.</div><div class='add'>+	 */</div><div class='add'>+	refcount_inc(&amp;ctx-&gt;scratch_eb-&gt;refs);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int process_dir_items_leaf(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				  struct btrfs_inode *inode,</div><div class='ctx'> 				  struct btrfs_path *path,</div><div class='ctx'> 				  struct btrfs_path *dst_path,</div><div class='del'>-				  int key_type,</div><div class='del'>-				  struct btrfs_log_ctx *ctx)</div><div class='add'>+				  struct btrfs_log_ctx *ctx,</div><div class='add'>+				  u64 *last_old_dentry_offset)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *log = inode-&gt;root-&gt;log_root;</div><div class='del'>-	struct extent_buffer *src = path-&gt;nodes[0];</div><div class='del'>-	const int nritems = btrfs_header_nritems(src);</div><div class='add'>+	struct extent_buffer *src;</div><div class='add'>+	const int nritems = btrfs_header_nritems(path-&gt;nodes[0]);</div><div class='ctx'> 	const u64 ino = btrfs_ino(inode);</div><div class='del'>-	const bool inode_logged_before = inode_logged(trans, inode);</div><div class='del'>-	u64 last_logged_key_offset;</div><div class='ctx'> 	bool last_found = false;</div><div class='ctx'> 	int batch_start = 0;</div><div class='ctx'> 	int batch_size = 0;</div><div class='del'>-	int i;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	if (key_type == BTRFS_DIR_ITEM_KEY)</div><div class='del'>-		last_logged_key_offset = inode-&gt;last_dir_item_offset;</div><div class='del'>-	else</div><div class='del'>-		last_logged_key_offset = inode-&gt;last_dir_index_offset;</div><div class='add'>+	/*</div><div class='add'>+	 * We need to clone the leaf, release the read lock on it, and use the</div><div class='add'>+	 * clone before modifying the log tree. See the comment at copy_items()</div><div class='add'>+	 * about why we need to do this.</div><div class='add'>+	 */</div><div class='add'>+	ret = clone_leaf(path, ctx);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	for (i = path-&gt;slots[0]; i &lt; nritems; i++) {</div><div class='add'>+	src = path-&gt;nodes[0];</div><div class='add'>+</div><div class='add'>+	for (int i = path-&gt;slots[0]; i &lt; nritems; i++) {</div><div class='add'>+		struct btrfs_dir_item *di;</div><div class='ctx'> 		struct btrfs_key key;</div><div class='del'>-		int ret;</div><div class='ctx'> </div><div class='ctx'> 		btrfs_item_key_to_cpu(src, &amp;key, i);</div><div class='ctx'> </div><div class='del'>-		if (key.objectid != ino || key.type != key_type) {</div><div class='add'>+		if (key.objectid != ino || key.type != BTRFS_DIR_INDEX_KEY) {</div><div class='ctx'> 			last_found = true;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		ctx-&gt;last_dir_item_offset = key.offset;</div><div class='add'>+		di = btrfs_item_ptr(src, i, struct btrfs_dir_item);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Skip ranges of items that consist only of dir item keys created</div><div class='add'>+		 * in past transactions. However if we find a gap, we must log a</div><div class='add'>+		 * dir index range item for that gap, so that index keys in that</div><div class='add'>+		 * gap are deleted during log replay.</div><div class='add'>+		 */</div><div class='add'>+		if (btrfs_dir_transid(src, di) &lt; trans-&gt;transid) {</div><div class='add'>+			if (key.offset &gt; *last_old_dentry_offset + 1) {</div><div class='add'>+				ret = insert_dir_log_key(trans, log, dst_path,</div><div class='add'>+						 ino, *last_old_dentry_offset + 1,</div><div class='add'>+						 key.offset - 1);</div><div class='add'>+				if (ret &lt; 0)</div><div class='add'>+					return ret;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			*last_old_dentry_offset = key.offset;</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* If we logged this dir index item before, we can skip it. */</div><div class='add'>+		if (key.offset &lt;= inode-&gt;last_dir_index_offset)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We must make sure that when we log a directory entry, the</div><div class='ctx'> 		 * corresponding inode, after log replay, has a matching link</div><div class='hunk'>@@ -3784,69 +4213,20 @@ static int process_dir_items_leaf(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		 * resulting in -ENOTEMPTY errors.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (!ctx-&gt;log_new_dentries) {</div><div class='del'>-			struct btrfs_dir_item *di;</div><div class='ctx'> 			struct btrfs_key di_key;</div><div class='ctx'> </div><div class='del'>-			di = btrfs_item_ptr(src, i, struct btrfs_dir_item);</div><div class='ctx'> 			btrfs_dir_item_key_to_cpu(src, di, &amp;di_key);</div><div class='del'>-			if ((btrfs_dir_transid(src, di) == trans-&gt;transid ||</div><div class='del'>-			     btrfs_dir_type(src, di) == BTRFS_FT_DIR) &amp;&amp;</div><div class='del'>-			    di_key.type != BTRFS_ROOT_ITEM_KEY)</div><div class='add'>+			if (di_key.type != BTRFS_ROOT_ITEM_KEY)</div><div class='ctx'> 				ctx-&gt;log_new_dentries = true;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (!inode_logged_before)</div><div class='del'>-			goto add_to_batch;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * If we were logged before and have logged dir items, we can skip</div><div class='del'>-		 * checking if any item with a key offset larger than the last one</div><div class='del'>-		 * we logged is in the log tree, saving time and avoiding adding</div><div class='del'>-		 * contention on the log tree.</div><div class='del'>-		 */</div><div class='del'>-		if (key.offset &gt; last_logged_key_offset)</div><div class='del'>-			goto add_to_batch;</div><div class='del'>-		/*</div><div class='del'>-		 * Check if the key was already logged before. If not we can add</div><div class='del'>-		 * it to a batch for bulk insertion.</div><div class='del'>-		 */</div><div class='del'>-		ret = btrfs_search_slot(NULL, log, &amp;key, dst_path, 0, 0);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			return ret;</div><div class='del'>-		} else if (ret &gt; 0) {</div><div class='del'>-			btrfs_release_path(dst_path);</div><div class='del'>-			goto add_to_batch;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Item exists in the log. Overwrite the item in the log if it</div><div class='del'>-		 * has different content or do nothing if it has exactly the same</div><div class='del'>-		 * content. And then flush the current batch if any - do it after</div><div class='del'>-		 * overwriting the current item, or we would deadlock otherwise,</div><div class='del'>-		 * since we are holding a path for the existing item.</div><div class='del'>-		 */</div><div class='del'>-		ret = do_overwrite_item(trans, log, dst_path, src, i, &amp;key);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			return ret;</div><div class='del'>-</div><div class='del'>-		if (batch_size &gt; 0) {</div><div class='del'>-			ret = flush_dir_items_batch(trans, log, src, dst_path,</div><div class='del'>-						    batch_start, batch_size);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				return ret;</div><div class='del'>-			batch_size = 0;</div><div class='del'>-		}</div><div class='del'>-		continue;</div><div class='del'>-add_to_batch:</div><div class='ctx'> 		if (batch_size == 0)</div><div class='ctx'> 			batch_start = i;</div><div class='ctx'> 		batch_size++;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (batch_size &gt; 0) {</div><div class='del'>-		int ret;</div><div class='del'>-</div><div class='del'>-		ret = flush_dir_items_batch(trans, log, src, dst_path,</div><div class='add'>+		ret = flush_dir_items_batch(trans, inode, src, dst_path,</div><div class='ctx'> 					    batch_start, batch_size);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			return ret;</div><div class='hunk'>@@ -3863,21 +4243,20 @@ add_to_batch:</div><div class='ctx'> static noinline int log_dir_items(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			  struct btrfs_inode *inode,</div><div class='ctx'> 			  struct btrfs_path *path,</div><div class='del'>-			  struct btrfs_path *dst_path, int key_type,</div><div class='add'>+			  struct btrfs_path *dst_path,</div><div class='ctx'> 			  struct btrfs_log_ctx *ctx,</div><div class='ctx'> 			  u64 min_offset, u64 *last_offset_ret)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_key min_key;</div><div class='ctx'> 	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	struct btrfs_root *log = root-&gt;log_root;</div><div class='del'>-	int err = 0;</div><div class='ctx'> 	int ret;</div><div class='del'>-	u64 first_offset = min_offset;</div><div class='add'>+	u64 last_old_dentry_offset = min_offset - 1;</div><div class='ctx'> 	u64 last_offset = (u64)-1;</div><div class='ctx'> 	u64 ino = btrfs_ino(inode);</div><div class='ctx'> </div><div class='ctx'> 	min_key.objectid = ino;</div><div class='del'>-	min_key.type = key_type;</div><div class='add'>+	min_key.type = BTRFS_DIR_INDEX_KEY;</div><div class='ctx'> 	min_key.offset = min_offset;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_search_forward(root, &amp;min_key, path, trans-&gt;transid);</div><div class='hunk'>@@ -3886,9 +4265,10 @@ static noinline int log_dir_items(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * we didn't find anything from this transaction, see if there</div><div class='ctx'> 	 * is anything at all</div><div class='ctx'> 	 */</div><div class='del'>-	if (ret != 0 || min_key.objectid != ino || min_key.type != key_type) {</div><div class='add'>+	if (ret != 0 || min_key.objectid != ino ||</div><div class='add'>+	    min_key.type != BTRFS_DIR_INDEX_KEY) {</div><div class='ctx'> 		min_key.objectid = ino;</div><div class='del'>-		min_key.type = key_type;</div><div class='add'>+		min_key.type = BTRFS_DIR_INDEX_KEY;</div><div class='ctx'> 		min_key.offset = (u64)-1;</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> 		ret = btrfs_search_slot(NULL, root, &amp;min_key, path, 0, 0);</div><div class='hunk'>@@ -3896,7 +4276,7 @@ static noinline int log_dir_items(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			btrfs_release_path(path);</div><div class='ctx'> 			return ret;</div><div class='ctx'> 		}</div><div class='del'>-		ret = btrfs_previous_item(root, path, ino, key_type);</div><div class='add'>+		ret = btrfs_previous_item(root, path, ino, BTRFS_DIR_INDEX_KEY);</div><div class='ctx'> </div><div class='ctx'> 		/* if ret == 0 there are items for this type,</div><div class='ctx'> 		 * create a range to tell us the last key of this type.</div><div class='hunk'>@@ -3905,43 +4285,65 @@ static noinline int log_dir_items(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (ret == 0) {</div><div class='ctx'> 			struct btrfs_key tmp;</div><div class='add'>+</div><div class='ctx'> 			btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;tmp,</div><div class='ctx'> 					      path-&gt;slots[0]);</div><div class='del'>-			if (key_type == tmp.type)</div><div class='del'>-				first_offset = max(min_offset, tmp.offset) + 1;</div><div class='add'>+			if (tmp.type == BTRFS_DIR_INDEX_KEY)</div><div class='add'>+				last_old_dentry_offset = tmp.offset;</div><div class='add'>+		} else if (ret &gt; 0) {</div><div class='add'>+			ret = 0;</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='ctx'> 		goto done;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* go backward to find any previous key */</div><div class='del'>-	ret = btrfs_previous_item(root, path, ino, key_type);</div><div class='add'>+	ret = btrfs_previous_item(root, path, ino, BTRFS_DIR_INDEX_KEY);</div><div class='ctx'> 	if (ret == 0) {</div><div class='ctx'> 		struct btrfs_key tmp;</div><div class='add'>+</div><div class='ctx'> 		btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;tmp, path-&gt;slots[0]);</div><div class='del'>-		if (key_type == tmp.type) {</div><div class='del'>-			first_offset = tmp.offset;</div><div class='del'>-			ret = overwrite_item(trans, log, dst_path,</div><div class='del'>-					     path-&gt;nodes[0], path-&gt;slots[0],</div><div class='del'>-					     &amp;tmp);</div><div class='del'>-			if (ret) {</div><div class='del'>-				err = ret;</div><div class='del'>-				goto done;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='add'>+		/*</div><div class='add'>+		 * The dir index key before the first one we found that needs to</div><div class='add'>+		 * be logged might be in a previous leaf, and there might be a</div><div class='add'>+		 * gap between these keys, meaning that we had deletions that</div><div class='add'>+		 * happened. So the key range item we log (key type</div><div class='add'>+		 * BTRFS_DIR_LOG_INDEX_KEY) must cover a range that starts at the</div><div class='add'>+		 * previous key's offset plus 1, so that those deletes are replayed.</div><div class='add'>+		 */</div><div class='add'>+		if (tmp.type == BTRFS_DIR_INDEX_KEY)</div><div class='add'>+			last_old_dentry_offset = tmp.offset;</div><div class='add'>+	} else if (ret &lt; 0) {</div><div class='add'>+		goto done;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Find the first key from this transaction again.  See the note for</div><div class='del'>-	 * log_new_dir_dentries, if we're logging a directory recursively we</div><div class='del'>-	 * won't be holding its i_mutex, which means we can modify the directory</div><div class='del'>-	 * while we're logging it.  If we remove an entry between our first</div><div class='del'>-	 * search and this search we'll not find the key again and can just</div><div class='del'>-	 * bail.</div><div class='add'>+	 * Find the first key from this transaction again or the one we were at</div><div class='add'>+	 * in the loop below in case we had to reschedule. We may be logging the</div><div class='add'>+	 * directory without holding its VFS lock, which happen when logging new</div><div class='add'>+	 * dentries (through log_new_dir_dentries()) or in some cases when we</div><div class='add'>+	 * need to log the parent directory of an inode. This means a dir index</div><div class='add'>+	 * key might be deleted from the inode's root, and therefore we may not</div><div class='add'>+	 * find it anymore. If we can't find it, just move to the next key. We</div><div class='add'>+	 * can not bail out and ignore, because if we do that we will simply</div><div class='add'>+	 * not log dir index keys that come after the one that was just deleted</div><div class='add'>+	 * and we can end up logging a dir index range that ends at (u64)-1</div><div class='add'>+	 * (@last_offset is initialized to that), resulting in removing dir</div><div class='add'>+	 * entries we should not remove at log replay time.</div><div class='ctx'> 	 */</div><div class='ctx'> search:</div><div class='ctx'> 	ret = btrfs_search_slot(NULL, root, &amp;min_key, path, 0, 0);</div><div class='del'>-	if (ret != 0)</div><div class='add'>+	if (ret &gt; 0) {</div><div class='add'>+		ret = btrfs_next_item(root, path);</div><div class='add'>+		if (ret &gt; 0) {</div><div class='add'>+			/* There are no more keys in the inode's root. */</div><div class='add'>+			ret = 0;</div><div class='add'>+			goto done;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	if (ret &lt; 0)</div><div class='ctx'> 		goto done;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -3949,11 +4351,11 @@ search:</div><div class='ctx'> 	 * from our directory</div><div class='ctx'> 	 */</div><div class='ctx'> 	while (1) {</div><div class='del'>-		ret = process_dir_items_leaf(trans, inode, path, dst_path,</div><div class='del'>-					     key_type, ctx);</div><div class='add'>+		ret = process_dir_items_leaf(trans, inode, path, dst_path, ctx,</div><div class='add'>+					     &amp;last_old_dentry_offset);</div><div class='ctx'> 		if (ret != 0) {</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				err = ret;</div><div class='add'>+			if (ret &gt; 0)</div><div class='add'>+				ret = 0;</div><div class='ctx'> 			goto done;</div><div class='ctx'> 		}</div><div class='ctx'> 		path-&gt;slots[0] = btrfs_header_nritems(path-&gt;nodes[0]);</div><div class='hunk'>@@ -3964,25 +4366,28 @@ search:</div><div class='ctx'> 		 */</div><div class='ctx'> 		ret = btrfs_next_leaf(root, path);</div><div class='ctx'> 		if (ret) {</div><div class='del'>-			if (ret == 1)</div><div class='add'>+			if (ret == 1) {</div><div class='ctx'> 				last_offset = (u64)-1;</div><div class='del'>-			else</div><div class='del'>-				err = ret;</div><div class='add'>+				ret = 0;</div><div class='add'>+			}</div><div class='ctx'> 			goto done;</div><div class='ctx'> 		}</div><div class='ctx'> 		btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;min_key, path-&gt;slots[0]);</div><div class='del'>-		if (min_key.objectid != ino || min_key.type != key_type) {</div><div class='add'>+		if (min_key.objectid != ino || min_key.type != BTRFS_DIR_INDEX_KEY) {</div><div class='ctx'> 			last_offset = (u64)-1;</div><div class='ctx'> 			goto done;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (btrfs_header_generation(path-&gt;nodes[0]) != trans-&gt;transid) {</div><div class='del'>-			ret = overwrite_item(trans, log, dst_path,</div><div class='del'>-					     path-&gt;nodes[0], path-&gt;slots[0],</div><div class='del'>-					     &amp;min_key);</div><div class='del'>-			if (ret)</div><div class='del'>-				err = ret;</div><div class='del'>-			else</div><div class='del'>-				last_offset = min_key.offset;</div><div class='add'>+			/*</div><div class='add'>+			 * The next leaf was not changed in the current transaction</div><div class='add'>+			 * and has at least one dir index key.</div><div class='add'>+			 * We check for the next key because there might have been</div><div class='add'>+			 * one or more deletions between the last key we logged and</div><div class='add'>+			 * that next key. So the key range item we log (key type</div><div class='add'>+			 * BTRFS_DIR_LOG_INDEX_KEY) must end at the next key's</div><div class='add'>+			 * offset minus 1, so that those deletes are replayed.</div><div class='add'>+			 */</div><div class='add'>+			last_offset = min_key.offset - 1;</div><div class='ctx'> 			goto done;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (need_resched()) {</div><div class='hunk'>@@ -3995,18 +4400,91 @@ done:</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> 	btrfs_release_path(dst_path);</div><div class='ctx'> </div><div class='del'>-	if (err == 0) {</div><div class='add'>+	if (ret == 0) {</div><div class='ctx'> 		*last_offset_ret = last_offset;</div><div class='ctx'> 		/*</div><div class='del'>-		 * insert the log range keys to indicate where the log</div><div class='del'>-		 * is valid</div><div class='add'>+		 * In case the leaf was changed in the current transaction but</div><div class='add'>+		 * all its dir items are from a past transaction, the last item</div><div class='add'>+		 * in the leaf is a dir item and there's no gap between that last</div><div class='add'>+		 * dir item and the first one on the next leaf (which did not</div><div class='add'>+		 * change in the current transaction), then we don't need to log</div><div class='add'>+		 * a range, last_old_dentry_offset is == to last_offset.</div><div class='ctx'> 		 */</div><div class='del'>-		ret = insert_dir_log_key(trans, log, path, key_type,</div><div class='del'>-					 ino, first_offset, last_offset);</div><div class='del'>-		if (ret)</div><div class='del'>-			err = ret;</div><div class='add'>+		ASSERT(last_old_dentry_offset &lt;= last_offset,</div><div class='add'>+		       "last_old_dentry_offset=%llu last_offset=%llu",</div><div class='add'>+		       last_old_dentry_offset, last_offset);</div><div class='add'>+		if (last_old_dentry_offset &lt; last_offset)</div><div class='add'>+			ret = insert_dir_log_key(trans, log, path, ino,</div><div class='add'>+						 last_old_dentry_offset + 1,</div><div class='add'>+						 last_offset);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * If the inode was logged before and it was evicted, then its</div><div class='add'>+ * last_dir_index_offset is 0, so we don't know the value of the last index</div><div class='add'>+ * key offset. If that's the case, search for it and update the inode. This</div><div class='add'>+ * is to avoid lookups in the log tree every time we try to insert a dir index</div><div class='add'>+ * key from a leaf changed in the current transaction, and to allow us to always</div><div class='add'>+ * do batch insertions of dir index keys.</div><div class='add'>+ */</div><div class='add'>+static int update_last_dir_index_offset(struct btrfs_inode *inode,</div><div class='add'>+					struct btrfs_path *path,</div><div class='add'>+					const struct btrfs_log_ctx *ctx)</div><div class='add'>+{</div><div class='add'>+	const u64 ino = btrfs_ino(inode);</div><div class='add'>+	struct btrfs_key key;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held(&amp;inode-&gt;log_mutex);</div><div class='add'>+</div><div class='add'>+	if (inode-&gt;last_dir_index_offset != 0)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if (!ctx-&gt;logged_before) {</div><div class='add'>+		inode-&gt;last_dir_index_offset = BTRFS_DIR_START_INDEX - 1;</div><div class='add'>+		return 0;</div><div class='ctx'> 	}</div><div class='del'>-	return err;</div><div class='add'>+</div><div class='add'>+	key.objectid = ino;</div><div class='add'>+	key.type = BTRFS_DIR_INDEX_KEY;</div><div class='add'>+	key.offset = (u64)-1;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_search_slot(NULL, inode-&gt;root-&gt;log_root, &amp;key, path, 0, 0);</div><div class='add'>+	/*</div><div class='add'>+	 * An error happened or we actually have an index key with an offset</div><div class='add'>+	 * value of (u64)-1. Bail out, we're done.</div><div class='add'>+	 */</div><div class='add'>+	if (ret &lt;= 0)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	ret = 0;</div><div class='add'>+	inode-&gt;last_dir_index_offset = BTRFS_DIR_START_INDEX - 1;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * No dir index items, bail out and leave last_dir_index_offset with</div><div class='add'>+	 * the value right before the first valid index value.</div><div class='add'>+	 */</div><div class='add'>+	if (path-&gt;slots[0] == 0)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * btrfs_search_slot() left us at one slot beyond the slot with the last</div><div class='add'>+	 * index key, or beyond the last key of the directory that is not an</div><div class='add'>+	 * index key. If we have an index key before, set last_dir_index_offset</div><div class='add'>+	 * to its offset value, otherwise leave it with a value right before the</div><div class='add'>+	 * first valid index value, as it means we have an empty directory.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, path-&gt;slots[0] - 1);</div><div class='add'>+	if (key.objectid == ino &amp;&amp; key.type == BTRFS_DIR_INDEX_KEY)</div><div class='add'>+		inode-&gt;last_dir_index_offset = key.offset;</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	btrfs_release_path(path);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -4030,35 +4508,16 @@ static noinline int log_directory_changes(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	u64 min_key;</div><div class='ctx'> 	u64 max_key;</div><div class='ctx'> 	int ret;</div><div class='del'>-	int key_type = BTRFS_DIR_ITEM_KEY;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * If this is the first time we are being logged in the current</div><div class='del'>-	 * transaction, or we were logged before but the inode was evicted and</div><div class='del'>-	 * reloaded later, in which case its logged_trans is 0, reset the values</div><div class='del'>-	 * of the last logged key offsets. Note that we don't use the helper</div><div class='del'>-	 * function inode_logged() here - that is because the function returns</div><div class='del'>-	 * true after an inode eviction, assuming the worst case as it can not</div><div class='del'>-	 * know for sure if the inode was logged before. So we can not skip key</div><div class='del'>-	 * searches in the case the inode was evicted, because it may not have</div><div class='del'>-	 * been logged in this transaction and may have been logged in a past</div><div class='del'>-	 * transaction, so we need to reset the last dir item and index offsets</div><div class='del'>-	 * to (u64)-1.</div><div class='del'>-	 */</div><div class='del'>-	if (inode-&gt;logged_trans != trans-&gt;transid) {</div><div class='del'>-		inode-&gt;last_dir_item_offset = (u64)-1;</div><div class='del'>-		inode-&gt;last_dir_index_offset = (u64)-1;</div><div class='del'>-	}</div><div class='del'>-again:</div><div class='del'>-	min_key = 0;</div><div class='add'>+	ret = update_last_dir_index_offset(inode, path, ctx);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	min_key = BTRFS_DIR_START_INDEX;</div><div class='ctx'> 	max_key = 0;</div><div class='del'>-	if (key_type == BTRFS_DIR_ITEM_KEY)</div><div class='del'>-		ctx-&gt;last_dir_item_offset = inode-&gt;last_dir_item_offset;</div><div class='del'>-	else</div><div class='del'>-		ctx-&gt;last_dir_item_offset = inode-&gt;last_dir_index_offset;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='del'>-		ret = log_dir_items(trans, inode, path, dst_path, key_type,</div><div class='add'>+		ret = log_dir_items(trans, inode, path, dst_path,</div><div class='ctx'> 				ctx, min_key, &amp;max_key);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='hunk'>@@ -4067,13 +4526,6 @@ again:</div><div class='ctx'> 		min_key = max_key + 1;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (key_type == BTRFS_DIR_ITEM_KEY) {</div><div class='del'>-		inode-&gt;last_dir_item_offset = ctx-&gt;last_dir_item_offset;</div><div class='del'>-		key_type = BTRFS_DIR_INDEX_KEY;</div><div class='del'>-		goto again;</div><div class='del'>-	} else {</div><div class='del'>-		inode-&gt;last_dir_index_offset = ctx-&gt;last_dir_item_offset;</div><div class='del'>-	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -4094,23 +4546,20 @@ static int drop_inode_items(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	struct btrfs_key found_key;</div><div class='ctx'> 	int start_slot;</div><div class='ctx'> </div><div class='del'>-	if (!inode_logged(trans, inode))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='ctx'> 	key.objectid = btrfs_ino(inode);</div><div class='ctx'> 	key.type = max_key_type;</div><div class='ctx'> 	key.offset = (u64)-1;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		ret = btrfs_search_slot(trans, log, &amp;key, path, -1, 1);</div><div class='del'>-		BUG_ON(ret == 0); /* Logic error */</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		if (path-&gt;slots[0] == 0)</div><div class='add'>+		if (ret &lt; 0) {</div><div class='ctx'> 			break;</div><div class='add'>+		} else if (ret &gt; 0) {</div><div class='add'>+			if (path-&gt;slots[0] == 0)</div><div class='add'>+				break;</div><div class='add'>+			path-&gt;slots[0]--;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-		path-&gt;slots[0]--;</div><div class='ctx'> 		btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;found_key,</div><div class='ctx'> 				      path-&gt;slots[0]);</div><div class='ctx'> </div><div class='hunk'>@@ -4119,7 +4568,7 @@ static int drop_inode_items(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 		found_key.offset = 0;</div><div class='ctx'> 		found_key.type = 0;</div><div class='del'>-		ret = btrfs_bin_search(path-&gt;nodes[0], &amp;found_key, &amp;start_slot);</div><div class='add'>+		ret = btrfs_bin_search(path-&gt;nodes[0], 0, &amp;found_key, &amp;start_slot);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='hunk'>@@ -4144,60 +4593,53 @@ static int truncate_inode_items(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				struct btrfs_inode *inode,</div><div class='ctx'> 				u64 new_size, u32 min_type)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		ret = btrfs_truncate_inode_items(trans, log_root, inode,</div><div class='del'>-						 new_size, min_type, NULL);</div><div class='del'>-	} while (ret == -EAGAIN);</div><div class='add'>+	struct btrfs_truncate_control control = {</div><div class='add'>+		.new_size = new_size,</div><div class='add'>+		.ino = btrfs_ino(inode),</div><div class='add'>+		.min_type = min_type,</div><div class='add'>+		.skip_ref_updates = true,</div><div class='add'>+	};</div><div class='ctx'> </div><div class='del'>-	return ret;</div><div class='add'>+	return btrfs_truncate_inode_items(trans, log_root, &amp;control);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void fill_inode_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			    struct extent_buffer *leaf,</div><div class='ctx'> 			    struct btrfs_inode_item *item,</div><div class='del'>-			    struct inode *inode, int log_inode_only,</div><div class='add'>+			    struct inode *inode, bool log_inode_only,</div><div class='ctx'> 			    u64 logged_isize)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_map_token token;</div><div class='ctx'> 	u64 flags;</div><div class='ctx'> </div><div class='del'>-	btrfs_init_map_token(&amp;token, leaf);</div><div class='del'>-</div><div class='ctx'> 	if (log_inode_only) {</div><div class='ctx'> 		/* set the generation to zero so the recover code</div><div class='ctx'> 		 * can tell the difference between an logging</div><div class='ctx'> 		 * just to say 'this inode exists' and a logging</div><div class='ctx'> 		 * to say 'update this inode with these values'</div><div class='ctx'> 		 */</div><div class='del'>-		btrfs_set_token_inode_generation(&amp;token, item, 0);</div><div class='del'>-		btrfs_set_token_inode_size(&amp;token, item, logged_isize);</div><div class='add'>+		btrfs_set_inode_generation(leaf, item, 0);</div><div class='add'>+		btrfs_set_inode_size(leaf, item, logged_isize);</div><div class='ctx'> 	} else {</div><div class='del'>-		btrfs_set_token_inode_generation(&amp;token, item,</div><div class='del'>-						 BTRFS_I(inode)-&gt;generation);</div><div class='del'>-		btrfs_set_token_inode_size(&amp;token, item, inode-&gt;i_size);</div><div class='add'>+		btrfs_set_inode_generation(leaf, item, BTRFS_I(inode)-&gt;generation);</div><div class='add'>+		btrfs_set_inode_size(leaf, item, inode-&gt;i_size);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_set_token_inode_uid(&amp;token, item, i_uid_read(inode));</div><div class='del'>-	btrfs_set_token_inode_gid(&amp;token, item, i_gid_read(inode));</div><div class='del'>-	btrfs_set_token_inode_mode(&amp;token, item, inode-&gt;i_mode);</div><div class='del'>-	btrfs_set_token_inode_nlink(&amp;token, item, inode-&gt;i_nlink);</div><div class='add'>+	btrfs_set_inode_uid(leaf, item, i_uid_read(inode));</div><div class='add'>+	btrfs_set_inode_gid(leaf, item, i_gid_read(inode));</div><div class='add'>+	btrfs_set_inode_mode(leaf, item, inode-&gt;i_mode);</div><div class='add'>+	btrfs_set_inode_nlink(leaf, item, inode-&gt;i_nlink);</div><div class='add'>+</div><div class='add'>+	btrfs_set_timespec_sec(leaf, &amp;item-&gt;atime, inode_get_atime_sec(inode));</div><div class='add'>+	btrfs_set_timespec_nsec(leaf, &amp;item-&gt;atime, inode_get_atime_nsec(inode));</div><div class='ctx'> </div><div class='del'>-	btrfs_set_token_timespec_sec(&amp;token, &amp;item-&gt;atime,</div><div class='del'>-				     inode-&gt;i_atime.tv_sec);</div><div class='del'>-	btrfs_set_token_timespec_nsec(&amp;token, &amp;item-&gt;atime,</div><div class='del'>-				      inode-&gt;i_atime.tv_nsec);</div><div class='add'>+	btrfs_set_timespec_sec(leaf, &amp;item-&gt;mtime, inode_get_mtime_sec(inode));</div><div class='add'>+	btrfs_set_timespec_nsec(leaf, &amp;item-&gt;mtime, inode_get_mtime_nsec(inode));</div><div class='ctx'> </div><div class='del'>-	btrfs_set_token_timespec_sec(&amp;token, &amp;item-&gt;mtime,</div><div class='del'>-				     inode-&gt;i_mtime.tv_sec);</div><div class='del'>-	btrfs_set_token_timespec_nsec(&amp;token, &amp;item-&gt;mtime,</div><div class='del'>-				      inode-&gt;i_mtime.tv_nsec);</div><div class='add'>+	btrfs_set_timespec_sec(leaf, &amp;item-&gt;ctime, inode_get_ctime_sec(inode));</div><div class='add'>+	btrfs_set_timespec_nsec(leaf, &amp;item-&gt;ctime, inode_get_ctime_nsec(inode));</div><div class='ctx'> </div><div class='del'>-	btrfs_set_token_timespec_sec(&amp;token, &amp;item-&gt;ctime,</div><div class='del'>-				     inode-&gt;i_ctime.tv_sec);</div><div class='del'>-	btrfs_set_token_timespec_nsec(&amp;token, &amp;item-&gt;ctime,</div><div class='del'>-				      inode-&gt;i_ctime.tv_nsec);</div><div class='add'>+	btrfs_set_timespec_sec(leaf, &amp;item-&gt;otime, BTRFS_I(inode)-&gt;i_otime_sec);</div><div class='add'>+	btrfs_set_timespec_nsec(leaf, &amp;item-&gt;otime, BTRFS_I(inode)-&gt;i_otime_nsec);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We do not need to set the nbytes field, in fact during a fast fsync</div><div class='hunk'>@@ -4208,13 +4650,13 @@ static void fill_inode_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * inode item in subvolume tree as needed (see overwrite_item()).</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='del'>-	btrfs_set_token_inode_sequence(&amp;token, item, inode_peek_iversion(inode));</div><div class='del'>-	btrfs_set_token_inode_transid(&amp;token, item, trans-&gt;transid);</div><div class='del'>-	btrfs_set_token_inode_rdev(&amp;token, item, inode-&gt;i_rdev);</div><div class='add'>+	btrfs_set_inode_sequence(leaf, item, inode_peek_iversion(inode));</div><div class='add'>+	btrfs_set_inode_transid(leaf, item, trans-&gt;transid);</div><div class='add'>+	btrfs_set_inode_rdev(leaf, item, inode-&gt;i_rdev);</div><div class='ctx'> 	flags = btrfs_inode_combine_flags(BTRFS_I(inode)-&gt;flags,</div><div class='ctx'> 					  BTRFS_I(inode)-&gt;ro_flags);</div><div class='del'>-	btrfs_set_token_inode_flags(&amp;token, item, flags);</div><div class='del'>-	btrfs_set_token_inode_block_group(&amp;token, item, 0);</div><div class='add'>+	btrfs_set_inode_flags(leaf, item, flags);</div><div class='add'>+	btrfs_set_inode_block_group(leaf, item, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int log_inode_item(struct btrfs_trans_handle *trans,</div><div class='hunk'>@@ -4222,8 +4664,10 @@ static int log_inode_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			  struct btrfs_inode *inode, bool inode_item_dropped)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_inode_item *inode_item;</div><div class='add'>+	struct btrfs_key key;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='add'>+	btrfs_get_inode_key(inode, &amp;key);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If we are doing a fast fsync and the inode was logged before in the</div><div class='ctx'> 	 * current transaction, then we know the inode was previously logged and</div><div class='hunk'>@@ -4235,7 +4679,7 @@ static int log_inode_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * already exists can also result in unnecessarily splitting a leaf.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (!inode_item_dropped &amp;&amp; inode-&gt;logged_trans == trans-&gt;transid) {</div><div class='del'>-		ret = btrfs_search_slot(trans, log, &amp;inode-&gt;location, path, 0, 1);</div><div class='add'>+		ret = btrfs_search_slot(trans, log, &amp;key, path, 0, 1);</div><div class='ctx'> 		ASSERT(ret &lt;= 0);</div><div class='ctx'> 		if (ret &gt; 0)</div><div class='ctx'> 			ret = -ENOENT;</div><div class='hunk'>@@ -4249,7 +4693,7 @@ static int log_inode_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		 * the inode, we set BTRFS_INODE_NEEDS_FULL_SYNC on its runtime</div><div class='ctx'> 		 * flags and set -&gt;logged_trans to 0.</div><div class='ctx'> 		 */</div><div class='del'>-		ret = btrfs_insert_empty_item(trans, log, path, &amp;inode-&gt;location,</div><div class='add'>+		ret = btrfs_insert_empty_item(trans, log, path, &amp;key,</div><div class='ctx'> 					      sizeof(*inode_item));</div><div class='ctx'> 		ASSERT(ret != -EEXIST);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -4258,7 +4702,7 @@ static int log_inode_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	inode_item = btrfs_item_ptr(path-&gt;nodes[0], path-&gt;slots[0],</div><div class='ctx'> 				    struct btrfs_inode_item);</div><div class='ctx'> 	fill_inode_item(trans, path-&gt;nodes[0], inode_item, &amp;inode-&gt;vfs_inode,</div><div class='del'>-			0, 0);</div><div class='add'>+			false, 0);</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -4268,7 +4712,7 @@ static int log_csums(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		     struct btrfs_root *log_root,</div><div class='ctx'> 		     struct btrfs_ordered_sum *sums)</div><div class='ctx'> {</div><div class='del'>-	const u64 lock_end = sums-&gt;bytenr + sums-&gt;len - 1;</div><div class='add'>+	const u64 lock_end = sums-&gt;logical + sums-&gt;len - 1;</div><div class='ctx'> 	struct extent_state *cached_state = NULL;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -4286,8 +4730,8 @@ static int log_csums(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * file which happens to refer to the same extent as well. Such races</div><div class='ctx'> 	 * can leave checksum items in the log with overlapping ranges.</div><div class='ctx'> 	 */</div><div class='del'>-	ret = lock_extent_bits(&amp;log_root-&gt;log_csum_range, sums-&gt;bytenr,</div><div class='del'>-			       lock_end, &amp;cached_state);</div><div class='add'>+	ret = btrfs_lock_extent(&amp;log_root-&gt;log_csum_range, sums-&gt;logical, lock_end,</div><div class='add'>+				&amp;cached_state);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -4299,12 +4743,12 @@ static int log_csums(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * some checksums missing in the fs/subvolume tree. So just delete (or</div><div class='ctx'> 	 * trim and adjust) any existing csum items in the log for this range.</div><div class='ctx'> 	 */</div><div class='del'>-	ret = btrfs_del_csums(trans, log_root, sums-&gt;bytenr, sums-&gt;len);</div><div class='add'>+	ret = btrfs_del_csums(trans, log_root, sums-&gt;logical, sums-&gt;len);</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		ret = btrfs_csum_file_blocks(trans, log_root, sums);</div><div class='ctx'> </div><div class='del'>-	unlock_extent_cached(&amp;log_root-&gt;log_csum_range, sums-&gt;bytenr, lock_end,</div><div class='del'>-			     &amp;cached_state);</div><div class='add'>+	btrfs_unlock_extent(&amp;log_root-&gt;log_csum_range, sums-&gt;logical, lock_end,</div><div class='add'>+			    &amp;cached_state);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -4314,28 +4758,55 @@ static noinline int copy_items(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			       struct btrfs_path *dst_path,</div><div class='ctx'> 			       struct btrfs_path *src_path,</div><div class='ctx'> 			       int start_slot, int nr, int inode_only,</div><div class='del'>-			       u64 logged_isize)</div><div class='add'>+			       u64 logged_isize, struct btrfs_log_ctx *ctx)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='del'>-	unsigned long src_offset;</div><div class='del'>-	unsigned long dst_offset;</div><div class='ctx'> 	struct btrfs_root *log = inode-&gt;root-&gt;log_root;</div><div class='ctx'> 	struct btrfs_file_extent_item *extent;</div><div class='del'>-	struct btrfs_inode_item *inode_item;</div><div class='del'>-	struct extent_buffer *src = src_path-&gt;nodes[0];</div><div class='add'>+	struct extent_buffer *src;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct btrfs_key *ins_keys;</div><div class='ctx'> 	u32 *ins_sizes;</div><div class='ctx'> 	struct btrfs_item_batch batch;</div><div class='del'>-	char *ins_data;</div><div class='del'>-	int i;</div><div class='del'>-	struct list_head ordered_sums;</div><div class='del'>-	int skip_csum = inode-&gt;flags &amp; BTRFS_INODE_NODATASUM;</div><div class='add'>+	char AUTO_KFREE(ins_data);</div><div class='add'>+	int dst_index;</div><div class='add'>+	const bool skip_csum = (inode-&gt;flags &amp; BTRFS_INODE_NODATASUM);</div><div class='add'>+	const u64 i_size = i_size_read(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> </div><div class='del'>-	INIT_LIST_HEAD(&amp;ordered_sums);</div><div class='add'>+	/*</div><div class='add'>+	 * To keep lockdep happy and avoid deadlocks, clone the source leaf and</div><div class='add'>+	 * use the clone. This is because otherwise we would be changing the log</div><div class='add'>+	 * tree, to insert items from the subvolume tree or insert csum items,</div><div class='add'>+	 * while holding a read lock on a leaf from the subvolume tree, which</div><div class='add'>+	 * creates a nasty lock dependency when COWing log tree nodes/leaves:</div><div class='add'>+	 *</div><div class='add'>+	 * 1) Modifying the log tree triggers an extent buffer allocation while</div><div class='add'>+	 *    holding a write lock on a parent extent buffer from the log tree.</div><div class='add'>+	 *    Allocating the pages for an extent buffer, or the extent buffer</div><div class='add'>+	 *    struct, can trigger inode eviction and finally the inode eviction</div><div class='add'>+	 *    will trigger a release/remove of a delayed node, which requires</div><div class='add'>+	 *    taking the delayed node's mutex;</div><div class='add'>+	 *</div><div class='add'>+	 * 2) Allocating a metadata extent for a log tree can trigger the async</div><div class='add'>+	 *    reclaim thread and make us wait for it to release enough space and</div><div class='add'>+	 *    unblock our reservation ticket. The reclaim thread can start</div><div class='add'>+	 *    flushing delayed items, and that in turn results in the need to</div><div class='add'>+	 *    lock delayed node mutexes and in the need to write lock extent</div><div class='add'>+	 *    buffers of a subvolume tree - all this while holding a write lock</div><div class='add'>+	 *    on the parent extent buffer in the log tree.</div><div class='add'>+	 *</div><div class='add'>+	 * So one task in scenario 1) running in parallel with another task in</div><div class='add'>+	 * scenario 2) could lead to a deadlock, one wanting to lock a delayed</div><div class='add'>+	 * node mutex while having a read lock on a leaf from the subvolume,</div><div class='add'>+	 * while the other is holding the delayed node's mutex and wants to</div><div class='add'>+	 * write lock the same subvolume leaf for flushing delayed items.</div><div class='add'>+	 */</div><div class='add'>+	ret = clone_leaf(src_path, ctx);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	ins_data = kmalloc(nr * sizeof(struct btrfs_key) +</div><div class='del'>-			   nr * sizeof(u32), GFP_NOFS);</div><div class='add'>+	src = src_path-&gt;nodes[0];</div><div class='add'>+</div><div class='add'>+	ins_data = kmalloc_array(nr, sizeof(struct btrfs_key) + sizeof(u32), GFP_NOFS);</div><div class='ctx'> 	if (!ins_data)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='hunk'>@@ -4344,28 +4815,153 @@ static noinline int copy_items(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	batch.keys = ins_keys;</div><div class='ctx'> 	batch.data_sizes = ins_sizes;</div><div class='ctx'> 	batch.total_data_size = 0;</div><div class='del'>-	batch.nr = nr;</div><div class='add'>+	batch.nr = 0;</div><div class='add'>+</div><div class='add'>+	dst_index = 0;</div><div class='add'>+	for (int i = 0; i &lt; nr; i++) {</div><div class='add'>+		const int src_slot = start_slot + i;</div><div class='add'>+		struct btrfs_root *csum_root;</div><div class='add'>+		struct btrfs_ordered_sum *sums;</div><div class='add'>+		struct btrfs_ordered_sum *sums_next;</div><div class='add'>+		LIST_HEAD(ordered_sums);</div><div class='add'>+		u64 disk_bytenr;</div><div class='add'>+		u64 disk_num_bytes;</div><div class='add'>+		u64 extent_offset;</div><div class='add'>+		u64 extent_num_bytes;</div><div class='add'>+		bool is_old_extent;</div><div class='add'>+</div><div class='add'>+		btrfs_item_key_to_cpu(src, &amp;ins_keys[dst_index], src_slot);</div><div class='add'>+</div><div class='add'>+		if (ins_keys[dst_index].type != BTRFS_EXTENT_DATA_KEY)</div><div class='add'>+			goto add_to_batch;</div><div class='add'>+</div><div class='add'>+		extent = btrfs_item_ptr(src, src_slot,</div><div class='add'>+					struct btrfs_file_extent_item);</div><div class='add'>+</div><div class='add'>+		is_old_extent = (btrfs_file_extent_generation(src, extent) &lt;</div><div class='add'>+				 trans-&gt;transid);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Don't copy extents from past generations. That would make us</div><div class='add'>+		 * log a lot more metadata for common cases like doing only a</div><div class='add'>+		 * few random writes into a file and then fsync it for the first</div><div class='add'>+		 * time or after the full sync flag is set on the inode. We can</div><div class='add'>+		 * get leaves full of extent items, most of which are from past</div><div class='add'>+		 * generations, so we can skip them - as long as the inode has</div><div class='add'>+		 * not been the target of a reflink operation in this transaction,</div><div class='add'>+		 * as in that case it might have had file extent items with old</div><div class='add'>+		 * generations copied into it. We also must always log prealloc</div><div class='add'>+		 * extents that start at or beyond eof, otherwise we would lose</div><div class='add'>+		 * them on log replay.</div><div class='add'>+		 */</div><div class='add'>+		if (is_old_extent &amp;&amp;</div><div class='add'>+		    ins_keys[dst_index].offset &lt; i_size &amp;&amp;</div><div class='add'>+		    inode-&gt;last_reflink_trans &lt; trans-&gt;transid)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		if (skip_csum)</div><div class='add'>+			goto add_to_batch;</div><div class='add'>+</div><div class='add'>+		/* Only regular extents have checksums. */</div><div class='add'>+		if (btrfs_file_extent_type(src, extent) != BTRFS_FILE_EXTENT_REG)</div><div class='add'>+			goto add_to_batch;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * If it's an extent created in a past transaction, then its</div><div class='add'>+		 * checksums are already accessible from the committed csum tree,</div><div class='add'>+		 * no need to log them.</div><div class='add'>+		 */</div><div class='add'>+		if (is_old_extent)</div><div class='add'>+			goto add_to_batch;</div><div class='add'>+</div><div class='add'>+		disk_bytenr = btrfs_file_extent_disk_bytenr(src, extent);</div><div class='add'>+		/* If it's an explicit hole, there are no checksums. */</div><div class='add'>+		if (disk_bytenr == 0)</div><div class='add'>+			goto add_to_batch;</div><div class='add'>+</div><div class='add'>+		disk_num_bytes = btrfs_file_extent_disk_num_bytes(src, extent);</div><div class='add'>+</div><div class='add'>+		if (btrfs_file_extent_compression(src, extent)) {</div><div class='add'>+			extent_offset = 0;</div><div class='add'>+			extent_num_bytes = disk_num_bytes;</div><div class='add'>+		} else {</div><div class='add'>+			extent_offset = btrfs_file_extent_offset(src, extent);</div><div class='add'>+			extent_num_bytes = btrfs_file_extent_num_bytes(src, extent);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		csum_root = btrfs_csum_root(trans-&gt;fs_info, disk_bytenr);</div><div class='add'>+		disk_bytenr += extent_offset;</div><div class='add'>+		ret = btrfs_lookup_csums_list(csum_root, disk_bytenr,</div><div class='add'>+					      disk_bytenr + extent_num_bytes - 1,</div><div class='add'>+					      &amp;ordered_sums, false);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='add'>+		ret = 0;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; nr; i++) {</div><div class='del'>-		ins_sizes[i] = btrfs_item_size_nr(src, i + start_slot);</div><div class='del'>-		batch.total_data_size += ins_sizes[i];</div><div class='del'>-		btrfs_item_key_to_cpu(src, ins_keys + i, i + start_slot);</div><div class='add'>+		list_for_each_entry_safe(sums, sums_next, &amp;ordered_sums, list) {</div><div class='add'>+			if (!ret)</div><div class='add'>+				ret = log_csums(trans, inode, log, sums);</div><div class='add'>+			list_del(&amp;sums-&gt;list);</div><div class='add'>+			kfree(sums);</div><div class='add'>+		}</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+</div><div class='add'>+add_to_batch:</div><div class='add'>+		ins_sizes[dst_index] = btrfs_item_size(src, src_slot);</div><div class='add'>+		batch.total_data_size += ins_sizes[dst_index];</div><div class='add'>+		batch.nr++;</div><div class='add'>+		dst_index++;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We have a leaf full of old extent items that don't need to be logged,</div><div class='add'>+	 * so we don't need to do anything.</div><div class='add'>+	 */</div><div class='add'>+	if (batch.nr == 0)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='ctx'> 	ret = btrfs_insert_empty_items(trans, log, dst_path, &amp;batch);</div><div class='del'>-	if (ret) {</div><div class='del'>-		kfree(ins_data);</div><div class='add'>+	if (ret)</div><div class='ctx'> 		return ret;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; nr; i++, dst_path-&gt;slots[0]++) {</div><div class='del'>-		dst_offset = btrfs_item_ptr_offset(dst_path-&gt;nodes[0],</div><div class='del'>-						   dst_path-&gt;slots[0]);</div><div class='add'>+	dst_index = 0;</div><div class='add'>+	for (int i = 0; i &lt; nr; i++) {</div><div class='add'>+		const int src_slot = start_slot + i;</div><div class='add'>+		const int dst_slot = dst_path-&gt;slots[0] + dst_index;</div><div class='add'>+		struct btrfs_key key;</div><div class='add'>+		unsigned long src_offset;</div><div class='add'>+		unsigned long dst_offset;</div><div class='ctx'> </div><div class='del'>-		src_offset = btrfs_item_ptr_offset(src, start_slot + i);</div><div class='add'>+		/*</div><div class='add'>+		 * We're done, all the remaining items in the source leaf</div><div class='add'>+		 * correspond to old file extent items.</div><div class='add'>+		 */</div><div class='add'>+		if (dst_index &gt;= batch.nr)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		btrfs_item_key_to_cpu(src, &amp;key, src_slot);</div><div class='add'>+</div><div class='add'>+		if (key.type != BTRFS_EXTENT_DATA_KEY)</div><div class='add'>+			goto copy_item;</div><div class='add'>+</div><div class='add'>+		extent = btrfs_item_ptr(src, src_slot,</div><div class='add'>+					struct btrfs_file_extent_item);</div><div class='ctx'> </div><div class='del'>-		if (ins_keys[i].type == BTRFS_INODE_ITEM_KEY) {</div><div class='del'>-			inode_item = btrfs_item_ptr(dst_path-&gt;nodes[0],</div><div class='del'>-						    dst_path-&gt;slots[0],</div><div class='add'>+		/* See the comment in the previous loop, same logic. */</div><div class='add'>+		if (btrfs_file_extent_generation(src, extent) &lt; trans-&gt;transid &amp;&amp;</div><div class='add'>+		    key.offset &lt; i_size &amp;&amp;</div><div class='add'>+		    inode-&gt;last_reflink_trans &lt; trans-&gt;transid)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+copy_item:</div><div class='add'>+		dst_offset = btrfs_item_ptr_offset(dst_path-&gt;nodes[0], dst_slot);</div><div class='add'>+		src_offset = btrfs_item_ptr_offset(src, src_slot);</div><div class='add'>+</div><div class='add'>+		if (key.type == BTRFS_INODE_ITEM_KEY) {</div><div class='add'>+			struct btrfs_inode_item *inode_item;</div><div class='add'>+</div><div class='add'>+			inode_item = btrfs_item_ptr(dst_path-&gt;nodes[0], dst_slot,</div><div class='ctx'> 						    struct btrfs_inode_item);</div><div class='ctx'> 			fill_inode_item(trans, dst_path-&gt;nodes[0], inode_item,</div><div class='ctx'> 					&amp;inode-&gt;vfs_inode,</div><div class='hunk'>@@ -4373,69 +4969,13 @@ static noinline int copy_items(struct btrfs_trans_handle *trans,</div><div class='ctx'> 					logged_isize);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			copy_extent_buffer(dst_path-&gt;nodes[0], src, dst_offset,</div><div class='del'>-					   src_offset, ins_sizes[i]);</div><div class='add'>+					   src_offset, ins_sizes[dst_index]);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		/* take a reference on file data extents so that truncates</div><div class='del'>-		 * or deletes of this inode don't have to relog the inode</div><div class='del'>-		 * again</div><div class='del'>-		 */</div><div class='del'>-		if (ins_keys[i].type == BTRFS_EXTENT_DATA_KEY &amp;&amp;</div><div class='del'>-		    !skip_csum) {</div><div class='del'>-			int found_type;</div><div class='del'>-			extent = btrfs_item_ptr(src, start_slot + i,</div><div class='del'>-						struct btrfs_file_extent_item);</div><div class='del'>-</div><div class='del'>-			if (btrfs_file_extent_generation(src, extent) &lt; trans-&gt;transid)</div><div class='del'>-				continue;</div><div class='del'>-</div><div class='del'>-			found_type = btrfs_file_extent_type(src, extent);</div><div class='del'>-			if (found_type == BTRFS_FILE_EXTENT_REG) {</div><div class='del'>-				u64 ds, dl, cs, cl;</div><div class='del'>-				ds = btrfs_file_extent_disk_bytenr(src,</div><div class='del'>-								extent);</div><div class='del'>-				/* ds == 0 is a hole */</div><div class='del'>-				if (ds == 0)</div><div class='del'>-					continue;</div><div class='del'>-</div><div class='del'>-				dl = btrfs_file_extent_disk_num_bytes(src,</div><div class='del'>-								extent);</div><div class='del'>-				cs = btrfs_file_extent_offset(src, extent);</div><div class='del'>-				cl = btrfs_file_extent_num_bytes(src,</div><div class='del'>-								extent);</div><div class='del'>-				if (btrfs_file_extent_compression(src,</div><div class='del'>-								  extent)) {</div><div class='del'>-					cs = 0;</div><div class='del'>-					cl = dl;</div><div class='del'>-				}</div><div class='del'>-</div><div class='del'>-				ret = btrfs_lookup_csums_range(</div><div class='del'>-						fs_info-&gt;csum_root,</div><div class='del'>-						ds + cs, ds + cs + cl - 1,</div><div class='del'>-						&amp;ordered_sums, 0);</div><div class='del'>-				if (ret)</div><div class='del'>-					break;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='add'>+		dst_index++;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_mark_buffer_dirty(dst_path-&gt;nodes[0]);</div><div class='ctx'> 	btrfs_release_path(dst_path);</div><div class='del'>-	kfree(ins_data);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * we have to do this after the loop above to avoid changing the</div><div class='del'>-	 * log tree while trying to change the log tree.</div><div class='del'>-	 */</div><div class='del'>-	while (!list_empty(&amp;ordered_sums)) {</div><div class='del'>-		struct btrfs_ordered_sum *sums = list_entry(ordered_sums.next,</div><div class='del'>-						   struct btrfs_ordered_sum,</div><div class='del'>-						   list);</div><div class='del'>-		if (!ret)</div><div class='del'>-			ret = log_csums(trans, inode, log, sums);</div><div class='del'>-		list_del(&amp;sums-&gt;list);</div><div class='del'>-		kfree(sums);</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -4462,16 +5002,18 @@ static int log_extent_csums(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			    struct btrfs_log_ctx *ctx)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_ordered_extent *ordered;</div><div class='add'>+	struct btrfs_root *csum_root;</div><div class='add'>+	u64 block_start;</div><div class='ctx'> 	u64 csum_offset;</div><div class='ctx'> 	u64 csum_len;</div><div class='del'>-	u64 mod_start = em-&gt;mod_start;</div><div class='del'>-	u64 mod_len = em-&gt;mod_len;</div><div class='add'>+	u64 mod_start = em-&gt;start;</div><div class='add'>+	u64 mod_len = em-&gt;len;</div><div class='ctx'> 	LIST_HEAD(ordered_sums);</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (inode-&gt;flags &amp; BTRFS_INODE_NODATASUM ||</div><div class='del'>-	    test_bit(EXTENT_FLAG_PREALLOC, &amp;em-&gt;flags) ||</div><div class='del'>-	    em-&gt;block_start == EXTENT_MAP_HOLE)</div><div class='add'>+	    (em-&gt;flags &amp; EXTENT_FLAG_PREALLOC) ||</div><div class='add'>+	    em-&gt;disk_bytenr == EXTENT_MAP_HOLE)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(ordered, &amp;ctx-&gt;ordered_extents, log_list) {</div><div class='hunk'>@@ -4533,26 +5075,28 @@ static int log_extent_csums(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/* If we're compressed we have to save the entire range of csums. */</div><div class='del'>-	if (em-&gt;compress_type) {</div><div class='add'>+	if (btrfs_extent_map_is_compressed(em)) {</div><div class='ctx'> 		csum_offset = 0;</div><div class='del'>-		csum_len = max(em-&gt;block_len, em-&gt;orig_block_len);</div><div class='add'>+		csum_len = em-&gt;disk_num_bytes;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		csum_offset = mod_start - em-&gt;start;</div><div class='ctx'> 		csum_len = mod_len;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* block start is already adjusted for the file extent offset. */</div><div class='del'>-	ret = btrfs_lookup_csums_range(trans-&gt;fs_info-&gt;csum_root,</div><div class='del'>-				       em-&gt;block_start + csum_offset,</div><div class='del'>-				       em-&gt;block_start + csum_offset +</div><div class='del'>-				       csum_len - 1, &amp;ordered_sums, 0);</div><div class='del'>-	if (ret)</div><div class='add'>+	block_start = btrfs_extent_map_block_start(em);</div><div class='add'>+	csum_root = btrfs_csum_root(trans-&gt;fs_info, block_start);</div><div class='add'>+	ret = btrfs_lookup_csums_list(csum_root, block_start + csum_offset,</div><div class='add'>+				      block_start + csum_offset + csum_len - 1,</div><div class='add'>+				      &amp;ordered_sums, false);</div><div class='add'>+	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='add'>+	ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	while (!list_empty(&amp;ordered_sums)) {</div><div class='del'>-		struct btrfs_ordered_sum *sums = list_entry(ordered_sums.next,</div><div class='del'>-						   struct btrfs_ordered_sum,</div><div class='del'>-						   list);</div><div class='add'>+		struct btrfs_ordered_sum *sums = list_first_entry(&amp;ordered_sums,</div><div class='add'>+								  struct btrfs_ordered_sum,</div><div class='add'>+								  list);</div><div class='ctx'> 		if (!ret)</div><div class='ctx'> 			ret = log_csums(trans, inode, log_root, sums);</div><div class='ctx'> 		list_del(&amp;sums-&gt;list);</div><div class='hunk'>@@ -4570,14 +5114,36 @@ static int log_one_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_drop_extents_args drop_args = { 0 };</div><div class='ctx'> 	struct btrfs_root *log = inode-&gt;root-&gt;log_root;</div><div class='del'>-	struct btrfs_file_extent_item *fi;</div><div class='add'>+	struct btrfs_file_extent_item fi = { 0 };</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='del'>-	struct btrfs_map_token token;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='del'>-	u64 extent_offset = em-&gt;start - em-&gt;orig_start;</div><div class='add'>+	enum btrfs_compression_type compress_type;</div><div class='add'>+	u64 extent_offset = em-&gt;offset;</div><div class='add'>+	u64 block_start = btrfs_extent_map_block_start(em);</div><div class='ctx'> 	u64 block_len;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='add'>+	btrfs_set_stack_file_extent_generation(&amp;fi, trans-&gt;transid);</div><div class='add'>+	if (em-&gt;flags &amp; EXTENT_FLAG_PREALLOC)</div><div class='add'>+		btrfs_set_stack_file_extent_type(&amp;fi, BTRFS_FILE_EXTENT_PREALLOC);</div><div class='add'>+	else</div><div class='add'>+		btrfs_set_stack_file_extent_type(&amp;fi, BTRFS_FILE_EXTENT_REG);</div><div class='add'>+</div><div class='add'>+	block_len = em-&gt;disk_num_bytes;</div><div class='add'>+	compress_type = btrfs_extent_map_compression(em);</div><div class='add'>+	if (compress_type != BTRFS_COMPRESS_NONE) {</div><div class='add'>+		btrfs_set_stack_file_extent_disk_bytenr(&amp;fi, block_start);</div><div class='add'>+		btrfs_set_stack_file_extent_disk_num_bytes(&amp;fi, block_len);</div><div class='add'>+	} else if (em-&gt;disk_bytenr &lt; EXTENT_MAP_LAST_BYTE) {</div><div class='add'>+		btrfs_set_stack_file_extent_disk_bytenr(&amp;fi, block_start - extent_offset);</div><div class='add'>+		btrfs_set_stack_file_extent_disk_num_bytes(&amp;fi, block_len);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	btrfs_set_stack_file_extent_offset(&amp;fi, extent_offset);</div><div class='add'>+	btrfs_set_stack_file_extent_num_bytes(&amp;fi, em-&gt;len);</div><div class='add'>+	btrfs_set_stack_file_extent_ram_bytes(&amp;fi, em-&gt;ram_bytes);</div><div class='add'>+	btrfs_set_stack_file_extent_compression(&amp;fi, compress_type);</div><div class='add'>+</div><div class='ctx'> 	ret = log_extent_csums(trans, inode, log, em, ctx);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -4591,12 +5157,12 @@ static int log_one_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * are small, with a root at level 2 or 3 at most, due to their short</div><div class='ctx'> 	 * life span.</div><div class='ctx'> 	 */</div><div class='del'>-	if (inode_logged(trans, inode)) {</div><div class='add'>+	if (ctx-&gt;logged_before) {</div><div class='ctx'> 		drop_args.path = path;</div><div class='ctx'> 		drop_args.start = em-&gt;start;</div><div class='ctx'> 		drop_args.end = em-&gt;start + em-&gt;len;</div><div class='ctx'> 		drop_args.replace_extent = true;</div><div class='del'>-		drop_args.extent_item_size = sizeof(*fi);</div><div class='add'>+		drop_args.extent_item_size = sizeof(fi);</div><div class='ctx'> 		ret = btrfs_drop_extents(trans, log, inode, &amp;drop_args);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='hunk'>@@ -4608,45 +5174,14 @@ static int log_one_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		key.offset = em-&gt;start;</div><div class='ctx'> </div><div class='ctx'> 		ret = btrfs_insert_empty_item(trans, log, path, &amp;key,</div><div class='del'>-					      sizeof(*fi));</div><div class='add'>+					      sizeof(fi));</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 	}</div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='del'>-	btrfs_init_map_token(&amp;token, leaf);</div><div class='del'>-	fi = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='del'>-			    struct btrfs_file_extent_item);</div><div class='del'>-</div><div class='del'>-	btrfs_set_token_file_extent_generation(&amp;token, fi, trans-&gt;transid);</div><div class='del'>-	if (test_bit(EXTENT_FLAG_PREALLOC, &amp;em-&gt;flags))</div><div class='del'>-		btrfs_set_token_file_extent_type(&amp;token, fi,</div><div class='del'>-						 BTRFS_FILE_EXTENT_PREALLOC);</div><div class='del'>-	else</div><div class='del'>-		btrfs_set_token_file_extent_type(&amp;token, fi,</div><div class='del'>-						 BTRFS_FILE_EXTENT_REG);</div><div class='del'>-</div><div class='del'>-	block_len = max(em-&gt;block_len, em-&gt;orig_block_len);</div><div class='del'>-	if (em-&gt;compress_type != BTRFS_COMPRESS_NONE) {</div><div class='del'>-		btrfs_set_token_file_extent_disk_bytenr(&amp;token, fi,</div><div class='del'>-							em-&gt;block_start);</div><div class='del'>-		btrfs_set_token_file_extent_disk_num_bytes(&amp;token, fi, block_len);</div><div class='del'>-	} else if (em-&gt;block_start &lt; EXTENT_MAP_LAST_BYTE) {</div><div class='del'>-		btrfs_set_token_file_extent_disk_bytenr(&amp;token, fi,</div><div class='del'>-							em-&gt;block_start -</div><div class='del'>-							extent_offset);</div><div class='del'>-		btrfs_set_token_file_extent_disk_num_bytes(&amp;token, fi, block_len);</div><div class='del'>-	} else {</div><div class='del'>-		btrfs_set_token_file_extent_disk_bytenr(&amp;token, fi, 0);</div><div class='del'>-		btrfs_set_token_file_extent_disk_num_bytes(&amp;token, fi, 0);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	btrfs_set_token_file_extent_offset(&amp;token, fi, extent_offset);</div><div class='del'>-	btrfs_set_token_file_extent_num_bytes(&amp;token, fi, em-&gt;len);</div><div class='del'>-	btrfs_set_token_file_extent_ram_bytes(&amp;token, fi, em-&gt;ram_bytes);</div><div class='del'>-	btrfs_set_token_file_extent_compression(&amp;token, fi, em-&gt;compress_type);</div><div class='del'>-	btrfs_set_token_file_extent_encryption(&amp;token, fi, 0);</div><div class='del'>-	btrfs_set_token_file_extent_other_encoding(&amp;token, fi, 0);</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='add'>+	write_extent_buffer(leaf, &amp;fi,</div><div class='add'>+			    btrfs_item_ptr_offset(leaf, path-&gt;slots[0]),</div><div class='add'>+			    sizeof(fi));</div><div class='ctx'> </div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> </div><div class='hunk'>@@ -4655,7 +5190,7 @@ static int log_one_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Log all prealloc extents beyond the inode's i_size to make sure we do not</div><div class='del'>- * lose them after doing a fast fsync and replaying the log. We scan the</div><div class='add'>+ * lose them after doing a full/fast fsync and replaying the log. We scan the</div><div class='ctx'>  * subvolume's root instead of iterating the inode's extent map tree because</div><div class='ctx'>  * otherwise we can log incorrect extent items based on extent map conversion.</div><div class='ctx'>  * That can happen due to the fact that extent maps are merged when they</div><div class='hunk'>@@ -4663,19 +5198,20 @@ static int log_one_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'>  */</div><div class='ctx'> static int btrfs_log_prealloc_extents(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				      struct btrfs_inode *inode,</div><div class='del'>-				      struct btrfs_path *path)</div><div class='add'>+				      struct btrfs_path *path,</div><div class='add'>+				      struct btrfs_log_ctx *ctx)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	const u64 i_size = i_size_read(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> 	const u64 ino = btrfs_ino(inode);</div><div class='del'>-	struct btrfs_path *dst_path = NULL;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(dst_path);</div><div class='ctx'> 	bool dropped_extents = false;</div><div class='ctx'> 	u64 truncate_offset = i_size;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	int slot;</div><div class='ctx'> 	int ins_nr = 0;</div><div class='del'>-	int start_slot;</div><div class='add'>+	int start_slot = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!(inode-&gt;flags &amp; BTRFS_INODE_PREALLOC))</div><div class='hunk'>@@ -4729,7 +5265,7 @@ static int btrfs_log_prealloc_extents(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		if (slot &gt;= btrfs_header_nritems(leaf)) {</div><div class='ctx'> 			if (ins_nr &gt; 0) {</div><div class='ctx'> 				ret = copy_items(trans, inode, dst_path, path,</div><div class='del'>-						 start_slot, ins_nr, 1, 0);</div><div class='add'>+						 start_slot, ins_nr, 1, 0, ctx);</div><div class='ctx'> 				if (ret &lt; 0)</div><div class='ctx'> 					goto out;</div><div class='ctx'> 				ins_nr = 0;</div><div class='hunk'>@@ -4753,18 +5289,23 @@ static int btrfs_log_prealloc_extents(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			path-&gt;slots[0]++;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='del'>-		if (!dropped_extents) {</div><div class='del'>-			/*</div><div class='del'>-			 * Avoid logging extent items logged in past fsync calls</div><div class='del'>-			 * and leading to duplicate keys in the log tree.</div><div class='del'>-			 */</div><div class='add'>+		/*</div><div class='add'>+		 * Avoid overlapping items in the log tree. The first time we</div><div class='add'>+		 * get here, get rid of everything from a past fsync. After</div><div class='add'>+		 * that, if the current extent starts before the end of the last</div><div class='add'>+		 * extent we copied, truncate the last one. This can happen if</div><div class='add'>+		 * an ordered extent completion modifies the subvolume tree</div><div class='add'>+		 * while btrfs_next_leaf() has the tree unlocked.</div><div class='add'>+		 */</div><div class='add'>+		if (!dropped_extents || key.offset &lt; truncate_offset) {</div><div class='ctx'> 			ret = truncate_inode_items(trans, root-&gt;log_root, inode,</div><div class='del'>-						   truncate_offset,</div><div class='add'>+						   min(key.offset, truncate_offset),</div><div class='ctx'> 						   BTRFS_EXTENT_DATA_KEY);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			dropped_extents = true;</div><div class='ctx'> 		}</div><div class='add'>+		truncate_offset = btrfs_file_extent_end(path);</div><div class='ctx'> 		if (ins_nr == 0)</div><div class='ctx'> 			start_slot = slot;</div><div class='ctx'> 		ins_nr++;</div><div class='hunk'>@@ -4779,10 +5320,9 @@ static int btrfs_log_prealloc_extents(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	}</div><div class='ctx'> 	if (ins_nr &gt; 0)</div><div class='ctx'> 		ret = copy_items(trans, inode, dst_path, path,</div><div class='del'>-				 start_slot, ins_nr, 1, 0);</div><div class='add'>+				 start_slot, ins_nr, 1, 0, ctx);</div><div class='ctx'> out:</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='del'>-	btrfs_free_path(dst_path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -4794,13 +5334,11 @@ static int btrfs_log_changed_extents(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	struct btrfs_ordered_extent *ordered;</div><div class='ctx'> 	struct btrfs_ordered_extent *tmp;</div><div class='ctx'> 	struct extent_map *em, *n;</div><div class='del'>-	struct list_head extents;</div><div class='add'>+	LIST_HEAD(extents);</div><div class='ctx'> 	struct extent_map_tree *tree = &amp;inode-&gt;extent_tree;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int num = 0;</div><div class='ctx'> </div><div class='del'>-	INIT_LIST_HEAD(&amp;extents);</div><div class='del'>-</div><div class='ctx'> 	write_lock(&amp;tree-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry_safe(em, n, &amp;tree-&gt;modified_extents, list) {</div><div class='hunk'>@@ -4821,13 +5359,13 @@ static int btrfs_log_changed_extents(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		/* We log prealloc extents beyond eof later. */</div><div class='del'>-		if (test_bit(EXTENT_FLAG_PREALLOC, &amp;em-&gt;flags) &amp;&amp;</div><div class='add'>+		if ((em-&gt;flags &amp; EXTENT_FLAG_PREALLOC) &amp;&amp;</div><div class='ctx'> 		    em-&gt;start &gt;= i_size_read(&amp;inode-&gt;vfs_inode))</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		/* Need a ref to keep it from getting evicted from cache */</div><div class='ctx'> 		refcount_inc(&amp;em-&gt;refs);</div><div class='del'>-		set_bit(EXTENT_FLAG_LOGGING, &amp;em-&gt;flags);</div><div class='add'>+		em-&gt;flags |= EXTENT_FLAG_LOGGING;</div><div class='ctx'> 		list_add_tail(&amp;em-&gt;list, &amp;extents);</div><div class='ctx'> 		num++;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -4835,7 +5373,7 @@ static int btrfs_log_changed_extents(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	list_sort(NULL, &amp;extents, extent_cmp);</div><div class='ctx'> process:</div><div class='ctx'> 	while (!list_empty(&amp;extents)) {</div><div class='del'>-		em = list_entry(extents.next, struct extent_map, list);</div><div class='add'>+		em = list_first_entry(&amp;extents, struct extent_map, list);</div><div class='ctx'> </div><div class='ctx'> 		list_del_init(&amp;em-&gt;list);</div><div class='ctx'> </div><div class='hunk'>@@ -4844,8 +5382,8 @@ process:</div><div class='ctx'> 		 * private list.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (ret) {</div><div class='del'>-			clear_em_logging(tree, em);</div><div class='del'>-			free_extent_map(em);</div><div class='add'>+			btrfs_clear_em_logging(inode, em);</div><div class='add'>+			btrfs_free_extent_map(em);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -4853,15 +5391,14 @@ process:</div><div class='ctx'> </div><div class='ctx'> 		ret = log_one_extent(trans, inode, em, path, ctx);</div><div class='ctx'> 		write_lock(&amp;tree-&gt;lock);</div><div class='del'>-		clear_em_logging(tree, em);</div><div class='del'>-		free_extent_map(em);</div><div class='add'>+		btrfs_clear_em_logging(inode, em);</div><div class='add'>+		btrfs_free_extent_map(em);</div><div class='ctx'> 	}</div><div class='ctx'> 	WARN_ON(!list_empty(&amp;extents));</div><div class='ctx'> 	write_unlock(&amp;tree-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	btrfs_release_path(path);</div><div class='ctx'> 	if (!ret)</div><div class='del'>-		ret = btrfs_log_prealloc_extents(trans, inode, path);</div><div class='add'>+		ret = btrfs_log_prealloc_extents(trans, inode, path, ctx);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='hunk'>@@ -4877,12 +5414,12 @@ process:</div><div class='ctx'> 		set_bit(BTRFS_ORDERED_LOGGED, &amp;ordered-&gt;flags);</div><div class='ctx'> </div><div class='ctx'> 		if (!test_bit(BTRFS_ORDERED_COMPLETE, &amp;ordered-&gt;flags)) {</div><div class='del'>-			spin_lock_irq(&amp;inode-&gt;ordered_tree.lock);</div><div class='add'>+			spin_lock(&amp;inode-&gt;ordered_tree_lock);</div><div class='ctx'> 			if (!test_bit(BTRFS_ORDERED_COMPLETE, &amp;ordered-&gt;flags)) {</div><div class='ctx'> 				set_bit(BTRFS_ORDERED_PENDING, &amp;ordered-&gt;flags);</div><div class='ctx'> 				atomic_inc(&amp;trans-&gt;transaction-&gt;pending_ordered);</div><div class='ctx'> 			}</div><div class='del'>-			spin_unlock_irq(&amp;inode-&gt;ordered_tree.lock);</div><div class='add'>+			spin_unlock(&amp;inode-&gt;ordered_tree_lock);</div><div class='ctx'> 		}</div><div class='ctx'> 		btrfs_put_ordered_extent(ordered);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -4942,7 +5479,8 @@ static int logged_inode_size(struct btrfs_root *log, struct btrfs_inode *inode,</div><div class='ctx'> static int btrfs_log_all_xattrs(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				struct btrfs_inode *inode,</div><div class='ctx'> 				struct btrfs_path *path,</div><div class='del'>-				struct btrfs_path *dst_path)</div><div class='add'>+				struct btrfs_path *dst_path,</div><div class='add'>+				struct btrfs_log_ctx *ctx)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -4971,7 +5509,7 @@ static int btrfs_log_all_xattrs(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		if (slot &gt;= nritems) {</div><div class='ctx'> 			if (ins_nr &gt; 0) {</div><div class='ctx'> 				ret = copy_items(trans, inode, dst_path, path,</div><div class='del'>-						 start_slot, ins_nr, 1, 0);</div><div class='add'>+						 start_slot, ins_nr, 1, 0, ctx);</div><div class='ctx'> 				if (ret &lt; 0)</div><div class='ctx'> 					return ret;</div><div class='ctx'> 				ins_nr = 0;</div><div class='hunk'>@@ -4997,7 +5535,7 @@ static int btrfs_log_all_xattrs(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	}</div><div class='ctx'> 	if (ins_nr &gt; 0) {</div><div class='ctx'> 		ret = copy_items(trans, inode, dst_path, path,</div><div class='del'>-				 start_slot, ins_nr, 1, 0);</div><div class='add'>+				 start_slot, ins_nr, 1, 0, ctx);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -5068,10 +5606,9 @@ static int btrfs_log_holes(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			 * leafs from the log root.</div><div class='ctx'> 			 */</div><div class='ctx'> 			btrfs_release_path(path);</div><div class='del'>-			ret = btrfs_insert_file_extent(trans, root-&gt;log_root,</div><div class='del'>-						       ino, prev_extent_end, 0,</div><div class='del'>-						       0, hole_len, 0, hole_len,</div><div class='del'>-						       0, 0, 0);</div><div class='add'>+			ret = btrfs_insert_hole_extent(trans, root-&gt;log_root,</div><div class='add'>+						       ino, prev_extent_end,</div><div class='add'>+						       hole_len);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='ctx'> 				return ret;</div><div class='ctx'> </div><div class='hunk'>@@ -5100,10 +5637,8 @@ static int btrfs_log_holes(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> 		hole_len = ALIGN(i_size - prev_extent_end, fs_info-&gt;sectorsize);</div><div class='del'>-		ret = btrfs_insert_file_extent(trans, root-&gt;log_root,</div><div class='del'>-					       ino, prev_extent_end, 0, 0,</div><div class='del'>-					       hole_len, 0, hole_len,</div><div class='del'>-					       0, 0, 0);</div><div class='add'>+		ret = btrfs_insert_hole_extent(trans, root-&gt;log_root, ino,</div><div class='add'>+					       prev_extent_end, hole_len);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -5159,19 +5694,18 @@ static int btrfs_check_ref_name_override(struct extent_buffer *eb,</div><div class='ctx'> 					 struct btrfs_inode *inode,</div><div class='ctx'> 					 u64 *other_ino, u64 *other_parent)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='del'>-	struct btrfs_path *search_path;</div><div class='del'>-	char *name = NULL;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(search_path);</div><div class='add'>+	char AUTO_KFREE(name);</div><div class='ctx'> 	u32 name_len = 0;</div><div class='del'>-	u32 item_size = btrfs_item_size_nr(eb, slot);</div><div class='add'>+	u32 item_size = btrfs_item_size(eb, slot);</div><div class='ctx'> 	u32 cur_offset = 0;</div><div class='ctx'> 	unsigned long ptr = btrfs_item_ptr_offset(eb, slot);</div><div class='ctx'> </div><div class='ctx'> 	search_path = btrfs_alloc_path();</div><div class='ctx'> 	if (!search_path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='del'>-	search_path-&gt;search_commit_root = 1;</div><div class='del'>-	search_path-&gt;skip_locking = 1;</div><div class='add'>+	search_path-&gt;search_commit_root = true;</div><div class='add'>+	search_path-&gt;skip_locking = true;</div><div class='ctx'> </div><div class='ctx'> 	while (cur_offset &lt; item_size) {</div><div class='ctx'> 		u64 parent;</div><div class='hunk'>@@ -5179,6 +5713,7 @@ static int btrfs_check_ref_name_override(struct extent_buffer *eb,</div><div class='ctx'> 		u32 this_len;</div><div class='ctx'> 		unsigned long name_ptr;</div><div class='ctx'> 		struct btrfs_dir_item *di;</div><div class='add'>+		struct fscrypt_str name_str;</div><div class='ctx'> </div><div class='ctx'> 		if (key-&gt;type == BTRFS_INODE_REF_KEY) {</div><div class='ctx'> 			struct btrfs_inode_ref *iref;</div><div class='hunk'>@@ -5203,17 +5738,18 @@ static int btrfs_check_ref_name_override(struct extent_buffer *eb,</div><div class='ctx'> 			char *new_name;</div><div class='ctx'> </div><div class='ctx'> 			new_name = krealloc(name, this_name_len, GFP_NOFS);</div><div class='del'>-			if (!new_name) {</div><div class='del'>-				ret = -ENOMEM;</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='add'>+			if (!new_name)</div><div class='add'>+				return -ENOMEM;</div><div class='ctx'> 			name_len = this_name_len;</div><div class='ctx'> 			name = new_name;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		read_extent_buffer(eb, name, name_ptr, this_name_len);</div><div class='add'>+</div><div class='add'>+		name_str.name = name;</div><div class='add'>+		name_str.len = this_name_len;</div><div class='ctx'> 		di = btrfs_lookup_dir_item(NULL, inode-&gt;root, search_path,</div><div class='del'>-				parent, name, this_name_len, 0);</div><div class='add'>+				parent, &amp;name_str, 0);</div><div class='ctx'> 		if (di &amp;&amp; !IS_ERR(di)) {</div><div class='ctx'> 			struct btrfs_key di_key;</div><div class='ctx'> </div><div class='hunk'>@@ -5221,28 +5757,243 @@ static int btrfs_check_ref_name_override(struct extent_buffer *eb,</div><div class='ctx'> 						  di, &amp;di_key);</div><div class='ctx'> 			if (di_key.type == BTRFS_INODE_ITEM_KEY) {</div><div class='ctx'> 				if (di_key.objectid != key-&gt;objectid) {</div><div class='del'>-					ret = 1;</div><div class='ctx'> 					*other_ino = di_key.objectid;</div><div class='ctx'> 					*other_parent = parent;</div><div class='add'>+					return 1;</div><div class='ctx'> 				} else {</div><div class='del'>-					ret = 0;</div><div class='add'>+					return 0;</div><div class='ctx'> 				}</div><div class='ctx'> 			} else {</div><div class='del'>-				ret = -EAGAIN;</div><div class='add'>+				return -EAGAIN;</div><div class='ctx'> 			}</div><div class='del'>-			goto out;</div><div class='ctx'> 		} else if (IS_ERR(di)) {</div><div class='del'>-			ret = PTR_ERR(di);</div><div class='del'>-			goto out;</div><div class='add'>+			return PTR_ERR(di);</div><div class='ctx'> 		}</div><div class='ctx'> 		btrfs_release_path(search_path);</div><div class='ctx'> </div><div class='ctx'> 		cur_offset += this_len;</div><div class='ctx'> 	}</div><div class='del'>-	ret = 0;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Check if we need to log an inode. This is used in contexts where while</div><div class='add'>+ * logging an inode we need to log another inode (either that it exists or in</div><div class='add'>+ * full mode). This is used instead of btrfs_inode_in_log() because the later</div><div class='add'>+ * requires the inode to be in the log and have the log transaction committed,</div><div class='add'>+ * while here we do not care if the log transaction was already committed - our</div><div class='add'>+ * caller will commit the log later - and we want to avoid logging an inode</div><div class='add'>+ * multiple times when multiple tasks have joined the same log transaction.</div><div class='add'>+ */</div><div class='add'>+static bool need_log_inode(const struct btrfs_trans_handle *trans,</div><div class='add'>+			   struct btrfs_inode *inode)</div><div class='add'>+{</div><div class='add'>+	/*</div><div class='add'>+	 * If a directory was not modified, no dentries added or removed, we can</div><div class='add'>+	 * and should avoid logging it.</div><div class='add'>+	 */</div><div class='add'>+	if (S_ISDIR(inode-&gt;vfs_inode.i_mode) &amp;&amp; inode-&gt;last_trans &lt; trans-&gt;transid)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If this inode does not have new/updated/deleted xattrs since the last</div><div class='add'>+	 * time it was logged and is flagged as logged in the current transaction,</div><div class='add'>+	 * we can skip logging it. As for new/deleted names, those are updated in</div><div class='add'>+	 * the log by link/unlink/rename operations.</div><div class='add'>+	 * In case the inode was logged and then evicted and reloaded, its</div><div class='add'>+	 * logged_trans will be 0, in which case we have to fully log it since</div><div class='add'>+	 * logged_trans is a transient field, not persisted.</div><div class='add'>+	 */</div><div class='add'>+	if (inode_logged(trans, inode, NULL) == 1 &amp;&amp;</div><div class='add'>+	    !test_bit(BTRFS_INODE_COPY_EVERYTHING, &amp;inode-&gt;runtime_flags))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct btrfs_dir_list {</div><div class='add'>+	u64 ino;</div><div class='add'>+	struct list_head list;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Log the inodes of the new dentries of a directory.</div><div class='add'>+ * See process_dir_items_leaf() for details about why it is needed.</div><div class='add'>+ * This is a recursive operation - if an existing dentry corresponds to a</div><div class='add'>+ * directory, that directory's new entries are logged too (same behaviour as</div><div class='add'>+ * ext3/4, xfs, f2fs, nilfs2). Note that when logging the inodes</div><div class='add'>+ * the dentries point to we do not acquire their VFS lock, otherwise lockdep</div><div class='add'>+ * complains about the following circular lock dependency / possible deadlock:</div><div class='add'>+ *</div><div class='add'>+ *        CPU0                                        CPU1</div><div class='add'>+ *        ----                                        ----</div><div class='add'>+ * lock(&amp;type-&gt;i_mutex_dir_key#3/2);</div><div class='add'>+ *                                            lock(sb_internal#2);</div><div class='add'>+ *                                            lock(&amp;type-&gt;i_mutex_dir_key#3/2);</div><div class='add'>+ * lock(&amp;sb-&gt;s_type-&gt;i_mutex_key#14);</div><div class='add'>+ *</div><div class='add'>+ * Where sb_internal is the lock (a counter that works as a lock) acquired by</div><div class='add'>+ * sb_start_intwrite() in btrfs_start_transaction().</div><div class='add'>+ * Not acquiring the VFS lock of the inodes is still safe because:</div><div class='add'>+ *</div><div class='add'>+ * 1) For regular files we log with a mode of LOG_INODE_EXISTS. It's possible</div><div class='add'>+ *    that while logging the inode new references (names) are added or removed</div><div class='add'>+ *    from the inode, leaving the logged inode item with a link count that does</div><div class='add'>+ *    not match the number of logged inode reference items. This is fine because</div><div class='add'>+ *    at log replay time we compute the real number of links and correct the</div><div class='add'>+ *    link count in the inode item (see replay_one_buffer() and</div><div class='add'>+ *    link_to_fixup_dir());</div><div class='add'>+ *</div><div class='add'>+ * 2) For directories we log with a mode of LOG_INODE_ALL. It's possible that</div><div class='add'>+ *    while logging the inode's items new index items (key type</div><div class='add'>+ *    BTRFS_DIR_INDEX_KEY) are added to fs/subvol tree and the logged inode item</div><div class='add'>+ *    has a size that doesn't match the sum of the lengths of all the logged</div><div class='add'>+ *    names - this is ok, not a problem, because at log replay time we set the</div><div class='add'>+ *    directory's i_size to the correct value (see replay_one_name() and</div><div class='add'>+ *    overwrite_item()).</div><div class='add'>+ */</div><div class='add'>+static int log_new_dir_dentries(struct btrfs_trans_handle *trans,</div><div class='add'>+				struct btrfs_inode *start_inode,</div><div class='add'>+				struct btrfs_log_ctx *ctx)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_root *root = start_inode-&gt;root;</div><div class='add'>+	struct btrfs_path *path;</div><div class='add'>+	LIST_HEAD(dir_list);</div><div class='add'>+	struct btrfs_dir_list *dir_elem;</div><div class='add'>+	u64 ino = btrfs_ino(start_inode);</div><div class='add'>+	struct btrfs_inode *curr_inode = start_inode;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If we are logging a new name, as part of a link or rename operation,</div><div class='add'>+	 * don't bother logging new dentries, as we just want to log the names</div><div class='add'>+	 * of an inode and that any new parents exist.</div><div class='add'>+	 */</div><div class='add'>+	if (ctx-&gt;logging_new_name)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	path = btrfs_alloc_path();</div><div class='add'>+	if (!path)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	/* Pairs with btrfs_add_delayed_iput below. */</div><div class='add'>+	ihold(&amp;curr_inode-&gt;vfs_inode);</div><div class='add'>+</div><div class='add'>+	while (true) {</div><div class='add'>+		struct btrfs_key key;</div><div class='add'>+		struct btrfs_key found_key;</div><div class='add'>+		u64 next_index;</div><div class='add'>+		bool continue_curr_inode = true;</div><div class='add'>+		int iter_ret;</div><div class='add'>+</div><div class='add'>+		key.objectid = ino;</div><div class='add'>+		key.type = BTRFS_DIR_INDEX_KEY;</div><div class='add'>+		key.offset = btrfs_get_first_dir_index_to_log(curr_inode);</div><div class='add'>+		next_index = key.offset;</div><div class='add'>+again:</div><div class='add'>+		btrfs_for_each_slot(root-&gt;log_root, &amp;key, &amp;found_key, path, iter_ret) {</div><div class='add'>+			struct extent_buffer *leaf = path-&gt;nodes[0];</div><div class='add'>+			struct btrfs_dir_item *di;</div><div class='add'>+			struct btrfs_key di_key;</div><div class='add'>+			struct btrfs_inode *di_inode;</div><div class='add'>+			int log_mode = LOG_INODE_EXISTS;</div><div class='add'>+			int type;</div><div class='add'>+</div><div class='add'>+			if (found_key.objectid != ino ||</div><div class='add'>+			    found_key.type != BTRFS_DIR_INDEX_KEY) {</div><div class='add'>+				continue_curr_inode = false;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			next_index = found_key.offset + 1;</div><div class='add'>+</div><div class='add'>+			di = btrfs_item_ptr(leaf, path-&gt;slots[0], struct btrfs_dir_item);</div><div class='add'>+			type = btrfs_dir_ftype(leaf, di);</div><div class='add'>+			if (btrfs_dir_transid(leaf, di) &lt; trans-&gt;transid)</div><div class='add'>+				continue;</div><div class='add'>+			btrfs_dir_item_key_to_cpu(leaf, di, &amp;di_key);</div><div class='add'>+			if (di_key.type == BTRFS_ROOT_ITEM_KEY)</div><div class='add'>+				continue;</div><div class='add'>+</div><div class='add'>+			btrfs_release_path(path);</div><div class='add'>+			di_inode = btrfs_iget_logging(di_key.objectid, root);</div><div class='add'>+			if (IS_ERR(di_inode)) {</div><div class='add'>+				ret = PTR_ERR(di_inode);</div><div class='add'>+				goto out;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			if (!need_log_inode(trans, di_inode)) {</div><div class='add'>+				btrfs_add_delayed_iput(di_inode);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			ctx-&gt;log_new_dentries = false;</div><div class='add'>+			if (type == BTRFS_FT_DIR)</div><div class='add'>+				log_mode = LOG_INODE_ALL;</div><div class='add'>+			ret = btrfs_log_inode(trans, di_inode, log_mode, ctx);</div><div class='add'>+			btrfs_add_delayed_iput(di_inode);</div><div class='add'>+			if (ret)</div><div class='add'>+				goto out;</div><div class='add'>+			if (ctx-&gt;log_new_dentries) {</div><div class='add'>+				dir_elem = kmalloc(sizeof(*dir_elem), GFP_NOFS);</div><div class='add'>+				if (!dir_elem) {</div><div class='add'>+					ret = -ENOMEM;</div><div class='add'>+					goto out;</div><div class='add'>+				}</div><div class='add'>+				dir_elem-&gt;ino = di_key.objectid;</div><div class='add'>+				list_add_tail(&amp;dir_elem-&gt;list, &amp;dir_list);</div><div class='add'>+			}</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		btrfs_release_path(path);</div><div class='add'>+</div><div class='add'>+		if (iter_ret &lt; 0) {</div><div class='add'>+			ret = iter_ret;</div><div class='add'>+			goto out;</div><div class='add'>+		} else if (iter_ret &gt; 0) {</div><div class='add'>+			continue_curr_inode = false;</div><div class='add'>+		} else {</div><div class='add'>+			key = found_key;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (continue_curr_inode &amp;&amp; key.offset &lt; (u64)-1) {</div><div class='add'>+			key.offset++;</div><div class='add'>+			goto again;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		btrfs_set_first_dir_index_to_log(curr_inode, next_index);</div><div class='add'>+</div><div class='add'>+		if (list_empty(&amp;dir_list))</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		dir_elem = list_first_entry(&amp;dir_list, struct btrfs_dir_list, list);</div><div class='add'>+		ino = dir_elem-&gt;ino;</div><div class='add'>+		list_del(&amp;dir_elem-&gt;list);</div><div class='add'>+		kfree(dir_elem);</div><div class='add'>+</div><div class='add'>+		btrfs_add_delayed_iput(curr_inode);</div><div class='add'>+</div><div class='add'>+		curr_inode = btrfs_iget_logging(ino, root);</div><div class='add'>+		if (IS_ERR(curr_inode)) {</div><div class='add'>+			ret = PTR_ERR(curr_inode);</div><div class='add'>+			curr_inode = NULL;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> out:</div><div class='del'>-	btrfs_free_path(search_path);</div><div class='del'>-	kfree(name);</div><div class='add'>+	btrfs_free_path(path);</div><div class='add'>+	if (curr_inode)</div><div class='add'>+		btrfs_add_delayed_iput(curr_inode);</div><div class='add'>+</div><div class='add'>+	if (ret) {</div><div class='add'>+		struct btrfs_dir_list *next;</div><div class='add'>+</div><div class='add'>+		list_for_each_entry_safe(dir_elem, next, &amp;dir_list, list)</div><div class='add'>+			kfree(dir_elem);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5252,105 +6003,251 @@ struct btrfs_ino_list {</div><div class='ctx'> 	struct list_head list;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int log_conflicting_inodes(struct btrfs_trans_handle *trans,</div><div class='del'>-				  struct btrfs_root *root,</div><div class='del'>-				  struct btrfs_path *path,</div><div class='del'>-				  struct btrfs_log_ctx *ctx,</div><div class='del'>-				  u64 ino, u64 parent)</div><div class='add'>+static void free_conflicting_inodes(struct btrfs_log_ctx *ctx)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_ino_list *curr;</div><div class='add'>+	struct btrfs_ino_list *next;</div><div class='add'>+</div><div class='add'>+	list_for_each_entry_safe(curr, next, &amp;ctx-&gt;conflict_inodes, list) {</div><div class='add'>+		list_del(&amp;curr-&gt;list);</div><div class='add'>+		kfree(curr);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int conflicting_inode_is_dir(struct btrfs_root *root, u64 ino,</div><div class='add'>+				    struct btrfs_path *path)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_key key;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	key.objectid = ino;</div><div class='add'>+	key.type = BTRFS_INODE_ITEM_KEY;</div><div class='add'>+	key.offset = 0;</div><div class='add'>+</div><div class='add'>+	path-&gt;search_commit_root = true;</div><div class='add'>+	path-&gt;skip_locking = true;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='add'>+	if (WARN_ON_ONCE(ret &gt; 0)) {</div><div class='add'>+		/*</div><div class='add'>+		 * We have previously found the inode through the commit root</div><div class='add'>+		 * so this should not happen. If it does, just error out and</div><div class='add'>+		 * fallback to a transaction commit.</div><div class='add'>+		 */</div><div class='add'>+		ret = -ENOENT;</div><div class='add'>+	} else if (ret == 0) {</div><div class='add'>+		struct btrfs_inode_item *item;</div><div class='add'>+</div><div class='add'>+		item = btrfs_item_ptr(path-&gt;nodes[0], path-&gt;slots[0],</div><div class='add'>+				      struct btrfs_inode_item);</div><div class='add'>+		if (S_ISDIR(btrfs_inode_mode(path-&gt;nodes[0], item)))</div><div class='add'>+			ret = 1;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	btrfs_release_path(path);</div><div class='add'>+	path-&gt;search_commit_root = false;</div><div class='add'>+	path-&gt;skip_locking = false;</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int add_conflicting_inode(struct btrfs_trans_handle *trans,</div><div class='add'>+				 struct btrfs_root *root,</div><div class='add'>+				 struct btrfs_path *path,</div><div class='add'>+				 u64 ino, u64 parent,</div><div class='add'>+				 struct btrfs_log_ctx *ctx)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_ino_list *ino_elem;</div><div class='del'>-	LIST_HEAD(inode_list);</div><div class='del'>-	int ret = 0;</div><div class='add'>+	struct btrfs_inode *inode;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * It's rare to have a lot of conflicting inodes, in practice it is not</div><div class='add'>+	 * common to have more than 1 or 2. We don't want to collect too many,</div><div class='add'>+	 * as we could end up logging too many inodes (even if only in</div><div class='add'>+	 * LOG_INODE_EXISTS mode) and slow down other fsyncs or transaction</div><div class='add'>+	 * commits.</div><div class='add'>+	 */</div><div class='add'>+	if (ctx-&gt;num_conflict_inodes &gt;= MAX_CONFLICT_INODES)</div><div class='add'>+		return BTRFS_LOG_FORCE_COMMIT;</div><div class='add'>+</div><div class='add'>+	inode = btrfs_iget_logging(ino, root);</div><div class='add'>+	/*</div><div class='add'>+	 * If the other inode that had a conflicting dir entry was deleted in</div><div class='add'>+	 * the current transaction then we either:</div><div class='add'>+	 *</div><div class='add'>+	 * 1) Log the parent directory (later after adding it to the list) if</div><div class='add'>+	 *    the inode is a directory. This is because it may be a deleted</div><div class='add'>+	 *    subvolume/snapshot or it may be a regular directory that had</div><div class='add'>+	 *    deleted subvolumes/snapshots (or subdirectories that had them),</div><div class='add'>+	 *    and at the moment we can't deal with dropping subvolumes/snapshots</div><div class='add'>+	 *    during log replay. So we just log the parent, which will result in</div><div class='add'>+	 *    a fallback to a transaction commit if we are dealing with those</div><div class='add'>+	 *    cases (last_unlink_trans will match the current transaction);</div><div class='add'>+	 *</div><div class='add'>+	 * 2) Do nothing if it's not a directory. During log replay we simply</div><div class='add'>+	 *    unlink the conflicting dentry from the parent directory and then</div><div class='add'>+	 *    add the dentry for our inode. Like this we can avoid logging the</div><div class='add'>+	 *    parent directory (and maybe fallback to a transaction commit in</div><div class='add'>+	 *    case it has a last_unlink_trans == trans-&gt;transid, due to moving</div><div class='add'>+	 *    some inode from it to some other directory).</div><div class='add'>+	 */</div><div class='add'>+	if (IS_ERR(inode)) {</div><div class='add'>+		int ret = PTR_ERR(inode);</div><div class='add'>+</div><div class='add'>+		if (ret != -ENOENT)</div><div class='add'>+			return ret;</div><div class='add'>+</div><div class='add'>+		ret = conflicting_inode_is_dir(root, ino, path);</div><div class='add'>+		/* Not a directory or we got an error. */</div><div class='add'>+		if (ret &lt;= 0)</div><div class='add'>+			return ret;</div><div class='add'>+</div><div class='add'>+		/* Conflicting inode is a directory, so we'll log its parent. */</div><div class='add'>+		ino_elem = kmalloc(sizeof(*ino_elem), GFP_NOFS);</div><div class='add'>+		if (!ino_elem)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+		ino_elem-&gt;ino = ino;</div><div class='add'>+		ino_elem-&gt;parent = parent;</div><div class='add'>+		list_add_tail(&amp;ino_elem-&gt;list, &amp;ctx-&gt;conflict_inodes);</div><div class='add'>+		ctx-&gt;num_conflict_inodes++;</div><div class='add'>+</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If the inode was already logged skip it - otherwise we can hit an</div><div class='add'>+	 * infinite loop. Example:</div><div class='add'>+	 *</div><div class='add'>+	 * From the commit root (previous transaction) we have the following</div><div class='add'>+	 * inodes:</div><div class='add'>+	 *</div><div class='add'>+	 * inode 257 a directory</div><div class='add'>+	 * inode 258 with references "zz" and "zz_link" on inode 257</div><div class='add'>+	 * inode 259 with reference "a" on inode 257</div><div class='add'>+	 *</div><div class='add'>+	 * And in the current (uncommitted) transaction we have:</div><div class='add'>+	 *</div><div class='add'>+	 * inode 257 a directory, unchanged</div><div class='add'>+	 * inode 258 with references "a" and "a2" on inode 257</div><div class='add'>+	 * inode 259 with reference "zz_link" on inode 257</div><div class='add'>+	 * inode 261 with reference "zz" on inode 257</div><div class='add'>+	 *</div><div class='add'>+	 * When logging inode 261 the following infinite loop could</div><div class='add'>+	 * happen if we don't skip already logged inodes:</div><div class='add'>+	 *</div><div class='add'>+	 * - we detect inode 258 as a conflicting inode, with inode 261</div><div class='add'>+	 *   on reference "zz", and log it;</div><div class='add'>+	 *</div><div class='add'>+	 * - we detect inode 259 as a conflicting inode, with inode 258</div><div class='add'>+	 *   on reference "a", and log it;</div><div class='add'>+	 *</div><div class='add'>+	 * - we detect inode 258 as a conflicting inode, with inode 259</div><div class='add'>+	 *   on reference "zz_link", and log it - again! After this we</div><div class='add'>+	 *   repeat the above steps forever.</div><div class='add'>+	 *</div><div class='add'>+	 * Here we can use need_log_inode() because we only need to log the</div><div class='add'>+	 * inode in LOG_INODE_EXISTS mode and rename operations update the log,</div><div class='add'>+	 * so that the log ends up with the new name and without the old name.</div><div class='add'>+	 */</div><div class='add'>+	if (!need_log_inode(trans, inode)) {</div><div class='add'>+		btrfs_add_delayed_iput(inode);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	btrfs_add_delayed_iput(inode);</div><div class='ctx'> </div><div class='ctx'> 	ino_elem = kmalloc(sizeof(*ino_elem), GFP_NOFS);</div><div class='ctx'> 	if (!ino_elem)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	ino_elem-&gt;ino = ino;</div><div class='ctx'> 	ino_elem-&gt;parent = parent;</div><div class='del'>-	list_add_tail(&amp;ino_elem-&gt;list, &amp;inode_list);</div><div class='add'>+	list_add_tail(&amp;ino_elem-&gt;list, &amp;ctx-&gt;conflict_inodes);</div><div class='add'>+	ctx-&gt;num_conflict_inodes++;</div><div class='ctx'> </div><div class='del'>-	while (!list_empty(&amp;inode_list)) {</div><div class='del'>-		struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='del'>-		struct btrfs_key key;</div><div class='del'>-		struct inode *inode;</div><div class='del'>-</div><div class='del'>-		ino_elem = list_first_entry(&amp;inode_list, struct btrfs_ino_list,</div><div class='del'>-					    list);</div><div class='del'>-		ino = ino_elem-&gt;ino;</div><div class='del'>-		parent = ino_elem-&gt;parent;</div><div class='del'>-		list_del(&amp;ino_elem-&gt;list);</div><div class='del'>-		kfree(ino_elem);</div><div class='del'>-		if (ret)</div><div class='del'>-			continue;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		btrfs_release_path(path);</div><div class='add'>+static int log_conflicting_inodes(struct btrfs_trans_handle *trans,</div><div class='add'>+				  struct btrfs_root *root,</div><div class='add'>+				  struct btrfs_log_ctx *ctx)</div><div class='add'>+{</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Conflicting inodes are logged by the first call to btrfs_log_inode(),</div><div class='add'>+	 * otherwise we could have unbounded recursion of btrfs_log_inode()</div><div class='add'>+	 * calls. This check guarantees we can have only 1 level of recursion.</div><div class='add'>+	 */</div><div class='add'>+	if (ctx-&gt;logging_conflict_inodes)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	ctx-&gt;logging_conflict_inodes = true;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * New conflicting inodes may be found and added to the list while we</div><div class='add'>+	 * are logging a conflicting inode, so keep iterating while the list is</div><div class='add'>+	 * not empty.</div><div class='add'>+	 */</div><div class='add'>+	while (!list_empty(&amp;ctx-&gt;conflict_inodes)) {</div><div class='add'>+		struct btrfs_ino_list *curr;</div><div class='add'>+		struct btrfs_inode *inode;</div><div class='add'>+		u64 ino;</div><div class='add'>+		u64 parent;</div><div class='add'>+</div><div class='add'>+		curr = list_first_entry(&amp;ctx-&gt;conflict_inodes,</div><div class='add'>+					struct btrfs_ino_list, list);</div><div class='add'>+		ino = curr-&gt;ino;</div><div class='add'>+		parent = curr-&gt;parent;</div><div class='add'>+		list_del(&amp;curr-&gt;list);</div><div class='add'>+		kfree(curr);</div><div class='ctx'> </div><div class='del'>-		inode = btrfs_iget(fs_info-&gt;sb, ino, root);</div><div class='add'>+		inode = btrfs_iget_logging(ino, root);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * If the other inode that had a conflicting dir entry was</div><div class='ctx'> 		 * deleted in the current transaction, we need to log its parent</div><div class='del'>-		 * directory.</div><div class='add'>+		 * directory. See the comment at add_conflicting_inode().</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (IS_ERR(inode)) {</div><div class='ctx'> 			ret = PTR_ERR(inode);</div><div class='del'>-			if (ret == -ENOENT) {</div><div class='del'>-				inode = btrfs_iget(fs_info-&gt;sb, parent, root);</div><div class='del'>-				if (IS_ERR(inode)) {</div><div class='del'>-					ret = PTR_ERR(inode);</div><div class='del'>-				} else {</div><div class='del'>-					ret = btrfs_log_inode(trans,</div><div class='del'>-						      BTRFS_I(inode),</div><div class='del'>-						      LOG_OTHER_INODE_ALL,</div><div class='del'>-						      ctx);</div><div class='del'>-					btrfs_add_delayed_iput(inode);</div><div class='del'>-				}</div><div class='add'>+			if (ret != -ENOENT)</div><div class='add'>+				break;</div><div class='add'>+</div><div class='add'>+			inode = btrfs_iget_logging(parent, root);</div><div class='add'>+			if (IS_ERR(inode)) {</div><div class='add'>+				ret = PTR_ERR(inode);</div><div class='add'>+				break;</div><div class='ctx'> 			}</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * Always log the directory, we cannot make this</div><div class='add'>+			 * conditional on need_log_inode() because the directory</div><div class='add'>+			 * might have been logged in LOG_INODE_EXISTS mode or</div><div class='add'>+			 * the dir index of the conflicting inode is not in a</div><div class='add'>+			 * dir index key range logged for the directory. So we</div><div class='add'>+			 * must make sure the deletion is recorded.</div><div class='add'>+			 */</div><div class='add'>+			ret = btrfs_log_inode(trans, inode, LOG_INODE_ALL, ctx);</div><div class='add'>+			btrfs_add_delayed_iput(inode);</div><div class='add'>+			if (ret)</div><div class='add'>+				break;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='ctx'> 		/*</div><div class='del'>-		 * If the inode was already logged skip it - otherwise we can</div><div class='del'>-		 * hit an infinite loop. Example:</div><div class='del'>-		 *</div><div class='del'>-		 * From the commit root (previous transaction) we have the</div><div class='del'>-		 * following inodes:</div><div class='del'>-		 *</div><div class='del'>-		 * inode 257 a directory</div><div class='del'>-		 * inode 258 with references "zz" and "zz_link" on inode 257</div><div class='del'>-		 * inode 259 with reference "a" on inode 257</div><div class='del'>-		 *</div><div class='del'>-		 * And in the current (uncommitted) transaction we have:</div><div class='add'>+		 * Here we can use need_log_inode() because we only need to log</div><div class='add'>+		 * the inode in LOG_INODE_EXISTS mode and rename operations</div><div class='add'>+		 * update the log, so that the log ends up with the new name and</div><div class='add'>+		 * without the old name.</div><div class='ctx'> 		 *</div><div class='del'>-		 * inode 257 a directory, unchanged</div><div class='del'>-		 * inode 258 with references "a" and "a2" on inode 257</div><div class='del'>-		 * inode 259 with reference "zz_link" on inode 257</div><div class='del'>-		 * inode 261 with reference "zz" on inode 257</div><div class='del'>-		 *</div><div class='del'>-		 * When logging inode 261 the following infinite loop could</div><div class='del'>-		 * happen if we don't skip already logged inodes:</div><div class='del'>-		 *</div><div class='del'>-		 * - we detect inode 258 as a conflicting inode, with inode 261</div><div class='del'>-		 *   on reference "zz", and log it;</div><div class='del'>-		 *</div><div class='del'>-		 * - we detect inode 259 as a conflicting inode, with inode 258</div><div class='del'>-		 *   on reference "a", and log it;</div><div class='del'>-		 *</div><div class='del'>-		 * - we detect inode 258 as a conflicting inode, with inode 259</div><div class='del'>-		 *   on reference "zz_link", and log it - again! After this we</div><div class='del'>-		 *   repeat the above steps forever.</div><div class='add'>+		 * We did this check at add_conflicting_inode(), but here we do</div><div class='add'>+		 * it again because if some other task logged the inode after</div><div class='add'>+		 * that, we can avoid doing it again.</div><div class='ctx'> 		 */</div><div class='del'>-		spin_lock(&amp;BTRFS_I(inode)-&gt;lock);</div><div class='del'>-		/*</div><div class='del'>-		 * Check the inode's logged_trans only instead of</div><div class='del'>-		 * btrfs_inode_in_log(). This is because the last_log_commit of</div><div class='del'>-		 * the inode is not updated when we only log that it exists (see</div><div class='del'>-		 * btrfs_log_inode()).</div><div class='del'>-		 */</div><div class='del'>-		if (BTRFS_I(inode)-&gt;logged_trans == trans-&gt;transid) {</div><div class='del'>-			spin_unlock(&amp;BTRFS_I(inode)-&gt;lock);</div><div class='add'>+		if (!need_log_inode(trans, inode)) {</div><div class='ctx'> 			btrfs_add_delayed_iput(inode);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='del'>-		spin_unlock(&amp;BTRFS_I(inode)-&gt;lock);</div><div class='add'>+</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We are safe logging the other inode without acquiring its</div><div class='ctx'> 		 * lock as long as we log with the LOG_INODE_EXISTS mode. We</div><div class='hunk'>@@ -5358,67 +6255,16 @@ static int log_conflicting_inodes(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		 * well because during a rename we pin the log and update the</div><div class='ctx'> 		 * log with the new name before we unpin it.</div><div class='ctx'> 		 */</div><div class='del'>-		ret = btrfs_log_inode(trans, BTRFS_I(inode), LOG_OTHER_INODE, ctx);</div><div class='del'>-		if (ret) {</div><div class='del'>-			btrfs_add_delayed_iput(inode);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		key.objectid = ino;</div><div class='del'>-		key.type = BTRFS_INODE_REF_KEY;</div><div class='del'>-		key.offset = 0;</div><div class='del'>-		ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			btrfs_add_delayed_iput(inode);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		while (true) {</div><div class='del'>-			struct extent_buffer *leaf = path-&gt;nodes[0];</div><div class='del'>-			int slot = path-&gt;slots[0];</div><div class='del'>-			u64 other_ino = 0;</div><div class='del'>-			u64 other_parent = 0;</div><div class='del'>-</div><div class='del'>-			if (slot &gt;= btrfs_header_nritems(leaf)) {</div><div class='del'>-				ret = btrfs_next_leaf(root, path);</div><div class='del'>-				if (ret &lt; 0) {</div><div class='del'>-					break;</div><div class='del'>-				} else if (ret &gt; 0) {</div><div class='del'>-					ret = 0;</div><div class='del'>-					break;</div><div class='del'>-				}</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			btrfs_item_key_to_cpu(leaf, &amp;key, slot);</div><div class='del'>-			if (key.objectid != ino ||</div><div class='del'>-			    (key.type != BTRFS_INODE_REF_KEY &amp;&amp;</div><div class='del'>-			     key.type != BTRFS_INODE_EXTREF_KEY)) {</div><div class='del'>-				ret = 0;</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			ret = btrfs_check_ref_name_override(leaf, slot, &amp;key,</div><div class='del'>-					BTRFS_I(inode), &amp;other_ino,</div><div class='del'>-					&amp;other_parent);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				break;</div><div class='del'>-			if (ret &gt; 0) {</div><div class='del'>-				ino_elem = kmalloc(sizeof(*ino_elem), GFP_NOFS);</div><div class='del'>-				if (!ino_elem) {</div><div class='del'>-					ret = -ENOMEM;</div><div class='del'>-					break;</div><div class='del'>-				}</div><div class='del'>-				ino_elem-&gt;ino = other_ino;</div><div class='del'>-				ino_elem-&gt;parent = other_parent;</div><div class='del'>-				list_add_tail(&amp;ino_elem-&gt;list, &amp;inode_list);</div><div class='del'>-				ret = 0;</div><div class='del'>-			}</div><div class='del'>-			path-&gt;slots[0]++;</div><div class='del'>-		}</div><div class='add'>+		ret = btrfs_log_inode(trans, inode, LOG_INODE_EXISTS, ctx);</div><div class='ctx'> 		btrfs_add_delayed_iput(inode);</div><div class='add'>+		if (ret)</div><div class='add'>+			break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	ctx-&gt;logging_conflict_inodes = false;</div><div class='add'>+	if (ret)</div><div class='add'>+		free_conflicting_inodes(ctx);</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5429,11 +6275,11 @@ static int copy_inode_items_to_log(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				   struct btrfs_path *path,</div><div class='ctx'> 				   struct btrfs_path *dst_path,</div><div class='ctx'> 				   const u64 logged_isize,</div><div class='del'>-				   const bool recursive_logging,</div><div class='ctx'> 				   const int inode_only,</div><div class='ctx'> 				   struct btrfs_log_ctx *ctx,</div><div class='ctx'> 				   bool *need_log_inode_item)</div><div class='ctx'> {</div><div class='add'>+	const u64 i_size = i_size_read(&amp;inode-&gt;vfs_inode);</div><div class='ctx'> 	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	int ins_start_slot = 0;</div><div class='ctx'> 	int ins_nr = 0;</div><div class='hunk'>@@ -5454,13 +6300,21 @@ again:</div><div class='ctx'> 		if (min_key-&gt;type &gt; max_key-&gt;type)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		if (min_key-&gt;type == BTRFS_INODE_ITEM_KEY)</div><div class='add'>+		if (min_key-&gt;type == BTRFS_INODE_ITEM_KEY) {</div><div class='ctx'> 			*need_log_inode_item = false;</div><div class='del'>-</div><div class='del'>-		if ((min_key-&gt;type == BTRFS_INODE_REF_KEY ||</div><div class='del'>-		     min_key-&gt;type == BTRFS_INODE_EXTREF_KEY) &amp;&amp;</div><div class='del'>-		    inode-&gt;generation == trans-&gt;transid &amp;&amp;</div><div class='del'>-		    !recursive_logging) {</div><div class='add'>+		} else if (min_key-&gt;type == BTRFS_EXTENT_DATA_KEY &amp;&amp;</div><div class='add'>+			   min_key-&gt;offset &gt;= i_size) {</div><div class='add'>+			/*</div><div class='add'>+			 * Extents at and beyond eof are logged with</div><div class='add'>+			 * btrfs_log_prealloc_extents().</div><div class='add'>+			 * Only regular files have BTRFS_EXTENT_DATA_KEY keys,</div><div class='add'>+			 * and no keys greater than that, so bail out.</div><div class='add'>+			 */</div><div class='add'>+			break;</div><div class='add'>+		} else if ((min_key-&gt;type == BTRFS_INODE_REF_KEY ||</div><div class='add'>+			    min_key-&gt;type == BTRFS_INODE_EXTREF_KEY) &amp;&amp;</div><div class='add'>+			   (inode-&gt;generation == trans-&gt;transid ||</div><div class='add'>+			    ctx-&gt;logging_conflict_inodes)) {</div><div class='ctx'> 			u64 other_ino = 0;</div><div class='ctx'> 			u64 other_parent = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -5470,7 +6324,7 @@ again:</div><div class='ctx'> 			if (ret &lt; 0) {</div><div class='ctx'> 				return ret;</div><div class='ctx'> 			} else if (ret &gt; 0 &amp;&amp;</div><div class='del'>-				   other_ino != btrfs_ino(BTRFS_I(ctx-&gt;inode))) {</div><div class='add'>+				   other_ino != btrfs_ino(ctx-&gt;inode)) {</div><div class='ctx'> 				if (ins_nr &gt; 0) {</div><div class='ctx'> 					ins_nr++;</div><div class='ctx'> 				} else {</div><div class='hunk'>@@ -5479,27 +6333,26 @@ again:</div><div class='ctx'> 				}</div><div class='ctx'> 				ret = copy_items(trans, inode, dst_path, path,</div><div class='ctx'> 						 ins_start_slot, ins_nr,</div><div class='del'>-						 inode_only, logged_isize);</div><div class='add'>+						 inode_only, logged_isize, ctx);</div><div class='ctx'> 				if (ret &lt; 0)</div><div class='ctx'> 					return ret;</div><div class='ctx'> 				ins_nr = 0;</div><div class='ctx'> </div><div class='del'>-				ret = log_conflicting_inodes(trans, root, path,</div><div class='del'>-						ctx, other_ino, other_parent);</div><div class='add'>+				btrfs_release_path(path);</div><div class='add'>+				ret = add_conflicting_inode(trans, root, path,</div><div class='add'>+							    other_ino,</div><div class='add'>+							    other_parent, ctx);</div><div class='ctx'> 				if (ret)</div><div class='ctx'> 					return ret;</div><div class='del'>-				btrfs_release_path(path);</div><div class='ctx'> 				goto next_key;</div><div class='ctx'> 			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/* Skip xattrs, we log them later with btrfs_log_all_xattrs() */</div><div class='del'>-		if (min_key-&gt;type == BTRFS_XATTR_ITEM_KEY) {</div><div class='add'>+		} else if (min_key-&gt;type == BTRFS_XATTR_ITEM_KEY) {</div><div class='add'>+			/* Skip xattrs, logged later with btrfs_log_all_xattrs() */</div><div class='ctx'> 			if (ins_nr == 0)</div><div class='ctx'> 				goto next_slot;</div><div class='ctx'> 			ret = copy_items(trans, inode, dst_path, path,</div><div class='ctx'> 					 ins_start_slot,</div><div class='del'>-					 ins_nr, inode_only, logged_isize);</div><div class='add'>+					 ins_nr, inode_only, logged_isize, ctx);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='ctx'> 				return ret;</div><div class='ctx'> 			ins_nr = 0;</div><div class='hunk'>@@ -5516,7 +6369,7 @@ again:</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		ret = copy_items(trans, inode, dst_path, path, ins_start_slot,</div><div class='del'>-				 ins_nr, inode_only, logged_isize);</div><div class='add'>+				 ins_nr, inode_only, logged_isize, ctx);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 		ins_nr = 1;</div><div class='hunk'>@@ -5531,7 +6384,7 @@ next_slot:</div><div class='ctx'> 		if (ins_nr) {</div><div class='ctx'> 			ret = copy_items(trans, inode, dst_path, path,</div><div class='ctx'> 					 ins_start_slot, ins_nr, inode_only,</div><div class='del'>-					 logged_isize);</div><div class='add'>+					 logged_isize, ctx);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='ctx'> 				return ret;</div><div class='ctx'> 			ins_nr = 0;</div><div class='hunk'>@@ -5546,10 +6399,396 @@ next_key:</div><div class='ctx'> 		} else {</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * We may process many leaves full of items for our inode, so</div><div class='add'>+		 * avoid monopolizing a cpu for too long by rescheduling while</div><div class='add'>+		 * not holding locks on any tree.</div><div class='add'>+		 */</div><div class='add'>+		cond_resched();</div><div class='ctx'> 	}</div><div class='del'>-	if (ins_nr)</div><div class='add'>+	if (ins_nr) {</div><div class='ctx'> 		ret = copy_items(trans, inode, dst_path, path, ins_start_slot,</div><div class='del'>-				 ins_nr, inode_only, logged_isize);</div><div class='add'>+				 ins_nr, inode_only, logged_isize, ctx);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (inode_only == LOG_INODE_ALL &amp;&amp; S_ISREG(inode-&gt;vfs_inode.i_mode)) {</div><div class='add'>+		/*</div><div class='add'>+		 * Release the path because otherwise we might attempt to double</div><div class='add'>+		 * lock the same leaf with btrfs_log_prealloc_extents() below.</div><div class='add'>+		 */</div><div class='add'>+		btrfs_release_path(path);</div><div class='add'>+		ret = btrfs_log_prealloc_extents(trans, inode, dst_path, ctx);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int insert_delayed_items_batch(struct btrfs_trans_handle *trans,</div><div class='add'>+				      struct btrfs_root *log,</div><div class='add'>+				      struct btrfs_path *path,</div><div class='add'>+				      const struct btrfs_item_batch *batch,</div><div class='add'>+				      const struct btrfs_delayed_item *first_item)</div><div class='add'>+{</div><div class='add'>+	const struct btrfs_delayed_item *curr = first_item;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_insert_empty_items(trans, log, path, batch);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	for (int i = 0; i &lt; batch-&gt;nr; i++) {</div><div class='add'>+		char *data_ptr;</div><div class='add'>+</div><div class='add'>+		data_ptr = btrfs_item_ptr(path-&gt;nodes[0], path-&gt;slots[0], char);</div><div class='add'>+		write_extent_buffer(path-&gt;nodes[0], &amp;curr-&gt;data,</div><div class='add'>+				    (unsigned long)data_ptr, curr-&gt;data_len);</div><div class='add'>+		curr = list_next_entry(curr, log_list);</div><div class='add'>+		path-&gt;slots[0]++;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	btrfs_release_path(path);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int log_delayed_insertion_items(struct btrfs_trans_handle *trans,</div><div class='add'>+				       struct btrfs_inode *inode,</div><div class='add'>+				       struct btrfs_path *path,</div><div class='add'>+				       const struct list_head *delayed_ins_list,</div><div class='add'>+				       struct btrfs_log_ctx *ctx)</div><div class='add'>+{</div><div class='add'>+	/* 195 (4095 bytes of keys and sizes) fits in a single 4K page. */</div><div class='add'>+	const int max_batch_size = 195;</div><div class='add'>+	const int leaf_data_size = BTRFS_LEAF_DATA_SIZE(trans-&gt;fs_info);</div><div class='add'>+	const u64 ino = btrfs_ino(inode);</div><div class='add'>+	struct btrfs_root *log = inode-&gt;root-&gt;log_root;</div><div class='add'>+	struct btrfs_item_batch batch = {</div><div class='add'>+		.nr = 0,</div><div class='add'>+		.total_data_size = 0,</div><div class='add'>+	};</div><div class='add'>+	const struct btrfs_delayed_item *first = NULL;</div><div class='add'>+	const struct btrfs_delayed_item *curr;</div><div class='add'>+	char *ins_data;</div><div class='add'>+	struct btrfs_key *ins_keys;</div><div class='add'>+	u32 *ins_sizes;</div><div class='add'>+	u64 curr_batch_size = 0;</div><div class='add'>+	int batch_idx = 0;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	/* We are adding dir index items to the log tree. */</div><div class='add'>+	lockdep_assert_held(&amp;inode-&gt;log_mutex);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We collect delayed items before copying index keys from the subvolume</div><div class='add'>+	 * to the log tree. However just after we collected them, they may have</div><div class='add'>+	 * been flushed (all of them or just some of them), and therefore we</div><div class='add'>+	 * could have copied them from the subvolume tree to the log tree.</div><div class='add'>+	 * So find the first delayed item that was not yet logged (they are</div><div class='add'>+	 * sorted by index number).</div><div class='add'>+	 */</div><div class='add'>+	list_for_each_entry(curr, delayed_ins_list, log_list) {</div><div class='add'>+		if (curr-&gt;index &gt; inode-&gt;last_dir_index_offset) {</div><div class='add'>+			first = curr;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Empty list or all delayed items were already logged. */</div><div class='add'>+	if (!first)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	ins_data = kmalloc_array(max_batch_size, sizeof(u32) + sizeof(struct btrfs_key), GFP_NOFS);</div><div class='add'>+	if (!ins_data)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	ins_sizes = (u32 *)ins_data;</div><div class='add'>+	batch.data_sizes = ins_sizes;</div><div class='add'>+	ins_keys = (struct btrfs_key *)(ins_data + max_batch_size * sizeof(u32));</div><div class='add'>+	batch.keys = ins_keys;</div><div class='add'>+</div><div class='add'>+	curr = first;</div><div class='add'>+	while (!list_entry_is_head(curr, delayed_ins_list, log_list)) {</div><div class='add'>+		const u32 curr_size = curr-&gt;data_len + sizeof(struct btrfs_item);</div><div class='add'>+</div><div class='add'>+		if (curr_batch_size + curr_size &gt; leaf_data_size ||</div><div class='add'>+		    batch.nr == max_batch_size) {</div><div class='add'>+			ret = insert_delayed_items_batch(trans, log, path,</div><div class='add'>+							 &amp;batch, first);</div><div class='add'>+			if (ret)</div><div class='add'>+				goto out;</div><div class='add'>+			batch_idx = 0;</div><div class='add'>+			batch.nr = 0;</div><div class='add'>+			batch.total_data_size = 0;</div><div class='add'>+			curr_batch_size = 0;</div><div class='add'>+			first = curr;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		ins_sizes[batch_idx] = curr-&gt;data_len;</div><div class='add'>+		ins_keys[batch_idx].objectid = ino;</div><div class='add'>+		ins_keys[batch_idx].type = BTRFS_DIR_INDEX_KEY;</div><div class='add'>+		ins_keys[batch_idx].offset = curr-&gt;index;</div><div class='add'>+		curr_batch_size += curr_size;</div><div class='add'>+		batch.total_data_size += curr-&gt;data_len;</div><div class='add'>+		batch.nr++;</div><div class='add'>+		batch_idx++;</div><div class='add'>+		curr = list_next_entry(curr, log_list);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ASSERT(batch.nr &gt;= 1, "batch.nr=%d", batch.nr);</div><div class='add'>+	ret = insert_delayed_items_batch(trans, log, path, &amp;batch, first);</div><div class='add'>+</div><div class='add'>+	curr = list_last_entry(delayed_ins_list, struct btrfs_delayed_item,</div><div class='add'>+			       log_list);</div><div class='add'>+	inode-&gt;last_dir_index_offset = curr-&gt;index;</div><div class='add'>+out:</div><div class='add'>+	kfree(ins_data);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int log_delayed_deletions_full(struct btrfs_trans_handle *trans,</div><div class='add'>+				      struct btrfs_inode *inode,</div><div class='add'>+				      struct btrfs_path *path,</div><div class='add'>+				      const struct list_head *delayed_del_list,</div><div class='add'>+				      struct btrfs_log_ctx *ctx)</div><div class='add'>+{</div><div class='add'>+	const u64 ino = btrfs_ino(inode);</div><div class='add'>+	const struct btrfs_delayed_item *curr;</div><div class='add'>+</div><div class='add'>+	curr = list_first_entry(delayed_del_list, struct btrfs_delayed_item,</div><div class='add'>+				log_list);</div><div class='add'>+</div><div class='add'>+	while (!list_entry_is_head(curr, delayed_del_list, log_list)) {</div><div class='add'>+		u64 first_dir_index = curr-&gt;index;</div><div class='add'>+		u64 last_dir_index;</div><div class='add'>+		const struct btrfs_delayed_item *next;</div><div class='add'>+		int ret;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Find a range of consecutive dir index items to delete. Like</div><div class='add'>+		 * this we log a single dir range item spanning several contiguous</div><div class='add'>+		 * dir items instead of logging one range item per dir index item.</div><div class='add'>+		 */</div><div class='add'>+		next = list_next_entry(curr, log_list);</div><div class='add'>+		while (!list_entry_is_head(next, delayed_del_list, log_list)) {</div><div class='add'>+			if (next-&gt;index != curr-&gt;index + 1)</div><div class='add'>+				break;</div><div class='add'>+			curr = next;</div><div class='add'>+			next = list_next_entry(next, log_list);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		last_dir_index = curr-&gt;index;</div><div class='add'>+		ASSERT(last_dir_index &gt;= first_dir_index,</div><div class='add'>+		       "last_dir_index=%llu first_dir_index=%llu",</div><div class='add'>+		       last_dir_index, first_dir_index);</div><div class='add'>+</div><div class='add'>+		ret = insert_dir_log_key(trans, inode-&gt;root-&gt;log_root, path,</div><div class='add'>+					 ino, first_dir_index, last_dir_index);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		curr = list_next_entry(curr, log_list);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int batch_delete_dir_index_items(struct btrfs_trans_handle *trans,</div><div class='add'>+					struct btrfs_inode *inode,</div><div class='add'>+					struct btrfs_path *path,</div><div class='add'>+					const struct list_head *delayed_del_list,</div><div class='add'>+					const struct btrfs_delayed_item *first,</div><div class='add'>+					const struct btrfs_delayed_item **last_ret)</div><div class='add'>+{</div><div class='add'>+	const struct btrfs_delayed_item *next;</div><div class='add'>+	struct extent_buffer *leaf = path-&gt;nodes[0];</div><div class='add'>+	const int last_slot = btrfs_header_nritems(leaf) - 1;</div><div class='add'>+	int slot = path-&gt;slots[0] + 1;</div><div class='add'>+	const u64 ino = btrfs_ino(inode);</div><div class='add'>+</div><div class='add'>+	next = list_next_entry(first, log_list);</div><div class='add'>+</div><div class='add'>+	while (slot &lt; last_slot &amp;&amp;</div><div class='add'>+	       !list_entry_is_head(next, delayed_del_list, log_list)) {</div><div class='add'>+		struct btrfs_key key;</div><div class='add'>+</div><div class='add'>+		btrfs_item_key_to_cpu(leaf, &amp;key, slot);</div><div class='add'>+		if (key.objectid != ino ||</div><div class='add'>+		    key.type != BTRFS_DIR_INDEX_KEY ||</div><div class='add'>+		    key.offset != next-&gt;index)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		slot++;</div><div class='add'>+		*last_ret = next;</div><div class='add'>+		next = list_next_entry(next, log_list);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return btrfs_del_items(trans, inode-&gt;root-&gt;log_root, path,</div><div class='add'>+			       path-&gt;slots[0], slot - path-&gt;slots[0]);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int log_delayed_deletions_incremental(struct btrfs_trans_handle *trans,</div><div class='add'>+					     struct btrfs_inode *inode,</div><div class='add'>+					     struct btrfs_path *path,</div><div class='add'>+					     const struct list_head *delayed_del_list,</div><div class='add'>+					     struct btrfs_log_ctx *ctx)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_root *log = inode-&gt;root-&gt;log_root;</div><div class='add'>+	const struct btrfs_delayed_item *curr;</div><div class='add'>+	u64 last_range_start = 0;</div><div class='add'>+	u64 last_range_end = 0;</div><div class='add'>+	struct btrfs_key key;</div><div class='add'>+</div><div class='add'>+	key.objectid = btrfs_ino(inode);</div><div class='add'>+	key.type = BTRFS_DIR_INDEX_KEY;</div><div class='add'>+	curr = list_first_entry(delayed_del_list, struct btrfs_delayed_item,</div><div class='add'>+				log_list);</div><div class='add'>+</div><div class='add'>+	while (!list_entry_is_head(curr, delayed_del_list, log_list)) {</div><div class='add'>+		const struct btrfs_delayed_item *last = curr;</div><div class='add'>+		u64 first_dir_index = curr-&gt;index;</div><div class='add'>+		u64 last_dir_index;</div><div class='add'>+		bool deleted_items = false;</div><div class='add'>+		int ret;</div><div class='add'>+</div><div class='add'>+		key.offset = curr-&gt;index;</div><div class='add'>+		ret = btrfs_search_slot(trans, log, &amp;key, path, -1, 1);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			return ret;</div><div class='add'>+		} else if (ret == 0) {</div><div class='add'>+			ret = batch_delete_dir_index_items(trans, inode, path,</div><div class='add'>+							   delayed_del_list, curr,</div><div class='add'>+							   &amp;last);</div><div class='add'>+			if (ret)</div><div class='add'>+				return ret;</div><div class='add'>+			deleted_items = true;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		btrfs_release_path(path);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * If we deleted items from the leaf, it means we have a range</div><div class='add'>+		 * item logging their range, so no need to add one or update an</div><div class='add'>+		 * existing one. Otherwise we have to log a dir range item.</div><div class='add'>+		 */</div><div class='add'>+		if (deleted_items)</div><div class='add'>+			goto next_batch;</div><div class='add'>+</div><div class='add'>+		last_dir_index = last-&gt;index;</div><div class='add'>+		ASSERT(last_dir_index &gt;= first_dir_index,</div><div class='add'>+		       "last_dir_index=%llu first_dir_index=%llu",</div><div class='add'>+		       last_dir_index, first_dir_index);</div><div class='add'>+		/*</div><div class='add'>+		 * If this range starts right after where the previous one ends,</div><div class='add'>+		 * then we want to reuse the previous range item and change its</div><div class='add'>+		 * end offset to the end of this range. This is just to minimize</div><div class='add'>+		 * leaf space usage, by avoiding adding a new range item.</div><div class='add'>+		 */</div><div class='add'>+		if (last_range_end != 0 &amp;&amp; first_dir_index == last_range_end + 1)</div><div class='add'>+			first_dir_index = last_range_start;</div><div class='add'>+</div><div class='add'>+		ret = insert_dir_log_key(trans, log, path, key.objectid,</div><div class='add'>+					 first_dir_index, last_dir_index);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+</div><div class='add'>+		last_range_start = first_dir_index;</div><div class='add'>+		last_range_end = last_dir_index;</div><div class='add'>+next_batch:</div><div class='add'>+		curr = list_next_entry(last, log_list);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int log_delayed_deletion_items(struct btrfs_trans_handle *trans,</div><div class='add'>+				      struct btrfs_inode *inode,</div><div class='add'>+				      struct btrfs_path *path,</div><div class='add'>+				      const struct list_head *delayed_del_list,</div><div class='add'>+				      struct btrfs_log_ctx *ctx)</div><div class='add'>+{</div><div class='add'>+	/*</div><div class='add'>+	 * We are deleting dir index items from the log tree or adding range</div><div class='add'>+	 * items to it.</div><div class='add'>+	 */</div><div class='add'>+	lockdep_assert_held(&amp;inode-&gt;log_mutex);</div><div class='add'>+</div><div class='add'>+	if (list_empty(delayed_del_list))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if (ctx-&gt;logged_before)</div><div class='add'>+		return log_delayed_deletions_incremental(trans, inode, path,</div><div class='add'>+							 delayed_del_list, ctx);</div><div class='add'>+</div><div class='add'>+	return log_delayed_deletions_full(trans, inode, path, delayed_del_list,</div><div class='add'>+					  ctx);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Similar logic as for log_new_dir_dentries(), but it iterates over the delayed</div><div class='add'>+ * items instead of the subvolume tree.</div><div class='add'>+ */</div><div class='add'>+static int log_new_delayed_dentries(struct btrfs_trans_handle *trans,</div><div class='add'>+				    struct btrfs_inode *inode,</div><div class='add'>+				    const struct list_head *delayed_ins_list,</div><div class='add'>+				    struct btrfs_log_ctx *ctx)</div><div class='add'>+{</div><div class='add'>+	const bool orig_log_new_dentries = ctx-&gt;log_new_dentries;</div><div class='add'>+	struct btrfs_delayed_item *item;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * No need for the log mutex, plus to avoid potential deadlocks or</div><div class='add'>+	 * lockdep annotations due to nesting of delayed inode mutexes and log</div><div class='add'>+	 * mutexes.</div><div class='add'>+	 */</div><div class='add'>+	lockdep_assert_not_held(&amp;inode-&gt;log_mutex);</div><div class='add'>+</div><div class='add'>+	ASSERT(!ctx-&gt;logging_new_delayed_dentries,</div><div class='add'>+	       "ctx-&gt;logging_new_delayed_dentries=%d", ctx-&gt;logging_new_delayed_dentries);</div><div class='add'>+	ctx-&gt;logging_new_delayed_dentries = true;</div><div class='add'>+</div><div class='add'>+	list_for_each_entry(item, delayed_ins_list, log_list) {</div><div class='add'>+		struct btrfs_dir_item *dir_item;</div><div class='add'>+		struct btrfs_inode *di_inode;</div><div class='add'>+		struct btrfs_key key;</div><div class='add'>+		int log_mode = LOG_INODE_EXISTS;</div><div class='add'>+</div><div class='add'>+		dir_item = (struct btrfs_dir_item *)item-&gt;data;</div><div class='add'>+		btrfs_disk_key_to_cpu(&amp;key, &amp;dir_item-&gt;location);</div><div class='add'>+</div><div class='add'>+		if (key.type == BTRFS_ROOT_ITEM_KEY)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		di_inode = btrfs_iget_logging(key.objectid, inode-&gt;root);</div><div class='add'>+		if (IS_ERR(di_inode)) {</div><div class='add'>+			ret = PTR_ERR(di_inode);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (!need_log_inode(trans, di_inode)) {</div><div class='add'>+			btrfs_add_delayed_iput(di_inode);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (btrfs_stack_dir_ftype(dir_item) == BTRFS_FT_DIR)</div><div class='add'>+			log_mode = LOG_INODE_ALL;</div><div class='add'>+</div><div class='add'>+		ctx-&gt;log_new_dentries = false;</div><div class='add'>+		ret = btrfs_log_inode(trans, di_inode, log_mode, ctx);</div><div class='add'>+</div><div class='add'>+		if (!ret &amp;&amp; ctx-&gt;log_new_dentries)</div><div class='add'>+			ret = log_new_dir_dentries(trans, di_inode, ctx);</div><div class='add'>+</div><div class='add'>+		btrfs_add_delayed_iput(di_inode);</div><div class='add'>+</div><div class='add'>+		if (ret)</div><div class='add'>+			break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ctx-&gt;log_new_dentries = orig_log_new_dentries;</div><div class='add'>+	ctx-&gt;logging_new_delayed_dentries = false;</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -5578,16 +6817,17 @@ static int btrfs_log_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	struct btrfs_key min_key;</div><div class='ctx'> 	struct btrfs_key max_key;</div><div class='ctx'> 	struct btrfs_root *log = inode-&gt;root-&gt;log_root;</div><div class='del'>-	int err = 0;</div><div class='del'>-	int ret = 0;</div><div class='add'>+	int ret;</div><div class='ctx'> 	bool fast_search = false;</div><div class='ctx'> 	u64 ino = btrfs_ino(inode);</div><div class='ctx'> 	struct extent_map_tree *em_tree = &amp;inode-&gt;extent_tree;</div><div class='ctx'> 	u64 logged_isize = 0;</div><div class='ctx'> 	bool need_log_inode_item = true;</div><div class='ctx'> 	bool xattrs_logged = false;</div><div class='del'>-	bool recursive_logging = false;</div><div class='ctx'> 	bool inode_item_dropped = true;</div><div class='add'>+	bool full_dir_logging = false;</div><div class='add'>+	LIST_HEAD(delayed_ins_list);</div><div class='add'>+	LIST_HEAD(delayed_del_list);</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='hunk'>@@ -5615,27 +6855,69 @@ static int btrfs_log_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		max_key.type = (u8)-1;</div><div class='ctx'> 	max_key.offset = (u64)-1;</div><div class='ctx'> </div><div class='add'>+	if (S_ISDIR(inode-&gt;vfs_inode.i_mode) &amp;&amp; inode_only == LOG_INODE_ALL)</div><div class='add'>+		full_dir_logging = true;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='del'>-	 * Only run delayed items if we are a directory. We want to make sure</div><div class='del'>-	 * all directory indexes hit the fs/subvolume tree so we can find them</div><div class='del'>-	 * and figure out which index ranges have to be logged.</div><div class='add'>+	 * If we are logging a directory while we are logging dentries of the</div><div class='add'>+	 * delayed items of some other inode, then we need to flush the delayed</div><div class='add'>+	 * items of this directory and not log the delayed items directly. This</div><div class='add'>+	 * is to prevent more than one level of recursion into btrfs_log_inode()</div><div class='add'>+	 * by having something like this:</div><div class='add'>+	 *</div><div class='add'>+	 *     $ mkdir -p a/b/c/d/e/f/g/h/...</div><div class='add'>+	 *     $ xfs_io -c "fsync" a</div><div class='add'>+	 *</div><div class='add'>+	 * Where all directories in the path did not exist before and are</div><div class='add'>+	 * created in the current transaction.</div><div class='add'>+	 * So in such a case we directly log the delayed items of the main</div><div class='add'>+	 * directory ("a") without flushing them first, while for each of its</div><div class='add'>+	 * subdirectories we flush their delayed items before logging them.</div><div class='add'>+	 * This prevents a potential unbounded recursion like this:</div><div class='add'>+	 *</div><div class='add'>+	 * btrfs_log_inode()</div><div class='add'>+	 *   log_new_delayed_dentries()</div><div class='add'>+	 *      btrfs_log_inode()</div><div class='add'>+	 *        log_new_delayed_dentries()</div><div class='add'>+	 *          btrfs_log_inode()</div><div class='add'>+	 *            log_new_delayed_dentries()</div><div class='add'>+	 *              (...)</div><div class='add'>+	 *</div><div class='add'>+	 * We have thresholds for the maximum number of delayed items to have in</div><div class='add'>+	 * memory, and once they are hit, the items are flushed asynchronously.</div><div class='add'>+	 * However the limit is quite high, so lets prevent deep levels of</div><div class='add'>+	 * recursion to happen by limiting the maximum depth to be 1.</div><div class='ctx'> 	 */</div><div class='del'>-	if (S_ISDIR(inode-&gt;vfs_inode.i_mode)) {</div><div class='del'>-		err = btrfs_commit_inode_delayed_items(trans, inode);</div><div class='del'>-		if (err)</div><div class='add'>+	if (full_dir_logging &amp;&amp; ctx-&gt;logging_new_delayed_dentries) {</div><div class='add'>+		ret = btrfs_commit_inode_delayed_items(trans, inode);</div><div class='add'>+		if (ret)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (inode_only == LOG_OTHER_INODE || inode_only == LOG_OTHER_INODE_ALL) {</div><div class='del'>-		recursive_logging = true;</div><div class='del'>-		if (inode_only == LOG_OTHER_INODE)</div><div class='del'>-			inode_only = LOG_INODE_EXISTS;</div><div class='del'>-		else</div><div class='del'>-			inode_only = LOG_INODE_ALL;</div><div class='del'>-		mutex_lock_nested(&amp;inode-&gt;log_mutex, SINGLE_DEPTH_NESTING);</div><div class='del'>-	} else {</div><div class='del'>-		mutex_lock(&amp;inode-&gt;log_mutex);</div><div class='del'>-	}</div><div class='add'>+	mutex_lock(&amp;inode-&gt;log_mutex);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * For symlinks, we must always log their content, which is stored in an</div><div class='add'>+	 * inline extent, otherwise we could end up with an empty symlink after</div><div class='add'>+	 * log replay, which is invalid on linux (symlink(2) returns -ENOENT if</div><div class='add'>+	 * one attempts to create an empty symlink).</div><div class='add'>+	 * We don't need to worry about flushing delalloc, because when we create</div><div class='add'>+	 * the inline extent when the symlink is created (we never have delalloc</div><div class='add'>+	 * for symlinks).</div><div class='add'>+	 */</div><div class='add'>+	if (S_ISLNK(inode-&gt;vfs_inode.i_mode))</div><div class='add'>+		inode_only = LOG_INODE_ALL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Before logging the inode item, cache the value returned by</div><div class='add'>+	 * inode_logged(), because after that we have the need to figure out if</div><div class='add'>+	 * the inode was previously logged in this transaction.</div><div class='add'>+	 */</div><div class='add'>+	ret = inode_logged(trans, inode, path);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	ctx-&gt;logged_before = (ret == 1);</div><div class='add'>+	ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * This is for cases where logging a directory could result in losing a</div><div class='hunk'>@@ -5644,11 +6926,8 @@ static int btrfs_log_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * to known the file was moved from A to B, so logging just A would</div><div class='ctx'> 	 * result in losing the file after a log replay.</div><div class='ctx'> 	 */</div><div class='del'>-	if (S_ISDIR(inode-&gt;vfs_inode.i_mode) &amp;&amp;</div><div class='del'>-	    inode_only == LOG_INODE_ALL &amp;&amp;</div><div class='del'>-	    inode-&gt;last_unlink_trans &gt;= trans-&gt;transid) {</div><div class='del'>-		btrfs_set_log_full_commit(trans);</div><div class='del'>-		err = 1;</div><div class='add'>+	if (full_dir_logging &amp;&amp; inode-&gt;last_unlink_trans &gt;= trans-&gt;transid) {</div><div class='add'>+		ret = BTRFS_LOG_FORCE_COMMIT;</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -5657,14 +6936,12 @@ static int btrfs_log_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * copies of everything.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (S_ISDIR(inode-&gt;vfs_inode.i_mode)) {</div><div class='del'>-		int max_key_type = BTRFS_DIR_LOG_INDEX_KEY;</div><div class='del'>-</div><div class='ctx'> 		clear_bit(BTRFS_INODE_COPY_EVERYTHING, &amp;inode-&gt;runtime_flags);</div><div class='del'>-		if (inode_only == LOG_INODE_EXISTS)</div><div class='del'>-			max_key_type = BTRFS_XATTR_ITEM_KEY;</div><div class='del'>-		ret = drop_inode_items(trans, log, path, inode, max_key_type);</div><div class='add'>+		if (ctx-&gt;logged_before)</div><div class='add'>+			ret = drop_inode_items(trans, log, path, inode,</div><div class='add'>+					       BTRFS_XATTR_ITEM_KEY);</div><div class='ctx'> 	} else {</div><div class='del'>-		if (inode_only == LOG_INODE_EXISTS &amp;&amp; inode_logged(trans, inode)) {</div><div class='add'>+		if (inode_only == LOG_INODE_EXISTS &amp;&amp; ctx-&gt;logged_before) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Make sure the new inode item we write to the log has</div><div class='ctx'> 			 * the same isize as the current one (if it exists).</div><div class='hunk'>@@ -5678,22 +6955,23 @@ static int btrfs_log_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			 * (zeroes), as if an expanding truncate happened,</div><div class='ctx'> 			 * instead of getting a file of 4Kb only.</div><div class='ctx'> 			 */</div><div class='del'>-			err = logged_inode_size(log, inode, path, &amp;logged_isize);</div><div class='del'>-			if (err)</div><div class='add'>+			ret = logged_inode_size(log, inode, path, &amp;logged_isize);</div><div class='add'>+			if (ret)</div><div class='ctx'> 				goto out_unlock;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (test_bit(BTRFS_INODE_NEEDS_FULL_SYNC,</div><div class='ctx'> 			     &amp;inode-&gt;runtime_flags)) {</div><div class='ctx'> 			if (inode_only == LOG_INODE_EXISTS) {</div><div class='ctx'> 				max_key.type = BTRFS_XATTR_ITEM_KEY;</div><div class='del'>-				ret = drop_inode_items(trans, log, path, inode,</div><div class='del'>-						       max_key.type);</div><div class='add'>+				if (ctx-&gt;logged_before)</div><div class='add'>+					ret = drop_inode_items(trans, log, path,</div><div class='add'>+							       inode, max_key.type);</div><div class='ctx'> 			} else {</div><div class='ctx'> 				clear_bit(BTRFS_INODE_NEEDS_FULL_SYNC,</div><div class='ctx'> 					  &amp;inode-&gt;runtime_flags);</div><div class='ctx'> 				clear_bit(BTRFS_INODE_COPY_EVERYTHING,</div><div class='ctx'> 					  &amp;inode-&gt;runtime_flags);</div><div class='del'>-				if (inode_logged(trans, inode))</div><div class='add'>+				if (ctx-&gt;logged_before)</div><div class='ctx'> 					ret = truncate_inode_items(trans, log,</div><div class='ctx'> 								   inode, 0, 0);</div><div class='ctx'> 			}</div><div class='hunk'>@@ -5703,8 +6981,9 @@ static int btrfs_log_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			if (inode_only == LOG_INODE_ALL)</div><div class='ctx'> 				fast_search = true;</div><div class='ctx'> 			max_key.type = BTRFS_XATTR_ITEM_KEY;</div><div class='del'>-			ret = drop_inode_items(trans, log, path, inode,</div><div class='del'>-					       max_key.type);</div><div class='add'>+			if (ctx-&gt;logged_before)</div><div class='add'>+				ret = drop_inode_items(trans, log, path, inode,</div><div class='add'>+						       max_key.type);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			if (inode_only == LOG_INODE_ALL)</div><div class='ctx'> 				fast_search = true;</div><div class='hunk'>@@ -5713,37 +6992,58 @@ static int btrfs_log_inode(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 	}</div><div class='del'>-	if (ret) {</div><div class='del'>-		err = ret;</div><div class='add'>+	if (ret)</div><div class='ctx'> 		goto out_unlock;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If we are logging a directory in full mode, collect the delayed items</div><div class='add'>+	 * before iterating the subvolume tree, so that we don't miss any new</div><div class='add'>+	 * dir index items in case they get flushed while or right after we are</div><div class='add'>+	 * iterating the subvolume tree.</div><div class='add'>+	 */</div><div class='add'>+	if (full_dir_logging &amp;&amp; !ctx-&gt;logging_new_delayed_dentries)</div><div class='add'>+		btrfs_log_get_delayed_items(inode, &amp;delayed_ins_list,</div><div class='add'>+					    &amp;delayed_del_list);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If we are fsyncing a file with 0 hard links, then commit the delayed</div><div class='add'>+	 * inode because the last inode ref (or extref) item may still be in the</div><div class='add'>+	 * subvolume tree and if we log it the file will still exist after a log</div><div class='add'>+	 * replay. So commit the delayed inode to delete that last ref and we</div><div class='add'>+	 * skip logging it.</div><div class='add'>+	 */</div><div class='add'>+	if (inode-&gt;vfs_inode.i_nlink == 0) {</div><div class='add'>+		ret = btrfs_commit_inode_delayed_inode(inode);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = copy_inode_items_to_log(trans, inode, &amp;min_key, &amp;max_key,</div><div class='add'>+	ret = copy_inode_items_to_log(trans, inode, &amp;min_key, &amp;max_key,</div><div class='ctx'> 				      path, dst_path, logged_isize,</div><div class='del'>-				      recursive_logging, inode_only, ctx,</div><div class='add'>+				      inode_only, ctx,</div><div class='ctx'> 				      &amp;need_log_inode_item);</div><div class='del'>-	if (err)</div><div class='add'>+	if (ret)</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> 	btrfs_release_path(dst_path);</div><div class='del'>-	err = btrfs_log_all_xattrs(trans, inode, path, dst_path);</div><div class='del'>-	if (err)</div><div class='add'>+	ret = btrfs_log_all_xattrs(trans, inode, path, dst_path, ctx);</div><div class='add'>+	if (ret)</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	xattrs_logged = true;</div><div class='ctx'> 	if (max_key.type &gt;= BTRFS_EXTENT_DATA_KEY &amp;&amp; !fast_search) {</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> 		btrfs_release_path(dst_path);</div><div class='del'>-		err = btrfs_log_holes(trans, inode, path);</div><div class='del'>-		if (err)</div><div class='add'>+		ret = btrfs_log_holes(trans, inode, path);</div><div class='add'>+		if (ret)</div><div class='ctx'> 			goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> log_extents:</div><div class='ctx'> 	btrfs_release_path(path);</div><div class='ctx'> 	btrfs_release_path(dst_path);</div><div class='ctx'> 	if (need_log_inode_item) {</div><div class='del'>-		err = log_inode_item(trans, log, dst_path, inode, inode_item_dropped);</div><div class='del'>-		if (err)</div><div class='add'>+		ret = log_inode_item(trans, log, dst_path, inode, inode_item_dropped);</div><div class='add'>+		if (ret)</div><div class='ctx'> 			goto out_unlock;</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * If we are doing a fast fsync and the inode was logged before</div><div class='hunk'>@@ -5754,18 +7054,16 @@ log_extents:</div><div class='ctx'> 		 * BTRFS_INODE_COPY_EVERYTHING set.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (!xattrs_logged &amp;&amp; inode-&gt;logged_trans &lt; trans-&gt;transid) {</div><div class='del'>-			err = btrfs_log_all_xattrs(trans, inode, path, dst_path);</div><div class='del'>-			if (err)</div><div class='add'>+			ret = btrfs_log_all_xattrs(trans, inode, path, dst_path, ctx);</div><div class='add'>+			if (ret)</div><div class='ctx'> 				goto out_unlock;</div><div class='ctx'> 			btrfs_release_path(path);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	if (fast_search) {</div><div class='ctx'> 		ret = btrfs_log_changed_extents(trans, inode, dst_path, ctx);</div><div class='del'>-		if (ret) {</div><div class='del'>-			err = ret;</div><div class='add'>+		if (ret)</div><div class='ctx'> 			goto out_unlock;</div><div class='del'>-		}</div><div class='ctx'> 	} else if (inode_only == LOG_INODE_ALL) {</div><div class='ctx'> 		struct extent_map *em, *n;</div><div class='ctx'> </div><div class='hunk'>@@ -5775,12 +7073,18 @@ log_extents:</div><div class='ctx'> 		write_unlock(&amp;em_tree-&gt;lock);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (inode_only == LOG_INODE_ALL &amp;&amp; S_ISDIR(inode-&gt;vfs_inode.i_mode)) {</div><div class='add'>+	if (full_dir_logging) {</div><div class='ctx'> 		ret = log_directory_changes(trans, inode, path, dst_path, ctx);</div><div class='del'>-		if (ret) {</div><div class='del'>-			err = ret;</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out_unlock;</div><div class='add'>+		ret = log_delayed_insertion_items(trans, inode, path,</div><div class='add'>+						  &amp;delayed_ins_list, ctx);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out_unlock;</div><div class='add'>+		ret = log_delayed_deletion_items(trans, inode, path,</div><div class='add'>+						 &amp;delayed_del_list, ctx);</div><div class='add'>+		if (ret)</div><div class='ctx'> 			goto out_unlock;</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;inode-&gt;lock);</div><div class='hunk'>@@ -5816,232 +7120,37 @@ log_extents:</div><div class='ctx'> 	 *    a power failure unless the log was synced as part of an fsync</div><div class='ctx'> 	 *    against any other unrelated inode.</div><div class='ctx'> 	 */</div><div class='del'>-	if (inode_only != LOG_INODE_EXISTS)</div><div class='add'>+	if (!ctx-&gt;logging_new_name &amp;&amp; inode_only != LOG_INODE_EXISTS)</div><div class='ctx'> 		inode-&gt;last_log_commit = inode-&gt;last_sub_trans;</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;lock);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Reset the last_reflink_trans so that the next fsync does not need to</div><div class='add'>+	 * go through the slower path when logging extents and their checksums.</div><div class='add'>+	 */</div><div class='add'>+	if (inode_only == LOG_INODE_ALL)</div><div class='add'>+		inode-&gt;last_reflink_trans = 0;</div><div class='add'>+</div><div class='ctx'> out_unlock:</div><div class='ctx'> 	mutex_unlock(&amp;inode-&gt;log_mutex);</div><div class='ctx'> out:</div><div class='ctx'> 	btrfs_free_path(path);</div><div class='ctx'> 	btrfs_free_path(dst_path);</div><div class='del'>-	return err;</div><div class='del'>-}</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Check if we need to log an inode. This is used in contexts where while</div><div class='del'>- * logging an inode we need to log another inode (either that it exists or in</div><div class='del'>- * full mode). This is used instead of btrfs_inode_in_log() because the later</div><div class='del'>- * requires the inode to be in the log and have the log transaction committed,</div><div class='del'>- * while here we do not care if the log transaction was already committed - our</div><div class='del'>- * caller will commit the log later - and we want to avoid logging an inode</div><div class='del'>- * multiple times when multiple tasks have joined the same log transaction.</div><div class='del'>- */</div><div class='del'>-static bool need_log_inode(struct btrfs_trans_handle *trans,</div><div class='del'>-			   struct btrfs_inode *inode)</div><div class='del'>-{</div><div class='del'>-	/*</div><div class='del'>-	 * If a directory was not modified, no dentries added or removed, we can</div><div class='del'>-	 * and should avoid logging it.</div><div class='del'>-	 */</div><div class='del'>-	if (S_ISDIR(inode-&gt;vfs_inode.i_mode) &amp;&amp; inode-&gt;last_trans &lt; trans-&gt;transid)</div><div class='del'>-		return false;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If this inode does not have new/updated/deleted xattrs since the last</div><div class='del'>-	 * time it was logged and is flagged as logged in the current transaction,</div><div class='del'>-	 * we can skip logging it. As for new/deleted names, those are updated in</div><div class='del'>-	 * the log by link/unlink/rename operations.</div><div class='del'>-	 * In case the inode was logged and then evicted and reloaded, its</div><div class='del'>-	 * logged_trans will be 0, in which case we have to fully log it since</div><div class='del'>-	 * logged_trans is a transient field, not persisted.</div><div class='del'>-	 */</div><div class='del'>-	if (inode-&gt;logged_trans == trans-&gt;transid &amp;&amp;</div><div class='del'>-	    !test_bit(BTRFS_INODE_COPY_EVERYTHING, &amp;inode-&gt;runtime_flags))</div><div class='del'>-		return false;</div><div class='del'>-</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct btrfs_dir_list {</div><div class='del'>-	u64 ino;</div><div class='del'>-	struct list_head list;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Log the inodes of the new dentries of a directory. See log_dir_items() for</div><div class='del'>- * details about the why it is needed.</div><div class='del'>- * This is a recursive operation - if an existing dentry corresponds to a</div><div class='del'>- * directory, that directory's new entries are logged too (same behaviour as</div><div class='del'>- * ext3/4, xfs, f2fs, reiserfs, nilfs2). Note that when logging the inodes</div><div class='del'>- * the dentries point to we do not lock their i_mutex, otherwise lockdep</div><div class='del'>- * complains about the following circular lock dependency / possible deadlock:</div><div class='del'>- *</div><div class='del'>- *        CPU0                                        CPU1</div><div class='del'>- *        ----                                        ----</div><div class='del'>- * lock(&amp;type-&gt;i_mutex_dir_key#3/2);</div><div class='del'>- *                                            lock(sb_internal#2);</div><div class='del'>- *                                            lock(&amp;type-&gt;i_mutex_dir_key#3/2);</div><div class='del'>- * lock(&amp;sb-&gt;s_type-&gt;i_mutex_key#14);</div><div class='del'>- *</div><div class='del'>- * Where sb_internal is the lock (a counter that works as a lock) acquired by</div><div class='del'>- * sb_start_intwrite() in btrfs_start_transaction().</div><div class='del'>- * Not locking i_mutex of the inodes is still safe because:</div><div class='del'>- *</div><div class='del'>- * 1) For regular files we log with a mode of LOG_INODE_EXISTS. It's possible</div><div class='del'>- *    that while logging the inode new references (names) are added or removed</div><div class='del'>- *    from the inode, leaving the logged inode item with a link count that does</div><div class='del'>- *    not match the number of logged inode reference items. This is fine because</div><div class='del'>- *    at log replay time we compute the real number of links and correct the</div><div class='del'>- *    link count in the inode item (see replay_one_buffer() and</div><div class='del'>- *    link_to_fixup_dir());</div><div class='del'>- *</div><div class='del'>- * 2) For directories we log with a mode of LOG_INODE_ALL. It's possible that</div><div class='del'>- *    while logging the inode's items new items with keys BTRFS_DIR_ITEM_KEY and</div><div class='del'>- *    BTRFS_DIR_INDEX_KEY are added to fs/subvol tree and the logged inode item</div><div class='del'>- *    has a size that doesn't match the sum of the lengths of all the logged</div><div class='del'>- *    names. This does not result in a problem because if a dir_item key is</div><div class='del'>- *    logged but its matching dir_index key is not logged, at log replay time we</div><div class='del'>- *    don't use it to replay the respective name (see replay_one_name()). On the</div><div class='del'>- *    other hand if only the dir_index key ends up being logged, the respective</div><div class='del'>- *    name is added to the fs/subvol tree with both the dir_item and dir_index</div><div class='del'>- *    keys created (see replay_one_name()).</div><div class='del'>- *    The directory's inode item with a wrong i_size is not a problem as well,</div><div class='del'>- *    since we don't use it at log replay time to set the i_size in the inode</div><div class='del'>- *    item of the fs/subvol tree (see overwrite_item()).</div><div class='del'>- */</div><div class='del'>-static int log_new_dir_dentries(struct btrfs_trans_handle *trans,</div><div class='del'>-				struct btrfs_root *root,</div><div class='del'>-				struct btrfs_inode *start_inode,</div><div class='del'>-				struct btrfs_log_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='del'>-	struct btrfs_root *log = root-&gt;log_root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='del'>-	LIST_HEAD(dir_list);</div><div class='del'>-	struct btrfs_dir_list *dir_elem;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If we are logging a new name, as part of a link or rename operation,</div><div class='del'>-	 * don't bother logging new dentries, as we just want to log the names</div><div class='del'>-	 * of an inode and that any new parents exist.</div><div class='del'>-	 */</div><div class='del'>-	if (ctx-&gt;logging_new_name)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	path = btrfs_alloc_path();</div><div class='del'>-	if (!path)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	dir_elem = kmalloc(sizeof(*dir_elem), GFP_NOFS);</div><div class='del'>-	if (!dir_elem) {</div><div class='del'>-		btrfs_free_path(path);</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	}</div><div class='del'>-	dir_elem-&gt;ino = btrfs_ino(start_inode);</div><div class='del'>-	list_add_tail(&amp;dir_elem-&gt;list, &amp;dir_list);</div><div class='del'>-</div><div class='del'>-	while (!list_empty(&amp;dir_list)) {</div><div class='del'>-		struct extent_buffer *leaf;</div><div class='del'>-		struct btrfs_key min_key;</div><div class='del'>-		int nritems;</div><div class='del'>-		int i;</div><div class='del'>-</div><div class='del'>-		dir_elem = list_first_entry(&amp;dir_list, struct btrfs_dir_list,</div><div class='del'>-					    list);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto next_dir_inode;</div><div class='del'>-</div><div class='del'>-		min_key.objectid = dir_elem-&gt;ino;</div><div class='del'>-		min_key.type = BTRFS_DIR_ITEM_KEY;</div><div class='del'>-		min_key.offset = 0;</div><div class='del'>-again:</div><div class='del'>-		btrfs_release_path(path);</div><div class='del'>-		ret = btrfs_search_forward(log, &amp;min_key, path, trans-&gt;transid);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			goto next_dir_inode;</div><div class='del'>-		} else if (ret &gt; 0) {</div><div class='del'>-			ret = 0;</div><div class='del'>-			goto next_dir_inode;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-process_leaf:</div><div class='del'>-		leaf = path-&gt;nodes[0];</div><div class='del'>-		nritems = btrfs_header_nritems(leaf);</div><div class='del'>-		for (i = path-&gt;slots[0]; i &lt; nritems; i++) {</div><div class='del'>-			struct btrfs_dir_item *di;</div><div class='del'>-			struct btrfs_key di_key;</div><div class='del'>-			struct inode *di_inode;</div><div class='del'>-			struct btrfs_dir_list *new_dir_elem;</div><div class='del'>-			int log_mode = LOG_INODE_EXISTS;</div><div class='del'>-			int type;</div><div class='del'>-</div><div class='del'>-			btrfs_item_key_to_cpu(leaf, &amp;min_key, i);</div><div class='del'>-			if (min_key.objectid != dir_elem-&gt;ino ||</div><div class='del'>-			    min_key.type != BTRFS_DIR_ITEM_KEY)</div><div class='del'>-				goto next_dir_inode;</div><div class='del'>-</div><div class='del'>-			di = btrfs_item_ptr(leaf, i, struct btrfs_dir_item);</div><div class='del'>-			type = btrfs_dir_type(leaf, di);</div><div class='del'>-			if (btrfs_dir_transid(leaf, di) &lt; trans-&gt;transid &amp;&amp;</div><div class='del'>-			    type != BTRFS_FT_DIR)</div><div class='del'>-				continue;</div><div class='del'>-			btrfs_dir_item_key_to_cpu(leaf, di, &amp;di_key);</div><div class='del'>-			if (di_key.type == BTRFS_ROOT_ITEM_KEY)</div><div class='del'>-				continue;</div><div class='del'>-</div><div class='del'>-			btrfs_release_path(path);</div><div class='del'>-			di_inode = btrfs_iget(fs_info-&gt;sb, di_key.objectid, root);</div><div class='del'>-			if (IS_ERR(di_inode)) {</div><div class='del'>-				ret = PTR_ERR(di_inode);</div><div class='del'>-				goto next_dir_inode;</div><div class='del'>-			}</div><div class='add'>+	if (ret)</div><div class='add'>+		free_conflicting_inodes(ctx);</div><div class='add'>+	else</div><div class='add'>+		ret = log_conflicting_inodes(trans, inode-&gt;root, ctx);</div><div class='ctx'> </div><div class='del'>-			if (!need_log_inode(trans, BTRFS_I(di_inode))) {</div><div class='del'>-				btrfs_add_delayed_iput(di_inode);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='add'>+	if (full_dir_logging &amp;&amp; !ctx-&gt;logging_new_delayed_dentries) {</div><div class='add'>+		if (!ret)</div><div class='add'>+			ret = log_new_delayed_dentries(trans, inode,</div><div class='add'>+						       &amp;delayed_ins_list, ctx);</div><div class='ctx'> </div><div class='del'>-			ctx-&gt;log_new_dentries = false;</div><div class='del'>-			if (type == BTRFS_FT_DIR || type == BTRFS_FT_SYMLINK)</div><div class='del'>-				log_mode = LOG_INODE_ALL;</div><div class='del'>-			ret = btrfs_log_inode(trans, BTRFS_I(di_inode),</div><div class='del'>-					      log_mode, ctx);</div><div class='del'>-			btrfs_add_delayed_iput(di_inode);</div><div class='del'>-			if (ret)</div><div class='del'>-				goto next_dir_inode;</div><div class='del'>-			if (ctx-&gt;log_new_dentries) {</div><div class='del'>-				new_dir_elem = kmalloc(sizeof(*new_dir_elem),</div><div class='del'>-						       GFP_NOFS);</div><div class='del'>-				if (!new_dir_elem) {</div><div class='del'>-					ret = -ENOMEM;</div><div class='del'>-					goto next_dir_inode;</div><div class='del'>-				}</div><div class='del'>-				new_dir_elem-&gt;ino = di_key.objectid;</div><div class='del'>-				list_add_tail(&amp;new_dir_elem-&gt;list, &amp;dir_list);</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		if (i == nritems) {</div><div class='del'>-			ret = btrfs_next_leaf(log, path);</div><div class='del'>-			if (ret &lt; 0) {</div><div class='del'>-				goto next_dir_inode;</div><div class='del'>-			} else if (ret &gt; 0) {</div><div class='del'>-				ret = 0;</div><div class='del'>-				goto next_dir_inode;</div><div class='del'>-			}</div><div class='del'>-			goto process_leaf;</div><div class='del'>-		}</div><div class='del'>-		if (min_key.offset &lt; (u64)-1) {</div><div class='del'>-			min_key.offset++;</div><div class='del'>-			goto again;</div><div class='del'>-		}</div><div class='del'>-next_dir_inode:</div><div class='del'>-		list_del(&amp;dir_elem-&gt;list);</div><div class='del'>-		kfree(dir_elem);</div><div class='add'>+		btrfs_log_put_delayed_items(inode, &amp;delayed_ins_list,</div><div class='add'>+					    &amp;delayed_del_list);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -6049,9 +7158,8 @@ static int btrfs_log_all_parents(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				 struct btrfs_inode *inode,</div><div class='ctx'> 				 struct btrfs_log_ctx *ctx)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	int ret;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	const u64 ino = btrfs_ino(inode);</div><div class='hunk'>@@ -6059,15 +7167,15 @@ static int btrfs_log_all_parents(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='del'>-	path-&gt;skip_locking = 1;</div><div class='del'>-	path-&gt;search_commit_root = 1;</div><div class='add'>+	path-&gt;skip_locking = true;</div><div class='add'>+	path-&gt;search_commit_root = true;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = ino;</div><div class='ctx'> 	key.type = BTRFS_INODE_REF_KEY;</div><div class='ctx'> 	key.offset = 0;</div><div class='ctx'> 	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	while (true) {</div><div class='ctx'> 		struct extent_buffer *leaf = path-&gt;nodes[0];</div><div class='hunk'>@@ -6079,8 +7187,8 @@ static int btrfs_log_all_parents(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		if (slot &gt;= btrfs_header_nritems(leaf)) {</div><div class='ctx'> 			ret = btrfs_next_leaf(root, path);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='del'>-				goto out;</div><div class='del'>-			else if (ret &gt; 0)</div><div class='add'>+				return ret;</div><div class='add'>+			if (ret &gt; 0)</div><div class='ctx'> 				break;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -6090,32 +7198,27 @@ static int btrfs_log_all_parents(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		if (key.objectid != ino || key.type &gt; BTRFS_INODE_EXTREF_KEY)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		item_size = btrfs_item_size_nr(leaf, slot);</div><div class='add'>+		item_size = btrfs_item_size(leaf, slot);</div><div class='ctx'> 		ptr = btrfs_item_ptr_offset(leaf, slot);</div><div class='ctx'> 		while (cur_offset &lt; item_size) {</div><div class='del'>-			struct btrfs_key inode_key;</div><div class='del'>-			struct inode *dir_inode;</div><div class='del'>-</div><div class='del'>-			inode_key.type = BTRFS_INODE_ITEM_KEY;</div><div class='del'>-			inode_key.offset = 0;</div><div class='add'>+			u64 dir_id;</div><div class='add'>+			struct btrfs_inode *dir_inode;</div><div class='ctx'> </div><div class='ctx'> 			if (key.type == BTRFS_INODE_EXTREF_KEY) {</div><div class='ctx'> 				struct btrfs_inode_extref *extref;</div><div class='ctx'> </div><div class='ctx'> 				extref = (struct btrfs_inode_extref *)</div><div class='ctx'> 					(ptr + cur_offset);</div><div class='del'>-				inode_key.objectid = btrfs_inode_extref_parent(</div><div class='del'>-					leaf, extref);</div><div class='add'>+				dir_id = btrfs_inode_extref_parent(leaf, extref);</div><div class='ctx'> 				cur_offset += sizeof(*extref);</div><div class='ctx'> 				cur_offset += btrfs_inode_extref_name_len(leaf,</div><div class='ctx'> 					extref);</div><div class='ctx'> 			} else {</div><div class='del'>-				inode_key.objectid = key.offset;</div><div class='add'>+				dir_id = key.offset;</div><div class='ctx'> 				cur_offset = item_size;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			dir_inode = btrfs_iget(fs_info-&gt;sb, inode_key.objectid,</div><div class='del'>-					       root);</div><div class='add'>+			dir_inode = btrfs_iget_logging(dir_id, root);</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * If the parent inode was deleted, return an error to</div><div class='ctx'> 			 * fallback to a transaction commit. This is to prevent</div><div class='hunk'>@@ -6139,32 +7242,25 @@ static int btrfs_log_all_parents(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			 * at both parents and the old parent B would still</div><div class='ctx'> 			 * exist.</div><div class='ctx'> 			 */</div><div class='del'>-			if (IS_ERR(dir_inode)) {</div><div class='del'>-				ret = PTR_ERR(dir_inode);</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='add'>+			if (IS_ERR(dir_inode))</div><div class='add'>+				return PTR_ERR(dir_inode);</div><div class='ctx'> </div><div class='del'>-			if (!need_log_inode(trans, BTRFS_I(dir_inode))) {</div><div class='add'>+			if (!need_log_inode(trans, dir_inode)) {</div><div class='ctx'> 				btrfs_add_delayed_iput(dir_inode);</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			ctx-&gt;log_new_dentries = false;</div><div class='del'>-			ret = btrfs_log_inode(trans, BTRFS_I(dir_inode),</div><div class='del'>-					      LOG_INODE_ALL, ctx);</div><div class='add'>+			ret = btrfs_log_inode(trans, dir_inode, LOG_INODE_ALL, ctx);</div><div class='ctx'> 			if (!ret &amp;&amp; ctx-&gt;log_new_dentries)</div><div class='del'>-				ret = log_new_dir_dentries(trans, root,</div><div class='del'>-						   BTRFS_I(dir_inode), ctx);</div><div class='add'>+				ret = log_new_dir_dentries(trans, dir_inode, ctx);</div><div class='ctx'> 			btrfs_add_delayed_iput(dir_inode);</div><div class='ctx'> 			if (ret)</div><div class='del'>-				goto out;</div><div class='add'>+				return ret;</div><div class='ctx'> 		}</div><div class='ctx'> 		path-&gt;slots[0]++;</div><div class='ctx'> 	}</div><div class='del'>-	ret = 0;</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int log_new_ancestors(struct btrfs_trans_handle *trans,</div><div class='hunk'>@@ -6177,11 +7273,10 @@ static int log_new_ancestors(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;found_key, path-&gt;slots[0]);</div><div class='ctx'> </div><div class='ctx'> 	while (true) {</div><div class='del'>-		struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='del'>-		struct extent_buffer *leaf = path-&gt;nodes[0];</div><div class='del'>-		int slot = path-&gt;slots[0];</div><div class='add'>+		struct extent_buffer *leaf;</div><div class='add'>+		int slot;</div><div class='ctx'> 		struct btrfs_key search_key;</div><div class='del'>-		struct inode *inode;</div><div class='add'>+		struct btrfs_inode *inode;</div><div class='ctx'> 		u64 ino;</div><div class='ctx'> 		int ret = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -6192,14 +7287,13 @@ static int log_new_ancestors(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		search_key.objectid = found_key.offset;</div><div class='ctx'> 		search_key.type = BTRFS_INODE_ITEM_KEY;</div><div class='ctx'> 		search_key.offset = 0;</div><div class='del'>-		inode = btrfs_iget(fs_info-&gt;sb, ino, root);</div><div class='add'>+		inode = btrfs_iget_logging(ino, root);</div><div class='ctx'> 		if (IS_ERR(inode))</div><div class='ctx'> 			return PTR_ERR(inode);</div><div class='ctx'> </div><div class='del'>-		if (BTRFS_I(inode)-&gt;generation &gt;= trans-&gt;transid &amp;&amp;</div><div class='del'>-		    need_log_inode(trans, BTRFS_I(inode)))</div><div class='del'>-			ret = btrfs_log_inode(trans, BTRFS_I(inode),</div><div class='del'>-					      LOG_INODE_EXISTS, ctx);</div><div class='add'>+		if (inode-&gt;generation &gt;= trans-&gt;transid &amp;&amp;</div><div class='add'>+		    need_log_inode(trans, inode))</div><div class='add'>+			ret = btrfs_log_inode(trans, inode, LOG_INODE_EXISTS, ctx);</div><div class='ctx'> 		btrfs_add_delayed_iput(inode);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='hunk'>@@ -6277,7 +7371,7 @@ static int log_all_new_ancestors(struct btrfs_trans_handle *trans,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	const u64 ino = btrfs_ino(inode);</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key search_key;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -6298,7 +7392,7 @@ static int log_all_new_ancestors(struct btrfs_trans_handle *trans,</div><div class='ctx'> again:</div><div class='ctx'> 	ret = btrfs_search_slot(NULL, root, &amp;search_key, path, 0, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> 	if (ret == 0)</div><div class='ctx'> 		path-&gt;slots[0]++;</div><div class='ctx'> </div><div class='hunk'>@@ -6310,8 +7404,8 @@ again:</div><div class='ctx'> 		if (slot &gt;= btrfs_header_nritems(leaf)) {</div><div class='ctx'> 			ret = btrfs_next_leaf(root, path);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='del'>-				goto out;</div><div class='del'>-			else if (ret &gt; 0)</div><div class='add'>+				return ret;</div><div class='add'>+			if (ret &gt; 0)</div><div class='ctx'> 				break;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -6328,10 +7422,8 @@ again:</div><div class='ctx'> 		 * this loop, etc). So just return some error to fallback to</div><div class='ctx'> 		 * a transaction commit.</div><div class='ctx'> 		 */</div><div class='del'>-		if (found_key.type == BTRFS_INODE_EXTREF_KEY) {</div><div class='del'>-			ret = -EMLINK;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+		if (found_key.type == BTRFS_INODE_EXTREF_KEY)</div><div class='add'>+			return -EMLINK;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Logging ancestors needs to do more searches on the fs/subvol</div><div class='hunk'>@@ -6343,14 +7435,11 @@ again:</div><div class='ctx'> </div><div class='ctx'> 		ret = log_new_ancestors(trans, root, path, ctx);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> 		goto again;</div><div class='ctx'> 	}</div><div class='del'>-	ret = 0;</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -6368,33 +7457,29 @@ static int btrfs_log_inode_parent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	bool log_dentries = false;</div><div class='add'>+	bool log_dentries;</div><div class='ctx'> </div><div class='del'>-	if (btrfs_test_opt(fs_info, NOTREELOG)) {</div><div class='del'>-		ret = 1;</div><div class='del'>-		goto end_no_trans;</div><div class='del'>-	}</div><div class='add'>+	if (btrfs_test_opt(fs_info, NOTREELOG))</div><div class='add'>+		return BTRFS_LOG_FORCE_COMMIT;</div><div class='ctx'> </div><div class='del'>-	if (btrfs_root_refs(&amp;root-&gt;root_item) == 0) {</div><div class='del'>-		ret = 1;</div><div class='del'>-		goto end_no_trans;</div><div class='del'>-	}</div><div class='add'>+	if (btrfs_root_refs(&amp;root-&gt;root_item) == 0)</div><div class='add'>+		return BTRFS_LOG_FORCE_COMMIT;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Skip already logged inodes or inodes corresponding to tmpfiles</div><div class='del'>-	 * (since logging them is pointless, a link count of 0 means they</div><div class='del'>-	 * will never be accessible).</div><div class='add'>+	 * If we're logging an inode from a subvolume created in the current</div><div class='add'>+	 * transaction we must force a commit since the root is not persisted.</div><div class='ctx'> 	 */</div><div class='del'>-	if ((btrfs_inode_in_log(inode, trans-&gt;transid) &amp;&amp;</div><div class='del'>-	     list_empty(&amp;ctx-&gt;ordered_extents)) ||</div><div class='del'>-	    inode-&gt;vfs_inode.i_nlink == 0) {</div><div class='del'>-		ret = BTRFS_NO_LOG_SYNC;</div><div class='del'>-		goto end_no_trans;</div><div class='del'>-	}</div><div class='add'>+	if (btrfs_root_generation(&amp;root-&gt;root_item) == trans-&gt;transid)</div><div class='add'>+		return BTRFS_LOG_FORCE_COMMIT;</div><div class='add'>+</div><div class='add'>+	/* Skip already logged inodes and without new extents. */</div><div class='add'>+	if (btrfs_inode_in_log(inode, trans-&gt;transid) &amp;&amp;</div><div class='add'>+	    list_empty(&amp;ctx-&gt;ordered_extents))</div><div class='add'>+		return BTRFS_NO_LOG_SYNC;</div><div class='ctx'> </div><div class='ctx'> 	ret = start_log_trans(trans, root, ctx);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto end_no_trans;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_log_inode(trans, inode, inode_only, ctx);</div><div class='ctx'> 	if (ret)</div><div class='hunk'>@@ -6413,8 +7498,11 @@ static int btrfs_log_inode_parent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		goto end_trans;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (S_ISDIR(inode-&gt;vfs_inode.i_mode) &amp;&amp; ctx-&gt;log_new_dentries)</div><div class='del'>-		log_dentries = true;</div><div class='add'>+	/*</div><div class='add'>+	 * Track if we need to log dentries because ctx-&gt;log_new_dentries can</div><div class='add'>+	 * be modified in the call chains below.</div><div class='add'>+	 */</div><div class='add'>+	log_dentries = ctx-&gt;log_new_dentries;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * On unlink we must make sure all our current and old parent directory</div><div class='hunk'>@@ -6468,19 +7556,17 @@ static int btrfs_log_inode_parent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		goto end_trans;</div><div class='ctx'> </div><div class='ctx'> 	if (log_dentries)</div><div class='del'>-		ret = log_new_dir_dentries(trans, root, inode, ctx);</div><div class='del'>-	else</div><div class='del'>-		ret = 0;</div><div class='add'>+		ret = log_new_dir_dentries(trans, inode, ctx);</div><div class='ctx'> end_trans:</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='ctx'> 		btrfs_set_log_full_commit(trans);</div><div class='del'>-		ret = 1;</div><div class='add'>+		ret = BTRFS_LOG_FORCE_COMMIT;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		btrfs_remove_log_ctx(root, ctx);</div><div class='ctx'> 	btrfs_end_log_trans(root);</div><div class='del'>-end_no_trans:</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -6514,8 +7600,6 @@ int btrfs_recover_log_trees(struct btrfs_root *log_root_tree)</div><div class='ctx'> 	struct btrfs_path *path;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='del'>-	struct btrfs_key found_key;</div><div class='del'>-	struct btrfs_root *log;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = log_root_tree-&gt;fs_info;</div><div class='ctx'> 	struct walk_control wc = {</div><div class='ctx'> 		.process_func = process_one_buffer,</div><div class='hunk'>@@ -6535,23 +7619,27 @@ int btrfs_recover_log_trees(struct btrfs_root *log_root_tree)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	wc.trans = trans;</div><div class='del'>-	wc.pin = 1;</div><div class='add'>+	wc.pin = true;</div><div class='add'>+	wc.log = log_root_tree;</div><div class='ctx'> </div><div class='del'>-	ret = walk_log_tree(trans, log_root_tree, &amp;wc);</div><div class='del'>-	if (ret) {</div><div class='add'>+	ret = walk_log_tree(&amp;wc);</div><div class='add'>+	wc.log = NULL;</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> again:</div><div class='ctx'> 	key.objectid = BTRFS_TREE_LOG_OBJECTID;</div><div class='del'>-	key.offset = (u64)-1;</div><div class='ctx'> 	key.type = BTRFS_ROOT_ITEM_KEY;</div><div class='add'>+	key.offset = (u64)-1;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='add'>+		struct btrfs_key found_key;</div><div class='add'>+</div><div class='ctx'> 		ret = btrfs_search_slot(NULL, log_root_tree, &amp;key, path, 0, 0);</div><div class='ctx'> </div><div class='del'>-		if (ret &lt; 0) {</div><div class='add'>+		if (unlikely(ret &lt; 0)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto error;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -6566,17 +7654,22 @@ again:</div><div class='ctx'> 		if (found_key.objectid != BTRFS_TREE_LOG_OBJECTID)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		log = btrfs_read_tree_root(log_root_tree, &amp;found_key);</div><div class='del'>-		if (IS_ERR(log)) {</div><div class='del'>-			ret = PTR_ERR(log);</div><div class='add'>+		wc.log = btrfs_read_tree_root(log_root_tree, &amp;found_key);</div><div class='add'>+		if (IS_ERR(wc.log)) {</div><div class='add'>+			ret = PTR_ERR(wc.log);</div><div class='add'>+			wc.log = NULL;</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto error;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		wc.replay_dest = btrfs_get_fs_root(fs_info, found_key.offset,</div><div class='del'>-						   true);</div><div class='del'>-		if (IS_ERR(wc.replay_dest)) {</div><div class='del'>-			ret = PTR_ERR(wc.replay_dest);</div><div class='add'>+		wc.root = btrfs_get_fs_root(fs_info, found_key.offset, true);</div><div class='add'>+		if (IS_ERR(wc.root)) {</div><div class='add'>+			ret = PTR_ERR(wc.root);</div><div class='add'>+			wc.root = NULL;</div><div class='add'>+			if (unlikely(ret != -ENOENT)) {</div><div class='add'>+				btrfs_abort_transaction(trans, ret);</div><div class='add'>+				goto error;</div><div class='add'>+			}</div><div class='ctx'> </div><div class='ctx'> 			/*</div><div class='ctx'> 			 * We didn't find the subvol, likely because it was</div><div class='hunk'>@@ -6589,38 +7682,37 @@ again:</div><div class='ctx'> 			 * block from being modified, and we'll just bail for</div><div class='ctx'> 			 * each subsequent pass.</div><div class='ctx'> 			 */</div><div class='del'>-			if (ret == -ENOENT)</div><div class='del'>-				ret = btrfs_pin_extent_for_log_replay(trans,</div><div class='del'>-							log-&gt;node-&gt;start,</div><div class='del'>-							log-&gt;node-&gt;len);</div><div class='del'>-			btrfs_put_root(log);</div><div class='add'>+			ret = btrfs_pin_extent_for_log_replay(trans, wc.log-&gt;node);</div><div class='add'>+			if (unlikely(ret)) {</div><div class='add'>+				btrfs_abort_transaction(trans, ret);</div><div class='add'>+				goto error;</div><div class='add'>+			}</div><div class='add'>+			goto next;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-			if (!ret)</div><div class='del'>-				goto next;</div><div class='add'>+		wc.root-&gt;log_root = wc.log;</div><div class='add'>+		ret = btrfs_record_root_in_trans(trans, wc.root);</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='del'>-			goto error;</div><div class='add'>+			goto next;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		wc.replay_dest-&gt;log_root = log;</div><div class='del'>-		ret = btrfs_record_root_in_trans(trans, wc.replay_dest);</div><div class='del'>-		if (ret)</div><div class='del'>-			/* The loop needs to continue due to the root refs */</div><div class='add'>+		ret = walk_log_tree(&amp;wc);</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='del'>-		else</div><div class='del'>-			ret = walk_log_tree(trans, log, &amp;wc);</div><div class='del'>-</div><div class='del'>-		if (!ret &amp;&amp; wc.stage == LOG_WALK_REPLAY_ALL) {</div><div class='del'>-			ret = fixup_inode_link_counts(trans, wc.replay_dest,</div><div class='del'>-						      path);</div><div class='del'>-			if (ret)</div><div class='del'>-				btrfs_abort_transaction(trans, ret);</div><div class='add'>+			goto next;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (!ret &amp;&amp; wc.stage == LOG_WALK_REPLAY_ALL) {</div><div class='del'>-			struct btrfs_root *root = wc.replay_dest;</div><div class='del'>-</div><div class='del'>-			btrfs_release_path(path);</div><div class='add'>+		if (wc.stage == LOG_WALK_REPLAY_ALL) {</div><div class='add'>+			struct btrfs_root *root = wc.root;</div><div class='ctx'> </div><div class='add'>+			wc.subvol_path = path;</div><div class='add'>+			ret = fixup_inode_link_counts(&amp;wc);</div><div class='add'>+			wc.subvol_path = NULL;</div><div class='add'>+			if (unlikely(ret)) {</div><div class='add'>+				btrfs_abort_transaction(trans, ret);</div><div class='add'>+				goto next;</div><div class='add'>+			}</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * We have just replayed everything, and the highest</div><div class='ctx'> 			 * objectid of fs roots probably has changed in case</div><div class='hunk'>@@ -6630,17 +7722,21 @@ again:</div><div class='ctx'> 			 * could only happen during mount.</div><div class='ctx'> 			 */</div><div class='ctx'> 			ret = btrfs_init_root_free_objectid(root);</div><div class='del'>-			if (ret)</div><div class='add'>+			if (unlikely(ret)) {</div><div class='ctx'> 				btrfs_abort_transaction(trans, ret);</div><div class='add'>+				goto next;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='del'>-</div><div class='del'>-		wc.replay_dest-&gt;log_root = NULL;</div><div class='del'>-		btrfs_put_root(wc.replay_dest);</div><div class='del'>-		btrfs_put_root(log);</div><div class='add'>+next:</div><div class='add'>+		if (wc.root) {</div><div class='add'>+			wc.root-&gt;log_root = NULL;</div><div class='add'>+			btrfs_put_root(wc.root);</div><div class='add'>+		}</div><div class='add'>+		btrfs_put_root(wc.log);</div><div class='add'>+		wc.log = NULL;</div><div class='ctx'> </div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto error;</div><div class='del'>-next:</div><div class='ctx'> 		if (found_key.offset == 0)</div><div class='ctx'> 			break;</div><div class='ctx'> 		key.offset = found_key.offset - 1;</div><div class='hunk'>@@ -6649,7 +7745,7 @@ next:</div><div class='ctx'> </div><div class='ctx'> 	/* step one is to pin it all, step two is to replay just inodes */</div><div class='ctx'> 	if (wc.pin) {</div><div class='del'>-		wc.pin = 0;</div><div class='add'>+		wc.pin = false;</div><div class='ctx'> 		wc.process_func = replay_one_buffer;</div><div class='ctx'> 		wc.stage = LOG_WALK_REPLAY_INODES;</div><div class='ctx'> 		goto again;</div><div class='hunk'>@@ -6667,14 +7763,13 @@ next:</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	log_root_tree-&gt;log_root = NULL;</div><div class='ctx'> 	clear_bit(BTRFS_FS_LOG_RECOVERING, &amp;fs_info-&gt;flags);</div><div class='del'>-	btrfs_put_root(log_root_tree);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> error:</div><div class='ctx'> 	if (wc.trans)</div><div class='ctx'> 		btrfs_end_transaction(wc.trans);</div><div class='add'>+	btrfs_put_root(wc.log);</div><div class='ctx'> 	clear_bit(BTRFS_FS_LOG_RECOVERING, &amp;fs_info-&gt;flags);</div><div class='ctx'> 	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -6693,7 +7788,7 @@ error:</div><div class='ctx'>  */</div><div class='ctx'> void btrfs_record_unlink_dir(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			     struct btrfs_inode *dir, struct btrfs_inode *inode,</div><div class='del'>-			     int for_rename)</div><div class='add'>+			     bool for_rename)</div><div class='ctx'> {</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * when we're logging a file, if it hasn't been renamed</div><div class='hunk'>@@ -6709,18 +7804,25 @@ void btrfs_record_unlink_dir(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	inode-&gt;last_unlink_trans = trans-&gt;transid;</div><div class='ctx'> 	mutex_unlock(&amp;inode-&gt;log_mutex);</div><div class='ctx'> </div><div class='add'>+	if (!for_rename)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='del'>-	 * if this directory was already logged any new</div><div class='del'>-	 * names for this file/dir will get recorded</div><div class='add'>+	 * If this directory was already logged, any new names will be logged</div><div class='add'>+	 * with btrfs_log_new_name() and old names will be deleted from the log</div><div class='add'>+	 * tree with btrfs_del_dir_entries_in_log() or with</div><div class='add'>+	 * btrfs_del_inode_ref_in_log().</div><div class='ctx'> 	 */</div><div class='del'>-	if (dir-&gt;logged_trans == trans-&gt;transid)</div><div class='add'>+	if (inode_logged(trans, dir, NULL) == 1)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * if the inode we're about to unlink was logged,</div><div class='del'>-	 * the log will be properly updated for any new names</div><div class='add'>+	 * If the inode we're about to unlink was logged before, the log will be</div><div class='add'>+	 * properly updated with the new name with btrfs_log_new_name() and the</div><div class='add'>+	 * old name removed with btrfs_del_dir_entries_in_log() or with</div><div class='add'>+	 * btrfs_del_inode_ref_in_log().</div><div class='ctx'> 	 */</div><div class='del'>-	if (inode-&gt;logged_trans == trans-&gt;transid)</div><div class='add'>+	if (inode_logged(trans, inode, NULL) == 1)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -6730,13 +7832,6 @@ void btrfs_record_unlink_dir(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * properly.  So, we have to be conservative and force commits</div><div class='ctx'> 	 * so the new name gets discovered.</div><div class='ctx'> 	 */</div><div class='del'>-	if (for_rename)</div><div class='del'>-		goto record;</div><div class='del'>-</div><div class='del'>-	/* we can safely do the unlink without any special recording */</div><div class='del'>-	return;</div><div class='del'>-</div><div class='del'>-record:</div><div class='ctx'> 	mutex_lock(&amp;dir-&gt;log_mutex);</div><div class='ctx'> 	dir-&gt;last_unlink_trans = trans-&gt;transid;</div><div class='ctx'> 	mutex_unlock(&amp;dir-&gt;log_mutex);</div><div class='hunk'>@@ -6763,14 +7858,57 @@ void btrfs_record_snapshot_destroy(struct btrfs_trans_handle *trans,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Call this after adding a new name for a file and it will properly</div><div class='del'>- * update the log to reflect the new name.</div><div class='add'>+ * Call this when creating a subvolume in a directory.</div><div class='add'>+ * Because we don't commit a transaction when creating a subvolume, we can't</div><div class='add'>+ * allow the directory pointing to the subvolume to be logged with an entry that</div><div class='add'>+ * points to an unpersisted root if we are still in the transaction used to</div><div class='add'>+ * create the subvolume, so make any attempt to log the directory to result in a</div><div class='add'>+ * full log sync.</div><div class='add'>+ * Also we don't need to worry with renames, since btrfs_rename() marks the log</div><div class='add'>+ * for full commit when renaming a subvolume.</div><div class='add'>+ *</div><div class='add'>+ * Must be called before creating the subvolume entry in its parent directory.</div><div class='add'>+ */</div><div class='add'>+void btrfs_record_new_subvolume(const struct btrfs_trans_handle *trans,</div><div class='add'>+				struct btrfs_inode *dir)</div><div class='add'>+{</div><div class='add'>+	mutex_lock(&amp;dir-&gt;log_mutex);</div><div class='add'>+	dir-&gt;last_unlink_trans = trans-&gt;transid;</div><div class='add'>+	mutex_unlock(&amp;dir-&gt;log_mutex);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Update the log after adding a new name for an inode.</div><div class='add'>+ *</div><div class='add'>+ * @trans:              Transaction handle.</div><div class='add'>+ * @old_dentry:         The dentry associated with the old name and the old</div><div class='add'>+ *                      parent directory.</div><div class='add'>+ * @old_dir:            The inode of the previous parent directory for the case</div><div class='add'>+ *                      of a rename. For a link operation, it must be NULL.</div><div class='add'>+ * @old_dir_index:      The index number associated with the old name, meaningful</div><div class='add'>+ *                      only for rename operations (when @old_dir is not NULL).</div><div class='add'>+ *                      Ignored for link operations.</div><div class='add'>+ * @parent:             The dentry associated with the directory under which the</div><div class='add'>+ *                      new name is located.</div><div class='add'>+ *</div><div class='add'>+ * Call this after adding a new name for an inode, as a result of a link or</div><div class='add'>+ * rename operation, and it will properly update the log to reflect the new name.</div><div class='ctx'>  */</div><div class='ctx'> void btrfs_log_new_name(struct btrfs_trans_handle *trans,</div><div class='del'>-			struct btrfs_inode *inode, struct btrfs_inode *old_dir,</div><div class='del'>-			struct dentry *parent)</div><div class='add'>+			struct dentry *old_dentry, struct btrfs_inode *old_dir,</div><div class='add'>+			u64 old_dir_index, struct dentry *parent)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_inode *inode = BTRFS_I(d_inode(old_dentry));</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	struct btrfs_log_ctx ctx;</div><div class='add'>+	bool log_pinned = false;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	/* The inode has a new name (ref/extref), so make sure we log it. */</div><div class='add'>+	set_bit(BTRFS_INODE_COPY_EVERYTHING, &amp;inode-&gt;runtime_flags);</div><div class='add'>+</div><div class='add'>+	btrfs_init_log_ctx(&amp;ctx, inode);</div><div class='add'>+	ctx.logging_new_name = true;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * this will force the logging code to walk the dentry chain</div><div class='hunk'>@@ -6783,30 +7921,110 @@ void btrfs_log_new_name(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * if this inode hasn't been logged and directory we're renaming it</div><div class='ctx'> 	 * from hasn't been logged, we don't need to log it</div><div class='ctx'> 	 */</div><div class='del'>-	if (!inode_logged(trans, inode) &amp;&amp;</div><div class='del'>-	    (!old_dir || !inode_logged(trans, old_dir)))</div><div class='del'>-		return;</div><div class='add'>+	ret = inode_logged(trans, inode, NULL);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		goto out;</div><div class='add'>+	} else if (ret == 0) {</div><div class='add'>+		if (!old_dir)</div><div class='add'>+			return;</div><div class='add'>+		/*</div><div class='add'>+		 * If the inode was not logged and we are doing a rename (old_dir is not</div><div class='add'>+		 * NULL), check if old_dir was logged - if it was not we can return and</div><div class='add'>+		 * do nothing.</div><div class='add'>+		 */</div><div class='add'>+		ret = inode_logged(trans, old_dir, NULL);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out;</div><div class='add'>+		else if (ret == 0)</div><div class='add'>+			return;</div><div class='add'>+	}</div><div class='add'>+	ret = 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Now that we know we need to update the log, allocate the scratch eb</div><div class='add'>+	 * for the context before joining a log transaction below, as this can</div><div class='add'>+	 * take time and therefore we could delay log commits from other tasks.</div><div class='add'>+	 */</div><div class='add'>+	btrfs_init_log_ctx_scratch_eb(&amp;ctx);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If we are doing a rename (old_dir is not NULL) from a directory that</div><div class='del'>-	 * was previously logged, make sure the next log attempt on the directory</div><div class='del'>-	 * is not skipped and logs the inode again. This is because the log may</div><div class='del'>-	 * not currently be authoritative for a range including the old</div><div class='del'>-	 * BTRFS_DIR_ITEM_KEY and BTRFS_DIR_INDEX_KEY keys, so we want to make</div><div class='del'>-	 * sure after a log replay we do not end up with both the new and old</div><div class='del'>-	 * dentries around (in case the inode is a directory we would have a</div><div class='del'>-	 * directory with two hard links and 2 inode references for different</div><div class='del'>-	 * parents). The next log attempt of old_dir will happen at</div><div class='del'>-	 * btrfs_log_all_parents(), called through btrfs_log_inode_parent()</div><div class='del'>-	 * below, because we have previously set inode-&gt;last_unlink_trans to the</div><div class='del'>-	 * current transaction ID, either here or at btrfs_record_unlink_dir() in</div><div class='del'>-	 * case inode is a directory.</div><div class='add'>+	 * was previously logged, make sure that on log replay we get the old</div><div class='add'>+	 * dir entry deleted. This is needed because we will also log the new</div><div class='add'>+	 * name of the renamed inode, so we need to make sure that after log</div><div class='add'>+	 * replay we don't end up with both the new and old dir entries existing.</div><div class='ctx'> 	 */</div><div class='del'>-	if (old_dir)</div><div class='del'>-		old_dir-&gt;logged_trans = 0;</div><div class='add'>+	if (old_dir &amp;&amp; old_dir-&gt;logged_trans == trans-&gt;transid) {</div><div class='add'>+		struct btrfs_root *log = old_dir-&gt;root-&gt;log_root;</div><div class='add'>+		struct btrfs_path *path;</div><div class='add'>+		struct fscrypt_name fname;</div><div class='add'>+</div><div class='add'>+		ASSERT(old_dir_index &gt;= BTRFS_DIR_START_INDEX,</div><div class='add'>+		       "old_dir_index=%llu", old_dir_index);</div><div class='add'>+</div><div class='add'>+		ret = fscrypt_setup_filename(&amp;old_dir-&gt;vfs_inode,</div><div class='add'>+					     &amp;old_dentry-&gt;d_name, 0, &amp;fname);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out;</div><div class='add'>+</div><div class='add'>+		path = btrfs_alloc_path();</div><div class='add'>+		if (!path) {</div><div class='add'>+			ret = -ENOMEM;</div><div class='add'>+			fscrypt_free_filename(&amp;fname);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * We have two inodes to update in the log, the old directory and</div><div class='add'>+		 * the inode that got renamed, so we must pin the log to prevent</div><div class='add'>+		 * anyone from syncing the log until we have updated both inodes</div><div class='add'>+		 * in the log.</div><div class='add'>+		 */</div><div class='add'>+		ret = join_running_log_trans(root);</div><div class='add'>+		/*</div><div class='add'>+		 * At least one of the inodes was logged before, so this should</div><div class='add'>+		 * not fail, but if it does, it's not serious, just bail out and</div><div class='add'>+		 * mark the log for a full commit.</div><div class='add'>+		 */</div><div class='add'>+		if (WARN_ON_ONCE(ret &lt; 0)) {</div><div class='add'>+			btrfs_free_path(path);</div><div class='add'>+			fscrypt_free_filename(&amp;fname);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		log_pinned = true;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Other concurrent task might be logging the old directory,</div><div class='add'>+		 * as it can be triggered when logging other inode that had or</div><div class='add'>+		 * still has a dentry in the old directory. We lock the old</div><div class='add'>+		 * directory's log_mutex to ensure the deletion of the old</div><div class='add'>+		 * name is persisted, because during directory logging we</div><div class='add'>+		 * delete all BTRFS_DIR_LOG_INDEX_KEY keys and the deletion of</div><div class='add'>+		 * the old name's dir index item is in the delayed items, so</div><div class='add'>+		 * it could be missed by an in progress directory logging.</div><div class='add'>+		 */</div><div class='add'>+		mutex_lock(&amp;old_dir-&gt;log_mutex);</div><div class='add'>+		ret = del_logged_dentry(trans, log, path, btrfs_ino(old_dir),</div><div class='add'>+					&amp;fname.disk_name, old_dir_index);</div><div class='add'>+		if (ret &gt; 0) {</div><div class='add'>+			/*</div><div class='add'>+			 * The dentry does not exist in the log, so record its</div><div class='add'>+			 * deletion.</div><div class='add'>+			 */</div><div class='add'>+			btrfs_release_path(path);</div><div class='add'>+			ret = insert_dir_log_key(trans, log, path,</div><div class='add'>+						 btrfs_ino(old_dir),</div><div class='add'>+						 old_dir_index, old_dir_index);</div><div class='add'>+		}</div><div class='add'>+		mutex_unlock(&amp;old_dir-&gt;log_mutex);</div><div class='add'>+</div><div class='add'>+		btrfs_free_path(path);</div><div class='add'>+		fscrypt_free_filename(&amp;fname);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	btrfs_init_log_ctx(&amp;ctx, &amp;inode-&gt;vfs_inode);</div><div class='del'>-	ctx.logging_new_name = true;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We don't care about the return value. If we fail to log the new name</div><div class='ctx'> 	 * then we know the next attempt to sync the log will fallback to a full</div><div class='hunk'>@@ -6815,5 +8033,18 @@ void btrfs_log_new_name(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 * inconsistent state after a rename operation.</div><div class='ctx'> 	 */</div><div class='ctx'> 	btrfs_log_inode_parent(trans, inode, parent, LOG_INODE_EXISTS, &amp;ctx);</div><div class='add'>+	ASSERT(list_empty(&amp;ctx.conflict_inodes));</div><div class='add'>+out:</div><div class='add'>+	/*</div><div class='add'>+	 * If an error happened mark the log for a full commit because it's not</div><div class='add'>+	 * consistent and up to date or we couldn't find out if one of the</div><div class='add'>+	 * inodes was logged before in this transaction. Do it before unpinning</div><div class='add'>+	 * the log, to avoid any races with someone else trying to commit it.</div><div class='add'>+	 */</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		btrfs_set_log_full_commit(trans);</div><div class='add'>+	if (log_pinned)</div><div class='add'>+		btrfs_end_log_trans(root);</div><div class='add'>+	free_extent_buffer(ctx.scratch_eb);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/btrfs/tree-log.h b/fs/btrfs/tree-log.h<br/>index f6811c3df38a..41e47fda036d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tree-log.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tree-log.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tree-log.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/tree-log.h</a></div><div class='hunk'>@@ -6,49 +6,57 @@</div><div class='ctx'> #ifndef BTRFS_TREE_LOG_H</div><div class='ctx'> #define BTRFS_TREE_LOG_H</div><div class='ctx'> </div><div class='del'>-#include "ctree.h"</div><div class='add'>+#include &lt;linux/list.h&gt;</div><div class='add'>+#include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/fscrypt.h&gt;</div><div class='ctx'> #include "transaction.h"</div><div class='ctx'> </div><div class='add'>+struct inode;</div><div class='add'>+struct dentry;</div><div class='add'>+struct btrfs_ordered_extent;</div><div class='add'>+struct btrfs_root;</div><div class='add'>+struct btrfs_trans_handle;</div><div class='add'>+</div><div class='ctx'> /* return value for btrfs_log_dentry_safe that means we don't need to log it at all */</div><div class='ctx'> #define BTRFS_NO_LOG_SYNC 256</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * We can't use the tree log for whatever reason, force a transaction commit.</div><div class='add'>+ * We use a negative value because there are functions through the logging code</div><div class='add'>+ * that need to return an error (&lt; 0 value), false (0) or true (1). Any negative</div><div class='add'>+ * value will do, as it will cause the log to be marked for a full sync.</div><div class='add'>+ */</div><div class='add'>+#define BTRFS_LOG_FORCE_COMMIT				(-(MAX_ERRNO + 1))</div><div class='add'>+</div><div class='ctx'> struct btrfs_log_ctx {</div><div class='ctx'> 	int log_ret;</div><div class='ctx'> 	int log_transid;</div><div class='ctx'> 	bool log_new_dentries;</div><div class='ctx'> 	bool logging_new_name;</div><div class='del'>-	/* Tracks the last logged dir item/index key offset. */</div><div class='del'>-	u64 last_dir_item_offset;</div><div class='del'>-	struct inode *inode;</div><div class='add'>+	bool logging_new_delayed_dentries;</div><div class='add'>+	/* Indicate if the inode being logged was logged before. */</div><div class='add'>+	bool logged_before;</div><div class='add'>+	struct btrfs_inode *inode;</div><div class='ctx'> 	struct list_head list;</div><div class='ctx'> 	/* Only used for fast fsyncs. */</div><div class='ctx'> 	struct list_head ordered_extents;</div><div class='add'>+	struct list_head conflict_inodes;</div><div class='add'>+	int num_conflict_inodes;</div><div class='add'>+	bool logging_conflict_inodes;</div><div class='add'>+	/*</div><div class='add'>+	 * Used for fsyncs that need to copy items from the subvolume tree to</div><div class='add'>+	 * the log tree (full sync flag set or copy everything flag set) to</div><div class='add'>+	 * avoid allocating a temporary extent buffer while holding a lock on</div><div class='add'>+	 * an extent buffer of the subvolume tree and under the log transaction.</div><div class='add'>+	 * Also helps to avoid allocating and freeing a temporary extent buffer</div><div class='add'>+	 * in case we need to process multiple leaves from the subvolume tree.</div><div class='add'>+	 */</div><div class='add'>+	struct extent_buffer *scratch_eb;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static inline void btrfs_init_log_ctx(struct btrfs_log_ctx *ctx,</div><div class='del'>-				      struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	ctx-&gt;log_ret = 0;</div><div class='del'>-	ctx-&gt;log_transid = 0;</div><div class='del'>-	ctx-&gt;log_new_dentries = false;</div><div class='del'>-	ctx-&gt;logging_new_name = false;</div><div class='del'>-	ctx-&gt;inode = inode;</div><div class='del'>-	INIT_LIST_HEAD(&amp;ctx-&gt;list);</div><div class='del'>-	INIT_LIST_HEAD(&amp;ctx-&gt;ordered_extents);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_release_log_ctx_extents(struct btrfs_log_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_ordered_extent *ordered;</div><div class='del'>-	struct btrfs_ordered_extent *tmp;</div><div class='del'>-</div><div class='del'>-	ASSERT(inode_is_locked(ctx-&gt;inode));</div><div class='del'>-</div><div class='del'>-	list_for_each_entry_safe(ordered, tmp, &amp;ctx-&gt;ordered_extents, log_list) {</div><div class='del'>-		list_del_init(&amp;ordered-&gt;log_list);</div><div class='del'>-		btrfs_put_ordered_extent(ordered);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='add'>+void btrfs_init_log_ctx(struct btrfs_log_ctx *ctx, struct btrfs_inode *inode);</div><div class='add'>+void btrfs_init_log_ctx_scratch_eb(struct btrfs_log_ctx *ctx);</div><div class='add'>+void btrfs_release_log_ctx_extents(struct btrfs_log_ctx *ctx);</div><div class='ctx'> </div><div class='ctx'> static inline void btrfs_set_log_full_commit(struct btrfs_trans_handle *trans)</div><div class='ctx'> {</div><div class='hunk'>@@ -71,22 +79,23 @@ int btrfs_log_dentry_safe(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			  struct dentry *dentry,</div><div class='ctx'> 			  struct btrfs_log_ctx *ctx);</div><div class='ctx'> void btrfs_del_dir_entries_in_log(struct btrfs_trans_handle *trans,</div><div class='del'>-				  struct btrfs_root *root,</div><div class='del'>-				  const char *name, int name_len,</div><div class='add'>+				  const struct fscrypt_str *name,</div><div class='ctx'> 				  struct btrfs_inode *dir, u64 index);</div><div class='ctx'> void btrfs_del_inode_ref_in_log(struct btrfs_trans_handle *trans,</div><div class='del'>-				struct btrfs_root *root,</div><div class='del'>-				const char *name, int name_len,</div><div class='del'>-				struct btrfs_inode *inode, u64 dirid);</div><div class='add'>+				const struct fscrypt_str *name,</div><div class='add'>+				struct btrfs_inode *inode,</div><div class='add'>+				struct btrfs_inode *dir);</div><div class='ctx'> void btrfs_end_log_trans(struct btrfs_root *root);</div><div class='ctx'> void btrfs_pin_log_trans(struct btrfs_root *root);</div><div class='ctx'> void btrfs_record_unlink_dir(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			     struct btrfs_inode *dir, struct btrfs_inode *inode,</div><div class='del'>-			     int for_rename);</div><div class='add'>+			     bool for_rename);</div><div class='ctx'> void btrfs_record_snapshot_destroy(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				   struct btrfs_inode *dir);</div><div class='add'>+void btrfs_record_new_subvolume(const struct btrfs_trans_handle *trans,</div><div class='add'>+				struct btrfs_inode *dir);</div><div class='ctx'> void btrfs_log_new_name(struct btrfs_trans_handle *trans,</div><div class='del'>-			struct btrfs_inode *inode, struct btrfs_inode *old_dir,</div><div class='del'>-			struct dentry *parent);</div><div class='add'>+			struct dentry *old_dentry, struct btrfs_inode *old_dir,</div><div class='add'>+			u64 old_dir_index, struct dentry *parent);</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/btrfs/tree-mod-log.c b/fs/btrfs/tree-mod-log.c<br/>index 8a3a14686d3e..9e8cb3b7c064 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tree-mod-log.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tree-mod-log.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tree-mod-log.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/tree-mod-log.c</a></div><div class='hunk'>@@ -1,7 +1,11 @@</div><div class='ctx'> // SPDX-License-Identifier: GPL-2.0</div><div class='ctx'> </div><div class='add'>+#include "messages.h"</div><div class='ctx'> #include "tree-mod-log.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "tree-checker.h"</div><div class='ctx'> </div><div class='ctx'> struct tree_mod_root {</div><div class='ctx'> 	u64 logical;</div><div class='hunk'>@@ -23,24 +27,35 @@ struct tree_mod_elem {</div><div class='ctx'> 	/* This is used for BTRFS_MOD_LOG_KEY* and BTRFS_MOD_LOG_ROOT_REPLACE. */</div><div class='ctx'> 	u64 generation;</div><div class='ctx'> </div><div class='del'>-	/* Those are used for op == BTRFS_MOD_LOG_KEY_{REPLACE,REMOVE}. */</div><div class='del'>-	struct btrfs_disk_key key;</div><div class='del'>-	u64 blockptr;</div><div class='del'>-</div><div class='del'>-	/* This is used for op == BTRFS_MOD_LOG_MOVE_KEYS. */</div><div class='del'>-	struct {</div><div class='del'>-		int dst_slot;</div><div class='del'>-		int nr_items;</div><div class='del'>-	} move;</div><div class='del'>-</div><div class='del'>-	/* This is used for op == BTRFS_MOD_LOG_ROOT_REPLACE. */</div><div class='del'>-	struct tree_mod_root old_root;</div><div class='add'>+	union {</div><div class='add'>+		/*</div><div class='add'>+		 * This is used for the following op types:</div><div class='add'>+		 *</div><div class='add'>+		 *    BTRFS_MOD_LOG_KEY_REMOVE_WHILE_FREEING</div><div class='add'>+		 *    BTRFS_MOD_LOG_KEY_REMOVE_WHILE_MOVING</div><div class='add'>+		 *    BTRFS_MOD_LOG_KEY_REMOVE</div><div class='add'>+		 *    BTRFS_MOD_LOG_KEY_REPLACE</div><div class='add'>+		 */</div><div class='add'>+		struct {</div><div class='add'>+			struct btrfs_disk_key key;</div><div class='add'>+			u64 blockptr;</div><div class='add'>+		} slot_change;</div><div class='add'>+</div><div class='add'>+		/* This is used for op == BTRFS_MOD_LOG_MOVE_KEYS. */</div><div class='add'>+		struct {</div><div class='add'>+			int dst_slot;</div><div class='add'>+			int nr_items;</div><div class='add'>+		} move;</div><div class='add'>+</div><div class='add'>+		/* This is used for op == BTRFS_MOD_LOG_ROOT_REPLACE. */</div><div class='add'>+		struct tree_mod_root old_root;</div><div class='add'>+	};</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Pull a new tree mod seq number for our operation.</div><div class='ctx'>  */</div><div class='del'>-static inline u64 btrfs_inc_tree_mod_seq(struct btrfs_fs_info *fs_info)</div><div class='add'>+static u64 btrfs_inc_tree_mod_seq(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	return atomic64_inc_return(&amp;fs_info-&gt;tree_mod_seq);</div><div class='ctx'> }</div><div class='hunk'>@@ -160,18 +175,41 @@ static noinline int tree_mod_log_insert(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline bool skip_eb_logging(const struct extent_buffer *eb)</div><div class='add'>+{</div><div class='add'>+	const u64 owner = btrfs_header_owner(eb);</div><div class='add'>+</div><div class='add'>+	if (btrfs_header_level(eb) == 0)</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Tree mod logging exists so that there's a consistent view of the</div><div class='add'>+	 * extents and backrefs of inodes even if while a task is iterating over</div><div class='add'>+	 * them other tasks are modifying subvolume trees and the extent tree</div><div class='add'>+	 * (including running delayed refs). So we only need to log extent</div><div class='add'>+	 * buffers from the extent tree and subvolume trees.</div><div class='add'>+	 */</div><div class='add'>+</div><div class='add'>+	if (owner == BTRFS_EXTENT_TREE_OBJECTID)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	if (btrfs_is_fstree(owner))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Determines if logging can be omitted. Returns true if it can. Otherwise, it</div><div class='ctx'>  * returns false with the tree_mod_log_lock acquired. The caller must hold</div><div class='ctx'>  * this until all tree mod log insertions are recorded in the rb tree and then</div><div class='ctx'>  * write unlock fs_info::tree_mod_log_lock.</div><div class='ctx'>  */</div><div class='del'>-static inline bool tree_mod_dont_log(struct btrfs_fs_info *fs_info,</div><div class='del'>-				    struct extent_buffer *eb)</div><div class='add'>+static bool tree_mod_dont_log(struct btrfs_fs_info *fs_info, const struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='ctx'> 	if (!test_bit(BTRFS_FS_TREE_MOD_LOG_USERS, &amp;fs_info-&gt;flags))</div><div class='ctx'> 		return true;</div><div class='del'>-	if (eb &amp;&amp; btrfs_header_level(eb) == 0)</div><div class='add'>+	if (eb &amp;&amp; skip_eb_logging(eb))</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='ctx'> 	write_lock(&amp;fs_info-&gt;tree_mod_log_lock);</div><div class='hunk'>@@ -184,33 +222,34 @@ static inline bool tree_mod_dont_log(struct btrfs_fs_info *fs_info,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Similar to tree_mod_dont_log, but doesn't acquire any locks. */</div><div class='del'>-static inline bool tree_mod_need_log(const struct btrfs_fs_info *fs_info,</div><div class='del'>-				    struct extent_buffer *eb)</div><div class='add'>+static bool tree_mod_need_log(const struct btrfs_fs_info *fs_info,</div><div class='add'>+			      const struct extent_buffer *eb)</div><div class='ctx'> {</div><div class='ctx'> 	if (!test_bit(BTRFS_FS_TREE_MOD_LOG_USERS, &amp;fs_info-&gt;flags))</div><div class='ctx'> 		return false;</div><div class='del'>-	if (eb &amp;&amp; btrfs_header_level(eb) == 0)</div><div class='add'>+	if (eb &amp;&amp; skip_eb_logging(eb))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct tree_mod_elem *alloc_tree_mod_elem(struct extent_buffer *eb,</div><div class='add'>+static struct tree_mod_elem *alloc_tree_mod_elem(const struct extent_buffer *eb,</div><div class='ctx'> 						 int slot,</div><div class='del'>-						 enum btrfs_mod_log_op op,</div><div class='del'>-						 gfp_t flags)</div><div class='add'>+						 enum btrfs_mod_log_op op)</div><div class='ctx'> {</div><div class='ctx'> 	struct tree_mod_elem *tm;</div><div class='ctx'> </div><div class='del'>-	tm = kzalloc(sizeof(*tm), flags);</div><div class='add'>+	/* Can't be one of these types, due to union in struct tree_mod_elem. */</div><div class='add'>+	ASSERT(op != BTRFS_MOD_LOG_MOVE_KEYS);</div><div class='add'>+	ASSERT(op != BTRFS_MOD_LOG_ROOT_REPLACE);</div><div class='add'>+</div><div class='add'>+	tm = kzalloc(sizeof(*tm), GFP_NOFS);</div><div class='ctx'> 	if (!tm)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='ctx'> 	tm-&gt;logical = eb-&gt;start;</div><div class='del'>-	if (op != BTRFS_MOD_LOG_KEY_ADD) {</div><div class='del'>-		btrfs_node_key(eb, &amp;tm-&gt;key, slot);</div><div class='del'>-		tm-&gt;blockptr = btrfs_node_blockptr(eb, slot);</div><div class='del'>-	}</div><div class='add'>+	btrfs_node_key(eb, &amp;tm-&gt;slot_change.key, slot);</div><div class='add'>+	tm-&gt;slot_change.blockptr = btrfs_node_blockptr(eb, slot);</div><div class='ctx'> 	tm-&gt;op = op;</div><div class='ctx'> 	tm-&gt;slot = slot;</div><div class='ctx'> 	tm-&gt;generation = btrfs_node_ptr_generation(eb, slot);</div><div class='hunk'>@@ -219,25 +258,36 @@ static struct tree_mod_elem *alloc_tree_mod_elem(struct extent_buffer *eb,</div><div class='ctx'> 	return tm;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_tree_mod_log_insert_key(struct extent_buffer *eb, int slot,</div><div class='del'>-				  enum btrfs_mod_log_op op, gfp_t flags)</div><div class='add'>+int btrfs_tree_mod_log_insert_key(const struct extent_buffer *eb, int slot,</div><div class='add'>+				  enum btrfs_mod_log_op op)</div><div class='ctx'> {</div><div class='ctx'> 	struct tree_mod_elem *tm;</div><div class='del'>-	int ret;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (!tree_mod_need_log(eb-&gt;fs_info, eb))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	tm = alloc_tree_mod_elem(eb, slot, op, flags);</div><div class='add'>+	tm = alloc_tree_mod_elem(eb, slot, op);</div><div class='ctx'> 	if (!tm)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+		ret = -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	if (tree_mod_dont_log(eb-&gt;fs_info, eb)) {</div><div class='ctx'> 		kfree(tm);</div><div class='add'>+		/*</div><div class='add'>+		 * Don't error if we failed to allocate memory because we don't</div><div class='add'>+		 * need to log.</div><div class='add'>+		 */</div><div class='ctx'> 		return 0;</div><div class='add'>+	} else if (ret != 0) {</div><div class='add'>+		/*</div><div class='add'>+		 * We previously failed to allocate memory and we need to log,</div><div class='add'>+		 * so we have to fail.</div><div class='add'>+		 */</div><div class='add'>+		goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = tree_mod_log_insert(eb-&gt;fs_info, tm);</div><div class='add'>+out_unlock:</div><div class='ctx'> 	write_unlock(&amp;eb-&gt;fs_info-&gt;tree_mod_log_lock);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		kfree(tm);</div><div class='hunk'>@@ -245,7 +295,27 @@ int btrfs_tree_mod_log_insert_key(struct extent_buffer *eb, int slot,</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_tree_mod_log_insert_move(struct extent_buffer *eb,</div><div class='add'>+static struct tree_mod_elem *tree_mod_log_alloc_move(const struct extent_buffer *eb,</div><div class='add'>+						     int dst_slot, int src_slot,</div><div class='add'>+						     int nr_items)</div><div class='add'>+{</div><div class='add'>+	struct tree_mod_elem *tm;</div><div class='add'>+</div><div class='add'>+	tm = kzalloc(sizeof(*tm), GFP_NOFS);</div><div class='add'>+	if (!tm)</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+</div><div class='add'>+	tm-&gt;logical = eb-&gt;start;</div><div class='add'>+	tm-&gt;slot = src_slot;</div><div class='add'>+	tm-&gt;move.dst_slot = dst_slot;</div><div class='add'>+	tm-&gt;move.nr_items = nr_items;</div><div class='add'>+	tm-&gt;op = BTRFS_MOD_LOG_MOVE_KEYS;</div><div class='add'>+	RB_CLEAR_NODE(&amp;tm-&gt;node);</div><div class='add'>+</div><div class='add'>+	return tm;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_tree_mod_log_insert_move(const struct extent_buffer *eb,</div><div class='ctx'> 				   int dst_slot, int src_slot,</div><div class='ctx'> 				   int nr_items)</div><div class='ctx'> {</div><div class='hunk'>@@ -259,35 +329,46 @@ int btrfs_tree_mod_log_insert_move(struct extent_buffer *eb,</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	tm_list = kcalloc(nr_items, sizeof(struct tree_mod_elem *), GFP_NOFS);</div><div class='del'>-	if (!tm_list)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	tm = kzalloc(sizeof(*tm), GFP_NOFS);</div><div class='del'>-	if (!tm) {</div><div class='add'>+	if (!tm_list) {</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='del'>-		goto free_tms;</div><div class='add'>+		goto lock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	tm-&gt;logical = eb-&gt;start;</div><div class='del'>-	tm-&gt;slot = src_slot;</div><div class='del'>-	tm-&gt;move.dst_slot = dst_slot;</div><div class='del'>-	tm-&gt;move.nr_items = nr_items;</div><div class='del'>-	tm-&gt;op = BTRFS_MOD_LOG_MOVE_KEYS;</div><div class='add'>+	tm = tree_mod_log_alloc_move(eb, dst_slot, src_slot, nr_items);</div><div class='add'>+	if (IS_ERR(tm)) {</div><div class='add'>+		ret = PTR_ERR(tm);</div><div class='add'>+		tm = NULL;</div><div class='add'>+		goto lock;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i + dst_slot &lt; src_slot &amp;&amp; i &lt; nr_items; i++) {</div><div class='ctx'> 		tm_list[i] = alloc_tree_mod_elem(eb, i + dst_slot,</div><div class='del'>-				BTRFS_MOD_LOG_KEY_REMOVE_WHILE_MOVING, GFP_NOFS);</div><div class='add'>+				BTRFS_MOD_LOG_KEY_REMOVE_WHILE_MOVING);</div><div class='ctx'> 		if (!tm_list[i]) {</div><div class='ctx'> 			ret = -ENOMEM;</div><div class='del'>-			goto free_tms;</div><div class='add'>+			goto lock;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (tree_mod_dont_log(eb-&gt;fs_info, eb))</div><div class='add'>+lock:</div><div class='add'>+	if (tree_mod_dont_log(eb-&gt;fs_info, eb)) {</div><div class='add'>+		/*</div><div class='add'>+		 * Don't error if we failed to allocate memory because we don't</div><div class='add'>+		 * need to log.</div><div class='add'>+		 */</div><div class='add'>+		ret = 0;</div><div class='ctx'> 		goto free_tms;</div><div class='add'>+	}</div><div class='ctx'> 	locked = true;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='add'>+	 * We previously failed to allocate memory and we need to log, so we</div><div class='add'>+	 * have to fail.</div><div class='add'>+	 */</div><div class='add'>+	if (ret != 0)</div><div class='add'>+		goto free_tms;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='ctx'> 	 * When we override something during the move, we log these removals.</div><div class='ctx'> 	 * This can only happen when we move towards the beginning of the</div><div class='ctx'> 	 * buffer, i.e. dst_slot &lt; src_slot.</div><div class='hunk'>@@ -307,10 +388,12 @@ int btrfs_tree_mod_log_insert_move(struct extent_buffer *eb,</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> free_tms:</div><div class='del'>-	for (i = 0; i &lt; nr_items; i++) {</div><div class='del'>-		if (tm_list[i] &amp;&amp; !RB_EMPTY_NODE(&amp;tm_list[i]-&gt;node))</div><div class='del'>-			rb_erase(&amp;tm_list[i]-&gt;node, &amp;eb-&gt;fs_info-&gt;tree_mod_log);</div><div class='del'>-		kfree(tm_list[i]);</div><div class='add'>+	if (tm_list) {</div><div class='add'>+		for (i = 0; i &lt; nr_items; i++) {</div><div class='add'>+			if (tm_list[i] &amp;&amp; !RB_EMPTY_NODE(&amp;tm_list[i]-&gt;node))</div><div class='add'>+				rb_erase(&amp;tm_list[i]-&gt;node, &amp;eb-&gt;fs_info-&gt;tree_mod_log);</div><div class='add'>+			kfree(tm_list[i]);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> 	if (locked)</div><div class='ctx'> 		write_unlock(&amp;eb-&gt;fs_info-&gt;tree_mod_log_lock);</div><div class='hunk'>@@ -320,9 +403,9 @@ free_tms:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int tree_mod_log_free_eb(struct btrfs_fs_info *fs_info,</div><div class='del'>-				       struct tree_mod_elem **tm_list,</div><div class='del'>-				       int nritems)</div><div class='add'>+static int tree_mod_log_free_eb(struct btrfs_fs_info *fs_info,</div><div class='add'>+				struct tree_mod_elem **tm_list,</div><div class='add'>+				int nritems)</div><div class='ctx'> {</div><div class='ctx'> 	int i, j;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -360,14 +443,14 @@ int btrfs_tree_mod_log_insert_root(struct extent_buffer *old_root,</div><div class='ctx'> 				  GFP_NOFS);</div><div class='ctx'> 		if (!tm_list) {</div><div class='ctx'> 			ret = -ENOMEM;</div><div class='del'>-			goto free_tms;</div><div class='add'>+			goto lock;</div><div class='ctx'> 		}</div><div class='ctx'> 		for (i = 0; i &lt; nritems; i++) {</div><div class='ctx'> 			tm_list[i] = alloc_tree_mod_elem(old_root, i,</div><div class='del'>-			    BTRFS_MOD_LOG_KEY_REMOVE_WHILE_FREEING, GFP_NOFS);</div><div class='add'>+			    BTRFS_MOD_LOG_KEY_REMOVE_WHILE_FREEING);</div><div class='ctx'> 			if (!tm_list[i]) {</div><div class='ctx'> 				ret = -ENOMEM;</div><div class='del'>-				goto free_tms;</div><div class='add'>+				goto lock;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -375,7 +458,7 @@ int btrfs_tree_mod_log_insert_root(struct extent_buffer *old_root,</div><div class='ctx'> 	tm = kzalloc(sizeof(*tm), GFP_NOFS);</div><div class='ctx'> 	if (!tm) {</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='del'>-		goto free_tms;</div><div class='add'>+		goto lock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	tm-&gt;logical = new_root-&gt;start;</div><div class='hunk'>@@ -384,14 +467,28 @@ int btrfs_tree_mod_log_insert_root(struct extent_buffer *old_root,</div><div class='ctx'> 	tm-&gt;generation = btrfs_header_generation(old_root);</div><div class='ctx'> 	tm-&gt;op = BTRFS_MOD_LOG_ROOT_REPLACE;</div><div class='ctx'> </div><div class='del'>-	if (tree_mod_dont_log(fs_info, NULL))</div><div class='add'>+lock:</div><div class='add'>+	if (tree_mod_dont_log(fs_info, NULL)) {</div><div class='add'>+		/*</div><div class='add'>+		 * Don't error if we failed to allocate memory because we don't</div><div class='add'>+		 * need to log.</div><div class='add'>+		 */</div><div class='add'>+		ret = 0;</div><div class='ctx'> 		goto free_tms;</div><div class='add'>+	} else if (ret != 0) {</div><div class='add'>+		/*</div><div class='add'>+		 * We previously failed to allocate memory and we need to log,</div><div class='add'>+		 * so we have to fail.</div><div class='add'>+		 */</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (tm_list)</div><div class='ctx'> 		ret = tree_mod_log_free_eb(fs_info, tm_list, nritems);</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		ret = tree_mod_log_insert(fs_info, tm);</div><div class='ctx'> </div><div class='add'>+out_unlock:</div><div class='ctx'> 	write_unlock(&amp;fs_info-&gt;tree_mod_log_lock);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto free_tms;</div><div class='hunk'>@@ -475,7 +572,7 @@ static struct tree_mod_elem *tree_mod_log_search(struct btrfs_fs_info *fs_info,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_tree_mod_log_eb_copy(struct extent_buffer *dst,</div><div class='del'>-			       struct extent_buffer *src,</div><div class='add'>+			       const struct extent_buffer *src,</div><div class='ctx'> 			       unsigned long dst_offset,</div><div class='ctx'> 			       unsigned long src_offset,</div><div class='ctx'> 			       int nr_items)</div><div class='hunk'>@@ -483,9 +580,14 @@ int btrfs_tree_mod_log_eb_copy(struct extent_buffer *dst,</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = dst-&gt;fs_info;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	struct tree_mod_elem **tm_list = NULL;</div><div class='del'>-	struct tree_mod_elem **tm_list_add, **tm_list_rem;</div><div class='add'>+	struct tree_mod_elem **tm_list_add = NULL;</div><div class='add'>+	struct tree_mod_elem **tm_list_rem = NULL;</div><div class='ctx'> 	int i;</div><div class='ctx'> 	bool locked = false;</div><div class='add'>+	struct tree_mod_elem *dst_move_tm = NULL;</div><div class='add'>+	struct tree_mod_elem *src_move_tm = NULL;</div><div class='add'>+	u32 dst_move_nr_items = btrfs_header_nritems(dst) - dst_offset;</div><div class='add'>+	u32 src_move_nr_items = btrfs_header_nritems(src) - (src_offset + nr_items);</div><div class='ctx'> </div><div class='ctx'> 	if (!tree_mod_need_log(fs_info, NULL))</div><div class='ctx'> 		return 0;</div><div class='hunk'>@@ -495,31 +597,72 @@ int btrfs_tree_mod_log_eb_copy(struct extent_buffer *dst,</div><div class='ctx'> </div><div class='ctx'> 	tm_list = kcalloc(nr_items * 2, sizeof(struct tree_mod_elem *),</div><div class='ctx'> 			  GFP_NOFS);</div><div class='del'>-	if (!tm_list)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	if (!tm_list) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto lock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (dst_move_nr_items) {</div><div class='add'>+		dst_move_tm = tree_mod_log_alloc_move(dst, dst_offset + nr_items,</div><div class='add'>+						      dst_offset, dst_move_nr_items);</div><div class='add'>+		if (IS_ERR(dst_move_tm)) {</div><div class='add'>+			ret = PTR_ERR(dst_move_tm);</div><div class='add'>+			dst_move_tm = NULL;</div><div class='add'>+			goto lock;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	if (src_move_nr_items) {</div><div class='add'>+		src_move_tm = tree_mod_log_alloc_move(src, src_offset,</div><div class='add'>+						      src_offset + nr_items,</div><div class='add'>+						      src_move_nr_items);</div><div class='add'>+		if (IS_ERR(src_move_tm)) {</div><div class='add'>+			ret = PTR_ERR(src_move_tm);</div><div class='add'>+			src_move_tm = NULL;</div><div class='add'>+			goto lock;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	tm_list_add = tm_list;</div><div class='ctx'> 	tm_list_rem = tm_list + nr_items;</div><div class='ctx'> 	for (i = 0; i &lt; nr_items; i++) {</div><div class='ctx'> 		tm_list_rem[i] = alloc_tree_mod_elem(src, i + src_offset,</div><div class='del'>-		    BTRFS_MOD_LOG_KEY_REMOVE, GFP_NOFS);</div><div class='add'>+						     BTRFS_MOD_LOG_KEY_REMOVE);</div><div class='ctx'> 		if (!tm_list_rem[i]) {</div><div class='ctx'> 			ret = -ENOMEM;</div><div class='del'>-			goto free_tms;</div><div class='add'>+			goto lock;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		tm_list_add[i] = alloc_tree_mod_elem(dst, i + dst_offset,</div><div class='del'>-						BTRFS_MOD_LOG_KEY_ADD, GFP_NOFS);</div><div class='add'>+						     BTRFS_MOD_LOG_KEY_ADD);</div><div class='ctx'> 		if (!tm_list_add[i]) {</div><div class='ctx'> 			ret = -ENOMEM;</div><div class='del'>-			goto free_tms;</div><div class='add'>+			goto lock;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (tree_mod_dont_log(fs_info, NULL))</div><div class='add'>+lock:</div><div class='add'>+	if (tree_mod_dont_log(fs_info, NULL)) {</div><div class='add'>+		/*</div><div class='add'>+		 * Don't error if we failed to allocate memory because we don't</div><div class='add'>+		 * need to log.</div><div class='add'>+		 */</div><div class='add'>+		ret = 0;</div><div class='ctx'> 		goto free_tms;</div><div class='add'>+	}</div><div class='ctx'> 	locked = true;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * We previously failed to allocate memory and we need to log, so we</div><div class='add'>+	 * have to fail.</div><div class='add'>+	 */</div><div class='add'>+	if (ret != 0)</div><div class='add'>+		goto free_tms;</div><div class='add'>+</div><div class='add'>+	if (dst_move_tm) {</div><div class='add'>+		ret = tree_mod_log_insert(fs_info, dst_move_tm);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto free_tms;</div><div class='add'>+	}</div><div class='ctx'> 	for (i = 0; i &lt; nr_items; i++) {</div><div class='ctx'> 		ret = tree_mod_log_insert(fs_info, tm_list_rem[i]);</div><div class='ctx'> 		if (ret)</div><div class='hunk'>@@ -528,6 +671,11 @@ int btrfs_tree_mod_log_eb_copy(struct extent_buffer *dst,</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto free_tms;</div><div class='ctx'> 	}</div><div class='add'>+	if (src_move_tm) {</div><div class='add'>+		ret = tree_mod_log_insert(fs_info, src_move_tm);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto free_tms;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	write_unlock(&amp;fs_info-&gt;tree_mod_log_lock);</div><div class='ctx'> 	kfree(tm_list);</div><div class='hunk'>@@ -535,10 +683,18 @@ int btrfs_tree_mod_log_eb_copy(struct extent_buffer *dst,</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> free_tms:</div><div class='del'>-	for (i = 0; i &lt; nr_items * 2; i++) {</div><div class='del'>-		if (tm_list[i] &amp;&amp; !RB_EMPTY_NODE(&amp;tm_list[i]-&gt;node))</div><div class='del'>-			rb_erase(&amp;tm_list[i]-&gt;node, &amp;fs_info-&gt;tree_mod_log);</div><div class='del'>-		kfree(tm_list[i]);</div><div class='add'>+	if (dst_move_tm &amp;&amp; !RB_EMPTY_NODE(&amp;dst_move_tm-&gt;node))</div><div class='add'>+		rb_erase(&amp;dst_move_tm-&gt;node, &amp;fs_info-&gt;tree_mod_log);</div><div class='add'>+	kfree(dst_move_tm);</div><div class='add'>+	if (src_move_tm &amp;&amp; !RB_EMPTY_NODE(&amp;src_move_tm-&gt;node))</div><div class='add'>+		rb_erase(&amp;src_move_tm-&gt;node, &amp;fs_info-&gt;tree_mod_log);</div><div class='add'>+	kfree(src_move_tm);</div><div class='add'>+	if (tm_list) {</div><div class='add'>+		for (i = 0; i &lt; nr_items * 2; i++) {</div><div class='add'>+			if (tm_list[i] &amp;&amp; !RB_EMPTY_NODE(&amp;tm_list[i]-&gt;node))</div><div class='add'>+				rb_erase(&amp;tm_list[i]-&gt;node, &amp;fs_info-&gt;tree_mod_log);</div><div class='add'>+			kfree(tm_list[i]);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> 	if (locked)</div><div class='ctx'> 		write_unlock(&amp;fs_info-&gt;tree_mod_log_lock);</div><div class='hunk'>@@ -559,22 +715,38 @@ int btrfs_tree_mod_log_free_eb(struct extent_buffer *eb)</div><div class='ctx'> </div><div class='ctx'> 	nritems = btrfs_header_nritems(eb);</div><div class='ctx'> 	tm_list = kcalloc(nritems, sizeof(struct tree_mod_elem *), GFP_NOFS);</div><div class='del'>-	if (!tm_list)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	if (!tm_list) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto lock;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; nritems; i++) {</div><div class='ctx'> 		tm_list[i] = alloc_tree_mod_elem(eb, i,</div><div class='del'>-		    BTRFS_MOD_LOG_KEY_REMOVE_WHILE_FREEING, GFP_NOFS);</div><div class='add'>+				    BTRFS_MOD_LOG_KEY_REMOVE_WHILE_FREEING);</div><div class='ctx'> 		if (!tm_list[i]) {</div><div class='ctx'> 			ret = -ENOMEM;</div><div class='del'>-			goto free_tms;</div><div class='add'>+			goto lock;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (tree_mod_dont_log(eb-&gt;fs_info, eb))</div><div class='add'>+lock:</div><div class='add'>+	if (tree_mod_dont_log(eb-&gt;fs_info, eb)) {</div><div class='add'>+		/*</div><div class='add'>+		 * Don't error if we failed to allocate memory because we don't</div><div class='add'>+		 * need to log.</div><div class='add'>+		 */</div><div class='add'>+		ret = 0;</div><div class='ctx'> 		goto free_tms;</div><div class='add'>+	} else if (ret != 0) {</div><div class='add'>+		/*</div><div class='add'>+		 * We previously failed to allocate memory and we need to log,</div><div class='add'>+		 * so we have to fail.</div><div class='add'>+		 */</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	ret = tree_mod_log_free_eb(eb-&gt;fs_info, tm_list, nritems);</div><div class='add'>+out_unlock:</div><div class='ctx'> 	write_unlock(&amp;eb-&gt;fs_info-&gt;tree_mod_log_lock);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto free_tms;</div><div class='hunk'>@@ -583,9 +755,11 @@ int btrfs_tree_mod_log_free_eb(struct extent_buffer *eb)</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> free_tms:</div><div class='del'>-	for (i = 0; i &lt; nritems; i++)</div><div class='del'>-		kfree(tm_list[i]);</div><div class='del'>-	kfree(tm_list);</div><div class='add'>+	if (tm_list) {</div><div class='add'>+		for (i = 0; i &lt; nritems; i++)</div><div class='add'>+			kfree(tm_list[i]);</div><div class='add'>+		kfree(tm_list);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -661,10 +835,27 @@ static void tree_mod_log_rewind(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	unsigned long o_dst;</div><div class='ctx'> 	unsigned long o_src;</div><div class='ctx'> 	unsigned long p_size = sizeof(struct btrfs_key_ptr);</div><div class='add'>+	/*</div><div class='add'>+	 * max_slot tracks the maximum valid slot of the rewind eb at every</div><div class='add'>+	 * step of the rewind. This is in contrast with 'n' which eventually</div><div class='add'>+	 * matches the number of items, but can be wrong during moves or if</div><div class='add'>+	 * removes overlap on already valid slots (which is probably separately</div><div class='add'>+	 * a bug). We do this to validate the offsets of memmoves for rewinding</div><div class='add'>+	 * moves and detect invalid memmoves.</div><div class='add'>+	 *</div><div class='add'>+	 * Since a rewind eb can start empty, max_slot is a signed integer with</div><div class='add'>+	 * a special meaning for -1, which is that no slot is valid to move out</div><div class='add'>+	 * of. Any other negative value is invalid.</div><div class='add'>+	 */</div><div class='add'>+	int max_slot;</div><div class='add'>+	int move_src_end_slot;</div><div class='add'>+	int move_dst_end_slot;</div><div class='ctx'> </div><div class='ctx'> 	n = btrfs_header_nritems(eb);</div><div class='add'>+	max_slot = n - 1;</div><div class='ctx'> 	read_lock(&amp;fs_info-&gt;tree_mod_log_lock);</div><div class='ctx'> 	while (tm &amp;&amp; tm-&gt;seq &gt;= time_seq) {</div><div class='add'>+		ASSERT(max_slot &gt;= -1);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * All the operations are recorded with the operator used for</div><div class='ctx'> 		 * the modification. As we're going backwards, we do the</div><div class='hunk'>@@ -676,28 +867,53 @@ static void tree_mod_log_rewind(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			fallthrough;</div><div class='ctx'> 		case BTRFS_MOD_LOG_KEY_REMOVE_WHILE_MOVING:</div><div class='ctx'> 		case BTRFS_MOD_LOG_KEY_REMOVE:</div><div class='del'>-			btrfs_set_node_key(eb, &amp;tm-&gt;key, tm-&gt;slot);</div><div class='del'>-			btrfs_set_node_blockptr(eb, tm-&gt;slot, tm-&gt;blockptr);</div><div class='add'>+			btrfs_set_node_key(eb, &amp;tm-&gt;slot_change.key, tm-&gt;slot);</div><div class='add'>+			btrfs_set_node_blockptr(eb, tm-&gt;slot, tm-&gt;slot_change.blockptr);</div><div class='ctx'> 			btrfs_set_node_ptr_generation(eb, tm-&gt;slot,</div><div class='ctx'> 						      tm-&gt;generation);</div><div class='ctx'> 			n++;</div><div class='add'>+			if (tm-&gt;slot &gt; max_slot)</div><div class='add'>+				max_slot = tm-&gt;slot;</div><div class='ctx'> 			break;</div><div class='ctx'> 		case BTRFS_MOD_LOG_KEY_REPLACE:</div><div class='ctx'> 			BUG_ON(tm-&gt;slot &gt;= n);</div><div class='del'>-			btrfs_set_node_key(eb, &amp;tm-&gt;key, tm-&gt;slot);</div><div class='del'>-			btrfs_set_node_blockptr(eb, tm-&gt;slot, tm-&gt;blockptr);</div><div class='add'>+			btrfs_set_node_key(eb, &amp;tm-&gt;slot_change.key, tm-&gt;slot);</div><div class='add'>+			btrfs_set_node_blockptr(eb, tm-&gt;slot, tm-&gt;slot_change.blockptr);</div><div class='ctx'> 			btrfs_set_node_ptr_generation(eb, tm-&gt;slot,</div><div class='ctx'> 						      tm-&gt;generation);</div><div class='ctx'> 			break;</div><div class='ctx'> 		case BTRFS_MOD_LOG_KEY_ADD:</div><div class='add'>+			/*</div><div class='add'>+			 * It is possible we could have already removed keys</div><div class='add'>+			 * behind the known max slot, so this will be an</div><div class='add'>+			 * overestimate. In practice, the copy operation</div><div class='add'>+			 * inserts them in increasing order, and overestimating</div><div class='add'>+			 * just means we miss some warnings, so it's OK. It</div><div class='add'>+			 * isn't worth carefully tracking the full array of</div><div class='add'>+			 * valid slots to check against when moving.</div><div class='add'>+			 */</div><div class='add'>+			if (tm-&gt;slot == max_slot)</div><div class='add'>+				max_slot--;</div><div class='ctx'> 			/* if a move operation is needed it's in the log */</div><div class='ctx'> 			n--;</div><div class='ctx'> 			break;</div><div class='ctx'> 		case BTRFS_MOD_LOG_MOVE_KEYS:</div><div class='del'>-			o_dst = btrfs_node_key_ptr_offset(tm-&gt;slot);</div><div class='del'>-			o_src = btrfs_node_key_ptr_offset(tm-&gt;move.dst_slot);</div><div class='add'>+			ASSERT(tm-&gt;move.nr_items &gt; 0);</div><div class='add'>+			move_src_end_slot = tm-&gt;move.dst_slot + tm-&gt;move.nr_items - 1;</div><div class='add'>+			move_dst_end_slot = tm-&gt;slot + tm-&gt;move.nr_items - 1;</div><div class='add'>+			o_dst = btrfs_node_key_ptr_offset(eb, tm-&gt;slot);</div><div class='add'>+			o_src = btrfs_node_key_ptr_offset(eb, tm-&gt;move.dst_slot);</div><div class='add'>+			if (WARN_ON(move_src_end_slot &gt; max_slot ||</div><div class='add'>+				    tm-&gt;move.nr_items &lt;= 0)) {</div><div class='add'>+				btrfs_warn(fs_info,</div><div class='add'>+"move from invalid tree mod log slot eb %llu slot %d dst_slot %d nr_items %d seq %llu n %u max_slot %d",</div><div class='add'>+					   eb-&gt;start, tm-&gt;slot,</div><div class='add'>+					   tm-&gt;move.dst_slot, tm-&gt;move.nr_items,</div><div class='add'>+					   tm-&gt;seq, n, max_slot);</div><div class='add'>+			}</div><div class='ctx'> 			memmove_extent_buffer(eb, o_dst, o_src,</div><div class='ctx'> 					      tm-&gt;move.nr_items * p_size);</div><div class='add'>+			max_slot = move_dst_end_slot;</div><div class='ctx'> 			break;</div><div class='ctx'> 		case BTRFS_MOD_LOG_ROOT_REPLACE:</div><div class='ctx'> 			/*</div><div class='hunk'>@@ -730,7 +946,6 @@ static void tree_mod_log_rewind(struct btrfs_fs_info *fs_info,</div><div class='ctx'>  * is freed (its refcount is decremented).</div><div class='ctx'>  */</div><div class='ctx'> struct extent_buffer *btrfs_tree_mod_log_rewind(struct btrfs_fs_info *fs_info,</div><div class='del'>-						struct btrfs_path *path,</div><div class='ctx'> 						struct extent_buffer *eb,</div><div class='ctx'> 						u64 time_seq)</div><div class='ctx'> {</div><div class='hunk'>@@ -819,10 +1034,15 @@ struct extent_buffer *btrfs_get_old_root(struct btrfs_root *root, u64 time_seq)</div><div class='ctx'> </div><div class='ctx'> 	tm = tree_mod_log_search(fs_info, logical, time_seq);</div><div class='ctx'> 	if (old_root &amp;&amp; tm &amp;&amp; tm-&gt;op != BTRFS_MOD_LOG_KEY_REMOVE_WHILE_FREEING) {</div><div class='add'>+		struct btrfs_tree_parent_check check = { 0 };</div><div class='add'>+</div><div class='ctx'> 		btrfs_tree_read_unlock(eb_root);</div><div class='ctx'> 		free_extent_buffer(eb_root);</div><div class='del'>-		old = read_tree_block(fs_info, logical, root-&gt;root_key.objectid,</div><div class='del'>-				      0, level, NULL);</div><div class='add'>+</div><div class='add'>+		check.level = level;</div><div class='add'>+		check.owner_root = btrfs_root_id(root);</div><div class='add'>+</div><div class='add'>+		old = read_tree_block(fs_info, logical, &amp;check);</div><div class='ctx'> 		if (WARN_ON(IS_ERR(old) || !extent_buffer_uptodate(old))) {</div><div class='ctx'> 			if (!IS_ERR(old))</div><div class='ctx'> 				free_extent_buffer(old);</div><div class='head'>diff --git a/fs/btrfs/tree-mod-log.h b/fs/btrfs/tree-mod-log.h<br/>index 12605d19621b..1c12566040db 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tree-mod-log.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/tree-mod-log.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/tree-mod-log.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/tree-mod-log.h</a></div><div class='hunk'>@@ -1,9 +1,15 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='ctx'> </div><div class='ctx'> #ifndef BTRFS_TREE_MOD_LOG_H</div><div class='ctx'> #define BTRFS_TREE_MOD_LOG_H</div><div class='ctx'> </div><div class='del'>-#include "ctree.h"</div><div class='add'>+#include &lt;linux/list.h&gt;</div><div class='add'>+</div><div class='add'>+struct extent_buffer;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+struct btrfs_path;</div><div class='add'>+struct btrfs_root;</div><div class='add'>+struct btrfs_seq_list;</div><div class='ctx'> </div><div class='ctx'> /* Represents a tree mod log user. */</div><div class='ctx'> struct btrfs_seq_list {</div><div class='hunk'>@@ -31,21 +37,20 @@ void btrfs_put_tree_mod_seq(struct btrfs_fs_info *fs_info,</div><div class='ctx'> int btrfs_tree_mod_log_insert_root(struct extent_buffer *old_root,</div><div class='ctx'> 				   struct extent_buffer *new_root,</div><div class='ctx'> 				   bool log_removal);</div><div class='del'>-int btrfs_tree_mod_log_insert_key(struct extent_buffer *eb, int slot,</div><div class='del'>-				  enum btrfs_mod_log_op op, gfp_t flags);</div><div class='add'>+int btrfs_tree_mod_log_insert_key(const struct extent_buffer *eb, int slot,</div><div class='add'>+				  enum btrfs_mod_log_op op);</div><div class='ctx'> int btrfs_tree_mod_log_free_eb(struct extent_buffer *eb);</div><div class='ctx'> struct extent_buffer *btrfs_tree_mod_log_rewind(struct btrfs_fs_info *fs_info,</div><div class='del'>-						struct btrfs_path *path,</div><div class='ctx'> 						struct extent_buffer *eb,</div><div class='ctx'> 						u64 time_seq);</div><div class='ctx'> struct extent_buffer *btrfs_get_old_root(struct btrfs_root *root, u64 time_seq);</div><div class='ctx'> int btrfs_old_root_level(struct btrfs_root *root, u64 time_seq);</div><div class='ctx'> int btrfs_tree_mod_log_eb_copy(struct extent_buffer *dst,</div><div class='del'>-			       struct extent_buffer *src,</div><div class='add'>+			       const struct extent_buffer *src,</div><div class='ctx'> 			       unsigned long dst_offset,</div><div class='ctx'> 			       unsigned long src_offset,</div><div class='ctx'> 			       int nr_items);</div><div class='del'>-int btrfs_tree_mod_log_insert_move(struct extent_buffer *eb,</div><div class='add'>+int btrfs_tree_mod_log_insert_move(const struct extent_buffer *eb,</div><div class='ctx'> 				   int dst_slot, int src_slot,</div><div class='ctx'> 				   int nr_items);</div><div class='ctx'> u64 btrfs_tree_mod_log_lowest_seq(struct btrfs_fs_info *fs_info);</div><div class='head'>diff --git a/fs/btrfs/ulist.c b/fs/btrfs/ulist.c<br/>index 3374c9e9be67..7e16a253fb35 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/ulist.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/ulist.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/ulist.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/ulist.c</a></div><div class='hunk'>@@ -5,8 +5,8 @@</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='add'>+#include "messages.h"</div><div class='ctx'> #include "ulist.h"</div><div class='del'>-#include "ctree.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * ulist is a generic data structure to hold a collection of unique u64</div><div class='hunk'>@@ -37,8 +37,9 @@</div><div class='ctx'>  * loop would be similar to the above.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * ulist_init - freshly initialize a ulist</div><div class='add'>+/*</div><div class='add'>+ * Freshly initialize a ulist.</div><div class='add'>+ *</div><div class='ctx'>  * @ulist:	the ulist to initialize</div><div class='ctx'>  *</div><div class='ctx'>  * Note: don't use this function to init an already used ulist, use</div><div class='hunk'>@@ -49,10 +50,12 @@ void ulist_init(struct ulist *ulist)</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;ulist-&gt;nodes);</div><div class='ctx'> 	ulist-&gt;root = RB_ROOT;</div><div class='ctx'> 	ulist-&gt;nnodes = 0;</div><div class='add'>+	ulist-&gt;prealloc = NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * ulist_release - free up additionally allocated memory for the ulist</div><div class='add'>+/*</div><div class='add'>+ * Free up additionally allocated memory for the ulist.</div><div class='add'>+ *</div><div class='ctx'>  * @ulist:	the ulist from which to free the additional memory</div><div class='ctx'>  *</div><div class='ctx'>  * This is useful in cases where the base 'struct ulist' has been statically</div><div class='hunk'>@@ -66,12 +69,15 @@ void ulist_release(struct ulist *ulist)</div><div class='ctx'> 	list_for_each_entry_safe(node, next, &amp;ulist-&gt;nodes, list) {</div><div class='ctx'> 		kfree(node);</div><div class='ctx'> 	}</div><div class='add'>+	kfree(ulist-&gt;prealloc);</div><div class='add'>+	ulist-&gt;prealloc = NULL;</div><div class='ctx'> 	ulist-&gt;root = RB_ROOT;</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;ulist-&gt;nodes);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * ulist_reinit - prepare a ulist for reuse</div><div class='add'>+/*</div><div class='add'>+ * Prepare a ulist for reuse.</div><div class='add'>+ *</div><div class='ctx'>  * @ulist:	ulist to be reused</div><div class='ctx'>  *</div><div class='ctx'>  * Free up all additional memory allocated for the list elements and reinit</div><div class='hunk'>@@ -83,8 +89,9 @@ void ulist_reinit(struct ulist *ulist)</div><div class='ctx'> 	ulist_init(ulist);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * ulist_alloc - dynamically allocate a ulist</div><div class='add'>+/*</div><div class='add'>+ * Dynamically allocate a ulist.</div><div class='add'>+ *</div><div class='ctx'>  * @gfp_mask:	allocation flags to for base allocation</div><div class='ctx'>  *</div><div class='ctx'>  * The allocated ulist will be returned in an initialized state.</div><div class='hunk'>@@ -101,8 +108,15 @@ struct ulist *ulist_alloc(gfp_t gfp_mask)</div><div class='ctx'> 	return ulist;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * ulist_free - free dynamically allocated ulist</div><div class='add'>+void ulist_prealloc(struct ulist *ulist, gfp_t gfp_mask)</div><div class='add'>+{</div><div class='add'>+	if (!ulist-&gt;prealloc)</div><div class='add'>+		ulist-&gt;prealloc = kzalloc(sizeof(*ulist-&gt;prealloc), gfp_mask);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Free dynamically allocated ulist.</div><div class='add'>+ *</div><div class='ctx'>  * @ulist:	ulist to free</div><div class='ctx'>  *</div><div class='ctx'>  * It is not necessary to call ulist_release before.</div><div class='hunk'>@@ -115,21 +129,25 @@ void ulist_free(struct ulist *ulist)</div><div class='ctx'> 	kfree(ulist);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int ulist_node_val_key_cmp(const void *key, const struct rb_node *node)</div><div class='add'>+{</div><div class='add'>+	const u64 *val = key;</div><div class='add'>+	const struct ulist_node *unode = rb_entry(node, struct ulist_node, rb_node);</div><div class='add'>+</div><div class='add'>+	if (unode-&gt;val &lt; *val)</div><div class='add'>+		return 1;</div><div class='add'>+	else if (unode-&gt;val &gt; *val)</div><div class='add'>+		return -1;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static struct ulist_node *ulist_rbtree_search(struct ulist *ulist, u64 val)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node *n = ulist-&gt;root.rb_node;</div><div class='del'>-	struct ulist_node *u = NULL;</div><div class='del'>-</div><div class='del'>-	while (n) {</div><div class='del'>-		u = rb_entry(n, struct ulist_node, rb_node);</div><div class='del'>-		if (u-&gt;val &lt; val)</div><div class='del'>-			n = n-&gt;rb_right;</div><div class='del'>-		else if (u-&gt;val &gt; val)</div><div class='del'>-			n = n-&gt;rb_left;</div><div class='del'>-		else</div><div class='del'>-			return u;</div><div class='del'>-	}</div><div class='del'>-	return NULL;</div><div class='add'>+	struct rb_node *node;</div><div class='add'>+</div><div class='add'>+	node = rb_find(&amp;val, &amp;ulist-&gt;root, ulist_node_val_key_cmp);</div><div class='add'>+	return rb_entry_safe(node, struct ulist_node, rb_node);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void ulist_rbtree_erase(struct ulist *ulist, struct ulist_node *node)</div><div class='hunk'>@@ -141,30 +159,26 @@ static void ulist_rbtree_erase(struct ulist *ulist, struct ulist_node *node)</div><div class='ctx'> 	ulist-&gt;nnodes--;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int ulist_node_val_cmp(struct rb_node *new, const struct rb_node *existing)</div><div class='add'>+{</div><div class='add'>+	const struct ulist_node *unode = rb_entry(new, struct ulist_node, rb_node);</div><div class='add'>+</div><div class='add'>+	return ulist_node_val_key_cmp(&amp;unode-&gt;val, existing);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int ulist_rbtree_insert(struct ulist *ulist, struct ulist_node *ins)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node **p = &amp;ulist-&gt;root.rb_node;</div><div class='del'>-	struct rb_node *parent = NULL;</div><div class='del'>-	struct ulist_node *cur = NULL;</div><div class='del'>-</div><div class='del'>-	while (*p) {</div><div class='del'>-		parent = *p;</div><div class='del'>-		cur = rb_entry(parent, struct ulist_node, rb_node);</div><div class='del'>-</div><div class='del'>-		if (cur-&gt;val &lt; ins-&gt;val)</div><div class='del'>-			p = &amp;(*p)-&gt;rb_right;</div><div class='del'>-		else if (cur-&gt;val &gt; ins-&gt;val)</div><div class='del'>-			p = &amp;(*p)-&gt;rb_left;</div><div class='del'>-		else</div><div class='del'>-			return -EEXIST;</div><div class='del'>-	}</div><div class='del'>-	rb_link_node(&amp;ins-&gt;rb_node, parent, p);</div><div class='del'>-	rb_insert_color(&amp;ins-&gt;rb_node, &amp;ulist-&gt;root);</div><div class='add'>+	struct rb_node *node;</div><div class='add'>+</div><div class='add'>+	node = rb_find_add(&amp;ins-&gt;rb_node, &amp;ulist-&gt;root, ulist_node_val_cmp);</div><div class='add'>+	if (node)</div><div class='add'>+		return -EEXIST;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * ulist_add - add an element to the ulist</div><div class='add'>+/*</div><div class='add'>+ * Add an element to the ulist.</div><div class='add'>+ *</div><div class='ctx'>  * @ulist:	ulist to add the element to</div><div class='ctx'>  * @val:	value to add to ulist</div><div class='ctx'>  * @aux:	auxiliary value to store along with val</div><div class='hunk'>@@ -200,9 +214,15 @@ int ulist_add_merge(struct ulist *ulist, u64 val, u64 aux,</div><div class='ctx'> 			*old_aux = node-&gt;aux;</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='del'>-	node = kmalloc(sizeof(*node), gfp_mask);</div><div class='del'>-	if (!node)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	if (ulist-&gt;prealloc) {</div><div class='add'>+		node = ulist-&gt;prealloc;</div><div class='add'>+		ulist-&gt;prealloc = NULL;</div><div class='add'>+	} else {</div><div class='add'>+		node = kmalloc(sizeof(*node), gfp_mask);</div><div class='add'>+		if (!node)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	node-&gt;val = val;</div><div class='ctx'> 	node-&gt;aux = aux;</div><div class='hunk'>@@ -216,7 +236,8 @@ int ulist_add_merge(struct ulist *ulist, u64 val, u64 aux,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * ulist_del - delete one node from ulist</div><div class='add'>+ * Delete one node from ulist.</div><div class='add'>+ *</div><div class='ctx'>  * @ulist:	ulist to remove node from</div><div class='ctx'>  * @val:	value to delete</div><div class='ctx'>  * @aux:	aux to delete</div><div class='hunk'>@@ -242,8 +263,9 @@ int ulist_del(struct ulist *ulist, u64 val, u64 aux)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * ulist_next - iterate ulist</div><div class='add'>+/*</div><div class='add'>+ * Iterate ulist.</div><div class='add'>+ *</div><div class='ctx'>  * @ulist:	ulist to iterate</div><div class='ctx'>  * @uiter:	iterator variable, initialized with ULIST_ITER_INIT(&amp;iterator)</div><div class='ctx'>  *</div><div class='hunk'>@@ -258,7 +280,7 @@ int ulist_del(struct ulist *ulist, u64 val, u64 aux)</div><div class='ctx'>  * It is allowed to call ulist_add during an enumeration. Newly added items</div><div class='ctx'>  * are guaranteed to show up in the running enumeration.</div><div class='ctx'>  */</div><div class='del'>-struct ulist_node *ulist_next(struct ulist *ulist, struct ulist_iterator *uiter)</div><div class='add'>+struct ulist_node *ulist_next(const struct ulist *ulist, struct ulist_iterator *uiter)</div><div class='ctx'> {</div><div class='ctx'> 	struct ulist_node *node;</div><div class='ctx'> </div><div class='head'>diff --git a/fs/btrfs/ulist.h b/fs/btrfs/ulist.h<br/>index 02fda0a2d4ce..c62a372f1462 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/ulist.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/ulist.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/ulist.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/ulist.h</a></div><div class='hunk'>@@ -7,6 +7,7 @@</div><div class='ctx'> #ifndef BTRFS_ULIST_H</div><div class='ctx'> #define BTRFS_ULIST_H</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='ctx'> #include &lt;linux/list.h&gt;</div><div class='ctx'> #include &lt;linux/rbtree.h&gt;</div><div class='ctx'> </div><div class='hunk'>@@ -40,12 +41,14 @@ struct ulist {</div><div class='ctx'> </div><div class='ctx'> 	struct list_head nodes;</div><div class='ctx'> 	struct rb_root root;</div><div class='add'>+	struct ulist_node *prealloc;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> void ulist_init(struct ulist *ulist);</div><div class='ctx'> void ulist_release(struct ulist *ulist);</div><div class='ctx'> void ulist_reinit(struct ulist *ulist);</div><div class='ctx'> struct ulist *ulist_alloc(gfp_t gfp_mask);</div><div class='add'>+void ulist_prealloc(struct ulist *ulist, gfp_t mask);</div><div class='ctx'> void ulist_free(struct ulist *ulist);</div><div class='ctx'> int ulist_add(struct ulist *ulist, u64 val, u64 aux, gfp_t gfp_mask);</div><div class='ctx'> int ulist_add_merge(struct ulist *ulist, u64 val, u64 aux,</div><div class='hunk'>@@ -66,7 +69,7 @@ static inline int ulist_add_merge_ptr(struct ulist *ulist, u64 val, void *aux,</div><div class='ctx'> #endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct ulist_node *ulist_next(struct ulist *ulist,</div><div class='add'>+struct ulist_node *ulist_next(const struct ulist *ulist,</div><div class='ctx'> 			      struct ulist_iterator *uiter);</div><div class='ctx'> </div><div class='ctx'> #define ULIST_ITER_INIT(uiter) ((uiter)-&gt;cur_list = NULL)</div><div class='head'>diff --git a/fs/btrfs/uuid-tree.c b/fs/btrfs/uuid-tree.c<br/>index 74023c8a783f..e3a1310fa7d5 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/uuid-tree.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/uuid-tree.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/uuid-tree.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/uuid-tree.c</a></div><div class='hunk'>@@ -3,15 +3,19 @@</div><div class='ctx'>  * Copyright (C) STRATO AG 2013.  All rights reserved.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/kthread.h&gt;</div><div class='ctx'> #include &lt;linux/uuid.h&gt;</div><div class='del'>-#include &lt;asm/unaligned.h&gt;</div><div class='add'>+#include &lt;linux/unaligned.h&gt;</div><div class='add'>+#include "messages.h"</div><div class='ctx'> #include "ctree.h"</div><div class='ctx'> #include "transaction.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='del'>-#include "print-tree.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "uuid-tree.h"</div><div class='add'>+#include "ioctl.h"</div><div class='ctx'> </div><div class='del'>-</div><div class='del'>-static void btrfs_uuid_to_key(u8 *uuid, u8 type, struct btrfs_key *key)</div><div class='add'>+static void btrfs_uuid_to_key(const u8 *uuid, u8 type, struct btrfs_key *key)</div><div class='ctx'> {</div><div class='ctx'> 	key-&gt;type = type;</div><div class='ctx'> 	key-&gt;objectid = get_unaligned_le64(uuid);</div><div class='hunk'>@@ -19,40 +23,34 @@ static void btrfs_uuid_to_key(u8 *uuid, u8 type, struct btrfs_key *key)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* return -ENOENT for !found, &lt; 0 for errors, or 0 if an item was found */</div><div class='del'>-static int btrfs_uuid_tree_lookup(struct btrfs_root *uuid_root, u8 *uuid,</div><div class='add'>+static int btrfs_uuid_tree_lookup(struct btrfs_root *uuid_root, const u8 *uuid,</div><div class='ctx'> 				  u8 type, u64 subid)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='del'>-	struct btrfs_path *path = NULL;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='ctx'> 	int slot;</div><div class='ctx'> 	u32 item_size;</div><div class='ctx'> 	unsigned long offset;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> </div><div class='del'>-	if (WARN_ON_ONCE(!uuid_root)) {</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (WARN_ON_ONCE(!uuid_root))</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='del'>-	if (!path) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (!path)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	btrfs_uuid_to_key(uuid, type, &amp;key);</div><div class='ctx'> 	ret = btrfs_search_slot(NULL, uuid_root, &amp;key, path, 0, 0);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		goto out;</div><div class='del'>-	} else if (ret &gt; 0) {</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> </div><div class='ctx'> 	eb = path-&gt;nodes[0];</div><div class='ctx'> 	slot = path-&gt;slots[0];</div><div class='del'>-	item_size = btrfs_item_size_nr(eb, slot);</div><div class='add'>+	item_size = btrfs_item_size(eb, slot);</div><div class='ctx'> 	offset = btrfs_item_ptr_offset(eb, slot);</div><div class='ctx'> 	ret = -ENOENT;</div><div class='ctx'> </div><div class='hunk'>@@ -60,7 +58,7 @@ static int btrfs_uuid_tree_lookup(struct btrfs_root *uuid_root, u8 *uuid,</div><div class='ctx'> 		btrfs_warn(uuid_root-&gt;fs_info,</div><div class='ctx'> 			   "uuid item with illegal size %lu!",</div><div class='ctx'> 			   (unsigned long)item_size);</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> 	while (item_size) {</div><div class='ctx'> 		__le64 data;</div><div class='hunk'>@@ -74,18 +72,16 @@ static int btrfs_uuid_tree_lookup(struct btrfs_root *uuid_root, u8 *uuid,</div><div class='ctx'> 		item_size -= sizeof(data);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_uuid_tree_add(struct btrfs_trans_handle *trans, u8 *uuid, u8 type,</div><div class='add'>+int btrfs_uuid_tree_add(struct btrfs_trans_handle *trans, const u8 *uuid, u8 type,</div><div class='ctx'> 			u64 subid_cpu)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_root *uuid_root = fs_info-&gt;uuid_root;</div><div class='ctx'> 	int ret;</div><div class='del'>-	struct btrfs_path *path = NULL;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='ctx'> 	int slot;</div><div class='hunk'>@@ -96,22 +92,18 @@ int btrfs_uuid_tree_add(struct btrfs_trans_handle *trans, u8 *uuid, u8 type,</div><div class='ctx'> 	if (ret != -ENOENT)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	if (WARN_ON_ONCE(!uuid_root)) {</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (WARN_ON_ONCE(!uuid_root))</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	btrfs_uuid_to_key(uuid, type, &amp;key);</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='del'>-	if (!path) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (!path)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_insert_empty_item(trans, uuid_root, path, &amp;key,</div><div class='ctx'> 				      sizeof(subid_le));</div><div class='del'>-	if (ret &gt;= 0) {</div><div class='add'>+	if (ret == 0) {</div><div class='ctx'> 		/* Add an item for the type for the first time */</div><div class='ctx'> 		eb = path-&gt;nodes[0];</div><div class='ctx'> 		slot = path-&gt;slots[0];</div><div class='hunk'>@@ -121,35 +113,30 @@ int btrfs_uuid_tree_add(struct btrfs_trans_handle *trans, u8 *uuid, u8 type,</div><div class='ctx'> 		 * An item with that type already exists.</div><div class='ctx'> 		 * Extend the item and store the new subid at the end.</div><div class='ctx'> 		 */</div><div class='del'>-		btrfs_extend_item(path, sizeof(subid_le));</div><div class='add'>+		btrfs_extend_item(trans, path, sizeof(subid_le));</div><div class='ctx'> 		eb = path-&gt;nodes[0];</div><div class='ctx'> 		slot = path-&gt;slots[0];</div><div class='ctx'> 		offset = btrfs_item_ptr_offset(eb, slot);</div><div class='del'>-		offset += btrfs_item_size_nr(eb, slot) - sizeof(subid_le);</div><div class='add'>+		offset += btrfs_item_size(eb, slot) - sizeof(subid_le);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		btrfs_warn(fs_info,</div><div class='ctx'> 			   "insert uuid item failed %d (0x%016llx, 0x%016llx) type %u!",</div><div class='ctx'> 			   ret, key.objectid, key.offset, type);</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = 0;</div><div class='ctx'> 	subid_le = cpu_to_le64(subid_cpu);</div><div class='ctx'> 	write_extent_buffer(eb, &amp;subid_le, offset, sizeof(subid_le));</div><div class='del'>-	btrfs_mark_buffer_dirty(eb);</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_uuid_tree_remove(struct btrfs_trans_handle *trans, u8 *uuid, u8 type,</div><div class='add'>+int btrfs_uuid_tree_remove(struct btrfs_trans_handle *trans, const u8 *uuid, u8 type,</div><div class='ctx'> 			u64 subid)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_root *uuid_root = fs_info-&gt;uuid_root;</div><div class='ctx'> 	int ret;</div><div class='del'>-	struct btrfs_path *path = NULL;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='ctx'> 	int slot;</div><div class='hunk'>@@ -159,39 +146,32 @@ int btrfs_uuid_tree_remove(struct btrfs_trans_handle *trans, u8 *uuid, u8 type,</div><div class='ctx'> 	unsigned long move_src;</div><div class='ctx'> 	unsigned long move_len;</div><div class='ctx'> </div><div class='del'>-	if (WARN_ON_ONCE(!uuid_root)) {</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (WARN_ON_ONCE(!uuid_root))</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	btrfs_uuid_to_key(uuid, type, &amp;key);</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='del'>-	if (!path) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (!path)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_search_slot(trans, uuid_root, &amp;key, path, -1, 1);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='ctx'> 		btrfs_warn(fs_info, "error %d while searching for uuid item!",</div><div class='ctx'> 			   ret);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	if (ret &gt; 0) {</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> </div><div class='ctx'> 	eb = path-&gt;nodes[0];</div><div class='ctx'> 	slot = path-&gt;slots[0];</div><div class='ctx'> 	offset = btrfs_item_ptr_offset(eb, slot);</div><div class='del'>-	item_size = btrfs_item_size_nr(eb, slot);</div><div class='add'>+	item_size = btrfs_item_size(eb, slot);</div><div class='ctx'> 	if (!IS_ALIGNED(item_size, sizeof(u64))) {</div><div class='ctx'> 		btrfs_warn(fs_info, "uuid item with illegal size %lu!",</div><div class='ctx'> 			   (unsigned long)item_size);</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-		goto out;</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> 	}</div><div class='ctx'> 	while (item_size) {</div><div class='ctx'> 		__le64 read_subid;</div><div class='hunk'>@@ -203,26 +183,20 @@ int btrfs_uuid_tree_remove(struct btrfs_trans_handle *trans, u8 *uuid, u8 type,</div><div class='ctx'> 		item_size -= sizeof(read_subid);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!item_size) {</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (!item_size)</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> </div><div class='del'>-	item_size = btrfs_item_size_nr(eb, slot);</div><div class='del'>-	if (item_size == sizeof(subid)) {</div><div class='del'>-		ret = btrfs_del_item(trans, uuid_root, path);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	item_size = btrfs_item_size(eb, slot);</div><div class='add'>+	if (item_size == sizeof(subid))</div><div class='add'>+		return btrfs_del_item(trans, uuid_root, path);</div><div class='ctx'> </div><div class='ctx'> 	move_dst = offset;</div><div class='ctx'> 	move_src = offset + sizeof(subid);</div><div class='ctx'> 	move_len = item_size - (move_src - btrfs_item_ptr_offset(eb, slot));</div><div class='ctx'> 	memmove_extent_buffer(eb, move_dst, move_src, move_len);</div><div class='del'>-	btrfs_truncate_item(path, item_size - sizeof(subid), 1);</div><div class='add'>+	btrfs_truncate_item(trans, path, item_size - sizeof(subid), 1);</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int btrfs_uuid_iter_rem(struct btrfs_root *uuid_root, u8 *uuid, u8 type,</div><div class='hunk'>@@ -254,7 +228,7 @@ out:</div><div class='ctx'>  * &lt; 0	if an error occurred</div><div class='ctx'>  */</div><div class='ctx'> static int btrfs_check_uuid_tree_entry(struct btrfs_fs_info *fs_info,</div><div class='del'>-				       u8 *uuid, u8 type, u64 subvolid)</div><div class='add'>+				       const u8 *uuid, u8 type, u64 subvolid)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	struct btrfs_root *subvol_root;</div><div class='hunk'>@@ -291,7 +265,7 @@ int btrfs_uuid_tree_iterate(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root = fs_info-&gt;uuid_root;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	int slot;</div><div class='hunk'>@@ -299,10 +273,8 @@ int btrfs_uuid_tree_iterate(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	unsigned long offset;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='del'>-	if (!path) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (!path)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = 0;</div><div class='ctx'> 	key.type = 0;</div><div class='hunk'>@@ -310,17 +282,15 @@ int btrfs_uuid_tree_iterate(struct btrfs_fs_info *fs_info)</div><div class='ctx'> </div><div class='ctx'> again_search_slot:</div><div class='ctx'> 	ret = btrfs_search_forward(root, &amp;key, path, BTRFS_OLDEST_GENERATION);</div><div class='del'>-	if (ret) {</div><div class='del'>-		if (ret &gt; 0)</div><div class='del'>-			ret = 0;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='del'>-		if (btrfs_fs_closing(fs_info)) {</div><div class='del'>-			ret = -EINTR;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+		if (btrfs_fs_closing(fs_info))</div><div class='add'>+			return -EINTR;</div><div class='add'>+</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 		leaf = path-&gt;nodes[0];</div><div class='ctx'> 		slot = path-&gt;slots[0];</div><div class='hunk'>@@ -331,7 +301,7 @@ again_search_slot:</div><div class='ctx'> 			goto skip;</div><div class='ctx'> </div><div class='ctx'> 		offset = btrfs_item_ptr_offset(leaf, slot);</div><div class='del'>-		item_size = btrfs_item_size_nr(leaf, slot);</div><div class='add'>+		item_size = btrfs_item_size(leaf, slot);</div><div class='ctx'> 		if (!IS_ALIGNED(item_size, sizeof(u64))) {</div><div class='ctx'> 			btrfs_warn(fs_info,</div><div class='ctx'> 				   "uuid item with illegal size %lu!",</div><div class='hunk'>@@ -351,7 +321,7 @@ again_search_slot:</div><div class='ctx'> 			ret = btrfs_check_uuid_tree_entry(fs_info, uuid,</div><div class='ctx'> 							  key.type, subid_cpu);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='del'>-				goto out;</div><div class='add'>+				return ret;</div><div class='ctx'> 			if (ret &gt; 0) {</div><div class='ctx'> 				btrfs_release_path(path);</div><div class='ctx'> 				ret = btrfs_uuid_iter_rem(root, uuid, key.type,</div><div class='hunk'>@@ -367,7 +337,7 @@ again_search_slot:</div><div class='ctx'> 					goto again_search_slot;</div><div class='ctx'> 				}</div><div class='ctx'> 				if (ret &lt; 0 &amp;&amp; ret != -ENOENT)</div><div class='del'>-					goto out;</div><div class='add'>+					return ret;</div><div class='ctx'> 				key.offset++;</div><div class='ctx'> 				goto again_search_slot;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -384,7 +354,182 @@ skip:</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_uuid_scan_kthread(void *data)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = data;</div><div class='add'>+	struct btrfs_root *root = fs_info-&gt;tree_root;</div><div class='add'>+	struct btrfs_key key;</div><div class='add'>+	struct btrfs_path *path = NULL;</div><div class='add'>+	int ret = 0;</div><div class='add'>+	struct extent_buffer *eb;</div><div class='add'>+	int slot;</div><div class='add'>+	struct btrfs_root_item root_item;</div><div class='add'>+	u32 item_size;</div><div class='add'>+	struct btrfs_trans_handle *trans = NULL;</div><div class='add'>+	bool closing = false;</div><div class='add'>+</div><div class='add'>+	path = btrfs_alloc_path();</div><div class='add'>+	if (!path) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	key.objectid = 0;</div><div class='add'>+	key.type = BTRFS_ROOT_ITEM_KEY;</div><div class='add'>+	key.offset = 0;</div><div class='add'>+</div><div class='add'>+	while (1) {</div><div class='add'>+		if (btrfs_fs_closing(fs_info)) {</div><div class='add'>+			closing = true;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		ret = btrfs_search_forward(root, &amp;key, path,</div><div class='add'>+				BTRFS_OLDEST_GENERATION);</div><div class='add'>+		if (ret) {</div><div class='add'>+			if (ret &gt; 0)</div><div class='add'>+				ret = 0;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (key.type != BTRFS_ROOT_ITEM_KEY ||</div><div class='add'>+		    (key.objectid &lt; BTRFS_FIRST_FREE_OBJECTID &amp;&amp;</div><div class='add'>+		     key.objectid != BTRFS_FS_TREE_OBJECTID) ||</div><div class='add'>+		    key.objectid &gt; BTRFS_LAST_FREE_OBJECTID)</div><div class='add'>+			goto skip;</div><div class='add'>+</div><div class='add'>+		eb = path-&gt;nodes[0];</div><div class='add'>+		slot = path-&gt;slots[0];</div><div class='add'>+		item_size = btrfs_item_size(eb, slot);</div><div class='add'>+		if (item_size &lt; sizeof(root_item))</div><div class='add'>+			goto skip;</div><div class='add'>+</div><div class='add'>+		read_extent_buffer(eb, &amp;root_item,</div><div class='add'>+				   btrfs_item_ptr_offset(eb, slot),</div><div class='add'>+				   (int)sizeof(root_item));</div><div class='add'>+		if (btrfs_root_refs(&amp;root_item) == 0)</div><div class='add'>+			goto skip;</div><div class='add'>+</div><div class='add'>+		if (!btrfs_is_empty_uuid(root_item.uuid) ||</div><div class='add'>+		    !btrfs_is_empty_uuid(root_item.received_uuid)) {</div><div class='add'>+			if (trans)</div><div class='add'>+				goto update_tree;</div><div class='add'>+</div><div class='add'>+			btrfs_release_path(path);</div><div class='add'>+			/*</div><div class='add'>+			 * 1 - subvol uuid item</div><div class='add'>+			 * 1 - received_subvol uuid item</div><div class='add'>+			 */</div><div class='add'>+			trans = btrfs_start_transaction(fs_info-&gt;uuid_root, 2);</div><div class='add'>+			if (IS_ERR(trans)) {</div><div class='add'>+				ret = PTR_ERR(trans);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+			continue;</div><div class='add'>+		} else {</div><div class='add'>+			goto skip;</div><div class='add'>+		}</div><div class='add'>+update_tree:</div><div class='add'>+		btrfs_release_path(path);</div><div class='add'>+		if (!btrfs_is_empty_uuid(root_item.uuid)) {</div><div class='add'>+			ret = btrfs_uuid_tree_add(trans, root_item.uuid,</div><div class='add'>+						  BTRFS_UUID_KEY_SUBVOL,</div><div class='add'>+						  key.objectid);</div><div class='add'>+			if (ret &lt; 0) {</div><div class='add'>+				btrfs_warn(fs_info, "uuid_tree_add failed %d",</div><div class='add'>+					ret);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (!btrfs_is_empty_uuid(root_item.received_uuid)) {</div><div class='add'>+			ret = btrfs_uuid_tree_add(trans,</div><div class='add'>+						  root_item.received_uuid,</div><div class='add'>+						 BTRFS_UUID_KEY_RECEIVED_SUBVOL,</div><div class='add'>+						  key.objectid);</div><div class='add'>+			if (ret &lt; 0) {</div><div class='add'>+				btrfs_warn(fs_info, "uuid_tree_add failed %d",</div><div class='add'>+					ret);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+skip:</div><div class='add'>+		btrfs_release_path(path);</div><div class='add'>+		if (trans) {</div><div class='add'>+			ret = btrfs_end_transaction(trans);</div><div class='add'>+			trans = NULL;</div><div class='add'>+			if (ret)</div><div class='add'>+				break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (key.offset &lt; (u64)-1) {</div><div class='add'>+			key.offset++;</div><div class='add'>+		} else if (key.type &lt; BTRFS_ROOT_ITEM_KEY) {</div><div class='add'>+			key.offset = 0;</div><div class='add'>+			key.type = BTRFS_ROOT_ITEM_KEY;</div><div class='add'>+		} else if (key.objectid &lt; (u64)-1) {</div><div class='add'>+			key.offset = 0;</div><div class='add'>+			key.type = BTRFS_ROOT_ITEM_KEY;</div><div class='add'>+			key.objectid++;</div><div class='add'>+		} else {</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		cond_resched();</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> out:</div><div class='ctx'> 	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	if (trans &amp;&amp; !IS_ERR(trans))</div><div class='add'>+		btrfs_end_transaction(trans);</div><div class='add'>+	if (ret)</div><div class='add'>+		btrfs_warn(fs_info, "btrfs_uuid_scan_kthread failed %d", ret);</div><div class='add'>+	else if (!closing)</div><div class='add'>+		set_bit(BTRFS_FS_UPDATE_UUID_TREE_GEN, &amp;fs_info-&gt;flags);</div><div class='add'>+	up(&amp;fs_info-&gt;uuid_tree_rescan_sem);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_create_uuid_tree(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_trans_handle *trans;</div><div class='add'>+	struct btrfs_root *tree_root = fs_info-&gt;tree_root;</div><div class='add'>+	struct btrfs_root *uuid_root;</div><div class='add'>+	struct task_struct *task;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * 1 - root node</div><div class='add'>+	 * 1 - root item</div><div class='add'>+	 */</div><div class='add'>+	trans = btrfs_start_transaction(tree_root, 2);</div><div class='add'>+	if (IS_ERR(trans))</div><div class='add'>+		return PTR_ERR(trans);</div><div class='add'>+</div><div class='add'>+	uuid_root = btrfs_create_tree(trans, BTRFS_UUID_TREE_OBJECTID);</div><div class='add'>+	if (IS_ERR(uuid_root)) {</div><div class='add'>+		ret = PTR_ERR(uuid_root);</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		btrfs_end_transaction(trans);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	fs_info-&gt;uuid_root = uuid_root;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_commit_transaction(trans);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	down(&amp;fs_info-&gt;uuid_tree_rescan_sem);</div><div class='add'>+	task = kthread_run(btrfs_uuid_scan_kthread, fs_info, "btrfs-uuid");</div><div class='add'>+	if (IS_ERR(task)) {</div><div class='add'>+		/* fs_info-&gt;update_uuid_tree_gen remains 0 in all error case */</div><div class='add'>+		btrfs_warn(fs_info, "failed to start uuid_scan task");</div><div class='add'>+		up(&amp;fs_info-&gt;uuid_tree_rescan_sem);</div><div class='add'>+		return PTR_ERR(task);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/btrfs/uuid-tree.h b/fs/btrfs/uuid-tree.h<br/>new file mode 100644<br/>index 000000000000..c60ad20325cc<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/uuid-tree.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/uuid-tree.h</a></div><div class='hunk'>@@ -0,0 +1,19 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+</div><div class='add'>+#ifndef BTRFS_UUID_TREE_H</div><div class='add'>+#define BTRFS_UUID_TREE_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+</div><div class='add'>+struct btrfs_trans_handle;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+</div><div class='add'>+int btrfs_uuid_tree_add(struct btrfs_trans_handle *trans, const u8 *uuid, u8 type,</div><div class='add'>+			u64 subid);</div><div class='add'>+int btrfs_uuid_tree_remove(struct btrfs_trans_handle *trans, const u8 *uuid, u8 type,</div><div class='add'>+			u64 subid);</div><div class='add'>+int btrfs_uuid_tree_iterate(struct btrfs_fs_info *fs_info);</div><div class='add'>+int btrfs_create_uuid_tree(struct btrfs_fs_info *fs_info);</div><div class='add'>+int btrfs_uuid_scan_kthread(void *data);</div><div class='add'>+</div><div class='add'>+#endif</div><div class='head'>diff --git a/fs/btrfs/verity.c b/fs/btrfs/verity.c<br/>index 4968535dfff0..a2ac3fb68bc8 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/verity.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/verity.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/verity.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/verity.c</a></div><div class='hunk'>@@ -10,11 +10,16 @@</div><div class='ctx'> #include &lt;linux/iversion.h&gt;</div><div class='ctx'> #include &lt;linux/fsverity.h&gt;</div><div class='ctx'> #include &lt;linux/sched/mm.h&gt;</div><div class='add'>+#include "messages.h"</div><div class='ctx'> #include "ctree.h"</div><div class='ctx'> #include "btrfs_inode.h"</div><div class='ctx'> #include "transaction.h"</div><div class='del'>-#include "disk-io.h"</div><div class='ctx'> #include "locking.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "ioctl.h"</div><div class='add'>+#include "verity.h"</div><div class='add'>+#include "orphan.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Implementation of the interface defined in struct fsverity_operations.</div><div class='hunk'>@@ -104,7 +109,7 @@ static int drop_verity_items(struct btrfs_inode *inode, u8 key_type)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	struct btrfs_root *root = inode-&gt;root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	int count = 0;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -116,10 +121,8 @@ static int drop_verity_items(struct btrfs_inode *inode, u8 key_type)</div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		/* 1 for the item being dropped */</div><div class='ctx'> 		trans = btrfs_start_transaction(root, 1);</div><div class='del'>-		if (IS_ERR(trans)) {</div><div class='del'>-			ret = PTR_ERR(trans);</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+		if (IS_ERR(trans))</div><div class='add'>+			return PTR_ERR(trans);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Walk backwards through all the items until we find one that</div><div class='hunk'>@@ -138,7 +141,7 @@ static int drop_verity_items(struct btrfs_inode *inode, u8 key_type)</div><div class='ctx'> 			path-&gt;slots[0]--;</div><div class='ctx'> 		} else if (ret &lt; 0) {</div><div class='ctx'> 			btrfs_end_transaction(trans);</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;key, path-&gt;slots[0]);</div><div class='hunk'>@@ -156,17 +159,14 @@ static int drop_verity_items(struct btrfs_inode *inode, u8 key_type)</div><div class='ctx'> 		ret = btrfs_del_items(trans, root, path, path-&gt;slots[0], 1);</div><div class='ctx'> 		if (ret) {</div><div class='ctx'> 			btrfs_end_transaction(trans);</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 		}</div><div class='ctx'> 		count++;</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> 		btrfs_end_transaction(trans);</div><div class='ctx'> 	}</div><div class='del'>-	ret = count;</div><div class='ctx'> 	btrfs_end_transaction(trans);</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	return count;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -212,7 +212,7 @@ static int write_key_bytes(struct btrfs_inode *inode, u8 key_type, u64 offset,</div><div class='ctx'> 			   const char *src, u64 len)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='hunk'>@@ -228,10 +228,8 @@ static int write_key_bytes(struct btrfs_inode *inode, u8 key_type, u64 offset,</div><div class='ctx'> 	while (len &gt; 0) {</div><div class='ctx'> 		/* 1 for the new item being inserted */</div><div class='ctx'> 		trans = btrfs_start_transaction(root, 1);</div><div class='del'>-		if (IS_ERR(trans)) {</div><div class='del'>-			ret = PTR_ERR(trans);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='add'>+		if (IS_ERR(trans))</div><div class='add'>+			return PTR_ERR(trans);</div><div class='ctx'> </div><div class='ctx'> 		key.objectid = btrfs_ino(inode);</div><div class='ctx'> 		key.type = key_type;</div><div class='hunk'>@@ -262,7 +260,6 @@ static int write_key_bytes(struct btrfs_inode *inode, u8 key_type, u64 offset,</div><div class='ctx'> 		btrfs_end_transaction(trans);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -279,7 +276,7 @@ static int write_key_bytes(struct btrfs_inode *inode, u8 key_type, u64 offset,</div><div class='ctx'>  *              page and ignore dest, but it must still be non-NULL to avoid the</div><div class='ctx'>  *              counting-only behavior.</div><div class='ctx'>  * @len:        length in bytes to read</div><div class='del'>- * @dest_page:  copy into this page instead of the dest buffer</div><div class='add'>+ * @dest_folio: copy into this folio instead of the dest buffer</div><div class='ctx'>  *</div><div class='ctx'>  * Helper function to read items from the btree.  This returns the number of</div><div class='ctx'>  * bytes read or &lt; 0 for errors.  We can return short reads if the items don't</div><div class='hunk'>@@ -289,9 +286,9 @@ static int write_key_bytes(struct btrfs_inode *inode, u8 key_type, u64 offset,</div><div class='ctx'>  * Returns number of bytes read or a negative error code on failure.</div><div class='ctx'>  */</div><div class='ctx'> static int read_key_bytes(struct btrfs_inode *inode, u8 key_type, u64 offset,</div><div class='del'>-			  char *dest, u64 len, struct page *dest_page)</div><div class='add'>+			  char *dest, u64 len, struct folio *dest_folio)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='hunk'>@@ -309,7 +306,7 @@ static int read_key_bytes(struct btrfs_inode *inode, u8 key_type, u64 offset,</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	if (dest_page)</div><div class='add'>+	if (dest_folio)</div><div class='ctx'> 		path-&gt;reada = READA_FORWARD;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = btrfs_ino(inode);</div><div class='hunk'>@@ -333,7 +330,7 @@ static int read_key_bytes(struct btrfs_inode *inode, u8 key_type, u64 offset,</div><div class='ctx'> 		if (key.objectid != btrfs_ino(inode) || key.type != key_type)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		item_end = btrfs_item_size_nr(leaf, path-&gt;slots[0]) + key.offset;</div><div class='add'>+		item_end = btrfs_item_size(leaf, path-&gt;slots[0]) + key.offset;</div><div class='ctx'> </div><div class='ctx'> 		if (copied &gt; 0) {</div><div class='ctx'> 			/*</div><div class='hunk'>@@ -366,15 +363,15 @@ static int read_key_bytes(struct btrfs_inode *inode, u8 key_type, u64 offset,</div><div class='ctx'> 		copy_offset = offset - key.offset;</div><div class='ctx'> </div><div class='ctx'> 		if (dest) {</div><div class='del'>-			if (dest_page)</div><div class='del'>-				kaddr = kmap_local_page(dest_page);</div><div class='add'>+			if (dest_folio)</div><div class='add'>+				kaddr = kmap_local_folio(dest_folio, 0);</div><div class='ctx'> </div><div class='ctx'> 			data = btrfs_item_ptr(leaf, path-&gt;slots[0], void);</div><div class='ctx'> 			read_extent_buffer(leaf, kaddr + dest_offset,</div><div class='ctx'> 					   (unsigned long)data + copy_offset,</div><div class='ctx'> 					   copy_bytes);</div><div class='ctx'> </div><div class='del'>-			if (dest_page)</div><div class='add'>+			if (dest_folio)</div><div class='ctx'> 				kunmap_local(kaddr);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -399,7 +396,6 @@ static int read_key_bytes(struct btrfs_inode *inode, u8 key_type, u64 offset,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		ret = copied;</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -455,7 +451,7 @@ static int rollback_verity(struct btrfs_inode *inode)</div><div class='ctx'> 	struct btrfs_root *root = inode-&gt;root;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ASSERT(inode_is_locked(&amp;inode-&gt;vfs_inode));</div><div class='add'>+	btrfs_assert_inode_locked(inode);</div><div class='ctx'> 	truncate_inode_pages(inode-&gt;vfs_inode.i_mapping, inode-&gt;vfs_inode.i_size);</div><div class='ctx'> 	clear_bit(BTRFS_INODE_VERITY_IN_PROGRESS, &amp;inode-&gt;runtime_flags);</div><div class='ctx'> 	ret = btrfs_drop_verity_items(inode);</div><div class='hunk'>@@ -480,14 +476,14 @@ static int rollback_verity(struct btrfs_inode *inode)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	inode-&gt;ro_flags &amp;= ~BTRFS_INODE_RO_VERITY;</div><div class='del'>-	btrfs_sync_inode_flags_to_i_flags(&amp;inode-&gt;vfs_inode);</div><div class='del'>-	ret = btrfs_update_inode(trans, root, inode);</div><div class='del'>-	if (ret) {</div><div class='add'>+	btrfs_sync_inode_flags_to_i_flags(inode);</div><div class='add'>+	ret = btrfs_update_inode(trans, inode);</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	ret = del_orphan(trans, inode);</div><div class='del'>-	if (ret) {</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -547,8 +543,8 @@ static int finish_verity(struct btrfs_inode *inode, const void *desc,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	inode-&gt;ro_flags |= BTRFS_INODE_RO_VERITY;</div><div class='del'>-	btrfs_sync_inode_flags_to_i_flags(&amp;inode-&gt;vfs_inode);</div><div class='del'>-	ret = btrfs_update_inode(trans, root, inode);</div><div class='add'>+	btrfs_sync_inode_flags_to_i_flags(inode);</div><div class='add'>+	ret = btrfs_update_inode(trans, inode);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto end_trans;</div><div class='ctx'> 	ret = del_orphan(trans, inode);</div><div class='hunk'>@@ -580,7 +576,10 @@ static int btrfs_begin_enable_verity(struct file *filp)</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ASSERT(inode_is_locked(file_inode(filp)));</div><div class='add'>+	btrfs_assert_inode_locked(inode);</div><div class='add'>+</div><div class='add'>+	if (IS_ENCRYPTED(&amp;inode-&gt;vfs_inode))</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='ctx'> 	if (test_bit(BTRFS_INODE_VERITY_IN_PROGRESS, &amp;inode-&gt;runtime_flags))</div><div class='ctx'> 		return -EBUSY;</div><div class='hunk'>@@ -628,7 +627,7 @@ static int btrfs_end_enable_verity(struct file *filp, const void *desc,</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int rollback_ret;</div><div class='ctx'> </div><div class='del'>-	ASSERT(inode_is_locked(file_inode(filp)));</div><div class='add'>+	btrfs_assert_inode_locked(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (desc == NULL)</div><div class='ctx'> 		goto rollback;</div><div class='hunk'>@@ -659,8 +658,7 @@ rollback:</div><div class='ctx'>  *</div><div class='ctx'>  * Returns the size on success or a negative error code on failure.</div><div class='ctx'>  */</div><div class='del'>-static int btrfs_get_verity_descriptor(struct inode *inode, void *buf,</div><div class='del'>-				       size_t buf_size)</div><div class='add'>+int btrfs_get_verity_descriptor(struct inode *inode, void *buf, size_t buf_size)</div><div class='ctx'> {</div><div class='ctx'> 	u64 true_size;</div><div class='ctx'> 	int ret = 0;</div><div class='hunk'>@@ -672,11 +670,11 @@ static int btrfs_get_verity_descriptor(struct inode *inode, void *buf,</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	if (item.reserved[0] != 0 || item.reserved[1] != 0)</div><div class='add'>+	if (unlikely(item.reserved[0] != 0 || item.reserved[1] != 0))</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> </div><div class='ctx'> 	true_size = btrfs_stack_verity_descriptor_size(&amp;item);</div><div class='del'>-	if (true_size &gt; INT_MAX)</div><div class='add'>+	if (unlikely(true_size &gt; INT_MAX))</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> </div><div class='ctx'> 	if (buf_size == 0)</div><div class='hunk'>@@ -710,7 +708,7 @@ static struct page *btrfs_read_merkle_tree_page(struct inode *inode,</div><div class='ctx'> 						pgoff_t index,</div><div class='ctx'> 						unsigned long num_ra_pages)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	u64 off = (u64)index &lt;&lt; PAGE_SHIFT;</div><div class='ctx'> 	loff_t merkle_pos = merkle_file_pos(inode);</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -721,29 +719,36 @@ static struct page *btrfs_read_merkle_tree_page(struct inode *inode,</div><div class='ctx'> 		return ERR_PTR(-EFBIG);</div><div class='ctx'> 	index += merkle_pos &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> again:</div><div class='del'>-	page = find_get_page_flags(inode-&gt;i_mapping, index, FGP_ACCESSED);</div><div class='del'>-	if (page) {</div><div class='del'>-		if (PageUptodate(page))</div><div class='del'>-			return page;</div><div class='add'>+	folio = __filemap_get_folio(inode-&gt;i_mapping, index, FGP_ACCESSED, 0);</div><div class='add'>+	if (!IS_ERR(folio)) {</div><div class='add'>+		if (folio_test_uptodate(folio))</div><div class='add'>+			goto out;</div><div class='ctx'> </div><div class='del'>-		lock_page(page);</div><div class='del'>-		/*</div><div class='del'>-		 * We only insert uptodate pages, so !Uptodate has to be</div><div class='del'>-		 * an error</div><div class='del'>-		 */</div><div class='del'>-		if (!PageUptodate(page)) {</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			put_page(page);</div><div class='add'>+		folio_lock(folio);</div><div class='add'>+		/* If it's not uptodate after we have the lock, we got a read error. */</div><div class='add'>+		if (!folio_test_uptodate(folio)) {</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+			folio_put(folio);</div><div class='ctx'> 			return ERR_PTR(-EIO);</div><div class='ctx'> 		}</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		return page;</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	page = __page_cache_alloc(mapping_gfp_constraint(inode-&gt;i_mapping, ~__GFP_FS));</div><div class='del'>-	if (!page)</div><div class='add'>+	folio = filemap_alloc_folio(mapping_gfp_constraint(inode-&gt;i_mapping, ~__GFP_FS),</div><div class='add'>+				    0, NULL);</div><div class='add'>+	if (!folio)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='add'>+	ret = filemap_add_folio(inode-&gt;i_mapping, folio, index, GFP_NOFS);</div><div class='add'>+	if (ret) {</div><div class='add'>+		folio_put(folio);</div><div class='add'>+		/* Did someone else insert a folio here? */</div><div class='add'>+		if (ret == -EEXIST)</div><div class='add'>+			goto again;</div><div class='add'>+		return ERR_PTR(ret);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Merkle item keys are indexed from byte 0 in the merkle tree.</div><div class='ctx'> 	 * They have the form:</div><div class='hunk'>@@ -751,60 +756,48 @@ again:</div><div class='ctx'> 	 * [ inode objectid, BTRFS_MERKLE_ITEM_KEY, offset in bytes ]</div><div class='ctx'> 	 */</div><div class='ctx'> 	ret = read_key_bytes(BTRFS_I(inode), BTRFS_VERITY_MERKLE_ITEM_KEY, off,</div><div class='del'>-			     page_address(page), PAGE_SIZE, page);</div><div class='add'>+			     folio_address(folio), PAGE_SIZE, folio);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='del'>-		put_page(page);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 		return ERR_PTR(ret);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (ret &lt; PAGE_SIZE)</div><div class='del'>-		memzero_page(page, ret, PAGE_SIZE - ret);</div><div class='add'>+		folio_zero_segment(folio, ret, PAGE_SIZE);</div><div class='ctx'> </div><div class='del'>-	SetPageUptodate(page);</div><div class='del'>-	ret = add_to_page_cache_lru(page, inode-&gt;i_mapping, index, GFP_NOFS);</div><div class='add'>+	folio_mark_uptodate(folio);</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> </div><div class='del'>-	if (!ret) {</div><div class='del'>-		/* Inserted and ready for fsverity */</div><div class='del'>-		unlock_page(page);</div><div class='del'>-	} else {</div><div class='del'>-		put_page(page);</div><div class='del'>-		/* Did someone race us into inserting this page? */</div><div class='del'>-		if (ret == -EEXIST)</div><div class='del'>-			goto again;</div><div class='del'>-		page = ERR_PTR(ret);</div><div class='del'>-	}</div><div class='del'>-	return page;</div><div class='add'>+out:</div><div class='add'>+	return folio_file_page(folio, index);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * fsverity op that writes a Merkle tree block into the btree.</div><div class='ctx'>  *</div><div class='del'>- * @inode:          inode to write a Merkle tree block for</div><div class='del'>- * @buf:            Merkle tree data block to write</div><div class='del'>- * @index:          index of the block in the Merkle tree</div><div class='del'>- * @log_blocksize:  log base 2 of the Merkle tree block size</div><div class='del'>- *</div><div class='del'>- * Note that the block size could be different from the page size, so it is not</div><div class='del'>- * safe to assume that index is a page index.</div><div class='add'>+ * @inode:	inode to write a Merkle tree block for</div><div class='add'>+ * @buf:	Merkle tree block to write</div><div class='add'>+ * @pos:	the position of the block in the Merkle tree (in bytes)</div><div class='add'>+ * @size:	the Merkle tree block size (in bytes)</div><div class='ctx'>  *</div><div class='ctx'>  * Returns 0 on success or negative error code on failure</div><div class='ctx'>  */</div><div class='ctx'> static int btrfs_write_merkle_tree_block(struct inode *inode, const void *buf,</div><div class='del'>-					u64 index, int log_blocksize)</div><div class='add'>+					 u64 pos, unsigned int size)</div><div class='ctx'> {</div><div class='del'>-	u64 off = index &lt;&lt; log_blocksize;</div><div class='del'>-	u64 len = 1ULL &lt;&lt; log_blocksize;</div><div class='ctx'> 	loff_t merkle_pos = merkle_file_pos(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (merkle_pos &lt; 0)</div><div class='ctx'> 		return merkle_pos;</div><div class='del'>-	if (merkle_pos &gt; inode-&gt;i_sb-&gt;s_maxbytes - off - len)</div><div class='add'>+	if (merkle_pos &gt; inode-&gt;i_sb-&gt;s_maxbytes - pos - size)</div><div class='ctx'> 		return -EFBIG;</div><div class='ctx'> </div><div class='ctx'> 	return write_key_bytes(BTRFS_I(inode), BTRFS_VERITY_MERKLE_ITEM_KEY,</div><div class='del'>-			       off, buf, len);</div><div class='add'>+			       pos, buf, size);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct fsverity_operations btrfs_verityops = {</div><div class='add'>+	.inode_info_offs         = (int)offsetof(struct btrfs_inode, i_verity_info) -</div><div class='add'>+				   (int)offsetof(struct btrfs_inode, vfs_inode),</div><div class='ctx'> 	.begin_enable_verity     = btrfs_begin_enable_verity,</div><div class='ctx'> 	.end_enable_verity       = btrfs_end_enable_verity,</div><div class='ctx'> 	.get_verity_descriptor   = btrfs_get_verity_descriptor,</div><div class='head'>diff --git a/fs/btrfs/verity.h b/fs/btrfs/verity.h<br/>new file mode 100644<br/>index 000000000000..d696659e43e4<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/verity.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/verity.h</a></div><div class='hunk'>@@ -0,0 +1,35 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+</div><div class='add'>+#ifndef BTRFS_VERITY_H</div><div class='add'>+#define BTRFS_VERITY_H</div><div class='add'>+</div><div class='add'>+struct inode;</div><div class='add'>+struct btrfs_inode;</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_FS_VERITY</div><div class='add'>+</div><div class='add'>+#include &lt;linux/fsverity.h&gt;</div><div class='add'>+</div><div class='add'>+extern const struct fsverity_operations btrfs_verityops;</div><div class='add'>+</div><div class='add'>+int btrfs_drop_verity_items(struct btrfs_inode *inode);</div><div class='add'>+int btrfs_get_verity_descriptor(struct inode *inode, void *buf, size_t buf_size);</div><div class='add'>+</div><div class='add'>+#else</div><div class='add'>+</div><div class='add'>+#include &lt;linux/errno.h&gt;</div><div class='add'>+</div><div class='add'>+static inline int btrfs_drop_verity_items(struct btrfs_inode *inode)</div><div class='add'>+{</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int btrfs_get_verity_descriptor(struct inode *inode, void *buf,</div><div class='add'>+					      size_t buf_size)</div><div class='add'>+{</div><div class='add'>+	return -EPERM;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+#endif</div><div class='head'>diff --git a/fs/btrfs/volumes.c b/fs/btrfs/volumes.c<br/>index 61ac57bcbf1a..ae1742a35e76 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/volumes.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/volumes.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/volumes.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/volumes.c</a></div><div class='hunk'>@@ -5,27 +5,19 @@</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='ctx'> #include &lt;linux/sched/mm.h&gt;</div><div class='del'>-#include &lt;linux/bio.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='del'>-#include &lt;linux/blkdev.h&gt;</div><div class='ctx'> #include &lt;linux/ratelimit.h&gt;</div><div class='ctx'> #include &lt;linux/kthread.h&gt;</div><div class='del'>-#include &lt;linux/raid/pq.h&gt;</div><div class='ctx'> #include &lt;linux/semaphore.h&gt;</div><div class='ctx'> #include &lt;linux/uuid.h&gt;</div><div class='ctx'> #include &lt;linux/list_sort.h&gt;</div><div class='ctx'> #include &lt;linux/namei.h&gt;</div><div class='ctx'> #include "misc.h"</div><div class='del'>-#include "ctree.h"</div><div class='del'>-#include "extent_map.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='add'>+#include "extent-tree.h"</div><div class='ctx'> #include "transaction.h"</div><div class='del'>-#include "print-tree.h"</div><div class='ctx'> #include "volumes.h"</div><div class='ctx'> #include "raid56.h"</div><div class='del'>-#include "async-thread.h"</div><div class='del'>-#include "check-integrity.h"</div><div class='del'>-#include "rcu-string.h"</div><div class='ctx'> #include "dev-replace.h"</div><div class='ctx'> #include "sysfs.h"</div><div class='ctx'> #include "tree-checker.h"</div><div class='hunk'>@@ -33,6 +25,30 @@</div><div class='ctx'> #include "block-group.h"</div><div class='ctx'> #include "discard.h"</div><div class='ctx'> #include "zoned.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "uuid-tree.h"</div><div class='add'>+#include "ioctl.h"</div><div class='add'>+#include "relocation.h"</div><div class='add'>+#include "scrub.h"</div><div class='add'>+#include "super.h"</div><div class='add'>+#include "raid-stripe-tree.h"</div><div class='add'>+</div><div class='add'>+#define BTRFS_BLOCK_GROUP_STRIPE_MASK	(BTRFS_BLOCK_GROUP_RAID0 | \</div><div class='add'>+					 BTRFS_BLOCK_GROUP_RAID10 | \</div><div class='add'>+					 BTRFS_BLOCK_GROUP_RAID56_MASK)</div><div class='add'>+</div><div class='add'>+struct btrfs_io_geometry {</div><div class='add'>+	u32 stripe_index;</div><div class='add'>+	u32 stripe_nr;</div><div class='add'>+	int mirror_num;</div><div class='add'>+	int num_stripes;</div><div class='add'>+	u64 stripe_offset;</div><div class='add'>+	u64 raid56_full_stripe_start;</div><div class='add'>+	int max_errors;</div><div class='add'>+	enum btrfs_map_op op;</div><div class='add'>+	bool use_rst;</div><div class='add'>+};</div><div class='ctx'> </div><div class='ctx'> const struct btrfs_raid_attr btrfs_raid_array[BTRFS_NR_RAID_TYPES] = {</div><div class='ctx'> 	[BTRFS_RAID_RAID10] = {</div><div class='hunk'>@@ -160,24 +176,12 @@ const struct btrfs_raid_attr btrfs_raid_array[BTRFS_NR_RAID_TYPES] = {</div><div class='ctx'>  */</div><div class='ctx'> enum btrfs_raid_types __attribute_const__ btrfs_bg_flags_to_raid_index(u64 flags)</div><div class='ctx'> {</div><div class='del'>-	if (flags &amp; BTRFS_BLOCK_GROUP_RAID10)</div><div class='del'>-		return BTRFS_RAID_RAID10;</div><div class='del'>-	else if (flags &amp; BTRFS_BLOCK_GROUP_RAID1)</div><div class='del'>-		return BTRFS_RAID_RAID1;</div><div class='del'>-	else if (flags &amp; BTRFS_BLOCK_GROUP_RAID1C3)</div><div class='del'>-		return BTRFS_RAID_RAID1C3;</div><div class='del'>-	else if (flags &amp; BTRFS_BLOCK_GROUP_RAID1C4)</div><div class='del'>-		return BTRFS_RAID_RAID1C4;</div><div class='del'>-	else if (flags &amp; BTRFS_BLOCK_GROUP_DUP)</div><div class='del'>-		return BTRFS_RAID_DUP;</div><div class='del'>-	else if (flags &amp; BTRFS_BLOCK_GROUP_RAID0)</div><div class='del'>-		return BTRFS_RAID_RAID0;</div><div class='del'>-	else if (flags &amp; BTRFS_BLOCK_GROUP_RAID5)</div><div class='del'>-		return BTRFS_RAID_RAID5;</div><div class='del'>-	else if (flags &amp; BTRFS_BLOCK_GROUP_RAID6)</div><div class='del'>-		return BTRFS_RAID_RAID6;</div><div class='del'>-</div><div class='del'>-	return BTRFS_RAID_SINGLE; /* BTRFS_BLOCK_GROUP_SINGLE */</div><div class='add'>+	const u64 profile = (flags &amp; BTRFS_BLOCK_GROUP_PROFILE_MASK);</div><div class='add'>+</div><div class='add'>+	if (!profile)</div><div class='add'>+		return BTRFS_RAID_SINGLE;</div><div class='add'>+</div><div class='add'>+	return BTRFS_BG_FLAG_TO_INDEX(profile);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const char *btrfs_bg_type_to_raid_name(u64 flags)</div><div class='hunk'>@@ -190,6 +194,13 @@ const char *btrfs_bg_type_to_raid_name(u64 flags)</div><div class='ctx'> 	return btrfs_raid_array[index].raid_name;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+int btrfs_nr_parity_stripes(u64 type)</div><div class='add'>+{</div><div class='add'>+	enum btrfs_raid_types index = btrfs_bg_flags_to_raid_index(type);</div><div class='add'>+</div><div class='add'>+	return btrfs_raid_array[index].nparity;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Fill @buf with textual description of @bg_flags, no more than @size_buf</div><div class='ctx'>  * bytes including terminating null byte.</div><div class='hunk'>@@ -202,10 +213,8 @@ void btrfs_describe_block_groups(u64 bg_flags, char *buf, u32 size_buf)</div><div class='ctx'> 	u64 flags = bg_flags;</div><div class='ctx'> 	u32 size_bp = size_buf;</div><div class='ctx'> </div><div class='del'>-	if (!flags) {</div><div class='del'>-		strcpy(bp, "NONE");</div><div class='add'>+	if (!flags)</div><div class='ctx'> 		return;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> #define DESCRIBE_FLAG(flag, desc)						\</div><div class='ctx'> 	do {								\</div><div class='hunk'>@@ -246,13 +255,7 @@ out_overflow:;</div><div class='ctx'> </div><div class='ctx'> static int init_first_rw_device(struct btrfs_trans_handle *trans);</div><div class='ctx'> static int btrfs_relocate_sys_chunks(struct btrfs_fs_info *fs_info);</div><div class='del'>-static void btrfs_dev_stat_print_on_error(struct btrfs_device *dev);</div><div class='ctx'> static void btrfs_dev_stat_print_on_load(struct btrfs_device *device);</div><div class='del'>-static int __btrfs_map_block(struct btrfs_fs_info *fs_info,</div><div class='del'>-			     enum btrfs_map_op op,</div><div class='del'>-			     u64 logical, u64 *length,</div><div class='del'>-			     struct btrfs_io_context **bioc_ret,</div><div class='del'>-			     int mirror_num, int need_raid_map);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Device locking</div><div class='hunk'>@@ -362,16 +365,16 @@ struct list_head * __attribute_const__ btrfs_get_fs_uuids(void)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * alloc_fs_devices - allocate struct btrfs_fs_devices</div><div class='del'>- * @fsid:		if not NULL, copy the UUID to fs_devices::fsid</div><div class='del'>- * @metadata_fsid:	if not NULL, copy the UUID to fs_devices::metadata_fsid</div><div class='add'>+ * Allocate new btrfs_fs_devices structure identified by a fsid.</div><div class='add'>+ *</div><div class='add'>+ * @fsid:    if not NULL, copy the UUID to fs_devices::fsid and to</div><div class='add'>+ *           fs_devices::metadata_fsid</div><div class='ctx'>  *</div><div class='ctx'>  * Return a pointer to a new struct btrfs_fs_devices on success, or ERR_PTR().</div><div class='ctx'>  * The returned struct is not linked onto any lists and can be destroyed with</div><div class='ctx'>  * kfree() right away.</div><div class='ctx'>  */</div><div class='del'>-static struct btrfs_fs_devices *alloc_fs_devices(const u8 *fsid,</div><div class='del'>-						 const u8 *metadata_fsid)</div><div class='add'>+static struct btrfs_fs_devices *alloc_fs_devices(const u8 *fsid)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_devices *fs_devs;</div><div class='ctx'> </div><div class='hunk'>@@ -385,23 +388,24 @@ static struct btrfs_fs_devices *alloc_fs_devices(const u8 *fsid,</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;fs_devs-&gt;alloc_list);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;fs_devs-&gt;fs_list);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;fs_devs-&gt;seed_list);</div><div class='del'>-	if (fsid)</div><div class='del'>-		memcpy(fs_devs-&gt;fsid, fsid, BTRFS_FSID_SIZE);</div><div class='ctx'> </div><div class='del'>-	if (metadata_fsid)</div><div class='del'>-		memcpy(fs_devs-&gt;metadata_uuid, metadata_fsid, BTRFS_FSID_SIZE);</div><div class='del'>-	else if (fsid)</div><div class='add'>+	if (fsid) {</div><div class='add'>+		memcpy(fs_devs-&gt;fsid, fsid, BTRFS_FSID_SIZE);</div><div class='ctx'> 		memcpy(fs_devs-&gt;metadata_uuid, fsid, BTRFS_FSID_SIZE);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	return fs_devs;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_free_device(struct btrfs_device *device)</div><div class='add'>+static void btrfs_free_device(struct btrfs_device *device)</div><div class='ctx'> {</div><div class='ctx'> 	WARN_ON(!list_empty(&amp;device-&gt;post_commit_list));</div><div class='del'>-	rcu_string_free(device-&gt;name);</div><div class='del'>-	extent_io_tree_release(&amp;device-&gt;alloc_state);</div><div class='del'>-	bio_put(device-&gt;flush_bio);</div><div class='add'>+	/*</div><div class='add'>+	 * No need to call kfree_rcu() nor do RCU lock/unlock, nothing is</div><div class='add'>+	 * reading the device name.</div><div class='add'>+	 */</div><div class='add'>+	kfree(rcu_dereference_raw(device-&gt;name));</div><div class='add'>+	btrfs_extent_io_tree_release(&amp;device-&gt;alloc_state);</div><div class='ctx'> 	btrfs_destroy_dev_zone_info(device);</div><div class='ctx'> 	kfree(device);</div><div class='ctx'> }</div><div class='hunk'>@@ -409,10 +413,12 @@ void btrfs_free_device(struct btrfs_device *device)</div><div class='ctx'> static void free_fs_devices(struct btrfs_fs_devices *fs_devices)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_device *device;</div><div class='add'>+</div><div class='ctx'> 	WARN_ON(fs_devices-&gt;opened);</div><div class='add'>+	WARN_ON(fs_devices-&gt;holding);</div><div class='ctx'> 	while (!list_empty(&amp;fs_devices-&gt;devices)) {</div><div class='del'>-		device = list_entry(fs_devices-&gt;devices.next,</div><div class='del'>-				    struct btrfs_device, dev_list);</div><div class='add'>+		device = list_first_entry(&amp;fs_devices-&gt;devices,</div><div class='add'>+					  struct btrfs_device, dev_list);</div><div class='ctx'> 		list_del(&amp;device-&gt;dev_list);</div><div class='ctx'> 		btrfs_free_device(device);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -424,146 +430,110 @@ void __exit btrfs_cleanup_fs_uuids(void)</div><div class='ctx'> 	struct btrfs_fs_devices *fs_devices;</div><div class='ctx'> </div><div class='ctx'> 	while (!list_empty(&amp;fs_uuids)) {</div><div class='del'>-		fs_devices = list_entry(fs_uuids.next,</div><div class='del'>-					struct btrfs_fs_devices, fs_list);</div><div class='add'>+		fs_devices = list_first_entry(&amp;fs_uuids, struct btrfs_fs_devices,</div><div class='add'>+					      fs_list);</div><div class='ctx'> 		list_del(&amp;fs_devices-&gt;fs_list);</div><div class='ctx'> 		free_fs_devices(fs_devices);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline struct btrfs_fs_devices *find_fsid(</div><div class='del'>-		const u8 *fsid, const u8 *metadata_fsid)</div><div class='add'>+static bool match_fsid_fs_devices(const struct btrfs_fs_devices *fs_devices,</div><div class='add'>+				  const u8 *fsid, const u8 *metadata_fsid)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_devices *fs_devices;</div><div class='add'>+	if (memcmp(fsid, fs_devices-&gt;fsid, BTRFS_FSID_SIZE) != 0)</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-	ASSERT(fsid);</div><div class='add'>+	if (!metadata_fsid)</div><div class='add'>+		return true;</div><div class='ctx'> </div><div class='del'>-	/* Handle non-split brain cases */</div><div class='del'>-	list_for_each_entry(fs_devices, &amp;fs_uuids, fs_list) {</div><div class='del'>-		if (metadata_fsid) {</div><div class='del'>-			if (memcmp(fsid, fs_devices-&gt;fsid, BTRFS_FSID_SIZE) == 0</div><div class='del'>-			    &amp;&amp; memcmp(metadata_fsid, fs_devices-&gt;metadata_uuid,</div><div class='del'>-				      BTRFS_FSID_SIZE) == 0)</div><div class='del'>-				return fs_devices;</div><div class='del'>-		} else {</div><div class='del'>-			if (memcmp(fsid, fs_devices-&gt;fsid, BTRFS_FSID_SIZE) == 0)</div><div class='del'>-				return fs_devices;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	return NULL;</div><div class='add'>+	if (memcmp(metadata_fsid, fs_devices-&gt;metadata_uuid, BTRFS_FSID_SIZE) != 0)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct btrfs_fs_devices *find_fsid_with_metadata_uuid(</div><div class='del'>-				struct btrfs_super_block *disk_super)</div><div class='add'>+static noinline struct btrfs_fs_devices *find_fsid(</div><div class='add'>+		const u8 *fsid, const u8 *metadata_fsid)</div><div class='ctx'> {</div><div class='del'>-</div><div class='ctx'> 	struct btrfs_fs_devices *fs_devices;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Handle scanned device having completed its fsid change but</div><div class='del'>-	 * belonging to a fs_devices that was created by first scanning</div><div class='del'>-	 * a device which didn't have its fsid/metadata_uuid changed</div><div class='del'>-	 * at all and the CHANGING_FSID_V2 flag set.</div><div class='del'>-	 */</div><div class='del'>-	list_for_each_entry(fs_devices, &amp;fs_uuids, fs_list) {</div><div class='del'>-		if (fs_devices-&gt;fsid_change &amp;&amp;</div><div class='del'>-		    memcmp(disk_super-&gt;metadata_uuid, fs_devices-&gt;fsid,</div><div class='del'>-			   BTRFS_FSID_SIZE) == 0 &amp;&amp;</div><div class='del'>-		    memcmp(fs_devices-&gt;fsid, fs_devices-&gt;metadata_uuid,</div><div class='del'>-			   BTRFS_FSID_SIZE) == 0) {</div><div class='del'>-			return fs_devices;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	/*</div><div class='del'>-	 * Handle scanned device having completed its fsid change but</div><div class='del'>-	 * belonging to a fs_devices that was created by a device that</div><div class='del'>-	 * has an outdated pair of fsid/metadata_uuid and</div><div class='del'>-	 * CHANGING_FSID_V2 flag set.</div><div class='del'>-	 */</div><div class='add'>+	ASSERT(fsid);</div><div class='add'>+</div><div class='add'>+	/* Handle non-split brain cases */</div><div class='ctx'> 	list_for_each_entry(fs_devices, &amp;fs_uuids, fs_list) {</div><div class='del'>-		if (fs_devices-&gt;fsid_change &amp;&amp;</div><div class='del'>-		    memcmp(fs_devices-&gt;metadata_uuid,</div><div class='del'>-			   fs_devices-&gt;fsid, BTRFS_FSID_SIZE) != 0 &amp;&amp;</div><div class='del'>-		    memcmp(disk_super-&gt;metadata_uuid, fs_devices-&gt;metadata_uuid,</div><div class='del'>-			   BTRFS_FSID_SIZE) == 0) {</div><div class='add'>+		if (match_fsid_fs_devices(fs_devices, fsid, metadata_fsid))</div><div class='ctx'> 			return fs_devices;</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	return find_fsid(disk_super-&gt;fsid, disk_super-&gt;metadata_uuid);</div><div class='add'>+	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-</div><div class='ctx'> static int</div><div class='del'>-btrfs_get_bdev_and_sb(const char *device_path, fmode_t flags, void *holder,</div><div class='del'>-		      int flush, struct block_device **bdev,</div><div class='add'>+btrfs_get_bdev_and_sb(const char *device_path, blk_mode_t flags, void *holder,</div><div class='add'>+		      int flush, struct file **bdev_file,</div><div class='ctx'> 		      struct btrfs_super_block **disk_super)</div><div class='ctx'> {</div><div class='add'>+	struct block_device *bdev;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	*bdev = blkdev_get_by_path(device_path, flags, holder);</div><div class='add'>+	*bdev_file = bdev_file_open_by_path(device_path, flags, holder, &amp;fs_holder_ops);</div><div class='ctx'> </div><div class='del'>-	if (IS_ERR(*bdev)) {</div><div class='del'>-		ret = PTR_ERR(*bdev);</div><div class='add'>+	if (IS_ERR(*bdev_file)) {</div><div class='add'>+		ret = PTR_ERR(*bdev_file);</div><div class='add'>+		btrfs_err(NULL, "failed to open device for path %s with flags 0x%x: %d",</div><div class='add'>+			  device_path, flags, ret);</div><div class='ctx'> 		goto error;</div><div class='ctx'> 	}</div><div class='add'>+	bdev = file_bdev(*bdev_file);</div><div class='ctx'> </div><div class='ctx'> 	if (flush)</div><div class='del'>-		sync_blockdev(*bdev);</div><div class='del'>-	ret = set_blocksize(*bdev, BTRFS_BDEV_BLOCKSIZE);</div><div class='del'>-	if (ret) {</div><div class='del'>-		blkdev_put(*bdev, flags);</div><div class='del'>-		goto error;</div><div class='add'>+		sync_blockdev(bdev);</div><div class='add'>+	if (holder) {</div><div class='add'>+		ret = set_blocksize(*bdev_file, BTRFS_BDEV_BLOCKSIZE);</div><div class='add'>+		if (ret) {</div><div class='add'>+			bdev_fput(*bdev_file);</div><div class='add'>+			goto error;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='del'>-	invalidate_bdev(*bdev);</div><div class='del'>-	*disk_super = btrfs_read_dev_super(*bdev);</div><div class='add'>+	invalidate_bdev(bdev);</div><div class='add'>+	*disk_super = btrfs_read_disk_super(bdev, 0, false);</div><div class='ctx'> 	if (IS_ERR(*disk_super)) {</div><div class='ctx'> 		ret = PTR_ERR(*disk_super);</div><div class='del'>-		blkdev_put(*bdev, flags);</div><div class='add'>+		bdev_fput(*bdev_file);</div><div class='ctx'> 		goto error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> error:</div><div class='del'>-	*bdev = NULL;</div><div class='add'>+	*disk_super = NULL;</div><div class='add'>+	*bdev_file = NULL;</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool device_path_matched(const char *path, struct btrfs_device *device)</div><div class='del'>-{</div><div class='del'>-	int found;</div><div class='del'>-</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	found = strcmp(rcu_str_deref(device-&gt;name), path);</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-</div><div class='del'>-	return found == 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='del'>- *  Search and remove all stale (devices which are not mounted) devices.</div><div class='del'>- *  When both inputs are NULL, it will search and release all stale devices.</div><div class='del'>- *  path:	Optional. When provided will it release all unmounted devices</div><div class='del'>- *		matching this path only.</div><div class='del'>- *  skip_dev:	Optional. Will skip this device when searching for the stale</div><div class='del'>- *		devices.</div><div class='del'>- *  Return:	0 for success or if @path is NULL.</div><div class='del'>- * 		-EBUSY if @path is a mounted device.</div><div class='del'>- * 		-ENOENT if @path does not match any device in the list.</div><div class='add'>+ *  Search and remove all stale devices (which are not mounted).  When both</div><div class='add'>+ *  inputs are NULL, it will search and release all stale devices.</div><div class='add'>+ *</div><div class='add'>+ *  @devt:         Optional. When provided will it release all unmounted devices</div><div class='add'>+ *                 matching this devt only.</div><div class='add'>+ *  @skip_device:  Optional. Will skip this device when searching for the stale</div><div class='add'>+ *                 devices.</div><div class='add'>+ *</div><div class='add'>+ *  Return:	0 for success or if @devt is 0.</div><div class='add'>+ *		-EBUSY if @devt is a mounted device.</div><div class='add'>+ *		-ENOENT if @devt does not match any device in the list.</div><div class='ctx'>  */</div><div class='del'>-static int btrfs_free_stale_devices(const char *path,</div><div class='del'>-				     struct btrfs_device *skip_device)</div><div class='add'>+static int btrfs_free_stale_devices(dev_t devt, struct btrfs_device *skip_device)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_devices *fs_devices, *tmp_fs_devices;</div><div class='ctx'> 	struct btrfs_device *device, *tmp_device;</div><div class='del'>-	int ret = 0;</div><div class='add'>+	int ret;</div><div class='add'>+	bool freed = false;</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;uuid_mutex);</div><div class='ctx'> </div><div class='del'>-	if (path)</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-</div><div class='add'>+	/* Return good status if there is no instance of devt. */</div><div class='add'>+	ret = 0;</div><div class='ctx'> 	list_for_each_entry_safe(fs_devices, tmp_fs_devices, &amp;fs_uuids, fs_list) {</div><div class='ctx'> </div><div class='ctx'> 		mutex_lock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='hunk'>@@ -571,13 +541,10 @@ static int btrfs_free_stale_devices(const char *path,</div><div class='ctx'> 					 &amp;fs_devices-&gt;devices, dev_list) {</div><div class='ctx'> 			if (skip_device &amp;&amp; skip_device == device)</div><div class='ctx'> 				continue;</div><div class='del'>-			if (path &amp;&amp; !device-&gt;name)</div><div class='del'>-				continue;</div><div class='del'>-			if (path &amp;&amp; !device_path_matched(path, device))</div><div class='add'>+			if (devt &amp;&amp; devt != device-&gt;devt)</div><div class='ctx'> 				continue;</div><div class='del'>-			if (fs_devices-&gt;opened) {</div><div class='del'>-				/* for an already deleted device return 0 */</div><div class='del'>-				if (path &amp;&amp; ret != 0)</div><div class='add'>+			if (fs_devices-&gt;opened || fs_devices-&gt;holding) {</div><div class='add'>+				if (devt)</div><div class='ctx'> 					ret = -EBUSY;</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -587,7 +554,7 @@ static int btrfs_free_stale_devices(const char *path,</div><div class='ctx'> 			list_del(&amp;device-&gt;dev_list);</div><div class='ctx'> 			btrfs_free_device(device);</div><div class='ctx'> </div><div class='del'>-			ret = 0;</div><div class='add'>+			freed = true;</div><div class='ctx'> 		}</div><div class='ctx'> 		mutex_unlock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='ctx'> </div><div class='hunk'>@@ -598,20 +565,91 @@ static int btrfs_free_stale_devices(const char *path,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/* If there is at least one freed device return 0. */</div><div class='add'>+	if (freed)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static struct btrfs_fs_devices *find_fsid_by_device(</div><div class='add'>+					struct btrfs_super_block *disk_super,</div><div class='add'>+					dev_t devt, bool *same_fsid_diff_dev)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_devices *fsid_fs_devices;</div><div class='add'>+	struct btrfs_fs_devices *devt_fs_devices;</div><div class='add'>+	const bool has_metadata_uuid = (btrfs_super_incompat_flags(disk_super) &amp;</div><div class='add'>+					BTRFS_FEATURE_INCOMPAT_METADATA_UUID);</div><div class='add'>+	bool found_by_devt = false;</div><div class='add'>+</div><div class='add'>+	/* Find the fs_device by the usual method, if found use it. */</div><div class='add'>+	fsid_fs_devices = find_fsid(disk_super-&gt;fsid,</div><div class='add'>+		    has_metadata_uuid ? disk_super-&gt;metadata_uuid : NULL);</div><div class='add'>+</div><div class='add'>+	/* The temp_fsid feature is supported only with single device filesystem. */</div><div class='add'>+	if (btrfs_super_num_devices(disk_super) != 1)</div><div class='add'>+		return fsid_fs_devices;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * A seed device is an integral component of the sprout device, which</div><div class='add'>+	 * functions as a multi-device filesystem. So, temp-fsid feature is</div><div class='add'>+	 * not supported.</div><div class='add'>+	 */</div><div class='add'>+	if (btrfs_super_flags(disk_super) &amp; BTRFS_SUPER_FLAG_SEEDING)</div><div class='add'>+		return fsid_fs_devices;</div><div class='add'>+</div><div class='add'>+	/* Try to find a fs_devices by matching devt. */</div><div class='add'>+	list_for_each_entry(devt_fs_devices, &amp;fs_uuids, fs_list) {</div><div class='add'>+		struct btrfs_device *device;</div><div class='add'>+</div><div class='add'>+		list_for_each_entry(device, &amp;devt_fs_devices-&gt;devices, dev_list) {</div><div class='add'>+			if (device-&gt;devt == devt) {</div><div class='add'>+				found_by_devt = true;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+		if (found_by_devt)</div><div class='add'>+			break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (found_by_devt) {</div><div class='add'>+		/* Existing device. */</div><div class='add'>+		if (fsid_fs_devices == NULL) {</div><div class='add'>+			if (devt_fs_devices-&gt;opened == 0) {</div><div class='add'>+				/* Stale device. */</div><div class='add'>+				return NULL;</div><div class='add'>+			} else {</div><div class='add'>+				/* temp_fsid is mounting a subvol. */</div><div class='add'>+				return devt_fs_devices;</div><div class='add'>+			}</div><div class='add'>+		} else {</div><div class='add'>+			/* Regular or temp_fsid device mounting a subvol. */</div><div class='add'>+			return devt_fs_devices;</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		/* New device. */</div><div class='add'>+		if (fsid_fs_devices == NULL) {</div><div class='add'>+			return NULL;</div><div class='add'>+		} else {</div><div class='add'>+			/* sb::fsid is already used create a new temp_fsid. */</div><div class='add'>+			*same_fsid_diff_dev = true;</div><div class='add'>+			return NULL;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Not reached. */</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * This is only used on mount, and we are protected from competing things</div><div class='ctx'>  * messing with our fs_devices by the uuid_mutex, thus we do not need the</div><div class='ctx'>  * fs_devices-&gt;device_list_mutex here.</div><div class='ctx'>  */</div><div class='ctx'> static int btrfs_open_one_device(struct btrfs_fs_devices *fs_devices,</div><div class='del'>-			struct btrfs_device *device, fmode_t flags,</div><div class='add'>+			struct btrfs_device *device, blk_mode_t flags,</div><div class='ctx'> 			void *holder)</div><div class='ctx'> {</div><div class='del'>-	struct request_queue *q;</div><div class='del'>-	struct block_device *bdev;</div><div class='add'>+	struct file *bdev_file;</div><div class='ctx'> 	struct btrfs_super_block *disk_super;</div><div class='ctx'> 	u64 devid;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -621,8 +659,8 @@ static int btrfs_open_one_device(struct btrfs_fs_devices *fs_devices,</div><div class='ctx'> 	if (!device-&gt;name)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_get_bdev_and_sb(device-&gt;name-&gt;str, flags, holder, 1,</div><div class='del'>-				    &amp;bdev, &amp;disk_super);</div><div class='add'>+	ret = btrfs_get_bdev_and_sb(rcu_dereference_raw(device-&gt;name), flags, holder, 1,</div><div class='add'>+				    &amp;bdev_file, &amp;disk_super);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='hunk'>@@ -638,27 +676,39 @@ static int btrfs_open_one_device(struct btrfs_fs_devices *fs_devices,</div><div class='ctx'> 	if (btrfs_super_flags(disk_super) &amp; BTRFS_SUPER_FLAG_SEEDING) {</div><div class='ctx'> 		if (btrfs_super_incompat_flags(disk_super) &amp;</div><div class='ctx'> 		    BTRFS_FEATURE_INCOMPAT_METADATA_UUID) {</div><div class='del'>-			pr_err(</div><div class='del'>-		"BTRFS: Invalid seeding and uuid-changed device detected\n");</div><div class='add'>+			btrfs_err(NULL,</div><div class='add'>+				  "invalid seeding and uuid-changed device detected");</div><div class='ctx'> 			goto error_free_page;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		clear_bit(BTRFS_DEV_STATE_WRITEABLE, &amp;device-&gt;dev_state);</div><div class='ctx'> 		fs_devices-&gt;seeding = true;</div><div class='ctx'> 	} else {</div><div class='del'>-		if (bdev_read_only(bdev))</div><div class='add'>+		if (bdev_read_only(file_bdev(bdev_file)))</div><div class='ctx'> 			clear_bit(BTRFS_DEV_STATE_WRITEABLE, &amp;device-&gt;dev_state);</div><div class='ctx'> 		else</div><div class='ctx'> 			set_bit(BTRFS_DEV_STATE_WRITEABLE, &amp;device-&gt;dev_state);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	q = bdev_get_queue(bdev);</div><div class='del'>-	if (!blk_queue_nonrot(q))</div><div class='add'>+	if (!bdev_nonrot(file_bdev(bdev_file)))</div><div class='ctx'> 		fs_devices-&gt;rotating = true;</div><div class='ctx'> </div><div class='del'>-	device-&gt;bdev = bdev;</div><div class='add'>+	if (bdev_max_discard_sectors(file_bdev(bdev_file)))</div><div class='add'>+		fs_devices-&gt;discardable = true;</div><div class='add'>+</div><div class='add'>+	device-&gt;bdev_file = bdev_file;</div><div class='add'>+	device-&gt;bdev = file_bdev(bdev_file);</div><div class='ctx'> 	clear_bit(BTRFS_DEV_STATE_IN_FS_METADATA, &amp;device-&gt;dev_state);</div><div class='del'>-	device-&gt;mode = flags;</div><div class='add'>+</div><div class='add'>+	if (device-&gt;devt != device-&gt;bdev-&gt;bd_dev) {</div><div class='add'>+		btrfs_warn(NULL,</div><div class='add'>+			   "device %s maj:min changed from %d:%d to %d:%d",</div><div class='add'>+			   rcu_dereference_raw(device-&gt;name), MAJOR(device-&gt;devt),</div><div class='add'>+			   MINOR(device-&gt;devt), MAJOR(device-&gt;bdev-&gt;bd_dev),</div><div class='add'>+			   MINOR(device-&gt;bdev-&gt;bd_dev));</div><div class='add'>+</div><div class='add'>+		device-&gt;devt = device-&gt;bdev-&gt;bd_dev;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	fs_devices-&gt;open_devices++;</div><div class='ctx'> 	if (test_bit(BTRFS_DEV_STATE_WRITEABLE, &amp;device-&gt;dev_state) &amp;&amp;</div><div class='hunk'>@@ -672,95 +722,54 @@ static int btrfs_open_one_device(struct btrfs_fs_devices *fs_devices,</div><div class='ctx'> </div><div class='ctx'> error_free_page:</div><div class='ctx'> 	btrfs_release_disk_super(disk_super);</div><div class='del'>-	blkdev_put(bdev, flags);</div><div class='add'>+	bdev_fput(bdev_file);</div><div class='ctx'> </div><div class='ctx'> 	return -EINVAL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Handle scanned device having its CHANGING_FSID_V2 flag set and the fs_devices</div><div class='del'>- * being created with a disk that has already completed its fsid change. Such</div><div class='del'>- * disk can belong to an fs which has its FSID changed or to one which doesn't.</div><div class='del'>- * Handle both cases here.</div><div class='del'>- */</div><div class='del'>-static struct btrfs_fs_devices *find_fsid_inprogress(</div><div class='del'>-					struct btrfs_super_block *disk_super)</div><div class='add'>+const u8 *btrfs_sb_fsid_ptr(const struct btrfs_super_block *sb)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_devices *fs_devices;</div><div class='add'>+	bool has_metadata_uuid = (btrfs_super_incompat_flags(sb) &amp;</div><div class='add'>+				  BTRFS_FEATURE_INCOMPAT_METADATA_UUID);</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry(fs_devices, &amp;fs_uuids, fs_list) {</div><div class='del'>-		if (memcmp(fs_devices-&gt;metadata_uuid, fs_devices-&gt;fsid,</div><div class='del'>-			   BTRFS_FSID_SIZE) != 0 &amp;&amp;</div><div class='del'>-		    memcmp(fs_devices-&gt;metadata_uuid, disk_super-&gt;fsid,</div><div class='del'>-			   BTRFS_FSID_SIZE) == 0 &amp;&amp; !fs_devices-&gt;fsid_change) {</div><div class='del'>-			return fs_devices;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return find_fsid(disk_super-&gt;fsid, NULL);</div><div class='add'>+	return has_metadata_uuid ? sb-&gt;metadata_uuid : sb-&gt;fsid;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-</div><div class='del'>-static struct btrfs_fs_devices *find_fsid_changed(</div><div class='del'>-					struct btrfs_super_block *disk_super)</div><div class='add'>+static bool is_same_device(struct btrfs_device *device, const char *new_path)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_devices *fs_devices;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Handles the case where scanned device is part of an fs that had</div><div class='del'>-	 * multiple successful changes of FSID but currently device didn't</div><div class='del'>-	 * observe it. Meaning our fsid will be different than theirs. We need</div><div class='del'>-	 * to handle two subcases :</div><div class='del'>-	 *  1 - The fs still continues to have different METADATA/FSID uuids.</div><div class='del'>-	 *  2 - The fs is switched back to its original FSID (METADATA/FSID</div><div class='del'>-	 *  are equal).</div><div class='del'>-	 */</div><div class='del'>-	list_for_each_entry(fs_devices, &amp;fs_uuids, fs_list) {</div><div class='del'>-		/* Changed UUIDs */</div><div class='del'>-		if (memcmp(fs_devices-&gt;metadata_uuid, fs_devices-&gt;fsid,</div><div class='del'>-			   BTRFS_FSID_SIZE) != 0 &amp;&amp;</div><div class='del'>-		    memcmp(fs_devices-&gt;metadata_uuid, disk_super-&gt;metadata_uuid,</div><div class='del'>-			   BTRFS_FSID_SIZE) == 0 &amp;&amp;</div><div class='del'>-		    memcmp(fs_devices-&gt;fsid, disk_super-&gt;fsid,</div><div class='del'>-			   BTRFS_FSID_SIZE) != 0)</div><div class='del'>-			return fs_devices;</div><div class='del'>-</div><div class='del'>-		/* Unchanged UUIDs */</div><div class='del'>-		if (memcmp(fs_devices-&gt;metadata_uuid, fs_devices-&gt;fsid,</div><div class='del'>-			   BTRFS_FSID_SIZE) == 0 &amp;&amp;</div><div class='del'>-		    memcmp(fs_devices-&gt;fsid, disk_super-&gt;metadata_uuid,</div><div class='del'>-			   BTRFS_FSID_SIZE) == 0)</div><div class='del'>-			return fs_devices;</div><div class='del'>-	}</div><div class='add'>+	struct path old = { .mnt = NULL, .dentry = NULL };</div><div class='add'>+	struct path new = { .mnt = NULL, .dentry = NULL };</div><div class='add'>+	char AUTO_KFREE(old_path);</div><div class='add'>+	bool is_same = false;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='add'>+	if (!device-&gt;name)</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='del'>-static struct btrfs_fs_devices *find_fsid_reverted_metadata(</div><div class='del'>-				struct btrfs_super_block *disk_super)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_devices *fs_devices;</div><div class='add'>+	old_path = kzalloc(PATH_MAX, GFP_NOFS);</div><div class='add'>+	if (!old_path)</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Handle the case where the scanned device is part of an fs whose last</div><div class='del'>-	 * metadata UUID change reverted it to the original FSID. At the same</div><div class='del'>-	 * time * fs_devices was first created by another constitutent device</div><div class='del'>-	 * which didn't fully observe the operation. This results in an</div><div class='del'>-	 * btrfs_fs_devices created with metadata/fsid different AND</div><div class='del'>-	 * btrfs_fs_devices::fsid_change set AND the metadata_uuid of the</div><div class='del'>-	 * fs_devices equal to the FSID of the disk.</div><div class='del'>-	 */</div><div class='del'>-	list_for_each_entry(fs_devices, &amp;fs_uuids, fs_list) {</div><div class='del'>-		if (memcmp(fs_devices-&gt;fsid, fs_devices-&gt;metadata_uuid,</div><div class='del'>-			   BTRFS_FSID_SIZE) != 0 &amp;&amp;</div><div class='del'>-		    memcmp(fs_devices-&gt;metadata_uuid, disk_super-&gt;fsid,</div><div class='del'>-			   BTRFS_FSID_SIZE) == 0 &amp;&amp;</div><div class='del'>-		    fs_devices-&gt;fsid_change)</div><div class='del'>-			return fs_devices;</div><div class='del'>-	}</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	ret = strscpy(old_path, rcu_dereference(device-&gt;name), PATH_MAX);</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='del'>-	return NULL;</div><div class='add'>+	ret = kern_path(old_path, LOOKUP_FOLLOW, &amp;old);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+	ret = kern_path(new_path, LOOKUP_FOLLOW, &amp;new);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+	if (path_equal(&amp;old, &amp;new))</div><div class='add'>+		is_same = true;</div><div class='add'>+out:</div><div class='add'>+	path_put(&amp;old);</div><div class='add'>+	path_put(&amp;new);</div><div class='add'>+	return is_same;</div><div class='ctx'> }</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Add new device to list of registered devices</div><div class='ctx'>  *</div><div class='hunk'>@@ -774,39 +783,47 @@ static noinline struct btrfs_device *device_list_add(const char *path,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_device *device;</div><div class='ctx'> 	struct btrfs_fs_devices *fs_devices = NULL;</div><div class='del'>-	struct rcu_string *name;</div><div class='add'>+	const char *name;</div><div class='ctx'> 	u64 found_transid = btrfs_super_generation(disk_super);</div><div class='ctx'> 	u64 devid = btrfs_stack_device_id(&amp;disk_super-&gt;dev_item);</div><div class='add'>+	dev_t path_devt;</div><div class='add'>+	int ret;</div><div class='add'>+	bool same_fsid_diff_dev = false;</div><div class='ctx'> 	bool has_metadata_uuid = (btrfs_super_incompat_flags(disk_super) &amp;</div><div class='ctx'> 		BTRFS_FEATURE_INCOMPAT_METADATA_UUID);</div><div class='del'>-	bool fsid_change_in_progress = (btrfs_super_flags(disk_super) &amp;</div><div class='del'>-					BTRFS_SUPER_FLAG_CHANGING_FSID_V2);</div><div class='ctx'> </div><div class='del'>-	if (fsid_change_in_progress) {</div><div class='del'>-		if (!has_metadata_uuid)</div><div class='del'>-			fs_devices = find_fsid_inprogress(disk_super);</div><div class='del'>-		else</div><div class='del'>-			fs_devices = find_fsid_changed(disk_super);</div><div class='del'>-	} else if (has_metadata_uuid) {</div><div class='del'>-		fs_devices = find_fsid_with_metadata_uuid(disk_super);</div><div class='del'>-	} else {</div><div class='del'>-		fs_devices = find_fsid_reverted_metadata(disk_super);</div><div class='del'>-		if (!fs_devices)</div><div class='del'>-			fs_devices = find_fsid(disk_super-&gt;fsid, NULL);</div><div class='add'>+	if (btrfs_super_flags(disk_super) &amp; BTRFS_SUPER_FLAG_CHANGING_FSID_V2) {</div><div class='add'>+		btrfs_err(NULL,</div><div class='add'>+"device %s has incomplete metadata_uuid change, please use btrfstune to complete",</div><div class='add'>+			  path);</div><div class='add'>+		return ERR_PTR(-EAGAIN);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	ret = lookup_bdev(path, &amp;path_devt);</div><div class='add'>+	if (ret) {</div><div class='add'>+		btrfs_err(NULL, "failed to lookup block device for path %s: %d",</div><div class='add'>+			  path, ret);</div><div class='add'>+		return ERR_PTR(ret);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (!fs_devices) {</div><div class='del'>-		if (has_metadata_uuid)</div><div class='del'>-			fs_devices = alloc_fs_devices(disk_super-&gt;fsid,</div><div class='del'>-						      disk_super-&gt;metadata_uuid);</div><div class='del'>-		else</div><div class='del'>-			fs_devices = alloc_fs_devices(disk_super-&gt;fsid, NULL);</div><div class='add'>+	fs_devices = find_fsid_by_device(disk_super, path_devt, &amp;same_fsid_diff_dev);</div><div class='ctx'> </div><div class='add'>+	if (!fs_devices) {</div><div class='add'>+		fs_devices = alloc_fs_devices(disk_super-&gt;fsid);</div><div class='ctx'> 		if (IS_ERR(fs_devices))</div><div class='ctx'> 			return ERR_CAST(fs_devices);</div><div class='ctx'> </div><div class='del'>-		fs_devices-&gt;fsid_change = fsid_change_in_progress;</div><div class='add'>+		if (has_metadata_uuid)</div><div class='add'>+			memcpy(fs_devices-&gt;metadata_uuid,</div><div class='add'>+			       disk_super-&gt;metadata_uuid, BTRFS_FSID_SIZE);</div><div class='add'>+</div><div class='add'>+		if (same_fsid_diff_dev) {</div><div class='add'>+			generate_random_uuid(fs_devices-&gt;fsid);</div><div class='add'>+			fs_devices-&gt;temp_fsid = true;</div><div class='add'>+			btrfs_info(NULL, "device %s (%d:%d) using temp-fsid %pU",</div><div class='add'>+				path, MAJOR(path_devt), MINOR(path_devt),</div><div class='add'>+				fs_devices-&gt;fsid);</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		mutex_lock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='ctx'> 		list_add(&amp;fs_devices-&gt;fs_list, &amp;fs_uuids);</div><div class='hunk'>@@ -821,49 +838,38 @@ static noinline struct btrfs_device *device_list_add(const char *path,</div><div class='ctx'> 		mutex_lock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='ctx'> 		device = btrfs_find_device(fs_devices, &amp;args);</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * If this disk has been pulled into an fs devices created by</div><div class='del'>-		 * a device which had the CHANGING_FSID_V2 flag then replace the</div><div class='del'>-		 * metadata_uuid/fsid values of the fs_devices.</div><div class='del'>-		 */</div><div class='del'>-		if (fs_devices-&gt;fsid_change &amp;&amp;</div><div class='del'>-		    found_transid &gt; fs_devices-&gt;latest_generation) {</div><div class='add'>+		if (found_transid &gt; fs_devices-&gt;latest_generation) {</div><div class='ctx'> 			memcpy(fs_devices-&gt;fsid, disk_super-&gt;fsid,</div><div class='ctx'> 					BTRFS_FSID_SIZE);</div><div class='del'>-</div><div class='del'>-			if (has_metadata_uuid)</div><div class='del'>-				memcpy(fs_devices-&gt;metadata_uuid,</div><div class='del'>-				       disk_super-&gt;metadata_uuid,</div><div class='del'>-				       BTRFS_FSID_SIZE);</div><div class='del'>-			else</div><div class='del'>-				memcpy(fs_devices-&gt;metadata_uuid,</div><div class='del'>-				       disk_super-&gt;fsid, BTRFS_FSID_SIZE);</div><div class='del'>-</div><div class='del'>-			fs_devices-&gt;fsid_change = false;</div><div class='add'>+			memcpy(fs_devices-&gt;metadata_uuid,</div><div class='add'>+			       btrfs_sb_fsid_ptr(disk_super), BTRFS_FSID_SIZE);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!device) {</div><div class='add'>+		unsigned int nofs_flag;</div><div class='add'>+</div><div class='ctx'> 		if (fs_devices-&gt;opened) {</div><div class='add'>+			btrfs_err(NULL,</div><div class='add'>+"device %s (%d:%d) belongs to fsid %pU, and the fs is already mounted, scanned by %s (%d)",</div><div class='add'>+				  path, MAJOR(path_devt), MINOR(path_devt),</div><div class='add'>+				  fs_devices-&gt;fsid, current-&gt;comm,</div><div class='add'>+				  task_pid_nr(current));</div><div class='ctx'> 			mutex_unlock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='ctx'> 			return ERR_PTR(-EBUSY);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		nofs_flag = memalloc_nofs_save();</div><div class='ctx'> 		device = btrfs_alloc_device(NULL, &amp;devid,</div><div class='del'>-					    disk_super-&gt;dev_item.uuid);</div><div class='add'>+					    disk_super-&gt;dev_item.uuid, path);</div><div class='add'>+		memalloc_nofs_restore(nofs_flag);</div><div class='ctx'> 		if (IS_ERR(device)) {</div><div class='ctx'> 			mutex_unlock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='ctx'> 			/* we can safely leave the fs_devices entry around */</div><div class='ctx'> 			return device;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		name = rcu_string_strdup(path, GFP_NOFS);</div><div class='del'>-		if (!name) {</div><div class='del'>-			btrfs_free_device(device);</div><div class='del'>-			mutex_unlock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='del'>-			return ERR_PTR(-ENOMEM);</div><div class='del'>-		}</div><div class='del'>-		rcu_assign_pointer(device-&gt;name, name);</div><div class='add'>+		device-&gt;devt = path_devt;</div><div class='ctx'> </div><div class='ctx'> 		list_add_rcu(&amp;device-&gt;dev_list, &amp;fs_devices-&gt;devices);</div><div class='ctx'> 		fs_devices-&gt;num_devices++;</div><div class='hunk'>@@ -873,16 +879,20 @@ static noinline struct btrfs_device *device_list_add(const char *path,</div><div class='ctx'> </div><div class='ctx'> 		if (disk_super-&gt;label[0])</div><div class='ctx'> 			pr_info(</div><div class='del'>-	"BTRFS: device label %s devid %llu transid %llu %s scanned by %s (%d)\n",</div><div class='add'>+"BTRFS: device label %s devid %llu transid %llu %s (%d:%d) scanned by %s (%d)\n",</div><div class='ctx'> 				disk_super-&gt;label, devid, found_transid, path,</div><div class='add'>+				MAJOR(path_devt), MINOR(path_devt),</div><div class='ctx'> 				current-&gt;comm, task_pid_nr(current));</div><div class='ctx'> 		else</div><div class='ctx'> 			pr_info(</div><div class='del'>-	"BTRFS: device fsid %pU devid %llu transid %llu %s scanned by %s (%d)\n",</div><div class='add'>+"BTRFS: device fsid %pU devid %llu transid %llu %s (%d:%d) scanned by %s (%d)\n",</div><div class='ctx'> 				disk_super-&gt;fsid, devid, found_transid, path,</div><div class='add'>+				MAJOR(path_devt), MINOR(path_devt),</div><div class='ctx'> 				current-&gt;comm, task_pid_nr(current));</div><div class='ctx'> </div><div class='del'>-	} else if (!device-&gt;name || strcmp(device-&gt;name-&gt;str, path)) {</div><div class='add'>+	} else if (!device-&gt;name || !is_same_device(device, path)) {</div><div class='add'>+		const char *old_name;</div><div class='add'>+</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * When FS is already mounted.</div><div class='ctx'> 		 * 1. If you are here and if the device-&gt;name is NULL that</div><div class='hunk'>@@ -918,56 +928,54 @@ static noinline struct btrfs_device *device_list_add(const char *path,</div><div class='ctx'> 			 * generation are equal.</div><div class='ctx'> 			 */</div><div class='ctx'> 			mutex_unlock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='add'>+			btrfs_err(NULL,</div><div class='add'>+"device %s already registered with a higher generation, found %llu expect %llu",</div><div class='add'>+				  path, found_transid, device-&gt;generation);</div><div class='ctx'> 			return ERR_PTR(-EEXIST);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We are going to replace the device path for a given devid,</div><div class='ctx'> 		 * make sure it's the same device if the device is mounted</div><div class='add'>+		 *</div><div class='add'>+		 * NOTE: the device-&gt;fs_info may not be reliable here so pass</div><div class='add'>+		 * in a NULL to message helpers instead. This avoids a possible</div><div class='add'>+		 * use-after-free when the fs_info and fs_info-&gt;sb are already</div><div class='add'>+		 * torn down.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (device-&gt;bdev) {</div><div class='del'>-			int error;</div><div class='del'>-			dev_t path_dev;</div><div class='del'>-</div><div class='del'>-			error = lookup_bdev(path, &amp;path_dev);</div><div class='del'>-			if (error) {</div><div class='add'>+			if (device-&gt;devt != path_devt) {</div><div class='ctx'> 				mutex_unlock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='del'>-				return ERR_PTR(error);</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			if (device-&gt;bdev-&gt;bd_dev != path_dev) {</div><div class='del'>-				mutex_unlock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='del'>-				/*</div><div class='del'>-				 * device-&gt;fs_info may not be reliable here, so</div><div class='del'>-				 * pass in a NULL instead. This avoids a</div><div class='del'>-				 * possible use-after-free when the fs_info and</div><div class='del'>-				 * fs_info-&gt;sb are already torn down.</div><div class='del'>-				 */</div><div class='del'>-				btrfs_warn_in_rcu(NULL,</div><div class='add'>+				btrfs_warn(NULL,</div><div class='ctx'> 	"duplicate device %s devid %llu generation %llu scanned by %s (%d)",</div><div class='ctx'> 						  path, devid, found_transid,</div><div class='ctx'> 						  current-&gt;comm,</div><div class='ctx'> 						  task_pid_nr(current));</div><div class='ctx'> 				return ERR_PTR(-EEXIST);</div><div class='ctx'> 			}</div><div class='del'>-			btrfs_info_in_rcu(device-&gt;fs_info,</div><div class='add'>+			btrfs_info(NULL,</div><div class='ctx'> 	"devid %llu device path %s changed to %s scanned by %s (%d)",</div><div class='del'>-					  devid, rcu_str_deref(device-&gt;name),</div><div class='add'>+					  devid, btrfs_dev_name(device),</div><div class='ctx'> 					  path, current-&gt;comm,</div><div class='ctx'> 					  task_pid_nr(current));</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		name = rcu_string_strdup(path, GFP_NOFS);</div><div class='add'>+		name = kstrdup(path, GFP_NOFS);</div><div class='ctx'> 		if (!name) {</div><div class='ctx'> 			mutex_unlock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='ctx'> 			return ERR_PTR(-ENOMEM);</div><div class='ctx'> 		}</div><div class='del'>-		rcu_string_free(device-&gt;name);</div><div class='add'>+		rcu_read_lock();</div><div class='add'>+		old_name = rcu_dereference(device-&gt;name);</div><div class='add'>+		rcu_read_unlock();</div><div class='ctx'> 		rcu_assign_pointer(device-&gt;name, name);</div><div class='add'>+		kfree_rcu_mightsleep(old_name);</div><div class='add'>+</div><div class='ctx'> 		if (test_bit(BTRFS_DEV_STATE_MISSING, &amp;device-&gt;dev_state)) {</div><div class='ctx'> 			fs_devices-&gt;missing_devices--;</div><div class='ctx'> 			clear_bit(BTRFS_DEV_STATE_MISSING, &amp;device-&gt;dev_state);</div><div class='ctx'> 		}</div><div class='add'>+		device-&gt;devt = path_devt;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -997,35 +1005,39 @@ static struct btrfs_fs_devices *clone_fs_devices(struct btrfs_fs_devices *orig)</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;uuid_mutex);</div><div class='ctx'> </div><div class='del'>-	fs_devices = alloc_fs_devices(orig-&gt;fsid, NULL);</div><div class='add'>+	fs_devices = alloc_fs_devices(orig-&gt;fsid);</div><div class='ctx'> 	if (IS_ERR(fs_devices))</div><div class='ctx'> 		return fs_devices;</div><div class='ctx'> </div><div class='ctx'> 	fs_devices-&gt;total_devices = orig-&gt;total_devices;</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(orig_dev, &amp;orig-&gt;devices, dev_list) {</div><div class='del'>-		struct rcu_string *name;</div><div class='add'>+		const char *dev_path = NULL;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * This is ok to do without RCU read locked because we hold the</div><div class='add'>+		 * uuid mutex so nothing we touch in here is going to disappear.</div><div class='add'>+		 */</div><div class='add'>+		if (orig_dev-&gt;name)</div><div class='add'>+			dev_path = rcu_dereference_raw(orig_dev-&gt;name);</div><div class='ctx'> </div><div class='ctx'> 		device = btrfs_alloc_device(NULL, &amp;orig_dev-&gt;devid,</div><div class='del'>-					    orig_dev-&gt;uuid);</div><div class='add'>+					    orig_dev-&gt;uuid, dev_path);</div><div class='ctx'> 		if (IS_ERR(device)) {</div><div class='ctx'> 			ret = PTR_ERR(device);</div><div class='ctx'> 			goto error;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * This is ok to do without rcu read locked because we hold the</div><div class='del'>-		 * uuid mutex so nothing we touch in here is going to disappear.</div><div class='del'>-		 */</div><div class='del'>-		if (orig_dev-&gt;name) {</div><div class='del'>-			name = rcu_string_strdup(orig_dev-&gt;name-&gt;str,</div><div class='del'>-					GFP_KERNEL);</div><div class='del'>-			if (!name) {</div><div class='add'>+		if (orig_dev-&gt;zone_info) {</div><div class='add'>+			struct btrfs_zoned_device_info *zone_info;</div><div class='add'>+</div><div class='add'>+			zone_info = btrfs_clone_dev_zone_info(orig_dev);</div><div class='add'>+			if (!zone_info) {</div><div class='ctx'> 				btrfs_free_device(device);</div><div class='ctx'> 				ret = -ENOMEM;</div><div class='ctx'> 				goto error;</div><div class='ctx'> 			}</div><div class='del'>-			rcu_assign_pointer(device-&gt;name, name);</div><div class='add'>+			device-&gt;zone_info = zone_info;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		list_add(&amp;device-&gt;dev_list, &amp;fs_devices-&gt;devices);</div><div class='hunk'>@@ -1064,9 +1076,10 @@ static void __btrfs_free_extra_devids(struct btrfs_fs_devices *fs_devices,</div><div class='ctx'> 		if (device-&gt;devid == BTRFS_DEV_REPLACE_DEVID)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		if (device-&gt;bdev) {</div><div class='del'>-			blkdev_put(device-&gt;bdev, device-&gt;mode);</div><div class='add'>+		if (device-&gt;bdev_file) {</div><div class='add'>+			bdev_fput(device-&gt;bdev_file);</div><div class='ctx'> 			device-&gt;bdev = NULL;</div><div class='add'>+			device-&gt;bdev_file = NULL;</div><div class='ctx'> 			fs_devices-&gt;open_devices--;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (test_bit(BTRFS_DEV_STATE_WRITEABLE, &amp;device-&gt;dev_state)) {</div><div class='hunk'>@@ -1111,7 +1124,7 @@ static void btrfs_close_bdev(struct btrfs_device *device)</div><div class='ctx'> 		invalidate_bdev(device-&gt;bdev);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	blkdev_put(device-&gt;bdev, device-&gt;mode);</div><div class='add'>+	bdev_fput(device-&gt;bdev_file);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void btrfs_close_one_device(struct btrfs_device *device)</div><div class='hunk'>@@ -1136,13 +1149,14 @@ static void btrfs_close_one_device(struct btrfs_device *device)</div><div class='ctx'> 	if (device-&gt;bdev) {</div><div class='ctx'> 		fs_devices-&gt;open_devices--;</div><div class='ctx'> 		device-&gt;bdev = NULL;</div><div class='add'>+		device-&gt;bdev_file = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> 	clear_bit(BTRFS_DEV_STATE_WRITEABLE, &amp;device-&gt;dev_state);</div><div class='ctx'> 	btrfs_destroy_dev_zone_info(device);</div><div class='ctx'> </div><div class='ctx'> 	device-&gt;fs_info = NULL;</div><div class='ctx'> 	atomic_set(&amp;device-&gt;dev_stats_ccnt, 0);</div><div class='del'>-	extent_io_tree_release(&amp;device-&gt;alloc_state);</div><div class='add'>+	btrfs_extent_io_tree_release(&amp;device-&gt;alloc_state);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Reset the flush error record. We might have a transient flush error</div><div class='hunk'>@@ -1158,11 +1172,10 @@ static void btrfs_close_one_device(struct btrfs_device *device)</div><div class='ctx'> 	device-&gt;last_flush_error = 0;</div><div class='ctx'> </div><div class='ctx'> 	/* Verify the device is back in a pristine state  */</div><div class='del'>-	ASSERT(!test_bit(BTRFS_DEV_STATE_FLUSH_SENT, &amp;device-&gt;dev_state));</div><div class='del'>-	ASSERT(!test_bit(BTRFS_DEV_STATE_REPLACE_TGT, &amp;device-&gt;dev_state));</div><div class='del'>-	ASSERT(list_empty(&amp;device-&gt;dev_alloc_list));</div><div class='del'>-	ASSERT(list_empty(&amp;device-&gt;post_commit_list));</div><div class='del'>-	ASSERT(atomic_read(&amp;device-&gt;reada_in_flight) == 0);</div><div class='add'>+	WARN_ON(test_bit(BTRFS_DEV_STATE_FLUSH_SENT, &amp;device-&gt;dev_state));</div><div class='add'>+	WARN_ON(test_bit(BTRFS_DEV_STATE_REPLACE_TGT, &amp;device-&gt;dev_state));</div><div class='add'>+	WARN_ON(!list_empty(&amp;device-&gt;dev_alloc_list));</div><div class='add'>+	WARN_ON(!list_empty(&amp;device-&gt;post_commit_list));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void close_fs_devices(struct btrfs_fs_devices *fs_devices)</div><div class='hunk'>@@ -1191,9 +1204,22 @@ void btrfs_close_devices(struct btrfs_fs_devices *fs_devices)</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;uuid_mutex);</div><div class='ctx'> 	close_fs_devices(fs_devices);</div><div class='del'>-	if (!fs_devices-&gt;opened)</div><div class='add'>+	if (!fs_devices-&gt;opened &amp;&amp; !fs_devices-&gt;holding) {</div><div class='ctx'> 		list_splice_init(&amp;fs_devices-&gt;seed_list, &amp;list);</div><div class='ctx'> </div><div class='add'>+		/*</div><div class='add'>+		 * If the struct btrfs_fs_devices is not assembled with any</div><div class='add'>+		 * other device, it can be re-initialized during the next mount</div><div class='add'>+		 * without the needing device-scan step. Therefore, it can be</div><div class='add'>+		 * fully freed.</div><div class='add'>+		 */</div><div class='add'>+		if (fs_devices-&gt;num_devices == 1) {</div><div class='add'>+			list_del(&amp;fs_devices-&gt;fs_list);</div><div class='add'>+			free_fs_devices(fs_devices);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+</div><div class='ctx'> 	list_for_each_entry_safe(fs_devices, tmp, &amp;list, seed_list) {</div><div class='ctx'> 		close_fs_devices(fs_devices);</div><div class='ctx'> 		list_del(&amp;fs_devices-&gt;seed_list);</div><div class='hunk'>@@ -1203,36 +1229,58 @@ void btrfs_close_devices(struct btrfs_fs_devices *fs_devices)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int open_fs_devices(struct btrfs_fs_devices *fs_devices,</div><div class='del'>-				fmode_t flags, void *holder)</div><div class='add'>+				blk_mode_t flags, void *holder)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_device *device;</div><div class='ctx'> 	struct btrfs_device *latest_dev = NULL;</div><div class='ctx'> 	struct btrfs_device *tmp_device;</div><div class='del'>-</div><div class='del'>-	flags |= FMODE_EXCL;</div><div class='add'>+	s64 __maybe_unused value = 0;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry_safe(device, tmp_device, &amp;fs_devices-&gt;devices,</div><div class='ctx'> 				 dev_list) {</div><div class='del'>-		int ret;</div><div class='add'>+		int ret2;</div><div class='ctx'> </div><div class='del'>-		ret = btrfs_open_one_device(fs_devices, device, flags, holder);</div><div class='del'>-		if (ret == 0 &amp;&amp;</div><div class='add'>+		ret2 = btrfs_open_one_device(fs_devices, device, flags, holder);</div><div class='add'>+		if (ret2 == 0 &amp;&amp;</div><div class='ctx'> 		    (!latest_dev || device-&gt;generation &gt; latest_dev-&gt;generation)) {</div><div class='ctx'> 			latest_dev = device;</div><div class='del'>-		} else if (ret == -ENODATA) {</div><div class='add'>+		} else if (ret2 == -ENODATA) {</div><div class='ctx'> 			fs_devices-&gt;num_devices--;</div><div class='ctx'> 			list_del(&amp;device-&gt;dev_list);</div><div class='ctx'> 			btrfs_free_device(device);</div><div class='ctx'> 		}</div><div class='add'>+		if (ret == 0 &amp;&amp; ret2 != 0)</div><div class='add'>+			ret = ret2;</div><div class='ctx'> 	}</div><div class='del'>-	if (fs_devices-&gt;open_devices == 0)</div><div class='add'>+</div><div class='add'>+	if (fs_devices-&gt;open_devices == 0) {</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='ctx'> 		return -EINVAL;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	fs_devices-&gt;opened = 1;</div><div class='ctx'> 	fs_devices-&gt;latest_dev = latest_dev;</div><div class='ctx'> 	fs_devices-&gt;total_rw_bytes = 0;</div><div class='ctx'> 	fs_devices-&gt;chunk_alloc_policy = BTRFS_CHUNK_ALLOC_REGULAR;</div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+	fs_devices-&gt;rr_min_contig_read = BTRFS_DEFAULT_RR_MIN_CONTIG_READ;</div><div class='add'>+	fs_devices-&gt;read_devid = latest_dev-&gt;devid;</div><div class='add'>+	fs_devices-&gt;read_policy = btrfs_read_policy_to_enum(btrfs_get_mod_read_policy(),</div><div class='add'>+							    &amp;value);</div><div class='add'>+	if (fs_devices-&gt;read_policy == BTRFS_READ_POLICY_RR)</div><div class='add'>+		fs_devices-&gt;collect_fs_stats = true;</div><div class='add'>+</div><div class='add'>+	if (value) {</div><div class='add'>+		if (fs_devices-&gt;read_policy == BTRFS_READ_POLICY_RR)</div><div class='add'>+			fs_devices-&gt;rr_min_contig_read = value;</div><div class='add'>+		if (fs_devices-&gt;read_policy == BTRFS_READ_POLICY_DEVID)</div><div class='add'>+			fs_devices-&gt;read_devid = value;</div><div class='add'>+	}</div><div class='add'>+#else</div><div class='ctx'> 	fs_devices-&gt;read_policy = BTRFS_READ_POLICY_PID;</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -1253,7 +1301,7 @@ static int devid_cmp(void *priv, const struct list_head *a,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_open_devices(struct btrfs_fs_devices *fs_devices,</div><div class='del'>-		       fmode_t flags, void *holder)</div><div class='add'>+		       blk_mode_t flags, void *holder)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -1284,111 +1332,172 @@ void btrfs_release_disk_super(struct btrfs_super_block *super)</div><div class='ctx'> 	put_page(page);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct btrfs_super_block *btrfs_read_disk_super(struct block_device *bdev,</div><div class='del'>-						       u64 bytenr, u64 bytenr_orig)</div><div class='add'>+struct btrfs_super_block *btrfs_read_disk_super(struct block_device *bdev,</div><div class='add'>+						int copy_num, bool drop_cache)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_super_block *disk_super;</div><div class='add'>+	struct btrfs_super_block *super;</div><div class='ctx'> 	struct page *page;</div><div class='del'>-	void *p;</div><div class='del'>-	pgoff_t index;</div><div class='add'>+	u64 bytenr, bytenr_orig;</div><div class='add'>+	struct address_space *mapping = bdev-&gt;bd_mapping;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	/* make sure our super fits in the device */</div><div class='del'>-	if (bytenr + PAGE_SIZE &gt;= bdev_nr_bytes(bdev))</div><div class='del'>-		return ERR_PTR(-EINVAL);</div><div class='add'>+	bytenr_orig = btrfs_sb_offset(copy_num);</div><div class='add'>+	ret = btrfs_sb_log_location_bdev(bdev, copy_num, READ, &amp;bytenr);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		if (ret == -ENOENT)</div><div class='add'>+			ret = -EINVAL;</div><div class='add'>+		return ERR_PTR(ret);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	/* make sure our super fits in the page */</div><div class='del'>-	if (sizeof(*disk_super) &gt; PAGE_SIZE)</div><div class='add'>+	if (bytenr + BTRFS_SUPER_INFO_SIZE &gt;= bdev_nr_bytes(bdev))</div><div class='ctx'> 		return ERR_PTR(-EINVAL);</div><div class='ctx'> </div><div class='del'>-	/* make sure our super doesn't straddle pages on disk */</div><div class='del'>-	index = bytenr &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	if ((bytenr + sizeof(*disk_super) - 1) &gt;&gt; PAGE_SHIFT != index)</div><div class='del'>-		return ERR_PTR(-EINVAL);</div><div class='add'>+	if (drop_cache) {</div><div class='add'>+		/* This should only be called with the primary sb. */</div><div class='add'>+		ASSERT(copy_num == 0);</div><div class='ctx'> </div><div class='del'>-	/* pull in the page with our super */</div><div class='del'>-	page = read_cache_page_gfp(bdev-&gt;bd_inode-&gt;i_mapping, index, GFP_KERNEL);</div><div class='add'>+		/*</div><div class='add'>+		 * Drop the page of the primary superblock, so later read will</div><div class='add'>+		 * always read from the device.</div><div class='add'>+		 */</div><div class='add'>+		invalidate_inode_pages2_range(mapping, bytenr &gt;&gt; PAGE_SHIFT,</div><div class='add'>+				      (bytenr + BTRFS_SUPER_INFO_SIZE) &gt;&gt; PAGE_SHIFT);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='add'>+	page = read_cache_page_gfp(mapping, bytenr &gt;&gt; PAGE_SHIFT, GFP_NOFS);</div><div class='ctx'> 	if (IS_ERR(page))</div><div class='ctx'> 		return ERR_CAST(page);</div><div class='ctx'> </div><div class='del'>-	p = page_address(page);</div><div class='del'>-</div><div class='del'>-	/* align our pointer to the offset of the super block */</div><div class='del'>-	disk_super = p + offset_in_page(bytenr);</div><div class='del'>-</div><div class='del'>-	if (btrfs_super_bytenr(disk_super) != bytenr_orig ||</div><div class='del'>-	    btrfs_super_magic(disk_super) != BTRFS_MAGIC) {</div><div class='del'>-		btrfs_release_disk_super(p);</div><div class='add'>+	super = page_address(page);</div><div class='add'>+	if (btrfs_super_magic(super) != BTRFS_MAGIC ||</div><div class='add'>+	    btrfs_super_bytenr(super) != bytenr_orig) {</div><div class='add'>+		btrfs_release_disk_super(super);</div><div class='ctx'> 		return ERR_PTR(-EINVAL);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (disk_super-&gt;label[0] &amp;&amp; disk_super-&gt;label[BTRFS_LABEL_SIZE - 1])</div><div class='del'>-		disk_super-&gt;label[BTRFS_LABEL_SIZE - 1] = 0;</div><div class='add'>+	/*</div><div class='add'>+	 * Make sure the last byte of label is properly NUL terminated.  We use</div><div class='add'>+	 * '%s' to print the label, if not properly NUL terminated we can access</div><div class='add'>+	 * beyond the label.</div><div class='add'>+	 */</div><div class='add'>+	if (super-&gt;label[0] &amp;&amp; super-&gt;label[BTRFS_LABEL_SIZE - 1])</div><div class='add'>+		super-&gt;label[BTRFS_LABEL_SIZE - 1] = 0;</div><div class='ctx'> </div><div class='del'>-	return disk_super;</div><div class='add'>+	return super;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_forget_devices(const char *path)</div><div class='add'>+int btrfs_forget_devices(dev_t devt)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;uuid_mutex);</div><div class='del'>-	ret = btrfs_free_stale_devices(strlen(path) ? path : NULL, NULL);</div><div class='add'>+	ret = btrfs_free_stale_devices(devt, NULL);</div><div class='ctx'> 	mutex_unlock(&amp;uuid_mutex);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool btrfs_skip_registration(struct btrfs_super_block *disk_super,</div><div class='add'>+				    const char *path, dev_t devt,</div><div class='add'>+				    bool mount_arg_dev)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_devices *fs_devices;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Do not skip device registration for mounted devices with matching</div><div class='add'>+	 * maj:min but different paths. Booting without initrd relies on</div><div class='add'>+	 * /dev/root initially, later replaced with the actual root device.</div><div class='add'>+	 * A successful scan ensures grub2-probe selects the correct device.</div><div class='add'>+	 */</div><div class='add'>+	list_for_each_entry(fs_devices, &amp;fs_uuids, fs_list) {</div><div class='add'>+		struct btrfs_device *device;</div><div class='add'>+</div><div class='add'>+		mutex_lock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='add'>+</div><div class='add'>+		if (!fs_devices-&gt;opened) {</div><div class='add'>+			mutex_unlock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		list_for_each_entry(device, &amp;fs_devices-&gt;devices, dev_list) {</div><div class='add'>+			if (device-&gt;bdev &amp;&amp; (device-&gt;bdev-&gt;bd_dev == devt) &amp;&amp;</div><div class='add'>+			    strcmp(rcu_dereference_raw(device-&gt;name), path) != 0) {</div><div class='add'>+				mutex_unlock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='add'>+</div><div class='add'>+				/* Do not skip registration. */</div><div class='add'>+				return false;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+		mutex_unlock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!mount_arg_dev &amp;&amp; btrfs_super_num_devices(disk_super) == 1 &amp;&amp;</div><div class='add'>+	    !(btrfs_super_flags(disk_super) &amp; BTRFS_SUPER_FLAG_SEEDING))</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Look for a btrfs signature on a device. This may be called out of the mount path</div><div class='ctx'>  * and we are not allowed to call set_blocksize during the scan. The superblock</div><div class='del'>- * is read via pagecache</div><div class='add'>+ * is read via pagecache.</div><div class='add'>+ *</div><div class='add'>+ * With @mount_arg_dev it's a scan during mount time that will always register</div><div class='add'>+ * the device or return an error. Multi-device and seeding devices are registered</div><div class='add'>+ * in both cases.</div><div class='ctx'>  */</div><div class='del'>-struct btrfs_device *btrfs_scan_one_device(const char *path, fmode_t flags,</div><div class='del'>-					   void *holder)</div><div class='add'>+struct btrfs_device *btrfs_scan_one_device(const char *path,</div><div class='add'>+					   bool mount_arg_dev)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_super_block *disk_super;</div><div class='ctx'> 	bool new_device_added = false;</div><div class='ctx'> 	struct btrfs_device *device = NULL;</div><div class='del'>-	struct block_device *bdev;</div><div class='del'>-	u64 bytenr, bytenr_orig;</div><div class='del'>-	int ret;</div><div class='add'>+	struct file *bdev_file;</div><div class='add'>+	dev_t devt;</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;uuid_mutex);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * we would like to check all the supers, but that would make</div><div class='del'>-	 * a btrfs mount succeed after a mkfs from a different FS.</div><div class='del'>-	 * So, we need to add a special mount option to scan for</div><div class='del'>-	 * later supers, using BTRFS_SUPER_MIRROR_MAX instead</div><div class='add'>+	 * Avoid an exclusive open here, as the systemd-udev may initiate the</div><div class='add'>+	 * device scan which may race with the user's mount or mkfs command,</div><div class='add'>+	 * resulting in failure.</div><div class='add'>+	 * Since the device scan is solely for reading purposes, there is no</div><div class='add'>+	 * need for an exclusive open. Additionally, the devices are read again</div><div class='add'>+	 * during the mount process. It is ok to get some inconsistent</div><div class='add'>+	 * values temporarily, as the device paths of the fsid are the only</div><div class='add'>+	 * required information for assembling the volume.</div><div class='ctx'> 	 */</div><div class='del'>-	flags |= FMODE_EXCL;</div><div class='del'>-</div><div class='del'>-	bdev = blkdev_get_by_path(path, flags, holder);</div><div class='del'>-	if (IS_ERR(bdev))</div><div class='del'>-		return ERR_CAST(bdev);</div><div class='del'>-</div><div class='del'>-	bytenr_orig = btrfs_sb_offset(0);</div><div class='del'>-	ret = btrfs_sb_log_location_bdev(bdev, 0, READ, &amp;bytenr);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ERR_PTR(ret);</div><div class='add'>+	bdev_file = bdev_file_open_by_path(path, BLK_OPEN_READ, NULL, NULL);</div><div class='add'>+	if (IS_ERR(bdev_file))</div><div class='add'>+		return ERR_CAST(bdev_file);</div><div class='ctx'> </div><div class='del'>-	disk_super = btrfs_read_disk_super(bdev, bytenr, bytenr_orig);</div><div class='add'>+	disk_super = btrfs_read_disk_super(file_bdev(bdev_file), 0, false);</div><div class='ctx'> 	if (IS_ERR(disk_super)) {</div><div class='ctx'> 		device = ERR_CAST(disk_super);</div><div class='ctx'> 		goto error_bdev_put;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	device = device_list_add(path, disk_super, &amp;new_device_added);</div><div class='del'>-	if (!IS_ERR(device)) {</div><div class='del'>-		if (new_device_added)</div><div class='del'>-			btrfs_free_stale_devices(path, device);</div><div class='add'>+	devt = file_bdev(bdev_file)-&gt;bd_dev;</div><div class='add'>+	if (btrfs_skip_registration(disk_super, path, devt, mount_arg_dev)) {</div><div class='add'>+		btrfs_debug(NULL, "skip registering single non-seed device %s (%d:%d)",</div><div class='add'>+			  path, MAJOR(devt), MINOR(devt));</div><div class='add'>+</div><div class='add'>+		btrfs_free_stale_devices(devt, NULL);</div><div class='add'>+</div><div class='add'>+		device = NULL;</div><div class='add'>+		goto free_disk_super;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	device = device_list_add(path, disk_super, &amp;new_device_added);</div><div class='add'>+	if (!IS_ERR(device) &amp;&amp; new_device_added)</div><div class='add'>+		btrfs_free_stale_devices(device-&gt;devt, device);</div><div class='add'>+</div><div class='add'>+free_disk_super:</div><div class='ctx'> 	btrfs_release_disk_super(disk_super);</div><div class='ctx'> </div><div class='ctx'> error_bdev_put:</div><div class='del'>-	blkdev_put(bdev, flags);</div><div class='add'>+	bdev_fput(bdev_file);</div><div class='ctx'> </div><div class='ctx'> 	return device;</div><div class='ctx'> }</div><div class='hunk'>@@ -1404,13 +1513,13 @@ static bool contains_pending_extent(struct btrfs_device *device, u64 *start,</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;device-&gt;fs_info-&gt;chunk_mutex);</div><div class='ctx'> </div><div class='del'>-	if (!find_first_extent_bit(&amp;device-&gt;alloc_state, *start,</div><div class='del'>-				   &amp;physical_start, &amp;physical_end,</div><div class='del'>-				   CHUNK_ALLOCATED, NULL)) {</div><div class='add'>+	if (btrfs_find_first_extent_bit(&amp;device-&gt;alloc_state, *start,</div><div class='add'>+					&amp;physical_start, &amp;physical_end,</div><div class='add'>+					CHUNK_ALLOCATED, NULL)) {</div><div class='ctx'> </div><div class='ctx'> 		if (in_range(physical_start, *start, len) ||</div><div class='ctx'> 		    in_range(*start, physical_start,</div><div class='del'>-			     physical_end - physical_start)) {</div><div class='add'>+			     physical_end + 1 - physical_start)) {</div><div class='ctx'> 			*start = physical_end + 1;</div><div class='ctx'> 			return true;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1418,25 +1527,21 @@ static bool contains_pending_extent(struct btrfs_device *device, u64 *start,</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static u64 dev_extent_search_start(struct btrfs_device *device, u64 start)</div><div class='add'>+static u64 dev_extent_search_start(struct btrfs_device *device)</div><div class='ctx'> {</div><div class='ctx'> 	switch (device-&gt;fs_devices-&gt;chunk_alloc_policy) {</div><div class='add'>+	default:</div><div class='add'>+		btrfs_warn_unknown_chunk_allocation(device-&gt;fs_devices-&gt;chunk_alloc_policy);</div><div class='add'>+		fallthrough;</div><div class='ctx'> 	case BTRFS_CHUNK_ALLOC_REGULAR:</div><div class='del'>-		/*</div><div class='del'>-		 * We don't want to overwrite the superblock on the drive nor</div><div class='del'>-		 * any area used by the boot loader (grub for example), so we</div><div class='del'>-		 * make sure to start at an offset of at least 1MB.</div><div class='del'>-		 */</div><div class='del'>-		return max_t(u64, start, SZ_1M);</div><div class='add'>+		return BTRFS_DEVICE_RANGE_RESERVED;</div><div class='ctx'> 	case BTRFS_CHUNK_ALLOC_ZONED:</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We don't care about the starting region like regular</div><div class='ctx'> 		 * allocator, because we anyway use/reserve the first two zones</div><div class='ctx'> 		 * for superblock logging.</div><div class='ctx'> 		 */</div><div class='del'>-		return ALIGN(start, device-&gt;zone_info-&gt;zone_size);</div><div class='del'>-	default:</div><div class='del'>-		BUG();</div><div class='add'>+		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1449,7 +1554,8 @@ static bool dev_extent_hole_check_zoned(struct btrfs_device *device,</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	bool changed = false;</div><div class='ctx'> </div><div class='del'>-	ASSERT(IS_ALIGNED(*hole_start, zone_size));</div><div class='add'>+	ASSERT(IS_ALIGNED(*hole_start, zone_size),</div><div class='add'>+	       "hole_start=%llu zone_size=%llu", *hole_start, zone_size);</div><div class='ctx'> </div><div class='ctx'> 	while (*hole_size &gt; 0) {</div><div class='ctx'> 		pos = btrfs_find_allocatable_zones(device, *hole_start,</div><div class='hunk'>@@ -1484,8 +1590,9 @@ static bool dev_extent_hole_check_zoned(struct btrfs_device *device,</div><div class='ctx'> 	return changed;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * dev_extent_hole_check - check if specified hole is suitable for allocation</div><div class='add'>+/*</div><div class='add'>+ * Check if specified hole is suitable for allocation.</div><div class='add'>+ *</div><div class='ctx'>  * @device:	the device which we have the hole</div><div class='ctx'>  * @hole_start: starting position of the hole</div><div class='ctx'>  * @hole_size:	the size of the hole</div><div class='hunk'>@@ -1514,6 +1621,9 @@ static bool dev_extent_hole_check(struct btrfs_device *device, u64 *hole_start,</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		switch (device-&gt;fs_devices-&gt;chunk_alloc_policy) {</div><div class='add'>+		default:</div><div class='add'>+			btrfs_warn_unknown_chunk_allocation(device-&gt;fs_devices-&gt;chunk_alloc_policy);</div><div class='add'>+			fallthrough;</div><div class='ctx'> 		case BTRFS_CHUNK_ALLOC_REGULAR:</div><div class='ctx'> 			/* No extra check */</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -1528,8 +1638,6 @@ static bool dev_extent_hole_check(struct btrfs_device *device, u64 *hole_start,</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> 			break;</div><div class='del'>-		default:</div><div class='del'>-			BUG();</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		break;</div><div class='hunk'>@@ -1539,7 +1647,8 @@ static bool dev_extent_hole_check(struct btrfs_device *device, u64 *hole_start,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * find_free_dev_extent_start - find free space in the specified device</div><div class='add'>+ * Find free space in the specified device.</div><div class='add'>+ *</div><div class='ctx'>  * @device:	  the device which we search the free space in</div><div class='ctx'>  * @num_bytes:	  the size of the free space that we need</div><div class='ctx'>  * @search_start: the position from which to begin the search</div><div class='hunk'>@@ -1547,9 +1656,8 @@ static bool dev_extent_hole_check(struct btrfs_device *device, u64 *hole_start,</div><div class='ctx'>  * @len:	  the size of the free space. that we find, or the size</div><div class='ctx'>  *		  of the max free space if we don't find suitable free space</div><div class='ctx'>  *</div><div class='del'>- * this uses a pretty simple search, the expectation is that it is</div><div class='del'>- * called very infrequently and that a given device has a small number</div><div class='del'>- * of extents</div><div class='add'>+ * This does a pretty simple search, the expectation is that it is called very</div><div class='add'>+ * infrequently and that a given device has a small number of extents.</div><div class='ctx'>  *</div><div class='ctx'>  * @start is used to store the start of the free space if we find. But if we</div><div class='ctx'>  * don't find suitable free space, it will be used to store the start position</div><div class='hunk'>@@ -1565,36 +1673,35 @@ static bool dev_extent_hole_check(struct btrfs_device *device, u64 *hole_start,</div><div class='ctx'>  * correct usable device space, as device extent freed in current transaction</div><div class='ctx'>  * is not reported as available.</div><div class='ctx'>  */</div><div class='del'>-static int find_free_dev_extent_start(struct btrfs_device *device,</div><div class='del'>-				u64 num_bytes, u64 search_start, u64 *start,</div><div class='del'>-				u64 *len)</div><div class='add'>+static int find_free_dev_extent(struct btrfs_device *device, u64 num_bytes,</div><div class='add'>+				u64 *start, u64 *len)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = device-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_root *root = fs_info-&gt;dev_root;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_dev_extent *dev_extent;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='add'>+	u64 search_start;</div><div class='ctx'> 	u64 hole_size;</div><div class='ctx'> 	u64 max_hole_start;</div><div class='del'>-	u64 max_hole_size;</div><div class='add'>+	u64 max_hole_size = 0;</div><div class='ctx'> 	u64 extent_end;</div><div class='ctx'> 	u64 search_end = device-&gt;total_bytes;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int slot;</div><div class='ctx'> 	struct extent_buffer *l;</div><div class='ctx'> </div><div class='del'>-	search_start = dev_extent_search_start(device, search_start);</div><div class='add'>+	search_start = dev_extent_search_start(device);</div><div class='add'>+	max_hole_start = search_start;</div><div class='ctx'> </div><div class='ctx'> 	WARN_ON(device-&gt;zone_info &amp;&amp;</div><div class='ctx'> 		!IS_ALIGNED(num_bytes, device-&gt;zone_info-&gt;zone_size));</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='del'>-	if (!path)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	max_hole_start = search_start;</div><div class='del'>-	max_hole_size = 0;</div><div class='del'>-</div><div class='add'>+	if (!path) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> again:</div><div class='ctx'> 	if (search_start &gt;= search_end ||</div><div class='ctx'> 		test_bit(BTRFS_DEV_STATE_REPLACE_TGT, &amp;device-&gt;dev_state)) {</div><div class='hunk'>@@ -1603,18 +1710,18 @@ again:</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	path-&gt;reada = READA_FORWARD;</div><div class='del'>-	path-&gt;search_commit_root = 1;</div><div class='del'>-	path-&gt;skip_locking = 1;</div><div class='add'>+	path-&gt;search_commit_root = true;</div><div class='add'>+	path-&gt;skip_locking = true;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = device-&gt;devid;</div><div class='del'>-	key.offset = search_start;</div><div class='ctx'> 	key.type = BTRFS_DEV_EXTENT_KEY;</div><div class='add'>+	key.offset = search_start;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_search_backwards(root, &amp;key, path);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	while (1) {</div><div class='add'>+	while (search_start &lt; search_end) {</div><div class='ctx'> 		l = path-&gt;nodes[0];</div><div class='ctx'> 		slot = path-&gt;slots[0];</div><div class='ctx'> 		if (slot &gt;= btrfs_header_nritems(l)) {</div><div class='hunk'>@@ -1637,6 +1744,9 @@ again:</div><div class='ctx'> 		if (key.type != BTRFS_DEV_EXTENT_KEY)</div><div class='ctx'> 			goto next;</div><div class='ctx'> </div><div class='add'>+		if (key.offset &gt; search_end)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='ctx'> 		if (key.offset &gt; search_start) {</div><div class='ctx'> 			hole_size = key.offset - search_start;</div><div class='ctx'> 			dev_extent_hole_check(device, &amp;search_start, &amp;hole_size,</div><div class='hunk'>@@ -1697,21 +1807,16 @@ next:</div><div class='ctx'> 	else</div><div class='ctx'> 		ret = 0;</div><div class='ctx'> </div><div class='add'>+	ASSERT(max_hole_start + max_hole_size &lt;= search_end,</div><div class='add'>+	       "max_hole_start=%llu max_hole_size=%llu search_end=%llu",</div><div class='add'>+	       max_hole_start, max_hole_size, search_end);</div><div class='ctx'> out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	*start = max_hole_start;</div><div class='ctx'> 	if (len)</div><div class='ctx'> 		*len = max_hole_size;</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int find_free_dev_extent(struct btrfs_device *device, u64 num_bytes,</div><div class='del'>-			 u64 *start, u64 *len)</div><div class='del'>-{</div><div class='del'>-	/* FIXME use last free of some kind */</div><div class='del'>-	return find_free_dev_extent_start(device, num_bytes, 0, start, len);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int btrfs_free_dev_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			  struct btrfs_device *device,</div><div class='ctx'> 			  u64 start, u64 *dev_extent_len)</div><div class='hunk'>@@ -1719,7 +1824,7 @@ static int btrfs_free_dev_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = device-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_root *root = fs_info-&gt;dev_root;</div><div class='ctx'> 	int ret;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_key found_key;</div><div class='ctx'> 	struct extent_buffer *leaf = NULL;</div><div class='hunk'>@@ -1730,15 +1835,15 @@ static int btrfs_free_dev_extent(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = device-&gt;devid;</div><div class='del'>-	key.offset = start;</div><div class='ctx'> 	key.type = BTRFS_DEV_EXTENT_KEY;</div><div class='add'>+	key.offset = start;</div><div class='ctx'> again:</div><div class='ctx'> 	ret = btrfs_search_slot(trans, root, &amp;key, path, -1, 1);</div><div class='ctx'> 	if (ret &gt; 0) {</div><div class='ctx'> 		ret = btrfs_previous_item(root, path, key.objectid,</div><div class='ctx'> 					  BTRFS_DEV_EXTENT_KEY);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 		leaf = path-&gt;nodes[0];</div><div class='ctx'> 		btrfs_item_key_to_cpu(leaf, &amp;found_key, path-&gt;slots[0]);</div><div class='ctx'> 		extent = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='hunk'>@@ -1753,7 +1858,7 @@ again:</div><div class='ctx'> 		extent = btrfs_item_ptr(leaf, path-&gt;slots[0],</div><div class='ctx'> 					struct btrfs_dev_extent);</div><div class='ctx'> 	} else {</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	*dev_extent_len = btrfs_dev_extent_length(leaf, extent);</div><div class='hunk'>@@ -1761,26 +1866,23 @@ again:</div><div class='ctx'> 	ret = btrfs_del_item(trans, root, path);</div><div class='ctx'> 	if (ret == 0)</div><div class='ctx'> 		set_bit(BTRFS_TRANS_HAVE_FREE_BGS, &amp;trans-&gt;transaction-&gt;flags);</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static u64 find_next_chunk(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	struct extent_map_tree *em_tree;</div><div class='del'>-	struct extent_map *em;</div><div class='ctx'> 	struct rb_node *n;</div><div class='ctx'> 	u64 ret = 0;</div><div class='ctx'> </div><div class='del'>-	em_tree = &amp;fs_info-&gt;mapping_tree;</div><div class='del'>-	read_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	n = rb_last(&amp;em_tree-&gt;map.rb_root);</div><div class='add'>+	read_lock(&amp;fs_info-&gt;mapping_tree_lock);</div><div class='add'>+	n = rb_last(&amp;fs_info-&gt;mapping_tree.rb_root);</div><div class='ctx'> 	if (n) {</div><div class='del'>-		em = rb_entry(n, struct extent_map, rb_node);</div><div class='del'>-		ret = em-&gt;start + em-&gt;len;</div><div class='add'>+		struct btrfs_chunk_map *map;</div><div class='add'>+</div><div class='add'>+		map = rb_entry(n, struct btrfs_chunk_map, rb_node);</div><div class='add'>+		ret = map-&gt;start + map-&gt;chunk_len;</div><div class='ctx'> 	}</div><div class='del'>-	read_unlock(&amp;em_tree-&gt;lock);</div><div class='add'>+	read_unlock(&amp;fs_info-&gt;mapping_tree_lock);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -1791,7 +1893,7 @@ static noinline int find_next_devid(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_key found_key;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='hunk'>@@ -1803,13 +1905,12 @@ static noinline int find_next_devid(struct btrfs_fs_info *fs_info,</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_search_slot(NULL, fs_info-&gt;chunk_root, &amp;key, path, 0, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto error;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	if (ret == 0) {</div><div class='add'>+	if (unlikely(ret == 0)) {</div><div class='ctx'> 		/* Corruption */</div><div class='ctx'> 		btrfs_err(fs_info, "corrupted chunk tree devid -1 matched");</div><div class='del'>-		ret = -EUCLEAN;</div><div class='del'>-		goto error;</div><div class='add'>+		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_previous_item(fs_info-&gt;chunk_root, path,</div><div class='hunk'>@@ -1822,10 +1923,7 @@ static noinline int find_next_devid(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				      path-&gt;slots[0]);</div><div class='ctx'> 		*devid_ret = found_key.offset + 1;</div><div class='ctx'> 	}</div><div class='del'>-	ret = 0;</div><div class='del'>-error:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1836,7 +1934,7 @@ static int btrfs_add_dev_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			    struct btrfs_device *device)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_dev_item *dev_item;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='hunk'>@@ -1855,7 +1953,7 @@ static int btrfs_add_dev_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				      &amp;key, sizeof(*dev_item));</div><div class='ctx'> 	btrfs_trans_release_chunk_metadata(trans);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	dev_item = btrfs_item_ptr(leaf, path-&gt;slots[0], struct btrfs_dev_item);</div><div class='hunk'>@@ -1880,12 +1978,8 @@ static int btrfs_add_dev_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	ptr = btrfs_device_fsid(dev_item);</div><div class='ctx'> 	write_extent_buffer(leaf, trans-&gt;fs_info-&gt;fs_devices-&gt;metadata_uuid,</div><div class='ctx'> 			    ptr, BTRFS_FSID_SIZE);</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> </div><div class='del'>-	ret = 0;</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1897,35 +1991,25 @@ out:</div><div class='ctx'> static void update_dev_time(const char *device_path)</div><div class='ctx'> {</div><div class='ctx'> 	struct path path;</div><div class='del'>-	struct timespec64 now;</div><div class='del'>-	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = kern_path(device_path, LOOKUP_FOLLOW, &amp;path);</div><div class='del'>-	if (ret)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	now = current_time(d_inode(path.dentry));</div><div class='del'>-	inode_update_time(d_inode(path.dentry), &amp;now, S_MTIME | S_CTIME);</div><div class='del'>-	path_put(&amp;path);</div><div class='add'>+	if (!kern_path(device_path, LOOKUP_FOLLOW, &amp;path)) {</div><div class='add'>+		vfs_utimes(&amp;path, NULL);</div><div class='add'>+		path_put(&amp;path);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int btrfs_rm_dev_item(struct btrfs_device *device)</div><div class='add'>+static int btrfs_rm_dev_item(struct btrfs_trans_handle *trans,</div><div class='add'>+			     struct btrfs_device *device)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root = device-&gt;fs_info-&gt;chunk_root;</div><div class='ctx'> 	int ret;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='del'>-	struct btrfs_trans_handle *trans;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	trans = btrfs_start_transaction(root, 0);</div><div class='del'>-	if (IS_ERR(trans)) {</div><div class='del'>-		btrfs_free_path(path);</div><div class='del'>-		return PTR_ERR(trans);</div><div class='del'>-	}</div><div class='ctx'> 	key.objectid = BTRFS_DEV_ITEMS_OBJECTID;</div><div class='ctx'> 	key.type = BTRFS_DEV_ITEM_KEY;</div><div class='ctx'> 	key.offset = device-&gt;devid;</div><div class='hunk'>@@ -1933,25 +2017,12 @@ static int btrfs_rm_dev_item(struct btrfs_device *device)</div><div class='ctx'> 	btrfs_reserve_chunk_metadata(trans, false);</div><div class='ctx'> 	ret = btrfs_search_slot(trans, root, &amp;key, path, -1, 1);</div><div class='ctx'> 	btrfs_trans_release_chunk_metadata(trans);</div><div class='del'>-	if (ret) {</div><div class='del'>-		if (ret &gt; 0)</div><div class='del'>-			ret = -ENOENT;</div><div class='del'>-		btrfs_abort_transaction(trans, ret);</div><div class='del'>-		btrfs_end_transaction(trans);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = btrfs_del_item(trans, root, path);</div><div class='del'>-	if (ret) {</div><div class='del'>-		btrfs_abort_transaction(trans, ret);</div><div class='del'>-		btrfs_end_transaction(trans);</div><div class='del'>-	}</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		return -ENOENT;</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	if (!ret)</div><div class='del'>-		ret = btrfs_commit_transaction(trans);</div><div class='del'>-	return ret;</div><div class='add'>+	return btrfs_del_item(trans, root, path);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2034,7 +2105,7 @@ static u64 btrfs_num_devices(struct btrfs_fs_info *fs_info)</div><div class='ctx'> </div><div class='ctx'> 	down_read(&amp;fs_info-&gt;dev_replace.rwsem);</div><div class='ctx'> 	if (btrfs_dev_replace_is_ongoing(&amp;fs_info-&gt;dev_replace)) {</div><div class='del'>-		ASSERT(num_devices &gt; 1);</div><div class='add'>+		ASSERT(num_devices &gt; 1, "num_devices=%llu", num_devices);</div><div class='ctx'> 		num_devices--;</div><div class='ctx'> 	}</div><div class='ctx'> 	up_read(&amp;fs_info-&gt;dev_replace.rwsem);</div><div class='hunk'>@@ -2042,61 +2113,66 @@ static u64 btrfs_num_devices(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	return num_devices;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_scratch_superblocks(struct btrfs_fs_info *fs_info,</div><div class='del'>-			       struct block_device *bdev,</div><div class='del'>-			       const char *device_path)</div><div class='add'>+static void btrfs_scratch_superblock(struct btrfs_fs_info *fs_info,</div><div class='add'>+				     struct block_device *bdev, int copy_num)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_super_block *disk_super;</div><div class='del'>-	int copy_num;</div><div class='add'>+	const size_t len = sizeof(disk_super-&gt;magic);</div><div class='add'>+	const u64 bytenr = btrfs_sb_offset(copy_num);</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	if (!bdev)</div><div class='add'>+	disk_super = btrfs_read_disk_super(bdev, copy_num, false);</div><div class='add'>+	if (IS_ERR(disk_super))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	for (copy_num = 0; copy_num &lt; BTRFS_SUPER_MIRROR_MAX; copy_num++) {</div><div class='del'>-		struct page *page;</div><div class='del'>-		int ret;</div><div class='del'>-</div><div class='del'>-		disk_super = btrfs_read_dev_one_super(bdev, copy_num);</div><div class='del'>-		if (IS_ERR(disk_super))</div><div class='del'>-			continue;</div><div class='add'>+	memset(&amp;disk_super-&gt;magic, 0, len);</div><div class='add'>+	folio_mark_dirty(virt_to_folio(disk_super));</div><div class='add'>+	btrfs_release_disk_super(disk_super);</div><div class='ctx'> </div><div class='del'>-		if (bdev_is_zoned(bdev)) {</div><div class='del'>-			btrfs_reset_sb_log_zones(bdev, copy_num);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='add'>+	ret = sync_blockdev_range(bdev, bytenr, bytenr + len - 1);</div><div class='add'>+	if (ret)</div><div class='add'>+		btrfs_warn(fs_info, "error clearing superblock number %d (%d)",</div><div class='add'>+			copy_num, ret);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		memset(&amp;disk_super-&gt;magic, 0, sizeof(disk_super-&gt;magic));</div><div class='add'>+void btrfs_scratch_superblocks(struct btrfs_fs_info *fs_info, struct btrfs_device *device)</div><div class='add'>+{</div><div class='add'>+	int copy_num;</div><div class='add'>+	struct block_device *bdev = device-&gt;bdev;</div><div class='ctx'> </div><div class='del'>-		page = virt_to_page(disk_super);</div><div class='del'>-		set_page_dirty(page);</div><div class='del'>-		lock_page(page);</div><div class='del'>-		/* write_on_page() unlocks the page */</div><div class='del'>-		ret = write_one_page(page);</div><div class='del'>-		if (ret)</div><div class='del'>-			btrfs_warn(fs_info,</div><div class='del'>-				"error clearing superblock number %d (%d)",</div><div class='del'>-				copy_num, ret);</div><div class='del'>-		btrfs_release_disk_super(disk_super);</div><div class='add'>+	if (!bdev)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='add'>+	for (copy_num = 0; copy_num &lt; BTRFS_SUPER_MIRROR_MAX; copy_num++) {</div><div class='add'>+		if (bdev_is_zoned(bdev))</div><div class='add'>+			btrfs_reset_sb_log_zones(bdev, copy_num);</div><div class='add'>+		else</div><div class='add'>+			btrfs_scratch_superblock(fs_info, bdev, copy_num);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Notify udev that device has changed */</div><div class='ctx'> 	btrfs_kobject_uevent(bdev, KOBJ_CHANGE);</div><div class='ctx'> </div><div class='ctx'> 	/* Update ctime/mtime for device path for libblkid */</div><div class='del'>-	update_dev_time(device_path);</div><div class='add'>+	update_dev_time(rcu_dereference_raw(device-&gt;name));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_rm_device(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		    struct btrfs_dev_lookup_args *args,</div><div class='del'>-		    struct block_device **bdev, fmode_t *mode)</div><div class='add'>+		    struct file **bdev_file)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	struct btrfs_device *device;</div><div class='ctx'> 	struct btrfs_fs_devices *cur_devices;</div><div class='ctx'> 	struct btrfs_fs_devices *fs_devices = fs_info-&gt;fs_devices;</div><div class='ctx'> 	u64 num_devices;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='add'>+	if (btrfs_fs_incompat(fs_info, EXTENT_TREE_V2)) {</div><div class='add'>+		btrfs_err(fs_info, "device remove not supported on extent tree v2 yet");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The device list in fs_devices is accessed without locks (neither</div><div class='ctx'> 	 * uuid_mutex nor device_list_mutex) as it won't change on a mounted</div><div class='hunk'>@@ -2106,7 +2182,7 @@ int btrfs_rm_device(struct btrfs_fs_info *fs_info,</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_check_raid_min_devices(fs_info, num_devices - 1);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	device = btrfs_find_device(fs_info-&gt;fs_devices, args);</div><div class='ctx'> 	if (!device) {</div><div class='hunk'>@@ -2114,27 +2190,22 @@ int btrfs_rm_device(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			ret = BTRFS_ERROR_DEV_MISSING_NOT_FOUND;</div><div class='ctx'> 		else</div><div class='ctx'> 			ret = -ENOENT;</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (btrfs_pinned_by_swapfile(fs_info, device)) {</div><div class='del'>-		btrfs_warn_in_rcu(fs_info,</div><div class='add'>+		btrfs_warn(fs_info,</div><div class='ctx'> 		  "cannot remove device %s (devid %llu) due to active swapfile",</div><div class='del'>-				  rcu_str_deref(device-&gt;name), device-&gt;devid);</div><div class='del'>-		ret = -ETXTBSY;</div><div class='del'>-		goto out;</div><div class='add'>+				  btrfs_dev_name(device), device-&gt;devid);</div><div class='add'>+		return -ETXTBSY;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (test_bit(BTRFS_DEV_STATE_REPLACE_TGT, &amp;device-&gt;dev_state)) {</div><div class='del'>-		ret = BTRFS_ERROR_DEV_TGT_REPLACE;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (test_bit(BTRFS_DEV_STATE_REPLACE_TGT, &amp;device-&gt;dev_state))</div><div class='add'>+		return BTRFS_ERROR_DEV_TGT_REPLACE;</div><div class='ctx'> </div><div class='ctx'> 	if (test_bit(BTRFS_DEV_STATE_WRITEABLE, &amp;device-&gt;dev_state) &amp;&amp;</div><div class='del'>-	    fs_info-&gt;fs_devices-&gt;rw_devices == 1) {</div><div class='del'>-		ret = BTRFS_ERROR_DEV_ONLY_WRITABLE;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	    fs_info-&gt;fs_devices-&gt;rw_devices == 1)</div><div class='add'>+		return BTRFS_ERROR_DEV_ONLY_WRITABLE;</div><div class='ctx'> </div><div class='ctx'> 	if (test_bit(BTRFS_DEV_STATE_WRITEABLE, &amp;device-&gt;dev_state)) {</div><div class='ctx'> 		mutex_lock(&amp;fs_info-&gt;chunk_mutex);</div><div class='hunk'>@@ -2144,19 +2215,25 @@ int btrfs_rm_device(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_shrink_device(device, 0);</div><div class='del'>-	if (!ret)</div><div class='del'>-		btrfs_reada_remove_dev(device);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto error_undo;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * TODO: the superblock still includes this device in its num_devices</div><div class='del'>-	 * counter although write_all_supers() is not locked out. This</div><div class='del'>-	 * could give a filesystem state which requires a degraded mount.</div><div class='del'>-	 */</div><div class='del'>-	ret = btrfs_rm_dev_item(device);</div><div class='del'>-	if (ret)</div><div class='add'>+	trans = btrfs_start_transaction(fs_info-&gt;chunk_root, 0);</div><div class='add'>+	if (IS_ERR(trans)) {</div><div class='add'>+		ret = PTR_ERR(trans);</div><div class='ctx'> 		goto error_undo;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_rm_dev_item(trans, device);</div><div class='add'>+	if (unlikely(ret)) {</div><div class='add'>+		/* Any error in dev item removal is critical */</div><div class='add'>+		btrfs_crit(fs_info,</div><div class='add'>+			   "failed to remove device item for devid %llu: %d",</div><div class='add'>+			   device-&gt;devid, ret);</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		btrfs_end_transaction(trans);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	clear_bit(BTRFS_DEV_STATE_IN_FS_METADATA, &amp;device-&gt;dev_state);</div><div class='ctx'> 	btrfs_scrub_cancel_dev(device);</div><div class='hunk'>@@ -2191,7 +2268,7 @@ int btrfs_rm_device(struct btrfs_fs_info *fs_info,</div><div class='ctx'> </div><div class='ctx'> 	btrfs_assign_next_active_device(device, NULL);</div><div class='ctx'> </div><div class='del'>-	if (device-&gt;bdev) {</div><div class='add'>+	if (device-&gt;bdev_file) {</div><div class='ctx'> 		cur_devices-&gt;open_devices--;</div><div class='ctx'> 		/* remove sysfs entry */</div><div class='ctx'> 		btrfs_sysfs_remove_device(device);</div><div class='hunk'>@@ -2207,21 +2284,19 @@ int btrfs_rm_device(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	 * free the device.</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * We cannot call btrfs_close_bdev() here because we're holding the sb</div><div class='del'>-	 * write lock, and blkdev_put() will pull in the -&gt;open_mutex on the</div><div class='del'>-	 * block device and it's dependencies.  Instead just flush the device</div><div class='del'>-	 * and let the caller do the final blkdev_put.</div><div class='add'>+	 * write lock, and bdev_fput() on the block device will pull in the</div><div class='add'>+	 * -&gt;open_mutex on the block device and it's dependencies.  Instead</div><div class='add'>+	 *  just flush the device and let the caller do the final bdev_release.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (test_bit(BTRFS_DEV_STATE_WRITEABLE, &amp;device-&gt;dev_state)) {</div><div class='del'>-		btrfs_scratch_superblocks(fs_info, device-&gt;bdev,</div><div class='del'>-					  device-&gt;name-&gt;str);</div><div class='add'>+		btrfs_scratch_superblocks(fs_info, device);</div><div class='ctx'> 		if (device-&gt;bdev) {</div><div class='ctx'> 			sync_blockdev(device-&gt;bdev);</div><div class='ctx'> 			invalidate_bdev(device-&gt;bdev);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	*bdev = device-&gt;bdev;</div><div class='del'>-	*mode = device-&gt;mode;</div><div class='add'>+	*bdev_file = device-&gt;bdev_file;</div><div class='ctx'> 	synchronize_rcu();</div><div class='ctx'> 	btrfs_free_device(device);</div><div class='ctx'> </div><div class='hunk'>@@ -2234,16 +2309,16 @@ int btrfs_rm_device(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (cur_devices-&gt;num_devices == 0) {</div><div class='ctx'> 		list_del_init(&amp;cur_devices-&gt;seed_list);</div><div class='del'>-		ASSERT(cur_devices-&gt;opened == 1);</div><div class='add'>+		ASSERT(cur_devices-&gt;opened == 1, "opened=%d", cur_devices-&gt;opened);</div><div class='ctx'> 		cur_devices-&gt;opened--;</div><div class='ctx'> 		free_fs_devices(cur_devices);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-out:</div><div class='add'>+	ret = btrfs_commit_transaction(trans);</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> </div><div class='ctx'> error_undo:</div><div class='del'>-	btrfs_reada_undo_remove_dev(device);</div><div class='ctx'> 	if (test_bit(BTRFS_DEV_STATE_WRITEABLE, &amp;device-&gt;dev_state)) {</div><div class='ctx'> 		mutex_lock(&amp;fs_info-&gt;chunk_mutex);</div><div class='ctx'> 		list_add(&amp;device-&gt;dev_alloc_list,</div><div class='hunk'>@@ -2251,7 +2326,7 @@ error_undo:</div><div class='ctx'> 		device-&gt;fs_devices-&gt;rw_devices++;</div><div class='ctx'> 		mutex_unlock(&amp;fs_info-&gt;chunk_mutex);</div><div class='ctx'> 	}</div><div class='del'>-	goto out;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_rm_dev_replace_remove_srcdev(struct btrfs_device *srcdev)</div><div class='hunk'>@@ -2327,16 +2402,15 @@ void btrfs_destroy_dev_replace_tgtdev(struct btrfs_device *tgtdev)</div><div class='ctx'> </div><div class='ctx'> 	mutex_unlock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='ctx'> </div><div class='del'>-	btrfs_scratch_superblocks(tgtdev-&gt;fs_info, tgtdev-&gt;bdev,</div><div class='del'>-				  tgtdev-&gt;name-&gt;str);</div><div class='add'>+	btrfs_scratch_superblocks(tgtdev-&gt;fs_info, tgtdev);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_close_bdev(tgtdev);</div><div class='ctx'> 	synchronize_rcu();</div><div class='ctx'> 	btrfs_free_device(tgtdev);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * Populate args from device at path</div><div class='add'>+/*</div><div class='add'>+ * Populate args from device at path.</div><div class='ctx'>  *</div><div class='ctx'>  * @fs_info:	the filesystem</div><div class='ctx'>  * @args:	the args to populate</div><div class='hunk'>@@ -2358,7 +2432,7 @@ int btrfs_get_dev_args_from_path(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				 const char *path)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_super_block *disk_super;</div><div class='del'>-	struct block_device *bdev;</div><div class='add'>+	struct file *bdev_file;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!path || !path[0])</div><div class='hunk'>@@ -2375,10 +2449,13 @@ int btrfs_get_dev_args_from_path(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_get_bdev_and_sb(path, FMODE_READ, fs_info-&gt;bdev_holder, 0,</div><div class='del'>-				    &amp;bdev, &amp;disk_super);</div><div class='del'>-	if (ret)</div><div class='add'>+	ret = btrfs_get_bdev_and_sb(path, BLK_OPEN_READ, NULL, 0,</div><div class='add'>+				    &amp;bdev_file, &amp;disk_super);</div><div class='add'>+	if (ret) {</div><div class='add'>+		btrfs_put_dev_args_from_path(args);</div><div class='ctx'> 		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	args-&gt;devid = btrfs_stack_device_id(&amp;disk_super-&gt;dev_item);</div><div class='ctx'> 	memcpy(args-&gt;uuid, disk_super-&gt;dev_item.uuid, BTRFS_UUID_SIZE);</div><div class='ctx'> 	if (btrfs_fs_incompat(fs_info, METADATA_UUID))</div><div class='hunk'>@@ -2386,7 +2463,7 @@ int btrfs_get_dev_args_from_path(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	else</div><div class='ctx'> 		memcpy(args-&gt;fsid, disk_super-&gt;fsid, BTRFS_FSID_SIZE);</div><div class='ctx'> 	btrfs_release_disk_super(disk_super);</div><div class='del'>-	blkdev_put(bdev, FMODE_READ);</div><div class='add'>+	bdev_fput(bdev_file);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2429,29 +2506,23 @@ struct btrfs_device *btrfs_find_device_by_devspec(</div><div class='ctx'> 	return device;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * does all the dirty work required for changing file system's UUID.</div><div class='del'>- */</div><div class='del'>-static int btrfs_prepare_sprout(struct btrfs_fs_info *fs_info)</div><div class='add'>+static struct btrfs_fs_devices *btrfs_init_sprout(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_devices *fs_devices = fs_info-&gt;fs_devices;</div><div class='ctx'> 	struct btrfs_fs_devices *old_devices;</div><div class='ctx'> 	struct btrfs_fs_devices *seed_devices;</div><div class='del'>-	struct btrfs_super_block *disk_super = fs_info-&gt;super_copy;</div><div class='del'>-	struct btrfs_device *device;</div><div class='del'>-	u64 super_flags;</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;uuid_mutex);</div><div class='ctx'> 	if (!fs_devices-&gt;seeding)</div><div class='del'>-		return -EINVAL;</div><div class='add'>+		return ERR_PTR(-EINVAL);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Private copy of the seed devices, anchored at</div><div class='ctx'> 	 * fs_info-&gt;fs_devices-&gt;seed_list</div><div class='ctx'> 	 */</div><div class='del'>-	seed_devices = alloc_fs_devices(NULL, NULL);</div><div class='add'>+	seed_devices = alloc_fs_devices(NULL);</div><div class='ctx'> 	if (IS_ERR(seed_devices))</div><div class='del'>-		return PTR_ERR(seed_devices);</div><div class='add'>+		return seed_devices;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * It's necessary to retain a copy of the original seed fs_devices in</div><div class='hunk'>@@ -2462,7 +2533,7 @@ static int btrfs_prepare_sprout(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	old_devices = clone_fs_devices(fs_devices);</div><div class='ctx'> 	if (IS_ERR(old_devices)) {</div><div class='ctx'> 		kfree(seed_devices);</div><div class='del'>-		return PTR_ERR(old_devices);</div><div class='add'>+		return old_devices;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	list_add(&amp;old_devices-&gt;fs_list, &amp;fs_uuids);</div><div class='hunk'>@@ -2473,7 +2544,41 @@ static int btrfs_prepare_sprout(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;seed_devices-&gt;alloc_list);</div><div class='ctx'> 	mutex_init(&amp;seed_devices-&gt;device_list_mutex);</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='add'>+	return seed_devices;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Splice seed devices into the sprout fs_devices.</div><div class='add'>+ * Generate a new fsid for the sprouted read-write filesystem.</div><div class='add'>+ */</div><div class='add'>+static void btrfs_setup_sprout(struct btrfs_fs_info *fs_info,</div><div class='add'>+			       struct btrfs_fs_devices *seed_devices)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_devices *fs_devices = fs_info-&gt;fs_devices;</div><div class='add'>+	struct btrfs_super_block *disk_super = fs_info-&gt;super_copy;</div><div class='add'>+	struct btrfs_device *device;</div><div class='add'>+	u64 super_flags;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We are updating the fsid, the thread leading to device_list_add()</div><div class='add'>+	 * could race, so uuid_mutex is needed.</div><div class='add'>+	 */</div><div class='add'>+	lockdep_assert_held(&amp;uuid_mutex);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The threads listed below may traverse dev_list but can do that without</div><div class='add'>+	 * device_list_mutex:</div><div class='add'>+	 * - All device ops and balance - as we are in btrfs_exclop_start.</div><div class='add'>+	 * - Various dev_list readers - are using RCU.</div><div class='add'>+	 * - btrfs_ioctl_fitrim() - is using RCU.</div><div class='add'>+	 *</div><div class='add'>+	 * For-read threads as below are using device_list_mutex:</div><div class='add'>+	 * - Readonly scrub btrfs_scrub_dev()</div><div class='add'>+	 * - Readonly scrub btrfs_scrub_progress()</div><div class='add'>+	 * - btrfs_get_dev_stats()</div><div class='add'>+	 */</div><div class='add'>+	lockdep_assert_held(&amp;fs_devices-&gt;device_list_mutex);</div><div class='add'>+</div><div class='ctx'> 	list_splice_init_rcu(&amp;fs_devices-&gt;devices, &amp;seed_devices-&gt;devices,</div><div class='ctx'> 			      synchronize_rcu);</div><div class='ctx'> 	list_for_each_entry(device, &amp;seed_devices-&gt;devices, dev_list)</div><div class='hunk'>@@ -2489,13 +2594,10 @@ static int btrfs_prepare_sprout(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	generate_random_uuid(fs_devices-&gt;fsid);</div><div class='ctx'> 	memcpy(fs_devices-&gt;metadata_uuid, fs_devices-&gt;fsid, BTRFS_FSID_SIZE);</div><div class='ctx'> 	memcpy(disk_super-&gt;fsid, fs_devices-&gt;fsid, BTRFS_FSID_SIZE);</div><div class='del'>-	mutex_unlock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='ctx'> </div><div class='ctx'> 	super_flags = btrfs_super_flags(disk_super) &amp;</div><div class='ctx'> 		      ~BTRFS_SUPER_FLAG_SEEDING;</div><div class='ctx'> 	btrfs_set_super_flags(disk_super, super_flags);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2506,7 +2608,7 @@ static int btrfs_finish_sprout(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	BTRFS_DEV_LOOKUP_ARGS(args);</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_root *root = fs_info-&gt;chunk_root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_dev_item *dev_item;</div><div class='ctx'> 	struct btrfs_device *device;</div><div class='hunk'>@@ -2520,15 +2622,15 @@ static int btrfs_finish_sprout(struct btrfs_trans_handle *trans)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = BTRFS_DEV_ITEMS_OBJECTID;</div><div class='del'>-	key.offset = 0;</div><div class='ctx'> 	key.type = BTRFS_DEV_ITEM_KEY;</div><div class='add'>+	key.offset = 0;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		btrfs_reserve_chunk_metadata(trans, false);</div><div class='ctx'> 		ret = btrfs_search_slot(trans, root, &amp;key, path, 0, 1);</div><div class='ctx'> 		btrfs_trans_release_chunk_metadata(trans);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto error;</div><div class='add'>+			return ret;</div><div class='ctx'> </div><div class='ctx'> 		leaf = path-&gt;nodes[0];</div><div class='ctx'> next_slot:</div><div class='hunk'>@@ -2537,7 +2639,7 @@ next_slot:</div><div class='ctx'> 			if (ret &gt; 0)</div><div class='ctx'> 				break;</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='del'>-				goto error;</div><div class='add'>+				return ret;</div><div class='ctx'> 			leaf = path-&gt;nodes[0];</div><div class='ctx'> 			btrfs_item_key_to_cpu(leaf, &amp;key, path-&gt;slots[0]);</div><div class='ctx'> 			btrfs_release_path(path);</div><div class='hunk'>@@ -2561,62 +2663,61 @@ next_slot:</div><div class='ctx'> 		device = btrfs_find_device(fs_info-&gt;fs_devices, &amp;args);</div><div class='ctx'> 		BUG_ON(!device); /* Logic error */</div><div class='ctx'> </div><div class='del'>-		if (device-&gt;fs_devices-&gt;seeding) {</div><div class='add'>+		if (device-&gt;fs_devices-&gt;seeding)</div><div class='ctx'> 			btrfs_set_device_generation(leaf, dev_item,</div><div class='ctx'> 						    device-&gt;generation);</div><div class='del'>-			btrfs_mark_buffer_dirty(leaf);</div><div class='del'>-		}</div><div class='ctx'> </div><div class='ctx'> 		path-&gt;slots[0]++;</div><div class='ctx'> 		goto next_slot;</div><div class='ctx'> 	}</div><div class='del'>-	ret = 0;</div><div class='del'>-error:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_init_new_device(struct btrfs_fs_info *fs_info, const char *device_path)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root = fs_info-&gt;dev_root;</div><div class='del'>-	struct request_queue *q;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='ctx'> 	struct btrfs_device *device;</div><div class='del'>-	struct block_device *bdev;</div><div class='add'>+	struct file *bdev_file;</div><div class='ctx'> 	struct super_block *sb = fs_info-&gt;sb;</div><div class='del'>-	struct rcu_string *name;</div><div class='ctx'> 	struct btrfs_fs_devices *fs_devices = fs_info-&gt;fs_devices;</div><div class='add'>+	struct btrfs_fs_devices *seed_devices = NULL;</div><div class='ctx'> 	u64 orig_super_total_bytes;</div><div class='ctx'> 	u64 orig_super_num_devices;</div><div class='del'>-	int seeding_dev = 0;</div><div class='ctx'> 	int ret = 0;</div><div class='add'>+	bool seeding_dev = false;</div><div class='ctx'> 	bool locked = false;</div><div class='ctx'> </div><div class='ctx'> 	if (sb_rdonly(sb) &amp;&amp; !fs_devices-&gt;seeding)</div><div class='ctx'> 		return -EROFS;</div><div class='ctx'> </div><div class='del'>-	bdev = blkdev_get_by_path(device_path, FMODE_WRITE | FMODE_EXCL,</div><div class='del'>-				  fs_info-&gt;bdev_holder);</div><div class='del'>-	if (IS_ERR(bdev))</div><div class='del'>-		return PTR_ERR(bdev);</div><div class='add'>+	bdev_file = bdev_file_open_by_path(device_path, BLK_OPEN_WRITE,</div><div class='add'>+					   fs_info-&gt;sb, &amp;fs_holder_ops);</div><div class='add'>+	if (IS_ERR(bdev_file))</div><div class='add'>+		return PTR_ERR(bdev_file);</div><div class='add'>+</div><div class='add'>+	if (!btrfs_check_device_zone_type(fs_info, file_bdev(bdev_file))) {</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto error;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (!btrfs_check_device_zone_type(fs_info, bdev)) {</div><div class='add'>+	if (bdev_nr_bytes(file_bdev(bdev_file)) &lt;= BTRFS_DEVICE_RANGE_RESERVED) {</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 		goto error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (fs_devices-&gt;seeding) {</div><div class='del'>-		seeding_dev = 1;</div><div class='add'>+		seeding_dev = true;</div><div class='ctx'> 		down_write(&amp;sb-&gt;s_umount);</div><div class='ctx'> 		mutex_lock(&amp;uuid_mutex);</div><div class='ctx'> 		locked = true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	sync_blockdev(bdev);</div><div class='add'>+	sync_blockdev(file_bdev(bdev_file));</div><div class='ctx'> </div><div class='ctx'> 	rcu_read_lock();</div><div class='ctx'> 	list_for_each_entry_rcu(device, &amp;fs_devices-&gt;devices, dev_list) {</div><div class='del'>-		if (device-&gt;bdev == bdev) {</div><div class='add'>+		if (device-&gt;bdev == file_bdev(bdev_file)) {</div><div class='ctx'> 			ret = -EEXIST;</div><div class='ctx'> 			rcu_read_unlock();</div><div class='ctx'> 			goto error;</div><div class='hunk'>@@ -2624,24 +2725,21 @@ int btrfs_init_new_device(struct btrfs_fs_info *fs_info, const char *device_path</div><div class='ctx'> 	}</div><div class='ctx'> 	rcu_read_unlock();</div><div class='ctx'> </div><div class='del'>-	device = btrfs_alloc_device(fs_info, NULL, NULL);</div><div class='add'>+	device = btrfs_alloc_device(fs_info, NULL, NULL, device_path);</div><div class='ctx'> 	if (IS_ERR(device)) {</div><div class='ctx'> 		/* we can safely leave the fs_devices entry around */</div><div class='ctx'> 		ret = PTR_ERR(device);</div><div class='ctx'> 		goto error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	name = rcu_string_strdup(device_path, GFP_KERNEL);</div><div class='del'>-	if (!name) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto error_free_device;</div><div class='del'>-	}</div><div class='del'>-	rcu_assign_pointer(device-&gt;name, name);</div><div class='del'>-</div><div class='ctx'> 	device-&gt;fs_info = fs_info;</div><div class='del'>-	device-&gt;bdev = bdev;</div><div class='add'>+	device-&gt;bdev_file = bdev_file;</div><div class='add'>+	device-&gt;bdev = file_bdev(bdev_file);</div><div class='add'>+	ret = lookup_bdev(device_path, &amp;device-&gt;devt);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto error_free_device;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_get_dev_zone_info(device);</div><div class='add'>+	ret = btrfs_get_dev_zone_info(device, false);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto error_free_device;</div><div class='ctx'> </div><div class='hunk'>@@ -2651,36 +2749,39 @@ int btrfs_init_new_device(struct btrfs_fs_info *fs_info, const char *device_path</div><div class='ctx'> 		goto error_free_zone;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	q = bdev_get_queue(bdev);</div><div class='ctx'> 	set_bit(BTRFS_DEV_STATE_WRITEABLE, &amp;device-&gt;dev_state);</div><div class='ctx'> 	device-&gt;generation = trans-&gt;transid;</div><div class='ctx'> 	device-&gt;io_width = fs_info-&gt;sectorsize;</div><div class='ctx'> 	device-&gt;io_align = fs_info-&gt;sectorsize;</div><div class='ctx'> 	device-&gt;sector_size = fs_info-&gt;sectorsize;</div><div class='ctx'> 	device-&gt;total_bytes =</div><div class='del'>-		round_down(bdev_nr_bytes(bdev), fs_info-&gt;sectorsize);</div><div class='add'>+		round_down(bdev_nr_bytes(device-&gt;bdev), fs_info-&gt;sectorsize);</div><div class='ctx'> 	device-&gt;disk_total_bytes = device-&gt;total_bytes;</div><div class='ctx'> 	device-&gt;commit_total_bytes = device-&gt;total_bytes;</div><div class='ctx'> 	set_bit(BTRFS_DEV_STATE_IN_FS_METADATA, &amp;device-&gt;dev_state);</div><div class='ctx'> 	clear_bit(BTRFS_DEV_STATE_REPLACE_TGT, &amp;device-&gt;dev_state);</div><div class='del'>-	device-&gt;mode = FMODE_EXCL;</div><div class='ctx'> 	device-&gt;dev_stats_valid = 1;</div><div class='del'>-	set_blocksize(device-&gt;bdev, BTRFS_BDEV_BLOCKSIZE);</div><div class='add'>+	set_blocksize(device-&gt;bdev_file, BTRFS_BDEV_BLOCKSIZE);</div><div class='ctx'> </div><div class='ctx'> 	if (seeding_dev) {</div><div class='del'>-		btrfs_clear_sb_rdonly(sb);</div><div class='del'>-		ret = btrfs_prepare_sprout(fs_info);</div><div class='del'>-		if (ret) {</div><div class='add'>+		/* GFP_KERNEL allocation must not be under device_list_mutex */</div><div class='add'>+		seed_devices = btrfs_init_sprout(fs_info);</div><div class='add'>+		if (IS_ERR(seed_devices)) {</div><div class='add'>+			ret = PTR_ERR(seed_devices);</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto error_trans;</div><div class='ctx'> 		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='add'>+	if (seeding_dev) {</div><div class='add'>+		btrfs_setup_sprout(fs_info, seed_devices);</div><div class='ctx'> 		btrfs_assign_next_active_device(fs_info-&gt;fs_devices-&gt;latest_dev,</div><div class='ctx'> 						device);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	device-&gt;fs_devices = fs_devices;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='ctx'> 	mutex_lock(&amp;fs_info-&gt;chunk_mutex);</div><div class='ctx'> 	list_add_rcu(&amp;device-&gt;dev_list, &amp;fs_devices-&gt;devices);</div><div class='ctx'> 	list_add(&amp;device-&gt;dev_alloc_list, &amp;fs_devices-&gt;alloc_list);</div><div class='hunk'>@@ -2692,7 +2793,7 @@ int btrfs_init_new_device(struct btrfs_fs_info *fs_info, const char *device_path</div><div class='ctx'> </div><div class='ctx'> 	atomic64_add(device-&gt;total_bytes, &amp;fs_info-&gt;free_chunk_space);</div><div class='ctx'> </div><div class='del'>-	if (!blk_queue_nonrot(q))</div><div class='add'>+	if (!bdev_nonrot(device-&gt;bdev))</div><div class='ctx'> 		fs_devices-&gt;rotating = true;</div><div class='ctx'> </div><div class='ctx'> 	orig_super_total_bytes = btrfs_super_total_bytes(fs_info-&gt;super_copy);</div><div class='hunk'>@@ -2721,28 +2822,28 @@ int btrfs_init_new_device(struct btrfs_fs_info *fs_info, const char *device_path</div><div class='ctx'> 		mutex_lock(&amp;fs_info-&gt;chunk_mutex);</div><div class='ctx'> 		ret = init_first_rw_device(trans);</div><div class='ctx'> 		mutex_unlock(&amp;fs_info-&gt;chunk_mutex);</div><div class='del'>-		if (ret) {</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto error_sysfs;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_add_dev_item(trans, device);</div><div class='del'>-	if (ret) {</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto error_sysfs;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (seeding_dev) {</div><div class='ctx'> 		ret = btrfs_finish_sprout(trans);</div><div class='del'>-		if (ret) {</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto error_sysfs;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * fs_devices now represents the newly sprouted filesystem and</div><div class='del'>-		 * its fsid has been changed by btrfs_prepare_sprout</div><div class='add'>+		 * its fsid has been changed by btrfs_sprout_splice().</div><div class='ctx'> 		 */</div><div class='ctx'> 		btrfs_sysfs_update_sprout_fsid(fs_devices);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2779,7 +2880,7 @@ int btrfs_init_new_device(struct btrfs_fs_info *fs_info, const char *device_path</div><div class='ctx'> 	 * We can ignore the return value as it typically returns -EINVAL and</div><div class='ctx'> 	 * only succeeds if the device was an alien.</div><div class='ctx'> 	 */</div><div class='del'>-	btrfs_forget_devices(device_path);</div><div class='add'>+	btrfs_forget_devices(device-&gt;devt);</div><div class='ctx'> </div><div class='ctx'> 	/* Update ctime/mtime for blkid or udev */</div><div class='ctx'> 	update_dev_time(device_path);</div><div class='hunk'>@@ -2805,8 +2906,6 @@ error_sysfs:</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;chunk_mutex);</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;fs_devices-&gt;device_list_mutex);</div><div class='ctx'> error_trans:</div><div class='del'>-	if (seeding_dev)</div><div class='del'>-		btrfs_set_sb_rdonly(sb);</div><div class='ctx'> 	if (trans)</div><div class='ctx'> 		btrfs_end_transaction(trans);</div><div class='ctx'> error_free_zone:</div><div class='hunk'>@@ -2814,7 +2913,7 @@ error_free_zone:</div><div class='ctx'> error_free_device:</div><div class='ctx'> 	btrfs_free_device(device);</div><div class='ctx'> error:</div><div class='del'>-	blkdev_put(bdev, FMODE_EXCL);</div><div class='add'>+	bdev_fput(bdev_file);</div><div class='ctx'> 	if (locked) {</div><div class='ctx'> 		mutex_unlock(&amp;uuid_mutex);</div><div class='ctx'> 		up_write(&amp;sb-&gt;s_umount);</div><div class='hunk'>@@ -2826,7 +2925,7 @@ static noinline int btrfs_update_device(struct btrfs_trans_handle *trans,</div><div class='ctx'> 					struct btrfs_device *device)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_root *root = device-&gt;fs_info-&gt;chunk_root;</div><div class='ctx'> 	struct btrfs_dev_item *dev_item;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='hunk'>@@ -2842,12 +2941,10 @@ static noinline int btrfs_update_device(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_search_slot(trans, root, &amp;key, path, 0, 1);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	if (ret &gt; 0) {</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	dev_item = btrfs_item_ptr(leaf, path-&gt;slots[0], struct btrfs_dev_item);</div><div class='hunk'>@@ -2861,10 +2958,6 @@ static noinline int btrfs_update_device(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				     btrfs_device_get_disk_total_bytes(device));</div><div class='ctx'> 	btrfs_set_device_bytes_used(leaf, dev_item,</div><div class='ctx'> 				    btrfs_device_get_bytes_used(device));</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2895,6 +2988,7 @@ int btrfs_grow_device(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	btrfs_set_super_total_bytes(super_copy,</div><div class='ctx'> 			round_down(old_total + diff, fs_info-&gt;sectorsize));</div><div class='ctx'> 	device-&gt;fs_devices-&gt;total_rw_bytes += diff;</div><div class='add'>+	atomic64_add(diff, &amp;fs_info-&gt;free_chunk_space);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_device_set_total_bytes(device, new_size);</div><div class='ctx'> 	btrfs_device_set_disk_total_bytes(device, new_size);</div><div class='hunk'>@@ -2916,7 +3010,7 @@ static int btrfs_free_chunk(struct btrfs_trans_handle *trans, u64 chunk_offset)</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_root *root = fs_info-&gt;chunk_root;</div><div class='ctx'> 	int ret;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='hunk'>@@ -2924,25 +3018,26 @@ static int btrfs_free_chunk(struct btrfs_trans_handle *trans, u64 chunk_offset)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	key.objectid = BTRFS_FIRST_CHUNK_TREE_OBJECTID;</div><div class='del'>-	key.offset = chunk_offset;</div><div class='ctx'> 	key.type = BTRFS_CHUNK_ITEM_KEY;</div><div class='add'>+	key.offset = chunk_offset;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_search_slot(trans, root, &amp;key, path, -1, 1);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-	else if (ret &gt; 0) { /* Logic error or corruption */</div><div class='del'>-		btrfs_handle_fs_error(fs_info, -ENOENT,</div><div class='del'>-				      "Failed lookup while freeing chunk.");</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='add'>+	if (unlikely(ret &gt; 0)) {</div><div class='add'>+		/* Logic error or corruption */</div><div class='add'>+		btrfs_err(fs_info, "failed to lookup chunk %llu when freeing",</div><div class='add'>+			  chunk_offset);</div><div class='add'>+		btrfs_abort_transaction(trans, -ENOENT);</div><div class='add'>+		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_del_item(trans, root, path);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		btrfs_handle_fs_error(fs_info, ret,</div><div class='del'>-				      "Failed to delete chunk item.");</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='add'>+	if (unlikely(ret &lt; 0)) {</div><div class='add'>+		btrfs_err(fs_info, "failed to delete chunk %llu item", chunk_offset);</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2992,44 +3087,118 @@ static int btrfs_del_sys_chunk(struct btrfs_fs_info *fs_info, u64 chunk_offset)</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+struct btrfs_chunk_map *btrfs_find_chunk_map_nolock(struct btrfs_fs_info *fs_info,</div><div class='add'>+						    u64 logical, u64 length)</div><div class='add'>+{</div><div class='add'>+	struct rb_node *node = fs_info-&gt;mapping_tree.rb_root.rb_node;</div><div class='add'>+	struct rb_node *prev = NULL;</div><div class='add'>+	struct rb_node *orig_prev;</div><div class='add'>+	struct btrfs_chunk_map *map;</div><div class='add'>+	struct btrfs_chunk_map *prev_map = NULL;</div><div class='add'>+</div><div class='add'>+	while (node) {</div><div class='add'>+		map = rb_entry(node, struct btrfs_chunk_map, rb_node);</div><div class='add'>+		prev = node;</div><div class='add'>+		prev_map = map;</div><div class='add'>+</div><div class='add'>+		if (logical &lt; map-&gt;start) {</div><div class='add'>+			node = node-&gt;rb_left;</div><div class='add'>+		} else if (logical &gt;= map-&gt;start + map-&gt;chunk_len) {</div><div class='add'>+			node = node-&gt;rb_right;</div><div class='add'>+		} else {</div><div class='add'>+			refcount_inc(&amp;map-&gt;refs);</div><div class='add'>+			return map;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!prev)</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	orig_prev = prev;</div><div class='add'>+	while (prev &amp;&amp; logical &gt;= prev_map-&gt;start + prev_map-&gt;chunk_len) {</div><div class='add'>+		prev = rb_next(prev);</div><div class='add'>+		prev_map = rb_entry(prev, struct btrfs_chunk_map, rb_node);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!prev) {</div><div class='add'>+		prev = orig_prev;</div><div class='add'>+		prev_map = rb_entry(prev, struct btrfs_chunk_map, rb_node);</div><div class='add'>+		while (prev &amp;&amp; logical &lt; prev_map-&gt;start) {</div><div class='add'>+			prev = rb_prev(prev);</div><div class='add'>+			prev_map = rb_entry(prev, struct btrfs_chunk_map, rb_node);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (prev) {</div><div class='add'>+		u64 end = logical + length;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Caller can pass a U64_MAX length when it wants to get any</div><div class='add'>+		 * chunk starting at an offset of 'logical' or higher, so deal</div><div class='add'>+		 * with underflow by resetting the end offset to U64_MAX.</div><div class='add'>+		 */</div><div class='add'>+		if (end &lt; logical)</div><div class='add'>+			end = U64_MAX;</div><div class='add'>+</div><div class='add'>+		if (end &gt; prev_map-&gt;start &amp;&amp;</div><div class='add'>+		    logical &lt; prev_map-&gt;start + prev_map-&gt;chunk_len) {</div><div class='add'>+			refcount_inc(&amp;prev_map-&gt;refs);</div><div class='add'>+			return prev_map;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct btrfs_chunk_map *btrfs_find_chunk_map(struct btrfs_fs_info *fs_info,</div><div class='add'>+					     u64 logical, u64 length)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_chunk_map *map;</div><div class='add'>+</div><div class='add'>+	read_lock(&amp;fs_info-&gt;mapping_tree_lock);</div><div class='add'>+	map = btrfs_find_chunk_map_nolock(fs_info, logical, length);</div><div class='add'>+	read_unlock(&amp;fs_info-&gt;mapping_tree_lock);</div><div class='add'>+</div><div class='add'>+	return map;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='del'>- * btrfs_get_chunk_map() - Find the mapping containing the given logical extent.</div><div class='add'>+ * Find the mapping containing the given logical extent.</div><div class='add'>+ *</div><div class='ctx'>  * @logical: Logical block offset in bytes.</div><div class='ctx'>  * @length: Length of extent in bytes.</div><div class='ctx'>  *</div><div class='ctx'>  * Return: Chunk mapping or ERR_PTR.</div><div class='ctx'>  */</div><div class='del'>-struct extent_map *btrfs_get_chunk_map(struct btrfs_fs_info *fs_info,</div><div class='del'>-				       u64 logical, u64 length)</div><div class='add'>+struct btrfs_chunk_map *btrfs_get_chunk_map(struct btrfs_fs_info *fs_info,</div><div class='add'>+					    u64 logical, u64 length)</div><div class='ctx'> {</div><div class='del'>-	struct extent_map_tree *em_tree;</div><div class='del'>-	struct extent_map *em;</div><div class='add'>+	struct btrfs_chunk_map *map;</div><div class='ctx'> </div><div class='del'>-	em_tree = &amp;fs_info-&gt;mapping_tree;</div><div class='del'>-	read_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	em = lookup_extent_mapping(em_tree, logical, length);</div><div class='del'>-	read_unlock(&amp;em_tree-&gt;lock);</div><div class='add'>+	map = btrfs_find_chunk_map(fs_info, logical, length);</div><div class='ctx'> </div><div class='del'>-	if (!em) {</div><div class='del'>-		btrfs_crit(fs_info, "unable to find logical %llu length %llu",</div><div class='add'>+	if (unlikely(!map)) {</div><div class='add'>+		btrfs_crit(fs_info,</div><div class='add'>+			   "unable to find chunk map for logical %llu length %llu",</div><div class='ctx'> 			   logical, length);</div><div class='ctx'> 		return ERR_PTR(-EINVAL);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (em-&gt;start &gt; logical || em-&gt;start + em-&gt;len &lt; logical) {</div><div class='add'>+	if (unlikely(map-&gt;start &gt; logical || map-&gt;start + map-&gt;chunk_len &lt;= logical)) {</div><div class='ctx'> 		btrfs_crit(fs_info,</div><div class='del'>-			   "found a bad mapping, wanted %llu-%llu, found %llu-%llu",</div><div class='del'>-			   logical, length, em-&gt;start, em-&gt;start + em-&gt;len);</div><div class='del'>-		free_extent_map(em);</div><div class='add'>+			   "found a bad chunk map, wanted %llu-%llu, found %llu-%llu",</div><div class='add'>+			   logical, logical + length, map-&gt;start,</div><div class='add'>+			   map-&gt;start + map-&gt;chunk_len);</div><div class='add'>+		btrfs_free_chunk_map(map);</div><div class='ctx'> 		return ERR_PTR(-EINVAL);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* callers are responsible for dropping em's ref. */</div><div class='del'>-	return em;</div><div class='add'>+	/* Callers are responsible for dropping the reference. */</div><div class='add'>+	return map;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int remove_chunk_item(struct btrfs_trans_handle *trans,</div><div class='del'>-			     struct map_lookup *map, u64 chunk_offset)</div><div class='add'>+			     struct btrfs_chunk_map *map, u64 chunk_offset)</div><div class='ctx'> {</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='hunk'>@@ -3054,23 +3223,22 @@ static int remove_chunk_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> int btrfs_remove_chunk(struct btrfs_trans_handle *trans, u64 chunk_offset)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	struct map_lookup *map;</div><div class='add'>+	struct btrfs_chunk_map *map;</div><div class='ctx'> 	u64 dev_extent_len = 0;</div><div class='ctx'> 	int i, ret = 0;</div><div class='ctx'> 	struct btrfs_fs_devices *fs_devices = fs_info-&gt;fs_devices;</div><div class='ctx'> </div><div class='del'>-	em = btrfs_get_chunk_map(fs_info, chunk_offset, 1);</div><div class='del'>-	if (IS_ERR(em)) {</div><div class='add'>+	map = btrfs_get_chunk_map(fs_info, chunk_offset, 1);</div><div class='add'>+	if (IS_ERR(map)) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * This is a logic error, but we don't want to just rely on the</div><div class='ctx'> 		 * user having built with ASSERT enabled, so if ASSERT doesn't</div><div class='ctx'> 		 * do anything we still error out.</div><div class='ctx'> 		 */</div><div class='del'>-		ASSERT(0);</div><div class='del'>-		return PTR_ERR(em);</div><div class='add'>+		DEBUG_WARN("errr %ld reading chunk map at offset %llu",</div><div class='add'>+			   PTR_ERR(map), chunk_offset);</div><div class='add'>+		return PTR_ERR(map);</div><div class='ctx'> 	}</div><div class='del'>-	map = em-&gt;map_lookup;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * First delete the device extent items from the devices btree.</div><div class='hunk'>@@ -3088,7 +3256,7 @@ int btrfs_remove_chunk(struct btrfs_trans_handle *trans, u64 chunk_offset)</div><div class='ctx'> 		ret = btrfs_free_dev_extent(trans, device,</div><div class='ctx'> 					    map-&gt;stripes[i].physical,</div><div class='ctx'> 					    &amp;dev_extent_len);</div><div class='del'>-		if (ret) {</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			mutex_unlock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out;</div><div class='hunk'>@@ -3100,6 +3268,12 @@ int btrfs_remove_chunk(struct btrfs_trans_handle *trans, u64 chunk_offset)</div><div class='ctx'> 					device-&gt;bytes_used - dev_extent_len);</div><div class='ctx'> 			atomic64_add(dev_extent_len, &amp;fs_info-&gt;free_chunk_space);</div><div class='ctx'> 			btrfs_clear_space_info_full(fs_info);</div><div class='add'>+</div><div class='add'>+			if (list_empty(&amp;device-&gt;post_commit_list)) {</div><div class='add'>+				list_add_tail(&amp;device-&gt;post_commit_list,</div><div class='add'>+					      &amp;trans-&gt;transaction-&gt;dev_update_list);</div><div class='add'>+			}</div><div class='add'>+</div><div class='ctx'> 			mutex_unlock(&amp;fs_info-&gt;chunk_mutex);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3149,8 +3323,16 @@ int btrfs_remove_chunk(struct btrfs_trans_handle *trans, u64 chunk_offset)</div><div class='ctx'> 	if (ret == -ENOSPC) {</div><div class='ctx'> 		const u64 sys_flags = btrfs_system_alloc_profile(fs_info);</div><div class='ctx'> 		struct btrfs_block_group *sys_bg;</div><div class='add'>+		struct btrfs_space_info *space_info;</div><div class='add'>+</div><div class='add'>+		space_info = btrfs_find_space_info(fs_info, sys_flags);</div><div class='add'>+		if (unlikely(!space_info)) {</div><div class='add'>+			ret = -EINVAL;</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-		sys_bg = btrfs_create_chunk(trans, sys_flags);</div><div class='add'>+		sys_bg = btrfs_create_chunk(trans, space_info, sys_flags);</div><div class='ctx'> 		if (IS_ERR(sys_bg)) {</div><div class='ctx'> 			ret = PTR_ERR(sys_bg);</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='hunk'>@@ -3158,26 +3340,26 @@ int btrfs_remove_chunk(struct btrfs_trans_handle *trans, u64 chunk_offset)</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		ret = btrfs_chunk_alloc_add_chunk_item(trans, sys_bg);</div><div class='del'>-		if (ret) {</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		ret = remove_chunk_item(trans, map, chunk_offset);</div><div class='del'>-		if (ret) {</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='del'>-	} else if (ret) {</div><div class='add'>+	} else if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	trace_btrfs_chunk_free(fs_info, map, chunk_offset, em-&gt;len);</div><div class='add'>+	trace_btrfs_chunk_free(fs_info, map, chunk_offset, map-&gt;chunk_len);</div><div class='ctx'> </div><div class='ctx'> 	if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_SYSTEM) {</div><div class='ctx'> 		ret = btrfs_del_sys_chunk(fs_info, chunk_offset);</div><div class='del'>-		if (ret) {</div><div class='add'>+		if (unlikely(ret)) {</div><div class='ctx'> 			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -3192,8 +3374,8 @@ int btrfs_remove_chunk(struct btrfs_trans_handle *trans, u64 chunk_offset)</div><div class='ctx'> 	 */</div><div class='ctx'> 	btrfs_trans_release_chunk_metadata(trans);</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_remove_block_group(trans, chunk_offset, em);</div><div class='del'>-	if (ret) {</div><div class='add'>+	ret = btrfs_remove_block_group(trans, map);</div><div class='add'>+	if (unlikely(ret)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3204,11 +3386,12 @@ out:</div><div class='ctx'> 		trans-&gt;removing_chunk = false;</div><div class='ctx'> 	}</div><div class='ctx'> 	/* once for us */</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_chunk_map(map);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_relocate_chunk(struct btrfs_fs_info *fs_info, u64 chunk_offset)</div><div class='add'>+int btrfs_relocate_chunk(struct btrfs_fs_info *fs_info, u64 chunk_offset,</div><div class='add'>+			 bool verbose)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root = fs_info-&gt;chunk_root;</div><div class='ctx'> 	struct btrfs_trans_handle *trans;</div><div class='hunk'>@@ -3216,6 +3399,12 @@ int btrfs_relocate_chunk(struct btrfs_fs_info *fs_info, u64 chunk_offset)</div><div class='ctx'> 	u64 length;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='add'>+	if (btrfs_fs_incompat(fs_info, EXTENT_TREE_V2)) {</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+			  "relocate: not supported on extent tree v2 yet");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Prevent races with automatic removal of unused block groups.</div><div class='ctx'> 	 * After we relocate and before we remove the chunk with offset</div><div class='hunk'>@@ -3232,10 +3421,17 @@ int btrfs_relocate_chunk(struct btrfs_fs_info *fs_info, u64 chunk_offset)</div><div class='ctx'> </div><div class='ctx'> 	/* step one, relocate all the extents inside this chunk */</div><div class='ctx'> 	btrfs_scrub_pause(fs_info);</div><div class='del'>-	ret = btrfs_relocate_block_group(fs_info, chunk_offset);</div><div class='add'>+	ret = btrfs_relocate_block_group(fs_info, chunk_offset, true);</div><div class='ctx'> 	btrfs_scrub_continue(fs_info);</div><div class='del'>-	if (ret)</div><div class='add'>+	if (ret) {</div><div class='add'>+		/*</div><div class='add'>+		 * If we had a transaction abort, stop all running scrubs.</div><div class='add'>+		 * See transaction.c:cleanup_transaction() why we do it here.</div><div class='add'>+		 */</div><div class='add'>+		if (BTRFS_FS_ERROR(fs_info))</div><div class='add'>+			btrfs_scrub_cancel(fs_info);</div><div class='ctx'> 		return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	block_group = btrfs_lookup_block_group(fs_info, chunk_offset);</div><div class='ctx'> 	if (!block_group)</div><div class='hunk'>@@ -3278,7 +3474,7 @@ int btrfs_relocate_chunk(struct btrfs_fs_info *fs_info, u64 chunk_offset)</div><div class='ctx'> static int btrfs_relocate_sys_chunks(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *chunk_root = fs_info-&gt;chunk_root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_chunk *chunk;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='hunk'>@@ -3294,24 +3490,34 @@ static int btrfs_relocate_sys_chunks(struct btrfs_fs_info *fs_info)</div><div class='ctx'> </div><div class='ctx'> again:</div><div class='ctx'> 	key.objectid = BTRFS_FIRST_CHUNK_TREE_OBJECTID;</div><div class='del'>-	key.offset = (u64)-1;</div><div class='ctx'> 	key.type = BTRFS_CHUNK_ITEM_KEY;</div><div class='add'>+	key.offset = (u64)-1;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		mutex_lock(&amp;fs_info-&gt;reclaim_bgs_lock);</div><div class='ctx'> 		ret = btrfs_search_slot(NULL, chunk_root, &amp;key, path, 0, 0);</div><div class='ctx'> 		if (ret &lt; 0) {</div><div class='ctx'> 			mutex_unlock(&amp;fs_info-&gt;reclaim_bgs_lock);</div><div class='del'>-			goto error;</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='add'>+		if (unlikely(ret == 0)) {</div><div class='add'>+			/*</div><div class='add'>+			 * On the first search we would find chunk tree with</div><div class='add'>+			 * offset -1, which is not possible. On subsequent</div><div class='add'>+			 * loops this would find an existing item on an invalid</div><div class='add'>+			 * offset (one less than the previous one, wrong</div><div class='add'>+			 * alignment and size).</div><div class='add'>+			 */</div><div class='add'>+			mutex_unlock(&amp;fs_info-&gt;reclaim_bgs_lock);</div><div class='add'>+			return -EUCLEAN;</div><div class='ctx'> 		}</div><div class='del'>-		BUG_ON(ret == 0); /* Corruption */</div><div class='ctx'> </div><div class='ctx'> 		ret = btrfs_previous_item(chunk_root, path, key.objectid,</div><div class='ctx'> 					  key.type);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			mutex_unlock(&amp;fs_info-&gt;reclaim_bgs_lock);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto error;</div><div class='add'>+			return ret;</div><div class='ctx'> 		if (ret &gt; 0)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='hunk'>@@ -3324,7 +3530,8 @@ again:</div><div class='ctx'> 		btrfs_release_path(path);</div><div class='ctx'> </div><div class='ctx'> 		if (chunk_type &amp; BTRFS_BLOCK_GROUP_SYSTEM) {</div><div class='del'>-			ret = btrfs_relocate_chunk(fs_info, found_key.offset);</div><div class='add'>+			ret = btrfs_relocate_chunk(fs_info, found_key.offset,</div><div class='add'>+						   true);</div><div class='ctx'> 			if (ret == -ENOSPC)</div><div class='ctx'> 				failed++;</div><div class='ctx'> 			else</div><div class='hunk'>@@ -3344,8 +3551,6 @@ again:</div><div class='ctx'> 	} else if (WARN_ON(failed &amp;&amp; retried)) {</div><div class='ctx'> 		ret = -ENOSPC;</div><div class='ctx'> 	}</div><div class='del'>-error:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3391,6 +3596,44 @@ static int btrfs_may_alloc_data_chunk(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void btrfs_disk_balance_args_to_cpu(struct btrfs_balance_args *cpu,</div><div class='add'>+					   const struct btrfs_disk_balance_args *disk)</div><div class='add'>+{</div><div class='add'>+	memset(cpu, 0, sizeof(*cpu));</div><div class='add'>+</div><div class='add'>+	cpu-&gt;profiles = le64_to_cpu(disk-&gt;profiles);</div><div class='add'>+	cpu-&gt;usage = le64_to_cpu(disk-&gt;usage);</div><div class='add'>+	cpu-&gt;devid = le64_to_cpu(disk-&gt;devid);</div><div class='add'>+	cpu-&gt;pstart = le64_to_cpu(disk-&gt;pstart);</div><div class='add'>+	cpu-&gt;pend = le64_to_cpu(disk-&gt;pend);</div><div class='add'>+	cpu-&gt;vstart = le64_to_cpu(disk-&gt;vstart);</div><div class='add'>+	cpu-&gt;vend = le64_to_cpu(disk-&gt;vend);</div><div class='add'>+	cpu-&gt;target = le64_to_cpu(disk-&gt;target);</div><div class='add'>+	cpu-&gt;flags = le64_to_cpu(disk-&gt;flags);</div><div class='add'>+	cpu-&gt;limit = le64_to_cpu(disk-&gt;limit);</div><div class='add'>+	cpu-&gt;stripes_min = le32_to_cpu(disk-&gt;stripes_min);</div><div class='add'>+	cpu-&gt;stripes_max = le32_to_cpu(disk-&gt;stripes_max);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void btrfs_cpu_balance_args_to_disk(struct btrfs_disk_balance_args *disk,</div><div class='add'>+					   const struct btrfs_balance_args *cpu)</div><div class='add'>+{</div><div class='add'>+	memset(disk, 0, sizeof(*disk));</div><div class='add'>+</div><div class='add'>+	disk-&gt;profiles = cpu_to_le64(cpu-&gt;profiles);</div><div class='add'>+	disk-&gt;usage = cpu_to_le64(cpu-&gt;usage);</div><div class='add'>+	disk-&gt;devid = cpu_to_le64(cpu-&gt;devid);</div><div class='add'>+	disk-&gt;pstart = cpu_to_le64(cpu-&gt;pstart);</div><div class='add'>+	disk-&gt;pend = cpu_to_le64(cpu-&gt;pend);</div><div class='add'>+	disk-&gt;vstart = cpu_to_le64(cpu-&gt;vstart);</div><div class='add'>+	disk-&gt;vend = cpu_to_le64(cpu-&gt;vend);</div><div class='add'>+	disk-&gt;target = cpu_to_le64(cpu-&gt;target);</div><div class='add'>+	disk-&gt;flags = cpu_to_le64(cpu-&gt;flags);</div><div class='add'>+	disk-&gt;limit = cpu_to_le64(cpu-&gt;limit);</div><div class='add'>+	disk-&gt;stripes_min = cpu_to_le32(cpu-&gt;stripes_min);</div><div class='add'>+	disk-&gt;stripes_max = cpu_to_le32(cpu-&gt;stripes_max);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int insert_balance_item(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			       struct btrfs_balance_control *bctl)</div><div class='ctx'> {</div><div class='hunk'>@@ -3433,10 +3676,7 @@ static int insert_balance_item(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	btrfs_set_balance_meta(leaf, item, &amp;disk_bargs);</div><div class='ctx'> 	btrfs_cpu_balance_args_to_disk(&amp;disk_bargs, &amp;bctl-&gt;sys);</div><div class='ctx'> 	btrfs_set_balance_sys(leaf, item, &amp;disk_bargs);</div><div class='del'>-</div><div class='ctx'> 	btrfs_set_balance_flags(leaf, item, bctl-&gt;flags);</div><div class='del'>-</div><div class='del'>-	btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> out:</div><div class='ctx'> 	btrfs_free_path(path);</div><div class='ctx'> 	err = btrfs_commit_transaction(trans);</div><div class='hunk'>@@ -3535,7 +3775,7 @@ static void reset_balance_state(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	struct btrfs_balance_control *bctl = fs_info-&gt;balance_ctl;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(!fs_info-&gt;balance_ctl);</div><div class='add'>+	ASSERT(fs_info-&gt;balance_ctl);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;fs_info-&gt;balance_lock);</div><div class='ctx'> 	fs_info-&gt;balance_ctl = NULL;</div><div class='hunk'>@@ -3551,26 +3791,25 @@ static void reset_balance_state(struct btrfs_fs_info *fs_info)</div><div class='ctx'>  * Balance filters.  Return 1 if chunk should be filtered out</div><div class='ctx'>  * (should not be balanced).</div><div class='ctx'>  */</div><div class='del'>-static int chunk_profiles_filter(u64 chunk_type,</div><div class='del'>-				 struct btrfs_balance_args *bargs)</div><div class='add'>+static bool chunk_profiles_filter(u64 chunk_type, struct btrfs_balance_args *bargs)</div><div class='ctx'> {</div><div class='ctx'> 	chunk_type = chunk_to_extended(chunk_type) &amp;</div><div class='ctx'> 				BTRFS_EXTENDED_PROFILE_MASK;</div><div class='ctx'> </div><div class='ctx'> 	if (bargs-&gt;profiles &amp; chunk_type)</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-	return 1;</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int chunk_usage_range_filter(struct btrfs_fs_info *fs_info, u64 chunk_offset,</div><div class='del'>-			      struct btrfs_balance_args *bargs)</div><div class='add'>+static bool chunk_usage_range_filter(struct btrfs_fs_info *fs_info, u64 chunk_offset,</div><div class='add'>+				     struct btrfs_balance_args *bargs)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_block_group *cache;</div><div class='ctx'> 	u64 chunk_used;</div><div class='ctx'> 	u64 user_thresh_min;</div><div class='ctx'> 	u64 user_thresh_max;</div><div class='del'>-	int ret = 1;</div><div class='add'>+	bool ret = true;</div><div class='ctx'> </div><div class='ctx'> 	cache = btrfs_lookup_block_group(fs_info, chunk_offset);</div><div class='ctx'> 	chunk_used = cache-&gt;used;</div><div class='hunk'>@@ -3578,30 +3817,28 @@ static int chunk_usage_range_filter(struct btrfs_fs_info *fs_info, u64 chunk_off</div><div class='ctx'> 	if (bargs-&gt;usage_min == 0)</div><div class='ctx'> 		user_thresh_min = 0;</div><div class='ctx'> 	else</div><div class='del'>-		user_thresh_min = div_factor_fine(cache-&gt;length,</div><div class='del'>-						  bargs-&gt;usage_min);</div><div class='add'>+		user_thresh_min = mult_perc(cache-&gt;length, bargs-&gt;usage_min);</div><div class='ctx'> </div><div class='ctx'> 	if (bargs-&gt;usage_max == 0)</div><div class='ctx'> 		user_thresh_max = 1;</div><div class='ctx'> 	else if (bargs-&gt;usage_max &gt; 100)</div><div class='ctx'> 		user_thresh_max = cache-&gt;length;</div><div class='ctx'> 	else</div><div class='del'>-		user_thresh_max = div_factor_fine(cache-&gt;length,</div><div class='del'>-						  bargs-&gt;usage_max);</div><div class='add'>+		user_thresh_max = mult_perc(cache-&gt;length, bargs-&gt;usage_max);</div><div class='ctx'> </div><div class='ctx'> 	if (user_thresh_min &lt;= chunk_used &amp;&amp; chunk_used &lt; user_thresh_max)</div><div class='del'>-		ret = 0;</div><div class='add'>+		ret = false;</div><div class='ctx'> </div><div class='ctx'> 	btrfs_put_block_group(cache);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int chunk_usage_filter(struct btrfs_fs_info *fs_info,</div><div class='del'>-		u64 chunk_offset, struct btrfs_balance_args *bargs)</div><div class='add'>+static bool chunk_usage_filter(struct btrfs_fs_info *fs_info, u64 chunk_offset,</div><div class='add'>+			       struct btrfs_balance_args *bargs)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_block_group *cache;</div><div class='ctx'> 	u64 chunk_used, user_thresh;</div><div class='del'>-	int ret = 1;</div><div class='add'>+	bool ret = true;</div><div class='ctx'> </div><div class='ctx'> 	cache = btrfs_lookup_block_group(fs_info, chunk_offset);</div><div class='ctx'> 	chunk_used = cache-&gt;used;</div><div class='hunk'>@@ -3611,18 +3848,17 @@ static int chunk_usage_filter(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	else if (bargs-&gt;usage &gt; 100)</div><div class='ctx'> 		user_thresh = cache-&gt;length;</div><div class='ctx'> 	else</div><div class='del'>-		user_thresh = div_factor_fine(cache-&gt;length, bargs-&gt;usage);</div><div class='add'>+		user_thresh = mult_perc(cache-&gt;length, bargs-&gt;usage);</div><div class='ctx'> </div><div class='ctx'> 	if (chunk_used &lt; user_thresh)</div><div class='del'>-		ret = 0;</div><div class='add'>+		ret = false;</div><div class='ctx'> </div><div class='ctx'> 	btrfs_put_block_group(cache);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int chunk_devid_filter(struct extent_buffer *leaf,</div><div class='del'>-			      struct btrfs_chunk *chunk,</div><div class='del'>-			      struct btrfs_balance_args *bargs)</div><div class='add'>+static bool chunk_devid_filter(struct extent_buffer *leaf, struct btrfs_chunk *chunk,</div><div class='add'>+			       struct btrfs_balance_args *bargs)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_stripe *stripe;</div><div class='ctx'> 	int num_stripes = btrfs_chunk_num_stripes(leaf, chunk);</div><div class='hunk'>@@ -3631,10 +3867,10 @@ static int chunk_devid_filter(struct extent_buffer *leaf,</div><div class='ctx'> 	for (i = 0; i &lt; num_stripes; i++) {</div><div class='ctx'> 		stripe = btrfs_stripe_nr(chunk, i);</div><div class='ctx'> 		if (btrfs_stripe_devid(leaf, stripe) == bargs-&gt;devid)</div><div class='del'>-			return 0;</div><div class='add'>+			return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return 1;</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static u64 calc_data_stripes(u64 type, int num_stripes)</div><div class='hunk'>@@ -3647,9 +3883,8 @@ static u64 calc_data_stripes(u64 type, int num_stripes)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* [pstart, pend) */</div><div class='del'>-static int chunk_drange_filter(struct extent_buffer *leaf,</div><div class='del'>-			       struct btrfs_chunk *chunk,</div><div class='del'>-			       struct btrfs_balance_args *bargs)</div><div class='add'>+static bool chunk_drange_filter(struct extent_buffer *leaf, struct btrfs_chunk *chunk,</div><div class='add'>+				struct btrfs_balance_args *bargs)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_stripe *stripe;</div><div class='ctx'> 	int num_stripes = btrfs_chunk_num_stripes(leaf, chunk);</div><div class='hunk'>@@ -3660,7 +3895,7 @@ static int chunk_drange_filter(struct extent_buffer *leaf,</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='ctx'> 	if (!(bargs-&gt;flags &amp; BTRFS_BALANCE_ARGS_DEVID))</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	type = btrfs_chunk_type(leaf, chunk);</div><div class='ctx'> 	factor = calc_data_stripes(type, num_stripes);</div><div class='hunk'>@@ -3676,56 +3911,53 @@ static int chunk_drange_filter(struct extent_buffer *leaf,</div><div class='ctx'> </div><div class='ctx'> 		if (stripe_offset &lt; bargs-&gt;pend &amp;&amp;</div><div class='ctx'> 		    stripe_offset + stripe_length &gt; bargs-&gt;pstart)</div><div class='del'>-			return 0;</div><div class='add'>+			return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return 1;</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* [vstart, vend) */</div><div class='del'>-static int chunk_vrange_filter(struct extent_buffer *leaf,</div><div class='del'>-			       struct btrfs_chunk *chunk,</div><div class='del'>-			       u64 chunk_offset,</div><div class='del'>-			       struct btrfs_balance_args *bargs)</div><div class='add'>+static bool chunk_vrange_filter(struct extent_buffer *leaf, struct btrfs_chunk *chunk,</div><div class='add'>+				u64 chunk_offset, struct btrfs_balance_args *bargs)</div><div class='ctx'> {</div><div class='ctx'> 	if (chunk_offset &lt; bargs-&gt;vend &amp;&amp;</div><div class='ctx'> 	    chunk_offset + btrfs_chunk_length(leaf, chunk) &gt; bargs-&gt;vstart)</div><div class='ctx'> 		/* at least part of the chunk is inside this vrange */</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-	return 1;</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int chunk_stripes_range_filter(struct extent_buffer *leaf,</div><div class='del'>-			       struct btrfs_chunk *chunk,</div><div class='del'>-			       struct btrfs_balance_args *bargs)</div><div class='add'>+static bool chunk_stripes_range_filter(struct extent_buffer *leaf,</div><div class='add'>+				       struct btrfs_chunk *chunk,</div><div class='add'>+				       struct btrfs_balance_args *bargs)</div><div class='ctx'> {</div><div class='ctx'> 	int num_stripes = btrfs_chunk_num_stripes(leaf, chunk);</div><div class='ctx'> </div><div class='ctx'> 	if (bargs-&gt;stripes_min &lt;= num_stripes</div><div class='ctx'> 			&amp;&amp; num_stripes &lt;= bargs-&gt;stripes_max)</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-	return 1;</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int chunk_soft_convert_filter(u64 chunk_type,</div><div class='del'>-				     struct btrfs_balance_args *bargs)</div><div class='add'>+static bool chunk_soft_convert_filter(u64 chunk_type, struct btrfs_balance_args *bargs)</div><div class='ctx'> {</div><div class='ctx'> 	if (!(bargs-&gt;flags &amp; BTRFS_BALANCE_ARGS_CONVERT))</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	chunk_type = chunk_to_extended(chunk_type) &amp;</div><div class='ctx'> 				BTRFS_EXTENDED_PROFILE_MASK;</div><div class='ctx'> </div><div class='ctx'> 	if (bargs-&gt;target == chunk_type)</div><div class='del'>-		return 1;</div><div class='add'>+		return true;</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int should_balance_chunk(struct extent_buffer *leaf,</div><div class='del'>-				struct btrfs_chunk *chunk, u64 chunk_offset)</div><div class='add'>+static bool should_balance_chunk(struct extent_buffer *leaf, struct btrfs_chunk *chunk,</div><div class='add'>+				 u64 chunk_offset)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = leaf-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_balance_control *bctl = fs_info-&gt;balance_ctl;</div><div class='hunk'>@@ -3735,7 +3967,7 @@ static int should_balance_chunk(struct extent_buffer *leaf,</div><div class='ctx'> 	/* type filter */</div><div class='ctx'> 	if (!((chunk_type &amp; BTRFS_BLOCK_GROUP_TYPE_MASK) &amp;</div><div class='ctx'> 	      (bctl-&gt;flags &amp; BTRFS_BALANCE_TYPE_MASK))) {</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (chunk_type &amp; BTRFS_BLOCK_GROUP_DATA)</div><div class='hunk'>@@ -3748,46 +3980,46 @@ static int should_balance_chunk(struct extent_buffer *leaf,</div><div class='ctx'> 	/* profiles filter */</div><div class='ctx'> 	if ((bargs-&gt;flags &amp; BTRFS_BALANCE_ARGS_PROFILES) &amp;&amp;</div><div class='ctx'> 	    chunk_profiles_filter(chunk_type, bargs)) {</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* usage filter */</div><div class='ctx'> 	if ((bargs-&gt;flags &amp; BTRFS_BALANCE_ARGS_USAGE) &amp;&amp;</div><div class='ctx'> 	    chunk_usage_filter(fs_info, chunk_offset, bargs)) {</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> 	} else if ((bargs-&gt;flags &amp; BTRFS_BALANCE_ARGS_USAGE_RANGE) &amp;&amp;</div><div class='ctx'> 	    chunk_usage_range_filter(fs_info, chunk_offset, bargs)) {</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* devid filter */</div><div class='ctx'> 	if ((bargs-&gt;flags &amp; BTRFS_BALANCE_ARGS_DEVID) &amp;&amp;</div><div class='ctx'> 	    chunk_devid_filter(leaf, chunk, bargs)) {</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* drange filter, makes sense only with devid filter */</div><div class='ctx'> 	if ((bargs-&gt;flags &amp; BTRFS_BALANCE_ARGS_DRANGE) &amp;&amp;</div><div class='ctx'> 	    chunk_drange_filter(leaf, chunk, bargs)) {</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* vrange filter */</div><div class='ctx'> 	if ((bargs-&gt;flags &amp; BTRFS_BALANCE_ARGS_VRANGE) &amp;&amp;</div><div class='ctx'> 	    chunk_vrange_filter(leaf, chunk, chunk_offset, bargs)) {</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* stripes filter */</div><div class='ctx'> 	if ((bargs-&gt;flags &amp; BTRFS_BALANCE_ARGS_STRIPES_RANGE) &amp;&amp;</div><div class='ctx'> 	    chunk_stripes_range_filter(leaf, chunk, bargs)) {</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* soft profile changing mode */</div><div class='ctx'> 	if ((bargs-&gt;flags &amp; BTRFS_BALANCE_ARGS_SOFT) &amp;&amp;</div><div class='ctx'> 	    chunk_soft_convert_filter(chunk_type, bargs)) {</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -3795,7 +4027,7 @@ static int should_balance_chunk(struct extent_buffer *leaf,</div><div class='ctx'> 	 */</div><div class='ctx'> 	if ((bargs-&gt;flags &amp; BTRFS_BALANCE_ARGS_LIMIT)) {</div><div class='ctx'> 		if (bargs-&gt;limit == 0)</div><div class='del'>-			return 0;</div><div class='add'>+			return false;</div><div class='ctx'> 		else</div><div class='ctx'> 			bargs-&gt;limit--;</div><div class='ctx'> 	} else if ((bargs-&gt;flags &amp; BTRFS_BALANCE_ARGS_LIMIT_RANGE)) {</div><div class='hunk'>@@ -3805,12 +4037,12 @@ static int should_balance_chunk(struct extent_buffer *leaf,</div><div class='ctx'> 		 * about the count of all chunks that satisfy the filters.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (bargs-&gt;limit_max == 0)</div><div class='del'>-			return 0;</div><div class='add'>+			return false;</div><div class='ctx'> 		else</div><div class='ctx'> 			bargs-&gt;limit_max--;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return 1;</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int __btrfs_balance(struct btrfs_fs_info *fs_info)</div><div class='hunk'>@@ -3819,7 +4051,7 @@ static int __btrfs_balance(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	struct btrfs_root *chunk_root = fs_info-&gt;chunk_root;</div><div class='ctx'> 	u64 chunk_type;</div><div class='ctx'> 	struct btrfs_chunk *chunk;</div><div class='del'>-	struct btrfs_path *path = NULL;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_key found_key;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='hunk'>@@ -3857,8 +4089,8 @@ again:</div><div class='ctx'> 		bctl-&gt;sys.limit = limit_sys;</div><div class='ctx'> 	}</div><div class='ctx'> 	key.objectid = BTRFS_FIRST_CHUNK_TREE_OBJECTID;</div><div class='del'>-	key.offset = (u64)-1;</div><div class='ctx'> 	key.type = BTRFS_CHUNK_ITEM_KEY;</div><div class='add'>+	key.offset = (u64)-1;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		if ((!counting &amp;&amp; atomic_read(&amp;fs_info-&gt;balance_pause_req)) ||</div><div class='hunk'>@@ -3962,7 +4194,7 @@ again:</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		ret = btrfs_relocate_chunk(fs_info, found_key.offset);</div><div class='add'>+		ret = btrfs_relocate_chunk(fs_info, found_key.offset, true);</div><div class='ctx'> 		mutex_unlock(&amp;fs_info-&gt;reclaim_bgs_lock);</div><div class='ctx'> 		if (ret == -ENOSPC) {</div><div class='ctx'> 			enospc_errors++;</div><div class='hunk'>@@ -3990,7 +4222,6 @@ loop:</div><div class='ctx'> 		goto again;</div><div class='ctx'> 	}</div><div class='ctx'> error:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	if (enospc_errors) {</div><div class='ctx'> 		btrfs_info(fs_info, "%d enospc errors during balance",</div><div class='ctx'> 			   enospc_errors);</div><div class='hunk'>@@ -4001,12 +4232,13 @@ error:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * alloc_profile_is_valid - see if a given profile is valid and reduced</div><div class='del'>- * @flags: profile to validate</div><div class='del'>- * @extended: if true @flags is treated as an extended profile</div><div class='add'>+/*</div><div class='add'>+ * See if a given profile is valid and reduced.</div><div class='add'>+ *</div><div class='add'>+ * @flags:     profile to validate</div><div class='add'>+ * @extended:  if true @flags is treated as an extended profile</div><div class='ctx'>  */</div><div class='del'>-static int alloc_profile_is_valid(u64 flags, int extended)</div><div class='add'>+static int alloc_profile_is_valid(u64 flags, bool extended)</div><div class='ctx'> {</div><div class='ctx'> 	u64 mask = (extended ? BTRFS_EXTENDED_PROFILE_MASK :</div><div class='ctx'> 			       BTRFS_BLOCK_GROUP_PROFILE_MASK);</div><div class='hunk'>@@ -4024,14 +4256,6 @@ static int alloc_profile_is_valid(u64 flags, int extended)</div><div class='ctx'> 	return has_single_bit_set(flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int balance_need_close(struct btrfs_fs_info *fs_info)</div><div class='del'>-{</div><div class='del'>-	/* cancel requested || normal exit path */</div><div class='del'>-	return atomic_read(&amp;fs_info-&gt;balance_cancel_req) ||</div><div class='del'>-		(atomic_read(&amp;fs_info-&gt;balance_pause_req) == 0 &amp;&amp;</div><div class='del'>-		 atomic_read(&amp;fs_info-&gt;balance_cancel_req) == 0);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Validate target profile against allowed profiles and return true if it's OK.</div><div class='ctx'>  * Otherwise print the error message and return false.</div><div class='hunk'>@@ -4043,13 +4267,6 @@ static inline int validate_convert_profile(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	if (!(bargs-&gt;flags &amp; BTRFS_BALANCE_ARGS_CONVERT))</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='del'>-	if (fs_info-&gt;sectorsize &lt; PAGE_SIZE &amp;&amp;</div><div class='del'>-		bargs-&gt;target &amp; BTRFS_BLOCK_GROUP_RAID56_MASK) {</div><div class='del'>-		btrfs_err(fs_info,</div><div class='del'>-		"RAID56 is not yet supported for sectorsize %u with page size %lu",</div><div class='del'>-			  fs_info-&gt;sectorsize, PAGE_SIZE);</div><div class='del'>-		return false;</div><div class='del'>-	}</div><div class='ctx'> 	/* Profile is valid and does not have bits outside of the allowed set */</div><div class='ctx'> 	if (alloc_profile_is_valid(bargs-&gt;target, 1) &amp;&amp;</div><div class='ctx'> 	    (bargs-&gt;target &amp; ~allowed) == 0)</div><div class='hunk'>@@ -4162,7 +4379,7 @@ static void describe_balance_start_or_resume(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	u32 size_buf = 1024;</div><div class='ctx'> 	char tmp_buf[192] = {'\0'};</div><div class='del'>-	char *buf;</div><div class='add'>+	char AUTO_KFREE(buf);</div><div class='ctx'> 	char *bp;</div><div class='ctx'> 	u32 size_bp = size_buf;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -4210,12 +4427,10 @@ out_overflow:</div><div class='ctx'> 	btrfs_info(fs_info, "balance: %s %s",</div><div class='ctx'> 		   (bctl-&gt;flags &amp; BTRFS_BALANCE_RESUME) ?</div><div class='ctx'> 		   "resume" : "start", buf);</div><div class='del'>-</div><div class='del'>-	kfree(buf);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Should be called with balance mutexe held</div><div class='add'>+ * Should be called with balance mutex held</div><div class='ctx'>  */</div><div class='ctx'> int btrfs_balance(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		  struct btrfs_balance_control *bctl,</div><div class='hunk'>@@ -4228,6 +4443,7 @@ int btrfs_balance(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	u64 num_devices;</div><div class='ctx'> 	unsigned seq;</div><div class='ctx'> 	bool reducing_redundancy;</div><div class='add'>+	bool paused = false;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='ctx'> 	if (btrfs_fs_closing(fs_info) ||</div><div class='hunk'>@@ -4355,8 +4571,11 @@ int btrfs_balance(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	ret = __btrfs_balance(fs_info);</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;fs_info-&gt;balance_mutex);</div><div class='del'>-	if (ret == -ECANCELED &amp;&amp; atomic_read(&amp;fs_info-&gt;balance_pause_req))</div><div class='add'>+	if (ret == -ECANCELED &amp;&amp; atomic_read(&amp;fs_info-&gt;balance_pause_req)) {</div><div class='ctx'> 		btrfs_info(fs_info, "balance: paused");</div><div class='add'>+		btrfs_exclop_balance(fs_info, BTRFS_EXCLOP_BALANCE_PAUSED);</div><div class='add'>+		paused = true;</div><div class='add'>+	}</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Balance can be canceled by:</div><div class='ctx'> 	 *</div><div class='hunk'>@@ -4384,8 +4603,8 @@ int btrfs_balance(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		btrfs_update_ioctl_balance_args(fs_info, bargs);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if ((ret &amp;&amp; ret != -ECANCELED &amp;&amp; ret != -ENOSPC) ||</div><div class='del'>-	    balance_need_close(fs_info)) {</div><div class='add'>+	/* We didn't pause, we can clean everything up. */</div><div class='add'>+	if (!paused) {</div><div class='ctx'> 		reset_balance_state(fs_info);</div><div class='ctx'> 		btrfs_exclop_finish(fs_info);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -4408,6 +4627,8 @@ static int balance_kthread(void *data)</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = data;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='add'>+	guard(super_write)(fs_info-&gt;sb);</div><div class='add'>+</div><div class='ctx'> 	mutex_lock(&amp;fs_info-&gt;balance_mutex);</div><div class='ctx'> 	if (fs_info-&gt;balance_ctl)</div><div class='ctx'> 		ret = btrfs_balance(fs_info, fs_info-&gt;balance_ctl, NULL);</div><div class='hunk'>@@ -4432,6 +4653,11 @@ int btrfs_resume_balance_async(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	spin_lock(&amp;fs_info-&gt;super_lock);</div><div class='add'>+	ASSERT(fs_info-&gt;exclusive_operation == BTRFS_EXCLOP_BALANCE_PAUSED,</div><div class='add'>+	       "exclusive_operation=%d", fs_info-&gt;exclusive_operation);</div><div class='add'>+	fs_info-&gt;exclusive_operation = BTRFS_EXCLOP_BALANCE;</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;super_lock);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * A ro-&gt;rw remount sequence should continue with the paused balance</div><div class='ctx'> 	 * regardless of who pauses it, system or the user as of now, so set</div><div class='hunk'>@@ -4450,7 +4676,7 @@ int btrfs_recover_balance(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	struct btrfs_balance_control *bctl;</div><div class='ctx'> 	struct btrfs_balance_item *item;</div><div class='ctx'> 	struct btrfs_disk_balance_args disk_bargs;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -4465,17 +4691,14 @@ int btrfs_recover_balance(struct btrfs_fs_info *fs_info)</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_search_slot(NULL, fs_info-&gt;tree_root, &amp;key, path, 0, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> 	if (ret &gt; 0) { /* ret = -ENOENT; */</div><div class='del'>-		ret = 0;</div><div class='del'>-		goto out;</div><div class='add'>+		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	bctl = kzalloc(sizeof(*bctl), GFP_NOFS);</div><div class='del'>-	if (!bctl) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (!bctl)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	item = btrfs_item_ptr(leaf, path-&gt;slots[0], struct btrfs_balance_item);</div><div class='hunk'>@@ -4500,7 +4723,7 @@ int btrfs_recover_balance(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	 * is in a paused state and must have fs_info::balance_ctl properly</div><div class='ctx'> 	 * set up.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!btrfs_exclop_start(fs_info, BTRFS_EXCLOP_BALANCE))</div><div class='add'>+	if (!btrfs_exclop_start(fs_info, BTRFS_EXCLOP_BALANCE_PAUSED))</div><div class='ctx'> 		btrfs_warn(fs_info,</div><div class='ctx'> 	"balance: cannot set exclusive op status, resume manually");</div><div class='ctx'> </div><div class='hunk'>@@ -4512,8 +4735,6 @@ int btrfs_recover_balance(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	fs_info-&gt;balance_ctl = bctl;</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;balance_lock);</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;balance_mutex);</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -4589,190 +4810,12 @@ int btrfs_cancel_balance(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	BUG_ON(fs_info-&gt;balance_ctl ||</div><div class='del'>-		test_bit(BTRFS_FS_BALANCE_RUNNING, &amp;fs_info-&gt;flags));</div><div class='add'>+	ASSERT(!test_bit(BTRFS_FS_BALANCE_RUNNING, &amp;fs_info-&gt;flags));</div><div class='ctx'> 	atomic_dec(&amp;fs_info-&gt;balance_cancel_req);</div><div class='ctx'> 	mutex_unlock(&amp;fs_info-&gt;balance_mutex);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_uuid_scan_kthread(void *data)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = data;</div><div class='del'>-	struct btrfs_root *root = fs_info-&gt;tree_root;</div><div class='del'>-	struct btrfs_key key;</div><div class='del'>-	struct btrfs_path *path = NULL;</div><div class='del'>-	int ret = 0;</div><div class='del'>-	struct extent_buffer *eb;</div><div class='del'>-	int slot;</div><div class='del'>-	struct btrfs_root_item root_item;</div><div class='del'>-	u32 item_size;</div><div class='del'>-	struct btrfs_trans_handle *trans = NULL;</div><div class='del'>-	bool closing = false;</div><div class='del'>-</div><div class='del'>-	path = btrfs_alloc_path();</div><div class='del'>-	if (!path) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	key.objectid = 0;</div><div class='del'>-	key.type = BTRFS_ROOT_ITEM_KEY;</div><div class='del'>-	key.offset = 0;</div><div class='del'>-</div><div class='del'>-	while (1) {</div><div class='del'>-		if (btrfs_fs_closing(fs_info)) {</div><div class='del'>-			closing = true;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		ret = btrfs_search_forward(root, &amp;key, path,</div><div class='del'>-				BTRFS_OLDEST_GENERATION);</div><div class='del'>-		if (ret) {</div><div class='del'>-			if (ret &gt; 0)</div><div class='del'>-				ret = 0;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (key.type != BTRFS_ROOT_ITEM_KEY ||</div><div class='del'>-		    (key.objectid &lt; BTRFS_FIRST_FREE_OBJECTID &amp;&amp;</div><div class='del'>-		     key.objectid != BTRFS_FS_TREE_OBJECTID) ||</div><div class='del'>-		    key.objectid &gt; BTRFS_LAST_FREE_OBJECTID)</div><div class='del'>-			goto skip;</div><div class='del'>-</div><div class='del'>-		eb = path-&gt;nodes[0];</div><div class='del'>-		slot = path-&gt;slots[0];</div><div class='del'>-		item_size = btrfs_item_size_nr(eb, slot);</div><div class='del'>-		if (item_size &lt; sizeof(root_item))</div><div class='del'>-			goto skip;</div><div class='del'>-</div><div class='del'>-		read_extent_buffer(eb, &amp;root_item,</div><div class='del'>-				   btrfs_item_ptr_offset(eb, slot),</div><div class='del'>-				   (int)sizeof(root_item));</div><div class='del'>-		if (btrfs_root_refs(&amp;root_item) == 0)</div><div class='del'>-			goto skip;</div><div class='del'>-</div><div class='del'>-		if (!btrfs_is_empty_uuid(root_item.uuid) ||</div><div class='del'>-		    !btrfs_is_empty_uuid(root_item.received_uuid)) {</div><div class='del'>-			if (trans)</div><div class='del'>-				goto update_tree;</div><div class='del'>-</div><div class='del'>-			btrfs_release_path(path);</div><div class='del'>-			/*</div><div class='del'>-			 * 1 - subvol uuid item</div><div class='del'>-			 * 1 - received_subvol uuid item</div><div class='del'>-			 */</div><div class='del'>-			trans = btrfs_start_transaction(fs_info-&gt;uuid_root, 2);</div><div class='del'>-			if (IS_ERR(trans)) {</div><div class='del'>-				ret = PTR_ERR(trans);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			continue;</div><div class='del'>-		} else {</div><div class='del'>-			goto skip;</div><div class='del'>-		}</div><div class='del'>-update_tree:</div><div class='del'>-		btrfs_release_path(path);</div><div class='del'>-		if (!btrfs_is_empty_uuid(root_item.uuid)) {</div><div class='del'>-			ret = btrfs_uuid_tree_add(trans, root_item.uuid,</div><div class='del'>-						  BTRFS_UUID_KEY_SUBVOL,</div><div class='del'>-						  key.objectid);</div><div class='del'>-			if (ret &lt; 0) {</div><div class='del'>-				btrfs_warn(fs_info, "uuid_tree_add failed %d",</div><div class='del'>-					ret);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (!btrfs_is_empty_uuid(root_item.received_uuid)) {</div><div class='del'>-			ret = btrfs_uuid_tree_add(trans,</div><div class='del'>-						  root_item.received_uuid,</div><div class='del'>-						 BTRFS_UUID_KEY_RECEIVED_SUBVOL,</div><div class='del'>-						  key.objectid);</div><div class='del'>-			if (ret &lt; 0) {</div><div class='del'>-				btrfs_warn(fs_info, "uuid_tree_add failed %d",</div><div class='del'>-					ret);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-skip:</div><div class='del'>-		btrfs_release_path(path);</div><div class='del'>-		if (trans) {</div><div class='del'>-			ret = btrfs_end_transaction(trans);</div><div class='del'>-			trans = NULL;</div><div class='del'>-			if (ret)</div><div class='del'>-				break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (key.offset &lt; (u64)-1) {</div><div class='del'>-			key.offset++;</div><div class='del'>-		} else if (key.type &lt; BTRFS_ROOT_ITEM_KEY) {</div><div class='del'>-			key.offset = 0;</div><div class='del'>-			key.type = BTRFS_ROOT_ITEM_KEY;</div><div class='del'>-		} else if (key.objectid &lt; (u64)-1) {</div><div class='del'>-			key.offset = 0;</div><div class='del'>-			key.type = BTRFS_ROOT_ITEM_KEY;</div><div class='del'>-			key.objectid++;</div><div class='del'>-		} else {</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		cond_resched();</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	if (trans &amp;&amp; !IS_ERR(trans))</div><div class='del'>-		btrfs_end_transaction(trans);</div><div class='del'>-	if (ret)</div><div class='del'>-		btrfs_warn(fs_info, "btrfs_uuid_scan_kthread failed %d", ret);</div><div class='del'>-	else if (!closing)</div><div class='del'>-		set_bit(BTRFS_FS_UPDATE_UUID_TREE_GEN, &amp;fs_info-&gt;flags);</div><div class='del'>-	up(&amp;fs_info-&gt;uuid_tree_rescan_sem);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int btrfs_create_uuid_tree(struct btrfs_fs_info *fs_info)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_trans_handle *trans;</div><div class='del'>-	struct btrfs_root *tree_root = fs_info-&gt;tree_root;</div><div class='del'>-	struct btrfs_root *uuid_root;</div><div class='del'>-	struct task_struct *task;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * 1 - root node</div><div class='del'>-	 * 1 - root item</div><div class='del'>-	 */</div><div class='del'>-	trans = btrfs_start_transaction(tree_root, 2);</div><div class='del'>-	if (IS_ERR(trans))</div><div class='del'>-		return PTR_ERR(trans);</div><div class='del'>-</div><div class='del'>-	uuid_root = btrfs_create_tree(trans, BTRFS_UUID_TREE_OBJECTID);</div><div class='del'>-	if (IS_ERR(uuid_root)) {</div><div class='del'>-		ret = PTR_ERR(uuid_root);</div><div class='del'>-		btrfs_abort_transaction(trans, ret);</div><div class='del'>-		btrfs_end_transaction(trans);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	fs_info-&gt;uuid_root = uuid_root;</div><div class='del'>-</div><div class='del'>-	ret = btrfs_commit_transaction(trans);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	down(&amp;fs_info-&gt;uuid_tree_rescan_sem);</div><div class='del'>-	task = kthread_run(btrfs_uuid_scan_kthread, fs_info, "btrfs-uuid");</div><div class='del'>-	if (IS_ERR(task)) {</div><div class='del'>-		/* fs_info-&gt;update_uuid_tree_gen remains 0 in all error case */</div><div class='del'>-		btrfs_warn(fs_info, "failed to start uuid_scan task");</div><div class='del'>-		up(&amp;fs_info-&gt;uuid_tree_rescan_sem);</div><div class='del'>-		return PTR_ERR(task);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * shrinking a device means finding all of the device extents past</div><div class='ctx'>  * the new size, and then following the back refs to the chunks.</div><div class='hunk'>@@ -4798,6 +4841,7 @@ int btrfs_shrink_device(struct btrfs_device *device, u64 new_size)</div><div class='ctx'> 	u64 old_size = btrfs_device_get_total_bytes(device);</div><div class='ctx'> 	u64 diff;</div><div class='ctx'> 	u64 start;</div><div class='add'>+	u64 free_diff = 0;</div><div class='ctx'> </div><div class='ctx'> 	new_size = round_down(new_size, fs_info-&gt;sectorsize);</div><div class='ctx'> 	start = new_size;</div><div class='hunk'>@@ -4823,7 +4867,19 @@ int btrfs_shrink_device(struct btrfs_device *device, u64 new_size)</div><div class='ctx'> 	btrfs_device_set_total_bytes(device, new_size);</div><div class='ctx'> 	if (test_bit(BTRFS_DEV_STATE_WRITEABLE, &amp;device-&gt;dev_state)) {</div><div class='ctx'> 		device-&gt;fs_devices-&gt;total_rw_bytes -= diff;</div><div class='del'>-		atomic64_sub(diff, &amp;fs_info-&gt;free_chunk_space);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * The new free_chunk_space is new_size - used, so we have to</div><div class='add'>+		 * subtract the delta of the old free_chunk_space which included</div><div class='add'>+		 * old_size - used.  If used &gt; new_size then just subtract this</div><div class='add'>+		 * entire device's free space.</div><div class='add'>+		 */</div><div class='add'>+		if (device-&gt;bytes_used &lt; new_size)</div><div class='add'>+			free_diff = (old_size - device-&gt;bytes_used) -</div><div class='add'>+				    (new_size - device-&gt;bytes_used);</div><div class='add'>+		else</div><div class='add'>+			free_diff = old_size - device-&gt;bytes_used;</div><div class='add'>+		atomic64_sub(free_diff, &amp;fs_info-&gt;free_chunk_space);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -4843,8 +4899,8 @@ int btrfs_shrink_device(struct btrfs_device *device, u64 new_size)</div><div class='ctx'> </div><div class='ctx'> again:</div><div class='ctx'> 	key.objectid = device-&gt;devid;</div><div class='del'>-	key.offset = (u64)-1;</div><div class='ctx'> 	key.type = BTRFS_DEV_EXTENT_KEY;</div><div class='add'>+	key.offset = (u64)-1;</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='ctx'> 		mutex_lock(&amp;fs_info-&gt;reclaim_bgs_lock);</div><div class='hunk'>@@ -4898,7 +4954,7 @@ again:</div><div class='ctx'> 			goto done;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		ret = btrfs_relocate_chunk(fs_info, chunk_offset);</div><div class='add'>+		ret = btrfs_relocate_chunk(fs_info, chunk_offset, true);</div><div class='ctx'> 		mutex_unlock(&amp;fs_info-&gt;reclaim_bgs_lock);</div><div class='ctx'> 		if (ret == -ENOSPC) {</div><div class='ctx'> 			failed++;</div><div class='hunk'>@@ -4930,8 +4986,8 @@ again:</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;fs_info-&gt;chunk_mutex);</div><div class='ctx'> 	/* Clear all state bits beyond the shrunk device size */</div><div class='del'>-	clear_extent_bits(&amp;device-&gt;alloc_state, new_size, (u64)-1,</div><div class='del'>-			  CHUNK_STATE_MASK);</div><div class='add'>+	btrfs_clear_extent_bit(&amp;device-&gt;alloc_state, new_size, (u64)-1,</div><div class='add'>+			       CHUNK_STATE_MASK, NULL);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_device_set_disk_total_bytes(device, new_size);</div><div class='ctx'> 	if (list_empty(&amp;device-&gt;post_commit_list))</div><div class='hunk'>@@ -4947,7 +5003,7 @@ again:</div><div class='ctx'> 	/* Now btrfs_update_device() will change the on-disk size. */</div><div class='ctx'> 	ret = btrfs_update_device(trans, device);</div><div class='ctx'> 	btrfs_trans_release_chunk_metadata(trans);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='add'>+	if (unlikely(ret &lt; 0)) {</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		btrfs_end_transaction(trans);</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -4958,9 +5014,10 @@ done:</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		mutex_lock(&amp;fs_info-&gt;chunk_mutex);</div><div class='ctx'> 		btrfs_device_set_total_bytes(device, old_size);</div><div class='del'>-		if (test_bit(BTRFS_DEV_STATE_WRITEABLE, &amp;device-&gt;dev_state))</div><div class='add'>+		if (test_bit(BTRFS_DEV_STATE_WRITEABLE, &amp;device-&gt;dev_state)) {</div><div class='ctx'> 			device-&gt;fs_devices-&gt;total_rw_bytes += diff;</div><div class='del'>-		atomic64_add(diff, &amp;fs_info-&gt;free_chunk_space);</div><div class='add'>+			atomic64_add(free_diff, &amp;fs_info-&gt;free_chunk_space);</div><div class='add'>+		}</div><div class='ctx'> 		mutex_unlock(&amp;fs_info-&gt;chunk_mutex);</div><div class='ctx'> 	}</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -5057,37 +5114,29 @@ struct alloc_chunk_ctl {</div><div class='ctx'> 	u64 stripe_size;</div><div class='ctx'> 	u64 chunk_size;</div><div class='ctx'> 	int ndevs;</div><div class='add'>+	/* Space_info the block group is going to belong. */</div><div class='add'>+	struct btrfs_space_info *space_info;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static void init_alloc_chunk_ctl_policy_regular(</div><div class='ctx'> 				struct btrfs_fs_devices *fs_devices,</div><div class='ctx'> 				struct alloc_chunk_ctl *ctl)</div><div class='ctx'> {</div><div class='del'>-	u64 type = ctl-&gt;type;</div><div class='add'>+	struct btrfs_space_info *space_info;</div><div class='ctx'> </div><div class='del'>-	if (type &amp; BTRFS_BLOCK_GROUP_DATA) {</div><div class='del'>-		ctl-&gt;max_stripe_size = SZ_1G;</div><div class='del'>-		ctl-&gt;max_chunk_size = BTRFS_MAX_DATA_CHUNK_SIZE;</div><div class='del'>-	} else if (type &amp; BTRFS_BLOCK_GROUP_METADATA) {</div><div class='del'>-		/* For larger filesystems, use larger metadata chunks */</div><div class='del'>-		if (fs_devices-&gt;total_rw_bytes &gt; 50ULL * SZ_1G)</div><div class='del'>-			ctl-&gt;max_stripe_size = SZ_1G;</div><div class='del'>-		else</div><div class='del'>-			ctl-&gt;max_stripe_size = SZ_256M;</div><div class='del'>-		ctl-&gt;max_chunk_size = ctl-&gt;max_stripe_size;</div><div class='del'>-	} else if (type &amp; BTRFS_BLOCK_GROUP_SYSTEM) {</div><div class='del'>-		ctl-&gt;max_stripe_size = SZ_32M;</div><div class='del'>-		ctl-&gt;max_chunk_size = 2 * ctl-&gt;max_stripe_size;</div><div class='del'>-		ctl-&gt;devs_max = min_t(int, ctl-&gt;devs_max,</div><div class='del'>-				      BTRFS_MAX_DEVS_SYS_CHUNK);</div><div class='del'>-	} else {</div><div class='del'>-		BUG();</div><div class='del'>-	}</div><div class='add'>+	space_info = btrfs_find_space_info(fs_devices-&gt;fs_info, ctl-&gt;type);</div><div class='add'>+	ASSERT(space_info);</div><div class='add'>+</div><div class='add'>+	ctl-&gt;max_chunk_size = READ_ONCE(space_info-&gt;chunk_size);</div><div class='add'>+	ctl-&gt;max_stripe_size = min_t(u64, ctl-&gt;max_chunk_size, SZ_1G);</div><div class='add'>+</div><div class='add'>+	if (ctl-&gt;type &amp; BTRFS_BLOCK_GROUP_SYSTEM)</div><div class='add'>+		ctl-&gt;devs_max = min_t(int, ctl-&gt;devs_max, BTRFS_MAX_DEVS_SYS_CHUNK);</div><div class='ctx'> </div><div class='ctx'> 	/* We don't want a chunk larger than 10% of writable space */</div><div class='del'>-	ctl-&gt;max_chunk_size = min(div_factor(fs_devices-&gt;total_rw_bytes, 1),</div><div class='add'>+	ctl-&gt;max_chunk_size = min(mult_perc(fs_devices-&gt;total_rw_bytes, 10),</div><div class='ctx'> 				  ctl-&gt;max_chunk_size);</div><div class='del'>-	ctl-&gt;dev_extent_min = BTRFS_STRIPE_LEN * ctl-&gt;dev_stripes;</div><div class='add'>+	ctl-&gt;dev_extent_min = btrfs_stripe_nr_to_offset(ctl-&gt;dev_stripes);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void init_alloc_chunk_ctl_policy_zoned(</div><div class='hunk'>@@ -5116,7 +5165,7 @@ static void init_alloc_chunk_ctl_policy_zoned(</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* We don't want a chunk larger than 10% of writable space */</div><div class='del'>-	limit = max(round_down(div_factor(fs_devices-&gt;total_rw_bytes, 1),</div><div class='add'>+	limit = max(round_down(mult_perc(fs_devices-&gt;total_rw_bytes, 10),</div><div class='ctx'> 			       zone_size),</div><div class='ctx'> 		    min_chunk_size);</div><div class='ctx'> 	ctl-&gt;max_chunk_size = min(limit, ctl-&gt;max_chunk_size);</div><div class='hunk'>@@ -5140,14 +5189,15 @@ static void init_alloc_chunk_ctl(struct btrfs_fs_devices *fs_devices,</div><div class='ctx'> 	ctl-&gt;ndevs = 0;</div><div class='ctx'> </div><div class='ctx'> 	switch (fs_devices-&gt;chunk_alloc_policy) {</div><div class='add'>+	default:</div><div class='add'>+		btrfs_warn_unknown_chunk_allocation(fs_devices-&gt;chunk_alloc_policy);</div><div class='add'>+		fallthrough;</div><div class='ctx'> 	case BTRFS_CHUNK_ALLOC_REGULAR:</div><div class='ctx'> 		init_alloc_chunk_ctl_policy_regular(fs_devices, ctl);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case BTRFS_CHUNK_ALLOC_ZONED:</div><div class='ctx'> 		init_alloc_chunk_ctl_policy_zoned(fs_devices, ctl);</div><div class='ctx'> 		break;</div><div class='del'>-	default:</div><div class='del'>-		BUG();</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5265,6 +5315,9 @@ static int decide_stripe_size_regular(struct alloc_chunk_ctl *ctl,</div><div class='ctx'> 				       ctl-&gt;stripe_size);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/* Stripe size should not go beyond 1G. */</div><div class='add'>+	ctl-&gt;stripe_size = min_t(u64, ctl-&gt;stripe_size, SZ_1G);</div><div class='add'>+</div><div class='ctx'> 	/* Align to BTRFS_STRIPE_LEN */</div><div class='ctx'> 	ctl-&gt;stripe_size = round_down(ctl-&gt;stripe_size, BTRFS_STRIPE_LEN);</div><div class='ctx'> 	ctl-&gt;chunk_size = ctl-&gt;stripe_size * data_stripes;</div><div class='hunk'>@@ -5283,20 +5336,24 @@ static int decide_stripe_size_zoned(struct alloc_chunk_ctl *ctl,</div><div class='ctx'> 	 * It should hold because:</div><div class='ctx'> 	 *    dev_extent_min == dev_extent_want == zone_size * dev_stripes</div><div class='ctx'> 	 */</div><div class='del'>-	ASSERT(devices_info[ctl-&gt;ndevs - 1].max_avail == ctl-&gt;dev_extent_min);</div><div class='add'>+	ASSERT(devices_info[ctl-&gt;ndevs - 1].max_avail == ctl-&gt;dev_extent_min,</div><div class='add'>+	       "ndevs=%d max_avail=%llu dev_extent_min=%llu", ctl-&gt;ndevs,</div><div class='add'>+	       devices_info[ctl-&gt;ndevs - 1].max_avail, ctl-&gt;dev_extent_min);</div><div class='ctx'> </div><div class='ctx'> 	ctl-&gt;stripe_size = zone_size;</div><div class='ctx'> 	ctl-&gt;num_stripes = ctl-&gt;ndevs * ctl-&gt;dev_stripes;</div><div class='ctx'> 	data_stripes = (ctl-&gt;num_stripes - ctl-&gt;nparity) / ctl-&gt;ncopies;</div><div class='ctx'> </div><div class='del'>-	/* stripe_size is fixed in zoned filesysmte. Reduce ndevs instead. */</div><div class='add'>+	/* stripe_size is fixed in zoned filesystem. Reduce ndevs instead. */</div><div class='ctx'> 	if (ctl-&gt;stripe_size * data_stripes &gt; ctl-&gt;max_chunk_size) {</div><div class='ctx'> 		ctl-&gt;ndevs = div_u64(div_u64(ctl-&gt;max_chunk_size * ctl-&gt;ncopies,</div><div class='ctx'> 					     ctl-&gt;stripe_size) + ctl-&gt;nparity,</div><div class='ctx'> 				     ctl-&gt;dev_stripes);</div><div class='ctx'> 		ctl-&gt;num_stripes = ctl-&gt;ndevs * ctl-&gt;dev_stripes;</div><div class='ctx'> 		data_stripes = (ctl-&gt;num_stripes - ctl-&gt;nparity) / ctl-&gt;ncopies;</div><div class='del'>-		ASSERT(ctl-&gt;stripe_size * data_stripes &lt;= ctl-&gt;max_chunk_size);</div><div class='add'>+		ASSERT(ctl-&gt;stripe_size * data_stripes &lt;= ctl-&gt;max_chunk_size,</div><div class='add'>+		       "stripe_size=%llu data_stripes=%d max_chunk_size=%llu",</div><div class='add'>+		       ctl-&gt;stripe_size, data_stripes, ctl-&gt;max_chunk_size);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ctl-&gt;chunk_size = ctl-&gt;stripe_size * data_stripes;</div><div class='hunk'>@@ -5329,79 +5386,151 @@ static int decide_stripe_size(struct btrfs_fs_devices *fs_devices,</div><div class='ctx'> 	ctl-&gt;ndevs = min(ctl-&gt;ndevs, ctl-&gt;devs_max);</div><div class='ctx'> </div><div class='ctx'> 	switch (fs_devices-&gt;chunk_alloc_policy) {</div><div class='add'>+	default:</div><div class='add'>+		btrfs_warn_unknown_chunk_allocation(fs_devices-&gt;chunk_alloc_policy);</div><div class='add'>+		fallthrough;</div><div class='ctx'> 	case BTRFS_CHUNK_ALLOC_REGULAR:</div><div class='ctx'> 		return decide_stripe_size_regular(ctl, devices_info);</div><div class='ctx'> 	case BTRFS_CHUNK_ALLOC_ZONED:</div><div class='ctx'> 		return decide_stripe_size_zoned(ctl, devices_info);</div><div class='del'>-	default:</div><div class='del'>-		BUG();</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void chunk_map_device_set_bits(struct btrfs_chunk_map *map, unsigned int bits)</div><div class='add'>+{</div><div class='add'>+	for (int i = 0; i &lt; map-&gt;num_stripes; i++) {</div><div class='add'>+		struct btrfs_io_stripe *stripe = &amp;map-&gt;stripes[i];</div><div class='add'>+		struct btrfs_device *device = stripe-&gt;dev;</div><div class='add'>+</div><div class='add'>+		btrfs_set_extent_bit(&amp;device-&gt;alloc_state, stripe-&gt;physical,</div><div class='add'>+				     stripe-&gt;physical + map-&gt;stripe_size - 1,</div><div class='add'>+				     bits | EXTENT_NOWAIT, NULL);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void chunk_map_device_clear_bits(struct btrfs_chunk_map *map, unsigned int bits)</div><div class='add'>+{</div><div class='add'>+	for (int i = 0; i &lt; map-&gt;num_stripes; i++) {</div><div class='add'>+		struct btrfs_io_stripe *stripe = &amp;map-&gt;stripes[i];</div><div class='add'>+		struct btrfs_device *device = stripe-&gt;dev;</div><div class='add'>+</div><div class='add'>+		btrfs_clear_extent_bit(&amp;device-&gt;alloc_state, stripe-&gt;physical,</div><div class='add'>+				       stripe-&gt;physical + map-&gt;stripe_size - 1,</div><div class='add'>+				       bits | EXTENT_NOWAIT, NULL);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_remove_chunk_map(struct btrfs_fs_info *fs_info, struct btrfs_chunk_map *map)</div><div class='add'>+{</div><div class='add'>+	write_lock(&amp;fs_info-&gt;mapping_tree_lock);</div><div class='add'>+	rb_erase_cached(&amp;map-&gt;rb_node, &amp;fs_info-&gt;mapping_tree);</div><div class='add'>+	RB_CLEAR_NODE(&amp;map-&gt;rb_node);</div><div class='add'>+	chunk_map_device_clear_bits(map, CHUNK_ALLOCATED);</div><div class='add'>+	write_unlock(&amp;fs_info-&gt;mapping_tree_lock);</div><div class='add'>+</div><div class='add'>+	/* Once for the tree reference. */</div><div class='add'>+	btrfs_free_chunk_map(map);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int btrfs_chunk_map_cmp(const struct rb_node *new,</div><div class='add'>+			       const struct rb_node *exist)</div><div class='add'>+{</div><div class='add'>+	const struct btrfs_chunk_map *new_map =</div><div class='add'>+		rb_entry(new, struct btrfs_chunk_map, rb_node);</div><div class='add'>+	const struct btrfs_chunk_map *exist_map =</div><div class='add'>+		rb_entry(exist, struct btrfs_chunk_map, rb_node);</div><div class='add'>+</div><div class='add'>+	if (new_map-&gt;start == exist_map-&gt;start)</div><div class='add'>+		return 0;</div><div class='add'>+	if (new_map-&gt;start &lt; exist_map-&gt;start)</div><div class='add'>+		return -1;</div><div class='add'>+	return 1;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+EXPORT_FOR_TESTS</div><div class='add'>+int btrfs_add_chunk_map(struct btrfs_fs_info *fs_info, struct btrfs_chunk_map *map)</div><div class='add'>+{</div><div class='add'>+	struct rb_node *exist;</div><div class='add'>+</div><div class='add'>+	write_lock(&amp;fs_info-&gt;mapping_tree_lock);</div><div class='add'>+	exist = rb_find_add_cached(&amp;map-&gt;rb_node, &amp;fs_info-&gt;mapping_tree,</div><div class='add'>+				   btrfs_chunk_map_cmp);</div><div class='add'>+</div><div class='add'>+	if (exist) {</div><div class='add'>+		write_unlock(&amp;fs_info-&gt;mapping_tree_lock);</div><div class='add'>+		return -EEXIST;</div><div class='add'>+	}</div><div class='add'>+	chunk_map_device_set_bits(map, CHUNK_ALLOCATED);</div><div class='add'>+	chunk_map_device_clear_bits(map, CHUNK_TRIMMED);</div><div class='add'>+	write_unlock(&amp;fs_info-&gt;mapping_tree_lock);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+EXPORT_FOR_TESTS</div><div class='add'>+struct btrfs_chunk_map *btrfs_alloc_chunk_map(int num_stripes, gfp_t gfp)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_chunk_map *map;</div><div class='add'>+</div><div class='add'>+	map = kmalloc(btrfs_chunk_map_size(num_stripes), gfp);</div><div class='add'>+	if (!map)</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	refcount_set(&amp;map-&gt;refs, 1);</div><div class='add'>+	RB_CLEAR_NODE(&amp;map-&gt;rb_node);</div><div class='add'>+</div><div class='add'>+	return map;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static struct btrfs_block_group *create_chunk(struct btrfs_trans_handle *trans,</div><div class='ctx'> 			struct alloc_chunk_ctl *ctl,</div><div class='ctx'> 			struct btrfs_device_info *devices_info)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *info = trans-&gt;fs_info;</div><div class='del'>-	struct map_lookup *map = NULL;</div><div class='del'>-	struct extent_map_tree *em_tree;</div><div class='add'>+	struct btrfs_chunk_map *map;</div><div class='ctx'> 	struct btrfs_block_group *block_group;</div><div class='del'>-	struct extent_map *em;</div><div class='ctx'> 	u64 start = ctl-&gt;start;</div><div class='ctx'> 	u64 type = ctl-&gt;type;</div><div class='ctx'> 	int ret;</div><div class='del'>-	int i;</div><div class='del'>-	int j;</div><div class='ctx'> </div><div class='del'>-	map = kmalloc(map_lookup_size(ctl-&gt;num_stripes), GFP_NOFS);</div><div class='add'>+	map = btrfs_alloc_chunk_map(ctl-&gt;num_stripes, GFP_NOFS);</div><div class='ctx'> 	if (!map)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='add'>+</div><div class='add'>+	map-&gt;start = start;</div><div class='add'>+	map-&gt;chunk_len = ctl-&gt;chunk_size;</div><div class='add'>+	map-&gt;stripe_size = ctl-&gt;stripe_size;</div><div class='add'>+	map-&gt;type = type;</div><div class='add'>+	map-&gt;io_align = BTRFS_STRIPE_LEN;</div><div class='add'>+	map-&gt;io_width = BTRFS_STRIPE_LEN;</div><div class='add'>+	map-&gt;sub_stripes = ctl-&gt;sub_stripes;</div><div class='ctx'> 	map-&gt;num_stripes = ctl-&gt;num_stripes;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; ctl-&gt;ndevs; ++i) {</div><div class='del'>-		for (j = 0; j &lt; ctl-&gt;dev_stripes; ++j) {</div><div class='add'>+	for (int i = 0; i &lt; ctl-&gt;ndevs; i++) {</div><div class='add'>+		for (int j = 0; j &lt; ctl-&gt;dev_stripes; j++) {</div><div class='ctx'> 			int s = i * ctl-&gt;dev_stripes + j;</div><div class='ctx'> 			map-&gt;stripes[s].dev = devices_info[i].dev;</div><div class='ctx'> 			map-&gt;stripes[s].physical = devices_info[i].dev_offset +</div><div class='ctx'> 						   j * ctl-&gt;stripe_size;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	map-&gt;stripe_len = BTRFS_STRIPE_LEN;</div><div class='del'>-	map-&gt;io_align = BTRFS_STRIPE_LEN;</div><div class='del'>-	map-&gt;io_width = BTRFS_STRIPE_LEN;</div><div class='del'>-	map-&gt;type = type;</div><div class='del'>-	map-&gt;sub_stripes = ctl-&gt;sub_stripes;</div><div class='ctx'> </div><div class='ctx'> 	trace_btrfs_chunk_alloc(info, map, start, ctl-&gt;chunk_size);</div><div class='ctx'> </div><div class='del'>-	em = alloc_extent_map();</div><div class='del'>-	if (!em) {</div><div class='del'>-		kfree(map);</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='del'>-	}</div><div class='del'>-	set_bit(EXTENT_FLAG_FS_MAPPING, &amp;em-&gt;flags);</div><div class='del'>-	em-&gt;map_lookup = map;</div><div class='del'>-	em-&gt;start = start;</div><div class='del'>-	em-&gt;len = ctl-&gt;chunk_size;</div><div class='del'>-	em-&gt;block_start = 0;</div><div class='del'>-	em-&gt;block_len = em-&gt;len;</div><div class='del'>-	em-&gt;orig_block_len = ctl-&gt;stripe_size;</div><div class='del'>-</div><div class='del'>-	em_tree = &amp;info-&gt;mapping_tree;</div><div class='del'>-	write_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	ret = add_extent_mapping(em_tree, em, 0);</div><div class='add'>+	ret = btrfs_add_chunk_map(info, map);</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		write_unlock(&amp;em_tree-&gt;lock);</div><div class='del'>-		free_extent_map(em);</div><div class='add'>+		btrfs_free_chunk_map(map);</div><div class='ctx'> 		return ERR_PTR(ret);</div><div class='ctx'> 	}</div><div class='del'>-	write_unlock(&amp;em_tree-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	block_group = btrfs_make_block_group(trans, 0, type, start, ctl-&gt;chunk_size);</div><div class='del'>-	if (IS_ERR(block_group))</div><div class='del'>-		goto error_del_extent;</div><div class='add'>+	block_group = btrfs_make_block_group(trans, ctl-&gt;space_info, type, start,</div><div class='add'>+					     ctl-&gt;chunk_size);</div><div class='add'>+	if (IS_ERR(block_group)) {</div><div class='add'>+		btrfs_remove_chunk_map(info, map);</div><div class='add'>+		return block_group;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; map-&gt;num_stripes; i++) {</div><div class='add'>+	for (int i = 0; i &lt; map-&gt;num_stripes; i++) {</div><div class='ctx'> 		struct btrfs_device *dev = map-&gt;stripes[i].dev;</div><div class='ctx'> </div><div class='ctx'> 		btrfs_device_set_bytes_used(dev,</div><div class='hunk'>@@ -5414,39 +5543,26 @@ static struct btrfs_block_group *create_chunk(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	atomic64_sub(ctl-&gt;stripe_size * map-&gt;num_stripes,</div><div class='ctx'> 		     &amp;info-&gt;free_chunk_space);</div><div class='ctx'> </div><div class='del'>-	free_extent_map(em);</div><div class='ctx'> 	check_raid56_incompat_flag(info, type);</div><div class='ctx'> 	check_raid1c34_incompat_flag(info, type);</div><div class='ctx'> </div><div class='ctx'> 	return block_group;</div><div class='del'>-</div><div class='del'>-error_del_extent:</div><div class='del'>-	write_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	remove_extent_mapping(em_tree, em);</div><div class='del'>-	write_unlock(&amp;em_tree-&gt;lock);</div><div class='del'>-</div><div class='del'>-	/* One for our allocation */</div><div class='del'>-	free_extent_map(em);</div><div class='del'>-	/* One for the tree reference */</div><div class='del'>-	free_extent_map(em);</div><div class='del'>-</div><div class='del'>-	return block_group;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct btrfs_block_group *btrfs_create_chunk(struct btrfs_trans_handle *trans,</div><div class='del'>-					    u64 type)</div><div class='add'>+					     struct btrfs_space_info *space_info,</div><div class='add'>+					     u64 type)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_fs_devices *fs_devices = info-&gt;fs_devices;</div><div class='del'>-	struct btrfs_device_info *devices_info = NULL;</div><div class='add'>+	struct btrfs_device_info AUTO_KFREE(devices_info);</div><div class='ctx'> 	struct alloc_chunk_ctl ctl;</div><div class='del'>-	struct btrfs_block_group *block_group;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;info-&gt;chunk_mutex);</div><div class='ctx'> </div><div class='ctx'> 	if (!alloc_profile_is_valid(type, 0)) {</div><div class='del'>-		ASSERT(0);</div><div class='add'>+		DEBUG_WARN("invalid alloc profile for type %llu", type);</div><div class='ctx'> 		return ERR_PTR(-EINVAL);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -5458,12 +5574,13 @@ struct btrfs_block_group *btrfs_create_chunk(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> 	if (!(type &amp; BTRFS_BLOCK_GROUP_TYPE_MASK)) {</div><div class='ctx'> 		btrfs_err(info, "invalid chunk type 0x%llx requested", type);</div><div class='del'>-		ASSERT(0);</div><div class='add'>+		DEBUG_WARN();</div><div class='ctx'> 		return ERR_PTR(-EINVAL);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ctl.start = find_next_chunk(info);</div><div class='ctx'> 	ctl.type = type;</div><div class='add'>+	ctl.space_info = space_info;</div><div class='ctx'> 	init_alloc_chunk_ctl(fs_devices, &amp;ctl);</div><div class='ctx'> </div><div class='ctx'> 	devices_info = kcalloc(fs_devices-&gt;rw_devices, sizeof(*devices_info),</div><div class='hunk'>@@ -5472,22 +5589,14 @@ struct btrfs_block_group *btrfs_create_chunk(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='ctx'> 	ret = gather_device_info(fs_devices, &amp;ctl, devices_info);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		block_group = ERR_PTR(ret);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ERR_PTR(ret);</div><div class='ctx'> </div><div class='ctx'> 	ret = decide_stripe_size(fs_devices, &amp;ctl, devices_info);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		block_group = ERR_PTR(ret);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	block_group = create_chunk(trans, &amp;ctl, devices_info);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ERR_PTR(ret);</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	kfree(devices_info);</div><div class='del'>-	return block_group;</div><div class='add'>+	return create_chunk(trans, &amp;ctl, devices_info);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -5502,13 +5611,11 @@ int btrfs_chunk_alloc_add_chunk_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				     struct btrfs_block_group *bg)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='del'>-	struct btrfs_root *extent_root = fs_info-&gt;extent_root;</div><div class='ctx'> 	struct btrfs_root *chunk_root = fs_info-&gt;chunk_root;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_chunk *chunk;</div><div class='ctx'> 	struct btrfs_stripe *stripe;</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	struct map_lookup *map;</div><div class='add'>+	struct btrfs_chunk_map *map;</div><div class='ctx'> 	size_t item_size;</div><div class='ctx'> 	int i;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -5537,18 +5644,17 @@ int btrfs_chunk_alloc_add_chunk_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	 */</div><div class='ctx'> 	lockdep_assert_held(&amp;fs_info-&gt;chunk_mutex);</div><div class='ctx'> </div><div class='del'>-	em = btrfs_get_chunk_map(fs_info, bg-&gt;start, bg-&gt;length);</div><div class='del'>-	if (IS_ERR(em)) {</div><div class='del'>-		ret = PTR_ERR(em);</div><div class='add'>+	map = btrfs_get_chunk_map(fs_info, bg-&gt;start, bg-&gt;length);</div><div class='add'>+	if (IS_ERR(map)) {</div><div class='add'>+		ret = PTR_ERR(map);</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	map = em-&gt;map_lookup;</div><div class='ctx'> 	item_size = btrfs_chunk_item_size(map-&gt;num_stripes);</div><div class='ctx'> </div><div class='ctx'> 	chunk = kzalloc(item_size, GFP_NOFS);</div><div class='del'>-	if (!chunk) {</div><div class='add'>+	if (unlikely(!chunk)) {</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='ctx'> 		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -5574,12 +5680,12 @@ int btrfs_chunk_alloc_add_chunk_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	btrfs_set_stack_chunk_length(chunk, bg-&gt;length);</div><div class='del'>-	btrfs_set_stack_chunk_owner(chunk, extent_root-&gt;root_key.objectid);</div><div class='del'>-	btrfs_set_stack_chunk_stripe_len(chunk, map-&gt;stripe_len);</div><div class='add'>+	btrfs_set_stack_chunk_owner(chunk, BTRFS_EXTENT_TREE_OBJECTID);</div><div class='add'>+	btrfs_set_stack_chunk_stripe_len(chunk, BTRFS_STRIPE_LEN);</div><div class='ctx'> 	btrfs_set_stack_chunk_type(chunk, map-&gt;type);</div><div class='ctx'> 	btrfs_set_stack_chunk_num_stripes(chunk, map-&gt;num_stripes);</div><div class='del'>-	btrfs_set_stack_chunk_io_align(chunk, map-&gt;stripe_len);</div><div class='del'>-	btrfs_set_stack_chunk_io_width(chunk, map-&gt;stripe_len);</div><div class='add'>+	btrfs_set_stack_chunk_io_align(chunk, BTRFS_STRIPE_LEN);</div><div class='add'>+	btrfs_set_stack_chunk_io_width(chunk, BTRFS_STRIPE_LEN);</div><div class='ctx'> 	btrfs_set_stack_chunk_sector_size(chunk, fs_info-&gt;sectorsize);</div><div class='ctx'> 	btrfs_set_stack_chunk_sub_stripes(chunk, map-&gt;sub_stripes);</div><div class='ctx'> </div><div class='hunk'>@@ -5591,7 +5697,7 @@ int btrfs_chunk_alloc_add_chunk_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	bg-&gt;chunk_item_inserted = 1;</div><div class='add'>+	set_bit(BLOCK_GROUP_FLAG_CHUNK_ITEM_INSERTED, &amp;bg-&gt;runtime_flags);</div><div class='ctx'> </div><div class='ctx'> 	if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_SYSTEM) {</div><div class='ctx'> 		ret = btrfs_add_system_chunk(fs_info, &amp;key, chunk, item_size);</div><div class='hunk'>@@ -5601,7 +5707,7 @@ int btrfs_chunk_alloc_add_chunk_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	kfree(chunk);</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_chunk_map(map);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5610,7 +5716,9 @@ static noinline int init_first_rw_device(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	u64 alloc_profile;</div><div class='ctx'> 	struct btrfs_block_group *meta_bg;</div><div class='add'>+	struct btrfs_space_info *meta_space_info;</div><div class='ctx'> 	struct btrfs_block_group *sys_bg;</div><div class='add'>+	struct btrfs_space_info *sys_space_info;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * When adding a new device for sprouting, the seed device is read-only</div><div class='hunk'>@@ -5634,19 +5742,29 @@ static noinline int init_first_rw_device(struct btrfs_trans_handle *trans)</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='ctx'> 	alloc_profile = btrfs_metadata_alloc_profile(fs_info);</div><div class='del'>-	meta_bg = btrfs_create_chunk(trans, alloc_profile);</div><div class='add'>+	meta_space_info = btrfs_find_space_info(fs_info, alloc_profile);</div><div class='add'>+	if (!meta_space_info) {</div><div class='add'>+		DEBUG_WARN();</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+	meta_bg = btrfs_create_chunk(trans, meta_space_info, alloc_profile);</div><div class='ctx'> 	if (IS_ERR(meta_bg))</div><div class='ctx'> 		return PTR_ERR(meta_bg);</div><div class='ctx'> </div><div class='ctx'> 	alloc_profile = btrfs_system_alloc_profile(fs_info);</div><div class='del'>-	sys_bg = btrfs_create_chunk(trans, alloc_profile);</div><div class='add'>+	sys_space_info = btrfs_find_space_info(fs_info, alloc_profile);</div><div class='add'>+	if (!sys_space_info) {</div><div class='add'>+		DEBUG_WARN();</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+	sys_bg = btrfs_create_chunk(trans, sys_space_info, alloc_profile);</div><div class='ctx'> 	if (IS_ERR(sys_bg))</div><div class='ctx'> 		return PTR_ERR(sys_bg);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int btrfs_chunk_max_errors(struct map_lookup *map)</div><div class='add'>+static inline int btrfs_chunk_max_errors(struct btrfs_chunk_map *map)</div><div class='ctx'> {</div><div class='ctx'> 	const int index = btrfs_bg_flags_to_raid_index(map-&gt;type);</div><div class='ctx'> </div><div class='hunk'>@@ -5655,17 +5773,15 @@ static inline int btrfs_chunk_max_errors(struct map_lookup *map)</div><div class='ctx'> </div><div class='ctx'> bool btrfs_chunk_writeable(struct btrfs_fs_info *fs_info, u64 chunk_offset)</div><div class='ctx'> {</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	struct map_lookup *map;</div><div class='add'>+	struct btrfs_chunk_map *map;</div><div class='ctx'> 	int miss_ndevs = 0;</div><div class='ctx'> 	int i;</div><div class='ctx'> 	bool ret = true;</div><div class='ctx'> </div><div class='del'>-	em = btrfs_get_chunk_map(fs_info, chunk_offset, 1);</div><div class='del'>-	if (IS_ERR(em))</div><div class='add'>+	map = btrfs_get_chunk_map(fs_info, chunk_offset, 1);</div><div class='add'>+	if (IS_ERR(map))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	map = em-&gt;map_lookup;</div><div class='ctx'> 	for (i = 0; i &lt; map-&gt;num_stripes; i++) {</div><div class='ctx'> 		if (test_bit(BTRFS_DEV_STATE_MISSING,</div><div class='ctx'> 					&amp;map-&gt;stripes[i].dev-&gt;dev_state)) {</div><div class='hunk'>@@ -5686,37 +5802,57 @@ bool btrfs_chunk_writeable(struct btrfs_fs_info *fs_info, u64 chunk_offset)</div><div class='ctx'> 	if (miss_ndevs &gt; btrfs_chunk_max_errors(map))</div><div class='ctx'> 		ret = false;</div><div class='ctx'> end:</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_chunk_map(map);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_mapping_tree_free(struct extent_map_tree *tree)</div><div class='add'>+void btrfs_mapping_tree_free(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	struct extent_map *em;</div><div class='add'>+	write_lock(&amp;fs_info-&gt;mapping_tree_lock);</div><div class='add'>+	while (!RB_EMPTY_ROOT(&amp;fs_info-&gt;mapping_tree.rb_root)) {</div><div class='add'>+		struct btrfs_chunk_map *map;</div><div class='add'>+		struct rb_node *node;</div><div class='ctx'> </div><div class='del'>-	while (1) {</div><div class='del'>-		write_lock(&amp;tree-&gt;lock);</div><div class='del'>-		em = lookup_extent_mapping(tree, 0, (u64)-1);</div><div class='del'>-		if (em)</div><div class='del'>-			remove_extent_mapping(tree, em);</div><div class='del'>-		write_unlock(&amp;tree-&gt;lock);</div><div class='del'>-		if (!em)</div><div class='del'>-			break;</div><div class='del'>-		/* once for us */</div><div class='del'>-		free_extent_map(em);</div><div class='del'>-		/* once for the tree */</div><div class='del'>-		free_extent_map(em);</div><div class='add'>+		node = rb_first_cached(&amp;fs_info-&gt;mapping_tree);</div><div class='add'>+		map = rb_entry(node, struct btrfs_chunk_map, rb_node);</div><div class='add'>+		rb_erase_cached(&amp;map-&gt;rb_node, &amp;fs_info-&gt;mapping_tree);</div><div class='add'>+		RB_CLEAR_NODE(&amp;map-&gt;rb_node);</div><div class='add'>+		chunk_map_device_clear_bits(map, CHUNK_ALLOCATED);</div><div class='add'>+		/* Once for the tree ref. */</div><div class='add'>+		btrfs_free_chunk_map(map);</div><div class='add'>+		cond_resched_rwlock_write(&amp;fs_info-&gt;mapping_tree_lock);</div><div class='ctx'> 	}</div><div class='add'>+	write_unlock(&amp;fs_info-&gt;mapping_tree_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int btrfs_chunk_map_num_copies(const struct btrfs_chunk_map *map)</div><div class='add'>+{</div><div class='add'>+	enum btrfs_raid_types index = btrfs_bg_flags_to_raid_index(map-&gt;type);</div><div class='add'>+</div><div class='add'>+	if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID5)</div><div class='add'>+		return 2;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * There could be two corrupted data stripes, we need to loop retry in</div><div class='add'>+	 * order to rebuild the correct data.</div><div class='add'>+	 *</div><div class='add'>+	 * Fail a stripe at a time on every retry except the stripe under</div><div class='add'>+	 * reconstruction.</div><div class='add'>+	 */</div><div class='add'>+	if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID6)</div><div class='add'>+		return map-&gt;num_stripes;</div><div class='add'>+</div><div class='add'>+	/* Non-RAID56, use their ncopies from btrfs_raid_array. */</div><div class='add'>+	return btrfs_raid_array[index].ncopies;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_num_copies(struct btrfs_fs_info *fs_info, u64 logical, u64 len)</div><div class='ctx'> {</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	struct map_lookup *map;</div><div class='add'>+	struct btrfs_chunk_map *map;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	em = btrfs_get_chunk_map(fs_info, logical, len);</div><div class='del'>-	if (IS_ERR(em))</div><div class='add'>+	map = btrfs_get_chunk_map(fs_info, logical, len);</div><div class='add'>+	if (IS_ERR(map))</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We could return errors for these cases, but that could get</div><div class='ctx'> 		 * ugly and we'd probably do the same thing which is just not do</div><div class='hunk'>@@ -5725,99 +5861,137 @@ int btrfs_num_copies(struct btrfs_fs_info *fs_info, u64 logical, u64 len)</div><div class='ctx'> 		 */</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='del'>-	map = em-&gt;map_lookup;</div><div class='del'>-	if (map-&gt;type &amp; (BTRFS_BLOCK_GROUP_DUP | BTRFS_BLOCK_GROUP_RAID1_MASK))</div><div class='del'>-		ret = map-&gt;num_stripes;</div><div class='del'>-	else if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID10)</div><div class='del'>-		ret = map-&gt;sub_stripes;</div><div class='del'>-	else if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID5)</div><div class='del'>-		ret = 2;</div><div class='del'>-	else if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID6)</div><div class='del'>-		/*</div><div class='del'>-		 * There could be two corrupted data stripes, we need</div><div class='del'>-		 * to loop retry in order to rebuild the correct data.</div><div class='del'>-		 *</div><div class='del'>-		 * Fail a stripe at a time on every retry except the</div><div class='del'>-		 * stripe under reconstruction.</div><div class='del'>-		 */</div><div class='del'>-		ret = map-&gt;num_stripes;</div><div class='del'>-	else</div><div class='del'>-		ret = 1;</div><div class='del'>-	free_extent_map(em);</div><div class='del'>-</div><div class='del'>-	down_read(&amp;fs_info-&gt;dev_replace.rwsem);</div><div class='del'>-	if (btrfs_dev_replace_is_ongoing(&amp;fs_info-&gt;dev_replace) &amp;&amp;</div><div class='del'>-	    fs_info-&gt;dev_replace.tgtdev)</div><div class='del'>-		ret++;</div><div class='del'>-	up_read(&amp;fs_info-&gt;dev_replace.rwsem);</div><div class='del'>-</div><div class='add'>+	ret = btrfs_chunk_map_num_copies(map);</div><div class='add'>+	btrfs_free_chunk_map(map);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> unsigned long btrfs_full_stripe_len(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				    u64 logical)</div><div class='ctx'> {</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	struct map_lookup *map;</div><div class='add'>+	struct btrfs_chunk_map *map;</div><div class='ctx'> 	unsigned long len = fs_info-&gt;sectorsize;</div><div class='ctx'> </div><div class='del'>-	em = btrfs_get_chunk_map(fs_info, logical, len);</div><div class='add'>+	if (!btrfs_fs_incompat(fs_info, RAID56))</div><div class='add'>+		return len;</div><div class='ctx'> </div><div class='del'>-	if (!WARN_ON(IS_ERR(em))) {</div><div class='del'>-		map = em-&gt;map_lookup;</div><div class='add'>+	map = btrfs_get_chunk_map(fs_info, logical, len);</div><div class='add'>+</div><div class='add'>+	if (!WARN_ON(IS_ERR(map))) {</div><div class='ctx'> 		if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID56_MASK)</div><div class='del'>-			len = map-&gt;stripe_len * nr_data_stripes(map);</div><div class='del'>-		free_extent_map(em);</div><div class='add'>+			len = btrfs_stripe_nr_to_offset(nr_data_stripes(map));</div><div class='add'>+		btrfs_free_chunk_map(map);</div><div class='ctx'> 	}</div><div class='ctx'> 	return len;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_is_parity_mirror(struct btrfs_fs_info *fs_info, u64 logical, u64 len)</div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+static int btrfs_read_preferred(struct btrfs_chunk_map *map, int first, int num_stripes)</div><div class='ctx'> {</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	struct map_lookup *map;</div><div class='del'>-	int ret = 0;</div><div class='add'>+	for (int index = first; index &lt; first + num_stripes; index++) {</div><div class='add'>+		const struct btrfs_device *device = map-&gt;stripes[index].dev;</div><div class='ctx'> </div><div class='del'>-	em = btrfs_get_chunk_map(fs_info, logical, len);</div><div class='add'>+		if (device-&gt;devid == READ_ONCE(device-&gt;fs_devices-&gt;read_devid))</div><div class='add'>+			return index;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if(!WARN_ON(IS_ERR(em))) {</div><div class='del'>-		map = em-&gt;map_lookup;</div><div class='del'>-		if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID56_MASK)</div><div class='del'>-			ret = 1;</div><div class='del'>-		free_extent_map(em);</div><div class='add'>+	/* If no read-preferred device is set use the first stripe. */</div><div class='add'>+	return first;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct stripe_mirror {</div><div class='add'>+	u64 devid;</div><div class='add'>+	int num;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int btrfs_cmp_devid(const void *a, const void *b)</div><div class='add'>+{</div><div class='add'>+	const struct stripe_mirror *s1 = (const struct stripe_mirror *)a;</div><div class='add'>+	const struct stripe_mirror *s2 = (const struct stripe_mirror *)b;</div><div class='add'>+</div><div class='add'>+	if (s1-&gt;devid &lt; s2-&gt;devid)</div><div class='add'>+		return -1;</div><div class='add'>+	if (s1-&gt;devid &gt; s2-&gt;devid)</div><div class='add'>+		return 1;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Select a stripe for reading using the round-robin algorithm.</div><div class='add'>+ *</div><div class='add'>+ *  1. Compute the read cycle as the total sectors read divided by the minimum</div><div class='add'>+ *     sectors per device.</div><div class='add'>+ *  2. Determine the stripe number for the current read by taking the modulus</div><div class='add'>+ *     of the read cycle with the total number of stripes:</div><div class='add'>+ *</div><div class='add'>+ *      stripe index = (total sectors / min sectors per dev) % num stripes</div><div class='add'>+ *</div><div class='add'>+ * The calculated stripe index is then used to select the corresponding device</div><div class='add'>+ * from the list of devices, which is ordered by devid.</div><div class='add'>+ */</div><div class='add'>+static int btrfs_read_rr(const struct btrfs_chunk_map *map, int first, int num_stripes)</div><div class='add'>+{</div><div class='add'>+	struct stripe_mirror stripes[BTRFS_RAID1_MAX_MIRRORS] = { 0 };</div><div class='add'>+	struct btrfs_device *device  = map-&gt;stripes[first].dev;</div><div class='add'>+	struct btrfs_fs_info *fs_info = device-&gt;fs_devices-&gt;fs_info;</div><div class='add'>+	unsigned int read_cycle;</div><div class='add'>+	unsigned int total_reads;</div><div class='add'>+	unsigned int min_reads_per_dev;</div><div class='add'>+</div><div class='add'>+	total_reads = percpu_counter_sum(&amp;fs_info-&gt;stats_read_blocks);</div><div class='add'>+	min_reads_per_dev = READ_ONCE(fs_info-&gt;fs_devices-&gt;rr_min_contig_read) &gt;&gt;</div><div class='add'>+						       fs_info-&gt;sectorsize_bits;</div><div class='add'>+</div><div class='add'>+	for (int index = 0, i = first; i &lt; first + num_stripes; i++) {</div><div class='add'>+		stripes[index].devid = map-&gt;stripes[i].dev-&gt;devid;</div><div class='add'>+		stripes[index].num = i;</div><div class='add'>+		index++;</div><div class='ctx'> 	}</div><div class='del'>-	return ret;</div><div class='add'>+	sort(stripes, num_stripes, sizeof(struct stripe_mirror),</div><div class='add'>+	     btrfs_cmp_devid, NULL);</div><div class='add'>+</div><div class='add'>+	read_cycle = total_reads / min_reads_per_dev;</div><div class='add'>+	return stripes[read_cycle % num_stripes].num;</div><div class='ctx'> }</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='ctx'> static int find_live_mirror(struct btrfs_fs_info *fs_info,</div><div class='del'>-			    struct map_lookup *map, int first,</div><div class='del'>-			    int dev_replace_is_ongoing)</div><div class='add'>+			    struct btrfs_chunk_map *map, int first,</div><div class='add'>+			    bool dev_replace_is_ongoing)</div><div class='ctx'> {</div><div class='add'>+	const enum btrfs_read_policy policy = READ_ONCE(fs_info-&gt;fs_devices-&gt;read_policy);</div><div class='ctx'> 	int i;</div><div class='ctx'> 	int num_stripes;</div><div class='ctx'> 	int preferred_mirror;</div><div class='ctx'> 	int tolerance;</div><div class='ctx'> 	struct btrfs_device *srcdev;</div><div class='ctx'> </div><div class='del'>-	ASSERT((map-&gt;type &amp;</div><div class='del'>-		 (BTRFS_BLOCK_GROUP_RAID1_MASK | BTRFS_BLOCK_GROUP_RAID10)));</div><div class='add'>+	ASSERT((map-&gt;type &amp; (BTRFS_BLOCK_GROUP_RAID1_MASK | BTRFS_BLOCK_GROUP_RAID10)),</div><div class='add'>+	       "type=%llu", map-&gt;type);</div><div class='ctx'> </div><div class='ctx'> 	if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID10)</div><div class='ctx'> 		num_stripes = map-&gt;sub_stripes;</div><div class='ctx'> 	else</div><div class='ctx'> 		num_stripes = map-&gt;num_stripes;</div><div class='ctx'> </div><div class='del'>-	switch (fs_info-&gt;fs_devices-&gt;read_policy) {</div><div class='add'>+	switch (policy) {</div><div class='ctx'> 	default:</div><div class='ctx'> 		/* Shouldn't happen, just warn and use pid instead of failing */</div><div class='del'>-		btrfs_warn_rl(fs_info,</div><div class='del'>-			      "unknown read_policy type %u, reset to pid",</div><div class='del'>-			      fs_info-&gt;fs_devices-&gt;read_policy);</div><div class='del'>-		fs_info-&gt;fs_devices-&gt;read_policy = BTRFS_READ_POLICY_PID;</div><div class='add'>+		btrfs_warn_rl(fs_info, "unknown read_policy type %u, reset to pid",</div><div class='add'>+			      policy);</div><div class='add'>+		WRITE_ONCE(fs_info-&gt;fs_devices-&gt;read_policy, BTRFS_READ_POLICY_PID);</div><div class='ctx'> 		fallthrough;</div><div class='ctx'> 	case BTRFS_READ_POLICY_PID:</div><div class='ctx'> 		preferred_mirror = first + (current-&gt;pid % num_stripes);</div><div class='ctx'> 		break;</div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+	case BTRFS_READ_POLICY_RR:</div><div class='add'>+		preferred_mirror = btrfs_read_rr(map, first, num_stripes);</div><div class='add'>+		break;</div><div class='add'>+	case BTRFS_READ_POLICY_DEVID:</div><div class='add'>+		preferred_mirror = btrfs_read_preferred(map, first, num_stripes);</div><div class='add'>+		break;</div><div class='add'>+#endif</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (dev_replace_is_ongoing &amp;&amp;</div><div class='hunk'>@@ -5849,49 +6023,23 @@ static int find_live_mirror(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	return preferred_mirror;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Bubble-sort the stripe set to put the parity/syndrome stripes last */</div><div class='del'>-static void sort_parity_stripes(struct btrfs_io_context *bioc, int num_stripes)</div><div class='add'>+EXPORT_FOR_TESTS</div><div class='add'>+struct btrfs_io_context *alloc_btrfs_io_context(struct btrfs_fs_info *fs_info,</div><div class='add'>+						u64 logical, u16 total_stripes)</div><div class='ctx'> {</div><div class='del'>-	int i;</div><div class='del'>-	int again = 1;</div><div class='del'>-</div><div class='del'>-	while (again) {</div><div class='del'>-		again = 0;</div><div class='del'>-		for (i = 0; i &lt; num_stripes - 1; i++) {</div><div class='del'>-			/* Swap if parity is on a smaller index */</div><div class='del'>-			if (bioc-&gt;raid_map[i] &gt; bioc-&gt;raid_map[i + 1]) {</div><div class='del'>-				swap(bioc-&gt;stripes[i], bioc-&gt;stripes[i + 1]);</div><div class='del'>-				swap(bioc-&gt;raid_map[i], bioc-&gt;raid_map[i + 1]);</div><div class='del'>-				again = 1;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-}</div><div class='add'>+	struct btrfs_io_context *bioc;</div><div class='ctx'> </div><div class='del'>-static struct btrfs_io_context *alloc_btrfs_io_context(struct btrfs_fs_info *fs_info,</div><div class='del'>-						       int total_stripes,</div><div class='del'>-						       int real_stripes)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_io_context *bioc = kzalloc(</div><div class='del'>-		 /* The size of btrfs_io_context */</div><div class='del'>-		sizeof(struct btrfs_io_context) +</div><div class='del'>-		/* Plus the variable array for the stripes */</div><div class='del'>-		sizeof(struct btrfs_io_stripe) * (total_stripes) +</div><div class='del'>-		/* Plus the variable array for the tgt dev */</div><div class='del'>-		sizeof(int) * (real_stripes) +</div><div class='del'>-		/*</div><div class='del'>-		 * Plus the raid_map, which includes both the tgt dev</div><div class='del'>-		 * and the stripes.</div><div class='del'>-		 */</div><div class='del'>-		sizeof(u64) * (total_stripes),</div><div class='del'>-		GFP_NOFS|__GFP_NOFAIL);</div><div class='add'>+	bioc = kzalloc(struct_size(bioc, stripes, total_stripes), GFP_NOFS);</div><div class='add'>+</div><div class='add'>+	if (!bioc)</div><div class='add'>+		return NULL;</div><div class='ctx'> </div><div class='del'>-	atomic_set(&amp;bioc-&gt;error, 0);</div><div class='ctx'> 	refcount_set(&amp;bioc-&gt;refs, 1);</div><div class='ctx'> </div><div class='ctx'> 	bioc-&gt;fs_info = fs_info;</div><div class='del'>-	bioc-&gt;tgtdev_map = (int *)(bioc-&gt;stripes + total_stripes);</div><div class='del'>-	bioc-&gt;raid_map = (u64 *)(bioc-&gt;tgtdev_map + real_stripes);</div><div class='add'>+	bioc-&gt;replace_stripe_src = -1;</div><div class='add'>+	bioc-&gt;full_stripe_logical = (u64)-1;</div><div class='add'>+	bioc-&gt;logical = logical;</div><div class='ctx'> </div><div class='ctx'> 	return bioc;</div><div class='ctx'> }</div><div class='hunk'>@@ -5910,75 +6058,66 @@ void btrfs_put_bioc(struct btrfs_io_context *bioc)</div><div class='ctx'> 		kfree(bioc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* can REQ_OP_DISCARD be sent with other REQ like REQ_OP_WRITE? */</div><div class='ctx'> /*</div><div class='ctx'>  * Please note that, discard won't be sent to target device of device</div><div class='ctx'>  * replace.</div><div class='ctx'>  */</div><div class='del'>-static int __btrfs_map_block_for_discard(struct btrfs_fs_info *fs_info,</div><div class='del'>-					 u64 logical, u64 *length_ret,</div><div class='del'>-					 struct btrfs_io_context **bioc_ret)</div><div class='add'>+struct btrfs_discard_stripe *btrfs_map_discard(struct btrfs_fs_info *fs_info,</div><div class='add'>+					       u64 logical, u64 *length_ret,</div><div class='add'>+					       u32 *num_stripes)</div><div class='ctx'> {</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	struct map_lookup *map;</div><div class='del'>-	struct btrfs_io_context *bioc;</div><div class='add'>+	struct btrfs_chunk_map *map;</div><div class='add'>+	struct btrfs_discard_stripe *stripes;</div><div class='ctx'> 	u64 length = *length_ret;</div><div class='ctx'> 	u64 offset;</div><div class='del'>-	u64 stripe_nr;</div><div class='del'>-	u64 stripe_nr_end;</div><div class='add'>+	u32 stripe_nr;</div><div class='add'>+	u32 stripe_nr_end;</div><div class='add'>+	u32 stripe_cnt;</div><div class='ctx'> 	u64 stripe_end_offset;</div><div class='del'>-	u64 stripe_cnt;</div><div class='del'>-	u64 stripe_len;</div><div class='ctx'> 	u64 stripe_offset;</div><div class='del'>-	u64 num_stripes;</div><div class='ctx'> 	u32 stripe_index;</div><div class='ctx'> 	u32 factor = 0;</div><div class='ctx'> 	u32 sub_stripes = 0;</div><div class='del'>-	u64 stripes_per_dev = 0;</div><div class='add'>+	u32 stripes_per_dev = 0;</div><div class='ctx'> 	u32 remaining_stripes = 0;</div><div class='ctx'> 	u32 last_stripe = 0;</div><div class='del'>-	int ret = 0;</div><div class='add'>+	int ret;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	/* Discard always returns a bioc. */</div><div class='del'>-	ASSERT(bioc_ret);</div><div class='del'>-</div><div class='del'>-	em = btrfs_get_chunk_map(fs_info, logical, length);</div><div class='del'>-	if (IS_ERR(em))</div><div class='del'>-		return PTR_ERR(em);</div><div class='add'>+	map = btrfs_get_chunk_map(fs_info, logical, length);</div><div class='add'>+	if (IS_ERR(map))</div><div class='add'>+		return ERR_CAST(map);</div><div class='ctx'> </div><div class='del'>-	map = em-&gt;map_lookup;</div><div class='ctx'> 	/* we don't discard raid56 yet */</div><div class='ctx'> 	if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID56_MASK) {</div><div class='ctx'> 		ret = -EOPNOTSUPP;</div><div class='del'>-		goto out;</div><div class='add'>+		goto out_free_map;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	offset = logical - em-&gt;start;</div><div class='del'>-	length = min_t(u64, em-&gt;start + em-&gt;len - logical, length);</div><div class='add'>+	offset = logical - map-&gt;start;</div><div class='add'>+	length = min_t(u64, map-&gt;start + map-&gt;chunk_len - logical, length);</div><div class='ctx'> 	*length_ret = length;</div><div class='ctx'> </div><div class='del'>-	stripe_len = map-&gt;stripe_len;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * stripe_nr counts the total number of stripes we have to stride</div><div class='ctx'> 	 * to get to this block</div><div class='ctx'> 	 */</div><div class='del'>-	stripe_nr = div64_u64(offset, stripe_len);</div><div class='add'>+	stripe_nr = offset &gt;&gt; BTRFS_STRIPE_LEN_SHIFT;</div><div class='ctx'> </div><div class='ctx'> 	/* stripe_offset is the offset of this block in its stripe */</div><div class='del'>-	stripe_offset = offset - stripe_nr * stripe_len;</div><div class='add'>+	stripe_offset = offset - btrfs_stripe_nr_to_offset(stripe_nr);</div><div class='ctx'> </div><div class='del'>-	stripe_nr_end = round_up(offset + length, map-&gt;stripe_len);</div><div class='del'>-	stripe_nr_end = div64_u64(stripe_nr_end, map-&gt;stripe_len);</div><div class='add'>+	stripe_nr_end = round_up(offset + length, BTRFS_STRIPE_LEN) &gt;&gt;</div><div class='add'>+			BTRFS_STRIPE_LEN_SHIFT;</div><div class='ctx'> 	stripe_cnt = stripe_nr_end - stripe_nr;</div><div class='del'>-	stripe_end_offset = stripe_nr_end * map-&gt;stripe_len -</div><div class='add'>+	stripe_end_offset = btrfs_stripe_nr_to_offset(stripe_nr_end) -</div><div class='ctx'> 			    (offset + length);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * after this, stripe_nr is the number of stripes on this</div><div class='ctx'> 	 * device we have to walk to find the data, and stripe_index is</div><div class='ctx'> 	 * the number of our device in the stripe array</div><div class='ctx'> 	 */</div><div class='del'>-	num_stripes = 1;</div><div class='add'>+	*num_stripes = 1;</div><div class='ctx'> 	stripe_index = 0;</div><div class='ctx'> 	if (map-&gt;type &amp; (BTRFS_BLOCK_GROUP_RAID0 |</div><div class='ctx'> 			 BTRFS_BLOCK_GROUP_RAID10)) {</div><div class='hunk'>@@ -5988,41 +6127,41 @@ static int __btrfs_map_block_for_discard(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			sub_stripes = map-&gt;sub_stripes;</div><div class='ctx'> </div><div class='ctx'> 		factor = map-&gt;num_stripes / sub_stripes;</div><div class='del'>-		num_stripes = min_t(u64, map-&gt;num_stripes,</div><div class='add'>+		*num_stripes = min_t(u64, map-&gt;num_stripes,</div><div class='ctx'> 				    sub_stripes * stripe_cnt);</div><div class='del'>-		stripe_nr = div_u64_rem(stripe_nr, factor, &amp;stripe_index);</div><div class='add'>+		stripe_index = stripe_nr % factor;</div><div class='add'>+		stripe_nr /= factor;</div><div class='ctx'> 		stripe_index *= sub_stripes;</div><div class='del'>-		stripes_per_dev = div_u64_rem(stripe_cnt, factor,</div><div class='del'>-					      &amp;remaining_stripes);</div><div class='del'>-		div_u64_rem(stripe_nr_end - 1, factor, &amp;last_stripe);</div><div class='del'>-		last_stripe *= sub_stripes;</div><div class='add'>+</div><div class='add'>+		remaining_stripes = stripe_cnt % factor;</div><div class='add'>+		stripes_per_dev = stripe_cnt / factor;</div><div class='add'>+		last_stripe = ((stripe_nr_end - 1) % factor) * sub_stripes;</div><div class='ctx'> 	} else if (map-&gt;type &amp; (BTRFS_BLOCK_GROUP_RAID1_MASK |</div><div class='ctx'> 				BTRFS_BLOCK_GROUP_DUP)) {</div><div class='del'>-		num_stripes = map-&gt;num_stripes;</div><div class='add'>+		*num_stripes = map-&gt;num_stripes;</div><div class='ctx'> 	} else {</div><div class='del'>-		stripe_nr = div_u64_rem(stripe_nr, map-&gt;num_stripes,</div><div class='del'>-					&amp;stripe_index);</div><div class='add'>+		stripe_index = stripe_nr % map-&gt;num_stripes;</div><div class='add'>+		stripe_nr /= map-&gt;num_stripes;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	bioc = alloc_btrfs_io_context(fs_info, num_stripes, 0);</div><div class='del'>-	if (!bioc) {</div><div class='add'>+	stripes = kcalloc(*num_stripes, sizeof(*stripes), GFP_NOFS);</div><div class='add'>+	if (!stripes) {</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='add'>+		goto out_free_map;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; num_stripes; i++) {</div><div class='del'>-		bioc-&gt;stripes[i].physical =</div><div class='add'>+	for (i = 0; i &lt; *num_stripes; i++) {</div><div class='add'>+		stripes[i].physical =</div><div class='ctx'> 			map-&gt;stripes[stripe_index].physical +</div><div class='del'>-			stripe_offset + stripe_nr * map-&gt;stripe_len;</div><div class='del'>-		bioc-&gt;stripes[i].dev = map-&gt;stripes[stripe_index].dev;</div><div class='add'>+			stripe_offset + btrfs_stripe_nr_to_offset(stripe_nr);</div><div class='add'>+		stripes[i].dev = map-&gt;stripes[stripe_index].dev;</div><div class='ctx'> </div><div class='ctx'> 		if (map-&gt;type &amp; (BTRFS_BLOCK_GROUP_RAID0 |</div><div class='ctx'> 				 BTRFS_BLOCK_GROUP_RAID10)) {</div><div class='del'>-			bioc-&gt;stripes[i].length = stripes_per_dev *</div><div class='del'>-				map-&gt;stripe_len;</div><div class='add'>+			stripes[i].length = btrfs_stripe_nr_to_offset(stripes_per_dev);</div><div class='ctx'> </div><div class='ctx'> 			if (i / sub_stripes &lt; remaining_stripes)</div><div class='del'>-				bioc-&gt;stripes[i].length += map-&gt;stripe_len;</div><div class='add'>+				stripes[i].length += BTRFS_STRIPE_LEN;</div><div class='ctx'> </div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Special for the first stripe and</div><div class='hunk'>@@ -6033,17 +6172,17 @@ static int __btrfs_map_block_for_discard(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			 *    off     end_off</div><div class='ctx'> 			 */</div><div class='ctx'> 			if (i &lt; sub_stripes)</div><div class='del'>-				bioc-&gt;stripes[i].length -= stripe_offset;</div><div class='add'>+				stripes[i].length -= stripe_offset;</div><div class='ctx'> </div><div class='ctx'> 			if (stripe_index &gt;= last_stripe &amp;&amp;</div><div class='ctx'> 			    stripe_index &lt;= (last_stripe +</div><div class='ctx'> 					     sub_stripes - 1))</div><div class='del'>-				bioc-&gt;stripes[i].length -= stripe_end_offset;</div><div class='add'>+				stripes[i].length -= stripe_end_offset;</div><div class='ctx'> </div><div class='ctx'> 			if (i == sub_stripes - 1)</div><div class='ctx'> 				stripe_offset = 0;</div><div class='ctx'> 		} else {</div><div class='del'>-			bioc-&gt;stripes[i].length = length;</div><div class='add'>+			stripes[i].length = length;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		stripe_index++;</div><div class='hunk'>@@ -6053,89 +6192,11 @@ static int __btrfs_map_block_for_discard(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	*bioc_ret = bioc;</div><div class='del'>-	bioc-&gt;map_type = map-&gt;type;</div><div class='del'>-	bioc-&gt;num_stripes = num_stripes;</div><div class='del'>-out:</div><div class='del'>-	free_extent_map(em);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * In dev-replace case, for repair case (that's the only case where the mirror</div><div class='del'>- * is selected explicitly when calling btrfs_map_block), blocks left of the</div><div class='del'>- * left cursor can also be read from the target drive.</div><div class='del'>- *</div><div class='del'>- * For REQ_GET_READ_MIRRORS, the target drive is added as the last one to the</div><div class='del'>- * array of stripes.</div><div class='del'>- * For READ, it also needs to be supported using the same mirror number.</div><div class='del'>- *</div><div class='del'>- * If the requested block is not left of the left cursor, EIO is returned. This</div><div class='del'>- * can happen because btrfs_num_copies() returns one more in the dev-replace</div><div class='del'>- * case.</div><div class='del'>- */</div><div class='del'>-static int get_extra_mirror_from_replace(struct btrfs_fs_info *fs_info,</div><div class='del'>-					 u64 logical, u64 length,</div><div class='del'>-					 u64 srcdev_devid, int *mirror_num,</div><div class='del'>-					 u64 *physical)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_io_context *bioc = NULL;</div><div class='del'>-	int num_stripes;</div><div class='del'>-	int index_srcdev = 0;</div><div class='del'>-	int found = 0;</div><div class='del'>-	u64 physical_of_found = 0;</div><div class='del'>-	int i;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	ret = __btrfs_map_block(fs_info, BTRFS_MAP_GET_READ_MIRRORS,</div><div class='del'>-				logical, &amp;length, &amp;bioc, 0, 0);</div><div class='del'>-	if (ret) {</div><div class='del'>-		ASSERT(bioc == NULL);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	num_stripes = bioc-&gt;num_stripes;</div><div class='del'>-	if (*mirror_num &gt; num_stripes) {</div><div class='del'>-		/*</div><div class='del'>-		 * BTRFS_MAP_GET_READ_MIRRORS does not contain this mirror,</div><div class='del'>-		 * that means that the requested area is not left of the left</div><div class='del'>-		 * cursor</div><div class='del'>-		 */</div><div class='del'>-		btrfs_put_bioc(bioc);</div><div class='del'>-		return -EIO;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * process the rest of the function using the mirror_num of the source</div><div class='del'>-	 * drive. Therefore look it up first.  At the end, patch the device</div><div class='del'>-	 * pointer to the one of the target drive.</div><div class='del'>-	 */</div><div class='del'>-	for (i = 0; i &lt; num_stripes; i++) {</div><div class='del'>-		if (bioc-&gt;stripes[i].dev-&gt;devid != srcdev_devid)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * In case of DUP, in order to keep it simple, only add the</div><div class='del'>-		 * mirror with the lowest physical address</div><div class='del'>-		 */</div><div class='del'>-		if (found &amp;&amp;</div><div class='del'>-		    physical_of_found &lt;= bioc-&gt;stripes[i].physical)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		index_srcdev = i;</div><div class='del'>-		found = 1;</div><div class='del'>-		physical_of_found = bioc-&gt;stripes[i].physical;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	btrfs_put_bioc(bioc);</div><div class='del'>-</div><div class='del'>-	ASSERT(found);</div><div class='del'>-	if (!found)</div><div class='del'>-		return -EIO;</div><div class='del'>-</div><div class='del'>-	*mirror_num = index_srcdev + 1;</div><div class='del'>-	*physical = physical_of_found;</div><div class='del'>-	return ret;</div><div class='add'>+	btrfs_free_chunk_map(map);</div><div class='add'>+	return stripes;</div><div class='add'>+out_free_map:</div><div class='add'>+	btrfs_free_chunk_map(map);</div><div class='add'>+	return ERR_PTR(ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool is_block_group_to_copy(struct btrfs_fs_info *fs_info, u64 logical)</div><div class='hunk'>@@ -6149,662 +6210,536 @@ static bool is_block_group_to_copy(struct btrfs_fs_info *fs_info, u64 logical)</div><div class='ctx'> </div><div class='ctx'> 	cache = btrfs_lookup_block_group(fs_info, logical);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;cache-&gt;lock);</div><div class='del'>-	ret = cache-&gt;to_copy;</div><div class='del'>-	spin_unlock(&amp;cache-&gt;lock);</div><div class='add'>+	ret = test_bit(BLOCK_GROUP_FLAG_TO_COPY, &amp;cache-&gt;runtime_flags);</div><div class='ctx'> </div><div class='ctx'> 	btrfs_put_block_group(cache);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void handle_ops_on_dev_replace(enum btrfs_map_op op,</div><div class='del'>-				      struct btrfs_io_context **bioc_ret,</div><div class='add'>+static void handle_ops_on_dev_replace(struct btrfs_io_context *bioc,</div><div class='ctx'> 				      struct btrfs_dev_replace *dev_replace,</div><div class='ctx'> 				      u64 logical,</div><div class='del'>-				      int *num_stripes_ret, int *max_errors_ret)</div><div class='add'>+				      struct btrfs_io_geometry *io_geom)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_io_context *bioc = *bioc_ret;</div><div class='ctx'> 	u64 srcdev_devid = dev_replace-&gt;srcdev-&gt;devid;</div><div class='del'>-	int tgtdev_indexes = 0;</div><div class='del'>-	int num_stripes = *num_stripes_ret;</div><div class='del'>-	int max_errors = *max_errors_ret;</div><div class='add'>+	/*</div><div class='add'>+	 * At this stage, num_stripes is still the real number of stripes,</div><div class='add'>+	 * excluding the duplicated stripes.</div><div class='add'>+	 */</div><div class='add'>+	int num_stripes = io_geom-&gt;num_stripes;</div><div class='add'>+	int max_errors = io_geom-&gt;max_errors;</div><div class='add'>+	int nr_extra_stripes = 0;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	if (op == BTRFS_MAP_WRITE) {</div><div class='del'>-		int index_where_to_add;</div><div class='add'>+	/*</div><div class='add'>+	 * A block group which has "to_copy" set will eventually be copied by</div><div class='add'>+	 * the dev-replace process. We can avoid cloning IO here.</div><div class='add'>+	 */</div><div class='add'>+	if (is_block_group_to_copy(dev_replace-&gt;srcdev-&gt;fs_info, logical))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * A block group which have "to_copy" set will eventually</div><div class='del'>-		 * copied by dev-replace process. We can avoid cloning IO here.</div><div class='del'>-		 */</div><div class='del'>-		if (is_block_group_to_copy(dev_replace-&gt;srcdev-&gt;fs_info, logical))</div><div class='del'>-			return;</div><div class='add'>+	/*</div><div class='add'>+	 * Duplicate the write operations while the dev-replace procedure is</div><div class='add'>+	 * running. Since the copying of the old disk to the new disk takes</div><div class='add'>+	 * place at run time while the filesystem is mounted writable, the</div><div class='add'>+	 * regular write operations to the old disk have to be duplicated to go</div><div class='add'>+	 * to the new disk as well.</div><div class='add'>+	 *</div><div class='add'>+	 * Note that device-&gt;missing is handled by the caller, and that the</div><div class='add'>+	 * write to the old disk is already set up in the stripes array.</div><div class='add'>+	 */</div><div class='add'>+	for (i = 0; i &lt; num_stripes; i++) {</div><div class='add'>+		struct btrfs_io_stripe *old = &amp;bioc-&gt;stripes[i];</div><div class='add'>+		struct btrfs_io_stripe *new = &amp;bioc-&gt;stripes[num_stripes + nr_extra_stripes];</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * duplicate the write operations while the dev replace</div><div class='del'>-		 * procedure is running. Since the copying of the old disk to</div><div class='del'>-		 * the new disk takes place at run time while the filesystem is</div><div class='del'>-		 * mounted writable, the regular write operations to the old</div><div class='del'>-		 * disk have to be duplicated to go to the new disk as well.</div><div class='del'>-		 *</div><div class='del'>-		 * Note that device-&gt;missing is handled by the caller, and that</div><div class='del'>-		 * the write to the old disk is already set up in the stripes</div><div class='del'>-		 * array.</div><div class='del'>-		 */</div><div class='del'>-		index_where_to_add = num_stripes;</div><div class='del'>-		for (i = 0; i &lt; num_stripes; i++) {</div><div class='del'>-			if (bioc-&gt;stripes[i].dev-&gt;devid == srcdev_devid) {</div><div class='del'>-				/* write to new disk, too */</div><div class='del'>-				struct btrfs_io_stripe *new =</div><div class='del'>-					bioc-&gt;stripes + index_where_to_add;</div><div class='del'>-				struct btrfs_io_stripe *old =</div><div class='del'>-					bioc-&gt;stripes + i;</div><div class='del'>-</div><div class='del'>-				new-&gt;physical = old-&gt;physical;</div><div class='del'>-				new-&gt;length = old-&gt;length;</div><div class='del'>-				new-&gt;dev = dev_replace-&gt;tgtdev;</div><div class='del'>-				bioc-&gt;tgtdev_map[i] = index_where_to_add;</div><div class='del'>-				index_where_to_add++;</div><div class='del'>-				max_errors++;</div><div class='del'>-				tgtdev_indexes++;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-		num_stripes = index_where_to_add;</div><div class='del'>-	} else if (op == BTRFS_MAP_GET_READ_MIRRORS) {</div><div class='del'>-		int index_srcdev = 0;</div><div class='del'>-		int found = 0;</div><div class='del'>-		u64 physical_of_found = 0;</div><div class='add'>+		if (old-&gt;dev-&gt;devid != srcdev_devid)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		new-&gt;physical = old-&gt;physical;</div><div class='add'>+		new-&gt;dev = dev_replace-&gt;tgtdev;</div><div class='add'>+		if (bioc-&gt;map_type &amp; BTRFS_BLOCK_GROUP_RAID56_MASK)</div><div class='add'>+			bioc-&gt;replace_stripe_src = i;</div><div class='add'>+		nr_extra_stripes++;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* We can only have at most 2 extra nr_stripes (for DUP). */</div><div class='add'>+	ASSERT(nr_extra_stripes &lt;= 2, "nr_extra_stripes=%d", nr_extra_stripes);</div><div class='add'>+	/*</div><div class='add'>+	 * For GET_READ_MIRRORS, we can only return at most 1 extra stripe for</div><div class='add'>+	 * replace.</div><div class='add'>+	 * If we have 2 extra stripes, only choose the one with smaller physical.</div><div class='add'>+	 */</div><div class='add'>+	if (io_geom-&gt;op == BTRFS_MAP_GET_READ_MIRRORS &amp;&amp; nr_extra_stripes == 2) {</div><div class='add'>+		struct btrfs_io_stripe *first = &amp;bioc-&gt;stripes[num_stripes];</div><div class='add'>+		struct btrfs_io_stripe *second = &amp;bioc-&gt;stripes[num_stripes + 1];</div><div class='add'>+</div><div class='add'>+		/* Only DUP can have two extra stripes. */</div><div class='add'>+		ASSERT(bioc-&gt;map_type &amp; BTRFS_BLOCK_GROUP_DUP,</div><div class='add'>+		       "map_type=%llu", bioc-&gt;map_type);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * During the dev-replace procedure, the target drive can also</div><div class='del'>-		 * be used to read data in case it is needed to repair a corrupt</div><div class='del'>-		 * block elsewhere. This is possible if the requested area is</div><div class='del'>-		 * left of the left cursor. In this area, the target drive is a</div><div class='del'>-		 * full copy of the source drive.</div><div class='add'>+		 * Swap the last stripe stripes and reduce @nr_extra_stripes.</div><div class='add'>+		 * The extra stripe would still be there, but won't be accessed.</div><div class='ctx'> 		 */</div><div class='del'>-		for (i = 0; i &lt; num_stripes; i++) {</div><div class='del'>-			if (bioc-&gt;stripes[i].dev-&gt;devid == srcdev_devid) {</div><div class='del'>-				/*</div><div class='del'>-				 * In case of DUP, in order to keep it simple,</div><div class='del'>-				 * only add the mirror with the lowest physical</div><div class='del'>-				 * address</div><div class='del'>-				 */</div><div class='del'>-				if (found &amp;&amp;</div><div class='del'>-				    physical_of_found &lt;= bioc-&gt;stripes[i].physical)</div><div class='del'>-					continue;</div><div class='del'>-				index_srcdev = i;</div><div class='del'>-				found = 1;</div><div class='del'>-				physical_of_found = bioc-&gt;stripes[i].physical;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-		if (found) {</div><div class='del'>-			struct btrfs_io_stripe *tgtdev_stripe =</div><div class='del'>-				bioc-&gt;stripes + num_stripes;</div><div class='del'>-</div><div class='del'>-			tgtdev_stripe-&gt;physical = physical_of_found;</div><div class='del'>-			tgtdev_stripe-&gt;length =</div><div class='del'>-				bioc-&gt;stripes[index_srcdev].length;</div><div class='del'>-			tgtdev_stripe-&gt;dev = dev_replace-&gt;tgtdev;</div><div class='del'>-			bioc-&gt;tgtdev_map[index_srcdev] = num_stripes;</div><div class='del'>-</div><div class='del'>-			tgtdev_indexes++;</div><div class='del'>-			num_stripes++;</div><div class='add'>+		if (first-&gt;physical &gt; second-&gt;physical) {</div><div class='add'>+			swap(second-&gt;physical, first-&gt;physical);</div><div class='add'>+			swap(second-&gt;dev, first-&gt;dev);</div><div class='add'>+			nr_extra_stripes--;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	*num_stripes_ret = num_stripes;</div><div class='del'>-	*max_errors_ret = max_errors;</div><div class='del'>-	bioc-&gt;num_tgtdevs = tgtdev_indexes;</div><div class='del'>-	*bioc_ret = bioc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool need_full_stripe(enum btrfs_map_op op)</div><div class='del'>-{</div><div class='del'>-	return (op == BTRFS_MAP_WRITE || op == BTRFS_MAP_GET_READ_MIRRORS);</div><div class='add'>+	io_geom-&gt;num_stripes = num_stripes + nr_extra_stripes;</div><div class='add'>+	io_geom-&gt;max_errors = max_errors + nr_extra_stripes;</div><div class='add'>+	bioc-&gt;replace_nr_stripes = nr_extra_stripes;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Calculate the geometry of a particular (address, len) tuple. This</div><div class='del'>- * information is used to calculate how big a particular bio can get before it</div><div class='del'>- * straddles a stripe.</div><div class='del'>- *</div><div class='del'>- * @fs_info: the filesystem</div><div class='del'>- * @em:      mapping containing the logical extent</div><div class='del'>- * @op:      type of operation - write or read</div><div class='del'>- * @logical: address that we want to figure out the geometry of</div><div class='del'>- * @io_geom: pointer used to return values</div><div class='del'>- *</div><div class='del'>- * Returns &lt; 0 in case a chunk for the given logical address cannot be found,</div><div class='del'>- * usually shouldn't happen unless @logical is corrupted, 0 otherwise.</div><div class='del'>- */</div><div class='del'>-int btrfs_get_io_geometry(struct btrfs_fs_info *fs_info, struct extent_map *em,</div><div class='del'>-			  enum btrfs_map_op op, u64 logical,</div><div class='del'>-			  struct btrfs_io_geometry *io_geom)</div><div class='add'>+static u64 btrfs_max_io_len(struct btrfs_chunk_map *map, u64 offset,</div><div class='add'>+			    struct btrfs_io_geometry *io_geom)</div><div class='ctx'> {</div><div class='del'>-	struct map_lookup *map;</div><div class='del'>-	u64 len;</div><div class='del'>-	u64 offset;</div><div class='del'>-	u64 stripe_offset;</div><div class='del'>-	u64 stripe_nr;</div><div class='del'>-	u64 stripe_len;</div><div class='del'>-	u64 raid56_full_stripe_start = (u64)-1;</div><div class='del'>-	int data_stripes;</div><div class='del'>-</div><div class='del'>-	ASSERT(op != BTRFS_MAP_DISCARD);</div><div class='del'>-</div><div class='del'>-	map = em-&gt;map_lookup;</div><div class='del'>-	/* Offset of this logical address in the chunk */</div><div class='del'>-	offset = logical - em-&gt;start;</div><div class='del'>-	/* Len of a stripe in a chunk */</div><div class='del'>-	stripe_len = map-&gt;stripe_len;</div><div class='del'>-	/* Stripe where this block falls in */</div><div class='del'>-	stripe_nr = div64_u64(offset, stripe_len);</div><div class='del'>-	/* Offset of stripe in the chunk */</div><div class='del'>-	stripe_offset = stripe_nr * stripe_len;</div><div class='del'>-	if (offset &lt; stripe_offset) {</div><div class='del'>-		btrfs_crit(fs_info,</div><div class='del'>-"stripe math has gone wrong, stripe_offset=%llu offset=%llu start=%llu logical=%llu stripe_len=%llu",</div><div class='del'>-			stripe_offset, offset, em-&gt;start, logical, stripe_len);</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* stripe_offset is the offset of this block in its stripe */</div><div class='del'>-	stripe_offset = offset - stripe_offset;</div><div class='del'>-	data_stripes = nr_data_stripes(map);</div><div class='add'>+	/*</div><div class='add'>+	 * Stripe_nr is the stripe where this block falls.  stripe_offset is</div><div class='add'>+	 * the offset of this block in its stripe.</div><div class='add'>+	 */</div><div class='add'>+	io_geom-&gt;stripe_offset = offset &amp; BTRFS_STRIPE_LEN_MASK;</div><div class='add'>+	io_geom-&gt;stripe_nr = offset &gt;&gt; BTRFS_STRIPE_LEN_SHIFT;</div><div class='add'>+	ASSERT(io_geom-&gt;stripe_offset &lt; U32_MAX,</div><div class='add'>+	       "stripe_offset=%llu", io_geom-&gt;stripe_offset);</div><div class='ctx'> </div><div class='del'>-	if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_PROFILE_MASK) {</div><div class='del'>-		u64 max_len = stripe_len - stripe_offset;</div><div class='add'>+	if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID56_MASK) {</div><div class='add'>+		unsigned long full_stripe_len =</div><div class='add'>+			btrfs_stripe_nr_to_offset(nr_data_stripes(map));</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * In case of raid56, we need to know the stripe aligned start</div><div class='add'>+		 * For full stripe start, we use previously calculated</div><div class='add'>+		 * @stripe_nr. Align it to nr_data_stripes, then multiply with</div><div class='add'>+		 * STRIPE_LEN.</div><div class='add'>+		 *</div><div class='add'>+		 * By this we can avoid u64 division completely.  And we have</div><div class='add'>+		 * to go rounddown(), not round_down(), as nr_data_stripes is</div><div class='add'>+		 * not ensured to be power of 2.</div><div class='ctx'> 		 */</div><div class='del'>-		if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID56_MASK) {</div><div class='del'>-			unsigned long full_stripe_len = stripe_len * data_stripes;</div><div class='del'>-			raid56_full_stripe_start = offset;</div><div class='add'>+		io_geom-&gt;raid56_full_stripe_start = btrfs_stripe_nr_to_offset(</div><div class='add'>+			rounddown(io_geom-&gt;stripe_nr, nr_data_stripes(map)));</div><div class='add'>+</div><div class='add'>+		ASSERT(io_geom-&gt;raid56_full_stripe_start + full_stripe_len &gt; offset,</div><div class='add'>+		       "raid56_full_stripe_start=%llu full_stripe_len=%lu offset=%llu",</div><div class='add'>+		       io_geom-&gt;raid56_full_stripe_start, full_stripe_len, offset);</div><div class='add'>+		ASSERT(io_geom-&gt;raid56_full_stripe_start &lt;= offset,</div><div class='add'>+		       "raid56_full_stripe_start=%llu offset=%llu",</div><div class='add'>+		       io_geom-&gt;raid56_full_stripe_start, offset);</div><div class='add'>+		/*</div><div class='add'>+		 * For writes to RAID56, allow to write a full stripe set, but</div><div class='add'>+		 * no straddling of stripe sets.</div><div class='add'>+		 */</div><div class='add'>+		if (io_geom-&gt;op == BTRFS_MAP_WRITE)</div><div class='add'>+			return full_stripe_len - (offset - io_geom-&gt;raid56_full_stripe_start);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-			/*</div><div class='del'>-			 * Allow a write of a full stripe, but make sure we</div><div class='del'>-			 * don't allow straddling of stripes</div><div class='del'>-			 */</div><div class='del'>-			raid56_full_stripe_start = div64_u64(raid56_full_stripe_start,</div><div class='del'>-					full_stripe_len);</div><div class='del'>-			raid56_full_stripe_start *= full_stripe_len;</div><div class='add'>+	/*</div><div class='add'>+	 * For other RAID types and for RAID56 reads, allow a single stripe (on</div><div class='add'>+	 * a single disk).</div><div class='add'>+	 */</div><div class='add'>+	if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_STRIPE_MASK)</div><div class='add'>+		return BTRFS_STRIPE_LEN - io_geom-&gt;stripe_offset;</div><div class='add'>+	return U64_MAX;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-			/*</div><div class='del'>-			 * For writes to RAID[56], allow a full stripeset across</div><div class='del'>-			 * all disks. For other RAID types and for RAID[56]</div><div class='del'>-			 * reads, just allow a single stripe (on a single disk).</div><div class='del'>-			 */</div><div class='del'>-			if (op == BTRFS_MAP_WRITE) {</div><div class='del'>-				max_len = stripe_len * data_stripes -</div><div class='del'>-					  (offset - raid56_full_stripe_start);</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-		len = min_t(u64, em-&gt;len - offset, max_len);</div><div class='del'>-	} else {</div><div class='del'>-		len = em-&gt;len - offset;</div><div class='del'>-	}</div><div class='add'>+static int set_io_stripe(struct btrfs_fs_info *fs_info, u64 logical,</div><div class='add'>+			 u64 *length, struct btrfs_io_stripe *dst,</div><div class='add'>+			 struct btrfs_chunk_map *map,</div><div class='add'>+			 struct btrfs_io_geometry *io_geom)</div><div class='add'>+{</div><div class='add'>+	dst-&gt;dev = map-&gt;stripes[io_geom-&gt;stripe_index].dev;</div><div class='ctx'> </div><div class='del'>-	io_geom-&gt;len = len;</div><div class='del'>-	io_geom-&gt;offset = offset;</div><div class='del'>-	io_geom-&gt;stripe_len = stripe_len;</div><div class='del'>-	io_geom-&gt;stripe_nr = stripe_nr;</div><div class='del'>-	io_geom-&gt;stripe_offset = stripe_offset;</div><div class='del'>-	io_geom-&gt;raid56_stripe_offset = raid56_full_stripe_start;</div><div class='add'>+	if (io_geom-&gt;op == BTRFS_MAP_READ &amp;&amp; io_geom-&gt;use_rst)</div><div class='add'>+		return btrfs_get_raid_extent_offset(fs_info, logical, length,</div><div class='add'>+						    map-&gt;type,</div><div class='add'>+						    io_geom-&gt;stripe_index, dst);</div><div class='ctx'> </div><div class='add'>+	dst-&gt;physical = map-&gt;stripes[io_geom-&gt;stripe_index].physical +</div><div class='add'>+			io_geom-&gt;stripe_offset +</div><div class='add'>+			btrfs_stripe_nr_to_offset(io_geom-&gt;stripe_nr);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __btrfs_map_block(struct btrfs_fs_info *fs_info,</div><div class='del'>-			     enum btrfs_map_op op,</div><div class='del'>-			     u64 logical, u64 *length,</div><div class='del'>-			     struct btrfs_io_context **bioc_ret,</div><div class='del'>-			     int mirror_num, int need_raid_map)</div><div class='add'>+static bool is_single_device_io(struct btrfs_fs_info *fs_info,</div><div class='add'>+				const struct btrfs_io_stripe *smap,</div><div class='add'>+				const struct btrfs_chunk_map *map,</div><div class='add'>+				int num_alloc_stripes,</div><div class='add'>+				struct btrfs_io_geometry *io_geom)</div><div class='ctx'> {</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	struct map_lookup *map;</div><div class='del'>-	u64 stripe_offset;</div><div class='del'>-	u64 stripe_nr;</div><div class='del'>-	u64 stripe_len;</div><div class='del'>-	u32 stripe_index;</div><div class='del'>-	int data_stripes;</div><div class='del'>-	int i;</div><div class='del'>-	int ret = 0;</div><div class='del'>-	int num_stripes;</div><div class='del'>-	int max_errors = 0;</div><div class='del'>-	int tgtdev_indexes = 0;</div><div class='del'>-	struct btrfs_io_context *bioc = NULL;</div><div class='del'>-	struct btrfs_dev_replace *dev_replace = &amp;fs_info-&gt;dev_replace;</div><div class='del'>-	int dev_replace_is_ongoing = 0;</div><div class='del'>-	int num_alloc_stripes;</div><div class='del'>-	int patch_the_first_stripe_for_dev_replace = 0;</div><div class='del'>-	u64 physical_to_patch_in_first_stripe = 0;</div><div class='del'>-	u64 raid56_full_stripe_start = (u64)-1;</div><div class='del'>-	struct btrfs_io_geometry geom;</div><div class='del'>-</div><div class='del'>-	ASSERT(bioc_ret);</div><div class='del'>-	ASSERT(op != BTRFS_MAP_DISCARD);</div><div class='add'>+	if (!smap)</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-	em = btrfs_get_chunk_map(fs_info, logical, *length);</div><div class='del'>-	ASSERT(!IS_ERR(em));</div><div class='add'>+	if (num_alloc_stripes != 1)</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_get_io_geometry(fs_info, em, op, logical, &amp;geom);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		return ret;</div><div class='add'>+	if (io_geom-&gt;use_rst &amp;&amp; io_geom-&gt;op != BTRFS_MAP_READ)</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-	map = em-&gt;map_lookup;</div><div class='add'>+	if ((map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID56_MASK) &amp;&amp; io_geom-&gt;mirror_num &gt; 1)</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-	*length = geom.len;</div><div class='del'>-	stripe_len = geom.stripe_len;</div><div class='del'>-	stripe_nr = geom.stripe_nr;</div><div class='del'>-	stripe_offset = geom.stripe_offset;</div><div class='del'>-	raid56_full_stripe_start = geom.raid56_stripe_offset;</div><div class='del'>-	data_stripes = nr_data_stripes(map);</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;dev_replace-&gt;rwsem);</div><div class='del'>-	dev_replace_is_ongoing = btrfs_dev_replace_is_ongoing(dev_replace);</div><div class='del'>-	/*</div><div class='del'>-	 * Hold the semaphore for read during the whole operation, write is</div><div class='del'>-	 * requested at commit time but must wait.</div><div class='del'>-	 */</div><div class='del'>-	if (!dev_replace_is_ongoing)</div><div class='del'>-		up_read(&amp;dev_replace-&gt;rwsem);</div><div class='add'>+static void map_blocks_raid0(const struct btrfs_chunk_map *map,</div><div class='add'>+			     struct btrfs_io_geometry *io_geom)</div><div class='add'>+{</div><div class='add'>+	io_geom-&gt;stripe_index = io_geom-&gt;stripe_nr % map-&gt;num_stripes;</div><div class='add'>+	io_geom-&gt;stripe_nr /= map-&gt;num_stripes;</div><div class='add'>+	if (io_geom-&gt;op == BTRFS_MAP_READ)</div><div class='add'>+		io_geom-&gt;mirror_num = 1;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if (dev_replace_is_ongoing &amp;&amp; mirror_num == map-&gt;num_stripes + 1 &amp;&amp;</div><div class='del'>-	    !need_full_stripe(op) &amp;&amp; dev_replace-&gt;tgtdev != NULL) {</div><div class='del'>-		ret = get_extra_mirror_from_replace(fs_info, logical, *length,</div><div class='del'>-						    dev_replace-&gt;srcdev-&gt;devid,</div><div class='del'>-						    &amp;mirror_num,</div><div class='del'>-					    &amp;physical_to_patch_in_first_stripe);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto out;</div><div class='del'>-		else</div><div class='del'>-			patch_the_first_stripe_for_dev_replace = 1;</div><div class='del'>-	} else if (mirror_num &gt; map-&gt;num_stripes) {</div><div class='del'>-		mirror_num = 0;</div><div class='add'>+static void map_blocks_raid1(struct btrfs_fs_info *fs_info,</div><div class='add'>+			     struct btrfs_chunk_map *map,</div><div class='add'>+			     struct btrfs_io_geometry *io_geom,</div><div class='add'>+			     bool dev_replace_is_ongoing)</div><div class='add'>+{</div><div class='add'>+	if (io_geom-&gt;op != BTRFS_MAP_READ) {</div><div class='add'>+		io_geom-&gt;num_stripes = map-&gt;num_stripes;</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	num_stripes = 1;</div><div class='del'>-	stripe_index = 0;</div><div class='del'>-	if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID0) {</div><div class='del'>-		stripe_nr = div_u64_rem(stripe_nr, map-&gt;num_stripes,</div><div class='del'>-				&amp;stripe_index);</div><div class='del'>-		if (!need_full_stripe(op))</div><div class='del'>-			mirror_num = 1;</div><div class='del'>-	} else if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID1_MASK) {</div><div class='del'>-		if (need_full_stripe(op))</div><div class='del'>-			num_stripes = map-&gt;num_stripes;</div><div class='del'>-		else if (mirror_num)</div><div class='del'>-			stripe_index = mirror_num - 1;</div><div class='del'>-		else {</div><div class='del'>-			stripe_index = find_live_mirror(fs_info, map, 0,</div><div class='del'>-					    dev_replace_is_ongoing);</div><div class='del'>-			mirror_num = stripe_index + 1;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-	} else if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_DUP) {</div><div class='del'>-		if (need_full_stripe(op)) {</div><div class='del'>-			num_stripes = map-&gt;num_stripes;</div><div class='del'>-		} else if (mirror_num) {</div><div class='del'>-			stripe_index = mirror_num - 1;</div><div class='del'>-		} else {</div><div class='del'>-			mirror_num = 1;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-	} else if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID10) {</div><div class='del'>-		u32 factor = map-&gt;num_stripes / map-&gt;sub_stripes;</div><div class='del'>-</div><div class='del'>-		stripe_nr = div_u64_rem(stripe_nr, factor, &amp;stripe_index);</div><div class='del'>-		stripe_index *= map-&gt;sub_stripes;</div><div class='del'>-</div><div class='del'>-		if (need_full_stripe(op))</div><div class='del'>-			num_stripes = map-&gt;sub_stripes;</div><div class='del'>-		else if (mirror_num)</div><div class='del'>-			stripe_index += mirror_num - 1;</div><div class='del'>-		else {</div><div class='del'>-			int old_stripe_index = stripe_index;</div><div class='del'>-			stripe_index = find_live_mirror(fs_info, map,</div><div class='del'>-					      stripe_index,</div><div class='del'>-					      dev_replace_is_ongoing);</div><div class='del'>-			mirror_num = stripe_index - old_stripe_index + 1;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-	} else if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID56_MASK) {</div><div class='del'>-		if (need_raid_map &amp;&amp; (need_full_stripe(op) || mirror_num &gt; 1)) {</div><div class='del'>-			/* push stripe_nr back to the start of the full stripe */</div><div class='del'>-			stripe_nr = div64_u64(raid56_full_stripe_start,</div><div class='del'>-					stripe_len * data_stripes);</div><div class='del'>-</div><div class='del'>-			/* RAID[56] write or recovery. Return all stripes */</div><div class='del'>-			num_stripes = map-&gt;num_stripes;</div><div class='del'>-			max_errors = nr_parity_stripes(map);</div><div class='del'>-</div><div class='del'>-			*length = map-&gt;stripe_len;</div><div class='del'>-			stripe_index = 0;</div><div class='del'>-			stripe_offset = 0;</div><div class='del'>-		} else {</div><div class='del'>-			/*</div><div class='del'>-			 * Mirror #0 or #1 means the original data block.</div><div class='del'>-			 * Mirror #2 is RAID5 parity block.</div><div class='del'>-			 * Mirror #3 is RAID6 Q block.</div><div class='del'>-			 */</div><div class='del'>-			stripe_nr = div_u64_rem(stripe_nr,</div><div class='del'>-					data_stripes, &amp;stripe_index);</div><div class='del'>-			if (mirror_num &gt; 1)</div><div class='del'>-				stripe_index = data_stripes + mirror_num - 2;</div><div class='del'>-</div><div class='del'>-			/* We distribute the parity blocks across stripes */</div><div class='del'>-			div_u64_rem(stripe_nr + stripe_index, map-&gt;num_stripes,</div><div class='del'>-					&amp;stripe_index);</div><div class='del'>-			if (!need_full_stripe(op) &amp;&amp; mirror_num &lt;= 1)</div><div class='del'>-				mirror_num = 1;</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-		/*</div><div class='del'>-		 * after this, stripe_nr is the number of stripes on this</div><div class='del'>-		 * device we have to walk to find the data, and stripe_index is</div><div class='del'>-		 * the number of our device in the stripe array</div><div class='del'>-		 */</div><div class='del'>-		stripe_nr = div_u64_rem(stripe_nr, map-&gt;num_stripes,</div><div class='del'>-				&amp;stripe_index);</div><div class='del'>-		mirror_num = stripe_index + 1;</div><div class='del'>-	}</div><div class='del'>-	if (stripe_index &gt;= map-&gt;num_stripes) {</div><div class='del'>-		btrfs_crit(fs_info,</div><div class='del'>-			   "stripe index math went horribly wrong, got stripe_index=%u, num_stripes=%u",</div><div class='del'>-			   stripe_index, map-&gt;num_stripes);</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		goto out;</div><div class='add'>+	if (io_geom-&gt;mirror_num) {</div><div class='add'>+		io_geom-&gt;stripe_index = io_geom-&gt;mirror_num - 1;</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	num_alloc_stripes = num_stripes;</div><div class='del'>-	if (dev_replace_is_ongoing &amp;&amp; dev_replace-&gt;tgtdev != NULL) {</div><div class='del'>-		if (op == BTRFS_MAP_WRITE)</div><div class='del'>-			num_alloc_stripes &lt;&lt;= 1;</div><div class='del'>-		if (op == BTRFS_MAP_GET_READ_MIRRORS)</div><div class='del'>-			num_alloc_stripes++;</div><div class='del'>-		tgtdev_indexes = num_stripes;</div><div class='del'>-	}</div><div class='add'>+	io_geom-&gt;stripe_index = find_live_mirror(fs_info, map, 0,</div><div class='add'>+						 dev_replace_is_ongoing);</div><div class='add'>+	io_geom-&gt;mirror_num = io_geom-&gt;stripe_index + 1;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	bioc = alloc_btrfs_io_context(fs_info, num_alloc_stripes, tgtdev_indexes);</div><div class='del'>-	if (!bioc) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='add'>+static void map_blocks_dup(const struct btrfs_chunk_map *map,</div><div class='add'>+			   struct btrfs_io_geometry *io_geom)</div><div class='add'>+{</div><div class='add'>+	if (io_geom-&gt;op != BTRFS_MAP_READ) {</div><div class='add'>+		io_geom-&gt;num_stripes = map-&gt;num_stripes;</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; num_stripes; i++) {</div><div class='del'>-		bioc-&gt;stripes[i].physical = map-&gt;stripes[stripe_index].physical +</div><div class='del'>-			stripe_offset + stripe_nr * map-&gt;stripe_len;</div><div class='del'>-		bioc-&gt;stripes[i].dev = map-&gt;stripes[stripe_index].dev;</div><div class='del'>-		stripe_index++;</div><div class='add'>+	if (io_geom-&gt;mirror_num) {</div><div class='add'>+		io_geom-&gt;stripe_index = io_geom-&gt;mirror_num - 1;</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Build raid_map */</div><div class='del'>-	if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID56_MASK &amp;&amp; need_raid_map &amp;&amp;</div><div class='del'>-	    (need_full_stripe(op) || mirror_num &gt; 1)) {</div><div class='del'>-		u64 tmp;</div><div class='del'>-		unsigned rot;</div><div class='del'>-</div><div class='del'>-		/* Work out the disk rotation on this stripe-set */</div><div class='del'>-		div_u64_rem(stripe_nr, num_stripes, &amp;rot);</div><div class='add'>+	io_geom-&gt;mirror_num = 1;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		/* Fill in the logical address of each stripe */</div><div class='del'>-		tmp = stripe_nr * data_stripes;</div><div class='del'>-		for (i = 0; i &lt; data_stripes; i++)</div><div class='del'>-			bioc-&gt;raid_map[(i + rot) % num_stripes] =</div><div class='del'>-				em-&gt;start + (tmp + i) * map-&gt;stripe_len;</div><div class='add'>+static void map_blocks_raid10(struct btrfs_fs_info *fs_info,</div><div class='add'>+			      struct btrfs_chunk_map *map,</div><div class='add'>+			      struct btrfs_io_geometry *io_geom,</div><div class='add'>+			      bool dev_replace_is_ongoing)</div><div class='add'>+{</div><div class='add'>+	u32 factor = map-&gt;num_stripes / map-&gt;sub_stripes;</div><div class='add'>+	int old_stripe_index;</div><div class='ctx'> </div><div class='del'>-		bioc-&gt;raid_map[(i + rot) % map-&gt;num_stripes] = RAID5_P_STRIPE;</div><div class='del'>-		if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID6)</div><div class='del'>-			bioc-&gt;raid_map[(i + rot + 1) % num_stripes] =</div><div class='del'>-				RAID6_Q_STRIPE;</div><div class='add'>+	io_geom-&gt;stripe_index = (io_geom-&gt;stripe_nr % factor) * map-&gt;sub_stripes;</div><div class='add'>+	io_geom-&gt;stripe_nr /= factor;</div><div class='ctx'> </div><div class='del'>-		sort_parity_stripes(bioc, num_stripes);</div><div class='add'>+	if (io_geom-&gt;op != BTRFS_MAP_READ) {</div><div class='add'>+		io_geom-&gt;num_stripes = map-&gt;sub_stripes;</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (need_full_stripe(op))</div><div class='del'>-		max_errors = btrfs_chunk_max_errors(map);</div><div class='del'>-</div><div class='del'>-	if (dev_replace_is_ongoing &amp;&amp; dev_replace-&gt;tgtdev != NULL &amp;&amp;</div><div class='del'>-	    need_full_stripe(op)) {</div><div class='del'>-		handle_ops_on_dev_replace(op, &amp;bioc, dev_replace, logical,</div><div class='del'>-					  &amp;num_stripes, &amp;max_errors);</div><div class='add'>+	if (io_geom-&gt;mirror_num) {</div><div class='add'>+		io_geom-&gt;stripe_index += io_geom-&gt;mirror_num - 1;</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	*bioc_ret = bioc;</div><div class='del'>-	bioc-&gt;map_type = map-&gt;type;</div><div class='del'>-	bioc-&gt;num_stripes = num_stripes;</div><div class='del'>-	bioc-&gt;max_errors = max_errors;</div><div class='del'>-	bioc-&gt;mirror_num = mirror_num;</div><div class='add'>+	old_stripe_index = io_geom-&gt;stripe_index;</div><div class='add'>+	io_geom-&gt;stripe_index = find_live_mirror(fs_info, map,</div><div class='add'>+						 io_geom-&gt;stripe_index,</div><div class='add'>+						 dev_replace_is_ongoing);</div><div class='add'>+	io_geom-&gt;mirror_num = io_geom-&gt;stripe_index - old_stripe_index + 1;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void map_blocks_raid56_write(struct btrfs_chunk_map *map,</div><div class='add'>+				    struct btrfs_io_geometry *io_geom,</div><div class='add'>+				    u64 logical, u64 *length)</div><div class='add'>+{</div><div class='add'>+	int data_stripes = nr_data_stripes(map);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * this is the case that REQ_READ &amp;&amp; dev_replace_is_ongoing &amp;&amp;</div><div class='del'>-	 * mirror_num == num_stripes + 1 &amp;&amp; dev_replace target drive is</div><div class='del'>-	 * available as a mirror</div><div class='add'>+	 * Needs full stripe mapping.</div><div class='add'>+	 *</div><div class='add'>+	 * Push stripe_nr back to the start of the full stripe For those cases</div><div class='add'>+	 * needing a full stripe, @stripe_nr is the full stripe number.</div><div class='add'>+	 *</div><div class='add'>+	 * Originally we go raid56_full_stripe_start / full_stripe_len, but</div><div class='add'>+	 * that can be expensive.  Here we just divide @stripe_nr with</div><div class='add'>+	 * @data_stripes.</div><div class='ctx'> 	 */</div><div class='del'>-	if (patch_the_first_stripe_for_dev_replace &amp;&amp; num_stripes &gt; 0) {</div><div class='del'>-		WARN_ON(num_stripes &gt; 1);</div><div class='del'>-		bioc-&gt;stripes[0].dev = dev_replace-&gt;tgtdev;</div><div class='del'>-		bioc-&gt;stripes[0].physical = physical_to_patch_in_first_stripe;</div><div class='del'>-		bioc-&gt;mirror_num = map-&gt;num_stripes + 1;</div><div class='del'>-	}</div><div class='del'>-out:</div><div class='del'>-	if (dev_replace_is_ongoing) {</div><div class='del'>-		lockdep_assert_held(&amp;dev_replace-&gt;rwsem);</div><div class='del'>-		/* Unlock and let waiting writers proceed */</div><div class='del'>-		up_read(&amp;dev_replace-&gt;rwsem);</div><div class='del'>-	}</div><div class='del'>-	free_extent_map(em);</div><div class='del'>-	return ret;</div><div class='add'>+	io_geom-&gt;stripe_nr /= data_stripes;</div><div class='add'>+</div><div class='add'>+	/* RAID[56] write or recovery. Return all stripes */</div><div class='add'>+	io_geom-&gt;num_stripes = map-&gt;num_stripes;</div><div class='add'>+	io_geom-&gt;max_errors = btrfs_chunk_max_errors(map);</div><div class='add'>+</div><div class='add'>+	/* Return the length to the full stripe end. */</div><div class='add'>+	*length = min(logical + *length,</div><div class='add'>+		      io_geom-&gt;raid56_full_stripe_start + map-&gt;start +</div><div class='add'>+		      btrfs_stripe_nr_to_offset(data_stripes)) -</div><div class='add'>+		logical;</div><div class='add'>+	io_geom-&gt;stripe_index = 0;</div><div class='add'>+	io_geom-&gt;stripe_offset = 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_map_block(struct btrfs_fs_info *fs_info, enum btrfs_map_op op,</div><div class='del'>-		      u64 logical, u64 *length,</div><div class='del'>-		      struct btrfs_io_context **bioc_ret, int mirror_num)</div><div class='add'>+static void map_blocks_raid56_read(struct btrfs_chunk_map *map,</div><div class='add'>+				   struct btrfs_io_geometry *io_geom)</div><div class='ctx'> {</div><div class='del'>-	if (op == BTRFS_MAP_DISCARD)</div><div class='del'>-		return __btrfs_map_block_for_discard(fs_info, logical,</div><div class='del'>-						     length, bioc_ret);</div><div class='add'>+	int data_stripes = nr_data_stripes(map);</div><div class='add'>+</div><div class='add'>+	ASSERT(io_geom-&gt;mirror_num &lt;= 1, "mirror_num=%d", io_geom-&gt;mirror_num);</div><div class='add'>+	/* Just grab the data stripe directly. */</div><div class='add'>+	io_geom-&gt;stripe_index = io_geom-&gt;stripe_nr % data_stripes;</div><div class='add'>+	io_geom-&gt;stripe_nr /= data_stripes;</div><div class='add'>+</div><div class='add'>+	/* We distribute the parity blocks across stripes. */</div><div class='add'>+	io_geom-&gt;stripe_index =</div><div class='add'>+		(io_geom-&gt;stripe_nr + io_geom-&gt;stripe_index) % map-&gt;num_stripes;</div><div class='ctx'> </div><div class='del'>-	return __btrfs_map_block(fs_info, op, logical, length, bioc_ret,</div><div class='del'>-				 mirror_num, 0);</div><div class='add'>+	if (io_geom-&gt;op == BTRFS_MAP_READ &amp;&amp; io_geom-&gt;mirror_num &lt; 1)</div><div class='add'>+		io_geom-&gt;mirror_num = 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* For Scrub/replace */</div><div class='del'>-int btrfs_map_sblock(struct btrfs_fs_info *fs_info, enum btrfs_map_op op,</div><div class='del'>-		     u64 logical, u64 *length,</div><div class='del'>-		     struct btrfs_io_context **bioc_ret)</div><div class='add'>+static void map_blocks_single(const struct btrfs_chunk_map *map,</div><div class='add'>+			      struct btrfs_io_geometry *io_geom)</div><div class='ctx'> {</div><div class='del'>-	return __btrfs_map_block(fs_info, op, logical, length, bioc_ret, 0, 1);</div><div class='add'>+	io_geom-&gt;stripe_index = io_geom-&gt;stripe_nr % map-&gt;num_stripes;</div><div class='add'>+	io_geom-&gt;stripe_nr /= map-&gt;num_stripes;</div><div class='add'>+	io_geom-&gt;mirror_num = io_geom-&gt;stripe_index + 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void btrfs_end_bioc(struct btrfs_io_context *bioc, struct bio *bio)</div><div class='add'>+/*</div><div class='add'>+ * Map one logical range to one or more physical ranges.</div><div class='add'>+ *</div><div class='add'>+ * @length:		(Mandatory) mapped length of this run.</div><div class='add'>+ *			One logical range can be split into different segments</div><div class='add'>+ *			due to factors like zones and RAID0/5/6/10 stripe</div><div class='add'>+ *			boundaries.</div><div class='add'>+ *</div><div class='add'>+ * @bioc_ret:		(Mandatory) returned btrfs_io_context structure.</div><div class='add'>+ *			which has one or more physical ranges (btrfs_io_stripe)</div><div class='add'>+ *			recorded inside.</div><div class='add'>+ *			Caller should call btrfs_put_bioc() to free it after use.</div><div class='add'>+ *</div><div class='add'>+ * @smap:		(Optional) single physical range optimization.</div><div class='add'>+ *			If the map request can be fulfilled by one single</div><div class='add'>+ *			physical range, and this is parameter is not NULL,</div><div class='add'>+ *			then @bioc_ret would be NULL, and @smap would be</div><div class='add'>+ *			updated.</div><div class='add'>+ *</div><div class='add'>+ * @mirror_num_ret:	(Mandatory) returned mirror number if the original</div><div class='add'>+ *			value is 0.</div><div class='add'>+ *</div><div class='add'>+ *			Mirror number 0 means to choose any live mirrors.</div><div class='add'>+ *</div><div class='add'>+ *			For non-RAID56 profiles, non-zero mirror_num means</div><div class='add'>+ *			the Nth mirror. (e.g. mirror_num 1 means the first</div><div class='add'>+ *			copy).</div><div class='add'>+ *</div><div class='add'>+ *			For RAID56 profile, mirror 1 means rebuild from P and</div><div class='add'>+ *			the remaining data stripes.</div><div class='add'>+ *</div><div class='add'>+ *			For RAID6 profile, mirror &gt; 2 means mark another</div><div class='add'>+ *			data/P stripe error and rebuild from the remaining</div><div class='add'>+ *			stripes..</div><div class='add'>+ */</div><div class='add'>+int btrfs_map_block(struct btrfs_fs_info *fs_info, enum btrfs_map_op op,</div><div class='add'>+		    u64 logical, u64 *length,</div><div class='add'>+		    struct btrfs_io_context **bioc_ret,</div><div class='add'>+		    struct btrfs_io_stripe *smap, int *mirror_num_ret)</div><div class='ctx'> {</div><div class='del'>-	bio-&gt;bi_private = bioc-&gt;private;</div><div class='del'>-	bio-&gt;bi_end_io = bioc-&gt;end_io;</div><div class='del'>-	bio_endio(bio);</div><div class='add'>+	struct btrfs_chunk_map *map;</div><div class='add'>+	struct btrfs_io_geometry io_geom = { 0 };</div><div class='add'>+	u64 map_offset;</div><div class='add'>+	int ret = 0;</div><div class='add'>+	int num_copies;</div><div class='add'>+	struct btrfs_io_context *bioc = NULL;</div><div class='add'>+	struct btrfs_dev_replace *dev_replace = &amp;fs_info-&gt;dev_replace;</div><div class='add'>+	bool dev_replace_is_ongoing = false;</div><div class='add'>+	u16 num_alloc_stripes;</div><div class='add'>+	u64 max_len;</div><div class='ctx'> </div><div class='del'>-	btrfs_put_bioc(bioc);</div><div class='del'>-}</div><div class='add'>+	ASSERT(bioc_ret);</div><div class='ctx'> </div><div class='del'>-static void btrfs_end_bio(struct bio *bio)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_io_context *bioc = bio-&gt;bi_private;</div><div class='del'>-	int is_orig_bio = 0;</div><div class='add'>+	io_geom.mirror_num = (mirror_num_ret ? *mirror_num_ret : 0);</div><div class='add'>+	io_geom.num_stripes = 1;</div><div class='add'>+	io_geom.stripe_index = 0;</div><div class='add'>+	io_geom.op = op;</div><div class='ctx'> </div><div class='del'>-	if (bio-&gt;bi_status) {</div><div class='del'>-		atomic_inc(&amp;bioc-&gt;error);</div><div class='del'>-		if (bio-&gt;bi_status == BLK_STS_IOERR ||</div><div class='del'>-		    bio-&gt;bi_status == BLK_STS_TARGET) {</div><div class='del'>-			struct btrfs_device *dev = btrfs_bio(bio)-&gt;device;</div><div class='add'>+	map = btrfs_get_chunk_map(fs_info, logical, *length);</div><div class='add'>+	if (IS_ERR(map))</div><div class='add'>+		return PTR_ERR(map);</div><div class='ctx'> </div><div class='del'>-			ASSERT(dev-&gt;bdev);</div><div class='del'>-			if (btrfs_op(bio) == BTRFS_MAP_WRITE)</div><div class='del'>-				btrfs_dev_stat_inc_and_print(dev,</div><div class='del'>-						BTRFS_DEV_STAT_WRITE_ERRS);</div><div class='del'>-			else if (!(bio-&gt;bi_opf &amp; REQ_RAHEAD))</div><div class='del'>-				btrfs_dev_stat_inc_and_print(dev,</div><div class='del'>-						BTRFS_DEV_STAT_READ_ERRS);</div><div class='del'>-			if (bio-&gt;bi_opf &amp; REQ_PREFLUSH)</div><div class='del'>-				btrfs_dev_stat_inc_and_print(dev,</div><div class='del'>-						BTRFS_DEV_STAT_FLUSH_ERRS);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	num_copies = btrfs_chunk_map_num_copies(map);</div><div class='add'>+	if (io_geom.mirror_num &gt; num_copies)</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	if (bio == bioc-&gt;orig_bio)</div><div class='del'>-		is_orig_bio = 1;</div><div class='add'>+	map_offset = logical - map-&gt;start;</div><div class='add'>+	io_geom.raid56_full_stripe_start = (u64)-1;</div><div class='add'>+	max_len = btrfs_max_io_len(map, map_offset, &amp;io_geom);</div><div class='add'>+	*length = min_t(u64, map-&gt;chunk_len - map_offset, max_len);</div><div class='add'>+	io_geom.use_rst = btrfs_need_stripe_tree_update(fs_info, map-&gt;type);</div><div class='ctx'> </div><div class='del'>-	btrfs_bio_counter_dec(bioc-&gt;fs_info);</div><div class='add'>+	if (dev_replace-&gt;replace_task != current)</div><div class='add'>+		down_read(&amp;dev_replace-&gt;rwsem);</div><div class='ctx'> </div><div class='del'>-	if (atomic_dec_and_test(&amp;bioc-&gt;stripes_pending)) {</div><div class='del'>-		if (!is_orig_bio) {</div><div class='del'>-			bio_put(bio);</div><div class='del'>-			bio = bioc-&gt;orig_bio;</div><div class='del'>-		}</div><div class='add'>+	dev_replace_is_ongoing = btrfs_dev_replace_is_ongoing(dev_replace);</div><div class='add'>+	/*</div><div class='add'>+	 * Hold the semaphore for read during the whole operation, write is</div><div class='add'>+	 * requested at commit time but must wait.</div><div class='add'>+	 */</div><div class='add'>+	if (!dev_replace_is_ongoing &amp;&amp; dev_replace-&gt;replace_task != current)</div><div class='add'>+		up_read(&amp;dev_replace-&gt;rwsem);</div><div class='ctx'> </div><div class='del'>-		btrfs_bio(bio)-&gt;mirror_num = bioc-&gt;mirror_num;</div><div class='del'>-		/* only send an error to the higher layers if it is</div><div class='del'>-		 * beyond the tolerance of the btrfs bio</div><div class='add'>+	switch (map-&gt;type &amp; BTRFS_BLOCK_GROUP_PROFILE_MASK) {</div><div class='add'>+	case BTRFS_BLOCK_GROUP_RAID0:</div><div class='add'>+		map_blocks_raid0(map, &amp;io_geom);</div><div class='add'>+		break;</div><div class='add'>+	case BTRFS_BLOCK_GROUP_RAID1:</div><div class='add'>+	case BTRFS_BLOCK_GROUP_RAID1C3:</div><div class='add'>+	case BTRFS_BLOCK_GROUP_RAID1C4:</div><div class='add'>+		map_blocks_raid1(fs_info, map, &amp;io_geom, dev_replace_is_ongoing);</div><div class='add'>+		break;</div><div class='add'>+	case BTRFS_BLOCK_GROUP_DUP:</div><div class='add'>+		map_blocks_dup(map, &amp;io_geom);</div><div class='add'>+		break;</div><div class='add'>+	case BTRFS_BLOCK_GROUP_RAID10:</div><div class='add'>+		map_blocks_raid10(fs_info, map, &amp;io_geom, dev_replace_is_ongoing);</div><div class='add'>+		break;</div><div class='add'>+	case BTRFS_BLOCK_GROUP_RAID5:</div><div class='add'>+	case BTRFS_BLOCK_GROUP_RAID6:</div><div class='add'>+		if (op != BTRFS_MAP_READ || io_geom.mirror_num &gt; 1)</div><div class='add'>+			map_blocks_raid56_write(map, &amp;io_geom, logical, length);</div><div class='add'>+		else</div><div class='add'>+			map_blocks_raid56_read(map, &amp;io_geom);</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		/*</div><div class='add'>+		 * After this, stripe_nr is the number of stripes on this</div><div class='add'>+		 * device we have to walk to find the data, and stripe_index is</div><div class='add'>+		 * the number of our device in the stripe array</div><div class='ctx'> 		 */</div><div class='del'>-		if (atomic_read(&amp;bioc-&gt;error) &gt; bioc-&gt;max_errors) {</div><div class='del'>-			bio-&gt;bi_status = BLK_STS_IOERR;</div><div class='del'>-		} else {</div><div class='del'>-			/*</div><div class='del'>-			 * this bio is actually up to date, we didn't</div><div class='del'>-			 * go over the max number of errors</div><div class='del'>-			 */</div><div class='del'>-			bio-&gt;bi_status = BLK_STS_OK;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		btrfs_end_bioc(bioc, bio);</div><div class='del'>-	} else if (!is_orig_bio) {</div><div class='del'>-		bio_put(bio);</div><div class='add'>+		map_blocks_single(map, &amp;io_geom);</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+	if (io_geom.stripe_index &gt;= map-&gt;num_stripes) {</div><div class='add'>+		btrfs_crit(fs_info,</div><div class='add'>+			   "stripe index math went horribly wrong, got stripe_index=%u, num_stripes=%u",</div><div class='add'>+			   io_geom.stripe_index, map-&gt;num_stripes);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='del'>-}</div><div class='ctx'> </div><div class='del'>-static void submit_stripe_bio(struct btrfs_io_context *bioc, struct bio *bio,</div><div class='del'>-			      u64 physical, struct btrfs_device *dev)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = bioc-&gt;fs_info;</div><div class='add'>+	num_alloc_stripes = io_geom.num_stripes;</div><div class='add'>+	if (dev_replace_is_ongoing &amp;&amp; dev_replace-&gt;tgtdev != NULL &amp;&amp;</div><div class='add'>+	    op != BTRFS_MAP_READ)</div><div class='add'>+		/*</div><div class='add'>+		 * For replace case, we need to add extra stripes for extra</div><div class='add'>+		 * duplicated stripes.</div><div class='add'>+		 *</div><div class='add'>+		 * For both WRITE and GET_READ_MIRRORS, we may have at most</div><div class='add'>+		 * 2 more stripes (DUP types, otherwise 1).</div><div class='add'>+		 */</div><div class='add'>+		num_alloc_stripes += 2;</div><div class='ctx'> </div><div class='del'>-	bio-&gt;bi_private = bioc;</div><div class='del'>-	btrfs_bio(bio)-&gt;device = dev;</div><div class='del'>-	bio-&gt;bi_end_io = btrfs_end_bio;</div><div class='del'>-	bio-&gt;bi_iter.bi_sector = physical &gt;&gt; 9;</div><div class='ctx'> 	/*</div><div class='del'>-	 * For zone append writing, bi_sector must point the beginning of the</div><div class='del'>-	 * zone</div><div class='add'>+	 * If this I/O maps to a single device, try to return the device and</div><div class='add'>+	 * physical block information on the stack instead of allocating an</div><div class='add'>+	 * I/O context structure.</div><div class='ctx'> 	 */</div><div class='del'>-	if (bio_op(bio) == REQ_OP_ZONE_APPEND) {</div><div class='del'>-		if (btrfs_dev_is_sequential(dev, physical)) {</div><div class='del'>-			u64 zone_start = round_down(physical, fs_info-&gt;zone_size);</div><div class='del'>-</div><div class='del'>-			bio-&gt;bi_iter.bi_sector = zone_start &gt;&gt; SECTOR_SHIFT;</div><div class='del'>-		} else {</div><div class='del'>-			bio-&gt;bi_opf &amp;= ~REQ_OP_ZONE_APPEND;</div><div class='del'>-			bio-&gt;bi_opf |= REQ_OP_WRITE;</div><div class='del'>-		}</div><div class='add'>+	if (is_single_device_io(fs_info, smap, map, num_alloc_stripes, &amp;io_geom)) {</div><div class='add'>+		ret = set_io_stripe(fs_info, logical, length, smap, map, &amp;io_geom);</div><div class='add'>+		if (mirror_num_ret)</div><div class='add'>+			*mirror_num_ret = io_geom.mirror_num;</div><div class='add'>+		*bioc_ret = NULL;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_debug_in_rcu(fs_info,</div><div class='del'>-	"btrfs_map_bio: rw %d 0x%x, sector=%llu, dev=%lu (%s id %llu), size=%u",</div><div class='del'>-		bio_op(bio), bio-&gt;bi_opf, bio-&gt;bi_iter.bi_sector,</div><div class='del'>-		(unsigned long)dev-&gt;bdev-&gt;bd_dev, rcu_str_deref(dev-&gt;name),</div><div class='del'>-		dev-&gt;devid, bio-&gt;bi_iter.bi_size);</div><div class='del'>-	bio_set_dev(bio, dev-&gt;bdev);</div><div class='del'>-</div><div class='del'>-	btrfs_bio_counter_inc_noblocked(fs_info);</div><div class='del'>-</div><div class='del'>-	btrfsic_submit_bio(bio);</div><div class='del'>-}</div><div class='ctx'> </div><div class='del'>-static void bioc_error(struct btrfs_io_context *bioc, struct bio *bio, u64 logical)</div><div class='del'>-{</div><div class='del'>-	atomic_inc(&amp;bioc-&gt;error);</div><div class='del'>-	if (atomic_dec_and_test(&amp;bioc-&gt;stripes_pending)) {</div><div class='del'>-		/* Should be the original bio. */</div><div class='del'>-		WARN_ON(bio != bioc-&gt;orig_bio);</div><div class='del'>-</div><div class='del'>-		btrfs_bio(bio)-&gt;mirror_num = bioc-&gt;mirror_num;</div><div class='del'>-		bio-&gt;bi_iter.bi_sector = logical &gt;&gt; 9;</div><div class='del'>-		if (atomic_read(&amp;bioc-&gt;error) &gt; bioc-&gt;max_errors)</div><div class='del'>-			bio-&gt;bi_status = BLK_STS_IOERR;</div><div class='del'>-		else</div><div class='del'>-			bio-&gt;bi_status = BLK_STS_OK;</div><div class='del'>-		btrfs_end_bioc(bioc, bio);</div><div class='add'>+	bioc = alloc_btrfs_io_context(fs_info, logical, num_alloc_stripes);</div><div class='add'>+	if (!bioc) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-blk_status_t btrfs_map_bio(struct btrfs_fs_info *fs_info, struct bio *bio,</div><div class='del'>-			   int mirror_num)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_device *dev;</div><div class='del'>-	struct bio *first_bio = bio;</div><div class='del'>-	u64 logical = bio-&gt;bi_iter.bi_sector &lt;&lt; 9;</div><div class='del'>-	u64 length = 0;</div><div class='del'>-	u64 map_length;</div><div class='del'>-	int ret;</div><div class='del'>-	int dev_nr;</div><div class='del'>-	int total_devs;</div><div class='del'>-	struct btrfs_io_context *bioc = NULL;</div><div class='del'>-</div><div class='del'>-	length = bio-&gt;bi_iter.bi_size;</div><div class='del'>-	map_length = length;</div><div class='add'>+	bioc-&gt;map_type = map-&gt;type;</div><div class='add'>+	bioc-&gt;use_rst = io_geom.use_rst;</div><div class='ctx'> </div><div class='del'>-	btrfs_bio_counter_inc_blocked(fs_info);</div><div class='del'>-	ret = __btrfs_map_block(fs_info, btrfs_op(bio), logical,</div><div class='del'>-				&amp;map_length, &amp;bioc, mirror_num, 1);</div><div class='del'>-	if (ret) {</div><div class='del'>-		btrfs_bio_counter_dec(fs_info);</div><div class='del'>-		return errno_to_blk_status(ret);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	total_devs = bioc-&gt;num_stripes;</div><div class='del'>-	bioc-&gt;orig_bio = first_bio;</div><div class='del'>-	bioc-&gt;private = first_bio-&gt;bi_private;</div><div class='del'>-	bioc-&gt;end_io = first_bio-&gt;bi_end_io;</div><div class='del'>-	atomic_set(&amp;bioc-&gt;stripes_pending, bioc-&gt;num_stripes);</div><div class='del'>-</div><div class='del'>-	if ((bioc-&gt;map_type &amp; BTRFS_BLOCK_GROUP_RAID56_MASK) &amp;&amp;</div><div class='del'>-	    ((btrfs_op(bio) == BTRFS_MAP_WRITE) || (mirror_num &gt; 1))) {</div><div class='del'>-		/* In this case, map_length has been set to the length of</div><div class='del'>-		   a single stripe; not the whole write */</div><div class='del'>-		if (btrfs_op(bio) == BTRFS_MAP_WRITE) {</div><div class='del'>-			ret = raid56_parity_write(bio, bioc, map_length);</div><div class='del'>-		} else {</div><div class='del'>-			ret = raid56_parity_recover(bio, bioc, map_length,</div><div class='del'>-						    mirror_num, 1);</div><div class='add'>+	/*</div><div class='add'>+	 * For RAID56 full map, we need to make sure the stripes[] follows the</div><div class='add'>+	 * rule that data stripes are all ordered, then followed with P and Q</div><div class='add'>+	 * (if we have).</div><div class='add'>+	 *</div><div class='add'>+	 * It's still mostly the same as other profiles, just with extra rotation.</div><div class='add'>+	 */</div><div class='add'>+	if (map-&gt;type &amp; BTRFS_BLOCK_GROUP_RAID56_MASK &amp;&amp;</div><div class='add'>+	    (op != BTRFS_MAP_READ || io_geom.mirror_num &gt; 1)) {</div><div class='add'>+		/*</div><div class='add'>+		 * For RAID56 @stripe_nr is already the number of full stripes</div><div class='add'>+		 * before us, which is also the rotation value (needs to modulo</div><div class='add'>+		 * with num_stripes).</div><div class='add'>+		 *</div><div class='add'>+		 * In this case, we just add @stripe_nr with @i, then do the</div><div class='add'>+		 * modulo, to reduce one modulo call.</div><div class='add'>+		 */</div><div class='add'>+		bioc-&gt;full_stripe_logical = map-&gt;start +</div><div class='add'>+			btrfs_stripe_nr_to_offset(io_geom.stripe_nr *</div><div class='add'>+						  nr_data_stripes(map));</div><div class='add'>+		for (int i = 0; i &lt; io_geom.num_stripes; i++) {</div><div class='add'>+			struct btrfs_io_stripe *dst = &amp;bioc-&gt;stripes[i];</div><div class='add'>+			u32 stripe_index;</div><div class='add'>+</div><div class='add'>+			stripe_index = (i + io_geom.stripe_nr) % io_geom.num_stripes;</div><div class='add'>+			dst-&gt;dev = map-&gt;stripes[stripe_index].dev;</div><div class='add'>+			dst-&gt;physical =</div><div class='add'>+				map-&gt;stripes[stripe_index].physical +</div><div class='add'>+				io_geom.stripe_offset +</div><div class='add'>+				btrfs_stripe_nr_to_offset(io_geom.stripe_nr);</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		/*</div><div class='add'>+		 * For all other non-RAID56 profiles, just copy the target</div><div class='add'>+		 * stripe into the bioc.</div><div class='add'>+		 */</div><div class='add'>+		for (int i = 0; i &lt; io_geom.num_stripes; i++) {</div><div class='add'>+			ret = set_io_stripe(fs_info, logical, length,</div><div class='add'>+					    &amp;bioc-&gt;stripes[i], map, &amp;io_geom);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				break;</div><div class='add'>+			io_geom.stripe_index++;</div><div class='ctx'> 		}</div><div class='del'>-</div><div class='del'>-		btrfs_bio_counter_dec(fs_info);</div><div class='del'>-		return errno_to_blk_status(ret);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (map_length &lt; length) {</div><div class='del'>-		btrfs_crit(fs_info,</div><div class='del'>-			   "mapping failed logical %llu bio len %llu len %llu",</div><div class='del'>-			   logical, length, map_length);</div><div class='del'>-		BUG();</div><div class='add'>+	if (ret) {</div><div class='add'>+		*bioc_ret = NULL;</div><div class='add'>+		btrfs_put_bioc(bioc);</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	for (dev_nr = 0; dev_nr &lt; total_devs; dev_nr++) {</div><div class='del'>-		dev = bioc-&gt;stripes[dev_nr].dev;</div><div class='del'>-		if (!dev || !dev-&gt;bdev || test_bit(BTRFS_DEV_STATE_MISSING,</div><div class='del'>-						   &amp;dev-&gt;dev_state) ||</div><div class='del'>-		    (btrfs_op(first_bio) == BTRFS_MAP_WRITE &amp;&amp;</div><div class='del'>-		    !test_bit(BTRFS_DEV_STATE_WRITEABLE, &amp;dev-&gt;dev_state))) {</div><div class='del'>-			bioc_error(bioc, first_bio, logical);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='add'>+	if (op != BTRFS_MAP_READ)</div><div class='add'>+		io_geom.max_errors = btrfs_chunk_max_errors(map);</div><div class='ctx'> </div><div class='del'>-		if (dev_nr &lt; total_devs - 1)</div><div class='del'>-			bio = btrfs_bio_clone(first_bio);</div><div class='del'>-		else</div><div class='del'>-			bio = first_bio;</div><div class='add'>+	if (dev_replace_is_ongoing &amp;&amp; dev_replace-&gt;tgtdev != NULL &amp;&amp;</div><div class='add'>+	    op != BTRFS_MAP_READ) {</div><div class='add'>+		handle_ops_on_dev_replace(bioc, dev_replace, logical, &amp;io_geom);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		submit_stripe_bio(bioc, bio, bioc-&gt;stripes[dev_nr].physical, dev);</div><div class='add'>+	*bioc_ret = bioc;</div><div class='add'>+	bioc-&gt;num_stripes = io_geom.num_stripes;</div><div class='add'>+	bioc-&gt;max_errors = io_geom.max_errors;</div><div class='add'>+	bioc-&gt;mirror_num = io_geom.mirror_num;</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	if (dev_replace_is_ongoing &amp;&amp; dev_replace-&gt;replace_task != current) {</div><div class='add'>+		lockdep_assert_held(&amp;dev_replace-&gt;rwsem);</div><div class='add'>+		/* Unlock and let waiting writers proceed */</div><div class='add'>+		up_read(&amp;dev_replace-&gt;rwsem);</div><div class='ctx'> 	}</div><div class='del'>-	btrfs_bio_counter_dec(fs_info);</div><div class='del'>-	return BLK_STS_OK;</div><div class='add'>+	btrfs_free_chunk_map(map);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool dev_args_match_fs_devices(const struct btrfs_dev_lookup_args *args,</div><div class='hunk'>@@ -6820,18 +6755,20 @@ static bool dev_args_match_fs_devices(const struct btrfs_dev_lookup_args *args,</div><div class='ctx'> static bool dev_args_match_device(const struct btrfs_dev_lookup_args *args,</div><div class='ctx'> 				  const struct btrfs_device *device)</div><div class='ctx'> {</div><div class='del'>-	ASSERT((args-&gt;devid != (u64)-1) || args-&gt;missing);</div><div class='add'>+	if (args-&gt;devt)</div><div class='add'>+		return device-&gt;devt == args-&gt;devt;</div><div class='add'>+	if (args-&gt;missing) {</div><div class='add'>+		if (test_bit(BTRFS_DEV_STATE_IN_FS_METADATA, &amp;device-&gt;dev_state) &amp;&amp;</div><div class='add'>+		    !device-&gt;bdev)</div><div class='add'>+			return true;</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if ((args-&gt;devid != (u64)-1) &amp;&amp; device-&gt;devid != args-&gt;devid)</div><div class='add'>+	if (device-&gt;devid != args-&gt;devid)</div><div class='ctx'> 		return false;</div><div class='ctx'> 	if (args-&gt;uuid &amp;&amp; memcmp(device-&gt;uuid, args-&gt;uuid, BTRFS_UUID_SIZE) != 0)</div><div class='ctx'> 		return false;</div><div class='del'>-	if (!args-&gt;missing)</div><div class='del'>-		return true;</div><div class='del'>-	if (test_bit(BTRFS_DEV_STATE_IN_FS_METADATA, &amp;device-&gt;dev_state) &amp;&amp;</div><div class='del'>-	    !device-&gt;bdev)</div><div class='del'>-		return true;</div><div class='del'>-	return false;</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -6878,8 +6815,9 @@ static struct btrfs_device *add_missing_dev(struct btrfs_fs_devices *fs_devices,</div><div class='ctx'> 	 * always do NOFS because we use it in a lot of other GFP_KERNEL safe</div><div class='ctx'> 	 * places.</div><div class='ctx'> 	 */</div><div class='add'>+</div><div class='ctx'> 	nofs_flag = memalloc_nofs_save();</div><div class='del'>-	device = btrfs_alloc_device(NULL, &amp;devid, dev_uuid);</div><div class='add'>+	device = btrfs_alloc_device(NULL, &amp;devid, dev_uuid, NULL);</div><div class='ctx'> 	memalloc_nofs_restore(nofs_flag);</div><div class='ctx'> 	if (IS_ERR(device))</div><div class='ctx'> 		return device;</div><div class='hunk'>@@ -6894,22 +6832,24 @@ static struct btrfs_device *add_missing_dev(struct btrfs_fs_devices *fs_devices,</div><div class='ctx'> 	return device;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * btrfs_alloc_device - allocate struct btrfs_device</div><div class='add'>+/*</div><div class='add'>+ * Allocate new device struct, set up devid and UUID.</div><div class='add'>+ *</div><div class='ctx'>  * @fs_info:	used only for generating a new devid, can be NULL if</div><div class='ctx'>  *		devid is provided (i.e. @devid != NULL).</div><div class='ctx'>  * @devid:	a pointer to devid for this device.  If NULL a new devid</div><div class='ctx'>  *		is generated.</div><div class='ctx'>  * @uuid:	a pointer to UUID for this device.  If NULL a new UUID</div><div class='ctx'>  *		is generated.</div><div class='add'>+ * @path:	a pointer to device path if available, NULL otherwise.</div><div class='ctx'>  *</div><div class='ctx'>  * Return: a pointer to a new &amp;struct btrfs_device on success; ERR_PTR()</div><div class='ctx'>  * on error.  Returned struct is not linked onto any lists and must be</div><div class='ctx'>  * destroyed with btrfs_free_device.</div><div class='ctx'>  */</div><div class='ctx'> struct btrfs_device *btrfs_alloc_device(struct btrfs_fs_info *fs_info,</div><div class='del'>-					const u64 *devid,</div><div class='del'>-					const u8 *uuid)</div><div class='add'>+					const u64 *devid, const u8 *uuid,</div><div class='add'>+					const char *path)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_device *dev;</div><div class='ctx'> 	u64 tmp;</div><div class='hunk'>@@ -6921,27 +6861,13 @@ struct btrfs_device *btrfs_alloc_device(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	if (!dev)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Preallocate a bio that's always going to be used for flushing device</div><div class='del'>-	 * barriers and matches the device lifespan</div><div class='del'>-	 */</div><div class='del'>-	dev-&gt;flush_bio = bio_kmalloc(GFP_KERNEL, 0);</div><div class='del'>-	if (!dev-&gt;flush_bio) {</div><div class='del'>-		kfree(dev);</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;dev-&gt;dev_list);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;dev-&gt;dev_alloc_list);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;dev-&gt;post_commit_list);</div><div class='ctx'> </div><div class='del'>-	atomic_set(&amp;dev-&gt;reada_in_flight, 0);</div><div class='ctx'> 	atomic_set(&amp;dev-&gt;dev_stats_ccnt, 0);</div><div class='ctx'> 	btrfs_device_data_ordered_init(dev);</div><div class='del'>-	INIT_RADIX_TREE(&amp;dev-&gt;reada_zones, GFP_NOFS &amp; ~__GFP_DIRECT_RECLAIM);</div><div class='del'>-	INIT_RADIX_TREE(&amp;dev-&gt;reada_extents, GFP_NOFS &amp; ~__GFP_DIRECT_RECLAIM);</div><div class='del'>-	extent_io_tree_init(fs_info, &amp;dev-&gt;alloc_state,</div><div class='del'>-			    IO_TREE_DEVICE_ALLOC_STATE, NULL);</div><div class='add'>+	btrfs_extent_io_tree_init(fs_info, &amp;dev-&gt;alloc_state, IO_TREE_DEVICE_ALLOC_STATE);</div><div class='ctx'> </div><div class='ctx'> 	if (devid)</div><div class='ctx'> 		tmp = *devid;</div><div class='hunk'>@@ -6961,6 +6887,17 @@ struct btrfs_device *btrfs_alloc_device(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	else</div><div class='ctx'> 		generate_random_uuid(dev-&gt;uuid);</div><div class='ctx'> </div><div class='add'>+	if (path) {</div><div class='add'>+		const char *name;</div><div class='add'>+</div><div class='add'>+		name = kstrdup(path, GFP_KERNEL);</div><div class='add'>+		if (!name) {</div><div class='add'>+			btrfs_free_device(dev);</div><div class='add'>+			return ERR_PTR(-ENOMEM);</div><div class='add'>+		}</div><div class='add'>+		rcu_assign_pointer(dev-&gt;name, name);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	return dev;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -6975,11 +6912,11 @@ static void btrfs_report_missing_device(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			      devid, uuid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static u64 calc_stripe_length(u64 type, u64 chunk_len, int num_stripes)</div><div class='add'>+u64 btrfs_calc_stripe_length(const struct btrfs_chunk_map *map)</div><div class='ctx'> {</div><div class='del'>-	const int data_stripes = calc_data_stripes(type, num_stripes);</div><div class='add'>+	const int data_stripes = calc_data_stripes(map-&gt;type, map-&gt;num_stripes);</div><div class='ctx'> </div><div class='del'>-	return div_u64(chunk_len, data_stripes);</div><div class='add'>+	return div_u64(map-&gt;chunk_len, data_stripes);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #if BITS_PER_LONG == 32</div><div class='hunk'>@@ -7022,19 +6959,39 @@ static void warn_32bit_meta_chunk(struct btrfs_fs_info *fs_info,</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='add'>+static struct btrfs_device *handle_missing_device(struct btrfs_fs_info *fs_info,</div><div class='add'>+						  u64 devid, u8 *uuid)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_device *dev;</div><div class='add'>+</div><div class='add'>+	if (!btrfs_test_opt(fs_info, DEGRADED)) {</div><div class='add'>+		btrfs_report_missing_device(fs_info, devid, uuid, true);</div><div class='add'>+		return ERR_PTR(-ENOENT);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	dev = add_missing_dev(fs_info-&gt;fs_devices, devid, uuid);</div><div class='add'>+	if (IS_ERR(dev)) {</div><div class='add'>+		btrfs_err(fs_info, "failed to init missing device %llu: %ld",</div><div class='add'>+			  devid, PTR_ERR(dev));</div><div class='add'>+		return dev;</div><div class='add'>+	}</div><div class='add'>+	btrfs_report_missing_device(fs_info, devid, uuid, false);</div><div class='add'>+</div><div class='add'>+	return dev;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int read_one_chunk(struct btrfs_key *key, struct extent_buffer *leaf,</div><div class='ctx'> 			  struct btrfs_chunk *chunk)</div><div class='ctx'> {</div><div class='ctx'> 	BTRFS_DEV_LOOKUP_ARGS(args);</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = leaf-&gt;fs_info;</div><div class='del'>-	struct extent_map_tree *map_tree = &amp;fs_info-&gt;mapping_tree;</div><div class='del'>-	struct map_lookup *map;</div><div class='del'>-	struct extent_map *em;</div><div class='add'>+	struct btrfs_chunk_map *map;</div><div class='ctx'> 	u64 logical;</div><div class='ctx'> 	u64 length;</div><div class='ctx'> 	u64 devid;</div><div class='ctx'> 	u64 type;</div><div class='ctx'> 	u8 uuid[BTRFS_UUID_SIZE];</div><div class='add'>+	int index;</div><div class='ctx'> 	int num_stripes;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int i;</div><div class='hunk'>@@ -7042,6 +6999,7 @@ static int read_one_chunk(struct btrfs_key *key, struct extent_buffer *leaf,</div><div class='ctx'> 	logical = key-&gt;offset;</div><div class='ctx'> 	length = btrfs_chunk_length(leaf, chunk);</div><div class='ctx'> 	type = btrfs_chunk_type(leaf, chunk);</div><div class='add'>+	index = btrfs_bg_flags_to_raid_index(type);</div><div class='ctx'> 	num_stripes = btrfs_chunk_num_stripes(leaf, chunk);</div><div class='ctx'> </div><div class='ctx'> #if BITS_PER_LONG == 32</div><div class='hunk'>@@ -7051,54 +7009,37 @@ static int read_one_chunk(struct btrfs_key *key, struct extent_buffer *leaf,</div><div class='ctx'> 	warn_32bit_meta_chunk(fs_info, logical, length, type);</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Only need to verify chunk item if we're reading from sys chunk array,</div><div class='del'>-	 * as chunk item in tree block is already verified by tree-checker.</div><div class='del'>-	 */</div><div class='del'>-	if (leaf-&gt;start == BTRFS_SUPER_INFO_OFFSET) {</div><div class='del'>-		ret = btrfs_check_chunk_valid(leaf, chunk, logical);</div><div class='del'>-		if (ret)</div><div class='del'>-			return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	read_lock(&amp;map_tree-&gt;lock);</div><div class='del'>-	em = lookup_extent_mapping(map_tree, logical, 1);</div><div class='del'>-	read_unlock(&amp;map_tree-&gt;lock);</div><div class='add'>+	map = btrfs_find_chunk_map(fs_info, logical, 1);</div><div class='ctx'> </div><div class='ctx'> 	/* already mapped? */</div><div class='del'>-	if (em &amp;&amp; em-&gt;start &lt;= logical &amp;&amp; em-&gt;start + em-&gt;len &gt; logical) {</div><div class='del'>-		free_extent_map(em);</div><div class='add'>+	if (map &amp;&amp; map-&gt;start &lt;= logical &amp;&amp; map-&gt;start + map-&gt;chunk_len &gt; logical) {</div><div class='add'>+		btrfs_free_chunk_map(map);</div><div class='ctx'> 		return 0;</div><div class='del'>-	} else if (em) {</div><div class='del'>-		free_extent_map(em);</div><div class='add'>+	} else if (map) {</div><div class='add'>+		btrfs_free_chunk_map(map);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	em = alloc_extent_map();</div><div class='del'>-	if (!em)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	map = kmalloc(map_lookup_size(num_stripes), GFP_NOFS);</div><div class='del'>-	if (!map) {</div><div class='del'>-		free_extent_map(em);</div><div class='add'>+	map = btrfs_alloc_chunk_map(num_stripes, GFP_NOFS);</div><div class='add'>+	if (!map)</div><div class='ctx'> 		return -ENOMEM;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	set_bit(EXTENT_FLAG_FS_MAPPING, &amp;em-&gt;flags);</div><div class='del'>-	em-&gt;map_lookup = map;</div><div class='del'>-	em-&gt;start = logical;</div><div class='del'>-	em-&gt;len = length;</div><div class='del'>-	em-&gt;orig_start = 0;</div><div class='del'>-	em-&gt;block_start = 0;</div><div class='del'>-	em-&gt;block_len = em-&gt;len;</div><div class='ctx'> </div><div class='add'>+	map-&gt;start = logical;</div><div class='add'>+	map-&gt;chunk_len = length;</div><div class='ctx'> 	map-&gt;num_stripes = num_stripes;</div><div class='ctx'> 	map-&gt;io_width = btrfs_chunk_io_width(leaf, chunk);</div><div class='ctx'> 	map-&gt;io_align = btrfs_chunk_io_align(leaf, chunk);</div><div class='del'>-	map-&gt;stripe_len = btrfs_chunk_stripe_len(leaf, chunk);</div><div class='ctx'> 	map-&gt;type = type;</div><div class='del'>-	map-&gt;sub_stripes = btrfs_chunk_sub_stripes(leaf, chunk);</div><div class='add'>+	/*</div><div class='add'>+	 * We can't use the sub_stripes value, as for profiles other than</div><div class='add'>+	 * RAID10, they may have 0 as sub_stripes for filesystems created by</div><div class='add'>+	 * older mkfs (&lt;v5.4).</div><div class='add'>+	 * In that case, it can cause divide-by-zero errors later.</div><div class='add'>+	 * Since currently sub_stripes is fixed for each profile, let's</div><div class='add'>+	 * use the trusted value instead.</div><div class='add'>+	 */</div><div class='add'>+	map-&gt;sub_stripes = btrfs_raid_array[index].sub_stripes;</div><div class='ctx'> 	map-&gt;verified_stripes = 0;</div><div class='del'>-	em-&gt;orig_block_len = calc_stripe_length(type, em-&gt;len,</div><div class='del'>-						map-&gt;num_stripes);</div><div class='add'>+	map-&gt;stripe_size = btrfs_calc_stripe_length(map);</div><div class='ctx'> 	for (i = 0; i &lt; num_stripes; i++) {</div><div class='ctx'> 		map-&gt;stripes[i].physical =</div><div class='ctx'> 			btrfs_stripe_offset_nr(leaf, chunk, i);</div><div class='hunk'>@@ -7109,39 +7050,27 @@ static int read_one_chunk(struct btrfs_key *key, struct extent_buffer *leaf,</div><div class='ctx'> 				   BTRFS_UUID_SIZE);</div><div class='ctx'> 		args.uuid = uuid;</div><div class='ctx'> 		map-&gt;stripes[i].dev = btrfs_find_device(fs_info-&gt;fs_devices, &amp;args);</div><div class='del'>-		if (!map-&gt;stripes[i].dev &amp;&amp;</div><div class='del'>-		    !btrfs_test_opt(fs_info, DEGRADED)) {</div><div class='del'>-			free_extent_map(em);</div><div class='del'>-			btrfs_report_missing_device(fs_info, devid, uuid, true);</div><div class='del'>-			return -ENOENT;</div><div class='del'>-		}</div><div class='ctx'> 		if (!map-&gt;stripes[i].dev) {</div><div class='del'>-			map-&gt;stripes[i].dev =</div><div class='del'>-				add_missing_dev(fs_info-&gt;fs_devices, devid,</div><div class='del'>-						uuid);</div><div class='add'>+			map-&gt;stripes[i].dev = handle_missing_device(fs_info,</div><div class='add'>+								    devid, uuid);</div><div class='ctx'> 			if (IS_ERR(map-&gt;stripes[i].dev)) {</div><div class='del'>-				free_extent_map(em);</div><div class='del'>-				btrfs_err(fs_info,</div><div class='del'>-					"failed to init missing dev %llu: %ld",</div><div class='del'>-					devid, PTR_ERR(map-&gt;stripes[i].dev));</div><div class='del'>-				return PTR_ERR(map-&gt;stripes[i].dev);</div><div class='add'>+				ret = PTR_ERR(map-&gt;stripes[i].dev);</div><div class='add'>+				btrfs_free_chunk_map(map);</div><div class='add'>+				return ret;</div><div class='ctx'> 			}</div><div class='del'>-			btrfs_report_missing_device(fs_info, devid, uuid, false);</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='ctx'> 		set_bit(BTRFS_DEV_STATE_IN_FS_METADATA,</div><div class='ctx'> 				&amp;(map-&gt;stripes[i].dev-&gt;dev_state));</div><div class='del'>-</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	write_lock(&amp;map_tree-&gt;lock);</div><div class='del'>-	ret = add_extent_mapping(map_tree, em, 0);</div><div class='del'>-	write_unlock(&amp;map_tree-&gt;lock);</div><div class='add'>+	ret = btrfs_add_chunk_map(fs_info, map);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='ctx'> 			  "failed to add chunk map, start=%llu len=%llu: %d",</div><div class='del'>-			  em-&gt;start, em-&gt;len, ret);</div><div class='add'>+			  map-&gt;start, map-&gt;chunk_len, ret);</div><div class='add'>+		btrfs_free_chunk_map(map);</div><div class='ctx'> 	}</div><div class='del'>-	free_extent_map(em);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -7186,10 +7115,14 @@ static struct btrfs_fs_devices *open_seed_devices(struct btrfs_fs_info *fs_info,</div><div class='ctx'> </div><div class='ctx'> 	fs_devices = find_fsid(fsid, NULL);</div><div class='ctx'> 	if (!fs_devices) {</div><div class='del'>-		if (!btrfs_test_opt(fs_info, DEGRADED))</div><div class='add'>+		if (!btrfs_test_opt(fs_info, DEGRADED)) {</div><div class='add'>+			btrfs_err(fs_info,</div><div class='add'>+		"failed to find fsid %pU when attempting to open seed devices",</div><div class='add'>+				  fsid);</div><div class='ctx'> 			return ERR_PTR(-ENOENT);</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-		fs_devices = alloc_fs_devices(fsid, NULL);</div><div class='add'>+		fs_devices = alloc_fs_devices(fsid);</div><div class='ctx'> 		if (IS_ERR(fs_devices))</div><div class='ctx'> 			return fs_devices;</div><div class='ctx'> </div><div class='hunk'>@@ -7206,7 +7139,7 @@ static struct btrfs_fs_devices *open_seed_devices(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	if (IS_ERR(fs_devices))</div><div class='ctx'> 		return fs_devices;</div><div class='ctx'> </div><div class='del'>-	ret = open_fs_devices(fs_devices, FMODE_READ, fs_info-&gt;bdev_holder);</div><div class='add'>+	ret = open_fs_devices(fs_devices, BLK_OPEN_READ, fs_info-&gt;sb);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		free_fs_devices(fs_devices);</div><div class='ctx'> 		return ERR_PTR(ret);</div><div class='hunk'>@@ -7235,7 +7168,8 @@ static int read_one_dev(struct extent_buffer *leaf,</div><div class='ctx'> 	u8 fs_uuid[BTRFS_FSID_SIZE];</div><div class='ctx'> 	u8 dev_uuid[BTRFS_UUID_SIZE];</div><div class='ctx'> </div><div class='del'>-	devid = args.devid = btrfs_device_id(leaf, dev_item);</div><div class='add'>+	devid = btrfs_device_id(leaf, dev_item);</div><div class='add'>+	args.devid = devid;</div><div class='ctx'> 	read_extent_buffer(leaf, dev_uuid, btrfs_device_uuid(dev_item),</div><div class='ctx'> 			   BTRFS_UUID_SIZE);</div><div class='ctx'> 	read_extent_buffer(leaf, fs_uuid, btrfs_device_fsid(dev_item),</div><div class='hunk'>@@ -7335,46 +7269,26 @@ static int read_one_dev(struct extent_buffer *leaf,</div><div class='ctx'> </div><div class='ctx'> int btrfs_read_sys_array(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_root *root = fs_info-&gt;tree_root;</div><div class='ctx'> 	struct btrfs_super_block *super_copy = fs_info-&gt;super_copy;</div><div class='ctx'> 	struct extent_buffer *sb;</div><div class='del'>-	struct btrfs_disk_key *disk_key;</div><div class='del'>-	struct btrfs_chunk *chunk;</div><div class='ctx'> 	u8 *array_ptr;</div><div class='ctx'> 	unsigned long sb_array_offset;</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	u32 num_stripes;</div><div class='ctx'> 	u32 array_size;</div><div class='del'>-	u32 len = 0;</div><div class='ctx'> 	u32 cur_offset;</div><div class='del'>-	u64 type;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> </div><div class='ctx'> 	ASSERT(BTRFS_SUPER_INFO_SIZE &lt;= fs_info-&gt;nodesize);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='del'>-	 * This will create extent buffer of nodesize, superblock size is</div><div class='del'>-	 * fixed to BTRFS_SUPER_INFO_SIZE. If nodesize &gt; sb size, this will</div><div class='del'>-	 * overallocate but we can keep it as-is, only the first page is used.</div><div class='add'>+	 * We allocated a dummy extent, just to use extent buffer accessors.</div><div class='add'>+	 * There will be unused space after BTRFS_SUPER_INFO_SIZE, but</div><div class='add'>+	 * that's fine, we will not go beyond system chunk array anyway.</div><div class='ctx'> 	 */</div><div class='del'>-	sb = btrfs_find_create_tree_block(fs_info, BTRFS_SUPER_INFO_OFFSET,</div><div class='del'>-					  root-&gt;root_key.objectid, 0);</div><div class='del'>-	if (IS_ERR(sb))</div><div class='del'>-		return PTR_ERR(sb);</div><div class='add'>+	sb = alloc_dummy_extent_buffer(fs_info, BTRFS_SUPER_INFO_OFFSET);</div><div class='add'>+	if (!sb)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> 	set_extent_buffer_uptodate(sb);</div><div class='del'>-	/*</div><div class='del'>-	 * The sb extent buffer is artificial and just used to read the system array.</div><div class='del'>-	 * set_extent_buffer_uptodate() call does not properly mark all it's</div><div class='del'>-	 * pages up-to-date when the page is larger: extent does not cover the</div><div class='del'>-	 * whole page and consequently check_page_uptodate does not find all</div><div class='del'>-	 * the page's extents up-to-date (the hole beyond sb),</div><div class='del'>-	 * write_extent_buffer then triggers a WARN_ON.</div><div class='del'>-	 *</div><div class='del'>-	 * Regular short extents go through mark_extent_buffer_dirty/writeback cycle,</div><div class='del'>-	 * but sb spans only this function. Add an explicit SetPageUptodate call</div><div class='del'>-	 * to silence the warning eg. on PowerPC 64.</div><div class='del'>-	 */</div><div class='del'>-	if (PAGE_SIZE &gt; BTRFS_SUPER_INFO_SIZE)</div><div class='del'>-		SetPageUptodate(sb-&gt;pages[0]);</div><div class='ctx'> </div><div class='ctx'> 	write_extent_buffer(sb, super_copy, 0, BTRFS_SUPER_INFO_SIZE);</div><div class='ctx'> 	array_size = btrfs_super_sys_array_size(super_copy);</div><div class='hunk'>@@ -7384,10 +7298,15 @@ int btrfs_read_sys_array(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	cur_offset = 0;</div><div class='ctx'> </div><div class='ctx'> 	while (cur_offset &lt; array_size) {</div><div class='del'>-		disk_key = (struct btrfs_disk_key *)array_ptr;</div><div class='del'>-		len = sizeof(*disk_key);</div><div class='del'>-		if (cur_offset + len &gt; array_size)</div><div class='del'>-			goto out_short_read;</div><div class='add'>+		struct btrfs_chunk *chunk;</div><div class='add'>+		struct btrfs_disk_key *disk_key = (struct btrfs_disk_key *)array_ptr;</div><div class='add'>+		u32 len = sizeof(*disk_key);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * The sys_chunk_array has been already verified at super block</div><div class='add'>+		 * read time.  Only do ASSERT()s for basic checks.</div><div class='add'>+		 */</div><div class='add'>+		ASSERT(cur_offset + len &lt;= array_size);</div><div class='ctx'> </div><div class='ctx'> 		btrfs_disk_key_to_cpu(&amp;key, disk_key);</div><div class='ctx'> </div><div class='hunk'>@@ -7395,44 +7314,14 @@ int btrfs_read_sys_array(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 		sb_array_offset += len;</div><div class='ctx'> 		cur_offset += len;</div><div class='ctx'> </div><div class='del'>-		if (key.type != BTRFS_CHUNK_ITEM_KEY) {</div><div class='del'>-			btrfs_err(fs_info,</div><div class='del'>-			    "unexpected item type %u in sys_array at offset %u",</div><div class='del'>-				  (u32)key.type, cur_offset);</div><div class='del'>-			ret = -EIO;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='add'>+		ASSERT(key.type == BTRFS_CHUNK_ITEM_KEY);</div><div class='ctx'> </div><div class='ctx'> 		chunk = (struct btrfs_chunk *)sb_array_offset;</div><div class='del'>-		/*</div><div class='del'>-		 * At least one btrfs_chunk with one stripe must be present,</div><div class='del'>-		 * exact stripe count check comes afterwards</div><div class='del'>-		 */</div><div class='del'>-		len = btrfs_chunk_item_size(1);</div><div class='del'>-		if (cur_offset + len &gt; array_size)</div><div class='del'>-			goto out_short_read;</div><div class='del'>-</div><div class='del'>-		num_stripes = btrfs_chunk_num_stripes(sb, chunk);</div><div class='del'>-		if (!num_stripes) {</div><div class='del'>-			btrfs_err(fs_info,</div><div class='del'>-			"invalid number of stripes %u in sys_array at offset %u",</div><div class='del'>-				  num_stripes, cur_offset);</div><div class='del'>-			ret = -EIO;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='add'>+		ASSERT(btrfs_chunk_type(sb, chunk) &amp; BTRFS_BLOCK_GROUP_SYSTEM);</div><div class='ctx'> </div><div class='del'>-		type = btrfs_chunk_type(sb, chunk);</div><div class='del'>-		if ((type &amp; BTRFS_BLOCK_GROUP_SYSTEM) == 0) {</div><div class='del'>-			btrfs_err(fs_info,</div><div class='del'>-			"invalid chunk type %llu in sys_array at offset %u",</div><div class='del'>-				  type, cur_offset);</div><div class='del'>-			ret = -EIO;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='add'>+		len = btrfs_chunk_item_size(btrfs_chunk_num_stripes(sb, chunk));</div><div class='ctx'> </div><div class='del'>-		len = btrfs_chunk_item_size(num_stripes);</div><div class='del'>-		if (cur_offset + len &gt; array_size)</div><div class='del'>-			goto out_short_read;</div><div class='add'>+		ASSERT(cur_offset + len &lt;= array_size);</div><div class='ctx'> </div><div class='ctx'> 		ret = read_one_chunk(&amp;key, sb, chunk);</div><div class='ctx'> 		if (ret)</div><div class='hunk'>@@ -7445,13 +7334,6 @@ int btrfs_read_sys_array(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	clear_extent_buffer_uptodate(sb);</div><div class='ctx'> 	free_extent_buffer_stale(sb);</div><div class='ctx'> 	return ret;</div><div class='del'>-</div><div class='del'>-out_short_read:</div><div class='del'>-	btrfs_err(fs_info, "sys_array too short to read %u bytes at offset %u",</div><div class='del'>-			len, cur_offset);</div><div class='del'>-	clear_extent_buffer_uptodate(sb);</div><div class='del'>-	free_extent_buffer_stale(sb);</div><div class='del'>-	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -7465,26 +7347,21 @@ out_short_read:</div><div class='ctx'> bool btrfs_check_rw_degradable(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 					struct btrfs_device *failing_dev)</div><div class='ctx'> {</div><div class='del'>-	struct extent_map_tree *map_tree = &amp;fs_info-&gt;mapping_tree;</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	u64 next_start = 0;</div><div class='add'>+	struct btrfs_chunk_map *map;</div><div class='add'>+	u64 next_start;</div><div class='ctx'> 	bool ret = true;</div><div class='ctx'> </div><div class='del'>-	read_lock(&amp;map_tree-&gt;lock);</div><div class='del'>-	em = lookup_extent_mapping(map_tree, 0, (u64)-1);</div><div class='del'>-	read_unlock(&amp;map_tree-&gt;lock);</div><div class='add'>+	map = btrfs_find_chunk_map(fs_info, 0, U64_MAX);</div><div class='ctx'> 	/* No chunk at all? Return false anyway */</div><div class='del'>-	if (!em) {</div><div class='add'>+	if (!map) {</div><div class='ctx'> 		ret = false;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	while (em) {</div><div class='del'>-		struct map_lookup *map;</div><div class='add'>+	while (map) {</div><div class='ctx'> 		int missing = 0;</div><div class='ctx'> 		int max_tolerated;</div><div class='ctx'> 		int i;</div><div class='ctx'> </div><div class='del'>-		map = em-&gt;map_lookup;</div><div class='ctx'> 		max_tolerated =</div><div class='ctx'> 			btrfs_get_num_tolerated_disk_barrier_failures(</div><div class='ctx'> 					map-&gt;type);</div><div class='hunk'>@@ -7502,18 +7379,15 @@ bool btrfs_check_rw_degradable(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			if (!failing_dev)</div><div class='ctx'> 				btrfs_warn(fs_info,</div><div class='ctx'> 	"chunk %llu missing %d devices, max tolerance is %d for writable mount",</div><div class='del'>-				   em-&gt;start, missing, max_tolerated);</div><div class='del'>-			free_extent_map(em);</div><div class='add'>+				   map-&gt;start, missing, max_tolerated);</div><div class='add'>+			btrfs_free_chunk_map(map);</div><div class='ctx'> 			ret = false;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='del'>-		next_start = extent_map_end(em);</div><div class='del'>-		free_extent_map(em);</div><div class='add'>+		next_start = map-&gt;start + map-&gt;chunk_len;</div><div class='add'>+		btrfs_free_chunk_map(map);</div><div class='ctx'> </div><div class='del'>-		read_lock(&amp;map_tree-&gt;lock);</div><div class='del'>-		em = lookup_extent_mapping(map_tree, next_start,</div><div class='del'>-					   (u64)(-1) - next_start);</div><div class='del'>-		read_unlock(&amp;map_tree-&gt;lock);</div><div class='add'>+		map = btrfs_find_chunk_map(fs_info, next_start, U64_MAX - next_start);</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -7531,12 +7405,13 @@ static void readahead_tree_node_children(struct extent_buffer *node)</div><div class='ctx'> int btrfs_read_chunk_tree(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_root *root = fs_info-&gt;chunk_root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_key found_key;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int slot;</div><div class='add'>+	int iter_ret = 0;</div><div class='ctx'> 	u64 total_dev = 0;</div><div class='ctx'> 	u64 last_ra_node = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -7559,42 +7434,39 @@ int btrfs_read_chunk_tree(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	fs_info-&gt;fs_devices-&gt;total_rw_bytes = 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='add'>+	 * Lockdep complains about possible circular locking dependency between</div><div class='add'>+	 * a disk's open_mutex (struct gendisk.open_mutex), the rw semaphores</div><div class='add'>+	 * used for freeze protection of a fs (struct super_block.s_writers),</div><div class='add'>+	 * which we take when starting a transaction, and extent buffers of the</div><div class='add'>+	 * chunk tree if we call read_one_dev() while holding a lock on an</div><div class='add'>+	 * extent buffer of the chunk tree. Since we are mounting the filesystem</div><div class='add'>+	 * and at this point there can't be any concurrent task modifying the</div><div class='add'>+	 * chunk tree, to keep it simple, just skip locking on the chunk tree.</div><div class='add'>+	 */</div><div class='add'>+	ASSERT(!test_bit(BTRFS_FS_OPEN, &amp;fs_info-&gt;flags));</div><div class='add'>+	path-&gt;skip_locking = true;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='ctx'> 	 * Read all device items, and then all the chunk items. All</div><div class='ctx'> 	 * device items are found before any chunk item (their object id</div><div class='ctx'> 	 * is smaller than the lowest possible object id for a chunk</div><div class='ctx'> 	 * item - BTRFS_FIRST_CHUNK_TREE_OBJECTID).</div><div class='ctx'> 	 */</div><div class='ctx'> 	key.objectid = BTRFS_DEV_ITEMS_OBJECTID;</div><div class='del'>-	key.offset = 0;</div><div class='ctx'> 	key.type = 0;</div><div class='del'>-	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto error;</div><div class='del'>-	while (1) {</div><div class='del'>-		struct extent_buffer *node;</div><div class='add'>+	key.offset = 0;</div><div class='add'>+	btrfs_for_each_slot(root, &amp;key, &amp;found_key, path, iter_ret) {</div><div class='add'>+		struct extent_buffer *node = path-&gt;nodes[1];</div><div class='ctx'> </div><div class='ctx'> 		leaf = path-&gt;nodes[0];</div><div class='ctx'> 		slot = path-&gt;slots[0];</div><div class='del'>-		if (slot &gt;= btrfs_header_nritems(leaf)) {</div><div class='del'>-			ret = btrfs_next_leaf(root, path);</div><div class='del'>-			if (ret == 0)</div><div class='del'>-				continue;</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto error;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		/*</div><div class='del'>-		 * The nodes on level 1 are not locked but we don't need to do</div><div class='del'>-		 * that during mount time as nothing else can access the tree</div><div class='del'>-		 */</div><div class='del'>-		node = path-&gt;nodes[1];</div><div class='add'>+</div><div class='ctx'> 		if (node) {</div><div class='ctx'> 			if (last_ra_node != node-&gt;start) {</div><div class='ctx'> 				readahead_tree_node_children(node);</div><div class='ctx'> 				last_ra_node = node-&gt;start;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		btrfs_item_key_to_cpu(leaf, &amp;found_key, slot);</div><div class='ctx'> 		if (found_key.type == BTRFS_DEV_ITEM_KEY) {</div><div class='ctx'> 			struct btrfs_dev_item *dev_item;</div><div class='ctx'> 			dev_item = btrfs_item_ptr(leaf, slot,</div><div class='hunk'>@@ -7614,13 +7486,16 @@ int btrfs_read_chunk_tree(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 			 * requirement for chunk allocation, see the comment on</div><div class='ctx'> 			 * top of btrfs_chunk_alloc() for details.</div><div class='ctx'> 			 */</div><div class='del'>-			ASSERT(!test_bit(BTRFS_FS_OPEN, &amp;fs_info-&gt;flags));</div><div class='ctx'> 			chunk = btrfs_item_ptr(leaf, slot, struct btrfs_chunk);</div><div class='ctx'> 			ret = read_one_chunk(&amp;found_key, leaf, chunk);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				goto error;</div><div class='ctx'> 		}</div><div class='del'>-		path-&gt;slots[0]++;</div><div class='add'>+	}</div><div class='add'>+	/* Catch error found during iteration */</div><div class='add'>+	if (iter_ret &lt; 0) {</div><div class='add'>+		ret = iter_ret;</div><div class='add'>+		goto error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -7628,12 +7503,12 @@ int btrfs_read_chunk_tree(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	 * do another round of validation checks.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (total_dev != fs_info-&gt;fs_devices-&gt;total_devices) {</div><div class='del'>-		btrfs_err(fs_info,</div><div class='del'>-	   "super_num_devices %llu mismatch with num_devices %llu found here",</div><div class='add'>+		btrfs_warn(fs_info,</div><div class='add'>+"super block num_devices %llu mismatch with DEV_ITEM count %llu, will be repaired on next transaction commit",</div><div class='ctx'> 			  btrfs_super_num_devices(fs_info-&gt;super_copy),</div><div class='ctx'> 			  total_dev);</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		goto error;</div><div class='add'>+		fs_info-&gt;fs_devices-&gt;total_devices = total_dev;</div><div class='add'>+		btrfs_set_super_num_devices(fs_info-&gt;super_copy, total_dev);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (btrfs_super_total_bytes(fs_info-&gt;super_copy) &lt;</div><div class='ctx'> 	    fs_info-&gt;fs_devices-&gt;total_rw_bytes) {</div><div class='hunk'>@@ -7647,29 +7522,32 @@ int btrfs_read_chunk_tree(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	ret = 0;</div><div class='ctx'> error:</div><div class='ctx'> 	mutex_unlock(&amp;uuid_mutex);</div><div class='del'>-</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_init_devices_late(struct btrfs_fs_info *fs_info)</div><div class='add'>+int btrfs_init_devices_late(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_devices *fs_devices = fs_info-&gt;fs_devices, *seed_devs;</div><div class='ctx'> 	struct btrfs_device *device;</div><div class='del'>-</div><div class='del'>-	fs_devices-&gt;fs_info = fs_info;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='ctx'> 	list_for_each_entry(device, &amp;fs_devices-&gt;devices, dev_list)</div><div class='ctx'> 		device-&gt;fs_info = fs_info;</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(seed_devs, &amp;fs_devices-&gt;seed_list, seed_list) {</div><div class='del'>-		list_for_each_entry(device, &amp;seed_devs-&gt;devices, dev_list)</div><div class='add'>+		list_for_each_entry(device, &amp;seed_devs-&gt;devices, dev_list) {</div><div class='ctx'> 			device-&gt;fs_info = fs_info;</div><div class='add'>+			ret = btrfs_get_dev_zone_info(device, false);</div><div class='add'>+			if (ret)</div><div class='add'>+				break;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		seed_devs-&gt;fs_info = fs_info;</div><div class='ctx'> 	}</div><div class='ctx'> 	mutex_unlock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static u64 btrfs_dev_stats_value(const struct extent_buffer *eb,</div><div class='hunk'>@@ -7720,7 +7598,7 @@ static int btrfs_device_init_dev_stats(struct btrfs_device *device,</div><div class='ctx'> 	}</div><div class='ctx'> 	slot = path-&gt;slots[0];</div><div class='ctx'> 	eb = path-&gt;nodes[0];</div><div class='del'>-	item_size = btrfs_item_size_nr(eb, slot);</div><div class='add'>+	item_size = btrfs_item_size(eb, slot);</div><div class='ctx'> </div><div class='ctx'> 	ptr = btrfs_item_ptr(eb, slot, struct btrfs_dev_stats_item);</div><div class='ctx'> </div><div class='hunk'>@@ -7743,7 +7621,7 @@ int btrfs_init_dev_stats(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_devices *fs_devices = fs_info-&gt;fs_devices, *seed_devs;</div><div class='ctx'> 	struct btrfs_device *device;</div><div class='del'>-	struct btrfs_path *path = NULL;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='hunk'>@@ -7765,8 +7643,6 @@ int btrfs_init_dev_stats(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='ctx'> 	mutex_unlock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='del'>-</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -7775,7 +7651,7 @@ static int update_dev_stat_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = trans-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_root *dev_root = fs_info-&gt;dev_root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct extent_buffer *eb;</div><div class='ctx'> 	struct btrfs_dev_stats_item *ptr;</div><div class='hunk'>@@ -7791,21 +7667,21 @@ static int update_dev_stat_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	ret = btrfs_search_slot(trans, dev_root, &amp;key, path, -1, 1);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='del'>-		btrfs_warn_in_rcu(fs_info,</div><div class='add'>+		btrfs_warn(fs_info,</div><div class='ctx'> 			"error %d while searching for dev_stats item for device %s",</div><div class='del'>-			      ret, rcu_str_deref(device-&gt;name));</div><div class='del'>-		goto out;</div><div class='add'>+				  ret, btrfs_dev_name(device));</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (ret == 0 &amp;&amp;</div><div class='del'>-	    btrfs_item_size_nr(path-&gt;nodes[0], path-&gt;slots[0]) &lt; sizeof(*ptr)) {</div><div class='add'>+	    btrfs_item_size(path-&gt;nodes[0], path-&gt;slots[0]) &lt; sizeof(*ptr)) {</div><div class='ctx'> 		/* need to delete old one and insert a new one */</div><div class='ctx'> 		ret = btrfs_del_item(trans, dev_root, path);</div><div class='ctx'> 		if (ret != 0) {</div><div class='del'>-			btrfs_warn_in_rcu(fs_info,</div><div class='add'>+			btrfs_warn(fs_info,</div><div class='ctx'> 				"delete too small dev_stats item for device %s failed %d",</div><div class='del'>-				      rcu_str_deref(device-&gt;name), ret);</div><div class='del'>-			goto out;</div><div class='add'>+					  btrfs_dev_name(device), ret);</div><div class='add'>+			return ret;</div><div class='ctx'> 		}</div><div class='ctx'> 		ret = 1;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -7816,10 +7692,10 @@ static int update_dev_stat_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 		ret = btrfs_insert_empty_item(trans, dev_root, path,</div><div class='ctx'> 					      &amp;key, sizeof(*ptr));</div><div class='ctx'> 		if (ret &lt; 0) {</div><div class='del'>-			btrfs_warn_in_rcu(fs_info,</div><div class='add'>+			btrfs_warn(fs_info,</div><div class='ctx'> 				"insert dev_stats item for device %s failed %d",</div><div class='del'>-				rcu_str_deref(device-&gt;name), ret);</div><div class='del'>-			goto out;</div><div class='add'>+				btrfs_dev_name(device), ret);</div><div class='add'>+			return ret;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -7828,10 +7704,6 @@ static int update_dev_stat_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 	for (i = 0; i &lt; BTRFS_DEV_STAT_VALUES_MAX; i++)</div><div class='ctx'> 		btrfs_set_dev_stats_value(eb, ptr, i,</div><div class='ctx'> 					  btrfs_dev_stat_read(device, i));</div><div class='del'>-	btrfs_mark_buffer_dirty(eb);</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -7878,16 +7750,12 @@ int btrfs_run_dev_stats(struct btrfs_trans_handle *trans)</div><div class='ctx'> void btrfs_dev_stat_inc_and_print(struct btrfs_device *dev, int index)</div><div class='ctx'> {</div><div class='ctx'> 	btrfs_dev_stat_inc(dev, index);</div><div class='del'>-	btrfs_dev_stat_print_on_error(dev);</div><div class='del'>-}</div><div class='ctx'> </div><div class='del'>-static void btrfs_dev_stat_print_on_error(struct btrfs_device *dev)</div><div class='del'>-{</div><div class='ctx'> 	if (!dev-&gt;dev_stats_valid)</div><div class='ctx'> 		return;</div><div class='del'>-	btrfs_err_rl_in_rcu(dev-&gt;fs_info,</div><div class='add'>+	btrfs_err_rl(dev-&gt;fs_info,</div><div class='ctx'> 		"bdev %s errs: wr %u, rd %u, flush %u, corrupt %u, gen %u",</div><div class='del'>-			   rcu_str_deref(dev-&gt;name),</div><div class='add'>+			   btrfs_dev_name(dev),</div><div class='ctx'> 			   btrfs_dev_stat_read(dev, BTRFS_DEV_STAT_WRITE_ERRS),</div><div class='ctx'> 			   btrfs_dev_stat_read(dev, BTRFS_DEV_STAT_READ_ERRS),</div><div class='ctx'> 			   btrfs_dev_stat_read(dev, BTRFS_DEV_STAT_FLUSH_ERRS),</div><div class='hunk'>@@ -7905,9 +7773,9 @@ static void btrfs_dev_stat_print_on_load(struct btrfs_device *dev)</div><div class='ctx'> 	if (i == BTRFS_DEV_STAT_VALUES_MAX)</div><div class='ctx'> 		return; /* all values == 0, suppress message */</div><div class='ctx'> </div><div class='del'>-	btrfs_info_in_rcu(dev-&gt;fs_info,</div><div class='add'>+	btrfs_info(dev-&gt;fs_info,</div><div class='ctx'> 		"bdev %s errs: wr %u, rd %u, flush %u, corrupt %u, gen %u",</div><div class='del'>-	       rcu_str_deref(dev-&gt;name),</div><div class='add'>+	       btrfs_dev_name(dev),</div><div class='ctx'> 	       btrfs_dev_stat_read(dev, BTRFS_DEV_STAT_WRITE_ERRS),</div><div class='ctx'> 	       btrfs_dev_stat_read(dev, BTRFS_DEV_STAT_READ_ERRS),</div><div class='ctx'> 	       btrfs_dev_stat_read(dev, BTRFS_DEV_STAT_FLUSH_ERRS),</div><div class='hunk'>@@ -7965,7 +7833,7 @@ void btrfs_commit_device_sizes(struct btrfs_transaction *trans)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_device *curr, *next;</div><div class='ctx'> </div><div class='del'>-	ASSERT(trans-&gt;state == TRANS_STATE_COMMIT_DOING);</div><div class='add'>+	ASSERT(trans-&gt;state == TRANS_STATE_COMMIT_DOING, "state=%d" , trans-&gt;state);</div><div class='ctx'> </div><div class='ctx'> 	if (list_empty(&amp;trans-&gt;dev_update_list))</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -7995,27 +7863,20 @@ int btrfs_bg_type_to_factor(u64 flags)</div><div class='ctx'> 	return btrfs_raid_array[index].ncopies;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-</div><div class='del'>-</div><div class='ctx'> static int verify_one_dev_extent(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				 u64 chunk_offset, u64 devid,</div><div class='ctx'> 				 u64 physical_offset, u64 physical_len)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_dev_lookup_args args = { .devid = devid };</div><div class='del'>-	struct extent_map_tree *em_tree = &amp;fs_info-&gt;mapping_tree;</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	struct map_lookup *map;</div><div class='add'>+	struct btrfs_chunk_map *map;</div><div class='ctx'> 	struct btrfs_device *dev;</div><div class='ctx'> 	u64 stripe_len;</div><div class='ctx'> 	bool found = false;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	read_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	em = lookup_extent_mapping(em_tree, chunk_offset, 1);</div><div class='del'>-	read_unlock(&amp;em_tree-&gt;lock);</div><div class='del'>-</div><div class='del'>-	if (!em) {</div><div class='add'>+	map = btrfs_find_chunk_map(fs_info, chunk_offset, 1);</div><div class='add'>+	if (unlikely(!map)) {</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='ctx'> "dev extent physical offset %llu on devid %llu doesn't have corresponding chunk",</div><div class='ctx'> 			  physical_offset, devid);</div><div class='hunk'>@@ -8023,25 +7884,34 @@ static int verify_one_dev_extent(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	map = em-&gt;map_lookup;</div><div class='del'>-	stripe_len = calc_stripe_length(map-&gt;type, em-&gt;len, map-&gt;num_stripes);</div><div class='del'>-	if (physical_len != stripe_len) {</div><div class='add'>+	stripe_len = btrfs_calc_stripe_length(map);</div><div class='add'>+	if (unlikely(physical_len != stripe_len)) {</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='ctx'> "dev extent physical offset %llu on devid %llu length doesn't match chunk %llu, have %llu expect %llu",</div><div class='del'>-			  physical_offset, devid, em-&gt;start, physical_len,</div><div class='add'>+			  physical_offset, devid, map-&gt;start, physical_len,</div><div class='ctx'> 			  stripe_len);</div><div class='ctx'> 		ret = -EUCLEAN;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Very old mkfs.btrfs (before v4.15) will not respect the reserved</div><div class='add'>+	 * space. Although kernel can handle it without problem, better to warn</div><div class='add'>+	 * the users.</div><div class='add'>+	 */</div><div class='add'>+	if (physical_offset &lt; BTRFS_DEVICE_RANGE_RESERVED)</div><div class='add'>+		btrfs_warn(fs_info,</div><div class='add'>+		"devid %llu physical %llu len %llu inside the reserved space",</div><div class='add'>+			   devid, physical_offset, physical_len);</div><div class='add'>+</div><div class='ctx'> 	for (i = 0; i &lt; map-&gt;num_stripes; i++) {</div><div class='del'>-		if (map-&gt;stripes[i].dev-&gt;devid == devid &amp;&amp;</div><div class='del'>-		    map-&gt;stripes[i].physical == physical_offset) {</div><div class='add'>+		if (unlikely(map-&gt;stripes[i].dev-&gt;devid == devid &amp;&amp;</div><div class='add'>+			     map-&gt;stripes[i].physical == physical_offset)) {</div><div class='ctx'> 			found = true;</div><div class='ctx'> 			if (map-&gt;verified_stripes &gt;= map-&gt;num_stripes) {</div><div class='ctx'> 				btrfs_err(fs_info,</div><div class='ctx'> 				"too many dev extents for chunk %llu found",</div><div class='del'>-					  em-&gt;start);</div><div class='add'>+					  map-&gt;start);</div><div class='ctx'> 				ret = -EUCLEAN;</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -8049,7 +7919,7 @@ static int verify_one_dev_extent(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	if (!found) {</div><div class='add'>+	if (unlikely(!found)) {</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='ctx'> 	"dev extent physical offset %llu devid %llu has no corresponding chunk",</div><div class='ctx'> 			physical_offset, devid);</div><div class='hunk'>@@ -8058,13 +7928,13 @@ static int verify_one_dev_extent(struct btrfs_fs_info *fs_info,</div><div class='ctx'> </div><div class='ctx'> 	/* Make sure no dev extent is beyond device boundary */</div><div class='ctx'> 	dev = btrfs_find_device(fs_info-&gt;fs_devices, &amp;args);</div><div class='del'>-	if (!dev) {</div><div class='add'>+	if (unlikely(!dev)) {</div><div class='ctx'> 		btrfs_err(fs_info, "failed to find devid %llu", devid);</div><div class='ctx'> 		ret = -EUCLEAN;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (physical_offset + physical_len &gt; dev-&gt;disk_total_bytes) {</div><div class='add'>+	if (unlikely(physical_offset + physical_len &gt; dev-&gt;disk_total_bytes)) {</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='ctx'> "dev extent devid %llu physical offset %llu len %llu is beyond device boundary %llu",</div><div class='ctx'> 			  devid, physical_offset, physical_len,</div><div class='hunk'>@@ -8076,8 +7946,8 @@ static int verify_one_dev_extent(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	if (dev-&gt;zone_info) {</div><div class='ctx'> 		u64 zone_size = dev-&gt;zone_info-&gt;zone_size;</div><div class='ctx'> </div><div class='del'>-		if (!IS_ALIGNED(physical_offset, zone_size) ||</div><div class='del'>-		    !IS_ALIGNED(physical_len, zone_size)) {</div><div class='add'>+		if (unlikely(!IS_ALIGNED(physical_offset, zone_size) ||</div><div class='add'>+			     !IS_ALIGNED(physical_len, zone_size))) {</div><div class='ctx'> 			btrfs_err(fs_info,</div><div class='ctx'> "zoned: dev extent devid %llu physical offset %llu len %llu is not aligned to device zone",</div><div class='ctx'> 				  devid, physical_offset, physical_len);</div><div class='hunk'>@@ -8087,32 +7957,30 @@ static int verify_one_dev_extent(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	free_extent_map(em);</div><div class='add'>+	btrfs_free_chunk_map(map);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int verify_chunk_dev_extent_mapping(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	struct extent_map_tree *em_tree = &amp;fs_info-&gt;mapping_tree;</div><div class='del'>-	struct extent_map *em;</div><div class='ctx'> 	struct rb_node *node;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	read_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	for (node = rb_first_cached(&amp;em_tree-&gt;map); node; node = rb_next(node)) {</div><div class='del'>-		em = rb_entry(node, struct extent_map, rb_node);</div><div class='del'>-		if (em-&gt;map_lookup-&gt;num_stripes !=</div><div class='del'>-		    em-&gt;map_lookup-&gt;verified_stripes) {</div><div class='add'>+	read_lock(&amp;fs_info-&gt;mapping_tree_lock);</div><div class='add'>+	for (node = rb_first_cached(&amp;fs_info-&gt;mapping_tree); node; node = rb_next(node)) {</div><div class='add'>+		struct btrfs_chunk_map *map;</div><div class='add'>+</div><div class='add'>+		map = rb_entry(node, struct btrfs_chunk_map, rb_node);</div><div class='add'>+		if (unlikely(map-&gt;num_stripes != map-&gt;verified_stripes)) {</div><div class='ctx'> 			btrfs_err(fs_info,</div><div class='ctx'> 			"chunk %llu has missing dev extent, have %d expect %d",</div><div class='del'>-				  em-&gt;start, em-&gt;map_lookup-&gt;verified_stripes,</div><div class='del'>-				  em-&gt;map_lookup-&gt;num_stripes);</div><div class='add'>+				  map-&gt;start, map-&gt;verified_stripes, map-&gt;num_stripes);</div><div class='ctx'> 			ret = -EUCLEAN;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='del'>-	read_unlock(&amp;em_tree-&gt;lock);</div><div class='add'>+	read_unlock(&amp;fs_info-&gt;mapping_tree_lock);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -8125,7 +7993,7 @@ out:</div><div class='ctx'>  */</div><div class='ctx'> int btrfs_verify_dev_extents(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_root *root = fs_info-&gt;dev_root;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	u64 prev_devid = 0;</div><div class='hunk'>@@ -8156,17 +8024,15 @@ int btrfs_verify_dev_extents(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	path-&gt;reada = READA_FORWARD;</div><div class='ctx'> 	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	if (path-&gt;slots[0] &gt;= btrfs_header_nritems(path-&gt;nodes[0])) {</div><div class='ctx'> 		ret = btrfs_next_leaf(root, path);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 		/* No dev extents at all? Not good */</div><div class='del'>-		if (ret &gt; 0) {</div><div class='del'>-			ret = -EUCLEAN;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+		if (unlikely(ret &gt; 0))</div><div class='add'>+			return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		struct extent_buffer *leaf = path-&gt;nodes[0];</div><div class='hunk'>@@ -8188,24 +8054,23 @@ int btrfs_verify_dev_extents(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 		physical_len = btrfs_dev_extent_length(leaf, dext);</div><div class='ctx'> </div><div class='ctx'> 		/* Check if this dev extent overlaps with the previous one */</div><div class='del'>-		if (devid == prev_devid &amp;&amp; physical_offset &lt; prev_dev_ext_end) {</div><div class='add'>+		if (unlikely(devid == prev_devid &amp;&amp; physical_offset &lt; prev_dev_ext_end)) {</div><div class='ctx'> 			btrfs_err(fs_info,</div><div class='ctx'> "dev extent devid %llu physical offset %llu overlap with previous dev extent end %llu",</div><div class='ctx'> 				  devid, physical_offset, prev_dev_ext_end);</div><div class='del'>-			ret = -EUCLEAN;</div><div class='del'>-			goto out;</div><div class='add'>+			return -EUCLEAN;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		ret = verify_one_dev_extent(fs_info, chunk_offset, devid,</div><div class='ctx'> 					    physical_offset, physical_len);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 		prev_devid = devid;</div><div class='ctx'> 		prev_dev_ext_end = physical_offset + physical_len;</div><div class='ctx'> </div><div class='ctx'> 		ret = btrfs_next_item(root, path);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 		if (ret &gt; 0) {</div><div class='ctx'> 			ret = 0;</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -8213,10 +8078,7 @@ int btrfs_verify_dev_extents(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Ensure all chunks have corresponding dev extents */</div><div class='del'>-	ret = verify_chunk_dev_extent_mapping(fs_info);</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	return verify_chunk_dev_extent_mapping(fs_info);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -8245,7 +8107,7 @@ bool btrfs_pinned_by_swapfile(struct btrfs_fs_info *fs_info, void *ptr)</div><div class='ctx'> </div><div class='ctx'> static int relocating_repair_kthread(void *data)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_block_group *cache = (struct btrfs_block_group *)data;</div><div class='add'>+	struct btrfs_block_group *cache = data;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = cache-&gt;fs_info;</div><div class='ctx'> 	u64 target;</div><div class='ctx'> 	int ret = 0;</div><div class='hunk'>@@ -8253,6 +8115,8 @@ static int relocating_repair_kthread(void *data)</div><div class='ctx'> 	target = cache-&gt;start;</div><div class='ctx'> 	btrfs_put_block_group(cache);</div><div class='ctx'> </div><div class='add'>+	guard(super_write)(fs_info-&gt;sb);</div><div class='add'>+</div><div class='ctx'> 	if (!btrfs_exclop_start(fs_info, BTRFS_EXCLOP_BALANCE)) {</div><div class='ctx'> 		btrfs_info(fs_info,</div><div class='ctx'> 			   "zoned: skip relocating block group %llu to repair: EBUSY",</div><div class='hunk'>@@ -8267,7 +8131,7 @@ static int relocating_repair_kthread(void *data)</div><div class='ctx'> 	if (!cache)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	if (!cache-&gt;relocating_repair)</div><div class='add'>+	if (!test_bit(BLOCK_GROUP_FLAG_RELOCATING_REPAIR, &amp;cache-&gt;runtime_flags))</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_may_alloc_data_chunk(fs_info, target);</div><div class='hunk'>@@ -8277,7 +8141,7 @@ static int relocating_repair_kthread(void *data)</div><div class='ctx'> 	btrfs_info(fs_info,</div><div class='ctx'> 		   "zoned: relocating block group %llu to repair IO failure",</div><div class='ctx'> 		   target);</div><div class='del'>-	ret = btrfs_relocate_chunk(fs_info, target);</div><div class='add'>+	ret = btrfs_relocate_chunk(fs_info, target, true);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	if (cache)</div><div class='hunk'>@@ -8288,29 +8152,102 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_repair_one_zone(struct btrfs_fs_info *fs_info, u64 logical)</div><div class='add'>+bool btrfs_repair_one_zone(struct btrfs_fs_info *fs_info, u64 logical)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_block_group *cache;</div><div class='ctx'> </div><div class='add'>+	if (!btrfs_is_zoned(fs_info))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='ctx'> 	/* Do not attempt to repair in degraded state */</div><div class='ctx'> 	if (btrfs_test_opt(fs_info, DEGRADED))</div><div class='del'>-		return 0;</div><div class='add'>+		return true;</div><div class='ctx'> </div><div class='ctx'> 	cache = btrfs_lookup_block_group(fs_info, logical);</div><div class='ctx'> 	if (!cache)</div><div class='del'>-		return 0;</div><div class='add'>+		return true;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;cache-&gt;lock);</div><div class='del'>-	if (cache-&gt;relocating_repair) {</div><div class='del'>-		spin_unlock(&amp;cache-&gt;lock);</div><div class='add'>+	if (test_and_set_bit(BLOCK_GROUP_FLAG_RELOCATING_REPAIR, &amp;cache-&gt;runtime_flags)) {</div><div class='ctx'> 		btrfs_put_block_group(cache);</div><div class='del'>-		return 0;</div><div class='add'>+		return true;</div><div class='ctx'> 	}</div><div class='del'>-	cache-&gt;relocating_repair = 1;</div><div class='del'>-	spin_unlock(&amp;cache-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	kthread_run(relocating_repair_kthread, cache,</div><div class='ctx'> 		    "btrfs-relocating-repair");</div><div class='ctx'> </div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void map_raid56_repair_block(struct btrfs_io_context *bioc,</div><div class='add'>+				    struct btrfs_io_stripe *smap,</div><div class='add'>+				    u64 logical)</div><div class='add'>+{</div><div class='add'>+	int data_stripes = nr_bioc_data_stripes(bioc);</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; data_stripes; i++) {</div><div class='add'>+		u64 stripe_start = bioc-&gt;full_stripe_logical +</div><div class='add'>+				   btrfs_stripe_nr_to_offset(i);</div><div class='add'>+</div><div class='add'>+		if (logical &gt;= stripe_start &amp;&amp;</div><div class='add'>+		    logical &lt; stripe_start + BTRFS_STRIPE_LEN)</div><div class='add'>+			break;</div><div class='add'>+	}</div><div class='add'>+	ASSERT(i &lt; data_stripes, "i=%d data_stripes=%d", i, data_stripes);</div><div class='add'>+	smap-&gt;dev = bioc-&gt;stripes[i].dev;</div><div class='add'>+	smap-&gt;physical = bioc-&gt;stripes[i].physical +</div><div class='add'>+			((logical - bioc-&gt;full_stripe_logical) &amp;</div><div class='add'>+			 BTRFS_STRIPE_LEN_MASK);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Map a repair write into a single device.</div><div class='add'>+ *</div><div class='add'>+ * A repair write is triggered by read time repair or scrub, which would only</div><div class='add'>+ * update the contents of a single device.</div><div class='add'>+ * Not update any other mirrors nor go through RMW path.</div><div class='add'>+ *</div><div class='add'>+ * Callers should ensure:</div><div class='add'>+ *</div><div class='add'>+ * - Call btrfs_bio_counter_inc_blocked() first</div><div class='add'>+ * - The range does not cross stripe boundary</div><div class='add'>+ * - Has a valid @mirror_num passed in.</div><div class='add'>+ */</div><div class='add'>+int btrfs_map_repair_block(struct btrfs_fs_info *fs_info,</div><div class='add'>+			   struct btrfs_io_stripe *smap, u64 logical,</div><div class='add'>+			   u32 length, int mirror_num)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_io_context *bioc = NULL;</div><div class='add'>+	u64 map_length = length;</div><div class='add'>+	int mirror_ret = mirror_num;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ASSERT(mirror_num &gt; 0, "mirror_num=%d", mirror_num);</div><div class='add'>+</div><div class='add'>+	ret = btrfs_map_block(fs_info, BTRFS_MAP_WRITE, logical, &amp;map_length,</div><div class='add'>+			      &amp;bioc, smap, &amp;mirror_ret);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	/* The map range should not cross stripe boundary. */</div><div class='add'>+	ASSERT(map_length &gt;= length, "map_length=%llu length=%u", map_length, length);</div><div class='add'>+</div><div class='add'>+	/* Already mapped to single stripe. */</div><div class='add'>+	if (!bioc)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	/* Map the RAID56 multi-stripe writes to a single one. */</div><div class='add'>+	if (bioc-&gt;map_type &amp; BTRFS_BLOCK_GROUP_RAID56_MASK) {</div><div class='add'>+		map_raid56_repair_block(bioc, smap, logical);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ASSERT(mirror_num &lt;= bioc-&gt;num_stripes,</div><div class='add'>+	       "mirror_num=%d num_stripes=%d", mirror_num,  bioc-&gt;num_stripes);</div><div class='add'>+	smap-&gt;dev = bioc-&gt;stripes[mirror_num - 1].dev;</div><div class='add'>+	smap-&gt;physical = bioc-&gt;stripes[mirror_num - 1].physical;</div><div class='add'>+out:</div><div class='add'>+	btrfs_put_bioc(bioc);</div><div class='add'>+	ASSERT(smap-&gt;dev);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/btrfs/volumes.h b/fs/btrfs/volumes.h<br/>index 3b8130680749..34b854c1a303 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/volumes.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/volumes.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/volumes.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/volumes.h</a></div><div class='hunk'>@@ -6,30 +6,78 @@</div><div class='ctx'> #ifndef BTRFS_VOLUMES_H</div><div class='ctx'> #define BTRFS_VOLUMES_H</div><div class='ctx'> </div><div class='del'>-#include &lt;linux/bio.h&gt;</div><div class='add'>+#include &lt;linux/blk_types.h&gt;</div><div class='add'>+#include &lt;linux/blkdev.h&gt;</div><div class='add'>+#include &lt;linux/sizes.h&gt;</div><div class='add'>+#include &lt;linux/atomic.h&gt;</div><div class='ctx'> #include &lt;linux/sort.h&gt;</div><div class='del'>-#include &lt;linux/btrfs.h&gt;</div><div class='del'>-#include "async-thread.h"</div><div class='add'>+#include &lt;linux/list.h&gt;</div><div class='add'>+#include &lt;linux/mutex.h&gt;</div><div class='add'>+#include &lt;linux/log2.h&gt;</div><div class='add'>+#include &lt;linux/kobject.h&gt;</div><div class='add'>+#include &lt;linux/refcount.h&gt;</div><div class='add'>+#include &lt;linux/completion.h&gt;</div><div class='add'>+#include &lt;linux/rbtree.h&gt;</div><div class='add'>+#include &lt;uapi/linux/btrfs.h&gt;</div><div class='add'>+#include &lt;uapi/linux/btrfs_tree.h&gt;</div><div class='add'>+#include "messages.h"</div><div class='add'>+#include "extent-io-tree.h"</div><div class='add'>+</div><div class='add'>+struct block_device;</div><div class='add'>+struct bdev_handle;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+struct btrfs_block_group;</div><div class='add'>+struct btrfs_trans_handle;</div><div class='add'>+struct btrfs_transaction;</div><div class='add'>+struct btrfs_zoned_device_info;</div><div class='ctx'> </div><div class='ctx'> #define BTRFS_MAX_DATA_CHUNK_SIZE	(10ULL * SZ_1G)</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Arbitrary maximum size of one discard request to limit potentially long time</div><div class='add'>+ * spent in blkdev_issue_discard().</div><div class='add'>+ */</div><div class='add'>+#define BTRFS_MAX_DISCARD_CHUNK_SIZE	(SZ_1G)</div><div class='add'>+</div><div class='ctx'> extern struct mutex uuid_mutex;</div><div class='ctx'> </div><div class='del'>-#define BTRFS_STRIPE_LEN	SZ_64K</div><div class='del'>-</div><div class='del'>-struct btrfs_io_geometry {</div><div class='del'>-	/* remaining bytes before crossing a stripe */</div><div class='del'>-	u64 len;</div><div class='del'>-	/* offset of logical address in chunk */</div><div class='del'>-	u64 offset;</div><div class='del'>-	/* length of single IO stripe */</div><div class='del'>-	u64 stripe_len;</div><div class='del'>-	/* number of stripe where address falls */</div><div class='del'>-	u64 stripe_nr;</div><div class='del'>-	/* offset of address in stripe */</div><div class='del'>-	u64 stripe_offset;</div><div class='del'>-	/* offset of raid56 stripe into the chunk */</div><div class='del'>-	u64 raid56_stripe_offset;</div><div class='add'>+#define BTRFS_STRIPE_LEN		SZ_64K</div><div class='add'>+#define BTRFS_STRIPE_LEN_SHIFT		(16)</div><div class='add'>+#define BTRFS_STRIPE_LEN_MASK		(BTRFS_STRIPE_LEN - 1)</div><div class='add'>+</div><div class='add'>+static_assert(ilog2(BTRFS_STRIPE_LEN) == BTRFS_STRIPE_LEN_SHIFT);</div><div class='add'>+</div><div class='add'>+/* Used by sanity check for btrfs_raid_types. */</div><div class='add'>+#define const_ffs(n) (__builtin_ctzll(n) + 1)</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * The conversion from BTRFS_BLOCK_GROUP_* bits to btrfs_raid_type requires</div><div class='add'>+ * RAID0 always to be the lowest profile bit.</div><div class='add'>+ * Although it's part of on-disk format and should never change, do extra</div><div class='add'>+ * compile-time sanity checks.</div><div class='add'>+ */</div><div class='add'>+static_assert(const_ffs(BTRFS_BLOCK_GROUP_RAID0) &lt;</div><div class='add'>+	      const_ffs(BTRFS_BLOCK_GROUP_PROFILE_MASK &amp; ~BTRFS_BLOCK_GROUP_RAID0));</div><div class='add'>+static_assert(ilog2(BTRFS_BLOCK_GROUP_RAID0) &gt; ilog2(BTRFS_BLOCK_GROUP_TYPE_MASK));</div><div class='add'>+</div><div class='add'>+/* ilog2() can handle both constants and variables */</div><div class='add'>+#define BTRFS_BG_FLAG_TO_INDEX(profile)					\</div><div class='add'>+	ilog2((profile) &gt;&gt; (ilog2(BTRFS_BLOCK_GROUP_RAID0) - 1))</div><div class='add'>+</div><div class='add'>+enum btrfs_raid_types {</div><div class='add'>+	/* SINGLE is the special one as it doesn't have on-disk bit. */</div><div class='add'>+	BTRFS_RAID_SINGLE  = 0,</div><div class='add'>+</div><div class='add'>+	BTRFS_RAID_RAID0   = BTRFS_BG_FLAG_TO_INDEX(BTRFS_BLOCK_GROUP_RAID0),</div><div class='add'>+	BTRFS_RAID_RAID1   = BTRFS_BG_FLAG_TO_INDEX(BTRFS_BLOCK_GROUP_RAID1),</div><div class='add'>+	BTRFS_RAID_DUP	   = BTRFS_BG_FLAG_TO_INDEX(BTRFS_BLOCK_GROUP_DUP),</div><div class='add'>+	BTRFS_RAID_RAID10  = BTRFS_BG_FLAG_TO_INDEX(BTRFS_BLOCK_GROUP_RAID10),</div><div class='add'>+	BTRFS_RAID_RAID5   = BTRFS_BG_FLAG_TO_INDEX(BTRFS_BLOCK_GROUP_RAID5),</div><div class='add'>+	BTRFS_RAID_RAID6   = BTRFS_BG_FLAG_TO_INDEX(BTRFS_BLOCK_GROUP_RAID6),</div><div class='add'>+	BTRFS_RAID_RAID1C3 = BTRFS_BG_FLAG_TO_INDEX(BTRFS_BLOCK_GROUP_RAID1C3),</div><div class='add'>+	BTRFS_RAID_RAID1C4 = BTRFS_BG_FLAG_TO_INDEX(BTRFS_BLOCK_GROUP_RAID1C4),</div><div class='add'>+</div><div class='add'>+	BTRFS_NR_RAID_TYPES</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -52,7 +100,10 @@ struct btrfs_io_geometry {</div><div class='ctx'> #define BTRFS_DEV_STATE_FLUSH_SENT	(4)</div><div class='ctx'> #define BTRFS_DEV_STATE_NO_READA	(5)</div><div class='ctx'> </div><div class='del'>-struct btrfs_zoned_device_info;</div><div class='add'>+/* Special value encoding failure to write primary super block. */</div><div class='add'>+#define BTRFS_SUPER_PRIMARY_WRITE_ERROR		(INT_MAX / 2)</div><div class='add'>+</div><div class='add'>+struct btrfs_fs_devices;</div><div class='ctx'> </div><div class='ctx'> struct btrfs_device {</div><div class='ctx'> 	struct list_head dev_list; /* device_list_mutex */</div><div class='hunk'>@@ -61,17 +112,21 @@ struct btrfs_device {</div><div class='ctx'> 	struct btrfs_fs_devices *fs_devices;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info;</div><div class='ctx'> </div><div class='del'>-	struct rcu_string __rcu *name;</div><div class='add'>+	/* Device path or NULL if missing. */</div><div class='add'>+	const char __rcu *name;</div><div class='ctx'> </div><div class='ctx'> 	u64 generation;</div><div class='ctx'> </div><div class='add'>+	struct file *bdev_file;</div><div class='ctx'> 	struct block_device *bdev;</div><div class='ctx'> </div><div class='ctx'> 	struct btrfs_zoned_device_info *zone_info;</div><div class='ctx'> </div><div class='del'>-	/* the mode sent to blkdev_get */</div><div class='del'>-	fmode_t mode;</div><div class='del'>-</div><div class='add'>+	/*</div><div class='add'>+	 * Device's major-minor number. Must be set even if the device is not</div><div class='add'>+	 * opened (bdev == NULL), unless the device is missing.</div><div class='add'>+	 */</div><div class='add'>+	dev_t devt;</div><div class='ctx'> 	unsigned long dev_state;</div><div class='ctx'> 	blk_status_t last_flush_error;</div><div class='ctx'> </div><div class='hunk'>@@ -99,6 +154,12 @@ struct btrfs_device {</div><div class='ctx'> 	/* type and info about this device */</div><div class='ctx'> 	u64 type;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Counter of super block write errors, values larger than</div><div class='add'>+	 * BTRFS_SUPER_PRIMARY_WRITE_ERROR encode primary super block write failure.</div><div class='add'>+	 */</div><div class='add'>+	atomic_t sb_write_errors;</div><div class='add'>+</div><div class='ctx'> 	/* minimal io size for this device */</div><div class='ctx'> 	u32 sector_size;</div><div class='ctx'> </div><div class='hunk'>@@ -116,20 +177,13 @@ struct btrfs_device {</div><div class='ctx'> 	/* bytes used on the current transaction */</div><div class='ctx'> 	u64 commit_bytes_used;</div><div class='ctx'> </div><div class='del'>-	/* for sending down flush barriers */</div><div class='del'>-	struct bio *flush_bio;</div><div class='add'>+	/* Bio used for flushing device barriers */</div><div class='add'>+	struct bio flush_bio;</div><div class='ctx'> 	struct completion flush_wait;</div><div class='ctx'> </div><div class='ctx'> 	/* per-device scrub information */</div><div class='ctx'> 	struct scrub_ctx *scrub_ctx;</div><div class='ctx'> </div><div class='del'>-	/* readahead state */</div><div class='del'>-	atomic_t reada_in_flight;</div><div class='del'>-	u64 reada_next;</div><div class='del'>-	struct reada_zone *reada_curr_zone;</div><div class='del'>-	struct radix_tree_root reada_zones;</div><div class='del'>-	struct radix_tree_root reada_extents;</div><div class='del'>-</div><div class='ctx'> 	/* disk I/O failure stats. For detailed description refer to</div><div class='ctx'> 	 * enum btrfs_dev_stat_values in ioctl.h */</div><div class='ctx'> 	int dev_stats_valid;</div><div class='hunk'>@@ -149,6 +203,31 @@ struct btrfs_device {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * Block group or device which contains an active swapfile. Used for preventing</div><div class='add'>+ * unsafe operations while a swapfile is active.</div><div class='add'>+ *</div><div class='add'>+ * These are sorted on (ptr, inode) (note that a block group or device can</div><div class='add'>+ * contain more than one swapfile). We compare the pointer values because we</div><div class='add'>+ * don't actually care what the object is, we just need a quick check whether</div><div class='add'>+ * the object exists in the rbtree.</div><div class='add'>+ */</div><div class='add'>+struct btrfs_swapfile_pin {</div><div class='add'>+	struct rb_node node;</div><div class='add'>+	void *ptr;</div><div class='add'>+	struct inode *inode;</div><div class='add'>+	/*</div><div class='add'>+	 * If true, ptr points to a struct btrfs_block_group. Otherwise, ptr</div><div class='add'>+	 * points to a struct btrfs_device.</div><div class='add'>+	 */</div><div class='add'>+	bool is_block_group;</div><div class='add'>+	/*</div><div class='add'>+	 * Only used when 'is_block_group' is true and it is the number of</div><div class='add'>+	 * extents used by a swapfile for this block group ('ptr' field).</div><div class='add'>+	 */</div><div class='add'>+	int bg_extent_count;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * If we read those variants at the context of their own lock, we needn't</div><div class='ctx'>  * use the following helpers, reading them directly is safe.</div><div class='ctx'>  */</div><div class='hunk'>@@ -220,6 +299,9 @@ enum btrfs_chunk_allocation_policy {</div><div class='ctx'> 	BTRFS_CHUNK_ALLOC_ZONED,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+#define BTRFS_DEFAULT_RR_MIN_CONTIG_READ	(SZ_256K)</div><div class='add'>+/* Keep in sync with raid_attr table, current maximum is RAID1C4. */</div><div class='add'>+#define BTRFS_RAID1_MAX_MIRRORS			(4)</div><div class='ctx'> /*</div><div class='ctx'>  * Read policies for mirrored block group profiles, read picks the stripe based</div><div class='ctx'>  * on these policies.</div><div class='hunk'>@@ -227,13 +309,62 @@ enum btrfs_chunk_allocation_policy {</div><div class='ctx'> enum btrfs_read_policy {</div><div class='ctx'> 	/* Use process PID to choose the stripe */</div><div class='ctx'> 	BTRFS_READ_POLICY_PID,</div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+	/* Balancing RAID1 reads across all striped devices (round-robin). */</div><div class='add'>+	BTRFS_READ_POLICY_RR,</div><div class='add'>+	/* Read from a specific device. */</div><div class='add'>+	BTRFS_READ_POLICY_DEVID,</div><div class='add'>+#endif</div><div class='ctx'> 	BTRFS_NR_READ_POLICY,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+/*</div><div class='add'>+ * Checksum mode - offload it to workqueues or do it synchronously in</div><div class='add'>+ * btrfs_submit_chunk().</div><div class='add'>+ */</div><div class='add'>+enum btrfs_offload_csum_mode {</div><div class='add'>+	/*</div><div class='add'>+	 * Choose offloading checksum or do it synchronously automatically.</div><div class='add'>+	 * Do it synchronously if the checksum is fast, or offload to workqueues</div><div class='add'>+	 * otherwise.</div><div class='add'>+	 */</div><div class='add'>+	BTRFS_OFFLOAD_CSUM_AUTO,</div><div class='add'>+	/* Always offload checksum to workqueues. */</div><div class='add'>+	BTRFS_OFFLOAD_CSUM_FORCE_ON,</div><div class='add'>+	/* Never offload checksum to workqueues. */</div><div class='add'>+	BTRFS_OFFLOAD_CSUM_FORCE_OFF,</div><div class='add'>+};</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> struct btrfs_fs_devices {</div><div class='ctx'> 	u8 fsid[BTRFS_FSID_SIZE]; /* FS specific uuid */</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * UUID written into the btree blocks:</div><div class='add'>+	 *</div><div class='add'>+	 * - If metadata_uuid != fsid then super block must have</div><div class='add'>+	 *   BTRFS_FEATURE_INCOMPAT_METADATA_UUID flag set.</div><div class='add'>+	 *</div><div class='add'>+	 * - Following shall be true at all times:</div><div class='add'>+	 *   - metadata_uuid == btrfs_header::fsid</div><div class='add'>+	 *   - metadata_uuid == btrfs_dev_item::fsid</div><div class='add'>+	 *</div><div class='add'>+	 * - Relations between fsid and metadata_uuid in sb and fs_devices:</div><div class='add'>+	 *   - Normal:</div><div class='add'>+	 *       fs_devices-&gt;fsid == fs_devices-&gt;metadata_uuid == sb-&gt;fsid</div><div class='add'>+	 *       sb-&gt;metadata_uuid == 0</div><div class='add'>+	 *</div><div class='add'>+	 *   - When the BTRFS_FEATURE_INCOMPAT_METADATA_UUID flag is set:</div><div class='add'>+	 *       fs_devices-&gt;fsid == sb-&gt;fsid</div><div class='add'>+	 *       fs_devices-&gt;metadata_uuid == sb-&gt;metadata_uuid</div><div class='add'>+	 *</div><div class='add'>+	 *   - When in-memory fs_devices-&gt;temp_fsid is true</div><div class='add'>+	 *	 fs_devices-&gt;fsid = random</div><div class='add'>+	 *	 fs_devices-&gt;metadata_uuid == sb-&gt;fsid</div><div class='add'>+	 */</div><div class='ctx'> 	u8 metadata_uuid[BTRFS_FSID_SIZE];</div><div class='del'>-	bool fsid_change;</div><div class='add'>+</div><div class='ctx'> 	struct list_head fs_list;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -271,32 +402,45 @@ struct btrfs_fs_devices {</div><div class='ctx'> 	 */</div><div class='ctx'> 	struct btrfs_device *latest_dev;</div><div class='ctx'> </div><div class='del'>-	/* all of the devices in the FS, protected by a mutex</div><div class='del'>-	 * so we can safely walk it to write out the supers without</div><div class='del'>-	 * worrying about add/remove by the multi-device code.</div><div class='del'>-	 * Scrubbing super can kick off supers writing by holding</div><div class='del'>-	 * this mutex lock.</div><div class='add'>+	/*</div><div class='add'>+	 * All of the devices in the filesystem, protected by a mutex so we can</div><div class='add'>+	 * safely walk it to write out the super blocks without worrying about</div><div class='add'>+	 * adding/removing by the multi-device code. Scrubbing super block can</div><div class='add'>+	 * kick off supers writing by holding this mutex lock.</div><div class='ctx'> 	 */</div><div class='ctx'> 	struct mutex device_list_mutex;</div><div class='ctx'> </div><div class='ctx'> 	/* List of all devices, protected by device_list_mutex */</div><div class='ctx'> 	struct list_head devices;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Devices which can satisfy space allocation. Protected by</div><div class='del'>-	 * chunk_mutex</div><div class='del'>-	 */</div><div class='add'>+	/* Devices which can satisfy space allocation. Protected by * chunk_mutex. */</div><div class='ctx'> 	struct list_head alloc_list;</div><div class='ctx'> </div><div class='ctx'> 	struct list_head seed_list;</div><div class='del'>-	bool seeding;</div><div class='ctx'> </div><div class='add'>+	/* Count fs-devices opened. */</div><div class='ctx'> 	int opened;</div><div class='ctx'> </div><div class='del'>-	/* set when we find or add a device that doesn't have the</div><div class='del'>-	 * nonrot flag set</div><div class='add'>+	/*</div><div class='add'>+	 * Counter of the processes that are holding this fs_devices but not</div><div class='add'>+	 * yet opened.</div><div class='add'>+	 * This is for mounting handling, as we can only open the fs_devices</div><div class='add'>+	 * after a super block is created.  But we cannot take uuid_mutex</div><div class='add'>+	 * during sget_fc(), thus we have to hold the fs_devices (meaning it</div><div class='add'>+	 * cannot be released) until a super block is returned.</div><div class='ctx'> 	 */</div><div class='add'>+	int holding;</div><div class='add'>+</div><div class='add'>+	/* Set when we find or add a device that doesn't have the nonrot flag set. */</div><div class='ctx'> 	bool rotating;</div><div class='add'>+	/* Devices support TRIM/discard commands. */</div><div class='add'>+	bool discardable;</div><div class='add'>+	/* The filesystem is a seed filesystem. */</div><div class='add'>+	bool seeding;</div><div class='add'>+	/* The mount needs to use a randomly generated fsid. */</div><div class='add'>+	bool temp_fsid;</div><div class='add'>+	/* Enable/disable the filesystem stats tracking. */</div><div class='add'>+	bool collect_fs_stats;</div><div class='ctx'> </div><div class='ctx'> 	struct btrfs_fs_info *fs_info;</div><div class='ctx'> 	/* sysfs kobjects */</div><div class='hunk'>@@ -307,11 +451,23 @@ struct btrfs_fs_devices {</div><div class='ctx'> </div><div class='ctx'> 	enum btrfs_chunk_allocation_policy chunk_alloc_policy;</div><div class='ctx'> </div><div class='del'>-	/* Policy used to read the mirrored stripes */</div><div class='add'>+	/* Policy used to read the mirrored stripes. */</div><div class='ctx'> 	enum btrfs_read_policy read_policy;</div><div class='del'>-};</div><div class='ctx'> </div><div class='del'>-#define BTRFS_BIO_INLINE_CSUM_SIZE	64</div><div class='add'>+#ifdef CONFIG_BTRFS_EXPERIMENTAL</div><div class='add'>+	/*</div><div class='add'>+	 * Minimum contiguous reads before switching to next device, the unit</div><div class='add'>+	 * is one block/sectorsize.</div><div class='add'>+	 */</div><div class='add'>+	u32 rr_min_contig_read;</div><div class='add'>+</div><div class='add'>+	/* Device to be used for reading in case of RAID1. */</div><div class='add'>+	u64 read_devid;</div><div class='add'>+</div><div class='add'>+	/* Checksum mode - offload it or do it synchronously. */</div><div class='add'>+	enum btrfs_offload_csum_mode offload_csum_mode;</div><div class='add'>+#endif</div><div class='add'>+};</div><div class='ctx'> </div><div class='ctx'> #define BTRFS_MAX_DEVS(info) ((BTRFS_MAX_ITEM_SIZE(info)	\</div><div class='ctx'> 			- sizeof(struct btrfs_chunk))		\</div><div class='hunk'>@@ -322,48 +478,23 @@ struct btrfs_fs_devices {</div><div class='ctx'> 				- 2 * sizeof(struct btrfs_chunk))	\</div><div class='ctx'> 				/ sizeof(struct btrfs_stripe) + 1)</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Additional info to pass along bio.</div><div class='del'>- *</div><div class='del'>- * Mostly for btrfs specific features like csum and mirror_num.</div><div class='del'>- */</div><div class='del'>-struct btrfs_bio {</div><div class='del'>-	unsigned int mirror_num;</div><div class='del'>-</div><div class='del'>-	/* @device is for stripe IO submission. */</div><div class='del'>-	struct btrfs_device *device;</div><div class='del'>-	u8 *csum;</div><div class='del'>-	u8 csum_inline[BTRFS_BIO_INLINE_CSUM_SIZE];</div><div class='del'>-	struct bvec_iter iter;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * This member must come last, bio_alloc_bioset will allocate enough</div><div class='del'>-	 * bytes for entire btrfs_bio but relies on bio being last.</div><div class='del'>-	 */</div><div class='del'>-	struct bio bio;</div><div class='add'>+struct btrfs_io_stripe {</div><div class='add'>+	struct btrfs_device *dev;</div><div class='add'>+	/* Block mapping. */</div><div class='add'>+	u64 physical;</div><div class='add'>+	bool rst_search_commit_root;</div><div class='add'>+	/* For the endio handler. */</div><div class='add'>+	struct btrfs_io_context *bioc;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static inline struct btrfs_bio *btrfs_bio(struct bio *bio)</div><div class='del'>-{</div><div class='del'>-	return container_of(bio, struct btrfs_bio, bio);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_bio_free_csum(struct btrfs_bio *bbio)</div><div class='del'>-{</div><div class='del'>-	if (bbio-&gt;csum != bbio-&gt;csum_inline) {</div><div class='del'>-		kfree(bbio-&gt;csum);</div><div class='del'>-		bbio-&gt;csum = NULL;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct btrfs_io_stripe {</div><div class='add'>+struct btrfs_discard_stripe {</div><div class='ctx'> 	struct btrfs_device *dev;</div><div class='ctx'> 	u64 physical;</div><div class='del'>-	u64 length; /* only used for discard mappings */</div><div class='add'>+	u64 length;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Context for IO subsmission for device stripe.</div><div class='add'>+ * Context for IO submission for device stripe.</div><div class='ctx'>  *</div><div class='ctx'>  * - Track the unfinished mirrors for mirror based profiles</div><div class='ctx'>  *   Mirror based profiles are SINGLE/DUP/RAID1/RAID10.</div><div class='hunk'>@@ -380,24 +511,85 @@ struct btrfs_io_stripe {</div><div class='ctx'>  */</div><div class='ctx'> struct btrfs_io_context {</div><div class='ctx'> 	refcount_t refs;</div><div class='del'>-	atomic_t stripes_pending;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info;</div><div class='del'>-	u64 map_type; /* get from map_lookup-&gt;type */</div><div class='del'>-	bio_end_io_t *end_io;</div><div class='add'>+	/* Taken from struct btrfs_chunk_map::type. */</div><div class='add'>+	u64 map_type;</div><div class='ctx'> 	struct bio *orig_bio;</div><div class='del'>-	void *private;</div><div class='ctx'> 	atomic_t error;</div><div class='del'>-	int max_errors;</div><div class='del'>-	int num_stripes;</div><div class='del'>-	int mirror_num;</div><div class='del'>-	int num_tgtdevs;</div><div class='del'>-	int *tgtdev_map;</div><div class='add'>+	u16 max_errors;</div><div class='add'>+	bool use_rst;</div><div class='add'>+</div><div class='add'>+	u64 logical;</div><div class='add'>+	u64 size;</div><div class='add'>+	/* Raid stripe tree ordered entry. */</div><div class='add'>+	struct list_head rst_ordered_entry;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='del'>-	 * logical block numbers for the start of each stripe</div><div class='del'>-	 * The last one or two are p/q.  These are sorted,</div><div class='del'>-	 * so raid_map[0] is the start of our full stripe</div><div class='add'>+	 * The total number of stripes, including the extra duplicated</div><div class='add'>+	 * stripe for replace.</div><div class='add'>+	 */</div><div class='add'>+	u16 num_stripes;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The mirror_num of this bioc.</div><div class='add'>+	 *</div><div class='add'>+	 * This is for reads which use 0 as mirror_num, thus we should return a</div><div class='add'>+	 * valid mirror_num (&gt;0) for the reader.</div><div class='ctx'> 	 */</div><div class='del'>-	u64 *raid_map;</div><div class='add'>+	u16 mirror_num;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The following two members are for dev-replace case only.</div><div class='add'>+	 *</div><div class='add'>+	 * @replace_nr_stripes:	Number of duplicated stripes which need to be</div><div class='add'>+	 *			written to replace target.</div><div class='add'>+	 *			Should be &lt;= 2 (2 for DUP, otherwise &lt;= 1).</div><div class='add'>+	 * @replace_stripe_src:	The array indicates where the duplicated stripes</div><div class='add'>+	 *			are from.</div><div class='add'>+	 *</div><div class='add'>+	 * The @replace_stripe_src[] array is mostly for RAID56 cases.</div><div class='add'>+	 * As non-RAID56 stripes share the same contents of the mapped range,</div><div class='add'>+	 * thus no need to bother where the duplicated ones are from.</div><div class='add'>+	 *</div><div class='add'>+	 * But for RAID56 case, all stripes contain different contents, thus</div><div class='add'>+	 * we need a way to know the mapping.</div><div class='add'>+	 *</div><div class='add'>+	 * There is an example for the two members, using a RAID5 write:</div><div class='add'>+	 *</div><div class='add'>+	 *   num_stripes:	4 (3 + 1 duplicated write)</div><div class='add'>+	 *   stripes[0]:	dev = devid 1, physical = X</div><div class='add'>+	 *   stripes[1]:	dev = devid 2, physical = Y</div><div class='add'>+	 *   stripes[2]:	dev = devid 3, physical = Z</div><div class='add'>+	 *   stripes[3]:	dev = devid 0, physical = Y</div><div class='add'>+	 *</div><div class='add'>+	 * replace_nr_stripes = 1</div><div class='add'>+	 * replace_stripe_src = 1	&lt;- Means stripes[1] is involved in replace.</div><div class='add'>+	 *				   The duplicated stripe index would be</div><div class='add'>+	 *				   (@num_stripes - 1).</div><div class='add'>+	 *</div><div class='add'>+	 * Note, that we can still have cases replace_nr_stripes = 2 for DUP.</div><div class='add'>+	 * In that case, all stripes share the same content, thus we don't</div><div class='add'>+	 * need to bother @replace_stripe_src value at all.</div><div class='add'>+	 */</div><div class='add'>+	u16 replace_nr_stripes;</div><div class='add'>+	s16 replace_stripe_src;</div><div class='add'>+	/*</div><div class='add'>+	 * Logical bytenr of the full stripe start, only for RAID56 cases.</div><div class='add'>+	 *</div><div class='add'>+	 * When this value is set to other than (u64)-1, the stripes[] should</div><div class='add'>+	 * follow this pattern:</div><div class='add'>+	 *</div><div class='add'>+	 * (real_stripes = num_stripes - replace_nr_stripes)</div><div class='add'>+	 * (data_stripes = (is_raid6) ? (real_stripes - 2) : (real_stripes - 1))</div><div class='add'>+	 *</div><div class='add'>+	 * stripes[0]:			The first data stripe</div><div class='add'>+	 * stripes[1]:			The second data stripe</div><div class='add'>+	 * ...</div><div class='add'>+	 * stripes[data_stripes - 1]:	The last data stripe</div><div class='add'>+	 * stripes[data_stripes]:	The P stripe</div><div class='add'>+	 * stripes[data_stripes + 1]:	The Q stripe (only for RAID6).</div><div class='add'>+	 */</div><div class='add'>+	u64 full_stripe_logical;</div><div class='ctx'> 	struct btrfs_io_stripe stripes[];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -425,22 +617,33 @@ struct btrfs_raid_attr {</div><div class='ctx'> </div><div class='ctx'> extern const struct btrfs_raid_attr btrfs_raid_array[BTRFS_NR_RAID_TYPES];</div><div class='ctx'> </div><div class='del'>-struct map_lookup {</div><div class='add'>+struct btrfs_chunk_map {</div><div class='add'>+	struct rb_node rb_node;</div><div class='add'>+	/* For mount time dev extent verification. */</div><div class='add'>+	int verified_stripes;</div><div class='add'>+	refcount_t refs;</div><div class='add'>+	u64 start;</div><div class='add'>+	u64 chunk_len;</div><div class='add'>+	u64 stripe_size;</div><div class='ctx'> 	u64 type;</div><div class='ctx'> 	int io_align;</div><div class='ctx'> 	int io_width;</div><div class='del'>-	u64 stripe_len;</div><div class='ctx'> 	int num_stripes;</div><div class='ctx'> 	int sub_stripes;</div><div class='del'>-	int verified_stripes; /* For mount time dev extent verification */</div><div class='ctx'> 	struct btrfs_io_stripe stripes[];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-#define map_lookup_size(n) (sizeof(struct map_lookup) + \</div><div class='del'>-			    (sizeof(struct btrfs_io_stripe) * (n)))</div><div class='add'>+#define btrfs_chunk_map_size(n) (sizeof(struct btrfs_chunk_map) + \</div><div class='add'>+				 (sizeof(struct btrfs_io_stripe) * (n)))</div><div class='add'>+</div><div class='add'>+static inline void btrfs_free_chunk_map(struct btrfs_chunk_map *map)</div><div class='add'>+{</div><div class='add'>+	if (map &amp;&amp; refcount_dec_and_test(&amp;map-&gt;refs)) {</div><div class='add'>+		ASSERT(RB_EMPTY_NODE(&amp;map-&gt;rb_node));</div><div class='add'>+		kfree(map);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-struct btrfs_balance_args;</div><div class='del'>-struct btrfs_balance_progress;</div><div class='ctx'> struct btrfs_balance_control {</div><div class='ctx'> 	struct btrfs_balance_args data;</div><div class='ctx'> 	struct btrfs_balance_args meta;</div><div class='hunk'>@@ -458,6 +661,11 @@ struct btrfs_dev_lookup_args {</div><div class='ctx'> 	u64 devid;</div><div class='ctx'> 	u8 *uuid;</div><div class='ctx'> 	u8 *fsid;</div><div class='add'>+	/*</div><div class='add'>+	 * If devt is specified, all other members will be ignored as it is</div><div class='add'>+	 * enough to uniquely locate a device.</div><div class='add'>+	 */</div><div class='add'>+	dev_t devt;</div><div class='ctx'> 	bool missing;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -470,15 +678,12 @@ struct btrfs_dev_lookup_args {</div><div class='ctx'> enum btrfs_map_op {</div><div class='ctx'> 	BTRFS_MAP_READ,</div><div class='ctx'> 	BTRFS_MAP_WRITE,</div><div class='del'>-	BTRFS_MAP_DISCARD,</div><div class='ctx'> 	BTRFS_MAP_GET_READ_MIRRORS,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static inline enum btrfs_map_op btrfs_op(struct bio *bio)</div><div class='add'>+static inline enum btrfs_map_op btrfs_op(const struct bio *bio)</div><div class='ctx'> {</div><div class='ctx'> 	switch (bio_op(bio)) {</div><div class='del'>-	case REQ_OP_DISCARD:</div><div class='del'>-		return BTRFS_MAP_DISCARD;</div><div class='ctx'> 	case REQ_OP_WRITE:</div><div class='ctx'> 	case REQ_OP_ZONE_APPEND:</div><div class='ctx'> 		return BTRFS_MAP_WRITE;</div><div class='hunk'>@@ -490,29 +695,46 @@ static inline enum btrfs_map_op btrfs_op(struct bio *bio)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline unsigned long btrfs_chunk_item_size(int num_stripes)</div><div class='add'>+{</div><div class='add'>+	ASSERT(num_stripes);</div><div class='add'>+	return sizeof(struct btrfs_chunk) +</div><div class='add'>+		sizeof(struct btrfs_stripe) * (num_stripes - 1);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Do the type safe conversion from stripe_nr to offset inside the chunk.</div><div class='add'>+ *</div><div class='add'>+ * @stripe_nr is u32, with left shift it can overflow u32 for chunks larger</div><div class='add'>+ * than 4G.  This does the proper type cast to avoid overflow.</div><div class='add'>+ */</div><div class='add'>+static inline u64 btrfs_stripe_nr_to_offset(u32 stripe_nr)</div><div class='add'>+{</div><div class='add'>+	return (u64)stripe_nr &lt;&lt; BTRFS_STRIPE_LEN_SHIFT;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> void btrfs_get_bioc(struct btrfs_io_context *bioc);</div><div class='ctx'> void btrfs_put_bioc(struct btrfs_io_context *bioc);</div><div class='ctx'> int btrfs_map_block(struct btrfs_fs_info *fs_info, enum btrfs_map_op op,</div><div class='ctx'> 		    u64 logical, u64 *length,</div><div class='del'>-		    struct btrfs_io_context **bioc_ret, int mirror_num);</div><div class='del'>-int btrfs_map_sblock(struct btrfs_fs_info *fs_info, enum btrfs_map_op op,</div><div class='del'>-		     u64 logical, u64 *length,</div><div class='del'>-		     struct btrfs_io_context **bioc_ret);</div><div class='del'>-int btrfs_get_io_geometry(struct btrfs_fs_info *fs_info, struct extent_map *map,</div><div class='del'>-			  enum btrfs_map_op op, u64 logical,</div><div class='del'>-			  struct btrfs_io_geometry *io_geom);</div><div class='add'>+		    struct btrfs_io_context **bioc_ret,</div><div class='add'>+		    struct btrfs_io_stripe *smap, int *mirror_num_ret);</div><div class='add'>+int btrfs_map_repair_block(struct btrfs_fs_info *fs_info,</div><div class='add'>+			   struct btrfs_io_stripe *smap, u64 logical,</div><div class='add'>+			   u32 length, int mirror_num);</div><div class='add'>+struct btrfs_discard_stripe *btrfs_map_discard(struct btrfs_fs_info *fs_info,</div><div class='add'>+					       u64 logical, u64 *length_ret,</div><div class='add'>+					       u32 *num_stripes);</div><div class='ctx'> int btrfs_read_sys_array(struct btrfs_fs_info *fs_info);</div><div class='ctx'> int btrfs_read_chunk_tree(struct btrfs_fs_info *fs_info);</div><div class='ctx'> struct btrfs_block_group *btrfs_create_chunk(struct btrfs_trans_handle *trans,</div><div class='del'>-					    u64 type);</div><div class='del'>-void btrfs_mapping_tree_free(struct extent_map_tree *tree);</div><div class='del'>-blk_status_t btrfs_map_bio(struct btrfs_fs_info *fs_info, struct bio *bio,</div><div class='del'>-			   int mirror_num);</div><div class='add'>+					     struct btrfs_space_info *space_info,</div><div class='add'>+					     u64 type);</div><div class='add'>+void btrfs_mapping_tree_free(struct btrfs_fs_info *fs_info);</div><div class='ctx'> int btrfs_open_devices(struct btrfs_fs_devices *fs_devices,</div><div class='del'>-		       fmode_t flags, void *holder);</div><div class='del'>-struct btrfs_device *btrfs_scan_one_device(const char *path,</div><div class='del'>-					   fmode_t flags, void *holder);</div><div class='del'>-int btrfs_forget_devices(const char *path);</div><div class='add'>+		       blk_mode_t flags, void *holder);</div><div class='add'>+struct btrfs_device *btrfs_scan_one_device(const char *path, bool mount_arg_dev);</div><div class='add'>+int btrfs_forget_devices(dev_t devt);</div><div class='ctx'> void btrfs_close_devices(struct btrfs_fs_devices *fs_devices);</div><div class='ctx'> void btrfs_free_extra_devids(struct btrfs_fs_devices *fs_devices);</div><div class='ctx'> void btrfs_assign_next_active_device(struct btrfs_device *device,</div><div class='hunk'>@@ -524,13 +746,12 @@ int btrfs_get_dev_args_from_path(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				 struct btrfs_dev_lookup_args *args,</div><div class='ctx'> 				 const char *path);</div><div class='ctx'> struct btrfs_device *btrfs_alloc_device(struct btrfs_fs_info *fs_info,</div><div class='del'>-					const u64 *devid,</div><div class='del'>-					const u8 *uuid);</div><div class='add'>+					const u64 *devid, const u8 *uuid,</div><div class='add'>+					const char *path);</div><div class='ctx'> void btrfs_put_dev_args_from_path(struct btrfs_dev_lookup_args *args);</div><div class='del'>-void btrfs_free_device(struct btrfs_device *device);</div><div class='ctx'> int btrfs_rm_device(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 		    struct btrfs_dev_lookup_args *args,</div><div class='del'>-		    struct block_device **bdev, fmode_t *mode);</div><div class='add'>+		    struct file **bdev_file);</div><div class='ctx'> void __exit btrfs_cleanup_fs_uuids(void);</div><div class='ctx'> int btrfs_num_copies(struct btrfs_fs_info *fs_info, u64 logical, u64 len);</div><div class='ctx'> int btrfs_grow_device(struct btrfs_trans_handle *trans,</div><div class='hunk'>@@ -546,31 +767,41 @@ void btrfs_describe_block_groups(u64 flags, char *buf, u32 size_buf);</div><div class='ctx'> int btrfs_resume_balance_async(struct btrfs_fs_info *fs_info);</div><div class='ctx'> int btrfs_recover_balance(struct btrfs_fs_info *fs_info);</div><div class='ctx'> int btrfs_pause_balance(struct btrfs_fs_info *fs_info);</div><div class='del'>-int btrfs_relocate_chunk(struct btrfs_fs_info *fs_info, u64 chunk_offset);</div><div class='add'>+int btrfs_relocate_chunk(struct btrfs_fs_info *fs_info, u64 chunk_offset,</div><div class='add'>+			 bool verbose);</div><div class='ctx'> int btrfs_cancel_balance(struct btrfs_fs_info *fs_info);</div><div class='del'>-int btrfs_create_uuid_tree(struct btrfs_fs_info *fs_info);</div><div class='del'>-int btrfs_uuid_scan_kthread(void *data);</div><div class='ctx'> bool btrfs_chunk_writeable(struct btrfs_fs_info *fs_info, u64 chunk_offset);</div><div class='del'>-int find_free_dev_extent(struct btrfs_device *device, u64 num_bytes,</div><div class='del'>-			 u64 *start, u64 *max_avail);</div><div class='ctx'> void btrfs_dev_stat_inc_and_print(struct btrfs_device *dev, int index);</div><div class='ctx'> int btrfs_get_dev_stats(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 			struct btrfs_ioctl_get_dev_stats *stats);</div><div class='del'>-void btrfs_init_devices_late(struct btrfs_fs_info *fs_info);</div><div class='add'>+int btrfs_init_devices_late(struct btrfs_fs_info *fs_info);</div><div class='ctx'> int btrfs_init_dev_stats(struct btrfs_fs_info *fs_info);</div><div class='ctx'> int btrfs_run_dev_stats(struct btrfs_trans_handle *trans);</div><div class='ctx'> void btrfs_rm_dev_replace_remove_srcdev(struct btrfs_device *srcdev);</div><div class='ctx'> void btrfs_rm_dev_replace_free_srcdev(struct btrfs_device *srcdev);</div><div class='ctx'> void btrfs_destroy_dev_replace_tgtdev(struct btrfs_device *tgtdev);</div><div class='del'>-int btrfs_is_parity_mirror(struct btrfs_fs_info *fs_info,</div><div class='del'>-			   u64 logical, u64 len);</div><div class='ctx'> unsigned long btrfs_full_stripe_len(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 				    u64 logical);</div><div class='add'>+u64 btrfs_calc_stripe_length(const struct btrfs_chunk_map *map);</div><div class='add'>+int btrfs_nr_parity_stripes(u64 type);</div><div class='ctx'> int btrfs_chunk_alloc_add_chunk_item(struct btrfs_trans_handle *trans,</div><div class='ctx'> 				     struct btrfs_block_group *bg);</div><div class='ctx'> int btrfs_remove_chunk(struct btrfs_trans_handle *trans, u64 chunk_offset);</div><div class='del'>-struct extent_map *btrfs_get_chunk_map(struct btrfs_fs_info *fs_info,</div><div class='del'>-				       u64 logical, u64 length);</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BTRFS_FS_RUN_SANITY_TESTS</div><div class='add'>+struct btrfs_chunk_map *btrfs_alloc_chunk_map(int num_stripes, gfp_t gfp);</div><div class='add'>+int btrfs_add_chunk_map(struct btrfs_fs_info *fs_info, struct btrfs_chunk_map *map);</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+struct btrfs_chunk_map *btrfs_find_chunk_map(struct btrfs_fs_info *fs_info,</div><div class='add'>+					     u64 logical, u64 length);</div><div class='add'>+struct btrfs_chunk_map *btrfs_find_chunk_map_nolock(struct btrfs_fs_info *fs_info,</div><div class='add'>+						    u64 logical, u64 length);</div><div class='add'>+struct btrfs_chunk_map *btrfs_get_chunk_map(struct btrfs_fs_info *fs_info,</div><div class='add'>+					    u64 logical, u64 length);</div><div class='add'>+void btrfs_remove_chunk_map(struct btrfs_fs_info *fs_info, struct btrfs_chunk_map *map);</div><div class='add'>+struct btrfs_super_block *btrfs_read_disk_super(struct block_device *bdev,</div><div class='add'>+						int copy_num, bool drop_cache);</div><div class='ctx'> void btrfs_release_disk_super(struct btrfs_super_block *super);</div><div class='ctx'> </div><div class='ctx'> static inline void btrfs_dev_stat_inc(struct btrfs_device *dev,</div><div class='hunk'>@@ -624,19 +855,52 @@ static inline void btrfs_dev_stat_set(struct btrfs_device *dev,</div><div class='ctx'> 	atomic_inc(&amp;dev-&gt;dev_stats_ccnt);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline const char *btrfs_dev_name(const struct btrfs_device *device)</div><div class='add'>+{</div><div class='add'>+	if (!device || test_bit(BTRFS_DEV_STATE_MISSING, &amp;device-&gt;dev_state))</div><div class='add'>+		return "&lt;missing disk&gt;";</div><div class='add'>+	else</div><div class='add'>+		return rcu_dereference(device-&gt;name);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_warn_unknown_chunk_allocation(enum btrfs_chunk_allocation_policy pol)</div><div class='add'>+{</div><div class='add'>+	WARN_ONCE(1, "unknown allocation policy %d, fallback to regular", pol);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_fs_devices_inc_holding(struct btrfs_fs_devices *fs_devices)</div><div class='add'>+{</div><div class='add'>+	lockdep_assert_held(&amp;uuid_mutex);</div><div class='add'>+	ASSERT(fs_devices-&gt;holding &gt;= 0);</div><div class='add'>+	fs_devices-&gt;holding++;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_fs_devices_dec_holding(struct btrfs_fs_devices *fs_devices)</div><div class='add'>+{</div><div class='add'>+	lockdep_assert_held(&amp;uuid_mutex);</div><div class='add'>+	ASSERT(fs_devices-&gt;holding &gt; 0);</div><div class='add'>+	fs_devices-&gt;holding--;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> void btrfs_commit_device_sizes(struct btrfs_transaction *trans);</div><div class='ctx'> </div><div class='ctx'> struct list_head * __attribute_const__ btrfs_get_fs_uuids(void);</div><div class='ctx'> bool btrfs_check_rw_degradable(struct btrfs_fs_info *fs_info,</div><div class='ctx'> 					struct btrfs_device *failing_dev);</div><div class='del'>-void btrfs_scratch_superblocks(struct btrfs_fs_info *fs_info,</div><div class='del'>-			       struct block_device *bdev,</div><div class='del'>-			       const char *device_path);</div><div class='add'>+void btrfs_scratch_superblocks(struct btrfs_fs_info *fs_info, struct btrfs_device *device);</div><div class='ctx'> </div><div class='ctx'> enum btrfs_raid_types __attribute_const__ btrfs_bg_flags_to_raid_index(u64 flags);</div><div class='ctx'> int btrfs_bg_type_to_factor(u64 flags);</div><div class='ctx'> const char *btrfs_bg_type_to_raid_name(u64 flags);</div><div class='ctx'> int btrfs_verify_dev_extents(struct btrfs_fs_info *fs_info);</div><div class='del'>-int btrfs_repair_one_zone(struct btrfs_fs_info *fs_info, u64 logical);</div><div class='add'>+bool btrfs_repair_one_zone(struct btrfs_fs_info *fs_info, u64 logical);</div><div class='add'>+</div><div class='add'>+bool btrfs_pinned_by_swapfile(struct btrfs_fs_info *fs_info, void *ptr);</div><div class='add'>+const u8 *btrfs_sb_fsid_ptr(const struct btrfs_super_block *sb);</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BTRFS_FS_RUN_SANITY_TESTS</div><div class='add'>+struct btrfs_io_context *alloc_btrfs_io_context(struct btrfs_fs_info *fs_info,</div><div class='add'>+						u64 logical, u16 total_stripes);</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/btrfs/xattr.c b/fs/btrfs/xattr.c<br/>index 2837b4c8424d..ab55d10bd71f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/xattr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/xattr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/xattr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/xattr.c</a></div><div class='hunk'>@@ -13,21 +13,24 @@</div><div class='ctx'> #include &lt;linux/iversion.h&gt;</div><div class='ctx'> #include &lt;linux/sched/mm.h&gt;</div><div class='ctx'> #include "ctree.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "messages.h"</div><div class='ctx'> #include "btrfs_inode.h"</div><div class='ctx'> #include "transaction.h"</div><div class='ctx'> #include "xattr.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='ctx'> #include "props.h"</div><div class='ctx'> #include "locking.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "dir-item.h"</div><div class='ctx'> </div><div class='del'>-int btrfs_getxattr(struct inode *inode, const char *name,</div><div class='add'>+int btrfs_getxattr(const struct inode *inode, const char *name,</div><div class='ctx'> 				void *buffer, size_t size)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_dir_item *di;</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='del'>-	int ret = 0;</div><div class='ctx'> 	unsigned long data_ptr;</div><div class='ctx'> </div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='hunk'>@@ -37,26 +40,19 @@ int btrfs_getxattr(struct inode *inode, const char *name,</div><div class='ctx'> 	/* lookup the xattr by name */</div><div class='ctx'> 	di = btrfs_lookup_xattr(NULL, root, path, btrfs_ino(BTRFS_I(inode)),</div><div class='ctx'> 			name, strlen(name), 0);</div><div class='del'>-	if (!di) {</div><div class='del'>-		ret = -ENODATA;</div><div class='del'>-		goto out;</div><div class='del'>-	} else if (IS_ERR(di)) {</div><div class='del'>-		ret = PTR_ERR(di);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (!di)</div><div class='add'>+		return -ENODATA;</div><div class='add'>+	if (IS_ERR(di))</div><div class='add'>+		return PTR_ERR(di);</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	/* if size is 0, that means we want the size of the attr */</div><div class='del'>-	if (!size) {</div><div class='del'>-		ret = btrfs_dir_data_len(leaf, di);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (!size)</div><div class='add'>+		return btrfs_dir_data_len(leaf, di);</div><div class='ctx'> </div><div class='ctx'> 	/* now get the data out of our dir_item */</div><div class='del'>-	if (btrfs_dir_data_len(leaf, di) &gt; size) {</div><div class='del'>-		ret = -ERANGE;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (btrfs_dir_data_len(leaf, di) &gt; size)</div><div class='add'>+		return -ERANGE;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The way things are packed into the leaf is like this</div><div class='hunk'>@@ -69,11 +65,7 @@ int btrfs_getxattr(struct inode *inode, const char *name,</div><div class='ctx'> 				   btrfs_dir_name_len(leaf, di));</div><div class='ctx'> 	read_extent_buffer(leaf, buffer, data_ptr,</div><div class='ctx'> 			   btrfs_dir_data_len(leaf, di));</div><div class='del'>-	ret = btrfs_dir_data_len(leaf, di);</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	return btrfs_dir_data_len(leaf, di);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_setxattr(struct btrfs_trans_handle *trans, struct inode *inode,</div><div class='hunk'>@@ -81,8 +73,7 @@ int btrfs_setxattr(struct btrfs_trans_handle *trans, struct inode *inode,</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_dir_item *di = NULL;</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='del'>-	struct btrfs_fs_info *fs_info = root-&gt;fs_info;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	size_t name_len = strlen(name);</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -94,7 +85,7 @@ int btrfs_setxattr(struct btrfs_trans_handle *trans, struct inode *inode,</div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='del'>-	path-&gt;skip_release_on_error = 1;</div><div class='add'>+	path-&gt;skip_release_on_error = true;</div><div class='ctx'> </div><div class='ctx'> 	if (!value) {</div><div class='ctx'> 		di = btrfs_lookup_xattr(trans, root, path,</div><div class='hunk'>@@ -116,7 +107,7 @@ int btrfs_setxattr(struct btrfs_trans_handle *trans, struct inode *inode,</div><div class='ctx'> 	 * locks the inode's i_mutex before calling setxattr or removexattr.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (flags &amp; XATTR_REPLACE) {</div><div class='del'>-		ASSERT(inode_is_locked(inode));</div><div class='add'>+		btrfs_assert_inode_locked(BTRFS_I(inode));</div><div class='ctx'> 		di = btrfs_lookup_xattr(NULL, root, path,</div><div class='ctx'> 				btrfs_ino(BTRFS_I(inode)), name, name_len, 0);</div><div class='ctx'> 		if (!di)</div><div class='hunk'>@@ -139,14 +130,14 @@ int btrfs_setxattr(struct btrfs_trans_handle *trans, struct inode *inode,</div><div class='ctx'> 		 */</div><div class='ctx'> 		ret = 0;</div><div class='ctx'> 		btrfs_assert_tree_write_locked(path-&gt;nodes[0]);</div><div class='del'>-		di = btrfs_match_dir_item_name(fs_info, path, name, name_len);</div><div class='add'>+		di = btrfs_match_dir_item_name(path, name, name_len);</div><div class='ctx'> 		if (!di &amp;&amp; !(flags &amp; XATTR_REPLACE)) {</div><div class='ctx'> 			ret = -ENOSPC;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else if (ret == -EEXIST) {</div><div class='ctx'> 		ret = 0;</div><div class='del'>-		di = btrfs_match_dir_item_name(fs_info, path, name, name_len);</div><div class='add'>+		di = btrfs_match_dir_item_name(path, name, name_len);</div><div class='ctx'> 		ASSERT(di); /* logic error */</div><div class='ctx'> 	} else if (ret) {</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -168,9 +159,8 @@ int btrfs_setxattr(struct btrfs_trans_handle *trans, struct inode *inode,</div><div class='ctx'> 		const int slot = path-&gt;slots[0];</div><div class='ctx'> 		struct extent_buffer *leaf = path-&gt;nodes[0];</div><div class='ctx'> 		const u16 old_data_len = btrfs_dir_data_len(leaf, di);</div><div class='del'>-		const u32 item_size = btrfs_item_size_nr(leaf, slot);</div><div class='add'>+		const u32 item_size = btrfs_item_size(leaf, slot);</div><div class='ctx'> 		const u32 data_size = sizeof(*di) + name_len + size;</div><div class='del'>-		struct btrfs_item *item;</div><div class='ctx'> 		unsigned long data_ptr;</div><div class='ctx'> 		char *ptr;</div><div class='ctx'> </div><div class='hunk'>@@ -185,25 +175,23 @@ int btrfs_setxattr(struct btrfs_trans_handle *trans, struct inode *inode,</div><div class='ctx'> 		if (old_data_len + name_len + sizeof(*di) == item_size) {</div><div class='ctx'> 			/* No other xattrs packed in the same leaf item. */</div><div class='ctx'> 			if (size &gt; old_data_len)</div><div class='del'>-				btrfs_extend_item(path, size - old_data_len);</div><div class='add'>+				btrfs_extend_item(trans, path, size - old_data_len);</div><div class='ctx'> 			else if (size &lt; old_data_len)</div><div class='del'>-				btrfs_truncate_item(path, data_size, 1);</div><div class='add'>+				btrfs_truncate_item(trans, path, data_size, 1);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			/* There are other xattrs packed in the same item. */</div><div class='ctx'> 			ret = btrfs_delete_one_dir_name(trans, root, path, di);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				goto out;</div><div class='del'>-			btrfs_extend_item(path, data_size);</div><div class='add'>+			btrfs_extend_item(trans, path, data_size);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		item = btrfs_item_nr(slot);</div><div class='ctx'> 		ptr = btrfs_item_ptr(leaf, slot, char);</div><div class='del'>-		ptr += btrfs_item_size(leaf, item) - data_size;</div><div class='add'>+		ptr += btrfs_item_size(leaf, slot) - data_size;</div><div class='ctx'> 		di = (struct btrfs_dir_item *)ptr;</div><div class='ctx'> 		btrfs_set_dir_data_len(leaf, di, size);</div><div class='ctx'> 		data_ptr = ((unsigned long)(di + 1)) + name_len;</div><div class='ctx'> 		write_extent_buffer(leaf, value, data_ptr, size);</div><div class='del'>-		btrfs_mark_buffer_dirty(leaf);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Insert, and we had space for the xattr, so path-&gt;slots[0] is</div><div class='hunk'>@@ -212,7 +200,6 @@ int btrfs_setxattr(struct btrfs_trans_handle *trans, struct inode *inode,</div><div class='ctx'> 		 */</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='ctx'> 	if (!ret) {</div><div class='ctx'> 		set_bit(BTRFS_INODE_COPY_EVERYTHING,</div><div class='ctx'> 			&amp;BTRFS_I(inode)-&gt;runtime_flags);</div><div class='hunk'>@@ -262,9 +249,10 @@ int btrfs_setxattr_trans(struct inode *inode, const char *name,</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	inode_inc_iversion(inode);</div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='del'>-	ret = btrfs_update_inode(trans, root, BTRFS_I(inode));</div><div class='del'>-	BUG_ON(ret);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='add'>+	ret = btrfs_update_inode(trans, BTRFS_I(inode));</div><div class='add'>+	if (ret)</div><div class='add'>+		btrfs_abort_transaction(trans, ret);</div><div class='ctx'> out:</div><div class='ctx'> 	if (start_trans)</div><div class='ctx'> 		btrfs_end_transaction(trans);</div><div class='hunk'>@@ -273,10 +261,12 @@ out:</div><div class='ctx'> </div><div class='ctx'> ssize_t btrfs_listxattr(struct dentry *dentry, char *buffer, size_t size)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_key found_key;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='add'>+	int iter_ret = 0;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	size_t total_size = 0, size_left = size;</div><div class='ctx'> </div><div class='hunk'>@@ -295,47 +285,26 @@ ssize_t btrfs_listxattr(struct dentry *dentry, char *buffer, size_t size)</div><div class='ctx'> 	path-&gt;reada = READA_FORWARD;</div><div class='ctx'> </div><div class='ctx'> 	/* search for our xattrs */</div><div class='del'>-	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto err;</div><div class='del'>-</div><div class='del'>-	while (1) {</div><div class='add'>+	btrfs_for_each_slot(root, &amp;key, &amp;found_key, path, iter_ret) {</div><div class='ctx'> 		struct extent_buffer *leaf;</div><div class='ctx'> 		int slot;</div><div class='ctx'> 		struct btrfs_dir_item *di;</div><div class='del'>-		struct btrfs_key found_key;</div><div class='ctx'> 		u32 item_size;</div><div class='ctx'> 		u32 cur;</div><div class='ctx'> </div><div class='ctx'> 		leaf = path-&gt;nodes[0];</div><div class='ctx'> 		slot = path-&gt;slots[0];</div><div class='ctx'> </div><div class='del'>-		/* this is where we start walking through the path */</div><div class='del'>-		if (slot &gt;= btrfs_header_nritems(leaf)) {</div><div class='del'>-			/*</div><div class='del'>-			 * if we've reached the last slot in this leaf we need</div><div class='del'>-			 * to go to the next leaf and reset everything</div><div class='del'>-			 */</div><div class='del'>-			ret = btrfs_next_leaf(root, path);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto err;</div><div class='del'>-			else if (ret &gt; 0)</div><div class='del'>-				break;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		btrfs_item_key_to_cpu(leaf, &amp;found_key, slot);</div><div class='del'>-</div><div class='ctx'> 		/* check to make sure this item is what we want */</div><div class='ctx'> 		if (found_key.objectid != key.objectid)</div><div class='ctx'> 			break;</div><div class='ctx'> 		if (found_key.type &gt; BTRFS_XATTR_ITEM_KEY)</div><div class='ctx'> 			break;</div><div class='ctx'> 		if (found_key.type &lt; BTRFS_XATTR_ITEM_KEY)</div><div class='del'>-			goto next_item;</div><div class='add'>+			continue;</div><div class='ctx'> </div><div class='ctx'> 		di = btrfs_item_ptr(leaf, slot, struct btrfs_dir_item);</div><div class='del'>-		item_size = btrfs_item_size_nr(leaf, slot);</div><div class='add'>+		item_size = btrfs_item_size(leaf, slot);</div><div class='ctx'> 		cur = 0;</div><div class='ctx'> 		while (cur &lt; item_size) {</div><div class='ctx'> 			u16 name_len = btrfs_dir_name_len(leaf, di);</div><div class='hunk'>@@ -352,8 +321,8 @@ ssize_t btrfs_listxattr(struct dentry *dentry, char *buffer, size_t size)</div><div class='ctx'> 				goto next;</div><div class='ctx'> </div><div class='ctx'> 			if (!buffer || (name_len + 1) &gt; size_left) {</div><div class='del'>-				ret = -ERANGE;</div><div class='del'>-				goto err;</div><div class='add'>+			        iter_ret = -ERANGE;</div><div class='add'>+				break;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			read_extent_buffer(leaf, buffer, name_ptr, name_len);</div><div class='hunk'>@@ -365,13 +334,12 @@ next:</div><div class='ctx'> 			cur += this_len;</div><div class='ctx'> 			di = (struct btrfs_dir_item *)((char *)di + this_len);</div><div class='ctx'> 		}</div><div class='del'>-next_item:</div><div class='del'>-		path-&gt;slots[0]++;</div><div class='ctx'> 	}</div><div class='del'>-	ret = total_size;</div><div class='ctx'> </div><div class='del'>-err:</div><div class='del'>-	btrfs_free_path(path);</div><div class='add'>+	if (iter_ret &lt; 0)</div><div class='add'>+		ret = iter_ret;</div><div class='add'>+	else</div><div class='add'>+		ret = total_size;</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -385,17 +353,67 @@ static int btrfs_xattr_handler_get(const struct xattr_handler *handler,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int btrfs_xattr_handler_set(const struct xattr_handler *handler,</div><div class='del'>-				   struct user_namespace *mnt_userns,</div><div class='add'>+				   struct mnt_idmap *idmap,</div><div class='ctx'> 				   struct dentry *unused, struct inode *inode,</div><div class='ctx'> 				   const char *name, const void *buffer,</div><div class='ctx'> 				   size_t size, int flags)</div><div class='ctx'> {</div><div class='add'>+	if (btrfs_root_readonly(BTRFS_I(inode)-&gt;root))</div><div class='add'>+		return -EROFS;</div><div class='add'>+</div><div class='ctx'> 	name = xattr_full_name(handler, name);</div><div class='ctx'> 	return btrfs_setxattr_trans(inode, name, buffer, size, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int btrfs_xattr_handler_get_security(const struct xattr_handler *handler,</div><div class='add'>+					    struct dentry *unused,</div><div class='add'>+					    struct inode *inode,</div><div class='add'>+					    const char *name, void *buffer,</div><div class='add'>+					    size_t size)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+	bool is_cap = false;</div><div class='add'>+</div><div class='add'>+	name = xattr_full_name(handler, name);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * security.capability doesn't cache the results, so calls into us</div><div class='add'>+	 * constantly to see if there's a capability xattr.  Cache the result</div><div class='add'>+	 * here in order to avoid wasting time doing lookups for xattrs we know</div><div class='add'>+	 * don't exist.</div><div class='add'>+	 */</div><div class='add'>+	if (strcmp(name, XATTR_NAME_CAPS) == 0) {</div><div class='add'>+		is_cap = true;</div><div class='add'>+		if (test_bit(BTRFS_INODE_NO_CAP_XATTR, &amp;BTRFS_I(inode)-&gt;runtime_flags))</div><div class='add'>+			return -ENODATA;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = btrfs_getxattr(inode, name, buffer, size);</div><div class='add'>+	if (ret == -ENODATA &amp;&amp; is_cap)</div><div class='add'>+		set_bit(BTRFS_INODE_NO_CAP_XATTR, &amp;BTRFS_I(inode)-&gt;runtime_flags);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int btrfs_xattr_handler_set_security(const struct xattr_handler *handler,</div><div class='add'>+					    struct mnt_idmap *idmap,</div><div class='add'>+					    struct dentry *unused,</div><div class='add'>+					    struct inode *inode,</div><div class='add'>+					    const char *name,</div><div class='add'>+					    const void *buffer,</div><div class='add'>+					    size_t size, int flags)</div><div class='add'>+{</div><div class='add'>+	if (btrfs_root_readonly(BTRFS_I(inode)-&gt;root))</div><div class='add'>+		return -EROFS;</div><div class='add'>+</div><div class='add'>+	name = xattr_full_name(handler, name);</div><div class='add'>+	if (strcmp(name, XATTR_NAME_CAPS) == 0)</div><div class='add'>+		clear_bit(BTRFS_INODE_NO_CAP_XATTR, &amp;BTRFS_I(inode)-&gt;runtime_flags);</div><div class='add'>+</div><div class='add'>+	return btrfs_setxattr_trans(inode, name, buffer, size, flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int btrfs_xattr_handler_set_prop(const struct xattr_handler *handler,</div><div class='del'>-					struct user_namespace *mnt_userns,</div><div class='add'>+					struct mnt_idmap *idmap,</div><div class='ctx'> 					struct dentry *unused, struct inode *inode,</div><div class='ctx'> 					const char *name, const void *value,</div><div class='ctx'> 					size_t size, int flags)</div><div class='hunk'>@@ -405,20 +423,24 @@ static int btrfs_xattr_handler_set_prop(const struct xattr_handler *handler,</div><div class='ctx'> 	struct btrfs_root *root = BTRFS_I(inode)-&gt;root;</div><div class='ctx'> </div><div class='ctx'> 	name = xattr_full_name(handler, name);</div><div class='del'>-	ret = btrfs_validate_prop(name, value, size);</div><div class='add'>+	ret = btrfs_validate_prop(BTRFS_I(inode), name, value, size);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='add'>+	if (btrfs_ignore_prop(BTRFS_I(inode), name))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='ctx'> 	trans = btrfs_start_transaction(root, 2);</div><div class='ctx'> 	if (IS_ERR(trans))</div><div class='ctx'> 		return PTR_ERR(trans);</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_set_prop(trans, inode, name, value, size, flags);</div><div class='add'>+	ret = btrfs_set_prop(trans, BTRFS_I(inode), name, value, size, flags);</div><div class='ctx'> 	if (!ret) {</div><div class='ctx'> 		inode_inc_iversion(inode);</div><div class='del'>-		inode-&gt;i_ctime = current_time(inode);</div><div class='del'>-		ret = btrfs_update_inode(trans, root, BTRFS_I(inode));</div><div class='del'>-		BUG_ON(ret);</div><div class='add'>+		inode_set_ctime_current(inode);</div><div class='add'>+		ret = btrfs_update_inode(trans, BTRFS_I(inode));</div><div class='add'>+		if (ret)</div><div class='add'>+			btrfs_abort_transaction(trans, ret);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	btrfs_end_transaction(trans);</div><div class='hunk'>@@ -428,8 +450,8 @@ static int btrfs_xattr_handler_set_prop(const struct xattr_handler *handler,</div><div class='ctx'> </div><div class='ctx'> static const struct xattr_handler btrfs_security_xattr_handler = {</div><div class='ctx'> 	.prefix = XATTR_SECURITY_PREFIX,</div><div class='del'>-	.get = btrfs_xattr_handler_get,</div><div class='del'>-	.set = btrfs_xattr_handler_set,</div><div class='add'>+	.get = btrfs_xattr_handler_get_security,</div><div class='add'>+	.set = btrfs_xattr_handler_set_security,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct xattr_handler btrfs_trusted_xattr_handler = {</div><div class='hunk'>@@ -450,12 +472,8 @@ static const struct xattr_handler btrfs_btrfs_xattr_handler = {</div><div class='ctx'> 	.set = btrfs_xattr_handler_set_prop,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-const struct xattr_handler *btrfs_xattr_handlers[] = {</div><div class='add'>+const struct xattr_handler * const btrfs_xattr_handlers[] = {</div><div class='ctx'> 	&amp;btrfs_security_xattr_handler,</div><div class='del'>-#ifdef CONFIG_BTRFS_FS_POSIX_ACL</div><div class='del'>-	&amp;posix_acl_access_xattr_handler,</div><div class='del'>-	&amp;posix_acl_default_xattr_handler,</div><div class='del'>-#endif</div><div class='ctx'> 	&amp;btrfs_trusted_xattr_handler,</div><div class='ctx'> 	&amp;btrfs_user_xattr_handler,</div><div class='ctx'> 	&amp;btrfs_btrfs_xattr_handler,</div><div class='hunk'>@@ -469,7 +487,7 @@ static int btrfs_initxattrs(struct inode *inode,</div><div class='ctx'> 	const struct xattr *xattr;</div><div class='ctx'> 	unsigned int nofs_flag;</div><div class='ctx'> 	char *name;</div><div class='del'>-	int err = 0;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We're holding a transaction handle, so use a NOFS memory allocation</div><div class='hunk'>@@ -477,22 +495,27 @@ static int btrfs_initxattrs(struct inode *inode,</div><div class='ctx'> 	 */</div><div class='ctx'> 	nofs_flag = memalloc_nofs_save();</div><div class='ctx'> 	for (xattr = xattr_array; xattr-&gt;name != NULL; xattr++) {</div><div class='del'>-		name = kmalloc(XATTR_SECURITY_PREFIX_LEN +</div><div class='del'>-			       strlen(xattr-&gt;name) + 1, GFP_KERNEL);</div><div class='add'>+		const size_t name_len = XATTR_SECURITY_PREFIX_LEN +</div><div class='add'>+					strlen(xattr-&gt;name) + 1;</div><div class='add'>+</div><div class='add'>+		name = kmalloc(name_len, GFP_KERNEL);</div><div class='ctx'> 		if (!name) {</div><div class='del'>-			err = -ENOMEM;</div><div class='add'>+			ret = -ENOMEM;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-		strcpy(name, XATTR_SECURITY_PREFIX);</div><div class='del'>-		strcpy(name + XATTR_SECURITY_PREFIX_LEN, xattr-&gt;name);</div><div class='del'>-		err = btrfs_setxattr(trans, inode, name, xattr-&gt;value,</div><div class='add'>+		scnprintf(name, name_len, "%s%s", XATTR_SECURITY_PREFIX, xattr-&gt;name);</div><div class='add'>+</div><div class='add'>+		if (strcmp(name, XATTR_NAME_CAPS) == 0)</div><div class='add'>+			clear_bit(BTRFS_INODE_NO_CAP_XATTR, &amp;BTRFS_I(inode)-&gt;runtime_flags);</div><div class='add'>+</div><div class='add'>+		ret = btrfs_setxattr(trans, inode, name, xattr-&gt;value,</div><div class='ctx'> 				     xattr-&gt;value_len, 0);</div><div class='ctx'> 		kfree(name);</div><div class='del'>-		if (err &lt; 0)</div><div class='add'>+		if (ret &lt; 0)</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='ctx'> 	memalloc_nofs_restore(nofs_flag);</div><div class='del'>-	return err;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_xattr_security_init(struct btrfs_trans_handle *trans,</div><div class='head'>diff --git a/fs/btrfs/xattr.h b/fs/btrfs/xattr.h<br/>index 1cd3fc0a8f17..0ce10e4ec836 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/xattr.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/xattr.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/xattr.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/xattr.h</a></div><div class='hunk'>@@ -6,11 +6,17 @@</div><div class='ctx'> #ifndef BTRFS_XATTR_H</div><div class='ctx'> #define BTRFS_XATTR_H</div><div class='ctx'> </div><div class='del'>-#include &lt;linux/xattr.h&gt;</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='ctx'> </div><div class='del'>-extern const struct xattr_handler *btrfs_xattr_handlers[];</div><div class='add'>+struct dentry;</div><div class='add'>+struct inode;</div><div class='add'>+struct qstr;</div><div class='add'>+struct xattr_handler;</div><div class='add'>+struct btrfs_trans_handle;</div><div class='ctx'> </div><div class='del'>-int btrfs_getxattr(struct inode *inode, const char *name,</div><div class='add'>+extern const struct xattr_handler * const btrfs_xattr_handlers[];</div><div class='add'>+</div><div class='add'>+int btrfs_getxattr(const struct inode *inode, const char *name,</div><div class='ctx'> 		void *buffer, size_t size);</div><div class='ctx'> int btrfs_setxattr(struct btrfs_trans_handle *trans, struct inode *inode,</div><div class='ctx'> 		   const char *name, const void *value, size_t size, int flags);</div><div class='head'>diff --git a/fs/btrfs/zlib.c b/fs/btrfs/zlib.c<br/>index 767a0c6c9694..6caba8be7c84 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/zlib.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/zlib.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/zlib.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/zlib.c</a></div><div class='hunk'>@@ -18,7 +18,10 @@</div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='ctx'> #include &lt;linux/bio.h&gt;</div><div class='ctx'> #include &lt;linux/refcount.h&gt;</div><div class='add'>+#include "btrfs_inode.h"</div><div class='ctx'> #include "compression.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "subpage.h"</div><div class='ctx'> </div><div class='ctx'> /* workspace buffer size for s390 zlib hardware support */</div><div class='ctx'> #define ZLIB_DFLTCC_BUF_SIZE    (4 * PAGE_SIZE)</div><div class='hunk'>@@ -31,11 +34,9 @@ struct workspace {</div><div class='ctx'> 	int level;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static struct workspace_manager wsm;</div><div class='del'>-</div><div class='del'>-struct list_head *zlib_get_workspace(unsigned int level)</div><div class='add'>+struct list_head *zlib_get_workspace(struct btrfs_fs_info *fs_info, unsigned int level)</div><div class='ctx'> {</div><div class='del'>-	struct list_head *ws = btrfs_get_workspace(BTRFS_COMPRESS_ZLIB, level);</div><div class='add'>+	struct list_head *ws = btrfs_get_workspace(fs_info, BTRFS_COMPRESS_ZLIB, level);</div><div class='ctx'> 	struct workspace *workspace = list_entry(ws, struct workspace, list);</div><div class='ctx'> </div><div class='ctx'> 	workspace-&gt;level = level;</div><div class='hunk'>@@ -52,8 +53,25 @@ void zlib_free_workspace(struct list_head *ws)</div><div class='ctx'> 	kfree(workspace);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct list_head *zlib_alloc_workspace(unsigned int level)</div><div class='add'>+/*</div><div class='add'>+ * For s390 hardware acceleration, the buffer size should be at least</div><div class='add'>+ * ZLIB_DFLTCC_BUF_SIZE to achieve the best performance.</div><div class='add'>+ *</div><div class='add'>+ * But if bs &gt; ps we can have large enough folios that meet the s390 hardware</div><div class='add'>+ * handling.</div><div class='add'>+ */</div><div class='add'>+static bool need_special_buffer(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	if (!zlib_deflate_dfltcc_enabled())</div><div class='add'>+		return false;</div><div class='add'>+	if (btrfs_min_folio_size(fs_info) &gt;= ZLIB_DFLTCC_BUF_SIZE)</div><div class='add'>+		return false;</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct list_head *zlib_alloc_workspace(struct btrfs_fs_info *fs_info, unsigned int level)</div><div class='ctx'> {</div><div class='add'>+	const u32 blocksize = fs_info-&gt;sectorsize;</div><div class='ctx'> 	struct workspace *workspace;</div><div class='ctx'> 	int workspacesize;</div><div class='ctx'> </div><div class='hunk'>@@ -63,22 +81,18 @@ struct list_head *zlib_alloc_workspace(unsigned int level)</div><div class='ctx'> </div><div class='ctx'> 	workspacesize = max(zlib_deflate_workspacesize(MAX_WBITS, MAX_MEM_LEVEL),</div><div class='ctx'> 			zlib_inflate_workspacesize());</div><div class='del'>-	workspace-&gt;strm.workspace = kvmalloc(workspacesize, GFP_KERNEL);</div><div class='add'>+	workspace-&gt;strm.workspace = kvzalloc(workspacesize, GFP_KERNEL | __GFP_NOWARN);</div><div class='ctx'> 	workspace-&gt;level = level;</div><div class='ctx'> 	workspace-&gt;buf = NULL;</div><div class='del'>-	/*</div><div class='del'>-	 * In case of s390 zlib hardware support, allocate lager workspace</div><div class='del'>-	 * buffer. If allocator fails, fall back to a single page buffer.</div><div class='del'>-	 */</div><div class='del'>-	if (zlib_deflate_dfltcc_enabled()) {</div><div class='add'>+	if (need_special_buffer(fs_info)) {</div><div class='ctx'> 		workspace-&gt;buf = kmalloc(ZLIB_DFLTCC_BUF_SIZE,</div><div class='ctx'> 					 __GFP_NOMEMALLOC | __GFP_NORETRY |</div><div class='ctx'> 					 __GFP_NOWARN | GFP_NOIO);</div><div class='ctx'> 		workspace-&gt;buf_size = ZLIB_DFLTCC_BUF_SIZE;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!workspace-&gt;buf) {</div><div class='del'>-		workspace-&gt;buf = kmalloc(PAGE_SIZE, GFP_KERNEL);</div><div class='del'>-		workspace-&gt;buf_size = PAGE_SIZE;</div><div class='add'>+		workspace-&gt;buf = kmalloc(blocksize, GFP_KERNEL);</div><div class='add'>+		workspace-&gt;buf_size = blocksize;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!workspace-&gt;strm.workspace || !workspace-&gt;buf)</div><div class='ctx'> 		goto fail;</div><div class='hunk'>@@ -91,29 +105,75 @@ fail:</div><div class='ctx'> 	return ERR_PTR(-ENOMEM);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int zlib_compress_pages(struct list_head *ws, struct address_space *mapping,</div><div class='del'>-		u64 start, struct page **pages, unsigned long *out_pages,</div><div class='del'>-		unsigned long *total_in, unsigned long *total_out)</div><div class='add'>+/*</div><div class='add'>+ * Helper for S390x with hardware zlib compression support.</div><div class='add'>+ *</div><div class='add'>+ * That hardware acceleration requires a buffer size larger than a single page</div><div class='add'>+ * to get ideal performance, thus we need to do the memory copy rather than</div><div class='add'>+ * use the page cache directly as input buffer.</div><div class='add'>+ */</div><div class='add'>+static int copy_data_into_buffer(struct address_space *mapping,</div><div class='add'>+				 struct workspace *workspace, u64 filepos,</div><div class='add'>+				 unsigned long length)</div><div class='add'>+{</div><div class='add'>+	u64 cur = filepos;</div><div class='add'>+</div><div class='add'>+	/* It's only for hardware accelerated zlib code. */</div><div class='add'>+	ASSERT(zlib_deflate_dfltcc_enabled());</div><div class='add'>+</div><div class='add'>+	while (cur &lt; filepos + length) {</div><div class='add'>+		struct folio *folio;</div><div class='add'>+		void *data_in;</div><div class='add'>+		unsigned int offset;</div><div class='add'>+		unsigned long copy_length;</div><div class='add'>+		int ret;</div><div class='add'>+</div><div class='add'>+		ret = btrfs_compress_filemap_get_folio(mapping, cur, &amp;folio);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='add'>+</div><div class='add'>+		offset = offset_in_folio(folio, cur);</div><div class='add'>+		copy_length = min(folio_size(folio) - offset,</div><div class='add'>+				  filepos + length - cur);</div><div class='add'>+</div><div class='add'>+		data_in = kmap_local_folio(folio, offset);</div><div class='add'>+		memcpy(workspace-&gt;buf + cur - filepos, data_in, copy_length);</div><div class='add'>+		kunmap_local(data_in);</div><div class='add'>+		cur += copy_length;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int zlib_compress_folios(struct list_head *ws, struct btrfs_inode *inode,</div><div class='add'>+			 u64 start, struct folio **folios, unsigned long *out_folios,</div><div class='add'>+			 unsigned long *total_in, unsigned long *total_out)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='ctx'> 	struct workspace *workspace = list_entry(ws, struct workspace, list);</div><div class='add'>+	struct address_space *mapping = inode-&gt;vfs_inode.i_mapping;</div><div class='add'>+	const u32 min_folio_shift = PAGE_SHIFT + fs_info-&gt;block_min_order;</div><div class='add'>+	const u32 min_folio_size = btrfs_min_folio_size(fs_info);</div><div class='ctx'> 	int ret;</div><div class='del'>-	char *data_in;</div><div class='del'>-	char *cpage_out;</div><div class='del'>-	int nr_pages = 0;</div><div class='del'>-	struct page *in_page = NULL;</div><div class='del'>-	struct page *out_page = NULL;</div><div class='del'>-	unsigned long bytes_left;</div><div class='del'>-	unsigned int in_buf_pages;</div><div class='add'>+	char *data_in = NULL;</div><div class='add'>+	char *cfolio_out;</div><div class='add'>+	int nr_folios = 0;</div><div class='add'>+	struct folio *in_folio = NULL;</div><div class='add'>+	struct folio *out_folio = NULL;</div><div class='ctx'> 	unsigned long len = *total_out;</div><div class='del'>-	unsigned long nr_dest_pages = *out_pages;</div><div class='del'>-	const unsigned long max_out = nr_dest_pages * PAGE_SIZE;</div><div class='add'>+	unsigned long nr_dest_folios = *out_folios;</div><div class='add'>+	const unsigned long max_out = nr_dest_folios &lt;&lt; min_folio_shift;</div><div class='add'>+	const u32 blocksize = fs_info-&gt;sectorsize;</div><div class='add'>+	const u64 orig_end = start + len;</div><div class='ctx'> </div><div class='del'>-	*out_pages = 0;</div><div class='add'>+	*out_folios = 0;</div><div class='ctx'> 	*total_out = 0;</div><div class='ctx'> 	*total_in = 0;</div><div class='ctx'> </div><div class='del'>-	if (Z_OK != zlib_deflateInit(&amp;workspace-&gt;strm, workspace-&gt;level)) {</div><div class='del'>-		pr_warn("BTRFS: deflateInit failed\n");</div><div class='add'>+	ret = zlib_deflateInit(&amp;workspace-&gt;strm, workspace-&gt;level);</div><div class='add'>+	if (unlikely(ret != Z_OK)) {</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+	"zlib compression init failed, error %d root %llu inode %llu offset %llu",</div><div class='add'>+			  ret, btrfs_root_id(inode-&gt;root), btrfs_ino(inode), start);</div><div class='ctx'> 		ret = -EIO;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -121,19 +181,19 @@ int zlib_compress_pages(struct list_head *ws, struct address_space *mapping,</div><div class='ctx'> 	workspace-&gt;strm.total_in = 0;</div><div class='ctx'> 	workspace-&gt;strm.total_out = 0;</div><div class='ctx'> </div><div class='del'>-	out_page = alloc_page(GFP_NOFS);</div><div class='del'>-	if (out_page == NULL) {</div><div class='add'>+	out_folio = btrfs_alloc_compr_folio(fs_info);</div><div class='add'>+	if (out_folio == NULL) {</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	cpage_out = kmap(out_page);</div><div class='del'>-	pages[0] = out_page;</div><div class='del'>-	nr_pages = 1;</div><div class='add'>+	cfolio_out = folio_address(out_folio);</div><div class='add'>+	folios[0] = out_folio;</div><div class='add'>+	nr_folios = 1;</div><div class='ctx'> </div><div class='ctx'> 	workspace-&gt;strm.next_in = workspace-&gt;buf;</div><div class='ctx'> 	workspace-&gt;strm.avail_in = 0;</div><div class='del'>-	workspace-&gt;strm.next_out = cpage_out;</div><div class='del'>-	workspace-&gt;strm.avail_out = PAGE_SIZE;</div><div class='add'>+	workspace-&gt;strm.next_out = cfolio_out;</div><div class='add'>+	workspace-&gt;strm.avail_out = min_folio_size;</div><div class='ctx'> </div><div class='ctx'> 	while (workspace-&gt;strm.total_in &lt; len) {</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -141,51 +201,56 @@ int zlib_compress_pages(struct list_head *ws, struct address_space *mapping,</div><div class='ctx'> 		 * the workspace buffer if required.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (workspace-&gt;strm.avail_in == 0) {</div><div class='del'>-			bytes_left = len - workspace-&gt;strm.total_in;</div><div class='del'>-			in_buf_pages = min(DIV_ROUND_UP(bytes_left, PAGE_SIZE),</div><div class='del'>-					   workspace-&gt;buf_size / PAGE_SIZE);</div><div class='del'>-			if (in_buf_pages &gt; 1) {</div><div class='del'>-				int i;</div><div class='del'>-</div><div class='del'>-				for (i = 0; i &lt; in_buf_pages; i++) {</div><div class='del'>-					if (in_page) {</div><div class='del'>-						kunmap(in_page);</div><div class='del'>-						put_page(in_page);</div><div class='del'>-					}</div><div class='del'>-					in_page = find_get_page(mapping,</div><div class='del'>-								start &gt;&gt; PAGE_SHIFT);</div><div class='del'>-					data_in = kmap(in_page);</div><div class='del'>-					memcpy(workspace-&gt;buf + i * PAGE_SIZE,</div><div class='del'>-					       data_in, PAGE_SIZE);</div><div class='del'>-					start += PAGE_SIZE;</div><div class='del'>-				}</div><div class='add'>+			unsigned long bytes_left = len - workspace-&gt;strm.total_in;</div><div class='add'>+			unsigned int copy_length = min(bytes_left, workspace-&gt;buf_size);</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * For s390 hardware accelerated zlib, and our folio is smaller</div><div class='add'>+			 * than the copy_length, we need to fill the buffer so that</div><div class='add'>+			 * we can take full advantage of hardware acceleration.</div><div class='add'>+			 */</div><div class='add'>+			if (need_special_buffer(fs_info)) {</div><div class='add'>+				ret = copy_data_into_buffer(mapping, workspace,</div><div class='add'>+							    start, copy_length);</div><div class='add'>+				if (ret &lt; 0)</div><div class='add'>+					goto out;</div><div class='add'>+				start += copy_length;</div><div class='ctx'> 				workspace-&gt;strm.next_in = workspace-&gt;buf;</div><div class='add'>+				workspace-&gt;strm.avail_in = copy_length;</div><div class='ctx'> 			} else {</div><div class='del'>-				if (in_page) {</div><div class='del'>-					kunmap(in_page);</div><div class='del'>-					put_page(in_page);</div><div class='add'>+				unsigned int cur_len;</div><div class='add'>+</div><div class='add'>+				if (data_in) {</div><div class='add'>+					kunmap_local(data_in);</div><div class='add'>+					folio_put(in_folio);</div><div class='add'>+					data_in = NULL;</div><div class='ctx'> 				}</div><div class='del'>-				in_page = find_get_page(mapping,</div><div class='del'>-							start &gt;&gt; PAGE_SHIFT);</div><div class='del'>-				data_in = kmap(in_page);</div><div class='del'>-				start += PAGE_SIZE;</div><div class='add'>+				ret = btrfs_compress_filemap_get_folio(mapping,</div><div class='add'>+						start, &amp;in_folio);</div><div class='add'>+				if (ret &lt; 0)</div><div class='add'>+					goto out;</div><div class='add'>+				cur_len = btrfs_calc_input_length(in_folio, orig_end, start);</div><div class='add'>+				data_in = kmap_local_folio(in_folio,</div><div class='add'>+							   offset_in_folio(in_folio, start));</div><div class='add'>+				start += cur_len;</div><div class='ctx'> 				workspace-&gt;strm.next_in = data_in;</div><div class='add'>+				workspace-&gt;strm.avail_in = cur_len;</div><div class='ctx'> 			}</div><div class='del'>-			workspace-&gt;strm.avail_in = min(bytes_left,</div><div class='del'>-						       (unsigned long) workspace-&gt;buf_size);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		ret = zlib_deflate(&amp;workspace-&gt;strm, Z_SYNC_FLUSH);</div><div class='del'>-		if (ret != Z_OK) {</div><div class='del'>-			pr_debug("BTRFS: deflate in loop returned %d\n",</div><div class='del'>-			       ret);</div><div class='add'>+		if (unlikely(ret != Z_OK)) {</div><div class='add'>+			btrfs_warn(fs_info,</div><div class='add'>+		"zlib compression failed, error %d root %llu inode %llu offset %llu",</div><div class='add'>+				   ret, btrfs_root_id(inode-&gt;root), btrfs_ino(inode),</div><div class='add'>+				   start);</div><div class='ctx'> 			zlib_deflateEnd(&amp;workspace-&gt;strm);</div><div class='ctx'> 			ret = -EIO;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* we're making it bigger, give up */</div><div class='del'>-		if (workspace-&gt;strm.total_in &gt; 8192 &amp;&amp;</div><div class='add'>+		if (workspace-&gt;strm.total_in &gt; blocksize * 2 &amp;&amp;</div><div class='ctx'> 		    workspace-&gt;strm.total_in &lt;</div><div class='ctx'> 		    workspace-&gt;strm.total_out) {</div><div class='ctx'> 			ret = -E2BIG;</div><div class='hunk'>@@ -196,22 +261,20 @@ int zlib_compress_pages(struct list_head *ws, struct address_space *mapping,</div><div class='ctx'> 		 * the stream end if required</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (workspace-&gt;strm.avail_out == 0) {</div><div class='del'>-			kunmap(out_page);</div><div class='del'>-			if (nr_pages == nr_dest_pages) {</div><div class='del'>-				out_page = NULL;</div><div class='add'>+			if (nr_folios == nr_dest_folios) {</div><div class='ctx'> 				ret = -E2BIG;</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='del'>-			out_page = alloc_page(GFP_NOFS);</div><div class='del'>-			if (out_page == NULL) {</div><div class='add'>+			out_folio = btrfs_alloc_compr_folio(fs_info);</div><div class='add'>+			if (out_folio == NULL) {</div><div class='ctx'> 				ret = -ENOMEM;</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='del'>-			cpage_out = kmap(out_page);</div><div class='del'>-			pages[nr_pages] = out_page;</div><div class='del'>-			nr_pages++;</div><div class='del'>-			workspace-&gt;strm.avail_out = PAGE_SIZE;</div><div class='del'>-			workspace-&gt;strm.next_out = cpage_out;</div><div class='add'>+			cfolio_out = folio_address(out_folio);</div><div class='add'>+			folios[nr_folios] = out_folio;</div><div class='add'>+			nr_folios++;</div><div class='add'>+			workspace-&gt;strm.avail_out = min_folio_size;</div><div class='add'>+			workspace-&gt;strm.next_out = cfolio_out;</div><div class='ctx'> 		}</div><div class='ctx'> 		/* we're all done */</div><div class='ctx'> 		if (workspace-&gt;strm.total_in &gt;= len)</div><div class='hunk'>@@ -228,28 +291,26 @@ int zlib_compress_pages(struct list_head *ws, struct address_space *mapping,</div><div class='ctx'> 		ret = zlib_deflate(&amp;workspace-&gt;strm, Z_FINISH);</div><div class='ctx'> 		if (ret == Z_STREAM_END)</div><div class='ctx'> 			break;</div><div class='del'>-		if (ret != Z_OK &amp;&amp; ret != Z_BUF_ERROR) {</div><div class='add'>+		if (unlikely(ret != Z_OK &amp;&amp; ret != Z_BUF_ERROR)) {</div><div class='ctx'> 			zlib_deflateEnd(&amp;workspace-&gt;strm);</div><div class='ctx'> 			ret = -EIO;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		} else if (workspace-&gt;strm.avail_out == 0) {</div><div class='del'>-			/* get another page for the stream end */</div><div class='del'>-			kunmap(out_page);</div><div class='del'>-			if (nr_pages == nr_dest_pages) {</div><div class='del'>-				out_page = NULL;</div><div class='add'>+			/* Get another folio for the stream end. */</div><div class='add'>+			if (nr_folios == nr_dest_folios) {</div><div class='ctx'> 				ret = -E2BIG;</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='del'>-			out_page = alloc_page(GFP_NOFS);</div><div class='del'>-			if (out_page == NULL) {</div><div class='add'>+			out_folio = btrfs_alloc_compr_folio(fs_info);</div><div class='add'>+			if (out_folio == NULL) {</div><div class='ctx'> 				ret = -ENOMEM;</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='del'>-			cpage_out = kmap(out_page);</div><div class='del'>-			pages[nr_pages] = out_page;</div><div class='del'>-			nr_pages++;</div><div class='del'>-			workspace-&gt;strm.avail_out = PAGE_SIZE;</div><div class='del'>-			workspace-&gt;strm.next_out = cpage_out;</div><div class='add'>+			cfolio_out = folio_address(out_folio);</div><div class='add'>+			folios[nr_folios] = out_folio;</div><div class='add'>+			nr_folios++;</div><div class='add'>+			workspace-&gt;strm.avail_out = min_folio_size;</div><div class='add'>+			workspace-&gt;strm.next_out = cfolio_out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	zlib_deflateEnd(&amp;workspace-&gt;strm);</div><div class='hunk'>@@ -263,33 +324,33 @@ int zlib_compress_pages(struct list_head *ws, struct address_space *mapping,</div><div class='ctx'> 	*total_out = workspace-&gt;strm.total_out;</div><div class='ctx'> 	*total_in = workspace-&gt;strm.total_in;</div><div class='ctx'> out:</div><div class='del'>-	*out_pages = nr_pages;</div><div class='del'>-	if (out_page)</div><div class='del'>-		kunmap(out_page);</div><div class='del'>-</div><div class='del'>-	if (in_page) {</div><div class='del'>-		kunmap(in_page);</div><div class='del'>-		put_page(in_page);</div><div class='add'>+	*out_folios = nr_folios;</div><div class='add'>+	if (data_in) {</div><div class='add'>+		kunmap_local(data_in);</div><div class='add'>+		folio_put(in_folio);</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int zlib_decompress_bio(struct list_head *ws, struct compressed_bio *cb)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = cb_to_fs_info(cb);</div><div class='ctx'> 	struct workspace *workspace = list_entry(ws, struct workspace, list);</div><div class='add'>+	const u32 min_folio_size = btrfs_min_folio_size(fs_info);</div><div class='ctx'> 	int ret = 0, ret2;</div><div class='ctx'> 	int wbits = MAX_WBITS;</div><div class='ctx'> 	char *data_in;</div><div class='ctx'> 	size_t total_out = 0;</div><div class='del'>-	unsigned long page_in_index = 0;</div><div class='add'>+	unsigned long folio_in_index = 0;</div><div class='ctx'> 	size_t srclen = cb-&gt;compressed_len;</div><div class='del'>-	unsigned long total_pages_in = DIV_ROUND_UP(srclen, PAGE_SIZE);</div><div class='add'>+	unsigned long total_folios_in = DIV_ROUND_UP(srclen, min_folio_size);</div><div class='ctx'> 	unsigned long buf_start;</div><div class='del'>-	struct page **pages_in = cb-&gt;compressed_pages;</div><div class='add'>+	struct folio **folios_in = cb-&gt;compressed_folios;</div><div class='ctx'> </div><div class='del'>-	data_in = kmap(pages_in[page_in_index]);</div><div class='add'>+	data_in = kmap_local_folio(folios_in[folio_in_index], 0);</div><div class='ctx'> 	workspace-&gt;strm.next_in = data_in;</div><div class='del'>-	workspace-&gt;strm.avail_in = min_t(size_t, srclen, PAGE_SIZE);</div><div class='add'>+	workspace-&gt;strm.avail_in = min_t(size_t, srclen, min_folio_size);</div><div class='ctx'> 	workspace-&gt;strm.total_in = 0;</div><div class='ctx'> </div><div class='ctx'> 	workspace-&gt;strm.total_out = 0;</div><div class='hunk'>@@ -307,9 +368,14 @@ int zlib_decompress_bio(struct list_head *ws, struct compressed_bio *cb)</div><div class='ctx'> 		workspace-&gt;strm.avail_in -= 2;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (Z_OK != zlib_inflateInit2(&amp;workspace-&gt;strm, wbits)) {</div><div class='del'>-		pr_warn("BTRFS: inflateInit failed\n");</div><div class='del'>-		kunmap(pages_in[page_in_index]);</div><div class='add'>+	ret = zlib_inflateInit2(&amp;workspace-&gt;strm, wbits);</div><div class='add'>+	if (unlikely(ret != Z_OK)) {</div><div class='add'>+		struct btrfs_inode *inode = cb-&gt;bbio.inode;</div><div class='add'>+</div><div class='add'>+		kunmap_local(data_in);</div><div class='add'>+		btrfs_err(inode-&gt;root-&gt;fs_info,</div><div class='add'>+	"zlib decompression init failed, error %d root %llu inode %llu offset %llu",</div><div class='add'>+			  ret, btrfs_root_id(inode-&gt;root), btrfs_ino(inode), cb-&gt;start);</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> 	while (workspace-&gt;strm.total_in &lt; srclen) {</div><div class='hunk'>@@ -336,44 +402,42 @@ int zlib_decompress_bio(struct list_head *ws, struct compressed_bio *cb)</div><div class='ctx'> </div><div class='ctx'> 		if (workspace-&gt;strm.avail_in == 0) {</div><div class='ctx'> 			unsigned long tmp;</div><div class='del'>-			kunmap(pages_in[page_in_index]);</div><div class='del'>-			page_in_index++;</div><div class='del'>-			if (page_in_index &gt;= total_pages_in) {</div><div class='add'>+			kunmap_local(data_in);</div><div class='add'>+			folio_in_index++;</div><div class='add'>+			if (folio_in_index &gt;= total_folios_in) {</div><div class='ctx'> 				data_in = NULL;</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='del'>-			data_in = kmap(pages_in[page_in_index]);</div><div class='add'>+			data_in = kmap_local_folio(folios_in[folio_in_index], 0);</div><div class='ctx'> 			workspace-&gt;strm.next_in = data_in;</div><div class='ctx'> 			tmp = srclen - workspace-&gt;strm.total_in;</div><div class='del'>-			workspace-&gt;strm.avail_in = min(tmp, PAGE_SIZE);</div><div class='add'>+			workspace-&gt;strm.avail_in = min(tmp, min_folio_size);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	if (ret != Z_STREAM_END)</div><div class='add'>+	if (unlikely(ret != Z_STREAM_END)) {</div><div class='add'>+		btrfs_err(cb-&gt;bbio.inode-&gt;root-&gt;fs_info,</div><div class='add'>+		"zlib decompression failed, error %d root %llu inode %llu offset %llu",</div><div class='add'>+			  ret, btrfs_root_id(cb-&gt;bbio.inode-&gt;root),</div><div class='add'>+			  btrfs_ino(cb-&gt;bbio.inode), cb-&gt;start);</div><div class='ctx'> 		ret = -EIO;</div><div class='del'>-	else</div><div class='add'>+	} else {</div><div class='ctx'> 		ret = 0;</div><div class='add'>+	}</div><div class='ctx'> done:</div><div class='ctx'> 	zlib_inflateEnd(&amp;workspace-&gt;strm);</div><div class='ctx'> 	if (data_in)</div><div class='del'>-		kunmap(pages_in[page_in_index]);</div><div class='del'>-	if (!ret)</div><div class='del'>-		zero_fill_bio(cb-&gt;orig_bio);</div><div class='add'>+		kunmap_local(data_in);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int zlib_decompress(struct list_head *ws, unsigned char *data_in,</div><div class='del'>-		struct page *dest_page, unsigned long start_byte, size_t srclen,</div><div class='add'>+int zlib_decompress(struct list_head *ws, const u8 *data_in,</div><div class='add'>+		struct folio *dest_folio, unsigned long dest_pgoff, size_t srclen,</div><div class='ctx'> 		size_t destlen)</div><div class='ctx'> {</div><div class='ctx'> 	struct workspace *workspace = list_entry(ws, struct workspace, list);</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int wbits = MAX_WBITS;</div><div class='del'>-	unsigned long bytes_left;</div><div class='del'>-	unsigned long total_out = 0;</div><div class='del'>-	unsigned long pg_offset = 0;</div><div class='del'>-</div><div class='del'>-	destlen = min_t(unsigned long, destlen, PAGE_SIZE);</div><div class='del'>-	bytes_left = destlen;</div><div class='add'>+	unsigned long to_copy;</div><div class='ctx'> </div><div class='ctx'> 	workspace-&gt;strm.next_in = data_in;</div><div class='ctx'> 	workspace-&gt;strm.avail_in = srclen;</div><div class='hunk'>@@ -393,70 +457,50 @@ int zlib_decompress(struct list_head *ws, unsigned char *data_in,</div><div class='ctx'> 		workspace-&gt;strm.avail_in -= 2;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (Z_OK != zlib_inflateInit2(&amp;workspace-&gt;strm, wbits)) {</div><div class='del'>-		pr_warn("BTRFS: inflateInit failed\n");</div><div class='add'>+	ret = zlib_inflateInit2(&amp;workspace-&gt;strm, wbits);</div><div class='add'>+	if (unlikely(ret != Z_OK)) {</div><div class='add'>+		struct btrfs_inode *inode = folio_to_inode(dest_folio);</div><div class='add'>+</div><div class='add'>+		btrfs_err(inode-&gt;root-&gt;fs_info,</div><div class='add'>+		"zlib decompression init failed, error %d root %llu inode %llu offset %llu",</div><div class='add'>+			  ret, btrfs_root_id(inode-&gt;root), btrfs_ino(inode),</div><div class='add'>+			  folio_pos(dest_folio));</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	while (bytes_left &gt; 0) {</div><div class='del'>-		unsigned long buf_start;</div><div class='del'>-		unsigned long buf_offset;</div><div class='del'>-		unsigned long bytes;</div><div class='del'>-</div><div class='del'>-		ret = zlib_inflate(&amp;workspace-&gt;strm, Z_NO_FLUSH);</div><div class='del'>-		if (ret != Z_OK &amp;&amp; ret != Z_STREAM_END)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		buf_start = total_out;</div><div class='del'>-		total_out = workspace-&gt;strm.total_out;</div><div class='del'>-</div><div class='del'>-		if (total_out == buf_start) {</div><div class='del'>-			ret = -EIO;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (total_out &lt;= start_byte)</div><div class='del'>-			goto next;</div><div class='del'>-</div><div class='del'>-		if (total_out &gt; start_byte &amp;&amp; buf_start &lt; start_byte)</div><div class='del'>-			buf_offset = start_byte - buf_start;</div><div class='del'>-		else</div><div class='del'>-			buf_offset = 0;</div><div class='del'>-</div><div class='del'>-		bytes = min(PAGE_SIZE - pg_offset,</div><div class='del'>-			    PAGE_SIZE - (buf_offset % PAGE_SIZE));</div><div class='del'>-		bytes = min(bytes, bytes_left);</div><div class='add'>+	/*</div><div class='add'>+	 * Everything (in/out buf) should be at most one sector, there should</div><div class='add'>+	 * be no need to switch any input/output buffer.</div><div class='add'>+	 */</div><div class='add'>+	ret = zlib_inflate(&amp;workspace-&gt;strm, Z_FINISH);</div><div class='add'>+	to_copy = min(workspace-&gt;strm.total_out, destlen);</div><div class='add'>+	if (ret != Z_STREAM_END)</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='del'>-		memcpy_to_page(dest_page, pg_offset,</div><div class='del'>-			       workspace-&gt;buf + buf_offset, bytes);</div><div class='add'>+	memcpy_to_folio(dest_folio, dest_pgoff, workspace-&gt;buf, to_copy);</div><div class='ctx'> </div><div class='del'>-		pg_offset += bytes;</div><div class='del'>-		bytes_left -= bytes;</div><div class='del'>-next:</div><div class='del'>-		workspace-&gt;strm.next_out = workspace-&gt;buf;</div><div class='del'>-		workspace-&gt;strm.avail_out = workspace-&gt;buf_size;</div><div class='del'>-	}</div><div class='add'>+out:</div><div class='add'>+	if (unlikely(to_copy != destlen)) {</div><div class='add'>+		struct btrfs_inode *inode = folio_to_inode(dest_folio);</div><div class='ctx'> </div><div class='del'>-	if (ret != Z_STREAM_END &amp;&amp; bytes_left != 0)</div><div class='add'>+		btrfs_err(inode-&gt;root-&gt;fs_info,</div><div class='add'>+"zlib decompression failed, error %d root %llu inode %llu offset %llu decompressed %lu expected %zu",</div><div class='add'>+			  ret, btrfs_root_id(inode-&gt;root), btrfs_ino(inode),</div><div class='add'>+			  folio_pos(dest_folio), to_copy, destlen);</div><div class='ctx'> 		ret = -EIO;</div><div class='del'>-	else</div><div class='add'>+	} else {</div><div class='ctx'> 		ret = 0;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	zlib_inflateEnd(&amp;workspace-&gt;strm);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * this should only happen if zlib returned fewer bytes than we</div><div class='del'>-	 * expected.  btrfs_get_block is responsible for zeroing from the</div><div class='del'>-	 * end of the inline extent (destlen) to the end of the page</div><div class='del'>-	 */</div><div class='del'>-	if (pg_offset &lt; destlen) {</div><div class='del'>-		memzero_page(dest_page, pg_offset, destlen - pg_offset);</div><div class='del'>-	}</div><div class='add'>+	if (unlikely(to_copy &lt; destlen))</div><div class='add'>+		folio_zero_range(dest_folio, dest_pgoff + to_copy, destlen - to_copy);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-const struct btrfs_compress_op btrfs_zlib_compress = {</div><div class='del'>-	.workspace_manager	= &amp;wsm,</div><div class='add'>+const struct btrfs_compress_levels btrfs_zlib_compress = {</div><div class='add'>+	.min_level		= 1,</div><div class='ctx'> 	.max_level		= 9,</div><div class='ctx'> 	.default_level		= BTRFS_ZLIB_DEFAULT_LEVEL,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/btrfs/zoned.c b/fs/btrfs/zoned.c<br/>index 67d932d70798..359a98e6de85 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/zoned.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/zoned.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/zoned.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/zoned.c</a></div><div class='hunk'>@@ -5,15 +5,19 @@</div><div class='ctx'> #include &lt;linux/blkdev.h&gt;</div><div class='ctx'> #include &lt;linux/sched/mm.h&gt;</div><div class='ctx'> #include &lt;linux/atomic.h&gt;</div><div class='add'>+#include &lt;linux/vmalloc.h&gt;</div><div class='ctx'> #include "ctree.h"</div><div class='ctx'> #include "volumes.h"</div><div class='ctx'> #include "zoned.h"</div><div class='del'>-#include "rcu-string.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='ctx'> #include "block-group.h"</div><div class='del'>-#include "transaction.h"</div><div class='ctx'> #include "dev-replace.h"</div><div class='ctx'> #include "space-info.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "accessors.h"</div><div class='add'>+#include "bio.h"</div><div class='add'>+#include "transaction.h"</div><div class='add'>+#include "sysfs.h"</div><div class='ctx'> </div><div class='ctx'> /* Maximum number of zones to report per blkdev_report_zones() call */</div><div class='ctx'> #define BTRFS_REPORT_NR_ZONES   4096</div><div class='hunk'>@@ -33,12 +37,15 @@</div><div class='ctx'> #define BTRFS_SB_LOG_FIRST_OFFSET	(512ULL * SZ_1G)</div><div class='ctx'> #define BTRFS_SB_LOG_SECOND_OFFSET	(4096ULL * SZ_1G)</div><div class='ctx'> </div><div class='del'>-#define BTRFS_SB_LOG_FIRST_SHIFT	const_ilog2(BTRFS_SB_LOG_FIRST_OFFSET)</div><div class='del'>-#define BTRFS_SB_LOG_SECOND_SHIFT	const_ilog2(BTRFS_SB_LOG_SECOND_OFFSET)</div><div class='add'>+#define BTRFS_SB_LOG_FIRST_SHIFT	ilog2(BTRFS_SB_LOG_FIRST_OFFSET)</div><div class='add'>+#define BTRFS_SB_LOG_SECOND_SHIFT	ilog2(BTRFS_SB_LOG_SECOND_OFFSET)</div><div class='ctx'> </div><div class='ctx'> /* Number of superblock log zones */</div><div class='ctx'> #define BTRFS_NR_SB_LOG_ZONES 2</div><div class='ctx'> </div><div class='add'>+/* Default number of max active zones when the device has no limits. */</div><div class='add'>+#define BTRFS_DEFAULT_MAX_ACTIVE_ZONES	128</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Minimum of active zones we need:</div><div class='ctx'>  *</div><div class='hunk'>@@ -50,14 +57,19 @@</div><div class='ctx'> #define BTRFS_MIN_ACTIVE_ZONES		(BTRFS_SUPER_MIRROR_MAX + 5)</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Maximum supported zone size. Currently, SMR disks have a zone size of</div><div class='del'>- * 256MiB, and we are expecting ZNS drives to be in the 1-4GiB range. We do not</div><div class='del'>- * expect the zone size to become larger than 8GiB in the near future.</div><div class='add'>+ * Minimum / maximum supported zone size. Currently, SMR disks have a zone</div><div class='add'>+ * size of 256MiB, and we are expecting ZNS drives to be in the 1-4GiB range.</div><div class='add'>+ * We do not expect the zone size to become larger than 8GiB or smaller than</div><div class='add'>+ * 4MiB in the near future.</div><div class='ctx'>  */</div><div class='ctx'> #define BTRFS_MAX_ZONE_SIZE		SZ_8G</div><div class='add'>+#define BTRFS_MIN_ZONE_SIZE		SZ_4M</div><div class='ctx'> </div><div class='ctx'> #define SUPER_INFO_SECTORS	((u64)BTRFS_SUPER_INFO_SIZE &gt;&gt; SECTOR_SHIFT)</div><div class='ctx'> </div><div class='add'>+static void wait_eb_writebacks(struct btrfs_block_group *block_group);</div><div class='add'>+static int do_zone_finish(struct btrfs_block_group *block_group, bool fully_written);</div><div class='add'>+</div><div class='ctx'> static inline bool sb_zone_is_full(const struct blk_zone *zone)</div><div class='ctx'> {</div><div class='ctx'> 	return (zone-&gt;cond == BLK_ZONE_COND_FULL) ||</div><div class='hunk'>@@ -79,10 +91,10 @@ static int sb_write_pointer(struct block_device *bdev, struct blk_zone *zones,</div><div class='ctx'> 	bool empty[BTRFS_NR_SB_LOG_ZONES];</div><div class='ctx'> 	bool full[BTRFS_NR_SB_LOG_ZONES];</div><div class='ctx'> 	sector_t sector;</div><div class='del'>-	int i;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; BTRFS_NR_SB_LOG_ZONES; i++) {</div><div class='del'>-		ASSERT(zones[i].type != BLK_ZONE_TYPE_CONVENTIONAL);</div><div class='add'>+	for (int i = 0; i &lt; BTRFS_NR_SB_LOG_ZONES; i++) {</div><div class='add'>+		ASSERT(zones[i].type != BLK_ZONE_TYPE_CONVENTIONAL,</div><div class='add'>+		       "zones[%d].type=%d", i, zones[i].type);</div><div class='ctx'> 		empty[i] = (zones[i].cond == BLK_ZONE_COND_EMPTY);</div><div class='ctx'> 		full[i] = sb_zone_is_full(&amp;zones[i]);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -91,9 +103,9 @@ static int sb_write_pointer(struct block_device *bdev, struct blk_zone *zones,</div><div class='ctx'> 	 * Possible states of log buffer zones</div><div class='ctx'> 	 *</div><div class='ctx'> 	 *           Empty[0]  In use[0]  Full[0]</div><div class='del'>-	 * Empty[1]         *          x        0</div><div class='del'>-	 * In use[1]        0          x        0</div><div class='del'>-	 * Full[1]          1          1        C</div><div class='add'>+	 * Empty[1]         *          0        1</div><div class='add'>+	 * In use[1]        x          x        1</div><div class='add'>+	 * Full[1]          0          0        C</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * Log position:</div><div class='ctx'> 	 *   *: Special case, no superblock is written</div><div class='hunk'>@@ -110,16 +122,14 @@ static int sb_write_pointer(struct block_device *bdev, struct blk_zone *zones,</div><div class='ctx'> 		return -ENOENT;</div><div class='ctx'> 	} else if (full[0] &amp;&amp; full[1]) {</div><div class='ctx'> 		/* Compare two super blocks */</div><div class='del'>-		struct address_space *mapping = bdev-&gt;bd_inode-&gt;i_mapping;</div><div class='add'>+		struct address_space *mapping = bdev-&gt;bd_mapping;</div><div class='ctx'> 		struct page *page[BTRFS_NR_SB_LOG_ZONES];</div><div class='ctx'> 		struct btrfs_super_block *super[BTRFS_NR_SB_LOG_ZONES];</div><div class='del'>-		int i;</div><div class='del'>-</div><div class='del'>-		for (i = 0; i &lt; BTRFS_NR_SB_LOG_ZONES; i++) {</div><div class='del'>-			u64 bytenr;</div><div class='ctx'> </div><div class='del'>-			bytenr = ((zones[i].start + zones[i].len)</div><div class='del'>-				   &lt;&lt; SECTOR_SHIFT) - BTRFS_SUPER_INFO_SIZE;</div><div class='add'>+		for (int i = 0; i &lt; BTRFS_NR_SB_LOG_ZONES; i++) {</div><div class='add'>+			u64 zone_end = (zones[i].start + zones[i].capacity) &lt;&lt; SECTOR_SHIFT;</div><div class='add'>+			u64 bytenr = ALIGN_DOWN(zone_end, BTRFS_SUPER_INFO_SIZE) -</div><div class='add'>+						BTRFS_SUPER_INFO_SIZE;</div><div class='ctx'> </div><div class='ctx'> 			page[i] = read_cache_page_gfp(mapping,</div><div class='ctx'> 					bytenr &gt;&gt; PAGE_SHIFT, GFP_NOFS);</div><div class='hunk'>@@ -131,12 +141,13 @@ static int sb_write_pointer(struct block_device *bdev, struct blk_zone *zones,</div><div class='ctx'> 			super[i] = page_address(page[i]);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (super[0]-&gt;generation &gt; super[1]-&gt;generation)</div><div class='add'>+		if (btrfs_super_generation(super[0]) &gt;</div><div class='add'>+		    btrfs_super_generation(super[1]))</div><div class='ctx'> 			sector = zones[1].start;</div><div class='ctx'> 		else</div><div class='ctx'> 			sector = zones[0].start;</div><div class='ctx'> </div><div class='del'>-		for (i = 0; i &lt; BTRFS_NR_SB_LOG_ZONES; i++)</div><div class='add'>+		for (int i = 0; i &lt; BTRFS_NR_SB_LOG_ZONES; i++)</div><div class='ctx'> 			btrfs_release_disk_super(super[i]);</div><div class='ctx'> 	} else if (!full[0] &amp;&amp; (empty[1] || full[1])) {</div><div class='ctx'> 		sector = zones[0].wp;</div><div class='hunk'>@@ -154,16 +165,16 @@ static int sb_write_pointer(struct block_device *bdev, struct blk_zone *zones,</div><div class='ctx'>  */</div><div class='ctx'> static inline u32 sb_zone_number(int shift, int mirror)</div><div class='ctx'> {</div><div class='del'>-	u64 zone;</div><div class='add'>+	u64 zone = U64_MAX;</div><div class='ctx'> </div><div class='del'>-	ASSERT(mirror &lt; BTRFS_SUPER_MIRROR_MAX);</div><div class='add'>+	ASSERT(mirror &lt; BTRFS_SUPER_MIRROR_MAX, "mirror=%d", mirror);</div><div class='ctx'> 	switch (mirror) {</div><div class='ctx'> 	case 0: zone = 0; break;</div><div class='ctx'> 	case 1: zone = 1ULL &lt;&lt; (BTRFS_SB_LOG_FIRST_SHIFT - shift); break;</div><div class='ctx'> 	case 2: zone = 1ULL &lt;&lt; (BTRFS_SB_LOG_SECOND_SHIFT - shift); break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ASSERT(zone &lt;= U32_MAX);</div><div class='add'>+	ASSERT(zone &lt;= U32_MAX, "zone=%llu", zone);</div><div class='ctx'> </div><div class='ctx'> 	return (u32)zone;</div><div class='ctx'> }</div><div class='hunk'>@@ -213,6 +224,7 @@ static int emulate_report_zones(struct btrfs_device *device, u64 pos,</div><div class='ctx'> static int btrfs_get_dev_zones(struct btrfs_device *device, u64 pos,</div><div class='ctx'> 			       struct blk_zone *zones, unsigned int *nr_zones)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_zoned_device_info *zinfo = device-&gt;zone_info;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!*nr_zones)</div><div class='hunk'>@@ -224,26 +236,64 @@ static int btrfs_get_dev_zones(struct btrfs_device *device, u64 pos,</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = blkdev_report_zones(device-&gt;bdev, pos &gt;&gt; SECTOR_SHIFT, *nr_zones,</div><div class='del'>-				  copy_zone_info_cb, zones);</div><div class='add'>+	/* Check cache */</div><div class='add'>+	if (zinfo-&gt;zone_cache) {</div><div class='add'>+		unsigned int i;</div><div class='add'>+		u32 zno;</div><div class='add'>+</div><div class='add'>+		ASSERT(IS_ALIGNED(pos, zinfo-&gt;zone_size),</div><div class='add'>+		       "pos=%llu zinfo-&gt;zone_size=%llu", pos, zinfo-&gt;zone_size);</div><div class='add'>+		zno = pos &gt;&gt; zinfo-&gt;zone_size_shift;</div><div class='add'>+		/*</div><div class='add'>+		 * We cannot report zones beyond the zone end. So, it is OK to</div><div class='add'>+		 * cap *nr_zones to at the end.</div><div class='add'>+		 */</div><div class='add'>+		*nr_zones = min_t(u32, *nr_zones, zinfo-&gt;nr_zones - zno);</div><div class='add'>+</div><div class='add'>+		for (i = 0; i &lt; *nr_zones; i++) {</div><div class='add'>+			struct blk_zone *zone_info;</div><div class='add'>+</div><div class='add'>+			zone_info = &amp;zinfo-&gt;zone_cache[zno + i];</div><div class='add'>+			if (!zone_info-&gt;len)</div><div class='add'>+				break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (i == *nr_zones) {</div><div class='add'>+			/* Cache hit on all the zones */</div><div class='add'>+			memcpy(zones, zinfo-&gt;zone_cache + zno,</div><div class='add'>+			       sizeof(*zinfo-&gt;zone_cache) * *nr_zones);</div><div class='add'>+			return 0;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = blkdev_report_zones_cached(device-&gt;bdev, pos &gt;&gt; SECTOR_SHIFT,</div><div class='add'>+					 *nr_zones, copy_zone_info_cb, zones);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='del'>-		btrfs_err_in_rcu(device-&gt;fs_info,</div><div class='add'>+		btrfs_err(device-&gt;fs_info,</div><div class='ctx'> 				 "zoned: failed to read zone %llu on %s (devid %llu)",</div><div class='del'>-				 pos, rcu_str_deref(device-&gt;name),</div><div class='add'>+				 pos, rcu_dereference(device-&gt;name),</div><div class='ctx'> 				 device-&gt;devid);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> 	*nr_zones = ret;</div><div class='del'>-	if (!ret)</div><div class='add'>+	if (unlikely(!ret))</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> </div><div class='add'>+	/* Populate cache */</div><div class='add'>+	if (zinfo-&gt;zone_cache) {</div><div class='add'>+		u32 zno = pos &gt;&gt; zinfo-&gt;zone_size_shift;</div><div class='add'>+</div><div class='add'>+		memcpy(zinfo-&gt;zone_cache + zno, zones,</div><div class='add'>+		       sizeof(*zinfo-&gt;zone_cache) * *nr_zones);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* The emulated zone size is determined from the size of device extent */</div><div class='ctx'> static int calculate_emulated_zone_size(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_root *root = fs_info-&gt;dev_root;</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct extent_buffer *leaf;</div><div class='hunk'>@@ -260,28 +310,21 @@ static int calculate_emulated_zone_size(struct btrfs_fs_info *fs_info)</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	if (path-&gt;slots[0] &gt;= btrfs_header_nritems(path-&gt;nodes[0])) {</div><div class='ctx'> 		ret = btrfs_next_leaf(root, path);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='add'>+			return ret;</div><div class='ctx'> 		/* No dev extents at all? Not good */</div><div class='del'>-		if (ret &gt; 0) {</div><div class='del'>-			ret = -EUCLEAN;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+		if (unlikely(ret &gt; 0))</div><div class='add'>+			return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	leaf = path-&gt;nodes[0];</div><div class='ctx'> 	dext = btrfs_item_ptr(leaf, path-&gt;slots[0], struct btrfs_dev_extent);</div><div class='ctx'> 	fs_info-&gt;zone_size = btrfs_dev_extent_length(leaf, dext);</div><div class='del'>-	ret = 0;</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_get_dev_zone_info_all_devices(struct btrfs_fs_info *fs_info)</div><div class='hunk'>@@ -300,7 +343,7 @@ int btrfs_get_dev_zone_info_all_devices(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 		if (!device-&gt;bdev)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		ret = btrfs_get_dev_zone_info(device);</div><div class='add'>+		ret = btrfs_get_dev_zone_info(device, true);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -309,12 +352,11 @@ int btrfs_get_dev_zone_info_all_devices(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_get_dev_zone_info(struct btrfs_device *device)</div><div class='add'>+int btrfs_get_dev_zone_info(struct btrfs_device *device, bool populate_cache)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = device-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_zoned_device_info *zone_info = NULL;</div><div class='ctx'> 	struct block_device *bdev = device-&gt;bdev;</div><div class='del'>-	struct request_queue *queue = bdev_get_queue(bdev);</div><div class='ctx'> 	unsigned int max_active_zones;</div><div class='ctx'> 	unsigned int nactive;</div><div class='ctx'> 	sector_t nr_sectors;</div><div class='hunk'>@@ -339,6 +381,8 @@ int btrfs_get_dev_zone_info(struct btrfs_device *device)</div><div class='ctx'> 	if (!zone_info)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='add'>+	device-&gt;zone_info = zone_info;</div><div class='add'>+</div><div class='ctx'> 	if (!bdev_is_zoned(bdev)) {</div><div class='ctx'> 		if (!fs_info-&gt;zone_size) {</div><div class='ctx'> 			ret = calculate_emulated_zone_size(fs_info);</div><div class='hunk'>@@ -352,18 +396,24 @@ int btrfs_get_dev_zone_info(struct btrfs_device *device)</div><div class='ctx'> 		zone_sectors = bdev_zone_sectors(bdev);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Check if it's power of 2 (see is_power_of_2) */</div><div class='del'>-	ASSERT(zone_sectors != 0 &amp;&amp; (zone_sectors &amp; (zone_sectors - 1)) == 0);</div><div class='add'>+	ASSERT(is_power_of_two_u64(zone_sectors));</div><div class='ctx'> 	zone_info-&gt;zone_size = zone_sectors &lt;&lt; SECTOR_SHIFT;</div><div class='ctx'> </div><div class='ctx'> 	/* We reject devices with a zone size larger than 8GB */</div><div class='ctx'> 	if (zone_info-&gt;zone_size &gt; BTRFS_MAX_ZONE_SIZE) {</div><div class='del'>-		btrfs_err_in_rcu(fs_info,</div><div class='add'>+		btrfs_err(fs_info,</div><div class='ctx'> 		"zoned: %s: zone size %llu larger than supported maximum %llu",</div><div class='del'>-				 rcu_str_deref(device-&gt;name),</div><div class='add'>+				 rcu_dereference(device-&gt;name),</div><div class='ctx'> 				 zone_info-&gt;zone_size, BTRFS_MAX_ZONE_SIZE);</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 		goto out;</div><div class='add'>+	} else if (zone_info-&gt;zone_size &lt; BTRFS_MIN_ZONE_SIZE) {</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+		"zoned: %s: zone size %llu smaller than supported minimum %u",</div><div class='add'>+				 rcu_dereference(device-&gt;name),</div><div class='add'>+				 zone_info-&gt;zone_size, BTRFS_MIN_ZONE_SIZE);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	nr_sectors = bdev_nr_sectors(bdev);</div><div class='hunk'>@@ -372,11 +422,14 @@ int btrfs_get_dev_zone_info(struct btrfs_device *device)</div><div class='ctx'> 	if (!IS_ALIGNED(nr_sectors, zone_sectors))</div><div class='ctx'> 		zone_info-&gt;nr_zones++;</div><div class='ctx'> </div><div class='del'>-	max_active_zones = queue_max_active_zones(queue);</div><div class='add'>+	max_active_zones = min_not_zero(bdev_max_active_zones(bdev),</div><div class='add'>+					bdev_max_open_zones(bdev));</div><div class='add'>+	if (!max_active_zones &amp;&amp; zone_info-&gt;nr_zones &gt; BTRFS_DEFAULT_MAX_ACTIVE_ZONES)</div><div class='add'>+		max_active_zones = BTRFS_DEFAULT_MAX_ACTIVE_ZONES;</div><div class='ctx'> 	if (max_active_zones &amp;&amp; max_active_zones &lt; BTRFS_MIN_ACTIVE_ZONES) {</div><div class='del'>-		btrfs_err_in_rcu(fs_info,</div><div class='add'>+		btrfs_err(fs_info,</div><div class='ctx'> "zoned: %s: max active zones %u is too small, need at least %u active zones",</div><div class='del'>-				 rcu_str_deref(device-&gt;name), max_active_zones,</div><div class='add'>+				 rcu_dereference(device-&gt;name), max_active_zones,</div><div class='ctx'> 				 BTRFS_MIN_ACTIVE_ZONES);</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -401,12 +454,29 @@ int btrfs_get_dev_zone_info(struct btrfs_device *device)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	zones = kcalloc(BTRFS_REPORT_NR_ZONES, sizeof(struct blk_zone), GFP_KERNEL);</div><div class='add'>+	zones = kvcalloc(BTRFS_REPORT_NR_ZONES, sizeof(struct blk_zone), GFP_KERNEL);</div><div class='ctx'> 	if (!zones) {</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Enable zone cache only for a zoned device. On a non-zoned device, we</div><div class='add'>+	 * fill the zone info with emulated CONVENTIONAL zones, so no need to</div><div class='add'>+	 * use the cache.</div><div class='add'>+	 */</div><div class='add'>+	if (populate_cache &amp;&amp; bdev_is_zoned(device-&gt;bdev)) {</div><div class='add'>+		zone_info-&gt;zone_cache = vcalloc(zone_info-&gt;nr_zones,</div><div class='add'>+						sizeof(struct blk_zone));</div><div class='add'>+		if (!zone_info-&gt;zone_cache) {</div><div class='add'>+			btrfs_err(device-&gt;fs_info,</div><div class='add'>+				"zoned: failed to allocate zone cache for %s",</div><div class='add'>+				rcu_dereference(device-&gt;name));</div><div class='add'>+			ret = -ENOMEM;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/* Get zones type */</div><div class='ctx'> 	nactive = 0;</div><div class='ctx'> 	while (sector &lt; nr_sectors) {</div><div class='hunk'>@@ -426,6 +496,7 @@ int btrfs_get_dev_zone_info(struct btrfs_device *device)</div><div class='ctx'> 			case BLK_ZONE_COND_IMP_OPEN:</div><div class='ctx'> 			case BLK_ZONE_COND_EXP_OPEN:</div><div class='ctx'> 			case BLK_ZONE_COND_CLOSED:</div><div class='add'>+			case BLK_ZONE_COND_ACTIVE:</div><div class='ctx'> 				__set_bit(nreported, zone_info-&gt;active_zones);</div><div class='ctx'> 				nactive++;</div><div class='ctx'> 				break;</div><div class='hunk'>@@ -435,28 +506,35 @@ int btrfs_get_dev_zone_info(struct btrfs_device *device)</div><div class='ctx'> 		sector = zones[nr_zones - 1].start + zones[nr_zones - 1].len;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (nreported != zone_info-&gt;nr_zones) {</div><div class='del'>-		btrfs_err_in_rcu(device-&gt;fs_info,</div><div class='add'>+	if (unlikely(nreported != zone_info-&gt;nr_zones)) {</div><div class='add'>+		btrfs_err(device-&gt;fs_info,</div><div class='ctx'> 				 "inconsistent number of zones on %s (%u/%u)",</div><div class='del'>-				 rcu_str_deref(device-&gt;name), nreported,</div><div class='add'>+				 rcu_dereference(device-&gt;name), nreported,</div><div class='ctx'> 				 zone_info-&gt;nr_zones);</div><div class='ctx'> 		ret = -EIO;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (max_active_zones) {</div><div class='del'>-		if (nactive &gt; max_active_zones) {</div><div class='del'>-			btrfs_err_in_rcu(device-&gt;fs_info,</div><div class='add'>+		if (unlikely(nactive &gt; max_active_zones)) {</div><div class='add'>+			if (bdev_max_active_zones(bdev) == 0) {</div><div class='add'>+				max_active_zones = 0;</div><div class='add'>+				zone_info-&gt;max_active_zones = 0;</div><div class='add'>+				goto validate;</div><div class='add'>+			}</div><div class='add'>+			btrfs_err(device-&gt;fs_info,</div><div class='ctx'> 			"zoned: %u active zones on %s exceeds max_active_zones %u",</div><div class='del'>-					 nactive, rcu_str_deref(device-&gt;name),</div><div class='add'>+					 nactive, rcu_dereference(device-&gt;name),</div><div class='ctx'> 					 max_active_zones);</div><div class='ctx'> 			ret = -EIO;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 		atomic_set(&amp;zone_info-&gt;active_zones_left,</div><div class='ctx'> 			   max_active_zones - nactive);</div><div class='add'>+		set_bit(BTRFS_FS_ACTIVE_ZONE_TRACKING, &amp;fs_info-&gt;flags);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+validate:</div><div class='ctx'> 	/* Validate superblock log */</div><div class='ctx'> 	nr_zones = BTRFS_NR_SB_LOG_ZONES;</div><div class='ctx'> 	for (i = 0; i &lt; BTRFS_SUPER_MIRROR_MAX; i++) {</div><div class='hunk'>@@ -475,8 +553,8 @@ int btrfs_get_dev_zone_info(struct btrfs_device *device)</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='del'>-		if (nr_zones != BTRFS_NR_SB_LOG_ZONES) {</div><div class='del'>-			btrfs_err_in_rcu(device-&gt;fs_info,</div><div class='add'>+		if (unlikely(nr_zones != BTRFS_NR_SB_LOG_ZONES)) {</div><div class='add'>+			btrfs_err(device-&gt;fs_info,</div><div class='ctx'> 	"zoned: failed to read super block log zone info at devid %llu zone %u",</div><div class='ctx'> 					 device-&gt;devid, sb_zone);</div><div class='ctx'> 			ret = -EUCLEAN;</div><div class='hunk'>@@ -493,8 +571,8 @@ int btrfs_get_dev_zone_info(struct btrfs_device *device)</div><div class='ctx'> </div><div class='ctx'> 		ret = sb_write_pointer(device-&gt;bdev,</div><div class='ctx'> 				       &amp;zone_info-&gt;sb_zones[sb_pos], &amp;sb_wp);</div><div class='del'>-		if (ret != -ENOENT &amp;&amp; ret) {</div><div class='del'>-			btrfs_err_in_rcu(device-&gt;fs_info,</div><div class='add'>+		if (unlikely(ret != -ENOENT &amp;&amp; ret)) {</div><div class='add'>+			btrfs_err(device-&gt;fs_info,</div><div class='ctx'> 			"zoned: super block log zone corrupted devid %llu zone %u",</div><div class='ctx'> 					 device-&gt;devid, sb_zone);</div><div class='ctx'> 			ret = -EUCLEAN;</div><div class='hunk'>@@ -503,48 +581,26 @@ int btrfs_get_dev_zone_info(struct btrfs_device *device)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> </div><div class='del'>-	kfree(zones);</div><div class='del'>-</div><div class='del'>-	device-&gt;zone_info = zone_info;</div><div class='add'>+	kvfree(zones);</div><div class='ctx'> </div><div class='del'>-	switch (bdev_zoned_model(bdev)) {</div><div class='del'>-	case BLK_ZONED_HM:</div><div class='add'>+	if (bdev_is_zoned(bdev)) {</div><div class='ctx'> 		model = "host-managed zoned";</div><div class='ctx'> 		emulated = "";</div><div class='del'>-		break;</div><div class='del'>-	case BLK_ZONED_HA:</div><div class='del'>-		model = "host-aware zoned";</div><div class='del'>-		emulated = "";</div><div class='del'>-		break;</div><div class='del'>-	case BLK_ZONED_NONE:</div><div class='add'>+	} else {</div><div class='ctx'> 		model = "regular";</div><div class='ctx'> 		emulated = "emulated ";</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		/* Just in case */</div><div class='del'>-		btrfs_err_in_rcu(fs_info, "zoned: unsupported model %d on %s",</div><div class='del'>-				 bdev_zoned_model(bdev),</div><div class='del'>-				 rcu_str_deref(device-&gt;name));</div><div class='del'>-		ret = -EOPNOTSUPP;</div><div class='del'>-		goto out_free_zone_info;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	btrfs_info_in_rcu(fs_info,</div><div class='add'>+	btrfs_info(fs_info,</div><div class='ctx'> 		"%s block device %s, %u %szones of %llu bytes",</div><div class='del'>-		model, rcu_str_deref(device-&gt;name), zone_info-&gt;nr_zones,</div><div class='add'>+		model, rcu_dereference(device-&gt;name), zone_info-&gt;nr_zones,</div><div class='ctx'> 		emulated, zone_info-&gt;zone_size);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	kfree(zones);</div><div class='del'>-out_free_zone_info:</div><div class='del'>-	bitmap_free(zone_info-&gt;active_zones);</div><div class='del'>-	bitmap_free(zone_info-&gt;empty_zones);</div><div class='del'>-	bitmap_free(zone_info-&gt;seq_zones);</div><div class='del'>-	kfree(zone_info);</div><div class='del'>-	device-&gt;zone_info = NULL;</div><div class='del'>-</div><div class='add'>+	kvfree(zones);</div><div class='add'>+	btrfs_destroy_dev_zone_info(device);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -558,12 +614,52 @@ void btrfs_destroy_dev_zone_info(struct btrfs_device *device)</div><div class='ctx'> 	bitmap_free(zone_info-&gt;active_zones);</div><div class='ctx'> 	bitmap_free(zone_info-&gt;seq_zones);</div><div class='ctx'> 	bitmap_free(zone_info-&gt;empty_zones);</div><div class='add'>+	vfree(zone_info-&gt;zone_cache);</div><div class='ctx'> 	kfree(zone_info);</div><div class='ctx'> 	device-&gt;zone_info = NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_get_dev_zone(struct btrfs_device *device, u64 pos,</div><div class='del'>-		       struct blk_zone *zone)</div><div class='add'>+struct btrfs_zoned_device_info *btrfs_clone_dev_zone_info(struct btrfs_device *orig_dev)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_zoned_device_info *zone_info;</div><div class='add'>+</div><div class='add'>+	zone_info = kmemdup(orig_dev-&gt;zone_info, sizeof(*zone_info), GFP_KERNEL);</div><div class='add'>+	if (!zone_info)</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	zone_info-&gt;seq_zones = bitmap_zalloc(zone_info-&gt;nr_zones, GFP_KERNEL);</div><div class='add'>+	if (!zone_info-&gt;seq_zones)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	bitmap_copy(zone_info-&gt;seq_zones, orig_dev-&gt;zone_info-&gt;seq_zones,</div><div class='add'>+		    zone_info-&gt;nr_zones);</div><div class='add'>+</div><div class='add'>+	zone_info-&gt;empty_zones = bitmap_zalloc(zone_info-&gt;nr_zones, GFP_KERNEL);</div><div class='add'>+	if (!zone_info-&gt;empty_zones)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	bitmap_copy(zone_info-&gt;empty_zones, orig_dev-&gt;zone_info-&gt;empty_zones,</div><div class='add'>+		    zone_info-&gt;nr_zones);</div><div class='add'>+</div><div class='add'>+	zone_info-&gt;active_zones = bitmap_zalloc(zone_info-&gt;nr_zones, GFP_KERNEL);</div><div class='add'>+	if (!zone_info-&gt;active_zones)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	bitmap_copy(zone_info-&gt;active_zones, orig_dev-&gt;zone_info-&gt;active_zones,</div><div class='add'>+		    zone_info-&gt;nr_zones);</div><div class='add'>+	zone_info-&gt;zone_cache = NULL;</div><div class='add'>+</div><div class='add'>+	return zone_info;</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	bitmap_free(zone_info-&gt;seq_zones);</div><div class='add'>+	bitmap_free(zone_info-&gt;empty_zones);</div><div class='add'>+	bitmap_free(zone_info-&gt;active_zones);</div><div class='add'>+	kfree(zone_info);</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int btrfs_get_dev_zone(struct btrfs_device *device, u64 pos, struct blk_zone *zone)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int nr_zones = 1;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -575,75 +671,66 @@ int btrfs_get_dev_zone(struct btrfs_device *device, u64 pos,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int btrfs_check_for_zoned_device(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_device *device;</div><div class='add'>+</div><div class='add'>+	list_for_each_entry(device, &amp;fs_info-&gt;fs_devices-&gt;devices, dev_list) {</div><div class='add'>+		if (device-&gt;bdev &amp;&amp; bdev_is_zoned(device-&gt;bdev)) {</div><div class='add'>+			btrfs_err(fs_info,</div><div class='add'>+				"zoned: mode not enabled but zoned device found: %pg",</div><div class='add'>+				device-&gt;bdev);</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> int btrfs_check_zoned_mode(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_devices *fs_devices = fs_info-&gt;fs_devices;</div><div class='add'>+	struct queue_limits *lim = &amp;fs_info-&gt;limits;</div><div class='ctx'> 	struct btrfs_device *device;</div><div class='del'>-	u64 zoned_devices = 0;</div><div class='del'>-	u64 nr_devices = 0;</div><div class='ctx'> 	u64 zone_size = 0;</div><div class='del'>-	const bool incompat_zoned = btrfs_fs_incompat(fs_info, ZONED);</div><div class='del'>-	int ret = 0;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	/* Count zoned devices */</div><div class='del'>-	list_for_each_entry(device, &amp;fs_devices-&gt;devices, dev_list) {</div><div class='del'>-		enum blk_zoned_model model;</div><div class='add'>+	/*</div><div class='add'>+	 * Host-Managed devices can't be used without the ZONED flag.  With the</div><div class='add'>+	 * ZONED all devices can be used, using zone emulation if required.</div><div class='add'>+	 */</div><div class='add'>+	if (!btrfs_fs_incompat(fs_info, ZONED))</div><div class='add'>+		return btrfs_check_for_zoned_device(fs_info);</div><div class='add'>+</div><div class='add'>+	blk_set_stacking_limits(lim);</div><div class='add'>+</div><div class='add'>+	list_for_each_entry(device, &amp;fs_info-&gt;fs_devices-&gt;devices, dev_list) {</div><div class='add'>+		struct btrfs_zoned_device_info *zone_info = device-&gt;zone_info;</div><div class='ctx'> </div><div class='ctx'> 		if (!device-&gt;bdev)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		model = bdev_zoned_model(device-&gt;bdev);</div><div class='del'>-		/*</div><div class='del'>-		 * A Host-Managed zoned device must be used as a zoned device.</div><div class='del'>-		 * A Host-Aware zoned device and a non-zoned devices can be</div><div class='del'>-		 * treated as a zoned device, if ZONED flag is enabled in the</div><div class='del'>-		 * superblock.</div><div class='del'>-		 */</div><div class='del'>-		if (model == BLK_ZONED_HM ||</div><div class='del'>-		    (model == BLK_ZONED_HA &amp;&amp; incompat_zoned) ||</div><div class='del'>-		    (model == BLK_ZONED_NONE &amp;&amp; incompat_zoned)) {</div><div class='del'>-			struct btrfs_zoned_device_info *zone_info =</div><div class='del'>-				device-&gt;zone_info;</div><div class='del'>-</div><div class='del'>-			zone_info = device-&gt;zone_info;</div><div class='del'>-			zoned_devices++;</div><div class='del'>-			if (!zone_size) {</div><div class='del'>-				zone_size = zone_info-&gt;zone_size;</div><div class='del'>-			} else if (zone_info-&gt;zone_size != zone_size) {</div><div class='del'>-				btrfs_err(fs_info,</div><div class='add'>+		if (!zone_size) {</div><div class='add'>+			zone_size = zone_info-&gt;zone_size;</div><div class='add'>+		} else if (zone_info-&gt;zone_size != zone_size) {</div><div class='add'>+			btrfs_err(fs_info,</div><div class='ctx'> 		"zoned: unequal block device zone sizes: have %llu found %llu",</div><div class='del'>-					  device-&gt;zone_info-&gt;zone_size,</div><div class='del'>-					  zone_size);</div><div class='del'>-				ret = -EINVAL;</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='add'>+				  zone_info-&gt;zone_size, zone_size);</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 		}</div><div class='del'>-		nr_devices++;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!zoned_devices &amp;&amp; !incompat_zoned)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	if (!zoned_devices &amp;&amp; incompat_zoned) {</div><div class='del'>-		/* No zoned block device found on ZONED filesystem */</div><div class='del'>-		btrfs_err(fs_info,</div><div class='del'>-			  "zoned: no zoned devices found on a zoned filesystem");</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	if (zoned_devices &amp;&amp; !incompat_zoned) {</div><div class='del'>-		btrfs_err(fs_info,</div><div class='del'>-			  "zoned: mode not enabled but zoned device found");</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		goto out;</div><div class='add'>+		/*</div><div class='add'>+		 * With the zoned emulation, we can have non-zoned device on the</div><div class='add'>+		 * zoned mode. In this case, we don't have a valid max zone</div><div class='add'>+		 * append size.</div><div class='add'>+		 */</div><div class='add'>+		if (bdev_is_zoned(device-&gt;bdev))</div><div class='add'>+			blk_stack_limits(lim, bdev_limits(device-&gt;bdev), 0);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (zoned_devices != nr_devices) {</div><div class='del'>-		btrfs_err(fs_info,</div><div class='del'>-			  "zoned: cannot mix zoned and regular devices");</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		goto out;</div><div class='add'>+	ret = blk_validate_limits(lim);</div><div class='add'>+	if (ret) {</div><div class='add'>+		btrfs_err(fs_info, "zoned: failed to validate queue limits");</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -655,33 +742,46 @@ int btrfs_check_zoned_mode(struct btrfs_fs_info *fs_info)</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='ctx'> 			  "zoned: zone size %llu not aligned to stripe %u",</div><div class='ctx'> 			  zone_size, BTRFS_STRIPE_LEN);</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		goto out;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (btrfs_fs_incompat(fs_info, MIXED_GROUPS)) {</div><div class='ctx'> 		btrfs_err(fs_info, "zoned: mixed block groups not supported");</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		goto out;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	fs_info-&gt;zone_size = zone_size;</div><div class='add'>+	/*</div><div class='add'>+	 * Also limit max_zone_append_size by max_segments * PAGE_SIZE.</div><div class='add'>+	 * Technically, we can have multiple pages per segment. But, since</div><div class='add'>+	 * we add the pages one by one to a bio, and cannot increase the</div><div class='add'>+	 * metadata reservation even if it increases the number of extents, it</div><div class='add'>+	 * is safe to stick with the limit.</div><div class='add'>+	 */</div><div class='add'>+	fs_info-&gt;max_zone_append_size = ALIGN_DOWN(</div><div class='add'>+		min3((u64)lim-&gt;max_zone_append_sectors &lt;&lt; SECTOR_SHIFT,</div><div class='add'>+		     (u64)lim-&gt;max_sectors &lt;&lt; SECTOR_SHIFT,</div><div class='add'>+		     (u64)lim-&gt;max_segments &lt;&lt; PAGE_SHIFT),</div><div class='add'>+		fs_info-&gt;sectorsize);</div><div class='ctx'> 	fs_info-&gt;fs_devices-&gt;chunk_alloc_policy = BTRFS_CHUNK_ALLOC_ZONED;</div><div class='ctx'> </div><div class='add'>+	fs_info-&gt;max_extent_size = min_not_zero(fs_info-&gt;max_extent_size,</div><div class='add'>+						fs_info-&gt;max_zone_append_size);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Check mount options here, because we might change fs_info-&gt;zoned</div><div class='ctx'> 	 * from fs_info-&gt;zone_size.</div><div class='ctx'> 	 */</div><div class='del'>-	ret = btrfs_check_mountopts_zoned(fs_info);</div><div class='add'>+	ret = btrfs_check_mountopts_zoned(fs_info, &amp;fs_info-&gt;mount_opt);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	btrfs_info(fs_info, "zoned mode enabled with zone size %llu", zone_size);</div><div class='del'>-out:</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_check_mountopts_zoned(struct btrfs_fs_info *info)</div><div class='add'>+int btrfs_check_mountopts_zoned(const struct btrfs_fs_info *info,</div><div class='add'>+				unsigned long long *mount_opt)</div><div class='ctx'> {</div><div class='ctx'> 	if (!btrfs_is_zoned(info))</div><div class='ctx'> 		return 0;</div><div class='hunk'>@@ -690,16 +790,22 @@ int btrfs_check_mountopts_zoned(struct btrfs_fs_info *info)</div><div class='ctx'> 	 * Space cache writing is not COWed. Disable that to avoid write errors</div><div class='ctx'> 	 * in sequential zones.</div><div class='ctx'> 	 */</div><div class='del'>-	if (btrfs_test_opt(info, SPACE_CACHE)) {</div><div class='add'>+	if (btrfs_raw_test_opt(*mount_opt, SPACE_CACHE)) {</div><div class='ctx'> 		btrfs_err(info, "zoned: space cache v1 is not supported");</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (btrfs_test_opt(info, NODATACOW)) {</div><div class='add'>+	if (btrfs_raw_test_opt(*mount_opt, NODATACOW)) {</div><div class='ctx'> 		btrfs_err(info, "zoned: NODATACOW not supported");</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (btrfs_raw_test_opt(*mount_opt, DISCARD_ASYNC)) {</div><div class='add'>+		btrfs_info(info,</div><div class='add'>+			   "zoned: async discard ignored and disabled for zoned mode");</div><div class='add'>+		btrfs_clear_opt(*mount_opt, DISCARD_ASYNC);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -727,11 +833,14 @@ static int sb_log_location(struct block_device *bdev, struct blk_zone *zones,</div><div class='ctx'> 			reset = &amp;zones[1];</div><div class='ctx'> </div><div class='ctx'> 		if (reset &amp;&amp; reset-&gt;cond != BLK_ZONE_COND_EMPTY) {</div><div class='add'>+			unsigned int nofs_flags;</div><div class='add'>+</div><div class='ctx'> 			ASSERT(sb_zone_is_full(reset));</div><div class='ctx'> </div><div class='add'>+			nofs_flags = memalloc_nofs_save();</div><div class='ctx'> 			ret = blkdev_zone_mgmt(bdev, REQ_OP_ZONE_RESET,</div><div class='del'>-					       reset-&gt;start, reset-&gt;len,</div><div class='del'>-					       GFP_NOFS);</div><div class='add'>+					       reset-&gt;start, reset-&gt;len);</div><div class='add'>+			memalloc_nofs_restore(nofs_flags);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				return ret;</div><div class='ctx'> </div><div class='hunk'>@@ -790,12 +899,12 @@ int btrfs_sb_log_location_bdev(struct block_device *bdev, int mirror, int rw,</div><div class='ctx'> 	if (sb_zone + 1 &gt;= nr_zones)</div><div class='ctx'> 		return -ENOENT;</div><div class='ctx'> </div><div class='del'>-	ret = blkdev_report_zones(bdev, zone_start_sector(sb_zone, bdev),</div><div class='del'>-				  BTRFS_NR_SB_LOG_ZONES, copy_zone_info_cb,</div><div class='del'>-				  zones);</div><div class='add'>+	ret = blkdev_report_zones_cached(bdev, zone_start_sector(sb_zone, bdev),</div><div class='add'>+					 BTRFS_NR_SB_LOG_ZONES,</div><div class='add'>+					 copy_zone_info_cb, zones);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='del'>-	if (ret != BTRFS_NR_SB_LOG_ZONES)</div><div class='add'>+	if (unlikely(ret != BTRFS_NR_SB_LOG_ZONES))</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> </div><div class='ctx'> 	return sb_log_location(bdev, zones, rw, bytenr_ret);</div><div class='hunk'>@@ -877,11 +986,14 @@ int btrfs_advance_sb_log(struct btrfs_device *device, int mirror)</div><div class='ctx'> 			 * explicit ZONE_FINISH is not necessary.</div><div class='ctx'> 			 */</div><div class='ctx'> 			if (zone-&gt;wp != zone-&gt;start + zone-&gt;capacity) {</div><div class='add'>+				unsigned int nofs_flags;</div><div class='ctx'> 				int ret;</div><div class='ctx'> </div><div class='add'>+				nofs_flags = memalloc_nofs_save();</div><div class='ctx'> 				ret = blkdev_zone_mgmt(device-&gt;bdev,</div><div class='ctx'> 						REQ_OP_ZONE_FINISH, zone-&gt;start,</div><div class='del'>-						zone-&gt;len, GFP_NOFS);</div><div class='add'>+						zone-&gt;len);</div><div class='add'>+				memalloc_nofs_restore(nofs_flags);</div><div class='ctx'> 				if (ret)</div><div class='ctx'> 					return ret;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -893,17 +1005,19 @@ int btrfs_advance_sb_log(struct btrfs_device *device, int mirror)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* All the zones are FULL. Should not reach here. */</div><div class='del'>-	ASSERT(0);</div><div class='add'>+	DEBUG_WARN("unexpected state, all zones full");</div><div class='ctx'> 	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_reset_sb_log_zones(struct block_device *bdev, int mirror)</div><div class='ctx'> {</div><div class='add'>+	unsigned int nofs_flags;</div><div class='ctx'> 	sector_t zone_sectors;</div><div class='ctx'> 	sector_t nr_sectors;</div><div class='ctx'> 	u8 zone_sectors_shift;</div><div class='ctx'> 	u32 sb_zone;</div><div class='ctx'> 	u32 nr_zones;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	zone_sectors = bdev_zone_sectors(bdev);</div><div class='ctx'> 	zone_sectors_shift = ilog2(zone_sectors);</div><div class='hunk'>@@ -914,13 +1028,16 @@ int btrfs_reset_sb_log_zones(struct block_device *bdev, int mirror)</div><div class='ctx'> 	if (sb_zone + 1 &gt;= nr_zones)</div><div class='ctx'> 		return -ENOENT;</div><div class='ctx'> </div><div class='del'>-	return blkdev_zone_mgmt(bdev, REQ_OP_ZONE_RESET,</div><div class='del'>-				zone_start_sector(sb_zone, bdev),</div><div class='del'>-				zone_sectors * BTRFS_NR_SB_LOG_ZONES, GFP_NOFS);</div><div class='add'>+	nofs_flags = memalloc_nofs_save();</div><div class='add'>+	ret = blkdev_zone_mgmt(bdev, REQ_OP_ZONE_RESET,</div><div class='add'>+			       zone_start_sector(sb_zone, bdev),</div><div class='add'>+			       zone_sectors * BTRFS_NR_SB_LOG_ZONES);</div><div class='add'>+	memalloc_nofs_restore(nofs_flags);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * btrfs_find_allocatable_zones - find allocatable zones within a given region</div><div class='add'>+/*</div><div class='add'>+ * Find allocatable zones within a given region.</div><div class='ctx'>  *</div><div class='ctx'>  * @device:	the device to allocate a region on</div><div class='ctx'>  * @hole_start: the position of the hole to allocate the region</div><div class='hunk'>@@ -941,8 +1058,10 @@ u64 btrfs_find_allocatable_zones(struct btrfs_device *device, u64 hole_start,</div><div class='ctx'> 	bool have_sb;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	ASSERT(IS_ALIGNED(hole_start, zinfo-&gt;zone_size));</div><div class='del'>-	ASSERT(IS_ALIGNED(num_bytes, zinfo-&gt;zone_size));</div><div class='add'>+	ASSERT(IS_ALIGNED(hole_start, zinfo-&gt;zone_size),</div><div class='add'>+	       "hole_start=%llu zinfo-&gt;zone_size=%llu", hole_start, zinfo-&gt;zone_size);</div><div class='add'>+	ASSERT(IS_ALIGNED(num_bytes, zinfo-&gt;zone_size),</div><div class='add'>+	       "num_bytes=%llu zinfo-&gt;zone_size=%llu", num_bytes, zinfo-&gt;zone_size);</div><div class='ctx'> </div><div class='ctx'> 	while (pos &lt; hole_end) {</div><div class='ctx'> 		begin = pos &gt;&gt; shift;</div><div class='hunk'>@@ -953,7 +1072,7 @@ u64 btrfs_find_allocatable_zones(struct btrfs_device *device, u64 hole_start,</div><div class='ctx'> </div><div class='ctx'> 		/* Check if zones in the region are all empty */</div><div class='ctx'> 		if (btrfs_dev_is_sequential(device, pos) &amp;&amp;</div><div class='del'>-		    find_next_zero_bit(zinfo-&gt;empty_zones, end, begin) != end) {</div><div class='add'>+		    !bitmap_test_range_all_set(zinfo-&gt;empty_zones, begin, nzones)) {</div><div class='ctx'> 			pos += zinfo-&gt;zone_size;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1027,12 +1146,14 @@ static void btrfs_dev_clear_active_zone(struct btrfs_device *device, u64 pos)</div><div class='ctx'> int btrfs_reset_device_zone(struct btrfs_device *device, u64 physical,</div><div class='ctx'> 			    u64 length, u64 *bytes)</div><div class='ctx'> {</div><div class='add'>+	unsigned int nofs_flags;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	*bytes = 0;</div><div class='add'>+	nofs_flags = memalloc_nofs_save();</div><div class='ctx'> 	ret = blkdev_zone_mgmt(device-&gt;bdev, REQ_OP_ZONE_RESET,</div><div class='del'>-			       physical &gt;&gt; SECTOR_SHIFT, length &gt;&gt; SECTOR_SHIFT,</div><div class='del'>-			       GFP_NOFS);</div><div class='add'>+			       physical &gt;&gt; SECTOR_SHIFT, length &gt;&gt; SECTOR_SHIFT);</div><div class='add'>+	memalloc_nofs_restore(nofs_flags);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='hunk'>@@ -1052,23 +1173,25 @@ int btrfs_ensure_empty_zones(struct btrfs_device *device, u64 start, u64 size)</div><div class='ctx'> 	struct btrfs_zoned_device_info *zinfo = device-&gt;zone_info;</div><div class='ctx'> 	const u8 shift = zinfo-&gt;zone_size_shift;</div><div class='ctx'> 	unsigned long begin = start &gt;&gt; shift;</div><div class='del'>-	unsigned long end = (start + size) &gt;&gt; shift;</div><div class='add'>+	unsigned long nbits = size &gt;&gt; shift;</div><div class='ctx'> 	u64 pos;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ASSERT(IS_ALIGNED(start, zinfo-&gt;zone_size));</div><div class='del'>-	ASSERT(IS_ALIGNED(size, zinfo-&gt;zone_size));</div><div class='add'>+	ASSERT(IS_ALIGNED(start, zinfo-&gt;zone_size),</div><div class='add'>+	       "start=%llu, zinfo-&gt;zone_size=%llu", start, zinfo-&gt;zone_size);</div><div class='add'>+	ASSERT(IS_ALIGNED(size, zinfo-&gt;zone_size),</div><div class='add'>+	       "size=%llu, zinfo-&gt;zone_size=%llu", size, zinfo-&gt;zone_size);</div><div class='ctx'> </div><div class='del'>-	if (end &gt; zinfo-&gt;nr_zones)</div><div class='add'>+	if (begin + nbits &gt; zinfo-&gt;nr_zones)</div><div class='ctx'> 		return -ERANGE;</div><div class='ctx'> </div><div class='ctx'> 	/* All the zones are conventional */</div><div class='del'>-	if (find_next_bit(zinfo-&gt;seq_zones, begin, end) == end)</div><div class='add'>+	if (bitmap_test_range_all_zero(zinfo-&gt;seq_zones, begin, nbits))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/* All the zones are sequential and empty */</div><div class='del'>-	if (find_next_zero_bit(zinfo-&gt;seq_zones, begin, end) == end &amp;&amp;</div><div class='del'>-	    find_next_zero_bit(zinfo-&gt;empty_zones, begin, end) == end)</div><div class='add'>+	if (bitmap_test_range_all_set(zinfo-&gt;seq_zones, begin, nbits) &amp;&amp;</div><div class='add'>+	    bitmap_test_range_all_set(zinfo-&gt;empty_zones, begin, nbits))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	for (pos = start; pos &lt; start + size; pos += zinfo-&gt;zone_size) {</div><div class='hunk'>@@ -1079,10 +1202,10 @@ int btrfs_ensure_empty_zones(struct btrfs_device *device, u64 start, u64 size)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		/* Free regions should be empty */</div><div class='del'>-		btrfs_warn_in_rcu(</div><div class='add'>+		btrfs_warn(</div><div class='ctx'> 			device-&gt;fs_info,</div><div class='ctx'> 		"zoned: resetting device %s (devid %llu) zone %llu for allocation",</div><div class='del'>-			rcu_str_deref(device-&gt;name), device-&gt;devid, pos &gt;&gt; shift);</div><div class='add'>+			rcu_dereference(device-&gt;name), device-&gt;devid, pos &gt;&gt; shift);</div><div class='ctx'> 		WARN_ON_ONCE(1);</div><div class='ctx'> </div><div class='ctx'> 		ret = btrfs_reset_device_zone(device, pos, zinfo-&gt;zone_size,</div><div class='hunk'>@@ -1101,16 +1224,31 @@ int btrfs_ensure_empty_zones(struct btrfs_device *device, u64 start, u64 size)</div><div class='ctx'>  * offset.</div><div class='ctx'>  */</div><div class='ctx'> static int calculate_alloc_pointer(struct btrfs_block_group *cache,</div><div class='del'>-				   u64 *offset_ret)</div><div class='add'>+				   u64 *offset_ret, bool new)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = cache-&gt;fs_info;</div><div class='del'>-	struct btrfs_root *root = fs_info-&gt;extent_root;</div><div class='del'>-	struct btrfs_path *path;</div><div class='add'>+	struct btrfs_root *root;</div><div class='add'>+	BTRFS_PATH_AUTO_FREE(path);</div><div class='ctx'> 	struct btrfs_key key;</div><div class='ctx'> 	struct btrfs_key found_key;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	u64 length;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Avoid  tree lookups for a new block group, there's no use for it.</div><div class='add'>+	 * It must always be 0.</div><div class='add'>+	 *</div><div class='add'>+	 * Also, we have a lock chain of extent buffer lock -&gt; chunk mutex.</div><div class='add'>+	 * For new a block group, this function is called from</div><div class='add'>+	 * btrfs_make_block_group() which is already taking the chunk mutex.</div><div class='add'>+	 * Thus, we cannot call calculate_alloc_pointer() which takes extent</div><div class='add'>+	 * buffer locks to avoid deadlock.</div><div class='add'>+	 */</div><div class='add'>+	if (new) {</div><div class='add'>+		*offset_ret = 0;</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	path = btrfs_alloc_path();</div><div class='ctx'> 	if (!path)</div><div class='ctx'> 		return -ENOMEM;</div><div class='hunk'>@@ -1119,12 +1257,13 @@ static int calculate_alloc_pointer(struct btrfs_block_group *cache,</div><div class='ctx'> 	key.type = 0;</div><div class='ctx'> 	key.offset = 0;</div><div class='ctx'> </div><div class='add'>+	root = btrfs_extent_root(fs_info, key.objectid);</div><div class='ctx'> 	ret = btrfs_search_slot(NULL, root, &amp;key, path, 0, 0);</div><div class='ctx'> 	/* We should not find the exact match */</div><div class='del'>-	if (!ret)</div><div class='add'>+	if (unlikely(!ret))</div><div class='ctx'> 		ret = -EUCLEAN;</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	ret = btrfs_previous_extent_item(root, path, cache-&gt;start);</div><div class='ctx'> 	if (ret) {</div><div class='hunk'>@@ -1132,7 +1271,7 @@ static int calculate_alloc_pointer(struct btrfs_block_group *cache,</div><div class='ctx'> 			ret = 0;</div><div class='ctx'> 			*offset_ret = 0;</div><div class='ctx'> 		}</div><div class='del'>-		goto out;</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	btrfs_item_key_to_cpu(path-&gt;nodes[0], &amp;found_key, path-&gt;slots[0]);</div><div class='hunk'>@@ -1142,232 +1281,451 @@ static int calculate_alloc_pointer(struct btrfs_block_group *cache,</div><div class='ctx'> 	else</div><div class='ctx'> 		length = fs_info-&gt;nodesize;</div><div class='ctx'> </div><div class='del'>-	if (!(found_key.objectid &gt;= cache-&gt;start &amp;&amp;</div><div class='del'>-	       found_key.objectid + length &lt;= cache-&gt;start + cache-&gt;length)) {</div><div class='del'>-		ret = -EUCLEAN;</div><div class='del'>-		goto out;</div><div class='add'>+	if (unlikely(!(found_key.objectid &gt;= cache-&gt;start &amp;&amp;</div><div class='add'>+		       found_key.objectid + length &lt;= cache-&gt;start + cache-&gt;length))) {</div><div class='add'>+		return -EUCLEAN;</div><div class='ctx'> 	}</div><div class='ctx'> 	*offset_ret = found_key.objectid + length - cache-&gt;start;</div><div class='del'>-	ret = 0;</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	btrfs_free_path(path);</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_load_block_group_zone_info(struct btrfs_block_group *cache, bool new)</div><div class='add'>+struct zone_info {</div><div class='add'>+	u64 physical;</div><div class='add'>+	u64 capacity;</div><div class='add'>+	u64 alloc_offset;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int btrfs_load_zone_info(struct btrfs_fs_info *fs_info, int zone_idx,</div><div class='add'>+				struct zone_info *info, unsigned long *active,</div><div class='add'>+				struct btrfs_chunk_map *map, bool new)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_fs_info *fs_info = cache-&gt;fs_info;</div><div class='del'>-	struct extent_map_tree *em_tree = &amp;fs_info-&gt;mapping_tree;</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	struct map_lookup *map;</div><div class='add'>+	struct btrfs_dev_replace *dev_replace = &amp;fs_info-&gt;dev_replace;</div><div class='ctx'> 	struct btrfs_device *device;</div><div class='del'>-	u64 logical = cache-&gt;start;</div><div class='del'>-	u64 length = cache-&gt;length;</div><div class='del'>-	u64 physical = 0;</div><div class='del'>-	int ret;</div><div class='del'>-	int i;</div><div class='add'>+	int dev_replace_is_ongoing = 0;</div><div class='ctx'> 	unsigned int nofs_flag;</div><div class='del'>-	u64 *alloc_offsets = NULL;</div><div class='del'>-	u64 *caps = NULL;</div><div class='del'>-	unsigned long *active = NULL;</div><div class='del'>-	u64 last_alloc = 0;</div><div class='del'>-	u32 num_sequential = 0, num_conventional = 0;</div><div class='add'>+	struct blk_zone zone;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	if (!btrfs_is_zoned(fs_info))</div><div class='add'>+	info-&gt;physical = map-&gt;stripes[zone_idx].physical;</div><div class='add'>+</div><div class='add'>+	down_read(&amp;dev_replace-&gt;rwsem);</div><div class='add'>+	device = map-&gt;stripes[zone_idx].dev;</div><div class='add'>+</div><div class='add'>+	if (!device-&gt;bdev) {</div><div class='add'>+		up_read(&amp;dev_replace-&gt;rwsem);</div><div class='add'>+		info-&gt;alloc_offset = WP_MISSING_DEV;</div><div class='ctx'> 		return 0;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	/* Sanity check */</div><div class='del'>-	if (!IS_ALIGNED(length, fs_info-&gt;zone_size)) {</div><div class='add'>+	/* Consider a zone as active if we can allow any number of active zones. */</div><div class='add'>+	if (!device-&gt;zone_info-&gt;max_active_zones)</div><div class='add'>+		__set_bit(zone_idx, active);</div><div class='add'>+</div><div class='add'>+	if (!btrfs_dev_is_sequential(device, info-&gt;physical)) {</div><div class='add'>+		up_read(&amp;dev_replace-&gt;rwsem);</div><div class='add'>+		info-&gt;alloc_offset = WP_CONVENTIONAL;</div><div class='add'>+		info-&gt;capacity = device-&gt;zone_info-&gt;zone_size;</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ASSERT(!new || btrfs_dev_is_empty_zone(device, info-&gt;physical));</div><div class='add'>+</div><div class='add'>+	/* This zone will be used for allocation, so mark this zone non-empty. */</div><div class='add'>+	btrfs_dev_clear_zone_empty(device, info-&gt;physical);</div><div class='add'>+</div><div class='add'>+	dev_replace_is_ongoing = btrfs_dev_replace_is_ongoing(dev_replace);</div><div class='add'>+	if (dev_replace_is_ongoing &amp;&amp; dev_replace-&gt;tgtdev != NULL)</div><div class='add'>+		btrfs_dev_clear_zone_empty(dev_replace-&gt;tgtdev, info-&gt;physical);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The group is mapped to a sequential zone. Get the zone write pointer</div><div class='add'>+	 * to determine the allocation offset within the zone.</div><div class='add'>+	 */</div><div class='add'>+	WARN_ON(!IS_ALIGNED(info-&gt;physical, fs_info-&gt;zone_size));</div><div class='add'>+</div><div class='add'>+	if (new) {</div><div class='add'>+		sector_t capacity;</div><div class='add'>+</div><div class='add'>+		capacity = bdev_zone_capacity(device-&gt;bdev, info-&gt;physical &gt;&gt; SECTOR_SHIFT);</div><div class='add'>+		up_read(&amp;dev_replace-&gt;rwsem);</div><div class='add'>+		info-&gt;alloc_offset = 0;</div><div class='add'>+		info-&gt;capacity = capacity &lt;&lt; SECTOR_SHIFT;</div><div class='add'>+</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	nofs_flag = memalloc_nofs_save();</div><div class='add'>+	ret = btrfs_get_dev_zone(device, info-&gt;physical, &amp;zone);</div><div class='add'>+	memalloc_nofs_restore(nofs_flag);</div><div class='add'>+	if (ret) {</div><div class='add'>+		up_read(&amp;dev_replace-&gt;rwsem);</div><div class='add'>+		if (ret != -EIO &amp;&amp; ret != -EOPNOTSUPP)</div><div class='add'>+			return ret;</div><div class='add'>+		info-&gt;alloc_offset = WP_MISSING_DEV;</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (unlikely(zone.type == BLK_ZONE_TYPE_CONVENTIONAL)) {</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='del'>-		"zoned: block group %llu len %llu unaligned to zone size %llu",</div><div class='del'>-			  logical, length, fs_info-&gt;zone_size);</div><div class='add'>+		"zoned: unexpected conventional zone %llu on device %s (devid %llu)",</div><div class='add'>+			zone.start &lt;&lt; SECTOR_SHIFT, rcu_dereference(device-&gt;name),</div><div class='add'>+			device-&gt;devid);</div><div class='add'>+		up_read(&amp;dev_replace-&gt;rwsem);</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Get the chunk mapping */</div><div class='del'>-	read_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	em = lookup_extent_mapping(em_tree, logical, length);</div><div class='del'>-	read_unlock(&amp;em_tree-&gt;lock);</div><div class='add'>+	info-&gt;capacity = (zone.capacity &lt;&lt; SECTOR_SHIFT);</div><div class='add'>+</div><div class='add'>+	switch (zone.cond) {</div><div class='add'>+	case BLK_ZONE_COND_OFFLINE:</div><div class='add'>+	case BLK_ZONE_COND_READONLY:</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+		"zoned: offline/readonly zone %llu on device %s (devid %llu)",</div><div class='add'>+			  (info-&gt;physical &gt;&gt; device-&gt;zone_info-&gt;zone_size_shift),</div><div class='add'>+			  rcu_dereference(device-&gt;name), device-&gt;devid);</div><div class='add'>+		info-&gt;alloc_offset = WP_MISSING_DEV;</div><div class='add'>+		break;</div><div class='add'>+	case BLK_ZONE_COND_EMPTY:</div><div class='add'>+		info-&gt;alloc_offset = 0;</div><div class='add'>+		break;</div><div class='add'>+	case BLK_ZONE_COND_FULL:</div><div class='add'>+		info-&gt;alloc_offset = info-&gt;capacity;</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		/* Partially used zone. */</div><div class='add'>+		info-&gt;alloc_offset = ((zone.wp - zone.start) &lt;&lt; SECTOR_SHIFT);</div><div class='add'>+		__set_bit(zone_idx, active);</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	up_read(&amp;dev_replace-&gt;rwsem);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if (!em)</div><div class='add'>+static int btrfs_load_block_group_single(struct btrfs_block_group *bg,</div><div class='add'>+					 struct zone_info *info,</div><div class='add'>+					 unsigned long *active)</div><div class='add'>+{</div><div class='add'>+	if (unlikely(info-&gt;alloc_offset == WP_MISSING_DEV)) {</div><div class='add'>+		btrfs_err(bg-&gt;fs_info,</div><div class='add'>+			"zoned: cannot recover write pointer for zone %llu",</div><div class='add'>+			info-&gt;physical);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	bg-&gt;alloc_offset = info-&gt;alloc_offset;</div><div class='add'>+	bg-&gt;zone_capacity = info-&gt;capacity;</div><div class='add'>+	if (test_bit(0, active))</div><div class='add'>+		set_bit(BLOCK_GROUP_FLAG_ZONE_IS_ACTIVE, &amp;bg-&gt;runtime_flags);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int btrfs_load_block_group_dup(struct btrfs_block_group *bg,</div><div class='add'>+				      struct btrfs_chunk_map *map,</div><div class='add'>+				      struct zone_info *zone_info,</div><div class='add'>+				      unsigned long *active,</div><div class='add'>+				      u64 last_alloc)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = bg-&gt;fs_info;</div><div class='add'>+</div><div class='add'>+	if ((map-&gt;type &amp; BTRFS_BLOCK_GROUP_DATA) &amp;&amp; !fs_info-&gt;stripe_root) {</div><div class='add'>+		btrfs_err(fs_info, "zoned: data DUP profile needs raid-stripe-tree");</div><div class='ctx'> 		return -EINVAL;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	map = em-&gt;map_lookup;</div><div class='add'>+	bg-&gt;zone_capacity = min_not_zero(zone_info[0].capacity, zone_info[1].capacity);</div><div class='ctx'> </div><div class='del'>-	cache-&gt;physical_map = kmemdup(map, map_lookup_size(map-&gt;num_stripes), GFP_NOFS);</div><div class='del'>-	if (!cache-&gt;physical_map) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='add'>+	if (unlikely(zone_info[0].alloc_offset == WP_MISSING_DEV)) {</div><div class='add'>+		btrfs_err(bg-&gt;fs_info,</div><div class='add'>+			  "zoned: cannot recover write pointer for zone %llu",</div><div class='add'>+			  zone_info[0].physical);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+	if (unlikely(zone_info[1].alloc_offset == WP_MISSING_DEV)) {</div><div class='add'>+		btrfs_err(bg-&gt;fs_info,</div><div class='add'>+			  "zoned: cannot recover write pointer for zone %llu",</div><div class='add'>+			  zone_info[1].physical);</div><div class='add'>+		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	alloc_offsets = kcalloc(map-&gt;num_stripes, sizeof(*alloc_offsets), GFP_NOFS);</div><div class='del'>-	if (!alloc_offsets) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='add'>+	if (zone_info[0].alloc_offset == WP_CONVENTIONAL)</div><div class='add'>+		zone_info[0].alloc_offset = last_alloc;</div><div class='add'>+</div><div class='add'>+	if (zone_info[1].alloc_offset == WP_CONVENTIONAL)</div><div class='add'>+		zone_info[1].alloc_offset = last_alloc;</div><div class='add'>+</div><div class='add'>+	if (unlikely(zone_info[0].alloc_offset != zone_info[1].alloc_offset)) {</div><div class='add'>+		btrfs_err(bg-&gt;fs_info,</div><div class='add'>+			  "zoned: write pointer offset mismatch of zones in DUP profile");</div><div class='add'>+		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	caps = kcalloc(map-&gt;num_stripes, sizeof(*caps), GFP_NOFS);</div><div class='del'>-	if (!caps) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='add'>+	if (test_bit(0, active) != test_bit(1, active)) {</div><div class='add'>+		if (unlikely(!btrfs_zone_activate(bg)))</div><div class='add'>+			return -EIO;</div><div class='add'>+	} else if (test_bit(0, active)) {</div><div class='add'>+		set_bit(BLOCK_GROUP_FLAG_ZONE_IS_ACTIVE, &amp;bg-&gt;runtime_flags);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	active = bitmap_zalloc(map-&gt;num_stripes, GFP_NOFS);</div><div class='del'>-	if (!active) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='add'>+	bg-&gt;alloc_offset = zone_info[0].alloc_offset;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int btrfs_load_block_group_raid1(struct btrfs_block_group *bg,</div><div class='add'>+					struct btrfs_chunk_map *map,</div><div class='add'>+					struct zone_info *zone_info,</div><div class='add'>+					unsigned long *active,</div><div class='add'>+					u64 last_alloc)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = bg-&gt;fs_info;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	if ((map-&gt;type &amp; BTRFS_BLOCK_GROUP_DATA) &amp;&amp; !fs_info-&gt;stripe_root) {</div><div class='add'>+		btrfs_err(fs_info, "zoned: data %s needs raid-stripe-tree",</div><div class='add'>+			  btrfs_bg_type_to_raid_name(map-&gt;type));</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/* In case a device is missing we have a cap of 0, so don't use it. */</div><div class='add'>+	bg-&gt;zone_capacity = min_not_zero(zone_info[0].capacity, zone_info[1].capacity);</div><div class='add'>+</div><div class='ctx'> 	for (i = 0; i &lt; map-&gt;num_stripes; i++) {</div><div class='del'>-		bool is_sequential;</div><div class='del'>-		struct blk_zone zone;</div><div class='del'>-		struct btrfs_dev_replace *dev_replace = &amp;fs_info-&gt;dev_replace;</div><div class='del'>-		int dev_replace_is_ongoing = 0;</div><div class='add'>+		if (zone_info[i].alloc_offset == WP_MISSING_DEV)</div><div class='add'>+			continue;</div><div class='ctx'> </div><div class='del'>-		device = map-&gt;stripes[i].dev;</div><div class='del'>-		physical = map-&gt;stripes[i].physical;</div><div class='add'>+		if (zone_info[i].alloc_offset == WP_CONVENTIONAL)</div><div class='add'>+			zone_info[i].alloc_offset = last_alloc;</div><div class='ctx'> </div><div class='del'>-		if (device-&gt;bdev == NULL) {</div><div class='del'>-			alloc_offsets[i] = WP_MISSING_DEV;</div><div class='del'>-			continue;</div><div class='add'>+		if (unlikely((zone_info[0].alloc_offset != zone_info[i].alloc_offset) &amp;&amp;</div><div class='add'>+			     !btrfs_test_opt(fs_info, DEGRADED))) {</div><div class='add'>+			btrfs_err(fs_info,</div><div class='add'>+			"zoned: write pointer offset mismatch of zones in %s profile",</div><div class='add'>+				  btrfs_bg_type_to_raid_name(map-&gt;type));</div><div class='add'>+			return -EIO;</div><div class='ctx'> 		}</div><div class='add'>+		if (test_bit(0, active) != test_bit(i, active)) {</div><div class='add'>+			if (unlikely(!btrfs_test_opt(fs_info, DEGRADED) &amp;&amp;</div><div class='add'>+				     !btrfs_zone_activate(bg))) {</div><div class='add'>+				return -EIO;</div><div class='add'>+			}</div><div class='add'>+		} else {</div><div class='add'>+			if (test_bit(0, active))</div><div class='add'>+				set_bit(BLOCK_GROUP_FLAG_ZONE_IS_ACTIVE, &amp;bg-&gt;runtime_flags);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		is_sequential = btrfs_dev_is_sequential(device, physical);</div><div class='del'>-		if (is_sequential)</div><div class='del'>-			num_sequential++;</div><div class='del'>-		else</div><div class='del'>-			num_conventional++;</div><div class='add'>+	if (zone_info[0].alloc_offset != WP_MISSING_DEV)</div><div class='add'>+		bg-&gt;alloc_offset = zone_info[0].alloc_offset;</div><div class='add'>+	else</div><div class='add'>+		bg-&gt;alloc_offset = zone_info[i - 1].alloc_offset;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		if (!is_sequential) {</div><div class='del'>-			alloc_offsets[i] = WP_CONVENTIONAL;</div><div class='add'>+static int btrfs_load_block_group_raid0(struct btrfs_block_group *bg,</div><div class='add'>+					struct btrfs_chunk_map *map,</div><div class='add'>+					struct zone_info *zone_info,</div><div class='add'>+					unsigned long *active,</div><div class='add'>+					u64 last_alloc)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = bg-&gt;fs_info;</div><div class='add'>+	u64 stripe_nr = 0, stripe_offset = 0;</div><div class='add'>+	u32 stripe_index = 0;</div><div class='add'>+</div><div class='add'>+	if ((map-&gt;type &amp; BTRFS_BLOCK_GROUP_DATA) &amp;&amp; !fs_info-&gt;stripe_root) {</div><div class='add'>+		btrfs_err(fs_info, "zoned: data %s needs raid-stripe-tree",</div><div class='add'>+			  btrfs_bg_type_to_raid_name(map-&gt;type));</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (last_alloc) {</div><div class='add'>+		u32 factor = map-&gt;num_stripes;</div><div class='add'>+</div><div class='add'>+		stripe_nr = last_alloc &gt;&gt; BTRFS_STRIPE_LEN_SHIFT;</div><div class='add'>+		stripe_offset = last_alloc &amp; BTRFS_STRIPE_LEN_MASK;</div><div class='add'>+		stripe_nr = div_u64_rem(stripe_nr, factor, &amp;stripe_index);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for (int i = 0; i &lt; map-&gt;num_stripes; i++) {</div><div class='add'>+		if (zone_info[i].alloc_offset == WP_MISSING_DEV)</div><div class='ctx'> 			continue;</div><div class='add'>+</div><div class='add'>+		if (zone_info[i].alloc_offset == WP_CONVENTIONAL) {</div><div class='add'>+</div><div class='add'>+			zone_info[i].alloc_offset = btrfs_stripe_nr_to_offset(stripe_nr);</div><div class='add'>+</div><div class='add'>+			if (stripe_index &gt; i)</div><div class='add'>+				zone_info[i].alloc_offset += BTRFS_STRIPE_LEN;</div><div class='add'>+			else if (stripe_index == i)</div><div class='add'>+				zone_info[i].alloc_offset += stripe_offset;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * This zone will be used for allocation, so mark this zone</div><div class='del'>-		 * non-empty.</div><div class='del'>-		 */</div><div class='del'>-		btrfs_dev_clear_zone_empty(device, physical);</div><div class='add'>+		if (test_bit(0, active) != test_bit(i, active)) {</div><div class='add'>+			if (unlikely(!btrfs_zone_activate(bg)))</div><div class='add'>+				return -EIO;</div><div class='add'>+		} else {</div><div class='add'>+			if (test_bit(0, active))</div><div class='add'>+				set_bit(BLOCK_GROUP_FLAG_ZONE_IS_ACTIVE, &amp;bg-&gt;runtime_flags);</div><div class='add'>+		}</div><div class='add'>+		bg-&gt;zone_capacity += zone_info[i].capacity;</div><div class='add'>+		bg-&gt;alloc_offset += zone_info[i].alloc_offset;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		down_read(&amp;dev_replace-&gt;rwsem);</div><div class='del'>-		dev_replace_is_ongoing = btrfs_dev_replace_is_ongoing(dev_replace);</div><div class='del'>-		if (dev_replace_is_ongoing &amp;&amp; dev_replace-&gt;tgtdev != NULL)</div><div class='del'>-			btrfs_dev_clear_zone_empty(dev_replace-&gt;tgtdev, physical);</div><div class='del'>-		up_read(&amp;dev_replace-&gt;rwsem);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * The group is mapped to a sequential zone. Get the zone write</div><div class='del'>-		 * pointer to determine the allocation offset within the zone.</div><div class='del'>-		 */</div><div class='del'>-		WARN_ON(!IS_ALIGNED(physical, fs_info-&gt;zone_size));</div><div class='del'>-		nofs_flag = memalloc_nofs_save();</div><div class='del'>-		ret = btrfs_get_dev_zone(device, physical, &amp;zone);</div><div class='del'>-		memalloc_nofs_restore(nofs_flag);</div><div class='del'>-		if (ret == -EIO || ret == -EOPNOTSUPP) {</div><div class='del'>-			ret = 0;</div><div class='del'>-			alloc_offsets[i] = WP_MISSING_DEV;</div><div class='add'>+static int btrfs_load_block_group_raid10(struct btrfs_block_group *bg,</div><div class='add'>+					 struct btrfs_chunk_map *map,</div><div class='add'>+					 struct zone_info *zone_info,</div><div class='add'>+					 unsigned long *active,</div><div class='add'>+					 u64 last_alloc)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = bg-&gt;fs_info;</div><div class='add'>+	u64 stripe_nr = 0, stripe_offset = 0;</div><div class='add'>+	u32 stripe_index = 0;</div><div class='add'>+</div><div class='add'>+	if ((map-&gt;type &amp; BTRFS_BLOCK_GROUP_DATA) &amp;&amp; !fs_info-&gt;stripe_root) {</div><div class='add'>+		btrfs_err(fs_info, "zoned: data %s needs raid-stripe-tree",</div><div class='add'>+			  btrfs_bg_type_to_raid_name(map-&gt;type));</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (last_alloc) {</div><div class='add'>+		u32 factor = map-&gt;num_stripes / map-&gt;sub_stripes;</div><div class='add'>+</div><div class='add'>+		stripe_nr = last_alloc &gt;&gt; BTRFS_STRIPE_LEN_SHIFT;</div><div class='add'>+		stripe_offset = last_alloc &amp; BTRFS_STRIPE_LEN_MASK;</div><div class='add'>+		stripe_nr = div_u64_rem(stripe_nr, factor, &amp;stripe_index);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for (int i = 0; i &lt; map-&gt;num_stripes; i++) {</div><div class='add'>+		if (zone_info[i].alloc_offset == WP_MISSING_DEV)</div><div class='ctx'> 			continue;</div><div class='del'>-		} else if (ret) {</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='ctx'> </div><div class='del'>-		if (zone.type == BLK_ZONE_TYPE_CONVENTIONAL) {</div><div class='del'>-			btrfs_err_in_rcu(fs_info,</div><div class='del'>-	"zoned: unexpected conventional zone %llu on device %s (devid %llu)",</div><div class='del'>-				zone.start &lt;&lt; SECTOR_SHIFT,</div><div class='del'>-				rcu_str_deref(device-&gt;name), device-&gt;devid);</div><div class='del'>-			ret = -EIO;</div><div class='del'>-			goto out;</div><div class='add'>+		if (test_bit(0, active) != test_bit(i, active)) {</div><div class='add'>+			if (unlikely(!btrfs_zone_activate(bg)))</div><div class='add'>+				return -EIO;</div><div class='add'>+		} else {</div><div class='add'>+			if (test_bit(0, active))</div><div class='add'>+				set_bit(BLOCK_GROUP_FLAG_ZONE_IS_ACTIVE, &amp;bg-&gt;runtime_flags);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		caps[i] = (zone.capacity &lt;&lt; SECTOR_SHIFT);</div><div class='add'>+		if (zone_info[i].alloc_offset == WP_CONVENTIONAL) {</div><div class='add'>+			zone_info[i].alloc_offset = btrfs_stripe_nr_to_offset(stripe_nr);</div><div class='ctx'> </div><div class='del'>-		switch (zone.cond) {</div><div class='del'>-		case BLK_ZONE_COND_OFFLINE:</div><div class='del'>-		case BLK_ZONE_COND_READONLY:</div><div class='del'>-			btrfs_err(fs_info,</div><div class='del'>-		"zoned: offline/readonly zone %llu on device %s (devid %llu)",</div><div class='del'>-				  physical &gt;&gt; device-&gt;zone_info-&gt;zone_size_shift,</div><div class='del'>-				  rcu_str_deref(device-&gt;name), device-&gt;devid);</div><div class='del'>-			alloc_offsets[i] = WP_MISSING_DEV;</div><div class='del'>-			break;</div><div class='del'>-		case BLK_ZONE_COND_EMPTY:</div><div class='del'>-			alloc_offsets[i] = 0;</div><div class='del'>-			break;</div><div class='del'>-		case BLK_ZONE_COND_FULL:</div><div class='del'>-			alloc_offsets[i] = caps[i];</div><div class='del'>-			break;</div><div class='del'>-		default:</div><div class='del'>-			/* Partially used zone */</div><div class='del'>-			alloc_offsets[i] =</div><div class='del'>-					((zone.wp - zone.start) &lt;&lt; SECTOR_SHIFT);</div><div class='del'>-			__set_bit(i, active);</div><div class='del'>-			break;</div><div class='add'>+			if (stripe_index &gt; (i / map-&gt;sub_stripes))</div><div class='add'>+				zone_info[i].alloc_offset += BTRFS_STRIPE_LEN;</div><div class='add'>+			else if (stripe_index == (i / map-&gt;sub_stripes))</div><div class='add'>+				zone_info[i].alloc_offset += stripe_offset;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * Consider a zone as active if we can allow any number of</div><div class='del'>-		 * active zones.</div><div class='del'>-		 */</div><div class='del'>-		if (!device-&gt;zone_info-&gt;max_active_zones)</div><div class='del'>-			__set_bit(i, active);</div><div class='add'>+		if ((i % map-&gt;sub_stripes) == 0) {</div><div class='add'>+			bg-&gt;zone_capacity += zone_info[i].capacity;</div><div class='add'>+			bg-&gt;alloc_offset += zone_info[i].alloc_offset;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (num_sequential &gt; 0)</div><div class='del'>-		cache-&gt;seq_zone = true;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if (num_conventional &gt; 0) {</div><div class='del'>-		/*</div><div class='del'>-		 * Avoid calling calculate_alloc_pointer() for new BG. It</div><div class='del'>-		 * is no use for new BG. It must be always 0.</div><div class='del'>-		 *</div><div class='del'>-		 * Also, we have a lock chain of extent buffer lock -&gt;</div><div class='del'>-		 * chunk mutex.  For new BG, this function is called from</div><div class='del'>-		 * btrfs_make_block_group() which is already taking the</div><div class='del'>-		 * chunk mutex. Thus, we cannot call</div><div class='del'>-		 * calculate_alloc_pointer() which takes extent buffer</div><div class='del'>-		 * locks to avoid deadlock.</div><div class='del'>-		 */</div><div class='add'>+int btrfs_load_block_group_zone_info(struct btrfs_block_group *cache, bool new)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = cache-&gt;fs_info;</div><div class='add'>+	struct btrfs_chunk_map *map;</div><div class='add'>+	u64 logical = cache-&gt;start;</div><div class='add'>+	u64 length = cache-&gt;length;</div><div class='add'>+	struct zone_info AUTO_KFREE(zone_info);</div><div class='add'>+	int ret;</div><div class='add'>+	int i;</div><div class='add'>+	unsigned long *active = NULL;</div><div class='add'>+	u64 last_alloc = 0;</div><div class='add'>+	u32 num_sequential = 0, num_conventional = 0;</div><div class='add'>+	u64 profile;</div><div class='add'>+</div><div class='add'>+	if (!btrfs_is_zoned(fs_info))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/* Sanity check */</div><div class='add'>+	if (unlikely(!IS_ALIGNED(length, fs_info-&gt;zone_size))) {</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+		"zoned: block group %llu len %llu unaligned to zone size %llu",</div><div class='add'>+			  logical, length, fs_info-&gt;zone_size);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	map = btrfs_find_chunk_map(fs_info, logical, length);</div><div class='add'>+	if (!map)</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-		/* Zone capacity is always zone size in emulation */</div><div class='del'>-		cache-&gt;zone_capacity = cache-&gt;length;</div><div class='del'>-		if (new) {</div><div class='del'>-			cache-&gt;alloc_offset = 0;</div><div class='add'>+	cache-&gt;physical_map = map;</div><div class='add'>+</div><div class='add'>+	zone_info = kcalloc(map-&gt;num_stripes, sizeof(*zone_info), GFP_NOFS);</div><div class='add'>+	if (!zone_info) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	active = bitmap_zalloc(map-&gt;num_stripes, GFP_NOFS);</div><div class='add'>+	if (!active) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; map-&gt;num_stripes; i++) {</div><div class='add'>+		ret = btrfs_load_zone_info(fs_info, i, &amp;zone_info[i], active, map, new);</div><div class='add'>+		if (ret)</div><div class='ctx'> 			goto out;</div><div class='del'>-		}</div><div class='del'>-		ret = calculate_alloc_pointer(cache, &amp;last_alloc);</div><div class='del'>-		if (ret || map-&gt;num_stripes == num_conventional) {</div><div class='del'>-			if (!ret)</div><div class='del'>-				cache-&gt;alloc_offset = last_alloc;</div><div class='del'>-			else</div><div class='del'>-				btrfs_err(fs_info,</div><div class='add'>+</div><div class='add'>+		if (zone_info[i].alloc_offset == WP_CONVENTIONAL)</div><div class='add'>+			num_conventional++;</div><div class='add'>+		else</div><div class='add'>+			num_sequential++;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (num_sequential &gt; 0)</div><div class='add'>+		set_bit(BLOCK_GROUP_FLAG_SEQUENTIAL_ZONE, &amp;cache-&gt;runtime_flags);</div><div class='add'>+</div><div class='add'>+	if (num_conventional &gt; 0) {</div><div class='add'>+		ret = calculate_alloc_pointer(cache, &amp;last_alloc, new);</div><div class='add'>+		if (ret) {</div><div class='add'>+			btrfs_err(fs_info,</div><div class='ctx'> 			"zoned: failed to determine allocation offset of bg %llu",</div><div class='del'>-					  cache-&gt;start);</div><div class='add'>+				  cache-&gt;start);</div><div class='add'>+			goto out;</div><div class='add'>+		} else if (map-&gt;num_stripes == num_conventional) {</div><div class='add'>+			cache-&gt;alloc_offset = last_alloc;</div><div class='add'>+			cache-&gt;zone_capacity = cache-&gt;length;</div><div class='add'>+			set_bit(BLOCK_GROUP_FLAG_ZONE_IS_ACTIVE, &amp;cache-&gt;runtime_flags);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	switch (map-&gt;type &amp; BTRFS_BLOCK_GROUP_PROFILE_MASK) {</div><div class='add'>+	profile = map-&gt;type &amp; BTRFS_BLOCK_GROUP_PROFILE_MASK;</div><div class='add'>+	switch (profile) {</div><div class='ctx'> 	case 0: /* single */</div><div class='del'>-		if (alloc_offsets[0] == WP_MISSING_DEV) {</div><div class='del'>-			btrfs_err(fs_info,</div><div class='del'>-			"zoned: cannot recover write pointer for zone %llu",</div><div class='del'>-				physical);</div><div class='del'>-			ret = -EIO;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		cache-&gt;alloc_offset = alloc_offsets[0];</div><div class='del'>-		cache-&gt;zone_capacity = caps[0];</div><div class='del'>-		cache-&gt;zone_is_active = test_bit(0, active);</div><div class='add'>+		ret = btrfs_load_block_group_single(cache, &amp;zone_info[0], active);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case BTRFS_BLOCK_GROUP_DUP:</div><div class='add'>+		ret = btrfs_load_block_group_dup(cache, map, zone_info, active,</div><div class='add'>+						 last_alloc);</div><div class='add'>+		break;</div><div class='ctx'> 	case BTRFS_BLOCK_GROUP_RAID1:</div><div class='add'>+	case BTRFS_BLOCK_GROUP_RAID1C3:</div><div class='add'>+	case BTRFS_BLOCK_GROUP_RAID1C4:</div><div class='add'>+		ret = btrfs_load_block_group_raid1(cache, map, zone_info,</div><div class='add'>+						   active, last_alloc);</div><div class='add'>+		break;</div><div class='ctx'> 	case BTRFS_BLOCK_GROUP_RAID0:</div><div class='add'>+		ret = btrfs_load_block_group_raid0(cache, map, zone_info,</div><div class='add'>+						   active, last_alloc);</div><div class='add'>+		break;</div><div class='ctx'> 	case BTRFS_BLOCK_GROUP_RAID10:</div><div class='add'>+		ret = btrfs_load_block_group_raid10(cache, map, zone_info,</div><div class='add'>+						    active, last_alloc);</div><div class='add'>+		break;</div><div class='ctx'> 	case BTRFS_BLOCK_GROUP_RAID5:</div><div class='ctx'> 	case BTRFS_BLOCK_GROUP_RAID6:</div><div class='del'>-		/* non-single profiles are not supported yet */</div><div class='ctx'> 	default:</div><div class='ctx'> 		btrfs_err(fs_info, "zoned: profile %s not yet supported",</div><div class='ctx'> 			  btrfs_bg_type_to_raid_name(map-&gt;type));</div><div class='hunk'>@@ -1375,22 +1733,33 @@ int btrfs_load_block_group_zone_info(struct btrfs_block_group *cache, bool new)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (cache-&gt;zone_is_active) {</div><div class='del'>-		btrfs_get_block_group(cache);</div><div class='del'>-		spin_lock(&amp;fs_info-&gt;zone_active_bgs_lock);</div><div class='del'>-		list_add_tail(&amp;cache-&gt;active_bg_list, &amp;fs_info-&gt;zone_active_bgs);</div><div class='del'>-		spin_unlock(&amp;fs_info-&gt;zone_active_bgs_lock);</div><div class='add'>+	if (ret == -EIO &amp;&amp; profile != 0 &amp;&amp; profile != BTRFS_BLOCK_GROUP_RAID0 &amp;&amp;</div><div class='add'>+	    profile != BTRFS_BLOCK_GROUP_RAID10) {</div><div class='add'>+		/*</div><div class='add'>+		 * Detected broken write pointer.  Make this block group</div><div class='add'>+		 * unallocatable by setting the allocation pointer at the end of</div><div class='add'>+		 * allocatable region. Relocating this block group will fix the</div><div class='add'>+		 * mismatch.</div><div class='add'>+		 *</div><div class='add'>+		 * Currently, we cannot handle RAID0 or RAID10 case like this</div><div class='add'>+		 * because we don't have a proper zone_capacity value. But,</div><div class='add'>+		 * reading from this block group won't work anyway by a missing</div><div class='add'>+		 * stripe.</div><div class='add'>+		 */</div><div class='add'>+		cache-&gt;alloc_offset = cache-&gt;zone_capacity;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	if (cache-&gt;alloc_offset &gt; fs_info-&gt;zone_size) {</div><div class='del'>-		btrfs_err(fs_info,</div><div class='del'>-			"zoned: invalid write pointer %llu in block group %llu",</div><div class='del'>-			cache-&gt;alloc_offset, cache-&gt;start);</div><div class='del'>-		ret = -EIO;</div><div class='add'>+	/* Reject non SINGLE data profiles without RST */</div><div class='add'>+	if ((map-&gt;type &amp; BTRFS_BLOCK_GROUP_DATA) &amp;&amp;</div><div class='add'>+	    (map-&gt;type &amp; BTRFS_BLOCK_GROUP_PROFILE_MASK) &amp;&amp;</div><div class='add'>+	    !fs_info-&gt;stripe_root) {</div><div class='add'>+		btrfs_err(fs_info, "zoned: data %s needs raid-stripe-tree",</div><div class='add'>+			  btrfs_bg_type_to_raid_name(map-&gt;type));</div><div class='add'>+		ret = -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (cache-&gt;alloc_offset &gt; cache-&gt;zone_capacity) {</div><div class='add'>+	if (unlikely(cache-&gt;alloc_offset &gt; cache-&gt;zone_capacity)) {</div><div class='ctx'> 		btrfs_err(fs_info,</div><div class='ctx'> "zoned: invalid write pointer %llu (larger than zone capacity %llu) in block group %llu",</div><div class='ctx'> 			  cache-&gt;alloc_offset, cache-&gt;zone_capacity,</div><div class='hunk'>@@ -1406,17 +1775,20 @@ out:</div><div class='ctx'> 		ret = -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!ret)</div><div class='add'>+	if (!ret) {</div><div class='ctx'> 		cache-&gt;meta_write_pointer = cache-&gt;alloc_offset + cache-&gt;start;</div><div class='del'>-</div><div class='del'>-	if (ret) {</div><div class='del'>-		kfree(cache-&gt;physical_map);</div><div class='add'>+		if (test_bit(BLOCK_GROUP_FLAG_ZONE_IS_ACTIVE, &amp;cache-&gt;runtime_flags)) {</div><div class='add'>+			btrfs_get_block_group(cache);</div><div class='add'>+			spin_lock(&amp;fs_info-&gt;zone_active_bgs_lock);</div><div class='add'>+			list_add_tail(&amp;cache-&gt;active_bg_list,</div><div class='add'>+				      &amp;fs_info-&gt;zone_active_bgs);</div><div class='add'>+			spin_unlock(&amp;fs_info-&gt;zone_active_bgs_lock);</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		btrfs_free_chunk_map(cache-&gt;physical_map);</div><div class='ctx'> 		cache-&gt;physical_map = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> 	bitmap_free(active);</div><div class='del'>-	kfree(caps);</div><div class='del'>-	kfree(alloc_offsets);</div><div class='del'>-	free_extent_map(em);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -1434,50 +1806,15 @@ void btrfs_calc_zone_unusable(struct btrfs_block_group *cache)</div><div class='ctx'> 	free = cache-&gt;zone_capacity - cache-&gt;alloc_offset;</div><div class='ctx'> </div><div class='ctx'> 	/* We only need -&gt;free_space in ALLOC_SEQ block groups */</div><div class='del'>-	cache-&gt;last_byte_to_unpin = (u64)-1;</div><div class='ctx'> 	cache-&gt;cached = BTRFS_CACHE_FINISHED;</div><div class='ctx'> 	cache-&gt;free_space_ctl-&gt;free_space = free;</div><div class='ctx'> 	cache-&gt;zone_unusable = unusable;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_redirty_list_add(struct btrfs_transaction *trans,</div><div class='del'>-			    struct extent_buffer *eb)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_fs_info *fs_info = eb-&gt;fs_info;</div><div class='del'>-</div><div class='del'>-	if (!btrfs_is_zoned(fs_info) ||</div><div class='del'>-	    btrfs_header_flag(eb, BTRFS_HEADER_FLAG_WRITTEN) ||</div><div class='del'>-	    !list_empty(&amp;eb-&gt;release_list))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	set_extent_buffer_dirty(eb);</div><div class='del'>-	set_extent_bits_nowait(&amp;trans-&gt;dirty_pages, eb-&gt;start,</div><div class='del'>-			       eb-&gt;start + eb-&gt;len - 1, EXTENT_DIRTY);</div><div class='del'>-	memzero_extent_buffer(eb, 0, eb-&gt;len);</div><div class='del'>-	set_bit(EXTENT_BUFFER_NO_CHECK, &amp;eb-&gt;bflags);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;trans-&gt;releasing_ebs_lock);</div><div class='del'>-	list_add_tail(&amp;eb-&gt;release_list, &amp;trans-&gt;releasing_ebs);</div><div class='del'>-	spin_unlock(&amp;trans-&gt;releasing_ebs_lock);</div><div class='del'>-	atomic_inc(&amp;eb-&gt;refs);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void btrfs_free_redirty_list(struct btrfs_transaction *trans)</div><div class='del'>-{</div><div class='del'>-	spin_lock(&amp;trans-&gt;releasing_ebs_lock);</div><div class='del'>-	while (!list_empty(&amp;trans-&gt;releasing_ebs)) {</div><div class='del'>-		struct extent_buffer *eb;</div><div class='del'>-</div><div class='del'>-		eb = list_first_entry(&amp;trans-&gt;releasing_ebs,</div><div class='del'>-				      struct extent_buffer, release_list);</div><div class='del'>-		list_del_init(&amp;eb-&gt;release_list);</div><div class='del'>-		free_extent_buffer(eb);</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;trans-&gt;releasing_ebs_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-bool btrfs_use_zone_append(struct btrfs_inode *inode, u64 start)</div><div class='add'>+bool btrfs_use_zone_append(struct btrfs_bio *bbio)</div><div class='ctx'> {</div><div class='add'>+	u64 start = (bbio-&gt;bio.bi_iter.bi_sector &lt;&lt; SECTOR_SHIFT);</div><div class='add'>+	struct btrfs_inode *inode = bbio-&gt;inode;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_block_group *cache;</div><div class='ctx'> 	bool ret = false;</div><div class='hunk'>@@ -1485,11 +1822,14 @@ bool btrfs_use_zone_append(struct btrfs_inode *inode, u64 start)</div><div class='ctx'> 	if (!btrfs_is_zoned(fs_info))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	if (!is_data_inode(&amp;inode-&gt;vfs_inode))</div><div class='add'>+	if (!is_data_inode(inode))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	if (btrfs_op(&amp;bbio-&gt;bio) != BTRFS_MAP_WRITE)</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Using REQ_OP_ZONE_APPNED for relocation can break assumptions on the</div><div class='add'>+	 * Using REQ_OP_ZONE_APPEND for relocation can break assumptions on the</div><div class='ctx'> 	 * extent layout the relocation code has.</div><div class='ctx'> 	 * Furthermore we have set aside own block-group from which only the</div><div class='ctx'> 	 * relocation "process" can allocate and make sure only one process at a</div><div class='hunk'>@@ -1504,123 +1844,229 @@ bool btrfs_use_zone_append(struct btrfs_inode *inode, u64 start)</div><div class='ctx'> 	if (!cache)</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	ret = cache-&gt;seq_zone;</div><div class='add'>+	ret = !!test_bit(BLOCK_GROUP_FLAG_SEQUENTIAL_ZONE, &amp;cache-&gt;runtime_flags);</div><div class='ctx'> 	btrfs_put_block_group(cache);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_record_physical_zoned(struct inode *inode, u64 file_offset,</div><div class='del'>-				 struct bio *bio)</div><div class='add'>+void btrfs_record_physical_zoned(struct btrfs_bio *bbio)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_ordered_extent *ordered;</div><div class='del'>-	const u64 physical = bio-&gt;bi_iter.bi_sector &lt;&lt; SECTOR_SHIFT;</div><div class='add'>+	const u64 physical = bbio-&gt;bio.bi_iter.bi_sector &lt;&lt; SECTOR_SHIFT;</div><div class='add'>+	struct btrfs_ordered_sum *sum = bbio-&gt;sums;</div><div class='ctx'> </div><div class='del'>-	if (bio_op(bio) != REQ_OP_ZONE_APPEND)</div><div class='del'>-		return;</div><div class='add'>+	if (physical &lt; bbio-&gt;orig_physical)</div><div class='add'>+		sum-&gt;logical -= bbio-&gt;orig_physical - physical;</div><div class='add'>+	else</div><div class='add'>+		sum-&gt;logical += physical - bbio-&gt;orig_physical;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	ordered = btrfs_lookup_ordered_extent(BTRFS_I(inode), file_offset);</div><div class='del'>-	if (WARN_ON(!ordered))</div><div class='del'>-		return;</div><div class='add'>+static void btrfs_rewrite_logical_zoned(struct btrfs_ordered_extent *ordered,</div><div class='add'>+					u64 logical)</div><div class='add'>+{</div><div class='add'>+	struct extent_map_tree *em_tree = &amp;ordered-&gt;inode-&gt;extent_tree;</div><div class='add'>+	struct extent_map *em;</div><div class='ctx'> </div><div class='del'>-	ordered-&gt;physical = physical;</div><div class='del'>-	ordered-&gt;bdev = bio-&gt;bi_bdev;</div><div class='add'>+	ordered-&gt;disk_bytenr = logical;</div><div class='ctx'> </div><div class='del'>-	btrfs_put_ordered_extent(ordered);</div><div class='add'>+	write_lock(&amp;em_tree-&gt;lock);</div><div class='add'>+	em = btrfs_search_extent_mapping(em_tree, ordered-&gt;file_offset,</div><div class='add'>+					 ordered-&gt;num_bytes);</div><div class='add'>+	/* The em should be a new COW extent, thus it should not have an offset. */</div><div class='add'>+	ASSERT(em-&gt;offset == 0, "em-&gt;offset=%llu", em-&gt;offset);</div><div class='add'>+	em-&gt;disk_bytenr = logical;</div><div class='add'>+	btrfs_free_extent_map(em);</div><div class='add'>+	write_unlock(&amp;em_tree-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_rewrite_logical_zoned(struct btrfs_ordered_extent *ordered)</div><div class='add'>+static bool btrfs_zoned_split_ordered(struct btrfs_ordered_extent *ordered,</div><div class='add'>+				      u64 logical, u64 len)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_inode *inode = BTRFS_I(ordered-&gt;inode);</div><div class='add'>+	struct btrfs_ordered_extent *new;</div><div class='add'>+</div><div class='add'>+	if (!test_bit(BTRFS_ORDERED_NOCOW, &amp;ordered-&gt;flags) &amp;&amp;</div><div class='add'>+	    btrfs_split_extent_map(ordered-&gt;inode, ordered-&gt;file_offset,</div><div class='add'>+				   ordered-&gt;num_bytes, len, logical))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	new = btrfs_split_ordered_extent(ordered, len);</div><div class='add'>+	if (IS_ERR(new))</div><div class='add'>+		return false;</div><div class='add'>+	new-&gt;disk_bytenr = logical;</div><div class='add'>+	btrfs_finish_one_ordered(new);</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_finish_ordered_zoned(struct btrfs_ordered_extent *ordered)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_inode *inode = ordered-&gt;inode;</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='del'>-	struct extent_map_tree *em_tree;</div><div class='del'>-	struct extent_map *em;</div><div class='ctx'> 	struct btrfs_ordered_sum *sum;</div><div class='del'>-	u64 orig_logical = ordered-&gt;disk_bytenr;</div><div class='del'>-	u64 *logical = NULL;</div><div class='del'>-	int nr, stripe_len;</div><div class='add'>+	u64 logical, len;</div><div class='ctx'> </div><div class='del'>-	/* Zoned devices should not have partitions. So, we can assume it is 0 */</div><div class='del'>-	ASSERT(!bdev_is_partition(ordered-&gt;bdev));</div><div class='del'>-	if (WARN_ON(!ordered-&gt;bdev))</div><div class='add'>+	/*</div><div class='add'>+	 * Write to pre-allocated region is for the data relocation, and so</div><div class='add'>+	 * it should use WRITE operation. No split/rewrite are necessary.</div><div class='add'>+	 */</div><div class='add'>+	if (test_bit(BTRFS_ORDERED_PREALLOC, &amp;ordered-&gt;flags))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	if (WARN_ON(btrfs_rmap_block(fs_info, orig_logical, ordered-&gt;bdev,</div><div class='del'>-				     ordered-&gt;physical, &amp;logical, &amp;nr,</div><div class='del'>-				     &amp;stripe_len)))</div><div class='del'>-		goto out;</div><div class='add'>+	ASSERT(!list_empty(&amp;ordered-&gt;list));</div><div class='add'>+	/* The ordered-&gt;list can be empty in the above pre-alloc case. */</div><div class='add'>+	sum = list_first_entry(&amp;ordered-&gt;list, struct btrfs_ordered_sum, list);</div><div class='add'>+	logical = sum-&gt;logical;</div><div class='add'>+	len = sum-&gt;len;</div><div class='ctx'> </div><div class='del'>-	WARN_ON(nr != 1);</div><div class='add'>+	while (len &lt; ordered-&gt;disk_num_bytes) {</div><div class='add'>+		sum = list_next_entry(sum, list);</div><div class='add'>+		if (sum-&gt;logical == logical + len) {</div><div class='add'>+			len += sum-&gt;len;</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+		if (!btrfs_zoned_split_ordered(ordered, logical, len)) {</div><div class='add'>+			set_bit(BTRFS_ORDERED_IOERR, &amp;ordered-&gt;flags);</div><div class='add'>+			btrfs_err(fs_info, "failed to split ordered extent");</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		logical = sum-&gt;logical;</div><div class='add'>+		len = sum-&gt;len;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (orig_logical == *logical)</div><div class='del'>-		goto out;</div><div class='add'>+	if (ordered-&gt;disk_bytenr != logical)</div><div class='add'>+		btrfs_rewrite_logical_zoned(ordered, logical);</div><div class='ctx'> </div><div class='del'>-	ordered-&gt;disk_bytenr = *logical;</div><div class='add'>+out:</div><div class='add'>+	/*</div><div class='add'>+	 * If we end up here for nodatasum I/O, the btrfs_ordered_sum structures</div><div class='add'>+	 * were allocated by btrfs_alloc_dummy_sum only to record the logical</div><div class='add'>+	 * addresses and don't contain actual checksums.  We thus must free them</div><div class='add'>+	 * here so that we don't attempt to log the csums later.</div><div class='add'>+	 */</div><div class='add'>+	if ((inode-&gt;flags &amp; BTRFS_INODE_NODATASUM) ||</div><div class='add'>+	    test_bit(BTRFS_FS_STATE_NO_DATA_CSUMS, &amp;fs_info-&gt;fs_state)) {</div><div class='add'>+		while ((sum = list_first_entry_or_null(&amp;ordered-&gt;list,</div><div class='add'>+						       typeof(*sum), list))) {</div><div class='add'>+			list_del(&amp;sum-&gt;list);</div><div class='add'>+			kfree(sum);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	em_tree = &amp;inode-&gt;extent_tree;</div><div class='del'>-	write_lock(&amp;em_tree-&gt;lock);</div><div class='del'>-	em = search_extent_mapping(em_tree, ordered-&gt;file_offset,</div><div class='del'>-				   ordered-&gt;num_bytes);</div><div class='del'>-	em-&gt;block_start = *logical;</div><div class='del'>-	free_extent_map(em);</div><div class='del'>-	write_unlock(&amp;em_tree-&gt;lock);</div><div class='add'>+static bool check_bg_is_active(struct btrfs_eb_write_context *ctx,</div><div class='add'>+			       struct btrfs_block_group **active_bg)</div><div class='add'>+{</div><div class='add'>+	const struct writeback_control *wbc = ctx-&gt;wbc;</div><div class='add'>+	struct btrfs_block_group *block_group = ctx-&gt;zoned_bg;</div><div class='add'>+	struct btrfs_fs_info *fs_info = block_group-&gt;fs_info;</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry(sum, &amp;ordered-&gt;list, list) {</div><div class='del'>-		if (*logical &lt; orig_logical)</div><div class='del'>-			sum-&gt;bytenr -= orig_logical - *logical;</div><div class='del'>-		else</div><div class='del'>-			sum-&gt;bytenr += *logical - orig_logical;</div><div class='add'>+	if (test_bit(BLOCK_GROUP_FLAG_ZONE_IS_ACTIVE, &amp;block_group-&gt;runtime_flags))</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	if (fs_info-&gt;treelog_bg == block_group-&gt;start) {</div><div class='add'>+		if (!btrfs_zone_activate(block_group)) {</div><div class='add'>+			int ret_fin = btrfs_zone_finish_one_bg(fs_info);</div><div class='add'>+</div><div class='add'>+			if (ret_fin != 1 || !btrfs_zone_activate(block_group))</div><div class='add'>+				return false;</div><div class='add'>+		}</div><div class='add'>+	} else if (*active_bg != block_group) {</div><div class='add'>+		struct btrfs_block_group *tgt = *active_bg;</div><div class='add'>+</div><div class='add'>+		/* zoned_meta_io_lock protects fs_info-&gt;active_{meta,system}_bg. */</div><div class='add'>+		lockdep_assert_held(&amp;fs_info-&gt;zoned_meta_io_lock);</div><div class='add'>+</div><div class='add'>+		if (tgt) {</div><div class='add'>+			/*</div><div class='add'>+			 * If there is an unsent IO left in the allocated area,</div><div class='add'>+			 * we cannot wait for them as it may cause a deadlock.</div><div class='add'>+			 */</div><div class='add'>+			if (tgt-&gt;meta_write_pointer &lt; tgt-&gt;start + tgt-&gt;alloc_offset) {</div><div class='add'>+				if (wbc-&gt;sync_mode == WB_SYNC_NONE ||</div><div class='add'>+				    (wbc-&gt;sync_mode == WB_SYNC_ALL &amp;&amp; !wbc-&gt;for_sync))</div><div class='add'>+					return false;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			/* Pivot active metadata/system block group. */</div><div class='add'>+			btrfs_zoned_meta_io_unlock(fs_info);</div><div class='add'>+			wait_eb_writebacks(tgt);</div><div class='add'>+			do_zone_finish(tgt, true);</div><div class='add'>+			btrfs_zoned_meta_io_lock(fs_info);</div><div class='add'>+			if (*active_bg == tgt) {</div><div class='add'>+				btrfs_put_block_group(tgt);</div><div class='add'>+				*active_bg = NULL;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+		if (!btrfs_zone_activate(block_group))</div><div class='add'>+			return false;</div><div class='add'>+		if (*active_bg != block_group) {</div><div class='add'>+			ASSERT(*active_bg == NULL);</div><div class='add'>+			*active_bg = block_group;</div><div class='add'>+			btrfs_get_block_group(block_group);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	kfree(logical);</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-bool btrfs_check_meta_write_pointer(struct btrfs_fs_info *fs_info,</div><div class='del'>-				    struct extent_buffer *eb,</div><div class='del'>-				    struct btrfs_block_group **cache_ret)</div><div class='add'>+/*</div><div class='add'>+ * Check if @ctx-&gt;eb is aligned to the write pointer.</div><div class='add'>+ *</div><div class='add'>+ * Return:</div><div class='add'>+ *   0:        @ctx-&gt;eb is at the write pointer. You can write it.</div><div class='add'>+ *   -EAGAIN:  There is a hole. The caller should handle the case.</div><div class='add'>+ *   -EBUSY:   There is a hole, but the caller can just bail out.</div><div class='add'>+ */</div><div class='add'>+int btrfs_check_meta_write_pointer(struct btrfs_fs_info *fs_info,</div><div class='add'>+				   struct btrfs_eb_write_context *ctx)</div><div class='ctx'> {</div><div class='del'>-	struct btrfs_block_group *cache;</div><div class='del'>-	bool ret = true;</div><div class='add'>+	const struct writeback_control *wbc = ctx-&gt;wbc;</div><div class='add'>+	const struct extent_buffer *eb = ctx-&gt;eb;</div><div class='add'>+	struct btrfs_block_group *block_group = ctx-&gt;zoned_bg;</div><div class='ctx'> </div><div class='ctx'> 	if (!btrfs_is_zoned(fs_info))</div><div class='del'>-		return true;</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	cache = *cache_ret;</div><div class='add'>+	if (block_group) {</div><div class='add'>+		if (block_group-&gt;start &gt; eb-&gt;start ||</div><div class='add'>+		    block_group-&gt;start + block_group-&gt;length &lt;= eb-&gt;start) {</div><div class='add'>+			btrfs_put_block_group(block_group);</div><div class='add'>+			block_group = NULL;</div><div class='add'>+			ctx-&gt;zoned_bg = NULL;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (cache &amp;&amp; (eb-&gt;start &lt; cache-&gt;start ||</div><div class='del'>-		      cache-&gt;start + cache-&gt;length &lt;= eb-&gt;start)) {</div><div class='del'>-		btrfs_put_block_group(cache);</div><div class='del'>-		cache = NULL;</div><div class='del'>-		*cache_ret = NULL;</div><div class='add'>+	if (!block_group) {</div><div class='add'>+		block_group = btrfs_lookup_block_group(fs_info, eb-&gt;start);</div><div class='add'>+		if (!block_group)</div><div class='add'>+			return 0;</div><div class='add'>+		ctx-&gt;zoned_bg = block_group;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!cache)</div><div class='del'>-		cache = btrfs_lookup_block_group(fs_info, eb-&gt;start);</div><div class='add'>+	if (block_group-&gt;meta_write_pointer == eb-&gt;start) {</div><div class='add'>+		struct btrfs_block_group **tgt;</div><div class='ctx'> </div><div class='del'>-	if (cache) {</div><div class='del'>-		if (cache-&gt;meta_write_pointer != eb-&gt;start) {</div><div class='del'>-			btrfs_put_block_group(cache);</div><div class='del'>-			cache = NULL;</div><div class='del'>-			ret = false;</div><div class='del'>-		} else {</div><div class='del'>-			cache-&gt;meta_write_pointer = eb-&gt;start + eb-&gt;len;</div><div class='del'>-		}</div><div class='add'>+		if (!test_bit(BTRFS_FS_ACTIVE_ZONE_TRACKING, &amp;fs_info-&gt;flags))</div><div class='add'>+			return 0;</div><div class='ctx'> </div><div class='del'>-		*cache_ret = cache;</div><div class='add'>+		if (block_group-&gt;flags &amp; BTRFS_BLOCK_GROUP_SYSTEM)</div><div class='add'>+			tgt = &amp;fs_info-&gt;active_system_bg;</div><div class='add'>+		else</div><div class='add'>+			tgt = &amp;fs_info-&gt;active_meta_bg;</div><div class='add'>+		if (check_bg_is_active(ctx, tgt))</div><div class='add'>+			return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void btrfs_revert_meta_write_pointer(struct btrfs_block_group *cache,</div><div class='del'>-				     struct extent_buffer *eb)</div><div class='del'>-{</div><div class='del'>-	if (!btrfs_is_zoned(eb-&gt;fs_info) || !cache)</div><div class='del'>-		return;</div><div class='add'>+	/*</div><div class='add'>+	 * Since we may release fs_info-&gt;zoned_meta_io_lock, someone can already</div><div class='add'>+	 * start writing this eb. In that case, we can just bail out.</div><div class='add'>+	 */</div><div class='add'>+	if (block_group-&gt;meta_write_pointer &gt; eb-&gt;start)</div><div class='add'>+		return -EBUSY;</div><div class='ctx'> </div><div class='del'>-	ASSERT(cache-&gt;meta_write_pointer == eb-&gt;start + eb-&gt;len);</div><div class='del'>-	cache-&gt;meta_write_pointer = eb-&gt;start;</div><div class='add'>+	/* If for_sync, this hole will be filled with transaction commit. */</div><div class='add'>+	if (wbc-&gt;sync_mode == WB_SYNC_ALL &amp;&amp; !wbc-&gt;for_sync)</div><div class='add'>+		return -EAGAIN;</div><div class='add'>+	return -EBUSY;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int btrfs_zoned_issue_zeroout(struct btrfs_device *device, u64 physical, u64 length)</div><div class='hunk'>@@ -1641,15 +2087,17 @@ static int read_zone_info(struct btrfs_fs_info *fs_info, u64 logical,</div><div class='ctx'> 	int nmirrors;</div><div class='ctx'> 	int i, ret;</div><div class='ctx'> </div><div class='del'>-	ret = btrfs_map_sblock(fs_info, BTRFS_MAP_GET_READ_MIRRORS, logical,</div><div class='del'>-			       &amp;mapped_length, &amp;bioc);</div><div class='del'>-	if (ret || !bioc || mapped_length &lt; PAGE_SIZE) {</div><div class='del'>-		btrfs_put_bioc(bioc);</div><div class='del'>-		return -EIO;</div><div class='add'>+	ret = btrfs_map_block(fs_info, BTRFS_MAP_GET_READ_MIRRORS, logical,</div><div class='add'>+			      &amp;mapped_length, &amp;bioc, NULL, NULL);</div><div class='add'>+	if (unlikely(ret || !bioc || mapped_length &lt; PAGE_SIZE)) {</div><div class='add'>+		ret = -EIO;</div><div class='add'>+		goto out_put_bioc;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (bioc-&gt;map_type &amp; BTRFS_BLOCK_GROUP_RAID56_MASK)</div><div class='del'>-		return -EINVAL;</div><div class='add'>+	if (bioc-&gt;map_type &amp; BTRFS_BLOCK_GROUP_RAID56_MASK) {</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out_put_bioc;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	nofs_flag = memalloc_nofs_save();</div><div class='ctx'> 	nmirrors = (int)bioc-&gt;num_stripes;</div><div class='hunk'>@@ -1668,7 +2116,8 @@ static int read_zone_info(struct btrfs_fs_info *fs_info, u64 logical,</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='ctx'> 	memalloc_nofs_restore(nofs_flag);</div><div class='del'>-</div><div class='add'>+out_put_bioc:</div><div class='add'>+	btrfs_put_bioc(bioc);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1698,35 +2147,14 @@ int btrfs_sync_zone_write_pointer(struct btrfs_device *tgt_dev, u64 logical,</div><div class='ctx'> 	if (physical_pos == wp)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	if (physical_pos &gt; wp)</div><div class='add'>+	if (unlikely(physical_pos &gt; wp))</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> </div><div class='ctx'> 	length = wp - physical_pos;</div><div class='ctx'> 	return btrfs_zoned_issue_zeroout(tgt_dev, physical_pos, length);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct btrfs_device *btrfs_zoned_get_device(struct btrfs_fs_info *fs_info,</div><div class='del'>-					    u64 logical, u64 length)</div><div class='del'>-{</div><div class='del'>-	struct btrfs_device *device;</div><div class='del'>-	struct extent_map *em;</div><div class='del'>-	struct map_lookup *map;</div><div class='del'>-</div><div class='del'>-	em = btrfs_get_chunk_map(fs_info, logical, length);</div><div class='del'>-	if (IS_ERR(em))</div><div class='del'>-		return ERR_CAST(em);</div><div class='del'>-</div><div class='del'>-	map = em-&gt;map_lookup;</div><div class='del'>-	/* We only support single profile for now */</div><div class='del'>-	ASSERT(map-&gt;num_stripes == 1);</div><div class='del'>-	device = map-&gt;stripes[0].dev;</div><div class='del'>-</div><div class='del'>-	free_extent_map(em);</div><div class='del'>-</div><div class='del'>-	return device;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='add'>+/*</div><div class='ctx'>  * Activate block group and underlying device zones</div><div class='ctx'>  *</div><div class='ctx'>  * @block_group: the block group to activate</div><div class='hunk'>@@ -1736,52 +2164,76 @@ struct btrfs_device *btrfs_zoned_get_device(struct btrfs_fs_info *fs_info,</div><div class='ctx'> bool btrfs_zone_activate(struct btrfs_block_group *block_group)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = block_group-&gt;fs_info;</div><div class='del'>-	struct map_lookup *map;</div><div class='add'>+	struct btrfs_chunk_map *map;</div><div class='ctx'> 	struct btrfs_device *device;</div><div class='ctx'> 	u64 physical;</div><div class='add'>+	const bool is_data = (block_group-&gt;flags &amp; BTRFS_BLOCK_GROUP_DATA);</div><div class='ctx'> 	bool ret;</div><div class='add'>+	int i;</div><div class='ctx'> </div><div class='ctx'> 	if (!btrfs_is_zoned(block_group-&gt;fs_info))</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='ctx'> 	map = block_group-&gt;physical_map;</div><div class='del'>-	/* Currently support SINGLE profile only */</div><div class='del'>-	ASSERT(map-&gt;num_stripes == 1);</div><div class='del'>-	device = map-&gt;stripes[0].dev;</div><div class='del'>-	physical = map-&gt;stripes[0].physical;</div><div class='del'>-</div><div class='del'>-	if (device-&gt;zone_info-&gt;max_active_zones == 0)</div><div class='del'>-		return true;</div><div class='ctx'> </div><div class='add'>+	spin_lock(&amp;fs_info-&gt;zone_active_bgs_lock);</div><div class='ctx'> 	spin_lock(&amp;block_group-&gt;lock);</div><div class='del'>-</div><div class='del'>-	if (block_group-&gt;zone_is_active) {</div><div class='add'>+	if (test_bit(BLOCK_GROUP_FLAG_ZONE_IS_ACTIVE, &amp;block_group-&gt;runtime_flags)) {</div><div class='ctx'> 		ret = true;</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* No space left */</div><div class='del'>-	if (block_group-&gt;alloc_offset == block_group-&gt;zone_capacity) {</div><div class='del'>-		ret = false;</div><div class='del'>-		goto out_unlock;</div><div class='add'>+	if (block_group-&gt;flags &amp; BTRFS_BLOCK_GROUP_DATA) {</div><div class='add'>+		/* The caller should check if the block group is full. */</div><div class='add'>+		if (WARN_ON_ONCE(btrfs_zoned_bg_is_full(block_group))) {</div><div class='add'>+			ret = false;</div><div class='add'>+			goto out_unlock;</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		/* Since it is already written, it should have been active. */</div><div class='add'>+		WARN_ON_ONCE(block_group-&gt;meta_write_pointer != block_group-&gt;start);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!btrfs_dev_set_active_zone(device, physical)) {</div><div class='del'>-		/* Cannot activate the zone */</div><div class='del'>-		ret = false;</div><div class='del'>-		goto out_unlock;</div><div class='add'>+	for (i = 0; i &lt; map-&gt;num_stripes; i++) {</div><div class='add'>+		struct btrfs_zoned_device_info *zinfo;</div><div class='add'>+		int reserved = 0;</div><div class='add'>+</div><div class='add'>+		device = map-&gt;stripes[i].dev;</div><div class='add'>+		physical = map-&gt;stripes[i].physical;</div><div class='add'>+		zinfo = device-&gt;zone_info;</div><div class='add'>+</div><div class='add'>+		if (!device-&gt;bdev)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		if (zinfo-&gt;max_active_zones == 0)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		if (is_data)</div><div class='add'>+			reserved = zinfo-&gt;reserved_active_zones;</div><div class='add'>+		/*</div><div class='add'>+		 * For the data block group, leave active zones for one</div><div class='add'>+		 * metadata block group and one system block group.</div><div class='add'>+		 */</div><div class='add'>+		if (atomic_read(&amp;zinfo-&gt;active_zones_left) &lt;= reserved) {</div><div class='add'>+			ret = false;</div><div class='add'>+			goto out_unlock;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (!btrfs_dev_set_active_zone(device, physical)) {</div><div class='add'>+			/* Cannot activate the zone */</div><div class='add'>+			ret = false;</div><div class='add'>+			goto out_unlock;</div><div class='add'>+		}</div><div class='add'>+		if (!is_data)</div><div class='add'>+			zinfo-&gt;reserved_active_zones--;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Successfully activated all the zones */</div><div class='del'>-	block_group-&gt;zone_is_active = 1;</div><div class='del'>-</div><div class='add'>+	set_bit(BLOCK_GROUP_FLAG_ZONE_IS_ACTIVE, &amp;block_group-&gt;runtime_flags);</div><div class='ctx'> 	spin_unlock(&amp;block_group-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	/* For the active block group list */</div><div class='ctx'> 	btrfs_get_block_group(block_group);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;fs_info-&gt;zone_active_bgs_lock);</div><div class='del'>-	ASSERT(list_empty(&amp;block_group-&gt;active_bg_list));</div><div class='ctx'> 	list_add_tail(&amp;block_group-&gt;active_bg_list, &amp;fs_info-&gt;zone_active_bgs);</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;zone_active_bgs_lock);</div><div class='ctx'> </div><div class='hunk'>@@ -1789,179 +2241,295 @@ bool btrfs_zone_activate(struct btrfs_block_group *block_group)</div><div class='ctx'> </div><div class='ctx'> out_unlock:</div><div class='ctx'> 	spin_unlock(&amp;block_group-&gt;lock);</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;zone_active_bgs_lock);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int btrfs_zone_finish(struct btrfs_block_group *block_group)</div><div class='add'>+static void wait_eb_writebacks(struct btrfs_block_group *block_group)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_fs_info *fs_info = block_group-&gt;fs_info;</div><div class='del'>-	struct map_lookup *map;</div><div class='del'>-	struct btrfs_device *device;</div><div class='del'>-	u64 physical;</div><div class='del'>-	int ret = 0;</div><div class='add'>+	const u64 end = block_group-&gt;start + block_group-&gt;length;</div><div class='add'>+	struct extent_buffer *eb;</div><div class='add'>+	unsigned long index, start = (block_group-&gt;start &gt;&gt; fs_info-&gt;nodesize_bits);</div><div class='ctx'> </div><div class='del'>-	if (!btrfs_is_zoned(fs_info))</div><div class='del'>-		return 0;</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	xa_for_each_start(&amp;fs_info-&gt;buffer_tree, index, eb, start) {</div><div class='add'>+		if (eb-&gt;start &lt; block_group-&gt;start)</div><div class='add'>+			continue;</div><div class='add'>+		if (eb-&gt;start &gt;= end)</div><div class='add'>+			break;</div><div class='add'>+		rcu_read_unlock();</div><div class='add'>+		wait_on_extent_buffer_writeback(eb);</div><div class='add'>+		rcu_read_lock();</div><div class='add'>+	}</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	map = block_group-&gt;physical_map;</div><div class='del'>-	/* Currently support SINGLE profile only */</div><div class='del'>-	ASSERT(map-&gt;num_stripes == 1);</div><div class='add'>+static int call_zone_finish(struct btrfs_block_group *block_group,</div><div class='add'>+			    struct btrfs_io_stripe *stripe)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_device *device = stripe-&gt;dev;</div><div class='add'>+	const u64 physical = stripe-&gt;physical;</div><div class='add'>+	struct btrfs_zoned_device_info *zinfo = device-&gt;zone_info;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	device = map-&gt;stripes[0].dev;</div><div class='del'>-	physical = map-&gt;stripes[0].physical;</div><div class='add'>+	if (!device-&gt;bdev)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	if (device-&gt;zone_info-&gt;max_active_zones == 0)</div><div class='add'>+	if (zinfo-&gt;max_active_zones == 0)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='add'>+	if (btrfs_dev_is_sequential(device, physical)) {</div><div class='add'>+		unsigned int nofs_flags;</div><div class='add'>+</div><div class='add'>+		nofs_flags = memalloc_nofs_save();</div><div class='add'>+		ret = blkdev_zone_mgmt(device-&gt;bdev, REQ_OP_ZONE_FINISH,</div><div class='add'>+				       physical &gt;&gt; SECTOR_SHIFT,</div><div class='add'>+				       zinfo-&gt;zone_size &gt;&gt; SECTOR_SHIFT);</div><div class='add'>+		memalloc_nofs_restore(nofs_flags);</div><div class='add'>+</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!(block_group-&gt;flags &amp; BTRFS_BLOCK_GROUP_DATA))</div><div class='add'>+		zinfo-&gt;reserved_active_zones++;</div><div class='add'>+	btrfs_dev_clear_active_zone(device, physical);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int do_zone_finish(struct btrfs_block_group *block_group, bool fully_written)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = block_group-&gt;fs_info;</div><div class='add'>+	struct btrfs_chunk_map *map;</div><div class='add'>+	const bool is_metadata = (block_group-&gt;flags &amp;</div><div class='add'>+			(BTRFS_BLOCK_GROUP_METADATA | BTRFS_BLOCK_GROUP_SYSTEM));</div><div class='add'>+	struct btrfs_dev_replace *dev_replace = &amp;fs_info-&gt;dev_replace;</div><div class='add'>+	int ret = 0;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='ctx'> 	spin_lock(&amp;block_group-&gt;lock);</div><div class='del'>-	if (!block_group-&gt;zone_is_active) {</div><div class='add'>+	if (!test_bit(BLOCK_GROUP_FLAG_ZONE_IS_ACTIVE, &amp;block_group-&gt;runtime_flags)) {</div><div class='ctx'> 		spin_unlock(&amp;block_group-&gt;lock);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Check if we have unwritten allocated space */</div><div class='del'>-	if ((block_group-&gt;flags &amp;</div><div class='del'>-	     (BTRFS_BLOCK_GROUP_METADATA | BTRFS_BLOCK_GROUP_SYSTEM)) &amp;&amp;</div><div class='del'>-	    block_group-&gt;alloc_offset &gt; block_group-&gt;meta_write_pointer) {</div><div class='add'>+	if (is_metadata &amp;&amp;</div><div class='add'>+	    block_group-&gt;start + block_group-&gt;alloc_offset &gt; block_group-&gt;meta_write_pointer) {</div><div class='ctx'> 		spin_unlock(&amp;block_group-&gt;lock);</div><div class='ctx'> 		return -EAGAIN;</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;block_group-&gt;lock);</div><div class='del'>-</div><div class='del'>-	ret = btrfs_inc_block_group_ro(block_group, false);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	/* Ensure all writes in this block group finish */</div><div class='del'>-	btrfs_wait_block_group_reservations(block_group);</div><div class='del'>-	/* No need to wait for NOCOW writers. Zoned mode does not allow that. */</div><div class='del'>-	btrfs_wait_ordered_roots(fs_info, U64_MAX, block_group-&gt;start,</div><div class='del'>-				 block_group-&gt;length);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;block_group-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Bail out if someone already deactivated the block group, or</div><div class='del'>-	 * allocated space is left in the block group.</div><div class='add'>+	 * If we are sure that the block group is full (= no more room left for</div><div class='add'>+	 * new allocation) and the IO for the last usable block is completed, we</div><div class='add'>+	 * don't need to wait for the other IOs. This holds because we ensure</div><div class='add'>+	 * the sequential IO submissions using the ZONE_APPEND command for data</div><div class='add'>+	 * and block_group-&gt;meta_write_pointer for metadata.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!block_group-&gt;zone_is_active) {</div><div class='add'>+	if (!fully_written) {</div><div class='add'>+		if (test_bit(BLOCK_GROUP_FLAG_ZONED_DATA_RELOC, &amp;block_group-&gt;runtime_flags)) {</div><div class='add'>+			spin_unlock(&amp;block_group-&gt;lock);</div><div class='add'>+			return -EAGAIN;</div><div class='add'>+		}</div><div class='ctx'> 		spin_unlock(&amp;block_group-&gt;lock);</div><div class='del'>-		btrfs_dec_block_group_ro(block_group);</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	if (block_group-&gt;reserved) {</div><div class='del'>-		spin_unlock(&amp;block_group-&gt;lock);</div><div class='del'>-		btrfs_dec_block_group_ro(block_group);</div><div class='del'>-		return -EAGAIN;</div><div class='add'>+		ret = btrfs_inc_block_group_ro(block_group, false);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+</div><div class='add'>+		/* Ensure all writes in this block group finish */</div><div class='add'>+		btrfs_wait_block_group_reservations(block_group);</div><div class='add'>+		/* No need to wait for NOCOW writers. Zoned mode does not allow that */</div><div class='add'>+		btrfs_wait_ordered_roots(fs_info, U64_MAX, block_group);</div><div class='add'>+		/* Wait for extent buffers to be written. */</div><div class='add'>+		if (is_metadata)</div><div class='add'>+			wait_eb_writebacks(block_group);</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;block_group-&gt;lock);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Bail out if someone already deactivated the block group, or</div><div class='add'>+		 * allocated space is left in the block group.</div><div class='add'>+		 */</div><div class='add'>+		if (!test_bit(BLOCK_GROUP_FLAG_ZONE_IS_ACTIVE,</div><div class='add'>+			      &amp;block_group-&gt;runtime_flags)) {</div><div class='add'>+			spin_unlock(&amp;block_group-&gt;lock);</div><div class='add'>+			btrfs_dec_block_group_ro(block_group);</div><div class='add'>+			return 0;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (block_group-&gt;reserved ||</div><div class='add'>+		    test_bit(BLOCK_GROUP_FLAG_ZONED_DATA_RELOC,</div><div class='add'>+			     &amp;block_group-&gt;runtime_flags)) {</div><div class='add'>+			spin_unlock(&amp;block_group-&gt;lock);</div><div class='add'>+			btrfs_dec_block_group_ro(block_group);</div><div class='add'>+			return -EAGAIN;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	block_group-&gt;zone_is_active = 0;</div><div class='add'>+	clear_bit(BLOCK_GROUP_FLAG_ZONE_IS_ACTIVE, &amp;block_group-&gt;runtime_flags);</div><div class='ctx'> 	block_group-&gt;alloc_offset = block_group-&gt;zone_capacity;</div><div class='add'>+	if (block_group-&gt;flags &amp; (BTRFS_BLOCK_GROUP_METADATA | BTRFS_BLOCK_GROUP_SYSTEM))</div><div class='add'>+		block_group-&gt;meta_write_pointer = block_group-&gt;start +</div><div class='add'>+						  block_group-&gt;zone_capacity;</div><div class='ctx'> 	block_group-&gt;free_space_ctl-&gt;free_space = 0;</div><div class='ctx'> 	btrfs_clear_treelog_bg(block_group);</div><div class='add'>+	btrfs_clear_data_reloc_bg(block_group);</div><div class='ctx'> 	spin_unlock(&amp;block_group-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	ret = blkdev_zone_mgmt(device-&gt;bdev, REQ_OP_ZONE_FINISH,</div><div class='del'>-			       physical &gt;&gt; SECTOR_SHIFT,</div><div class='del'>-			       device-&gt;zone_info-&gt;zone_size &gt;&gt; SECTOR_SHIFT,</div><div class='del'>-			       GFP_NOFS);</div><div class='del'>-	btrfs_dec_block_group_ro(block_group);</div><div class='add'>+	down_read(&amp;dev_replace-&gt;rwsem);</div><div class='add'>+	map = block_group-&gt;physical_map;</div><div class='add'>+	for (i = 0; i &lt; map-&gt;num_stripes; i++) {</div><div class='ctx'> </div><div class='del'>-	if (!ret) {</div><div class='del'>-		btrfs_dev_clear_active_zone(device, physical);</div><div class='add'>+		ret = call_zone_finish(block_group, &amp;map-&gt;stripes[i]);</div><div class='add'>+		if (ret) {</div><div class='add'>+			up_read(&amp;dev_replace-&gt;rwsem);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	up_read(&amp;dev_replace-&gt;rwsem);</div><div class='ctx'> </div><div class='del'>-		spin_lock(&amp;fs_info-&gt;zone_active_bgs_lock);</div><div class='del'>-		ASSERT(!list_empty(&amp;block_group-&gt;active_bg_list));</div><div class='del'>-		list_del_init(&amp;block_group-&gt;active_bg_list);</div><div class='del'>-		spin_unlock(&amp;fs_info-&gt;zone_active_bgs_lock);</div><div class='add'>+	if (!fully_written)</div><div class='add'>+		btrfs_dec_block_group_ro(block_group);</div><div class='ctx'> </div><div class='del'>-		/* For active_bg_list */</div><div class='del'>-		btrfs_put_block_group(block_group);</div><div class='del'>-	}</div><div class='add'>+	spin_lock(&amp;fs_info-&gt;zone_active_bgs_lock);</div><div class='add'>+	ASSERT(!list_empty(&amp;block_group-&gt;active_bg_list));</div><div class='add'>+	list_del_init(&amp;block_group-&gt;active_bg_list);</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;zone_active_bgs_lock);</div><div class='ctx'> </div><div class='del'>-	return ret;</div><div class='add'>+	/* For active_bg_list */</div><div class='add'>+	btrfs_put_block_group(block_group);</div><div class='add'>+</div><div class='add'>+	clear_and_wake_up_bit(BTRFS_FS_NEED_ZONE_FINISH, &amp;fs_info-&gt;flags);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-bool btrfs_can_activate_zone(struct btrfs_fs_devices *fs_devices, int raid_index)</div><div class='add'>+int btrfs_zone_finish(struct btrfs_block_group *block_group)</div><div class='ctx'> {</div><div class='add'>+	if (!btrfs_is_zoned(block_group-&gt;fs_info))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	return do_zone_finish(block_group, false);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool btrfs_can_activate_zone(struct btrfs_fs_devices *fs_devices, u64 flags)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = fs_devices-&gt;fs_info;</div><div class='ctx'> 	struct btrfs_device *device;</div><div class='ctx'> 	bool ret = false;</div><div class='ctx'> </div><div class='del'>-	if (!btrfs_is_zoned(fs_devices-&gt;fs_info))</div><div class='add'>+	if (!btrfs_is_zoned(fs_info))</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='del'>-	/* Non-single profiles are not supported yet */</div><div class='del'>-	if (raid_index != BTRFS_RAID_SINGLE)</div><div class='add'>+	if (test_bit(BTRFS_FS_NEED_ZONE_FINISH, &amp;fs_info-&gt;flags))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='ctx'> 	/* Check if there is a device with active zones left */</div><div class='del'>-	mutex_lock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='del'>-	list_for_each_entry(device, &amp;fs_devices-&gt;devices, dev_list) {</div><div class='add'>+	mutex_lock(&amp;fs_info-&gt;chunk_mutex);</div><div class='add'>+	spin_lock(&amp;fs_info-&gt;zone_active_bgs_lock);</div><div class='add'>+	list_for_each_entry(device, &amp;fs_devices-&gt;alloc_list, dev_alloc_list) {</div><div class='ctx'> 		struct btrfs_zoned_device_info *zinfo = device-&gt;zone_info;</div><div class='add'>+		int reserved = 0;</div><div class='ctx'> </div><div class='ctx'> 		if (!device-&gt;bdev)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		if (!zinfo-&gt;max_active_zones ||</div><div class='del'>-		    atomic_read(&amp;zinfo-&gt;active_zones_left)) {</div><div class='add'>+		if (!zinfo-&gt;max_active_zones) {</div><div class='ctx'> 			ret = true;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='add'>+		if (flags &amp; BTRFS_BLOCK_GROUP_DATA)</div><div class='add'>+			reserved = zinfo-&gt;reserved_active_zones;</div><div class='add'>+</div><div class='add'>+		switch (flags &amp; BTRFS_BLOCK_GROUP_PROFILE_MASK) {</div><div class='add'>+		case 0: /* single */</div><div class='add'>+			ret = (atomic_read(&amp;zinfo-&gt;active_zones_left) &gt;= (1 + reserved));</div><div class='add'>+			break;</div><div class='add'>+		case BTRFS_BLOCK_GROUP_DUP:</div><div class='add'>+			ret = (atomic_read(&amp;zinfo-&gt;active_zones_left) &gt;= (2 + reserved));</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		if (ret)</div><div class='add'>+			break;</div><div class='ctx'> 	}</div><div class='del'>-	mutex_unlock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;zone_active_bgs_lock);</div><div class='add'>+	mutex_unlock(&amp;fs_info-&gt;chunk_mutex);</div><div class='add'>+</div><div class='add'>+	if (!ret)</div><div class='add'>+		set_bit(BTRFS_FS_NEED_ZONE_FINISH, &amp;fs_info-&gt;flags);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void btrfs_zone_finish_endio(struct btrfs_fs_info *fs_info, u64 logical, u64 length)</div><div class='add'>+int btrfs_zone_finish_endio(struct btrfs_fs_info *fs_info, u64 logical, u64 length)</div><div class='ctx'> {</div><div class='ctx'> 	struct btrfs_block_group *block_group;</div><div class='del'>-	struct map_lookup *map;</div><div class='del'>-	struct btrfs_device *device;</div><div class='del'>-	u64 physical;</div><div class='add'>+	u64 min_alloc_bytes;</div><div class='ctx'> </div><div class='ctx'> 	if (!btrfs_is_zoned(fs_info))</div><div class='del'>-		return;</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> 	block_group = btrfs_lookup_block_group(fs_info, logical);</div><div class='del'>-	ASSERT(block_group);</div><div class='del'>-</div><div class='del'>-	if (logical + length &lt; block_group-&gt;start + block_group-&gt;zone_capacity)</div><div class='del'>-		goto out;</div><div class='add'>+	if (WARN_ON_ONCE(!block_group))</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;block_group-&gt;lock);</div><div class='add'>+	/* No MIXED_BG on zoned btrfs. */</div><div class='add'>+	if (block_group-&gt;flags &amp; BTRFS_BLOCK_GROUP_DATA)</div><div class='add'>+		min_alloc_bytes = fs_info-&gt;sectorsize;</div><div class='add'>+	else</div><div class='add'>+		min_alloc_bytes = fs_info-&gt;nodesize;</div><div class='ctx'> </div><div class='del'>-	if (!block_group-&gt;zone_is_active) {</div><div class='del'>-		spin_unlock(&amp;block_group-&gt;lock);</div><div class='add'>+	/* Bail out if we can allocate more data from this block group. */</div><div class='add'>+	if (logical + length + min_alloc_bytes &lt;=</div><div class='add'>+	    block_group-&gt;start + block_group-&gt;zone_capacity)</div><div class='ctx'> 		goto out;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	block_group-&gt;zone_is_active = 0;</div><div class='del'>-	/* We should have consumed all the free space */</div><div class='del'>-	ASSERT(block_group-&gt;alloc_offset == block_group-&gt;zone_capacity);</div><div class='del'>-	ASSERT(block_group-&gt;free_space_ctl-&gt;free_space == 0);</div><div class='del'>-	btrfs_clear_treelog_bg(block_group);</div><div class='del'>-	spin_unlock(&amp;block_group-&gt;lock);</div><div class='add'>+	do_zone_finish(block_group, true);</div><div class='ctx'> </div><div class='del'>-	map = block_group-&gt;physical_map;</div><div class='del'>-	device = map-&gt;stripes[0].dev;</div><div class='del'>-	physical = map-&gt;stripes[0].physical;</div><div class='add'>+out:</div><div class='add'>+	btrfs_put_block_group(block_group);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if (!device-&gt;zone_info-&gt;max_active_zones)</div><div class='del'>-		goto out;</div><div class='add'>+static void btrfs_zone_finish_endio_workfn(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+	struct btrfs_block_group *bg =</div><div class='add'>+		container_of(work, struct btrfs_block_group, zone_finish_work);</div><div class='ctx'> </div><div class='del'>-	btrfs_dev_clear_active_zone(device, physical);</div><div class='add'>+	wait_on_extent_buffer_writeback(bg-&gt;last_eb);</div><div class='add'>+	free_extent_buffer(bg-&gt;last_eb);</div><div class='add'>+	ret = do_zone_finish(bg, true);</div><div class='add'>+	if (ret)</div><div class='add'>+		btrfs_handle_fs_error(bg-&gt;fs_info, ret,</div><div class='add'>+				      "Failed to finish block-group's zone");</div><div class='add'>+	btrfs_put_block_group(bg);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;fs_info-&gt;zone_active_bgs_lock);</div><div class='del'>-	ASSERT(!list_empty(&amp;block_group-&gt;active_bg_list));</div><div class='del'>-	list_del_init(&amp;block_group-&gt;active_bg_list);</div><div class='del'>-	spin_unlock(&amp;fs_info-&gt;zone_active_bgs_lock);</div><div class='add'>+void btrfs_schedule_zone_finish_bg(struct btrfs_block_group *bg,</div><div class='add'>+				   struct extent_buffer *eb)</div><div class='add'>+{</div><div class='add'>+	if (!test_bit(BLOCK_GROUP_FLAG_SEQUENTIAL_ZONE, &amp;bg-&gt;runtime_flags) ||</div><div class='add'>+	    eb-&gt;start + eb-&gt;len * 2 &lt;= bg-&gt;start + bg-&gt;zone_capacity)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	btrfs_put_block_group(block_group);</div><div class='add'>+	if (WARN_ON(bg-&gt;zone_finish_work.func == btrfs_zone_finish_endio_workfn)) {</div><div class='add'>+		btrfs_err(bg-&gt;fs_info, "double scheduling of bg %llu zone finishing",</div><div class='add'>+			  bg-&gt;start);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	btrfs_put_block_group(block_group);</div><div class='add'>+	/* For the work */</div><div class='add'>+	btrfs_get_block_group(bg);</div><div class='add'>+	refcount_inc(&amp;eb-&gt;refs);</div><div class='add'>+	bg-&gt;last_eb = eb;</div><div class='add'>+	INIT_WORK(&amp;bg-&gt;zone_finish_work, btrfs_zone_finish_endio_workfn);</div><div class='add'>+	queue_work(system_dfl_wq, &amp;bg-&gt;zone_finish_work);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void btrfs_clear_data_reloc_bg(struct btrfs_block_group *bg)</div><div class='hunk'>@@ -1973,3 +2541,446 @@ void btrfs_clear_data_reloc_bg(struct btrfs_block_group *bg)</div><div class='ctx'> 		fs_info-&gt;data_reloc_bg = 0;</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;relocation_bg_lock);</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+void btrfs_zoned_reserve_data_reloc_bg(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_space_info *data_sinfo = fs_info-&gt;data_sinfo;</div><div class='add'>+	struct btrfs_space_info *space_info = data_sinfo;</div><div class='add'>+	struct btrfs_trans_handle *trans;</div><div class='add'>+	struct btrfs_block_group *bg;</div><div class='add'>+	struct list_head *bg_list;</div><div class='add'>+	u64 alloc_flags;</div><div class='add'>+	bool first = true;</div><div class='add'>+	bool did_chunk_alloc = false;</div><div class='add'>+	int index;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (!btrfs_is_zoned(fs_info))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (fs_info-&gt;data_reloc_bg)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (sb_rdonly(fs_info-&gt;sb))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	alloc_flags = btrfs_get_alloc_profile(fs_info, space_info-&gt;flags);</div><div class='add'>+	index = btrfs_bg_flags_to_raid_index(alloc_flags);</div><div class='add'>+</div><div class='add'>+	/* Scan the data space_info to find empty block groups. Take the second one. */</div><div class='add'>+again:</div><div class='add'>+	bg_list = &amp;space_info-&gt;block_groups[index];</div><div class='add'>+	list_for_each_entry(bg, bg_list, list) {</div><div class='add'>+		if (bg-&gt;alloc_offset != 0)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		if (first) {</div><div class='add'>+			first = false;</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (space_info == data_sinfo) {</div><div class='add'>+			/* Migrate the block group to the data relocation space_info. */</div><div class='add'>+			struct btrfs_space_info *reloc_sinfo = data_sinfo-&gt;sub_group[0];</div><div class='add'>+			int factor;</div><div class='add'>+</div><div class='add'>+			ASSERT(reloc_sinfo-&gt;subgroup_id == BTRFS_SUB_GROUP_DATA_RELOC,</div><div class='add'>+			       "reloc_sinfo-&gt;subgroup_id=%d", reloc_sinfo-&gt;subgroup_id);</div><div class='add'>+			factor = btrfs_bg_type_to_factor(bg-&gt;flags);</div><div class='add'>+</div><div class='add'>+			down_write(&amp;space_info-&gt;groups_sem);</div><div class='add'>+			list_del_init(&amp;bg-&gt;list);</div><div class='add'>+			/* We can assume this as we choose the second empty one. */</div><div class='add'>+			ASSERT(!list_empty(&amp;space_info-&gt;block_groups[index]));</div><div class='add'>+			up_write(&amp;space_info-&gt;groups_sem);</div><div class='add'>+</div><div class='add'>+			spin_lock(&amp;space_info-&gt;lock);</div><div class='add'>+			space_info-&gt;total_bytes -= bg-&gt;length;</div><div class='add'>+			space_info-&gt;disk_total -= bg-&gt;length * factor;</div><div class='add'>+			space_info-&gt;disk_total -= bg-&gt;zone_unusable;</div><div class='add'>+			/* There is no allocation ever happened. */</div><div class='add'>+			ASSERT(bg-&gt;used == 0, "bg-&gt;used=%llu", bg-&gt;used);</div><div class='add'>+			/* No super block in a block group on the zoned setup. */</div><div class='add'>+			ASSERT(bg-&gt;bytes_super == 0, "bg-&gt;bytes_super=%llu", bg-&gt;bytes_super);</div><div class='add'>+			spin_unlock(&amp;space_info-&gt;lock);</div><div class='add'>+</div><div class='add'>+			bg-&gt;space_info = reloc_sinfo;</div><div class='add'>+			if (reloc_sinfo-&gt;block_group_kobjs[index] == NULL)</div><div class='add'>+				btrfs_sysfs_add_block_group_type(bg);</div><div class='add'>+</div><div class='add'>+			btrfs_add_bg_to_space_info(fs_info, bg);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		fs_info-&gt;data_reloc_bg = bg-&gt;start;</div><div class='add'>+		set_bit(BLOCK_GROUP_FLAG_ZONED_DATA_RELOC, &amp;bg-&gt;runtime_flags);</div><div class='add'>+		btrfs_zone_activate(bg);</div><div class='add'>+</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (did_chunk_alloc)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	trans = btrfs_join_transaction(fs_info-&gt;tree_root);</div><div class='add'>+	if (IS_ERR(trans))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/* Allocate new BG in the data relocation space_info. */</div><div class='add'>+	space_info = data_sinfo-&gt;sub_group[0];</div><div class='add'>+	ASSERT(space_info-&gt;subgroup_id == BTRFS_SUB_GROUP_DATA_RELOC,</div><div class='add'>+	       "space_info-&gt;subgroup_id=%d", space_info-&gt;subgroup_id);</div><div class='add'>+	ret = btrfs_chunk_alloc(trans, space_info, alloc_flags, CHUNK_ALLOC_FORCE);</div><div class='add'>+	btrfs_end_transaction(trans);</div><div class='add'>+	if (ret == 1) {</div><div class='add'>+		/*</div><div class='add'>+		 * We allocated a new block group in the data relocation space_info. We</div><div class='add'>+		 * can take that one.</div><div class='add'>+		 */</div><div class='add'>+		first = false;</div><div class='add'>+		did_chunk_alloc = true;</div><div class='add'>+		goto again;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_free_zone_cache(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_devices *fs_devices = fs_info-&gt;fs_devices;</div><div class='add'>+	struct btrfs_device *device;</div><div class='add'>+</div><div class='add'>+	if (!btrfs_is_zoned(fs_info))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='add'>+	list_for_each_entry(device, &amp;fs_devices-&gt;devices, dev_list) {</div><div class='add'>+		if (device-&gt;zone_info) {</div><div class='add'>+			vfree(device-&gt;zone_info-&gt;zone_cache);</div><div class='add'>+			device-&gt;zone_info-&gt;zone_cache = NULL;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	mutex_unlock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool btrfs_zoned_should_reclaim(const struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_devices *fs_devices = fs_info-&gt;fs_devices;</div><div class='add'>+	struct btrfs_device *device;</div><div class='add'>+	u64 total = btrfs_super_total_bytes(fs_info-&gt;super_copy);</div><div class='add'>+	u64 used = 0;</div><div class='add'>+	u64 factor;</div><div class='add'>+</div><div class='add'>+	ASSERT(btrfs_is_zoned(fs_info));</div><div class='add'>+</div><div class='add'>+	if (fs_info-&gt;bg_reclaim_threshold == 0)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='add'>+	list_for_each_entry(device, &amp;fs_devices-&gt;devices, dev_list) {</div><div class='add'>+		if (!device-&gt;bdev)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		used += device-&gt;bytes_used;</div><div class='add'>+	}</div><div class='add'>+	mutex_unlock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='add'>+</div><div class='add'>+	factor = div64_u64(used * 100, total);</div><div class='add'>+	return factor &gt;= fs_info-&gt;bg_reclaim_threshold;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void btrfs_zoned_release_data_reloc_bg(struct btrfs_fs_info *fs_info, u64 logical,</div><div class='add'>+				       u64 length)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_block_group *block_group;</div><div class='add'>+</div><div class='add'>+	if (!btrfs_is_zoned(fs_info))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	block_group = btrfs_lookup_block_group(fs_info, logical);</div><div class='add'>+	/* It should be called on a previous data relocation block group. */</div><div class='add'>+	ASSERT(block_group &amp;&amp; (block_group-&gt;flags &amp; BTRFS_BLOCK_GROUP_DATA));</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;block_group-&gt;lock);</div><div class='add'>+	if (!test_bit(BLOCK_GROUP_FLAG_ZONED_DATA_RELOC, &amp;block_group-&gt;runtime_flags))</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	/* All relocation extents are written. */</div><div class='add'>+	if (block_group-&gt;start + block_group-&gt;alloc_offset == logical + length) {</div><div class='add'>+		/*</div><div class='add'>+		 * Now, release this block group for further allocations and</div><div class='add'>+		 * zone finish.</div><div class='add'>+		 */</div><div class='add'>+		clear_bit(BLOCK_GROUP_FLAG_ZONED_DATA_RELOC,</div><div class='add'>+			  &amp;block_group-&gt;runtime_flags);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	spin_unlock(&amp;block_group-&gt;lock);</div><div class='add'>+	btrfs_put_block_group(block_group);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_zone_finish_one_bg(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_block_group *block_group;</div><div class='add'>+	struct btrfs_block_group *min_bg = NULL;</div><div class='add'>+	u64 min_avail = U64_MAX;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fs_info-&gt;zone_active_bgs_lock);</div><div class='add'>+	list_for_each_entry(block_group, &amp;fs_info-&gt;zone_active_bgs,</div><div class='add'>+			    active_bg_list) {</div><div class='add'>+		u64 avail;</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;block_group-&gt;lock);</div><div class='add'>+		if (block_group-&gt;reserved || block_group-&gt;alloc_offset == 0 ||</div><div class='add'>+		    !(block_group-&gt;flags &amp; BTRFS_BLOCK_GROUP_DATA) ||</div><div class='add'>+		    test_bit(BLOCK_GROUP_FLAG_ZONED_DATA_RELOC, &amp;block_group-&gt;runtime_flags)) {</div><div class='add'>+			spin_unlock(&amp;block_group-&gt;lock);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		avail = block_group-&gt;zone_capacity - block_group-&gt;alloc_offset;</div><div class='add'>+		if (min_avail &gt; avail) {</div><div class='add'>+			if (min_bg)</div><div class='add'>+				btrfs_put_block_group(min_bg);</div><div class='add'>+			min_bg = block_group;</div><div class='add'>+			min_avail = avail;</div><div class='add'>+			btrfs_get_block_group(min_bg);</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;block_group-&gt;lock);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;zone_active_bgs_lock);</div><div class='add'>+</div><div class='add'>+	if (!min_bg)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	ret = btrfs_zone_finish(min_bg);</div><div class='add'>+	btrfs_put_block_group(min_bg);</div><div class='add'>+</div><div class='add'>+	return ret &lt; 0 ? ret : 1;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int btrfs_zoned_activate_one_bg(struct btrfs_space_info *space_info, bool do_finish)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = space_info-&gt;fs_info;</div><div class='add'>+	struct btrfs_block_group *bg;</div><div class='add'>+	int index;</div><div class='add'>+</div><div class='add'>+	if (!btrfs_is_zoned(fs_info) || (space_info-&gt;flags &amp; BTRFS_BLOCK_GROUP_DATA))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	for (;;) {</div><div class='add'>+		int ret;</div><div class='add'>+		bool need_finish = false;</div><div class='add'>+</div><div class='add'>+		down_read(&amp;space_info-&gt;groups_sem);</div><div class='add'>+		for (index = 0; index &lt; BTRFS_NR_RAID_TYPES; index++) {</div><div class='add'>+			list_for_each_entry(bg, &amp;space_info-&gt;block_groups[index],</div><div class='add'>+					    list) {</div><div class='add'>+				if (!spin_trylock(&amp;bg-&gt;lock))</div><div class='add'>+					continue;</div><div class='add'>+				if (btrfs_zoned_bg_is_full(bg) ||</div><div class='add'>+				    test_bit(BLOCK_GROUP_FLAG_ZONE_IS_ACTIVE,</div><div class='add'>+					     &amp;bg-&gt;runtime_flags)) {</div><div class='add'>+					spin_unlock(&amp;bg-&gt;lock);</div><div class='add'>+					continue;</div><div class='add'>+				}</div><div class='add'>+				spin_unlock(&amp;bg-&gt;lock);</div><div class='add'>+</div><div class='add'>+				if (btrfs_zone_activate(bg)) {</div><div class='add'>+					up_read(&amp;space_info-&gt;groups_sem);</div><div class='add'>+					return 1;</div><div class='add'>+				}</div><div class='add'>+</div><div class='add'>+				need_finish = true;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+		up_read(&amp;space_info-&gt;groups_sem);</div><div class='add'>+</div><div class='add'>+		if (!do_finish || !need_finish)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		ret = btrfs_zone_finish_one_bg(fs_info);</div><div class='add'>+		if (ret == 0)</div><div class='add'>+			break;</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Reserve zones for one metadata block group, one tree-log block group, and one</div><div class='add'>+ * system block group.</div><div class='add'>+ */</div><div class='add'>+void btrfs_check_active_zone_reservation(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_devices *fs_devices = fs_info-&gt;fs_devices;</div><div class='add'>+	struct btrfs_block_group *block_group;</div><div class='add'>+	struct btrfs_device *device;</div><div class='add'>+	/* Reserve zones for normal SINGLE metadata and tree-log block group. */</div><div class='add'>+	unsigned int metadata_reserve = 2;</div><div class='add'>+	/* Reserve a zone for SINGLE system block group. */</div><div class='add'>+	unsigned int system_reserve = 1;</div><div class='add'>+</div><div class='add'>+	if (!test_bit(BTRFS_FS_ACTIVE_ZONE_TRACKING, &amp;fs_info-&gt;flags))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This function is called from the mount context. So, there is no</div><div class='add'>+	 * parallel process touching the bits. No need for read_seqretry().</div><div class='add'>+	 */</div><div class='add'>+	if (fs_info-&gt;avail_metadata_alloc_bits &amp; BTRFS_BLOCK_GROUP_DUP)</div><div class='add'>+		metadata_reserve = 4;</div><div class='add'>+	if (fs_info-&gt;avail_system_alloc_bits &amp; BTRFS_BLOCK_GROUP_DUP)</div><div class='add'>+		system_reserve = 2;</div><div class='add'>+</div><div class='add'>+	/* Apply the reservation on all the devices. */</div><div class='add'>+	mutex_lock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='add'>+	list_for_each_entry(device, &amp;fs_devices-&gt;devices, dev_list) {</div><div class='add'>+		if (!device-&gt;bdev)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		device-&gt;zone_info-&gt;reserved_active_zones =</div><div class='add'>+			metadata_reserve + system_reserve;</div><div class='add'>+	}</div><div class='add'>+	mutex_unlock(&amp;fs_devices-&gt;device_list_mutex);</div><div class='add'>+</div><div class='add'>+	/* Release reservation for currently active block groups. */</div><div class='add'>+	spin_lock(&amp;fs_info-&gt;zone_active_bgs_lock);</div><div class='add'>+	list_for_each_entry(block_group, &amp;fs_info-&gt;zone_active_bgs, active_bg_list) {</div><div class='add'>+		struct btrfs_chunk_map *map = block_group-&gt;physical_map;</div><div class='add'>+</div><div class='add'>+		if (!(block_group-&gt;flags &amp;</div><div class='add'>+		      (BTRFS_BLOCK_GROUP_METADATA | BTRFS_BLOCK_GROUP_SYSTEM)))</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		for (int i = 0; i &lt; map-&gt;num_stripes; i++)</div><div class='add'>+			map-&gt;stripes[i].dev-&gt;zone_info-&gt;reserved_active_zones--;</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;fs_info-&gt;zone_active_bgs_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Reset the zones of unused block groups from @space_info-&gt;bytes_zone_unusable.</div><div class='add'>+ *</div><div class='add'>+ * @space_info:	the space to work on</div><div class='add'>+ * @num_bytes:	targeting reclaim bytes</div><div class='add'>+ *</div><div class='add'>+ * This one resets the zones of a block group, so we can reuse the region</div><div class='add'>+ * without removing the block group. On the other hand, btrfs_delete_unused_bgs()</div><div class='add'>+ * just removes a block group and frees up the underlying zones. So, we still</div><div class='add'>+ * need to allocate a new block group to reuse the zones.</div><div class='add'>+ *</div><div class='add'>+ * Resetting is faster than deleting/recreating a block group. It is similar</div><div class='add'>+ * to freeing the logical space on the regular mode. However, we cannot change</div><div class='add'>+ * the block group's profile with this operation.</div><div class='add'>+ */</div><div class='add'>+int btrfs_reset_unused_block_groups(struct btrfs_space_info *space_info, u64 num_bytes)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_fs_info *fs_info = space_info-&gt;fs_info;</div><div class='add'>+	const sector_t zone_size_sectors = fs_info-&gt;zone_size &gt;&gt; SECTOR_SHIFT;</div><div class='add'>+</div><div class='add'>+	if (!btrfs_is_zoned(fs_info))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	while (num_bytes &gt; 0) {</div><div class='add'>+		struct btrfs_chunk_map *map;</div><div class='add'>+		struct btrfs_block_group *bg = NULL;</div><div class='add'>+		bool found = false;</div><div class='add'>+		u64 reclaimed = 0;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Here, we choose a fully zone_unusable block group. It's</div><div class='add'>+		 * technically possible to reset a partly zone_unusable block</div><div class='add'>+		 * group, which still has some free space left. However,</div><div class='add'>+		 * handling that needs to cope with the allocation side, which</div><div class='add'>+		 * makes the logic more complex. So, let's handle the easy case</div><div class='add'>+		 * for now.</div><div class='add'>+		 */</div><div class='add'>+		spin_lock(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='add'>+		list_for_each_entry(bg, &amp;fs_info-&gt;unused_bgs, bg_list) {</div><div class='add'>+			if ((bg-&gt;flags &amp; BTRFS_BLOCK_GROUP_TYPE_MASK) != space_info-&gt;flags)</div><div class='add'>+				continue;</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * Use trylock to avoid locking order violation. In</div><div class='add'>+			 * btrfs_reclaim_bgs_work(), the lock order is</div><div class='add'>+			 * &amp;bg-&gt;lock -&gt; &amp;fs_info-&gt;unused_bgs_lock. We skip a</div><div class='add'>+			 * block group if we cannot take its lock.</div><div class='add'>+			 */</div><div class='add'>+			if (!spin_trylock(&amp;bg-&gt;lock))</div><div class='add'>+				continue;</div><div class='add'>+			if (btrfs_is_block_group_used(bg) || bg-&gt;zone_unusable &lt; bg-&gt;length) {</div><div class='add'>+				spin_unlock(&amp;bg-&gt;lock);</div><div class='add'>+				continue;</div><div class='add'>+			}</div><div class='add'>+			spin_unlock(&amp;bg-&gt;lock);</div><div class='add'>+			found = true;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		if (!found) {</div><div class='add'>+			spin_unlock(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='add'>+			return 0;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		list_del_init(&amp;bg-&gt;bg_list);</div><div class='add'>+		btrfs_put_block_group(bg);</div><div class='add'>+		spin_unlock(&amp;fs_info-&gt;unused_bgs_lock);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Since the block group is fully zone_unusable and we cannot</div><div class='add'>+		 * allocate from this block group anymore, we don't need to set</div><div class='add'>+		 * this block group read-only.</div><div class='add'>+		 */</div><div class='add'>+</div><div class='add'>+		down_read(&amp;fs_info-&gt;dev_replace.rwsem);</div><div class='add'>+		map = bg-&gt;physical_map;</div><div class='add'>+		for (int i = 0; i &lt; map-&gt;num_stripes; i++) {</div><div class='add'>+			struct btrfs_io_stripe *stripe = &amp;map-&gt;stripes[i];</div><div class='add'>+			unsigned int nofs_flags;</div><div class='add'>+			int ret;</div><div class='add'>+</div><div class='add'>+			nofs_flags = memalloc_nofs_save();</div><div class='add'>+			ret = blkdev_zone_mgmt(stripe-&gt;dev-&gt;bdev, REQ_OP_ZONE_RESET,</div><div class='add'>+					       stripe-&gt;physical &gt;&gt; SECTOR_SHIFT,</div><div class='add'>+					       zone_size_sectors);</div><div class='add'>+			memalloc_nofs_restore(nofs_flags);</div><div class='add'>+</div><div class='add'>+			if (ret) {</div><div class='add'>+				up_read(&amp;fs_info-&gt;dev_replace.rwsem);</div><div class='add'>+				return ret;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+		up_read(&amp;fs_info-&gt;dev_replace.rwsem);</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;space_info-&gt;lock);</div><div class='add'>+		spin_lock(&amp;bg-&gt;lock);</div><div class='add'>+		ASSERT(!btrfs_is_block_group_used(bg));</div><div class='add'>+		if (bg-&gt;ro) {</div><div class='add'>+			spin_unlock(&amp;bg-&gt;lock);</div><div class='add'>+			spin_unlock(&amp;space_info-&gt;lock);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		reclaimed = bg-&gt;alloc_offset;</div><div class='add'>+		bg-&gt;zone_unusable = bg-&gt;length - bg-&gt;zone_capacity;</div><div class='add'>+		bg-&gt;alloc_offset = 0;</div><div class='add'>+		/*</div><div class='add'>+		 * This holds because we currently reset fully used then freed</div><div class='add'>+		 * block group.</div><div class='add'>+		 */</div><div class='add'>+		ASSERT(reclaimed == bg-&gt;zone_capacity,</div><div class='add'>+		       "reclaimed=%llu bg-&gt;zone_capacity=%llu", reclaimed, bg-&gt;zone_capacity);</div><div class='add'>+		bg-&gt;free_space_ctl-&gt;free_space += reclaimed;</div><div class='add'>+		space_info-&gt;bytes_zone_unusable -= reclaimed;</div><div class='add'>+		spin_unlock(&amp;bg-&gt;lock);</div><div class='add'>+		btrfs_return_free_space(space_info, reclaimed);</div><div class='add'>+		spin_unlock(&amp;space_info-&gt;lock);</div><div class='add'>+</div><div class='add'>+		if (num_bytes &lt;= reclaimed)</div><div class='add'>+			break;</div><div class='add'>+		num_bytes -= reclaimed;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/btrfs/zoned.h b/fs/btrfs/zoned.h<br/>index e53ab7b96437..5cefdeb08b7b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/zoned.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/zoned.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/zoned.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/zoned.h</a></div><div class='hunk'>@@ -4,16 +4,28 @@</div><div class='ctx'> #define BTRFS_ZONED_H</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/types.h&gt;</div><div class='add'>+#include &lt;linux/atomic.h&gt;</div><div class='ctx'> #include &lt;linux/blkdev.h&gt;</div><div class='add'>+#include &lt;linux/blkzoned.h&gt;</div><div class='add'>+#include &lt;linux/errno.h&gt;</div><div class='add'>+#include &lt;linux/spinlock.h&gt;</div><div class='add'>+#include &lt;linux/mutex.h&gt;</div><div class='add'>+#include "messages.h"</div><div class='ctx'> #include "volumes.h"</div><div class='ctx'> #include "disk-io.h"</div><div class='ctx'> #include "block-group.h"</div><div class='add'>+#include "btrfs_inode.h"</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Block groups with more than this value (percents) of unusable space will be</div><div class='del'>- * scheduled for background reclaim.</div><div class='del'>- */</div><div class='del'>-#define BTRFS_DEFAULT_RECLAIM_THRESH		75</div><div class='add'>+struct block_device;</div><div class='add'>+struct extent_buffer;</div><div class='add'>+struct btrfs_bio;</div><div class='add'>+struct btrfs_ordered_extent;</div><div class='add'>+struct btrfs_fs_info;</div><div class='add'>+struct btrfs_space_info;</div><div class='add'>+struct btrfs_eb_write_context;</div><div class='add'>+struct btrfs_fs_devices;</div><div class='add'>+</div><div class='add'>+#define BTRFS_DEFAULT_RECLAIM_THRESH           			(75)</div><div class='ctx'> </div><div class='ctx'> struct btrfs_zoned_device_info {</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -24,21 +36,29 @@ struct btrfs_zoned_device_info {</div><div class='ctx'> 	u8  zone_size_shift;</div><div class='ctx'> 	u32 nr_zones;</div><div class='ctx'> 	unsigned int max_active_zones;</div><div class='add'>+	/*</div><div class='add'>+	 * Reserved active zones for one metadata and one system block group.</div><div class='add'>+	 * It can vary per-device depending on the allocation status.</div><div class='add'>+	 */</div><div class='add'>+	int reserved_active_zones;</div><div class='ctx'> 	atomic_t active_zones_left;</div><div class='ctx'> 	unsigned long *seq_zones;</div><div class='ctx'> 	unsigned long *empty_zones;</div><div class='ctx'> 	unsigned long *active_zones;</div><div class='add'>+	struct blk_zone *zone_cache;</div><div class='ctx'> 	struct blk_zone sb_zones[2 * BTRFS_SUPER_MIRROR_MAX];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+void btrfs_finish_ordered_zoned(struct btrfs_ordered_extent *ordered);</div><div class='add'>+</div><div class='ctx'> #ifdef CONFIG_BLK_DEV_ZONED</div><div class='del'>-int btrfs_get_dev_zone(struct btrfs_device *device, u64 pos,</div><div class='del'>-		       struct blk_zone *zone);</div><div class='ctx'> int btrfs_get_dev_zone_info_all_devices(struct btrfs_fs_info *fs_info);</div><div class='del'>-int btrfs_get_dev_zone_info(struct btrfs_device *device);</div><div class='add'>+int btrfs_get_dev_zone_info(struct btrfs_device *device, bool populate_cache);</div><div class='ctx'> void btrfs_destroy_dev_zone_info(struct btrfs_device *device);</div><div class='add'>+struct btrfs_zoned_device_info *btrfs_clone_dev_zone_info(struct btrfs_device *orig_dev);</div><div class='ctx'> int btrfs_check_zoned_mode(struct btrfs_fs_info *fs_info);</div><div class='del'>-int btrfs_check_mountopts_zoned(struct btrfs_fs_info *info);</div><div class='add'>+int btrfs_check_mountopts_zoned(const struct btrfs_fs_info *info,</div><div class='add'>+				unsigned long long *mount_opt);</div><div class='ctx'> int btrfs_sb_log_location_bdev(struct block_device *bdev, int mirror, int rw,</div><div class='ctx'> 			       u64 *bytenr_ret);</div><div class='ctx'> int btrfs_sb_log_location(struct btrfs_device *device, int mirror, int rw,</div><div class='hunk'>@@ -52,49 +72,55 @@ int btrfs_reset_device_zone(struct btrfs_device *device, u64 physical,</div><div class='ctx'> int btrfs_ensure_empty_zones(struct btrfs_device *device, u64 start, u64 size);</div><div class='ctx'> int btrfs_load_block_group_zone_info(struct btrfs_block_group *cache, bool new);</div><div class='ctx'> void btrfs_calc_zone_unusable(struct btrfs_block_group *cache);</div><div class='del'>-void btrfs_redirty_list_add(struct btrfs_transaction *trans,</div><div class='del'>-			    struct extent_buffer *eb);</div><div class='del'>-void btrfs_free_redirty_list(struct btrfs_transaction *trans);</div><div class='del'>-bool btrfs_use_zone_append(struct btrfs_inode *inode, u64 start);</div><div class='del'>-void btrfs_record_physical_zoned(struct inode *inode, u64 file_offset,</div><div class='del'>-				 struct bio *bio);</div><div class='del'>-void btrfs_rewrite_logical_zoned(struct btrfs_ordered_extent *ordered);</div><div class='del'>-bool btrfs_check_meta_write_pointer(struct btrfs_fs_info *fs_info,</div><div class='del'>-				    struct extent_buffer *eb,</div><div class='del'>-				    struct btrfs_block_group **cache_ret);</div><div class='del'>-void btrfs_revert_meta_write_pointer(struct btrfs_block_group *cache,</div><div class='del'>-				     struct extent_buffer *eb);</div><div class='add'>+bool btrfs_use_zone_append(struct btrfs_bio *bbio);</div><div class='add'>+void btrfs_record_physical_zoned(struct btrfs_bio *bbio);</div><div class='add'>+int btrfs_check_meta_write_pointer(struct btrfs_fs_info *fs_info,</div><div class='add'>+				   struct btrfs_eb_write_context *ctx);</div><div class='ctx'> int btrfs_zoned_issue_zeroout(struct btrfs_device *device, u64 physical, u64 length);</div><div class='ctx'> int btrfs_sync_zone_write_pointer(struct btrfs_device *tgt_dev, u64 logical,</div><div class='ctx'> 				  u64 physical_start, u64 physical_pos);</div><div class='del'>-struct btrfs_device *btrfs_zoned_get_device(struct btrfs_fs_info *fs_info,</div><div class='del'>-					    u64 logical, u64 length);</div><div class='ctx'> bool btrfs_zone_activate(struct btrfs_block_group *block_group);</div><div class='ctx'> int btrfs_zone_finish(struct btrfs_block_group *block_group);</div><div class='del'>-bool btrfs_can_activate_zone(struct btrfs_fs_devices *fs_devices,</div><div class='del'>-			     int raid_index);</div><div class='del'>-void btrfs_zone_finish_endio(struct btrfs_fs_info *fs_info, u64 logical,</div><div class='add'>+bool btrfs_can_activate_zone(struct btrfs_fs_devices *fs_devices, u64 flags);</div><div class='add'>+int btrfs_zone_finish_endio(struct btrfs_fs_info *fs_info, u64 logical,</div><div class='ctx'> 			     u64 length);</div><div class='add'>+void btrfs_schedule_zone_finish_bg(struct btrfs_block_group *bg,</div><div class='add'>+				   struct extent_buffer *eb);</div><div class='ctx'> void btrfs_clear_data_reloc_bg(struct btrfs_block_group *bg);</div><div class='add'>+void btrfs_zoned_reserve_data_reloc_bg(struct btrfs_fs_info *fs_info);</div><div class='add'>+void btrfs_free_zone_cache(struct btrfs_fs_info *fs_info);</div><div class='add'>+bool btrfs_zoned_should_reclaim(const struct btrfs_fs_info *fs_info);</div><div class='add'>+void btrfs_zoned_release_data_reloc_bg(struct btrfs_fs_info *fs_info, u64 logical,</div><div class='add'>+				       u64 length);</div><div class='add'>+int btrfs_zone_finish_one_bg(struct btrfs_fs_info *fs_info);</div><div class='add'>+int btrfs_zoned_activate_one_bg(struct btrfs_space_info *space_info, bool do_finish);</div><div class='add'>+void btrfs_check_active_zone_reservation(struct btrfs_fs_info *fs_info);</div><div class='add'>+int btrfs_reset_unused_block_groups(struct btrfs_space_info *space_info, u64 num_bytes);</div><div class='ctx'> #else /* CONFIG_BLK_DEV_ZONED */</div><div class='del'>-static inline int btrfs_get_dev_zone(struct btrfs_device *device, u64 pos,</div><div class='del'>-				     struct blk_zone *zone)</div><div class='del'>-{</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='ctx'> </div><div class='ctx'> static inline int btrfs_get_dev_zone_info_all_devices(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int btrfs_get_dev_zone_info(struct btrfs_device *device)</div><div class='add'>+static inline int btrfs_get_dev_zone_info(struct btrfs_device *device,</div><div class='add'>+					  bool populate_cache)</div><div class='ctx'> {</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void btrfs_destroy_dev_zone_info(struct btrfs_device *device) { }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * In case the kernel is compiled without CONFIG_BLK_DEV_ZONED we'll never call</div><div class='add'>+ * into btrfs_clone_dev_zone_info() so it's safe to return NULL here.</div><div class='add'>+ */</div><div class='add'>+static inline struct btrfs_zoned_device_info *btrfs_clone_dev_zone_info(</div><div class='add'>+						 struct btrfs_device *orig_dev)</div><div class='add'>+{</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline int btrfs_check_zoned_mode(const struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='ctx'> 	if (!btrfs_is_zoned(fs_info))</div><div class='hunk'>@@ -104,7 +130,8 @@ static inline int btrfs_check_zoned_mode(const struct btrfs_fs_info *fs_info)</div><div class='ctx'> 	return -EOPNOTSUPP;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int btrfs_check_mountopts_zoned(struct btrfs_fs_info *info)</div><div class='add'>+static inline int btrfs_check_mountopts_zoned(const struct btrfs_fs_info *info,</div><div class='add'>+					      unsigned long long *mount_opt)</div><div class='ctx'> {</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -161,34 +188,19 @@ static inline int btrfs_load_block_group_zone_info(</div><div class='ctx'> </div><div class='ctx'> static inline void btrfs_calc_zone_unusable(struct btrfs_block_group *cache) { }</div><div class='ctx'> </div><div class='del'>-static inline void btrfs_redirty_list_add(struct btrfs_transaction *trans,</div><div class='del'>-					  struct extent_buffer *eb) { }</div><div class='del'>-static inline void btrfs_free_redirty_list(struct btrfs_transaction *trans) { }</div><div class='del'>-</div><div class='del'>-static inline bool btrfs_use_zone_append(struct btrfs_inode *inode, u64 start)</div><div class='add'>+static inline bool btrfs_use_zone_append(struct btrfs_bio *bbio)</div><div class='ctx'> {</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void btrfs_record_physical_zoned(struct inode *inode,</div><div class='del'>-					       u64 file_offset, struct bio *bio)</div><div class='add'>+static inline void btrfs_record_physical_zoned(struct btrfs_bio *bbio)</div><div class='ctx'> {</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void btrfs_rewrite_logical_zoned(</div><div class='del'>-				struct btrfs_ordered_extent *ordered) { }</div><div class='del'>-</div><div class='del'>-static inline bool btrfs_check_meta_write_pointer(struct btrfs_fs_info *fs_info,</div><div class='del'>-			       struct extent_buffer *eb,</div><div class='del'>-			       struct btrfs_block_group **cache_ret)</div><div class='del'>-{</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void btrfs_revert_meta_write_pointer(</div><div class='del'>-						struct btrfs_block_group *cache,</div><div class='del'>-						struct extent_buffer *eb)</div><div class='add'>+static inline int btrfs_check_meta_write_pointer(struct btrfs_fs_info *fs_info,</div><div class='add'>+						 struct btrfs_eb_write_context *ctx)</div><div class='ctx'> {</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int btrfs_zoned_issue_zeroout(struct btrfs_device *device,</div><div class='hunk'>@@ -204,13 +216,6 @@ static inline int btrfs_sync_zone_write_pointer(struct btrfs_device *tgt_dev,</div><div class='ctx'> 	return -EOPNOTSUPP;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline struct btrfs_device *btrfs_zoned_get_device(</div><div class='del'>-						  struct btrfs_fs_info *fs_info,</div><div class='del'>-						  u64 logical, u64 length)</div><div class='del'>-{</div><div class='del'>-	return ERR_PTR(-EOPNOTSUPP);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static inline bool btrfs_zone_activate(struct btrfs_block_group *block_group)</div><div class='ctx'> {</div><div class='ctx'> 	return true;</div><div class='hunk'>@@ -222,16 +227,54 @@ static inline int btrfs_zone_finish(struct btrfs_block_group *block_group)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline bool btrfs_can_activate_zone(struct btrfs_fs_devices *fs_devices,</div><div class='del'>-					   int raid_index)</div><div class='add'>+					   u64 flags)</div><div class='ctx'> {</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void btrfs_zone_finish_endio(struct btrfs_fs_info *fs_info,</div><div class='del'>-					   u64 logical, u64 length) { }</div><div class='add'>+static inline int btrfs_zone_finish_endio(struct btrfs_fs_info *fs_info,</div><div class='add'>+					   u64 logical, u64 length)</div><div class='add'>+{</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_schedule_zone_finish_bg(struct btrfs_block_group *bg,</div><div class='add'>+						 struct extent_buffer *eb) { }</div><div class='ctx'> </div><div class='ctx'> static inline void btrfs_clear_data_reloc_bg(struct btrfs_block_group *bg) { }</div><div class='ctx'> </div><div class='add'>+static inline void btrfs_zoned_reserve_data_reloc_bg(struct btrfs_fs_info *fs_info) { }</div><div class='add'>+</div><div class='add'>+static inline void btrfs_free_zone_cache(struct btrfs_fs_info *fs_info) { }</div><div class='add'>+</div><div class='add'>+static inline bool btrfs_zoned_should_reclaim(const struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_zoned_release_data_reloc_bg(struct btrfs_fs_info *fs_info,</div><div class='add'>+						     u64 logical, u64 length) { }</div><div class='add'>+</div><div class='add'>+static inline int btrfs_zone_finish_one_bg(struct btrfs_fs_info *fs_info)</div><div class='add'>+{</div><div class='add'>+	return 1;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int btrfs_zoned_activate_one_bg(struct btrfs_space_info *space_info,</div><div class='add'>+					      bool do_finish)</div><div class='add'>+{</div><div class='add'>+	/* Consider all the block groups are active */</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_check_active_zone_reservation(struct btrfs_fs_info *fs_info) { }</div><div class='add'>+</div><div class='add'>+static inline int btrfs_reset_unused_block_groups(struct btrfs_space_info *space_info,</div><div class='add'>+						  u64 num_bytes)</div><div class='add'>+{</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> static inline bool btrfs_dev_is_sequential(struct btrfs_device *device, u64 pos)</div><div class='hunk'>@@ -295,8 +338,8 @@ static inline bool btrfs_check_device_zone_type(const struct btrfs_fs_info *fs_i</div><div class='ctx'> 			(bdev_zone_sectors(bdev) &lt;&lt; SECTOR_SHIFT);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Do not allow Host Manged zoned device */</div><div class='del'>-	return bdev_zoned_model(bdev) != BLK_ZONED_HM;</div><div class='add'>+	/* Do not allow Host Managed zoned device. */</div><div class='add'>+	return !bdev_is_zoned(bdev);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline bool btrfs_check_super_location(struct btrfs_device *device, u64 pos)</div><div class='hunk'>@@ -350,4 +393,26 @@ static inline void btrfs_clear_treelog_bg(struct btrfs_block_group *bg)</div><div class='ctx'> 	spin_unlock(&amp;fs_info-&gt;treelog_bg_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline void btrfs_zoned_data_reloc_lock(struct btrfs_inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+</div><div class='add'>+	if (btrfs_is_data_reloc_root(root) &amp;&amp; btrfs_is_zoned(root-&gt;fs_info))</div><div class='add'>+		mutex_lock(&amp;root-&gt;fs_info-&gt;zoned_data_reloc_io_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void btrfs_zoned_data_reloc_unlock(struct btrfs_inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct btrfs_root *root = inode-&gt;root;</div><div class='add'>+</div><div class='add'>+	if (btrfs_is_data_reloc_root(root) &amp;&amp; btrfs_is_zoned(root-&gt;fs_info))</div><div class='add'>+		mutex_unlock(&amp;root-&gt;fs_info-&gt;zoned_data_reloc_io_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool btrfs_zoned_bg_is_full(const struct btrfs_block_group *bg)</div><div class='add'>+{</div><div class='add'>+	ASSERT(btrfs_is_zoned(bg-&gt;fs_info));</div><div class='add'>+	return (bg-&gt;alloc_offset == bg-&gt;zone_capacity);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/btrfs/zstd.c b/fs/btrfs/zstd.c<br/>index f06b68040352..c9cddcfa337b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/btrfs/zstd.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/btrfs/zstd.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/btrfs/zstd.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/btrfs/zstd.c</a></div><div class='hunk'>@@ -18,20 +18,23 @@</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/zstd.h&gt;</div><div class='ctx'> #include "misc.h"</div><div class='add'>+#include "fs.h"</div><div class='add'>+#include "btrfs_inode.h"</div><div class='ctx'> #include "compression.h"</div><div class='del'>-#include "ctree.h"</div><div class='add'>+#include "super.h"</div><div class='ctx'> </div><div class='ctx'> #define ZSTD_BTRFS_MAX_WINDOWLOG 17</div><div class='del'>-#define ZSTD_BTRFS_MAX_INPUT (1 &lt;&lt; ZSTD_BTRFS_MAX_WINDOWLOG)</div><div class='add'>+#define ZSTD_BTRFS_MAX_INPUT (1U &lt;&lt; ZSTD_BTRFS_MAX_WINDOWLOG)</div><div class='ctx'> #define ZSTD_BTRFS_DEFAULT_LEVEL 3</div><div class='add'>+#define ZSTD_BTRFS_MIN_LEVEL -15</div><div class='ctx'> #define ZSTD_BTRFS_MAX_LEVEL 15</div><div class='ctx'> /* 307s to avoid pathologically clashing with transaction commit */</div><div class='ctx'> #define ZSTD_BTRFS_RECLAIM_JIFFIES (307 * HZ)</div><div class='ctx'> </div><div class='del'>-static ZSTD_parameters zstd_get_btrfs_parameters(unsigned int level,</div><div class='add'>+static zstd_parameters zstd_get_btrfs_parameters(int level,</div><div class='ctx'> 						 size_t src_len)</div><div class='ctx'> {</div><div class='del'>-	ZSTD_parameters params = ZSTD_getParams(level, src_len, 0);</div><div class='add'>+	zstd_parameters params = zstd_get_params(level, src_len);</div><div class='ctx'> </div><div class='ctx'> 	if (params.cParams.windowLog &gt; ZSTD_BTRFS_MAX_WINDOWLOG)</div><div class='ctx'> 		params.cParams.windowLog = ZSTD_BTRFS_MAX_WINDOWLOG;</div><div class='hunk'>@@ -43,13 +46,14 @@ struct workspace {</div><div class='ctx'> 	void *mem;</div><div class='ctx'> 	size_t size;</div><div class='ctx'> 	char *buf;</div><div class='del'>-	unsigned int level;</div><div class='del'>-	unsigned int req_level;</div><div class='add'>+	int level;</div><div class='add'>+	int req_level;</div><div class='ctx'> 	unsigned long last_used; /* jiffies */</div><div class='ctx'> 	struct list_head list;</div><div class='ctx'> 	struct list_head lru_list;</div><div class='del'>-	ZSTD_inBuffer in_buf;</div><div class='del'>-	ZSTD_outBuffer out_buf;</div><div class='add'>+	zstd_in_buffer in_buf;</div><div class='add'>+	zstd_out_buffer out_buf;</div><div class='add'>+	zstd_parameters params;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -73,7 +77,6 @@ struct workspace {</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> struct zstd_workspace_manager {</div><div class='del'>-	const struct btrfs_compress_op *ops;</div><div class='ctx'> 	spinlock_t lock;</div><div class='ctx'> 	struct list_head lru_list;</div><div class='ctx'> 	struct list_head idle_ws[ZSTD_BTRFS_MAX_LEVEL];</div><div class='hunk'>@@ -82,8 +85,6 @@ struct zstd_workspace_manager {</div><div class='ctx'> 	struct timer_list timer;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static struct zstd_workspace_manager wsm;</div><div class='del'>-</div><div class='ctx'> static size_t zstd_ws_mem_sizes[ZSTD_BTRFS_MAX_LEVEL];</div><div class='ctx'> </div><div class='ctx'> static inline struct workspace *list_to_workspace(struct list_head *list)</div><div class='hunk'>@@ -91,31 +92,39 @@ static inline struct workspace *list_to_workspace(struct list_head *list)</div><div class='ctx'> 	return container_of(list, struct workspace, list);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void zstd_free_workspace(struct list_head *ws);</div><div class='del'>-struct list_head *zstd_alloc_workspace(unsigned int level);</div><div class='add'>+static inline int clip_level(int level)</div><div class='add'>+{</div><div class='add'>+	return max(0, level - 1);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='del'>- * zstd_reclaim_timer_fn - reclaim timer</div><div class='add'>+ * Timer callback to free unused workspaces.</div><div class='add'>+ *</div><div class='ctx'>  * @t: timer</div><div class='ctx'>  *</div><div class='ctx'>  * This scans the lru_list and attempts to reclaim any workspace that hasn't</div><div class='ctx'>  * been used for ZSTD_BTRFS_RECLAIM_JIFFIES.</div><div class='add'>+ *</div><div class='add'>+ * The context is softirq and does not need the _bh locking primitives.</div><div class='ctx'>  */</div><div class='ctx'> static void zstd_reclaim_timer_fn(struct timer_list *timer)</div><div class='ctx'> {</div><div class='add'>+	struct zstd_workspace_manager *zwsm =</div><div class='add'>+		container_of(timer, struct zstd_workspace_manager, timer);</div><div class='ctx'> 	unsigned long reclaim_threshold = jiffies - ZSTD_BTRFS_RECLAIM_JIFFIES;</div><div class='ctx'> 	struct list_head *pos, *next;</div><div class='ctx'> </div><div class='del'>-	spin_lock_bh(&amp;wsm.lock);</div><div class='add'>+	spin_lock(&amp;zwsm-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	if (list_empty(&amp;wsm.lru_list)) {</div><div class='del'>-		spin_unlock_bh(&amp;wsm.lock);</div><div class='add'>+	if (list_empty(&amp;zwsm-&gt;lru_list)) {</div><div class='add'>+		spin_unlock(&amp;zwsm-&gt;lock);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	list_for_each_prev_safe(pos, next, &amp;wsm.lru_list) {</div><div class='add'>+	list_for_each_prev_safe(pos, next, &amp;zwsm-&gt;lru_list) {</div><div class='ctx'> 		struct workspace *victim = container_of(pos, struct workspace,</div><div class='ctx'> 							lru_list);</div><div class='del'>-		unsigned int level;</div><div class='add'>+		int level;</div><div class='ctx'> </div><div class='ctx'> 		if (time_after(victim-&gt;last_used, reclaim_threshold))</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -129,19 +138,19 @@ static void zstd_reclaim_timer_fn(struct timer_list *timer)</div><div class='ctx'> 		list_del(&amp;victim-&gt;list);</div><div class='ctx'> 		zstd_free_workspace(&amp;victim-&gt;list);</div><div class='ctx'> </div><div class='del'>-		if (list_empty(&amp;wsm.idle_ws[level - 1]))</div><div class='del'>-			clear_bit(level - 1, &amp;wsm.active_map);</div><div class='add'>+		if (list_empty(&amp;zwsm-&gt;idle_ws[level]))</div><div class='add'>+			clear_bit(level, &amp;zwsm-&gt;active_map);</div><div class='ctx'> </div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!list_empty(&amp;wsm.lru_list))</div><div class='del'>-		mod_timer(&amp;wsm.timer, jiffies + ZSTD_BTRFS_RECLAIM_JIFFIES);</div><div class='add'>+	if (!list_empty(&amp;zwsm-&gt;lru_list))</div><div class='add'>+		mod_timer(&amp;zwsm-&gt;timer, jiffies + ZSTD_BTRFS_RECLAIM_JIFFIES);</div><div class='ctx'> </div><div class='del'>-	spin_unlock_bh(&amp;wsm.lock);</div><div class='add'>+	spin_unlock(&amp;zwsm-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * zstd_calc_ws_mem_sizes - calculate monotonic memory bounds</div><div class='add'>+ * Calculate monotonic memory bounds.</div><div class='ctx'>  *</div><div class='ctx'>  * It is possible based on the level configurations that a higher level</div><div class='ctx'>  * workspace uses less memory than a lower level workspace.  In order to reuse</div><div class='hunk'>@@ -152,69 +161,79 @@ static void zstd_reclaim_timer_fn(struct timer_list *timer)</div><div class='ctx'> static void zstd_calc_ws_mem_sizes(void)</div><div class='ctx'> {</div><div class='ctx'> 	size_t max_size = 0;</div><div class='del'>-	unsigned int level;</div><div class='add'>+	int level;</div><div class='ctx'> </div><div class='del'>-	for (level = 1; level &lt;= ZSTD_BTRFS_MAX_LEVEL; level++) {</div><div class='del'>-		ZSTD_parameters params =</div><div class='add'>+	for (level = ZSTD_BTRFS_MIN_LEVEL; level &lt;= ZSTD_BTRFS_MAX_LEVEL; level++) {</div><div class='add'>+		if (level == 0)</div><div class='add'>+			continue;</div><div class='add'>+		zstd_parameters params =</div><div class='ctx'> 			zstd_get_btrfs_parameters(level, ZSTD_BTRFS_MAX_INPUT);</div><div class='ctx'> 		size_t level_size =</div><div class='ctx'> 			max_t(size_t,</div><div class='del'>-			      ZSTD_CStreamWorkspaceBound(params.cParams),</div><div class='del'>-			      ZSTD_DStreamWorkspaceBound(ZSTD_BTRFS_MAX_INPUT));</div><div class='add'>+			      zstd_cstream_workspace_bound(&amp;params.cParams),</div><div class='add'>+			      zstd_dstream_workspace_bound(ZSTD_BTRFS_MAX_INPUT));</div><div class='ctx'> </div><div class='ctx'> 		max_size = max_t(size_t, max_size, level_size);</div><div class='del'>-		zstd_ws_mem_sizes[level - 1] = max_size;</div><div class='add'>+		/* Use level 1 workspace size for all the fast mode negative levels. */</div><div class='add'>+		zstd_ws_mem_sizes[clip_level(level)] = max_size;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void zstd_init_workspace_manager(void)</div><div class='add'>+int zstd_alloc_workspace_manager(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='add'>+	struct zstd_workspace_manager *zwsm;</div><div class='ctx'> 	struct list_head *ws;</div><div class='del'>-	int i;</div><div class='ctx'> </div><div class='add'>+	ASSERT(fs_info-&gt;compr_wsm[BTRFS_COMPRESS_ZSTD] == NULL);</div><div class='add'>+	zwsm = kzalloc(sizeof(*zwsm), GFP_KERNEL);</div><div class='add'>+	if (!zwsm)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> 	zstd_calc_ws_mem_sizes();</div><div class='add'>+	spin_lock_init(&amp;zwsm-&gt;lock);</div><div class='add'>+	init_waitqueue_head(&amp;zwsm-&gt;wait);</div><div class='add'>+	timer_setup(&amp;zwsm-&gt;timer, zstd_reclaim_timer_fn, 0);</div><div class='ctx'> </div><div class='del'>-	wsm.ops = &amp;btrfs_zstd_compress;</div><div class='del'>-	spin_lock_init(&amp;wsm.lock);</div><div class='del'>-	init_waitqueue_head(&amp;wsm.wait);</div><div class='del'>-	timer_setup(&amp;wsm.timer, zstd_reclaim_timer_fn, 0);</div><div class='del'>-</div><div class='del'>-	INIT_LIST_HEAD(&amp;wsm.lru_list);</div><div class='del'>-	for (i = 0; i &lt; ZSTD_BTRFS_MAX_LEVEL; i++)</div><div class='del'>-		INIT_LIST_HEAD(&amp;wsm.idle_ws[i]);</div><div class='add'>+	INIT_LIST_HEAD(&amp;zwsm-&gt;lru_list);</div><div class='add'>+	for (int i = 0; i &lt; ZSTD_BTRFS_MAX_LEVEL; i++)</div><div class='add'>+		INIT_LIST_HEAD(&amp;zwsm-&gt;idle_ws[i]);</div><div class='add'>+	fs_info-&gt;compr_wsm[BTRFS_COMPRESS_ZSTD] = zwsm;</div><div class='ctx'> </div><div class='del'>-	ws = zstd_alloc_workspace(ZSTD_BTRFS_MAX_LEVEL);</div><div class='add'>+	ws = zstd_alloc_workspace(fs_info, ZSTD_BTRFS_MAX_LEVEL);</div><div class='ctx'> 	if (IS_ERR(ws)) {</div><div class='del'>-		pr_warn(</div><div class='del'>-		"BTRFS: cannot preallocate zstd compression workspace\n");</div><div class='add'>+		btrfs_warn(NULL, "cannot preallocate zstd compression workspace");</div><div class='ctx'> 	} else {</div><div class='del'>-		set_bit(ZSTD_BTRFS_MAX_LEVEL - 1, &amp;wsm.active_map);</div><div class='del'>-		list_add(ws, &amp;wsm.idle_ws[ZSTD_BTRFS_MAX_LEVEL - 1]);</div><div class='add'>+		set_bit(ZSTD_BTRFS_MAX_LEVEL - 1, &amp;zwsm-&gt;active_map);</div><div class='add'>+		list_add(ws, &amp;zwsm-&gt;idle_ws[ZSTD_BTRFS_MAX_LEVEL - 1]);</div><div class='ctx'> 	}</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void zstd_cleanup_workspace_manager(void)</div><div class='add'>+void zstd_free_workspace_manager(struct btrfs_fs_info *fs_info)</div><div class='ctx'> {</div><div class='add'>+	struct zstd_workspace_manager *zwsm = fs_info-&gt;compr_wsm[BTRFS_COMPRESS_ZSTD];</div><div class='ctx'> 	struct workspace *workspace;</div><div class='del'>-	int i;</div><div class='ctx'> </div><div class='del'>-	spin_lock_bh(&amp;wsm.lock);</div><div class='del'>-	for (i = 0; i &lt; ZSTD_BTRFS_MAX_LEVEL; i++) {</div><div class='del'>-		while (!list_empty(&amp;wsm.idle_ws[i])) {</div><div class='del'>-			workspace = container_of(wsm.idle_ws[i].next,</div><div class='add'>+	if (!zwsm)</div><div class='add'>+		return;</div><div class='add'>+	fs_info-&gt;compr_wsm[BTRFS_COMPRESS_ZSTD] = NULL;</div><div class='add'>+	spin_lock_bh(&amp;zwsm-&gt;lock);</div><div class='add'>+	for (int i = 0; i &lt; ZSTD_BTRFS_MAX_LEVEL; i++) {</div><div class='add'>+		while (!list_empty(&amp;zwsm-&gt;idle_ws[i])) {</div><div class='add'>+			workspace = container_of(zwsm-&gt;idle_ws[i].next,</div><div class='ctx'> 						 struct workspace, list);</div><div class='ctx'> 			list_del(&amp;workspace-&gt;list);</div><div class='ctx'> 			list_del(&amp;workspace-&gt;lru_list);</div><div class='ctx'> 			zstd_free_workspace(&amp;workspace-&gt;list);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock_bh(&amp;wsm.lock);</div><div class='del'>-</div><div class='del'>-	del_timer_sync(&amp;wsm.timer);</div><div class='add'>+	spin_unlock_bh(&amp;zwsm-&gt;lock);</div><div class='add'>+	timer_delete_sync(&amp;zwsm-&gt;timer);</div><div class='add'>+	kfree(zwsm);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * zstd_find_workspace - find workspace</div><div class='add'>+ * Find workspace for given level.</div><div class='add'>+ *</div><div class='ctx'>  * @level: compression level</div><div class='ctx'>  *</div><div class='ctx'>  * This iterates over the set bits in the active_map beginning at the requested</div><div class='hunk'>@@ -224,35 +243,38 @@ void zstd_cleanup_workspace_manager(void)</div><div class='ctx'>  * offer the opportunity to reclaim the workspace in favor of allocating an</div><div class='ctx'>  * appropriately sized one in the future.</div><div class='ctx'>  */</div><div class='del'>-static struct list_head *zstd_find_workspace(unsigned int level)</div><div class='add'>+static struct list_head *zstd_find_workspace(struct btrfs_fs_info *fs_info, int level)</div><div class='ctx'> {</div><div class='add'>+	struct zstd_workspace_manager *zwsm = fs_info-&gt;compr_wsm[BTRFS_COMPRESS_ZSTD];</div><div class='ctx'> 	struct list_head *ws;</div><div class='ctx'> 	struct workspace *workspace;</div><div class='del'>-	int i = level - 1;</div><div class='add'>+	int i = clip_level(level);</div><div class='ctx'> </div><div class='del'>-	spin_lock_bh(&amp;wsm.lock);</div><div class='del'>-	for_each_set_bit_from(i, &amp;wsm.active_map, ZSTD_BTRFS_MAX_LEVEL) {</div><div class='del'>-		if (!list_empty(&amp;wsm.idle_ws[i])) {</div><div class='del'>-			ws = wsm.idle_ws[i].next;</div><div class='add'>+	ASSERT(zwsm);</div><div class='add'>+	spin_lock_bh(&amp;zwsm-&gt;lock);</div><div class='add'>+	for_each_set_bit_from(i, &amp;zwsm-&gt;active_map, ZSTD_BTRFS_MAX_LEVEL) {</div><div class='add'>+		if (!list_empty(&amp;zwsm-&gt;idle_ws[i])) {</div><div class='add'>+			ws = zwsm-&gt;idle_ws[i].next;</div><div class='ctx'> 			workspace = list_to_workspace(ws);</div><div class='ctx'> 			list_del_init(ws);</div><div class='ctx'> 			/* keep its place if it's a lower level using this */</div><div class='ctx'> 			workspace-&gt;req_level = level;</div><div class='del'>-			if (level == workspace-&gt;level)</div><div class='add'>+			if (clip_level(level) == workspace-&gt;level)</div><div class='ctx'> 				list_del(&amp;workspace-&gt;lru_list);</div><div class='del'>-			if (list_empty(&amp;wsm.idle_ws[i]))</div><div class='del'>-				clear_bit(i, &amp;wsm.active_map);</div><div class='del'>-			spin_unlock_bh(&amp;wsm.lock);</div><div class='add'>+			if (list_empty(&amp;zwsm-&gt;idle_ws[i]))</div><div class='add'>+				clear_bit(i, &amp;zwsm-&gt;active_map);</div><div class='add'>+			spin_unlock_bh(&amp;zwsm-&gt;lock);</div><div class='ctx'> 			return ws;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock_bh(&amp;wsm.lock);</div><div class='add'>+	spin_unlock_bh(&amp;zwsm-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * zstd_get_workspace - zstd's get_workspace</div><div class='add'>+ * Zstd get_workspace for level.</div><div class='add'>+ *</div><div class='ctx'>  * @level: compression level</div><div class='ctx'>  *</div><div class='ctx'>  * If @level is 0, then any compression level can be used.  Therefore, we begin</div><div class='hunk'>@@ -260,30 +282,33 @@ static struct list_head *zstd_find_workspace(unsigned int level)</div><div class='ctx'>  * attempt to allocate a new workspace.  If we fail to allocate one due to</div><div class='ctx'>  * memory pressure, go to sleep waiting for the max level workspace to free up.</div><div class='ctx'>  */</div><div class='del'>-struct list_head *zstd_get_workspace(unsigned int level)</div><div class='add'>+struct list_head *zstd_get_workspace(struct btrfs_fs_info *fs_info, int level)</div><div class='ctx'> {</div><div class='add'>+	struct zstd_workspace_manager *zwsm = fs_info-&gt;compr_wsm[BTRFS_COMPRESS_ZSTD];</div><div class='ctx'> 	struct list_head *ws;</div><div class='ctx'> 	unsigned int nofs_flag;</div><div class='ctx'> </div><div class='add'>+	ASSERT(zwsm);</div><div class='add'>+</div><div class='ctx'> 	/* level == 0 means we can use any workspace */</div><div class='ctx'> 	if (!level)</div><div class='ctx'> 		level = 1;</div><div class='ctx'> </div><div class='ctx'> again:</div><div class='del'>-	ws = zstd_find_workspace(level);</div><div class='add'>+	ws = zstd_find_workspace(fs_info, level);</div><div class='ctx'> 	if (ws)</div><div class='ctx'> 		return ws;</div><div class='ctx'> </div><div class='ctx'> 	nofs_flag = memalloc_nofs_save();</div><div class='del'>-	ws = zstd_alloc_workspace(level);</div><div class='add'>+	ws = zstd_alloc_workspace(fs_info, level);</div><div class='ctx'> 	memalloc_nofs_restore(nofs_flag);</div><div class='ctx'> </div><div class='ctx'> 	if (IS_ERR(ws)) {</div><div class='ctx'> 		DEFINE_WAIT(wait);</div><div class='ctx'> </div><div class='del'>-		prepare_to_wait(&amp;wsm.wait, &amp;wait, TASK_UNINTERRUPTIBLE);</div><div class='add'>+		prepare_to_wait(&amp;zwsm-&gt;wait, &amp;wait, TASK_UNINTERRUPTIBLE);</div><div class='ctx'> 		schedule();</div><div class='del'>-		finish_wait(&amp;wsm.wait, &amp;wait);</div><div class='add'>+		finish_wait(&amp;zwsm-&gt;wait, &amp;wait);</div><div class='ctx'> </div><div class='ctx'> 		goto again;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -292,7 +317,8 @@ again:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * zstd_put_workspace - zstd put_workspace</div><div class='add'>+ * Zstd put_workspace.</div><div class='add'>+ *</div><div class='ctx'>  * @ws: list_head for the workspace</div><div class='ctx'>  *</div><div class='ctx'>  * When putting back a workspace, we only need to update the LRU if we are of</div><div class='hunk'>@@ -301,34 +327,36 @@ again:</div><div class='ctx'>  * isn't set, it is also set here.  Only the max level workspace tries and wakes</div><div class='ctx'>  * up waiting workspaces.</div><div class='ctx'>  */</div><div class='del'>-void zstd_put_workspace(struct list_head *ws)</div><div class='add'>+void zstd_put_workspace(struct btrfs_fs_info *fs_info, struct list_head *ws)</div><div class='ctx'> {</div><div class='add'>+	struct zstd_workspace_manager *zwsm = fs_info-&gt;compr_wsm[BTRFS_COMPRESS_ZSTD];</div><div class='ctx'> 	struct workspace *workspace = list_to_workspace(ws);</div><div class='ctx'> </div><div class='del'>-	spin_lock_bh(&amp;wsm.lock);</div><div class='add'>+	ASSERT(zwsm);</div><div class='add'>+	spin_lock_bh(&amp;zwsm-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	/* A node is only taken off the lru if we are the corresponding level */</div><div class='del'>-	if (workspace-&gt;req_level == workspace-&gt;level) {</div><div class='add'>+	if (clip_level(workspace-&gt;req_level) == workspace-&gt;level) {</div><div class='ctx'> 		/* Hide a max level workspace from reclaim */</div><div class='del'>-		if (list_empty(&amp;wsm.idle_ws[ZSTD_BTRFS_MAX_LEVEL - 1])) {</div><div class='add'>+		if (list_empty(&amp;zwsm-&gt;idle_ws[ZSTD_BTRFS_MAX_LEVEL - 1])) {</div><div class='ctx'> 			INIT_LIST_HEAD(&amp;workspace-&gt;lru_list);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			workspace-&gt;last_used = jiffies;</div><div class='del'>-			list_add(&amp;workspace-&gt;lru_list, &amp;wsm.lru_list);</div><div class='del'>-			if (!timer_pending(&amp;wsm.timer))</div><div class='del'>-				mod_timer(&amp;wsm.timer,</div><div class='add'>+			list_add(&amp;workspace-&gt;lru_list, &amp;zwsm-&gt;lru_list);</div><div class='add'>+			if (!timer_pending(&amp;zwsm-&gt;timer))</div><div class='add'>+				mod_timer(&amp;zwsm-&gt;timer,</div><div class='ctx'> 					  jiffies + ZSTD_BTRFS_RECLAIM_JIFFIES);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	set_bit(workspace-&gt;level - 1, &amp;wsm.active_map);</div><div class='del'>-	list_add(&amp;workspace-&gt;list, &amp;wsm.idle_ws[workspace-&gt;level - 1]);</div><div class='add'>+	set_bit(workspace-&gt;level, &amp;zwsm-&gt;active_map);</div><div class='add'>+	list_add(&amp;workspace-&gt;list, &amp;zwsm-&gt;idle_ws[workspace-&gt;level]);</div><div class='ctx'> 	workspace-&gt;req_level = 0;</div><div class='ctx'> </div><div class='del'>-	spin_unlock_bh(&amp;wsm.lock);</div><div class='add'>+	spin_unlock_bh(&amp;zwsm-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	if (workspace-&gt;level == ZSTD_BTRFS_MAX_LEVEL)</div><div class='del'>-		cond_wake_up(&amp;wsm.wait);</div><div class='add'>+	if (workspace-&gt;level == clip_level(ZSTD_BTRFS_MAX_LEVEL))</div><div class='add'>+		cond_wake_up(&amp;zwsm-&gt;wait);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void zstd_free_workspace(struct list_head *ws)</div><div class='hunk'>@@ -340,20 +368,22 @@ void zstd_free_workspace(struct list_head *ws)</div><div class='ctx'> 	kfree(workspace);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct list_head *zstd_alloc_workspace(unsigned int level)</div><div class='add'>+struct list_head *zstd_alloc_workspace(struct btrfs_fs_info *fs_info, int level)</div><div class='ctx'> {</div><div class='add'>+	const u32 blocksize = fs_info-&gt;sectorsize;</div><div class='ctx'> 	struct workspace *workspace;</div><div class='ctx'> </div><div class='ctx'> 	workspace = kzalloc(sizeof(*workspace), GFP_KERNEL);</div><div class='ctx'> 	if (!workspace)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='del'>-	workspace-&gt;size = zstd_ws_mem_sizes[level - 1];</div><div class='del'>-	workspace-&gt;level = level;</div><div class='add'>+	/* Use level 1 workspace size for all the fast mode negative levels. */</div><div class='add'>+	workspace-&gt;size = zstd_ws_mem_sizes[clip_level(level)];</div><div class='add'>+	workspace-&gt;level = clip_level(level);</div><div class='ctx'> 	workspace-&gt;req_level = level;</div><div class='ctx'> 	workspace-&gt;last_used = jiffies;</div><div class='del'>-	workspace-&gt;mem = kvmalloc(workspace-&gt;size, GFP_KERNEL);</div><div class='del'>-	workspace-&gt;buf = kmalloc(PAGE_SIZE, GFP_KERNEL);</div><div class='add'>+	workspace-&gt;mem = kvmalloc(workspace-&gt;size, GFP_KERNEL | __GFP_NOWARN);</div><div class='add'>+	workspace-&gt;buf = kmalloc(blocksize, GFP_KERNEL);</div><div class='ctx'> 	if (!workspace-&gt;mem || !workspace-&gt;buf)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> </div><div class='hunk'>@@ -366,69 +396,82 @@ fail:</div><div class='ctx'> 	return ERR_PTR(-ENOMEM);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int zstd_compress_pages(struct list_head *ws, struct address_space *mapping,</div><div class='del'>-		u64 start, struct page **pages, unsigned long *out_pages,</div><div class='del'>-		unsigned long *total_in, unsigned long *total_out)</div><div class='add'>+int zstd_compress_folios(struct list_head *ws, struct btrfs_inode *inode,</div><div class='add'>+			 u64 start, struct folio **folios, unsigned long *out_folios,</div><div class='add'>+			 unsigned long *total_in, unsigned long *total_out)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = inode-&gt;root-&gt;fs_info;</div><div class='ctx'> 	struct workspace *workspace = list_entry(ws, struct workspace, list);</div><div class='del'>-	ZSTD_CStream *stream;</div><div class='add'>+	struct address_space *mapping = inode-&gt;vfs_inode.i_mapping;</div><div class='add'>+	zstd_cstream *stream;</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	int nr_pages = 0;</div><div class='del'>-	struct page *in_page = NULL;  /* The current page to read */</div><div class='del'>-	struct page *out_page = NULL; /* The current page to write to */</div><div class='add'>+	int nr_folios = 0;</div><div class='add'>+	struct folio *in_folio = NULL;  /* The current folio to read. */</div><div class='add'>+	struct folio *out_folio = NULL; /* The current folio to write to. */</div><div class='ctx'> 	unsigned long tot_in = 0;</div><div class='ctx'> 	unsigned long tot_out = 0;</div><div class='ctx'> 	unsigned long len = *total_out;</div><div class='del'>-	const unsigned long nr_dest_pages = *out_pages;</div><div class='del'>-	unsigned long max_out = nr_dest_pages * PAGE_SIZE;</div><div class='del'>-	ZSTD_parameters params = zstd_get_btrfs_parameters(workspace-&gt;req_level,</div><div class='del'>-							   len);</div><div class='del'>-</div><div class='del'>-	*out_pages = 0;</div><div class='add'>+	const unsigned long nr_dest_folios = *out_folios;</div><div class='add'>+	const u64 orig_end = start + len;</div><div class='add'>+	const u32 blocksize = fs_info-&gt;sectorsize;</div><div class='add'>+	const u32 min_folio_size = btrfs_min_folio_size(fs_info);</div><div class='add'>+	unsigned long max_out = nr_dest_folios * min_folio_size;</div><div class='add'>+	unsigned int cur_len;</div><div class='add'>+</div><div class='add'>+	workspace-&gt;params = zstd_get_btrfs_parameters(workspace-&gt;req_level, len);</div><div class='add'>+	*out_folios = 0;</div><div class='ctx'> 	*total_out = 0;</div><div class='ctx'> 	*total_in = 0;</div><div class='ctx'> </div><div class='ctx'> 	/* Initialize the stream */</div><div class='del'>-	stream = ZSTD_initCStream(params, len, workspace-&gt;mem,</div><div class='add'>+	stream = zstd_init_cstream(&amp;workspace-&gt;params, len, workspace-&gt;mem,</div><div class='ctx'> 			workspace-&gt;size);</div><div class='del'>-	if (!stream) {</div><div class='del'>-		pr_warn("BTRFS: ZSTD_initCStream failed\n");</div><div class='add'>+	if (unlikely(!stream)) {</div><div class='add'>+		btrfs_err(fs_info,</div><div class='add'>+	"zstd compression init level %d failed, root %llu inode %llu offset %llu",</div><div class='add'>+			  workspace-&gt;req_level, btrfs_root_id(inode-&gt;root),</div><div class='add'>+			  btrfs_ino(inode), start);</div><div class='ctx'> 		ret = -EIO;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* map in the first page of input data */</div><div class='del'>-	in_page = find_get_page(mapping, start &gt;&gt; PAGE_SHIFT);</div><div class='del'>-	workspace-&gt;in_buf.src = kmap(in_page);</div><div class='add'>+	ret = btrfs_compress_filemap_get_folio(mapping, start, &amp;in_folio);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+	cur_len = btrfs_calc_input_length(in_folio, orig_end, start);</div><div class='add'>+	workspace-&gt;in_buf.src = kmap_local_folio(in_folio, offset_in_folio(in_folio, start));</div><div class='ctx'> 	workspace-&gt;in_buf.pos = 0;</div><div class='del'>-	workspace-&gt;in_buf.size = min_t(size_t, len, PAGE_SIZE);</div><div class='del'>-</div><div class='add'>+	workspace-&gt;in_buf.size = cur_len;</div><div class='ctx'> </div><div class='ctx'> 	/* Allocate and map in the output buffer */</div><div class='del'>-	out_page = alloc_page(GFP_NOFS);</div><div class='del'>-	if (out_page == NULL) {</div><div class='add'>+	out_folio = btrfs_alloc_compr_folio(fs_info);</div><div class='add'>+	if (out_folio == NULL) {</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	pages[nr_pages++] = out_page;</div><div class='del'>-	workspace-&gt;out_buf.dst = kmap(out_page);</div><div class='add'>+	folios[nr_folios++] = out_folio;</div><div class='add'>+	workspace-&gt;out_buf.dst = folio_address(out_folio);</div><div class='ctx'> 	workspace-&gt;out_buf.pos = 0;</div><div class='del'>-	workspace-&gt;out_buf.size = min_t(size_t, max_out, PAGE_SIZE);</div><div class='add'>+	workspace-&gt;out_buf.size = min_t(size_t, max_out, min_folio_size);</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		size_t ret2;</div><div class='ctx'> </div><div class='del'>-		ret2 = ZSTD_compressStream(stream, &amp;workspace-&gt;out_buf,</div><div class='add'>+		ret2 = zstd_compress_stream(stream, &amp;workspace-&gt;out_buf,</div><div class='ctx'> 				&amp;workspace-&gt;in_buf);</div><div class='del'>-		if (ZSTD_isError(ret2)) {</div><div class='del'>-			pr_debug("BTRFS: ZSTD_compressStream returned %d\n",</div><div class='del'>-					ZSTD_getErrorCode(ret2));</div><div class='add'>+		if (unlikely(zstd_is_error(ret2))) {</div><div class='add'>+			btrfs_warn(fs_info,</div><div class='add'>+"zstd compression level %d failed, error %d root %llu inode %llu offset %llu",</div><div class='add'>+				   workspace-&gt;req_level, zstd_get_error_code(ret2),</div><div class='add'>+				   btrfs_root_id(inode-&gt;root), btrfs_ino(inode),</div><div class='add'>+				   start);</div><div class='ctx'> 			ret = -EIO;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* Check to see if we are making it bigger */</div><div class='del'>-		if (tot_in + workspace-&gt;in_buf.pos &gt; 8192 &amp;&amp;</div><div class='add'>+		if (tot_in + workspace-&gt;in_buf.pos &gt; blocksize * 2 &amp;&amp;</div><div class='ctx'> 				tot_in + workspace-&gt;in_buf.pos &lt;</div><div class='ctx'> 				tot_out + workspace-&gt;out_buf.pos) {</div><div class='ctx'> 			ret = -E2BIG;</div><div class='hunk'>@@ -444,24 +487,21 @@ int zstd_compress_pages(struct list_head *ws, struct address_space *mapping,</div><div class='ctx'> </div><div class='ctx'> 		/* Check if we need more output space */</div><div class='ctx'> 		if (workspace-&gt;out_buf.pos == workspace-&gt;out_buf.size) {</div><div class='del'>-			tot_out += PAGE_SIZE;</div><div class='del'>-			max_out -= PAGE_SIZE;</div><div class='del'>-			kunmap(out_page);</div><div class='del'>-			if (nr_pages == nr_dest_pages) {</div><div class='del'>-				out_page = NULL;</div><div class='add'>+			tot_out += min_folio_size;</div><div class='add'>+			max_out -= min_folio_size;</div><div class='add'>+			if (nr_folios == nr_dest_folios) {</div><div class='ctx'> 				ret = -E2BIG;</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='del'>-			out_page = alloc_page(GFP_NOFS);</div><div class='del'>-			if (out_page == NULL) {</div><div class='add'>+			out_folio = btrfs_alloc_compr_folio(fs_info);</div><div class='add'>+			if (out_folio == NULL) {</div><div class='ctx'> 				ret = -ENOMEM;</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='del'>-			pages[nr_pages++] = out_page;</div><div class='del'>-			workspace-&gt;out_buf.dst = kmap(out_page);</div><div class='add'>+			folios[nr_folios++] = out_folio;</div><div class='add'>+			workspace-&gt;out_buf.dst = folio_address(out_folio);</div><div class='ctx'> 			workspace-&gt;out_buf.pos = 0;</div><div class='del'>-			workspace-&gt;out_buf.size = min_t(size_t, max_out,</div><div class='del'>-							PAGE_SIZE);</div><div class='add'>+			workspace-&gt;out_buf.size = min_t(size_t, max_out, min_folio_size);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* We've reached the end of the input */</div><div class='hunk'>@@ -472,25 +512,32 @@ int zstd_compress_pages(struct list_head *ws, struct address_space *mapping,</div><div class='ctx'> </div><div class='ctx'> 		/* Check if we need more input */</div><div class='ctx'> 		if (workspace-&gt;in_buf.pos == workspace-&gt;in_buf.size) {</div><div class='del'>-			tot_in += PAGE_SIZE;</div><div class='del'>-			kunmap(in_page);</div><div class='del'>-			put_page(in_page);</div><div class='del'>-</div><div class='del'>-			start += PAGE_SIZE;</div><div class='del'>-			len -= PAGE_SIZE;</div><div class='del'>-			in_page = find_get_page(mapping, start &gt;&gt; PAGE_SHIFT);</div><div class='del'>-			workspace-&gt;in_buf.src = kmap(in_page);</div><div class='add'>+			tot_in += workspace-&gt;in_buf.size;</div><div class='add'>+			kunmap_local(workspace-&gt;in_buf.src);</div><div class='add'>+			workspace-&gt;in_buf.src = NULL;</div><div class='add'>+			folio_put(in_folio);</div><div class='add'>+			start += cur_len;</div><div class='add'>+			len -= cur_len;</div><div class='add'>+			ret = btrfs_compress_filemap_get_folio(mapping, start, &amp;in_folio);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				goto out;</div><div class='add'>+			cur_len = btrfs_calc_input_length(in_folio, orig_end, start);</div><div class='add'>+			workspace-&gt;in_buf.src = kmap_local_folio(in_folio,</div><div class='add'>+							 offset_in_folio(in_folio, start));</div><div class='ctx'> 			workspace-&gt;in_buf.pos = 0;</div><div class='del'>-			workspace-&gt;in_buf.size = min_t(size_t, len, PAGE_SIZE);</div><div class='add'>+			workspace-&gt;in_buf.size = cur_len;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		size_t ret2;</div><div class='ctx'> </div><div class='del'>-		ret2 = ZSTD_endStream(stream, &amp;workspace-&gt;out_buf);</div><div class='del'>-		if (ZSTD_isError(ret2)) {</div><div class='del'>-			pr_debug("BTRFS: ZSTD_endStream returned %d\n",</div><div class='del'>-					ZSTD_getErrorCode(ret2));</div><div class='add'>+		ret2 = zstd_end_stream(stream, &amp;workspace-&gt;out_buf);</div><div class='add'>+		if (unlikely(zstd_is_error(ret2))) {</div><div class='add'>+			btrfs_err(fs_info,</div><div class='add'>+"zstd compression end level %d failed, error %d root %llu inode %llu offset %llu",</div><div class='add'>+				  workspace-&gt;req_level, zstd_get_error_code(ret2),</div><div class='add'>+				  btrfs_root_id(inode-&gt;root), btrfs_ino(inode),</div><div class='add'>+				  start);</div><div class='ctx'> 			ret = -EIO;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -504,23 +551,21 @@ int zstd_compress_pages(struct list_head *ws, struct address_space *mapping,</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		tot_out += PAGE_SIZE;</div><div class='del'>-		max_out -= PAGE_SIZE;</div><div class='del'>-		kunmap(out_page);</div><div class='del'>-		if (nr_pages == nr_dest_pages) {</div><div class='del'>-			out_page = NULL;</div><div class='add'>+		tot_out += min_folio_size;</div><div class='add'>+		max_out -= min_folio_size;</div><div class='add'>+		if (nr_folios == nr_dest_folios) {</div><div class='ctx'> 			ret = -E2BIG;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='del'>-		out_page = alloc_page(GFP_NOFS);</div><div class='del'>-		if (out_page == NULL) {</div><div class='add'>+		out_folio = btrfs_alloc_compr_folio(fs_info);</div><div class='add'>+		if (out_folio == NULL) {</div><div class='ctx'> 			ret = -ENOMEM;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='del'>-		pages[nr_pages++] = out_page;</div><div class='del'>-		workspace-&gt;out_buf.dst = kmap(out_page);</div><div class='add'>+		folios[nr_folios++] = out_folio;</div><div class='add'>+		workspace-&gt;out_buf.dst = folio_address(out_folio);</div><div class='ctx'> 		workspace-&gt;out_buf.pos = 0;</div><div class='del'>-		workspace-&gt;out_buf.size = min_t(size_t, max_out, PAGE_SIZE);</div><div class='add'>+		workspace-&gt;out_buf.size = min_t(size_t, max_out, min_folio_size);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (tot_out &gt;= tot_in) {</div><div class='hunk'>@@ -532,53 +577,61 @@ int zstd_compress_pages(struct list_head *ws, struct address_space *mapping,</div><div class='ctx'> 	*total_in = tot_in;</div><div class='ctx'> 	*total_out = tot_out;</div><div class='ctx'> out:</div><div class='del'>-	*out_pages = nr_pages;</div><div class='del'>-	/* Cleanup */</div><div class='del'>-	if (in_page) {</div><div class='del'>-		kunmap(in_page);</div><div class='del'>-		put_page(in_page);</div><div class='add'>+	*out_folios = nr_folios;</div><div class='add'>+	if (workspace-&gt;in_buf.src) {</div><div class='add'>+		kunmap_local(workspace-&gt;in_buf.src);</div><div class='add'>+		folio_put(in_folio);</div><div class='ctx'> 	}</div><div class='del'>-	if (out_page)</div><div class='del'>-		kunmap(out_page);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int zstd_decompress_bio(struct list_head *ws, struct compressed_bio *cb)</div><div class='ctx'> {</div><div class='add'>+	struct btrfs_fs_info *fs_info = cb_to_fs_info(cb);</div><div class='ctx'> 	struct workspace *workspace = list_entry(ws, struct workspace, list);</div><div class='del'>-	struct page **pages_in = cb-&gt;compressed_pages;</div><div class='add'>+	struct folio **folios_in = cb-&gt;compressed_folios;</div><div class='ctx'> 	size_t srclen = cb-&gt;compressed_len;</div><div class='del'>-	ZSTD_DStream *stream;</div><div class='add'>+	zstd_dstream *stream;</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	unsigned long page_in_index = 0;</div><div class='del'>-	unsigned long total_pages_in = DIV_ROUND_UP(srclen, PAGE_SIZE);</div><div class='add'>+	const u32 blocksize = fs_info-&gt;sectorsize;</div><div class='add'>+	const unsigned int min_folio_size = btrfs_min_folio_size(fs_info);</div><div class='add'>+	unsigned long folio_in_index = 0;</div><div class='add'>+	unsigned long total_folios_in = DIV_ROUND_UP(srclen, min_folio_size);</div><div class='ctx'> 	unsigned long buf_start;</div><div class='ctx'> 	unsigned long total_out = 0;</div><div class='ctx'> </div><div class='del'>-	stream = ZSTD_initDStream(</div><div class='add'>+	stream = zstd_init_dstream(</div><div class='ctx'> 			ZSTD_BTRFS_MAX_INPUT, workspace-&gt;mem, workspace-&gt;size);</div><div class='del'>-	if (!stream) {</div><div class='del'>-		pr_debug("BTRFS: ZSTD_initDStream failed\n");</div><div class='add'>+	if (unlikely(!stream)) {</div><div class='add'>+		struct btrfs_inode *inode = cb-&gt;bbio.inode;</div><div class='add'>+</div><div class='add'>+		btrfs_err(inode-&gt;root-&gt;fs_info,</div><div class='add'>+		"zstd decompression init failed, root %llu inode %llu offset %llu",</div><div class='add'>+			  btrfs_root_id(inode-&gt;root), btrfs_ino(inode), cb-&gt;start);</div><div class='ctx'> 		ret = -EIO;</div><div class='ctx'> 		goto done;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	workspace-&gt;in_buf.src = kmap(pages_in[page_in_index]);</div><div class='add'>+	workspace-&gt;in_buf.src = kmap_local_folio(folios_in[folio_in_index], 0);</div><div class='ctx'> 	workspace-&gt;in_buf.pos = 0;</div><div class='del'>-	workspace-&gt;in_buf.size = min_t(size_t, srclen, PAGE_SIZE);</div><div class='add'>+	workspace-&gt;in_buf.size = min_t(size_t, srclen, min_folio_size);</div><div class='ctx'> </div><div class='ctx'> 	workspace-&gt;out_buf.dst = workspace-&gt;buf;</div><div class='ctx'> 	workspace-&gt;out_buf.pos = 0;</div><div class='del'>-	workspace-&gt;out_buf.size = PAGE_SIZE;</div><div class='add'>+	workspace-&gt;out_buf.size = blocksize;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		size_t ret2;</div><div class='ctx'> </div><div class='del'>-		ret2 = ZSTD_decompressStream(stream, &amp;workspace-&gt;out_buf,</div><div class='add'>+		ret2 = zstd_decompress_stream(stream, &amp;workspace-&gt;out_buf,</div><div class='ctx'> 				&amp;workspace-&gt;in_buf);</div><div class='del'>-		if (ZSTD_isError(ret2)) {</div><div class='del'>-			pr_debug("BTRFS: ZSTD_decompressStream returned %d\n",</div><div class='del'>-					ZSTD_getErrorCode(ret2));</div><div class='add'>+		if (unlikely(zstd_is_error(ret2))) {</div><div class='add'>+			struct btrfs_inode *inode = cb-&gt;bbio.inode;</div><div class='add'>+</div><div class='add'>+			btrfs_err(inode-&gt;root-&gt;fs_info,</div><div class='add'>+		"zstd decompression failed, error %d root %llu inode %llu offset %llu",</div><div class='add'>+				  zstd_get_error_code(ret2), btrfs_root_id(inode-&gt;root),</div><div class='add'>+				  btrfs_ino(inode), cb-&gt;start);</div><div class='ctx'> 			ret = -EIO;</div><div class='ctx'> 			goto done;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -599,108 +652,86 @@ int zstd_decompress_bio(struct list_head *ws, struct compressed_bio *cb)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='ctx'> 		if (workspace-&gt;in_buf.pos == workspace-&gt;in_buf.size) {</div><div class='del'>-			kunmap(pages_in[page_in_index++]);</div><div class='del'>-			if (page_in_index &gt;= total_pages_in) {</div><div class='add'>+			kunmap_local(workspace-&gt;in_buf.src);</div><div class='add'>+			folio_in_index++;</div><div class='add'>+			if (unlikely(folio_in_index &gt;= total_folios_in)) {</div><div class='ctx'> 				workspace-&gt;in_buf.src = NULL;</div><div class='ctx'> 				ret = -EIO;</div><div class='ctx'> 				goto done;</div><div class='ctx'> 			}</div><div class='del'>-			srclen -= PAGE_SIZE;</div><div class='del'>-			workspace-&gt;in_buf.src = kmap(pages_in[page_in_index]);</div><div class='add'>+			srclen -= min_folio_size;</div><div class='add'>+			workspace-&gt;in_buf.src =</div><div class='add'>+				kmap_local_folio(folios_in[folio_in_index], 0);</div><div class='ctx'> 			workspace-&gt;in_buf.pos = 0;</div><div class='del'>-			workspace-&gt;in_buf.size = min_t(size_t, srclen, PAGE_SIZE);</div><div class='add'>+			workspace-&gt;in_buf.size = min_t(size_t, srclen, min_folio_size);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	ret = 0;</div><div class='del'>-	zero_fill_bio(cb-&gt;orig_bio);</div><div class='ctx'> done:</div><div class='ctx'> 	if (workspace-&gt;in_buf.src)</div><div class='del'>-		kunmap(pages_in[page_in_index]);</div><div class='add'>+		kunmap_local(workspace-&gt;in_buf.src);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int zstd_decompress(struct list_head *ws, unsigned char *data_in,</div><div class='del'>-		struct page *dest_page, unsigned long start_byte, size_t srclen,</div><div class='add'>+int zstd_decompress(struct list_head *ws, const u8 *data_in,</div><div class='add'>+		struct folio *dest_folio, unsigned long dest_pgoff, size_t srclen,</div><div class='ctx'> 		size_t destlen)</div><div class='ctx'> {</div><div class='ctx'> 	struct workspace *workspace = list_entry(ws, struct workspace, list);</div><div class='del'>-	ZSTD_DStream *stream;</div><div class='add'>+	struct btrfs_fs_info *fs_info = btrfs_sb(folio_inode(dest_folio)-&gt;i_sb);</div><div class='add'>+	const u32 sectorsize = fs_info-&gt;sectorsize;</div><div class='add'>+	zstd_dstream *stream;</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	size_t ret2;</div><div class='del'>-	unsigned long total_out = 0;</div><div class='del'>-	unsigned long pg_offset = 0;</div><div class='add'>+	unsigned long to_copy = 0;</div><div class='ctx'> </div><div class='del'>-	stream = ZSTD_initDStream(</div><div class='add'>+	stream = zstd_init_dstream(</div><div class='ctx'> 			ZSTD_BTRFS_MAX_INPUT, workspace-&gt;mem, workspace-&gt;size);</div><div class='del'>-	if (!stream) {</div><div class='del'>-		pr_warn("BTRFS: ZSTD_initDStream failed\n");</div><div class='add'>+	if (unlikely(!stream)) {</div><div class='add'>+		struct btrfs_inode *inode = folio_to_inode(dest_folio);</div><div class='add'>+</div><div class='add'>+		btrfs_err(inode-&gt;root-&gt;fs_info,</div><div class='add'>+		"zstd decompression init failed, root %llu inode %llu offset %llu",</div><div class='add'>+			  btrfs_root_id(inode-&gt;root), btrfs_ino(inode),</div><div class='add'>+			  folio_pos(dest_folio));</div><div class='ctx'> 		ret = -EIO;</div><div class='ctx'> 		goto finish;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	destlen = min_t(size_t, destlen, PAGE_SIZE);</div><div class='del'>-</div><div class='ctx'> 	workspace-&gt;in_buf.src = data_in;</div><div class='ctx'> 	workspace-&gt;in_buf.pos = 0;</div><div class='ctx'> 	workspace-&gt;in_buf.size = srclen;</div><div class='ctx'> </div><div class='ctx'> 	workspace-&gt;out_buf.dst = workspace-&gt;buf;</div><div class='ctx'> 	workspace-&gt;out_buf.pos = 0;</div><div class='del'>-	workspace-&gt;out_buf.size = PAGE_SIZE;</div><div class='del'>-</div><div class='del'>-	ret2 = 1;</div><div class='del'>-	while (pg_offset &lt; destlen</div><div class='del'>-	       &amp;&amp; workspace-&gt;in_buf.pos &lt; workspace-&gt;in_buf.size) {</div><div class='del'>-		unsigned long buf_start;</div><div class='del'>-		unsigned long buf_offset;</div><div class='del'>-		unsigned long bytes;</div><div class='del'>-</div><div class='del'>-		/* Check if the frame is over and we still need more input */</div><div class='del'>-		if (ret2 == 0) {</div><div class='del'>-			pr_debug("BTRFS: ZSTD_decompressStream ended early\n");</div><div class='del'>-			ret = -EIO;</div><div class='del'>-			goto finish;</div><div class='del'>-		}</div><div class='del'>-		ret2 = ZSTD_decompressStream(stream, &amp;workspace-&gt;out_buf,</div><div class='del'>-				&amp;workspace-&gt;in_buf);</div><div class='del'>-		if (ZSTD_isError(ret2)) {</div><div class='del'>-			pr_debug("BTRFS: ZSTD_decompressStream returned %d\n",</div><div class='del'>-					ZSTD_getErrorCode(ret2));</div><div class='del'>-			ret = -EIO;</div><div class='del'>-			goto finish;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		buf_start = total_out;</div><div class='del'>-		total_out += workspace-&gt;out_buf.pos;</div><div class='del'>-		workspace-&gt;out_buf.pos = 0;</div><div class='del'>-</div><div class='del'>-		if (total_out &lt;= start_byte)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		if (total_out &gt; start_byte &amp;&amp; buf_start &lt; start_byte)</div><div class='del'>-			buf_offset = start_byte - buf_start;</div><div class='del'>-		else</div><div class='del'>-			buf_offset = 0;</div><div class='del'>-</div><div class='del'>-		bytes = min_t(unsigned long, destlen - pg_offset,</div><div class='del'>-				workspace-&gt;out_buf.size - buf_offset);</div><div class='del'>-</div><div class='del'>-		memcpy_to_page(dest_page, pg_offset,</div><div class='del'>-			       workspace-&gt;out_buf.dst + buf_offset, bytes);</div><div class='del'>-</div><div class='del'>-		pg_offset += bytes;</div><div class='add'>+	workspace-&gt;out_buf.size = sectorsize;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Since both input and output buffers should not exceed one sector,</div><div class='add'>+	 * one call should end the decompression.</div><div class='add'>+	 */</div><div class='add'>+	ret = zstd_decompress_stream(stream, &amp;workspace-&gt;out_buf, &amp;workspace-&gt;in_buf);</div><div class='add'>+	if (unlikely(zstd_is_error(ret))) {</div><div class='add'>+		struct btrfs_inode *inode = folio_to_inode(dest_folio);</div><div class='add'>+</div><div class='add'>+		btrfs_err(inode-&gt;root-&gt;fs_info,</div><div class='add'>+		"zstd decompression failed, error %d root %llu inode %llu offset %llu",</div><div class='add'>+			  zstd_get_error_code(ret), btrfs_root_id(inode-&gt;root),</div><div class='add'>+			  btrfs_ino(inode), folio_pos(dest_folio));</div><div class='add'>+		goto finish;</div><div class='ctx'> 	}</div><div class='del'>-	ret = 0;</div><div class='add'>+	to_copy = workspace-&gt;out_buf.pos;</div><div class='add'>+	memcpy_to_folio(dest_folio, dest_pgoff, workspace-&gt;out_buf.dst, to_copy);</div><div class='ctx'> finish:</div><div class='del'>-	if (pg_offset &lt; destlen) {</div><div class='del'>-		memzero_page(dest_page, pg_offset, destlen - pg_offset);</div><div class='add'>+	/* Error or early end. */</div><div class='add'>+	if (unlikely(to_copy &lt; destlen)) {</div><div class='add'>+		ret = -EIO;</div><div class='add'>+		folio_zero_range(dest_folio, dest_pgoff + to_copy, destlen - to_copy);</div><div class='ctx'> 	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-const struct btrfs_compress_op btrfs_zstd_compress = {</div><div class='del'>-	/* ZSTD uses own workspace manager */</div><div class='del'>-	.workspace_manager = NULL,</div><div class='add'>+const struct btrfs_compress_levels btrfs_zstd_compress = {</div><div class='add'>+	.min_level	= ZSTD_BTRFS_MIN_LEVEL,</div><div class='ctx'> 	.max_level	= ZSTD_BTRFS_MAX_LEVEL,</div><div class='ctx'> 	.default_level	= ZSTD_BTRFS_DEFAULT_LEVEL,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/buffer.c b/fs/buffer.c<br/>index 46bc589b7a03..838c0c571022 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/buffer.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/buffer.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/buffer.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/buffer.c</a></div><div class='hunk'>@@ -48,19 +48,21 @@</div><div class='ctx'> #include &lt;linux/sched/mm.h&gt;</div><div class='ctx'> #include &lt;trace/events/block.h&gt;</div><div class='ctx'> #include &lt;linux/fscrypt.h&gt;</div><div class='add'>+#include &lt;linux/fsverity.h&gt;</div><div class='add'>+#include &lt;linux/sched/isolation.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "internal.h"</div><div class='ctx'> </div><div class='ctx'> static int fsync_buffers_list(spinlock_t *lock, struct list_head *list);</div><div class='del'>-static int submit_bh_wbc(int op, int op_flags, struct buffer_head *bh,</div><div class='del'>-			 enum rw_hint hint, struct writeback_control *wbc);</div><div class='add'>+static void submit_bh_wbc(blk_opf_t opf, struct buffer_head *bh,</div><div class='add'>+			  enum rw_hint hint, struct writeback_control *wbc);</div><div class='ctx'> </div><div class='ctx'> #define BH_ENTRY(list) list_entry((list), struct buffer_head, b_assoc_buffers)</div><div class='ctx'> </div><div class='ctx'> inline void touch_buffer(struct buffer_head *bh)</div><div class='ctx'> {</div><div class='ctx'> 	trace_block_touch_buffer(bh);</div><div class='del'>-	mark_page_accessed(bh-&gt;b_page);</div><div class='add'>+	folio_mark_accessed(bh-&gt;b_folio);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(touch_buffer);</div><div class='ctx'> </div><div class='hunk'>@@ -79,26 +81,26 @@ void unlock_buffer(struct buffer_head *bh)</div><div class='ctx'> EXPORT_SYMBOL(unlock_buffer);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Returns if the page has dirty or writeback buffers. If all the buffers</div><div class='del'>- * are unlocked and clean then the PageDirty information is stale. If</div><div class='del'>- * any of the pages are locked, it is assumed they are locked for IO.</div><div class='add'>+ * Returns if the folio has dirty or writeback buffers. If all the buffers</div><div class='add'>+ * are unlocked and clean then the folio_test_dirty information is stale. If</div><div class='add'>+ * any of the buffers are locked, it is assumed they are locked for IO.</div><div class='ctx'>  */</div><div class='del'>-void buffer_check_dirty_writeback(struct page *page,</div><div class='add'>+void buffer_check_dirty_writeback(struct folio *folio,</div><div class='ctx'> 				     bool *dirty, bool *writeback)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *head, *bh;</div><div class='ctx'> 	*dirty = false;</div><div class='ctx'> 	*writeback = false;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(!PageLocked(page));</div><div class='add'>+	BUG_ON(!folio_test_locked(folio));</div><div class='ctx'> </div><div class='del'>-	if (!page_has_buffers(page))</div><div class='add'>+	head = folio_buffers(folio);</div><div class='add'>+	if (!head)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	if (PageWriteback(page))</div><div class='add'>+	if (folio_test_writeback(folio))</div><div class='ctx'> 		*writeback = true;</div><div class='ctx'> </div><div class='del'>-	head = page_buffers(page);</div><div class='ctx'> 	bh = head;</div><div class='ctx'> 	do {</div><div class='ctx'> 		if (buffer_locked(bh))</div><div class='hunk'>@@ -110,7 +112,6 @@ void buffer_check_dirty_writeback(struct page *page,</div><div class='ctx'> 		bh = bh-&gt;b_this_page;</div><div class='ctx'> 	} while (bh != head);</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(buffer_check_dirty_writeback);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Block until a buffer comes unlocked.  This doesn't stop it</div><div class='hunk'>@@ -152,12 +153,12 @@ static void __end_buffer_read_notouch(struct buffer_head *bh, int uptodate)</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Default synchronous end-of-IO handler..  Just mark it up-to-date and</div><div class='del'>- * unlock the buffer. This is what ll_rw_block uses too.</div><div class='add'>+ * unlock the buffer.</div><div class='ctx'>  */</div><div class='ctx'> void end_buffer_read_sync(struct buffer_head *bh, int uptodate)</div><div class='ctx'> {</div><div class='del'>-	__end_buffer_read_notouch(bh, uptodate);</div><div class='ctx'> 	put_bh(bh);</div><div class='add'>+	__end_buffer_read_notouch(bh, uptodate);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(end_buffer_read_sync);</div><div class='ctx'> </div><div class='hunk'>@@ -175,38 +176,46 @@ void end_buffer_write_sync(struct buffer_head *bh, int uptodate)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(end_buffer_write_sync);</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Various filesystems appear to want __find_get_block to be non-blocking.</div><div class='del'>- * But it's the page lock which protects the buffers.  To get around this,</div><div class='del'>- * we get exclusion from try_to_free_buffers with the blockdev mapping's</div><div class='del'>- * private_lock.</div><div class='del'>- *</div><div class='del'>- * Hack idea: for the blockdev mapping, private_lock contention</div><div class='del'>- * may be quite high.  This code could TryLock the page, and if that</div><div class='del'>- * succeeds, there is no need to take private_lock.</div><div class='del'>- */</div><div class='ctx'> static struct buffer_head *</div><div class='del'>-__find_get_block_slow(struct block_device *bdev, sector_t block)</div><div class='add'>+__find_get_block_slow(struct block_device *bdev, sector_t block, bool atomic)</div><div class='ctx'> {</div><div class='del'>-	struct inode *bd_inode = bdev-&gt;bd_inode;</div><div class='del'>-	struct address_space *bd_mapping = bd_inode-&gt;i_mapping;</div><div class='add'>+	struct address_space *bd_mapping = bdev-&gt;bd_mapping;</div><div class='add'>+	const int blkbits = bd_mapping-&gt;host-&gt;i_blkbits;</div><div class='ctx'> 	struct buffer_head *ret = NULL;</div><div class='ctx'> 	pgoff_t index;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> 	struct buffer_head *head;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	int all_mapped = 1;</div><div class='ctx'> 	static DEFINE_RATELIMIT_STATE(last_warned, HZ, 1);</div><div class='ctx'> </div><div class='del'>-	index = block &gt;&gt; (PAGE_SHIFT - bd_inode-&gt;i_blkbits);</div><div class='del'>-	page = find_get_page_flags(bd_mapping, index, FGP_ACCESSED);</div><div class='del'>-	if (!page)</div><div class='add'>+	index = ((loff_t)block &lt;&lt; blkbits) / PAGE_SIZE;</div><div class='add'>+	folio = __filemap_get_folio(bd_mapping, index, FGP_ACCESSED, 0);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;bd_mapping-&gt;private_lock);</div><div class='del'>-	if (!page_has_buffers(page))</div><div class='add'>+	/*</div><div class='add'>+	 * Folio lock protects the buffers. Callers that cannot block</div><div class='add'>+	 * will fallback to serializing vs try_to_free_buffers() via</div><div class='add'>+	 * the i_private_lock.</div><div class='add'>+	 */</div><div class='add'>+	if (atomic)</div><div class='add'>+		spin_lock(&amp;bd_mapping-&gt;i_private_lock);</div><div class='add'>+	else</div><div class='add'>+		folio_lock(folio);</div><div class='add'>+</div><div class='add'>+	head = folio_buffers(folio);</div><div class='add'>+	if (!head)</div><div class='ctx'> 		goto out_unlock;</div><div class='del'>-	head = page_buffers(page);</div><div class='add'>+	/*</div><div class='add'>+	 * Upon a noref migration, the folio lock serializes here;</div><div class='add'>+	 * otherwise bail.</div><div class='add'>+	 */</div><div class='add'>+	if (test_bit_acquire(BH_Migrate, &amp;head-&gt;b_state)) {</div><div class='add'>+		WARN_ON(!atomic);</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	bh = head;</div><div class='ctx'> 	do {</div><div class='ctx'> 		if (!buffer_mapped(bh))</div><div class='hunk'>@@ -232,11 +241,14 @@ __find_get_block_slow(struct block_device *bdev, sector_t block)</div><div class='ctx'> 		       (unsigned long long)block,</div><div class='ctx'> 		       (unsigned long long)bh-&gt;b_blocknr,</div><div class='ctx'> 		       bh-&gt;b_state, bh-&gt;b_size, bdev,</div><div class='del'>-		       1 &lt;&lt; bd_inode-&gt;i_blkbits);</div><div class='add'>+		       1 &lt;&lt; blkbits);</div><div class='ctx'> 	}</div><div class='ctx'> out_unlock:</div><div class='del'>-	spin_unlock(&amp;bd_mapping-&gt;private_lock);</div><div class='del'>-	put_page(page);</div><div class='add'>+	if (atomic)</div><div class='add'>+		spin_unlock(&amp;bd_mapping-&gt;i_private_lock);</div><div class='add'>+	else</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -246,18 +258,17 @@ static void end_buffer_async_read(struct buffer_head *bh, int uptodate)</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> 	struct buffer_head *first;</div><div class='ctx'> 	struct buffer_head *tmp;</div><div class='del'>-	struct page *page;</div><div class='del'>-	int page_uptodate = 1;</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	int folio_uptodate = 1;</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(!buffer_async_read(bh));</div><div class='ctx'> </div><div class='del'>-	page = bh-&gt;b_page;</div><div class='add'>+	folio = bh-&gt;b_folio;</div><div class='ctx'> 	if (uptodate) {</div><div class='ctx'> 		set_buffer_uptodate(bh);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		clear_buffer_uptodate(bh);</div><div class='ctx'> 		buffer_io_error(bh, ", async page read");</div><div class='del'>-		SetPageError(page);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -265,14 +276,14 @@ static void end_buffer_async_read(struct buffer_head *bh, int uptodate)</div><div class='ctx'> 	 * two buffer heads end IO at almost the same time and both</div><div class='ctx'> 	 * decide that the page is now completely done.</div><div class='ctx'> 	 */</div><div class='del'>-	first = page_buffers(page);</div><div class='add'>+	first = folio_buffers(folio);</div><div class='ctx'> 	spin_lock_irqsave(&amp;first-&gt;b_uptodate_lock, flags);</div><div class='ctx'> 	clear_buffer_async_read(bh);</div><div class='ctx'> 	unlock_buffer(bh);</div><div class='ctx'> 	tmp = bh;</div><div class='ctx'> 	do {</div><div class='ctx'> 		if (!buffer_uptodate(tmp))</div><div class='del'>-			page_uptodate = 0;</div><div class='add'>+			folio_uptodate = 0;</div><div class='ctx'> 		if (buffer_async_read(tmp)) {</div><div class='ctx'> 			BUG_ON(!buffer_locked(tmp));</div><div class='ctx'> 			goto still_busy;</div><div class='hunk'>@@ -281,53 +292,87 @@ static void end_buffer_async_read(struct buffer_head *bh, int uptodate)</div><div class='ctx'> 	} while (tmp != bh);</div><div class='ctx'> 	spin_unlock_irqrestore(&amp;first-&gt;b_uptodate_lock, flags);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * If none of the buffers had errors and they are all</div><div class='del'>-	 * uptodate then we can set the page uptodate.</div><div class='del'>-	 */</div><div class='del'>-	if (page_uptodate &amp;&amp; !PageError(page))</div><div class='del'>-		SetPageUptodate(page);</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	folio_end_read(folio, folio_uptodate);</div><div class='ctx'> 	return;</div><div class='ctx'> </div><div class='ctx'> still_busy:</div><div class='ctx'> 	spin_unlock_irqrestore(&amp;first-&gt;b_uptodate_lock, flags);</div><div class='del'>-	return;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct decrypt_bh_ctx {</div><div class='add'>+struct postprocess_bh_ctx {</div><div class='ctx'> 	struct work_struct work;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+static void verify_bh(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct postprocess_bh_ctx *ctx =</div><div class='add'>+		container_of(work, struct postprocess_bh_ctx, work);</div><div class='add'>+	struct buffer_head *bh = ctx-&gt;bh;</div><div class='add'>+	bool valid;</div><div class='add'>+</div><div class='add'>+	valid = fsverity_verify_blocks(bh-&gt;b_folio, bh-&gt;b_size, bh_offset(bh));</div><div class='add'>+	end_buffer_async_read(bh, valid);</div><div class='add'>+	kfree(ctx);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool need_fsverity(struct buffer_head *bh)</div><div class='add'>+{</div><div class='add'>+	struct folio *folio = bh-&gt;b_folio;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+</div><div class='add'>+	return fsverity_active(inode) &amp;&amp;</div><div class='add'>+		/* needed by ext4 */</div><div class='add'>+		folio-&gt;index &lt; DIV_ROUND_UP(inode-&gt;i_size, PAGE_SIZE);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void decrypt_bh(struct work_struct *work)</div><div class='ctx'> {</div><div class='del'>-	struct decrypt_bh_ctx *ctx =</div><div class='del'>-		container_of(work, struct decrypt_bh_ctx, work);</div><div class='add'>+	struct postprocess_bh_ctx *ctx =</div><div class='add'>+		container_of(work, struct postprocess_bh_ctx, work);</div><div class='ctx'> 	struct buffer_head *bh = ctx-&gt;bh;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	err = fscrypt_decrypt_pagecache_blocks(bh-&gt;b_page, bh-&gt;b_size,</div><div class='add'>+	err = fscrypt_decrypt_pagecache_blocks(bh-&gt;b_folio, bh-&gt;b_size,</div><div class='ctx'> 					       bh_offset(bh));</div><div class='add'>+	if (err == 0 &amp;&amp; need_fsverity(bh)) {</div><div class='add'>+		/*</div><div class='add'>+		 * We use different work queues for decryption and for verity</div><div class='add'>+		 * because verity may require reading metadata pages that need</div><div class='add'>+		 * decryption, and we shouldn't recurse to the same workqueue.</div><div class='add'>+		 */</div><div class='add'>+		INIT_WORK(&amp;ctx-&gt;work, verify_bh);</div><div class='add'>+		fsverity_enqueue_verify_work(&amp;ctx-&gt;work);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='ctx'> 	end_buffer_async_read(bh, err == 0);</div><div class='ctx'> 	kfree(ctx);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * I/O completion handler for block_read_full_page() - pages</div><div class='add'>+ * I/O completion handler for block_read_full_folio() - pages</div><div class='ctx'>  * which come unlocked at the end of I/O.</div><div class='ctx'>  */</div><div class='ctx'> static void end_buffer_async_read_io(struct buffer_head *bh, int uptodate)</div><div class='ctx'> {</div><div class='del'>-	/* Decrypt if needed */</div><div class='del'>-	if (uptodate &amp;&amp;</div><div class='del'>-	    fscrypt_inode_uses_fs_layer_crypto(bh-&gt;b_page-&gt;mapping-&gt;host)) {</div><div class='del'>-		struct decrypt_bh_ctx *ctx = kmalloc(sizeof(*ctx), GFP_ATOMIC);</div><div class='add'>+	struct inode *inode = bh-&gt;b_folio-&gt;mapping-&gt;host;</div><div class='add'>+	bool decrypt = fscrypt_inode_uses_fs_layer_crypto(inode);</div><div class='add'>+	bool verify = need_fsverity(bh);</div><div class='add'>+</div><div class='add'>+	/* Decrypt (with fscrypt) and/or verify (with fsverity) if needed. */</div><div class='add'>+	if (uptodate &amp;&amp; (decrypt || verify)) {</div><div class='add'>+		struct postprocess_bh_ctx *ctx =</div><div class='add'>+			kmalloc(sizeof(*ctx), GFP_ATOMIC);</div><div class='ctx'> </div><div class='ctx'> 		if (ctx) {</div><div class='del'>-			INIT_WORK(&amp;ctx-&gt;work, decrypt_bh);</div><div class='ctx'> 			ctx-&gt;bh = bh;</div><div class='del'>-			fscrypt_enqueue_decrypt_work(&amp;ctx-&gt;work);</div><div class='add'>+			if (decrypt) {</div><div class='add'>+				INIT_WORK(&amp;ctx-&gt;work, decrypt_bh);</div><div class='add'>+				fscrypt_enqueue_decrypt_work(&amp;ctx-&gt;work);</div><div class='add'>+			} else {</div><div class='add'>+				INIT_WORK(&amp;ctx-&gt;work, verify_bh);</div><div class='add'>+				fsverity_enqueue_verify_work(&amp;ctx-&gt;work);</div><div class='add'>+			}</div><div class='ctx'> 			return;</div><div class='ctx'> 		}</div><div class='ctx'> 		uptodate = 0;</div><div class='hunk'>@@ -336,29 +381,28 @@ static void end_buffer_async_read_io(struct buffer_head *bh, int uptodate)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Completion handler for block_write_full_page() - pages which are unlocked</div><div class='del'>- * during I/O, and which have PageWriteback cleared upon I/O completion.</div><div class='add'>+ * Completion handler for block_write_full_folio() - folios which are unlocked</div><div class='add'>+ * during I/O, and which have the writeback flag cleared upon I/O completion.</div><div class='ctx'>  */</div><div class='del'>-void end_buffer_async_write(struct buffer_head *bh, int uptodate)</div><div class='add'>+static void end_buffer_async_write(struct buffer_head *bh, int uptodate)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> 	struct buffer_head *first;</div><div class='ctx'> 	struct buffer_head *tmp;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(!buffer_async_write(bh));</div><div class='ctx'> </div><div class='del'>-	page = bh-&gt;b_page;</div><div class='add'>+	folio = bh-&gt;b_folio;</div><div class='ctx'> 	if (uptodate) {</div><div class='ctx'> 		set_buffer_uptodate(bh);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		buffer_io_error(bh, ", lost async page write");</div><div class='ctx'> 		mark_buffer_write_io_error(bh);</div><div class='ctx'> 		clear_buffer_uptodate(bh);</div><div class='del'>-		SetPageError(page);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	first = page_buffers(page);</div><div class='add'>+	first = folio_buffers(folio);</div><div class='ctx'> 	spin_lock_irqsave(&amp;first-&gt;b_uptodate_lock, flags);</div><div class='ctx'> </div><div class='ctx'> 	clear_buffer_async_write(bh);</div><div class='hunk'>@@ -372,14 +416,12 @@ void end_buffer_async_write(struct buffer_head *bh, int uptodate)</div><div class='ctx'> 		tmp = tmp-&gt;b_this_page;</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock_irqrestore(&amp;first-&gt;b_uptodate_lock, flags);</div><div class='del'>-	end_page_writeback(page);</div><div class='add'>+	folio_end_writeback(folio);</div><div class='ctx'> 	return;</div><div class='ctx'> </div><div class='ctx'> still_busy:</div><div class='ctx'> 	spin_unlock_irqrestore(&amp;first-&gt;b_uptodate_lock, flags);</div><div class='del'>-	return;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(end_buffer_async_write);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * If a page's buffers are under async readin (end_buffer_async_read</div><div class='hunk'>@@ -429,27 +471,27 @@ EXPORT_SYMBOL(mark_buffer_async_write);</div><div class='ctx'>  * a successful fsync().  For example, ext2 indirect blocks need to be</div><div class='ctx'>  * written back and waited upon before fsync() returns.</div><div class='ctx'>  *</div><div class='del'>- * The functions mark_buffer_inode_dirty(), fsync_inode_buffers(),</div><div class='add'>+ * The functions mark_buffer_dirty_inode(), fsync_inode_buffers(),</div><div class='ctx'>  * inode_has_buffers() and invalidate_inode_buffers() are provided for the</div><div class='del'>- * management of a list of dependent buffers at -&gt;i_mapping-&gt;private_list.</div><div class='add'>+ * management of a list of dependent buffers at -&gt;i_mapping-&gt;i_private_list.</div><div class='ctx'>  *</div><div class='ctx'>  * Locking is a little subtle: try_to_free_buffers() will remove buffers</div><div class='ctx'>  * from their controlling inode's queue when they are being freed.  But</div><div class='ctx'>  * try_to_free_buffers() will be operating against the *blockdev* mapping</div><div class='ctx'>  * at the time, not against the S_ISREG file which depends on those buffers.</div><div class='del'>- * So the locking for private_list is via the private_lock in the address_space</div><div class='add'>+ * So the locking for i_private_list is via the i_private_lock in the address_space</div><div class='ctx'>  * which backs the buffers.  Which is different from the address_space </div><div class='ctx'>  * against which the buffers are listed.  So for a particular address_space,</div><div class='del'>- * mapping-&gt;private_lock does *not* protect mapping-&gt;private_list!  In fact,</div><div class='del'>- * mapping-&gt;private_list will always be protected by the backing blockdev's</div><div class='del'>- * -&gt;private_lock.</div><div class='add'>+ * mapping-&gt;i_private_lock does *not* protect mapping-&gt;i_private_list!  In fact,</div><div class='add'>+ * mapping-&gt;i_private_list will always be protected by the backing blockdev's</div><div class='add'>+ * -&gt;i_private_lock.</div><div class='ctx'>  *</div><div class='ctx'>  * Which introduces a requirement: all buffers on an address_space's</div><div class='del'>- * -&gt;private_list must be from the same address_space: the blockdev's.</div><div class='add'>+ * -&gt;i_private_list must be from the same address_space: the blockdev's.</div><div class='ctx'>  *</div><div class='del'>- * address_spaces which do not place buffers at -&gt;private_list via these</div><div class='del'>- * utility functions are free to use private_lock and private_list for</div><div class='del'>- * whatever they want.  The only requirement is that list_empty(private_list)</div><div class='add'>+ * address_spaces which do not place buffers at -&gt;i_private_list via these</div><div class='add'>+ * utility functions are free to use i_private_lock and i_private_list for</div><div class='add'>+ * whatever they want.  The only requirement is that list_empty(i_private_list)</div><div class='ctx'>  * be true at clear_inode() time.</div><div class='ctx'>  *</div><div class='ctx'>  * FIXME: clear_inode should not call invalidate_inode_buffers().  The</div><div class='hunk'>@@ -472,7 +514,7 @@ EXPORT_SYMBOL(mark_buffer_async_write);</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * The buffer's backing address_space's private_lock must be held</div><div class='add'>+ * The buffer's backing address_space's i_private_lock must be held</div><div class='ctx'>  */</div><div class='ctx'> static void __remove_assoc_queue(struct buffer_head *bh)</div><div class='ctx'> {</div><div class='hunk'>@@ -483,7 +525,7 @@ static void __remove_assoc_queue(struct buffer_head *bh)</div><div class='ctx'> </div><div class='ctx'> int inode_has_buffers(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	return !list_empty(&amp;inode-&gt;i_data.private_list);</div><div class='add'>+	return !list_empty(&amp;inode-&gt;i_data.i_private_list);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -491,8 +533,8 @@ int inode_has_buffers(struct inode *inode)</div><div class='ctx'>  * all already-submitted IO to complete, but does not queue any new</div><div class='ctx'>  * writes to the disk.</div><div class='ctx'>  *</div><div class='del'>- * To do O_SYNC writes, just queue the buffer writes with ll_rw_block as</div><div class='del'>- * you dirty the buffers, and then use osync_inode_buffers to wait for</div><div class='add'>+ * To do O_SYNC writes, just queue the buffer writes with write_dirty_buffer</div><div class='add'>+ * as you dirty the buffers, and then use osync_inode_buffers to wait for</div><div class='ctx'>  * completion.  Any other dirty buffers which are not yet queued for</div><div class='ctx'>  * write will not be flushed to disk by the osync.</div><div class='ctx'>  */</div><div class='hunk'>@@ -521,17 +563,11 @@ repeat:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void emergency_thaw_bdev(struct super_block *sb)</div><div class='del'>-{</div><div class='del'>-	while (sb-&gt;s_bdev &amp;&amp; !thaw_bdev(sb-&gt;s_bdev))</div><div class='del'>-		printk(KERN_WARNING "Emergency Thaw on %pg\n", sb-&gt;s_bdev);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /**</div><div class='ctx'>  * sync_mapping_buffers - write out &amp; wait upon a mapping's "associated" buffers</div><div class='ctx'>  * @mapping: the mapping which wants those buffers written</div><div class='ctx'>  *</div><div class='del'>- * Starts I/O against the buffers at mapping-&gt;private_list, and waits upon</div><div class='add'>+ * Starts I/O against the buffers at mapping-&gt;i_private_list, and waits upon</div><div class='ctx'>  * that I/O.</div><div class='ctx'>  *</div><div class='ctx'>  * Basically, this is a convenience function for fsync().</div><div class='hunk'>@@ -540,16 +576,86 @@ void emergency_thaw_bdev(struct super_block *sb)</div><div class='ctx'>  */</div><div class='ctx'> int sync_mapping_buffers(struct address_space *mapping)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *buffer_mapping = mapping-&gt;private_data;</div><div class='add'>+	struct address_space *buffer_mapping = mapping-&gt;i_private_data;</div><div class='ctx'> </div><div class='del'>-	if (buffer_mapping == NULL || list_empty(&amp;mapping-&gt;private_list))</div><div class='add'>+	if (buffer_mapping == NULL || list_empty(&amp;mapping-&gt;i_private_list))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	return fsync_buffers_list(&amp;buffer_mapping-&gt;private_lock,</div><div class='del'>-					&amp;mapping-&gt;private_list);</div><div class='add'>+	return fsync_buffers_list(&amp;buffer_mapping-&gt;i_private_lock,</div><div class='add'>+					&amp;mapping-&gt;i_private_list);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(sync_mapping_buffers);</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * generic_buffers_fsync_noflush - generic buffer fsync implementation</div><div class='add'>+ * for simple filesystems with no inode lock</div><div class='add'>+ *</div><div class='add'>+ * @file:	file to synchronize</div><div class='add'>+ * @start:	start offset in bytes</div><div class='add'>+ * @end:	end offset in bytes (inclusive)</div><div class='add'>+ * @datasync:	only synchronize essential metadata if true</div><div class='add'>+ *</div><div class='add'>+ * This is a generic implementation of the fsync method for simple</div><div class='add'>+ * filesystems which track all non-inode metadata in the buffers list</div><div class='add'>+ * hanging off the address_space structure.</div><div class='add'>+ */</div><div class='add'>+int generic_buffers_fsync_noflush(struct file *file, loff_t start, loff_t end,</div><div class='add'>+				  bool datasync)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file-&gt;f_mapping-&gt;host;</div><div class='add'>+	int err;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	err = file_write_and_wait_range(file, start, end);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	ret = sync_mapping_buffers(inode-&gt;i_mapping);</div><div class='add'>+	if (!(inode_state_read_once(inode) &amp; I_DIRTY_ALL))</div><div class='add'>+		goto out;</div><div class='add'>+	if (datasync &amp;&amp; !(inode_state_read_once(inode) &amp; I_DIRTY_DATASYNC))</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	err = sync_inode_metadata(inode, 1);</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		ret = err;</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	/* check and advance again to catch errors after syncing out buffers */</div><div class='add'>+	err = file_check_and_advance_wb_err(file);</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		ret = err;</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(generic_buffers_fsync_noflush);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * generic_buffers_fsync - generic buffer fsync implementation</div><div class='add'>+ * for simple filesystems with no inode lock</div><div class='add'>+ *</div><div class='add'>+ * @file:	file to synchronize</div><div class='add'>+ * @start:	start offset in bytes</div><div class='add'>+ * @end:	end offset in bytes (inclusive)</div><div class='add'>+ * @datasync:	only synchronize essential metadata if true</div><div class='add'>+ *</div><div class='add'>+ * This is a generic implementation of the fsync method for simple</div><div class='add'>+ * filesystems which track all non-inode metadata in the buffers list</div><div class='add'>+ * hanging off the address_space structure. This also makes sure that</div><div class='add'>+ * a device cache flush operation is called at the end.</div><div class='add'>+ */</div><div class='add'>+int generic_buffers_fsync(struct file *file, loff_t start, loff_t end,</div><div class='add'>+			  bool datasync)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file-&gt;f_mapping-&gt;host;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = generic_buffers_fsync_noflush(file, start, end, datasync);</div><div class='add'>+	if (!ret)</div><div class='add'>+		ret = blkdev_issue_flush(inode-&gt;i_sb-&gt;s_bdev);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(generic_buffers_fsync);</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Called when we've recently written block `bblock', and it is known that</div><div class='ctx'>  * `bblock' was for a buffer_boundary() buffer.  This means that the block at</div><div class='hunk'>@@ -559,10 +665,12 @@ EXPORT_SYMBOL(sync_mapping_buffers);</div><div class='ctx'> void write_boundary_block(struct block_device *bdev,</div><div class='ctx'> 			sector_t bblock, unsigned blocksize)</div><div class='ctx'> {</div><div class='del'>-	struct buffer_head *bh = __find_get_block(bdev, bblock + 1, blocksize);</div><div class='add'>+	struct buffer_head *bh;</div><div class='add'>+</div><div class='add'>+	bh = __find_get_block_nonatomic(bdev, bblock + 1, blocksize);</div><div class='ctx'> 	if (bh) {</div><div class='ctx'> 		if (buffer_dirty(bh))</div><div class='del'>-			ll_rw_block(REQ_OP_WRITE, 0, 1, &amp;bh);</div><div class='add'>+			write_dirty_buffer(bh, 0);</div><div class='ctx'> 		put_bh(bh);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -570,60 +678,64 @@ void write_boundary_block(struct block_device *bdev,</div><div class='ctx'> void mark_buffer_dirty_inode(struct buffer_head *bh, struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='del'>-	struct address_space *buffer_mapping = bh-&gt;b_page-&gt;mapping;</div><div class='add'>+	struct address_space *buffer_mapping = bh-&gt;b_folio-&gt;mapping;</div><div class='ctx'> </div><div class='ctx'> 	mark_buffer_dirty(bh);</div><div class='del'>-	if (!mapping-&gt;private_data) {</div><div class='del'>-		mapping-&gt;private_data = buffer_mapping;</div><div class='add'>+	if (!mapping-&gt;i_private_data) {</div><div class='add'>+		mapping-&gt;i_private_data = buffer_mapping;</div><div class='ctx'> 	} else {</div><div class='del'>-		BUG_ON(mapping-&gt;private_data != buffer_mapping);</div><div class='add'>+		BUG_ON(mapping-&gt;i_private_data != buffer_mapping);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!bh-&gt;b_assoc_map) {</div><div class='del'>-		spin_lock(&amp;buffer_mapping-&gt;private_lock);</div><div class='add'>+		spin_lock(&amp;buffer_mapping-&gt;i_private_lock);</div><div class='ctx'> 		list_move_tail(&amp;bh-&gt;b_assoc_buffers,</div><div class='del'>-				&amp;mapping-&gt;private_list);</div><div class='add'>+				&amp;mapping-&gt;i_private_list);</div><div class='ctx'> 		bh-&gt;b_assoc_map = mapping;</div><div class='del'>-		spin_unlock(&amp;buffer_mapping-&gt;private_lock);</div><div class='add'>+		spin_unlock(&amp;buffer_mapping-&gt;i_private_lock);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(mark_buffer_dirty_inode);</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Add a page to the dirty page list.</div><div class='del'>- *</div><div class='del'>- * It is a sad fact of life that this function is called from several places</div><div class='del'>- * deeply under spinlocking.  It may not sleep.</div><div class='del'>- *</div><div class='del'>- * If the page has buffers, the uptodate buffers are set dirty, to preserve</div><div class='del'>- * dirty-state coherency between the page and the buffers.  It the page does</div><div class='del'>- * not have buffers then when they are later attached they will all be set</div><div class='del'>- * dirty.</div><div class='del'>- *</div><div class='del'>- * The buffers are dirtied before the page is dirtied.  There's a small race</div><div class='del'>- * window in which a writepage caller may see the page cleanness but not the</div><div class='del'>- * buffer dirtiness.  That's fine.  If this code were to set the page dirty</div><div class='del'>- * before the buffers, a concurrent writepage caller could clear the page dirty</div><div class='del'>- * bit, see a bunch of clean buffers and we'd end up with dirty buffers/clean</div><div class='del'>- * page on the dirty page list.</div><div class='del'>- *</div><div class='del'>- * We use private_lock to lock against try_to_free_buffers while using the</div><div class='del'>- * page's buffer list.  Also use this to protect against clean buffers being</div><div class='del'>- * added to the page after it was set dirty.</div><div class='del'>- *</div><div class='del'>- * FIXME: may need to call -&gt;reservepage here as well.  That's rather up to the</div><div class='del'>- * address_space though.</div><div class='add'>+/**</div><div class='add'>+ * block_dirty_folio - Mark a folio as dirty.</div><div class='add'>+ * @mapping: The address space containing this folio.</div><div class='add'>+ * @folio: The folio to mark dirty.</div><div class='add'>+ *</div><div class='add'>+ * Filesystems which use buffer_heads can use this function as their</div><div class='add'>+ * -&gt;dirty_folio implementation.  Some filesystems need to do a little</div><div class='add'>+ * work before calling this function.  Filesystems which do not use</div><div class='add'>+ * buffer_heads should call filemap_dirty_folio() instead.</div><div class='add'>+ *</div><div class='add'>+ * If the folio has buffers, the uptodate buffers are set dirty, to</div><div class='add'>+ * preserve dirty-state coherency between the folio and the buffers.</div><div class='add'>+ * Buffers added to a dirty folio are created dirty.</div><div class='add'>+ *</div><div class='add'>+ * The buffers are dirtied before the folio is dirtied.  There's a small</div><div class='add'>+ * race window in which writeback may see the folio cleanness but not the</div><div class='add'>+ * buffer dirtiness.  That's fine.  If this code were to set the folio</div><div class='add'>+ * dirty before the buffers, writeback could clear the folio dirty flag,</div><div class='add'>+ * see a bunch of clean buffers and we'd end up with dirty buffers/clean</div><div class='add'>+ * folio on the dirty folio list.</div><div class='add'>+ *</div><div class='add'>+ * We use i_private_lock to lock against try_to_free_buffers() while</div><div class='add'>+ * using the folio's buffer list.  This also prevents clean buffers</div><div class='add'>+ * being added to the folio after it was set dirty.</div><div class='add'>+ *</div><div class='add'>+ * Context: May only be called from process context.  Does not sleep.</div><div class='add'>+ * Caller must ensure that @folio cannot be truncated during this call,</div><div class='add'>+ * typically by holding the folio lock or having a page in the folio</div><div class='add'>+ * mapped and holding the page table lock.</div><div class='add'>+ *</div><div class='add'>+ * Return: True if the folio was dirtied; false if it was already dirtied.</div><div class='ctx'>  */</div><div class='del'>-int __set_page_dirty_buffers(struct page *page)</div><div class='add'>+bool block_dirty_folio(struct address_space *mapping, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	int newly_dirty;</div><div class='del'>-	struct address_space *mapping = page_mapping(page);</div><div class='del'>-</div><div class='del'>-	if (unlikely(!mapping))</div><div class='del'>-		return !TestSetPageDirty(page);</div><div class='add'>+	struct buffer_head *head;</div><div class='add'>+	bool newly_dirty;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;mapping-&gt;private_lock);</div><div class='del'>-	if (page_has_buffers(page)) {</div><div class='del'>-		struct buffer_head *head = page_buffers(page);</div><div class='add'>+	spin_lock(&amp;mapping-&gt;i_private_lock);</div><div class='add'>+	head = folio_buffers(folio);</div><div class='add'>+	if (head) {</div><div class='ctx'> 		struct buffer_head *bh = head;</div><div class='ctx'> </div><div class='ctx'> 		do {</div><div class='hunk'>@@ -635,21 +747,18 @@ int __set_page_dirty_buffers(struct page *page)</div><div class='ctx'> 	 * Lock out page's memcg migration to keep PageDirty</div><div class='ctx'> 	 * synchronized with per-memcg dirty page counters.</div><div class='ctx'> 	 */</div><div class='del'>-	lock_page_memcg(page);</div><div class='del'>-	newly_dirty = !TestSetPageDirty(page);</div><div class='del'>-	spin_unlock(&amp;mapping-&gt;private_lock);</div><div class='add'>+	newly_dirty = !folio_test_set_dirty(folio);</div><div class='add'>+	spin_unlock(&amp;mapping-&gt;i_private_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (newly_dirty)</div><div class='del'>-		__set_page_dirty(page, mapping, 1);</div><div class='del'>-</div><div class='del'>-	unlock_page_memcg(page);</div><div class='add'>+		__folio_mark_dirty(folio, mapping, 1);</div><div class='ctx'> </div><div class='ctx'> 	if (newly_dirty)</div><div class='ctx'> 		__mark_inode_dirty(mapping-&gt;host, I_DIRTY_PAGES);</div><div class='ctx'> </div><div class='ctx'> 	return newly_dirty;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(__set_page_dirty_buffers);</div><div class='add'>+EXPORT_SYMBOL(block_dirty_folio);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Write out and wait upon a list of buffers.</div><div class='hunk'>@@ -673,12 +782,11 @@ EXPORT_SYMBOL(__set_page_dirty_buffers);</div><div class='ctx'> static int fsync_buffers_list(spinlock_t *lock, struct list_head *list)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='del'>-	struct list_head tmp;</div><div class='ctx'> 	struct address_space *mapping;</div><div class='ctx'> 	int err = 0, err2;</div><div class='ctx'> 	struct blk_plug plug;</div><div class='add'>+	LIST_HEAD(tmp);</div><div class='ctx'> </div><div class='del'>-	INIT_LIST_HEAD(&amp;tmp);</div><div class='ctx'> 	blk_start_plug(&amp;plug);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(lock);</div><div class='hunk'>@@ -730,7 +838,7 @@ static int fsync_buffers_list(spinlock_t *lock, struct list_head *list)</div><div class='ctx'> 		smp_mb();</div><div class='ctx'> 		if (buffer_dirty(bh)) {</div><div class='ctx'> 			list_add(&amp;bh-&gt;b_assoc_buffers,</div><div class='del'>-				 &amp;mapping-&gt;private_list);</div><div class='add'>+				 &amp;mapping-&gt;i_private_list);</div><div class='ctx'> 			bh-&gt;b_assoc_map = mapping;</div><div class='ctx'> 		}</div><div class='ctx'> 		spin_unlock(lock);</div><div class='hunk'>@@ -754,21 +862,20 @@ static int fsync_buffers_list(spinlock_t *lock, struct list_head *list)</div><div class='ctx'>  * probably unmounting the fs, but that doesn't mean we have already</div><div class='ctx'>  * done a sync().  Just drop the buffers from the inode list.</div><div class='ctx'>  *</div><div class='del'>- * NOTE: we take the inode's blockdev's mapping's private_lock.  Which</div><div class='del'>- * assumes that all the buffers are against the blockdev.  Not true</div><div class='del'>- * for reiserfs.</div><div class='add'>+ * NOTE: we take the inode's blockdev's mapping's i_private_lock.  Which</div><div class='add'>+ * assumes that all the buffers are against the blockdev.</div><div class='ctx'>  */</div><div class='ctx'> void invalidate_inode_buffers(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	if (inode_has_buffers(inode)) {</div><div class='ctx'> 		struct address_space *mapping = &amp;inode-&gt;i_data;</div><div class='del'>-		struct list_head *list = &amp;mapping-&gt;private_list;</div><div class='del'>-		struct address_space *buffer_mapping = mapping-&gt;private_data;</div><div class='add'>+		struct list_head *list = &amp;mapping-&gt;i_private_list;</div><div class='add'>+		struct address_space *buffer_mapping = mapping-&gt;i_private_data;</div><div class='ctx'> </div><div class='del'>-		spin_lock(&amp;buffer_mapping-&gt;private_lock);</div><div class='add'>+		spin_lock(&amp;buffer_mapping-&gt;i_private_lock);</div><div class='ctx'> 		while (!list_empty(list))</div><div class='ctx'> 			__remove_assoc_queue(BH_ENTRY(list-&gt;next));</div><div class='del'>-		spin_unlock(&amp;buffer_mapping-&gt;private_lock);</div><div class='add'>+		spin_unlock(&amp;buffer_mapping-&gt;i_private_lock);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(invalidate_inode_buffers);</div><div class='hunk'>@@ -785,10 +892,10 @@ int remove_inode_buffers(struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> 	if (inode_has_buffers(inode)) {</div><div class='ctx'> 		struct address_space *mapping = &amp;inode-&gt;i_data;</div><div class='del'>-		struct list_head *list = &amp;mapping-&gt;private_list;</div><div class='del'>-		struct address_space *buffer_mapping = mapping-&gt;private_data;</div><div class='add'>+		struct list_head *list = &amp;mapping-&gt;i_private_list;</div><div class='add'>+		struct address_space *buffer_mapping = mapping-&gt;i_private_data;</div><div class='ctx'> </div><div class='del'>-		spin_lock(&amp;buffer_mapping-&gt;private_lock);</div><div class='add'>+		spin_lock(&amp;buffer_mapping-&gt;i_private_lock);</div><div class='ctx'> 		while (!list_empty(list)) {</div><div class='ctx'> 			struct buffer_head *bh = BH_ENTRY(list-&gt;next);</div><div class='ctx'> 			if (buffer_dirty(bh)) {</div><div class='hunk'>@@ -797,13 +904,13 @@ int remove_inode_buffers(struct inode *inode)</div><div class='ctx'> 			}</div><div class='ctx'> 			__remove_assoc_queue(bh);</div><div class='ctx'> 		}</div><div class='del'>-		spin_unlock(&amp;buffer_mapping-&gt;private_lock);</div><div class='add'>+		spin_unlock(&amp;buffer_mapping-&gt;i_private_lock);</div><div class='ctx'> 	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Create the appropriate buffers when given a page for data area and</div><div class='add'>+ * Create the appropriate buffers when given a folio for data area and</div><div class='ctx'>  * the size of each buffer.. Use the bh-&gt;b_this_page linked list to</div><div class='ctx'>  * follow the buffers created.  Return NULL if unable to create more</div><div class='ctx'>  * buffers.</div><div class='hunk'>@@ -811,23 +918,19 @@ int remove_inode_buffers(struct inode *inode)</div><div class='ctx'>  * The retry flag is used to differentiate async IO (paging, swapping)</div><div class='ctx'>  * which may not fail from ordinary buffer allocations.</div><div class='ctx'>  */</div><div class='del'>-struct buffer_head *alloc_page_buffers(struct page *page, unsigned long size,</div><div class='del'>-		bool retry)</div><div class='add'>+struct buffer_head *folio_alloc_buffers(struct folio *folio, unsigned long size,</div><div class='add'>+					gfp_t gfp)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *bh, *head;</div><div class='del'>-	gfp_t gfp = GFP_NOFS | __GFP_ACCOUNT;</div><div class='ctx'> 	long offset;</div><div class='ctx'> 	struct mem_cgroup *memcg, *old_memcg;</div><div class='ctx'> </div><div class='del'>-	if (retry)</div><div class='del'>-		gfp |= __GFP_NOFAIL;</div><div class='del'>-</div><div class='del'>-	/* The page lock pins the memcg */</div><div class='del'>-	memcg = page_memcg(page);</div><div class='add'>+	/* The folio lock pins the memcg */</div><div class='add'>+	memcg = folio_memcg(folio);</div><div class='ctx'> 	old_memcg = set_active_memcg(memcg);</div><div class='ctx'> </div><div class='ctx'> 	head = NULL;</div><div class='del'>-	offset = PAGE_SIZE;</div><div class='add'>+	offset = folio_size(folio);</div><div class='ctx'> 	while ((offset -= size) &gt;= 0) {</div><div class='ctx'> 		bh = alloc_buffer_head(gfp);</div><div class='ctx'> 		if (!bh)</div><div class='hunk'>@@ -839,8 +942,8 @@ struct buffer_head *alloc_page_buffers(struct page *page, unsigned long size,</div><div class='ctx'> </div><div class='ctx'> 		bh-&gt;b_size = size;</div><div class='ctx'> </div><div class='del'>-		/* Link the buffer to its page */</div><div class='del'>-		set_bh_page(bh, page, offset);</div><div class='add'>+		/* Link the buffer to its folio */</div><div class='add'>+		folio_set_bh(bh, folio, offset);</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='ctx'> 	set_active_memcg(old_memcg);</div><div class='hunk'>@@ -859,10 +962,18 @@ no_grow:</div><div class='ctx'> </div><div class='ctx'> 	goto out;</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL_GPL(folio_alloc_buffers);</div><div class='add'>+</div><div class='add'>+struct buffer_head *alloc_page_buffers(struct page *page, unsigned long size)</div><div class='add'>+{</div><div class='add'>+	gfp_t gfp = GFP_NOFS | __GFP_ACCOUNT;</div><div class='add'>+</div><div class='add'>+	return folio_alloc_buffers(page_folio(page), size, gfp);</div><div class='add'>+}</div><div class='ctx'> EXPORT_SYMBOL_GPL(alloc_page_buffers);</div><div class='ctx'> </div><div class='del'>-static inline void</div><div class='del'>-link_dev_buffers(struct page *page, struct buffer_head *head)</div><div class='add'>+static inline void link_dev_buffers(struct folio *folio,</div><div class='add'>+		struct buffer_head *head)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *bh, *tail;</div><div class='ctx'> </div><div class='hunk'>@@ -872,7 +983,7 @@ link_dev_buffers(struct page *page, struct buffer_head *head)</div><div class='ctx'> 		bh = bh-&gt;b_this_page;</div><div class='ctx'> 	} while (bh);</div><div class='ctx'> 	tail-&gt;b_this_page = head;</div><div class='del'>-	attach_page_private(page, head);</div><div class='add'>+	folio_attach_private(folio, head);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static sector_t blkdev_max_block(struct block_device *bdev, unsigned int size)</div><div class='hunk'>@@ -888,15 +999,15 @@ static sector_t blkdev_max_block(struct block_device *bdev, unsigned int size)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Initialise the state of a blockdev page's buffers.</div><div class='add'>+ * Initialise the state of a blockdev folio's buffers.</div><div class='ctx'>  */ </div><div class='del'>-static sector_t</div><div class='del'>-init_page_buffers(struct page *page, struct block_device *bdev,</div><div class='del'>-			sector_t block, int size)</div><div class='add'>+static sector_t folio_init_buffers(struct folio *folio,</div><div class='add'>+		struct block_device *bdev, unsigned size)</div><div class='ctx'> {</div><div class='del'>-	struct buffer_head *head = page_buffers(page);</div><div class='add'>+	struct buffer_head *head = folio_buffers(folio);</div><div class='ctx'> 	struct buffer_head *bh = head;</div><div class='del'>-	int uptodate = PageUptodate(page);</div><div class='add'>+	bool uptodate = folio_test_uptodate(folio);</div><div class='add'>+	sector_t block = div_u64(folio_pos(folio), size);</div><div class='ctx'> 	sector_t end_block = blkdev_max_block(bdev, size);</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='hunk'>@@ -921,126 +1032,114 @@ init_page_buffers(struct page *page, struct block_device *bdev,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Create the page-cache page that contains the requested block.</div><div class='add'>+ * Create the page-cache folio that contains the requested block.</div><div class='ctx'>  *</div><div class='ctx'>  * This is used purely for blockdev mappings.</div><div class='add'>+ *</div><div class='add'>+ * Returns false if we have a failure which cannot be cured by retrying</div><div class='add'>+ * without sleeping.  Returns true if we succeeded, or the caller should retry.</div><div class='ctx'>  */</div><div class='del'>-static int</div><div class='del'>-grow_dev_page(struct block_device *bdev, sector_t block,</div><div class='del'>-	      pgoff_t index, int size, int sizebits, gfp_t gfp)</div><div class='add'>+static bool grow_dev_folio(struct block_device *bdev, sector_t block,</div><div class='add'>+		pgoff_t index, unsigned size, gfp_t gfp)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = bdev-&gt;bd_inode;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct address_space *mapping = bdev-&gt;bd_mapping;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='del'>-	sector_t end_block;</div><div class='del'>-	int ret = 0;</div><div class='del'>-	gfp_t gfp_mask;</div><div class='del'>-</div><div class='del'>-	gfp_mask = mapping_gfp_constraint(inode-&gt;i_mapping, ~__GFP_FS) | gfp;</div><div class='add'>+	sector_t end_block = 0;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * XXX: __getblk_slow() can not really deal with failure and</div><div class='del'>-	 * will endlessly loop on improvised global reclaim.  Prefer</div><div class='del'>-	 * looping in the allocator rather than here, at least that</div><div class='del'>-	 * code knows what it's doing.</div><div class='del'>-	 */</div><div class='del'>-	gfp_mask |= __GFP_NOFAIL;</div><div class='del'>-</div><div class='del'>-	page = find_or_create_page(inode-&gt;i_mapping, index, gfp_mask);</div><div class='add'>+	folio = __filemap_get_folio(mapping, index,</div><div class='add'>+			FGP_LOCK | FGP_ACCESSED | FGP_CREAT, gfp);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(!PageLocked(page));</div><div class='del'>-</div><div class='del'>-	if (page_has_buffers(page)) {</div><div class='del'>-		bh = page_buffers(page);</div><div class='add'>+	bh = folio_buffers(folio);</div><div class='add'>+	if (bh) {</div><div class='ctx'> 		if (bh-&gt;b_size == size) {</div><div class='del'>-			end_block = init_page_buffers(page, bdev,</div><div class='del'>-						(sector_t)index &lt;&lt; sizebits,</div><div class='del'>-						size);</div><div class='del'>-			goto done;</div><div class='add'>+			end_block = folio_init_buffers(folio, bdev, size);</div><div class='add'>+			goto unlock;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Retrying may succeed; for example the folio may finish</div><div class='add'>+		 * writeback, or buffers may be cleaned.  This should not</div><div class='add'>+		 * happen very often; maybe we have old buffers attached to</div><div class='add'>+		 * this blockdev's page cache and we're trying to change</div><div class='add'>+		 * the block size?</div><div class='add'>+		 */</div><div class='add'>+		if (!try_to_free_buffers(folio)) {</div><div class='add'>+			end_block = ~0ULL;</div><div class='add'>+			goto unlock;</div><div class='ctx'> 		}</div><div class='del'>-		if (!try_to_free_buffers(page))</div><div class='del'>-			goto failed;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Allocate some buffers for this page</div><div class='del'>-	 */</div><div class='del'>-	bh = alloc_page_buffers(page, size, true);</div><div class='add'>+	bh = folio_alloc_buffers(folio, size, gfp | __GFP_ACCOUNT);</div><div class='add'>+	if (!bh)</div><div class='add'>+		goto unlock;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Link the page to the buffers and initialise them.  Take the</div><div class='add'>+	 * Link the folio to the buffers and initialise them.  Take the</div><div class='ctx'> 	 * lock to be atomic wrt __find_get_block(), which does not</div><div class='del'>-	 * run under the page lock.</div><div class='add'>+	 * run under the folio lock.</div><div class='ctx'> 	 */</div><div class='del'>-	spin_lock(&amp;inode-&gt;i_mapping-&gt;private_lock);</div><div class='del'>-	link_dev_buffers(page, bh);</div><div class='del'>-	end_block = init_page_buffers(page, bdev, (sector_t)index &lt;&lt; sizebits,</div><div class='del'>-			size);</div><div class='del'>-	spin_unlock(&amp;inode-&gt;i_mapping-&gt;private_lock);</div><div class='del'>-done:</div><div class='del'>-	ret = (block &lt; end_block) ? 1 : -ENXIO;</div><div class='del'>-failed:</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='del'>-	return ret;</div><div class='add'>+	spin_lock(&amp;mapping-&gt;i_private_lock);</div><div class='add'>+	link_dev_buffers(folio, bh);</div><div class='add'>+	end_block = folio_init_buffers(folio, bdev, size);</div><div class='add'>+	spin_unlock(&amp;mapping-&gt;i_private_lock);</div><div class='add'>+unlock:</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='add'>+	return block &lt; end_block;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Create buffers for the specified block device block's page.  If</div><div class='del'>- * that page was dirty, the buffers are set dirty also.</div><div class='add'>+ * Create buffers for the specified block device block's folio.  If</div><div class='add'>+ * that folio was dirty, the buffers are set dirty also.  Returns false</div><div class='add'>+ * if we've hit a permanent error.</div><div class='ctx'>  */</div><div class='del'>-static int</div><div class='del'>-grow_buffers(struct block_device *bdev, sector_t block, int size, gfp_t gfp)</div><div class='add'>+static bool grow_buffers(struct block_device *bdev, sector_t block,</div><div class='add'>+		unsigned size, gfp_t gfp)</div><div class='ctx'> {</div><div class='del'>-	pgoff_t index;</div><div class='del'>-	int sizebits;</div><div class='del'>-</div><div class='del'>-	sizebits = PAGE_SHIFT - __ffs(size);</div><div class='del'>-	index = block &gt;&gt; sizebits;</div><div class='add'>+	loff_t pos;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Check for a block which wants to lie outside our maximum possible</div><div class='del'>-	 * pagecache index.  (this comparison is done using sector_t types).</div><div class='add'>+	 * Check for a block which lies outside our maximum possible</div><div class='add'>+	 * pagecache index.</div><div class='ctx'> 	 */</div><div class='del'>-	if (unlikely(index != block &gt;&gt; sizebits)) {</div><div class='del'>-		printk(KERN_ERR "%s: requested out-of-range block %llu for "</div><div class='del'>-			"device %pg\n",</div><div class='add'>+	if (check_mul_overflow(block, (sector_t)size, &amp;pos) || pos &gt; MAX_LFS_FILESIZE) {</div><div class='add'>+		printk(KERN_ERR "%s: requested out-of-range block %llu for device %pg\n",</div><div class='ctx'> 			__func__, (unsigned long long)block,</div><div class='ctx'> 			bdev);</div><div class='del'>-		return -EIO;</div><div class='add'>+		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Create a page with the proper size buffers.. */</div><div class='del'>-	return grow_dev_page(bdev, block, index, size, sizebits, gfp);</div><div class='add'>+	/* Create a folio with the proper size buffers */</div><div class='add'>+	return grow_dev_folio(bdev, block, pos / PAGE_SIZE, size, gfp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct buffer_head *</div><div class='ctx'> __getblk_slow(struct block_device *bdev, sector_t block,</div><div class='ctx'> 	     unsigned size, gfp_t gfp)</div><div class='ctx'> {</div><div class='del'>-	/* Size must be multiple of hard sectorsize */</div><div class='del'>-	if (unlikely(size &amp; (bdev_logical_block_size(bdev)-1) ||</div><div class='del'>-			(size &lt; 512 || size &gt; PAGE_SIZE))) {</div><div class='del'>-		printk(KERN_ERR "getblk(): invalid block size %d requested\n",</div><div class='del'>-					size);</div><div class='del'>-		printk(KERN_ERR "logical block size: %d\n",</div><div class='del'>-					bdev_logical_block_size(bdev));</div><div class='add'>+	bool blocking = gfpflags_allow_blocking(gfp);</div><div class='ctx'> </div><div class='del'>-		dump_stack();</div><div class='add'>+	if (WARN_ON_ONCE(!IS_ALIGNED(size, bdev_logical_block_size(bdev)))) {</div><div class='add'>+		printk(KERN_ERR "getblk(): block size %d not aligned to logical block size %d\n",</div><div class='add'>+		       size, bdev_logical_block_size(bdev));</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	for (;;) {</div><div class='ctx'> 		struct buffer_head *bh;</div><div class='del'>-		int ret;</div><div class='ctx'> </div><div class='del'>-		bh = __find_get_block(bdev, block, size);</div><div class='add'>+		if (!grow_buffers(bdev, block, size, gfp))</div><div class='add'>+			return NULL;</div><div class='add'>+</div><div class='add'>+		if (blocking)</div><div class='add'>+			bh = __find_get_block_nonatomic(bdev, block, size);</div><div class='add'>+		else</div><div class='add'>+			bh = __find_get_block(bdev, block, size);</div><div class='ctx'> 		if (bh)</div><div class='ctx'> 			return bh;</div><div class='del'>-</div><div class='del'>-		ret = grow_buffers(bdev, block, size, gfp);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			return NULL;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1063,8 +1162,8 @@ __getblk_slow(struct block_device *bdev, sector_t block,</div><div class='ctx'>  * Also.  When blockdev buffers are explicitly read with bread(), they</div><div class='ctx'>  * individually become uptodate.  But their backing page remains not</div><div class='ctx'>  * uptodate - even if all of its buffers are uptodate.  A subsequent</div><div class='del'>- * block_read_full_page() against that page will discover all the uptodate</div><div class='del'>- * buffers, will set the page uptodate and will perform no I/O.</div><div class='add'>+ * block_read_full_folio() against that folio will discover all the uptodate</div><div class='add'>+ * buffers, will set the folio uptodate and will perform no I/O.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -1076,7 +1175,7 @@ __getblk_slow(struct block_device *bdev, sector_t block,</div><div class='ctx'>  * and then attach the address_space's inode to its superblock's dirty</div><div class='ctx'>  * inode list.</div><div class='ctx'>  *</div><div class='del'>- * mark_buffer_dirty() is atomic.  It takes bh-&gt;b_page-&gt;mapping-&gt;private_lock,</div><div class='add'>+ * mark_buffer_dirty() is atomic.  It takes bh-&gt;b_folio-&gt;mapping-&gt;i_private_lock,</div><div class='ctx'>  * i_pages lock and mapping-&gt;host-&gt;i_lock.</div><div class='ctx'>  */</div><div class='ctx'> void mark_buffer_dirty(struct buffer_head *bh)</div><div class='hunk'>@@ -1098,16 +1197,14 @@ void mark_buffer_dirty(struct buffer_head *bh)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!test_set_buffer_dirty(bh)) {</div><div class='del'>-		struct page *page = bh-&gt;b_page;</div><div class='add'>+		struct folio *folio = bh-&gt;b_folio;</div><div class='ctx'> 		struct address_space *mapping = NULL;</div><div class='ctx'> </div><div class='del'>-		lock_page_memcg(page);</div><div class='del'>-		if (!TestSetPageDirty(page)) {</div><div class='del'>-			mapping = page_mapping(page);</div><div class='add'>+		if (!folio_test_set_dirty(folio)) {</div><div class='add'>+			mapping = folio-&gt;mapping;</div><div class='ctx'> 			if (mapping)</div><div class='del'>-				__set_page_dirty(page, mapping, 0);</div><div class='add'>+				__folio_mark_dirty(folio, mapping, 0);</div><div class='ctx'> 		}</div><div class='del'>-		unlock_page_memcg(page);</div><div class='ctx'> 		if (mapping)</div><div class='ctx'> 			__mark_inode_dirty(mapping-&gt;host, I_DIRTY_PAGES);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1116,53 +1213,48 @@ EXPORT_SYMBOL(mark_buffer_dirty);</div><div class='ctx'> </div><div class='ctx'> void mark_buffer_write_io_error(struct buffer_head *bh)</div><div class='ctx'> {</div><div class='del'>-	struct super_block *sb;</div><div class='del'>-</div><div class='ctx'> 	set_buffer_write_io_error(bh);</div><div class='ctx'> 	/* FIXME: do we need to set this in both places? */</div><div class='del'>-	if (bh-&gt;b_page &amp;&amp; bh-&gt;b_page-&gt;mapping)</div><div class='del'>-		mapping_set_error(bh-&gt;b_page-&gt;mapping, -EIO);</div><div class='add'>+	if (bh-&gt;b_folio &amp;&amp; bh-&gt;b_folio-&gt;mapping)</div><div class='add'>+		mapping_set_error(bh-&gt;b_folio-&gt;mapping, -EIO);</div><div class='ctx'> 	if (bh-&gt;b_assoc_map)</div><div class='ctx'> 		mapping_set_error(bh-&gt;b_assoc_map, -EIO);</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	sb = READ_ONCE(bh-&gt;b_bdev-&gt;bd_super);</div><div class='del'>-	if (sb)</div><div class='del'>-		errseq_set(&amp;sb-&gt;s_wb_err, -EIO);</div><div class='del'>-	rcu_read_unlock();</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(mark_buffer_write_io_error);</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Decrement a buffer_head's reference count.  If all buffers against a page</div><div class='del'>- * have zero reference count, are clean and unlocked, and if the page is clean</div><div class='del'>- * and unlocked then try_to_free_buffers() may strip the buffers from the page</div><div class='del'>- * in preparation for freeing it (sometimes, rarely, buffers are removed from</div><div class='del'>- * a page but it ends up not being freed, and buffers may later be reattached).</div><div class='add'>+/**</div><div class='add'>+ * __brelse - Release a buffer.</div><div class='add'>+ * @bh: The buffer to release.</div><div class='add'>+ *</div><div class='add'>+ * This variant of brelse() can be called if @bh is guaranteed to not be NULL.</div><div class='ctx'>  */</div><div class='del'>-void __brelse(struct buffer_head * buf)</div><div class='add'>+void __brelse(struct buffer_head *bh)</div><div class='ctx'> {</div><div class='del'>-	if (atomic_read(&amp;buf-&gt;b_count)) {</div><div class='del'>-		put_bh(buf);</div><div class='add'>+	if (atomic_read(&amp;bh-&gt;b_count)) {</div><div class='add'>+		put_bh(bh);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> 	WARN(1, KERN_ERR "VFS: brelse: Trying to free free buffer\n");</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(__brelse);</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * bforget() is like brelse(), except it discards any</div><div class='del'>- * potentially dirty data.</div><div class='add'>+/**</div><div class='add'>+ * __bforget - Discard any dirty data in a buffer.</div><div class='add'>+ * @bh: The buffer to forget.</div><div class='add'>+ *</div><div class='add'>+ * This variant of bforget() can be called if @bh is guaranteed to not</div><div class='add'>+ * be NULL.</div><div class='ctx'>  */</div><div class='ctx'> void __bforget(struct buffer_head *bh)</div><div class='ctx'> {</div><div class='ctx'> 	clear_buffer_dirty(bh);</div><div class='ctx'> 	if (bh-&gt;b_assoc_map) {</div><div class='del'>-		struct address_space *buffer_mapping = bh-&gt;b_page-&gt;mapping;</div><div class='add'>+		struct address_space *buffer_mapping = bh-&gt;b_folio-&gt;mapping;</div><div class='ctx'> </div><div class='del'>-		spin_lock(&amp;buffer_mapping-&gt;private_lock);</div><div class='add'>+		spin_lock(&amp;buffer_mapping-&gt;i_private_lock);</div><div class='ctx'> 		list_del_init(&amp;bh-&gt;b_assoc_buffers);</div><div class='ctx'> 		bh-&gt;b_assoc_map = NULL;</div><div class='del'>-		spin_unlock(&amp;buffer_mapping-&gt;private_lock);</div><div class='add'>+		spin_unlock(&amp;buffer_mapping-&gt;i_private_lock);</div><div class='ctx'> 	}</div><div class='ctx'> 	__brelse(bh);</div><div class='ctx'> }</div><div class='hunk'>@@ -1177,7 +1269,7 @@ static struct buffer_head *__bread_slow(struct buffer_head *bh)</div><div class='ctx'> 	} else {</div><div class='ctx'> 		get_bh(bh);</div><div class='ctx'> 		bh-&gt;b_end_io = end_buffer_read_sync;</div><div class='del'>-		submit_bh(REQ_OP_READ, 0, bh);</div><div class='add'>+		submit_bh(REQ_OP_READ, bh);</div><div class='ctx'> 		wait_on_buffer(bh);</div><div class='ctx'> 		if (buffer_uptodate(bh))</div><div class='ctx'> 			return bh;</div><div class='hunk'>@@ -1235,16 +1327,18 @@ static void bh_lru_install(struct buffer_head *bh)</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='ctx'> 	check_irqs_on();</div><div class='add'>+	bh_lru_lock();</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * the refcount of buffer_head in bh_lru prevents dropping the</div><div class='ctx'> 	 * attached page(i.e., try_to_free_buffers) so it could cause</div><div class='ctx'> 	 * failing page migration.</div><div class='ctx'> 	 * Skip putting upcoming bh into bh_lru until migration is done.</div><div class='ctx'> 	 */</div><div class='del'>-	if (lru_cache_disabled())</div><div class='add'>+	if (lru_cache_disabled() || cpu_is_isolated(smp_processor_id())) {</div><div class='add'>+		bh_lru_unlock();</div><div class='ctx'> 		return;</div><div class='del'>-</div><div class='del'>-	bh_lru_lock();</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	b = this_cpu_ptr(&amp;bh_lrus);</div><div class='ctx'> 	for (i = 0; i &lt; BH_LRU_SIZE; i++) {</div><div class='hunk'>@@ -1271,6 +1365,10 @@ lookup_bh_lru(struct block_device *bdev, sector_t block, unsigned size)</div><div class='ctx'> </div><div class='ctx'> 	check_irqs_on();</div><div class='ctx'> 	bh_lru_lock();</div><div class='add'>+	if (cpu_is_isolated(smp_processor_id())) {</div><div class='add'>+		bh_lru_unlock();</div><div class='add'>+		return NULL;</div><div class='add'>+	}</div><div class='ctx'> 	for (i = 0; i &lt; BH_LRU_SIZE; i++) {</div><div class='ctx'> 		struct buffer_head *bh = __this_cpu_read(bh_lrus.bhs[i]);</div><div class='ctx'> </div><div class='hunk'>@@ -1296,16 +1394,18 @@ lookup_bh_lru(struct block_device *bdev, sector_t block, unsigned size)</div><div class='ctx'> /*</div><div class='ctx'>  * Perform a pagecache lookup for the matching buffer.  If it's there, refresh</div><div class='ctx'>  * it in the LRU and mark it as accessed.  If it is not present then return</div><div class='del'>- * NULL</div><div class='add'>+ * NULL. Atomic context callers may also return NULL if the buffer is being</div><div class='add'>+ * migrated; similarly the page is not marked accessed either.</div><div class='ctx'>  */</div><div class='del'>-struct buffer_head *</div><div class='del'>-__find_get_block(struct block_device *bdev, sector_t block, unsigned size)</div><div class='add'>+static struct buffer_head *</div><div class='add'>+find_get_block_common(struct block_device *bdev, sector_t block,</div><div class='add'>+			unsigned size, bool atomic)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *bh = lookup_bh_lru(bdev, block, size);</div><div class='ctx'> </div><div class='ctx'> 	if (bh == NULL) {</div><div class='ctx'> 		/* __find_get_block_slow will mark the page accessed */</div><div class='del'>-		bh = __find_get_block_slow(bdev, block);</div><div class='add'>+		bh = __find_get_block_slow(bdev, block, atomic);</div><div class='ctx'> 		if (bh)</div><div class='ctx'> 			bh_lru_install(bh);</div><div class='ctx'> 	} else</div><div class='hunk'>@@ -1313,70 +1413,106 @@ __find_get_block(struct block_device *bdev, sector_t block, unsigned size)</div><div class='ctx'> </div><div class='ctx'> 	return bh;</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+struct buffer_head *</div><div class='add'>+__find_get_block(struct block_device *bdev, sector_t block, unsigned size)</div><div class='add'>+{</div><div class='add'>+	return find_get_block_common(bdev, block, size, true);</div><div class='add'>+}</div><div class='ctx'> EXPORT_SYMBOL(__find_get_block);</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * __getblk_gfp() will locate (and, if necessary, create) the buffer_head</div><div class='del'>- * which corresponds to the passed block_device, block and size. The</div><div class='del'>- * returned buffer has its reference count incremented.</div><div class='del'>- *</div><div class='del'>- * __getblk_gfp() will lock up the machine if grow_dev_page's</div><div class='del'>- * try_to_free_buffers() attempt is failing.  FIXME, perhaps?</div><div class='del'>- */</div><div class='add'>+/* same as __find_get_block() but allows sleeping contexts */</div><div class='ctx'> struct buffer_head *</div><div class='del'>-__getblk_gfp(struct block_device *bdev, sector_t block,</div><div class='del'>-	     unsigned size, gfp_t gfp)</div><div class='add'>+__find_get_block_nonatomic(struct block_device *bdev, sector_t block,</div><div class='add'>+			   unsigned size)</div><div class='ctx'> {</div><div class='del'>-	struct buffer_head *bh = __find_get_block(bdev, block, size);</div><div class='add'>+	return find_get_block_common(bdev, block, size, false);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(__find_get_block_nonatomic);</div><div class='ctx'> </div><div class='del'>-	might_sleep();</div><div class='del'>-	if (bh == NULL)</div><div class='del'>-		bh = __getblk_slow(bdev, block, size, gfp);</div><div class='del'>-	return bh;</div><div class='add'>+/**</div><div class='add'>+ * bdev_getblk - Get a buffer_head in a block device's buffer cache.</div><div class='add'>+ * @bdev: The block device.</div><div class='add'>+ * @block: The block number.</div><div class='add'>+ * @size: The size of buffer_heads for this @bdev.</div><div class='add'>+ * @gfp: The memory allocation flags to use.</div><div class='add'>+ *</div><div class='add'>+ * The returned buffer head has its reference count incremented, but is</div><div class='add'>+ * not locked.  The caller should call brelse() when it has finished</div><div class='add'>+ * with the buffer.  The buffer may not be uptodate.  If needed, the</div><div class='add'>+ * caller can bring it uptodate either by reading it or overwriting it.</div><div class='add'>+ *</div><div class='add'>+ * Return: The buffer head, or NULL if memory could not be allocated.</div><div class='add'>+ */</div><div class='add'>+struct buffer_head *bdev_getblk(struct block_device *bdev, sector_t block,</div><div class='add'>+		unsigned size, gfp_t gfp)</div><div class='add'>+{</div><div class='add'>+	struct buffer_head *bh;</div><div class='add'>+</div><div class='add'>+	if (gfpflags_allow_blocking(gfp))</div><div class='add'>+		bh = __find_get_block_nonatomic(bdev, block, size);</div><div class='add'>+	else</div><div class='add'>+		bh = __find_get_block(bdev, block, size);</div><div class='add'>+</div><div class='add'>+	might_alloc(gfp);</div><div class='add'>+	if (bh)</div><div class='add'>+		return bh;</div><div class='add'>+</div><div class='add'>+	return __getblk_slow(bdev, block, size, gfp);</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(__getblk_gfp);</div><div class='add'>+EXPORT_SYMBOL(bdev_getblk);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Do async read-ahead on a buffer..</div><div class='ctx'>  */</div><div class='ctx'> void __breadahead(struct block_device *bdev, sector_t block, unsigned size)</div><div class='ctx'> {</div><div class='del'>-	struct buffer_head *bh = __getblk(bdev, block, size);</div><div class='del'>-	if (likely(bh)) {</div><div class='del'>-		ll_rw_block(REQ_OP_READ, REQ_RAHEAD, 1, &amp;bh);</div><div class='del'>-		brelse(bh);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(__breadahead);</div><div class='add'>+	struct buffer_head *bh = bdev_getblk(bdev, block, size,</div><div class='add'>+			GFP_NOWAIT | __GFP_MOVABLE);</div><div class='ctx'> </div><div class='del'>-void __breadahead_gfp(struct block_device *bdev, sector_t block, unsigned size,</div><div class='del'>-		      gfp_t gfp)</div><div class='del'>-{</div><div class='del'>-	struct buffer_head *bh = __getblk_gfp(bdev, block, size, gfp);</div><div class='ctx'> 	if (likely(bh)) {</div><div class='del'>-		ll_rw_block(REQ_OP_READ, REQ_RAHEAD, 1, &amp;bh);</div><div class='add'>+		bh_readahead(bh, REQ_RAHEAD);</div><div class='ctx'> 		brelse(bh);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(__breadahead_gfp);</div><div class='add'>+EXPORT_SYMBOL(__breadahead);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- *  __bread_gfp() - reads a specified block and returns the bh</div><div class='del'>- *  @bdev: the block_device to read from</div><div class='del'>- *  @block: number of block</div><div class='del'>- *  @size: size (in bytes) to read</div><div class='del'>- *  @gfp: page allocation flag</div><div class='del'>- *</div><div class='del'>- *  Reads a specified block, and returns buffer head that contains it.</div><div class='del'>- *  The page cache can be allocated from non-movable area</div><div class='del'>- *  not to prevent page migration if you set gfp to zero.</div><div class='del'>- *  It returns NULL if the block was unreadable.</div><div class='add'>+ * __bread_gfp() - Read a block.</div><div class='add'>+ * @bdev: The block device to read from.</div><div class='add'>+ * @block: Block number in units of block size.</div><div class='add'>+ * @size: The block size of this device in bytes.</div><div class='add'>+ * @gfp: Not page allocation flags; see below.</div><div class='add'>+ *</div><div class='add'>+ * You are not expected to call this function.  You should use one of</div><div class='add'>+ * sb_bread(), sb_bread_unmovable() or __bread().</div><div class='add'>+ *</div><div class='add'>+ * Read a specified block, and return the buffer head that refers to it.</div><div class='add'>+ * If @gfp is 0, the memory will be allocated using the block device's</div><div class='add'>+ * default GFP flags.  If @gfp is __GFP_MOVABLE, the memory may be</div><div class='add'>+ * allocated from a movable area.  Do not pass in a complete set of</div><div class='add'>+ * GFP flags.</div><div class='add'>+ *</div><div class='add'>+ * The returned buffer head has its refcount increased.  The caller should</div><div class='add'>+ * call brelse() when it has finished with the buffer.</div><div class='add'>+ *</div><div class='add'>+ * Context: May sleep waiting for I/O.</div><div class='add'>+ * Return: NULL if the block was unreadable.</div><div class='ctx'>  */</div><div class='del'>-struct buffer_head *</div><div class='del'>-__bread_gfp(struct block_device *bdev, sector_t block,</div><div class='del'>-		   unsigned size, gfp_t gfp)</div><div class='add'>+struct buffer_head *__bread_gfp(struct block_device *bdev, sector_t block,</div><div class='add'>+		unsigned size, gfp_t gfp)</div><div class='ctx'> {</div><div class='del'>-	struct buffer_head *bh = __getblk_gfp(bdev, block, size, gfp);</div><div class='add'>+	struct buffer_head *bh;</div><div class='add'>+</div><div class='add'>+	gfp |= mapping_gfp_constraint(bdev-&gt;bd_mapping, ~__GFP_FS);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Prefer looping in the allocator rather than here, at least that</div><div class='add'>+	 * code knows what it's doing.</div><div class='add'>+	 */</div><div class='add'>+	gfp |= __GFP_NOFAIL;</div><div class='add'>+</div><div class='add'>+	bh = bdev_getblk(bdev, block, size, gfp);</div><div class='ctx'> </div><div class='ctx'> 	if (likely(bh) &amp;&amp; !buffer_uptodate(bh))</div><div class='ctx'> 		bh = __bread_slow(bh);</div><div class='hunk'>@@ -1439,20 +1575,20 @@ void invalidate_bh_lrus_cpu(void)</div><div class='ctx'> 	bh_lru_unlock();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void set_bh_page(struct buffer_head *bh,</div><div class='del'>-		struct page *page, unsigned long offset)</div><div class='add'>+void folio_set_bh(struct buffer_head *bh, struct folio *folio,</div><div class='add'>+		  unsigned long offset)</div><div class='ctx'> {</div><div class='del'>-	bh-&gt;b_page = page;</div><div class='del'>-	BUG_ON(offset &gt;= PAGE_SIZE);</div><div class='del'>-	if (PageHighMem(page))</div><div class='add'>+	bh-&gt;b_folio = folio;</div><div class='add'>+	BUG_ON(offset &gt;= folio_size(folio));</div><div class='add'>+	if (folio_test_highmem(folio))</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * This catches illegal uses and preserves the offset:</div><div class='ctx'> 		 */</div><div class='ctx'> 		bh-&gt;b_data = (char *)(0 + offset);</div><div class='ctx'> 	else</div><div class='del'>-		bh-&gt;b_data = page_address(page) + offset;</div><div class='add'>+		bh-&gt;b_data = folio_address(folio) + offset;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(set_bh_page);</div><div class='add'>+EXPORT_SYMBOL(folio_set_bh);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Called when truncating a buffer on a page completely.</div><div class='hunk'>@@ -1465,58 +1601,53 @@ EXPORT_SYMBOL(set_bh_page);</div><div class='ctx'> </div><div class='ctx'> static void discard_buffer(struct buffer_head * bh)</div><div class='ctx'> {</div><div class='del'>-	unsigned long b_state, b_state_old;</div><div class='add'>+	unsigned long b_state;</div><div class='ctx'> </div><div class='ctx'> 	lock_buffer(bh);</div><div class='ctx'> 	clear_buffer_dirty(bh);</div><div class='ctx'> 	bh-&gt;b_bdev = NULL;</div><div class='del'>-	b_state = bh-&gt;b_state;</div><div class='del'>-	for (;;) {</div><div class='del'>-		b_state_old = cmpxchg(&amp;bh-&gt;b_state, b_state,</div><div class='del'>-				      (b_state &amp; ~BUFFER_FLAGS_DISCARD));</div><div class='del'>-		if (b_state_old == b_state)</div><div class='del'>-			break;</div><div class='del'>-		b_state = b_state_old;</div><div class='del'>-	}</div><div class='add'>+	b_state = READ_ONCE(bh-&gt;b_state);</div><div class='add'>+	do {</div><div class='add'>+	} while (!try_cmpxchg_relaxed(&amp;bh-&gt;b_state, &amp;b_state,</div><div class='add'>+				      b_state &amp; ~BUFFER_FLAGS_DISCARD));</div><div class='ctx'> 	unlock_buffer(bh);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * block_invalidatepage - invalidate part or all of a buffer-backed page</div><div class='del'>- *</div><div class='del'>- * @page: the page which is affected</div><div class='add'>+ * block_invalidate_folio - Invalidate part or all of a buffer-backed folio.</div><div class='add'>+ * @folio: The folio which is affected.</div><div class='ctx'>  * @offset: start of the range to invalidate</div><div class='ctx'>  * @length: length of the range to invalidate</div><div class='ctx'>  *</div><div class='del'>- * block_invalidatepage() is called when all or part of the page has become</div><div class='add'>+ * block_invalidate_folio() is called when all or part of the folio has been</div><div class='ctx'>  * invalidated by a truncate operation.</div><div class='ctx'>  *</div><div class='del'>- * block_invalidatepage() does not have to release all buffers, but it must</div><div class='add'>+ * block_invalidate_folio() does not have to release all buffers, but it must</div><div class='ctx'>  * ensure that no dirty buffer is left outside @offset and that no I/O</div><div class='ctx'>  * is underway against any of the blocks which are outside the truncation</div><div class='ctx'>  * point.  Because the caller is about to free (and possibly reuse) those</div><div class='ctx'>  * blocks on-disk.</div><div class='ctx'>  */</div><div class='del'>-void block_invalidatepage(struct page *page, unsigned int offset,</div><div class='del'>-			  unsigned int length)</div><div class='add'>+void block_invalidate_folio(struct folio *folio, size_t offset, size_t length)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *head, *bh, *next;</div><div class='del'>-	unsigned int curr_off = 0;</div><div class='del'>-	unsigned int stop = length + offset;</div><div class='add'>+	size_t curr_off = 0;</div><div class='add'>+	size_t stop = length + offset;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(!PageLocked(page));</div><div class='del'>-	if (!page_has_buffers(page))</div><div class='del'>-		goto out;</div><div class='add'>+	BUG_ON(!folio_test_locked(folio));</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Check for overflow</div><div class='ctx'> 	 */</div><div class='del'>-	BUG_ON(stop &gt; PAGE_SIZE || stop &lt; length);</div><div class='add'>+	BUG_ON(stop &gt; folio_size(folio) || stop &lt; length);</div><div class='add'>+</div><div class='add'>+	head = folio_buffers(folio);</div><div class='add'>+	if (!head)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	head = page_buffers(page);</div><div class='ctx'> 	bh = head;</div><div class='ctx'> 	do {</div><div class='del'>-		unsigned int next_off = curr_off + bh-&gt;b_size;</div><div class='add'>+		size_t next_off = curr_off + bh-&gt;b_size;</div><div class='ctx'> 		next = bh-&gt;b_this_page;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='hunk'>@@ -1535,29 +1666,29 @@ void block_invalidatepage(struct page *page, unsigned int offset,</div><div class='ctx'> 	} while (bh != head);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * We release buffers only if the entire page is being invalidated.</div><div class='add'>+	 * We release buffers only if the entire folio is being invalidated.</div><div class='ctx'> 	 * The get_block cached value has been unconditionally invalidated,</div><div class='ctx'> 	 * so real IO is not possible anymore.</div><div class='ctx'> 	 */</div><div class='del'>-	if (length == PAGE_SIZE)</div><div class='del'>-		try_to_release_page(page, 0);</div><div class='add'>+	if (length == folio_size(folio))</div><div class='add'>+		filemap_release_folio(folio, 0);</div><div class='ctx'> out:</div><div class='del'>-	return;</div><div class='add'>+	folio_clear_mappedtodisk(folio);</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(block_invalidatepage);</div><div class='del'>-</div><div class='add'>+EXPORT_SYMBOL(block_invalidate_folio);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * We attach and possibly dirty the buffers atomically wrt</div><div class='del'>- * __set_page_dirty_buffers() via private_lock.  try_to_free_buffers</div><div class='del'>- * is already excluded via the page lock.</div><div class='add'>+ * block_dirty_folio() via i_private_lock.  try_to_free_buffers</div><div class='add'>+ * is already excluded via the folio lock.</div><div class='ctx'>  */</div><div class='del'>-void create_empty_buffers(struct page *page,</div><div class='del'>-			unsigned long blocksize, unsigned long b_state)</div><div class='add'>+struct buffer_head *create_empty_buffers(struct folio *folio,</div><div class='add'>+		unsigned long blocksize, unsigned long b_state)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *bh, *head, *tail;</div><div class='add'>+	gfp_t gfp = GFP_NOFS | __GFP_ACCOUNT | __GFP_NOFAIL;</div><div class='ctx'> </div><div class='del'>-	head = alloc_page_buffers(page, blocksize, true);</div><div class='add'>+	head = folio_alloc_buffers(folio, blocksize, gfp);</div><div class='ctx'> 	bh = head;</div><div class='ctx'> 	do {</div><div class='ctx'> 		bh-&gt;b_state |= b_state;</div><div class='hunk'>@@ -1566,19 +1697,21 @@ void create_empty_buffers(struct page *page,</div><div class='ctx'> 	} while (bh);</div><div class='ctx'> 	tail-&gt;b_this_page = head;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;page-&gt;mapping-&gt;private_lock);</div><div class='del'>-	if (PageUptodate(page) || PageDirty(page)) {</div><div class='add'>+	spin_lock(&amp;folio-&gt;mapping-&gt;i_private_lock);</div><div class='add'>+	if (folio_test_uptodate(folio) || folio_test_dirty(folio)) {</div><div class='ctx'> 		bh = head;</div><div class='ctx'> 		do {</div><div class='del'>-			if (PageDirty(page))</div><div class='add'>+			if (folio_test_dirty(folio))</div><div class='ctx'> 				set_buffer_dirty(bh);</div><div class='del'>-			if (PageUptodate(page))</div><div class='add'>+			if (folio_test_uptodate(folio))</div><div class='ctx'> 				set_buffer_uptodate(bh);</div><div class='ctx'> 			bh = bh-&gt;b_this_page;</div><div class='ctx'> 		} while (bh != head);</div><div class='ctx'> 	}</div><div class='del'>-	attach_page_private(page, head);</div><div class='del'>-	spin_unlock(&amp;page-&gt;mapping-&gt;private_lock);</div><div class='add'>+	folio_attach_private(folio, head);</div><div class='add'>+	spin_unlock(&amp;folio-&gt;mapping-&gt;i_private_lock);</div><div class='add'>+</div><div class='add'>+	return head;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(create_empty_buffers);</div><div class='ctx'> </div><div class='hunk'>@@ -1604,34 +1737,34 @@ EXPORT_SYMBOL(create_empty_buffers);</div><div class='ctx'>  */</div><div class='ctx'> void clean_bdev_aliases(struct block_device *bdev, sector_t block, sector_t len)</div><div class='ctx'> {</div><div class='del'>-	struct inode *bd_inode = bdev-&gt;bd_inode;</div><div class='del'>-	struct address_space *bd_mapping = bd_inode-&gt;i_mapping;</div><div class='del'>-	struct pagevec pvec;</div><div class='del'>-	pgoff_t index = block &gt;&gt; (PAGE_SHIFT - bd_inode-&gt;i_blkbits);</div><div class='add'>+	struct address_space *bd_mapping = bdev-&gt;bd_mapping;</div><div class='add'>+	const int blkbits = bd_mapping-&gt;host-&gt;i_blkbits;</div><div class='add'>+	struct folio_batch fbatch;</div><div class='add'>+	pgoff_t index = ((loff_t)block &lt;&lt; blkbits) / PAGE_SIZE;</div><div class='ctx'> 	pgoff_t end;</div><div class='ctx'> 	int i, count;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> 	struct buffer_head *head;</div><div class='ctx'> </div><div class='del'>-	end = (block + len - 1) &gt;&gt; (PAGE_SHIFT - bd_inode-&gt;i_blkbits);</div><div class='del'>-	pagevec_init(&amp;pvec);</div><div class='del'>-	while (pagevec_lookup_range(&amp;pvec, bd_mapping, &amp;index, end)) {</div><div class='del'>-		count = pagevec_count(&amp;pvec);</div><div class='add'>+	end = ((loff_t)(block + len - 1) &lt;&lt; blkbits) / PAGE_SIZE;</div><div class='add'>+	folio_batch_init(&amp;fbatch);</div><div class='add'>+	while (filemap_get_folios(bd_mapping, &amp;index, end, &amp;fbatch)) {</div><div class='add'>+		count = folio_batch_count(&amp;fbatch);</div><div class='ctx'> 		for (i = 0; i &lt; count; i++) {</div><div class='del'>-			struct page *page = pvec.pages[i];</div><div class='add'>+			struct folio *folio = fbatch.folios[i];</div><div class='ctx'> </div><div class='del'>-			if (!page_has_buffers(page))</div><div class='add'>+			if (!folio_buffers(folio))</div><div class='ctx'> 				continue;</div><div class='ctx'> 			/*</div><div class='del'>-			 * We use page lock instead of bd_mapping-&gt;private_lock</div><div class='add'>+			 * We use folio lock instead of bd_mapping-&gt;i_private_lock</div><div class='ctx'> 			 * to pin buffers here since we can afford to sleep and</div><div class='ctx'> 			 * it scales better than a global spinlock lock.</div><div class='ctx'> 			 */</div><div class='del'>-			lock_page(page);</div><div class='del'>-			/* Recheck when the page is locked which pins bhs */</div><div class='del'>-			if (!page_has_buffers(page))</div><div class='add'>+			folio_lock(folio);</div><div class='add'>+			/* Recheck when the folio is locked which pins bhs */</div><div class='add'>+			head = folio_buffers(folio);</div><div class='add'>+			if (!head)</div><div class='ctx'> 				goto unlock_page;</div><div class='del'>-			head = page_buffers(page);</div><div class='ctx'> 			bh = head;</div><div class='ctx'> 			do {</div><div class='ctx'> 				if (!buffer_mapped(bh) || (bh-&gt;b_blocknr &lt; block))</div><div class='hunk'>@@ -1645,9 +1778,9 @@ next:</div><div class='ctx'> 				bh = bh-&gt;b_this_page;</div><div class='ctx'> 			} while (bh != head);</div><div class='ctx'> unlock_page:</div><div class='del'>-			unlock_page(page);</div><div class='add'>+			folio_unlock(folio);</div><div class='ctx'> 		}</div><div class='del'>-		pagevec_release(&amp;pvec);</div><div class='add'>+		folio_batch_release(&amp;fbatch);</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 		/* End of range already reached? */</div><div class='ctx'> 		if (index &gt; end || !index)</div><div class='hunk'>@@ -1656,27 +1789,19 @@ unlock_page:</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(clean_bdev_aliases);</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Size is a power-of-two in the range 512..PAGE_SIZE,</div><div class='del'>- * and the case we care about most is PAGE_SIZE.</div><div class='del'>- *</div><div class='del'>- * So this *could* possibly be written with those</div><div class='del'>- * constraints in mind (relevant mostly if some</div><div class='del'>- * architecture has a slow bit-scan instruction)</div><div class='del'>- */</div><div class='del'>-static inline int block_size_bits(unsigned int blocksize)</div><div class='add'>+static struct buffer_head *folio_create_buffers(struct folio *folio,</div><div class='add'>+						struct inode *inode,</div><div class='add'>+						unsigned int b_state)</div><div class='ctx'> {</div><div class='del'>-	return ilog2(blocksize);</div><div class='del'>-}</div><div class='add'>+	struct buffer_head *bh;</div><div class='ctx'> </div><div class='del'>-static struct buffer_head *create_page_buffers(struct page *page, struct inode *inode, unsigned int b_state)</div><div class='del'>-{</div><div class='del'>-	BUG_ON(!PageLocked(page));</div><div class='add'>+	BUG_ON(!folio_test_locked(folio));</div><div class='ctx'> </div><div class='del'>-	if (!page_has_buffers(page))</div><div class='del'>-		create_empty_buffers(page, 1 &lt;&lt; READ_ONCE(inode-&gt;i_blkbits),</div><div class='del'>-				     b_state);</div><div class='del'>-	return page_buffers(page);</div><div class='add'>+	bh = folio_buffers(folio);</div><div class='add'>+	if (!bh)</div><div class='add'>+		bh = create_empty_buffers(folio,</div><div class='add'>+				1 &lt;&lt; READ_ONCE(inode-&gt;i_blkbits), b_state);</div><div class='add'>+	return bh;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1693,52 +1818,50 @@ static struct buffer_head *create_page_buffers(struct page *page, struct inode *</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * While block_write_full_page is writing back the dirty buffers under</div><div class='add'>+ * While block_write_full_folio is writing back the dirty buffers under</div><div class='ctx'>  * the page lock, whoever dirtied the buffers may decide to clean them</div><div class='ctx'>  * again at any time.  We handle that by only looking at the buffer</div><div class='ctx'>  * state inside lock_buffer().</div><div class='ctx'>  *</div><div class='del'>- * If block_write_full_page() is called for regular writeback</div><div class='add'>+ * If block_write_full_folio() is called for regular writeback</div><div class='ctx'>  * (wbc-&gt;sync_mode == WB_SYNC_NONE) then it will redirty a page which has a</div><div class='ctx'>  * locked buffer.   This only can happen if someone has written the buffer</div><div class='ctx'>  * directly, with submit_bh().  At the address_space level PageWriteback</div><div class='ctx'>  * prevents this contention from occurring.</div><div class='ctx'>  *</div><div class='del'>- * If block_write_full_page() is called with wbc-&gt;sync_mode ==</div><div class='add'>+ * If block_write_full_folio() is called with wbc-&gt;sync_mode ==</div><div class='ctx'>  * WB_SYNC_ALL, the writes are posted using REQ_SYNC; this</div><div class='ctx'>  * causes the writes to be flagged as synchronous writes.</div><div class='ctx'>  */</div><div class='del'>-int __block_write_full_page(struct inode *inode, struct page *page,</div><div class='del'>-			get_block_t *get_block, struct writeback_control *wbc,</div><div class='del'>-			bh_end_io_t *handler)</div><div class='add'>+int __block_write_full_folio(struct inode *inode, struct folio *folio,</div><div class='add'>+			get_block_t *get_block, struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='ctx'> 	sector_t block;</div><div class='ctx'> 	sector_t last_block;</div><div class='ctx'> 	struct buffer_head *bh, *head;</div><div class='del'>-	unsigned int blocksize, bbits;</div><div class='add'>+	size_t blocksize;</div><div class='ctx'> 	int nr_underway = 0;</div><div class='del'>-	int write_flags = wbc_to_write_flags(wbc);</div><div class='add'>+	blk_opf_t write_flags = wbc_to_write_flags(wbc);</div><div class='ctx'> </div><div class='del'>-	head = create_page_buffers(page, inode,</div><div class='del'>-					(1 &lt;&lt; BH_Dirty)|(1 &lt;&lt; BH_Uptodate));</div><div class='add'>+	head = folio_create_buffers(folio, inode,</div><div class='add'>+				    (1 &lt;&lt; BH_Dirty) | (1 &lt;&lt; BH_Uptodate));</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Be very careful.  We have no exclusion from __set_page_dirty_buffers</div><div class='add'>+	 * Be very careful.  We have no exclusion from block_dirty_folio</div><div class='ctx'> 	 * here, and the (potentially unmapped) buffers may become dirty at</div><div class='ctx'> 	 * any time.  If a buffer becomes dirty here after we've inspected it</div><div class='del'>-	 * then we just miss that fact, and the page stays dirty.</div><div class='add'>+	 * then we just miss that fact, and the folio stays dirty.</div><div class='ctx'> 	 *</div><div class='del'>-	 * Buffers outside i_size may be dirtied by __set_page_dirty_buffers;</div><div class='add'>+	 * Buffers outside i_size may be dirtied by block_dirty_folio;</div><div class='ctx'> 	 * handle that here by just cleaning them.</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='ctx'> 	bh = head;</div><div class='ctx'> 	blocksize = bh-&gt;b_size;</div><div class='del'>-	bbits = block_size_bits(blocksize);</div><div class='ctx'> </div><div class='del'>-	block = (sector_t)page-&gt;index &lt;&lt; (PAGE_SHIFT - bbits);</div><div class='del'>-	last_block = (i_size_read(inode) - 1) &gt;&gt; bbits;</div><div class='add'>+	block = div_u64(folio_pos(folio), blocksize);</div><div class='add'>+	last_block = div_u64(i_size_read(inode) - 1, blocksize);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Get all the dirty buffers mapped to disk addresses and</div><div class='hunk'>@@ -1748,11 +1871,11 @@ int __block_write_full_page(struct inode *inode, struct page *page,</div><div class='ctx'> 		if (block &gt; last_block) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * mapped buffers outside i_size will occur, because</div><div class='del'>-			 * this page can be outside i_size when there is a</div><div class='add'>+			 * this folio can be outside i_size when there is a</div><div class='ctx'> 			 * truncate in progress.</div><div class='ctx'> 			 */</div><div class='ctx'> 			/*</div><div class='del'>-			 * The buffer was zeroed by block_write_full_page()</div><div class='add'>+			 * The buffer was zeroed by block_write_full_folio()</div><div class='ctx'> 			 */</div><div class='ctx'> 			clear_buffer_dirty(bh);</div><div class='ctx'> 			set_buffer_uptodate(bh);</div><div class='hunk'>@@ -1778,7 +1901,7 @@ int __block_write_full_page(struct inode *inode, struct page *page,</div><div class='ctx'> 			continue;</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * If it's a fully non-blocking write attempt and we cannot</div><div class='del'>-		 * lock the buffer then redirty the page.  Note that this can</div><div class='add'>+		 * lock the buffer then redirty the folio.  Note that this can</div><div class='ctx'> 		 * potentially cause a busy-wait loop from writeback threads</div><div class='ctx'> 		 * and kswapd activity, but those code paths have their own</div><div class='ctx'> 		 * higher-level throttling.</div><div class='hunk'>@@ -1786,46 +1909,47 @@ int __block_write_full_page(struct inode *inode, struct page *page,</div><div class='ctx'> 		if (wbc-&gt;sync_mode != WB_SYNC_NONE) {</div><div class='ctx'> 			lock_buffer(bh);</div><div class='ctx'> 		} else if (!trylock_buffer(bh)) {</div><div class='del'>-			redirty_page_for_writepage(wbc, page);</div><div class='add'>+			folio_redirty_for_writepage(wbc, folio);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (test_clear_buffer_dirty(bh)) {</div><div class='del'>-			mark_buffer_async_write_endio(bh, handler);</div><div class='add'>+			mark_buffer_async_write_endio(bh,</div><div class='add'>+				end_buffer_async_write);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			unlock_buffer(bh);</div><div class='ctx'> 		}</div><div class='ctx'> 	} while ((bh = bh-&gt;b_this_page) != head);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * The page and its buffers are protected by PageWriteback(), so we can</div><div class='del'>-	 * drop the bh refcounts early.</div><div class='add'>+	 * The folio and its buffers are protected by the writeback flag,</div><div class='add'>+	 * so we can drop the bh refcounts early.</div><div class='ctx'> 	 */</div><div class='del'>-	BUG_ON(PageWriteback(page));</div><div class='del'>-	set_page_writeback(page);</div><div class='add'>+	BUG_ON(folio_test_writeback(folio));</div><div class='add'>+	folio_start_writeback(folio);</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='ctx'> 		struct buffer_head *next = bh-&gt;b_this_page;</div><div class='ctx'> 		if (buffer_async_write(bh)) {</div><div class='del'>-			submit_bh_wbc(REQ_OP_WRITE, write_flags, bh,</div><div class='del'>-					inode-&gt;i_write_hint, wbc);</div><div class='add'>+			submit_bh_wbc(REQ_OP_WRITE | write_flags, bh,</div><div class='add'>+				      inode-&gt;i_write_hint, wbc);</div><div class='ctx'> 			nr_underway++;</div><div class='ctx'> 		}</div><div class='ctx'> 		bh = next;</div><div class='ctx'> 	} while (bh != head);</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> </div><div class='ctx'> 	err = 0;</div><div class='ctx'> done:</div><div class='ctx'> 	if (nr_underway == 0) {</div><div class='ctx'> 		/*</div><div class='del'>-		 * The page was marked dirty, but the buffers were</div><div class='add'>+		 * The folio was marked dirty, but the buffers were</div><div class='ctx'> 		 * clean.  Someone wrote them back by hand with</div><div class='del'>-		 * ll_rw_block/submit_bh.  A rare case.</div><div class='add'>+		 * write_dirty_buffer/submit_bh.  A rare case.</div><div class='ctx'> 		 */</div><div class='del'>-		end_page_writeback(page);</div><div class='add'>+		folio_end_writeback(folio);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * The page and buffer_heads can be released at any time from</div><div class='add'>+		 * The folio and buffer_heads can be released at any time from</div><div class='ctx'> 		 * here on.</div><div class='ctx'> 		 */</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1836,7 +1960,7 @@ recover:</div><div class='ctx'> 	 * ENOSPC, or some other error.  We may already have added some</div><div class='ctx'> 	 * blocks to the file, so we need to write these out to avoid</div><div class='ctx'> 	 * exposing stale data.</div><div class='del'>-	 * The page is currently locked and not marked for writeback</div><div class='add'>+	 * The folio is currently locked and not marked for writeback</div><div class='ctx'> 	 */</div><div class='ctx'> 	bh = head;</div><div class='ctx'> 	/* Recovery: lock and submit the mapped buffers */</div><div class='hunk'>@@ -1844,62 +1968,63 @@ recover:</div><div class='ctx'> 		if (buffer_mapped(bh) &amp;&amp; buffer_dirty(bh) &amp;&amp;</div><div class='ctx'> 		    !buffer_delay(bh)) {</div><div class='ctx'> 			lock_buffer(bh);</div><div class='del'>-			mark_buffer_async_write_endio(bh, handler);</div><div class='add'>+			mark_buffer_async_write_endio(bh,</div><div class='add'>+				end_buffer_async_write);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * The buffer may have been set dirty during</div><div class='del'>-			 * attachment to a dirty page.</div><div class='add'>+			 * attachment to a dirty folio.</div><div class='ctx'> 			 */</div><div class='ctx'> 			clear_buffer_dirty(bh);</div><div class='ctx'> 		}</div><div class='ctx'> 	} while ((bh = bh-&gt;b_this_page) != head);</div><div class='del'>-	SetPageError(page);</div><div class='del'>-	BUG_ON(PageWriteback(page));</div><div class='del'>-	mapping_set_error(page-&gt;mapping, err);</div><div class='del'>-	set_page_writeback(page);</div><div class='add'>+	BUG_ON(folio_test_writeback(folio));</div><div class='add'>+	mapping_set_error(folio-&gt;mapping, err);</div><div class='add'>+	folio_start_writeback(folio);</div><div class='ctx'> 	do {</div><div class='ctx'> 		struct buffer_head *next = bh-&gt;b_this_page;</div><div class='ctx'> 		if (buffer_async_write(bh)) {</div><div class='ctx'> 			clear_buffer_dirty(bh);</div><div class='del'>-			submit_bh_wbc(REQ_OP_WRITE, write_flags, bh,</div><div class='del'>-					inode-&gt;i_write_hint, wbc);</div><div class='add'>+			submit_bh_wbc(REQ_OP_WRITE | write_flags, bh,</div><div class='add'>+				      inode-&gt;i_write_hint, wbc);</div><div class='ctx'> 			nr_underway++;</div><div class='ctx'> 		}</div><div class='ctx'> 		bh = next;</div><div class='ctx'> 	} while (bh != head);</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> 	goto done;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(__block_write_full_page);</div><div class='add'>+EXPORT_SYMBOL(__block_write_full_folio);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * If a page has any new buffers, zero them out here, and mark them uptodate</div><div class='add'>+ * If a folio has any new buffers, zero them out here, and mark them uptodate</div><div class='ctx'>  * and dirty so they'll be written out (in order to prevent uninitialised</div><div class='ctx'>  * block data from leaking). And clear the new bit.</div><div class='ctx'>  */</div><div class='del'>-void page_zero_new_buffers(struct page *page, unsigned from, unsigned to)</div><div class='add'>+void folio_zero_new_buffers(struct folio *folio, size_t from, size_t to)</div><div class='ctx'> {</div><div class='del'>-	unsigned int block_start, block_end;</div><div class='add'>+	size_t block_start, block_end;</div><div class='ctx'> 	struct buffer_head *head, *bh;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(!PageLocked(page));</div><div class='del'>-	if (!page_has_buffers(page))</div><div class='add'>+	BUG_ON(!folio_test_locked(folio));</div><div class='add'>+	head = folio_buffers(folio);</div><div class='add'>+	if (!head)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	bh = head = page_buffers(page);</div><div class='add'>+	bh = head;</div><div class='ctx'> 	block_start = 0;</div><div class='ctx'> 	do {</div><div class='ctx'> 		block_end = block_start + bh-&gt;b_size;</div><div class='ctx'> </div><div class='ctx'> 		if (buffer_new(bh)) {</div><div class='ctx'> 			if (block_end &gt; from &amp;&amp; block_start &lt; to) {</div><div class='del'>-				if (!PageUptodate(page)) {</div><div class='del'>-					unsigned start, size;</div><div class='add'>+				if (!folio_test_uptodate(folio)) {</div><div class='add'>+					size_t start, xend;</div><div class='ctx'> </div><div class='ctx'> 					start = max(from, block_start);</div><div class='del'>-					size = min(to, block_end) - start;</div><div class='add'>+					xend = min(to, block_end);</div><div class='ctx'> </div><div class='del'>-					zero_user(page, start, size);</div><div class='add'>+					folio_zero_segment(folio, start, xend);</div><div class='ctx'> 					set_buffer_uptodate(bh);</div><div class='ctx'> 				}</div><div class='ctx'> </div><div class='hunk'>@@ -1912,13 +2037,13 @@ void page_zero_new_buffers(struct page *page, unsigned from, unsigned to)</div><div class='ctx'> 		bh = bh-&gt;b_this_page;</div><div class='ctx'> 	} while (bh != head);</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(page_zero_new_buffers);</div><div class='add'>+EXPORT_SYMBOL(folio_zero_new_buffers);</div><div class='ctx'> </div><div class='del'>-static void</div><div class='add'>+static int</div><div class='ctx'> iomap_to_bh(struct inode *inode, sector_t block, struct buffer_head *bh,</div><div class='ctx'> 		const struct iomap *iomap)</div><div class='ctx'> {</div><div class='del'>-	loff_t offset = block &lt;&lt; inode-&gt;i_blkbits;</div><div class='add'>+	loff_t offset = (loff_t)block &lt;&lt; inode-&gt;i_blkbits;</div><div class='ctx'> </div><div class='ctx'> 	bh-&gt;b_bdev = iomap-&gt;bdev;</div><div class='ctx'> </div><div class='hunk'>@@ -1928,7 +2053,8 @@ iomap_to_bh(struct inode *inode, sector_t block, struct buffer_head *bh,</div><div class='ctx'> 	 * current block, then do not map the buffer and let the caller</div><div class='ctx'> 	 * handle it.</div><div class='ctx'> 	 */</div><div class='del'>-	BUG_ON(offset &gt;= iomap-&gt;offset + iomap-&gt;length);</div><div class='add'>+	if (offset &gt;= iomap-&gt;offset + iomap-&gt;length)</div><div class='add'>+		return -EIO;</div><div class='ctx'> </div><div class='ctx'> 	switch (iomap-&gt;type) {</div><div class='ctx'> 	case IOMAP_HOLE:</div><div class='hunk'>@@ -1940,7 +2066,7 @@ iomap_to_bh(struct inode *inode, sector_t block, struct buffer_head *bh,</div><div class='ctx'> 		if (!buffer_uptodate(bh) ||</div><div class='ctx'> 		    (offset &gt;= i_size_read(inode)))</div><div class='ctx'> 			set_buffer_new(bh);</div><div class='del'>-		break;</div><div class='add'>+		return 0;</div><div class='ctx'> 	case IOMAP_DELALLOC:</div><div class='ctx'> 		if (!buffer_uptodate(bh) ||</div><div class='ctx'> 		    (offset &gt;= i_size_read(inode)))</div><div class='hunk'>@@ -1948,7 +2074,7 @@ iomap_to_bh(struct inode *inode, sector_t block, struct buffer_head *bh,</div><div class='ctx'> 		set_buffer_uptodate(bh);</div><div class='ctx'> 		set_buffer_mapped(bh);</div><div class='ctx'> 		set_buffer_delay(bh);</div><div class='del'>-		break;</div><div class='add'>+		return 0;</div><div class='ctx'> 	case IOMAP_UNWRITTEN:</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * For unwritten regions, we always need to ensure that regions</div><div class='hunk'>@@ -1960,43 +2086,52 @@ iomap_to_bh(struct inode *inode, sector_t block, struct buffer_head *bh,</div><div class='ctx'> 		fallthrough;</div><div class='ctx'> 	case IOMAP_MAPPED:</div><div class='ctx'> 		if ((iomap-&gt;flags &amp; IOMAP_F_NEW) ||</div><div class='del'>-		    offset &gt;= i_size_read(inode))</div><div class='add'>+		    offset &gt;= i_size_read(inode)) {</div><div class='add'>+			/*</div><div class='add'>+			 * This can happen if truncating the block device races</div><div class='add'>+			 * with the check in the caller as i_size updates on</div><div class='add'>+			 * block devices aren't synchronized by i_rwsem for</div><div class='add'>+			 * block devices.</div><div class='add'>+			 */</div><div class='add'>+			if (S_ISBLK(inode-&gt;i_mode))</div><div class='add'>+				return -EIO;</div><div class='ctx'> 			set_buffer_new(bh);</div><div class='add'>+		}</div><div class='ctx'> 		bh-&gt;b_blocknr = (iomap-&gt;addr + offset - iomap-&gt;offset) &gt;&gt;</div><div class='ctx'> 				inode-&gt;i_blkbits;</div><div class='ctx'> 		set_buffer_mapped(bh);</div><div class='del'>-		break;</div><div class='add'>+		return 0;</div><div class='add'>+	default:</div><div class='add'>+		WARN_ON_ONCE(1);</div><div class='add'>+		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int __block_write_begin_int(struct page *page, loff_t pos, unsigned len,</div><div class='add'>+int __block_write_begin_int(struct folio *folio, loff_t pos, unsigned len,</div><div class='ctx'> 		get_block_t *get_block, const struct iomap *iomap)</div><div class='ctx'> {</div><div class='del'>-	unsigned from = pos &amp; (PAGE_SIZE - 1);</div><div class='del'>-	unsigned to = from + len;</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-	unsigned block_start, block_end;</div><div class='add'>+	size_t from = offset_in_folio(folio, pos);</div><div class='add'>+	size_t to = from + len;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+	size_t block_start, block_end;</div><div class='ctx'> 	sector_t block;</div><div class='ctx'> 	int err = 0;</div><div class='del'>-	unsigned blocksize, bbits;</div><div class='add'>+	size_t blocksize;</div><div class='ctx'> 	struct buffer_head *bh, *head, *wait[2], **wait_bh=wait;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(!PageLocked(page));</div><div class='del'>-	BUG_ON(from &gt; PAGE_SIZE);</div><div class='del'>-	BUG_ON(to &gt; PAGE_SIZE);</div><div class='add'>+	BUG_ON(!folio_test_locked(folio));</div><div class='add'>+	BUG_ON(to &gt; folio_size(folio));</div><div class='ctx'> 	BUG_ON(from &gt; to);</div><div class='ctx'> </div><div class='del'>-	head = create_page_buffers(page, inode, 0);</div><div class='add'>+	head = folio_create_buffers(folio, inode, 0);</div><div class='ctx'> 	blocksize = head-&gt;b_size;</div><div class='del'>-	bbits = block_size_bits(blocksize);</div><div class='del'>-</div><div class='del'>-	block = (sector_t)page-&gt;index &lt;&lt; (PAGE_SHIFT - bbits);</div><div class='add'>+	block = div_u64(folio_pos(folio), blocksize);</div><div class='ctx'> </div><div class='del'>-	for(bh = head, block_start = 0; bh != head || !block_start;</div><div class='add'>+	for (bh = head, block_start = 0; bh != head || !block_start;</div><div class='ctx'> 	    block++, block_start=block_end, bh = bh-&gt;b_this_page) {</div><div class='ctx'> 		block_end = block_start + blocksize;</div><div class='ctx'> 		if (block_end &lt;= from || block_start &gt;= to) {</div><div class='del'>-			if (PageUptodate(page)) {</div><div class='add'>+			if (folio_test_uptodate(folio)) {</div><div class='ctx'> 				if (!buffer_uptodate(bh))</div><div class='ctx'> 					set_buffer_uptodate(bh);</div><div class='ctx'> 			}</div><div class='hunk'>@@ -2006,30 +2141,29 @@ int __block_write_begin_int(struct page *page, loff_t pos, unsigned len,</div><div class='ctx'> 			clear_buffer_new(bh);</div><div class='ctx'> 		if (!buffer_mapped(bh)) {</div><div class='ctx'> 			WARN_ON(bh-&gt;b_size != blocksize);</div><div class='del'>-			if (get_block) {</div><div class='add'>+			if (get_block)</div><div class='ctx'> 				err = get_block(inode, block, bh, 1);</div><div class='del'>-				if (err)</div><div class='del'>-					break;</div><div class='del'>-			} else {</div><div class='del'>-				iomap_to_bh(inode, block, bh, iomap);</div><div class='del'>-			}</div><div class='add'>+			else</div><div class='add'>+				err = iomap_to_bh(inode, block, bh, iomap);</div><div class='add'>+			if (err)</div><div class='add'>+				break;</div><div class='ctx'> </div><div class='ctx'> 			if (buffer_new(bh)) {</div><div class='ctx'> 				clean_bdev_bh_alias(bh);</div><div class='del'>-				if (PageUptodate(page)) {</div><div class='add'>+				if (folio_test_uptodate(folio)) {</div><div class='ctx'> 					clear_buffer_new(bh);</div><div class='ctx'> 					set_buffer_uptodate(bh);</div><div class='ctx'> 					mark_buffer_dirty(bh);</div><div class='ctx'> 					continue;</div><div class='ctx'> 				}</div><div class='ctx'> 				if (block_end &gt; to || block_start &lt; from)</div><div class='del'>-					zero_user_segments(page,</div><div class='add'>+					folio_zero_segments(folio,</div><div class='ctx'> 						to, block_end,</div><div class='ctx'> 						block_start, from);</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		if (PageUptodate(page)) {</div><div class='add'>+		if (folio_test_uptodate(folio)) {</div><div class='ctx'> 			if (!buffer_uptodate(bh))</div><div class='ctx'> 				set_buffer_uptodate(bh);</div><div class='ctx'> 			continue; </div><div class='hunk'>@@ -2037,7 +2171,7 @@ int __block_write_begin_int(struct page *page, loff_t pos, unsigned len,</div><div class='ctx'> 		if (!buffer_uptodate(bh) &amp;&amp; !buffer_delay(bh) &amp;&amp;</div><div class='ctx'> 		    !buffer_unwritten(bh) &amp;&amp;</div><div class='ctx'> 		     (block_start &lt; from || block_end &gt; to)) {</div><div class='del'>-			ll_rw_block(REQ_OP_READ, 0, 1, &amp;bh);</div><div class='add'>+			bh_read_nowait(bh, 0);</div><div class='ctx'> 			*wait_bh++=bh;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2050,26 +2184,27 @@ int __block_write_begin_int(struct page *page, loff_t pos, unsigned len,</div><div class='ctx'> 			err = -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (unlikely(err))</div><div class='del'>-		page_zero_new_buffers(page, from, to);</div><div class='add'>+		folio_zero_new_buffers(folio, from, to);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int __block_write_begin(struct page *page, loff_t pos, unsigned len,</div><div class='add'>+int __block_write_begin(struct folio *folio, loff_t pos, unsigned len,</div><div class='ctx'> 		get_block_t *get_block)</div><div class='ctx'> {</div><div class='del'>-	return __block_write_begin_int(page, pos, len, get_block, NULL);</div><div class='add'>+	return __block_write_begin_int(folio, pos, len, get_block, NULL);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(__block_write_begin);</div><div class='ctx'> </div><div class='del'>-static int __block_commit_write(struct inode *inode, struct page *page,</div><div class='del'>-		unsigned from, unsigned to)</div><div class='add'>+void block_commit_write(struct folio *folio, size_t from, size_t to)</div><div class='ctx'> {</div><div class='del'>-	unsigned block_start, block_end;</div><div class='del'>-	int partial = 0;</div><div class='add'>+	size_t block_start, block_end;</div><div class='add'>+	bool partial = false;</div><div class='ctx'> 	unsigned blocksize;</div><div class='ctx'> 	struct buffer_head *bh, *head;</div><div class='ctx'> </div><div class='del'>-	bh = head = page_buffers(page);</div><div class='add'>+	bh = head = folio_buffers(folio);</div><div class='add'>+	if (!bh)</div><div class='add'>+		return;</div><div class='ctx'> 	blocksize = bh-&gt;b_size;</div><div class='ctx'> </div><div class='ctx'> 	block_start = 0;</div><div class='hunk'>@@ -2077,7 +2212,7 @@ static int __block_commit_write(struct inode *inode, struct page *page,</div><div class='ctx'> 		block_end = block_start + blocksize;</div><div class='ctx'> 		if (block_end &lt;= from || block_start &gt;= to) {</div><div class='ctx'> 			if (!buffer_uptodate(bh))</div><div class='del'>-				partial = 1;</div><div class='add'>+				partial = true;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			set_buffer_uptodate(bh);</div><div class='ctx'> 			mark_buffer_dirty(bh);</div><div class='hunk'>@@ -2091,14 +2226,14 @@ static int __block_commit_write(struct inode *inode, struct page *page,</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If this is a partial write which happened to make all buffers</div><div class='del'>-	 * uptodate then we can optimize away a bogus readpage() for</div><div class='del'>-	 * the next read(). Here we 'discover' whether the page went</div><div class='add'>+	 * uptodate then we can optimize away a bogus read_folio() for</div><div class='add'>+	 * the next read(). Here we 'discover' whether the folio went</div><div class='ctx'> 	 * uptodate as a result of this (potentially partial) write.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (!partial)</div><div class='del'>-		SetPageUptodate(page);</div><div class='del'>-	return 0;</div><div class='add'>+		folio_mark_uptodate(folio);</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL(block_commit_write);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * block_write_begin takes care of the basic task of block allocation and</div><div class='hunk'>@@ -2107,79 +2242,76 @@ static int __block_commit_write(struct inode *inode, struct page *page,</div><div class='ctx'>  * The filesystem needs to handle block truncation upon failure.</div><div class='ctx'>  */</div><div class='ctx'> int block_write_begin(struct address_space *mapping, loff_t pos, unsigned len,</div><div class='del'>-		unsigned flags, struct page **pagep, get_block_t *get_block)</div><div class='add'>+		struct folio **foliop, get_block_t *get_block)</div><div class='ctx'> {</div><div class='ctx'> 	pgoff_t index = pos &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	int status;</div><div class='ctx'> </div><div class='del'>-	page = grab_cache_page_write_begin(mapping, index, flags);</div><div class='del'>-	if (!page)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	folio = __filemap_get_folio(mapping, index, FGP_WRITEBEGIN,</div><div class='add'>+			mapping_gfp_mask(mapping));</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio);</div><div class='ctx'> </div><div class='del'>-	status = __block_write_begin(page, pos, len, get_block);</div><div class='add'>+	status = __block_write_begin_int(folio, pos, len, get_block, NULL);</div><div class='ctx'> 	if (unlikely(status)) {</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		put_page(page);</div><div class='del'>-		page = NULL;</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='add'>+		folio = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	*pagep = page;</div><div class='add'>+	*foliop = folio;</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(block_write_begin);</div><div class='ctx'> </div><div class='del'>-int block_write_end(struct file *file, struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned copied,</div><div class='del'>-			struct page *page, void *fsdata)</div><div class='add'>+int block_write_end(loff_t pos, unsigned len, unsigned copied,</div><div class='add'>+		struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = mapping-&gt;host;</div><div class='del'>-	unsigned start;</div><div class='del'>-</div><div class='del'>-	start = pos &amp; (PAGE_SIZE - 1);</div><div class='add'>+	size_t start = pos - folio_pos(folio);</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(copied &lt; len)) {</div><div class='ctx'> 		/*</div><div class='del'>-		 * The buffers that were written will now be uptodate, so we</div><div class='del'>-		 * don't have to worry about a readpage reading them and</div><div class='del'>-		 * overwriting a partial write. However if we have encountered</div><div class='del'>-		 * a short write and only partially written into a buffer, it</div><div class='del'>-		 * will not be marked uptodate, so a readpage might come in and</div><div class='del'>-		 * destroy our partial write.</div><div class='add'>+		 * The buffers that were written will now be uptodate, so</div><div class='add'>+		 * we don't have to worry about a read_folio reading them</div><div class='add'>+		 * and overwriting a partial write. However if we have</div><div class='add'>+		 * encountered a short write and only partially written</div><div class='add'>+		 * into a buffer, it will not be marked uptodate, so a</div><div class='add'>+		 * read_folio might come in and destroy our partial write.</div><div class='ctx'> 		 *</div><div class='ctx'> 		 * Do the simplest thing, and just treat any short write to a</div><div class='del'>-		 * non uptodate page as a zero-length write, and force the</div><div class='add'>+		 * non uptodate folio as a zero-length write, and force the</div><div class='ctx'> 		 * caller to redo the whole thing.</div><div class='ctx'> 		 */</div><div class='del'>-		if (!PageUptodate(page))</div><div class='add'>+		if (!folio_test_uptodate(folio))</div><div class='ctx'> 			copied = 0;</div><div class='ctx'> </div><div class='del'>-		page_zero_new_buffers(page, start+copied, start+len);</div><div class='add'>+		folio_zero_new_buffers(folio, start+copied, start+len);</div><div class='ctx'> 	}</div><div class='del'>-	flush_dcache_page(page);</div><div class='add'>+	flush_dcache_folio(folio);</div><div class='ctx'> </div><div class='ctx'> 	/* This could be a short (even 0-length) commit */</div><div class='del'>-	__block_commit_write(inode, page, start, start+copied);</div><div class='add'>+	block_commit_write(folio, start, start + copied);</div><div class='ctx'> </div><div class='ctx'> 	return copied;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(block_write_end);</div><div class='ctx'> </div><div class='del'>-int generic_write_end(struct file *file, struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned copied,</div><div class='del'>-			struct page *page, void *fsdata)</div><div class='add'>+int generic_write_end(const struct kiocb *iocb, struct address_space *mapping,</div><div class='add'>+		      loff_t pos, unsigned len, unsigned copied,</div><div class='add'>+		      struct folio *folio, void *fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='ctx'> 	loff_t old_size = inode-&gt;i_size;</div><div class='ctx'> 	bool i_size_changed = false;</div><div class='ctx'> </div><div class='del'>-	copied = block_write_end(file, mapping, pos, len, copied, page, fsdata);</div><div class='add'>+	copied = block_write_end(pos, len, copied, folio);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * No need to use i_size_read() here, the i_size cannot change under us</div><div class='ctx'> 	 * because we hold i_rwsem.</div><div class='ctx'> 	 *</div><div class='del'>-	 * But it's important to update i_size while still holding page lock:</div><div class='add'>+	 * But it's important to update i_size while still holding folio lock:</div><div class='ctx'> 	 * page writeout could otherwise come in and zero beyond i_size.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (pos + copied &gt; inode-&gt;i_size) {</div><div class='hunk'>@@ -2187,8 +2319,8 @@ int generic_write_end(struct file *file, struct address_space *mapping,</div><div class='ctx'> 		i_size_changed = true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> </div><div class='ctx'> 	if (old_size &lt; pos)</div><div class='ctx'> 		pagecache_isize_extended(inode, old_size, pos);</div><div class='hunk'>@@ -2205,29 +2337,27 @@ int generic_write_end(struct file *file, struct address_space *mapping,</div><div class='ctx'> EXPORT_SYMBOL(generic_write_end);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * block_is_partially_uptodate checks whether buffers within a page are</div><div class='add'>+ * block_is_partially_uptodate checks whether buffers within a folio are</div><div class='ctx'>  * uptodate or not.</div><div class='ctx'>  *</div><div class='del'>- * Returns true if all buffers which correspond to a file portion</div><div class='del'>- * we want to read are uptodate.</div><div class='add'>+ * Returns true if all buffers which correspond to the specified part</div><div class='add'>+ * of the folio are uptodate.</div><div class='ctx'>  */</div><div class='del'>-int block_is_partially_uptodate(struct page *page, unsigned long from,</div><div class='del'>-					unsigned long count)</div><div class='add'>+bool block_is_partially_uptodate(struct folio *folio, size_t from, size_t count)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned block_start, block_end, blocksize;</div><div class='ctx'> 	unsigned to;</div><div class='ctx'> 	struct buffer_head *bh, *head;</div><div class='del'>-	int ret = 1;</div><div class='add'>+	bool ret = true;</div><div class='ctx'> </div><div class='del'>-	if (!page_has_buffers(page))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	head = page_buffers(page);</div><div class='add'>+	head = folio_buffers(folio);</div><div class='add'>+	if (!head)</div><div class='add'>+		return false;</div><div class='ctx'> 	blocksize = head-&gt;b_size;</div><div class='del'>-	to = min_t(unsigned, PAGE_SIZE - from, count);</div><div class='add'>+	to = min_t(unsigned, folio_size(folio) - from, count);</div><div class='ctx'> 	to = from + to;</div><div class='del'>-	if (from &lt; blocksize &amp;&amp; to &gt; PAGE_SIZE - blocksize)</div><div class='del'>-		return 0;</div><div class='add'>+	if (from &lt; blocksize &amp;&amp; to &gt; folio_size(folio) - blocksize)</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	bh = head;</div><div class='ctx'> 	block_start = 0;</div><div class='hunk'>@@ -2235,7 +2365,7 @@ int block_is_partially_uptodate(struct page *page, unsigned long from,</div><div class='ctx'> 		block_end = block_start + blocksize;</div><div class='ctx'> 		if (block_end &gt; from &amp;&amp; block_start &lt; to) {</div><div class='ctx'> 			if (!buffer_uptodate(bh)) {</div><div class='del'>-				ret = 0;</div><div class='add'>+				ret = false;</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> 			if (block_end &gt;= to)</div><div class='hunk'>@@ -2250,30 +2380,32 @@ int block_is_partially_uptodate(struct page *page, unsigned long from,</div><div class='ctx'> EXPORT_SYMBOL(block_is_partially_uptodate);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Generic "read page" function for block devices that have the normal</div><div class='add'>+ * Generic "read_folio" function for block devices that have the normal</div><div class='ctx'>  * get_block functionality. This is most of the block device filesystems.</div><div class='del'>- * Reads the page asynchronously --- the unlock_buffer() and</div><div class='add'>+ * Reads the folio asynchronously --- the unlock_buffer() and</div><div class='ctx'>  * set/clear_buffer_uptodate() functions propagate buffer state into the</div><div class='del'>- * page struct once IO has completed.</div><div class='add'>+ * folio once IO has completed.</div><div class='ctx'>  */</div><div class='del'>-int block_read_full_page(struct page *page, get_block_t *get_block)</div><div class='add'>+int block_read_full_folio(struct folio *folio, get_block_t *get_block)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	sector_t iblock, lblock;</div><div class='del'>-	struct buffer_head *bh, *head, *arr[MAX_BUF_PER_PAGE];</div><div class='del'>-	unsigned int blocksize, bbits;</div><div class='del'>-	int nr, i;</div><div class='add'>+	struct buffer_head *bh, *head, *prev = NULL;</div><div class='add'>+	size_t blocksize;</div><div class='ctx'> 	int fully_mapped = 1;</div><div class='add'>+	bool page_error = false;</div><div class='add'>+	loff_t limit = i_size_read(inode);</div><div class='ctx'> </div><div class='del'>-	head = create_page_buffers(page, inode, 0);</div><div class='add'>+	/* This is needed for ext4. */</div><div class='add'>+	if (IS_ENABLED(CONFIG_FS_VERITY) &amp;&amp; IS_VERITY(inode))</div><div class='add'>+		limit = inode-&gt;i_sb-&gt;s_maxbytes;</div><div class='add'>+</div><div class='add'>+	head = folio_create_buffers(folio, inode, 0);</div><div class='ctx'> 	blocksize = head-&gt;b_size;</div><div class='del'>-	bbits = block_size_bits(blocksize);</div><div class='ctx'> </div><div class='del'>-	iblock = (sector_t)page-&gt;index &lt;&lt; (PAGE_SHIFT - bbits);</div><div class='del'>-	lblock = (i_size_read(inode)+blocksize-1) &gt;&gt; bbits;</div><div class='add'>+	iblock = div_u64(folio_pos(folio), blocksize);</div><div class='add'>+	lblock = div_u64(limit + blocksize - 1, blocksize);</div><div class='ctx'> 	bh = head;</div><div class='del'>-	nr = 0;</div><div class='del'>-	i = 0;</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='ctx'> 		if (buffer_uptodate(bh))</div><div class='hunk'>@@ -2287,10 +2419,11 @@ int block_read_full_page(struct page *page, get_block_t *get_block)</div><div class='ctx'> 				WARN_ON(bh-&gt;b_size != blocksize);</div><div class='ctx'> 				err = get_block(inode, iblock, bh, 0);</div><div class='ctx'> 				if (err)</div><div class='del'>-					SetPageError(page);</div><div class='add'>+					page_error = true;</div><div class='ctx'> 			}</div><div class='ctx'> 			if (!buffer_mapped(bh)) {</div><div class='del'>-				zero_user(page, i * blocksize, blocksize);</div><div class='add'>+				folio_zero_range(folio, bh_offset(bh),</div><div class='add'>+						blocksize);</div><div class='ctx'> 				if (!err)</div><div class='ctx'> 					set_buffer_uptodate(bh);</div><div class='ctx'> 				continue;</div><div class='hunk'>@@ -2302,45 +2435,36 @@ int block_read_full_page(struct page *page, get_block_t *get_block)</div><div class='ctx'> 			if (buffer_uptodate(bh))</div><div class='ctx'> 				continue;</div><div class='ctx'> 		}</div><div class='del'>-		arr[nr++] = bh;</div><div class='del'>-	} while (i++, iblock++, (bh = bh-&gt;b_this_page) != head);</div><div class='del'>-</div><div class='del'>-	if (fully_mapped)</div><div class='del'>-		SetPageMappedToDisk(page);</div><div class='del'>-</div><div class='del'>-	if (!nr) {</div><div class='del'>-		/*</div><div class='del'>-		 * All buffers are uptodate - we can set the page uptodate</div><div class='del'>-		 * as well. But not if get_block() returned an error.</div><div class='del'>-		 */</div><div class='del'>-		if (!PageError(page))</div><div class='del'>-			SetPageUptodate(page);</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	/* Stage two: lock the buffers */</div><div class='del'>-	for (i = 0; i &lt; nr; i++) {</div><div class='del'>-		bh = arr[i];</div><div class='ctx'> 		lock_buffer(bh);</div><div class='add'>+		if (buffer_uptodate(bh)) {</div><div class='add'>+			unlock_buffer(bh);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		mark_buffer_async_read(bh);</div><div class='del'>-	}</div><div class='add'>+		if (prev)</div><div class='add'>+			submit_bh(REQ_OP_READ, prev);</div><div class='add'>+		prev = bh;</div><div class='add'>+	} while (iblock++, (bh = bh-&gt;b_this_page) != head);</div><div class='add'>+</div><div class='add'>+	if (fully_mapped)</div><div class='add'>+		folio_set_mappedtodisk(folio);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Stage 3: start the IO.  Check for uptodateness</div><div class='del'>-	 * inside the buffer lock in case another process reading</div><div class='del'>-	 * the underlying blockdev brought it uptodate (the sct fix).</div><div class='add'>+	 * All buffers are uptodate or get_block() returned an error</div><div class='add'>+	 * when trying to map them - we must finish the read because</div><div class='add'>+	 * end_buffer_async_read() will never be called on any buffer</div><div class='add'>+	 * in this folio.</div><div class='ctx'> 	 */</div><div class='del'>-	for (i = 0; i &lt; nr; i++) {</div><div class='del'>-		bh = arr[i];</div><div class='del'>-		if (buffer_uptodate(bh))</div><div class='del'>-			end_buffer_async_read(bh, 1);</div><div class='del'>-		else</div><div class='del'>-			submit_bh(REQ_OP_READ, 0, bh);</div><div class='del'>-	}</div><div class='add'>+	if (prev)</div><div class='add'>+		submit_bh(REQ_OP_READ, prev);</div><div class='add'>+	else</div><div class='add'>+		folio_end_read(folio, !page_error);</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(block_read_full_page);</div><div class='add'>+EXPORT_SYMBOL(block_read_full_folio);</div><div class='ctx'> </div><div class='ctx'> /* utility function for filesystems that need to do work on expanding</div><div class='ctx'>  * truncates.  Uses filesystem pagecache writes to allow the filesystem to</div><div class='hunk'>@@ -2349,20 +2473,20 @@ EXPORT_SYMBOL(block_read_full_page);</div><div class='ctx'> int generic_cont_expand_simple(struct inode *inode, loff_t size)</div><div class='ctx'> {</div><div class='ctx'> 	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='del'>-	struct page *page;</div><div class='del'>-	void *fsdata;</div><div class='add'>+	const struct address_space_operations *aops = mapping-&gt;a_ops;</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	void *fsdata = NULL;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	err = inode_newsize_ok(inode, size);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	err = pagecache_write_begin(NULL, mapping, size, 0,</div><div class='del'>-				    AOP_FLAG_CONT_EXPAND, &amp;page, &amp;fsdata);</div><div class='add'>+	err = aops-&gt;write_begin(NULL, mapping, size, 0, &amp;folio, &amp;fsdata);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	err = pagecache_write_end(NULL, mapping, size, 0, 0, page, fsdata);</div><div class='add'>+	err = aops-&gt;write_end(NULL, mapping, size, 0, 0, folio, fsdata);</div><div class='ctx'> 	BUG_ON(err &gt; 0);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='hunk'>@@ -2370,13 +2494,15 @@ out:</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(generic_cont_expand_simple);</div><div class='ctx'> </div><div class='del'>-static int cont_expand_zero(struct file *file, struct address_space *mapping,</div><div class='add'>+static int cont_expand_zero(const struct kiocb *iocb,</div><div class='add'>+			    struct address_space *mapping,</div><div class='ctx'> 			    loff_t pos, loff_t *bytes)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='add'>+	const struct address_space_operations *aops = mapping-&gt;a_ops;</div><div class='ctx'> 	unsigned int blocksize = i_blocksize(inode);</div><div class='del'>-	struct page *page;</div><div class='del'>-	void *fsdata;</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	void *fsdata = NULL;</div><div class='ctx'> 	pgoff_t index, curidx;</div><div class='ctx'> 	loff_t curpos;</div><div class='ctx'> 	unsigned zerofrom, offset, len;</div><div class='hunk'>@@ -2393,13 +2519,13 @@ static int cont_expand_zero(struct file *file, struct address_space *mapping,</div><div class='ctx'> 		}</div><div class='ctx'> 		len = PAGE_SIZE - zerofrom;</div><div class='ctx'> </div><div class='del'>-		err = pagecache_write_begin(file, mapping, curpos, len, 0,</div><div class='del'>-					    &amp;page, &amp;fsdata);</div><div class='add'>+		err = aops-&gt;write_begin(iocb, mapping, curpos, len,</div><div class='add'>+					    &amp;folio, &amp;fsdata);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto out;</div><div class='del'>-		zero_user(page, zerofrom, len);</div><div class='del'>-		err = pagecache_write_end(file, mapping, curpos, len, len,</div><div class='del'>-						page, fsdata);</div><div class='add'>+		folio_zero_range(folio, offset_in_folio(folio, curpos), len);</div><div class='add'>+		err = aops-&gt;write_end(iocb, mapping, curpos, len, len,</div><div class='add'>+						folio, fsdata);</div><div class='ctx'> 		if (err &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		BUG_ON(err != len);</div><div class='hunk'>@@ -2426,13 +2552,13 @@ static int cont_expand_zero(struct file *file, struct address_space *mapping,</div><div class='ctx'> 		}</div><div class='ctx'> 		len = offset - zerofrom;</div><div class='ctx'> </div><div class='del'>-		err = pagecache_write_begin(file, mapping, curpos, len, 0,</div><div class='del'>-					    &amp;page, &amp;fsdata);</div><div class='add'>+		err = aops-&gt;write_begin(iocb, mapping, curpos, len,</div><div class='add'>+					    &amp;folio, &amp;fsdata);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto out;</div><div class='del'>-		zero_user(page, zerofrom, len);</div><div class='del'>-		err = pagecache_write_end(file, mapping, curpos, len, len,</div><div class='del'>-						page, fsdata);</div><div class='add'>+		folio_zero_range(folio, offset_in_folio(folio, curpos), len);</div><div class='add'>+		err = aops-&gt;write_end(iocb, mapping, curpos, len, len,</div><div class='add'>+						folio, fsdata);</div><div class='ctx'> 		if (err &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		BUG_ON(err != len);</div><div class='hunk'>@@ -2446,17 +2572,16 @@ out:</div><div class='ctx'>  * For moronic filesystems that do not allow holes in file.</div><div class='ctx'>  * We may have to extend the file.</div><div class='ctx'>  */</div><div class='del'>-int cont_write_begin(struct file *file, struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned flags,</div><div class='del'>-			struct page **pagep, void **fsdata,</div><div class='del'>-			get_block_t *get_block, loff_t *bytes)</div><div class='add'>+int cont_write_begin(const struct kiocb *iocb, struct address_space *mapping,</div><div class='add'>+		     loff_t pos, unsigned len, struct folio **foliop,</div><div class='add'>+		     void **fsdata, get_block_t *get_block, loff_t *bytes)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='ctx'> 	unsigned int blocksize = i_blocksize(inode);</div><div class='ctx'> 	unsigned int zerofrom;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	err = cont_expand_zero(file, mapping, pos, bytes);</div><div class='add'>+	err = cont_expand_zero(iocb, mapping, pos, bytes);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='hunk'>@@ -2466,18 +2591,10 @@ int cont_write_begin(struct file *file, struct address_space *mapping,</div><div class='ctx'> 		(*bytes)++;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return block_write_begin(mapping, pos, len, flags, pagep, get_block);</div><div class='add'>+	return block_write_begin(mapping, pos, len, foliop, get_block);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(cont_write_begin);</div><div class='ctx'> </div><div class='del'>-int block_commit_write(struct page *page, unsigned from, unsigned to)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-	__block_commit_write(inode,page,from,to);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(block_commit_write);</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * block_page_mkwrite() is not allowed to change the file size as it gets</div><div class='ctx'>  * called from a page fault handler when a page is first dirtied. Hence we must</div><div class='hunk'>@@ -2486,7 +2603,7 @@ EXPORT_SYMBOL(block_commit_write);</div><div class='ctx'>  * holes and correct delalloc and unwritten extent mapping on filesystems that</div><div class='ctx'>  * support these features.</div><div class='ctx'>  *</div><div class='del'>- * We are not allowed to take the i_mutex here so we have to play games to</div><div class='add'>+ * We are not allowed to take the i_rwsem here so we have to play games to</div><div class='ctx'>  * protect against truncate races as the page could now be beyond EOF.  Because</div><div class='ctx'>  * truncate writes the inode size before removing pages, once we have the</div><div class='ctx'>  * page lock we can determine safely if the page is beyond EOF. If it is not</div><div class='hunk'>@@ -2499,410 +2616,73 @@ EXPORT_SYMBOL(block_commit_write);</div><div class='ctx'> int block_page_mkwrite(struct vm_area_struct *vma, struct vm_fault *vmf,</div><div class='ctx'> 			 get_block_t get_block)</div><div class='ctx'> {</div><div class='del'>-	struct page *page = vmf-&gt;page;</div><div class='add'>+	struct folio *folio = page_folio(vmf-&gt;page);</div><div class='ctx'> 	struct inode *inode = file_inode(vma-&gt;vm_file);</div><div class='ctx'> 	unsigned long end;</div><div class='ctx'> 	loff_t size;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	lock_page(page);</div><div class='add'>+	folio_lock(folio);</div><div class='ctx'> 	size = i_size_read(inode);</div><div class='del'>-	if ((page-&gt;mapping != inode-&gt;i_mapping) ||</div><div class='del'>-	    (page_offset(page) &gt; size)) {</div><div class='add'>+	if ((folio-&gt;mapping != inode-&gt;i_mapping) ||</div><div class='add'>+	    (folio_pos(folio) &gt;= size)) {</div><div class='ctx'> 		/* We overload EFAULT to mean page got truncated */</div><div class='ctx'> 		ret = -EFAULT;</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* page is wholly or partially inside EOF */</div><div class='del'>-	if (((page-&gt;index + 1) &lt;&lt; PAGE_SHIFT) &gt; size)</div><div class='del'>-		end = size &amp; ~PAGE_MASK;</div><div class='del'>-	else</div><div class='del'>-		end = PAGE_SIZE;</div><div class='del'>-</div><div class='del'>-	ret = __block_write_begin(page, 0, end, get_block);</div><div class='del'>-	if (!ret)</div><div class='del'>-		ret = block_commit_write(page, 0, end);</div><div class='add'>+	end = folio_size(folio);</div><div class='add'>+	/* folio is wholly or partially inside EOF */</div><div class='add'>+	if (folio_pos(folio) + end &gt; size)</div><div class='add'>+		end = size - folio_pos(folio);</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ret &lt; 0))</div><div class='add'>+	ret = __block_write_begin_int(folio, 0, end, get_block, NULL);</div><div class='add'>+	if (unlikely(ret))</div><div class='ctx'> 		goto out_unlock;</div><div class='del'>-	set_page_dirty(page);</div><div class='del'>-	wait_for_stable_page(page);</div><div class='del'>-	return 0;</div><div class='del'>-out_unlock:</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(block_page_mkwrite);</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * nobh_write_begin()'s prereads are special: the buffer_heads are freed</div><div class='del'>- * immediately, while under the page lock.  So it needs a special end_io</div><div class='del'>- * handler which does not touch the bh after unlocking it.</div><div class='del'>- */</div><div class='del'>-static void end_buffer_read_nobh(struct buffer_head *bh, int uptodate)</div><div class='del'>-{</div><div class='del'>-	__end_buffer_read_notouch(bh, uptodate);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Attach the singly-linked list of buffers created by nobh_write_begin, to</div><div class='del'>- * the page (converting it to circular linked list and taking care of page</div><div class='del'>- * dirty races).</div><div class='del'>- */</div><div class='del'>-static void attach_nobh_buffers(struct page *page, struct buffer_head *head)</div><div class='del'>-{</div><div class='del'>-	struct buffer_head *bh;</div><div class='del'>-</div><div class='del'>-	BUG_ON(!PageLocked(page));</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;page-&gt;mapping-&gt;private_lock);</div><div class='del'>-	bh = head;</div><div class='del'>-	do {</div><div class='del'>-		if (PageDirty(page))</div><div class='del'>-			set_buffer_dirty(bh);</div><div class='del'>-		if (!bh-&gt;b_this_page)</div><div class='del'>-			bh-&gt;b_this_page = head;</div><div class='del'>-		bh = bh-&gt;b_this_page;</div><div class='del'>-	} while (bh != head);</div><div class='del'>-	attach_page_private(page, head);</div><div class='del'>-	spin_unlock(&amp;page-&gt;mapping-&gt;private_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * On entry, the page is fully not uptodate.</div><div class='del'>- * On exit the page is fully uptodate in the areas outside (from,to)</div><div class='del'>- * The filesystem needs to handle block truncation upon failure.</div><div class='del'>- */</div><div class='del'>-int nobh_write_begin(struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned flags,</div><div class='del'>-			struct page **pagep, void **fsdata,</div><div class='del'>-			get_block_t *get_block)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = mapping-&gt;host;</div><div class='del'>-	const unsigned blkbits = inode-&gt;i_blkbits;</div><div class='del'>-	const unsigned blocksize = 1 &lt;&lt; blkbits;</div><div class='del'>-	struct buffer_head *head, *bh;</div><div class='del'>-	struct page *page;</div><div class='del'>-	pgoff_t index;</div><div class='del'>-	unsigned from, to;</div><div class='del'>-	unsigned block_in_page;</div><div class='del'>-	unsigned block_start, block_end;</div><div class='del'>-	sector_t block_in_file;</div><div class='del'>-	int nr_reads = 0;</div><div class='del'>-	int ret = 0;</div><div class='del'>-	int is_mapped_to_disk = 1;</div><div class='del'>-</div><div class='del'>-	index = pos &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	from = pos &amp; (PAGE_SIZE - 1);</div><div class='del'>-	to = from + len;</div><div class='del'>-</div><div class='del'>-	page = grab_cache_page_write_begin(mapping, index, flags);</div><div class='del'>-	if (!page)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	*pagep = page;</div><div class='del'>-	*fsdata = NULL;</div><div class='del'>-</div><div class='del'>-	if (page_has_buffers(page)) {</div><div class='del'>-		ret = __block_write_begin(page, pos, len, get_block);</div><div class='del'>-		if (unlikely(ret))</div><div class='del'>-			goto out_release;</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (PageMappedToDisk(page))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Allocate buffers so that we can keep track of state, and potentially</div><div class='del'>-	 * attach them to the page if an error occurs. In the common case of</div><div class='del'>-	 * no error, they will just be freed again without ever being attached</div><div class='del'>-	 * to the page (which is all OK, because we're under the page lock).</div><div class='del'>-	 *</div><div class='del'>-	 * Be careful: the buffer linked list is a NULL terminated one, rather</div><div class='del'>-	 * than the circular one we're used to.</div><div class='del'>-	 */</div><div class='del'>-	head = alloc_page_buffers(page, blocksize, false);</div><div class='del'>-	if (!head) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out_release;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	block_in_file = (sector_t)page-&gt;index &lt;&lt; (PAGE_SHIFT - blkbits);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * We loop across all blocks in the page, whether or not they are</div><div class='del'>-	 * part of the affected region.  This is so we can discover if the</div><div class='del'>-	 * page is fully mapped-to-disk.</div><div class='del'>-	 */</div><div class='del'>-	for (block_start = 0, block_in_page = 0, bh = head;</div><div class='del'>-		  block_start &lt; PAGE_SIZE;</div><div class='del'>-		  block_in_page++, block_start += blocksize, bh = bh-&gt;b_this_page) {</div><div class='del'>-		int create;</div><div class='del'>-</div><div class='del'>-		block_end = block_start + blocksize;</div><div class='del'>-		bh-&gt;b_state = 0;</div><div class='del'>-		create = 1;</div><div class='del'>-		if (block_start &gt;= to)</div><div class='del'>-			create = 0;</div><div class='del'>-		ret = get_block(inode, block_in_file + block_in_page,</div><div class='del'>-					bh, create);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto failed;</div><div class='del'>-		if (!buffer_mapped(bh))</div><div class='del'>-			is_mapped_to_disk = 0;</div><div class='del'>-		if (buffer_new(bh))</div><div class='del'>-			clean_bdev_bh_alias(bh);</div><div class='del'>-		if (PageUptodate(page)) {</div><div class='del'>-			set_buffer_uptodate(bh);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-		if (buffer_new(bh) || !buffer_mapped(bh)) {</div><div class='del'>-			zero_user_segments(page, block_start, from,</div><div class='del'>-							to, block_end);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-		if (buffer_uptodate(bh))</div><div class='del'>-			continue;	/* reiserfs does this */</div><div class='del'>-		if (block_start &lt; from || block_end &gt; to) {</div><div class='del'>-			lock_buffer(bh);</div><div class='del'>-			bh-&gt;b_end_io = end_buffer_read_nobh;</div><div class='del'>-			submit_bh(REQ_OP_READ, 0, bh);</div><div class='del'>-			nr_reads++;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (nr_reads) {</div><div class='del'>-		/*</div><div class='del'>-		 * The page is locked, so these buffers are protected from</div><div class='del'>-		 * any VM or truncate activity.  Hence we don't need to care</div><div class='del'>-		 * for the buffer_head refcounts.</div><div class='del'>-		 */</div><div class='del'>-		for (bh = head; bh; bh = bh-&gt;b_this_page) {</div><div class='del'>-			wait_on_buffer(bh);</div><div class='del'>-			if (!buffer_uptodate(bh))</div><div class='del'>-				ret = -EIO;</div><div class='del'>-		}</div><div class='del'>-		if (ret)</div><div class='del'>-			goto failed;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (is_mapped_to_disk)</div><div class='del'>-		SetPageMappedToDisk(page);</div><div class='del'>-</div><div class='del'>-	*fsdata = head; /* to be released by nobh_write_end */</div><div class='add'>+	block_commit_write(folio, 0, end);</div><div class='ctx'> </div><div class='add'>+	folio_mark_dirty(folio);</div><div class='add'>+	folio_wait_stable(folio);</div><div class='ctx'> 	return 0;</div><div class='del'>-</div><div class='del'>-failed:</div><div class='del'>-	BUG_ON(!ret);</div><div class='del'>-	/*</div><div class='del'>-	 * Error recovery is a bit difficult. We need to zero out blocks that</div><div class='del'>-	 * were newly allocated, and dirty them to ensure they get written out.</div><div class='del'>-	 * Buffers need to be attached to the page at this point, otherwise</div><div class='del'>-	 * the handling of potential IO errors during writeout would be hard</div><div class='del'>-	 * (could try doing synchronous writeout, but what if that fails too?)</div><div class='del'>-	 */</div><div class='del'>-	attach_nobh_buffers(page, head);</div><div class='del'>-	page_zero_new_buffers(page, from, to);</div><div class='del'>-</div><div class='del'>-out_release:</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='del'>-	*pagep = NULL;</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(nobh_write_begin);</div><div class='del'>-</div><div class='del'>-int nobh_write_end(struct file *file, struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned copied,</div><div class='del'>-			struct page *page, void *fsdata)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-	struct buffer_head *head = fsdata;</div><div class='del'>-	struct buffer_head *bh;</div><div class='del'>-	BUG_ON(fsdata != NULL &amp;&amp; page_has_buffers(page));</div><div class='del'>-</div><div class='del'>-	if (unlikely(copied &lt; len) &amp;&amp; head)</div><div class='del'>-		attach_nobh_buffers(page, head);</div><div class='del'>-	if (page_has_buffers(page))</div><div class='del'>-		return generic_write_end(file, mapping, pos, len,</div><div class='del'>-					copied, page, fsdata);</div><div class='del'>-</div><div class='del'>-	SetPageUptodate(page);</div><div class='del'>-	set_page_dirty(page);</div><div class='del'>-	if (pos+copied &gt; inode-&gt;i_size) {</div><div class='del'>-		i_size_write(inode, pos+copied);</div><div class='del'>-		mark_inode_dirty(inode);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='del'>-</div><div class='del'>-	while (head) {</div><div class='del'>-		bh = head;</div><div class='del'>-		head = head-&gt;b_this_page;</div><div class='del'>-		free_buffer_head(bh);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return copied;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(nobh_write_end);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * nobh_writepage() - based on block_full_write_page() except</div><div class='del'>- * that it tries to operate without attaching bufferheads to</div><div class='del'>- * the page.</div><div class='del'>- */</div><div class='del'>-int nobh_writepage(struct page *page, get_block_t *get_block,</div><div class='del'>-			struct writeback_control *wbc)</div><div class='del'>-{</div><div class='del'>-	struct inode * const inode = page-&gt;mapping-&gt;host;</div><div class='del'>-	loff_t i_size = i_size_read(inode);</div><div class='del'>-	const pgoff_t end_index = i_size &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	unsigned offset;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	/* Is the page fully inside i_size? */</div><div class='del'>-	if (page-&gt;index &lt; end_index)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	/* Is the page fully outside i_size? (truncate in progress) */</div><div class='del'>-	offset = i_size &amp; (PAGE_SIZE-1);</div><div class='del'>-	if (page-&gt;index &gt;= end_index+1 || !offset) {</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		return 0; /* don't care */</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * The page straddles i_size.  It must be zeroed out on each and every</div><div class='del'>-	 * writepage invocation because it may be mmapped.  "A file is mapped</div><div class='del'>-	 * in multiples of the page size.  For a file that is not a multiple of</div><div class='del'>-	 * the  page size, the remaining memory is zeroed when mapped, and</div><div class='del'>-	 * writes to that region are not written out to the file."</div><div class='del'>-	 */</div><div class='del'>-	zero_user_segment(page, offset, PAGE_SIZE);</div><div class='del'>-out:</div><div class='del'>-	ret = mpage_writepage(page, get_block, wbc);</div><div class='del'>-	if (ret == -EAGAIN)</div><div class='del'>-		ret = __block_write_full_page(inode, page, get_block, wbc,</div><div class='del'>-					      end_buffer_async_write);</div><div class='add'>+out_unlock:</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(nobh_writepage);</div><div class='del'>-</div><div class='del'>-int nobh_truncate_page(struct address_space *mapping,</div><div class='del'>-			loff_t from, get_block_t *get_block)</div><div class='del'>-{</div><div class='del'>-	pgoff_t index = from &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	unsigned offset = from &amp; (PAGE_SIZE-1);</div><div class='del'>-	unsigned blocksize;</div><div class='del'>-	sector_t iblock;</div><div class='del'>-	unsigned length, pos;</div><div class='del'>-	struct inode *inode = mapping-&gt;host;</div><div class='del'>-	struct page *page;</div><div class='del'>-	struct buffer_head map_bh;</div><div class='del'>-	int err;</div><div class='del'>-</div><div class='del'>-	blocksize = i_blocksize(inode);</div><div class='del'>-	length = offset &amp; (blocksize - 1);</div><div class='del'>-</div><div class='del'>-	/* Block boundary? Nothing to do */</div><div class='del'>-	if (!length)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	length = blocksize - length;</div><div class='del'>-	iblock = (sector_t)index &lt;&lt; (PAGE_SHIFT - inode-&gt;i_blkbits);</div><div class='del'>-</div><div class='del'>-	page = grab_cache_page(mapping, index);</div><div class='del'>-	err = -ENOMEM;</div><div class='del'>-	if (!page)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	if (page_has_buffers(page)) {</div><div class='del'>-has_buffers:</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		put_page(page);</div><div class='del'>-		return block_truncate_page(mapping, from, get_block);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Find the buffer that contains "offset" */</div><div class='del'>-	pos = blocksize;</div><div class='del'>-	while (offset &gt;= pos) {</div><div class='del'>-		iblock++;</div><div class='del'>-		pos += blocksize;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	map_bh.b_size = blocksize;</div><div class='del'>-	map_bh.b_state = 0;</div><div class='del'>-	err = get_block(inode, iblock, &amp;map_bh, 0);</div><div class='del'>-	if (err)</div><div class='del'>-		goto unlock;</div><div class='del'>-	/* unmapped? It's a hole - nothing to do */</div><div class='del'>-	if (!buffer_mapped(&amp;map_bh))</div><div class='del'>-		goto unlock;</div><div class='del'>-</div><div class='del'>-	/* Ok, it's mapped. Make sure it's up-to-date */</div><div class='del'>-	if (!PageUptodate(page)) {</div><div class='del'>-		err = mapping-&gt;a_ops-&gt;readpage(NULL, page);</div><div class='del'>-		if (err) {</div><div class='del'>-			put_page(page);</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		lock_page(page);</div><div class='del'>-		if (!PageUptodate(page)) {</div><div class='del'>-			err = -EIO;</div><div class='del'>-			goto unlock;</div><div class='del'>-		}</div><div class='del'>-		if (page_has_buffers(page))</div><div class='del'>-			goto has_buffers;</div><div class='del'>-	}</div><div class='del'>-	zero_user(page, offset, length);</div><div class='del'>-	set_page_dirty(page);</div><div class='del'>-	err = 0;</div><div class='del'>-</div><div class='del'>-unlock:</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='del'>-out:</div><div class='del'>-	return err;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(nobh_truncate_page);</div><div class='add'>+EXPORT_SYMBOL(block_page_mkwrite);</div><div class='ctx'> </div><div class='ctx'> int block_truncate_page(struct address_space *mapping,</div><div class='ctx'> 			loff_t from, get_block_t *get_block)</div><div class='ctx'> {</div><div class='ctx'> 	pgoff_t index = from &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	unsigned offset = from &amp; (PAGE_SIZE-1);</div><div class='ctx'> 	unsigned blocksize;</div><div class='ctx'> 	sector_t iblock;</div><div class='del'>-	unsigned length, pos;</div><div class='add'>+	size_t offset, length, pos;</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='del'>-	int err;</div><div class='add'>+	int err = 0;</div><div class='ctx'> </div><div class='ctx'> 	blocksize = i_blocksize(inode);</div><div class='del'>-	length = offset &amp; (blocksize - 1);</div><div class='add'>+	length = from &amp; (blocksize - 1);</div><div class='ctx'> </div><div class='ctx'> 	/* Block boundary? Nothing to do */</div><div class='ctx'> 	if (!length)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	length = blocksize - length;</div><div class='del'>-	iblock = (sector_t)index &lt;&lt; (PAGE_SHIFT - inode-&gt;i_blkbits);</div><div class='del'>-	</div><div class='del'>-	page = grab_cache_page(mapping, index);</div><div class='del'>-	err = -ENOMEM;</div><div class='del'>-	if (!page)</div><div class='del'>-		goto out;</div><div class='add'>+	iblock = ((loff_t)index * PAGE_SIZE) &gt;&gt; inode-&gt;i_blkbits;</div><div class='add'>+</div><div class='add'>+	folio = filemap_grab_folio(mapping, index);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio);</div><div class='ctx'> </div><div class='del'>-	if (!page_has_buffers(page))</div><div class='del'>-		create_empty_buffers(page, blocksize, 0);</div><div class='add'>+	bh = folio_buffers(folio);</div><div class='add'>+	if (!bh)</div><div class='add'>+		bh = create_empty_buffers(folio, blocksize, 0);</div><div class='ctx'> </div><div class='ctx'> 	/* Find the buffer that contains "offset" */</div><div class='del'>-	bh = page_buffers(page);</div><div class='add'>+	offset = offset_in_folio(folio, from);</div><div class='ctx'> 	pos = blocksize;</div><div class='ctx'> 	while (offset &gt;= pos) {</div><div class='ctx'> 		bh = bh-&gt;b_this_page;</div><div class='hunk'>@@ -2910,7 +2690,6 @@ int block_truncate_page(struct address_space *mapping,</div><div class='ctx'> 		pos += blocksize;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = 0;</div><div class='ctx'> 	if (!buffer_mapped(bh)) {</div><div class='ctx'> 		WARN_ON(bh-&gt;b_size != blocksize);</div><div class='ctx'> 		err = get_block(inode, iblock, bh, 0);</div><div class='hunk'>@@ -2922,65 +2701,57 @@ int block_truncate_page(struct address_space *mapping,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Ok, it's mapped. Make sure it's up-to-date */</div><div class='del'>-	if (PageUptodate(page))</div><div class='add'>+	if (folio_test_uptodate(folio))</div><div class='ctx'> 		set_buffer_uptodate(bh);</div><div class='ctx'> </div><div class='ctx'> 	if (!buffer_uptodate(bh) &amp;&amp; !buffer_delay(bh) &amp;&amp; !buffer_unwritten(bh)) {</div><div class='del'>-		err = -EIO;</div><div class='del'>-		ll_rw_block(REQ_OP_READ, 0, 1, &amp;bh);</div><div class='del'>-		wait_on_buffer(bh);</div><div class='add'>+		err = bh_read(bh, 0);</div><div class='ctx'> 		/* Uhhuh. Read error. Complain and punt. */</div><div class='del'>-		if (!buffer_uptodate(bh))</div><div class='add'>+		if (err &lt; 0)</div><div class='ctx'> 			goto unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	zero_user(page, offset, length);</div><div class='add'>+	folio_zero_range(folio, offset, length);</div><div class='ctx'> 	mark_buffer_dirty(bh);</div><div class='del'>-	err = 0;</div><div class='ctx'> </div><div class='ctx'> unlock:</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='del'>-out:</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='add'>+</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(block_truncate_page);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * The generic -&gt;writepage function for buffer-backed address_spaces</div><div class='add'>+ * The generic write folio function for buffer-backed address_spaces</div><div class='ctx'>  */</div><div class='del'>-int block_write_full_page(struct page *page, get_block_t *get_block,</div><div class='del'>-			struct writeback_control *wbc)</div><div class='add'>+int block_write_full_folio(struct folio *folio, struct writeback_control *wbc,</div><div class='add'>+		void *get_block)</div><div class='ctx'> {</div><div class='del'>-	struct inode * const inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode * const inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	loff_t i_size = i_size_read(inode);</div><div class='del'>-	const pgoff_t end_index = i_size &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	unsigned offset;</div><div class='del'>-</div><div class='del'>-	/* Is the page fully inside i_size? */</div><div class='del'>-	if (page-&gt;index &lt; end_index)</div><div class='del'>-		return __block_write_full_page(inode, page, get_block, wbc,</div><div class='del'>-					       end_buffer_async_write);</div><div class='del'>-</div><div class='del'>-	/* Is the page fully outside i_size? (truncate in progress) */</div><div class='del'>-	offset = i_size &amp; (PAGE_SIZE-1);</div><div class='del'>-	if (page-&gt;index &gt;= end_index+1 || !offset) {</div><div class='del'>-		unlock_page(page);</div><div class='add'>+</div><div class='add'>+	/* Is the folio fully inside i_size? */</div><div class='add'>+	if (folio_next_pos(folio) &lt;= i_size)</div><div class='add'>+		return __block_write_full_folio(inode, folio, get_block, wbc);</div><div class='add'>+</div><div class='add'>+	/* Is the folio fully outside i_size? (truncate in progress) */</div><div class='add'>+	if (folio_pos(folio) &gt;= i_size) {</div><div class='add'>+		folio_unlock(folio);</div><div class='ctx'> 		return 0; /* don't care */</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * The page straddles i_size.  It must be zeroed out on each and every</div><div class='del'>-	 * writepage invocation because it may be mmapped.  "A file is mapped</div><div class='add'>+	 * The folio straddles i_size.  It must be zeroed out on each and every</div><div class='add'>+	 * writeback invocation because it may be mmapped.  "A file is mapped</div><div class='ctx'> 	 * in multiples of the page size.  For a file that is not a multiple of</div><div class='del'>-	 * the  page size, the remaining memory is zeroed when mapped, and</div><div class='add'>+	 * the page size, the remaining memory is zeroed when mapped, and</div><div class='ctx'> 	 * writes to that region are not written out to the file."</div><div class='ctx'> 	 */</div><div class='del'>-	zero_user_segment(page, offset, PAGE_SIZE);</div><div class='del'>-	return __block_write_full_page(inode, page, get_block, wbc,</div><div class='del'>-							end_buffer_async_write);</div><div class='add'>+	folio_zero_segment(folio, offset_in_folio(folio, i_size),</div><div class='add'>+			folio_size(folio));</div><div class='add'>+	return __block_write_full_folio(inode, folio, get_block, wbc);</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(block_write_full_page);</div><div class='ctx'> </div><div class='ctx'> sector_t generic_block_bmap(struct address_space *mapping, sector_t block,</div><div class='ctx'> 			    get_block_t *get_block)</div><div class='hunk'>@@ -3006,9 +2777,11 @@ static void end_bio_bh_io_sync(struct bio *bio)</div><div class='ctx'> 	bio_put(bio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int submit_bh_wbc(int op, int op_flags, struct buffer_head *bh,</div><div class='del'>-			 enum rw_hint write_hint, struct writeback_control *wbc)</div><div class='add'>+static void submit_bh_wbc(blk_opf_t opf, struct buffer_head *bh,</div><div class='add'>+			  enum rw_hint write_hint,</div><div class='add'>+			  struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='add'>+	const enum req_op op = opf &amp; REQ_OP_MASK;</div><div class='ctx'> 	struct bio *bio;</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(!buffer_locked(bh));</div><div class='hunk'>@@ -3023,100 +2796,41 @@ static int submit_bh_wbc(int op, int op_flags, struct buffer_head *bh,</div><div class='ctx'> 	if (test_set_buffer_req(bh) &amp;&amp; (op == REQ_OP_WRITE))</div><div class='ctx'> 		clear_buffer_write_io_error(bh);</div><div class='ctx'> </div><div class='del'>-	bio = bio_alloc(GFP_NOIO, 1);</div><div class='add'>+	if (buffer_meta(bh))</div><div class='add'>+		opf |= REQ_META;</div><div class='add'>+	if (buffer_prio(bh))</div><div class='add'>+		opf |= REQ_PRIO;</div><div class='add'>+</div><div class='add'>+	bio = bio_alloc(bh-&gt;b_bdev, 1, opf, GFP_NOIO);</div><div class='ctx'> </div><div class='ctx'> 	fscrypt_set_bio_crypt_ctx_bh(bio, bh, GFP_NOIO);</div><div class='ctx'> </div><div class='ctx'> 	bio-&gt;bi_iter.bi_sector = bh-&gt;b_blocknr * (bh-&gt;b_size &gt;&gt; 9);</div><div class='del'>-	bio_set_dev(bio, bh-&gt;b_bdev);</div><div class='ctx'> 	bio-&gt;bi_write_hint = write_hint;</div><div class='ctx'> </div><div class='del'>-	bio_add_page(bio, bh-&gt;b_page, bh-&gt;b_size, bh_offset(bh));</div><div class='del'>-	BUG_ON(bio-&gt;bi_iter.bi_size != bh-&gt;b_size);</div><div class='add'>+	bio_add_folio_nofail(bio, bh-&gt;b_folio, bh-&gt;b_size, bh_offset(bh));</div><div class='ctx'> </div><div class='ctx'> 	bio-&gt;bi_end_io = end_bio_bh_io_sync;</div><div class='ctx'> 	bio-&gt;bi_private = bh;</div><div class='ctx'> </div><div class='del'>-	if (buffer_meta(bh))</div><div class='del'>-		op_flags |= REQ_META;</div><div class='del'>-	if (buffer_prio(bh))</div><div class='del'>-		op_flags |= REQ_PRIO;</div><div class='del'>-	bio_set_op_attrs(bio, op, op_flags);</div><div class='del'>-</div><div class='ctx'> 	/* Take care of bh's that straddle the end of the device */</div><div class='ctx'> 	guard_bio_eod(bio);</div><div class='ctx'> </div><div class='ctx'> 	if (wbc) {</div><div class='ctx'> 		wbc_init_bio(wbc, bio);</div><div class='del'>-		wbc_account_cgroup_owner(wbc, bh-&gt;b_page, bh-&gt;b_size);</div><div class='add'>+		wbc_account_cgroup_owner(wbc, bh-&gt;b_folio, bh-&gt;b_size);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	submit_bio(bio);</div><div class='del'>-	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int submit_bh(int op, int op_flags, struct buffer_head *bh)</div><div class='add'>+void submit_bh(blk_opf_t opf, struct buffer_head *bh)</div><div class='ctx'> {</div><div class='del'>-	return submit_bh_wbc(op, op_flags, bh, 0, NULL);</div><div class='add'>+	submit_bh_wbc(opf, bh, WRITE_LIFE_NOT_SET, NULL);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(submit_bh);</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * ll_rw_block: low-level access to block devices (DEPRECATED)</div><div class='del'>- * @op: whether to %READ or %WRITE</div><div class='del'>- * @op_flags: req_flag_bits</div><div class='del'>- * @nr: number of &amp;struct buffer_heads in the array</div><div class='del'>- * @bhs: array of pointers to &amp;struct buffer_head</div><div class='del'>- *</div><div class='del'>- * ll_rw_block() takes an array of pointers to &amp;struct buffer_heads, and</div><div class='del'>- * requests an I/O operation on them, either a %REQ_OP_READ or a %REQ_OP_WRITE.</div><div class='del'>- * @op_flags contains flags modifying the detailed I/O behavior, most notably</div><div class='del'>- * %REQ_RAHEAD.</div><div class='del'>- *</div><div class='del'>- * This function drops any buffer that it cannot get a lock on (with the</div><div class='del'>- * BH_Lock state bit), any buffer that appears to be clean when doing a write</div><div class='del'>- * request, and any buffer that appears to be up-to-date when doing read</div><div class='del'>- * request.  Further it marks as clean buffers that are processed for</div><div class='del'>- * writing (the buffer cache won't assume that they are actually clean</div><div class='del'>- * until the buffer gets unlocked).</div><div class='del'>- *</div><div class='del'>- * ll_rw_block sets b_end_io to simple completion handler that marks</div><div class='del'>- * the buffer up-to-date (if appropriate), unlocks the buffer and wakes</div><div class='del'>- * any waiters. </div><div class='del'>- *</div><div class='del'>- * All of the buffers must be for the same device, and must also be a</div><div class='del'>- * multiple of the current approved size for the device.</div><div class='del'>- */</div><div class='del'>-void ll_rw_block(int op, int op_flags,  int nr, struct buffer_head *bhs[])</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; nr; i++) {</div><div class='del'>-		struct buffer_head *bh = bhs[i];</div><div class='del'>-</div><div class='del'>-		if (!trylock_buffer(bh))</div><div class='del'>-			continue;</div><div class='del'>-		if (op == WRITE) {</div><div class='del'>-			if (test_clear_buffer_dirty(bh)) {</div><div class='del'>-				bh-&gt;b_end_io = end_buffer_write_sync;</div><div class='del'>-				get_bh(bh);</div><div class='del'>-				submit_bh(op, op_flags, bh);</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='del'>-		} else {</div><div class='del'>-			if (!buffer_uptodate(bh)) {</div><div class='del'>-				bh-&gt;b_end_io = end_buffer_read_sync;</div><div class='del'>-				get_bh(bh);</div><div class='del'>-				submit_bh(op, op_flags, bh);</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-		unlock_buffer(bh);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(ll_rw_block);</div><div class='del'>-</div><div class='del'>-void write_dirty_buffer(struct buffer_head *bh, int op_flags)</div><div class='add'>+void write_dirty_buffer(struct buffer_head *bh, blk_opf_t op_flags)</div><div class='ctx'> {</div><div class='ctx'> 	lock_buffer(bh);</div><div class='ctx'> 	if (!test_clear_buffer_dirty(bh)) {</div><div class='hunk'>@@ -3125,7 +2839,7 @@ void write_dirty_buffer(struct buffer_head *bh, int op_flags)</div><div class='ctx'> 	}</div><div class='ctx'> 	bh-&gt;b_end_io = end_buffer_write_sync;</div><div class='ctx'> 	get_bh(bh);</div><div class='del'>-	submit_bh(REQ_OP_WRITE, op_flags, bh);</div><div class='add'>+	submit_bh(REQ_OP_WRITE | op_flags, bh);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(write_dirty_buffer);</div><div class='ctx'> </div><div class='hunk'>@@ -3134,10 +2848,8 @@ EXPORT_SYMBOL(write_dirty_buffer);</div><div class='ctx'>  * and then start new I/O and then wait upon it.  The caller must have a ref on</div><div class='ctx'>  * the buffer_head.</div><div class='ctx'>  */</div><div class='del'>-int __sync_dirty_buffer(struct buffer_head *bh, int op_flags)</div><div class='add'>+int __sync_dirty_buffer(struct buffer_head *bh, blk_opf_t op_flags)</div><div class='ctx'> {</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='ctx'> 	WARN_ON(atomic_read(&amp;bh-&gt;b_count) &lt; 1);</div><div class='ctx'> 	lock_buffer(bh);</div><div class='ctx'> 	if (test_clear_buffer_dirty(bh)) {</div><div class='hunk'>@@ -3152,14 +2864,14 @@ int __sync_dirty_buffer(struct buffer_head *bh, int op_flags)</div><div class='ctx'> </div><div class='ctx'> 		get_bh(bh);</div><div class='ctx'> 		bh-&gt;b_end_io = end_buffer_write_sync;</div><div class='del'>-		ret = submit_bh(REQ_OP_WRITE, op_flags, bh);</div><div class='add'>+		submit_bh(REQ_OP_WRITE | op_flags, bh);</div><div class='ctx'> 		wait_on_buffer(bh);</div><div class='del'>-		if (!ret &amp;&amp; !buffer_uptodate(bh))</div><div class='del'>-			ret = -EIO;</div><div class='add'>+		if (!buffer_uptodate(bh))</div><div class='add'>+			return -EIO;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		unlock_buffer(bh);</div><div class='ctx'> 	}</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(__sync_dirty_buffer);</div><div class='ctx'> </div><div class='hunk'>@@ -3169,36 +2881,16 @@ int sync_dirty_buffer(struct buffer_head *bh)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(sync_dirty_buffer);</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * try_to_free_buffers() checks if all the buffers on this particular page</div><div class='del'>- * are unused, and releases them if so.</div><div class='del'>- *</div><div class='del'>- * Exclusion against try_to_free_buffers may be obtained by either</div><div class='del'>- * locking the page or by holding its mapping's private_lock.</div><div class='del'>- *</div><div class='del'>- * If the page is dirty but all the buffers are clean then we need to</div><div class='del'>- * be sure to mark the page clean as well.  This is because the page</div><div class='del'>- * may be against a block device, and a later reattachment of buffers</div><div class='del'>- * to a dirty page will set *all* buffers dirty.  Which would corrupt</div><div class='del'>- * filesystem data on the same device.</div><div class='del'>- *</div><div class='del'>- * The same applies to regular filesystem pages: if all the buffers are</div><div class='del'>- * clean then we set the page clean and proceed.  To do that, we require</div><div class='del'>- * total exclusion from __set_page_dirty_buffers().  That is obtained with</div><div class='del'>- * private_lock.</div><div class='del'>- *</div><div class='del'>- * try_to_free_buffers() is non-blocking.</div><div class='del'>- */</div><div class='ctx'> static inline int buffer_busy(struct buffer_head *bh)</div><div class='ctx'> {</div><div class='ctx'> 	return atomic_read(&amp;bh-&gt;b_count) |</div><div class='ctx'> 		(bh-&gt;b_state &amp; ((1 &lt;&lt; BH_Dirty) | (1 &lt;&lt; BH_Lock)));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int</div><div class='del'>-drop_buffers(struct page *page, struct buffer_head **buffers_to_free)</div><div class='add'>+static bool</div><div class='add'>+drop_buffers(struct folio *folio, struct buffer_head **buffers_to_free)</div><div class='ctx'> {</div><div class='del'>-	struct buffer_head *head = page_buffers(page);</div><div class='add'>+	struct buffer_head *head = folio_buffers(folio);</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> </div><div class='ctx'> 	bh = head;</div><div class='hunk'>@@ -3216,47 +2908,71 @@ drop_buffers(struct page *page, struct buffer_head **buffers_to_free)</div><div class='ctx'> 		bh = next;</div><div class='ctx'> 	} while (bh != head);</div><div class='ctx'> 	*buffers_to_free = head;</div><div class='del'>-	detach_page_private(page);</div><div class='del'>-	return 1;</div><div class='add'>+	folio_detach_private(folio);</div><div class='add'>+	return true;</div><div class='ctx'> failed:</div><div class='del'>-	return 0;</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int try_to_free_buffers(struct page *page)</div><div class='add'>+/**</div><div class='add'>+ * try_to_free_buffers - Release buffers attached to this folio.</div><div class='add'>+ * @folio: The folio.</div><div class='add'>+ *</div><div class='add'>+ * If any buffers are in use (dirty, under writeback, elevated refcount),</div><div class='add'>+ * no buffers will be freed.</div><div class='add'>+ *</div><div class='add'>+ * If the folio is dirty but all the buffers are clean then we need to</div><div class='add'>+ * be sure to mark the folio clean as well.  This is because the folio</div><div class='add'>+ * may be against a block device, and a later reattachment of buffers</div><div class='add'>+ * to a dirty folio will set *all* buffers dirty.  Which would corrupt</div><div class='add'>+ * filesystem data on the same device.</div><div class='add'>+ *</div><div class='add'>+ * The same applies to regular filesystem folios: if all the buffers are</div><div class='add'>+ * clean then we set the folio clean and proceed.  To do that, we require</div><div class='add'>+ * total exclusion from block_dirty_folio().  That is obtained with</div><div class='add'>+ * i_private_lock.</div><div class='add'>+ *</div><div class='add'>+ * Exclusion against try_to_free_buffers may be obtained by either</div><div class='add'>+ * locking the folio or by holding its mapping's i_private_lock.</div><div class='add'>+ *</div><div class='add'>+ * Context: Process context.  @folio must be locked.  Will not sleep.</div><div class='add'>+ * Return: true if all buffers attached to this folio were freed.</div><div class='add'>+ */</div><div class='add'>+bool try_to_free_buffers(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct address_space * const mapping = page-&gt;mapping;</div><div class='add'>+	struct address_space * const mapping = folio-&gt;mapping;</div><div class='ctx'> 	struct buffer_head *buffers_to_free = NULL;</div><div class='del'>-	int ret = 0;</div><div class='add'>+	bool ret = 0;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(!PageLocked(page));</div><div class='del'>-	if (PageWriteback(page))</div><div class='del'>-		return 0;</div><div class='add'>+	BUG_ON(!folio_test_locked(folio));</div><div class='add'>+	if (folio_test_writeback(folio))</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	if (mapping == NULL) {		/* can this still happen? */</div><div class='del'>-		ret = drop_buffers(page, &amp;buffers_to_free);</div><div class='add'>+		ret = drop_buffers(folio, &amp;buffers_to_free);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;mapping-&gt;private_lock);</div><div class='del'>-	ret = drop_buffers(page, &amp;buffers_to_free);</div><div class='add'>+	spin_lock(&amp;mapping-&gt;i_private_lock);</div><div class='add'>+	ret = drop_buffers(folio, &amp;buffers_to_free);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If the filesystem writes its buffers by hand (eg ext3)</div><div class='del'>-	 * then we can have clean buffers against a dirty page.  We</div><div class='del'>-	 * clean the page here; otherwise the VM will never notice</div><div class='add'>+	 * then we can have clean buffers against a dirty folio.  We</div><div class='add'>+	 * clean the folio here; otherwise the VM will never notice</div><div class='ctx'> 	 * that the filesystem did any IO at all.</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * Also, during truncate, discard_buffer will have marked all</div><div class='del'>-	 * the page's buffers clean.  We discover that here and clean</div><div class='del'>-	 * the page also.</div><div class='add'>+	 * the folio's buffers clean.  We discover that here and clean</div><div class='add'>+	 * the folio also.</div><div class='ctx'> 	 *</div><div class='del'>-	 * private_lock must be held over this entire operation in order</div><div class='del'>-	 * to synchronise against __set_page_dirty_buffers and prevent the</div><div class='add'>+	 * i_private_lock must be held over this entire operation in order</div><div class='add'>+	 * to synchronise against block_dirty_folio and prevent the</div><div class='ctx'> 	 * dirty bit from being lost.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (ret)</div><div class='del'>-		cancel_dirty_page(page);</div><div class='del'>-	spin_unlock(&amp;mapping-&gt;private_lock);</div><div class='add'>+		folio_cancel_dirty(folio);</div><div class='add'>+	spin_unlock(&amp;mapping-&gt;i_private_lock);</div><div class='ctx'> out:</div><div class='ctx'> 	if (buffers_to_free) {</div><div class='ctx'> 		struct buffer_head *bh = buffers_to_free;</div><div class='hunk'>@@ -3274,13 +2990,13 @@ EXPORT_SYMBOL(try_to_free_buffers);</div><div class='ctx'> /*</div><div class='ctx'>  * Buffer-head allocation</div><div class='ctx'>  */</div><div class='del'>-static struct kmem_cache *bh_cachep __read_mostly;</div><div class='add'>+static struct kmem_cache *bh_cachep __ro_after_init;</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Once the number of bh's in the machine exceeds this level, we start</div><div class='ctx'>  * stripping them in writeback.</div><div class='ctx'>  */</div><div class='del'>-static unsigned long max_buffer_heads;</div><div class='add'>+static unsigned long max_buffer_heads __ro_after_init;</div><div class='ctx'> </div><div class='ctx'> int buffer_heads_over_limit;</div><div class='ctx'> </div><div class='hunk'>@@ -3364,41 +3080,77 @@ int bh_uptodate_or_lock(struct buffer_head *bh)</div><div class='ctx'> EXPORT_SYMBOL(bh_uptodate_or_lock);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * bh_submit_read - Submit a locked buffer for reading</div><div class='add'>+ * __bh_read - Submit read for a locked buffer</div><div class='ctx'>  * @bh: struct buffer_head</div><div class='add'>+ * @op_flags: appending REQ_OP_* flags besides REQ_OP_READ</div><div class='add'>+ * @wait: wait until reading finish</div><div class='ctx'>  *</div><div class='del'>- * Returns zero on success and -EIO on error.</div><div class='add'>+ * Returns zero on success or don't wait, and -EIO on error.</div><div class='ctx'>  */</div><div class='del'>-int bh_submit_read(struct buffer_head *bh)</div><div class='add'>+int __bh_read(struct buffer_head *bh, blk_opf_t op_flags, bool wait)</div><div class='ctx'> {</div><div class='del'>-	BUG_ON(!buffer_locked(bh));</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	if (buffer_uptodate(bh)) {</div><div class='del'>-		unlock_buffer(bh);</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='add'>+	BUG_ON(!buffer_locked(bh));</div><div class='ctx'> </div><div class='ctx'> 	get_bh(bh);</div><div class='ctx'> 	bh-&gt;b_end_io = end_buffer_read_sync;</div><div class='del'>-	submit_bh(REQ_OP_READ, 0, bh);</div><div class='del'>-	wait_on_buffer(bh);</div><div class='del'>-	if (buffer_uptodate(bh))</div><div class='del'>-		return 0;</div><div class='del'>-	return -EIO;</div><div class='add'>+	submit_bh(REQ_OP_READ | op_flags, bh);</div><div class='add'>+	if (wait) {</div><div class='add'>+		wait_on_buffer(bh);</div><div class='add'>+		if (!buffer_uptodate(bh))</div><div class='add'>+			ret = -EIO;</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(__bh_read);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * __bh_read_batch - Submit read for a batch of unlocked buffers</div><div class='add'>+ * @nr: entry number of the buffer batch</div><div class='add'>+ * @bhs: a batch of struct buffer_head</div><div class='add'>+ * @op_flags: appending REQ_OP_* flags besides REQ_OP_READ</div><div class='add'>+ * @force_lock: force to get a lock on the buffer if set, otherwise drops any</div><div class='add'>+ *              buffer that cannot lock.</div><div class='add'>+ *</div><div class='add'>+ * Returns zero on success or don't wait, and -EIO on error.</div><div class='add'>+ */</div><div class='add'>+void __bh_read_batch(int nr, struct buffer_head *bhs[],</div><div class='add'>+		     blk_opf_t op_flags, bool force_lock)</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; nr; i++) {</div><div class='add'>+		struct buffer_head *bh = bhs[i];</div><div class='add'>+</div><div class='add'>+		if (buffer_uptodate(bh))</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		if (force_lock)</div><div class='add'>+			lock_buffer(bh);</div><div class='add'>+		else</div><div class='add'>+			if (!trylock_buffer(bh))</div><div class='add'>+				continue;</div><div class='add'>+</div><div class='add'>+		if (buffer_uptodate(bh)) {</div><div class='add'>+			unlock_buffer(bh);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		bh-&gt;b_end_io = end_buffer_read_sync;</div><div class='add'>+		get_bh(bh);</div><div class='add'>+		submit_bh(REQ_OP_READ | op_flags, bh);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(bh_submit_read);</div><div class='add'>+EXPORT_SYMBOL(__bh_read_batch);</div><div class='ctx'> </div><div class='ctx'> void __init buffer_init(void)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned long nrpages;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	bh_cachep = kmem_cache_create("buffer_head",</div><div class='del'>-			sizeof(struct buffer_head), 0,</div><div class='del'>-				(SLAB_RECLAIM_ACCOUNT|SLAB_PANIC|</div><div class='del'>-				SLAB_MEM_SPREAD),</div><div class='del'>-				NULL);</div><div class='del'>-</div><div class='add'>+	bh_cachep = KMEM_CACHE(buffer_head,</div><div class='add'>+				SLAB_RECLAIM_ACCOUNT|SLAB_PANIC);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Limit the bh occupancy to 10% of ZONE_NORMAL</div><div class='ctx'> 	 */</div><div class='head'>diff --git a/fs/cachefiles/Kconfig b/fs/cachefiles/Kconfig<br/>index 6827b40f7ddc..c5a070550ee3 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cachefiles/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/cachefiles/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/cachefiles/Kconfig</a></div><div class='hunk'>@@ -2,7 +2,7 @@</div><div class='ctx'> </div><div class='ctx'> config CACHEFILES</div><div class='ctx'> 	tristate "Filesystem caching on files"</div><div class='del'>-	depends on FSCACHE &amp;&amp; BLOCK</div><div class='add'>+	depends on NETFS_SUPPORT &amp;&amp; FSCACHE &amp;&amp; BLOCK</div><div class='ctx'> 	help</div><div class='ctx'> 	  This permits use of a mounted filesystem as a cache for other</div><div class='ctx'> 	  filesystems - primarily networking filesystems - thus allowing fast</div><div class='hunk'>@@ -19,3 +19,22 @@ config CACHEFILES_DEBUG</div><div class='ctx'> 	  caching on files module.  If this is set, the debugging output may be</div><div class='ctx'> 	  enabled by setting bits in /sys/modules/cachefiles/parameter/debug or</div><div class='ctx'> 	  by including a debugging specifier in /etc/cachefilesd.conf.</div><div class='add'>+</div><div class='add'>+config CACHEFILES_ERROR_INJECTION</div><div class='add'>+	bool "Provide error injection for cachefiles"</div><div class='add'>+	depends on CACHEFILES &amp;&amp; SYSCTL</div><div class='add'>+	help</div><div class='add'>+	  This permits error injection to be enabled in cachefiles whilst a</div><div class='add'>+	  cache is in service.</div><div class='add'>+</div><div class='add'>+config CACHEFILES_ONDEMAND</div><div class='add'>+	bool "Support for on-demand read"</div><div class='add'>+	depends on CACHEFILES</div><div class='add'>+	default n</div><div class='add'>+	help</div><div class='add'>+	  This permits userspace to enable the cachefiles on-demand read mode.</div><div class='add'>+	  In this mode, when a cache miss occurs, responsibility for fetching</div><div class='add'>+	  the data lies with the cachefiles backend instead of with the netfs</div><div class='add'>+	  and is delegated to userspace.</div><div class='add'>+</div><div class='add'>+	  If unsure, say N.</div><div class='head'>diff --git a/fs/cachefiles/Makefile b/fs/cachefiles/Makefile<br/>index 02fd17731769..c37a7a9af10b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cachefiles/Makefile?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/Makefile</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/cachefiles/Makefile?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/cachefiles/Makefile</a></div><div class='hunk'>@@ -4,15 +4,18 @@</div><div class='ctx'> #</div><div class='ctx'> </div><div class='ctx'> cachefiles-y := \</div><div class='del'>-	bind.o \</div><div class='add'>+	cache.o \</div><div class='ctx'> 	daemon.o \</div><div class='ctx'> 	interface.o \</div><div class='ctx'> 	io.o \</div><div class='ctx'> 	key.o \</div><div class='ctx'> 	main.o \</div><div class='ctx'> 	namei.o \</div><div class='del'>-	rdwr.o \</div><div class='ctx'> 	security.o \</div><div class='add'>+	volume.o \</div><div class='ctx'> 	xattr.o</div><div class='ctx'> </div><div class='add'>+cachefiles-$(CONFIG_CACHEFILES_ERROR_INJECTION) += error_inject.o</div><div class='add'>+cachefiles-$(CONFIG_CACHEFILES_ONDEMAND) += ondemand.o</div><div class='add'>+</div><div class='ctx'> obj-$(CONFIG_CACHEFILES) := cachefiles.o</div><div class='head'>diff --git a/fs/cachefiles/bind.c b/fs/cachefiles/bind.c<br/>deleted file mode 100644<br/>index d463d89f5db8..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cachefiles/bind.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/bind.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,278 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='del'>-/* Bind and unbind a cache from the filesystem backing it</div><div class='del'>- *</div><div class='del'>- * Copyright (C) 2007 Red Hat, Inc. All Rights Reserved.</div><div class='del'>- * Written by David Howells (dhowells@redhat.com)</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#include &lt;linux/module.h&gt;</div><div class='del'>-#include &lt;linux/init.h&gt;</div><div class='del'>-#include &lt;linux/sched.h&gt;</div><div class='del'>-#include &lt;linux/completion.h&gt;</div><div class='del'>-#include &lt;linux/slab.h&gt;</div><div class='del'>-#include &lt;linux/fs.h&gt;</div><div class='del'>-#include &lt;linux/file.h&gt;</div><div class='del'>-#include &lt;linux/namei.h&gt;</div><div class='del'>-#include &lt;linux/mount.h&gt;</div><div class='del'>-#include &lt;linux/statfs.h&gt;</div><div class='del'>-#include &lt;linux/ctype.h&gt;</div><div class='del'>-#include &lt;linux/xattr.h&gt;</div><div class='del'>-#include "internal.h"</div><div class='del'>-</div><div class='del'>-static int cachefiles_daemon_add_cache(struct cachefiles_cache *caches);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * bind a directory as a cache</div><div class='del'>- */</div><div class='del'>-int cachefiles_daemon_bind(struct cachefiles_cache *cache, char *args)</div><div class='del'>-{</div><div class='del'>-	_enter("{%u,%u,%u,%u,%u,%u},%s",</div><div class='del'>-	       cache-&gt;frun_percent,</div><div class='del'>-	       cache-&gt;fcull_percent,</div><div class='del'>-	       cache-&gt;fstop_percent,</div><div class='del'>-	       cache-&gt;brun_percent,</div><div class='del'>-	       cache-&gt;bcull_percent,</div><div class='del'>-	       cache-&gt;bstop_percent,</div><div class='del'>-	       args);</div><div class='del'>-</div><div class='del'>-	/* start by checking things over */</div><div class='del'>-	ASSERT(cache-&gt;fstop_percent &gt;= 0 &amp;&amp;</div><div class='del'>-	       cache-&gt;fstop_percent &lt; cache-&gt;fcull_percent &amp;&amp;</div><div class='del'>-	       cache-&gt;fcull_percent &lt; cache-&gt;frun_percent &amp;&amp;</div><div class='del'>-	       cache-&gt;frun_percent  &lt; 100);</div><div class='del'>-</div><div class='del'>-	ASSERT(cache-&gt;bstop_percent &gt;= 0 &amp;&amp;</div><div class='del'>-	       cache-&gt;bstop_percent &lt; cache-&gt;bcull_percent &amp;&amp;</div><div class='del'>-	       cache-&gt;bcull_percent &lt; cache-&gt;brun_percent &amp;&amp;</div><div class='del'>-	       cache-&gt;brun_percent  &lt; 100);</div><div class='del'>-</div><div class='del'>-	if (*args) {</div><div class='del'>-		pr_err("'bind' command doesn't take an argument\n");</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!cache-&gt;rootdirname) {</div><div class='del'>-		pr_err("No cache directory specified\n");</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* don't permit already bound caches to be re-bound */</div><div class='del'>-	if (test_bit(CACHEFILES_READY, &amp;cache-&gt;flags)) {</div><div class='del'>-		pr_err("Cache already bound\n");</div><div class='del'>-		return -EBUSY;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* make sure we have copies of the tag and dirname strings */</div><div class='del'>-	if (!cache-&gt;tag) {</div><div class='del'>-		/* the tag string is released by the fops-&gt;release()</div><div class='del'>-		 * function, so we don't release it on error here */</div><div class='del'>-		cache-&gt;tag = kstrdup("CacheFiles", GFP_KERNEL);</div><div class='del'>-		if (!cache-&gt;tag)</div><div class='del'>-			return -ENOMEM;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* add the cache */</div><div class='del'>-	return cachefiles_daemon_add_cache(cache);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * add a cache</div><div class='del'>- */</div><div class='del'>-static int cachefiles_daemon_add_cache(struct cachefiles_cache *cache)</div><div class='del'>-{</div><div class='del'>-	struct cachefiles_object *fsdef;</div><div class='del'>-	struct path path;</div><div class='del'>-	struct kstatfs stats;</div><div class='del'>-	struct dentry *graveyard, *cachedir, *root;</div><div class='del'>-	const struct cred *saved_cred;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	_enter("");</div><div class='del'>-</div><div class='del'>-	/* we want to work under the module's security ID */</div><div class='del'>-	ret = cachefiles_get_security_ID(cache);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	cachefiles_begin_secure(cache, &amp;saved_cred);</div><div class='del'>-</div><div class='del'>-	/* allocate the root index object */</div><div class='del'>-	ret = -ENOMEM;</div><div class='del'>-</div><div class='del'>-	fsdef = kmem_cache_alloc(cachefiles_object_jar, GFP_KERNEL);</div><div class='del'>-	if (!fsdef)</div><div class='del'>-		goto error_root_object;</div><div class='del'>-</div><div class='del'>-	ASSERTCMP(fsdef-&gt;backer, ==, NULL);</div><div class='del'>-</div><div class='del'>-	atomic_set(&amp;fsdef-&gt;usage, 1);</div><div class='del'>-	fsdef-&gt;type = FSCACHE_COOKIE_TYPE_INDEX;</div><div class='del'>-</div><div class='del'>-	/* look up the directory at the root of the cache */</div><div class='del'>-	ret = kern_path(cache-&gt;rootdirname, LOOKUP_DIRECTORY, &amp;path);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto error_open_root;</div><div class='del'>-</div><div class='del'>-	cache-&gt;mnt = path.mnt;</div><div class='del'>-	root = path.dentry;</div><div class='del'>-</div><div class='del'>-	ret = -EINVAL;</div><div class='del'>-	if (mnt_user_ns(path.mnt) != &amp;init_user_ns) {</div><div class='del'>-		pr_warn("File cache on idmapped mounts not supported");</div><div class='del'>-		goto error_unsupported;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* check parameters */</div><div class='del'>-	ret = -EOPNOTSUPP;</div><div class='del'>-	if (d_is_negative(root) ||</div><div class='del'>-	    !d_backing_inode(root)-&gt;i_op-&gt;lookup ||</div><div class='del'>-	    !d_backing_inode(root)-&gt;i_op-&gt;mkdir ||</div><div class='del'>-	    !(d_backing_inode(root)-&gt;i_opflags &amp; IOP_XATTR) ||</div><div class='del'>-	    !root-&gt;d_sb-&gt;s_op-&gt;statfs ||</div><div class='del'>-	    !root-&gt;d_sb-&gt;s_op-&gt;sync_fs)</div><div class='del'>-		goto error_unsupported;</div><div class='del'>-</div><div class='del'>-	ret = -EROFS;</div><div class='del'>-	if (sb_rdonly(root-&gt;d_sb))</div><div class='del'>-		goto error_unsupported;</div><div class='del'>-</div><div class='del'>-	/* determine the security of the on-disk cache as this governs</div><div class='del'>-	 * security ID of files we create */</div><div class='del'>-	ret = cachefiles_determine_cache_security(cache, root, &amp;saved_cred);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto error_unsupported;</div><div class='del'>-</div><div class='del'>-	/* get the cache size and blocksize */</div><div class='del'>-	ret = vfs_statfs(&amp;path, &amp;stats);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto error_unsupported;</div><div class='del'>-</div><div class='del'>-	ret = -ERANGE;</div><div class='del'>-	if (stats.f_bsize &lt;= 0)</div><div class='del'>-		goto error_unsupported;</div><div class='del'>-</div><div class='del'>-	ret = -EOPNOTSUPP;</div><div class='del'>-	if (stats.f_bsize &gt; PAGE_SIZE)</div><div class='del'>-		goto error_unsupported;</div><div class='del'>-</div><div class='del'>-	cache-&gt;bsize = stats.f_bsize;</div><div class='del'>-	cache-&gt;bshift = 0;</div><div class='del'>-	if (stats.f_bsize &lt; PAGE_SIZE)</div><div class='del'>-		cache-&gt;bshift = PAGE_SHIFT - ilog2(stats.f_bsize);</div><div class='del'>-</div><div class='del'>-	_debug("blksize %u (shift %u)",</div><div class='del'>-	       cache-&gt;bsize, cache-&gt;bshift);</div><div class='del'>-</div><div class='del'>-	_debug("size %llu, avail %llu",</div><div class='del'>-	       (unsigned long long) stats.f_blocks,</div><div class='del'>-	       (unsigned long long) stats.f_bavail);</div><div class='del'>-</div><div class='del'>-	/* set up caching limits */</div><div class='del'>-	do_div(stats.f_files, 100);</div><div class='del'>-	cache-&gt;fstop = stats.f_files * cache-&gt;fstop_percent;</div><div class='del'>-	cache-&gt;fcull = stats.f_files * cache-&gt;fcull_percent;</div><div class='del'>-	cache-&gt;frun  = stats.f_files * cache-&gt;frun_percent;</div><div class='del'>-</div><div class='del'>-	_debug("limits {%llu,%llu,%llu} files",</div><div class='del'>-	       (unsigned long long) cache-&gt;frun,</div><div class='del'>-	       (unsigned long long) cache-&gt;fcull,</div><div class='del'>-	       (unsigned long long) cache-&gt;fstop);</div><div class='del'>-</div><div class='del'>-	stats.f_blocks &gt;&gt;= cache-&gt;bshift;</div><div class='del'>-	do_div(stats.f_blocks, 100);</div><div class='del'>-	cache-&gt;bstop = stats.f_blocks * cache-&gt;bstop_percent;</div><div class='del'>-	cache-&gt;bcull = stats.f_blocks * cache-&gt;bcull_percent;</div><div class='del'>-	cache-&gt;brun  = stats.f_blocks * cache-&gt;brun_percent;</div><div class='del'>-</div><div class='del'>-	_debug("limits {%llu,%llu,%llu} blocks",</div><div class='del'>-	       (unsigned long long) cache-&gt;brun,</div><div class='del'>-	       (unsigned long long) cache-&gt;bcull,</div><div class='del'>-	       (unsigned long long) cache-&gt;bstop);</div><div class='del'>-</div><div class='del'>-	/* get the cache directory and check its type */</div><div class='del'>-	cachedir = cachefiles_get_directory(cache, root, "cache");</div><div class='del'>-	if (IS_ERR(cachedir)) {</div><div class='del'>-		ret = PTR_ERR(cachedir);</div><div class='del'>-		goto error_unsupported;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	fsdef-&gt;dentry = cachedir;</div><div class='del'>-	fsdef-&gt;fscache.cookie = NULL;</div><div class='del'>-</div><div class='del'>-	ret = cachefiles_check_object_type(fsdef);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto error_unsupported;</div><div class='del'>-</div><div class='del'>-	/* get the graveyard directory */</div><div class='del'>-	graveyard = cachefiles_get_directory(cache, root, "graveyard");</div><div class='del'>-	if (IS_ERR(graveyard)) {</div><div class='del'>-		ret = PTR_ERR(graveyard);</div><div class='del'>-		goto error_unsupported;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	cache-&gt;graveyard = graveyard;</div><div class='del'>-</div><div class='del'>-	/* publish the cache */</div><div class='del'>-	fscache_init_cache(&amp;cache-&gt;cache,</div><div class='del'>-			   &amp;cachefiles_cache_ops,</div><div class='del'>-			   "%s",</div><div class='del'>-			   fsdef-&gt;dentry-&gt;d_sb-&gt;s_id);</div><div class='del'>-</div><div class='del'>-	fscache_object_init(&amp;fsdef-&gt;fscache, &amp;fscache_fsdef_index,</div><div class='del'>-			    &amp;cache-&gt;cache);</div><div class='del'>-</div><div class='del'>-	ret = fscache_add_cache(&amp;cache-&gt;cache, &amp;fsdef-&gt;fscache, cache-&gt;tag);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto error_add_cache;</div><div class='del'>-</div><div class='del'>-	/* done */</div><div class='del'>-	set_bit(CACHEFILES_READY, &amp;cache-&gt;flags);</div><div class='del'>-	dput(root);</div><div class='del'>-</div><div class='del'>-	pr_info("File cache on %s registered\n", cache-&gt;cache.identifier);</div><div class='del'>-</div><div class='del'>-	/* check how much space the cache has */</div><div class='del'>-	cachefiles_has_space(cache, 0, 0);</div><div class='del'>-	cachefiles_end_secure(cache, saved_cred);</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-error_add_cache:</div><div class='del'>-	dput(cache-&gt;graveyard);</div><div class='del'>-	cache-&gt;graveyard = NULL;</div><div class='del'>-error_unsupported:</div><div class='del'>-	mntput(cache-&gt;mnt);</div><div class='del'>-	cache-&gt;mnt = NULL;</div><div class='del'>-	dput(fsdef-&gt;dentry);</div><div class='del'>-	fsdef-&gt;dentry = NULL;</div><div class='del'>-	dput(root);</div><div class='del'>-error_open_root:</div><div class='del'>-	kmem_cache_free(cachefiles_object_jar, fsdef);</div><div class='del'>-error_root_object:</div><div class='del'>-	cachefiles_end_secure(cache, saved_cred);</div><div class='del'>-	pr_err("Failed to register: %d\n", ret);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * unbind a cache on fd release</div><div class='del'>- */</div><div class='del'>-void cachefiles_daemon_unbind(struct cachefiles_cache *cache)</div><div class='del'>-{</div><div class='del'>-	_enter("");</div><div class='del'>-</div><div class='del'>-	if (test_bit(CACHEFILES_READY, &amp;cache-&gt;flags)) {</div><div class='del'>-		pr_info("File cache on %s unregistering\n",</div><div class='del'>-			cache-&gt;cache.identifier);</div><div class='del'>-</div><div class='del'>-		fscache_withdraw_cache(&amp;cache-&gt;cache);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	dput(cache-&gt;graveyard);</div><div class='del'>-	mntput(cache-&gt;mnt);</div><div class='del'>-</div><div class='del'>-	kfree(cache-&gt;rootdirname);</div><div class='del'>-	kfree(cache-&gt;secctx);</div><div class='del'>-	kfree(cache-&gt;tag);</div><div class='del'>-</div><div class='del'>-	_leave("");</div><div class='del'>-}</div><div class='head'>diff --git a/fs/cachefiles/cache.c b/fs/cachefiles/cache.c<br/>new file mode 100644<br/>index 000000000000..9fb06dc16520<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/cachefiles/cache.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/cachefiles/cache.c</a></div><div class='hunk'>@@ -0,0 +1,428 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='add'>+/* Manage high-level VFS aspects of a cache.</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2007, 2021 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/slab.h&gt;</div><div class='add'>+#include &lt;linux/statfs.h&gt;</div><div class='add'>+#include &lt;linux/namei.h&gt;</div><div class='add'>+#include &lt;trace/events/fscache.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Bring a cache online.</div><div class='add'>+ */</div><div class='add'>+int cachefiles_add_cache(struct cachefiles_cache *cache)</div><div class='add'>+{</div><div class='add'>+	struct fscache_cache *cache_cookie;</div><div class='add'>+	struct path path;</div><div class='add'>+	struct kstatfs stats;</div><div class='add'>+	struct dentry *graveyard, *cachedir, *root;</div><div class='add'>+	const struct cred *saved_cred;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	_enter("");</div><div class='add'>+</div><div class='add'>+	cache_cookie = fscache_acquire_cache(cache-&gt;tag);</div><div class='add'>+	if (IS_ERR(cache_cookie))</div><div class='add'>+		return PTR_ERR(cache_cookie);</div><div class='add'>+</div><div class='add'>+	/* we want to work under the module's security ID */</div><div class='add'>+	ret = cachefiles_get_security_ID(cache);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto error_getsec;</div><div class='add'>+</div><div class='add'>+	cachefiles_begin_secure(cache, &amp;saved_cred);</div><div class='add'>+</div><div class='add'>+	/* look up the directory at the root of the cache */</div><div class='add'>+	ret = kern_path(cache-&gt;rootdirname, LOOKUP_DIRECTORY, &amp;path);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto error_open_root;</div><div class='add'>+</div><div class='add'>+	cache-&gt;mnt = path.mnt;</div><div class='add'>+	root = path.dentry;</div><div class='add'>+</div><div class='add'>+	ret = -EINVAL;</div><div class='add'>+	if (is_idmapped_mnt(path.mnt)) {</div><div class='add'>+		pr_warn("File cache on idmapped mounts not supported");</div><div class='add'>+		goto error_unsupported;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Check features of the backing filesystem:</div><div class='add'>+	 * - Directories must support looking up and directory creation</div><div class='add'>+	 * - We create tmpfiles to handle invalidation</div><div class='add'>+	 * - We use xattrs to store metadata</div><div class='add'>+	 * - We need to be able to query the amount of space available</div><div class='add'>+	 * - We want to be able to sync the filesystem when stopping the cache</div><div class='add'>+	 * - We use DIO to/from pages, so the blocksize mustn't be too big.</div><div class='add'>+	 */</div><div class='add'>+	ret = -EOPNOTSUPP;</div><div class='add'>+	if (d_is_negative(root) ||</div><div class='add'>+	    !d_backing_inode(root)-&gt;i_op-&gt;lookup ||</div><div class='add'>+	    !d_backing_inode(root)-&gt;i_op-&gt;mkdir ||</div><div class='add'>+	    !d_backing_inode(root)-&gt;i_op-&gt;tmpfile ||</div><div class='add'>+	    !(d_backing_inode(root)-&gt;i_opflags &amp; IOP_XATTR) ||</div><div class='add'>+	    !root-&gt;d_sb-&gt;s_op-&gt;statfs ||</div><div class='add'>+	    !root-&gt;d_sb-&gt;s_op-&gt;sync_fs ||</div><div class='add'>+	    root-&gt;d_sb-&gt;s_blocksize &gt; PAGE_SIZE)</div><div class='add'>+		goto error_unsupported;</div><div class='add'>+</div><div class='add'>+	ret = -EROFS;</div><div class='add'>+	if (sb_rdonly(root-&gt;d_sb))</div><div class='add'>+		goto error_unsupported;</div><div class='add'>+</div><div class='add'>+	/* determine the security of the on-disk cache as this governs</div><div class='add'>+	 * security ID of files we create */</div><div class='add'>+	ret = cachefiles_determine_cache_security(cache, root, &amp;saved_cred);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto error_unsupported;</div><div class='add'>+</div><div class='add'>+	/* get the cache size and blocksize */</div><div class='add'>+	ret = vfs_statfs(&amp;path, &amp;stats);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto error_unsupported;</div><div class='add'>+</div><div class='add'>+	ret = -ERANGE;</div><div class='add'>+	if (stats.f_bsize &lt;= 0)</div><div class='add'>+		goto error_unsupported;</div><div class='add'>+</div><div class='add'>+	ret = -EOPNOTSUPP;</div><div class='add'>+	if (stats.f_bsize &gt; PAGE_SIZE)</div><div class='add'>+		goto error_unsupported;</div><div class='add'>+</div><div class='add'>+	cache-&gt;bsize = stats.f_bsize;</div><div class='add'>+	cache-&gt;bshift = ilog2(stats.f_bsize);</div><div class='add'>+</div><div class='add'>+	_debug("blksize %u (shift %u)",</div><div class='add'>+	       cache-&gt;bsize, cache-&gt;bshift);</div><div class='add'>+</div><div class='add'>+	_debug("size %llu, avail %llu",</div><div class='add'>+	       (unsigned long long) stats.f_blocks,</div><div class='add'>+	       (unsigned long long) stats.f_bavail);</div><div class='add'>+</div><div class='add'>+	/* set up caching limits */</div><div class='add'>+	do_div(stats.f_files, 100);</div><div class='add'>+	cache-&gt;fstop = stats.f_files * cache-&gt;fstop_percent;</div><div class='add'>+	cache-&gt;fcull = stats.f_files * cache-&gt;fcull_percent;</div><div class='add'>+	cache-&gt;frun  = stats.f_files * cache-&gt;frun_percent;</div><div class='add'>+</div><div class='add'>+	_debug("limits {%llu,%llu,%llu} files",</div><div class='add'>+	       (unsigned long long) cache-&gt;frun,</div><div class='add'>+	       (unsigned long long) cache-&gt;fcull,</div><div class='add'>+	       (unsigned long long) cache-&gt;fstop);</div><div class='add'>+</div><div class='add'>+	do_div(stats.f_blocks, 100);</div><div class='add'>+	cache-&gt;bstop = stats.f_blocks * cache-&gt;bstop_percent;</div><div class='add'>+	cache-&gt;bcull = stats.f_blocks * cache-&gt;bcull_percent;</div><div class='add'>+	cache-&gt;brun  = stats.f_blocks * cache-&gt;brun_percent;</div><div class='add'>+</div><div class='add'>+	_debug("limits {%llu,%llu,%llu} blocks",</div><div class='add'>+	       (unsigned long long) cache-&gt;brun,</div><div class='add'>+	       (unsigned long long) cache-&gt;bcull,</div><div class='add'>+	       (unsigned long long) cache-&gt;bstop);</div><div class='add'>+</div><div class='add'>+	/* get the cache directory and check its type */</div><div class='add'>+	cachedir = cachefiles_get_directory(cache, root, "cache", NULL);</div><div class='add'>+	if (IS_ERR(cachedir)) {</div><div class='add'>+		ret = PTR_ERR(cachedir);</div><div class='add'>+		goto error_unsupported;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	cache-&gt;store = cachedir;</div><div class='add'>+</div><div class='add'>+	/* get the graveyard directory */</div><div class='add'>+	graveyard = cachefiles_get_directory(cache, root, "graveyard", NULL);</div><div class='add'>+	if (IS_ERR(graveyard)) {</div><div class='add'>+		ret = PTR_ERR(graveyard);</div><div class='add'>+		goto error_unsupported;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	cache-&gt;graveyard = graveyard;</div><div class='add'>+	cache-&gt;cache = cache_cookie;</div><div class='add'>+</div><div class='add'>+	ret = fscache_add_cache(cache_cookie, &amp;cachefiles_cache_ops, cache);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto error_add_cache;</div><div class='add'>+</div><div class='add'>+	/* done */</div><div class='add'>+	set_bit(CACHEFILES_READY, &amp;cache-&gt;flags);</div><div class='add'>+	dput(root);</div><div class='add'>+</div><div class='add'>+	pr_info("File cache on %s registered\n", cache_cookie-&gt;name);</div><div class='add'>+</div><div class='add'>+	/* check how much space the cache has */</div><div class='add'>+	cachefiles_has_space(cache, 0, 0, cachefiles_has_space_check);</div><div class='add'>+	cachefiles_end_secure(cache, saved_cred);</div><div class='add'>+	_leave(" = 0 [%px]", cache-&gt;cache);</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+error_add_cache:</div><div class='add'>+	cachefiles_put_directory(cache-&gt;graveyard);</div><div class='add'>+	cache-&gt;graveyard = NULL;</div><div class='add'>+error_unsupported:</div><div class='add'>+	cachefiles_put_directory(cache-&gt;store);</div><div class='add'>+	cache-&gt;store = NULL;</div><div class='add'>+	mntput(cache-&gt;mnt);</div><div class='add'>+	cache-&gt;mnt = NULL;</div><div class='add'>+	dput(root);</div><div class='add'>+error_open_root:</div><div class='add'>+	cachefiles_end_secure(cache, saved_cred);</div><div class='add'>+	put_cred(cache-&gt;cache_cred);</div><div class='add'>+	cache-&gt;cache_cred = NULL;</div><div class='add'>+error_getsec:</div><div class='add'>+	fscache_relinquish_cache(cache_cookie);</div><div class='add'>+	cache-&gt;cache = NULL;</div><div class='add'>+	pr_err("Failed to register: %d\n", ret);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * See if we have space for a number of pages and/or a number of files in the</div><div class='add'>+ * cache</div><div class='add'>+ */</div><div class='add'>+int cachefiles_has_space(struct cachefiles_cache *cache,</div><div class='add'>+			 unsigned fnr, unsigned bnr,</div><div class='add'>+			 enum cachefiles_has_space_for reason)</div><div class='add'>+{</div><div class='add'>+	struct kstatfs stats;</div><div class='add'>+	u64 b_avail, b_writing;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	struct path path = {</div><div class='add'>+		.mnt	= cache-&gt;mnt,</div><div class='add'>+		.dentry	= cache-&gt;mnt-&gt;mnt_root,</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+	//_enter("{%llu,%llu,%llu,%llu,%llu,%llu},%u,%u",</div><div class='add'>+	//       (unsigned long long) cache-&gt;frun,</div><div class='add'>+	//       (unsigned long long) cache-&gt;fcull,</div><div class='add'>+	//       (unsigned long long) cache-&gt;fstop,</div><div class='add'>+	//       (unsigned long long) cache-&gt;brun,</div><div class='add'>+	//       (unsigned long long) cache-&gt;bcull,</div><div class='add'>+	//       (unsigned long long) cache-&gt;bstop,</div><div class='add'>+	//       fnr, bnr);</div><div class='add'>+</div><div class='add'>+	/* find out how many pages of blockdev are available */</div><div class='add'>+	memset(&amp;stats, 0, sizeof(stats));</div><div class='add'>+</div><div class='add'>+	ret = vfs_statfs(&amp;path, &amp;stats);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		trace_cachefiles_vfs_error(NULL, d_inode(path.dentry), ret,</div><div class='add'>+					   cachefiles_trace_statfs_error);</div><div class='add'>+		if (ret == -EIO)</div><div class='add'>+			cachefiles_io_error(cache, "statfs failed");</div><div class='add'>+		_leave(" = %d", ret);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	b_avail = stats.f_bavail;</div><div class='add'>+	b_writing = atomic_long_read(&amp;cache-&gt;b_writing);</div><div class='add'>+	if (b_avail &gt; b_writing)</div><div class='add'>+		b_avail -= b_writing;</div><div class='add'>+	else</div><div class='add'>+		b_avail = 0;</div><div class='add'>+</div><div class='add'>+	//_debug("avail %llu,%llu",</div><div class='add'>+	//       (unsigned long long)stats.f_ffree,</div><div class='add'>+	//       (unsigned long long)b_avail);</div><div class='add'>+</div><div class='add'>+	/* see if there is sufficient space */</div><div class='add'>+	if (stats.f_ffree &gt; fnr)</div><div class='add'>+		stats.f_ffree -= fnr;</div><div class='add'>+	else</div><div class='add'>+		stats.f_ffree = 0;</div><div class='add'>+</div><div class='add'>+	if (b_avail &gt; bnr)</div><div class='add'>+		b_avail -= bnr;</div><div class='add'>+	else</div><div class='add'>+		b_avail = 0;</div><div class='add'>+</div><div class='add'>+	ret = -ENOBUFS;</div><div class='add'>+	if (stats.f_ffree &lt; cache-&gt;fstop ||</div><div class='add'>+	    b_avail &lt; cache-&gt;bstop)</div><div class='add'>+		goto stop_and_begin_cull;</div><div class='add'>+</div><div class='add'>+	ret = 0;</div><div class='add'>+	if (stats.f_ffree &lt; cache-&gt;fcull ||</div><div class='add'>+	    b_avail &lt; cache-&gt;bcull)</div><div class='add'>+		goto begin_cull;</div><div class='add'>+</div><div class='add'>+	if (test_bit(CACHEFILES_CULLING, &amp;cache-&gt;flags) &amp;&amp;</div><div class='add'>+	    stats.f_ffree &gt;= cache-&gt;frun &amp;&amp;</div><div class='add'>+	    b_avail &gt;= cache-&gt;brun &amp;&amp;</div><div class='add'>+	    test_and_clear_bit(CACHEFILES_CULLING, &amp;cache-&gt;flags)</div><div class='add'>+	    ) {</div><div class='add'>+		_debug("cease culling");</div><div class='add'>+		cachefiles_state_changed(cache);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	//_leave(" = 0");</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+stop_and_begin_cull:</div><div class='add'>+	switch (reason) {</div><div class='add'>+	case cachefiles_has_space_for_write:</div><div class='add'>+		fscache_count_no_write_space();</div><div class='add'>+		break;</div><div class='add'>+	case cachefiles_has_space_for_create:</div><div class='add'>+		fscache_count_no_create_space();</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+begin_cull:</div><div class='add'>+	if (!test_and_set_bit(CACHEFILES_CULLING, &amp;cache-&gt;flags)) {</div><div class='add'>+		_debug("### CULL CACHE ###");</div><div class='add'>+		cachefiles_state_changed(cache);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	_leave(" = %d", ret);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Mark all the objects as being out of service and queue them all for cleanup.</div><div class='add'>+ */</div><div class='add'>+static void cachefiles_withdraw_objects(struct cachefiles_cache *cache)</div><div class='add'>+{</div><div class='add'>+	struct cachefiles_object *object;</div><div class='add'>+	unsigned int count = 0;</div><div class='add'>+</div><div class='add'>+	_enter("");</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;cache-&gt;object_list_lock);</div><div class='add'>+</div><div class='add'>+	while (!list_empty(&amp;cache-&gt;object_list)) {</div><div class='add'>+		object = list_first_entry(&amp;cache-&gt;object_list,</div><div class='add'>+					  struct cachefiles_object, cache_link);</div><div class='add'>+		cachefiles_see_object(object, cachefiles_obj_see_withdrawal);</div><div class='add'>+		list_del_init(&amp;object-&gt;cache_link);</div><div class='add'>+		fscache_withdraw_cookie(object-&gt;cookie);</div><div class='add'>+		count++;</div><div class='add'>+		if ((count &amp; 63) == 0) {</div><div class='add'>+			spin_unlock(&amp;cache-&gt;object_list_lock);</div><div class='add'>+			cond_resched();</div><div class='add'>+			spin_lock(&amp;cache-&gt;object_list_lock);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_unlock(&amp;cache-&gt;object_list_lock);</div><div class='add'>+	_leave(" [%u objs]", count);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Withdraw fscache volumes.</div><div class='add'>+ */</div><div class='add'>+static void cachefiles_withdraw_fscache_volumes(struct cachefiles_cache *cache)</div><div class='add'>+{</div><div class='add'>+	struct list_head *cur;</div><div class='add'>+	struct cachefiles_volume *volume;</div><div class='add'>+	struct fscache_volume *vcookie;</div><div class='add'>+</div><div class='add'>+	_enter("");</div><div class='add'>+retry:</div><div class='add'>+	spin_lock(&amp;cache-&gt;object_list_lock);</div><div class='add'>+	list_for_each(cur, &amp;cache-&gt;volumes) {</div><div class='add'>+		volume = list_entry(cur, struct cachefiles_volume, cache_link);</div><div class='add'>+</div><div class='add'>+		if (atomic_read(&amp;volume-&gt;vcookie-&gt;n_accesses) == 0)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		vcookie = fscache_try_get_volume(volume-&gt;vcookie,</div><div class='add'>+						 fscache_volume_get_withdraw);</div><div class='add'>+		if (vcookie) {</div><div class='add'>+			spin_unlock(&amp;cache-&gt;object_list_lock);</div><div class='add'>+			fscache_withdraw_volume(vcookie);</div><div class='add'>+			fscache_put_volume(vcookie, fscache_volume_put_withdraw);</div><div class='add'>+			goto retry;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;cache-&gt;object_list_lock);</div><div class='add'>+</div><div class='add'>+	_leave("");</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Withdraw cachefiles volumes.</div><div class='add'>+ */</div><div class='add'>+static void cachefiles_withdraw_volumes(struct cachefiles_cache *cache)</div><div class='add'>+{</div><div class='add'>+	_enter("");</div><div class='add'>+</div><div class='add'>+	for (;;) {</div><div class='add'>+		struct fscache_volume *vcookie = NULL;</div><div class='add'>+		struct cachefiles_volume *volume = NULL;</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;cache-&gt;object_list_lock);</div><div class='add'>+		if (!list_empty(&amp;cache-&gt;volumes)) {</div><div class='add'>+			volume = list_first_entry(&amp;cache-&gt;volumes,</div><div class='add'>+						  struct cachefiles_volume, cache_link);</div><div class='add'>+			vcookie = fscache_try_get_volume(volume-&gt;vcookie,</div><div class='add'>+							 fscache_volume_get_withdraw);</div><div class='add'>+			if (!vcookie) {</div><div class='add'>+				spin_unlock(&amp;cache-&gt;object_list_lock);</div><div class='add'>+				cpu_relax();</div><div class='add'>+				continue;</div><div class='add'>+			}</div><div class='add'>+			list_del_init(&amp;volume-&gt;cache_link);</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;cache-&gt;object_list_lock);</div><div class='add'>+		if (!volume)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		cachefiles_withdraw_volume(volume);</div><div class='add'>+		fscache_put_volume(vcookie, fscache_volume_put_withdraw);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	_leave("");</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Sync a cache to backing disk.</div><div class='add'>+ */</div><div class='add'>+static void cachefiles_sync_cache(struct cachefiles_cache *cache)</div><div class='add'>+{</div><div class='add'>+	const struct cred *saved_cred;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	_enter("%s", cache-&gt;cache-&gt;name);</div><div class='add'>+</div><div class='add'>+	/* make sure all pages pinned by operations on behalf of the netfs are</div><div class='add'>+	 * written to disc */</div><div class='add'>+	cachefiles_begin_secure(cache, &amp;saved_cred);</div><div class='add'>+	down_read(&amp;cache-&gt;mnt-&gt;mnt_sb-&gt;s_umount);</div><div class='add'>+	ret = sync_filesystem(cache-&gt;mnt-&gt;mnt_sb);</div><div class='add'>+	up_read(&amp;cache-&gt;mnt-&gt;mnt_sb-&gt;s_umount);</div><div class='add'>+	cachefiles_end_secure(cache, saved_cred);</div><div class='add'>+</div><div class='add'>+	if (ret == -EIO)</div><div class='add'>+		cachefiles_io_error(cache,</div><div class='add'>+				    "Attempt to sync backing fs superblock returned error %d",</div><div class='add'>+				    ret);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Withdraw cache objects.</div><div class='add'>+ */</div><div class='add'>+void cachefiles_withdraw_cache(struct cachefiles_cache *cache)</div><div class='add'>+{</div><div class='add'>+	struct fscache_cache *fscache = cache-&gt;cache;</div><div class='add'>+</div><div class='add'>+	pr_info("File cache on %s unregistering\n", fscache-&gt;name);</div><div class='add'>+</div><div class='add'>+	fscache_withdraw_cache(fscache);</div><div class='add'>+	cachefiles_withdraw_fscache_volumes(cache);</div><div class='add'>+</div><div class='add'>+	/* we now have to destroy all the active objects pertaining to this</div><div class='add'>+	 * cache - which we do by passing them off to thread pool to be</div><div class='add'>+	 * disposed of */</div><div class='add'>+	cachefiles_withdraw_objects(cache);</div><div class='add'>+	fscache_wait_for_objects(fscache);</div><div class='add'>+</div><div class='add'>+	cachefiles_withdraw_volumes(cache);</div><div class='add'>+	cachefiles_sync_cache(cache);</div><div class='add'>+	cache-&gt;cache = NULL;</div><div class='add'>+	fscache_relinquish_cache(fscache);</div><div class='add'>+}</div><div class='head'>diff --git a/fs/cachefiles/daemon.c b/fs/cachefiles/daemon.c<br/>index 752c1e43416f..1806bff8e59b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cachefiles/daemon.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/daemon.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/cachefiles/daemon.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/cachefiles/daemon.c</a></div><div class='hunk'>@@ -1,7 +1,7 @@</div><div class='ctx'> // SPDX-License-Identifier: GPL-2.0-or-later</div><div class='ctx'> /* Daemon interface</div><div class='ctx'>  *</div><div class='del'>- * Copyright (C) 2007 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Copyright (C) 2007, 2021 Red Hat, Inc. All Rights Reserved.</div><div class='ctx'>  * Written by David Howells (dhowells@redhat.com)</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='hunk'>@@ -15,6 +15,7 @@</div><div class='ctx'> #include &lt;linux/namei.h&gt;</div><div class='ctx'> #include &lt;linux/poll.h&gt;</div><div class='ctx'> #include &lt;linux/mount.h&gt;</div><div class='add'>+#include &lt;linux/security.h&gt;</div><div class='ctx'> #include &lt;linux/statfs.h&gt;</div><div class='ctx'> #include &lt;linux/ctype.h&gt;</div><div class='ctx'> #include &lt;linux/string.h&gt;</div><div class='hunk'>@@ -41,6 +42,8 @@ static int cachefiles_daemon_dir(struct cachefiles_cache *, char *);</div><div class='ctx'> static int cachefiles_daemon_inuse(struct cachefiles_cache *, char *);</div><div class='ctx'> static int cachefiles_daemon_secctx(struct cachefiles_cache *, char *);</div><div class='ctx'> static int cachefiles_daemon_tag(struct cachefiles_cache *, char *);</div><div class='add'>+static int cachefiles_daemon_bind(struct cachefiles_cache *, char *);</div><div class='add'>+static void cachefiles_daemon_unbind(struct cachefiles_cache *);</div><div class='ctx'> </div><div class='ctx'> static unsigned long cachefiles_open;</div><div class='ctx'> </div><div class='hunk'>@@ -73,12 +76,16 @@ static const struct cachefiles_daemon_cmd cachefiles_daemon_cmds[] = {</div><div class='ctx'> 	{ "inuse",	cachefiles_daemon_inuse		},</div><div class='ctx'> 	{ "secctx",	cachefiles_daemon_secctx	},</div><div class='ctx'> 	{ "tag",	cachefiles_daemon_tag		},</div><div class='add'>+#ifdef CONFIG_CACHEFILES_ONDEMAND</div><div class='add'>+	{ "copen",	cachefiles_ondemand_copen	},</div><div class='add'>+	{ "restore",	cachefiles_ondemand_restore	},</div><div class='add'>+#endif</div><div class='ctx'> 	{ "",		NULL				}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * do various checks</div><div class='add'>+ * Prepare a cache for caching.</div><div class='ctx'>  */</div><div class='ctx'> static int cachefiles_daemon_open(struct inode *inode, struct file *file)</div><div class='ctx'> {</div><div class='hunk'>@@ -102,9 +109,13 @@ static int cachefiles_daemon_open(struct inode *inode, struct file *file)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	mutex_init(&amp;cache-&gt;daemon_mutex);</div><div class='del'>-	cache-&gt;active_nodes = RB_ROOT;</div><div class='del'>-	rwlock_init(&amp;cache-&gt;active_lock);</div><div class='ctx'> 	init_waitqueue_head(&amp;cache-&gt;daemon_pollwq);</div><div class='add'>+	INIT_LIST_HEAD(&amp;cache-&gt;volumes);</div><div class='add'>+	INIT_LIST_HEAD(&amp;cache-&gt;object_list);</div><div class='add'>+	spin_lock_init(&amp;cache-&gt;object_list_lock);</div><div class='add'>+	refcount_set(&amp;cache-&gt;unbind_pincount, 1);</div><div class='add'>+	xa_init_flags(&amp;cache-&gt;reqs, XA_FLAGS_ALLOC);</div><div class='add'>+	xa_init_flags(&amp;cache-&gt;ondemand_ids, XA_FLAGS_ALLOC1);</div><div class='ctx'> </div><div class='ctx'> 	/* set default caching limits</div><div class='ctx'> 	 * - limit at 1% free space and/or free files</div><div class='hunk'>@@ -123,8 +134,56 @@ static int cachefiles_daemon_open(struct inode *inode, struct file *file)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void cachefiles_flush_reqs(struct cachefiles_cache *cache)</div><div class='add'>+{</div><div class='add'>+	struct xarray *xa = &amp;cache-&gt;reqs;</div><div class='add'>+	struct cachefiles_req *req;</div><div class='add'>+	unsigned long index;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Make sure the following two operations won't be reordered.</div><div class='add'>+	 *   1) set CACHEFILES_DEAD bit</div><div class='add'>+	 *   2) flush requests in the xarray</div><div class='add'>+	 * Otherwise the request may be enqueued after xarray has been</div><div class='add'>+	 * flushed, leaving the orphan request never being completed.</div><div class='add'>+	 *</div><div class='add'>+	 * CPU 1			CPU 2</div><div class='add'>+	 * =====			=====</div><div class='add'>+	 * flush requests in the xarray</div><div class='add'>+	 *				test CACHEFILES_DEAD bit</div><div class='add'>+	 *				enqueue the request</div><div class='add'>+	 * set CACHEFILES_DEAD bit</div><div class='add'>+	 */</div><div class='add'>+	smp_mb();</div><div class='add'>+</div><div class='add'>+	xa_lock(xa);</div><div class='add'>+	xa_for_each(xa, index, req) {</div><div class='add'>+		req-&gt;error = -EIO;</div><div class='add'>+		complete(&amp;req-&gt;done);</div><div class='add'>+		__xa_erase(xa, index);</div><div class='add'>+	}</div><div class='add'>+	xa_unlock(xa);</div><div class='add'>+</div><div class='add'>+	xa_destroy(&amp;cache-&gt;reqs);</div><div class='add'>+	xa_destroy(&amp;cache-&gt;ondemand_ids);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void cachefiles_put_unbind_pincount(struct cachefiles_cache *cache)</div><div class='add'>+{</div><div class='add'>+	if (refcount_dec_and_test(&amp;cache-&gt;unbind_pincount)) {</div><div class='add'>+		cachefiles_daemon_unbind(cache);</div><div class='add'>+		cachefiles_open = 0;</div><div class='add'>+		kfree(cache);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void cachefiles_get_unbind_pincount(struct cachefiles_cache *cache)</div><div class='add'>+{</div><div class='add'>+	refcount_inc(&amp;cache-&gt;unbind_pincount);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='del'>- * release a cache</div><div class='add'>+ * Release a cache.</div><div class='ctx'>  */</div><div class='ctx'> static int cachefiles_daemon_release(struct inode *inode, struct file *file)</div><div class='ctx'> {</div><div class='hunk'>@@ -136,40 +195,29 @@ static int cachefiles_daemon_release(struct inode *inode, struct file *file)</div><div class='ctx'> </div><div class='ctx'> 	set_bit(CACHEFILES_DEAD, &amp;cache-&gt;flags);</div><div class='ctx'> </div><div class='del'>-	cachefiles_daemon_unbind(cache);</div><div class='del'>-</div><div class='del'>-	ASSERT(!cache-&gt;active_nodes.rb_node);</div><div class='add'>+	if (cachefiles_in_ondemand_mode(cache))</div><div class='add'>+		cachefiles_flush_reqs(cache);</div><div class='ctx'> </div><div class='ctx'> 	/* clean up the control file interface */</div><div class='ctx'> 	cache-&gt;cachefilesd = NULL;</div><div class='ctx'> 	file-&gt;private_data = NULL;</div><div class='del'>-	cachefiles_open = 0;</div><div class='ctx'> </div><div class='del'>-	kfree(cache);</div><div class='add'>+	cachefiles_put_unbind_pincount(cache);</div><div class='ctx'> </div><div class='ctx'> 	_leave("");</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * read the cache state</div><div class='del'>- */</div><div class='del'>-static ssize_t cachefiles_daemon_read(struct file *file, char __user *_buffer,</div><div class='del'>-				      size_t buflen, loff_t *pos)</div><div class='add'>+static ssize_t cachefiles_do_daemon_read(struct cachefiles_cache *cache,</div><div class='add'>+					 char __user *_buffer, size_t buflen)</div><div class='ctx'> {</div><div class='del'>-	struct cachefiles_cache *cache = file-&gt;private_data;</div><div class='ctx'> 	unsigned long long b_released;</div><div class='ctx'> 	unsigned f_released;</div><div class='ctx'> 	char buffer[256];</div><div class='ctx'> 	int n;</div><div class='ctx'> </div><div class='del'>-	//_enter(",,%zu,", buflen);</div><div class='del'>-</div><div class='del'>-	if (!test_bit(CACHEFILES_READY, &amp;cache-&gt;flags))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='ctx'> 	/* check how much space the cache has */</div><div class='del'>-	cachefiles_has_space(cache, 0, 0);</div><div class='add'>+	cachefiles_has_space(cache, 0, 0, cachefiles_has_space_check);</div><div class='ctx'> </div><div class='ctx'> 	/* summarise */</div><div class='ctx'> 	f_released = atomic_xchg(&amp;cache-&gt;f_released, 0);</div><div class='hunk'>@@ -206,7 +254,26 @@ static ssize_t cachefiles_daemon_read(struct file *file, char __user *_buffer,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * command the cache</div><div class='add'>+ * Read the cache state.</div><div class='add'>+ */</div><div class='add'>+static ssize_t cachefiles_daemon_read(struct file *file, char __user *_buffer,</div><div class='add'>+				      size_t buflen, loff_t *pos)</div><div class='add'>+{</div><div class='add'>+	struct cachefiles_cache *cache = file-&gt;private_data;</div><div class='add'>+</div><div class='add'>+	//_enter(",,%zu,", buflen);</div><div class='add'>+</div><div class='add'>+	if (!test_bit(CACHEFILES_READY, &amp;cache-&gt;flags))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if (cachefiles_in_ondemand_mode(cache))</div><div class='add'>+		return cachefiles_ondemand_daemon_read(cache, _buffer, buflen);</div><div class='add'>+	else</div><div class='add'>+		return cachefiles_do_daemon_read(cache, _buffer, buflen);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Take a command from cachefilesd, parse it and act on it.</div><div class='ctx'>  */</div><div class='ctx'> static ssize_t cachefiles_daemon_write(struct file *file,</div><div class='ctx'> 				       const char __user *_data,</div><div class='hunk'>@@ -225,7 +292,7 @@ static ssize_t cachefiles_daemon_write(struct file *file,</div><div class='ctx'> 	if (test_bit(CACHEFILES_DEAD, &amp;cache-&gt;flags))</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> </div><div class='del'>-	if (datalen &lt; 0 || datalen &gt; PAGE_SIZE - 1)</div><div class='add'>+	if (datalen &gt; PAGE_SIZE - 1)</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='ctx'> 	/* drag the command string into the kernel so we can parse it */</div><div class='hunk'>@@ -284,20 +351,35 @@ found_command:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * poll for culling state</div><div class='add'>+ * Poll for culling state</div><div class='ctx'>  * - use EPOLLOUT to indicate culling state</div><div class='ctx'>  */</div><div class='ctx'> static __poll_t cachefiles_daemon_poll(struct file *file,</div><div class='ctx'> 					   struct poll_table_struct *poll)</div><div class='ctx'> {</div><div class='ctx'> 	struct cachefiles_cache *cache = file-&gt;private_data;</div><div class='add'>+	XA_STATE(xas, &amp;cache-&gt;reqs, 0);</div><div class='add'>+	struct cachefiles_req *req;</div><div class='ctx'> 	__poll_t mask;</div><div class='ctx'> </div><div class='ctx'> 	poll_wait(file, &amp;cache-&gt;daemon_pollwq, poll);</div><div class='ctx'> 	mask = 0;</div><div class='ctx'> </div><div class='del'>-	if (test_bit(CACHEFILES_STATE_CHANGED, &amp;cache-&gt;flags))</div><div class='del'>-		mask |= EPOLLIN;</div><div class='add'>+	if (cachefiles_in_ondemand_mode(cache)) {</div><div class='add'>+		if (!xa_empty(&amp;cache-&gt;reqs)) {</div><div class='add'>+			xas_lock(&amp;xas);</div><div class='add'>+			xas_for_each_marked(&amp;xas, req, ULONG_MAX, CACHEFILES_REQ_NEW) {</div><div class='add'>+				if (!cachefiles_ondemand_is_reopening_read(req)) {</div><div class='add'>+					mask |= EPOLLIN;</div><div class='add'>+					break;</div><div class='add'>+				}</div><div class='add'>+			}</div><div class='add'>+			xas_unlock(&amp;xas);</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		if (test_bit(CACHEFILES_STATE_CHANGED, &amp;cache-&gt;flags))</div><div class='add'>+			mask |= EPOLLIN;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (test_bit(CACHEFILES_CULLING, &amp;cache-&gt;flags))</div><div class='ctx'> 		mask |= EPOLLOUT;</div><div class='hunk'>@@ -306,7 +388,7 @@ static __poll_t cachefiles_daemon_poll(struct file *file,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * give a range error for cache space constraints</div><div class='add'>+ * Give a range error for cache space constraints</div><div class='ctx'>  * - can be tail-called</div><div class='ctx'>  */</div><div class='ctx'> static int cachefiles_daemon_range_error(struct cachefiles_cache *cache,</div><div class='hunk'>@@ -318,7 +400,7 @@ static int cachefiles_daemon_range_error(struct cachefiles_cache *cache,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * set the percentage of files at which to stop culling</div><div class='add'>+ * Set the percentage of files at which to stop culling</div><div class='ctx'>  * - command: "frun &lt;N&gt;%"</div><div class='ctx'>  */</div><div class='ctx'> static int cachefiles_daemon_frun(struct cachefiles_cache *cache, char *args)</div><div class='hunk'>@@ -342,7 +424,7 @@ static int cachefiles_daemon_frun(struct cachefiles_cache *cache, char *args)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * set the percentage of files at which to start culling</div><div class='add'>+ * Set the percentage of files at which to start culling</div><div class='ctx'>  * - command: "fcull &lt;N&gt;%"</div><div class='ctx'>  */</div><div class='ctx'> static int cachefiles_daemon_fcull(struct cachefiles_cache *cache, char *args)</div><div class='hunk'>@@ -366,7 +448,7 @@ static int cachefiles_daemon_fcull(struct cachefiles_cache *cache, char *args)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * set the percentage of files at which to stop allocating</div><div class='add'>+ * Set the percentage of files at which to stop allocating</div><div class='ctx'>  * - command: "fstop &lt;N&gt;%"</div><div class='ctx'>  */</div><div class='ctx'> static int cachefiles_daemon_fstop(struct cachefiles_cache *cache, char *args)</div><div class='hunk'>@@ -382,7 +464,7 @@ static int cachefiles_daemon_fstop(struct cachefiles_cache *cache, char *args)</div><div class='ctx'> 	if (args[0] != '%' || args[1] != '\0')</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	if (fstop &lt; 0 || fstop &gt;= cache-&gt;fcull_percent)</div><div class='add'>+	if (fstop &gt;= cache-&gt;fcull_percent)</div><div class='ctx'> 		return cachefiles_daemon_range_error(cache, args);</div><div class='ctx'> </div><div class='ctx'> 	cache-&gt;fstop_percent = fstop;</div><div class='hunk'>@@ -390,7 +472,7 @@ static int cachefiles_daemon_fstop(struct cachefiles_cache *cache, char *args)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * set the percentage of blocks at which to stop culling</div><div class='add'>+ * Set the percentage of blocks at which to stop culling</div><div class='ctx'>  * - command: "brun &lt;N&gt;%"</div><div class='ctx'>  */</div><div class='ctx'> static int cachefiles_daemon_brun(struct cachefiles_cache *cache, char *args)</div><div class='hunk'>@@ -414,7 +496,7 @@ static int cachefiles_daemon_brun(struct cachefiles_cache *cache, char *args)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * set the percentage of blocks at which to start culling</div><div class='add'>+ * Set the percentage of blocks at which to start culling</div><div class='ctx'>  * - command: "bcull &lt;N&gt;%"</div><div class='ctx'>  */</div><div class='ctx'> static int cachefiles_daemon_bcull(struct cachefiles_cache *cache, char *args)</div><div class='hunk'>@@ -438,7 +520,7 @@ static int cachefiles_daemon_bcull(struct cachefiles_cache *cache, char *args)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * set the percentage of blocks at which to stop allocating</div><div class='add'>+ * Set the percentage of blocks at which to stop allocating</div><div class='ctx'>  * - command: "bstop &lt;N&gt;%"</div><div class='ctx'>  */</div><div class='ctx'> static int cachefiles_daemon_bstop(struct cachefiles_cache *cache, char *args)</div><div class='hunk'>@@ -454,7 +536,7 @@ static int cachefiles_daemon_bstop(struct cachefiles_cache *cache, char *args)</div><div class='ctx'> 	if (args[0] != '%' || args[1] != '\0')</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	if (bstop &lt; 0 || bstop &gt;= cache-&gt;bcull_percent)</div><div class='add'>+	if (bstop &gt;= cache-&gt;bcull_percent)</div><div class='ctx'> 		return cachefiles_daemon_range_error(cache, args);</div><div class='ctx'> </div><div class='ctx'> 	cache-&gt;bstop_percent = bstop;</div><div class='hunk'>@@ -462,7 +544,7 @@ static int cachefiles_daemon_bstop(struct cachefiles_cache *cache, char *args)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * set the cache directory</div><div class='add'>+ * Set the cache directory</div><div class='ctx'>  * - command: "dir &lt;name&gt;"</div><div class='ctx'>  */</div><div class='ctx'> static int cachefiles_daemon_dir(struct cachefiles_cache *cache, char *args)</div><div class='hunk'>@@ -490,12 +572,12 @@ static int cachefiles_daemon_dir(struct cachefiles_cache *cache, char *args)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * set the cache security context</div><div class='add'>+ * Set the cache security context</div><div class='ctx'>  * - command: "secctx &lt;ctx&gt;"</div><div class='ctx'>  */</div><div class='ctx'> static int cachefiles_daemon_secctx(struct cachefiles_cache *cache, char *args)</div><div class='ctx'> {</div><div class='del'>-	char *secctx;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='ctx'> 	_enter(",%s", args);</div><div class='ctx'> </div><div class='hunk'>@@ -504,21 +586,21 @@ static int cachefiles_daemon_secctx(struct cachefiles_cache *cache, char *args)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (cache-&gt;secctx) {</div><div class='add'>+	if (cache-&gt;have_secid) {</div><div class='ctx'> 		pr_err("Second security context specified\n");</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	secctx = kstrdup(args, GFP_KERNEL);</div><div class='del'>-	if (!secctx)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	err = security_secctx_to_secid(args, strlen(args), &amp;cache-&gt;secid);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='del'>-	cache-&gt;secctx = secctx;</div><div class='add'>+	cache-&gt;have_secid = true;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * set the cache tag</div><div class='add'>+ * Set the cache tag</div><div class='ctx'>  * - command: "tag &lt;name&gt;"</div><div class='ctx'>  */</div><div class='ctx'> static int cachefiles_daemon_tag(struct cachefiles_cache *cache, char *args)</div><div class='hunk'>@@ -544,7 +626,7 @@ static int cachefiles_daemon_tag(struct cachefiles_cache *cache, char *args)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * request a node in the cache be culled from the current working directory</div><div class='add'>+ * Request a node in the cache be culled from the current working directory</div><div class='ctx'>  * - command: "cull &lt;name&gt;"</div><div class='ctx'>  */</div><div class='ctx'> static int cachefiles_daemon_cull(struct cachefiles_cache *cache, char *args)</div><div class='hunk'>@@ -568,7 +650,6 @@ static int cachefiles_daemon_cull(struct cachefiles_cache *cache, char *args)</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* extract the directory dentry from the cwd */</div><div class='ctx'> 	get_fs_pwd(current-&gt;fs, &amp;path);</div><div class='ctx'> </div><div class='ctx'> 	if (!d_can_lookup(path.dentry))</div><div class='hunk'>@@ -593,7 +674,7 @@ inval:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * set debugging mode</div><div class='add'>+ * Set debugging mode</div><div class='ctx'>  * - command: "debug &lt;mask&gt;"</div><div class='ctx'>  */</div><div class='ctx'> static int cachefiles_daemon_debug(struct cachefiles_cache *cache, char *args)</div><div class='hunk'>@@ -616,7 +697,7 @@ inval:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * find out whether an object in the current working directory is in use or not</div><div class='add'>+ * Find out whether an object in the current working directory is in use or not</div><div class='ctx'>  * - command: "inuse &lt;name&gt;"</div><div class='ctx'>  */</div><div class='ctx'> static int cachefiles_daemon_inuse(struct cachefiles_cache *cache, char *args)</div><div class='hunk'>@@ -640,7 +721,6 @@ static int cachefiles_daemon_inuse(struct cachefiles_cache *cache, char *args)</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* extract the directory dentry from the cwd */</div><div class='ctx'> 	get_fs_pwd(current-&gt;fs, &amp;path);</div><div class='ctx'> </div><div class='ctx'> 	if (!d_can_lookup(path.dentry))</div><div class='hunk'>@@ -665,84 +745,83 @@ inval:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * see if we have space for a number of pages and/or a number of files in the</div><div class='del'>- * cache</div><div class='add'>+ * Bind a directory as a cache</div><div class='ctx'>  */</div><div class='del'>-int cachefiles_has_space(struct cachefiles_cache *cache,</div><div class='del'>-			 unsigned fnr, unsigned bnr)</div><div class='add'>+static int cachefiles_daemon_bind(struct cachefiles_cache *cache, char *args)</div><div class='ctx'> {</div><div class='del'>-	struct kstatfs stats;</div><div class='del'>-	struct path path = {</div><div class='del'>-		.mnt	= cache-&gt;mnt,</div><div class='del'>-		.dentry	= cache-&gt;mnt-&gt;mnt_root,</div><div class='del'>-	};</div><div class='del'>-	int ret;</div><div class='add'>+	_enter("{%u,%u,%u,%u,%u,%u},%s",</div><div class='add'>+	       cache-&gt;frun_percent,</div><div class='add'>+	       cache-&gt;fcull_percent,</div><div class='add'>+	       cache-&gt;fstop_percent,</div><div class='add'>+	       cache-&gt;brun_percent,</div><div class='add'>+	       cache-&gt;bcull_percent,</div><div class='add'>+	       cache-&gt;bstop_percent,</div><div class='add'>+	       args);</div><div class='add'>+</div><div class='add'>+	if (cache-&gt;fstop_percent &gt;= cache-&gt;fcull_percent ||</div><div class='add'>+	    cache-&gt;fcull_percent &gt;= cache-&gt;frun_percent ||</div><div class='add'>+	    cache-&gt;frun_percent  &gt;= 100)</div><div class='add'>+		return -ERANGE;</div><div class='add'>+</div><div class='add'>+	if (cache-&gt;bstop_percent &gt;= cache-&gt;bcull_percent ||</div><div class='add'>+	    cache-&gt;bcull_percent &gt;= cache-&gt;brun_percent ||</div><div class='add'>+	    cache-&gt;brun_percent  &gt;= 100)</div><div class='add'>+		return -ERANGE;</div><div class='add'>+</div><div class='add'>+	if (!cache-&gt;rootdirname) {</div><div class='add'>+		pr_err("No cache directory specified\n");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Don't permit already bound caches to be re-bound */</div><div class='add'>+	if (test_bit(CACHEFILES_READY, &amp;cache-&gt;flags)) {</div><div class='add'>+		pr_err("Cache already bound\n");</div><div class='add'>+		return -EBUSY;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	//_enter("{%llu,%llu,%llu,%llu,%llu,%llu},%u,%u",</div><div class='del'>-	//       (unsigned long long) cache-&gt;frun,</div><div class='del'>-	//       (unsigned long long) cache-&gt;fcull,</div><div class='del'>-	//       (unsigned long long) cache-&gt;fstop,</div><div class='del'>-	//       (unsigned long long) cache-&gt;brun,</div><div class='del'>-	//       (unsigned long long) cache-&gt;bcull,</div><div class='del'>-	//       (unsigned long long) cache-&gt;bstop,</div><div class='del'>-	//       fnr, bnr);</div><div class='del'>-</div><div class='del'>-	/* find out how many pages of blockdev are available */</div><div class='del'>-	memset(&amp;stats, 0, sizeof(stats));</div><div class='del'>-</div><div class='del'>-	ret = vfs_statfs(&amp;path, &amp;stats);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		if (ret == -EIO)</div><div class='del'>-			cachefiles_io_error(cache, "statfs failed");</div><div class='del'>-		_leave(" = %d", ret);</div><div class='del'>-		return ret;</div><div class='add'>+	if (IS_ENABLED(CONFIG_CACHEFILES_ONDEMAND)) {</div><div class='add'>+		if (!strcmp(args, "ondemand")) {</div><div class='add'>+			set_bit(CACHEFILES_ONDEMAND_MODE, &amp;cache-&gt;flags);</div><div class='add'>+		} else if (*args) {</div><div class='add'>+			pr_err("Invalid argument to the 'bind' command\n");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+	} else if (*args) {</div><div class='add'>+		pr_err("'bind' command doesn't take an argument\n");</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	stats.f_bavail &gt;&gt;= cache-&gt;bshift;</div><div class='add'>+	/* Make sure we have copies of the tag string */</div><div class='add'>+	if (!cache-&gt;tag) {</div><div class='add'>+		/*</div><div class='add'>+		 * The tag string is released by the fops-&gt;release()</div><div class='add'>+		 * function, so we don't release it on error here</div><div class='add'>+		 */</div><div class='add'>+		cache-&gt;tag = kstrdup("CacheFiles", GFP_KERNEL);</div><div class='add'>+		if (!cache-&gt;tag)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	//_debug("avail %llu,%llu",</div><div class='del'>-	//       (unsigned long long) stats.f_ffree,</div><div class='del'>-	//       (unsigned long long) stats.f_bavail);</div><div class='add'>+	return cachefiles_add_cache(cache);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	/* see if there is sufficient space */</div><div class='del'>-	if (stats.f_ffree &gt; fnr)</div><div class='del'>-		stats.f_ffree -= fnr;</div><div class='del'>-	else</div><div class='del'>-		stats.f_ffree = 0;</div><div class='add'>+/*</div><div class='add'>+ * Unbind a cache.</div><div class='add'>+ */</div><div class='add'>+static void cachefiles_daemon_unbind(struct cachefiles_cache *cache)</div><div class='add'>+{</div><div class='add'>+	_enter("");</div><div class='ctx'> </div><div class='del'>-	if (stats.f_bavail &gt; bnr)</div><div class='del'>-		stats.f_bavail -= bnr;</div><div class='del'>-	else</div><div class='del'>-		stats.f_bavail = 0;</div><div class='del'>-</div><div class='del'>-	ret = -ENOBUFS;</div><div class='del'>-	if (stats.f_ffree &lt; cache-&gt;fstop ||</div><div class='del'>-	    stats.f_bavail &lt; cache-&gt;bstop)</div><div class='del'>-		goto begin_cull;</div><div class='del'>-</div><div class='del'>-	ret = 0;</div><div class='del'>-	if (stats.f_ffree &lt; cache-&gt;fcull ||</div><div class='del'>-	    stats.f_bavail &lt; cache-&gt;bcull)</div><div class='del'>-		goto begin_cull;</div><div class='del'>-</div><div class='del'>-	if (test_bit(CACHEFILES_CULLING, &amp;cache-&gt;flags) &amp;&amp;</div><div class='del'>-	    stats.f_ffree &gt;= cache-&gt;frun &amp;&amp;</div><div class='del'>-	    stats.f_bavail &gt;= cache-&gt;brun &amp;&amp;</div><div class='del'>-	    test_and_clear_bit(CACHEFILES_CULLING, &amp;cache-&gt;flags)</div><div class='del'>-	    ) {</div><div class='del'>-		_debug("cease culling");</div><div class='del'>-		cachefiles_state_changed(cache);</div><div class='del'>-	}</div><div class='add'>+	if (test_bit(CACHEFILES_READY, &amp;cache-&gt;flags))</div><div class='add'>+		cachefiles_withdraw_cache(cache);</div><div class='ctx'> </div><div class='del'>-	//_leave(" = 0");</div><div class='del'>-	return 0;</div><div class='add'>+	cachefiles_put_directory(cache-&gt;graveyard);</div><div class='add'>+	cachefiles_put_directory(cache-&gt;store);</div><div class='add'>+	mntput(cache-&gt;mnt);</div><div class='add'>+	put_cred(cache-&gt;cache_cred);</div><div class='ctx'> </div><div class='del'>-begin_cull:</div><div class='del'>-	if (!test_and_set_bit(CACHEFILES_CULLING, &amp;cache-&gt;flags)) {</div><div class='del'>-		_debug("### CULL CACHE ###");</div><div class='del'>-		cachefiles_state_changed(cache);</div><div class='del'>-	}</div><div class='add'>+	kfree(cache-&gt;rootdirname);</div><div class='add'>+	kfree(cache-&gt;tag);</div><div class='ctx'> </div><div class='del'>-	_leave(" = %d", ret);</div><div class='del'>-	return ret;</div><div class='add'>+	_leave("");</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/cachefiles/error_inject.c b/fs/cachefiles/error_inject.c<br/>new file mode 100644<br/>index 000000000000..e341ade47dd8<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/cachefiles/error_inject.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/cachefiles/error_inject.c</a></div><div class='hunk'>@@ -0,0 +1,36 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='add'>+/* Error injection handling.</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2021 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/sysctl.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+unsigned int cachefiles_error_injection_state;</div><div class='add'>+</div><div class='add'>+static struct ctl_table_header *cachefiles_sysctl;</div><div class='add'>+static const struct ctl_table cachefiles_sysctls[] = {</div><div class='add'>+	{</div><div class='add'>+		.procname	= "error_injection",</div><div class='add'>+		.data		= &amp;cachefiles_error_injection_state,</div><div class='add'>+		.maxlen		= sizeof(unsigned int),</div><div class='add'>+		.mode		= 0644,</div><div class='add'>+		.proc_handler	= proc_douintvec,</div><div class='add'>+	},</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+int __init cachefiles_register_error_injection(void)</div><div class='add'>+{</div><div class='add'>+	cachefiles_sysctl = register_sysctl("cachefiles", cachefiles_sysctls);</div><div class='add'>+	if (!cachefiles_sysctl)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void cachefiles_unregister_error_injection(void)</div><div class='add'>+{</div><div class='add'>+	unregister_sysctl_table(cachefiles_sysctl);</div><div class='add'>+}</div><div class='head'>diff --git a/fs/cachefiles/interface.c b/fs/cachefiles/interface.c<br/>index da28ac1fa225..a08250d244ea 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cachefiles/interface.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/interface.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/cachefiles/interface.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/cachefiles/interface.c</a></div><div class='hunk'>@@ -1,572 +1,461 @@</div><div class='ctx'> // SPDX-License-Identifier: GPL-2.0-or-later</div><div class='ctx'> /* FS-Cache interface to CacheFiles</div><div class='ctx'>  *</div><div class='del'>- * Copyright (C) 2007 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Copyright (C) 2021 Red Hat, Inc. All Rights Reserved.</div><div class='ctx'>  * Written by David Howells (dhowells@redhat.com)</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/mount.h&gt;</div><div class='add'>+#include &lt;linux/xattr.h&gt;</div><div class='add'>+#include &lt;linux/file.h&gt;</div><div class='add'>+#include &lt;linux/namei.h&gt;</div><div class='add'>+#include &lt;linux/falloc.h&gt;</div><div class='add'>+#include &lt;trace/events/fscache.h&gt;</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> </div><div class='del'>-struct cachefiles_lookup_data {</div><div class='del'>-	struct cachefiles_xattr	*auxdata;	/* auxiliary data */</div><div class='del'>-	char			*key;		/* key path */</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static int cachefiles_attr_changed(struct fscache_object *_object);</div><div class='add'>+static atomic_t cachefiles_object_debug_id;</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * allocate an object record for a cookie lookup and prepare the lookup data</div><div class='add'>+ * Allocate a cache object record.</div><div class='ctx'>  */</div><div class='del'>-static struct fscache_object *cachefiles_alloc_object(</div><div class='del'>-	struct fscache_cache *_cache,</div><div class='del'>-	struct fscache_cookie *cookie)</div><div class='add'>+static</div><div class='add'>+struct cachefiles_object *cachefiles_alloc_object(struct fscache_cookie *cookie)</div><div class='ctx'> {</div><div class='del'>-	struct cachefiles_lookup_data *lookup_data;</div><div class='add'>+	struct fscache_volume *vcookie = cookie-&gt;volume;</div><div class='add'>+	struct cachefiles_volume *volume = vcookie-&gt;cache_priv;</div><div class='ctx'> 	struct cachefiles_object *object;</div><div class='del'>-	struct cachefiles_cache *cache;</div><div class='del'>-	struct cachefiles_xattr *auxdata;</div><div class='del'>-	unsigned keylen, auxlen;</div><div class='del'>-	void *buffer, *p;</div><div class='del'>-	char *key;</div><div class='ctx'> </div><div class='del'>-	cache = container_of(_cache, struct cachefiles_cache, cache);</div><div class='add'>+	_enter("{%s},%x,", vcookie-&gt;key, cookie-&gt;debug_id);</div><div class='ctx'> </div><div class='del'>-	_enter("{%s},%x,", cache-&gt;cache.identifier, cookie-&gt;debug_id);</div><div class='del'>-</div><div class='del'>-	lookup_data = kmalloc(sizeof(*lookup_data), cachefiles_gfp);</div><div class='del'>-	if (!lookup_data)</div><div class='del'>-		goto nomem_lookup_data;</div><div class='del'>-</div><div class='del'>-	/* create a new object record and a temporary leaf image */</div><div class='del'>-	object = kmem_cache_alloc(cachefiles_object_jar, cachefiles_gfp);</div><div class='add'>+	object = kmem_cache_zalloc(cachefiles_object_jar, GFP_KERNEL);</div><div class='ctx'> 	if (!object)</div><div class='del'>-		goto nomem_object;</div><div class='del'>-</div><div class='del'>-	ASSERTCMP(object-&gt;backer, ==, NULL);</div><div class='add'>+		return NULL;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(test_bit(CACHEFILES_OBJECT_ACTIVE, &amp;object-&gt;flags));</div><div class='del'>-	atomic_set(&amp;object-&gt;usage, 1);</div><div class='del'>-</div><div class='del'>-	fscache_object_init(&amp;object-&gt;fscache, cookie, &amp;cache-&gt;cache);</div><div class='add'>+	if (cachefiles_ondemand_init_obj_info(object, volume)) {</div><div class='add'>+		kmem_cache_free(cachefiles_object_jar, object);</div><div class='add'>+		return NULL;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	object-&gt;type = cookie-&gt;def-&gt;type;</div><div class='add'>+	refcount_set(&amp;object-&gt;ref, 1);</div><div class='ctx'> </div><div class='del'>-	/* get hold of the raw key</div><div class='del'>-	 * - stick the length on the front and leave space on the back for the</div><div class='del'>-	 *   encoder</div><div class='del'>-	 */</div><div class='del'>-	buffer = kmalloc((2 + 512) + 3, cachefiles_gfp);</div><div class='del'>-	if (!buffer)</div><div class='del'>-		goto nomem_buffer;</div><div class='del'>-</div><div class='del'>-	keylen = cookie-&gt;key_len;</div><div class='del'>-	if (keylen &lt;= sizeof(cookie-&gt;inline_key))</div><div class='del'>-		p = cookie-&gt;inline_key;</div><div class='del'>-	else</div><div class='del'>-		p = cookie-&gt;key;</div><div class='del'>-	memcpy(buffer + 2, p, keylen);</div><div class='del'>-</div><div class='del'>-	*(uint16_t *)buffer = keylen;</div><div class='del'>-	((char *)buffer)[keylen + 2] = 0;</div><div class='del'>-	((char *)buffer)[keylen + 3] = 0;</div><div class='del'>-	((char *)buffer)[keylen + 4] = 0;</div><div class='del'>-</div><div class='del'>-	/* turn the raw key into something that can work with as a filename */</div><div class='del'>-	key = cachefiles_cook_key(buffer, keylen + 2, object-&gt;type);</div><div class='del'>-	if (!key)</div><div class='del'>-		goto nomem_key;</div><div class='del'>-</div><div class='del'>-	/* get hold of the auxiliary data and prepend the object type */</div><div class='del'>-	auxdata = buffer;</div><div class='del'>-	auxlen = cookie-&gt;aux_len;</div><div class='del'>-	if (auxlen) {</div><div class='del'>-		if (auxlen &lt;= sizeof(cookie-&gt;inline_aux))</div><div class='del'>-			p = cookie-&gt;inline_aux;</div><div class='del'>-		else</div><div class='del'>-			p = cookie-&gt;aux;</div><div class='del'>-		memcpy(auxdata-&gt;data, p, auxlen);</div><div class='del'>-	}</div><div class='add'>+	spin_lock_init(&amp;object-&gt;lock);</div><div class='add'>+	INIT_LIST_HEAD(&amp;object-&gt;cache_link);</div><div class='add'>+	object-&gt;volume = volume;</div><div class='add'>+	object-&gt;debug_id = atomic_inc_return(&amp;cachefiles_object_debug_id);</div><div class='add'>+	object-&gt;cookie = fscache_get_cookie(cookie, fscache_cookie_get_attach_object);</div><div class='ctx'> </div><div class='del'>-	auxdata-&gt;len = auxlen + 1;</div><div class='del'>-	auxdata-&gt;type = cookie-&gt;type;</div><div class='del'>-</div><div class='del'>-	lookup_data-&gt;auxdata = auxdata;</div><div class='del'>-	lookup_data-&gt;key = key;</div><div class='del'>-	object-&gt;lookup_data = lookup_data;</div><div class='del'>-</div><div class='del'>-	_leave(" = %x [%p]", object-&gt;fscache.debug_id, lookup_data);</div><div class='del'>-	return &amp;object-&gt;fscache;</div><div class='del'>-</div><div class='del'>-nomem_key:</div><div class='del'>-	kfree(buffer);</div><div class='del'>-nomem_buffer:</div><div class='del'>-	BUG_ON(test_bit(CACHEFILES_OBJECT_ACTIVE, &amp;object-&gt;flags));</div><div class='del'>-	kmem_cache_free(cachefiles_object_jar, object);</div><div class='del'>-	fscache_object_destroyed(&amp;cache-&gt;cache);</div><div class='del'>-nomem_object:</div><div class='del'>-	kfree(lookup_data);</div><div class='del'>-nomem_lookup_data:</div><div class='del'>-	_leave(" = -ENOMEM");</div><div class='del'>-	return ERR_PTR(-ENOMEM);</div><div class='add'>+	fscache_count_object(vcookie-&gt;cache);</div><div class='add'>+	trace_cachefiles_ref(object-&gt;debug_id, cookie-&gt;debug_id, 1,</div><div class='add'>+			     cachefiles_obj_new);</div><div class='add'>+	return object;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * attempt to look up the nominated node in this cache</div><div class='del'>- * - return -ETIMEDOUT to be scheduled again</div><div class='add'>+ * Note that an object has been seen.</div><div class='ctx'>  */</div><div class='del'>-static int cachefiles_lookup_object(struct fscache_object *_object)</div><div class='add'>+void cachefiles_see_object(struct cachefiles_object *object,</div><div class='add'>+			   enum cachefiles_obj_ref_trace why)</div><div class='ctx'> {</div><div class='del'>-	struct cachefiles_lookup_data *lookup_data;</div><div class='del'>-	struct cachefiles_object *parent, *object;</div><div class='del'>-	struct cachefiles_cache *cache;</div><div class='del'>-	const struct cred *saved_cred;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	_enter("{OBJ%x}", _object-&gt;debug_id);</div><div class='del'>-</div><div class='del'>-	cache = container_of(_object-&gt;cache, struct cachefiles_cache, cache);</div><div class='del'>-	parent = container_of(_object-&gt;parent,</div><div class='del'>-			      struct cachefiles_object, fscache);</div><div class='del'>-	object = container_of(_object, struct cachefiles_object, fscache);</div><div class='del'>-	lookup_data = object-&gt;lookup_data;</div><div class='del'>-</div><div class='del'>-	ASSERTCMP(lookup_data, !=, NULL);</div><div class='del'>-</div><div class='del'>-	/* look up the key, creating any missing bits */</div><div class='del'>-	cachefiles_begin_secure(cache, &amp;saved_cred);</div><div class='del'>-	ret = cachefiles_walk_to_object(parent, object,</div><div class='del'>-					lookup_data-&gt;key,</div><div class='del'>-					lookup_data-&gt;auxdata);</div><div class='del'>-	cachefiles_end_secure(cache, saved_cred);</div><div class='del'>-</div><div class='del'>-	/* polish off by setting the attributes of non-index files */</div><div class='del'>-	if (ret == 0 &amp;&amp;</div><div class='del'>-	    object-&gt;fscache.cookie-&gt;def-&gt;type != FSCACHE_COOKIE_TYPE_INDEX)</div><div class='del'>-		cachefiles_attr_changed(&amp;object-&gt;fscache);</div><div class='del'>-</div><div class='del'>-	if (ret &lt; 0 &amp;&amp; ret != -ETIMEDOUT) {</div><div class='del'>-		if (ret != -ENOBUFS)</div><div class='del'>-			pr_warn("Lookup failed error %d\n", ret);</div><div class='del'>-		fscache_object_lookup_error(&amp;object-&gt;fscache);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	_leave(" [%d]", ret);</div><div class='del'>-	return ret;</div><div class='add'>+	trace_cachefiles_ref(object-&gt;debug_id, object-&gt;cookie-&gt;debug_id,</div><div class='add'>+			     refcount_read(&amp;object-&gt;ref), why);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * indication of lookup completion</div><div class='add'>+ * Increment the usage count on an object;</div><div class='ctx'>  */</div><div class='del'>-static void cachefiles_lookup_complete(struct fscache_object *_object)</div><div class='add'>+struct cachefiles_object *cachefiles_grab_object(struct cachefiles_object *object,</div><div class='add'>+						 enum cachefiles_obj_ref_trace why)</div><div class='ctx'> {</div><div class='del'>-	struct cachefiles_object *object;</div><div class='del'>-</div><div class='del'>-	object = container_of(_object, struct cachefiles_object, fscache);</div><div class='add'>+	int r;</div><div class='ctx'> </div><div class='del'>-	_enter("{OBJ%x,%p}", object-&gt;fscache.debug_id, object-&gt;lookup_data);</div><div class='del'>-</div><div class='del'>-	if (object-&gt;lookup_data) {</div><div class='del'>-		kfree(object-&gt;lookup_data-&gt;key);</div><div class='del'>-		kfree(object-&gt;lookup_data-&gt;auxdata);</div><div class='del'>-		kfree(object-&gt;lookup_data);</div><div class='del'>-		object-&gt;lookup_data = NULL;</div><div class='del'>-	}</div><div class='add'>+	__refcount_inc(&amp;object-&gt;ref, &amp;r);</div><div class='add'>+	trace_cachefiles_ref(object-&gt;debug_id, object-&gt;cookie-&gt;debug_id, r, why);</div><div class='add'>+	return object;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * increment the usage count on an inode object (may fail if unmounting)</div><div class='add'>+ * dispose of a reference to an object</div><div class='ctx'>  */</div><div class='del'>-static</div><div class='del'>-struct fscache_object *cachefiles_grab_object(struct fscache_object *_object,</div><div class='del'>-					      enum fscache_obj_ref_trace why)</div><div class='add'>+void cachefiles_put_object(struct cachefiles_object *object,</div><div class='add'>+			   enum cachefiles_obj_ref_trace why)</div><div class='ctx'> {</div><div class='del'>-	struct cachefiles_object *object =</div><div class='del'>-		container_of(_object, struct cachefiles_object, fscache);</div><div class='del'>-	int u;</div><div class='add'>+	unsigned int object_debug_id = object-&gt;debug_id;</div><div class='add'>+	unsigned int cookie_debug_id = object-&gt;cookie-&gt;debug_id;</div><div class='add'>+	struct fscache_cache *cache;</div><div class='add'>+	bool done;</div><div class='add'>+	int r;</div><div class='add'>+</div><div class='add'>+	done = __refcount_dec_and_test(&amp;object-&gt;ref, &amp;r);</div><div class='add'>+	trace_cachefiles_ref(object_debug_id, cookie_debug_id, r, why);</div><div class='add'>+	if (done) {</div><div class='add'>+		_debug("- kill object OBJ%x", object_debug_id);</div><div class='ctx'> </div><div class='del'>-	_enter("{OBJ%x,%d}", _object-&gt;debug_id, atomic_read(&amp;object-&gt;usage));</div><div class='add'>+		ASSERTCMP(object-&gt;file, ==, NULL);</div><div class='ctx'> </div><div class='del'>-#ifdef CACHEFILES_DEBUG_SLAB</div><div class='del'>-	ASSERT((atomic_read(&amp;object-&gt;usage) &amp; 0xffff0000) != 0x6b6b0000);</div><div class='del'>-#endif</div><div class='add'>+		kfree(object-&gt;d_name);</div><div class='add'>+		cachefiles_ondemand_deinit_obj_info(object);</div><div class='add'>+		cache = object-&gt;volume-&gt;cache-&gt;cache;</div><div class='add'>+		fscache_put_cookie(object-&gt;cookie, fscache_cookie_put_object);</div><div class='add'>+		object-&gt;cookie = NULL;</div><div class='add'>+		kmem_cache_free(cachefiles_object_jar, object);</div><div class='add'>+		fscache_uncount_object(cache);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	u = atomic_inc_return(&amp;object-&gt;usage);</div><div class='del'>-	trace_cachefiles_ref(object, _object-&gt;cookie,</div><div class='del'>-			     (enum cachefiles_obj_ref_trace)why, u);</div><div class='del'>-	return &amp;object-&gt;fscache;</div><div class='add'>+	_leave("");</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * update the auxiliary data for an object object on disk</div><div class='add'>+ * Adjust the size of a cache file if necessary to match the DIO size.  We keep</div><div class='add'>+ * the EOF marker a multiple of DIO blocks so that we don't fall back to doing</div><div class='add'>+ * non-DIO for a partial block straddling the EOF, but we also have to be</div><div class='add'>+ * careful of someone expanding the file and accidentally accreting the</div><div class='add'>+ * padding.</div><div class='ctx'>  */</div><div class='del'>-static void cachefiles_update_object(struct fscache_object *_object)</div><div class='add'>+static int cachefiles_adjust_size(struct cachefiles_object *object)</div><div class='ctx'> {</div><div class='del'>-	struct cachefiles_object *object;</div><div class='del'>-	struct cachefiles_xattr *auxdata;</div><div class='del'>-	struct cachefiles_cache *cache;</div><div class='del'>-	struct fscache_cookie *cookie;</div><div class='del'>-	const struct cred *saved_cred;</div><div class='del'>-	const void *aux;</div><div class='del'>-	unsigned auxlen;</div><div class='add'>+	struct iattr newattrs;</div><div class='add'>+	struct file *file = object-&gt;file;</div><div class='add'>+	uint64_t ni_size;</div><div class='add'>+	loff_t oi_size;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	_enter("{OBJ%x}", _object-&gt;debug_id);</div><div class='add'>+	ni_size = object-&gt;cookie-&gt;object_size;</div><div class='add'>+	ni_size = round_up(ni_size, CACHEFILES_DIO_BLOCK_SIZE);</div><div class='ctx'> </div><div class='del'>-	object = container_of(_object, struct cachefiles_object, fscache);</div><div class='del'>-	cache = container_of(object-&gt;fscache.cache, struct cachefiles_cache,</div><div class='del'>-			     cache);</div><div class='add'>+	_enter("{OBJ%x},[%llu]",</div><div class='add'>+	       object-&gt;debug_id, (unsigned long long) ni_size);</div><div class='ctx'> </div><div class='del'>-	if (!fscache_use_cookie(_object)) {</div><div class='del'>-		_leave(" [relinq]");</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='add'>+	if (!file)</div><div class='add'>+		return -ENOBUFS;</div><div class='ctx'> </div><div class='del'>-	cookie = object-&gt;fscache.cookie;</div><div class='del'>-	auxlen = cookie-&gt;aux_len;</div><div class='add'>+	oi_size = i_size_read(file_inode(file));</div><div class='add'>+	if (oi_size == ni_size)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	if (!auxlen) {</div><div class='del'>-		fscache_unuse_cookie(_object);</div><div class='del'>-		_leave(" [no aux]");</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='add'>+	inode_lock(file_inode(file));</div><div class='ctx'> </div><div class='del'>-	auxdata = kmalloc(2 + auxlen + 3, cachefiles_gfp);</div><div class='del'>-	if (!auxdata) {</div><div class='del'>-		fscache_unuse_cookie(_object);</div><div class='del'>-		_leave(" [nomem]");</div><div class='del'>-		return;</div><div class='add'>+	/* if there's an extension to a partial page at the end of the backing</div><div class='add'>+	 * file, we need to discard the partial page so that we pick up new</div><div class='add'>+	 * data after it */</div><div class='add'>+	if (oi_size &amp; ~PAGE_MASK &amp;&amp; ni_size &gt; oi_size) {</div><div class='add'>+		_debug("discard tail %llx", oi_size);</div><div class='add'>+		newattrs.ia_valid = ATTR_SIZE;</div><div class='add'>+		newattrs.ia_size = oi_size &amp; PAGE_MASK;</div><div class='add'>+		ret = cachefiles_inject_remove_error();</div><div class='add'>+		if (ret == 0)</div><div class='add'>+			ret = notify_change(&amp;nop_mnt_idmap, file-&gt;f_path.dentry,</div><div class='add'>+					    &amp;newattrs, NULL);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto truncate_failed;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	aux = (auxlen &lt;= sizeof(cookie-&gt;inline_aux)) ?</div><div class='del'>-		cookie-&gt;inline_aux : cookie-&gt;aux;</div><div class='add'>+	newattrs.ia_valid = ATTR_SIZE;</div><div class='add'>+	newattrs.ia_size = ni_size;</div><div class='add'>+	ret = cachefiles_inject_write_error();</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		ret = notify_change(&amp;nop_mnt_idmap, file-&gt;f_path.dentry,</div><div class='add'>+				    &amp;newattrs, NULL);</div><div class='ctx'> </div><div class='del'>-	memcpy(auxdata-&gt;data, aux, auxlen);</div><div class='del'>-	fscache_unuse_cookie(_object);</div><div class='add'>+truncate_failed:</div><div class='add'>+	inode_unlock(file_inode(file));</div><div class='ctx'> </div><div class='del'>-	auxdata-&gt;len = auxlen + 1;</div><div class='del'>-	auxdata-&gt;type = cookie-&gt;type;</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		trace_cachefiles_io_error(NULL, file_inode(file), ret,</div><div class='add'>+					  cachefiles_trace_notify_change_error);</div><div class='add'>+	if (ret == -EIO) {</div><div class='add'>+		cachefiles_io_error_obj(object, "Size set failed");</div><div class='add'>+		ret = -ENOBUFS;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	cachefiles_begin_secure(cache, &amp;saved_cred);</div><div class='del'>-	cachefiles_update_object_xattr(object, auxdata);</div><div class='del'>-	cachefiles_end_secure(cache, saved_cred);</div><div class='del'>-	kfree(auxdata);</div><div class='del'>-	_leave("");</div><div class='add'>+	_leave(" = %d", ret);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * discard the resources pinned by an object and effect retirement if</div><div class='del'>- * requested</div><div class='add'>+ * Attempt to look up the nominated node in this cache</div><div class='ctx'>  */</div><div class='del'>-static void cachefiles_drop_object(struct fscache_object *_object)</div><div class='add'>+static bool cachefiles_lookup_cookie(struct fscache_cookie *cookie)</div><div class='ctx'> {</div><div class='ctx'> 	struct cachefiles_object *object;</div><div class='del'>-	struct cachefiles_cache *cache;</div><div class='add'>+	struct cachefiles_cache *cache = cookie-&gt;volume-&gt;cache-&gt;cache_priv;</div><div class='ctx'> 	const struct cred *saved_cred;</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	blkcnt_t i_blocks = 0;</div><div class='add'>+	bool success;</div><div class='ctx'> </div><div class='del'>-	ASSERT(_object);</div><div class='add'>+	object = cachefiles_alloc_object(cookie);</div><div class='add'>+	if (!object)</div><div class='add'>+		goto fail;</div><div class='ctx'> </div><div class='del'>-	object = container_of(_object, struct cachefiles_object, fscache);</div><div class='add'>+	_enter("{OBJ%x}", object-&gt;debug_id);</div><div class='ctx'> </div><div class='del'>-	_enter("{OBJ%x,%d}",</div><div class='del'>-	       object-&gt;fscache.debug_id, atomic_read(&amp;object-&gt;usage));</div><div class='add'>+	if (!cachefiles_cook_key(object))</div><div class='add'>+		goto fail_put;</div><div class='ctx'> </div><div class='del'>-	cache = container_of(object-&gt;fscache.cache,</div><div class='del'>-			     struct cachefiles_cache, cache);</div><div class='add'>+	cookie-&gt;cache_priv = object;</div><div class='ctx'> </div><div class='del'>-#ifdef CACHEFILES_DEBUG_SLAB</div><div class='del'>-	ASSERT((atomic_read(&amp;object-&gt;usage) &amp; 0xffff0000) != 0x6b6b0000);</div><div class='del'>-#endif</div><div class='add'>+	cachefiles_begin_secure(cache, &amp;saved_cred);</div><div class='ctx'> </div><div class='del'>-	/* We need to tidy the object up if we did in fact manage to open it.</div><div class='del'>-	 * It's possible for us to get here before the object is fully</div><div class='del'>-	 * initialised if the parent goes away or the object gets retired</div><div class='del'>-	 * before we set it up.</div><div class='del'>-	 */</div><div class='del'>-	if (object-&gt;dentry) {</div><div class='del'>-		/* delete retired objects */</div><div class='del'>-		if (test_bit(FSCACHE_OBJECT_RETIRED, &amp;object-&gt;fscache.flags) &amp;&amp;</div><div class='del'>-		    _object != cache-&gt;cache.fsdef</div><div class='del'>-		    ) {</div><div class='del'>-			_debug("- retire object OBJ%x", object-&gt;fscache.debug_id);</div><div class='del'>-			inode = d_backing_inode(object-&gt;dentry);</div><div class='del'>-			if (inode)</div><div class='del'>-				i_blocks = inode-&gt;i_blocks;</div><div class='del'>-</div><div class='del'>-			cachefiles_begin_secure(cache, &amp;saved_cred);</div><div class='del'>-			cachefiles_delete_object(cache, object);</div><div class='del'>-			cachefiles_end_secure(cache, saved_cred);</div><div class='del'>-		}</div><div class='add'>+	success = cachefiles_look_up_object(object);</div><div class='add'>+	if (!success)</div><div class='add'>+		goto fail_withdraw;</div><div class='ctx'> </div><div class='del'>-		/* close the filesystem stuff attached to the object */</div><div class='del'>-		if (object-&gt;backer != object-&gt;dentry)</div><div class='del'>-			dput(object-&gt;backer);</div><div class='del'>-		object-&gt;backer = NULL;</div><div class='del'>-	}</div><div class='add'>+	cachefiles_see_object(object, cachefiles_obj_see_lookup_cookie);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;cache-&gt;object_list_lock);</div><div class='add'>+	list_add(&amp;object-&gt;cache_link, &amp;cache-&gt;object_list);</div><div class='add'>+	spin_unlock(&amp;cache-&gt;object_list_lock);</div><div class='add'>+	cachefiles_adjust_size(object);</div><div class='ctx'> </div><div class='del'>-	/* note that the object is now inactive */</div><div class='del'>-	if (test_bit(CACHEFILES_OBJECT_ACTIVE, &amp;object-&gt;flags))</div><div class='del'>-		cachefiles_mark_object_inactive(cache, object, i_blocks);</div><div class='add'>+	cachefiles_end_secure(cache, saved_cred);</div><div class='add'>+	_leave(" = t");</div><div class='add'>+	return true;</div><div class='ctx'> </div><div class='del'>-	dput(object-&gt;dentry);</div><div class='del'>-	object-&gt;dentry = NULL;</div><div class='add'>+fail_withdraw:</div><div class='add'>+	cachefiles_end_secure(cache, saved_cred);</div><div class='add'>+	cachefiles_see_object(object, cachefiles_obj_see_lookup_failed);</div><div class='add'>+	fscache_caching_failed(cookie);</div><div class='add'>+	_debug("failed c=%08x o=%08x", cookie-&gt;debug_id, object-&gt;debug_id);</div><div class='add'>+	/* The caller holds an access count on the cookie, so we need them to</div><div class='add'>+	 * drop it before we can withdraw the object.</div><div class='add'>+	 */</div><div class='add'>+	return false;</div><div class='ctx'> </div><div class='del'>-	_leave("");</div><div class='add'>+fail_put:</div><div class='add'>+	cachefiles_put_object(object, cachefiles_obj_put_alloc_fail);</div><div class='add'>+fail:</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * dispose of a reference to an object</div><div class='add'>+ * Shorten the backing object to discard any dirty data and free up</div><div class='add'>+ * any unused granules.</div><div class='ctx'>  */</div><div class='del'>-void cachefiles_put_object(struct fscache_object *_object,</div><div class='del'>-			   enum fscache_obj_ref_trace why)</div><div class='add'>+static bool cachefiles_shorten_object(struct cachefiles_object *object,</div><div class='add'>+				      struct file *file, loff_t new_size)</div><div class='ctx'> {</div><div class='del'>-	struct cachefiles_object *object;</div><div class='del'>-	struct fscache_cache *cache;</div><div class='del'>-	int u;</div><div class='del'>-</div><div class='del'>-	ASSERT(_object);</div><div class='del'>-</div><div class='del'>-	object = container_of(_object, struct cachefiles_object, fscache);</div><div class='del'>-</div><div class='del'>-	_enter("{OBJ%x,%d}",</div><div class='del'>-	       object-&gt;fscache.debug_id, atomic_read(&amp;object-&gt;usage));</div><div class='del'>-</div><div class='del'>-#ifdef CACHEFILES_DEBUG_SLAB</div><div class='del'>-	ASSERT((atomic_read(&amp;object-&gt;usage) &amp; 0xffff0000) != 0x6b6b0000);</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-	ASSERTIFCMP(object-&gt;fscache.parent,</div><div class='del'>-		    object-&gt;fscache.parent-&gt;n_children, &gt;, 0);</div><div class='del'>-</div><div class='del'>-	u = atomic_dec_return(&amp;object-&gt;usage);</div><div class='del'>-	trace_cachefiles_ref(object, _object-&gt;cookie,</div><div class='del'>-			     (enum cachefiles_obj_ref_trace)why, u);</div><div class='del'>-	ASSERTCMP(u, !=, -1);</div><div class='del'>-	if (u == 0) {</div><div class='del'>-		_debug("- kill object OBJ%x", object-&gt;fscache.debug_id);</div><div class='add'>+	struct cachefiles_cache *cache = object-&gt;volume-&gt;cache;</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='add'>+	loff_t i_size, dio_size;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-		ASSERT(!test_bit(CACHEFILES_OBJECT_ACTIVE, &amp;object-&gt;flags));</div><div class='del'>-		ASSERTCMP(object-&gt;fscache.parent, ==, NULL);</div><div class='del'>-		ASSERTCMP(object-&gt;backer, ==, NULL);</div><div class='del'>-		ASSERTCMP(object-&gt;dentry, ==, NULL);</div><div class='del'>-		ASSERTCMP(object-&gt;fscache.n_ops, ==, 0);</div><div class='del'>-		ASSERTCMP(object-&gt;fscache.n_children, ==, 0);</div><div class='add'>+	dio_size = round_up(new_size, CACHEFILES_DIO_BLOCK_SIZE);</div><div class='add'>+	i_size = i_size_read(inode);</div><div class='add'>+</div><div class='add'>+	trace_cachefiles_trunc(object, inode, i_size, dio_size,</div><div class='add'>+			       cachefiles_trunc_shrink);</div><div class='add'>+	ret = cachefiles_inject_remove_error();</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		ret = vfs_truncate(&amp;file-&gt;f_path, dio_size);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		trace_cachefiles_io_error(object, file_inode(file), ret,</div><div class='add'>+					  cachefiles_trace_trunc_error);</div><div class='add'>+		cachefiles_io_error_obj(object, "Trunc-to-size failed %d", ret);</div><div class='add'>+		cachefiles_remove_object_xattr(cache, object, file-&gt;f_path.dentry);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		if (object-&gt;lookup_data) {</div><div class='del'>-			kfree(object-&gt;lookup_data-&gt;key);</div><div class='del'>-			kfree(object-&gt;lookup_data-&gt;auxdata);</div><div class='del'>-			kfree(object-&gt;lookup_data);</div><div class='del'>-			object-&gt;lookup_data = NULL;</div><div class='add'>+	if (new_size &lt; dio_size) {</div><div class='add'>+		trace_cachefiles_trunc(object, inode, dio_size, new_size,</div><div class='add'>+				       cachefiles_trunc_dio_adjust);</div><div class='add'>+		ret = cachefiles_inject_write_error();</div><div class='add'>+		if (ret == 0)</div><div class='add'>+			ret = vfs_fallocate(file, FALLOC_FL_ZERO_RANGE,</div><div class='add'>+					    new_size, dio_size - new_size);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			trace_cachefiles_io_error(object, file_inode(file), ret,</div><div class='add'>+						  cachefiles_trace_fallocate_error);</div><div class='add'>+			cachefiles_io_error_obj(object, "Trunc-to-dio-size failed %d", ret);</div><div class='add'>+			cachefiles_remove_object_xattr(cache, object, file-&gt;f_path.dentry);</div><div class='add'>+			return false;</div><div class='ctx'> 		}</div><div class='del'>-</div><div class='del'>-		cache = object-&gt;fscache.cache;</div><div class='del'>-		fscache_object_destroy(&amp;object-&gt;fscache);</div><div class='del'>-		kmem_cache_free(cachefiles_object_jar, object);</div><div class='del'>-		fscache_object_destroyed(cache);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	_leave("");</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * sync a cache</div><div class='add'>+ * Resize the backing object.</div><div class='ctx'>  */</div><div class='del'>-static void cachefiles_sync_cache(struct fscache_cache *_cache)</div><div class='add'>+static void cachefiles_resize_cookie(struct netfs_cache_resources *cres,</div><div class='add'>+				     loff_t new_size)</div><div class='ctx'> {</div><div class='del'>-	struct cachefiles_cache *cache;</div><div class='add'>+	struct cachefiles_object *object = cachefiles_cres_object(cres);</div><div class='add'>+	struct cachefiles_cache *cache = object-&gt;volume-&gt;cache;</div><div class='add'>+	struct fscache_cookie *cookie = object-&gt;cookie;</div><div class='ctx'> 	const struct cred *saved_cred;</div><div class='del'>-	int ret;</div><div class='add'>+	struct file *file = cachefiles_cres_file(cres);</div><div class='add'>+	loff_t old_size = cookie-&gt;object_size;</div><div class='ctx'> </div><div class='del'>-	_enter("%s", _cache-&gt;tag-&gt;name);</div><div class='add'>+	_enter("%llu-&gt;%llu", old_size, new_size);</div><div class='ctx'> </div><div class='del'>-	cache = container_of(_cache, struct cachefiles_cache, cache);</div><div class='del'>-</div><div class='del'>-	/* make sure all pages pinned by operations on behalf of the netfs are</div><div class='del'>-	 * written to disc */</div><div class='del'>-	cachefiles_begin_secure(cache, &amp;saved_cred);</div><div class='del'>-	down_read(&amp;cache-&gt;mnt-&gt;mnt_sb-&gt;s_umount);</div><div class='del'>-	ret = sync_filesystem(cache-&gt;mnt-&gt;mnt_sb);</div><div class='del'>-	up_read(&amp;cache-&gt;mnt-&gt;mnt_sb-&gt;s_umount);</div><div class='del'>-	cachefiles_end_secure(cache, saved_cred);</div><div class='add'>+	if (new_size &lt; old_size) {</div><div class='add'>+		cachefiles_begin_secure(cache, &amp;saved_cred);</div><div class='add'>+		cachefiles_shorten_object(object, file, new_size);</div><div class='add'>+		cachefiles_end_secure(cache, saved_cred);</div><div class='add'>+		object-&gt;cookie-&gt;object_size = new_size;</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (ret == -EIO)</div><div class='del'>-		cachefiles_io_error(cache,</div><div class='del'>-				    "Attempt to sync backing fs superblock"</div><div class='del'>-				    " returned error %d",</div><div class='del'>-				    ret);</div><div class='add'>+	/* The file is being expanded.  We don't need to do anything</div><div class='add'>+	 * particularly.  cookie-&gt;initial_size doesn't change and so the point</div><div class='add'>+	 * at which we have to download before doesn't change.</div><div class='add'>+	 */</div><div class='add'>+	cookie-&gt;object_size = new_size;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * check if the backing cache is updated to FS-Cache</div><div class='del'>- * - called by FS-Cache when evaluates if need to invalidate the cache</div><div class='add'>+ * Commit changes to the object as we drop it.</div><div class='ctx'>  */</div><div class='del'>-static int cachefiles_check_consistency(struct fscache_operation *op)</div><div class='add'>+static void cachefiles_commit_object(struct cachefiles_object *object,</div><div class='add'>+				     struct cachefiles_cache *cache)</div><div class='ctx'> {</div><div class='del'>-	struct cachefiles_object *object;</div><div class='del'>-	struct cachefiles_cache *cache;</div><div class='del'>-	const struct cred *saved_cred;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	_enter("{OBJ%x}", op-&gt;object-&gt;debug_id);</div><div class='del'>-</div><div class='del'>-	object = container_of(op-&gt;object, struct cachefiles_object, fscache);</div><div class='del'>-	cache = container_of(object-&gt;fscache.cache,</div><div class='del'>-			     struct cachefiles_cache, cache);</div><div class='add'>+	bool update = false;</div><div class='ctx'> </div><div class='del'>-	cachefiles_begin_secure(cache, &amp;saved_cred);</div><div class='del'>-	ret = cachefiles_check_auxdata(object);</div><div class='del'>-	cachefiles_end_secure(cache, saved_cred);</div><div class='add'>+	if (test_and_clear_bit(FSCACHE_COOKIE_LOCAL_WRITE, &amp;object-&gt;cookie-&gt;flags))</div><div class='add'>+		update = true;</div><div class='add'>+	if (test_and_clear_bit(FSCACHE_COOKIE_NEEDS_UPDATE, &amp;object-&gt;cookie-&gt;flags))</div><div class='add'>+		update = true;</div><div class='add'>+	if (update)</div><div class='add'>+		cachefiles_set_object_xattr(object);</div><div class='ctx'> </div><div class='del'>-	_leave(" = %d", ret);</div><div class='del'>-	return ret;</div><div class='add'>+	if (test_bit(CACHEFILES_OBJECT_USING_TMPFILE, &amp;object-&gt;flags))</div><div class='add'>+		cachefiles_commit_tmpfile(cache, object);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * notification the attributes on an object have changed</div><div class='del'>- * - called with reads/writes excluded by FS-Cache</div><div class='add'>+ * Finalise and object and close the VFS structs that we have.</div><div class='ctx'>  */</div><div class='del'>-static int cachefiles_attr_changed(struct fscache_object *_object)</div><div class='add'>+static void cachefiles_clean_up_object(struct cachefiles_object *object,</div><div class='add'>+				       struct cachefiles_cache *cache)</div><div class='ctx'> {</div><div class='del'>-	struct cachefiles_object *object;</div><div class='del'>-	struct cachefiles_cache *cache;</div><div class='del'>-	const struct cred *saved_cred;</div><div class='del'>-	struct iattr newattrs;</div><div class='del'>-	uint64_t ni_size;</div><div class='del'>-	loff_t oi_size;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ni_size = _object-&gt;store_limit_l;</div><div class='del'>-</div><div class='del'>-	_enter("{OBJ%x},[%llu]",</div><div class='del'>-	       _object-&gt;debug_id, (unsigned long long) ni_size);</div><div class='del'>-</div><div class='del'>-	object = container_of(_object, struct cachefiles_object, fscache);</div><div class='del'>-	cache = container_of(object-&gt;fscache.cache,</div><div class='del'>-			     struct cachefiles_cache, cache);</div><div class='del'>-</div><div class='del'>-	if (ni_size == object-&gt;i_size)</div><div class='del'>-		return 0;</div><div class='add'>+	struct file *file;</div><div class='add'>+</div><div class='add'>+	if (test_bit(FSCACHE_COOKIE_RETIRED, &amp;object-&gt;cookie-&gt;flags)) {</div><div class='add'>+		if (!test_bit(CACHEFILES_OBJECT_USING_TMPFILE, &amp;object-&gt;flags)) {</div><div class='add'>+			cachefiles_see_object(object, cachefiles_obj_see_clean_delete);</div><div class='add'>+			_debug("- inval object OBJ%x", object-&gt;debug_id);</div><div class='add'>+			cachefiles_delete_object(object, FSCACHE_OBJECT_WAS_RETIRED);</div><div class='add'>+		} else {</div><div class='add'>+			cachefiles_see_object(object, cachefiles_obj_see_clean_drop_tmp);</div><div class='add'>+			_debug("- inval object OBJ%x tmpfile", object-&gt;debug_id);</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		cachefiles_see_object(object, cachefiles_obj_see_clean_commit);</div><div class='add'>+		cachefiles_commit_object(object, cache);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (!object-&gt;backer)</div><div class='del'>-		return -ENOBUFS;</div><div class='add'>+	cachefiles_unmark_inode_in_use(object, object-&gt;file);</div><div class='ctx'> </div><div class='del'>-	ASSERT(d_is_reg(object-&gt;backer));</div><div class='add'>+	spin_lock(&amp;object-&gt;lock);</div><div class='add'>+	file = object-&gt;file;</div><div class='add'>+	object-&gt;file = NULL;</div><div class='add'>+	spin_unlock(&amp;object-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	fscache_set_store_limit(&amp;object-&gt;fscache, ni_size);</div><div class='add'>+	if (file)</div><div class='add'>+		fput(file);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	oi_size = i_size_read(d_backing_inode(object-&gt;backer));</div><div class='del'>-	if (oi_size == ni_size)</div><div class='del'>-		return 0;</div><div class='add'>+/*</div><div class='add'>+ * Withdraw caching for a cookie.</div><div class='add'>+ */</div><div class='add'>+static void cachefiles_withdraw_cookie(struct fscache_cookie *cookie)</div><div class='add'>+{</div><div class='add'>+	struct cachefiles_object *object = cookie-&gt;cache_priv;</div><div class='add'>+	struct cachefiles_cache *cache = object-&gt;volume-&gt;cache;</div><div class='add'>+	const struct cred *saved_cred;</div><div class='ctx'> </div><div class='del'>-	cachefiles_begin_secure(cache, &amp;saved_cred);</div><div class='del'>-	inode_lock(d_inode(object-&gt;backer));</div><div class='add'>+	_enter("o=%x", object-&gt;debug_id);</div><div class='add'>+	cachefiles_see_object(object, cachefiles_obj_see_withdraw_cookie);</div><div class='ctx'> </div><div class='del'>-	/* if there's an extension to a partial page at the end of the backing</div><div class='del'>-	 * file, we need to discard the partial page so that we pick up new</div><div class='del'>-	 * data after it */</div><div class='del'>-	if (oi_size &amp; ~PAGE_MASK &amp;&amp; ni_size &gt; oi_size) {</div><div class='del'>-		_debug("discard tail %llx", oi_size);</div><div class='del'>-		newattrs.ia_valid = ATTR_SIZE;</div><div class='del'>-		newattrs.ia_size = oi_size &amp; PAGE_MASK;</div><div class='del'>-		ret = notify_change(&amp;init_user_ns, object-&gt;backer, &amp;newattrs, NULL);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			goto truncate_failed;</div><div class='add'>+	if (!list_empty(&amp;object-&gt;cache_link)) {</div><div class='add'>+		spin_lock(&amp;cache-&gt;object_list_lock);</div><div class='add'>+		cachefiles_see_object(object, cachefiles_obj_see_withdrawal);</div><div class='add'>+		list_del_init(&amp;object-&gt;cache_link);</div><div class='add'>+		spin_unlock(&amp;cache-&gt;object_list_lock);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	newattrs.ia_valid = ATTR_SIZE;</div><div class='del'>-	newattrs.ia_size = ni_size;</div><div class='del'>-	ret = notify_change(&amp;init_user_ns, object-&gt;backer, &amp;newattrs, NULL);</div><div class='add'>+	cachefiles_ondemand_clean_object(object);</div><div class='ctx'> </div><div class='del'>-truncate_failed:</div><div class='del'>-	inode_unlock(d_inode(object-&gt;backer));</div><div class='del'>-	cachefiles_end_secure(cache, saved_cred);</div><div class='del'>-</div><div class='del'>-	if (ret == -EIO) {</div><div class='del'>-		fscache_set_store_limit(&amp;object-&gt;fscache, 0);</div><div class='del'>-		cachefiles_io_error_obj(object, "Size set failed");</div><div class='del'>-		ret = -ENOBUFS;</div><div class='add'>+	if (object-&gt;file) {</div><div class='add'>+		cachefiles_begin_secure(cache, &amp;saved_cred);</div><div class='add'>+		cachefiles_clean_up_object(object, cache);</div><div class='add'>+		cachefiles_end_secure(cache, saved_cred);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	_leave(" = %d", ret);</div><div class='del'>-	return ret;</div><div class='add'>+	cookie-&gt;cache_priv = NULL;</div><div class='add'>+	cachefiles_put_object(object, cachefiles_obj_put_detach);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Invalidate an object</div><div class='add'>+ * Invalidate the storage associated with a cookie.</div><div class='ctx'>  */</div><div class='del'>-static void cachefiles_invalidate_object(struct fscache_operation *op)</div><div class='add'>+static bool cachefiles_invalidate_cookie(struct fscache_cookie *cookie)</div><div class='ctx'> {</div><div class='del'>-	struct cachefiles_object *object;</div><div class='del'>-	struct cachefiles_cache *cache;</div><div class='del'>-	const struct cred *saved_cred;</div><div class='del'>-	struct path path;</div><div class='del'>-	uint64_t ni_size;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	object = container_of(op-&gt;object, struct cachefiles_object, fscache);</div><div class='del'>-	cache = container_of(object-&gt;fscache.cache,</div><div class='del'>-			     struct cachefiles_cache, cache);</div><div class='del'>-</div><div class='del'>-	ni_size = op-&gt;object-&gt;store_limit_l;</div><div class='del'>-</div><div class='del'>-	_enter("{OBJ%x},[%llu]",</div><div class='del'>-	       op-&gt;object-&gt;debug_id, (unsigned long long)ni_size);</div><div class='del'>-</div><div class='del'>-	if (object-&gt;backer) {</div><div class='del'>-		ASSERT(d_is_reg(object-&gt;backer));</div><div class='add'>+	struct cachefiles_object *object = cookie-&gt;cache_priv;</div><div class='add'>+	struct file *new_file, *old_file;</div><div class='add'>+	bool old_tmpfile;</div><div class='ctx'> </div><div class='del'>-		fscache_set_store_limit(&amp;object-&gt;fscache, ni_size);</div><div class='add'>+	_enter("o=%x,[%llu]", object-&gt;debug_id, object-&gt;cookie-&gt;object_size);</div><div class='ctx'> </div><div class='del'>-		path.dentry = object-&gt;backer;</div><div class='del'>-		path.mnt = cache-&gt;mnt;</div><div class='add'>+	old_tmpfile = test_bit(CACHEFILES_OBJECT_USING_TMPFILE, &amp;object-&gt;flags);</div><div class='ctx'> </div><div class='del'>-		cachefiles_begin_secure(cache, &amp;saved_cred);</div><div class='del'>-		ret = vfs_truncate(&amp;path, 0);</div><div class='del'>-		if (ret == 0)</div><div class='del'>-			ret = vfs_truncate(&amp;path, ni_size);</div><div class='del'>-		cachefiles_end_secure(cache, saved_cred);</div><div class='add'>+	if (!object-&gt;file) {</div><div class='add'>+		fscache_resume_after_invalidation(cookie);</div><div class='add'>+		_leave(" = t [light]");</div><div class='add'>+		return true;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		if (ret != 0) {</div><div class='del'>-			fscache_set_store_limit(&amp;object-&gt;fscache, 0);</div><div class='del'>-			if (ret == -EIO)</div><div class='del'>-				cachefiles_io_error_obj(object,</div><div class='del'>-							"Invalidate failed");</div><div class='add'>+	new_file = cachefiles_create_tmpfile(object);</div><div class='add'>+	if (IS_ERR(new_file))</div><div class='add'>+		goto failed;</div><div class='add'>+</div><div class='add'>+	/* Substitute the VFS target */</div><div class='add'>+	_debug("sub");</div><div class='add'>+	spin_lock(&amp;object-&gt;lock);</div><div class='add'>+</div><div class='add'>+	old_file = object-&gt;file;</div><div class='add'>+	object-&gt;file = new_file;</div><div class='add'>+	object-&gt;content_info = CACHEFILES_CONTENT_NO_DATA;</div><div class='add'>+	set_bit(CACHEFILES_OBJECT_USING_TMPFILE, &amp;object-&gt;flags);</div><div class='add'>+	set_bit(FSCACHE_COOKIE_NEEDS_UPDATE, &amp;object-&gt;cookie-&gt;flags);</div><div class='add'>+</div><div class='add'>+	spin_unlock(&amp;object-&gt;lock);</div><div class='add'>+	_debug("subbed");</div><div class='add'>+</div><div class='add'>+	/* Allow I/O to take place again */</div><div class='add'>+	fscache_resume_after_invalidation(cookie);</div><div class='add'>+</div><div class='add'>+	if (old_file) {</div><div class='add'>+		if (!old_tmpfile) {</div><div class='add'>+			struct cachefiles_volume *volume = object-&gt;volume;</div><div class='add'>+			struct dentry *fan = volume-&gt;fanout[(u8)cookie-&gt;key_hash];</div><div class='add'>+			struct dentry *obj;</div><div class='add'>+</div><div class='add'>+			obj = start_removing_dentry(fan, old_file-&gt;f_path.dentry);</div><div class='add'>+			if (!IS_ERR(obj))</div><div class='add'>+				cachefiles_bury_object(volume-&gt;cache, object,</div><div class='add'>+						       fan, obj,</div><div class='add'>+						       FSCACHE_OBJECT_INVALIDATED);</div><div class='ctx'> 		}</div><div class='add'>+		fput(old_file);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	fscache_op_complete(op, true);</div><div class='del'>-	_leave("");</div><div class='del'>-}</div><div class='add'>+	_leave(" = t");</div><div class='add'>+	return true;</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * dissociate a cache from all the pages it was backing</div><div class='del'>- */</div><div class='del'>-static void cachefiles_dissociate_pages(struct fscache_cache *cache)</div><div class='del'>-{</div><div class='del'>-	_enter("");</div><div class='add'>+failed:</div><div class='add'>+	_leave(" = f");</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct fscache_cache_ops cachefiles_cache_ops = {</div><div class='ctx'> 	.name			= "cachefiles",</div><div class='del'>-	.alloc_object		= cachefiles_alloc_object,</div><div class='del'>-	.lookup_object		= cachefiles_lookup_object,</div><div class='del'>-	.lookup_complete	= cachefiles_lookup_complete,</div><div class='del'>-	.grab_object		= cachefiles_grab_object,</div><div class='del'>-	.update_object		= cachefiles_update_object,</div><div class='del'>-	.invalidate_object	= cachefiles_invalidate_object,</div><div class='del'>-	.drop_object		= cachefiles_drop_object,</div><div class='del'>-	.put_object		= cachefiles_put_object,</div><div class='del'>-	.sync_cache		= cachefiles_sync_cache,</div><div class='del'>-	.attr_changed		= cachefiles_attr_changed,</div><div class='del'>-	.read_or_alloc_page	= cachefiles_read_or_alloc_page,</div><div class='del'>-	.read_or_alloc_pages	= cachefiles_read_or_alloc_pages,</div><div class='del'>-	.allocate_page		= cachefiles_allocate_page,</div><div class='del'>-	.allocate_pages		= cachefiles_allocate_pages,</div><div class='del'>-	.write_page		= cachefiles_write_page,</div><div class='del'>-	.uncache_page		= cachefiles_uncache_page,</div><div class='del'>-	.dissociate_pages	= cachefiles_dissociate_pages,</div><div class='del'>-	.check_consistency	= cachefiles_check_consistency,</div><div class='del'>-	.begin_read_operation	= cachefiles_begin_read_operation,</div><div class='add'>+	.acquire_volume		= cachefiles_acquire_volume,</div><div class='add'>+	.free_volume		= cachefiles_free_volume,</div><div class='add'>+	.lookup_cookie		= cachefiles_lookup_cookie,</div><div class='add'>+	.withdraw_cookie	= cachefiles_withdraw_cookie,</div><div class='add'>+	.invalidate_cookie	= cachefiles_invalidate_cookie,</div><div class='add'>+	.begin_operation	= cachefiles_begin_operation,</div><div class='add'>+	.resize_cookie		= cachefiles_resize_cookie,</div><div class='add'>+	.prepare_to_write	= cachefiles_prepare_to_write,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/cachefiles/internal.h b/fs/cachefiles/internal.h<br/>index 0a511c36dab8..b62cd3e9a18e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cachefiles/internal.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/internal.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/cachefiles/internal.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/cachefiles/internal.h</a></div><div class='hunk'>@@ -1,7 +1,7 @@</div><div class='ctx'> /* SPDX-License-Identifier: GPL-2.0-or-later */</div><div class='ctx'> /* General netfs cache on cache files internal defs</div><div class='ctx'>  *</div><div class='del'>- * Copyright (C) 2007 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Copyright (C) 2021 Red Hat, Inc. All Rights Reserved.</div><div class='ctx'>  * Written by David Howells (dhowells@redhat.com)</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='hunk'>@@ -13,58 +13,93 @@</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/fscache-cache.h&gt;</div><div class='del'>-#include &lt;linux/timer.h&gt;</div><div class='del'>-#include &lt;linux/wait_bit.h&gt;</div><div class='ctx'> #include &lt;linux/cred.h&gt;</div><div class='del'>-#include &lt;linux/workqueue.h&gt;</div><div class='ctx'> #include &lt;linux/security.h&gt;</div><div class='add'>+#include &lt;linux/xarray.h&gt;</div><div class='add'>+#include &lt;linux/cachefiles.h&gt;</div><div class='add'>+</div><div class='add'>+#define CACHEFILES_DIO_BLOCK_SIZE 4096</div><div class='ctx'> </div><div class='ctx'> struct cachefiles_cache;</div><div class='ctx'> struct cachefiles_object;</div><div class='ctx'> </div><div class='del'>-extern unsigned cachefiles_debug;</div><div class='del'>-#define CACHEFILES_DEBUG_KENTER	1</div><div class='del'>-#define CACHEFILES_DEBUG_KLEAVE	2</div><div class='del'>-#define CACHEFILES_DEBUG_KDEBUG	4</div><div class='add'>+enum cachefiles_content {</div><div class='add'>+	/* These values are saved on disk */</div><div class='add'>+	CACHEFILES_CONTENT_NO_DATA	= 0, /* No content stored */</div><div class='add'>+	CACHEFILES_CONTENT_SINGLE	= 1, /* Content is monolithic, all is present */</div><div class='add'>+	CACHEFILES_CONTENT_ALL		= 2, /* Content is all present, no map */</div><div class='add'>+	CACHEFILES_CONTENT_BACKFS_MAP	= 3, /* Content is piecemeal, mapped through backing fs */</div><div class='add'>+	CACHEFILES_CONTENT_DIRTY	= 4, /* Content is dirty (only seen on disk) */</div><div class='add'>+	nr__cachefiles_content</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-#define cachefiles_gfp (__GFP_RECLAIM | __GFP_NORETRY | __GFP_NOMEMALLOC)</div><div class='add'>+/*</div><div class='add'>+ * Cached volume representation.</div><div class='add'>+ */</div><div class='add'>+struct cachefiles_volume {</div><div class='add'>+	struct cachefiles_cache		*cache;</div><div class='add'>+	struct list_head		cache_link;	/* Link in cache-&gt;volumes */</div><div class='add'>+	struct fscache_volume		*vcookie;	/* The netfs's representation */</div><div class='add'>+	struct dentry			*dentry;	/* The volume dentry */</div><div class='add'>+	struct dentry			*fanout[256];	/* Fanout subdirs */</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+enum cachefiles_object_state {</div><div class='add'>+	CACHEFILES_ONDEMAND_OBJSTATE_CLOSE, /* Anonymous fd closed by daemon or initial state */</div><div class='add'>+	CACHEFILES_ONDEMAND_OBJSTATE_OPEN, /* Anonymous fd associated with object is available */</div><div class='add'>+	CACHEFILES_ONDEMAND_OBJSTATE_REOPENING, /* Object that was closed and is being reopened. */</div><div class='add'>+	CACHEFILES_ONDEMAND_OBJSTATE_DROPPING, /* Object is being dropped. */</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct cachefiles_ondemand_info {</div><div class='add'>+	struct work_struct		ondemand_work;</div><div class='add'>+	int				ondemand_id;</div><div class='add'>+	enum cachefiles_object_state	state;</div><div class='add'>+	struct cachefiles_object	*object;</div><div class='add'>+	spinlock_t			lock;</div><div class='add'>+};</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * node records</div><div class='add'>+ * Backing file state.</div><div class='ctx'>  */</div><div class='ctx'> struct cachefiles_object {</div><div class='del'>-	struct fscache_object		fscache;	/* fscache handle */</div><div class='del'>-	struct cachefiles_lookup_data	*lookup_data;	/* cached lookup data */</div><div class='del'>-	struct dentry			*dentry;	/* the file/dir representing this object */</div><div class='del'>-	struct dentry			*backer;	/* backing file */</div><div class='del'>-	loff_t				i_size;		/* object size */</div><div class='add'>+	struct fscache_cookie		*cookie;	/* Netfs data storage object cookie */</div><div class='add'>+	struct cachefiles_volume	*volume;	/* Cache volume that holds this object */</div><div class='add'>+	struct list_head		cache_link;	/* Link in cache-&gt;*_list */</div><div class='add'>+	struct file			*file;		/* The file representing this object */</div><div class='add'>+	char				*d_name;	/* Backing file name */</div><div class='add'>+	int				debug_id;</div><div class='add'>+	spinlock_t			lock;</div><div class='add'>+	refcount_t			ref;</div><div class='add'>+	enum cachefiles_content		content_info:8;	/* Info about content presence */</div><div class='ctx'> 	unsigned long			flags;</div><div class='del'>-#define CACHEFILES_OBJECT_ACTIVE	0		/* T if marked active */</div><div class='del'>-	atomic_t			usage;		/* object usage count */</div><div class='del'>-	uint8_t				type;		/* object type */</div><div class='del'>-	uint8_t				new;		/* T if object new */</div><div class='del'>-	spinlock_t			work_lock;</div><div class='del'>-	struct rb_node			active_node;	/* link in active tree (dentry is key) */</div><div class='add'>+#define CACHEFILES_OBJECT_USING_TMPFILE	0		/* Have an unlinked tmpfile */</div><div class='add'>+#ifdef CONFIG_CACHEFILES_ONDEMAND</div><div class='add'>+	struct cachefiles_ondemand_info	*ondemand;</div><div class='add'>+#endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-extern struct kmem_cache *cachefiles_object_jar;</div><div class='add'>+#define CACHEFILES_ONDEMAND_ID_CLOSED	-1</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Cache files cache definition</div><div class='ctx'>  */</div><div class='ctx'> struct cachefiles_cache {</div><div class='del'>-	struct fscache_cache		cache;		/* FS-Cache record */</div><div class='add'>+	struct fscache_cache		*cache;		/* Cache cookie */</div><div class='ctx'> 	struct vfsmount			*mnt;		/* mountpoint holding the cache */</div><div class='add'>+	struct dentry			*store;		/* Directory into which live objects go */</div><div class='ctx'> 	struct dentry			*graveyard;	/* directory into which dead objects go */</div><div class='ctx'> 	struct file			*cachefilesd;	/* manager daemon handle */</div><div class='add'>+	struct list_head		volumes;	/* List of volume objects */</div><div class='add'>+	struct list_head		object_list;	/* List of active objects */</div><div class='add'>+	spinlock_t			object_list_lock; /* Lock for volumes and object_list */</div><div class='ctx'> 	const struct cred		*cache_cred;	/* security override for accessing cache */</div><div class='ctx'> 	struct mutex			daemon_mutex;	/* command serialisation mutex */</div><div class='ctx'> 	wait_queue_head_t		daemon_pollwq;	/* poll waitqueue for daemon */</div><div class='del'>-	struct rb_root			active_nodes;	/* active nodes (can't be culled) */</div><div class='del'>-	rwlock_t			active_lock;	/* lock for active_nodes */</div><div class='ctx'> 	atomic_t			gravecounter;	/* graveyard uniquifier */</div><div class='ctx'> 	atomic_t			f_released;	/* number of objects released lately */</div><div class='ctx'> 	atomic_long_t			b_released;	/* number of blocks released lately */</div><div class='add'>+	atomic_long_t			b_writing;	/* Number of blocks being written */</div><div class='ctx'> 	unsigned			frun_percent;	/* when to stop culling (% files) */</div><div class='ctx'> 	unsigned			fcull_percent;	/* when to start culling (% files) */</div><div class='ctx'> 	unsigned			fstop_percent;	/* when to stop allocating (% files) */</div><div class='hunk'>@@ -72,7 +107,7 @@ struct cachefiles_cache {</div><div class='ctx'> 	unsigned			bcull_percent;	/* when to start culling (% blocks) */</div><div class='ctx'> 	unsigned			bstop_percent;	/* when to stop allocating (% blocks) */</div><div class='ctx'> 	unsigned			bsize;		/* cache's block size */</div><div class='del'>-	unsigned			bshift;		/* min(ilog2(PAGE_SIZE / bsize), 0) */</div><div class='add'>+	unsigned			bshift;		/* ilog2(bsize) */</div><div class='ctx'> 	uint64_t			frun;		/* when to stop culling */</div><div class='ctx'> 	uint64_t			fcull;		/* when to start culling */</div><div class='ctx'> 	uint64_t			fstop;		/* when to stop allocating */</div><div class='hunk'>@@ -84,44 +119,49 @@ struct cachefiles_cache {</div><div class='ctx'> #define CACHEFILES_DEAD			1	/* T if cache dead */</div><div class='ctx'> #define CACHEFILES_CULLING		2	/* T if cull engaged */</div><div class='ctx'> #define CACHEFILES_STATE_CHANGED	3	/* T if state changed (poll trigger) */</div><div class='add'>+#define CACHEFILES_ONDEMAND_MODE	4	/* T if in on-demand read mode */</div><div class='ctx'> 	char				*rootdirname;	/* name of cache root directory */</div><div class='del'>-	char				*secctx;	/* LSM security context */</div><div class='ctx'> 	char				*tag;		/* cache binding tag */</div><div class='add'>+	refcount_t			unbind_pincount;/* refcount to do daemon unbind */</div><div class='add'>+	struct xarray			reqs;		/* xarray of pending on-demand requests */</div><div class='add'>+	unsigned long			req_id_next;</div><div class='add'>+	struct xarray			ondemand_ids;	/* xarray for ondemand_id allocation */</div><div class='add'>+	u32				ondemand_id_next;</div><div class='add'>+	u32				msg_id_next;</div><div class='add'>+	u32				secid;		/* LSM security id */</div><div class='add'>+	bool				have_secid;	/* whether "secid" was set */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * backing file read tracking</div><div class='del'>- */</div><div class='del'>-struct cachefiles_one_read {</div><div class='del'>-	wait_queue_entry_t			monitor;	/* link into monitored waitqueue */</div><div class='del'>-	struct page			*back_page;	/* backing file page we're waiting for */</div><div class='del'>-	struct page			*netfs_page;	/* netfs page we're going to fill */</div><div class='del'>-	struct fscache_retrieval	*op;		/* retrieval op covering this */</div><div class='del'>-	struct list_head		op_link;	/* link in op's todo list */</div><div class='del'>-};</div><div class='add'>+static inline bool cachefiles_in_ondemand_mode(struct cachefiles_cache *cache)</div><div class='add'>+{</div><div class='add'>+	return IS_ENABLED(CONFIG_CACHEFILES_ONDEMAND) &amp;&amp;</div><div class='add'>+		test_bit(CACHEFILES_ONDEMAND_MODE, &amp;cache-&gt;flags);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * backing file write tracking</div><div class='del'>- */</div><div class='del'>-struct cachefiles_one_write {</div><div class='del'>-	struct page			*netfs_page;	/* netfs page to copy */</div><div class='del'>-	struct cachefiles_object	*object;</div><div class='del'>-	struct list_head		obj_link;	/* link in object's lists */</div><div class='del'>-	fscache_rw_complete_t		end_io_func;</div><div class='del'>-	void				*context;</div><div class='add'>+struct cachefiles_req {</div><div class='add'>+	struct cachefiles_object *object;</div><div class='add'>+	struct completion done;</div><div class='add'>+	refcount_t ref;</div><div class='add'>+	int error;</div><div class='add'>+	struct cachefiles_msg msg;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * auxiliary data xattr buffer</div><div class='del'>- */</div><div class='del'>-struct cachefiles_xattr {</div><div class='del'>-	uint16_t			len;</div><div class='del'>-	uint8_t				type;</div><div class='del'>-	uint8_t				data[];</div><div class='del'>-};</div><div class='add'>+#define CACHEFILES_REQ_NEW	XA_MARK_1</div><div class='ctx'> </div><div class='ctx'> #include &lt;trace/events/cachefiles.h&gt;</div><div class='ctx'> </div><div class='add'>+static inline</div><div class='add'>+struct file *cachefiles_cres_file(struct netfs_cache_resources *cres)</div><div class='add'>+{</div><div class='add'>+	return cres-&gt;cache_priv2;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline</div><div class='add'>+struct cachefiles_object *cachefiles_cres_object(struct netfs_cache_resources *cres)</div><div class='add'>+{</div><div class='add'>+	return fscache_cres_cookie(cres)-&gt;cache_priv;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * note change of state for daemon</div><div class='ctx'>  */</div><div class='hunk'>@@ -132,74 +172,215 @@ static inline void cachefiles_state_changed(struct cachefiles_cache *cache)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * bind.c</div><div class='add'>+ * cache.c</div><div class='ctx'>  */</div><div class='del'>-extern int cachefiles_daemon_bind(struct cachefiles_cache *cache, char *args);</div><div class='del'>-extern void cachefiles_daemon_unbind(struct cachefiles_cache *cache);</div><div class='add'>+extern int cachefiles_add_cache(struct cachefiles_cache *cache);</div><div class='add'>+extern void cachefiles_withdraw_cache(struct cachefiles_cache *cache);</div><div class='add'>+</div><div class='add'>+enum cachefiles_has_space_for {</div><div class='add'>+	cachefiles_has_space_check,</div><div class='add'>+	cachefiles_has_space_for_write,</div><div class='add'>+	cachefiles_has_space_for_create,</div><div class='add'>+};</div><div class='add'>+extern int cachefiles_has_space(struct cachefiles_cache *cache,</div><div class='add'>+				unsigned fnr, unsigned bnr,</div><div class='add'>+				enum cachefiles_has_space_for reason);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * daemon.c</div><div class='ctx'>  */</div><div class='ctx'> extern const struct file_operations cachefiles_daemon_fops;</div><div class='add'>+extern void cachefiles_flush_reqs(struct cachefiles_cache *cache);</div><div class='add'>+extern void cachefiles_get_unbind_pincount(struct cachefiles_cache *cache);</div><div class='add'>+extern void cachefiles_put_unbind_pincount(struct cachefiles_cache *cache);</div><div class='ctx'> </div><div class='del'>-extern int cachefiles_has_space(struct cachefiles_cache *cache,</div><div class='del'>-				unsigned fnr, unsigned bnr);</div><div class='add'>+/*</div><div class='add'>+ * error_inject.c</div><div class='add'>+ */</div><div class='add'>+#ifdef CONFIG_CACHEFILES_ERROR_INJECTION</div><div class='add'>+extern unsigned int cachefiles_error_injection_state;</div><div class='add'>+extern int cachefiles_register_error_injection(void);</div><div class='add'>+extern void cachefiles_unregister_error_injection(void);</div><div class='add'>+</div><div class='add'>+#else</div><div class='add'>+#define cachefiles_error_injection_state 0</div><div class='add'>+</div><div class='add'>+static inline int cachefiles_register_error_injection(void)</div><div class='add'>+{</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void cachefiles_unregister_error_injection(void)</div><div class='add'>+{</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+</div><div class='add'>+static inline int cachefiles_inject_read_error(void)</div><div class='add'>+{</div><div class='add'>+	return cachefiles_error_injection_state &amp; 2 ? -EIO : 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int cachefiles_inject_write_error(void)</div><div class='add'>+{</div><div class='add'>+	return cachefiles_error_injection_state &amp; 2 ? -EIO :</div><div class='add'>+		cachefiles_error_injection_state &amp; 1 ? -ENOSPC :</div><div class='add'>+		0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int cachefiles_inject_remove_error(void)</div><div class='add'>+{</div><div class='add'>+	return cachefiles_error_injection_state &amp; 2 ? -EIO : 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * interface.c</div><div class='ctx'>  */</div><div class='ctx'> extern const struct fscache_cache_ops cachefiles_cache_ops;</div><div class='add'>+extern void cachefiles_see_object(struct cachefiles_object *object,</div><div class='add'>+				  enum cachefiles_obj_ref_trace why);</div><div class='add'>+extern struct cachefiles_object *cachefiles_grab_object(struct cachefiles_object *object,</div><div class='add'>+							enum cachefiles_obj_ref_trace why);</div><div class='add'>+extern void cachefiles_put_object(struct cachefiles_object *object,</div><div class='add'>+				  enum cachefiles_obj_ref_trace why);</div><div class='ctx'> </div><div class='del'>-void cachefiles_put_object(struct fscache_object *_object,</div><div class='del'>-			   enum fscache_obj_ref_trace why);</div><div class='add'>+/*</div><div class='add'>+ * io.c</div><div class='add'>+ */</div><div class='add'>+extern bool cachefiles_begin_operation(struct netfs_cache_resources *cres,</div><div class='add'>+				       enum fscache_want_state want_state);</div><div class='add'>+extern int __cachefiles_prepare_write(struct cachefiles_object *object,</div><div class='add'>+				      struct file *file,</div><div class='add'>+				      loff_t *_start, size_t *_len, size_t upper_len,</div><div class='add'>+				      bool no_space_allocated_yet);</div><div class='add'>+extern int __cachefiles_write(struct cachefiles_object *object,</div><div class='add'>+			      struct file *file,</div><div class='add'>+			      loff_t start_pos,</div><div class='add'>+			      struct iov_iter *iter,</div><div class='add'>+			      netfs_io_terminated_t term_func,</div><div class='add'>+			      void *term_func_priv);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * key.c</div><div class='ctx'>  */</div><div class='del'>-extern char *cachefiles_cook_key(const u8 *raw, int keylen, uint8_t type);</div><div class='add'>+extern bool cachefiles_cook_key(struct cachefiles_object *object);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * main.c</div><div class='add'>+ */</div><div class='add'>+extern struct kmem_cache *cachefiles_object_jar;</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * namei.c</div><div class='ctx'>  */</div><div class='del'>-extern void cachefiles_mark_object_inactive(struct cachefiles_cache *cache,</div><div class='del'>-					    struct cachefiles_object *object,</div><div class='del'>-					    blkcnt_t i_blocks);</div><div class='del'>-extern int cachefiles_delete_object(struct cachefiles_cache *cache,</div><div class='del'>-				    struct cachefiles_object *object);</div><div class='del'>-extern int cachefiles_walk_to_object(struct cachefiles_object *parent,</div><div class='del'>-				     struct cachefiles_object *object,</div><div class='del'>-				     const char *key,</div><div class='del'>-				     struct cachefiles_xattr *auxdata);</div><div class='add'>+extern void cachefiles_unmark_inode_in_use(struct cachefiles_object *object,</div><div class='add'>+					   struct file *file);</div><div class='add'>+extern int cachefiles_bury_object(struct cachefiles_cache *cache,</div><div class='add'>+				  struct cachefiles_object *object,</div><div class='add'>+				  struct dentry *dir,</div><div class='add'>+				  struct dentry *rep,</div><div class='add'>+				  enum fscache_why_object_killed why);</div><div class='add'>+extern int cachefiles_delete_object(struct cachefiles_object *object,</div><div class='add'>+				    enum fscache_why_object_killed why);</div><div class='add'>+extern bool cachefiles_look_up_object(struct cachefiles_object *object);</div><div class='ctx'> extern struct dentry *cachefiles_get_directory(struct cachefiles_cache *cache,</div><div class='ctx'> 					       struct dentry *dir,</div><div class='del'>-					       const char *name);</div><div class='add'>+					       const char *name,</div><div class='add'>+					       bool *_is_new);</div><div class='add'>+extern void cachefiles_put_directory(struct dentry *dir);</div><div class='ctx'> </div><div class='ctx'> extern int cachefiles_cull(struct cachefiles_cache *cache, struct dentry *dir,</div><div class='ctx'> 			   char *filename);</div><div class='ctx'> </div><div class='ctx'> extern int cachefiles_check_in_use(struct cachefiles_cache *cache,</div><div class='ctx'> 				   struct dentry *dir, char *filename);</div><div class='add'>+extern struct file *cachefiles_create_tmpfile(struct cachefiles_object *object);</div><div class='add'>+extern bool cachefiles_commit_tmpfile(struct cachefiles_cache *cache,</div><div class='add'>+				      struct cachefiles_object *object);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * rdwr.c</div><div class='add'>+ * ondemand.c</div><div class='ctx'>  */</div><div class='del'>-extern int cachefiles_read_or_alloc_page(struct fscache_retrieval *,</div><div class='del'>-					 struct page *, gfp_t);</div><div class='del'>-extern int cachefiles_read_or_alloc_pages(struct fscache_retrieval *,</div><div class='del'>-					  struct list_head *, unsigned *,</div><div class='del'>-					  gfp_t);</div><div class='del'>-extern int cachefiles_allocate_page(struct fscache_retrieval *, struct page *,</div><div class='del'>-				    gfp_t);</div><div class='del'>-extern int cachefiles_allocate_pages(struct fscache_retrieval *,</div><div class='del'>-				     struct list_head *, unsigned *, gfp_t);</div><div class='del'>-extern int cachefiles_write_page(struct fscache_storage *, struct page *);</div><div class='del'>-extern void cachefiles_uncache_page(struct fscache_object *, struct page *);</div><div class='add'>+#ifdef CONFIG_CACHEFILES_ONDEMAND</div><div class='add'>+extern ssize_t cachefiles_ondemand_daemon_read(struct cachefiles_cache *cache,</div><div class='add'>+					char __user *_buffer, size_t buflen);</div><div class='add'>+</div><div class='add'>+extern int cachefiles_ondemand_copen(struct cachefiles_cache *cache,</div><div class='add'>+				     char *args);</div><div class='add'>+</div><div class='add'>+extern int cachefiles_ondemand_restore(struct cachefiles_cache *cache,</div><div class='add'>+					char *args);</div><div class='add'>+</div><div class='add'>+extern int cachefiles_ondemand_init_object(struct cachefiles_object *object);</div><div class='add'>+extern void cachefiles_ondemand_clean_object(struct cachefiles_object *object);</div><div class='add'>+</div><div class='add'>+extern int cachefiles_ondemand_read(struct cachefiles_object *object,</div><div class='add'>+				    loff_t pos, size_t len);</div><div class='add'>+</div><div class='add'>+extern int cachefiles_ondemand_init_obj_info(struct cachefiles_object *obj,</div><div class='add'>+					struct cachefiles_volume *volume);</div><div class='add'>+extern void cachefiles_ondemand_deinit_obj_info(struct cachefiles_object *obj);</div><div class='add'>+</div><div class='add'>+#define CACHEFILES_OBJECT_STATE_FUNCS(_state, _STATE)	\</div><div class='add'>+static inline bool								\</div><div class='add'>+cachefiles_ondemand_object_is_##_state(const struct cachefiles_object *object) \</div><div class='add'>+{												\</div><div class='add'>+	return object-&gt;ondemand-&gt;state == CACHEFILES_ONDEMAND_OBJSTATE_##_STATE; \</div><div class='add'>+}												\</div><div class='add'>+												\</div><div class='add'>+static inline void								\</div><div class='add'>+cachefiles_ondemand_set_object_##_state(struct cachefiles_object *object) \</div><div class='add'>+{												\</div><div class='add'>+	object-&gt;ondemand-&gt;state = CACHEFILES_ONDEMAND_OBJSTATE_##_STATE; \</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * rdwr2.c</div><div class='del'>- */</div><div class='del'>-extern int cachefiles_begin_read_operation(struct netfs_read_request *,</div><div class='del'>-					   struct fscache_retrieval *);</div><div class='add'>+CACHEFILES_OBJECT_STATE_FUNCS(open, OPEN);</div><div class='add'>+CACHEFILES_OBJECT_STATE_FUNCS(close, CLOSE);</div><div class='add'>+CACHEFILES_OBJECT_STATE_FUNCS(reopening, REOPENING);</div><div class='add'>+CACHEFILES_OBJECT_STATE_FUNCS(dropping, DROPPING);</div><div class='add'>+</div><div class='add'>+static inline bool cachefiles_ondemand_is_reopening_read(struct cachefiles_req *req)</div><div class='add'>+{</div><div class='add'>+	return cachefiles_ondemand_object_is_reopening(req-&gt;object) &amp;&amp;</div><div class='add'>+			req-&gt;msg.opcode == CACHEFILES_OP_READ;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#else</div><div class='add'>+static inline ssize_t cachefiles_ondemand_daemon_read(struct cachefiles_cache *cache,</div><div class='add'>+					char __user *_buffer, size_t buflen)</div><div class='add'>+{</div><div class='add'>+	return -EOPNOTSUPP;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int cachefiles_ondemand_init_object(struct cachefiles_object *object)</div><div class='add'>+{</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void cachefiles_ondemand_clean_object(struct cachefiles_object *object)</div><div class='add'>+{</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int cachefiles_ondemand_read(struct cachefiles_object *object,</div><div class='add'>+					   loff_t pos, size_t len)</div><div class='add'>+{</div><div class='add'>+	return -EOPNOTSUPP;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int cachefiles_ondemand_init_obj_info(struct cachefiles_object *obj,</div><div class='add'>+						struct cachefiles_volume *volume)</div><div class='add'>+{</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+static inline void cachefiles_ondemand_deinit_obj_info(struct cachefiles_object *obj)</div><div class='add'>+{</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool cachefiles_ondemand_is_reopening_read(struct cachefiles_req *req)</div><div class='add'>+{</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * security.c</div><div class='hunk'>@@ -222,44 +403,55 @@ static inline void cachefiles_end_secure(struct cachefiles_cache *cache,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * volume.c</div><div class='add'>+ */</div><div class='add'>+void cachefiles_acquire_volume(struct fscache_volume *volume);</div><div class='add'>+void cachefiles_free_volume(struct fscache_volume *volume);</div><div class='add'>+void cachefiles_withdraw_volume(struct cachefiles_volume *volume);</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * xattr.c</div><div class='ctx'>  */</div><div class='del'>-extern int cachefiles_check_object_type(struct cachefiles_object *object);</div><div class='del'>-extern int cachefiles_set_object_xattr(struct cachefiles_object *object,</div><div class='del'>-				       struct cachefiles_xattr *auxdata);</div><div class='del'>-extern int cachefiles_update_object_xattr(struct cachefiles_object *object,</div><div class='del'>-					  struct cachefiles_xattr *auxdata);</div><div class='del'>-extern int cachefiles_check_auxdata(struct cachefiles_object *object);</div><div class='del'>-extern int cachefiles_check_object_xattr(struct cachefiles_object *object,</div><div class='del'>-					 struct cachefiles_xattr *auxdata);</div><div class='add'>+extern int cachefiles_set_object_xattr(struct cachefiles_object *object);</div><div class='add'>+extern int cachefiles_check_auxdata(struct cachefiles_object *object,</div><div class='add'>+				    struct file *file);</div><div class='ctx'> extern int cachefiles_remove_object_xattr(struct cachefiles_cache *cache,</div><div class='add'>+					  struct cachefiles_object *object,</div><div class='ctx'> 					  struct dentry *dentry);</div><div class='del'>-</div><div class='add'>+extern void cachefiles_prepare_to_write(struct fscache_cookie *cookie);</div><div class='add'>+extern bool cachefiles_set_volume_xattr(struct cachefiles_volume *volume);</div><div class='add'>+extern int cachefiles_check_volume_xattr(struct cachefiles_volume *volume);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * error handling</div><div class='add'>+ * Error handling</div><div class='ctx'>  */</div><div class='del'>-</div><div class='ctx'> #define cachefiles_io_error(___cache, FMT, ...)		\</div><div class='ctx'> do {							\</div><div class='ctx'> 	pr_err("I/O Error: " FMT"\n", ##__VA_ARGS__);	\</div><div class='del'>-	fscache_io_error(&amp;(___cache)-&gt;cache);		\</div><div class='add'>+	fscache_io_error((___cache)-&gt;cache);		\</div><div class='ctx'> 	set_bit(CACHEFILES_DEAD, &amp;(___cache)-&gt;flags);	\</div><div class='add'>+	if (cachefiles_in_ondemand_mode(___cache))	\</div><div class='add'>+		cachefiles_flush_reqs(___cache);	\</div><div class='ctx'> } while (0)</div><div class='ctx'> </div><div class='ctx'> #define cachefiles_io_error_obj(object, FMT, ...)			\</div><div class='ctx'> do {									\</div><div class='ctx'> 	struct cachefiles_cache *___cache;				\</div><div class='ctx'> 									\</div><div class='del'>-	___cache = container_of((object)-&gt;fscache.cache,		\</div><div class='del'>-				struct cachefiles_cache, cache);	\</div><div class='del'>-	cachefiles_io_error(___cache, FMT, ##__VA_ARGS__);		\</div><div class='add'>+	___cache = (object)-&gt;volume-&gt;cache;				\</div><div class='add'>+	cachefiles_io_error(___cache, FMT " [o=%08x]", ##__VA_ARGS__,	\</div><div class='add'>+			    (object)-&gt;debug_id);			\</div><div class='ctx'> } while (0)</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * debug tracing</div><div class='add'>+ * Debug tracing</div><div class='ctx'>  */</div><div class='add'>+extern unsigned cachefiles_debug;</div><div class='add'>+#define CACHEFILES_DEBUG_KENTER	1</div><div class='add'>+#define CACHEFILES_DEBUG_KLEAVE	2</div><div class='add'>+#define CACHEFILES_DEBUG_KDEBUG	4</div><div class='add'>+</div><div class='ctx'> #define dbgprintk(FMT, ...) \</div><div class='ctx'> 	printk(KERN_DEBUG "[%-6.6s] "FMT"\n", current-&gt;comm, ##__VA_ARGS__)</div><div class='ctx'> </div><div class='head'>diff --git a/fs/cachefiles/io.c b/fs/cachefiles/io.c<br/>index effe37ef8629..3e0576d9db1d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cachefiles/io.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/io.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/cachefiles/io.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/cachefiles/io.c</a></div><div class='hunk'>@@ -9,8 +9,11 @@</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/file.h&gt;</div><div class='ctx'> #include &lt;linux/uio.h&gt;</div><div class='add'>+#include &lt;linux/bio.h&gt;</div><div class='add'>+#include &lt;linux/falloc.h&gt;</div><div class='ctx'> #include &lt;linux/sched/mm.h&gt;</div><div class='del'>-#include &lt;linux/netfs.h&gt;</div><div class='add'>+#include &lt;trace/events/fscache.h&gt;</div><div class='add'>+#include &lt;trace/events/netfs.h&gt;</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> </div><div class='ctx'> struct cachefiles_kiocb {</div><div class='hunk'>@@ -21,14 +24,18 @@ struct cachefiles_kiocb {</div><div class='ctx'> 		size_t		skipped;</div><div class='ctx'> 		size_t		len;</div><div class='ctx'> 	};</div><div class='add'>+	struct cachefiles_object *object;</div><div class='ctx'> 	netfs_io_terminated_t	term_func;</div><div class='ctx'> 	void			*term_func_priv;</div><div class='ctx'> 	bool			was_async;</div><div class='add'>+	unsigned int		inval_counter;	/* Copy of cookie-&gt;inval_counter */</div><div class='add'>+	u64			b_writing;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static inline void cachefiles_put_kiocb(struct cachefiles_kiocb *ki)</div><div class='ctx'> {</div><div class='ctx'> 	if (refcount_dec_and_test(&amp;ki-&gt;ki_refcnt)) {</div><div class='add'>+		cachefiles_put_object(ki-&gt;object, cachefiles_obj_put_ioreq);</div><div class='ctx'> 		fput(ki-&gt;iocb.ki_filp);</div><div class='ctx'> 		kfree(ki);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -40,13 +47,23 @@ static inline void cachefiles_put_kiocb(struct cachefiles_kiocb *ki)</div><div class='ctx'> static void cachefiles_read_complete(struct kiocb *iocb, long ret)</div><div class='ctx'> {</div><div class='ctx'> 	struct cachefiles_kiocb *ki = container_of(iocb, struct cachefiles_kiocb, iocb);</div><div class='add'>+	struct inode *inode = file_inode(ki-&gt;iocb.ki_filp);</div><div class='ctx'> </div><div class='ctx'> 	_enter("%ld", ret);</div><div class='ctx'> </div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		trace_cachefiles_io_error(ki-&gt;object, inode, ret,</div><div class='add'>+					  cachefiles_trace_read_error);</div><div class='add'>+</div><div class='ctx'> 	if (ki-&gt;term_func) {</div><div class='del'>-		if (ret &gt;= 0)</div><div class='del'>-			ret += ki-&gt;skipped;</div><div class='del'>-		ki-&gt;term_func(ki-&gt;term_func_priv, ret, ki-&gt;was_async);</div><div class='add'>+		if (ret &gt;= 0) {</div><div class='add'>+			if (ki-&gt;object-&gt;cookie-&gt;inval_counter == ki-&gt;inval_counter)</div><div class='add'>+				ki-&gt;skipped += ret;</div><div class='add'>+			else</div><div class='add'>+				ret = -ESTALE;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		ki-&gt;term_func(ki-&gt;term_func_priv, ret);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	cachefiles_put_kiocb(ki);</div><div class='hunk'>@@ -58,16 +75,24 @@ static void cachefiles_read_complete(struct kiocb *iocb, long ret)</div><div class='ctx'> static int cachefiles_read(struct netfs_cache_resources *cres,</div><div class='ctx'> 			   loff_t start_pos,</div><div class='ctx'> 			   struct iov_iter *iter,</div><div class='del'>-			   bool seek_data,</div><div class='add'>+			   enum netfs_read_from_hole read_hole,</div><div class='ctx'> 			   netfs_io_terminated_t term_func,</div><div class='ctx'> 			   void *term_func_priv)</div><div class='ctx'> {</div><div class='add'>+	struct cachefiles_object *object;</div><div class='ctx'> 	struct cachefiles_kiocb *ki;</div><div class='del'>-	struct file *file = cres-&gt;cache_priv2;</div><div class='add'>+	struct file *file;</div><div class='ctx'> 	unsigned int old_nofs;</div><div class='ctx'> 	ssize_t ret = -ENOBUFS;</div><div class='ctx'> 	size_t len = iov_iter_count(iter), skipped = 0;</div><div class='ctx'> </div><div class='add'>+	if (!fscache_wait_for_operation(cres, FSCACHE_WANT_READ))</div><div class='add'>+		goto presubmission_error;</div><div class='add'>+</div><div class='add'>+	fscache_count_read();</div><div class='add'>+	object = cachefiles_cres_object(cres);</div><div class='add'>+	file = cachefiles_cres_file(cres);</div><div class='add'>+</div><div class='ctx'> 	_enter("%pD,%li,%llx,%zx/%llx",</div><div class='ctx'> 	       file, file_inode(file)-&gt;i_ino, start_pos, len,</div><div class='ctx'> 	       i_size_read(file_inode(file)));</div><div class='hunk'>@@ -75,10 +100,12 @@ static int cachefiles_read(struct netfs_cache_resources *cres,</div><div class='ctx'> 	/* If the caller asked us to seek for data before doing the read, then</div><div class='ctx'> 	 * we should do that now.  If we find a gap, we fill it with zeros.</div><div class='ctx'> 	 */</div><div class='del'>-	if (seek_data) {</div><div class='add'>+	if (read_hole != NETFS_READ_HOLE_IGNORE) {</div><div class='ctx'> 		loff_t off = start_pos, off2;</div><div class='ctx'> </div><div class='del'>-		off2 = vfs_llseek(file, off, SEEK_DATA);</div><div class='add'>+		off2 = cachefiles_inject_read_error();</div><div class='add'>+		if (off2 == 0)</div><div class='add'>+			off2 = vfs_llseek(file, off, SEEK_DATA);</div><div class='ctx'> 		if (off2 &lt; 0 &amp;&amp; off2 &gt;= (loff_t)-MAX_ERRNO &amp;&amp; off2 != -ENXIO) {</div><div class='ctx'> 			skipped = 0;</div><div class='ctx'> 			ret = off2;</div><div class='hunk'>@@ -90,6 +117,10 @@ static int cachefiles_read(struct netfs_cache_resources *cres,</div><div class='ctx'> 			 * in the region, so clear the rest of the buffer and</div><div class='ctx'> 			 * return success.</div><div class='ctx'> 			 */</div><div class='add'>+			ret = -ENODATA;</div><div class='add'>+			if (read_hole == NETFS_READ_HOLE_FAIL)</div><div class='add'>+				goto presubmission_error;</div><div class='add'>+</div><div class='ctx'> 			iov_iter_zero(len, iter);</div><div class='ctx'> 			skipped = len;</div><div class='ctx'> 			ret = 0;</div><div class='hunk'>@@ -100,7 +131,7 @@ static int cachefiles_read(struct netfs_cache_resources *cres,</div><div class='ctx'> 		iov_iter_zero(skipped, iter);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = -ENOBUFS;</div><div class='add'>+	ret = -ENOMEM;</div><div class='ctx'> 	ki = kzalloc(sizeof(struct cachefiles_kiocb), GFP_KERNEL);</div><div class='ctx'> 	if (!ki)</div><div class='ctx'> 		goto presubmission_error;</div><div class='hunk'>@@ -109,9 +140,10 @@ static int cachefiles_read(struct netfs_cache_resources *cres,</div><div class='ctx'> 	ki-&gt;iocb.ki_filp	= file;</div><div class='ctx'> 	ki-&gt;iocb.ki_pos		= start_pos + skipped;</div><div class='ctx'> 	ki-&gt;iocb.ki_flags	= IOCB_DIRECT;</div><div class='del'>-	ki-&gt;iocb.ki_hint	= ki_hint_validate(file_write_hint(file));</div><div class='ctx'> 	ki-&gt;iocb.ki_ioprio	= get_current_ioprio();</div><div class='ctx'> 	ki-&gt;skipped		= skipped;</div><div class='add'>+	ki-&gt;object		= object;</div><div class='add'>+	ki-&gt;inval_counter	= cres-&gt;inval_counter;</div><div class='ctx'> 	ki-&gt;term_func		= term_func;</div><div class='ctx'> 	ki-&gt;term_func_priv	= term_func_priv;</div><div class='ctx'> 	ki-&gt;was_async		= true;</div><div class='hunk'>@@ -120,9 +152,13 @@ static int cachefiles_read(struct netfs_cache_resources *cres,</div><div class='ctx'> 		ki-&gt;iocb.ki_complete = cachefiles_read_complete;</div><div class='ctx'> </div><div class='ctx'> 	get_file(ki-&gt;iocb.ki_filp);</div><div class='add'>+	cachefiles_grab_object(object, cachefiles_obj_get_ioreq);</div><div class='ctx'> </div><div class='add'>+	trace_cachefiles_read(object, file_inode(file), ki-&gt;iocb.ki_pos, len - skipped);</div><div class='ctx'> 	old_nofs = memalloc_nofs_save();</div><div class='del'>-	ret = vfs_iocb_iter_read(file, &amp;ki-&gt;iocb, iter);</div><div class='add'>+	ret = cachefiles_inject_read_error();</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		ret = vfs_iocb_iter_read(file, &amp;ki-&gt;iocb, iter);</div><div class='ctx'> 	memalloc_nofs_restore(old_nofs);</div><div class='ctx'> 	switch (ret) {</div><div class='ctx'> 	case -EIOCBQUEUED:</div><div class='hunk'>@@ -152,82 +188,148 @@ in_progress:</div><div class='ctx'> </div><div class='ctx'> presubmission_error:</div><div class='ctx'> 	if (term_func)</div><div class='del'>-		term_func(term_func_priv, ret &lt; 0 ? ret : skipped, false);</div><div class='add'>+		term_func(term_func_priv, ret &lt; 0 ? ret : skipped);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * Query the occupancy of the cache in a region, returning where the next chunk</div><div class='add'>+ * of data starts and how long it is.</div><div class='add'>+ */</div><div class='add'>+static int cachefiles_query_occupancy(struct netfs_cache_resources *cres,</div><div class='add'>+				      loff_t start, size_t len, size_t granularity,</div><div class='add'>+				      loff_t *_data_start, size_t *_data_len)</div><div class='add'>+{</div><div class='add'>+	struct cachefiles_object *object;</div><div class='add'>+	struct file *file;</div><div class='add'>+	loff_t off, off2;</div><div class='add'>+</div><div class='add'>+	*_data_start = -1;</div><div class='add'>+	*_data_len = 0;</div><div class='add'>+</div><div class='add'>+	if (!fscache_wait_for_operation(cres, FSCACHE_WANT_READ))</div><div class='add'>+		return -ENOBUFS;</div><div class='add'>+</div><div class='add'>+	object = cachefiles_cres_object(cres);</div><div class='add'>+	file = cachefiles_cres_file(cres);</div><div class='add'>+	granularity = max_t(size_t, object-&gt;volume-&gt;cache-&gt;bsize, granularity);</div><div class='add'>+</div><div class='add'>+	_enter("%pD,%li,%llx,%zx/%llx",</div><div class='add'>+	       file, file_inode(file)-&gt;i_ino, start, len,</div><div class='add'>+	       i_size_read(file_inode(file)));</div><div class='add'>+</div><div class='add'>+	off = cachefiles_inject_read_error();</div><div class='add'>+	if (off == 0)</div><div class='add'>+		off = vfs_llseek(file, start, SEEK_DATA);</div><div class='add'>+	if (off == -ENXIO)</div><div class='add'>+		return -ENODATA; /* Beyond EOF */</div><div class='add'>+	if (off &lt; 0 &amp;&amp; off &gt;= (loff_t)-MAX_ERRNO)</div><div class='add'>+		return -ENOBUFS; /* Error. */</div><div class='add'>+	if (round_up(off, granularity) &gt;= start + len)</div><div class='add'>+		return -ENODATA; /* No data in range */</div><div class='add'>+</div><div class='add'>+	off2 = cachefiles_inject_read_error();</div><div class='add'>+	if (off2 == 0)</div><div class='add'>+		off2 = vfs_llseek(file, off, SEEK_HOLE);</div><div class='add'>+	if (off2 == -ENXIO)</div><div class='add'>+		return -ENODATA; /* Beyond EOF */</div><div class='add'>+	if (off2 &lt; 0 &amp;&amp; off2 &gt;= (loff_t)-MAX_ERRNO)</div><div class='add'>+		return -ENOBUFS; /* Error. */</div><div class='add'>+</div><div class='add'>+	/* Round away partial blocks */</div><div class='add'>+	off = round_up(off, granularity);</div><div class='add'>+	off2 = round_down(off2, granularity);</div><div class='add'>+	if (off2 &lt;= off)</div><div class='add'>+		return -ENODATA;</div><div class='add'>+</div><div class='add'>+	*_data_start = off;</div><div class='add'>+	if (off2 &gt; start + len)</div><div class='add'>+		*_data_len = len;</div><div class='add'>+	else</div><div class='add'>+		*_data_len = off2 - off;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * Handle completion of a write to the cache.</div><div class='ctx'>  */</div><div class='ctx'> static void cachefiles_write_complete(struct kiocb *iocb, long ret)</div><div class='ctx'> {</div><div class='ctx'> 	struct cachefiles_kiocb *ki = container_of(iocb, struct cachefiles_kiocb, iocb);</div><div class='add'>+	struct cachefiles_object *object = ki-&gt;object;</div><div class='ctx'> 	struct inode *inode = file_inode(ki-&gt;iocb.ki_filp);</div><div class='ctx'> </div><div class='ctx'> 	_enter("%ld", ret);</div><div class='ctx'> </div><div class='del'>-	/* Tell lockdep we inherited freeze protection from submission thread */</div><div class='del'>-	__sb_writers_acquired(inode-&gt;i_sb, SB_FREEZE_WRITE);</div><div class='del'>-	__sb_end_write(inode-&gt;i_sb, SB_FREEZE_WRITE);</div><div class='add'>+	if (ki-&gt;was_async)</div><div class='add'>+		kiocb_end_write(iocb);</div><div class='ctx'> </div><div class='del'>-	if (ki-&gt;term_func)</div><div class='del'>-		ki-&gt;term_func(ki-&gt;term_func_priv, ret, ki-&gt;was_async);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		trace_cachefiles_io_error(object, inode, ret,</div><div class='add'>+					  cachefiles_trace_write_error);</div><div class='ctx'> </div><div class='add'>+	atomic_long_sub(ki-&gt;b_writing, &amp;object-&gt;volume-&gt;cache-&gt;b_writing);</div><div class='add'>+	set_bit(FSCACHE_COOKIE_HAVE_DATA, &amp;object-&gt;cookie-&gt;flags);</div><div class='add'>+	if (ki-&gt;term_func)</div><div class='add'>+		ki-&gt;term_func(ki-&gt;term_func_priv, ret);</div><div class='ctx'> 	cachefiles_put_kiocb(ki);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Initiate a write to the cache.</div><div class='ctx'>  */</div><div class='del'>-static int cachefiles_write(struct netfs_cache_resources *cres,</div><div class='del'>-			    loff_t start_pos,</div><div class='del'>-			    struct iov_iter *iter,</div><div class='del'>-			    netfs_io_terminated_t term_func,</div><div class='del'>-			    void *term_func_priv)</div><div class='add'>+int __cachefiles_write(struct cachefiles_object *object,</div><div class='add'>+		       struct file *file,</div><div class='add'>+		       loff_t start_pos,</div><div class='add'>+		       struct iov_iter *iter,</div><div class='add'>+		       netfs_io_terminated_t term_func,</div><div class='add'>+		       void *term_func_priv)</div><div class='ctx'> {</div><div class='add'>+	struct cachefiles_cache *cache;</div><div class='ctx'> 	struct cachefiles_kiocb *ki;</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	struct file *file = cres-&gt;cache_priv2;</div><div class='ctx'> 	unsigned int old_nofs;</div><div class='del'>-	ssize_t ret = -ENOBUFS;</div><div class='add'>+	ssize_t ret;</div><div class='ctx'> 	size_t len = iov_iter_count(iter);</div><div class='ctx'> </div><div class='add'>+	fscache_count_write();</div><div class='add'>+	cache = object-&gt;volume-&gt;cache;</div><div class='add'>+</div><div class='ctx'> 	_enter("%pD,%li,%llx,%zx/%llx",</div><div class='ctx'> 	       file, file_inode(file)-&gt;i_ino, start_pos, len,</div><div class='ctx'> 	       i_size_read(file_inode(file)));</div><div class='ctx'> </div><div class='ctx'> 	ki = kzalloc(sizeof(struct cachefiles_kiocb), GFP_KERNEL);</div><div class='del'>-	if (!ki)</div><div class='del'>-		goto presubmission_error;</div><div class='add'>+	if (!ki) {</div><div class='add'>+		if (term_func)</div><div class='add'>+			term_func(term_func_priv, -ENOMEM);</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	refcount_set(&amp;ki-&gt;ki_refcnt, 2);</div><div class='ctx'> 	ki-&gt;iocb.ki_filp	= file;</div><div class='ctx'> 	ki-&gt;iocb.ki_pos		= start_pos;</div><div class='ctx'> 	ki-&gt;iocb.ki_flags	= IOCB_DIRECT | IOCB_WRITE;</div><div class='del'>-	ki-&gt;iocb.ki_hint	= ki_hint_validate(file_write_hint(file));</div><div class='ctx'> 	ki-&gt;iocb.ki_ioprio	= get_current_ioprio();</div><div class='add'>+	ki-&gt;object		= object;</div><div class='ctx'> 	ki-&gt;start		= start_pos;</div><div class='ctx'> 	ki-&gt;len			= len;</div><div class='ctx'> 	ki-&gt;term_func		= term_func;</div><div class='ctx'> 	ki-&gt;term_func_priv	= term_func_priv;</div><div class='ctx'> 	ki-&gt;was_async		= true;</div><div class='add'>+	ki-&gt;b_writing		= (len + (1 &lt;&lt; cache-&gt;bshift) - 1) &gt;&gt; cache-&gt;bshift;</div><div class='ctx'> </div><div class='ctx'> 	if (ki-&gt;term_func)</div><div class='ctx'> 		ki-&gt;iocb.ki_complete = cachefiles_write_complete;</div><div class='del'>-</div><div class='del'>-	/* Open-code file_start_write here to grab freeze protection, which</div><div class='del'>-	 * will be released by another thread in aio_complete_rw().  Fool</div><div class='del'>-	 * lockdep by telling it the lock got released so that it doesn't</div><div class='del'>-	 * complain about the held lock when we return to userspace.</div><div class='del'>-	 */</div><div class='del'>-	inode = file_inode(file);</div><div class='del'>-	__sb_start_write(inode-&gt;i_sb, SB_FREEZE_WRITE);</div><div class='del'>-	__sb_writers_release(inode-&gt;i_sb, SB_FREEZE_WRITE);</div><div class='add'>+	atomic_long_add(ki-&gt;b_writing, &amp;cache-&gt;b_writing);</div><div class='ctx'> </div><div class='ctx'> 	get_file(ki-&gt;iocb.ki_filp);</div><div class='add'>+	cachefiles_grab_object(object, cachefiles_obj_get_ioreq);</div><div class='ctx'> </div><div class='add'>+	trace_cachefiles_write(object, file_inode(file), ki-&gt;iocb.ki_pos, len);</div><div class='ctx'> 	old_nofs = memalloc_nofs_save();</div><div class='del'>-	ret = vfs_iocb_iter_write(file, &amp;ki-&gt;iocb, iter);</div><div class='add'>+	ret = cachefiles_inject_write_error();</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		ret = vfs_iocb_iter_write(file, &amp;ki-&gt;iocb, iter);</div><div class='ctx'> 	memalloc_nofs_restore(old_nofs);</div><div class='ctx'> 	switch (ret) {</div><div class='ctx'> 	case -EIOCBQUEUED:</div><div class='hunk'>@@ -245,8 +347,6 @@ static int cachefiles_write(struct netfs_cache_resources *cres,</div><div class='ctx'> 	default:</div><div class='ctx'> 		ki-&gt;was_async = false;</div><div class='ctx'> 		cachefiles_write_complete(&amp;ki-&gt;iocb, ret);</div><div class='del'>-		if (ret &gt; 0)</div><div class='del'>-			ret = 0;</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -254,96 +354,361 @@ in_progress:</div><div class='ctx'> 	cachefiles_put_kiocb(ki);</div><div class='ctx'> 	_leave(" = %zd", ret);</div><div class='ctx'> 	return ret;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-presubmission_error:</div><div class='del'>-	if (term_func)</div><div class='del'>-		term_func(term_func_priv, -ENOMEM, false);</div><div class='del'>-	return -ENOMEM;</div><div class='add'>+static int cachefiles_write(struct netfs_cache_resources *cres,</div><div class='add'>+			    loff_t start_pos,</div><div class='add'>+			    struct iov_iter *iter,</div><div class='add'>+			    netfs_io_terminated_t term_func,</div><div class='add'>+			    void *term_func_priv)</div><div class='add'>+{</div><div class='add'>+	if (!fscache_wait_for_operation(cres, FSCACHE_WANT_WRITE)) {</div><div class='add'>+		if (term_func)</div><div class='add'>+			term_func(term_func_priv, -ENOBUFS);</div><div class='add'>+		trace_netfs_sreq(term_func_priv, netfs_sreq_trace_cache_nowrite);</div><div class='add'>+		return -ENOBUFS;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return __cachefiles_write(cachefiles_cres_object(cres),</div><div class='add'>+				  cachefiles_cres_file(cres),</div><div class='add'>+				  start_pos, iter,</div><div class='add'>+				  term_func, term_func_priv);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Prepare a read operation, shortening it to a cached/uncached</div><div class='del'>- * boundary as appropriate.</div><div class='del'>- */</div><div class='del'>-static enum netfs_read_source cachefiles_prepare_read(struct netfs_read_subrequest *subreq,</div><div class='del'>-						      loff_t i_size)</div><div class='add'>+static inline enum netfs_io_source</div><div class='add'>+cachefiles_do_prepare_read(struct netfs_cache_resources *cres,</div><div class='add'>+			   loff_t start, size_t *_len, loff_t i_size,</div><div class='add'>+			   unsigned long *_flags, ino_t netfs_ino)</div><div class='ctx'> {</div><div class='del'>-	struct fscache_retrieval *op = subreq-&gt;rreq-&gt;cache_resources.cache_priv;</div><div class='del'>-	struct cachefiles_object *object;</div><div class='add'>+	enum cachefiles_prepare_read_trace why;</div><div class='add'>+	struct cachefiles_object *object = NULL;</div><div class='ctx'> 	struct cachefiles_cache *cache;</div><div class='add'>+	struct fscache_cookie *cookie = fscache_cres_cookie(cres);</div><div class='ctx'> 	const struct cred *saved_cred;</div><div class='del'>-	struct file *file = subreq-&gt;rreq-&gt;cache_resources.cache_priv2;</div><div class='add'>+	struct file *file = cachefiles_cres_file(cres);</div><div class='add'>+	enum netfs_io_source ret = NETFS_DOWNLOAD_FROM_SERVER;</div><div class='add'>+	size_t len = *_len;</div><div class='ctx'> 	loff_t off, to;</div><div class='add'>+	ino_t ino = file ? file_inode(file)-&gt;i_ino : 0;</div><div class='add'>+	int rc;</div><div class='ctx'> </div><div class='del'>-	_enter("%zx @%llx/%llx", subreq-&gt;len, subreq-&gt;start, i_size);</div><div class='add'>+	_enter("%zx @%llx/%llx", len, start, i_size);</div><div class='ctx'> </div><div class='del'>-	object = container_of(op-&gt;op.object,</div><div class='del'>-			      struct cachefiles_object, fscache);</div><div class='del'>-	cache = container_of(object-&gt;fscache.cache,</div><div class='del'>-			     struct cachefiles_cache, cache);</div><div class='add'>+	if (start &gt;= i_size) {</div><div class='add'>+		ret = NETFS_FILL_WITH_ZEROES;</div><div class='add'>+		why = cachefiles_trace_read_after_eof;</div><div class='add'>+		goto out_no_object;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (!file)</div><div class='del'>-		goto cache_fail_nosec;</div><div class='add'>+	if (test_bit(FSCACHE_COOKIE_NO_DATA_TO_READ, &amp;cookie-&gt;flags)) {</div><div class='add'>+		__set_bit(NETFS_SREQ_COPY_TO_CACHE, _flags);</div><div class='add'>+		why = cachefiles_trace_read_no_data;</div><div class='add'>+		if (!test_bit(NETFS_SREQ_ONDEMAND, _flags))</div><div class='add'>+			goto out_no_object;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (subreq-&gt;start &gt;= i_size)</div><div class='del'>-		return NETFS_FILL_WITH_ZEROES;</div><div class='add'>+	/* The object and the file may be being created in the background. */</div><div class='add'>+	if (!file) {</div><div class='add'>+		why = cachefiles_trace_read_no_file;</div><div class='add'>+		if (!fscache_wait_for_operation(cres, FSCACHE_WANT_READ))</div><div class='add'>+			goto out_no_object;</div><div class='add'>+		file = cachefiles_cres_file(cres);</div><div class='add'>+		if (!file)</div><div class='add'>+			goto out_no_object;</div><div class='add'>+		ino = file_inode(file)-&gt;i_ino;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='add'>+	object = cachefiles_cres_object(cres);</div><div class='add'>+	cache = object-&gt;volume-&gt;cache;</div><div class='ctx'> 	cachefiles_begin_secure(cache, &amp;saved_cred);</div><div class='del'>-</div><div class='del'>-	off = vfs_llseek(file, subreq-&gt;start, SEEK_DATA);</div><div class='add'>+retry:</div><div class='add'>+	off = cachefiles_inject_read_error();</div><div class='add'>+	if (off == 0)</div><div class='add'>+		off = vfs_llseek(file, start, SEEK_DATA);</div><div class='ctx'> 	if (off &lt; 0 &amp;&amp; off &gt;= (loff_t)-MAX_ERRNO) {</div><div class='del'>-		if (off == (loff_t)-ENXIO)</div><div class='add'>+		if (off == (loff_t)-ENXIO) {</div><div class='add'>+			why = cachefiles_trace_read_seek_nxio;</div><div class='ctx'> 			goto download_and_store;</div><div class='del'>-		goto cache_fail;</div><div class='add'>+		}</div><div class='add'>+		trace_cachefiles_io_error(object, file_inode(file), off,</div><div class='add'>+					  cachefiles_trace_seek_error);</div><div class='add'>+		why = cachefiles_trace_read_seek_error;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (off &gt;= subreq-&gt;start + subreq-&gt;len)</div><div class='add'>+	if (off &gt;= start + len) {</div><div class='add'>+		why = cachefiles_trace_read_found_hole;</div><div class='ctx'> 		goto download_and_store;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (off &gt; subreq-&gt;start) {</div><div class='add'>+	if (off &gt; start) {</div><div class='ctx'> 		off = round_up(off, cache-&gt;bsize);</div><div class='del'>-		subreq-&gt;len = off - subreq-&gt;start;</div><div class='add'>+		len = off - start;</div><div class='add'>+		*_len = len;</div><div class='add'>+		why = cachefiles_trace_read_found_part;</div><div class='ctx'> 		goto download_and_store;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	to = vfs_llseek(file, subreq-&gt;start, SEEK_HOLE);</div><div class='del'>-	if (to &lt; 0 &amp;&amp; to &gt;= (loff_t)-MAX_ERRNO)</div><div class='del'>-		goto cache_fail;</div><div class='add'>+	to = cachefiles_inject_read_error();</div><div class='add'>+	if (to == 0)</div><div class='add'>+		to = vfs_llseek(file, start, SEEK_HOLE);</div><div class='add'>+	if (to &lt; 0 &amp;&amp; to &gt;= (loff_t)-MAX_ERRNO) {</div><div class='add'>+		trace_cachefiles_io_error(object, file_inode(file), to,</div><div class='add'>+					  cachefiles_trace_seek_error);</div><div class='add'>+		why = cachefiles_trace_read_seek_error;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (to &lt; subreq-&gt;start + subreq-&gt;len) {</div><div class='del'>-		if (subreq-&gt;start + subreq-&gt;len &gt;= i_size)</div><div class='add'>+	if (to &lt; start + len) {</div><div class='add'>+		if (start + len &gt;= i_size)</div><div class='ctx'> 			to = round_up(to, cache-&gt;bsize);</div><div class='ctx'> 		else</div><div class='ctx'> 			to = round_down(to, cache-&gt;bsize);</div><div class='del'>-		subreq-&gt;len = to - subreq-&gt;start;</div><div class='add'>+		len = to - start;</div><div class='add'>+		*_len = len;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	cachefiles_end_secure(cache, saved_cred);</div><div class='del'>-	return NETFS_READ_FROM_CACHE;</div><div class='add'>+	why = cachefiles_trace_read_have_data;</div><div class='add'>+	ret = NETFS_READ_FROM_CACHE;</div><div class='add'>+	goto out;</div><div class='ctx'> </div><div class='ctx'> download_and_store:</div><div class='del'>-	if (cachefiles_has_space(cache, 0, (subreq-&gt;len + PAGE_SIZE - 1) / PAGE_SIZE) == 0)</div><div class='del'>-		__set_bit(NETFS_SREQ_WRITE_TO_CACHE, &amp;subreq-&gt;flags);</div><div class='del'>-cache_fail:</div><div class='add'>+	__set_bit(NETFS_SREQ_COPY_TO_CACHE, _flags);</div><div class='add'>+	if (test_bit(NETFS_SREQ_ONDEMAND, _flags)) {</div><div class='add'>+		rc = cachefiles_ondemand_read(object, start, len);</div><div class='add'>+		if (!rc) {</div><div class='add'>+			__clear_bit(NETFS_SREQ_ONDEMAND, _flags);</div><div class='add'>+			goto retry;</div><div class='add'>+		}</div><div class='add'>+		ret = NETFS_INVALID_READ;</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='ctx'> 	cachefiles_end_secure(cache, saved_cred);</div><div class='del'>-cache_fail_nosec:</div><div class='del'>-	return NETFS_DOWNLOAD_FROM_SERVER;</div><div class='add'>+out_no_object:</div><div class='add'>+	trace_cachefiles_prep_read(object, start, len, *_flags, ret, why, ino, netfs_ino);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Prepare a read operation, shortening it to a cached/uncached</div><div class='add'>+ * boundary as appropriate.</div><div class='add'>+ */</div><div class='add'>+static enum netfs_io_source cachefiles_prepare_read(struct netfs_io_subrequest *subreq,</div><div class='add'>+						    unsigned long long i_size)</div><div class='add'>+{</div><div class='add'>+	return cachefiles_do_prepare_read(&amp;subreq-&gt;rreq-&gt;cache_resources,</div><div class='add'>+					  subreq-&gt;start, &amp;subreq-&gt;len, i_size,</div><div class='add'>+					  &amp;subreq-&gt;flags, subreq-&gt;rreq-&gt;inode-&gt;i_ino);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Prepare an on-demand read operation, shortening it to a cached/uncached</div><div class='add'>+ * boundary as appropriate.</div><div class='add'>+ */</div><div class='add'>+static enum netfs_io_source</div><div class='add'>+cachefiles_prepare_ondemand_read(struct netfs_cache_resources *cres,</div><div class='add'>+				 loff_t start, size_t *_len, loff_t i_size,</div><div class='add'>+				 unsigned long *_flags, ino_t ino)</div><div class='add'>+{</div><div class='add'>+	return cachefiles_do_prepare_read(cres, start, _len, i_size, _flags, ino);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Prepare for a write to occur.</div><div class='ctx'>  */</div><div class='del'>-static int cachefiles_prepare_write(struct netfs_cache_resources *cres,</div><div class='del'>-				    loff_t *_start, size_t *_len, loff_t i_size)</div><div class='add'>+int __cachefiles_prepare_write(struct cachefiles_object *object,</div><div class='add'>+			       struct file *file,</div><div class='add'>+			       loff_t *_start, size_t *_len, size_t upper_len,</div><div class='add'>+			       bool no_space_allocated_yet)</div><div class='ctx'> {</div><div class='del'>-	loff_t start = *_start;</div><div class='del'>-	size_t len = *_len, down;</div><div class='add'>+	struct cachefiles_cache *cache = object-&gt;volume-&gt;cache;</div><div class='add'>+	loff_t start = *_start, pos;</div><div class='add'>+	size_t len = *_len;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	/* Round to DIO size */</div><div class='del'>-	down = start - round_down(start, PAGE_SIZE);</div><div class='del'>-	*_start = start - down;</div><div class='del'>-	*_len = round_up(down + len, PAGE_SIZE);</div><div class='del'>-	return 0;</div><div class='add'>+	start = round_down(*_start, PAGE_SIZE);</div><div class='add'>+	if (start != *_start || *_len &gt; upper_len) {</div><div class='add'>+		/* Probably asked to cache a streaming write written into the</div><div class='add'>+		 * pagecache when the cookie was temporarily out of service to</div><div class='add'>+		 * culling.</div><div class='add'>+		 */</div><div class='add'>+		fscache_count_dio_misfit();</div><div class='add'>+		return -ENOBUFS;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	*_len = round_up(len, PAGE_SIZE);</div><div class='add'>+</div><div class='add'>+	/* We need to work out whether there's sufficient disk space to perform</div><div class='add'>+	 * the write - but we can skip that check if we have space already</div><div class='add'>+	 * allocated.</div><div class='add'>+	 */</div><div class='add'>+	if (no_space_allocated_yet)</div><div class='add'>+		goto check_space;</div><div class='add'>+</div><div class='add'>+	pos = cachefiles_inject_read_error();</div><div class='add'>+	if (pos == 0)</div><div class='add'>+		pos = vfs_llseek(file, start, SEEK_DATA);</div><div class='add'>+	if (pos &lt; 0 &amp;&amp; pos &gt;= (loff_t)-MAX_ERRNO) {</div><div class='add'>+		if (pos == -ENXIO)</div><div class='add'>+			goto check_space; /* Unallocated tail */</div><div class='add'>+		trace_cachefiles_io_error(object, file_inode(file), pos,</div><div class='add'>+					  cachefiles_trace_seek_error);</div><div class='add'>+		return pos;</div><div class='add'>+	}</div><div class='add'>+	if ((u64)pos &gt;= (u64)start + *_len)</div><div class='add'>+		goto check_space; /* Unallocated region */</div><div class='add'>+</div><div class='add'>+	/* We have a block that's at least partially filled - if we're low on</div><div class='add'>+	 * space, we need to see if it's fully allocated.  If it's not, we may</div><div class='add'>+	 * want to cull it.</div><div class='add'>+	 */</div><div class='add'>+	if (cachefiles_has_space(cache, 0, *_len / PAGE_SIZE,</div><div class='add'>+				 cachefiles_has_space_check) == 0)</div><div class='add'>+		return 0; /* Enough space to simply overwrite the whole block */</div><div class='add'>+</div><div class='add'>+	pos = cachefiles_inject_read_error();</div><div class='add'>+	if (pos == 0)</div><div class='add'>+		pos = vfs_llseek(file, start, SEEK_HOLE);</div><div class='add'>+	if (pos &lt; 0 &amp;&amp; pos &gt;= (loff_t)-MAX_ERRNO) {</div><div class='add'>+		trace_cachefiles_io_error(object, file_inode(file), pos,</div><div class='add'>+					  cachefiles_trace_seek_error);</div><div class='add'>+		return pos;</div><div class='add'>+	}</div><div class='add'>+	if ((u64)pos &gt;= (u64)start + *_len)</div><div class='add'>+		return 0; /* Fully allocated */</div><div class='add'>+</div><div class='add'>+	/* Partially allocated, but insufficient space: cull. */</div><div class='add'>+	fscache_count_no_write_space();</div><div class='add'>+	ret = cachefiles_inject_remove_error();</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		ret = vfs_fallocate(file, FALLOC_FL_PUNCH_HOLE | FALLOC_FL_KEEP_SIZE,</div><div class='add'>+				    start, *_len);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		trace_cachefiles_io_error(object, file_inode(file), ret,</div><div class='add'>+					  cachefiles_trace_fallocate_error);</div><div class='add'>+		cachefiles_io_error_obj(object,</div><div class='add'>+					"CacheFiles: fallocate failed (%d)\n", ret);</div><div class='add'>+		ret = -EIO;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+</div><div class='add'>+check_space:</div><div class='add'>+	return cachefiles_has_space(cache, 0, *_len / PAGE_SIZE,</div><div class='add'>+				    cachefiles_has_space_for_write);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int cachefiles_prepare_write(struct netfs_cache_resources *cres,</div><div class='add'>+				    loff_t *_start, size_t *_len, size_t upper_len,</div><div class='add'>+				    loff_t i_size, bool no_space_allocated_yet)</div><div class='add'>+{</div><div class='add'>+	struct cachefiles_object *object = cachefiles_cres_object(cres);</div><div class='add'>+	struct cachefiles_cache *cache = object-&gt;volume-&gt;cache;</div><div class='add'>+	const struct cred *saved_cred;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (!cachefiles_cres_file(cres)) {</div><div class='add'>+		if (!fscache_wait_for_operation(cres, FSCACHE_WANT_WRITE))</div><div class='add'>+			return -ENOBUFS;</div><div class='add'>+		if (!cachefiles_cres_file(cres))</div><div class='add'>+			return -ENOBUFS;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	cachefiles_begin_secure(cache, &amp;saved_cred);</div><div class='add'>+	ret = __cachefiles_prepare_write(object, cachefiles_cres_file(cres),</div><div class='add'>+					 _start, _len, upper_len,</div><div class='add'>+					 no_space_allocated_yet);</div><div class='add'>+	cachefiles_end_secure(cache, saved_cred);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void cachefiles_prepare_write_subreq(struct netfs_io_subrequest *subreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *wreq = subreq-&gt;rreq;</div><div class='add'>+	struct netfs_cache_resources *cres = &amp;wreq-&gt;cache_resources;</div><div class='add'>+	struct netfs_io_stream *stream = &amp;wreq-&gt;io_streams[subreq-&gt;stream_nr];</div><div class='add'>+</div><div class='add'>+	_enter("W=%x[%x] %llx", wreq-&gt;debug_id, subreq-&gt;debug_index, subreq-&gt;start);</div><div class='add'>+</div><div class='add'>+	stream-&gt;sreq_max_len = MAX_RW_COUNT;</div><div class='add'>+	stream-&gt;sreq_max_segs = BIO_MAX_VECS;</div><div class='add'>+</div><div class='add'>+	if (!cachefiles_cres_file(cres)) {</div><div class='add'>+		if (!fscache_wait_for_operation(cres, FSCACHE_WANT_WRITE))</div><div class='add'>+			return netfs_prepare_write_failed(subreq);</div><div class='add'>+		if (!cachefiles_cres_file(cres))</div><div class='add'>+			return netfs_prepare_write_failed(subreq);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void cachefiles_issue_write(struct netfs_io_subrequest *subreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *wreq = subreq-&gt;rreq;</div><div class='add'>+	struct netfs_cache_resources *cres = &amp;wreq-&gt;cache_resources;</div><div class='add'>+	struct cachefiles_object *object = cachefiles_cres_object(cres);</div><div class='add'>+	struct cachefiles_cache *cache = object-&gt;volume-&gt;cache;</div><div class='add'>+	struct netfs_io_stream *stream = &amp;wreq-&gt;io_streams[subreq-&gt;stream_nr];</div><div class='add'>+	const struct cred *saved_cred;</div><div class='add'>+	size_t off, pre, post, len = subreq-&gt;len;</div><div class='add'>+	loff_t start = subreq-&gt;start;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	_enter("W=%x[%x] %llx-%llx",</div><div class='add'>+	       wreq-&gt;debug_id, subreq-&gt;debug_index, start, start + len - 1);</div><div class='add'>+</div><div class='add'>+	/* We need to start on the cache granularity boundary */</div><div class='add'>+	off = start &amp; (CACHEFILES_DIO_BLOCK_SIZE - 1);</div><div class='add'>+	if (off) {</div><div class='add'>+		pre = CACHEFILES_DIO_BLOCK_SIZE - off;</div><div class='add'>+		if (pre &gt;= len) {</div><div class='add'>+			fscache_count_dio_misfit();</div><div class='add'>+			netfs_write_subrequest_terminated(subreq, len);</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+		subreq-&gt;transferred += pre;</div><div class='add'>+		start += pre;</div><div class='add'>+		len -= pre;</div><div class='add'>+		iov_iter_advance(&amp;subreq-&gt;io_iter, pre);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* We also need to end on the cache granularity boundary */</div><div class='add'>+	if (start + len == wreq-&gt;i_size) {</div><div class='add'>+		size_t part = len % CACHEFILES_DIO_BLOCK_SIZE;</div><div class='add'>+		size_t need = CACHEFILES_DIO_BLOCK_SIZE - part;</div><div class='add'>+</div><div class='add'>+		if (part &amp;&amp; stream-&gt;submit_extendable_to &gt;= need) {</div><div class='add'>+			len += need;</div><div class='add'>+			subreq-&gt;len += need;</div><div class='add'>+			subreq-&gt;io_iter.count += need;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	post = len &amp; (CACHEFILES_DIO_BLOCK_SIZE - 1);</div><div class='add'>+	if (post) {</div><div class='add'>+		len -= post;</div><div class='add'>+		if (len == 0) {</div><div class='add'>+			fscache_count_dio_misfit();</div><div class='add'>+			netfs_write_subrequest_terminated(subreq, post);</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+		iov_iter_truncate(&amp;subreq-&gt;io_iter, len);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	trace_netfs_sreq(subreq, netfs_sreq_trace_cache_prepare);</div><div class='add'>+	cachefiles_begin_secure(cache, &amp;saved_cred);</div><div class='add'>+	ret = __cachefiles_prepare_write(object, cachefiles_cres_file(cres),</div><div class='add'>+					 &amp;start, &amp;len, len, true);</div><div class='add'>+	cachefiles_end_secure(cache, saved_cred);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		netfs_write_subrequest_terminated(subreq, ret);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	trace_netfs_sreq(subreq, netfs_sreq_trace_cache_write);</div><div class='add'>+	cachefiles_write(&amp;subreq-&gt;rreq-&gt;cache_resources,</div><div class='add'>+			 subreq-&gt;start, &amp;subreq-&gt;io_iter,</div><div class='add'>+			 netfs_write_subrequest_terminated, subreq);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -351,70 +716,47 @@ static int cachefiles_prepare_write(struct netfs_cache_resources *cres,</div><div class='ctx'>  */</div><div class='ctx'> static void cachefiles_end_operation(struct netfs_cache_resources *cres)</div><div class='ctx'> {</div><div class='del'>-	struct fscache_retrieval *op = cres-&gt;cache_priv;</div><div class='del'>-	struct file *file = cres-&gt;cache_priv2;</div><div class='del'>-</div><div class='del'>-	_enter("");</div><div class='add'>+	struct file *file = cachefiles_cres_file(cres);</div><div class='ctx'> </div><div class='ctx'> 	if (file)</div><div class='ctx'> 		fput(file);</div><div class='del'>-	if (op) {</div><div class='del'>-		fscache_op_complete(&amp;op-&gt;op, false);</div><div class='del'>-		fscache_put_retrieval(op);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	_leave("");</div><div class='add'>+	fscache_end_cookie_access(fscache_cres_cookie(cres), fscache_access_io_end);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct netfs_cache_ops cachefiles_netfs_cache_ops = {</div><div class='ctx'> 	.end_operation		= cachefiles_end_operation,</div><div class='ctx'> 	.read			= cachefiles_read,</div><div class='ctx'> 	.write			= cachefiles_write,</div><div class='add'>+	.issue_write		= cachefiles_issue_write,</div><div class='ctx'> 	.prepare_read		= cachefiles_prepare_read,</div><div class='ctx'> 	.prepare_write		= cachefiles_prepare_write,</div><div class='add'>+	.prepare_write_subreq	= cachefiles_prepare_write_subreq,</div><div class='add'>+	.prepare_ondemand_read	= cachefiles_prepare_ondemand_read,</div><div class='add'>+	.query_occupancy	= cachefiles_query_occupancy,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Open the cache file when beginning a cache operation.</div><div class='ctx'>  */</div><div class='del'>-int cachefiles_begin_read_operation(struct netfs_read_request *rreq,</div><div class='del'>-				    struct fscache_retrieval *op)</div><div class='add'>+bool cachefiles_begin_operation(struct netfs_cache_resources *cres,</div><div class='add'>+				enum fscache_want_state want_state)</div><div class='ctx'> {</div><div class='del'>-	struct cachefiles_object *object;</div><div class='del'>-	struct cachefiles_cache *cache;</div><div class='del'>-	struct path path;</div><div class='del'>-	struct file *file;</div><div class='del'>-</div><div class='del'>-	_enter("");</div><div class='del'>-</div><div class='del'>-	object = container_of(op-&gt;op.object,</div><div class='del'>-			      struct cachefiles_object, fscache);</div><div class='del'>-	cache = container_of(object-&gt;fscache.cache,</div><div class='del'>-			     struct cachefiles_cache, cache);</div><div class='del'>-</div><div class='del'>-	path.mnt = cache-&gt;mnt;</div><div class='del'>-	path.dentry = object-&gt;backer;</div><div class='del'>-	file = open_with_fake_path(&amp;path, O_RDWR | O_LARGEFILE | O_DIRECT,</div><div class='del'>-				   d_inode(object-&gt;backer), cache-&gt;cache_cred);</div><div class='del'>-	if (IS_ERR(file))</div><div class='del'>-		return PTR_ERR(file);</div><div class='del'>-	if (!S_ISREG(file_inode(file)-&gt;i_mode))</div><div class='del'>-		goto error_file;</div><div class='del'>-	if (unlikely(!file-&gt;f_op-&gt;read_iter) ||</div><div class='del'>-	    unlikely(!file-&gt;f_op-&gt;write_iter)) {</div><div class='del'>-		pr_notice("Cache does not support read_iter and write_iter\n");</div><div class='del'>-		goto error_file;</div><div class='add'>+	struct cachefiles_object *object = cachefiles_cres_object(cres);</div><div class='add'>+</div><div class='add'>+	if (!cachefiles_cres_file(cres)) {</div><div class='add'>+		cres-&gt;ops = &amp;cachefiles_netfs_cache_ops;</div><div class='add'>+		if (object-&gt;file) {</div><div class='add'>+			spin_lock(&amp;object-&gt;lock);</div><div class='add'>+			if (!cres-&gt;cache_priv2 &amp;&amp; object-&gt;file)</div><div class='add'>+				cres-&gt;cache_priv2 = get_file(object-&gt;file);</div><div class='add'>+			spin_unlock(&amp;object-&gt;lock);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	fscache_get_retrieval(op);</div><div class='del'>-	rreq-&gt;cache_resources.cache_priv = op;</div><div class='del'>-	rreq-&gt;cache_resources.cache_priv2 = file;</div><div class='del'>-	rreq-&gt;cache_resources.ops = &amp;cachefiles_netfs_cache_ops;</div><div class='del'>-	rreq-&gt;cache_resources.debug_id = object-&gt;fscache.debug_id;</div><div class='del'>-	_leave("");</div><div class='del'>-	return 0;</div><div class='add'>+	if (!cachefiles_cres_file(cres) &amp;&amp; want_state != FSCACHE_WANT_PARAMS) {</div><div class='add'>+		pr_err("failed to get cres-&gt;file\n");</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-error_file:</div><div class='del'>-	fput(file);</div><div class='del'>-	return -EIO;</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/cachefiles/key.c b/fs/cachefiles/key.c<br/>index 7f94efc97e23..aae86af48ed5 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cachefiles/key.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/key.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/cachefiles/key.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/cachefiles/key.c</a></div><div class='hunk'>@@ -1,14 +1,14 @@</div><div class='ctx'> // SPDX-License-Identifier: GPL-2.0-or-later</div><div class='ctx'> /* Key to pathname encoder</div><div class='ctx'>  *</div><div class='del'>- * Copyright (C) 2007 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Copyright (C) 2021 Red Hat, Inc. All Rights Reserved.</div><div class='ctx'>  * Written by David Howells (dhowells@redhat.com)</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> </div><div class='del'>-static const char cachefiles_charmap[64] =</div><div class='add'>+static const char cachefiles_charmap[64] __nonstring =</div><div class='ctx'> 	"0123456789"			/* 0 - 9 */</div><div class='ctx'> 	"abcdefghijklmnopqrstuvwxyz"	/* 10 - 35 */</div><div class='ctx'> 	"ABCDEFGHIJKLMNOPQRSTUVWXYZ"	/* 36 - 61 */</div><div class='hunk'>@@ -22,134 +22,116 @@ static const char cachefiles_filecharmap[256] = {</div><div class='ctx'> 	[48 ... 127] = 1,		/* '0' -&gt; '~' */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+static inline unsigned int how_many_hex_digits(unsigned int x)</div><div class='add'>+{</div><div class='add'>+	return x ? round_up(ilog2(x) + 1, 4) / 4 : 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * turn the raw key into something cooked</div><div class='del'>- * - the raw key should include the length in the two bytes at the front</div><div class='del'>- * - the key may be up to 514 bytes in length (including the length word)</div><div class='add'>+ * - the key may be up to NAME_MAX in length (including the length word)</div><div class='ctx'>  *   - "base64" encode the strange keys, mapping 3 bytes of raw to four of</div><div class='ctx'>  *     cooked</div><div class='ctx'>  *   - need to cut the cooked key into 252 char lengths (189 raw bytes)</div><div class='ctx'>  */</div><div class='del'>-char *cachefiles_cook_key(const u8 *raw, int keylen, uint8_t type)</div><div class='add'>+bool cachefiles_cook_key(struct cachefiles_object *object)</div><div class='ctx'> {</div><div class='del'>-	unsigned char csum, ch;</div><div class='del'>-	unsigned int acc;</div><div class='del'>-	char *key;</div><div class='del'>-	int loop, len, max, seg, mark, print;</div><div class='add'>+	const u8 *key = fscache_get_key(object-&gt;cookie), *kend;</div><div class='add'>+	unsigned char ch;</div><div class='add'>+	unsigned int acc, i, n, nle, nbe, keylen = object-&gt;cookie-&gt;key_len;</div><div class='add'>+	unsigned int b64len, len, print, pad;</div><div class='add'>+	char *name, sep;</div><div class='ctx'> </div><div class='del'>-	_enter(",%d", keylen);</div><div class='add'>+	_enter(",%u,%*phN", keylen, keylen, key);</div><div class='ctx'> </div><div class='del'>-	BUG_ON(keylen &lt; 2 || keylen &gt; 514);</div><div class='add'>+	BUG_ON(keylen &gt; NAME_MAX - 3);</div><div class='ctx'> </div><div class='del'>-	csum = raw[0] + raw[1];</div><div class='ctx'> 	print = 1;</div><div class='del'>-	for (loop = 2; loop &lt; keylen; loop++) {</div><div class='del'>-		ch = raw[loop];</div><div class='del'>-		csum += ch;</div><div class='add'>+	for (i = 0; i &lt; keylen; i++) {</div><div class='add'>+		ch = key[i];</div><div class='ctx'> 		print &amp;= cachefiles_filecharmap[ch];</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/* If the path is usable ASCII, then we render it directly */</div><div class='ctx'> 	if (print) {</div><div class='del'>-		/* if the path is usable ASCII, then we render it directly */</div><div class='del'>-		max = keylen - 2;</div><div class='del'>-		max += 2;	/* two base64'd length chars on the front */</div><div class='del'>-		max += 5;	/* @checksum/M */</div><div class='del'>-		max += 3 * 2;	/* maximum number of segment dividers (".../M")</div><div class='del'>-				 * is ((514 + 251) / 252) = 3</div><div class='del'>-				 */</div><div class='del'>-		max += 1;	/* NUL on end */</div><div class='del'>-	} else {</div><div class='del'>-		/* calculate the maximum length of the cooked key */</div><div class='del'>-		keylen = (keylen + 2) / 3;</div><div class='del'>-</div><div class='del'>-		max = keylen * 4;</div><div class='del'>-		max += 5;	/* @checksum/M */</div><div class='del'>-		max += 3 * 2;	/* maximum number of segment dividers (".../M")</div><div class='del'>-				 * is ((514 + 188) / 189) = 3</div><div class='del'>-				 */</div><div class='del'>-		max += 1;	/* NUL on end */</div><div class='add'>+		len = 1 + keylen;</div><div class='add'>+		name = kmalloc(len + 1, GFP_KERNEL);</div><div class='add'>+		if (!name)</div><div class='add'>+			return false;</div><div class='add'>+</div><div class='add'>+		name[0] = 'D'; /* Data object type, string encoding */</div><div class='add'>+		memcpy(name + 1, key, keylen);</div><div class='add'>+		goto success;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	max += 1;	/* 2nd NUL on end */</div><div class='del'>-</div><div class='del'>-	_debug("max: %d", max);</div><div class='del'>-</div><div class='del'>-	key = kmalloc(max, cachefiles_gfp);</div><div class='del'>-	if (!key)</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	len = 0;</div><div class='del'>-</div><div class='del'>-	/* build the cooked key */</div><div class='del'>-	sprintf(key, "@%02x%c+", (unsigned) csum, 0);</div><div class='del'>-	len = 5;</div><div class='del'>-	mark = len - 1;</div><div class='del'>-</div><div class='del'>-	if (print) {</div><div class='del'>-		acc = *(uint16_t *) raw;</div><div class='del'>-		raw += 2;</div><div class='del'>-</div><div class='del'>-		key[len + 1] = cachefiles_charmap[acc &amp; 63];</div><div class='del'>-		acc &gt;&gt;= 6;</div><div class='del'>-		key[len] = cachefiles_charmap[acc &amp; 63];</div><div class='del'>-		len += 2;</div><div class='del'>-</div><div class='del'>-		seg = 250;</div><div class='del'>-		for (loop = keylen; loop &gt; 0; loop--) {</div><div class='del'>-			if (seg &lt;= 0) {</div><div class='del'>-				key[len++] = '\0';</div><div class='del'>-				mark = len;</div><div class='del'>-				key[len++] = '+';</div><div class='del'>-				seg = 252;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			key[len++] = *raw++;</div><div class='del'>-			ASSERT(len &lt; max);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		switch (type) {</div><div class='del'>-		case FSCACHE_COOKIE_TYPE_INDEX:		type = 'I';	break;</div><div class='del'>-		case FSCACHE_COOKIE_TYPE_DATAFILE:	type = 'D';	break;</div><div class='del'>-		default:				type = 'S';	break;</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-		seg = 252;</div><div class='del'>-		for (loop = keylen; loop &gt; 0; loop--) {</div><div class='del'>-			if (seg &lt;= 0) {</div><div class='del'>-				key[len++] = '\0';</div><div class='del'>-				mark = len;</div><div class='del'>-				key[len++] = '+';</div><div class='del'>-				seg = 252;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			acc = *raw++;</div><div class='del'>-			acc |= *raw++ &lt;&lt; 8;</div><div class='del'>-			acc |= *raw++ &lt;&lt; 16;</div><div class='del'>-</div><div class='del'>-			_debug("acc: %06x", acc);</div><div class='del'>-</div><div class='del'>-			key[len++] = cachefiles_charmap[acc &amp; 63];</div><div class='del'>-			acc &gt;&gt;= 6;</div><div class='del'>-			key[len++] = cachefiles_charmap[acc &amp; 63];</div><div class='del'>-			acc &gt;&gt;= 6;</div><div class='del'>-			key[len++] = cachefiles_charmap[acc &amp; 63];</div><div class='del'>-			acc &gt;&gt;= 6;</div><div class='del'>-			key[len++] = cachefiles_charmap[acc &amp; 63];</div><div class='del'>-</div><div class='del'>-			ASSERT(len &lt; max);</div><div class='del'>-		}</div><div class='add'>+	/* See if it makes sense to encode it as "hex,hex,hex" for each 32-bit</div><div class='add'>+	 * chunk.  We rely on the key having been padded out to a whole number</div><div class='add'>+	 * of 32-bit words.</div><div class='add'>+	 */</div><div class='add'>+	n = round_up(keylen, 4);</div><div class='add'>+	nbe = nle = 0;</div><div class='add'>+	for (i = 0; i &lt; n; i += 4) {</div><div class='add'>+		u32 be = be32_to_cpu(*(__be32 *)(key + i));</div><div class='add'>+		u32 le = le32_to_cpu(*(__le32 *)(key + i));</div><div class='add'>+</div><div class='add'>+		nbe += 1 + how_many_hex_digits(be);</div><div class='add'>+		nle += 1 + how_many_hex_digits(le);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		switch (type) {</div><div class='del'>-		case FSCACHE_COOKIE_TYPE_INDEX:		type = 'J';	break;</div><div class='del'>-		case FSCACHE_COOKIE_TYPE_DATAFILE:	type = 'E';	break;</div><div class='del'>-		default:				type = 'T';	break;</div><div class='add'>+	b64len = DIV_ROUND_UP(keylen, 3);</div><div class='add'>+	pad = b64len * 3 - keylen;</div><div class='add'>+	b64len = 2 + b64len * 4; /* Length if we base64-encode it */</div><div class='add'>+	_debug("len=%u nbe=%u nle=%u b64=%u", keylen, nbe, nle, b64len);</div><div class='add'>+	if (nbe &lt; b64len || nle &lt; b64len) {</div><div class='add'>+		unsigned int nlen = min(nbe, nle) + 1;</div><div class='add'>+		name = kmalloc(nlen, GFP_KERNEL);</div><div class='add'>+		if (!name)</div><div class='add'>+			return false;</div><div class='add'>+		sep = (nbe &lt;= nle) ? 'S' : 'T'; /* Encoding indicator */</div><div class='add'>+		len = 0;</div><div class='add'>+		for (i = 0; i &lt; n; i += 4) {</div><div class='add'>+			u32 x;</div><div class='add'>+			if (nbe &lt;= nle)</div><div class='add'>+				x = be32_to_cpu(*(__be32 *)(key + i));</div><div class='add'>+			else</div><div class='add'>+				x = le32_to_cpu(*(__le32 *)(key + i));</div><div class='add'>+			name[len++] = sep;</div><div class='add'>+			if (x != 0)</div><div class='add'>+				len += snprintf(name + len, nlen - len, "%x", x);</div><div class='add'>+			sep = ',';</div><div class='ctx'> 		}</div><div class='add'>+		goto success;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	key[mark] = type;</div><div class='del'>-	key[len++] = 0;</div><div class='del'>-	key[len] = 0;</div><div class='add'>+	/* We need to base64-encode it */</div><div class='add'>+	name = kmalloc(b64len + 1, GFP_KERNEL);</div><div class='add'>+	if (!name)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	name[0] = 'E';</div><div class='add'>+	name[1] = '0' + pad;</div><div class='add'>+	len = 2;</div><div class='add'>+	kend = key + keylen;</div><div class='add'>+	do {</div><div class='add'>+		acc  = *key++;</div><div class='add'>+		if (key &lt; kend) {</div><div class='add'>+			acc |= *key++ &lt;&lt; 8;</div><div class='add'>+			if (key &lt; kend)</div><div class='add'>+				acc |= *key++ &lt;&lt; 16;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	_leave(" = %s %d", key, len);</div><div class='del'>-	return key;</div><div class='add'>+		name[len++] = cachefiles_charmap[acc &amp; 63];</div><div class='add'>+		acc &gt;&gt;= 6;</div><div class='add'>+		name[len++] = cachefiles_charmap[acc &amp; 63];</div><div class='add'>+		acc &gt;&gt;= 6;</div><div class='add'>+		name[len++] = cachefiles_charmap[acc &amp; 63];</div><div class='add'>+		acc &gt;&gt;= 6;</div><div class='add'>+		name[len++] = cachefiles_charmap[acc &amp; 63];</div><div class='add'>+	} while (key &lt; kend);</div><div class='add'>+</div><div class='add'>+success:</div><div class='add'>+	name[len] = 0;</div><div class='add'>+	object-&gt;d_name = name;</div><div class='add'>+	_leave(" = %s", object-&gt;d_name);</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/cachefiles/main.c b/fs/cachefiles/main.c<br/>index 9c8d34c49b12..3f369c6f816d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cachefiles/main.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/main.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/cachefiles/main.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/cachefiles/main.c</a></div><div class='hunk'>@@ -2,7 +2,7 @@</div><div class='ctx'> /* Network filesystem caching backend to use cache files on a premounted</div><div class='ctx'>  * filesystem</div><div class='ctx'>  *</div><div class='del'>- * Copyright (C) 2007 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Copyright (C) 2021 Red Hat, Inc. All Rights Reserved.</div><div class='ctx'>  * Written by David Howells (dhowells@redhat.com)</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='hunk'>@@ -18,6 +18,8 @@</div><div class='ctx'> #include &lt;linux/statfs.h&gt;</div><div class='ctx'> #include &lt;linux/sysctl.h&gt;</div><div class='ctx'> #include &lt;linux/miscdevice.h&gt;</div><div class='add'>+#include &lt;linux/netfs.h&gt;</div><div class='add'>+#include &lt;trace/events/netfs.h&gt;</div><div class='ctx'> #define CREATE_TRACE_POINTS</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> </div><div class='hunk'>@@ -37,14 +39,6 @@ static struct miscdevice cachefiles_dev = {</div><div class='ctx'> 	.fops	= &amp;cachefiles_daemon_fops,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static void cachefiles_object_init_once(void *_object)</div><div class='del'>-{</div><div class='del'>-	struct cachefiles_object *object = _object;</div><div class='del'>-</div><div class='del'>-	memset(object, 0, sizeof(*object));</div><div class='del'>-	spin_lock_init(&amp;object-&gt;work_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * initialise the fs caching module</div><div class='ctx'>  */</div><div class='hunk'>@@ -52,6 +46,9 @@ static int __init cachefiles_init(void)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='add'>+	ret = cachefiles_register_error_injection();</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto error_einj;</div><div class='ctx'> 	ret = misc_register(&amp;cachefiles_dev);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto error_dev;</div><div class='hunk'>@@ -61,9 +58,7 @@ static int __init cachefiles_init(void)</div><div class='ctx'> 	cachefiles_object_jar =</div><div class='ctx'> 		kmem_cache_create("cachefiles_object_jar",</div><div class='ctx'> 				  sizeof(struct cachefiles_object),</div><div class='del'>-				  0,</div><div class='del'>-				  SLAB_HWCACHE_ALIGN,</div><div class='del'>-				  cachefiles_object_init_once);</div><div class='add'>+				  0, SLAB_HWCACHE_ALIGN, NULL);</div><div class='ctx'> 	if (!cachefiles_object_jar) {</div><div class='ctx'> 		pr_notice("Failed to allocate an object jar\n");</div><div class='ctx'> 		goto error_object_jar;</div><div class='hunk'>@@ -75,6 +70,8 @@ static int __init cachefiles_init(void)</div><div class='ctx'> error_object_jar:</div><div class='ctx'> 	misc_deregister(&amp;cachefiles_dev);</div><div class='ctx'> error_dev:</div><div class='add'>+	cachefiles_unregister_error_injection();</div><div class='add'>+error_einj:</div><div class='ctx'> 	pr_err("failed to register: %d\n", ret);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -90,6 +87,7 @@ static void __exit cachefiles_exit(void)</div><div class='ctx'> </div><div class='ctx'> 	kmem_cache_destroy(cachefiles_object_jar);</div><div class='ctx'> 	misc_deregister(&amp;cachefiles_dev);</div><div class='add'>+	cachefiles_unregister_error_injection();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> module_exit(cachefiles_exit);</div><div class='head'>diff --git a/fs/cachefiles/namei.c b/fs/cachefiles/namei.c<br/>index a9aca5ab5970..e5ec90dccc27 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cachefiles/namei.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/namei.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/cachefiles/namei.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/cachefiles/namei.c</a></div><div class='hunk'>@@ -1,295 +1,274 @@</div><div class='ctx'> // SPDX-License-Identifier: GPL-2.0-or-later</div><div class='ctx'> /* CacheFiles path walking and related routines</div><div class='ctx'>  *</div><div class='del'>- * Copyright (C) 2007 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Copyright (C) 2021 Red Hat, Inc. All Rights Reserved.</div><div class='ctx'>  * Written by David Howells (dhowells@redhat.com)</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-#include &lt;linux/module.h&gt;</div><div class='del'>-#include &lt;linux/sched.h&gt;</div><div class='del'>-#include &lt;linux/file.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='del'>-#include &lt;linux/fsnotify.h&gt;</div><div class='del'>-#include &lt;linux/quotaops.h&gt;</div><div class='del'>-#include &lt;linux/xattr.h&gt;</div><div class='del'>-#include &lt;linux/mount.h&gt;</div><div class='ctx'> #include &lt;linux/namei.h&gt;</div><div class='del'>-#include &lt;linux/security.h&gt;</div><div class='del'>-#include &lt;linux/slab.h&gt;</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> </div><div class='del'>-#define CACHEFILES_KEYBUF_SIZE 512</div><div class='del'>-</div><div class='ctx'> /*</div><div class='del'>- * dump debugging info about an object</div><div class='add'>+ * Mark the backing file as being a cache file if it's not already in use.  The</div><div class='add'>+ * mark tells the culling request command that it's not allowed to cull the</div><div class='add'>+ * file or directory.  The caller must hold the inode lock.</div><div class='ctx'>  */</div><div class='del'>-static noinline</div><div class='del'>-void __cachefiles_printk_object(struct cachefiles_object *object,</div><div class='del'>-				const char *prefix)</div><div class='add'>+static bool __cachefiles_mark_inode_in_use(struct cachefiles_object *object,</div><div class='add'>+					   struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct fscache_cookie *cookie;</div><div class='del'>-	const u8 *k;</div><div class='del'>-	unsigned loop;</div><div class='del'>-</div><div class='del'>-	pr_err("%sobject: OBJ%x\n", prefix, object-&gt;fscache.debug_id);</div><div class='del'>-	pr_err("%sobjstate=%s fl=%lx wbusy=%x ev=%lx[%lx]\n",</div><div class='del'>-	       prefix, object-&gt;fscache.state-&gt;name,</div><div class='del'>-	       object-&gt;fscache.flags, work_busy(&amp;object-&gt;fscache.work),</div><div class='del'>-	       object-&gt;fscache.events, object-&gt;fscache.event_mask);</div><div class='del'>-	pr_err("%sops=%u inp=%u exc=%u\n",</div><div class='del'>-	       prefix, object-&gt;fscache.n_ops, object-&gt;fscache.n_in_progress,</div><div class='del'>-	       object-&gt;fscache.n_exclusive);</div><div class='del'>-	pr_err("%sparent=%x\n",</div><div class='del'>-	       prefix, object-&gt;fscache.parent ? object-&gt;fscache.parent-&gt;debug_id : 0);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;object-&gt;fscache.lock);</div><div class='del'>-	cookie = object-&gt;fscache.cookie;</div><div class='del'>-	if (cookie) {</div><div class='del'>-		pr_err("%scookie=%x [pr=%x nd=%p fl=%lx]\n",</div><div class='del'>-		       prefix,</div><div class='del'>-		       cookie-&gt;debug_id,</div><div class='del'>-		       cookie-&gt;parent ? cookie-&gt;parent-&gt;debug_id : 0,</div><div class='del'>-		       cookie-&gt;netfs_data,</div><div class='del'>-		       cookie-&gt;flags);</div><div class='del'>-		pr_err("%skey=[%u] '", prefix, cookie-&gt;key_len);</div><div class='del'>-		k = (cookie-&gt;key_len &lt;= sizeof(cookie-&gt;inline_key)) ?</div><div class='del'>-			cookie-&gt;inline_key : cookie-&gt;key;</div><div class='del'>-		for (loop = 0; loop &lt; cookie-&gt;key_len; loop++)</div><div class='del'>-			pr_cont("%02x", k[loop]);</div><div class='del'>-		pr_cont("'\n");</div><div class='add'>+	bool can_use = false;</div><div class='add'>+</div><div class='add'>+	if (!(inode-&gt;i_flags &amp; S_KERNEL_FILE)) {</div><div class='add'>+		inode-&gt;i_flags |= S_KERNEL_FILE;</div><div class='add'>+		trace_cachefiles_mark_active(object, inode);</div><div class='add'>+		can_use = true;</div><div class='ctx'> 	} else {</div><div class='del'>-		pr_err("%scookie=NULL\n", prefix);</div><div class='add'>+		trace_cachefiles_mark_failed(object, inode);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;object-&gt;fscache.lock);</div><div class='add'>+</div><div class='add'>+	return can_use;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool cachefiles_mark_inode_in_use(struct cachefiles_object *object,</div><div class='add'>+					 struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	bool can_use;</div><div class='add'>+</div><div class='add'>+	inode_lock(inode);</div><div class='add'>+	can_use = __cachefiles_mark_inode_in_use(object, inode);</div><div class='add'>+	inode_unlock(inode);</div><div class='add'>+	return can_use;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * dump debugging info about a pair of objects</div><div class='add'>+ * Unmark a backing inode.  The caller must hold the inode lock.</div><div class='ctx'>  */</div><div class='del'>-static noinline void cachefiles_printk_object(struct cachefiles_object *object,</div><div class='del'>-					      struct cachefiles_object *xobject)</div><div class='add'>+static void __cachefiles_unmark_inode_in_use(struct cachefiles_object *object,</div><div class='add'>+					     struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	if (object)</div><div class='del'>-		__cachefiles_printk_object(object, "");</div><div class='del'>-	if (xobject)</div><div class='del'>-		__cachefiles_printk_object(xobject, "x");</div><div class='add'>+	inode-&gt;i_flags &amp;= ~S_KERNEL_FILE;</div><div class='add'>+	trace_cachefiles_mark_inactive(object, inode);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void cachefiles_do_unmark_inode_in_use(struct cachefiles_object *object,</div><div class='add'>+					      struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	inode_lock(inode);</div><div class='add'>+	__cachefiles_unmark_inode_in_use(object, inode);</div><div class='add'>+	inode_unlock(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * mark the owner of a dentry, if there is one, to indicate that that dentry</div><div class='del'>- * has been preemptively deleted</div><div class='del'>- * - the caller must hold the i_mutex on the dentry's parent as required to</div><div class='del'>- *   call vfs_unlink(), vfs_rmdir() or vfs_rename()</div><div class='add'>+ * Unmark a backing inode and tell cachefilesd that there's something that can</div><div class='add'>+ * be culled.</div><div class='ctx'>  */</div><div class='del'>-static void cachefiles_mark_object_buried(struct cachefiles_cache *cache,</div><div class='del'>-					  struct dentry *dentry,</div><div class='del'>-					  enum fscache_why_object_killed why)</div><div class='add'>+void cachefiles_unmark_inode_in_use(struct cachefiles_object *object,</div><div class='add'>+				    struct file *file)</div><div class='ctx'> {</div><div class='del'>-	struct cachefiles_object *object;</div><div class='del'>-	struct rb_node *p;</div><div class='del'>-</div><div class='del'>-	_enter(",'%pd'", dentry);</div><div class='add'>+	struct cachefiles_cache *cache = object-&gt;volume-&gt;cache;</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='ctx'> </div><div class='del'>-	write_lock(&amp;cache-&gt;active_lock);</div><div class='add'>+	cachefiles_do_unmark_inode_in_use(object, inode);</div><div class='ctx'> </div><div class='del'>-	p = cache-&gt;active_nodes.rb_node;</div><div class='del'>-	while (p) {</div><div class='del'>-		object = rb_entry(p, struct cachefiles_object, active_node);</div><div class='del'>-		if (object-&gt;dentry &gt; dentry)</div><div class='del'>-			p = p-&gt;rb_left;</div><div class='del'>-		else if (object-&gt;dentry &lt; dentry)</div><div class='del'>-			p = p-&gt;rb_right;</div><div class='del'>-		else</div><div class='del'>-			goto found_dentry;</div><div class='add'>+	if (!test_bit(CACHEFILES_OBJECT_USING_TMPFILE, &amp;object-&gt;flags)) {</div><div class='add'>+		atomic_long_add(inode-&gt;i_blocks, &amp;cache-&gt;b_released);</div><div class='add'>+		if (atomic_inc_return(&amp;cache-&gt;f_released))</div><div class='add'>+			cachefiles_state_changed(cache);</div><div class='ctx'> 	}</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	write_unlock(&amp;cache-&gt;active_lock);</div><div class='del'>-	trace_cachefiles_mark_buried(NULL, dentry, why);</div><div class='del'>-	_leave(" [no owner]");</div><div class='del'>-	return;</div><div class='add'>+/*</div><div class='add'>+ * get a subdirectory</div><div class='add'>+ */</div><div class='add'>+struct dentry *cachefiles_get_directory(struct cachefiles_cache *cache,</div><div class='add'>+					struct dentry *dir,</div><div class='add'>+					const char *dirname,</div><div class='add'>+					bool *_is_new)</div><div class='add'>+{</div><div class='add'>+	struct dentry *subdir;</div><div class='add'>+	struct path path;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	/* found the dentry for  */</div><div class='del'>-found_dentry:</div><div class='del'>-	kdebug("preemptive burial: OBJ%x [%s] %pd",</div><div class='del'>-	       object-&gt;fscache.debug_id,</div><div class='del'>-	       object-&gt;fscache.state-&gt;name,</div><div class='del'>-	       dentry);</div><div class='add'>+	_enter(",,%s", dirname);</div><div class='ctx'> </div><div class='del'>-	trace_cachefiles_mark_buried(object, dentry, why);</div><div class='add'>+	/* search the current directory for the element name */</div><div class='ctx'> </div><div class='del'>-	if (fscache_object_is_live(&amp;object-&gt;fscache)) {</div><div class='del'>-		pr_err("\n");</div><div class='del'>-		pr_err("Error: Can't preemptively bury live object\n");</div><div class='del'>-		cachefiles_printk_object(object, NULL);</div><div class='del'>-	} else {</div><div class='del'>-		if (why != FSCACHE_OBJECT_IS_STALE)</div><div class='del'>-			fscache_object_mark_killed(&amp;object-&gt;fscache, why);</div><div class='add'>+retry:</div><div class='add'>+	ret = cachefiles_inject_read_error();</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		subdir = start_creating(&amp;nop_mnt_idmap, dir, &amp;QSTR(dirname));</div><div class='add'>+	else</div><div class='add'>+		subdir = ERR_PTR(ret);</div><div class='add'>+	trace_cachefiles_lookup(NULL, dir, subdir);</div><div class='add'>+	if (IS_ERR(subdir)) {</div><div class='add'>+		trace_cachefiles_vfs_error(NULL, d_backing_inode(dir),</div><div class='add'>+					   PTR_ERR(subdir),</div><div class='add'>+					   cachefiles_trace_lookup_error);</div><div class='add'>+		if (PTR_ERR(subdir) == -ENOMEM)</div><div class='add'>+			goto nomem_d_alloc;</div><div class='add'>+		goto lookup_error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	write_unlock(&amp;cache-&gt;active_lock);</div><div class='del'>-	_leave(" [owner marked]");</div><div class='del'>-}</div><div class='add'>+	_debug("subdir -&gt; %pd %s",</div><div class='add'>+	       subdir, d_backing_inode(subdir) ? "positive" : "negative");</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * record the fact that an object is now active</div><div class='del'>- */</div><div class='del'>-static int cachefiles_mark_object_active(struct cachefiles_cache *cache,</div><div class='del'>-					 struct cachefiles_object *object)</div><div class='del'>-{</div><div class='del'>-	struct cachefiles_object *xobject;</div><div class='del'>-	struct rb_node **_p, *_parent = NULL;</div><div class='del'>-	struct dentry *dentry;</div><div class='add'>+	/* we need to create the subdir if it doesn't exist yet */</div><div class='add'>+	if (d_is_negative(subdir)) {</div><div class='add'>+		ret = cachefiles_has_space(cache, 1, 0,</div><div class='add'>+					   cachefiles_has_space_for_create);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto mkdir_error;</div><div class='ctx'> </div><div class='del'>-	_enter(",%x", object-&gt;fscache.debug_id);</div><div class='add'>+		_debug("attempt mkdir");</div><div class='ctx'> </div><div class='del'>-try_again:</div><div class='del'>-	write_lock(&amp;cache-&gt;active_lock);</div><div class='add'>+		path.mnt = cache-&gt;mnt;</div><div class='add'>+		path.dentry = dir;</div><div class='add'>+		ret = security_path_mkdir(&amp;path, subdir, 0700);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto mkdir_error;</div><div class='add'>+		ret = cachefiles_inject_write_error();</div><div class='add'>+		if (ret == 0) {</div><div class='add'>+			subdir = vfs_mkdir(&amp;nop_mnt_idmap, d_inode(dir), subdir, 0700, NULL);</div><div class='add'>+		} else {</div><div class='add'>+			end_creating(subdir);</div><div class='add'>+			subdir = ERR_PTR(ret);</div><div class='add'>+		}</div><div class='add'>+		if (IS_ERR(subdir)) {</div><div class='add'>+			trace_cachefiles_vfs_error(NULL, d_inode(dir), ret,</div><div class='add'>+						   cachefiles_trace_mkdir_error);</div><div class='add'>+			goto mkdir_error;</div><div class='add'>+		}</div><div class='add'>+		trace_cachefiles_mkdir(dir, subdir);</div><div class='ctx'> </div><div class='del'>-	dentry = object-&gt;dentry;</div><div class='del'>-	trace_cachefiles_mark_active(object, dentry);</div><div class='add'>+		if (unlikely(d_unhashed(subdir) || d_is_negative(subdir))) {</div><div class='add'>+			end_creating(subdir);</div><div class='add'>+			goto retry;</div><div class='add'>+		}</div><div class='add'>+		ASSERT(d_backing_inode(subdir));</div><div class='ctx'> </div><div class='del'>-	if (test_and_set_bit(CACHEFILES_OBJECT_ACTIVE, &amp;object-&gt;flags)) {</div><div class='del'>-		pr_err("Error: Object already active\n");</div><div class='del'>-		cachefiles_printk_object(object, NULL);</div><div class='del'>-		BUG();</div><div class='add'>+		_debug("mkdir -&gt; %pd{ino=%lu}",</div><div class='add'>+		       subdir, d_backing_inode(subdir)-&gt;i_ino);</div><div class='add'>+		if (_is_new)</div><div class='add'>+			*_is_new = true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	_p = &amp;cache-&gt;active_nodes.rb_node;</div><div class='del'>-	while (*_p) {</div><div class='del'>-		_parent = *_p;</div><div class='del'>-		xobject = rb_entry(_parent,</div><div class='del'>-				   struct cachefiles_object, active_node);</div><div class='add'>+	/* Tell rmdir() it's not allowed to delete the subdir */</div><div class='add'>+	inode_lock(d_inode(subdir));</div><div class='add'>+	end_creating_keep(subdir);</div><div class='ctx'> </div><div class='del'>-		ASSERT(xobject != object);</div><div class='del'>-</div><div class='del'>-		if (xobject-&gt;dentry &gt; dentry)</div><div class='del'>-			_p = &amp;(*_p)-&gt;rb_left;</div><div class='del'>-		else if (xobject-&gt;dentry &lt; dentry)</div><div class='del'>-			_p = &amp;(*_p)-&gt;rb_right;</div><div class='del'>-		else</div><div class='del'>-			goto wait_for_old_object;</div><div class='add'>+	if (!__cachefiles_mark_inode_in_use(NULL, d_inode(subdir))) {</div><div class='add'>+		pr_notice("cachefiles: Inode already in use: %pd (B=%lx)\n",</div><div class='add'>+			  subdir, d_inode(subdir)-&gt;i_ino);</div><div class='add'>+		goto mark_error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	rb_link_node(&amp;object-&gt;active_node, _parent, _p);</div><div class='del'>-	rb_insert_color(&amp;object-&gt;active_node, &amp;cache-&gt;active_nodes);</div><div class='add'>+	inode_unlock(d_inode(subdir));</div><div class='ctx'> </div><div class='del'>-	write_unlock(&amp;cache-&gt;active_lock);</div><div class='del'>-	_leave(" = 0");</div><div class='del'>-	return 0;</div><div class='add'>+	/* we need to make sure the subdir is a directory */</div><div class='add'>+	ASSERT(d_backing_inode(subdir));</div><div class='ctx'> </div><div class='del'>-	/* an old object from a previous incarnation is hogging the slot - we</div><div class='del'>-	 * need to wait for it to be destroyed */</div><div class='del'>-wait_for_old_object:</div><div class='del'>-	trace_cachefiles_wait_active(object, dentry, xobject);</div><div class='del'>-	clear_bit(CACHEFILES_OBJECT_ACTIVE, &amp;object-&gt;flags);</div><div class='del'>-</div><div class='del'>-	if (fscache_object_is_live(&amp;xobject-&gt;fscache)) {</div><div class='del'>-		pr_err("\n");</div><div class='del'>-		pr_err("Error: Unexpected object collision\n");</div><div class='del'>-		cachefiles_printk_object(object, xobject);</div><div class='del'>-	}</div><div class='del'>-	atomic_inc(&amp;xobject-&gt;usage);</div><div class='del'>-	write_unlock(&amp;cache-&gt;active_lock);</div><div class='del'>-</div><div class='del'>-	if (test_bit(CACHEFILES_OBJECT_ACTIVE, &amp;xobject-&gt;flags)) {</div><div class='del'>-		wait_queue_head_t *wq;</div><div class='del'>-</div><div class='del'>-		signed long timeout = 60 * HZ;</div><div class='del'>-		wait_queue_entry_t wait;</div><div class='del'>-		bool requeue;</div><div class='del'>-</div><div class='del'>-		/* if the object we're waiting for is queued for processing,</div><div class='del'>-		 * then just put ourselves on the queue behind it */</div><div class='del'>-		if (work_pending(&amp;xobject-&gt;fscache.work)) {</div><div class='del'>-			_debug("queue OBJ%x behind OBJ%x immediately",</div><div class='del'>-			       object-&gt;fscache.debug_id,</div><div class='del'>-			       xobject-&gt;fscache.debug_id);</div><div class='del'>-			goto requeue;</div><div class='del'>-		}</div><div class='add'>+	if (!d_can_lookup(subdir)) {</div><div class='add'>+		pr_err("%s is not a directory\n", dirname);</div><div class='add'>+		ret = -EIO;</div><div class='add'>+		goto check_error;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		/* otherwise we sleep until either the object we're waiting for</div><div class='del'>-		 * is done, or the fscache_object is congested */</div><div class='del'>-		wq = bit_waitqueue(&amp;xobject-&gt;flags, CACHEFILES_OBJECT_ACTIVE);</div><div class='del'>-		init_wait(&amp;wait);</div><div class='del'>-		requeue = false;</div><div class='del'>-		do {</div><div class='del'>-			prepare_to_wait(wq, &amp;wait, TASK_UNINTERRUPTIBLE);</div><div class='del'>-			if (!test_bit(CACHEFILES_OBJECT_ACTIVE, &amp;xobject-&gt;flags))</div><div class='del'>-				break;</div><div class='del'>-</div><div class='del'>-			requeue = fscache_object_sleep_till_congested(&amp;timeout);</div><div class='del'>-		} while (timeout &gt; 0 &amp;&amp; !requeue);</div><div class='del'>-		finish_wait(wq, &amp;wait);</div><div class='del'>-</div><div class='del'>-		if (requeue &amp;&amp;</div><div class='del'>-		    test_bit(CACHEFILES_OBJECT_ACTIVE, &amp;xobject-&gt;flags)) {</div><div class='del'>-			_debug("queue OBJ%x behind OBJ%x after wait",</div><div class='del'>-			       object-&gt;fscache.debug_id,</div><div class='del'>-			       xobject-&gt;fscache.debug_id);</div><div class='del'>-			goto requeue;</div><div class='del'>-		}</div><div class='add'>+	ret = -EPERM;</div><div class='add'>+	if (!(d_backing_inode(subdir)-&gt;i_opflags &amp; IOP_XATTR) ||</div><div class='add'>+	    !d_backing_inode(subdir)-&gt;i_op-&gt;lookup ||</div><div class='add'>+	    !d_backing_inode(subdir)-&gt;i_op-&gt;mkdir ||</div><div class='add'>+	    !d_backing_inode(subdir)-&gt;i_op-&gt;rename ||</div><div class='add'>+	    !d_backing_inode(subdir)-&gt;i_op-&gt;rmdir ||</div><div class='add'>+	    !d_backing_inode(subdir)-&gt;i_op-&gt;unlink)</div><div class='add'>+		goto check_error;</div><div class='ctx'> </div><div class='del'>-		if (timeout &lt;= 0) {</div><div class='del'>-			pr_err("\n");</div><div class='del'>-			pr_err("Error: Overlong wait for old active object to go away\n");</div><div class='del'>-			cachefiles_printk_object(object, xobject);</div><div class='del'>-			goto requeue;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	_leave(" = [%lu]", d_backing_inode(subdir)-&gt;i_ino);</div><div class='add'>+	return subdir;</div><div class='ctx'> </div><div class='del'>-	ASSERT(!test_bit(CACHEFILES_OBJECT_ACTIVE, &amp;xobject-&gt;flags));</div><div class='add'>+check_error:</div><div class='add'>+	cachefiles_put_directory(subdir);</div><div class='add'>+	_leave(" = %d [check]", ret);</div><div class='add'>+	return ERR_PTR(ret);</div><div class='ctx'> </div><div class='del'>-	cache-&gt;cache.ops-&gt;put_object(&amp;xobject-&gt;fscache,</div><div class='del'>-		(enum fscache_obj_ref_trace)cachefiles_obj_put_wait_retry);</div><div class='del'>-	goto try_again;</div><div class='add'>+mark_error:</div><div class='add'>+	inode_unlock(d_inode(subdir));</div><div class='add'>+	dput(subdir);</div><div class='add'>+	return ERR_PTR(-EBUSY);</div><div class='ctx'> </div><div class='del'>-requeue:</div><div class='del'>-	cache-&gt;cache.ops-&gt;put_object(&amp;xobject-&gt;fscache,</div><div class='del'>-		(enum fscache_obj_ref_trace)cachefiles_obj_put_wait_timeo);</div><div class='del'>-	_leave(" = -ETIMEDOUT");</div><div class='del'>-	return -ETIMEDOUT;</div><div class='add'>+mkdir_error:</div><div class='add'>+	end_creating(subdir);</div><div class='add'>+	pr_err("mkdir %s failed with error %d\n", dirname, ret);</div><div class='add'>+	return ERR_PTR(ret);</div><div class='add'>+</div><div class='add'>+lookup_error:</div><div class='add'>+	ret = PTR_ERR(subdir);</div><div class='add'>+	pr_err("Lookup %s failed with error %d\n", dirname, ret);</div><div class='add'>+	return ERR_PTR(ret);</div><div class='add'>+</div><div class='add'>+nomem_d_alloc:</div><div class='add'>+	inode_unlock(d_inode(dir));</div><div class='add'>+	_leave(" = -ENOMEM");</div><div class='add'>+	return ERR_PTR(-ENOMEM);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Mark an object as being inactive.</div><div class='add'>+ * Put a subdirectory.</div><div class='ctx'>  */</div><div class='del'>-void cachefiles_mark_object_inactive(struct cachefiles_cache *cache,</div><div class='del'>-				     struct cachefiles_object *object,</div><div class='del'>-				     blkcnt_t i_blocks)</div><div class='add'>+void cachefiles_put_directory(struct dentry *dir)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *dentry = object-&gt;dentry;</div><div class='del'>-	struct inode *inode = d_backing_inode(dentry);</div><div class='del'>-</div><div class='del'>-	trace_cachefiles_mark_inactive(object, dentry, inode);</div><div class='add'>+	if (dir) {</div><div class='add'>+		cachefiles_do_unmark_inode_in_use(NULL, d_inode(dir));</div><div class='add'>+		dput(dir);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	write_lock(&amp;cache-&gt;active_lock);</div><div class='del'>-	rb_erase(&amp;object-&gt;active_node, &amp;cache-&gt;active_nodes);</div><div class='del'>-	clear_bit(CACHEFILES_OBJECT_ACTIVE, &amp;object-&gt;flags);</div><div class='del'>-	write_unlock(&amp;cache-&gt;active_lock);</div><div class='add'>+/*</div><div class='add'>+ * Remove a regular file from the cache.</div><div class='add'>+ */</div><div class='add'>+static int cachefiles_unlink(struct cachefiles_cache *cache,</div><div class='add'>+			     struct cachefiles_object *object,</div><div class='add'>+			     struct dentry *dir, struct dentry *dentry,</div><div class='add'>+			     enum fscache_why_object_killed why)</div><div class='add'>+{</div><div class='add'>+	struct path path = {</div><div class='add'>+		.mnt	= cache-&gt;mnt,</div><div class='add'>+		.dentry	= dir,</div><div class='add'>+	};</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	wake_up_bit(&amp;object-&gt;flags, CACHEFILES_OBJECT_ACTIVE);</div><div class='add'>+	trace_cachefiles_unlink(object, d_inode(dentry)-&gt;i_ino, why);</div><div class='add'>+	ret = security_path_unlink(&amp;path, dentry);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		cachefiles_io_error(cache, "Unlink security error");</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	/* This object can now be culled, so we need to let the daemon know</div><div class='del'>-	 * that there is something it can remove if it needs to.</div><div class='del'>-	 */</div><div class='del'>-	atomic_long_add(i_blocks, &amp;cache-&gt;b_released);</div><div class='del'>-	if (atomic_inc_return(&amp;cache-&gt;f_released))</div><div class='del'>-		cachefiles_state_changed(cache);</div><div class='add'>+	ret = cachefiles_inject_remove_error();</div><div class='add'>+	if (ret == 0) {</div><div class='add'>+		ret = vfs_unlink(&amp;nop_mnt_idmap, d_backing_inode(dir), dentry, NULL);</div><div class='add'>+		if (ret == -EIO)</div><div class='add'>+			cachefiles_io_error(cache, "Unlink failed");</div><div class='add'>+	}</div><div class='add'>+	if (ret != 0)</div><div class='add'>+		trace_cachefiles_vfs_error(object, d_backing_inode(dir), ret,</div><div class='add'>+					   cachefiles_trace_unlink_error);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * delete an object representation from the cache</div><div class='del'>- * - file backed objects are unlinked</div><div class='del'>- * - directory backed objects are stuffed into the graveyard for userspace to</div><div class='add'>+ * Delete an object representation from the cache</div><div class='add'>+ * - File backed objects are unlinked</div><div class='add'>+ * - Directory backed objects are stuffed into the graveyard for userspace to</div><div class='ctx'>  *   delete</div><div class='del'>- * - unlocks the directory mutex</div><div class='add'>+ * On entry dir must be locked.  It will be unlocked on exit.</div><div class='add'>+ * On entry there must be at least 2 refs on rep, one will be dropped on exit.</div><div class='ctx'>  */</div><div class='del'>-static int cachefiles_bury_object(struct cachefiles_cache *cache,</div><div class='del'>-				  struct cachefiles_object *object,</div><div class='del'>-				  struct dentry *dir,</div><div class='del'>-				  struct dentry *rep,</div><div class='del'>-				  bool preemptive,</div><div class='del'>-				  enum fscache_why_object_killed why)</div><div class='add'>+int cachefiles_bury_object(struct cachefiles_cache *cache,</div><div class='add'>+			   struct cachefiles_object *object,</div><div class='add'>+			   struct dentry *dir,</div><div class='add'>+			   struct dentry *rep,</div><div class='add'>+			   enum fscache_why_object_killed why)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *grave, *trap;</div><div class='ctx'> 	struct path path, path_to_graveyard;</div><div class='hunk'>@@ -298,28 +277,16 @@ static int cachefiles_bury_object(struct cachefiles_cache *cache,</div><div class='ctx'> </div><div class='ctx'> 	_enter(",'%pd','%pd'", dir, rep);</div><div class='ctx'> </div><div class='add'>+	if (rep-&gt;d_parent != dir) {</div><div class='add'>+		end_removing(rep);</div><div class='add'>+		_leave(" = -ESTALE");</div><div class='add'>+		return -ESTALE;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/* non-directories can just be unlinked */</div><div class='ctx'> 	if (!d_is_dir(rep)) {</div><div class='del'>-		_debug("unlink stale object");</div><div class='del'>-</div><div class='del'>-		path.mnt = cache-&gt;mnt;</div><div class='del'>-		path.dentry = dir;</div><div class='del'>-		ret = security_path_unlink(&amp;path, rep);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			cachefiles_io_error(cache, "Unlink security error");</div><div class='del'>-		} else {</div><div class='del'>-			trace_cachefiles_unlink(object, rep, why);</div><div class='del'>-			ret = vfs_unlink(&amp;init_user_ns, d_inode(dir), rep,</div><div class='del'>-					 NULL);</div><div class='del'>-</div><div class='del'>-			if (preemptive)</div><div class='del'>-				cachefiles_mark_object_buried(cache, rep, why);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		inode_unlock(d_inode(dir));</div><div class='del'>-</div><div class='del'>-		if (ret == -EIO)</div><div class='del'>-			cachefiles_io_error(cache, "Unlink failed");</div><div class='add'>+		ret = cachefiles_unlink(cache, object, dir, rep, why);</div><div class='add'>+		end_removing(rep);</div><div class='ctx'> </div><div class='ctx'> 		_leave(" = %d", ret);</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -327,7 +294,7 @@ static int cachefiles_bury_object(struct cachefiles_cache *cache,</div><div class='ctx'> </div><div class='ctx'> 	/* directories have to be moved to the graveyard */</div><div class='ctx'> 	_debug("move stale object to graveyard");</div><div class='del'>-	inode_unlock(d_inode(dir));</div><div class='add'>+	end_removing(rep);</div><div class='ctx'> </div><div class='ctx'> try_again:</div><div class='ctx'> 	/* first step is to make up a grave dentry in the graveyard */</div><div class='hunk'>@@ -337,6 +304,8 @@ try_again:</div><div class='ctx'> </div><div class='ctx'> 	/* do the multiway lock magic */</div><div class='ctx'> 	trap = lock_rename(cache-&gt;graveyard, dir);</div><div class='add'>+	if (IS_ERR(trap))</div><div class='add'>+		return PTR_ERR(trap);</div><div class='ctx'> </div><div class='ctx'> 	/* do some checks before getting the grave dentry */</div><div class='ctx'> 	if (rep-&gt;d_parent != dir || IS_DEADDIR(d_inode(rep))) {</div><div class='hunk'>@@ -365,17 +334,19 @@ try_again:</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	grave = lookup_one_len(nbuffer, cache-&gt;graveyard, strlen(nbuffer));</div><div class='add'>+	grave = lookup_one(&amp;nop_mnt_idmap, &amp;QSTR(nbuffer), cache-&gt;graveyard);</div><div class='ctx'> 	if (IS_ERR(grave)) {</div><div class='ctx'> 		unlock_rename(cache-&gt;graveyard, dir);</div><div class='add'>+		trace_cachefiles_vfs_error(object, d_inode(cache-&gt;graveyard),</div><div class='add'>+					   PTR_ERR(grave),</div><div class='add'>+					   cachefiles_trace_lookup_error);</div><div class='ctx'> </div><div class='ctx'> 		if (PTR_ERR(grave) == -ENOMEM) {</div><div class='ctx'> 			_leave(" = -ENOMEM");</div><div class='ctx'> 			return -ENOMEM;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		cachefiles_io_error(cache, "Lookup error %ld",</div><div class='del'>-				    PTR_ERR(grave));</div><div class='add'>+		cachefiles_io_error(cache, "Lookup error %ld", PTR_ERR(grave));</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -412,23 +383,25 @@ try_again:</div><div class='ctx'> 		cachefiles_io_error(cache, "Rename security error %d", ret);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		struct renamedata rd = {</div><div class='del'>-			.old_mnt_userns	= &amp;init_user_ns,</div><div class='del'>-			.old_dir	= d_inode(dir),</div><div class='add'>+			.mnt_idmap	= &amp;nop_mnt_idmap,</div><div class='add'>+			.old_parent	= dir,</div><div class='ctx'> 			.old_dentry	= rep,</div><div class='del'>-			.new_mnt_userns	= &amp;init_user_ns,</div><div class='del'>-			.new_dir	= d_inode(cache-&gt;graveyard),</div><div class='add'>+			.new_parent	= cache-&gt;graveyard,</div><div class='ctx'> 			.new_dentry	= grave,</div><div class='ctx'> 		};</div><div class='del'>-		trace_cachefiles_rename(object, rep, grave, why);</div><div class='del'>-		ret = vfs_rename(&amp;rd);</div><div class='add'>+		trace_cachefiles_rename(object, d_inode(rep)-&gt;i_ino, why);</div><div class='add'>+		ret = cachefiles_inject_read_error();</div><div class='add'>+		if (ret == 0)</div><div class='add'>+			ret = vfs_rename(&amp;rd);</div><div class='add'>+		if (ret != 0)</div><div class='add'>+			trace_cachefiles_vfs_error(object, d_inode(dir), ret,</div><div class='add'>+						   cachefiles_trace_rename_error);</div><div class='ctx'> 		if (ret != 0 &amp;&amp; ret != -ENOMEM)</div><div class='ctx'> 			cachefiles_io_error(cache,</div><div class='ctx'> 					    "Rename failed with error %d", ret);</div><div class='del'>-</div><div class='del'>-		if (preemptive)</div><div class='del'>-			cachefiles_mark_object_buried(cache, rep, why);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	__cachefiles_unmark_inode_in_use(object, d_inode(rep));</div><div class='ctx'> 	unlock_rename(cache-&gt;graveyard, dir);</div><div class='ctx'> 	dput(grave);</div><div class='ctx'> 	_leave(" = 0");</div><div class='hunk'>@@ -436,493 +409,365 @@ try_again:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * delete an object representation from the cache</div><div class='add'>+ * Delete a cache file.</div><div class='ctx'>  */</div><div class='del'>-int cachefiles_delete_object(struct cachefiles_cache *cache,</div><div class='del'>-			     struct cachefiles_object *object)</div><div class='add'>+int cachefiles_delete_object(struct cachefiles_object *object,</div><div class='add'>+			     enum fscache_why_object_killed why)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *dir;</div><div class='add'>+	struct cachefiles_volume *volume = object-&gt;volume;</div><div class='add'>+	struct dentry *dentry = object-&gt;file-&gt;f_path.dentry;</div><div class='add'>+	struct dentry *fan = volume-&gt;fanout[(u8)object-&gt;cookie-&gt;key_hash];</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	_enter(",OBJ%x{%pd}", object-&gt;fscache.debug_id, object-&gt;dentry);</div><div class='del'>-</div><div class='del'>-	ASSERT(object-&gt;dentry);</div><div class='del'>-	ASSERT(d_backing_inode(object-&gt;dentry));</div><div class='del'>-	ASSERT(object-&gt;dentry-&gt;d_parent);</div><div class='add'>+	_enter(",OBJ%x{%pD}", object-&gt;debug_id, object-&gt;file);</div><div class='ctx'> </div><div class='del'>-	dir = dget_parent(object-&gt;dentry);</div><div class='del'>-</div><div class='del'>-	inode_lock_nested(d_inode(dir), I_MUTEX_PARENT);</div><div class='del'>-</div><div class='del'>-	if (test_bit(FSCACHE_OBJECT_KILLED_BY_CACHE, &amp;object-&gt;fscache.flags)) {</div><div class='del'>-		/* object allocation for the same key preemptively deleted this</div><div class='del'>-		 * object's file so that it could create its own file */</div><div class='del'>-		_debug("object preemptively buried");</div><div class='del'>-		inode_unlock(d_inode(dir));</div><div class='del'>-		ret = 0;</div><div class='del'>-	} else {</div><div class='del'>-		/* we need to check that our parent is _still_ our parent - it</div><div class='del'>-		 * may have been renamed */</div><div class='del'>-		if (dir == object-&gt;dentry-&gt;d_parent) {</div><div class='del'>-			ret = cachefiles_bury_object(cache, object, dir,</div><div class='del'>-						     object-&gt;dentry, false,</div><div class='del'>-						     FSCACHE_OBJECT_WAS_RETIRED);</div><div class='del'>-		} else {</div><div class='del'>-			/* it got moved, presumably by cachefilesd culling it,</div><div class='del'>-			 * so it's no longer in the key path and we can ignore</div><div class='del'>-			 * it */</div><div class='del'>-			inode_unlock(d_inode(dir));</div><div class='del'>-			ret = 0;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	dput(dir);</div><div class='del'>-	_leave(" = %d", ret);</div><div class='add'>+	dentry = start_removing_dentry(fan, dentry);</div><div class='add'>+	if (IS_ERR(dentry))</div><div class='add'>+		ret = PTR_ERR(dentry);</div><div class='add'>+	else</div><div class='add'>+		ret = cachefiles_unlink(volume-&gt;cache, object, fan, dentry, why);</div><div class='add'>+	end_removing(dentry);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * walk from the parent object to the child object through the backing</div><div class='del'>- * filesystem, creating directories as we go</div><div class='add'>+ * Create a temporary file and leave it unattached and un-xattr'd until the</div><div class='add'>+ * time comes to discard the object from memory.</div><div class='ctx'>  */</div><div class='del'>-int cachefiles_walk_to_object(struct cachefiles_object *parent,</div><div class='del'>-			      struct cachefiles_object *object,</div><div class='del'>-			      const char *key,</div><div class='del'>-			      struct cachefiles_xattr *auxdata)</div><div class='add'>+struct file *cachefiles_create_tmpfile(struct cachefiles_object *object)</div><div class='ctx'> {</div><div class='del'>-	struct cachefiles_cache *cache;</div><div class='del'>-	struct dentry *dir, *next = NULL;</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	struct path path;</div><div class='del'>-	const char *name;</div><div class='del'>-	int ret, nlen;</div><div class='del'>-</div><div class='del'>-	_enter("OBJ%x{%pd},OBJ%x,%s,",</div><div class='del'>-	       parent-&gt;fscache.debug_id, parent-&gt;dentry,</div><div class='del'>-	       object-&gt;fscache.debug_id, key);</div><div class='del'>-</div><div class='del'>-	cache = container_of(parent-&gt;fscache.cache,</div><div class='del'>-			     struct cachefiles_cache, cache);</div><div class='del'>-	path.mnt = cache-&gt;mnt;</div><div class='del'>-</div><div class='del'>-	ASSERT(parent-&gt;dentry);</div><div class='del'>-	ASSERT(d_backing_inode(parent-&gt;dentry));</div><div class='del'>-</div><div class='del'>-	if (!(d_is_dir(parent-&gt;dentry))) {</div><div class='del'>-		// TODO: convert file to dir</div><div class='del'>-		_leave("looking up in none directory");</div><div class='del'>-		return -ENOBUFS;</div><div class='add'>+	struct cachefiles_volume *volume = object-&gt;volume;</div><div class='add'>+	struct cachefiles_cache *cache = volume-&gt;cache;</div><div class='add'>+	const struct cred *saved_cred;</div><div class='add'>+	struct dentry *fan = volume-&gt;fanout[(u8)object-&gt;cookie-&gt;key_hash];</div><div class='add'>+	struct file *file;</div><div class='add'>+	const struct path parentpath = { .mnt = cache-&gt;mnt, .dentry = fan };</div><div class='add'>+	uint64_t ni_size;</div><div class='add'>+	long ret;</div><div class='add'>+</div><div class='add'>+</div><div class='add'>+	cachefiles_begin_secure(cache, &amp;saved_cred);</div><div class='add'>+</div><div class='add'>+	ret = cachefiles_inject_write_error();</div><div class='add'>+	if (ret == 0) {</div><div class='add'>+		file = kernel_tmpfile_open(&amp;nop_mnt_idmap, &amp;parentpath,</div><div class='add'>+					   S_IFREG | 0600,</div><div class='add'>+					   O_RDWR | O_LARGEFILE | O_DIRECT,</div><div class='add'>+					   cache-&gt;cache_cred);</div><div class='add'>+		ret = PTR_ERR_OR_ZERO(file);</div><div class='add'>+	}</div><div class='add'>+	if (ret) {</div><div class='add'>+		trace_cachefiles_vfs_error(object, d_inode(fan), ret,</div><div class='add'>+					   cachefiles_trace_tmpfile_error);</div><div class='add'>+		if (ret == -EIO)</div><div class='add'>+			cachefiles_io_error_obj(object, "Failed to create tmpfile");</div><div class='add'>+		goto err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dir = dget(parent-&gt;dentry);</div><div class='del'>-</div><div class='del'>-advance:</div><div class='del'>-	/* attempt to transit the first directory component */</div><div class='del'>-	name = key;</div><div class='del'>-	nlen = strlen(key);</div><div class='add'>+	trace_cachefiles_tmpfile(object, file_inode(file));</div><div class='ctx'> </div><div class='del'>-	/* key ends in a double NUL */</div><div class='del'>-	key = key + nlen + 1;</div><div class='del'>-	if (!*key)</div><div class='del'>-		key = NULL;</div><div class='add'>+	/* This is a newly created file with no other possible user */</div><div class='add'>+	if (!cachefiles_mark_inode_in_use(object, file_inode(file)))</div><div class='add'>+		WARN_ON(1);</div><div class='ctx'> </div><div class='del'>-lookup_again:</div><div class='del'>-	/* search the current directory for the element name */</div><div class='del'>-	_debug("lookup '%s'", name);</div><div class='del'>-</div><div class='del'>-	inode_lock_nested(d_inode(dir), I_MUTEX_PARENT);</div><div class='del'>-</div><div class='del'>-	next = lookup_one_len(name, dir, nlen);</div><div class='del'>-	if (IS_ERR(next)) {</div><div class='del'>-		trace_cachefiles_lookup(object, next, NULL);</div><div class='del'>-		goto lookup_error;</div><div class='del'>-	}</div><div class='add'>+	ret = cachefiles_ondemand_init_object(object);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto err_unuse;</div><div class='ctx'> </div><div class='del'>-	inode = d_backing_inode(next);</div><div class='del'>-	trace_cachefiles_lookup(object, next, inode);</div><div class='del'>-	_debug("next -&gt; %pd %s", next, inode ? "positive" : "negative");</div><div class='del'>-</div><div class='del'>-	if (!key)</div><div class='del'>-		object-&gt;new = !inode;</div><div class='del'>-</div><div class='del'>-	/* if this element of the path doesn't exist, then the lookup phase</div><div class='del'>-	 * failed, and we can release any readers in the certain knowledge that</div><div class='del'>-	 * there's nothing for them to actually read */</div><div class='del'>-	if (d_is_negative(next))</div><div class='del'>-		fscache_object_lookup_negative(&amp;object-&gt;fscache);</div><div class='del'>-</div><div class='del'>-	/* we need to create the object if it's negative */</div><div class='del'>-	if (key || object-&gt;type == FSCACHE_COOKIE_TYPE_INDEX) {</div><div class='del'>-		/* index objects and intervening tree levels must be subdirs */</div><div class='del'>-		if (d_is_negative(next)) {</div><div class='del'>-			ret = cachefiles_has_space(cache, 1, 0);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto no_space_error;</div><div class='del'>-</div><div class='del'>-			path.dentry = dir;</div><div class='del'>-			ret = security_path_mkdir(&amp;path, next, 0);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto create_error;</div><div class='del'>-			ret = vfs_mkdir(&amp;init_user_ns, d_inode(dir), next, 0);</div><div class='del'>-			if (!key)</div><div class='del'>-				trace_cachefiles_mkdir(object, next, ret);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto create_error;</div><div class='del'>-</div><div class='del'>-			if (unlikely(d_unhashed(next))) {</div><div class='del'>-				dput(next);</div><div class='del'>-				inode_unlock(d_inode(dir));</div><div class='del'>-				goto lookup_again;</div><div class='del'>-			}</div><div class='del'>-			ASSERT(d_backing_inode(next));</div><div class='del'>-</div><div class='del'>-			_debug("mkdir -&gt; %pd{ino=%lu}",</div><div class='del'>-			       next, d_backing_inode(next)-&gt;i_ino);</div><div class='del'>-</div><div class='del'>-		} else if (!d_can_lookup(next)) {</div><div class='del'>-			pr_err("inode %lu is not a directory\n",</div><div class='del'>-			       d_backing_inode(next)-&gt;i_ino);</div><div class='del'>-			ret = -ENOBUFS;</div><div class='del'>-			goto error;</div><div class='del'>-		}</div><div class='add'>+	ni_size = object-&gt;cookie-&gt;object_size;</div><div class='add'>+	ni_size = round_up(ni_size, CACHEFILES_DIO_BLOCK_SIZE);</div><div class='ctx'> </div><div class='del'>-	} else {</div><div class='del'>-		/* non-index objects start out life as files */</div><div class='del'>-		if (d_is_negative(next)) {</div><div class='del'>-			ret = cachefiles_has_space(cache, 1, 0);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto no_space_error;</div><div class='del'>-</div><div class='del'>-			path.dentry = dir;</div><div class='del'>-			ret = security_path_mknod(&amp;path, next, S_IFREG, 0);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto create_error;</div><div class='del'>-			ret = vfs_create(&amp;init_user_ns, d_inode(dir), next,</div><div class='del'>-					 S_IFREG, true);</div><div class='del'>-			trace_cachefiles_create(object, next, ret);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto create_error;</div><div class='del'>-</div><div class='del'>-			ASSERT(d_backing_inode(next));</div><div class='del'>-</div><div class='del'>-			_debug("create -&gt; %pd{ino=%lu}",</div><div class='del'>-			       next, d_backing_inode(next)-&gt;i_ino);</div><div class='del'>-</div><div class='del'>-		} else if (!d_can_lookup(next) &amp;&amp;</div><div class='del'>-			   !d_is_reg(next)</div><div class='del'>-			   ) {</div><div class='del'>-			pr_err("inode %lu is not a file or directory\n",</div><div class='del'>-			       d_backing_inode(next)-&gt;i_ino);</div><div class='del'>-			ret = -ENOBUFS;</div><div class='del'>-			goto error;</div><div class='add'>+	if (ni_size &gt; 0) {</div><div class='add'>+		trace_cachefiles_trunc(object, file_inode(file), 0, ni_size,</div><div class='add'>+				       cachefiles_trunc_expand_tmpfile);</div><div class='add'>+		ret = cachefiles_inject_write_error();</div><div class='add'>+		if (ret == 0)</div><div class='add'>+			ret = vfs_truncate(&amp;file-&gt;f_path, ni_size);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			trace_cachefiles_vfs_error(</div><div class='add'>+				object, file_inode(file), ret,</div><div class='add'>+				cachefiles_trace_trunc_error);</div><div class='add'>+			goto err_unuse;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* process the next component */</div><div class='del'>-	if (key) {</div><div class='del'>-		_debug("advance");</div><div class='del'>-		inode_unlock(d_inode(dir));</div><div class='del'>-		dput(dir);</div><div class='del'>-		dir = next;</div><div class='del'>-		next = NULL;</div><div class='del'>-		goto advance;</div><div class='add'>+	ret = -EINVAL;</div><div class='add'>+	if (unlikely(!file-&gt;f_op-&gt;read_iter) ||</div><div class='add'>+	    unlikely(!file-&gt;f_op-&gt;write_iter)) {</div><div class='add'>+		fput(file);</div><div class='add'>+		pr_notice("Cache does not support read_iter and write_iter\n");</div><div class='add'>+		goto err_unuse;</div><div class='ctx'> 	}</div><div class='add'>+out:</div><div class='add'>+	cachefiles_end_secure(cache, saved_cred);</div><div class='add'>+	return file;</div><div class='ctx'> </div><div class='del'>-	/* we've found the object we were looking for */</div><div class='del'>-	object-&gt;dentry = next;</div><div class='del'>-</div><div class='del'>-	/* if we've found that the terminal object exists, then we need to</div><div class='del'>-	 * check its attributes and delete it if it's out of date */</div><div class='del'>-	if (!object-&gt;new) {</div><div class='del'>-		_debug("validate '%pd'", next);</div><div class='del'>-</div><div class='del'>-		ret = cachefiles_check_object_xattr(object, auxdata);</div><div class='del'>-		if (ret == -ESTALE) {</div><div class='del'>-			/* delete the object (the deleter drops the directory</div><div class='del'>-			 * mutex) */</div><div class='del'>-			object-&gt;dentry = NULL;</div><div class='add'>+err_unuse:</div><div class='add'>+	cachefiles_do_unmark_inode_in_use(object, file_inode(file));</div><div class='add'>+	fput(file);</div><div class='add'>+err:</div><div class='add'>+	file = ERR_PTR(ret);</div><div class='add'>+	goto out;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-			ret = cachefiles_bury_object(cache, object, dir, next,</div><div class='del'>-						     true,</div><div class='del'>-						     FSCACHE_OBJECT_IS_STALE);</div><div class='del'>-			dput(next);</div><div class='del'>-			next = NULL;</div><div class='add'>+/*</div><div class='add'>+ * Create a new file.</div><div class='add'>+ */</div><div class='add'>+static bool cachefiles_create_file(struct cachefiles_object *object)</div><div class='add'>+{</div><div class='add'>+	struct file *file;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto delete_error;</div><div class='add'>+	ret = cachefiles_has_space(object-&gt;volume-&gt;cache, 1, 0,</div><div class='add'>+				   cachefiles_has_space_for_create);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-			_debug("redo lookup");</div><div class='del'>-			fscache_object_retrying_stale(&amp;object-&gt;fscache);</div><div class='del'>-			goto lookup_again;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	file = cachefiles_create_tmpfile(object);</div><div class='add'>+	if (IS_ERR(file))</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-	/* note that we're now using this object */</div><div class='del'>-	ret = cachefiles_mark_object_active(cache, object);</div><div class='add'>+	set_bit(FSCACHE_COOKIE_NEEDS_UPDATE, &amp;object-&gt;cookie-&gt;flags);</div><div class='add'>+	set_bit(CACHEFILES_OBJECT_USING_TMPFILE, &amp;object-&gt;flags);</div><div class='add'>+	_debug("create -&gt; %pD{ino=%lu}", file, file_inode(file)-&gt;i_ino);</div><div class='add'>+	object-&gt;file = file;</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	inode_unlock(d_inode(dir));</div><div class='del'>-	dput(dir);</div><div class='del'>-	dir = NULL;</div><div class='add'>+/*</div><div class='add'>+ * Open an existing file, checking its attributes and replacing it if it is</div><div class='add'>+ * stale.</div><div class='add'>+ */</div><div class='add'>+static bool cachefiles_open_file(struct cachefiles_object *object,</div><div class='add'>+				 struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	struct cachefiles_cache *cache = object-&gt;volume-&gt;cache;</div><div class='add'>+	struct file *file;</div><div class='add'>+	struct path path;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	if (ret == -ETIMEDOUT)</div><div class='del'>-		goto mark_active_timed_out;</div><div class='add'>+	_enter("%pd", dentry);</div><div class='ctx'> </div><div class='del'>-	_debug("=== OBTAINED_OBJECT ===");</div><div class='add'>+	if (!cachefiles_mark_inode_in_use(object, d_inode(dentry))) {</div><div class='add'>+		pr_notice("cachefiles: Inode already in use: %pd (B=%lx)\n",</div><div class='add'>+			  dentry, d_inode(dentry)-&gt;i_ino);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (object-&gt;new) {</div><div class='del'>-		/* attach data to a newly constructed terminal object */</div><div class='del'>-		ret = cachefiles_set_object_xattr(object, auxdata);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			goto check_error;</div><div class='del'>-	} else {</div><div class='del'>-		/* always update the atime on an object we've just looked up</div><div class='del'>-		 * (this is used to keep track of culling, and atimes are only</div><div class='del'>-		 * updated by read, write and readdir but not lookup or</div><div class='del'>-		 * open) */</div><div class='del'>-		path.dentry = next;</div><div class='del'>-		touch_atime(&amp;path);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* open a file interface onto a data file */</div><div class='del'>-	if (object-&gt;type != FSCACHE_COOKIE_TYPE_INDEX) {</div><div class='del'>-		if (d_is_reg(object-&gt;dentry)) {</div><div class='del'>-			const struct address_space_operations *aops;</div><div class='del'>-</div><div class='del'>-			ret = -EPERM;</div><div class='del'>-			aops = d_backing_inode(object-&gt;dentry)-&gt;i_mapping-&gt;a_ops;</div><div class='del'>-			if (!aops-&gt;bmap)</div><div class='del'>-				goto check_error;</div><div class='del'>-			if (object-&gt;dentry-&gt;d_sb-&gt;s_blocksize &gt; PAGE_SIZE)</div><div class='del'>-				goto check_error;</div><div class='del'>-</div><div class='del'>-			object-&gt;backer = object-&gt;dentry;</div><div class='del'>-		} else {</div><div class='del'>-			BUG(); // TODO: open file in data-class subdir</div><div class='del'>-		}</div><div class='add'>+	/* We need to open a file interface onto a data file now as we can't do</div><div class='add'>+	 * it on demand because writeback called from do_exit() sees</div><div class='add'>+	 * current-&gt;fs == NULL - which breaks d_path() called from ext4 open.</div><div class='add'>+	 */</div><div class='add'>+	path.mnt = cache-&gt;mnt;</div><div class='add'>+	path.dentry = dentry;</div><div class='add'>+	file = kernel_file_open(&amp;path, O_RDWR | O_LARGEFILE | O_DIRECT, cache-&gt;cache_cred);</div><div class='add'>+	if (IS_ERR(file)) {</div><div class='add'>+		trace_cachefiles_vfs_error(object, d_backing_inode(dentry),</div><div class='add'>+					   PTR_ERR(file),</div><div class='add'>+					   cachefiles_trace_open_error);</div><div class='add'>+		goto error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	object-&gt;new = 0;</div><div class='del'>-	fscache_obtained_object(&amp;object-&gt;fscache);</div><div class='add'>+	if (unlikely(!file-&gt;f_op-&gt;read_iter) ||</div><div class='add'>+	    unlikely(!file-&gt;f_op-&gt;write_iter)) {</div><div class='add'>+		pr_notice("Cache does not support read_iter and write_iter\n");</div><div class='add'>+		goto error_fput;</div><div class='add'>+	}</div><div class='add'>+	_debug("file -&gt; %pd positive", dentry);</div><div class='ctx'> </div><div class='del'>-	_leave(" = 0 [%lu]", d_backing_inode(object-&gt;dentry)-&gt;i_ino);</div><div class='del'>-	return 0;</div><div class='add'>+	ret = cachefiles_ondemand_init_object(object);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto error_fput;</div><div class='ctx'> </div><div class='del'>-no_space_error:</div><div class='del'>-	fscache_object_mark_killed(&amp;object-&gt;fscache, FSCACHE_OBJECT_NO_SPACE);</div><div class='del'>-create_error:</div><div class='del'>-	_debug("create error %d", ret);</div><div class='del'>-	if (ret == -EIO)</div><div class='del'>-		cachefiles_io_error(cache, "Create/mkdir failed");</div><div class='del'>-	goto error;</div><div class='add'>+	ret = cachefiles_check_auxdata(object, file);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto check_failed;</div><div class='ctx'> </div><div class='del'>-mark_active_timed_out:</div><div class='del'>-	_debug("mark active timed out");</div><div class='del'>-	goto release_dentry;</div><div class='add'>+	clear_bit(FSCACHE_COOKIE_NO_DATA_TO_READ, &amp;object-&gt;cookie-&gt;flags);</div><div class='ctx'> </div><div class='del'>-check_error:</div><div class='del'>-	_debug("check error %d", ret);</div><div class='del'>-	cachefiles_mark_object_inactive(</div><div class='del'>-		cache, object, d_backing_inode(object-&gt;dentry)-&gt;i_blocks);</div><div class='del'>-release_dentry:</div><div class='del'>-	dput(object-&gt;dentry);</div><div class='del'>-	object-&gt;dentry = NULL;</div><div class='del'>-	goto error_out;</div><div class='del'>-</div><div class='del'>-delete_error:</div><div class='del'>-	_debug("delete error %d", ret);</div><div class='del'>-	goto error_out2;</div><div class='add'>+	object-&gt;file = file;</div><div class='ctx'> </div><div class='del'>-lookup_error:</div><div class='del'>-	_debug("lookup error %ld", PTR_ERR(next));</div><div class='del'>-	ret = PTR_ERR(next);</div><div class='del'>-	if (ret == -EIO)</div><div class='del'>-		cachefiles_io_error(cache, "Lookup failed");</div><div class='del'>-	next = NULL;</div><div class='add'>+	/* Always update the atime on an object we've just looked up (this is</div><div class='add'>+	 * used to keep track of culling, and atimes are only updated by read,</div><div class='add'>+	 * write and readdir but not lookup or open).</div><div class='add'>+	 */</div><div class='add'>+	touch_atime(&amp;file-&gt;f_path);</div><div class='add'>+	return true;</div><div class='add'>+</div><div class='add'>+check_failed:</div><div class='add'>+	fscache_cookie_lookup_negative(object-&gt;cookie);</div><div class='add'>+	cachefiles_unmark_inode_in_use(object, file);</div><div class='add'>+	fput(file);</div><div class='add'>+	if (ret == -ESTALE)</div><div class='add'>+		return cachefiles_create_file(object);</div><div class='add'>+	return false;</div><div class='add'>+</div><div class='add'>+error_fput:</div><div class='add'>+	fput(file);</div><div class='ctx'> error:</div><div class='del'>-	inode_unlock(d_inode(dir));</div><div class='del'>-	dput(next);</div><div class='del'>-error_out2:</div><div class='del'>-	dput(dir);</div><div class='del'>-error_out:</div><div class='del'>-	_leave(" = error %d", -ret);</div><div class='del'>-	return ret;</div><div class='add'>+	cachefiles_do_unmark_inode_in_use(object, d_inode(dentry));</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * get a subdirectory</div><div class='add'>+ * walk from the parent object to the child object through the backing</div><div class='add'>+ * filesystem, creating directories as we go</div><div class='ctx'>  */</div><div class='del'>-struct dentry *cachefiles_get_directory(struct cachefiles_cache *cache,</div><div class='del'>-					struct dentry *dir,</div><div class='del'>-					const char *dirname)</div><div class='add'>+bool cachefiles_look_up_object(struct cachefiles_object *object)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *subdir;</div><div class='del'>-	struct path path;</div><div class='add'>+	struct cachefiles_volume *volume = object-&gt;volume;</div><div class='add'>+	struct dentry *dentry, *fan = volume-&gt;fanout[(u8)object-&gt;cookie-&gt;key_hash];</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	_enter(",,%s", dirname);</div><div class='del'>-</div><div class='del'>-	/* search the current directory for the element name */</div><div class='del'>-	inode_lock(d_inode(dir));</div><div class='del'>-</div><div class='del'>-retry:</div><div class='del'>-	subdir = lookup_one_len(dirname, dir, strlen(dirname));</div><div class='del'>-	if (IS_ERR(subdir)) {</div><div class='del'>-		if (PTR_ERR(subdir) == -ENOMEM)</div><div class='del'>-			goto nomem_d_alloc;</div><div class='del'>-		goto lookup_error;</div><div class='add'>+	_enter("OBJ%x,%s,", object-&gt;debug_id, object-&gt;d_name);</div><div class='add'>+</div><div class='add'>+	/* Look up path "cache/vol/fanout/file". */</div><div class='add'>+	ret = cachefiles_inject_read_error();</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		dentry = lookup_one_positive_unlocked(&amp;nop_mnt_idmap,</div><div class='add'>+						      &amp;QSTR(object-&gt;d_name), fan);</div><div class='add'>+	else</div><div class='add'>+		dentry = ERR_PTR(ret);</div><div class='add'>+	trace_cachefiles_lookup(object, fan, dentry);</div><div class='add'>+	if (IS_ERR(dentry)) {</div><div class='add'>+		if (dentry == ERR_PTR(-ENOENT))</div><div class='add'>+			goto new_file;</div><div class='add'>+		if (dentry == ERR_PTR(-EIO))</div><div class='add'>+			cachefiles_io_error_obj(object, "Lookup failed");</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!d_is_reg(dentry)) {</div><div class='add'>+		pr_err("%pd is not a file\n", dentry);</div><div class='add'>+		struct dentry *de = start_removing_dentry(fan, dentry);</div><div class='add'>+		if (IS_ERR(de))</div><div class='add'>+			ret = PTR_ERR(de);</div><div class='add'>+		else</div><div class='add'>+			ret = cachefiles_bury_object(volume-&gt;cache, object,</div><div class='add'>+						     fan, de,</div><div class='add'>+						     FSCACHE_OBJECT_IS_WEIRD);</div><div class='add'>+		dput(dentry);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return false;</div><div class='add'>+		goto new_file;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	_debug("subdir -&gt; %pd %s",</div><div class='del'>-	       subdir, d_backing_inode(subdir) ? "positive" : "negative");</div><div class='add'>+	ret = cachefiles_open_file(object, dentry);</div><div class='add'>+	dput(dentry);</div><div class='add'>+	if (!ret)</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-	/* we need to create the subdir if it doesn't exist yet */</div><div class='del'>-	if (d_is_negative(subdir)) {</div><div class='del'>-		ret = cachefiles_has_space(cache, 1, 0);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			goto mkdir_error;</div><div class='add'>+	_leave(" = t [%lu]", file_inode(object-&gt;file)-&gt;i_ino);</div><div class='add'>+	return true;</div><div class='ctx'> </div><div class='del'>-		_debug("attempt mkdir");</div><div class='add'>+new_file:</div><div class='add'>+	fscache_cookie_lookup_negative(object-&gt;cookie);</div><div class='add'>+	return cachefiles_create_file(object);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		path.mnt = cache-&gt;mnt;</div><div class='del'>-		path.dentry = dir;</div><div class='del'>-		ret = security_path_mkdir(&amp;path, subdir, 0700);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			goto mkdir_error;</div><div class='del'>-		ret = vfs_mkdir(&amp;init_user_ns, d_inode(dir), subdir, 0700);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			goto mkdir_error;</div><div class='add'>+/*</div><div class='add'>+ * Attempt to link a temporary file into its rightful place in the cache.</div><div class='add'>+ */</div><div class='add'>+bool cachefiles_commit_tmpfile(struct cachefiles_cache *cache,</div><div class='add'>+			       struct cachefiles_object *object)</div><div class='add'>+{</div><div class='add'>+	struct cachefiles_volume *volume = object-&gt;volume;</div><div class='add'>+	struct dentry *dentry, *fan = volume-&gt;fanout[(u8)object-&gt;cookie-&gt;key_hash];</div><div class='add'>+	bool success = false;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-		if (unlikely(d_unhashed(subdir))) {</div><div class='del'>-			dput(subdir);</div><div class='del'>-			goto retry;</div><div class='del'>-		}</div><div class='del'>-		ASSERT(d_backing_inode(subdir));</div><div class='add'>+	_enter(",%pD", object-&gt;file);</div><div class='ctx'> </div><div class='del'>-		_debug("mkdir -&gt; %pd{ino=%lu}",</div><div class='del'>-		       subdir, d_backing_inode(subdir)-&gt;i_ino);</div><div class='add'>+	ret = cachefiles_inject_read_error();</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		dentry = start_creating(&amp;nop_mnt_idmap, fan, &amp;QSTR(object-&gt;d_name));</div><div class='add'>+	else</div><div class='add'>+		dentry = ERR_PTR(ret);</div><div class='add'>+	if (IS_ERR(dentry)) {</div><div class='add'>+		trace_cachefiles_vfs_error(object, d_inode(fan), PTR_ERR(dentry),</div><div class='add'>+					   cachefiles_trace_lookup_error);</div><div class='add'>+		_debug("lookup fail %ld", PTR_ERR(dentry));</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	inode_unlock(d_inode(dir));</div><div class='add'>+	/*</div><div class='add'>+	 * This loop will only execute more than once if some other thread</div><div class='add'>+	 * races to create the object we are trying to create.</div><div class='add'>+	 */</div><div class='add'>+	while (!d_is_negative(dentry)) {</div><div class='add'>+		ret = cachefiles_unlink(volume-&gt;cache, object, fan, dentry,</div><div class='add'>+					FSCACHE_OBJECT_IS_STALE);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out_end;</div><div class='ctx'> </div><div class='del'>-	/* we need to make sure the subdir is a directory */</div><div class='del'>-	ASSERT(d_backing_inode(subdir));</div><div class='add'>+		end_creating(dentry);</div><div class='ctx'> </div><div class='del'>-	if (!d_can_lookup(subdir)) {</div><div class='del'>-		pr_err("%s is not a directory\n", dirname);</div><div class='del'>-		ret = -EIO;</div><div class='del'>-		goto check_error;</div><div class='add'>+		ret = cachefiles_inject_read_error();</div><div class='add'>+		if (ret == 0)</div><div class='add'>+			dentry = start_creating(&amp;nop_mnt_idmap, fan,</div><div class='add'>+						&amp;QSTR(object-&gt;d_name));</div><div class='add'>+		else</div><div class='add'>+			dentry = ERR_PTR(ret);</div><div class='add'>+		if (IS_ERR(dentry)) {</div><div class='add'>+			trace_cachefiles_vfs_error(object, d_inode(fan), PTR_ERR(dentry),</div><div class='add'>+						   cachefiles_trace_lookup_error);</div><div class='add'>+			_debug("lookup fail %ld", PTR_ERR(dentry));</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = -EPERM;</div><div class='del'>-	if (!(d_backing_inode(subdir)-&gt;i_opflags &amp; IOP_XATTR) ||</div><div class='del'>-	    !d_backing_inode(subdir)-&gt;i_op-&gt;lookup ||</div><div class='del'>-	    !d_backing_inode(subdir)-&gt;i_op-&gt;mkdir ||</div><div class='del'>-	    !d_backing_inode(subdir)-&gt;i_op-&gt;create ||</div><div class='del'>-	    !d_backing_inode(subdir)-&gt;i_op-&gt;rename ||</div><div class='del'>-	    !d_backing_inode(subdir)-&gt;i_op-&gt;rmdir ||</div><div class='del'>-	    !d_backing_inode(subdir)-&gt;i_op-&gt;unlink)</div><div class='del'>-		goto check_error;</div><div class='del'>-</div><div class='del'>-	_leave(" = [%lu]", d_backing_inode(subdir)-&gt;i_ino);</div><div class='del'>-	return subdir;</div><div class='del'>-</div><div class='del'>-check_error:</div><div class='del'>-	dput(subdir);</div><div class='del'>-	_leave(" = %d [check]", ret);</div><div class='del'>-	return ERR_PTR(ret);</div><div class='del'>-</div><div class='del'>-mkdir_error:</div><div class='del'>-	inode_unlock(d_inode(dir));</div><div class='del'>-	dput(subdir);</div><div class='del'>-	pr_err("mkdir %s failed with error %d\n", dirname, ret);</div><div class='del'>-	return ERR_PTR(ret);</div><div class='del'>-</div><div class='del'>-lookup_error:</div><div class='del'>-	inode_unlock(d_inode(dir));</div><div class='del'>-	ret = PTR_ERR(subdir);</div><div class='del'>-	pr_err("Lookup %s failed with error %d\n", dirname, ret);</div><div class='del'>-	return ERR_PTR(ret);</div><div class='del'>-</div><div class='del'>-nomem_d_alloc:</div><div class='del'>-	inode_unlock(d_inode(dir));</div><div class='del'>-	_leave(" = -ENOMEM");</div><div class='del'>-	return ERR_PTR(-ENOMEM);</div><div class='add'>+	ret = cachefiles_inject_read_error();</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		ret = vfs_link(object-&gt;file-&gt;f_path.dentry, &amp;nop_mnt_idmap,</div><div class='add'>+			       d_inode(fan), dentry, NULL);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		trace_cachefiles_vfs_error(object, d_inode(fan), ret,</div><div class='add'>+					   cachefiles_trace_link_error);</div><div class='add'>+		_debug("link fail %d", ret);</div><div class='add'>+	} else {</div><div class='add'>+		trace_cachefiles_link(object, file_inode(object-&gt;file));</div><div class='add'>+		spin_lock(&amp;object-&gt;lock);</div><div class='add'>+		/* TODO: Do we want to switch the file pointer to the new dentry? */</div><div class='add'>+		clear_bit(CACHEFILES_OBJECT_USING_TMPFILE, &amp;object-&gt;flags);</div><div class='add'>+		spin_unlock(&amp;object-&gt;lock);</div><div class='add'>+		success = true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+out_end:</div><div class='add'>+	end_creating(dentry);</div><div class='add'>+out:</div><div class='add'>+	_leave(" = %u", success);</div><div class='add'>+	return success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * find out if an object is in use or not</div><div class='del'>- * - if finds object and it's not in use:</div><div class='del'>- *   - returns a pointer to the object and a reference on it</div><div class='del'>- *   - returns with the directory locked</div><div class='add'>+ * Look up an inode to be checked or culled.  Return -EBUSY if the inode is</div><div class='add'>+ * marked in use.</div><div class='ctx'>  */</div><div class='del'>-static struct dentry *cachefiles_check_active(struct cachefiles_cache *cache,</div><div class='del'>-					      struct dentry *dir,</div><div class='del'>-					      char *filename)</div><div class='add'>+static struct dentry *cachefiles_lookup_for_cull(struct cachefiles_cache *cache,</div><div class='add'>+						 struct dentry *dir,</div><div class='add'>+						 char *filename)</div><div class='ctx'> {</div><div class='del'>-	struct cachefiles_object *object;</div><div class='del'>-	struct rb_node *_n;</div><div class='ctx'> 	struct dentry *victim;</div><div class='del'>-	int ret;</div><div class='add'>+	int ret = -ENOENT;</div><div class='ctx'> </div><div class='del'>-	//_enter(",%pd/,%s",</div><div class='del'>-	//       dir, filename);</div><div class='add'>+	victim = start_removing(&amp;nop_mnt_idmap, dir, &amp;QSTR(filename));</div><div class='ctx'> </div><div class='del'>-	/* look up the victim */</div><div class='del'>-	inode_lock_nested(d_inode(dir), I_MUTEX_PARENT);</div><div class='del'>-</div><div class='del'>-	victim = lookup_one_len(filename, dir, strlen(filename));</div><div class='ctx'> 	if (IS_ERR(victim))</div><div class='ctx'> 		goto lookup_error;</div><div class='del'>-</div><div class='del'>-	//_debug("victim -&gt; %pd %s",</div><div class='del'>-	//       victim, d_backing_inode(victim) ? "positive" : "negative");</div><div class='del'>-</div><div class='del'>-	/* if the object is no longer there then we probably retired the object</div><div class='del'>-	 * at the netfs's request whilst the cull was in progress</div><div class='del'>-	 */</div><div class='del'>-	if (d_is_negative(victim)) {</div><div class='del'>-		inode_unlock(d_inode(dir));</div><div class='del'>-		dput(victim);</div><div class='del'>-		_leave(" = -ENOENT [absent]");</div><div class='del'>-		return ERR_PTR(-ENOENT);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* check to see if we're using this object */</div><div class='del'>-	read_lock(&amp;cache-&gt;active_lock);</div><div class='del'>-</div><div class='del'>-	_n = cache-&gt;active_nodes.rb_node;</div><div class='del'>-</div><div class='del'>-	while (_n) {</div><div class='del'>-		object = rb_entry(_n, struct cachefiles_object, active_node);</div><div class='del'>-</div><div class='del'>-		if (object-&gt;dentry &gt; victim)</div><div class='del'>-			_n = _n-&gt;rb_left;</div><div class='del'>-		else if (object-&gt;dentry &lt; victim)</div><div class='del'>-			_n = _n-&gt;rb_right;</div><div class='del'>-		else</div><div class='del'>-			goto object_in_use;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	read_unlock(&amp;cache-&gt;active_lock);</div><div class='del'>-</div><div class='del'>-	//_leave(" = %pd", victim);</div><div class='add'>+	if (d_inode(victim)-&gt;i_flags &amp; S_KERNEL_FILE)</div><div class='add'>+		goto lookup_busy;</div><div class='ctx'> 	return victim;</div><div class='ctx'> </div><div class='del'>-object_in_use:</div><div class='del'>-	read_unlock(&amp;cache-&gt;active_lock);</div><div class='del'>-	inode_unlock(d_inode(dir));</div><div class='del'>-	dput(victim);</div><div class='del'>-	//_leave(" = -EBUSY [in use]");</div><div class='del'>-	return ERR_PTR(-EBUSY);</div><div class='add'>+lookup_busy:</div><div class='add'>+	ret = -EBUSY;</div><div class='add'>+	end_removing(victim);</div><div class='add'>+	return ERR_PTR(ret);</div><div class='ctx'> </div><div class='ctx'> lookup_error:</div><div class='del'>-	inode_unlock(d_inode(dir));</div><div class='ctx'> 	ret = PTR_ERR(victim);</div><div class='del'>-	if (ret == -ENOENT) {</div><div class='del'>-		/* file or dir now absent - probably retired by netfs */</div><div class='del'>-		_leave(" = -ESTALE [absent]");</div><div class='del'>-		return ERR_PTR(-ESTALE);</div><div class='del'>-	}</div><div class='add'>+	if (ret == -ENOENT)</div><div class='add'>+		return ERR_PTR(-ESTALE); /* Probably got retired by the netfs */</div><div class='ctx'> </div><div class='ctx'> 	if (ret == -EIO) {</div><div class='ctx'> 		cachefiles_io_error(cache, "Lookup failed");</div><div class='hunk'>@@ -931,59 +776,55 @@ lookup_error:</div><div class='ctx'> 		ret = -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	_leave(" = %d", ret);</div><div class='ctx'> 	return ERR_PTR(ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * cull an object if it's not in use</div><div class='add'>+ * Cull an object if it's not in use</div><div class='ctx'>  * - called only by cache manager daemon</div><div class='ctx'>  */</div><div class='ctx'> int cachefiles_cull(struct cachefiles_cache *cache, struct dentry *dir,</div><div class='ctx'> 		    char *filename)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *victim;</div><div class='add'>+	struct inode *inode;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	_enter(",%pd/,%s", dir, filename);</div><div class='ctx'> </div><div class='del'>-	victim = cachefiles_check_active(cache, dir, filename);</div><div class='add'>+	victim = cachefiles_lookup_for_cull(cache, dir, filename);</div><div class='ctx'> 	if (IS_ERR(victim))</div><div class='ctx'> 		return PTR_ERR(victim);</div><div class='ctx'> </div><div class='del'>-	_debug("victim -&gt; %pd %s",</div><div class='del'>-	       victim, d_backing_inode(victim) ? "positive" : "negative");</div><div class='del'>-</div><div class='del'>-	/* okay... the victim is not being used so we can cull it</div><div class='del'>-	 * - start by marking it as stale</div><div class='del'>-	 */</div><div class='del'>-	_debug("victim is cullable");</div><div class='del'>-</div><div class='del'>-	ret = cachefiles_remove_object_xattr(cache, victim);</div><div class='add'>+	/* check to see if someone is using this object */</div><div class='add'>+	inode = d_inode(victim);</div><div class='add'>+	inode_lock(inode);</div><div class='add'>+	if (inode-&gt;i_flags &amp; S_KERNEL_FILE) {</div><div class='add'>+		ret = -EBUSY;</div><div class='add'>+	} else {</div><div class='add'>+		/* Stop the cache from picking it back up */</div><div class='add'>+		inode-&gt;i_flags |= S_KERNEL_FILE;</div><div class='add'>+		ret = 0;</div><div class='add'>+	}</div><div class='add'>+	inode_unlock(inode);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto error_unlock;</div><div class='ctx'> </div><div class='del'>-	/*  actually remove the victim (drops the dir mutex) */</div><div class='del'>-	_debug("bury");</div><div class='del'>-</div><div class='del'>-	ret = cachefiles_bury_object(cache, NULL, dir, victim, false,</div><div class='add'>+	ret = cachefiles_bury_object(cache, NULL, dir, victim,</div><div class='ctx'> 				     FSCACHE_OBJECT_WAS_CULLED);</div><div class='add'>+	dput(victim);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto error;</div><div class='ctx'> </div><div class='del'>-	dput(victim);</div><div class='add'>+	fscache_count_culled();</div><div class='ctx'> 	_leave(" = 0");</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> error_unlock:</div><div class='del'>-	inode_unlock(d_inode(dir));</div><div class='add'>+	end_removing(victim);</div><div class='ctx'> error:</div><div class='del'>-	dput(victim);</div><div class='del'>-	if (ret == -ENOENT) {</div><div class='del'>-		/* file or dir now absent - probably retired by netfs */</div><div class='del'>-		_leave(" = -ESTALE [absent]");</div><div class='del'>-		return -ESTALE;</div><div class='del'>-	}</div><div class='add'>+	if (ret == -ENOENT)</div><div class='add'>+		return -ESTALE; /* Probably got retired by the netfs */</div><div class='ctx'> </div><div class='ctx'> 	if (ret != -ENOMEM) {</div><div class='ctx'> 		pr_err("Internal error: %d\n", ret);</div><div class='hunk'>@@ -995,7 +836,7 @@ error:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * find out if an object is in use or not</div><div class='add'>+ * Find out if an object is in use or not</div><div class='ctx'>  * - called only by cache manager daemon</div><div class='ctx'>  * - returns -EBUSY or 0 to indicate whether an object is in use or not</div><div class='ctx'>  */</div><div class='hunk'>@@ -1003,16 +844,13 @@ int cachefiles_check_in_use(struct cachefiles_cache *cache, struct dentry *dir,</div><div class='ctx'> 			    char *filename)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *victim;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	//_enter(",%pd/,%s",</div><div class='del'>-	//       dir, filename);</div><div class='del'>-</div><div class='del'>-	victim = cachefiles_check_active(cache, dir, filename);</div><div class='add'>+	victim = cachefiles_lookup_for_cull(cache, dir, filename);</div><div class='ctx'> 	if (IS_ERR(victim))</div><div class='ctx'> 		return PTR_ERR(victim);</div><div class='ctx'> </div><div class='ctx'> 	inode_unlock(d_inode(dir));</div><div class='ctx'> 	dput(victim);</div><div class='del'>-	//_leave(" = 0");</div><div class='del'>-	return 0;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/cachefiles/ondemand.c b/fs/cachefiles/ondemand.c<br/>new file mode 100644<br/>index 000000000000..a7ed86fa98bb<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/cachefiles/ondemand.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/cachefiles/ondemand.c</a></div><div class='hunk'>@@ -0,0 +1,762 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='add'>+#include &lt;linux/anon_inodes.h&gt;</div><div class='add'>+#include &lt;linux/uio.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+struct ondemand_anon_file {</div><div class='add'>+	struct file *file;</div><div class='add'>+	int fd;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static inline void cachefiles_req_put(struct cachefiles_req *req)</div><div class='add'>+{</div><div class='add'>+	if (refcount_dec_and_test(&amp;req-&gt;ref))</div><div class='add'>+		kfree(req);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int cachefiles_ondemand_fd_release(struct inode *inode,</div><div class='add'>+					  struct file *file)</div><div class='add'>+{</div><div class='add'>+	struct cachefiles_object *object = file-&gt;private_data;</div><div class='add'>+	struct cachefiles_cache *cache;</div><div class='add'>+	struct cachefiles_ondemand_info *info;</div><div class='add'>+	int object_id;</div><div class='add'>+	struct cachefiles_req *req;</div><div class='add'>+	XA_STATE(xas, NULL, 0);</div><div class='add'>+</div><div class='add'>+	if (!object)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	info = object-&gt;ondemand;</div><div class='add'>+	cache = object-&gt;volume-&gt;cache;</div><div class='add'>+	xas.xa = &amp;cache-&gt;reqs;</div><div class='add'>+</div><div class='add'>+	xa_lock(&amp;cache-&gt;reqs);</div><div class='add'>+	spin_lock(&amp;info-&gt;lock);</div><div class='add'>+	object_id = info-&gt;ondemand_id;</div><div class='add'>+	info-&gt;ondemand_id = CACHEFILES_ONDEMAND_ID_CLOSED;</div><div class='add'>+	cachefiles_ondemand_set_object_close(object);</div><div class='add'>+	spin_unlock(&amp;info-&gt;lock);</div><div class='add'>+</div><div class='add'>+	/* Only flush CACHEFILES_REQ_NEW marked req to avoid race with daemon_read */</div><div class='add'>+	xas_for_each_marked(&amp;xas, req, ULONG_MAX, CACHEFILES_REQ_NEW) {</div><div class='add'>+		if (req-&gt;msg.object_id == object_id &amp;&amp;</div><div class='add'>+		    req-&gt;msg.opcode == CACHEFILES_OP_CLOSE) {</div><div class='add'>+			complete(&amp;req-&gt;done);</div><div class='add'>+			xas_store(&amp;xas, NULL);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	xa_unlock(&amp;cache-&gt;reqs);</div><div class='add'>+</div><div class='add'>+	xa_erase(&amp;cache-&gt;ondemand_ids, object_id);</div><div class='add'>+	trace_cachefiles_ondemand_fd_release(object, object_id);</div><div class='add'>+	cachefiles_put_object(object, cachefiles_obj_put_ondemand_fd);</div><div class='add'>+	cachefiles_put_unbind_pincount(cache);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t cachefiles_ondemand_fd_write_iter(struct kiocb *kiocb,</div><div class='add'>+						 struct iov_iter *iter)</div><div class='add'>+{</div><div class='add'>+	struct cachefiles_object *object = kiocb-&gt;ki_filp-&gt;private_data;</div><div class='add'>+	struct cachefiles_cache *cache = object-&gt;volume-&gt;cache;</div><div class='add'>+	struct file *file;</div><div class='add'>+	size_t len = iter-&gt;count, aligned_len = len;</div><div class='add'>+	loff_t pos = kiocb-&gt;ki_pos;</div><div class='add'>+	const struct cred *saved_cred;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;object-&gt;lock);</div><div class='add'>+	file = object-&gt;file;</div><div class='add'>+	if (!file) {</div><div class='add'>+		spin_unlock(&amp;object-&gt;lock);</div><div class='add'>+		return -ENOBUFS;</div><div class='add'>+	}</div><div class='add'>+	get_file(file);</div><div class='add'>+	spin_unlock(&amp;object-&gt;lock);</div><div class='add'>+</div><div class='add'>+	cachefiles_begin_secure(cache, &amp;saved_cred);</div><div class='add'>+	ret = __cachefiles_prepare_write(object, file, &amp;pos, &amp;aligned_len, len, true);</div><div class='add'>+	cachefiles_end_secure(cache, saved_cred);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	trace_cachefiles_ondemand_fd_write(object, file_inode(file), pos, len);</div><div class='add'>+	ret = __cachefiles_write(object, file, pos, iter, NULL, NULL);</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		kiocb-&gt;ki_pos += ret;</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	fput(file);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static loff_t cachefiles_ondemand_fd_llseek(struct file *filp, loff_t pos,</div><div class='add'>+					    int whence)</div><div class='add'>+{</div><div class='add'>+	struct cachefiles_object *object = filp-&gt;private_data;</div><div class='add'>+	struct file *file;</div><div class='add'>+	loff_t ret;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;object-&gt;lock);</div><div class='add'>+	file = object-&gt;file;</div><div class='add'>+	if (!file) {</div><div class='add'>+		spin_unlock(&amp;object-&gt;lock);</div><div class='add'>+		return -ENOBUFS;</div><div class='add'>+	}</div><div class='add'>+	get_file(file);</div><div class='add'>+	spin_unlock(&amp;object-&gt;lock);</div><div class='add'>+</div><div class='add'>+	ret = vfs_llseek(file, pos, whence);</div><div class='add'>+	fput(file);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static long cachefiles_ondemand_fd_ioctl(struct file *filp, unsigned int ioctl,</div><div class='add'>+					 unsigned long id)</div><div class='add'>+{</div><div class='add'>+	struct cachefiles_object *object = filp-&gt;private_data;</div><div class='add'>+	struct cachefiles_cache *cache = object-&gt;volume-&gt;cache;</div><div class='add'>+	struct cachefiles_req *req;</div><div class='add'>+	XA_STATE(xas, &amp;cache-&gt;reqs, id);</div><div class='add'>+</div><div class='add'>+	if (ioctl != CACHEFILES_IOC_READ_COMPLETE)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	if (!test_bit(CACHEFILES_ONDEMAND_MODE, &amp;cache-&gt;flags))</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+</div><div class='add'>+	xa_lock(&amp;cache-&gt;reqs);</div><div class='add'>+	req = xas_load(&amp;xas);</div><div class='add'>+	if (!req || req-&gt;msg.opcode != CACHEFILES_OP_READ ||</div><div class='add'>+	    req-&gt;object != object) {</div><div class='add'>+		xa_unlock(&amp;cache-&gt;reqs);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+	xas_store(&amp;xas, NULL);</div><div class='add'>+	xa_unlock(&amp;cache-&gt;reqs);</div><div class='add'>+</div><div class='add'>+	trace_cachefiles_ondemand_cread(object, id);</div><div class='add'>+	complete(&amp;req-&gt;done);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct file_operations cachefiles_ondemand_fd_fops = {</div><div class='add'>+	.owner		= THIS_MODULE,</div><div class='add'>+	.release	= cachefiles_ondemand_fd_release,</div><div class='add'>+	.write_iter	= cachefiles_ondemand_fd_write_iter,</div><div class='add'>+	.llseek		= cachefiles_ondemand_fd_llseek,</div><div class='add'>+	.unlocked_ioctl	= cachefiles_ondemand_fd_ioctl,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * OPEN request Completion (copen)</div><div class='add'>+ * - command: "copen &lt;id&gt;,&lt;cache_size&gt;"</div><div class='add'>+ *   &lt;cache_size&gt; indicates the object size if &gt;=0, error code if negative</div><div class='add'>+ */</div><div class='add'>+int cachefiles_ondemand_copen(struct cachefiles_cache *cache, char *args)</div><div class='add'>+{</div><div class='add'>+	struct cachefiles_req *req;</div><div class='add'>+	struct fscache_cookie *cookie;</div><div class='add'>+	struct cachefiles_ondemand_info *info;</div><div class='add'>+	char *pid, *psize;</div><div class='add'>+	unsigned long id;</div><div class='add'>+	long size;</div><div class='add'>+	int ret;</div><div class='add'>+	XA_STATE(xas, &amp;cache-&gt;reqs, 0);</div><div class='add'>+</div><div class='add'>+	if (!test_bit(CACHEFILES_ONDEMAND_MODE, &amp;cache-&gt;flags))</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+</div><div class='add'>+	if (!*args) {</div><div class='add'>+		pr_err("Empty id specified\n");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	pid = args;</div><div class='add'>+	psize = strchr(args, ',');</div><div class='add'>+	if (!psize) {</div><div class='add'>+		pr_err("Cache size is not specified\n");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	*psize = 0;</div><div class='add'>+	psize++;</div><div class='add'>+</div><div class='add'>+	ret = kstrtoul(pid, 0, &amp;id);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	xa_lock(&amp;cache-&gt;reqs);</div><div class='add'>+	xas.xa_index = id;</div><div class='add'>+	req = xas_load(&amp;xas);</div><div class='add'>+	if (!req || req-&gt;msg.opcode != CACHEFILES_OP_OPEN ||</div><div class='add'>+	    !req-&gt;object-&gt;ondemand-&gt;ondemand_id) {</div><div class='add'>+		xa_unlock(&amp;cache-&gt;reqs);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+	xas_store(&amp;xas, NULL);</div><div class='add'>+	xa_unlock(&amp;cache-&gt;reqs);</div><div class='add'>+</div><div class='add'>+	info = req-&gt;object-&gt;ondemand;</div><div class='add'>+	/* fail OPEN request if copen format is invalid */</div><div class='add'>+	ret = kstrtol(psize, 0, &amp;size);</div><div class='add'>+	if (ret) {</div><div class='add'>+		req-&gt;error = ret;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* fail OPEN request if daemon reports an error */</div><div class='add'>+	if (size &lt; 0) {</div><div class='add'>+		if (!IS_ERR_VALUE(size)) {</div><div class='add'>+			req-&gt;error = -EINVAL;</div><div class='add'>+			ret = -EINVAL;</div><div class='add'>+		} else {</div><div class='add'>+			req-&gt;error = size;</div><div class='add'>+			ret = 0;</div><div class='add'>+		}</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;info-&gt;lock);</div><div class='add'>+	/*</div><div class='add'>+	 * The anonymous fd was closed before copen ? Fail the request.</div><div class='add'>+	 *</div><div class='add'>+	 *             t1             |             t2</div><div class='add'>+	 * ---------------------------------------------------------</div><div class='add'>+	 *                             cachefiles_ondemand_copen</div><div class='add'>+	 *                             req = xa_erase(&amp;cache-&gt;reqs, id)</div><div class='add'>+	 * // Anon fd is maliciously closed.</div><div class='add'>+	 * cachefiles_ondemand_fd_release</div><div class='add'>+	 * xa_lock(&amp;cache-&gt;reqs)</div><div class='add'>+	 * cachefiles_ondemand_set_object_close(object)</div><div class='add'>+	 * xa_unlock(&amp;cache-&gt;reqs)</div><div class='add'>+	 *                             cachefiles_ondemand_set_object_open</div><div class='add'>+	 *                             // No one will ever close it again.</div><div class='add'>+	 * cachefiles_ondemand_daemon_read</div><div class='add'>+	 * cachefiles_ondemand_select_req</div><div class='add'>+	 *</div><div class='add'>+	 * Get a read req but its fd is already closed. The daemon can't</div><div class='add'>+	 * issue a cread ioctl with an closed fd, then hung.</div><div class='add'>+	 */</div><div class='add'>+	if (info-&gt;ondemand_id == CACHEFILES_ONDEMAND_ID_CLOSED) {</div><div class='add'>+		spin_unlock(&amp;info-&gt;lock);</div><div class='add'>+		req-&gt;error = -EBADFD;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	cookie = req-&gt;object-&gt;cookie;</div><div class='add'>+	cookie-&gt;object_size = size;</div><div class='add'>+	if (size)</div><div class='add'>+		clear_bit(FSCACHE_COOKIE_NO_DATA_TO_READ, &amp;cookie-&gt;flags);</div><div class='add'>+	else</div><div class='add'>+		set_bit(FSCACHE_COOKIE_NO_DATA_TO_READ, &amp;cookie-&gt;flags);</div><div class='add'>+	trace_cachefiles_ondemand_copen(req-&gt;object, id, size);</div><div class='add'>+</div><div class='add'>+	cachefiles_ondemand_set_object_open(req-&gt;object);</div><div class='add'>+	spin_unlock(&amp;info-&gt;lock);</div><div class='add'>+	wake_up_all(&amp;cache-&gt;daemon_pollwq);</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	spin_lock(&amp;info-&gt;lock);</div><div class='add'>+	/* Need to set object close to avoid reopen status continuing */</div><div class='add'>+	if (info-&gt;ondemand_id == CACHEFILES_ONDEMAND_ID_CLOSED)</div><div class='add'>+		cachefiles_ondemand_set_object_close(req-&gt;object);</div><div class='add'>+	spin_unlock(&amp;info-&gt;lock);</div><div class='add'>+	complete(&amp;req-&gt;done);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int cachefiles_ondemand_restore(struct cachefiles_cache *cache, char *args)</div><div class='add'>+{</div><div class='add'>+	struct cachefiles_req *req;</div><div class='add'>+</div><div class='add'>+	XA_STATE(xas, &amp;cache-&gt;reqs, 0);</div><div class='add'>+</div><div class='add'>+	if (!test_bit(CACHEFILES_ONDEMAND_MODE, &amp;cache-&gt;flags))</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Reset the requests to CACHEFILES_REQ_NEW state, so that the</div><div class='add'>+	 * requests have been processed halfway before the crash of the</div><div class='add'>+	 * user daemon could be reprocessed after the recovery.</div><div class='add'>+	 */</div><div class='add'>+	xas_lock(&amp;xas);</div><div class='add'>+	xas_for_each(&amp;xas, req, ULONG_MAX)</div><div class='add'>+		xas_set_mark(&amp;xas, CACHEFILES_REQ_NEW);</div><div class='add'>+	xas_unlock(&amp;xas);</div><div class='add'>+</div><div class='add'>+	wake_up_all(&amp;cache-&gt;daemon_pollwq);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int cachefiles_ondemand_get_fd(struct cachefiles_req *req,</div><div class='add'>+				      struct ondemand_anon_file *anon_file)</div><div class='add'>+{</div><div class='add'>+	struct cachefiles_object *object;</div><div class='add'>+	struct cachefiles_cache *cache;</div><div class='add'>+	struct cachefiles_open *load;</div><div class='add'>+	u32 object_id;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	object = cachefiles_grab_object(req-&gt;object,</div><div class='add'>+			cachefiles_obj_get_ondemand_fd);</div><div class='add'>+	cache = object-&gt;volume-&gt;cache;</div><div class='add'>+</div><div class='add'>+	ret = xa_alloc_cyclic(&amp;cache-&gt;ondemand_ids, &amp;object_id, NULL,</div><div class='add'>+			      XA_LIMIT(1, INT_MAX),</div><div class='add'>+			      &amp;cache-&gt;ondemand_id_next, GFP_KERNEL);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto err;</div><div class='add'>+</div><div class='add'>+	anon_file-&gt;fd = get_unused_fd_flags(O_WRONLY);</div><div class='add'>+	if (anon_file-&gt;fd &lt; 0) {</div><div class='add'>+		ret = anon_file-&gt;fd;</div><div class='add'>+		goto err_free_id;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	anon_file-&gt;file = anon_inode_getfile_fmode("[cachefiles]",</div><div class='add'>+				&amp;cachefiles_ondemand_fd_fops, object,</div><div class='add'>+				O_WRONLY, FMODE_PWRITE | FMODE_LSEEK);</div><div class='add'>+	if (IS_ERR(anon_file-&gt;file)) {</div><div class='add'>+		ret = PTR_ERR(anon_file-&gt;file);</div><div class='add'>+		goto err_put_fd;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;object-&gt;ondemand-&gt;lock);</div><div class='add'>+	if (object-&gt;ondemand-&gt;ondemand_id &gt; 0) {</div><div class='add'>+		spin_unlock(&amp;object-&gt;ondemand-&gt;lock);</div><div class='add'>+		/* Pair with check in cachefiles_ondemand_fd_release(). */</div><div class='add'>+		anon_file-&gt;file-&gt;private_data = NULL;</div><div class='add'>+		ret = -EEXIST;</div><div class='add'>+		goto err_put_file;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	load = (void *)req-&gt;msg.data;</div><div class='add'>+	load-&gt;fd = anon_file-&gt;fd;</div><div class='add'>+	object-&gt;ondemand-&gt;ondemand_id = object_id;</div><div class='add'>+	spin_unlock(&amp;object-&gt;ondemand-&gt;lock);</div><div class='add'>+</div><div class='add'>+	cachefiles_get_unbind_pincount(cache);</div><div class='add'>+	trace_cachefiles_ondemand_open(object, &amp;req-&gt;msg, load);</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+err_put_file:</div><div class='add'>+	fput(anon_file-&gt;file);</div><div class='add'>+	anon_file-&gt;file = NULL;</div><div class='add'>+err_put_fd:</div><div class='add'>+	put_unused_fd(anon_file-&gt;fd);</div><div class='add'>+	anon_file-&gt;fd = ret;</div><div class='add'>+err_free_id:</div><div class='add'>+	xa_erase(&amp;cache-&gt;ondemand_ids, object_id);</div><div class='add'>+err:</div><div class='add'>+	spin_lock(&amp;object-&gt;ondemand-&gt;lock);</div><div class='add'>+	/* Avoid marking an opened object as closed. */</div><div class='add'>+	if (object-&gt;ondemand-&gt;ondemand_id &lt;= 0)</div><div class='add'>+		cachefiles_ondemand_set_object_close(object);</div><div class='add'>+	spin_unlock(&amp;object-&gt;ondemand-&gt;lock);</div><div class='add'>+	cachefiles_put_object(object, cachefiles_obj_put_ondemand_fd);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void ondemand_object_worker(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct cachefiles_ondemand_info *info =</div><div class='add'>+		container_of(work, struct cachefiles_ondemand_info, ondemand_work);</div><div class='add'>+</div><div class='add'>+	cachefiles_ondemand_init_object(info-&gt;object);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * If there are any inflight or subsequent READ requests on the</div><div class='add'>+ * closed object, reopen it.</div><div class='add'>+ * Skip read requests whose related object is reopening.</div><div class='add'>+ */</div><div class='add'>+static struct cachefiles_req *cachefiles_ondemand_select_req(struct xa_state *xas,</div><div class='add'>+							      unsigned long xa_max)</div><div class='add'>+{</div><div class='add'>+	struct cachefiles_req *req;</div><div class='add'>+	struct cachefiles_object *object;</div><div class='add'>+	struct cachefiles_ondemand_info *info;</div><div class='add'>+</div><div class='add'>+	xas_for_each_marked(xas, req, xa_max, CACHEFILES_REQ_NEW) {</div><div class='add'>+		if (req-&gt;msg.opcode != CACHEFILES_OP_READ)</div><div class='add'>+			return req;</div><div class='add'>+		object = req-&gt;object;</div><div class='add'>+		info = object-&gt;ondemand;</div><div class='add'>+		if (cachefiles_ondemand_object_is_close(object)) {</div><div class='add'>+			cachefiles_ondemand_set_object_reopening(object);</div><div class='add'>+			queue_work(fscache_wq, &amp;info-&gt;ondemand_work);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+		if (cachefiles_ondemand_object_is_reopening(object))</div><div class='add'>+			continue;</div><div class='add'>+		return req;</div><div class='add'>+	}</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool cachefiles_ondemand_finish_req(struct cachefiles_req *req,</div><div class='add'>+						  struct xa_state *xas, int err)</div><div class='add'>+{</div><div class='add'>+	if (unlikely(!xas || !req))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	if (xa_cmpxchg(xas-&gt;xa, xas-&gt;xa_index, req, NULL, 0) != req)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	req-&gt;error = err;</div><div class='add'>+	complete(&amp;req-&gt;done);</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+ssize_t cachefiles_ondemand_daemon_read(struct cachefiles_cache *cache,</div><div class='add'>+					char __user *_buffer, size_t buflen)</div><div class='add'>+{</div><div class='add'>+	struct cachefiles_req *req;</div><div class='add'>+	struct cachefiles_msg *msg;</div><div class='add'>+	size_t n;</div><div class='add'>+	int ret = 0;</div><div class='add'>+	struct ondemand_anon_file anon_file;</div><div class='add'>+	XA_STATE(xas, &amp;cache-&gt;reqs, cache-&gt;req_id_next);</div><div class='add'>+</div><div class='add'>+	xa_lock(&amp;cache-&gt;reqs);</div><div class='add'>+	/*</div><div class='add'>+	 * Cyclically search for a request that has not ever been processed,</div><div class='add'>+	 * to prevent requests from being processed repeatedly, and make</div><div class='add'>+	 * request distribution fair.</div><div class='add'>+	 */</div><div class='add'>+	req = cachefiles_ondemand_select_req(&amp;xas, ULONG_MAX);</div><div class='add'>+	if (!req &amp;&amp; cache-&gt;req_id_next &gt; 0) {</div><div class='add'>+		xas_set(&amp;xas, 0);</div><div class='add'>+		req = cachefiles_ondemand_select_req(&amp;xas, cache-&gt;req_id_next - 1);</div><div class='add'>+	}</div><div class='add'>+	if (!req) {</div><div class='add'>+		xa_unlock(&amp;cache-&gt;reqs);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	msg = &amp;req-&gt;msg;</div><div class='add'>+	n = msg-&gt;len;</div><div class='add'>+</div><div class='add'>+	if (n &gt; buflen) {</div><div class='add'>+		xa_unlock(&amp;cache-&gt;reqs);</div><div class='add'>+		return -EMSGSIZE;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	xas_clear_mark(&amp;xas, CACHEFILES_REQ_NEW);</div><div class='add'>+	cache-&gt;req_id_next = xas.xa_index + 1;</div><div class='add'>+	refcount_inc(&amp;req-&gt;ref);</div><div class='add'>+	cachefiles_grab_object(req-&gt;object, cachefiles_obj_get_read_req);</div><div class='add'>+	xa_unlock(&amp;cache-&gt;reqs);</div><div class='add'>+</div><div class='add'>+	if (msg-&gt;opcode == CACHEFILES_OP_OPEN) {</div><div class='add'>+		ret = cachefiles_ondemand_get_fd(req, &amp;anon_file);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	msg-&gt;msg_id = xas.xa_index;</div><div class='add'>+	msg-&gt;object_id = req-&gt;object-&gt;ondemand-&gt;ondemand_id;</div><div class='add'>+</div><div class='add'>+	if (copy_to_user(_buffer, msg, n) != 0)</div><div class='add'>+		ret = -EFAULT;</div><div class='add'>+</div><div class='add'>+	if (msg-&gt;opcode == CACHEFILES_OP_OPEN) {</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			fput(anon_file.file);</div><div class='add'>+			put_unused_fd(anon_file.fd);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		fd_install(anon_file.fd, anon_file.file);</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='add'>+	cachefiles_put_object(req-&gt;object, cachefiles_obj_put_read_req);</div><div class='add'>+	/* Remove error request and CLOSE request has no reply */</div><div class='add'>+	if (ret || msg-&gt;opcode == CACHEFILES_OP_CLOSE)</div><div class='add'>+		cachefiles_ondemand_finish_req(req, &amp;xas, ret);</div><div class='add'>+	cachefiles_req_put(req);</div><div class='add'>+	return ret ? ret : n;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+typedef int (*init_req_fn)(struct cachefiles_req *req, void *private);</div><div class='add'>+</div><div class='add'>+static int cachefiles_ondemand_send_req(struct cachefiles_object *object,</div><div class='add'>+					enum cachefiles_opcode opcode,</div><div class='add'>+					size_t data_len,</div><div class='add'>+					init_req_fn init_req,</div><div class='add'>+					void *private)</div><div class='add'>+{</div><div class='add'>+	struct cachefiles_cache *cache = object-&gt;volume-&gt;cache;</div><div class='add'>+	struct cachefiles_req *req = NULL;</div><div class='add'>+	XA_STATE(xas, &amp;cache-&gt;reqs, 0);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (!test_bit(CACHEFILES_ONDEMAND_MODE, &amp;cache-&gt;flags))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if (test_bit(CACHEFILES_DEAD, &amp;cache-&gt;flags)) {</div><div class='add'>+		ret = -EIO;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	req = kzalloc(sizeof(*req) + data_len, GFP_KERNEL);</div><div class='add'>+	if (!req) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	refcount_set(&amp;req-&gt;ref, 1);</div><div class='add'>+	req-&gt;object = object;</div><div class='add'>+	init_completion(&amp;req-&gt;done);</div><div class='add'>+	req-&gt;msg.opcode = opcode;</div><div class='add'>+	req-&gt;msg.len = sizeof(struct cachefiles_msg) + data_len;</div><div class='add'>+</div><div class='add'>+	ret = init_req(req, private);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		/*</div><div class='add'>+		 * Stop enqueuing the request when daemon is dying. The</div><div class='add'>+		 * following two operations need to be atomic as a whole.</div><div class='add'>+		 *   1) check cache state, and</div><div class='add'>+		 *   2) enqueue request if cache is alive.</div><div class='add'>+		 * Otherwise the request may be enqueued after xarray has been</div><div class='add'>+		 * flushed, leaving the orphan request never being completed.</div><div class='add'>+		 *</div><div class='add'>+		 * CPU 1			CPU 2</div><div class='add'>+		 * =====			=====</div><div class='add'>+		 *				test CACHEFILES_DEAD bit</div><div class='add'>+		 * set CACHEFILES_DEAD bit</div><div class='add'>+		 * flush requests in the xarray</div><div class='add'>+		 *				enqueue the request</div><div class='add'>+		 */</div><div class='add'>+		xas_lock(&amp;xas);</div><div class='add'>+</div><div class='add'>+		if (test_bit(CACHEFILES_DEAD, &amp;cache-&gt;flags) ||</div><div class='add'>+		    cachefiles_ondemand_object_is_dropping(object)) {</div><div class='add'>+			xas_unlock(&amp;xas);</div><div class='add'>+			ret = -EIO;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* coupled with the barrier in cachefiles_flush_reqs() */</div><div class='add'>+		smp_mb();</div><div class='add'>+</div><div class='add'>+		if (opcode == CACHEFILES_OP_CLOSE &amp;&amp;</div><div class='add'>+		    !cachefiles_ondemand_object_is_open(object)) {</div><div class='add'>+			WARN_ON_ONCE(object-&gt;ondemand-&gt;ondemand_id == 0);</div><div class='add'>+			xas_unlock(&amp;xas);</div><div class='add'>+			ret = -EIO;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Cyclically find a free xas to avoid msg_id reuse that would</div><div class='add'>+		 * cause the daemon to successfully copen a stale msg_id.</div><div class='add'>+		 */</div><div class='add'>+		xas.xa_index = cache-&gt;msg_id_next;</div><div class='add'>+		xas_find_marked(&amp;xas, UINT_MAX, XA_FREE_MARK);</div><div class='add'>+		if (xas.xa_node == XAS_RESTART) {</div><div class='add'>+			xas.xa_index = 0;</div><div class='add'>+			xas_find_marked(&amp;xas, cache-&gt;msg_id_next - 1, XA_FREE_MARK);</div><div class='add'>+		}</div><div class='add'>+		if (xas.xa_node == XAS_RESTART)</div><div class='add'>+			xas_set_err(&amp;xas, -EBUSY);</div><div class='add'>+</div><div class='add'>+		xas_store(&amp;xas, req);</div><div class='add'>+		if (xas_valid(&amp;xas)) {</div><div class='add'>+			cache-&gt;msg_id_next = xas.xa_index + 1;</div><div class='add'>+			xas_clear_mark(&amp;xas, XA_FREE_MARK);</div><div class='add'>+			xas_set_mark(&amp;xas, CACHEFILES_REQ_NEW);</div><div class='add'>+		}</div><div class='add'>+		xas_unlock(&amp;xas);</div><div class='add'>+	} while (xas_nomem(&amp;xas, GFP_KERNEL));</div><div class='add'>+</div><div class='add'>+	ret = xas_error(&amp;xas);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	wake_up_all(&amp;cache-&gt;daemon_pollwq);</div><div class='add'>+wait:</div><div class='add'>+	ret = wait_for_completion_killable(&amp;req-&gt;done);</div><div class='add'>+	if (!ret) {</div><div class='add'>+		ret = req-&gt;error;</div><div class='add'>+	} else {</div><div class='add'>+		ret = -EINTR;</div><div class='add'>+		if (!cachefiles_ondemand_finish_req(req, &amp;xas, ret)) {</div><div class='add'>+			/* Someone will complete it soon. */</div><div class='add'>+			cpu_relax();</div><div class='add'>+			goto wait;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	cachefiles_req_put(req);</div><div class='add'>+	return ret;</div><div class='add'>+out:</div><div class='add'>+	/* Reset the object to close state in error handling path.</div><div class='add'>+	 * If error occurs after creating the anonymous fd,</div><div class='add'>+	 * cachefiles_ondemand_fd_release() will set object to close.</div><div class='add'>+	 */</div><div class='add'>+	if (opcode == CACHEFILES_OP_OPEN &amp;&amp;</div><div class='add'>+	    !cachefiles_ondemand_object_is_dropping(object))</div><div class='add'>+		cachefiles_ondemand_set_object_close(object);</div><div class='add'>+	kfree(req);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int cachefiles_ondemand_init_open_req(struct cachefiles_req *req,</div><div class='add'>+					     void *private)</div><div class='add'>+{</div><div class='add'>+	struct cachefiles_object *object = req-&gt;object;</div><div class='add'>+	struct fscache_cookie *cookie = object-&gt;cookie;</div><div class='add'>+	struct fscache_volume *volume = object-&gt;volume-&gt;vcookie;</div><div class='add'>+	struct cachefiles_open *load = (void *)req-&gt;msg.data;</div><div class='add'>+	size_t volume_key_size, cookie_key_size;</div><div class='add'>+	void *volume_key, *cookie_key;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Volume key is a NUL-terminated string. key[0] stores strlen() of the</div><div class='add'>+	 * string, followed by the content of the string (excluding '\0').</div><div class='add'>+	 */</div><div class='add'>+	volume_key_size = volume-&gt;key[0] + 1;</div><div class='add'>+	volume_key = volume-&gt;key + 1;</div><div class='add'>+</div><div class='add'>+	/* Cookie key is binary data, which is netfs specific. */</div><div class='add'>+	cookie_key_size = cookie-&gt;key_len;</div><div class='add'>+	cookie_key = fscache_get_key(cookie);</div><div class='add'>+</div><div class='add'>+	if (!(object-&gt;cookie-&gt;advice &amp; FSCACHE_ADV_WANT_CACHE_SIZE)) {</div><div class='add'>+		pr_err("WANT_CACHE_SIZE is needed for on-demand mode\n");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	load-&gt;volume_key_size = volume_key_size;</div><div class='add'>+	load-&gt;cookie_key_size = cookie_key_size;</div><div class='add'>+	memcpy(load-&gt;data, volume_key, volume_key_size);</div><div class='add'>+	memcpy(load-&gt;data + volume_key_size, cookie_key, cookie_key_size);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int cachefiles_ondemand_init_close_req(struct cachefiles_req *req,</div><div class='add'>+					      void *private)</div><div class='add'>+{</div><div class='add'>+	struct cachefiles_object *object = req-&gt;object;</div><div class='add'>+</div><div class='add'>+	if (!cachefiles_ondemand_object_is_open(object))</div><div class='add'>+		return -ENOENT;</div><div class='add'>+</div><div class='add'>+	trace_cachefiles_ondemand_close(object, &amp;req-&gt;msg);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct cachefiles_read_ctx {</div><div class='add'>+	loff_t off;</div><div class='add'>+	size_t len;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int cachefiles_ondemand_init_read_req(struct cachefiles_req *req,</div><div class='add'>+					     void *private)</div><div class='add'>+{</div><div class='add'>+	struct cachefiles_object *object = req-&gt;object;</div><div class='add'>+	struct cachefiles_read *load = (void *)req-&gt;msg.data;</div><div class='add'>+	struct cachefiles_read_ctx *read_ctx = private;</div><div class='add'>+</div><div class='add'>+	load-&gt;off = read_ctx-&gt;off;</div><div class='add'>+	load-&gt;len = read_ctx-&gt;len;</div><div class='add'>+	trace_cachefiles_ondemand_read(object, &amp;req-&gt;msg, load);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int cachefiles_ondemand_init_object(struct cachefiles_object *object)</div><div class='add'>+{</div><div class='add'>+	struct fscache_cookie *cookie = object-&gt;cookie;</div><div class='add'>+	struct fscache_volume *volume = object-&gt;volume-&gt;vcookie;</div><div class='add'>+	size_t volume_key_size, cookie_key_size, data_len;</div><div class='add'>+</div><div class='add'>+	if (!object-&gt;ondemand)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * CacheFiles will firstly check the cache file under the root cache</div><div class='add'>+	 * directory. If the coherency check failed, it will fallback to</div><div class='add'>+	 * creating a new tmpfile as the cache file. Reuse the previously</div><div class='add'>+	 * allocated object ID if any.</div><div class='add'>+	 */</div><div class='add'>+	if (cachefiles_ondemand_object_is_open(object))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	volume_key_size = volume-&gt;key[0] + 1;</div><div class='add'>+	cookie_key_size = cookie-&gt;key_len;</div><div class='add'>+	data_len = sizeof(struct cachefiles_open) +</div><div class='add'>+		   volume_key_size + cookie_key_size;</div><div class='add'>+</div><div class='add'>+	return cachefiles_ondemand_send_req(object, CACHEFILES_OP_OPEN,</div><div class='add'>+			data_len, cachefiles_ondemand_init_open_req, NULL);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void cachefiles_ondemand_clean_object(struct cachefiles_object *object)</div><div class='add'>+{</div><div class='add'>+	unsigned long index;</div><div class='add'>+	struct cachefiles_req *req;</div><div class='add'>+	struct cachefiles_cache *cache;</div><div class='add'>+</div><div class='add'>+	if (!object-&gt;ondemand)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	cachefiles_ondemand_send_req(object, CACHEFILES_OP_CLOSE, 0,</div><div class='add'>+			cachefiles_ondemand_init_close_req, NULL);</div><div class='add'>+</div><div class='add'>+	if (!object-&gt;ondemand-&gt;ondemand_id)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/* Cancel all requests for the object that is being dropped. */</div><div class='add'>+	cache = object-&gt;volume-&gt;cache;</div><div class='add'>+	xa_lock(&amp;cache-&gt;reqs);</div><div class='add'>+	cachefiles_ondemand_set_object_dropping(object);</div><div class='add'>+	xa_for_each(&amp;cache-&gt;reqs, index, req) {</div><div class='add'>+		if (req-&gt;object == object) {</div><div class='add'>+			req-&gt;error = -EIO;</div><div class='add'>+			complete(&amp;req-&gt;done);</div><div class='add'>+			__xa_erase(&amp;cache-&gt;reqs, index);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	xa_unlock(&amp;cache-&gt;reqs);</div><div class='add'>+</div><div class='add'>+	/* Wait for ondemand_object_worker() to finish to avoid UAF. */</div><div class='add'>+	cancel_work_sync(&amp;object-&gt;ondemand-&gt;ondemand_work);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int cachefiles_ondemand_init_obj_info(struct cachefiles_object *object,</div><div class='add'>+				struct cachefiles_volume *volume)</div><div class='add'>+{</div><div class='add'>+	if (!cachefiles_in_ondemand_mode(volume-&gt;cache))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	object-&gt;ondemand = kzalloc(sizeof(struct cachefiles_ondemand_info),</div><div class='add'>+					GFP_KERNEL);</div><div class='add'>+	if (!object-&gt;ondemand)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	object-&gt;ondemand-&gt;object = object;</div><div class='add'>+	spin_lock_init(&amp;object-&gt;ondemand-&gt;lock);</div><div class='add'>+	INIT_WORK(&amp;object-&gt;ondemand-&gt;ondemand_work, ondemand_object_worker);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void cachefiles_ondemand_deinit_obj_info(struct cachefiles_object *object)</div><div class='add'>+{</div><div class='add'>+	kfree(object-&gt;ondemand);</div><div class='add'>+	object-&gt;ondemand = NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int cachefiles_ondemand_read(struct cachefiles_object *object,</div><div class='add'>+			     loff_t pos, size_t len)</div><div class='add'>+{</div><div class='add'>+	struct cachefiles_read_ctx read_ctx = {pos, len};</div><div class='add'>+</div><div class='add'>+	return cachefiles_ondemand_send_req(object, CACHEFILES_OP_READ,</div><div class='add'>+			sizeof(struct cachefiles_read),</div><div class='add'>+			cachefiles_ondemand_init_read_req, &amp;read_ctx);</div><div class='add'>+}</div><div class='head'>diff --git a/fs/cachefiles/rdwr.c b/fs/cachefiles/rdwr.c<br/>deleted file mode 100644<br/>index fcf4f3b72923..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cachefiles/rdwr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/rdwr.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,972 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='del'>-/* Storage object read/write</div><div class='del'>- *</div><div class='del'>- * Copyright (C) 2007 Red Hat, Inc. All Rights Reserved.</div><div class='del'>- * Written by David Howells (dhowells@redhat.com)</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#include &lt;linux/mount.h&gt;</div><div class='del'>-#include &lt;linux/slab.h&gt;</div><div class='del'>-#include &lt;linux/file.h&gt;</div><div class='del'>-#include &lt;linux/swap.h&gt;</div><div class='del'>-#include "internal.h"</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * detect wake up events generated by the unlocking of pages in which we're</div><div class='del'>- * interested</div><div class='del'>- * - we use this to detect read completion of backing pages</div><div class='del'>- * - the caller holds the waitqueue lock</div><div class='del'>- */</div><div class='del'>-static int cachefiles_read_waiter(wait_queue_entry_t *wait, unsigned mode,</div><div class='del'>-				  int sync, void *_key)</div><div class='del'>-{</div><div class='del'>-	struct cachefiles_one_read *monitor =</div><div class='del'>-		container_of(wait, struct cachefiles_one_read, monitor);</div><div class='del'>-	struct cachefiles_object *object;</div><div class='del'>-	struct fscache_retrieval *op = monitor-&gt;op;</div><div class='del'>-	struct wait_page_key *key = _key;</div><div class='del'>-	struct folio *folio = wait-&gt;private;</div><div class='del'>-</div><div class='del'>-	ASSERT(key);</div><div class='del'>-</div><div class='del'>-	_enter("{%lu},%u,%d,{%p,%u}",</div><div class='del'>-	       monitor-&gt;netfs_page-&gt;index, mode, sync,</div><div class='del'>-	       key-&gt;folio, key-&gt;bit_nr);</div><div class='del'>-</div><div class='del'>-	if (key-&gt;folio != folio || key-&gt;bit_nr != PG_locked)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	_debug("--- monitor %p %lx ---", folio, folio-&gt;flags);</div><div class='del'>-</div><div class='del'>-	if (!folio_test_uptodate(folio) &amp;&amp; !folio_test_error(folio)) {</div><div class='del'>-		/* unlocked, not uptodate and not erronous? */</div><div class='del'>-		_debug("page probably truncated");</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* remove from the waitqueue */</div><div class='del'>-	list_del(&amp;wait-&gt;entry);</div><div class='del'>-</div><div class='del'>-	/* move onto the action list and queue for FS-Cache thread pool */</div><div class='del'>-	ASSERT(op);</div><div class='del'>-</div><div class='del'>-	/* We need to temporarily bump the usage count as we don't own a ref</div><div class='del'>-	 * here otherwise cachefiles_read_copier() may free the op between the</div><div class='del'>-	 * monitor being enqueued on the op-&gt;to_do list and the op getting</div><div class='del'>-	 * enqueued on the work queue.</div><div class='del'>-	 */</div><div class='del'>-	fscache_get_retrieval(op);</div><div class='del'>-</div><div class='del'>-	object = container_of(op-&gt;op.object, struct cachefiles_object, fscache);</div><div class='del'>-	spin_lock(&amp;object-&gt;work_lock);</div><div class='del'>-	list_add_tail(&amp;monitor-&gt;op_link, &amp;op-&gt;to_do);</div><div class='del'>-	fscache_enqueue_retrieval(op);</div><div class='del'>-	spin_unlock(&amp;object-&gt;work_lock);</div><div class='del'>-</div><div class='del'>-	fscache_put_retrieval(op);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * handle a probably truncated page</div><div class='del'>- * - check to see if the page is still relevant and reissue the read if</div><div class='del'>- *   possible</div><div class='del'>- * - return -EIO on error, -ENODATA if the page is gone, -EINPROGRESS if we</div><div class='del'>- *   must wait again and 0 if successful</div><div class='del'>- */</div><div class='del'>-static int cachefiles_read_reissue(struct cachefiles_object *object,</div><div class='del'>-				   struct cachefiles_one_read *monitor)</div><div class='del'>-{</div><div class='del'>-	struct address_space *bmapping = d_backing_inode(object-&gt;backer)-&gt;i_mapping;</div><div class='del'>-	struct page *backpage = monitor-&gt;back_page, *backpage2;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	_enter("{ino=%lx},{%lx,%lx}",</div><div class='del'>-	       d_backing_inode(object-&gt;backer)-&gt;i_ino,</div><div class='del'>-	       backpage-&gt;index, backpage-&gt;flags);</div><div class='del'>-</div><div class='del'>-	/* skip if the page was truncated away completely */</div><div class='del'>-	if (backpage-&gt;mapping != bmapping) {</div><div class='del'>-		_leave(" = -ENODATA [mapping]");</div><div class='del'>-		return -ENODATA;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	backpage2 = find_get_page(bmapping, backpage-&gt;index);</div><div class='del'>-	if (!backpage2) {</div><div class='del'>-		_leave(" = -ENODATA [gone]");</div><div class='del'>-		return -ENODATA;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (backpage != backpage2) {</div><div class='del'>-		put_page(backpage2);</div><div class='del'>-		_leave(" = -ENODATA [different]");</div><div class='del'>-		return -ENODATA;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* the page is still there and we already have a ref on it, so we don't</div><div class='del'>-	 * need a second */</div><div class='del'>-	put_page(backpage2);</div><div class='del'>-</div><div class='del'>-	INIT_LIST_HEAD(&amp;monitor-&gt;op_link);</div><div class='del'>-	folio_add_wait_queue(page_folio(backpage), &amp;monitor-&gt;monitor);</div><div class='del'>-</div><div class='del'>-	if (trylock_page(backpage)) {</div><div class='del'>-		ret = -EIO;</div><div class='del'>-		if (PageError(backpage))</div><div class='del'>-			goto unlock_discard;</div><div class='del'>-		ret = 0;</div><div class='del'>-		if (PageUptodate(backpage))</div><div class='del'>-			goto unlock_discard;</div><div class='del'>-</div><div class='del'>-		_debug("reissue read");</div><div class='del'>-		ret = bmapping-&gt;a_ops-&gt;readpage(NULL, backpage);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			goto discard;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* but the page may have been read before the monitor was installed, so</div><div class='del'>-	 * the monitor may miss the event - so we have to ensure that we do get</div><div class='del'>-	 * one in such a case */</div><div class='del'>-	if (trylock_page(backpage)) {</div><div class='del'>-		_debug("jumpstart %p {%lx}", backpage, backpage-&gt;flags);</div><div class='del'>-		unlock_page(backpage);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* it'll reappear on the todo list */</div><div class='del'>-	_leave(" = -EINPROGRESS");</div><div class='del'>-	return -EINPROGRESS;</div><div class='del'>-</div><div class='del'>-unlock_discard:</div><div class='del'>-	unlock_page(backpage);</div><div class='del'>-discard:</div><div class='del'>-	spin_lock_irq(&amp;object-&gt;work_lock);</div><div class='del'>-	list_del(&amp;monitor-&gt;op_link);</div><div class='del'>-	spin_unlock_irq(&amp;object-&gt;work_lock);</div><div class='del'>-	_leave(" = %d", ret);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * copy data from backing pages to netfs pages to complete a read operation</div><div class='del'>- * - driven by FS-Cache's thread pool</div><div class='del'>- */</div><div class='del'>-static void cachefiles_read_copier(struct fscache_operation *_op)</div><div class='del'>-{</div><div class='del'>-	struct cachefiles_one_read *monitor;</div><div class='del'>-	struct cachefiles_object *object;</div><div class='del'>-	struct fscache_retrieval *op;</div><div class='del'>-	int error, max;</div><div class='del'>-</div><div class='del'>-	op = container_of(_op, struct fscache_retrieval, op);</div><div class='del'>-	object = container_of(op-&gt;op.object,</div><div class='del'>-			      struct cachefiles_object, fscache);</div><div class='del'>-</div><div class='del'>-	_enter("{ino=%lu}", d_backing_inode(object-&gt;backer)-&gt;i_ino);</div><div class='del'>-</div><div class='del'>-	max = 8;</div><div class='del'>-	spin_lock_irq(&amp;object-&gt;work_lock);</div><div class='del'>-</div><div class='del'>-	while (!list_empty(&amp;op-&gt;to_do)) {</div><div class='del'>-		monitor = list_entry(op-&gt;to_do.next,</div><div class='del'>-				     struct cachefiles_one_read, op_link);</div><div class='del'>-		list_del(&amp;monitor-&gt;op_link);</div><div class='del'>-</div><div class='del'>-		spin_unlock_irq(&amp;object-&gt;work_lock);</div><div class='del'>-</div><div class='del'>-		_debug("- copy {%lu}", monitor-&gt;back_page-&gt;index);</div><div class='del'>-</div><div class='del'>-	recheck:</div><div class='del'>-		if (test_bit(FSCACHE_COOKIE_INVALIDATING,</div><div class='del'>-			     &amp;object-&gt;fscache.cookie-&gt;flags)) {</div><div class='del'>-			error = -ESTALE;</div><div class='del'>-		} else if (PageUptodate(monitor-&gt;back_page)) {</div><div class='del'>-			copy_highpage(monitor-&gt;netfs_page, monitor-&gt;back_page);</div><div class='del'>-			fscache_mark_page_cached(monitor-&gt;op,</div><div class='del'>-						 monitor-&gt;netfs_page);</div><div class='del'>-			error = 0;</div><div class='del'>-		} else if (!PageError(monitor-&gt;back_page)) {</div><div class='del'>-			/* the page has probably been truncated */</div><div class='del'>-			error = cachefiles_read_reissue(object, monitor);</div><div class='del'>-			if (error == -EINPROGRESS)</div><div class='del'>-				goto next;</div><div class='del'>-			goto recheck;</div><div class='del'>-		} else {</div><div class='del'>-			cachefiles_io_error_obj(</div><div class='del'>-				object,</div><div class='del'>-				"Readpage failed on backing file %lx",</div><div class='del'>-				(unsigned long) monitor-&gt;back_page-&gt;flags);</div><div class='del'>-			error = -EIO;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		put_page(monitor-&gt;back_page);</div><div class='del'>-</div><div class='del'>-		fscache_end_io(op, monitor-&gt;netfs_page, error);</div><div class='del'>-		put_page(monitor-&gt;netfs_page);</div><div class='del'>-		fscache_retrieval_complete(op, 1);</div><div class='del'>-		fscache_put_retrieval(op);</div><div class='del'>-		kfree(monitor);</div><div class='del'>-</div><div class='del'>-	next:</div><div class='del'>-		/* let the thread pool have some air occasionally */</div><div class='del'>-		max--;</div><div class='del'>-		if (max &lt; 0 || need_resched()) {</div><div class='del'>-			if (!list_empty(&amp;op-&gt;to_do))</div><div class='del'>-				fscache_enqueue_retrieval(op);</div><div class='del'>-			_leave(" [maxed out]");</div><div class='del'>-			return;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		spin_lock_irq(&amp;object-&gt;work_lock);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_unlock_irq(&amp;object-&gt;work_lock);</div><div class='del'>-	_leave("");</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * read the corresponding page to the given set from the backing file</div><div class='del'>- * - an uncertain page is simply discarded, to be tried again another time</div><div class='del'>- */</div><div class='del'>-static int cachefiles_read_backing_file_one(struct cachefiles_object *object,</div><div class='del'>-					    struct fscache_retrieval *op,</div><div class='del'>-					    struct page *netpage)</div><div class='del'>-{</div><div class='del'>-	struct cachefiles_one_read *monitor;</div><div class='del'>-	struct address_space *bmapping;</div><div class='del'>-	struct page *newpage, *backpage;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	_enter("");</div><div class='del'>-</div><div class='del'>-	_debug("read back %p{%lu,%d}",</div><div class='del'>-	       netpage, netpage-&gt;index, page_count(netpage));</div><div class='del'>-</div><div class='del'>-	monitor = kzalloc(sizeof(*monitor), cachefiles_gfp);</div><div class='del'>-	if (!monitor)</div><div class='del'>-		goto nomem;</div><div class='del'>-</div><div class='del'>-	monitor-&gt;netfs_page = netpage;</div><div class='del'>-	monitor-&gt;op = fscache_get_retrieval(op);</div><div class='del'>-</div><div class='del'>-	init_waitqueue_func_entry(&amp;monitor-&gt;monitor, cachefiles_read_waiter);</div><div class='del'>-</div><div class='del'>-	/* attempt to get hold of the backing page */</div><div class='del'>-	bmapping = d_backing_inode(object-&gt;backer)-&gt;i_mapping;</div><div class='del'>-	newpage = NULL;</div><div class='del'>-</div><div class='del'>-	for (;;) {</div><div class='del'>-		backpage = find_get_page(bmapping, netpage-&gt;index);</div><div class='del'>-		if (backpage)</div><div class='del'>-			goto backing_page_already_present;</div><div class='del'>-</div><div class='del'>-		if (!newpage) {</div><div class='del'>-			newpage = __page_cache_alloc(cachefiles_gfp);</div><div class='del'>-			if (!newpage)</div><div class='del'>-				goto nomem_monitor;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		ret = add_to_page_cache_lru(newpage, bmapping,</div><div class='del'>-					    netpage-&gt;index, cachefiles_gfp);</div><div class='del'>-		if (ret == 0)</div><div class='del'>-			goto installed_new_backing_page;</div><div class='del'>-		if (ret != -EEXIST)</div><div class='del'>-			goto nomem_page;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* we've installed a new backing page, so now we need to start</div><div class='del'>-	 * it reading */</div><div class='del'>-installed_new_backing_page:</div><div class='del'>-	_debug("- new %p", newpage);</div><div class='del'>-</div><div class='del'>-	backpage = newpage;</div><div class='del'>-	newpage = NULL;</div><div class='del'>-</div><div class='del'>-read_backing_page:</div><div class='del'>-	ret = bmapping-&gt;a_ops-&gt;readpage(NULL, backpage);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto read_error;</div><div class='del'>-</div><div class='del'>-	/* set the monitor to transfer the data across */</div><div class='del'>-monitor_backing_page:</div><div class='del'>-	_debug("- monitor add");</div><div class='del'>-</div><div class='del'>-	/* install the monitor */</div><div class='del'>-	get_page(monitor-&gt;netfs_page);</div><div class='del'>-	get_page(backpage);</div><div class='del'>-	monitor-&gt;back_page = backpage;</div><div class='del'>-	monitor-&gt;monitor.private = backpage;</div><div class='del'>-	folio_add_wait_queue(page_folio(backpage), &amp;monitor-&gt;monitor);</div><div class='del'>-	monitor = NULL;</div><div class='del'>-</div><div class='del'>-	/* but the page may have been read before the monitor was installed, so</div><div class='del'>-	 * the monitor may miss the event - so we have to ensure that we do get</div><div class='del'>-	 * one in such a case */</div><div class='del'>-	if (trylock_page(backpage)) {</div><div class='del'>-		_debug("jumpstart %p {%lx}", backpage, backpage-&gt;flags);</div><div class='del'>-		unlock_page(backpage);</div><div class='del'>-	}</div><div class='del'>-	goto success;</div><div class='del'>-</div><div class='del'>-	/* if the backing page is already present, it can be in one of</div><div class='del'>-	 * three states: read in progress, read failed or read okay */</div><div class='del'>-backing_page_already_present:</div><div class='del'>-	_debug("- present");</div><div class='del'>-</div><div class='del'>-	if (newpage) {</div><div class='del'>-		put_page(newpage);</div><div class='del'>-		newpage = NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (PageError(backpage))</div><div class='del'>-		goto io_error;</div><div class='del'>-</div><div class='del'>-	if (PageUptodate(backpage))</div><div class='del'>-		goto backing_page_already_uptodate;</div><div class='del'>-</div><div class='del'>-	if (!trylock_page(backpage))</div><div class='del'>-		goto monitor_backing_page;</div><div class='del'>-	_debug("read %p {%lx}", backpage, backpage-&gt;flags);</div><div class='del'>-	goto read_backing_page;</div><div class='del'>-</div><div class='del'>-	/* the backing page is already up to date, attach the netfs</div><div class='del'>-	 * page to the pagecache and LRU and copy the data across */</div><div class='del'>-backing_page_already_uptodate:</div><div class='del'>-	_debug("- uptodate");</div><div class='del'>-</div><div class='del'>-	fscache_mark_page_cached(op, netpage);</div><div class='del'>-</div><div class='del'>-	copy_highpage(netpage, backpage);</div><div class='del'>-	fscache_end_io(op, netpage, 0);</div><div class='del'>-	fscache_retrieval_complete(op, 1);</div><div class='del'>-</div><div class='del'>-success:</div><div class='del'>-	_debug("success");</div><div class='del'>-	ret = 0;</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	if (backpage)</div><div class='del'>-		put_page(backpage);</div><div class='del'>-	if (monitor) {</div><div class='del'>-		fscache_put_retrieval(monitor-&gt;op);</div><div class='del'>-		kfree(monitor);</div><div class='del'>-	}</div><div class='del'>-	_leave(" = %d", ret);</div><div class='del'>-	return ret;</div><div class='del'>-</div><div class='del'>-read_error:</div><div class='del'>-	_debug("read error %d", ret);</div><div class='del'>-	if (ret == -ENOMEM) {</div><div class='del'>-		fscache_retrieval_complete(op, 1);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-io_error:</div><div class='del'>-	cachefiles_io_error_obj(object, "Page read error on backing file");</div><div class='del'>-	fscache_retrieval_complete(op, 1);</div><div class='del'>-	ret = -ENOBUFS;</div><div class='del'>-	goto out;</div><div class='del'>-</div><div class='del'>-nomem_page:</div><div class='del'>-	put_page(newpage);</div><div class='del'>-nomem_monitor:</div><div class='del'>-	fscache_put_retrieval(monitor-&gt;op);</div><div class='del'>-	kfree(monitor);</div><div class='del'>-nomem:</div><div class='del'>-	fscache_retrieval_complete(op, 1);</div><div class='del'>-	_leave(" = -ENOMEM");</div><div class='del'>-	return -ENOMEM;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * read a page from the cache or allocate a block in which to store it</div><div class='del'>- * - cache withdrawal is prevented by the caller</div><div class='del'>- * - returns -EINTR if interrupted</div><div class='del'>- * - returns -ENOMEM if ran out of memory</div><div class='del'>- * - returns -ENOBUFS if no buffers can be made available</div><div class='del'>- * - returns -ENOBUFS if page is beyond EOF</div><div class='del'>- * - if the page is backed by a block in the cache:</div><div class='del'>- *   - a read will be started which will call the callback on completion</div><div class='del'>- *   - 0 will be returned</div><div class='del'>- * - else if the page is unbacked:</div><div class='del'>- *   - the metadata will be retained</div><div class='del'>- *   - -ENODATA will be returned</div><div class='del'>- */</div><div class='del'>-int cachefiles_read_or_alloc_page(struct fscache_retrieval *op,</div><div class='del'>-				  struct page *page,</div><div class='del'>-				  gfp_t gfp)</div><div class='del'>-{</div><div class='del'>-	struct cachefiles_object *object;</div><div class='del'>-	struct cachefiles_cache *cache;</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	sector_t block;</div><div class='del'>-	unsigned shift;</div><div class='del'>-	int ret, ret2;</div><div class='del'>-</div><div class='del'>-	object = container_of(op-&gt;op.object,</div><div class='del'>-			      struct cachefiles_object, fscache);</div><div class='del'>-	cache = container_of(object-&gt;fscache.cache,</div><div class='del'>-			     struct cachefiles_cache, cache);</div><div class='del'>-</div><div class='del'>-	_enter("{%p},{%lx},,,", object, page-&gt;index);</div><div class='del'>-</div><div class='del'>-	if (!object-&gt;backer)</div><div class='del'>-		goto enobufs;</div><div class='del'>-</div><div class='del'>-	inode = d_backing_inode(object-&gt;backer);</div><div class='del'>-	ASSERT(S_ISREG(inode-&gt;i_mode));</div><div class='del'>-</div><div class='del'>-	/* calculate the shift required to use bmap */</div><div class='del'>-	shift = PAGE_SHIFT - inode-&gt;i_sb-&gt;s_blocksize_bits;</div><div class='del'>-</div><div class='del'>-	op-&gt;op.flags &amp;= FSCACHE_OP_KEEP_FLAGS;</div><div class='del'>-	op-&gt;op.flags |= FSCACHE_OP_ASYNC;</div><div class='del'>-	op-&gt;op.processor = cachefiles_read_copier;</div><div class='del'>-</div><div class='del'>-	/* we assume the absence or presence of the first block is a good</div><div class='del'>-	 * enough indication for the page as a whole</div><div class='del'>-	 * - TODO: don't use bmap() for this as it is _not_ actually good</div><div class='del'>-	 *   enough for this as it doesn't indicate errors, but it's all we've</div><div class='del'>-	 *   got for the moment</div><div class='del'>-	 */</div><div class='del'>-	block = page-&gt;index;</div><div class='del'>-	block &lt;&lt;= shift;</div><div class='del'>-</div><div class='del'>-	ret2 = bmap(inode, &amp;block);</div><div class='del'>-	ASSERT(ret2 == 0);</div><div class='del'>-</div><div class='del'>-	_debug("%llx -&gt; %llx",</div><div class='del'>-	       (unsigned long long) (page-&gt;index &lt;&lt; shift),</div><div class='del'>-	       (unsigned long long) block);</div><div class='del'>-</div><div class='del'>-	if (block) {</div><div class='del'>-		/* submit the apparently valid page to the backing fs to be</div><div class='del'>-		 * read from disk */</div><div class='del'>-		ret = cachefiles_read_backing_file_one(object, op, page);</div><div class='del'>-	} else if (cachefiles_has_space(cache, 0, 1) == 0) {</div><div class='del'>-		/* there's space in the cache we can use */</div><div class='del'>-		fscache_mark_page_cached(op, page);</div><div class='del'>-		fscache_retrieval_complete(op, 1);</div><div class='del'>-		ret = -ENODATA;</div><div class='del'>-	} else {</div><div class='del'>-		goto enobufs;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	_leave(" = %d", ret);</div><div class='del'>-	return ret;</div><div class='del'>-</div><div class='del'>-enobufs:</div><div class='del'>-	fscache_retrieval_complete(op, 1);</div><div class='del'>-	_leave(" = -ENOBUFS");</div><div class='del'>-	return -ENOBUFS;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * read the corresponding pages to the given set from the backing file</div><div class='del'>- * - any uncertain pages are simply discarded, to be tried again another time</div><div class='del'>- */</div><div class='del'>-static int cachefiles_read_backing_file(struct cachefiles_object *object,</div><div class='del'>-					struct fscache_retrieval *op,</div><div class='del'>-					struct list_head *list)</div><div class='del'>-{</div><div class='del'>-	struct cachefiles_one_read *monitor = NULL;</div><div class='del'>-	struct address_space *bmapping = d_backing_inode(object-&gt;backer)-&gt;i_mapping;</div><div class='del'>-	struct page *newpage = NULL, *netpage, *_n, *backpage = NULL;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	_enter("");</div><div class='del'>-</div><div class='del'>-	list_for_each_entry_safe(netpage, _n, list, lru) {</div><div class='del'>-		list_del(&amp;netpage-&gt;lru);</div><div class='del'>-</div><div class='del'>-		_debug("read back %p{%lu,%d}",</div><div class='del'>-		       netpage, netpage-&gt;index, page_count(netpage));</div><div class='del'>-</div><div class='del'>-		if (!monitor) {</div><div class='del'>-			monitor = kzalloc(sizeof(*monitor), cachefiles_gfp);</div><div class='del'>-			if (!monitor)</div><div class='del'>-				goto nomem;</div><div class='del'>-</div><div class='del'>-			monitor-&gt;op = fscache_get_retrieval(op);</div><div class='del'>-			init_waitqueue_func_entry(&amp;monitor-&gt;monitor,</div><div class='del'>-						  cachefiles_read_waiter);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		for (;;) {</div><div class='del'>-			backpage = find_get_page(bmapping, netpage-&gt;index);</div><div class='del'>-			if (backpage)</div><div class='del'>-				goto backing_page_already_present;</div><div class='del'>-</div><div class='del'>-			if (!newpage) {</div><div class='del'>-				newpage = __page_cache_alloc(cachefiles_gfp);</div><div class='del'>-				if (!newpage)</div><div class='del'>-					goto nomem;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			ret = add_to_page_cache_lru(newpage, bmapping,</div><div class='del'>-						    netpage-&gt;index,</div><div class='del'>-						    cachefiles_gfp);</div><div class='del'>-			if (ret == 0)</div><div class='del'>-				goto installed_new_backing_page;</div><div class='del'>-			if (ret != -EEXIST)</div><div class='del'>-				goto nomem;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/* we've installed a new backing page, so now we need</div><div class='del'>-		 * to start it reading */</div><div class='del'>-	installed_new_backing_page:</div><div class='del'>-		_debug("- new %p", newpage);</div><div class='del'>-</div><div class='del'>-		backpage = newpage;</div><div class='del'>-		newpage = NULL;</div><div class='del'>-</div><div class='del'>-	reread_backing_page:</div><div class='del'>-		ret = bmapping-&gt;a_ops-&gt;readpage(NULL, backpage);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			goto read_error;</div><div class='del'>-</div><div class='del'>-		/* add the netfs page to the pagecache and LRU, and set the</div><div class='del'>-		 * monitor to transfer the data across */</div><div class='del'>-	monitor_backing_page:</div><div class='del'>-		_debug("- monitor add");</div><div class='del'>-</div><div class='del'>-		ret = add_to_page_cache_lru(netpage, op-&gt;mapping,</div><div class='del'>-					    netpage-&gt;index, cachefiles_gfp);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			if (ret == -EEXIST) {</div><div class='del'>-				put_page(backpage);</div><div class='del'>-				backpage = NULL;</div><div class='del'>-				put_page(netpage);</div><div class='del'>-				netpage = NULL;</div><div class='del'>-				fscache_retrieval_complete(op, 1);</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='del'>-			goto nomem;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/* install a monitor */</div><div class='del'>-		get_page(netpage);</div><div class='del'>-		monitor-&gt;netfs_page = netpage;</div><div class='del'>-</div><div class='del'>-		get_page(backpage);</div><div class='del'>-		monitor-&gt;back_page = backpage;</div><div class='del'>-		monitor-&gt;monitor.private = backpage;</div><div class='del'>-		folio_add_wait_queue(page_folio(backpage), &amp;monitor-&gt;monitor);</div><div class='del'>-		monitor = NULL;</div><div class='del'>-</div><div class='del'>-		/* but the page may have been read before the monitor was</div><div class='del'>-		 * installed, so the monitor may miss the event - so we have to</div><div class='del'>-		 * ensure that we do get one in such a case */</div><div class='del'>-		if (trylock_page(backpage)) {</div><div class='del'>-			_debug("2unlock %p {%lx}", backpage, backpage-&gt;flags);</div><div class='del'>-			unlock_page(backpage);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		put_page(backpage);</div><div class='del'>-		backpage = NULL;</div><div class='del'>-</div><div class='del'>-		put_page(netpage);</div><div class='del'>-		netpage = NULL;</div><div class='del'>-		continue;</div><div class='del'>-</div><div class='del'>-		/* if the backing page is already present, it can be in one of</div><div class='del'>-		 * three states: read in progress, read failed or read okay */</div><div class='del'>-	backing_page_already_present:</div><div class='del'>-		_debug("- present %p", backpage);</div><div class='del'>-</div><div class='del'>-		if (PageError(backpage))</div><div class='del'>-			goto io_error;</div><div class='del'>-</div><div class='del'>-		if (PageUptodate(backpage))</div><div class='del'>-			goto backing_page_already_uptodate;</div><div class='del'>-</div><div class='del'>-		_debug("- not ready %p{%lx}", backpage, backpage-&gt;flags);</div><div class='del'>-</div><div class='del'>-		if (!trylock_page(backpage))</div><div class='del'>-			goto monitor_backing_page;</div><div class='del'>-</div><div class='del'>-		if (PageError(backpage)) {</div><div class='del'>-			_debug("error %lx", backpage-&gt;flags);</div><div class='del'>-			unlock_page(backpage);</div><div class='del'>-			goto io_error;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (PageUptodate(backpage))</div><div class='del'>-			goto backing_page_already_uptodate_unlock;</div><div class='del'>-</div><div class='del'>-		/* we've locked a page that's neither up to date nor erroneous,</div><div class='del'>-		 * so we need to attempt to read it again */</div><div class='del'>-		goto reread_backing_page;</div><div class='del'>-</div><div class='del'>-		/* the backing page is already up to date, attach the netfs</div><div class='del'>-		 * page to the pagecache and LRU and copy the data across */</div><div class='del'>-	backing_page_already_uptodate_unlock:</div><div class='del'>-		_debug("uptodate %lx", backpage-&gt;flags);</div><div class='del'>-		unlock_page(backpage);</div><div class='del'>-	backing_page_already_uptodate:</div><div class='del'>-		_debug("- uptodate");</div><div class='del'>-</div><div class='del'>-		ret = add_to_page_cache_lru(netpage, op-&gt;mapping,</div><div class='del'>-					    netpage-&gt;index, cachefiles_gfp);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			if (ret == -EEXIST) {</div><div class='del'>-				put_page(backpage);</div><div class='del'>-				backpage = NULL;</div><div class='del'>-				put_page(netpage);</div><div class='del'>-				netpage = NULL;</div><div class='del'>-				fscache_retrieval_complete(op, 1);</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='del'>-			goto nomem;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		copy_highpage(netpage, backpage);</div><div class='del'>-</div><div class='del'>-		put_page(backpage);</div><div class='del'>-		backpage = NULL;</div><div class='del'>-</div><div class='del'>-		fscache_mark_page_cached(op, netpage);</div><div class='del'>-</div><div class='del'>-		/* the netpage is unlocked and marked up to date here */</div><div class='del'>-		fscache_end_io(op, netpage, 0);</div><div class='del'>-		put_page(netpage);</div><div class='del'>-		netpage = NULL;</div><div class='del'>-		fscache_retrieval_complete(op, 1);</div><div class='del'>-		continue;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	netpage = NULL;</div><div class='del'>-</div><div class='del'>-	_debug("out");</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	/* tidy up */</div><div class='del'>-	if (newpage)</div><div class='del'>-		put_page(newpage);</div><div class='del'>-	if (netpage)</div><div class='del'>-		put_page(netpage);</div><div class='del'>-	if (backpage)</div><div class='del'>-		put_page(backpage);</div><div class='del'>-	if (monitor) {</div><div class='del'>-		fscache_put_retrieval(op);</div><div class='del'>-		kfree(monitor);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	list_for_each_entry_safe(netpage, _n, list, lru) {</div><div class='del'>-		list_del(&amp;netpage-&gt;lru);</div><div class='del'>-		put_page(netpage);</div><div class='del'>-		fscache_retrieval_complete(op, 1);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	_leave(" = %d", ret);</div><div class='del'>-	return ret;</div><div class='del'>-</div><div class='del'>-nomem:</div><div class='del'>-	_debug("nomem");</div><div class='del'>-	ret = -ENOMEM;</div><div class='del'>-	goto record_page_complete;</div><div class='del'>-</div><div class='del'>-read_error:</div><div class='del'>-	_debug("read error %d", ret);</div><div class='del'>-	if (ret == -ENOMEM)</div><div class='del'>-		goto record_page_complete;</div><div class='del'>-io_error:</div><div class='del'>-	cachefiles_io_error_obj(object, "Page read error on backing file");</div><div class='del'>-	ret = -ENOBUFS;</div><div class='del'>-record_page_complete:</div><div class='del'>-	fscache_retrieval_complete(op, 1);</div><div class='del'>-	goto out;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * read a list of pages from the cache or allocate blocks in which to store</div><div class='del'>- * them</div><div class='del'>- */</div><div class='del'>-int cachefiles_read_or_alloc_pages(struct fscache_retrieval *op,</div><div class='del'>-				   struct list_head *pages,</div><div class='del'>-				   unsigned *nr_pages,</div><div class='del'>-				   gfp_t gfp)</div><div class='del'>-{</div><div class='del'>-	struct cachefiles_object *object;</div><div class='del'>-	struct cachefiles_cache *cache;</div><div class='del'>-	struct list_head backpages;</div><div class='del'>-	struct pagevec pagevec;</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	struct page *page, *_n;</div><div class='del'>-	unsigned shift, nrbackpages;</div><div class='del'>-	int ret, ret2, space;</div><div class='del'>-</div><div class='del'>-	object = container_of(op-&gt;op.object,</div><div class='del'>-			      struct cachefiles_object, fscache);</div><div class='del'>-	cache = container_of(object-&gt;fscache.cache,</div><div class='del'>-			     struct cachefiles_cache, cache);</div><div class='del'>-</div><div class='del'>-	_enter("{OBJ%x,%d},,%d,,",</div><div class='del'>-	       object-&gt;fscache.debug_id, atomic_read(&amp;op-&gt;op.usage),</div><div class='del'>-	       *nr_pages);</div><div class='del'>-</div><div class='del'>-	if (!object-&gt;backer)</div><div class='del'>-		goto all_enobufs;</div><div class='del'>-</div><div class='del'>-	space = 1;</div><div class='del'>-	if (cachefiles_has_space(cache, 0, *nr_pages) &lt; 0)</div><div class='del'>-		space = 0;</div><div class='del'>-</div><div class='del'>-	inode = d_backing_inode(object-&gt;backer);</div><div class='del'>-	ASSERT(S_ISREG(inode-&gt;i_mode));</div><div class='del'>-</div><div class='del'>-	/* calculate the shift required to use bmap */</div><div class='del'>-	shift = PAGE_SHIFT - inode-&gt;i_sb-&gt;s_blocksize_bits;</div><div class='del'>-</div><div class='del'>-	pagevec_init(&amp;pagevec);</div><div class='del'>-</div><div class='del'>-	op-&gt;op.flags &amp;= FSCACHE_OP_KEEP_FLAGS;</div><div class='del'>-	op-&gt;op.flags |= FSCACHE_OP_ASYNC;</div><div class='del'>-	op-&gt;op.processor = cachefiles_read_copier;</div><div class='del'>-</div><div class='del'>-	INIT_LIST_HEAD(&amp;backpages);</div><div class='del'>-	nrbackpages = 0;</div><div class='del'>-</div><div class='del'>-	ret = space ? -ENODATA : -ENOBUFS;</div><div class='del'>-	list_for_each_entry_safe(page, _n, pages, lru) {</div><div class='del'>-		sector_t block;</div><div class='del'>-</div><div class='del'>-		/* we assume the absence or presence of the first block is a</div><div class='del'>-		 * good enough indication for the page as a whole</div><div class='del'>-		 * - TODO: don't use bmap() for this as it is _not_ actually</div><div class='del'>-		 *   good enough for this as it doesn't indicate errors, but</div><div class='del'>-		 *   it's all we've got for the moment</div><div class='del'>-		 */</div><div class='del'>-		block = page-&gt;index;</div><div class='del'>-		block &lt;&lt;= shift;</div><div class='del'>-</div><div class='del'>-		ret2 = bmap(inode, &amp;block);</div><div class='del'>-		ASSERT(ret2 == 0);</div><div class='del'>-</div><div class='del'>-		_debug("%llx -&gt; %llx",</div><div class='del'>-		       (unsigned long long) (page-&gt;index &lt;&lt; shift),</div><div class='del'>-		       (unsigned long long) block);</div><div class='del'>-</div><div class='del'>-		if (block) {</div><div class='del'>-			/* we have data - add it to the list to give to the</div><div class='del'>-			 * backing fs */</div><div class='del'>-			list_move(&amp;page-&gt;lru, &amp;backpages);</div><div class='del'>-			(*nr_pages)--;</div><div class='del'>-			nrbackpages++;</div><div class='del'>-		} else if (space &amp;&amp; pagevec_add(&amp;pagevec, page) == 0) {</div><div class='del'>-			fscache_mark_pages_cached(op, &amp;pagevec);</div><div class='del'>-			fscache_retrieval_complete(op, 1);</div><div class='del'>-			ret = -ENODATA;</div><div class='del'>-		} else {</div><div class='del'>-			fscache_retrieval_complete(op, 1);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (pagevec_count(&amp;pagevec) &gt; 0)</div><div class='del'>-		fscache_mark_pages_cached(op, &amp;pagevec);</div><div class='del'>-</div><div class='del'>-	if (list_empty(pages))</div><div class='del'>-		ret = 0;</div><div class='del'>-</div><div class='del'>-	/* submit the apparently valid pages to the backing fs to be read from</div><div class='del'>-	 * disk */</div><div class='del'>-	if (nrbackpages &gt; 0) {</div><div class='del'>-		ret2 = cachefiles_read_backing_file(object, op, &amp;backpages);</div><div class='del'>-		if (ret2 == -ENOMEM || ret2 == -EINTR)</div><div class='del'>-			ret = ret2;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	_leave(" = %d [nr=%u%s]",</div><div class='del'>-	       ret, *nr_pages, list_empty(pages) ? " empty" : "");</div><div class='del'>-	return ret;</div><div class='del'>-</div><div class='del'>-all_enobufs:</div><div class='del'>-	fscache_retrieval_complete(op, *nr_pages);</div><div class='del'>-	return -ENOBUFS;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * allocate a block in the cache in which to store a page</div><div class='del'>- * - cache withdrawal is prevented by the caller</div><div class='del'>- * - returns -EINTR if interrupted</div><div class='del'>- * - returns -ENOMEM if ran out of memory</div><div class='del'>- * - returns -ENOBUFS if no buffers can be made available</div><div class='del'>- * - returns -ENOBUFS if page is beyond EOF</div><div class='del'>- * - otherwise:</div><div class='del'>- *   - the metadata will be retained</div><div class='del'>- *   - 0 will be returned</div><div class='del'>- */</div><div class='del'>-int cachefiles_allocate_page(struct fscache_retrieval *op,</div><div class='del'>-			     struct page *page,</div><div class='del'>-			     gfp_t gfp)</div><div class='del'>-{</div><div class='del'>-	struct cachefiles_object *object;</div><div class='del'>-	struct cachefiles_cache *cache;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	object = container_of(op-&gt;op.object,</div><div class='del'>-			      struct cachefiles_object, fscache);</div><div class='del'>-	cache = container_of(object-&gt;fscache.cache,</div><div class='del'>-			     struct cachefiles_cache, cache);</div><div class='del'>-</div><div class='del'>-	_enter("%p,{%lx},", object, page-&gt;index);</div><div class='del'>-</div><div class='del'>-	ret = cachefiles_has_space(cache, 0, 1);</div><div class='del'>-	if (ret == 0)</div><div class='del'>-		fscache_mark_page_cached(op, page);</div><div class='del'>-	else</div><div class='del'>-		ret = -ENOBUFS;</div><div class='del'>-</div><div class='del'>-	fscache_retrieval_complete(op, 1);</div><div class='del'>-	_leave(" = %d", ret);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * allocate blocks in the cache in which to store a set of pages</div><div class='del'>- * - cache withdrawal is prevented by the caller</div><div class='del'>- * - returns -EINTR if interrupted</div><div class='del'>- * - returns -ENOMEM if ran out of memory</div><div class='del'>- * - returns -ENOBUFS if some buffers couldn't be made available</div><div class='del'>- * - returns -ENOBUFS if some pages are beyond EOF</div><div class='del'>- * - otherwise:</div><div class='del'>- *   - -ENODATA will be returned</div><div class='del'>- * - metadata will be retained for any page marked</div><div class='del'>- */</div><div class='del'>-int cachefiles_allocate_pages(struct fscache_retrieval *op,</div><div class='del'>-			      struct list_head *pages,</div><div class='del'>-			      unsigned *nr_pages,</div><div class='del'>-			      gfp_t gfp)</div><div class='del'>-{</div><div class='del'>-	struct cachefiles_object *object;</div><div class='del'>-	struct cachefiles_cache *cache;</div><div class='del'>-	struct pagevec pagevec;</div><div class='del'>-	struct page *page;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	object = container_of(op-&gt;op.object,</div><div class='del'>-			      struct cachefiles_object, fscache);</div><div class='del'>-	cache = container_of(object-&gt;fscache.cache,</div><div class='del'>-			     struct cachefiles_cache, cache);</div><div class='del'>-</div><div class='del'>-	_enter("%p,,,%d,", object, *nr_pages);</div><div class='del'>-</div><div class='del'>-	ret = cachefiles_has_space(cache, 0, *nr_pages);</div><div class='del'>-	if (ret == 0) {</div><div class='del'>-		pagevec_init(&amp;pagevec);</div><div class='del'>-</div><div class='del'>-		list_for_each_entry(page, pages, lru) {</div><div class='del'>-			if (pagevec_add(&amp;pagevec, page) == 0)</div><div class='del'>-				fscache_mark_pages_cached(op, &amp;pagevec);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (pagevec_count(&amp;pagevec) &gt; 0)</div><div class='del'>-			fscache_mark_pages_cached(op, &amp;pagevec);</div><div class='del'>-		ret = -ENODATA;</div><div class='del'>-	} else {</div><div class='del'>-		ret = -ENOBUFS;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	fscache_retrieval_complete(op, *nr_pages);</div><div class='del'>-	_leave(" = %d", ret);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * request a page be stored in the cache</div><div class='del'>- * - cache withdrawal is prevented by the caller</div><div class='del'>- * - this request may be ignored if there's no cache block available, in which</div><div class='del'>- *   case -ENOBUFS will be returned</div><div class='del'>- * - if the op is in progress, 0 will be returned</div><div class='del'>- */</div><div class='del'>-int cachefiles_write_page(struct fscache_storage *op, struct page *page)</div><div class='del'>-{</div><div class='del'>-	struct cachefiles_object *object;</div><div class='del'>-	struct cachefiles_cache *cache;</div><div class='del'>-	struct file *file;</div><div class='del'>-	struct path path;</div><div class='del'>-	loff_t pos, eof;</div><div class='del'>-	size_t len;</div><div class='del'>-	void *data;</div><div class='del'>-	int ret = -ENOBUFS;</div><div class='del'>-</div><div class='del'>-	ASSERT(op != NULL);</div><div class='del'>-	ASSERT(page != NULL);</div><div class='del'>-</div><div class='del'>-	object = container_of(op-&gt;op.object,</div><div class='del'>-			      struct cachefiles_object, fscache);</div><div class='del'>-</div><div class='del'>-	_enter("%p,%p{%lx},,,", object, page, page-&gt;index);</div><div class='del'>-</div><div class='del'>-	if (!object-&gt;backer) {</div><div class='del'>-		_leave(" = -ENOBUFS");</div><div class='del'>-		return -ENOBUFS;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ASSERT(d_is_reg(object-&gt;backer));</div><div class='del'>-</div><div class='del'>-	cache = container_of(object-&gt;fscache.cache,</div><div class='del'>-			     struct cachefiles_cache, cache);</div><div class='del'>-</div><div class='del'>-	pos = (loff_t)page-&gt;index &lt;&lt; PAGE_SHIFT;</div><div class='del'>-</div><div class='del'>-	/* We mustn't write more data than we have, so we have to beware of a</div><div class='del'>-	 * partial page at EOF.</div><div class='del'>-	 */</div><div class='del'>-	eof = object-&gt;fscache.store_limit_l;</div><div class='del'>-	if (pos &gt;= eof)</div><div class='del'>-		goto error;</div><div class='del'>-</div><div class='del'>-	/* write the page to the backing filesystem and let it store it in its</div><div class='del'>-	 * own time */</div><div class='del'>-	path.mnt = cache-&gt;mnt;</div><div class='del'>-	path.dentry = object-&gt;backer;</div><div class='del'>-	file = dentry_open(&amp;path, O_RDWR | O_LARGEFILE, cache-&gt;cache_cred);</div><div class='del'>-	if (IS_ERR(file)) {</div><div class='del'>-		ret = PTR_ERR(file);</div><div class='del'>-		goto error_2;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	len = PAGE_SIZE;</div><div class='del'>-	if (eof &amp; ~PAGE_MASK) {</div><div class='del'>-		if (eof - pos &lt; PAGE_SIZE) {</div><div class='del'>-			_debug("cut short %llx to %llx",</div><div class='del'>-			       pos, eof);</div><div class='del'>-			len = eof - pos;</div><div class='del'>-			ASSERTCMP(pos + len, ==, eof);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	data = kmap(page);</div><div class='del'>-	ret = kernel_write(file, data, len, &amp;pos);</div><div class='del'>-	kunmap(page);</div><div class='del'>-	fput(file);</div><div class='del'>-	if (ret != len)</div><div class='del'>-		goto error_eio;</div><div class='del'>-</div><div class='del'>-	_leave(" = 0");</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-error_eio:</div><div class='del'>-	ret = -EIO;</div><div class='del'>-error_2:</div><div class='del'>-	if (ret == -EIO)</div><div class='del'>-		cachefiles_io_error_obj(object,</div><div class='del'>-					"Write page to backing file failed");</div><div class='del'>-error:</div><div class='del'>-	_leave(" = -ENOBUFS [%d]", ret);</div><div class='del'>-	return -ENOBUFS;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * detach a backing block from a page</div><div class='del'>- * - cache withdrawal is prevented by the caller</div><div class='del'>- */</div><div class='del'>-void cachefiles_uncache_page(struct fscache_object *_object, struct page *page)</div><div class='del'>-	__releases(&amp;object-&gt;fscache.cookie-&gt;lock)</div><div class='del'>-{</div><div class='del'>-	struct cachefiles_object *object;</div><div class='del'>-</div><div class='del'>-	object = container_of(_object, struct cachefiles_object, fscache);</div><div class='del'>-</div><div class='del'>-	_enter("%p,{%lu}", object, page-&gt;index);</div><div class='del'>-</div><div class='del'>-	spin_unlock(&amp;object-&gt;fscache.cookie-&gt;lock);</div><div class='del'>-}</div><div class='head'>diff --git a/fs/cachefiles/security.c b/fs/cachefiles/security.c<br/>index aec13fd94692..fc6611886b3b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cachefiles/security.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/security.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/cachefiles/security.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/cachefiles/security.c</a></div><div class='hunk'>@@ -1,7 +1,7 @@</div><div class='ctx'> // SPDX-License-Identifier: GPL-2.0-or-later</div><div class='ctx'> /* CacheFiles security management</div><div class='ctx'>  *</div><div class='del'>- * Copyright (C) 2007 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Copyright (C) 2007, 2021 Red Hat, Inc. All Rights Reserved.</div><div class='ctx'>  * Written by David Howells (dhowells@redhat.com)</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='hunk'>@@ -18,7 +18,7 @@ int cachefiles_get_security_ID(struct cachefiles_cache *cache)</div><div class='ctx'> 	struct cred *new;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	_enter("{%s}", cache-&gt;secctx);</div><div class='add'>+	_enter("{%u}", cache-&gt;have_secid ? cache-&gt;secid : 0);</div><div class='ctx'> </div><div class='ctx'> 	new = prepare_kernel_cred(current);</div><div class='ctx'> 	if (!new) {</div><div class='hunk'>@@ -26,8 +26,8 @@ int cachefiles_get_security_ID(struct cachefiles_cache *cache)</div><div class='ctx'> 		goto error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (cache-&gt;secctx) {</div><div class='del'>-		ret = set_security_override_from_ctx(new, cache-&gt;secctx);</div><div class='add'>+	if (cache-&gt;have_secid) {</div><div class='add'>+		ret = set_security_override(new, cache-&gt;secid);</div><div class='ctx'> 		if (ret &lt; 0) {</div><div class='ctx'> 			put_cred(new);</div><div class='ctx'> 			pr_err("Security denies permission to nominate security context: error %d\n",</div><div class='head'>diff --git a/fs/cachefiles/volume.c b/fs/cachefiles/volume.c<br/>new file mode 100644<br/>index 000000000000..90ba926f488e<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/cachefiles/volume.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/cachefiles/volume.c</a></div><div class='hunk'>@@ -0,0 +1,141 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='add'>+/* Volume handling.</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2021 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/slab.h&gt;</div><div class='add'>+#include &lt;linux/namei.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+#include &lt;trace/events/fscache.h&gt;</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Allocate and set up a volume representation.  We make sure all the fanout</div><div class='add'>+ * directories are created and pinned.</div><div class='add'>+ */</div><div class='add'>+void cachefiles_acquire_volume(struct fscache_volume *vcookie)</div><div class='add'>+{</div><div class='add'>+	struct cachefiles_volume *volume;</div><div class='add'>+	struct cachefiles_cache *cache = vcookie-&gt;cache-&gt;cache_priv;</div><div class='add'>+	const struct cred *saved_cred;</div><div class='add'>+	struct dentry *vdentry, *fan;</div><div class='add'>+	size_t len;</div><div class='add'>+	char *name;</div><div class='add'>+	bool is_new = false;</div><div class='add'>+	int ret, n_accesses, i;</div><div class='add'>+</div><div class='add'>+	_enter("");</div><div class='add'>+</div><div class='add'>+	volume = kzalloc(sizeof(struct cachefiles_volume), GFP_KERNEL);</div><div class='add'>+	if (!volume)</div><div class='add'>+		return;</div><div class='add'>+	volume-&gt;vcookie = vcookie;</div><div class='add'>+	volume-&gt;cache = cache;</div><div class='add'>+	INIT_LIST_HEAD(&amp;volume-&gt;cache_link);</div><div class='add'>+</div><div class='add'>+	cachefiles_begin_secure(cache, &amp;saved_cred);</div><div class='add'>+</div><div class='add'>+	len = vcookie-&gt;key[0];</div><div class='add'>+	name = kmalloc(len + 3, GFP_NOFS);</div><div class='add'>+	if (!name)</div><div class='add'>+		goto error_vol;</div><div class='add'>+	name[0] = 'I';</div><div class='add'>+	memcpy(name + 1, vcookie-&gt;key + 1, len);</div><div class='add'>+	name[len + 1] = 0;</div><div class='add'>+</div><div class='add'>+retry:</div><div class='add'>+	vdentry = cachefiles_get_directory(cache, cache-&gt;store, name, &amp;is_new);</div><div class='add'>+	if (IS_ERR(vdentry))</div><div class='add'>+		goto error_name;</div><div class='add'>+	volume-&gt;dentry = vdentry;</div><div class='add'>+</div><div class='add'>+	if (is_new) {</div><div class='add'>+		if (!cachefiles_set_volume_xattr(volume))</div><div class='add'>+			goto error_dir;</div><div class='add'>+	} else {</div><div class='add'>+		ret = cachefiles_check_volume_xattr(volume);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			if (ret != -ESTALE)</div><div class='add'>+				goto error_dir;</div><div class='add'>+			vdentry = start_removing_dentry(cache-&gt;store, vdentry);</div><div class='add'>+			if (!IS_ERR(vdentry))</div><div class='add'>+				cachefiles_bury_object(cache, NULL, cache-&gt;store,</div><div class='add'>+						       vdentry,</div><div class='add'>+						       FSCACHE_VOLUME_IS_WEIRD);</div><div class='add'>+			cachefiles_put_directory(volume-&gt;dentry);</div><div class='add'>+			cond_resched();</div><div class='add'>+			goto retry;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	</div><div class='add'>+	for (i = 0; i &lt; 256; i++) {</div><div class='add'>+		sprintf(name, "@%02x", i);</div><div class='add'>+		fan = cachefiles_get_directory(cache, vdentry, name, NULL);</div><div class='add'>+		if (IS_ERR(fan))</div><div class='add'>+			goto error_fan;</div><div class='add'>+		volume-&gt;fanout[i] = fan;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	cachefiles_end_secure(cache, saved_cred);</div><div class='add'>+</div><div class='add'>+	vcookie-&gt;cache_priv = volume;</div><div class='add'>+	n_accesses = atomic_inc_return(&amp;vcookie-&gt;n_accesses); /* Stop wakeups on dec-to-0 */</div><div class='add'>+	trace_fscache_access_volume(vcookie-&gt;debug_id, 0,</div><div class='add'>+				    refcount_read(&amp;vcookie-&gt;ref),</div><div class='add'>+				    n_accesses, fscache_access_cache_pin);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;cache-&gt;object_list_lock);</div><div class='add'>+	list_add(&amp;volume-&gt;cache_link, &amp;volume-&gt;cache-&gt;volumes);</div><div class='add'>+	spin_unlock(&amp;cache-&gt;object_list_lock);</div><div class='add'>+</div><div class='add'>+	kfree(name);</div><div class='add'>+	return;</div><div class='add'>+</div><div class='add'>+error_fan:</div><div class='add'>+	for (i = 0; i &lt; 256; i++)</div><div class='add'>+		cachefiles_put_directory(volume-&gt;fanout[i]);</div><div class='add'>+error_dir:</div><div class='add'>+	cachefiles_put_directory(volume-&gt;dentry);</div><div class='add'>+error_name:</div><div class='add'>+	kfree(name);</div><div class='add'>+error_vol:</div><div class='add'>+	kfree(volume);</div><div class='add'>+	cachefiles_end_secure(cache, saved_cred);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Release a volume representation.</div><div class='add'>+ */</div><div class='add'>+static void __cachefiles_free_volume(struct cachefiles_volume *volume)</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	_enter("");</div><div class='add'>+</div><div class='add'>+	volume-&gt;vcookie-&gt;cache_priv = NULL;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; 256; i++)</div><div class='add'>+		cachefiles_put_directory(volume-&gt;fanout[i]);</div><div class='add'>+	cachefiles_put_directory(volume-&gt;dentry);</div><div class='add'>+	kfree(volume);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void cachefiles_free_volume(struct fscache_volume *vcookie)</div><div class='add'>+{</div><div class='add'>+	struct cachefiles_volume *volume = vcookie-&gt;cache_priv;</div><div class='add'>+</div><div class='add'>+	if (volume) {</div><div class='add'>+		spin_lock(&amp;volume-&gt;cache-&gt;object_list_lock);</div><div class='add'>+		list_del_init(&amp;volume-&gt;cache_link);</div><div class='add'>+		spin_unlock(&amp;volume-&gt;cache-&gt;object_list_lock);</div><div class='add'>+		__cachefiles_free_volume(volume);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void cachefiles_withdraw_volume(struct cachefiles_volume *volume)</div><div class='add'>+{</div><div class='add'>+	cachefiles_set_volume_xattr(volume);</div><div class='add'>+	__cachefiles_free_volume(volume);</div><div class='add'>+}</div><div class='head'>diff --git a/fs/cachefiles/xattr.c b/fs/cachefiles/xattr.c<br/>index 9e82de668595..52383b1d0ba6 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cachefiles/xattr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cachefiles/xattr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/cachefiles/xattr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/cachefiles/xattr.c</a></div><div class='hunk'>@@ -1,7 +1,7 @@</div><div class='ctx'> // SPDX-License-Identifier: GPL-2.0-or-later</div><div class='ctx'> /* CacheFiles extended attribute management</div><div class='ctx'>  *</div><div class='del'>- * Copyright (C) 2007 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Copyright (C) 2021 Red Hat, Inc. All Rights Reserved.</div><div class='ctx'>  * Written by David Howells (dhowells@redhat.com)</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='hunk'>@@ -15,310 +15,290 @@</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> </div><div class='add'>+#define CACHEFILES_COOKIE_TYPE_DATA 1</div><div class='add'>+</div><div class='add'>+struct cachefiles_xattr {</div><div class='add'>+	__be64	object_size;	/* Actual size of the object */</div><div class='add'>+	__be64	zero_point;	/* Size after which server has no data not written by us */</div><div class='add'>+	__u8	type;		/* Type of object */</div><div class='add'>+	__u8	content;	/* Content presence (enum cachefiles_content) */</div><div class='add'>+	__u8	data[];		/* netfs coherency data */</div><div class='add'>+} __packed;</div><div class='add'>+</div><div class='ctx'> static const char cachefiles_xattr_cache[] =</div><div class='ctx'> 	XATTR_USER_PREFIX "CacheFiles.cache";</div><div class='ctx'> </div><div class='add'>+struct cachefiles_vol_xattr {</div><div class='add'>+	__be32	reserved;	/* Reserved, should be 0 */</div><div class='add'>+	__u8	data[];		/* netfs volume coherency data */</div><div class='add'>+} __packed;</div><div class='add'>+</div><div class='ctx'> /*</div><div class='del'>- * check the type label on an object</div><div class='del'>- * - done using xattrs</div><div class='add'>+ * set the state xattr on a cache file</div><div class='ctx'>  */</div><div class='del'>-int cachefiles_check_object_type(struct cachefiles_object *object)</div><div class='add'>+int cachefiles_set_object_xattr(struct cachefiles_object *object)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *dentry = object-&gt;dentry;</div><div class='del'>-	char type[3], xtype[3];</div><div class='add'>+	struct cachefiles_xattr *buf;</div><div class='add'>+	struct dentry *dentry;</div><div class='add'>+	struct file *file = object-&gt;file;</div><div class='add'>+	unsigned int len = object-&gt;cookie-&gt;aux_len;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ASSERT(dentry);</div><div class='del'>-	ASSERT(d_backing_inode(dentry));</div><div class='add'>+	if (!file)</div><div class='add'>+		return -ESTALE;</div><div class='add'>+	dentry = file-&gt;f_path.dentry;</div><div class='add'>+</div><div class='add'>+	_enter("%x,#%d", object-&gt;debug_id, len);</div><div class='ctx'> </div><div class='del'>-	if (!object-&gt;fscache.cookie)</div><div class='del'>-		strcpy(type, "C3");</div><div class='del'>-	else</div><div class='del'>-		snprintf(type, 3, "%02x", object-&gt;fscache.cookie-&gt;def-&gt;type);</div><div class='add'>+	buf = kmalloc(sizeof(struct cachefiles_xattr) + len, GFP_KERNEL);</div><div class='add'>+	if (!buf)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	_enter("%x{%s}", object-&gt;fscache.debug_id, type);</div><div class='add'>+	buf-&gt;object_size	= cpu_to_be64(object-&gt;cookie-&gt;object_size);</div><div class='add'>+	buf-&gt;zero_point		= 0;</div><div class='add'>+	buf-&gt;type		= CACHEFILES_COOKIE_TYPE_DATA;</div><div class='add'>+	buf-&gt;content		= object-&gt;content_info;</div><div class='add'>+	if (test_bit(FSCACHE_COOKIE_LOCAL_WRITE, &amp;object-&gt;cookie-&gt;flags))</div><div class='add'>+		buf-&gt;content	= CACHEFILES_CONTENT_DIRTY;</div><div class='add'>+	if (len &gt; 0)</div><div class='add'>+		memcpy(buf-&gt;data, fscache_get_aux(object-&gt;cookie), len);</div><div class='ctx'> </div><div class='del'>-	/* attempt to install a type label directly */</div><div class='del'>-	ret = vfs_setxattr(&amp;init_user_ns, dentry, cachefiles_xattr_cache, type,</div><div class='del'>-			   2, XATTR_CREATE);</div><div class='add'>+	ret = cachefiles_inject_write_error();</div><div class='ctx'> 	if (ret == 0) {</div><div class='del'>-		_debug("SET"); /* we succeeded */</div><div class='del'>-		goto error;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (ret != -EEXIST) {</div><div class='del'>-		pr_err("Can't set xattr on %pd [%lu] (err %d)\n",</div><div class='del'>-		       dentry, d_backing_inode(dentry)-&gt;i_ino,</div><div class='del'>-		       -ret);</div><div class='del'>-		goto error;</div><div class='add'>+		ret = mnt_want_write_file(file);</div><div class='add'>+		if (ret == 0) {</div><div class='add'>+			ret = vfs_setxattr(&amp;nop_mnt_idmap, dentry,</div><div class='add'>+					   cachefiles_xattr_cache, buf,</div><div class='add'>+					   sizeof(struct cachefiles_xattr) + len, 0);</div><div class='add'>+			mnt_drop_write_file(file);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	/* read the current type label */</div><div class='del'>-	ret = vfs_getxattr(&amp;init_user_ns, dentry, cachefiles_xattr_cache, xtype,</div><div class='del'>-			   3);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='del'>-		if (ret == -ERANGE)</div><div class='del'>-			goto bad_type_length;</div><div class='del'>-</div><div class='del'>-		pr_err("Can't read xattr on %pd [%lu] (err %d)\n",</div><div class='del'>-		       dentry, d_backing_inode(dentry)-&gt;i_ino,</div><div class='del'>-		       -ret);</div><div class='del'>-		goto error;</div><div class='add'>+		trace_cachefiles_vfs_error(object, file_inode(file), ret,</div><div class='add'>+					   cachefiles_trace_setxattr_error);</div><div class='add'>+		trace_cachefiles_coherency(object, file_inode(file)-&gt;i_ino,</div><div class='add'>+					   be64_to_cpup((__be64 *)buf-&gt;data),</div><div class='add'>+					   buf-&gt;content,</div><div class='add'>+					   cachefiles_coherency_set_fail);</div><div class='add'>+		if (ret != -ENOMEM)</div><div class='add'>+			cachefiles_io_error_obj(</div><div class='add'>+				object,</div><div class='add'>+				"Failed to set xattr with error %d", ret);</div><div class='add'>+	} else {</div><div class='add'>+		trace_cachefiles_coherency(object, file_inode(file)-&gt;i_ino,</div><div class='add'>+					   be64_to_cpup((__be64 *)buf-&gt;data),</div><div class='add'>+					   buf-&gt;content,</div><div class='add'>+					   cachefiles_coherency_set_ok);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* check the type is what we're expecting */</div><div class='del'>-	if (ret != 2)</div><div class='del'>-		goto bad_type_length;</div><div class='del'>-</div><div class='del'>-	if (xtype[0] != type[0] || xtype[1] != type[1])</div><div class='del'>-		goto bad_type;</div><div class='del'>-</div><div class='del'>-	ret = 0;</div><div class='del'>-</div><div class='del'>-error:</div><div class='add'>+	kfree(buf);</div><div class='ctx'> 	_leave(" = %d", ret);</div><div class='ctx'> 	return ret;</div><div class='del'>-</div><div class='del'>-bad_type_length:</div><div class='del'>-	pr_err("Cache object %lu type xattr length incorrect\n",</div><div class='del'>-	       d_backing_inode(dentry)-&gt;i_ino);</div><div class='del'>-	ret = -EIO;</div><div class='del'>-	goto error;</div><div class='del'>-</div><div class='del'>-bad_type:</div><div class='del'>-	xtype[2] = 0;</div><div class='del'>-	pr_err("Cache object %pd [%lu] type %s not %s\n",</div><div class='del'>-	       dentry, d_backing_inode(dentry)-&gt;i_ino,</div><div class='del'>-	       xtype, type);</div><div class='del'>-	ret = -EIO;</div><div class='del'>-	goto error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * set the state xattr on a cache file</div><div class='add'>+ * check the consistency between the backing cache and the FS-Cache cookie</div><div class='ctx'>  */</div><div class='del'>-int cachefiles_set_object_xattr(struct cachefiles_object *object,</div><div class='del'>-				struct cachefiles_xattr *auxdata)</div><div class='add'>+int cachefiles_check_auxdata(struct cachefiles_object *object, struct file *file)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *dentry = object-&gt;dentry;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ASSERT(dentry);</div><div class='add'>+	struct cachefiles_xattr *buf;</div><div class='add'>+	struct dentry *dentry = file-&gt;f_path.dentry;</div><div class='add'>+	unsigned int len = object-&gt;cookie-&gt;aux_len, tlen;</div><div class='add'>+	const void *p = fscache_get_aux(object-&gt;cookie);</div><div class='add'>+	enum cachefiles_coherency_trace why;</div><div class='add'>+	ssize_t xlen;</div><div class='add'>+	int ret = -ESTALE;</div><div class='ctx'> </div><div class='del'>-	_enter("%p,#%d", object, auxdata-&gt;len);</div><div class='add'>+	tlen = sizeof(struct cachefiles_xattr) + len;</div><div class='add'>+	buf = kmalloc(tlen, GFP_KERNEL);</div><div class='add'>+	if (!buf)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	/* attempt to install the cache metadata directly */</div><div class='del'>-	_debug("SET #%u", auxdata-&gt;len);</div><div class='add'>+	xlen = cachefiles_inject_read_error();</div><div class='add'>+	if (xlen == 0)</div><div class='add'>+		xlen = vfs_getxattr(&amp;nop_mnt_idmap, dentry, cachefiles_xattr_cache, buf, tlen);</div><div class='add'>+	if (xlen != tlen) {</div><div class='add'>+		if (xlen &lt; 0) {</div><div class='add'>+			ret = xlen;</div><div class='add'>+			trace_cachefiles_vfs_error(object, file_inode(file), xlen,</div><div class='add'>+						   cachefiles_trace_getxattr_error);</div><div class='add'>+		}</div><div class='add'>+		if (xlen == -EIO)</div><div class='add'>+			cachefiles_io_error_obj(</div><div class='add'>+				object,</div><div class='add'>+				"Failed to read aux with error %zd", xlen);</div><div class='add'>+		why = cachefiles_coherency_check_xattr;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	clear_bit(FSCACHE_COOKIE_AUX_UPDATED, &amp;object-&gt;fscache.cookie-&gt;flags);</div><div class='del'>-	ret = vfs_setxattr(&amp;init_user_ns, dentry, cachefiles_xattr_cache,</div><div class='del'>-			   &amp;auxdata-&gt;type, auxdata-&gt;len, XATTR_CREATE);</div><div class='del'>-	if (ret &lt; 0 &amp;&amp; ret != -ENOMEM)</div><div class='del'>-		cachefiles_io_error_obj(</div><div class='del'>-			object,</div><div class='del'>-			"Failed to set xattr with error %d", ret);</div><div class='add'>+	if (buf-&gt;type != CACHEFILES_COOKIE_TYPE_DATA) {</div><div class='add'>+		why = cachefiles_coherency_check_type;</div><div class='add'>+	} else if (memcmp(buf-&gt;data, p, len) != 0) {</div><div class='add'>+		why = cachefiles_coherency_check_aux;</div><div class='add'>+	} else if (be64_to_cpu(buf-&gt;object_size) != object-&gt;cookie-&gt;object_size) {</div><div class='add'>+		why = cachefiles_coherency_check_objsize;</div><div class='add'>+	} else if (buf-&gt;content == CACHEFILES_CONTENT_DIRTY) {</div><div class='add'>+		// TODO: Begin conflict resolution</div><div class='add'>+		pr_warn("Dirty object in cache\n");</div><div class='add'>+		why = cachefiles_coherency_check_dirty;</div><div class='add'>+	} else {</div><div class='add'>+		why = cachefiles_coherency_check_ok;</div><div class='add'>+		ret = 0;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	_leave(" = %d", ret);</div><div class='add'>+out:</div><div class='add'>+	trace_cachefiles_coherency(object, file_inode(file)-&gt;i_ino,</div><div class='add'>+				   be64_to_cpup((__be64 *)buf-&gt;data),</div><div class='add'>+				   buf-&gt;content, why);</div><div class='add'>+	kfree(buf);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * update the state xattr on a cache file</div><div class='add'>+ * remove the object's xattr to mark it stale</div><div class='ctx'>  */</div><div class='del'>-int cachefiles_update_object_xattr(struct cachefiles_object *object,</div><div class='del'>-				   struct cachefiles_xattr *auxdata)</div><div class='add'>+int cachefiles_remove_object_xattr(struct cachefiles_cache *cache,</div><div class='add'>+				   struct cachefiles_object *object,</div><div class='add'>+				   struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *dentry = object-&gt;dentry;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (!dentry)</div><div class='del'>-		return -ESTALE;</div><div class='del'>-</div><div class='del'>-	_enter("%x,#%d", object-&gt;fscache.debug_id, auxdata-&gt;len);</div><div class='del'>-</div><div class='del'>-	/* attempt to install the cache metadata directly */</div><div class='del'>-	_debug("SET #%u", auxdata-&gt;len);</div><div class='del'>-</div><div class='del'>-	clear_bit(FSCACHE_COOKIE_AUX_UPDATED, &amp;object-&gt;fscache.cookie-&gt;flags);</div><div class='del'>-	ret = vfs_setxattr(&amp;init_user_ns, dentry, cachefiles_xattr_cache,</div><div class='del'>-			   &amp;auxdata-&gt;type, auxdata-&gt;len, XATTR_REPLACE);</div><div class='del'>-	if (ret &lt; 0 &amp;&amp; ret != -ENOMEM)</div><div class='del'>-		cachefiles_io_error_obj(</div><div class='del'>-			object,</div><div class='del'>-			"Failed to update xattr with error %d", ret);</div><div class='add'>+	ret = cachefiles_inject_remove_error();</div><div class='add'>+	if (ret == 0) {</div><div class='add'>+		ret = mnt_want_write(cache-&gt;mnt);</div><div class='add'>+		if (ret == 0) {</div><div class='add'>+			ret = vfs_removexattr(&amp;nop_mnt_idmap, dentry,</div><div class='add'>+					      cachefiles_xattr_cache);</div><div class='add'>+			mnt_drop_write(cache-&gt;mnt);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		trace_cachefiles_vfs_error(object, d_inode(dentry), ret,</div><div class='add'>+					   cachefiles_trace_remxattr_error);</div><div class='add'>+		if (ret == -ENOENT || ret == -ENODATA)</div><div class='add'>+			ret = 0;</div><div class='add'>+		else if (ret != -ENOMEM)</div><div class='add'>+			cachefiles_io_error(cache,</div><div class='add'>+					    "Can't remove xattr from %lu"</div><div class='add'>+					    " (error %d)",</div><div class='add'>+					    d_backing_inode(dentry)-&gt;i_ino, -ret);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	_leave(" = %d", ret);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * check the consistency between the backing cache and the FS-Cache cookie</div><div class='add'>+ * Stick a marker on the cache object to indicate that it's dirty.</div><div class='ctx'>  */</div><div class='del'>-int cachefiles_check_auxdata(struct cachefiles_object *object)</div><div class='add'>+void cachefiles_prepare_to_write(struct fscache_cookie *cookie)</div><div class='ctx'> {</div><div class='del'>-	struct cachefiles_xattr *auxbuf;</div><div class='del'>-	enum fscache_checkaux validity;</div><div class='del'>-	struct dentry *dentry = object-&gt;dentry;</div><div class='del'>-	ssize_t xlen;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ASSERT(dentry);</div><div class='del'>-	ASSERT(d_backing_inode(dentry));</div><div class='del'>-	ASSERT(object-&gt;fscache.cookie-&gt;def-&gt;check_aux);</div><div class='add'>+	const struct cred *saved_cred;</div><div class='add'>+	struct cachefiles_object *object = cookie-&gt;cache_priv;</div><div class='add'>+	struct cachefiles_cache *cache = object-&gt;volume-&gt;cache;</div><div class='ctx'> </div><div class='del'>-	auxbuf = kmalloc(sizeof(struct cachefiles_xattr) + 512, GFP_KERNEL);</div><div class='del'>-	if (!auxbuf)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	_enter("c=%08x", object-&gt;cookie-&gt;debug_id);</div><div class='ctx'> </div><div class='del'>-	xlen = vfs_getxattr(&amp;init_user_ns, dentry, cachefiles_xattr_cache,</div><div class='del'>-			    &amp;auxbuf-&gt;type, 512 + 1);</div><div class='del'>-	ret = -ESTALE;</div><div class='del'>-	if (xlen &lt; 1 ||</div><div class='del'>-	    auxbuf-&gt;type != object-&gt;fscache.cookie-&gt;def-&gt;type)</div><div class='del'>-		goto error;</div><div class='del'>-</div><div class='del'>-	xlen--;</div><div class='del'>-	validity = fscache_check_aux(&amp;object-&gt;fscache, &amp;auxbuf-&gt;data, xlen,</div><div class='del'>-				     i_size_read(d_backing_inode(dentry)));</div><div class='del'>-	if (validity != FSCACHE_CHECKAUX_OKAY)</div><div class='del'>-		goto error;</div><div class='del'>-</div><div class='del'>-	ret = 0;</div><div class='del'>-error:</div><div class='del'>-	kfree(auxbuf);</div><div class='del'>-	return ret;</div><div class='add'>+	if (!test_bit(CACHEFILES_OBJECT_USING_TMPFILE, &amp;object-&gt;flags)) {</div><div class='add'>+		cachefiles_begin_secure(cache, &amp;saved_cred);</div><div class='add'>+		cachefiles_set_object_xattr(object);</div><div class='add'>+		cachefiles_end_secure(cache, saved_cred);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * check the state xattr on a cache file</div><div class='del'>- * - return -ESTALE if the object should be deleted</div><div class='add'>+ * Set the state xattr on a volume directory.</div><div class='ctx'>  */</div><div class='del'>-int cachefiles_check_object_xattr(struct cachefiles_object *object,</div><div class='del'>-				  struct cachefiles_xattr *auxdata)</div><div class='add'>+bool cachefiles_set_volume_xattr(struct cachefiles_volume *volume)</div><div class='ctx'> {</div><div class='del'>-	struct cachefiles_xattr *auxbuf;</div><div class='del'>-	struct dentry *dentry = object-&gt;dentry;</div><div class='add'>+	struct cachefiles_vol_xattr *buf;</div><div class='add'>+	unsigned int len = volume-&gt;vcookie-&gt;coherency_len;</div><div class='add'>+	const void *p = volume-&gt;vcookie-&gt;coherency;</div><div class='add'>+	struct dentry *dentry = volume-&gt;dentry;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	_enter("%p,#%d", object, auxdata-&gt;len);</div><div class='add'>+	_enter("%x,#%d", volume-&gt;vcookie-&gt;debug_id, len);</div><div class='ctx'> </div><div class='del'>-	ASSERT(dentry);</div><div class='del'>-	ASSERT(d_backing_inode(dentry));</div><div class='add'>+	len += sizeof(*buf);</div><div class='add'>+	buf = kmalloc(len, GFP_KERNEL);</div><div class='add'>+	if (!buf)</div><div class='add'>+		return false;</div><div class='add'>+	buf-&gt;reserved = cpu_to_be32(0);</div><div class='add'>+	memcpy(buf-&gt;data, p, volume-&gt;vcookie-&gt;coherency_len);</div><div class='ctx'> </div><div class='del'>-	auxbuf = kmalloc(sizeof(struct cachefiles_xattr) + 512, cachefiles_gfp);</div><div class='del'>-	if (!auxbuf) {</div><div class='del'>-		_leave(" = -ENOMEM");</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	ret = cachefiles_inject_write_error();</div><div class='add'>+	if (ret == 0) {</div><div class='add'>+		ret = mnt_want_write(volume-&gt;cache-&gt;mnt);</div><div class='add'>+		if (ret == 0) {</div><div class='add'>+			ret = vfs_setxattr(&amp;nop_mnt_idmap, dentry,</div><div class='add'>+					   cachefiles_xattr_cache,</div><div class='add'>+					   buf, len, 0);</div><div class='add'>+			mnt_drop_write(volume-&gt;cache-&gt;mnt);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	/* read the current type label */</div><div class='del'>-	ret = vfs_getxattr(&amp;init_user_ns, dentry, cachefiles_xattr_cache,</div><div class='del'>-			   &amp;auxbuf-&gt;type, 512 + 1);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='del'>-		if (ret == -ENODATA)</div><div class='del'>-			goto stale; /* no attribute - power went off</div><div class='del'>-				     * mid-cull? */</div><div class='del'>-</div><div class='del'>-		if (ret == -ERANGE)</div><div class='del'>-			goto bad_type_length;</div><div class='del'>-</div><div class='del'>-		cachefiles_io_error_obj(object,</div><div class='del'>-					"Can't read xattr on %lu (err %d)",</div><div class='del'>-					d_backing_inode(dentry)-&gt;i_ino, -ret);</div><div class='del'>-		goto error;</div><div class='add'>+		trace_cachefiles_vfs_error(NULL, d_inode(dentry), ret,</div><div class='add'>+					   cachefiles_trace_setxattr_error);</div><div class='add'>+		trace_cachefiles_vol_coherency(volume, d_inode(dentry)-&gt;i_ino,</div><div class='add'>+					       cachefiles_coherency_vol_set_fail);</div><div class='add'>+		if (ret != -ENOMEM)</div><div class='add'>+			cachefiles_io_error(</div><div class='add'>+				volume-&gt;cache, "Failed to set xattr with error %d", ret);</div><div class='add'>+	} else {</div><div class='add'>+		trace_cachefiles_vol_coherency(volume, d_inode(dentry)-&gt;i_ino,</div><div class='add'>+					       cachefiles_coherency_vol_set_ok);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* check the on-disk object */</div><div class='del'>-	if (ret &lt; 1)</div><div class='del'>-		goto bad_type_length;</div><div class='del'>-</div><div class='del'>-	if (auxbuf-&gt;type != auxdata-&gt;type)</div><div class='del'>-		goto stale;</div><div class='del'>-</div><div class='del'>-	auxbuf-&gt;len = ret;</div><div class='del'>-</div><div class='del'>-	/* consult the netfs */</div><div class='del'>-	if (object-&gt;fscache.cookie-&gt;def-&gt;check_aux) {</div><div class='del'>-		enum fscache_checkaux result;</div><div class='del'>-		unsigned int dlen;</div><div class='del'>-</div><div class='del'>-		dlen = auxbuf-&gt;len - 1;</div><div class='del'>-</div><div class='del'>-		_debug("checkaux %s #%u",</div><div class='del'>-		       object-&gt;fscache.cookie-&gt;def-&gt;name, dlen);</div><div class='del'>-</div><div class='del'>-		result = fscache_check_aux(&amp;object-&gt;fscache,</div><div class='del'>-					   &amp;auxbuf-&gt;data, dlen,</div><div class='del'>-					   i_size_read(d_backing_inode(dentry)));</div><div class='del'>-</div><div class='del'>-		switch (result) {</div><div class='del'>-			/* entry okay as is */</div><div class='del'>-		case FSCACHE_CHECKAUX_OKAY:</div><div class='del'>-			goto okay;</div><div class='del'>-</div><div class='del'>-			/* entry requires update */</div><div class='del'>-		case FSCACHE_CHECKAUX_NEEDS_UPDATE:</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-			/* entry requires deletion */</div><div class='del'>-		case FSCACHE_CHECKAUX_OBSOLETE:</div><div class='del'>-			goto stale;</div><div class='del'>-</div><div class='del'>-		default:</div><div class='del'>-			BUG();</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/* update the current label */</div><div class='del'>-		ret = vfs_setxattr(&amp;init_user_ns, dentry,</div><div class='del'>-				   cachefiles_xattr_cache, &amp;auxdata-&gt;type,</div><div class='del'>-				   auxdata-&gt;len, XATTR_REPLACE);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			cachefiles_io_error_obj(object,</div><div class='del'>-						"Can't update xattr on %lu"</div><div class='del'>-						" (error %d)",</div><div class='del'>-						d_backing_inode(dentry)-&gt;i_ino, -ret);</div><div class='del'>-			goto error;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-okay:</div><div class='del'>-	ret = 0;</div><div class='del'>-</div><div class='del'>-error:</div><div class='del'>-	kfree(auxbuf);</div><div class='add'>+	kfree(buf);</div><div class='ctx'> 	_leave(" = %d", ret);</div><div class='del'>-	return ret;</div><div class='del'>-</div><div class='del'>-bad_type_length:</div><div class='del'>-	pr_err("Cache object %lu xattr length incorrect\n",</div><div class='del'>-	       d_backing_inode(dentry)-&gt;i_ino);</div><div class='del'>-	ret = -EIO;</div><div class='del'>-	goto error;</div><div class='del'>-</div><div class='del'>-stale:</div><div class='del'>-	ret = -ESTALE;</div><div class='del'>-	goto error;</div><div class='add'>+	return ret == 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * remove the object's xattr to mark it stale</div><div class='add'>+ * Check the consistency between the backing cache and the volume cookie.</div><div class='ctx'>  */</div><div class='del'>-int cachefiles_remove_object_xattr(struct cachefiles_cache *cache,</div><div class='del'>-				   struct dentry *dentry)</div><div class='add'>+int cachefiles_check_volume_xattr(struct cachefiles_volume *volume)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='add'>+	struct cachefiles_vol_xattr *buf;</div><div class='add'>+	struct dentry *dentry = volume-&gt;dentry;</div><div class='add'>+	unsigned int len = volume-&gt;vcookie-&gt;coherency_len;</div><div class='add'>+	const void *p = volume-&gt;vcookie-&gt;coherency;</div><div class='add'>+	enum cachefiles_coherency_trace why;</div><div class='add'>+	ssize_t xlen;</div><div class='add'>+	int ret = -ESTALE;</div><div class='ctx'> </div><div class='del'>-	ret = vfs_removexattr(&amp;init_user_ns, dentry, cachefiles_xattr_cache);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		if (ret == -ENOENT || ret == -ENODATA)</div><div class='del'>-			ret = 0;</div><div class='del'>-		else if (ret != -ENOMEM)</div><div class='del'>-			cachefiles_io_error(cache,</div><div class='del'>-					    "Can't remove xattr from %lu"</div><div class='del'>-					    " (error %d)",</div><div class='del'>-					    d_backing_inode(dentry)-&gt;i_ino, -ret);</div><div class='add'>+	_enter("");</div><div class='add'>+</div><div class='add'>+	len += sizeof(*buf);</div><div class='add'>+	buf = kmalloc(len, GFP_KERNEL);</div><div class='add'>+	if (!buf)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	xlen = cachefiles_inject_read_error();</div><div class='add'>+	if (xlen == 0)</div><div class='add'>+		xlen = vfs_getxattr(&amp;nop_mnt_idmap, dentry, cachefiles_xattr_cache, buf, len);</div><div class='add'>+	if (xlen != len) {</div><div class='add'>+		if (xlen &lt; 0) {</div><div class='add'>+			ret = xlen;</div><div class='add'>+			trace_cachefiles_vfs_error(NULL, d_inode(dentry), xlen,</div><div class='add'>+						   cachefiles_trace_getxattr_error);</div><div class='add'>+			if (xlen == -EIO)</div><div class='add'>+				cachefiles_io_error(</div><div class='add'>+					volume-&gt;cache,</div><div class='add'>+					"Failed to read xattr with error %zd", xlen);</div><div class='add'>+		}</div><div class='add'>+		why = cachefiles_coherency_vol_check_xattr;</div><div class='add'>+	} else if (buf-&gt;reserved != cpu_to_be32(0)) {</div><div class='add'>+		why = cachefiles_coherency_vol_check_resv;</div><div class='add'>+	} else if (memcmp(buf-&gt;data, p, len - sizeof(*buf)) != 0) {</div><div class='add'>+		why = cachefiles_coherency_vol_check_cmp;</div><div class='add'>+	} else {</div><div class='add'>+		why = cachefiles_coherency_vol_check_ok;</div><div class='add'>+		ret = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	trace_cachefiles_vol_coherency(volume, d_inode(dentry)-&gt;i_ino, why);</div><div class='add'>+	kfree(buf);</div><div class='ctx'> 	_leave(" = %d", ret);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/ceph/Kconfig b/fs/ceph/Kconfig<br/>index 94df854147d3..3e7def3d31c1 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ceph/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/Kconfig</a></div><div class='hunk'>@@ -3,10 +3,11 @@ config CEPH_FS</div><div class='ctx'> 	tristate "Ceph distributed file system"</div><div class='ctx'> 	depends on INET</div><div class='ctx'> 	select CEPH_LIB</div><div class='del'>-	select LIBCRC32C</div><div class='add'>+	select CRC32</div><div class='ctx'> 	select CRYPTO_AES</div><div class='ctx'> 	select CRYPTO</div><div class='ctx'> 	select NETFS_SUPPORT</div><div class='add'>+	select FS_ENCRYPTION_ALGS if FS_ENCRYPTION</div><div class='ctx'> 	default n</div><div class='ctx'> 	help</div><div class='ctx'> 	  Choose Y or M here to include support for mounting the</div><div class='head'>diff --git a/fs/ceph/Makefile b/fs/ceph/Makefile<br/>index 50c635dc7f71..1f77ca04c426 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ceph/Makefile?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/Makefile</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/Makefile?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/Makefile</a></div><div class='hunk'>@@ -12,3 +12,4 @@ ceph-y := super.o inode.o dir.o file.o locks.o addr.o ioctl.o \</div><div class='ctx'> </div><div class='ctx'> ceph-$(CONFIG_CEPH_FSCACHE) += cache.o</div><div class='ctx'> ceph-$(CONFIG_CEPH_FS_POSIX_ACL) += acl.o</div><div class='add'>+ceph-$(CONFIG_FS_ENCRYPTION) += crypto.o</div><div class='head'>diff --git a/fs/ceph/acl.c b/fs/ceph/acl.c<br/>index f4fc8e0b847c..1564eacc253d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ceph/acl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/acl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/acl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/acl.c</a></div><div class='hunk'>@@ -15,6 +15,7 @@</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "super.h"</div><div class='add'>+#include "mds_client.h"</div><div class='ctx'> </div><div class='ctx'> static inline void ceph_set_cached_acl(struct inode *inode,</div><div class='ctx'> 					int type, struct posix_acl *acl)</div><div class='hunk'>@@ -31,6 +32,7 @@ static inline void ceph_set_cached_acl(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> struct posix_acl *ceph_get_acl(struct inode *inode, int type, bool rcu)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	int size;</div><div class='ctx'> 	unsigned int retry_cnt = 0;</div><div class='ctx'> 	const char *name;</div><div class='hunk'>@@ -72,8 +74,8 @@ retry:</div><div class='ctx'> 	} else if (size == -ENODATA || size == 0) {</div><div class='ctx'> 		acl = NULL;</div><div class='ctx'> 	} else {</div><div class='del'>-		pr_err_ratelimited("get acl %llx.%llx failed, err=%d\n",</div><div class='del'>-				   ceph_vinop(inode), size);</div><div class='add'>+		pr_err_ratelimited_client(cl, "%llx.%llx failed, err=%d\n",</div><div class='add'>+					  ceph_vinop(inode), size);</div><div class='ctx'> 		acl = ERR_PTR(-EIO);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -85,14 +87,15 @@ retry:</div><div class='ctx'> 	return acl;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int ceph_set_acl(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='add'>+int ceph_set_acl(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		 struct posix_acl *acl, int type)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0, size = 0;</div><div class='ctx'> 	const char *name = NULL;</div><div class='ctx'> 	char *value = NULL;</div><div class='ctx'> 	struct iattr newattrs;</div><div class='del'>-	struct timespec64 old_ctime = inode-&gt;i_ctime;</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='add'>+	struct timespec64 old_ctime = inode_get_ctime(inode);</div><div class='ctx'> 	umode_t new_mode = inode-&gt;i_mode, old_mode = inode-&gt;i_mode;</div><div class='ctx'> </div><div class='ctx'> 	if (ceph_snap(inode) != CEPH_NOSNAP) {</div><div class='hunk'>@@ -104,7 +107,7 @@ int ceph_set_acl(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='ctx'> 	case ACL_TYPE_ACCESS:</div><div class='ctx'> 		name = XATTR_NAME_POSIX_ACL_ACCESS;</div><div class='ctx'> 		if (acl) {</div><div class='del'>-			ret = posix_acl_update_mode(&amp;init_user_ns, inode,</div><div class='add'>+			ret = posix_acl_update_mode(idmap, inode,</div><div class='ctx'> 						    &amp;new_mode, &amp;acl);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				goto out;</div><div class='hunk'>@@ -139,7 +142,7 @@ int ceph_set_acl(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='ctx'> 		newattrs.ia_ctime = current_time(inode);</div><div class='ctx'> 		newattrs.ia_mode = new_mode;</div><div class='ctx'> 		newattrs.ia_valid = ATTR_MODE | ATTR_CTIME;</div><div class='del'>-		ret = __ceph_setattr(inode, &amp;newattrs);</div><div class='add'>+		ret = __ceph_setattr(idmap, inode, &amp;newattrs, NULL);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto out_free;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -150,7 +153,7 @@ int ceph_set_acl(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='ctx'> 			newattrs.ia_ctime = old_ctime;</div><div class='ctx'> 			newattrs.ia_mode = old_mode;</div><div class='ctx'> 			newattrs.ia_valid = ATTR_MODE | ATTR_CTIME;</div><div class='del'>-			__ceph_setattr(inode, &amp;newattrs);</div><div class='add'>+			__ceph_setattr(idmap, inode, &amp;newattrs, NULL);</div><div class='ctx'> 		}</div><div class='ctx'> 		goto out_free;</div><div class='ctx'> 	}</div><div class='head'>diff --git a/fs/ceph/addr.c b/fs/ceph/addr.c<br/>index 04bbe853bcb1..63b75d214210 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ceph/addr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/addr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/addr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/addr.c</a></div><div class='hunk'>@@ -4,8 +4,8 @@</div><div class='ctx'> #include &lt;linux/backing-dev.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/mm.h&gt;</div><div class='add'>+#include &lt;linux/swap.h&gt;</div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='del'>-#include &lt;linux/writeback.h&gt;	/* generic_writepages */</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/pagevec.h&gt;</div><div class='ctx'> #include &lt;linux/task_io_accounting_ops.h&gt;</div><div class='hunk'>@@ -13,11 +13,13 @@</div><div class='ctx'> #include &lt;linux/iversion.h&gt;</div><div class='ctx'> #include &lt;linux/ktime.h&gt;</div><div class='ctx'> #include &lt;linux/netfs.h&gt;</div><div class='add'>+#include &lt;trace/events/netfs.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "super.h"</div><div class='ctx'> #include "mds_client.h"</div><div class='ctx'> #include "cache.h"</div><div class='ctx'> #include "metric.h"</div><div class='add'>+#include "crypto.h"</div><div class='ctx'> #include &lt;linux/ceph/osd_client.h&gt;</div><div class='ctx'> #include &lt;linux/ceph/striper.h&gt;</div><div class='ctx'> </div><div class='hunk'>@@ -63,7 +65,7 @@</div><div class='ctx'> 	 (CONGESTION_ON_THRESH(congestion_kb) &gt;&gt; 2))</div><div class='ctx'> </div><div class='ctx'> static int ceph_netfs_check_write_begin(struct file *file, loff_t pos, unsigned int len,</div><div class='del'>-					struct folio *folio, void **_fsdata);</div><div class='add'>+					struct folio **foliop, void **_fsdata);</div><div class='ctx'> </div><div class='ctx'> static inline struct ceph_snap_context *page_snap_context(struct page *page)</div><div class='ctx'> {</div><div class='hunk'>@@ -76,26 +78,27 @@ static inline struct ceph_snap_context *page_snap_context(struct page *page)</div><div class='ctx'>  * Dirty a page.  Optimistically adjust accounting, on the assumption</div><div class='ctx'>  * that we won't race with invalidate.  If we do, readjust.</div><div class='ctx'>  */</div><div class='del'>-static int ceph_set_page_dirty(struct page *page)</div><div class='add'>+static bool ceph_dirty_folio(struct address_space *mapping, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *mapping = page-&gt;mapping;</div><div class='del'>-	struct inode *inode;</div><div class='add'>+	struct inode *inode = mapping-&gt;host;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_sb_to_mdsc(inode-&gt;i_sb);</div><div class='ctx'> 	struct ceph_inode_info *ci;</div><div class='ctx'> 	struct ceph_snap_context *snapc;</div><div class='ctx'> </div><div class='del'>-	if (PageDirty(page)) {</div><div class='del'>-		dout("%p set_page_dirty %p idx %lu -- already dirty\n",</div><div class='del'>-		     mapping-&gt;host, page, page-&gt;index);</div><div class='del'>-		BUG_ON(!PagePrivate(page));</div><div class='del'>-		return 0;</div><div class='add'>+	if (folio_test_dirty(folio)) {</div><div class='add'>+		doutc(cl, "%llx.%llx %p idx %lu -- already dirty\n",</div><div class='add'>+		      ceph_vinop(inode), folio, folio-&gt;index);</div><div class='add'>+		VM_BUG_ON_FOLIO(!folio_test_private(folio), folio);</div><div class='add'>+		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	inode = mapping-&gt;host;</div><div class='add'>+	atomic64_inc(&amp;mdsc-&gt;dirty_folios);</div><div class='add'>+</div><div class='ctx'> 	ci = ceph_inode(inode);</div><div class='ctx'> </div><div class='ctx'> 	/* dirty the head */</div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-	BUG_ON(ci-&gt;i_wr_ref == 0); // caller should hold Fw reference</div><div class='ctx'> 	if (__ceph_have_pending_cap_snap(ci)) {</div><div class='ctx'> 		struct ceph_cap_snap *capsnap =</div><div class='ctx'> 				list_last_entry(&amp;ci-&gt;i_cap_snaps,</div><div class='hunk'>@@ -111,272 +114,467 @@ static int ceph_set_page_dirty(struct page *page)</div><div class='ctx'> 	if (ci-&gt;i_wrbuffer_ref == 0)</div><div class='ctx'> 		ihold(inode);</div><div class='ctx'> 	++ci-&gt;i_wrbuffer_ref;</div><div class='del'>-	dout("%p set_page_dirty %p idx %lu head %d/%d -&gt; %d/%d "</div><div class='del'>-	     "snapc %p seq %lld (%d snaps)\n",</div><div class='del'>-	     mapping-&gt;host, page, page-&gt;index,</div><div class='del'>-	     ci-&gt;i_wrbuffer_ref-1, ci-&gt;i_wrbuffer_ref_head-1,</div><div class='del'>-	     ci-&gt;i_wrbuffer_ref, ci-&gt;i_wrbuffer_ref_head,</div><div class='del'>-	     snapc, snapc-&gt;seq, snapc-&gt;num_snaps);</div><div class='add'>+	doutc(cl, "%llx.%llx %p idx %lu head %d/%d -&gt; %d/%d "</div><div class='add'>+	      "snapc %p seq %lld (%d snaps)\n",</div><div class='add'>+	      ceph_vinop(inode), folio, folio-&gt;index,</div><div class='add'>+	      ci-&gt;i_wrbuffer_ref-1, ci-&gt;i_wrbuffer_ref_head-1,</div><div class='add'>+	      ci-&gt;i_wrbuffer_ref, ci-&gt;i_wrbuffer_ref_head,</div><div class='add'>+	      snapc, snapc-&gt;seq, snapc-&gt;num_snaps);</div><div class='ctx'> 	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Reference snap context in page-&gt;private.  Also set</div><div class='del'>-	 * PagePrivate so that we get invalidatepage callback.</div><div class='add'>+	 * Reference snap context in folio-&gt;private.  Also set</div><div class='add'>+	 * PagePrivate so that we get invalidate_folio callback.</div><div class='ctx'> 	 */</div><div class='del'>-	BUG_ON(PagePrivate(page));</div><div class='del'>-	attach_page_private(page, snapc);</div><div class='add'>+	VM_WARN_ON_FOLIO(folio-&gt;private, folio);</div><div class='add'>+	folio_attach_private(folio, snapc);</div><div class='ctx'> </div><div class='del'>-	return __set_page_dirty_nobuffers(page);</div><div class='add'>+	return ceph_fscache_dirty_folio(mapping, folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * If we are truncating the full page (i.e. offset == 0), adjust the</div><div class='del'>- * dirty page counters appropriately.  Only called if there is private</div><div class='del'>- * data on the page.</div><div class='add'>+ * If we are truncating the full folio (i.e. offset == 0), adjust the</div><div class='add'>+ * dirty folio counters appropriately.  Only called if there is private</div><div class='add'>+ * data on the folio.</div><div class='ctx'>  */</div><div class='del'>-static void ceph_invalidatepage(struct page *page, unsigned int offset,</div><div class='del'>-				unsigned int length)</div><div class='add'>+static void ceph_invalidate_folio(struct folio *folio, size_t offset,</div><div class='add'>+				size_t length)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	struct ceph_inode_info *ci;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='add'>+	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	struct ceph_snap_context *snapc;</div><div class='ctx'> </div><div class='del'>-	wait_on_page_fscache(page);</div><div class='ctx'> </div><div class='del'>-	inode = page-&gt;mapping-&gt;host;</div><div class='del'>-	ci = ceph_inode(inode);</div><div class='del'>-</div><div class='del'>-	if (offset != 0 || length != thp_size(page)) {</div><div class='del'>-		dout("%p invalidatepage %p idx %lu partial dirty page %u~%u\n",</div><div class='del'>-		     inode, page, page-&gt;index, offset, length);</div><div class='add'>+	if (offset != 0 || length != folio_size(folio)) {</div><div class='add'>+		doutc(cl, "%llx.%llx idx %lu partial dirty page %zu~%zu\n",</div><div class='add'>+		      ceph_vinop(inode), folio-&gt;index, offset, length);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	WARN_ON(!PageLocked(page));</div><div class='del'>-	if (!PagePrivate(page))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	dout("%p invalidatepage %p idx %lu full dirty page\n",</div><div class='del'>-	     inode, page, page-&gt;index);</div><div class='add'>+	WARN_ON(!folio_test_locked(folio));</div><div class='add'>+	if (folio_test_private(folio)) {</div><div class='add'>+		doutc(cl, "%llx.%llx idx %lu full dirty page\n",</div><div class='add'>+		      ceph_vinop(inode), folio-&gt;index);</div><div class='ctx'> </div><div class='del'>-	snapc = detach_page_private(page);</div><div class='del'>-	ceph_put_wrbuffer_cap_refs(ci, 1, snapc);</div><div class='del'>-	ceph_put_snap_context(snapc);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int ceph_releasepage(struct page *page, gfp_t gfp)</div><div class='del'>-{</div><div class='del'>-	dout("%p releasepage %p idx %lu (%sdirty)\n", page-&gt;mapping-&gt;host,</div><div class='del'>-	     page, page-&gt;index, PageDirty(page) ? "" : "not ");</div><div class='del'>-</div><div class='del'>-	if (PageFsCache(page)) {</div><div class='del'>-		if (!(gfp &amp; __GFP_DIRECT_RECLAIM) || !(gfp &amp; __GFP_FS))</div><div class='del'>-			return 0;</div><div class='del'>-		wait_on_page_fscache(page);</div><div class='add'>+		snapc = folio_detach_private(folio);</div><div class='add'>+		ceph_put_wrbuffer_cap_refs(ci, 1, snapc);</div><div class='add'>+		ceph_put_snap_context(snapc);</div><div class='ctx'> 	}</div><div class='del'>-	return !PagePrivate(page);</div><div class='add'>+</div><div class='add'>+	netfs_invalidate_folio(folio, offset, length);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void ceph_netfs_expand_readahead(struct netfs_read_request *rreq)</div><div class='add'>+static void ceph_netfs_expand_readahead(struct netfs_io_request *rreq)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = rreq-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *inode = rreq-&gt;inode;</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	struct ceph_file_layout *lo = &amp;ci-&gt;i_layout;</div><div class='add'>+	unsigned long max_pages = inode-&gt;i_sb-&gt;s_bdi-&gt;ra_pages;</div><div class='add'>+	loff_t end = rreq-&gt;start + rreq-&gt;len, new_end;</div><div class='add'>+	struct ceph_netfs_request_data *priv = rreq-&gt;netfs_priv;</div><div class='add'>+	unsigned long max_len;</div><div class='ctx'> 	u32 blockoff;</div><div class='del'>-	u64 blockno;</div><div class='ctx'> </div><div class='del'>-	/* Expand the start downward */</div><div class='del'>-	blockno = div_u64_rem(rreq-&gt;start, lo-&gt;stripe_unit, &amp;blockoff);</div><div class='del'>-	rreq-&gt;start = blockno * lo-&gt;stripe_unit;</div><div class='del'>-	rreq-&gt;len += blockoff;</div><div class='add'>+	if (priv) {</div><div class='add'>+		/* Readahead is disabled by posix_fadvise POSIX_FADV_RANDOM */</div><div class='add'>+		if (priv-&gt;file_ra_disabled)</div><div class='add'>+			max_pages = 0;</div><div class='add'>+		else</div><div class='add'>+			max_pages = priv-&gt;file_ra_pages;</div><div class='add'>+</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	/* Now, round up the length to the next block */</div><div class='del'>-	rreq-&gt;len = roundup(rreq-&gt;len, lo-&gt;stripe_unit);</div><div class='del'>-}</div><div class='add'>+	/* Readahead is disabled */</div><div class='add'>+	if (!max_pages)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-static bool ceph_netfs_clamp_length(struct netfs_read_subrequest *subreq)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = subreq-&gt;rreq-&gt;mapping-&gt;host;</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_inode_to_client(inode);</div><div class='del'>-	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	u64 objno, objoff;</div><div class='del'>-	u32 xlen;</div><div class='add'>+	max_len = max_pages &lt;&lt; PAGE_SHIFT;</div><div class='ctx'> </div><div class='del'>-	/* Truncate the extent at the end of the current block */</div><div class='del'>-	ceph_calc_file_object_mapping(&amp;ci-&gt;i_layout, subreq-&gt;start, subreq-&gt;len,</div><div class='del'>-				      &amp;objno, &amp;objoff, &amp;xlen);</div><div class='del'>-	subreq-&gt;len = min(xlen, fsc-&gt;mount_options-&gt;rsize);</div><div class='del'>-	return true;</div><div class='add'>+	/*</div><div class='add'>+	 * Try to expand the length forward by rounding up it to the next</div><div class='add'>+	 * block, but do not exceed the file size, unless the original</div><div class='add'>+	 * request already exceeds it.</div><div class='add'>+	 */</div><div class='add'>+	new_end = umin(round_up(end, lo-&gt;stripe_unit), rreq-&gt;i_size);</div><div class='add'>+	if (new_end &gt; end &amp;&amp; new_end &lt;= rreq-&gt;start + max_len)</div><div class='add'>+		rreq-&gt;len = new_end - rreq-&gt;start;</div><div class='add'>+</div><div class='add'>+	/* Try to expand the start downward */</div><div class='add'>+	div_u64_rem(rreq-&gt;start, lo-&gt;stripe_unit, &amp;blockoff);</div><div class='add'>+	if (rreq-&gt;len + blockoff &lt;= max_len) {</div><div class='add'>+		rreq-&gt;start -= blockoff;</div><div class='add'>+		rreq-&gt;len += blockoff;</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void finish_netfs_read(struct ceph_osd_request *req)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_inode_to_client(req-&gt;r_inode);</div><div class='add'>+	struct inode *inode = req-&gt;r_inode;</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='ctx'> 	struct ceph_osd_data *osd_data = osd_req_op_extent_osd_data(req, 0);</div><div class='del'>-	struct netfs_read_subrequest *subreq = req-&gt;r_priv;</div><div class='del'>-	int num_pages;</div><div class='add'>+	struct netfs_io_subrequest *subreq = req-&gt;r_priv;</div><div class='add'>+	struct ceph_osd_req_op *op = &amp;req-&gt;r_ops[0];</div><div class='ctx'> 	int err = req-&gt;r_result;</div><div class='add'>+	bool sparse = (op-&gt;op == CEPH_OSD_OP_SPARSE_READ);</div><div class='ctx'> </div><div class='ctx'> 	ceph_update_read_metrics(&amp;fsc-&gt;mdsc-&gt;metric, req-&gt;r_start_latency,</div><div class='ctx'> 				 req-&gt;r_end_latency, osd_data-&gt;length, err);</div><div class='ctx'> </div><div class='del'>-	dout("%s: result %d subreq-&gt;len=%zu i_size=%lld\n", __func__, req-&gt;r_result,</div><div class='del'>-	     subreq-&gt;len, i_size_read(req-&gt;r_inode));</div><div class='add'>+	doutc(cl, "result %d subreq-&gt;len=%zu i_size=%lld\n", req-&gt;r_result,</div><div class='add'>+	      subreq-&gt;len, i_size_read(req-&gt;r_inode));</div><div class='ctx'> </div><div class='ctx'> 	/* no object means success but no data */</div><div class='del'>-	if (err == -ENOENT)</div><div class='add'>+	if (err == -ENOENT) {</div><div class='add'>+		__set_bit(NETFS_SREQ_CLEAR_TAIL, &amp;subreq-&gt;flags);</div><div class='add'>+		__set_bit(NETFS_SREQ_MADE_PROGRESS, &amp;subreq-&gt;flags);</div><div class='ctx'> 		err = 0;</div><div class='del'>-	else if (err == -EBLOCKLISTED)</div><div class='add'>+	} else if (err == -EBLOCKLISTED) {</div><div class='ctx'> 		fsc-&gt;blocklisted = true;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (err &gt;= 0 &amp;&amp; err &lt; subreq-&gt;len)</div><div class='add'>+	if (err &gt;= 0) {</div><div class='add'>+		if (sparse &amp;&amp; err &gt; 0)</div><div class='add'>+			err = ceph_sparse_ext_map_end(op);</div><div class='add'>+		if (err &lt; subreq-&gt;len &amp;&amp;</div><div class='add'>+		    subreq-&gt;rreq-&gt;origin != NETFS_UNBUFFERED_READ &amp;&amp;</div><div class='add'>+		    subreq-&gt;rreq-&gt;origin != NETFS_DIO_READ)</div><div class='add'>+			__set_bit(NETFS_SREQ_CLEAR_TAIL, &amp;subreq-&gt;flags);</div><div class='add'>+		if (IS_ENCRYPTED(inode) &amp;&amp; err &gt; 0) {</div><div class='add'>+			err = ceph_fscrypt_decrypt_extents(inode,</div><div class='add'>+					osd_data-&gt;pages, subreq-&gt;start,</div><div class='add'>+					op-&gt;extent.sparse_ext,</div><div class='add'>+					op-&gt;extent.sparse_ext_cnt);</div><div class='add'>+			if (err &gt; subreq-&gt;len)</div><div class='add'>+				err = subreq-&gt;len;</div><div class='add'>+		}</div><div class='add'>+		if (err &gt; 0)</div><div class='add'>+			__set_bit(NETFS_SREQ_CLEAR_TAIL, &amp;subreq-&gt;flags);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (osd_data-&gt;type == CEPH_OSD_DATA_TYPE_PAGES) {</div><div class='add'>+		ceph_put_page_vector(osd_data-&gt;pages,</div><div class='add'>+				     calc_pages_for(osd_data-&gt;alignment,</div><div class='add'>+					osd_data-&gt;length), false);</div><div class='add'>+	}</div><div class='add'>+	if (err &gt; 0) {</div><div class='add'>+		subreq-&gt;transferred = err;</div><div class='add'>+		err = 0;</div><div class='add'>+	}</div><div class='add'>+	subreq-&gt;error = err;</div><div class='add'>+	trace_netfs_sreq(subreq, netfs_sreq_trace_io_progress);</div><div class='add'>+	netfs_read_subreq_terminated(subreq);</div><div class='add'>+	iput(req-&gt;r_inode);</div><div class='add'>+	ceph_dec_osd_stopping_blocker(fsc-&gt;mdsc);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool ceph_netfs_issue_op_inline(struct netfs_io_subrequest *subreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *rreq = subreq-&gt;rreq;</div><div class='add'>+	struct inode *inode = rreq-&gt;inode;</div><div class='add'>+	struct ceph_mds_reply_info_parsed *rinfo;</div><div class='add'>+	struct ceph_mds_reply_info_in *iinfo;</div><div class='add'>+	struct ceph_mds_request *req;</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_sb_to_mdsc(inode-&gt;i_sb);</div><div class='add'>+	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	ssize_t err = 0;</div><div class='add'>+	size_t len;</div><div class='add'>+	int mode;</div><div class='add'>+</div><div class='add'>+	if (rreq-&gt;origin != NETFS_UNBUFFERED_READ &amp;&amp;</div><div class='add'>+	    rreq-&gt;origin != NETFS_DIO_READ)</div><div class='ctx'> 		__set_bit(NETFS_SREQ_CLEAR_TAIL, &amp;subreq-&gt;flags);</div><div class='add'>+	__clear_bit(NETFS_SREQ_COPY_TO_CACHE, &amp;subreq-&gt;flags);</div><div class='ctx'> </div><div class='del'>-	netfs_subreq_terminated(subreq, err, true);</div><div class='add'>+	if (subreq-&gt;start &gt;= inode-&gt;i_size)</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='del'>-	num_pages = calc_pages_for(osd_data-&gt;alignment, osd_data-&gt;length);</div><div class='del'>-	ceph_put_page_vector(osd_data-&gt;pages, num_pages, false);</div><div class='del'>-	iput(req-&gt;r_inode);</div><div class='add'>+	/* We need to fetch the inline data. */</div><div class='add'>+	mode = ceph_try_to_choose_auth_mds(inode, CEPH_STAT_CAP_INLINE_DATA);</div><div class='add'>+	req = ceph_mdsc_create_request(mdsc, CEPH_MDS_OP_GETATTR, mode);</div><div class='add'>+	if (IS_ERR(req)) {</div><div class='add'>+		err = PTR_ERR(req);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	req-&gt;r_ino1 = ci-&gt;i_vino;</div><div class='add'>+	req-&gt;r_args.getattr.mask = cpu_to_le32(CEPH_STAT_CAP_INLINE_DATA);</div><div class='add'>+	req-&gt;r_num_caps = 2;</div><div class='add'>+</div><div class='add'>+	trace_netfs_sreq(subreq, netfs_sreq_trace_submit);</div><div class='add'>+	err = ceph_mdsc_do_request(mdsc, NULL, req);</div><div class='add'>+	if (err &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	rinfo = &amp;req-&gt;r_reply_info;</div><div class='add'>+	iinfo = &amp;rinfo-&gt;targeti;</div><div class='add'>+	if (iinfo-&gt;inline_version == CEPH_INLINE_NONE) {</div><div class='add'>+		/* The data got uninlined */</div><div class='add'>+		ceph_mdsc_put_request(req);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	len = min_t(size_t, iinfo-&gt;inline_len - subreq-&gt;start, subreq-&gt;len);</div><div class='add'>+	err = copy_to_iter(iinfo-&gt;inline_data + subreq-&gt;start, len, &amp;subreq-&gt;io_iter);</div><div class='add'>+	if (err == 0) {</div><div class='add'>+		err = -EFAULT;</div><div class='add'>+	} else {</div><div class='add'>+		subreq-&gt;transferred += err;</div><div class='add'>+		err = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ceph_mdsc_put_request(req);</div><div class='add'>+out:</div><div class='add'>+	subreq-&gt;error = err;</div><div class='add'>+	trace_netfs_sreq(subreq, netfs_sreq_trace_io_progress);</div><div class='add'>+	netfs_read_subreq_terminated(subreq);</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void ceph_netfs_issue_op(struct netfs_read_subrequest *subreq)</div><div class='add'>+static int ceph_netfs_prepare_read(struct netfs_io_subrequest *subreq)</div><div class='ctx'> {</div><div class='del'>-	struct netfs_read_request *rreq = subreq-&gt;rreq;</div><div class='del'>-	struct inode *inode = rreq-&gt;mapping-&gt;host;</div><div class='add'>+	struct netfs_io_request *rreq = subreq-&gt;rreq;</div><div class='add'>+	struct inode *inode = rreq-&gt;inode;</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_inode_to_client(inode);</div><div class='del'>-	struct ceph_osd_request *req;</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='add'>+	u64 objno, objoff;</div><div class='add'>+	u32 xlen;</div><div class='add'>+</div><div class='add'>+	/* Truncate the extent at the end of the current block */</div><div class='add'>+	ceph_calc_file_object_mapping(&amp;ci-&gt;i_layout, subreq-&gt;start, subreq-&gt;len,</div><div class='add'>+				      &amp;objno, &amp;objoff, &amp;xlen);</div><div class='add'>+	rreq-&gt;io_streams[0].sreq_max_len = umin(xlen, fsc-&gt;mount_options-&gt;rsize);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void ceph_netfs_issue_read(struct netfs_io_subrequest *subreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *rreq = subreq-&gt;rreq;</div><div class='add'>+	struct inode *inode = rreq-&gt;inode;</div><div class='add'>+	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='add'>+	struct ceph_osd_request *req = NULL;</div><div class='ctx'> 	struct ceph_vino vino = ceph_vino(inode);</div><div class='del'>-	struct iov_iter iter;</div><div class='del'>-	struct page **pages;</div><div class='del'>-	size_t page_off;</div><div class='del'>-	int err = 0;</div><div class='del'>-	u64 len = subreq-&gt;len;</div><div class='add'>+	int err;</div><div class='add'>+	u64 len;</div><div class='add'>+	bool sparse = IS_ENCRYPTED(inode) || ceph_test_mount_opt(fsc, SPARSEREAD);</div><div class='add'>+	u64 off = subreq-&gt;start;</div><div class='add'>+	int extent_cnt;</div><div class='ctx'> </div><div class='del'>-	req = ceph_osdc_new_request(&amp;fsc-&gt;client-&gt;osdc, &amp;ci-&gt;i_layout, vino, subreq-&gt;start, &amp;len,</div><div class='del'>-			0, 1, CEPH_OSD_OP_READ,</div><div class='del'>-			CEPH_OSD_FLAG_READ | fsc-&gt;client-&gt;osdc.client-&gt;options-&gt;read_from_replica,</div><div class='del'>-			NULL, ci-&gt;i_truncate_seq, ci-&gt;i_truncate_size, false);</div><div class='add'>+	if (ceph_inode_is_shutdown(inode)) {</div><div class='add'>+		err = -EIO;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (ceph_has_inline_data(ci) &amp;&amp; ceph_netfs_issue_op_inline(subreq))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	// TODO: This rounding here is slightly dodgy.  It *should* work, for</div><div class='add'>+	// now, as the cache only deals in blocks that are a multiple of</div><div class='add'>+	// PAGE_SIZE and fscrypt blocks are at most PAGE_SIZE.  What needs to</div><div class='add'>+	// happen is for the fscrypt driving to be moved into netfslib and the</div><div class='add'>+	// data in the cache also to be stored encrypted.</div><div class='add'>+	len = subreq-&gt;len;</div><div class='add'>+	ceph_fscrypt_adjust_off_and_len(inode, &amp;off, &amp;len);</div><div class='add'>+</div><div class='add'>+	req = ceph_osdc_new_request(&amp;fsc-&gt;client-&gt;osdc, &amp;ci-&gt;i_layout, vino,</div><div class='add'>+			off, &amp;len, 0, 1, sparse ? CEPH_OSD_OP_SPARSE_READ : CEPH_OSD_OP_READ,</div><div class='add'>+			CEPH_OSD_FLAG_READ, NULL, ci-&gt;i_truncate_seq,</div><div class='add'>+			ci-&gt;i_truncate_size, false);</div><div class='ctx'> 	if (IS_ERR(req)) {</div><div class='ctx'> 		err = PTR_ERR(req);</div><div class='ctx'> 		req = NULL;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("%s: pos=%llu orig_len=%zu len=%llu\n", __func__, subreq-&gt;start, subreq-&gt;len, len);</div><div class='del'>-	iov_iter_xarray(&amp;iter, READ, &amp;rreq-&gt;mapping-&gt;i_pages, subreq-&gt;start, len);</div><div class='del'>-	err = iov_iter_get_pages_alloc(&amp;iter, &amp;pages, len, &amp;page_off);</div><div class='del'>-	if (err &lt; 0) {</div><div class='del'>-		dout("%s: iov_ter_get_pages_alloc returned %d\n", __func__, err);</div><div class='del'>-		goto out;</div><div class='add'>+	if (sparse) {</div><div class='add'>+		extent_cnt = __ceph_sparse_read_ext_count(inode, len);</div><div class='add'>+		err = ceph_alloc_sparse_ext_map(&amp;req-&gt;r_ops[0], extent_cnt);</div><div class='add'>+		if (err)</div><div class='add'>+			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* should always give us a page-aligned read */</div><div class='del'>-	WARN_ON_ONCE(page_off);</div><div class='del'>-	len = err;</div><div class='add'>+	doutc(cl, "%llx.%llx pos=%llu orig_len=%zu len=%llu\n",</div><div class='add'>+	      ceph_vinop(inode), subreq-&gt;start, subreq-&gt;len, len);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * FIXME: For now, use CEPH_OSD_DATA_TYPE_PAGES instead of _ITER for</div><div class='add'>+	 * encrypted inodes. We'd need infrastructure that handles an iov_iter</div><div class='add'>+	 * instead of page arrays, and we don't have that as of yet. Once the</div><div class='add'>+	 * dust settles on the write helpers and encrypt/decrypt routines for</div><div class='add'>+	 * netfs, we should be able to rework this.</div><div class='add'>+	 */</div><div class='add'>+	if (IS_ENCRYPTED(inode)) {</div><div class='add'>+		struct page **pages;</div><div class='add'>+		size_t page_off;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * FIXME: io_iter.count needs to be corrected to aligned</div><div class='add'>+		 * length. Otherwise, iov_iter_get_pages_alloc2() operates</div><div class='add'>+		 * with the initial unaligned length value. As a result,</div><div class='add'>+		 * ceph_msg_data_cursor_init() triggers BUG_ON() in the case</div><div class='add'>+		 * if msg-&gt;sparse_read_total &gt; msg-&gt;data_length.</div><div class='add'>+		 */</div><div class='add'>+		subreq-&gt;io_iter.count = len;</div><div class='ctx'> </div><div class='del'>-	osd_req_op_extent_osd_data_pages(req, 0, pages, len, 0, false, false);</div><div class='add'>+		err = iov_iter_get_pages_alloc2(&amp;subreq-&gt;io_iter, &amp;pages, len, &amp;page_off);</div><div class='add'>+		if (err &lt; 0) {</div><div class='add'>+			doutc(cl, "%llx.%llx failed to allocate pages, %d\n",</div><div class='add'>+			      ceph_vinop(inode), err);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* should always give us a page-aligned read */</div><div class='add'>+		WARN_ON_ONCE(page_off);</div><div class='add'>+		len = err;</div><div class='add'>+		err = 0;</div><div class='add'>+</div><div class='add'>+		osd_req_op_extent_osd_data_pages(req, 0, pages, len, 0, false,</div><div class='add'>+						 false);</div><div class='add'>+	} else {</div><div class='add'>+		osd_req_op_extent_osd_iter(req, 0, &amp;subreq-&gt;io_iter);</div><div class='add'>+	}</div><div class='add'>+	if (!ceph_inc_osd_stopping_blocker(fsc-&gt;mdsc)) {</div><div class='add'>+		err = -EIO;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> 	req-&gt;r_callback = finish_netfs_read;</div><div class='ctx'> 	req-&gt;r_priv = subreq;</div><div class='ctx'> 	req-&gt;r_inode = inode;</div><div class='ctx'> 	ihold(inode);</div><div class='ctx'> </div><div class='del'>-	err = ceph_osdc_start_request(req-&gt;r_osdc, req, false);</div><div class='del'>-	if (err)</div><div class='del'>-		iput(inode);</div><div class='add'>+	trace_netfs_sreq(subreq, netfs_sreq_trace_submit);</div><div class='add'>+	ceph_osdc_start_request(req-&gt;r_osdc, req);</div><div class='ctx'> out:</div><div class='ctx'> 	ceph_osdc_put_request(req);</div><div class='del'>-	if (err)</div><div class='del'>-		netfs_subreq_terminated(subreq, err, false);</div><div class='del'>-	dout("%s: result %d\n", __func__, err);</div><div class='add'>+	if (err) {</div><div class='add'>+		subreq-&gt;error = err;</div><div class='add'>+		netfs_read_subreq_terminated(subreq);</div><div class='add'>+	}</div><div class='add'>+	doutc(cl, "%llx.%llx result %d\n", ceph_vinop(inode), err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void ceph_init_rreq(struct netfs_read_request *rreq, struct file *file)</div><div class='add'>+static int ceph_init_request(struct netfs_io_request *rreq, struct file *file)</div><div class='ctx'> {</div><div class='add'>+	struct inode *inode = rreq-&gt;inode;</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='add'>+	int got = 0, want = CEPH_CAP_FILE_CACHE;</div><div class='add'>+	struct ceph_netfs_request_data *priv;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	/* [DEPRECATED] Use PG_private_2 to mark folio being written to the cache. */</div><div class='add'>+	__set_bit(NETFS_RREQ_USE_PGPRIV2, &amp;rreq-&gt;flags);</div><div class='add'>+</div><div class='add'>+	if (rreq-&gt;origin != NETFS_READAHEAD)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	priv = kzalloc(sizeof(*priv), GFP_NOFS);</div><div class='add'>+	if (!priv)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	if (file) {</div><div class='add'>+		struct ceph_rw_context *rw_ctx;</div><div class='add'>+		struct ceph_file_info *fi = file-&gt;private_data;</div><div class='add'>+</div><div class='add'>+		priv-&gt;file_ra_pages = file-&gt;f_ra.ra_pages;</div><div class='add'>+		priv-&gt;file_ra_disabled = file-&gt;f_mode &amp; FMODE_RANDOM;</div><div class='add'>+</div><div class='add'>+		rw_ctx = ceph_find_rw_context(fi);</div><div class='add'>+		if (rw_ctx) {</div><div class='add'>+			rreq-&gt;netfs_priv = priv;</div><div class='add'>+			return 0;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * readahead callers do not necessarily hold Fcb caps</div><div class='add'>+	 * (e.g. fadvise, madvise).</div><div class='add'>+	 */</div><div class='add'>+	ret = ceph_try_get_caps(inode, CEPH_CAP_FILE_RD, want, true, &amp;got);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		doutc(cl, "%llx.%llx, error getting cap\n", ceph_vinop(inode));</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!(got &amp; want)) {</div><div class='add'>+		doutc(cl, "%llx.%llx, no cache cap\n", ceph_vinop(inode));</div><div class='add'>+		ret = -EACCES;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	if (ret == 0) {</div><div class='add'>+		ret = -EACCES;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	priv-&gt;caps = got;</div><div class='add'>+	rreq-&gt;netfs_priv = priv;</div><div class='add'>+	rreq-&gt;io_streams[0].sreq_max_len = fsc-&gt;mount_options-&gt;rsize;</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		if (got)</div><div class='add'>+			ceph_put_cap_refs(ceph_inode(inode), got);</div><div class='add'>+		kfree(priv);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void ceph_readahead_cleanup(struct address_space *mapping, void *priv)</div><div class='add'>+static void ceph_netfs_free_request(struct netfs_io_request *rreq)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = mapping-&gt;host;</div><div class='del'>-	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	int got = (uintptr_t)priv;</div><div class='add'>+	struct ceph_netfs_request_data *priv = rreq-&gt;netfs_priv;</div><div class='ctx'> </div><div class='del'>-	if (got)</div><div class='del'>-		ceph_put_cap_refs(ci, got);</div><div class='add'>+	if (!priv)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (priv-&gt;caps)</div><div class='add'>+		ceph_put_cap_refs(ceph_inode(rreq-&gt;inode), priv-&gt;caps);</div><div class='add'>+	kfree(priv);</div><div class='add'>+	rreq-&gt;netfs_priv = NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static const struct netfs_read_request_ops ceph_netfs_read_ops = {</div><div class='del'>-	.init_rreq		= ceph_init_rreq,</div><div class='del'>-	.is_cache_enabled	= ceph_is_cache_enabled,</div><div class='del'>-	.begin_cache_operation	= ceph_begin_cache_operation,</div><div class='del'>-	.issue_op		= ceph_netfs_issue_op,</div><div class='add'>+const struct netfs_request_ops ceph_netfs_ops = {</div><div class='add'>+	.init_request		= ceph_init_request,</div><div class='add'>+	.free_request		= ceph_netfs_free_request,</div><div class='add'>+	.prepare_read		= ceph_netfs_prepare_read,</div><div class='add'>+	.issue_read		= ceph_netfs_issue_read,</div><div class='ctx'> 	.expand_readahead	= ceph_netfs_expand_readahead,</div><div class='del'>-	.clamp_length		= ceph_netfs_clamp_length,</div><div class='ctx'> 	.check_write_begin	= ceph_netfs_check_write_begin,</div><div class='del'>-	.cleanup		= ceph_readahead_cleanup,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/* read a single page, without unlocking it. */</div><div class='del'>-static int ceph_readpage(struct file *file, struct page *subpage)</div><div class='add'>+#ifdef CONFIG_CEPH_FSCACHE</div><div class='add'>+static void ceph_set_page_fscache(struct page *page)</div><div class='ctx'> {</div><div class='del'>-	struct folio *folio = page_folio(subpage);</div><div class='del'>-	struct inode *inode = file_inode(file);</div><div class='del'>-	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	struct ceph_vino vino = ceph_vino(inode);</div><div class='del'>-	size_t len = folio_size(folio);</div><div class='del'>-	u64 off = folio_file_pos(folio);</div><div class='del'>-</div><div class='del'>-	if (ci-&gt;i_inline_version != CEPH_INLINE_NONE) {</div><div class='del'>-		/*</div><div class='del'>-		 * Uptodate inline data should have been added</div><div class='del'>-		 * into page cache while getting Fcr caps.</div><div class='del'>-		 */</div><div class='del'>-		if (off == 0) {</div><div class='del'>-			folio_unlock(folio);</div><div class='del'>-			return -EINVAL;</div><div class='del'>-		}</div><div class='del'>-		zero_user_segment(&amp;folio-&gt;page, 0, folio_size(folio));</div><div class='del'>-		folio_mark_uptodate(folio);</div><div class='del'>-		folio_unlock(folio);</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	dout("readpage ino %llx.%llx file %p off %llu len %zu folio %p index %lu\n",</div><div class='del'>-	     vino.ino, vino.snap, file, off, len, folio, folio_index(folio));</div><div class='del'>-</div><div class='del'>-	return netfs_readpage(file, folio, &amp;ceph_netfs_read_ops, NULL);</div><div class='add'>+	folio_start_private_2(page_folio(page)); /* [DEPRECATED] */</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void ceph_readahead(struct readahead_control *ractl)</div><div class='add'>+static void ceph_fscache_write_terminated(void *priv, ssize_t error)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = file_inode(ractl-&gt;file);</div><div class='del'>-	struct ceph_file_info *fi = ractl-&gt;file-&gt;private_data;</div><div class='del'>-	struct ceph_rw_context *rw_ctx;</div><div class='del'>-	int got = 0;</div><div class='del'>-	int ret = 0;</div><div class='add'>+	struct inode *inode = priv;</div><div class='ctx'> </div><div class='del'>-	if (ceph_inode(inode)-&gt;i_inline_version != CEPH_INLINE_NONE)</div><div class='del'>-		return;</div><div class='add'>+	if (IS_ERR_VALUE(error) &amp;&amp; error != -ENOBUFS)</div><div class='add'>+		ceph_fscache_invalidate(inode, false);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	rw_ctx = ceph_find_rw_context(fi);</div><div class='del'>-	if (!rw_ctx) {</div><div class='del'>-		/*</div><div class='del'>-		 * readahead callers do not necessarily hold Fcb caps</div><div class='del'>-		 * (e.g. fadvise, madvise).</div><div class='del'>-		 */</div><div class='del'>-		int want = CEPH_CAP_FILE_CACHE;</div><div class='add'>+static void ceph_fscache_write_to_cache(struct inode *inode, u64 off, u64 len, bool caching)</div><div class='add'>+{</div><div class='add'>+	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	struct fscache_cookie *cookie = ceph_fscache_cookie(ci);</div><div class='ctx'> </div><div class='del'>-		ret = ceph_try_get_caps(inode, CEPH_CAP_FILE_RD, want, true, &amp;got);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			dout("start_read %p, error getting cap\n", inode);</div><div class='del'>-		else if (!(got &amp; want))</div><div class='del'>-			dout("start_read %p, no cache cap\n", inode);</div><div class='add'>+	fscache_write_to_cache(cookie, inode-&gt;i_mapping, off, len, i_size_read(inode),</div><div class='add'>+			       ceph_fscache_write_terminated, inode, true, caching);</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+static inline void ceph_set_page_fscache(struct page *page)</div><div class='add'>+{</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		if (ret &lt;= 0)</div><div class='del'>-			return;</div><div class='del'>-	}</div><div class='del'>-	netfs_readahead(ractl, &amp;ceph_netfs_read_ops, (void *)(uintptr_t)got);</div><div class='add'>+static inline void ceph_fscache_write_to_cache(struct inode *inode, u64 off, u64 len, bool caching)</div><div class='add'>+{</div><div class='ctx'> }</div><div class='add'>+#endif /* CONFIG_CEPH_FSCACHE */</div><div class='ctx'> </div><div class='ctx'> struct ceph_writeback_ctl</div><div class='ctx'> {</div><div class='hunk'>@@ -384,7 +582,36 @@ struct ceph_writeback_ctl</div><div class='ctx'> 	u64 truncate_size;</div><div class='ctx'> 	u32 truncate_seq;</div><div class='ctx'> 	bool size_stable;</div><div class='add'>+</div><div class='ctx'> 	bool head_snapc;</div><div class='add'>+	struct ceph_snap_context *snapc;</div><div class='add'>+	struct ceph_snap_context *last_snapc;</div><div class='add'>+</div><div class='add'>+	bool done;</div><div class='add'>+	bool should_loop;</div><div class='add'>+	bool range_whole;</div><div class='add'>+	pgoff_t start_index;</div><div class='add'>+	pgoff_t index;</div><div class='add'>+	pgoff_t end;</div><div class='add'>+	xa_mark_t tag;</div><div class='add'>+</div><div class='add'>+	pgoff_t strip_unit_end;</div><div class='add'>+	unsigned int wsize;</div><div class='add'>+	unsigned int nr_folios;</div><div class='add'>+	unsigned int max_pages;</div><div class='add'>+	unsigned int locked_pages;</div><div class='add'>+</div><div class='add'>+	int op_idx;</div><div class='add'>+	int num_ops;</div><div class='add'>+	u64 offset;</div><div class='add'>+	u64 len;</div><div class='add'>+</div><div class='add'>+	struct folio_batch fbatch;</div><div class='add'>+	unsigned int processed_in_fbatch;</div><div class='add'>+</div><div class='add'>+	bool from_pool;</div><div class='add'>+	struct page **pages;</div><div class='add'>+	struct page **data_pages;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -396,13 +623,14 @@ get_oldest_context(struct inode *inode, struct ceph_writeback_ctl *ctl,</div><div class='ctx'> 		   struct ceph_snap_context *page_snapc)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_snap_context *snapc = NULL;</div><div class='ctx'> 	struct ceph_cap_snap *capsnap = NULL;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 	list_for_each_entry(capsnap, &amp;ci-&gt;i_cap_snaps, ci_item) {</div><div class='del'>-		dout(" cap_snap %p snapc %p has %d dirty pages\n", capsnap,</div><div class='del'>-		     capsnap-&gt;context, capsnap-&gt;dirty_pages);</div><div class='add'>+		doutc(cl, " capsnap %p snapc %p has %d dirty pages\n",</div><div class='add'>+		      capsnap, capsnap-&gt;context, capsnap-&gt;dirty_pages);</div><div class='ctx'> 		if (!capsnap-&gt;dirty_pages)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='hunk'>@@ -434,8 +662,8 @@ get_oldest_context(struct inode *inode, struct ceph_writeback_ctl *ctl,</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!snapc &amp;&amp; ci-&gt;i_wrbuffer_ref_head) {</div><div class='ctx'> 		snapc = ceph_get_snap_context(ci-&gt;i_head_snapc);</div><div class='del'>-		dout(" head snapc %p has %d dirty pages\n",</div><div class='del'>-		     snapc, ci-&gt;i_wrbuffer_ref_head);</div><div class='add'>+		doutc(cl, " head snapc %p has %d dirty pages\n", snapc,</div><div class='add'>+		      ci-&gt;i_wrbuffer_ref_head);</div><div class='ctx'> 		if (ctl) {</div><div class='ctx'> 			ctl-&gt;i_size = i_size_read(inode);</div><div class='ctx'> 			ctl-&gt;truncate_size = ci-&gt;i_truncate_size;</div><div class='hunk'>@@ -452,10 +680,12 @@ static u64 get_writepages_data_length(struct inode *inode,</div><div class='ctx'> 				      struct page *page, u64 start)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	struct ceph_snap_context *snapc = page_snap_context(page);</div><div class='add'>+	struct ceph_snap_context *snapc;</div><div class='ctx'> 	struct ceph_cap_snap *capsnap = NULL;</div><div class='ctx'> 	u64 end = i_size_read(inode);</div><div class='add'>+	u64 ret;</div><div class='ctx'> </div><div class='add'>+	snapc = page_snap_context(ceph_fscrypt_pagecache_page(page));</div><div class='ctx'> 	if (snapc != ci-&gt;i_head_snapc) {</div><div class='ctx'> 		bool found = false;</div><div class='ctx'> 		spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='hunk'>@@ -470,91 +700,130 @@ static u64 get_writepages_data_length(struct inode *inode,</div><div class='ctx'> 		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 		WARN_ON(!found);</div><div class='ctx'> 	}</div><div class='del'>-	if (end &gt; page_offset(page) + thp_size(page))</div><div class='del'>-		end = page_offset(page) + thp_size(page);</div><div class='del'>-	return end &gt; start ? end - start : 0;</div><div class='add'>+	if (end &gt; ceph_fscrypt_page_offset(page) + thp_size(page))</div><div class='add'>+		end = ceph_fscrypt_page_offset(page) + thp_size(page);</div><div class='add'>+	ret = end &gt; start ? end - start : 0;</div><div class='add'>+	if (ret &amp;&amp; fscrypt_is_bounce_page(page))</div><div class='add'>+		ret = round_up(ret, CEPH_FSCRYPT_BLOCK_SIZE);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Write a single page, but leave the page locked.</div><div class='add'>+ * Write a folio, but leave it locked.</div><div class='ctx'>  *</div><div class='ctx'>  * If we get a write error, mark the mapping for error, but still adjust the</div><div class='del'>- * dirty page accounting (i.e., page is no longer dirty).</div><div class='add'>+ * dirty page accounting (i.e., folio is no longer dirty).</div><div class='ctx'>  */</div><div class='del'>-static int writepage_nounlock(struct page *page, struct writeback_control *wbc)</div><div class='add'>+static int write_folio_nounlock(struct folio *folio,</div><div class='add'>+		struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct page *page = &amp;folio-&gt;page;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_inode_to_client(inode);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='ctx'> 	struct ceph_snap_context *snapc, *oldest;</div><div class='del'>-	loff_t page_off = page_offset(page);</div><div class='add'>+	loff_t page_off = folio_pos(folio);</div><div class='ctx'> 	int err;</div><div class='del'>-	loff_t len = thp_size(page);</div><div class='add'>+	loff_t len = folio_size(folio);</div><div class='add'>+	loff_t wlen;</div><div class='ctx'> 	struct ceph_writeback_ctl ceph_wbc;</div><div class='ctx'> 	struct ceph_osd_client *osdc = &amp;fsc-&gt;client-&gt;osdc;</div><div class='ctx'> 	struct ceph_osd_request *req;</div><div class='add'>+	bool caching = ceph_is_cache_enabled(inode);</div><div class='add'>+	struct page *bounce_page = NULL;</div><div class='ctx'> </div><div class='del'>-	dout("writepage %p idx %lu\n", page, page-&gt;index);</div><div class='add'>+	doutc(cl, "%llx.%llx folio %p idx %lu\n", ceph_vinop(inode), folio,</div><div class='add'>+	      folio-&gt;index);</div><div class='add'>+</div><div class='add'>+	if (ceph_inode_is_shutdown(inode))</div><div class='add'>+		return -EIO;</div><div class='ctx'> </div><div class='ctx'> 	/* verify this is a writeable snap context */</div><div class='del'>-	snapc = page_snap_context(page);</div><div class='add'>+	snapc = page_snap_context(&amp;folio-&gt;page);</div><div class='ctx'> 	if (!snapc) {</div><div class='del'>-		dout("writepage %p page %p not dirty?\n", inode, page);</div><div class='add'>+		doutc(cl, "%llx.%llx folio %p not dirty?\n", ceph_vinop(inode),</div><div class='add'>+		      folio);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> 	oldest = get_oldest_context(inode, &amp;ceph_wbc, snapc);</div><div class='ctx'> 	if (snapc-&gt;seq &gt; oldest-&gt;seq) {</div><div class='del'>-		dout("writepage %p page %p snapc %p not writeable - noop\n",</div><div class='del'>-		     inode, page, snapc);</div><div class='add'>+		doutc(cl, "%llx.%llx folio %p snapc %p not writeable - noop\n",</div><div class='add'>+		      ceph_vinop(inode), folio, snapc);</div><div class='ctx'> 		/* we should only noop if called by kswapd */</div><div class='ctx'> 		WARN_ON(!(current-&gt;flags &amp; PF_MEMALLOC));</div><div class='ctx'> 		ceph_put_snap_context(oldest);</div><div class='del'>-		redirty_page_for_writepage(wbc, page);</div><div class='add'>+		folio_redirty_for_writepage(wbc, folio);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> 	ceph_put_snap_context(oldest);</div><div class='ctx'> </div><div class='ctx'> 	/* is this a partial page at end of file? */</div><div class='ctx'> 	if (page_off &gt;= ceph_wbc.i_size) {</div><div class='del'>-		dout("%p page eof %llu\n", page, ceph_wbc.i_size);</div><div class='del'>-		page-&gt;mapping-&gt;a_ops-&gt;invalidatepage(page, 0, thp_size(page));</div><div class='add'>+		doutc(cl, "%llx.%llx folio at %lu beyond eof %llu\n",</div><div class='add'>+		      ceph_vinop(inode), folio-&gt;index, ceph_wbc.i_size);</div><div class='add'>+		folio_invalidate(folio, 0, folio_size(folio));</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (ceph_wbc.i_size &lt; page_off + len)</div><div class='ctx'> 		len = ceph_wbc.i_size - page_off;</div><div class='ctx'> </div><div class='del'>-	dout("writepage %p page %p index %lu on %llu~%llu snapc %p seq %lld\n",</div><div class='del'>-	     inode, page, page-&gt;index, page_off, len, snapc, snapc-&gt;seq);</div><div class='add'>+	wlen = IS_ENCRYPTED(inode) ? round_up(len, CEPH_FSCRYPT_BLOCK_SIZE) : len;</div><div class='add'>+	doutc(cl, "%llx.%llx folio %p index %lu on %llu~%llu snapc %p seq %lld\n",</div><div class='add'>+	      ceph_vinop(inode), folio, folio-&gt;index, page_off, wlen, snapc,</div><div class='add'>+	      snapc-&gt;seq);</div><div class='ctx'> </div><div class='ctx'> 	if (atomic_long_inc_return(&amp;fsc-&gt;writeback_count) &gt;</div><div class='ctx'> 	    CONGESTION_ON_THRESH(fsc-&gt;mount_options-&gt;congestion_kb))</div><div class='del'>-		set_bdi_congested(inode_to_bdi(inode), BLK_RW_ASYNC);</div><div class='add'>+		fsc-&gt;write_congested = true;</div><div class='ctx'> </div><div class='del'>-	set_page_writeback(page);</div><div class='del'>-	req = ceph_osdc_new_request(osdc, &amp;ci-&gt;i_layout, ceph_vino(inode), page_off, &amp;len, 0, 1,</div><div class='del'>-				    CEPH_OSD_OP_WRITE, CEPH_OSD_FLAG_WRITE, snapc,</div><div class='del'>-				    ceph_wbc.truncate_seq, ceph_wbc.truncate_size,</div><div class='del'>-				    true);</div><div class='add'>+	req = ceph_osdc_new_request(osdc, &amp;ci-&gt;i_layout, ceph_vino(inode),</div><div class='add'>+				    page_off, &amp;wlen, 0, 1, CEPH_OSD_OP_WRITE,</div><div class='add'>+				    CEPH_OSD_FLAG_WRITE, snapc,</div><div class='add'>+				    ceph_wbc.truncate_seq,</div><div class='add'>+				    ceph_wbc.truncate_size, true);</div><div class='ctx'> 	if (IS_ERR(req)) {</div><div class='del'>-		redirty_page_for_writepage(wbc, page);</div><div class='del'>-		end_page_writeback(page);</div><div class='add'>+		folio_redirty_for_writepage(wbc, folio);</div><div class='ctx'> 		return PTR_ERR(req);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* it may be a short write due to an object boundary */</div><div class='del'>-	WARN_ON_ONCE(len &gt; thp_size(page));</div><div class='del'>-	osd_req_op_extent_osd_data_pages(req, 0, &amp;page, len, 0, false, false);</div><div class='del'>-	dout("writepage %llu~%llu (%llu bytes)\n", page_off, len, len);</div><div class='add'>+	if (wlen &lt; len)</div><div class='add'>+		len = wlen;</div><div class='add'>+</div><div class='add'>+	folio_start_writeback(folio);</div><div class='add'>+	if (caching)</div><div class='add'>+		ceph_set_page_fscache(&amp;folio-&gt;page);</div><div class='add'>+	ceph_fscache_write_to_cache(inode, page_off, len, caching);</div><div class='add'>+</div><div class='add'>+	if (IS_ENCRYPTED(inode)) {</div><div class='add'>+		bounce_page = fscrypt_encrypt_pagecache_blocks(folio,</div><div class='add'>+						    CEPH_FSCRYPT_BLOCK_SIZE, 0,</div><div class='add'>+						    GFP_NOFS);</div><div class='add'>+		if (IS_ERR(bounce_page)) {</div><div class='add'>+			folio_redirty_for_writepage(wbc, folio);</div><div class='add'>+			folio_end_writeback(folio);</div><div class='add'>+			ceph_osdc_put_request(req);</div><div class='add'>+			return PTR_ERR(bounce_page);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	req-&gt;r_mtime = inode-&gt;i_mtime;</div><div class='del'>-	err = ceph_osdc_start_request(osdc, req, true);</div><div class='del'>-	if (!err)</div><div class='del'>-		err = ceph_osdc_wait_request(osdc, req);</div><div class='add'>+	/* it may be a short write due to an object boundary */</div><div class='add'>+	WARN_ON_ONCE(len &gt; folio_size(folio));</div><div class='add'>+	osd_req_op_extent_osd_data_pages(req, 0,</div><div class='add'>+			bounce_page ? &amp;bounce_page : &amp;page, wlen, 0,</div><div class='add'>+			false, false);</div><div class='add'>+	doutc(cl, "%llx.%llx %llu~%llu (%llu bytes, %sencrypted)\n",</div><div class='add'>+	      ceph_vinop(inode), page_off, len, wlen,</div><div class='add'>+	      IS_ENCRYPTED(inode) ? "" : "not ");</div><div class='add'>+</div><div class='add'>+	req-&gt;r_mtime = inode_get_mtime(inode);</div><div class='add'>+	ceph_osdc_start_request(osdc, req);</div><div class='add'>+	err = ceph_osdc_wait_request(osdc, req);</div><div class='ctx'> </div><div class='ctx'> 	ceph_update_write_metrics(&amp;fsc-&gt;mdsc-&gt;metric, req-&gt;r_start_latency,</div><div class='ctx'> 				  req-&gt;r_end_latency, len, err);</div><div class='del'>-</div><div class='add'>+	fscrypt_free_bounce_page(bounce_page);</div><div class='ctx'> 	ceph_osdc_put_request(req);</div><div class='ctx'> 	if (err == 0)</div><div class='ctx'> 		err = len;</div><div class='hunk'>@@ -565,48 +834,33 @@ static int writepage_nounlock(struct page *page, struct writeback_control *wbc)</div><div class='ctx'> 			wbc = &amp;tmp_wbc;</div><div class='ctx'> 		if (err == -ERESTARTSYS) {</div><div class='ctx'> 			/* killed by SIGKILL */</div><div class='del'>-			dout("writepage interrupted page %p\n", page);</div><div class='del'>-			redirty_page_for_writepage(wbc, page);</div><div class='del'>-			end_page_writeback(page);</div><div class='add'>+			doutc(cl, "%llx.%llx interrupted page %p\n",</div><div class='add'>+			      ceph_vinop(inode), folio);</div><div class='add'>+			folio_redirty_for_writepage(wbc, folio);</div><div class='add'>+			folio_end_writeback(folio);</div><div class='ctx'> 			return err;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (err == -EBLOCKLISTED)</div><div class='ctx'> 			fsc-&gt;blocklisted = true;</div><div class='del'>-		dout("writepage setting page/mapping error %d %p\n",</div><div class='del'>-		     err, page);</div><div class='add'>+		doutc(cl, "%llx.%llx setting mapping error %d %p\n",</div><div class='add'>+		      ceph_vinop(inode), err, folio);</div><div class='ctx'> 		mapping_set_error(&amp;inode-&gt;i_data, err);</div><div class='ctx'> 		wbc-&gt;pages_skipped++;</div><div class='ctx'> 	} else {</div><div class='del'>-		dout("writepage cleaned page %p\n", page);</div><div class='add'>+		doutc(cl, "%llx.%llx cleaned page %p\n",</div><div class='add'>+		      ceph_vinop(inode), folio);</div><div class='ctx'> 		err = 0;  /* vfs expects us to return 0 */</div><div class='ctx'> 	}</div><div class='del'>-	oldest = detach_page_private(page);</div><div class='add'>+	oldest = folio_detach_private(folio);</div><div class='ctx'> 	WARN_ON_ONCE(oldest != snapc);</div><div class='del'>-	end_page_writeback(page);</div><div class='add'>+	folio_end_writeback(folio);</div><div class='ctx'> 	ceph_put_wrbuffer_cap_refs(ci, 1, snapc);</div><div class='ctx'> 	ceph_put_snap_context(snapc);  /* page's reference */</div><div class='ctx'> </div><div class='ctx'> 	if (atomic_long_dec_return(&amp;fsc-&gt;writeback_count) &lt;</div><div class='ctx'> 	    CONGESTION_OFF_THRESH(fsc-&gt;mount_options-&gt;congestion_kb))</div><div class='del'>-		clear_bdi_congested(inode_to_bdi(inode), BLK_RW_ASYNC);</div><div class='del'>-</div><div class='del'>-	return err;</div><div class='del'>-}</div><div class='add'>+		fsc-&gt;write_congested = false;</div><div class='ctx'> </div><div class='del'>-static int ceph_writepage(struct page *page, struct writeback_control *wbc)</div><div class='del'>-{</div><div class='del'>-	int err;</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-	BUG_ON(!inode);</div><div class='del'>-	ihold(inode);</div><div class='del'>-	err = writepage_nounlock(page, wbc);</div><div class='del'>-	if (err == -ERESTARTSYS) {</div><div class='del'>-		/* direct memory reclaimer was killed by SIGKILL. return 0</div><div class='del'>-		 * to prevent caller from setting mapping/page error */</div><div class='del'>-		err = 0;</div><div class='del'>-	}</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	iput(inode);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -620,6 +874,7 @@ static void writepages_finish(struct ceph_osd_request *req)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = req-&gt;r_inode;</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_osd_data *osd_data;</div><div class='ctx'> 	struct page *page;</div><div class='ctx'> 	int num_pages, total_pages = 0;</div><div class='hunk'>@@ -627,11 +882,12 @@ static void writepages_finish(struct ceph_osd_request *req)</div><div class='ctx'> 	int rc = req-&gt;r_result;</div><div class='ctx'> 	struct ceph_snap_context *snapc = req-&gt;r_snapc;</div><div class='ctx'> 	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_inode_to_client(inode);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_sb_to_mdsc(inode-&gt;i_sb);</div><div class='ctx'> 	unsigned int len = 0;</div><div class='ctx'> 	bool remove_page;</div><div class='ctx'> </div><div class='del'>-	dout("writepages_finish %p rc %d\n", inode, rc);</div><div class='add'>+	doutc(cl, "%llx.%llx rc %d\n", ceph_vinop(inode), rc);</div><div class='ctx'> 	if (rc &lt; 0) {</div><div class='ctx'> 		mapping_set_error(mapping, rc);</div><div class='ctx'> 		ceph_set_error_write(ci);</div><div class='hunk'>@@ -652,8 +908,13 @@ static void writepages_finish(struct ceph_osd_request *req)</div><div class='ctx'> </div><div class='ctx'> 	/* clean all pages */</div><div class='ctx'> 	for (i = 0; i &lt; req-&gt;r_num_ops; i++) {</div><div class='del'>-		if (req-&gt;r_ops[i].op != CEPH_OSD_OP_WRITE)</div><div class='add'>+		if (req-&gt;r_ops[i].op != CEPH_OSD_OP_WRITE) {</div><div class='add'>+			pr_warn_client(cl,</div><div class='add'>+				"%llx.%llx incorrect op %d req %p index %d tid %llu\n",</div><div class='add'>+				ceph_vinop(inode), req-&gt;r_ops[i].op, req, i,</div><div class='add'>+				req-&gt;r_tid);</div><div class='ctx'> 			break;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		osd_data = osd_req_op_extent_osd_data(req, i);</div><div class='ctx'> 		BUG_ON(osd_data-&gt;type != CEPH_OSD_DATA_TYPE_PAGES);</div><div class='hunk'>@@ -663,27 +924,38 @@ static void writepages_finish(struct ceph_osd_request *req)</div><div class='ctx'> 		total_pages += num_pages;</div><div class='ctx'> 		for (j = 0; j &lt; num_pages; j++) {</div><div class='ctx'> 			page = osd_data-&gt;pages[j];</div><div class='add'>+			if (fscrypt_is_bounce_page(page)) {</div><div class='add'>+				page = fscrypt_pagecache_page(page);</div><div class='add'>+				fscrypt_free_bounce_page(osd_data-&gt;pages[j]);</div><div class='add'>+				osd_data-&gt;pages[j] = page;</div><div class='add'>+			}</div><div class='ctx'> 			BUG_ON(!page);</div><div class='ctx'> 			WARN_ON(!PageUptodate(page));</div><div class='ctx'> </div><div class='ctx'> 			if (atomic_long_dec_return(&amp;fsc-&gt;writeback_count) &lt;</div><div class='ctx'> 			     CONGESTION_OFF_THRESH(</div><div class='ctx'> 					fsc-&gt;mount_options-&gt;congestion_kb))</div><div class='del'>-				clear_bdi_congested(inode_to_bdi(inode),</div><div class='del'>-						    BLK_RW_ASYNC);</div><div class='add'>+				fsc-&gt;write_congested = false;</div><div class='ctx'> </div><div class='ctx'> 			ceph_put_snap_context(detach_page_private(page));</div><div class='ctx'> 			end_page_writeback(page);</div><div class='del'>-			dout("unlocking %p\n", page);</div><div class='add'>+</div><div class='add'>+			if (atomic64_dec_return(&amp;mdsc-&gt;dirty_folios) &lt;= 0) {</div><div class='add'>+				wake_up_all(&amp;mdsc-&gt;flush_end_wq);</div><div class='add'>+				WARN_ON(atomic64_read(&amp;mdsc-&gt;dirty_folios) &lt; 0);</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			doutc(cl, "unlocking %p\n", page);</div><div class='ctx'> </div><div class='ctx'> 			if (remove_page)</div><div class='del'>-				generic_error_remove_page(inode-&gt;i_mapping,</div><div class='del'>-							  page);</div><div class='add'>+				generic_error_remove_folio(inode-&gt;i_mapping,</div><div class='add'>+							  page_folio(page));</div><div class='ctx'> </div><div class='ctx'> 			unlock_page(page);</div><div class='ctx'> 		}</div><div class='del'>-		dout("writepages_finish %p wrote %llu bytes cleaned %d pages\n",</div><div class='del'>-		     inode, osd_data-&gt;length, rc &gt;= 0 ? num_pages : 0);</div><div class='add'>+		doutc(cl, "%llx.%llx wrote %llu bytes cleaned %d pages\n",</div><div class='add'>+		      ceph_vinop(inode), osd_data-&gt;length,</div><div class='add'>+		      rc &gt;= 0 ? num_pages : 0);</div><div class='ctx'> </div><div class='ctx'> 		release_pages(osd_data-&gt;pages, num_pages);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -699,365 +971,748 @@ static void writepages_finish(struct ceph_osd_request *req)</div><div class='ctx'> 	else</div><div class='ctx'> 		kfree(osd_data-&gt;pages);</div><div class='ctx'> 	ceph_osdc_put_request(req);</div><div class='add'>+	ceph_dec_osd_stopping_blocker(fsc-&gt;mdsc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * initiate async writeback</div><div class='del'>- */</div><div class='del'>-static int ceph_writepages_start(struct address_space *mapping,</div><div class='del'>-				 struct writeback_control *wbc)</div><div class='add'>+static inline</div><div class='add'>+bool is_forced_umount(struct address_space *mapping)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_inode_to_client(inode);</div><div class='del'>-	struct ceph_vino vino = ceph_vino(inode);</div><div class='del'>-	pgoff_t index, start_index, end = -1;</div><div class='del'>-	struct ceph_snap_context *snapc = NULL, *last_snapc = NULL, *pgsnapc;</div><div class='del'>-	struct pagevec pvec;</div><div class='del'>-	int rc = 0;</div><div class='del'>-	unsigned int wsize = i_blocksize(inode);</div><div class='del'>-	struct ceph_osd_request *req = NULL;</div><div class='del'>-	struct ceph_writeback_ctl ceph_wbc;</div><div class='del'>-	bool should_loop, range_whole = false;</div><div class='del'>-	bool done = false;</div><div class='del'>-</div><div class='del'>-	dout("writepages_start %p (mode=%s)\n", inode,</div><div class='del'>-	     wbc-&gt;sync_mode == WB_SYNC_NONE ? "NONE" :</div><div class='del'>-	     (wbc-&gt;sync_mode == WB_SYNC_ALL ? "ALL" : "HOLD"));</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='ctx'> </div><div class='del'>-	if (READ_ONCE(fsc-&gt;mount_state) &gt;= CEPH_MOUNT_SHUTDOWN) {</div><div class='add'>+	if (ceph_inode_is_shutdown(inode)) {</div><div class='ctx'> 		if (ci-&gt;i_wrbuffer_ref &gt; 0) {</div><div class='del'>-			pr_warn_ratelimited(</div><div class='del'>-				"writepage_start %p %lld forced umount\n",</div><div class='del'>-				inode, ceph_ino(inode));</div><div class='add'>+			pr_warn_ratelimited_client(cl,</div><div class='add'>+				"%llx.%llx %lld forced umount\n",</div><div class='add'>+				ceph_vinop(inode), ceph_ino(inode));</div><div class='ctx'> 		}</div><div class='ctx'> 		mapping_set_error(mapping, -EIO);</div><div class='del'>-		return -EIO; /* we're in a forced umount, don't write! */</div><div class='add'>+		return true;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline</div><div class='add'>+unsigned int ceph_define_write_size(struct address_space *mapping)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = mapping-&gt;host;</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='add'>+	unsigned int wsize = i_blocksize(inode);</div><div class='add'>+</div><div class='ctx'> 	if (fsc-&gt;mount_options-&gt;wsize &lt; wsize)</div><div class='ctx'> 		wsize = fsc-&gt;mount_options-&gt;wsize;</div><div class='ctx'> </div><div class='del'>-	pagevec_init(&amp;pvec);</div><div class='add'>+	return wsize;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	start_index = wbc-&gt;range_cyclic ? mapping-&gt;writeback_index : 0;</div><div class='del'>-	index = start_index;</div><div class='add'>+static inline</div><div class='add'>+void ceph_folio_batch_init(struct ceph_writeback_ctl *ceph_wbc)</div><div class='add'>+{</div><div class='add'>+	folio_batch_init(&amp;ceph_wbc-&gt;fbatch);</div><div class='add'>+	ceph_wbc-&gt;processed_in_fbatch = 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline</div><div class='add'>+void ceph_folio_batch_reinit(struct ceph_writeback_ctl *ceph_wbc)</div><div class='add'>+{</div><div class='add'>+	folio_batch_release(&amp;ceph_wbc-&gt;fbatch);</div><div class='add'>+	ceph_folio_batch_init(ceph_wbc);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline</div><div class='add'>+void ceph_init_writeback_ctl(struct address_space *mapping,</div><div class='add'>+			     struct writeback_control *wbc,</div><div class='add'>+			     struct ceph_writeback_ctl *ceph_wbc)</div><div class='add'>+{</div><div class='add'>+	ceph_wbc-&gt;snapc = NULL;</div><div class='add'>+	ceph_wbc-&gt;last_snapc = NULL;</div><div class='add'>+</div><div class='add'>+	ceph_wbc-&gt;strip_unit_end = 0;</div><div class='add'>+	ceph_wbc-&gt;wsize = ceph_define_write_size(mapping);</div><div class='add'>+</div><div class='add'>+	ceph_wbc-&gt;nr_folios = 0;</div><div class='add'>+	ceph_wbc-&gt;max_pages = 0;</div><div class='add'>+	ceph_wbc-&gt;locked_pages = 0;</div><div class='add'>+</div><div class='add'>+	ceph_wbc-&gt;done = false;</div><div class='add'>+	ceph_wbc-&gt;should_loop = false;</div><div class='add'>+	ceph_wbc-&gt;range_whole = false;</div><div class='add'>+</div><div class='add'>+	ceph_wbc-&gt;start_index = wbc-&gt;range_cyclic ? mapping-&gt;writeback_index : 0;</div><div class='add'>+	ceph_wbc-&gt;index = ceph_wbc-&gt;start_index;</div><div class='add'>+	ceph_wbc-&gt;end = -1;</div><div class='add'>+</div><div class='add'>+	ceph_wbc-&gt;tag = wbc_to_tag(wbc);</div><div class='add'>+</div><div class='add'>+	ceph_wbc-&gt;op_idx = -1;</div><div class='add'>+	ceph_wbc-&gt;num_ops = 0;</div><div class='add'>+	ceph_wbc-&gt;offset = 0;</div><div class='add'>+	ceph_wbc-&gt;len = 0;</div><div class='add'>+	ceph_wbc-&gt;from_pool = false;</div><div class='add'>+</div><div class='add'>+	ceph_folio_batch_init(ceph_wbc);</div><div class='add'>+</div><div class='add'>+	ceph_wbc-&gt;pages = NULL;</div><div class='add'>+	ceph_wbc-&gt;data_pages = NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline</div><div class='add'>+int ceph_define_writeback_range(struct address_space *mapping,</div><div class='add'>+				struct writeback_control *wbc,</div><div class='add'>+				struct ceph_writeback_ctl *ceph_wbc)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = mapping-&gt;host;</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='ctx'> </div><div class='del'>-retry:</div><div class='ctx'> 	/* find oldest snap context with dirty data */</div><div class='del'>-	snapc = get_oldest_context(inode, &amp;ceph_wbc, NULL);</div><div class='del'>-	if (!snapc) {</div><div class='add'>+	ceph_wbc-&gt;snapc = get_oldest_context(inode, ceph_wbc, NULL);</div><div class='add'>+	if (!ceph_wbc-&gt;snapc) {</div><div class='ctx'> 		/* hmm, why does writepages get called when there</div><div class='ctx'> 		   is no dirty data? */</div><div class='del'>-		dout(" no snap context with dirty data?\n");</div><div class='del'>-		goto out;</div><div class='add'>+		doutc(cl, " no snap context with dirty data?\n");</div><div class='add'>+		return -ENODATA;</div><div class='ctx'> 	}</div><div class='del'>-	dout(" oldest snapc is %p seq %lld (%d snaps)\n",</div><div class='del'>-	     snapc, snapc-&gt;seq, snapc-&gt;num_snaps);</div><div class='ctx'> </div><div class='del'>-	should_loop = false;</div><div class='del'>-	if (ceph_wbc.head_snapc &amp;&amp; snapc != last_snapc) {</div><div class='add'>+	doutc(cl, " oldest snapc is %p seq %lld (%d snaps)\n",</div><div class='add'>+	      ceph_wbc-&gt;snapc, ceph_wbc-&gt;snapc-&gt;seq,</div><div class='add'>+	      ceph_wbc-&gt;snapc-&gt;num_snaps);</div><div class='add'>+</div><div class='add'>+	ceph_wbc-&gt;should_loop = false;</div><div class='add'>+</div><div class='add'>+	if (ceph_wbc-&gt;head_snapc &amp;&amp; ceph_wbc-&gt;snapc != ceph_wbc-&gt;last_snapc) {</div><div class='ctx'> 		/* where to start/end? */</div><div class='ctx'> 		if (wbc-&gt;range_cyclic) {</div><div class='del'>-			index = start_index;</div><div class='del'>-			end = -1;</div><div class='del'>-			if (index &gt; 0)</div><div class='del'>-				should_loop = true;</div><div class='del'>-			dout(" cyclic, start at %lu\n", index);</div><div class='add'>+			ceph_wbc-&gt;index = ceph_wbc-&gt;start_index;</div><div class='add'>+			ceph_wbc-&gt;end = -1;</div><div class='add'>+			if (ceph_wbc-&gt;index &gt; 0)</div><div class='add'>+				ceph_wbc-&gt;should_loop = true;</div><div class='add'>+			doutc(cl, " cyclic, start at %lu\n", ceph_wbc-&gt;index);</div><div class='ctx'> 		} else {</div><div class='del'>-			index = wbc-&gt;range_start &gt;&gt; PAGE_SHIFT;</div><div class='del'>-			end = wbc-&gt;range_end &gt;&gt; PAGE_SHIFT;</div><div class='add'>+			ceph_wbc-&gt;index = wbc-&gt;range_start &gt;&gt; PAGE_SHIFT;</div><div class='add'>+			ceph_wbc-&gt;end = wbc-&gt;range_end &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> 			if (wbc-&gt;range_start == 0 &amp;&amp; wbc-&gt;range_end == LLONG_MAX)</div><div class='del'>-				range_whole = true;</div><div class='del'>-			dout(" not cyclic, %lu to %lu\n", index, end);</div><div class='add'>+				ceph_wbc-&gt;range_whole = true;</div><div class='add'>+			doutc(cl, " not cyclic, %lu to %lu\n",</div><div class='add'>+				ceph_wbc-&gt;index, ceph_wbc-&gt;end);</div><div class='ctx'> 		}</div><div class='del'>-	} else if (!ceph_wbc.head_snapc) {</div><div class='add'>+	} else if (!ceph_wbc-&gt;head_snapc) {</div><div class='ctx'> 		/* Do not respect wbc-&gt;range_{start,end}. Dirty pages</div><div class='ctx'> 		 * in that range can be associated with newer snapc.</div><div class='ctx'> 		 * They are not writeable until we write all dirty pages</div><div class='ctx'> 		 * associated with 'snapc' get written */</div><div class='del'>-		if (index &gt; 0)</div><div class='del'>-			should_loop = true;</div><div class='del'>-		dout(" non-head snapc, range whole\n");</div><div class='add'>+		if (ceph_wbc-&gt;index &gt; 0)</div><div class='add'>+			ceph_wbc-&gt;should_loop = true;</div><div class='add'>+		doutc(cl, " non-head snapc, range whole\n");</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ceph_put_snap_context(last_snapc);</div><div class='del'>-	last_snapc = snapc;</div><div class='add'>+	ceph_put_snap_context(ceph_wbc-&gt;last_snapc);</div><div class='add'>+	ceph_wbc-&gt;last_snapc = ceph_wbc-&gt;snapc;</div><div class='ctx'> </div><div class='del'>-	while (!done &amp;&amp; index &lt;= end) {</div><div class='del'>-		int num_ops = 0, op_idx;</div><div class='del'>-		unsigned i, pvec_pages, max_pages, locked_pages = 0;</div><div class='del'>-		struct page **pages = NULL, **data_pages;</div><div class='del'>-		struct page *page;</div><div class='del'>-		pgoff_t strip_unit_end = 0;</div><div class='del'>-		u64 offset = 0, len = 0;</div><div class='del'>-		bool from_pool = false;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		max_pages = wsize &gt;&gt; PAGE_SHIFT;</div><div class='add'>+static inline</div><div class='add'>+bool has_writeback_done(struct ceph_writeback_ctl *ceph_wbc)</div><div class='add'>+{</div><div class='add'>+	return ceph_wbc-&gt;done &amp;&amp; ceph_wbc-&gt;index &gt; ceph_wbc-&gt;end;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-get_more_pages:</div><div class='del'>-		pvec_pages = pagevec_lookup_range_tag(&amp;pvec, mapping, &amp;index,</div><div class='del'>-						end, PAGECACHE_TAG_DIRTY);</div><div class='del'>-		dout("pagevec_lookup_range_tag got %d\n", pvec_pages);</div><div class='del'>-		if (!pvec_pages &amp;&amp; !locked_pages)</div><div class='del'>-			break;</div><div class='del'>-		for (i = 0; i &lt; pvec_pages &amp;&amp; locked_pages &lt; max_pages; i++) {</div><div class='del'>-			page = pvec.pages[i];</div><div class='del'>-			dout("? %p idx %lu\n", page, page-&gt;index);</div><div class='del'>-			if (locked_pages == 0)</div><div class='del'>-				lock_page(page);  /* first page */</div><div class='del'>-			else if (!trylock_page(page))</div><div class='del'>-				break;</div><div class='add'>+static inline</div><div class='add'>+bool can_next_page_be_processed(struct ceph_writeback_ctl *ceph_wbc,</div><div class='add'>+				unsigned index)</div><div class='add'>+{</div><div class='add'>+	return index &lt; ceph_wbc-&gt;nr_folios &amp;&amp;</div><div class='add'>+		ceph_wbc-&gt;locked_pages &lt; ceph_wbc-&gt;max_pages;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-			/* only dirty pages, or our accounting breaks */</div><div class='del'>-			if (unlikely(!PageDirty(page)) ||</div><div class='del'>-			    unlikely(page-&gt;mapping != mapping)) {</div><div class='del'>-				dout("!dirty or !mapping %p\n", page);</div><div class='del'>-				unlock_page(page);</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='del'>-			/* only if matching snap context */</div><div class='del'>-			pgsnapc = page_snap_context(page);</div><div class='del'>-			if (pgsnapc != snapc) {</div><div class='del'>-				dout("page snapc %p %lld != oldest %p %lld\n",</div><div class='del'>-				     pgsnapc, pgsnapc-&gt;seq, snapc, snapc-&gt;seq);</div><div class='del'>-				if (!should_loop &amp;&amp;</div><div class='del'>-				    !ceph_wbc.head_snapc &amp;&amp;</div><div class='del'>-				    wbc-&gt;sync_mode != WB_SYNC_NONE)</div><div class='del'>-					should_loop = true;</div><div class='del'>-				unlock_page(page);</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='del'>-			if (page_offset(page) &gt;= ceph_wbc.i_size) {</div><div class='del'>-				dout("%p page eof %llu\n",</div><div class='del'>-				     page, ceph_wbc.i_size);</div><div class='del'>-				if ((ceph_wbc.size_stable ||</div><div class='del'>-				    page_offset(page) &gt;= i_size_read(inode)) &amp;&amp;</div><div class='del'>-				    clear_page_dirty_for_io(page))</div><div class='del'>-					mapping-&gt;a_ops-&gt;invalidatepage(page,</div><div class='del'>-								0, thp_size(page));</div><div class='del'>-				unlock_page(page);</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='del'>-			if (strip_unit_end &amp;&amp; (page-&gt;index &gt; strip_unit_end)) {</div><div class='del'>-				dout("end of strip unit %p\n", page);</div><div class='del'>-				unlock_page(page);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			if (PageWriteback(page)) {</div><div class='del'>-				if (wbc-&gt;sync_mode == WB_SYNC_NONE) {</div><div class='del'>-					dout("%p under writeback\n", page);</div><div class='del'>-					unlock_page(page);</div><div class='del'>-					continue;</div><div class='del'>-				}</div><div class='del'>-				dout("waiting on writeback %p\n", page);</div><div class='del'>-				wait_on_page_writeback(page);</div><div class='del'>-			}</div><div class='add'>+static</div><div class='add'>+int ceph_check_page_before_write(struct address_space *mapping,</div><div class='add'>+				 struct writeback_control *wbc,</div><div class='add'>+				 struct ceph_writeback_ctl *ceph_wbc,</div><div class='add'>+				 struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = mapping-&gt;host;</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='add'>+	struct ceph_snap_context *pgsnapc;</div><div class='add'>+</div><div class='add'>+	/* only dirty folios, or our accounting breaks */</div><div class='add'>+	if (unlikely(!folio_test_dirty(folio) || folio-&gt;mapping != mapping)) {</div><div class='add'>+		doutc(cl, "!dirty or !mapping %p\n", folio);</div><div class='add'>+		return -ENODATA;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-			if (!clear_page_dirty_for_io(page)) {</div><div class='del'>-				dout("%p !clear_page_dirty_for_io\n", page);</div><div class='del'>-				unlock_page(page);</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='add'>+	/* only if matching snap context */</div><div class='add'>+	pgsnapc = page_snap_context(&amp;folio-&gt;page);</div><div class='add'>+	if (pgsnapc != ceph_wbc-&gt;snapc) {</div><div class='add'>+		doutc(cl, "folio snapc %p %lld != oldest %p %lld\n",</div><div class='add'>+		      pgsnapc, pgsnapc-&gt;seq,</div><div class='add'>+		      ceph_wbc-&gt;snapc, ceph_wbc-&gt;snapc-&gt;seq);</div><div class='ctx'> </div><div class='del'>-			/*</div><div class='del'>-			 * We have something to write.  If this is</div><div class='del'>-			 * the first locked page this time through,</div><div class='del'>-			 * calculate max possinle write size and</div><div class='del'>-			 * allocate a page array</div><div class='del'>-			 */</div><div class='del'>-			if (locked_pages == 0) {</div><div class='del'>-				u64 objnum;</div><div class='del'>-				u64 objoff;</div><div class='del'>-				u32 xlen;</div><div class='del'>-</div><div class='del'>-				/* prepare async write request */</div><div class='del'>-				offset = (u64)page_offset(page);</div><div class='del'>-				ceph_calc_file_object_mapping(&amp;ci-&gt;i_layout,</div><div class='del'>-							      offset, wsize,</div><div class='del'>-							      &amp;objnum, &amp;objoff,</div><div class='del'>-							      &amp;xlen);</div><div class='del'>-				len = xlen;</div><div class='del'>-</div><div class='del'>-				num_ops = 1;</div><div class='del'>-				strip_unit_end = page-&gt;index +</div><div class='del'>-					((len - 1) &gt;&gt; PAGE_SHIFT);</div><div class='del'>-</div><div class='del'>-				BUG_ON(pages);</div><div class='del'>-				max_pages = calc_pages_for(0, (u64)len);</div><div class='del'>-				pages = kmalloc_array(max_pages,</div><div class='del'>-						      sizeof(*pages),</div><div class='del'>-						      GFP_NOFS);</div><div class='del'>-				if (!pages) {</div><div class='del'>-					from_pool = true;</div><div class='del'>-					pages = mempool_alloc(ceph_wb_pagevec_pool, GFP_NOFS);</div><div class='del'>-					BUG_ON(!pages);</div><div class='del'>-				}</div><div class='del'>-</div><div class='del'>-				len = 0;</div><div class='del'>-			} else if (page-&gt;index !=</div><div class='del'>-				   (offset + len) &gt;&gt; PAGE_SHIFT) {</div><div class='del'>-				if (num_ops &gt;= (from_pool ?  CEPH_OSD_SLAB_OPS :</div><div class='del'>-							     CEPH_OSD_MAX_OPS)) {</div><div class='del'>-					redirty_page_for_writepage(wbc, page);</div><div class='del'>-					unlock_page(page);</div><div class='del'>-					break;</div><div class='del'>-				}</div><div class='del'>-</div><div class='del'>-				num_ops++;</div><div class='del'>-				offset = (u64)page_offset(page);</div><div class='del'>-				len = 0;</div><div class='del'>-			}</div><div class='add'>+		if (!ceph_wbc-&gt;should_loop &amp;&amp; !ceph_wbc-&gt;head_snapc &amp;&amp;</div><div class='add'>+		    wbc-&gt;sync_mode != WB_SYNC_NONE)</div><div class='add'>+			ceph_wbc-&gt;should_loop = true;</div><div class='add'>+</div><div class='add'>+		return -ENODATA;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (folio_pos(folio) &gt;= ceph_wbc-&gt;i_size) {</div><div class='add'>+		doutc(cl, "folio at %lu beyond eof %llu\n",</div><div class='add'>+		      folio-&gt;index, ceph_wbc-&gt;i_size);</div><div class='add'>+</div><div class='add'>+		if ((ceph_wbc-&gt;size_stable ||</div><div class='add'>+		    folio_pos(folio) &gt;= i_size_read(inode)) &amp;&amp;</div><div class='add'>+		    folio_clear_dirty_for_io(folio))</div><div class='add'>+			folio_invalidate(folio, 0, folio_size(folio));</div><div class='add'>+</div><div class='add'>+		return -ENODATA;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (ceph_wbc-&gt;strip_unit_end &amp;&amp;</div><div class='add'>+	    (folio-&gt;index &gt; ceph_wbc-&gt;strip_unit_end)) {</div><div class='add'>+		doutc(cl, "end of strip unit %p\n", folio);</div><div class='add'>+		return -E2BIG;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline</div><div class='add'>+void __ceph_allocate_page_array(struct ceph_writeback_ctl *ceph_wbc,</div><div class='add'>+				unsigned int max_pages)</div><div class='add'>+{</div><div class='add'>+	ceph_wbc-&gt;pages = kmalloc_array(max_pages,</div><div class='add'>+					sizeof(*ceph_wbc-&gt;pages),</div><div class='add'>+					GFP_NOFS);</div><div class='add'>+	if (!ceph_wbc-&gt;pages) {</div><div class='add'>+		ceph_wbc-&gt;from_pool = true;</div><div class='add'>+		ceph_wbc-&gt;pages = mempool_alloc(ceph_wb_pagevec_pool, GFP_NOFS);</div><div class='add'>+		BUG_ON(!ceph_wbc-&gt;pages);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-			/* note position of first page in pvec */</div><div class='del'>-			dout("%p will write page %p idx %lu\n",</div><div class='del'>-			     inode, page, page-&gt;index);</div><div class='add'>+static inline</div><div class='add'>+void ceph_allocate_page_array(struct address_space *mapping,</div><div class='add'>+			      struct ceph_writeback_ctl *ceph_wbc,</div><div class='add'>+			      struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = mapping-&gt;host;</div><div class='add'>+	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	u64 objnum;</div><div class='add'>+	u64 objoff;</div><div class='add'>+	u32 xlen;</div><div class='add'>+</div><div class='add'>+	/* prepare async write request */</div><div class='add'>+	ceph_wbc-&gt;offset = (u64)folio_pos(folio);</div><div class='add'>+	ceph_calc_file_object_mapping(&amp;ci-&gt;i_layout,</div><div class='add'>+					ceph_wbc-&gt;offset, ceph_wbc-&gt;wsize,</div><div class='add'>+					&amp;objnum, &amp;objoff, &amp;xlen);</div><div class='add'>+</div><div class='add'>+	ceph_wbc-&gt;num_ops = 1;</div><div class='add'>+	ceph_wbc-&gt;strip_unit_end = folio-&gt;index + ((xlen - 1) &gt;&gt; PAGE_SHIFT);</div><div class='add'>+</div><div class='add'>+	BUG_ON(ceph_wbc-&gt;pages);</div><div class='add'>+	ceph_wbc-&gt;max_pages = calc_pages_for(0, (u64)xlen);</div><div class='add'>+	__ceph_allocate_page_array(ceph_wbc, ceph_wbc-&gt;max_pages);</div><div class='add'>+</div><div class='add'>+	ceph_wbc-&gt;len = 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline</div><div class='add'>+bool is_folio_index_contiguous(const struct ceph_writeback_ctl *ceph_wbc,</div><div class='add'>+			      const struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	return folio-&gt;index == (ceph_wbc-&gt;offset + ceph_wbc-&gt;len) &gt;&gt; PAGE_SHIFT;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline</div><div class='add'>+bool is_num_ops_too_big(struct ceph_writeback_ctl *ceph_wbc)</div><div class='add'>+{</div><div class='add'>+	return ceph_wbc-&gt;num_ops &gt;=</div><div class='add'>+		(ceph_wbc-&gt;from_pool ?  CEPH_OSD_SLAB_OPS : CEPH_OSD_MAX_OPS);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline</div><div class='add'>+bool is_write_congestion_happened(struct ceph_fs_client *fsc)</div><div class='add'>+{</div><div class='add'>+	return atomic_long_inc_return(&amp;fsc-&gt;writeback_count) &gt;</div><div class='add'>+		CONGESTION_ON_THRESH(fsc-&gt;mount_options-&gt;congestion_kb);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-			if (atomic_long_inc_return(&amp;fsc-&gt;writeback_count) &gt;</div><div class='del'>-			    CONGESTION_ON_THRESH(</div><div class='del'>-				    fsc-&gt;mount_options-&gt;congestion_kb)) {</div><div class='del'>-				set_bdi_congested(inode_to_bdi(inode),</div><div class='del'>-						  BLK_RW_ASYNC);</div><div class='add'>+static inline int move_dirty_folio_in_page_array(struct address_space *mapping,</div><div class='add'>+		struct writeback_control *wbc,</div><div class='add'>+		struct ceph_writeback_ctl *ceph_wbc, struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = mapping-&gt;host;</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='add'>+	struct page **pages = ceph_wbc-&gt;pages;</div><div class='add'>+	unsigned int index = ceph_wbc-&gt;locked_pages;</div><div class='add'>+	gfp_t gfp_flags = ceph_wbc-&gt;locked_pages ? GFP_NOWAIT : GFP_NOFS;</div><div class='add'>+</div><div class='add'>+	if (IS_ENCRYPTED(inode)) {</div><div class='add'>+		pages[index] = fscrypt_encrypt_pagecache_blocks(folio,</div><div class='add'>+								PAGE_SIZE,</div><div class='add'>+								0,</div><div class='add'>+								gfp_flags);</div><div class='add'>+		if (IS_ERR(pages[index])) {</div><div class='add'>+			int err = PTR_ERR(pages[index]);</div><div class='add'>+</div><div class='add'>+			if (err == -EINVAL) {</div><div class='add'>+				pr_err_client(cl, "inode-&gt;i_blkbits=%hhu\n",</div><div class='add'>+						inode-&gt;i_blkbits);</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='add'>+			/* better not fail on first page! */</div><div class='add'>+			BUG_ON(ceph_wbc-&gt;locked_pages == 0);</div><div class='add'>+</div><div class='add'>+			pages[index] = NULL;</div><div class='add'>+			return err;</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		pages[index] = &amp;folio-&gt;page;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ceph_wbc-&gt;locked_pages++;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-			pages[locked_pages++] = page;</div><div class='del'>-			pvec.pages[i] = NULL;</div><div class='add'>+static</div><div class='add'>+int ceph_process_folio_batch(struct address_space *mapping,</div><div class='add'>+			     struct writeback_control *wbc,</div><div class='add'>+			     struct ceph_writeback_ctl *ceph_wbc)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = mapping-&gt;host;</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='add'>+	struct folio *folio = NULL;</div><div class='add'>+	unsigned i;</div><div class='add'>+	int rc = 0;</div><div class='add'>+</div><div class='add'>+	for (i = 0; can_next_page_be_processed(ceph_wbc, i); i++) {</div><div class='add'>+		folio = ceph_wbc-&gt;fbatch.folios[i];</div><div class='ctx'> </div><div class='del'>-			len += thp_size(page);</div><div class='add'>+		if (!folio)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		doutc(cl, "? %p idx %lu, folio_test_writeback %#x, "</div><div class='add'>+			"folio_test_dirty %#x, folio_test_locked %#x\n",</div><div class='add'>+			folio, folio-&gt;index, folio_test_writeback(folio),</div><div class='add'>+			folio_test_dirty(folio),</div><div class='add'>+			folio_test_locked(folio));</div><div class='add'>+</div><div class='add'>+		if (folio_test_writeback(folio) ||</div><div class='add'>+		    folio_test_private_2(folio) /* [DEPRECATED] */) {</div><div class='add'>+			doutc(cl, "waiting on writeback %p\n", folio);</div><div class='add'>+			folio_wait_writeback(folio);</div><div class='add'>+			folio_wait_private_2(folio); /* [DEPRECATED] */</div><div class='add'>+			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		/* did we get anything? */</div><div class='del'>-		if (!locked_pages)</div><div class='del'>-			goto release_pvec_pages;</div><div class='del'>-		if (i) {</div><div class='del'>-			unsigned j, n = 0;</div><div class='del'>-			/* shift unused page to beginning of pvec */</div><div class='del'>-			for (j = 0; j &lt; pvec_pages; j++) {</div><div class='del'>-				if (!pvec.pages[j])</div><div class='del'>-					continue;</div><div class='del'>-				if (n &lt; j)</div><div class='del'>-					pvec.pages[n] = pvec.pages[j];</div><div class='del'>-				n++;</div><div class='del'>-			}</div><div class='del'>-			pvec.nr = n;</div><div class='add'>+		if (ceph_wbc-&gt;locked_pages == 0)</div><div class='add'>+			folio_lock(folio);</div><div class='add'>+		else if (!folio_trylock(folio))</div><div class='add'>+			break;</div><div class='ctx'> </div><div class='del'>-			if (pvec_pages &amp;&amp; i == pvec_pages &amp;&amp;</div><div class='del'>-			    locked_pages &lt; max_pages) {</div><div class='del'>-				dout("reached end pvec, trying for more\n");</div><div class='del'>-				pagevec_release(&amp;pvec);</div><div class='del'>-				goto get_more_pages;</div><div class='add'>+		rc = ceph_check_page_before_write(mapping, wbc,</div><div class='add'>+						  ceph_wbc, folio);</div><div class='add'>+		if (rc == -ENODATA) {</div><div class='add'>+			rc = 0;</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+			ceph_wbc-&gt;fbatch.folios[i] = NULL;</div><div class='add'>+			continue;</div><div class='add'>+		} else if (rc == -E2BIG) {</div><div class='add'>+			rc = 0;</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+			ceph_wbc-&gt;fbatch.folios[i] = NULL;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (!folio_clear_dirty_for_io(folio)) {</div><div class='add'>+			doutc(cl, "%p !folio_clear_dirty_for_io\n", folio);</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+			ceph_wbc-&gt;fbatch.folios[i] = NULL;</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * We have something to write.  If this is</div><div class='add'>+		 * the first locked page this time through,</div><div class='add'>+		 * calculate max possible write size and</div><div class='add'>+		 * allocate a page array</div><div class='add'>+		 */</div><div class='add'>+		if (ceph_wbc-&gt;locked_pages == 0) {</div><div class='add'>+			ceph_allocate_page_array(mapping, ceph_wbc, folio);</div><div class='add'>+		} else if (!is_folio_index_contiguous(ceph_wbc, folio)) {</div><div class='add'>+			if (is_num_ops_too_big(ceph_wbc)) {</div><div class='add'>+				folio_redirty_for_writepage(wbc, folio);</div><div class='add'>+				folio_unlock(folio);</div><div class='add'>+				break;</div><div class='ctx'> 			}</div><div class='add'>+</div><div class='add'>+			ceph_wbc-&gt;num_ops++;</div><div class='add'>+			ceph_wbc-&gt;offset = (u64)folio_pos(folio);</div><div class='add'>+			ceph_wbc-&gt;len = 0;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* note position of first page in fbatch */</div><div class='add'>+		doutc(cl, "%llx.%llx will write folio %p idx %lu\n",</div><div class='add'>+		      ceph_vinop(inode), folio, folio-&gt;index);</div><div class='add'>+</div><div class='add'>+		fsc-&gt;write_congested = is_write_congestion_happened(fsc);</div><div class='add'>+</div><div class='add'>+		rc = move_dirty_folio_in_page_array(mapping, wbc, ceph_wbc,</div><div class='add'>+				folio);</div><div class='add'>+		if (rc) {</div><div class='add'>+			folio_redirty_for_writepage(wbc, folio);</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		ceph_wbc-&gt;fbatch.folios[i] = NULL;</div><div class='add'>+		ceph_wbc-&gt;len += folio_size(folio);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ceph_wbc-&gt;processed_in_fbatch = i;</div><div class='add'>+</div><div class='add'>+	return rc;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline</div><div class='add'>+void ceph_shift_unused_folios_left(struct folio_batch *fbatch)</div><div class='add'>+{</div><div class='add'>+	unsigned j, n = 0;</div><div class='add'>+</div><div class='add'>+	/* shift unused page to beginning of fbatch */</div><div class='add'>+	for (j = 0; j &lt; folio_batch_count(fbatch); j++) {</div><div class='add'>+		if (!fbatch-&gt;folios[j])</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		if (n &lt; j) {</div><div class='add'>+			fbatch-&gt;folios[n] = fbatch-&gt;folios[j];</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		n++;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	fbatch-&gt;nr = n;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static</div><div class='add'>+int ceph_submit_write(struct address_space *mapping,</div><div class='add'>+			struct writeback_control *wbc,</div><div class='add'>+			struct ceph_writeback_ctl *ceph_wbc)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = mapping-&gt;host;</div><div class='add'>+	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='add'>+	struct ceph_vino vino = ceph_vino(inode);</div><div class='add'>+	struct ceph_osd_request *req = NULL;</div><div class='add'>+	struct page *page = NULL;</div><div class='add'>+	bool caching = ceph_is_cache_enabled(inode);</div><div class='add'>+	u64 offset;</div><div class='add'>+	u64 len;</div><div class='add'>+	unsigned i;</div><div class='add'>+</div><div class='ctx'> new_request:</div><div class='del'>-		offset = page_offset(pages[0]);</div><div class='del'>-		len = wsize;</div><div class='add'>+	offset = ceph_fscrypt_page_offset(ceph_wbc-&gt;pages[0]);</div><div class='add'>+	len = ceph_wbc-&gt;wsize;</div><div class='ctx'> </div><div class='add'>+	req = ceph_osdc_new_request(&amp;fsc-&gt;client-&gt;osdc,</div><div class='add'>+				    &amp;ci-&gt;i_layout, vino,</div><div class='add'>+				    offset, &amp;len, 0, ceph_wbc-&gt;num_ops,</div><div class='add'>+				    CEPH_OSD_OP_WRITE, CEPH_OSD_FLAG_WRITE,</div><div class='add'>+				    ceph_wbc-&gt;snapc, ceph_wbc-&gt;truncate_seq,</div><div class='add'>+				    ceph_wbc-&gt;truncate_size, false);</div><div class='add'>+	if (IS_ERR(req)) {</div><div class='ctx'> 		req = ceph_osdc_new_request(&amp;fsc-&gt;client-&gt;osdc,</div><div class='del'>-					&amp;ci-&gt;i_layout, vino,</div><div class='del'>-					offset, &amp;len, 0, num_ops,</div><div class='del'>-					CEPH_OSD_OP_WRITE, CEPH_OSD_FLAG_WRITE,</div><div class='del'>-					snapc, ceph_wbc.truncate_seq,</div><div class='del'>-					ceph_wbc.truncate_size, false);</div><div class='del'>-		if (IS_ERR(req)) {</div><div class='del'>-			req = ceph_osdc_new_request(&amp;fsc-&gt;client-&gt;osdc,</div><div class='del'>-						&amp;ci-&gt;i_layout, vino,</div><div class='del'>-						offset, &amp;len, 0,</div><div class='del'>-						min(num_ops,</div><div class='del'>-						    CEPH_OSD_SLAB_OPS),</div><div class='del'>-						CEPH_OSD_OP_WRITE,</div><div class='del'>-						CEPH_OSD_FLAG_WRITE,</div><div class='del'>-						snapc, ceph_wbc.truncate_seq,</div><div class='del'>-						ceph_wbc.truncate_size, true);</div><div class='del'>-			BUG_ON(IS_ERR(req));</div><div class='add'>+					    &amp;ci-&gt;i_layout, vino,</div><div class='add'>+					    offset, &amp;len, 0,</div><div class='add'>+					    min(ceph_wbc-&gt;num_ops,</div><div class='add'>+						CEPH_OSD_SLAB_OPS),</div><div class='add'>+					    CEPH_OSD_OP_WRITE,</div><div class='add'>+					    CEPH_OSD_FLAG_WRITE,</div><div class='add'>+					    ceph_wbc-&gt;snapc,</div><div class='add'>+					    ceph_wbc-&gt;truncate_seq,</div><div class='add'>+					    ceph_wbc-&gt;truncate_size,</div><div class='add'>+					    true);</div><div class='add'>+		BUG_ON(IS_ERR(req));</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	page = ceph_wbc-&gt;pages[ceph_wbc-&gt;locked_pages - 1];</div><div class='add'>+	BUG_ON(len &lt; ceph_fscrypt_page_offset(page) + thp_size(page) - offset);</div><div class='add'>+</div><div class='add'>+	if (!ceph_inc_osd_stopping_blocker(fsc-&gt;mdsc)) {</div><div class='add'>+		for (i = 0; i &lt; folio_batch_count(&amp;ceph_wbc-&gt;fbatch); i++) {</div><div class='add'>+			struct folio *folio = ceph_wbc-&gt;fbatch.folios[i];</div><div class='add'>+</div><div class='add'>+			if (!folio)</div><div class='add'>+				continue;</div><div class='add'>+</div><div class='add'>+			page = &amp;folio-&gt;page;</div><div class='add'>+			redirty_page_for_writepage(wbc, page);</div><div class='add'>+			unlock_page(page);</div><div class='ctx'> 		}</div><div class='del'>-		BUG_ON(len &lt; page_offset(pages[locked_pages - 1]) +</div><div class='del'>-			     thp_size(page) - offset);</div><div class='del'>-</div><div class='del'>-		req-&gt;r_callback = writepages_finish;</div><div class='del'>-		req-&gt;r_inode = inode;</div><div class='del'>-</div><div class='del'>-		/* Format the osd request message and submit the write */</div><div class='del'>-		len = 0;</div><div class='del'>-		data_pages = pages;</div><div class='del'>-		op_idx = 0;</div><div class='del'>-		for (i = 0; i &lt; locked_pages; i++) {</div><div class='del'>-			u64 cur_offset = page_offset(pages[i]);</div><div class='del'>-			if (offset + len != cur_offset) {</div><div class='del'>-				if (op_idx + 1 == req-&gt;r_num_ops)</div><div class='del'>-					break;</div><div class='del'>-				osd_req_op_extent_dup_last(req, op_idx,</div><div class='del'>-							   cur_offset - offset);</div><div class='del'>-				dout("writepages got pages at %llu~%llu\n",</div><div class='del'>-				     offset, len);</div><div class='del'>-				osd_req_op_extent_osd_data_pages(req, op_idx,</div><div class='del'>-							data_pages, len, 0,</div><div class='del'>-							from_pool, false);</div><div class='del'>-				osd_req_op_extent_update(req, op_idx, len);</div><div class='del'>-</div><div class='del'>-				len = 0;</div><div class='del'>-				offset = cur_offset; </div><div class='del'>-				data_pages = pages + i;</div><div class='del'>-				op_idx++;</div><div class='del'>-			}</div><div class='ctx'> </div><div class='del'>-			set_page_writeback(pages[i]);</div><div class='del'>-			len += thp_size(page);</div><div class='add'>+		for (i = 0; i &lt; ceph_wbc-&gt;locked_pages; i++) {</div><div class='add'>+			page = ceph_fscrypt_pagecache_page(ceph_wbc-&gt;pages[i]);</div><div class='add'>+</div><div class='add'>+			if (!page)</div><div class='add'>+				continue;</div><div class='add'>+</div><div class='add'>+			redirty_page_for_writepage(wbc, page);</div><div class='add'>+			unlock_page(page);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (ceph_wbc.size_stable) {</div><div class='del'>-			len = min(len, ceph_wbc.i_size - offset);</div><div class='del'>-		} else if (i == locked_pages) {</div><div class='del'>-			/* writepages_finish() clears writeback pages</div><div class='del'>-			 * according to the data length, so make sure</div><div class='del'>-			 * data length covers all locked pages */</div><div class='del'>-			u64 min_len = len + 1 - thp_size(page);</div><div class='del'>-			len = get_writepages_data_length(inode, pages[i - 1],</div><div class='del'>-							 offset);</div><div class='del'>-			len = max(len, min_len);</div><div class='add'>+		ceph_osdc_put_request(req);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	req-&gt;r_callback = writepages_finish;</div><div class='add'>+	req-&gt;r_inode = inode;</div><div class='add'>+</div><div class='add'>+	/* Format the osd request message and submit the write */</div><div class='add'>+	len = 0;</div><div class='add'>+	ceph_wbc-&gt;data_pages = ceph_wbc-&gt;pages;</div><div class='add'>+	ceph_wbc-&gt;op_idx = 0;</div><div class='add'>+	for (i = 0; i &lt; ceph_wbc-&gt;locked_pages; i++) {</div><div class='add'>+		u64 cur_offset;</div><div class='add'>+</div><div class='add'>+		page = ceph_fscrypt_pagecache_page(ceph_wbc-&gt;pages[i]);</div><div class='add'>+		cur_offset = page_offset(page);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Discontinuity in page range? Ceph can handle that by just passing</div><div class='add'>+		 * multiple extents in the write op.</div><div class='add'>+		 */</div><div class='add'>+		if (offset + len != cur_offset) {</div><div class='add'>+			/* If it's full, stop here */</div><div class='add'>+			if (ceph_wbc-&gt;op_idx + 1 == req-&gt;r_num_ops)</div><div class='add'>+				break;</div><div class='add'>+</div><div class='add'>+			/* Kick off an fscache write with what we have so far. */</div><div class='add'>+			ceph_fscache_write_to_cache(inode, offset, len, caching);</div><div class='add'>+</div><div class='add'>+			/* Start a new extent */</div><div class='add'>+			osd_req_op_extent_dup_last(req, ceph_wbc-&gt;op_idx,</div><div class='add'>+						   cur_offset - offset);</div><div class='add'>+</div><div class='add'>+			doutc(cl, "got pages at %llu~%llu\n", offset, len);</div><div class='add'>+</div><div class='add'>+			osd_req_op_extent_osd_data_pages(req, ceph_wbc-&gt;op_idx,</div><div class='add'>+							 ceph_wbc-&gt;data_pages,</div><div class='add'>+							 len, 0,</div><div class='add'>+							 ceph_wbc-&gt;from_pool,</div><div class='add'>+							 false);</div><div class='add'>+			osd_req_op_extent_update(req, ceph_wbc-&gt;op_idx, len);</div><div class='add'>+</div><div class='add'>+			len = 0;</div><div class='add'>+			offset = cur_offset;</div><div class='add'>+			ceph_wbc-&gt;data_pages = ceph_wbc-&gt;pages + i;</div><div class='add'>+			ceph_wbc-&gt;op_idx++;</div><div class='ctx'> 		}</div><div class='del'>-		dout("writepages got pages at %llu~%llu\n", offset, len);</div><div class='del'>-</div><div class='del'>-		osd_req_op_extent_osd_data_pages(req, op_idx, data_pages, len,</div><div class='del'>-						 0, from_pool, false);</div><div class='del'>-		osd_req_op_extent_update(req, op_idx, len);</div><div class='del'>-</div><div class='del'>-		BUG_ON(op_idx + 1 != req-&gt;r_num_ops);</div><div class='del'>-</div><div class='del'>-		from_pool = false;</div><div class='del'>-		if (i &lt; locked_pages) {</div><div class='del'>-			BUG_ON(num_ops &lt;= req-&gt;r_num_ops);</div><div class='del'>-			num_ops -= req-&gt;r_num_ops;</div><div class='del'>-			locked_pages -= i;</div><div class='del'>-</div><div class='del'>-			/* allocate new pages array for next request */</div><div class='del'>-			data_pages = pages;</div><div class='del'>-			pages = kmalloc_array(locked_pages, sizeof(*pages),</div><div class='del'>-					      GFP_NOFS);</div><div class='del'>-			if (!pages) {</div><div class='del'>-				from_pool = true;</div><div class='del'>-				pages = mempool_alloc(ceph_wb_pagevec_pool, GFP_NOFS);</div><div class='del'>-				BUG_ON(!pages);</div><div class='add'>+</div><div class='add'>+		set_page_writeback(page);</div><div class='add'>+</div><div class='add'>+		if (caching)</div><div class='add'>+			ceph_set_page_fscache(page);</div><div class='add'>+</div><div class='add'>+		len += thp_size(page);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ceph_fscache_write_to_cache(inode, offset, len, caching);</div><div class='add'>+</div><div class='add'>+	if (ceph_wbc-&gt;size_stable) {</div><div class='add'>+		len = min(len, ceph_wbc-&gt;i_size - offset);</div><div class='add'>+	} else if (i == ceph_wbc-&gt;locked_pages) {</div><div class='add'>+		/* writepages_finish() clears writeback pages</div><div class='add'>+		 * according to the data length, so make sure</div><div class='add'>+		 * data length covers all locked pages */</div><div class='add'>+		u64 min_len = len + 1 - thp_size(page);</div><div class='add'>+		len = get_writepages_data_length(inode,</div><div class='add'>+						 ceph_wbc-&gt;pages[i - 1],</div><div class='add'>+						 offset);</div><div class='add'>+		len = max(len, min_len);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (IS_ENCRYPTED(inode))</div><div class='add'>+		len = round_up(len, CEPH_FSCRYPT_BLOCK_SIZE);</div><div class='add'>+</div><div class='add'>+	doutc(cl, "got pages at %llu~%llu\n", offset, len);</div><div class='add'>+</div><div class='add'>+	if (IS_ENCRYPTED(inode) &amp;&amp;</div><div class='add'>+	    ((offset | len) &amp; ~CEPH_FSCRYPT_BLOCK_MASK)) {</div><div class='add'>+		pr_warn_client(cl,</div><div class='add'>+			"bad encrypted write offset=%lld len=%llu\n",</div><div class='add'>+			offset, len);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	osd_req_op_extent_osd_data_pages(req, ceph_wbc-&gt;op_idx,</div><div class='add'>+					 ceph_wbc-&gt;data_pages, len,</div><div class='add'>+					 0, ceph_wbc-&gt;from_pool, false);</div><div class='add'>+	osd_req_op_extent_update(req, ceph_wbc-&gt;op_idx, len);</div><div class='add'>+</div><div class='add'>+	BUG_ON(ceph_wbc-&gt;op_idx + 1 != req-&gt;r_num_ops);</div><div class='add'>+</div><div class='add'>+	ceph_wbc-&gt;from_pool = false;</div><div class='add'>+	if (i &lt; ceph_wbc-&gt;locked_pages) {</div><div class='add'>+		BUG_ON(ceph_wbc-&gt;num_ops &lt;= req-&gt;r_num_ops);</div><div class='add'>+		ceph_wbc-&gt;num_ops -= req-&gt;r_num_ops;</div><div class='add'>+		ceph_wbc-&gt;locked_pages -= i;</div><div class='add'>+</div><div class='add'>+		/* allocate new pages array for next request */</div><div class='add'>+		ceph_wbc-&gt;data_pages = ceph_wbc-&gt;pages;</div><div class='add'>+		__ceph_allocate_page_array(ceph_wbc, ceph_wbc-&gt;locked_pages);</div><div class='add'>+		memcpy(ceph_wbc-&gt;pages, ceph_wbc-&gt;data_pages + i,</div><div class='add'>+			ceph_wbc-&gt;locked_pages * sizeof(*ceph_wbc-&gt;pages));</div><div class='add'>+		memset(ceph_wbc-&gt;data_pages + i, 0,</div><div class='add'>+			ceph_wbc-&gt;locked_pages * sizeof(*ceph_wbc-&gt;pages));</div><div class='add'>+	} else {</div><div class='add'>+		BUG_ON(ceph_wbc-&gt;num_ops != req-&gt;r_num_ops);</div><div class='add'>+		/* request message now owns the pages array */</div><div class='add'>+		ceph_wbc-&gt;pages = NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	req-&gt;r_mtime = inode_get_mtime(inode);</div><div class='add'>+	ceph_osdc_start_request(&amp;fsc-&gt;client-&gt;osdc, req);</div><div class='add'>+	req = NULL;</div><div class='add'>+</div><div class='add'>+	wbc-&gt;nr_to_write -= i;</div><div class='add'>+	if (ceph_wbc-&gt;pages)</div><div class='add'>+		goto new_request;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static</div><div class='add'>+void ceph_wait_until_current_writes_complete(struct address_space *mapping,</div><div class='add'>+					     struct writeback_control *wbc,</div><div class='add'>+					     struct ceph_writeback_ctl *ceph_wbc)</div><div class='add'>+{</div><div class='add'>+	struct page *page;</div><div class='add'>+	unsigned i, nr;</div><div class='add'>+</div><div class='add'>+	if (wbc-&gt;sync_mode != WB_SYNC_NONE &amp;&amp;</div><div class='add'>+	    ceph_wbc-&gt;start_index == 0 &amp;&amp; /* all dirty pages were checked */</div><div class='add'>+	    !ceph_wbc-&gt;head_snapc) {</div><div class='add'>+		ceph_wbc-&gt;index = 0;</div><div class='add'>+</div><div class='add'>+		while ((ceph_wbc-&gt;index &lt;= ceph_wbc-&gt;end) &amp;&amp;</div><div class='add'>+			(nr = filemap_get_folios_tag(mapping,</div><div class='add'>+						     &amp;ceph_wbc-&gt;index,</div><div class='add'>+						     (pgoff_t)-1,</div><div class='add'>+						     PAGECACHE_TAG_WRITEBACK,</div><div class='add'>+						     &amp;ceph_wbc-&gt;fbatch))) {</div><div class='add'>+			for (i = 0; i &lt; nr; i++) {</div><div class='add'>+				page = &amp;ceph_wbc-&gt;fbatch.folios[i]-&gt;page;</div><div class='add'>+				if (page_snap_context(page) != ceph_wbc-&gt;snapc)</div><div class='add'>+					continue;</div><div class='add'>+				wait_on_page_writeback(page);</div><div class='ctx'> 			}</div><div class='del'>-			memcpy(pages, data_pages + i,</div><div class='del'>-			       locked_pages * sizeof(*pages));</div><div class='del'>-			memset(data_pages + i, 0,</div><div class='del'>-			       locked_pages * sizeof(*pages));</div><div class='del'>-		} else {</div><div class='del'>-			BUG_ON(num_ops != req-&gt;r_num_ops);</div><div class='del'>-			index = pages[i - 1]-&gt;index + 1;</div><div class='del'>-			/* request message now owns the pages array */</div><div class='del'>-			pages = NULL;</div><div class='add'>+</div><div class='add'>+			folio_batch_release(&amp;ceph_wbc-&gt;fbatch);</div><div class='add'>+			cond_resched();</div><div class='ctx'> 		}</div><div class='add'>+	}</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		req-&gt;r_mtime = inode-&gt;i_mtime;</div><div class='del'>-		rc = ceph_osdc_start_request(&amp;fsc-&gt;client-&gt;osdc, req, true);</div><div class='del'>-		BUG_ON(rc);</div><div class='del'>-		req = NULL;</div><div class='add'>+/*</div><div class='add'>+ * initiate async writeback</div><div class='add'>+ */</div><div class='add'>+static int ceph_writepages_start(struct address_space *mapping,</div><div class='add'>+				 struct writeback_control *wbc)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = mapping-&gt;host;</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='add'>+	struct ceph_writeback_ctl ceph_wbc;</div><div class='add'>+	int rc = 0;</div><div class='add'>+</div><div class='add'>+	if (wbc-&gt;sync_mode == WB_SYNC_NONE &amp;&amp; fsc-&gt;write_congested)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	doutc(cl, "%llx.%llx (mode=%s)\n", ceph_vinop(inode),</div><div class='add'>+	      wbc-&gt;sync_mode == WB_SYNC_NONE ? "NONE" :</div><div class='add'>+	      (wbc-&gt;sync_mode == WB_SYNC_ALL ? "ALL" : "HOLD"));</div><div class='add'>+</div><div class='add'>+	if (is_forced_umount(mapping)) {</div><div class='add'>+		/* we're in a forced umount, don't write! */</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ceph_init_writeback_ctl(mapping, wbc, &amp;ceph_wbc);</div><div class='ctx'> </div><div class='del'>-		wbc-&gt;nr_to_write -= i;</div><div class='del'>-		if (pages)</div><div class='del'>-			goto new_request;</div><div class='add'>+	if (!ceph_inc_osd_stopping_blocker(fsc-&gt;mdsc)) {</div><div class='add'>+		rc = -EIO;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+retry:</div><div class='add'>+	rc = ceph_define_writeback_range(mapping, wbc, &amp;ceph_wbc);</div><div class='add'>+	if (rc == -ENODATA) {</div><div class='add'>+		/* hmm, why does writepages get called when there</div><div class='add'>+		   is no dirty data? */</div><div class='add'>+		rc = 0;</div><div class='add'>+		goto dec_osd_stopping_blocker;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (wbc-&gt;sync_mode == WB_SYNC_ALL || wbc-&gt;tagged_writepages)</div><div class='add'>+		tag_pages_for_writeback(mapping, ceph_wbc.index, ceph_wbc.end);</div><div class='add'>+</div><div class='add'>+	while (!has_writeback_done(&amp;ceph_wbc)) {</div><div class='add'>+		ceph_wbc.locked_pages = 0;</div><div class='add'>+		ceph_wbc.max_pages = ceph_wbc.wsize &gt;&gt; PAGE_SHIFT;</div><div class='add'>+</div><div class='add'>+get_more_pages:</div><div class='add'>+		ceph_folio_batch_reinit(&amp;ceph_wbc);</div><div class='add'>+</div><div class='add'>+		ceph_wbc.nr_folios = filemap_get_folios_tag(mapping,</div><div class='add'>+							    &amp;ceph_wbc.index,</div><div class='add'>+							    ceph_wbc.end,</div><div class='add'>+							    ceph_wbc.tag,</div><div class='add'>+							    &amp;ceph_wbc.fbatch);</div><div class='add'>+		doutc(cl, "pagevec_lookup_range_tag for tag %#x got %d\n",</div><div class='add'>+			ceph_wbc.tag, ceph_wbc.nr_folios);</div><div class='add'>+</div><div class='add'>+		if (!ceph_wbc.nr_folios &amp;&amp; !ceph_wbc.locked_pages)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+process_folio_batch:</div><div class='add'>+		rc = ceph_process_folio_batch(mapping, wbc, &amp;ceph_wbc);</div><div class='add'>+		ceph_shift_unused_folios_left(&amp;ceph_wbc.fbatch);</div><div class='add'>+		if (rc)</div><div class='add'>+			goto release_folios;</div><div class='add'>+</div><div class='add'>+		/* did we get anything? */</div><div class='add'>+		if (!ceph_wbc.locked_pages)</div><div class='add'>+			goto release_folios;</div><div class='add'>+</div><div class='add'>+		if (ceph_wbc.processed_in_fbatch) {</div><div class='add'>+			if (folio_batch_count(&amp;ceph_wbc.fbatch) == 0 &amp;&amp;</div><div class='add'>+			    ceph_wbc.locked_pages &lt; ceph_wbc.max_pages) {</div><div class='add'>+				doutc(cl, "reached end fbatch, trying for more\n");</div><div class='add'>+				goto get_more_pages;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		rc = ceph_submit_write(mapping, wbc, &amp;ceph_wbc);</div><div class='add'>+		if (rc)</div><div class='add'>+			goto release_folios;</div><div class='add'>+</div><div class='add'>+		ceph_wbc.locked_pages = 0;</div><div class='add'>+		ceph_wbc.strip_unit_end = 0;</div><div class='add'>+</div><div class='add'>+		if (folio_batch_count(&amp;ceph_wbc.fbatch) &gt; 0) {</div><div class='add'>+			ceph_wbc.nr_folios =</div><div class='add'>+				folio_batch_count(&amp;ceph_wbc.fbatch);</div><div class='add'>+			goto process_folio_batch;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We stop writing back only if we are not doing</div><div class='hunk'>@@ -1066,58 +1721,44 @@ new_request:</div><div class='ctx'> 		 * we tagged for writeback prior to entering this loop.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (wbc-&gt;nr_to_write &lt;= 0 &amp;&amp; wbc-&gt;sync_mode == WB_SYNC_NONE)</div><div class='del'>-			done = true;</div><div class='add'>+			ceph_wbc.done = true;</div><div class='ctx'> </div><div class='del'>-release_pvec_pages:</div><div class='del'>-		dout("pagevec_release on %d pages (%p)\n", (int)pvec.nr,</div><div class='del'>-		     pvec.nr ? pvec.pages[0] : NULL);</div><div class='del'>-		pagevec_release(&amp;pvec);</div><div class='add'>+release_folios:</div><div class='add'>+		doutc(cl, "folio_batch release on %d folios (%p)\n",</div><div class='add'>+		      (int)ceph_wbc.fbatch.nr,</div><div class='add'>+		      ceph_wbc.fbatch.nr ? ceph_wbc.fbatch.folios[0] : NULL);</div><div class='add'>+		folio_batch_release(&amp;ceph_wbc.fbatch);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (should_loop &amp;&amp; !done) {</div><div class='add'>+	if (ceph_wbc.should_loop &amp;&amp; !ceph_wbc.done) {</div><div class='ctx'> 		/* more to do; loop back to beginning of file */</div><div class='del'>-		dout("writepages looping back to beginning of file\n");</div><div class='del'>-		end = start_index - 1; /* OK even when start_index == 0 */</div><div class='add'>+		doutc(cl, "looping back to beginning of file\n");</div><div class='add'>+		/* OK even when start_index == 0 */</div><div class='add'>+		ceph_wbc.end = ceph_wbc.start_index - 1;</div><div class='ctx'> </div><div class='ctx'> 		/* to write dirty pages associated with next snapc,</div><div class='ctx'> 		 * we need to wait until current writes complete */</div><div class='del'>-		if (wbc-&gt;sync_mode != WB_SYNC_NONE &amp;&amp;</div><div class='del'>-		    start_index == 0 &amp;&amp; /* all dirty pages were checked */</div><div class='del'>-		    !ceph_wbc.head_snapc) {</div><div class='del'>-			struct page *page;</div><div class='del'>-			unsigned i, nr;</div><div class='del'>-			index = 0;</div><div class='del'>-			while ((index &lt;= end) &amp;&amp;</div><div class='del'>-			       (nr = pagevec_lookup_tag(&amp;pvec, mapping, &amp;index,</div><div class='del'>-						PAGECACHE_TAG_WRITEBACK))) {</div><div class='del'>-				for (i = 0; i &lt; nr; i++) {</div><div class='del'>-					page = pvec.pages[i];</div><div class='del'>-					if (page_snap_context(page) != snapc)</div><div class='del'>-						continue;</div><div class='del'>-					wait_on_page_writeback(page);</div><div class='del'>-				}</div><div class='del'>-				pagevec_release(&amp;pvec);</div><div class='del'>-				cond_resched();</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='add'>+		ceph_wait_until_current_writes_complete(mapping, wbc, &amp;ceph_wbc);</div><div class='ctx'> </div><div class='del'>-		start_index = 0;</div><div class='del'>-		index = 0;</div><div class='add'>+		ceph_wbc.start_index = 0;</div><div class='add'>+		ceph_wbc.index = 0;</div><div class='ctx'> 		goto retry;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (wbc-&gt;range_cyclic || (range_whole &amp;&amp; wbc-&gt;nr_to_write &gt; 0))</div><div class='del'>-		mapping-&gt;writeback_index = index;</div><div class='add'>+	if (wbc-&gt;range_cyclic || (ceph_wbc.range_whole &amp;&amp; wbc-&gt;nr_to_write &gt; 0))</div><div class='add'>+		mapping-&gt;writeback_index = ceph_wbc.index;</div><div class='add'>+</div><div class='add'>+dec_osd_stopping_blocker:</div><div class='add'>+	ceph_dec_osd_stopping_blocker(fsc-&gt;mdsc);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	ceph_osdc_put_request(req);</div><div class='del'>-	ceph_put_snap_context(last_snapc);</div><div class='del'>-	dout("writepages dend - startone, rc = %d\n", rc);</div><div class='add'>+	ceph_put_snap_context(ceph_wbc.last_snapc);</div><div class='add'>+	doutc(cl, "%llx.%llx dend - startone, rc = %d\n", ceph_vinop(inode),</div><div class='add'>+	      rc);</div><div class='add'>+</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * See if a given @snapc is either writeable, or already written.</div><div class='ctx'>  */</div><div class='hunk'>@@ -1133,53 +1774,56 @@ static int context_is_writeable_or_written(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * ceph_find_incompatible - find an incompatible context and return it</div><div class='del'>- * @page: page being dirtied</div><div class='add'>+ * @folio: folio being dirtied</div><div class='ctx'>  *</div><div class='del'>- * We are only allowed to write into/dirty a page if the page is</div><div class='add'>+ * We are only allowed to write into/dirty a folio if the folio is</div><div class='ctx'>  * clean, or already dirty within the same snap context. Returns a</div><div class='ctx'>  * conflicting context if there is one, NULL if there isn't, or a</div><div class='ctx'>  * negative error code on other errors.</div><div class='ctx'>  *</div><div class='del'>- * Must be called with page lock held.</div><div class='add'>+ * Must be called with folio lock held.</div><div class='ctx'>  */</div><div class='ctx'> static struct ceph_snap_context *</div><div class='del'>-ceph_find_incompatible(struct page *page)</div><div class='add'>+ceph_find_incompatible(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_inode_to_client(inode);</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> </div><div class='del'>-	if (READ_ONCE(fsc-&gt;mount_state) &gt;= CEPH_MOUNT_SHUTDOWN) {</div><div class='del'>-		dout(" page %p forced umount\n", page);</div><div class='del'>-		return ERR_PTR(-EIO);</div><div class='add'>+	if (ceph_inode_is_shutdown(inode)) {</div><div class='add'>+		doutc(cl, " %llx.%llx folio %p is shutdown\n",</div><div class='add'>+		      ceph_vinop(inode), folio);</div><div class='add'>+		return ERR_PTR(-ESTALE);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	for (;;) {</div><div class='ctx'> 		struct ceph_snap_context *snapc, *oldest;</div><div class='ctx'> </div><div class='del'>-		wait_on_page_writeback(page);</div><div class='add'>+		folio_wait_writeback(folio);</div><div class='ctx'> </div><div class='del'>-		snapc = page_snap_context(page);</div><div class='add'>+		snapc = page_snap_context(&amp;folio-&gt;page);</div><div class='ctx'> 		if (!snapc || snapc == ci-&gt;i_head_snapc)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * this page is already dirty in another (older) snap</div><div class='add'>+		 * this folio is already dirty in another (older) snap</div><div class='ctx'> 		 * context!  is it writeable now?</div><div class='ctx'> 		 */</div><div class='ctx'> 		oldest = get_oldest_context(inode, NULL, NULL);</div><div class='ctx'> 		if (snapc-&gt;seq &gt; oldest-&gt;seq) {</div><div class='ctx'> 			/* not writeable -- return it for the caller to deal with */</div><div class='ctx'> 			ceph_put_snap_context(oldest);</div><div class='del'>-			dout(" page %p snapc %p not current or oldest\n", page, snapc);</div><div class='add'>+			doutc(cl, " %llx.%llx folio %p snapc %p not current or oldest\n",</div><div class='add'>+			      ceph_vinop(inode), folio, snapc);</div><div class='ctx'> 			return ceph_get_snap_context(snapc);</div><div class='ctx'> 		}</div><div class='ctx'> 		ceph_put_snap_context(oldest);</div><div class='ctx'> </div><div class='del'>-		/* yay, writeable, do it now (without dropping page lock) */</div><div class='del'>-		dout(" page %p snapc %p not current, but oldest\n", page, snapc);</div><div class='del'>-		if (clear_page_dirty_for_io(page)) {</div><div class='del'>-			int r = writepage_nounlock(page, NULL);</div><div class='add'>+		/* yay, writeable, do it now (without dropping folio lock) */</div><div class='add'>+		doutc(cl, " %llx.%llx folio %p snapc %p not current, but oldest\n",</div><div class='add'>+		      ceph_vinop(inode), folio, snapc);</div><div class='add'>+		if (folio_clear_dirty_for_io(folio)) {</div><div class='add'>+			int r = write_folio_nounlock(folio, NULL);</div><div class='ctx'> 			if (r &lt; 0)</div><div class='ctx'> 				return ERR_PTR(r);</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1188,18 +1832,19 @@ ceph_find_incompatible(struct page *page)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ceph_netfs_check_write_begin(struct file *file, loff_t pos, unsigned int len,</div><div class='del'>-					struct folio *folio, void **_fsdata)</div><div class='add'>+					struct folio **foliop, void **_fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	struct ceph_snap_context *snapc;</div><div class='ctx'> </div><div class='del'>-	snapc = ceph_find_incompatible(folio_page(folio, 0));</div><div class='add'>+	snapc = ceph_find_incompatible(*foliop);</div><div class='ctx'> 	if (snapc) {</div><div class='ctx'> 		int r;</div><div class='ctx'> </div><div class='del'>-		folio_unlock(folio);</div><div class='del'>-		folio_put(folio);</div><div class='add'>+		folio_unlock(*foliop);</div><div class='add'>+		folio_put(*foliop);</div><div class='add'>+		*foliop = NULL;</div><div class='ctx'> 		if (IS_ERR(snapc))</div><div class='ctx'> 			return PTR_ERR(snapc);</div><div class='ctx'> </div><div class='hunk'>@@ -1216,76 +1861,41 @@ static int ceph_netfs_check_write_begin(struct file *file, loff_t pos, unsigned</div><div class='ctx'>  * We are only allowed to write into/dirty the page if the page is</div><div class='ctx'>  * clean, or already dirty within the same snap context.</div><div class='ctx'>  */</div><div class='del'>-static int ceph_write_begin(struct file *file, struct address_space *mapping,</div><div class='del'>-			    loff_t pos, unsigned len, unsigned aop_flags,</div><div class='del'>-			    struct page **pagep, void **fsdata)</div><div class='add'>+static int ceph_write_begin(const struct kiocb *iocb,</div><div class='add'>+			    struct address_space *mapping,</div><div class='add'>+			    loff_t pos, unsigned len,</div><div class='add'>+			    struct folio **foliop, void **fsdata)</div><div class='ctx'> {</div><div class='add'>+	struct file *file = iocb-&gt;ki_filp;</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	struct folio *folio = NULL;</div><div class='del'>-	pgoff_t index = pos &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> 	int r;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Uninlining should have already been done and everything updated, EXCEPT</div><div class='del'>-	 * for inline_version sent to the MDS.</div><div class='del'>-	 */</div><div class='del'>-	if (ci-&gt;i_inline_version != CEPH_INLINE_NONE) {</div><div class='del'>-		unsigned int fgp_flags = FGP_LOCK | FGP_WRITE | FGP_CREAT | FGP_STABLE;</div><div class='del'>-		if (aop_flags &amp; AOP_FLAG_NOFS)</div><div class='del'>-			fgp_flags |= FGP_NOFS;</div><div class='del'>-		folio = __filemap_get_folio(mapping, index, fgp_flags,</div><div class='del'>-					    mapping_gfp_mask(mapping));</div><div class='del'>-		if (!folio)</div><div class='del'>-			return -ENOMEM;</div><div class='add'>+	r = netfs_write_begin(&amp;ci-&gt;netfs, file, inode-&gt;i_mapping, pos, len, foliop, NULL);</div><div class='add'>+	if (r &lt; 0)</div><div class='add'>+		return r;</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * The inline_version on a new inode is set to 1. If that's the</div><div class='del'>-		 * case, then the folio is brand new and isn't yet Uptodate.</div><div class='del'>-		 */</div><div class='del'>-		r = 0;</div><div class='del'>-		if (index == 0 &amp;&amp; ci-&gt;i_inline_version != 1) {</div><div class='del'>-			if (!folio_test_uptodate(folio)) {</div><div class='del'>-				WARN_ONCE(1, "ceph: write_begin called on still-inlined inode (inline_version %llu)!\n",</div><div class='del'>-					  ci-&gt;i_inline_version);</div><div class='del'>-				r = -EINVAL;</div><div class='del'>-			}</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		zero_user_segment(&amp;folio-&gt;page, 0, folio_size(folio));</div><div class='del'>-		folio_mark_uptodate(folio);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	r = netfs_write_begin(file, inode-&gt;i_mapping, pos, len, 0, &amp;folio, NULL,</div><div class='del'>-			      &amp;ceph_netfs_read_ops, NULL);</div><div class='del'>-out:</div><div class='del'>-	if (r == 0)</div><div class='del'>-		folio_wait_fscache(folio);</div><div class='del'>-	if (r &lt; 0) {</div><div class='del'>-		if (folio)</div><div class='del'>-			folio_put(folio);</div><div class='del'>-	} else {</div><div class='del'>-		WARN_ON_ONCE(!folio_test_locked(folio));</div><div class='del'>-		*pagep = &amp;folio-&gt;page;</div><div class='del'>-	}</div><div class='del'>-	return r;</div><div class='add'>+	folio_wait_private_2(*foliop); /* [DEPRECATED] */</div><div class='add'>+	WARN_ON_ONCE(!folio_test_locked(*foliop));</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * we don't do anything in here that simple_write_end doesn't do</div><div class='ctx'>  * except adjust dirty page accounting</div><div class='ctx'>  */</div><div class='del'>-static int ceph_write_end(struct file *file, struct address_space *mapping,</div><div class='del'>-			  loff_t pos, unsigned len, unsigned copied,</div><div class='del'>-			  struct page *subpage, void *fsdata)</div><div class='add'>+static int ceph_write_end(const struct kiocb *iocb,</div><div class='add'>+			  struct address_space *mapping, loff_t pos,</div><div class='add'>+			  unsigned len, unsigned copied,</div><div class='add'>+			  struct folio *folio, void *fsdata)</div><div class='ctx'> {</div><div class='del'>-	struct folio *folio = page_folio(subpage);</div><div class='add'>+	struct file *file = iocb-&gt;ki_filp;</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	bool check_cap = false;</div><div class='ctx'> </div><div class='del'>-	dout("write_end file %p inode %p folio %p %d~%d (%d)\n", file,</div><div class='del'>-	     inode, folio, (int)pos, (int)copied, (int)len);</div><div class='add'>+	doutc(cl, "%llx.%llx file %p folio %p %d~%d (%d)\n", ceph_vinop(inode),</div><div class='add'>+	      file, folio, (int)pos, (int)copied, (int)len);</div><div class='ctx'> </div><div class='ctx'> 	if (!folio_test_uptodate(folio)) {</div><div class='ctx'> 		/* just return that nothing was copied on a short copy */</div><div class='hunk'>@@ -1307,33 +1917,22 @@ out:</div><div class='ctx'> 	folio_put(folio);</div><div class='ctx'> </div><div class='ctx'> 	if (check_cap)</div><div class='del'>-		ceph_check_caps(ceph_inode(inode), CHECK_CAPS_AUTHONLY, NULL);</div><div class='add'>+		ceph_check_caps(ceph_inode(inode), CHECK_CAPS_AUTHONLY);</div><div class='ctx'> </div><div class='ctx'> 	return copied;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * we set .direct_IO to indicate direct io is supported, but since we</div><div class='del'>- * intercept O_DIRECT reads and writes early, this function should</div><div class='del'>- * never get called.</div><div class='del'>- */</div><div class='del'>-static ssize_t ceph_direct_io(struct kiocb *iocb, struct iov_iter *iter)</div><div class='del'>-{</div><div class='del'>-	WARN_ON(1);</div><div class='del'>-	return -EINVAL;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> const struct address_space_operations ceph_aops = {</div><div class='del'>-	.readpage = ceph_readpage,</div><div class='del'>-	.readahead = ceph_readahead,</div><div class='del'>-	.writepage = ceph_writepage,</div><div class='add'>+	.read_folio = netfs_read_folio,</div><div class='add'>+	.readahead = netfs_readahead,</div><div class='ctx'> 	.writepages = ceph_writepages_start,</div><div class='ctx'> 	.write_begin = ceph_write_begin,</div><div class='ctx'> 	.write_end = ceph_write_end,</div><div class='del'>-	.set_page_dirty = ceph_set_page_dirty,</div><div class='del'>-	.invalidatepage = ceph_invalidatepage,</div><div class='del'>-	.releasepage = ceph_releasepage,</div><div class='del'>-	.direct_IO = ceph_direct_io,</div><div class='add'>+	.dirty_folio = ceph_dirty_folio,</div><div class='add'>+	.invalidate_folio = ceph_invalidate_folio,</div><div class='add'>+	.release_folio = netfs_release_folio,</div><div class='add'>+	.direct_IO = noop_direct_IO,</div><div class='add'>+	.migrate_folio = filemap_migrate_folio,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static void ceph_block_sigs(sigset_t *oldset)</div><div class='hunk'>@@ -1356,16 +1955,20 @@ static vm_fault_t ceph_filemap_fault(struct vm_fault *vmf)</div><div class='ctx'> 	struct vm_area_struct *vma = vmf-&gt;vma;</div><div class='ctx'> 	struct inode *inode = file_inode(vma-&gt;vm_file);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_file_info *fi = vma-&gt;vm_file-&gt;private_data;</div><div class='ctx'> 	loff_t off = (loff_t)vmf-&gt;pgoff &lt;&lt; PAGE_SHIFT;</div><div class='ctx'> 	int want, got, err;</div><div class='ctx'> 	sigset_t oldset;</div><div class='ctx'> 	vm_fault_t ret = VM_FAULT_SIGBUS;</div><div class='ctx'> </div><div class='add'>+	if (ceph_inode_is_shutdown(inode))</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='ctx'> 	ceph_block_sigs(&amp;oldset);</div><div class='ctx'> </div><div class='del'>-	dout("filemap_fault %p %llx.%llx %llu trying to get caps\n",</div><div class='del'>-	     inode, ceph_vinop(inode), off);</div><div class='add'>+	doutc(cl, "%llx.%llx %llu trying to get caps\n",</div><div class='add'>+	      ceph_vinop(inode), off);</div><div class='ctx'> 	if (fi-&gt;fmode &amp; CEPH_FILE_MODE_LAZY)</div><div class='ctx'> 		want = CEPH_CAP_FILE_CACHE | CEPH_CAP_FILE_LAZYIO;</div><div class='ctx'> 	else</div><div class='hunk'>@@ -1376,17 +1979,17 @@ static vm_fault_t ceph_filemap_fault(struct vm_fault *vmf)</div><div class='ctx'> 	if (err &lt; 0)</div><div class='ctx'> 		goto out_restore;</div><div class='ctx'> </div><div class='del'>-	dout("filemap_fault %p %llu got cap refs on %s\n",</div><div class='del'>-	     inode, off, ceph_cap_string(got));</div><div class='add'>+	doutc(cl, "%llx.%llx %llu got cap refs on %s\n", ceph_vinop(inode),</div><div class='add'>+	      off, ceph_cap_string(got));</div><div class='ctx'> </div><div class='ctx'> 	if ((got &amp; (CEPH_CAP_FILE_CACHE | CEPH_CAP_FILE_LAZYIO)) ||</div><div class='del'>-	    ci-&gt;i_inline_version == CEPH_INLINE_NONE) {</div><div class='add'>+	    !ceph_has_inline_data(ci)) {</div><div class='ctx'> 		CEPH_DEFINE_RW_CONTEXT(rw_ctx, got);</div><div class='ctx'> 		ceph_add_rw_context(fi, &amp;rw_ctx);</div><div class='ctx'> 		ret = filemap_fault(vmf);</div><div class='ctx'> 		ceph_del_rw_context(fi, &amp;rw_ctx);</div><div class='del'>-		dout("filemap_fault %p %llu drop cap refs %s ret %x\n",</div><div class='del'>-		     inode, off, ceph_cap_string(got), ret);</div><div class='add'>+		doutc(cl, "%llx.%llx %llu drop cap refs %s ret %x\n",</div><div class='add'>+		      ceph_vinop(inode), off, ceph_cap_string(got), ret);</div><div class='ctx'> 	} else</div><div class='ctx'> 		err = -EAGAIN;</div><div class='ctx'> </div><div class='hunk'>@@ -1427,8 +2030,8 @@ static vm_fault_t ceph_filemap_fault(struct vm_fault *vmf)</div><div class='ctx'> 		ret = VM_FAULT_MAJOR | VM_FAULT_LOCKED;</div><div class='ctx'> out_inline:</div><div class='ctx'> 		filemap_invalidate_unlock_shared(mapping);</div><div class='del'>-		dout("filemap_fault %p %llu read inline data ret %x\n",</div><div class='del'>-		     inode, off, ret);</div><div class='add'>+		doutc(cl, "%llx.%llx %llu read inline data ret %x\n",</div><div class='add'>+		      ceph_vinop(inode), off, ret);</div><div class='ctx'> 	}</div><div class='ctx'> out_restore:</div><div class='ctx'> 	ceph_restore_sigs(&amp;oldset);</div><div class='hunk'>@@ -1442,17 +2045,21 @@ static vm_fault_t ceph_page_mkwrite(struct vm_fault *vmf)</div><div class='ctx'> {</div><div class='ctx'> 	struct vm_area_struct *vma = vmf-&gt;vma;</div><div class='ctx'> 	struct inode *inode = file_inode(vma-&gt;vm_file);</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	struct ceph_file_info *fi = vma-&gt;vm_file-&gt;private_data;</div><div class='ctx'> 	struct ceph_cap_flush *prealloc_cf;</div><div class='del'>-	struct page *page = vmf-&gt;page;</div><div class='del'>-	loff_t off = page_offset(page);</div><div class='add'>+	struct folio *folio = page_folio(vmf-&gt;page);</div><div class='add'>+	loff_t off = folio_pos(folio);</div><div class='ctx'> 	loff_t size = i_size_read(inode);</div><div class='ctx'> 	size_t len;</div><div class='ctx'> 	int want, got, err;</div><div class='ctx'> 	sigset_t oldset;</div><div class='ctx'> 	vm_fault_t ret = VM_FAULT_SIGBUS;</div><div class='ctx'> </div><div class='add'>+	if (ceph_inode_is_shutdown(inode))</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='ctx'> 	prealloc_cf = ceph_alloc_cap_flush();</div><div class='ctx'> 	if (!prealloc_cf)</div><div class='ctx'> 		return VM_FAULT_OOM;</div><div class='hunk'>@@ -1460,26 +2067,13 @@ static vm_fault_t ceph_page_mkwrite(struct vm_fault *vmf)</div><div class='ctx'> 	sb_start_pagefault(inode-&gt;i_sb);</div><div class='ctx'> 	ceph_block_sigs(&amp;oldset);</div><div class='ctx'> </div><div class='del'>-	if (ci-&gt;i_inline_version != CEPH_INLINE_NONE) {</div><div class='del'>-		struct page *locked_page = NULL;</div><div class='del'>-		if (off == 0) {</div><div class='del'>-			lock_page(page);</div><div class='del'>-			locked_page = page;</div><div class='del'>-		}</div><div class='del'>-		err = ceph_uninline_data(vma-&gt;vm_file, locked_page);</div><div class='del'>-		if (locked_page)</div><div class='del'>-			unlock_page(locked_page);</div><div class='del'>-		if (err &lt; 0)</div><div class='del'>-			goto out_free;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (off + thp_size(page) &lt;= size)</div><div class='del'>-		len = thp_size(page);</div><div class='add'>+	if (off + folio_size(folio) &lt;= size)</div><div class='add'>+		len = folio_size(folio);</div><div class='ctx'> 	else</div><div class='del'>-		len = offset_in_thp(page, size);</div><div class='add'>+		len = offset_in_folio(folio, size);</div><div class='ctx'> </div><div class='del'>-	dout("page_mkwrite %p %llx.%llx %llu~%zd getting caps i_size %llu\n",</div><div class='del'>-	     inode, ceph_vinop(inode), off, len, size);</div><div class='add'>+	doutc(cl, "%llx.%llx %llu~%zd getting caps i_size %llu\n",</div><div class='add'>+	      ceph_vinop(inode), off, len, size);</div><div class='ctx'> 	if (fi-&gt;fmode &amp; CEPH_FILE_MODE_LAZY)</div><div class='ctx'> 		want = CEPH_CAP_FILE_BUFFER | CEPH_CAP_FILE_LAZYIO;</div><div class='ctx'> 	else</div><div class='hunk'>@@ -1490,33 +2084,33 @@ static vm_fault_t ceph_page_mkwrite(struct vm_fault *vmf)</div><div class='ctx'> 	if (err &lt; 0)</div><div class='ctx'> 		goto out_free;</div><div class='ctx'> </div><div class='del'>-	dout("page_mkwrite %p %llu~%zd got cap refs on %s\n",</div><div class='del'>-	     inode, off, len, ceph_cap_string(got));</div><div class='add'>+	doutc(cl, "%llx.%llx %llu~%zd got cap refs on %s\n", ceph_vinop(inode),</div><div class='add'>+	      off, len, ceph_cap_string(got));</div><div class='ctx'> </div><div class='del'>-	/* Update time before taking page lock */</div><div class='add'>+	/* Update time before taking folio lock */</div><div class='ctx'> 	file_update_time(vma-&gt;vm_file);</div><div class='ctx'> 	inode_inc_iversion_raw(inode);</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='ctx'> 		struct ceph_snap_context *snapc;</div><div class='ctx'> </div><div class='del'>-		lock_page(page);</div><div class='add'>+		folio_lock(folio);</div><div class='ctx'> </div><div class='del'>-		if (page_mkwrite_check_truncate(page, inode) &lt; 0) {</div><div class='del'>-			unlock_page(page);</div><div class='add'>+		if (folio_mkwrite_check_truncate(folio, inode) &lt; 0) {</div><div class='add'>+			folio_unlock(folio);</div><div class='ctx'> 			ret = VM_FAULT_NOPAGE;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		snapc = ceph_find_incompatible(page);</div><div class='add'>+		snapc = ceph_find_incompatible(folio);</div><div class='ctx'> 		if (!snapc) {</div><div class='del'>-			/* success.  we'll keep the page locked. */</div><div class='del'>-			set_page_dirty(page);</div><div class='add'>+			/* success.  we'll keep the folio locked. */</div><div class='add'>+			folio_mark_dirty(folio);</div><div class='ctx'> 			ret = VM_FAULT_LOCKED;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		unlock_page(page);</div><div class='add'>+		folio_unlock(folio);</div><div class='ctx'> </div><div class='ctx'> 		if (IS_ERR(snapc)) {</div><div class='ctx'> 			ret = VM_FAULT_SIGBUS;</div><div class='hunk'>@@ -1529,11 +2123,9 @@ static vm_fault_t ceph_page_mkwrite(struct vm_fault *vmf)</div><div class='ctx'> 		ceph_put_snap_context(snapc);</div><div class='ctx'> 	} while (err == 0);</div><div class='ctx'> </div><div class='del'>-	if (ret == VM_FAULT_LOCKED ||</div><div class='del'>-	    ci-&gt;i_inline_version != CEPH_INLINE_NONE) {</div><div class='add'>+	if (ret == VM_FAULT_LOCKED) {</div><div class='ctx'> 		int dirty;</div><div class='ctx'> 		spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-		ci-&gt;i_inline_version = CEPH_INLINE_NONE;</div><div class='ctx'> 		dirty = __ceph_mark_dirty_caps(ci, CEPH_CAP_FILE_WR,</div><div class='ctx'> 					       &amp;prealloc_cf);</div><div class='ctx'> 		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='hunk'>@@ -1541,8 +2133,8 @@ static vm_fault_t ceph_page_mkwrite(struct vm_fault *vmf)</div><div class='ctx'> 			__mark_inode_dirty(inode, dirty);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("page_mkwrite %p %llu~%zd dropping cap refs on %s ret %x\n",</div><div class='del'>-	     inode, off, len, ceph_cap_string(got), ret);</div><div class='add'>+	doutc(cl, "%llx.%llx %llu~%zd dropping cap refs on %s ret %x\n",</div><div class='add'>+	      ceph_vinop(inode), off, len, ceph_cap_string(got), ret);</div><div class='ctx'> 	ceph_put_cap_refs_async(ci, got);</div><div class='ctx'> out_free:</div><div class='ctx'> 	ceph_restore_sigs(&amp;oldset);</div><div class='hunk'>@@ -1556,6 +2148,7 @@ out_free:</div><div class='ctx'> void ceph_fill_inline_data(struct inode *inode, struct page *locked_page,</div><div class='ctx'> 			   char	*data, size_t len)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='ctx'> 	struct page *page;</div><div class='ctx'> </div><div class='hunk'>@@ -1576,8 +2169,8 @@ void ceph_fill_inline_data(struct inode *inode, struct page *locked_page,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("fill_inline_data %p %llx.%llx len %zu locked_page %p\n",</div><div class='del'>-	     inode, ceph_vinop(inode), len, locked_page);</div><div class='add'>+	doutc(cl, "%p %llx.%llx len %zu locked_page %p\n", inode,</div><div class='add'>+	      ceph_vinop(inode), len, locked_page);</div><div class='ctx'> </div><div class='ctx'> 	if (len &gt; 0) {</div><div class='ctx'> 		void *kaddr = kmap_atomic(page);</div><div class='hunk'>@@ -1597,82 +2190,69 @@ void ceph_fill_inline_data(struct inode *inode, struct page *locked_page,</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int ceph_uninline_data(struct file *filp, struct page *locked_page)</div><div class='add'>+int ceph_uninline_data(struct file *file)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = file_inode(filp);</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_inode_to_client(inode);</div><div class='del'>-	struct ceph_osd_request *req;</div><div class='del'>-	struct page *page = NULL;</div><div class='del'>-	u64 len, inline_version;</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='add'>+	struct ceph_osd_request *req = NULL;</div><div class='add'>+	struct ceph_cap_flush *prealloc_cf = NULL;</div><div class='add'>+	struct folio *folio = NULL;</div><div class='add'>+	u64 inline_version = CEPH_INLINE_NONE;</div><div class='add'>+	struct page *pages[1];</div><div class='ctx'> 	int err = 0;</div><div class='del'>-	bool from_pagecache = false;</div><div class='add'>+	u64 len;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 	inline_version = ci-&gt;i_inline_version;</div><div class='ctx'> 	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> </div><div class='del'>-	dout("uninline_data %p %llx.%llx inline_version %llu\n",</div><div class='del'>-	     inode, ceph_vinop(inode), inline_version);</div><div class='add'>+	doutc(cl, "%llx.%llx inline_version %llu\n", ceph_vinop(inode),</div><div class='add'>+	      inline_version);</div><div class='ctx'> </div><div class='del'>-	if (inline_version == 1 || /* initial version, no data */</div><div class='del'>-	    inline_version == CEPH_INLINE_NONE)</div><div class='add'>+	if (ceph_inode_is_shutdown(inode)) {</div><div class='add'>+		err = -EIO;</div><div class='ctx'> 		goto out;</div><div class='del'>-</div><div class='del'>-	if (locked_page) {</div><div class='del'>-		page = locked_page;</div><div class='del'>-		WARN_ON(!PageUptodate(page));</div><div class='del'>-	} else if (ceph_caps_issued(ci) &amp;</div><div class='del'>-		   (CEPH_CAP_FILE_CACHE|CEPH_CAP_FILE_LAZYIO)) {</div><div class='del'>-		page = find_get_page(inode-&gt;i_mapping, 0);</div><div class='del'>-		if (page) {</div><div class='del'>-			if (PageUptodate(page)) {</div><div class='del'>-				from_pagecache = true;</div><div class='del'>-				lock_page(page);</div><div class='del'>-			} else {</div><div class='del'>-				put_page(page);</div><div class='del'>-				page = NULL;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (page) {</div><div class='del'>-		len = i_size_read(inode);</div><div class='del'>-		if (len &gt; PAGE_SIZE)</div><div class='del'>-			len = PAGE_SIZE;</div><div class='del'>-	} else {</div><div class='del'>-		page = __page_cache_alloc(GFP_NOFS);</div><div class='del'>-		if (!page) {</div><div class='del'>-			err = -ENOMEM;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		err = __ceph_do_getattr(inode, page,</div><div class='del'>-					CEPH_STAT_CAP_INLINE_DATA, true);</div><div class='del'>-		if (err &lt; 0) {</div><div class='del'>-			/* no inline data */</div><div class='del'>-			if (err == -ENODATA)</div><div class='del'>-				err = 0;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		len = err;</div><div class='add'>+	if (inline_version == CEPH_INLINE_NONE)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	prealloc_cf = ceph_alloc_cap_flush();</div><div class='add'>+	if (!prealloc_cf)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	if (inline_version == 1) /* initial version, no data */</div><div class='add'>+		goto out_uninline;</div><div class='add'>+</div><div class='add'>+	folio = read_mapping_folio(inode-&gt;i_mapping, 0, file);</div><div class='add'>+	if (IS_ERR(folio)) {</div><div class='add'>+		err = PTR_ERR(folio);</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	folio_lock(folio);</div><div class='add'>+</div><div class='add'>+	len = i_size_read(inode);</div><div class='add'>+	if (len &gt; folio_size(folio))</div><div class='add'>+		len = folio_size(folio);</div><div class='add'>+</div><div class='ctx'> 	req = ceph_osdc_new_request(&amp;fsc-&gt;client-&gt;osdc, &amp;ci-&gt;i_layout,</div><div class='ctx'> 				    ceph_vino(inode), 0, &amp;len, 0, 1,</div><div class='ctx'> 				    CEPH_OSD_OP_CREATE, CEPH_OSD_FLAG_WRITE,</div><div class='ctx'> 				    NULL, 0, 0, false);</div><div class='ctx'> 	if (IS_ERR(req)) {</div><div class='ctx'> 		err = PTR_ERR(req);</div><div class='del'>-		goto out;</div><div class='add'>+		goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	req-&gt;r_mtime = inode-&gt;i_mtime;</div><div class='del'>-	err = ceph_osdc_start_request(&amp;fsc-&gt;client-&gt;osdc, req, false);</div><div class='del'>-	if (!err)</div><div class='del'>-		err = ceph_osdc_wait_request(&amp;fsc-&gt;client-&gt;osdc, req);</div><div class='add'>+	req-&gt;r_mtime = inode_get_mtime(inode);</div><div class='add'>+	ceph_osdc_start_request(&amp;fsc-&gt;client-&gt;osdc, req);</div><div class='add'>+	err = ceph_osdc_wait_request(&amp;fsc-&gt;client-&gt;osdc, req);</div><div class='ctx'> 	ceph_osdc_put_request(req);</div><div class='ctx'> 	if (err &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		goto out_unlock;</div><div class='ctx'> </div><div class='ctx'> 	req = ceph_osdc_new_request(&amp;fsc-&gt;client-&gt;osdc, &amp;ci-&gt;i_layout,</div><div class='ctx'> 				    ceph_vino(inode), 0, &amp;len, 1, 3,</div><div class='hunk'>@@ -1681,10 +2261,11 @@ int ceph_uninline_data(struct file *filp, struct page *locked_page)</div><div class='ctx'> 				    ci-&gt;i_truncate_size, false);</div><div class='ctx'> 	if (IS_ERR(req)) {</div><div class='ctx'> 		err = PTR_ERR(req);</div><div class='del'>-		goto out;</div><div class='add'>+		goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	osd_req_op_extent_osd_data_pages(req, 1, &amp;page, len, 0, false, false);</div><div class='add'>+	pages[0] = folio_page(folio, 0);</div><div class='add'>+	osd_req_op_extent_osd_data_pages(req, 1, pages, len, 0, false, false);</div><div class='ctx'> </div><div class='ctx'> 	{</div><div class='ctx'> 		__le64 xattr_buf = cpu_to_le64(inline_version);</div><div class='hunk'>@@ -1694,7 +2275,7 @@ int ceph_uninline_data(struct file *filp, struct page *locked_page)</div><div class='ctx'> 					    CEPH_OSD_CMPXATTR_OP_GT,</div><div class='ctx'> 					    CEPH_OSD_CMPXATTR_MODE_U64);</div><div class='ctx'> 		if (err)</div><div class='del'>-			goto out_put;</div><div class='add'>+			goto out_put_req;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	{</div><div class='hunk'>@@ -1705,32 +2286,43 @@ int ceph_uninline_data(struct file *filp, struct page *locked_page)</div><div class='ctx'> 					    "inline_version",</div><div class='ctx'> 					    xattr_buf, xattr_len, 0, 0);</div><div class='ctx'> 		if (err)</div><div class='del'>-			goto out_put;</div><div class='add'>+			goto out_put_req;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	req-&gt;r_mtime = inode-&gt;i_mtime;</div><div class='del'>-	err = ceph_osdc_start_request(&amp;fsc-&gt;client-&gt;osdc, req, false);</div><div class='del'>-	if (!err)</div><div class='del'>-		err = ceph_osdc_wait_request(&amp;fsc-&gt;client-&gt;osdc, req);</div><div class='add'>+	req-&gt;r_mtime = inode_get_mtime(inode);</div><div class='add'>+	ceph_osdc_start_request(&amp;fsc-&gt;client-&gt;osdc, req);</div><div class='add'>+	err = ceph_osdc_wait_request(&amp;fsc-&gt;client-&gt;osdc, req);</div><div class='ctx'> </div><div class='ctx'> 	ceph_update_write_metrics(&amp;fsc-&gt;mdsc-&gt;metric, req-&gt;r_start_latency,</div><div class='ctx'> 				  req-&gt;r_end_latency, len, err);</div><div class='ctx'> </div><div class='del'>-out_put:</div><div class='add'>+out_uninline:</div><div class='add'>+	if (!err) {</div><div class='add'>+		int dirty;</div><div class='add'>+</div><div class='add'>+		/* Set to CAP_INLINE_NONE and dirty the caps */</div><div class='add'>+		down_read(&amp;fsc-&gt;mdsc-&gt;snap_rwsem);</div><div class='add'>+		spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+		ci-&gt;i_inline_version = CEPH_INLINE_NONE;</div><div class='add'>+		dirty = __ceph_mark_dirty_caps(ci, CEPH_CAP_FILE_WR, &amp;prealloc_cf);</div><div class='add'>+		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+		up_read(&amp;fsc-&gt;mdsc-&gt;snap_rwsem);</div><div class='add'>+		if (dirty)</div><div class='add'>+			__mark_inode_dirty(inode, dirty);</div><div class='add'>+	}</div><div class='add'>+out_put_req:</div><div class='ctx'> 	ceph_osdc_put_request(req);</div><div class='ctx'> 	if (err == -ECANCELED)</div><div class='ctx'> 		err = 0;</div><div class='del'>-out:</div><div class='del'>-	if (page &amp;&amp; page != locked_page) {</div><div class='del'>-		if (from_pagecache) {</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			put_page(page);</div><div class='del'>-		} else</div><div class='del'>-			__free_pages(page, 0);</div><div class='add'>+out_unlock:</div><div class='add'>+	if (folio) {</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	dout("uninline_data %p %llx.%llx inline_version %llu = %d\n",</div><div class='del'>-	     inode, ceph_vinop(inode), inline_version, err);</div><div class='add'>+out:</div><div class='add'>+	ceph_free_cap_flush(prealloc_cf);</div><div class='add'>+	doutc(cl, "%llx.%llx inline_version %llu = %d\n",</div><div class='add'>+	      ceph_vinop(inode), inline_version, err);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1739,14 +2331,13 @@ static const struct vm_operations_struct ceph_vmops = {</div><div class='ctx'> 	.page_mkwrite	= ceph_page_mkwrite,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-int ceph_mmap(struct file *file, struct vm_area_struct *vma)</div><div class='add'>+int ceph_mmap_prepare(struct vm_area_desc *desc)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *mapping = file-&gt;f_mapping;</div><div class='add'>+	struct address_space *mapping = desc-&gt;file-&gt;f_mapping;</div><div class='ctx'> </div><div class='del'>-	if (!mapping-&gt;a_ops-&gt;readpage)</div><div class='add'>+	if (!mapping-&gt;a_ops-&gt;read_folio)</div><div class='ctx'> 		return -ENOEXEC;</div><div class='del'>-	file_accessed(file);</div><div class='del'>-	vma-&gt;vm_ops = &amp;ceph_vmops;</div><div class='add'>+	desc-&gt;vm_ops = &amp;ceph_vmops;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1758,8 +2349,9 @@ enum {</div><div class='ctx'> static int __ceph_pool_perm_get(struct ceph_inode_info *ci,</div><div class='ctx'> 				s64 pool, struct ceph_string *pool_ns)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_inode_to_client(&amp;ci-&gt;vfs_inode);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(&amp;ci-&gt;netfs.inode);</div><div class='ctx'> 	struct ceph_mds_client *mdsc = fsc-&gt;mdsc;</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='ctx'> 	struct ceph_osd_request *rd_req = NULL, *wr_req = NULL;</div><div class='ctx'> 	struct rb_node **p, *parent;</div><div class='ctx'> 	struct ceph_pool_perm *perm;</div><div class='hunk'>@@ -1794,10 +2386,10 @@ static int __ceph_pool_perm_get(struct ceph_inode_info *ci,</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	if (pool_ns)</div><div class='del'>-		dout("__ceph_pool_perm_get pool %lld ns %.*s no perm cached\n",</div><div class='del'>-		     pool, (int)pool_ns-&gt;len, pool_ns-&gt;str);</div><div class='add'>+		doutc(cl, "pool %lld ns %.*s no perm cached\n", pool,</div><div class='add'>+		      (int)pool_ns-&gt;len, pool_ns-&gt;str);</div><div class='ctx'> 	else</div><div class='del'>-		dout("__ceph_pool_perm_get pool %lld no perm cached\n", pool);</div><div class='add'>+		doutc(cl, "pool %lld no perm cached\n", pool);</div><div class='ctx'> </div><div class='ctx'> 	down_write(&amp;mdsc-&gt;pool_perm_rwsem);</div><div class='ctx'> 	p = &amp;mdsc-&gt;pool_perm_tree.rb_node;</div><div class='hunk'>@@ -1871,15 +2463,13 @@ static int __ceph_pool_perm_get(struct ceph_inode_info *ci,</div><div class='ctx'> </div><div class='ctx'> 	osd_req_op_raw_data_in_pages(rd_req, 0, pages, PAGE_SIZE,</div><div class='ctx'> 				     0, false, true);</div><div class='del'>-	err = ceph_osdc_start_request(&amp;fsc-&gt;client-&gt;osdc, rd_req, false);</div><div class='add'>+	ceph_osdc_start_request(&amp;fsc-&gt;client-&gt;osdc, rd_req);</div><div class='ctx'> </div><div class='del'>-	wr_req-&gt;r_mtime = ci-&gt;vfs_inode.i_mtime;</div><div class='del'>-	err2 = ceph_osdc_start_request(&amp;fsc-&gt;client-&gt;osdc, wr_req, false);</div><div class='add'>+	wr_req-&gt;r_mtime = inode_get_mtime(&amp;ci-&gt;netfs.inode);</div><div class='add'>+	ceph_osdc_start_request(&amp;fsc-&gt;client-&gt;osdc, wr_req);</div><div class='ctx'> </div><div class='del'>-	if (!err)</div><div class='del'>-		err = ceph_osdc_wait_request(&amp;fsc-&gt;client-&gt;osdc, rd_req);</div><div class='del'>-	if (!err2)</div><div class='del'>-		err2 = ceph_osdc_wait_request(&amp;fsc-&gt;client-&gt;osdc, wr_req);</div><div class='add'>+	err = ceph_osdc_wait_request(&amp;fsc-&gt;client-&gt;osdc, rd_req);</div><div class='add'>+	err2 = ceph_osdc_wait_request(&amp;fsc-&gt;client-&gt;osdc, wr_req);</div><div class='ctx'> </div><div class='ctx'> 	if (err &gt;= 0 || err == -ENOENT)</div><div class='ctx'> 		have |= POOL_READ;</div><div class='hunk'>@@ -1899,7 +2489,7 @@ static int __ceph_pool_perm_get(struct ceph_inode_info *ci,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	pool_ns_len = pool_ns ? pool_ns-&gt;len : 0;</div><div class='del'>-	perm = kmalloc(sizeof(*perm) + pool_ns_len + 1, GFP_NOFS);</div><div class='add'>+	perm = kmalloc(struct_size(perm, pool_ns, pool_ns_len + 1), GFP_NOFS);</div><div class='ctx'> 	if (!perm) {</div><div class='ctx'> 		err = -ENOMEM;</div><div class='ctx'> 		goto out_unlock;</div><div class='hunk'>@@ -1924,15 +2514,16 @@ out:</div><div class='ctx'> 	if (!err)</div><div class='ctx'> 		err = have;</div><div class='ctx'> 	if (pool_ns)</div><div class='del'>-		dout("__ceph_pool_perm_get pool %lld ns %.*s result = %d\n",</div><div class='del'>-		     pool, (int)pool_ns-&gt;len, pool_ns-&gt;str, err);</div><div class='add'>+		doutc(cl, "pool %lld ns %.*s result = %d\n", pool,</div><div class='add'>+		      (int)pool_ns-&gt;len, pool_ns-&gt;str, err);</div><div class='ctx'> 	else</div><div class='del'>-		dout("__ceph_pool_perm_get pool %lld result = %d\n", pool, err);</div><div class='add'>+		doutc(cl, "pool %lld result = %d\n", pool, err);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int ceph_pool_perm_check(struct inode *inode, int need)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	struct ceph_string *pool_ns;</div><div class='ctx'> 	s64 pool;</div><div class='hunk'>@@ -1945,13 +2536,13 @@ int ceph_pool_perm_check(struct inode *inode, int need)</div><div class='ctx'> 	if (ci-&gt;i_vino.snap != CEPH_NOSNAP) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Pool permission check needs to write to the first object.</div><div class='del'>-		 * But for snapshot, head of the first object may have alread</div><div class='add'>+		 * But for snapshot, head of the first object may have already</div><div class='ctx'> 		 * been deleted. Skip check to avoid creating orphan object.</div><div class='ctx'> 		 */</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (ceph_test_mount_opt(ceph_inode_to_client(inode),</div><div class='add'>+	if (ceph_test_mount_opt(ceph_inode_to_fs_client(inode),</div><div class='ctx'> 				NOPOOLPERM))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='hunk'>@@ -1962,13 +2553,11 @@ int ceph_pool_perm_check(struct inode *inode, int need)</div><div class='ctx'> check:</div><div class='ctx'> 	if (flags &amp; CEPH_I_POOL_PERM) {</div><div class='ctx'> 		if ((need &amp; CEPH_CAP_FILE_RD) &amp;&amp; !(flags &amp; CEPH_I_POOL_RD)) {</div><div class='del'>-			dout("ceph_pool_perm_check pool %lld no read perm\n",</div><div class='del'>-			     pool);</div><div class='add'>+			doutc(cl, "pool %lld no read perm\n", pool);</div><div class='ctx'> 			return -EPERM;</div><div class='ctx'> 		}</div><div class='ctx'> 		if ((need &amp; CEPH_CAP_FILE_WR) &amp;&amp; !(flags &amp; CEPH_I_POOL_WR)) {</div><div class='del'>-			dout("ceph_pool_perm_check pool %lld no write perm\n",</div><div class='del'>-			     pool);</div><div class='add'>+			doutc(cl, "pool %lld no write perm\n", pool);</div><div class='ctx'> 			return -EPERM;</div><div class='ctx'> 		}</div><div class='ctx'> 		return 0;</div><div class='head'>diff --git a/fs/ceph/cache.c b/fs/ceph/cache.c<br/>index 9cfadbb86568..f678bab189d8 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ceph/cache.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/cache.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/cache.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/cache.c</a></div><div class='hunk'>@@ -12,216 +12,101 @@</div><div class='ctx'> #include "super.h"</div><div class='ctx'> #include "cache.h"</div><div class='ctx'> </div><div class='del'>-struct ceph_aux_inode {</div><div class='del'>-	u64 	version;</div><div class='del'>-	u64	mtime_sec;</div><div class='del'>-	u64	mtime_nsec;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct fscache_netfs ceph_cache_netfs = {</div><div class='del'>-	.name		= "ceph",</div><div class='del'>-	.version	= 0,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static DEFINE_MUTEX(ceph_fscache_lock);</div><div class='del'>-static LIST_HEAD(ceph_fscache_list);</div><div class='del'>-</div><div class='del'>-struct ceph_fscache_entry {</div><div class='del'>-	struct list_head list;</div><div class='del'>-	struct fscache_cookie *fscache;</div><div class='del'>-	size_t uniq_len;</div><div class='del'>-	/* The following members must be last */</div><div class='del'>-	struct ceph_fsid fsid;</div><div class='del'>-	char uniquifier[];</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static const struct fscache_cookie_def ceph_fscache_fsid_object_def = {</div><div class='del'>-	.name		= "CEPH.fsid",</div><div class='del'>-	.type		= FSCACHE_COOKIE_TYPE_INDEX,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-int __init ceph_fscache_register(void)</div><div class='del'>-{</div><div class='del'>-	return fscache_register_netfs(&amp;ceph_cache_netfs);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void ceph_fscache_unregister(void)</div><div class='del'>-{</div><div class='del'>-	fscache_unregister_netfs(&amp;ceph_cache_netfs);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int ceph_fscache_register_fs(struct ceph_fs_client* fsc, struct fs_context *fc)</div><div class='add'>+void ceph_fscache_register_inode_cookie(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	const struct ceph_fsid *fsid = &amp;fsc-&gt;client-&gt;fsid;</div><div class='del'>-	const char *fscache_uniq = fsc-&gt;mount_options-&gt;fscache_uniq;</div><div class='del'>-	size_t uniq_len = fscache_uniq ? strlen(fscache_uniq) : 0;</div><div class='del'>-	struct ceph_fscache_entry *ent;</div><div class='del'>-	int err = 0;</div><div class='add'>+	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;ceph_fscache_lock);</div><div class='del'>-	list_for_each_entry(ent, &amp;ceph_fscache_list, list) {</div><div class='del'>-		if (memcmp(&amp;ent-&gt;fsid, fsid, sizeof(*fsid)))</div><div class='del'>-			continue;</div><div class='del'>-		if (ent-&gt;uniq_len != uniq_len)</div><div class='del'>-			continue;</div><div class='del'>-		if (uniq_len &amp;&amp; memcmp(ent-&gt;uniquifier, fscache_uniq, uniq_len))</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		errorfc(fc, "fscache cookie already registered for fsid %pU, use fsc=&lt;uniquifier&gt; option",</div><div class='del'>-		       fsid);</div><div class='del'>-		err = -EBUSY;</div><div class='del'>-		goto out_unlock;</div><div class='del'>-	}</div><div class='add'>+	/* No caching for filesystem? */</div><div class='add'>+	if (!fsc-&gt;fscache)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	ent = kzalloc(sizeof(*ent) + uniq_len, GFP_KERNEL);</div><div class='del'>-	if (!ent) {</div><div class='del'>-		err = -ENOMEM;</div><div class='del'>-		goto out_unlock;</div><div class='del'>-	}</div><div class='add'>+	/* Regular files only */</div><div class='add'>+	if (!S_ISREG(inode-&gt;i_mode))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	memcpy(&amp;ent-&gt;fsid, fsid, sizeof(*fsid));</div><div class='del'>-	if (uniq_len &gt; 0) {</div><div class='del'>-		memcpy(&amp;ent-&gt;uniquifier, fscache_uniq, uniq_len);</div><div class='del'>-		ent-&gt;uniq_len = uniq_len;</div><div class='del'>-	}</div><div class='add'>+	/* Only new inodes! */</div><div class='add'>+	if (!(inode_state_read_once(inode) &amp; I_NEW))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	fsc-&gt;fscache = fscache_acquire_cookie(ceph_cache_netfs.primary_index,</div><div class='del'>-					      &amp;ceph_fscache_fsid_object_def,</div><div class='del'>-					      &amp;ent-&gt;fsid, sizeof(ent-&gt;fsid) + uniq_len,</div><div class='del'>-					      NULL, 0,</div><div class='del'>-					      fsc, 0, true);</div><div class='add'>+	WARN_ON_ONCE(ci-&gt;netfs.cache);</div><div class='ctx'> </div><div class='del'>-	if (fsc-&gt;fscache) {</div><div class='del'>-		ent-&gt;fscache = fsc-&gt;fscache;</div><div class='del'>-		list_add_tail(&amp;ent-&gt;list, &amp;ceph_fscache_list);</div><div class='del'>-	} else {</div><div class='del'>-		kfree(ent);</div><div class='del'>-		errorfc(fc, "unable to register fscache cookie for fsid %pU",</div><div class='del'>-		       fsid);</div><div class='del'>-		/* all other fs ignore this error */</div><div class='del'>-	}</div><div class='del'>-out_unlock:</div><div class='del'>-	mutex_unlock(&amp;ceph_fscache_lock);</div><div class='del'>-	return err;</div><div class='add'>+	ci-&gt;netfs.cache =</div><div class='add'>+		fscache_acquire_cookie(fsc-&gt;fscache, 0,</div><div class='add'>+				       &amp;ci-&gt;i_vino, sizeof(ci-&gt;i_vino),</div><div class='add'>+				       &amp;ci-&gt;i_version, sizeof(ci-&gt;i_version),</div><div class='add'>+				       i_size_read(inode));</div><div class='add'>+	if (ci-&gt;netfs.cache)</div><div class='add'>+		mapping_set_release_always(inode-&gt;i_mapping);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static enum fscache_checkaux ceph_fscache_inode_check_aux(</div><div class='del'>-	void *cookie_netfs_data, const void *data, uint16_t dlen,</div><div class='del'>-	loff_t object_size)</div><div class='add'>+void ceph_fscache_unregister_inode_cookie(struct ceph_inode_info *ci)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_aux_inode aux;</div><div class='del'>-	struct ceph_inode_info* ci = cookie_netfs_data;</div><div class='del'>-	struct inode* inode = &amp;ci-&gt;vfs_inode;</div><div class='del'>-</div><div class='del'>-	if (dlen != sizeof(aux) ||</div><div class='del'>-	    i_size_read(inode) != object_size)</div><div class='del'>-		return FSCACHE_CHECKAUX_OBSOLETE;</div><div class='del'>-</div><div class='del'>-	memset(&amp;aux, 0, sizeof(aux));</div><div class='del'>-	aux.version = ci-&gt;i_version;</div><div class='del'>-	aux.mtime_sec = inode-&gt;i_mtime.tv_sec;</div><div class='del'>-	aux.mtime_nsec = inode-&gt;i_mtime.tv_nsec;</div><div class='add'>+	fscache_relinquish_cookie(ceph_fscache_cookie(ci), false);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if (memcmp(data, &amp;aux, sizeof(aux)) != 0)</div><div class='del'>-		return FSCACHE_CHECKAUX_OBSOLETE;</div><div class='add'>+void ceph_fscache_use_cookie(struct inode *inode, bool will_modify)</div><div class='add'>+{</div><div class='add'>+	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> </div><div class='del'>-	dout("ceph inode 0x%p cached okay\n", ci);</div><div class='del'>-	return FSCACHE_CHECKAUX_OKAY;</div><div class='add'>+	fscache_use_cookie(ceph_fscache_cookie(ci), will_modify);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static const struct fscache_cookie_def ceph_fscache_inode_object_def = {</div><div class='del'>-	.name		= "CEPH.inode",</div><div class='del'>-	.type		= FSCACHE_COOKIE_TYPE_DATAFILE,</div><div class='del'>-	.check_aux	= ceph_fscache_inode_check_aux,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-void ceph_fscache_register_inode_cookie(struct inode *inode)</div><div class='add'>+void ceph_fscache_unuse_cookie(struct inode *inode, bool update)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_inode_to_client(inode);</div><div class='del'>-	struct ceph_aux_inode aux;</div><div class='ctx'> </div><div class='del'>-	/* No caching for filesystem */</div><div class='del'>-	if (!fsc-&gt;fscache)</div><div class='del'>-		return;</div><div class='add'>+	if (update) {</div><div class='add'>+		loff_t i_size = i_size_read(inode);</div><div class='ctx'> </div><div class='del'>-	/* Only cache for regular files that are read only */</div><div class='del'>-	if (!S_ISREG(inode-&gt;i_mode))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	inode_lock_nested(inode, I_MUTEX_CHILD);</div><div class='del'>-	if (!ci-&gt;fscache) {</div><div class='del'>-		memset(&amp;aux, 0, sizeof(aux));</div><div class='del'>-		aux.version = ci-&gt;i_version;</div><div class='del'>-		aux.mtime_sec = inode-&gt;i_mtime.tv_sec;</div><div class='del'>-		aux.mtime_nsec = inode-&gt;i_mtime.tv_nsec;</div><div class='del'>-		ci-&gt;fscache = fscache_acquire_cookie(fsc-&gt;fscache,</div><div class='del'>-						     &amp;ceph_fscache_inode_object_def,</div><div class='del'>-						     &amp;ci-&gt;i_vino, sizeof(ci-&gt;i_vino),</div><div class='del'>-						     &amp;aux, sizeof(aux),</div><div class='del'>-						     ci, i_size_read(inode), false);</div><div class='add'>+		fscache_unuse_cookie(ceph_fscache_cookie(ci),</div><div class='add'>+				     &amp;ci-&gt;i_version, &amp;i_size);</div><div class='add'>+	} else {</div><div class='add'>+		fscache_unuse_cookie(ceph_fscache_cookie(ci), NULL, NULL);</div><div class='ctx'> 	}</div><div class='del'>-	inode_unlock(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void ceph_fscache_unregister_inode_cookie(struct ceph_inode_info* ci)</div><div class='add'>+void ceph_fscache_update(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct fscache_cookie* cookie;</div><div class='del'>-</div><div class='del'>-	if ((cookie = ci-&gt;fscache) == NULL)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	ci-&gt;fscache = NULL;</div><div class='add'>+	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	loff_t i_size = i_size_read(inode);</div><div class='ctx'> </div><div class='del'>-	fscache_relinquish_cookie(cookie, &amp;ci-&gt;i_vino, false);</div><div class='add'>+	fscache_update_cookie(ceph_fscache_cookie(ci), &amp;ci-&gt;i_version, &amp;i_size);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool ceph_fscache_can_enable(void *data)</div><div class='add'>+void ceph_fscache_invalidate(struct inode *inode, bool dio_write)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = data;</div><div class='del'>-	return !inode_is_open_for_write(inode);</div><div class='add'>+	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+</div><div class='add'>+	fscache_invalidate(ceph_fscache_cookie(ci),</div><div class='add'>+			   &amp;ci-&gt;i_version, i_size_read(inode),</div><div class='add'>+			   dio_write ? FSCACHE_INVAL_DIO_WRITE : 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void ceph_fscache_file_set_cookie(struct inode *inode, struct file *filp)</div><div class='add'>+int ceph_fscache_register_fs(struct ceph_fs_client* fsc, struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	const struct ceph_fsid *fsid = &amp;fsc-&gt;client-&gt;fsid;</div><div class='add'>+	const char *fscache_uniq = fsc-&gt;mount_options-&gt;fscache_uniq;</div><div class='add'>+	size_t uniq_len = fscache_uniq ? strlen(fscache_uniq) : 0;</div><div class='add'>+	char *name;</div><div class='add'>+	int err = 0;</div><div class='ctx'> </div><div class='del'>-	if (!fscache_cookie_valid(ci-&gt;fscache))</div><div class='del'>-		return;</div><div class='add'>+	name = kasprintf(GFP_KERNEL, "ceph,%pU%s%s", fsid, uniq_len ? "," : "",</div><div class='add'>+			 uniq_len ? fscache_uniq : "");</div><div class='add'>+	if (!name)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	if (inode_is_open_for_write(inode)) {</div><div class='del'>-		dout("fscache_file_set_cookie %p %p disabling cache\n",</div><div class='del'>-		     inode, filp);</div><div class='del'>-		fscache_disable_cookie(ci-&gt;fscache, &amp;ci-&gt;i_vino, false);</div><div class='del'>-	} else {</div><div class='del'>-		fscache_enable_cookie(ci-&gt;fscache, &amp;ci-&gt;i_vino, i_size_read(inode),</div><div class='del'>-				      ceph_fscache_can_enable, inode);</div><div class='del'>-		if (fscache_cookie_enabled(ci-&gt;fscache)) {</div><div class='del'>-			dout("fscache_file_set_cookie %p %p enabling cache\n",</div><div class='del'>-			     inode, filp);</div><div class='del'>-		}</div><div class='add'>+	fsc-&gt;fscache = fscache_acquire_volume(name, NULL, NULL, 0);</div><div class='add'>+	if (IS_ERR_OR_NULL(fsc-&gt;fscache)) {</div><div class='add'>+		errorfc(fc, "Unable to register fscache cookie for %s", name);</div><div class='add'>+		err = fsc-&gt;fscache ? PTR_ERR(fsc-&gt;fscache) : -EOPNOTSUPP;</div><div class='add'>+		fsc-&gt;fscache = NULL;</div><div class='ctx'> 	}</div><div class='add'>+	kfree(name);</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void ceph_fscache_unregister_fs(struct ceph_fs_client* fsc)</div><div class='ctx'> {</div><div class='del'>-	if (fscache_cookie_valid(fsc-&gt;fscache)) {</div><div class='del'>-		struct ceph_fscache_entry *ent;</div><div class='del'>-		bool found = false;</div><div class='del'>-</div><div class='del'>-		mutex_lock(&amp;ceph_fscache_lock);</div><div class='del'>-		list_for_each_entry(ent, &amp;ceph_fscache_list, list) {</div><div class='del'>-			if (ent-&gt;fscache == fsc-&gt;fscache) {</div><div class='del'>-				list_del(&amp;ent-&gt;list);</div><div class='del'>-				kfree(ent);</div><div class='del'>-				found = true;</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-		WARN_ON_ONCE(!found);</div><div class='del'>-		mutex_unlock(&amp;ceph_fscache_lock);</div><div class='del'>-</div><div class='del'>-		__fscache_relinquish_cookie(fsc-&gt;fscache, NULL, false);</div><div class='del'>-	}</div><div class='del'>-	fsc-&gt;fscache = NULL;</div><div class='add'>+	fscache_relinquish_volume(fsc-&gt;fscache, NULL, false);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/ceph/cache.h b/fs/ceph/cache.h<br/>index 058ea2a04376..20efac020394 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ceph/cache.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/cache.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/cache.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/cache.h</a></div><div class='hunk'>@@ -12,106 +12,106 @@</div><div class='ctx'> #include &lt;linux/netfs.h&gt;</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_CEPH_FSCACHE</div><div class='del'>-</div><div class='del'>-extern struct fscache_netfs ceph_cache_netfs;</div><div class='del'>-</div><div class='del'>-int ceph_fscache_register(void);</div><div class='del'>-void ceph_fscache_unregister(void);</div><div class='add'>+#include &lt;linux/fscache.h&gt;</div><div class='ctx'> </div><div class='ctx'> int ceph_fscache_register_fs(struct ceph_fs_client* fsc, struct fs_context *fc);</div><div class='ctx'> void ceph_fscache_unregister_fs(struct ceph_fs_client* fsc);</div><div class='ctx'> </div><div class='ctx'> void ceph_fscache_register_inode_cookie(struct inode *inode);</div><div class='ctx'> void ceph_fscache_unregister_inode_cookie(struct ceph_inode_info* ci);</div><div class='del'>-void ceph_fscache_file_set_cookie(struct inode *inode, struct file *filp);</div><div class='del'>-void ceph_fscache_revalidate_cookie(struct ceph_inode_info *ci);</div><div class='ctx'> </div><div class='del'>-static inline void ceph_fscache_inode_init(struct ceph_inode_info *ci)</div><div class='add'>+void ceph_fscache_use_cookie(struct inode *inode, bool will_modify);</div><div class='add'>+void ceph_fscache_unuse_cookie(struct inode *inode, bool update);</div><div class='add'>+</div><div class='add'>+void ceph_fscache_update(struct inode *inode);</div><div class='add'>+void ceph_fscache_invalidate(struct inode *inode, bool dio_write);</div><div class='add'>+</div><div class='add'>+static inline struct fscache_cookie *ceph_fscache_cookie(struct ceph_inode_info *ci)</div><div class='ctx'> {</div><div class='del'>-	ci-&gt;fscache = NULL;</div><div class='add'>+	return netfs_i_cookie(&amp;ci-&gt;netfs);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline struct fscache_cookie *ceph_fscache_cookie(struct ceph_inode_info *ci)</div><div class='add'>+static inline void ceph_fscache_resize(struct inode *inode, loff_t to)</div><div class='ctx'> {</div><div class='del'>-	return ci-&gt;fscache;</div><div class='add'>+	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	struct fscache_cookie *cookie = ceph_fscache_cookie(ci);</div><div class='add'>+</div><div class='add'>+	if (cookie) {</div><div class='add'>+		ceph_fscache_use_cookie(inode, true);</div><div class='add'>+		fscache_resize_cookie(cookie, to);</div><div class='add'>+		ceph_fscache_unuse_cookie(inode, true);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void ceph_fscache_invalidate(struct inode *inode)</div><div class='add'>+static inline int ceph_fscache_unpin_writeback(struct inode *inode,</div><div class='add'>+						struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='del'>-	fscache_invalidate(ceph_inode(inode)-&gt;fscache);</div><div class='add'>+	return netfs_unpin_writeback(inode, wbc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#define ceph_fscache_dirty_folio netfs_dirty_folio</div><div class='add'>+</div><div class='ctx'> static inline bool ceph_is_cache_enabled(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct fscache_cookie *cookie = ceph_fscache_cookie(ceph_inode(inode));</div><div class='del'>-</div><div class='del'>-	if (!cookie)</div><div class='del'>-		return false;</div><div class='del'>-	return fscache_cookie_enabled(cookie);</div><div class='add'>+	return fscache_cookie_enabled(ceph_fscache_cookie(ceph_inode(inode)));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int ceph_begin_cache_operation(struct netfs_read_request *rreq)</div><div class='add'>+#else /* CONFIG_CEPH_FSCACHE */</div><div class='add'>+static inline int ceph_fscache_register_fs(struct ceph_fs_client* fsc,</div><div class='add'>+					   struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	struct fscache_cookie *cookie = ceph_fscache_cookie(ceph_inode(rreq-&gt;inode));</div><div class='del'>-</div><div class='del'>-	return fscache_begin_read_operation(rreq, cookie);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='del'>-#else</div><div class='ctx'> </div><div class='del'>-static inline int ceph_fscache_register(void)</div><div class='add'>+static inline void ceph_fscache_unregister_fs(struct ceph_fs_client* fsc)</div><div class='ctx'> {</div><div class='del'>-	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void ceph_fscache_unregister(void)</div><div class='add'>+static inline void ceph_fscache_register_inode_cookie(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int ceph_fscache_register_fs(struct ceph_fs_client* fsc,</div><div class='del'>-					   struct fs_context *fc)</div><div class='add'>+static inline void ceph_fscache_unregister_inode_cookie(struct ceph_inode_info* ci)</div><div class='ctx'> {</div><div class='del'>-	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void ceph_fscache_unregister_fs(struct ceph_fs_client* fsc)</div><div class='add'>+static inline void ceph_fscache_use_cookie(struct inode *inode, bool will_modify)</div><div class='ctx'> {</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void ceph_fscache_inode_init(struct ceph_inode_info *ci)</div><div class='add'>+static inline void ceph_fscache_unuse_cookie(struct inode *inode, bool update)</div><div class='ctx'> {</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline struct fscache_cookie *ceph_fscache_cookie(struct ceph_inode_info *ci)</div><div class='add'>+static inline void ceph_fscache_update(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void ceph_fscache_register_inode_cookie(struct inode *inode)</div><div class='add'>+static inline void ceph_fscache_invalidate(struct inode *inode, bool dio_write)</div><div class='ctx'> {</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void ceph_fscache_unregister_inode_cookie(struct ceph_inode_info* ci)</div><div class='add'>+static inline struct fscache_cookie *ceph_fscache_cookie(struct ceph_inode_info *ci)</div><div class='ctx'> {</div><div class='add'>+	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void ceph_fscache_file_set_cookie(struct inode *inode,</div><div class='del'>-						struct file *filp)</div><div class='add'>+static inline void ceph_fscache_resize(struct inode *inode, loff_t to)</div><div class='ctx'> {</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void ceph_fscache_invalidate(struct inode *inode)</div><div class='add'>+static inline int ceph_fscache_unpin_writeback(struct inode *inode,</div><div class='add'>+					       struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#define ceph_fscache_dirty_folio filemap_dirty_folio</div><div class='add'>+</div><div class='ctx'> static inline bool ceph_is_cache_enabled(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='add'>+#endif /* CONFIG_CEPH_FSCACHE */</div><div class='ctx'> </div><div class='del'>-static inline int ceph_begin_cache_operation(struct netfs_read_request *rreq)</div><div class='del'>-{</div><div class='del'>-	return -ENOBUFS;</div><div class='del'>-}</div><div class='ctx'> #endif</div><div class='del'>-</div><div class='del'>-#endif /* _CEPH_CACHE_H */</div><div class='head'>diff --git a/fs/ceph/caps.c b/fs/ceph/caps.c<br/>index 8f537f1d9d1d..b1a8ff612c41 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ceph/caps.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/caps.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/caps.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/caps.c</a></div><div class='hunk'>@@ -9,10 +9,13 @@</div><div class='ctx'> #include &lt;linux/wait.h&gt;</div><div class='ctx'> #include &lt;linux/writeback.h&gt;</div><div class='ctx'> #include &lt;linux/iversion.h&gt;</div><div class='add'>+#include &lt;linux/filelock.h&gt;</div><div class='add'>+#include &lt;linux/jiffies.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "super.h"</div><div class='ctx'> #include "mds_client.h"</div><div class='ctx'> #include "cache.h"</div><div class='add'>+#include "crypto.h"</div><div class='ctx'> #include &lt;linux/ceph/decode.h&gt;</div><div class='ctx'> #include &lt;linux/ceph/messenger.h&gt;</div><div class='ctx'> </div><div class='hunk'>@@ -184,10 +187,10 @@ static void __ceph_unreserve_caps(struct ceph_mds_client *mdsc, int nr_caps)</div><div class='ctx'> 			mdsc-&gt;caps_avail_count += nr_caps;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		dout("%s: caps %d = %d used + %d resv + %d avail\n",</div><div class='del'>-		     __func__,</div><div class='del'>-		     mdsc-&gt;caps_total_count, mdsc-&gt;caps_use_count,</div><div class='del'>-		     mdsc-&gt;caps_reserve_count, mdsc-&gt;caps_avail_count);</div><div class='add'>+		doutc(mdsc-&gt;fsc-&gt;client,</div><div class='add'>+		      "caps %d = %d used + %d resv + %d avail\n",</div><div class='add'>+		      mdsc-&gt;caps_total_count, mdsc-&gt;caps_use_count,</div><div class='add'>+		      mdsc-&gt;caps_reserve_count, mdsc-&gt;caps_avail_count);</div><div class='ctx'> 		BUG_ON(mdsc-&gt;caps_total_count != mdsc-&gt;caps_use_count +</div><div class='ctx'> 						 mdsc-&gt;caps_reserve_count +</div><div class='ctx'> 						 mdsc-&gt;caps_avail_count);</div><div class='hunk'>@@ -200,6 +203,7 @@ static void __ceph_unreserve_caps(struct ceph_mds_client *mdsc, int nr_caps)</div><div class='ctx'> int ceph_reserve_caps(struct ceph_mds_client *mdsc,</div><div class='ctx'> 		      struct ceph_cap_reservation *ctx, int need)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	int i, j;</div><div class='ctx'> 	struct ceph_cap *cap;</div><div class='ctx'> 	int have;</div><div class='hunk'>@@ -210,7 +214,7 @@ int ceph_reserve_caps(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	struct ceph_mds_session *s;</div><div class='ctx'> 	LIST_HEAD(newcaps);</div><div class='ctx'> </div><div class='del'>-	dout("reserve caps ctx=%p need=%d\n", ctx, need);</div><div class='add'>+	doutc(cl, "ctx=%p need=%d\n", ctx, need);</div><div class='ctx'> </div><div class='ctx'> 	/* first reserve any caps that are already allocated */</div><div class='ctx'> 	spin_lock(&amp;mdsc-&gt;caps_list_lock);</div><div class='hunk'>@@ -270,8 +274,8 @@ int ceph_reserve_caps(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		pr_warn("reserve caps ctx=%p ENOMEM need=%d got=%d\n",</div><div class='del'>-			ctx, need, have + alloc);</div><div class='add'>+		pr_warn_client(cl, "ctx=%p ENOMEM need=%d got=%d\n", ctx, need,</div><div class='add'>+			       have + alloc);</div><div class='ctx'> 		err = -ENOMEM;</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -296,20 +300,21 @@ int ceph_reserve_caps(struct ceph_mds_client *mdsc,</div><div class='ctx'> </div><div class='ctx'> 	spin_unlock(&amp;mdsc-&gt;caps_list_lock);</div><div class='ctx'> </div><div class='del'>-	dout("reserve caps ctx=%p %d = %d used + %d resv + %d avail\n",</div><div class='del'>-	     ctx, mdsc-&gt;caps_total_count, mdsc-&gt;caps_use_count,</div><div class='del'>-	     mdsc-&gt;caps_reserve_count, mdsc-&gt;caps_avail_count);</div><div class='add'>+	doutc(cl, "ctx=%p %d = %d used + %d resv + %d avail\n", ctx,</div><div class='add'>+	      mdsc-&gt;caps_total_count, mdsc-&gt;caps_use_count,</div><div class='add'>+	      mdsc-&gt;caps_reserve_count, mdsc-&gt;caps_avail_count);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void ceph_unreserve_caps(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			 struct ceph_cap_reservation *ctx)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	bool reclaim = false;</div><div class='ctx'> 	if (!ctx-&gt;count)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	dout("unreserve caps ctx=%p count=%d\n", ctx, ctx-&gt;count);</div><div class='add'>+	doutc(cl, "ctx=%p count=%d\n", ctx, ctx-&gt;count);</div><div class='ctx'> 	spin_lock(&amp;mdsc-&gt;caps_list_lock);</div><div class='ctx'> 	__ceph_unreserve_caps(mdsc, ctx-&gt;count);</div><div class='ctx'> 	ctx-&gt;count = 0;</div><div class='hunk'>@@ -326,6 +331,7 @@ void ceph_unreserve_caps(struct ceph_mds_client *mdsc,</div><div class='ctx'> struct ceph_cap *ceph_get_cap(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			      struct ceph_cap_reservation *ctx)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_cap *cap = NULL;</div><div class='ctx'> </div><div class='ctx'> 	/* temporary, until we do something about cap import/export */</div><div class='hunk'>@@ -357,9 +363,9 @@ struct ceph_cap *ceph_get_cap(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;mdsc-&gt;caps_list_lock);</div><div class='del'>-	dout("get_cap ctx=%p (%d) %d = %d used + %d resv + %d avail\n",</div><div class='del'>-	     ctx, ctx-&gt;count, mdsc-&gt;caps_total_count, mdsc-&gt;caps_use_count,</div><div class='del'>-	     mdsc-&gt;caps_reserve_count, mdsc-&gt;caps_avail_count);</div><div class='add'>+	doutc(cl, "ctx=%p (%d) %d = %d used + %d resv + %d avail\n", ctx,</div><div class='add'>+	      ctx-&gt;count, mdsc-&gt;caps_total_count, mdsc-&gt;caps_use_count,</div><div class='add'>+	      mdsc-&gt;caps_reserve_count, mdsc-&gt;caps_avail_count);</div><div class='ctx'> 	BUG_ON(!ctx-&gt;count);</div><div class='ctx'> 	BUG_ON(ctx-&gt;count &gt; mdsc-&gt;caps_reserve_count);</div><div class='ctx'> 	BUG_ON(list_empty(&amp;mdsc-&gt;caps_list));</div><div class='hunk'>@@ -380,10 +386,12 @@ struct ceph_cap *ceph_get_cap(struct ceph_mds_client *mdsc,</div><div class='ctx'> </div><div class='ctx'> void ceph_put_cap(struct ceph_mds_client *mdsc, struct ceph_cap *cap)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='add'>+</div><div class='ctx'> 	spin_lock(&amp;mdsc-&gt;caps_list_lock);</div><div class='del'>-	dout("put_cap %p %d = %d used + %d resv + %d avail\n",</div><div class='del'>-	     cap, mdsc-&gt;caps_total_count, mdsc-&gt;caps_use_count,</div><div class='del'>-	     mdsc-&gt;caps_reserve_count, mdsc-&gt;caps_avail_count);</div><div class='add'>+	doutc(cl, "%p %d = %d used + %d resv + %d avail\n", cap,</div><div class='add'>+	      mdsc-&gt;caps_total_count, mdsc-&gt;caps_use_count,</div><div class='add'>+	      mdsc-&gt;caps_reserve_count, mdsc-&gt;caps_avail_count);</div><div class='ctx'> 	mdsc-&gt;caps_use_count--;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Keep some preallocated caps around (ceph_min_count), to</div><div class='hunk'>@@ -430,7 +438,7 @@ void ceph_reservation_status(struct ceph_fs_client *fsc,</div><div class='ctx'>  *</div><div class='ctx'>  * Called with i_ceph_lock held.</div><div class='ctx'>  */</div><div class='del'>-static struct ceph_cap *__get_cap_for_mds(struct ceph_inode_info *ci, int mds)</div><div class='add'>+struct ceph_cap *__get_cap_for_mds(struct ceph_inode_info *ci, int mds)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_cap *cap;</div><div class='ctx'> 	struct rb_node *n = ci-&gt;i_caps.rb_node;</div><div class='hunk'>@@ -489,11 +497,13 @@ static void __insert_cap_node(struct ceph_inode_info *ci,</div><div class='ctx'> static void __cap_set_timeouts(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			       struct ceph_inode_info *ci)</div><div class='ctx'> {</div><div class='add'>+	struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='ctx'> 	struct ceph_mount_options *opt = mdsc-&gt;fsc-&gt;mount_options;</div><div class='add'>+</div><div class='ctx'> 	ci-&gt;i_hold_caps_max = round_jiffies(jiffies +</div><div class='ctx'> 					    opt-&gt;caps_wanted_delay_max * HZ);</div><div class='del'>-	dout("__cap_set_timeouts %p %lu\n", &amp;ci-&gt;vfs_inode,</div><div class='del'>-	     ci-&gt;i_hold_caps_max - jiffies);</div><div class='add'>+	doutc(mdsc-&gt;fsc-&gt;client, "%p %llx.%llx %lu\n", inode,</div><div class='add'>+	      ceph_vinop(inode), ci-&gt;i_hold_caps_max - jiffies);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -507,8 +517,11 @@ static void __cap_set_timeouts(struct ceph_mds_client *mdsc,</div><div class='ctx'> static void __cap_delay_requeue(struct ceph_mds_client *mdsc,</div><div class='ctx'> 				struct ceph_inode_info *ci)</div><div class='ctx'> {</div><div class='del'>-	dout("__cap_delay_requeue %p flags 0x%lx at %lu\n", &amp;ci-&gt;vfs_inode,</div><div class='del'>-	     ci-&gt;i_ceph_flags, ci-&gt;i_hold_caps_max);</div><div class='add'>+	struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='add'>+</div><div class='add'>+	doutc(mdsc-&gt;fsc-&gt;client, "%p %llx.%llx flags 0x%lx at %lu\n",</div><div class='add'>+	      inode, ceph_vinop(inode), ci-&gt;i_ceph_flags,</div><div class='add'>+	      ci-&gt;i_hold_caps_max);</div><div class='ctx'> 	if (!mdsc-&gt;stopping) {</div><div class='ctx'> 		spin_lock(&amp;mdsc-&gt;cap_delay_lock);</div><div class='ctx'> 		if (!list_empty(&amp;ci-&gt;i_cap_delay_list)) {</div><div class='hunk'>@@ -531,7 +544,9 @@ no_change:</div><div class='ctx'> static void __cap_delay_requeue_front(struct ceph_mds_client *mdsc,</div><div class='ctx'> 				      struct ceph_inode_info *ci)</div><div class='ctx'> {</div><div class='del'>-	dout("__cap_delay_requeue_front %p\n", &amp;ci-&gt;vfs_inode);</div><div class='add'>+	struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='add'>+</div><div class='add'>+	doutc(mdsc-&gt;fsc-&gt;client, "%p %llx.%llx\n", inode, ceph_vinop(inode));</div><div class='ctx'> 	spin_lock(&amp;mdsc-&gt;cap_delay_lock);</div><div class='ctx'> 	ci-&gt;i_ceph_flags |= CEPH_I_FLUSH;</div><div class='ctx'> 	if (!list_empty(&amp;ci-&gt;i_cap_delay_list))</div><div class='hunk'>@@ -548,7 +563,9 @@ static void __cap_delay_requeue_front(struct ceph_mds_client *mdsc,</div><div class='ctx'> static void __cap_delay_cancel(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			       struct ceph_inode_info *ci)</div><div class='ctx'> {</div><div class='del'>-	dout("__cap_delay_cancel %p\n", &amp;ci-&gt;vfs_inode);</div><div class='add'>+	struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='add'>+</div><div class='add'>+	doutc(mdsc-&gt;fsc-&gt;client, "%p %llx.%llx\n", inode, ceph_vinop(inode));</div><div class='ctx'> 	if (list_empty(&amp;ci-&gt;i_cap_delay_list))</div><div class='ctx'> 		return;</div><div class='ctx'> 	spin_lock(&amp;mdsc-&gt;cap_delay_lock);</div><div class='hunk'>@@ -560,6 +577,9 @@ static void __cap_delay_cancel(struct ceph_mds_client *mdsc,</div><div class='ctx'> static void __check_cap_issue(struct ceph_inode_info *ci, struct ceph_cap *cap,</div><div class='ctx'> 			      unsigned issued)</div><div class='ctx'> {</div><div class='add'>+	struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='add'>+</div><div class='ctx'> 	unsigned had = __ceph_caps_issued(ci, NULL);</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;ci-&gt;i_ceph_lock);</div><div class='hunk'>@@ -568,7 +588,7 @@ static void __check_cap_issue(struct ceph_inode_info *ci, struct ceph_cap *cap,</div><div class='ctx'> 	 * Each time we receive FILE_CACHE anew, we increment</div><div class='ctx'> 	 * i_rdcache_gen.</div><div class='ctx'> 	 */</div><div class='del'>-	if (S_ISREG(ci-&gt;vfs_inode.i_mode) &amp;&amp;</div><div class='add'>+	if (S_ISREG(ci-&gt;netfs.inode.i_mode) &amp;&amp;</div><div class='ctx'> 	    (issued &amp; (CEPH_CAP_FILE_CACHE|CEPH_CAP_FILE_LAZYIO)) &amp;&amp;</div><div class='ctx'> 	    (had &amp; (CEPH_CAP_FILE_CACHE|CEPH_CAP_FILE_LAZYIO)) == 0) {</div><div class='ctx'> 		ci-&gt;i_rdcache_gen++;</div><div class='hunk'>@@ -583,14 +603,14 @@ static void __check_cap_issue(struct ceph_inode_info *ci, struct ceph_cap *cap,</div><div class='ctx'> 	if ((issued &amp; CEPH_CAP_FILE_SHARED) != (had &amp; CEPH_CAP_FILE_SHARED)) {</div><div class='ctx'> 		if (issued &amp; CEPH_CAP_FILE_SHARED)</div><div class='ctx'> 			atomic_inc(&amp;ci-&gt;i_shared_gen);</div><div class='del'>-		if (S_ISDIR(ci-&gt;vfs_inode.i_mode)) {</div><div class='del'>-			dout(" marking %p NOT complete\n", &amp;ci-&gt;vfs_inode);</div><div class='add'>+		if (S_ISDIR(ci-&gt;netfs.inode.i_mode)) {</div><div class='add'>+			doutc(cl, " marking %p NOT complete\n", inode);</div><div class='ctx'> 			__ceph_dir_clear_complete(ci);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Wipe saved layout if we're losing DIR_CREATE caps */</div><div class='del'>-	if (S_ISDIR(ci-&gt;vfs_inode.i_mode) &amp;&amp; (had &amp; CEPH_CAP_DIR_CREATE) &amp;&amp;</div><div class='add'>+	if (S_ISDIR(ci-&gt;netfs.inode.i_mode) &amp;&amp; (had &amp; CEPH_CAP_DIR_CREATE) &amp;&amp;</div><div class='ctx'> 		!(issued &amp; CEPH_CAP_DIR_CREATE)) {</div><div class='ctx'> 	     ceph_put_string(rcu_dereference_raw(ci-&gt;i_cached_layout.pool_ns));</div><div class='ctx'> 	     memset(&amp;ci-&gt;i_cached_layout, 0, sizeof(ci-&gt;i_cached_layout));</div><div class='hunk'>@@ -602,8 +622,8 @@ static void __check_cap_issue(struct ceph_inode_info *ci, struct ceph_cap *cap,</div><div class='ctx'>  * @ci: inode to be moved</div><div class='ctx'>  * @session: new auth caps session</div><div class='ctx'>  */</div><div class='del'>-static void change_auth_cap_ses(struct ceph_inode_info *ci,</div><div class='del'>-				struct ceph_mds_session *session)</div><div class='add'>+void change_auth_cap_ses(struct ceph_inode_info *ci,</div><div class='add'>+			 struct ceph_mds_session *session)</div><div class='ctx'> {</div><div class='ctx'> 	lockdep_assert_held(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> </div><div class='hunk'>@@ -633,7 +653,8 @@ void ceph_add_cap(struct inode *inode,</div><div class='ctx'> 		  unsigned seq, unsigned mseq, u64 realmino, int flags,</div><div class='ctx'> 		  struct ceph_cap **new_cap)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_mds_client *mdsc = ceph_inode_to_client(inode)-&gt;mdsc;</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_inode_to_fs_client(inode)-&gt;mdsc;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	struct ceph_cap *cap;</div><div class='ctx'> 	int mds = session-&gt;s_mds;</div><div class='hunk'>@@ -642,8 +663,9 @@ void ceph_add_cap(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> </div><div class='del'>-	dout("add_cap %p mds%d cap %llx %s seq %d\n", inode,</div><div class='del'>-	     session-&gt;s_mds, cap_id, ceph_cap_string(issued), seq);</div><div class='add'>+	doutc(cl, "%p %llx.%llx mds%d cap %llx %s seq %d\n", inode,</div><div class='add'>+	      ceph_vinop(inode), session-&gt;s_mds, cap_id,</div><div class='add'>+	      ceph_cap_string(issued), seq);</div><div class='ctx'> </div><div class='ctx'> 	gen = atomic_read(&amp;session-&gt;s_cap_gen);</div><div class='ctx'> </div><div class='hunk'>@@ -721,9 +743,9 @@ void ceph_add_cap(struct inode *inode,</div><div class='ctx'> 	actual_wanted = __ceph_caps_wanted(ci);</div><div class='ctx'> 	if ((wanted &amp; ~actual_wanted) ||</div><div class='ctx'> 	    (issued &amp; ~actual_wanted &amp; CEPH_CAP_ANY_WR)) {</div><div class='del'>-		dout(" issued %s, mds wanted %s, actual %s, queueing\n",</div><div class='del'>-		     ceph_cap_string(issued), ceph_cap_string(wanted),</div><div class='del'>-		     ceph_cap_string(actual_wanted));</div><div class='add'>+		doutc(cl, "issued %s, mds wanted %s, actual %s, queueing\n",</div><div class='add'>+		      ceph_cap_string(issued), ceph_cap_string(wanted),</div><div class='add'>+		      ceph_cap_string(actual_wanted));</div><div class='ctx'> 		__cap_delay_requeue(mdsc, ci);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -740,9 +762,9 @@ void ceph_add_cap(struct inode *inode,</div><div class='ctx'> 		WARN_ON(ci-&gt;i_auth_cap == cap);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("add_cap inode %p (%llx.%llx) cap %p %s now %s seq %d mds%d\n",</div><div class='del'>-	     inode, ceph_vinop(inode), cap, ceph_cap_string(issued),</div><div class='del'>-	     ceph_cap_string(issued|cap-&gt;issued), seq, mds);</div><div class='add'>+	doutc(cl, "inode %p %llx.%llx cap %p %s now %s seq %d mds%d\n",</div><div class='add'>+	      inode, ceph_vinop(inode), cap, ceph_cap_string(issued),</div><div class='add'>+	      ceph_cap_string(issued|cap-&gt;issued), seq, mds);</div><div class='ctx'> 	cap-&gt;cap_id = cap_id;</div><div class='ctx'> 	cap-&gt;issued = issued;</div><div class='ctx'> 	cap-&gt;implemented |= issued;</div><div class='hunk'>@@ -754,6 +776,7 @@ void ceph_add_cap(struct inode *inode,</div><div class='ctx'> 	cap-&gt;issue_seq = seq;</div><div class='ctx'> 	cap-&gt;mseq = mseq;</div><div class='ctx'> 	cap-&gt;cap_gen = gen;</div><div class='add'>+	wake_up_all(&amp;ci-&gt;i_cap_wq);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -763,6 +786,8 @@ void ceph_add_cap(struct inode *inode,</div><div class='ctx'>  */</div><div class='ctx'> static int __cap_is_valid(struct ceph_cap *cap)</div><div class='ctx'> {</div><div class='add'>+	struct inode *inode = &amp;cap-&gt;ci-&gt;netfs.inode;</div><div class='add'>+	struct ceph_client *cl = cap-&gt;session-&gt;s_mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	unsigned long ttl;</div><div class='ctx'> 	u32 gen;</div><div class='ctx'> </div><div class='hunk'>@@ -770,9 +795,9 @@ static int __cap_is_valid(struct ceph_cap *cap)</div><div class='ctx'> 	ttl = cap-&gt;session-&gt;s_cap_ttl;</div><div class='ctx'> </div><div class='ctx'> 	if (cap-&gt;cap_gen &lt; gen || time_after_eq(jiffies, ttl)) {</div><div class='del'>-		dout("__cap_is_valid %p cap %p issued %s "</div><div class='del'>-		     "but STALE (gen %u vs %u)\n", &amp;cap-&gt;ci-&gt;vfs_inode,</div><div class='del'>-		     cap, ceph_cap_string(cap-&gt;issued), cap-&gt;cap_gen, gen);</div><div class='add'>+		doutc(cl, "%p %llx.%llx cap %p issued %s but STALE (gen %u vs %u)\n",</div><div class='add'>+		      inode, ceph_vinop(inode), cap,</div><div class='add'>+		      ceph_cap_string(cap-&gt;issued), cap-&gt;cap_gen, gen);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -786,6 +811,8 @@ static int __cap_is_valid(struct ceph_cap *cap)</div><div class='ctx'>  */</div><div class='ctx'> int __ceph_caps_issued(struct ceph_inode_info *ci, int *implemented)</div><div class='ctx'> {</div><div class='add'>+	struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	int have = ci-&gt;i_snap_caps;</div><div class='ctx'> 	struct ceph_cap *cap;</div><div class='ctx'> 	struct rb_node *p;</div><div class='hunk'>@@ -796,8 +823,8 @@ int __ceph_caps_issued(struct ceph_inode_info *ci, int *implemented)</div><div class='ctx'> 		cap = rb_entry(p, struct ceph_cap, ci_node);</div><div class='ctx'> 		if (!__cap_is_valid(cap))</div><div class='ctx'> 			continue;</div><div class='del'>-		dout("__ceph_caps_issued %p cap %p issued %s\n",</div><div class='del'>-		     &amp;ci-&gt;vfs_inode, cap, ceph_cap_string(cap-&gt;issued));</div><div class='add'>+		doutc(cl, "%p %llx.%llx cap %p issued %s\n", inode,</div><div class='add'>+		      ceph_vinop(inode), cap, ceph_cap_string(cap-&gt;issued));</div><div class='ctx'> 		have |= cap-&gt;issued;</div><div class='ctx'> 		if (implemented)</div><div class='ctx'> 			*implemented |= cap-&gt;implemented;</div><div class='hunk'>@@ -840,16 +867,18 @@ int __ceph_caps_issued_other(struct ceph_inode_info *ci, struct ceph_cap *ocap)</div><div class='ctx'>  */</div><div class='ctx'> static void __touch_cap(struct ceph_cap *cap)</div><div class='ctx'> {</div><div class='add'>+	struct inode *inode = &amp;cap-&gt;ci-&gt;netfs.inode;</div><div class='ctx'> 	struct ceph_mds_session *s = cap-&gt;session;</div><div class='add'>+	struct ceph_client *cl = s-&gt;s_mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;s-&gt;s_cap_lock);</div><div class='ctx'> 	if (!s-&gt;s_cap_iterator) {</div><div class='del'>-		dout("__touch_cap %p cap %p mds%d\n", &amp;cap-&gt;ci-&gt;vfs_inode, cap,</div><div class='del'>-		     s-&gt;s_mds);</div><div class='add'>+		doutc(cl, "%p %llx.%llx cap %p mds%d\n", inode,</div><div class='add'>+		      ceph_vinop(inode), cap, s-&gt;s_mds);</div><div class='ctx'> 		list_move_tail(&amp;cap-&gt;session_caps, &amp;s-&gt;s_caps);</div><div class='ctx'> 	} else {</div><div class='del'>-		dout("__touch_cap %p cap %p mds%d NOP, iterating over caps\n",</div><div class='del'>-		     &amp;cap-&gt;ci-&gt;vfs_inode, cap, s-&gt;s_mds);</div><div class='add'>+		doutc(cl, "%p %llx.%llx cap %p mds%d NOP, iterating over caps\n",</div><div class='add'>+		      inode, ceph_vinop(inode), cap, s-&gt;s_mds);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;s-&gt;s_cap_lock);</div><div class='ctx'> }</div><div class='hunk'>@@ -861,15 +890,16 @@ static void __touch_cap(struct ceph_cap *cap)</div><div class='ctx'>  */</div><div class='ctx'> int __ceph_caps_issued_mask(struct ceph_inode_info *ci, int mask, int touch)</div><div class='ctx'> {</div><div class='add'>+	struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_cap *cap;</div><div class='ctx'> 	struct rb_node *p;</div><div class='ctx'> 	int have = ci-&gt;i_snap_caps;</div><div class='ctx'> </div><div class='ctx'> 	if ((have &amp; mask) == mask) {</div><div class='del'>-		dout("__ceph_caps_issued_mask ino 0x%llx snap issued %s"</div><div class='del'>-		     " (mask %s)\n", ceph_ino(&amp;ci-&gt;vfs_inode),</div><div class='del'>-		     ceph_cap_string(have),</div><div class='del'>-		     ceph_cap_string(mask));</div><div class='add'>+		doutc(cl, "mask %p %llx.%llx snap issued %s (mask %s)\n",</div><div class='add'>+		      inode, ceph_vinop(inode), ceph_cap_string(have),</div><div class='add'>+		      ceph_cap_string(mask));</div><div class='ctx'> 		return 1;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -878,10 +908,10 @@ int __ceph_caps_issued_mask(struct ceph_inode_info *ci, int mask, int touch)</div><div class='ctx'> 		if (!__cap_is_valid(cap))</div><div class='ctx'> 			continue;</div><div class='ctx'> 		if ((cap-&gt;issued &amp; mask) == mask) {</div><div class='del'>-			dout("__ceph_caps_issued_mask ino 0x%llx cap %p issued %s"</div><div class='del'>-			     " (mask %s)\n", ceph_ino(&amp;ci-&gt;vfs_inode), cap,</div><div class='del'>-			     ceph_cap_string(cap-&gt;issued),</div><div class='del'>-			     ceph_cap_string(mask));</div><div class='add'>+			doutc(cl, "mask %p %llx.%llx cap %p issued %s (mask %s)\n",</div><div class='add'>+			      inode, ceph_vinop(inode), cap,</div><div class='add'>+			      ceph_cap_string(cap-&gt;issued),</div><div class='add'>+			      ceph_cap_string(mask));</div><div class='ctx'> 			if (touch)</div><div class='ctx'> 				__touch_cap(cap);</div><div class='ctx'> 			return 1;</div><div class='hunk'>@@ -890,10 +920,10 @@ int __ceph_caps_issued_mask(struct ceph_inode_info *ci, int mask, int touch)</div><div class='ctx'> 		/* does a combination of caps satisfy mask? */</div><div class='ctx'> 		have |= cap-&gt;issued;</div><div class='ctx'> 		if ((have &amp; mask) == mask) {</div><div class='del'>-			dout("__ceph_caps_issued_mask ino 0x%llx combo issued %s"</div><div class='del'>-			     " (mask %s)\n", ceph_ino(&amp;ci-&gt;vfs_inode),</div><div class='del'>-			     ceph_cap_string(cap-&gt;issued),</div><div class='del'>-			     ceph_cap_string(mask));</div><div class='add'>+			doutc(cl, "mask %p %llx.%llx combo issued %s (mask %s)\n",</div><div class='add'>+			      inode, ceph_vinop(inode),</div><div class='add'>+			      ceph_cap_string(cap-&gt;issued),</div><div class='add'>+			      ceph_cap_string(mask));</div><div class='ctx'> 			if (touch) {</div><div class='ctx'> 				struct rb_node *q;</div><div class='ctx'> </div><div class='hunk'>@@ -919,7 +949,7 @@ int __ceph_caps_issued_mask(struct ceph_inode_info *ci, int mask, int touch)</div><div class='ctx'> int __ceph_caps_issued_mask_metric(struct ceph_inode_info *ci, int mask,</div><div class='ctx'> 				   int touch)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_sb_to_client(ci-&gt;vfs_inode.i_sb);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_sb_to_fs_client(ci-&gt;netfs.inode.i_sb);</div><div class='ctx'> 	int r;</div><div class='ctx'> </div><div class='ctx'> 	r = __ceph_caps_issued_mask(ci, mask, touch);</div><div class='hunk'>@@ -948,19 +978,6 @@ int __ceph_caps_revoking_other(struct ceph_inode_info *ci,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int ceph_caps_revoking(struct ceph_inode_info *ci, int mask)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = &amp;ci-&gt;vfs_inode;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-	ret = __ceph_caps_revoking_other(ci, NULL, mask);</div><div class='del'>-	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-	dout("ceph_caps_revoking %p %s = %d\n", inode,</div><div class='del'>-	     ceph_cap_string(mask), ret);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> int __ceph_caps_used(struct ceph_inode_info *ci)</div><div class='ctx'> {</div><div class='ctx'> 	int used = 0;</div><div class='hunk'>@@ -969,8 +986,8 @@ int __ceph_caps_used(struct ceph_inode_info *ci)</div><div class='ctx'> 	if (ci-&gt;i_rd_ref)</div><div class='ctx'> 		used |= CEPH_CAP_FILE_RD;</div><div class='ctx'> 	if (ci-&gt;i_rdcache_ref ||</div><div class='del'>-	    (S_ISREG(ci-&gt;vfs_inode.i_mode) &amp;&amp;</div><div class='del'>-	     ci-&gt;vfs_inode.i_data.nrpages))</div><div class='add'>+	    (S_ISREG(ci-&gt;netfs.inode.i_mode) &amp;&amp;</div><div class='add'>+	     ci-&gt;netfs.inode.i_data.nrpages))</div><div class='ctx'> 		used |= CEPH_CAP_FILE_CACHE;</div><div class='ctx'> 	if (ci-&gt;i_wr_ref)</div><div class='ctx'> 		used |= CEPH_CAP_FILE_WR;</div><div class='hunk'>@@ -993,11 +1010,11 @@ int __ceph_caps_file_wanted(struct ceph_inode_info *ci)</div><div class='ctx'> 	const int WR_SHIFT = ffs(CEPH_FILE_MODE_WR);</div><div class='ctx'> 	const int LAZY_SHIFT = ffs(CEPH_FILE_MODE_LAZY);</div><div class='ctx'> 	struct ceph_mount_options *opt =</div><div class='del'>-		ceph_inode_to_client(&amp;ci-&gt;vfs_inode)-&gt;mount_options;</div><div class='add'>+		ceph_inode_to_fs_client(&amp;ci-&gt;netfs.inode)-&gt;mount_options;</div><div class='ctx'> 	unsigned long used_cutoff = jiffies - opt-&gt;caps_wanted_delay_max * HZ;</div><div class='ctx'> 	unsigned long idle_cutoff = jiffies - opt-&gt;caps_wanted_delay_min * HZ;</div><div class='ctx'> </div><div class='del'>-	if (S_ISDIR(ci-&gt;vfs_inode.i_mode)) {</div><div class='add'>+	if (S_ISDIR(ci-&gt;netfs.inode.i_mode)) {</div><div class='ctx'> 		int want = 0;</div><div class='ctx'> </div><div class='ctx'> 		/* use used_cutoff here, to keep dir's wanted caps longer */</div><div class='hunk'>@@ -1050,7 +1067,7 @@ int __ceph_caps_file_wanted(struct ceph_inode_info *ci)</div><div class='ctx'> int __ceph_caps_wanted(struct ceph_inode_info *ci)</div><div class='ctx'> {</div><div class='ctx'> 	int w = __ceph_caps_file_wanted(ci) | __ceph_caps_used(ci);</div><div class='del'>-	if (S_ISDIR(ci-&gt;vfs_inode.i_mode)) {</div><div class='add'>+	if (S_ISDIR(ci-&gt;netfs.inode.i_mode)) {</div><div class='ctx'> 		/* we want EXCL if holding caps of dir ops */</div><div class='ctx'> 		if (w &amp; CEPH_CAP_ANY_DIR_OPS)</div><div class='ctx'> 			w |= CEPH_CAP_FILE_EXCL;</div><div class='hunk'>@@ -1104,21 +1121,23 @@ int ceph_is_any_caps(struct inode *inode)</div><div class='ctx'> void __ceph_remove_cap(struct ceph_cap *cap, bool queue_release)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_mds_session *session = cap-&gt;session;</div><div class='add'>+	struct ceph_client *cl = session-&gt;s_mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_inode_info *ci = cap-&gt;ci;</div><div class='add'>+	struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='ctx'> 	struct ceph_mds_client *mdsc;</div><div class='ctx'> 	int removed = 0;</div><div class='ctx'> </div><div class='ctx'> 	/* 'ci' being NULL means the remove have already occurred */</div><div class='ctx'> 	if (!ci) {</div><div class='del'>-		dout("%s: cap inode is NULL\n", __func__);</div><div class='add'>+		doutc(cl, "inode is NULL\n");</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> </div><div class='del'>-	dout("__ceph_remove_cap %p from %p\n", cap, &amp;ci-&gt;vfs_inode);</div><div class='add'>+	doutc(cl, "%p from %p %llx.%llx\n", cap, inode, ceph_vinop(inode));</div><div class='ctx'> </div><div class='del'>-	mdsc = ceph_inode_to_client(&amp;ci-&gt;vfs_inode)-&gt;mdsc;</div><div class='add'>+	mdsc = ceph_inode_to_fs_client(&amp;ci-&gt;netfs.inode)-&gt;mdsc;</div><div class='ctx'> </div><div class='ctx'> 	/* remove from inode's cap rbtree, and clear auth cap */</div><div class='ctx'> 	rb_erase(&amp;cap-&gt;ci_node, &amp;ci-&gt;i_caps);</div><div class='hunk'>@@ -1129,8 +1148,8 @@ void __ceph_remove_cap(struct ceph_cap *cap, bool queue_release)</div><div class='ctx'> 	spin_lock(&amp;session-&gt;s_cap_lock);</div><div class='ctx'> 	if (session-&gt;s_cap_iterator == cap) {</div><div class='ctx'> 		/* not yet, we are iterating over this very cap */</div><div class='del'>-		dout("__ceph_remove_cap  delaying %p removal from session %p\n",</div><div class='del'>-		     cap, cap-&gt;session);</div><div class='add'>+		doutc(cl, "delaying %p removal from session %p\n", cap,</div><div class='add'>+		      cap-&gt;session);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		list_del_init(&amp;cap-&gt;session_caps);</div><div class='ctx'> 		session-&gt;s_nr_caps--;</div><div class='hunk'>@@ -1169,30 +1188,31 @@ void __ceph_remove_cap(struct ceph_cap *cap, bool queue_release)</div><div class='ctx'> 		 * keep i_snap_realm.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (ci-&gt;i_wr_ref == 0 &amp;&amp; ci-&gt;i_snap_realm)</div><div class='del'>-			ceph_change_snap_realm(&amp;ci-&gt;vfs_inode, NULL);</div><div class='add'>+			ceph_change_snap_realm(&amp;ci-&gt;netfs.inode, NULL);</div><div class='ctx'> </div><div class='ctx'> 		__cap_delay_cancel(mdsc, ci);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void ceph_remove_cap(struct ceph_cap *cap, bool queue_release)</div><div class='add'>+void ceph_remove_cap(struct ceph_mds_client *mdsc, struct ceph_cap *cap,</div><div class='add'>+		     bool queue_release)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_inode_info *ci = cap-&gt;ci;</div><div class='ctx'> 	struct ceph_fs_client *fsc;</div><div class='ctx'> </div><div class='ctx'> 	/* 'ci' being NULL means the remove have already occurred */</div><div class='ctx'> 	if (!ci) {</div><div class='del'>-		dout("%s: cap inode is NULL\n", __func__);</div><div class='add'>+		doutc(mdsc-&gt;fsc-&gt;client, "inode is NULL\n");</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> </div><div class='del'>-	fsc = ceph_sb_to_client(ci-&gt;vfs_inode.i_sb);</div><div class='add'>+	fsc = ceph_inode_to_fs_client(&amp;ci-&gt;netfs.inode);</div><div class='ctx'> 	WARN_ON_ONCE(ci-&gt;i_auth_cap == cap &amp;&amp;</div><div class='ctx'> 		     !list_empty(&amp;ci-&gt;i_dirty_item) &amp;&amp;</div><div class='ctx'> 		     !fsc-&gt;blocklisted &amp;&amp;</div><div class='del'>-		     READ_ONCE(fsc-&gt;mount_state) != CEPH_MOUNT_SHUTDOWN);</div><div class='add'>+		     !ceph_inode_is_shutdown(&amp;ci-&gt;netfs.inode));</div><div class='ctx'> </div><div class='ctx'> 	__ceph_remove_cap(cap, queue_release);</div><div class='ctx'> }</div><div class='hunk'>@@ -1214,31 +1234,31 @@ struct cap_msg_args {</div><div class='ctx'> 	umode_t			mode;</div><div class='ctx'> 	bool			inline_data;</div><div class='ctx'> 	bool			wake;</div><div class='add'>+	bool			encrypted;</div><div class='add'>+	u32			fscrypt_auth_len;</div><div class='add'>+	u8			fscrypt_auth[sizeof(struct ceph_fscrypt_auth)]; // for context</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * cap struct size + flock buffer size + inline version + inline data size +</div><div class='del'>- * osd_epoch_barrier + oldest_flush_tid</div><div class='del'>- */</div><div class='del'>-#define CAP_MSG_SIZE (sizeof(struct ceph_mds_caps) + \</div><div class='del'>-		      4 + 8 + 4 + 4 + 8 + 4 + 4 + 4 + 8 + 8 + 4)</div><div class='del'>-</div><div class='ctx'> /* Marshal up the cap msg to the MDS */</div><div class='ctx'> static void encode_cap_msg(struct ceph_msg *msg, struct cap_msg_args *arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_mds_caps *fc;</div><div class='ctx'> 	void *p;</div><div class='del'>-	struct ceph_osd_client *osdc = &amp;arg-&gt;session-&gt;s_mdsc-&gt;fsc-&gt;client-&gt;osdc;</div><div class='del'>-</div><div class='del'>-	dout("%s %s %llx %llx caps %s wanted %s dirty %s seq %u/%u tid %llu/%llu mseq %u follows %lld size %llu/%llu xattr_ver %llu xattr_len %d\n",</div><div class='del'>-	     __func__, ceph_cap_op_name(arg-&gt;op), arg-&gt;cid, arg-&gt;ino,</div><div class='del'>-	     ceph_cap_string(arg-&gt;caps), ceph_cap_string(arg-&gt;wanted),</div><div class='del'>-	     ceph_cap_string(arg-&gt;dirty), arg-&gt;seq, arg-&gt;issue_seq,</div><div class='del'>-	     arg-&gt;flush_tid, arg-&gt;oldest_flush_tid, arg-&gt;mseq, arg-&gt;follows,</div><div class='del'>-	     arg-&gt;size, arg-&gt;max_size, arg-&gt;xattr_version,</div><div class='del'>-	     arg-&gt;xattr_buf ? (int)arg-&gt;xattr_buf-&gt;vec.iov_len : 0);</div><div class='del'>-</div><div class='del'>-	msg-&gt;hdr.version = cpu_to_le16(10);</div><div class='add'>+	struct ceph_mds_client *mdsc = arg-&gt;session-&gt;s_mdsc;</div><div class='add'>+	struct ceph_osd_client *osdc = &amp;mdsc-&gt;fsc-&gt;client-&gt;osdc;</div><div class='add'>+</div><div class='add'>+	doutc(mdsc-&gt;fsc-&gt;client,</div><div class='add'>+	      "%s %llx %llx caps %s wanted %s dirty %s seq %u/%u"</div><div class='add'>+	      " tid %llu/%llu mseq %u follows %lld size %llu/%llu"</div><div class='add'>+	      " xattr_ver %llu xattr_len %d\n",</div><div class='add'>+	      ceph_cap_op_name(arg-&gt;op), arg-&gt;cid, arg-&gt;ino,</div><div class='add'>+	      ceph_cap_string(arg-&gt;caps), ceph_cap_string(arg-&gt;wanted),</div><div class='add'>+	      ceph_cap_string(arg-&gt;dirty), arg-&gt;seq, arg-&gt;issue_seq,</div><div class='add'>+	      arg-&gt;flush_tid, arg-&gt;oldest_flush_tid, arg-&gt;mseq, arg-&gt;follows,</div><div class='add'>+	      arg-&gt;size, arg-&gt;max_size, arg-&gt;xattr_version,</div><div class='add'>+	      arg-&gt;xattr_buf ? (int)arg-&gt;xattr_buf-&gt;vec.iov_len : 0);</div><div class='add'>+</div><div class='add'>+	msg-&gt;hdr.version = cpu_to_le16(12);</div><div class='ctx'> 	msg-&gt;hdr.tid = cpu_to_le64(arg-&gt;flush_tid);</div><div class='ctx'> </div><div class='ctx'> 	fc = msg-&gt;front.iov_base;</div><div class='hunk'>@@ -1255,7 +1275,13 @@ static void encode_cap_msg(struct ceph_msg *msg, struct cap_msg_args *arg)</div><div class='ctx'> 	fc-&gt;ino = cpu_to_le64(arg-&gt;ino);</div><div class='ctx'> 	fc-&gt;snap_follows = cpu_to_le64(arg-&gt;follows);</div><div class='ctx'> </div><div class='del'>-	fc-&gt;size = cpu_to_le64(arg-&gt;size);</div><div class='add'>+#if IS_ENABLED(CONFIG_FS_ENCRYPTION)</div><div class='add'>+	if (arg-&gt;encrypted)</div><div class='add'>+		fc-&gt;size = cpu_to_le64(round_up(arg-&gt;size,</div><div class='add'>+						CEPH_FSCRYPT_BLOCK_SIZE));</div><div class='add'>+	else</div><div class='add'>+#endif</div><div class='add'>+		fc-&gt;size = cpu_to_le64(arg-&gt;size);</div><div class='ctx'> 	fc-&gt;max_size = cpu_to_le64(arg-&gt;max_size);</div><div class='ctx'> 	ceph_encode_timespec64(&amp;fc-&gt;mtime, &amp;arg-&gt;mtime);</div><div class='ctx'> 	ceph_encode_timespec64(&amp;fc-&gt;atime, &amp;arg-&gt;atime);</div><div class='hunk'>@@ -1309,6 +1335,27 @@ static void encode_cap_msg(struct ceph_msg *msg, struct cap_msg_args *arg)</div><div class='ctx'> </div><div class='ctx'> 	/* Advisory flags (version 10) */</div><div class='ctx'> 	ceph_encode_32(&amp;p, arg-&gt;flags);</div><div class='add'>+</div><div class='add'>+	/* dirstats (version 11) - these are r/o on the client */</div><div class='add'>+	ceph_encode_64(&amp;p, 0);</div><div class='add'>+	ceph_encode_64(&amp;p, 0);</div><div class='add'>+</div><div class='add'>+#if IS_ENABLED(CONFIG_FS_ENCRYPTION)</div><div class='add'>+	/*</div><div class='add'>+	 * fscrypt_auth and fscrypt_file (version 12)</div><div class='add'>+	 *</div><div class='add'>+	 * fscrypt_auth holds the crypto context (if any). fscrypt_file</div><div class='add'>+	 * tracks the real i_size as an __le64 field (and we use a rounded-up</div><div class='add'>+	 * i_size in the traditional size field).</div><div class='add'>+	 */</div><div class='add'>+	ceph_encode_32(&amp;p, arg-&gt;fscrypt_auth_len);</div><div class='add'>+	ceph_encode_copy(&amp;p, arg-&gt;fscrypt_auth, arg-&gt;fscrypt_auth_len);</div><div class='add'>+	ceph_encode_32(&amp;p, sizeof(__le64));</div><div class='add'>+	ceph_encode_64(&amp;p, arg-&gt;size);</div><div class='add'>+#else /* CONFIG_FS_ENCRYPTION */</div><div class='add'>+	ceph_encode_32(&amp;p, 0);</div><div class='add'>+	ceph_encode_32(&amp;p, 0);</div><div class='add'>+#endif /* CONFIG_FS_ENCRYPTION */</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1316,6 +1363,8 @@ static void encode_cap_msg(struct ceph_msg *msg, struct cap_msg_args *arg)</div><div class='ctx'>  */</div><div class='ctx'> void __ceph_remove_caps(struct ceph_inode_info *ci)</div><div class='ctx'> {</div><div class='add'>+	struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_inode_to_fs_client(inode)-&gt;mdsc;</div><div class='ctx'> 	struct rb_node *p;</div><div class='ctx'> </div><div class='ctx'> 	/* lock i_ceph_lock, because ceph_d_revalidate(..., LOOKUP_RCU)</div><div class='hunk'>@@ -1325,7 +1374,7 @@ void __ceph_remove_caps(struct ceph_inode_info *ci)</div><div class='ctx'> 	while (p) {</div><div class='ctx'> 		struct ceph_cap *cap = rb_entry(p, struct ceph_cap, ci_node);</div><div class='ctx'> 		p = rb_next(p);</div><div class='del'>-		ceph_remove_cap(cap, true);</div><div class='add'>+		ceph_remove_cap(mdsc, cap, true);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> }</div><div class='hunk'>@@ -1343,7 +1392,8 @@ static void __prep_cap(struct cap_msg_args *arg, struct ceph_cap *cap,</div><div class='ctx'> 		       int flushing, u64 flush_tid, u64 oldest_flush_tid)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_inode_info *ci = cap-&gt;ci;</div><div class='del'>-	struct inode *inode = &amp;ci-&gt;vfs_inode;</div><div class='add'>+	struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	int held, revoking;</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;ci-&gt;i_ceph_lock);</div><div class='hunk'>@@ -1352,10 +1402,10 @@ static void __prep_cap(struct cap_msg_args *arg, struct ceph_cap *cap,</div><div class='ctx'> 	revoking = cap-&gt;implemented &amp; ~cap-&gt;issued;</div><div class='ctx'> 	retain &amp;= ~revoking;</div><div class='ctx'> </div><div class='del'>-	dout("%s %p cap %p session %p %s -&gt; %s (revoking %s)\n",</div><div class='del'>-	     __func__, inode, cap, cap-&gt;session,</div><div class='del'>-	     ceph_cap_string(held), ceph_cap_string(held &amp; retain),</div><div class='del'>-	     ceph_cap_string(revoking));</div><div class='add'>+	doutc(cl, "%p %llx.%llx cap %p session %p %s -&gt; %s (revoking %s)\n",</div><div class='add'>+	      inode, ceph_vinop(inode), cap, cap-&gt;session,</div><div class='add'>+	      ceph_cap_string(held), ceph_cap_string(held &amp; retain),</div><div class='add'>+	      ceph_cap_string(revoking));</div><div class='ctx'> 	BUG_ON((retain &amp; CEPH_CAP_PIN) == 0);</div><div class='ctx'> </div><div class='ctx'> 	ci-&gt;i_ceph_flags &amp;= ~CEPH_I_FLUSH;</div><div class='hunk'>@@ -1376,7 +1426,6 @@ static void __prep_cap(struct cap_msg_args *arg, struct ceph_cap *cap,</div><div class='ctx'> 	arg-&gt;follows = flushing ? ci-&gt;i_head_snapc-&gt;seq : 0;</div><div class='ctx'> 	arg-&gt;flush_tid = flush_tid;</div><div class='ctx'> 	arg-&gt;oldest_flush_tid = oldest_flush_tid;</div><div class='del'>-</div><div class='ctx'> 	arg-&gt;size = i_size_read(inode);</div><div class='ctx'> 	ci-&gt;i_reported_size = arg-&gt;size;</div><div class='ctx'> 	arg-&gt;max_size = ci-&gt;i_wanted_max_size;</div><div class='hunk'>@@ -1390,15 +1439,15 @@ static void __prep_cap(struct cap_msg_args *arg, struct ceph_cap *cap,</div><div class='ctx'> 	if (flushing &amp; CEPH_CAP_XATTR_EXCL) {</div><div class='ctx'> 		arg-&gt;old_xattr_buf = __ceph_build_xattrs_blob(ci);</div><div class='ctx'> 		arg-&gt;xattr_version = ci-&gt;i_xattrs.version;</div><div class='del'>-		arg-&gt;xattr_buf = ci-&gt;i_xattrs.blob;</div><div class='add'>+		arg-&gt;xattr_buf = ceph_buffer_get(ci-&gt;i_xattrs.blob);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		arg-&gt;xattr_buf = NULL;</div><div class='ctx'> 		arg-&gt;old_xattr_buf = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	arg-&gt;mtime = inode-&gt;i_mtime;</div><div class='del'>-	arg-&gt;atime = inode-&gt;i_atime;</div><div class='del'>-	arg-&gt;ctime = inode-&gt;i_ctime;</div><div class='add'>+	arg-&gt;mtime = inode_get_mtime(inode);</div><div class='add'>+	arg-&gt;atime = inode_get_atime(inode);</div><div class='add'>+	arg-&gt;ctime = inode_get_ctime(inode);</div><div class='ctx'> 	arg-&gt;btime = ci-&gt;i_btime;</div><div class='ctx'> 	arg-&gt;change_attr = inode_peek_iversion_raw(inode);</div><div class='ctx'> </div><div class='hunk'>@@ -1430,7 +1479,38 @@ static void __prep_cap(struct cap_msg_args *arg, struct ceph_cap *cap,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	arg-&gt;flags = flags;</div><div class='add'>+	arg-&gt;encrypted = IS_ENCRYPTED(inode);</div><div class='add'>+#if IS_ENABLED(CONFIG_FS_ENCRYPTION)</div><div class='add'>+	if (ci-&gt;fscrypt_auth_len &amp;&amp;</div><div class='add'>+	    WARN_ON_ONCE(ci-&gt;fscrypt_auth_len &gt; sizeof(struct ceph_fscrypt_auth))) {</div><div class='add'>+		/* Don't set this if it's too big */</div><div class='add'>+		arg-&gt;fscrypt_auth_len = 0;</div><div class='add'>+	} else {</div><div class='add'>+		arg-&gt;fscrypt_auth_len = ci-&gt;fscrypt_auth_len;</div><div class='add'>+		memcpy(arg-&gt;fscrypt_auth, ci-&gt;fscrypt_auth,</div><div class='add'>+		       min_t(size_t, ci-&gt;fscrypt_auth_len,</div><div class='add'>+			     sizeof(arg-&gt;fscrypt_auth)));</div><div class='add'>+	}</div><div class='add'>+#endif /* CONFIG_FS_ENCRYPTION */</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#if IS_ENABLED(CONFIG_FS_ENCRYPTION)</div><div class='add'>+#define CAP_MSG_FIXED_FIELDS (sizeof(struct ceph_mds_caps) + \</div><div class='add'>+		      4 + 8 + 4 + 4 + 8 + 4 + 4 + 4 + 8 + 8 + 4 + 8 + 8 + 4 + 4 + 8)</div><div class='add'>+</div><div class='add'>+static inline int cap_msg_size(struct cap_msg_args *arg)</div><div class='add'>+{</div><div class='add'>+	return CAP_MSG_FIXED_FIELDS + arg-&gt;fscrypt_auth_len;</div><div class='ctx'> }</div><div class='add'>+#else</div><div class='add'>+#define CAP_MSG_FIXED_FIELDS (sizeof(struct ceph_mds_caps) + \</div><div class='add'>+		      4 + 8 + 4 + 4 + 8 + 4 + 4 + 4 + 8 + 8 + 4 + 8 + 8 + 4 + 4)</div><div class='add'>+</div><div class='add'>+static inline int cap_msg_size(struct cap_msg_args *arg)</div><div class='add'>+{</div><div class='add'>+	return CAP_MSG_FIXED_FIELDS;</div><div class='add'>+}</div><div class='add'>+#endif /* CONFIG_FS_ENCRYPTION */</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Send a cap msg on the given inode.</div><div class='hunk'>@@ -1440,13 +1520,17 @@ static void __prep_cap(struct cap_msg_args *arg, struct ceph_cap *cap,</div><div class='ctx'> static void __send_cap(struct cap_msg_args *arg, struct ceph_inode_info *ci)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_msg *msg;</div><div class='del'>-	struct inode *inode = &amp;ci-&gt;vfs_inode;</div><div class='add'>+	struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> </div><div class='del'>-	msg = ceph_msg_new(CEPH_MSG_CLIENT_CAPS, CAP_MSG_SIZE, GFP_NOFS, false);</div><div class='add'>+	msg = ceph_msg_new(CEPH_MSG_CLIENT_CAPS, cap_msg_size(arg), GFP_NOFS,</div><div class='add'>+			   false);</div><div class='ctx'> 	if (!msg) {</div><div class='del'>-		pr_err("error allocating cap msg: ino (%llx.%llx) flushing %s tid %llu, requeuing cap.\n",</div><div class='del'>-		       ceph_vinop(inode), ceph_cap_string(arg-&gt;dirty),</div><div class='del'>-		       arg-&gt;flush_tid);</div><div class='add'>+		pr_err_client(cl,</div><div class='add'>+			      "error allocating cap msg: ino (%llx.%llx)"</div><div class='add'>+			      " flushing %s tid %llu, requeuing cap.\n",</div><div class='add'>+			      ceph_vinop(inode), ceph_cap_string(arg-&gt;dirty),</div><div class='add'>+			      arg-&gt;flush_tid);</div><div class='ctx'> 		spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 		__cap_delay_requeue(arg-&gt;session-&gt;s_mdsc, ci);</div><div class='ctx'> 		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='hunk'>@@ -1456,6 +1540,7 @@ static void __send_cap(struct cap_msg_args *arg, struct ceph_inode_info *ci)</div><div class='ctx'> 	encode_cap_msg(msg, arg);</div><div class='ctx'> 	ceph_con_send(&amp;arg-&gt;session-&gt;s_con, msg);</div><div class='ctx'> 	ceph_buffer_put(arg-&gt;old_xattr_buf);</div><div class='add'>+	ceph_buffer_put(arg-&gt;xattr_buf);</div><div class='ctx'> 	if (arg-&gt;wake)</div><div class='ctx'> 		wake_up_all(&amp;ci-&gt;i_cap_wq);</div><div class='ctx'> }</div><div class='hunk'>@@ -1468,10 +1553,6 @@ static inline int __send_flush_snap(struct inode *inode,</div><div class='ctx'> 	struct cap_msg_args	arg;</div><div class='ctx'> 	struct ceph_msg		*msg;</div><div class='ctx'> </div><div class='del'>-	msg = ceph_msg_new(CEPH_MSG_CLIENT_CAPS, CAP_MSG_SIZE, GFP_NOFS, false);</div><div class='del'>-	if (!msg)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='ctx'> 	arg.session = session;</div><div class='ctx'> 	arg.ino = ceph_vino(inode).ino;</div><div class='ctx'> 	arg.cid = 0;</div><div class='hunk'>@@ -1508,6 +1589,15 @@ static inline int __send_flush_snap(struct inode *inode,</div><div class='ctx'> 	arg.inline_data = capsnap-&gt;inline_data;</div><div class='ctx'> 	arg.flags = 0;</div><div class='ctx'> 	arg.wake = false;</div><div class='add'>+	arg.encrypted = IS_ENCRYPTED(inode);</div><div class='add'>+</div><div class='add'>+	/* No fscrypt_auth changes from a capsnap.*/</div><div class='add'>+	arg.fscrypt_auth_len = 0;</div><div class='add'>+</div><div class='add'>+	msg = ceph_msg_new(CEPH_MSG_CLIENT_CAPS, cap_msg_size(&amp;arg),</div><div class='add'>+			   GFP_NOFS, false);</div><div class='add'>+	if (!msg)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	encode_cap_msg(msg, &amp;arg);</div><div class='ctx'> 	ceph_con_send(&amp;arg.session-&gt;s_con, msg);</div><div class='hunk'>@@ -1528,13 +1618,15 @@ static void __ceph_flush_snaps(struct ceph_inode_info *ci,</div><div class='ctx'> 		__releases(ci-&gt;i_ceph_lock)</div><div class='ctx'> 		__acquires(ci-&gt;i_ceph_lock)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = &amp;ci-&gt;vfs_inode;</div><div class='add'>+	struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='ctx'> 	struct ceph_mds_client *mdsc = session-&gt;s_mdsc;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_cap_snap *capsnap;</div><div class='ctx'> 	u64 oldest_flush_tid = 0;</div><div class='ctx'> 	u64 first_tid = 1, last_tid = 0;</div><div class='ctx'> </div><div class='del'>-	dout("__flush_snaps %p session %p\n", inode, session);</div><div class='add'>+	doutc(cl, "%p %llx.%llx session %p\n", inode, ceph_vinop(inode),</div><div class='add'>+	      session);</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(capsnap, &amp;ci-&gt;i_cap_snaps, ci_item) {</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -1549,7 +1641,7 @@ static void __ceph_flush_snaps(struct ceph_inode_info *ci,</div><div class='ctx'> </div><div class='ctx'> 		/* only flush each capsnap once */</div><div class='ctx'> 		if (capsnap-&gt;cap_flush.tid &gt; 0) {</div><div class='del'>-			dout(" already flushed %p, skipping\n", capsnap);</div><div class='add'>+			doutc(cl, "already flushed %p, skipping\n", capsnap);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -1577,18 +1669,19 @@ static void __ceph_flush_snaps(struct ceph_inode_info *ci,</div><div class='ctx'> </div><div class='ctx'> 	while (first_tid &lt;= last_tid) {</div><div class='ctx'> 		struct ceph_cap *cap = ci-&gt;i_auth_cap;</div><div class='del'>-		struct ceph_cap_flush *cf;</div><div class='add'>+		struct ceph_cap_flush *cf = NULL, *iter;</div><div class='ctx'> 		int ret;</div><div class='ctx'> </div><div class='ctx'> 		if (!(cap &amp;&amp; cap-&gt;session == session)) {</div><div class='del'>-			dout("__flush_snaps %p auth cap %p not mds%d, "</div><div class='del'>-			     "stop\n", inode, cap, session-&gt;s_mds);</div><div class='add'>+			doutc(cl, "%p %llx.%llx auth cap %p not mds%d, stop\n",</div><div class='add'>+			      inode, ceph_vinop(inode), cap, session-&gt;s_mds);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		ret = -ENOENT;</div><div class='del'>-		list_for_each_entry(cf, &amp;ci-&gt;i_cap_flush_list, i_list) {</div><div class='del'>-			if (cf-&gt;tid &gt;= first_tid) {</div><div class='add'>+		list_for_each_entry(iter, &amp;ci-&gt;i_cap_flush_list, i_list) {</div><div class='add'>+			if (iter-&gt;tid &gt;= first_tid) {</div><div class='add'>+				cf = iter;</div><div class='ctx'> 				ret = 0;</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -1602,15 +1695,17 @@ static void __ceph_flush_snaps(struct ceph_inode_info *ci,</div><div class='ctx'> 		refcount_inc(&amp;capsnap-&gt;nref);</div><div class='ctx'> 		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> </div><div class='del'>-		dout("__flush_snaps %p capsnap %p tid %llu %s\n",</div><div class='del'>-		     inode, capsnap, cf-&gt;tid, ceph_cap_string(capsnap-&gt;dirty));</div><div class='add'>+		doutc(cl, "%p %llx.%llx capsnap %p tid %llu %s\n", inode,</div><div class='add'>+		      ceph_vinop(inode), capsnap, cf-&gt;tid,</div><div class='add'>+		      ceph_cap_string(capsnap-&gt;dirty));</div><div class='ctx'> </div><div class='ctx'> 		ret = __send_flush_snap(inode, session, capsnap, cap-&gt;mseq,</div><div class='ctx'> 					oldest_flush_tid);</div><div class='ctx'> 		if (ret &lt; 0) {</div><div class='del'>-			pr_err("__flush_snaps: error sending cap flushsnap, "</div><div class='del'>-			       "ino (%llx.%llx) tid %llu follows %llu\n",</div><div class='del'>-				ceph_vinop(inode), cf-&gt;tid, capsnap-&gt;follows);</div><div class='add'>+			pr_err_client(cl, "error sending cap flushsnap, "</div><div class='add'>+				      "ino (%llx.%llx) tid %llu follows %llu\n",</div><div class='add'>+				      ceph_vinop(inode), cf-&gt;tid,</div><div class='add'>+				      capsnap-&gt;follows);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		ceph_put_cap_snap(capsnap);</div><div class='hunk'>@@ -1621,28 +1716,30 @@ static void __ceph_flush_snaps(struct ceph_inode_info *ci,</div><div class='ctx'> void ceph_flush_snaps(struct ceph_inode_info *ci,</div><div class='ctx'> 		      struct ceph_mds_session **psession)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = &amp;ci-&gt;vfs_inode;</div><div class='del'>-	struct ceph_mds_client *mdsc = ceph_inode_to_client(inode)-&gt;mdsc;</div><div class='add'>+	struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_inode_to_fs_client(inode)-&gt;mdsc;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_mds_session *session = NULL;</div><div class='add'>+	bool need_put = false;</div><div class='ctx'> 	int mds;</div><div class='ctx'> </div><div class='del'>-	dout("ceph_flush_snaps %p\n", inode);</div><div class='add'>+	doutc(cl, "%p %llx.%llx\n", inode, ceph_vinop(inode));</div><div class='ctx'> 	if (psession)</div><div class='ctx'> 		session = *psession;</div><div class='ctx'> retry:</div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 	if (!(ci-&gt;i_ceph_flags &amp; CEPH_I_FLUSH_SNAPS)) {</div><div class='del'>-		dout(" no capsnap needs flush, doing nothing\n");</div><div class='add'>+		doutc(cl, " no capsnap needs flush, doing nothing\n");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!ci-&gt;i_auth_cap) {</div><div class='del'>-		dout(" no auth cap (migrating?), doing nothing\n");</div><div class='add'>+		doutc(cl, " no auth cap (migrating?), doing nothing\n");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	mds = ci-&gt;i_auth_cap-&gt;session-&gt;s_mds;</div><div class='ctx'> 	if (session &amp;&amp; session-&gt;s_mds != mds) {</div><div class='del'>-		dout(" oops, wrong session %p mutex\n", session);</div><div class='add'>+		doutc(cl, " oops, wrong session %p mutex\n", session);</div><div class='ctx'> 		ceph_put_mds_session(session);</div><div class='ctx'> 		session = NULL;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1668,8 +1765,13 @@ out:</div><div class='ctx'> 		ceph_put_mds_session(session);</div><div class='ctx'> 	/* we flushed them all; remove this inode from the queue */</div><div class='ctx'> 	spin_lock(&amp;mdsc-&gt;snap_flush_lock);</div><div class='add'>+	if (!list_empty(&amp;ci-&gt;i_snap_flush_item))</div><div class='add'>+		need_put = true;</div><div class='ctx'> 	list_del_init(&amp;ci-&gt;i_snap_flush_item);</div><div class='ctx'> 	spin_unlock(&amp;mdsc-&gt;snap_flush_lock);</div><div class='add'>+</div><div class='add'>+	if (need_put)</div><div class='add'>+		iput(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1681,23 +1783,25 @@ int __ceph_mark_dirty_caps(struct ceph_inode_info *ci, int mask,</div><div class='ctx'> 			   struct ceph_cap_flush **pcf)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_mds_client *mdsc =</div><div class='del'>-		ceph_sb_to_client(ci-&gt;vfs_inode.i_sb)-&gt;mdsc;</div><div class='del'>-	struct inode *inode = &amp;ci-&gt;vfs_inode;</div><div class='add'>+		ceph_sb_to_fs_client(ci-&gt;netfs.inode.i_sb)-&gt;mdsc;</div><div class='add'>+	struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	int was = ci-&gt;i_dirty_caps;</div><div class='ctx'> 	int dirty = 0;</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (!ci-&gt;i_auth_cap) {</div><div class='del'>-		pr_warn("__mark_dirty_caps %p %llx mask %s, "</div><div class='del'>-			"but no auth cap (session was closed?)\n",</div><div class='del'>-			inode, ceph_ino(inode), ceph_cap_string(mask));</div><div class='add'>+		pr_warn_client(cl, "%p %llx.%llx mask %s, "</div><div class='add'>+			       "but no auth cap (session was closed?)\n",</div><div class='add'>+				inode, ceph_vinop(inode),</div><div class='add'>+				ceph_cap_string(mask));</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("__mark_dirty_caps %p %s dirty %s -&gt; %s\n", &amp;ci-&gt;vfs_inode,</div><div class='del'>-	     ceph_cap_string(mask), ceph_cap_string(was),</div><div class='del'>-	     ceph_cap_string(was | mask));</div><div class='add'>+	doutc(cl, "%p %llx.%llx %s dirty %s -&gt; %s\n", inode,</div><div class='add'>+	      ceph_vinop(inode), ceph_cap_string(mask),</div><div class='add'>+	      ceph_cap_string(was), ceph_cap_string(was | mask));</div><div class='ctx'> 	ci-&gt;i_dirty_caps |= mask;</div><div class='ctx'> 	if (was == 0) {</div><div class='ctx'> 		struct ceph_mds_session *session = ci-&gt;i_auth_cap-&gt;session;</div><div class='hunk'>@@ -1710,8 +1814,9 @@ int __ceph_mark_dirty_caps(struct ceph_inode_info *ci, int mask,</div><div class='ctx'> 			ci-&gt;i_head_snapc = ceph_get_snap_context(</div><div class='ctx'> 				ci-&gt;i_snap_realm-&gt;cached_context);</div><div class='ctx'> 		}</div><div class='del'>-		dout(" inode %p now dirty snapc %p auth cap %p\n",</div><div class='del'>-		     &amp;ci-&gt;vfs_inode, ci-&gt;i_head_snapc, ci-&gt;i_auth_cap);</div><div class='add'>+		doutc(cl, "%p %llx.%llx now dirty snapc %p auth cap %p\n",</div><div class='add'>+		      inode, ceph_vinop(inode), ci-&gt;i_head_snapc,</div><div class='add'>+		      ci-&gt;i_auth_cap);</div><div class='ctx'> 		BUG_ON(!list_empty(&amp;ci-&gt;i_dirty_item));</div><div class='ctx'> 		spin_lock(&amp;mdsc-&gt;cap_dirty_lock);</div><div class='ctx'> 		list_add(&amp;ci-&gt;i_dirty_item, &amp;session-&gt;s_cap_dirty);</div><div class='hunk'>@@ -1804,7 +1909,8 @@ static u64 __mark_caps_flushing(struct inode *inode,</div><div class='ctx'> 				struct ceph_mds_session *session, bool wake,</div><div class='ctx'> 				u64 *oldest_flush_tid)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_mds_client *mdsc = ceph_sb_to_client(inode-&gt;i_sb)-&gt;mdsc;</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_sb_to_fs_client(inode-&gt;i_sb)-&gt;mdsc;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	struct ceph_cap_flush *cf = NULL;</div><div class='ctx'> 	int flushing;</div><div class='hunk'>@@ -1815,13 +1921,13 @@ static u64 __mark_caps_flushing(struct inode *inode,</div><div class='ctx'> 	BUG_ON(!ci-&gt;i_prealloc_cap_flush);</div><div class='ctx'> </div><div class='ctx'> 	flushing = ci-&gt;i_dirty_caps;</div><div class='del'>-	dout("__mark_caps_flushing flushing %s, flushing_caps %s -&gt; %s\n",</div><div class='del'>-	     ceph_cap_string(flushing),</div><div class='del'>-	     ceph_cap_string(ci-&gt;i_flushing_caps),</div><div class='del'>-	     ceph_cap_string(ci-&gt;i_flushing_caps | flushing));</div><div class='add'>+	doutc(cl, "flushing %s, flushing_caps %s -&gt; %s\n",</div><div class='add'>+	      ceph_cap_string(flushing),</div><div class='add'>+	      ceph_cap_string(ci-&gt;i_flushing_caps),</div><div class='add'>+	      ceph_cap_string(ci-&gt;i_flushing_caps | flushing));</div><div class='ctx'> 	ci-&gt;i_flushing_caps |= flushing;</div><div class='ctx'> 	ci-&gt;i_dirty_caps = 0;</div><div class='del'>-	dout(" inode %p now !dirty\n", inode);</div><div class='add'>+	doutc(cl, "%p %llx.%llx now !dirty\n", inode, ceph_vinop(inode));</div><div class='ctx'> </div><div class='ctx'> 	swap(cf, ci-&gt;i_prealloc_cap_flush);</div><div class='ctx'> 	cf-&gt;caps = flushing;</div><div class='hunk'>@@ -1852,29 +1958,31 @@ static int try_nonblocking_invalidate(struct inode *inode)</div><div class='ctx'> 	__releases(ci-&gt;i_ceph_lock)</div><div class='ctx'> 	__acquires(ci-&gt;i_ceph_lock)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	u32 invalidating_gen = ci-&gt;i_rdcache_gen;</div><div class='ctx'> </div><div class='ctx'> 	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-	ceph_fscache_invalidate(inode);</div><div class='add'>+	ceph_fscache_invalidate(inode, false);</div><div class='ctx'> 	invalidate_mapping_pages(&amp;inode-&gt;i_data, 0, -1);</div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (inode-&gt;i_data.nrpages == 0 &amp;&amp;</div><div class='ctx'> 	    invalidating_gen == ci-&gt;i_rdcache_gen) {</div><div class='ctx'> 		/* success. */</div><div class='del'>-		dout("try_nonblocking_invalidate %p success\n", inode);</div><div class='add'>+		doutc(cl, "%p %llx.%llx success\n", inode,</div><div class='add'>+		      ceph_vinop(inode));</div><div class='ctx'> 		/* save any racing async invalidate some trouble */</div><div class='ctx'> 		ci-&gt;i_rdcache_revoking = ci-&gt;i_rdcache_gen - 1;</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='del'>-	dout("try_nonblocking_invalidate %p failed\n", inode);</div><div class='add'>+	doutc(cl, "%p %llx.%llx failed\n", inode, ceph_vinop(inode));</div><div class='ctx'> 	return -1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> bool __ceph_should_report_size(struct ceph_inode_info *ci)</div><div class='ctx'> {</div><div class='del'>-	loff_t size = i_size_read(&amp;ci-&gt;vfs_inode);</div><div class='add'>+	loff_t size = i_size_read(&amp;ci-&gt;netfs.inode);</div><div class='ctx'> 	/* mds will adjust max size according to the reported size */</div><div class='ctx'> 	if (ci-&gt;i_flushing_caps &amp; CEPH_CAP_FILE_WR)</div><div class='ctx'> 		return false;</div><div class='hunk'>@@ -1895,12 +2003,14 @@ bool __ceph_should_report_size(struct ceph_inode_info *ci)</div><div class='ctx'>  *  CHECK_CAPS_AUTHONLY - we should only check the auth cap</div><div class='ctx'>  *  CHECK_CAPS_FLUSH - we should flush any dirty caps immediately, without</div><div class='ctx'>  *    further delay.</div><div class='add'>+ *  CHECK_CAPS_FLUSH_FORCE - we should flush any caps immediately, without</div><div class='add'>+ *    further delay.</div><div class='ctx'>  */</div><div class='del'>-void ceph_check_caps(struct ceph_inode_info *ci, int flags,</div><div class='del'>-		     struct ceph_mds_session *session)</div><div class='add'>+void ceph_check_caps(struct ceph_inode_info *ci, int flags)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = &amp;ci-&gt;vfs_inode;</div><div class='add'>+	struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='ctx'> 	struct ceph_mds_client *mdsc = ceph_sb_to_mdsc(inode-&gt;i_sb);</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_cap *cap;</div><div class='ctx'> 	u64 flush_tid, oldest_flush_tid;</div><div class='ctx'> 	int file_wanted, used, cap_used;</div><div class='hunk'>@@ -1910,11 +2020,18 @@ void ceph_check_caps(struct ceph_inode_info *ci, int flags,</div><div class='ctx'> 	struct rb_node *p;</div><div class='ctx'> 	bool queue_invalidate = false;</div><div class='ctx'> 	bool tried_invalidate = false;</div><div class='del'>-</div><div class='del'>-	if (session)</div><div class='del'>-		ceph_get_mds_session(session);</div><div class='add'>+	bool queue_writeback = false;</div><div class='add'>+	struct ceph_mds_session *session = NULL;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+	if (ci-&gt;i_ceph_flags &amp; CEPH_I_ASYNC_CREATE) {</div><div class='add'>+		ci-&gt;i_ceph_flags |= CEPH_I_ASYNC_CHECK_CAPS;</div><div class='add'>+</div><div class='add'>+		/* Don't send messages until we get async create reply */</div><div class='add'>+		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (ci-&gt;i_ceph_flags &amp; CEPH_I_FLUSH)</div><div class='ctx'> 		flags |= CHECK_CAPS_FLUSH;</div><div class='ctx'> retry:</div><div class='hunk'>@@ -1968,15 +2085,17 @@ retry:</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("check_caps %p file_want %s used %s dirty %s flushing %s"</div><div class='del'>-	     " issued %s revoking %s retain %s %s%s\n", inode,</div><div class='del'>-	     ceph_cap_string(file_wanted),</div><div class='add'>+	doutc(cl, "%p %llx.%llx file_want %s used %s dirty %s "</div><div class='add'>+	      "flushing %s issued %s revoking %s retain %s %s%s%s%s\n",</div><div class='add'>+	     inode, ceph_vinop(inode), ceph_cap_string(file_wanted),</div><div class='ctx'> 	     ceph_cap_string(used), ceph_cap_string(ci-&gt;i_dirty_caps),</div><div class='ctx'> 	     ceph_cap_string(ci-&gt;i_flushing_caps),</div><div class='ctx'> 	     ceph_cap_string(issued), ceph_cap_string(revoking),</div><div class='ctx'> 	     ceph_cap_string(retain),</div><div class='ctx'> 	     (flags &amp; CHECK_CAPS_AUTHONLY) ? " AUTHONLY" : "",</div><div class='del'>-	     (flags &amp; CHECK_CAPS_FLUSH) ? " FLUSH" : "");</div><div class='add'>+	     (flags &amp; CHECK_CAPS_FLUSH) ? " FLUSH" : "",</div><div class='add'>+	     (flags &amp; CHECK_CAPS_NOINVAL) ? " NOINVAL" : "",</div><div class='add'>+	     (flags &amp; CHECK_CAPS_FLUSH_FORCE) ? " FLUSH_FORCE" : "");</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If we no longer need to hold onto old our caps, and we may</div><div class='hunk'>@@ -1990,9 +2109,10 @@ retry:</div><div class='ctx'> 	    (revoking &amp; (CEPH_CAP_FILE_CACHE|</div><div class='ctx'> 			 CEPH_CAP_FILE_LAZYIO)) &amp;&amp; /*  or revoking cache */</div><div class='ctx'> 	    !tried_invalidate) {</div><div class='del'>-		dout("check_caps trying to invalidate on %p\n", inode);</div><div class='add'>+		doutc(cl, "trying to invalidate on %p %llx.%llx\n",</div><div class='add'>+		      inode, ceph_vinop(inode));</div><div class='ctx'> 		if (try_nonblocking_invalidate(inode) &lt; 0) {</div><div class='del'>-			dout("check_caps queuing invalidate\n");</div><div class='add'>+			doutc(cl, "queuing invalidate\n");</div><div class='ctx'> 			queue_invalidate = true;</div><div class='ctx'> 			ci-&gt;i_rdcache_revoking = ci-&gt;i_rdcache_gen;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2020,46 +2140,68 @@ retry:</div><div class='ctx'> 			cap_used &amp;= ~ci-&gt;i_auth_cap-&gt;issued;</div><div class='ctx'> </div><div class='ctx'> 		revoking = cap-&gt;implemented &amp; ~cap-&gt;issued;</div><div class='del'>-		dout(" mds%d cap %p used %s issued %s implemented %s revoking %s\n",</div><div class='del'>-		     cap-&gt;mds, cap, ceph_cap_string(cap_used),</div><div class='del'>-		     ceph_cap_string(cap-&gt;issued),</div><div class='del'>-		     ceph_cap_string(cap-&gt;implemented),</div><div class='del'>-		     ceph_cap_string(revoking));</div><div class='add'>+		doutc(cl, " mds%d cap %p used %s issued %s implemented %s revoking %s\n",</div><div class='add'>+		      cap-&gt;mds, cap, ceph_cap_string(cap_used),</div><div class='add'>+		      ceph_cap_string(cap-&gt;issued),</div><div class='add'>+		      ceph_cap_string(cap-&gt;implemented),</div><div class='add'>+		      ceph_cap_string(revoking));</div><div class='add'>+</div><div class='add'>+		/* completed revocation? going down and there are no caps? */</div><div class='add'>+		if (revoking) {</div><div class='add'>+			if ((revoking &amp; cap_used) == 0) {</div><div class='add'>+				doutc(cl, "completed revocation of %s\n",</div><div class='add'>+				      ceph_cap_string(cap-&gt;implemented &amp; ~cap-&gt;issued));</div><div class='add'>+				goto ack;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * If the "i_wrbuffer_ref" was increased by mmap or generic</div><div class='add'>+			 * cache write just before the ceph_check_caps() is called,</div><div class='add'>+			 * the Fb capability revoking will fail this time. Then we</div><div class='add'>+			 * must wait for the BDI's delayed work to flush the dirty</div><div class='add'>+			 * pages and to release the "i_wrbuffer_ref", which will cost</div><div class='add'>+			 * at most 5 seconds. That means the MDS needs to wait at</div><div class='add'>+			 * most 5 seconds to finished the Fb capability's revocation.</div><div class='add'>+			 *</div><div class='add'>+			 * Let's queue a writeback for it.</div><div class='add'>+			 */</div><div class='add'>+			if (S_ISREG(inode-&gt;i_mode) &amp;&amp; ci-&gt;i_wrbuffer_ref &amp;&amp;</div><div class='add'>+			    (revoking &amp; CEPH_CAP_FILE_BUFFER))</div><div class='add'>+				queue_writeback = true;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (flags &amp; CHECK_CAPS_FLUSH_FORCE) {</div><div class='add'>+			doutc(cl, "force to flush caps\n");</div><div class='add'>+			goto ack;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		if (cap == ci-&gt;i_auth_cap &amp;&amp;</div><div class='ctx'> 		    (cap-&gt;issued &amp; CEPH_CAP_FILE_WR)) {</div><div class='ctx'> 			/* request larger max_size from MDS? */</div><div class='ctx'> 			if (ci-&gt;i_wanted_max_size &gt; ci-&gt;i_max_size &amp;&amp;</div><div class='ctx'> 			    ci-&gt;i_wanted_max_size &gt; ci-&gt;i_requested_max_size) {</div><div class='del'>-				dout("requesting new max_size\n");</div><div class='add'>+				doutc(cl, "requesting new max_size\n");</div><div class='ctx'> 				goto ack;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			/* approaching file_max? */</div><div class='ctx'> 			if (__ceph_should_report_size(ci)) {</div><div class='del'>-				dout("i_size approaching max_size\n");</div><div class='add'>+				doutc(cl, "i_size approaching max_size\n");</div><div class='ctx'> 				goto ack;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 		/* flush anything dirty? */</div><div class='ctx'> 		if (cap == ci-&gt;i_auth_cap) {</div><div class='ctx'> 			if ((flags &amp; CHECK_CAPS_FLUSH) &amp;&amp; ci-&gt;i_dirty_caps) {</div><div class='del'>-				dout("flushing dirty caps\n");</div><div class='add'>+				doutc(cl, "flushing dirty caps\n");</div><div class='ctx'> 				goto ack;</div><div class='ctx'> 			}</div><div class='ctx'> 			if (ci-&gt;i_ceph_flags &amp; CEPH_I_FLUSH_SNAPS) {</div><div class='del'>-				dout("flushing snap caps\n");</div><div class='add'>+				doutc(cl, "flushing snap caps\n");</div><div class='ctx'> 				goto ack;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		/* completed revocation? going down and there are no caps? */</div><div class='del'>-		if (revoking &amp;&amp; (revoking &amp; cap_used) == 0) {</div><div class='del'>-			dout("completed revocation of %s\n",</div><div class='del'>-			     ceph_cap_string(cap-&gt;implemented &amp; ~cap-&gt;issued));</div><div class='del'>-			goto ack;</div><div class='del'>-		}</div><div class='del'>-</div><div class='ctx'> 		/* want more caps from mds? */</div><div class='ctx'> 		if (want &amp; ~cap-&gt;mds_wanted) {</div><div class='ctx'> 			if (want &amp; ~(cap-&gt;mds_wanted | cap-&gt;issued))</div><div class='hunk'>@@ -2127,6 +2269,8 @@ ack:</div><div class='ctx'> 	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> </div><div class='ctx'> 	ceph_put_mds_session(session);</div><div class='add'>+	if (queue_writeback)</div><div class='add'>+		ceph_queue_writeback(inode);</div><div class='ctx'> 	if (queue_invalidate)</div><div class='ctx'> 		ceph_queue_invalidate(inode);</div><div class='ctx'> }</div><div class='hunk'>@@ -2136,7 +2280,7 @@ ack:</div><div class='ctx'>  */</div><div class='ctx'> static int try_flush_caps(struct inode *inode, u64 *ptid)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_mds_client *mdsc = ceph_sb_to_client(inode-&gt;i_sb)-&gt;mdsc;</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_sb_to_fs_client(inode-&gt;i_sb)-&gt;mdsc;</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	int flushing = 0;</div><div class='ctx'> 	u64 flush_tid = 0, oldest_flush_tid = 0;</div><div class='hunk'>@@ -2210,11 +2354,12 @@ static int caps_are_flushed(struct inode *inode, u64 flush_tid)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * wait for any unsafe requests to complete.</div><div class='add'>+ * flush the mdlog and wait for any unsafe requests to complete.</div><div class='ctx'>  */</div><div class='del'>-static int unsafe_request_wait(struct inode *inode)</div><div class='add'>+static int flush_mdlog_and_wait_inode_unsafe_requests(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_mds_client *mdsc = ceph_sb_to_client(inode-&gt;i_sb)-&gt;mdsc;</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_sb_to_fs_client(inode-&gt;i_sb)-&gt;mdsc;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	struct ceph_mds_request *req1 = NULL, *req2 = NULL;</div><div class='ctx'> 	int ret, err = 0;</div><div class='hunk'>@@ -2240,33 +2385,29 @@ static int unsafe_request_wait(struct inode *inode)</div><div class='ctx'> 	 * to wait the journal logs to be flushed by the MDSes periodically.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (req1 || req2) {</div><div class='del'>-		struct ceph_mds_session **sessions = NULL;</div><div class='del'>-		struct ceph_mds_session *s;</div><div class='ctx'> 		struct ceph_mds_request *req;</div><div class='del'>-		unsigned int max;</div><div class='add'>+		struct ceph_mds_session **sessions;</div><div class='add'>+		struct ceph_mds_session *s;</div><div class='add'>+		unsigned int max_sessions;</div><div class='ctx'> 		int i;</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * The mdsc-&gt;max_sessions is unlikely to be changed</div><div class='del'>-		 * mostly, here we will retry it by reallocating the</div><div class='del'>-		 * sessions arrary memory to get rid of the mdsc-&gt;mutex</div><div class='del'>-		 * lock.</div><div class='del'>-		 */</div><div class='del'>-retry:</div><div class='del'>-		max = mdsc-&gt;max_sessions;</div><div class='del'>-		sessions = krealloc(sessions, max * sizeof(s), __GFP_ZERO);</div><div class='del'>-		if (!sessions)</div><div class='del'>-			return -ENOMEM;</div><div class='add'>+		mutex_lock(&amp;mdsc-&gt;mutex);</div><div class='add'>+		max_sessions = mdsc-&gt;max_sessions;</div><div class='add'>+</div><div class='add'>+		sessions = kcalloc(max_sessions, sizeof(s), GFP_KERNEL);</div><div class='add'>+		if (!sessions) {</div><div class='add'>+			mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='add'>+			err = -ENOMEM;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		spin_lock(&amp;ci-&gt;i_unsafe_lock);</div><div class='ctx'> 		if (req1) {</div><div class='ctx'> 			list_for_each_entry(req, &amp;ci-&gt;i_unsafe_dirops,</div><div class='ctx'> 					    r_unsafe_dir_item) {</div><div class='ctx'> 				s = req-&gt;r_session;</div><div class='del'>-				if (unlikely(s-&gt;s_mds &gt;= max)) {</div><div class='del'>-					spin_unlock(&amp;ci-&gt;i_unsafe_lock);</div><div class='del'>-					goto retry;</div><div class='del'>-				}</div><div class='add'>+				if (!s)</div><div class='add'>+					continue;</div><div class='ctx'> 				if (!sessions[s-&gt;s_mds]) {</div><div class='ctx'> 					s = ceph_get_mds_session(s);</div><div class='ctx'> 					sessions[s-&gt;s_mds] = s;</div><div class='hunk'>@@ -2277,10 +2418,8 @@ retry:</div><div class='ctx'> 			list_for_each_entry(req, &amp;ci-&gt;i_unsafe_iops,</div><div class='ctx'> 					    r_unsafe_target_item) {</div><div class='ctx'> 				s = req-&gt;r_session;</div><div class='del'>-				if (unlikely(s-&gt;s_mds &gt;= max)) {</div><div class='del'>-					spin_unlock(&amp;ci-&gt;i_unsafe_lock);</div><div class='del'>-					goto retry;</div><div class='del'>-				}</div><div class='add'>+				if (!s)</div><div class='add'>+					continue;</div><div class='ctx'> 				if (!sessions[s-&gt;s_mds]) {</div><div class='ctx'> 					s = ceph_get_mds_session(s);</div><div class='ctx'> 					sessions[s-&gt;s_mds] = s;</div><div class='hunk'>@@ -2292,14 +2431,15 @@ retry:</div><div class='ctx'> 		/* the auth MDS */</div><div class='ctx'> 		spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 		if (ci-&gt;i_auth_cap) {</div><div class='del'>-		      s = ci-&gt;i_auth_cap-&gt;session;</div><div class='del'>-		      if (!sessions[s-&gt;s_mds])</div><div class='del'>-			      sessions[s-&gt;s_mds] = ceph_get_mds_session(s);</div><div class='add'>+			s = ci-&gt;i_auth_cap-&gt;session;</div><div class='add'>+			if (!sessions[s-&gt;s_mds])</div><div class='add'>+				sessions[s-&gt;s_mds] = ceph_get_mds_session(s);</div><div class='ctx'> 		}</div><div class='ctx'> 		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+		mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> </div><div class='ctx'> 		/* send flush mdlog request to MDSes */</div><div class='del'>-		for (i = 0; i &lt; max; i++) {</div><div class='add'>+		for (i = 0; i &lt; max_sessions; i++) {</div><div class='ctx'> 			s = sessions[i];</div><div class='ctx'> 			if (s) {</div><div class='ctx'> 				send_flush_mdlog(s);</div><div class='hunk'>@@ -2309,22 +2449,27 @@ retry:</div><div class='ctx'> 		kfree(sessions);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("unsafe_request_wait %p wait on tid %llu %llu\n",</div><div class='del'>-	     inode, req1 ? req1-&gt;r_tid : 0ULL, req2 ? req2-&gt;r_tid : 0ULL);</div><div class='add'>+	doutc(cl, "%p %llx.%llx wait on tid %llu %llu\n", inode,</div><div class='add'>+	      ceph_vinop(inode), req1 ? req1-&gt;r_tid : 0ULL,</div><div class='add'>+	      req2 ? req2-&gt;r_tid : 0ULL);</div><div class='ctx'> 	if (req1) {</div><div class='ctx'> 		ret = !wait_for_completion_timeout(&amp;req1-&gt;r_safe_completion,</div><div class='ctx'> 					ceph_timeout_jiffies(req1-&gt;r_timeout));</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			err = -EIO;</div><div class='del'>-		ceph_mdsc_put_request(req1);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (req2) {</div><div class='ctx'> 		ret = !wait_for_completion_timeout(&amp;req2-&gt;r_safe_completion,</div><div class='ctx'> 					ceph_timeout_jiffies(req2-&gt;r_timeout));</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			err = -EIO;</div><div class='del'>-		ceph_mdsc_put_request(req2);</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	if (req1)</div><div class='add'>+		ceph_mdsc_put_request(req1);</div><div class='add'>+	if (req2)</div><div class='add'>+		ceph_mdsc_put_request(req2);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2332,11 +2477,13 @@ int ceph_fsync(struct file *file, loff_t start, loff_t end, int datasync)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file-&gt;f_mapping-&gt;host;</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	u64 flush_tid;</div><div class='ctx'> 	int ret, err;</div><div class='ctx'> 	int dirty;</div><div class='ctx'> </div><div class='del'>-	dout("fsync %p%s\n", inode, datasync ? " datasync" : "");</div><div class='add'>+	doutc(cl, "%p %llx.%llx%s\n", inode, ceph_vinop(inode),</div><div class='add'>+	      datasync ? " datasync" : "");</div><div class='ctx'> </div><div class='ctx'> 	ret = file_write_and_wait_range(file, start, end);</div><div class='ctx'> 	if (datasync)</div><div class='hunk'>@@ -2347,9 +2494,9 @@ int ceph_fsync(struct file *file, loff_t start, loff_t end, int datasync)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	dirty = try_flush_caps(inode, &amp;flush_tid);</div><div class='del'>-	dout("fsync dirty caps are %s\n", ceph_cap_string(dirty));</div><div class='add'>+	doutc(cl, "dirty caps are %s\n", ceph_cap_string(dirty));</div><div class='ctx'> </div><div class='del'>-	err = unsafe_request_wait(inode);</div><div class='add'>+	err = flush_mdlog_and_wait_inode_unsafe_requests(inode);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * only wait on non-file metadata writeback (the mds</div><div class='hunk'>@@ -2368,7 +2515,8 @@ int ceph_fsync(struct file *file, loff_t start, loff_t end, int datasync)</div><div class='ctx'> 	if (err &lt; 0)</div><div class='ctx'> 		ret = err;</div><div class='ctx'> out:</div><div class='del'>-	dout("fsync %p%s result=%d\n", inode, datasync ? " datasync" : "", ret);</div><div class='add'>+	doutc(cl, "%p %llx.%llx%s result=%d\n", inode, ceph_vinop(inode),</div><div class='add'>+	      datasync ? " datasync" : "", ret);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2381,20 +2529,25 @@ out:</div><div class='ctx'> int ceph_write_inode(struct inode *inode, struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	u64 flush_tid;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> 	int dirty;</div><div class='ctx'> 	int wait = (wbc-&gt;sync_mode == WB_SYNC_ALL &amp;&amp; !wbc-&gt;for_sync);</div><div class='ctx'> </div><div class='del'>-	dout("write_inode %p wait=%d\n", inode, wait);</div><div class='add'>+	doutc(cl, "%p %llx.%llx wait=%d\n", inode, ceph_vinop(inode), wait);</div><div class='add'>+	ceph_fscache_unpin_writeback(inode, wbc);</div><div class='ctx'> 	if (wait) {</div><div class='add'>+		err = ceph_wait_on_async_create(inode);</div><div class='add'>+		if (err)</div><div class='add'>+			return err;</div><div class='ctx'> 		dirty = try_flush_caps(inode, &amp;flush_tid);</div><div class='ctx'> 		if (dirty)</div><div class='ctx'> 			err = wait_event_interruptible(ci-&gt;i_cap_wq,</div><div class='ctx'> 				       caps_are_flushed(inode, flush_tid));</div><div class='ctx'> 	} else {</div><div class='ctx'> 		struct ceph_mds_client *mdsc =</div><div class='del'>-			ceph_sb_to_client(inode-&gt;i_sb)-&gt;mdsc;</div><div class='add'>+			ceph_sb_to_fs_client(inode-&gt;i_sb)-&gt;mdsc;</div><div class='ctx'> </div><div class='ctx'> 		spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 		if (__ceph_caps_dirty(ci))</div><div class='hunk'>@@ -2411,13 +2564,18 @@ static void __kick_flushing_caps(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	__releases(ci-&gt;i_ceph_lock)</div><div class='ctx'> 	__acquires(ci-&gt;i_ceph_lock)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = &amp;ci-&gt;vfs_inode;</div><div class='add'>+	struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_cap *cap;</div><div class='ctx'> 	struct ceph_cap_flush *cf;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	u64 first_tid = 0;</div><div class='ctx'> 	u64 last_snap_flush = 0;</div><div class='ctx'> </div><div class='add'>+	/* Don't do anything until create reply comes in */</div><div class='add'>+	if (ci-&gt;i_ceph_flags &amp; CEPH_I_ASYNC_CREATE)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='ctx'> 	ci-&gt;i_ceph_flags &amp;= ~CEPH_I_KICK_FLUSH;</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry_reverse(cf, &amp;ci-&gt;i_cap_flush_list, i_list) {</div><div class='hunk'>@@ -2433,8 +2591,8 @@ static void __kick_flushing_caps(struct ceph_mds_client *mdsc,</div><div class='ctx'> </div><div class='ctx'> 		cap = ci-&gt;i_auth_cap;</div><div class='ctx'> 		if (!(cap &amp;&amp; cap-&gt;session == session)) {</div><div class='del'>-			pr_err("%p auth cap %p not mds%d ???\n",</div><div class='del'>-			       inode, cap, session-&gt;s_mds);</div><div class='add'>+			pr_err_client(cl, "%p auth cap %p not mds%d ???\n",</div><div class='add'>+				      inode, cap, session-&gt;s_mds);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -2443,8 +2601,9 @@ static void __kick_flushing_caps(struct ceph_mds_client *mdsc,</div><div class='ctx'> 		if (!cf-&gt;is_capsnap) {</div><div class='ctx'> 			struct cap_msg_args arg;</div><div class='ctx'> </div><div class='del'>-			dout("kick_flushing_caps %p cap %p tid %llu %s\n",</div><div class='del'>-			     inode, cap, cf-&gt;tid, ceph_cap_string(cf-&gt;caps));</div><div class='add'>+			doutc(cl, "%p %llx.%llx cap %p tid %llu %s\n",</div><div class='add'>+			      inode, ceph_vinop(inode), cap, cf-&gt;tid,</div><div class='add'>+			      ceph_cap_string(cf-&gt;caps));</div><div class='ctx'> 			__prep_cap(&amp;arg, cap, CEPH_CAP_OP_FLUSH,</div><div class='ctx'> 					 (cf-&gt;tid &lt; last_snap_flush ?</div><div class='ctx'> 					  CEPH_CLIENT_CAPS_PENDING_CAPSNAP : 0),</div><div class='hunk'>@@ -2458,9 +2617,9 @@ static void __kick_flushing_caps(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			struct ceph_cap_snap *capsnap =</div><div class='ctx'> 					container_of(cf, struct ceph_cap_snap,</div><div class='ctx'> 						    cap_flush);</div><div class='del'>-			dout("kick_flushing_caps %p capsnap %p tid %llu %s\n",</div><div class='del'>-			     inode, capsnap, cf-&gt;tid,</div><div class='del'>-			     ceph_cap_string(capsnap-&gt;dirty));</div><div class='add'>+			doutc(cl, "%p %llx.%llx capsnap %p tid %llu %s\n",</div><div class='add'>+			      inode, ceph_vinop(inode), capsnap, cf-&gt;tid,</div><div class='add'>+			      ceph_cap_string(capsnap-&gt;dirty));</div><div class='ctx'> </div><div class='ctx'> 			refcount_inc(&amp;capsnap-&gt;nref);</div><div class='ctx'> 			spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='hunk'>@@ -2468,11 +2627,10 @@ static void __kick_flushing_caps(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			ret = __send_flush_snap(inode, session, capsnap, cap-&gt;mseq,</div><div class='ctx'> 						oldest_flush_tid);</div><div class='ctx'> 			if (ret &lt; 0) {</div><div class='del'>-				pr_err("kick_flushing_caps: error sending "</div><div class='del'>-					"cap flushsnap, ino (%llx.%llx) "</div><div class='del'>-					"tid %llu follows %llu\n",</div><div class='del'>-					ceph_vinop(inode), cf-&gt;tid,</div><div class='del'>-					capsnap-&gt;follows);</div><div class='add'>+				pr_err_client(cl, "error sending cap flushsnap,"</div><div class='add'>+					      " %p %llx.%llx tid %llu follows %llu\n",</div><div class='add'>+					      inode, ceph_vinop(inode), cf-&gt;tid,</div><div class='add'>+					      capsnap-&gt;follows);</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			ceph_put_cap_snap(capsnap);</div><div class='hunk'>@@ -2485,22 +2643,26 @@ static void __kick_flushing_caps(struct ceph_mds_client *mdsc,</div><div class='ctx'> void ceph_early_kick_flushing_caps(struct ceph_mds_client *mdsc,</div><div class='ctx'> 				   struct ceph_mds_session *session)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_inode_info *ci;</div><div class='ctx'> 	struct ceph_cap *cap;</div><div class='ctx'> 	u64 oldest_flush_tid;</div><div class='ctx'> </div><div class='del'>-	dout("early_kick_flushing_caps mds%d\n", session-&gt;s_mds);</div><div class='add'>+	doutc(cl, "mds%d\n", session-&gt;s_mds);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;mdsc-&gt;cap_dirty_lock);</div><div class='ctx'> 	oldest_flush_tid = __get_oldest_flush_tid(mdsc);</div><div class='ctx'> 	spin_unlock(&amp;mdsc-&gt;cap_dirty_lock);</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(ci, &amp;session-&gt;s_cap_flushing, i_flushing_item) {</div><div class='add'>+		struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='add'>+</div><div class='ctx'> 		spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 		cap = ci-&gt;i_auth_cap;</div><div class='ctx'> 		if (!(cap &amp;&amp; cap-&gt;session == session)) {</div><div class='del'>-			pr_err("%p auth cap %p not mds%d ???\n",</div><div class='del'>-				&amp;ci-&gt;vfs_inode, cap, session-&gt;s_mds);</div><div class='add'>+			pr_err_client(cl, "%p %llx.%llx auth cap %p not mds%d ???\n",</div><div class='add'>+				      inode, ceph_vinop(inode), cap,</div><div class='add'>+				      session-&gt;s_mds);</div><div class='ctx'> 			spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2533,24 +2695,28 @@ void ceph_early_kick_flushing_caps(struct ceph_mds_client *mdsc,</div><div class='ctx'> void ceph_kick_flushing_caps(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			     struct ceph_mds_session *session)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_inode_info *ci;</div><div class='ctx'> 	struct ceph_cap *cap;</div><div class='ctx'> 	u64 oldest_flush_tid;</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;session-&gt;s_mutex);</div><div class='ctx'> </div><div class='del'>-	dout("kick_flushing_caps mds%d\n", session-&gt;s_mds);</div><div class='add'>+	doutc(cl, "mds%d\n", session-&gt;s_mds);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;mdsc-&gt;cap_dirty_lock);</div><div class='ctx'> 	oldest_flush_tid = __get_oldest_flush_tid(mdsc);</div><div class='ctx'> 	spin_unlock(&amp;mdsc-&gt;cap_dirty_lock);</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(ci, &amp;session-&gt;s_cap_flushing, i_flushing_item) {</div><div class='add'>+		struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='add'>+</div><div class='ctx'> 		spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 		cap = ci-&gt;i_auth_cap;</div><div class='ctx'> 		if (!(cap &amp;&amp; cap-&gt;session == session)) {</div><div class='del'>-			pr_err("%p auth cap %p not mds%d ???\n",</div><div class='del'>-				&amp;ci-&gt;vfs_inode, cap, session-&gt;s_mds);</div><div class='add'>+			pr_err_client(cl, "%p %llx.%llx auth cap %p not mds%d ???\n",</div><div class='add'>+				      inode, ceph_vinop(inode), cap,</div><div class='add'>+				      session-&gt;s_mds);</div><div class='ctx'> 			spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2567,11 +2733,13 @@ void ceph_kick_flushing_inode_caps(struct ceph_mds_session *session,</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_mds_client *mdsc = session-&gt;s_mdsc;</div><div class='ctx'> 	struct ceph_cap *cap = ci-&gt;i_auth_cap;</div><div class='add'>+	struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> </div><div class='del'>-	dout("%s %p flushing %s\n", __func__, &amp;ci-&gt;vfs_inode,</div><div class='del'>-	     ceph_cap_string(ci-&gt;i_flushing_caps));</div><div class='add'>+	doutc(mdsc-&gt;fsc-&gt;client, "%p %llx.%llx flushing %s\n",</div><div class='add'>+	      inode, ceph_vinop(inode),</div><div class='add'>+	      ceph_cap_string(ci-&gt;i_flushing_caps));</div><div class='ctx'> </div><div class='ctx'> 	if (!list_empty(&amp;ci-&gt;i_cap_flush_list)) {</div><div class='ctx'> 		u64 oldest_flush_tid;</div><div class='hunk'>@@ -2593,6 +2761,9 @@ void ceph_kick_flushing_inode_caps(struct ceph_mds_session *session,</div><div class='ctx'> void ceph_take_cap_refs(struct ceph_inode_info *ci, int got,</div><div class='ctx'> 			    bool snap_rwsem_locked)</div><div class='ctx'> {</div><div class='add'>+	struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='add'>+</div><div class='ctx'> 	lockdep_assert_held(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (got &amp; CEPH_CAP_PIN)</div><div class='hunk'>@@ -2613,10 +2784,10 @@ void ceph_take_cap_refs(struct ceph_inode_info *ci, int got,</div><div class='ctx'> 	}</div><div class='ctx'> 	if (got &amp; CEPH_CAP_FILE_BUFFER) {</div><div class='ctx'> 		if (ci-&gt;i_wb_ref == 0)</div><div class='del'>-			ihold(&amp;ci-&gt;vfs_inode);</div><div class='add'>+			ihold(inode);</div><div class='ctx'> 		ci-&gt;i_wb_ref++;</div><div class='del'>-		dout("%s %p wb %d -&gt; %d (?)\n", __func__,</div><div class='del'>-		     &amp;ci-&gt;vfs_inode, ci-&gt;i_wb_ref-1, ci-&gt;i_wb_ref);</div><div class='add'>+		doutc(cl, "%p %llx.%llx wb %d -&gt; %d (?)\n", inode,</div><div class='add'>+		      ceph_vinop(inode), ci-&gt;i_wb_ref-1, ci-&gt;i_wb_ref);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2628,10 +2799,10 @@ void ceph_take_cap_refs(struct ceph_inode_info *ci, int got,</div><div class='ctx'>  * requested from the MDS.</div><div class='ctx'>  *</div><div class='ctx'>  * Returns 0 if caps were not able to be acquired (yet), 1 if succeed,</div><div class='del'>- * or a negative error code. There are 3 speical error codes:</div><div class='del'>- *  -EAGAIN: need to sleep but non-blocking is specified</div><div class='del'>- *  -EFBIG:  ask caller to call check_max_size() and try again.</div><div class='del'>- *  -ESTALE: ask caller to call ceph_renew_caps() and try again.</div><div class='add'>+ * or a negative error code. There are 3 special error codes:</div><div class='add'>+ *  -EAGAIN:  need to sleep but non-blocking is specified</div><div class='add'>+ *  -EFBIG:   ask caller to call check_max_size() and try again.</div><div class='add'>+ *  -EUCLEAN: ask caller to call ceph_renew_caps() and try again.</div><div class='ctx'>  */</div><div class='ctx'> enum {</div><div class='ctx'> 	/* first 8 bits are reserved for CEPH_FILE_MODE_FOO */</div><div class='hunk'>@@ -2643,20 +2814,23 @@ static int try_get_cap_refs(struct inode *inode, int need, int want,</div><div class='ctx'> 			    loff_t endoff, int flags, int *got)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	struct ceph_mds_client *mdsc = ceph_inode_to_client(inode)-&gt;mdsc;</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_inode_to_fs_client(inode)-&gt;mdsc;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int have, implemented;</div><div class='ctx'> 	bool snap_rwsem_locked = false;</div><div class='ctx'> </div><div class='del'>-	dout("get_cap_refs %p need %s want %s\n", inode,</div><div class='del'>-	     ceph_cap_string(need), ceph_cap_string(want));</div><div class='add'>+	doutc(cl, "%p %llx.%llx need %s want %s\n", inode,</div><div class='add'>+	      ceph_vinop(inode), ceph_cap_string(need),</div><div class='add'>+	      ceph_cap_string(want));</div><div class='ctx'> </div><div class='ctx'> again:</div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> </div><div class='ctx'> 	if ((flags &amp; CHECK_FILELOCK) &amp;&amp;</div><div class='ctx'> 	    (ci-&gt;i_ceph_flags &amp; CEPH_I_ERROR_FILELOCK)) {</div><div class='del'>-		dout("try_get_cap_refs %p error filelock\n", inode);</div><div class='add'>+		doutc(cl, "%p %llx.%llx error filelock\n", inode,</div><div class='add'>+		      ceph_vinop(inode));</div><div class='ctx'> 		ret = -EIO;</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2676,10 +2850,10 @@ again:</div><div class='ctx'> </div><div class='ctx'> 	if (have &amp; need &amp; CEPH_CAP_FILE_WR) {</div><div class='ctx'> 		if (endoff &gt;= 0 &amp;&amp; endoff &gt; (loff_t)ci-&gt;i_max_size) {</div><div class='del'>-			dout("get_cap_refs %p endoff %llu &gt; maxsize %llu\n",</div><div class='del'>-			     inode, endoff, ci-&gt;i_max_size);</div><div class='add'>+			doutc(cl, "%p %llx.%llx endoff %llu &gt; maxsize %llu\n",</div><div class='add'>+			      inode, ceph_vinop(inode), endoff, ci-&gt;i_max_size);</div><div class='ctx'> 			if (endoff &gt; ci-&gt;i_requested_max_size)</div><div class='del'>-				ret = ci-&gt;i_auth_cap ? -EFBIG : -ESTALE;</div><div class='add'>+				ret = ci-&gt;i_auth_cap ? -EFBIG : -EUCLEAN;</div><div class='ctx'> 			goto out_unlock;</div><div class='ctx'> 		}</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -2687,7 +2861,8 @@ again:</div><div class='ctx'> 		 * can get a final snapshot value for size+mtime.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (__ceph_have_pending_cap_snap(ci)) {</div><div class='del'>-			dout("get_cap_refs %p cap_snap_pending\n", inode);</div><div class='add'>+			doutc(cl, "%p %llx.%llx cap_snap_pending\n", inode,</div><div class='add'>+			      ceph_vinop(inode));</div><div class='ctx'> 			goto out_unlock;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2698,13 +2873,17 @@ again:</div><div class='ctx'> 		 * on transition from wanted -&gt; needed caps.  This is needed</div><div class='ctx'> 		 * for WRBUFFER|WR -&gt; WR to avoid a new WR sync write from</div><div class='ctx'> 		 * going before a prior buffered writeback happens.</div><div class='add'>+		 *</div><div class='add'>+		 * For RDCACHE|RD -&gt; RD, there is not need to wait and we can</div><div class='add'>+		 * just exclude the revoking caps and force to sync read.</div><div class='ctx'> 		 */</div><div class='ctx'> 		int not = want &amp; ~(have &amp; need);</div><div class='ctx'> 		int revoking = implemented &amp; ~have;</div><div class='del'>-		dout("get_cap_refs %p have %s but not %s (revoking %s)\n",</div><div class='del'>-		     inode, ceph_cap_string(have), ceph_cap_string(not),</div><div class='del'>-		     ceph_cap_string(revoking));</div><div class='del'>-		if ((revoking &amp; not) == 0) {</div><div class='add'>+		int exclude = revoking &amp; not;</div><div class='add'>+		doutc(cl, "%p %llx.%llx have %s but not %s (revoking %s)\n",</div><div class='add'>+		      inode, ceph_vinop(inode), ceph_cap_string(have),</div><div class='add'>+		      ceph_cap_string(not), ceph_cap_string(revoking));</div><div class='add'>+		if (!exclude || !(exclude &amp; CEPH_CAP_FILE_BUFFER)) {</div><div class='ctx'> 			if (!snap_rwsem_locked &amp;&amp;</div><div class='ctx'> 			    !ci-&gt;i_head_snapc &amp;&amp;</div><div class='ctx'> 			    (need &amp; CEPH_CAP_FILE_WR)) {</div><div class='hunk'>@@ -2726,7 +2905,7 @@ again:</div><div class='ctx'> 				snap_rwsem_locked = true;</div><div class='ctx'> 			}</div><div class='ctx'> 			if ((have &amp; want) == want)</div><div class='del'>-				*got = need | want;</div><div class='add'>+				*got = need | (want &amp; ~exclude);</div><div class='ctx'> 			else</div><div class='ctx'> 				*got = need;</div><div class='ctx'> 			ceph_take_cap_refs(ci, *got, true);</div><div class='hunk'>@@ -2743,28 +2922,31 @@ again:</div><div class='ctx'> 			spin_unlock(&amp;s-&gt;s_cap_lock);</div><div class='ctx'> 		}</div><div class='ctx'> 		if (session_readonly) {</div><div class='del'>-			dout("get_cap_refs %p need %s but mds%d readonly\n",</div><div class='del'>-			     inode, ceph_cap_string(need), ci-&gt;i_auth_cap-&gt;mds);</div><div class='add'>+			doutc(cl, "%p %llx.%llx need %s but mds%d readonly\n",</div><div class='add'>+			      inode, ceph_vinop(inode), ceph_cap_string(need),</div><div class='add'>+			      ci-&gt;i_auth_cap-&gt;mds);</div><div class='ctx'> 			ret = -EROFS;</div><div class='ctx'> 			goto out_unlock;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (READ_ONCE(mdsc-&gt;fsc-&gt;mount_state) &gt;= CEPH_MOUNT_SHUTDOWN) {</div><div class='del'>-			dout("get_cap_refs %p forced umount\n", inode);</div><div class='del'>-			ret = -EIO;</div><div class='add'>+		if (ceph_inode_is_shutdown(inode)) {</div><div class='add'>+			doutc(cl, "%p %llx.%llx inode is shutdown\n",</div><div class='add'>+			      inode, ceph_vinop(inode));</div><div class='add'>+			ret = -ESTALE;</div><div class='ctx'> 			goto out_unlock;</div><div class='ctx'> 		}</div><div class='ctx'> 		mds_wanted = __ceph_caps_mds_wanted(ci, false);</div><div class='ctx'> 		if (need &amp; ~mds_wanted) {</div><div class='del'>-			dout("get_cap_refs %p need %s &gt; mds_wanted %s\n",</div><div class='del'>-			     inode, ceph_cap_string(need),</div><div class='del'>-			     ceph_cap_string(mds_wanted));</div><div class='del'>-			ret = -ESTALE;</div><div class='add'>+			doutc(cl, "%p %llx.%llx need %s &gt; mds_wanted %s\n",</div><div class='add'>+			      inode, ceph_vinop(inode), ceph_cap_string(need),</div><div class='add'>+			      ceph_cap_string(mds_wanted));</div><div class='add'>+			ret = -EUCLEAN;</div><div class='ctx'> 			goto out_unlock;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		dout("get_cap_refs %p have %s need %s\n", inode,</div><div class='del'>-		     ceph_cap_string(have), ceph_cap_string(need));</div><div class='add'>+		doutc(cl, "%p %llx.%llx have %s need %s\n", inode,</div><div class='add'>+		      ceph_vinop(inode), ceph_cap_string(have),</div><div class='add'>+		      ceph_cap_string(need));</div><div class='ctx'> 	}</div><div class='ctx'> out_unlock:</div><div class='ctx'> </div><div class='hunk'>@@ -2779,8 +2961,8 @@ out_unlock:</div><div class='ctx'> 	else if (ret == 1)</div><div class='ctx'> 		ceph_update_cap_hit(&amp;mdsc-&gt;metric);</div><div class='ctx'> </div><div class='del'>-	dout("get_cap_refs %p ret %d got %s\n", inode,</div><div class='del'>-	     ret, ceph_cap_string(*got));</div><div class='add'>+	doutc(cl, "%p %llx.%llx ret %d got %s\n", inode,</div><div class='add'>+	      ceph_vinop(inode), ret, ceph_cap_string(*got));</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2792,13 +2974,14 @@ out_unlock:</div><div class='ctx'> static void check_max_size(struct inode *inode, loff_t endoff)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	int check = 0;</div><div class='ctx'> </div><div class='ctx'> 	/* do we need to explicitly request a larger max_size? */</div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 	if (endoff &gt;= ci-&gt;i_max_size &amp;&amp; endoff &gt; ci-&gt;i_wanted_max_size) {</div><div class='del'>-		dout("write %p at large endoff %llu, req max_size\n",</div><div class='del'>-		     inode, endoff);</div><div class='add'>+		doutc(cl, "write %p %llx.%llx at large endoff %llu, req max_size\n",</div><div class='add'>+		      inode, ceph_vinop(inode), endoff);</div><div class='ctx'> 		ci-&gt;i_wanted_max_size = endoff;</div><div class='ctx'> 	}</div><div class='ctx'> 	/* duplicate ceph_check_caps()'s logic */</div><div class='hunk'>@@ -2809,7 +2992,7 @@ static void check_max_size(struct inode *inode, loff_t endoff)</div><div class='ctx'> 		check = 1;</div><div class='ctx'> 	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 	if (check)</div><div class='del'>-		ceph_check_caps(ci, CHECK_CAPS_AUTHONLY, NULL);</div><div class='add'>+		ceph_check_caps(ci, CHECK_CAPS_AUTHONLY);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int get_used_fmode(int caps)</div><div class='hunk'>@@ -2843,7 +3026,7 @@ int ceph_try_get_caps(struct inode *inode, int need, int want,</div><div class='ctx'> </div><div class='ctx'> 	ret = try_get_cap_refs(inode, need, want, 0, flags, got);</div><div class='ctx'> 	/* three special error codes */</div><div class='del'>-	if (ret == -EAGAIN || ret == -EFBIG || ret == -ESTALE)</div><div class='add'>+	if (ret == -EAGAIN || ret == -EFBIG || ret == -EUCLEAN)</div><div class='ctx'> 		ret = 0;</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -2853,19 +3036,18 @@ int ceph_try_get_caps(struct inode *inode, int need, int want,</div><div class='ctx'>  * due to a small max_size, make sure we check_max_size (and possibly</div><div class='ctx'>  * ask the mds) so we don't get hung up indefinitely.</div><div class='ctx'>  */</div><div class='del'>-int ceph_get_caps(struct file *filp, int need, int want, loff_t endoff, int *got)</div><div class='add'>+int __ceph_get_caps(struct inode *inode, struct ceph_file_info *fi, int need,</div><div class='add'>+		    int want, loff_t endoff, int *got)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_file_info *fi = filp-&gt;private_data;</div><div class='del'>-	struct inode *inode = file_inode(filp);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_inode_to_client(inode);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='ctx'> 	int ret, _got, flags;</div><div class='ctx'> </div><div class='ctx'> 	ret = ceph_pool_perm_check(inode, need);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	if ((fi-&gt;fmode &amp; CEPH_FILE_MODE_WR) &amp;&amp;</div><div class='add'>+	if (fi &amp;&amp; (fi-&gt;fmode &amp; CEPH_FILE_MODE_WR) &amp;&amp;</div><div class='ctx'> 	    fi-&gt;filp_gen != READ_ONCE(fsc-&gt;filp_gen))</div><div class='ctx'> 		return -EBADF;</div><div class='ctx'> </div><div class='hunk'>@@ -2873,17 +3055,20 @@ int ceph_get_caps(struct file *filp, int need, int want, loff_t endoff, int *got</div><div class='ctx'> </div><div class='ctx'> 	while (true) {</div><div class='ctx'> 		flags &amp;= CEPH_FILE_MODE_MASK;</div><div class='del'>-		if (atomic_read(&amp;fi-&gt;num_locks))</div><div class='add'>+		if (vfs_inode_has_locks(inode))</div><div class='ctx'> 			flags |= CHECK_FILELOCK;</div><div class='ctx'> 		_got = 0;</div><div class='ctx'> 		ret = try_get_cap_refs(inode, need, want, endoff,</div><div class='ctx'> 				       flags, &amp;_got);</div><div class='ctx'> 		WARN_ON_ONCE(ret == -EAGAIN);</div><div class='ctx'> 		if (!ret) {</div><div class='add'>+#ifdef CONFIG_DEBUG_FS</div><div class='ctx'> 			struct ceph_mds_client *mdsc = fsc-&gt;mdsc;</div><div class='ctx'> 			struct cap_wait cw;</div><div class='add'>+#endif</div><div class='ctx'> 			DEFINE_WAIT_FUNC(wait, woken_wake_function);</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_DEBUG_FS</div><div class='ctx'> 			cw.ino = ceph_ino(inode);</div><div class='ctx'> 			cw.tgid = current-&gt;tgid;</div><div class='ctx'> 			cw.need = need;</div><div class='hunk'>@@ -2892,6 +3077,7 @@ int ceph_get_caps(struct file *filp, int need, int want, loff_t endoff, int *got</div><div class='ctx'> 			spin_lock(&amp;mdsc-&gt;caps_list_lock);</div><div class='ctx'> 			list_add(&amp;cw.list, &amp;mdsc-&gt;cap_wait_list);</div><div class='ctx'> 			spin_unlock(&amp;mdsc-&gt;caps_list_lock);</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='ctx'> 			/* make sure used fmode not timeout */</div><div class='ctx'> 			ceph_get_fmode(ci, flags, FMODE_WAIT_BIAS);</div><div class='hunk'>@@ -2910,15 +3096,17 @@ int ceph_get_caps(struct file *filp, int need, int want, loff_t endoff, int *got</div><div class='ctx'> 			remove_wait_queue(&amp;ci-&gt;i_cap_wq, &amp;wait);</div><div class='ctx'> 			ceph_put_fmode(ci, flags, FMODE_WAIT_BIAS);</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_DEBUG_FS</div><div class='ctx'> 			spin_lock(&amp;mdsc-&gt;caps_list_lock);</div><div class='ctx'> 			list_del(&amp;cw.list);</div><div class='ctx'> 			spin_unlock(&amp;mdsc-&gt;caps_list_lock);</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='ctx'> 			if (ret == -EAGAIN)</div><div class='ctx'> 				continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if ((fi-&gt;fmode &amp; CEPH_FILE_MODE_WR) &amp;&amp;</div><div class='add'>+		if (fi &amp;&amp; (fi-&gt;fmode &amp; CEPH_FILE_MODE_WR) &amp;&amp;</div><div class='ctx'> 		    fi-&gt;filp_gen != READ_ONCE(fsc-&gt;filp_gen)) {</div><div class='ctx'> 			if (ret &gt;= 0 &amp;&amp; _got)</div><div class='ctx'> 				ceph_put_cap_refs(ci, _got);</div><div class='hunk'>@@ -2926,7 +3114,7 @@ int ceph_get_caps(struct file *filp, int need, int want, loff_t endoff, int *got</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (ret &lt; 0) {</div><div class='del'>-			if (ret == -EFBIG || ret == -ESTALE) {</div><div class='add'>+			if (ret == -EFBIG || ret == -EUCLEAN) {</div><div class='ctx'> 				int ret2 = ceph_wait_on_async_create(inode);</div><div class='ctx'> 				if (ret2 &lt; 0)</div><div class='ctx'> 					return ret2;</div><div class='hunk'>@@ -2935,7 +3123,7 @@ int ceph_get_caps(struct file *filp, int need, int want, loff_t endoff, int *got</div><div class='ctx'> 				check_max_size(inode, endoff);</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='del'>-			if (ret == -ESTALE) {</div><div class='add'>+			if (ret == -EUCLEAN) {</div><div class='ctx'> 				/* session was killed, try renew caps */</div><div class='ctx'> 				ret = ceph_renew_caps(inode, flags);</div><div class='ctx'> 				if (ret == 0)</div><div class='hunk'>@@ -2944,8 +3132,8 @@ int ceph_get_caps(struct file *filp, int need, int want, loff_t endoff, int *got</div><div class='ctx'> 			return ret;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (S_ISREG(ci-&gt;vfs_inode.i_mode) &amp;&amp;</div><div class='del'>-		    ci-&gt;i_inline_version != CEPH_INLINE_NONE &amp;&amp;</div><div class='add'>+		if (S_ISREG(ci-&gt;netfs.inode.i_mode) &amp;&amp;</div><div class='add'>+		    ceph_has_inline_data(ci) &amp;&amp;</div><div class='ctx'> 		    (_got &amp; (CEPH_CAP_FILE_CACHE|CEPH_CAP_FILE_LAZYIO)) &amp;&amp;</div><div class='ctx'> 		    i_size_read(inode) &gt; 0) {</div><div class='ctx'> 			struct page *page =</div><div class='hunk'>@@ -2981,6 +3169,15 @@ int ceph_get_caps(struct file *filp, int need, int want, loff_t endoff, int *got</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+int ceph_get_caps(struct file *filp, int need, int want, loff_t endoff,</div><div class='add'>+		  int *got)</div><div class='add'>+{</div><div class='add'>+	struct ceph_file_info *fi = filp-&gt;private_data;</div><div class='add'>+	struct inode *inode = file_inode(filp);</div><div class='add'>+</div><div class='add'>+	return __ceph_get_caps(inode, fi, need, want, endoff, got);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Take cap refs.  Caller must already know we hold at least one ref</div><div class='ctx'>  * on the caps in question or we don't know this is safe.</div><div class='hunk'>@@ -3000,10 +3197,12 @@ void ceph_get_cap_refs(struct ceph_inode_info *ci, int caps)</div><div class='ctx'> static int ceph_try_drop_cap_snap(struct ceph_inode_info *ci,</div><div class='ctx'> 				  struct ceph_cap_snap *capsnap)</div><div class='ctx'> {</div><div class='add'>+	struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='add'>+</div><div class='ctx'> 	if (!capsnap-&gt;need_flush &amp;&amp;</div><div class='ctx'> 	    !capsnap-&gt;writing &amp;&amp; !capsnap-&gt;dirty_pages) {</div><div class='del'>-		dout("dropping cap_snap %p follows %llu\n",</div><div class='del'>-		     capsnap, capsnap-&gt;follows);</div><div class='add'>+		doutc(cl, "%p follows %llu\n", capsnap, capsnap-&gt;follows);</div><div class='ctx'> 		BUG_ON(capsnap-&gt;cap_flush.tid &gt; 0);</div><div class='ctx'> 		ceph_put_snap_context(capsnap-&gt;context);</div><div class='ctx'> 		if (!list_is_last(&amp;capsnap-&gt;ci_item, &amp;ci-&gt;i_cap_snaps))</div><div class='hunk'>@@ -3018,7 +3217,6 @@ static int ceph_try_drop_cap_snap(struct ceph_inode_info *ci,</div><div class='ctx'> </div><div class='ctx'> enum put_cap_refs_mode {</div><div class='ctx'> 	PUT_CAP_REFS_SYNC = 0,</div><div class='del'>-	PUT_CAP_REFS_NO_CHECK,</div><div class='ctx'> 	PUT_CAP_REFS_ASYNC,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -3034,7 +3232,8 @@ enum put_cap_refs_mode {</div><div class='ctx'> static void __ceph_put_cap_refs(struct ceph_inode_info *ci, int had,</div><div class='ctx'> 				enum put_cap_refs_mode mode)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = &amp;ci-&gt;vfs_inode;</div><div class='add'>+	struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	int last = 0, put = 0, flushsnaps = 0, wake = 0;</div><div class='ctx'> 	bool check_flushsnaps = false;</div><div class='ctx'> </div><div class='hunk'>@@ -3057,11 +3256,17 @@ static void __ceph_put_cap_refs(struct ceph_inode_info *ci, int had,</div><div class='ctx'> 			put++;</div><div class='ctx'> 			check_flushsnaps = true;</div><div class='ctx'> 		}</div><div class='del'>-		dout("put_cap_refs %p wb %d -&gt; %d (?)\n",</div><div class='del'>-		     inode, ci-&gt;i_wb_ref+1, ci-&gt;i_wb_ref);</div><div class='add'>+		doutc(cl, "%p %llx.%llx wb %d -&gt; %d (?)\n", inode,</div><div class='add'>+		      ceph_vinop(inode), ci-&gt;i_wb_ref+1, ci-&gt;i_wb_ref);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (had &amp; CEPH_CAP_FILE_WR) {</div><div class='ctx'> 		if (--ci-&gt;i_wr_ref == 0) {</div><div class='add'>+			/*</div><div class='add'>+			 * The Fb caps will always be took and released</div><div class='add'>+			 * together with the Fw caps.</div><div class='add'>+			 */</div><div class='add'>+			WARN_ON_ONCE(ci-&gt;i_wb_ref);</div><div class='add'>+</div><div class='ctx'> 			last++;</div><div class='ctx'> 			check_flushsnaps = true;</div><div class='ctx'> 			if (ci-&gt;i_wrbuffer_ref_head == 0 &amp;&amp;</div><div class='hunk'>@@ -3092,13 +3297,13 @@ static void __ceph_put_cap_refs(struct ceph_inode_info *ci, int had,</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> </div><div class='del'>-	dout("put_cap_refs %p had %s%s%s\n", inode, ceph_cap_string(had),</div><div class='del'>-	     last ? " last" : "", put ? " put" : "");</div><div class='add'>+	doutc(cl, "%p %llx.%llx had %s%s%s\n", inode, ceph_vinop(inode),</div><div class='add'>+	      ceph_cap_string(had), last ? " last" : "", put ? " put" : "");</div><div class='ctx'> </div><div class='ctx'> 	switch (mode) {</div><div class='ctx'> 	case PUT_CAP_REFS_SYNC:</div><div class='ctx'> 		if (last)</div><div class='del'>-			ceph_check_caps(ci, 0, NULL);</div><div class='add'>+			ceph_check_caps(ci, 0);</div><div class='ctx'> 		else if (flushsnaps)</div><div class='ctx'> 			ceph_flush_snaps(ci, NULL);</div><div class='ctx'> 		break;</div><div class='hunk'>@@ -3127,11 +3332,6 @@ void ceph_put_cap_refs_async(struct ceph_inode_info *ci, int had)</div><div class='ctx'> 	__ceph_put_cap_refs(ci, had, PUT_CAP_REFS_ASYNC);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void ceph_put_cap_refs_no_check_caps(struct ceph_inode_info *ci, int had)</div><div class='del'>-{</div><div class='del'>-	__ceph_put_cap_refs(ci, had, PUT_CAP_REFS_NO_CHECK);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Release @nr WRBUFFER refs on dirty pages for the given @snapc snap</div><div class='ctx'>  * context.  Adjust per-snap dirty page accounting as appropriate.</div><div class='hunk'>@@ -3142,11 +3342,11 @@ void ceph_put_cap_refs_no_check_caps(struct ceph_inode_info *ci, int had)</div><div class='ctx'> void ceph_put_wrbuffer_cap_refs(struct ceph_inode_info *ci, int nr,</div><div class='ctx'> 				struct ceph_snap_context *snapc)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = &amp;ci-&gt;vfs_inode;</div><div class='del'>-	struct ceph_cap_snap *capsnap = NULL;</div><div class='add'>+	struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='add'>+	struct ceph_cap_snap *capsnap = NULL, *iter;</div><div class='ctx'> 	int put = 0;</div><div class='ctx'> 	bool last = false;</div><div class='del'>-	bool found = false;</div><div class='ctx'> 	bool flush_snaps = false;</div><div class='ctx'> 	bool complete_capsnap = false;</div><div class='ctx'> </div><div class='hunk'>@@ -3167,20 +3367,19 @@ void ceph_put_wrbuffer_cap_refs(struct ceph_inode_info *ci, int nr,</div><div class='ctx'> 			ceph_put_snap_context(ci-&gt;i_head_snapc);</div><div class='ctx'> 			ci-&gt;i_head_snapc = NULL;</div><div class='ctx'> 		}</div><div class='del'>-		dout("put_wrbuffer_cap_refs on %p head %d/%d -&gt; %d/%d %s\n",</div><div class='del'>-		     inode,</div><div class='del'>-		     ci-&gt;i_wrbuffer_ref+nr, ci-&gt;i_wrbuffer_ref_head+nr,</div><div class='del'>-		     ci-&gt;i_wrbuffer_ref, ci-&gt;i_wrbuffer_ref_head,</div><div class='del'>-		     last ? " LAST" : "");</div><div class='add'>+		doutc(cl, "on %p %llx.%llx head %d/%d -&gt; %d/%d %s\n",</div><div class='add'>+		      inode, ceph_vinop(inode), ci-&gt;i_wrbuffer_ref+nr,</div><div class='add'>+		      ci-&gt;i_wrbuffer_ref_head+nr, ci-&gt;i_wrbuffer_ref,</div><div class='add'>+		      ci-&gt;i_wrbuffer_ref_head, last ? " LAST" : "");</div><div class='ctx'> 	} else {</div><div class='del'>-		list_for_each_entry(capsnap, &amp;ci-&gt;i_cap_snaps, ci_item) {</div><div class='del'>-			if (capsnap-&gt;context == snapc) {</div><div class='del'>-				found = true;</div><div class='add'>+		list_for_each_entry(iter, &amp;ci-&gt;i_cap_snaps, ci_item) {</div><div class='add'>+			if (iter-&gt;context == snapc) {</div><div class='add'>+				capsnap = iter;</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (!found) {</div><div class='add'>+		if (!capsnap) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * The capsnap should already be removed when removing</div><div class='ctx'> 			 * auth cap in the case of a forced unmount.</div><div class='hunk'>@@ -3201,20 +3400,19 @@ void ceph_put_wrbuffer_cap_refs(struct ceph_inode_info *ci, int nr,</div><div class='ctx'> 				}</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		dout("put_wrbuffer_cap_refs on %p cap_snap %p "</div><div class='del'>-		     " snap %lld %d/%d -&gt; %d/%d %s%s\n",</div><div class='del'>-		     inode, capsnap, capsnap-&gt;context-&gt;seq,</div><div class='del'>-		     ci-&gt;i_wrbuffer_ref+nr, capsnap-&gt;dirty_pages + nr,</div><div class='del'>-		     ci-&gt;i_wrbuffer_ref, capsnap-&gt;dirty_pages,</div><div class='del'>-		     last ? " (wrbuffer last)" : "",</div><div class='del'>-		     complete_capsnap ? " (complete capsnap)" : "");</div><div class='add'>+		doutc(cl, "%p %llx.%llx cap_snap %p snap %lld %d/%d -&gt; %d/%d %s%s\n",</div><div class='add'>+		      inode, ceph_vinop(inode), capsnap, capsnap-&gt;context-&gt;seq,</div><div class='add'>+		      ci-&gt;i_wrbuffer_ref+nr, capsnap-&gt;dirty_pages + nr,</div><div class='add'>+		      ci-&gt;i_wrbuffer_ref, capsnap-&gt;dirty_pages,</div><div class='add'>+		      last ? " (wrbuffer last)" : "",</div><div class='add'>+		      complete_capsnap ? " (complete capsnap)" : "");</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> unlock:</div><div class='ctx'> 	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (last) {</div><div class='del'>-		ceph_check_caps(ci, 0, NULL);</div><div class='add'>+		ceph_check_caps(ci, 0);</div><div class='ctx'> 	} else if (flush_snaps) {</div><div class='ctx'> 		ceph_flush_snaps(ci, NULL);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3230,9 +3428,10 @@ unlock:</div><div class='ctx'>  */</div><div class='ctx'> static void invalidate_aliases(struct inode *inode)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct dentry *dn, *prev = NULL;</div><div class='ctx'> </div><div class='del'>-	dout("invalidate_aliases inode %p\n", inode);</div><div class='add'>+	doutc(cl, "%p %llx.%llx\n", inode, ceph_vinop(inode));</div><div class='ctx'> 	d_prune_aliases(inode);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * For non-directory inode, d_find_alias() only returns</div><div class='hunk'>@@ -3271,6 +3470,9 @@ struct cap_extra_info {</div><div class='ctx'> 	/* currently issued */</div><div class='ctx'> 	int issued;</div><div class='ctx'> 	struct timespec64 btime;</div><div class='add'>+	u8 *fscrypt_auth;</div><div class='add'>+	u32 fscrypt_auth_len;</div><div class='add'>+	u64 fscrypt_file_size;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -3288,6 +3490,7 @@ static void handle_cap_grant(struct inode *inode,</div><div class='ctx'> 	__releases(ci-&gt;i_ceph_lock)</div><div class='ctx'> 	__releases(session-&gt;s_mdsc-&gt;snap_rwsem)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	int seq = le32_to_cpu(grant-&gt;seq);</div><div class='ctx'> 	int newcaps = le32_to_cpu(grant-&gt;caps);</div><div class='hunk'>@@ -3302,11 +3505,22 @@ static void handle_cap_grant(struct inode *inode,</div><div class='ctx'> 	bool queue_invalidate = false;</div><div class='ctx'> 	bool deleted_inode = false;</div><div class='ctx'> 	bool fill_inline = false;</div><div class='add'>+	bool revoke_wait = false;</div><div class='add'>+	int flags = 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If there is at least one crypto block then we'll trust</div><div class='add'>+	 * fscrypt_file_size. If the real length of the file is 0, then</div><div class='add'>+	 * ignore it (it has probably been truncated down to 0 by the MDS).</div><div class='add'>+	 */</div><div class='add'>+	if (IS_ENCRYPTED(inode) &amp;&amp; size)</div><div class='add'>+		size = extra_info-&gt;fscrypt_file_size;</div><div class='ctx'> </div><div class='del'>-	dout("handle_cap_grant inode %p cap %p mds%d seq %d %s\n",</div><div class='del'>-	     inode, cap, session-&gt;s_mds, seq, ceph_cap_string(newcaps));</div><div class='del'>-	dout(" size %llu max_size %llu, i_size %llu\n", size, max_size,</div><div class='del'>-		i_size_read(inode));</div><div class='add'>+	doutc(cl, "%p %llx.%llx cap %p mds%d seq %d %s\n", inode,</div><div class='add'>+	      ceph_vinop(inode), cap, session-&gt;s_mds, seq,</div><div class='add'>+	      ceph_cap_string(newcaps));</div><div class='add'>+	doutc(cl, " size %llu max_size %llu, i_size %llu\n", size,</div><div class='add'>+	      max_size, i_size_read(inode));</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -3366,16 +3580,25 @@ static void handle_cap_grant(struct inode *inode,</div><div class='ctx'> 		inode-&gt;i_uid = make_kuid(&amp;init_user_ns, le32_to_cpu(grant-&gt;uid));</div><div class='ctx'> 		inode-&gt;i_gid = make_kgid(&amp;init_user_ns, le32_to_cpu(grant-&gt;gid));</div><div class='ctx'> 		ci-&gt;i_btime = extra_info-&gt;btime;</div><div class='del'>-		dout("%p mode 0%o uid.gid %d.%d\n", inode, inode-&gt;i_mode,</div><div class='del'>-		     from_kuid(&amp;init_user_ns, inode-&gt;i_uid),</div><div class='del'>-		     from_kgid(&amp;init_user_ns, inode-&gt;i_gid));</div><div class='add'>+		doutc(cl, "%p %llx.%llx mode 0%o uid.gid %d.%d\n", inode,</div><div class='add'>+		      ceph_vinop(inode), inode-&gt;i_mode,</div><div class='add'>+		      from_kuid(&amp;init_user_ns, inode-&gt;i_uid),</div><div class='add'>+		      from_kgid(&amp;init_user_ns, inode-&gt;i_gid));</div><div class='add'>+#if IS_ENABLED(CONFIG_FS_ENCRYPTION)</div><div class='add'>+		if (ci-&gt;fscrypt_auth_len != extra_info-&gt;fscrypt_auth_len ||</div><div class='add'>+		    memcmp(ci-&gt;fscrypt_auth, extra_info-&gt;fscrypt_auth,</div><div class='add'>+			   ci-&gt;fscrypt_auth_len))</div><div class='add'>+			pr_warn_ratelimited_client(cl,</div><div class='add'>+				"cap grant attempt to change fscrypt_auth on non-I_NEW inode (old len %d new len %d)\n",</div><div class='add'>+				ci-&gt;fscrypt_auth_len,</div><div class='add'>+				extra_info-&gt;fscrypt_auth_len);</div><div class='add'>+#endif</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if ((newcaps &amp; CEPH_CAP_LINK_SHARED) &amp;&amp;</div><div class='ctx'> 	    (extra_info-&gt;issued &amp; CEPH_CAP_LINK_EXCL) == 0) {</div><div class='ctx'> 		set_nlink(inode, le32_to_cpu(grant-&gt;nlink));</div><div class='del'>-		if (inode-&gt;i_nlink == 0 &amp;&amp;</div><div class='del'>-		    (newcaps &amp; (CEPH_CAP_LINK_SHARED | CEPH_CAP_LINK_EXCL)))</div><div class='add'>+		if (inode-&gt;i_nlink == 0)</div><div class='ctx'> 			deleted_inode = true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -3385,8 +3608,8 @@ static void handle_cap_grant(struct inode *inode,</div><div class='ctx'> 		u64 version = le64_to_cpu(grant-&gt;xattr_version);</div><div class='ctx'> </div><div class='ctx'> 		if (version &gt; ci-&gt;i_xattrs.version) {</div><div class='del'>-			dout(" got new xattrs v%llu on %p len %d\n",</div><div class='del'>-			     version, inode, len);</div><div class='add'>+			doutc(cl, " got new xattrs v%llu on %p %llx.%llx len %d\n",</div><div class='add'>+			      version, inode, ceph_vinop(inode), len);</div><div class='ctx'> 			if (ci-&gt;i_xattrs.blob)</div><div class='ctx'> 				ceph_buffer_put(ci-&gt;i_xattrs.blob);</div><div class='ctx'> 			ci-&gt;i_xattrs.blob = ceph_buffer_get(xattr_buf);</div><div class='hunk'>@@ -3437,8 +3660,8 @@ static void handle_cap_grant(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 	if (ci-&gt;i_auth_cap == cap &amp;&amp; (newcaps &amp; CEPH_CAP_ANY_FILE_WR)) {</div><div class='ctx'> 		if (max_size != ci-&gt;i_max_size) {</div><div class='del'>-			dout("max_size %lld -&gt; %llu\n",</div><div class='del'>-			     ci-&gt;i_max_size, max_size);</div><div class='add'>+			doutc(cl, "max_size %lld -&gt; %llu\n", ci-&gt;i_max_size,</div><div class='add'>+			      max_size);</div><div class='ctx'> 			ci-&gt;i_max_size = max_size;</div><div class='ctx'> 			if (max_size &gt;= ci-&gt;i_wanted_max_size) {</div><div class='ctx'> 				ci-&gt;i_wanted_max_size = 0;  /* reset */</div><div class='hunk'>@@ -3452,10 +3675,9 @@ static void handle_cap_grant(struct inode *inode,</div><div class='ctx'> 	wanted = __ceph_caps_wanted(ci);</div><div class='ctx'> 	used = __ceph_caps_used(ci);</div><div class='ctx'> 	dirty = __ceph_caps_dirty(ci);</div><div class='del'>-	dout(" my wanted = %s, used = %s, dirty %s\n",</div><div class='del'>-	     ceph_cap_string(wanted),</div><div class='del'>-	     ceph_cap_string(used),</div><div class='del'>-	     ceph_cap_string(dirty));</div><div class='add'>+	doutc(cl, " my wanted = %s, used = %s, dirty %s\n",</div><div class='add'>+	      ceph_cap_string(wanted), ceph_cap_string(used),</div><div class='add'>+	      ceph_cap_string(dirty));</div><div class='ctx'> </div><div class='ctx'> 	if ((was_stale || le32_to_cpu(grant-&gt;op) == CEPH_CAP_OP_IMPORT) &amp;&amp;</div><div class='ctx'> 	    (wanted &amp; ~(cap-&gt;mds_wanted | newcaps))) {</div><div class='hunk'>@@ -3476,29 +3698,34 @@ static void handle_cap_grant(struct inode *inode,</div><div class='ctx'> 	if (cap-&gt;issued &amp; ~newcaps) {</div><div class='ctx'> 		int revoking = cap-&gt;issued &amp; ~newcaps;</div><div class='ctx'> </div><div class='del'>-		dout("revocation: %s -&gt; %s (revoking %s)\n",</div><div class='del'>-		     ceph_cap_string(cap-&gt;issued),</div><div class='del'>-		     ceph_cap_string(newcaps),</div><div class='del'>-		     ceph_cap_string(revoking));</div><div class='add'>+		doutc(cl, "revocation: %s -&gt; %s (revoking %s)\n",</div><div class='add'>+		      ceph_cap_string(cap-&gt;issued), ceph_cap_string(newcaps),</div><div class='add'>+		      ceph_cap_string(revoking));</div><div class='ctx'> 		if (S_ISREG(inode-&gt;i_mode) &amp;&amp;</div><div class='del'>-		    (revoking &amp; used &amp; CEPH_CAP_FILE_BUFFER))</div><div class='add'>+		    (revoking &amp; used &amp; CEPH_CAP_FILE_BUFFER)) {</div><div class='ctx'> 			writeback = true;  /* initiate writeback; will delay ack */</div><div class='del'>-		else if (queue_invalidate &amp;&amp;</div><div class='add'>+			revoke_wait = true;</div><div class='add'>+		} else if (queue_invalidate &amp;&amp;</div><div class='ctx'> 			 revoking == CEPH_CAP_FILE_CACHE &amp;&amp;</div><div class='del'>-			 (newcaps &amp; CEPH_CAP_FILE_LAZYIO) == 0)</div><div class='del'>-			; /* do nothing yet, invalidation will be queued */</div><div class='del'>-		else if (cap == ci-&gt;i_auth_cap)</div><div class='add'>+			 (newcaps &amp; CEPH_CAP_FILE_LAZYIO) == 0) {</div><div class='add'>+			revoke_wait = true; /* do nothing yet, invalidation will be queued */</div><div class='add'>+		} else if (cap == ci-&gt;i_auth_cap) {</div><div class='ctx'> 			check_caps = 1; /* check auth cap only */</div><div class='del'>-		else</div><div class='add'>+		} else {</div><div class='ctx'> 			check_caps = 2; /* check all caps */</div><div class='add'>+		}</div><div class='add'>+		/* If there is new caps, try to wake up the waiters */</div><div class='add'>+		if (~cap-&gt;issued &amp; newcaps)</div><div class='add'>+			wake = true;</div><div class='ctx'> 		cap-&gt;issued = newcaps;</div><div class='ctx'> 		cap-&gt;implemented |= newcaps;</div><div class='ctx'> 	} else if (cap-&gt;issued == newcaps) {</div><div class='del'>-		dout("caps unchanged: %s -&gt; %s\n",</div><div class='del'>-		     ceph_cap_string(cap-&gt;issued), ceph_cap_string(newcaps));</div><div class='add'>+		doutc(cl, "caps unchanged: %s -&gt; %s\n",</div><div class='add'>+		      ceph_cap_string(cap-&gt;issued),</div><div class='add'>+		      ceph_cap_string(newcaps));</div><div class='ctx'> 	} else {</div><div class='del'>-		dout("grant: %s -&gt; %s\n", ceph_cap_string(cap-&gt;issued),</div><div class='del'>-		     ceph_cap_string(newcaps));</div><div class='add'>+		doutc(cl, "grant: %s -&gt; %s\n", ceph_cap_string(cap-&gt;issued),</div><div class='add'>+		      ceph_cap_string(newcaps));</div><div class='ctx'> 		/* non-auth MDS is revoking the newly grant caps ? */</div><div class='ctx'> 		if (cap == ci-&gt;i_auth_cap &amp;&amp;</div><div class='ctx'> 		    __ceph_caps_revoking_other(ci, cap, newcaps))</div><div class='hunk'>@@ -3512,6 +3739,16 @@ static void handle_cap_grant(struct inode *inode,</div><div class='ctx'> 	}</div><div class='ctx'> 	BUG_ON(cap-&gt;issued &amp; ~cap-&gt;implemented);</div><div class='ctx'> </div><div class='add'>+	/* don't let check_caps skip sending a response to MDS for revoke msgs */</div><div class='add'>+	if (!revoke_wait &amp;&amp; le32_to_cpu(grant-&gt;op) == CEPH_CAP_OP_REVOKE) {</div><div class='add'>+		cap-&gt;mds_wanted = 0;</div><div class='add'>+		flags |= CHECK_CAPS_FLUSH_FORCE;</div><div class='add'>+		if (cap == ci-&gt;i_auth_cap)</div><div class='add'>+			check_caps = 1; /* check auth cap only */</div><div class='add'>+		else</div><div class='add'>+			check_caps = 2; /* check all caps */</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (extra_info-&gt;inline_version &gt; 0 &amp;&amp;</div><div class='ctx'> 	    extra_info-&gt;inline_version &gt;= ci-&gt;i_inline_version) {</div><div class='ctx'> 		ci-&gt;i_inline_version = extra_info-&gt;inline_version;</div><div class='hunk'>@@ -3520,24 +3757,23 @@ static void handle_cap_grant(struct inode *inode,</div><div class='ctx'> 			fill_inline = true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (ci-&gt;i_auth_cap == cap &amp;&amp;</div><div class='del'>-	    le32_to_cpu(grant-&gt;op) == CEPH_CAP_OP_IMPORT) {</div><div class='del'>-		if (newcaps &amp; ~extra_info-&gt;issued)</div><div class='del'>-			wake = true;</div><div class='add'>+	if (le32_to_cpu(grant-&gt;op) == CEPH_CAP_OP_IMPORT) {</div><div class='add'>+		if (ci-&gt;i_auth_cap == cap) {</div><div class='add'>+			if (newcaps &amp; ~extra_info-&gt;issued)</div><div class='add'>+				wake = true;</div><div class='ctx'> </div><div class='del'>-		if (ci-&gt;i_requested_max_size &gt; max_size ||</div><div class='del'>-		    !(le32_to_cpu(grant-&gt;wanted) &amp; CEPH_CAP_ANY_FILE_WR)) {</div><div class='del'>-			/* re-request max_size if necessary */</div><div class='del'>-			ci-&gt;i_requested_max_size = 0;</div><div class='del'>-			wake = true;</div><div class='del'>-		}</div><div class='add'>+			if (ci-&gt;i_requested_max_size &gt; max_size ||</div><div class='add'>+			    !(le32_to_cpu(grant-&gt;wanted) &amp; CEPH_CAP_ANY_FILE_WR)) {</div><div class='add'>+				/* re-request max_size if necessary */</div><div class='add'>+				ci-&gt;i_requested_max_size = 0;</div><div class='add'>+				wake = true;</div><div class='add'>+			}</div><div class='ctx'> </div><div class='del'>-		ceph_kick_flushing_inode_caps(session, ci);</div><div class='del'>-		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+			ceph_kick_flushing_inode_caps(session, ci);</div><div class='add'>+		}</div><div class='ctx'> 		up_read(&amp;session-&gt;s_mdsc-&gt;snap_rwsem);</div><div class='del'>-	} else {</div><div class='del'>-		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 	}</div><div class='add'>+	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (fill_inline)</div><div class='ctx'> 		ceph_fill_inline_data(inode, NULL, extra_info-&gt;inline_data,</div><div class='hunk'>@@ -3562,10 +3798,9 @@ static void handle_cap_grant(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 	mutex_unlock(&amp;session-&gt;s_mutex);</div><div class='ctx'> 	if (check_caps == 1)</div><div class='del'>-		ceph_check_caps(ci, CHECK_CAPS_AUTHONLY | CHECK_CAPS_NOINVAL,</div><div class='del'>-				session);</div><div class='add'>+		ceph_check_caps(ci, flags | CHECK_CAPS_AUTHONLY | CHECK_CAPS_NOINVAL);</div><div class='ctx'> 	else if (check_caps == 2)</div><div class='del'>-		ceph_check_caps(ci, CHECK_CAPS_NOINVAL, session);</div><div class='add'>+		ceph_check_caps(ci, flags | CHECK_CAPS_NOINVAL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -3579,7 +3814,8 @@ static void handle_cap_flush_ack(struct inode *inode, u64 flush_tid,</div><div class='ctx'> 	__releases(ci-&gt;i_ceph_lock)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	struct ceph_mds_client *mdsc = ceph_sb_to_client(inode-&gt;i_sb)-&gt;mdsc;</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_sb_to_fs_client(inode-&gt;i_sb)-&gt;mdsc;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_cap_flush *cf, *tmp_cf;</div><div class='ctx'> 	LIST_HEAD(to_remove);</div><div class='ctx'> 	unsigned seq = le32_to_cpu(m-&gt;seq);</div><div class='hunk'>@@ -3616,11 +3852,11 @@ static void handle_cap_flush_ack(struct inode *inode, u64 flush_tid,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("handle_cap_flush_ack inode %p mds%d seq %d on %s cleaned %s,"</div><div class='del'>-	     " flushing %s -&gt; %s\n",</div><div class='del'>-	     inode, session-&gt;s_mds, seq, ceph_cap_string(dirty),</div><div class='del'>-	     ceph_cap_string(cleaned), ceph_cap_string(ci-&gt;i_flushing_caps),</div><div class='del'>-	     ceph_cap_string(ci-&gt;i_flushing_caps &amp; ~cleaned));</div><div class='add'>+	doutc(cl, "%p %llx.%llx mds%d seq %d on %s cleaned %s, flushing %s -&gt; %s\n",</div><div class='add'>+	      inode, ceph_vinop(inode), session-&gt;s_mds, seq,</div><div class='add'>+	      ceph_cap_string(dirty), ceph_cap_string(cleaned),</div><div class='add'>+	      ceph_cap_string(ci-&gt;i_flushing_caps),</div><div class='add'>+	      ceph_cap_string(ci-&gt;i_flushing_caps &amp; ~cleaned));</div><div class='ctx'> </div><div class='ctx'> 	if (list_empty(&amp;to_remove) &amp;&amp; !cleaned)</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -3636,18 +3872,21 @@ static void handle_cap_flush_ack(struct inode *inode, u64 flush_tid,</div><div class='ctx'> 		if (list_empty(&amp;ci-&gt;i_cap_flush_list)) {</div><div class='ctx'> 			list_del_init(&amp;ci-&gt;i_flushing_item);</div><div class='ctx'> 			if (!list_empty(&amp;session-&gt;s_cap_flushing)) {</div><div class='del'>-				dout(" mds%d still flushing cap on %p\n",</div><div class='del'>-				     session-&gt;s_mds,</div><div class='del'>-				     &amp;list_first_entry(&amp;session-&gt;s_cap_flushing,</div><div class='del'>-						struct ceph_inode_info,</div><div class='del'>-						i_flushing_item)-&gt;vfs_inode);</div><div class='add'>+				struct inode *inode =</div><div class='add'>+					    &amp;list_first_entry(&amp;session-&gt;s_cap_flushing,</div><div class='add'>+							      struct ceph_inode_info,</div><div class='add'>+							      i_flushing_item)-&gt;netfs.inode;</div><div class='add'>+				doutc(cl, " mds%d still flushing cap on %p %llx.%llx\n",</div><div class='add'>+				      session-&gt;s_mds, inode, ceph_vinop(inode));</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 		mdsc-&gt;num_cap_flushing--;</div><div class='del'>-		dout(" inode %p now !flushing\n", inode);</div><div class='add'>+		doutc(cl, " %p %llx.%llx now !flushing\n", inode,</div><div class='add'>+		      ceph_vinop(inode));</div><div class='ctx'> </div><div class='ctx'> 		if (ci-&gt;i_dirty_caps == 0) {</div><div class='del'>-			dout(" inode %p now clean\n", inode);</div><div class='add'>+			doutc(cl, " %p %llx.%llx now clean\n", inode,</div><div class='add'>+			      ceph_vinop(inode));</div><div class='ctx'> 			BUG_ON(!list_empty(&amp;ci-&gt;i_dirty_item));</div><div class='ctx'> 			drop = true;</div><div class='ctx'> 			if (ci-&gt;i_wr_ref == 0 &amp;&amp;</div><div class='hunk'>@@ -3685,12 +3924,14 @@ void __ceph_remove_capsnap(struct inode *inode, struct ceph_cap_snap *capsnap,</div><div class='ctx'> 			   bool *wake_ci, bool *wake_mdsc)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	struct ceph_mds_client *mdsc = ceph_sb_to_client(inode-&gt;i_sb)-&gt;mdsc;</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_sb_to_fs_client(inode-&gt;i_sb)-&gt;mdsc;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	bool ret;</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> </div><div class='del'>-	dout("removing capsnap %p, inode %p ci %p\n", capsnap, inode, ci);</div><div class='add'>+	doutc(cl, "removing capsnap %p, %p %llx.%llx ci %p\n", capsnap,</div><div class='add'>+	      inode, ceph_vinop(inode), ci);</div><div class='ctx'> </div><div class='ctx'> 	list_del_init(&amp;capsnap-&gt;ci_item);</div><div class='ctx'> 	ret = __detach_cap_flush_from_ci(ci, &amp;capsnap-&gt;cap_flush);</div><div class='hunk'>@@ -3729,37 +3970,38 @@ static void handle_cap_flushsnap_ack(struct inode *inode, u64 flush_tid,</div><div class='ctx'> 				     struct ceph_mds_session *session)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	struct ceph_mds_client *mdsc = ceph_sb_to_client(inode-&gt;i_sb)-&gt;mdsc;</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_sb_to_fs_client(inode-&gt;i_sb)-&gt;mdsc;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	u64 follows = le64_to_cpu(m-&gt;snap_follows);</div><div class='del'>-	struct ceph_cap_snap *capsnap;</div><div class='del'>-	bool flushed = false;</div><div class='add'>+	struct ceph_cap_snap *capsnap = NULL, *iter;</div><div class='ctx'> 	bool wake_ci = false;</div><div class='ctx'> 	bool wake_mdsc = false;</div><div class='ctx'> </div><div class='del'>-	dout("handle_cap_flushsnap_ack inode %p ci %p mds%d follows %lld\n",</div><div class='del'>-	     inode, ci, session-&gt;s_mds, follows);</div><div class='add'>+	doutc(cl, "%p %llx.%llx ci %p mds%d follows %lld\n", inode,</div><div class='add'>+	      ceph_vinop(inode), ci, session-&gt;s_mds, follows);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-	list_for_each_entry(capsnap, &amp;ci-&gt;i_cap_snaps, ci_item) {</div><div class='del'>-		if (capsnap-&gt;follows == follows) {</div><div class='del'>-			if (capsnap-&gt;cap_flush.tid != flush_tid) {</div><div class='del'>-				dout(" cap_snap %p follows %lld tid %lld !="</div><div class='del'>-				     " %lld\n", capsnap, follows,</div><div class='del'>-				     flush_tid, capsnap-&gt;cap_flush.tid);</div><div class='add'>+	list_for_each_entry(iter, &amp;ci-&gt;i_cap_snaps, ci_item) {</div><div class='add'>+		if (iter-&gt;follows == follows) {</div><div class='add'>+			if (iter-&gt;cap_flush.tid != flush_tid) {</div><div class='add'>+				doutc(cl, " cap_snap %p follows %lld "</div><div class='add'>+				      "tid %lld != %lld\n", iter,</div><div class='add'>+				      follows, flush_tid,</div><div class='add'>+				      iter-&gt;cap_flush.tid);</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='del'>-			flushed = true;</div><div class='add'>+			capsnap = iter;</div><div class='ctx'> 			break;</div><div class='ctx'> 		} else {</div><div class='del'>-			dout(" skipping cap_snap %p follows %lld\n",</div><div class='del'>-			     capsnap, capsnap-&gt;follows);</div><div class='add'>+			doutc(cl, " skipping cap_snap %p follows %lld\n",</div><div class='add'>+			      iter, iter-&gt;follows);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	if (flushed)</div><div class='add'>+	if (capsnap)</div><div class='ctx'> 		ceph_remove_capsnap(inode, capsnap, &amp;wake_ci, &amp;wake_mdsc);</div><div class='ctx'> 	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> </div><div class='del'>-	if (flushed) {</div><div class='add'>+	if (capsnap) {</div><div class='ctx'> 		ceph_put_snap_context(capsnap-&gt;context);</div><div class='ctx'> 		ceph_put_cap_snap(capsnap);</div><div class='ctx'> 		if (wake_ci)</div><div class='hunk'>@@ -3777,9 +4019,11 @@ static void handle_cap_flushsnap_ack(struct inode *inode, u64 flush_tid,</div><div class='ctx'>  */</div><div class='ctx'> static bool handle_cap_trunc(struct inode *inode,</div><div class='ctx'> 			     struct ceph_mds_caps *trunc,</div><div class='del'>-			     struct ceph_mds_session *session)</div><div class='add'>+			     struct ceph_mds_session *session,</div><div class='add'>+			     struct cap_extra_info *extra_info)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	int mds = session-&gt;s_mds;</div><div class='ctx'> 	int seq = le32_to_cpu(trunc-&gt;seq);</div><div class='ctx'> 	u32 truncate_seq = le32_to_cpu(trunc-&gt;truncate_seq);</div><div class='hunk'>@@ -3794,8 +4038,16 @@ static bool handle_cap_trunc(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 	issued |= implemented | dirty;</div><div class='ctx'> </div><div class='del'>-	dout("handle_cap_trunc inode %p mds%d seq %d to %lld seq %d\n",</div><div class='del'>-	     inode, mds, seq, truncate_size, truncate_seq);</div><div class='add'>+	/*</div><div class='add'>+	 * If there is at least one crypto block then we'll trust</div><div class='add'>+	 * fscrypt_file_size. If the real length of the file is 0, then</div><div class='add'>+	 * ignore it (it has probably been truncated down to 0 by the MDS).</div><div class='add'>+	 */</div><div class='add'>+	if (IS_ENCRYPTED(inode) &amp;&amp; size)</div><div class='add'>+		size = extra_info-&gt;fscrypt_file_size;</div><div class='add'>+</div><div class='add'>+	doutc(cl, "%p %llx.%llx mds%d seq %d to %lld truncate seq %d\n",</div><div class='add'>+	      inode, ceph_vinop(inode), mds, seq, truncate_size, truncate_seq);</div><div class='ctx'> 	queue_trunc = ceph_fill_file_size(inode, issued,</div><div class='ctx'> 					  truncate_seq, truncate_size, size);</div><div class='ctx'> 	return queue_trunc;</div><div class='hunk'>@@ -3813,36 +4065,37 @@ static void handle_cap_export(struct inode *inode, struct ceph_mds_caps *ex,</div><div class='ctx'> 			      struct ceph_mds_cap_peer *ph,</div><div class='ctx'> 			      struct ceph_mds_session *session)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_mds_client *mdsc = ceph_inode_to_client(inode)-&gt;mdsc;</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_inode_to_fs_client(inode)-&gt;mdsc;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_mds_session *tsession = NULL;</div><div class='ctx'> 	struct ceph_cap *cap, *tcap, *new_cap = NULL;</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	u64 t_cap_id;</div><div class='del'>-	unsigned mseq = le32_to_cpu(ex-&gt;migrate_seq);</div><div class='del'>-	unsigned t_seq, t_mseq;</div><div class='add'>+	u32 t_issue_seq, t_mseq;</div><div class='ctx'> 	int target, issued;</div><div class='ctx'> 	int mds = session-&gt;s_mds;</div><div class='ctx'> </div><div class='ctx'> 	if (ph) {</div><div class='ctx'> 		t_cap_id = le64_to_cpu(ph-&gt;cap_id);</div><div class='del'>-		t_seq = le32_to_cpu(ph-&gt;seq);</div><div class='add'>+		t_issue_seq = le32_to_cpu(ph-&gt;issue_seq);</div><div class='ctx'> 		t_mseq = le32_to_cpu(ph-&gt;mseq);</div><div class='ctx'> 		target = le32_to_cpu(ph-&gt;mds);</div><div class='ctx'> 	} else {</div><div class='del'>-		t_cap_id = t_seq = t_mseq = 0;</div><div class='add'>+		t_cap_id = t_issue_seq = t_mseq = 0;</div><div class='ctx'> 		target = -1;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("handle_cap_export inode %p ci %p mds%d mseq %d target %d\n",</div><div class='del'>-	     inode, ci, mds, mseq, target);</div><div class='add'>+	doutc(cl, " cap %llx.%llx export to peer %d piseq %u pmseq %u\n",</div><div class='add'>+	      ceph_vinop(inode), target, t_issue_seq, t_mseq);</div><div class='ctx'> retry:</div><div class='add'>+	down_read(&amp;mdsc-&gt;snap_rwsem);</div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 	cap = __get_cap_for_mds(ci, mds);</div><div class='ctx'> 	if (!cap || cap-&gt;cap_id != le64_to_cpu(ex-&gt;cap_id))</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='ctx'> 	if (target &lt; 0) {</div><div class='del'>-		ceph_remove_cap(cap, false);</div><div class='add'>+		ceph_remove_cap(mdsc, cap, false);</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -3853,23 +4106,25 @@ retry:</div><div class='ctx'> </div><div class='ctx'> 	issued = cap-&gt;issued;</div><div class='ctx'> 	if (issued != cap-&gt;implemented)</div><div class='del'>-		pr_err_ratelimited("handle_cap_export: issued != implemented: "</div><div class='del'>-				"ino (%llx.%llx) mds%d seq %d mseq %d "</div><div class='del'>-				"issued %s implemented %s\n",</div><div class='del'>-				ceph_vinop(inode), mds, cap-&gt;seq, cap-&gt;mseq,</div><div class='del'>-				ceph_cap_string(issued),</div><div class='del'>-				ceph_cap_string(cap-&gt;implemented));</div><div class='add'>+		pr_err_ratelimited_client(cl, "issued != implemented: "</div><div class='add'>+					  "%p %llx.%llx mds%d seq %d mseq %d"</div><div class='add'>+					  " issued %s implemented %s\n",</div><div class='add'>+					  inode, ceph_vinop(inode), mds,</div><div class='add'>+					  cap-&gt;seq, cap-&gt;mseq,</div><div class='add'>+					  ceph_cap_string(issued),</div><div class='add'>+					  ceph_cap_string(cap-&gt;implemented));</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> 	tcap = __get_cap_for_mds(ci, target);</div><div class='ctx'> 	if (tcap) {</div><div class='ctx'> 		/* already have caps from the target */</div><div class='ctx'> 		if (tcap-&gt;cap_id == t_cap_id &amp;&amp;</div><div class='del'>-		    ceph_seq_cmp(tcap-&gt;seq, t_seq) &lt; 0) {</div><div class='del'>-			dout(" updating import cap %p mds%d\n", tcap, target);</div><div class='add'>+		    ceph_seq_cmp(tcap-&gt;seq, t_issue_seq) &lt; 0) {</div><div class='add'>+			doutc(cl, " updating import cap %p mds%d\n", tcap,</div><div class='add'>+			      target);</div><div class='ctx'> 			tcap-&gt;cap_id = t_cap_id;</div><div class='del'>-			tcap-&gt;seq = t_seq - 1;</div><div class='del'>-			tcap-&gt;issue_seq = t_seq - 1;</div><div class='add'>+			tcap-&gt;seq = t_issue_seq - 1;</div><div class='add'>+			tcap-&gt;issue_seq = t_issue_seq - 1;</div><div class='ctx'> 			tcap-&gt;issued |= issued;</div><div class='ctx'> 			tcap-&gt;implemented |= issued;</div><div class='ctx'> 			if (cap == ci-&gt;i_auth_cap) {</div><div class='hunk'>@@ -3877,14 +4132,14 @@ retry:</div><div class='ctx'> 				change_auth_cap_ses(ci, tcap-&gt;session);</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		ceph_remove_cap(cap, false);</div><div class='add'>+		ceph_remove_cap(mdsc, cap, false);</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	} else if (tsession) {</div><div class='del'>-		/* add placeholder for the export tagert */</div><div class='add'>+		/* add placeholder for the export target */</div><div class='ctx'> 		int flag = (cap == ci-&gt;i_auth_cap) ? CEPH_CAP_FLAG_AUTH : 0;</div><div class='ctx'> 		tcap = new_cap;</div><div class='ctx'> 		ceph_add_cap(inode, tsession, t_cap_id, issued, 0,</div><div class='del'>-			     t_seq - 1, t_mseq, (u64)-1, flag, &amp;new_cap);</div><div class='add'>+			     t_issue_seq - 1, t_mseq, (u64)-1, flag, &amp;new_cap);</div><div class='ctx'> </div><div class='ctx'> 		if (!list_empty(&amp;ci-&gt;i_cap_flush_list) &amp;&amp;</div><div class='ctx'> 		    ci-&gt;i_auth_cap == tcap) {</div><div class='hunk'>@@ -3894,11 +4149,12 @@ retry:</div><div class='ctx'> 			spin_unlock(&amp;mdsc-&gt;cap_dirty_lock);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		ceph_remove_cap(cap, false);</div><div class='add'>+		ceph_remove_cap(mdsc, cap, false);</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+	up_read(&amp;mdsc-&gt;snap_rwsem);</div><div class='ctx'> 	mutex_unlock(&amp;session-&gt;s_mutex);</div><div class='ctx'> </div><div class='ctx'> 	/* open target session */</div><div class='hunk'>@@ -3924,6 +4180,7 @@ retry:</div><div class='ctx'> </div><div class='ctx'> out_unlock:</div><div class='ctx'> 	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+	up_read(&amp;mdsc-&gt;snap_rwsem);</div><div class='ctx'> 	mutex_unlock(&amp;session-&gt;s_mutex);</div><div class='ctx'> 	if (tsession) {</div><div class='ctx'> 		mutex_unlock(&amp;tsession-&gt;s_mutex);</div><div class='hunk'>@@ -3945,6 +4202,7 @@ static void handle_cap_import(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			      struct ceph_cap **target_cap, int *old_issued)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_cap *cap, *ocap, *new_cap = NULL;</div><div class='ctx'> 	int mds = session-&gt;s_mds;</div><div class='ctx'> 	int issued;</div><div class='hunk'>@@ -3955,18 +4213,22 @@ static void handle_cap_import(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	u64 realmino = le64_to_cpu(im-&gt;realm);</div><div class='ctx'> 	u64 cap_id = le64_to_cpu(im-&gt;cap_id);</div><div class='ctx'> 	u64 p_cap_id;</div><div class='add'>+	u32 piseq = 0;</div><div class='add'>+	u32 pmseq = 0;</div><div class='ctx'> 	int peer;</div><div class='ctx'> </div><div class='ctx'> 	if (ph) {</div><div class='ctx'> 		p_cap_id = le64_to_cpu(ph-&gt;cap_id);</div><div class='ctx'> 		peer = le32_to_cpu(ph-&gt;mds);</div><div class='add'>+		piseq = le32_to_cpu(ph-&gt;issue_seq);</div><div class='add'>+		pmseq = le32_to_cpu(ph-&gt;mseq);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		p_cap_id = 0;</div><div class='ctx'> 		peer = -1;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("handle_cap_import inode %p ci %p mds%d mseq %d peer %d\n",</div><div class='del'>-	     inode, ci, mds, mseq, peer);</div><div class='add'>+	doutc(cl, " cap %llx.%llx import from peer %d piseq %u pmseq %u\n",</div><div class='add'>+	      ceph_vinop(inode), peer, piseq, pmseq);</div><div class='ctx'> retry:</div><div class='ctx'> 	cap = __get_cap_for_mds(ci, mds);</div><div class='ctx'> 	if (!cap) {</div><div class='hunk'>@@ -3992,26 +4254,70 @@ retry:</div><div class='ctx'> </div><div class='ctx'> 	ocap = peer &gt;= 0 ? __get_cap_for_mds(ci, peer) : NULL;</div><div class='ctx'> 	if (ocap &amp;&amp; ocap-&gt;cap_id == p_cap_id) {</div><div class='del'>-		dout(" remove export cap %p mds%d flags %d\n",</div><div class='del'>-		     ocap, peer, ph-&gt;flags);</div><div class='add'>+		doutc(cl, " remove export cap %p mds%d flags %d\n",</div><div class='add'>+		      ocap, peer, ph-&gt;flags);</div><div class='ctx'> 		if ((ph-&gt;flags &amp; CEPH_CAP_FLAG_AUTH) &amp;&amp;</div><div class='del'>-		    (ocap-&gt;seq != le32_to_cpu(ph-&gt;seq) ||</div><div class='del'>-		     ocap-&gt;mseq != le32_to_cpu(ph-&gt;mseq))) {</div><div class='del'>-			pr_err_ratelimited("handle_cap_import: "</div><div class='del'>-					"mismatched seq/mseq: ino (%llx.%llx) "</div><div class='del'>-					"mds%d seq %d mseq %d importer mds%d "</div><div class='del'>-					"has peer seq %d mseq %d\n",</div><div class='del'>-					ceph_vinop(inode), peer, ocap-&gt;seq,</div><div class='del'>-					ocap-&gt;mseq, mds, le32_to_cpu(ph-&gt;seq),</div><div class='del'>-					le32_to_cpu(ph-&gt;mseq));</div><div class='add'>+		    (ocap-&gt;seq != piseq ||</div><div class='add'>+		     ocap-&gt;mseq != pmseq)) {</div><div class='add'>+			pr_err_ratelimited_client(cl, "mismatched seq/mseq: "</div><div class='add'>+					"%p %llx.%llx mds%d seq %d mseq %d"</div><div class='add'>+					" importer mds%d has peer seq %d mseq %d\n",</div><div class='add'>+					inode, ceph_vinop(inode), peer,</div><div class='add'>+					ocap-&gt;seq, ocap-&gt;mseq, mds, piseq, pmseq);</div><div class='ctx'> 		}</div><div class='del'>-		ceph_remove_cap(ocap, (ph-&gt;flags &amp; CEPH_CAP_FLAG_RELEASE));</div><div class='add'>+		ceph_remove_cap(mdsc, ocap, (ph-&gt;flags &amp; CEPH_CAP_FLAG_RELEASE));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	*old_issued = issued;</div><div class='ctx'> 	*target_cap = cap;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_FS_ENCRYPTION</div><div class='add'>+static int parse_fscrypt_fields(void **p, void *end,</div><div class='add'>+				struct cap_extra_info *extra)</div><div class='add'>+{</div><div class='add'>+	u32 len;</div><div class='add'>+</div><div class='add'>+	ceph_decode_32_safe(p, end, extra-&gt;fscrypt_auth_len, bad);</div><div class='add'>+	if (extra-&gt;fscrypt_auth_len) {</div><div class='add'>+		ceph_decode_need(p, end, extra-&gt;fscrypt_auth_len, bad);</div><div class='add'>+		extra-&gt;fscrypt_auth = kmalloc(extra-&gt;fscrypt_auth_len,</div><div class='add'>+					      GFP_KERNEL);</div><div class='add'>+		if (!extra-&gt;fscrypt_auth)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+		ceph_decode_copy_safe(p, end, extra-&gt;fscrypt_auth,</div><div class='add'>+					extra-&gt;fscrypt_auth_len, bad);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ceph_decode_32_safe(p, end, len, bad);</div><div class='add'>+	if (len &gt;= sizeof(u64)) {</div><div class='add'>+		ceph_decode_64_safe(p, end, extra-&gt;fscrypt_file_size, bad);</div><div class='add'>+		len -= sizeof(u64);</div><div class='add'>+	}</div><div class='add'>+	ceph_decode_skip_n(p, end, len, bad);</div><div class='add'>+	return 0;</div><div class='add'>+bad:</div><div class='add'>+	return -EIO;</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+static int parse_fscrypt_fields(void **p, void *end,</div><div class='add'>+				struct cap_extra_info *extra)</div><div class='add'>+{</div><div class='add'>+	u32 len;</div><div class='add'>+</div><div class='add'>+	/* Don't care about these fields unless we're encryption-capable */</div><div class='add'>+	ceph_decode_32_safe(p, end, len, bad);</div><div class='add'>+	if (len)</div><div class='add'>+		ceph_decode_skip_n(p, end, len, bad);</div><div class='add'>+	ceph_decode_32_safe(p, end, len, bad);</div><div class='add'>+	if (len)</div><div class='add'>+		ceph_decode_skip_n(p, end, len, bad);</div><div class='add'>+	return 0;</div><div class='add'>+bad:</div><div class='add'>+	return -EIO;</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Handle a caps message from the MDS.</div><div class='ctx'>  *</div><div class='hunk'>@@ -4022,6 +4328,7 @@ void ceph_handle_caps(struct ceph_mds_session *session,</div><div class='ctx'> 		      struct ceph_msg *msg)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_mds_client *mdsc = session-&gt;s_mdsc;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct ceph_inode_info *ci;</div><div class='ctx'> 	struct ceph_cap *cap;</div><div class='hunk'>@@ -4030,15 +4337,18 @@ void ceph_handle_caps(struct ceph_mds_session *session,</div><div class='ctx'> 	struct ceph_snap_realm *realm = NULL;</div><div class='ctx'> 	int op;</div><div class='ctx'> 	int msg_version = le16_to_cpu(msg-&gt;hdr.version);</div><div class='del'>-	u32 seq, mseq;</div><div class='add'>+	u32 seq, mseq, issue_seq;</div><div class='ctx'> 	struct ceph_vino vino;</div><div class='ctx'> 	void *snaptrace;</div><div class='ctx'> 	size_t snaptrace_len;</div><div class='ctx'> 	void *p, *end;</div><div class='ctx'> 	struct cap_extra_info extra_info = {};</div><div class='ctx'> 	bool queue_trunc;</div><div class='add'>+	bool close_sessions = false;</div><div class='add'>+	bool do_cap_release = false;</div><div class='ctx'> </div><div class='del'>-	dout("handle_caps from mds%d\n", session-&gt;s_mds);</div><div class='add'>+	if (!ceph_inc_mds_stopping_blocker(mdsc, session))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='ctx'> 	/* decode */</div><div class='ctx'> 	end = msg-&gt;front.iov_base + msg-&gt;front.iov_len;</div><div class='hunk'>@@ -4050,6 +4360,7 @@ void ceph_handle_caps(struct ceph_mds_session *session,</div><div class='ctx'> 	vino.snap = CEPH_NOSNAP;</div><div class='ctx'> 	seq = le32_to_cpu(h-&gt;seq);</div><div class='ctx'> 	mseq = le32_to_cpu(h-&gt;migrate_seq);</div><div class='add'>+	issue_seq = le32_to_cpu(h-&gt;issue_seq);</div><div class='ctx'> </div><div class='ctx'> 	snaptrace = h + 1;</div><div class='ctx'> 	snaptrace_len = le32_to_cpu(h-&gt;snap_trace_len);</div><div class='hunk'>@@ -4130,34 +4441,34 @@ void ceph_handle_caps(struct ceph_mds_session *session,</div><div class='ctx'> 		ceph_decode_64_safe(&amp;p, end, extra_info.nsubdirs, bad);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (msg_version &gt;= 12) {</div><div class='add'>+		if (parse_fscrypt_fields(&amp;p, end, &amp;extra_info))</div><div class='add'>+			goto bad;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/* lookup ino */</div><div class='ctx'> 	inode = ceph_find_inode(mdsc-&gt;fsc-&gt;sb, vino);</div><div class='del'>-	ci = ceph_inode(inode);</div><div class='del'>-	dout(" op %s ino %llx.%llx inode %p\n", ceph_cap_op_name(op), vino.ino,</div><div class='del'>-	     vino.snap, inode);</div><div class='add'>+	doutc(cl, " caps mds%d op %s ino %llx.%llx inode %p seq %u iseq %u mseq %u\n",</div><div class='add'>+	      session-&gt;s_mds, ceph_cap_op_name(op), vino.ino, vino.snap, inode,</div><div class='add'>+	      seq, issue_seq, mseq);</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;session-&gt;s_mutex);</div><div class='del'>-	inc_session_sequence(session);</div><div class='del'>-	dout(" mds%d seq %lld cap seq %u\n", session-&gt;s_mds, session-&gt;s_seq,</div><div class='del'>-	     (unsigned)seq);</div><div class='ctx'> </div><div class='ctx'> 	if (!inode) {</div><div class='del'>-		dout(" i don't have ino %llx\n", vino.ino);</div><div class='add'>+		doutc(cl, " i don't have ino %llx\n", vino.ino);</div><div class='ctx'> </div><div class='del'>-		if (op == CEPH_CAP_OP_IMPORT) {</div><div class='del'>-			cap = ceph_get_cap(mdsc, NULL);</div><div class='del'>-			cap-&gt;cap_ino = vino.ino;</div><div class='del'>-			cap-&gt;queue_release = 1;</div><div class='del'>-			cap-&gt;cap_id = le64_to_cpu(h-&gt;cap_id);</div><div class='del'>-			cap-&gt;mseq = mseq;</div><div class='del'>-			cap-&gt;seq = seq;</div><div class='del'>-			cap-&gt;issue_seq = seq;</div><div class='del'>-			spin_lock(&amp;session-&gt;s_cap_lock);</div><div class='del'>-			__ceph_queue_cap_release(session, cap);</div><div class='del'>-			spin_unlock(&amp;session-&gt;s_cap_lock);</div><div class='add'>+		switch (op) {</div><div class='add'>+		case CEPH_CAP_OP_IMPORT:</div><div class='add'>+		case CEPH_CAP_OP_REVOKE:</div><div class='add'>+		case CEPH_CAP_OP_GRANT:</div><div class='add'>+			do_cap_release = true;</div><div class='add'>+			break;</div><div class='add'>+		default:</div><div class='add'>+			break;</div><div class='ctx'> 		}</div><div class='ctx'> 		goto flush_cap_releases;</div><div class='ctx'> 	}</div><div class='add'>+	ci = ceph_inode(inode);</div><div class='ctx'> </div><div class='ctx'> 	/* these will work even if we don't have a cap yet */</div><div class='ctx'> 	switch (op) {</div><div class='hunk'>@@ -4174,9 +4485,13 @@ void ceph_handle_caps(struct ceph_mds_session *session,</div><div class='ctx'> 		realm = NULL;</div><div class='ctx'> 		if (snaptrace_len) {</div><div class='ctx'> 			down_write(&amp;mdsc-&gt;snap_rwsem);</div><div class='del'>-			ceph_update_snap_trace(mdsc, snaptrace,</div><div class='del'>-					       snaptrace + snaptrace_len,</div><div class='del'>-					       false, &amp;realm);</div><div class='add'>+			if (ceph_update_snap_trace(mdsc, snaptrace,</div><div class='add'>+						   snaptrace + snaptrace_len,</div><div class='add'>+						   false, &amp;realm)) {</div><div class='add'>+				up_write(&amp;mdsc-&gt;snap_rwsem);</div><div class='add'>+				close_sessions = true;</div><div class='add'>+				goto done;</div><div class='add'>+			}</div><div class='ctx'> 			downgrade_write(&amp;mdsc-&gt;snap_rwsem);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			down_read(&amp;mdsc-&gt;snap_rwsem);</div><div class='hunk'>@@ -4195,10 +4510,18 @@ void ceph_handle_caps(struct ceph_mds_session *session,</div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 	cap = __get_cap_for_mds(ceph_inode(inode), session-&gt;s_mds);</div><div class='ctx'> 	if (!cap) {</div><div class='del'>-		dout(" no cap on %p ino %llx.%llx from mds%d\n",</div><div class='del'>-		     inode, ceph_ino(inode), ceph_snap(inode),</div><div class='del'>-		     session-&gt;s_mds);</div><div class='add'>+		doutc(cl, " no cap on %p ino %llx.%llx from mds%d\n",</div><div class='add'>+		      inode, ceph_ino(inode), ceph_snap(inode),</div><div class='add'>+		      session-&gt;s_mds);</div><div class='ctx'> 		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+		switch (op) {</div><div class='add'>+		case CEPH_CAP_OP_REVOKE:</div><div class='add'>+		case CEPH_CAP_OP_GRANT:</div><div class='add'>+			do_cap_release = true;</div><div class='add'>+			break;</div><div class='add'>+		default:</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='ctx'> 		goto flush_cap_releases;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -4218,7 +4541,8 @@ void ceph_handle_caps(struct ceph_mds_session *session,</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	case CEPH_CAP_OP_TRUNC:</div><div class='del'>-		queue_trunc = handle_cap_trunc(inode, h, session);</div><div class='add'>+		queue_trunc = handle_cap_trunc(inode, h, session,</div><div class='add'>+						&amp;extra_info);</div><div class='ctx'> 		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 		if (queue_trunc)</div><div class='ctx'> 			ceph_queue_vmtruncate(inode);</div><div class='hunk'>@@ -4226,8 +4550,8 @@ void ceph_handle_caps(struct ceph_mds_session *session,</div><div class='ctx'> </div><div class='ctx'> 	default:</div><div class='ctx'> 		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-		pr_err("ceph_handle_caps: unknown cap op %d %s\n", op,</div><div class='del'>-		       ceph_cap_op_name(op));</div><div class='add'>+		pr_err_client(cl, "unknown cap op %d %s\n", op,</div><div class='add'>+			      ceph_cap_op_name(op));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> done:</div><div class='hunk'>@@ -4235,7 +4559,15 @@ done:</div><div class='ctx'> done_unlocked:</div><div class='ctx'> 	iput(inode);</div><div class='ctx'> out:</div><div class='add'>+	ceph_dec_mds_stopping_blocker(mdsc);</div><div class='add'>+</div><div class='ctx'> 	ceph_put_string(extra_info.pool_ns);</div><div class='add'>+</div><div class='add'>+	/* Defer closing the sessions after s_mutex lock being released */</div><div class='add'>+	if (close_sessions)</div><div class='add'>+		ceph_mdsc_close_sessions(mdsc);</div><div class='add'>+</div><div class='add'>+	kfree(extra_info.fscrypt_auth);</div><div class='ctx'> 	return;</div><div class='ctx'> </div><div class='ctx'> flush_cap_releases:</div><div class='hunk'>@@ -4244,11 +4576,23 @@ flush_cap_releases:</div><div class='ctx'> 	 * along for the mds (who clearly thinks we still have this</div><div class='ctx'> 	 * cap).</div><div class='ctx'> 	 */</div><div class='del'>-	ceph_flush_cap_releases(mdsc, session);</div><div class='add'>+	if (do_cap_release) {</div><div class='add'>+		cap = ceph_get_cap(mdsc, NULL);</div><div class='add'>+		cap-&gt;cap_ino = vino.ino;</div><div class='add'>+		cap-&gt;queue_release = 1;</div><div class='add'>+		cap-&gt;cap_id = le64_to_cpu(h-&gt;cap_id);</div><div class='add'>+		cap-&gt;mseq = mseq;</div><div class='add'>+		cap-&gt;seq = seq;</div><div class='add'>+		cap-&gt;issue_seq = seq;</div><div class='add'>+		spin_lock(&amp;session-&gt;s_cap_lock);</div><div class='add'>+		__ceph_queue_cap_release(session, cap);</div><div class='add'>+		spin_unlock(&amp;session-&gt;s_cap_lock);</div><div class='add'>+	}</div><div class='add'>+	ceph_flush_session_cap_releases(mdsc, session);</div><div class='ctx'> 	goto done;</div><div class='ctx'> </div><div class='ctx'> bad:</div><div class='del'>-	pr_err("ceph_handle_caps: corrupt message\n");</div><div class='add'>+	pr_err_client(cl, "corrupt message\n");</div><div class='ctx'> 	ceph_msg_dump(msg);</div><div class='ctx'> 	goto out;</div><div class='ctx'> }</div><div class='hunk'>@@ -4262,6 +4606,7 @@ bad:</div><div class='ctx'>  */</div><div class='ctx'> unsigned long ceph_check_delayed_caps(struct ceph_mds_client *mdsc)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct ceph_inode_info *ci;</div><div class='ctx'> 	struct ceph_mount_options *opt = mdsc-&gt;fsc-&gt;mount_options;</div><div class='hunk'>@@ -4269,14 +4614,14 @@ unsigned long ceph_check_delayed_caps(struct ceph_mds_client *mdsc)</div><div class='ctx'> 	unsigned long loop_start = jiffies;</div><div class='ctx'> 	unsigned long delay = 0;</div><div class='ctx'> </div><div class='del'>-	dout("check_delayed_caps\n");</div><div class='add'>+	doutc(cl, "begin\n");</div><div class='ctx'> 	spin_lock(&amp;mdsc-&gt;cap_delay_lock);</div><div class='ctx'> 	while (!list_empty(&amp;mdsc-&gt;cap_delay_list)) {</div><div class='ctx'> 		ci = list_first_entry(&amp;mdsc-&gt;cap_delay_list,</div><div class='ctx'> 				      struct ceph_inode_info,</div><div class='ctx'> 				      i_cap_delay_list);</div><div class='ctx'> 		if (time_before(loop_start, ci-&gt;i_hold_caps_max - delay_max)) {</div><div class='del'>-			dout("%s caps added recently.  Exiting loop", __func__);</div><div class='add'>+			doutc(cl, "caps added recently.  Exiting loop");</div><div class='ctx'> 			delay = ci-&gt;i_hold_caps_max;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -4285,16 +4630,26 @@ unsigned long ceph_check_delayed_caps(struct ceph_mds_client *mdsc)</div><div class='ctx'> 			break;</div><div class='ctx'> 		list_del_init(&amp;ci-&gt;i_cap_delay_list);</div><div class='ctx'> </div><div class='del'>-		inode = igrab(&amp;ci-&gt;vfs_inode);</div><div class='add'>+		inode = igrab(&amp;ci-&gt;netfs.inode);</div><div class='ctx'> 		if (inode) {</div><div class='ctx'> 			spin_unlock(&amp;mdsc-&gt;cap_delay_lock);</div><div class='del'>-			dout("check_delayed_caps on %p\n", inode);</div><div class='del'>-			ceph_check_caps(ci, 0, NULL);</div><div class='add'>+			doutc(cl, "on %p %llx.%llx\n", inode,</div><div class='add'>+			      ceph_vinop(inode));</div><div class='add'>+			ceph_check_caps(ci, 0);</div><div class='ctx'> 			iput(inode);</div><div class='ctx'> 			spin_lock(&amp;mdsc-&gt;cap_delay_lock);</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Make sure too many dirty caps or general</div><div class='add'>+		 * slowness doesn't block mdsc delayed work,</div><div class='add'>+		 * preventing send_renew_caps() from running.</div><div class='add'>+		 */</div><div class='add'>+		if (time_after_eq(jiffies, loop_start + 5 * HZ))</div><div class='add'>+			break;</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;mdsc-&gt;cap_delay_lock);</div><div class='add'>+	doutc(cl, "done\n");</div><div class='ctx'> </div><div class='ctx'> 	return delay;</div><div class='ctx'> }</div><div class='hunk'>@@ -4305,24 +4660,26 @@ unsigned long ceph_check_delayed_caps(struct ceph_mds_client *mdsc)</div><div class='ctx'> static void flush_dirty_session_caps(struct ceph_mds_session *s)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_mds_client *mdsc = s-&gt;s_mdsc;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_inode_info *ci;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> </div><div class='del'>-	dout("flush_dirty_caps\n");</div><div class='add'>+	doutc(cl, "begin\n");</div><div class='ctx'> 	spin_lock(&amp;mdsc-&gt;cap_dirty_lock);</div><div class='ctx'> 	while (!list_empty(&amp;s-&gt;s_cap_dirty)) {</div><div class='ctx'> 		ci = list_first_entry(&amp;s-&gt;s_cap_dirty, struct ceph_inode_info,</div><div class='ctx'> 				      i_dirty_item);</div><div class='del'>-		inode = &amp;ci-&gt;vfs_inode;</div><div class='add'>+		inode = &amp;ci-&gt;netfs.inode;</div><div class='ctx'> 		ihold(inode);</div><div class='del'>-		dout("flush_dirty_caps %p\n", inode);</div><div class='add'>+		doutc(cl, "%p %llx.%llx\n", inode, ceph_vinop(inode));</div><div class='ctx'> 		spin_unlock(&amp;mdsc-&gt;cap_dirty_lock);</div><div class='del'>-		ceph_check_caps(ci, CHECK_CAPS_FLUSH, NULL);</div><div class='add'>+		ceph_wait_on_async_create(inode);</div><div class='add'>+		ceph_check_caps(ci, CHECK_CAPS_FLUSH);</div><div class='ctx'> 		iput(inode);</div><div class='ctx'> 		spin_lock(&amp;mdsc-&gt;cap_dirty_lock);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;mdsc-&gt;cap_dirty_lock);</div><div class='del'>-	dout("flush_dirty_caps done\n");</div><div class='add'>+	doutc(cl, "done\n");</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void ceph_flush_dirty_caps(struct ceph_mds_client *mdsc)</div><div class='hunk'>@@ -4330,6 +4687,28 @@ void ceph_flush_dirty_caps(struct ceph_mds_client *mdsc)</div><div class='ctx'> 	ceph_mdsc_iterate_sessions(mdsc, flush_dirty_session_caps, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Flush all cap releases to the mds</div><div class='add'>+ */</div><div class='add'>+static void flush_cap_releases(struct ceph_mds_session *s)</div><div class='add'>+{</div><div class='add'>+	struct ceph_mds_client *mdsc = s-&gt;s_mdsc;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='add'>+</div><div class='add'>+	doutc(cl, "begin\n");</div><div class='add'>+	spin_lock(&amp;s-&gt;s_cap_lock);</div><div class='add'>+	if (s-&gt;s_num_cap_releases)</div><div class='add'>+		ceph_flush_session_cap_releases(mdsc, s);</div><div class='add'>+	spin_unlock(&amp;s-&gt;s_cap_lock);</div><div class='add'>+	doutc(cl, "done\n");</div><div class='add'>+</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void ceph_flush_cap_releases(struct ceph_mds_client *mdsc)</div><div class='add'>+{</div><div class='add'>+	ceph_mdsc_iterate_sessions(mdsc, flush_cap_releases, true);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> void __ceph_touch_fmode(struct ceph_inode_info *ci,</div><div class='ctx'> 			struct ceph_mds_client *mdsc, int fmode)</div><div class='ctx'> {</div><div class='hunk'>@@ -4347,9 +4726,9 @@ void __ceph_touch_fmode(struct ceph_inode_info *ci,</div><div class='ctx'> </div><div class='ctx'> void ceph_get_fmode(struct ceph_inode_info *ci, int fmode, int count)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_mds_client *mdsc = ceph_sb_to_mdsc(ci-&gt;vfs_inode.i_sb);</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_sb_to_mdsc(ci-&gt;netfs.inode.i_sb);</div><div class='ctx'> 	int bits = (fmode &lt;&lt; 1) | 1;</div><div class='del'>-	bool is_opened = false;</div><div class='add'>+	bool already_opened = false;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='ctx'> 	if (count == 1)</div><div class='hunk'>@@ -4357,19 +4736,19 @@ void ceph_get_fmode(struct ceph_inode_info *ci, int fmode, int count)</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 	for (i = 0; i &lt; CEPH_FILE_MODE_BITS; i++) {</div><div class='del'>-		if (bits &amp; (1 &lt;&lt; i))</div><div class='del'>-			ci-&gt;i_nr_by_mode[i] += count;</div><div class='del'>-</div><div class='ctx'> 		/*</div><div class='del'>-		 * If any of the mode ref is larger than 1,</div><div class='add'>+		 * If any of the mode ref is larger than 0,</div><div class='ctx'> 		 * that means it has been already opened by</div><div class='ctx'> 		 * others. Just skip checking the PIN ref.</div><div class='ctx'> 		 */</div><div class='del'>-		if (i &amp;&amp; ci-&gt;i_nr_by_mode[i] &gt; 1)</div><div class='del'>-			is_opened = true;</div><div class='add'>+		if (i &amp;&amp; ci-&gt;i_nr_by_mode[i])</div><div class='add'>+			already_opened = true;</div><div class='add'>+</div><div class='add'>+		if (bits &amp; (1 &lt;&lt; i))</div><div class='add'>+			ci-&gt;i_nr_by_mode[i] += count;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!is_opened)</div><div class='add'>+	if (!already_opened)</div><div class='ctx'> 		percpu_counter_inc(&amp;mdsc-&gt;metric.opened_inodes);</div><div class='ctx'> 	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> }</div><div class='hunk'>@@ -4381,7 +4760,7 @@ void ceph_get_fmode(struct ceph_inode_info *ci, int fmode, int count)</div><div class='ctx'>  */</div><div class='ctx'> void ceph_put_fmode(struct ceph_inode_info *ci, int fmode, int count)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_mds_client *mdsc = ceph_sb_to_mdsc(ci-&gt;vfs_inode.i_sb);</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_sb_to_mdsc(ci-&gt;netfs.inode.i_sb);</div><div class='ctx'> 	int bits = (fmode &lt;&lt; 1) | 1;</div><div class='ctx'> 	bool is_closed = true;</div><div class='ctx'> 	int i;</div><div class='hunk'>@@ -4427,8 +4806,23 @@ int ceph_drop_caps_for_unlink(struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> 		if (__ceph_caps_dirty(ci)) {</div><div class='ctx'> 			struct ceph_mds_client *mdsc =</div><div class='del'>-				ceph_inode_to_client(inode)-&gt;mdsc;</div><div class='del'>-			__cap_delay_requeue_front(mdsc, ci);</div><div class='add'>+				ceph_inode_to_fs_client(inode)-&gt;mdsc;</div><div class='add'>+</div><div class='add'>+			doutc(mdsc-&gt;fsc-&gt;client, "%p %llx.%llx\n", inode,</div><div class='add'>+			      ceph_vinop(inode));</div><div class='add'>+			spin_lock(&amp;mdsc-&gt;cap_delay_lock);</div><div class='add'>+			ci-&gt;i_ceph_flags |= CEPH_I_FLUSH;</div><div class='add'>+			if (!list_empty(&amp;ci-&gt;i_cap_delay_list))</div><div class='add'>+				list_del_init(&amp;ci-&gt;i_cap_delay_list);</div><div class='add'>+			list_add_tail(&amp;ci-&gt;i_cap_delay_list,</div><div class='add'>+				      &amp;mdsc-&gt;cap_unlink_delay_list);</div><div class='add'>+			spin_unlock(&amp;mdsc-&gt;cap_delay_lock);</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * Fire the work immediately, because the MDS maybe</div><div class='add'>+			 * waiting for caps release.</div><div class='add'>+			 */</div><div class='add'>+			ceph_queue_cap_unlink_work(mdsc);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='hunk'>@@ -4447,6 +4841,7 @@ int ceph_encode_inode_release(void **p, struct inode *inode,</div><div class='ctx'> 			      int mds, int drop, int unless, int force)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_cap *cap;</div><div class='ctx'> 	struct ceph_mds_request_release *rel = *p;</div><div class='ctx'> 	int used, dirty;</div><div class='hunk'>@@ -4456,9 +4851,9 @@ int ceph_encode_inode_release(void **p, struct inode *inode,</div><div class='ctx'> 	used = __ceph_caps_used(ci);</div><div class='ctx'> 	dirty = __ceph_caps_dirty(ci);</div><div class='ctx'> </div><div class='del'>-	dout("encode_inode_release %p mds%d used|dirty %s drop %s unless %s\n",</div><div class='del'>-	     inode, mds, ceph_cap_string(used|dirty), ceph_cap_string(drop),</div><div class='del'>-	     ceph_cap_string(unless));</div><div class='add'>+	doutc(cl, "%p %llx.%llx mds%d used|dirty %s drop %s unless %s\n",</div><div class='add'>+	      inode, ceph_vinop(inode), mds, ceph_cap_string(used|dirty),</div><div class='add'>+	      ceph_cap_string(drop), ceph_cap_string(unless));</div><div class='ctx'> </div><div class='ctx'> 	/* only drop unused, clean caps */</div><div class='ctx'> 	drop &amp;= ~(used | dirty);</div><div class='hunk'>@@ -4480,12 +4875,13 @@ int ceph_encode_inode_release(void **p, struct inode *inode,</div><div class='ctx'> 		if (force || (cap-&gt;issued &amp; drop)) {</div><div class='ctx'> 			if (cap-&gt;issued &amp; drop) {</div><div class='ctx'> 				int wanted = __ceph_caps_wanted(ci);</div><div class='del'>-				dout("encode_inode_release %p cap %p "</div><div class='del'>-				     "%s -&gt; %s, wanted %s -&gt; %s\n", inode, cap,</div><div class='del'>-				     ceph_cap_string(cap-&gt;issued),</div><div class='del'>-				     ceph_cap_string(cap-&gt;issued &amp; ~drop),</div><div class='del'>-				     ceph_cap_string(cap-&gt;mds_wanted),</div><div class='del'>-				     ceph_cap_string(wanted));</div><div class='add'>+				doutc(cl, "%p %llx.%llx cap %p %s -&gt; %s, "</div><div class='add'>+				      "wanted %s -&gt; %s\n", inode,</div><div class='add'>+				      ceph_vinop(inode), cap,</div><div class='add'>+				      ceph_cap_string(cap-&gt;issued),</div><div class='add'>+				      ceph_cap_string(cap-&gt;issued &amp; ~drop),</div><div class='add'>+				      ceph_cap_string(cap-&gt;mds_wanted),</div><div class='add'>+				      ceph_cap_string(wanted));</div><div class='ctx'> </div><div class='ctx'> 				cap-&gt;issued &amp;= ~drop;</div><div class='ctx'> 				cap-&gt;implemented &amp;= ~drop;</div><div class='hunk'>@@ -4494,9 +4890,9 @@ int ceph_encode_inode_release(void **p, struct inode *inode,</div><div class='ctx'> 				    !(wanted &amp; CEPH_CAP_ANY_FILE_WR))</div><div class='ctx'> 					ci-&gt;i_requested_max_size = 0;</div><div class='ctx'> 			} else {</div><div class='del'>-				dout("encode_inode_release %p cap %p %s"</div><div class='del'>-				     " (force)\n", inode, cap,</div><div class='del'>-				     ceph_cap_string(cap-&gt;issued));</div><div class='add'>+				doutc(cl, "%p %llx.%llx cap %p %s (force)\n",</div><div class='add'>+				      inode, ceph_vinop(inode), cap,</div><div class='add'>+				      ceph_cap_string(cap-&gt;issued));</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			rel-&gt;ino = cpu_to_le64(ceph_ino(inode));</div><div class='hunk'>@@ -4511,24 +4907,40 @@ int ceph_encode_inode_release(void **p, struct inode *inode,</div><div class='ctx'> 			*p += sizeof(*rel);</div><div class='ctx'> 			ret = 1;</div><div class='ctx'> 		} else {</div><div class='del'>-			dout("encode_inode_release %p cap %p %s (noop)\n",</div><div class='del'>-			     inode, cap, ceph_cap_string(cap-&gt;issued));</div><div class='add'>+			doutc(cl, "%p %llx.%llx cap %p %s (noop)\n",</div><div class='add'>+			      inode, ceph_vinop(inode), cap,</div><div class='add'>+			      ceph_cap_string(cap-&gt;issued));</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * ceph_encode_dentry_release - encode a dentry release into an outgoing request</div><div class='add'>+ * @p: outgoing request buffer</div><div class='add'>+ * @dentry: dentry to release</div><div class='add'>+ * @dir: dir to release it from</div><div class='add'>+ * @mds: mds that we're speaking to</div><div class='add'>+ * @drop: caps being dropped</div><div class='add'>+ * @unless: unless we have these caps</div><div class='add'>+ *</div><div class='add'>+ * Encode a dentry release into an outgoing request buffer. Returns 1 if the</div><div class='add'>+ * thing was released, or a negative error code otherwise.</div><div class='add'>+ */</div><div class='ctx'> int ceph_encode_dentry_release(void **p, struct dentry *dentry,</div><div class='ctx'> 			       struct inode *dir,</div><div class='ctx'> 			       int mds, int drop, int unless)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *parent = NULL;</div><div class='ctx'> 	struct ceph_mds_request_release *rel = *p;</div><div class='ctx'> 	struct ceph_dentry_info *di = ceph_dentry(dentry);</div><div class='add'>+	struct ceph_client *cl;</div><div class='ctx'> 	int force = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='add'>+	/* This shouldn't happen */</div><div class='add'>+	BUG_ON(!dir);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * force an record for the directory caps if we have a dentry lease.</div><div class='ctx'> 	 * this is racy (can't take i_ceph_lock and d_lock together), but it</div><div class='hunk'>@@ -4538,25 +4950,149 @@ int ceph_encode_dentry_release(void **p, struct dentry *dentry,</div><div class='ctx'> 	spin_lock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 	if (di-&gt;lease_session &amp;&amp; di-&gt;lease_session-&gt;s_mds == mds)</div><div class='ctx'> 		force = 1;</div><div class='del'>-	if (!dir) {</div><div class='del'>-		parent = dget(dentry-&gt;d_parent);</div><div class='del'>-		dir = d_inode(parent);</div><div class='del'>-	}</div><div class='ctx'> 	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> </div><div class='ctx'> 	ret = ceph_encode_inode_release(p, dir, mds, drop, unless, force);</div><div class='del'>-	dput(parent);</div><div class='ctx'> </div><div class='add'>+	cl = ceph_inode_to_client(dir);</div><div class='ctx'> 	spin_lock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 	if (ret &amp;&amp; di-&gt;lease_session &amp;&amp; di-&gt;lease_session-&gt;s_mds == mds) {</div><div class='del'>-		dout("encode_dentry_release %p mds%d seq %d\n",</div><div class='del'>-		     dentry, mds, (int)di-&gt;lease_seq);</div><div class='del'>-		rel-&gt;dname_len = cpu_to_le32(dentry-&gt;d_name.len);</div><div class='del'>-		memcpy(*p, dentry-&gt;d_name.name, dentry-&gt;d_name.len);</div><div class='del'>-		*p += dentry-&gt;d_name.len;</div><div class='add'>+		int len = dentry-&gt;d_name.len;</div><div class='add'>+		doutc(cl, "%p mds%d seq %d\n",  dentry, mds,</div><div class='add'>+		      (int)di-&gt;lease_seq);</div><div class='ctx'> 		rel-&gt;dname_seq = cpu_to_le32(di-&gt;lease_seq);</div><div class='ctx'> 		__ceph_mdsc_drop_dentry_lease(dentry);</div><div class='add'>+		memcpy(*p, dentry-&gt;d_name.name, len);</div><div class='add'>+		spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='add'>+		if (IS_ENCRYPTED(dir) &amp;&amp; fscrypt_has_encryption_key(dir)) {</div><div class='add'>+			len = ceph_encode_encrypted_dname(dir, *p, len);</div><div class='add'>+			if (len &lt; 0)</div><div class='add'>+				return len;</div><div class='add'>+		}</div><div class='add'>+		rel-&gt;dname_len = cpu_to_le32(len);</div><div class='add'>+		*p += len;</div><div class='add'>+	} else {</div><div class='add'>+		spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+static int remove_capsnaps(struct ceph_mds_client *mdsc, struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='add'>+	struct ceph_cap_snap *capsnap;</div><div class='add'>+	int capsnap_release = 0;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+</div><div class='add'>+	doutc(cl, "removing capsnaps, ci is %p, %p %llx.%llx\n",</div><div class='add'>+	      ci, inode, ceph_vinop(inode));</div><div class='add'>+</div><div class='add'>+	while (!list_empty(&amp;ci-&gt;i_cap_snaps)) {</div><div class='add'>+		capsnap = list_first_entry(&amp;ci-&gt;i_cap_snaps,</div><div class='add'>+					   struct ceph_cap_snap, ci_item);</div><div class='add'>+		__ceph_remove_capsnap(inode, capsnap, NULL, NULL);</div><div class='add'>+		ceph_put_snap_context(capsnap-&gt;context);</div><div class='add'>+		ceph_put_cap_snap(capsnap);</div><div class='add'>+		capsnap_release++;</div><div class='add'>+	}</div><div class='add'>+	wake_up_all(&amp;ci-&gt;i_cap_wq);</div><div class='add'>+	wake_up_all(&amp;mdsc-&gt;cap_flushing_wq);</div><div class='add'>+	return capsnap_release;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int ceph_purge_inode_cap(struct inode *inode, struct ceph_cap *cap, bool *invalidate)</div><div class='add'>+{</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='add'>+	struct ceph_mds_client *mdsc = fsc-&gt;mdsc;</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='add'>+	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	bool is_auth;</div><div class='add'>+	bool dirty_dropped = false;</div><div class='add'>+	int iputs = 0;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+</div><div class='add'>+	doutc(cl, "removing cap %p, ci is %p, %p %llx.%llx\n",</div><div class='add'>+	      cap, ci, inode, ceph_vinop(inode));</div><div class='add'>+</div><div class='add'>+	is_auth = (cap == ci-&gt;i_auth_cap);</div><div class='add'>+	__ceph_remove_cap(cap, false);</div><div class='add'>+	if (is_auth) {</div><div class='add'>+		struct ceph_cap_flush *cf;</div><div class='add'>+</div><div class='add'>+		if (ceph_inode_is_shutdown(inode)) {</div><div class='add'>+			if (inode-&gt;i_data.nrpages &gt; 0)</div><div class='add'>+				*invalidate = true;</div><div class='add'>+			if (ci-&gt;i_wrbuffer_ref &gt; 0)</div><div class='add'>+				mapping_set_error(&amp;inode-&gt;i_data, -EIO);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;mdsc-&gt;cap_dirty_lock);</div><div class='add'>+</div><div class='add'>+		/* trash all of the cap flushes for this inode */</div><div class='add'>+		while (!list_empty(&amp;ci-&gt;i_cap_flush_list)) {</div><div class='add'>+			cf = list_first_entry(&amp;ci-&gt;i_cap_flush_list,</div><div class='add'>+					      struct ceph_cap_flush, i_list);</div><div class='add'>+			list_del_init(&amp;cf-&gt;g_list);</div><div class='add'>+			list_del_init(&amp;cf-&gt;i_list);</div><div class='add'>+			if (!cf-&gt;is_capsnap)</div><div class='add'>+				ceph_free_cap_flush(cf);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (!list_empty(&amp;ci-&gt;i_dirty_item)) {</div><div class='add'>+			pr_warn_ratelimited_client(cl,</div><div class='add'>+				" dropping dirty %s state for %p %llx.%llx\n",</div><div class='add'>+				ceph_cap_string(ci-&gt;i_dirty_caps),</div><div class='add'>+				inode, ceph_vinop(inode));</div><div class='add'>+			ci-&gt;i_dirty_caps = 0;</div><div class='add'>+			list_del_init(&amp;ci-&gt;i_dirty_item);</div><div class='add'>+			dirty_dropped = true;</div><div class='add'>+		}</div><div class='add'>+		if (!list_empty(&amp;ci-&gt;i_flushing_item)) {</div><div class='add'>+			pr_warn_ratelimited_client(cl,</div><div class='add'>+				" dropping dirty+flushing %s state for %p %llx.%llx\n",</div><div class='add'>+				ceph_cap_string(ci-&gt;i_flushing_caps),</div><div class='add'>+				inode, ceph_vinop(inode));</div><div class='add'>+			ci-&gt;i_flushing_caps = 0;</div><div class='add'>+			list_del_init(&amp;ci-&gt;i_flushing_item);</div><div class='add'>+			mdsc-&gt;num_cap_flushing--;</div><div class='add'>+			dirty_dropped = true;</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;mdsc-&gt;cap_dirty_lock);</div><div class='add'>+</div><div class='add'>+		if (dirty_dropped) {</div><div class='add'>+			mapping_set_error(inode-&gt;i_mapping, -EIO);</div><div class='add'>+</div><div class='add'>+			if (ci-&gt;i_wrbuffer_ref_head == 0 &amp;&amp;</div><div class='add'>+			    ci-&gt;i_wr_ref == 0 &amp;&amp;</div><div class='add'>+			    ci-&gt;i_dirty_caps == 0 &amp;&amp;</div><div class='add'>+			    ci-&gt;i_flushing_caps == 0) {</div><div class='add'>+				ceph_put_snap_context(ci-&gt;i_head_snapc);</div><div class='add'>+				ci-&gt;i_head_snapc = NULL;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (atomic_read(&amp;ci-&gt;i_filelock_ref) &gt; 0) {</div><div class='add'>+			/* make further file lock syscall return -EIO */</div><div class='add'>+			ci-&gt;i_ceph_flags |= CEPH_I_ERROR_FILELOCK;</div><div class='add'>+			pr_warn_ratelimited_client(cl,</div><div class='add'>+				" dropping file locks for %p %llx.%llx\n",</div><div class='add'>+				inode, ceph_vinop(inode));</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (!ci-&gt;i_dirty_caps &amp;&amp; ci-&gt;i_prealloc_cap_flush) {</div><div class='add'>+			cf = ci-&gt;i_prealloc_cap_flush;</div><div class='add'>+			ci-&gt;i_prealloc_cap_flush = NULL;</div><div class='add'>+			if (!cf-&gt;is_capsnap)</div><div class='add'>+				ceph_free_cap_flush(cf);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (!list_empty(&amp;ci-&gt;i_cap_snaps))</div><div class='add'>+			iputs = remove_capsnaps(mdsc, inode);</div><div class='add'>+	}</div><div class='add'>+	if (dirty_dropped)</div><div class='add'>+		++iputs;</div><div class='add'>+	return iputs;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/ceph/crypto.c b/fs/ceph/crypto.c<br/>new file mode 100644<br/>index 000000000000..0ea4db650f85<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/crypto.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/crypto.c</a></div><div class='hunk'>@@ -0,0 +1,604 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+/*</div><div class='add'>+ * The base64 encode/decode code was copied from fscrypt:</div><div class='add'>+ * Copyright (C) 2015, Google, Inc.</div><div class='add'>+ * Copyright (C) 2015, Motorola Mobility</div><div class='add'>+ * Written by Uday Savagaonkar, 2014.</div><div class='add'>+ * Modified by Jaegeuk Kim, 2015.</div><div class='add'>+ */</div><div class='add'>+#include &lt;linux/ceph/ceph_debug.h&gt;</div><div class='add'>+#include &lt;linux/xattr.h&gt;</div><div class='add'>+#include &lt;linux/fscrypt.h&gt;</div><div class='add'>+#include &lt;linux/ceph/striper.h&gt;</div><div class='add'>+</div><div class='add'>+#include "super.h"</div><div class='add'>+#include "mds_client.h"</div><div class='add'>+#include "crypto.h"</div><div class='add'>+</div><div class='add'>+static int ceph_crypt_get_context(struct inode *inode, void *ctx, size_t len)</div><div class='add'>+{</div><div class='add'>+	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	struct ceph_fscrypt_auth *cfa = (struct ceph_fscrypt_auth *)ci-&gt;fscrypt_auth;</div><div class='add'>+	u32 ctxlen;</div><div class='add'>+</div><div class='add'>+	/* Non existent or too short? */</div><div class='add'>+	if (!cfa || (ci-&gt;fscrypt_auth_len &lt; (offsetof(struct ceph_fscrypt_auth, cfa_blob) + 1)))</div><div class='add'>+		return -ENOBUFS;</div><div class='add'>+</div><div class='add'>+	/* Some format we don't recognize? */</div><div class='add'>+	if (le32_to_cpu(cfa-&gt;cfa_version) != CEPH_FSCRYPT_AUTH_VERSION)</div><div class='add'>+		return -ENOBUFS;</div><div class='add'>+</div><div class='add'>+	ctxlen = le32_to_cpu(cfa-&gt;cfa_blob_len);</div><div class='add'>+	if (len &lt; ctxlen)</div><div class='add'>+		return -ERANGE;</div><div class='add'>+</div><div class='add'>+	memcpy(ctx, cfa-&gt;cfa_blob, ctxlen);</div><div class='add'>+	return ctxlen;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ceph_crypt_set_context(struct inode *inode, const void *ctx,</div><div class='add'>+				  size_t len, void *fs_data)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+	struct iattr attr = { };</div><div class='add'>+	struct ceph_iattr cia = { };</div><div class='add'>+	struct ceph_fscrypt_auth *cfa;</div><div class='add'>+</div><div class='add'>+	WARN_ON_ONCE(fs_data);</div><div class='add'>+</div><div class='add'>+	if (len &gt; FSCRYPT_SET_CONTEXT_MAX_SIZE)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	cfa = kzalloc(sizeof(*cfa), GFP_KERNEL);</div><div class='add'>+	if (!cfa)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	cfa-&gt;cfa_version = cpu_to_le32(CEPH_FSCRYPT_AUTH_VERSION);</div><div class='add'>+	cfa-&gt;cfa_blob_len = cpu_to_le32(len);</div><div class='add'>+	memcpy(cfa-&gt;cfa_blob, ctx, len);</div><div class='add'>+</div><div class='add'>+	cia.fscrypt_auth = cfa;</div><div class='add'>+</div><div class='add'>+	ret = __ceph_setattr(&amp;nop_mnt_idmap, inode, &amp;attr, &amp;cia);</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		inode_set_flags(inode, S_ENCRYPTED, S_ENCRYPTED);</div><div class='add'>+	kfree(cia.fscrypt_auth);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool ceph_crypt_empty_dir(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+</div><div class='add'>+	return ci-&gt;i_rsubdirs + ci-&gt;i_rfiles == 1;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const union fscrypt_policy *ceph_get_dummy_policy(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	return ceph_sb_to_fs_client(sb)-&gt;fsc_dummy_enc_policy.policy;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct fscrypt_operations ceph_fscrypt_ops = {</div><div class='add'>+	.inode_info_offs	= (int)offsetof(struct ceph_inode_info, i_crypt_info) -</div><div class='add'>+				  (int)offsetof(struct ceph_inode_info, netfs.inode),</div><div class='add'>+	.needs_bounce_pages	= 1,</div><div class='add'>+	.get_context		= ceph_crypt_get_context,</div><div class='add'>+	.set_context		= ceph_crypt_set_context,</div><div class='add'>+	.get_dummy_policy	= ceph_get_dummy_policy,</div><div class='add'>+	.empty_dir		= ceph_crypt_empty_dir,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+void ceph_fscrypt_set_ops(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	fscrypt_set_ops(sb, &amp;ceph_fscrypt_ops);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void ceph_fscrypt_free_dummy_policy(struct ceph_fs_client *fsc)</div><div class='add'>+{</div><div class='add'>+	fscrypt_free_dummy_policy(&amp;fsc-&gt;fsc_dummy_enc_policy);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int ceph_fscrypt_prepare_context(struct inode *dir, struct inode *inode,</div><div class='add'>+				 struct ceph_acl_sec_ctx *as)</div><div class='add'>+{</div><div class='add'>+	int ret, ctxsize;</div><div class='add'>+	bool encrypted = false;</div><div class='add'>+	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+</div><div class='add'>+	ret = fscrypt_prepare_new_inode(dir, inode, &amp;encrypted);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+	if (!encrypted)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	as-&gt;fscrypt_auth = kzalloc(sizeof(*as-&gt;fscrypt_auth), GFP_KERNEL);</div><div class='add'>+	if (!as-&gt;fscrypt_auth)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	ctxsize = fscrypt_context_for_new_inode(as-&gt;fscrypt_auth-&gt;cfa_blob,</div><div class='add'>+						inode);</div><div class='add'>+	if (ctxsize &lt; 0)</div><div class='add'>+		return ctxsize;</div><div class='add'>+</div><div class='add'>+	as-&gt;fscrypt_auth-&gt;cfa_version = cpu_to_le32(CEPH_FSCRYPT_AUTH_VERSION);</div><div class='add'>+	as-&gt;fscrypt_auth-&gt;cfa_blob_len = cpu_to_le32(ctxsize);</div><div class='add'>+</div><div class='add'>+	WARN_ON_ONCE(ci-&gt;fscrypt_auth);</div><div class='add'>+	kfree(ci-&gt;fscrypt_auth);</div><div class='add'>+	ci-&gt;fscrypt_auth_len = ceph_fscrypt_auth_len(as-&gt;fscrypt_auth);</div><div class='add'>+	ci-&gt;fscrypt_auth = kmemdup(as-&gt;fscrypt_auth, ci-&gt;fscrypt_auth_len,</div><div class='add'>+				   GFP_KERNEL);</div><div class='add'>+	if (!ci-&gt;fscrypt_auth)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	inode-&gt;i_flags |= S_ENCRYPTED;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void ceph_fscrypt_as_ctx_to_req(struct ceph_mds_request *req,</div><div class='add'>+				struct ceph_acl_sec_ctx *as)</div><div class='add'>+{</div><div class='add'>+	swap(req-&gt;r_fscrypt_auth, as-&gt;fscrypt_auth);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * User-created snapshots can't start with '_'.  Snapshots that start with this</div><div class='add'>+ * character are special (hint: there aren't real snapshots) and use the</div><div class='add'>+ * following format:</div><div class='add'>+ *</div><div class='add'>+ *   _&lt;SNAPSHOT-NAME&gt;_&lt;INODE-NUMBER&gt;</div><div class='add'>+ *</div><div class='add'>+ * where:</div><div class='add'>+ *  - &lt;SNAPSHOT-NAME&gt; - the real snapshot name that may need to be decrypted,</div><div class='add'>+ *  - &lt;INODE-NUMBER&gt; - the inode number (in decimal) for the actual snapshot</div><div class='add'>+ *</div><div class='add'>+ * This function parses these snapshot names and returns the inode</div><div class='add'>+ * &lt;INODE-NUMBER&gt;.  'name_len' will also bet set with the &lt;SNAPSHOT-NAME&gt;</div><div class='add'>+ * length.</div><div class='add'>+ */</div><div class='add'>+static struct inode *parse_longname(const struct inode *parent,</div><div class='add'>+				    const char *name, int *name_len)</div><div class='add'>+{</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(parent);</div><div class='add'>+	struct inode *dir = NULL;</div><div class='add'>+	struct ceph_vino vino = { .snap = CEPH_NOSNAP };</div><div class='add'>+	char *name_end, *inode_number;</div><div class='add'>+	int ret = -EIO;</div><div class='add'>+	/* NUL-terminate */</div><div class='add'>+	char *str __free(kfree) = kmemdup_nul(name, *name_len, GFP_KERNEL);</div><div class='add'>+	if (!str)</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+	/* Skip initial '_' */</div><div class='add'>+	str++;</div><div class='add'>+	name_end = strrchr(str, '_');</div><div class='add'>+	if (!name_end) {</div><div class='add'>+		doutc(cl, "failed to parse long snapshot name: %s\n", str);</div><div class='add'>+		return ERR_PTR(-EIO);</div><div class='add'>+	}</div><div class='add'>+	*name_len = (name_end - str);</div><div class='add'>+	if (*name_len &lt;= 0) {</div><div class='add'>+		pr_err_client(cl, "failed to parse long snapshot name\n");</div><div class='add'>+		return ERR_PTR(-EIO);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Get the inode number */</div><div class='add'>+	inode_number = name_end + 1;</div><div class='add'>+	ret = kstrtou64(inode_number, 10, &amp;vino.ino);</div><div class='add'>+	if (ret) {</div><div class='add'>+		doutc(cl, "failed to parse inode number: %s\n", str);</div><div class='add'>+		return ERR_PTR(ret);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* And finally the inode */</div><div class='add'>+	dir = ceph_find_inode(parent-&gt;i_sb, vino);</div><div class='add'>+	if (!dir) {</div><div class='add'>+		/* This can happen if we're not mounting cephfs on the root */</div><div class='add'>+		dir = ceph_get_inode(parent-&gt;i_sb, vino, NULL);</div><div class='add'>+		if (IS_ERR(dir))</div><div class='add'>+			doutc(cl, "can't find inode %s (%s)\n", inode_number, name);</div><div class='add'>+	}</div><div class='add'>+	return dir;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int ceph_encode_encrypted_dname(struct inode *parent, char *buf, int elen)</div><div class='add'>+{</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(parent);</div><div class='add'>+	struct inode *dir = parent;</div><div class='add'>+	char *p = buf;</div><div class='add'>+	u32 len;</div><div class='add'>+	int name_len = elen;</div><div class='add'>+	int ret;</div><div class='add'>+	u8 *cryptbuf = NULL;</div><div class='add'>+</div><div class='add'>+	/* Handle the special case of snapshot names that start with '_' */</div><div class='add'>+	if (ceph_snap(dir) == CEPH_SNAPDIR &amp;&amp; *p == '_') {</div><div class='add'>+		dir = parse_longname(parent, p, &amp;name_len);</div><div class='add'>+		if (IS_ERR(dir))</div><div class='add'>+			return PTR_ERR(dir);</div><div class='add'>+		p++; /* skip initial '_' */</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!fscrypt_has_encryption_key(dir))</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Convert cleartext d_name to ciphertext. If result is longer than</div><div class='add'>+	 * CEPH_NOHASH_NAME_MAX, sha256 the remaining bytes</div><div class='add'>+	 *</div><div class='add'>+	 * See: fscrypt_setup_filename</div><div class='add'>+	 */</div><div class='add'>+	if (!fscrypt_fname_encrypted_size(dir, name_len, NAME_MAX, &amp;len)) {</div><div class='add'>+		elen = -ENAMETOOLONG;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Allocate a buffer appropriate to hold the result */</div><div class='add'>+	cryptbuf = kmalloc(len &gt; CEPH_NOHASH_NAME_MAX ? NAME_MAX : len,</div><div class='add'>+			   GFP_KERNEL);</div><div class='add'>+	if (!cryptbuf) {</div><div class='add'>+		elen = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = fscrypt_fname_encrypt(dir,</div><div class='add'>+				    &amp;(struct qstr)QSTR_INIT(p, name_len),</div><div class='add'>+				    cryptbuf, len);</div><div class='add'>+	if (ret) {</div><div class='add'>+		elen = ret;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* hash the end if the name is long enough */</div><div class='add'>+	if (len &gt; CEPH_NOHASH_NAME_MAX) {</div><div class='add'>+		u8 hash[SHA256_DIGEST_SIZE];</div><div class='add'>+		u8 *extra = cryptbuf + CEPH_NOHASH_NAME_MAX;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * hash the extra bytes and overwrite crypttext beyond that</div><div class='add'>+		 * point with it</div><div class='add'>+		 */</div><div class='add'>+		sha256(extra, len - CEPH_NOHASH_NAME_MAX, hash);</div><div class='add'>+		memcpy(extra, hash, SHA256_DIGEST_SIZE);</div><div class='add'>+		len = CEPH_NOHASH_NAME_MAX + SHA256_DIGEST_SIZE;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* base64 encode the encrypted name */</div><div class='add'>+	elen = base64_encode(cryptbuf, len, p, false, BASE64_IMAP);</div><div class='add'>+	doutc(cl, "base64-encoded ciphertext name = %.*s\n", elen, p);</div><div class='add'>+</div><div class='add'>+	/* To understand the 240 limit, see CEPH_NOHASH_NAME_MAX comments */</div><div class='add'>+	WARN_ON(elen &gt; 240);</div><div class='add'>+	if (dir != parent) // leading _ is already there; append _&lt;inum&gt;</div><div class='add'>+		elen += 1 + sprintf(p + elen, "_%ld", dir-&gt;i_ino);</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	kfree(cryptbuf);</div><div class='add'>+	if (dir != parent) {</div><div class='add'>+		if ((inode_state_read_once(dir) &amp; I_NEW))</div><div class='add'>+			discard_new_inode(dir);</div><div class='add'>+		else</div><div class='add'>+			iput(dir);</div><div class='add'>+	}</div><div class='add'>+	return elen;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * ceph_fname_to_usr - convert a filename for userland presentation</div><div class='add'>+ * @fname: ceph_fname to be converted</div><div class='add'>+ * @tname: temporary name buffer to use for conversion (may be NULL)</div><div class='add'>+ * @oname: where converted name should be placed</div><div class='add'>+ * @is_nokey: set to true if key wasn't available during conversion (may be NULL)</div><div class='add'>+ *</div><div class='add'>+ * Given a filename (usually from the MDS), format it for presentation to</div><div class='add'>+ * userland. If @parent is not encrypted, just pass it back as-is.</div><div class='add'>+ *</div><div class='add'>+ * Otherwise, base64 decode the string, and then ask fscrypt to format it</div><div class='add'>+ * for userland presentation.</div><div class='add'>+ *</div><div class='add'>+ * Returns 0 on success or negative error code on error.</div><div class='add'>+ */</div><div class='add'>+int ceph_fname_to_usr(const struct ceph_fname *fname, struct fscrypt_str *tname,</div><div class='add'>+		      struct fscrypt_str *oname, bool *is_nokey)</div><div class='add'>+{</div><div class='add'>+	struct inode *dir = fname-&gt;dir;</div><div class='add'>+	struct fscrypt_str _tname = FSTR_INIT(NULL, 0);</div><div class='add'>+	struct fscrypt_str iname;</div><div class='add'>+	char *name = fname-&gt;name;</div><div class='add'>+	int name_len = fname-&gt;name_len;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	/* Sanity check that the resulting name will fit in the buffer */</div><div class='add'>+	if (fname-&gt;name_len &gt; NAME_MAX || fname-&gt;ctext_len &gt; NAME_MAX)</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	/* Handle the special case of snapshot names that start with '_' */</div><div class='add'>+	if ((ceph_snap(dir) == CEPH_SNAPDIR) &amp;&amp; (name_len &gt; 0) &amp;&amp;</div><div class='add'>+	    (name[0] == '_')) {</div><div class='add'>+		dir = parse_longname(dir, name, &amp;name_len);</div><div class='add'>+		if (IS_ERR(dir))</div><div class='add'>+			return PTR_ERR(dir);</div><div class='add'>+		name++; /* skip initial '_' */</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!IS_ENCRYPTED(dir)) {</div><div class='add'>+		oname-&gt;name = fname-&gt;name;</div><div class='add'>+		oname-&gt;len = fname-&gt;name_len;</div><div class='add'>+		ret = 0;</div><div class='add'>+		goto out_inode;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = ceph_fscrypt_prepare_readdir(dir);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_inode;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Use the raw dentry name as sent by the MDS instead of</div><div class='add'>+	 * generating a nokey name via fscrypt.</div><div class='add'>+	 */</div><div class='add'>+	if (!fscrypt_has_encryption_key(dir)) {</div><div class='add'>+		if (fname-&gt;no_copy)</div><div class='add'>+			oname-&gt;name = fname-&gt;name;</div><div class='add'>+		else</div><div class='add'>+			memcpy(oname-&gt;name, fname-&gt;name, fname-&gt;name_len);</div><div class='add'>+		oname-&gt;len = fname-&gt;name_len;</div><div class='add'>+		if (is_nokey)</div><div class='add'>+			*is_nokey = true;</div><div class='add'>+		ret = 0;</div><div class='add'>+		goto out_inode;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (fname-&gt;ctext_len == 0) {</div><div class='add'>+		int declen;</div><div class='add'>+</div><div class='add'>+		if (!tname) {</div><div class='add'>+			ret = fscrypt_fname_alloc_buffer(NAME_MAX, &amp;_tname);</div><div class='add'>+			if (ret)</div><div class='add'>+				goto out_inode;</div><div class='add'>+			tname = &amp;_tname;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		declen = base64_decode(name, name_len,</div><div class='add'>+				       tname-&gt;name, false, BASE64_IMAP);</div><div class='add'>+		if (declen &lt;= 0) {</div><div class='add'>+			ret = -EIO;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		iname.name = tname-&gt;name;</div><div class='add'>+		iname.len = declen;</div><div class='add'>+	} else {</div><div class='add'>+		iname.name = fname-&gt;ctext;</div><div class='add'>+		iname.len = fname-&gt;ctext_len;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = fscrypt_fname_disk_to_usr(dir, 0, 0, &amp;iname, oname);</div><div class='add'>+	if (!ret &amp;&amp; (dir != fname-&gt;dir)) {</div><div class='add'>+		char tmp_buf[BASE64_CHARS(NAME_MAX)];</div><div class='add'>+</div><div class='add'>+		name_len = snprintf(tmp_buf, sizeof(tmp_buf), "_%.*s_%ld",</div><div class='add'>+				    oname-&gt;len, oname-&gt;name, dir-&gt;i_ino);</div><div class='add'>+		memcpy(oname-&gt;name, tmp_buf, name_len);</div><div class='add'>+		oname-&gt;len = name_len;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	fscrypt_fname_free_buffer(&amp;_tname);</div><div class='add'>+out_inode:</div><div class='add'>+	if (dir != fname-&gt;dir) {</div><div class='add'>+		if ((inode_state_read_once(dir) &amp; I_NEW))</div><div class='add'>+			discard_new_inode(dir);</div><div class='add'>+		else</div><div class='add'>+			iput(dir);</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * ceph_fscrypt_prepare_readdir - simple __fscrypt_prepare_readdir() wrapper</div><div class='add'>+ * @dir: directory inode for readdir prep</div><div class='add'>+ *</div><div class='add'>+ * Simple wrapper around __fscrypt_prepare_readdir() that will mark directory as</div><div class='add'>+ * non-complete if this call results in having the directory unlocked.</div><div class='add'>+ *</div><div class='add'>+ * Returns:</div><div class='add'>+ *     1 - if directory was locked and key is now loaded (i.e. dir is unlocked)</div><div class='add'>+ *     0 - if directory is still locked</div><div class='add'>+ *   &lt; 0 - if __fscrypt_prepare_readdir() fails</div><div class='add'>+ */</div><div class='add'>+int ceph_fscrypt_prepare_readdir(struct inode *dir)</div><div class='add'>+{</div><div class='add'>+	bool had_key = fscrypt_has_encryption_key(dir);</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	if (!IS_ENCRYPTED(dir))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	err = __fscrypt_prepare_readdir(dir);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+	if (!had_key &amp;&amp; fscrypt_has_encryption_key(dir)) {</div><div class='add'>+		/* directory just got unlocked, mark it as not complete */</div><div class='add'>+		ceph_dir_clear_complete(dir);</div><div class='add'>+		return 1;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int ceph_fscrypt_decrypt_block_inplace(const struct inode *inode,</div><div class='add'>+				  struct page *page, unsigned int len,</div><div class='add'>+				  unsigned int offs, u64 lblk_num)</div><div class='add'>+{</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='add'>+</div><div class='add'>+	doutc(cl, "%p %llx.%llx len %u offs %u blk %llu\n", inode,</div><div class='add'>+	      ceph_vinop(inode), len, offs, lblk_num);</div><div class='add'>+	return fscrypt_decrypt_block_inplace(inode, page, len, offs, lblk_num);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int ceph_fscrypt_encrypt_block_inplace(const struct inode *inode,</div><div class='add'>+				  struct page *page, unsigned int len,</div><div class='add'>+				  unsigned int offs, u64 lblk_num)</div><div class='add'>+{</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='add'>+</div><div class='add'>+	doutc(cl, "%p %llx.%llx len %u offs %u blk %llu\n", inode,</div><div class='add'>+	      ceph_vinop(inode), len, offs, lblk_num);</div><div class='add'>+	return fscrypt_encrypt_block_inplace(inode, page, len, offs, lblk_num);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * ceph_fscrypt_decrypt_pages - decrypt an array of pages</div><div class='add'>+ * @inode: pointer to inode associated with these pages</div><div class='add'>+ * @page: pointer to page array</div><div class='add'>+ * @off: offset into the file that the read data starts</div><div class='add'>+ * @len: max length to decrypt</div><div class='add'>+ *</div><div class='add'>+ * Decrypt an array of fscrypt'ed pages and return the amount of</div><div class='add'>+ * data decrypted. Any data in the page prior to the start of the</div><div class='add'>+ * first complete block in the read is ignored. Any incomplete</div><div class='add'>+ * crypto blocks at the end of the array are ignored (and should</div><div class='add'>+ * probably be zeroed by the caller).</div><div class='add'>+ *</div><div class='add'>+ * Returns the length of the decrypted data or a negative errno.</div><div class='add'>+ */</div><div class='add'>+int ceph_fscrypt_decrypt_pages(struct inode *inode, struct page **page,</div><div class='add'>+			       u64 off, int len)</div><div class='add'>+{</div><div class='add'>+	int i, num_blocks;</div><div class='add'>+	u64 baseblk = off &gt;&gt; CEPH_FSCRYPT_BLOCK_SHIFT;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We can't deal with partial blocks on an encrypted file, so mask off</div><div class='add'>+	 * the last bit.</div><div class='add'>+	 */</div><div class='add'>+	num_blocks = ceph_fscrypt_blocks(off, len &amp; CEPH_FSCRYPT_BLOCK_MASK);</div><div class='add'>+</div><div class='add'>+	/* Decrypt each block */</div><div class='add'>+	for (i = 0; i &lt; num_blocks; ++i) {</div><div class='add'>+		int blkoff = i &lt;&lt; CEPH_FSCRYPT_BLOCK_SHIFT;</div><div class='add'>+		int pgidx = blkoff &gt;&gt; PAGE_SHIFT;</div><div class='add'>+		unsigned int pgoffs = offset_in_page(blkoff);</div><div class='add'>+		int fret;</div><div class='add'>+</div><div class='add'>+		fret = ceph_fscrypt_decrypt_block_inplace(inode, page[pgidx],</div><div class='add'>+				CEPH_FSCRYPT_BLOCK_SIZE, pgoffs,</div><div class='add'>+				baseblk + i);</div><div class='add'>+		if (fret &lt; 0) {</div><div class='add'>+			if (ret == 0)</div><div class='add'>+				ret = fret;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		ret += CEPH_FSCRYPT_BLOCK_SIZE;</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * ceph_fscrypt_decrypt_extents: decrypt received extents in given buffer</div><div class='add'>+ * @inode: inode associated with pages being decrypted</div><div class='add'>+ * @page: pointer to page array</div><div class='add'>+ * @off: offset into the file that the data in page[0] starts</div><div class='add'>+ * @map: pointer to extent array</div><div class='add'>+ * @ext_cnt: length of extent array</div><div class='add'>+ *</div><div class='add'>+ * Given an extent map and a page array, decrypt the received data in-place,</div><div class='add'>+ * skipping holes. Returns the offset into buffer of end of last decrypted</div><div class='add'>+ * block.</div><div class='add'>+ */</div><div class='add'>+int ceph_fscrypt_decrypt_extents(struct inode *inode, struct page **page,</div><div class='add'>+				 u64 off, struct ceph_sparse_extent *map,</div><div class='add'>+				 u32 ext_cnt)</div><div class='add'>+{</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='add'>+	int i, ret = 0;</div><div class='add'>+	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	u64 objno, objoff;</div><div class='add'>+	u32 xlen;</div><div class='add'>+</div><div class='add'>+	/* Nothing to do for empty array */</div><div class='add'>+	if (ext_cnt == 0) {</div><div class='add'>+		doutc(cl, "%p %llx.%llx empty array, ret 0\n", inode,</div><div class='add'>+		      ceph_vinop(inode));</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ceph_calc_file_object_mapping(&amp;ci-&gt;i_layout, off, map[0].len,</div><div class='add'>+				      &amp;objno, &amp;objoff, &amp;xlen);</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; ext_cnt; ++i) {</div><div class='add'>+		struct ceph_sparse_extent *ext = &amp;map[i];</div><div class='add'>+		int pgsoff = ext-&gt;off - objoff;</div><div class='add'>+		int pgidx = pgsoff &gt;&gt; PAGE_SHIFT;</div><div class='add'>+		int fret;</div><div class='add'>+</div><div class='add'>+		if ((ext-&gt;off | ext-&gt;len) &amp; ~CEPH_FSCRYPT_BLOCK_MASK) {</div><div class='add'>+			pr_warn_client(cl,</div><div class='add'>+				"%p %llx.%llx bad encrypted sparse extent "</div><div class='add'>+				"idx %d off %llx len %llx\n",</div><div class='add'>+				inode, ceph_vinop(inode), i, ext-&gt;off,</div><div class='add'>+				ext-&gt;len);</div><div class='add'>+			return -EIO;</div><div class='add'>+		}</div><div class='add'>+		fret = ceph_fscrypt_decrypt_pages(inode, &amp;page[pgidx],</div><div class='add'>+						 off + pgsoff, ext-&gt;len);</div><div class='add'>+		doutc(cl, "%p %llx.%llx [%d] 0x%llx~0x%llx fret %d\n", inode,</div><div class='add'>+		      ceph_vinop(inode), i, ext-&gt;off, ext-&gt;len, fret);</div><div class='add'>+		if (fret &lt; 0) {</div><div class='add'>+			if (ret == 0)</div><div class='add'>+				ret = fret;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		ret = pgsoff + fret;</div><div class='add'>+	}</div><div class='add'>+	doutc(cl, "ret %d\n", ret);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * ceph_fscrypt_encrypt_pages - encrypt an array of pages</div><div class='add'>+ * @inode: pointer to inode associated with these pages</div><div class='add'>+ * @page: pointer to page array</div><div class='add'>+ * @off: offset into the file that the data starts</div><div class='add'>+ * @len: max length to encrypt</div><div class='add'>+ *</div><div class='add'>+ * Encrypt an array of cleartext pages and return the amount of</div><div class='add'>+ * data encrypted. Any data in the page prior to the start of the</div><div class='add'>+ * first complete block in the read is ignored. Any incomplete</div><div class='add'>+ * crypto blocks at the end of the array are ignored.</div><div class='add'>+ *</div><div class='add'>+ * Returns the length of the encrypted data or a negative errno.</div><div class='add'>+ */</div><div class='add'>+int ceph_fscrypt_encrypt_pages(struct inode *inode, struct page **page, u64 off,</div><div class='add'>+				int len)</div><div class='add'>+{</div><div class='add'>+	int i, num_blocks;</div><div class='add'>+	u64 baseblk = off &gt;&gt; CEPH_FSCRYPT_BLOCK_SHIFT;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We can't deal with partial blocks on an encrypted file, so mask off</div><div class='add'>+	 * the last bit.</div><div class='add'>+	 */</div><div class='add'>+	num_blocks = ceph_fscrypt_blocks(off, len &amp; CEPH_FSCRYPT_BLOCK_MASK);</div><div class='add'>+</div><div class='add'>+	/* Encrypt each block */</div><div class='add'>+	for (i = 0; i &lt; num_blocks; ++i) {</div><div class='add'>+		int blkoff = i &lt;&lt; CEPH_FSCRYPT_BLOCK_SHIFT;</div><div class='add'>+		int pgidx = blkoff &gt;&gt; PAGE_SHIFT;</div><div class='add'>+		unsigned int pgoffs = offset_in_page(blkoff);</div><div class='add'>+		int fret;</div><div class='add'>+</div><div class='add'>+		fret = ceph_fscrypt_encrypt_block_inplace(inode, page[pgidx],</div><div class='add'>+				CEPH_FSCRYPT_BLOCK_SIZE, pgoffs,</div><div class='add'>+				baseblk + i);</div><div class='add'>+		if (fret &lt; 0) {</div><div class='add'>+			if (ret == 0)</div><div class='add'>+				ret = fret;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		ret += CEPH_FSCRYPT_BLOCK_SIZE;</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/ceph/crypto.h b/fs/ceph/crypto.h<br/>new file mode 100644<br/>index 000000000000..b748e2060bc9<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/crypto.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/crypto.h</a></div><div class='hunk'>@@ -0,0 +1,272 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+/*</div><div class='add'>+ * Ceph fscrypt functionality</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#ifndef _CEPH_CRYPTO_H</div><div class='add'>+#define _CEPH_CRYPTO_H</div><div class='add'>+</div><div class='add'>+#include &lt;crypto/sha2.h&gt;</div><div class='add'>+#include &lt;linux/fscrypt.h&gt;</div><div class='add'>+#include &lt;linux/base64.h&gt;</div><div class='add'>+</div><div class='add'>+#define CEPH_FSCRYPT_BLOCK_SHIFT   12</div><div class='add'>+#define CEPH_FSCRYPT_BLOCK_SIZE    (_AC(1, UL) &lt;&lt; CEPH_FSCRYPT_BLOCK_SHIFT)</div><div class='add'>+#define CEPH_FSCRYPT_BLOCK_MASK	   (~(CEPH_FSCRYPT_BLOCK_SIZE-1))</div><div class='add'>+</div><div class='add'>+struct ceph_fs_client;</div><div class='add'>+struct ceph_acl_sec_ctx;</div><div class='add'>+struct ceph_mds_request;</div><div class='add'>+</div><div class='add'>+struct ceph_fname {</div><div class='add'>+	struct inode	*dir;</div><div class='add'>+	char		*name;		// b64 encoded, possibly hashed</div><div class='add'>+	unsigned char	*ctext;		// binary crypttext (if any)</div><div class='add'>+	u32		name_len;	// length of name buffer</div><div class='add'>+	u32		ctext_len;	// length of crypttext</div><div class='add'>+	bool		no_copy;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Header for the encrypted file when truncating the size, this</div><div class='add'>+ * will be sent to MDS, and the MDS will update the encrypted</div><div class='add'>+ * last block and then truncate the size.</div><div class='add'>+ */</div><div class='add'>+struct ceph_fscrypt_truncate_size_header {</div><div class='add'>+	__u8  ver;</div><div class='add'>+	__u8  compat;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * It will be sizeof(assert_ver + file_offset + block_size)</div><div class='add'>+	 * if the last block is empty when it's located in a file</div><div class='add'>+	 * hole. Or the data_len will plus CEPH_FSCRYPT_BLOCK_SIZE.</div><div class='add'>+	 */</div><div class='add'>+	__le32 data_len;</div><div class='add'>+</div><div class='add'>+	__le64 change_attr;</div><div class='add'>+	__le64 file_offset;</div><div class='add'>+	__le32 block_size;</div><div class='add'>+} __packed;</div><div class='add'>+</div><div class='add'>+struct ceph_fscrypt_auth {</div><div class='add'>+	__le32	cfa_version;</div><div class='add'>+	__le32	cfa_blob_len;</div><div class='add'>+	u8	cfa_blob[FSCRYPT_SET_CONTEXT_MAX_SIZE];</div><div class='add'>+} __packed;</div><div class='add'>+</div><div class='add'>+#define CEPH_FSCRYPT_AUTH_VERSION	1</div><div class='add'>+static inline u32 ceph_fscrypt_auth_len(struct ceph_fscrypt_auth *fa)</div><div class='add'>+{</div><div class='add'>+	u32 ctxsize = le32_to_cpu(fa-&gt;cfa_blob_len);</div><div class='add'>+</div><div class='add'>+	return offsetof(struct ceph_fscrypt_auth, cfa_blob) + ctxsize;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_FS_ENCRYPTION</div><div class='add'>+/*</div><div class='add'>+ * We want to encrypt filenames when creating them, but the encrypted</div><div class='add'>+ * versions of those names may have illegal characters in them. To mitigate</div><div class='add'>+ * that, we base64 encode them, but that gives us a result that can exceed</div><div class='add'>+ * NAME_MAX.</div><div class='add'>+ *</div><div class='add'>+ * Follow a similar scheme to fscrypt itself, and cap the filename to a</div><div class='add'>+ * smaller size. If the ciphertext name is longer than the value below, then</div><div class='add'>+ * sha256 hash the remaining bytes.</div><div class='add'>+ *</div><div class='add'>+ * For the fscrypt_nokey_name struct the dirhash[2] member is useless in ceph</div><div class='add'>+ * so the corresponding struct will be:</div><div class='add'>+ *</div><div class='add'>+ * struct fscrypt_ceph_nokey_name {</div><div class='add'>+ *	u8 bytes[157];</div><div class='add'>+ *	u8 sha256[SHA256_DIGEST_SIZE];</div><div class='add'>+ * }; // 180 bytes =&gt; 240 bytes base64-encoded, which is &lt;= NAME_MAX (255)</div><div class='add'>+ *</div><div class='add'>+ * (240 bytes is the maximum size allowed for snapshot names to take into</div><div class='add'>+ *  account the format: '_&lt;SNAPSHOT-NAME&gt;_&lt;INODE-NUMBER&gt;'.)</div><div class='add'>+ *</div><div class='add'>+ * Note that for long names that end up having their tail portion hashed, we</div><div class='add'>+ * must also store the full encrypted name (in the dentry's alternate_name</div><div class='add'>+ * field).</div><div class='add'>+ */</div><div class='add'>+#define CEPH_NOHASH_NAME_MAX (180 - SHA256_DIGEST_SIZE)</div><div class='add'>+</div><div class='add'>+void ceph_fscrypt_set_ops(struct super_block *sb);</div><div class='add'>+</div><div class='add'>+void ceph_fscrypt_free_dummy_policy(struct ceph_fs_client *fsc);</div><div class='add'>+</div><div class='add'>+int ceph_fscrypt_prepare_context(struct inode *dir, struct inode *inode,</div><div class='add'>+				 struct ceph_acl_sec_ctx *as);</div><div class='add'>+void ceph_fscrypt_as_ctx_to_req(struct ceph_mds_request *req,</div><div class='add'>+				struct ceph_acl_sec_ctx *as);</div><div class='add'>+int ceph_encode_encrypted_dname(struct inode *parent, char *buf, int len);</div><div class='add'>+</div><div class='add'>+static inline int ceph_fname_alloc_buffer(struct inode *parent,</div><div class='add'>+					  struct fscrypt_str *fname)</div><div class='add'>+{</div><div class='add'>+	if (!IS_ENCRYPTED(parent))</div><div class='add'>+		return 0;</div><div class='add'>+	return fscrypt_fname_alloc_buffer(NAME_MAX, fname);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void ceph_fname_free_buffer(struct inode *parent,</div><div class='add'>+					  struct fscrypt_str *fname)</div><div class='add'>+{</div><div class='add'>+	if (IS_ENCRYPTED(parent))</div><div class='add'>+		fscrypt_fname_free_buffer(fname);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int ceph_fname_to_usr(const struct ceph_fname *fname, struct fscrypt_str *tname,</div><div class='add'>+		      struct fscrypt_str *oname, bool *is_nokey);</div><div class='add'>+int ceph_fscrypt_prepare_readdir(struct inode *dir);</div><div class='add'>+</div><div class='add'>+static inline unsigned int ceph_fscrypt_blocks(u64 off, u64 len)</div><div class='add'>+{</div><div class='add'>+	/* crypto blocks cannot span more than one page */</div><div class='add'>+	BUILD_BUG_ON(CEPH_FSCRYPT_BLOCK_SHIFT &gt; PAGE_SHIFT);</div><div class='add'>+</div><div class='add'>+	return ((off+len+CEPH_FSCRYPT_BLOCK_SIZE-1) &gt;&gt; CEPH_FSCRYPT_BLOCK_SHIFT) -</div><div class='add'>+		(off &gt;&gt; CEPH_FSCRYPT_BLOCK_SHIFT);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * If we have an encrypted inode then we must adjust the offset and</div><div class='add'>+ * range of the on-the-wire read to cover an entire encryption block.</div><div class='add'>+ * The copy will be done using the original offset and length, after</div><div class='add'>+ * we've decrypted the result.</div><div class='add'>+ */</div><div class='add'>+static inline void ceph_fscrypt_adjust_off_and_len(struct inode *inode,</div><div class='add'>+						   u64 *off, u64 *len)</div><div class='add'>+{</div><div class='add'>+	if (IS_ENCRYPTED(inode)) {</div><div class='add'>+		*len = ceph_fscrypt_blocks(*off, *len) * CEPH_FSCRYPT_BLOCK_SIZE;</div><div class='add'>+		*off &amp;= CEPH_FSCRYPT_BLOCK_MASK;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int ceph_fscrypt_decrypt_block_inplace(const struct inode *inode,</div><div class='add'>+				  struct page *page, unsigned int len,</div><div class='add'>+				  unsigned int offs, u64 lblk_num);</div><div class='add'>+int ceph_fscrypt_encrypt_block_inplace(const struct inode *inode,</div><div class='add'>+				  struct page *page, unsigned int len,</div><div class='add'>+				  unsigned int offs, u64 lblk_num);</div><div class='add'>+int ceph_fscrypt_decrypt_pages(struct inode *inode, struct page **page,</div><div class='add'>+			       u64 off, int len);</div><div class='add'>+int ceph_fscrypt_decrypt_extents(struct inode *inode, struct page **page,</div><div class='add'>+				 u64 off, struct ceph_sparse_extent *map,</div><div class='add'>+				 u32 ext_cnt);</div><div class='add'>+int ceph_fscrypt_encrypt_pages(struct inode *inode, struct page **page, u64 off,</div><div class='add'>+			       int len);</div><div class='add'>+</div><div class='add'>+static inline struct page *ceph_fscrypt_pagecache_page(struct page *page)</div><div class='add'>+{</div><div class='add'>+	return fscrypt_is_bounce_page(page) ? fscrypt_pagecache_page(page) : page;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#else /* CONFIG_FS_ENCRYPTION */</div><div class='add'>+</div><div class='add'>+static inline void ceph_fscrypt_set_ops(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void ceph_fscrypt_free_dummy_policy(struct ceph_fs_client *fsc)</div><div class='add'>+{</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int ceph_fscrypt_prepare_context(struct inode *dir,</div><div class='add'>+					       struct inode *inode,</div><div class='add'>+					       struct ceph_acl_sec_ctx *as)</div><div class='add'>+{</div><div class='add'>+	if (IS_ENCRYPTED(dir))</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void ceph_fscrypt_as_ctx_to_req(struct ceph_mds_request *req,</div><div class='add'>+						struct ceph_acl_sec_ctx *as_ctx)</div><div class='add'>+{</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int ceph_encode_encrypted_dname(struct inode *parent, char *buf,</div><div class='add'>+					      int len)</div><div class='add'>+{</div><div class='add'>+	return len;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int ceph_fname_alloc_buffer(struct inode *parent,</div><div class='add'>+					  struct fscrypt_str *fname)</div><div class='add'>+{</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void ceph_fname_free_buffer(struct inode *parent,</div><div class='add'>+					  struct fscrypt_str *fname)</div><div class='add'>+{</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int ceph_fname_to_usr(const struct ceph_fname *fname,</div><div class='add'>+				    struct fscrypt_str *tname,</div><div class='add'>+				    struct fscrypt_str *oname, bool *is_nokey)</div><div class='add'>+{</div><div class='add'>+	oname-&gt;name = fname-&gt;name;</div><div class='add'>+	oname-&gt;len = fname-&gt;name_len;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int ceph_fscrypt_prepare_readdir(struct inode *dir)</div><div class='add'>+{</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void ceph_fscrypt_adjust_off_and_len(struct inode *inode,</div><div class='add'>+						   u64 *off, u64 *len)</div><div class='add'>+{</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int ceph_fscrypt_decrypt_block_inplace(const struct inode *inode,</div><div class='add'>+					  struct page *page, unsigned int len,</div><div class='add'>+					  unsigned int offs, u64 lblk_num)</div><div class='add'>+{</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int ceph_fscrypt_encrypt_block_inplace(const struct inode *inode,</div><div class='add'>+					  struct page *page, unsigned int len,</div><div class='add'>+					  unsigned int offs, u64 lblk_num)</div><div class='add'>+{</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int ceph_fscrypt_decrypt_pages(struct inode *inode,</div><div class='add'>+					     struct page **page, u64 off,</div><div class='add'>+					     int len)</div><div class='add'>+{</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int ceph_fscrypt_decrypt_extents(struct inode *inode,</div><div class='add'>+					       struct page **page, u64 off,</div><div class='add'>+					       struct ceph_sparse_extent *map,</div><div class='add'>+					       u32 ext_cnt)</div><div class='add'>+{</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int ceph_fscrypt_encrypt_pages(struct inode *inode,</div><div class='add'>+					     struct page **page, u64 off,</div><div class='add'>+					     int len)</div><div class='add'>+{</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline struct page *ceph_fscrypt_pagecache_page(struct page *page)</div><div class='add'>+{</div><div class='add'>+	return page;</div><div class='add'>+}</div><div class='add'>+#endif /* CONFIG_FS_ENCRYPTION */</div><div class='add'>+</div><div class='add'>+static inline loff_t ceph_fscrypt_page_offset(struct page *page)</div><div class='add'>+{</div><div class='add'>+	return page_offset(ceph_fscrypt_pagecache_page(page));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#endif /* _CEPH_CRYPTO_H */</div><div class='head'>diff --git a/fs/ceph/debugfs.c b/fs/ceph/debugfs.c<br/>index 38b78b45811f..f3fe786b4143 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ceph/debugfs.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/debugfs.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/debugfs.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/debugfs.c</a></div><div class='hunk'>@@ -55,8 +55,6 @@ static int mdsc_show(struct seq_file *s, void *p)</div><div class='ctx'> 	struct ceph_mds_client *mdsc = fsc-&gt;mdsc;</div><div class='ctx'> 	struct ceph_mds_request *req;</div><div class='ctx'> 	struct rb_node *rp;</div><div class='del'>-	int pathlen = 0;</div><div class='del'>-	u64 pathbase;</div><div class='ctx'> 	char *path;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;mdsc-&gt;mutex);</div><div class='hunk'>@@ -81,8 +79,8 @@ static int mdsc_show(struct seq_file *s, void *p)</div><div class='ctx'> 		if (req-&gt;r_inode) {</div><div class='ctx'> 			seq_printf(s, " #%llx", ceph_ino(req-&gt;r_inode));</div><div class='ctx'> 		} else if (req-&gt;r_dentry) {</div><div class='del'>-			path = ceph_mdsc_build_path(req-&gt;r_dentry, &amp;pathlen,</div><div class='del'>-						    &amp;pathbase, 0);</div><div class='add'>+			struct ceph_path_info path_info;</div><div class='add'>+			path = ceph_mdsc_build_path(mdsc, req-&gt;r_dentry, &amp;path_info, 0);</div><div class='ctx'> 			if (IS_ERR(path))</div><div class='ctx'> 				path = NULL;</div><div class='ctx'> 			spin_lock(&amp;req-&gt;r_dentry-&gt;d_lock);</div><div class='hunk'>@@ -91,7 +89,7 @@ static int mdsc_show(struct seq_file *s, void *p)</div><div class='ctx'> 				   req-&gt;r_dentry,</div><div class='ctx'> 				   path ? path : "");</div><div class='ctx'> 			spin_unlock(&amp;req-&gt;r_dentry-&gt;d_lock);</div><div class='del'>-			ceph_mdsc_free_path(path, pathlen);</div><div class='add'>+			ceph_mdsc_free_path_info(&amp;path_info);</div><div class='ctx'> 		} else if (req-&gt;r_path1) {</div><div class='ctx'> 			seq_printf(s, " #%llx/%s", req-&gt;r_ino1.ino,</div><div class='ctx'> 				   req-&gt;r_path1);</div><div class='hunk'>@@ -100,8 +98,8 @@ static int mdsc_show(struct seq_file *s, void *p)</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (req-&gt;r_old_dentry) {</div><div class='del'>-			path = ceph_mdsc_build_path(req-&gt;r_old_dentry, &amp;pathlen,</div><div class='del'>-						    &amp;pathbase, 0);</div><div class='add'>+			struct ceph_path_info path_info;</div><div class='add'>+			path = ceph_mdsc_build_path(mdsc, req-&gt;r_old_dentry, &amp;path_info, 0);</div><div class='ctx'> 			if (IS_ERR(path))</div><div class='ctx'> 				path = NULL;</div><div class='ctx'> 			spin_lock(&amp;req-&gt;r_old_dentry-&gt;d_lock);</div><div class='hunk'>@@ -111,7 +109,7 @@ static int mdsc_show(struct seq_file *s, void *p)</div><div class='ctx'> 				   req-&gt;r_old_dentry,</div><div class='ctx'> 				   path ? path : "");</div><div class='ctx'> 			spin_unlock(&amp;req-&gt;r_old_dentry-&gt;d_lock);</div><div class='del'>-			ceph_mdsc_free_path(path, pathlen);</div><div class='add'>+			ceph_mdsc_free_path_info(&amp;path_info);</div><div class='ctx'> 		} else if (req-&gt;r_path2 &amp;&amp; req-&gt;r_op != CEPH_MDS_OP_SYMLINK) {</div><div class='ctx'> 			if (req-&gt;r_ino2.ino)</div><div class='ctx'> 				seq_printf(s, " #%llx/%s", req-&gt;r_ino2.ino,</div><div class='hunk'>@@ -146,82 +144,92 @@ static int mdsc_show(struct seq_file *s, void *p)</div><div class='ctx'> 		   name, total, avg, _min, max, sum);			\</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int metric_show(struct seq_file *s, void *p)</div><div class='add'>+static int metrics_file_show(struct seq_file *s, void *p)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_fs_client *fsc = s-&gt;private;</div><div class='del'>-	struct ceph_mds_client *mdsc = fsc-&gt;mdsc;</div><div class='del'>-	struct ceph_client_metric *m = &amp;mdsc-&gt;metric;</div><div class='del'>-	int nr_caps = 0;</div><div class='del'>-	s64 total, sum, avg, min, max, sq;</div><div class='del'>-	u64 sum_sz, avg_sz, min_sz, max_sz;</div><div class='add'>+	struct ceph_client_metric *m = &amp;fsc-&gt;mdsc-&gt;metric;</div><div class='ctx'> </div><div class='del'>-	sum = percpu_counter_sum(&amp;m-&gt;total_inodes);</div><div class='ctx'> 	seq_printf(s, "item                               total\n");</div><div class='ctx'> 	seq_printf(s, "------------------------------------------\n");</div><div class='del'>-	seq_printf(s, "%-35s%lld / %lld\n", "opened files  / total inodes",</div><div class='del'>-		   atomic64_read(&amp;m-&gt;opened_files), sum);</div><div class='del'>-	seq_printf(s, "%-35s%lld / %lld\n", "pinned i_caps / total inodes",</div><div class='del'>-		   atomic64_read(&amp;m-&gt;total_caps), sum);</div><div class='del'>-	seq_printf(s, "%-35s%lld / %lld\n", "opened inodes / total inodes",</div><div class='del'>-		   percpu_counter_sum(&amp;m-&gt;opened_inodes), sum);</div><div class='del'>-</div><div class='del'>-	seq_printf(s, "\n");</div><div class='add'>+	seq_printf(s, "%-35s%lld\n", "total inodes",</div><div class='add'>+		   percpu_counter_sum(&amp;m-&gt;total_inodes));</div><div class='add'>+	seq_printf(s, "%-35s%lld\n", "opened files",</div><div class='add'>+		   atomic64_read(&amp;m-&gt;opened_files));</div><div class='add'>+	seq_printf(s, "%-35s%lld\n", "pinned i_caps",</div><div class='add'>+		   atomic64_read(&amp;m-&gt;total_caps));</div><div class='add'>+	seq_printf(s, "%-35s%lld\n", "opened inodes",</div><div class='add'>+		   percpu_counter_sum(&amp;m-&gt;opened_inodes));</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const char * const metric_str[] = {</div><div class='add'>+	"read",</div><div class='add'>+	"write",</div><div class='add'>+	"metadata",</div><div class='add'>+	"copyfrom"</div><div class='add'>+};</div><div class='add'>+static int metrics_latency_show(struct seq_file *s, void *p)</div><div class='add'>+{</div><div class='add'>+	struct ceph_fs_client *fsc = s-&gt;private;</div><div class='add'>+	struct ceph_client_metric *cm = &amp;fsc-&gt;mdsc-&gt;metric;</div><div class='add'>+	struct ceph_metric *m;</div><div class='add'>+	s64 total, avg, min, max, sq;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='ctx'> 	seq_printf(s, "item          total       avg_lat(us)     min_lat(us)     max_lat(us)     stdev(us)\n");</div><div class='ctx'> 	seq_printf(s, "-----------------------------------------------------------------------------------\n");</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;m-&gt;read_metric_lock);</div><div class='del'>-	total = m-&gt;total_reads;</div><div class='del'>-	sum = m-&gt;read_latency_sum;</div><div class='del'>-	avg = total &gt; 0 ? DIV64_U64_ROUND_CLOSEST(sum, total) : 0;</div><div class='del'>-	min = m-&gt;read_latency_min;</div><div class='del'>-	max = m-&gt;read_latency_max;</div><div class='del'>-	sq = m-&gt;read_latency_sq_sum;</div><div class='del'>-	spin_unlock(&amp;m-&gt;read_metric_lock);</div><div class='del'>-	CEPH_LAT_METRIC_SHOW("read", total, avg, min, max, sq);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;m-&gt;write_metric_lock);</div><div class='del'>-	total = m-&gt;total_writes;</div><div class='del'>-	sum = m-&gt;write_latency_sum;</div><div class='del'>-	avg = total &gt; 0 ? DIV64_U64_ROUND_CLOSEST(sum, total) : 0;</div><div class='del'>-	min = m-&gt;write_latency_min;</div><div class='del'>-	max = m-&gt;write_latency_max;</div><div class='del'>-	sq = m-&gt;write_latency_sq_sum;</div><div class='del'>-	spin_unlock(&amp;m-&gt;write_metric_lock);</div><div class='del'>-	CEPH_LAT_METRIC_SHOW("write", total, avg, min, max, sq);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;m-&gt;metadata_metric_lock);</div><div class='del'>-	total = m-&gt;total_metadatas;</div><div class='del'>-	sum = m-&gt;metadata_latency_sum;</div><div class='del'>-	avg = total &gt; 0 ? DIV64_U64_ROUND_CLOSEST(sum, total) : 0;</div><div class='del'>-	min = m-&gt;metadata_latency_min;</div><div class='del'>-	max = m-&gt;metadata_latency_max;</div><div class='del'>-	sq = m-&gt;metadata_latency_sq_sum;</div><div class='del'>-	spin_unlock(&amp;m-&gt;metadata_metric_lock);</div><div class='del'>-	CEPH_LAT_METRIC_SHOW("metadata", total, avg, min, max, sq);</div><div class='del'>-</div><div class='del'>-	seq_printf(s, "\n");</div><div class='add'>+	for (i = 0; i &lt; METRIC_MAX; i++) {</div><div class='add'>+		m = &amp;cm-&gt;metric[i];</div><div class='add'>+		spin_lock(&amp;m-&gt;lock);</div><div class='add'>+		total = m-&gt;total;</div><div class='add'>+		avg = m-&gt;latency_avg;</div><div class='add'>+		min = m-&gt;latency_min;</div><div class='add'>+		max = m-&gt;latency_max;</div><div class='add'>+		sq = m-&gt;latency_sq_sum;</div><div class='add'>+		spin_unlock(&amp;m-&gt;lock);</div><div class='add'>+		CEPH_LAT_METRIC_SHOW(metric_str[i], total, avg, min, max, sq);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int metrics_size_show(struct seq_file *s, void *p)</div><div class='add'>+{</div><div class='add'>+	struct ceph_fs_client *fsc = s-&gt;private;</div><div class='add'>+	struct ceph_client_metric *cm = &amp;fsc-&gt;mdsc-&gt;metric;</div><div class='add'>+	struct ceph_metric *m;</div><div class='add'>+	s64 total;</div><div class='add'>+	u64 sum, avg, min, max;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='ctx'> 	seq_printf(s, "item          total       avg_sz(bytes)   min_sz(bytes)   max_sz(bytes)  total_sz(bytes)\n");</div><div class='ctx'> 	seq_printf(s, "----------------------------------------------------------------------------------------\n");</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;m-&gt;read_metric_lock);</div><div class='del'>-	total = m-&gt;total_reads;</div><div class='del'>-	sum_sz = m-&gt;read_size_sum;</div><div class='del'>-	avg_sz = total &gt; 0 ? DIV64_U64_ROUND_CLOSEST(sum_sz, total) : 0;</div><div class='del'>-	min_sz = m-&gt;read_size_min;</div><div class='del'>-	max_sz = m-&gt;read_size_max;</div><div class='del'>-	spin_unlock(&amp;m-&gt;read_metric_lock);</div><div class='del'>-	CEPH_SZ_METRIC_SHOW("read", total, avg_sz, min_sz, max_sz, sum_sz);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;m-&gt;write_metric_lock);</div><div class='del'>-	total = m-&gt;total_writes;</div><div class='del'>-	sum_sz = m-&gt;write_size_sum;</div><div class='del'>-	avg_sz = total &gt; 0 ? DIV64_U64_ROUND_CLOSEST(sum_sz, total) : 0;</div><div class='del'>-	min_sz = m-&gt;write_size_min;</div><div class='del'>-	max_sz = m-&gt;write_size_max;</div><div class='del'>-	spin_unlock(&amp;m-&gt;write_metric_lock);</div><div class='del'>-	CEPH_SZ_METRIC_SHOW("write", total, avg_sz, min_sz, max_sz, sum_sz);</div><div class='del'>-</div><div class='del'>-	seq_printf(s, "\n");</div><div class='add'>+	for (i = 0; i &lt; METRIC_MAX; i++) {</div><div class='add'>+		/* skip 'metadata' as it doesn't use the size metric */</div><div class='add'>+		if (i == METRIC_METADATA)</div><div class='add'>+			continue;</div><div class='add'>+		m = &amp;cm-&gt;metric[i];</div><div class='add'>+		spin_lock(&amp;m-&gt;lock);</div><div class='add'>+		total = m-&gt;total;</div><div class='add'>+		sum = m-&gt;size_sum;</div><div class='add'>+		avg = total &gt; 0 ? DIV64_U64_ROUND_CLOSEST(sum, total) : 0;</div><div class='add'>+		min = m-&gt;size_min;</div><div class='add'>+		max = m-&gt;size_max;</div><div class='add'>+		spin_unlock(&amp;m-&gt;lock);</div><div class='add'>+		CEPH_SZ_METRIC_SHOW(metric_str[i], total, avg, min, max, sum);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int metrics_caps_show(struct seq_file *s, void *p)</div><div class='add'>+{</div><div class='add'>+	struct ceph_fs_client *fsc = s-&gt;private;</div><div class='add'>+	struct ceph_client_metric *m = &amp;fsc-&gt;mdsc-&gt;metric;</div><div class='add'>+	int nr_caps = 0;</div><div class='add'>+</div><div class='ctx'> 	seq_printf(s, "item          total           miss            hit\n");</div><div class='ctx'> 	seq_printf(s, "-------------------------------------------------\n");</div><div class='ctx'> </div><div class='hunk'>@@ -238,14 +246,20 @@ static int metric_show(struct seq_file *s, void *p)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int caps_show_cb(struct inode *inode, struct ceph_cap *cap, void *p)</div><div class='add'>+static int caps_show_cb(struct inode *inode, int mds, void *p)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	struct seq_file *s = p;</div><div class='del'>-</div><div class='del'>-	seq_printf(s, "0x%-17llx%-3d%-17s%-17s\n", ceph_ino(inode),</div><div class='del'>-		   cap-&gt;session-&gt;s_mds,</div><div class='del'>-		   ceph_cap_string(cap-&gt;issued),</div><div class='del'>-		   ceph_cap_string(cap-&gt;implemented));</div><div class='add'>+	struct ceph_cap *cap;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+	cap = __get_cap_for_mds(ci, mds);</div><div class='add'>+	if (cap)</div><div class='add'>+		seq_printf(s, "0x%-17llx%-3d%-17s%-17s\n", ceph_ino(inode),</div><div class='add'>+			   cap-&gt;session-&gt;s_mds,</div><div class='add'>+			   ceph_cap_string(cap-&gt;issued),</div><div class='add'>+			   ceph_cap_string(cap-&gt;implemented));</div><div class='add'>+	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -341,7 +355,7 @@ static int status_show(struct seq_file *s, void *p)</div><div class='ctx'> </div><div class='ctx'> 	seq_printf(s, "instance: %s.%lld %s/%u\n", ENTITY_NAME(inst-&gt;name),</div><div class='ctx'> 		   ceph_pr_addr(client_addr), le32_to_cpu(client_addr-&gt;nonce));</div><div class='del'>-	seq_printf(s, "blocklisted: %s\n", fsc-&gt;blocklisted ? "true" : "false");</div><div class='add'>+	seq_printf(s, "blocklisted: %s\n", str_true_false(fsc-&gt;blocklisted));</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -350,8 +364,11 @@ DEFINE_SHOW_ATTRIBUTE(mdsmap);</div><div class='ctx'> DEFINE_SHOW_ATTRIBUTE(mdsc);</div><div class='ctx'> DEFINE_SHOW_ATTRIBUTE(caps);</div><div class='ctx'> DEFINE_SHOW_ATTRIBUTE(mds_sessions);</div><div class='del'>-DEFINE_SHOW_ATTRIBUTE(metric);</div><div class='ctx'> DEFINE_SHOW_ATTRIBUTE(status);</div><div class='add'>+DEFINE_SHOW_ATTRIBUTE(metrics_file);</div><div class='add'>+DEFINE_SHOW_ATTRIBUTE(metrics_latency);</div><div class='add'>+DEFINE_SHOW_ATTRIBUTE(metrics_size);</div><div class='add'>+DEFINE_SHOW_ATTRIBUTE(metrics_caps);</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -379,21 +396,23 @@ DEFINE_SIMPLE_ATTRIBUTE(congestion_kb_fops, congestion_kb_get,</div><div class='ctx'> </div><div class='ctx'> void ceph_fs_debugfs_cleanup(struct ceph_fs_client *fsc)</div><div class='ctx'> {</div><div class='del'>-	dout("ceph_fs_debugfs_cleanup\n");</div><div class='add'>+	doutc(fsc-&gt;client, "begin\n");</div><div class='ctx'> 	debugfs_remove(fsc-&gt;debugfs_bdi);</div><div class='ctx'> 	debugfs_remove(fsc-&gt;debugfs_congestion_kb);</div><div class='ctx'> 	debugfs_remove(fsc-&gt;debugfs_mdsmap);</div><div class='ctx'> 	debugfs_remove(fsc-&gt;debugfs_mds_sessions);</div><div class='ctx'> 	debugfs_remove(fsc-&gt;debugfs_caps);</div><div class='del'>-	debugfs_remove(fsc-&gt;debugfs_metric);</div><div class='add'>+	debugfs_remove(fsc-&gt;debugfs_status);</div><div class='ctx'> 	debugfs_remove(fsc-&gt;debugfs_mdsc);</div><div class='add'>+	debugfs_remove_recursive(fsc-&gt;debugfs_metrics_dir);</div><div class='add'>+	doutc(fsc-&gt;client, "done\n");</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void ceph_fs_debugfs_init(struct ceph_fs_client *fsc)</div><div class='ctx'> {</div><div class='del'>-	char name[100];</div><div class='add'>+	char name[NAME_MAX];</div><div class='ctx'> </div><div class='del'>-	dout("ceph_fs_debugfs_init\n");</div><div class='add'>+	doutc(fsc-&gt;client, "begin\n");</div><div class='ctx'> 	fsc-&gt;debugfs_congestion_kb =</div><div class='ctx'> 		debugfs_create_file("writeback_congestion_kb",</div><div class='ctx'> 				    0600,</div><div class='hunk'>@@ -426,12 +445,6 @@ void ceph_fs_debugfs_init(struct ceph_fs_client *fsc)</div><div class='ctx'> 						fsc,</div><div class='ctx'> 						&amp;mdsc_fops);</div><div class='ctx'> </div><div class='del'>-	fsc-&gt;debugfs_metric = debugfs_create_file("metrics",</div><div class='del'>-						  0400,</div><div class='del'>-						  fsc-&gt;client-&gt;debugfs_dir,</div><div class='del'>-						  fsc,</div><div class='del'>-						  &amp;metric_fops);</div><div class='del'>-</div><div class='ctx'> 	fsc-&gt;debugfs_caps = debugfs_create_file("caps",</div><div class='ctx'> 						0400,</div><div class='ctx'> 						fsc-&gt;client-&gt;debugfs_dir,</div><div class='hunk'>@@ -443,6 +456,19 @@ void ceph_fs_debugfs_init(struct ceph_fs_client *fsc)</div><div class='ctx'> 						  fsc-&gt;client-&gt;debugfs_dir,</div><div class='ctx'> 						  fsc,</div><div class='ctx'> 						  &amp;status_fops);</div><div class='add'>+</div><div class='add'>+	fsc-&gt;debugfs_metrics_dir = debugfs_create_dir("metrics",</div><div class='add'>+						      fsc-&gt;client-&gt;debugfs_dir);</div><div class='add'>+</div><div class='add'>+	debugfs_create_file("file", 0400, fsc-&gt;debugfs_metrics_dir, fsc,</div><div class='add'>+			    &amp;metrics_file_fops);</div><div class='add'>+	debugfs_create_file("latency", 0400, fsc-&gt;debugfs_metrics_dir, fsc,</div><div class='add'>+			    &amp;metrics_latency_fops);</div><div class='add'>+	debugfs_create_file("size", 0400, fsc-&gt;debugfs_metrics_dir, fsc,</div><div class='add'>+			    &amp;metrics_size_fops);</div><div class='add'>+	debugfs_create_file("caps", 0400, fsc-&gt;debugfs_metrics_dir, fsc,</div><div class='add'>+			    &amp;metrics_caps_fops);</div><div class='add'>+	doutc(fsc-&gt;client, "done\n");</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> </div><div class='head'>diff --git a/fs/ceph/dir.c b/fs/ceph/dir.c<br/>index 133dbd9338e7..86d7aa594ea9 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ceph/dir.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/dir.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/dir.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/dir.c</a></div><div class='hunk'>@@ -9,6 +9,7 @@</div><div class='ctx'> </div><div class='ctx'> #include "super.h"</div><div class='ctx'> #include "mds_client.h"</div><div class='add'>+#include "crypto.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Directory operations: readdir, lookup, create, link, unlink,</div><div class='hunk'>@@ -108,7 +109,9 @@ static int fpos_cmp(loff_t l, loff_t r)</div><div class='ctx'>  * regardless of what dir changes take place on the</div><div class='ctx'>  * server.</div><div class='ctx'>  */</div><div class='del'>-static int note_last_dentry(struct ceph_dir_file_info *dfi, const char *name,</div><div class='add'>+static int note_last_dentry(struct ceph_fs_client *fsc,</div><div class='add'>+			    struct ceph_dir_file_info *dfi,</div><div class='add'>+			    const char *name,</div><div class='ctx'> 		            int len, unsigned next_offset)</div><div class='ctx'> {</div><div class='ctx'> 	char *buf = kmalloc(len+1, GFP_KERNEL);</div><div class='hunk'>@@ -119,7 +122,7 @@ static int note_last_dentry(struct ceph_dir_file_info *dfi, const char *name,</div><div class='ctx'> 	memcpy(dfi-&gt;last_name, name, len);</div><div class='ctx'> 	dfi-&gt;last_name[len] = 0;</div><div class='ctx'> 	dfi-&gt;next_offset = next_offset;</div><div class='del'>-	dout("note_last_dentry '%s'\n", dfi-&gt;last_name);</div><div class='add'>+	doutc(fsc-&gt;client, "'%s'\n", dfi-&gt;last_name);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -129,6 +132,7 @@ __dcache_find_get_entry(struct dentry *parent, u64 idx,</div><div class='ctx'> 			struct ceph_readdir_cache_control *cache_ctl)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *dir = d_inode(parent);</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(dir);</div><div class='ctx'> 	struct dentry *dentry;</div><div class='ctx'> 	unsigned idx_mask = (PAGE_SIZE / sizeof(struct dentry *)) - 1;</div><div class='ctx'> 	loff_t ptr_pos = idx * sizeof(struct dentry *);</div><div class='hunk'>@@ -137,17 +141,18 @@ __dcache_find_get_entry(struct dentry *parent, u64 idx,</div><div class='ctx'> 	if (ptr_pos &gt;= i_size_read(dir))</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='del'>-	if (!cache_ctl-&gt;page || ptr_pgoff != page_index(cache_ctl-&gt;page)) {</div><div class='add'>+	if (!cache_ctl-&gt;folio || ptr_pgoff != cache_ctl-&gt;folio-&gt;index) {</div><div class='ctx'> 		ceph_readdir_cache_release(cache_ctl);</div><div class='del'>-		cache_ctl-&gt;page = find_lock_page(&amp;dir-&gt;i_data, ptr_pgoff);</div><div class='del'>-		if (!cache_ctl-&gt;page) {</div><div class='del'>-			dout(" page %lu not found\n", ptr_pgoff);</div><div class='add'>+		cache_ctl-&gt;folio = filemap_lock_folio(&amp;dir-&gt;i_data, ptr_pgoff);</div><div class='add'>+		if (IS_ERR(cache_ctl-&gt;folio)) {</div><div class='add'>+			cache_ctl-&gt;folio = NULL;</div><div class='add'>+			doutc(cl, " folio %lu not found\n", ptr_pgoff);</div><div class='ctx'> 			return ERR_PTR(-EAGAIN);</div><div class='ctx'> 		}</div><div class='ctx'> 		/* reading/filling the cache are serialized by</div><div class='del'>-		   i_mutex, no need to use page lock */</div><div class='del'>-		unlock_page(cache_ctl-&gt;page);</div><div class='del'>-		cache_ctl-&gt;dentries = kmap(cache_ctl-&gt;page);</div><div class='add'>+		   i_rwsem, no need to use folio lock */</div><div class='add'>+		folio_unlock(cache_ctl-&gt;folio);</div><div class='add'>+		cache_ctl-&gt;dentries = kmap_local_folio(cache_ctl-&gt;folio, 0);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	cache_ctl-&gt;index = idx &amp; idx_mask;</div><div class='hunk'>@@ -155,7 +160,7 @@ __dcache_find_get_entry(struct dentry *parent, u64 idx,</div><div class='ctx'> 	rcu_read_lock();</div><div class='ctx'> 	spin_lock(&amp;parent-&gt;d_lock);</div><div class='ctx'> 	/* check i_size again here, because empty directory can be</div><div class='del'>-	 * marked as complete while not holding the i_mutex. */</div><div class='add'>+	 * marked as complete while not holding the i_rwsem. */</div><div class='ctx'> 	if (ceph_dir_is_complete_ordered(dir) &amp;&amp; ptr_pos &lt; i_size_read(dir))</div><div class='ctx'> 		dentry = cache_ctl-&gt;dentries[cache_ctl-&gt;index];</div><div class='ctx'> 	else</div><div class='hunk'>@@ -170,7 +175,7 @@ __dcache_find_get_entry(struct dentry *parent, u64 idx,</div><div class='ctx'> /*</div><div class='ctx'>  * When possible, we try to satisfy a readdir by peeking at the</div><div class='ctx'>  * dcache.  We make this work by carefully ordering dentries on</div><div class='del'>- * d_child when we initially get results back from the MDS, and</div><div class='add'>+ * d_children when we initially get results back from the MDS, and</div><div class='ctx'>  * falling back to a "normal" sync readdir if any dentries in the dir</div><div class='ctx'>  * are dropped.</div><div class='ctx'>  *</div><div class='hunk'>@@ -184,13 +189,16 @@ static int __dcache_readdir(struct file *file,  struct dir_context *ctx,</div><div class='ctx'> 	struct ceph_dir_file_info *dfi = file-&gt;private_data;</div><div class='ctx'> 	struct dentry *parent = file-&gt;f_path.dentry;</div><div class='ctx'> 	struct inode *dir = d_inode(parent);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(dir);</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(dir);</div><div class='ctx'> 	struct dentry *dentry, *last = NULL;</div><div class='ctx'> 	struct ceph_dentry_info *di;</div><div class='ctx'> 	struct ceph_readdir_cache_control cache_ctl = {};</div><div class='ctx'> 	u64 idx = 0;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='del'>-	dout("__dcache_readdir %p v%u at %llx\n", dir, (unsigned)shared_gen, ctx-&gt;pos);</div><div class='add'>+	doutc(cl, "%p %llx.%llx v%u at %llx\n", dir, ceph_vinop(dir),</div><div class='add'>+	      (unsigned)shared_gen, ctx-&gt;pos);</div><div class='ctx'> </div><div class='ctx'> 	/* search start position */</div><div class='ctx'> 	if (ctx-&gt;pos &gt; 2) {</div><div class='hunk'>@@ -200,7 +208,7 @@ static int __dcache_readdir(struct file *file,  struct dir_context *ctx,</div><div class='ctx'> 			dentry = __dcache_find_get_entry(parent, idx + step,</div><div class='ctx'> 							 &amp;cache_ctl);</div><div class='ctx'> 			if (!dentry) {</div><div class='del'>-				/* use linar search */</div><div class='add'>+				/* use linear search */</div><div class='ctx'> 				idx = 0;</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -220,7 +228,8 @@ static int __dcache_readdir(struct file *file,  struct dir_context *ctx,</div><div class='ctx'> 			dput(dentry);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		dout("__dcache_readdir %p cache idx %llu\n", dir, idx);</div><div class='add'>+		doutc(cl, "%p %llx.%llx cache idx %llu\n", dir,</div><div class='add'>+		      ceph_vinop(dir), idx);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> </div><div class='hunk'>@@ -241,7 +250,9 @@ static int __dcache_readdir(struct file *file,  struct dir_context *ctx,</div><div class='ctx'> 		di = ceph_dentry(dentry);</div><div class='ctx'> 		if (d_unhashed(dentry) ||</div><div class='ctx'> 		    d_really_is_negative(dentry) ||</div><div class='del'>-		    di-&gt;lease_shared_gen != shared_gen) {</div><div class='add'>+		    di-&gt;lease_shared_gen != shared_gen ||</div><div class='add'>+		    ((dentry-&gt;d_flags &amp; DCACHE_NOKEY_NAME) &amp;&amp;</div><div class='add'>+		     fscrypt_has_encryption_key(dir))) {</div><div class='ctx'> 			spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 			dput(dentry);</div><div class='ctx'> 			err = -EAGAIN;</div><div class='hunk'>@@ -254,8 +265,8 @@ static int __dcache_readdir(struct file *file,  struct dir_context *ctx,</div><div class='ctx'> 		spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> </div><div class='ctx'> 		if (emit_dentry) {</div><div class='del'>-			dout(" %llx dentry %p %pd %p\n", di-&gt;offset,</div><div class='del'>-			     dentry, dentry, d_inode(dentry));</div><div class='add'>+			doutc(cl, " %llx dentry %p %pd %p\n", di-&gt;offset,</div><div class='add'>+			      dentry, dentry, d_inode(dentry));</div><div class='ctx'> 			ctx-&gt;pos = di-&gt;offset;</div><div class='ctx'> 			if (!dir_emit(ctx, dentry-&gt;d_name.name,</div><div class='ctx'> 				      dentry-&gt;d_name.len, ceph_present_inode(d_inode(dentry)),</div><div class='hunk'>@@ -278,7 +289,8 @@ out:</div><div class='ctx'> 	if (last) {</div><div class='ctx'> 		int ret;</div><div class='ctx'> 		di = ceph_dentry(last);</div><div class='del'>-		ret = note_last_dentry(dfi, last-&gt;d_name.name, last-&gt;d_name.len,</div><div class='add'>+		ret = note_last_dentry(fsc, dfi, last-&gt;d_name.name,</div><div class='add'>+				       last-&gt;d_name.len,</div><div class='ctx'> 				       fpos_off(di-&gt;offset) + 1);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			err = ret;</div><div class='hunk'>@@ -307,20 +319,23 @@ static int ceph_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 	struct ceph_dir_file_info *dfi = file-&gt;private_data;</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_inode_to_client(inode);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='ctx'> 	struct ceph_mds_client *mdsc = fsc-&gt;mdsc;</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='ctx'> 	int i;</div><div class='ctx'> 	int err;</div><div class='ctx'> 	unsigned frag = -1;</div><div class='ctx'> 	struct ceph_mds_reply_info_parsed *rinfo;</div><div class='ctx'> </div><div class='del'>-	dout("readdir %p file %p pos %llx\n", inode, file, ctx-&gt;pos);</div><div class='add'>+	doutc(cl, "%p %llx.%llx file %p pos %llx\n", inode,</div><div class='add'>+	      ceph_vinop(inode), file, ctx-&gt;pos);</div><div class='ctx'> 	if (dfi-&gt;file_info.flags &amp; CEPH_F_ATEND)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/* always start with . and .. */</div><div class='ctx'> 	if (ctx-&gt;pos == 0) {</div><div class='del'>-		dout("readdir off 0 -&gt; '.'\n");</div><div class='add'>+		doutc(cl, "%p %llx.%llx off 0 -&gt; '.'\n", inode,</div><div class='add'>+		      ceph_vinop(inode));</div><div class='ctx'> 		if (!dir_emit(ctx, ".", 1, ceph_present_inode(inode),</div><div class='ctx'> 			    inode-&gt;i_mode &gt;&gt; 12))</div><div class='ctx'> 			return 0;</div><div class='hunk'>@@ -334,12 +349,17 @@ static int ceph_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 		ino = ceph_present_inode(dentry-&gt;d_parent-&gt;d_inode);</div><div class='ctx'> 		spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> </div><div class='del'>-		dout("readdir off 1 -&gt; '..'\n");</div><div class='add'>+		doutc(cl, "%p %llx.%llx off 1 -&gt; '..'\n", inode,</div><div class='add'>+		      ceph_vinop(inode));</div><div class='ctx'> 		if (!dir_emit(ctx, "..", 2, ino, inode-&gt;i_mode &gt;&gt; 12))</div><div class='ctx'> 			return 0;</div><div class='ctx'> 		ctx-&gt;pos = 2;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	err = ceph_fscrypt_prepare_readdir(inode);</div><div class='add'>+	if (err &lt; 0)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 	/* request Fx cap. if have Fx, we don't need to release Fs cap</div><div class='ctx'> 	 * for later create/unlink. */</div><div class='hunk'>@@ -384,11 +404,12 @@ more:</div><div class='ctx'> 			frag = fpos_frag(ctx-&gt;pos);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		dout("readdir fetching %llx.%llx frag %x offset '%s'\n",</div><div class='del'>-		     ceph_vinop(inode), frag, dfi-&gt;last_name);</div><div class='add'>+		doutc(cl, "fetching %p %llx.%llx frag %x offset '%s'\n",</div><div class='add'>+		      inode, ceph_vinop(inode), frag, dfi-&gt;last_name);</div><div class='ctx'> 		req = ceph_mdsc_create_request(mdsc, op, USE_AUTH_MDS);</div><div class='ctx'> 		if (IS_ERR(req))</div><div class='ctx'> 			return PTR_ERR(req);</div><div class='add'>+</div><div class='ctx'> 		err = ceph_alloc_readdir_reply_buffer(req, inode);</div><div class='ctx'> 		if (err) {</div><div class='ctx'> 			ceph_mdsc_put_request(req);</div><div class='hunk'>@@ -402,11 +423,20 @@ more:</div><div class='ctx'> 			req-&gt;r_inode_drop = CEPH_CAP_FILE_EXCL;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (dfi-&gt;last_name) {</div><div class='del'>-			req-&gt;r_path2 = kstrdup(dfi-&gt;last_name, GFP_KERNEL);</div><div class='add'>+			int len = strlen(dfi-&gt;last_name);</div><div class='add'>+</div><div class='add'>+			req-&gt;r_path2 = kzalloc(NAME_MAX + 1, GFP_KERNEL);</div><div class='ctx'> 			if (!req-&gt;r_path2) {</div><div class='ctx'> 				ceph_mdsc_put_request(req);</div><div class='ctx'> 				return -ENOMEM;</div><div class='ctx'> 			}</div><div class='add'>+			memcpy(req-&gt;r_path2, dfi-&gt;last_name, len);</div><div class='add'>+</div><div class='add'>+			err = ceph_encode_encrypted_dname(inode, req-&gt;r_path2, len);</div><div class='add'>+			if (err &lt; 0) {</div><div class='add'>+				ceph_mdsc_put_request(req);</div><div class='add'>+				return err;</div><div class='add'>+			}</div><div class='ctx'> 		} else if (is_hash_order(ctx-&gt;pos)) {</div><div class='ctx'> 			req-&gt;r_args.readdir.offset_hash =</div><div class='ctx'> 				cpu_to_le32(fpos_hash(ctx-&gt;pos));</div><div class='hunk'>@@ -428,12 +458,12 @@ more:</div><div class='ctx'> 			ceph_mdsc_put_request(req);</div><div class='ctx'> 			return err;</div><div class='ctx'> 		}</div><div class='del'>-		dout("readdir got and parsed readdir result=%d on "</div><div class='del'>-		     "frag %x, end=%d, complete=%d, hash_order=%d\n",</div><div class='del'>-		     err, frag,</div><div class='del'>-		     (int)req-&gt;r_reply_info.dir_end,</div><div class='del'>-		     (int)req-&gt;r_reply_info.dir_complete,</div><div class='del'>-		     (int)req-&gt;r_reply_info.hash_order);</div><div class='add'>+		doutc(cl, "%p %llx.%llx got and parsed readdir result=%d"</div><div class='add'>+		      "on frag %x, end=%d, complete=%d, hash_order=%d\n",</div><div class='add'>+		      inode, ceph_vinop(inode), err, frag,</div><div class='add'>+		      (int)req-&gt;r_reply_info.dir_end,</div><div class='add'>+		      (int)req-&gt;r_reply_info.dir_complete,</div><div class='add'>+		      (int)req-&gt;r_reply_info.hash_order);</div><div class='ctx'> </div><div class='ctx'> 		rinfo = &amp;req-&gt;r_reply_info;</div><div class='ctx'> 		if (le32_to_cpu(rinfo-&gt;dir_dir-&gt;frag) != frag) {</div><div class='hunk'>@@ -463,7 +493,8 @@ more:</div><div class='ctx'> 				dfi-&gt;dir_ordered_count = req-&gt;r_dir_ordered_cnt;</div><div class='ctx'> 			}</div><div class='ctx'> 		} else {</div><div class='del'>-			dout("readdir !did_prepopulate\n");</div><div class='add'>+			doutc(cl, "%p %llx.%llx !did_prepopulate\n", inode,</div><div class='add'>+			      ceph_vinop(inode));</div><div class='ctx'> 			/* disable readdir cache */</div><div class='ctx'> 			dfi-&gt;readdir_cache_idx = -1;</div><div class='ctx'> 			/* preclude from marking dir complete */</div><div class='hunk'>@@ -476,10 +507,13 @@ more:</div><div class='ctx'> 					rinfo-&gt;dir_entries + (rinfo-&gt;dir_nr-1);</div><div class='ctx'> 			unsigned next_offset = req-&gt;r_reply_info.dir_end ?</div><div class='ctx'> 					2 : (fpos_off(rde-&gt;offset) + 1);</div><div class='del'>-			err = note_last_dentry(dfi, rde-&gt;name, rde-&gt;name_len,</div><div class='del'>-					       next_offset);</div><div class='del'>-			if (err)</div><div class='add'>+			err = note_last_dentry(fsc, dfi, rde-&gt;name,</div><div class='add'>+					       rde-&gt;name_len, next_offset);</div><div class='add'>+			if (err) {</div><div class='add'>+				ceph_mdsc_put_request(dfi-&gt;last_readdir);</div><div class='add'>+				dfi-&gt;last_readdir = NULL;</div><div class='ctx'> 				return err;</div><div class='add'>+			}</div><div class='ctx'> 		} else if (req-&gt;r_reply_info.dir_end) {</div><div class='ctx'> 			dfi-&gt;next_offset = 2;</div><div class='ctx'> 			/* keep last name */</div><div class='hunk'>@@ -487,9 +521,9 @@ more:</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	rinfo = &amp;dfi-&gt;last_readdir-&gt;r_reply_info;</div><div class='del'>-	dout("readdir frag %x num %d pos %llx chunk first %llx\n",</div><div class='del'>-	     dfi-&gt;frag, rinfo-&gt;dir_nr, ctx-&gt;pos,</div><div class='del'>-	     rinfo-&gt;dir_nr ? rinfo-&gt;dir_entries[0].offset : 0LL);</div><div class='add'>+	doutc(cl, "%p %llx.%llx frag %x num %d pos %llx chunk first %llx\n",</div><div class='add'>+	      inode, ceph_vinop(inode), dfi-&gt;frag, rinfo-&gt;dir_nr, ctx-&gt;pos,</div><div class='add'>+	      rinfo-&gt;dir_nr ? rinfo-&gt;dir_entries[0].offset : 0LL);</div><div class='ctx'> </div><div class='ctx'> 	i = 0;</div><div class='ctx'> 	/* search start position */</div><div class='hunk'>@@ -508,21 +542,35 @@ more:</div><div class='ctx'> 	for (; i &lt; rinfo-&gt;dir_nr; i++) {</div><div class='ctx'> 		struct ceph_mds_reply_dir_entry *rde = rinfo-&gt;dir_entries + i;</div><div class='ctx'> </div><div class='del'>-		BUG_ON(rde-&gt;offset &lt; ctx-&gt;pos);</div><div class='add'>+		if (rde-&gt;offset &lt; ctx-&gt;pos) {</div><div class='add'>+			pr_warn_client(cl,</div><div class='add'>+				"%p %llx.%llx rde-&gt;offset 0x%llx ctx-&gt;pos 0x%llx\n",</div><div class='add'>+				inode, ceph_vinop(inode), rde-&gt;offset, ctx-&gt;pos);</div><div class='add'>+			return -EIO;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (WARN_ON_ONCE(!rde-&gt;inode.in))</div><div class='add'>+			return -EIO;</div><div class='ctx'> </div><div class='ctx'> 		ctx-&gt;pos = rde-&gt;offset;</div><div class='del'>-		dout("readdir (%d/%d) -&gt; %llx '%.*s' %p\n",</div><div class='del'>-		     i, rinfo-&gt;dir_nr, ctx-&gt;pos,</div><div class='del'>-		     rde-&gt;name_len, rde-&gt;name, &amp;rde-&gt;inode.in);</div><div class='del'>-</div><div class='del'>-		BUG_ON(!rde-&gt;inode.in);</div><div class='add'>+		doutc(cl, "%p %llx.%llx (%d/%d) -&gt; %llx '%.*s' %p\n", inode,</div><div class='add'>+		      ceph_vinop(inode), i, rinfo-&gt;dir_nr, ctx-&gt;pos,</div><div class='add'>+		      rde-&gt;name_len, rde-&gt;name, &amp;rde-&gt;inode.in);</div><div class='ctx'> </div><div class='ctx'> 		if (!dir_emit(ctx, rde-&gt;name, rde-&gt;name_len,</div><div class='ctx'> 			      ceph_present_ino(inode-&gt;i_sb, le64_to_cpu(rde-&gt;inode.in-&gt;ino)),</div><div class='ctx'> 			      le32_to_cpu(rde-&gt;inode.in-&gt;mode) &gt;&gt; 12)) {</div><div class='del'>-			dout("filldir stopping us...\n");</div><div class='add'>+			/*</div><div class='add'>+			 * NOTE: Here no need to put the 'dfi-&gt;last_readdir',</div><div class='add'>+			 * because when dir_emit stops us it's most likely</div><div class='add'>+			 * doesn't have enough memory, etc. So for next readdir</div><div class='add'>+			 * it will continue.</div><div class='add'>+			 */</div><div class='add'>+			doutc(cl, "filldir stopping us...\n");</div><div class='ctx'> 			return 0;</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='add'>+		/* Reset the lengths to their original allocated vals */</div><div class='ctx'> 		ctx-&gt;pos++;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -549,7 +597,8 @@ more:</div><div class='ctx'> 			kfree(dfi-&gt;last_name);</div><div class='ctx'> 			dfi-&gt;last_name = NULL;</div><div class='ctx'> 		}</div><div class='del'>-		dout("readdir next frag is %x\n", frag);</div><div class='add'>+		doutc(cl, "%p %llx.%llx next frag is %x\n", inode,</div><div class='add'>+		      ceph_vinop(inode), frag);</div><div class='ctx'> 		goto more;</div><div class='ctx'> 	}</div><div class='ctx'> 	dfi-&gt;file_info.flags |= CEPH_F_ATEND;</div><div class='hunk'>@@ -564,21 +613,23 @@ more:</div><div class='ctx'> 		spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 		if (dfi-&gt;dir_ordered_count ==</div><div class='ctx'> 				atomic64_read(&amp;ci-&gt;i_ordered_count)) {</div><div class='del'>-			dout(" marking %p complete and ordered\n", inode);</div><div class='add'>+			doutc(cl, " marking %p %llx.%llx complete and ordered\n",</div><div class='add'>+			      inode, ceph_vinop(inode));</div><div class='ctx'> 			/* use i_size to track number of entries in</div><div class='ctx'> 			 * readdir cache */</div><div class='ctx'> 			BUG_ON(dfi-&gt;readdir_cache_idx &lt; 0);</div><div class='ctx'> 			i_size_write(inode, dfi-&gt;readdir_cache_idx *</div><div class='ctx'> 				     sizeof(struct dentry*));</div><div class='ctx'> 		} else {</div><div class='del'>-			dout(" marking %p complete\n", inode);</div><div class='add'>+			doutc(cl, " marking %llx.%llx complete\n",</div><div class='add'>+			      ceph_vinop(inode));</div><div class='ctx'> 		}</div><div class='ctx'> 		__ceph_dir_set_complete(ci, dfi-&gt;dir_release_count,</div><div class='ctx'> 					dfi-&gt;dir_ordered_count);</div><div class='ctx'> 		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	dout("readdir %p file %p done.\n", inode, file);</div><div class='add'>+	doutc(cl, "%p %llx.%llx file %p done.\n", inode, ceph_vinop(inode),</div><div class='add'>+	      file);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -608,7 +659,7 @@ static bool need_reset_readdir(struct ceph_dir_file_info *dfi, loff_t new_pos)</div><div class='ctx'> 		return true;</div><div class='ctx'> 	if (is_hash_order(new_pos)) {</div><div class='ctx'> 		/* no need to reset last_name for a forward seek when</div><div class='del'>-		 * dentries are sotred in hash order */</div><div class='add'>+		 * dentries are sorted in hash order */</div><div class='ctx'> 	} else if (dfi-&gt;frag != fpos_frag(new_pos)) {</div><div class='ctx'> 		return true;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -624,6 +675,7 @@ static loff_t ceph_dir_llseek(struct file *file, loff_t offset, int whence)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_dir_file_info *dfi = file-&gt;private_data;</div><div class='ctx'> 	struct inode *inode = file-&gt;f_mapping-&gt;host;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	loff_t retval;</div><div class='ctx'> </div><div class='ctx'> 	inode_lock(inode);</div><div class='hunk'>@@ -643,7 +695,8 @@ static loff_t ceph_dir_llseek(struct file *file, loff_t offset, int whence)</div><div class='ctx'> </div><div class='ctx'> 	if (offset &gt;= 0) {</div><div class='ctx'> 		if (need_reset_readdir(dfi, offset)) {</div><div class='del'>-			dout("dir_llseek dropping %p content\n", file);</div><div class='add'>+			doutc(cl, "%p %llx.%llx dropping %p content\n",</div><div class='add'>+			      inode, ceph_vinop(inode), file);</div><div class='ctx'> 			reset_readdir(dfi);</div><div class='ctx'> 		} else if (is_hash_order(offset) &amp;&amp; offset &gt; file-&gt;f_pos) {</div><div class='ctx'> 			/* for hash offset, we don't know if a forward seek</div><div class='hunk'>@@ -654,7 +707,6 @@ static loff_t ceph_dir_llseek(struct file *file, loff_t offset, int whence)</div><div class='ctx'> </div><div class='ctx'> 		if (offset != file-&gt;f_pos) {</div><div class='ctx'> 			file-&gt;f_pos = offset;</div><div class='del'>-			file-&gt;f_version = 0;</div><div class='ctx'> 			dfi-&gt;file_info.flags &amp;= ~CEPH_F_ATEND;</div><div class='ctx'> 		}</div><div class='ctx'> 		retval = offset;</div><div class='hunk'>@@ -670,8 +722,9 @@ out:</div><div class='ctx'> struct dentry *ceph_handle_snapdir(struct ceph_mds_request *req,</div><div class='ctx'> 				   struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_sb_to_client(dentry-&gt;d_sb);</div><div class='del'>-	struct inode *parent = d_inode(dentry-&gt;d_parent); /* we hold i_mutex */</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_sb_to_fs_client(dentry-&gt;d_sb);</div><div class='add'>+	struct inode *parent = d_inode(dentry-&gt;d_parent); /* we hold i_rwsem */</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(parent);</div><div class='ctx'> </div><div class='ctx'> 	/* .snap dir? */</div><div class='ctx'> 	if (ceph_snap(parent) == CEPH_NOSNAP &amp;&amp;</div><div class='hunk'>@@ -680,8 +733,9 @@ struct dentry *ceph_handle_snapdir(struct ceph_mds_request *req,</div><div class='ctx'> 		struct inode *inode = ceph_get_snapdir(parent);</div><div class='ctx'> </div><div class='ctx'> 		res = d_splice_alias(inode, dentry);</div><div class='del'>-		dout("ENOENT on snapdir %p '%pd', linking to snapdir %p. Spliced dentry %p\n",</div><div class='del'>-		     dentry, dentry, inode, res);</div><div class='add'>+		doutc(cl, "ENOENT on snapdir %p '%pd', linking to "</div><div class='add'>+		      "snapdir %p %llx.%llx. Spliced dentry %p\n",</div><div class='add'>+		      dentry, dentry, inode, ceph_vinop(inode), res);</div><div class='ctx'> 		if (res)</div><div class='ctx'> 			dentry = res;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -702,12 +756,15 @@ struct dentry *ceph_handle_snapdir(struct ceph_mds_request *req,</div><div class='ctx'> struct dentry *ceph_finish_lookup(struct ceph_mds_request *req,</div><div class='ctx'> 				  struct dentry *dentry, int err)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = req-&gt;r_mdsc-&gt;fsc-&gt;client;</div><div class='add'>+</div><div class='ctx'> 	if (err == -ENOENT) {</div><div class='ctx'> 		/* no trace? */</div><div class='ctx'> 		err = 0;</div><div class='ctx'> 		if (!req-&gt;r_reply_info.head-&gt;is_dentry) {</div><div class='del'>-			dout("ENOENT and no trace, dentry %p inode %p\n",</div><div class='del'>-			     dentry, d_inode(dentry));</div><div class='add'>+			doutc(cl,</div><div class='add'>+			      "ENOENT and no trace, dentry %p inode %llx.%llx\n",</div><div class='add'>+			      dentry, ceph_vinop(d_inode(dentry)));</div><div class='ctx'> 			if (d_really_is_positive(dentry)) {</div><div class='ctx'> 				d_drop(dentry);</div><div class='ctx'> 				err = -ENOENT;</div><div class='hunk'>@@ -738,26 +795,40 @@ static bool is_root_ceph_dentry(struct inode *inode, struct dentry *dentry)</div><div class='ctx'> static struct dentry *ceph_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 				  unsigned int flags)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_sb_to_client(dir-&gt;i_sb);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_sb_to_fs_client(dir-&gt;i_sb);</div><div class='ctx'> 	struct ceph_mds_client *mdsc = ceph_sb_to_mdsc(dir-&gt;i_sb);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='ctx'> 	struct ceph_mds_request *req;</div><div class='ctx'> 	int op;</div><div class='ctx'> 	int mask;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	dout("lookup %p dentry %p '%pd'\n",</div><div class='del'>-	     dir, dentry, dentry);</div><div class='add'>+	doutc(cl, "%p %llx.%llx/'%pd' dentry %p\n", dir, ceph_vinop(dir),</div><div class='add'>+	      dentry, dentry);</div><div class='ctx'> </div><div class='ctx'> 	if (dentry-&gt;d_name.len &gt; NAME_MAX)</div><div class='ctx'> 		return ERR_PTR(-ENAMETOOLONG);</div><div class='ctx'> </div><div class='add'>+	if (IS_ENCRYPTED(dir)) {</div><div class='add'>+		bool had_key = fscrypt_has_encryption_key(dir);</div><div class='add'>+</div><div class='add'>+		err = fscrypt_prepare_lookup_partial(dir, dentry);</div><div class='add'>+		if (err &lt; 0)</div><div class='add'>+			return ERR_PTR(err);</div><div class='add'>+</div><div class='add'>+		/* mark directory as incomplete if it has been unlocked */</div><div class='add'>+		if (!had_key &amp;&amp; fscrypt_has_encryption_key(dir))</div><div class='add'>+			ceph_dir_clear_complete(dir);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/* can we conclude ENOENT locally? */</div><div class='ctx'> 	if (d_really_is_negative(dentry)) {</div><div class='ctx'> 		struct ceph_inode_info *ci = ceph_inode(dir);</div><div class='ctx'> 		struct ceph_dentry_info *di = ceph_dentry(dentry);</div><div class='ctx'> </div><div class='ctx'> 		spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-		dout(" dir %p flags are 0x%lx\n", dir, ci-&gt;i_ceph_flags);</div><div class='add'>+		doutc(cl, " dir %llx.%llx flags are 0x%lx\n",</div><div class='add'>+		      ceph_vinop(dir), ci-&gt;i_ceph_flags);</div><div class='ctx'> 		if (strncmp(dentry-&gt;d_name.name,</div><div class='ctx'> 			    fsc-&gt;mount_options-&gt;snapdir_name,</div><div class='ctx'> 			    dentry-&gt;d_name.len) &amp;&amp;</div><div class='hunk'>@@ -767,7 +838,8 @@ static struct dentry *ceph_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 		    __ceph_caps_issued_mask_metric(ci, CEPH_CAP_FILE_SHARED, 1)) {</div><div class='ctx'> 			__ceph_touch_fmode(ci, mdsc, CEPH_FILE_MODE_RD);</div><div class='ctx'> 			spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-			dout(" dir %p complete, -ENOENT\n", dir);</div><div class='add'>+			doutc(cl, " dir %llx.%llx complete, -ENOENT\n",</div><div class='add'>+			      ceph_vinop(dir));</div><div class='ctx'> 			d_add(dentry, NULL);</div><div class='ctx'> 			di-&gt;lease_shared_gen = atomic_read(&amp;ci-&gt;i_shared_gen);</div><div class='ctx'> 			return NULL;</div><div class='hunk'>@@ -805,7 +877,7 @@ static struct dentry *ceph_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	}</div><div class='ctx'> 	dentry = ceph_finish_lookup(req, dentry, err);</div><div class='ctx'> 	ceph_mdsc_put_request(req);  /* will dput(dentry) */</div><div class='del'>-	dout("lookup result=%p\n", dentry);</div><div class='add'>+	doutc(cl, "result=%p\n", dentry);</div><div class='ctx'> 	return dentry;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -836,10 +908,11 @@ int ceph_handle_notrace_create(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	return PTR_ERR(result);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ceph_mknod(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int ceph_mknod(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		      struct dentry *dentry, umode_t mode, dev_t rdev)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_mds_client *mdsc = ceph_sb_to_mdsc(dir-&gt;i_sb);</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_mds_request *req;</div><div class='ctx'> 	struct ceph_acl_sec_ctx as_ctx = {};</div><div class='ctx'> 	int err;</div><div class='hunk'>@@ -847,41 +920,51 @@ static int ceph_mknod(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	if (ceph_snap(dir) != CEPH_NOSNAP)</div><div class='ctx'> 		return -EROFS;</div><div class='ctx'> </div><div class='add'>+	err = ceph_wait_on_conflict_unlink(dentry);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='ctx'> 	if (ceph_quota_is_max_files_exceeded(dir)) {</div><div class='ctx'> 		err = -EDQUOT;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = ceph_pre_init_acls(dir, &amp;mode, &amp;as_ctx);</div><div class='del'>-	if (err &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-	err = ceph_security_init_secctx(dentry, mode, &amp;as_ctx);</div><div class='del'>-	if (err &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	dout("mknod in dir %p dentry %p mode 0%ho rdev %d\n",</div><div class='del'>-	     dir, dentry, mode, rdev);</div><div class='add'>+	doutc(cl, "%p %llx.%llx/'%pd' dentry %p mode 0%ho rdev %d\n",</div><div class='add'>+	      dir, ceph_vinop(dir), dentry, dentry, mode, rdev);</div><div class='ctx'> 	req = ceph_mdsc_create_request(mdsc, CEPH_MDS_OP_MKNOD, USE_AUTH_MDS);</div><div class='ctx'> 	if (IS_ERR(req)) {</div><div class='ctx'> 		err = PTR_ERR(req);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	req-&gt;r_new_inode = ceph_new_inode(dir, dentry, &amp;mode, &amp;as_ctx);</div><div class='add'>+	if (IS_ERR(req-&gt;r_new_inode)) {</div><div class='add'>+		err = PTR_ERR(req-&gt;r_new_inode);</div><div class='add'>+		req-&gt;r_new_inode = NULL;</div><div class='add'>+		goto out_req;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (S_ISREG(mode) &amp;&amp; IS_ENCRYPTED(dir))</div><div class='add'>+		set_bit(CEPH_MDS_R_FSCRYPT_FILE, &amp;req-&gt;r_req_flags);</div><div class='add'>+</div><div class='ctx'> 	req-&gt;r_dentry = dget(dentry);</div><div class='ctx'> 	req-&gt;r_num_caps = 2;</div><div class='ctx'> 	req-&gt;r_parent = dir;</div><div class='ctx'> 	ihold(dir);</div><div class='ctx'> 	set_bit(CEPH_MDS_R_PARENT_LOCKED, &amp;req-&gt;r_req_flags);</div><div class='add'>+	req-&gt;r_mnt_idmap = mnt_idmap_get(idmap);</div><div class='ctx'> 	req-&gt;r_args.mknod.mode = cpu_to_le32(mode);</div><div class='ctx'> 	req-&gt;r_args.mknod.rdev = cpu_to_le32(rdev);</div><div class='del'>-	req-&gt;r_dentry_drop = CEPH_CAP_FILE_SHARED | CEPH_CAP_AUTH_EXCL;</div><div class='add'>+	req-&gt;r_dentry_drop = CEPH_CAP_FILE_SHARED | CEPH_CAP_AUTH_EXCL |</div><div class='add'>+			     CEPH_CAP_XATTR_EXCL;</div><div class='ctx'> 	req-&gt;r_dentry_unless = CEPH_CAP_FILE_EXCL;</div><div class='del'>-	if (as_ctx.pagelist) {</div><div class='del'>-		req-&gt;r_pagelist = as_ctx.pagelist;</div><div class='del'>-		as_ctx.pagelist = NULL;</div><div class='del'>-	}</div><div class='add'>+</div><div class='add'>+	ceph_as_ctx_to_req(req, &amp;as_ctx);</div><div class='add'>+</div><div class='ctx'> 	err = ceph_mdsc_do_request(mdsc, dir, req);</div><div class='ctx'> 	if (!err &amp;&amp; !req-&gt;r_reply_info.head-&gt;is_dentry)</div><div class='ctx'> 		err = ceph_handle_notrace_create(dir, dentry);</div><div class='add'>+out_req:</div><div class='ctx'> 	ceph_mdsc_put_request(req);</div><div class='ctx'> out:</div><div class='ctx'> 	if (!err)</div><div class='hunk'>@@ -892,59 +975,116 @@ out:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ceph_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int ceph_create(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		       struct dentry *dentry, umode_t mode, bool excl)</div><div class='ctx'> {</div><div class='del'>-	return ceph_mknod(mnt_userns, dir, dentry, mode, 0);</div><div class='add'>+	return ceph_mknod(idmap, dir, dentry, mode, 0);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#if IS_ENABLED(CONFIG_FS_ENCRYPTION)</div><div class='add'>+static int prep_encrypted_symlink_target(struct ceph_mds_request *req,</div><div class='add'>+					 const char *dest)</div><div class='add'>+{</div><div class='add'>+	int err;</div><div class='add'>+	int len = strlen(dest);</div><div class='add'>+	struct fscrypt_str osd_link = FSTR_INIT(NULL, 0);</div><div class='add'>+</div><div class='add'>+	err = fscrypt_prepare_symlink(req-&gt;r_parent, dest, len, PATH_MAX,</div><div class='add'>+				      &amp;osd_link);</div><div class='add'>+	if (err)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	err = fscrypt_encrypt_symlink(req-&gt;r_new_inode, dest, len, &amp;osd_link);</div><div class='add'>+	if (err)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	req-&gt;r_path2 = kmalloc(BASE64_CHARS(osd_link.len) + 1, GFP_KERNEL);</div><div class='add'>+	if (!req-&gt;r_path2) {</div><div class='add'>+		err = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	len = base64_encode(osd_link.name, osd_link.len,</div><div class='add'>+			    req-&gt;r_path2, false, BASE64_IMAP);</div><div class='add'>+	req-&gt;r_path2[len] = '\0';</div><div class='add'>+out:</div><div class='add'>+	fscrypt_fname_free_buffer(&amp;osd_link);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+static int prep_encrypted_symlink_target(struct ceph_mds_request *req,</div><div class='add'>+					 const char *dest)</div><div class='add'>+{</div><div class='add'>+	return -EOPNOTSUPP;</div><div class='ctx'> }</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='del'>-static int ceph_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int ceph_symlink(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 			struct dentry *dentry, const char *dest)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_mds_client *mdsc = ceph_sb_to_mdsc(dir-&gt;i_sb);</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_mds_request *req;</div><div class='ctx'> 	struct ceph_acl_sec_ctx as_ctx = {};</div><div class='add'>+	umode_t mode = S_IFLNK | 0777;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (ceph_snap(dir) != CEPH_NOSNAP)</div><div class='ctx'> 		return -EROFS;</div><div class='ctx'> </div><div class='add'>+	err = ceph_wait_on_conflict_unlink(dentry);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='ctx'> 	if (ceph_quota_is_max_files_exceeded(dir)) {</div><div class='ctx'> 		err = -EDQUOT;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = ceph_security_init_secctx(dentry, S_IFLNK | 0777, &amp;as_ctx);</div><div class='del'>-	if (err &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	dout("symlink in dir %p dentry %p to '%s'\n", dir, dentry, dest);</div><div class='add'>+	doutc(cl, "%p %llx.%llx/'%pd' to '%s'\n", dir, ceph_vinop(dir), dentry,</div><div class='add'>+	      dest);</div><div class='ctx'> 	req = ceph_mdsc_create_request(mdsc, CEPH_MDS_OP_SYMLINK, USE_AUTH_MDS);</div><div class='ctx'> 	if (IS_ERR(req)) {</div><div class='ctx'> 		err = PTR_ERR(req);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	req-&gt;r_path2 = kstrdup(dest, GFP_KERNEL);</div><div class='del'>-	if (!req-&gt;r_path2) {</div><div class='del'>-		err = -ENOMEM;</div><div class='del'>-		ceph_mdsc_put_request(req);</div><div class='del'>-		goto out;</div><div class='add'>+</div><div class='add'>+	req-&gt;r_new_inode = ceph_new_inode(dir, dentry, &amp;mode, &amp;as_ctx);</div><div class='add'>+	if (IS_ERR(req-&gt;r_new_inode)) {</div><div class='add'>+		err = PTR_ERR(req-&gt;r_new_inode);</div><div class='add'>+		req-&gt;r_new_inode = NULL;</div><div class='add'>+		goto out_req;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> 	req-&gt;r_parent = dir;</div><div class='ctx'> 	ihold(dir);</div><div class='ctx'> </div><div class='add'>+	if (IS_ENCRYPTED(req-&gt;r_new_inode)) {</div><div class='add'>+		err = prep_encrypted_symlink_target(req, dest);</div><div class='add'>+		if (err)</div><div class='add'>+			goto out_req;</div><div class='add'>+	} else {</div><div class='add'>+		req-&gt;r_path2 = kstrdup(dest, GFP_KERNEL);</div><div class='add'>+		if (!req-&gt;r_path2) {</div><div class='add'>+			err = -ENOMEM;</div><div class='add'>+			goto out_req;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	set_bit(CEPH_MDS_R_PARENT_LOCKED, &amp;req-&gt;r_req_flags);</div><div class='add'>+	req-&gt;r_mnt_idmap = mnt_idmap_get(idmap);</div><div class='ctx'> 	req-&gt;r_dentry = dget(dentry);</div><div class='ctx'> 	req-&gt;r_num_caps = 2;</div><div class='del'>-	req-&gt;r_dentry_drop = CEPH_CAP_FILE_SHARED | CEPH_CAP_AUTH_EXCL;</div><div class='add'>+	req-&gt;r_dentry_drop = CEPH_CAP_FILE_SHARED | CEPH_CAP_AUTH_EXCL |</div><div class='add'>+			     CEPH_CAP_XATTR_EXCL;</div><div class='ctx'> 	req-&gt;r_dentry_unless = CEPH_CAP_FILE_EXCL;</div><div class='del'>-	if (as_ctx.pagelist) {</div><div class='del'>-		req-&gt;r_pagelist = as_ctx.pagelist;</div><div class='del'>-		as_ctx.pagelist = NULL;</div><div class='del'>-	}</div><div class='add'>+</div><div class='add'>+	ceph_as_ctx_to_req(req, &amp;as_ctx);</div><div class='add'>+</div><div class='ctx'> 	err = ceph_mdsc_do_request(mdsc, dir, req);</div><div class='ctx'> 	if (!err &amp;&amp; !req-&gt;r_reply_info.head-&gt;is_dentry)</div><div class='ctx'> 		err = ceph_handle_notrace_create(dir, dentry);</div><div class='add'>+out_req:</div><div class='ctx'> 	ceph_mdsc_put_request(req);</div><div class='ctx'> out:</div><div class='ctx'> 	if (err)</div><div class='hunk'>@@ -953,86 +1093,122 @@ out:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ceph_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-		      struct dentry *dentry, umode_t mode)</div><div class='add'>+static struct dentry *ceph_mkdir(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+				 struct dentry *dentry, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_mds_client *mdsc = ceph_sb_to_mdsc(dir-&gt;i_sb);</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_mds_request *req;</div><div class='ctx'> 	struct ceph_acl_sec_ctx as_ctx = {};</div><div class='del'>-	int err = -EROFS;</div><div class='add'>+	struct dentry *ret;</div><div class='add'>+	int err;</div><div class='ctx'> 	int op;</div><div class='ctx'> </div><div class='add'>+	err = ceph_wait_on_conflict_unlink(dentry);</div><div class='add'>+	if (err)</div><div class='add'>+		return ERR_PTR(err);</div><div class='add'>+</div><div class='ctx'> 	if (ceph_snap(dir) == CEPH_SNAPDIR) {</div><div class='ctx'> 		/* mkdir .snap/foo is a MKSNAP */</div><div class='ctx'> 		op = CEPH_MDS_OP_MKSNAP;</div><div class='del'>-		dout("mksnap dir %p snap '%pd' dn %p\n", dir,</div><div class='del'>-		     dentry, dentry);</div><div class='add'>+		doutc(cl, "mksnap %llx.%llx/'%pd' dentry %p\n",</div><div class='add'>+		      ceph_vinop(dir), dentry, dentry);</div><div class='ctx'> 	} else if (ceph_snap(dir) == CEPH_NOSNAP) {</div><div class='del'>-		dout("mkdir dir %p dn %p mode 0%ho\n", dir, dentry, mode);</div><div class='add'>+		doutc(cl, "mkdir %llx.%llx/'%pd' dentry %p mode 0%ho\n",</div><div class='add'>+		      ceph_vinop(dir), dentry, dentry, mode);</div><div class='ctx'> 		op = CEPH_MDS_OP_MKDIR;</div><div class='ctx'> 	} else {</div><div class='add'>+		ret = ERR_PTR(-EROFS);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (op == CEPH_MDS_OP_MKDIR &amp;&amp;</div><div class='ctx'> 	    ceph_quota_is_max_files_exceeded(dir)) {</div><div class='del'>-		err = -EDQUOT;</div><div class='add'>+		ret = ERR_PTR(-EDQUOT);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	mode |= S_IFDIR;</div><div class='del'>-	err = ceph_pre_init_acls(dir, &amp;mode, &amp;as_ctx);</div><div class='del'>-	if (err &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-	err = ceph_security_init_secctx(dentry, mode, &amp;as_ctx);</div><div class='del'>-	if (err &lt; 0)</div><div class='add'>+	if ((op == CEPH_MDS_OP_MKSNAP) &amp;&amp; IS_ENCRYPTED(dir) &amp;&amp;</div><div class='add'>+	    !fscrypt_has_encryption_key(dir)) {</div><div class='add'>+		ret = ERR_PTR(-ENOKEY);</div><div class='ctx'> 		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> </div><div class='ctx'> 	req = ceph_mdsc_create_request(mdsc, op, USE_AUTH_MDS);</div><div class='ctx'> 	if (IS_ERR(req)) {</div><div class='del'>-		err = PTR_ERR(req);</div><div class='add'>+		ret = ERR_CAST(req);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	mode |= S_IFDIR;</div><div class='add'>+	req-&gt;r_new_inode = ceph_new_inode(dir, dentry, &amp;mode, &amp;as_ctx);</div><div class='add'>+	if (IS_ERR(req-&gt;r_new_inode)) {</div><div class='add'>+		ret = ERR_CAST(req-&gt;r_new_inode);</div><div class='add'>+		req-&gt;r_new_inode = NULL;</div><div class='add'>+		goto out_req;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	req-&gt;r_dentry = dget(dentry);</div><div class='ctx'> 	req-&gt;r_num_caps = 2;</div><div class='ctx'> 	req-&gt;r_parent = dir;</div><div class='ctx'> 	ihold(dir);</div><div class='ctx'> 	set_bit(CEPH_MDS_R_PARENT_LOCKED, &amp;req-&gt;r_req_flags);</div><div class='add'>+	if (op == CEPH_MDS_OP_MKDIR)</div><div class='add'>+		req-&gt;r_mnt_idmap = mnt_idmap_get(idmap);</div><div class='ctx'> 	req-&gt;r_args.mkdir.mode = cpu_to_le32(mode);</div><div class='del'>-	req-&gt;r_dentry_drop = CEPH_CAP_FILE_SHARED | CEPH_CAP_AUTH_EXCL;</div><div class='add'>+	req-&gt;r_dentry_drop = CEPH_CAP_FILE_SHARED | CEPH_CAP_AUTH_EXCL |</div><div class='add'>+			     CEPH_CAP_XATTR_EXCL;</div><div class='ctx'> 	req-&gt;r_dentry_unless = CEPH_CAP_FILE_EXCL;</div><div class='del'>-	if (as_ctx.pagelist) {</div><div class='del'>-		req-&gt;r_pagelist = as_ctx.pagelist;</div><div class='del'>-		as_ctx.pagelist = NULL;</div><div class='del'>-	}</div><div class='add'>+</div><div class='add'>+	ceph_as_ctx_to_req(req, &amp;as_ctx);</div><div class='add'>+</div><div class='ctx'> 	err = ceph_mdsc_do_request(mdsc, dir, req);</div><div class='ctx'> 	if (!err &amp;&amp;</div><div class='ctx'> 	    !req-&gt;r_reply_info.head-&gt;is_target &amp;&amp;</div><div class='ctx'> 	    !req-&gt;r_reply_info.head-&gt;is_dentry)</div><div class='ctx'> 		err = ceph_handle_notrace_create(dir, dentry);</div><div class='add'>+	ret = ERR_PTR(err);</div><div class='add'>+out_req:</div><div class='add'>+	if (!IS_ERR(ret) &amp;&amp; req-&gt;r_dentry != dentry)</div><div class='add'>+		/* Some other dentry was spliced in */</div><div class='add'>+		ret = dget(req-&gt;r_dentry);</div><div class='ctx'> 	ceph_mdsc_put_request(req);</div><div class='ctx'> out:</div><div class='del'>-	if (!err)</div><div class='add'>+	if (!IS_ERR(ret)) {</div><div class='add'>+		if (ret)</div><div class='add'>+			dentry = ret;</div><div class='ctx'> 		ceph_init_inode_acls(d_inode(dentry), &amp;as_ctx);</div><div class='del'>-	else</div><div class='add'>+	} else {</div><div class='ctx'> 		d_drop(dentry);</div><div class='add'>+	}</div><div class='ctx'> 	ceph_release_acl_sec_ctx(&amp;as_ctx);</div><div class='del'>-	return err;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ceph_link(struct dentry *old_dentry, struct inode *dir,</div><div class='ctx'> 		     struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_mds_client *mdsc = ceph_sb_to_mdsc(dir-&gt;i_sb);</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_mds_request *req;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='add'>+	if (dentry-&gt;d_flags &amp; DCACHE_DISCONNECTED)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	err = ceph_wait_on_conflict_unlink(dentry);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='ctx'> 	if (ceph_snap(dir) != CEPH_NOSNAP)</div><div class='ctx'> 		return -EROFS;</div><div class='ctx'> </div><div class='del'>-	dout("link in dir %p old_dentry %p dentry %p\n", dir,</div><div class='del'>-	     old_dentry, dentry);</div><div class='add'>+	err = fscrypt_prepare_link(old_dentry, dir, dentry);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	doutc(cl, "%p %llx.%llx/'%pd' to '%pd'\n", dir, ceph_vinop(dir),</div><div class='add'>+	      old_dentry, dentry);</div><div class='ctx'> 	req = ceph_mdsc_create_request(mdsc, CEPH_MDS_OP_LINK, USE_AUTH_MDS);</div><div class='ctx'> 	if (IS_ERR(req)) {</div><div class='ctx'> 		d_drop(dentry);</div><div class='hunk'>@@ -1041,10 +1217,16 @@ static int ceph_link(struct dentry *old_dentry, struct inode *dir,</div><div class='ctx'> 	req-&gt;r_dentry = dget(dentry);</div><div class='ctx'> 	req-&gt;r_num_caps = 2;</div><div class='ctx'> 	req-&gt;r_old_dentry = dget(old_dentry);</div><div class='add'>+	/*</div><div class='add'>+	 * The old_dentry maybe a DCACHE_DISCONNECTED dentry, then we</div><div class='add'>+	 * will just pass the ino# to MDSs.</div><div class='add'>+	 */</div><div class='add'>+	if (old_dentry-&gt;d_flags &amp; DCACHE_DISCONNECTED)</div><div class='add'>+		req-&gt;r_ino2 = ceph_vino(d_inode(old_dentry));</div><div class='ctx'> 	req-&gt;r_parent = dir;</div><div class='ctx'> 	ihold(dir);</div><div class='ctx'> 	set_bit(CEPH_MDS_R_PARENT_LOCKED, &amp;req-&gt;r_req_flags);</div><div class='del'>-	req-&gt;r_dentry_drop = CEPH_CAP_FILE_SHARED;</div><div class='add'>+	req-&gt;r_dentry_drop = CEPH_CAP_FILE_SHARED | CEPH_CAP_XATTR_EXCL;</div><div class='ctx'> 	req-&gt;r_dentry_unless = CEPH_CAP_FILE_EXCL;</div><div class='ctx'> 	/* release LINK_SHARED on source inode (mds will lock it) */</div><div class='ctx'> 	req-&gt;r_old_inode_drop = CEPH_CAP_LINK_SHARED | CEPH_CAP_LINK_EXCL;</div><div class='hunk'>@@ -1062,33 +1244,50 @@ static int ceph_link(struct dentry *old_dentry, struct inode *dir,</div><div class='ctx'> static void ceph_async_unlink_cb(struct ceph_mds_client *mdsc,</div><div class='ctx'> 				 struct ceph_mds_request *req)</div><div class='ctx'> {</div><div class='add'>+	struct dentry *dentry = req-&gt;r_dentry;</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_sb_to_fs_client(dentry-&gt;d_sb);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='add'>+	struct ceph_dentry_info *di = ceph_dentry(dentry);</div><div class='ctx'> 	int result = req-&gt;r_err ? req-&gt;r_err :</div><div class='ctx'> 			le32_to_cpu(req-&gt;r_reply_info.head-&gt;result);</div><div class='ctx'> </div><div class='add'>+	if (!test_bit(CEPH_DENTRY_ASYNC_UNLINK_BIT, &amp;di-&gt;flags))</div><div class='add'>+		pr_warn_client(cl,</div><div class='add'>+			"dentry %p:%pd async unlink bit is not set\n",</div><div class='add'>+			dentry, dentry);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fsc-&gt;async_unlink_conflict_lock);</div><div class='add'>+	hash_del_rcu(&amp;di-&gt;hnode);</div><div class='add'>+	spin_unlock(&amp;fsc-&gt;async_unlink_conflict_lock);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;dentry-&gt;d_lock);</div><div class='add'>+	clear_and_wake_up_bit(CEPH_DENTRY_ASYNC_UNLINK_BIT, &amp;di-&gt;flags);</div><div class='add'>+	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='add'>+</div><div class='add'>+	synchronize_rcu();</div><div class='add'>+</div><div class='ctx'> 	if (result == -EJUKEBOX)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	/* If op failed, mark everyone involved for errors */</div><div class='ctx'> 	if (result) {</div><div class='del'>-		int pathlen = 0;</div><div class='del'>-		u64 base = 0;</div><div class='del'>-		char *path = ceph_mdsc_build_path(req-&gt;r_dentry, &amp;pathlen,</div><div class='del'>-						  &amp;base, 0);</div><div class='add'>+		struct ceph_path_info path_info = {0};</div><div class='add'>+		char *path = ceph_mdsc_build_path(mdsc, dentry, &amp;path_info, 0);</div><div class='ctx'> </div><div class='ctx'> 		/* mark error on parent + clear complete */</div><div class='ctx'> 		mapping_set_error(req-&gt;r_parent-&gt;i_mapping, result);</div><div class='ctx'> 		ceph_dir_clear_complete(req-&gt;r_parent);</div><div class='ctx'> </div><div class='ctx'> 		/* drop the dentry -- we don't know its status */</div><div class='del'>-		if (!d_unhashed(req-&gt;r_dentry))</div><div class='del'>-			d_drop(req-&gt;r_dentry);</div><div class='add'>+		if (!d_unhashed(dentry))</div><div class='add'>+			d_drop(dentry);</div><div class='ctx'> </div><div class='ctx'> 		/* mark inode itself for an error (since metadata is bogus) */</div><div class='ctx'> 		mapping_set_error(req-&gt;r_old_inode-&gt;i_mapping, result);</div><div class='ctx'> </div><div class='del'>-		pr_warn("ceph: async unlink failure path=(%llx)%s result=%d!\n",</div><div class='del'>-			base, IS_ERR(path) ? "&lt;&lt;bad&gt;&gt;" : path, result);</div><div class='del'>-		ceph_mdsc_free_path(path, pathlen);</div><div class='add'>+		pr_warn_client(cl, "failure path=(%llx)%s result=%d!\n",</div><div class='add'>+			       path_info.vino.ino, IS_ERR(path) ? "&lt;&lt;bad&gt;&gt;" : path, result);</div><div class='add'>+		ceph_mdsc_free_path_info(&amp;path_info);</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='ctx'> 	iput(req-&gt;r_old_inode);</div><div class='hunk'>@@ -1136,25 +1335,54 @@ static int get_caps_for_async_unlink(struct inode *dir, struct dentry *dentry)</div><div class='ctx'>  */</div><div class='ctx'> static int ceph_unlink(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_sb_to_client(dir-&gt;i_sb);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_sb_to_fs_client(dir-&gt;i_sb);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='ctx'> 	struct ceph_mds_client *mdsc = fsc-&gt;mdsc;</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	struct ceph_mds_request *req;</div><div class='ctx'> 	bool try_async = ceph_test_mount_opt(fsc, ASYNC_DIROPS);</div><div class='add'>+	struct dentry *dn;</div><div class='ctx'> 	int err = -EROFS;</div><div class='ctx'> 	int op;</div><div class='add'>+	char *path;</div><div class='ctx'> </div><div class='ctx'> 	if (ceph_snap(dir) == CEPH_SNAPDIR) {</div><div class='ctx'> 		/* rmdir .snap/foo is RMSNAP */</div><div class='del'>-		dout("rmsnap dir %p '%pd' dn %p\n", dir, dentry, dentry);</div><div class='add'>+		doutc(cl, "rmsnap %llx.%llx/'%pd' dn\n", ceph_vinop(dir),</div><div class='add'>+		      dentry);</div><div class='ctx'> 		op = CEPH_MDS_OP_RMSNAP;</div><div class='ctx'> 	} else if (ceph_snap(dir) == CEPH_NOSNAP) {</div><div class='del'>-		dout("unlink/rmdir dir %p dn %p inode %p\n",</div><div class='del'>-		     dir, dentry, inode);</div><div class='add'>+		doutc(cl, "unlink/rmdir %llx.%llx/'%pd' inode %llx.%llx\n",</div><div class='add'>+		      ceph_vinop(dir), dentry, ceph_vinop(inode));</div><div class='ctx'> 		op = d_is_dir(dentry) ?</div><div class='ctx'> 			CEPH_MDS_OP_RMDIR : CEPH_MDS_OP_UNLINK;</div><div class='ctx'> 	} else</div><div class='ctx'> 		goto out;</div><div class='add'>+</div><div class='add'>+	dn = d_find_alias(dir);</div><div class='add'>+	if (!dn) {</div><div class='add'>+		try_async = false;</div><div class='add'>+	} else {</div><div class='add'>+		struct ceph_path_info path_info;</div><div class='add'>+		path = ceph_mdsc_build_path(mdsc, dn, &amp;path_info, 0);</div><div class='add'>+		if (IS_ERR(path)) {</div><div class='add'>+			try_async = false;</div><div class='add'>+			err = 0;</div><div class='add'>+		} else {</div><div class='add'>+			err = ceph_mds_check_access(mdsc, path, MAY_WRITE);</div><div class='add'>+		}</div><div class='add'>+		ceph_mdsc_free_path_info(&amp;path_info);</div><div class='add'>+		dput(dn);</div><div class='add'>+</div><div class='add'>+		/* For none EACCES cases will let the MDS do the mds auth check */</div><div class='add'>+		if (err == -EACCES) {</div><div class='add'>+			return err;</div><div class='add'>+		} else if (err &lt; 0) {</div><div class='add'>+			try_async = false;</div><div class='add'>+			err = 0;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> retry:</div><div class='ctx'> 	req = ceph_mdsc_create_request(mdsc, op, USE_AUTH_MDS);</div><div class='ctx'> 	if (IS_ERR(req)) {</div><div class='hunk'>@@ -1165,19 +1393,31 @@ retry:</div><div class='ctx'> 	req-&gt;r_num_caps = 2;</div><div class='ctx'> 	req-&gt;r_parent = dir;</div><div class='ctx'> 	ihold(dir);</div><div class='del'>-	req-&gt;r_dentry_drop = CEPH_CAP_FILE_SHARED;</div><div class='add'>+	req-&gt;r_dentry_drop = CEPH_CAP_FILE_SHARED | CEPH_CAP_XATTR_EXCL;</div><div class='ctx'> 	req-&gt;r_dentry_unless = CEPH_CAP_FILE_EXCL;</div><div class='ctx'> 	req-&gt;r_inode_drop = ceph_drop_caps_for_unlink(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (try_async &amp;&amp; op == CEPH_MDS_OP_UNLINK &amp;&amp;</div><div class='ctx'> 	    (req-&gt;r_dir_caps = get_caps_for_async_unlink(dir, dentry))) {</div><div class='del'>-		dout("async unlink on %llu/%.*s caps=%s", ceph_ino(dir),</div><div class='del'>-		     dentry-&gt;d_name.len, dentry-&gt;d_name.name,</div><div class='del'>-		     ceph_cap_string(req-&gt;r_dir_caps));</div><div class='add'>+		struct ceph_dentry_info *di = ceph_dentry(dentry);</div><div class='add'>+</div><div class='add'>+		doutc(cl, "async unlink on %llx.%llx/'%pd' caps=%s",</div><div class='add'>+		      ceph_vinop(dir), dentry,</div><div class='add'>+		      ceph_cap_string(req-&gt;r_dir_caps));</div><div class='ctx'> 		set_bit(CEPH_MDS_R_ASYNC, &amp;req-&gt;r_req_flags);</div><div class='ctx'> 		req-&gt;r_callback = ceph_async_unlink_cb;</div><div class='ctx'> 		req-&gt;r_old_inode = d_inode(dentry);</div><div class='ctx'> 		ihold(req-&gt;r_old_inode);</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;dentry-&gt;d_lock);</div><div class='add'>+		di-&gt;flags |= CEPH_DENTRY_ASYNC_UNLINK;</div><div class='add'>+		spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;fsc-&gt;async_unlink_conflict_lock);</div><div class='add'>+		hash_add_rcu(fsc-&gt;async_unlink_conflict, &amp;di-&gt;hnode,</div><div class='add'>+			     dentry-&gt;d_name.hash);</div><div class='add'>+		spin_unlock(&amp;fsc-&gt;async_unlink_conflict_lock);</div><div class='add'>+</div><div class='ctx'> 		err = ceph_mdsc_submit_request(mdsc, dir, req);</div><div class='ctx'> 		if (!err) {</div><div class='ctx'> 			/*</div><div class='hunk'>@@ -1186,10 +1426,20 @@ retry:</div><div class='ctx'> 			 */</div><div class='ctx'> 			drop_nlink(inode);</div><div class='ctx'> 			d_delete(dentry);</div><div class='del'>-		} else if (err == -EJUKEBOX) {</div><div class='del'>-			try_async = false;</div><div class='del'>-			ceph_mdsc_put_request(req);</div><div class='del'>-			goto retry;</div><div class='add'>+		} else {</div><div class='add'>+			spin_lock(&amp;fsc-&gt;async_unlink_conflict_lock);</div><div class='add'>+			hash_del_rcu(&amp;di-&gt;hnode);</div><div class='add'>+			spin_unlock(&amp;fsc-&gt;async_unlink_conflict_lock);</div><div class='add'>+</div><div class='add'>+			spin_lock(&amp;dentry-&gt;d_lock);</div><div class='add'>+			di-&gt;flags &amp;= ~CEPH_DENTRY_ASYNC_UNLINK;</div><div class='add'>+			spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='add'>+</div><div class='add'>+			if (err == -EJUKEBOX) {</div><div class='add'>+				try_async = false;</div><div class='add'>+				ceph_mdsc_put_request(req);</div><div class='add'>+				goto retry;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='ctx'> 		set_bit(CEPH_MDS_R_PARENT_LOCKED, &amp;req-&gt;r_req_flags);</div><div class='hunk'>@@ -1203,11 +1453,12 @@ out:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ceph_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='add'>+static int ceph_rename(struct mnt_idmap *idmap, struct inode *old_dir,</div><div class='ctx'> 		       struct dentry *old_dentry, struct inode *new_dir,</div><div class='ctx'> 		       struct dentry *new_dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_mds_client *mdsc = ceph_sb_to_mdsc(old_dir-&gt;i_sb);</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_mds_request *req;</div><div class='ctx'> 	int op = CEPH_MDS_OP_RENAME;</div><div class='ctx'> 	int err;</div><div class='hunk'>@@ -1228,8 +1479,18 @@ static int ceph_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> 	    (!ceph_quota_is_same_realm(old_dir, new_dir)))</div><div class='ctx'> 		return -EXDEV;</div><div class='ctx'> </div><div class='del'>-	dout("rename dir %p dentry %p to dir %p dentry %p\n",</div><div class='del'>-	     old_dir, old_dentry, new_dir, new_dentry);</div><div class='add'>+	err = ceph_wait_on_conflict_unlink(new_dentry);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	err = fscrypt_prepare_rename(old_dir, old_dentry, new_dir, new_dentry,</div><div class='add'>+				     flags);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	doutc(cl, "%llx.%llx/'%pd' to %llx.%llx/'%pd'\n",</div><div class='add'>+	      ceph_vinop(old_dir), old_dentry, ceph_vinop(new_dir),</div><div class='add'>+	      new_dentry);</div><div class='ctx'> 	req = ceph_mdsc_create_request(mdsc, op, USE_AUTH_MDS);</div><div class='ctx'> 	if (IS_ERR(req))</div><div class='ctx'> 		return PTR_ERR(req);</div><div class='hunk'>@@ -1241,9 +1502,9 @@ static int ceph_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> 	req-&gt;r_parent = new_dir;</div><div class='ctx'> 	ihold(new_dir);</div><div class='ctx'> 	set_bit(CEPH_MDS_R_PARENT_LOCKED, &amp;req-&gt;r_req_flags);</div><div class='del'>-	req-&gt;r_old_dentry_drop = CEPH_CAP_FILE_SHARED;</div><div class='add'>+	req-&gt;r_old_dentry_drop = CEPH_CAP_FILE_SHARED | CEPH_CAP_XATTR_EXCL;</div><div class='ctx'> 	req-&gt;r_old_dentry_unless = CEPH_CAP_FILE_EXCL;</div><div class='del'>-	req-&gt;r_dentry_drop = CEPH_CAP_FILE_SHARED;</div><div class='add'>+	req-&gt;r_dentry_drop = CEPH_CAP_FILE_SHARED | CEPH_CAP_XATTR_EXCL;</div><div class='ctx'> 	req-&gt;r_dentry_unless = CEPH_CAP_FILE_EXCL;</div><div class='ctx'> 	/* release LINK_RDCACHE on source inode (mds will lock it) */</div><div class='ctx'> 	req-&gt;r_old_inode_drop = CEPH_CAP_LINK_SHARED | CEPH_CAP_LINK_EXCL;</div><div class='hunk'>@@ -1274,9 +1535,10 @@ static int ceph_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> void __ceph_dentry_lease_touch(struct ceph_dentry_info *di)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dn = di-&gt;dentry;</div><div class='del'>-	struct ceph_mds_client *mdsc;</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_sb_to_fs_client(dn-&gt;d_sb)-&gt;mdsc;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> </div><div class='del'>-	dout("dentry_lease_touch %p %p '%pd'\n", di, dn, dn);</div><div class='add'>+	doutc(cl, "%p %p '%pd'\n", di, dn, dn);</div><div class='ctx'> </div><div class='ctx'> 	di-&gt;flags |= CEPH_DENTRY_LEASE_LIST;</div><div class='ctx'> 	if (di-&gt;flags &amp; CEPH_DENTRY_SHRINK_LIST) {</div><div class='hunk'>@@ -1284,7 +1546,6 @@ void __ceph_dentry_lease_touch(struct ceph_dentry_info *di)</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	mdsc = ceph_sb_to_client(dn-&gt;d_sb)-&gt;mdsc;</div><div class='ctx'> 	spin_lock(&amp;mdsc-&gt;dentry_list_lock);</div><div class='ctx'> 	list_move_tail(&amp;di-&gt;lease_list, &amp;mdsc-&gt;dentry_leases);</div><div class='ctx'> 	spin_unlock(&amp;mdsc-&gt;dentry_list_lock);</div><div class='hunk'>@@ -1308,10 +1569,10 @@ static void __dentry_dir_lease_touch(struct ceph_mds_client* mdsc,</div><div class='ctx'> void __ceph_dentry_dir_lease_touch(struct ceph_dentry_info *di)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dn = di-&gt;dentry;</div><div class='del'>-	struct ceph_mds_client *mdsc;</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_sb_to_fs_client(dn-&gt;d_sb)-&gt;mdsc;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> </div><div class='del'>-	dout("dentry_dir_lease_touch %p %p '%pd' (offset 0x%llx)\n",</div><div class='del'>-	     di, dn, dn, di-&gt;offset);</div><div class='add'>+	doutc(cl, "%p %p '%pd' (offset 0x%llx)\n", di, dn, dn, di-&gt;offset);</div><div class='ctx'> </div><div class='ctx'> 	if (!list_empty(&amp;di-&gt;lease_list)) {</div><div class='ctx'> 		if (di-&gt;flags &amp; CEPH_DENTRY_LEASE_LIST) {</div><div class='hunk'>@@ -1331,9 +1592,8 @@ void __ceph_dentry_dir_lease_touch(struct ceph_dentry_info *di)</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	mdsc = ceph_sb_to_client(dn-&gt;d_sb)-&gt;mdsc;</div><div class='ctx'> 	spin_lock(&amp;mdsc-&gt;dentry_list_lock);</div><div class='del'>-	__dentry_dir_lease_touch(mdsc, di),</div><div class='add'>+	__dentry_dir_lease_touch(mdsc, di);</div><div class='ctx'> 	spin_unlock(&amp;mdsc-&gt;dentry_list_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1345,7 +1605,7 @@ static void __dentry_lease_unlist(struct ceph_dentry_info *di)</div><div class='ctx'> 	if (list_empty(&amp;di-&gt;lease_list))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	mdsc = ceph_sb_to_client(di-&gt;dentry-&gt;d_sb)-&gt;mdsc;</div><div class='add'>+	mdsc = ceph_sb_to_fs_client(di-&gt;dentry-&gt;d_sb)-&gt;mdsc;</div><div class='ctx'> 	spin_lock(&amp;mdsc-&gt;dentry_list_lock);</div><div class='ctx'> 	list_del_init(&amp;di-&gt;lease_list);</div><div class='ctx'> 	spin_unlock(&amp;mdsc-&gt;dentry_list_lock);</div><div class='hunk'>@@ -1365,10 +1625,12 @@ struct ceph_lease_walk_control {</div><div class='ctx'> 	unsigned long dir_lease_ttl;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+static int __dir_lease_check(const struct dentry *, struct ceph_lease_walk_control *);</div><div class='add'>+static int __dentry_lease_check(const struct dentry *);</div><div class='add'>+</div><div class='ctx'> static unsigned long</div><div class='ctx'> __dentry_leases_walk(struct ceph_mds_client *mdsc,</div><div class='del'>-		     struct ceph_lease_walk_control *lwc,</div><div class='del'>-		     int (*check)(struct dentry*, void*))</div><div class='add'>+		     struct ceph_lease_walk_control *lwc)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_dentry_info *di, *tmp;</div><div class='ctx'> 	struct dentry *dentry, *last = NULL;</div><div class='hunk'>@@ -1396,7 +1658,10 @@ __dentry_leases_walk(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			goto next;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		ret = check(dentry, lwc);</div><div class='add'>+		if (lwc-&gt;dir_lease)</div><div class='add'>+			ret = __dir_lease_check(dentry, lwc);</div><div class='add'>+		else</div><div class='add'>+			ret = __dentry_lease_check(dentry);</div><div class='ctx'> 		if (ret &amp; TOUCH) {</div><div class='ctx'> 			/* move it into tail of dir lease list */</div><div class='ctx'> 			__dentry_dir_lease_touch(mdsc, di);</div><div class='hunk'>@@ -1453,7 +1718,7 @@ next:</div><div class='ctx'> 	return freed;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __dentry_lease_check(struct dentry *dentry, void *arg)</div><div class='add'>+static int __dentry_lease_check(const struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_dentry_info *di = ceph_dentry(dentry);</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -1468,9 +1733,9 @@ static int __dentry_lease_check(struct dentry *dentry, void *arg)</div><div class='ctx'> 	return DELETE;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __dir_lease_check(struct dentry *dentry, void *arg)</div><div class='add'>+static int __dir_lease_check(const struct dentry *dentry,</div><div class='add'>+			     struct ceph_lease_walk_control *lwc)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_lease_walk_control *lwc = arg;</div><div class='ctx'> 	struct ceph_dentry_info *di = ceph_dentry(dentry);</div><div class='ctx'> </div><div class='ctx'> 	int ret = __dir_lease_try_check(dentry);</div><div class='hunk'>@@ -1509,7 +1774,7 @@ int ceph_trim_dentries(struct ceph_mds_client *mdsc)</div><div class='ctx'> </div><div class='ctx'> 	lwc.dir_lease = false;</div><div class='ctx'> 	lwc.nr_to_scan  = CEPH_CAPS_PER_RELEASE * 2;</div><div class='del'>-	freed = __dentry_leases_walk(mdsc, &amp;lwc, __dentry_lease_check);</div><div class='add'>+	freed = __dentry_leases_walk(mdsc, &amp;lwc);</div><div class='ctx'> 	if (!lwc.nr_to_scan) /* more invalid leases */</div><div class='ctx'> 		return -EAGAIN;</div><div class='ctx'> </div><div class='hunk'>@@ -1519,7 +1784,7 @@ int ceph_trim_dentries(struct ceph_mds_client *mdsc)</div><div class='ctx'> 	lwc.dir_lease = true;</div><div class='ctx'> 	lwc.expire_dir_lease = freed &lt; count;</div><div class='ctx'> 	lwc.dir_lease_ttl = mdsc-&gt;fsc-&gt;mount_options-&gt;caps_wanted_delay_max * HZ;</div><div class='del'>-	freed +=__dentry_leases_walk(mdsc, &amp;lwc, __dir_lease_check);</div><div class='add'>+	freed +=__dentry_leases_walk(mdsc, &amp;lwc);</div><div class='ctx'> 	if (!lwc.nr_to_scan) /* more to check */</div><div class='ctx'> 		return -EAGAIN;</div><div class='ctx'> </div><div class='hunk'>@@ -1572,6 +1837,8 @@ static int dentry_lease_is_valid(struct dentry *dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_dentry_info *di;</div><div class='ctx'> 	struct ceph_mds_session *session = NULL;</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_sb_to_fs_client(dentry-&gt;d_sb)-&gt;mdsc;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	u32 seq = 0;</div><div class='ctx'> 	int valid = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -1604,7 +1871,7 @@ static int dentry_lease_is_valid(struct dentry *dentry, unsigned int flags)</div><div class='ctx'> 					 CEPH_MDS_LEASE_RENEW, seq);</div><div class='ctx'> 		ceph_put_mds_session(session);</div><div class='ctx'> 	}</div><div class='del'>-	dout("dentry_lease_is_valid - dentry %p = %d\n", dentry, valid);</div><div class='add'>+	doutc(cl, "dentry %p = %d\n", dentry, valid);</div><div class='ctx'> 	return valid;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1647,6 +1914,7 @@ static int dir_lease_is_valid(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 			      struct ceph_mds_client *mdsc)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(dir);</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	int valid;</div><div class='ctx'> 	int shared_gen;</div><div class='ctx'> </div><div class='hunk'>@@ -1668,42 +1936,39 @@ static int dir_lease_is_valid(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 			valid = 0;</div><div class='ctx'> 		spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 	}</div><div class='del'>-	dout("dir_lease_is_valid dir %p v%u dentry %p = %d\n",</div><div class='del'>-	     dir, (unsigned)atomic_read(&amp;ci-&gt;i_shared_gen), dentry, valid);</div><div class='add'>+	doutc(cl, "dir %p %llx.%llx v%u dentry %p '%pd' = %d\n", dir,</div><div class='add'>+	      ceph_vinop(dir), (unsigned)atomic_read(&amp;ci-&gt;i_shared_gen),</div><div class='add'>+	      dentry, dentry, valid);</div><div class='ctx'> 	return valid;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Check if cached dentry can be trusted.</div><div class='ctx'>  */</div><div class='del'>-static int ceph_d_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='add'>+static int ceph_d_revalidate(struct inode *dir, const struct qstr *name,</div><div class='add'>+			     struct dentry *dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_sb_to_fs_client(dentry-&gt;d_sb)-&gt;mdsc;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	int valid = 0;</div><div class='del'>-	struct dentry *parent;</div><div class='del'>-	struct inode *dir, *inode;</div><div class='del'>-	struct ceph_mds_client *mdsc;</div><div class='add'>+	struct inode *inode;</div><div class='ctx'> </div><div class='del'>-	if (flags &amp; LOOKUP_RCU) {</div><div class='del'>-		parent = READ_ONCE(dentry-&gt;d_parent);</div><div class='del'>-		dir = d_inode_rcu(parent);</div><div class='del'>-		if (!dir)</div><div class='del'>-			return -ECHILD;</div><div class='del'>-		inode = d_inode_rcu(dentry);</div><div class='del'>-	} else {</div><div class='del'>-		parent = dget_parent(dentry);</div><div class='del'>-		dir = d_inode(parent);</div><div class='del'>-		inode = d_inode(dentry);</div><div class='del'>-	}</div><div class='add'>+	valid = fscrypt_d_revalidate(dir, name, dentry, flags);</div><div class='add'>+	if (valid &lt;= 0)</div><div class='add'>+		return valid;</div><div class='ctx'> </div><div class='del'>-	dout("d_revalidate %p '%pd' inode %p offset 0x%llx\n", dentry,</div><div class='del'>-	     dentry, inode, ceph_dentry(dentry)-&gt;offset);</div><div class='add'>+	inode = d_inode_rcu(dentry);</div><div class='ctx'> </div><div class='del'>-	mdsc = ceph_sb_to_client(dir-&gt;i_sb)-&gt;mdsc;</div><div class='add'>+	doutc(cl, "%p '%pd' inode %p offset 0x%llx nokey %d\n",</div><div class='add'>+	      dentry, dentry, inode, ceph_dentry(dentry)-&gt;offset,</div><div class='add'>+	      !!(dentry-&gt;d_flags &amp; DCACHE_NOKEY_NAME));</div><div class='add'>+</div><div class='add'>+	mdsc = ceph_sb_to_fs_client(dir-&gt;i_sb)-&gt;mdsc;</div><div class='ctx'> </div><div class='ctx'> 	/* always trust cached snapped dentries, snapdir dentry */</div><div class='ctx'> 	if (ceph_snap(dir) != CEPH_NOSNAP) {</div><div class='del'>-		dout("d_revalidate %p '%pd' inode %p is SNAPPED\n", dentry,</div><div class='del'>-		     dentry, inode);</div><div class='add'>+		doutc(cl, "%p '%pd' inode %p is SNAPPED\n", dentry,</div><div class='add'>+		      dentry, inode);</div><div class='ctx'> 		valid = 1;</div><div class='ctx'> 	} else if (inode &amp;&amp; ceph_snap(inode) == CEPH_SNAPDIR) {</div><div class='ctx'> 		valid = 1;</div><div class='hunk'>@@ -1738,6 +2003,8 @@ static int ceph_d_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='ctx'> 			req-&gt;r_parent = dir;</div><div class='ctx'> 			ihold(dir);</div><div class='ctx'> </div><div class='add'>+			req-&gt;r_dname = name;</div><div class='add'>+</div><div class='ctx'> 			mask = CEPH_STAT_CAP_INODE | CEPH_CAP_AUTH_SHARED;</div><div class='ctx'> 			if (ceph_security_xattr_wanted(dir))</div><div class='ctx'> 				mask |= CEPH_CAP_XATTR_SHARED;</div><div class='hunk'>@@ -1758,19 +2025,16 @@ static int ceph_d_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> 			ceph_mdsc_put_request(req);</div><div class='del'>-			dout("d_revalidate %p lookup result=%d\n",</div><div class='del'>-			     dentry, err);</div><div class='add'>+			doutc(cl, "%p '%pd', lookup result=%d\n", dentry,</div><div class='add'>+			      dentry, err);</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='ctx'> 		percpu_counter_inc(&amp;mdsc-&gt;metric.d_lease_hit);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("d_revalidate %p %s\n", dentry, valid ? "valid" : "invalid");</div><div class='add'>+	doutc(cl, "%p '%pd' %s\n", dentry, dentry, valid ? "valid" : "invalid");</div><div class='ctx'> 	if (!valid)</div><div class='ctx'> 		ceph_dir_clear_complete(dir);</div><div class='del'>-</div><div class='del'>-	if (!(flags &amp; LOOKUP_RCU))</div><div class='del'>-		dput(parent);</div><div class='ctx'> 	return valid;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1788,7 +2052,7 @@ static int ceph_d_delete(const struct dentry *dentry)</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	if (ceph_snap(d_inode(dentry)) != CEPH_NOSNAP)</div><div class='ctx'> 		return 0;</div><div class='del'>-	/* vaild lease? */</div><div class='add'>+	/* valid lease? */</div><div class='ctx'> 	di = ceph_dentry(dentry);</div><div class='ctx'> 	if (di) {</div><div class='ctx'> 		if (__dentry_lease_is_valid(di))</div><div class='hunk'>@@ -1805,9 +2069,9 @@ static int ceph_d_delete(const struct dentry *dentry)</div><div class='ctx'> static void ceph_d_release(struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_dentry_info *di = ceph_dentry(dentry);</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_sb_to_client(dentry-&gt;d_sb);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_sb_to_fs_client(dentry-&gt;d_sb);</div><div class='ctx'> </div><div class='del'>-	dout("d_release %p\n", dentry);</div><div class='add'>+	doutc(fsc-&gt;client, "dentry %p '%pd'\n", dentry, dentry);</div><div class='ctx'> </div><div class='ctx'> 	atomic64_dec(&amp;fsc-&gt;mdsc-&gt;metric.total_dentries);</div><div class='ctx'> </div><div class='hunk'>@@ -1828,10 +2092,12 @@ static void ceph_d_release(struct dentry *dentry)</div><div class='ctx'>  */</div><div class='ctx'> static void ceph_d_prune(struct dentry *dentry)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_sb_to_mdsc(dentry-&gt;d_sb);</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_inode_info *dir_ci;</div><div class='ctx'> 	struct ceph_dentry_info *di;</div><div class='ctx'> </div><div class='del'>-	dout("ceph_d_prune %pd %p\n", dentry, dentry);</div><div class='add'>+	doutc(cl, "dentry %p '%pd'\n", dentry, dentry);</div><div class='ctx'> </div><div class='ctx'> 	/* do we have a valid parent? */</div><div class='ctx'> 	if (IS_ROOT(dentry))</div><div class='hunk'>@@ -1874,7 +2140,7 @@ static ssize_t ceph_read_dir(struct file *file, char __user *buf, size_t size,</div><div class='ctx'> 	int left;</div><div class='ctx'> 	const int bufsize = 1024;</div><div class='ctx'> </div><div class='del'>-	if (!ceph_test_mount_opt(ceph_sb_to_client(inode-&gt;i_sb), DIRSTAT))</div><div class='add'>+	if (!ceph_test_mount_opt(ceph_sb_to_fs_client(inode-&gt;i_sb), DIRSTAT))</div><div class='ctx'> 		return -EISDIR;</div><div class='ctx'> </div><div class='ctx'> 	if (!dfi-&gt;dir_info) {</div><div class='hunk'>@@ -1890,7 +2156,7 @@ static ssize_t ceph_read_dir(struct file *file, char __user *buf, size_t size,</div><div class='ctx'> 				" rfiles:   %20lld\n"</div><div class='ctx'> 				" rsubdirs: %20lld\n"</div><div class='ctx'> 				"rbytes:    %20lld\n"</div><div class='del'>-				"rctime:    %10lld.%09ld\n",</div><div class='add'>+				"rctime:    %ptSp\n",</div><div class='ctx'> 				ci-&gt;i_files + ci-&gt;i_subdirs,</div><div class='ctx'> 				ci-&gt;i_files,</div><div class='ctx'> 				ci-&gt;i_subdirs,</div><div class='hunk'>@@ -1898,8 +2164,7 @@ static ssize_t ceph_read_dir(struct file *file, char __user *buf, size_t size,</div><div class='ctx'> 				ci-&gt;i_rfiles,</div><div class='ctx'> 				ci-&gt;i_rsubdirs,</div><div class='ctx'> 				ci-&gt;i_rbytes,</div><div class='del'>-				ci-&gt;i_rctime.tv_sec,</div><div class='del'>-				ci-&gt;i_rctime.tv_nsec);</div><div class='add'>+				&amp;ci-&gt;i_rctime);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (*ppos &gt;= dfi-&gt;dir_info_len)</div><div class='hunk'>@@ -1937,9 +2202,10 @@ unsigned ceph_dentry_hash(struct inode *dir, struct dentry *dn)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+WRAP_DIR_ITER(ceph_readdir) // FIXME!</div><div class='ctx'> const struct file_operations ceph_dir_fops = {</div><div class='ctx'> 	.read = ceph_read_dir,</div><div class='del'>-	.iterate = ceph_readdir,</div><div class='add'>+	.iterate_shared = shared_ceph_readdir,</div><div class='ctx'> 	.llseek = ceph_dir_llseek,</div><div class='ctx'> 	.open = ceph_open,</div><div class='ctx'> 	.release = ceph_release,</div><div class='hunk'>@@ -1951,7 +2217,7 @@ const struct file_operations ceph_dir_fops = {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct file_operations ceph_snapdir_fops = {</div><div class='del'>-	.iterate = ceph_readdir,</div><div class='add'>+	.iterate_shared = shared_ceph_readdir,</div><div class='ctx'> 	.llseek = ceph_dir_llseek,</div><div class='ctx'> 	.open = ceph_open,</div><div class='ctx'> 	.release = ceph_release,</div><div class='hunk'>@@ -1963,7 +2229,7 @@ const struct inode_operations ceph_dir_iops = {</div><div class='ctx'> 	.getattr = ceph_getattr,</div><div class='ctx'> 	.setattr = ceph_setattr,</div><div class='ctx'> 	.listxattr = ceph_listxattr,</div><div class='del'>-	.get_acl = ceph_get_acl,</div><div class='add'>+	.get_inode_acl = ceph_get_acl,</div><div class='ctx'> 	.set_acl = ceph_set_acl,</div><div class='ctx'> 	.mknod = ceph_mknod,</div><div class='ctx'> 	.symlink = ceph_symlink,</div><div class='head'>diff --git a/fs/ceph/export.c b/fs/ceph/export.c<br/>index 1d65934c1262..b2f2af104679 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ceph/export.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/export.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/export.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/export.c</a></div><div class='hunk'>@@ -3,10 +3,11 @@</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/exportfs.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='del'>-#include &lt;asm/unaligned.h&gt;</div><div class='add'>+#include &lt;linux/unaligned.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "super.h"</div><div class='ctx'> #include "mds_client.h"</div><div class='add'>+#include "crypto.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Basic fh</div><div class='hunk'>@@ -32,11 +33,19 @@ struct ceph_nfs_snapfh {</div><div class='ctx'> 	u32 hash;</div><div class='ctx'> } __attribute__ ((packed));</div><div class='ctx'> </div><div class='add'>+#define BYTES_PER_U32		(sizeof(u32))</div><div class='add'>+#define CEPH_FH_BASIC_SIZE \</div><div class='add'>+	(sizeof(struct ceph_nfs_fh) / BYTES_PER_U32)</div><div class='add'>+#define CEPH_FH_WITH_PARENT_SIZE \</div><div class='add'>+	(sizeof(struct ceph_nfs_confh) / BYTES_PER_U32)</div><div class='add'>+#define CEPH_FH_SNAPPED_INODE_SIZE \</div><div class='add'>+	(sizeof(struct ceph_nfs_snapfh) / BYTES_PER_U32)</div><div class='add'>+</div><div class='ctx'> static int ceph_encode_snapfh(struct inode *inode, u32 *rawfh, int *max_len,</div><div class='ctx'> 			      struct inode *parent_inode)</div><div class='ctx'> {</div><div class='del'>-	static const int snap_handle_length =</div><div class='del'>-		sizeof(struct ceph_nfs_snapfh) &gt;&gt; 2;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='add'>+	static const int snap_handle_length = CEPH_FH_SNAPPED_INODE_SIZE;</div><div class='ctx'> 	struct ceph_nfs_snapfh *sfh = (void *)rawfh;</div><div class='ctx'> 	u64 snapid = ceph_snap(inode);</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -78,17 +87,16 @@ static int ceph_encode_snapfh(struct inode *inode, u32 *rawfh, int *max_len,</div><div class='ctx'> 	*max_len = snap_handle_length;</div><div class='ctx'> 	ret = FILEID_BTRFS_WITH_PARENT;</div><div class='ctx'> out:</div><div class='del'>-	dout("encode_snapfh %llx.%llx ret=%d\n", ceph_vinop(inode), ret);</div><div class='add'>+	doutc(cl, "%p %llx.%llx ret=%d\n", inode, ceph_vinop(inode), ret);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ceph_encode_fh(struct inode *inode, u32 *rawfh, int *max_len,</div><div class='ctx'> 			  struct inode *parent_inode)</div><div class='ctx'> {</div><div class='del'>-	static const int handle_length =</div><div class='del'>-		sizeof(struct ceph_nfs_fh) &gt;&gt; 2;</div><div class='del'>-	static const int connected_handle_length =</div><div class='del'>-		sizeof(struct ceph_nfs_confh) &gt;&gt; 2;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='add'>+	static const int handle_length = CEPH_FH_BASIC_SIZE;</div><div class='add'>+	static const int connected_handle_length = CEPH_FH_WITH_PARENT_SIZE;</div><div class='ctx'> 	int type;</div><div class='ctx'> </div><div class='ctx'> 	if (ceph_snap(inode) != CEPH_NOSNAP)</div><div class='hunk'>@@ -104,15 +112,15 @@ static int ceph_encode_fh(struct inode *inode, u32 *rawfh, int *max_len,</div><div class='ctx'> </div><div class='ctx'> 	if (parent_inode) {</div><div class='ctx'> 		struct ceph_nfs_confh *cfh = (void *)rawfh;</div><div class='del'>-		dout("encode_fh %llx with parent %llx\n",</div><div class='del'>-		     ceph_ino(inode), ceph_ino(parent_inode));</div><div class='add'>+		doutc(cl, "%p %llx.%llx with parent %p %llx.%llx\n", inode,</div><div class='add'>+		      ceph_vinop(inode), parent_inode, ceph_vinop(parent_inode));</div><div class='ctx'> 		cfh-&gt;ino = ceph_ino(inode);</div><div class='ctx'> 		cfh-&gt;parent_ino = ceph_ino(parent_inode);</div><div class='ctx'> 		*max_len = connected_handle_length;</div><div class='ctx'> 		type = FILEID_INO32_GEN_PARENT;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		struct ceph_nfs_fh *fh = (void *)rawfh;</div><div class='del'>-		dout("encode_fh %llx\n", ceph_ino(inode));</div><div class='add'>+		doutc(cl, "%p %llx.%llx\n", inode, ceph_vinop(inode));</div><div class='ctx'> 		fh-&gt;ino = ceph_ino(inode);</div><div class='ctx'> 		*max_len = handle_length;</div><div class='ctx'> 		type = FILEID_INO32_GEN;</div><div class='hunk'>@@ -122,7 +130,7 @@ static int ceph_encode_fh(struct inode *inode, u32 *rawfh, int *max_len,</div><div class='ctx'> </div><div class='ctx'> static struct inode *__lookup_inode(struct super_block *sb, u64 ino)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_mds_client *mdsc = ceph_sb_to_client(sb)-&gt;mdsc;</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_sb_to_fs_client(sb)-&gt;mdsc;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct ceph_vino vino;</div><div class='ctx'> 	int err;</div><div class='hunk'>@@ -157,6 +165,11 @@ static struct inode *__lookup_inode(struct super_block *sb, u64 ino)</div><div class='ctx'> 		ceph_mdsc_put_request(req);</div><div class='ctx'> 		if (!inode)</div><div class='ctx'> 			return err &lt; 0 ? ERR_PTR(err) : ERR_PTR(-ESTALE);</div><div class='add'>+	} else {</div><div class='add'>+		if (ceph_inode_is_shutdown(inode)) {</div><div class='add'>+			iput(inode);</div><div class='add'>+			return ERR_PTR(-ESTALE);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> 	return inode;</div><div class='ctx'> }</div><div class='hunk'>@@ -176,6 +189,7 @@ struct inode *ceph_lookup_inode(struct super_block *sb, u64 ino)</div><div class='ctx'> static struct dentry *__fh_to_dentry(struct super_block *sb, u64 ino)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = __lookup_inode(sb, ino);</div><div class='add'>+	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (IS_ERR(inode))</div><div class='hunk'>@@ -187,7 +201,7 @@ static struct dentry *__fh_to_dentry(struct super_block *sb, u64 ino)</div><div class='ctx'> 		return ERR_PTR(err);</div><div class='ctx'> 	}</div><div class='ctx'> 	/* -ESTALE if inode as been unlinked and no file is open */</div><div class='del'>-	if ((inode-&gt;i_nlink == 0) &amp;&amp; (atomic_read(&amp;inode-&gt;i_count) == 1)) {</div><div class='add'>+	if ((inode-&gt;i_nlink == 0) &amp;&amp; !__ceph_is_file_opened(ci)) {</div><div class='ctx'> 		iput(inode);</div><div class='ctx'> 		return ERR_PTR(-ESTALE);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -198,7 +212,8 @@ static struct dentry *__snapfh_to_dentry(struct super_block *sb,</div><div class='ctx'> 					  struct ceph_nfs_snapfh *sfh,</div><div class='ctx'> 					  bool want_parent)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_mds_client *mdsc = ceph_sb_to_client(sb)-&gt;mdsc;</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_sb_to_fs_client(sb)-&gt;mdsc;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_mds_request *req;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct ceph_vino vino;</div><div class='hunk'>@@ -223,8 +238,13 @@ static struct dentry *__snapfh_to_dentry(struct super_block *sb,</div><div class='ctx'> 		return ERR_PTR(-ESTALE);</div><div class='ctx'> </div><div class='ctx'> 	inode = ceph_find_inode(sb, vino);</div><div class='del'>-	if (inode)</div><div class='add'>+	if (inode) {</div><div class='add'>+		if (ceph_inode_is_shutdown(inode)) {</div><div class='add'>+			iput(inode);</div><div class='add'>+			return ERR_PTR(-ESTALE);</div><div class='add'>+		}</div><div class='ctx'> 		return d_obtain_alias(inode);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	req = ceph_mdsc_create_request(mdsc, CEPH_MDS_OP_LOOKUPINO,</div><div class='ctx'> 				       USE_ANY_MDS);</div><div class='hunk'>@@ -266,14 +286,11 @@ static struct dentry *__snapfh_to_dentry(struct super_block *sb,</div><div class='ctx'> 	ceph_mdsc_put_request(req);</div><div class='ctx'> </div><div class='ctx'> 	if (want_parent) {</div><div class='del'>-		dout("snapfh_to_parent %llx.%llx\n err=%d\n",</div><div class='del'>-		     vino.ino, vino.snap, err);</div><div class='add'>+		doutc(cl, "%llx.%llx\n err=%d\n", vino.ino, vino.snap, err);</div><div class='ctx'> 	} else {</div><div class='del'>-		dout("snapfh_to_dentry %llx.%llx parent %llx hash %x err=%d",</div><div class='del'>-		      vino.ino, vino.snap, sfh-&gt;parent_ino, sfh-&gt;hash, err);</div><div class='add'>+		doutc(cl, "%llx.%llx parent %llx hash %x err=%d", vino.ino,</div><div class='add'>+		      vino.snap, sfh-&gt;parent_ino, sfh-&gt;hash, err);</div><div class='ctx'> 	}</div><div class='del'>-	if (IS_ERR(inode))</div><div class='del'>-		return ERR_CAST(inode);</div><div class='ctx'> 	/* see comments in ceph_get_parent() */</div><div class='ctx'> 	return unlinked ? d_obtain_root(inode) : d_obtain_alias(inode);</div><div class='ctx'> }</div><div class='hunk'>@@ -285,6 +302,7 @@ static struct dentry *ceph_fh_to_dentry(struct super_block *sb,</div><div class='ctx'> 					struct fid *fid,</div><div class='ctx'> 					int fh_len, int fh_type)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_sb_to_fs_client(sb);</div><div class='ctx'> 	struct ceph_nfs_fh *fh = (void *)fid-&gt;raw;</div><div class='ctx'> </div><div class='ctx'> 	if (fh_type == FILEID_BTRFS_WITH_PARENT) {</div><div class='hunk'>@@ -295,17 +313,17 @@ static struct dentry *ceph_fh_to_dentry(struct super_block *sb,</div><div class='ctx'> 	if (fh_type != FILEID_INO32_GEN  &amp;&amp;</div><div class='ctx'> 	    fh_type != FILEID_INO32_GEN_PARENT)</div><div class='ctx'> 		return NULL;</div><div class='del'>-	if (fh_len &lt; sizeof(*fh) / 4)</div><div class='add'>+	if (fh_len &lt; sizeof(*fh) / BYTES_PER_U32)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='del'>-	dout("fh_to_dentry %llx\n", fh-&gt;ino);</div><div class='add'>+	doutc(fsc-&gt;client, "%llx\n", fh-&gt;ino);</div><div class='ctx'> 	return __fh_to_dentry(sb, fh-&gt;ino);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct dentry *__get_parent(struct super_block *sb,</div><div class='ctx'> 				   struct dentry *child, u64 ino)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_mds_client *mdsc = ceph_sb_to_client(sb)-&gt;mdsc;</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_sb_to_fs_client(sb)-&gt;mdsc;</div><div class='ctx'> 	struct ceph_mds_request *req;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	int mask;</div><div class='hunk'>@@ -351,6 +369,7 @@ static struct dentry *__get_parent(struct super_block *sb,</div><div class='ctx'> static struct dentry *ceph_get_parent(struct dentry *child)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(child);</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct dentry *dn;</div><div class='ctx'> </div><div class='ctx'> 	if (ceph_snap(inode) != CEPH_NOSNAP) {</div><div class='hunk'>@@ -379,9 +398,9 @@ static struct dentry *ceph_get_parent(struct dentry *child)</div><div class='ctx'> 			}</div><div class='ctx'> 			dir = snapdir;</div><div class='ctx'> 		}</div><div class='del'>-		/* If directory has already been deleted, futher get_parent</div><div class='add'>+		/* If directory has already been deleted, further get_parent</div><div class='ctx'> 		 * will fail. Do not mark snapdir dentry as disconnected,</div><div class='del'>-		 * this prevent exportfs from doing futher get_parent. */</div><div class='add'>+		 * this prevents exportfs from doing further get_parent. */</div><div class='ctx'> 		if (unlinked)</div><div class='ctx'> 			dn = d_obtain_root(dir);</div><div class='ctx'> 		else</div><div class='hunk'>@@ -390,8 +409,8 @@ static struct dentry *ceph_get_parent(struct dentry *child)</div><div class='ctx'> 		dn = __get_parent(child-&gt;d_sb, child, 0);</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='del'>-	dout("get_parent %p ino %llx.%llx err=%ld\n",</div><div class='del'>-	     child, ceph_vinop(inode), (long)PTR_ERR_OR_ZERO(dn));</div><div class='add'>+	doutc(cl, "child %p %p %llx.%llx err=%ld\n", child, inode,</div><div class='add'>+	      ceph_vinop(inode), (long)PTR_ERR_OR_ZERO(dn));</div><div class='ctx'> 	return dn;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -402,6 +421,7 @@ static struct dentry *ceph_fh_to_parent(struct super_block *sb,</div><div class='ctx'> 					struct fid *fid,</div><div class='ctx'> 					int fh_len, int fh_type)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_sb_to_fs_client(sb);</div><div class='ctx'> 	struct ceph_nfs_confh *cfh = (void *)fid-&gt;raw;</div><div class='ctx'> 	struct dentry *dentry;</div><div class='ctx'> </div><div class='hunk'>@@ -412,10 +432,10 @@ static struct dentry *ceph_fh_to_parent(struct super_block *sb,</div><div class='ctx'> </div><div class='ctx'> 	if (fh_type != FILEID_INO32_GEN_PARENT)</div><div class='ctx'> 		return NULL;</div><div class='del'>-	if (fh_len &lt; sizeof(*cfh) / 4)</div><div class='add'>+	if (fh_len &lt; sizeof(*cfh) / BYTES_PER_U32)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='del'>-	dout("fh_to_parent %llx\n", cfh-&gt;parent_ino);</div><div class='add'>+	doutc(fsc-&gt;client, "%llx\n", cfh-&gt;parent_ino);</div><div class='ctx'> 	dentry = __get_parent(sb, NULL, cfh-&gt;ino);</div><div class='ctx'> 	if (unlikely(dentry == ERR_PTR(-ENOENT)))</div><div class='ctx'> 		dentry = __fh_to_dentry(sb, cfh-&gt;parent_ino);</div><div class='hunk'>@@ -427,7 +447,7 @@ static int __get_snap_name(struct dentry *parent, char *name,</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(child);</div><div class='ctx'> 	struct inode *dir = d_inode(parent);</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_inode_to_client(inode);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='ctx'> 	struct ceph_mds_request *req = NULL;</div><div class='ctx'> 	char *last_name = NULL;</div><div class='ctx'> 	unsigned next_offset = 2;</div><div class='hunk'>@@ -437,7 +457,13 @@ static int __get_snap_name(struct dentry *parent, char *name,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	if (ceph_snap(inode) == CEPH_SNAPDIR) {</div><div class='ctx'> 		if (ceph_snap(dir) == CEPH_NOSNAP) {</div><div class='del'>-			strcpy(name, fsc-&gt;mount_options-&gt;snapdir_name);</div><div class='add'>+			/*</div><div class='add'>+			 * .get_name() from struct export_operations</div><div class='add'>+			 * assumes that its 'name' parameter is pointing</div><div class='add'>+			 * to a NAME_MAX+1 sized buffer</div><div class='add'>+			 */</div><div class='add'>+			strscpy(name, fsc-&gt;mount_options-&gt;snapdir_name,</div><div class='add'>+				NAME_MAX + 1);</div><div class='ctx'> 			err = 0;</div><div class='ctx'> 		}</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -514,8 +540,8 @@ out:</div><div class='ctx'> 	if (req)</div><div class='ctx'> 		ceph_mdsc_put_request(req);</div><div class='ctx'> 	kfree(last_name);</div><div class='del'>-	dout("get_snap_name %p ino %llx.%llx err=%d\n",</div><div class='del'>-	     child, ceph_vinop(inode), err);</div><div class='add'>+	doutc(fsc-&gt;client, "child dentry %p %p %llx.%llx err=%d\n", child,</div><div class='add'>+	      inode, ceph_vinop(inode), err);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -524,42 +550,61 @@ static int ceph_get_name(struct dentry *parent, char *name,</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_mds_client *mdsc;</div><div class='ctx'> 	struct ceph_mds_request *req;</div><div class='add'>+	struct inode *dir = d_inode(parent);</div><div class='ctx'> 	struct inode *inode = d_inode(child);</div><div class='add'>+	struct ceph_mds_reply_info_parsed *rinfo;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (ceph_snap(inode) != CEPH_NOSNAP)</div><div class='ctx'> 		return __get_snap_name(parent, name, child);</div><div class='ctx'> </div><div class='del'>-	mdsc = ceph_inode_to_client(inode)-&gt;mdsc;</div><div class='add'>+	mdsc = ceph_inode_to_fs_client(inode)-&gt;mdsc;</div><div class='ctx'> 	req = ceph_mdsc_create_request(mdsc, CEPH_MDS_OP_LOOKUPNAME,</div><div class='ctx'> 				       USE_ANY_MDS);</div><div class='ctx'> 	if (IS_ERR(req))</div><div class='ctx'> 		return PTR_ERR(req);</div><div class='ctx'> </div><div class='del'>-	inode_lock(d_inode(parent));</div><div class='del'>-</div><div class='add'>+	inode_lock(dir);</div><div class='ctx'> 	req-&gt;r_inode = inode;</div><div class='ctx'> 	ihold(inode);</div><div class='ctx'> 	req-&gt;r_ino2 = ceph_vino(d_inode(parent));</div><div class='del'>-	req-&gt;r_parent = d_inode(parent);</div><div class='del'>-	ihold(req-&gt;r_parent);</div><div class='add'>+	req-&gt;r_parent = dir;</div><div class='add'>+	ihold(dir);</div><div class='ctx'> 	set_bit(CEPH_MDS_R_PARENT_LOCKED, &amp;req-&gt;r_req_flags);</div><div class='ctx'> 	req-&gt;r_num_caps = 2;</div><div class='ctx'> 	err = ceph_mdsc_do_request(mdsc, NULL, req);</div><div class='add'>+	inode_unlock(dir);</div><div class='ctx'> </div><div class='del'>-	inode_unlock(d_inode(parent));</div><div class='add'>+	if (err)</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='del'>-	if (!err) {</div><div class='del'>-		struct ceph_mds_reply_info_parsed *rinfo = &amp;req-&gt;r_reply_info;</div><div class='add'>+	rinfo = &amp;req-&gt;r_reply_info;</div><div class='add'>+	if (!IS_ENCRYPTED(dir)) {</div><div class='ctx'> 		memcpy(name, rinfo-&gt;dname, rinfo-&gt;dname_len);</div><div class='ctx'> 		name[rinfo-&gt;dname_len] = 0;</div><div class='del'>-		dout("get_name %p ino %llx.%llx name %s\n",</div><div class='del'>-		     child, ceph_vinop(inode), name);</div><div class='ctx'> 	} else {</div><div class='del'>-		dout("get_name %p ino %llx.%llx err %d\n",</div><div class='del'>-		     child, ceph_vinop(inode), err);</div><div class='del'>-	}</div><div class='add'>+		struct fscrypt_str oname = FSTR_INIT(NULL, 0);</div><div class='add'>+		struct ceph_fname fname = { .dir	= dir,</div><div class='add'>+					    .name	= rinfo-&gt;dname,</div><div class='add'>+					    .ctext	= rinfo-&gt;altname,</div><div class='add'>+					    .name_len	= rinfo-&gt;dname_len,</div><div class='add'>+					    .ctext_len	= rinfo-&gt;altname_len };</div><div class='add'>+</div><div class='add'>+		err = ceph_fname_alloc_buffer(dir, &amp;oname);</div><div class='add'>+		if (err &lt; 0)</div><div class='add'>+			goto out;</div><div class='ctx'> </div><div class='add'>+		err = ceph_fname_to_usr(&amp;fname, NULL, &amp;oname, NULL);</div><div class='add'>+		if (!err) {</div><div class='add'>+			memcpy(name, oname.name, oname.len);</div><div class='add'>+			name[oname.len] = 0;</div><div class='add'>+		}</div><div class='add'>+		ceph_fname_free_buffer(dir, &amp;oname);</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='add'>+	doutc(mdsc-&gt;fsc-&gt;client, "child dentry %p %p %llx.%llx err %d %s%s\n",</div><div class='add'>+	      child, inode, ceph_vinop(inode), err, err ? "" : "name ",</div><div class='add'>+	      err ? "" : name);</div><div class='ctx'> 	ceph_mdsc_put_request(req);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/ceph/file.c b/fs/ceph/file.c<br/>index b129ea551378..983390069f73 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ceph/file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/file.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/file.c</a></div><div class='hunk'>@@ -12,6 +12,7 @@</div><div class='ctx'> #include &lt;linux/falloc.h&gt;</div><div class='ctx'> #include &lt;linux/iversion.h&gt;</div><div class='ctx'> #include &lt;linux/ktime.h&gt;</div><div class='add'>+#include &lt;linux/splice.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "super.h"</div><div class='ctx'> #include "mds_client.h"</div><div class='hunk'>@@ -19,8 +20,9 @@</div><div class='ctx'> #include "io.h"</div><div class='ctx'> #include "metric.h"</div><div class='ctx'> </div><div class='del'>-static __le32 ceph_flags_sys2wire(u32 flags)</div><div class='add'>+static __le32 ceph_flags_sys2wire(struct ceph_mds_client *mdsc, u32 flags)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	u32 wire_flags = 0;</div><div class='ctx'> </div><div class='ctx'> 	switch (flags &amp; O_ACCMODE) {</div><div class='hunk'>@@ -48,7 +50,7 @@ static __le32 ceph_flags_sys2wire(u32 flags)</div><div class='ctx'> #undef ceph_sys2wire</div><div class='ctx'> </div><div class='ctx'> 	if (flags)</div><div class='del'>-		dout("unused open flags: %x\n", flags);</div><div class='add'>+		doutc(cl, "unused open flags: %x\n", flags);</div><div class='ctx'> </div><div class='ctx'> 	return cpu_to_le32(wire_flags);</div><div class='ctx'> }</div><div class='hunk'>@@ -95,23 +97,18 @@ static ssize_t __iter_get_bvecs(struct iov_iter *iter, size_t maxsize,</div><div class='ctx'> 		size_t start;</div><div class='ctx'> 		int idx = 0;</div><div class='ctx'> </div><div class='del'>-		bytes = iov_iter_get_pages(iter, pages, maxsize - size,</div><div class='add'>+		bytes = iov_iter_get_pages2(iter, pages, maxsize - size,</div><div class='ctx'> 					   ITER_GET_BVECS_PAGES, &amp;start);</div><div class='ctx'> 		if (bytes &lt; 0)</div><div class='ctx'> 			return size ?: bytes;</div><div class='ctx'> </div><div class='del'>-		iov_iter_advance(iter, bytes);</div><div class='ctx'> 		size += bytes;</div><div class='ctx'> </div><div class='ctx'> 		for ( ; bytes; idx++, bvec_idx++) {</div><div class='del'>-			struct bio_vec bv = {</div><div class='del'>-				.bv_page = pages[idx],</div><div class='del'>-				.bv_len = min_t(int, bytes, PAGE_SIZE - start),</div><div class='del'>-				.bv_offset = start,</div><div class='del'>-			};</div><div class='del'>-</div><div class='del'>-			bvecs[bvec_idx] = bv;</div><div class='del'>-			bytes -= bv.bv_len;</div><div class='add'>+			int len = min_t(int, bytes, PAGE_SIZE - start);</div><div class='add'>+</div><div class='add'>+			bvec_set_page(&amp;bvecs[bvec_idx], pages[idx], len, start);</div><div class='add'>+			bytes -= len;</div><div class='ctx'> 			start = 0;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -194,7 +191,7 @@ prepare_open_request(struct super_block *sb, int flags, int create_mode)</div><div class='ctx'> 	if (IS_ERR(req))</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	req-&gt;r_fmode = ceph_flags_to_mode(flags);</div><div class='del'>-	req-&gt;r_args.open.flags = ceph_flags_sys2wire(flags);</div><div class='add'>+	req-&gt;r_args.open.flags = ceph_flags_sys2wire(mdsc, flags);</div><div class='ctx'> 	req-&gt;r_args.open.mode = cpu_to_le32(create_mode);</div><div class='ctx'> out:</div><div class='ctx'> 	return req;</div><div class='hunk'>@@ -204,10 +201,14 @@ static int ceph_init_file_info(struct inode *inode, struct file *file,</div><div class='ctx'> 					int fmode, bool isdir)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	struct ceph_mount_options *opt =</div><div class='add'>+		ceph_inode_to_fs_client(&amp;ci-&gt;netfs.inode)-&gt;mount_options;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_file_info *fi;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	dout("%s %p %p 0%o (%s)\n", __func__, inode, file,</div><div class='del'>-			inode-&gt;i_mode, isdir ? "dir" : "regular");</div><div class='add'>+	doutc(cl, "%p %llx.%llx %p 0%o (%s)\n", inode, ceph_vinop(inode),</div><div class='add'>+	      file, inode-&gt;i_mode, isdir ? "dir" : "regular");</div><div class='ctx'> 	BUG_ON(inode-&gt;i_fop-&gt;release != ceph_release);</div><div class='ctx'> </div><div class='ctx'> 	if (isdir) {</div><div class='hunk'>@@ -225,6 +226,9 @@ static int ceph_init_file_info(struct inode *inode, struct file *file,</div><div class='ctx'> 		if (!fi)</div><div class='ctx'> 			return -ENOMEM;</div><div class='ctx'> </div><div class='add'>+		if (opt-&gt;flags &amp; CEPH_MOUNT_OPT_NOPAGECACHE)</div><div class='add'>+			fi-&gt;flags |= CEPH_F_SYNC;</div><div class='add'>+</div><div class='ctx'> 		file-&gt;private_data = fi;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -233,9 +237,23 @@ static int ceph_init_file_info(struct inode *inode, struct file *file,</div><div class='ctx'> </div><div class='ctx'> 	spin_lock_init(&amp;fi-&gt;rw_contexts_lock);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;fi-&gt;rw_contexts);</div><div class='del'>-	fi-&gt;filp_gen = READ_ONCE(ceph_inode_to_client(inode)-&gt;filp_gen);</div><div class='add'>+	fi-&gt;filp_gen = READ_ONCE(ceph_inode_to_fs_client(inode)-&gt;filp_gen);</div><div class='add'>+</div><div class='add'>+	if ((file-&gt;f_mode &amp; FMODE_WRITE) &amp;&amp; ceph_has_inline_data(ci)) {</div><div class='add'>+		ret = ceph_uninline_data(file);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto error;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='add'>+</div><div class='add'>+error:</div><div class='add'>+	ceph_fscache_unuse_cookie(inode, file-&gt;f_mode &amp; FMODE_WRITE);</div><div class='add'>+	ceph_put_fmode(ci, fi-&gt;fmode, 1);</div><div class='add'>+	kmem_cache_free(ceph_file_cachep, fi);</div><div class='add'>+	/* wake up anyone waiting for caps on this inode */</div><div class='add'>+	wake_up_all(&amp;ci-&gt;i_cap_wq);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -244,12 +262,12 @@ static int ceph_init_file_info(struct inode *inode, struct file *file,</div><div class='ctx'>  */</div><div class='ctx'> static int ceph_init_file(struct inode *inode, struct file *file, int fmode)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	switch (inode-&gt;i_mode &amp; S_IFMT) {</div><div class='ctx'> 	case S_IFREG:</div><div class='del'>-		ceph_fscache_register_inode_cookie(inode);</div><div class='del'>-		ceph_fscache_file_set_cookie(inode, file);</div><div class='add'>+		ceph_fscache_use_cookie(inode, file-&gt;f_mode &amp; FMODE_WRITE);</div><div class='ctx'> 		fallthrough;</div><div class='ctx'> 	case S_IFDIR:</div><div class='ctx'> 		ret = ceph_init_file_info(inode, file, fmode,</div><div class='hunk'>@@ -257,13 +275,13 @@ static int ceph_init_file(struct inode *inode, struct file *file, int fmode)</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	case S_IFLNK:</div><div class='del'>-		dout("init_file %p %p 0%o (symlink)\n", inode, file,</div><div class='del'>-		     inode-&gt;i_mode);</div><div class='add'>+		doutc(cl, "%p %llx.%llx %p 0%o (symlink)\n", inode,</div><div class='add'>+		      ceph_vinop(inode), file, inode-&gt;i_mode);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	default:</div><div class='del'>-		dout("init_file %p %p 0%o (special)\n", inode, file,</div><div class='del'>-		     inode-&gt;i_mode);</div><div class='add'>+		doutc(cl, "%p %llx.%llx %p 0%o (special)\n", inode,</div><div class='add'>+		      ceph_vinop(inode), file, inode-&gt;i_mode);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * we need to drop the open ref now, since we don't</div><div class='ctx'> 		 * have .release set to ceph_release.</div><div class='hunk'>@@ -282,6 +300,7 @@ static int ceph_init_file(struct inode *inode, struct file *file, int fmode)</div><div class='ctx'> int ceph_renew_caps(struct inode *inode, int fmode)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_mds_client *mdsc = ceph_sb_to_mdsc(inode-&gt;i_sb);</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	struct ceph_mds_request *req;</div><div class='ctx'> 	int err, flags, wanted;</div><div class='hunk'>@@ -293,9 +312,10 @@ int ceph_renew_caps(struct inode *inode, int fmode)</div><div class='ctx'> 	    (!(wanted &amp; CEPH_CAP_ANY_WR) || ci-&gt;i_auth_cap)) {</div><div class='ctx'> 		int issued = __ceph_caps_issued(ci, NULL);</div><div class='ctx'> 		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-		dout("renew caps %p want %s issued %s updating mds_wanted\n",</div><div class='del'>-		     inode, ceph_cap_string(wanted), ceph_cap_string(issued));</div><div class='del'>-		ceph_check_caps(ci, 0, NULL);</div><div class='add'>+		doutc(cl, "%p %llx.%llx want %s issued %s updating mds_wanted\n",</div><div class='add'>+		      inode, ceph_vinop(inode), ceph_cap_string(wanted),</div><div class='add'>+		      ceph_cap_string(issued));</div><div class='add'>+		ceph_check_caps(ci, 0);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='hunk'>@@ -325,7 +345,8 @@ int ceph_renew_caps(struct inode *inode, int fmode)</div><div class='ctx'> 	err = ceph_mdsc_do_request(mdsc, NULL, req);</div><div class='ctx'> 	ceph_mdsc_put_request(req);</div><div class='ctx'> out:</div><div class='del'>-	dout("renew caps %p open result=%d\n", inode, err);</div><div class='add'>+	doutc(cl, "%p %llx.%llx open result=%d\n", inode, ceph_vinop(inode),</div><div class='add'>+	      err);</div><div class='ctx'> 	return err &lt; 0 ? err : 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -338,28 +359,64 @@ out:</div><div class='ctx'> int ceph_open(struct inode *inode, struct file *file)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_sb_to_client(inode-&gt;i_sb);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_sb_to_fs_client(inode-&gt;i_sb);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='ctx'> 	struct ceph_mds_client *mdsc = fsc-&gt;mdsc;</div><div class='ctx'> 	struct ceph_mds_request *req;</div><div class='ctx'> 	struct ceph_file_info *fi = file-&gt;private_data;</div><div class='ctx'> 	int err;</div><div class='ctx'> 	int flags, fmode, wanted;</div><div class='add'>+	struct dentry *dentry;</div><div class='add'>+	char *path;</div><div class='add'>+	bool do_sync = false;</div><div class='add'>+	int mask = MAY_READ;</div><div class='ctx'> </div><div class='ctx'> 	if (fi) {</div><div class='del'>-		dout("open file %p is already opened\n", file);</div><div class='add'>+		doutc(cl, "file %p is already opened\n", file);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* filter out O_CREAT|O_EXCL; vfs did that already.  yuck. */</div><div class='ctx'> 	flags = file-&gt;f_flags &amp; ~(O_CREAT|O_EXCL);</div><div class='del'>-	if (S_ISDIR(inode-&gt;i_mode))</div><div class='add'>+	if (S_ISDIR(inode-&gt;i_mode)) {</div><div class='ctx'> 		flags = O_DIRECTORY;  /* mds likes to know */</div><div class='add'>+	} else if (S_ISREG(inode-&gt;i_mode)) {</div><div class='add'>+		err = fscrypt_file_open(inode, file);</div><div class='add'>+		if (err)</div><div class='add'>+			return err;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	dout("open inode %p ino %llx.%llx file %p flags %d (%d)\n", inode,</div><div class='del'>-	     ceph_vinop(inode), file, flags, file-&gt;f_flags);</div><div class='add'>+	doutc(cl, "%p %llx.%llx file %p flags %d (%d)\n", inode,</div><div class='add'>+	      ceph_vinop(inode), file, flags, file-&gt;f_flags);</div><div class='ctx'> 	fmode = ceph_flags_to_mode(flags);</div><div class='ctx'> 	wanted = ceph_caps_for_mode(fmode);</div><div class='ctx'> </div><div class='add'>+	if (fmode &amp; CEPH_FILE_MODE_WR)</div><div class='add'>+		mask |= MAY_WRITE;</div><div class='add'>+	dentry = d_find_alias(inode);</div><div class='add'>+	if (!dentry) {</div><div class='add'>+		do_sync = true;</div><div class='add'>+	} else {</div><div class='add'>+		struct ceph_path_info path_info;</div><div class='add'>+		path = ceph_mdsc_build_path(mdsc, dentry, &amp;path_info, 0);</div><div class='add'>+		if (IS_ERR(path)) {</div><div class='add'>+			do_sync = true;</div><div class='add'>+			err = 0;</div><div class='add'>+		} else {</div><div class='add'>+			err = ceph_mds_check_access(mdsc, path, mask);</div><div class='add'>+		}</div><div class='add'>+		ceph_mdsc_free_path_info(&amp;path_info);</div><div class='add'>+		dput(dentry);</div><div class='add'>+</div><div class='add'>+		/* For none EACCES cases will let the MDS do the mds auth check */</div><div class='add'>+		if (err == -EACCES) {</div><div class='add'>+			return err;</div><div class='add'>+		} else if (err &lt; 0) {</div><div class='add'>+			do_sync = true;</div><div class='add'>+			err = 0;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/* snapped files are read-only */</div><div class='ctx'> 	if (ceph_snap(inode) != CEPH_NOSNAP &amp;&amp; (file-&gt;f_mode &amp; FMODE_WRITE))</div><div class='ctx'> 		return -EROFS;</div><div class='hunk'>@@ -375,14 +432,14 @@ int ceph_open(struct inode *inode, struct file *file)</div><div class='ctx'> 	 * asynchronously.</div><div class='ctx'> 	 */</div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-	if (__ceph_is_any_real_caps(ci) &amp;&amp;</div><div class='add'>+	if (!do_sync &amp;&amp; __ceph_is_any_real_caps(ci) &amp;&amp;</div><div class='ctx'> 	    (((fmode &amp; CEPH_FILE_MODE_WR) == 0) || ci-&gt;i_auth_cap)) {</div><div class='ctx'> 		int mds_wanted = __ceph_caps_mds_wanted(ci, true);</div><div class='ctx'> 		int issued = __ceph_caps_issued(ci, NULL);</div><div class='ctx'> </div><div class='del'>-		dout("open %p fmode %d want %s issued %s using existing\n",</div><div class='del'>-		     inode, fmode, ceph_cap_string(wanted),</div><div class='del'>-		     ceph_cap_string(issued));</div><div class='add'>+		doutc(cl, "open %p fmode %d want %s issued %s using existing\n",</div><div class='add'>+		      inode, fmode, ceph_cap_string(wanted),</div><div class='add'>+		      ceph_cap_string(issued));</div><div class='ctx'> 		__ceph_touch_fmode(ci, mdsc, fmode);</div><div class='ctx'> 		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> </div><div class='hunk'>@@ -390,10 +447,10 @@ int ceph_open(struct inode *inode, struct file *file)</div><div class='ctx'> 		if ((issued &amp; wanted) != wanted &amp;&amp;</div><div class='ctx'> 		    (mds_wanted &amp; wanted) != wanted &amp;&amp;</div><div class='ctx'> 		    ceph_snap(inode) != CEPH_SNAPDIR)</div><div class='del'>-			ceph_check_caps(ci, 0, NULL);</div><div class='add'>+			ceph_check_caps(ci, 0);</div><div class='ctx'> </div><div class='ctx'> 		return ceph_init_file(inode, file, fmode);</div><div class='del'>-	} else if (ceph_snap(inode) != CEPH_NOSNAP &amp;&amp;</div><div class='add'>+	} else if (!do_sync &amp;&amp; ceph_snap(inode) != CEPH_NOSNAP &amp;&amp;</div><div class='ctx'> 		   (ci-&gt;i_snap_caps &amp; wanted) == wanted) {</div><div class='ctx'> 		__ceph_touch_fmode(ci, mdsc, fmode);</div><div class='ctx'> 		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='hunk'>@@ -402,7 +459,7 @@ int ceph_open(struct inode *inode, struct file *file)</div><div class='ctx'> </div><div class='ctx'> 	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> </div><div class='del'>-	dout("open fmode %d wants %s\n", fmode, ceph_cap_string(wanted));</div><div class='add'>+	doutc(cl, "open fmode %d wants %s\n", fmode, ceph_cap_string(wanted));</div><div class='ctx'> 	req = prepare_open_request(inode-&gt;i_sb, flags, 0);</div><div class='ctx'> 	if (IS_ERR(req)) {</div><div class='ctx'> 		err = PTR_ERR(req);</div><div class='hunk'>@@ -416,7 +473,7 @@ int ceph_open(struct inode *inode, struct file *file)</div><div class='ctx'> 	if (!err)</div><div class='ctx'> 		err = ceph_init_file(inode, file, req-&gt;r_fmode);</div><div class='ctx'> 	ceph_mdsc_put_request(req);</div><div class='del'>-	dout("open result=%d on %llx.%llx\n", err, ceph_vinop(inode));</div><div class='add'>+	doutc(cl, "open result=%d on %llx.%llx\n", err, ceph_vinop(inode));</div><div class='ctx'> out:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='hunk'>@@ -496,6 +553,7 @@ no_async:</div><div class='ctx'> </div><div class='ctx'> static void restore_deleg_ino(struct inode *dir, u64 ino)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(dir);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(dir);</div><div class='ctx'> 	struct ceph_mds_session *s = NULL;</div><div class='ctx'> </div><div class='hunk'>@@ -506,65 +564,93 @@ static void restore_deleg_ino(struct inode *dir, u64 ino)</div><div class='ctx'> 	if (s) {</div><div class='ctx'> 		int err = ceph_restore_deleg_ino(s, ino);</div><div class='ctx'> 		if (err)</div><div class='del'>-			pr_warn("ceph: unable to restore delegated ino 0x%llx to session: %d\n",</div><div class='add'>+			pr_warn_client(cl,</div><div class='add'>+				"unable to restore delegated ino 0x%llx to session: %d\n",</div><div class='ctx'> 				ino, err);</div><div class='ctx'> 		ceph_put_mds_session(s);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void wake_async_create_waiters(struct inode *inode,</div><div class='add'>+				      struct ceph_mds_session *session)</div><div class='add'>+{</div><div class='add'>+	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	bool check_cap = false;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+	if (ci-&gt;i_ceph_flags &amp; CEPH_I_ASYNC_CREATE) {</div><div class='add'>+		clear_and_wake_up_bit(CEPH_ASYNC_CREATE_BIT, &amp;ci-&gt;i_ceph_flags);</div><div class='add'>+</div><div class='add'>+		if (ci-&gt;i_ceph_flags &amp; CEPH_I_ASYNC_CHECK_CAPS) {</div><div class='add'>+			ci-&gt;i_ceph_flags &amp;= ~CEPH_I_ASYNC_CHECK_CAPS;</div><div class='add'>+			check_cap = true;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	ceph_kick_flushing_inode_caps(session, ci);</div><div class='add'>+	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+</div><div class='add'>+	if (check_cap)</div><div class='add'>+		ceph_check_caps(ci, CHECK_CAPS_FLUSH);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void ceph_async_create_cb(struct ceph_mds_client *mdsc,</div><div class='ctx'>                                  struct ceph_mds_request *req)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='add'>+	struct dentry *dentry = req-&gt;r_dentry;</div><div class='add'>+	struct inode *dinode = d_inode(dentry);</div><div class='add'>+	struct inode *tinode = req-&gt;r_target_inode;</div><div class='ctx'> 	int result = req-&gt;r_err ? req-&gt;r_err :</div><div class='ctx'> 			le32_to_cpu(req-&gt;r_reply_info.head-&gt;result);</div><div class='ctx'> </div><div class='add'>+	WARN_ON_ONCE(dinode &amp;&amp; tinode &amp;&amp; dinode != tinode);</div><div class='add'>+</div><div class='add'>+	/* MDS changed -- caller must resubmit */</div><div class='ctx'> 	if (result == -EJUKEBOX)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	mapping_set_error(req-&gt;r_parent-&gt;i_mapping, result);</div><div class='ctx'> </div><div class='ctx'> 	if (result) {</div><div class='del'>-		struct dentry *dentry = req-&gt;r_dentry;</div><div class='del'>-		int pathlen = 0;</div><div class='del'>-		u64 base = 0;</div><div class='del'>-		char *path = ceph_mdsc_build_path(req-&gt;r_dentry, &amp;pathlen,</div><div class='del'>-						  &amp;base, 0);</div><div class='add'>+		struct ceph_path_info path_info = {0};</div><div class='add'>+		char *path = ceph_mdsc_build_path(mdsc, req-&gt;r_dentry, &amp;path_info, 0);</div><div class='add'>+</div><div class='add'>+		pr_warn_client(cl,</div><div class='add'>+			"async create failure path=(%llx)%s result=%d!\n",</div><div class='add'>+			path_info.vino.ino, IS_ERR(path) ? "&lt;&lt;bad&gt;&gt;" : path, result);</div><div class='add'>+		ceph_mdsc_free_path_info(&amp;path_info);</div><div class='ctx'> </div><div class='ctx'> 		ceph_dir_clear_complete(req-&gt;r_parent);</div><div class='ctx'> 		if (!d_unhashed(dentry))</div><div class='ctx'> 			d_drop(dentry);</div><div class='ctx'> </div><div class='del'>-		/* FIXME: start returning I/O errors on all accesses? */</div><div class='del'>-		pr_warn("ceph: async create failure path=(%llx)%s result=%d!\n",</div><div class='del'>-			base, IS_ERR(path) ? "&lt;&lt;bad&gt;&gt;" : path, result);</div><div class='del'>-		ceph_mdsc_free_path(path, pathlen);</div><div class='add'>+		if (dinode) {</div><div class='add'>+			mapping_set_error(dinode-&gt;i_mapping, result);</div><div class='add'>+			ceph_inode_shutdown(dinode);</div><div class='add'>+			wake_async_create_waiters(dinode, req-&gt;r_session);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (req-&gt;r_target_inode) {</div><div class='del'>-		struct ceph_inode_info *ci = ceph_inode(req-&gt;r_target_inode);</div><div class='del'>-		u64 ino = ceph_vino(req-&gt;r_target_inode).ino;</div><div class='add'>+	if (tinode) {</div><div class='add'>+		u64 ino = ceph_vino(tinode).ino;</div><div class='ctx'> </div><div class='ctx'> 		if (req-&gt;r_deleg_ino != ino)</div><div class='del'>-			pr_warn("%s: inode number mismatch! err=%d deleg_ino=0x%llx target=0x%llx\n",</div><div class='del'>-				__func__, req-&gt;r_err, req-&gt;r_deleg_ino, ino);</div><div class='del'>-		mapping_set_error(req-&gt;r_target_inode-&gt;i_mapping, result);</div><div class='add'>+			pr_warn_client(cl,</div><div class='add'>+				"inode number mismatch! err=%d deleg_ino=0x%llx target=0x%llx\n",</div><div class='add'>+				req-&gt;r_err, req-&gt;r_deleg_ino, ino);</div><div class='ctx'> </div><div class='del'>-		spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-		if (ci-&gt;i_ceph_flags &amp; CEPH_I_ASYNC_CREATE) {</div><div class='del'>-			ci-&gt;i_ceph_flags &amp;= ~CEPH_I_ASYNC_CREATE;</div><div class='del'>-			wake_up_bit(&amp;ci-&gt;i_ceph_flags, CEPH_ASYNC_CREATE_BIT);</div><div class='del'>-		}</div><div class='del'>-		ceph_kick_flushing_inode_caps(req-&gt;r_session, ci);</div><div class='del'>-		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-	} else {</div><div class='del'>-		pr_warn("%s: no req-&gt;r_target_inode for 0x%llx\n", __func__,</div><div class='del'>-			req-&gt;r_deleg_ino);</div><div class='add'>+		mapping_set_error(tinode-&gt;i_mapping, result);</div><div class='add'>+		wake_async_create_waiters(tinode, req-&gt;r_session);</div><div class='add'>+	} else if (!result) {</div><div class='add'>+		pr_warn_client(cl, "no req-&gt;r_target_inode for 0x%llx\n",</div><div class='add'>+			       req-&gt;r_deleg_ino);</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='ctx'> 	ceph_mdsc_release_dir_caps(req);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ceph_finish_async_create(struct inode *dir, struct dentry *dentry,</div><div class='add'>+static int ceph_finish_async_create(struct inode *dir, struct inode *inode,</div><div class='add'>+				    struct dentry *dentry,</div><div class='ctx'> 				    struct file *file, umode_t mode,</div><div class='ctx'> 				    struct ceph_mds_request *req,</div><div class='ctx'> 				    struct ceph_acl_sec_ctx *as_ctx,</div><div class='hunk'>@@ -575,25 +661,29 @@ static int ceph_finish_async_create(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	struct ceph_mds_reply_inode in = { };</div><div class='ctx'> 	struct ceph_mds_reply_info_in iinfo = { .in = &amp;in };</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(dir);</div><div class='del'>-	struct inode *inode;</div><div class='add'>+	struct ceph_dentry_info *di = ceph_dentry(dentry);</div><div class='ctx'> 	struct timespec64 now;</div><div class='add'>+	struct ceph_string *pool_ns;</div><div class='ctx'> 	struct ceph_mds_client *mdsc = ceph_sb_to_mdsc(dir-&gt;i_sb);</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_vino vino = { .ino = req-&gt;r_deleg_ino,</div><div class='ctx'> 				  .snap = CEPH_NOSNAP };</div><div class='ctx'> </div><div class='ctx'> 	ktime_get_real_ts64(&amp;now);</div><div class='ctx'> </div><div class='del'>-	inode = ceph_get_inode(dentry-&gt;d_sb, vino);</div><div class='del'>-	if (IS_ERR(inode))</div><div class='del'>-		return PTR_ERR(inode);</div><div class='del'>-</div><div class='ctx'> 	iinfo.inline_version = CEPH_INLINE_NONE;</div><div class='ctx'> 	iinfo.change_attr = 1;</div><div class='ctx'> 	ceph_encode_timespec64(&amp;iinfo.btime, &amp;now);</div><div class='ctx'> </div><div class='del'>-	iinfo.xattr_len = ARRAY_SIZE(xattr_buf);</div><div class='del'>-	iinfo.xattr_data = xattr_buf;</div><div class='del'>-	memset(iinfo.xattr_data, 0, iinfo.xattr_len);</div><div class='add'>+	if (req-&gt;r_pagelist) {</div><div class='add'>+		iinfo.xattr_len = req-&gt;r_pagelist-&gt;length;</div><div class='add'>+		iinfo.xattr_data = req-&gt;r_pagelist-&gt;mapped_tail;</div><div class='add'>+	} else {</div><div class='add'>+		/* fake it */</div><div class='add'>+		iinfo.xattr_len = ARRAY_SIZE(xattr_buf);</div><div class='add'>+		iinfo.xattr_data = xattr_buf;</div><div class='add'>+		memset(iinfo.xattr_data, 0, iinfo.xattr_len);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	in.ino = cpu_to_le64(vino.ino);</div><div class='ctx'> 	in.snapid = cpu_to_le64(CEPH_NOSNAP);</div><div class='hunk'>@@ -603,37 +693,54 @@ static int ceph_finish_async_create(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	in.cap.realm = cpu_to_le64(ci-&gt;i_snap_realm-&gt;ino);</div><div class='ctx'> 	in.cap.flags = CEPH_CAP_FLAG_AUTH;</div><div class='ctx'> 	in.ctime = in.mtime = in.atime = iinfo.btime;</div><div class='del'>-	in.mode = cpu_to_le32((u32)mode);</div><div class='ctx'> 	in.truncate_seq = cpu_to_le32(1);</div><div class='ctx'> 	in.truncate_size = cpu_to_le64(-1ULL);</div><div class='ctx'> 	in.xattr_version = cpu_to_le64(1);</div><div class='del'>-	in.uid = cpu_to_le32(from_kuid(&amp;init_user_ns, current_fsuid()));</div><div class='del'>-	in.gid = cpu_to_le32(from_kgid(&amp;init_user_ns, dir-&gt;i_mode &amp; S_ISGID ?</div><div class='del'>-				dir-&gt;i_gid : current_fsgid()));</div><div class='add'>+	in.uid = cpu_to_le32(from_kuid(&amp;init_user_ns,</div><div class='add'>+				       mapped_fsuid(req-&gt;r_mnt_idmap,</div><div class='add'>+						    &amp;init_user_ns)));</div><div class='add'>+	if (dir-&gt;i_mode &amp; S_ISGID) {</div><div class='add'>+		in.gid = cpu_to_le32(from_kgid(&amp;init_user_ns, dir-&gt;i_gid));</div><div class='add'>+</div><div class='add'>+		/* Directories always inherit the setgid bit. */</div><div class='add'>+		if (S_ISDIR(mode))</div><div class='add'>+			mode |= S_ISGID;</div><div class='add'>+	} else {</div><div class='add'>+		in.gid = cpu_to_le32(from_kgid(&amp;init_user_ns,</div><div class='add'>+				     mapped_fsgid(req-&gt;r_mnt_idmap,</div><div class='add'>+						  &amp;init_user_ns)));</div><div class='add'>+	}</div><div class='add'>+	in.mode = cpu_to_le32((u32)mode);</div><div class='add'>+</div><div class='ctx'> 	in.nlink = cpu_to_le32(1);</div><div class='ctx'> 	in.max_size = cpu_to_le64(lo-&gt;stripe_unit);</div><div class='ctx'> </div><div class='ctx'> 	ceph_file_layout_to_legacy(lo, &amp;in.layout);</div><div class='add'>+	/* lo is private, so pool_ns can't change */</div><div class='add'>+	pool_ns = rcu_dereference_raw(lo-&gt;pool_ns);</div><div class='add'>+	if (pool_ns) {</div><div class='add'>+		iinfo.pool_ns_len = pool_ns-&gt;len;</div><div class='add'>+		iinfo.pool_ns_data = pool_ns-&gt;str;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	down_read(&amp;mdsc-&gt;snap_rwsem);</div><div class='ctx'> 	ret = ceph_fill_inode(inode, NULL, &amp;iinfo, NULL, req-&gt;r_session,</div><div class='ctx'> 			      req-&gt;r_fmode, NULL);</div><div class='ctx'> 	up_read(&amp;mdsc-&gt;snap_rwsem);</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		dout("%s failed to fill inode: %d\n", __func__, ret);</div><div class='add'>+		doutc(cl, "failed to fill inode: %d\n", ret);</div><div class='ctx'> 		ceph_dir_clear_complete(dir);</div><div class='ctx'> 		if (!d_unhashed(dentry))</div><div class='ctx'> 			d_drop(dentry);</div><div class='del'>-		if (inode-&gt;i_state &amp; I_NEW)</div><div class='del'>-			discard_new_inode(inode);</div><div class='add'>+		discard_new_inode(inode);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		struct dentry *dn;</div><div class='ctx'> </div><div class='del'>-		dout("%s d_adding new inode 0x%llx to 0x%llx/%s\n", __func__,</div><div class='del'>-			vino.ino, ceph_ino(dir), dentry-&gt;d_name.name);</div><div class='add'>+		doutc(cl, "d_adding new inode 0x%llx to 0x%llx/%s\n",</div><div class='add'>+		      vino.ino, ceph_ino(dir), dentry-&gt;d_name.name);</div><div class='ctx'> 		ceph_dir_clear_ordered(dir);</div><div class='ctx'> 		ceph_init_inode_acls(inode, as_ctx);</div><div class='del'>-		if (inode-&gt;i_state &amp; I_NEW) {</div><div class='add'>+		if (inode_state_read_once(inode) &amp; I_NEW) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * If it's not I_NEW, then someone created this before</div><div class='ctx'> 			 * we got here. Assume the server is aware of it at</div><div class='hunk'>@@ -652,6 +759,11 @@ static int ceph_finish_async_create(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 		file-&gt;f_mode |= FMODE_CREATED;</div><div class='ctx'> 		ret = finish_open(file, dentry, ceph_open);</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;dentry-&gt;d_lock);</div><div class='add'>+	clear_and_wake_up_bit(CEPH_DENTRY_ASYNC_CREATE_BIT, &amp;di-&gt;flags);</div><div class='add'>+	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -662,36 +774,83 @@ static int ceph_finish_async_create(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> int ceph_atomic_open(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 		     struct file *file, unsigned flags, umode_t mode)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_sb_to_client(dir-&gt;i_sb);</div><div class='add'>+	struct mnt_idmap *idmap = file_mnt_idmap(file);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_sb_to_fs_client(dir-&gt;i_sb);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='ctx'> 	struct ceph_mds_client *mdsc = fsc-&gt;mdsc;</div><div class='ctx'> 	struct ceph_mds_request *req;</div><div class='add'>+	struct inode *new_inode = NULL;</div><div class='ctx'> 	struct dentry *dn;</div><div class='ctx'> 	struct ceph_acl_sec_ctx as_ctx = {};</div><div class='ctx'> 	bool try_async = ceph_test_mount_opt(fsc, ASYNC_DIROPS);</div><div class='ctx'> 	int mask;</div><div class='ctx'> 	int err;</div><div class='add'>+	char *path;</div><div class='ctx'> </div><div class='del'>-	dout("atomic_open %p dentry %p '%pd' %s flags %d mode 0%o\n",</div><div class='del'>-	     dir, dentry, dentry,</div><div class='del'>-	     d_unhashed(dentry) ? "unhashed" : "hashed", flags, mode);</div><div class='add'>+	doutc(cl, "%p %llx.%llx dentry %p '%pd' %s flags %d mode 0%o\n",</div><div class='add'>+	      dir, ceph_vinop(dir), dentry, dentry,</div><div class='add'>+	      d_unhashed(dentry) ? "unhashed" : "hashed", flags, mode);</div><div class='ctx'> </div><div class='ctx'> 	if (dentry-&gt;d_name.len &gt; NAME_MAX)</div><div class='ctx'> 		return -ENAMETOOLONG;</div><div class='ctx'> </div><div class='add'>+	err = ceph_wait_on_conflict_unlink(dentry);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+	/*</div><div class='add'>+	 * Do not truncate the file, since atomic_open is called before the</div><div class='add'>+	 * permission check. The caller will do the truncation afterward.</div><div class='add'>+	 */</div><div class='add'>+	flags &amp;= ~O_TRUNC;</div><div class='add'>+</div><div class='add'>+	dn = d_find_alias(dir);</div><div class='add'>+	if (!dn) {</div><div class='add'>+		try_async = false;</div><div class='add'>+	} else {</div><div class='add'>+		struct ceph_path_info path_info;</div><div class='add'>+		path = ceph_mdsc_build_path(mdsc, dn, &amp;path_info, 0);</div><div class='add'>+		if (IS_ERR(path)) {</div><div class='add'>+			try_async = false;</div><div class='add'>+			err = 0;</div><div class='add'>+		} else {</div><div class='add'>+			int fmode = ceph_flags_to_mode(flags);</div><div class='add'>+</div><div class='add'>+			mask = MAY_READ;</div><div class='add'>+			if (fmode &amp; CEPH_FILE_MODE_WR)</div><div class='add'>+				mask |= MAY_WRITE;</div><div class='add'>+			err = ceph_mds_check_access(mdsc, path, mask);</div><div class='add'>+		}</div><div class='add'>+		ceph_mdsc_free_path_info(&amp;path_info);</div><div class='add'>+		dput(dn);</div><div class='add'>+</div><div class='add'>+		/* For none EACCES cases will let the MDS do the mds auth check */</div><div class='add'>+		if (err == -EACCES) {</div><div class='add'>+			return err;</div><div class='add'>+		} else if (err &lt; 0) {</div><div class='add'>+			try_async = false;</div><div class='add'>+			err = 0;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+retry:</div><div class='ctx'> 	if (flags &amp; O_CREAT) {</div><div class='ctx'> 		if (ceph_quota_is_max_files_exceeded(dir))</div><div class='ctx'> 			return -EDQUOT;</div><div class='del'>-		err = ceph_pre_init_acls(dir, &amp;mode, &amp;as_ctx);</div><div class='del'>-		if (err &lt; 0)</div><div class='del'>-			return err;</div><div class='del'>-		err = ceph_security_init_secctx(dentry, mode, &amp;as_ctx);</div><div class='del'>-		if (err &lt; 0)</div><div class='add'>+</div><div class='add'>+		new_inode = ceph_new_inode(dir, dentry, &amp;mode, &amp;as_ctx);</div><div class='add'>+		if (IS_ERR(new_inode)) {</div><div class='add'>+			err = PTR_ERR(new_inode);</div><div class='ctx'> 			goto out_ctx;</div><div class='add'>+		}</div><div class='add'>+		/* Async create can't handle more than a page of xattrs */</div><div class='add'>+		if (as_ctx.pagelist &amp;&amp;</div><div class='add'>+		    !list_is_singular(&amp;as_ctx.pagelist-&gt;head))</div><div class='add'>+			try_async = false;</div><div class='ctx'> 	} else if (!d_in_lookup(dentry)) {</div><div class='ctx'> 		/* If it's not being looked up, it's negative */</div><div class='ctx'> 		return -ENOENT;</div><div class='ctx'> 	}</div><div class='del'>-retry:</div><div class='add'>+</div><div class='ctx'> 	/* do the open */</div><div class='ctx'> 	req = prepare_open_request(dir-&gt;i_sb, flags, mode);</div><div class='ctx'> 	if (IS_ERR(req)) {</div><div class='hunk'>@@ -705,43 +864,76 @@ retry:</div><div class='ctx'> 		mask |= CEPH_CAP_XATTR_SHARED;</div><div class='ctx'> 	req-&gt;r_args.open.mask = cpu_to_le32(mask);</div><div class='ctx'> 	req-&gt;r_parent = dir;</div><div class='add'>+	if (req-&gt;r_op == CEPH_MDS_OP_CREATE)</div><div class='add'>+		req-&gt;r_mnt_idmap = mnt_idmap_get(idmap);</div><div class='ctx'> 	ihold(dir);</div><div class='add'>+	if (IS_ENCRYPTED(dir)) {</div><div class='add'>+		set_bit(CEPH_MDS_R_FSCRYPT_FILE, &amp;req-&gt;r_req_flags);</div><div class='add'>+		err = fscrypt_prepare_lookup_partial(dir, dentry);</div><div class='add'>+		if (err &lt; 0)</div><div class='add'>+			goto out_req;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; O_CREAT) {</div><div class='ctx'> 		struct ceph_file_layout lo;</div><div class='ctx'> </div><div class='del'>-		req-&gt;r_dentry_drop = CEPH_CAP_FILE_SHARED | CEPH_CAP_AUTH_EXCL;</div><div class='add'>+		req-&gt;r_dentry_drop = CEPH_CAP_FILE_SHARED | CEPH_CAP_AUTH_EXCL |</div><div class='add'>+				     CEPH_CAP_XATTR_EXCL;</div><div class='ctx'> 		req-&gt;r_dentry_unless = CEPH_CAP_FILE_EXCL;</div><div class='del'>-		if (as_ctx.pagelist) {</div><div class='del'>-			req-&gt;r_pagelist = as_ctx.pagelist;</div><div class='del'>-			as_ctx.pagelist = NULL;</div><div class='del'>-		}</div><div class='del'>-		if (try_async &amp;&amp;</div><div class='del'>-		    (req-&gt;r_dir_caps =</div><div class='del'>-		      try_prep_async_create(dir, dentry, &amp;lo,</div><div class='del'>-					    &amp;req-&gt;r_deleg_ino))) {</div><div class='add'>+</div><div class='add'>+		ceph_as_ctx_to_req(req, &amp;as_ctx);</div><div class='add'>+</div><div class='add'>+		if (try_async &amp;&amp; (req-&gt;r_dir_caps =</div><div class='add'>+				  try_prep_async_create(dir, dentry, &amp;lo,</div><div class='add'>+							&amp;req-&gt;r_deleg_ino))) {</div><div class='add'>+			struct ceph_vino vino = { .ino = req-&gt;r_deleg_ino,</div><div class='add'>+						  .snap = CEPH_NOSNAP };</div><div class='add'>+			struct ceph_dentry_info *di = ceph_dentry(dentry);</div><div class='add'>+</div><div class='ctx'> 			set_bit(CEPH_MDS_R_ASYNC, &amp;req-&gt;r_req_flags);</div><div class='ctx'> 			req-&gt;r_args.open.flags |= cpu_to_le32(CEPH_O_EXCL);</div><div class='ctx'> 			req-&gt;r_callback = ceph_async_create_cb;</div><div class='add'>+</div><div class='add'>+			/* Hash inode before RPC */</div><div class='add'>+			new_inode = ceph_get_inode(dir-&gt;i_sb, vino, new_inode);</div><div class='add'>+			if (IS_ERR(new_inode)) {</div><div class='add'>+				err = PTR_ERR(new_inode);</div><div class='add'>+				new_inode = NULL;</div><div class='add'>+				goto out_req;</div><div class='add'>+			}</div><div class='add'>+			WARN_ON_ONCE(!(inode_state_read_once(new_inode) &amp; I_NEW));</div><div class='add'>+</div><div class='add'>+			spin_lock(&amp;dentry-&gt;d_lock);</div><div class='add'>+			di-&gt;flags |= CEPH_DENTRY_ASYNC_CREATE;</div><div class='add'>+			spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='add'>+</div><div class='ctx'> 			err = ceph_mdsc_submit_request(mdsc, dir, req);</div><div class='ctx'> 			if (!err) {</div><div class='del'>-				err = ceph_finish_async_create(dir, dentry,</div><div class='del'>-							file, mode, req,</div><div class='del'>-							&amp;as_ctx, &amp;lo);</div><div class='add'>+				err = ceph_finish_async_create(dir, new_inode,</div><div class='add'>+							       dentry, file,</div><div class='add'>+							       mode, req,</div><div class='add'>+							       &amp;as_ctx, &amp;lo);</div><div class='add'>+				new_inode = NULL;</div><div class='ctx'> 			} else if (err == -EJUKEBOX) {</div><div class='ctx'> 				restore_deleg_ino(dir, req-&gt;r_deleg_ino);</div><div class='ctx'> 				ceph_mdsc_put_request(req);</div><div class='add'>+				discard_new_inode(new_inode);</div><div class='add'>+				ceph_release_acl_sec_ctx(&amp;as_ctx);</div><div class='add'>+				memset(&amp;as_ctx, 0, sizeof(as_ctx));</div><div class='add'>+				new_inode = NULL;</div><div class='ctx'> 				try_async = false;</div><div class='add'>+				ceph_put_string(rcu_dereference_raw(lo.pool_ns));</div><div class='ctx'> 				goto retry;</div><div class='ctx'> 			}</div><div class='add'>+			ceph_put_string(rcu_dereference_raw(lo.pool_ns));</div><div class='ctx'> 			goto out_req;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	set_bit(CEPH_MDS_R_PARENT_LOCKED, &amp;req-&gt;r_req_flags);</div><div class='del'>-	err = ceph_mdsc_do_request(mdsc,</div><div class='del'>-				   (flags &amp; (O_CREAT|O_TRUNC)) ? dir : NULL,</div><div class='del'>-				   req);</div><div class='add'>+	req-&gt;r_new_inode = new_inode;</div><div class='add'>+	new_inode = NULL;</div><div class='add'>+	err = ceph_mdsc_do_request(mdsc, (flags &amp; O_CREAT) ? dir : NULL, req);</div><div class='ctx'> 	if (err == -ENOENT) {</div><div class='ctx'> 		dentry = ceph_handle_snapdir(req, dentry);</div><div class='ctx'> 		if (IS_ERR(dentry)) {</div><div class='hunk'>@@ -766,10 +958,18 @@ retry:</div><div class='ctx'> 		goto out_req;</div><div class='ctx'> 	if (dn || d_really_is_negative(dentry) || d_is_symlink(dentry)) {</div><div class='ctx'> 		/* make vfs retry on splice, ENOENT, or symlink */</div><div class='del'>-		dout("atomic_open finish_no_open on dn %p\n", dn);</div><div class='add'>+		doutc(cl, "finish_no_open on dn %p\n", dn);</div><div class='ctx'> 		err = finish_no_open(file, dn);</div><div class='ctx'> 	} else {</div><div class='del'>-		dout("atomic_open finish_open on dn %p\n", dn);</div><div class='add'>+		if (IS_ENCRYPTED(dir) &amp;&amp;</div><div class='add'>+		    !fscrypt_has_permitted_context(dir, d_inode(dentry))) {</div><div class='add'>+			pr_warn_client(cl,</div><div class='add'>+				"Inconsistent encryption context (parent %llx:%llx child %llx:%llx)\n",</div><div class='add'>+				ceph_vinop(dir), ceph_vinop(d_inode(dentry)));</div><div class='add'>+			goto out_req;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		doutc(cl, "finish_open on dn %p\n", dn);</div><div class='ctx'> 		if (req-&gt;r_op == CEPH_MDS_OP_CREATE &amp;&amp; req-&gt;r_reply_info.has_create_ino) {</div><div class='ctx'> 			struct inode *newino = d_inode(dentry);</div><div class='ctx'> </div><div class='hunk'>@@ -781,19 +981,22 @@ retry:</div><div class='ctx'> 	}</div><div class='ctx'> out_req:</div><div class='ctx'> 	ceph_mdsc_put_request(req);</div><div class='add'>+	iput(new_inode);</div><div class='ctx'> out_ctx:</div><div class='ctx'> 	ceph_release_acl_sec_ctx(&amp;as_ctx);</div><div class='del'>-	dout("atomic_open result=%d\n", err);</div><div class='add'>+	doutc(cl, "result=%d\n", err);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int ceph_release(struct inode *inode, struct file *file)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (S_ISDIR(inode-&gt;i_mode)) {</div><div class='ctx'> 		struct ceph_dir_file_info *dfi = file-&gt;private_data;</div><div class='del'>-		dout("release inode %p dir file %p\n", inode, file);</div><div class='add'>+		doutc(cl, "%p %llx.%llx dir file %p\n", inode,</div><div class='add'>+		      ceph_vinop(inode), file);</div><div class='ctx'> 		WARN_ON(!list_empty(&amp;dfi-&gt;file_info.rw_contexts));</div><div class='ctx'> </div><div class='ctx'> 		ceph_put_fmode(ci, dfi-&gt;file_info.fmode, 1);</div><div class='hunk'>@@ -805,9 +1008,11 @@ int ceph_release(struct inode *inode, struct file *file)</div><div class='ctx'> 		kmem_cache_free(ceph_dir_file_cachep, dfi);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		struct ceph_file_info *fi = file-&gt;private_data;</div><div class='del'>-		dout("release inode %p regular file %p\n", inode, file);</div><div class='add'>+		doutc(cl, "%p %llx.%llx regular file %p\n", inode,</div><div class='add'>+		      ceph_vinop(inode), file);</div><div class='ctx'> 		WARN_ON(!list_empty(&amp;fi-&gt;rw_contexts));</div><div class='ctx'> </div><div class='add'>+		ceph_fscache_unuse_cookie(inode, file-&gt;f_mode &amp; FMODE_WRITE);</div><div class='ctx'> 		ceph_put_fmode(ci, fi-&gt;fmode, 1);</div><div class='ctx'> </div><div class='ctx'> 		kmem_cache_free(ceph_file_cachep, fi);</div><div class='hunk'>@@ -834,22 +1039,28 @@ enum {</div><div class='ctx'>  * If we get a short result from the OSD, check against i_size; we need to</div><div class='ctx'>  * only return a short read to the caller if we hit EOF.</div><div class='ctx'>  */</div><div class='del'>-static ssize_t ceph_sync_read(struct kiocb *iocb, struct iov_iter *to,</div><div class='del'>-			      int *retry_op)</div><div class='add'>+ssize_t __ceph_sync_read(struct inode *inode, loff_t *ki_pos,</div><div class='add'>+			 struct iov_iter *to, int *retry_op,</div><div class='add'>+			 u64 *last_objver)</div><div class='ctx'> {</div><div class='del'>-	struct file *file = iocb-&gt;ki_filp;</div><div class='del'>-	struct inode *inode = file_inode(file);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_inode_to_client(inode);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='ctx'> 	struct ceph_osd_client *osdc = &amp;fsc-&gt;client-&gt;osdc;</div><div class='ctx'> 	ssize_t ret;</div><div class='del'>-	u64 off = iocb-&gt;ki_pos;</div><div class='add'>+	u64 off = *ki_pos;</div><div class='ctx'> 	u64 len = iov_iter_count(to);</div><div class='add'>+	u64 i_size = i_size_read(inode);</div><div class='add'>+	bool sparse = IS_ENCRYPTED(inode) || ceph_test_mount_opt(fsc, SPARSEREAD);</div><div class='add'>+	u64 objver = 0;</div><div class='add'>+</div><div class='add'>+	doutc(cl, "on inode %p %llx.%llx %llx~%llx\n", inode,</div><div class='add'>+	      ceph_vinop(inode), *ki_pos, len);</div><div class='ctx'> </div><div class='del'>-	dout("sync_read on file %p %llu~%u %s\n", file, off, (unsigned)len,</div><div class='del'>-	     (file-&gt;f_flags &amp; O_DIRECT) ? "O_DIRECT" : "");</div><div class='add'>+	if (ceph_inode_is_shutdown(inode))</div><div class='add'>+		return -EIO;</div><div class='ctx'> </div><div class='del'>-	if (!len)</div><div class='add'>+	if (!len || !i_size)</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * flush any page cache pages in this range.  this</div><div class='hunk'>@@ -868,14 +1079,25 @@ static ssize_t ceph_sync_read(struct kiocb *iocb, struct iov_iter *to,</div><div class='ctx'> 		struct page **pages;</div><div class='ctx'> 		int num_pages;</div><div class='ctx'> 		size_t page_off;</div><div class='del'>-		u64 i_size;</div><div class='ctx'> 		bool more;</div><div class='del'>-		int idx;</div><div class='add'>+		int idx = 0;</div><div class='ctx'> 		size_t left;</div><div class='add'>+		struct ceph_osd_req_op *op;</div><div class='add'>+		u64 read_off = off;</div><div class='add'>+		u64 read_len = len;</div><div class='add'>+		int extent_cnt;</div><div class='add'>+</div><div class='add'>+		/* determine new offset/length if encrypted */</div><div class='add'>+		ceph_fscrypt_adjust_off_and_len(inode, &amp;read_off, &amp;read_len);</div><div class='add'>+</div><div class='add'>+		doutc(cl, "orig %llu~%llu reading %llu~%llu", off, len,</div><div class='add'>+		      read_off, read_len);</div><div class='ctx'> </div><div class='ctx'> 		req = ceph_osdc_new_request(osdc, &amp;ci-&gt;i_layout,</div><div class='del'>-					ci-&gt;i_vino, off, &amp;len, 0, 1,</div><div class='del'>-					CEPH_OSD_OP_READ, CEPH_OSD_FLAG_READ,</div><div class='add'>+					ci-&gt;i_vino, read_off, &amp;read_len, 0, 1,</div><div class='add'>+					sparse ? CEPH_OSD_OP_SPARSE_READ :</div><div class='add'>+						 CEPH_OSD_OP_READ,</div><div class='add'>+					CEPH_OSD_FLAG_READ,</div><div class='ctx'> 					NULL, ci-&gt;i_truncate_seq,</div><div class='ctx'> 					ci-&gt;i_truncate_size, false);</div><div class='ctx'> 		if (IS_ERR(req)) {</div><div class='hunk'>@@ -883,10 +1105,23 @@ static ssize_t ceph_sync_read(struct kiocb *iocb, struct iov_iter *to,</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		/* adjust len downward if the request truncated the len */</div><div class='add'>+		if (off + len &gt; read_off + read_len)</div><div class='add'>+			len = read_off + read_len - off;</div><div class='ctx'> 		more = len &lt; iov_iter_count(to);</div><div class='ctx'> </div><div class='del'>-		num_pages = calc_pages_for(off, len);</div><div class='del'>-		page_off = off &amp; ~PAGE_MASK;</div><div class='add'>+		op = &amp;req-&gt;r_ops[0];</div><div class='add'>+		if (sparse) {</div><div class='add'>+			extent_cnt = __ceph_sparse_read_ext_count(inode, read_len);</div><div class='add'>+			ret = ceph_alloc_sparse_ext_map(op, extent_cnt);</div><div class='add'>+			if (ret) {</div><div class='add'>+				ceph_osdc_put_request(req);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		num_pages = calc_pages_for(read_off, read_len);</div><div class='add'>+		page_off = offset_in_page(off);</div><div class='ctx'> 		pages = ceph_alloc_page_vector(num_pages, GFP_KERNEL);</div><div class='ctx'> 		if (IS_ERR(pages)) {</div><div class='ctx'> 			ceph_osdc_put_request(req);</div><div class='hunk'>@@ -894,74 +1129,133 @@ static ssize_t ceph_sync_read(struct kiocb *iocb, struct iov_iter *to,</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		osd_req_op_extent_osd_data_pages(req, 0, pages, len, page_off,</div><div class='del'>-						 false, false);</div><div class='del'>-		ret = ceph_osdc_start_request(osdc, req, false);</div><div class='del'>-		if (!ret)</div><div class='del'>-			ret = ceph_osdc_wait_request(osdc, req);</div><div class='add'>+		osd_req_op_extent_osd_data_pages(req, 0, pages, read_len,</div><div class='add'>+						 offset_in_page(read_off),</div><div class='add'>+						 false, true);</div><div class='add'>+</div><div class='add'>+		ceph_osdc_start_request(osdc, req);</div><div class='add'>+		ret = ceph_osdc_wait_request(osdc, req);</div><div class='ctx'> </div><div class='ctx'> 		ceph_update_read_metrics(&amp;fsc-&gt;mdsc-&gt;metric,</div><div class='ctx'> 					 req-&gt;r_start_latency,</div><div class='ctx'> 					 req-&gt;r_end_latency,</div><div class='del'>-					 len, ret);</div><div class='add'>+					 read_len, ret);</div><div class='ctx'> </div><div class='del'>-		ceph_osdc_put_request(req);</div><div class='add'>+		if (ret &gt; 0)</div><div class='add'>+			objver = req-&gt;r_version;</div><div class='ctx'> </div><div class='ctx'> 		i_size = i_size_read(inode);</div><div class='del'>-		dout("sync_read %llu~%llu got %zd i_size %llu%s\n",</div><div class='del'>-		     off, len, ret, i_size, (more ? " MORE" : ""));</div><div class='add'>+		doutc(cl, "%llu~%llu got %zd i_size %llu%s\n", off, len,</div><div class='add'>+		      ret, i_size, (more ? " MORE" : ""));</div><div class='ctx'> </div><div class='del'>-		if (ret == -ENOENT)</div><div class='add'>+		/* Fix it to go to end of extent map */</div><div class='add'>+		if (sparse &amp;&amp; ret &gt;= 0)</div><div class='add'>+			ret = ceph_sparse_ext_map_end(op);</div><div class='add'>+		else if (ret == -ENOENT)</div><div class='ctx'> 			ret = 0;</div><div class='del'>-		if (ret &gt;= 0 &amp;&amp; ret &lt; len &amp;&amp; (off + ret &lt; i_size)) {</div><div class='add'>+</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			ceph_osdc_put_request(req);</div><div class='add'>+			if (ret == -EBLOCKLISTED)</div><div class='add'>+				fsc-&gt;blocklisted = true;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (IS_ENCRYPTED(inode)) {</div><div class='add'>+			int fret;</div><div class='add'>+</div><div class='add'>+			fret = ceph_fscrypt_decrypt_extents(inode, pages,</div><div class='add'>+					read_off, op-&gt;extent.sparse_ext,</div><div class='add'>+					op-&gt;extent.sparse_ext_cnt);</div><div class='add'>+			if (fret &lt; 0) {</div><div class='add'>+				ret = fret;</div><div class='add'>+				ceph_osdc_put_request(req);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			/* account for any partial block at the beginning */</div><div class='add'>+			fret -= (off - read_off);</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * Short read after big offset adjustment?</div><div class='add'>+			 * Nothing is usable, just call it a zero</div><div class='add'>+			 * len read.</div><div class='add'>+			 */</div><div class='add'>+			fret = max(fret, 0);</div><div class='add'>+</div><div class='add'>+			/* account for partial block at the end */</div><div class='add'>+			ret = min_t(ssize_t, fret, len);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* Short read but not EOF? Zero out the remainder. */</div><div class='add'>+		if (ret &lt; len &amp;&amp; (off + ret &lt; i_size)) {</div><div class='ctx'> 			int zlen = min(len - ret, i_size - off - ret);</div><div class='ctx'> 			int zoff = page_off + ret;</div><div class='del'>-			dout("sync_read zero gap %llu~%llu\n",</div><div class='del'>-                             off + ret, off + ret + zlen);</div><div class='add'>+</div><div class='add'>+			doutc(cl, "zero gap %llu~%llu\n", off + ret,</div><div class='add'>+			      off + ret + zlen);</div><div class='ctx'> 			ceph_zero_page_vector_range(zoff, zlen, pages);</div><div class='ctx'> 			ret += zlen;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		idx = 0;</div><div class='del'>-		left = ret &gt; 0 ? ret : 0;</div><div class='add'>+		if (off + ret &gt; i_size)</div><div class='add'>+			left = (i_size &gt; off) ? i_size - off : 0;</div><div class='add'>+		else</div><div class='add'>+			left = ret;</div><div class='add'>+</div><div class='ctx'> 		while (left &gt; 0) {</div><div class='del'>-			size_t len, copied;</div><div class='del'>-			page_off = off &amp; ~PAGE_MASK;</div><div class='del'>-			len = min_t(size_t, left, PAGE_SIZE - page_off);</div><div class='add'>+			size_t plen, copied;</div><div class='add'>+</div><div class='add'>+			plen = min_t(size_t, left, PAGE_SIZE - page_off);</div><div class='ctx'> 			SetPageUptodate(pages[idx]);</div><div class='ctx'> 			copied = copy_page_to_iter(pages[idx++],</div><div class='del'>-						   page_off, len, to);</div><div class='add'>+						   page_off, plen, to);</div><div class='ctx'> 			off += copied;</div><div class='ctx'> 			left -= copied;</div><div class='del'>-			if (copied &lt; len) {</div><div class='add'>+			page_off = 0;</div><div class='add'>+			if (copied &lt; plen) {</div><div class='ctx'> 				ret = -EFAULT;</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		ceph_release_page_vector(pages, num_pages);</div><div class='ctx'> </div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			if (ret == -EBLOCKLISTED)</div><div class='del'>-				fsc-&gt;blocklisted = true;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='add'>+		ceph_osdc_put_request(req);</div><div class='ctx'> </div><div class='ctx'> 		if (off &gt;= i_size || !more)</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (off &gt; iocb-&gt;ki_pos) {</div><div class='del'>-		if (ret &gt;= 0 &amp;&amp;</div><div class='del'>-		    iov_iter_count(to) &gt; 0 &amp;&amp; off &gt;= i_size_read(inode))</div><div class='add'>+	if (ret &gt; 0) {</div><div class='add'>+		if (off &gt;= i_size) {</div><div class='ctx'> 			*retry_op = CHECK_EOF;</div><div class='del'>-		ret = off - iocb-&gt;ki_pos;</div><div class='del'>-		iocb-&gt;ki_pos = off;</div><div class='del'>-	}</div><div class='add'>+			ret = i_size - *ki_pos;</div><div class='add'>+			*ki_pos = i_size;</div><div class='add'>+		} else {</div><div class='add'>+			ret = off - *ki_pos;</div><div class='add'>+			*ki_pos = off;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	dout("sync_read result %zd retry_op %d\n", ret, *retry_op);</div><div class='add'>+		if (last_objver)</div><div class='add'>+			*last_objver = objver;</div><div class='add'>+	}</div><div class='add'>+	doutc(cl, "result %zd retry_op %d\n", ret, *retry_op);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static ssize_t ceph_sync_read(struct kiocb *iocb, struct iov_iter *to,</div><div class='add'>+			      int *retry_op)</div><div class='add'>+{</div><div class='add'>+	struct file *file = iocb-&gt;ki_filp;</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='add'>+</div><div class='add'>+	doutc(cl, "on file %p %llx~%zx %s\n", file, iocb-&gt;ki_pos,</div><div class='add'>+	      iov_iter_count(to),</div><div class='add'>+	      (file-&gt;f_flags &amp; O_DIRECT) ? "O_DIRECT" : "");</div><div class='add'>+</div><div class='add'>+	return __ceph_sync_read(inode, &amp;iocb-&gt;ki_pos, to, retry_op, NULL);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> struct ceph_aio_request {</div><div class='ctx'> 	struct kiocb *iocb;</div><div class='ctx'> 	size_t total_len;</div><div class='hunk'>@@ -985,6 +1279,7 @@ static void ceph_aio_retry_work(struct work_struct *work);</div><div class='ctx'> static void ceph_aio_complete(struct inode *inode,</div><div class='ctx'> 			      struct ceph_aio_request *aio_req)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -998,7 +1293,7 @@ static void ceph_aio_complete(struct inode *inode,</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		ret = aio_req-&gt;total_len;</div><div class='ctx'> </div><div class='del'>-	dout("ceph_aio_complete %p rc %d\n", inode, ret);</div><div class='add'>+	doutc(cl, "%p %llx.%llx rc %d\n", inode, ceph_vinop(inode), ret);</div><div class='ctx'> </div><div class='ctx'> 	if (ret &gt;= 0 &amp;&amp; aio_req-&gt;write) {</div><div class='ctx'> 		int dirty;</div><div class='hunk'>@@ -1006,11 +1301,10 @@ static void ceph_aio_complete(struct inode *inode,</div><div class='ctx'> 		loff_t endoff = aio_req-&gt;iocb-&gt;ki_pos + aio_req-&gt;total_len;</div><div class='ctx'> 		if (endoff &gt; i_size_read(inode)) {</div><div class='ctx'> 			if (ceph_inode_set_size(inode, endoff))</div><div class='del'>-				ceph_check_caps(ci, CHECK_CAPS_AUTHONLY, NULL);</div><div class='add'>+				ceph_check_caps(ci, CHECK_CAPS_AUTHONLY);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-		ci-&gt;i_inline_version = CEPH_INLINE_NONE;</div><div class='ctx'> 		dirty = __ceph_mark_dirty_caps(ci, CEPH_CAP_FILE_WR,</div><div class='ctx'> 					       &amp;aio_req-&gt;prealloc_cf);</div><div class='ctx'> 		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='hunk'>@@ -1034,13 +1328,17 @@ static void ceph_aio_complete_req(struct ceph_osd_request *req)</div><div class='ctx'> 	struct inode *inode = req-&gt;r_inode;</div><div class='ctx'> 	struct ceph_aio_request *aio_req = req-&gt;r_priv;</div><div class='ctx'> 	struct ceph_osd_data *osd_data = osd_req_op_extent_osd_data(req, 0);</div><div class='add'>+	struct ceph_osd_req_op *op = &amp;req-&gt;r_ops[0];</div><div class='ctx'> 	struct ceph_client_metric *metric = &amp;ceph_sb_to_mdsc(inode-&gt;i_sb)-&gt;metric;</div><div class='ctx'> 	unsigned int len = osd_data-&gt;bvec_pos.iter.bi_size;</div><div class='add'>+	bool sparse = (op-&gt;op == CEPH_OSD_OP_SPARSE_READ);</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(osd_data-&gt;type != CEPH_OSD_DATA_TYPE_BVECS);</div><div class='ctx'> 	BUG_ON(!osd_data-&gt;num_bvecs);</div><div class='ctx'> </div><div class='del'>-	dout("ceph_aio_complete_req %p rc %d bytes %u\n", inode, rc, len);</div><div class='add'>+	doutc(cl, "req %p inode %p %llx.%llx, rc %d bytes %u\n", req,</div><div class='add'>+	      inode, ceph_vinop(inode), rc, len);</div><div class='ctx'> </div><div class='ctx'> 	if (rc == -EOLDSNAPC) {</div><div class='ctx'> 		struct ceph_aio_work *aio_work;</div><div class='hunk'>@@ -1050,12 +1348,14 @@ static void ceph_aio_complete_req(struct ceph_osd_request *req)</div><div class='ctx'> 		if (aio_work) {</div><div class='ctx'> 			INIT_WORK(&amp;aio_work-&gt;work, ceph_aio_retry_work);</div><div class='ctx'> 			aio_work-&gt;req = req;</div><div class='del'>-			queue_work(ceph_inode_to_client(inode)-&gt;inode_wq,</div><div class='add'>+			queue_work(ceph_inode_to_fs_client(inode)-&gt;inode_wq,</div><div class='ctx'> 				   &amp;aio_work-&gt;work);</div><div class='ctx'> 			return;</div><div class='ctx'> 		}</div><div class='ctx'> 		rc = -ENOMEM;</div><div class='ctx'> 	} else if (!aio_req-&gt;write) {</div><div class='add'>+		if (sparse &amp;&amp; rc &gt;= 0)</div><div class='add'>+			rc = ceph_sparse_ext_map_end(op);</div><div class='ctx'> 		if (rc == -ENOENT)</div><div class='ctx'> 			rc = 0;</div><div class='ctx'> 		if (rc &gt;= 0 &amp;&amp; len &gt; rc) {</div><div class='hunk'>@@ -1076,7 +1376,7 @@ static void ceph_aio_complete_req(struct ceph_osd_request *req)</div><div class='ctx'> 				aio_req-&gt;total_len = rc + zlen;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			iov_iter_bvec(&amp;i, READ, osd_data-&gt;bvec_pos.bvecs,</div><div class='add'>+			iov_iter_bvec(&amp;i, ITER_DEST, osd_data-&gt;bvec_pos.bvecs,</div><div class='ctx'> 				      osd_data-&gt;num_bvecs, len);</div><div class='ctx'> 			iov_iter_advance(&amp;i, rc);</div><div class='ctx'> 			iov_iter_zero(zlen, &amp;i);</div><div class='hunk'>@@ -1159,7 +1459,7 @@ static void ceph_aio_retry_work(struct work_struct *work)</div><div class='ctx'> 	req-&gt;r_inode = inode;</div><div class='ctx'> 	req-&gt;r_priv = aio_req;</div><div class='ctx'> </div><div class='del'>-	ret = ceph_osdc_start_request(req-&gt;r_osdc, req, false);</div><div class='add'>+	ceph_osdc_start_request(req-&gt;r_osdc, req);</div><div class='ctx'> out:</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='ctx'> 		req-&gt;r_result = ret;</div><div class='hunk'>@@ -1178,7 +1478,8 @@ ceph_direct_read_write(struct kiocb *iocb, struct iov_iter *iter,</div><div class='ctx'> 	struct file *file = iocb-&gt;ki_filp;</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_inode_to_client(inode);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='ctx'> 	struct ceph_client_metric *metric = &amp;fsc-&gt;mdsc-&gt;metric;</div><div class='ctx'> 	struct ceph_vino vino;</div><div class='ctx'> 	struct ceph_osd_request *req;</div><div class='hunk'>@@ -1191,21 +1492,27 @@ ceph_direct_read_write(struct kiocb *iocb, struct iov_iter *iter,</div><div class='ctx'> 	size_t count = iov_iter_count(iter);</div><div class='ctx'> 	loff_t pos = iocb-&gt;ki_pos;</div><div class='ctx'> 	bool write = iov_iter_rw(iter) == WRITE;</div><div class='del'>-	bool should_dirty = !write &amp;&amp; iter_is_iovec(iter);</div><div class='add'>+	bool should_dirty = !write &amp;&amp; user_backed_iter(iter);</div><div class='add'>+	bool sparse = ceph_test_mount_opt(fsc, SPARSEREAD);</div><div class='ctx'> </div><div class='ctx'> 	if (write &amp;&amp; ceph_snap(file_inode(file)) != CEPH_NOSNAP)</div><div class='ctx'> 		return -EROFS;</div><div class='ctx'> </div><div class='del'>-	dout("sync_direct_%s on file %p %lld~%u snapc %p seq %lld\n",</div><div class='del'>-	     (write ? "write" : "read"), file, pos, (unsigned)count,</div><div class='del'>-	     snapc, snapc ? snapc-&gt;seq : 0);</div><div class='add'>+	doutc(cl, "sync_direct_%s on file %p %lld~%u snapc %p seq %lld\n",</div><div class='add'>+	      (write ? "write" : "read"), file, pos, (unsigned)count,</div><div class='add'>+	      snapc, snapc ? snapc-&gt;seq : 0);</div><div class='ctx'> </div><div class='ctx'> 	if (write) {</div><div class='del'>-		int ret2 = invalidate_inode_pages2_range(inode-&gt;i_mapping,</div><div class='add'>+		int ret2;</div><div class='add'>+</div><div class='add'>+		ceph_fscache_invalidate(inode, true);</div><div class='add'>+</div><div class='add'>+		ret2 = invalidate_inode_pages2_range(inode-&gt;i_mapping,</div><div class='ctx'> 					pos &gt;&gt; PAGE_SHIFT,</div><div class='ctx'> 					(pos + count - 1) &gt;&gt; PAGE_SHIFT);</div><div class='ctx'> 		if (ret2 &lt; 0)</div><div class='del'>-			dout("invalidate_inode_pages2_range returned %d\n", ret2);</div><div class='add'>+			doutc(cl, "invalidate_inode_pages2_range returned %d\n",</div><div class='add'>+			      ret2);</div><div class='ctx'> </div><div class='ctx'> 		flags = /* CEPH_OSD_FLAG_ORDERSNAP | */ CEPH_OSD_FLAG_WRITE;</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -1215,6 +1522,9 @@ ceph_direct_read_write(struct kiocb *iocb, struct iov_iter *iter,</div><div class='ctx'> 	while (iov_iter_count(iter) &gt; 0) {</div><div class='ctx'> 		u64 size = iov_iter_count(iter);</div><div class='ctx'> 		ssize_t len;</div><div class='add'>+		struct ceph_osd_req_op *op;</div><div class='add'>+		int readop = sparse ? CEPH_OSD_OP_SPARSE_READ : CEPH_OSD_OP_READ;</div><div class='add'>+		int extent_cnt;</div><div class='ctx'> </div><div class='ctx'> 		if (write)</div><div class='ctx'> 			size = min_t(u64, size, fsc-&gt;mount_options-&gt;wsize);</div><div class='hunk'>@@ -1225,8 +1535,7 @@ ceph_direct_read_write(struct kiocb *iocb, struct iov_iter *iter,</div><div class='ctx'> 		req = ceph_osdc_new_request(&amp;fsc-&gt;client-&gt;osdc, &amp;ci-&gt;i_layout,</div><div class='ctx'> 					    vino, pos, &amp;size, 0,</div><div class='ctx'> 					    1,</div><div class='del'>-					    write ? CEPH_OSD_OP_WRITE :</div><div class='del'>-						    CEPH_OSD_OP_READ,</div><div class='add'>+					    write ? CEPH_OSD_OP_WRITE : readop,</div><div class='ctx'> 					    flags, snapc,</div><div class='ctx'> 					    ci-&gt;i_truncate_seq,</div><div class='ctx'> 					    ci-&gt;i_truncate_size,</div><div class='hunk'>@@ -1236,6 +1545,16 @@ ceph_direct_read_write(struct kiocb *iocb, struct iov_iter *iter,</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		op = &amp;req-&gt;r_ops[0];</div><div class='add'>+		if (!write &amp;&amp; sparse) {</div><div class='add'>+			extent_cnt = __ceph_sparse_read_ext_count(inode, size);</div><div class='add'>+			ret = ceph_alloc_sparse_ext_map(op, extent_cnt);</div><div class='add'>+			if (ret) {</div><div class='add'>+				ceph_osdc_put_request(req);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		len = iter_get_bvecs_alloc(iter, size, &amp;bvecs, &amp;num_pages);</div><div class='ctx'> 		if (len &lt; 0) {</div><div class='ctx'> 			ceph_osdc_put_request(req);</div><div class='hunk'>@@ -1245,6 +1564,8 @@ ceph_direct_read_write(struct kiocb *iocb, struct iov_iter *iter,</div><div class='ctx'> 		if (len != size)</div><div class='ctx'> 			osd_req_op_extent_update(req, 0, len);</div><div class='ctx'> </div><div class='add'>+		osd_req_op_extent_osd_data_bvecs(req, 0, bvecs, num_pages, len);</div><div class='add'>+</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * To simplify error handling, allow AIO when IO within i_size</div><div class='ctx'> 		 * or IO can be satisfied by single OSD request.</div><div class='hunk'>@@ -1276,8 +1597,6 @@ ceph_direct_read_write(struct kiocb *iocb, struct iov_iter *iter,</div><div class='ctx'> 			req-&gt;r_mtime = mtime;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		osd_req_op_extent_osd_data_bvecs(req, 0, bvecs, num_pages, len);</div><div class='del'>-</div><div class='ctx'> 		if (aio_req) {</div><div class='ctx'> 			aio_req-&gt;total_len += len;</div><div class='ctx'> 			aio_req-&gt;num_reqs++;</div><div class='hunk'>@@ -1292,9 +1611,8 @@ ceph_direct_read_write(struct kiocb *iocb, struct iov_iter *iter,</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		ret = ceph_osdc_start_request(req-&gt;r_osdc, req, false);</div><div class='del'>-		if (!ret)</div><div class='del'>-			ret = ceph_osdc_wait_request(&amp;fsc-&gt;client-&gt;osdc, req);</div><div class='add'>+		ceph_osdc_start_request(req-&gt;r_osdc, req);</div><div class='add'>+		ret = ceph_osdc_wait_request(&amp;fsc-&gt;client-&gt;osdc, req);</div><div class='ctx'> </div><div class='ctx'> 		if (write)</div><div class='ctx'> 			ceph_update_write_metrics(metric, req-&gt;r_start_latency,</div><div class='hunk'>@@ -1305,14 +1623,17 @@ ceph_direct_read_write(struct kiocb *iocb, struct iov_iter *iter,</div><div class='ctx'> </div><div class='ctx'> 		size = i_size_read(inode);</div><div class='ctx'> 		if (!write) {</div><div class='del'>-			if (ret == -ENOENT)</div><div class='add'>+			if (sparse &amp;&amp; ret &gt;= 0)</div><div class='add'>+				ret = ceph_sparse_ext_map_end(op);</div><div class='add'>+			else if (ret == -ENOENT)</div><div class='ctx'> 				ret = 0;</div><div class='add'>+</div><div class='ctx'> 			if (ret &gt;= 0 &amp;&amp; ret &lt; len &amp;&amp; pos + ret &lt; size) {</div><div class='ctx'> 				struct iov_iter i;</div><div class='ctx'> 				int zlen = min_t(size_t, len - ret,</div><div class='ctx'> 						 size - pos - ret);</div><div class='ctx'> </div><div class='del'>-				iov_iter_bvec(&amp;i, READ, bvecs, num_pages, len);</div><div class='add'>+				iov_iter_bvec(&amp;i, ITER_DEST, bvecs, num_pages, len);</div><div class='ctx'> 				iov_iter_advance(&amp;i, ret);</div><div class='ctx'> 				iov_iter_zero(zlen, &amp;i);</div><div class='ctx'> 				ret += zlen;</div><div class='hunk'>@@ -1333,8 +1654,7 @@ ceph_direct_read_write(struct kiocb *iocb, struct iov_iter *iter,</div><div class='ctx'> 		if (write &amp;&amp; pos &gt; size) {</div><div class='ctx'> 			if (ceph_inode_set_size(inode, pos))</div><div class='ctx'> 				ceph_check_caps(ceph_inode(inode),</div><div class='del'>-						CHECK_CAPS_AUTHONLY,</div><div class='del'>-						NULL);</div><div class='add'>+						CHECK_CAPS_AUTHONLY);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1357,8 +1677,7 @@ ceph_direct_read_write(struct kiocb *iocb, struct iov_iter *iter,</div><div class='ctx'> 					       r_private_item);</div><div class='ctx'> 			list_del_init(&amp;req-&gt;r_private_item);</div><div class='ctx'> 			if (ret &gt;= 0)</div><div class='del'>-				ret = ceph_osdc_start_request(req-&gt;r_osdc,</div><div class='del'>-							      req, false);</div><div class='add'>+				ceph_osdc_start_request(req-&gt;r_osdc, req);</div><div class='ctx'> 			if (ret &lt; 0) {</div><div class='ctx'> 				req-&gt;r_result = ret;</div><div class='ctx'> 				ceph_aio_complete_req(req);</div><div class='hunk'>@@ -1388,14 +1707,14 @@ ceph_sync_write(struct kiocb *iocb, struct iov_iter *from, loff_t pos,</div><div class='ctx'> 	struct file *file = iocb-&gt;ki_filp;</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_inode_to_client(inode);</div><div class='del'>-	struct ceph_vino vino;</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='add'>+	struct ceph_osd_client *osdc = &amp;fsc-&gt;client-&gt;osdc;</div><div class='ctx'> 	struct ceph_osd_request *req;</div><div class='ctx'> 	struct page **pages;</div><div class='ctx'> 	u64 len;</div><div class='ctx'> 	int num_pages;</div><div class='ctx'> 	int written = 0;</div><div class='del'>-	int flags;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	bool check_caps = false;</div><div class='ctx'> 	struct timespec64 mtime = current_time(inode);</div><div class='hunk'>@@ -1404,94 +1723,363 @@ ceph_sync_write(struct kiocb *iocb, struct iov_iter *from, loff_t pos,</div><div class='ctx'> 	if (ceph_snap(file_inode(file)) != CEPH_NOSNAP)</div><div class='ctx'> 		return -EROFS;</div><div class='ctx'> </div><div class='del'>-	dout("sync_write on file %p %lld~%u snapc %p seq %lld\n",</div><div class='del'>-	     file, pos, (unsigned)count, snapc, snapc-&gt;seq);</div><div class='add'>+	doutc(cl, "on file %p %lld~%u snapc %p seq %lld\n", file, pos,</div><div class='add'>+	      (unsigned)count, snapc, snapc-&gt;seq);</div><div class='ctx'> </div><div class='ctx'> 	ret = filemap_write_and_wait_range(inode-&gt;i_mapping,</div><div class='ctx'> 					   pos, pos + count - 1);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	ret = invalidate_inode_pages2_range(inode-&gt;i_mapping,</div><div class='del'>-					    pos &gt;&gt; PAGE_SHIFT,</div><div class='del'>-					    (pos + count - 1) &gt;&gt; PAGE_SHIFT);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		dout("invalidate_inode_pages2_range returned %d\n", ret);</div><div class='del'>-</div><div class='del'>-	flags = /* CEPH_OSD_FLAG_ORDERSNAP | */ CEPH_OSD_FLAG_WRITE;</div><div class='add'>+	ceph_fscache_invalidate(inode, false);</div><div class='ctx'> </div><div class='ctx'> 	while ((len = iov_iter_count(from)) &gt; 0) {</div><div class='ctx'> 		size_t left;</div><div class='ctx'> 		int n;</div><div class='del'>-</div><div class='del'>-		vino = ceph_vino(inode);</div><div class='del'>-		req = ceph_osdc_new_request(&amp;fsc-&gt;client-&gt;osdc, &amp;ci-&gt;i_layout,</div><div class='del'>-					    vino, pos, &amp;len, 0, 1,</div><div class='del'>-					    CEPH_OSD_OP_WRITE, flags, snapc,</div><div class='del'>-					    ci-&gt;i_truncate_seq,</div><div class='del'>-					    ci-&gt;i_truncate_size,</div><div class='del'>-					    false);</div><div class='del'>-		if (IS_ERR(req)) {</div><div class='del'>-			ret = PTR_ERR(req);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='add'>+		u64 write_pos = pos;</div><div class='add'>+		u64 write_len = len;</div><div class='add'>+		u64 objnum, objoff;</div><div class='add'>+		u32 xlen;</div><div class='add'>+		u64 assert_ver = 0;</div><div class='add'>+		bool rmw;</div><div class='add'>+		bool first, last;</div><div class='add'>+		struct iov_iter saved_iter = *from;</div><div class='add'>+		size_t off;</div><div class='add'>+</div><div class='add'>+		ceph_fscrypt_adjust_off_and_len(inode, &amp;write_pos, &amp;write_len);</div><div class='add'>+</div><div class='add'>+		/* clamp the length to the end of first object */</div><div class='add'>+		ceph_calc_file_object_mapping(&amp;ci-&gt;i_layout, write_pos,</div><div class='add'>+					      write_len, &amp;objnum, &amp;objoff,</div><div class='add'>+					      &amp;xlen);</div><div class='add'>+		write_len = xlen;</div><div class='add'>+</div><div class='add'>+		/* adjust len downward if it goes beyond current object */</div><div class='add'>+		if (pos + len &gt; write_pos + write_len)</div><div class='add'>+			len = write_pos + write_len - pos;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * write from beginning of first page,</div><div class='del'>-		 * regardless of io alignment</div><div class='add'>+		 * If we had to adjust the length or position to align with a</div><div class='add'>+		 * crypto block, then we must do a read/modify/write cycle. We</div><div class='add'>+		 * use a version assertion to redrive the thing if something</div><div class='add'>+		 * changes in between.</div><div class='ctx'> 		 */</div><div class='del'>-		num_pages = (len + PAGE_SIZE - 1) &gt;&gt; PAGE_SHIFT;</div><div class='add'>+		first = pos != write_pos;</div><div class='add'>+		last = (pos + len) != (write_pos + write_len);</div><div class='add'>+		rmw = first || last;</div><div class='add'>+</div><div class='add'>+		doutc(cl, "ino %llx %lld~%llu adjusted %lld~%llu -- %srmw\n",</div><div class='add'>+		      ci-&gt;i_vino.ino, pos, len, write_pos, write_len,</div><div class='add'>+		      rmw ? "" : "no ");</div><div class='ctx'> </div><div class='add'>+		/*</div><div class='add'>+		 * The data is emplaced into the page as it would be if it were</div><div class='add'>+		 * in an array of pagecache pages.</div><div class='add'>+		 */</div><div class='add'>+		num_pages = calc_pages_for(write_pos, write_len);</div><div class='ctx'> 		pages = ceph_alloc_page_vector(num_pages, GFP_KERNEL);</div><div class='ctx'> 		if (IS_ERR(pages)) {</div><div class='ctx'> 			ret = PTR_ERR(pages);</div><div class='del'>-			goto out;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* Do we need to preload the pages? */</div><div class='add'>+		if (rmw) {</div><div class='add'>+			u64 first_pos = write_pos;</div><div class='add'>+			u64 last_pos = (write_pos + write_len) - CEPH_FSCRYPT_BLOCK_SIZE;</div><div class='add'>+			u64 read_len = CEPH_FSCRYPT_BLOCK_SIZE;</div><div class='add'>+			struct ceph_osd_req_op *op;</div><div class='add'>+</div><div class='add'>+			/* We should only need to do this for encrypted inodes */</div><div class='add'>+			WARN_ON_ONCE(!IS_ENCRYPTED(inode));</div><div class='add'>+</div><div class='add'>+			/* No need to do two reads if first and last blocks are same */</div><div class='add'>+			if (first &amp;&amp; last_pos == first_pos)</div><div class='add'>+				last = false;</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * Allocate a read request for one or two extents,</div><div class='add'>+			 * depending on how the request was aligned.</div><div class='add'>+			 */</div><div class='add'>+			req = ceph_osdc_new_request(osdc, &amp;ci-&gt;i_layout,</div><div class='add'>+					ci-&gt;i_vino, first ? first_pos : last_pos,</div><div class='add'>+					&amp;read_len, 0, (first &amp;&amp; last) ? 2 : 1,</div><div class='add'>+					CEPH_OSD_OP_SPARSE_READ, CEPH_OSD_FLAG_READ,</div><div class='add'>+					NULL, ci-&gt;i_truncate_seq,</div><div class='add'>+					ci-&gt;i_truncate_size, false);</div><div class='add'>+			if (IS_ERR(req)) {</div><div class='add'>+				ceph_release_page_vector(pages, num_pages);</div><div class='add'>+				ret = PTR_ERR(req);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			/* Something is misaligned! */</div><div class='add'>+			if (read_len != CEPH_FSCRYPT_BLOCK_SIZE) {</div><div class='add'>+				ceph_osdc_put_request(req);</div><div class='add'>+				ceph_release_page_vector(pages, num_pages);</div><div class='add'>+				ret = -EIO;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			/* Add extent for first block? */</div><div class='add'>+			op = &amp;req-&gt;r_ops[0];</div><div class='add'>+</div><div class='add'>+			if (first) {</div><div class='add'>+				osd_req_op_extent_osd_data_pages(req, 0, pages,</div><div class='add'>+							 CEPH_FSCRYPT_BLOCK_SIZE,</div><div class='add'>+							 offset_in_page(first_pos),</div><div class='add'>+							 false, false);</div><div class='add'>+				/* We only expect a single extent here */</div><div class='add'>+				ret = __ceph_alloc_sparse_ext_map(op, 1);</div><div class='add'>+				if (ret) {</div><div class='add'>+					ceph_osdc_put_request(req);</div><div class='add'>+					ceph_release_page_vector(pages, num_pages);</div><div class='add'>+					break;</div><div class='add'>+				}</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			/* Add extent for last block */</div><div class='add'>+			if (last) {</div><div class='add'>+				/* Init the other extent if first extent has been used */</div><div class='add'>+				if (first) {</div><div class='add'>+					op = &amp;req-&gt;r_ops[1];</div><div class='add'>+					osd_req_op_extent_init(req, 1,</div><div class='add'>+							CEPH_OSD_OP_SPARSE_READ,</div><div class='add'>+							last_pos, CEPH_FSCRYPT_BLOCK_SIZE,</div><div class='add'>+							ci-&gt;i_truncate_size,</div><div class='add'>+							ci-&gt;i_truncate_seq);</div><div class='add'>+				}</div><div class='add'>+</div><div class='add'>+				ret = __ceph_alloc_sparse_ext_map(op, 1);</div><div class='add'>+				if (ret) {</div><div class='add'>+					ceph_osdc_put_request(req);</div><div class='add'>+					ceph_release_page_vector(pages, num_pages);</div><div class='add'>+					break;</div><div class='add'>+				}</div><div class='add'>+</div><div class='add'>+				osd_req_op_extent_osd_data_pages(req, first ? 1 : 0,</div><div class='add'>+							&amp;pages[num_pages - 1],</div><div class='add'>+							CEPH_FSCRYPT_BLOCK_SIZE,</div><div class='add'>+							offset_in_page(last_pos),</div><div class='add'>+							false, false);</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			ceph_osdc_start_request(osdc, req);</div><div class='add'>+			ret = ceph_osdc_wait_request(osdc, req);</div><div class='add'>+</div><div class='add'>+			/* FIXME: length field is wrong if there are 2 extents */</div><div class='add'>+			ceph_update_read_metrics(&amp;fsc-&gt;mdsc-&gt;metric,</div><div class='add'>+						 req-&gt;r_start_latency,</div><div class='add'>+						 req-&gt;r_end_latency,</div><div class='add'>+						 read_len, ret);</div><div class='add'>+</div><div class='add'>+			/* Ok if object is not already present */</div><div class='add'>+			if (ret == -ENOENT) {</div><div class='add'>+				/*</div><div class='add'>+				 * If there is no object, then we can't assert</div><div class='add'>+				 * on its version. Set it to 0, and we'll use an</div><div class='add'>+				 * exclusive create instead.</div><div class='add'>+				 */</div><div class='add'>+				ceph_osdc_put_request(req);</div><div class='add'>+				ret = 0;</div><div class='add'>+</div><div class='add'>+				/*</div><div class='add'>+				 * zero out the soon-to-be uncopied parts of the</div><div class='add'>+				 * first and last pages.</div><div class='add'>+				 */</div><div class='add'>+				if (first)</div><div class='add'>+					zero_user_segment(pages[0], 0,</div><div class='add'>+							  offset_in_page(first_pos));</div><div class='add'>+				if (last)</div><div class='add'>+					zero_user_segment(pages[num_pages - 1],</div><div class='add'>+							  offset_in_page(last_pos),</div><div class='add'>+							  PAGE_SIZE);</div><div class='add'>+			} else {</div><div class='add'>+				if (ret &lt; 0) {</div><div class='add'>+					ceph_osdc_put_request(req);</div><div class='add'>+					ceph_release_page_vector(pages, num_pages);</div><div class='add'>+					break;</div><div class='add'>+				}</div><div class='add'>+</div><div class='add'>+				op = &amp;req-&gt;r_ops[0];</div><div class='add'>+				if (op-&gt;extent.sparse_ext_cnt == 0) {</div><div class='add'>+					if (first)</div><div class='add'>+						zero_user_segment(pages[0], 0,</div><div class='add'>+								  offset_in_page(first_pos));</div><div class='add'>+					else</div><div class='add'>+						zero_user_segment(pages[num_pages - 1],</div><div class='add'>+								  offset_in_page(last_pos),</div><div class='add'>+								  PAGE_SIZE);</div><div class='add'>+				} else if (op-&gt;extent.sparse_ext_cnt != 1 ||</div><div class='add'>+					   ceph_sparse_ext_map_end(op) !=</div><div class='add'>+						CEPH_FSCRYPT_BLOCK_SIZE) {</div><div class='add'>+					ret = -EIO;</div><div class='add'>+					ceph_osdc_put_request(req);</div><div class='add'>+					ceph_release_page_vector(pages, num_pages);</div><div class='add'>+					break;</div><div class='add'>+				}</div><div class='add'>+</div><div class='add'>+				if (first &amp;&amp; last) {</div><div class='add'>+					op = &amp;req-&gt;r_ops[1];</div><div class='add'>+					if (op-&gt;extent.sparse_ext_cnt == 0) {</div><div class='add'>+						zero_user_segment(pages[num_pages - 1],</div><div class='add'>+								  offset_in_page(last_pos),</div><div class='add'>+								  PAGE_SIZE);</div><div class='add'>+					} else if (op-&gt;extent.sparse_ext_cnt != 1 ||</div><div class='add'>+						   ceph_sparse_ext_map_end(op) !=</div><div class='add'>+							CEPH_FSCRYPT_BLOCK_SIZE) {</div><div class='add'>+						ret = -EIO;</div><div class='add'>+						ceph_osdc_put_request(req);</div><div class='add'>+						ceph_release_page_vector(pages, num_pages);</div><div class='add'>+						break;</div><div class='add'>+					}</div><div class='add'>+				}</div><div class='add'>+</div><div class='add'>+				/* Grab assert version. It must be non-zero. */</div><div class='add'>+				assert_ver = req-&gt;r_version;</div><div class='add'>+				WARN_ON_ONCE(ret &gt; 0 &amp;&amp; assert_ver == 0);</div><div class='add'>+</div><div class='add'>+				ceph_osdc_put_request(req);</div><div class='add'>+				if (first) {</div><div class='add'>+					ret = ceph_fscrypt_decrypt_block_inplace(inode,</div><div class='add'>+							pages[0], CEPH_FSCRYPT_BLOCK_SIZE,</div><div class='add'>+							offset_in_page(first_pos),</div><div class='add'>+							first_pos &gt;&gt; CEPH_FSCRYPT_BLOCK_SHIFT);</div><div class='add'>+					if (ret &lt; 0) {</div><div class='add'>+						ceph_release_page_vector(pages, num_pages);</div><div class='add'>+						break;</div><div class='add'>+					}</div><div class='add'>+				}</div><div class='add'>+				if (last) {</div><div class='add'>+					ret = ceph_fscrypt_decrypt_block_inplace(inode,</div><div class='add'>+							pages[num_pages - 1],</div><div class='add'>+							CEPH_FSCRYPT_BLOCK_SIZE,</div><div class='add'>+							offset_in_page(last_pos),</div><div class='add'>+							last_pos &gt;&gt; CEPH_FSCRYPT_BLOCK_SHIFT);</div><div class='add'>+					if (ret &lt; 0) {</div><div class='add'>+						ceph_release_page_vector(pages, num_pages);</div><div class='add'>+						break;</div><div class='add'>+					}</div><div class='add'>+				}</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		left = len;</div><div class='add'>+		off = offset_in_page(pos);</div><div class='ctx'> 		for (n = 0; n &lt; num_pages; n++) {</div><div class='del'>-			size_t plen = min_t(size_t, left, PAGE_SIZE);</div><div class='del'>-			ret = copy_page_from_iter(pages[n], 0, plen, from);</div><div class='add'>+			size_t plen = min_t(size_t, left, PAGE_SIZE - off);</div><div class='add'>+</div><div class='add'>+			/* copy the data */</div><div class='add'>+			ret = copy_page_from_iter(pages[n], off, plen, from);</div><div class='ctx'> 			if (ret != plen) {</div><div class='ctx'> 				ret = -EFAULT;</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='add'>+			off = 0;</div><div class='ctx'> 			left -= ret;</div><div class='ctx'> 		}</div><div class='del'>-</div><div class='ctx'> 		if (ret &lt; 0) {</div><div class='add'>+			doutc(cl, "write failed with %d\n", ret);</div><div class='ctx'> 			ceph_release_page_vector(pages, num_pages);</div><div class='del'>-			goto out;</div><div class='add'>+			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		req-&gt;r_inode = inode;</div><div class='add'>+		if (IS_ENCRYPTED(inode)) {</div><div class='add'>+			ret = ceph_fscrypt_encrypt_pages(inode, pages,</div><div class='add'>+							 write_pos, write_len);</div><div class='add'>+			if (ret &lt; 0) {</div><div class='add'>+				doutc(cl, "encryption failed with %d\n", ret);</div><div class='add'>+				ceph_release_page_vector(pages, num_pages);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-		osd_req_op_extent_osd_data_pages(req, 0, pages, len, 0,</div><div class='del'>-						false, true);</div><div class='add'>+		req = ceph_osdc_new_request(osdc, &amp;ci-&gt;i_layout,</div><div class='add'>+					    ci-&gt;i_vino, write_pos, &amp;write_len,</div><div class='add'>+					    rmw ? 1 : 0, rmw ? 2 : 1,</div><div class='add'>+					    CEPH_OSD_OP_WRITE,</div><div class='add'>+					    CEPH_OSD_FLAG_WRITE,</div><div class='add'>+					    snapc, ci-&gt;i_truncate_seq,</div><div class='add'>+					    ci-&gt;i_truncate_size, false);</div><div class='add'>+		if (IS_ERR(req)) {</div><div class='add'>+			ret = PTR_ERR(req);</div><div class='add'>+			ceph_release_page_vector(pages, num_pages);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='add'>+		doutc(cl, "write op %lld~%llu\n", write_pos, write_len);</div><div class='add'>+		osd_req_op_extent_osd_data_pages(req, rmw ? 1 : 0, pages, write_len,</div><div class='add'>+						 offset_in_page(write_pos), false,</div><div class='add'>+						 true);</div><div class='add'>+		req-&gt;r_inode = inode;</div><div class='ctx'> 		req-&gt;r_mtime = mtime;</div><div class='del'>-		ret = ceph_osdc_start_request(&amp;fsc-&gt;client-&gt;osdc, req, false);</div><div class='del'>-		if (!ret)</div><div class='del'>-			ret = ceph_osdc_wait_request(&amp;fsc-&gt;client-&gt;osdc, req);</div><div class='add'>+</div><div class='add'>+		/* Set up the assertion */</div><div class='add'>+		if (rmw) {</div><div class='add'>+			/*</div><div class='add'>+			 * Set up the assertion. If we don't have a version</div><div class='add'>+			 * number, then the object doesn't exist yet. Use an</div><div class='add'>+			 * exclusive create instead of a version assertion in</div><div class='add'>+			 * that case.</div><div class='add'>+			 */</div><div class='add'>+			if (assert_ver) {</div><div class='add'>+				osd_req_op_init(req, 0, CEPH_OSD_OP_ASSERT_VER, 0);</div><div class='add'>+				req-&gt;r_ops[0].assert_ver.ver = assert_ver;</div><div class='add'>+			} else {</div><div class='add'>+				osd_req_op_init(req, 0, CEPH_OSD_OP_CREATE,</div><div class='add'>+						CEPH_OSD_OP_FLAG_EXCL);</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		ceph_osdc_start_request(osdc, req);</div><div class='add'>+		ret = ceph_osdc_wait_request(osdc, req);</div><div class='ctx'> </div><div class='ctx'> 		ceph_update_write_metrics(&amp;fsc-&gt;mdsc-&gt;metric, req-&gt;r_start_latency,</div><div class='ctx'> 					  req-&gt;r_end_latency, len, ret);</div><div class='del'>-out:</div><div class='ctx'> 		ceph_osdc_put_request(req);</div><div class='ctx'> 		if (ret != 0) {</div><div class='add'>+			doutc(cl, "osd write returned %d\n", ret);</div><div class='add'>+			/* Version changed! Must re-do the rmw cycle */</div><div class='add'>+			if ((assert_ver &amp;&amp; (ret == -ERANGE || ret == -EOVERFLOW)) ||</div><div class='add'>+			    (!assert_ver &amp;&amp; ret == -EEXIST)) {</div><div class='add'>+				/* We should only ever see this on a rmw */</div><div class='add'>+				WARN_ON_ONCE(!rmw);</div><div class='add'>+</div><div class='add'>+				/* The version should never go backward */</div><div class='add'>+				WARN_ON_ONCE(ret == -EOVERFLOW);</div><div class='add'>+</div><div class='add'>+				*from = saved_iter;</div><div class='add'>+</div><div class='add'>+				/* FIXME: limit number of times we loop? */</div><div class='add'>+				continue;</div><div class='add'>+			}</div><div class='ctx'> 			ceph_set_error_write(ci);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		ceph_clear_error_write(ci);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * We successfully wrote to a range of the file. Declare</div><div class='add'>+		 * that region of the pagecache invalid.</div><div class='add'>+		 */</div><div class='add'>+		ret = invalidate_inode_pages2_range(</div><div class='add'>+				inode-&gt;i_mapping,</div><div class='add'>+				pos &gt;&gt; PAGE_SHIFT,</div><div class='add'>+				(pos + len - 1) &gt;&gt; PAGE_SHIFT);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			doutc(cl, "invalidate_inode_pages2_range returned %d\n",</div><div class='add'>+			      ret);</div><div class='add'>+			ret = 0;</div><div class='add'>+		}</div><div class='ctx'> 		pos += len;</div><div class='ctx'> 		written += len;</div><div class='add'>+		doutc(cl, "written %d\n", written);</div><div class='ctx'> 		if (pos &gt; i_size_read(inode)) {</div><div class='ctx'> 			check_caps = ceph_inode_set_size(inode, pos);</div><div class='ctx'> 			if (check_caps)</div><div class='ctx'> 				ceph_check_caps(ceph_inode(inode),</div><div class='del'>-						CHECK_CAPS_AUTHONLY,</div><div class='del'>-						NULL);</div><div class='add'>+						CHECK_CAPS_AUTHONLY);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 	}</div><div class='hunk'>@@ -1500,6 +2088,7 @@ out:</div><div class='ctx'> 		ret = written;</div><div class='ctx'> 		iocb-&gt;ki_pos = pos;</div><div class='ctx'> 	}</div><div class='add'>+	doutc(cl, "returning %d\n", ret);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1518,26 +2107,31 @@ static ssize_t ceph_read_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='ctx'> 	struct inode *inode = file_inode(filp);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	bool direct_lock = iocb-&gt;ki_flags &amp; IOCB_DIRECT;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	ssize_t ret;</div><div class='del'>-	int want, got = 0;</div><div class='add'>+	int want = 0, got = 0;</div><div class='ctx'> 	int retry_op = 0, read = 0;</div><div class='ctx'> </div><div class='ctx'> again:</div><div class='del'>-	dout("aio_read %p %llx.%llx %llu~%u trying to get caps on %p\n",</div><div class='del'>-	     inode, ceph_vinop(inode), iocb-&gt;ki_pos, (unsigned)len, inode);</div><div class='add'>+	doutc(cl, "%llu~%u trying to get caps on %p %llx.%llx\n",</div><div class='add'>+	      iocb-&gt;ki_pos, (unsigned)len, inode, ceph_vinop(inode));</div><div class='ctx'> </div><div class='del'>-	if (direct_lock)</div><div class='del'>-		ceph_start_io_direct(inode);</div><div class='del'>-	else</div><div class='del'>-		ceph_start_io_read(inode);</div><div class='add'>+	if (ceph_inode_is_shutdown(inode))</div><div class='add'>+		return -ESTALE;</div><div class='ctx'> </div><div class='add'>+	ret = direct_lock ? ceph_start_io_direct(inode) :</div><div class='add'>+			    ceph_start_io_read(inode);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	if (!(fi-&gt;flags &amp; CEPH_F_SYNC) &amp;&amp; !direct_lock)</div><div class='add'>+		want |= CEPH_CAP_FILE_CACHE;</div><div class='ctx'> 	if (fi-&gt;fmode &amp; CEPH_FILE_MODE_LAZY)</div><div class='del'>-		want = CEPH_CAP_FILE_CACHE | CEPH_CAP_FILE_LAZYIO;</div><div class='del'>-	else</div><div class='del'>-		want = CEPH_CAP_FILE_CACHE;</div><div class='add'>+		want |= CEPH_CAP_FILE_LAZYIO;</div><div class='add'>+</div><div class='ctx'> 	ret = ceph_get_caps(filp, CEPH_CAP_FILE_RD, want, -1, &amp;got);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='del'>-		if (iocb-&gt;ki_flags &amp; IOCB_DIRECT)</div><div class='add'>+		if (direct_lock)</div><div class='ctx'> 			ceph_end_io_direct(inode);</div><div class='ctx'> 		else</div><div class='ctx'> 			ceph_end_io_read(inode);</div><div class='hunk'>@@ -1548,12 +2142,14 @@ again:</div><div class='ctx'> 	    (iocb-&gt;ki_flags &amp; IOCB_DIRECT) ||</div><div class='ctx'> 	    (fi-&gt;flags &amp; CEPH_F_SYNC)) {</div><div class='ctx'> </div><div class='del'>-		dout("aio_sync_read %p %llx.%llx %llu~%u got cap refs on %s\n",</div><div class='del'>-		     inode, ceph_vinop(inode), iocb-&gt;ki_pos, (unsigned)len,</div><div class='del'>-		     ceph_cap_string(got));</div><div class='add'>+		doutc(cl, "sync %p %llx.%llx %llu~%u got cap refs on %s\n",</div><div class='add'>+		      inode, ceph_vinop(inode), iocb-&gt;ki_pos, (unsigned)len,</div><div class='add'>+		      ceph_cap_string(got));</div><div class='ctx'> </div><div class='del'>-		if (ci-&gt;i_inline_version == CEPH_INLINE_NONE) {</div><div class='del'>-			if (!retry_op &amp;&amp; (iocb-&gt;ki_flags &amp; IOCB_DIRECT)) {</div><div class='add'>+		if (!ceph_has_inline_data(ci)) {</div><div class='add'>+			if (!retry_op &amp;&amp;</div><div class='add'>+			    (iocb-&gt;ki_flags &amp; IOCB_DIRECT) &amp;&amp;</div><div class='add'>+			    !IS_ENCRYPTED(inode)) {</div><div class='ctx'> 				ret = ceph_direct_read_write(iocb, to,</div><div class='ctx'> 							     NULL, NULL);</div><div class='ctx'> 				if (ret &gt;= 0 &amp;&amp; ret &lt; len)</div><div class='hunk'>@@ -1566,16 +2162,16 @@ again:</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='ctx'> 		CEPH_DEFINE_RW_CONTEXT(rw_ctx, got);</div><div class='del'>-		dout("aio_read %p %llx.%llx %llu~%u got cap refs on %s\n",</div><div class='del'>-		     inode, ceph_vinop(inode), iocb-&gt;ki_pos, (unsigned)len,</div><div class='del'>-		     ceph_cap_string(got));</div><div class='add'>+		doutc(cl, "async %p %llx.%llx %llu~%u got cap refs on %s\n",</div><div class='add'>+		      inode, ceph_vinop(inode), iocb-&gt;ki_pos, (unsigned)len,</div><div class='add'>+		      ceph_cap_string(got));</div><div class='ctx'> 		ceph_add_rw_context(fi, &amp;rw_ctx);</div><div class='ctx'> 		ret = generic_file_read_iter(iocb, to);</div><div class='ctx'> 		ceph_del_rw_context(fi, &amp;rw_ctx);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("aio_read %p %llx.%llx dropping cap refs on %s = %d\n",</div><div class='del'>-	     inode, ceph_vinop(inode), ceph_cap_string(got), (int)ret);</div><div class='add'>+	doutc(cl, "%p %llx.%llx dropping cap refs on %s = %d\n",</div><div class='add'>+	      inode, ceph_vinop(inode), ceph_cap_string(got), (int)ret);</div><div class='ctx'> 	ceph_put_cap_refs(ci, got);</div><div class='ctx'> </div><div class='ctx'> 	if (direct_lock)</div><div class='hunk'>@@ -1587,14 +2183,16 @@ again:</div><div class='ctx'> 		int statret;</div><div class='ctx'> 		struct page *page = NULL;</div><div class='ctx'> 		loff_t i_size;</div><div class='add'>+		int mask = CEPH_STAT_CAP_SIZE;</div><div class='ctx'> 		if (retry_op == READ_INLINE) {</div><div class='ctx'> 			page = __page_cache_alloc(GFP_KERNEL);</div><div class='ctx'> 			if (!page)</div><div class='ctx'> 				return -ENOMEM;</div><div class='add'>+</div><div class='add'>+			mask = CEPH_STAT_CAP_INLINE_DATA;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		statret = __ceph_do_getattr(inode, page,</div><div class='del'>-					    CEPH_STAT_CAP_INLINE_DATA, !!page);</div><div class='add'>+		statret = __ceph_do_getattr(inode, page, mask, !!page);</div><div class='ctx'> 		if (statret &lt; 0) {</div><div class='ctx'> 			if (page)</div><div class='ctx'> 				__free_page(page);</div><div class='hunk'>@@ -1635,8 +2233,8 @@ again:</div><div class='ctx'> 		/* hit EOF or hole? */</div><div class='ctx'> 		if (retry_op == CHECK_EOF &amp;&amp; iocb-&gt;ki_pos &lt; i_size &amp;&amp;</div><div class='ctx'> 		    ret &lt; len) {</div><div class='del'>-			dout("sync_read hit hole, ppos %lld &lt; size %lld"</div><div class='del'>-			     ", reading more\n", iocb-&gt;ki_pos, i_size);</div><div class='add'>+			doutc(cl, "may hit hole, ppos %lld &lt; size %lld, reading more\n",</div><div class='add'>+			      iocb-&gt;ki_pos, i_size);</div><div class='ctx'> </div><div class='ctx'> 			read += ret;</div><div class='ctx'> 			len -= ret;</div><div class='hunk'>@@ -1652,6 +2250,71 @@ again:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * Wrap filemap_splice_read with checks for cap bits on the inode.</div><div class='add'>+ * Atomically grab references, so that those bits are not released</div><div class='add'>+ * back to the MDS mid-read.</div><div class='add'>+ */</div><div class='add'>+static ssize_t ceph_splice_read(struct file *in, loff_t *ppos,</div><div class='add'>+				struct pipe_inode_info *pipe,</div><div class='add'>+				size_t len, unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	struct ceph_file_info *fi = in-&gt;private_data;</div><div class='add'>+	struct inode *inode = file_inode(in);</div><div class='add'>+	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	ssize_t ret;</div><div class='add'>+	int want = 0, got = 0;</div><div class='add'>+	CEPH_DEFINE_RW_CONTEXT(rw_ctx, 0);</div><div class='add'>+</div><div class='add'>+	dout("splice_read %p %llx.%llx %llu~%zu trying to get caps on %p\n",</div><div class='add'>+	     inode, ceph_vinop(inode), *ppos, len, inode);</div><div class='add'>+</div><div class='add'>+	if (ceph_inode_is_shutdown(inode))</div><div class='add'>+		return -ESTALE;</div><div class='add'>+</div><div class='add'>+	if (ceph_has_inline_data(ci) ||</div><div class='add'>+	    (fi-&gt;flags &amp; CEPH_F_SYNC))</div><div class='add'>+		return copy_splice_read(in, ppos, pipe, len, flags);</div><div class='add'>+</div><div class='add'>+	ret = ceph_start_io_read(inode);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	want = CEPH_CAP_FILE_CACHE;</div><div class='add'>+	if (fi-&gt;fmode &amp; CEPH_FILE_MODE_LAZY)</div><div class='add'>+		want |= CEPH_CAP_FILE_LAZYIO;</div><div class='add'>+</div><div class='add'>+	ret = ceph_get_caps(in, CEPH_CAP_FILE_RD, want, -1, &amp;got);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out_end;</div><div class='add'>+</div><div class='add'>+	if ((got &amp; (CEPH_CAP_FILE_CACHE | CEPH_CAP_FILE_LAZYIO)) == 0) {</div><div class='add'>+		dout("splice_read/sync %p %llx.%llx %llu~%zu got cap refs on %s\n",</div><div class='add'>+		     inode, ceph_vinop(inode), *ppos, len,</div><div class='add'>+		     ceph_cap_string(got));</div><div class='add'>+</div><div class='add'>+		ceph_put_cap_refs(ci, got);</div><div class='add'>+		ceph_end_io_read(inode);</div><div class='add'>+		return copy_splice_read(in, ppos, pipe, len, flags);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	dout("splice_read %p %llx.%llx %llu~%zu got cap refs on %s\n",</div><div class='add'>+	     inode, ceph_vinop(inode), *ppos, len, ceph_cap_string(got));</div><div class='add'>+</div><div class='add'>+	rw_ctx.caps = got;</div><div class='add'>+	ceph_add_rw_context(fi, &amp;rw_ctx);</div><div class='add'>+	ret = filemap_splice_read(in, ppos, pipe, len, flags);</div><div class='add'>+	ceph_del_rw_context(fi, &amp;rw_ctx);</div><div class='add'>+</div><div class='add'>+	dout("splice_read %p %llx.%llx dropping cap refs on %s = %zd\n",</div><div class='add'>+	     inode, ceph_vinop(inode), ceph_cap_string(got), ret);</div><div class='add'>+</div><div class='add'>+	ceph_put_cap_refs(ci, got);</div><div class='add'>+out_end:</div><div class='add'>+	ceph_end_io_read(inode);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * Take cap references to avoid releasing caps to MDS mid-write.</div><div class='ctx'>  *</div><div class='ctx'>  * If we are synchronous, and write with an old snap context, the OSD</div><div class='hunk'>@@ -1667,17 +2330,21 @@ static ssize_t ceph_write_iter(struct kiocb *iocb, struct iov_iter *from)</div><div class='ctx'> 	struct ceph_file_info *fi = file-&gt;private_data;</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_inode_to_client(inode);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='ctx'> 	struct ceph_osd_client *osdc = &amp;fsc-&gt;client-&gt;osdc;</div><div class='ctx'> 	struct ceph_cap_flush *prealloc_cf;</div><div class='ctx'> 	ssize_t count, written = 0;</div><div class='del'>-	int err, want, got;</div><div class='add'>+	int err, want = 0, got;</div><div class='ctx'> 	bool direct_lock = false;</div><div class='ctx'> 	u32 map_flags;</div><div class='ctx'> 	u64 pool_flags;</div><div class='ctx'> 	loff_t pos;</div><div class='ctx'> 	loff_t limit = max(i_size_read(inode), fsc-&gt;max_file_size);</div><div class='ctx'> </div><div class='add'>+	if (ceph_inode_is_shutdown(inode))</div><div class='add'>+		return -ESTALE;</div><div class='add'>+</div><div class='ctx'> 	if (ceph_snap(inode) != CEPH_NOSNAP)</div><div class='ctx'> 		return -EROFS;</div><div class='ctx'> </div><div class='hunk'>@@ -1689,13 +2356,10 @@ static ssize_t ceph_write_iter(struct kiocb *iocb, struct iov_iter *from)</div><div class='ctx'> 		direct_lock = true;</div><div class='ctx'> </div><div class='ctx'> retry_snap:</div><div class='del'>-	if (direct_lock)</div><div class='del'>-		ceph_start_io_direct(inode);</div><div class='del'>-	else</div><div class='del'>-		ceph_start_io_write(inode);</div><div class='del'>-</div><div class='del'>-	/* We can write back this queue in page reclaim */</div><div class='del'>-	current-&gt;backing_dev_info = inode_to_bdi(inode);</div><div class='add'>+	err = direct_lock ? ceph_start_io_direct(inode) :</div><div class='add'>+			    ceph_start_io_write(inode);</div><div class='add'>+	if (err)</div><div class='add'>+		goto out_unlocked;</div><div class='ctx'> </div><div class='ctx'> 	if (iocb-&gt;ki_flags &amp; IOCB_APPEND) {</div><div class='ctx'> 		err = ceph_do_getattr(inode, CEPH_STAT_CAP_SIZE, false);</div><div class='hunk'>@@ -1735,18 +2399,13 @@ retry_snap:</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	if (ci-&gt;i_inline_version != CEPH_INLINE_NONE) {</div><div class='del'>-		err = ceph_uninline_data(file, NULL);</div><div class='del'>-		if (err &lt; 0)</div><div class='del'>-			goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	dout("aio_write %p %llx.%llx %llu~%zd getting caps. i_size %llu\n",</div><div class='del'>-	     inode, ceph_vinop(inode), pos, count, i_size_read(inode));</div><div class='add'>+	doutc(cl, "%p %llx.%llx %llu~%zd getting caps. i_size %llu\n",</div><div class='add'>+	      inode, ceph_vinop(inode), pos, count,</div><div class='add'>+	      i_size_read(inode));</div><div class='add'>+	if (!(fi-&gt;flags &amp; CEPH_F_SYNC) &amp;&amp; !direct_lock)</div><div class='add'>+		want |= CEPH_CAP_FILE_BUFFER;</div><div class='ctx'> 	if (fi-&gt;fmode &amp; CEPH_FILE_MODE_LAZY)</div><div class='del'>-		want = CEPH_CAP_FILE_BUFFER | CEPH_CAP_FILE_LAZYIO;</div><div class='del'>-	else</div><div class='del'>-		want = CEPH_CAP_FILE_BUFFER;</div><div class='add'>+		want |= CEPH_CAP_FILE_LAZYIO;</div><div class='ctx'> 	got = 0;</div><div class='ctx'> 	err = ceph_get_caps(file, CEPH_CAP_FILE_WR, want, pos + count, &amp;got);</div><div class='ctx'> 	if (err &lt; 0)</div><div class='hunk'>@@ -1758,8 +2417,8 @@ retry_snap:</div><div class='ctx'> </div><div class='ctx'> 	inode_inc_iversion_raw(inode);</div><div class='ctx'> </div><div class='del'>-	dout("aio_write %p %llx.%llx %llu~%zd got cap refs on %s\n",</div><div class='del'>-	     inode, ceph_vinop(inode), pos, count, ceph_cap_string(got));</div><div class='add'>+	doutc(cl, "%p %llx.%llx %llu~%zd got cap refs on %s\n",</div><div class='add'>+	      inode, ceph_vinop(inode), pos, count, ceph_cap_string(got));</div><div class='ctx'> </div><div class='ctx'> 	if ((got &amp; (CEPH_CAP_FILE_BUFFER|CEPH_CAP_FILE_LAZYIO)) == 0 ||</div><div class='ctx'> 	    (iocb-&gt;ki_flags &amp; IOCB_DIRECT) || (fi-&gt;flags &amp; CEPH_F_SYNC) ||</div><div class='hunk'>@@ -1782,7 +2441,7 @@ retry_snap:</div><div class='ctx'> </div><div class='ctx'> 		/* we might need to revert back to that point */</div><div class='ctx'> 		data = *from;</div><div class='del'>-		if (iocb-&gt;ki_flags &amp; IOCB_DIRECT)</div><div class='add'>+		if ((iocb-&gt;ki_flags &amp; IOCB_DIRECT) &amp;&amp; !IS_ENCRYPTED(inode))</div><div class='ctx'> 			written = ceph_direct_read_write(iocb, &amp;data, snapc,</div><div class='ctx'> 							 &amp;prealloc_cf);</div><div class='ctx'> 		else</div><div class='hunk'>@@ -1802,9 +2461,7 @@ retry_snap:</div><div class='ctx'> 		 * are pending vmtruncate. So write and vmtruncate</div><div class='ctx'> 		 * can not run at the same time</div><div class='ctx'> 		 */</div><div class='del'>-		written = generic_perform_write(file, from, pos);</div><div class='del'>-		if (likely(written &gt;= 0))</div><div class='del'>-			iocb-&gt;ki_pos = pos + written;</div><div class='add'>+		written = generic_perform_write(iocb, from);</div><div class='ctx'> 		ceph_end_io_write(inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1812,24 +2469,23 @@ retry_snap:</div><div class='ctx'> 		int dirty;</div><div class='ctx'> </div><div class='ctx'> 		spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-		ci-&gt;i_inline_version = CEPH_INLINE_NONE;</div><div class='ctx'> 		dirty = __ceph_mark_dirty_caps(ci, CEPH_CAP_FILE_WR,</div><div class='ctx'> 					       &amp;prealloc_cf);</div><div class='ctx'> 		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 		if (dirty)</div><div class='ctx'> 			__mark_inode_dirty(inode, dirty);</div><div class='ctx'> 		if (ceph_quota_is_max_bytes_approaching(inode, iocb-&gt;ki_pos))</div><div class='del'>-			ceph_check_caps(ci, 0, NULL);</div><div class='add'>+			ceph_check_caps(ci, CHECK_CAPS_FLUSH);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("aio_write %p %llx.%llx %llu~%u  dropping cap refs on %s\n",</div><div class='del'>-	     inode, ceph_vinop(inode), pos, (unsigned)count,</div><div class='del'>-	     ceph_cap_string(got));</div><div class='add'>+	doutc(cl, "%p %llx.%llx %llu~%u  dropping cap refs on %s\n",</div><div class='add'>+	      inode, ceph_vinop(inode), pos, (unsigned)count,</div><div class='add'>+	      ceph_cap_string(got));</div><div class='ctx'> 	ceph_put_cap_refs(ci, got);</div><div class='ctx'> </div><div class='ctx'> 	if (written == -EOLDSNAPC) {</div><div class='del'>-		dout("aio_write %p %llx.%llx %llu~%u" "got EOLDSNAPC, retrying\n",</div><div class='del'>-		     inode, ceph_vinop(inode), pos, (unsigned)count);</div><div class='add'>+		doutc(cl, "%p %llx.%llx %llu~%u" "got EOLDSNAPC, retrying\n",</div><div class='add'>+		      inode, ceph_vinop(inode), pos, (unsigned)count);</div><div class='ctx'> 		goto retry_snap;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1850,7 +2506,6 @@ out:</div><div class='ctx'> 		ceph_end_io_write(inode);</div><div class='ctx'> out_unlocked:</div><div class='ctx'> 	ceph_free_cap_flush(prealloc_cf);</div><div class='del'>-	current-&gt;backing_dev_info = NULL;</div><div class='ctx'> 	return written ? written : err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1859,72 +2514,30 @@ out_unlocked:</div><div class='ctx'>  */</div><div class='ctx'> static loff_t ceph_llseek(struct file *file, loff_t offset, int whence)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = file-&gt;f_mapping-&gt;host;</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_inode_to_client(inode);</div><div class='del'>-	loff_t i_size;</div><div class='del'>-	loff_t ret;</div><div class='del'>-</div><div class='del'>-	inode_lock(inode);</div><div class='del'>-</div><div class='ctx'> 	if (whence == SEEK_END || whence == SEEK_DATA || whence == SEEK_HOLE) {</div><div class='add'>+		struct inode *inode = file_inode(file);</div><div class='add'>+		int ret;</div><div class='add'>+</div><div class='ctx'> 		ret = ceph_do_getattr(inode, CEPH_STAT_CAP_SIZE, false);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	i_size = i_size_read(inode);</div><div class='del'>-	switch (whence) {</div><div class='del'>-	case SEEK_END:</div><div class='del'>-		offset += i_size;</div><div class='del'>-		break;</div><div class='del'>-	case SEEK_CUR:</div><div class='del'>-		/*</div><div class='del'>-		 * Here we special-case the lseek(fd, 0, SEEK_CUR)</div><div class='del'>-		 * position-querying operation.  Avoid rewriting the "same"</div><div class='del'>-		 * f_pos value back to the file because a concurrent read(),</div><div class='del'>-		 * write() or lseek() might have altered it</div><div class='del'>-		 */</div><div class='del'>-		if (offset == 0) {</div><div class='del'>-			ret = file-&gt;f_pos;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		offset += file-&gt;f_pos;</div><div class='del'>-		break;</div><div class='del'>-	case SEEK_DATA:</div><div class='del'>-		if (offset &lt; 0 || offset &gt;= i_size) {</div><div class='del'>-			ret = -ENXIO;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		break;</div><div class='del'>-	case SEEK_HOLE:</div><div class='del'>-		if (offset &lt; 0 || offset &gt;= i_size) {</div><div class='del'>-			ret = -ENXIO;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		offset = i_size;</div><div class='del'>-		break;</div><div class='add'>+			return ret;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	ret = vfs_setpos(file, offset, max(i_size, fsc-&gt;max_file_size));</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	inode_unlock(inode);</div><div class='del'>-	return ret;</div><div class='add'>+	return generic_file_llseek(file, offset, whence);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void ceph_zero_partial_page(</div><div class='del'>-	struct inode *inode, loff_t offset, unsigned size)</div><div class='add'>+static inline void ceph_zero_partial_page(struct inode *inode,</div><div class='add'>+		loff_t offset, size_t size)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='del'>-	pgoff_t index = offset &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> </div><div class='del'>-	page = find_lock_page(inode-&gt;i_mapping, index);</div><div class='del'>-	if (page) {</div><div class='del'>-		wait_on_page_writeback(page);</div><div class='del'>-		zero_user(page, offset &amp; (PAGE_SIZE - 1), size);</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		put_page(page);</div><div class='del'>-	}</div><div class='add'>+	folio = filemap_lock_folio(inode-&gt;i_mapping, offset &gt;&gt; PAGE_SHIFT);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	folio_wait_writeback(folio);</div><div class='add'>+	folio_zero_range(folio, offset_in_folio(folio, offset), size);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void ceph_zero_pagecache_range(struct inode *inode, loff_t offset,</div><div class='hunk'>@@ -1953,12 +2566,15 @@ static int ceph_zero_partial_object(struct inode *inode,</div><div class='ctx'> 				    loff_t offset, loff_t *length)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_inode_to_client(inode);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='ctx'> 	struct ceph_osd_request *req;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	loff_t zero = 0;</div><div class='ctx'> 	int op;</div><div class='ctx'> </div><div class='add'>+	if (ceph_inode_is_shutdown(inode))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='ctx'> 	if (!length) {</div><div class='ctx'> 		op = offset ? CEPH_OSD_OP_DELETE : CEPH_OSD_OP_TRUNCATE;</div><div class='ctx'> 		length = &amp;zero;</div><div class='hunk'>@@ -1977,13 +2593,11 @@ static int ceph_zero_partial_object(struct inode *inode,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	req-&gt;r_mtime = inode-&gt;i_mtime;</div><div class='del'>-	ret = ceph_osdc_start_request(&amp;fsc-&gt;client-&gt;osdc, req, false);</div><div class='del'>-	if (!ret) {</div><div class='del'>-		ret = ceph_osdc_wait_request(&amp;fsc-&gt;client-&gt;osdc, req);</div><div class='del'>-		if (ret == -ENOENT)</div><div class='del'>-			ret = 0;</div><div class='del'>-	}</div><div class='add'>+	req-&gt;r_mtime = inode_get_mtime(inode);</div><div class='add'>+	ceph_osdc_start_request(&amp;fsc-&gt;client-&gt;osdc, req);</div><div class='add'>+	ret = ceph_osdc_wait_request(&amp;fsc-&gt;client-&gt;osdc, req);</div><div class='add'>+	if (ret == -ENOENT)</div><div class='add'>+		ret = 0;</div><div class='ctx'> 	ceph_osdc_put_request(req);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='hunk'>@@ -1997,7 +2611,7 @@ static int ceph_zero_objects(struct inode *inode, loff_t offset, loff_t length)</div><div class='ctx'> 	s32 stripe_unit = ci-&gt;i_layout.stripe_unit;</div><div class='ctx'> 	s32 stripe_count = ci-&gt;i_layout.stripe_count;</div><div class='ctx'> 	s32 object_size = ci-&gt;i_layout.object_size;</div><div class='del'>-	u64 object_set_size = object_size * stripe_count;</div><div class='add'>+	u64 object_set_size = (u64) object_size * stripe_count;</div><div class='ctx'> 	u64 nearly, t;</div><div class='ctx'> </div><div class='ctx'> 	/* round offset up to next period boundary */</div><div class='hunk'>@@ -2043,18 +2657,25 @@ static long ceph_fallocate(struct file *file, int mode,</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	struct ceph_cap_flush *prealloc_cf;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	int want, got = 0;</div><div class='ctx'> 	int dirty;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	loff_t endoff = 0;</div><div class='ctx'> 	loff_t size;</div><div class='ctx'> </div><div class='add'>+	doutc(cl, "%p %llx.%llx mode %x, offset %llu length %llu\n",</div><div class='add'>+	      inode, ceph_vinop(inode), mode, offset, length);</div><div class='add'>+</div><div class='ctx'> 	if (mode != (FALLOC_FL_KEEP_SIZE | FALLOC_FL_PUNCH_HOLE))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='ctx'> 	if (!S_ISREG(inode-&gt;i_mode))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='add'>+	if (IS_ENCRYPTED(inode))</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+</div><div class='ctx'> 	prealloc_cf = ceph_alloc_cap_flush();</div><div class='ctx'> 	if (!prealloc_cf)</div><div class='ctx'> 		return -ENOMEM;</div><div class='hunk'>@@ -2066,12 +2687,6 @@ static long ceph_fallocate(struct file *file, int mode,</div><div class='ctx'> 		goto unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (ci-&gt;i_inline_version != CEPH_INLINE_NONE) {</div><div class='del'>-		ret = ceph_uninline_data(file, NULL);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			goto unlock;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	size = i_size_read(inode);</div><div class='ctx'> </div><div class='ctx'> 	/* Are we punching a hole beyond EOF? */</div><div class='hunk'>@@ -2089,13 +2704,17 @@ static long ceph_fallocate(struct file *file, int mode,</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto unlock;</div><div class='ctx'> </div><div class='add'>+	ret = file_modified(file);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto put_caps;</div><div class='add'>+</div><div class='ctx'> 	filemap_invalidate_lock(inode-&gt;i_mapping);</div><div class='add'>+	ceph_fscache_invalidate(inode, false);</div><div class='ctx'> 	ceph_zero_pagecache_range(inode, offset, length);</div><div class='ctx'> 	ret = ceph_zero_objects(inode, offset, length);</div><div class='ctx'> </div><div class='ctx'> 	if (!ret) {</div><div class='ctx'> 		spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-		ci-&gt;i_inline_version = CEPH_INLINE_NONE;</div><div class='ctx'> 		dirty = __ceph_mark_dirty_caps(ci, CEPH_CAP_FILE_WR,</div><div class='ctx'> 					       &amp;prealloc_cf);</div><div class='ctx'> 		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='hunk'>@@ -2104,6 +2723,7 @@ static long ceph_fallocate(struct file *file, int mode,</div><div class='ctx'> 	}</div><div class='ctx'> 	filemap_invalidate_unlock(inode-&gt;i_mapping);</div><div class='ctx'> </div><div class='add'>+put_caps:</div><div class='ctx'> 	ceph_put_cap_refs(ci, got);</div><div class='ctx'> unlock:</div><div class='ctx'> 	inode_unlock(inode);</div><div class='hunk'>@@ -2174,6 +2794,7 @@ static void put_rd_wr_caps(struct ceph_inode_info *src_ci, int src_got,</div><div class='ctx'> static int is_file_size_ok(struct inode *src_inode, struct inode *dst_inode,</div><div class='ctx'> 			   loff_t src_off, loff_t dst_off, size_t len)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(src_inode);</div><div class='ctx'> 	loff_t size, endoff;</div><div class='ctx'> </div><div class='ctx'> 	size = i_size_read(src_inode);</div><div class='hunk'>@@ -2184,8 +2805,8 @@ static int is_file_size_ok(struct inode *src_inode, struct inode *dst_inode,</div><div class='ctx'> 	 * inode.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (src_off + len &gt; size) {</div><div class='del'>-		dout("Copy beyond EOF (%llu + %zu &gt; %llu)\n",</div><div class='del'>-		     src_off, len, size);</div><div class='add'>+		doutc(cl, "Copy beyond EOF (%llu + %zu &gt; %llu)\n", src_off,</div><div class='add'>+		      len, size);</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> 	}</div><div class='ctx'> 	size = i_size_read(dst_inode);</div><div class='hunk'>@@ -2200,6 +2821,54 @@ static int is_file_size_ok(struct inode *src_inode, struct inode *dst_inode,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static struct ceph_osd_request *</div><div class='add'>+ceph_alloc_copyfrom_request(struct ceph_osd_client *osdc,</div><div class='add'>+			    u64 src_snapid,</div><div class='add'>+			    struct ceph_object_id *src_oid,</div><div class='add'>+			    struct ceph_object_locator *src_oloc,</div><div class='add'>+			    struct ceph_object_id *dst_oid,</div><div class='add'>+			    struct ceph_object_locator *dst_oloc,</div><div class='add'>+			    u32 truncate_seq, u64 truncate_size)</div><div class='add'>+{</div><div class='add'>+	struct ceph_osd_request *req;</div><div class='add'>+	int ret;</div><div class='add'>+	u32 src_fadvise_flags =</div><div class='add'>+		CEPH_OSD_OP_FLAG_FADVISE_SEQUENTIAL |</div><div class='add'>+		CEPH_OSD_OP_FLAG_FADVISE_NOCACHE;</div><div class='add'>+	u32 dst_fadvise_flags =</div><div class='add'>+		CEPH_OSD_OP_FLAG_FADVISE_SEQUENTIAL |</div><div class='add'>+		CEPH_OSD_OP_FLAG_FADVISE_DONTNEED;</div><div class='add'>+</div><div class='add'>+	req = ceph_osdc_alloc_request(osdc, NULL, 1, false, GFP_KERNEL);</div><div class='add'>+	if (!req)</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+</div><div class='add'>+	req-&gt;r_flags = CEPH_OSD_FLAG_WRITE;</div><div class='add'>+</div><div class='add'>+	ceph_oloc_copy(&amp;req-&gt;r_t.base_oloc, dst_oloc);</div><div class='add'>+	ceph_oid_copy(&amp;req-&gt;r_t.base_oid, dst_oid);</div><div class='add'>+</div><div class='add'>+	ret = osd_req_op_copy_from_init(req, src_snapid, 0,</div><div class='add'>+					src_oid, src_oloc,</div><div class='add'>+					src_fadvise_flags,</div><div class='add'>+					dst_fadvise_flags,</div><div class='add'>+					truncate_seq,</div><div class='add'>+					truncate_size,</div><div class='add'>+					CEPH_OSD_COPY_FROM_FLAG_TRUNCATE_SEQ);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	ret = ceph_osdc_alloc_messages(req, GFP_KERNEL);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	return req;</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	ceph_osdc_put_request(req);</div><div class='add'>+	return ERR_PTR(ret);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static ssize_t ceph_do_objects_copy(struct ceph_inode_info *src_ci, u64 *src_off,</div><div class='ctx'> 				    struct ceph_inode_info *dst_ci, u64 *dst_off,</div><div class='ctx'> 				    struct ceph_fs_client *fsc,</div><div class='hunk'>@@ -2207,16 +2876,20 @@ static ssize_t ceph_do_objects_copy(struct ceph_inode_info *src_ci, u64 *src_off</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_object_locator src_oloc, dst_oloc;</div><div class='ctx'> 	struct ceph_object_id src_oid, dst_oid;</div><div class='del'>-	size_t bytes = 0;</div><div class='add'>+	struct ceph_osd_client *osdc;</div><div class='add'>+	struct ceph_osd_request *req;</div><div class='add'>+	ssize_t bytes = 0;</div><div class='ctx'> 	u64 src_objnum, src_objoff, dst_objnum, dst_objoff;</div><div class='ctx'> 	u32 src_objlen, dst_objlen;</div><div class='ctx'> 	u32 object_size = src_ci-&gt;i_layout.object_size;</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	src_oloc.pool = src_ci-&gt;i_layout.pool_id;</div><div class='ctx'> 	src_oloc.pool_ns = ceph_try_get_string(src_ci-&gt;i_layout.pool_ns);</div><div class='ctx'> 	dst_oloc.pool = dst_ci-&gt;i_layout.pool_id;</div><div class='ctx'> 	dst_oloc.pool_ns = ceph_try_get_string(dst_ci-&gt;i_layout.pool_ns);</div><div class='add'>+	osdc = &amp;fsc-&gt;client-&gt;osdc;</div><div class='ctx'> </div><div class='ctx'> 	while (len &gt;= object_size) {</div><div class='ctx'> 		ceph_calc_file_object_mapping(&amp;src_ci-&gt;i_layout, *src_off,</div><div class='hunk'>@@ -2232,24 +2905,30 @@ static ssize_t ceph_do_objects_copy(struct ceph_inode_info *src_ci, u64 *src_off</div><div class='ctx'> 		ceph_oid_printf(&amp;dst_oid, "%llx.%08llx",</div><div class='ctx'> 				dst_ci-&gt;i_vino.ino, dst_objnum);</div><div class='ctx'> 		/* Do an object remote copy */</div><div class='del'>-		ret = ceph_osdc_copy_from(&amp;fsc-&gt;client-&gt;osdc,</div><div class='del'>-					  src_ci-&gt;i_vino.snap, 0,</div><div class='del'>-					  &amp;src_oid, &amp;src_oloc,</div><div class='del'>-					  CEPH_OSD_OP_FLAG_FADVISE_SEQUENTIAL |</div><div class='del'>-					  CEPH_OSD_OP_FLAG_FADVISE_NOCACHE,</div><div class='del'>-					  &amp;dst_oid, &amp;dst_oloc,</div><div class='del'>-					  CEPH_OSD_OP_FLAG_FADVISE_SEQUENTIAL |</div><div class='del'>-					  CEPH_OSD_OP_FLAG_FADVISE_DONTNEED,</div><div class='del'>-					  dst_ci-&gt;i_truncate_seq,</div><div class='del'>-					  dst_ci-&gt;i_truncate_size,</div><div class='del'>-					  CEPH_OSD_COPY_FROM_FLAG_TRUNCATE_SEQ);</div><div class='add'>+		req = ceph_alloc_copyfrom_request(osdc, src_ci-&gt;i_vino.snap,</div><div class='add'>+						  &amp;src_oid, &amp;src_oloc,</div><div class='add'>+						  &amp;dst_oid, &amp;dst_oloc,</div><div class='add'>+						  dst_ci-&gt;i_truncate_seq,</div><div class='add'>+						  dst_ci-&gt;i_truncate_size);</div><div class='add'>+		if (IS_ERR(req))</div><div class='add'>+			ret = PTR_ERR(req);</div><div class='add'>+		else {</div><div class='add'>+			ceph_osdc_start_request(osdc, req);</div><div class='add'>+			ret = ceph_osdc_wait_request(osdc, req);</div><div class='add'>+			ceph_update_copyfrom_metrics(&amp;fsc-&gt;mdsc-&gt;metric,</div><div class='add'>+						     req-&gt;r_start_latency,</div><div class='add'>+						     req-&gt;r_end_latency,</div><div class='add'>+						     object_size, ret);</div><div class='add'>+			ceph_osdc_put_request(req);</div><div class='add'>+		}</div><div class='ctx'> 		if (ret) {</div><div class='ctx'> 			if (ret == -EOPNOTSUPP) {</div><div class='ctx'> 				fsc-&gt;have_copy_from2 = false;</div><div class='del'>-				pr_notice("OSDs don't support copy-from2; disabling copy offload\n");</div><div class='add'>+				pr_notice_client(cl,</div><div class='add'>+					"OSDs don't support copy-from2; disabling copy offload\n");</div><div class='ctx'> 			}</div><div class='del'>-			dout("ceph_osdc_copy_from returned %d\n", ret);</div><div class='del'>-			if (!bytes)</div><div class='add'>+			doutc(cl, "returned %d\n", ret);</div><div class='add'>+			if (bytes &lt;= 0)</div><div class='ctx'> 				bytes = ret;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2274,7 +2953,8 @@ static ssize_t __ceph_copy_file_range(struct file *src_file, loff_t src_off,</div><div class='ctx'> 	struct ceph_inode_info *src_ci = ceph_inode(src_inode);</div><div class='ctx'> 	struct ceph_inode_info *dst_ci = ceph_inode(dst_inode);</div><div class='ctx'> 	struct ceph_cap_flush *prealloc_cf;</div><div class='del'>-	struct ceph_fs_client *src_fsc = ceph_inode_to_client(src_inode);</div><div class='add'>+	struct ceph_fs_client *src_fsc = ceph_inode_to_fs_client(src_inode);</div><div class='add'>+	struct ceph_client *cl = src_fsc-&gt;client;</div><div class='ctx'> 	loff_t size;</div><div class='ctx'> 	ssize_t ret = -EIO, bytes;</div><div class='ctx'> 	u64 src_objnum, dst_objnum, src_objoff, dst_objoff;</div><div class='hunk'>@@ -2282,7 +2962,7 @@ static ssize_t __ceph_copy_file_range(struct file *src_file, loff_t src_off,</div><div class='ctx'> 	int src_got = 0, dst_got = 0, err, dirty;</div><div class='ctx'> </div><div class='ctx'> 	if (src_inode-&gt;i_sb != dst_inode-&gt;i_sb) {</div><div class='del'>-		struct ceph_fs_client *dst_fsc = ceph_inode_to_client(dst_inode);</div><div class='add'>+		struct ceph_fs_client *dst_fsc = ceph_inode_to_fs_client(dst_inode);</div><div class='ctx'> </div><div class='ctx'> 		if (ceph_fsid_compare(&amp;src_fsc-&gt;client-&gt;fsid,</div><div class='ctx'> 				      &amp;dst_fsc-&gt;client-&gt;fsid)) {</div><div class='hunk'>@@ -2317,10 +2997,14 @@ static ssize_t __ceph_copy_file_range(struct file *src_file, loff_t src_off,</div><div class='ctx'> 	    (src_ci-&gt;i_layout.stripe_count != 1) ||</div><div class='ctx'> 	    (dst_ci-&gt;i_layout.stripe_count != 1) ||</div><div class='ctx'> 	    (src_ci-&gt;i_layout.object_size != dst_ci-&gt;i_layout.object_size)) {</div><div class='del'>-		dout("Invalid src/dst files layout\n");</div><div class='add'>+		doutc(cl, "Invalid src/dst files layout\n");</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/* Every encrypted inode gets its own key, so we can't offload them */</div><div class='add'>+	if (IS_ENCRYPTED(src_inode) || IS_ENCRYPTED(dst_inode))</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+</div><div class='ctx'> 	if (len &lt; src_ci-&gt;i_layout.object_size)</div><div class='ctx'> 		return -EOPNOTSUPP; /* no remote copy will be done */</div><div class='ctx'> </div><div class='hunk'>@@ -2331,12 +3015,12 @@ static ssize_t __ceph_copy_file_range(struct file *src_file, loff_t src_off,</div><div class='ctx'> 	/* Start by sync'ing the source and destination files */</div><div class='ctx'> 	ret = file_write_and_wait_range(src_file, src_off, (src_off + len));</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='del'>-		dout("failed to write src file (%zd)\n", ret);</div><div class='add'>+		doutc(cl, "failed to write src file (%zd)\n", ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	ret = file_write_and_wait_range(dst_file, dst_off, (dst_off + len));</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='del'>-		dout("failed to write dst file (%zd)\n", ret);</div><div class='add'>+		doutc(cl, "failed to write dst file (%zd)\n", ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -2348,7 +3032,7 @@ static ssize_t __ceph_copy_file_range(struct file *src_file, loff_t src_off,</div><div class='ctx'> 	err = get_rd_wr_caps(src_file, &amp;src_got,</div><div class='ctx'> 			     dst_file, (dst_off + len), &amp;dst_got);</div><div class='ctx'> 	if (err &lt; 0) {</div><div class='del'>-		dout("get_rd_wr_caps returned %d\n", err);</div><div class='add'>+		doutc(cl, "get_rd_wr_caps returned %d\n", err);</div><div class='ctx'> 		ret = -EOPNOTSUPP;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2358,11 +3042,13 @@ static ssize_t __ceph_copy_file_range(struct file *src_file, loff_t src_off,</div><div class='ctx'> 		goto out_caps;</div><div class='ctx'> </div><div class='ctx'> 	/* Drop dst file cached pages */</div><div class='add'>+	ceph_fscache_invalidate(dst_inode, false);</div><div class='ctx'> 	ret = invalidate_inode_pages2_range(dst_inode-&gt;i_mapping,</div><div class='ctx'> 					    dst_off &gt;&gt; PAGE_SHIFT,</div><div class='ctx'> 					    (dst_off + len) &gt;&gt; PAGE_SHIFT);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='del'>-		dout("Failed to invalidate inode pages (%zd)\n", ret);</div><div class='add'>+		doutc(cl, "Failed to invalidate inode pages (%zd)\n",</div><div class='add'>+			    ret);</div><div class='ctx'> 		ret = 0; /* XXX */</div><div class='ctx'> 	}</div><div class='ctx'> 	ceph_calc_file_object_mapping(&amp;src_ci-&gt;i_layout, src_off,</div><div class='hunk'>@@ -2383,18 +3069,18 @@ static ssize_t __ceph_copy_file_range(struct file *src_file, loff_t src_off,</div><div class='ctx'> 	 * starting at the src_off</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (src_objoff) {</div><div class='del'>-		dout("Initial partial copy of %u bytes\n", src_objlen);</div><div class='add'>+		doutc(cl, "Initial partial copy of %u bytes\n", src_objlen);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * we need to temporarily drop all caps as we'll be calling</div><div class='ctx'> 		 * {read,write}_iter, which will get caps again.</div><div class='ctx'> 		 */</div><div class='ctx'> 		put_rd_wr_caps(src_ci, src_got, dst_ci, dst_got);</div><div class='del'>-		ret = do_splice_direct(src_file, &amp;src_off, dst_file,</div><div class='del'>-				       &amp;dst_off, src_objlen, flags);</div><div class='add'>+		ret = splice_file_range(src_file, &amp;src_off, dst_file, &amp;dst_off,</div><div class='add'>+					src_objlen);</div><div class='ctx'> 		/* Abort on short copies or on error */</div><div class='del'>-		if (ret &lt; src_objlen) {</div><div class='del'>-			dout("Failed partial copy (%zd)\n", ret);</div><div class='add'>+		if (ret &lt; (long)src_objlen) {</div><div class='add'>+			doutc(cl, "Failed partial copy (%zd)\n", ret);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 		len -= ret;</div><div class='hunk'>@@ -2416,7 +3102,7 @@ static ssize_t __ceph_copy_file_range(struct file *src_file, loff_t src_off,</div><div class='ctx'> 			ret = bytes;</div><div class='ctx'> 		goto out_caps;</div><div class='ctx'> 	}</div><div class='del'>-	dout("Copied %zu bytes out of %zu\n", bytes, len);</div><div class='add'>+	doutc(cl, "Copied %zu bytes out of %zu\n", bytes, len);</div><div class='ctx'> 	len -= bytes;</div><div class='ctx'> 	ret += bytes;</div><div class='ctx'> </div><div class='hunk'>@@ -2427,11 +3113,10 @@ static ssize_t __ceph_copy_file_range(struct file *src_file, loff_t src_off,</div><div class='ctx'> 		/* Let the MDS know about dst file size change */</div><div class='ctx'> 		if (ceph_inode_set_size(dst_inode, dst_off) ||</div><div class='ctx'> 		    ceph_quota_is_max_bytes_approaching(dst_inode, dst_off))</div><div class='del'>-			ceph_check_caps(dst_ci, CHECK_CAPS_AUTHONLY, NULL);</div><div class='add'>+			ceph_check_caps(dst_ci, CHECK_CAPS_AUTHONLY | CHECK_CAPS_FLUSH);</div><div class='ctx'> 	}</div><div class='ctx'> 	/* Mark Fw dirty */</div><div class='ctx'> 	spin_lock(&amp;dst_ci-&gt;i_ceph_lock);</div><div class='del'>-	dst_ci-&gt;i_inline_version = CEPH_INLINE_NONE;</div><div class='ctx'> 	dirty = __ceph_mark_dirty_caps(dst_ci, CEPH_CAP_FILE_WR, &amp;prealloc_cf);</div><div class='ctx'> 	spin_unlock(&amp;dst_ci-&gt;i_ceph_lock);</div><div class='ctx'> 	if (dirty)</div><div class='hunk'>@@ -2445,13 +3130,13 @@ out_caps:</div><div class='ctx'> 	 * there were errors in remote object copies (len &gt;= object_size).</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (len &amp;&amp; (len &lt; src_ci-&gt;i_layout.object_size)) {</div><div class='del'>-		dout("Final partial copy of %zu bytes\n", len);</div><div class='del'>-		bytes = do_splice_direct(src_file, &amp;src_off, dst_file,</div><div class='del'>-					 &amp;dst_off, len, flags);</div><div class='add'>+		doutc(cl, "Final partial copy of %zu bytes\n", len);</div><div class='add'>+		bytes = splice_file_range(src_file, &amp;src_off, dst_file,</div><div class='add'>+					  &amp;dst_off, len);</div><div class='ctx'> 		if (bytes &gt; 0)</div><div class='ctx'> 			ret += bytes;</div><div class='ctx'> 		else</div><div class='del'>-			dout("Failed partial copy (%zd)\n", bytes);</div><div class='add'>+			doutc(cl, "Failed partial copy (%zd)\n", bytes);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='hunk'>@@ -2470,8 +3155,8 @@ static ssize_t ceph_copy_file_range(struct file *src_file, loff_t src_off,</div><div class='ctx'> 				     len, flags);</div><div class='ctx'> </div><div class='ctx'> 	if (ret == -EOPNOTSUPP || ret == -EXDEV)</div><div class='del'>-		ret = generic_copy_file_range(src_file, src_off, dst_file,</div><div class='del'>-					      dst_off, len, flags);</div><div class='add'>+		ret = splice_copy_file_range(src_file, src_off, dst_file,</div><div class='add'>+					     dst_off, len);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2481,12 +3166,12 @@ const struct file_operations ceph_file_fops = {</div><div class='ctx'> 	.llseek = ceph_llseek,</div><div class='ctx'> 	.read_iter = ceph_read_iter,</div><div class='ctx'> 	.write_iter = ceph_write_iter,</div><div class='del'>-	.mmap = ceph_mmap,</div><div class='add'>+	.mmap_prepare = ceph_mmap_prepare,</div><div class='ctx'> 	.fsync = ceph_fsync,</div><div class='ctx'> 	.lock = ceph_lock,</div><div class='ctx'> 	.setlease = simple_nosetlease,</div><div class='ctx'> 	.flock = ceph_flock,</div><div class='del'>-	.splice_read = generic_file_splice_read,</div><div class='add'>+	.splice_read = ceph_splice_read,</div><div class='ctx'> 	.splice_write = iter_file_splice_write,</div><div class='ctx'> 	.unlocked_ioctl = ceph_ioctl,</div><div class='ctx'> 	.compat_ioctl = compat_ptr_ioctl,</div><div class='head'>diff --git a/fs/ceph/inode.c b/fs/ceph/inode.c<br/>index 1c7574105478..2966f88310e3 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ceph/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/inode.c</a></div><div class='hunk'>@@ -14,10 +14,12 @@</div><div class='ctx'> #include &lt;linux/random.h&gt;</div><div class='ctx'> #include &lt;linux/sort.h&gt;</div><div class='ctx'> #include &lt;linux/iversion.h&gt;</div><div class='add'>+#include &lt;linux/fscrypt.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "super.h"</div><div class='ctx'> #include "mds_client.h"</div><div class='ctx'> #include "cache.h"</div><div class='add'>+#include "crypto.h"</div><div class='ctx'> #include &lt;linux/ceph/decode.h&gt;</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -33,6 +35,7 @@</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> static const struct inode_operations ceph_symlink_iops;</div><div class='add'>+static const struct inode_operations ceph_encrypted_symlink_iops;</div><div class='ctx'> </div><div class='ctx'> static void ceph_inode_work(struct work_struct *work);</div><div class='ctx'> </div><div class='hunk'>@@ -52,60 +55,213 @@ static int ceph_set_ino_cb(struct inode *inode, void *data)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct inode *ceph_get_inode(struct super_block *sb, struct ceph_vino vino)</div><div class='add'>+/*</div><div class='add'>+ * Check if the parent inode matches the vino from directory reply info</div><div class='add'>+ */</div><div class='add'>+static inline bool ceph_vino_matches_parent(struct inode *parent,</div><div class='add'>+					    struct ceph_vino vino)</div><div class='add'>+{</div><div class='add'>+	return ceph_ino(parent) == vino.ino &amp;&amp; ceph_snap(parent) == vino.snap;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Validate that the directory inode referenced by @req-&gt;r_parent matches the</div><div class='add'>+ * inode number and snapshot id contained in the reply's directory record.  If</div><div class='add'>+ * they do not match – which can theoretically happen if the parent dentry was</div><div class='add'>+ * moved between the time the request was issued and the reply arrived – fall</div><div class='add'>+ * back to looking up the correct inode in the inode cache.</div><div class='add'>+ *</div><div class='add'>+ * A reference is *always* returned.  Callers that receive a different inode</div><div class='add'>+ * than the original @parent are responsible for dropping the extra reference</div><div class='add'>+ * once the reply has been processed.</div><div class='add'>+ */</div><div class='add'>+static struct inode *ceph_get_reply_dir(struct super_block *sb,</div><div class='add'>+					struct inode *parent,</div><div class='add'>+					struct ceph_mds_reply_info_parsed *rinfo)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_vino vino;</div><div class='add'>+</div><div class='add'>+	if (unlikely(!rinfo-&gt;diri.in))</div><div class='add'>+		return parent; /* nothing to compare against */</div><div class='add'>+</div><div class='add'>+	/* If we didn't have a cached parent inode to begin with, just bail out. */</div><div class='add'>+	if (!parent)</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	vino.ino  = le64_to_cpu(rinfo-&gt;diri.in-&gt;ino);</div><div class='add'>+	vino.snap = le64_to_cpu(rinfo-&gt;diri.in-&gt;snapid);</div><div class='add'>+</div><div class='add'>+	if (likely(ceph_vino_matches_parent(parent, vino)))</div><div class='add'>+		return parent; /* matches – use the original reference */</div><div class='add'>+</div><div class='add'>+	/* Mismatch – this should be rare.  Emit a WARN and obtain the correct inode. */</div><div class='add'>+	WARN_ONCE(1, "ceph: reply dir mismatch (parent valid %llx.%llx reply %llx.%llx)\n",</div><div class='add'>+		  ceph_ino(parent), ceph_snap(parent), vino.ino, vino.snap);</div><div class='add'>+</div><div class='add'>+	return ceph_get_inode(sb, vino, NULL);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * ceph_new_inode - allocate a new inode in advance of an expected create</div><div class='add'>+ * @dir: parent directory for new inode</div><div class='add'>+ * @dentry: dentry that may eventually point to new inode</div><div class='add'>+ * @mode: mode of new inode</div><div class='add'>+ * @as_ctx: pointer to inherited security context</div><div class='add'>+ *</div><div class='add'>+ * Allocate a new inode in advance of an operation to create a new inode.</div><div class='add'>+ * This allocates the inode and sets up the acl_sec_ctx with appropriate</div><div class='add'>+ * info for the new inode.</div><div class='add'>+ *</div><div class='add'>+ * Returns a pointer to the new inode or an ERR_PTR.</div><div class='add'>+ */</div><div class='add'>+struct inode *ceph_new_inode(struct inode *dir, struct dentry *dentry,</div><div class='add'>+			     umode_t *mode, struct ceph_acl_sec_ctx *as_ctx)</div><div class='add'>+{</div><div class='add'>+	int err;</div><div class='add'>+	struct inode *inode;</div><div class='add'>+</div><div class='add'>+	inode = new_inode(dir-&gt;i_sb);</div><div class='add'>+	if (!inode)</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+</div><div class='add'>+	inode-&gt;i_blkbits = CEPH_FSCRYPT_BLOCK_SHIFT;</div><div class='add'>+</div><div class='add'>+	if (!S_ISLNK(*mode)) {</div><div class='add'>+		err = ceph_pre_init_acls(dir, mode, as_ctx);</div><div class='add'>+		if (err &lt; 0)</div><div class='add'>+			goto out_err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	inode_state_assign_raw(inode, 0);</div><div class='add'>+	inode-&gt;i_mode = *mode;</div><div class='add'>+</div><div class='add'>+	err = ceph_security_init_secctx(dentry, *mode, as_ctx);</div><div class='add'>+	if (err &lt; 0)</div><div class='add'>+		goto out_err;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We'll skip setting fscrypt context for snapshots, leaving that for</div><div class='add'>+	 * the handle_reply().</div><div class='add'>+	 */</div><div class='add'>+	if (ceph_snap(dir) != CEPH_SNAPDIR) {</div><div class='add'>+		err = ceph_fscrypt_prepare_context(dir, inode, as_ctx);</div><div class='add'>+		if (err)</div><div class='add'>+			goto out_err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return inode;</div><div class='add'>+out_err:</div><div class='add'>+	iput(inode);</div><div class='add'>+	return ERR_PTR(err);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void ceph_as_ctx_to_req(struct ceph_mds_request *req,</div><div class='add'>+			struct ceph_acl_sec_ctx *as_ctx)</div><div class='add'>+{</div><div class='add'>+	if (as_ctx-&gt;pagelist) {</div><div class='add'>+		req-&gt;r_pagelist = as_ctx-&gt;pagelist;</div><div class='add'>+		as_ctx-&gt;pagelist = NULL;</div><div class='add'>+	}</div><div class='add'>+	ceph_fscrypt_as_ctx_to_req(req, as_ctx);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * ceph_get_inode - find or create/hash a new inode</div><div class='add'>+ * @sb: superblock to search and allocate in</div><div class='add'>+ * @vino: vino to search for</div><div class='add'>+ * @newino: optional new inode to insert if one isn't found (may be NULL)</div><div class='add'>+ *</div><div class='add'>+ * Search for or insert a new inode into the hash for the given vino, and</div><div class='add'>+ * return a reference to it. If new is non-NULL, its reference is consumed.</div><div class='add'>+ */</div><div class='add'>+struct inode *ceph_get_inode(struct super_block *sb, struct ceph_vino vino,</div><div class='add'>+			     struct inode *newino)</div><div class='add'>+{</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_sb_to_mdsc(sb);</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> </div><div class='ctx'> 	if (ceph_vino_is_reserved(vino))</div><div class='ctx'> 		return ERR_PTR(-EREMOTEIO);</div><div class='ctx'> </div><div class='del'>-	inode = iget5_locked(sb, (unsigned long)vino.ino, ceph_ino_compare,</div><div class='del'>-			     ceph_set_ino_cb, &amp;vino);</div><div class='del'>-	if (!inode)</div><div class='add'>+	if (newino) {</div><div class='add'>+		inode = inode_insert5(newino, (unsigned long)vino.ino,</div><div class='add'>+				      ceph_ino_compare, ceph_set_ino_cb, &amp;vino);</div><div class='add'>+		if (inode != newino)</div><div class='add'>+			iput(newino);</div><div class='add'>+	} else {</div><div class='add'>+		inode = iget5_locked(sb, (unsigned long)vino.ino,</div><div class='add'>+				     ceph_ino_compare, ceph_set_ino_cb, &amp;vino);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!inode) {</div><div class='add'>+		doutc(cl, "no inode found for %llx.%llx\n", vino.ino, vino.snap);</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	dout("get_inode on %llu=%llx.%llx got %p new %d\n", ceph_present_inode(inode),</div><div class='del'>-	     ceph_vinop(inode), inode, !!(inode-&gt;i_state &amp; I_NEW));</div><div class='add'>+	doutc(cl, "on %llx=%llx.%llx got %p new %d\n",</div><div class='add'>+	      ceph_present_inode(inode), ceph_vinop(inode), inode,</div><div class='add'>+	      !!(inode_state_read_once(inode) &amp; I_NEW));</div><div class='ctx'> 	return inode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * get/constuct snapdir inode for a given directory</div><div class='add'>+ * get/construct snapdir inode for a given directory</div><div class='ctx'>  */</div><div class='ctx'> struct inode *ceph_get_snapdir(struct inode *parent)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(parent);</div><div class='ctx'> 	struct ceph_vino vino = {</div><div class='ctx'> 		.ino = ceph_ino(parent),</div><div class='ctx'> 		.snap = CEPH_SNAPDIR,</div><div class='ctx'> 	};</div><div class='del'>-	struct inode *inode = ceph_get_inode(parent-&gt;i_sb, vino);</div><div class='add'>+	struct inode *inode = ceph_get_inode(parent-&gt;i_sb, vino, NULL);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	int ret = -ENOTDIR;</div><div class='ctx'> </div><div class='ctx'> 	if (IS_ERR(inode))</div><div class='ctx'> 		return inode;</div><div class='ctx'> </div><div class='ctx'> 	if (!S_ISDIR(parent-&gt;i_mode)) {</div><div class='del'>-		pr_warn_once("bad snapdir parent type (mode=0%o)\n",</div><div class='del'>-			     parent-&gt;i_mode);</div><div class='del'>-		return ERR_PTR(-ENOTDIR);</div><div class='add'>+		pr_warn_once_client(cl, "bad snapdir parent type (mode=0%o)\n",</div><div class='add'>+				    parent-&gt;i_mode);</div><div class='add'>+		goto err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!(inode-&gt;i_state &amp; I_NEW) &amp;&amp; !S_ISDIR(inode-&gt;i_mode)) {</div><div class='del'>-		pr_warn_once("bad snapdir inode type (mode=0%o)\n",</div><div class='del'>-			     inode-&gt;i_mode);</div><div class='del'>-		return ERR_PTR(-ENOTDIR);</div><div class='add'>+	if (!(inode_state_read_once(inode) &amp; I_NEW) &amp;&amp; !S_ISDIR(inode-&gt;i_mode)) {</div><div class='add'>+		pr_warn_once_client(cl, "bad snapdir inode type (mode=0%o)\n",</div><div class='add'>+				    inode-&gt;i_mode);</div><div class='add'>+		goto err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_mode = parent-&gt;i_mode;</div><div class='ctx'> 	inode-&gt;i_uid = parent-&gt;i_uid;</div><div class='ctx'> 	inode-&gt;i_gid = parent-&gt;i_gid;</div><div class='del'>-	inode-&gt;i_mtime = parent-&gt;i_mtime;</div><div class='del'>-	inode-&gt;i_ctime = parent-&gt;i_ctime;</div><div class='del'>-	inode-&gt;i_atime = parent-&gt;i_atime;</div><div class='add'>+	inode_set_mtime_to_ts(inode, inode_get_mtime(parent));</div><div class='add'>+	inode_set_ctime_to_ts(inode, inode_get_ctime(parent));</div><div class='add'>+	inode_set_atime_to_ts(inode, inode_get_atime(parent));</div><div class='ctx'> 	ci-&gt;i_rbytes = 0;</div><div class='ctx'> 	ci-&gt;i_btime = ceph_inode(parent)-&gt;i_btime;</div><div class='ctx'> </div><div class='del'>-	if (inode-&gt;i_state &amp; I_NEW) {</div><div class='add'>+#ifdef CONFIG_FS_ENCRYPTION</div><div class='add'>+	/* if encrypted, just borrow fscrypt_auth from parent */</div><div class='add'>+	if (IS_ENCRYPTED(parent)) {</div><div class='add'>+		struct ceph_inode_info *pci = ceph_inode(parent);</div><div class='add'>+</div><div class='add'>+		ci-&gt;fscrypt_auth = kmemdup(pci-&gt;fscrypt_auth,</div><div class='add'>+					   pci-&gt;fscrypt_auth_len,</div><div class='add'>+					   GFP_KERNEL);</div><div class='add'>+		if (ci-&gt;fscrypt_auth) {</div><div class='add'>+			inode-&gt;i_flags |= S_ENCRYPTED;</div><div class='add'>+			ci-&gt;fscrypt_auth_len = pci-&gt;fscrypt_auth_len;</div><div class='add'>+		} else {</div><div class='add'>+			doutc(cl, "Failed to alloc snapdir fscrypt_auth\n");</div><div class='add'>+			ret = -ENOMEM;</div><div class='add'>+			goto err;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='add'>+	if (inode_state_read_once(inode) &amp; I_NEW) {</div><div class='ctx'> 		inode-&gt;i_op = &amp;ceph_snapdir_iops;</div><div class='ctx'> 		inode-&gt;i_fop = &amp;ceph_snapdir_fops;</div><div class='ctx'> 		ci-&gt;i_snap_caps = CEPH_CAP_PIN; /* so we can open */</div><div class='hunk'>@@ -113,6 +269,12 @@ struct inode *ceph_get_snapdir(struct inode *parent)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return inode;</div><div class='add'>+err:</div><div class='add'>+	if ((inode_state_read_once(inode) &amp; I_NEW))</div><div class='add'>+		discard_new_inode(inode);</div><div class='add'>+	else</div><div class='add'>+		iput(inode);</div><div class='add'>+	return ERR_PTR(ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct inode_operations ceph_file_iops = {</div><div class='hunk'>@@ -120,7 +282,7 @@ const struct inode_operations ceph_file_iops = {</div><div class='ctx'> 	.setattr = ceph_setattr,</div><div class='ctx'> 	.getattr = ceph_getattr,</div><div class='ctx'> 	.listxattr = ceph_listxattr,</div><div class='del'>-	.get_acl = ceph_get_acl,</div><div class='add'>+	.get_inode_acl = ceph_get_acl,</div><div class='ctx'> 	.set_acl = ceph_set_acl,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -139,6 +301,8 @@ const struct inode_operations ceph_file_iops = {</div><div class='ctx'> static struct ceph_inode_frag *__get_or_create_frag(struct ceph_inode_info *ci,</div><div class='ctx'> 						    u32 f)</div><div class='ctx'> {</div><div class='add'>+	struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct rb_node **p;</div><div class='ctx'> 	struct rb_node *parent = NULL;</div><div class='ctx'> 	struct ceph_inode_frag *frag;</div><div class='hunk'>@@ -169,8 +333,7 @@ static struct ceph_inode_frag *__get_or_create_frag(struct ceph_inode_info *ci,</div><div class='ctx'> 	rb_link_node(&amp;frag-&gt;node, parent, p);</div><div class='ctx'> 	rb_insert_color(&amp;frag-&gt;node, &amp;ci-&gt;i_fragtree);</div><div class='ctx'> </div><div class='del'>-	dout("get_or_create_frag added %llx.%llx frag %x\n",</div><div class='del'>-	     ceph_vinop(&amp;ci-&gt;vfs_inode), f);</div><div class='add'>+	doutc(cl, "added %p %llx.%llx frag %x\n", inode, ceph_vinop(inode), f);</div><div class='ctx'> 	return frag;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -203,6 +366,7 @@ struct ceph_inode_frag *__ceph_find_frag(struct ceph_inode_info *ci, u32 f)</div><div class='ctx'> static u32 __ceph_choose_frag(struct ceph_inode_info *ci, u32 v,</div><div class='ctx'> 			      struct ceph_inode_frag *pfrag, int *found)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(&amp;ci-&gt;netfs.inode);</div><div class='ctx'> 	u32 t = ceph_frag_make(0, 0);</div><div class='ctx'> 	struct ceph_inode_frag *frag;</div><div class='ctx'> 	unsigned nway, i;</div><div class='hunk'>@@ -226,8 +390,8 @@ static u32 __ceph_choose_frag(struct ceph_inode_info *ci, u32 v,</div><div class='ctx'> </div><div class='ctx'> 		/* choose child */</div><div class='ctx'> 		nway = 1 &lt;&lt; frag-&gt;split_by;</div><div class='del'>-		dout("choose_frag(%x) %x splits by %d (%d ways)\n", v, t,</div><div class='del'>-		     frag-&gt;split_by, nway);</div><div class='add'>+		doutc(cl, "frag(%x) %x splits by %d (%d ways)\n", v, t,</div><div class='add'>+		      frag-&gt;split_by, nway);</div><div class='ctx'> 		for (i = 0; i &lt; nway; i++) {</div><div class='ctx'> 			n = ceph_frag_make_child(t, frag-&gt;split_by, i);</div><div class='ctx'> 			if (ceph_frag_contains_value(n, v)) {</div><div class='hunk'>@@ -237,7 +401,7 @@ static u32 __ceph_choose_frag(struct ceph_inode_info *ci, u32 v,</div><div class='ctx'> 		}</div><div class='ctx'> 		BUG_ON(i == nway);</div><div class='ctx'> 	}</div><div class='del'>-	dout("choose_frag(%x) = %x\n", v, t);</div><div class='add'>+	doutc(cl, "frag(%x) = %x\n", v, t);</div><div class='ctx'> </div><div class='ctx'> 	return t;</div><div class='ctx'> }</div><div class='hunk'>@@ -261,6 +425,7 @@ static int ceph_fill_dirfrag(struct inode *inode,</div><div class='ctx'> 			     struct ceph_mds_reply_dirfrag *dirinfo)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_inode_frag *frag;</div><div class='ctx'> 	u32 id = le32_to_cpu(dirinfo-&gt;frag);</div><div class='ctx'> 	int mds = le32_to_cpu(dirinfo-&gt;auth);</div><div class='hunk'>@@ -285,14 +450,14 @@ static int ceph_fill_dirfrag(struct inode *inode,</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		if (frag-&gt;split_by == 0) {</div><div class='ctx'> 			/* tree leaf, remove */</div><div class='del'>-			dout("fill_dirfrag removed %llx.%llx frag %x"</div><div class='del'>-			     " (no ref)\n", ceph_vinop(inode), id);</div><div class='add'>+			doutc(cl, "removed %p %llx.%llx frag %x (no ref)\n",</div><div class='add'>+			      inode, ceph_vinop(inode), id);</div><div class='ctx'> 			rb_erase(&amp;frag-&gt;node, &amp;ci-&gt;i_fragtree);</div><div class='ctx'> 			kfree(frag);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			/* tree branch, keep and clear */</div><div class='del'>-			dout("fill_dirfrag cleared %llx.%llx frag %x"</div><div class='del'>-			     " referral\n", ceph_vinop(inode), id);</div><div class='add'>+			doutc(cl, "cleared %p %llx.%llx frag %x referral\n",</div><div class='add'>+			      inode, ceph_vinop(inode), id);</div><div class='ctx'> 			frag-&gt;mds = -1;</div><div class='ctx'> 			frag-&gt;ndist = 0;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -305,8 +470,9 @@ static int ceph_fill_dirfrag(struct inode *inode,</div><div class='ctx'> 	if (IS_ERR(frag)) {</div><div class='ctx'> 		/* this is not the end of the world; we can continue</div><div class='ctx'> 		   with bad/inaccurate delegation info */</div><div class='del'>-		pr_err("fill_dirfrag ENOMEM on mds ref %llx.%llx fg %x\n",</div><div class='del'>-		       ceph_vinop(inode), le32_to_cpu(dirinfo-&gt;frag));</div><div class='add'>+		pr_err_client(cl, "ENOMEM on mds ref %p %llx.%llx fg %x\n",</div><div class='add'>+			      inode, ceph_vinop(inode),</div><div class='add'>+			      le32_to_cpu(dirinfo-&gt;frag));</div><div class='ctx'> 		err = -ENOMEM;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -315,8 +481,8 @@ static int ceph_fill_dirfrag(struct inode *inode,</div><div class='ctx'> 	frag-&gt;ndist = min_t(u32, ndist, CEPH_MAX_DIRFRAG_REP);</div><div class='ctx'> 	for (i = 0; i &lt; frag-&gt;ndist; i++)</div><div class='ctx'> 		frag-&gt;dist[i] = le32_to_cpu(dirinfo-&gt;dist[i]);</div><div class='del'>-	dout("fill_dirfrag %llx.%llx frag %x ndist=%d\n",</div><div class='del'>-	     ceph_vinop(inode), frag-&gt;frag, frag-&gt;ndist);</div><div class='add'>+	doutc(cl, "%p %llx.%llx frag %x ndist=%d\n", inode,</div><div class='add'>+	      ceph_vinop(inode), frag-&gt;frag, frag-&gt;ndist);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	mutex_unlock(&amp;ci-&gt;i_fragtree_mutex);</div><div class='hunk'>@@ -344,6 +510,7 @@ static int ceph_fill_fragtree(struct inode *inode,</div><div class='ctx'> 			      struct ceph_frag_tree_head *fragtree,</div><div class='ctx'> 			      struct ceph_mds_reply_dirfrag *dirinfo)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	struct ceph_inode_frag *frag, *prev_frag = NULL;</div><div class='ctx'> 	struct rb_node *rb_node;</div><div class='hunk'>@@ -356,7 +523,7 @@ static int ceph_fill_fragtree(struct inode *inode,</div><div class='ctx'> 	if (nsplits != ci-&gt;i_fragtree_nsplits) {</div><div class='ctx'> 		update = true;</div><div class='ctx'> 	} else if (nsplits) {</div><div class='del'>-		i = prandom_u32() % nsplits;</div><div class='add'>+		i = get_random_u32_below(nsplits);</div><div class='ctx'> 		id = le32_to_cpu(fragtree-&gt;splits[i].frag);</div><div class='ctx'> 		if (!__ceph_find_frag(ci, id))</div><div class='ctx'> 			update = true;</div><div class='hunk'>@@ -379,15 +546,15 @@ static int ceph_fill_fragtree(struct inode *inode,</div><div class='ctx'> 		     frag_tree_split_cmp, NULL);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("fill_fragtree %llx.%llx\n", ceph_vinop(inode));</div><div class='add'>+	doutc(cl, "%p %llx.%llx\n", inode, ceph_vinop(inode));</div><div class='ctx'> 	rb_node = rb_first(&amp;ci-&gt;i_fragtree);</div><div class='ctx'> 	for (i = 0; i &lt; nsplits; i++) {</div><div class='ctx'> 		id = le32_to_cpu(fragtree-&gt;splits[i].frag);</div><div class='ctx'> 		split_by = le32_to_cpu(fragtree-&gt;splits[i].by);</div><div class='ctx'> 		if (split_by == 0 || ceph_frag_bits(id) + split_by &gt; 24) {</div><div class='del'>-			pr_err("fill_fragtree %llx.%llx invalid split %d/%u, "</div><div class='del'>-			       "frag %x split by %d\n", ceph_vinop(inode),</div><div class='del'>-			       i, nsplits, id, split_by);</div><div class='add'>+			pr_err_client(cl, "%p %llx.%llx invalid split %d/%u, "</div><div class='add'>+			       "frag %x split by %d\n", inode,</div><div class='add'>+			       ceph_vinop(inode), i, nsplits, id, split_by);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> 		frag = NULL;</div><div class='hunk'>@@ -419,7 +586,7 @@ static int ceph_fill_fragtree(struct inode *inode,</div><div class='ctx'> 		if (frag-&gt;split_by == 0)</div><div class='ctx'> 			ci-&gt;i_fragtree_nsplits++;</div><div class='ctx'> 		frag-&gt;split_by = split_by;</div><div class='del'>-		dout(" frag %x split by %d\n", frag-&gt;frag, frag-&gt;split_by);</div><div class='add'>+		doutc(cl, " frag %x split by %d\n", frag-&gt;frag, frag-&gt;split_by);</div><div class='ctx'> 		prev_frag = frag;</div><div class='ctx'> 	}</div><div class='ctx'> 	while (rb_node) {</div><div class='hunk'>@@ -444,14 +611,18 @@ out_unlock:</div><div class='ctx'>  */</div><div class='ctx'> struct inode *ceph_alloc_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_sb_to_fs_client(sb);</div><div class='ctx'> 	struct ceph_inode_info *ci;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	ci = kmem_cache_alloc(ceph_inode_cachep, GFP_NOFS);</div><div class='add'>+	ci = alloc_inode_sb(sb, ceph_inode_cachep, GFP_NOFS);</div><div class='ctx'> 	if (!ci)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='del'>-	dout("alloc_inode %p\n", &amp;ci-&gt;vfs_inode);</div><div class='add'>+	doutc(fsc-&gt;client, "%p\n", &amp;ci-&gt;netfs.inode);</div><div class='add'>+</div><div class='add'>+	/* Set parameters for the netfs library */</div><div class='add'>+	netfs_inode_init(&amp;ci-&gt;netfs, &amp;ceph_netfs_ops, false);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock_init(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> </div><div class='hunk'>@@ -508,6 +679,7 @@ struct inode *ceph_alloc_inode(struct super_block *sb)</div><div class='ctx'> 	ci-&gt;i_truncate_seq = 0;</div><div class='ctx'> 	ci-&gt;i_truncate_size = 0;</div><div class='ctx'> 	ci-&gt;i_truncate_pending = 0;</div><div class='add'>+	ci-&gt;i_truncate_pagecache_size = 0;</div><div class='ctx'> </div><div class='ctx'> 	ci-&gt;i_max_size = 0;</div><div class='ctx'> 	ci-&gt;i_reported_size = 0;</div><div class='hunk'>@@ -538,10 +710,12 @@ struct inode *ceph_alloc_inode(struct super_block *sb)</div><div class='ctx'> 	INIT_WORK(&amp;ci-&gt;i_work, ceph_inode_work);</div><div class='ctx'> 	ci-&gt;i_work_mask = 0;</div><div class='ctx'> 	memset(&amp;ci-&gt;i_btime, '\0', sizeof(ci-&gt;i_btime));</div><div class='del'>-</div><div class='del'>-	ceph_fscache_inode_init(ci);</div><div class='del'>-</div><div class='del'>-	return &amp;ci-&gt;vfs_inode;</div><div class='add'>+#ifdef CONFIG_FS_ENCRYPTION</div><div class='add'>+	ci-&gt;i_crypt_info = NULL;</div><div class='add'>+	ci-&gt;fscrypt_auth = NULL;</div><div class='add'>+	ci-&gt;fscrypt_auth_len = 0;</div><div class='add'>+#endif</div><div class='add'>+	return &amp;ci-&gt;netfs.inode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void ceph_free_inode(struct inode *inode)</div><div class='hunk'>@@ -549,6 +723,10 @@ void ceph_free_inode(struct inode *inode)</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> </div><div class='ctx'> 	kfree(ci-&gt;i_symlink);</div><div class='add'>+#ifdef CONFIG_FS_ENCRYPTION</div><div class='add'>+	kfree(ci-&gt;fscrypt_auth);</div><div class='add'>+#endif</div><div class='add'>+	fscrypt_free_inode(inode);</div><div class='ctx'> 	kmem_cache_free(ceph_inode_cachep, ci);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -556,21 +734,26 @@ void ceph_evict_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	struct ceph_mds_client *mdsc = ceph_sb_to_mdsc(inode-&gt;i_sb);</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_inode_frag *frag;</div><div class='ctx'> 	struct rb_node *n;</div><div class='ctx'> </div><div class='del'>-	dout("evict_inode %p ino %llx.%llx\n", inode, ceph_vinop(inode));</div><div class='add'>+	doutc(cl, "%p ino %llx.%llx\n", inode, ceph_vinop(inode));</div><div class='ctx'> </div><div class='ctx'> 	percpu_counter_dec(&amp;mdsc-&gt;metric.total_inodes);</div><div class='ctx'> </div><div class='add'>+	netfs_wait_for_outstanding_io(inode);</div><div class='ctx'> 	truncate_inode_pages_final(&amp;inode-&gt;i_data);</div><div class='add'>+	if (inode_state_read_once(inode) &amp; I_PINNING_NETFS_WB)</div><div class='add'>+		ceph_fscache_unuse_cookie(inode, true);</div><div class='ctx'> 	clear_inode(inode);</div><div class='ctx'> </div><div class='ctx'> 	ceph_fscache_unregister_inode_cookie(ci);</div><div class='add'>+	fscrypt_put_encryption_info(inode);</div><div class='ctx'> </div><div class='ctx'> 	__ceph_remove_caps(ci);</div><div class='ctx'> </div><div class='del'>-	if (__ceph_has_any_quota(ci))</div><div class='add'>+	if (__ceph_has_quota(ci, QUOTA_GET_ANY))</div><div class='ctx'> 		ceph_adjust_quota_realms_count(inode, false);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -579,8 +762,8 @@ void ceph_evict_inode(struct inode *inode)</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (ci-&gt;i_snap_realm) {</div><div class='ctx'> 		if (ceph_snap(inode) == CEPH_NOSNAP) {</div><div class='del'>-			dout(" dropping residual ref to snap realm %p\n",</div><div class='del'>-			     ci-&gt;i_snap_realm);</div><div class='add'>+			doutc(cl, " dropping residual ref to snap realm %p\n",</div><div class='add'>+			      ci-&gt;i_snap_realm);</div><div class='ctx'> 			ceph_change_snap_realm(inode, NULL);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			ceph_put_snapid_map(mdsc, ci-&gt;i_snapid_map);</div><div class='hunk'>@@ -621,29 +804,34 @@ static inline blkcnt_t calc_inode_blocks(u64 size)</div><div class='ctx'> int ceph_fill_file_size(struct inode *inode, int issued,</div><div class='ctx'> 			u32 truncate_seq, u64 truncate_size, u64 size)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	int queue_trunc = 0;</div><div class='ctx'> 	loff_t isize = i_size_read(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (ceph_seq_cmp(truncate_seq, ci-&gt;i_truncate_seq) &gt; 0 ||</div><div class='ctx'> 	    (truncate_seq == ci-&gt;i_truncate_seq &amp;&amp; size &gt; isize)) {</div><div class='del'>-		dout("size %lld -&gt; %llu\n", isize, size);</div><div class='add'>+		doutc(cl, "size %lld -&gt; %llu\n", isize, size);</div><div class='ctx'> 		if (size &gt; 0 &amp;&amp; S_ISDIR(inode-&gt;i_mode)) {</div><div class='del'>-			pr_err("fill_file_size non-zero size for directory\n");</div><div class='add'>+			pr_err_client(cl, "non-zero size for directory\n");</div><div class='ctx'> 			size = 0;</div><div class='ctx'> 		}</div><div class='ctx'> 		i_size_write(inode, size);</div><div class='ctx'> 		inode-&gt;i_blocks = calc_inode_blocks(size);</div><div class='add'>+		/*</div><div class='add'>+		 * If we're expanding, then we should be able to just update</div><div class='add'>+		 * the existing cookie.</div><div class='add'>+		 */</div><div class='add'>+		if (size &gt; isize)</div><div class='add'>+			ceph_fscache_update(inode);</div><div class='ctx'> 		ci-&gt;i_reported_size = size;</div><div class='ctx'> 		if (truncate_seq != ci-&gt;i_truncate_seq) {</div><div class='del'>-			dout("truncate_seq %u -&gt; %u\n",</div><div class='del'>-			     ci-&gt;i_truncate_seq, truncate_seq);</div><div class='add'>+			doutc(cl, "truncate_seq %u -&gt; %u\n",</div><div class='add'>+			      ci-&gt;i_truncate_seq, truncate_seq);</div><div class='ctx'> 			ci-&gt;i_truncate_seq = truncate_seq;</div><div class='ctx'> </div><div class='ctx'> 			/* the MDS should have revoked these caps */</div><div class='del'>-			WARN_ON_ONCE(issued &amp; (CEPH_CAP_FILE_EXCL |</div><div class='del'>-					       CEPH_CAP_FILE_RD |</div><div class='del'>-					       CEPH_CAP_FILE_WR |</div><div class='add'>+			WARN_ON_ONCE(issued &amp; (CEPH_CAP_FILE_RD |</div><div class='ctx'> 					       CEPH_CAP_FILE_LAZYIO));</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * If we hold relevant caps, or in the case where we're</div><div class='hunk'>@@ -660,16 +848,28 @@ int ceph_fill_file_size(struct inode *inode, int issued,</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	if (ceph_seq_cmp(truncate_seq, ci-&gt;i_truncate_seq) &gt;= 0 &amp;&amp;</div><div class='del'>-	    ci-&gt;i_truncate_size != truncate_size) {</div><div class='del'>-		dout("truncate_size %lld -&gt; %llu\n", ci-&gt;i_truncate_size,</div><div class='del'>-		     truncate_size);</div><div class='del'>-		ci-&gt;i_truncate_size = truncate_size;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	if (queue_trunc)</div><div class='del'>-		ceph_fscache_invalidate(inode);</div><div class='add'>+	/*</div><div class='add'>+	 * It's possible that the new sizes of the two consecutive</div><div class='add'>+	 * size truncations will be in the same fscrypt last block,</div><div class='add'>+	 * and we need to truncate the corresponding page caches</div><div class='add'>+	 * anyway.</div><div class='add'>+	 */</div><div class='add'>+	if (ceph_seq_cmp(truncate_seq, ci-&gt;i_truncate_seq) &gt;= 0) {</div><div class='add'>+		doutc(cl, "truncate_size %lld -&gt; %llu, encrypted %d\n",</div><div class='add'>+		      ci-&gt;i_truncate_size, truncate_size,</div><div class='add'>+		      !!IS_ENCRYPTED(inode));</div><div class='add'>+</div><div class='add'>+		ci-&gt;i_truncate_size = truncate_size;</div><div class='ctx'> </div><div class='add'>+		if (IS_ENCRYPTED(inode)) {</div><div class='add'>+			doutc(cl, "truncate_pagecache_size %lld -&gt; %llu\n",</div><div class='add'>+			      ci-&gt;i_truncate_pagecache_size, size);</div><div class='add'>+			ci-&gt;i_truncate_pagecache_size = size;</div><div class='add'>+		} else {</div><div class='add'>+			ci-&gt;i_truncate_pagecache_size = truncate_size;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> 	return queue_trunc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -677,7 +877,11 @@ void ceph_fill_file_time(struct inode *inode, int issued,</div><div class='ctx'> 			 u64 time_warp_seq, struct timespec64 *ctime,</div><div class='ctx'> 			 struct timespec64 *mtime, struct timespec64 *atime)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	struct timespec64 iatime = inode_get_atime(inode);</div><div class='add'>+	struct timespec64 ictime = inode_get_ctime(inode);</div><div class='add'>+	struct timespec64 imtime = inode_get_mtime(inode);</div><div class='ctx'> 	int warn = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (issued &amp; (CEPH_CAP_FILE_EXCL|</div><div class='hunk'>@@ -686,39 +890,28 @@ void ceph_fill_file_time(struct inode *inode, int issued,</div><div class='ctx'> 		      CEPH_CAP_AUTH_EXCL|</div><div class='ctx'> 		      CEPH_CAP_XATTR_EXCL)) {</div><div class='ctx'> 		if (ci-&gt;i_version == 0 ||</div><div class='del'>-		    timespec64_compare(ctime, &amp;inode-&gt;i_ctime) &gt; 0) {</div><div class='del'>-			dout("ctime %lld.%09ld -&gt; %lld.%09ld inc w/ cap\n",</div><div class='del'>-			     inode-&gt;i_ctime.tv_sec, inode-&gt;i_ctime.tv_nsec,</div><div class='del'>-			     ctime-&gt;tv_sec, ctime-&gt;tv_nsec);</div><div class='del'>-			inode-&gt;i_ctime = *ctime;</div><div class='add'>+		    timespec64_compare(ctime, &amp;ictime) &gt; 0) {</div><div class='add'>+			doutc(cl, "ctime %ptSp -&gt; %ptSp inc w/ cap\n", &amp;ictime, ctime);</div><div class='add'>+			inode_set_ctime_to_ts(inode, *ctime);</div><div class='ctx'> 		}</div><div class='ctx'> 		if (ci-&gt;i_version == 0 ||</div><div class='ctx'> 		    ceph_seq_cmp(time_warp_seq, ci-&gt;i_time_warp_seq) &gt; 0) {</div><div class='ctx'> 			/* the MDS did a utimes() */</div><div class='del'>-			dout("mtime %lld.%09ld -&gt; %lld.%09ld "</div><div class='del'>-			     "tw %d -&gt; %d\n",</div><div class='del'>-			     inode-&gt;i_mtime.tv_sec, inode-&gt;i_mtime.tv_nsec,</div><div class='del'>-			     mtime-&gt;tv_sec, mtime-&gt;tv_nsec,</div><div class='del'>-			     ci-&gt;i_time_warp_seq, (int)time_warp_seq);</div><div class='del'>-</div><div class='del'>-			inode-&gt;i_mtime = *mtime;</div><div class='del'>-			inode-&gt;i_atime = *atime;</div><div class='add'>+			doutc(cl, "mtime %ptSp -&gt; %ptSp tw %d -&gt; %d\n", &amp;imtime, mtime,</div><div class='add'>+			      ci-&gt;i_time_warp_seq, (int)time_warp_seq);</div><div class='add'>+</div><div class='add'>+			inode_set_mtime_to_ts(inode, *mtime);</div><div class='add'>+			inode_set_atime_to_ts(inode, *atime);</div><div class='ctx'> 			ci-&gt;i_time_warp_seq = time_warp_seq;</div><div class='ctx'> 		} else if (time_warp_seq == ci-&gt;i_time_warp_seq) {</div><div class='ctx'> 			/* nobody did utimes(); take the max */</div><div class='del'>-			if (timespec64_compare(mtime, &amp;inode-&gt;i_mtime) &gt; 0) {</div><div class='del'>-				dout("mtime %lld.%09ld -&gt; %lld.%09ld inc\n",</div><div class='del'>-				     inode-&gt;i_mtime.tv_sec,</div><div class='del'>-				     inode-&gt;i_mtime.tv_nsec,</div><div class='del'>-				     mtime-&gt;tv_sec, mtime-&gt;tv_nsec);</div><div class='del'>-				inode-&gt;i_mtime = *mtime;</div><div class='add'>+			if (timespec64_compare(mtime, &amp;imtime) &gt; 0) {</div><div class='add'>+				doutc(cl, "mtime %ptSp -&gt; %ptSp inc\n", &amp;imtime, mtime);</div><div class='add'>+				inode_set_mtime_to_ts(inode, *mtime);</div><div class='ctx'> 			}</div><div class='del'>-			if (timespec64_compare(atime, &amp;inode-&gt;i_atime) &gt; 0) {</div><div class='del'>-				dout("atime %lld.%09ld -&gt; %lld.%09ld inc\n",</div><div class='del'>-				     inode-&gt;i_atime.tv_sec,</div><div class='del'>-				     inode-&gt;i_atime.tv_nsec,</div><div class='del'>-				     atime-&gt;tv_sec, atime-&gt;tv_nsec);</div><div class='del'>-				inode-&gt;i_atime = *atime;</div><div class='add'>+			if (timespec64_compare(atime, &amp;iatime) &gt; 0) {</div><div class='add'>+				doutc(cl, "atime %ptSp -&gt; %ptSp inc\n", &amp;iatime, atime);</div><div class='add'>+				inode_set_atime_to_ts(inode, *atime);</div><div class='ctx'> 			}</div><div class='ctx'> 		} else if (issued &amp; CEPH_CAP_FILE_EXCL) {</div><div class='ctx'> 			/* we did a utimes(); ignore mds values */</div><div class='hunk'>@@ -728,19 +921,53 @@ void ceph_fill_file_time(struct inode *inode, int issued,</div><div class='ctx'> 	} else {</div><div class='ctx'> 		/* we have no write|excl caps; whatever the MDS says is true */</div><div class='ctx'> 		if (ceph_seq_cmp(time_warp_seq, ci-&gt;i_time_warp_seq) &gt;= 0) {</div><div class='del'>-			inode-&gt;i_ctime = *ctime;</div><div class='del'>-			inode-&gt;i_mtime = *mtime;</div><div class='del'>-			inode-&gt;i_atime = *atime;</div><div class='add'>+			inode_set_ctime_to_ts(inode, *ctime);</div><div class='add'>+			inode_set_mtime_to_ts(inode, *mtime);</div><div class='add'>+			inode_set_atime_to_ts(inode, *atime);</div><div class='ctx'> 			ci-&gt;i_time_warp_seq = time_warp_seq;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			warn = 1;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	if (warn) /* time_warp_seq shouldn't go backwards */</div><div class='del'>-		dout("%p mds time_warp_seq %llu &lt; %u\n",</div><div class='del'>-		     inode, time_warp_seq, ci-&gt;i_time_warp_seq);</div><div class='add'>+		doutc(cl, "%p mds time_warp_seq %llu &lt; %u\n", inode,</div><div class='add'>+		      time_warp_seq, ci-&gt;i_time_warp_seq);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#if IS_ENABLED(CONFIG_FS_ENCRYPTION)</div><div class='add'>+static int decode_encrypted_symlink(struct ceph_mds_client *mdsc,</div><div class='add'>+				    const char *encsym,</div><div class='add'>+				    int enclen, u8 **decsym)</div><div class='add'>+{</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='add'>+	int declen;</div><div class='add'>+	u8 *sym;</div><div class='add'>+</div><div class='add'>+	sym = kmalloc(enclen + 1, GFP_NOFS);</div><div class='add'>+	if (!sym)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	declen = base64_decode(encsym, enclen, sym, false, BASE64_IMAP);</div><div class='add'>+	if (declen &lt; 0) {</div><div class='add'>+		pr_err_client(cl,</div><div class='add'>+			"can't decode symlink (%d). Content: %.*s\n",</div><div class='add'>+			declen, enclen, encsym);</div><div class='add'>+		kfree(sym);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+	sym[declen + 1] = '\0';</div><div class='add'>+	*decsym = sym;</div><div class='add'>+	return declen;</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+static int decode_encrypted_symlink(struct ceph_mds_client *mdsc,</div><div class='add'>+				    const char *encsym,</div><div class='add'>+				    int symlen, u8 **decsym)</div><div class='add'>+{</div><div class='add'>+	return -EOPNOTSUPP;</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Populate an inode based on info from mds.  May be called on new or</div><div class='ctx'>  * existing inodes.</div><div class='hunk'>@@ -752,6 +979,7 @@ int ceph_fill_inode(struct inode *inode, struct page *locked_page,</div><div class='ctx'> 		    struct ceph_cap_reservation *caps_reservation)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_mds_client *mdsc = ceph_sb_to_mdsc(inode-&gt;i_sb);</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_mds_reply_inode *info = iinfo-&gt;in;</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	int issued, new_issued, info_caps;</div><div class='hunk'>@@ -770,25 +998,26 @@ int ceph_fill_inode(struct inode *inode, struct page *locked_page,</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;mdsc-&gt;snap_rwsem);</div><div class='ctx'> </div><div class='del'>-	dout("%s %p ino %llx.%llx v %llu had %llu\n", __func__,</div><div class='del'>-	     inode, ceph_vinop(inode), le64_to_cpu(info-&gt;version),</div><div class='del'>-	     ci-&gt;i_version);</div><div class='add'>+	doutc(cl, "%p ino %llx.%llx v %llu had %llu\n", inode, ceph_vinop(inode),</div><div class='add'>+	      le64_to_cpu(info-&gt;version), ci-&gt;i_version);</div><div class='ctx'> </div><div class='ctx'> 	/* Once I_NEW is cleared, we can't change type or dev numbers */</div><div class='del'>-	if (inode-&gt;i_state &amp; I_NEW) {</div><div class='add'>+	if (inode_state_read_once(inode) &amp; I_NEW) {</div><div class='ctx'> 		inode-&gt;i_mode = mode;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		if (inode_wrong_type(inode, mode)) {</div><div class='del'>-			pr_warn_once("inode type changed! (ino %llx.%llx is 0%o, mds says 0%o)\n",</div><div class='del'>-				     ceph_vinop(inode), inode-&gt;i_mode, mode);</div><div class='add'>+			pr_warn_once_client(cl,</div><div class='add'>+				"inode type changed! (ino %llx.%llx is 0%o, mds says 0%o)\n",</div><div class='add'>+				ceph_vinop(inode), inode-&gt;i_mode, mode);</div><div class='ctx'> 			return -ESTALE;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if ((S_ISCHR(mode) || S_ISBLK(mode)) &amp;&amp; inode-&gt;i_rdev != rdev) {</div><div class='del'>-			pr_warn_once("dev inode rdev changed! (ino %llx.%llx is %u:%u, mds says %u:%u)\n",</div><div class='del'>-				     ceph_vinop(inode), MAJOR(inode-&gt;i_rdev),</div><div class='del'>-				     MINOR(inode-&gt;i_rdev), MAJOR(rdev),</div><div class='del'>-				     MINOR(rdev));</div><div class='add'>+			pr_warn_once_client(cl,</div><div class='add'>+				"dev inode rdev changed! (ino %llx.%llx is %u:%u, mds says %u:%u)\n",</div><div class='add'>+				ceph_vinop(inode), MAJOR(inode-&gt;i_rdev),</div><div class='add'>+				MINOR(inode-&gt;i_rdev), MAJOR(rdev),</div><div class='add'>+				MINOR(rdev));</div><div class='ctx'> 			return -ESTALE;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -810,8 +1039,8 @@ int ceph_fill_inode(struct inode *inode, struct page *locked_page,</div><div class='ctx'> 	if (iinfo-&gt;xattr_len &gt; 4) {</div><div class='ctx'> 		xattr_blob = ceph_buffer_new(iinfo-&gt;xattr_len, GFP_NOFS);</div><div class='ctx'> 		if (!xattr_blob)</div><div class='del'>-			pr_err("%s ENOMEM xattr blob %d bytes\n", __func__,</div><div class='del'>-			       iinfo-&gt;xattr_len);</div><div class='add'>+			pr_err_client(cl, "ENOMEM xattr blob %d bytes\n",</div><div class='add'>+				      iinfo-&gt;xattr_len);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (iinfo-&gt;pool_ns_len &gt; 0)</div><div class='hunk'>@@ -846,27 +1075,42 @@ int ceph_fill_inode(struct inode *inode, struct page *locked_page,</div><div class='ctx'> 	issued |= __ceph_caps_dirty(ci);</div><div class='ctx'> 	new_issued = ~issued &amp; info_caps;</div><div class='ctx'> </div><div class='del'>-	/* directories have fl_stripe_unit set to zero */</div><div class='del'>-	if (le32_to_cpu(info-&gt;layout.fl_stripe_unit))</div><div class='del'>-		inode-&gt;i_blkbits =</div><div class='del'>-			fls(le32_to_cpu(info-&gt;layout.fl_stripe_unit)) - 1;</div><div class='del'>-	else</div><div class='del'>-		inode-&gt;i_blkbits = CEPH_BLOCK_SHIFT;</div><div class='del'>-</div><div class='ctx'> 	__ceph_update_quota(ci, iinfo-&gt;max_bytes, iinfo-&gt;max_files);</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_FS_ENCRYPTION</div><div class='add'>+	if (iinfo-&gt;fscrypt_auth_len &amp;&amp;</div><div class='add'>+	    ((inode_state_read_once(inode) &amp; I_NEW) || (ci-&gt;fscrypt_auth_len == 0))) {</div><div class='add'>+		kfree(ci-&gt;fscrypt_auth);</div><div class='add'>+		ci-&gt;fscrypt_auth_len = iinfo-&gt;fscrypt_auth_len;</div><div class='add'>+		ci-&gt;fscrypt_auth = iinfo-&gt;fscrypt_auth;</div><div class='add'>+		iinfo-&gt;fscrypt_auth = NULL;</div><div class='add'>+		iinfo-&gt;fscrypt_auth_len = 0;</div><div class='add'>+		inode_set_flags(inode, S_ENCRYPTED, S_ENCRYPTED);</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> 	if ((new_version || (new_issued &amp; CEPH_CAP_AUTH_SHARED)) &amp;&amp;</div><div class='ctx'> 	    (issued &amp; CEPH_CAP_AUTH_EXCL) == 0) {</div><div class='ctx'> 		inode-&gt;i_mode = mode;</div><div class='ctx'> 		inode-&gt;i_uid = make_kuid(&amp;init_user_ns, le32_to_cpu(info-&gt;uid));</div><div class='ctx'> 		inode-&gt;i_gid = make_kgid(&amp;init_user_ns, le32_to_cpu(info-&gt;gid));</div><div class='del'>-		dout("%p mode 0%o uid.gid %d.%d\n", inode, inode-&gt;i_mode,</div><div class='del'>-		     from_kuid(&amp;init_user_ns, inode-&gt;i_uid),</div><div class='del'>-		     from_kgid(&amp;init_user_ns, inode-&gt;i_gid));</div><div class='add'>+		doutc(cl, "%p %llx.%llx mode 0%o uid.gid %d.%d\n", inode,</div><div class='add'>+		      ceph_vinop(inode), inode-&gt;i_mode,</div><div class='add'>+		      from_kuid(&amp;init_user_ns, inode-&gt;i_uid),</div><div class='add'>+		      from_kgid(&amp;init_user_ns, inode-&gt;i_gid));</div><div class='ctx'> 		ceph_decode_timespec64(&amp;ci-&gt;i_btime, &amp;iinfo-&gt;btime);</div><div class='ctx'> 		ceph_decode_timespec64(&amp;ci-&gt;i_snap_btime, &amp;iinfo-&gt;snap_btime);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/* directories have fl_stripe_unit set to zero */</div><div class='add'>+	if (IS_ENCRYPTED(inode))</div><div class='add'>+		inode-&gt;i_blkbits = CEPH_FSCRYPT_BLOCK_SHIFT;</div><div class='add'>+	else if (le32_to_cpu(info-&gt;layout.fl_stripe_unit))</div><div class='add'>+		inode-&gt;i_blkbits =</div><div class='add'>+			fls(le32_to_cpu(info-&gt;layout.fl_stripe_unit)) - 1;</div><div class='add'>+	else</div><div class='add'>+		inode-&gt;i_blkbits = CEPH_BLOCK_SHIFT;</div><div class='add'>+</div><div class='ctx'> 	if ((new_version || (new_issued &amp; CEPH_CAP_LINK_SHARED)) &amp;&amp;</div><div class='ctx'> 	    (issued &amp; CEPH_CAP_LINK_EXCL) == 0)</div><div class='ctx'> 		set_nlink(inode, le32_to_cpu(info-&gt;nlink));</div><div class='hunk'>@@ -888,6 +1132,7 @@ int ceph_fill_inode(struct inode *inode, struct page *locked_page,</div><div class='ctx'> </div><div class='ctx'> 	if (new_version ||</div><div class='ctx'> 	    (new_issued &amp; (CEPH_CAP_ANY_FILE_RD | CEPH_CAP_ANY_FILE_WR))) {</div><div class='add'>+		u64 size = le64_to_cpu(info-&gt;size);</div><div class='ctx'> 		s64 old_pool = ci-&gt;i_layout.pool_id;</div><div class='ctx'> 		struct ceph_string *old_ns;</div><div class='ctx'> </div><div class='hunk'>@@ -901,15 +1146,28 @@ int ceph_fill_inode(struct inode *inode, struct page *locked_page,</div><div class='ctx'> </div><div class='ctx'> 		pool_ns = old_ns;</div><div class='ctx'> </div><div class='add'>+		if (IS_ENCRYPTED(inode) &amp;&amp; size &amp;&amp;</div><div class='add'>+		    iinfo-&gt;fscrypt_file_len == sizeof(__le64)) {</div><div class='add'>+			u64 fsize = __le64_to_cpu(*(__le64 *)iinfo-&gt;fscrypt_file);</div><div class='add'>+</div><div class='add'>+			if (size == round_up(fsize, CEPH_FSCRYPT_BLOCK_SIZE)) {</div><div class='add'>+				size = fsize;</div><div class='add'>+			} else {</div><div class='add'>+				pr_warn_client(cl,</div><div class='add'>+					"fscrypt size mismatch: size=%llu fscrypt_file=%llu, discarding fscrypt_file size.\n",</div><div class='add'>+					info-&gt;size, size);</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		queue_trunc = ceph_fill_file_size(inode, issued,</div><div class='ctx'> 					le32_to_cpu(info-&gt;truncate_seq),</div><div class='ctx'> 					le64_to_cpu(info-&gt;truncate_size),</div><div class='del'>-					le64_to_cpu(info-&gt;size));</div><div class='add'>+					size);</div><div class='ctx'> 		/* only update max_size on auth cap */</div><div class='ctx'> 		if ((info-&gt;cap.flags &amp; CEPH_CAP_FLAG_AUTH) &amp;&amp;</div><div class='ctx'> 		    ci-&gt;i_max_size != le64_to_cpu(info-&gt;max_size)) {</div><div class='del'>-			dout("max_size %lld -&gt; %llu\n", ci-&gt;i_max_size,</div><div class='del'>-					le64_to_cpu(info-&gt;max_size));</div><div class='add'>+			doutc(cl, "max_size %lld -&gt; %llu\n",</div><div class='add'>+			    ci-&gt;i_max_size, le64_to_cpu(info-&gt;max_size));</div><div class='ctx'> 			ci-&gt;i_max_size = le64_to_cpu(info-&gt;max_size);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -964,26 +1222,45 @@ int ceph_fill_inode(struct inode *inode, struct page *locked_page,</div><div class='ctx'> 		inode-&gt;i_fop = &amp;ceph_file_fops;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case S_IFLNK:</div><div class='del'>-		inode-&gt;i_op = &amp;ceph_symlink_iops;</div><div class='ctx'> 		if (!ci-&gt;i_symlink) {</div><div class='ctx'> 			u32 symlen = iinfo-&gt;symlink_len;</div><div class='ctx'> 			char *sym;</div><div class='ctx'> </div><div class='ctx'> 			spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> </div><div class='del'>-			if (symlen != i_size_read(inode)) {</div><div class='del'>-				pr_err("%s %llx.%llx BAD symlink "</div><div class='del'>-					"size %lld\n", __func__,</div><div class='del'>-					ceph_vinop(inode),</div><div class='del'>-					i_size_read(inode));</div><div class='add'>+			if (IS_ENCRYPTED(inode)) {</div><div class='add'>+				if (symlen != i_size_read(inode))</div><div class='add'>+					pr_err_client(cl,</div><div class='add'>+						"%p %llx.%llx BAD symlink size %lld\n",</div><div class='add'>+						inode, ceph_vinop(inode),</div><div class='add'>+						i_size_read(inode));</div><div class='add'>+</div><div class='add'>+				err = decode_encrypted_symlink(mdsc, iinfo-&gt;symlink,</div><div class='add'>+							       symlen, (u8 **)&amp;sym);</div><div class='add'>+				if (err &lt; 0) {</div><div class='add'>+					pr_err_client(cl,</div><div class='add'>+						"decoding encrypted symlink failed: %d\n",</div><div class='add'>+						err);</div><div class='add'>+					goto out;</div><div class='add'>+				}</div><div class='add'>+				symlen = err;</div><div class='ctx'> 				i_size_write(inode, symlen);</div><div class='ctx'> 				inode-&gt;i_blocks = calc_inode_blocks(symlen);</div><div class='del'>-			}</div><div class='add'>+			} else {</div><div class='add'>+				if (symlen != i_size_read(inode)) {</div><div class='add'>+					pr_err_client(cl,</div><div class='add'>+						"%p %llx.%llx BAD symlink size %lld\n",</div><div class='add'>+						inode, ceph_vinop(inode),</div><div class='add'>+						i_size_read(inode));</div><div class='add'>+					i_size_write(inode, symlen);</div><div class='add'>+					inode-&gt;i_blocks = calc_inode_blocks(symlen);</div><div class='add'>+				}</div><div class='ctx'> </div><div class='del'>-			err = -ENOMEM;</div><div class='del'>-			sym = kstrndup(iinfo-&gt;symlink, symlen, GFP_NOFS);</div><div class='del'>-			if (!sym)</div><div class='del'>-				goto out;</div><div class='add'>+				err = -ENOMEM;</div><div class='add'>+				sym = kstrndup(iinfo-&gt;symlink, symlen, GFP_NOFS);</div><div class='add'>+				if (!sym)</div><div class='add'>+					goto out;</div><div class='add'>+			}</div><div class='ctx'> </div><div class='ctx'> 			spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 			if (!ci-&gt;i_symlink)</div><div class='hunk'>@@ -991,15 +1268,25 @@ int ceph_fill_inode(struct inode *inode, struct page *locked_page,</div><div class='ctx'> 			else</div><div class='ctx'> 				kfree(sym); /* lost a race */</div><div class='ctx'> 		}</div><div class='del'>-		inode-&gt;i_link = ci-&gt;i_symlink;</div><div class='add'>+</div><div class='add'>+		if (IS_ENCRYPTED(inode)) {</div><div class='add'>+			/*</div><div class='add'>+			 * Encrypted symlinks need to be decrypted before we can</div><div class='add'>+			 * cache their targets in i_link. Don't touch it here.</div><div class='add'>+			 */</div><div class='add'>+			inode-&gt;i_op = &amp;ceph_encrypted_symlink_iops;</div><div class='add'>+		} else {</div><div class='add'>+			inode-&gt;i_link = ci-&gt;i_symlink;</div><div class='add'>+			inode-&gt;i_op = &amp;ceph_symlink_iops;</div><div class='add'>+		}</div><div class='ctx'> 		break;</div><div class='ctx'> 	case S_IFDIR:</div><div class='ctx'> 		inode-&gt;i_op = &amp;ceph_dir_iops;</div><div class='ctx'> 		inode-&gt;i_fop = &amp;ceph_dir_fops;</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='del'>-		pr_err("%s %llx.%llx BAD mode 0%o\n", __func__,</div><div class='del'>-		       ceph_vinop(inode), inode-&gt;i_mode);</div><div class='add'>+		pr_err_client(cl, "%p %llx.%llx BAD mode 0%o\n", inode,</div><div class='add'>+			      ceph_vinop(inode), inode-&gt;i_mode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* were we issued a capability? */</div><div class='hunk'>@@ -1020,7 +1307,8 @@ int ceph_fill_inode(struct inode *inode, struct page *locked_page,</div><div class='ctx'> 			    (info_caps &amp; CEPH_CAP_FILE_SHARED) &amp;&amp;</div><div class='ctx'> 			    (issued &amp; CEPH_CAP_FILE_EXCL) == 0 &amp;&amp;</div><div class='ctx'> 			    !__ceph_dir_is_complete(ci)) {</div><div class='del'>-				dout(" marking %p complete (empty)\n", inode);</div><div class='add'>+				doutc(cl, " marking %p complete (empty)\n",</div><div class='add'>+				      inode);</div><div class='ctx'> 				i_size_write(inode, 0);</div><div class='ctx'> 				__ceph_dir_set_complete(ci,</div><div class='ctx'> 					atomic64_read(&amp;ci-&gt;i_release_count),</div><div class='hunk'>@@ -1029,8 +1317,8 @@ int ceph_fill_inode(struct inode *inode, struct page *locked_page,</div><div class='ctx'> </div><div class='ctx'> 			wake = true;</div><div class='ctx'> 		} else {</div><div class='del'>-			dout(" %p got snap_caps %s\n", inode,</div><div class='del'>-			     ceph_cap_string(info_caps));</div><div class='add'>+			doutc(cl, " %p got snap_caps %s\n", inode,</div><div class='add'>+			      ceph_cap_string(info_caps));</div><div class='ctx'> 			ci-&gt;i_snap_caps |= info_caps;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1039,20 +1327,22 @@ int ceph_fill_inode(struct inode *inode, struct page *locked_page,</div><div class='ctx'> 	    iinfo-&gt;inline_version &gt;= ci-&gt;i_inline_version) {</div><div class='ctx'> 		int cache_caps = CEPH_CAP_FILE_CACHE | CEPH_CAP_FILE_LAZYIO;</div><div class='ctx'> 		ci-&gt;i_inline_version = iinfo-&gt;inline_version;</div><div class='del'>-		if (ci-&gt;i_inline_version != CEPH_INLINE_NONE &amp;&amp;</div><div class='add'>+		if (ceph_has_inline_data(ci) &amp;&amp;</div><div class='ctx'> 		    (locked_page || (info_caps &amp; cache_caps)))</div><div class='ctx'> 			fill_inline = true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (cap_fmode &gt;= 0) {</div><div class='ctx'> 		if (!info_caps)</div><div class='del'>-			pr_warn("mds issued no caps on %llx.%llx\n",</div><div class='del'>-				ceph_vinop(inode));</div><div class='add'>+			pr_warn_client(cl, "mds issued no caps on %llx.%llx\n",</div><div class='add'>+				       ceph_vinop(inode));</div><div class='ctx'> 		__ceph_touch_fmode(ci, mdsc, cap_fmode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> </div><div class='add'>+	ceph_fscache_register_inode_cookie(inode);</div><div class='add'>+</div><div class='ctx'> 	if (fill_inline)</div><div class='ctx'> 		ceph_fill_inline_data(inode, locked_page,</div><div class='ctx'> 				      iinfo-&gt;inline_data, iinfo-&gt;inline_len);</div><div class='hunk'>@@ -1091,14 +1381,14 @@ static void __update_dentry_lease(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 				  unsigned long from_time,</div><div class='ctx'> 				  struct ceph_mds_session **old_lease_session)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(dir);</div><div class='ctx'> 	struct ceph_dentry_info *di = ceph_dentry(dentry);</div><div class='ctx'> 	unsigned mask = le16_to_cpu(lease-&gt;mask);</div><div class='ctx'> 	long unsigned duration = le32_to_cpu(lease-&gt;duration_ms);</div><div class='ctx'> 	long unsigned ttl = from_time + (duration * HZ) / 1000;</div><div class='ctx'> 	long unsigned half_ttl = from_time + (duration * HZ / 2) / 1000;</div><div class='ctx'> </div><div class='del'>-	dout("update_dentry_lease %p duration %lu ms ttl %lu\n",</div><div class='del'>-	     dentry, duration, ttl);</div><div class='add'>+	doutc(cl, "%p duration %lu ms ttl %lu\n", dentry, duration, ttl);</div><div class='ctx'> </div><div class='ctx'> 	/* only track leases on regular dentries */</div><div class='ctx'> 	if (ceph_snap(dir) != CEPH_NOSNAP)</div><div class='hunk'>@@ -1195,10 +1485,11 @@ out_unlock:</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * splice a dentry to an inode.</div><div class='del'>- * caller must hold directory i_mutex for this to be safe.</div><div class='add'>+ * caller must hold directory i_rwsem for this to be safe.</div><div class='ctx'>  */</div><div class='ctx'> static int splice_dentry(struct dentry **pdn, struct inode *in)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(in);</div><div class='ctx'> 	struct dentry *dn = *pdn;</div><div class='ctx'> 	struct dentry *realdn;</div><div class='ctx'> </div><div class='hunk'>@@ -1230,23 +1521,21 @@ static int splice_dentry(struct dentry **pdn, struct inode *in)</div><div class='ctx'> 		d_drop(dn);</div><div class='ctx'> 	realdn = d_splice_alias(in, dn);</div><div class='ctx'> 	if (IS_ERR(realdn)) {</div><div class='del'>-		pr_err("splice_dentry error %ld %p inode %p ino %llx.%llx\n",</div><div class='del'>-		       PTR_ERR(realdn), dn, in, ceph_vinop(in));</div><div class='add'>+		pr_err_client(cl, "error %ld %p inode %p ino %llx.%llx\n",</div><div class='add'>+			      PTR_ERR(realdn), dn, in, ceph_vinop(in));</div><div class='ctx'> 		return PTR_ERR(realdn);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (realdn) {</div><div class='del'>-		dout("dn %p (%d) spliced with %p (%d) "</div><div class='del'>-		     "inode %p ino %llx.%llx\n",</div><div class='del'>-		     dn, d_count(dn),</div><div class='del'>-		     realdn, d_count(realdn),</div><div class='del'>-		     d_inode(realdn), ceph_vinop(d_inode(realdn)));</div><div class='add'>+		doutc(cl, "dn %p (%d) spliced with %p (%d) inode %p ino %llx.%llx\n",</div><div class='add'>+		      dn, d_count(dn), realdn, d_count(realdn),</div><div class='add'>+		      d_inode(realdn), ceph_vinop(d_inode(realdn)));</div><div class='ctx'> 		dput(dn);</div><div class='ctx'> 		*pdn = realdn;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		BUG_ON(!ceph_dentry(dn));</div><div class='del'>-		dout("dn %p attached to %p ino %llx.%llx\n",</div><div class='del'>-		     dn, d_inode(dn), ceph_vinop(d_inode(dn)));</div><div class='add'>+		doutc(cl, "dn %p attached to %p ino %llx.%llx\n", dn,</div><div class='add'>+		      d_inode(dn), ceph_vinop(d_inode(dn)));</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -1268,24 +1557,33 @@ int ceph_fill_trace(struct super_block *sb, struct ceph_mds_request *req)</div><div class='ctx'> 	struct ceph_mds_reply_info_parsed *rinfo = &amp;req-&gt;r_reply_info;</div><div class='ctx'> 	struct inode *in = NULL;</div><div class='ctx'> 	struct ceph_vino tvino, dvino;</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_sb_to_client(sb);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_sb_to_fs_client(sb);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='add'>+	struct inode *parent_dir = NULL;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='del'>-	dout("fill_trace %p is_dentry %d is_target %d\n", req,</div><div class='del'>-	     rinfo-&gt;head-&gt;is_dentry, rinfo-&gt;head-&gt;is_target);</div><div class='add'>+	doutc(cl, "%p is_dentry %d is_target %d\n", req,</div><div class='add'>+	      rinfo-&gt;head-&gt;is_dentry, rinfo-&gt;head-&gt;is_target);</div><div class='ctx'> </div><div class='ctx'> 	if (!rinfo-&gt;head-&gt;is_target &amp;&amp; !rinfo-&gt;head-&gt;is_dentry) {</div><div class='del'>-		dout("fill_trace reply is empty!\n");</div><div class='add'>+		doutc(cl, "reply is empty!\n");</div><div class='ctx'> 		if (rinfo-&gt;head-&gt;result == 0 &amp;&amp; req-&gt;r_parent)</div><div class='ctx'> 			ceph_invalidate_dir_request(req);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (rinfo-&gt;head-&gt;is_dentry) {</div><div class='del'>-		struct inode *dir = req-&gt;r_parent;</div><div class='del'>-</div><div class='del'>-		if (dir) {</div><div class='del'>-			err = ceph_fill_inode(dir, NULL, &amp;rinfo-&gt;diri,</div><div class='add'>+		/*</div><div class='add'>+		 * r_parent may be stale, in cases when R_PARENT_LOCKED is not set,</div><div class='add'>+		 * so we need to get the correct inode</div><div class='add'>+		 */</div><div class='add'>+		parent_dir = ceph_get_reply_dir(sb, req-&gt;r_parent, rinfo);</div><div class='add'>+		if (unlikely(IS_ERR(parent_dir))) {</div><div class='add'>+			err = PTR_ERR(parent_dir);</div><div class='add'>+			goto done;</div><div class='add'>+		}</div><div class='add'>+		if (parent_dir) {</div><div class='add'>+			err = ceph_fill_inode(parent_dir, NULL, &amp;rinfo-&gt;diri,</div><div class='ctx'> 					      rinfo-&gt;dirfrag, session, -1,</div><div class='ctx'> 					      &amp;req-&gt;r_caps_reservation);</div><div class='ctx'> 			if (err &lt; 0)</div><div class='hunk'>@@ -1294,48 +1592,74 @@ int ceph_fill_trace(struct super_block *sb, struct ceph_mds_request *req)</div><div class='ctx'> 			WARN_ON_ONCE(1);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (dir &amp;&amp; req-&gt;r_op == CEPH_MDS_OP_LOOKUPNAME &amp;&amp;</div><div class='add'>+		if (parent_dir &amp;&amp; req-&gt;r_op == CEPH_MDS_OP_LOOKUPNAME &amp;&amp;</div><div class='ctx'> 		    test_bit(CEPH_MDS_R_PARENT_LOCKED, &amp;req-&gt;r_req_flags) &amp;&amp;</div><div class='ctx'> 		    !test_bit(CEPH_MDS_R_ABORTED, &amp;req-&gt;r_req_flags)) {</div><div class='add'>+			bool is_nokey = false;</div><div class='ctx'> 			struct qstr dname;</div><div class='ctx'> 			struct dentry *dn, *parent;</div><div class='add'>+			struct fscrypt_str oname = FSTR_INIT(NULL, 0);</div><div class='add'>+			struct ceph_fname fname = { .dir	= parent_dir,</div><div class='add'>+						    .name	= rinfo-&gt;dname,</div><div class='add'>+						    .ctext	= rinfo-&gt;altname,</div><div class='add'>+						    .name_len	= rinfo-&gt;dname_len,</div><div class='add'>+						    .ctext_len	= rinfo-&gt;altname_len };</div><div class='ctx'> </div><div class='ctx'> 			BUG_ON(!rinfo-&gt;head-&gt;is_target);</div><div class='ctx'> 			BUG_ON(req-&gt;r_dentry);</div><div class='ctx'> </div><div class='del'>-			parent = d_find_any_alias(dir);</div><div class='add'>+			parent = d_find_any_alias(parent_dir);</div><div class='ctx'> 			BUG_ON(!parent);</div><div class='ctx'> </div><div class='del'>-			dname.name = rinfo-&gt;dname;</div><div class='del'>-			dname.len = rinfo-&gt;dname_len;</div><div class='add'>+			err = ceph_fname_alloc_buffer(parent_dir, &amp;oname);</div><div class='add'>+			if (err &lt; 0) {</div><div class='add'>+				dput(parent);</div><div class='add'>+				goto done;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			err = ceph_fname_to_usr(&amp;fname, NULL, &amp;oname, &amp;is_nokey);</div><div class='add'>+			if (err &lt; 0) {</div><div class='add'>+				dput(parent);</div><div class='add'>+				ceph_fname_free_buffer(parent_dir, &amp;oname);</div><div class='add'>+				goto done;</div><div class='add'>+			}</div><div class='add'>+			dname.name = oname.name;</div><div class='add'>+			dname.len = oname.len;</div><div class='ctx'> 			dname.hash = full_name_hash(parent, dname.name, dname.len);</div><div class='ctx'> 			tvino.ino = le64_to_cpu(rinfo-&gt;targeti.in-&gt;ino);</div><div class='ctx'> 			tvino.snap = le64_to_cpu(rinfo-&gt;targeti.in-&gt;snapid);</div><div class='ctx'> retry_lookup:</div><div class='ctx'> 			dn = d_lookup(parent, &amp;dname);</div><div class='del'>-			dout("d_lookup on parent=%p name=%.*s got %p\n",</div><div class='del'>-			     parent, dname.len, dname.name, dn);</div><div class='add'>+			doutc(cl, "d_lookup on parent=%p name=%.*s got %p\n",</div><div class='add'>+			      parent, dname.len, dname.name, dn);</div><div class='ctx'> </div><div class='ctx'> 			if (!dn) {</div><div class='ctx'> 				dn = d_alloc(parent, &amp;dname);</div><div class='del'>-				dout("d_alloc %p '%.*s' = %p\n", parent,</div><div class='del'>-				     dname.len, dname.name, dn);</div><div class='add'>+				doutc(cl, "d_alloc %p '%.*s' = %p\n", parent,</div><div class='add'>+				      dname.len, dname.name, dn);</div><div class='ctx'> 				if (!dn) {</div><div class='ctx'> 					dput(parent);</div><div class='add'>+					ceph_fname_free_buffer(parent_dir, &amp;oname);</div><div class='ctx'> 					err = -ENOMEM;</div><div class='ctx'> 					goto done;</div><div class='ctx'> 				}</div><div class='add'>+				if (is_nokey) {</div><div class='add'>+					spin_lock(&amp;dn-&gt;d_lock);</div><div class='add'>+					dn-&gt;d_flags |= DCACHE_NOKEY_NAME;</div><div class='add'>+					spin_unlock(&amp;dn-&gt;d_lock);</div><div class='add'>+				}</div><div class='ctx'> 				err = 0;</div><div class='ctx'> 			} else if (d_really_is_positive(dn) &amp;&amp;</div><div class='ctx'> 				   (ceph_ino(d_inode(dn)) != tvino.ino ||</div><div class='ctx'> 				    ceph_snap(d_inode(dn)) != tvino.snap)) {</div><div class='del'>-				dout(" dn %p points to wrong inode %p\n",</div><div class='del'>-				     dn, d_inode(dn));</div><div class='del'>-				ceph_dir_clear_ordered(dir);</div><div class='add'>+				doutc(cl, " dn %p points to wrong inode %p\n",</div><div class='add'>+				      dn, d_inode(dn));</div><div class='add'>+				ceph_dir_clear_ordered(parent_dir);</div><div class='ctx'> 				d_delete(dn);</div><div class='ctx'> 				dput(dn);</div><div class='ctx'> 				goto retry_lookup;</div><div class='ctx'> 			}</div><div class='add'>+			ceph_fname_free_buffer(parent_dir, &amp;oname);</div><div class='ctx'> </div><div class='ctx'> 			req-&gt;r_dentry = dn;</div><div class='ctx'> 			dput(parent);</div><div class='hunk'>@@ -1354,16 +1678,16 @@ retry_lookup:</div><div class='ctx'> 				 rinfo-&gt;head-&gt;result == 0) ?  req-&gt;r_fmode : -1,</div><div class='ctx'> 				&amp;req-&gt;r_caps_reservation);</div><div class='ctx'> 		if (err &lt; 0) {</div><div class='del'>-			pr_err("ceph_fill_inode badness %p %llx.%llx\n",</div><div class='del'>-				in, ceph_vinop(in));</div><div class='add'>+			pr_err_client(cl, "badness %p %llx.%llx\n", in,</div><div class='add'>+				      ceph_vinop(in));</div><div class='ctx'> 			req-&gt;r_target_inode = NULL;</div><div class='del'>-			if (in-&gt;i_state &amp; I_NEW)</div><div class='add'>+			if (inode_state_read_once(in) &amp; I_NEW)</div><div class='ctx'> 				discard_new_inode(in);</div><div class='ctx'> 			else</div><div class='ctx'> 				iput(in);</div><div class='ctx'> 			goto done;</div><div class='ctx'> 		}</div><div class='del'>-		if (in-&gt;i_state &amp; I_NEW)</div><div class='add'>+		if (inode_state_read_once(in) &amp; I_NEW)</div><div class='ctx'> 			unlock_new_inode(in);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1405,36 +1729,32 @@ retry_lookup:</div><div class='ctx'> 		have_lease = have_dir_cap ||</div><div class='ctx'> 			le32_to_cpu(rinfo-&gt;dlease-&gt;duration_ms);</div><div class='ctx'> 		if (!have_lease)</div><div class='del'>-			dout("fill_trace  no dentry lease or dir cap\n");</div><div class='add'>+			doutc(cl, "no dentry lease or dir cap\n");</div><div class='ctx'> </div><div class='ctx'> 		/* rename? */</div><div class='ctx'> 		if (req-&gt;r_old_dentry &amp;&amp; req-&gt;r_op == CEPH_MDS_OP_RENAME) {</div><div class='ctx'> 			struct inode *olddir = req-&gt;r_old_dentry_dir;</div><div class='ctx'> 			BUG_ON(!olddir);</div><div class='ctx'> </div><div class='del'>-			dout(" src %p '%pd' dst %p '%pd'\n",</div><div class='del'>-			     req-&gt;r_old_dentry,</div><div class='del'>-			     req-&gt;r_old_dentry,</div><div class='del'>-			     dn, dn);</div><div class='del'>-			dout("fill_trace doing d_move %p -&gt; %p\n",</div><div class='del'>-			     req-&gt;r_old_dentry, dn);</div><div class='add'>+			doutc(cl, " src %p '%pd' dst %p '%pd'\n",</div><div class='add'>+			      req-&gt;r_old_dentry, req-&gt;r_old_dentry, dn, dn);</div><div class='add'>+			doutc(cl, "doing d_move %p -&gt; %p\n", req-&gt;r_old_dentry, dn);</div><div class='ctx'> </div><div class='ctx'> 			/* d_move screws up sibling dentries' offsets */</div><div class='ctx'> 			ceph_dir_clear_ordered(dir);</div><div class='ctx'> 			ceph_dir_clear_ordered(olddir);</div><div class='ctx'> </div><div class='ctx'> 			d_move(req-&gt;r_old_dentry, dn);</div><div class='del'>-			dout(" src %p '%pd' dst %p '%pd'\n",</div><div class='del'>-			     req-&gt;r_old_dentry,</div><div class='del'>-			     req-&gt;r_old_dentry,</div><div class='del'>-			     dn, dn);</div><div class='add'>+			doutc(cl, " src %p '%pd' dst %p '%pd'\n",</div><div class='add'>+			      req-&gt;r_old_dentry, req-&gt;r_old_dentry, dn, dn);</div><div class='ctx'> </div><div class='ctx'> 			/* ensure target dentry is invalidated, despite</div><div class='ctx'> 			   rehashing bug in vfs_rename_dir */</div><div class='ctx'> 			ceph_invalidate_dentry_lease(dn);</div><div class='ctx'> </div><div class='del'>-			dout("dn %p gets new offset %lld\n", req-&gt;r_old_dentry,</div><div class='del'>-			     ceph_dentry(req-&gt;r_old_dentry)-&gt;offset);</div><div class='add'>+			doutc(cl, "dn %p gets new offset %lld\n",</div><div class='add'>+			      req-&gt;r_old_dentry,</div><div class='add'>+			      ceph_dentry(req-&gt;r_old_dentry)-&gt;offset);</div><div class='ctx'> </div><div class='ctx'> 			/* swap r_dentry and r_old_dentry in case that</div><div class='ctx'> 			 * splice_dentry() gets called later. This is safe</div><div class='hunk'>@@ -1446,18 +1766,25 @@ retry_lookup:</div><div class='ctx'> </div><div class='ctx'> 		/* null dentry? */</div><div class='ctx'> 		if (!rinfo-&gt;head-&gt;is_target) {</div><div class='del'>-			dout("fill_trace null dentry\n");</div><div class='add'>+			doutc(cl, "null dentry\n");</div><div class='ctx'> 			if (d_really_is_positive(dn)) {</div><div class='del'>-				dout("d_delete %p\n", dn);</div><div class='add'>+				doutc(cl, "d_delete %p\n", dn);</div><div class='ctx'> 				ceph_dir_clear_ordered(dir);</div><div class='ctx'> 				d_delete(dn);</div><div class='ctx'> 			} else if (have_lease) {</div><div class='ctx'> 				if (d_unhashed(dn))</div><div class='ctx'> 					d_add(dn, NULL);</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			if (!d_unhashed(dn) &amp;&amp; have_lease)</div><div class='ctx'> 				update_dentry_lease(dir, dn,</div><div class='ctx'> 						    rinfo-&gt;dlease, session,</div><div class='ctx'> 						    req-&gt;r_request_started);</div><div class='del'>-			}</div><div class='add'>+			goto done;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (unlikely(!in)) {</div><div class='add'>+			err = -EINVAL;</div><div class='ctx'> 			goto done;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -1470,9 +1797,9 @@ retry_lookup:</div><div class='ctx'> 				goto done;</div><div class='ctx'> 			dn = req-&gt;r_dentry;  /* may have spliced */</div><div class='ctx'> 		} else if (d_really_is_positive(dn) &amp;&amp; d_inode(dn) != in) {</div><div class='del'>-			dout(" %p links to %p %llx.%llx, not %llx.%llx\n",</div><div class='del'>-			     dn, d_inode(dn), ceph_vinop(d_inode(dn)),</div><div class='del'>-			     ceph_vinop(in));</div><div class='add'>+			doutc(cl, " %p links to %p %llx.%llx, not %llx.%llx\n",</div><div class='add'>+			      dn, d_inode(dn), ceph_vinop(d_inode(dn)),</div><div class='add'>+			      ceph_vinop(in));</div><div class='ctx'> 			d_invalidate(dn);</div><div class='ctx'> 			have_lease = false;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1482,7 +1809,7 @@ retry_lookup:</div><div class='ctx'> 					    rinfo-&gt;dlease, session,</div><div class='ctx'> 					    req-&gt;r_request_started);</div><div class='ctx'> 		}</div><div class='del'>-		dout(" final dn %p\n", dn);</div><div class='add'>+		doutc(cl, " final dn %p\n", dn);</div><div class='ctx'> 	} else if ((req-&gt;r_op == CEPH_MDS_OP_LOOKUPSNAP ||</div><div class='ctx'> 		    req-&gt;r_op == CEPH_MDS_OP_MKSNAP) &amp;&amp;</div><div class='ctx'> 	           test_bit(CEPH_MDS_R_PARENT_LOCKED, &amp;req-&gt;r_req_flags) &amp;&amp;</div><div class='hunk'>@@ -1493,14 +1820,21 @@ retry_lookup:</div><div class='ctx'> 		BUG_ON(!dir);</div><div class='ctx'> 		BUG_ON(ceph_snap(dir) != CEPH_SNAPDIR);</div><div class='ctx'> 		BUG_ON(!req-&gt;r_dentry);</div><div class='del'>-		dout(" linking snapped dir %p to dn %p\n", in, req-&gt;r_dentry);</div><div class='add'>+		doutc(cl, " linking snapped dir %p to dn %p\n", in,</div><div class='add'>+		      req-&gt;r_dentry);</div><div class='ctx'> 		ceph_dir_clear_ordered(dir);</div><div class='add'>+</div><div class='add'>+		if (unlikely(!in)) {</div><div class='add'>+			err = -EINVAL;</div><div class='add'>+			goto done;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		ihold(in);</div><div class='ctx'> 		err = splice_dentry(&amp;req-&gt;r_dentry, in);</div><div class='ctx'> 		if (err &lt; 0)</div><div class='ctx'> 			goto done;</div><div class='ctx'> 	} else if (rinfo-&gt;head-&gt;is_dentry &amp;&amp; req-&gt;r_dentry) {</div><div class='del'>-		/* parent inode is not locked, be carefull */</div><div class='add'>+		/* parent inode is not locked, be careful */</div><div class='ctx'> 		struct ceph_vino *ptvino = NULL;</div><div class='ctx'> 		dvino.ino = le64_to_cpu(rinfo-&gt;diri.in-&gt;ino);</div><div class='ctx'> 		dvino.snap = le64_to_cpu(rinfo-&gt;diri.in-&gt;snapid);</div><div class='hunk'>@@ -1515,7 +1849,10 @@ retry_lookup:</div><div class='ctx'> 					    &amp;dvino, ptvino);</div><div class='ctx'> 	}</div><div class='ctx'> done:</div><div class='del'>-	dout("fill_trace done err=%d\n", err);</div><div class='add'>+	/* Drop extra ref from ceph_get_reply_dir() if it returned a new inode */</div><div class='add'>+	if (unlikely(!IS_ERR_OR_NULL(parent_dir) &amp;&amp; parent_dir != req-&gt;r_parent))</div><div class='add'>+		iput(parent_dir);</div><div class='add'>+	doutc(cl, "done err=%d\n", err);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1526,6 +1863,7 @@ static int readdir_prepopulate_inodes_only(struct ceph_mds_request *req,</div><div class='ctx'> 					   struct ceph_mds_session *session)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_mds_reply_info_parsed *rinfo = &amp;req-&gt;r_reply_info;</div><div class='add'>+	struct ceph_client *cl = session-&gt;s_mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	int i, err = 0;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; rinfo-&gt;dir_nr; i++) {</div><div class='hunk'>@@ -1537,23 +1875,23 @@ static int readdir_prepopulate_inodes_only(struct ceph_mds_request *req,</div><div class='ctx'> 		vino.ino = le64_to_cpu(rde-&gt;inode.in-&gt;ino);</div><div class='ctx'> 		vino.snap = le64_to_cpu(rde-&gt;inode.in-&gt;snapid);</div><div class='ctx'> </div><div class='del'>-		in = ceph_get_inode(req-&gt;r_dentry-&gt;d_sb, vino);</div><div class='add'>+		in = ceph_get_inode(req-&gt;r_dentry-&gt;d_sb, vino, NULL);</div><div class='ctx'> 		if (IS_ERR(in)) {</div><div class='ctx'> 			err = PTR_ERR(in);</div><div class='del'>-			dout("new_inode badness got %d\n", err);</div><div class='add'>+			doutc(cl, "badness got %d\n", err);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> 		rc = ceph_fill_inode(in, NULL, &amp;rde-&gt;inode, NULL, session,</div><div class='ctx'> 				     -1, &amp;req-&gt;r_caps_reservation);</div><div class='ctx'> 		if (rc &lt; 0) {</div><div class='del'>-			pr_err("ceph_fill_inode badness on %p got %d\n",</div><div class='del'>-			       in, rc);</div><div class='add'>+			pr_err_client(cl, "inode badness on %p got %d\n", in,</div><div class='add'>+				      rc);</div><div class='ctx'> 			err = rc;</div><div class='del'>-			if (in-&gt;i_state &amp; I_NEW) {</div><div class='add'>+			if (inode_state_read_once(in) &amp; I_NEW) {</div><div class='ctx'> 				ihold(in);</div><div class='ctx'> 				discard_new_inode(in);</div><div class='ctx'> 			}</div><div class='del'>-		} else if (in-&gt;i_state &amp; I_NEW) {</div><div class='add'>+		} else if (inode_state_read_once(in) &amp; I_NEW) {</div><div class='ctx'> 			unlock_new_inode(in);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -1565,10 +1903,9 @@ static int readdir_prepopulate_inodes_only(struct ceph_mds_request *req,</div><div class='ctx'> </div><div class='ctx'> void ceph_readdir_cache_release(struct ceph_readdir_cache_control *ctl)</div><div class='ctx'> {</div><div class='del'>-	if (ctl-&gt;page) {</div><div class='del'>-		kunmap(ctl-&gt;page);</div><div class='del'>-		put_page(ctl-&gt;page);</div><div class='del'>-		ctl-&gt;page = NULL;</div><div class='add'>+	if (ctl-&gt;folio) {</div><div class='add'>+		folio_release_kmap(ctl-&gt;folio, ctl-&gt;dentries);</div><div class='add'>+		ctl-&gt;folio = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1576,36 +1913,43 @@ static int fill_readdir_cache(struct inode *dir, struct dentry *dn,</div><div class='ctx'> 			      struct ceph_readdir_cache_control *ctl,</div><div class='ctx'> 			      struct ceph_mds_request *req)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(dir);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(dir);</div><div class='ctx'> 	unsigned nsize = PAGE_SIZE / sizeof(struct dentry*);</div><div class='ctx'> 	unsigned idx = ctl-&gt;index % nsize;</div><div class='ctx'> 	pgoff_t pgoff = ctl-&gt;index / nsize;</div><div class='ctx'> </div><div class='del'>-	if (!ctl-&gt;page || pgoff != page_index(ctl-&gt;page)) {</div><div class='add'>+	if (!ctl-&gt;folio || pgoff != ctl-&gt;folio-&gt;index) {</div><div class='ctx'> 		ceph_readdir_cache_release(ctl);</div><div class='add'>+		fgf_t fgf = FGP_LOCK;</div><div class='add'>+</div><div class='ctx'> 		if (idx == 0)</div><div class='del'>-			ctl-&gt;page = grab_cache_page(&amp;dir-&gt;i_data, pgoff);</div><div class='del'>-		else</div><div class='del'>-			ctl-&gt;page = find_lock_page(&amp;dir-&gt;i_data, pgoff);</div><div class='del'>-		if (!ctl-&gt;page) {</div><div class='add'>+			fgf |= FGP_ACCESSED | FGP_CREAT;</div><div class='add'>+</div><div class='add'>+		ctl-&gt;folio = __filemap_get_folio(&amp;dir-&gt;i_data, pgoff,</div><div class='add'>+				fgf, mapping_gfp_mask(&amp;dir-&gt;i_data));</div><div class='add'>+		if (IS_ERR(ctl-&gt;folio)) {</div><div class='add'>+			int err = PTR_ERR(ctl-&gt;folio);</div><div class='add'>+</div><div class='add'>+			ctl-&gt;folio = NULL;</div><div class='ctx'> 			ctl-&gt;index = -1;</div><div class='del'>-			return idx == 0 ? -ENOMEM : 0;</div><div class='add'>+			return idx == 0 ? err : 0;</div><div class='ctx'> 		}</div><div class='ctx'> 		/* reading/filling the cache are serialized by</div><div class='del'>-		 * i_mutex, no need to use page lock */</div><div class='del'>-		unlock_page(ctl-&gt;page);</div><div class='del'>-		ctl-&gt;dentries = kmap(ctl-&gt;page);</div><div class='add'>+		 * i_rwsem, no need to use folio lock */</div><div class='add'>+		folio_unlock(ctl-&gt;folio);</div><div class='add'>+		ctl-&gt;dentries = kmap_local_folio(ctl-&gt;folio, 0);</div><div class='ctx'> 		if (idx == 0)</div><div class='ctx'> 			memset(ctl-&gt;dentries, 0, PAGE_SIZE);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (req-&gt;r_dir_release_cnt == atomic64_read(&amp;ci-&gt;i_release_count) &amp;&amp;</div><div class='ctx'> 	    req-&gt;r_dir_ordered_cnt == atomic64_read(&amp;ci-&gt;i_ordered_count)) {</div><div class='del'>-		dout("readdir cache dn %p idx %d\n", dn, ctl-&gt;index);</div><div class='add'>+		doutc(cl, "dn %p idx %d\n", dn, ctl-&gt;index);</div><div class='ctx'> 		ctl-&gt;dentries[idx] = dn;</div><div class='ctx'> 		ctl-&gt;index++;</div><div class='ctx'> 	} else {</div><div class='del'>-		dout("disable readdir cache\n");</div><div class='add'>+		doutc(cl, "disable readdir cache\n");</div><div class='ctx'> 		ctl-&gt;index = -1;</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -1615,8 +1959,10 @@ int ceph_readdir_prepopulate(struct ceph_mds_request *req,</div><div class='ctx'> 			     struct ceph_mds_session *session)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *parent = req-&gt;r_dentry;</div><div class='del'>-	struct ceph_inode_info *ci = ceph_inode(d_inode(parent));</div><div class='add'>+	struct inode *inode = d_inode(parent);</div><div class='add'>+	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	struct ceph_mds_reply_info_parsed *rinfo = &amp;req-&gt;r_reply_info;</div><div class='add'>+	struct ceph_client *cl = session-&gt;s_mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct qstr dname;</div><div class='ctx'> 	struct dentry *dn;</div><div class='ctx'> 	struct inode *in;</div><div class='hunk'>@@ -1644,19 +1990,18 @@ int ceph_readdir_prepopulate(struct ceph_mds_request *req,</div><div class='ctx'> </div><div class='ctx'> 	if (rinfo-&gt;dir_dir &amp;&amp;</div><div class='ctx'> 	    le32_to_cpu(rinfo-&gt;dir_dir-&gt;frag) != frag) {</div><div class='del'>-		dout("readdir_prepopulate got new frag %x -&gt; %x\n",</div><div class='del'>-		     frag, le32_to_cpu(rinfo-&gt;dir_dir-&gt;frag));</div><div class='add'>+		doutc(cl, "got new frag %x -&gt; %x\n", frag,</div><div class='add'>+			    le32_to_cpu(rinfo-&gt;dir_dir-&gt;frag));</div><div class='ctx'> 		frag = le32_to_cpu(rinfo-&gt;dir_dir-&gt;frag);</div><div class='ctx'> 		if (!rinfo-&gt;hash_order)</div><div class='ctx'> 			req-&gt;r_readdir_offset = 2;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (le32_to_cpu(rinfo-&gt;head-&gt;op) == CEPH_MDS_OP_LSSNAP) {</div><div class='del'>-		dout("readdir_prepopulate %d items under SNAPDIR dn %p\n",</div><div class='del'>-		     rinfo-&gt;dir_nr, parent);</div><div class='add'>+		doutc(cl, "%d items under SNAPDIR dn %p\n",</div><div class='add'>+		      rinfo-&gt;dir_nr, parent);</div><div class='ctx'> 	} else {</div><div class='del'>-		dout("readdir_prepopulate %d items under dn %p\n",</div><div class='del'>-		     rinfo-&gt;dir_nr, parent);</div><div class='add'>+		doutc(cl, "%d items under dn %p\n", rinfo-&gt;dir_nr, parent);</div><div class='ctx'> 		if (rinfo-&gt;dir_dir)</div><div class='ctx'> 			ceph_fill_dirfrag(d_inode(parent), rinfo-&gt;dir_dir);</div><div class='ctx'> </div><div class='hunk'>@@ -1689,9 +2034,7 @@ int ceph_readdir_prepopulate(struct ceph_mds_request *req,</div><div class='ctx'> 		tvino.snap = le64_to_cpu(rde-&gt;inode.in-&gt;snapid);</div><div class='ctx'> </div><div class='ctx'> 		if (rinfo-&gt;hash_order) {</div><div class='del'>-			u32 hash = ceph_str_hash(ci-&gt;i_dir_layout.dl_dir_hash,</div><div class='del'>-						 rde-&gt;name, rde-&gt;name_len);</div><div class='del'>-			hash = ceph_frag_value(hash);</div><div class='add'>+			u32 hash = ceph_frag_value(rde-&gt;raw_hash);</div><div class='ctx'> 			if (hash != last_hash)</div><div class='ctx'> 				fpos_offset = 2;</div><div class='ctx'> 			last_hash = hash;</div><div class='hunk'>@@ -1702,24 +2045,29 @@ int ceph_readdir_prepopulate(struct ceph_mds_request *req,</div><div class='ctx'> </div><div class='ctx'> retry_lookup:</div><div class='ctx'> 		dn = d_lookup(parent, &amp;dname);</div><div class='del'>-		dout("d_lookup on parent=%p name=%.*s got %p\n",</div><div class='del'>-		     parent, dname.len, dname.name, dn);</div><div class='add'>+		doutc(cl, "d_lookup on parent=%p name=%.*s got %p\n",</div><div class='add'>+		      parent, dname.len, dname.name, dn);</div><div class='ctx'> </div><div class='ctx'> 		if (!dn) {</div><div class='ctx'> 			dn = d_alloc(parent, &amp;dname);</div><div class='del'>-			dout("d_alloc %p '%.*s' = %p\n", parent,</div><div class='del'>-			     dname.len, dname.name, dn);</div><div class='add'>+			doutc(cl, "d_alloc %p '%.*s' = %p\n", parent,</div><div class='add'>+			      dname.len, dname.name, dn);</div><div class='ctx'> 			if (!dn) {</div><div class='del'>-				dout("d_alloc badness\n");</div><div class='add'>+				doutc(cl, "d_alloc badness\n");</div><div class='ctx'> 				err = -ENOMEM;</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='add'>+			if (rde-&gt;is_nokey) {</div><div class='add'>+				spin_lock(&amp;dn-&gt;d_lock);</div><div class='add'>+				dn-&gt;d_flags |= DCACHE_NOKEY_NAME;</div><div class='add'>+				spin_unlock(&amp;dn-&gt;d_lock);</div><div class='add'>+			}</div><div class='ctx'> 		} else if (d_really_is_positive(dn) &amp;&amp;</div><div class='ctx'> 			   (ceph_ino(d_inode(dn)) != tvino.ino ||</div><div class='ctx'> 			    ceph_snap(d_inode(dn)) != tvino.snap)) {</div><div class='ctx'> 			struct ceph_dentry_info *di = ceph_dentry(dn);</div><div class='del'>-			dout(" dn %p points to wrong inode %p\n",</div><div class='del'>-			     dn, d_inode(dn));</div><div class='add'>+			doutc(cl, " dn %p points to wrong inode %p\n",</div><div class='add'>+			      dn, d_inode(dn));</div><div class='ctx'> </div><div class='ctx'> 			spin_lock(&amp;dn-&gt;d_lock);</div><div class='ctx'> 			if (di-&gt;offset &gt; 0 &amp;&amp;</div><div class='hunk'>@@ -1739,9 +2087,9 @@ retry_lookup:</div><div class='ctx'> 		if (d_really_is_positive(dn)) {</div><div class='ctx'> 			in = d_inode(dn);</div><div class='ctx'> 		} else {</div><div class='del'>-			in = ceph_get_inode(parent-&gt;d_sb, tvino);</div><div class='add'>+			in = ceph_get_inode(parent-&gt;d_sb, tvino, NULL);</div><div class='ctx'> 			if (IS_ERR(in)) {</div><div class='del'>-				dout("new_inode badness\n");</div><div class='add'>+				doutc(cl, "new_inode badness\n");</div><div class='ctx'> 				d_drop(dn);</div><div class='ctx'> 				dput(dn);</div><div class='ctx'> 				err = PTR_ERR(in);</div><div class='hunk'>@@ -1752,9 +2100,10 @@ retry_lookup:</div><div class='ctx'> 		ret = ceph_fill_inode(in, NULL, &amp;rde-&gt;inode, NULL, session,</div><div class='ctx'> 				      -1, &amp;req-&gt;r_caps_reservation);</div><div class='ctx'> 		if (ret &lt; 0) {</div><div class='del'>-			pr_err("ceph_fill_inode badness on %p\n", in);</div><div class='add'>+			pr_err_client(cl, "badness on %p %llx.%llx\n", in,</div><div class='add'>+				      ceph_vinop(in));</div><div class='ctx'> 			if (d_really_is_negative(dn)) {</div><div class='del'>-				if (in-&gt;i_state &amp; I_NEW) {</div><div class='add'>+				if (inode_state_read_once(in) &amp; I_NEW) {</div><div class='ctx'> 					ihold(in);</div><div class='ctx'> 					discard_new_inode(in);</div><div class='ctx'> 				}</div><div class='hunk'>@@ -1764,13 +2113,13 @@ retry_lookup:</div><div class='ctx'> 			err = ret;</div><div class='ctx'> 			goto next_item;</div><div class='ctx'> 		}</div><div class='del'>-		if (in-&gt;i_state &amp; I_NEW)</div><div class='add'>+		if (inode_state_read_once(in) &amp; I_NEW)</div><div class='ctx'> 			unlock_new_inode(in);</div><div class='ctx'> </div><div class='ctx'> 		if (d_really_is_negative(dn)) {</div><div class='ctx'> 			if (ceph_security_xattr_deadlock(in)) {</div><div class='del'>-				dout(" skip splicing dn %p to inode %p"</div><div class='del'>-				     " (security xattr deadlock)\n", dn, in);</div><div class='add'>+				doutc(cl, " skip splicing dn %p to inode %p"</div><div class='add'>+				      " (security xattr deadlock)\n", dn, in);</div><div class='ctx'> 				iput(in);</div><div class='ctx'> 				skipped++;</div><div class='ctx'> 				goto next_item;</div><div class='hunk'>@@ -1802,54 +2151,62 @@ out:</div><div class='ctx'> 		req-&gt;r_readdir_cache_idx = cache_ctl.index;</div><div class='ctx'> 	}</div><div class='ctx'> 	ceph_readdir_cache_release(&amp;cache_ctl);</div><div class='del'>-	dout("readdir_prepopulate done\n");</div><div class='add'>+	doutc(cl, "done\n");</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> bool ceph_inode_set_size(struct inode *inode, loff_t size)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	bool ret;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-	dout("set_size %p %llu -&gt; %llu\n", inode, i_size_read(inode), size);</div><div class='add'>+	doutc(cl, "set_size %p %llu -&gt; %llu\n", inode, i_size_read(inode), size);</div><div class='ctx'> 	i_size_write(inode, size);</div><div class='add'>+	ceph_fscache_update(inode);</div><div class='ctx'> 	inode-&gt;i_blocks = calc_inode_blocks(size);</div><div class='ctx'> </div><div class='ctx'> 	ret = __ceph_should_report_size(ci);</div><div class='ctx'> </div><div class='ctx'> 	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void ceph_queue_inode_work(struct inode *inode, int work_bit)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_inode_to_client(inode);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	set_bit(work_bit, &amp;ci-&gt;i_work_mask);</div><div class='ctx'> </div><div class='ctx'> 	ihold(inode);</div><div class='ctx'> 	if (queue_work(fsc-&gt;inode_wq, &amp;ci-&gt;i_work)) {</div><div class='del'>-		dout("queue_inode_work %p, mask=%lx\n", inode, ci-&gt;i_work_mask);</div><div class='add'>+		doutc(cl, "%p %llx.%llx mask=%lx\n", inode,</div><div class='add'>+		      ceph_vinop(inode), ci-&gt;i_work_mask);</div><div class='ctx'> 	} else {</div><div class='del'>-		dout("queue_inode_work %p already queued, mask=%lx\n",</div><div class='del'>-		     inode, ci-&gt;i_work_mask);</div><div class='add'>+		doutc(cl, "%p %llx.%llx already queued, mask=%lx\n",</div><div class='add'>+		      inode, ceph_vinop(inode), ci-&gt;i_work_mask);</div><div class='ctx'> 		iput(inode);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void ceph_do_invalidate_pages(struct inode *inode)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_inode_to_client(inode);</div><div class='ctx'> 	u32 orig_gen;</div><div class='ctx'> 	int check = 0;</div><div class='ctx'> </div><div class='add'>+	ceph_fscache_invalidate(inode, false);</div><div class='add'>+</div><div class='ctx'> 	mutex_lock(&amp;ci-&gt;i_truncate_mutex);</div><div class='ctx'> </div><div class='del'>-	if (READ_ONCE(fsc-&gt;mount_state) &gt;= CEPH_MOUNT_SHUTDOWN) {</div><div class='del'>-		pr_warn_ratelimited("invalidate_pages %p %lld forced umount\n",</div><div class='del'>-				    inode, ceph_ino(inode));</div><div class='add'>+	if (ceph_inode_is_shutdown(inode)) {</div><div class='add'>+		pr_warn_ratelimited_client(cl,</div><div class='add'>+			"%p %llx.%llx is shut down\n", inode,</div><div class='add'>+			ceph_vinop(inode));</div><div class='ctx'> 		mapping_set_error(inode-&gt;i_mapping, -EIO);</div><div class='ctx'> 		truncate_pagecache(inode, 0);</div><div class='ctx'> 		mutex_unlock(&amp;ci-&gt;i_truncate_mutex);</div><div class='hunk'>@@ -1857,8 +2214,8 @@ static void ceph_do_invalidate_pages(struct inode *inode)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-	dout("invalidate_pages %p gen %d revoking %d\n", inode,</div><div class='del'>-	     ci-&gt;i_rdcache_gen, ci-&gt;i_rdcache_revoking);</div><div class='add'>+	doutc(cl, "%p %llx.%llx gen %d revoking %d\n", inode,</div><div class='add'>+	      ceph_vinop(inode), ci-&gt;i_rdcache_gen, ci-&gt;i_rdcache_revoking);</div><div class='ctx'> 	if (ci-&gt;i_rdcache_revoking != ci-&gt;i_rdcache_gen) {</div><div class='ctx'> 		if (__ceph_caps_revoking_other(ci, NULL, CEPH_CAP_FILE_CACHE))</div><div class='ctx'> 			check = 1;</div><div class='hunk'>@@ -1869,22 +2226,22 @@ static void ceph_do_invalidate_pages(struct inode *inode)</div><div class='ctx'> 	orig_gen = ci-&gt;i_rdcache_gen;</div><div class='ctx'> 	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> </div><div class='del'>-	ceph_fscache_invalidate(inode);</div><div class='ctx'> 	if (invalidate_inode_pages2(inode-&gt;i_mapping) &lt; 0) {</div><div class='del'>-		pr_err("invalidate_pages %p fails\n", inode);</div><div class='add'>+		pr_err_client(cl, "invalidate_inode_pages2 %llx.%llx failed\n",</div><div class='add'>+			      ceph_vinop(inode));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 	if (orig_gen == ci-&gt;i_rdcache_gen &amp;&amp;</div><div class='ctx'> 	    orig_gen == ci-&gt;i_rdcache_revoking) {</div><div class='del'>-		dout("invalidate_pages %p gen %d successful\n", inode,</div><div class='del'>-		     ci-&gt;i_rdcache_gen);</div><div class='add'>+		doutc(cl, "%p %llx.%llx gen %d successful\n", inode,</div><div class='add'>+		      ceph_vinop(inode), ci-&gt;i_rdcache_gen);</div><div class='ctx'> 		ci-&gt;i_rdcache_revoking--;</div><div class='ctx'> 		check = 1;</div><div class='ctx'> 	} else {</div><div class='del'>-		dout("invalidate_pages %p gen %d raced, now %d revoking %d\n",</div><div class='del'>-		     inode, orig_gen, ci-&gt;i_rdcache_gen,</div><div class='del'>-		     ci-&gt;i_rdcache_revoking);</div><div class='add'>+		doutc(cl, "%p %llx.%llx gen %d raced, now %d revoking %d\n",</div><div class='add'>+		      inode, ceph_vinop(inode), orig_gen, ci-&gt;i_rdcache_gen,</div><div class='add'>+		      ci-&gt;i_rdcache_revoking);</div><div class='ctx'> 		if (__ceph_caps_revoking_other(ci, NULL, CEPH_CAP_FILE_CACHE))</div><div class='ctx'> 			check = 1;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1892,7 +2249,7 @@ static void ceph_do_invalidate_pages(struct inode *inode)</div><div class='ctx'> 	mutex_unlock(&amp;ci-&gt;i_truncate_mutex);</div><div class='ctx'> out:</div><div class='ctx'> 	if (check)</div><div class='del'>-		ceph_check_caps(ci, 0, NULL);</div><div class='add'>+		ceph_check_caps(ci, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1901,6 +2258,7 @@ out:</div><div class='ctx'>  */</div><div class='ctx'> void __ceph_do_pending_vmtruncate(struct inode *inode)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	u64 to;</div><div class='ctx'> 	int wrbuffer_refs, finish = 0;</div><div class='hunk'>@@ -1909,7 +2267,8 @@ void __ceph_do_pending_vmtruncate(struct inode *inode)</div><div class='ctx'> retry:</div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 	if (ci-&gt;i_truncate_pending == 0) {</div><div class='del'>-		dout("__do_pending_vmtruncate %p none pending\n", inode);</div><div class='add'>+		doutc(cl, "%p %llx.%llx none pending\n", inode,</div><div class='add'>+		      ceph_vinop(inode));</div><div class='ctx'> 		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 		mutex_unlock(&amp;ci-&gt;i_truncate_mutex);</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -1921,8 +2280,8 @@ retry:</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (ci-&gt;i_wrbuffer_ref_head &lt; ci-&gt;i_wrbuffer_ref) {</div><div class='ctx'> 		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-		dout("__do_pending_vmtruncate %p flushing snaps first\n",</div><div class='del'>-		     inode);</div><div class='add'>+		doutc(cl, "%p %llx.%llx flushing snaps first\n", inode,</div><div class='add'>+		      ceph_vinop(inode));</div><div class='ctx'> 		filemap_write_and_wait_range(&amp;inode-&gt;i_data, 0,</div><div class='ctx'> 					     inode-&gt;i_sb-&gt;s_maxbytes);</div><div class='ctx'> 		goto retry;</div><div class='hunk'>@@ -1931,16 +2290,17 @@ retry:</div><div class='ctx'> 	/* there should be no reader or writer */</div><div class='ctx'> 	WARN_ON_ONCE(ci-&gt;i_rd_ref || ci-&gt;i_wr_ref);</div><div class='ctx'> </div><div class='del'>-	to = ci-&gt;i_truncate_size;</div><div class='add'>+	to = ci-&gt;i_truncate_pagecache_size;</div><div class='ctx'> 	wrbuffer_refs = ci-&gt;i_wrbuffer_ref;</div><div class='del'>-	dout("__do_pending_vmtruncate %p (%d) to %lld\n", inode,</div><div class='del'>-	     ci-&gt;i_truncate_pending, to);</div><div class='add'>+	doutc(cl, "%p %llx.%llx (%d) to %lld\n", inode, ceph_vinop(inode),</div><div class='add'>+	      ci-&gt;i_truncate_pending, to);</div><div class='ctx'> 	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> </div><div class='add'>+	ceph_fscache_resize(inode, to);</div><div class='ctx'> 	truncate_pagecache(inode, to);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-	if (to == ci-&gt;i_truncate_size) {</div><div class='add'>+	if (to == ci-&gt;i_truncate_pagecache_size) {</div><div class='ctx'> 		ci-&gt;i_truncate_pending = 0;</div><div class='ctx'> 		finish = 1;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1951,7 +2311,7 @@ retry:</div><div class='ctx'> 	mutex_unlock(&amp;ci-&gt;i_truncate_mutex);</div><div class='ctx'> </div><div class='ctx'> 	if (wrbuffer_refs == 0)</div><div class='del'>-		ceph_check_caps(ci, 0, NULL);</div><div class='add'>+		ceph_check_caps(ci, 0);</div><div class='ctx'> </div><div class='ctx'> 	wake_up_all(&amp;ci-&gt;i_cap_wq);</div><div class='ctx'> }</div><div class='hunk'>@@ -1960,10 +2320,11 @@ static void ceph_inode_work(struct work_struct *work)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_inode_info *ci = container_of(work, struct ceph_inode_info,</div><div class='ctx'> 						 i_work);</div><div class='del'>-	struct inode *inode = &amp;ci-&gt;vfs_inode;</div><div class='add'>+	struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (test_and_clear_bit(CEPH_I_WORK_WRITEBACK, &amp;ci-&gt;i_work_mask)) {</div><div class='del'>-		dout("writeback %p\n", inode);</div><div class='add'>+		doutc(cl, "writeback %p %llx.%llx\n", inode, ceph_vinop(inode));</div><div class='ctx'> 		filemap_fdatawrite(&amp;inode-&gt;i_data);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (test_and_clear_bit(CEPH_I_WORK_INVALIDATE_PAGES, &amp;ci-&gt;i_work_mask))</div><div class='hunk'>@@ -1973,7 +2334,7 @@ static void ceph_inode_work(struct work_struct *work)</div><div class='ctx'> 		__ceph_do_pending_vmtruncate(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (test_and_clear_bit(CEPH_I_WORK_CHECK_CAPS, &amp;ci-&gt;i_work_mask))</div><div class='del'>-		ceph_check_caps(ci, 0, NULL);</div><div class='add'>+		ceph_check_caps(ci, 0);</div><div class='ctx'> </div><div class='ctx'> 	if (test_and_clear_bit(CEPH_I_WORK_FLUSH_SNAPS, &amp;ci-&gt;i_work_mask))</div><div class='ctx'> 		ceph_flush_snaps(ci, NULL);</div><div class='hunk'>@@ -1981,6 +2342,32 @@ static void ceph_inode_work(struct work_struct *work)</div><div class='ctx'> 	iput(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static const char *ceph_encrypted_get_link(struct dentry *dentry,</div><div class='add'>+					   struct inode *inode,</div><div class='add'>+					   struct delayed_call *done)</div><div class='add'>+{</div><div class='add'>+	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+</div><div class='add'>+	if (!dentry)</div><div class='add'>+		return ERR_PTR(-ECHILD);</div><div class='add'>+</div><div class='add'>+	return fscrypt_get_symlink(inode, ci-&gt;i_symlink, i_size_read(inode),</div><div class='add'>+				   done);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ceph_encrypted_symlink_getattr(struct mnt_idmap *idmap,</div><div class='add'>+					  const struct path *path,</div><div class='add'>+					  struct kstat *stat, u32 request_mask,</div><div class='add'>+					  unsigned int query_flags)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = ceph_getattr(idmap, path, stat, request_mask, query_flags);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+	return fscrypt_symlink_getattr(path, stat);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * symlinks</div><div class='ctx'>  */</div><div class='hunk'>@@ -1991,20 +2378,200 @@ static const struct inode_operations ceph_symlink_iops = {</div><div class='ctx'> 	.listxattr = ceph_listxattr,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-int __ceph_setattr(struct inode *inode, struct iattr *attr)</div><div class='add'>+static const struct inode_operations ceph_encrypted_symlink_iops = {</div><div class='add'>+	.get_link = ceph_encrypted_get_link,</div><div class='add'>+	.setattr = ceph_setattr,</div><div class='add'>+	.getattr = ceph_encrypted_symlink_getattr,</div><div class='add'>+	.listxattr = ceph_listxattr,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Transfer the encrypted last block to the MDS and the MDS</div><div class='add'>+ * will help update it when truncating a smaller size.</div><div class='add'>+ *</div><div class='add'>+ * We don't support a PAGE_SIZE that is smaller than the</div><div class='add'>+ * CEPH_FSCRYPT_BLOCK_SIZE.</div><div class='add'>+ */</div><div class='add'>+static int fill_fscrypt_truncate(struct inode *inode,</div><div class='add'>+				 struct ceph_mds_request *req,</div><div class='add'>+				 struct iattr *attr)</div><div class='add'>+{</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='add'>+	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	int boff = attr-&gt;ia_size % CEPH_FSCRYPT_BLOCK_SIZE;</div><div class='add'>+	loff_t pos, orig_pos = round_down(attr-&gt;ia_size,</div><div class='add'>+					  CEPH_FSCRYPT_BLOCK_SIZE);</div><div class='add'>+	u64 block = orig_pos &gt;&gt; CEPH_FSCRYPT_BLOCK_SHIFT;</div><div class='add'>+	struct ceph_pagelist *pagelist = NULL;</div><div class='add'>+	struct kvec iov = {0};</div><div class='add'>+	struct iov_iter iter;</div><div class='add'>+	struct page *page = NULL;</div><div class='add'>+	struct ceph_fscrypt_truncate_size_header header;</div><div class='add'>+	int retry_op = 0;</div><div class='add'>+	int len = CEPH_FSCRYPT_BLOCK_SIZE;</div><div class='add'>+	loff_t i_size = i_size_read(inode);</div><div class='add'>+	int got, ret, issued;</div><div class='add'>+	u64 objver;</div><div class='add'>+</div><div class='add'>+	ret = __ceph_get_caps(inode, NULL, CEPH_CAP_FILE_RD, 0, -1, &amp;got);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	issued = __ceph_caps_issued(ci, NULL);</div><div class='add'>+</div><div class='add'>+	doutc(cl, "size %lld -&gt; %lld got cap refs on %s, issued %s\n",</div><div class='add'>+	      i_size, attr-&gt;ia_size, ceph_cap_string(got),</div><div class='add'>+	      ceph_cap_string(issued));</div><div class='add'>+</div><div class='add'>+	/* Try to writeback the dirty pagecaches */</div><div class='add'>+	if (issued &amp; (CEPH_CAP_FILE_BUFFER)) {</div><div class='add'>+		loff_t lend = orig_pos + CEPH_FSCRYPT_BLOCK_SIZE - 1;</div><div class='add'>+</div><div class='add'>+		ret = filemap_write_and_wait_range(inode-&gt;i_mapping,</div><div class='add'>+						   orig_pos, lend);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	page = __page_cache_alloc(GFP_KERNEL);</div><div class='add'>+	if (page == NULL) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	pagelist = ceph_pagelist_alloc(GFP_KERNEL);</div><div class='add'>+	if (!pagelist) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	iov.iov_base = kmap_local_page(page);</div><div class='add'>+	iov.iov_len = len;</div><div class='add'>+	iov_iter_kvec(&amp;iter, READ, &amp;iov, 1, len);</div><div class='add'>+</div><div class='add'>+	pos = orig_pos;</div><div class='add'>+	ret = __ceph_sync_read(inode, &amp;pos, &amp;iter, &amp;retry_op, &amp;objver);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	/* Insert the header first */</div><div class='add'>+	header.ver = 1;</div><div class='add'>+	header.compat = 1;</div><div class='add'>+	header.change_attr = cpu_to_le64(inode_peek_iversion_raw(inode));</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Always set the block_size to CEPH_FSCRYPT_BLOCK_SIZE,</div><div class='add'>+	 * because in MDS it may need this to do the truncate.</div><div class='add'>+	 */</div><div class='add'>+	header.block_size = cpu_to_le32(CEPH_FSCRYPT_BLOCK_SIZE);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If we hit a hole here, we should just skip filling</div><div class='add'>+	 * the fscrypt for the request, because once the fscrypt</div><div class='add'>+	 * is enabled, the file will be split into many blocks</div><div class='add'>+	 * with the size of CEPH_FSCRYPT_BLOCK_SIZE, if there</div><div class='add'>+	 * has a hole, the hole size should be multiple of block</div><div class='add'>+	 * size.</div><div class='add'>+	 *</div><div class='add'>+	 * If the Rados object doesn't exist, it will be set to 0.</div><div class='add'>+	 */</div><div class='add'>+	if (!objver) {</div><div class='add'>+		doutc(cl, "hit hole, ppos %lld &lt; size %lld\n", pos, i_size);</div><div class='add'>+</div><div class='add'>+		header.data_len = cpu_to_le32(8 + 8 + 4);</div><div class='add'>+		header.file_offset = 0;</div><div class='add'>+		ret = 0;</div><div class='add'>+	} else {</div><div class='add'>+		header.data_len = cpu_to_le32(8 + 8 + 4 + CEPH_FSCRYPT_BLOCK_SIZE);</div><div class='add'>+		header.file_offset = cpu_to_le64(orig_pos);</div><div class='add'>+</div><div class='add'>+		doutc(cl, "encrypt block boff/bsize %d/%lu\n", boff,</div><div class='add'>+		      CEPH_FSCRYPT_BLOCK_SIZE);</div><div class='add'>+</div><div class='add'>+		/* truncate and zero out the extra contents for the last block */</div><div class='add'>+		memset(iov.iov_base + boff, 0, PAGE_SIZE - boff);</div><div class='add'>+</div><div class='add'>+		/* encrypt the last block */</div><div class='add'>+		ret = ceph_fscrypt_encrypt_block_inplace(inode, page,</div><div class='add'>+						    CEPH_FSCRYPT_BLOCK_SIZE,</div><div class='add'>+						    0, block);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Insert the header */</div><div class='add'>+	ret = ceph_pagelist_append(pagelist, &amp;header, sizeof(header));</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	if (header.block_size) {</div><div class='add'>+		/* Append the last block contents to pagelist */</div><div class='add'>+		ret = ceph_pagelist_append(pagelist, iov.iov_base,</div><div class='add'>+					   CEPH_FSCRYPT_BLOCK_SIZE);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='add'>+	req-&gt;r_pagelist = pagelist;</div><div class='add'>+out:</div><div class='add'>+	doutc(cl, "%p %llx.%llx size dropping cap refs on %s\n", inode,</div><div class='add'>+	      ceph_vinop(inode), ceph_cap_string(got));</div><div class='add'>+	ceph_put_cap_refs(ci, got);</div><div class='add'>+	if (iov.iov_base)</div><div class='add'>+		kunmap_local(iov.iov_base);</div><div class='add'>+	if (page)</div><div class='add'>+		__free_pages(page, 0);</div><div class='add'>+	if (ret &amp;&amp; pagelist)</div><div class='add'>+		ceph_pagelist_release(pagelist);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int __ceph_setattr(struct mnt_idmap *idmap, struct inode *inode,</div><div class='add'>+		   struct iattr *attr, struct ceph_iattr *cia)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	unsigned int ia_valid = attr-&gt;ia_valid;</div><div class='ctx'> 	struct ceph_mds_request *req;</div><div class='del'>-	struct ceph_mds_client *mdsc = ceph_sb_to_client(inode-&gt;i_sb)-&gt;mdsc;</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_sb_to_fs_client(inode-&gt;i_sb)-&gt;mdsc;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_cap_flush *prealloc_cf;</div><div class='add'>+	loff_t isize = i_size_read(inode);</div><div class='ctx'> 	int issued;</div><div class='ctx'> 	int release = 0, dirtied = 0;</div><div class='ctx'> 	int mask = 0;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> 	int inode_dirty_flags = 0;</div><div class='ctx'> 	bool lock_snap_rwsem = false;</div><div class='add'>+	bool fill_fscrypt;</div><div class='add'>+	int truncate_retry = 20; /* The RMW will take around 50ms */</div><div class='add'>+	struct dentry *dentry;</div><div class='add'>+	char *path;</div><div class='add'>+	bool do_sync = false;</div><div class='add'>+</div><div class='add'>+	dentry = d_find_alias(inode);</div><div class='add'>+	if (!dentry) {</div><div class='add'>+		do_sync = true;</div><div class='add'>+	} else {</div><div class='add'>+		struct ceph_path_info path_info;</div><div class='add'>+		path = ceph_mdsc_build_path(mdsc, dentry, &amp;path_info, 0);</div><div class='add'>+		if (IS_ERR(path)) {</div><div class='add'>+			do_sync = true;</div><div class='add'>+			err = 0;</div><div class='add'>+		} else {</div><div class='add'>+			err = ceph_mds_check_access(mdsc, path, MAY_WRITE);</div><div class='add'>+		}</div><div class='add'>+		ceph_mdsc_free_path_info(&amp;path_info);</div><div class='add'>+		dput(dentry);</div><div class='add'>+</div><div class='add'>+		/* For none EACCES cases will let the MDS do the mds auth check */</div><div class='add'>+		if (err == -EACCES) {</div><div class='add'>+			return err;</div><div class='add'>+		} else if (err &lt; 0) {</div><div class='add'>+			do_sync = true;</div><div class='add'>+			err = 0;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='add'>+retry:</div><div class='ctx'> 	prealloc_cf = ceph_alloc_cap_flush();</div><div class='ctx'> 	if (!prealloc_cf)</div><div class='ctx'> 		return -ENOMEM;</div><div class='hunk'>@@ -2016,6 +2583,7 @@ int __ceph_setattr(struct inode *inode, struct iattr *attr)</div><div class='ctx'> 		return PTR_ERR(req);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	fill_fscrypt = false;</div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 	issued = __ceph_caps_issued(ci, NULL);</div><div class='ctx'> </div><div class='hunk'>@@ -2030,42 +2598,86 @@ int __ceph_setattr(struct inode *inode, struct iattr *attr)</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("setattr %p issued %s\n", inode, ceph_cap_string(issued));</div><div class='add'>+	doutc(cl, "%p %llx.%llx issued %s\n", inode, ceph_vinop(inode),</div><div class='add'>+	      ceph_cap_string(issued));</div><div class='add'>+#if IS_ENABLED(CONFIG_FS_ENCRYPTION)</div><div class='add'>+	if (cia &amp;&amp; cia-&gt;fscrypt_auth) {</div><div class='add'>+		u32 len = ceph_fscrypt_auth_len(cia-&gt;fscrypt_auth);</div><div class='add'>+</div><div class='add'>+		if (len &gt; sizeof(*cia-&gt;fscrypt_auth)) {</div><div class='add'>+			err = -EINVAL;</div><div class='add'>+			spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		doutc(cl, "%p %llx.%llx fscrypt_auth len %u to %u)\n", inode,</div><div class='add'>+		      ceph_vinop(inode), ci-&gt;fscrypt_auth_len, len);</div><div class='add'>+</div><div class='add'>+		/* It should never be re-set once set */</div><div class='add'>+		WARN_ON_ONCE(ci-&gt;fscrypt_auth);</div><div class='add'>+</div><div class='add'>+		if (!do_sync &amp;&amp; (issued &amp; CEPH_CAP_AUTH_EXCL)) {</div><div class='add'>+			dirtied |= CEPH_CAP_AUTH_EXCL;</div><div class='add'>+			kfree(ci-&gt;fscrypt_auth);</div><div class='add'>+			ci-&gt;fscrypt_auth = (u8 *)cia-&gt;fscrypt_auth;</div><div class='add'>+			ci-&gt;fscrypt_auth_len = len;</div><div class='add'>+		} else if ((issued &amp; CEPH_CAP_AUTH_SHARED) == 0 ||</div><div class='add'>+			   ci-&gt;fscrypt_auth_len != len ||</div><div class='add'>+			   memcmp(ci-&gt;fscrypt_auth, cia-&gt;fscrypt_auth, len)) {</div><div class='add'>+			req-&gt;r_fscrypt_auth = cia-&gt;fscrypt_auth;</div><div class='add'>+			mask |= CEPH_SETATTR_FSCRYPT_AUTH;</div><div class='add'>+			release |= CEPH_CAP_AUTH_SHARED;</div><div class='add'>+		}</div><div class='add'>+		cia-&gt;fscrypt_auth = NULL;</div><div class='add'>+	}</div><div class='add'>+#else</div><div class='add'>+	if (cia &amp;&amp; cia-&gt;fscrypt_auth) {</div><div class='add'>+		err = -EINVAL;</div><div class='add'>+		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+#endif /* CONFIG_FS_ENCRYPTION */</div><div class='ctx'> </div><div class='ctx'> 	if (ia_valid &amp; ATTR_UID) {</div><div class='del'>-		dout("setattr %p uid %d -&gt; %d\n", inode,</div><div class='del'>-		     from_kuid(&amp;init_user_ns, inode-&gt;i_uid),</div><div class='del'>-		     from_kuid(&amp;init_user_ns, attr-&gt;ia_uid));</div><div class='del'>-		if (issued &amp; CEPH_CAP_AUTH_EXCL) {</div><div class='del'>-			inode-&gt;i_uid = attr-&gt;ia_uid;</div><div class='add'>+		kuid_t fsuid = from_vfsuid(idmap, i_user_ns(inode), attr-&gt;ia_vfsuid);</div><div class='add'>+</div><div class='add'>+		doutc(cl, "%p %llx.%llx uid %d -&gt; %d\n", inode,</div><div class='add'>+		      ceph_vinop(inode),</div><div class='add'>+		      from_kuid(&amp;init_user_ns, inode-&gt;i_uid),</div><div class='add'>+		      from_kuid(&amp;init_user_ns, attr-&gt;ia_uid));</div><div class='add'>+		if (!do_sync &amp;&amp; (issued &amp; CEPH_CAP_AUTH_EXCL)) {</div><div class='add'>+			inode-&gt;i_uid = fsuid;</div><div class='ctx'> 			dirtied |= CEPH_CAP_AUTH_EXCL;</div><div class='ctx'> 		} else if ((issued &amp; CEPH_CAP_AUTH_SHARED) == 0 ||</div><div class='del'>-			   !uid_eq(attr-&gt;ia_uid, inode-&gt;i_uid)) {</div><div class='add'>+			   !uid_eq(fsuid, inode-&gt;i_uid)) {</div><div class='ctx'> 			req-&gt;r_args.setattr.uid = cpu_to_le32(</div><div class='del'>-				from_kuid(&amp;init_user_ns, attr-&gt;ia_uid));</div><div class='add'>+				from_kuid(&amp;init_user_ns, fsuid));</div><div class='ctx'> 			mask |= CEPH_SETATTR_UID;</div><div class='ctx'> 			release |= CEPH_CAP_AUTH_SHARED;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	if (ia_valid &amp; ATTR_GID) {</div><div class='del'>-		dout("setattr %p gid %d -&gt; %d\n", inode,</div><div class='del'>-		     from_kgid(&amp;init_user_ns, inode-&gt;i_gid),</div><div class='del'>-		     from_kgid(&amp;init_user_ns, attr-&gt;ia_gid));</div><div class='del'>-		if (issued &amp; CEPH_CAP_AUTH_EXCL) {</div><div class='del'>-			inode-&gt;i_gid = attr-&gt;ia_gid;</div><div class='add'>+		kgid_t fsgid = from_vfsgid(idmap, i_user_ns(inode), attr-&gt;ia_vfsgid);</div><div class='add'>+</div><div class='add'>+		doutc(cl, "%p %llx.%llx gid %d -&gt; %d\n", inode,</div><div class='add'>+		      ceph_vinop(inode),</div><div class='add'>+		      from_kgid(&amp;init_user_ns, inode-&gt;i_gid),</div><div class='add'>+		      from_kgid(&amp;init_user_ns, attr-&gt;ia_gid));</div><div class='add'>+		if (!do_sync &amp;&amp; (issued &amp; CEPH_CAP_AUTH_EXCL)) {</div><div class='add'>+			inode-&gt;i_gid = fsgid;</div><div class='ctx'> 			dirtied |= CEPH_CAP_AUTH_EXCL;</div><div class='ctx'> 		} else if ((issued &amp; CEPH_CAP_AUTH_SHARED) == 0 ||</div><div class='del'>-			   !gid_eq(attr-&gt;ia_gid, inode-&gt;i_gid)) {</div><div class='add'>+			   !gid_eq(fsgid, inode-&gt;i_gid)) {</div><div class='ctx'> 			req-&gt;r_args.setattr.gid = cpu_to_le32(</div><div class='del'>-				from_kgid(&amp;init_user_ns, attr-&gt;ia_gid));</div><div class='add'>+				from_kgid(&amp;init_user_ns, fsgid));</div><div class='ctx'> 			mask |= CEPH_SETATTR_GID;</div><div class='ctx'> 			release |= CEPH_CAP_AUTH_SHARED;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	if (ia_valid &amp; ATTR_MODE) {</div><div class='del'>-		dout("setattr %p mode 0%o -&gt; 0%o\n", inode, inode-&gt;i_mode,</div><div class='del'>-		     attr-&gt;ia_mode);</div><div class='del'>-		if (issued &amp; CEPH_CAP_AUTH_EXCL) {</div><div class='add'>+		doutc(cl, "%p %llx.%llx mode 0%o -&gt; 0%o\n", inode,</div><div class='add'>+		      ceph_vinop(inode), inode-&gt;i_mode, attr-&gt;ia_mode);</div><div class='add'>+		if (!do_sync &amp;&amp; (issued &amp; CEPH_CAP_AUTH_EXCL)) {</div><div class='ctx'> 			inode-&gt;i_mode = attr-&gt;ia_mode;</div><div class='ctx'> 			dirtied |= CEPH_CAP_AUTH_EXCL;</div><div class='ctx'> 		} else if ((issued &amp; CEPH_CAP_AUTH_SHARED) == 0 ||</div><div class='hunk'>@@ -2078,20 +2690,21 @@ int __ceph_setattr(struct inode *inode, struct iattr *attr)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (ia_valid &amp; ATTR_ATIME) {</div><div class='del'>-		dout("setattr %p atime %lld.%ld -&gt; %lld.%ld\n", inode,</div><div class='del'>-		     inode-&gt;i_atime.tv_sec, inode-&gt;i_atime.tv_nsec,</div><div class='del'>-		     attr-&gt;ia_atime.tv_sec, attr-&gt;ia_atime.tv_nsec);</div><div class='del'>-		if (issued &amp; CEPH_CAP_FILE_EXCL) {</div><div class='add'>+		struct timespec64 atime = inode_get_atime(inode);</div><div class='add'>+</div><div class='add'>+		doutc(cl, "%p %llx.%llx atime %ptSp -&gt; %ptSp\n",</div><div class='add'>+		      inode, ceph_vinop(inode), &amp;atime, &amp;attr-&gt;ia_atime);</div><div class='add'>+		if (!do_sync &amp;&amp; (issued &amp; CEPH_CAP_FILE_EXCL)) {</div><div class='ctx'> 			ci-&gt;i_time_warp_seq++;</div><div class='del'>-			inode-&gt;i_atime = attr-&gt;ia_atime;</div><div class='add'>+			inode_set_atime_to_ts(inode, attr-&gt;ia_atime);</div><div class='ctx'> 			dirtied |= CEPH_CAP_FILE_EXCL;</div><div class='del'>-		} else if ((issued &amp; CEPH_CAP_FILE_WR) &amp;&amp;</div><div class='del'>-			   timespec64_compare(&amp;inode-&gt;i_atime,</div><div class='del'>-					    &amp;attr-&gt;ia_atime) &lt; 0) {</div><div class='del'>-			inode-&gt;i_atime = attr-&gt;ia_atime;</div><div class='add'>+		} else if (!do_sync &amp;&amp; (issued &amp; CEPH_CAP_FILE_WR) &amp;&amp;</div><div class='add'>+			   timespec64_compare(&amp;atime,</div><div class='add'>+					      &amp;attr-&gt;ia_atime) &lt; 0) {</div><div class='add'>+			inode_set_atime_to_ts(inode, attr-&gt;ia_atime);</div><div class='ctx'> 			dirtied |= CEPH_CAP_FILE_WR;</div><div class='ctx'> 		} else if ((issued &amp; CEPH_CAP_FILE_SHARED) == 0 ||</div><div class='del'>-			   !timespec64_equal(&amp;inode-&gt;i_atime, &amp;attr-&gt;ia_atime)) {</div><div class='add'>+			   !timespec64_equal(&amp;atime, &amp;attr-&gt;ia_atime)) {</div><div class='ctx'> 			ceph_encode_timespec64(&amp;req-&gt;r_args.setattr.atime,</div><div class='ctx'> 					       &amp;attr-&gt;ia_atime);</div><div class='ctx'> 			mask |= CEPH_SETATTR_ATIME;</div><div class='hunk'>@@ -2100,39 +2713,72 @@ int __ceph_setattr(struct inode *inode, struct iattr *attr)</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	if (ia_valid &amp; ATTR_SIZE) {</div><div class='del'>-		loff_t isize = i_size_read(inode);</div><div class='del'>-</div><div class='del'>-		dout("setattr %p size %lld -&gt; %lld\n", inode, isize, attr-&gt;ia_size);</div><div class='del'>-		if ((issued &amp; CEPH_CAP_FILE_EXCL) &amp;&amp; attr-&gt;ia_size &gt; isize) {</div><div class='del'>-			i_size_write(inode, attr-&gt;ia_size);</div><div class='del'>-			inode-&gt;i_blocks = calc_inode_blocks(attr-&gt;ia_size);</div><div class='del'>-			ci-&gt;i_reported_size = attr-&gt;ia_size;</div><div class='del'>-			dirtied |= CEPH_CAP_FILE_EXCL;</div><div class='del'>-			ia_valid |= ATTR_MTIME;</div><div class='add'>+		doutc(cl, "%p %llx.%llx size %lld -&gt; %lld\n", inode,</div><div class='add'>+		      ceph_vinop(inode), isize, attr-&gt;ia_size);</div><div class='add'>+		/*</div><div class='add'>+		 * Only when the new size is smaller and not aligned to</div><div class='add'>+		 * CEPH_FSCRYPT_BLOCK_SIZE will the RMW is needed.</div><div class='add'>+		 */</div><div class='add'>+		if (IS_ENCRYPTED(inode) &amp;&amp; attr-&gt;ia_size &lt; isize &amp;&amp;</div><div class='add'>+		    (attr-&gt;ia_size % CEPH_FSCRYPT_BLOCK_SIZE)) {</div><div class='add'>+			mask |= CEPH_SETATTR_SIZE;</div><div class='add'>+			release |= CEPH_CAP_FILE_SHARED | CEPH_CAP_FILE_EXCL |</div><div class='add'>+				   CEPH_CAP_FILE_RD | CEPH_CAP_FILE_WR;</div><div class='add'>+			set_bit(CEPH_MDS_R_FSCRYPT_FILE, &amp;req-&gt;r_req_flags);</div><div class='add'>+			mask |= CEPH_SETATTR_FSCRYPT_FILE;</div><div class='add'>+			req-&gt;r_args.setattr.size =</div><div class='add'>+				cpu_to_le64(round_up(attr-&gt;ia_size,</div><div class='add'>+						     CEPH_FSCRYPT_BLOCK_SIZE));</div><div class='add'>+			req-&gt;r_args.setattr.old_size =</div><div class='add'>+				cpu_to_le64(round_up(isize,</div><div class='add'>+						     CEPH_FSCRYPT_BLOCK_SIZE));</div><div class='add'>+			req-&gt;r_fscrypt_file = attr-&gt;ia_size;</div><div class='add'>+			fill_fscrypt = true;</div><div class='add'>+		} else if (!do_sync &amp;&amp; (issued &amp; CEPH_CAP_FILE_EXCL) &amp;&amp; attr-&gt;ia_size &gt;= isize) {</div><div class='add'>+			if (attr-&gt;ia_size &gt; isize) {</div><div class='add'>+				i_size_write(inode, attr-&gt;ia_size);</div><div class='add'>+				inode-&gt;i_blocks = calc_inode_blocks(attr-&gt;ia_size);</div><div class='add'>+				ci-&gt;i_reported_size = attr-&gt;ia_size;</div><div class='add'>+				dirtied |= CEPH_CAP_FILE_EXCL;</div><div class='add'>+				ia_valid |= ATTR_MTIME;</div><div class='add'>+			}</div><div class='ctx'> 		} else if ((issued &amp; CEPH_CAP_FILE_SHARED) == 0 ||</div><div class='ctx'> 			   attr-&gt;ia_size != isize) {</div><div class='del'>-			req-&gt;r_args.setattr.size = cpu_to_le64(attr-&gt;ia_size);</div><div class='del'>-			req-&gt;r_args.setattr.old_size = cpu_to_le64(isize);</div><div class='ctx'> 			mask |= CEPH_SETATTR_SIZE;</div><div class='ctx'> 			release |= CEPH_CAP_FILE_SHARED | CEPH_CAP_FILE_EXCL |</div><div class='ctx'> 				   CEPH_CAP_FILE_RD | CEPH_CAP_FILE_WR;</div><div class='add'>+			if (IS_ENCRYPTED(inode) &amp;&amp; attr-&gt;ia_size) {</div><div class='add'>+				set_bit(CEPH_MDS_R_FSCRYPT_FILE, &amp;req-&gt;r_req_flags);</div><div class='add'>+				mask |= CEPH_SETATTR_FSCRYPT_FILE;</div><div class='add'>+				req-&gt;r_args.setattr.size =</div><div class='add'>+					cpu_to_le64(round_up(attr-&gt;ia_size,</div><div class='add'>+							     CEPH_FSCRYPT_BLOCK_SIZE));</div><div class='add'>+				req-&gt;r_args.setattr.old_size =</div><div class='add'>+					cpu_to_le64(round_up(isize,</div><div class='add'>+							     CEPH_FSCRYPT_BLOCK_SIZE));</div><div class='add'>+				req-&gt;r_fscrypt_file = attr-&gt;ia_size;</div><div class='add'>+			} else {</div><div class='add'>+				req-&gt;r_args.setattr.size = cpu_to_le64(attr-&gt;ia_size);</div><div class='add'>+				req-&gt;r_args.setattr.old_size = cpu_to_le64(isize);</div><div class='add'>+				req-&gt;r_fscrypt_file = 0;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	if (ia_valid &amp; ATTR_MTIME) {</div><div class='del'>-		dout("setattr %p mtime %lld.%ld -&gt; %lld.%ld\n", inode,</div><div class='del'>-		     inode-&gt;i_mtime.tv_sec, inode-&gt;i_mtime.tv_nsec,</div><div class='del'>-		     attr-&gt;ia_mtime.tv_sec, attr-&gt;ia_mtime.tv_nsec);</div><div class='del'>-		if (issued &amp; CEPH_CAP_FILE_EXCL) {</div><div class='add'>+		struct timespec64 mtime = inode_get_mtime(inode);</div><div class='add'>+</div><div class='add'>+		doutc(cl, "%p %llx.%llx mtime %ptSp -&gt; %ptSp\n",</div><div class='add'>+		      inode, ceph_vinop(inode), &amp;mtime, &amp;attr-&gt;ia_mtime);</div><div class='add'>+		if (!do_sync &amp;&amp; (issued &amp; CEPH_CAP_FILE_EXCL)) {</div><div class='ctx'> 			ci-&gt;i_time_warp_seq++;</div><div class='del'>-			inode-&gt;i_mtime = attr-&gt;ia_mtime;</div><div class='add'>+			inode_set_mtime_to_ts(inode, attr-&gt;ia_mtime);</div><div class='ctx'> 			dirtied |= CEPH_CAP_FILE_EXCL;</div><div class='del'>-		} else if ((issued &amp; CEPH_CAP_FILE_WR) &amp;&amp;</div><div class='del'>-			   timespec64_compare(&amp;inode-&gt;i_mtime,</div><div class='del'>-					    &amp;attr-&gt;ia_mtime) &lt; 0) {</div><div class='del'>-			inode-&gt;i_mtime = attr-&gt;ia_mtime;</div><div class='add'>+		} else if (!do_sync &amp;&amp; (issued &amp; CEPH_CAP_FILE_WR) &amp;&amp;</div><div class='add'>+			   timespec64_compare(&amp;mtime, &amp;attr-&gt;ia_mtime) &lt; 0) {</div><div class='add'>+			inode_set_mtime_to_ts(inode, attr-&gt;ia_mtime);</div><div class='ctx'> 			dirtied |= CEPH_CAP_FILE_WR;</div><div class='ctx'> 		} else if ((issued &amp; CEPH_CAP_FILE_SHARED) == 0 ||</div><div class='del'>-			   !timespec64_equal(&amp;inode-&gt;i_mtime, &amp;attr-&gt;ia_mtime)) {</div><div class='add'>+			   !timespec64_equal(&amp;mtime, &amp;attr-&gt;ia_mtime)) {</div><div class='ctx'> 			ceph_encode_timespec64(&amp;req-&gt;r_args.setattr.mtime,</div><div class='ctx'> 					       &amp;attr-&gt;ia_mtime);</div><div class='ctx'> 			mask |= CEPH_SETATTR_MTIME;</div><div class='hunk'>@@ -2143,12 +2789,12 @@ int __ceph_setattr(struct inode *inode, struct iattr *attr)</div><div class='ctx'> </div><div class='ctx'> 	/* these do nothing */</div><div class='ctx'> 	if (ia_valid &amp; ATTR_CTIME) {</div><div class='add'>+		struct timespec64 ictime = inode_get_ctime(inode);</div><div class='ctx'> 		bool only = (ia_valid &amp; (ATTR_SIZE|ATTR_MTIME|ATTR_ATIME|</div><div class='ctx'> 					 ATTR_MODE|ATTR_UID|ATTR_GID)) == 0;</div><div class='del'>-		dout("setattr %p ctime %lld.%ld -&gt; %lld.%ld (%s)\n", inode,</div><div class='del'>-		     inode-&gt;i_ctime.tv_sec, inode-&gt;i_ctime.tv_nsec,</div><div class='del'>-		     attr-&gt;ia_ctime.tv_sec, attr-&gt;ia_ctime.tv_nsec,</div><div class='del'>-		     only ? "ctime only" : "ignored");</div><div class='add'>+		doutc(cl, "%p %llx.%llx ctime %ptSp -&gt; %ptSp (%s)\n",</div><div class='add'>+		      inode, ceph_vinop(inode), &amp;ictime, &amp;attr-&gt;ia_ctime,</div><div class='add'>+		      only ? "ctime only" : "ignored");</div><div class='ctx'> 		if (only) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * if kernel wants to dirty ctime but nothing else,</div><div class='hunk'>@@ -2166,23 +2812,26 @@ int __ceph_setattr(struct inode *inode, struct iattr *attr)</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	if (ia_valid &amp; ATTR_FILE)</div><div class='del'>-		dout("setattr %p ATTR_FILE ... hrm!\n", inode);</div><div class='add'>+		doutc(cl, "%p %llx.%llx ATTR_FILE ... hrm!\n", inode,</div><div class='add'>+		      ceph_vinop(inode));</div><div class='ctx'> </div><div class='ctx'> 	if (dirtied) {</div><div class='ctx'> 		inode_dirty_flags = __ceph_mark_dirty_caps(ci, dirtied,</div><div class='ctx'> 							   &amp;prealloc_cf);</div><div class='del'>-		inode-&gt;i_ctime = attr-&gt;ia_ctime;</div><div class='add'>+		inode_set_ctime_to_ts(inode, attr-&gt;ia_ctime);</div><div class='add'>+		inode_inc_iversion_raw(inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	release &amp;= issued;</div><div class='ctx'> 	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-	if (lock_snap_rwsem)</div><div class='add'>+	if (lock_snap_rwsem) {</div><div class='ctx'> 		up_read(&amp;mdsc-&gt;snap_rwsem);</div><div class='add'>+		lock_snap_rwsem = false;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (inode_dirty_flags)</div><div class='ctx'> 		__mark_inode_dirty(inode, inode_dirty_flags);</div><div class='ctx'> </div><div class='del'>-</div><div class='ctx'> 	if (mask) {</div><div class='ctx'> 		req-&gt;r_inode = inode;</div><div class='ctx'> 		ihold(inode);</div><div class='hunk'>@@ -2190,10 +2839,32 @@ int __ceph_setattr(struct inode *inode, struct iattr *attr)</div><div class='ctx'> 		req-&gt;r_args.setattr.mask = cpu_to_le32(mask);</div><div class='ctx'> 		req-&gt;r_num_caps = 1;</div><div class='ctx'> 		req-&gt;r_stamp = attr-&gt;ia_ctime;</div><div class='add'>+		if (fill_fscrypt) {</div><div class='add'>+			err = fill_fscrypt_truncate(inode, req, attr);</div><div class='add'>+			if (err)</div><div class='add'>+				goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * The truncate request will return -EAGAIN when the</div><div class='add'>+		 * last block has been updated just before the MDS</div><div class='add'>+		 * successfully gets the xlock for the FILE lock. To</div><div class='add'>+		 * avoid corrupting the file contents we need to retry</div><div class='add'>+		 * it.</div><div class='add'>+		 */</div><div class='ctx'> 		err = ceph_mdsc_do_request(mdsc, NULL, req);</div><div class='add'>+		if (err == -EAGAIN &amp;&amp; truncate_retry--) {</div><div class='add'>+			doutc(cl, "%p %llx.%llx result=%d (%s locally, %d remote), retry it!\n",</div><div class='add'>+			      inode, ceph_vinop(inode), err,</div><div class='add'>+			      ceph_cap_string(dirtied), mask);</div><div class='add'>+			ceph_mdsc_put_request(req);</div><div class='add'>+			ceph_free_cap_flush(prealloc_cf);</div><div class='add'>+			goto retry;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='del'>-	dout("setattr %p result=%d (%s locally, %d remote)\n", inode, err,</div><div class='del'>-	     ceph_cap_string(dirtied), mask);</div><div class='add'>+out:</div><div class='add'>+	doutc(cl, "%p %llx.%llx result=%d (%s locally, %d remote)\n", inode,</div><div class='add'>+	      ceph_vinop(inode), err, ceph_cap_string(dirtied), mask);</div><div class='ctx'> </div><div class='ctx'> 	ceph_mdsc_put_request(req);</div><div class='ctx'> 	ceph_free_cap_flush(prealloc_cf);</div><div class='hunk'>@@ -2207,17 +2878,24 @@ int __ceph_setattr(struct inode *inode, struct iattr *attr)</div><div class='ctx'> /*</div><div class='ctx'>  * setattr</div><div class='ctx'>  */</div><div class='del'>-int ceph_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='add'>+int ceph_setattr(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		 struct iattr *attr)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_inode_to_client(inode);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (ceph_snap(inode) != CEPH_NOSNAP)</div><div class='ctx'> 		return -EROFS;</div><div class='ctx'> </div><div class='del'>-	err = setattr_prepare(&amp;init_user_ns, dentry, attr);</div><div class='add'>+	if (ceph_inode_is_shutdown(inode))</div><div class='add'>+		return -ESTALE;</div><div class='add'>+</div><div class='add'>+	err = fscrypt_prepare_setattr(dentry, attr);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	err = setattr_prepare(idmap, dentry, attr);</div><div class='ctx'> 	if (err != 0)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='hunk'>@@ -2229,14 +2907,44 @@ int ceph_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 	    ceph_quota_is_max_bytes_exceeded(inode, attr-&gt;ia_size))</div><div class='ctx'> 		return -EDQUOT;</div><div class='ctx'> </div><div class='del'>-	err = __ceph_setattr(inode, attr);</div><div class='add'>+	err = __ceph_setattr(idmap, inode, attr, NULL);</div><div class='ctx'> </div><div class='ctx'> 	if (err &gt;= 0 &amp;&amp; (attr-&gt;ia_valid &amp; ATTR_MODE))</div><div class='del'>-		err = posix_acl_chmod(&amp;init_user_ns, inode, attr-&gt;ia_mode);</div><div class='add'>+		err = posix_acl_chmod(idmap, dentry, attr-&gt;ia_mode);</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+int ceph_try_to_choose_auth_mds(struct inode *inode, int mask)</div><div class='add'>+{</div><div class='add'>+	int issued = ceph_caps_issued(ceph_inode(inode));</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If any 'x' caps is issued we can just choose the auth MDS</div><div class='add'>+	 * instead of the random replica MDSes. Because only when the</div><div class='add'>+	 * Locker is in LOCK_EXEC state will the loner client could</div><div class='add'>+	 * get the 'x' caps. And if we send the getattr requests to</div><div class='add'>+	 * any replica MDS it must auth pin and tries to rdlock from</div><div class='add'>+	 * the auth MDS, and then the auth MDS need to do the Locker</div><div class='add'>+	 * state transition to LOCK_SYNC. And after that the lock state</div><div class='add'>+	 * will change back.</div><div class='add'>+	 *</div><div class='add'>+	 * This cost much when doing the Locker state transition and</div><div class='add'>+	 * usually will need to revoke caps from clients.</div><div class='add'>+	 *</div><div class='add'>+	 * And for the 'Xs' caps for getxattr we will also choose the</div><div class='add'>+	 * auth MDS, because the MDS side code is buggy due to setxattr</div><div class='add'>+	 * won't notify the replica MDSes when the values changed and</div><div class='add'>+	 * the replica MDS will return the old values. Though we will</div><div class='add'>+	 * fix it in MDS code, but this still makes sense for old ceph.</div><div class='add'>+	 */</div><div class='add'>+	if (((mask &amp; CEPH_CAP_ANY_SHARED) &amp;&amp; (issued &amp; CEPH_CAP_ANY_EXCL))</div><div class='add'>+	    || (mask &amp; (CEPH_STAT_RSTAT | CEPH_STAT_CAP_XATTR)))</div><div class='add'>+		return USE_AUTH_MDS;</div><div class='add'>+	else</div><div class='add'>+		return USE_ANY_MDS;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Verify that we have a lease on the given mask.  If not,</div><div class='ctx'>  * do a getattr against an mds.</div><div class='hunk'>@@ -2244,23 +2952,25 @@ int ceph_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> int __ceph_do_getattr(struct inode *inode, struct page *locked_page,</div><div class='ctx'> 		      int mask, bool force)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_sb_to_client(inode-&gt;i_sb);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_sb_to_fs_client(inode-&gt;i_sb);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='ctx'> 	struct ceph_mds_client *mdsc = fsc-&gt;mdsc;</div><div class='ctx'> 	struct ceph_mds_request *req;</div><div class='ctx'> 	int mode;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (ceph_snap(inode) == CEPH_SNAPDIR) {</div><div class='del'>-		dout("do_getattr inode %p SNAPDIR\n", inode);</div><div class='add'>+		doutc(cl, "inode %p %llx.%llx SNAPDIR\n", inode,</div><div class='add'>+		      ceph_vinop(inode));</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("do_getattr inode %p mask %s mode 0%o\n",</div><div class='del'>-	     inode, ceph_cap_string(mask), inode-&gt;i_mode);</div><div class='add'>+	doutc(cl, "inode %p %llx.%llx mask %s mode 0%o\n", inode,</div><div class='add'>+	      ceph_vinop(inode), ceph_cap_string(mask), inode-&gt;i_mode);</div><div class='ctx'> 	if (!force &amp;&amp; ceph_caps_issued_mask_metric(ceph_inode(inode), mask, 1))</div><div class='ctx'> 			return 0;</div><div class='ctx'> </div><div class='del'>-	mode = (mask &amp; CEPH_STAT_RSTAT) ? USE_AUTH_MDS : USE_ANY_MDS;</div><div class='add'>+	mode = ceph_try_to_choose_auth_mds(inode, mask);</div><div class='ctx'> 	req = ceph_mdsc_create_request(mdsc, CEPH_MDS_OP_GETATTR, mode);</div><div class='ctx'> 	if (IS_ERR(req))</div><div class='ctx'> 		return PTR_ERR(req);</div><div class='hunk'>@@ -2275,14 +2985,68 @@ int __ceph_do_getattr(struct inode *inode, struct page *locked_page,</div><div class='ctx'> 		if (inline_version == 0) {</div><div class='ctx'> 			/* the reply is supposed to contain inline data */</div><div class='ctx'> 			err = -EINVAL;</div><div class='del'>-		} else if (inline_version == CEPH_INLINE_NONE) {</div><div class='add'>+		} else if (inline_version == CEPH_INLINE_NONE ||</div><div class='add'>+			   inline_version == 1) {</div><div class='ctx'> 			err = -ENODATA;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			err = req-&gt;r_reply_info.targeti.inline_len;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	ceph_mdsc_put_request(req);</div><div class='del'>-	dout("do_getattr result=%d\n", err);</div><div class='add'>+	doutc(cl, "result=%d\n", err);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int ceph_do_getvxattr(struct inode *inode, const char *name, void *value,</div><div class='add'>+		      size_t size)</div><div class='add'>+{</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_sb_to_fs_client(inode-&gt;i_sb);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='add'>+	struct ceph_mds_client *mdsc = fsc-&gt;mdsc;</div><div class='add'>+	struct ceph_mds_request *req;</div><div class='add'>+	int mode = USE_AUTH_MDS;</div><div class='add'>+	int err;</div><div class='add'>+	char *xattr_value;</div><div class='add'>+	size_t xattr_value_len;</div><div class='add'>+</div><div class='add'>+	req = ceph_mdsc_create_request(mdsc, CEPH_MDS_OP_GETVXATTR, mode);</div><div class='add'>+	if (IS_ERR(req)) {</div><div class='add'>+		err = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	req-&gt;r_feature_needed = CEPHFS_FEATURE_OP_GETVXATTR;</div><div class='add'>+	req-&gt;r_path2 = kstrdup(name, GFP_NOFS);</div><div class='add'>+	if (!req-&gt;r_path2) {</div><div class='add'>+		err = -ENOMEM;</div><div class='add'>+		goto put;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ihold(inode);</div><div class='add'>+	req-&gt;r_inode = inode;</div><div class='add'>+	err = ceph_mdsc_do_request(mdsc, NULL, req);</div><div class='add'>+	if (err &lt; 0)</div><div class='add'>+		goto put;</div><div class='add'>+</div><div class='add'>+	xattr_value = req-&gt;r_reply_info.xattr_info.xattr_value;</div><div class='add'>+	xattr_value_len = req-&gt;r_reply_info.xattr_info.xattr_value_len;</div><div class='add'>+</div><div class='add'>+	doutc(cl, "xattr_value_len:%zu, size:%zu\n", xattr_value_len, size);</div><div class='add'>+</div><div class='add'>+	err = (int)xattr_value_len;</div><div class='add'>+	if (size == 0)</div><div class='add'>+		goto put;</div><div class='add'>+</div><div class='add'>+	if (xattr_value_len &gt; size) {</div><div class='add'>+		err = -ERANGE;</div><div class='add'>+		goto put;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	memcpy(value, xattr_value, xattr_value_len);</div><div class='add'>+put:</div><div class='add'>+	ceph_mdsc_put_request(req);</div><div class='add'>+out:</div><div class='add'>+	doutc(cl, "result=%d\n", err);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2291,7 +3055,7 @@ int __ceph_do_getattr(struct inode *inode, struct page *locked_page,</div><div class='ctx'>  * Check inode permissions.  We verify we have a valid value for</div><div class='ctx'>  * the AUTH cap, then call the generic handler.</div><div class='ctx'>  */</div><div class='del'>-int ceph_permission(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='add'>+int ceph_permission(struct mnt_idmap *idmap, struct inode *inode,</div><div class='ctx'> 		    int mask)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='hunk'>@@ -2302,7 +3066,7 @@ int ceph_permission(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='ctx'> 	err = ceph_do_getattr(inode, CEPH_CAP_AUTH_SHARED, false);</div><div class='ctx'> </div><div class='ctx'> 	if (!err)</div><div class='del'>-		err = generic_permission(&amp;init_user_ns, inode, mask);</div><div class='add'>+		err = generic_permission(idmap, inode, mask);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2311,10 +3075,10 @@ static int statx_to_caps(u32 want, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	int mask = 0;</div><div class='ctx'> </div><div class='del'>-	if (want &amp; (STATX_MODE|STATX_UID|STATX_GID|STATX_CTIME|STATX_BTIME))</div><div class='add'>+	if (want &amp; (STATX_MODE|STATX_UID|STATX_GID|STATX_CTIME|STATX_BTIME|STATX_CHANGE_COOKIE))</div><div class='ctx'> 		mask |= CEPH_CAP_AUTH_SHARED;</div><div class='ctx'> </div><div class='del'>-	if (want &amp; (STATX_NLINK|STATX_CTIME)) {</div><div class='add'>+	if (want &amp; (STATX_NLINK|STATX_CTIME|STATX_CHANGE_COOKIE)) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * The link count for directories depends on inode-&gt;i_subdirs,</div><div class='ctx'> 		 * and that is only updated when Fs caps are held.</div><div class='hunk'>@@ -2325,11 +3089,10 @@ static int statx_to_caps(u32 want, umode_t mode)</div><div class='ctx'> 			mask |= CEPH_CAP_LINK_SHARED;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (want &amp; (STATX_ATIME|STATX_MTIME|STATX_CTIME|STATX_SIZE|</div><div class='del'>-		    STATX_BLOCKS))</div><div class='add'>+	if (want &amp; (STATX_ATIME|STATX_MTIME|STATX_CTIME|STATX_SIZE|STATX_BLOCKS|STATX_CHANGE_COOKIE))</div><div class='ctx'> 		mask |= CEPH_CAP_FILE_SHARED;</div><div class='ctx'> </div><div class='del'>-	if (want &amp; (STATX_CTIME))</div><div class='add'>+	if (want &amp; (STATX_CTIME|STATX_CHANGE_COOKIE))</div><div class='ctx'> 		mask |= CEPH_CAP_XATTR_SHARED;</div><div class='ctx'> </div><div class='ctx'> 	return mask;</div><div class='hunk'>@@ -2339,16 +3102,20 @@ static int statx_to_caps(u32 want, umode_t mode)</div><div class='ctx'>  * Get all the attributes. If we have sufficient caps for the requested attrs,</div><div class='ctx'>  * then we can avoid talking to the MDS at all.</div><div class='ctx'>  */</div><div class='del'>-int ceph_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='add'>+int ceph_getattr(struct mnt_idmap *idmap, const struct path *path,</div><div class='ctx'> 		 struct kstat *stat, u32 request_mask, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(path-&gt;dentry);</div><div class='add'>+	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	u32 valid_mask = STATX_BASIC_STATS;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='add'>+	if (ceph_inode_is_shutdown(inode))</div><div class='add'>+		return -ESTALE;</div><div class='add'>+</div><div class='ctx'> 	/* Skip the getattr altogether if we're asked not to sync */</div><div class='del'>-	if (!(flags &amp; AT_STATX_DONT_SYNC)) {</div><div class='add'>+	if ((flags &amp; AT_STATX_SYNC_TYPE) != AT_STATX_DONT_SYNC) {</div><div class='ctx'> 		err = ceph_do_getattr(inode,</div><div class='ctx'> 				statx_to_caps(request_mask, inode-&gt;i_mode),</div><div class='ctx'> 				flags &amp; AT_STATX_FORCE_SYNC);</div><div class='hunk'>@@ -2356,7 +3123,7 @@ int ceph_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='ctx'> 			return err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	generic_fillattr(&amp;init_user_ns, inode, stat);</div><div class='add'>+	generic_fillattr(idmap, request_mask, inode, stat);</div><div class='ctx'> 	stat-&gt;ino = ceph_present_inode(inode);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -2368,17 +3135,40 @@ int ceph_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='ctx'> 		valid_mask |= STATX_BTIME;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (request_mask &amp; STATX_CHANGE_COOKIE) {</div><div class='add'>+		stat-&gt;change_cookie = inode_peek_iversion_raw(inode);</div><div class='add'>+		valid_mask |= STATX_CHANGE_COOKIE;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (ceph_snap(inode) == CEPH_NOSNAP)</div><div class='del'>-		stat-&gt;dev = inode-&gt;i_sb-&gt;s_dev;</div><div class='add'>+		stat-&gt;dev = sb-&gt;s_dev;</div><div class='ctx'> 	else</div><div class='ctx'> 		stat-&gt;dev = ci-&gt;i_snapid_map ? ci-&gt;i_snapid_map-&gt;dev : 0;</div><div class='ctx'> </div><div class='ctx'> 	if (S_ISDIR(inode-&gt;i_mode)) {</div><div class='del'>-		if (ceph_test_mount_opt(ceph_sb_to_client(inode-&gt;i_sb),</div><div class='del'>-					RBYTES))</div><div class='add'>+		if (ceph_test_mount_opt(ceph_sb_to_fs_client(sb), RBYTES)) {</div><div class='ctx'> 			stat-&gt;size = ci-&gt;i_rbytes;</div><div class='del'>-		else</div><div class='add'>+		} else if (ceph_snap(inode) == CEPH_SNAPDIR) {</div><div class='add'>+			struct ceph_inode_info *pci;</div><div class='add'>+			struct ceph_snap_realm *realm;</div><div class='add'>+			struct inode *parent;</div><div class='add'>+</div><div class='add'>+			parent = ceph_lookup_inode(sb, ceph_ino(inode));</div><div class='add'>+			if (IS_ERR(parent))</div><div class='add'>+				return PTR_ERR(parent);</div><div class='add'>+</div><div class='add'>+			pci = ceph_inode(parent);</div><div class='add'>+			spin_lock(&amp;pci-&gt;i_ceph_lock);</div><div class='add'>+			realm = pci-&gt;i_snap_realm;</div><div class='add'>+			if (realm)</div><div class='add'>+				stat-&gt;size = realm-&gt;num_snaps;</div><div class='add'>+			else</div><div class='add'>+				stat-&gt;size = 0;</div><div class='add'>+			spin_unlock(&amp;pci-&gt;i_ceph_lock);</div><div class='add'>+			iput(parent);</div><div class='add'>+		} else {</div><div class='ctx'> 			stat-&gt;size = ci-&gt;i_files + ci-&gt;i_subdirs;</div><div class='add'>+		}</div><div class='ctx'> 		stat-&gt;blocks = 0;</div><div class='ctx'> 		stat-&gt;blksize = 65536;</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -2391,6 +3181,36 @@ int ceph_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='ctx'> 			stat-&gt;nlink = 1 + 1 + ci-&gt;i_subdirs;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	stat-&gt;attributes |= STATX_ATTR_CHANGE_MONOTONIC;</div><div class='add'>+	if (IS_ENCRYPTED(inode))</div><div class='add'>+		stat-&gt;attributes |= STATX_ATTR_ENCRYPTED;</div><div class='add'>+	stat-&gt;attributes_mask |= (STATX_ATTR_CHANGE_MONOTONIC |</div><div class='add'>+				  STATX_ATTR_ENCRYPTED);</div><div class='add'>+</div><div class='ctx'> 	stat-&gt;result_mask = request_mask &amp; valid_mask;</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+void ceph_inode_shutdown(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	struct rb_node *p;</div><div class='add'>+	int iputs = 0;</div><div class='add'>+	bool invalidate = false;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+	ci-&gt;i_ceph_flags |= CEPH_I_SHUTDOWN;</div><div class='add'>+	p = rb_first(&amp;ci-&gt;i_caps);</div><div class='add'>+	while (p) {</div><div class='add'>+		struct ceph_cap *cap = rb_entry(p, struct ceph_cap, ci_node);</div><div class='add'>+</div><div class='add'>+		p = rb_next(p);</div><div class='add'>+		iputs += ceph_purge_inode_cap(inode, cap, &amp;invalidate);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+</div><div class='add'>+	if (invalidate)</div><div class='add'>+		ceph_queue_invalidate(inode);</div><div class='add'>+	while (iputs--)</div><div class='add'>+		iput(inode);</div><div class='add'>+}</div><div class='head'>diff --git a/fs/ceph/io.c b/fs/ceph/io.c<br/>index c456509b31c3..2d10f49c93a9 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ceph/io.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/io.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/io.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/io.c</a></div><div class='hunk'>@@ -21,14 +21,23 @@</div><div class='ctx'> /* Call with exclusively locked inode-&gt;i_rwsem */</div><div class='ctx'> static void ceph_block_o_direct(struct ceph_inode_info *ci, struct inode *inode)</div><div class='ctx'> {</div><div class='add'>+	bool is_odirect;</div><div class='add'>+</div><div class='ctx'> 	lockdep_assert_held_write(&amp;inode-&gt;i_rwsem);</div><div class='ctx'> </div><div class='del'>-	if (READ_ONCE(ci-&gt;i_ceph_flags) &amp; CEPH_I_ODIRECT) {</div><div class='del'>-		spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-		ci-&gt;i_ceph_flags &amp;= ~CEPH_I_ODIRECT;</div><div class='del'>-		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-		inode_dio_wait(inode);</div><div class='add'>+	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+	/* ensure that bit state is consistent */</div><div class='add'>+	smp_mb__before_atomic();</div><div class='add'>+	is_odirect = READ_ONCE(ci-&gt;i_ceph_flags) &amp; CEPH_I_ODIRECT;</div><div class='add'>+	if (is_odirect) {</div><div class='add'>+		clear_bit(CEPH_I_ODIRECT_BIT, &amp;ci-&gt;i_ceph_flags);</div><div class='add'>+		/* ensure modified bit is visible */</div><div class='add'>+		smp_mb__after_atomic();</div><div class='ctx'> 	}</div><div class='add'>+	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+</div><div class='add'>+	if (is_odirect)</div><div class='add'>+		inode_dio_wait(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -47,20 +56,35 @@ static void ceph_block_o_direct(struct ceph_inode_info *ci, struct inode *inode)</div><div class='ctx'>  * Note that buffered writes and truncates both take a write lock on</div><div class='ctx'>  * inode-&gt;i_rwsem, meaning that those are serialised w.r.t. the reads.</div><div class='ctx'>  */</div><div class='del'>-void</div><div class='del'>-ceph_start_io_read(struct inode *inode)</div><div class='add'>+int ceph_start_io_read(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	bool is_odirect;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='ctx'> 	/* Be an optimist! */</div><div class='del'>-	down_read(&amp;inode-&gt;i_rwsem);</div><div class='del'>-	if (!(READ_ONCE(ci-&gt;i_ceph_flags) &amp; CEPH_I_ODIRECT))</div><div class='del'>-		return;</div><div class='add'>+	err = down_read_killable(&amp;inode-&gt;i_rwsem);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+	/* ensure that bit state is consistent */</div><div class='add'>+	smp_mb__before_atomic();</div><div class='add'>+	is_odirect = READ_ONCE(ci-&gt;i_ceph_flags) &amp; CEPH_I_ODIRECT;</div><div class='add'>+	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+	if (!is_odirect)</div><div class='add'>+		return 0;</div><div class='ctx'> 	up_read(&amp;inode-&gt;i_rwsem);</div><div class='add'>+</div><div class='ctx'> 	/* Slow path.... */</div><div class='del'>-	down_write(&amp;inode-&gt;i_rwsem);</div><div class='add'>+	err = down_write_killable(&amp;inode-&gt;i_rwsem);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='ctx'> 	ceph_block_o_direct(ci, inode);</div><div class='ctx'> 	downgrade_write(&amp;inode-&gt;i_rwsem);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -83,11 +107,12 @@ ceph_end_io_read(struct inode *inode)</div><div class='ctx'>  * Declare that a buffered write operation is about to start, and ensure</div><div class='ctx'>  * that we block all direct I/O.</div><div class='ctx'>  */</div><div class='del'>-void</div><div class='del'>-ceph_start_io_write(struct inode *inode)</div><div class='add'>+int ceph_start_io_write(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	down_write(&amp;inode-&gt;i_rwsem);</div><div class='del'>-	ceph_block_o_direct(ceph_inode(inode), inode);</div><div class='add'>+	int err = down_write_killable(&amp;inode-&gt;i_rwsem);</div><div class='add'>+	if (!err)</div><div class='add'>+		ceph_block_o_direct(ceph_inode(inode), inode);</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -106,12 +131,22 @@ ceph_end_io_write(struct inode *inode)</div><div class='ctx'> /* Call with exclusively locked inode-&gt;i_rwsem */</div><div class='ctx'> static void ceph_block_buffered(struct ceph_inode_info *ci, struct inode *inode)</div><div class='ctx'> {</div><div class='add'>+	bool is_odirect;</div><div class='add'>+</div><div class='ctx'> 	lockdep_assert_held_write(&amp;inode-&gt;i_rwsem);</div><div class='ctx'> </div><div class='del'>-	if (!(READ_ONCE(ci-&gt;i_ceph_flags) &amp; CEPH_I_ODIRECT)) {</div><div class='del'>-		spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-		ci-&gt;i_ceph_flags |= CEPH_I_ODIRECT;</div><div class='del'>-		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+	/* ensure that bit state is consistent */</div><div class='add'>+	smp_mb__before_atomic();</div><div class='add'>+	is_odirect = READ_ONCE(ci-&gt;i_ceph_flags) &amp; CEPH_I_ODIRECT;</div><div class='add'>+	if (!is_odirect) {</div><div class='add'>+		set_bit(CEPH_I_ODIRECT_BIT, &amp;ci-&gt;i_ceph_flags);</div><div class='add'>+		/* ensure modified bit is visible */</div><div class='add'>+		smp_mb__after_atomic();</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+</div><div class='add'>+	if (!is_odirect) {</div><div class='ctx'> 		/* FIXME: unmap_mapping_range? */</div><div class='ctx'> 		filemap_write_and_wait(inode-&gt;i_mapping);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -133,20 +168,35 @@ static void ceph_block_buffered(struct ceph_inode_info *ci, struct inode *inode)</div><div class='ctx'>  * Note that buffered writes and truncates both take a write lock on</div><div class='ctx'>  * inode-&gt;i_rwsem, meaning that those are serialised w.r.t. O_DIRECT.</div><div class='ctx'>  */</div><div class='del'>-void</div><div class='del'>-ceph_start_io_direct(struct inode *inode)</div><div class='add'>+int ceph_start_io_direct(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	bool is_odirect;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='ctx'> 	/* Be an optimist! */</div><div class='del'>-	down_read(&amp;inode-&gt;i_rwsem);</div><div class='del'>-	if (READ_ONCE(ci-&gt;i_ceph_flags) &amp; CEPH_I_ODIRECT)</div><div class='del'>-		return;</div><div class='add'>+	err = down_read_killable(&amp;inode-&gt;i_rwsem);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+	/* ensure that bit state is consistent */</div><div class='add'>+	smp_mb__before_atomic();</div><div class='add'>+	is_odirect = READ_ONCE(ci-&gt;i_ceph_flags) &amp; CEPH_I_ODIRECT;</div><div class='add'>+	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+	if (is_odirect)</div><div class='add'>+		return 0;</div><div class='ctx'> 	up_read(&amp;inode-&gt;i_rwsem);</div><div class='add'>+</div><div class='ctx'> 	/* Slow path.... */</div><div class='del'>-	down_write(&amp;inode-&gt;i_rwsem);</div><div class='add'>+	err = down_write_killable(&amp;inode-&gt;i_rwsem);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='ctx'> 	ceph_block_buffered(ci, inode);</div><div class='ctx'> 	downgrade_write(&amp;inode-&gt;i_rwsem);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='head'>diff --git a/fs/ceph/io.h b/fs/ceph/io.h<br/>index fa594cd77348..79029825e8b8 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ceph/io.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/io.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/io.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/io.h</a></div><div class='hunk'>@@ -2,11 +2,13 @@</div><div class='ctx'> #ifndef _FS_CEPH_IO_H</div><div class='ctx'> #define _FS_CEPH_IO_H</div><div class='ctx'> </div><div class='del'>-void ceph_start_io_read(struct inode *inode);</div><div class='add'>+#include &lt;linux/compiler_attributes.h&gt;</div><div class='add'>+</div><div class='add'>+int __must_check ceph_start_io_read(struct inode *inode);</div><div class='ctx'> void ceph_end_io_read(struct inode *inode);</div><div class='del'>-void ceph_start_io_write(struct inode *inode);</div><div class='add'>+int __must_check ceph_start_io_write(struct inode *inode);</div><div class='ctx'> void ceph_end_io_write(struct inode *inode);</div><div class='del'>-void ceph_start_io_direct(struct inode *inode);</div><div class='add'>+int __must_check ceph_start_io_direct(struct inode *inode);</div><div class='ctx'> void ceph_end_io_direct(struct inode *inode);</div><div class='ctx'> </div><div class='ctx'> #endif /* FS_CEPH_IO_H */</div><div class='head'>diff --git a/fs/ceph/ioctl.c b/fs/ceph/ioctl.c<br/>index 6e061bf62ad4..15cde055f3da 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ceph/ioctl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/ioctl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/ioctl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/ioctl.c</a></div><div class='hunk'>@@ -6,6 +6,7 @@</div><div class='ctx'> #include "mds_client.h"</div><div class='ctx'> #include "ioctl.h"</div><div class='ctx'> #include &lt;linux/ceph/striper.h&gt;</div><div class='add'>+#include &lt;linux/fscrypt.h&gt;</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * ioctls</div><div class='hunk'>@@ -64,7 +65,7 @@ static long __validate_layout(struct ceph_mds_client *mdsc,</div><div class='ctx'> static long ceph_ioctl_set_layout(struct file *file, void __user *arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='del'>-	struct ceph_mds_client *mdsc = ceph_sb_to_client(inode-&gt;i_sb)-&gt;mdsc;</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_sb_to_fs_client(inode-&gt;i_sb)-&gt;mdsc;</div><div class='ctx'> 	struct ceph_mds_request *req;</div><div class='ctx'> 	struct ceph_ioctl_layout l;</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(file_inode(file));</div><div class='hunk'>@@ -139,7 +140,7 @@ static long ceph_ioctl_set_layout_policy (struct file *file, void __user *arg)</div><div class='ctx'> 	struct ceph_mds_request *req;</div><div class='ctx'> 	struct ceph_ioctl_layout l;</div><div class='ctx'> 	int err;</div><div class='del'>-	struct ceph_mds_client *mdsc = ceph_sb_to_client(inode-&gt;i_sb)-&gt;mdsc;</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_sb_to_fs_client(inode-&gt;i_sb)-&gt;mdsc;</div><div class='ctx'> </div><div class='ctx'> 	/* copy and validate */</div><div class='ctx'> 	if (copy_from_user(&amp;l, arg, sizeof(l)))</div><div class='hunk'>@@ -182,7 +183,7 @@ static long ceph_ioctl_get_dataloc(struct file *file, void __user *arg)</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	struct ceph_osd_client *osdc =</div><div class='del'>-		&amp;ceph_sb_to_client(inode-&gt;i_sb)-&gt;client-&gt;osdc;</div><div class='add'>+		&amp;ceph_sb_to_fs_client(inode-&gt;i_sb)-&gt;client-&gt;osdc;</div><div class='ctx'> 	struct ceph_object_locator oloc;</div><div class='ctx'> 	CEPH_DEFINE_OID_ONSTACK(oid);</div><div class='ctx'> 	u32 xlen;</div><div class='hunk'>@@ -243,20 +244,30 @@ static long ceph_ioctl_lazyio(struct file *file)</div><div class='ctx'> 	struct ceph_file_info *fi = file-&gt;private_data;</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	struct ceph_mds_client *mdsc = ceph_inode_to_client(inode)-&gt;mdsc;</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_inode_to_fs_client(inode)-&gt;mdsc;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='add'>+	bool is_file_already_lazy = false;</div><div class='ctx'> </div><div class='add'>+	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 	if ((fi-&gt;fmode &amp; CEPH_FILE_MODE_LAZY) == 0) {</div><div class='del'>-		spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 		fi-&gt;fmode |= CEPH_FILE_MODE_LAZY;</div><div class='ctx'> 		ci-&gt;i_nr_by_mode[ffs(CEPH_FILE_MODE_LAZY)]++;</div><div class='ctx'> 		__ceph_touch_fmode(ci, mdsc, fi-&gt;fmode);</div><div class='del'>-		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-		dout("ioctl_layzio: file %p marked lazy\n", file);</div><div class='add'>+	} else {</div><div class='add'>+		is_file_already_lazy = true;</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> </div><div class='del'>-		ceph_check_caps(ci, 0, NULL);</div><div class='add'>+	if (is_file_already_lazy) {</div><div class='add'>+		doutc(cl, "file %p %p %llx.%llx already lazy\n", file, inode,</div><div class='add'>+		      ceph_vinop(inode));</div><div class='ctx'> 	} else {</div><div class='del'>-		dout("ioctl_layzio: file %p already lazy\n", file);</div><div class='add'>+		doutc(cl, "file %p %p %llx.%llx marked lazy\n", file, inode,</div><div class='add'>+		      ceph_vinop(inode));</div><div class='add'>+</div><div class='add'>+		ceph_check_caps(ci, 0);</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -268,9 +279,98 @@ static long ceph_ioctl_syncio(struct file *file)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int vet_mds_for_fscrypt(struct file *file)</div><div class='add'>+{</div><div class='add'>+	int i, ret = -EOPNOTSUPP;</div><div class='add'>+	struct ceph_mds_client	*mdsc = ceph_sb_to_mdsc(file_inode(file)-&gt;i_sb);</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;mdsc-&gt;mutex);</div><div class='add'>+	for (i = 0; i &lt; mdsc-&gt;max_sessions; i++) {</div><div class='add'>+		struct ceph_mds_session *s = mdsc-&gt;sessions[i];</div><div class='add'>+</div><div class='add'>+		if (!s)</div><div class='add'>+			continue;</div><div class='add'>+		if (test_bit(CEPHFS_FEATURE_ALTERNATE_NAME, &amp;s-&gt;s_features))</div><div class='add'>+			ret = 0;</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+	mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static long ceph_set_encryption_policy(struct file *file, unsigned long arg)</div><div class='add'>+{</div><div class='add'>+	int ret, got = 0;</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='add'>+	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+</div><div class='add'>+	/* encrypted directories can't have striped layout */</div><div class='add'>+	if (ci-&gt;i_layout.stripe_count &gt; 1)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	ret = vet_mds_for_fscrypt(file);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Ensure we hold these caps so that we _know_ that the rstats check</div><div class='add'>+	 * in the empty_dir check is reliable.</div><div class='add'>+	 */</div><div class='add'>+	ret = ceph_get_caps(file, CEPH_CAP_FILE_SHARED, 0, -1, &amp;got);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	ret = fscrypt_ioctl_set_policy(file, (const void __user *)arg);</div><div class='add'>+	if (got)</div><div class='add'>+		ceph_put_cap_refs(ci, got);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const char *ceph_ioctl_cmd_name(const unsigned int cmd)</div><div class='add'>+{</div><div class='add'>+	switch (cmd) {</div><div class='add'>+	case CEPH_IOC_GET_LAYOUT:</div><div class='add'>+		return "get_layout";</div><div class='add'>+	case CEPH_IOC_SET_LAYOUT:</div><div class='add'>+		return "set_layout";</div><div class='add'>+	case CEPH_IOC_SET_LAYOUT_POLICY:</div><div class='add'>+		return "set_layout_policy";</div><div class='add'>+	case CEPH_IOC_GET_DATALOC:</div><div class='add'>+		return "get_dataloc";</div><div class='add'>+	case CEPH_IOC_LAZYIO:</div><div class='add'>+		return "lazyio";</div><div class='add'>+	case CEPH_IOC_SYNCIO:</div><div class='add'>+		return "syncio";</div><div class='add'>+	case FS_IOC_SET_ENCRYPTION_POLICY:</div><div class='add'>+		return "set_encryption_policy";</div><div class='add'>+	case FS_IOC_GET_ENCRYPTION_POLICY:</div><div class='add'>+		return "get_encryption_policy";</div><div class='add'>+	case FS_IOC_GET_ENCRYPTION_POLICY_EX:</div><div class='add'>+		return "get_encryption_policy_ex";</div><div class='add'>+	case FS_IOC_ADD_ENCRYPTION_KEY:</div><div class='add'>+		return "add_encryption_key";</div><div class='add'>+	case FS_IOC_REMOVE_ENCRYPTION_KEY:</div><div class='add'>+		return "remove_encryption_key";</div><div class='add'>+	case FS_IOC_REMOVE_ENCRYPTION_KEY_ALL_USERS:</div><div class='add'>+		return "remove_encryption_key_all_users";</div><div class='add'>+	case FS_IOC_GET_ENCRYPTION_KEY_STATUS:</div><div class='add'>+		return "get_encryption_key_status";</div><div class='add'>+	case FS_IOC_GET_ENCRYPTION_NONCE:</div><div class='add'>+		return "get_encryption_nonce";</div><div class='add'>+	default:</div><div class='add'>+		return "unknown";</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> long ceph_ioctl(struct file *file, unsigned int cmd, unsigned long arg)</div><div class='ctx'> {</div><div class='del'>-	dout("ioctl file %p cmd %u arg %lu\n", file, cmd, arg);</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	doutc(fsc-&gt;client, "file %p %p %llx.%llx cmd %s arg %lu\n", file,</div><div class='add'>+	      inode, ceph_vinop(inode), ceph_ioctl_cmd_name(cmd), arg);</div><div class='ctx'> 	switch (cmd) {</div><div class='ctx'> 	case CEPH_IOC_GET_LAYOUT:</div><div class='ctx'> 		return ceph_ioctl_get_layout(file, (void __user *)arg);</div><div class='hunk'>@@ -289,6 +389,43 @@ long ceph_ioctl(struct file *file, unsigned int cmd, unsigned long arg)</div><div class='ctx'> </div><div class='ctx'> 	case CEPH_IOC_SYNCIO:</div><div class='ctx'> 		return ceph_ioctl_syncio(file);</div><div class='add'>+</div><div class='add'>+	case FS_IOC_SET_ENCRYPTION_POLICY:</div><div class='add'>+		return ceph_set_encryption_policy(file, arg);</div><div class='add'>+</div><div class='add'>+	case FS_IOC_GET_ENCRYPTION_POLICY:</div><div class='add'>+		ret = vet_mds_for_fscrypt(file);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		return fscrypt_ioctl_get_policy(file, (void __user *)arg);</div><div class='add'>+</div><div class='add'>+	case FS_IOC_GET_ENCRYPTION_POLICY_EX:</div><div class='add'>+		ret = vet_mds_for_fscrypt(file);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		return fscrypt_ioctl_get_policy_ex(file, (void __user *)arg);</div><div class='add'>+</div><div class='add'>+	case FS_IOC_ADD_ENCRYPTION_KEY:</div><div class='add'>+		ret = vet_mds_for_fscrypt(file);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		return fscrypt_ioctl_add_key(file, (void __user *)arg);</div><div class='add'>+</div><div class='add'>+	case FS_IOC_REMOVE_ENCRYPTION_KEY:</div><div class='add'>+		return fscrypt_ioctl_remove_key(file, (void __user *)arg);</div><div class='add'>+</div><div class='add'>+	case FS_IOC_REMOVE_ENCRYPTION_KEY_ALL_USERS:</div><div class='add'>+		return fscrypt_ioctl_remove_key_all_users(file,</div><div class='add'>+							  (void __user *)arg);</div><div class='add'>+</div><div class='add'>+	case FS_IOC_GET_ENCRYPTION_KEY_STATUS:</div><div class='add'>+		return fscrypt_ioctl_get_key_status(file, (void __user *)arg);</div><div class='add'>+</div><div class='add'>+	case FS_IOC_GET_ENCRYPTION_NONCE:</div><div class='add'>+		ret = vet_mds_for_fscrypt(file);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		return fscrypt_ioctl_get_nonce(file, (void __user *)arg);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return -ENOTTY;</div><div class='head'>diff --git a/fs/ceph/locks.c b/fs/ceph/locks.c<br/>index d8c31069fbf2..dd764f9c64b9 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ceph/locks.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/locks.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/locks.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/locks.c</a></div><div class='hunk'>@@ -7,6 +7,7 @@</div><div class='ctx'> </div><div class='ctx'> #include "super.h"</div><div class='ctx'> #include "mds_client.h"</div><div class='add'>+#include &lt;linux/filelock.h&gt;</div><div class='ctx'> #include &lt;linux/ceph/pagelist.h&gt;</div><div class='ctx'> </div><div class='ctx'> static u64 lock_secret;</div><div class='hunk'>@@ -32,24 +33,36 @@ void __init ceph_flock_init(void)</div><div class='ctx'> </div><div class='ctx'> static void ceph_fl_copy_lock(struct file_lock *dst, struct file_lock *src)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_file_info *fi = dst-&gt;fl_file-&gt;private_data;</div><div class='del'>-	struct inode *inode = file_inode(dst-&gt;fl_file);</div><div class='add'>+	struct inode *inode = file_inode(dst-&gt;c.flc_file);</div><div class='ctx'> 	atomic_inc(&amp;ceph_inode(inode)-&gt;i_filelock_ref);</div><div class='del'>-	atomic_inc(&amp;fi-&gt;num_locks);</div><div class='add'>+	dst-&gt;fl_u.ceph.inode = igrab(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Do not use the 'fl-&gt;fl_file' in release function, which</div><div class='add'>+ * is possibly already released by another thread.</div><div class='add'>+ */</div><div class='ctx'> static void ceph_fl_release_lock(struct file_lock *fl)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_file_info *fi = fl-&gt;fl_file-&gt;private_data;</div><div class='del'>-	struct inode *inode = file_inode(fl-&gt;fl_file);</div><div class='del'>-	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	atomic_dec(&amp;fi-&gt;num_locks);</div><div class='add'>+	struct inode *inode = fl-&gt;fl_u.ceph.inode;</div><div class='add'>+	struct ceph_inode_info *ci;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If inode is NULL it should be a request file_lock,</div><div class='add'>+	 * nothing we can do.</div><div class='add'>+	 */</div><div class='add'>+	if (!inode)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	ci = ceph_inode(inode);</div><div class='ctx'> 	if (atomic_dec_and_test(&amp;ci-&gt;i_filelock_ref)) {</div><div class='ctx'> 		/* clear error when all locks are released */</div><div class='ctx'> 		spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 		ci-&gt;i_ceph_flags &amp;= ~CEPH_I_ERROR_FILELOCK;</div><div class='ctx'> 		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 	}</div><div class='add'>+	fl-&gt;fl_u.ceph.inode = NULL;</div><div class='add'>+	iput(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct file_lock_operations ceph_fl_lock_ops = {</div><div class='hunk'>@@ -64,6 +77,7 @@ static int ceph_lock_message(u8 lock_type, u16 operation, struct inode *inode,</div><div class='ctx'> 			     int cmd, u8 wait, struct file_lock *fl)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_mds_client *mdsc = ceph_sb_to_mdsc(inode-&gt;i_sb);</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_mds_request *req;</div><div class='ctx'> 	int err;</div><div class='ctx'> 	u64 length = 0;</div><div class='hunk'>@@ -96,33 +110,34 @@ static int ceph_lock_message(u8 lock_type, u16 operation, struct inode *inode,</div><div class='ctx'> 	else</div><div class='ctx'> 		length = fl-&gt;fl_end - fl-&gt;fl_start + 1;</div><div class='ctx'> </div><div class='del'>-	owner = secure_addr(fl-&gt;fl_owner);</div><div class='add'>+	owner = secure_addr(fl-&gt;c.flc_owner);</div><div class='ctx'> </div><div class='del'>-	dout("ceph_lock_message: rule: %d, op: %d, owner: %llx, pid: %llu, "</div><div class='del'>-	     "start: %llu, length: %llu, wait: %d, type: %d\n", (int)lock_type,</div><div class='del'>-	     (int)operation, owner, (u64)fl-&gt;fl_pid, fl-&gt;fl_start, length,</div><div class='del'>-	     wait, fl-&gt;fl_type);</div><div class='add'>+	doutc(cl, "rule: %d, op: %d, owner: %llx, pid: %llu, "</div><div class='add'>+		    "start: %llu, length: %llu, wait: %d, type: %d\n",</div><div class='add'>+		    (int)lock_type, (int)operation, owner,</div><div class='add'>+		    (u64) fl-&gt;c.flc_pid,</div><div class='add'>+		    fl-&gt;fl_start, length, wait, fl-&gt;c.flc_type);</div><div class='ctx'> </div><div class='ctx'> 	req-&gt;r_args.filelock_change.rule = lock_type;</div><div class='ctx'> 	req-&gt;r_args.filelock_change.type = cmd;</div><div class='ctx'> 	req-&gt;r_args.filelock_change.owner = cpu_to_le64(owner);</div><div class='del'>-	req-&gt;r_args.filelock_change.pid = cpu_to_le64((u64)fl-&gt;fl_pid);</div><div class='add'>+	req-&gt;r_args.filelock_change.pid = cpu_to_le64((u64) fl-&gt;c.flc_pid);</div><div class='ctx'> 	req-&gt;r_args.filelock_change.start = cpu_to_le64(fl-&gt;fl_start);</div><div class='ctx'> 	req-&gt;r_args.filelock_change.length = cpu_to_le64(length);</div><div class='ctx'> 	req-&gt;r_args.filelock_change.wait = wait;</div><div class='ctx'> </div><div class='del'>-	if (wait)</div><div class='del'>-		req-&gt;r_wait_for_completion = ceph_lock_wait_for_completion;</div><div class='del'>-</div><div class='del'>-	err = ceph_mdsc_do_request(mdsc, inode, req);</div><div class='add'>+	err = ceph_mdsc_submit_request(mdsc, inode, req);</div><div class='add'>+	if (!err)</div><div class='add'>+		err = ceph_mdsc_wait_request(mdsc, req, wait ?</div><div class='add'>+					ceph_lock_wait_for_completion : NULL);</div><div class='ctx'> 	if (!err &amp;&amp; operation == CEPH_MDS_OP_GETFILELOCK) {</div><div class='del'>-		fl-&gt;fl_pid = -le64_to_cpu(req-&gt;r_reply_info.filelock_reply-&gt;pid);</div><div class='add'>+		fl-&gt;c.flc_pid = -le64_to_cpu(req-&gt;r_reply_info.filelock_reply-&gt;pid);</div><div class='ctx'> 		if (CEPH_LOCK_SHARED == req-&gt;r_reply_info.filelock_reply-&gt;type)</div><div class='del'>-			fl-&gt;fl_type = F_RDLCK;</div><div class='add'>+			fl-&gt;c.flc_type = F_RDLCK;</div><div class='ctx'> 		else if (CEPH_LOCK_EXCL == req-&gt;r_reply_info.filelock_reply-&gt;type)</div><div class='del'>-			fl-&gt;fl_type = F_WRLCK;</div><div class='add'>+			fl-&gt;c.flc_type = F_WRLCK;</div><div class='ctx'> 		else</div><div class='del'>-			fl-&gt;fl_type = F_UNLCK;</div><div class='add'>+			fl-&gt;c.flc_type = F_UNLCK;</div><div class='ctx'> </div><div class='ctx'> 		fl-&gt;fl_start = le64_to_cpu(req-&gt;r_reply_info.filelock_reply-&gt;start);</div><div class='ctx'> 		length = le64_to_cpu(req-&gt;r_reply_info.filelock_reply-&gt;start) +</div><div class='hunk'>@@ -134,16 +149,17 @@ static int ceph_lock_message(u8 lock_type, u16 operation, struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 	}</div><div class='ctx'> 	ceph_mdsc_put_request(req);</div><div class='del'>-	dout("ceph_lock_message: rule: %d, op: %d, pid: %llu, start: %llu, "</div><div class='del'>-	     "length: %llu, wait: %d, type: %d, err code %d\n", (int)lock_type,</div><div class='del'>-	     (int)operation, (u64)fl-&gt;fl_pid, fl-&gt;fl_start,</div><div class='del'>-	     length, wait, fl-&gt;fl_type, err);</div><div class='add'>+	doutc(cl, "rule: %d, op: %d, pid: %llu, start: %llu, "</div><div class='add'>+	      "length: %llu, wait: %d, type: %d, err code %d\n",</div><div class='add'>+	      (int)lock_type, (int)operation, (u64) fl-&gt;c.flc_pid,</div><div class='add'>+	      fl-&gt;fl_start, length, wait, fl-&gt;c.flc_type, err);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ceph_lock_wait_for_completion(struct ceph_mds_client *mdsc,</div><div class='ctx'>                                          struct ceph_mds_request *req)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_mds_request *intr_req;</div><div class='ctx'> 	struct inode *inode = req-&gt;r_inode;</div><div class='ctx'> 	int err, lock_type;</div><div class='hunk'>@@ -161,8 +177,7 @@ static int ceph_lock_wait_for_completion(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	if (!err)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	dout("ceph_lock_wait_for_completion: request %llu was interrupted\n",</div><div class='del'>-	     req-&gt;r_tid);</div><div class='add'>+	doutc(cl, "request %llu was interrupted\n", req-&gt;r_tid);</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> 	if (test_bit(CEPH_MDS_R_GOT_RESULT, &amp;req-&gt;r_req_flags)) {</div><div class='hunk'>@@ -206,17 +221,20 @@ static int ceph_lock_wait_for_completion(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	if (err &amp;&amp; err != -ERESTARTSYS)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	wait_for_completion_killable(&amp;req-&gt;r_safe_completion);</div><div class='add'>+	err = wait_for_completion_killable(&amp;req-&gt;r_safe_completion);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int try_unlock_file(struct file *file, struct file_lock *fl)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='del'>-	unsigned int orig_flags = fl-&gt;fl_flags;</div><div class='del'>-	fl-&gt;fl_flags |= FL_EXISTS;</div><div class='add'>+	unsigned int orig_flags = fl-&gt;c.flc_flags;</div><div class='add'>+	fl-&gt;c.flc_flags |= FL_EXISTS;</div><div class='ctx'> 	err = locks_lock_file_wait(file, fl);</div><div class='del'>-	fl-&gt;fl_flags = orig_flags;</div><div class='add'>+	fl-&gt;c.flc_flags = orig_flags;</div><div class='ctx'> 	if (err == -ENOENT) {</div><div class='ctx'> 		if (!(orig_flags &amp; FL_EXISTS))</div><div class='ctx'> 			err = 0;</div><div class='hunk'>@@ -233,15 +251,19 @@ int ceph_lock(struct file *file, int cmd, struct file_lock *fl)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> 	u16 op = CEPH_MDS_OP_SETFILELOCK;</div><div class='ctx'> 	u8 wait = 0;</div><div class='ctx'> 	u8 lock_cmd;</div><div class='ctx'> </div><div class='del'>-	if (!(fl-&gt;fl_flags &amp; FL_POSIX))</div><div class='add'>+	if (!(fl-&gt;c.flc_flags &amp; FL_POSIX))</div><div class='ctx'> 		return -ENOLCK;</div><div class='ctx'> </div><div class='del'>-	dout("ceph_lock, fl_owner: %p\n", fl-&gt;fl_owner);</div><div class='add'>+	if (ceph_inode_is_shutdown(inode))</div><div class='add'>+		return -ESTALE;</div><div class='add'>+</div><div class='add'>+	doutc(cl, "fl_owner: %p\n", fl-&gt;c.flc_owner);</div><div class='ctx'> </div><div class='ctx'> 	/* set wait bit as appropriate, then make command as Ceph expects it*/</div><div class='ctx'> 	if (IS_GETLK(cmd))</div><div class='hunk'>@@ -255,19 +277,19 @@ int ceph_lock(struct file *file, int cmd, struct file_lock *fl)</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 	if (err &lt; 0) {</div><div class='del'>-		if (op == CEPH_MDS_OP_SETFILELOCK &amp;&amp; F_UNLCK == fl-&gt;fl_type)</div><div class='add'>+		if (op == CEPH_MDS_OP_SETFILELOCK &amp;&amp; lock_is_unlock(fl))</div><div class='ctx'> 			posix_lock_file(file, fl, NULL);</div><div class='ctx'> 		return err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (F_RDLCK == fl-&gt;fl_type)</div><div class='add'>+	if (lock_is_read(fl))</div><div class='ctx'> 		lock_cmd = CEPH_LOCK_SHARED;</div><div class='del'>-	else if (F_WRLCK == fl-&gt;fl_type)</div><div class='add'>+	else if (lock_is_write(fl))</div><div class='ctx'> 		lock_cmd = CEPH_LOCK_EXCL;</div><div class='ctx'> 	else</div><div class='ctx'> 		lock_cmd = CEPH_LOCK_UNLOCK;</div><div class='ctx'> </div><div class='del'>-	if (op == CEPH_MDS_OP_SETFILELOCK &amp;&amp; F_UNLCK == fl-&gt;fl_type) {</div><div class='add'>+	if (op == CEPH_MDS_OP_SETFILELOCK &amp;&amp; lock_is_unlock(fl)) {</div><div class='ctx'> 		err = try_unlock_file(file, fl);</div><div class='ctx'> 		if (err &lt;= 0)</div><div class='ctx'> 			return err;</div><div class='hunk'>@@ -275,8 +297,8 @@ int ceph_lock(struct file *file, int cmd, struct file_lock *fl)</div><div class='ctx'> </div><div class='ctx'> 	err = ceph_lock_message(CEPH_LOCK_FCNTL, op, inode, lock_cmd, wait, fl);</div><div class='ctx'> 	if (!err) {</div><div class='del'>-		if (op == CEPH_MDS_OP_SETFILELOCK &amp;&amp; F_UNLCK != fl-&gt;fl_type) {</div><div class='del'>-			dout("mds locked, locking locally\n");</div><div class='add'>+		if (op == CEPH_MDS_OP_SETFILELOCK &amp;&amp; F_UNLCK != fl-&gt;c.flc_type) {</div><div class='add'>+			doutc(cl, "locking locally\n");</div><div class='ctx'> 			err = posix_lock_file(file, fl, NULL);</div><div class='ctx'> 			if (err) {</div><div class='ctx'> 				/* undo! This should only happen if</div><div class='hunk'>@@ -284,8 +306,8 @@ int ceph_lock(struct file *file, int cmd, struct file_lock *fl)</div><div class='ctx'> 				 * deadlock. */</div><div class='ctx'> 				ceph_lock_message(CEPH_LOCK_FCNTL, op, inode,</div><div class='ctx'> 						  CEPH_LOCK_UNLOCK, 0, fl);</div><div class='del'>-				dout("got %d on posix_lock_file, undid lock\n",</div><div class='del'>-				     err);</div><div class='add'>+				doutc(cl, "got %d on posix_lock_file, undid lock\n",</div><div class='add'>+				      err);</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -296,14 +318,18 @@ int ceph_flock(struct file *file, int cmd, struct file_lock *fl)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> 	u8 wait = 0;</div><div class='ctx'> 	u8 lock_cmd;</div><div class='ctx'> </div><div class='del'>-	if (!(fl-&gt;fl_flags &amp; FL_FLOCK))</div><div class='add'>+	if (!(fl-&gt;c.flc_flags &amp; FL_FLOCK))</div><div class='ctx'> 		return -ENOLCK;</div><div class='ctx'> </div><div class='del'>-	dout("ceph_flock, fl_file: %p\n", fl-&gt;fl_file);</div><div class='add'>+	if (ceph_inode_is_shutdown(inode))</div><div class='add'>+		return -ESTALE;</div><div class='add'>+</div><div class='add'>+	doutc(cl, "fl_file: %p\n", fl-&gt;c.flc_file);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 	if (ci-&gt;i_ceph_flags &amp; CEPH_I_ERROR_FILELOCK) {</div><div class='hunk'>@@ -311,7 +337,7 @@ int ceph_flock(struct file *file, int cmd, struct file_lock *fl)</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 	if (err &lt; 0) {</div><div class='del'>-		if (F_UNLCK == fl-&gt;fl_type)</div><div class='add'>+		if (lock_is_unlock(fl))</div><div class='ctx'> 			locks_lock_file_wait(file, fl);</div><div class='ctx'> 		return err;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -319,14 +345,14 @@ int ceph_flock(struct file *file, int cmd, struct file_lock *fl)</div><div class='ctx'> 	if (IS_SETLKW(cmd))</div><div class='ctx'> 		wait = 1;</div><div class='ctx'> </div><div class='del'>-	if (F_RDLCK == fl-&gt;fl_type)</div><div class='add'>+	if (lock_is_read(fl))</div><div class='ctx'> 		lock_cmd = CEPH_LOCK_SHARED;</div><div class='del'>-	else if (F_WRLCK == fl-&gt;fl_type)</div><div class='add'>+	else if (lock_is_write(fl))</div><div class='ctx'> 		lock_cmd = CEPH_LOCK_EXCL;</div><div class='ctx'> 	else</div><div class='ctx'> 		lock_cmd = CEPH_LOCK_UNLOCK;</div><div class='ctx'> </div><div class='del'>-	if (F_UNLCK == fl-&gt;fl_type) {</div><div class='add'>+	if (lock_is_unlock(fl)) {</div><div class='ctx'> 		err = try_unlock_file(file, fl);</div><div class='ctx'> 		if (err &lt;= 0)</div><div class='ctx'> 			return err;</div><div class='hunk'>@@ -334,13 +360,14 @@ int ceph_flock(struct file *file, int cmd, struct file_lock *fl)</div><div class='ctx'> </div><div class='ctx'> 	err = ceph_lock_message(CEPH_LOCK_FLOCK, CEPH_MDS_OP_SETFILELOCK,</div><div class='ctx'> 				inode, lock_cmd, wait, fl);</div><div class='del'>-	if (!err &amp;&amp; F_UNLCK != fl-&gt;fl_type) {</div><div class='add'>+	if (!err &amp;&amp; F_UNLCK != fl-&gt;c.flc_type) {</div><div class='ctx'> 		err = locks_lock_file_wait(file, fl);</div><div class='ctx'> 		if (err) {</div><div class='ctx'> 			ceph_lock_message(CEPH_LOCK_FLOCK,</div><div class='ctx'> 					  CEPH_MDS_OP_SETFILELOCK,</div><div class='ctx'> 					  inode, CEPH_LOCK_UNLOCK, 0, fl);</div><div class='del'>-			dout("got %d on locks_lock_file_wait, undid lock\n", err);</div><div class='add'>+			doutc(cl, "got %d on locks_lock_file_wait, undid lock\n",</div><div class='add'>+			      err);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	return err;</div><div class='hunk'>@@ -352,39 +379,43 @@ int ceph_flock(struct file *file, int cmd, struct file_lock *fl)</div><div class='ctx'>  */</div><div class='ctx'> void ceph_count_locks(struct inode *inode, int *fcntl_count, int *flock_count)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct file_lock *lock;</div><div class='ctx'> 	struct file_lock_context *ctx;</div><div class='ctx'> </div><div class='ctx'> 	*fcntl_count = 0;</div><div class='ctx'> 	*flock_count = 0;</div><div class='ctx'> </div><div class='del'>-	ctx = inode-&gt;i_flctx;</div><div class='add'>+	ctx = locks_inode_context(inode);</div><div class='ctx'> 	if (ctx) {</div><div class='ctx'> 		spin_lock(&amp;ctx-&gt;flc_lock);</div><div class='del'>-		list_for_each_entry(lock, &amp;ctx-&gt;flc_posix, fl_list)</div><div class='add'>+		for_each_file_lock(lock, &amp;ctx-&gt;flc_posix)</div><div class='ctx'> 			++(*fcntl_count);</div><div class='del'>-		list_for_each_entry(lock, &amp;ctx-&gt;flc_flock, fl_list)</div><div class='add'>+		for_each_file_lock(lock, &amp;ctx-&gt;flc_flock)</div><div class='ctx'> 			++(*flock_count);</div><div class='ctx'> 		spin_unlock(&amp;ctx-&gt;flc_lock);</div><div class='ctx'> 	}</div><div class='del'>-	dout("counted %d flock locks and %d fcntl locks\n",</div><div class='del'>-	     *flock_count, *fcntl_count);</div><div class='add'>+	doutc(cl, "counted %d flock locks and %d fcntl locks\n",</div><div class='add'>+	      *flock_count, *fcntl_count);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Given a pointer to a lock, convert it to a ceph filelock</div><div class='ctx'>  */</div><div class='del'>-static int lock_to_ceph_filelock(struct file_lock *lock,</div><div class='add'>+static int lock_to_ceph_filelock(struct inode *inode,</div><div class='add'>+				 struct file_lock *lock,</div><div class='ctx'> 				 struct ceph_filelock *cephlock)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	int err = 0;</div><div class='add'>+</div><div class='ctx'> 	cephlock-&gt;start = cpu_to_le64(lock-&gt;fl_start);</div><div class='ctx'> 	cephlock-&gt;length = cpu_to_le64(lock-&gt;fl_end - lock-&gt;fl_start + 1);</div><div class='ctx'> 	cephlock-&gt;client = cpu_to_le64(0);</div><div class='del'>-	cephlock-&gt;pid = cpu_to_le64((u64)lock-&gt;fl_pid);</div><div class='del'>-	cephlock-&gt;owner = cpu_to_le64(secure_addr(lock-&gt;fl_owner));</div><div class='add'>+	cephlock-&gt;pid = cpu_to_le64((u64) lock-&gt;c.flc_pid);</div><div class='add'>+	cephlock-&gt;owner = cpu_to_le64(secure_addr(lock-&gt;c.flc_owner));</div><div class='ctx'> </div><div class='del'>-	switch (lock-&gt;fl_type) {</div><div class='add'>+	switch (lock-&gt;c.flc_type) {</div><div class='ctx'> 	case F_RDLCK:</div><div class='ctx'> 		cephlock-&gt;type = CEPH_LOCK_SHARED;</div><div class='ctx'> 		break;</div><div class='hunk'>@@ -395,7 +426,8 @@ static int lock_to_ceph_filelock(struct file_lock *lock,</div><div class='ctx'> 		cephlock-&gt;type = CEPH_LOCK_UNLOCK;</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='del'>-		dout("Have unknown lock type %d\n", lock-&gt;fl_type);</div><div class='add'>+		doutc(cl, "Have unknown lock type %d\n",</div><div class='add'>+		      lock-&gt;c.flc_type);</div><div class='ctx'> 		err = -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -412,37 +444,38 @@ int ceph_encode_locks_to_buffer(struct inode *inode,</div><div class='ctx'> 				int num_fcntl_locks, int num_flock_locks)</div><div class='ctx'> {</div><div class='ctx'> 	struct file_lock *lock;</div><div class='del'>-	struct file_lock_context *ctx = inode-&gt;i_flctx;</div><div class='add'>+	struct file_lock_context *ctx = locks_inode_context(inode);</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> 	int seen_fcntl = 0;</div><div class='ctx'> 	int seen_flock = 0;</div><div class='ctx'> 	int l = 0;</div><div class='ctx'> </div><div class='del'>-	dout("encoding %d flock and %d fcntl locks\n", num_flock_locks,</div><div class='del'>-	     num_fcntl_locks);</div><div class='add'>+	doutc(cl, "encoding %d flock and %d fcntl locks\n", num_flock_locks,</div><div class='add'>+	      num_fcntl_locks);</div><div class='ctx'> </div><div class='ctx'> 	if (!ctx)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;ctx-&gt;flc_lock);</div><div class='del'>-	list_for_each_entry(lock, &amp;ctx-&gt;flc_posix, fl_list) {</div><div class='add'>+	for_each_file_lock(lock, &amp;ctx-&gt;flc_posix) {</div><div class='ctx'> 		++seen_fcntl;</div><div class='ctx'> 		if (seen_fcntl &gt; num_fcntl_locks) {</div><div class='ctx'> 			err = -ENOSPC;</div><div class='ctx'> 			goto fail;</div><div class='ctx'> 		}</div><div class='del'>-		err = lock_to_ceph_filelock(lock, &amp;flocks[l]);</div><div class='add'>+		err = lock_to_ceph_filelock(inode, lock, &amp;flocks[l]);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto fail;</div><div class='ctx'> 		++l;</div><div class='ctx'> 	}</div><div class='del'>-	list_for_each_entry(lock, &amp;ctx-&gt;flc_flock, fl_list) {</div><div class='add'>+	for_each_file_lock(lock, &amp;ctx-&gt;flc_flock) {</div><div class='ctx'> 		++seen_flock;</div><div class='ctx'> 		if (seen_flock &gt; num_flock_locks) {</div><div class='ctx'> 			err = -ENOSPC;</div><div class='ctx'> 			goto fail;</div><div class='ctx'> 		}</div><div class='del'>-		err = lock_to_ceph_filelock(lock, &amp;flocks[l]);</div><div class='add'>+		err = lock_to_ceph_filelock(inode, lock, &amp;flocks[l]);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto fail;</div><div class='ctx'> 		++l;</div><div class='head'>diff --git a/fs/ceph/mds_client.c b/fs/ceph/mds_client.c<br/>index d64413adc0fd..1740047aef0f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ceph/mds_client.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/mds_client.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/mds_client.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/mds_client.c</a></div><div class='hunk'>@@ -12,9 +12,11 @@</div><div class='ctx'> #include &lt;linux/bits.h&gt;</div><div class='ctx'> #include &lt;linux/ktime.h&gt;</div><div class='ctx'> #include &lt;linux/bitmap.h&gt;</div><div class='add'>+#include &lt;linux/mnt_idmapping.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "super.h"</div><div class='ctx'> #include "mds_client.h"</div><div class='add'>+#include "crypto.h"</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/ceph/ceph_features.h&gt;</div><div class='ctx'> #include &lt;linux/ceph/messenger.h&gt;</div><div class='hunk'>@@ -184,8 +186,54 @@ static int parse_reply_info_in(void **p, void *end,</div><div class='ctx'> 			info-&gt;rsnaps = 0;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		if (struct_v &gt;= 5) {</div><div class='add'>+			u32 alen;</div><div class='add'>+</div><div class='add'>+			ceph_decode_32_safe(p, end, alen, bad);</div><div class='add'>+</div><div class='add'>+			while (alen--) {</div><div class='add'>+				u32 len;</div><div class='add'>+</div><div class='add'>+				/* key */</div><div class='add'>+				ceph_decode_32_safe(p, end, len, bad);</div><div class='add'>+				ceph_decode_skip_n(p, end, len, bad);</div><div class='add'>+				/* value */</div><div class='add'>+				ceph_decode_32_safe(p, end, len, bad);</div><div class='add'>+				ceph_decode_skip_n(p, end, len, bad);</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* fscrypt flag -- ignore */</div><div class='add'>+		if (struct_v &gt;= 6)</div><div class='add'>+			ceph_decode_skip_8(p, end, bad);</div><div class='add'>+</div><div class='add'>+		info-&gt;fscrypt_auth = NULL;</div><div class='add'>+		info-&gt;fscrypt_auth_len = 0;</div><div class='add'>+		info-&gt;fscrypt_file = NULL;</div><div class='add'>+		info-&gt;fscrypt_file_len = 0;</div><div class='add'>+		if (struct_v &gt;= 7) {</div><div class='add'>+			ceph_decode_32_safe(p, end, info-&gt;fscrypt_auth_len, bad);</div><div class='add'>+			if (info-&gt;fscrypt_auth_len) {</div><div class='add'>+				info-&gt;fscrypt_auth = kmalloc(info-&gt;fscrypt_auth_len,</div><div class='add'>+							     GFP_KERNEL);</div><div class='add'>+				if (!info-&gt;fscrypt_auth)</div><div class='add'>+					return -ENOMEM;</div><div class='add'>+				ceph_decode_copy_safe(p, end, info-&gt;fscrypt_auth,</div><div class='add'>+						      info-&gt;fscrypt_auth_len, bad);</div><div class='add'>+			}</div><div class='add'>+			ceph_decode_32_safe(p, end, info-&gt;fscrypt_file_len, bad);</div><div class='add'>+			if (info-&gt;fscrypt_file_len) {</div><div class='add'>+				info-&gt;fscrypt_file = kmalloc(info-&gt;fscrypt_file_len,</div><div class='add'>+							     GFP_KERNEL);</div><div class='add'>+				if (!info-&gt;fscrypt_file)</div><div class='add'>+					return -ENOMEM;</div><div class='add'>+				ceph_decode_copy_safe(p, end, info-&gt;fscrypt_file,</div><div class='add'>+						      info-&gt;fscrypt_file_len, bad);</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='ctx'> 		*p = end;</div><div class='ctx'> 	} else {</div><div class='add'>+		/* legacy (unversioned) struct */</div><div class='ctx'> 		if (features &amp; CEPH_FEATURE_MDS_INLINE_DATA) {</div><div class='ctx'> 			ceph_decode_64_safe(p, end, info-&gt;inline_version, bad);</div><div class='ctx'> 			ceph_decode_32_safe(p, end, info-&gt;inline_len, bad);</div><div class='hunk'>@@ -263,27 +311,47 @@ bad:</div><div class='ctx'> </div><div class='ctx'> static int parse_reply_info_lease(void **p, void *end,</div><div class='ctx'> 				  struct ceph_mds_reply_lease **lease,</div><div class='del'>-				  u64 features)</div><div class='add'>+				  u64 features, u32 *altname_len, u8 **altname)</div><div class='ctx'> {</div><div class='add'>+	u8 struct_v;</div><div class='add'>+	u32 struct_len;</div><div class='add'>+	void *lend;</div><div class='add'>+</div><div class='ctx'> 	if (features == (u64)-1) {</div><div class='del'>-		u8 struct_v, struct_compat;</div><div class='del'>-		u32 struct_len;</div><div class='add'>+		u8 struct_compat;</div><div class='add'>+</div><div class='ctx'> 		ceph_decode_8_safe(p, end, struct_v, bad);</div><div class='ctx'> 		ceph_decode_8_safe(p, end, struct_compat, bad);</div><div class='add'>+</div><div class='ctx'> 		/* struct_v is expected to be &gt;= 1. we only understand</div><div class='ctx'> 		 * encoding whose struct_compat == 1. */</div><div class='ctx'> 		if (!struct_v || struct_compat != 1)</div><div class='ctx'> 			goto bad;</div><div class='add'>+</div><div class='ctx'> 		ceph_decode_32_safe(p, end, struct_len, bad);</div><div class='del'>-		ceph_decode_need(p, end, struct_len, bad);</div><div class='del'>-		end = *p + struct_len;</div><div class='add'>+	} else {</div><div class='add'>+		struct_len = sizeof(**lease);</div><div class='add'>+		*altname_len = 0;</div><div class='add'>+		*altname = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ceph_decode_need(p, end, sizeof(**lease), bad);</div><div class='add'>+	lend = *p + struct_len;</div><div class='add'>+	ceph_decode_need(p, end, struct_len, bad);</div><div class='ctx'> 	*lease = *p;</div><div class='ctx'> 	*p += sizeof(**lease);</div><div class='del'>-	if (features == (u64)-1)</div><div class='del'>-		*p = end;</div><div class='add'>+</div><div class='add'>+	if (features == (u64)-1) {</div><div class='add'>+		if (struct_v &gt;= 2) {</div><div class='add'>+			ceph_decode_32_safe(p, end, *altname_len, bad);</div><div class='add'>+			ceph_decode_need(p, end, *altname_len, bad);</div><div class='add'>+			*altname = *p;</div><div class='add'>+			*p += *altname_len;</div><div class='add'>+		} else {</div><div class='add'>+			*altname = NULL;</div><div class='add'>+			*altname_len = 0;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	*p = lend;</div><div class='ctx'> 	return 0;</div><div class='ctx'> bad:</div><div class='ctx'> 	return -EIO;</div><div class='hunk'>@@ -313,7 +381,8 @@ static int parse_reply_info_trace(void **p, void *end,</div><div class='ctx'> 		info-&gt;dname = *p;</div><div class='ctx'> 		*p += info-&gt;dname_len;</div><div class='ctx'> </div><div class='del'>-		err = parse_reply_info_lease(p, end, &amp;info-&gt;dlease, features);</div><div class='add'>+		err = parse_reply_info_lease(p, end, &amp;info-&gt;dlease, features,</div><div class='add'>+					     &amp;info-&gt;altname_len, &amp;info-&gt;altname);</div><div class='ctx'> 		if (err &lt; 0)</div><div class='ctx'> 			goto out_bad;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -339,9 +408,11 @@ out_bad:</div><div class='ctx'>  * parse readdir results</div><div class='ctx'>  */</div><div class='ctx'> static int parse_reply_info_readdir(void **p, void *end,</div><div class='del'>-				struct ceph_mds_reply_info_parsed *info,</div><div class='del'>-				u64 features)</div><div class='add'>+				    struct ceph_mds_request *req,</div><div class='add'>+				    u64 features)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_mds_reply_info_parsed *info = &amp;req-&gt;r_reply_info;</div><div class='add'>+	struct ceph_client *cl = req-&gt;r_mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	u32 num, i = 0;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='hunk'>@@ -364,25 +435,94 @@ static int parse_reply_info_readdir(void **p, void *end,</div><div class='ctx'> 	BUG_ON(!info-&gt;dir_entries);</div><div class='ctx'> 	if ((unsigned long)(info-&gt;dir_entries + num) &gt;</div><div class='ctx'> 	    (unsigned long)info-&gt;dir_entries + info-&gt;dir_buf_size) {</div><div class='del'>-		pr_err("dir contents are larger than expected\n");</div><div class='add'>+		pr_err_client(cl, "dir contents are larger than expected\n");</div><div class='ctx'> 		WARN_ON(1);</div><div class='ctx'> 		goto bad;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	info-&gt;dir_nr = num;</div><div class='ctx'> 	while (num) {</div><div class='add'>+		struct inode *inode = d_inode(req-&gt;r_dentry);</div><div class='add'>+		struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 		struct ceph_mds_reply_dir_entry *rde = info-&gt;dir_entries + i;</div><div class='add'>+		struct fscrypt_str tname = FSTR_INIT(NULL, 0);</div><div class='add'>+		struct fscrypt_str oname = FSTR_INIT(NULL, 0);</div><div class='add'>+		struct ceph_fname fname;</div><div class='add'>+		u32 altname_len, _name_len;</div><div class='add'>+		u8 *altname, *_name;</div><div class='add'>+</div><div class='ctx'> 		/* dentry */</div><div class='del'>-		ceph_decode_32_safe(p, end, rde-&gt;name_len, bad);</div><div class='del'>-		ceph_decode_need(p, end, rde-&gt;name_len, bad);</div><div class='del'>-		rde-&gt;name = *p;</div><div class='del'>-		*p += rde-&gt;name_len;</div><div class='del'>-		dout("parsed dir dname '%.*s'\n", rde-&gt;name_len, rde-&gt;name);</div><div class='add'>+		ceph_decode_32_safe(p, end, _name_len, bad);</div><div class='add'>+		ceph_decode_need(p, end, _name_len, bad);</div><div class='add'>+		_name = *p;</div><div class='add'>+		*p += _name_len;</div><div class='add'>+		doutc(cl, "parsed dir dname '%.*s'\n", _name_len, _name);</div><div class='add'>+</div><div class='add'>+		if (info-&gt;hash_order)</div><div class='add'>+			rde-&gt;raw_hash = ceph_str_hash(ci-&gt;i_dir_layout.dl_dir_hash,</div><div class='add'>+						      _name, _name_len);</div><div class='ctx'> </div><div class='ctx'> 		/* dentry lease */</div><div class='del'>-		err = parse_reply_info_lease(p, end, &amp;rde-&gt;lease, features);</div><div class='add'>+		err = parse_reply_info_lease(p, end, &amp;rde-&gt;lease, features,</div><div class='add'>+					     &amp;altname_len, &amp;altname);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto out_bad;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Try to dencrypt the dentry names and update them</div><div class='add'>+		 * in the ceph_mds_reply_dir_entry struct.</div><div class='add'>+		 */</div><div class='add'>+		fname.dir = inode;</div><div class='add'>+		fname.name = _name;</div><div class='add'>+		fname.name_len = _name_len;</div><div class='add'>+		fname.ctext = altname;</div><div class='add'>+		fname.ctext_len = altname_len;</div><div class='add'>+		/*</div><div class='add'>+		 * The _name_len maybe larger than altname_len, such as</div><div class='add'>+		 * when the human readable name length is in range of</div><div class='add'>+		 * (CEPH_NOHASH_NAME_MAX, CEPH_NOHASH_NAME_MAX + SHA256_DIGEST_SIZE),</div><div class='add'>+		 * then the copy in ceph_fname_to_usr will corrupt the</div><div class='add'>+		 * data if there has no encryption key.</div><div class='add'>+		 *</div><div class='add'>+		 * Just set the no_copy flag and then if there has no</div><div class='add'>+		 * encryption key the oname.name will be assigned to</div><div class='add'>+		 * _name always.</div><div class='add'>+		 */</div><div class='add'>+		fname.no_copy = true;</div><div class='add'>+		if (altname_len == 0) {</div><div class='add'>+			/*</div><div class='add'>+			 * Set tname to _name, and this will be used</div><div class='add'>+			 * to do the base64_decode in-place. It's</div><div class='add'>+			 * safe because the decoded string should</div><div class='add'>+			 * always be shorter, which is 3/4 of origin</div><div class='add'>+			 * string.</div><div class='add'>+			 */</div><div class='add'>+			tname.name = _name;</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * Set oname to _name too, and this will be</div><div class='add'>+			 * used to do the dencryption in-place.</div><div class='add'>+			 */</div><div class='add'>+			oname.name = _name;</div><div class='add'>+			oname.len = _name_len;</div><div class='add'>+		} else {</div><div class='add'>+			/*</div><div class='add'>+			 * This will do the decryption only in-place</div><div class='add'>+			 * from altname cryptext directly.</div><div class='add'>+			 */</div><div class='add'>+			oname.name = altname;</div><div class='add'>+			oname.len = altname_len;</div><div class='add'>+		}</div><div class='add'>+		rde-&gt;is_nokey = false;</div><div class='add'>+		err = ceph_fname_to_usr(&amp;fname, &amp;tname, &amp;oname, &amp;rde-&gt;is_nokey);</div><div class='add'>+		if (err) {</div><div class='add'>+			pr_err_client(cl, "unable to decode %.*s, got %d\n",</div><div class='add'>+				      _name_len, _name, err);</div><div class='add'>+			goto out_bad;</div><div class='add'>+		}</div><div class='add'>+		rde-&gt;name = oname.name;</div><div class='add'>+		rde-&gt;name_len = oname.len;</div><div class='add'>+</div><div class='ctx'> 		/* inode */</div><div class='ctx'> 		err = parse_reply_info_in(p, end, &amp;rde-&gt;inode, features);</div><div class='ctx'> 		if (err &lt; 0)</div><div class='hunk'>@@ -401,7 +541,7 @@ done:</div><div class='ctx'> bad:</div><div class='ctx'> 	err = -EIO;</div><div class='ctx'> out_bad:</div><div class='del'>-	pr_err("problem parsing dir contents %d\n", err);</div><div class='add'>+	pr_err_client(cl, "problem parsing dir contents %d\n", err);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -432,31 +572,33 @@ bad:</div><div class='ctx'> static int ceph_parse_deleg_inos(void **p, void *end,</div><div class='ctx'> 				 struct ceph_mds_session *s)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = s-&gt;s_mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	u32 sets;</div><div class='ctx'> </div><div class='ctx'> 	ceph_decode_32_safe(p, end, sets, bad);</div><div class='del'>-	dout("got %u sets of delegated inodes\n", sets);</div><div class='add'>+	doutc(cl, "got %u sets of delegated inodes\n", sets);</div><div class='ctx'> 	while (sets--) {</div><div class='del'>-		u64 start, len, ino;</div><div class='add'>+		u64 start, len;</div><div class='ctx'> </div><div class='ctx'> 		ceph_decode_64_safe(p, end, start, bad);</div><div class='ctx'> 		ceph_decode_64_safe(p, end, len, bad);</div><div class='ctx'> </div><div class='ctx'> 		/* Don't accept a delegation of system inodes */</div><div class='ctx'> 		if (start &lt; CEPH_INO_SYSTEM_BASE) {</div><div class='del'>-			pr_warn_ratelimited("ceph: ignoring reserved inode range delegation (start=0x%llx len=0x%llx)\n",</div><div class='del'>-					start, len);</div><div class='add'>+			pr_warn_ratelimited_client(cl,</div><div class='add'>+				"ignoring reserved inode range delegation (start=0x%llx len=0x%llx)\n",</div><div class='add'>+				start, len);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> 		while (len--) {</div><div class='del'>-			int err = xa_insert(&amp;s-&gt;s_delegated_inos, ino = start++,</div><div class='add'>+			int err = xa_insert(&amp;s-&gt;s_delegated_inos, start++,</div><div class='ctx'> 					    DELEGATED_INO_AVAILABLE,</div><div class='ctx'> 					    GFP_KERNEL);</div><div class='ctx'> 			if (!err) {</div><div class='del'>-				dout("added delegated inode 0x%llx\n",</div><div class='del'>-				     start - 1);</div><div class='add'>+				doutc(cl, "added delegated inode 0x%llx\n", start - 1);</div><div class='ctx'> 			} else if (err == -EBUSY) {</div><div class='del'>-				pr_warn("ceph: MDS delegated inode 0x%llx more than once.\n",</div><div class='add'>+				pr_warn_client(cl,</div><div class='add'>+					"MDS delegated inode 0x%llx more than once.\n",</div><div class='ctx'> 					start - 1);</div><div class='ctx'> 			} else {</div><div class='ctx'> 				return err;</div><div class='hunk'>@@ -555,21 +697,46 @@ bad:</div><div class='ctx'> 	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int parse_reply_info_getvxattr(void **p, void *end,</div><div class='add'>+				      struct ceph_mds_reply_info_parsed *info,</div><div class='add'>+				      u64 features)</div><div class='add'>+{</div><div class='add'>+	u32 value_len;</div><div class='add'>+</div><div class='add'>+	ceph_decode_skip_8(p, end, bad); /* skip current version: 1 */</div><div class='add'>+	ceph_decode_skip_8(p, end, bad); /* skip first version: 1 */</div><div class='add'>+	ceph_decode_skip_32(p, end, bad); /* skip payload length */</div><div class='add'>+</div><div class='add'>+	ceph_decode_32_safe(p, end, value_len, bad);</div><div class='add'>+</div><div class='add'>+	if (value_len == end - *p) {</div><div class='add'>+	  info-&gt;xattr_info.xattr_value = *p;</div><div class='add'>+	  info-&gt;xattr_info.xattr_value_len = value_len;</div><div class='add'>+	  *p = end;</div><div class='add'>+	  return value_len;</div><div class='add'>+	}</div><div class='add'>+bad:</div><div class='add'>+	return -EIO;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * parse extra results</div><div class='ctx'>  */</div><div class='ctx'> static int parse_reply_info_extra(void **p, void *end,</div><div class='del'>-				  struct ceph_mds_reply_info_parsed *info,</div><div class='add'>+				  struct ceph_mds_request *req,</div><div class='ctx'> 				  u64 features, struct ceph_mds_session *s)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_mds_reply_info_parsed *info = &amp;req-&gt;r_reply_info;</div><div class='ctx'> 	u32 op = le32_to_cpu(info-&gt;head-&gt;op);</div><div class='ctx'> </div><div class='ctx'> 	if (op == CEPH_MDS_OP_GETFILELOCK)</div><div class='ctx'> 		return parse_reply_info_filelock(p, end, info, features);</div><div class='ctx'> 	else if (op == CEPH_MDS_OP_READDIR || op == CEPH_MDS_OP_LSSNAP)</div><div class='del'>-		return parse_reply_info_readdir(p, end, info, features);</div><div class='add'>+		return parse_reply_info_readdir(p, end, req, features);</div><div class='ctx'> 	else if (op == CEPH_MDS_OP_CREATE)</div><div class='ctx'> 		return parse_reply_info_create(p, end, info, features, s);</div><div class='add'>+	else if (op == CEPH_MDS_OP_GETVXATTR)</div><div class='add'>+		return parse_reply_info_getvxattr(p, end, info, features);</div><div class='ctx'> 	else</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> }</div><div class='hunk'>@@ -578,9 +745,10 @@ static int parse_reply_info_extra(void **p, void *end,</div><div class='ctx'>  * parse entire mds reply</div><div class='ctx'>  */</div><div class='ctx'> static int parse_reply_info(struct ceph_mds_session *s, struct ceph_msg *msg,</div><div class='del'>-			    struct ceph_mds_reply_info_parsed *info,</div><div class='del'>-			    u64 features)</div><div class='add'>+			    struct ceph_mds_request *req, u64 features)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_mds_reply_info_parsed *info = &amp;req-&gt;r_reply_info;</div><div class='add'>+	struct ceph_client *cl = s-&gt;s_mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	void *p, *end;</div><div class='ctx'> 	u32 len;</div><div class='ctx'> 	int err;</div><div class='hunk'>@@ -602,7 +770,7 @@ static int parse_reply_info(struct ceph_mds_session *s, struct ceph_msg *msg,</div><div class='ctx'> 	ceph_decode_32_safe(&amp;p, end, len, bad);</div><div class='ctx'> 	if (len &gt; 0) {</div><div class='ctx'> 		ceph_decode_need(&amp;p, end, len, bad);</div><div class='del'>-		err = parse_reply_info_extra(&amp;p, p+len, info, features, s);</div><div class='add'>+		err = parse_reply_info_extra(&amp;p, p+len, req, features, s);</div><div class='ctx'> 		if (err &lt; 0)</div><div class='ctx'> 			goto out_bad;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -620,17 +788,105 @@ static int parse_reply_info(struct ceph_mds_session *s, struct ceph_msg *msg,</div><div class='ctx'> bad:</div><div class='ctx'> 	err = -EIO;</div><div class='ctx'> out_bad:</div><div class='del'>-	pr_err("mds parse_reply err %d\n", err);</div><div class='add'>+	pr_err_client(cl, "mds parse_reply err %d\n", err);</div><div class='add'>+	ceph_msg_dump(msg);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void destroy_reply_info(struct ceph_mds_reply_info_parsed *info)</div><div class='ctx'> {</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	kfree(info-&gt;diri.fscrypt_auth);</div><div class='add'>+	kfree(info-&gt;diri.fscrypt_file);</div><div class='add'>+	kfree(info-&gt;targeti.fscrypt_auth);</div><div class='add'>+	kfree(info-&gt;targeti.fscrypt_file);</div><div class='ctx'> 	if (!info-&gt;dir_entries)</div><div class='ctx'> 		return;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; info-&gt;dir_nr; i++) {</div><div class='add'>+		struct ceph_mds_reply_dir_entry *rde = info-&gt;dir_entries + i;</div><div class='add'>+</div><div class='add'>+		kfree(rde-&gt;inode.fscrypt_auth);</div><div class='add'>+		kfree(rde-&gt;inode.fscrypt_file);</div><div class='add'>+	}</div><div class='ctx'> 	free_pages((unsigned long)info-&gt;dir_entries, get_order(info-&gt;dir_buf_size));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * In async unlink case the kclient won't wait for the first reply</div><div class='add'>+ * from MDS and just drop all the links and unhash the dentry and then</div><div class='add'>+ * succeeds immediately.</div><div class='add'>+ *</div><div class='add'>+ * For any new create/link/rename,etc requests followed by using the</div><div class='add'>+ * same file names we must wait for the first reply of the inflight</div><div class='add'>+ * unlink request, or the MDS possibly will fail these following</div><div class='add'>+ * requests with -EEXIST if the inflight async unlink request was</div><div class='add'>+ * delayed for some reasons.</div><div class='add'>+ *</div><div class='add'>+ * And the worst case is that for the none async openc request it will</div><div class='add'>+ * successfully open the file if the CDentry hasn't been unlinked yet,</div><div class='add'>+ * but later the previous delayed async unlink request will remove the</div><div class='add'>+ * CDentry. That means the just created file is possibly deleted later</div><div class='add'>+ * by accident.</div><div class='add'>+ *</div><div class='add'>+ * We need to wait for the inflight async unlink requests to finish</div><div class='add'>+ * when creating new files/directories by using the same file names.</div><div class='add'>+ */</div><div class='add'>+int ceph_wait_on_conflict_unlink(struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_sb_to_fs_client(dentry-&gt;d_sb);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='add'>+	struct dentry *pdentry = dentry-&gt;d_parent;</div><div class='add'>+	struct dentry *udentry, *found = NULL;</div><div class='add'>+	struct ceph_dentry_info *di;</div><div class='add'>+	struct qstr dname;</div><div class='add'>+	u32 hash = dentry-&gt;d_name.hash;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	dname.name = dentry-&gt;d_name.name;</div><div class='add'>+	dname.len = dentry-&gt;d_name.len;</div><div class='add'>+</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	hash_for_each_possible_rcu(fsc-&gt;async_unlink_conflict, di,</div><div class='add'>+				   hnode, hash) {</div><div class='add'>+		udentry = di-&gt;dentry;</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;udentry-&gt;d_lock);</div><div class='add'>+		if (udentry-&gt;d_name.hash != hash)</div><div class='add'>+			goto next;</div><div class='add'>+		if (unlikely(udentry-&gt;d_parent != pdentry))</div><div class='add'>+			goto next;</div><div class='add'>+		if (!hash_hashed(&amp;di-&gt;hnode))</div><div class='add'>+			goto next;</div><div class='add'>+</div><div class='add'>+		if (!test_bit(CEPH_DENTRY_ASYNC_UNLINK_BIT, &amp;di-&gt;flags))</div><div class='add'>+			pr_warn_client(cl, "dentry %p:%pd async unlink bit is not set\n",</div><div class='add'>+				       dentry, dentry);</div><div class='add'>+</div><div class='add'>+		if (!d_same_name(udentry, pdentry, &amp;dname))</div><div class='add'>+			goto next;</div><div class='add'>+</div><div class='add'>+		found = dget_dlock(udentry);</div><div class='add'>+		spin_unlock(&amp;udentry-&gt;d_lock);</div><div class='add'>+		break;</div><div class='add'>+next:</div><div class='add'>+		spin_unlock(&amp;udentry-&gt;d_lock);</div><div class='add'>+	}</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+</div><div class='add'>+	if (likely(!found))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	doutc(cl, "dentry %p:%pd conflict with old %p:%pd\n", dentry, dentry,</div><div class='add'>+	      found, found);</div><div class='add'>+</div><div class='add'>+	err = wait_on_bit(&amp;di-&gt;flags, CEPH_DENTRY_ASYNC_UNLINK_BIT,</div><div class='add'>+			  TASK_KILLABLE);</div><div class='add'>+	dput(found);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * sessions</div><div class='hunk'>@@ -707,8 +963,12 @@ static int __verify_registered_session(struct ceph_mds_client *mdsc,</div><div class='ctx'> static struct ceph_mds_session *register_session(struct ceph_mds_client *mdsc,</div><div class='ctx'> 						 int mds)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_mds_session *s;</div><div class='ctx'> </div><div class='add'>+	if (READ_ONCE(mdsc-&gt;fsc-&gt;mount_state) == CEPH_MOUNT_FENCE_IO)</div><div class='add'>+		return ERR_PTR(-EIO);</div><div class='add'>+</div><div class='ctx'> 	if (mds &gt;= mdsc-&gt;mdsmap-&gt;possible_max_rank)</div><div class='ctx'> 		return ERR_PTR(-EINVAL);</div><div class='ctx'> </div><div class='hunk'>@@ -719,21 +979,22 @@ static struct ceph_mds_session *register_session(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	if (mds &gt;= mdsc-&gt;max_sessions) {</div><div class='ctx'> 		int newmax = 1 &lt;&lt; get_count_order(mds + 1);</div><div class='ctx'> 		struct ceph_mds_session **sa;</div><div class='add'>+		size_t ptr_size = sizeof(struct ceph_mds_session *);</div><div class='ctx'> </div><div class='del'>-		dout("%s: realloc to %d\n", __func__, newmax);</div><div class='del'>-		sa = kcalloc(newmax, sizeof(void *), GFP_NOFS);</div><div class='add'>+		doutc(cl, "realloc to %d\n", newmax);</div><div class='add'>+		sa = kcalloc(newmax, ptr_size, GFP_NOFS);</div><div class='ctx'> 		if (!sa)</div><div class='ctx'> 			goto fail_realloc;</div><div class='ctx'> 		if (mdsc-&gt;sessions) {</div><div class='ctx'> 			memcpy(sa, mdsc-&gt;sessions,</div><div class='del'>-			       mdsc-&gt;max_sessions * sizeof(void *));</div><div class='add'>+			       mdsc-&gt;max_sessions * ptr_size);</div><div class='ctx'> 			kfree(mdsc-&gt;sessions);</div><div class='ctx'> 		}</div><div class='ctx'> 		mdsc-&gt;sessions = sa;</div><div class='ctx'> 		mdsc-&gt;max_sessions = newmax;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("%s: mds%d\n", __func__, mds);</div><div class='add'>+	doutc(cl, "mds%d\n", mds);</div><div class='ctx'> 	s-&gt;s_mdsc = mdsc;</div><div class='ctx'> 	s-&gt;s_mds = mds;</div><div class='ctx'> 	s-&gt;s_state = CEPH_MDS_SESSION_NEW;</div><div class='hunk'>@@ -776,7 +1037,7 @@ fail_realloc:</div><div class='ctx'> static void __unregister_session(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			       struct ceph_mds_session *s)</div><div class='ctx'> {</div><div class='del'>-	dout("__unregister_session mds%d %p\n", s-&gt;s_mds, s);</div><div class='add'>+	doutc(mdsc-&gt;fsc-&gt;client, "mds%d %p\n", s-&gt;s_mds, s);</div><div class='ctx'> 	BUG_ON(mdsc-&gt;sessions[s-&gt;s_mds] != s);</div><div class='ctx'> 	mdsc-&gt;sessions[s-&gt;s_mds] = NULL;</div><div class='ctx'> 	ceph_con_close(&amp;s-&gt;s_con);</div><div class='hunk'>@@ -829,7 +1090,7 @@ void ceph_mdsc_release_request(struct kref *kref)</div><div class='ctx'> 	struct ceph_mds_request *req = container_of(kref,</div><div class='ctx'> 						    struct ceph_mds_request,</div><div class='ctx'> 						    r_kref);</div><div class='del'>-	ceph_mdsc_release_dir_caps_no_check(req);</div><div class='add'>+	ceph_mdsc_release_dir_caps_async(req);</div><div class='ctx'> 	destroy_reply_info(&amp;req-&gt;r_reply_info);</div><div class='ctx'> 	if (req-&gt;r_request)</div><div class='ctx'> 		ceph_msg_put(req-&gt;r_request);</div><div class='hunk'>@@ -844,6 +1105,7 @@ void ceph_mdsc_release_request(struct kref *kref)</div><div class='ctx'> 		iput(req-&gt;r_parent);</div><div class='ctx'> 	}</div><div class='ctx'> 	iput(req-&gt;r_target_inode);</div><div class='add'>+	iput(req-&gt;r_new_inode);</div><div class='ctx'> 	if (req-&gt;r_dentry)</div><div class='ctx'> 		dput(req-&gt;r_dentry);</div><div class='ctx'> 	if (req-&gt;r_old_dentry)</div><div class='hunk'>@@ -862,8 +1124,12 @@ void ceph_mdsc_release_request(struct kref *kref)</div><div class='ctx'> 	kfree(req-&gt;r_path1);</div><div class='ctx'> 	kfree(req-&gt;r_path2);</div><div class='ctx'> 	put_cred(req-&gt;r_cred);</div><div class='add'>+	if (req-&gt;r_mnt_idmap)</div><div class='add'>+		mnt_idmap_put(req-&gt;r_mnt_idmap);</div><div class='ctx'> 	if (req-&gt;r_pagelist)</div><div class='ctx'> 		ceph_pagelist_release(req-&gt;r_pagelist);</div><div class='add'>+	kfree(req-&gt;r_fscrypt_auth);</div><div class='add'>+	kfree(req-&gt;r_altname);</div><div class='ctx'> 	put_request_session(req);</div><div class='ctx'> 	ceph_unreserve_caps(req-&gt;r_mdsc, &amp;req-&gt;r_caps_reservation);</div><div class='ctx'> 	WARN_ON_ONCE(!list_empty(&amp;req-&gt;r_wait));</div><div class='hunk'>@@ -899,6 +1165,7 @@ static void __register_request(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			       struct ceph_mds_request *req,</div><div class='ctx'> 			       struct inode *dir)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	req-&gt;r_tid = ++mdsc-&gt;last_tid;</div><div class='hunk'>@@ -906,18 +1173,20 @@ static void __register_request(struct ceph_mds_client *mdsc,</div><div class='ctx'> 		ret = ceph_reserve_caps(mdsc, &amp;req-&gt;r_caps_reservation,</div><div class='ctx'> 					req-&gt;r_num_caps);</div><div class='ctx'> 		if (ret &lt; 0) {</div><div class='del'>-			pr_err("__register_request %p "</div><div class='del'>-			       "failed to reserve caps: %d\n", req, ret);</div><div class='add'>+			pr_err_client(cl, "%p failed to reserve caps: %d\n",</div><div class='add'>+				      req, ret);</div><div class='ctx'> 			/* set req-&gt;r_err to fail early from __do_request */</div><div class='ctx'> 			req-&gt;r_err = ret;</div><div class='ctx'> 			return;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	dout("__register_request %p tid %lld\n", req, req-&gt;r_tid);</div><div class='add'>+	doutc(cl, "%p tid %lld\n", req, req-&gt;r_tid);</div><div class='ctx'> 	ceph_mdsc_get_request(req);</div><div class='ctx'> 	insert_request(&amp;mdsc-&gt;request_tree, req);</div><div class='ctx'> </div><div class='ctx'> 	req-&gt;r_cred = get_current_cred();</div><div class='add'>+	if (!req-&gt;r_mnt_idmap)</div><div class='add'>+		req-&gt;r_mnt_idmap = &amp;nop_mnt_idmap;</div><div class='ctx'> </div><div class='ctx'> 	if (mdsc-&gt;oldest_tid == 0 &amp;&amp; req-&gt;r_op != CEPH_MDS_OP_SETFILELOCK)</div><div class='ctx'> 		mdsc-&gt;oldest_tid = req-&gt;r_tid;</div><div class='hunk'>@@ -936,7 +1205,7 @@ static void __register_request(struct ceph_mds_client *mdsc,</div><div class='ctx'> static void __unregister_request(struct ceph_mds_client *mdsc,</div><div class='ctx'> 				 struct ceph_mds_request *req)</div><div class='ctx'> {</div><div class='del'>-	dout("__unregister_request %p tid %lld\n", req, req-&gt;r_tid);</div><div class='add'>+	doutc(mdsc-&gt;fsc-&gt;client, "%p tid %lld\n", req, req-&gt;r_tid);</div><div class='ctx'> </div><div class='ctx'> 	/* Never leave an unregistered request on an unsafe list! */</div><div class='ctx'> 	list_del_init(&amp;req-&gt;r_unsafe_item);</div><div class='hunk'>@@ -1022,6 +1291,7 @@ static int __choose_mds(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	int mds = -1;</div><div class='ctx'> 	u32 hash = req-&gt;r_direct_hash;</div><div class='ctx'> 	bool is_hash = test_bit(CEPH_MDS_R_DIRECT_IS_HASH, &amp;req-&gt;r_req_flags);</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> </div><div class='ctx'> 	if (random)</div><div class='ctx'> 		*random = false;</div><div class='hunk'>@@ -1033,8 +1303,7 @@ static int __choose_mds(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	if (req-&gt;r_resend_mds &gt;= 0 &amp;&amp;</div><div class='ctx'> 	    (__have_session(mdsc, req-&gt;r_resend_mds) ||</div><div class='ctx'> 	     ceph_mdsmap_get_state(mdsc-&gt;mdsmap, req-&gt;r_resend_mds) &gt; 0)) {</div><div class='del'>-		dout("%s using resend_mds mds%d\n", __func__,</div><div class='del'>-		     req-&gt;r_resend_mds);</div><div class='add'>+		doutc(cl, "using resend_mds mds%d\n", req-&gt;r_resend_mds);</div><div class='ctx'> 		return req-&gt;r_resend_mds;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1051,7 +1320,8 @@ static int __choose_mds(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			rcu_read_lock();</div><div class='ctx'> 			inode = get_nonsnap_parent(req-&gt;r_dentry);</div><div class='ctx'> 			rcu_read_unlock();</div><div class='del'>-			dout("%s using snapdir's parent %p\n", __func__, inode);</div><div class='add'>+			doutc(cl, "using snapdir's parent %p %llx.%llx\n",</div><div class='add'>+			      inode, ceph_vinop(inode));</div><div class='ctx'> 		}</div><div class='ctx'> 	} else if (req-&gt;r_dentry) {</div><div class='ctx'> 		/* ignore race with rename; old or new d_parent is okay */</div><div class='hunk'>@@ -1071,7 +1341,8 @@ static int __choose_mds(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			/* direct snapped/virtual snapdir requests</div><div class='ctx'> 			 * based on parent dir inode */</div><div class='ctx'> 			inode = get_nonsnap_parent(parent);</div><div class='del'>-			dout("%s using nonsnap parent %p\n", __func__, inode);</div><div class='add'>+			doutc(cl, "using nonsnap parent %p %llx.%llx\n",</div><div class='add'>+			      inode, ceph_vinop(inode));</div><div class='ctx'> 		} else {</div><div class='ctx'> 			/* dentry target */</div><div class='ctx'> 			inode = d_inode(req-&gt;r_dentry);</div><div class='hunk'>@@ -1087,10 +1358,11 @@ static int __choose_mds(struct ceph_mds_client *mdsc,</div><div class='ctx'> 		rcu_read_unlock();</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("%s %p is_hash=%d (0x%x) mode %d\n", __func__, inode, (int)is_hash,</div><div class='del'>-	     hash, mode);</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		goto random;</div><div class='add'>+</div><div class='add'>+	doutc(cl, "%p %llx.%llx is_hash=%d (0x%x) mode %d\n", inode,</div><div class='add'>+	      ceph_vinop(inode), (int)is_hash, hash, mode);</div><div class='ctx'> 	ci = ceph_inode(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (is_hash &amp;&amp; S_ISDIR(inode-&gt;i_mode)) {</div><div class='hunk'>@@ -1106,9 +1378,9 @@ static int __choose_mds(struct ceph_mds_client *mdsc,</div><div class='ctx'> 				get_random_bytes(&amp;r, 1);</div><div class='ctx'> 				r %= frag.ndist;</div><div class='ctx'> 				mds = frag.dist[r];</div><div class='del'>-				dout("%s %p %llx.%llx frag %u mds%d (%d/%d)\n",</div><div class='del'>-				     __func__, inode, ceph_vinop(inode),</div><div class='del'>-				     frag.frag, mds, (int)r, frag.ndist);</div><div class='add'>+				doutc(cl, "%p %llx.%llx frag %u mds%d (%d/%d)\n",</div><div class='add'>+				      inode, ceph_vinop(inode), frag.frag,</div><div class='add'>+				      mds, (int)r, frag.ndist);</div><div class='ctx'> 				if (ceph_mdsmap_get_state(mdsc-&gt;mdsmap, mds) &gt;=</div><div class='ctx'> 				    CEPH_MDS_STATE_ACTIVE &amp;&amp;</div><div class='ctx'> 				    !ceph_mdsmap_is_laggy(mdsc-&gt;mdsmap, mds))</div><div class='hunk'>@@ -1121,9 +1393,8 @@ static int __choose_mds(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			if (frag.mds &gt;= 0) {</div><div class='ctx'> 				/* choose auth mds */</div><div class='ctx'> 				mds = frag.mds;</div><div class='del'>-				dout("%s %p %llx.%llx frag %u mds%d (auth)\n",</div><div class='del'>-				     __func__, inode, ceph_vinop(inode),</div><div class='del'>-				     frag.frag, mds);</div><div class='add'>+				doutc(cl, "%p %llx.%llx frag %u mds%d (auth)\n",</div><div class='add'>+				      inode, ceph_vinop(inode), frag.frag, mds);</div><div class='ctx'> 				if (ceph_mdsmap_get_state(mdsc-&gt;mdsmap, mds) &gt;=</div><div class='ctx'> 				    CEPH_MDS_STATE_ACTIVE) {</div><div class='ctx'> 					if (!ceph_mdsmap_is_laggy(mdsc-&gt;mdsmap,</div><div class='hunk'>@@ -1147,9 +1418,9 @@ static int __choose_mds(struct ceph_mds_client *mdsc,</div><div class='ctx'> 		goto random;</div><div class='ctx'> 	}</div><div class='ctx'> 	mds = cap-&gt;session-&gt;s_mds;</div><div class='del'>-	dout("%s %p %llx.%llx mds%d (%scap %p)\n", __func__,</div><div class='del'>-	     inode, ceph_vinop(inode), mds,</div><div class='del'>-	     cap == ci-&gt;i_auth_cap ? "auth " : "", cap);</div><div class='add'>+	doutc(cl, "%p %llx.%llx mds%d (%scap %p)\n", inode,</div><div class='add'>+	      ceph_vinop(inode), mds,</div><div class='add'>+	      cap == ci-&gt;i_auth_cap ? "auth " : "", cap);</div><div class='ctx'> 	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> out:</div><div class='ctx'> 	iput(inode);</div><div class='hunk'>@@ -1160,7 +1431,7 @@ random:</div><div class='ctx'> 		*random = true;</div><div class='ctx'> </div><div class='ctx'> 	mds = ceph_mdsmap_get_random_mds(mdsc-&gt;mdsmap);</div><div class='del'>-	dout("%s chose random mds%d\n", __func__, mds);</div><div class='add'>+	doutc(cl, "chose random mds%d\n", mds);</div><div class='ctx'> 	return mds;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1196,14 +1467,17 @@ static int encode_supported_features(void **p, void *end)</div><div class='ctx'> 	if (count &gt; 0) {</div><div class='ctx'> 		size_t i;</div><div class='ctx'> 		size_t size = FEATURE_BYTES(count);</div><div class='add'>+		unsigned long bit;</div><div class='ctx'> </div><div class='ctx'> 		if (WARN_ON_ONCE(*p + 4 + size &gt; end))</div><div class='ctx'> 			return -ERANGE;</div><div class='ctx'> </div><div class='ctx'> 		ceph_encode_32(p, size);</div><div class='ctx'> 		memset(*p, 0, size);</div><div class='del'>-		for (i = 0; i &lt; count; i++)</div><div class='del'>-			((unsigned char*)(*p))[i / 8] |= BIT(feature_bits[i] % 8);</div><div class='add'>+		for (i = 0; i &lt; count; i++) {</div><div class='add'>+			bit = feature_bits[i];</div><div class='add'>+			((unsigned char *)(*p))[bit / 8] |= BIT(bit % 8);</div><div class='add'>+		}</div><div class='ctx'> 		*p += size;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		if (WARN_ON_ONCE(*p + 4 &gt; end))</div><div class='hunk'>@@ -1261,7 +1535,8 @@ static int encode_metric_spec(void **p, void *end)</div><div class='ctx'>  * session message, specialization for CEPH_SESSION_REQUEST_OPEN</div><div class='ctx'>  * to include additional client metadata fields.</div><div class='ctx'>  */</div><div class='del'>-static struct ceph_msg *create_session_open_msg(struct ceph_mds_client *mdsc, u64 seq)</div><div class='add'>+static struct ceph_msg *</div><div class='add'>+create_session_full_msg(struct ceph_mds_client *mdsc, int op, u64 seq)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_msg *msg;</div><div class='ctx'> 	struct ceph_mds_session_head *h;</div><div class='hunk'>@@ -1270,6 +1545,7 @@ static struct ceph_msg *create_session_open_msg(struct ceph_mds_client *mdsc, u6</div><div class='ctx'> 	int metadata_key_count = 0;</div><div class='ctx'> 	struct ceph_options *opt = mdsc-&gt;fsc-&gt;client-&gt;options;</div><div class='ctx'> 	struct ceph_mount_options *fsopt = mdsc-&gt;fsc-&gt;mount_options;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	size_t size, count;</div><div class='ctx'> 	void *p, *end;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -1304,27 +1580,30 @@ static struct ceph_msg *create_session_open_msg(struct ceph_mds_client *mdsc, u6</div><div class='ctx'> 		size = METRIC_BYTES(count);</div><div class='ctx'> 	extra_bytes += 2 + 4 + 4 + size;</div><div class='ctx'> </div><div class='add'>+	/* flags, mds auth caps and oldest_client_tid */</div><div class='add'>+	extra_bytes += 4 + 4 + 8;</div><div class='add'>+</div><div class='ctx'> 	/* Allocate the message */</div><div class='ctx'> 	msg = ceph_msg_new(CEPH_MSG_CLIENT_SESSION, sizeof(*h) + extra_bytes,</div><div class='ctx'> 			   GFP_NOFS, false);</div><div class='ctx'> 	if (!msg) {</div><div class='del'>-		pr_err("ENOMEM creating session open msg\n");</div><div class='add'>+		pr_err_client(cl, "ENOMEM creating session open msg\n");</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> 	}</div><div class='ctx'> 	p = msg-&gt;front.iov_base;</div><div class='ctx'> 	end = p + msg-&gt;front.iov_len;</div><div class='ctx'> </div><div class='ctx'> 	h = p;</div><div class='del'>-	h-&gt;op = cpu_to_le32(CEPH_SESSION_REQUEST_OPEN);</div><div class='add'>+	h-&gt;op = cpu_to_le32(op);</div><div class='ctx'> 	h-&gt;seq = cpu_to_le64(seq);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Serialize client metadata into waiting buffer space, using</div><div class='ctx'> 	 * the format that userspace expects for map&lt;string, string&gt;</div><div class='ctx'> 	 *</div><div class='del'>-	 * ClientSession messages with metadata are v4</div><div class='add'>+	 * ClientSession messages with metadata are v7</div><div class='ctx'> 	 */</div><div class='del'>-	msg-&gt;hdr.version = cpu_to_le16(4);</div><div class='add'>+	msg-&gt;hdr.version = cpu_to_le16(7);</div><div class='ctx'> 	msg-&gt;hdr.compat_version = cpu_to_le16(1);</div><div class='ctx'> </div><div class='ctx'> 	/* The write pointer, following the session_head structure */</div><div class='hunk'>@@ -1348,18 +1627,27 @@ static struct ceph_msg *create_session_open_msg(struct ceph_mds_client *mdsc, u6</div><div class='ctx'> </div><div class='ctx'> 	ret = encode_supported_features(&amp;p, end);</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		pr_err("encode_supported_features failed!\n");</div><div class='add'>+		pr_err_client(cl, "encode_supported_features failed!\n");</div><div class='ctx'> 		ceph_msg_put(msg);</div><div class='ctx'> 		return ERR_PTR(ret);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = encode_metric_spec(&amp;p, end);</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		pr_err("encode_metric_spec failed!\n");</div><div class='add'>+		pr_err_client(cl, "encode_metric_spec failed!\n");</div><div class='ctx'> 		ceph_msg_put(msg);</div><div class='ctx'> 		return ERR_PTR(ret);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/* version == 5, flags */</div><div class='add'>+	ceph_encode_32(&amp;p, 0);</div><div class='add'>+</div><div class='add'>+	/* version == 6, mds auth caps */</div><div class='add'>+	ceph_encode_32(&amp;p, 0);</div><div class='add'>+</div><div class='add'>+	/* version == 7, oldest_client_tid */</div><div class='add'>+	ceph_encode_64(&amp;p, mdsc-&gt;oldest_tid);</div><div class='add'>+</div><div class='ctx'> 	msg-&gt;front.iov_len = p - msg-&gt;front.iov_base;</div><div class='ctx'> 	msg-&gt;hdr.front_len = cpu_to_le32(msg-&gt;front.iov_len);</div><div class='ctx'> </div><div class='hunk'>@@ -1378,15 +1666,19 @@ static int __open_session(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	int mstate;</div><div class='ctx'> 	int mds = session-&gt;s_mds;</div><div class='ctx'> </div><div class='add'>+	if (READ_ONCE(mdsc-&gt;fsc-&gt;mount_state) == CEPH_MOUNT_FENCE_IO)</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='ctx'> 	/* wait for mds to go active? */</div><div class='ctx'> 	mstate = ceph_mdsmap_get_state(mdsc-&gt;mdsmap, mds);</div><div class='del'>-	dout("open_session to mds%d (%s)\n", mds,</div><div class='del'>-	     ceph_mds_state_name(mstate));</div><div class='add'>+	doutc(mdsc-&gt;fsc-&gt;client, "open_session to mds%d (%s)\n", mds,</div><div class='add'>+	      ceph_mds_state_name(mstate));</div><div class='ctx'> 	session-&gt;s_state = CEPH_MDS_SESSION_OPENING;</div><div class='ctx'> 	session-&gt;s_renew_requested = jiffies;</div><div class='ctx'> </div><div class='ctx'> 	/* send connect message */</div><div class='del'>-	msg = create_session_open_msg(mdsc, session-&gt;s_seq);</div><div class='add'>+	msg = create_session_full_msg(mdsc, CEPH_SESSION_REQUEST_OPEN,</div><div class='add'>+				      session-&gt;s_seq);</div><div class='ctx'> 	if (IS_ERR(msg))</div><div class='ctx'> 		return PTR_ERR(msg);</div><div class='ctx'> 	ceph_con_send(&amp;session-&gt;s_con, msg);</div><div class='hunk'>@@ -1424,8 +1716,9 @@ struct ceph_mds_session *</div><div class='ctx'> ceph_mdsc_open_export_target_session(struct ceph_mds_client *mdsc, int target)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_mds_session *session;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> </div><div class='del'>-	dout("open_export_target_session to mds%d\n", target);</div><div class='add'>+	doutc(cl, "to mds%d\n", target);</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> 	session = __open_export_target_session(mdsc, target);</div><div class='hunk'>@@ -1440,13 +1733,14 @@ static void __open_export_target_sessions(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	struct ceph_mds_info *mi;</div><div class='ctx'> 	struct ceph_mds_session *ts;</div><div class='ctx'> 	int i, mds = session-&gt;s_mds;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> </div><div class='ctx'> 	if (mds &gt;= mdsc-&gt;mdsmap-&gt;possible_max_rank)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	mi = &amp;mdsc-&gt;mdsmap-&gt;m_info[mds];</div><div class='del'>-	dout("open_export_target_sessions for mds%d (%d targets)\n",</div><div class='del'>-	     session-&gt;s_mds, mi-&gt;num_export_targets);</div><div class='add'>+	doutc(cl, "for mds%d (%d targets)\n", session-&gt;s_mds,</div><div class='add'>+	      mi-&gt;num_export_targets);</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; mi-&gt;num_export_targets; i++) {</div><div class='ctx'> 		ts = __open_export_target_session(mdsc, mi-&gt;export_targets[i]);</div><div class='hunk'>@@ -1454,14 +1748,6 @@ static void __open_export_target_sessions(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void ceph_mdsc_open_export_target_sessions(struct ceph_mds_client *mdsc,</div><div class='del'>-					   struct ceph_mds_session *session)</div><div class='del'>-{</div><div class='del'>-	mutex_lock(&amp;mdsc-&gt;mutex);</div><div class='del'>-	__open_export_target_sessions(mdsc, session);</div><div class='del'>-	mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * session caps</div><div class='ctx'>  */</div><div class='hunk'>@@ -1469,11 +1755,13 @@ void ceph_mdsc_open_export_target_sessions(struct ceph_mds_client *mdsc,</div><div class='ctx'> static void detach_cap_releases(struct ceph_mds_session *session,</div><div class='ctx'> 				struct list_head *target)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = session-&gt;s_mdsc-&gt;fsc-&gt;client;</div><div class='add'>+</div><div class='ctx'> 	lockdep_assert_held(&amp;session-&gt;s_cap_lock);</div><div class='ctx'> </div><div class='ctx'> 	list_splice_init(&amp;session-&gt;s_cap_releases, target);</div><div class='ctx'> 	session-&gt;s_num_cap_releases = 0;</div><div class='del'>-	dout("dispose_cap_releases mds%d\n", session-&gt;s_mds);</div><div class='add'>+	doutc(cl, "mds%d\n", session-&gt;s_mds);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void dispose_cap_releases(struct ceph_mds_client *mdsc,</div><div class='hunk'>@@ -1491,16 +1779,17 @@ static void dispose_cap_releases(struct ceph_mds_client *mdsc,</div><div class='ctx'> static void cleanup_session_requests(struct ceph_mds_client *mdsc,</div><div class='ctx'> 				     struct ceph_mds_session *session)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_mds_request *req;</div><div class='ctx'> 	struct rb_node *p;</div><div class='ctx'> </div><div class='del'>-	dout("cleanup_session_requests mds%d\n", session-&gt;s_mds);</div><div class='add'>+	doutc(cl, "mds%d\n", session-&gt;s_mds);</div><div class='ctx'> 	mutex_lock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> 	while (!list_empty(&amp;session-&gt;s_unsafe)) {</div><div class='ctx'> 		req = list_first_entry(&amp;session-&gt;s_unsafe,</div><div class='ctx'> 				       struct ceph_mds_request, r_unsafe_item);</div><div class='del'>-		pr_warn_ratelimited(" dropping unsafe request %llu\n",</div><div class='del'>-				    req-&gt;r_tid);</div><div class='add'>+		pr_warn_ratelimited_client(cl, " dropping unsafe request %llu\n",</div><div class='add'>+					   req-&gt;r_tid);</div><div class='ctx'> 		if (req-&gt;r_target_inode)</div><div class='ctx'> 			mapping_set_error(req-&gt;r_target_inode-&gt;i_mapping, -EIO);</div><div class='ctx'> 		if (req-&gt;r_unsafe_dir)</div><div class='hunk'>@@ -1526,26 +1815,30 @@ static void cleanup_session_requests(struct ceph_mds_client *mdsc,</div><div class='ctx'>  * Caller must hold session s_mutex.</div><div class='ctx'>  */</div><div class='ctx'> int ceph_iterate_session_caps(struct ceph_mds_session *session,</div><div class='del'>-			      int (*cb)(struct inode *, struct ceph_cap *,</div><div class='del'>-					void *), void *arg)</div><div class='add'>+			      int (*cb)(struct inode *, int mds, void *),</div><div class='add'>+			      void *arg)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = session-&gt;s_mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct list_head *p;</div><div class='ctx'> 	struct ceph_cap *cap;</div><div class='ctx'> 	struct inode *inode, *last_inode = NULL;</div><div class='ctx'> 	struct ceph_cap *old_cap = NULL;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	dout("iterate_session_caps %p mds%d\n", session, session-&gt;s_mds);</div><div class='add'>+	doutc(cl, "%p mds%d\n", session, session-&gt;s_mds);</div><div class='ctx'> 	spin_lock(&amp;session-&gt;s_cap_lock);</div><div class='ctx'> 	p = session-&gt;s_caps.next;</div><div class='ctx'> 	while (p != &amp;session-&gt;s_caps) {</div><div class='add'>+		int mds;</div><div class='add'>+</div><div class='ctx'> 		cap = list_entry(p, struct ceph_cap, session_caps);</div><div class='del'>-		inode = igrab(&amp;cap-&gt;ci-&gt;vfs_inode);</div><div class='add'>+		inode = igrab(&amp;cap-&gt;ci-&gt;netfs.inode);</div><div class='ctx'> 		if (!inode) {</div><div class='ctx'> 			p = p-&gt;next;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> 		session-&gt;s_cap_iterator = cap;</div><div class='add'>+		mds = cap-&gt;mds;</div><div class='ctx'> 		spin_unlock(&amp;session-&gt;s_cap_lock);</div><div class='ctx'> </div><div class='ctx'> 		if (last_inode) {</div><div class='hunk'>@@ -1557,14 +1850,13 @@ int ceph_iterate_session_caps(struct ceph_mds_session *session,</div><div class='ctx'> 			old_cap = NULL;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		ret = cb(inode, cap, arg);</div><div class='add'>+		ret = cb(inode, mds, arg);</div><div class='ctx'> 		last_inode = inode;</div><div class='ctx'> </div><div class='ctx'> 		spin_lock(&amp;session-&gt;s_cap_lock);</div><div class='ctx'> 		p = p-&gt;next;</div><div class='ctx'> 		if (!cap-&gt;ci) {</div><div class='del'>-			dout("iterate_session_caps  finishing cap %p removal\n",</div><div class='del'>-			     cap);</div><div class='add'>+			doutc(cl, "finishing cap %p removal\n", cap);</div><div class='ctx'> 			BUG_ON(cap-&gt;session != session);</div><div class='ctx'> 			cap-&gt;session = NULL;</div><div class='ctx'> 			list_del_init(&amp;cap-&gt;session_caps);</div><div class='hunk'>@@ -1590,129 +1882,29 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int remove_capsnaps(struct ceph_mds_client *mdsc, struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	struct ceph_cap_snap *capsnap;</div><div class='del'>-	int capsnap_release = 0;</div><div class='del'>-</div><div class='del'>-	lockdep_assert_held(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-</div><div class='del'>-	dout("removing capsnaps, ci is %p, inode is %p\n", ci, inode);</div><div class='del'>-</div><div class='del'>-	while (!list_empty(&amp;ci-&gt;i_cap_snaps)) {</div><div class='del'>-		capsnap = list_first_entry(&amp;ci-&gt;i_cap_snaps,</div><div class='del'>-					   struct ceph_cap_snap, ci_item);</div><div class='del'>-		__ceph_remove_capsnap(inode, capsnap, NULL, NULL);</div><div class='del'>-		ceph_put_snap_context(capsnap-&gt;context);</div><div class='del'>-		ceph_put_cap_snap(capsnap);</div><div class='del'>-		capsnap_release++;</div><div class='del'>-	}</div><div class='del'>-	wake_up_all(&amp;ci-&gt;i_cap_wq);</div><div class='del'>-	wake_up_all(&amp;mdsc-&gt;cap_flushing_wq);</div><div class='del'>-	return capsnap_release;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int remove_session_caps_cb(struct inode *inode, struct ceph_cap *cap,</div><div class='del'>-				  void *arg)</div><div class='add'>+static int remove_session_caps_cb(struct inode *inode, int mds, void *arg)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_fs_client *fsc = (struct ceph_fs_client *)arg;</div><div class='del'>-	struct ceph_mds_client *mdsc = fsc-&gt;mdsc;</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	LIST_HEAD(to_remove);</div><div class='del'>-	bool dirty_dropped = false;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	bool invalidate = false;</div><div class='del'>-	int capsnap_release = 0;</div><div class='add'>+	struct ceph_cap *cap;</div><div class='add'>+	int iputs = 0;</div><div class='ctx'> </div><div class='del'>-	dout("removing cap %p, ci is %p, inode is %p\n",</div><div class='del'>-	     cap, ci, &amp;ci-&gt;vfs_inode);</div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-	__ceph_remove_cap(cap, false);</div><div class='del'>-	if (!ci-&gt;i_auth_cap) {</div><div class='del'>-		struct ceph_cap_flush *cf;</div><div class='del'>-</div><div class='del'>-		if (READ_ONCE(fsc-&gt;mount_state) &gt;= CEPH_MOUNT_SHUTDOWN) {</div><div class='del'>-			if (inode-&gt;i_data.nrpages &gt; 0)</div><div class='del'>-				invalidate = true;</div><div class='del'>-			if (ci-&gt;i_wrbuffer_ref &gt; 0)</div><div class='del'>-				mapping_set_error(&amp;inode-&gt;i_data, -EIO);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		while (!list_empty(&amp;ci-&gt;i_cap_flush_list)) {</div><div class='del'>-			cf = list_first_entry(&amp;ci-&gt;i_cap_flush_list,</div><div class='del'>-					      struct ceph_cap_flush, i_list);</div><div class='del'>-			list_move(&amp;cf-&gt;i_list, &amp;to_remove);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		spin_lock(&amp;mdsc-&gt;cap_dirty_lock);</div><div class='add'>+	cap = __get_cap_for_mds(ci, mds);</div><div class='add'>+	if (cap) {</div><div class='add'>+		doutc(cl, " removing cap %p, ci is %p, inode is %p\n",</div><div class='add'>+		      cap, ci, &amp;ci-&gt;netfs.inode);</div><div class='ctx'> </div><div class='del'>-		list_for_each_entry(cf, &amp;to_remove, i_list)</div><div class='del'>-			list_del_init(&amp;cf-&gt;g_list);</div><div class='del'>-</div><div class='del'>-		if (!list_empty(&amp;ci-&gt;i_dirty_item)) {</div><div class='del'>-			pr_warn_ratelimited(</div><div class='del'>-				" dropping dirty %s state for %p %lld\n",</div><div class='del'>-				ceph_cap_string(ci-&gt;i_dirty_caps),</div><div class='del'>-				inode, ceph_ino(inode));</div><div class='del'>-			ci-&gt;i_dirty_caps = 0;</div><div class='del'>-			list_del_init(&amp;ci-&gt;i_dirty_item);</div><div class='del'>-			dirty_dropped = true;</div><div class='del'>-		}</div><div class='del'>-		if (!list_empty(&amp;ci-&gt;i_flushing_item)) {</div><div class='del'>-			pr_warn_ratelimited(</div><div class='del'>-				" dropping dirty+flushing %s state for %p %lld\n",</div><div class='del'>-				ceph_cap_string(ci-&gt;i_flushing_caps),</div><div class='del'>-				inode, ceph_ino(inode));</div><div class='del'>-			ci-&gt;i_flushing_caps = 0;</div><div class='del'>-			list_del_init(&amp;ci-&gt;i_flushing_item);</div><div class='del'>-			mdsc-&gt;num_cap_flushing--;</div><div class='del'>-			dirty_dropped = true;</div><div class='del'>-		}</div><div class='del'>-		spin_unlock(&amp;mdsc-&gt;cap_dirty_lock);</div><div class='del'>-</div><div class='del'>-		if (dirty_dropped) {</div><div class='del'>-			mapping_set_error(inode-&gt;i_mapping, -EIO);</div><div class='del'>-</div><div class='del'>-			if (ci-&gt;i_wrbuffer_ref_head == 0 &amp;&amp;</div><div class='del'>-			    ci-&gt;i_wr_ref == 0 &amp;&amp;</div><div class='del'>-			    ci-&gt;i_dirty_caps == 0 &amp;&amp;</div><div class='del'>-			    ci-&gt;i_flushing_caps == 0) {</div><div class='del'>-				ceph_put_snap_context(ci-&gt;i_head_snapc);</div><div class='del'>-				ci-&gt;i_head_snapc = NULL;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (atomic_read(&amp;ci-&gt;i_filelock_ref) &gt; 0) {</div><div class='del'>-			/* make further file lock syscall return -EIO */</div><div class='del'>-			ci-&gt;i_ceph_flags |= CEPH_I_ERROR_FILELOCK;</div><div class='del'>-			pr_warn_ratelimited(" dropping file locks for %p %lld\n",</div><div class='del'>-					    inode, ceph_ino(inode));</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (!ci-&gt;i_dirty_caps &amp;&amp; ci-&gt;i_prealloc_cap_flush) {</div><div class='del'>-			list_add(&amp;ci-&gt;i_prealloc_cap_flush-&gt;i_list, &amp;to_remove);</div><div class='del'>-			ci-&gt;i_prealloc_cap_flush = NULL;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (!list_empty(&amp;ci-&gt;i_cap_snaps))</div><div class='del'>-			capsnap_release = remove_capsnaps(mdsc, inode);</div><div class='add'>+		iputs = ceph_purge_inode_cap(inode, cap, &amp;invalidate);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-	while (!list_empty(&amp;to_remove)) {</div><div class='del'>-		struct ceph_cap_flush *cf;</div><div class='del'>-		cf = list_first_entry(&amp;to_remove,</div><div class='del'>-				      struct ceph_cap_flush, i_list);</div><div class='del'>-		list_del_init(&amp;cf-&gt;i_list);</div><div class='del'>-		if (!cf-&gt;is_capsnap)</div><div class='del'>-			ceph_free_cap_flush(cf);</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	wake_up_all(&amp;ci-&gt;i_cap_wq);</div><div class='add'>+	if (cap)</div><div class='add'>+		wake_up_all(&amp;ci-&gt;i_cap_wq);</div><div class='ctx'> 	if (invalidate)</div><div class='ctx'> 		ceph_queue_invalidate(inode);</div><div class='del'>-	if (dirty_dropped)</div><div class='del'>-		iput(inode);</div><div class='del'>-	while (capsnap_release--)</div><div class='add'>+	while (iputs--)</div><div class='ctx'> 		iput(inode);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -1726,7 +1918,7 @@ static void remove_session_caps(struct ceph_mds_session *session)</div><div class='ctx'> 	struct super_block *sb = fsc-&gt;sb;</div><div class='ctx'> 	LIST_HEAD(dispose);</div><div class='ctx'> </div><div class='del'>-	dout("remove_session_caps on %p\n", session);</div><div class='add'>+	doutc(fsc-&gt;client, "on %p\n", session);</div><div class='ctx'> 	ceph_iterate_session_caps(session, remove_session_caps_cb, fsc);</div><div class='ctx'> </div><div class='ctx'> 	wake_up_all(&amp;fsc-&gt;mdsc-&gt;cap_flushing_wq);</div><div class='hunk'>@@ -1780,8 +1972,7 @@ enum {</div><div class='ctx'>  *</div><div class='ctx'>  * caller must hold s_mutex.</div><div class='ctx'>  */</div><div class='del'>-static int wake_up_session_cb(struct inode *inode, struct ceph_cap *cap,</div><div class='del'>-			      void *arg)</div><div class='add'>+static int wake_up_session_cb(struct inode *inode, int mds, void *arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	unsigned long ev = (unsigned long)arg;</div><div class='hunk'>@@ -1792,12 +1983,14 @@ static int wake_up_session_cb(struct inode *inode, struct ceph_cap *cap,</div><div class='ctx'> 		ci-&gt;i_requested_max_size = 0;</div><div class='ctx'> 		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 	} else if (ev == RENEWCAPS) {</div><div class='del'>-		if (cap-&gt;cap_gen &lt; atomic_read(&amp;cap-&gt;session-&gt;s_cap_gen)) {</div><div class='del'>-			/* mds did not re-issue stale cap */</div><div class='del'>-			spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+		struct ceph_cap *cap;</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+		cap = __get_cap_for_mds(ci, mds);</div><div class='add'>+		/* mds did not re-issue stale cap */</div><div class='add'>+		if (cap &amp;&amp; cap-&gt;cap_gen &lt; atomic_read(&amp;cap-&gt;session-&gt;s_cap_gen))</div><div class='ctx'> 			cap-&gt;issued = cap-&gt;implemented = CEPH_CAP_PIN;</div><div class='del'>-			spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-		}</div><div class='add'>+		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 	} else if (ev == FORCE_RO) {</div><div class='ctx'> 	}</div><div class='ctx'> 	wake_up_all(&amp;ci-&gt;i_cap_wq);</div><div class='hunk'>@@ -1806,7 +1999,9 @@ static int wake_up_session_cb(struct inode *inode, struct ceph_cap *cap,</div><div class='ctx'> </div><div class='ctx'> static void wake_up_session_caps(struct ceph_mds_session *session, int ev)</div><div class='ctx'> {</div><div class='del'>-	dout("wake_up_session_caps %p mds%d\n", session, session-&gt;s_mds);</div><div class='add'>+	struct ceph_client *cl = session-&gt;s_mdsc-&gt;fsc-&gt;client;</div><div class='add'>+</div><div class='add'>+	doutc(cl, "session %p mds%d\n", session, session-&gt;s_mds);</div><div class='ctx'> 	ceph_iterate_session_caps(session, wake_up_session_cb,</div><div class='ctx'> 				  (void *)(unsigned long)ev);</div><div class='ctx'> }</div><div class='hunk'>@@ -1820,29 +2015,30 @@ static void wake_up_session_caps(struct ceph_mds_session *session, int ev)</div><div class='ctx'> static int send_renew_caps(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			   struct ceph_mds_session *session)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_msg *msg;</div><div class='ctx'> 	int state;</div><div class='ctx'> </div><div class='ctx'> 	if (time_after_eq(jiffies, session-&gt;s_cap_ttl) &amp;&amp;</div><div class='ctx'> 	    time_after_eq(session-&gt;s_cap_ttl, session-&gt;s_renew_requested))</div><div class='del'>-		pr_info("mds%d caps stale\n", session-&gt;s_mds);</div><div class='add'>+		pr_info_client(cl, "mds%d caps stale\n", session-&gt;s_mds);</div><div class='ctx'> 	session-&gt;s_renew_requested = jiffies;</div><div class='ctx'> </div><div class='ctx'> 	/* do not try to renew caps until a recovering mds has reconnected</div><div class='ctx'> 	 * with its clients. */</div><div class='ctx'> 	state = ceph_mdsmap_get_state(mdsc-&gt;mdsmap, session-&gt;s_mds);</div><div class='ctx'> 	if (state &lt; CEPH_MDS_STATE_RECONNECT) {</div><div class='del'>-		dout("send_renew_caps ignoring mds%d (%s)\n",</div><div class='del'>-		     session-&gt;s_mds, ceph_mds_state_name(state));</div><div class='add'>+		doutc(cl, "ignoring mds%d (%s)\n", session-&gt;s_mds,</div><div class='add'>+		      ceph_mds_state_name(state));</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("send_renew_caps to mds%d (%s)\n", session-&gt;s_mds,</div><div class='del'>-		ceph_mds_state_name(state));</div><div class='del'>-	msg = ceph_create_session_msg(CEPH_SESSION_REQUEST_RENEWCAPS,</div><div class='add'>+	doutc(cl, "to mds%d (%s)\n", session-&gt;s_mds,</div><div class='add'>+	      ceph_mds_state_name(state));</div><div class='add'>+	msg = create_session_full_msg(mdsc, CEPH_SESSION_REQUEST_RENEWCAPS,</div><div class='ctx'> 				      ++session-&gt;s_renew_seq);</div><div class='del'>-	if (!msg)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	if (IS_ERR(msg))</div><div class='add'>+		return PTR_ERR(msg);</div><div class='ctx'> 	ceph_con_send(&amp;session-&gt;s_con, msg);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -1850,10 +2046,11 @@ static int send_renew_caps(struct ceph_mds_client *mdsc,</div><div class='ctx'> static int send_flushmsg_ack(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			     struct ceph_mds_session *session, u64 seq)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_msg *msg;</div><div class='ctx'> </div><div class='del'>-	dout("send_flushmsg_ack to mds%d (%s)s seq %lld\n",</div><div class='del'>-	     session-&gt;s_mds, ceph_session_state_name(session-&gt;s_state), seq);</div><div class='add'>+	doutc(cl, "to mds%d (%s)s seq %lld\n", session-&gt;s_mds,</div><div class='add'>+	      ceph_session_state_name(session-&gt;s_state), seq);</div><div class='ctx'> 	msg = ceph_create_session_msg(CEPH_SESSION_FLUSHMSG_ACK, seq);</div><div class='ctx'> 	if (!msg)</div><div class='ctx'> 		return -ENOMEM;</div><div class='hunk'>@@ -1870,6 +2067,7 @@ static int send_flushmsg_ack(struct ceph_mds_client *mdsc,</div><div class='ctx'> static void renewed_caps(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			 struct ceph_mds_session *session, int is_renew)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	int was_stale;</div><div class='ctx'> 	int wake = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -1881,15 +2079,17 @@ static void renewed_caps(struct ceph_mds_client *mdsc,</div><div class='ctx'> </div><div class='ctx'> 	if (was_stale) {</div><div class='ctx'> 		if (time_before(jiffies, session-&gt;s_cap_ttl)) {</div><div class='del'>-			pr_info("mds%d caps renewed\n", session-&gt;s_mds);</div><div class='add'>+			pr_info_client(cl, "mds%d caps renewed\n",</div><div class='add'>+				       session-&gt;s_mds);</div><div class='ctx'> 			wake = 1;</div><div class='ctx'> 		} else {</div><div class='del'>-			pr_info("mds%d caps still stale\n", session-&gt;s_mds);</div><div class='add'>+			pr_info_client(cl, "mds%d caps still stale\n",</div><div class='add'>+				       session-&gt;s_mds);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	dout("renewed_caps mds%d ttl now %lu, was %s, now %s\n",</div><div class='del'>-	     session-&gt;s_mds, session-&gt;s_cap_ttl, was_stale ? "stale" : "fresh",</div><div class='del'>-	     time_before(jiffies, session-&gt;s_cap_ttl) ? "stale" : "fresh");</div><div class='add'>+	doutc(cl, "mds%d ttl now %lu, was %s, now %s\n", session-&gt;s_mds,</div><div class='add'>+	      session-&gt;s_cap_ttl, was_stale ? "stale" : "fresh",</div><div class='add'>+	      time_before(jiffies, session-&gt;s_cap_ttl) ? "stale" : "fresh");</div><div class='ctx'> 	spin_unlock(&amp;session-&gt;s_cap_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (wake)</div><div class='hunk'>@@ -1901,11 +2101,11 @@ static void renewed_caps(struct ceph_mds_client *mdsc,</div><div class='ctx'>  */</div><div class='ctx'> static int request_close_session(struct ceph_mds_session *session)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = session-&gt;s_mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_msg *msg;</div><div class='ctx'> </div><div class='del'>-	dout("request_close_session mds%d state %s seq %lld\n",</div><div class='del'>-	     session-&gt;s_mds, ceph_session_state_name(session-&gt;s_state),</div><div class='del'>-	     session-&gt;s_seq);</div><div class='add'>+	doutc(cl, "mds%d state %s seq %lld\n", session-&gt;s_mds,</div><div class='add'>+	      ceph_session_state_name(session-&gt;s_state), session-&gt;s_seq);</div><div class='ctx'> 	msg = ceph_create_session_msg(CEPH_SESSION_REQUEST_CLOSE,</div><div class='ctx'> 				      session-&gt;s_seq);</div><div class='ctx'> 	if (!msg)</div><div class='hunk'>@@ -1935,7 +2135,7 @@ static bool drop_negative_children(struct dentry *dentry)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;dentry-&gt;d_lock);</div><div class='del'>-	list_for_each_entry(child, &amp;dentry-&gt;d_subdirs, d_child) {</div><div class='add'>+	hlist_for_each_entry(child, &amp;dentry-&gt;d_children, d_sib) {</div><div class='ctx'> 		if (d_really_is_positive(child)) {</div><div class='ctx'> 			all_negative = false;</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -1959,24 +2159,33 @@ out:</div><div class='ctx'>  * Yes, this is a bit sloppy.  Our only real goal here is to respond to</div><div class='ctx'>  * memory pressure from the MDS, though, so it needn't be perfect.</div><div class='ctx'>  */</div><div class='del'>-static int trim_caps_cb(struct inode *inode, struct ceph_cap *cap, void *arg)</div><div class='add'>+static int trim_caps_cb(struct inode *inode, int mds, void *arg)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_sb_to_mdsc(inode-&gt;i_sb);</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	int *remaining = arg;</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	int used, wanted, oissued, mine;</div><div class='add'>+	struct ceph_cap *cap;</div><div class='ctx'> </div><div class='ctx'> 	if (*remaining &lt;= 0)</div><div class='ctx'> 		return -1;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+	cap = __get_cap_for_mds(ci, mds);</div><div class='add'>+	if (!cap) {</div><div class='add'>+		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='ctx'> 	mine = cap-&gt;issued | cap-&gt;implemented;</div><div class='ctx'> 	used = __ceph_caps_used(ci);</div><div class='ctx'> 	wanted = __ceph_caps_file_wanted(ci);</div><div class='ctx'> 	oissued = __ceph_caps_issued_other(ci, cap);</div><div class='ctx'> </div><div class='del'>-	dout("trim_caps_cb %p cap %p mine %s oissued %s used %s wanted %s\n",</div><div class='del'>-	     inode, cap, ceph_cap_string(mine), ceph_cap_string(oissued),</div><div class='del'>-	     ceph_cap_string(used), ceph_cap_string(wanted));</div><div class='add'>+	doutc(cl, "%p %llx.%llx cap %p mine %s oissued %s used %s wanted %s\n",</div><div class='add'>+	      inode, ceph_vinop(inode), cap, ceph_cap_string(mine),</div><div class='add'>+	      ceph_cap_string(oissued), ceph_cap_string(used),</div><div class='add'>+	      ceph_cap_string(wanted));</div><div class='ctx'> 	if (cap == ci-&gt;i_auth_cap) {</div><div class='ctx'> 		if (ci-&gt;i_dirty_caps || ci-&gt;i_flushing_caps ||</div><div class='ctx'> 		    !list_empty(&amp;ci-&gt;i_cap_snaps))</div><div class='hunk'>@@ -2002,7 +2211,7 @@ static int trim_caps_cb(struct inode *inode, struct ceph_cap *cap, void *arg)</div><div class='ctx'> </div><div class='ctx'> 	if (oissued) {</div><div class='ctx'> 		/* we aren't the only cap.. just remove us */</div><div class='del'>-		ceph_remove_cap(cap, true);</div><div class='add'>+		ceph_remove_cap(mdsc, cap, true);</div><div class='ctx'> 		(*remaining)--;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		struct dentry *dentry;</div><div class='hunk'>@@ -2013,11 +2222,11 @@ static int trim_caps_cb(struct inode *inode, struct ceph_cap *cap, void *arg)</div><div class='ctx'> 			int count;</div><div class='ctx'> 			dput(dentry);</div><div class='ctx'> 			d_prune_aliases(inode);</div><div class='del'>-			count = atomic_read(&amp;inode-&gt;i_count);</div><div class='add'>+			count = icount_read(inode);</div><div class='ctx'> 			if (count == 1)</div><div class='ctx'> 				(*remaining)--;</div><div class='del'>-			dout("trim_caps_cb %p cap %p pruned, count now %d\n",</div><div class='del'>-			     inode, cap, count);</div><div class='add'>+			doutc(cl, "%p %llx.%llx cap %p pruned, count now %d\n",</div><div class='add'>+			      inode, ceph_vinop(inode), cap, count);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			dput(dentry);</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2036,26 +2245,28 @@ int ceph_trim_caps(struct ceph_mds_client *mdsc,</div><div class='ctx'> 		   struct ceph_mds_session *session,</div><div class='ctx'> 		   int max_caps)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	int trim_caps = session-&gt;s_nr_caps - max_caps;</div><div class='ctx'> </div><div class='del'>-	dout("trim_caps mds%d start: %d / %d, trim %d\n",</div><div class='del'>-	     session-&gt;s_mds, session-&gt;s_nr_caps, max_caps, trim_caps);</div><div class='add'>+	doutc(cl, "mds%d start: %d / %d, trim %d\n", session-&gt;s_mds,</div><div class='add'>+	      session-&gt;s_nr_caps, max_caps, trim_caps);</div><div class='ctx'> 	if (trim_caps &gt; 0) {</div><div class='ctx'> 		int remaining = trim_caps;</div><div class='ctx'> </div><div class='ctx'> 		ceph_iterate_session_caps(session, trim_caps_cb, &amp;remaining);</div><div class='del'>-		dout("trim_caps mds%d done: %d / %d, trimmed %d\n",</div><div class='del'>-		     session-&gt;s_mds, session-&gt;s_nr_caps, max_caps,</div><div class='del'>-			trim_caps - remaining);</div><div class='add'>+		doutc(cl, "mds%d done: %d / %d, trimmed %d\n",</div><div class='add'>+		      session-&gt;s_mds, session-&gt;s_nr_caps, max_caps,</div><div class='add'>+		      trim_caps - remaining);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ceph_flush_cap_releases(mdsc, session);</div><div class='add'>+	ceph_flush_session_cap_releases(mdsc, session);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int check_caps_flush(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			    u64 want_flush_tid)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	int ret = 1;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;mdsc-&gt;cap_dirty_lock);</div><div class='hunk'>@@ -2064,8 +2275,8 @@ static int check_caps_flush(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			list_first_entry(&amp;mdsc-&gt;cap_flush_list,</div><div class='ctx'> 					 struct ceph_cap_flush, g_list);</div><div class='ctx'> 		if (cf-&gt;tid &lt;= want_flush_tid) {</div><div class='del'>-			dout("check_caps_flush still flushing tid "</div><div class='del'>-			     "%llu &lt;= %llu\n", cf-&gt;tid, want_flush_tid);</div><div class='add'>+			doutc(cl, "still flushing tid %llu &lt;= %llu\n",</div><div class='add'>+			      cf-&gt;tid, want_flush_tid);</div><div class='ctx'> 			ret = 0;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2081,12 +2292,14 @@ static int check_caps_flush(struct ceph_mds_client *mdsc,</div><div class='ctx'> static void wait_caps_flush(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			    u64 want_flush_tid)</div><div class='ctx'> {</div><div class='del'>-	dout("check_caps_flush want %llu\n", want_flush_tid);</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='add'>+</div><div class='add'>+	doutc(cl, "want %llu\n", want_flush_tid);</div><div class='ctx'> </div><div class='ctx'> 	wait_event(mdsc-&gt;cap_flushing_wq,</div><div class='ctx'> 		   check_caps_flush(mdsc, want_flush_tid));</div><div class='ctx'> </div><div class='del'>-	dout("check_caps_flush ok, flushed thru %llu\n", want_flush_tid);</div><div class='add'>+	doutc(cl, "ok, flushed thru %llu\n", want_flush_tid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2095,6 +2308,7 @@ static void wait_caps_flush(struct ceph_mds_client *mdsc,</div><div class='ctx'> static void ceph_send_cap_releases(struct ceph_mds_client *mdsc,</div><div class='ctx'> 				   struct ceph_mds_session *session)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_msg *msg = NULL;</div><div class='ctx'> 	struct ceph_mds_cap_release *head;</div><div class='ctx'> 	struct ceph_mds_cap_item *item;</div><div class='hunk'>@@ -2141,7 +2355,7 @@ again:</div><div class='ctx'> 		item-&gt;ino = cpu_to_le64(cap-&gt;cap_ino);</div><div class='ctx'> 		item-&gt;cap_id = cpu_to_le64(cap-&gt;cap_id);</div><div class='ctx'> 		item-&gt;migrate_seq = cpu_to_le32(cap-&gt;mseq);</div><div class='del'>-		item-&gt;seq = cpu_to_le32(cap-&gt;issue_seq);</div><div class='add'>+		item-&gt;issue_seq = cpu_to_le32(cap-&gt;issue_seq);</div><div class='ctx'> 		msg-&gt;front.iov_len += sizeof(*item);</div><div class='ctx'> </div><div class='ctx'> 		ceph_put_cap(mdsc, cap);</div><div class='hunk'>@@ -2153,7 +2367,7 @@ again:</div><div class='ctx'> 			msg-&gt;front.iov_len += sizeof(*cap_barrier);</div><div class='ctx'> </div><div class='ctx'> 			msg-&gt;hdr.front_len = cpu_to_le32(msg-&gt;front.iov_len);</div><div class='del'>-			dout("send_cap_releases mds%d %p\n", session-&gt;s_mds, msg);</div><div class='add'>+			doutc(cl, "mds%d %p\n", session-&gt;s_mds, msg);</div><div class='ctx'> 			ceph_con_send(&amp;session-&gt;s_con, msg);</div><div class='ctx'> 			msg = NULL;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2173,13 +2387,13 @@ again:</div><div class='ctx'> 		msg-&gt;front.iov_len += sizeof(*cap_barrier);</div><div class='ctx'> </div><div class='ctx'> 		msg-&gt;hdr.front_len = cpu_to_le32(msg-&gt;front.iov_len);</div><div class='del'>-		dout("send_cap_releases mds%d %p\n", session-&gt;s_mds, msg);</div><div class='add'>+		doutc(cl, "mds%d %p\n", session-&gt;s_mds, msg);</div><div class='ctx'> 		ceph_con_send(&amp;session-&gt;s_con, msg);</div><div class='ctx'> 	}</div><div class='ctx'> 	return;</div><div class='ctx'> out_err:</div><div class='del'>-	pr_err("send_cap_releases mds%d, failed to allocate message\n",</div><div class='del'>-		session-&gt;s_mds);</div><div class='add'>+	pr_err_client(cl, "mds%d, failed to allocate message\n",</div><div class='add'>+		      session-&gt;s_mds);</div><div class='ctx'> 	spin_lock(&amp;session-&gt;s_cap_lock);</div><div class='ctx'> 	list_splice(&amp;tmp_list, &amp;session-&gt;s_cap_releases);</div><div class='ctx'> 	session-&gt;s_num_cap_releases += num_cap_releases;</div><div class='hunk'>@@ -2199,19 +2413,20 @@ static void ceph_cap_release_work(struct work_struct *work)</div><div class='ctx'> 	ceph_put_mds_session(session);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void ceph_flush_cap_releases(struct ceph_mds_client *mdsc,</div><div class='add'>+void ceph_flush_session_cap_releases(struct ceph_mds_client *mdsc,</div><div class='ctx'> 		             struct ceph_mds_session *session)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	if (mdsc-&gt;stopping)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	ceph_get_mds_session(session);</div><div class='ctx'> 	if (queue_work(mdsc-&gt;fsc-&gt;cap_wq,</div><div class='ctx'> 		       &amp;session-&gt;s_cap_release_work)) {</div><div class='del'>-		dout("cap release work queued\n");</div><div class='add'>+		doutc(cl, "cap release work queued\n");</div><div class='ctx'> 	} else {</div><div class='ctx'> 		ceph_put_mds_session(session);</div><div class='del'>-		dout("failed to queue cap release work\n");</div><div class='add'>+		doutc(cl, "failed to queue cap release work\n");</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2225,7 +2440,7 @@ void __ceph_queue_cap_release(struct ceph_mds_session *session,</div><div class='ctx'> 	session-&gt;s_num_cap_releases++;</div><div class='ctx'> </div><div class='ctx'> 	if (!(session-&gt;s_num_cap_releases % CEPH_CAPS_PER_RELEASE))</div><div class='del'>-		ceph_flush_cap_releases(session-&gt;s_mdsc, session);</div><div class='add'>+		ceph_flush_session_cap_releases(session-&gt;s_mdsc, session);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void ceph_cap_reclaim_work(struct work_struct *work)</div><div class='hunk'>@@ -2239,13 +2454,14 @@ static void ceph_cap_reclaim_work(struct work_struct *work)</div><div class='ctx'> </div><div class='ctx'> void ceph_queue_cap_reclaim_work(struct ceph_mds_client *mdsc)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	if (mdsc-&gt;stopping)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'>         if (queue_work(mdsc-&gt;fsc-&gt;cap_wq, &amp;mdsc-&gt;cap_reclaim_work)) {</div><div class='del'>-                dout("caps reclaim work queued\n");</div><div class='add'>+                doutc(cl, "caps reclaim work queued\n");</div><div class='ctx'>         } else {</div><div class='del'>-                dout("failed to queue caps release work\n");</div><div class='add'>+                doutc(cl, "failed to queue caps release work\n");</div><div class='ctx'>         }</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2261,6 +2477,50 @@ void ceph_reclaim_caps_nr(struct ceph_mds_client *mdsc, int nr)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void ceph_queue_cap_unlink_work(struct ceph_mds_client *mdsc)</div><div class='add'>+{</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='add'>+	if (mdsc-&gt;stopping)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+        if (queue_work(mdsc-&gt;fsc-&gt;cap_wq, &amp;mdsc-&gt;cap_unlink_work)) {</div><div class='add'>+                doutc(cl, "caps unlink work queued\n");</div><div class='add'>+        } else {</div><div class='add'>+                doutc(cl, "failed to queue caps unlink work\n");</div><div class='add'>+        }</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void ceph_cap_unlink_work(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct ceph_mds_client *mdsc =</div><div class='add'>+		container_of(work, struct ceph_mds_client, cap_unlink_work);</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='add'>+</div><div class='add'>+	doutc(cl, "begin\n");</div><div class='add'>+	spin_lock(&amp;mdsc-&gt;cap_delay_lock);</div><div class='add'>+	while (!list_empty(&amp;mdsc-&gt;cap_unlink_delay_list)) {</div><div class='add'>+		struct ceph_inode_info *ci;</div><div class='add'>+		struct inode *inode;</div><div class='add'>+</div><div class='add'>+		ci = list_first_entry(&amp;mdsc-&gt;cap_unlink_delay_list,</div><div class='add'>+				      struct ceph_inode_info,</div><div class='add'>+				      i_cap_delay_list);</div><div class='add'>+		list_del_init(&amp;ci-&gt;i_cap_delay_list);</div><div class='add'>+</div><div class='add'>+		inode = igrab(&amp;ci-&gt;netfs.inode);</div><div class='add'>+		if (inode) {</div><div class='add'>+			spin_unlock(&amp;mdsc-&gt;cap_delay_lock);</div><div class='add'>+			doutc(cl, "on %p %llx.%llx\n", inode,</div><div class='add'>+			      ceph_vinop(inode));</div><div class='add'>+			ceph_check_caps(ci, CHECK_CAPS_FLUSH);</div><div class='add'>+			iput(inode);</div><div class='add'>+			spin_lock(&amp;mdsc-&gt;cap_delay_lock);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;mdsc-&gt;cap_delay_lock);</div><div class='add'>+	doutc(cl, "done\n");</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * requests</div><div class='ctx'>  */</div><div class='hunk'>@@ -2273,6 +2533,7 @@ int ceph_alloc_readdir_reply_buffer(struct ceph_mds_request *req,</div><div class='ctx'> 	struct ceph_mount_options *opt = req-&gt;r_mdsc-&gt;fsc-&gt;mount_options;</div><div class='ctx'> 	size_t size = sizeof(struct ceph_mds_reply_dir_entry);</div><div class='ctx'> 	unsigned int num_entries;</div><div class='add'>+	u64 bytes_count;</div><div class='ctx'> 	int order;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='hunk'>@@ -2281,16 +2542,21 @@ int ceph_alloc_readdir_reply_buffer(struct ceph_mds_request *req,</div><div class='ctx'> 	num_entries = max(num_entries, 1U);</div><div class='ctx'> 	num_entries = min(num_entries, opt-&gt;max_readdir);</div><div class='ctx'> </div><div class='del'>-	order = get_order(size * num_entries);</div><div class='add'>+	bytes_count = (u64)size * num_entries;</div><div class='add'>+	if (unlikely(bytes_count &gt; ULONG_MAX))</div><div class='add'>+		bytes_count = ULONG_MAX;</div><div class='add'>+</div><div class='add'>+	order = get_order((unsigned long)bytes_count);</div><div class='ctx'> 	while (order &gt;= 0) {</div><div class='ctx'> 		rinfo-&gt;dir_entries = (void*)__get_free_pages(GFP_KERNEL |</div><div class='del'>-							     __GFP_NOWARN,</div><div class='add'>+							     __GFP_NOWARN |</div><div class='add'>+							     __GFP_ZERO,</div><div class='ctx'> 							     order);</div><div class='ctx'> 		if (rinfo-&gt;dir_entries)</div><div class='ctx'> 			break;</div><div class='ctx'> 		order--;</div><div class='ctx'> 	}</div><div class='del'>-	if (!rinfo-&gt;dir_entries)</div><div class='add'>+	if (!rinfo-&gt;dir_entries || unlikely(order &lt; 0))</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	num_entries = (PAGE_SIZE &lt;&lt; order) / size;</div><div class='hunk'>@@ -2323,6 +2589,7 @@ ceph_mdsc_create_request(struct ceph_mds_client *mdsc, int op, int mode)</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;req-&gt;r_unsafe_dir_item);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;req-&gt;r_unsafe_target_item);</div><div class='ctx'> 	req-&gt;r_fmode = -1;</div><div class='add'>+	req-&gt;r_feature_needed = -1;</div><div class='ctx'> 	kref_init(&amp;req-&gt;r_kref);</div><div class='ctx'> 	RB_CLEAR_NODE(&amp;req-&gt;r_node);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;req-&gt;r_wait);</div><div class='hunk'>@@ -2355,20 +2622,94 @@ static inline  u64 __get_oldest_tid(struct ceph_mds_client *mdsc)</div><div class='ctx'> 	return mdsc-&gt;oldest_tid;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Build a dentry's path.  Allocate on heap; caller must kfree.  Based</div><div class='del'>- * on build_path_from_dentry in fs/cifs/dir.c.</div><div class='add'>+#if IS_ENABLED(CONFIG_FS_ENCRYPTION)</div><div class='add'>+static u8 *get_fscrypt_altname(const struct ceph_mds_request *req, u32 *plen)</div><div class='add'>+{</div><div class='add'>+	struct inode *dir = req-&gt;r_parent;</div><div class='add'>+	struct dentry *dentry = req-&gt;r_dentry;</div><div class='add'>+	const struct qstr *name = req-&gt;r_dname;</div><div class='add'>+	u8 *cryptbuf = NULL;</div><div class='add'>+	u32 len = 0;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	/* only encode if we have parent and dentry */</div><div class='add'>+	if (!dir || !dentry)</div><div class='add'>+		goto success;</div><div class='add'>+</div><div class='add'>+	/* No-op unless this is encrypted */</div><div class='add'>+	if (!IS_ENCRYPTED(dir))</div><div class='add'>+		goto success;</div><div class='add'>+</div><div class='add'>+	ret = ceph_fscrypt_prepare_readdir(dir);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ERR_PTR(ret);</div><div class='add'>+</div><div class='add'>+	/* No key? Just ignore it. */</div><div class='add'>+	if (!fscrypt_has_encryption_key(dir))</div><div class='add'>+		goto success;</div><div class='add'>+</div><div class='add'>+	if (!name)</div><div class='add'>+		name = &amp;dentry-&gt;d_name;</div><div class='add'>+</div><div class='add'>+	if (!fscrypt_fname_encrypted_size(dir, name-&gt;len, NAME_MAX, &amp;len)) {</div><div class='add'>+		WARN_ON_ONCE(1);</div><div class='add'>+		return ERR_PTR(-ENAMETOOLONG);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* No need to append altname if name is short enough */</div><div class='add'>+	if (len &lt;= CEPH_NOHASH_NAME_MAX) {</div><div class='add'>+		len = 0;</div><div class='add'>+		goto success;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	cryptbuf = kmalloc(len, GFP_KERNEL);</div><div class='add'>+	if (!cryptbuf)</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+</div><div class='add'>+	ret = fscrypt_fname_encrypt(dir, name, cryptbuf, len);</div><div class='add'>+	if (ret) {</div><div class='add'>+		kfree(cryptbuf);</div><div class='add'>+		return ERR_PTR(ret);</div><div class='add'>+	}</div><div class='add'>+success:</div><div class='add'>+	*plen = len;</div><div class='add'>+	return cryptbuf;</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+static u8 *get_fscrypt_altname(const struct ceph_mds_request *req, u32 *plen)</div><div class='add'>+{</div><div class='add'>+	*plen = 0;</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * ceph_mdsc_build_path - build a path string to a given dentry</div><div class='add'>+ * @mdsc: mds client</div><div class='add'>+ * @dentry: dentry to which path should be built</div><div class='add'>+ * @path_info: output path, length, base ino+snap, and freepath ownership flag</div><div class='add'>+ * @for_wire: is this path going to be sent to the MDS?</div><div class='add'>+ *</div><div class='add'>+ * Build a string that represents the path to the dentry. This is mostly called</div><div class='add'>+ * for two different purposes:</div><div class='add'>+ *</div><div class='add'>+ * 1) we need to build a path string to send to the MDS (for_wire == true)</div><div class='add'>+ * 2) we need a path string for local presentation (e.g. debugfs)</div><div class='add'>+ *    (for_wire == false)</div><div class='ctx'>  *</div><div class='del'>- * If @stop_on_nosnap, generate path relative to the first non-snapped</div><div class='del'>- * inode.</div><div class='add'>+ * The path is built in reverse, starting with the dentry. Walk back up toward</div><div class='add'>+ * the root, building the path until the first non-snapped inode is reached</div><div class='add'>+ * (for_wire) or the root inode is reached (!for_wire).</div><div class='ctx'>  *</div><div class='ctx'>  * Encode hidden .snap dirs as a double /, i.e.</div><div class='ctx'>  *   foo/.snap/bar -&gt; foo//bar</div><div class='ctx'>  */</div><div class='del'>-char *ceph_mdsc_build_path(struct dentry *dentry, int *plen, u64 *pbase,</div><div class='del'>-			   int stop_on_nosnap)</div><div class='add'>+char *ceph_mdsc_build_path(struct ceph_mds_client *mdsc, struct dentry *dentry,</div><div class='add'>+			   struct ceph_path_info *path_info, int for_wire)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *temp;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='add'>+	struct dentry *cur;</div><div class='add'>+	struct inode *inode;</div><div class='ctx'> 	char *path;</div><div class='ctx'> 	int pos;</div><div class='ctx'> 	unsigned seq;</div><div class='hunk'>@@ -2385,34 +2726,71 @@ retry:</div><div class='ctx'> 	path[pos] = '\0';</div><div class='ctx'> </div><div class='ctx'> 	seq = read_seqbegin(&amp;rename_lock);</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	temp = dentry;</div><div class='add'>+	cur = dget(dentry);</div><div class='ctx'> 	for (;;) {</div><div class='del'>-		struct inode *inode;</div><div class='add'>+		struct dentry *parent;</div><div class='ctx'> </div><div class='del'>-		spin_lock(&amp;temp-&gt;d_lock);</div><div class='del'>-		inode = d_inode(temp);</div><div class='add'>+		spin_lock(&amp;cur-&gt;d_lock);</div><div class='add'>+		inode = d_inode(cur);</div><div class='ctx'> 		if (inode &amp;&amp; ceph_snap(inode) == CEPH_SNAPDIR) {</div><div class='del'>-			dout("build_path path+%d: %p SNAPDIR\n",</div><div class='del'>-			     pos, temp);</div><div class='del'>-		} else if (stop_on_nosnap &amp;&amp; inode &amp;&amp; dentry != temp &amp;&amp;</div><div class='add'>+			doutc(cl, "path+%d: %p SNAPDIR\n", pos, cur);</div><div class='add'>+			spin_unlock(&amp;cur-&gt;d_lock);</div><div class='add'>+			parent = dget_parent(cur);</div><div class='add'>+		} else if (for_wire &amp;&amp; inode &amp;&amp; dentry != cur &amp;&amp;</div><div class='ctx'> 			   ceph_snap(inode) == CEPH_NOSNAP) {</div><div class='del'>-			spin_unlock(&amp;temp-&gt;d_lock);</div><div class='add'>+			spin_unlock(&amp;cur-&gt;d_lock);</div><div class='ctx'> 			pos++; /* get rid of any prepended '/' */</div><div class='ctx'> 			break;</div><div class='add'>+		} else if (!for_wire || !IS_ENCRYPTED(d_inode(cur-&gt;d_parent))) {</div><div class='add'>+			pos -= cur-&gt;d_name.len;</div><div class='add'>+			if (pos &lt; 0) {</div><div class='add'>+				spin_unlock(&amp;cur-&gt;d_lock);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+			memcpy(path + pos, cur-&gt;d_name.name, cur-&gt;d_name.len);</div><div class='add'>+			spin_unlock(&amp;cur-&gt;d_lock);</div><div class='add'>+			parent = dget_parent(cur);</div><div class='ctx'> 		} else {</div><div class='del'>-			pos -= temp-&gt;d_name.len;</div><div class='add'>+			int len, ret;</div><div class='add'>+			char buf[NAME_MAX];</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * Proactively copy name into buf, in case we need to</div><div class='add'>+			 * present it as-is.</div><div class='add'>+			 */</div><div class='add'>+			memcpy(buf, cur-&gt;d_name.name, cur-&gt;d_name.len);</div><div class='add'>+			len = cur-&gt;d_name.len;</div><div class='add'>+			spin_unlock(&amp;cur-&gt;d_lock);</div><div class='add'>+			parent = dget_parent(cur);</div><div class='add'>+</div><div class='add'>+			ret = ceph_fscrypt_prepare_readdir(d_inode(parent));</div><div class='add'>+			if (ret &lt; 0) {</div><div class='add'>+				dput(parent);</div><div class='add'>+				dput(cur);</div><div class='add'>+				return ERR_PTR(ret);</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			if (fscrypt_has_encryption_key(d_inode(parent))) {</div><div class='add'>+				len = ceph_encode_encrypted_dname(d_inode(parent),</div><div class='add'>+								  buf, len);</div><div class='add'>+				if (len &lt; 0) {</div><div class='add'>+					dput(parent);</div><div class='add'>+					dput(cur);</div><div class='add'>+					return ERR_PTR(len);</div><div class='add'>+				}</div><div class='add'>+			}</div><div class='add'>+			pos -= len;</div><div class='ctx'> 			if (pos &lt; 0) {</div><div class='del'>-				spin_unlock(&amp;temp-&gt;d_lock);</div><div class='add'>+				dput(parent);</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='del'>-			memcpy(path + pos, temp-&gt;d_name.name, temp-&gt;d_name.len);</div><div class='add'>+			memcpy(path + pos, buf, len);</div><div class='ctx'> 		}</div><div class='del'>-		spin_unlock(&amp;temp-&gt;d_lock);</div><div class='del'>-		temp = READ_ONCE(temp-&gt;d_parent);</div><div class='add'>+		dput(cur);</div><div class='add'>+		cur = parent;</div><div class='ctx'> </div><div class='ctx'> 		/* Are we at the root? */</div><div class='del'>-		if (IS_ROOT(temp))</div><div class='add'>+		if (IS_ROOT(cur))</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='ctx'> 		/* Are we out of buffer? */</div><div class='hunk'>@@ -2421,73 +2799,93 @@ retry:</div><div class='ctx'> </div><div class='ctx'> 		path[pos] = '/';</div><div class='ctx'> 	}</div><div class='del'>-	base = ceph_ino(d_inode(temp));</div><div class='del'>-	rcu_read_unlock();</div><div class='add'>+	inode = d_inode(cur);</div><div class='add'>+	base = inode ? ceph_ino(inode) : 0;</div><div class='add'>+	dput(cur);</div><div class='ctx'> </div><div class='ctx'> 	if (read_seqretry(&amp;rename_lock, seq))</div><div class='ctx'> 		goto retry;</div><div class='ctx'> </div><div class='ctx'> 	if (pos &lt; 0) {</div><div class='ctx'> 		/*</div><div class='del'>-		 * A rename didn't occur, but somehow we didn't end up where</div><div class='del'>-		 * we thought we would. Throw a warning and try again.</div><div class='add'>+		 * The path is longer than PATH_MAX and this function</div><div class='add'>+		 * cannot ever succeed.  Creating paths that long is</div><div class='add'>+		 * possible with Ceph, but Linux cannot use them.</div><div class='ctx'> 		 */</div><div class='del'>-		pr_warn("build_path did not end path lookup where "</div><div class='del'>-			"expected, pos is %d\n", pos);</div><div class='del'>-		goto retry;</div><div class='add'>+		return ERR_PTR(-ENAMETOOLONG);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	*pbase = base;</div><div class='del'>-	*plen = PATH_MAX - 1 - pos;</div><div class='del'>-	dout("build_path on %p %d built %llx '%.*s'\n",</div><div class='del'>-	     dentry, d_count(dentry), base, *plen, path + pos);</div><div class='add'>+	/* Initialize the output structure */</div><div class='add'>+	memset(path_info, 0, sizeof(*path_info));</div><div class='add'>+</div><div class='add'>+	path_info-&gt;vino.ino = base;</div><div class='add'>+	path_info-&gt;pathlen = PATH_MAX - 1 - pos;</div><div class='add'>+	path_info-&gt;path = path + pos;</div><div class='add'>+	path_info-&gt;freepath = true;</div><div class='add'>+</div><div class='add'>+	/* Set snap from dentry if available */</div><div class='add'>+	if (d_inode(dentry))</div><div class='add'>+		path_info-&gt;vino.snap = ceph_snap(d_inode(dentry));</div><div class='add'>+	else</div><div class='add'>+		path_info-&gt;vino.snap = CEPH_NOSNAP;</div><div class='add'>+</div><div class='add'>+	doutc(cl, "on %p %d built %llx '%.*s'\n", dentry, d_count(dentry),</div><div class='add'>+	      base, PATH_MAX - 1 - pos, path + pos);</div><div class='ctx'> 	return path + pos;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int build_dentry_path(struct dentry *dentry, struct inode *dir,</div><div class='del'>-			     const char **ppath, int *ppathlen, u64 *pino,</div><div class='del'>-			     bool *pfreepath, bool parent_locked)</div><div class='add'>+static int build_dentry_path(struct ceph_mds_client *mdsc, struct dentry *dentry,</div><div class='add'>+			     struct inode *dir, struct ceph_path_info *path_info,</div><div class='add'>+			     bool parent_locked)</div><div class='ctx'> {</div><div class='ctx'> 	char *path;</div><div class='ctx'> </div><div class='ctx'> 	rcu_read_lock();</div><div class='ctx'> 	if (!dir)</div><div class='ctx'> 		dir = d_inode_rcu(dentry-&gt;d_parent);</div><div class='del'>-	if (dir &amp;&amp; parent_locked &amp;&amp; ceph_snap(dir) == CEPH_NOSNAP) {</div><div class='del'>-		*pino = ceph_ino(dir);</div><div class='add'>+	if (dir &amp;&amp; parent_locked &amp;&amp; ceph_snap(dir) == CEPH_NOSNAP &amp;&amp;</div><div class='add'>+	    !IS_ENCRYPTED(dir)) {</div><div class='add'>+		path_info-&gt;vino.ino = ceph_ino(dir);</div><div class='add'>+		path_info-&gt;vino.snap = ceph_snap(dir);</div><div class='ctx'> 		rcu_read_unlock();</div><div class='del'>-		*ppath = dentry-&gt;d_name.name;</div><div class='del'>-		*ppathlen = dentry-&gt;d_name.len;</div><div class='add'>+		path_info-&gt;path = dentry-&gt;d_name.name;</div><div class='add'>+		path_info-&gt;pathlen = dentry-&gt;d_name.len;</div><div class='add'>+		path_info-&gt;freepath = false;</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> 	rcu_read_unlock();</div><div class='del'>-	path = ceph_mdsc_build_path(dentry, ppathlen, pino, 1);</div><div class='add'>+	path = ceph_mdsc_build_path(mdsc, dentry, path_info, 1);</div><div class='ctx'> 	if (IS_ERR(path))</div><div class='ctx'> 		return PTR_ERR(path);</div><div class='del'>-	*ppath = path;</div><div class='del'>-	*pfreepath = true;</div><div class='add'>+	/*</div><div class='add'>+	 * ceph_mdsc_build_path already fills path_info, including snap handling.</div><div class='add'>+	 */</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int build_inode_path(struct inode *inode,</div><div class='del'>-			    const char **ppath, int *ppathlen, u64 *pino,</div><div class='del'>-			    bool *pfreepath)</div><div class='add'>+static int build_inode_path(struct inode *inode, struct ceph_path_info *path_info)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_sb_to_mdsc(inode-&gt;i_sb);</div><div class='ctx'> 	struct dentry *dentry;</div><div class='ctx'> 	char *path;</div><div class='ctx'> </div><div class='ctx'> 	if (ceph_snap(inode) == CEPH_NOSNAP) {</div><div class='del'>-		*pino = ceph_ino(inode);</div><div class='del'>-		*ppathlen = 0;</div><div class='add'>+		path_info-&gt;vino.ino = ceph_ino(inode);</div><div class='add'>+		path_info-&gt;vino.snap = ceph_snap(inode);</div><div class='add'>+		path_info-&gt;pathlen = 0;</div><div class='add'>+		path_info-&gt;freepath = false;</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> 	dentry = d_find_alias(inode);</div><div class='del'>-	path = ceph_mdsc_build_path(dentry, ppathlen, pino, 1);</div><div class='add'>+	path = ceph_mdsc_build_path(mdsc, dentry, path_info, 1);</div><div class='ctx'> 	dput(dentry);</div><div class='ctx'> 	if (IS_ERR(path))</div><div class='ctx'> 		return PTR_ERR(path);</div><div class='del'>-	*ppath = path;</div><div class='del'>-	*pfreepath = true;</div><div class='add'>+	/*</div><div class='add'>+	 * ceph_mdsc_build_path already fills path_info, including snap from dentry.</div><div class='add'>+	 * Override with inode's snap since that's what this function is for.</div><div class='add'>+	 */</div><div class='add'>+	path_info-&gt;vino.snap = ceph_snap(inode);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2495,34 +2893,41 @@ static int build_inode_path(struct inode *inode,</div><div class='ctx'>  * request arguments may be specified via an inode *, a dentry *, or</div><div class='ctx'>  * an explicit ino+path.</div><div class='ctx'>  */</div><div class='del'>-static int set_request_path_attr(struct inode *rinode, struct dentry *rdentry,</div><div class='del'>-				  struct inode *rdiri, const char *rpath,</div><div class='del'>-				  u64 rino, const char **ppath, int *pathlen,</div><div class='del'>-				  u64 *ino, bool *freepath, bool parent_locked)</div><div class='add'>+static int set_request_path_attr(struct ceph_mds_client *mdsc, struct inode *rinode,</div><div class='add'>+				 struct dentry *rdentry, struct inode *rdiri,</div><div class='add'>+				 const char *rpath, u64 rino,</div><div class='add'>+				 struct ceph_path_info *path_info,</div><div class='add'>+				 bool parent_locked)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	int r = 0;</div><div class='ctx'> </div><div class='add'>+	/* Initialize the output structure */</div><div class='add'>+	memset(path_info, 0, sizeof(*path_info));</div><div class='add'>+</div><div class='ctx'> 	if (rinode) {</div><div class='del'>-		r = build_inode_path(rinode, ppath, pathlen, ino, freepath);</div><div class='del'>-		dout(" inode %p %llx.%llx\n", rinode, ceph_ino(rinode),</div><div class='del'>-		     ceph_snap(rinode));</div><div class='add'>+		r = build_inode_path(rinode, path_info);</div><div class='add'>+		doutc(cl, " inode %p %llx.%llx\n", rinode, ceph_ino(rinode),</div><div class='add'>+		      ceph_snap(rinode));</div><div class='ctx'> 	} else if (rdentry) {</div><div class='del'>-		r = build_dentry_path(rdentry, rdiri, ppath, pathlen, ino,</div><div class='del'>-					freepath, parent_locked);</div><div class='del'>-		dout(" dentry %p %llx/%.*s\n", rdentry, *ino, *pathlen,</div><div class='del'>-		     *ppath);</div><div class='add'>+		r = build_dentry_path(mdsc, rdentry, rdiri, path_info, parent_locked);</div><div class='add'>+		doutc(cl, " dentry %p %llx/%.*s\n", rdentry, path_info-&gt;vino.ino,</div><div class='add'>+		      path_info-&gt;pathlen, path_info-&gt;path);</div><div class='ctx'> 	} else if (rpath || rino) {</div><div class='del'>-		*ino = rino;</div><div class='del'>-		*ppath = rpath;</div><div class='del'>-		*pathlen = rpath ? strlen(rpath) : 0;</div><div class='del'>-		dout(" path %.*s\n", *pathlen, rpath);</div><div class='add'>+		path_info-&gt;vino.ino = rino;</div><div class='add'>+		path_info-&gt;vino.snap = CEPH_NOSNAP;</div><div class='add'>+		path_info-&gt;path = rpath;</div><div class='add'>+		path_info-&gt;pathlen = rpath ? strlen(rpath) : 0;</div><div class='add'>+		path_info-&gt;freepath = false;</div><div class='add'>+</div><div class='add'>+		doutc(cl, " path %.*s\n", path_info-&gt;pathlen, rpath);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return r;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void encode_timestamp_and_gids(void **p,</div><div class='del'>-				      const struct ceph_mds_request *req)</div><div class='add'>+static void encode_mclientrequest_tail(void **p,</div><div class='add'>+				       const struct ceph_mds_request *req)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_timespec ts;</div><div class='ctx'> 	int i;</div><div class='hunk'>@@ -2530,11 +2935,54 @@ static void encode_timestamp_and_gids(void **p,</div><div class='ctx'> 	ceph_encode_timespec64(&amp;ts, &amp;req-&gt;r_stamp);</div><div class='ctx'> 	ceph_encode_copy(p, &amp;ts, sizeof(ts));</div><div class='ctx'> </div><div class='del'>-	/* gid_list */</div><div class='add'>+	/* v4: gid_list */</div><div class='ctx'> 	ceph_encode_32(p, req-&gt;r_cred-&gt;group_info-&gt;ngroups);</div><div class='ctx'> 	for (i = 0; i &lt; req-&gt;r_cred-&gt;group_info-&gt;ngroups; i++)</div><div class='ctx'> 		ceph_encode_64(p, from_kgid(&amp;init_user_ns,</div><div class='ctx'> 					    req-&gt;r_cred-&gt;group_info-&gt;gid[i]));</div><div class='add'>+</div><div class='add'>+	/* v5: altname */</div><div class='add'>+	ceph_encode_32(p, req-&gt;r_altname_len);</div><div class='add'>+	ceph_encode_copy(p, req-&gt;r_altname, req-&gt;r_altname_len);</div><div class='add'>+</div><div class='add'>+	/* v6: fscrypt_auth and fscrypt_file */</div><div class='add'>+	if (req-&gt;r_fscrypt_auth) {</div><div class='add'>+		u32 authlen = ceph_fscrypt_auth_len(req-&gt;r_fscrypt_auth);</div><div class='add'>+</div><div class='add'>+		ceph_encode_32(p, authlen);</div><div class='add'>+		ceph_encode_copy(p, req-&gt;r_fscrypt_auth, authlen);</div><div class='add'>+	} else {</div><div class='add'>+		ceph_encode_32(p, 0);</div><div class='add'>+	}</div><div class='add'>+	if (test_bit(CEPH_MDS_R_FSCRYPT_FILE, &amp;req-&gt;r_req_flags)) {</div><div class='add'>+		ceph_encode_32(p, sizeof(__le64));</div><div class='add'>+		ceph_encode_64(p, req-&gt;r_fscrypt_file);</div><div class='add'>+	} else {</div><div class='add'>+		ceph_encode_32(p, 0);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline u16 mds_supported_head_version(struct ceph_mds_session *session)</div><div class='add'>+{</div><div class='add'>+	if (!test_bit(CEPHFS_FEATURE_32BITS_RETRY_FWD, &amp;session-&gt;s_features))</div><div class='add'>+		return 1;</div><div class='add'>+</div><div class='add'>+	if (!test_bit(CEPHFS_FEATURE_HAS_OWNER_UIDGID, &amp;session-&gt;s_features))</div><div class='add'>+		return 2;</div><div class='add'>+</div><div class='add'>+	return CEPH_MDS_REQUEST_HEAD_VERSION;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct ceph_mds_request_head_legacy *</div><div class='add'>+find_legacy_request_head(void *p, u64 features)</div><div class='add'>+{</div><div class='add'>+	bool legacy = !(features &amp; CEPH_FEATURE_FS_BTIME);</div><div class='add'>+	struct ceph_mds_request_head *head;</div><div class='add'>+</div><div class='add'>+	if (legacy)</div><div class='add'>+		return (struct ceph_mds_request_head_legacy *)p;</div><div class='add'>+	head = (struct ceph_mds_request_head *)p;</div><div class='add'>+	return (struct ceph_mds_request_head_legacy *)&amp;head-&gt;oldest_client_tid;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2546,53 +2994,125 @@ static struct ceph_msg *create_request_message(struct ceph_mds_session *session,</div><div class='ctx'> {</div><div class='ctx'> 	int mds = session-&gt;s_mds;</div><div class='ctx'> 	struct ceph_mds_client *mdsc = session-&gt;s_mdsc;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_msg *msg;</div><div class='del'>-	struct ceph_mds_request_head_old *head;</div><div class='del'>-	const char *path1 = NULL;</div><div class='del'>-	const char *path2 = NULL;</div><div class='del'>-	u64 ino1 = 0, ino2 = 0;</div><div class='del'>-	int pathlen1 = 0, pathlen2 = 0;</div><div class='del'>-	bool freepath1 = false, freepath2 = false;</div><div class='add'>+	struct ceph_mds_request_head_legacy *lhead;</div><div class='add'>+	struct ceph_path_info path_info1 = {0};</div><div class='add'>+	struct ceph_path_info path_info2 = {0};</div><div class='add'>+	struct dentry *old_dentry = NULL;</div><div class='ctx'> 	int len;</div><div class='ctx'> 	u16 releases;</div><div class='ctx'> 	void *p, *end;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	bool legacy = !(session-&gt;s_con.peer_features &amp; CEPH_FEATURE_FS_BTIME);</div><div class='del'>-</div><div class='del'>-	ret = set_request_path_attr(req-&gt;r_inode, req-&gt;r_dentry,</div><div class='del'>-			      req-&gt;r_parent, req-&gt;r_path1, req-&gt;r_ino1.ino,</div><div class='del'>-			      &amp;path1, &amp;pathlen1, &amp;ino1, &amp;freepath1,</div><div class='del'>-			      test_bit(CEPH_MDS_R_PARENT_LOCKED,</div><div class='del'>-					&amp;req-&gt;r_req_flags));</div><div class='add'>+	u16 request_head_version = mds_supported_head_version(session);</div><div class='add'>+	kuid_t caller_fsuid = req-&gt;r_cred-&gt;fsuid;</div><div class='add'>+	kgid_t caller_fsgid = req-&gt;r_cred-&gt;fsgid;</div><div class='add'>+	bool parent_locked = test_bit(CEPH_MDS_R_PARENT_LOCKED, &amp;req-&gt;r_req_flags);</div><div class='add'>+</div><div class='add'>+	ret = set_request_path_attr(mdsc, req-&gt;r_inode, req-&gt;r_dentry,</div><div class='add'>+				    req-&gt;r_parent, req-&gt;r_path1, req-&gt;r_ino1.ino,</div><div class='add'>+				    &amp;path_info1, parent_locked);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='ctx'> 		msg = ERR_PTR(ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * When the parent directory's i_rwsem is *not* locked, req-&gt;r_parent may</div><div class='add'>+	 * have become stale (e.g. after a concurrent rename) between the time the</div><div class='add'>+	 * dentry was looked up and now.  If we detect that the stored r_parent</div><div class='add'>+	 * does not match the inode number we just encoded for the request, switch</div><div class='add'>+	 * to the correct inode so that the MDS receives a valid parent reference.</div><div class='add'>+	 */</div><div class='add'>+	if (!parent_locked &amp;&amp; req-&gt;r_parent &amp;&amp; path_info1.vino.ino &amp;&amp;</div><div class='add'>+	    ceph_ino(req-&gt;r_parent) != path_info1.vino.ino) {</div><div class='add'>+		struct inode *old_parent = req-&gt;r_parent;</div><div class='add'>+		struct inode *correct_dir = ceph_get_inode(mdsc-&gt;fsc-&gt;sb, path_info1.vino, NULL);</div><div class='add'>+		if (!IS_ERR(correct_dir)) {</div><div class='add'>+			WARN_ONCE(1, "ceph: r_parent mismatch (had %llx wanted %llx) - updating\n",</div><div class='add'>+			          ceph_ino(old_parent), path_info1.vino.ino);</div><div class='add'>+			/*</div><div class='add'>+			 * Transfer CEPH_CAP_PIN from the old parent to the new one.</div><div class='add'>+			 * The pin was taken earlier in ceph_mdsc_submit_request().</div><div class='add'>+			 */</div><div class='add'>+			ceph_put_cap_refs(ceph_inode(old_parent), CEPH_CAP_PIN);</div><div class='add'>+			iput(old_parent);</div><div class='add'>+			req-&gt;r_parent = correct_dir;</div><div class='add'>+			ceph_get_cap_refs(ceph_inode(req-&gt;r_parent), CEPH_CAP_PIN);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/* If r_old_dentry is set, then assume that its parent is locked */</div><div class='del'>-	ret = set_request_path_attr(NULL, req-&gt;r_old_dentry,</div><div class='del'>-			      req-&gt;r_old_dentry_dir,</div><div class='del'>-			      req-&gt;r_path2, req-&gt;r_ino2.ino,</div><div class='del'>-			      &amp;path2, &amp;pathlen2, &amp;ino2, &amp;freepath2, true);</div><div class='add'>+	if (req-&gt;r_old_dentry &amp;&amp;</div><div class='add'>+	    !(req-&gt;r_old_dentry-&gt;d_flags &amp; DCACHE_DISCONNECTED))</div><div class='add'>+		old_dentry = req-&gt;r_old_dentry;</div><div class='add'>+	ret = set_request_path_attr(mdsc, NULL, old_dentry,</div><div class='add'>+				    req-&gt;r_old_dentry_dir,</div><div class='add'>+				    req-&gt;r_path2, req-&gt;r_ino2.ino,</div><div class='add'>+				    &amp;path_info2, true);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='ctx'> 		msg = ERR_PTR(ret);</div><div class='ctx'> 		goto out_free1;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	len = legacy ? sizeof(*head) : sizeof(struct ceph_mds_request_head);</div><div class='del'>-	len += pathlen1 + pathlen2 + 2*(1 + sizeof(u32) + sizeof(u64)) +</div><div class='del'>-		sizeof(struct ceph_timespec);</div><div class='del'>-	len += sizeof(u32) + (sizeof(u64) * req-&gt;r_cred-&gt;group_info-&gt;ngroups);</div><div class='add'>+	req-&gt;r_altname = get_fscrypt_altname(req, &amp;req-&gt;r_altname_len);</div><div class='add'>+	if (IS_ERR(req-&gt;r_altname)) {</div><div class='add'>+		msg = ERR_CAST(req-&gt;r_altname);</div><div class='add'>+		req-&gt;r_altname = NULL;</div><div class='add'>+		goto out_free2;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	/* calculate (max) length for cap releases */</div><div class='add'>+	/*</div><div class='add'>+	 * For old cephs without supporting the 32bit retry/fwd feature</div><div class='add'>+	 * it will copy the raw memories directly when decoding the</div><div class='add'>+	 * requests. While new cephs will decode the head depending the</div><div class='add'>+	 * version member, so we need to make sure it will be compatible</div><div class='add'>+	 * with them both.</div><div class='add'>+	 */</div><div class='add'>+	if (legacy)</div><div class='add'>+		len = sizeof(struct ceph_mds_request_head_legacy);</div><div class='add'>+	else if (request_head_version == 1)</div><div class='add'>+		len = offsetofend(struct ceph_mds_request_head, args);</div><div class='add'>+	else if (request_head_version == 2)</div><div class='add'>+		len = offsetofend(struct ceph_mds_request_head, ext_num_fwd);</div><div class='add'>+	else</div><div class='add'>+		len = sizeof(struct ceph_mds_request_head);</div><div class='add'>+</div><div class='add'>+	/* filepaths */</div><div class='add'>+	len += 2 * (1 + sizeof(u32) + sizeof(u64));</div><div class='add'>+	len += path_info1.pathlen + path_info2.pathlen;</div><div class='add'>+</div><div class='add'>+	/* cap releases */</div><div class='ctx'> 	len += sizeof(struct ceph_mds_request_release) *</div><div class='ctx'> 		(!!req-&gt;r_inode_drop + !!req-&gt;r_dentry_drop +</div><div class='ctx'> 		 !!req-&gt;r_old_inode_drop + !!req-&gt;r_old_dentry_drop);</div><div class='ctx'> </div><div class='ctx'> 	if (req-&gt;r_dentry_drop)</div><div class='del'>-		len += pathlen1;</div><div class='add'>+		len += path_info1.pathlen;</div><div class='ctx'> 	if (req-&gt;r_old_dentry_drop)</div><div class='del'>-		len += pathlen2;</div><div class='add'>+		len += path_info2.pathlen;</div><div class='add'>+</div><div class='add'>+	/* MClientRequest tail */</div><div class='add'>+</div><div class='add'>+	/* req-&gt;r_stamp */</div><div class='add'>+	len += sizeof(struct ceph_timespec);</div><div class='add'>+</div><div class='add'>+	/* gid list */</div><div class='add'>+	len += sizeof(u32) + (sizeof(u64) * req-&gt;r_cred-&gt;group_info-&gt;ngroups);</div><div class='add'>+</div><div class='add'>+	/* alternate name */</div><div class='add'>+	len += sizeof(u32) + req-&gt;r_altname_len;</div><div class='add'>+</div><div class='add'>+	/* fscrypt_auth */</div><div class='add'>+	len += sizeof(u32); // fscrypt_auth</div><div class='add'>+	if (req-&gt;r_fscrypt_auth)</div><div class='add'>+		len += ceph_fscrypt_auth_len(req-&gt;r_fscrypt_auth);</div><div class='add'>+</div><div class='add'>+	/* fscrypt_file */</div><div class='add'>+	len += sizeof(u32);</div><div class='add'>+	if (test_bit(CEPH_MDS_R_FSCRYPT_FILE, &amp;req-&gt;r_req_flags))</div><div class='add'>+		len += sizeof(__le64);</div><div class='ctx'> </div><div class='ctx'> 	msg = ceph_msg_new2(CEPH_MSG_CLIENT_REQUEST, len, 1, GFP_NOFS, false);</div><div class='ctx'> 	if (!msg) {</div><div class='hunk'>@@ -2602,36 +3122,90 @@ static struct ceph_msg *create_request_message(struct ceph_mds_session *session,</div><div class='ctx'> </div><div class='ctx'> 	msg-&gt;hdr.tid = cpu_to_le64(req-&gt;r_tid);</div><div class='ctx'> </div><div class='add'>+	lhead = find_legacy_request_head(msg-&gt;front.iov_base,</div><div class='add'>+					 session-&gt;s_con.peer_features);</div><div class='add'>+</div><div class='add'>+	if ((req-&gt;r_mnt_idmap != &amp;nop_mnt_idmap) &amp;&amp;</div><div class='add'>+	    !test_bit(CEPHFS_FEATURE_HAS_OWNER_UIDGID, &amp;session-&gt;s_features)) {</div><div class='add'>+		WARN_ON_ONCE(!IS_CEPH_MDS_OP_NEWINODE(req-&gt;r_op));</div><div class='add'>+</div><div class='add'>+		if (enable_unsafe_idmap) {</div><div class='add'>+			pr_warn_once_client(cl,</div><div class='add'>+				"idmapped mount is used and CEPHFS_FEATURE_HAS_OWNER_UIDGID"</div><div class='add'>+				" is not supported by MDS. UID/GID-based restrictions may"</div><div class='add'>+				" not work properly.\n");</div><div class='add'>+</div><div class='add'>+			caller_fsuid = from_vfsuid(req-&gt;r_mnt_idmap, &amp;init_user_ns,</div><div class='add'>+						   VFSUIDT_INIT(req-&gt;r_cred-&gt;fsuid));</div><div class='add'>+			caller_fsgid = from_vfsgid(req-&gt;r_mnt_idmap, &amp;init_user_ns,</div><div class='add'>+						   VFSGIDT_INIT(req-&gt;r_cred-&gt;fsgid));</div><div class='add'>+		} else {</div><div class='add'>+			pr_err_ratelimited_client(cl,</div><div class='add'>+				"idmapped mount is used and CEPHFS_FEATURE_HAS_OWNER_UIDGID"</div><div class='add'>+				" is not supported by MDS. Fail request with -EIO.\n");</div><div class='add'>+</div><div class='add'>+			ret = -EIO;</div><div class='add'>+			goto out_err;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='del'>-	 * The old ceph_mds_request_head didn't contain a version field, and</div><div class='add'>+	 * The ceph_mds_request_head_legacy didn't contain a version field, and</div><div class='ctx'> 	 * one was added when we moved the message version from 3-&gt;4.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (legacy) {</div><div class='ctx'> 		msg-&gt;hdr.version = cpu_to_le16(3);</div><div class='del'>-		head = msg-&gt;front.iov_base;</div><div class='del'>-		p = msg-&gt;front.iov_base + sizeof(*head);</div><div class='del'>-	} else {</div><div class='del'>-		struct ceph_mds_request_head *new_head = msg-&gt;front.iov_base;</div><div class='add'>+		p = msg-&gt;front.iov_base + sizeof(*lhead);</div><div class='add'>+	} else if (request_head_version == 1) {</div><div class='add'>+		struct ceph_mds_request_head *nhead = msg-&gt;front.iov_base;</div><div class='ctx'> </div><div class='ctx'> 		msg-&gt;hdr.version = cpu_to_le16(4);</div><div class='del'>-		new_head-&gt;version = cpu_to_le16(CEPH_MDS_REQUEST_HEAD_VERSION);</div><div class='del'>-		head = (struct ceph_mds_request_head_old *)&amp;new_head-&gt;oldest_client_tid;</div><div class='del'>-		p = msg-&gt;front.iov_base + sizeof(*new_head);</div><div class='add'>+		nhead-&gt;version = cpu_to_le16(1);</div><div class='add'>+		p = msg-&gt;front.iov_base + offsetofend(struct ceph_mds_request_head, args);</div><div class='add'>+	} else if (request_head_version == 2) {</div><div class='add'>+		struct ceph_mds_request_head *nhead = msg-&gt;front.iov_base;</div><div class='add'>+</div><div class='add'>+		msg-&gt;hdr.version = cpu_to_le16(6);</div><div class='add'>+		nhead-&gt;version = cpu_to_le16(2);</div><div class='add'>+</div><div class='add'>+		p = msg-&gt;front.iov_base + offsetofend(struct ceph_mds_request_head, ext_num_fwd);</div><div class='add'>+	} else {</div><div class='add'>+		struct ceph_mds_request_head *nhead = msg-&gt;front.iov_base;</div><div class='add'>+		kuid_t owner_fsuid;</div><div class='add'>+		kgid_t owner_fsgid;</div><div class='add'>+</div><div class='add'>+		msg-&gt;hdr.version = cpu_to_le16(6);</div><div class='add'>+		nhead-&gt;version = cpu_to_le16(CEPH_MDS_REQUEST_HEAD_VERSION);</div><div class='add'>+		nhead-&gt;struct_len = cpu_to_le32(sizeof(struct ceph_mds_request_head));</div><div class='add'>+</div><div class='add'>+		if (IS_CEPH_MDS_OP_NEWINODE(req-&gt;r_op)) {</div><div class='add'>+			owner_fsuid = from_vfsuid(req-&gt;r_mnt_idmap, &amp;init_user_ns,</div><div class='add'>+						VFSUIDT_INIT(req-&gt;r_cred-&gt;fsuid));</div><div class='add'>+			owner_fsgid = from_vfsgid(req-&gt;r_mnt_idmap, &amp;init_user_ns,</div><div class='add'>+						VFSGIDT_INIT(req-&gt;r_cred-&gt;fsgid));</div><div class='add'>+			nhead-&gt;owner_uid = cpu_to_le32(from_kuid(&amp;init_user_ns, owner_fsuid));</div><div class='add'>+			nhead-&gt;owner_gid = cpu_to_le32(from_kgid(&amp;init_user_ns, owner_fsgid));</div><div class='add'>+		} else {</div><div class='add'>+			nhead-&gt;owner_uid = cpu_to_le32(-1);</div><div class='add'>+			nhead-&gt;owner_gid = cpu_to_le32(-1);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		p = msg-&gt;front.iov_base + sizeof(*nhead);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	end = msg-&gt;front.iov_base + msg-&gt;front.iov_len;</div><div class='ctx'> </div><div class='del'>-	head-&gt;mdsmap_epoch = cpu_to_le32(mdsc-&gt;mdsmap-&gt;m_epoch);</div><div class='del'>-	head-&gt;op = cpu_to_le32(req-&gt;r_op);</div><div class='del'>-	head-&gt;caller_uid = cpu_to_le32(from_kuid(&amp;init_user_ns,</div><div class='del'>-						 req-&gt;r_cred-&gt;fsuid));</div><div class='del'>-	head-&gt;caller_gid = cpu_to_le32(from_kgid(&amp;init_user_ns,</div><div class='del'>-						 req-&gt;r_cred-&gt;fsgid));</div><div class='del'>-	head-&gt;ino = cpu_to_le64(req-&gt;r_deleg_ino);</div><div class='del'>-	head-&gt;args = req-&gt;r_args;</div><div class='add'>+	lhead-&gt;mdsmap_epoch = cpu_to_le32(mdsc-&gt;mdsmap-&gt;m_epoch);</div><div class='add'>+	lhead-&gt;op = cpu_to_le32(req-&gt;r_op);</div><div class='add'>+	lhead-&gt;caller_uid = cpu_to_le32(from_kuid(&amp;init_user_ns,</div><div class='add'>+						  caller_fsuid));</div><div class='add'>+	lhead-&gt;caller_gid = cpu_to_le32(from_kgid(&amp;init_user_ns,</div><div class='add'>+						  caller_fsgid));</div><div class='add'>+	lhead-&gt;ino = cpu_to_le64(req-&gt;r_deleg_ino);</div><div class='add'>+	lhead-&gt;args = req-&gt;r_args;</div><div class='ctx'> </div><div class='del'>-	ceph_encode_filepath(&amp;p, end, ino1, path1);</div><div class='del'>-	ceph_encode_filepath(&amp;p, end, ino2, path2);</div><div class='add'>+	ceph_encode_filepath(&amp;p, end, path_info1.vino.ino, path_info1.path);</div><div class='add'>+	ceph_encode_filepath(&amp;p, end, path_info2.vino.ino, path_info2.path);</div><div class='ctx'> </div><div class='ctx'> 	/* make note of release offset, in case we need to replay */</div><div class='ctx'> 	req-&gt;r_request_release_offset = p - msg-&gt;front.iov_base;</div><div class='hunk'>@@ -2643,15 +3217,23 @@ static struct ceph_msg *create_request_message(struct ceph_mds_session *session,</div><div class='ctx'> 		      req-&gt;r_inode ? req-&gt;r_inode : d_inode(req-&gt;r_dentry),</div><div class='ctx'> 		      mds, req-&gt;r_inode_drop, req-&gt;r_inode_unless,</div><div class='ctx'> 		      req-&gt;r_op == CEPH_MDS_OP_READDIR);</div><div class='del'>-	if (req-&gt;r_dentry_drop)</div><div class='del'>-		releases += ceph_encode_dentry_release(&amp;p, req-&gt;r_dentry,</div><div class='add'>+	if (req-&gt;r_dentry_drop) {</div><div class='add'>+		ret = ceph_encode_dentry_release(&amp;p, req-&gt;r_dentry,</div><div class='ctx'> 				req-&gt;r_parent, mds, req-&gt;r_dentry_drop,</div><div class='ctx'> 				req-&gt;r_dentry_unless);</div><div class='del'>-	if (req-&gt;r_old_dentry_drop)</div><div class='del'>-		releases += ceph_encode_dentry_release(&amp;p, req-&gt;r_old_dentry,</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out_err;</div><div class='add'>+		releases += ret;</div><div class='add'>+	}</div><div class='add'>+	if (req-&gt;r_old_dentry_drop) {</div><div class='add'>+		ret = ceph_encode_dentry_release(&amp;p, req-&gt;r_old_dentry,</div><div class='ctx'> 				req-&gt;r_old_dentry_dir, mds,</div><div class='ctx'> 				req-&gt;r_old_dentry_drop,</div><div class='ctx'> 				req-&gt;r_old_dentry_unless);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out_err;</div><div class='add'>+		releases += ret;</div><div class='add'>+	}</div><div class='ctx'> 	if (req-&gt;r_old_inode_drop)</div><div class='ctx'> 		releases += ceph_encode_inode_release(&amp;p,</div><div class='ctx'> 		      d_inode(req-&gt;r_old_dentry),</div><div class='hunk'>@@ -2662,9 +3244,9 @@ static struct ceph_msg *create_request_message(struct ceph_mds_session *session,</div><div class='ctx'> 		p = msg-&gt;front.iov_base + req-&gt;r_request_release_offset;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	head-&gt;num_releases = cpu_to_le16(releases);</div><div class='add'>+	lhead-&gt;num_releases = cpu_to_le16(releases);</div><div class='ctx'> </div><div class='del'>-	encode_timestamp_and_gids(&amp;p, req);</div><div class='add'>+	encode_mclientrequest_tail(&amp;p, req);</div><div class='ctx'> </div><div class='ctx'> 	if (WARN_ON_ONCE(p &gt; end)) {</div><div class='ctx'> 		ceph_msg_put(msg);</div><div class='hunk'>@@ -2686,13 +3268,15 @@ static struct ceph_msg *create_request_message(struct ceph_mds_session *session,</div><div class='ctx'> 	msg-&gt;hdr.data_off = cpu_to_le16(0);</div><div class='ctx'> </div><div class='ctx'> out_free2:</div><div class='del'>-	if (freepath2)</div><div class='del'>-		ceph_mdsc_free_path((char *)path2, pathlen2);</div><div class='add'>+	ceph_mdsc_free_path_info(&amp;path_info2);</div><div class='ctx'> out_free1:</div><div class='del'>-	if (freepath1)</div><div class='del'>-		ceph_mdsc_free_path((char *)path1, pathlen1);</div><div class='add'>+	ceph_mdsc_free_path_info(&amp;path_info1);</div><div class='ctx'> out:</div><div class='ctx'> 	return msg;</div><div class='add'>+out_err:</div><div class='add'>+	ceph_msg_put(msg);</div><div class='add'>+	msg = ERR_PTR(ret);</div><div class='add'>+	goto out_free2;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2709,18 +3293,6 @@ static void complete_request(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	complete_all(&amp;req-&gt;r_completion);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct ceph_mds_request_head_old *</div><div class='del'>-find_old_request_head(void *p, u64 features)</div><div class='del'>-{</div><div class='del'>-	bool legacy = !(features &amp; CEPH_FEATURE_FS_BTIME);</div><div class='del'>-	struct ceph_mds_request_head *new_head;</div><div class='del'>-</div><div class='del'>-	if (legacy)</div><div class='del'>-		return (struct ceph_mds_request_head_old *)p;</div><div class='del'>-	new_head = (struct ceph_mds_request_head *)p;</div><div class='del'>-	return (struct ceph_mds_request_head_old *)&amp;new_head-&gt;oldest_client_tid;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * called under mdsc-&gt;mutex</div><div class='ctx'>  */</div><div class='hunk'>@@ -2730,9 +3302,30 @@ static int __prepare_send_request(struct ceph_mds_session *session,</div><div class='ctx'> {</div><div class='ctx'> 	int mds = session-&gt;s_mds;</div><div class='ctx'> 	struct ceph_mds_client *mdsc = session-&gt;s_mdsc;</div><div class='del'>-	struct ceph_mds_request_head_old *rhead;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='add'>+	struct ceph_mds_request_head_legacy *lhead;</div><div class='add'>+	struct ceph_mds_request_head *nhead;</div><div class='ctx'> 	struct ceph_msg *msg;</div><div class='del'>-	int flags = 0;</div><div class='add'>+	int flags = 0, old_max_retry;</div><div class='add'>+	bool old_version = !test_bit(CEPHFS_FEATURE_32BITS_RETRY_FWD,</div><div class='add'>+				     &amp;session-&gt;s_features);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Avoid infinite retrying after overflow. The client will</div><div class='add'>+	 * increase the retry count and if the MDS is old version,</div><div class='add'>+	 * so we limit to retry at most 256 times.</div><div class='add'>+	 */</div><div class='add'>+	if (req-&gt;r_attempts) {</div><div class='add'>+	       old_max_retry = sizeof_field(struct ceph_mds_request_head,</div><div class='add'>+					    num_retry);</div><div class='add'>+	       old_max_retry = 1 &lt;&lt; (old_max_retry * BITS_PER_BYTE);</div><div class='add'>+	       if ((old_version &amp;&amp; req-&gt;r_attempts &gt;= old_max_retry) ||</div><div class='add'>+		   ((uint32_t)req-&gt;r_attempts &gt;= U32_MAX)) {</div><div class='add'>+			pr_warn_ratelimited_client(cl, "request tid %llu seq overflow\n",</div><div class='add'>+						   req-&gt;r_tid);</div><div class='add'>+			return -EMULTIHOP;</div><div class='add'>+	       }</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	req-&gt;r_attempts++;</div><div class='ctx'> 	if (req-&gt;r_inode) {</div><div class='hunk'>@@ -2744,8 +3337,8 @@ static int __prepare_send_request(struct ceph_mds_session *session,</div><div class='ctx'> 		else</div><div class='ctx'> 			req-&gt;r_sent_on_mseq = -1;</div><div class='ctx'> 	}</div><div class='del'>-	dout("prepare_send_request %p tid %lld %s (attempt %d)\n", req,</div><div class='del'>-	     req-&gt;r_tid, ceph_mds_op_name(req-&gt;r_op), req-&gt;r_attempts);</div><div class='add'>+	doutc(cl, "%p tid %lld %s (attempt %d)\n", req, req-&gt;r_tid,</div><div class='add'>+	      ceph_mds_op_name(req-&gt;r_op), req-&gt;r_attempts);</div><div class='ctx'> </div><div class='ctx'> 	if (test_bit(CEPH_MDS_R_GOT_UNSAFE, &amp;req-&gt;r_req_flags)) {</div><div class='ctx'> 		void *p;</div><div class='hunk'>@@ -2757,23 +3350,27 @@ static int __prepare_send_request(struct ceph_mds_session *session,</div><div class='ctx'> 		 * d_move mangles the src name.</div><div class='ctx'> 		 */</div><div class='ctx'> 		msg = req-&gt;r_request;</div><div class='del'>-		rhead = find_old_request_head(msg-&gt;front.iov_base,</div><div class='del'>-					      session-&gt;s_con.peer_features);</div><div class='add'>+		lhead = find_legacy_request_head(msg-&gt;front.iov_base,</div><div class='add'>+						 session-&gt;s_con.peer_features);</div><div class='ctx'> </div><div class='del'>-		flags = le32_to_cpu(rhead-&gt;flags);</div><div class='add'>+		flags = le32_to_cpu(lhead-&gt;flags);</div><div class='ctx'> 		flags |= CEPH_MDS_FLAG_REPLAY;</div><div class='del'>-		rhead-&gt;flags = cpu_to_le32(flags);</div><div class='add'>+		lhead-&gt;flags = cpu_to_le32(flags);</div><div class='ctx'> </div><div class='ctx'> 		if (req-&gt;r_target_inode)</div><div class='del'>-			rhead-&gt;ino = cpu_to_le64(ceph_ino(req-&gt;r_target_inode));</div><div class='add'>+			lhead-&gt;ino = cpu_to_le64(ceph_ino(req-&gt;r_target_inode));</div><div class='ctx'> </div><div class='del'>-		rhead-&gt;num_retry = req-&gt;r_attempts - 1;</div><div class='add'>+		lhead-&gt;num_retry = req-&gt;r_attempts - 1;</div><div class='add'>+		if (!old_version) {</div><div class='add'>+			nhead = (struct ceph_mds_request_head*)msg-&gt;front.iov_base;</div><div class='add'>+			nhead-&gt;ext_num_retry = cpu_to_le32(req-&gt;r_attempts - 1);</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		/* remove cap/dentry releases from message */</div><div class='del'>-		rhead-&gt;num_releases = 0;</div><div class='add'>+		lhead-&gt;num_releases = 0;</div><div class='ctx'> </div><div class='ctx'> 		p = msg-&gt;front.iov_base + req-&gt;r_request_release_offset;</div><div class='del'>-		encode_timestamp_and_gids(&amp;p, req);</div><div class='add'>+		encode_mclientrequest_tail(&amp;p, req);</div><div class='ctx'> </div><div class='ctx'> 		msg-&gt;front.iov_len = p - msg-&gt;front.iov_base;</div><div class='ctx'> 		msg-&gt;hdr.front_len = cpu_to_le32(msg-&gt;front.iov_len);</div><div class='hunk'>@@ -2791,20 +3388,25 @@ static int __prepare_send_request(struct ceph_mds_session *session,</div><div class='ctx'> 	}</div><div class='ctx'> 	req-&gt;r_request = msg;</div><div class='ctx'> </div><div class='del'>-	rhead = find_old_request_head(msg-&gt;front.iov_base,</div><div class='del'>-				      session-&gt;s_con.peer_features);</div><div class='del'>-	rhead-&gt;oldest_client_tid = cpu_to_le64(__get_oldest_tid(mdsc));</div><div class='add'>+	lhead = find_legacy_request_head(msg-&gt;front.iov_base,</div><div class='add'>+					 session-&gt;s_con.peer_features);</div><div class='add'>+	lhead-&gt;oldest_client_tid = cpu_to_le64(__get_oldest_tid(mdsc));</div><div class='ctx'> 	if (test_bit(CEPH_MDS_R_GOT_UNSAFE, &amp;req-&gt;r_req_flags))</div><div class='ctx'> 		flags |= CEPH_MDS_FLAG_REPLAY;</div><div class='ctx'> 	if (test_bit(CEPH_MDS_R_ASYNC, &amp;req-&gt;r_req_flags))</div><div class='ctx'> 		flags |= CEPH_MDS_FLAG_ASYNC;</div><div class='ctx'> 	if (req-&gt;r_parent)</div><div class='ctx'> 		flags |= CEPH_MDS_FLAG_WANT_DENTRY;</div><div class='del'>-	rhead-&gt;flags = cpu_to_le32(flags);</div><div class='del'>-	rhead-&gt;num_fwd = req-&gt;r_num_fwd;</div><div class='del'>-	rhead-&gt;num_retry = req-&gt;r_attempts - 1;</div><div class='add'>+	lhead-&gt;flags = cpu_to_le32(flags);</div><div class='add'>+	lhead-&gt;num_fwd = req-&gt;r_num_fwd;</div><div class='add'>+	lhead-&gt;num_retry = req-&gt;r_attempts - 1;</div><div class='add'>+	if (!old_version) {</div><div class='add'>+		nhead = (struct ceph_mds_request_head*)msg-&gt;front.iov_base;</div><div class='add'>+		nhead-&gt;ext_num_fwd = cpu_to_le32(req-&gt;r_num_fwd);</div><div class='add'>+		nhead-&gt;ext_num_retry = cpu_to_le32(req-&gt;r_attempts - 1);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	dout(" r_parent = %p\n", req-&gt;r_parent);</div><div class='add'>+	doutc(cl, " r_parent = %p\n", req-&gt;r_parent);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2832,6 +3434,7 @@ static int __send_request(struct ceph_mds_session *session,</div><div class='ctx'> static void __do_request(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			struct ceph_mds_request *req)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_mds_session *session = NULL;</div><div class='ctx'> 	int mds = -1;</div><div class='ctx'> 	int err = 0;</div><div class='hunk'>@@ -2843,25 +3446,30 @@ static void __do_request(struct ceph_mds_client *mdsc,</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (READ_ONCE(mdsc-&gt;fsc-&gt;mount_state) == CEPH_MOUNT_FENCE_IO) {</div><div class='add'>+		doutc(cl, "metadata corrupted\n");</div><div class='add'>+		err = -EIO;</div><div class='add'>+		goto finish;</div><div class='add'>+	}</div><div class='ctx'> 	if (req-&gt;r_timeout &amp;&amp;</div><div class='ctx'> 	    time_after_eq(jiffies, req-&gt;r_started + req-&gt;r_timeout)) {</div><div class='del'>-		dout("do_request timed out\n");</div><div class='add'>+		doutc(cl, "timed out\n");</div><div class='ctx'> 		err = -ETIMEDOUT;</div><div class='ctx'> 		goto finish;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (READ_ONCE(mdsc-&gt;fsc-&gt;mount_state) == CEPH_MOUNT_SHUTDOWN) {</div><div class='del'>-		dout("do_request forced umount\n");</div><div class='add'>+		doutc(cl, "forced umount\n");</div><div class='ctx'> 		err = -EIO;</div><div class='ctx'> 		goto finish;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (READ_ONCE(mdsc-&gt;fsc-&gt;mount_state) == CEPH_MOUNT_MOUNTING) {</div><div class='ctx'> 		if (mdsc-&gt;mdsmap_err) {</div><div class='ctx'> 			err = mdsc-&gt;mdsmap_err;</div><div class='del'>-			dout("do_request mdsmap err %d\n", err);</div><div class='add'>+			doutc(cl, "mdsmap err %d\n", err);</div><div class='ctx'> 			goto finish;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (mdsc-&gt;mdsmap-&gt;m_epoch == 0) {</div><div class='del'>-			dout("do_request no mdsmap, waiting for map\n");</div><div class='add'>+			doutc(cl, "no mdsmap, waiting for map\n");</div><div class='ctx'> 			list_add(&amp;req-&gt;r_wait, &amp;mdsc-&gt;waiting_for_map);</div><div class='ctx'> 			return;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2882,7 +3490,7 @@ static void __do_request(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			err = -EJUKEBOX;</div><div class='ctx'> 			goto finish;</div><div class='ctx'> 		}</div><div class='del'>-		dout("do_request no mds or not active, waiting for map\n");</div><div class='add'>+		doutc(cl, "no mds or not active, waiting for map\n");</div><div class='ctx'> 		list_add(&amp;req-&gt;r_wait, &amp;mdsc-&gt;waiting_for_map);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2898,8 +3506,18 @@ static void __do_request(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	}</div><div class='ctx'> 	req-&gt;r_session = ceph_get_mds_session(session);</div><div class='ctx'> </div><div class='del'>-	dout("do_request mds%d session %p state %s\n", mds, session,</div><div class='del'>-	     ceph_session_state_name(session-&gt;s_state));</div><div class='add'>+	doutc(cl, "mds%d session %p state %s\n", mds, session,</div><div class='add'>+	      ceph_session_state_name(session-&gt;s_state));</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The old ceph will crash the MDSs when see unknown OPs</div><div class='add'>+	 */</div><div class='add'>+	if (req-&gt;r_feature_needed &gt; 0 &amp;&amp;</div><div class='add'>+	    !test_bit(req-&gt;r_feature_needed, &amp;session-&gt;s_features)) {</div><div class='add'>+		err = -EOPNOTSUPP;</div><div class='add'>+		goto out_session;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (session-&gt;s_state != CEPH_MDS_SESSION_OPEN &amp;&amp;</div><div class='ctx'> 	    session-&gt;s_state != CEPH_MDS_SESSION_HUNG) {</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -2944,13 +3562,71 @@ static void __do_request(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	if (req-&gt;r_request_started == 0)   /* note request start time */</div><div class='ctx'> 		req-&gt;r_request_started = jiffies;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * For async create we will choose the auth MDS of frag in parent</div><div class='add'>+	 * directory to send the request and usually this works fine, but</div><div class='add'>+	 * if the migrated the dirtory to another MDS before it could handle</div><div class='add'>+	 * it the request will be forwarded.</div><div class='add'>+	 *</div><div class='add'>+	 * And then the auth cap will be changed.</div><div class='add'>+	 */</div><div class='add'>+	if (test_bit(CEPH_MDS_R_ASYNC, &amp;req-&gt;r_req_flags) &amp;&amp; req-&gt;r_num_fwd) {</div><div class='add'>+		struct ceph_dentry_info *di = ceph_dentry(req-&gt;r_dentry);</div><div class='add'>+		struct ceph_inode_info *ci;</div><div class='add'>+		struct ceph_cap *cap;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * The request maybe handled very fast and the new inode</div><div class='add'>+		 * hasn't been linked to the dentry yet. We need to wait</div><div class='add'>+		 * for the ceph_finish_async_create(), which shouldn't be</div><div class='add'>+		 * stuck too long or fail in thoery, to finish when forwarding</div><div class='add'>+		 * the request.</div><div class='add'>+		 */</div><div class='add'>+		if (!d_inode(req-&gt;r_dentry)) {</div><div class='add'>+			err = wait_on_bit(&amp;di-&gt;flags, CEPH_DENTRY_ASYNC_CREATE_BIT,</div><div class='add'>+					  TASK_KILLABLE);</div><div class='add'>+			if (err) {</div><div class='add'>+				mutex_lock(&amp;req-&gt;r_fill_mutex);</div><div class='add'>+				set_bit(CEPH_MDS_R_ABORTED, &amp;req-&gt;r_req_flags);</div><div class='add'>+				mutex_unlock(&amp;req-&gt;r_fill_mutex);</div><div class='add'>+				goto out_session;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		ci = ceph_inode(d_inode(req-&gt;r_dentry));</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+		cap = ci-&gt;i_auth_cap;</div><div class='add'>+		if (ci-&gt;i_ceph_flags &amp; CEPH_I_ASYNC_CREATE &amp;&amp; mds != cap-&gt;mds) {</div><div class='add'>+			doutc(cl, "session changed for auth cap %d -&gt; %d\n",</div><div class='add'>+			      cap-&gt;session-&gt;s_mds, session-&gt;s_mds);</div><div class='add'>+</div><div class='add'>+			/* Remove the auth cap from old session */</div><div class='add'>+			spin_lock(&amp;cap-&gt;session-&gt;s_cap_lock);</div><div class='add'>+			cap-&gt;session-&gt;s_nr_caps--;</div><div class='add'>+			list_del_init(&amp;cap-&gt;session_caps);</div><div class='add'>+			spin_unlock(&amp;cap-&gt;session-&gt;s_cap_lock);</div><div class='add'>+</div><div class='add'>+			/* Add the auth cap to the new session */</div><div class='add'>+			cap-&gt;mds = mds;</div><div class='add'>+			cap-&gt;session = session;</div><div class='add'>+			spin_lock(&amp;session-&gt;s_cap_lock);</div><div class='add'>+			session-&gt;s_nr_caps++;</div><div class='add'>+			list_add_tail(&amp;cap-&gt;session_caps, &amp;session-&gt;s_caps);</div><div class='add'>+			spin_unlock(&amp;session-&gt;s_cap_lock);</div><div class='add'>+</div><div class='add'>+			change_auth_cap_ses(ci, session);</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	err = __send_request(session, req, false);</div><div class='ctx'> </div><div class='ctx'> out_session:</div><div class='ctx'> 	ceph_put_mds_session(session);</div><div class='ctx'> finish:</div><div class='ctx'> 	if (err) {</div><div class='del'>-		dout("__do_request early error %d\n", err);</div><div class='add'>+		doutc(cl, "early error %d\n", err);</div><div class='ctx'> 		req-&gt;r_err = err;</div><div class='ctx'> 		complete_request(mdsc, req);</div><div class='ctx'> 		__unregister_request(mdsc, req);</div><div class='hunk'>@@ -2964,6 +3640,7 @@ finish:</div><div class='ctx'> static void __wake_requests(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			    struct list_head *head)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_mds_request *req;</div><div class='ctx'> 	LIST_HEAD(tmp_list);</div><div class='ctx'> </div><div class='hunk'>@@ -2973,7 +3650,8 @@ static void __wake_requests(struct ceph_mds_client *mdsc,</div><div class='ctx'> 		req = list_entry(tmp_list.next,</div><div class='ctx'> 				 struct ceph_mds_request, r_wait);</div><div class='ctx'> 		list_del_init(&amp;req-&gt;r_wait);</div><div class='del'>-		dout(" wake request %p tid %llu\n", req, req-&gt;r_tid);</div><div class='add'>+		doutc(cl, " wake request %p tid %llu\n", req,</div><div class='add'>+		      req-&gt;r_tid);</div><div class='ctx'> 		__do_request(mdsc, req);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -2984,10 +3662,11 @@ static void __wake_requests(struct ceph_mds_client *mdsc,</div><div class='ctx'>  */</div><div class='ctx'> static void kick_requests(struct ceph_mds_client *mdsc, int mds)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_mds_request *req;</div><div class='ctx'> 	struct rb_node *p = rb_first(&amp;mdsc-&gt;request_tree);</div><div class='ctx'> </div><div class='del'>-	dout("kick_requests mds%d\n", mds);</div><div class='add'>+	doutc(cl, "kick_requests mds%d\n", mds);</div><div class='ctx'> 	while (p) {</div><div class='ctx'> 		req = rb_entry(p, struct ceph_mds_request, r_node);</div><div class='ctx'> 		p = rb_next(p);</div><div class='hunk'>@@ -2997,7 +3676,7 @@ static void kick_requests(struct ceph_mds_client *mdsc, int mds)</div><div class='ctx'> 			continue; /* only new requests */</div><div class='ctx'> 		if (req-&gt;r_session &amp;&amp;</div><div class='ctx'> 		    req-&gt;r_session-&gt;s_mds == mds) {</div><div class='del'>-			dout(" kicking tid %llu\n", req-&gt;r_tid);</div><div class='add'>+			doutc(cl, " kicking tid %llu\n", req-&gt;r_tid);</div><div class='ctx'> 			list_del_init(&amp;req-&gt;r_wait);</div><div class='ctx'> 			__do_request(mdsc, req);</div><div class='ctx'> 		}</div><div class='hunk'>@@ -3007,6 +3686,7 @@ static void kick_requests(struct ceph_mds_client *mdsc, int mds)</div><div class='ctx'> int ceph_mdsc_submit_request(struct ceph_mds_client *mdsc, struct inode *dir,</div><div class='ctx'> 			      struct ceph_mds_request *req)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='ctx'> 	/* take CAP_PIN refs for r_inode, r_parent, r_old_dentry */</div><div class='hunk'>@@ -3028,8 +3708,7 @@ int ceph_mdsc_submit_request(struct ceph_mds_client *mdsc, struct inode *dir,</div><div class='ctx'> 	if (req-&gt;r_inode) {</div><div class='ctx'> 		err = ceph_wait_on_async_create(req-&gt;r_inode);</div><div class='ctx'> 		if (err) {</div><div class='del'>-			dout("%s: wait for async create returned: %d\n",</div><div class='del'>-			     __func__, err);</div><div class='add'>+			doutc(cl, "wait for async create returned: %d\n", err);</div><div class='ctx'> 			return err;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3037,13 +3716,12 @@ int ceph_mdsc_submit_request(struct ceph_mds_client *mdsc, struct inode *dir,</div><div class='ctx'> 	if (!err &amp;&amp; req-&gt;r_old_inode) {</div><div class='ctx'> 		err = ceph_wait_on_async_create(req-&gt;r_old_inode);</div><div class='ctx'> 		if (err) {</div><div class='del'>-			dout("%s: wait for async create returned: %d\n",</div><div class='del'>-			     __func__, err);</div><div class='add'>+			doutc(cl, "wait for async create returned: %d\n", err);</div><div class='ctx'> 			return err;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("submit_request on %p for inode %p\n", req, dir);</div><div class='add'>+	doutc(cl, "submit_request on %p for inode %p\n", req, dir);</div><div class='ctx'> 	mutex_lock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> 	__register_request(mdsc, req, dir);</div><div class='ctx'> 	__do_request(mdsc, req);</div><div class='hunk'>@@ -3052,15 +3730,17 @@ int ceph_mdsc_submit_request(struct ceph_mds_client *mdsc, struct inode *dir,</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ceph_mdsc_wait_request(struct ceph_mds_client *mdsc,</div><div class='del'>-				  struct ceph_mds_request *req)</div><div class='add'>+int ceph_mdsc_wait_request(struct ceph_mds_client *mdsc,</div><div class='add'>+			   struct ceph_mds_request *req,</div><div class='add'>+			   ceph_mds_request_wait_callback_t wait_func)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	/* wait */</div><div class='del'>-	dout("do_request waiting\n");</div><div class='del'>-	if (!req-&gt;r_timeout &amp;&amp; req-&gt;r_wait_for_completion) {</div><div class='del'>-		err = req-&gt;r_wait_for_completion(mdsc, req);</div><div class='add'>+	doutc(cl, "do_request waiting\n");</div><div class='add'>+	if (wait_func) {</div><div class='add'>+		err = wait_func(mdsc, req);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		long timeleft = wait_for_completion_killable_timeout(</div><div class='ctx'> 					&amp;req-&gt;r_completion,</div><div class='hunk'>@@ -3072,14 +3752,14 @@ static int ceph_mdsc_wait_request(struct ceph_mds_client *mdsc,</div><div class='ctx'> 		else</div><div class='ctx'> 			err = timeleft;  /* killed */</div><div class='ctx'> 	}</div><div class='del'>-	dout("do_request waited, got %d\n", err);</div><div class='add'>+	doutc(cl, "do_request waited, got %d\n", err);</div><div class='ctx'> 	mutex_lock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> </div><div class='ctx'> 	/* only abort if we didn't race with a real reply */</div><div class='ctx'> 	if (test_bit(CEPH_MDS_R_GOT_RESULT, &amp;req-&gt;r_req_flags)) {</div><div class='ctx'> 		err = le32_to_cpu(req-&gt;r_reply_info.head-&gt;result);</div><div class='ctx'> 	} else if (err &lt; 0) {</div><div class='del'>-		dout("aborted request %lld with %d\n", req-&gt;r_tid, err);</div><div class='add'>+		doutc(cl, "aborted request %lld with %d\n", req-&gt;r_tid, err);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * ensure we aren't running concurrently with</div><div class='hunk'>@@ -3110,15 +3790,16 @@ int ceph_mdsc_do_request(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			 struct inode *dir,</div><div class='ctx'> 			 struct ceph_mds_request *req)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	dout("do_request on %p\n", req);</div><div class='add'>+	doutc(cl, "do_request on %p\n", req);</div><div class='ctx'> </div><div class='ctx'> 	/* issue */</div><div class='ctx'> 	err = ceph_mdsc_submit_request(mdsc, dir, req);</div><div class='ctx'> 	if (!err)</div><div class='del'>-		err = ceph_mdsc_wait_request(mdsc, req);</div><div class='del'>-	dout("do_request %p done, result %d\n", req, err);</div><div class='add'>+		err = ceph_mdsc_wait_request(mdsc, req, NULL);</div><div class='add'>+	doutc(cl, "do_request %p done, result %d\n", req, err);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3130,8 +3811,10 @@ void ceph_invalidate_dir_request(struct ceph_mds_request *req)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *dir = req-&gt;r_parent;</div><div class='ctx'> 	struct inode *old_dir = req-&gt;r_old_dentry_dir;</div><div class='add'>+	struct ceph_client *cl = req-&gt;r_mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> </div><div class='del'>-	dout("invalidate_dir_request %p %p (complete, lease(s))\n", dir, old_dir);</div><div class='add'>+	doutc(cl, "invalidate_dir_request %p %p (complete, lease(s))\n",</div><div class='add'>+	      dir, old_dir);</div><div class='ctx'> </div><div class='ctx'> 	ceph_dir_clear_complete(dir);</div><div class='ctx'> 	if (old_dir)</div><div class='hunk'>@@ -3152,6 +3835,7 @@ void ceph_invalidate_dir_request(struct ceph_mds_request *req)</div><div class='ctx'> static void handle_reply(struct ceph_mds_session *session, struct ceph_msg *msg)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_mds_client *mdsc = session-&gt;s_mdsc;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_mds_request *req;</div><div class='ctx'> 	struct ceph_mds_reply_head *head = msg-&gt;front.iov_base;</div><div class='ctx'> 	struct ceph_mds_reply_info_parsed *rinfo;  /* parsed reply info */</div><div class='hunk'>@@ -3159,9 +3843,10 @@ static void handle_reply(struct ceph_mds_session *session, struct ceph_msg *msg)</div><div class='ctx'> 	u64 tid;</div><div class='ctx'> 	int err, result;</div><div class='ctx'> 	int mds = session-&gt;s_mds;</div><div class='add'>+	bool close_sessions = false;</div><div class='ctx'> </div><div class='ctx'> 	if (msg-&gt;front.iov_len &lt; sizeof(*head)) {</div><div class='del'>-		pr_err("mdsc_handle_reply got corrupt (short) reply\n");</div><div class='add'>+		pr_err_client(cl, "got corrupt (short) reply\n");</div><div class='ctx'> 		ceph_msg_dump(msg);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3171,17 +3856,17 @@ static void handle_reply(struct ceph_mds_session *session, struct ceph_msg *msg)</div><div class='ctx'> 	mutex_lock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> 	req = lookup_get_request(mdsc, tid);</div><div class='ctx'> 	if (!req) {</div><div class='del'>-		dout("handle_reply on unknown tid %llu\n", tid);</div><div class='add'>+		doutc(cl, "on unknown tid %llu\n", tid);</div><div class='ctx'> 		mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='del'>-	dout("handle_reply %p\n", req);</div><div class='add'>+	doutc(cl, "handle_reply %p\n", req);</div><div class='ctx'> </div><div class='ctx'> 	/* correct session? */</div><div class='ctx'> 	if (req-&gt;r_session != session) {</div><div class='del'>-		pr_err("mdsc_handle_reply got %llu on session mds%d"</div><div class='del'>-		       " not mds%d\n", tid, session-&gt;s_mds,</div><div class='del'>-		       req-&gt;r_session ? req-&gt;r_session-&gt;s_mds : -1);</div><div class='add'>+		pr_err_client(cl, "got %llu on session mds%d not mds%d\n",</div><div class='add'>+			      tid, session-&gt;s_mds,</div><div class='add'>+			      req-&gt;r_session ? req-&gt;r_session-&gt;s_mds : -1);</div><div class='ctx'> 		mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3189,49 +3874,20 @@ static void handle_reply(struct ceph_mds_session *session, struct ceph_msg *msg)</div><div class='ctx'> 	/* dup? */</div><div class='ctx'> 	if ((test_bit(CEPH_MDS_R_GOT_UNSAFE, &amp;req-&gt;r_req_flags) &amp;&amp; !head-&gt;safe) ||</div><div class='ctx'> 	    (test_bit(CEPH_MDS_R_GOT_SAFE, &amp;req-&gt;r_req_flags) &amp;&amp; head-&gt;safe)) {</div><div class='del'>-		pr_warn("got a dup %s reply on %llu from mds%d\n",</div><div class='del'>-			   head-&gt;safe ? "safe" : "unsafe", tid, mds);</div><div class='add'>+		pr_warn_client(cl, "got a dup %s reply on %llu from mds%d\n",</div><div class='add'>+			       head-&gt;safe ? "safe" : "unsafe", tid, mds);</div><div class='ctx'> 		mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (test_bit(CEPH_MDS_R_GOT_SAFE, &amp;req-&gt;r_req_flags)) {</div><div class='del'>-		pr_warn("got unsafe after safe on %llu from mds%d\n",</div><div class='del'>-			   tid, mds);</div><div class='add'>+		pr_warn_client(cl, "got unsafe after safe on %llu from mds%d\n",</div><div class='add'>+			       tid, mds);</div><div class='ctx'> 		mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	result = le32_to_cpu(head-&gt;result);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Handle an ESTALE</div><div class='del'>-	 * if we're not talking to the authority, send to them</div><div class='del'>-	 * if the authority has changed while we weren't looking,</div><div class='del'>-	 * send to new authority</div><div class='del'>-	 * Otherwise we just have to return an ESTALE</div><div class='del'>-	 */</div><div class='del'>-	if (result == -ESTALE) {</div><div class='del'>-		dout("got ESTALE on request %llu\n", req-&gt;r_tid);</div><div class='del'>-		req-&gt;r_resend_mds = -1;</div><div class='del'>-		if (req-&gt;r_direct_mode != USE_AUTH_MDS) {</div><div class='del'>-			dout("not using auth, setting for that now\n");</div><div class='del'>-			req-&gt;r_direct_mode = USE_AUTH_MDS;</div><div class='del'>-			__do_request(mdsc, req);</div><div class='del'>-			mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='del'>-			goto out;</div><div class='del'>-		} else  {</div><div class='del'>-			int mds = __choose_mds(mdsc, req, NULL);</div><div class='del'>-			if (mds &gt;= 0 &amp;&amp; mds != req-&gt;r_session-&gt;s_mds) {</div><div class='del'>-				dout("but auth changed, so resending\n");</div><div class='del'>-				__do_request(mdsc, req);</div><div class='del'>-				mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-		dout("have to return ESTALE on request %llu\n", req-&gt;r_tid);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-</div><div class='ctx'> 	if (head-&gt;safe) {</div><div class='ctx'> 		set_bit(CEPH_MDS_R_GOT_SAFE, &amp;req-&gt;r_req_flags);</div><div class='ctx'> 		__unregister_request(mdsc, req);</div><div class='hunk'>@@ -3248,7 +3904,7 @@ static void handle_reply(struct ceph_mds_session *session, struct ceph_msg *msg)</div><div class='ctx'> 			 * response.  And even if it did, there is nothing</div><div class='ctx'> 			 * useful we could do with a revised return value.</div><div class='ctx'> 			 */</div><div class='del'>-			dout("got safe reply %llu, mds%d\n", tid, mds);</div><div class='add'>+			doutc(cl, "got safe reply %llu, mds%d\n", tid, mds);</div><div class='ctx'> </div><div class='ctx'> 			mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> 			goto out;</div><div class='hunk'>@@ -3258,23 +3914,36 @@ static void handle_reply(struct ceph_mds_session *session, struct ceph_msg *msg)</div><div class='ctx'> 		list_add_tail(&amp;req-&gt;r_unsafe_item, &amp;req-&gt;r_session-&gt;s_unsafe);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("handle_reply tid %lld result %d\n", tid, result);</div><div class='del'>-	rinfo = &amp;req-&gt;r_reply_info;</div><div class='add'>+	doutc(cl, "tid %lld result %d\n", tid, result);</div><div class='ctx'> 	if (test_bit(CEPHFS_FEATURE_REPLY_ENCODING, &amp;session-&gt;s_features))</div><div class='del'>-		err = parse_reply_info(session, msg, rinfo, (u64)-1);</div><div class='add'>+		err = parse_reply_info(session, msg, req, (u64)-1);</div><div class='ctx'> 	else</div><div class='del'>-		err = parse_reply_info(session, msg, rinfo, session-&gt;s_con.peer_features);</div><div class='add'>+		err = parse_reply_info(session, msg, req,</div><div class='add'>+				       session-&gt;s_con.peer_features);</div><div class='ctx'> 	mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> </div><div class='ctx'> 	/* Must find target inode outside of mutexes to avoid deadlocks */</div><div class='add'>+	rinfo = &amp;req-&gt;r_reply_info;</div><div class='ctx'> 	if ((err &gt;= 0) &amp;&amp; rinfo-&gt;head-&gt;is_target) {</div><div class='del'>-		struct inode *in;</div><div class='add'>+		struct inode *in = xchg(&amp;req-&gt;r_new_inode, NULL);</div><div class='ctx'> 		struct ceph_vino tvino = {</div><div class='ctx'> 			.ino  = le64_to_cpu(rinfo-&gt;targeti.in-&gt;ino),</div><div class='ctx'> 			.snap = le64_to_cpu(rinfo-&gt;targeti.in-&gt;snapid)</div><div class='ctx'> 		};</div><div class='ctx'> </div><div class='del'>-		in = ceph_get_inode(mdsc-&gt;fsc-&gt;sb, tvino);</div><div class='add'>+		/*</div><div class='add'>+		 * If we ended up opening an existing inode, discard</div><div class='add'>+		 * r_new_inode</div><div class='add'>+		 */</div><div class='add'>+		if (req-&gt;r_op == CEPH_MDS_OP_CREATE &amp;&amp;</div><div class='add'>+		    !req-&gt;r_reply_info.has_create_ino) {</div><div class='add'>+			/* This should never happen on an async create */</div><div class='add'>+			WARN_ON_ONCE(req-&gt;r_deleg_ino);</div><div class='add'>+			iput(in);</div><div class='add'>+			in = NULL;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		in = ceph_get_inode(mdsc-&gt;fsc-&gt;sb, tvino, in);</div><div class='ctx'> 		if (IS_ERR(in)) {</div><div class='ctx'> 			err = PTR_ERR(in);</div><div class='ctx'> 			mutex_lock(&amp;session-&gt;s_mutex);</div><div class='hunk'>@@ -3285,7 +3954,8 @@ static void handle_reply(struct ceph_mds_session *session, struct ceph_msg *msg)</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;session-&gt;s_mutex);</div><div class='ctx'> 	if (err &lt; 0) {</div><div class='del'>-		pr_err("mdsc_handle_reply got corrupt reply mds%d(tid:%lld)\n", mds, tid);</div><div class='add'>+		pr_err_client(cl, "got corrupt reply mds%d(tid:%lld)\n",</div><div class='add'>+			      mds, tid);</div><div class='ctx'> 		ceph_msg_dump(msg);</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3294,10 +3964,17 @@ static void handle_reply(struct ceph_mds_session *session, struct ceph_msg *msg)</div><div class='ctx'> 	realm = NULL;</div><div class='ctx'> 	if (rinfo-&gt;snapblob_len) {</div><div class='ctx'> 		down_write(&amp;mdsc-&gt;snap_rwsem);</div><div class='del'>-		ceph_update_snap_trace(mdsc, rinfo-&gt;snapblob,</div><div class='add'>+		err = ceph_update_snap_trace(mdsc, rinfo-&gt;snapblob,</div><div class='ctx'> 				rinfo-&gt;snapblob + rinfo-&gt;snapblob_len,</div><div class='ctx'> 				le32_to_cpu(head-&gt;op) == CEPH_MDS_OP_RMSNAP,</div><div class='ctx'> 				&amp;realm);</div><div class='add'>+		if (err) {</div><div class='add'>+			up_write(&amp;mdsc-&gt;snap_rwsem);</div><div class='add'>+			close_sessions = true;</div><div class='add'>+			if (err == -EIO)</div><div class='add'>+				ceph_msg_dump(msg);</div><div class='add'>+			goto out_err;</div><div class='add'>+		}</div><div class='ctx'> 		downgrade_write(&amp;mdsc-&gt;snap_rwsem);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		down_read(&amp;mdsc-&gt;snap_rwsem);</div><div class='hunk'>@@ -3310,7 +3987,7 @@ static void handle_reply(struct ceph_mds_session *session, struct ceph_msg *msg)</div><div class='ctx'> 	if (err == 0) {</div><div class='ctx'> 		if (result == 0 &amp;&amp; (req-&gt;r_op == CEPH_MDS_OP_READDIR ||</div><div class='ctx'> 				    req-&gt;r_op == CEPH_MDS_OP_LSSNAP))</div><div class='del'>-			ceph_readdir_prepopulate(req, req-&gt;r_session);</div><div class='add'>+			err = ceph_readdir_prepopulate(req, req-&gt;r_session);</div><div class='ctx'> 	}</div><div class='ctx'> 	current-&gt;journal_info = NULL;</div><div class='ctx'> 	mutex_unlock(&amp;req-&gt;r_fill_mutex);</div><div class='hunk'>@@ -3342,7 +4019,7 @@ out_err:</div><div class='ctx'> 			set_bit(CEPH_MDS_R_GOT_RESULT, &amp;req-&gt;r_req_flags);</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='del'>-		dout("reply arrived after request %lld was aborted\n", tid);</div><div class='add'>+		doutc(cl, "reply arrived after request %lld was aborted\n", tid);</div><div class='ctx'> 	}</div><div class='ctx'> 	mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> </div><div class='hunk'>@@ -3355,6 +4032,10 @@ out_err:</div><div class='ctx'> 				     req-&gt;r_end_latency, err);</div><div class='ctx'> out:</div><div class='ctx'> 	ceph_mdsc_put_request(req);</div><div class='add'>+</div><div class='add'>+	/* Defer closing the sessions after s_mutex lock being released */</div><div class='add'>+	if (close_sessions)</div><div class='add'>+		ceph_mdsc_close_sessions(mdsc);</div><div class='ctx'> 	return;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3367,6 +4048,7 @@ static void handle_forward(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			   struct ceph_mds_session *session,</div><div class='ctx'> 			   struct ceph_msg *msg)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_mds_request *req;</div><div class='ctx'> 	u64 tid = le64_to_cpu(msg-&gt;hdr.tid);</div><div class='ctx'> 	u32 next_mds;</div><div class='hunk'>@@ -3374,6 +4056,7 @@ static void handle_forward(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	int err = -EINVAL;</div><div class='ctx'> 	void *p = msg-&gt;front.iov_base;</div><div class='ctx'> 	void *end = p + msg-&gt;front.iov_len;</div><div class='add'>+	bool aborted = false;</div><div class='ctx'> </div><div class='ctx'> 	ceph_decode_need(&amp;p, end, 2*sizeof(u32), bad);</div><div class='ctx'> 	next_mds = ceph_decode_32(&amp;p);</div><div class='hunk'>@@ -3382,19 +4065,33 @@ static void handle_forward(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	mutex_lock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> 	req = lookup_get_request(mdsc, tid);</div><div class='ctx'> 	if (!req) {</div><div class='del'>-		dout("forward tid %llu to mds%d - req dne\n", tid, next_mds);</div><div class='del'>-		goto out;  /* dup reply? */</div><div class='add'>+		mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='add'>+		doutc(cl, "forward tid %llu to mds%d - req dne\n", tid, next_mds);</div><div class='add'>+		return;  /* dup reply? */</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (test_bit(CEPH_MDS_R_ABORTED, &amp;req-&gt;r_req_flags)) {</div><div class='del'>-		dout("forward tid %llu aborted, unregistering\n", tid);</div><div class='add'>+		doutc(cl, "forward tid %llu aborted, unregistering\n", tid);</div><div class='ctx'> 		__unregister_request(mdsc, req);</div><div class='del'>-	} else if (fwd_seq &lt;= req-&gt;r_num_fwd) {</div><div class='del'>-		dout("forward tid %llu to mds%d - old seq %d &lt;= %d\n",</div><div class='del'>-		     tid, next_mds, req-&gt;r_num_fwd, fwd_seq);</div><div class='add'>+	} else if (fwd_seq &lt;= req-&gt;r_num_fwd || (uint32_t)fwd_seq &gt;= U32_MAX) {</div><div class='add'>+		/*</div><div class='add'>+		 * Avoid infinite retrying after overflow.</div><div class='add'>+		 *</div><div class='add'>+		 * The MDS will increase the fwd count and in client side</div><div class='add'>+		 * if the num_fwd is less than the one saved in request</div><div class='add'>+		 * that means the MDS is an old version and overflowed of</div><div class='add'>+		 * 8 bits.</div><div class='add'>+		 */</div><div class='add'>+		mutex_lock(&amp;req-&gt;r_fill_mutex);</div><div class='add'>+		req-&gt;r_err = -EMULTIHOP;</div><div class='add'>+		set_bit(CEPH_MDS_R_ABORTED, &amp;req-&gt;r_req_flags);</div><div class='add'>+		mutex_unlock(&amp;req-&gt;r_fill_mutex);</div><div class='add'>+		aborted = true;</div><div class='add'>+		pr_warn_ratelimited_client(cl, "forward tid %llu seq overflow\n",</div><div class='add'>+					   tid);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		/* resend. forward race not possible; mds would drop */</div><div class='del'>-		dout("forward tid %llu to mds%d (we resend)\n", tid, next_mds);</div><div class='add'>+		doutc(cl, "forward tid %llu to mds%d (we resend)\n", tid, next_mds);</div><div class='ctx'> 		BUG_ON(req-&gt;r_err);</div><div class='ctx'> 		BUG_ON(test_bit(CEPH_MDS_R_GOT_RESULT, &amp;req-&gt;r_req_flags));</div><div class='ctx'> 		req-&gt;r_attempts = 0;</div><div class='hunk'>@@ -3403,13 +4100,17 @@ static void handle_forward(struct ceph_mds_client *mdsc,</div><div class='ctx'> 		put_request_session(req);</div><div class='ctx'> 		__do_request(mdsc, req);</div><div class='ctx'> 	}</div><div class='del'>-	ceph_mdsc_put_request(req);</div><div class='del'>-out:</div><div class='ctx'> 	mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='add'>+</div><div class='add'>+	/* kick calling process */</div><div class='add'>+	if (aborted)</div><div class='add'>+		complete_request(mdsc, req);</div><div class='add'>+	ceph_mdsc_put_request(req);</div><div class='ctx'> 	return;</div><div class='ctx'> </div><div class='ctx'> bad:</div><div class='del'>-	pr_err("mdsc_handle_forward decode error err=%d\n", err);</div><div class='add'>+	pr_err_client(cl, "decode error err=%d\n", err);</div><div class='add'>+	ceph_msg_dump(msg);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int __decode_session_metadata(void **p, void *end,</div><div class='hunk'>@@ -3447,15 +4148,19 @@ static void handle_session(struct ceph_mds_session *session,</div><div class='ctx'> 			   struct ceph_msg *msg)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_mds_client *mdsc = session-&gt;s_mdsc;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	int mds = session-&gt;s_mds;</div><div class='ctx'> 	int msg_version = le16_to_cpu(msg-&gt;hdr.version);</div><div class='ctx'> 	void *p = msg-&gt;front.iov_base;</div><div class='ctx'> 	void *end = p + msg-&gt;front.iov_len;</div><div class='ctx'> 	struct ceph_mds_session_head *h;</div><div class='del'>-	u32 op;</div><div class='add'>+	struct ceph_mds_cap_auth *cap_auths = NULL;</div><div class='add'>+	u32 op, cap_auths_num = 0;</div><div class='ctx'> 	u64 seq, features = 0;</div><div class='ctx'> 	int wake = 0;</div><div class='ctx'> 	bool blocklisted = false;</div><div class='add'>+	u32 i;</div><div class='add'>+</div><div class='ctx'> </div><div class='ctx'> 	/* decode */</div><div class='ctx'> 	ceph_decode_need(&amp;p, end, sizeof(*h), bad);</div><div class='hunk'>@@ -3467,9 +4172,14 @@ static void handle_session(struct ceph_mds_session *session,</div><div class='ctx'> </div><div class='ctx'> 	if (msg_version &gt;= 3) {</div><div class='ctx'> 		u32 len;</div><div class='del'>-		/* version &gt;= 2, metadata */</div><div class='del'>-		if (__decode_session_metadata(&amp;p, end, &amp;blocklisted) &lt; 0)</div><div class='add'>+		/* version &gt;= 2 and &lt; 5, decode metadata, skip otherwise</div><div class='add'>+		 * as it's handled via flags.</div><div class='add'>+		 */</div><div class='add'>+		if (msg_version &gt;= 5)</div><div class='add'>+			ceph_decode_skip_map(&amp;p, end, string, string, bad);</div><div class='add'>+		else if (__decode_session_metadata(&amp;p, end, &amp;blocklisted) &lt; 0)</div><div class='ctx'> 			goto bad;</div><div class='add'>+</div><div class='ctx'> 		/* version &gt;= 3, feature bits */</div><div class='ctx'> 		ceph_decode_32_safe(&amp;p, end, len, bad);</div><div class='ctx'> 		if (len) {</div><div class='hunk'>@@ -3478,7 +4188,118 @@ static void handle_session(struct ceph_mds_session *session,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (msg_version &gt;= 5) {</div><div class='add'>+		u32 flags, len;</div><div class='add'>+</div><div class='add'>+		/* version &gt;= 4 */</div><div class='add'>+		ceph_decode_skip_16(&amp;p, end, bad); /* struct_v, struct_cv */</div><div class='add'>+		ceph_decode_32_safe(&amp;p, end, len, bad); /* len */</div><div class='add'>+		ceph_decode_skip_n(&amp;p, end, len, bad); /* metric_spec */</div><div class='add'>+</div><div class='add'>+		/* version &gt;= 5, flags   */</div><div class='add'>+		ceph_decode_32_safe(&amp;p, end, flags, bad);</div><div class='add'>+		if (flags &amp; CEPH_SESSION_BLOCKLISTED) {</div><div class='add'>+			pr_warn_client(cl, "mds%d session blocklisted\n",</div><div class='add'>+				       session-&gt;s_mds);</div><div class='add'>+			blocklisted = true;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (msg_version &gt;= 6) {</div><div class='add'>+		ceph_decode_32_safe(&amp;p, end, cap_auths_num, bad);</div><div class='add'>+		doutc(cl, "cap_auths_num %d\n", cap_auths_num);</div><div class='add'>+</div><div class='add'>+		if (cap_auths_num &amp;&amp; op != CEPH_SESSION_OPEN) {</div><div class='add'>+			WARN_ON_ONCE(op != CEPH_SESSION_OPEN);</div><div class='add'>+			goto skip_cap_auths;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		cap_auths = kcalloc(cap_auths_num,</div><div class='add'>+				    sizeof(struct ceph_mds_cap_auth),</div><div class='add'>+				    GFP_KERNEL);</div><div class='add'>+		if (!cap_auths) {</div><div class='add'>+			pr_err_client(cl, "No memory for cap_auths\n");</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		for (i = 0; i &lt; cap_auths_num; i++) {</div><div class='add'>+			u32 _len, j;</div><div class='add'>+</div><div class='add'>+			/* struct_v, struct_compat, and struct_len in MDSCapAuth */</div><div class='add'>+			ceph_decode_skip_n(&amp;p, end, 2 + sizeof(u32), bad);</div><div class='add'>+</div><div class='add'>+			/* struct_v, struct_compat, and struct_len in MDSCapMatch */</div><div class='add'>+			ceph_decode_skip_n(&amp;p, end, 2 + sizeof(u32), bad);</div><div class='add'>+			ceph_decode_64_safe(&amp;p, end, cap_auths[i].match.uid, bad);</div><div class='add'>+			ceph_decode_32_safe(&amp;p, end, _len, bad);</div><div class='add'>+			if (_len) {</div><div class='add'>+				cap_auths[i].match.gids = kcalloc(_len, sizeof(u32),</div><div class='add'>+								  GFP_KERNEL);</div><div class='add'>+				if (!cap_auths[i].match.gids) {</div><div class='add'>+					pr_err_client(cl, "No memory for gids\n");</div><div class='add'>+					goto fail;</div><div class='add'>+				}</div><div class='add'>+</div><div class='add'>+				cap_auths[i].match.num_gids = _len;</div><div class='add'>+				for (j = 0; j &lt; _len; j++)</div><div class='add'>+					ceph_decode_32_safe(&amp;p, end,</div><div class='add'>+							    cap_auths[i].match.gids[j],</div><div class='add'>+							    bad);</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			ceph_decode_32_safe(&amp;p, end, _len, bad);</div><div class='add'>+			if (_len) {</div><div class='add'>+				cap_auths[i].match.path = kcalloc(_len + 1, sizeof(char),</div><div class='add'>+								  GFP_KERNEL);</div><div class='add'>+				if (!cap_auths[i].match.path) {</div><div class='add'>+					pr_err_client(cl, "No memory for path\n");</div><div class='add'>+					goto fail;</div><div class='add'>+				}</div><div class='add'>+				ceph_decode_copy(&amp;p, cap_auths[i].match.path, _len);</div><div class='add'>+</div><div class='add'>+				/* Remove the tailing '/' */</div><div class='add'>+				while (_len &amp;&amp; cap_auths[i].match.path[_len - 1] == '/') {</div><div class='add'>+					cap_auths[i].match.path[_len - 1] = '\0';</div><div class='add'>+					_len -= 1;</div><div class='add'>+				}</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			ceph_decode_32_safe(&amp;p, end, _len, bad);</div><div class='add'>+			if (_len) {</div><div class='add'>+				cap_auths[i].match.fs_name = kcalloc(_len + 1, sizeof(char),</div><div class='add'>+								     GFP_KERNEL);</div><div class='add'>+				if (!cap_auths[i].match.fs_name) {</div><div class='add'>+					pr_err_client(cl, "No memory for fs_name\n");</div><div class='add'>+					goto fail;</div><div class='add'>+				}</div><div class='add'>+				ceph_decode_copy(&amp;p, cap_auths[i].match.fs_name, _len);</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			ceph_decode_8_safe(&amp;p, end, cap_auths[i].match.root_squash, bad);</div><div class='add'>+			ceph_decode_8_safe(&amp;p, end, cap_auths[i].readable, bad);</div><div class='add'>+			ceph_decode_8_safe(&amp;p, end, cap_auths[i].writeable, bad);</div><div class='add'>+			doutc(cl, "uid %lld, num_gids %u, path %s, fs_name %s, root_squash %d, readable %d, writeable %d\n",</div><div class='add'>+			      cap_auths[i].match.uid, cap_auths[i].match.num_gids,</div><div class='add'>+			      cap_auths[i].match.path, cap_auths[i].match.fs_name,</div><div class='add'>+			      cap_auths[i].match.root_squash,</div><div class='add'>+			      cap_auths[i].readable, cap_auths[i].writeable);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+skip_cap_auths:</div><div class='ctx'> 	mutex_lock(&amp;mdsc-&gt;mutex);</div><div class='add'>+	if (op == CEPH_SESSION_OPEN) {</div><div class='add'>+		if (mdsc-&gt;s_cap_auths) {</div><div class='add'>+			for (i = 0; i &lt; mdsc-&gt;s_cap_auths_num; i++) {</div><div class='add'>+				kfree(mdsc-&gt;s_cap_auths[i].match.gids);</div><div class='add'>+				kfree(mdsc-&gt;s_cap_auths[i].match.path);</div><div class='add'>+				kfree(mdsc-&gt;s_cap_auths[i].match.fs_name);</div><div class='add'>+			}</div><div class='add'>+			kfree(mdsc-&gt;s_cap_auths);</div><div class='add'>+		}</div><div class='add'>+		mdsc-&gt;s_cap_auths_num = cap_auths_num;</div><div class='add'>+		mdsc-&gt;s_cap_auths = cap_auths;</div><div class='add'>+	}</div><div class='ctx'> 	if (op == CEPH_SESSION_CLOSE) {</div><div class='ctx'> 		ceph_get_mds_session(session);</div><div class='ctx'> 		__unregister_session(mdsc, session);</div><div class='hunk'>@@ -3489,24 +4310,41 @@ static void handle_session(struct ceph_mds_session *session,</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;session-&gt;s_mutex);</div><div class='ctx'> </div><div class='del'>-	dout("handle_session mds%d %s %p state %s seq %llu\n",</div><div class='del'>-	     mds, ceph_session_op_name(op), session,</div><div class='del'>-	     ceph_session_state_name(session-&gt;s_state), seq);</div><div class='add'>+	doutc(cl, "mds%d %s %p state %s seq %llu\n", mds,</div><div class='add'>+	      ceph_session_op_name(op), session,</div><div class='add'>+	      ceph_session_state_name(session-&gt;s_state), seq);</div><div class='ctx'> </div><div class='ctx'> 	if (session-&gt;s_state == CEPH_MDS_SESSION_HUNG) {</div><div class='ctx'> 		session-&gt;s_state = CEPH_MDS_SESSION_OPEN;</div><div class='del'>-		pr_info("mds%d came back\n", session-&gt;s_mds);</div><div class='add'>+		pr_info_client(cl, "mds%d came back\n", session-&gt;s_mds);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	switch (op) {</div><div class='ctx'> 	case CEPH_SESSION_OPEN:</div><div class='ctx'> 		if (session-&gt;s_state == CEPH_MDS_SESSION_RECONNECTING)</div><div class='del'>-			pr_info("mds%d reconnect success\n", session-&gt;s_mds);</div><div class='del'>-		session-&gt;s_state = CEPH_MDS_SESSION_OPEN;</div><div class='add'>+			pr_info_client(cl, "mds%d reconnect success\n",</div><div class='add'>+				       session-&gt;s_mds);</div><div class='add'>+</div><div class='ctx'> 		session-&gt;s_features = features;</div><div class='del'>-		renewed_caps(mdsc, session, 0);</div><div class='del'>-		if (test_bit(CEPHFS_FEATURE_METRIC_COLLECT, &amp;session-&gt;s_features))</div><div class='del'>-			metric_schedule_delayed(&amp;mdsc-&gt;metric);</div><div class='add'>+		if (session-&gt;s_state == CEPH_MDS_SESSION_OPEN) {</div><div class='add'>+			pr_notice_client(cl, "mds%d is already opened\n",</div><div class='add'>+					 session-&gt;s_mds);</div><div class='add'>+		} else {</div><div class='add'>+			session-&gt;s_state = CEPH_MDS_SESSION_OPEN;</div><div class='add'>+			renewed_caps(mdsc, session, 0);</div><div class='add'>+			if (test_bit(CEPHFS_FEATURE_METRIC_COLLECT,</div><div class='add'>+				     &amp;session-&gt;s_features))</div><div class='add'>+				metric_schedule_delayed(&amp;mdsc-&gt;metric);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * The connection maybe broken and the session in client</div><div class='add'>+		 * side has been reinitialized, need to update the seq</div><div class='add'>+		 * anyway.</div><div class='add'>+		 */</div><div class='add'>+		if (!session-&gt;s_seq &amp;&amp; seq)</div><div class='add'>+			session-&gt;s_seq = seq;</div><div class='add'>+</div><div class='ctx'> 		wake = 1;</div><div class='ctx'> 		if (mdsc-&gt;stopping)</div><div class='ctx'> 			__close_session(mdsc, session);</div><div class='hunk'>@@ -3519,7 +4357,8 @@ static void handle_session(struct ceph_mds_session *session,</div><div class='ctx'> </div><div class='ctx'> 	case CEPH_SESSION_CLOSE:</div><div class='ctx'> 		if (session-&gt;s_state == CEPH_MDS_SESSION_RECONNECTING)</div><div class='del'>-			pr_info("mds%d reconnect denied\n", session-&gt;s_mds);</div><div class='add'>+			pr_info_client(cl, "mds%d reconnect denied\n",</div><div class='add'>+				       session-&gt;s_mds);</div><div class='ctx'> 		session-&gt;s_state = CEPH_MDS_SESSION_CLOSED;</div><div class='ctx'> 		cleanup_session_requests(mdsc, session);</div><div class='ctx'> 		remove_session_caps(session);</div><div class='hunk'>@@ -3528,8 +4367,8 @@ static void handle_session(struct ceph_mds_session *session,</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	case CEPH_SESSION_STALE:</div><div class='del'>-		pr_info("mds%d caps went stale, renewing\n",</div><div class='del'>-			session-&gt;s_mds);</div><div class='add'>+		pr_info_client(cl, "mds%d caps went stale, renewing\n",</div><div class='add'>+			       session-&gt;s_mds);</div><div class='ctx'> 		atomic_inc(&amp;session-&gt;s_cap_gen);</div><div class='ctx'> 		session-&gt;s_cap_ttl = jiffies - 1;</div><div class='ctx'> 		send_renew_caps(mdsc, session);</div><div class='hunk'>@@ -3540,11 +4379,17 @@ static void handle_session(struct ceph_mds_session *session,</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	case CEPH_SESSION_FLUSHMSG:</div><div class='add'>+		/* flush cap releases */</div><div class='add'>+		spin_lock(&amp;session-&gt;s_cap_lock);</div><div class='add'>+		if (session-&gt;s_num_cap_releases)</div><div class='add'>+			ceph_flush_session_cap_releases(mdsc, session);</div><div class='add'>+		spin_unlock(&amp;session-&gt;s_cap_lock);</div><div class='add'>+</div><div class='ctx'> 		send_flushmsg_ack(mdsc, session, seq);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	case CEPH_SESSION_FORCE_RO:</div><div class='del'>-		dout("force_session_readonly %p\n", session);</div><div class='add'>+		doutc(cl, "force_session_readonly %p\n", session);</div><div class='ctx'> 		spin_lock(&amp;session-&gt;s_cap_lock);</div><div class='ctx'> 		session-&gt;s_readonly = true;</div><div class='ctx'> 		spin_unlock(&amp;session-&gt;s_cap_lock);</div><div class='hunk'>@@ -3553,7 +4398,8 @@ static void handle_session(struct ceph_mds_session *session,</div><div class='ctx'> </div><div class='ctx'> 	case CEPH_SESSION_REJECT:</div><div class='ctx'> 		WARN_ON(session-&gt;s_state != CEPH_MDS_SESSION_OPENING);</div><div class='del'>-		pr_info("mds%d rejected session\n", session-&gt;s_mds);</div><div class='add'>+		pr_info_client(cl, "mds%d rejected session\n",</div><div class='add'>+			       session-&gt;s_mds);</div><div class='ctx'> 		session-&gt;s_state = CEPH_MDS_SESSION_REJECTED;</div><div class='ctx'> 		cleanup_session_requests(mdsc, session);</div><div class='ctx'> 		remove_session_caps(session);</div><div class='hunk'>@@ -3563,7 +4409,7 @@ static void handle_session(struct ceph_mds_session *session,</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	default:</div><div class='del'>-		pr_err("mdsc_handle_session bad op %d mds%d\n", op, mds);</div><div class='add'>+		pr_err_client(cl, "bad op %d mds%d\n", op, mds);</div><div class='ctx'> 		WARN_ON(1);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -3580,32 +4426,40 @@ static void handle_session(struct ceph_mds_session *session,</div><div class='ctx'> 	return;</div><div class='ctx'> </div><div class='ctx'> bad:</div><div class='del'>-	pr_err("mdsc_handle_session corrupt message mds%d len %d\n", mds,</div><div class='del'>-	       (int)msg-&gt;front.iov_len);</div><div class='add'>+	pr_err_client(cl, "corrupt message mds%d len %d\n", mds,</div><div class='add'>+		      (int)msg-&gt;front.iov_len);</div><div class='ctx'> 	ceph_msg_dump(msg);</div><div class='add'>+fail:</div><div class='add'>+	for (i = 0; i &lt; cap_auths_num; i++) {</div><div class='add'>+		kfree(cap_auths[i].match.gids);</div><div class='add'>+		kfree(cap_auths[i].match.path);</div><div class='add'>+		kfree(cap_auths[i].match.fs_name);</div><div class='add'>+	}</div><div class='add'>+	kfree(cap_auths);</div><div class='ctx'> 	return;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void ceph_mdsc_release_dir_caps(struct ceph_mds_request *req)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = req-&gt;r_mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	int dcaps;</div><div class='ctx'> </div><div class='ctx'> 	dcaps = xchg(&amp;req-&gt;r_dir_caps, 0);</div><div class='ctx'> 	if (dcaps) {</div><div class='del'>-		dout("releasing r_dir_caps=%s\n", ceph_cap_string(dcaps));</div><div class='add'>+		doutc(cl, "releasing r_dir_caps=%s\n", ceph_cap_string(dcaps));</div><div class='ctx'> 		ceph_put_cap_refs(ceph_inode(req-&gt;r_parent), dcaps);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void ceph_mdsc_release_dir_caps_no_check(struct ceph_mds_request *req)</div><div class='add'>+void ceph_mdsc_release_dir_caps_async(struct ceph_mds_request *req)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = req-&gt;r_mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	int dcaps;</div><div class='ctx'> </div><div class='ctx'> 	dcaps = xchg(&amp;req-&gt;r_dir_caps, 0);</div><div class='ctx'> 	if (dcaps) {</div><div class='del'>-		dout("releasing r_dir_caps=%s\n", ceph_cap_string(dcaps));</div><div class='del'>-		ceph_put_cap_refs_no_check_caps(ceph_inode(req-&gt;r_parent),</div><div class='del'>-						dcaps);</div><div class='add'>+		doutc(cl, "releasing r_dir_caps=%s\n", ceph_cap_string(dcaps));</div><div class='add'>+		ceph_put_cap_refs_async(ceph_inode(req-&gt;r_parent), dcaps);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3618,7 +4472,7 @@ static void replay_unsafe_requests(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	struct ceph_mds_request *req, *nreq;</div><div class='ctx'> 	struct rb_node *p;</div><div class='ctx'> </div><div class='del'>-	dout("replay_unsafe_requests mds%d\n", session-&gt;s_mds);</div><div class='add'>+	doutc(mdsc-&gt;fsc-&gt;client, "mds%d\n", session-&gt;s_mds);</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> 	list_for_each_entry_safe(req, nreq, &amp;session-&gt;s_unsafe, r_unsafe_item)</div><div class='hunk'>@@ -3641,7 +4495,7 @@ static void replay_unsafe_requests(struct ceph_mds_client *mdsc,</div><div class='ctx'> 		if (req-&gt;r_session-&gt;s_mds != session-&gt;s_mds)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		ceph_mdsc_release_dir_caps_no_check(req);</div><div class='add'>+		ceph_mdsc_release_dir_caps_async(req);</div><div class='ctx'> </div><div class='ctx'> 		__send_request(session, req, true);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3760,43 +4614,46 @@ out_unlock:</div><div class='ctx'> /*</div><div class='ctx'>  * Encode information about a cap for a reconnect with the MDS.</div><div class='ctx'>  */</div><div class='del'>-static int reconnect_caps_cb(struct inode *inode, struct ceph_cap *cap,</div><div class='del'>-			  void *arg)</div><div class='add'>+static int reconnect_caps_cb(struct inode *inode, int mds, void *arg)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_sb_to_mdsc(inode-&gt;i_sb);</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	union {</div><div class='ctx'> 		struct ceph_mds_cap_reconnect v2;</div><div class='ctx'> 		struct ceph_mds_cap_reconnect_v1 v1;</div><div class='ctx'> 	} rec;</div><div class='del'>-	struct ceph_inode_info *ci = cap-&gt;ci;</div><div class='add'>+	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	struct ceph_reconnect_state *recon_state = arg;</div><div class='ctx'> 	struct ceph_pagelist *pagelist = recon_state-&gt;pagelist;</div><div class='ctx'> 	struct dentry *dentry;</div><div class='del'>-	char *path;</div><div class='del'>-	int pathlen, err;</div><div class='del'>-	u64 pathbase;</div><div class='add'>+	struct ceph_cap *cap;</div><div class='add'>+	struct ceph_path_info path_info = {0};</div><div class='add'>+	int err;</div><div class='ctx'> 	u64 snap_follows;</div><div class='ctx'> </div><div class='del'>-	dout(" adding %p ino %llx.%llx cap %p %lld %s\n",</div><div class='del'>-	     inode, ceph_vinop(inode), cap, cap-&gt;cap_id,</div><div class='del'>-	     ceph_cap_string(cap-&gt;issued));</div><div class='del'>-</div><div class='ctx'> 	dentry = d_find_primary(inode);</div><div class='ctx'> 	if (dentry) {</div><div class='ctx'> 		/* set pathbase to parent dir when msg_version &gt;= 2 */</div><div class='del'>-		path = ceph_mdsc_build_path(dentry, &amp;pathlen, &amp;pathbase,</div><div class='add'>+		char *path = ceph_mdsc_build_path(mdsc, dentry, &amp;path_info,</div><div class='ctx'> 					    recon_state-&gt;msg_version &gt;= 2);</div><div class='ctx'> 		dput(dentry);</div><div class='ctx'> 		if (IS_ERR(path)) {</div><div class='ctx'> 			err = PTR_ERR(path);</div><div class='ctx'> 			goto out_err;</div><div class='ctx'> 		}</div><div class='del'>-	} else {</div><div class='del'>-		path = NULL;</div><div class='del'>-		pathlen = 0;</div><div class='del'>-		pathbase = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+	cap = __get_cap_for_mds(ci, mds);</div><div class='add'>+	if (!cap) {</div><div class='add'>+		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='add'>+		err = 0;</div><div class='add'>+		goto out_err;</div><div class='add'>+	}</div><div class='add'>+	doutc(cl, " adding %p ino %llx.%llx cap %p %lld %s\n", inode,</div><div class='add'>+	      ceph_vinop(inode), cap, cap-&gt;cap_id,</div><div class='add'>+	      ceph_cap_string(cap-&gt;issued));</div><div class='add'>+</div><div class='ctx'> 	cap-&gt;seq = 0;        /* reset cap seq */</div><div class='ctx'> 	cap-&gt;issue_seq = 0;  /* and issue_seq */</div><div class='ctx'> 	cap-&gt;mseq = 0;       /* and migrate_seq */</div><div class='hunk'>@@ -3816,18 +4673,22 @@ static int reconnect_caps_cb(struct inode *inode, struct ceph_cap *cap,</div><div class='ctx'> 		rec.v2.wanted = cpu_to_le32(__ceph_caps_wanted(ci));</div><div class='ctx'> 		rec.v2.issued = cpu_to_le32(cap-&gt;issued);</div><div class='ctx'> 		rec.v2.snaprealm = cpu_to_le64(ci-&gt;i_snap_realm-&gt;ino);</div><div class='del'>-		rec.v2.pathbase = cpu_to_le64(pathbase);</div><div class='add'>+		rec.v2.pathbase = cpu_to_le64(path_info.vino.ino);</div><div class='ctx'> 		rec.v2.flock_len = (__force __le32)</div><div class='ctx'> 			((ci-&gt;i_ceph_flags &amp; CEPH_I_ERROR_FILELOCK) ? 0 : 1);</div><div class='ctx'> 	} else {</div><div class='add'>+		struct timespec64 ts;</div><div class='add'>+</div><div class='ctx'> 		rec.v1.cap_id = cpu_to_le64(cap-&gt;cap_id);</div><div class='ctx'> 		rec.v1.wanted = cpu_to_le32(__ceph_caps_wanted(ci));</div><div class='ctx'> 		rec.v1.issued = cpu_to_le32(cap-&gt;issued);</div><div class='ctx'> 		rec.v1.size = cpu_to_le64(i_size_read(inode));</div><div class='del'>-		ceph_encode_timespec64(&amp;rec.v1.mtime, &amp;inode-&gt;i_mtime);</div><div class='del'>-		ceph_encode_timespec64(&amp;rec.v1.atime, &amp;inode-&gt;i_atime);</div><div class='add'>+		ts = inode_get_mtime(inode);</div><div class='add'>+		ceph_encode_timespec64(&amp;rec.v1.mtime, &amp;ts);</div><div class='add'>+		ts = inode_get_atime(inode);</div><div class='add'>+		ceph_encode_timespec64(&amp;rec.v1.atime, &amp;ts);</div><div class='ctx'> 		rec.v1.snaprealm = cpu_to_le64(ci-&gt;i_snap_realm-&gt;ino);</div><div class='del'>-		rec.v1.pathbase = cpu_to_le64(pathbase);</div><div class='add'>+		rec.v1.pathbase = cpu_to_le64(path_info.vino.ino);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (list_empty(&amp;ci-&gt;i_cap_snaps)) {</div><div class='hunk'>@@ -3889,7 +4750,7 @@ encode_again:</div><div class='ctx'> 			    sizeof(struct ceph_filelock);</div><div class='ctx'> 		rec.v2.flock_len = cpu_to_le32(struct_len);</div><div class='ctx'> </div><div class='del'>-		struct_len += sizeof(u32) + pathlen + sizeof(rec.v2);</div><div class='add'>+		struct_len += sizeof(u32) + path_info.pathlen + sizeof(rec.v2);</div><div class='ctx'> </div><div class='ctx'> 		if (struct_v &gt;= 2)</div><div class='ctx'> 			struct_len += sizeof(u64); /* snap_follows */</div><div class='hunk'>@@ -3913,7 +4774,7 @@ encode_again:</div><div class='ctx'> 			ceph_pagelist_encode_8(pagelist, 1);</div><div class='ctx'> 			ceph_pagelist_encode_32(pagelist, struct_len);</div><div class='ctx'> 		}</div><div class='del'>-		ceph_pagelist_encode_string(pagelist, path, pathlen);</div><div class='add'>+		ceph_pagelist_encode_string(pagelist, (char *)path_info.path, path_info.pathlen);</div><div class='ctx'> 		ceph_pagelist_append(pagelist, &amp;rec, sizeof(rec.v2));</div><div class='ctx'> 		ceph_locks_to_pagelist(flocks, pagelist,</div><div class='ctx'> 				       num_fcntl_locks, num_flock_locks);</div><div class='hunk'>@@ -3924,17 +4785,17 @@ out_freeflocks:</div><div class='ctx'> 	} else {</div><div class='ctx'> 		err = ceph_pagelist_reserve(pagelist,</div><div class='ctx'> 					    sizeof(u64) + sizeof(u32) +</div><div class='del'>-					    pathlen + sizeof(rec.v1));</div><div class='add'>+					    path_info.pathlen + sizeof(rec.v1));</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto out_err;</div><div class='ctx'> </div><div class='ctx'> 		ceph_pagelist_encode_64(pagelist, ceph_ino(inode));</div><div class='del'>-		ceph_pagelist_encode_string(pagelist, path, pathlen);</div><div class='add'>+		ceph_pagelist_encode_string(pagelist, (char *)path_info.path, path_info.pathlen);</div><div class='ctx'> 		ceph_pagelist_append(pagelist, &amp;rec, sizeof(rec.v1));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> out_err:</div><div class='del'>-	ceph_mdsc_free_path(path, pathlen);</div><div class='add'>+	ceph_mdsc_free_path_info(&amp;path_info);</div><div class='ctx'> 	if (!err)</div><div class='ctx'> 		recon_state-&gt;nr_caps++;</div><div class='ctx'> 	return err;</div><div class='hunk'>@@ -3945,6 +4806,7 @@ static int encode_snap_realms(struct ceph_mds_client *mdsc,</div><div class='ctx'> {</div><div class='ctx'> 	struct rb_node *p;</div><div class='ctx'> 	struct ceph_pagelist *pagelist = recon_state-&gt;pagelist;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (recon_state-&gt;msg_version &gt;= 4) {</div><div class='hunk'>@@ -3983,8 +4845,8 @@ static int encode_snap_realms(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			ceph_pagelist_encode_32(pagelist, sizeof(sr_rec));</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		dout(" adding snap realm %llx seq %lld parent %llx\n",</div><div class='del'>-		     realm-&gt;ino, realm-&gt;seq, realm-&gt;parent_ino);</div><div class='add'>+		doutc(cl, " adding snap realm %llx seq %lld parent %llx\n",</div><div class='add'>+		      realm-&gt;ino, realm-&gt;seq, realm-&gt;parent_ino);</div><div class='ctx'> 		sr_rec.ino = cpu_to_le64(realm-&gt;ino);</div><div class='ctx'> 		sr_rec.seq = cpu_to_le64(realm-&gt;seq);</div><div class='ctx'> 		sr_rec.parent = cpu_to_le64(realm-&gt;parent_ino);</div><div class='hunk'>@@ -4013,6 +4875,7 @@ fail:</div><div class='ctx'> static void send_mds_reconnect(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			       struct ceph_mds_session *session)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_msg *reply;</div><div class='ctx'> 	int mds = session-&gt;s_mds;</div><div class='ctx'> 	int err = -ENOMEM;</div><div class='hunk'>@@ -4021,7 +4884,7 @@ static void send_mds_reconnect(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	};</div><div class='ctx'> 	LIST_HEAD(dispose);</div><div class='ctx'> </div><div class='del'>-	pr_info("mds%d reconnect start\n", mds);</div><div class='add'>+	pr_info_client(cl, "mds%d reconnect start\n", mds);</div><div class='ctx'> </div><div class='ctx'> 	recon_state.pagelist = ceph_pagelist_alloc(GFP_NOFS);</div><div class='ctx'> 	if (!recon_state.pagelist)</div><div class='hunk'>@@ -4037,8 +4900,8 @@ static void send_mds_reconnect(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	session-&gt;s_state = CEPH_MDS_SESSION_RECONNECTING;</div><div class='ctx'> 	session-&gt;s_seq = 0;</div><div class='ctx'> </div><div class='del'>-	dout("session %p state %s\n", session,</div><div class='del'>-	     ceph_session_state_name(session-&gt;s_state));</div><div class='add'>+	doutc(cl, "session %p state %s\n", session,</div><div class='add'>+	      ceph_session_state_name(session-&gt;s_state));</div><div class='ctx'> </div><div class='ctx'> 	atomic_inc(&amp;session-&gt;s_cap_gen);</div><div class='ctx'> </div><div class='hunk'>@@ -4085,7 +4948,7 @@ static void send_mds_reconnect(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	} else {</div><div class='ctx'> 		recon_state.msg_version = 2;</div><div class='ctx'> 	}</div><div class='del'>-	/* trsaverse this session's caps */</div><div class='add'>+	/* traverse this session's caps */</div><div class='ctx'> 	err = ceph_iterate_session_caps(session, reconnect_caps_cb, &amp;recon_state);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;session-&gt;s_cap_lock);</div><div class='hunk'>@@ -4172,7 +5035,8 @@ fail:</div><div class='ctx'> fail_nomsg:</div><div class='ctx'> 	ceph_pagelist_release(recon_state.pagelist);</div><div class='ctx'> fail_nopagelist:</div><div class='del'>-	pr_err("error %d preparing reconnect for mds%d\n", err, mds);</div><div class='add'>+	pr_err_client(cl, "error %d preparing reconnect for mds%d\n",</div><div class='add'>+		      err, mds);</div><div class='ctx'> 	return;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -4191,9 +5055,9 @@ static void check_new_map(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	int oldstate, newstate;</div><div class='ctx'> 	struct ceph_mds_session *s;</div><div class='ctx'> 	unsigned long targets[DIV_ROUND_UP(CEPH_MAX_MDS, sizeof(unsigned long))] = {0};</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> </div><div class='del'>-	dout("check_new_map new %u old %u\n",</div><div class='del'>-	     newmap-&gt;m_epoch, oldmap-&gt;m_epoch);</div><div class='add'>+	doutc(cl, "new %u old %u\n", newmap-&gt;m_epoch, oldmap-&gt;m_epoch);</div><div class='ctx'> </div><div class='ctx'> 	if (newmap-&gt;m_info) {</div><div class='ctx'> 		for (i = 0; i &lt; newmap-&gt;possible_max_rank; i++) {</div><div class='hunk'>@@ -4209,12 +5073,12 @@ static void check_new_map(struct ceph_mds_client *mdsc,</div><div class='ctx'> 		oldstate = ceph_mdsmap_get_state(oldmap, i);</div><div class='ctx'> 		newstate = ceph_mdsmap_get_state(newmap, i);</div><div class='ctx'> </div><div class='del'>-		dout("check_new_map mds%d state %s%s -&gt; %s%s (session %s)\n",</div><div class='del'>-		     i, ceph_mds_state_name(oldstate),</div><div class='del'>-		     ceph_mdsmap_is_laggy(oldmap, i) ? " (laggy)" : "",</div><div class='del'>-		     ceph_mds_state_name(newstate),</div><div class='del'>-		     ceph_mdsmap_is_laggy(newmap, i) ? " (laggy)" : "",</div><div class='del'>-		     ceph_session_state_name(s-&gt;s_state));</div><div class='add'>+		doutc(cl, "mds%d state %s%s -&gt; %s%s (session %s)\n",</div><div class='add'>+		      i, ceph_mds_state_name(oldstate),</div><div class='add'>+		      ceph_mdsmap_is_laggy(oldmap, i) ? " (laggy)" : "",</div><div class='add'>+		      ceph_mds_state_name(newstate),</div><div class='add'>+		      ceph_mdsmap_is_laggy(newmap, i) ? " (laggy)" : "",</div><div class='add'>+		      ceph_session_state_name(s-&gt;s_state));</div><div class='ctx'> </div><div class='ctx'> 		if (i &gt;= newmap-&gt;possible_max_rank) {</div><div class='ctx'> 			/* force close session for stopped mds */</div><div class='hunk'>@@ -4267,7 +5131,8 @@ static void check_new_map(struct ceph_mds_client *mdsc,</div><div class='ctx'> 		    newstate &gt;= CEPH_MDS_STATE_ACTIVE) {</div><div class='ctx'> 			if (oldstate != CEPH_MDS_STATE_CREATING &amp;&amp;</div><div class='ctx'> 			    oldstate != CEPH_MDS_STATE_STARTING)</div><div class='del'>-				pr_info("mds%d recovery completed\n", s-&gt;s_mds);</div><div class='add'>+				pr_info_client(cl, "mds%d recovery completed\n",</div><div class='add'>+					       s-&gt;s_mds);</div><div class='ctx'> 			kick_requests(mdsc, i);</div><div class='ctx'> 			mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> 			mutex_lock(&amp;s-&gt;s_mutex);</div><div class='hunk'>@@ -4311,12 +5176,13 @@ static void check_new_map(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			s = __open_export_target_session(mdsc, i);</div><div class='ctx'> 			if (IS_ERR(s)) {</div><div class='ctx'> 				err = PTR_ERR(s);</div><div class='del'>-				pr_err("failed to open export target session, err %d\n",</div><div class='del'>-				       err);</div><div class='add'>+				pr_err_client(cl,</div><div class='add'>+					      "failed to open export target session, err %d\n",</div><div class='add'>+					      err);</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		dout("send reconnect to export target mds.%d\n", i);</div><div class='add'>+		doutc(cl, "send reconnect to export target mds.%d\n", i);</div><div class='ctx'> 		mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> 		send_mds_reconnect(mdsc, s);</div><div class='ctx'> 		ceph_put_mds_session(s);</div><div class='hunk'>@@ -4332,8 +5198,7 @@ static void check_new_map(struct ceph_mds_client *mdsc,</div><div class='ctx'> 		if (s-&gt;s_state == CEPH_MDS_SESSION_OPEN ||</div><div class='ctx'> 		    s-&gt;s_state == CEPH_MDS_SESSION_HUNG ||</div><div class='ctx'> 		    s-&gt;s_state == CEPH_MDS_SESSION_CLOSING) {</div><div class='del'>-			dout(" connecting to export targets of laggy mds%d\n",</div><div class='del'>-			     i);</div><div class='add'>+			doutc(cl, " connecting to export targets of laggy mds%d\n", i);</div><div class='ctx'> 			__open_export_target_sessions(mdsc, s);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -4360,6 +5225,7 @@ static void handle_lease(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			 struct ceph_mds_session *session,</div><div class='ctx'> 			 struct ceph_msg *msg)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct super_block *sb = mdsc-&gt;fsc-&gt;sb;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct dentry *parent, *dentry;</div><div class='hunk'>@@ -4371,7 +5237,10 @@ static void handle_lease(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	struct qstr dname;</div><div class='ctx'> 	int release = 0;</div><div class='ctx'> </div><div class='del'>-	dout("handle_lease from mds%d\n", mds);</div><div class='add'>+	doutc(cl, "from mds%d\n", mds);</div><div class='add'>+</div><div class='add'>+	if (!ceph_inc_mds_stopping_blocker(mdsc, session))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='ctx'> 	/* decode */</div><div class='ctx'> 	if (msg-&gt;front.iov_len &lt; sizeof(*h) + sizeof(u32))</div><div class='hunk'>@@ -4386,22 +5255,19 @@ static void handle_lease(struct ceph_mds_client *mdsc,</div><div class='ctx'> </div><div class='ctx'> 	/* lookup inode */</div><div class='ctx'> 	inode = ceph_find_inode(sb, vino);</div><div class='del'>-	dout("handle_lease %s, ino %llx %p %.*s\n",</div><div class='del'>-	     ceph_lease_op_name(h-&gt;action), vino.ino, inode,</div><div class='del'>-	     dname.len, dname.name);</div><div class='add'>+	doutc(cl, "%s, ino %llx %p %.*s\n", ceph_lease_op_name(h-&gt;action),</div><div class='add'>+	      vino.ino, inode, dname.len, dname.name);</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;session-&gt;s_mutex);</div><div class='del'>-	inc_session_sequence(session);</div><div class='del'>-</div><div class='ctx'> 	if (!inode) {</div><div class='del'>-		dout("handle_lease no inode %llx\n", vino.ino);</div><div class='add'>+		doutc(cl, "no inode %llx\n", vino.ino);</div><div class='ctx'> 		goto release;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* dentry */</div><div class='ctx'> 	parent = d_find_alias(inode);</div><div class='ctx'> 	if (!parent) {</div><div class='del'>-		dout("no parent dentry on inode %p\n", inode);</div><div class='add'>+		doutc(cl, "no parent dentry on inode %p\n", inode);</div><div class='ctx'> 		WARN_ON(1);</div><div class='ctx'> 		goto release;  /* hrm... */</div><div class='ctx'> 	}</div><div class='hunk'>@@ -4454,10 +5320,14 @@ release:</div><div class='ctx'> out:</div><div class='ctx'> 	mutex_unlock(&amp;session-&gt;s_mutex);</div><div class='ctx'> 	iput(inode);</div><div class='add'>+</div><div class='add'>+	ceph_dec_mds_stopping_blocker(mdsc);</div><div class='ctx'> 	return;</div><div class='ctx'> </div><div class='ctx'> bad:</div><div class='del'>-	pr_err("corrupt lease message\n");</div><div class='add'>+	ceph_dec_mds_stopping_blocker(mdsc);</div><div class='add'>+</div><div class='add'>+	pr_err_client(cl, "corrupt lease message\n");</div><div class='ctx'> 	ceph_msg_dump(msg);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -4465,13 +5335,14 @@ void ceph_mdsc_lease_send_msg(struct ceph_mds_session *session,</div><div class='ctx'> 			      struct dentry *dentry, char action,</div><div class='ctx'> 			      u32 seq)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = session-&gt;s_mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_msg *msg;</div><div class='ctx'> 	struct ceph_mds_lease *lease;</div><div class='ctx'> 	struct inode *dir;</div><div class='ctx'> 	int len = sizeof(*lease) + sizeof(u32) + NAME_MAX;</div><div class='ctx'> </div><div class='del'>-	dout("lease_send_msg identry %p %s to mds%d\n",</div><div class='del'>-	     dentry, ceph_lease_op_name(action), session-&gt;s_mds);</div><div class='add'>+	doutc(cl, "identry %p %s to mds%d\n", dentry, ceph_lease_op_name(action),</div><div class='add'>+	      session-&gt;s_mds);</div><div class='ctx'> </div><div class='ctx'> 	msg = ceph_msg_new(CEPH_MSG_CLIENT_LEASE, len, GFP_NOFS, false);</div><div class='ctx'> 	if (!msg)</div><div class='hunk'>@@ -4489,12 +5360,6 @@ void ceph_mdsc_lease_send_msg(struct ceph_mds_session *session,</div><div class='ctx'> 	memcpy((void *)(lease + 1) + 4,</div><div class='ctx'> 	       dentry-&gt;d_name.name, dentry-&gt;d_name.len);</div><div class='ctx'> 	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='del'>-	/*</div><div class='del'>-	 * if this is a preemptive lease RELEASE, no need to</div><div class='del'>-	 * flush request stream, since the actual request will</div><div class='del'>-	 * soon follow.</div><div class='del'>-	 */</div><div class='del'>-	msg-&gt;more_to_follow = (action == CEPH_MDS_LEASE_RELEASE);</div><div class='ctx'> </div><div class='ctx'> 	ceph_con_send(&amp;session-&gt;s_con, msg);</div><div class='ctx'> }</div><div class='hunk'>@@ -4510,6 +5375,7 @@ static void lock_unlock_session(struct ceph_mds_session *s)</div><div class='ctx'> </div><div class='ctx'> static void maybe_recover_session(struct ceph_mds_client *mdsc)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_fs_client *fsc = mdsc-&gt;fsc;</div><div class='ctx'> </div><div class='ctx'> 	if (!ceph_test_mount_opt(fsc, CLEANRECOVER))</div><div class='hunk'>@@ -4521,26 +5387,22 @@ static void maybe_recover_session(struct ceph_mds_client *mdsc)</div><div class='ctx'> 	if (!READ_ONCE(fsc-&gt;blocklisted))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	pr_info("auto reconnect after blocklisted\n");</div><div class='add'>+	pr_info_client(cl, "auto reconnect after blocklisted\n");</div><div class='ctx'> 	ceph_force_reconnect(fsc-&gt;sb);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> bool check_session_state(struct ceph_mds_session *s)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_fs_client *fsc = s-&gt;s_mdsc-&gt;fsc;</div><div class='add'>+	struct ceph_client *cl = s-&gt;s_mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> </div><div class='ctx'> 	switch (s-&gt;s_state) {</div><div class='ctx'> 	case CEPH_MDS_SESSION_OPEN:</div><div class='ctx'> 		if (s-&gt;s_ttl &amp;&amp; time_after(jiffies, s-&gt;s_ttl)) {</div><div class='ctx'> 			s-&gt;s_state = CEPH_MDS_SESSION_HUNG;</div><div class='del'>-			pr_info("mds%d hung\n", s-&gt;s_mds);</div><div class='add'>+			pr_info_client(cl, "mds%d hung\n", s-&gt;s_mds);</div><div class='ctx'> 		}</div><div class='ctx'> 		break;</div><div class='ctx'> 	case CEPH_MDS_SESSION_CLOSING:</div><div class='del'>-		/* Should never reach this when not force unmounting */</div><div class='del'>-		WARN_ON_ONCE(s-&gt;s_ttl &amp;&amp;</div><div class='del'>-			     READ_ONCE(fsc-&gt;mount_state) != CEPH_MOUNT_SHUTDOWN);</div><div class='del'>-		fallthrough;</div><div class='ctx'> 	case CEPH_MDS_SESSION_NEW:</div><div class='ctx'> 	case CEPH_MDS_SESSION_RESTARTING:</div><div class='ctx'> 	case CEPH_MDS_SESSION_CLOSED:</div><div class='hunk'>@@ -4557,6 +5419,8 @@ bool check_session_state(struct ceph_mds_session *s)</div><div class='ctx'>  */</div><div class='ctx'> void inc_session_sequence(struct ceph_mds_session *s)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = s-&gt;s_mdsc-&gt;fsc-&gt;client;</div><div class='add'>+</div><div class='ctx'> 	lockdep_assert_held(&amp;s-&gt;s_mutex);</div><div class='ctx'> </div><div class='ctx'> 	s-&gt;s_seq++;</div><div class='hunk'>@@ -4564,11 +5428,11 @@ void inc_session_sequence(struct ceph_mds_session *s)</div><div class='ctx'> 	if (s-&gt;s_state == CEPH_MDS_SESSION_CLOSING) {</div><div class='ctx'> 		int ret;</div><div class='ctx'> </div><div class='del'>-		dout("resending session close request for mds%d\n", s-&gt;s_mds);</div><div class='add'>+		doutc(cl, "resending session close request for mds%d\n", s-&gt;s_mds);</div><div class='ctx'> 		ret = request_close_session(s);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			pr_err("unable to close session to mds%d: %d\n",</div><div class='del'>-			       s-&gt;s_mds, ret);</div><div class='add'>+			pr_err_client(cl, "unable to close session to mds%d: %d\n",</div><div class='add'>+				      s-&gt;s_mds, ret);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -4597,9 +5461,9 @@ static void delayed_work(struct work_struct *work)</div><div class='ctx'> 	int renew_caps;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	dout("mdsc delayed_work\n");</div><div class='add'>+	doutc(mdsc-&gt;fsc-&gt;client, "mdsc delayed_work\n");</div><div class='ctx'> </div><div class='del'>-	if (mdsc-&gt;stopping)</div><div class='add'>+	if (mdsc-&gt;stopping &gt;= CEPH_MDSC_STOPPING_FLUSHED)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;mdsc-&gt;mutex);</div><div class='hunk'>@@ -4620,6 +5484,8 @@ static void delayed_work(struct work_struct *work)</div><div class='ctx'> 		}</div><div class='ctx'> 		mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> </div><div class='add'>+		ceph_flush_session_cap_releases(mdsc, s);</div><div class='add'>+</div><div class='ctx'> 		mutex_lock(&amp;s-&gt;s_mutex);</div><div class='ctx'> 		if (renew_caps)</div><div class='ctx'> 			send_renew_caps(mdsc, s);</div><div class='hunk'>@@ -4664,6 +5530,11 @@ int ceph_mdsc_init(struct ceph_fs_client *fsc)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	init_completion(&amp;mdsc-&gt;safe_umount_waiters);</div><div class='add'>+	spin_lock_init(&amp;mdsc-&gt;stopping_lock);</div><div class='add'>+	atomic_set(&amp;mdsc-&gt;stopping_blockers, 0);</div><div class='add'>+	init_completion(&amp;mdsc-&gt;stopping_waiter);</div><div class='add'>+	atomic64_set(&amp;mdsc-&gt;dirty_folios, 0);</div><div class='add'>+	init_waitqueue_head(&amp;mdsc-&gt;flush_end_wq);</div><div class='ctx'> 	init_waitqueue_head(&amp;mdsc-&gt;session_close_wq);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;mdsc-&gt;waiting_for_map);</div><div class='ctx'> 	mdsc-&gt;quotarealms_inodes = RB_ROOT;</div><div class='hunk'>@@ -4676,8 +5547,11 @@ int ceph_mdsc_init(struct ceph_fs_client *fsc)</div><div class='ctx'> 	INIT_DELAYED_WORK(&amp;mdsc-&gt;delayed_work, delayed_work);</div><div class='ctx'> 	mdsc-&gt;last_renew_caps = jiffies;</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;mdsc-&gt;cap_delay_list);</div><div class='add'>+#ifdef CONFIG_DEBUG_FS</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;mdsc-&gt;cap_wait_list);</div><div class='add'>+#endif</div><div class='ctx'> 	spin_lock_init(&amp;mdsc-&gt;cap_delay_lock);</div><div class='add'>+	INIT_LIST_HEAD(&amp;mdsc-&gt;cap_unlink_delay_list);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;mdsc-&gt;snap_flush_list);</div><div class='ctx'> 	spin_lock_init(&amp;mdsc-&gt;snap_flush_lock);</div><div class='ctx'> 	mdsc-&gt;last_cap_flush_tid = 1;</div><div class='hunk'>@@ -4686,6 +5560,7 @@ int ceph_mdsc_init(struct ceph_fs_client *fsc)</div><div class='ctx'> 	spin_lock_init(&amp;mdsc-&gt;cap_dirty_lock);</div><div class='ctx'> 	init_waitqueue_head(&amp;mdsc-&gt;cap_flushing_wq);</div><div class='ctx'> 	INIT_WORK(&amp;mdsc-&gt;cap_reclaim_work, ceph_cap_reclaim_work);</div><div class='add'>+	INIT_WORK(&amp;mdsc-&gt;cap_unlink_work, ceph_cap_unlink_work);</div><div class='ctx'> 	err = ceph_metric_init(&amp;mdsc-&gt;metric);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto err_mdsmap;</div><div class='hunk'>@@ -4723,6 +5598,7 @@ err_mdsc:</div><div class='ctx'>  */</div><div class='ctx'> static void wait_requests(struct ceph_mds_client *mdsc)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_options *opts = mdsc-&gt;fsc-&gt;client-&gt;options;</div><div class='ctx'> 	struct ceph_mds_request *req;</div><div class='ctx'> </div><div class='hunk'>@@ -4730,25 +5606,25 @@ static void wait_requests(struct ceph_mds_client *mdsc)</div><div class='ctx'> 	if (__get_oldest_req(mdsc)) {</div><div class='ctx'> 		mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> </div><div class='del'>-		dout("wait_requests waiting for requests\n");</div><div class='add'>+		doutc(cl, "waiting for requests\n");</div><div class='ctx'> 		wait_for_completion_timeout(&amp;mdsc-&gt;safe_umount_waiters,</div><div class='ctx'> 				    ceph_timeout_jiffies(opts-&gt;mount_timeout));</div><div class='ctx'> </div><div class='ctx'> 		/* tear down remaining requests */</div><div class='ctx'> 		mutex_lock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> 		while ((req = __get_oldest_req(mdsc))) {</div><div class='del'>-			dout("wait_requests timed out on tid %llu\n",</div><div class='del'>-			     req-&gt;r_tid);</div><div class='add'>+			doutc(cl, "timed out on tid %llu\n", req-&gt;r_tid);</div><div class='ctx'> 			list_del_init(&amp;req-&gt;r_wait);</div><div class='ctx'> 			__unregister_request(mdsc, req);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='del'>-	dout("wait_requests done\n");</div><div class='add'>+	doutc(cl, "done\n");</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void send_flush_mdlog(struct ceph_mds_session *s)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = s-&gt;s_mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_msg *msg;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -4758,27 +5634,202 @@ void send_flush_mdlog(struct ceph_mds_session *s)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;s-&gt;s_mutex);</div><div class='del'>-	dout("request mdlog flush to mds%d (%s)s seq %lld\n", s-&gt;s_mds,</div><div class='del'>-	     ceph_session_state_name(s-&gt;s_state), s-&gt;s_seq);</div><div class='add'>+	doutc(cl, "request mdlog flush to mds%d (%s)s seq %lld\n",</div><div class='add'>+	      s-&gt;s_mds, ceph_session_state_name(s-&gt;s_state), s-&gt;s_seq);</div><div class='ctx'> 	msg = ceph_create_session_msg(CEPH_SESSION_REQUEST_FLUSH_MDLOG,</div><div class='ctx'> 				      s-&gt;s_seq);</div><div class='ctx'> 	if (!msg) {</div><div class='del'>-		pr_err("failed to request mdlog flush to mds%d (%s) seq %lld\n",</div><div class='del'>-		       s-&gt;s_mds, ceph_session_state_name(s-&gt;s_state), s-&gt;s_seq);</div><div class='add'>+		pr_err_client(cl, "failed to request mdlog flush to mds%d (%s) seq %lld\n",</div><div class='add'>+			      s-&gt;s_mds, ceph_session_state_name(s-&gt;s_state), s-&gt;s_seq);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		ceph_con_send(&amp;s-&gt;s_con, msg);</div><div class='ctx'> 	}</div><div class='ctx'> 	mutex_unlock(&amp;s-&gt;s_mutex);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int ceph_mds_auth_match(struct ceph_mds_client *mdsc,</div><div class='add'>+			       struct ceph_mds_cap_auth *auth,</div><div class='add'>+			       const struct cred *cred,</div><div class='add'>+			       char *tpath)</div><div class='add'>+{</div><div class='add'>+	u32 caller_uid = from_kuid(&amp;init_user_ns, cred-&gt;fsuid);</div><div class='add'>+	u32 caller_gid = from_kgid(&amp;init_user_ns, cred-&gt;fsgid);</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='add'>+	const char *fs_name = mdsc-&gt;fsc-&gt;mount_options-&gt;mds_namespace;</div><div class='add'>+	const char *spath = mdsc-&gt;fsc-&gt;mount_options-&gt;server_path;</div><div class='add'>+	bool gid_matched = false;</div><div class='add'>+	u32 gid, tlen, len;</div><div class='add'>+	int i, j;</div><div class='add'>+</div><div class='add'>+	doutc(cl, "fsname check fs_name=%s  match.fs_name=%s\n",</div><div class='add'>+	      fs_name, auth-&gt;match.fs_name ? auth-&gt;match.fs_name : "");</div><div class='add'>+	if (auth-&gt;match.fs_name &amp;&amp; strcmp(auth-&gt;match.fs_name, fs_name)) {</div><div class='add'>+		/* fsname mismatch, try next one */</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	doutc(cl, "match.uid %lld\n", auth-&gt;match.uid);</div><div class='add'>+	if (auth-&gt;match.uid != MDS_AUTH_UID_ANY) {</div><div class='add'>+		if (auth-&gt;match.uid != caller_uid)</div><div class='add'>+			return 0;</div><div class='add'>+		if (auth-&gt;match.num_gids) {</div><div class='add'>+			for (i = 0; i &lt; auth-&gt;match.num_gids; i++) {</div><div class='add'>+				if (caller_gid == auth-&gt;match.gids[i])</div><div class='add'>+					gid_matched = true;</div><div class='add'>+			}</div><div class='add'>+			if (!gid_matched &amp;&amp; cred-&gt;group_info-&gt;ngroups) {</div><div class='add'>+				for (i = 0; i &lt; cred-&gt;group_info-&gt;ngroups; i++) {</div><div class='add'>+					gid = from_kgid(&amp;init_user_ns,</div><div class='add'>+							cred-&gt;group_info-&gt;gid[i]);</div><div class='add'>+					for (j = 0; j &lt; auth-&gt;match.num_gids; j++) {</div><div class='add'>+						if (gid == auth-&gt;match.gids[j]) {</div><div class='add'>+							gid_matched = true;</div><div class='add'>+							break;</div><div class='add'>+						}</div><div class='add'>+					}</div><div class='add'>+					if (gid_matched)</div><div class='add'>+						break;</div><div class='add'>+				}</div><div class='add'>+			}</div><div class='add'>+			if (!gid_matched)</div><div class='add'>+				return 0;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* path match */</div><div class='add'>+	if (auth-&gt;match.path) {</div><div class='add'>+		if (!tpath)</div><div class='add'>+			return 0;</div><div class='add'>+</div><div class='add'>+		tlen = strlen(tpath);</div><div class='add'>+		len = strlen(auth-&gt;match.path);</div><div class='add'>+		if (len) {</div><div class='add'>+			char *_tpath = tpath;</div><div class='add'>+			bool free_tpath = false;</div><div class='add'>+			int m, n;</div><div class='add'>+</div><div class='add'>+			doutc(cl, "server path %s, tpath %s, match.path %s\n",</div><div class='add'>+			      spath, tpath, auth-&gt;match.path);</div><div class='add'>+			if (spath &amp;&amp; (m = strlen(spath)) != 1) {</div><div class='add'>+				/* mount path + '/' + tpath + an extra space */</div><div class='add'>+				n = m + 1 + tlen + 1;</div><div class='add'>+				_tpath = kmalloc(n, GFP_NOFS);</div><div class='add'>+				if (!_tpath)</div><div class='add'>+					return -ENOMEM;</div><div class='add'>+				/* remove the leading '/' */</div><div class='add'>+				snprintf(_tpath, n, "%s/%s", spath + 1, tpath);</div><div class='add'>+				free_tpath = true;</div><div class='add'>+				tlen = strlen(_tpath);</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * Please note the tailing '/' for match.path has already</div><div class='add'>+			 * been removed when parsing.</div><div class='add'>+			 *</div><div class='add'>+			 * Remove the tailing '/' for the target path.</div><div class='add'>+			 */</div><div class='add'>+			while (tlen &amp;&amp; _tpath[tlen - 1] == '/') {</div><div class='add'>+				_tpath[tlen - 1] = '\0';</div><div class='add'>+				tlen -= 1;</div><div class='add'>+			}</div><div class='add'>+			doutc(cl, "_tpath %s\n", _tpath);</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * In case first == _tpath &amp;&amp; tlen == len:</div><div class='add'>+			 *  match.path=/foo  --&gt; /foo _path=/foo     --&gt; match</div><div class='add'>+			 *  match.path=/foo/ --&gt; /foo _path=/foo     --&gt; match</div><div class='add'>+			 *</div><div class='add'>+			 * In case first == _tmatch.path &amp;&amp; tlen &gt; len:</div><div class='add'>+			 *  match.path=/foo/ --&gt; /foo _path=/foo/    --&gt; match</div><div class='add'>+			 *  match.path=/foo  --&gt; /foo _path=/foo/    --&gt; match</div><div class='add'>+			 *  match.path=/foo/ --&gt; /foo _path=/foo/d   --&gt; match</div><div class='add'>+			 *  match.path=/foo  --&gt; /foo _path=/food    --&gt; mismatch</div><div class='add'>+			 *</div><div class='add'>+			 * All the other cases                       --&gt; mismatch</div><div class='add'>+			 */</div><div class='add'>+			bool path_matched = true;</div><div class='add'>+			char *first = strstr(_tpath, auth-&gt;match.path);</div><div class='add'>+			if (first != _tpath ||</div><div class='add'>+			    (tlen &gt; len &amp;&amp; _tpath[len] != '/')) {</div><div class='add'>+				path_matched = false;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			if (free_tpath)</div><div class='add'>+				kfree(_tpath);</div><div class='add'>+</div><div class='add'>+			if (!path_matched)</div><div class='add'>+				return 0;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	doutc(cl, "matched\n");</div><div class='add'>+	return 1;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int ceph_mds_check_access(struct ceph_mds_client *mdsc, char *tpath, int mask)</div><div class='add'>+{</div><div class='add'>+	const struct cred *cred = get_current_cred();</div><div class='add'>+	u32 caller_uid = from_kuid(&amp;init_user_ns, cred-&gt;fsuid);</div><div class='add'>+	u32 caller_gid = from_kgid(&amp;init_user_ns, cred-&gt;fsgid);</div><div class='add'>+	struct ceph_mds_cap_auth *rw_perms_s = NULL;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='add'>+	bool root_squash_perms = true;</div><div class='add'>+	int i, err;</div><div class='add'>+</div><div class='add'>+	doutc(cl, "tpath '%s', mask %d, caller_uid %d, caller_gid %d\n",</div><div class='add'>+	      tpath, mask, caller_uid, caller_gid);</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; mdsc-&gt;s_cap_auths_num; i++) {</div><div class='add'>+		struct ceph_mds_cap_auth *s = &amp;mdsc-&gt;s_cap_auths[i];</div><div class='add'>+</div><div class='add'>+		err = ceph_mds_auth_match(mdsc, s, cred, tpath);</div><div class='add'>+		if (err &lt; 0) {</div><div class='add'>+			put_cred(cred);</div><div class='add'>+			return err;</div><div class='add'>+		} else if (err &gt; 0) {</div><div class='add'>+			/* always follow the last auth caps' permission */</div><div class='add'>+			root_squash_perms = true;</div><div class='add'>+			rw_perms_s = NULL;</div><div class='add'>+			if ((mask &amp; MAY_WRITE) &amp;&amp; s-&gt;writeable &amp;&amp;</div><div class='add'>+			    s-&gt;match.root_squash &amp;&amp; (!caller_uid || !caller_gid))</div><div class='add'>+				root_squash_perms = false;</div><div class='add'>+</div><div class='add'>+			if (((mask &amp; MAY_WRITE) &amp;&amp; !s-&gt;writeable) ||</div><div class='add'>+			    ((mask &amp; MAY_READ) &amp;&amp; !s-&gt;readable))</div><div class='add'>+				rw_perms_s = s;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	put_cred(cred);</div><div class='add'>+</div><div class='add'>+	doutc(cl, "root_squash_perms %d, rw_perms_s %p\n", root_squash_perms,</div><div class='add'>+	      rw_perms_s);</div><div class='add'>+	if (root_squash_perms &amp;&amp; rw_perms_s == NULL) {</div><div class='add'>+		doutc(cl, "access allowed\n");</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!root_squash_perms) {</div><div class='add'>+		doutc(cl, "root_squash is enabled and user(%d %d) isn't allowed to write",</div><div class='add'>+		      caller_uid, caller_gid);</div><div class='add'>+	}</div><div class='add'>+	if (rw_perms_s) {</div><div class='add'>+		doutc(cl, "mds auth caps readable/writeable %d/%d while request r/w %d/%d",</div><div class='add'>+		      rw_perms_s-&gt;readable, rw_perms_s-&gt;writeable,</div><div class='add'>+		      !!(mask &amp; MAY_READ), !!(mask &amp; MAY_WRITE));</div><div class='add'>+	}</div><div class='add'>+	doutc(cl, "access denied\n");</div><div class='add'>+	return -EACCES;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * called before mount is ro, and before dentries are torn down.</div><div class='ctx'>  * (hmm, does this still race with new lookups?)</div><div class='ctx'>  */</div><div class='ctx'> void ceph_mdsc_pre_umount(struct ceph_mds_client *mdsc)</div><div class='ctx'> {</div><div class='del'>-	dout("pre_umount\n");</div><div class='del'>-	mdsc-&gt;stopping = 1;</div><div class='add'>+	doutc(mdsc-&gt;fsc-&gt;client, "begin\n");</div><div class='add'>+	mdsc-&gt;stopping = CEPH_MDSC_STOPPING_BEGIN;</div><div class='ctx'> </div><div class='ctx'> 	ceph_mdsc_iterate_sessions(mdsc, send_flush_mdlog, true);</div><div class='ctx'> 	ceph_mdsc_iterate_sessions(mdsc, lock_unlock_session, false);</div><div class='hunk'>@@ -4792,18 +5843,22 @@ void ceph_mdsc_pre_umount(struct ceph_mds_client *mdsc)</div><div class='ctx'> 	ceph_msgr_flush();</div><div class='ctx'> </div><div class='ctx'> 	ceph_cleanup_quotarealms_inodes(mdsc);</div><div class='add'>+	doutc(mdsc-&gt;fsc-&gt;client, "done\n");</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * wait for all write mds requests to flush.</div><div class='add'>+ * flush the mdlog and wait for all write mds requests to flush.</div><div class='ctx'>  */</div><div class='del'>-static void wait_unsafe_requests(struct ceph_mds_client *mdsc, u64 want_tid)</div><div class='add'>+static void flush_mdlog_and_wait_mdsc_unsafe_requests(struct ceph_mds_client *mdsc,</div><div class='add'>+						 u64 want_tid)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_mds_request *req = NULL, *nextreq;</div><div class='add'>+	struct ceph_mds_session *last_session = NULL;</div><div class='ctx'> 	struct rb_node *n;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;mdsc-&gt;mutex);</div><div class='del'>-	dout("wait_unsafe_requests want %lld\n", want_tid);</div><div class='add'>+	doutc(cl, "want %lld\n", want_tid);</div><div class='ctx'> restart:</div><div class='ctx'> 	req = __get_oldest_req(mdsc);</div><div class='ctx'> 	while (req &amp;&amp; req-&gt;r_tid &lt;= want_tid) {</div><div class='hunk'>@@ -4815,14 +5870,32 @@ restart:</div><div class='ctx'> 			nextreq = NULL;</div><div class='ctx'> 		if (req-&gt;r_op != CEPH_MDS_OP_SETFILELOCK &amp;&amp;</div><div class='ctx'> 		    (req-&gt;r_op &amp; CEPH_MDS_OP_WRITE)) {</div><div class='add'>+			struct ceph_mds_session *s = req-&gt;r_session;</div><div class='add'>+</div><div class='add'>+			if (!s) {</div><div class='add'>+				req = nextreq;</div><div class='add'>+				continue;</div><div class='add'>+			}</div><div class='add'>+</div><div class='ctx'> 			/* write op */</div><div class='ctx'> 			ceph_mdsc_get_request(req);</div><div class='ctx'> 			if (nextreq)</div><div class='ctx'> 				ceph_mdsc_get_request(nextreq);</div><div class='add'>+			s = ceph_get_mds_session(s);</div><div class='ctx'> 			mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='del'>-			dout("wait_unsafe_requests  wait on %llu (want %llu)\n",</div><div class='del'>-			     req-&gt;r_tid, want_tid);</div><div class='add'>+</div><div class='add'>+			/* send flush mdlog request to MDS */</div><div class='add'>+			if (last_session != s) {</div><div class='add'>+				send_flush_mdlog(s);</div><div class='add'>+				ceph_put_mds_session(last_session);</div><div class='add'>+				last_session = s;</div><div class='add'>+			} else {</div><div class='add'>+				ceph_put_mds_session(s);</div><div class='add'>+			}</div><div class='add'>+			doutc(cl, "wait on %llu (want %llu)\n",</div><div class='add'>+			      req-&gt;r_tid, want_tid);</div><div class='ctx'> 			wait_for_completion(&amp;req-&gt;r_safe_completion);</div><div class='add'>+</div><div class='ctx'> 			mutex_lock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> 			ceph_mdsc_put_request(req);</div><div class='ctx'> 			if (!nextreq)</div><div class='hunk'>@@ -4837,22 +5910,25 @@ restart:</div><div class='ctx'> 		req = nextreq;</div><div class='ctx'> 	}</div><div class='ctx'> 	mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='del'>-	dout("wait_unsafe_requests done\n");</div><div class='add'>+	ceph_put_mds_session(last_session);</div><div class='add'>+	doutc(cl, "done\n");</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void ceph_mdsc_sync(struct ceph_mds_client *mdsc)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	u64 want_tid, want_flush;</div><div class='ctx'> </div><div class='ctx'> 	if (READ_ONCE(mdsc-&gt;fsc-&gt;mount_state) &gt;= CEPH_MOUNT_SHUTDOWN)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	dout("sync\n");</div><div class='add'>+	doutc(cl, "sync\n");</div><div class='ctx'> 	mutex_lock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> 	want_tid = mdsc-&gt;last_tid;</div><div class='ctx'> 	mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> </div><div class='ctx'> 	ceph_flush_dirty_caps(mdsc);</div><div class='add'>+	ceph_flush_cap_releases(mdsc);</div><div class='ctx'> 	spin_lock(&amp;mdsc-&gt;cap_dirty_lock);</div><div class='ctx'> 	want_flush = mdsc-&gt;last_cap_flush_tid;</div><div class='ctx'> 	if (!list_empty(&amp;mdsc-&gt;cap_flush_list)) {</div><div class='hunk'>@@ -4863,10 +5939,9 @@ void ceph_mdsc_sync(struct ceph_mds_client *mdsc)</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;mdsc-&gt;cap_dirty_lock);</div><div class='ctx'> </div><div class='del'>-	dout("sync want tid %lld flush_seq %lld\n",</div><div class='del'>-	     want_tid, want_flush);</div><div class='add'>+	doutc(cl, "sync want tid %lld flush_seq %lld\n", want_tid, want_flush);</div><div class='ctx'> </div><div class='del'>-	wait_unsafe_requests(mdsc, want_tid);</div><div class='add'>+	flush_mdlog_and_wait_mdsc_unsafe_requests(mdsc, want_tid);</div><div class='ctx'> 	wait_caps_flush(mdsc, want_flush);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -4881,16 +5956,17 @@ static bool done_closing_sessions(struct ceph_mds_client *mdsc, int skipped)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * called after sb is ro.</div><div class='add'>+ * called after sb is ro or when metadata corrupted.</div><div class='ctx'>  */</div><div class='ctx'> void ceph_mdsc_close_sessions(struct ceph_mds_client *mdsc)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_options *opts = mdsc-&gt;fsc-&gt;client-&gt;options;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_mds_session *session;</div><div class='ctx'> 	int i;</div><div class='ctx'> 	int skipped = 0;</div><div class='ctx'> </div><div class='del'>-	dout("close_sessions\n");</div><div class='add'>+	doutc(cl, "begin\n");</div><div class='ctx'> </div><div class='ctx'> 	/* close sessions */</div><div class='ctx'> 	mutex_lock(&amp;mdsc-&gt;mutex);</div><div class='hunk'>@@ -4908,7 +5984,7 @@ void ceph_mdsc_close_sessions(struct ceph_mds_client *mdsc)</div><div class='ctx'> 	}</div><div class='ctx'> 	mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> </div><div class='del'>-	dout("waiting for sessions to close\n");</div><div class='add'>+	doutc(cl, "waiting for sessions to close\n");</div><div class='ctx'> 	wait_event_timeout(mdsc-&gt;session_close_wq,</div><div class='ctx'> 			   done_closing_sessions(mdsc, skipped),</div><div class='ctx'> 			   ceph_timeout_jiffies(opts-&gt;mount_timeout));</div><div class='hunk'>@@ -4931,12 +6007,13 @@ void ceph_mdsc_close_sessions(struct ceph_mds_client *mdsc)</div><div class='ctx'> 	mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> </div><div class='ctx'> 	ceph_cleanup_snapid_map(mdsc);</div><div class='del'>-	ceph_cleanup_empty_realms(mdsc);</div><div class='add'>+	ceph_cleanup_global_and_empty_realms(mdsc);</div><div class='ctx'> </div><div class='ctx'> 	cancel_work_sync(&amp;mdsc-&gt;cap_reclaim_work);</div><div class='add'>+	cancel_work_sync(&amp;mdsc-&gt;cap_unlink_work);</div><div class='ctx'> 	cancel_delayed_work_sync(&amp;mdsc-&gt;delayed_work); /* cancel timer */</div><div class='ctx'> </div><div class='del'>-	dout("stopped\n");</div><div class='add'>+	doutc(cl, "done\n");</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void ceph_mdsc_force_umount(struct ceph_mds_client *mdsc)</div><div class='hunk'>@@ -4944,7 +6021,7 @@ void ceph_mdsc_force_umount(struct ceph_mds_client *mdsc)</div><div class='ctx'> 	struct ceph_mds_session *session;</div><div class='ctx'> 	int mds;</div><div class='ctx'> </div><div class='del'>-	dout("force umount\n");</div><div class='add'>+	doutc(mdsc-&gt;fsc-&gt;client, "force umount\n");</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> 	for (mds = 0; mds &lt; mdsc-&gt;max_sessions; mds++) {</div><div class='hunk'>@@ -4975,7 +6052,7 @@ void ceph_mdsc_force_umount(struct ceph_mds_client *mdsc)</div><div class='ctx'> </div><div class='ctx'> static void ceph_mdsc_stop(struct ceph_mds_client *mdsc)</div><div class='ctx'> {</div><div class='del'>-	dout("stop\n");</div><div class='add'>+	doutc(mdsc-&gt;fsc-&gt;client, "stop\n");</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Make sure the delayed work stopped before releasing</div><div class='ctx'> 	 * the resources.</div><div class='hunk'>@@ -4990,13 +6067,25 @@ static void ceph_mdsc_stop(struct ceph_mds_client *mdsc)</div><div class='ctx'> 		ceph_mdsmap_destroy(mdsc-&gt;mdsmap);</div><div class='ctx'> 	kfree(mdsc-&gt;sessions);</div><div class='ctx'> 	ceph_caps_finalize(mdsc);</div><div class='add'>+</div><div class='add'>+	if (mdsc-&gt;s_cap_auths) {</div><div class='add'>+		int i;</div><div class='add'>+</div><div class='add'>+		for (i = 0; i &lt; mdsc-&gt;s_cap_auths_num; i++) {</div><div class='add'>+			kfree(mdsc-&gt;s_cap_auths[i].match.gids);</div><div class='add'>+			kfree(mdsc-&gt;s_cap_auths[i].match.path);</div><div class='add'>+			kfree(mdsc-&gt;s_cap_auths[i].match.fs_name);</div><div class='add'>+		}</div><div class='add'>+		kfree(mdsc-&gt;s_cap_auths);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	ceph_pool_perm_destroy(mdsc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void ceph_mdsc_destroy(struct ceph_fs_client *fsc)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_mds_client *mdsc = fsc-&gt;mdsc;</div><div class='del'>-	dout("mdsc_destroy %p\n", mdsc);</div><div class='add'>+	doutc(fsc-&gt;client, "%p\n", mdsc);</div><div class='ctx'> </div><div class='ctx'> 	if (!mdsc)</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -5010,12 +6099,13 @@ void ceph_mdsc_destroy(struct ceph_fs_client *fsc)</div><div class='ctx'> </div><div class='ctx'> 	fsc-&gt;mdsc = NULL;</div><div class='ctx'> 	kfree(mdsc);</div><div class='del'>-	dout("mdsc_destroy %p done\n", mdsc);</div><div class='add'>+	doutc(fsc-&gt;client, "%p done\n", mdsc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void ceph_mdsc_handle_fsmap(struct ceph_mds_client *mdsc, struct ceph_msg *msg)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_fs_client *fsc = mdsc-&gt;fsc;</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='ctx'> 	const char *mds_namespace = fsc-&gt;mount_options-&gt;mds_namespace;</div><div class='ctx'> 	void *p = msg-&gt;front.iov_base;</div><div class='ctx'> 	void *end = p + msg-&gt;front.iov_len;</div><div class='hunk'>@@ -5027,7 +6117,7 @@ void ceph_mdsc_handle_fsmap(struct ceph_mds_client *mdsc, struct ceph_msg *msg)</div><div class='ctx'> 	ceph_decode_need(&amp;p, end, sizeof(u32), bad);</div><div class='ctx'> 	epoch = ceph_decode_32(&amp;p);</div><div class='ctx'> </div><div class='del'>-	dout("handle_fsmap epoch %u\n", epoch);</div><div class='add'>+	doutc(cl, "epoch %u\n", epoch);</div><div class='ctx'> </div><div class='ctx'> 	/* struct_v, struct_cv, map_len, epoch, legacy_client_fscid */</div><div class='ctx'> 	ceph_decode_skip_n(&amp;p, end, 2 + sizeof(u32) * 3, bad);</div><div class='hunk'>@@ -5072,7 +6162,10 @@ void ceph_mdsc_handle_fsmap(struct ceph_mds_client *mdsc, struct ceph_msg *msg)</div><div class='ctx'> 	return;</div><div class='ctx'> </div><div class='ctx'> bad:</div><div class='del'>-	pr_err("error decoding fsmap\n");</div><div class='add'>+	pr_err_client(cl, "error decoding fsmap %d. Shutting down mount.\n",</div><div class='add'>+		      err);</div><div class='add'>+	ceph_umount_begin(mdsc-&gt;fsc-&gt;sb);</div><div class='add'>+	ceph_msg_dump(msg);</div><div class='ctx'> err_out:</div><div class='ctx'> 	mutex_lock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> 	mdsc-&gt;mdsmap_err = err;</div><div class='hunk'>@@ -5085,6 +6178,7 @@ err_out:</div><div class='ctx'>  */</div><div class='ctx'> void ceph_mdsc_handle_mdsmap(struct ceph_mds_client *mdsc, struct ceph_msg *msg)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	u32 epoch;</div><div class='ctx'> 	u32 maplen;</div><div class='ctx'> 	void *p = msg-&gt;front.iov_base;</div><div class='hunk'>@@ -5099,18 +6193,17 @@ void ceph_mdsc_handle_mdsmap(struct ceph_mds_client *mdsc, struct ceph_msg *msg)</div><div class='ctx'> 		return;</div><div class='ctx'> 	epoch = ceph_decode_32(&amp;p);</div><div class='ctx'> 	maplen = ceph_decode_32(&amp;p);</div><div class='del'>-	dout("handle_map epoch %u len %d\n", epoch, (int)maplen);</div><div class='add'>+	doutc(cl, "epoch %u len %d\n", epoch, (int)maplen);</div><div class='ctx'> </div><div class='ctx'> 	/* do we need it? */</div><div class='ctx'> 	mutex_lock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> 	if (mdsc-&gt;mdsmap &amp;&amp; epoch &lt;= mdsc-&gt;mdsmap-&gt;m_epoch) {</div><div class='del'>-		dout("handle_map epoch %u &lt;= our %u\n",</div><div class='del'>-		     epoch, mdsc-&gt;mdsmap-&gt;m_epoch);</div><div class='add'>+		doutc(cl, "epoch %u &lt;= our %u\n", epoch, mdsc-&gt;mdsmap-&gt;m_epoch);</div><div class='ctx'> 		mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	newmap = ceph_mdsmap_decode(&amp;p, end, ceph_msgr2(mdsc-&gt;fsc-&gt;client));</div><div class='add'>+	newmap = ceph_mdsmap_decode(mdsc, &amp;p, end, ceph_msgr2(mdsc-&gt;fsc-&gt;client));</div><div class='ctx'> 	if (IS_ERR(newmap)) {</div><div class='ctx'> 		err = PTR_ERR(newmap);</div><div class='ctx'> 		goto bad_unlock;</div><div class='hunk'>@@ -5139,7 +6232,10 @@ void ceph_mdsc_handle_mdsmap(struct ceph_mds_client *mdsc, struct ceph_msg *msg)</div><div class='ctx'> bad_unlock:</div><div class='ctx'> 	mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='ctx'> bad:</div><div class='del'>-	pr_err("error decoding mdsmap %d\n", err);</div><div class='add'>+	pr_err_client(cl, "error decoding mdsmap %d. Shutting down mount.\n",</div><div class='add'>+		      err);</div><div class='add'>+	ceph_umount_begin(mdsc-&gt;fsc-&gt;sb);</div><div class='add'>+	ceph_msg_dump(msg);</div><div class='ctx'> 	return;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5168,14 +6264,18 @@ static void mds_peer_reset(struct ceph_connection *con)</div><div class='ctx'> 	struct ceph_mds_session *s = con-&gt;private;</div><div class='ctx'> 	struct ceph_mds_client *mdsc = s-&gt;s_mdsc;</div><div class='ctx'> </div><div class='del'>-	pr_warn("mds%d closed our session\n", s-&gt;s_mds);</div><div class='del'>-	send_mds_reconnect(mdsc, s);</div><div class='add'>+	pr_warn_client(mdsc-&gt;fsc-&gt;client, "mds%d closed our session\n",</div><div class='add'>+		       s-&gt;s_mds);</div><div class='add'>+	if (READ_ONCE(mdsc-&gt;fsc-&gt;mount_state) != CEPH_MOUNT_FENCE_IO &amp;&amp;</div><div class='add'>+	    ceph_mdsmap_get_state(mdsc-&gt;mdsmap, s-&gt;s_mds) &gt;= CEPH_MDS_STATE_RECONNECT)</div><div class='add'>+		send_mds_reconnect(mdsc, s);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void mds_dispatch(struct ceph_connection *con, struct ceph_msg *msg)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_mds_session *s = con-&gt;private;</div><div class='ctx'> 	struct ceph_mds_client *mdsc = s-&gt;s_mdsc;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	int type = le16_to_cpu(msg-&gt;hdr.type);</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;mdsc-&gt;mutex);</div><div class='hunk'>@@ -5215,8 +6315,8 @@ static void mds_dispatch(struct ceph_connection *con, struct ceph_msg *msg)</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	default:</div><div class='del'>-		pr_err("received unknown message type %d %s\n", type,</div><div class='del'>-		       ceph_msg_type_name(type));</div><div class='add'>+		pr_err_client(cl, "received unknown message type %d %s\n",</div><div class='add'>+			      type, ceph_msg_type_name(type));</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='ctx'> 	ceph_msg_put(msg);</div><div class='head'>diff --git a/fs/ceph/mds_client.h b/fs/ceph/mds_client.h<br/>index 97c7f7bfa55f..0428a5eaf28c 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ceph/mds_client.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/mds_client.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/mds_client.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/mds_client.h</a></div><div class='hunk'>@@ -14,9 +14,9 @@</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/ceph/types.h&gt;</div><div class='ctx'> #include &lt;linux/ceph/messenger.h&gt;</div><div class='del'>-#include &lt;linux/ceph/mdsmap.h&gt;</div><div class='ctx'> #include &lt;linux/ceph/auth.h&gt;</div><div class='ctx'> </div><div class='add'>+#include "mdsmap.h"</div><div class='ctx'> #include "metric.h"</div><div class='ctx'> #include "super.h"</div><div class='ctx'> </div><div class='hunk'>@@ -29,14 +29,17 @@ enum ceph_feature_type {</div><div class='ctx'> 	CEPHFS_FEATURE_MULTI_RECONNECT,</div><div class='ctx'> 	CEPHFS_FEATURE_DELEG_INO,</div><div class='ctx'> 	CEPHFS_FEATURE_METRIC_COLLECT,</div><div class='del'>-</div><div class='del'>-	CEPHFS_FEATURE_MAX = CEPHFS_FEATURE_METRIC_COLLECT,</div><div class='add'>+	CEPHFS_FEATURE_ALTERNATE_NAME,</div><div class='add'>+	CEPHFS_FEATURE_NOTIFY_SESSION_STATE,</div><div class='add'>+	CEPHFS_FEATURE_OP_GETVXATTR,</div><div class='add'>+	CEPHFS_FEATURE_32BITS_RETRY_FWD,</div><div class='add'>+	CEPHFS_FEATURE_NEW_SNAPREALM_INFO,</div><div class='add'>+	CEPHFS_FEATURE_HAS_OWNER_UIDGID,</div><div class='add'>+	CEPHFS_FEATURE_MDS_AUTH_CAPS_CHECK,</div><div class='add'>+</div><div class='add'>+	CEPHFS_FEATURE_MAX = CEPHFS_FEATURE_MDS_AUTH_CAPS_CHECK,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * This will always have the highest feature bit value</div><div class='del'>- * as the last element of the array.</div><div class='del'>- */</div><div class='ctx'> #define CEPHFS_FEATURES_CLIENT_SUPPORTED {	\</div><div class='ctx'> 	0, 1, 2, 3, 4, 5, 6, 7,			\</div><div class='ctx'> 	CEPHFS_FEATURE_MIMIC,			\</div><div class='hunk'>@@ -45,10 +48,13 @@ enum ceph_feature_type {</div><div class='ctx'> 	CEPHFS_FEATURE_MULTI_RECONNECT,		\</div><div class='ctx'> 	CEPHFS_FEATURE_DELEG_INO,		\</div><div class='ctx'> 	CEPHFS_FEATURE_METRIC_COLLECT,		\</div><div class='del'>-						\</div><div class='del'>-	CEPHFS_FEATURE_MAX,			\</div><div class='add'>+	CEPHFS_FEATURE_ALTERNATE_NAME,		\</div><div class='add'>+	CEPHFS_FEATURE_NOTIFY_SESSION_STATE,	\</div><div class='add'>+	CEPHFS_FEATURE_OP_GETVXATTR,		\</div><div class='add'>+	CEPHFS_FEATURE_32BITS_RETRY_FWD,	\</div><div class='add'>+	CEPHFS_FEATURE_HAS_OWNER_UIDGID,	\</div><div class='add'>+	CEPHFS_FEATURE_MDS_AUTH_CAPS_CHECK,	\</div><div class='ctx'> }</div><div class='del'>-#define CEPHFS_FEATURES_CLIENT_REQUIRED {}</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Some lock dependencies:</div><div class='hunk'>@@ -67,6 +73,24 @@ enum ceph_feature_type {</div><div class='ctx'> struct ceph_fs_client;</div><div class='ctx'> struct ceph_cap;</div><div class='ctx'> </div><div class='add'>+#define MDS_AUTH_UID_ANY -1</div><div class='add'>+</div><div class='add'>+struct ceph_mds_cap_match {</div><div class='add'>+	s64 uid;  /* default to MDS_AUTH_UID_ANY */</div><div class='add'>+	u32 num_gids;</div><div class='add'>+	u32 *gids;  /* use these GIDs */</div><div class='add'>+	char *path;  /* require path to be child of this</div><div class='add'>+			(may be "" or "/" for any) */</div><div class='add'>+	char *fs_name;</div><div class='add'>+	bool root_squash;  /* default to false */</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct ceph_mds_cap_auth {</div><div class='add'>+	struct ceph_mds_cap_match match;</div><div class='add'>+	bool readable;</div><div class='add'>+	bool writeable;</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * parsed info about a single inode.  pointers are into the encoded</div><div class='ctx'>  * on-wire structures within the mds reply message payload.</div><div class='hunk'>@@ -88,18 +112,29 @@ struct ceph_mds_reply_info_in {</div><div class='ctx'> 	s32 dir_pin;</div><div class='ctx'> 	struct ceph_timespec btime;</div><div class='ctx'> 	struct ceph_timespec snap_btime;</div><div class='add'>+	u8 *fscrypt_auth;</div><div class='add'>+	u8 *fscrypt_file;</div><div class='add'>+	u32 fscrypt_auth_len;</div><div class='add'>+	u32 fscrypt_file_len;</div><div class='ctx'> 	u64 rsnaps;</div><div class='ctx'> 	u64 change_attr;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct ceph_mds_reply_dir_entry {</div><div class='add'>+	bool			      is_nokey;</div><div class='ctx'> 	char                          *name;</div><div class='ctx'> 	u32                           name_len;</div><div class='add'>+	u32			      raw_hash;</div><div class='ctx'> 	struct ceph_mds_reply_lease   *lease;</div><div class='ctx'> 	struct ceph_mds_reply_info_in inode;</div><div class='ctx'> 	loff_t			      offset;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+struct ceph_mds_reply_xattr {</div><div class='add'>+	char *xattr_value;</div><div class='add'>+	size_t xattr_value_len;</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * parsed info about an mds reply, including information about</div><div class='ctx'>  * either: 1) the target inode and/or its parent directory and dentry,</div><div class='hunk'>@@ -113,8 +148,11 @@ struct ceph_mds_reply_info_parsed {</div><div class='ctx'> 	struct ceph_mds_reply_info_in diri, targeti;</div><div class='ctx'> 	struct ceph_mds_reply_dirfrag *dirfrag;</div><div class='ctx'> 	char                          *dname;</div><div class='add'>+	u8			      *altname;</div><div class='ctx'> 	u32                           dname_len;</div><div class='add'>+	u32                           altname_len;</div><div class='ctx'> 	struct ceph_mds_reply_lease   *dlease;</div><div class='add'>+	struct ceph_mds_reply_xattr   xattr_info;</div><div class='ctx'> </div><div class='ctx'> 	/* extra */</div><div class='ctx'> 	union {</div><div class='hunk'>@@ -259,6 +297,9 @@ struct ceph_mds_request {</div><div class='ctx'> </div><div class='ctx'> 	struct inode *r_parent;		    /* parent dir inode */</div><div class='ctx'> 	struct inode *r_target_inode;       /* resulting inode */</div><div class='add'>+	struct inode *r_new_inode;	    /* new inode (for creates) */</div><div class='add'>+</div><div class='add'>+	const struct qstr *r_dname;	    /* stable name (for -&gt;d_revalidate) */</div><div class='ctx'> </div><div class='ctx'> #define CEPH_MDS_R_DIRECT_IS_HASH	(1) /* r_direct_hash is valid */</div><div class='ctx'> #define CEPH_MDS_R_ABORTED		(2) /* call was aborted */</div><div class='hunk'>@@ -268,14 +309,23 @@ struct ceph_mds_request {</div><div class='ctx'> #define CEPH_MDS_R_DID_PREPOPULATE	(6) /* prepopulated readdir */</div><div class='ctx'> #define CEPH_MDS_R_PARENT_LOCKED	(7) /* is r_parent-&gt;i_rwsem wlocked? */</div><div class='ctx'> #define CEPH_MDS_R_ASYNC		(8) /* async request */</div><div class='add'>+#define CEPH_MDS_R_FSCRYPT_FILE		(9) /* must marshal fscrypt_file field */</div><div class='ctx'> 	unsigned long	r_req_flags;</div><div class='ctx'> </div><div class='ctx'> 	struct mutex r_fill_mutex;</div><div class='ctx'> </div><div class='ctx'> 	union ceph_mds_request_args r_args;</div><div class='add'>+</div><div class='add'>+	struct ceph_fscrypt_auth *r_fscrypt_auth;</div><div class='add'>+	u64	r_fscrypt_file;</div><div class='add'>+</div><div class='add'>+	u8 *r_altname;		    /* fscrypt binary crypttext for long filenames */</div><div class='add'>+	u32 r_altname_len;	    /* length of r_altname */</div><div class='add'>+</div><div class='ctx'> 	int r_fmode;        /* file mode, if expecting cap */</div><div class='del'>-	const struct cred *r_cred;</div><div class='ctx'> 	int r_request_release_offset;</div><div class='add'>+	const struct cred *r_cred;</div><div class='add'>+	struct mnt_idmap *r_mnt_idmap;</div><div class='ctx'> 	struct timespec64 r_stamp;</div><div class='ctx'> </div><div class='ctx'> 	/* for choosing which mds to send this request to */</div><div class='hunk'>@@ -296,12 +346,11 @@ struct ceph_mds_request {</div><div class='ctx'> 	struct ceph_msg  *r_reply;</div><div class='ctx'> 	struct ceph_mds_reply_info_parsed r_reply_info;</div><div class='ctx'> 	int r_err;</div><div class='del'>-</div><div class='add'>+	u32               r_readdir_offset;</div><div class='ctx'> </div><div class='ctx'> 	struct page *r_locked_page;</div><div class='ctx'> 	int r_dir_caps;</div><div class='ctx'> 	int r_num_caps;</div><div class='del'>-	u32               r_readdir_offset;</div><div class='ctx'> </div><div class='ctx'> 	unsigned long r_timeout;  /* optional.  jiffies, 0 is "wait forever" */</div><div class='ctx'> 	unsigned long r_started;  /* start time to measure timeout against */</div><div class='hunk'>@@ -329,13 +378,14 @@ struct ceph_mds_request {</div><div class='ctx'> 	struct completion r_completion;</div><div class='ctx'> 	struct completion r_safe_completion;</div><div class='ctx'> 	ceph_mds_request_callback_t r_callback;</div><div class='del'>-	ceph_mds_request_wait_callback_t r_wait_for_completion;</div><div class='ctx'> 	struct list_head  r_unsafe_item;  /* per-session unsafe list item */</div><div class='ctx'> </div><div class='ctx'> 	long long	  r_dir_release_cnt;</div><div class='ctx'> 	long long	  r_dir_ordered_cnt;</div><div class='ctx'> 	int		  r_readdir_cache_idx;</div><div class='ctx'> </div><div class='add'>+	int		  r_feature_needed;</div><div class='add'>+</div><div class='ctx'> 	struct ceph_cap_reservation r_caps_reservation;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -351,8 +401,8 @@ struct ceph_snapid_map {</div><div class='ctx'> 	struct rb_node node;</div><div class='ctx'> 	struct list_head lru;</div><div class='ctx'> 	atomic_t ref;</div><div class='del'>-	u64 snap;</div><div class='ctx'> 	dev_t dev;</div><div class='add'>+	u64 snap;</div><div class='ctx'> 	unsigned long last_used;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -368,6 +418,8 @@ struct ceph_quotarealm_inode {</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_DEBUG_FS</div><div class='add'>+</div><div class='ctx'> struct cap_wait {</div><div class='ctx'> 	struct list_head	list;</div><div class='ctx'> 	u64			ino;</div><div class='hunk'>@@ -376,6 +428,14 @@ struct cap_wait {</div><div class='ctx'> 	int			want;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+enum {</div><div class='add'>+	CEPH_MDSC_STOPPING_BEGIN = 1,</div><div class='add'>+	CEPH_MDSC_STOPPING_FLUSHING = 2,</div><div class='add'>+	CEPH_MDSC_STOPPING_FLUSHED = 3,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * mds client state</div><div class='ctx'>  */</div><div class='hunk'>@@ -392,7 +452,14 @@ struct ceph_mds_client {</div><div class='ctx'> 	struct ceph_mds_session **sessions;    /* NULL for mds if no session */</div><div class='ctx'> 	atomic_t		num_sessions;</div><div class='ctx'> 	int                     max_sessions;  /* len of sessions array */</div><div class='del'>-	int                     stopping;      /* true if shutting down */</div><div class='add'>+</div><div class='add'>+	spinlock_t              stopping_lock;  /* protect snap_empty */</div><div class='add'>+	int                     stopping;      /* the stage of shutting down */</div><div class='add'>+	atomic_t                stopping_blockers;</div><div class='add'>+	struct completion	stopping_waiter;</div><div class='add'>+</div><div class='add'>+	atomic64_t		dirty_folios;</div><div class='add'>+	wait_queue_head_t	flush_end_wq;</div><div class='ctx'> </div><div class='ctx'> 	atomic64_t		quotarealms_count; /* # realms with quota */</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -423,7 +490,8 @@ struct ceph_mds_client {</div><div class='ctx'> 	struct delayed_work    delayed_work;  /* delayed work */</div><div class='ctx'> 	unsigned long    last_renew_caps;  /* last time we renewed our caps */</div><div class='ctx'> 	struct list_head cap_delay_list;   /* caps with delayed release */</div><div class='del'>-	spinlock_t       cap_delay_lock;   /* protects cap_delay_list */</div><div class='add'>+	struct list_head cap_unlink_delay_list;  /* caps with delayed release for unlink */</div><div class='add'>+	spinlock_t       cap_delay_lock;   /* protects cap_delay_list and cap_unlink_delay_list */</div><div class='ctx'> 	struct list_head snap_flush_list;  /* cap_snaps ready to flush */</div><div class='ctx'> 	spinlock_t       snap_flush_lock;</div><div class='ctx'> </div><div class='hunk'>@@ -437,6 +505,8 @@ struct ceph_mds_client {</div><div class='ctx'> 	struct work_struct cap_reclaim_work;</div><div class='ctx'> 	atomic_t	   cap_reclaim_pending;</div><div class='ctx'> </div><div class='add'>+	struct work_struct cap_unlink_work;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Cap reservations</div><div class='ctx'> 	 *</div><div class='hunk'>@@ -451,7 +521,9 @@ struct ceph_mds_client {</div><div class='ctx'> 	spinlock_t	caps_list_lock;</div><div class='ctx'> 	struct		list_head caps_list; /* unused (reserved or</div><div class='ctx'> 						unreserved) */</div><div class='add'>+#ifdef CONFIG_DEBUG_FS</div><div class='ctx'> 	struct		list_head cap_wait_list;</div><div class='add'>+#endif</div><div class='ctx'> 	int		caps_total_count;    /* total caps allocated */</div><div class='ctx'> 	int		caps_use_count;      /* in use */</div><div class='ctx'> 	int		caps_use_max;	     /* max used caps */</div><div class='hunk'>@@ -472,6 +544,9 @@ struct ceph_mds_client {</div><div class='ctx'> 	struct rw_semaphore     pool_perm_rwsem;</div><div class='ctx'> 	struct rb_root		pool_perm_tree;</div><div class='ctx'> </div><div class='add'>+	u32			 s_cap_auths_num;</div><div class='add'>+	struct ceph_mds_cap_auth *s_cap_auths;</div><div class='add'>+</div><div class='ctx'> 	char nodename[__NEW_UTS_LEN + 1];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -489,9 +564,6 @@ extern struct ceph_mds_session *</div><div class='ctx'> ceph_get_mds_session(struct ceph_mds_session *s);</div><div class='ctx'> extern void ceph_put_mds_session(struct ceph_mds_session *s);</div><div class='ctx'> </div><div class='del'>-extern int ceph_send_msg_mds(struct ceph_mds_client *mdsc,</div><div class='del'>-			     struct ceph_msg *msg, int mds);</div><div class='del'>-</div><div class='ctx'> extern int ceph_mdsc_init(struct ceph_fs_client *fsc);</div><div class='ctx'> extern void ceph_mdsc_close_sessions(struct ceph_mds_client *mdsc);</div><div class='ctx'> extern void ceph_mdsc_force_umount(struct ceph_mds_client *mdsc);</div><div class='hunk'>@@ -507,11 +579,14 @@ ceph_mdsc_create_request(struct ceph_mds_client *mdsc, int op, int mode);</div><div class='ctx'> extern int ceph_mdsc_submit_request(struct ceph_mds_client *mdsc,</div><div class='ctx'> 				    struct inode *dir,</div><div class='ctx'> 				    struct ceph_mds_request *req);</div><div class='add'>+int ceph_mdsc_wait_request(struct ceph_mds_client *mdsc,</div><div class='add'>+			struct ceph_mds_request *req,</div><div class='add'>+			ceph_mds_request_wait_callback_t wait_func);</div><div class='ctx'> extern int ceph_mdsc_do_request(struct ceph_mds_client *mdsc,</div><div class='ctx'> 				struct inode *dir,</div><div class='ctx'> 				struct ceph_mds_request *req);</div><div class='ctx'> extern void ceph_mdsc_release_dir_caps(struct ceph_mds_request *req);</div><div class='del'>-extern void ceph_mdsc_release_dir_caps_no_check(struct ceph_mds_request *req);</div><div class='add'>+extern void ceph_mdsc_release_dir_caps_async(struct ceph_mds_request *req);</div><div class='ctx'> static inline void ceph_mdsc_get_request(struct ceph_mds_request *req)</div><div class='ctx'> {</div><div class='ctx'> 	kref_get(&amp;req-&gt;r_kref);</div><div class='hunk'>@@ -529,24 +604,38 @@ extern void ceph_mdsc_iterate_sessions(struct ceph_mds_client *mdsc,</div><div class='ctx'> extern struct ceph_msg *ceph_create_session_msg(u32 op, u64 seq);</div><div class='ctx'> extern void __ceph_queue_cap_release(struct ceph_mds_session *session,</div><div class='ctx'> 				    struct ceph_cap *cap);</div><div class='del'>-extern void ceph_flush_cap_releases(struct ceph_mds_client *mdsc,</div><div class='del'>-				    struct ceph_mds_session *session);</div><div class='add'>+extern void ceph_flush_session_cap_releases(struct ceph_mds_client *mdsc,</div><div class='add'>+					    struct ceph_mds_session *session);</div><div class='ctx'> extern void ceph_queue_cap_reclaim_work(struct ceph_mds_client *mdsc);</div><div class='ctx'> extern void ceph_reclaim_caps_nr(struct ceph_mds_client *mdsc, int nr);</div><div class='add'>+extern void ceph_queue_cap_unlink_work(struct ceph_mds_client *mdsc);</div><div class='ctx'> extern int ceph_iterate_session_caps(struct ceph_mds_session *session,</div><div class='del'>-				     int (*cb)(struct inode *,</div><div class='del'>-					       struct ceph_cap *, void *),</div><div class='add'>+				     int (*cb)(struct inode *, int mds, void *),</div><div class='ctx'> 				     void *arg);</div><div class='add'>+extern int ceph_mds_check_access(struct ceph_mds_client *mdsc, char *tpath,</div><div class='add'>+				 int mask);</div><div class='add'>+</div><div class='ctx'> extern void ceph_mdsc_pre_umount(struct ceph_mds_client *mdsc);</div><div class='ctx'> </div><div class='del'>-static inline void ceph_mdsc_free_path(char *path, int len)</div><div class='add'>+/*</div><div class='add'>+ * Structure to group path-related output parameters for build_*_path functions</div><div class='add'>+ */</div><div class='add'>+struct ceph_path_info {</div><div class='add'>+	const char *path;</div><div class='add'>+	int pathlen;</div><div class='add'>+	struct ceph_vino vino;</div><div class='add'>+	bool freepath;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static inline void ceph_mdsc_free_path_info(const struct ceph_path_info *path_info)</div><div class='ctx'> {</div><div class='del'>-	if (!IS_ERR_OR_NULL(path))</div><div class='del'>-		__putname(path - (PATH_MAX - 1 - len));</div><div class='add'>+	if (path_info &amp;&amp; path_info-&gt;freepath &amp;&amp; !IS_ERR_OR_NULL(path_info-&gt;path))</div><div class='add'>+		__putname((char *)path_info-&gt;path - (PATH_MAX - 1 - path_info-&gt;pathlen));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-extern char *ceph_mdsc_build_path(struct dentry *dentry, int *plen, u64 *base,</div><div class='del'>-				  int stop_on_nosnap);</div><div class='add'>+extern char *ceph_mdsc_build_path(struct ceph_mds_client *mdsc,</div><div class='add'>+				  struct dentry *dentry, struct ceph_path_info *path_info,</div><div class='add'>+				  int for_wire);</div><div class='ctx'> </div><div class='ctx'> extern void __ceph_mdsc_drop_dentry_lease(struct dentry *dentry);</div><div class='ctx'> extern void ceph_mdsc_lease_send_msg(struct ceph_mds_session *session,</div><div class='hunk'>@@ -560,8 +649,6 @@ extern void ceph_mdsc_handle_fsmap(struct ceph_mds_client *mdsc,</div><div class='ctx'> </div><div class='ctx'> extern struct ceph_mds_session *</div><div class='ctx'> ceph_mdsc_open_export_target_session(struct ceph_mds_client *mdsc, int target);</div><div class='del'>-extern void ceph_mdsc_open_export_target_sessions(struct ceph_mds_client *mdsc,</div><div class='del'>-					  struct ceph_mds_session *session);</div><div class='ctx'> </div><div class='ctx'> extern int ceph_trim_caps(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			  struct ceph_mds_session *session,</div><div class='hunk'>@@ -572,9 +659,12 @@ static inline int ceph_wait_on_async_create(struct inode *inode)</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> </div><div class='ctx'> 	return wait_on_bit(&amp;ci-&gt;i_ceph_flags, CEPH_ASYNC_CREATE_BIT,</div><div class='del'>-			   TASK_INTERRUPTIBLE);</div><div class='add'>+			   TASK_KILLABLE);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+extern int ceph_wait_on_conflict_unlink(struct dentry *dentry);</div><div class='ctx'> extern u64 ceph_get_deleg_ino(struct ceph_mds_session *session);</div><div class='ctx'> extern int ceph_restore_deleg_ino(struct ceph_mds_session *session, u64 ino);</div><div class='add'>+</div><div class='add'>+extern bool enable_unsafe_idmap;</div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/ceph/mdsmap.c b/fs/ceph/mdsmap.c<br/>index 61d67cbcb367..2c7b151a7c95 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ceph/mdsmap.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/mdsmap.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/mdsmap.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/mdsmap.c</a></div><div class='hunk'>@@ -7,10 +7,11 @@</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/types.h&gt;</div><div class='ctx'> </div><div class='del'>-#include &lt;linux/ceph/mdsmap.h&gt;</div><div class='ctx'> #include &lt;linux/ceph/messenger.h&gt;</div><div class='ctx'> #include &lt;linux/ceph/decode.h&gt;</div><div class='ctx'> </div><div class='add'>+#include "mdsmap.h"</div><div class='add'>+#include "mds_client.h"</div><div class='ctx'> #include "super.h"</div><div class='ctx'> </div><div class='ctx'> #define CEPH_MDS_IS_READY(i, ignore_laggy) \</div><div class='hunk'>@@ -29,7 +30,7 @@ static int __mdsmap_get_random_mds(struct ceph_mdsmap *m, bool ignore_laggy)</div><div class='ctx'> 		return -1;</div><div class='ctx'> </div><div class='ctx'> 	/* pick */</div><div class='del'>-	n = prandom_u32() % n;</div><div class='add'>+	n = get_random_u32_below(n);</div><div class='ctx'> 	for (j = 0, i = 0; i &lt; m-&gt;possible_max_rank; i++) {</div><div class='ctx'> 		if (CEPH_MDS_IS_READY(i, ignore_laggy))</div><div class='ctx'> 			j++;</div><div class='hunk'>@@ -114,8 +115,10 @@ bad:</div><div class='ctx'>  * Ignore any fields we don't care about (there are quite a few of</div><div class='ctx'>  * them).</div><div class='ctx'>  */</div><div class='del'>-struct ceph_mdsmap *ceph_mdsmap_decode(void **p, void *end, bool msgr2)</div><div class='add'>+struct ceph_mdsmap *ceph_mdsmap_decode(struct ceph_mds_client *mdsc, void **p,</div><div class='add'>+				       void *end, bool msgr2)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_mdsmap *m;</div><div class='ctx'> 	const void *start = *p;</div><div class='ctx'> 	int i, j, n;</div><div class='hunk'>@@ -233,20 +236,18 @@ struct ceph_mdsmap *ceph_mdsmap_decode(void **p, void *end, bool msgr2)</div><div class='ctx'> 			*p = info_end;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		dout("mdsmap_decode %d/%d %lld mds%d.%d %s %s%s\n",</div><div class='del'>-		     i+1, n, global_id, mds, inc,</div><div class='del'>-		     ceph_pr_addr(&amp;addr),</div><div class='del'>-		     ceph_mds_state_name(state),</div><div class='del'>-		     laggy ? "(laggy)" : "");</div><div class='add'>+		doutc(cl, "%d/%d %lld mds%d.%d %s %s%s\n", i+1, n, global_id,</div><div class='add'>+		      mds, inc, ceph_pr_addr(&amp;addr),</div><div class='add'>+		      ceph_mds_state_name(state), laggy ? "(laggy)" : "");</div><div class='ctx'> </div><div class='ctx'> 		if (mds &lt; 0 || mds &gt;= m-&gt;possible_max_rank) {</div><div class='del'>-			pr_warn("mdsmap_decode got incorrect mds(%d)\n", mds);</div><div class='add'>+			pr_warn_client(cl, "got incorrect mds(%d)\n", mds);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (state &lt;= 0) {</div><div class='del'>-			dout("mdsmap_decode got incorrect state(%s)\n",</div><div class='del'>-			     ceph_mds_state_name(state));</div><div class='add'>+			doutc(cl, "got incorrect state(%s)\n",</div><div class='add'>+			      ceph_mds_state_name(state));</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -263,10 +264,6 @@ struct ceph_mdsmap *ceph_mdsmap_decode(void **p, void *end, bool msgr2)</div><div class='ctx'> 				goto nomem;</div><div class='ctx'> 			for (j = 0; j &lt; num_export_targets; j++) {</div><div class='ctx'> 				target = ceph_decode_32(&amp;pexport_targets);</div><div class='del'>-				if (target &gt;= m-&gt;possible_max_rank) {</div><div class='del'>-					err = -EIO;</div><div class='del'>-					goto corrupt;</div><div class='del'>-				}</div><div class='ctx'> 				info-&gt;export_targets[j] = target;</div><div class='ctx'> 			}</div><div class='ctx'> 		} else {</div><div class='hunk'>@@ -356,12 +353,22 @@ struct ceph_mdsmap *ceph_mdsmap_decode(void **p, void *end, bool msgr2)</div><div class='ctx'> 		__decode_and_drop_type(p, end, u8, bad_ext);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (mdsmap_ev &gt;= 8) {</div><div class='del'>-		u32 name_len;</div><div class='add'>+		u32 fsname_len;</div><div class='ctx'> 		/* enabled */</div><div class='ctx'> 		ceph_decode_8_safe(p, end, m-&gt;m_enabled, bad_ext);</div><div class='del'>-		ceph_decode_32_safe(p, end, name_len, bad_ext);</div><div class='del'>-		ceph_decode_need(p, end, name_len, bad_ext);</div><div class='del'>-		*p += name_len;</div><div class='add'>+		/* fs_name */</div><div class='add'>+		ceph_decode_32_safe(p, end, fsname_len, bad_ext);</div><div class='add'>+</div><div class='add'>+		/* validate fsname against mds_namespace */</div><div class='add'>+		if (!namespace_equals(mdsc-&gt;fsc-&gt;mount_options, *p,</div><div class='add'>+				      fsname_len)) {</div><div class='add'>+			pr_warn_client(cl, "fsname %*pE doesn't match mds_namespace %s\n",</div><div class='add'>+				       (int)fsname_len, (char *)*p,</div><div class='add'>+				       mdsc-&gt;fsc-&gt;mount_options-&gt;mds_namespace);</div><div class='add'>+			goto bad;</div><div class='add'>+		}</div><div class='add'>+		/* skip fsname after validation */</div><div class='add'>+		ceph_decode_skip_n(p, end, fsname_len, bad);</div><div class='ctx'> 	}</div><div class='ctx'> 	/* damaged */</div><div class='ctx'> 	if (mdsmap_ev &gt;= 9) {</div><div class='hunk'>@@ -374,17 +381,34 @@ struct ceph_mdsmap *ceph_mdsmap_decode(void **p, void *end, bool msgr2)</div><div class='ctx'> 	} else {</div><div class='ctx'> 		m-&gt;m_damaged = false;</div><div class='ctx'> 	}</div><div class='add'>+	if (mdsmap_ev &gt;= 17) {</div><div class='add'>+		/* balancer */</div><div class='add'>+		ceph_decode_skip_string(p, end, bad_ext);</div><div class='add'>+		/* standby_count_wanted */</div><div class='add'>+		ceph_decode_skip_32(p, end, bad_ext);</div><div class='add'>+		/* old_max_mds */</div><div class='add'>+		ceph_decode_skip_32(p, end, bad_ext);</div><div class='add'>+		/* min_compat_client */</div><div class='add'>+		ceph_decode_skip_8(p, end, bad_ext);</div><div class='add'>+		/* required_client_features */</div><div class='add'>+		ceph_decode_skip_set(p, end, 64, bad_ext);</div><div class='add'>+		/* bal_rank_mask */</div><div class='add'>+		ceph_decode_skip_string(p, end, bad_ext);</div><div class='add'>+	}</div><div class='add'>+	if (mdsmap_ev &gt;= 18) {</div><div class='add'>+		ceph_decode_64_safe(p, end, m-&gt;m_max_xattr_size, bad_ext);</div><div class='add'>+	}</div><div class='ctx'> bad_ext:</div><div class='del'>-	dout("mdsmap_decode m_enabled: %d, m_damaged: %d, m_num_laggy: %d\n",</div><div class='del'>-	     !!m-&gt;m_enabled, !!m-&gt;m_damaged, m-&gt;m_num_laggy);</div><div class='add'>+	doutc(cl, "m_enabled: %d, m_damaged: %d, m_num_laggy: %d\n",</div><div class='add'>+	      !!m-&gt;m_enabled, !!m-&gt;m_damaged, m-&gt;m_num_laggy);</div><div class='ctx'> 	*p = end;</div><div class='del'>-	dout("mdsmap_decode success epoch %u\n", m-&gt;m_epoch);</div><div class='add'>+	doutc(cl, "success epoch %u\n", m-&gt;m_epoch);</div><div class='ctx'> 	return m;</div><div class='ctx'> nomem:</div><div class='ctx'> 	err = -ENOMEM;</div><div class='ctx'> 	goto out_err;</div><div class='ctx'> corrupt:</div><div class='del'>-	pr_err("corrupt mdsmap\n");</div><div class='add'>+	pr_err_client(cl, "corrupt mdsmap\n");</div><div class='ctx'> 	print_hex_dump(KERN_DEBUG, "mdsmap: ",</div><div class='ctx'> 		       DUMP_PREFIX_OFFSET, 16, 1,</div><div class='ctx'> 		       start, end - start, true);</div><div class='head'>diff --git a/fs/ceph/mdsmap.h b/fs/ceph/mdsmap.h<br/>new file mode 100644<br/>index 000000000000..1f2171dd01bf<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/mdsmap.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/mdsmap.h</a></div><div class='hunk'>@@ -0,0 +1,79 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+#ifndef _FS_CEPH_MDSMAP_H</div><div class='add'>+#define _FS_CEPH_MDSMAP_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/bug.h&gt;</div><div class='add'>+#include &lt;linux/ceph/types.h&gt;</div><div class='add'>+</div><div class='add'>+struct ceph_mds_client;</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * mds map - describe servers in the mds cluster.</div><div class='add'>+ *</div><div class='add'>+ * we limit fields to those the client actually xcares about</div><div class='add'>+ */</div><div class='add'>+struct ceph_mds_info {</div><div class='add'>+	u64 global_id;</div><div class='add'>+	struct ceph_entity_addr addr;</div><div class='add'>+	s32 state;</div><div class='add'>+	int num_export_targets;</div><div class='add'>+	bool laggy;</div><div class='add'>+	u32 *export_targets;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct ceph_mdsmap {</div><div class='add'>+	u32 m_epoch, m_client_epoch, m_last_failure;</div><div class='add'>+	u32 m_root;</div><div class='add'>+	u32 m_session_timeout;          /* seconds */</div><div class='add'>+	u32 m_session_autoclose;        /* seconds */</div><div class='add'>+	u64 m_max_file_size;</div><div class='add'>+	/*</div><div class='add'>+	 * maximum size for xattrs blob.</div><div class='add'>+	 * Zeroed by default to force the usage of the (sync) SETXATTR Op.</div><div class='add'>+	 */</div><div class='add'>+	u64 m_max_xattr_size;</div><div class='add'>+	u32 m_max_mds;			/* expected up:active mds number */</div><div class='add'>+	u32 m_num_active_mds;		/* actual up:active mds number */</div><div class='add'>+	u32 possible_max_rank;		/* possible max rank index */</div><div class='add'>+	struct ceph_mds_info *m_info;</div><div class='add'>+</div><div class='add'>+	/* which object pools file data can be stored in */</div><div class='add'>+	int m_num_data_pg_pools;</div><div class='add'>+	u64 *m_data_pg_pools;</div><div class='add'>+	u64 m_cas_pg_pool;</div><div class='add'>+</div><div class='add'>+	bool m_enabled;</div><div class='add'>+	bool m_damaged;</div><div class='add'>+	int m_num_laggy;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static inline struct ceph_entity_addr *</div><div class='add'>+ceph_mdsmap_get_addr(struct ceph_mdsmap *m, int w)</div><div class='add'>+{</div><div class='add'>+	if (w &gt;= m-&gt;possible_max_rank)</div><div class='add'>+		return NULL;</div><div class='add'>+	return &amp;m-&gt;m_info[w].addr;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int ceph_mdsmap_get_state(struct ceph_mdsmap *m, int w)</div><div class='add'>+{</div><div class='add'>+	BUG_ON(w &lt; 0);</div><div class='add'>+	if (w &gt;= m-&gt;possible_max_rank)</div><div class='add'>+		return CEPH_MDS_STATE_DNE;</div><div class='add'>+	return m-&gt;m_info[w].state;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool ceph_mdsmap_is_laggy(struct ceph_mdsmap *m, int w)</div><div class='add'>+{</div><div class='add'>+	if (w &gt;= 0 &amp;&amp; w &lt; m-&gt;possible_max_rank)</div><div class='add'>+		return m-&gt;m_info[w].laggy;</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+extern int ceph_mdsmap_get_random_mds(struct ceph_mdsmap *m);</div><div class='add'>+struct ceph_mdsmap *ceph_mdsmap_decode(struct ceph_mds_client *mdsc, void **p,</div><div class='add'>+				       void *end, bool msgr2);</div><div class='add'>+extern void ceph_mdsmap_destroy(struct ceph_mdsmap *m);</div><div class='add'>+extern bool ceph_mdsmap_is_cluster_available(struct ceph_mdsmap *m);</div><div class='add'>+</div><div class='add'>+#endif</div><div class='head'>diff --git a/fs/ceph/metric.c b/fs/ceph/metric.c<br/>index 04d5df29bbbf..871c1090e520 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ceph/metric.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/metric.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/metric.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/metric.c</a></div><div class='hunk'>@@ -8,6 +8,12 @@</div><div class='ctx'> #include "metric.h"</div><div class='ctx'> #include "mds_client.h"</div><div class='ctx'> </div><div class='add'>+static void ktime_to_ceph_timespec(struct ceph_timespec *ts, ktime_t val)</div><div class='add'>+{</div><div class='add'>+	struct timespec64 t = ktime_to_timespec64(val);</div><div class='add'>+	ceph_encode_timespec64(ts, &amp;t);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static bool ceph_mdsc_send_metrics(struct ceph_mds_client *mdsc,</div><div class='ctx'> 				   struct ceph_mds_session *s)</div><div class='ctx'> {</div><div class='hunk'>@@ -25,12 +31,20 @@ static bool ceph_mdsc_send_metrics(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	struct ceph_client_metric *m = &amp;mdsc-&gt;metric;</div><div class='ctx'> 	u64 nr_caps = atomic64_read(&amp;m-&gt;total_caps);</div><div class='ctx'> 	u32 header_len = sizeof(struct ceph_metric_header);</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_msg *msg;</div><div class='del'>-	struct timespec64 ts;</div><div class='ctx'> 	s64 sum;</div><div class='ctx'> 	s32 items = 0;</div><div class='ctx'> 	s32 len;</div><div class='ctx'> </div><div class='add'>+	/* Do not send the metrics until the MDS rank is ready */</div><div class='add'>+	mutex_lock(&amp;mdsc-&gt;mutex);</div><div class='add'>+	if (ceph_mdsmap_get_state(mdsc-&gt;mdsmap, s-&gt;s_mds) != CEPH_MDS_STATE_ACTIVE) {</div><div class='add'>+		mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+	mutex_unlock(&amp;mdsc-&gt;mutex);</div><div class='add'>+</div><div class='ctx'> 	len = sizeof(*head) + sizeof(*cap) + sizeof(*read) + sizeof(*write)</div><div class='ctx'> 	      + sizeof(*meta) + sizeof(*dlease) + sizeof(*files)</div><div class='ctx'> 	      + sizeof(*icaps) + sizeof(*inodes) + sizeof(*rsize)</div><div class='hunk'>@@ -38,8 +52,8 @@ static bool ceph_mdsc_send_metrics(struct ceph_mds_client *mdsc,</div><div class='ctx'> </div><div class='ctx'> 	msg = ceph_msg_new(CEPH_MSG_CLIENT_METRICS, len, GFP_NOFS, true);</div><div class='ctx'> 	if (!msg) {</div><div class='del'>-		pr_err("send metrics to mds%d, failed to allocate message\n",</div><div class='del'>-		       s-&gt;s_mds);</div><div class='add'>+		pr_err_client(cl, "to mds%d, failed to allocate message\n",</div><div class='add'>+			      s-&gt;s_mds);</div><div class='ctx'> 		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -59,37 +73,40 @@ static bool ceph_mdsc_send_metrics(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	/* encode the read latency metric */</div><div class='ctx'> 	read = (struct ceph_metric_read_latency *)(cap + 1);</div><div class='ctx'> 	read-&gt;header.type = cpu_to_le32(CLIENT_METRIC_TYPE_READ_LATENCY);</div><div class='del'>-	read-&gt;header.ver = 1;</div><div class='add'>+	read-&gt;header.ver = 2;</div><div class='ctx'> 	read-&gt;header.compat = 1;</div><div class='ctx'> 	read-&gt;header.data_len = cpu_to_le32(sizeof(*read) - header_len);</div><div class='del'>-	sum = m-&gt;read_latency_sum;</div><div class='del'>-	jiffies_to_timespec64(sum, &amp;ts);</div><div class='del'>-	read-&gt;sec = cpu_to_le32(ts.tv_sec);</div><div class='del'>-	read-&gt;nsec = cpu_to_le32(ts.tv_nsec);</div><div class='add'>+	sum = m-&gt;metric[METRIC_READ].latency_sum;</div><div class='add'>+	ktime_to_ceph_timespec(&amp;read-&gt;lat, sum);</div><div class='add'>+	ktime_to_ceph_timespec(&amp;read-&gt;avg, m-&gt;metric[METRIC_READ].latency_avg);</div><div class='add'>+	read-&gt;sq_sum = cpu_to_le64(m-&gt;metric[METRIC_READ].latency_sq_sum);</div><div class='add'>+	read-&gt;count = cpu_to_le64(m-&gt;metric[METRIC_READ].total);</div><div class='ctx'> 	items++;</div><div class='ctx'> </div><div class='ctx'> 	/* encode the write latency metric */</div><div class='ctx'> 	write = (struct ceph_metric_write_latency *)(read + 1);</div><div class='ctx'> 	write-&gt;header.type = cpu_to_le32(CLIENT_METRIC_TYPE_WRITE_LATENCY);</div><div class='del'>-	write-&gt;header.ver = 1;</div><div class='add'>+	write-&gt;header.ver = 2;</div><div class='ctx'> 	write-&gt;header.compat = 1;</div><div class='ctx'> 	write-&gt;header.data_len = cpu_to_le32(sizeof(*write) - header_len);</div><div class='del'>-	sum = m-&gt;write_latency_sum;</div><div class='del'>-	jiffies_to_timespec64(sum, &amp;ts);</div><div class='del'>-	write-&gt;sec = cpu_to_le32(ts.tv_sec);</div><div class='del'>-	write-&gt;nsec = cpu_to_le32(ts.tv_nsec);</div><div class='add'>+	sum = m-&gt;metric[METRIC_WRITE].latency_sum;</div><div class='add'>+	ktime_to_ceph_timespec(&amp;write-&gt;lat, sum);</div><div class='add'>+	ktime_to_ceph_timespec(&amp;write-&gt;avg, m-&gt;metric[METRIC_WRITE].latency_avg);</div><div class='add'>+	write-&gt;sq_sum = cpu_to_le64(m-&gt;metric[METRIC_WRITE].latency_sq_sum);</div><div class='add'>+	write-&gt;count = cpu_to_le64(m-&gt;metric[METRIC_WRITE].total);</div><div class='ctx'> 	items++;</div><div class='ctx'> </div><div class='ctx'> 	/* encode the metadata latency metric */</div><div class='ctx'> 	meta = (struct ceph_metric_metadata_latency *)(write + 1);</div><div class='ctx'> 	meta-&gt;header.type = cpu_to_le32(CLIENT_METRIC_TYPE_METADATA_LATENCY);</div><div class='del'>-	meta-&gt;header.ver = 1;</div><div class='add'>+	meta-&gt;header.ver = 2;</div><div class='ctx'> 	meta-&gt;header.compat = 1;</div><div class='ctx'> 	meta-&gt;header.data_len = cpu_to_le32(sizeof(*meta) - header_len);</div><div class='del'>-	sum = m-&gt;metadata_latency_sum;</div><div class='del'>-	jiffies_to_timespec64(sum, &amp;ts);</div><div class='del'>-	meta-&gt;sec = cpu_to_le32(ts.tv_sec);</div><div class='del'>-	meta-&gt;nsec = cpu_to_le32(ts.tv_nsec);</div><div class='add'>+	sum = m-&gt;metric[METRIC_METADATA].latency_sum;</div><div class='add'>+	ktime_to_ceph_timespec(&amp;meta-&gt;lat, sum);</div><div class='add'>+	ktime_to_ceph_timespec(&amp;meta-&gt;avg, m-&gt;metric[METRIC_METADATA].latency_avg);</div><div class='add'>+	meta-&gt;sq_sum = cpu_to_le64(m-&gt;metric[METRIC_METADATA].latency_sq_sum);</div><div class='add'>+	meta-&gt;count = cpu_to_le64(m-&gt;metric[METRIC_METADATA].total);</div><div class='ctx'> 	items++;</div><div class='ctx'> </div><div class='ctx'> 	/* encode the dentry lease metric */</div><div class='hunk'>@@ -141,8 +158,8 @@ static bool ceph_mdsc_send_metrics(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	rsize-&gt;header.ver = 1;</div><div class='ctx'> 	rsize-&gt;header.compat = 1;</div><div class='ctx'> 	rsize-&gt;header.data_len = cpu_to_le32(sizeof(*rsize) - header_len);</div><div class='del'>-	rsize-&gt;total_ops = cpu_to_le64(m-&gt;total_reads);</div><div class='del'>-	rsize-&gt;total_size = cpu_to_le64(m-&gt;read_size_sum);</div><div class='add'>+	rsize-&gt;total_ops = cpu_to_le64(m-&gt;metric[METRIC_READ].total);</div><div class='add'>+	rsize-&gt;total_size = cpu_to_le64(m-&gt;metric[METRIC_READ].size_sum);</div><div class='ctx'> 	items++;</div><div class='ctx'> </div><div class='ctx'> 	/* encode the write io size metric */</div><div class='hunk'>@@ -151,8 +168,8 @@ static bool ceph_mdsc_send_metrics(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	wsize-&gt;header.ver = 1;</div><div class='ctx'> 	wsize-&gt;header.compat = 1;</div><div class='ctx'> 	wsize-&gt;header.data_len = cpu_to_le32(sizeof(*wsize) - header_len);</div><div class='del'>-	wsize-&gt;total_ops = cpu_to_le64(m-&gt;total_writes);</div><div class='del'>-	wsize-&gt;total_size = cpu_to_le64(m-&gt;write_size_sum);</div><div class='add'>+	wsize-&gt;total_ops = cpu_to_le64(m-&gt;metric[METRIC_WRITE].total);</div><div class='add'>+	wsize-&gt;total_size = cpu_to_le64(m-&gt;metric[METRIC_WRITE].size_sum);</div><div class='ctx'> 	items++;</div><div class='ctx'> </div><div class='ctx'> 	put_unaligned_le32(items, &amp;head-&gt;num);</div><div class='hunk'>@@ -160,8 +177,6 @@ static bool ceph_mdsc_send_metrics(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	msg-&gt;hdr.version = cpu_to_le16(1);</div><div class='ctx'> 	msg-&gt;hdr.compat_version = cpu_to_le16(1);</div><div class='ctx'> 	msg-&gt;hdr.front_len = cpu_to_le32(msg-&gt;front.iov_len);</div><div class='del'>-	dout("client%llu send metrics to mds%d\n",</div><div class='del'>-	     ceph_client_gid(mdsc-&gt;fsc-&gt;client), s-&gt;s_mds);</div><div class='ctx'> 	ceph_con_send(&amp;s-&gt;s_con, msg);</div><div class='ctx'> </div><div class='ctx'> 	return true;</div><div class='hunk'>@@ -202,7 +217,7 @@ static void metric_delayed_work(struct work_struct *work)</div><div class='ctx'> 	struct ceph_mds_client *mdsc =</div><div class='ctx'> 		container_of(m, struct ceph_mds_client, metric);</div><div class='ctx'> </div><div class='del'>-	if (mdsc-&gt;stopping)</div><div class='add'>+	if (mdsc-&gt;stopping || disable_send_metrics)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	if (!m-&gt;session || !check_session_state(m-&gt;session)) {</div><div class='hunk'>@@ -220,7 +235,8 @@ static void metric_delayed_work(struct work_struct *work)</div><div class='ctx'> </div><div class='ctx'> int ceph_metric_init(struct ceph_client_metric *m)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='add'>+	struct ceph_metric *metric;</div><div class='add'>+	int ret, i;</div><div class='ctx'> </div><div class='ctx'> 	if (!m)</div><div class='ctx'> 		return -EINVAL;</div><div class='hunk'>@@ -243,32 +259,19 @@ int ceph_metric_init(struct ceph_client_metric *m)</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto err_i_caps_mis;</div><div class='ctx'> </div><div class='del'>-	spin_lock_init(&amp;m-&gt;read_metric_lock);</div><div class='del'>-	m-&gt;read_latency_sq_sum = 0;</div><div class='del'>-	m-&gt;read_latency_min = KTIME_MAX;</div><div class='del'>-	m-&gt;read_latency_max = 0;</div><div class='del'>-	m-&gt;total_reads = 0;</div><div class='del'>-	m-&gt;read_latency_sum = 0;</div><div class='del'>-	m-&gt;read_size_min = U64_MAX;</div><div class='del'>-	m-&gt;read_size_max = 0;</div><div class='del'>-	m-&gt;read_size_sum = 0;</div><div class='del'>-</div><div class='del'>-	spin_lock_init(&amp;m-&gt;write_metric_lock);</div><div class='del'>-	m-&gt;write_latency_sq_sum = 0;</div><div class='del'>-	m-&gt;write_latency_min = KTIME_MAX;</div><div class='del'>-	m-&gt;write_latency_max = 0;</div><div class='del'>-	m-&gt;total_writes = 0;</div><div class='del'>-	m-&gt;write_latency_sum = 0;</div><div class='del'>-	m-&gt;write_size_min = U64_MAX;</div><div class='del'>-	m-&gt;write_size_max = 0;</div><div class='del'>-	m-&gt;write_size_sum = 0;</div><div class='del'>-</div><div class='del'>-	spin_lock_init(&amp;m-&gt;metadata_metric_lock);</div><div class='del'>-	m-&gt;metadata_latency_sq_sum = 0;</div><div class='del'>-	m-&gt;metadata_latency_min = KTIME_MAX;</div><div class='del'>-	m-&gt;metadata_latency_max = 0;</div><div class='del'>-	m-&gt;total_metadatas = 0;</div><div class='del'>-	m-&gt;metadata_latency_sum = 0;</div><div class='add'>+	for (i = 0; i &lt; METRIC_MAX; i++) {</div><div class='add'>+		metric = &amp;m-&gt;metric[i];</div><div class='add'>+		spin_lock_init(&amp;metric-&gt;lock);</div><div class='add'>+		metric-&gt;size_sum = 0;</div><div class='add'>+		metric-&gt;size_min = U64_MAX;</div><div class='add'>+		metric-&gt;size_max = 0;</div><div class='add'>+		metric-&gt;total = 0;</div><div class='add'>+		metric-&gt;latency_sum = 0;</div><div class='add'>+		metric-&gt;latency_avg = 0;</div><div class='add'>+		metric-&gt;latency_sq_sum = 0;</div><div class='add'>+		metric-&gt;latency_min = KTIME_MAX;</div><div class='add'>+		metric-&gt;latency_max = 0;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	atomic64_set(&amp;m-&gt;opened_files, 0);</div><div class='ctx'> 	ret = percpu_counter_init(&amp;m-&gt;opened_inodes, 0, GFP_KERNEL);</div><div class='hunk'>@@ -322,25 +325,24 @@ void ceph_metric_destroy(struct ceph_client_metric *m)</div><div class='ctx'> 		max = new;			\</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void __update_stdev(ktime_t total, ktime_t lsum,</div><div class='del'>-				  ktime_t *sq_sump, ktime_t lat)</div><div class='add'>+static inline void __update_mean_and_stdev(ktime_t total, ktime_t *lavg,</div><div class='add'>+					   ktime_t *sq_sump, ktime_t lat)</div><div class='ctx'> {</div><div class='del'>-	ktime_t avg, sq;</div><div class='del'>-</div><div class='del'>-	if (unlikely(total == 1))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	/* the sq is (lat - old_avg) * (lat - new_avg) */</div><div class='del'>-	avg = DIV64_U64_ROUND_CLOSEST((lsum - lat), (total - 1));</div><div class='del'>-	sq = lat - avg;</div><div class='del'>-	avg = DIV64_U64_ROUND_CLOSEST(lsum, total);</div><div class='del'>-	sq = sq * (lat - avg);</div><div class='del'>-	*sq_sump += sq;</div><div class='add'>+	ktime_t avg;</div><div class='add'>+</div><div class='add'>+	if (unlikely(total == 1)) {</div><div class='add'>+		*lavg = lat;</div><div class='add'>+	} else {</div><div class='add'>+		/* the sq is (lat - old_avg) * (lat - new_avg) */</div><div class='add'>+		avg = *lavg + div64_s64(lat - *lavg, total);</div><div class='add'>+		*sq_sump += (lat - *lavg)*(lat - avg);</div><div class='add'>+		*lavg = avg;</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void ceph_update_read_metrics(struct ceph_client_metric *m,</div><div class='del'>-			      ktime_t r_start, ktime_t r_end,</div><div class='del'>-			      unsigned int size, int rc)</div><div class='add'>+void ceph_update_metrics(struct ceph_metric *m,</div><div class='add'>+			 ktime_t r_start, ktime_t r_end,</div><div class='add'>+			 unsigned int size, int rc)</div><div class='ctx'> {</div><div class='ctx'> 	ktime_t lat = ktime_sub(r_end, r_start);</div><div class='ctx'> 	ktime_t total;</div><div class='hunk'>@@ -348,63 +350,13 @@ void ceph_update_read_metrics(struct ceph_client_metric *m,</div><div class='ctx'> 	if (unlikely(rc &lt; 0 &amp;&amp; rc != -ENOENT &amp;&amp; rc != -ETIMEDOUT))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;m-&gt;read_metric_lock);</div><div class='del'>-	total = ++m-&gt;total_reads;</div><div class='del'>-	m-&gt;read_size_sum += size;</div><div class='del'>-	m-&gt;read_latency_sum += lat;</div><div class='del'>-	METRIC_UPDATE_MIN_MAX(m-&gt;read_size_min,</div><div class='del'>-			      m-&gt;read_size_max,</div><div class='del'>-			      size);</div><div class='del'>-	METRIC_UPDATE_MIN_MAX(m-&gt;read_latency_min,</div><div class='del'>-			      m-&gt;read_latency_max,</div><div class='del'>-			      lat);</div><div class='del'>-	__update_stdev(total, m-&gt;read_latency_sum,</div><div class='del'>-		       &amp;m-&gt;read_latency_sq_sum, lat);</div><div class='del'>-	spin_unlock(&amp;m-&gt;read_metric_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void ceph_update_write_metrics(struct ceph_client_metric *m,</div><div class='del'>-			       ktime_t r_start, ktime_t r_end,</div><div class='del'>-			       unsigned int size, int rc)</div><div class='del'>-{</div><div class='del'>-	ktime_t lat = ktime_sub(r_end, r_start);</div><div class='del'>-	ktime_t total;</div><div class='del'>-</div><div class='del'>-	if (unlikely(rc &amp;&amp; rc != -ETIMEDOUT))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;m-&gt;write_metric_lock);</div><div class='del'>-	total = ++m-&gt;total_writes;</div><div class='del'>-	m-&gt;write_size_sum += size;</div><div class='del'>-	m-&gt;write_latency_sum += lat;</div><div class='del'>-	METRIC_UPDATE_MIN_MAX(m-&gt;write_size_min,</div><div class='del'>-			      m-&gt;write_size_max,</div><div class='del'>-			      size);</div><div class='del'>-	METRIC_UPDATE_MIN_MAX(m-&gt;write_latency_min,</div><div class='del'>-			      m-&gt;write_latency_max,</div><div class='del'>-			      lat);</div><div class='del'>-	__update_stdev(total, m-&gt;write_latency_sum,</div><div class='del'>-		       &amp;m-&gt;write_latency_sq_sum, lat);</div><div class='del'>-	spin_unlock(&amp;m-&gt;write_metric_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void ceph_update_metadata_metrics(struct ceph_client_metric *m,</div><div class='del'>-				  ktime_t r_start, ktime_t r_end,</div><div class='del'>-				  int rc)</div><div class='del'>-{</div><div class='del'>-	ktime_t lat = ktime_sub(r_end, r_start);</div><div class='del'>-	ktime_t total;</div><div class='del'>-</div><div class='del'>-	if (unlikely(rc &amp;&amp; rc != -ENOENT))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;m-&gt;metadata_metric_lock);</div><div class='del'>-	total = ++m-&gt;total_metadatas;</div><div class='del'>-	m-&gt;metadata_latency_sum += lat;</div><div class='del'>-	METRIC_UPDATE_MIN_MAX(m-&gt;metadata_latency_min,</div><div class='del'>-			      m-&gt;metadata_latency_max,</div><div class='del'>-			      lat);</div><div class='del'>-	__update_stdev(total, m-&gt;metadata_latency_sum,</div><div class='del'>-		       &amp;m-&gt;metadata_latency_sq_sum, lat);</div><div class='del'>-	spin_unlock(&amp;m-&gt;metadata_metric_lock);</div><div class='add'>+	spin_lock(&amp;m-&gt;lock);</div><div class='add'>+	total = ++m-&gt;total;</div><div class='add'>+	m-&gt;size_sum += size;</div><div class='add'>+	METRIC_UPDATE_MIN_MAX(m-&gt;size_min, m-&gt;size_max, size);</div><div class='add'>+	m-&gt;latency_sum += lat;</div><div class='add'>+	METRIC_UPDATE_MIN_MAX(m-&gt;latency_min, m-&gt;latency_max, lat);</div><div class='add'>+	__update_mean_and_stdev(total, &amp;m-&gt;latency_avg,	&amp;m-&gt;latency_sq_sum,</div><div class='add'>+				lat);</div><div class='add'>+	spin_unlock(&amp;m-&gt;lock);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/ceph/metric.h b/fs/ceph/metric.h<br/>index 0133955a3c6a..0d0c44bd3332 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ceph/metric.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/metric.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/metric.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/metric.h</a></div><div class='hunk'>@@ -2,7 +2,7 @@</div><div class='ctx'> #ifndef _FS_CEPH_MDS_METRIC_H</div><div class='ctx'> #define _FS_CEPH_MDS_METRIC_H</div><div class='ctx'> </div><div class='del'>-#include &lt;linux/types.h&gt;</div><div class='add'>+#include &lt;linux/ceph/types.h&gt;</div><div class='ctx'> #include &lt;linux/percpu_counter.h&gt;</div><div class='ctx'> #include &lt;linux/ktime.h&gt;</div><div class='ctx'> </div><div class='hunk'>@@ -19,27 +19,39 @@ enum ceph_metric_type {</div><div class='ctx'> 	CLIENT_METRIC_TYPE_OPENED_INODES,</div><div class='ctx'> 	CLIENT_METRIC_TYPE_READ_IO_SIZES,</div><div class='ctx'> 	CLIENT_METRIC_TYPE_WRITE_IO_SIZES,</div><div class='del'>-</div><div class='del'>-	CLIENT_METRIC_TYPE_MAX = CLIENT_METRIC_TYPE_WRITE_IO_SIZES,</div><div class='add'>+	CLIENT_METRIC_TYPE_AVG_READ_LATENCY,</div><div class='add'>+	CLIENT_METRIC_TYPE_STDEV_READ_LATENCY,</div><div class='add'>+	CLIENT_METRIC_TYPE_AVG_WRITE_LATENCY,</div><div class='add'>+	CLIENT_METRIC_TYPE_STDEV_WRITE_LATENCY,</div><div class='add'>+	CLIENT_METRIC_TYPE_AVG_METADATA_LATENCY,</div><div class='add'>+	CLIENT_METRIC_TYPE_STDEV_METADATA_LATENCY,</div><div class='add'>+</div><div class='add'>+	CLIENT_METRIC_TYPE_MAX = CLIENT_METRIC_TYPE_STDEV_METADATA_LATENCY,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * This will always have the highest metric bit value</div><div class='ctx'>  * as the last element of the array.</div><div class='ctx'>  */</div><div class='del'>-#define CEPHFS_METRIC_SPEC_CLIENT_SUPPORTED {	\</div><div class='del'>-	CLIENT_METRIC_TYPE_CAP_INFO,		\</div><div class='del'>-	CLIENT_METRIC_TYPE_READ_LATENCY,	\</div><div class='del'>-	CLIENT_METRIC_TYPE_WRITE_LATENCY,	\</div><div class='del'>-	CLIENT_METRIC_TYPE_METADATA_LATENCY,	\</div><div class='del'>-	CLIENT_METRIC_TYPE_DENTRY_LEASE,	\</div><div class='del'>-	CLIENT_METRIC_TYPE_OPENED_FILES,	\</div><div class='del'>-	CLIENT_METRIC_TYPE_PINNED_ICAPS,	\</div><div class='del'>-	CLIENT_METRIC_TYPE_OPENED_INODES,	\</div><div class='del'>-	CLIENT_METRIC_TYPE_READ_IO_SIZES,	\</div><div class='del'>-	CLIENT_METRIC_TYPE_WRITE_IO_SIZES,	\</div><div class='del'>-						\</div><div class='del'>-	CLIENT_METRIC_TYPE_MAX,			\</div><div class='add'>+#define CEPHFS_METRIC_SPEC_CLIENT_SUPPORTED {	   \</div><div class='add'>+	CLIENT_METRIC_TYPE_CAP_INFO,		   \</div><div class='add'>+	CLIENT_METRIC_TYPE_READ_LATENCY,	   \</div><div class='add'>+	CLIENT_METRIC_TYPE_WRITE_LATENCY,	   \</div><div class='add'>+	CLIENT_METRIC_TYPE_METADATA_LATENCY,	   \</div><div class='add'>+	CLIENT_METRIC_TYPE_DENTRY_LEASE,	   \</div><div class='add'>+	CLIENT_METRIC_TYPE_OPENED_FILES,	   \</div><div class='add'>+	CLIENT_METRIC_TYPE_PINNED_ICAPS,	   \</div><div class='add'>+	CLIENT_METRIC_TYPE_OPENED_INODES,	   \</div><div class='add'>+	CLIENT_METRIC_TYPE_READ_IO_SIZES,	   \</div><div class='add'>+	CLIENT_METRIC_TYPE_WRITE_IO_SIZES,	   \</div><div class='add'>+	CLIENT_METRIC_TYPE_AVG_READ_LATENCY,	   \</div><div class='add'>+	CLIENT_METRIC_TYPE_STDEV_READ_LATENCY,	   \</div><div class='add'>+	CLIENT_METRIC_TYPE_AVG_WRITE_LATENCY,	   \</div><div class='add'>+	CLIENT_METRIC_TYPE_STDEV_WRITE_LATENCY,	   \</div><div class='add'>+	CLIENT_METRIC_TYPE_AVG_METADATA_LATENCY,   \</div><div class='add'>+	CLIENT_METRIC_TYPE_STDEV_METADATA_LATENCY, \</div><div class='add'>+						   \</div><div class='add'>+	CLIENT_METRIC_TYPE_MAX,			   \</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct ceph_metric_header {</div><div class='hunk'>@@ -60,22 +72,28 @@ struct ceph_metric_cap {</div><div class='ctx'> /* metric read latency header */</div><div class='ctx'> struct ceph_metric_read_latency {</div><div class='ctx'> 	struct ceph_metric_header header;</div><div class='del'>-	__le32 sec;</div><div class='del'>-	__le32 nsec;</div><div class='add'>+	struct ceph_timespec lat;</div><div class='add'>+	struct ceph_timespec avg;</div><div class='add'>+	__le64 sq_sum;</div><div class='add'>+	__le64 count;</div><div class='ctx'> } __packed;</div><div class='ctx'> </div><div class='ctx'> /* metric write latency header */</div><div class='ctx'> struct ceph_metric_write_latency {</div><div class='ctx'> 	struct ceph_metric_header header;</div><div class='del'>-	__le32 sec;</div><div class='del'>-	__le32 nsec;</div><div class='add'>+	struct ceph_timespec lat;</div><div class='add'>+	struct ceph_timespec avg;</div><div class='add'>+	__le64 sq_sum;</div><div class='add'>+	__le64 count;</div><div class='ctx'> } __packed;</div><div class='ctx'> </div><div class='ctx'> /* metric metadata latency header */</div><div class='ctx'> struct ceph_metric_metadata_latency {</div><div class='ctx'> 	struct ceph_metric_header header;</div><div class='del'>-	__le32 sec;</div><div class='del'>-	__le32 nsec;</div><div class='add'>+	struct ceph_timespec lat;</div><div class='add'>+	struct ceph_timespec avg;</div><div class='add'>+	__le64 sq_sum;</div><div class='add'>+	__le64 count;</div><div class='ctx'> } __packed;</div><div class='ctx'> </div><div class='ctx'> /* metric dentry lease header */</div><div class='hunk'>@@ -125,6 +143,27 @@ struct ceph_metric_head {</div><div class='ctx'> 	__le32 num;	/* the number of metrics that will be sent */</div><div class='ctx'> } __packed;</div><div class='ctx'> </div><div class='add'>+enum metric_type {</div><div class='add'>+	METRIC_READ,</div><div class='add'>+	METRIC_WRITE,</div><div class='add'>+	METRIC_METADATA,</div><div class='add'>+	METRIC_COPYFROM,</div><div class='add'>+	METRIC_MAX</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct ceph_metric {</div><div class='add'>+	spinlock_t lock;</div><div class='add'>+	u64 total;</div><div class='add'>+	u64 size_sum;</div><div class='add'>+	u64 size_min;</div><div class='add'>+	u64 size_max;</div><div class='add'>+	ktime_t latency_sum;</div><div class='add'>+	ktime_t latency_avg;</div><div class='add'>+	ktime_t latency_sq_sum;</div><div class='add'>+	ktime_t latency_min;</div><div class='add'>+	ktime_t latency_max;</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> /* This is the global metrics */</div><div class='ctx'> struct ceph_client_metric {</div><div class='ctx'> 	atomic64_t            total_dentries;</div><div class='hunk'>@@ -135,32 +174,7 @@ struct ceph_client_metric {</div><div class='ctx'> 	struct percpu_counter i_caps_hit;</div><div class='ctx'> 	struct percpu_counter i_caps_mis;</div><div class='ctx'> </div><div class='del'>-	spinlock_t read_metric_lock;</div><div class='del'>-	u64 total_reads;</div><div class='del'>-	u64 read_size_sum;</div><div class='del'>-	u64 read_size_min;</div><div class='del'>-	u64 read_size_max;</div><div class='del'>-	ktime_t read_latency_sum;</div><div class='del'>-	ktime_t read_latency_sq_sum;</div><div class='del'>-	ktime_t read_latency_min;</div><div class='del'>-	ktime_t read_latency_max;</div><div class='del'>-</div><div class='del'>-	spinlock_t write_metric_lock;</div><div class='del'>-	u64 total_writes;</div><div class='del'>-	u64 write_size_sum;</div><div class='del'>-	u64 write_size_min;</div><div class='del'>-	u64 write_size_max;</div><div class='del'>-	ktime_t write_latency_sum;</div><div class='del'>-	ktime_t write_latency_sq_sum;</div><div class='del'>-	ktime_t write_latency_min;</div><div class='del'>-	ktime_t write_latency_max;</div><div class='del'>-</div><div class='del'>-	spinlock_t metadata_metric_lock;</div><div class='del'>-	u64 total_metadatas;</div><div class='del'>-	ktime_t metadata_latency_sum;</div><div class='del'>-	ktime_t metadata_latency_sq_sum;</div><div class='del'>-	ktime_t metadata_latency_min;</div><div class='del'>-	ktime_t metadata_latency_max;</div><div class='add'>+	struct ceph_metric metric[METRIC_MAX];</div><div class='ctx'> </div><div class='ctx'> 	/* The total number of directories and files that are opened */</div><div class='ctx'> 	atomic64_t opened_files;</div><div class='hunk'>@@ -195,13 +209,36 @@ static inline void ceph_update_cap_mis(struct ceph_client_metric *m)</div><div class='ctx'> 	percpu_counter_inc(&amp;m-&gt;i_caps_mis);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-extern void ceph_update_read_metrics(struct ceph_client_metric *m,</div><div class='del'>-				     ktime_t r_start, ktime_t r_end,</div><div class='del'>-				     unsigned int size, int rc);</div><div class='del'>-extern void ceph_update_write_metrics(struct ceph_client_metric *m,</div><div class='del'>-				      ktime_t r_start, ktime_t r_end,</div><div class='del'>-				      unsigned int size, int rc);</div><div class='del'>-extern void ceph_update_metadata_metrics(struct ceph_client_metric *m,</div><div class='del'>-				         ktime_t r_start, ktime_t r_end,</div><div class='del'>-					 int rc);</div><div class='add'>+extern void ceph_update_metrics(struct ceph_metric *m,</div><div class='add'>+				ktime_t r_start, ktime_t r_end,</div><div class='add'>+				unsigned int size, int rc);</div><div class='add'>+</div><div class='add'>+static inline void ceph_update_read_metrics(struct ceph_client_metric *m,</div><div class='add'>+					    ktime_t r_start, ktime_t r_end,</div><div class='add'>+					    unsigned int size, int rc)</div><div class='add'>+{</div><div class='add'>+	ceph_update_metrics(&amp;m-&gt;metric[METRIC_READ],</div><div class='add'>+			    r_start, r_end, size, rc);</div><div class='add'>+}</div><div class='add'>+static inline void ceph_update_write_metrics(struct ceph_client_metric *m,</div><div class='add'>+					     ktime_t r_start, ktime_t r_end,</div><div class='add'>+					     unsigned int size, int rc)</div><div class='add'>+{</div><div class='add'>+	ceph_update_metrics(&amp;m-&gt;metric[METRIC_WRITE],</div><div class='add'>+			    r_start, r_end, size, rc);</div><div class='add'>+}</div><div class='add'>+static inline void ceph_update_metadata_metrics(struct ceph_client_metric *m,</div><div class='add'>+						ktime_t r_start, ktime_t r_end,</div><div class='add'>+						int rc)</div><div class='add'>+{</div><div class='add'>+	ceph_update_metrics(&amp;m-&gt;metric[METRIC_METADATA],</div><div class='add'>+			    r_start, r_end, 0, rc);</div><div class='add'>+}</div><div class='add'>+static inline void ceph_update_copyfrom_metrics(struct ceph_client_metric *m,</div><div class='add'>+						ktime_t r_start, ktime_t r_end,</div><div class='add'>+						unsigned int size, int rc)</div><div class='add'>+{</div><div class='add'>+	ceph_update_metrics(&amp;m-&gt;metric[METRIC_COPYFROM],</div><div class='add'>+			    r_start, r_end, size, rc);</div><div class='add'>+}</div><div class='ctx'> #endif /* _FS_CEPH_MDS_METRIC_H */</div><div class='head'>diff --git a/fs/ceph/quota.c b/fs/ceph/quota.c<br/>index 620c691af40e..d90eda19bcc4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ceph/quota.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/quota.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/quota.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/quota.c</a></div><div class='hunk'>@@ -30,6 +30,9 @@ static inline bool ceph_has_realms_with_quotas(struct inode *inode)</div><div class='ctx'> 	/* if root is the real CephFS root, we don't have quota realms */</div><div class='ctx'> 	if (root &amp;&amp; ceph_ino(root) == CEPH_INO_ROOT)</div><div class='ctx'> 		return false;</div><div class='add'>+	/* MDS stray dirs have no quota realms */</div><div class='add'>+	if (ceph_vino_is_reserved(ceph_inode(inode)-&gt;i_vino))</div><div class='add'>+		return false;</div><div class='ctx'> 	/* otherwise, we can't know for sure */</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='hunk'>@@ -40,29 +43,28 @@ void ceph_handle_quota(struct ceph_mds_client *mdsc,</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = mdsc-&gt;fsc-&gt;sb;</div><div class='ctx'> 	struct ceph_mds_quota *h = msg-&gt;front.iov_base;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_vino vino;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct ceph_inode_info *ci;</div><div class='ctx'> </div><div class='add'>+	if (!ceph_inc_mds_stopping_blocker(mdsc, session))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='ctx'> 	if (msg-&gt;front.iov_len &lt; sizeof(*h)) {</div><div class='del'>-		pr_err("%s corrupt message mds%d len %d\n", __func__,</div><div class='del'>-		       session-&gt;s_mds, (int)msg-&gt;front.iov_len);</div><div class='add'>+		pr_err_client(cl, "corrupt message mds%d len %d\n",</div><div class='add'>+			      session-&gt;s_mds, (int)msg-&gt;front.iov_len);</div><div class='ctx'> 		ceph_msg_dump(msg);</div><div class='del'>-		return;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* increment msg sequence number */</div><div class='del'>-	mutex_lock(&amp;session-&gt;s_mutex);</div><div class='del'>-	inc_session_sequence(session);</div><div class='del'>-	mutex_unlock(&amp;session-&gt;s_mutex);</div><div class='del'>-</div><div class='ctx'> 	/* lookup inode */</div><div class='ctx'> 	vino.ino = le64_to_cpu(h-&gt;ino);</div><div class='ctx'> 	vino.snap = CEPH_NOSNAP;</div><div class='ctx'> 	inode = ceph_find_inode(sb, vino);</div><div class='ctx'> 	if (!inode) {</div><div class='del'>-		pr_warn("Failed to find inode %llu\n", vino.ino);</div><div class='del'>-		return;</div><div class='add'>+		pr_warn_client(cl, "failed to find inode %llx\n", vino.ino);</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	ci = ceph_inode(inode);</div><div class='ctx'> </div><div class='hunk'>@@ -75,6 +77,8 @@ void ceph_handle_quota(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> </div><div class='ctx'> 	iput(inode);</div><div class='add'>+out:</div><div class='add'>+	ceph_dec_mds_stopping_blocker(mdsc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct ceph_quotarealm_inode *</div><div class='hunk'>@@ -82,6 +86,7 @@ find_quotarealm_inode(struct ceph_mds_client *mdsc, u64 ino)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_quotarealm_inode *qri = NULL;</div><div class='ctx'> 	struct rb_node **node, *parent = NULL;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;mdsc-&gt;quotarealms_inodes_mutex);</div><div class='ctx'> 	node = &amp;(mdsc-&gt;quotarealms_inodes.rb_node);</div><div class='hunk'>@@ -107,7 +112,7 @@ find_quotarealm_inode(struct ceph_mds_client *mdsc, u64 ino)</div><div class='ctx'> 			rb_link_node(&amp;qri-&gt;node, parent, node);</div><div class='ctx'> 			rb_insert_color(&amp;qri-&gt;node, &amp;mdsc-&gt;quotarealms_inodes);</div><div class='ctx'> 		} else</div><div class='del'>-			pr_warn("Failed to alloc quotarealms_inode\n");</div><div class='add'>+			pr_warn_client(cl, "Failed to alloc quotarealms_inode\n");</div><div class='ctx'> 	}</div><div class='ctx'> 	mutex_unlock(&amp;mdsc-&gt;quotarealms_inodes_mutex);</div><div class='ctx'> </div><div class='hunk'>@@ -126,6 +131,7 @@ static struct inode *lookup_quotarealm_inode(struct ceph_mds_client *mdsc,</div><div class='ctx'> 					     struct super_block *sb,</div><div class='ctx'> 					     struct ceph_snap_realm *realm)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_quotarealm_inode *qri;</div><div class='ctx'> 	struct inode *in;</div><div class='ctx'> </div><div class='hunk'>@@ -158,9 +164,9 @@ static struct inode *lookup_quotarealm_inode(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (IS_ERR(in)) {</div><div class='del'>-		dout("Can't lookup inode %llx (err: %ld)\n",</div><div class='del'>-		     realm-&gt;ino, PTR_ERR(in));</div><div class='del'>-		qri-&gt;timeout = jiffies + msecs_to_jiffies(60 * 1000); /* XXX */</div><div class='add'>+		doutc(cl, "Can't lookup inode %llx (err: %ld)\n", realm-&gt;ino,</div><div class='add'>+		      PTR_ERR(in));</div><div class='add'>+		qri-&gt;timeout = jiffies + secs_to_jiffies(60); /* XXX */</div><div class='ctx'> 	} else {</div><div class='ctx'> 		qri-&gt;timeout = 0;</div><div class='ctx'> 		qri-&gt;inode = in;</div><div class='hunk'>@@ -191,10 +197,10 @@ void ceph_cleanup_quotarealms_inodes(struct ceph_mds_client *mdsc)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * This function walks through the snaprealm for an inode and returns the</div><div class='del'>- * ceph_snap_realm for the first snaprealm that has quotas set (either max_files</div><div class='del'>- * or max_bytes).  If the root is reached, return the root ceph_snap_realm</div><div class='del'>- * instead.</div><div class='add'>+ * This function walks through the snaprealm for an inode and set the</div><div class='add'>+ * realmp with the first snaprealm that has quotas set (max_files,</div><div class='add'>+ * max_bytes, or any, depending on the 'which_quota' argument).  If the root is</div><div class='add'>+ * reached, set the realmp with the root ceph_snap_realm instead.</div><div class='ctx'>  *</div><div class='ctx'>  * Note that the caller is responsible for calling ceph_put_snap_realm() on the</div><div class='ctx'>  * returned realm.</div><div class='hunk'>@@ -205,24 +211,29 @@ void ceph_cleanup_quotarealms_inodes(struct ceph_mds_client *mdsc)</div><div class='ctx'>  * this function will return -EAGAIN; otherwise, the snaprealms walk-through</div><div class='ctx'>  * will be restarted.</div><div class='ctx'>  */</div><div class='del'>-static struct ceph_snap_realm *get_quota_realm(struct ceph_mds_client *mdsc,</div><div class='del'>-					       struct inode *inode, bool retry)</div><div class='add'>+static int get_quota_realm(struct ceph_mds_client *mdsc, struct inode *inode,</div><div class='add'>+			   enum quota_get_realm which_quota,</div><div class='add'>+			   struct ceph_snap_realm **realmp, bool retry)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_inode_info *ci = NULL;</div><div class='ctx'> 	struct ceph_snap_realm *realm, *next;</div><div class='ctx'> 	struct inode *in;</div><div class='ctx'> 	bool has_quota;</div><div class='ctx'> </div><div class='add'>+	if (realmp)</div><div class='add'>+		*realmp = NULL;</div><div class='ctx'> 	if (ceph_snap(inode) != CEPH_NOSNAP)</div><div class='del'>-		return NULL;</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> restart:</div><div class='ctx'> 	realm = ceph_inode(inode)-&gt;i_snap_realm;</div><div class='ctx'> 	if (realm)</div><div class='ctx'> 		ceph_get_snap_realm(mdsc, realm);</div><div class='ctx'> 	else</div><div class='del'>-		pr_err_ratelimited("get_quota_realm: ino (%llx.%llx) "</div><div class='del'>-				   "null i_snap_realm\n", ceph_vinop(inode));</div><div class='add'>+		pr_err_ratelimited_client(cl,</div><div class='add'>+				"%p %llx.%llx null i_snap_realm\n",</div><div class='add'>+				inode, ceph_vinop(inode));</div><div class='ctx'> 	while (realm) {</div><div class='ctx'> 		bool has_inode;</div><div class='ctx'> </div><div class='hunk'>@@ -240,17 +251,20 @@ restart:</div><div class='ctx'> 				break;</div><div class='ctx'> 			ceph_put_snap_realm(mdsc, realm);</div><div class='ctx'> 			if (!retry)</div><div class='del'>-				return ERR_PTR(-EAGAIN);</div><div class='add'>+				return -EAGAIN;</div><div class='ctx'> 			goto restart;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		ci = ceph_inode(in);</div><div class='del'>-		has_quota = __ceph_has_any_quota(ci);</div><div class='add'>+		has_quota = __ceph_has_quota(ci, which_quota);</div><div class='ctx'> 		iput(in);</div><div class='ctx'> </div><div class='ctx'> 		next = realm-&gt;parent;</div><div class='del'>-		if (has_quota || !next)</div><div class='del'>-		       return realm;</div><div class='add'>+		if (has_quota || !next) {</div><div class='add'>+			if (realmp)</div><div class='add'>+				*realmp = realm;</div><div class='add'>+			return 0;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		ceph_get_snap_realm(mdsc, next);</div><div class='ctx'> 		ceph_put_snap_realm(mdsc, realm);</div><div class='hunk'>@@ -259,7 +273,7 @@ restart:</div><div class='ctx'> 	if (realm)</div><div class='ctx'> 		ceph_put_snap_realm(mdsc, realm);</div><div class='ctx'> </div><div class='del'>-	return NULL;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> bool ceph_quota_is_same_realm(struct inode *old, struct inode *new)</div><div class='hunk'>@@ -267,6 +281,7 @@ bool ceph_quota_is_same_realm(struct inode *old, struct inode *new)</div><div class='ctx'> 	struct ceph_mds_client *mdsc = ceph_sb_to_mdsc(old-&gt;i_sb);</div><div class='ctx'> 	struct ceph_snap_realm *old_realm, *new_realm;</div><div class='ctx'> 	bool is_same;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> restart:</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -276,9 +291,9 @@ restart:</div><div class='ctx'> 	 * dropped and we can then restart the whole operation.</div><div class='ctx'> 	 */</div><div class='ctx'> 	down_read(&amp;mdsc-&gt;snap_rwsem);</div><div class='del'>-	old_realm = get_quota_realm(mdsc, old, true);</div><div class='del'>-	new_realm = get_quota_realm(mdsc, new, false);</div><div class='del'>-	if (PTR_ERR(new_realm) == -EAGAIN) {</div><div class='add'>+	get_quota_realm(mdsc, old, QUOTA_GET_ANY, &amp;old_realm, true);</div><div class='add'>+	ret = get_quota_realm(mdsc, new, QUOTA_GET_ANY, &amp;new_realm, false);</div><div class='add'>+	if (ret == -EAGAIN) {</div><div class='ctx'> 		up_read(&amp;mdsc-&gt;snap_rwsem);</div><div class='ctx'> 		if (old_realm)</div><div class='ctx'> 			ceph_put_snap_realm(mdsc, old_realm);</div><div class='hunk'>@@ -312,6 +327,7 @@ static bool check_quota_exceeded(struct inode *inode, enum quota_check_op op,</div><div class='ctx'> 				 loff_t delta)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_mds_client *mdsc = ceph_sb_to_mdsc(inode-&gt;i_sb);</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_inode_info *ci;</div><div class='ctx'> 	struct ceph_snap_realm *realm, *next;</div><div class='ctx'> 	struct inode *in;</div><div class='hunk'>@@ -327,8 +343,9 @@ restart:</div><div class='ctx'> 	if (realm)</div><div class='ctx'> 		ceph_get_snap_realm(mdsc, realm);</div><div class='ctx'> 	else</div><div class='del'>-		pr_err_ratelimited("check_quota_exceeded: ino (%llx.%llx) "</div><div class='del'>-				   "null i_snap_realm\n", ceph_vinop(inode));</div><div class='add'>+		pr_err_ratelimited_client(cl,</div><div class='add'>+				"%p %llx.%llx null i_snap_realm\n",</div><div class='add'>+				inode, ceph_vinop(inode));</div><div class='ctx'> 	while (realm) {</div><div class='ctx'> 		bool has_inode;</div><div class='ctx'> </div><div class='hunk'>@@ -378,7 +395,7 @@ restart:</div><div class='ctx'> 			break;</div><div class='ctx'> 		default:</div><div class='ctx'> 			/* Shouldn't happen */</div><div class='del'>-			pr_warn("Invalid quota check op (%d)\n", op);</div><div class='add'>+			pr_warn_client(cl, "Invalid quota check op (%d)\n", op);</div><div class='ctx'> 			exceeded = true; /* Just break the loop */</div><div class='ctx'> 		}</div><div class='ctx'> 		iput(in);</div><div class='hunk'>@@ -480,7 +497,8 @@ bool ceph_quota_update_statfs(struct ceph_fs_client *fsc, struct kstatfs *buf)</div><div class='ctx'> 	bool is_updated = false;</div><div class='ctx'> </div><div class='ctx'> 	down_read(&amp;mdsc-&gt;snap_rwsem);</div><div class='del'>-	realm = get_quota_realm(mdsc, d_inode(fsc-&gt;sb-&gt;s_root), true);</div><div class='add'>+	get_quota_realm(mdsc, d_inode(fsc-&gt;sb-&gt;s_root), QUOTA_GET_MAX_BYTES,</div><div class='add'>+			&amp;realm, true);</div><div class='ctx'> 	up_read(&amp;mdsc-&gt;snap_rwsem);</div><div class='ctx'> 	if (!realm)</div><div class='ctx'> 		return false;</div><div class='hunk'>@@ -494,10 +512,24 @@ bool ceph_quota_update_statfs(struct ceph_fs_client *fsc, struct kstatfs *buf)</div><div class='ctx'> 		if (ci-&gt;i_max_bytes) {</div><div class='ctx'> 			total = ci-&gt;i_max_bytes &gt;&gt; CEPH_BLOCK_SHIFT;</div><div class='ctx'> 			used = ci-&gt;i_rbytes &gt;&gt; CEPH_BLOCK_SHIFT;</div><div class='add'>+			/* For quota size less than 4MB, use 4KB block size */</div><div class='add'>+			if (!total) {</div><div class='add'>+				total = ci-&gt;i_max_bytes &gt;&gt; CEPH_4K_BLOCK_SHIFT;</div><div class='add'>+				used = ci-&gt;i_rbytes &gt;&gt; CEPH_4K_BLOCK_SHIFT;</div><div class='add'>+	                        buf-&gt;f_frsize = 1 &lt;&lt; CEPH_4K_BLOCK_SHIFT;</div><div class='add'>+			}</div><div class='ctx'> 			/* It is possible for a quota to be exceeded.</div><div class='ctx'> 			 * Report 'zero' in that case</div><div class='ctx'> 			 */</div><div class='ctx'> 			free = total &gt; used ? total - used : 0;</div><div class='add'>+			/* For quota size less than 4KB, report the</div><div class='add'>+			 * total=used=4KB,free=0 when quota is full</div><div class='add'>+			 * and total=free=4KB, used=0 otherwise */</div><div class='add'>+			if (!total) {</div><div class='add'>+				total = 1;</div><div class='add'>+				free = ci-&gt;i_max_bytes &gt; ci-&gt;i_rbytes ? 1 : 0;</div><div class='add'>+	                        buf-&gt;f_frsize = 1 &lt;&lt; CEPH_4K_BLOCK_SHIFT;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> 		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 		if (total) {</div><div class='head'>diff --git a/fs/ceph/snap.c b/fs/ceph/snap.c<br/>index b41e6724c591..c65f2b202b2b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ceph/snap.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/snap.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/snap.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/snap.c</a></div><div class='hunk'>@@ -1,6 +1,7 @@</div><div class='ctx'> // SPDX-License-Identifier: GPL-2.0</div><div class='ctx'> #include &lt;linux/ceph/ceph_debug.h&gt;</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/sort.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/iversion.h&gt;</div><div class='hunk'>@@ -121,18 +122,23 @@ static struct ceph_snap_realm *ceph_create_snap_realm(</div><div class='ctx'> 	if (!realm)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='del'>-	atomic_set(&amp;realm-&gt;nref, 1);    /* for caller */</div><div class='add'>+	/* Do not release the global dummy snaprealm until unmouting */</div><div class='add'>+	if (ino == CEPH_INO_GLOBAL_SNAPREALM)</div><div class='add'>+		atomic_set(&amp;realm-&gt;nref, 2);</div><div class='add'>+	else</div><div class='add'>+		atomic_set(&amp;realm-&gt;nref, 1);</div><div class='ctx'> 	realm-&gt;ino = ino;</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;realm-&gt;children);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;realm-&gt;child_item);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;realm-&gt;empty_item);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;realm-&gt;dirty_item);</div><div class='add'>+	INIT_LIST_HEAD(&amp;realm-&gt;rebuild_item);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;realm-&gt;inodes_with_caps);</div><div class='ctx'> 	spin_lock_init(&amp;realm-&gt;inodes_with_caps_lock);</div><div class='ctx'> 	__insert_snap_realm(&amp;mdsc-&gt;snap_realms, realm);</div><div class='ctx'> 	mdsc-&gt;num_snap_realms++;</div><div class='ctx'> </div><div class='del'>-	dout("create_snap_realm %llx %p\n", realm-&gt;ino, realm);</div><div class='add'>+	doutc(mdsc-&gt;fsc-&gt;client, "%llx %p\n", realm-&gt;ino, realm);</div><div class='ctx'> 	return realm;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -144,6 +150,7 @@ static struct ceph_snap_realm *ceph_create_snap_realm(</div><div class='ctx'> static struct ceph_snap_realm *__lookup_snap_realm(struct ceph_mds_client *mdsc,</div><div class='ctx'> 						   u64 ino)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct rb_node *n = mdsc-&gt;snap_realms.rb_node;</div><div class='ctx'> 	struct ceph_snap_realm *r;</div><div class='ctx'> </div><div class='hunk'>@@ -156,7 +163,7 @@ static struct ceph_snap_realm *__lookup_snap_realm(struct ceph_mds_client *mdsc,</div><div class='ctx'> 		else if (ino &gt; r-&gt;ino)</div><div class='ctx'> 			n = n-&gt;rb_right;</div><div class='ctx'> 		else {</div><div class='del'>-			dout("lookup_snap_realm %llx %p\n", r-&gt;ino, r);</div><div class='add'>+			doutc(cl, "%llx %p\n", r-&gt;ino, r);</div><div class='ctx'> 			return r;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -182,9 +189,10 @@ static void __put_snap_realm(struct ceph_mds_client *mdsc,</div><div class='ctx'> static void __destroy_snap_realm(struct ceph_mds_client *mdsc,</div><div class='ctx'> 				 struct ceph_snap_realm *realm)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	lockdep_assert_held_write(&amp;mdsc-&gt;snap_rwsem);</div><div class='ctx'> </div><div class='del'>-	dout("__destroy_snap_realm %p %llx\n", realm, realm-&gt;ino);</div><div class='add'>+	doutc(cl, "%p %llx\n", realm, realm-&gt;ino);</div><div class='ctx'> </div><div class='ctx'> 	rb_erase(&amp;realm-&gt;node, &amp;mdsc-&gt;snap_realms);</div><div class='ctx'> 	mdsc-&gt;num_snap_realms--;</div><div class='hunk'>@@ -260,9 +268,14 @@ static void __cleanup_empty_realms(struct ceph_mds_client *mdsc)</div><div class='ctx'> 	spin_unlock(&amp;mdsc-&gt;snap_empty_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void ceph_cleanup_empty_realms(struct ceph_mds_client *mdsc)</div><div class='add'>+void ceph_cleanup_global_and_empty_realms(struct ceph_mds_client *mdsc)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_snap_realm *global_realm;</div><div class='add'>+</div><div class='ctx'> 	down_write(&amp;mdsc-&gt;snap_rwsem);</div><div class='add'>+	global_realm = __lookup_snap_realm(mdsc, CEPH_INO_GLOBAL_SNAPREALM);</div><div class='add'>+	if (global_realm)</div><div class='add'>+		ceph_put_snap_realm(mdsc, global_realm);</div><div class='ctx'> 	__cleanup_empty_realms(mdsc);</div><div class='ctx'> 	up_write(&amp;mdsc-&gt;snap_rwsem);</div><div class='ctx'> }</div><div class='hunk'>@@ -279,6 +292,7 @@ static int adjust_snap_realm_parent(struct ceph_mds_client *mdsc,</div><div class='ctx'> 				    struct ceph_snap_realm *realm,</div><div class='ctx'> 				    u64 parentino)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_snap_realm *parent;</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held_write(&amp;mdsc-&gt;snap_rwsem);</div><div class='hunk'>@@ -292,9 +306,8 @@ static int adjust_snap_realm_parent(struct ceph_mds_client *mdsc,</div><div class='ctx'> 		if (IS_ERR(parent))</div><div class='ctx'> 			return PTR_ERR(parent);</div><div class='ctx'> 	}</div><div class='del'>-	dout("adjust_snap_realm_parent %llx %p: %llx %p -&gt; %llx %p\n",</div><div class='del'>-	     realm-&gt;ino, realm, realm-&gt;parent_ino, realm-&gt;parent,</div><div class='del'>-	     parentino, parent);</div><div class='add'>+	doutc(cl, "%llx %p: %llx %p -&gt; %llx %p\n", realm-&gt;ino, realm,</div><div class='add'>+	      realm-&gt;parent_ino, realm-&gt;parent, parentino, parent);</div><div class='ctx'> 	if (realm-&gt;parent) {</div><div class='ctx'> 		list_del_init(&amp;realm-&gt;child_item);</div><div class='ctx'> 		ceph_put_snap_realm(mdsc, realm-&gt;parent);</div><div class='hunk'>@@ -319,9 +332,12 @@ static int cmpu64_rev(const void *a, const void *b)</div><div class='ctx'> /*</div><div class='ctx'>  * build the snap context for a given realm.</div><div class='ctx'>  */</div><div class='del'>-static int build_snap_context(struct ceph_snap_realm *realm,</div><div class='del'>-			      struct list_head* dirty_realms)</div><div class='add'>+static int build_snap_context(struct ceph_mds_client *mdsc,</div><div class='add'>+			      struct ceph_snap_realm *realm,</div><div class='add'>+			      struct list_head *realm_queue,</div><div class='add'>+			      struct list_head *dirty_realms)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_snap_realm *parent = realm-&gt;parent;</div><div class='ctx'> 	struct ceph_snap_context *snapc;</div><div class='ctx'> 	int err = 0;</div><div class='hunk'>@@ -334,9 +350,9 @@ static int build_snap_context(struct ceph_snap_realm *realm,</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (parent) {</div><div class='ctx'> 		if (!parent-&gt;cached_context) {</div><div class='del'>-			err = build_snap_context(parent, dirty_realms);</div><div class='del'>-			if (err)</div><div class='del'>-				goto fail;</div><div class='add'>+			/* add to the queue head */</div><div class='add'>+			list_add(&amp;parent-&gt;rebuild_item, realm_queue);</div><div class='add'>+			return 1;</div><div class='ctx'> 		}</div><div class='ctx'> 		num += parent-&gt;cached_context-&gt;num_snaps;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -349,11 +365,10 @@ static int build_snap_context(struct ceph_snap_realm *realm,</div><div class='ctx'> 	    realm-&gt;cached_context-&gt;seq == realm-&gt;seq &amp;&amp;</div><div class='ctx'> 	    (!parent ||</div><div class='ctx'> 	     realm-&gt;cached_context-&gt;seq &gt;= parent-&gt;cached_context-&gt;seq)) {</div><div class='del'>-		dout("build_snap_context %llx %p: %p seq %lld (%u snaps)"</div><div class='del'>-		     " (unchanged)\n",</div><div class='del'>-		     realm-&gt;ino, realm, realm-&gt;cached_context,</div><div class='del'>-		     realm-&gt;cached_context-&gt;seq,</div><div class='del'>-		     (unsigned int)realm-&gt;cached_context-&gt;num_snaps);</div><div class='add'>+		doutc(cl, "%llx %p: %p seq %lld (%u snaps) (unchanged)\n",</div><div class='add'>+		      realm-&gt;ino, realm, realm-&gt;cached_context,</div><div class='add'>+		      realm-&gt;cached_context-&gt;seq,</div><div class='add'>+		      (unsigned int)realm-&gt;cached_context-&gt;num_snaps);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -390,9 +405,8 @@ static int build_snap_context(struct ceph_snap_realm *realm,</div><div class='ctx'> </div><div class='ctx'> 	sort(snapc-&gt;snaps, num, sizeof(u64), cmpu64_rev, NULL);</div><div class='ctx'> 	snapc-&gt;num_snaps = num;</div><div class='del'>-	dout("build_snap_context %llx %p: %p seq %lld (%u snaps)\n",</div><div class='del'>-	     realm-&gt;ino, realm, snapc, snapc-&gt;seq,</div><div class='del'>-	     (unsigned int) snapc-&gt;num_snaps);</div><div class='add'>+	doutc(cl, "%llx %p: %p seq %lld (%u snaps)\n", realm-&gt;ino, realm,</div><div class='add'>+	      snapc, snapc-&gt;seq, (unsigned int) snapc-&gt;num_snaps);</div><div class='ctx'> </div><div class='ctx'> 	ceph_put_snap_context(realm-&gt;cached_context);</div><div class='ctx'> 	realm-&gt;cached_context = snapc;</div><div class='hunk'>@@ -409,24 +423,63 @@ fail:</div><div class='ctx'> 		ceph_put_snap_context(realm-&gt;cached_context);</div><div class='ctx'> 		realm-&gt;cached_context = NULL;</div><div class='ctx'> 	}</div><div class='del'>-	pr_err("build_snap_context %llx %p fail %d\n", realm-&gt;ino,</div><div class='del'>-	       realm, err);</div><div class='add'>+	pr_err_client(cl, "%llx %p fail %d\n", realm-&gt;ino, realm, err);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * rebuild snap context for the given realm and all of its children.</div><div class='ctx'>  */</div><div class='del'>-static void rebuild_snap_realms(struct ceph_snap_realm *realm,</div><div class='add'>+static void rebuild_snap_realms(struct ceph_mds_client *mdsc,</div><div class='add'>+				struct ceph_snap_realm *realm,</div><div class='ctx'> 				struct list_head *dirty_realms)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_snap_realm *child;</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='add'>+	LIST_HEAD(realm_queue);</div><div class='add'>+	int last = 0;</div><div class='add'>+	bool skip = false;</div><div class='add'>+</div><div class='add'>+	list_add_tail(&amp;realm-&gt;rebuild_item, &amp;realm_queue);</div><div class='add'>+</div><div class='add'>+	while (!list_empty(&amp;realm_queue)) {</div><div class='add'>+		struct ceph_snap_realm *_realm, *child;</div><div class='add'>+</div><div class='add'>+		_realm = list_first_entry(&amp;realm_queue,</div><div class='add'>+					  struct ceph_snap_realm,</div><div class='add'>+					  rebuild_item);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * If the last building failed dues to memory</div><div class='add'>+		 * issue, just empty the realm_queue and return</div><div class='add'>+		 * to avoid infinite loop.</div><div class='add'>+		 */</div><div class='add'>+		if (last &lt; 0) {</div><div class='add'>+			list_del_init(&amp;_realm-&gt;rebuild_item);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		last = build_snap_context(mdsc, _realm, &amp;realm_queue,</div><div class='add'>+					  dirty_realms);</div><div class='add'>+		doutc(cl, "%llx %p, %s\n", realm-&gt;ino, realm,</div><div class='add'>+		      last &gt; 0 ? "is deferred" : !last ? "succeeded" : "failed");</div><div class='add'>+</div><div class='add'>+		/* is any child in the list ? */</div><div class='add'>+		list_for_each_entry(child, &amp;_realm-&gt;children, child_item) {</div><div class='add'>+			if (!list_empty(&amp;child-&gt;rebuild_item)) {</div><div class='add'>+				skip = true;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	dout("rebuild_snap_realms %llx %p\n", realm-&gt;ino, realm);</div><div class='del'>-	build_snap_context(realm, dirty_realms);</div><div class='add'>+		if (!skip) {</div><div class='add'>+			list_for_each_entry(child, &amp;_realm-&gt;children, child_item)</div><div class='add'>+				list_add_tail(&amp;child-&gt;rebuild_item, &amp;realm_queue);</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry(child, &amp;realm-&gt;children, child_item)</div><div class='del'>-		rebuild_snap_realms(child, dirty_realms);</div><div class='add'>+		/* last == 1 means need to build parent first */</div><div class='add'>+		if (last &lt;= 0)</div><div class='add'>+			list_del_init(&amp;_realm-&gt;rebuild_item);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> </div><div class='hunk'>@@ -474,23 +527,16 @@ static bool has_new_snaps(struct ceph_snap_context *o,</div><div class='ctx'>  * Caller must hold snap_rwsem for read (i.e., the realm topology won't</div><div class='ctx'>  * change).</div><div class='ctx'>  */</div><div class='del'>-static void ceph_queue_cap_snap(struct ceph_inode_info *ci)</div><div class='add'>+static void ceph_queue_cap_snap(struct ceph_inode_info *ci,</div><div class='add'>+				struct ceph_cap_snap **pcapsnap)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = &amp;ci-&gt;vfs_inode;</div><div class='del'>-	struct ceph_cap_snap *capsnap;</div><div class='add'>+	struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_snap_context *old_snapc, *new_snapc;</div><div class='add'>+	struct ceph_cap_snap *capsnap = *pcapsnap;</div><div class='ctx'> 	struct ceph_buffer *old_blob = NULL;</div><div class='ctx'> 	int used, dirty;</div><div class='ctx'> </div><div class='del'>-	capsnap = kzalloc(sizeof(*capsnap), GFP_NOFS);</div><div class='del'>-	if (!capsnap) {</div><div class='del'>-		pr_err("ENOMEM allocating ceph_cap_snap on %p\n", inode);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-	capsnap-&gt;cap_flush.is_capsnap = true;</div><div class='del'>-	INIT_LIST_HEAD(&amp;capsnap-&gt;cap_flush.i_list);</div><div class='del'>-	INIT_LIST_HEAD(&amp;capsnap-&gt;cap_flush.g_list);</div><div class='del'>-</div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 	used = __ceph_caps_used(ci);</div><div class='ctx'> 	dirty = __ceph_caps_dirty(ci);</div><div class='hunk'>@@ -511,12 +557,14 @@ static void ceph_queue_cap_snap(struct ceph_inode_info *ci)</div><div class='ctx'> 		   as no new writes are allowed to start when pending, so any</div><div class='ctx'> 		   writes in progress now were started before the previous</div><div class='ctx'> 		   cap_snap.  lucky us. */</div><div class='del'>-		dout("queue_cap_snap %p already pending\n", inode);</div><div class='add'>+		doutc(cl, "%p %llx.%llx already pending\n", inode,</div><div class='add'>+		      ceph_vinop(inode));</div><div class='ctx'> 		goto update_snapc;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (ci-&gt;i_wrbuffer_ref_head == 0 &amp;&amp;</div><div class='ctx'> 	    !(dirty &amp; (CEPH_CAP_ANY_EXCL|CEPH_CAP_FILE_WR))) {</div><div class='del'>-		dout("queue_cap_snap %p nothing dirty|writing\n", inode);</div><div class='add'>+		doutc(cl, "%p %llx.%llx nothing dirty|writing\n", inode,</div><div class='add'>+		      ceph_vinop(inode));</div><div class='ctx'> 		goto update_snapc;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -536,20 +584,17 @@ static void ceph_queue_cap_snap(struct ceph_inode_info *ci)</div><div class='ctx'> 	} else {</div><div class='ctx'> 		if (!(used &amp; CEPH_CAP_FILE_WR) &amp;&amp;</div><div class='ctx'> 		    ci-&gt;i_wrbuffer_ref_head == 0) {</div><div class='del'>-			dout("queue_cap_snap %p "</div><div class='del'>-			     "no new_snap|dirty_page|writing\n", inode);</div><div class='add'>+			doutc(cl, "%p %llx.%llx no new_snap|dirty_page|writing\n",</div><div class='add'>+			      inode, ceph_vinop(inode));</div><div class='ctx'> 			goto update_snapc;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("queue_cap_snap %p cap_snap %p queuing under %p %s %s\n",</div><div class='del'>-	     inode, capsnap, old_snapc, ceph_cap_string(dirty),</div><div class='del'>-	     capsnap-&gt;need_flush ? "" : "no_flush");</div><div class='add'>+	doutc(cl, "%p %llx.%llx cap_snap %p queuing under %p %s %s\n",</div><div class='add'>+	      inode, ceph_vinop(inode), capsnap, old_snapc,</div><div class='add'>+	      ceph_cap_string(dirty), capsnap-&gt;need_flush ? "" : "no_flush");</div><div class='ctx'> 	ihold(inode);</div><div class='ctx'> </div><div class='del'>-	refcount_set(&amp;capsnap-&gt;nref, 1);</div><div class='del'>-	INIT_LIST_HEAD(&amp;capsnap-&gt;ci_item);</div><div class='del'>-</div><div class='ctx'> 	capsnap-&gt;follows = old_snapc-&gt;seq;</div><div class='ctx'> 	capsnap-&gt;issued = __ceph_caps_issued(ci, NULL);</div><div class='ctx'> 	capsnap-&gt;dirty = dirty;</div><div class='hunk'>@@ -579,31 +624,30 @@ static void ceph_queue_cap_snap(struct ceph_inode_info *ci)</div><div class='ctx'> 	list_add_tail(&amp;capsnap-&gt;ci_item, &amp;ci-&gt;i_cap_snaps);</div><div class='ctx'> </div><div class='ctx'> 	if (used &amp; CEPH_CAP_FILE_WR) {</div><div class='del'>-		dout("queue_cap_snap %p cap_snap %p snapc %p"</div><div class='del'>-		     " seq %llu used WR, now pending\n", inode,</div><div class='del'>-		     capsnap, old_snapc, old_snapc-&gt;seq);</div><div class='add'>+		doutc(cl, "%p %llx.%llx cap_snap %p snapc %p seq %llu used WR,"</div><div class='add'>+		      " now pending\n", inode, ceph_vinop(inode), capsnap,</div><div class='add'>+		      old_snapc, old_snapc-&gt;seq);</div><div class='ctx'> 		capsnap-&gt;writing = 1;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		/* note mtime, size NOW. */</div><div class='ctx'> 		__ceph_finish_cap_snap(ci, capsnap);</div><div class='ctx'> 	}</div><div class='del'>-	capsnap = NULL;</div><div class='add'>+	*pcapsnap = NULL;</div><div class='ctx'> 	old_snapc = NULL;</div><div class='ctx'> </div><div class='ctx'> update_snapc:</div><div class='del'>-       if (ci-&gt;i_wrbuffer_ref_head == 0 &amp;&amp;</div><div class='del'>-           ci-&gt;i_wr_ref == 0 &amp;&amp;</div><div class='del'>-           ci-&gt;i_dirty_caps == 0 &amp;&amp;</div><div class='del'>-           ci-&gt;i_flushing_caps == 0) {</div><div class='del'>-               ci-&gt;i_head_snapc = NULL;</div><div class='del'>-       } else {</div><div class='add'>+	if (ci-&gt;i_wrbuffer_ref_head == 0 &amp;&amp;</div><div class='add'>+	    ci-&gt;i_wr_ref == 0 &amp;&amp;</div><div class='add'>+	    ci-&gt;i_dirty_caps == 0 &amp;&amp;</div><div class='add'>+	    ci-&gt;i_flushing_caps == 0) {</div><div class='add'>+		ci-&gt;i_head_snapc = NULL;</div><div class='add'>+	} else {</div><div class='ctx'> 		ci-&gt;i_head_snapc = ceph_get_snap_context(new_snapc);</div><div class='del'>-		dout(" new snapc is %p\n", new_snapc);</div><div class='add'>+		doutc(cl, " new snapc is %p\n", new_snapc);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> </div><div class='ctx'> 	ceph_buffer_put(old_blob);</div><div class='del'>-	kfree(capsnap);</div><div class='ctx'> 	ceph_put_snap_context(old_snapc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -618,47 +662,55 @@ update_snapc:</div><div class='ctx'> int __ceph_finish_cap_snap(struct ceph_inode_info *ci,</div><div class='ctx'> 			    struct ceph_cap_snap *capsnap)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = &amp;ci-&gt;vfs_inode;</div><div class='add'>+	struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='ctx'> 	struct ceph_mds_client *mdsc = ceph_sb_to_mdsc(inode-&gt;i_sb);</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(capsnap-&gt;writing);</div><div class='ctx'> 	capsnap-&gt;size = i_size_read(inode);</div><div class='del'>-	capsnap-&gt;mtime = inode-&gt;i_mtime;</div><div class='del'>-	capsnap-&gt;atime = inode-&gt;i_atime;</div><div class='del'>-	capsnap-&gt;ctime = inode-&gt;i_ctime;</div><div class='add'>+	capsnap-&gt;mtime = inode_get_mtime(inode);</div><div class='add'>+	capsnap-&gt;atime = inode_get_atime(inode);</div><div class='add'>+	capsnap-&gt;ctime = inode_get_ctime(inode);</div><div class='ctx'> 	capsnap-&gt;btime = ci-&gt;i_btime;</div><div class='ctx'> 	capsnap-&gt;change_attr = inode_peek_iversion_raw(inode);</div><div class='ctx'> 	capsnap-&gt;time_warp_seq = ci-&gt;i_time_warp_seq;</div><div class='ctx'> 	capsnap-&gt;truncate_size = ci-&gt;i_truncate_size;</div><div class='ctx'> 	capsnap-&gt;truncate_seq = ci-&gt;i_truncate_seq;</div><div class='ctx'> 	if (capsnap-&gt;dirty_pages) {</div><div class='del'>-		dout("finish_cap_snap %p cap_snap %p snapc %p %llu %s s=%llu "</div><div class='del'>-		     "still has %d dirty pages\n", inode, capsnap,</div><div class='del'>-		     capsnap-&gt;context, capsnap-&gt;context-&gt;seq,</div><div class='del'>-		     ceph_cap_string(capsnap-&gt;dirty), capsnap-&gt;size,</div><div class='del'>-		     capsnap-&gt;dirty_pages);</div><div class='add'>+		doutc(cl, "%p %llx.%llx cap_snap %p snapc %p %llu %s "</div><div class='add'>+		      "s=%llu still has %d dirty pages\n", inode,</div><div class='add'>+		      ceph_vinop(inode), capsnap, capsnap-&gt;context,</div><div class='add'>+		      capsnap-&gt;context-&gt;seq,</div><div class='add'>+		      ceph_cap_string(capsnap-&gt;dirty),</div><div class='add'>+		      capsnap-&gt;size, capsnap-&gt;dirty_pages);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Fb cap still in use, delay it */</div><div class='del'>-	if (ci-&gt;i_wb_ref) {</div><div class='del'>-		dout("finish_cap_snap %p cap_snap %p snapc %p %llu %s s=%llu "</div><div class='del'>-		     "used WRBUFFER, delaying\n", inode, capsnap,</div><div class='del'>-		     capsnap-&gt;context, capsnap-&gt;context-&gt;seq,</div><div class='del'>-		     ceph_cap_string(capsnap-&gt;dirty), capsnap-&gt;size);</div><div class='del'>-		capsnap-&gt;writing = 1;</div><div class='add'>+	/*</div><div class='add'>+	 * Defer flushing the capsnap if the dirty buffer not flushed yet.</div><div class='add'>+	 * And trigger to flush the buffer immediately.</div><div class='add'>+	 */</div><div class='add'>+	if (ci-&gt;i_wrbuffer_ref) {</div><div class='add'>+		doutc(cl, "%p %llx.%llx cap_snap %p snapc %p %llu %s "</div><div class='add'>+		      "s=%llu used WRBUFFER, delaying\n", inode,</div><div class='add'>+		      ceph_vinop(inode), capsnap, capsnap-&gt;context,</div><div class='add'>+		      capsnap-&gt;context-&gt;seq, ceph_cap_string(capsnap-&gt;dirty),</div><div class='add'>+		      capsnap-&gt;size);</div><div class='add'>+		ceph_queue_writeback(inode);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ci-&gt;i_ceph_flags |= CEPH_I_FLUSH_SNAPS;</div><div class='del'>-	dout("finish_cap_snap %p cap_snap %p snapc %p %llu %s s=%llu\n",</div><div class='del'>-	     inode, capsnap, capsnap-&gt;context,</div><div class='del'>-	     capsnap-&gt;context-&gt;seq, ceph_cap_string(capsnap-&gt;dirty),</div><div class='del'>-	     capsnap-&gt;size);</div><div class='add'>+	doutc(cl, "%p %llx.%llx cap_snap %p snapc %p %llu %s s=%llu\n",</div><div class='add'>+	      inode, ceph_vinop(inode), capsnap, capsnap-&gt;context,</div><div class='add'>+	      capsnap-&gt;context-&gt;seq, ceph_cap_string(capsnap-&gt;dirty),</div><div class='add'>+	      capsnap-&gt;size);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;mdsc-&gt;snap_flush_lock);</div><div class='del'>-	if (list_empty(&amp;ci-&gt;i_snap_flush_item))</div><div class='add'>+	if (list_empty(&amp;ci-&gt;i_snap_flush_item)) {</div><div class='add'>+		ihold(inode);</div><div class='ctx'> 		list_add_tail(&amp;ci-&gt;i_snap_flush_item, &amp;mdsc-&gt;snap_flush_list);</div><div class='add'>+	}</div><div class='ctx'> 	spin_unlock(&amp;mdsc-&gt;snap_flush_lock);</div><div class='ctx'> 	return 1;  /* caller may want to ceph_flush_snaps */</div><div class='ctx'> }</div><div class='hunk'>@@ -667,28 +719,54 @@ int __ceph_finish_cap_snap(struct ceph_inode_info *ci,</div><div class='ctx'>  * Queue cap_snaps for snap writeback for this realm and its children.</div><div class='ctx'>  * Called under snap_rwsem, so realm topology won't change.</div><div class='ctx'>  */</div><div class='del'>-static void queue_realm_cap_snaps(struct ceph_snap_realm *realm)</div><div class='add'>+static void queue_realm_cap_snaps(struct ceph_mds_client *mdsc,</div><div class='add'>+				  struct ceph_snap_realm *realm)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_inode_info *ci;</div><div class='ctx'> 	struct inode *lastinode = NULL;</div><div class='add'>+	struct ceph_cap_snap *capsnap = NULL;</div><div class='ctx'> </div><div class='del'>-	dout("queue_realm_cap_snaps %p %llx inodes\n", realm, realm-&gt;ino);</div><div class='add'>+	doutc(cl, "%p %llx inode\n", realm, realm-&gt;ino);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;realm-&gt;inodes_with_caps_lock);</div><div class='ctx'> 	list_for_each_entry(ci, &amp;realm-&gt;inodes_with_caps, i_snap_realm_item) {</div><div class='del'>-		struct inode *inode = igrab(&amp;ci-&gt;vfs_inode);</div><div class='add'>+		struct inode *inode = igrab(&amp;ci-&gt;netfs.inode);</div><div class='ctx'> 		if (!inode)</div><div class='ctx'> 			continue;</div><div class='ctx'> 		spin_unlock(&amp;realm-&gt;inodes_with_caps_lock);</div><div class='ctx'> 		iput(lastinode);</div><div class='ctx'> 		lastinode = inode;</div><div class='del'>-		ceph_queue_cap_snap(ci);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Allocate the capsnap memory outside of ceph_queue_cap_snap()</div><div class='add'>+		 * to reduce very possible but unnecessary frequently memory</div><div class='add'>+		 * allocate/free in this loop.</div><div class='add'>+		 */</div><div class='add'>+		if (!capsnap) {</div><div class='add'>+			capsnap = kmem_cache_zalloc(ceph_cap_snap_cachep, GFP_NOFS);</div><div class='add'>+			if (!capsnap) {</div><div class='add'>+				pr_err_client(cl,</div><div class='add'>+					"ENOMEM allocating ceph_cap_snap on %p\n",</div><div class='add'>+					inode);</div><div class='add'>+				return;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+		capsnap-&gt;cap_flush.is_capsnap = true;</div><div class='add'>+		refcount_set(&amp;capsnap-&gt;nref, 1);</div><div class='add'>+		INIT_LIST_HEAD(&amp;capsnap-&gt;cap_flush.i_list);</div><div class='add'>+		INIT_LIST_HEAD(&amp;capsnap-&gt;cap_flush.g_list);</div><div class='add'>+		INIT_LIST_HEAD(&amp;capsnap-&gt;ci_item);</div><div class='add'>+</div><div class='add'>+		ceph_queue_cap_snap(ci, &amp;capsnap);</div><div class='ctx'> 		spin_lock(&amp;realm-&gt;inodes_with_caps_lock);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;realm-&gt;inodes_with_caps_lock);</div><div class='ctx'> 	iput(lastinode);</div><div class='ctx'> </div><div class='del'>-	dout("queue_realm_cap_snaps %p %llx done\n", realm, realm-&gt;ino);</div><div class='add'>+	if (capsnap)</div><div class='add'>+		kmem_cache_free(ceph_cap_snap_cachep, capsnap);</div><div class='add'>+	doutc(cl, "%p %llx done\n", realm, realm-&gt;ino);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -702,19 +780,25 @@ int ceph_update_snap_trace(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			   void *p, void *e, bool deletion,</div><div class='ctx'> 			   struct ceph_snap_realm **realm_ret)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_mds_snap_realm *ri;    /* encoded */</div><div class='ctx'> 	__le64 *snaps;                     /* encoded */</div><div class='ctx'> 	__le64 *prior_parent_snaps;        /* encoded */</div><div class='del'>-	struct ceph_snap_realm *realm = NULL;</div><div class='add'>+	struct ceph_snap_realm *realm;</div><div class='ctx'> 	struct ceph_snap_realm *first_realm = NULL;</div><div class='del'>-	int invalidate = 0;</div><div class='add'>+	struct ceph_snap_realm *realm_to_rebuild = NULL;</div><div class='add'>+	struct ceph_client *client = mdsc-&gt;fsc-&gt;client;</div><div class='add'>+	int rebuild_snapcs;</div><div class='ctx'> 	int err = -ENOMEM;</div><div class='add'>+	int ret;</div><div class='ctx'> 	LIST_HEAD(dirty_realms);</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held_write(&amp;mdsc-&gt;snap_rwsem);</div><div class='ctx'> </div><div class='del'>-	dout("update_snap_trace deletion=%d\n", deletion);</div><div class='add'>+	doutc(cl, "deletion=%d\n", deletion);</div><div class='ctx'> more:</div><div class='add'>+	realm = NULL;</div><div class='add'>+	rebuild_snapcs = 0;</div><div class='ctx'> 	ceph_decode_need(&amp;p, e, sizeof(*ri), bad);</div><div class='ctx'> 	ri = p;</div><div class='ctx'> 	p += sizeof(*ri);</div><div class='hunk'>@@ -738,11 +822,11 @@ more:</div><div class='ctx'> 	err = adjust_snap_realm_parent(mdsc, realm, le64_to_cpu(ri-&gt;parent));</div><div class='ctx'> 	if (err &lt; 0)</div><div class='ctx'> 		goto fail;</div><div class='del'>-	invalidate += err;</div><div class='add'>+	rebuild_snapcs += err;</div><div class='ctx'> </div><div class='ctx'> 	if (le64_to_cpu(ri-&gt;seq) &gt; realm-&gt;seq) {</div><div class='del'>-		dout("update_snap_trace updating %llx %p %lld -&gt; %lld\n",</div><div class='del'>-		     realm-&gt;ino, realm, realm-&gt;seq, le64_to_cpu(ri-&gt;seq));</div><div class='add'>+		doutc(cl, "updating %llx %p %lld -&gt; %lld\n", realm-&gt;ino,</div><div class='add'>+		      realm, realm-&gt;seq, le64_to_cpu(ri-&gt;seq));</div><div class='ctx'> 		/* update realm parameters, snap lists */</div><div class='ctx'> 		realm-&gt;seq = le64_to_cpu(ri-&gt;seq);</div><div class='ctx'> 		realm-&gt;created = le64_to_cpu(ri-&gt;created);</div><div class='hunk'>@@ -763,22 +847,30 @@ more:</div><div class='ctx'> 		if (realm-&gt;seq &gt; mdsc-&gt;last_snap_seq)</div><div class='ctx'> 			mdsc-&gt;last_snap_seq = realm-&gt;seq;</div><div class='ctx'> </div><div class='del'>-		invalidate = 1;</div><div class='add'>+		rebuild_snapcs = 1;</div><div class='ctx'> 	} else if (!realm-&gt;cached_context) {</div><div class='del'>-		dout("update_snap_trace %llx %p seq %lld new\n",</div><div class='del'>-		     realm-&gt;ino, realm, realm-&gt;seq);</div><div class='del'>-		invalidate = 1;</div><div class='add'>+		doutc(cl, "%llx %p seq %lld new\n", realm-&gt;ino, realm,</div><div class='add'>+		      realm-&gt;seq);</div><div class='add'>+		rebuild_snapcs = 1;</div><div class='ctx'> 	} else {</div><div class='del'>-		dout("update_snap_trace %llx %p seq %lld unchanged\n",</div><div class='del'>-		     realm-&gt;ino, realm, realm-&gt;seq);</div><div class='add'>+		doutc(cl, "%llx %p seq %lld unchanged\n", realm-&gt;ino, realm,</div><div class='add'>+		      realm-&gt;seq);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("done with %llx %p, invalidated=%d, %p %p\n", realm-&gt;ino,</div><div class='del'>-	     realm, invalidate, p, e);</div><div class='add'>+	doutc(cl, "done with %llx %p, rebuild_snapcs=%d, %p %p\n", realm-&gt;ino,</div><div class='add'>+	      realm, rebuild_snapcs, p, e);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * this will always track the uppest parent realm from which</div><div class='add'>+	 * we need to rebuild the snapshot contexts _downward_ in</div><div class='add'>+	 * hierarchy.</div><div class='add'>+	 */</div><div class='add'>+	if (rebuild_snapcs)</div><div class='add'>+		realm_to_rebuild = realm;</div><div class='ctx'> </div><div class='del'>-	/* invalidate when we reach the _end_ (root) of the trace */</div><div class='del'>-	if (invalidate &amp;&amp; p &gt;= e)</div><div class='del'>-		rebuild_snap_realms(realm, &amp;dirty_realms);</div><div class='add'>+	/* rebuild_snapcs when we reach the _end_ (root) of the trace */</div><div class='add'>+	if (realm_to_rebuild &amp;&amp; p &gt;= e)</div><div class='add'>+		rebuild_snap_realms(mdsc, realm_to_rebuild, &amp;dirty_realms);</div><div class='ctx'> </div><div class='ctx'> 	if (!first_realm)</div><div class='ctx'> 		first_realm = realm;</div><div class='hunk'>@@ -796,7 +888,7 @@ more:</div><div class='ctx'> 		realm = list_first_entry(&amp;dirty_realms, struct ceph_snap_realm,</div><div class='ctx'> 					 dirty_item);</div><div class='ctx'> 		list_del_init(&amp;realm-&gt;dirty_item);</div><div class='del'>-		queue_realm_cap_snaps(realm);</div><div class='add'>+		queue_realm_cap_snaps(mdsc, realm);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (realm_ret)</div><div class='hunk'>@@ -814,7 +906,29 @@ fail:</div><div class='ctx'> 		ceph_put_snap_realm(mdsc, realm);</div><div class='ctx'> 	if (first_realm)</div><div class='ctx'> 		ceph_put_snap_realm(mdsc, first_realm);</div><div class='del'>-	pr_err("update_snap_trace error %d\n", err);</div><div class='add'>+	pr_err_client(cl, "error %d\n", err);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * When receiving a corrupted snap trace we don't know what</div><div class='add'>+	 * exactly has happened in MDS side. And we shouldn't continue</div><div class='add'>+	 * writing to OSD, which may corrupt the snapshot contents.</div><div class='add'>+	 *</div><div class='add'>+	 * Just try to blocklist this kclient and then this kclient</div><div class='add'>+	 * must be remounted to continue after the corrupted metadata</div><div class='add'>+	 * fixed in the MDS side.</div><div class='add'>+	 */</div><div class='add'>+	WRITE_ONCE(mdsc-&gt;fsc-&gt;mount_state, CEPH_MOUNT_FENCE_IO);</div><div class='add'>+	ret = ceph_monc_blocklist_add(&amp;client-&gt;monc, &amp;client-&gt;msgr.inst.addr);</div><div class='add'>+	if (ret)</div><div class='add'>+		pr_err_client(cl, "failed to blocklist %s: %d\n",</div><div class='add'>+			      ceph_pr_addr(&amp;client-&gt;msgr.inst.addr), ret);</div><div class='add'>+</div><div class='add'>+	WARN(1, "[client.%lld] %s %s%sdo remount to continue%s",</div><div class='add'>+	     client-&gt;monc.auth-&gt;global_id, __func__,</div><div class='add'>+	     ret ? "" : ceph_pr_addr(&amp;client-&gt;msgr.inst.addr),</div><div class='add'>+	     ret ? "" : " was blocklisted, ",</div><div class='add'>+	     err == -EIO ? " after corrupted snaptrace is fixed" : "");</div><div class='add'>+</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -827,16 +941,17 @@ fail:</div><div class='ctx'>  */</div><div class='ctx'> static void flush_snaps(struct ceph_mds_client *mdsc)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_inode_info *ci;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct ceph_mds_session *session = NULL;</div><div class='ctx'> </div><div class='del'>-	dout("flush_snaps\n");</div><div class='add'>+	doutc(cl, "begin\n");</div><div class='ctx'> 	spin_lock(&amp;mdsc-&gt;snap_flush_lock);</div><div class='ctx'> 	while (!list_empty(&amp;mdsc-&gt;snap_flush_list)) {</div><div class='ctx'> 		ci = list_first_entry(&amp;mdsc-&gt;snap_flush_list,</div><div class='ctx'> 				struct ceph_inode_info, i_snap_flush_item);</div><div class='del'>-		inode = &amp;ci-&gt;vfs_inode;</div><div class='add'>+		inode = &amp;ci-&gt;netfs.inode;</div><div class='ctx'> 		ihold(inode);</div><div class='ctx'> 		spin_unlock(&amp;mdsc-&gt;snap_flush_lock);</div><div class='ctx'> 		ceph_flush_snaps(ci, &amp;session);</div><div class='hunk'>@@ -846,7 +961,7 @@ static void flush_snaps(struct ceph_mds_client *mdsc)</div><div class='ctx'> 	spin_unlock(&amp;mdsc-&gt;snap_flush_lock);</div><div class='ctx'> </div><div class='ctx'> 	ceph_put_mds_session(session);</div><div class='del'>-	dout("flush_snaps done\n");</div><div class='add'>+	doutc(cl, "done\n");</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -862,7 +977,7 @@ static void flush_snaps(struct ceph_mds_client *mdsc)</div><div class='ctx'> void ceph_change_snap_realm(struct inode *inode, struct ceph_snap_realm *realm)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	struct ceph_mds_client *mdsc = ceph_inode_to_client(inode)-&gt;mdsc;</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_inode_to_fs_client(inode)-&gt;mdsc;</div><div class='ctx'> 	struct ceph_snap_realm *oldrealm = ci-&gt;i_snap_realm;</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;ci-&gt;i_ceph_lock);</div><div class='hunk'>@@ -902,6 +1017,7 @@ void ceph_handle_snap(struct ceph_mds_client *mdsc,</div><div class='ctx'> 		      struct ceph_mds_session *session,</div><div class='ctx'> 		      struct ceph_msg *msg)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct super_block *sb = mdsc-&gt;fsc-&gt;sb;</div><div class='ctx'> 	int mds = session-&gt;s_mds;</div><div class='ctx'> 	u64 split;</div><div class='hunk'>@@ -915,6 +1031,10 @@ void ceph_handle_snap(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	__le64 *split_inos = NULL, *split_realms = NULL;</div><div class='ctx'> 	int i;</div><div class='ctx'> 	int locked_rwsem = 0;</div><div class='add'>+	bool close_sessions = false;</div><div class='add'>+</div><div class='add'>+	if (!ceph_inc_mds_stopping_blocker(mdsc, session))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='ctx'> 	/* decode */</div><div class='ctx'> 	if (msg-&gt;front.iov_len &lt; sizeof(*h))</div><div class='hunk'>@@ -928,12 +1048,8 @@ void ceph_handle_snap(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	trace_len = le32_to_cpu(h-&gt;trace_len);</div><div class='ctx'> 	p += sizeof(*h);</div><div class='ctx'> </div><div class='del'>-	dout("handle_snap from mds%d op %s split %llx tracelen %d\n", mds,</div><div class='del'>-	     ceph_snap_op_name(op), split, trace_len);</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;session-&gt;s_mutex);</div><div class='del'>-	inc_session_sequence(session);</div><div class='del'>-	mutex_unlock(&amp;session-&gt;s_mutex);</div><div class='add'>+	doutc(cl, "from mds%d op %s split %llx tracelen %d\n", mds,</div><div class='add'>+	      ceph_snap_op_name(op), split, trace_len);</div><div class='ctx'> </div><div class='ctx'> 	down_write(&amp;mdsc-&gt;snap_rwsem);</div><div class='ctx'> 	locked_rwsem = 1;</div><div class='hunk'>@@ -964,7 +1080,7 @@ void ceph_handle_snap(struct ceph_mds_client *mdsc,</div><div class='ctx'> 				goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		dout("splitting snap_realm %llx %p\n", realm-&gt;ino, realm);</div><div class='add'>+		doutc(cl, "splitting snap_realm %llx %p\n", realm-&gt;ino, realm);</div><div class='ctx'> 		for (i = 0; i &lt; num_split_inos; i++) {</div><div class='ctx'> 			struct ceph_vino vino = {</div><div class='ctx'> 				.ino = le64_to_cpu(split_inos[i]),</div><div class='hunk'>@@ -989,13 +1105,13 @@ void ceph_handle_snap(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			 */</div><div class='ctx'> 			if (ci-&gt;i_snap_realm-&gt;created &gt;</div><div class='ctx'> 			    le64_to_cpu(ri-&gt;created)) {</div><div class='del'>-				dout(" leaving %p in newer realm %llx %p\n",</div><div class='del'>-				     inode, ci-&gt;i_snap_realm-&gt;ino,</div><div class='del'>-				     ci-&gt;i_snap_realm);</div><div class='add'>+				doutc(cl, " leaving %p %llx.%llx in newer realm %llx %p\n",</div><div class='add'>+				      inode, ceph_vinop(inode), ci-&gt;i_snap_realm-&gt;ino,</div><div class='add'>+				      ci-&gt;i_snap_realm);</div><div class='ctx'> 				goto skip_inode;</div><div class='ctx'> 			}</div><div class='del'>-			dout(" will move %p to split realm %llx %p\n",</div><div class='del'>-			     inode, realm-&gt;ino, realm);</div><div class='add'>+			doutc(cl, " will move %p %llx.%llx to split realm %llx %p\n",</div><div class='add'>+			      inode, ceph_vinop(inode), realm-&gt;ino, realm);</div><div class='ctx'> </div><div class='ctx'> 			ceph_get_snap_realm(mdsc, realm);</div><div class='ctx'> 			ceph_change_snap_realm(inode, realm);</div><div class='hunk'>@@ -1017,14 +1133,31 @@ skip_inode:</div><div class='ctx'> 				continue;</div><div class='ctx'> 			adjust_snap_realm_parent(mdsc, child, realm-&gt;ino);</div><div class='ctx'> 		}</div><div class='add'>+	} else {</div><div class='add'>+		/*</div><div class='add'>+		 * In the non-split case both 'num_split_inos' and</div><div class='add'>+		 * 'num_split_realms' should be 0, making this a no-op.</div><div class='add'>+		 * However the MDS happens to populate 'split_realms' list</div><div class='add'>+		 * in one of the UPDATE op cases by mistake.</div><div class='add'>+		 *</div><div class='add'>+		 * Skip both lists just in case to ensure that 'p' is</div><div class='add'>+		 * positioned at the start of realm info, as expected by</div><div class='add'>+		 * ceph_update_snap_trace().</div><div class='add'>+		 */</div><div class='add'>+		p += sizeof(u64) * num_split_inos;</div><div class='add'>+		p += sizeof(u64) * num_split_realms;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * update using the provided snap trace. if we are deleting a</div><div class='ctx'> 	 * snap, we can avoid queueing cap_snaps.</div><div class='ctx'> 	 */</div><div class='del'>-	ceph_update_snap_trace(mdsc, p, e,</div><div class='del'>-			       op == CEPH_SNAP_OP_DESTROY, NULL);</div><div class='add'>+	if (ceph_update_snap_trace(mdsc, p, e,</div><div class='add'>+				   op == CEPH_SNAP_OP_DESTROY,</div><div class='add'>+				   NULL)) {</div><div class='add'>+		close_sessions = true;</div><div class='add'>+		goto bad;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (op == CEPH_SNAP_OP_SPLIT)</div><div class='ctx'> 		/* we took a reference when we created the realm, above */</div><div class='hunk'>@@ -1035,20 +1168,27 @@ skip_inode:</div><div class='ctx'> 	up_write(&amp;mdsc-&gt;snap_rwsem);</div><div class='ctx'> </div><div class='ctx'> 	flush_snaps(mdsc);</div><div class='add'>+	ceph_dec_mds_stopping_blocker(mdsc);</div><div class='ctx'> 	return;</div><div class='ctx'> </div><div class='ctx'> bad:</div><div class='del'>-	pr_err("corrupt snap message from mds%d\n", mds);</div><div class='add'>+	pr_err_client(cl, "corrupt snap message from mds%d\n", mds);</div><div class='ctx'> 	ceph_msg_dump(msg);</div><div class='ctx'> out:</div><div class='ctx'> 	if (locked_rwsem)</div><div class='ctx'> 		up_write(&amp;mdsc-&gt;snap_rwsem);</div><div class='add'>+</div><div class='add'>+	ceph_dec_mds_stopping_blocker(mdsc);</div><div class='add'>+</div><div class='add'>+	if (close_sessions)</div><div class='add'>+		ceph_mdsc_close_sessions(mdsc);</div><div class='ctx'> 	return;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct ceph_snapid_map* ceph_get_snapid_map(struct ceph_mds_client *mdsc,</div><div class='ctx'> 					    u64 snap)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_snapid_map *sm, *exist;</div><div class='ctx'> 	struct rb_node **p, *parent;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -1071,7 +1211,8 @@ struct ceph_snapid_map* ceph_get_snapid_map(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;mdsc-&gt;snapid_map_lock);</div><div class='ctx'> 	if (exist) {</div><div class='del'>-		dout("found snapid map %llx -&gt; %x\n", exist-&gt;snap, exist-&gt;dev);</div><div class='add'>+		doutc(cl, "found snapid map %llx -&gt; %x\n", exist-&gt;snap,</div><div class='add'>+		      exist-&gt;dev);</div><div class='ctx'> 		return exist;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1115,11 +1256,12 @@ struct ceph_snapid_map* ceph_get_snapid_map(struct ceph_mds_client *mdsc,</div><div class='ctx'> 	if (exist) {</div><div class='ctx'> 		free_anon_bdev(sm-&gt;dev);</div><div class='ctx'> 		kfree(sm);</div><div class='del'>-		dout("found snapid map %llx -&gt; %x\n", exist-&gt;snap, exist-&gt;dev);</div><div class='add'>+		doutc(cl, "found snapid map %llx -&gt; %x\n", exist-&gt;snap,</div><div class='add'>+		      exist-&gt;dev);</div><div class='ctx'> 		return exist;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("create snapid map %llx -&gt; %x\n", sm-&gt;snap, sm-&gt;dev);</div><div class='add'>+	doutc(cl, "create snapid map %llx -&gt; %x\n", sm-&gt;snap, sm-&gt;dev);</div><div class='ctx'> 	return sm;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1144,6 +1286,7 @@ void ceph_put_snapid_map(struct ceph_mds_client* mdsc,</div><div class='ctx'> </div><div class='ctx'> void ceph_trim_snapid_map(struct ceph_mds_client *mdsc)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_snapid_map *sm;</div><div class='ctx'> 	unsigned long now;</div><div class='ctx'> 	LIST_HEAD(to_free);</div><div class='hunk'>@@ -1165,7 +1308,7 @@ void ceph_trim_snapid_map(struct ceph_mds_client *mdsc)</div><div class='ctx'> 	while (!list_empty(&amp;to_free)) {</div><div class='ctx'> 		sm = list_first_entry(&amp;to_free, struct ceph_snapid_map, lru);</div><div class='ctx'> 		list_del(&amp;sm-&gt;lru);</div><div class='del'>-		dout("trim snapid map %llx -&gt; %x\n", sm-&gt;snap, sm-&gt;dev);</div><div class='add'>+		doutc(cl, "trim snapid map %llx -&gt; %x\n", sm-&gt;snap, sm-&gt;dev);</div><div class='ctx'> 		free_anon_bdev(sm-&gt;dev);</div><div class='ctx'> 		kfree(sm);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1173,6 +1316,7 @@ void ceph_trim_snapid_map(struct ceph_mds_client *mdsc)</div><div class='ctx'> </div><div class='ctx'> void ceph_cleanup_snapid_map(struct ceph_mds_client *mdsc)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = mdsc-&gt;fsc-&gt;client;</div><div class='ctx'> 	struct ceph_snapid_map *sm;</div><div class='ctx'> 	struct rb_node *p;</div><div class='ctx'> 	LIST_HEAD(to_free);</div><div class='hunk'>@@ -1191,8 +1335,8 @@ void ceph_cleanup_snapid_map(struct ceph_mds_client *mdsc)</div><div class='ctx'> 		list_del(&amp;sm-&gt;lru);</div><div class='ctx'> 		free_anon_bdev(sm-&gt;dev);</div><div class='ctx'> 		if (WARN_ON_ONCE(atomic_read(&amp;sm-&gt;ref))) {</div><div class='del'>-			pr_err("snapid map %llx -&gt; %x still in use\n",</div><div class='del'>-			       sm-&gt;snap, sm-&gt;dev);</div><div class='add'>+			pr_err_client(cl, "snapid map %llx -&gt; %x still in use\n",</div><div class='add'>+				      sm-&gt;snap, sm-&gt;dev);</div><div class='ctx'> 		}</div><div class='ctx'> 		kfree(sm);</div><div class='ctx'> 	}</div><div class='head'>diff --git a/fs/ceph/strings.c b/fs/ceph/strings.c<br/>index 573bb9556fb5..e36e8948e728 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ceph/strings.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/strings.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/strings.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/strings.c</a></div><div class='hunk'>@@ -60,6 +60,7 @@ const char *ceph_mds_op_name(int op)</div><div class='ctx'> 	case CEPH_MDS_OP_LOOKUPINO:  return "lookupino";</div><div class='ctx'> 	case CEPH_MDS_OP_LOOKUPNAME:  return "lookupname";</div><div class='ctx'> 	case CEPH_MDS_OP_GETATTR:  return "getattr";</div><div class='add'>+	case CEPH_MDS_OP_GETVXATTR:  return "getvxattr";</div><div class='ctx'> 	case CEPH_MDS_OP_SETXATTR: return "setxattr";</div><div class='ctx'> 	case CEPH_MDS_OP_SETATTR: return "setattr";</div><div class='ctx'> 	case CEPH_MDS_OP_RMXATTR: return "rmxattr";</div><div class='head'>diff --git a/fs/ceph/super.c b/fs/ceph/super.c<br/>index fd8742bae847..f6bf24b5c683 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ceph/super.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/super.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/super.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/super.c</a></div><div class='hunk'>@@ -20,6 +20,7 @@</div><div class='ctx'> #include "super.h"</div><div class='ctx'> #include "mds_client.h"</div><div class='ctx'> #include "cache.h"</div><div class='add'>+#include "crypto.h"</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/ceph/ceph_features.h&gt;</div><div class='ctx'> #include &lt;linux/ceph/decode.h&gt;</div><div class='hunk'>@@ -27,6 +28,8 @@</div><div class='ctx'> #include &lt;linux/ceph/auth.h&gt;</div><div class='ctx'> #include &lt;linux/ceph/debugfs.h&gt;</div><div class='ctx'> </div><div class='add'>+#include &lt;uapi/linux/magic.h&gt;</div><div class='add'>+</div><div class='ctx'> static DEFINE_SPINLOCK(ceph_fsc_lock);</div><div class='ctx'> static LIST_HEAD(ceph_fsc_list);</div><div class='ctx'> </div><div class='hunk'>@@ -41,28 +44,29 @@ static LIST_HEAD(ceph_fsc_list);</div><div class='ctx'>  */</div><div class='ctx'> static void ceph_put_super(struct super_block *s)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_sb_to_client(s);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_sb_to_fs_client(s);</div><div class='ctx'> </div><div class='del'>-	dout("put_super\n");</div><div class='add'>+	doutc(fsc-&gt;client, "begin\n");</div><div class='add'>+	ceph_fscrypt_free_dummy_policy(fsc);</div><div class='ctx'> 	ceph_mdsc_close_sessions(fsc-&gt;mdsc);</div><div class='add'>+	doutc(fsc-&gt;client, "done\n");</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ceph_statfs(struct dentry *dentry, struct kstatfs *buf)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_inode_to_client(d_inode(dentry));</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(d_inode(dentry));</div><div class='ctx'> 	struct ceph_mon_client *monc = &amp;fsc-&gt;client-&gt;monc;</div><div class='ctx'> 	struct ceph_statfs st;</div><div class='del'>-	u64 fsid;</div><div class='del'>-	int err;</div><div class='add'>+	int i, err;</div><div class='ctx'> 	u64 data_pool;</div><div class='ctx'> </div><div class='add'>+	doutc(fsc-&gt;client, "begin\n");</div><div class='ctx'> 	if (fsc-&gt;mdsc-&gt;mdsmap-&gt;m_num_data_pg_pools == 1) {</div><div class='ctx'> 		data_pool = fsc-&gt;mdsc-&gt;mdsmap-&gt;m_data_pg_pools[0];</div><div class='ctx'> 	} else {</div><div class='ctx'> 		data_pool = CEPH_NOPOOL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("statfs\n");</div><div class='ctx'> 	err = ceph_monc_do_statfs(monc, data_pool, &amp;st);</div><div class='ctx'> 	if (err &lt; 0)</div><div class='ctx'> 		return err;</div><div class='hunk'>@@ -71,15 +75,9 @@ static int ceph_statfs(struct dentry *dentry, struct kstatfs *buf)</div><div class='ctx'> 	buf-&gt;f_type = CEPH_SUPER_MAGIC;  /* ?? */</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * express utilization in terms of large blocks to avoid</div><div class='add'>+	 * Express utilization in terms of large blocks to avoid</div><div class='ctx'> 	 * overflow on 32-bit machines.</div><div class='del'>-	 *</div><div class='del'>-	 * NOTE: for the time being, we make bsize == frsize to humor</div><div class='del'>-	 * not-yet-ancient versions of glibc that are broken.</div><div class='del'>-	 * Someday, we will probably want to report a real block</div><div class='del'>-	 * size...  whatever that may mean for a network file system!</div><div class='ctx'> 	 */</div><div class='del'>-	buf-&gt;f_bsize = 1 &lt;&lt; CEPH_BLOCK_SHIFT;</div><div class='ctx'> 	buf-&gt;f_frsize = 1 &lt;&lt; CEPH_BLOCK_SHIFT;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -94,36 +92,49 @@ static int ceph_statfs(struct dentry *dentry, struct kstatfs *buf)</div><div class='ctx'> 		buf-&gt;f_bavail = le64_to_cpu(st.kb_avail) &gt;&gt; (CEPH_BLOCK_SHIFT-10);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * NOTE: for the time being, we make bsize == frsize to humor</div><div class='add'>+	 * not-yet-ancient versions of glibc that are broken.</div><div class='add'>+	 * Someday, we will probably want to report a real block</div><div class='add'>+	 * size...  whatever that may mean for a network file system!</div><div class='add'>+	 */</div><div class='add'>+	buf-&gt;f_bsize = buf-&gt;f_frsize;</div><div class='add'>+</div><div class='ctx'> 	buf-&gt;f_files = le64_to_cpu(st.num_objects);</div><div class='ctx'> 	buf-&gt;f_ffree = -1;</div><div class='ctx'> 	buf-&gt;f_namelen = NAME_MAX;</div><div class='ctx'> </div><div class='ctx'> 	/* Must convert the fsid, for consistent values across arches */</div><div class='add'>+	buf-&gt;f_fsid.val[0] = 0;</div><div class='ctx'> 	mutex_lock(&amp;monc-&gt;mutex);</div><div class='del'>-	fsid = le64_to_cpu(*(__le64 *)(&amp;monc-&gt;monmap-&gt;fsid)) ^</div><div class='del'>-	       le64_to_cpu(*((__le64 *)&amp;monc-&gt;monmap-&gt;fsid + 1));</div><div class='add'>+	for (i = 0 ; i &lt; sizeof(monc-&gt;monmap-&gt;fsid) / sizeof(__le32) ; ++i)</div><div class='add'>+		buf-&gt;f_fsid.val[0] ^= le32_to_cpu(((__le32 *)&amp;monc-&gt;monmap-&gt;fsid)[i]);</div><div class='ctx'> 	mutex_unlock(&amp;monc-&gt;mutex);</div><div class='ctx'> </div><div class='del'>-	buf-&gt;f_fsid = u64_to_fsid(fsid);</div><div class='add'>+	/* fold the fs_cluster_id into the upper bits */</div><div class='add'>+	buf-&gt;f_fsid.val[1] = monc-&gt;fs_cluster_id;</div><div class='ctx'> </div><div class='add'>+	doutc(fsc-&gt;client, "done\n");</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ceph_sync_fs(struct super_block *sb, int wait)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_sb_to_client(sb);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_sb_to_fs_client(sb);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='ctx'> </div><div class='ctx'> 	if (!wait) {</div><div class='del'>-		dout("sync_fs (non-blocking)\n");</div><div class='add'>+		doutc(cl, "(non-blocking)\n");</div><div class='ctx'> 		ceph_flush_dirty_caps(fsc-&gt;mdsc);</div><div class='del'>-		dout("sync_fs (non-blocking) done\n");</div><div class='add'>+		ceph_flush_cap_releases(fsc-&gt;mdsc);</div><div class='add'>+		doutc(cl, "(non-blocking) done\n");</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("sync_fs (blocking)\n");</div><div class='add'>+	doutc(cl, "(blocking)\n");</div><div class='ctx'> 	ceph_osdc_sync(&amp;fsc-&gt;client-&gt;osdc);</div><div class='ctx'> 	ceph_mdsc_sync(fsc-&gt;mdsc);</div><div class='del'>-	dout("sync_fs (blocking) done\n");</div><div class='add'>+	doutc(cl, "(blocking) done\n");</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -145,6 +156,8 @@ enum {</div><div class='ctx'> 	Opt_mds_namespace,</div><div class='ctx'> 	Opt_recover_session,</div><div class='ctx'> 	Opt_source,</div><div class='add'>+	Opt_mon_addr,</div><div class='add'>+	Opt_test_dummy_encryption,</div><div class='ctx'> 	/* string args above */</div><div class='ctx'> 	Opt_dirstat,</div><div class='ctx'> 	Opt_rbytes,</div><div class='hunk'>@@ -158,6 +171,8 @@ enum {</div><div class='ctx'> 	Opt_quotadf,</div><div class='ctx'> 	Opt_copyfrom,</div><div class='ctx'> 	Opt_wsync,</div><div class='add'>+	Opt_pagecache,</div><div class='add'>+	Opt_sparseread,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> enum ceph_recover_session_mode {</div><div class='hunk'>@@ -185,6 +200,7 @@ static const struct fs_parameter_spec ceph_mount_parameters[] = {</div><div class='ctx'> 	fsparam_string	("fsc",				Opt_fscache), // fsc=...</div><div class='ctx'> 	fsparam_flag_no ("ino32",			Opt_ino32),</div><div class='ctx'> 	fsparam_string	("mds_namespace",		Opt_mds_namespace),</div><div class='add'>+	fsparam_string	("mon_addr",			Opt_mon_addr),</div><div class='ctx'> 	fsparam_flag_no ("poolperm",			Opt_poolperm),</div><div class='ctx'> 	fsparam_flag_no ("quotadf",			Opt_quotadf),</div><div class='ctx'> 	fsparam_u32	("rasize",			Opt_rasize),</div><div class='hunk'>@@ -196,8 +212,12 @@ static const struct fs_parameter_spec ceph_mount_parameters[] = {</div><div class='ctx'> 	fsparam_u32	("rsize",			Opt_rsize),</div><div class='ctx'> 	fsparam_string	("snapdirname",			Opt_snapdirname),</div><div class='ctx'> 	fsparam_string	("source",			Opt_source),</div><div class='add'>+	fsparam_flag	("test_dummy_encryption",	Opt_test_dummy_encryption),</div><div class='add'>+	fsparam_string	("test_dummy_encryption",	Opt_test_dummy_encryption),</div><div class='ctx'> 	fsparam_u32	("wsize",			Opt_wsize),</div><div class='ctx'> 	fsparam_flag_no	("wsync",			Opt_wsync),</div><div class='add'>+	fsparam_flag_no	("pagecache",			Opt_pagecache),</div><div class='add'>+	fsparam_flag_no	("sparseread",			Opt_sparseread),</div><div class='ctx'> 	{}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -226,10 +246,87 @@ static void canonicalize_path(char *path)</div><div class='ctx'> 	path[j] = '\0';</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int ceph_parse_old_source(const char *dev_name, const char *dev_name_end,</div><div class='add'>+				 struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	int r;</div><div class='add'>+	struct ceph_parse_opts_ctx *pctx = fc-&gt;fs_private;</div><div class='add'>+	struct ceph_mount_options *fsopt = pctx-&gt;opts;</div><div class='add'>+</div><div class='add'>+	if (*dev_name_end != ':')</div><div class='add'>+		return invalfc(fc, "separator ':' missing in source");</div><div class='add'>+</div><div class='add'>+	r = ceph_parse_mon_ips(dev_name, dev_name_end - dev_name,</div><div class='add'>+			       pctx-&gt;copts, fc-&gt;log.log, ',');</div><div class='add'>+	if (r)</div><div class='add'>+		return r;</div><div class='add'>+</div><div class='add'>+	fsopt-&gt;new_dev_syntax = false;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ceph_parse_new_source(const char *dev_name, const char *dev_name_end,</div><div class='add'>+				 struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	size_t len;</div><div class='add'>+	struct ceph_fsid fsid;</div><div class='add'>+	struct ceph_parse_opts_ctx *pctx = fc-&gt;fs_private;</div><div class='add'>+	struct ceph_options *opts = pctx-&gt;copts;</div><div class='add'>+	struct ceph_mount_options *fsopt = pctx-&gt;opts;</div><div class='add'>+	const char *name_start = dev_name;</div><div class='add'>+	const char *fsid_start, *fs_name_start;</div><div class='add'>+</div><div class='add'>+	if (*dev_name_end != '=') {</div><div class='add'>+		dout("separator '=' missing in source");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	fsid_start = strchr(dev_name, '@');</div><div class='add'>+	if (!fsid_start)</div><div class='add'>+		return invalfc(fc, "missing cluster fsid");</div><div class='add'>+	len = fsid_start - name_start;</div><div class='add'>+	kfree(opts-&gt;name);</div><div class='add'>+	opts-&gt;name = kstrndup(name_start, len, GFP_KERNEL);</div><div class='add'>+	if (!opts-&gt;name)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	dout("using %s entity name", opts-&gt;name);</div><div class='add'>+</div><div class='add'>+	++fsid_start; /* start of cluster fsid */</div><div class='add'>+	fs_name_start = strchr(fsid_start, '.');</div><div class='add'>+	if (!fs_name_start)</div><div class='add'>+		return invalfc(fc, "missing file system name");</div><div class='add'>+</div><div class='add'>+	if (ceph_parse_fsid(fsid_start, &amp;fsid))</div><div class='add'>+		return invalfc(fc, "Invalid FSID");</div><div class='add'>+</div><div class='add'>+	++fs_name_start; /* start of file system name */</div><div class='add'>+	len = dev_name_end - fs_name_start;</div><div class='add'>+</div><div class='add'>+	if (!namespace_equals(fsopt, fs_name_start, len))</div><div class='add'>+		return invalfc(fc, "Mismatching mds_namespace");</div><div class='add'>+	kfree(fsopt-&gt;mds_namespace);</div><div class='add'>+	fsopt-&gt;mds_namespace = kstrndup(fs_name_start, len, GFP_KERNEL);</div><div class='add'>+	if (!fsopt-&gt;mds_namespace)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	dout("file system (mds namespace) '%s'\n", fsopt-&gt;mds_namespace);</div><div class='add'>+</div><div class='add'>+	fsopt-&gt;new_dev_syntax = true;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='del'>- * Parse the source parameter.  Distinguish the server list from the path.</div><div class='add'>+ * Parse the source parameter for new device format. Distinguish the device</div><div class='add'>+ * spec from the path. Try parsing new device format and fallback to old</div><div class='add'>+ * format if needed.</div><div class='ctx'>  *</div><div class='del'>- * The source will look like:</div><div class='add'>+ * New device syntax will looks like:</div><div class='add'>+ *     &lt;device_spec&gt;=/&lt;path&gt;</div><div class='add'>+ * where</div><div class='add'>+ *     &lt;device_spec&gt; is name@fsid.fsname</div><div class='add'>+ *     &lt;path&gt; is optional, but if present must begin with '/'</div><div class='add'>+ * (monitor addresses are passed via mount option)</div><div class='add'>+ *</div><div class='add'>+ * Old device syntax is:</div><div class='ctx'>  *     &lt;server_spec&gt;[,&lt;server_spec&gt;...]:[&lt;path&gt;]</div><div class='ctx'>  * where</div><div class='ctx'>  *     &lt;server_spec&gt; is &lt;ip&gt;[:&lt;port&gt;]</div><div class='hunk'>@@ -242,7 +339,7 @@ static int ceph_parse_source(struct fs_parameter *param, struct fs_context *fc)</div><div class='ctx'> 	char *dev_name = param-&gt;string, *dev_name_end;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	dout("%s '%s'\n", __func__, dev_name);</div><div class='add'>+	dout("'%s'\n", dev_name);</div><div class='ctx'> 	if (!dev_name || !*dev_name)</div><div class='ctx'> 		return invalfc(fc, "Empty source");</div><div class='ctx'> </div><div class='hunk'>@@ -262,24 +359,44 @@ static int ceph_parse_source(struct fs_parameter *param, struct fs_context *fc)</div><div class='ctx'> 		dev_name_end = dev_name + strlen(dev_name);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dev_name_end--;		/* back up to ':' separator */</div><div class='del'>-	if (dev_name_end &lt; dev_name || *dev_name_end != ':')</div><div class='del'>-		return invalfc(fc, "No path or : separator in source");</div><div class='add'>+	dev_name_end--;		/* back up to separator */</div><div class='add'>+	if (dev_name_end &lt; dev_name)</div><div class='add'>+		return invalfc(fc, "Path missing in source");</div><div class='ctx'> </div><div class='ctx'> 	dout("device name '%.*s'\n", (int)(dev_name_end - dev_name), dev_name);</div><div class='ctx'> 	if (fsopt-&gt;server_path)</div><div class='ctx'> 		dout("server path '%s'\n", fsopt-&gt;server_path);</div><div class='ctx'> </div><div class='del'>-	ret = ceph_parse_mon_ips(param-&gt;string, dev_name_end - dev_name,</div><div class='del'>-				 pctx-&gt;copts, fc-&gt;log.log);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='add'>+	dout("trying new device syntax");</div><div class='add'>+	ret = ceph_parse_new_source(dev_name, dev_name_end, fc);</div><div class='add'>+	if (ret) {</div><div class='add'>+		if (ret != -EINVAL)</div><div class='add'>+			return ret;</div><div class='add'>+		dout("trying old device syntax");</div><div class='add'>+		ret = ceph_parse_old_source(dev_name, dev_name_end, fc);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	fc-&gt;source = param-&gt;string;</div><div class='ctx'> 	param-&gt;string = NULL;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int ceph_parse_mon_addr(struct fs_parameter *param,</div><div class='add'>+			       struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct ceph_parse_opts_ctx *pctx = fc-&gt;fs_private;</div><div class='add'>+	struct ceph_mount_options *fsopt = pctx-&gt;opts;</div><div class='add'>+</div><div class='add'>+	kfree(fsopt-&gt;mon_addr);</div><div class='add'>+	fsopt-&gt;mon_addr = param-&gt;string;</div><div class='add'>+	param-&gt;string = NULL;</div><div class='add'>+</div><div class='add'>+	return ceph_parse_mon_ips(fsopt-&gt;mon_addr, strlen(fsopt-&gt;mon_addr),</div><div class='add'>+				  pctx-&gt;copts, fc-&gt;log.log, '/');</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int ceph_parse_mount_param(struct fs_context *fc,</div><div class='ctx'> 				  struct fs_parameter *param)</div><div class='ctx'> {</div><div class='hunk'>@@ -294,17 +411,21 @@ static int ceph_parse_mount_param(struct fs_context *fc,</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='ctx'> 	token = fs_parse(fc, ceph_mount_parameters, param, &amp;result);</div><div class='del'>-	dout("%s fs_parse '%s' token %d\n", __func__, param-&gt;key, token);</div><div class='add'>+	dout("%s: fs_parse '%s' token %d\n",__func__, param-&gt;key, token);</div><div class='ctx'> 	if (token &lt; 0)</div><div class='ctx'> 		return token;</div><div class='ctx'> </div><div class='ctx'> 	switch (token) {</div><div class='ctx'> 	case Opt_snapdirname:</div><div class='add'>+		if (strlen(param-&gt;string) &gt; NAME_MAX)</div><div class='add'>+			return invalfc(fc, "snapdirname too long");</div><div class='ctx'> 		kfree(fsopt-&gt;snapdir_name);</div><div class='ctx'> 		fsopt-&gt;snapdir_name = param-&gt;string;</div><div class='ctx'> 		param-&gt;string = NULL;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case Opt_mds_namespace:</div><div class='add'>+		if (!namespace_equals(fsopt, param-&gt;string, strlen(param-&gt;string)))</div><div class='add'>+			return invalfc(fc, "Mismatching mds_namespace");</div><div class='ctx'> 		kfree(fsopt-&gt;mds_namespace);</div><div class='ctx'> 		fsopt-&gt;mds_namespace = param-&gt;string;</div><div class='ctx'> 		param-&gt;string = NULL;</div><div class='hunk'>@@ -322,6 +443,8 @@ static int ceph_parse_mount_param(struct fs_context *fc,</div><div class='ctx'> 		if (fc-&gt;source)</div><div class='ctx'> 			return invalfc(fc, "Multiple sources specified");</div><div class='ctx'> 		return ceph_parse_source(param, fc);</div><div class='add'>+	case Opt_mon_addr:</div><div class='add'>+		return ceph_parse_mon_addr(param, fc);</div><div class='ctx'> 	case Opt_wsize:</div><div class='ctx'> 		if (result.uint_32 &lt; PAGE_SIZE ||</div><div class='ctx'> 		    result.uint_32 &gt; CEPH_MAX_WRITE_SIZE)</div><div class='hunk'>@@ -454,6 +577,35 @@ static int ceph_parse_mount_param(struct fs_context *fc,</div><div class='ctx'> 		else</div><div class='ctx'> 			fsopt-&gt;flags |= CEPH_MOUNT_OPT_ASYNC_DIROPS;</div><div class='ctx'> 		break;</div><div class='add'>+	case Opt_pagecache:</div><div class='add'>+		if (result.negated)</div><div class='add'>+			fsopt-&gt;flags |= CEPH_MOUNT_OPT_NOPAGECACHE;</div><div class='add'>+		else</div><div class='add'>+			fsopt-&gt;flags &amp;= ~CEPH_MOUNT_OPT_NOPAGECACHE;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_sparseread:</div><div class='add'>+		if (result.negated)</div><div class='add'>+			fsopt-&gt;flags &amp;= ~CEPH_MOUNT_OPT_SPARSEREAD;</div><div class='add'>+		else</div><div class='add'>+			fsopt-&gt;flags |= CEPH_MOUNT_OPT_SPARSEREAD;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_test_dummy_encryption:</div><div class='add'>+#ifdef CONFIG_FS_ENCRYPTION</div><div class='add'>+		fscrypt_free_dummy_policy(&amp;fsopt-&gt;dummy_enc_policy);</div><div class='add'>+		ret = fscrypt_parse_test_dummy_encryption(param,</div><div class='add'>+						&amp;fsopt-&gt;dummy_enc_policy);</div><div class='add'>+		if (ret == -EINVAL) {</div><div class='add'>+			warnfc(fc, "Value of option \"%s\" is unrecognized",</div><div class='add'>+			       param-&gt;key);</div><div class='add'>+		} else if (ret == -EEXIST) {</div><div class='add'>+			warnfc(fc, "Conflicting test_dummy_encryption options");</div><div class='add'>+			ret = -EINVAL;</div><div class='add'>+		}</div><div class='add'>+#else</div><div class='add'>+		warnfc(fc,</div><div class='add'>+		       "FS encryption not supported: test_dummy_encryption mount option ignored");</div><div class='add'>+#endif</div><div class='add'>+		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		BUG();</div><div class='ctx'> 	}</div><div class='hunk'>@@ -473,6 +625,8 @@ static void destroy_mount_options(struct ceph_mount_options *args)</div><div class='ctx'> 	kfree(args-&gt;mds_namespace);</div><div class='ctx'> 	kfree(args-&gt;server_path);</div><div class='ctx'> 	kfree(args-&gt;fscache_uniq);</div><div class='add'>+	kfree(args-&gt;mon_addr);</div><div class='add'>+	fscrypt_free_dummy_policy(&amp;args-&gt;dummy_enc_policy);</div><div class='ctx'> 	kfree(args);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -516,6 +670,10 @@ static int compare_mount_options(struct ceph_mount_options *new_fsopt,</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='add'>+	ret = strcmp_null(fsopt1-&gt;mon_addr, fsopt2-&gt;mon_addr);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='ctx'> 	return ceph_compare_options(new_opt, fsc-&gt;client);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -526,7 +684,7 @@ static int compare_mount_options(struct ceph_mount_options *new_fsopt,</div><div class='ctx'>  */</div><div class='ctx'> static int ceph_show_options(struct seq_file *m, struct dentry *root)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_sb_to_client(root-&gt;d_sb);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_sb_to_fs_client(root-&gt;d_sb);</div><div class='ctx'> 	struct ceph_mount_options *fsopt = fsc-&gt;mount_options;</div><div class='ctx'> 	size_t pos;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -571,14 +729,24 @@ static int ceph_show_options(struct seq_file *m, struct dentry *root)</div><div class='ctx'> 	if ((fsopt-&gt;flags &amp; CEPH_MOUNT_OPT_NOCOPYFROM) == 0)</div><div class='ctx'> 		seq_puts(m, ",copyfrom");</div><div class='ctx'> </div><div class='del'>-	if (fsopt-&gt;mds_namespace)</div><div class='add'>+	/* dump mds_namespace when old device syntax is in use */</div><div class='add'>+	if (fsopt-&gt;mds_namespace &amp;&amp; !fsopt-&gt;new_dev_syntax)</div><div class='ctx'> 		seq_show_option(m, "mds_namespace", fsopt-&gt;mds_namespace);</div><div class='ctx'> </div><div class='add'>+	if (fsopt-&gt;mon_addr)</div><div class='add'>+		seq_printf(m, ",mon_addr=%s", fsopt-&gt;mon_addr);</div><div class='add'>+</div><div class='ctx'> 	if (fsopt-&gt;flags &amp; CEPH_MOUNT_OPT_CLEANRECOVER)</div><div class='ctx'> 		seq_show_option(m, "recover_session", "clean");</div><div class='ctx'> </div><div class='del'>-	if (fsopt-&gt;flags &amp; CEPH_MOUNT_OPT_ASYNC_DIROPS)</div><div class='del'>-		seq_puts(m, ",nowsync");</div><div class='add'>+	if (!(fsopt-&gt;flags &amp; CEPH_MOUNT_OPT_ASYNC_DIROPS))</div><div class='add'>+		seq_puts(m, ",wsync");</div><div class='add'>+	if (fsopt-&gt;flags &amp; CEPH_MOUNT_OPT_NOPAGECACHE)</div><div class='add'>+		seq_puts(m, ",nopagecache");</div><div class='add'>+	if (fsopt-&gt;flags &amp; CEPH_MOUNT_OPT_SPARSEREAD)</div><div class='add'>+		seq_puts(m, ",sparseread");</div><div class='add'>+</div><div class='add'>+	fscrypt_show_test_dummy_encryption(m, ',', root-&gt;d_sb);</div><div class='ctx'> </div><div class='ctx'> 	if (fsopt-&gt;wsize != CEPH_MAX_WRITE_SIZE)</div><div class='ctx'> 		seq_printf(m, ",wsize=%u", fsopt-&gt;wsize);</div><div class='hunk'>@@ -670,6 +838,7 @@ static struct ceph_fs_client *create_fs_client(struct ceph_mount_options *fsopt,</div><div class='ctx'> 	fsc-&gt;have_copy_from2 = true;</div><div class='ctx'> </div><div class='ctx'> 	atomic_long_set(&amp;fsc-&gt;writeback_count, 0);</div><div class='add'>+	fsc-&gt;write_congested = false;</div><div class='ctx'> </div><div class='ctx'> 	err = -ENOMEM;</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -679,10 +848,13 @@ static struct ceph_fs_client *create_fs_client(struct ceph_mount_options *fsopt,</div><div class='ctx'> 	fsc-&gt;inode_wq = alloc_workqueue("ceph-inode", WQ_UNBOUND, 0);</div><div class='ctx'> 	if (!fsc-&gt;inode_wq)</div><div class='ctx'> 		goto fail_client;</div><div class='del'>-	fsc-&gt;cap_wq = alloc_workqueue("ceph-cap", 0, 1);</div><div class='add'>+	fsc-&gt;cap_wq = alloc_workqueue("ceph-cap", WQ_PERCPU, 1);</div><div class='ctx'> 	if (!fsc-&gt;cap_wq)</div><div class='ctx'> 		goto fail_inode_wq;</div><div class='ctx'> </div><div class='add'>+	hash_init(fsc-&gt;async_unlink_conflict);</div><div class='add'>+	spin_lock_init(&amp;fsc-&gt;async_unlink_conflict_lock);</div><div class='add'>+</div><div class='ctx'> 	spin_lock(&amp;ceph_fsc_lock);</div><div class='ctx'> 	list_add_tail(&amp;fsc-&gt;metric_wakeup, &amp;ceph_fsc_list);</div><div class='ctx'> 	spin_unlock(&amp;ceph_fsc_lock);</div><div class='hunk'>@@ -709,7 +881,7 @@ static void flush_fs_workqueues(struct ceph_fs_client *fsc)</div><div class='ctx'> </div><div class='ctx'> static void destroy_fs_client(struct ceph_fs_client *fsc)</div><div class='ctx'> {</div><div class='del'>-	dout("destroy_fs_client %p\n", fsc);</div><div class='add'>+	doutc(fsc-&gt;client, "%p\n", fsc);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;ceph_fsc_lock);</div><div class='ctx'> 	list_del(&amp;fsc-&gt;metric_wakeup);</div><div class='hunk'>@@ -724,7 +896,7 @@ static void destroy_fs_client(struct ceph_fs_client *fsc)</div><div class='ctx'> 	ceph_destroy_client(fsc-&gt;client);</div><div class='ctx'> </div><div class='ctx'> 	kfree(fsc);</div><div class='del'>-	dout("destroy_fs_client %p done\n", fsc);</div><div class='add'>+	dout("%s: %p done\n", __func__, fsc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -732,6 +904,7 @@ static void destroy_fs_client(struct ceph_fs_client *fsc)</div><div class='ctx'>  */</div><div class='ctx'> struct kmem_cache *ceph_inode_cachep;</div><div class='ctx'> struct kmem_cache *ceph_cap_cachep;</div><div class='add'>+struct kmem_cache *ceph_cap_snap_cachep;</div><div class='ctx'> struct kmem_cache *ceph_cap_flush_cachep;</div><div class='ctx'> struct kmem_cache *ceph_dentry_cachep;</div><div class='ctx'> struct kmem_cache *ceph_file_cachep;</div><div class='hunk'>@@ -742,7 +915,7 @@ mempool_t *ceph_wb_pagevec_pool;</div><div class='ctx'> static void ceph_inode_init_once(void *foo)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_inode_info *ci = foo;</div><div class='del'>-	inode_init_once(&amp;ci-&gt;vfs_inode);</div><div class='add'>+	inode_init_once(&amp;ci-&gt;netfs.inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int __init init_caches(void)</div><div class='hunk'>@@ -752,50 +925,48 @@ static int __init init_caches(void)</div><div class='ctx'> 	ceph_inode_cachep = kmem_cache_create("ceph_inode_info",</div><div class='ctx'> 				      sizeof(struct ceph_inode_info),</div><div class='ctx'> 				      __alignof__(struct ceph_inode_info),</div><div class='del'>-				      SLAB_RECLAIM_ACCOUNT|SLAB_MEM_SPREAD|</div><div class='del'>-				      SLAB_ACCOUNT, ceph_inode_init_once);</div><div class='add'>+				      SLAB_RECLAIM_ACCOUNT | SLAB_ACCOUNT,</div><div class='add'>+				      ceph_inode_init_once);</div><div class='ctx'> 	if (!ceph_inode_cachep)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	ceph_cap_cachep = KMEM_CACHE(ceph_cap, SLAB_MEM_SPREAD);</div><div class='add'>+	ceph_cap_cachep = KMEM_CACHE(ceph_cap, 0);</div><div class='ctx'> 	if (!ceph_cap_cachep)</div><div class='ctx'> 		goto bad_cap;</div><div class='add'>+	ceph_cap_snap_cachep = KMEM_CACHE(ceph_cap_snap, 0);</div><div class='add'>+	if (!ceph_cap_snap_cachep)</div><div class='add'>+		goto bad_cap_snap;</div><div class='ctx'> 	ceph_cap_flush_cachep = KMEM_CACHE(ceph_cap_flush,</div><div class='del'>-					   SLAB_RECLAIM_ACCOUNT|SLAB_MEM_SPREAD);</div><div class='add'>+					   SLAB_RECLAIM_ACCOUNT);</div><div class='ctx'> 	if (!ceph_cap_flush_cachep)</div><div class='ctx'> 		goto bad_cap_flush;</div><div class='ctx'> </div><div class='ctx'> 	ceph_dentry_cachep = KMEM_CACHE(ceph_dentry_info,</div><div class='del'>-					SLAB_RECLAIM_ACCOUNT|SLAB_MEM_SPREAD);</div><div class='add'>+					SLAB_RECLAIM_ACCOUNT);</div><div class='ctx'> 	if (!ceph_dentry_cachep)</div><div class='ctx'> 		goto bad_dentry;</div><div class='ctx'> </div><div class='del'>-	ceph_file_cachep = KMEM_CACHE(ceph_file_info, SLAB_MEM_SPREAD);</div><div class='add'>+	ceph_file_cachep = KMEM_CACHE(ceph_file_info, 0);</div><div class='ctx'> 	if (!ceph_file_cachep)</div><div class='ctx'> 		goto bad_file;</div><div class='ctx'> </div><div class='del'>-	ceph_dir_file_cachep = KMEM_CACHE(ceph_dir_file_info, SLAB_MEM_SPREAD);</div><div class='add'>+	ceph_dir_file_cachep = KMEM_CACHE(ceph_dir_file_info, 0);</div><div class='ctx'> 	if (!ceph_dir_file_cachep)</div><div class='ctx'> 		goto bad_dir_file;</div><div class='ctx'> </div><div class='del'>-	ceph_mds_request_cachep = KMEM_CACHE(ceph_mds_request, SLAB_MEM_SPREAD);</div><div class='add'>+	ceph_mds_request_cachep = KMEM_CACHE(ceph_mds_request, 0);</div><div class='ctx'> 	if (!ceph_mds_request_cachep)</div><div class='ctx'> 		goto bad_mds_req;</div><div class='ctx'> </div><div class='del'>-	ceph_wb_pagevec_pool = mempool_create_kmalloc_pool(10, CEPH_MAX_WRITE_SIZE &gt;&gt; PAGE_SHIFT);</div><div class='add'>+	ceph_wb_pagevec_pool = mempool_create_kmalloc_pool(10,</div><div class='add'>+	    (CEPH_MAX_WRITE_SIZE &gt;&gt; PAGE_SHIFT) * sizeof(struct page *));</div><div class='ctx'> 	if (!ceph_wb_pagevec_pool)</div><div class='ctx'> 		goto bad_pagevec_pool;</div><div class='ctx'> </div><div class='del'>-	error = ceph_fscache_register();</div><div class='del'>-	if (error)</div><div class='del'>-		goto bad_fscache;</div><div class='del'>-</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='del'>-bad_fscache:</div><div class='del'>-	kmem_cache_destroy(ceph_mds_request_cachep);</div><div class='ctx'> bad_pagevec_pool:</div><div class='del'>-	mempool_destroy(ceph_wb_pagevec_pool);</div><div class='add'>+	kmem_cache_destroy(ceph_mds_request_cachep);</div><div class='ctx'> bad_mds_req:</div><div class='ctx'> 	kmem_cache_destroy(ceph_dir_file_cachep);</div><div class='ctx'> bad_dir_file:</div><div class='hunk'>@@ -805,6 +976,8 @@ bad_file:</div><div class='ctx'> bad_dentry:</div><div class='ctx'> 	kmem_cache_destroy(ceph_cap_flush_cachep);</div><div class='ctx'> bad_cap_flush:</div><div class='add'>+	kmem_cache_destroy(ceph_cap_snap_cachep);</div><div class='add'>+bad_cap_snap:</div><div class='ctx'> 	kmem_cache_destroy(ceph_cap_cachep);</div><div class='ctx'> bad_cap:</div><div class='ctx'> 	kmem_cache_destroy(ceph_inode_cachep);</div><div class='hunk'>@@ -821,14 +994,13 @@ static void destroy_caches(void)</div><div class='ctx'> </div><div class='ctx'> 	kmem_cache_destroy(ceph_inode_cachep);</div><div class='ctx'> 	kmem_cache_destroy(ceph_cap_cachep);</div><div class='add'>+	kmem_cache_destroy(ceph_cap_snap_cachep);</div><div class='ctx'> 	kmem_cache_destroy(ceph_cap_flush_cachep);</div><div class='ctx'> 	kmem_cache_destroy(ceph_dentry_cachep);</div><div class='ctx'> 	kmem_cache_destroy(ceph_file_cachep);</div><div class='ctx'> 	kmem_cache_destroy(ceph_dir_file_cachep);</div><div class='ctx'> 	kmem_cache_destroy(ceph_mds_request_cachep);</div><div class='ctx'> 	mempool_destroy(ceph_wb_pagevec_pool);</div><div class='del'>-</div><div class='del'>-	ceph_fscache_unregister();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void __ceph_umount_begin(struct ceph_fs_client *fsc)</div><div class='hunk'>@@ -842,13 +1014,12 @@ static void __ceph_umount_begin(struct ceph_fs_client *fsc)</div><div class='ctx'>  * ceph_umount_begin - initiate forced umount.  Tear down the</div><div class='ctx'>  * mount, skipping steps that may hang while waiting for server(s).</div><div class='ctx'>  */</div><div class='del'>-static void ceph_umount_begin(struct super_block *sb)</div><div class='add'>+void ceph_umount_begin(struct super_block *sb)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_sb_to_client(sb);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_sb_to_fs_client(sb);</div><div class='add'>+</div><div class='add'>+	doutc(fsc-&gt;client, "starting forced umount\n");</div><div class='ctx'> </div><div class='del'>-	dout("ceph_umount_begin - starting forced umount\n");</div><div class='del'>-	if (!fsc)</div><div class='del'>-		return;</div><div class='ctx'> 	fsc-&gt;mount_state = CEPH_MOUNT_SHUTDOWN;</div><div class='ctx'> 	__ceph_umount_begin(fsc);</div><div class='ctx'> }</div><div class='hunk'>@@ -857,7 +1028,7 @@ static const struct super_operations ceph_super_ops = {</div><div class='ctx'> 	.alloc_inode	= ceph_alloc_inode,</div><div class='ctx'> 	.free_inode	= ceph_free_inode,</div><div class='ctx'> 	.write_inode    = ceph_write_inode,</div><div class='del'>-	.drop_inode	= generic_delete_inode,</div><div class='add'>+	.drop_inode	= inode_just_drop,</div><div class='ctx'> 	.evict_inode	= ceph_evict_inode,</div><div class='ctx'> 	.sync_fs        = ceph_sync_fs,</div><div class='ctx'> 	.put_super	= ceph_put_super,</div><div class='hunk'>@@ -874,13 +1045,14 @@ static struct dentry *open_root_dentry(struct ceph_fs_client *fsc,</div><div class='ctx'> 				       const char *path,</div><div class='ctx'> 				       unsigned long started)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='ctx'> 	struct ceph_mds_client *mdsc = fsc-&gt;mdsc;</div><div class='ctx'> 	struct ceph_mds_request *req = NULL;</div><div class='ctx'> 	int err;</div><div class='ctx'> 	struct dentry *root;</div><div class='ctx'> </div><div class='ctx'> 	/* open dir */</div><div class='del'>-	dout("open_root_inode opening '%s'\n", path);</div><div class='add'>+	doutc(cl, "opening '%s'\n", path);</div><div class='ctx'> 	req = ceph_mdsc_create_request(mdsc, CEPH_MDS_OP_GETATTR, USE_ANY_MDS);</div><div class='ctx'> 	if (IS_ERR(req))</div><div class='ctx'> 		return ERR_CAST(req);</div><div class='hunk'>@@ -900,13 +1072,13 @@ static struct dentry *open_root_dentry(struct ceph_fs_client *fsc,</div><div class='ctx'> 	if (err == 0) {</div><div class='ctx'> 		struct inode *inode = req-&gt;r_target_inode;</div><div class='ctx'> 		req-&gt;r_target_inode = NULL;</div><div class='del'>-		dout("open_root_inode success\n");</div><div class='add'>+		doutc(cl, "success\n");</div><div class='ctx'> 		root = d_make_root(inode);</div><div class='ctx'> 		if (!root) {</div><div class='ctx'> 			root = ERR_PTR(-ENOMEM);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='del'>-		dout("open_root_inode success, root dentry is %p\n", root);</div><div class='add'>+		doutc(cl, "success, root dentry is %p\n", root);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		root = ERR_PTR(err);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -915,24 +1087,69 @@ out:</div><div class='ctx'> 	return root;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_FS_ENCRYPTION</div><div class='add'>+static int ceph_apply_test_dummy_encryption(struct super_block *sb,</div><div class='add'>+					    struct fs_context *fc,</div><div class='add'>+					    struct ceph_mount_options *fsopt)</div><div class='add'>+{</div><div class='add'>+	struct ceph_fs_client *fsc = sb-&gt;s_fs_info;</div><div class='add'>+</div><div class='add'>+	if (!fscrypt_is_dummy_policy_set(&amp;fsopt-&gt;dummy_enc_policy))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/* No changing encryption context on remount. */</div><div class='add'>+	if (fc-&gt;purpose == FS_CONTEXT_FOR_RECONFIGURE &amp;&amp;</div><div class='add'>+	    !fscrypt_is_dummy_policy_set(&amp;fsc-&gt;fsc_dummy_enc_policy)) {</div><div class='add'>+		if (fscrypt_dummy_policies_equal(&amp;fsopt-&gt;dummy_enc_policy,</div><div class='add'>+						 &amp;fsc-&gt;fsc_dummy_enc_policy))</div><div class='add'>+			return 0;</div><div class='add'>+		errorfc(fc, "Can't set test_dummy_encryption on remount");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Also make sure fsopt doesn't contain a conflicting value. */</div><div class='add'>+	if (fscrypt_is_dummy_policy_set(&amp;fsc-&gt;fsc_dummy_enc_policy)) {</div><div class='add'>+		if (fscrypt_dummy_policies_equal(&amp;fsopt-&gt;dummy_enc_policy,</div><div class='add'>+						 &amp;fsc-&gt;fsc_dummy_enc_policy))</div><div class='add'>+			return 0;</div><div class='add'>+		errorfc(fc, "Conflicting test_dummy_encryption options");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	fsc-&gt;fsc_dummy_enc_policy = fsopt-&gt;dummy_enc_policy;</div><div class='add'>+	memset(&amp;fsopt-&gt;dummy_enc_policy, 0, sizeof(fsopt-&gt;dummy_enc_policy));</div><div class='add'>+</div><div class='add'>+	warnfc(fc, "test_dummy_encryption mode enabled");</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+static int ceph_apply_test_dummy_encryption(struct super_block *sb,</div><div class='add'>+					    struct fs_context *fc,</div><div class='add'>+					    struct ceph_mount_options *fsopt)</div><div class='add'>+{</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * mount: join the ceph cluster, and open root directory.</div><div class='ctx'>  */</div><div class='ctx'> static struct dentry *ceph_real_mount(struct ceph_fs_client *fsc,</div><div class='ctx'> 				      struct fs_context *fc)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='ctx'> 	int err;</div><div class='ctx'> 	unsigned long started = jiffies;  /* note the start time */</div><div class='ctx'> 	struct dentry *root;</div><div class='ctx'> </div><div class='del'>-	dout("mount start %p\n", fsc);</div><div class='add'>+	doutc(cl, "mount start %p\n", fsc);</div><div class='ctx'> 	mutex_lock(&amp;fsc-&gt;client-&gt;mount_mutex);</div><div class='ctx'> </div><div class='ctx'> 	if (!fsc-&gt;sb-&gt;s_root) {</div><div class='ctx'> 		const char *path = fsc-&gt;mount_options-&gt;server_path ?</div><div class='ctx'> 				     fsc-&gt;mount_options-&gt;server_path + 1 : "";</div><div class='ctx'> </div><div class='del'>-		err = __ceph_open_session(fsc-&gt;client, started);</div><div class='add'>+		err = __ceph_open_session(fsc-&gt;client);</div><div class='ctx'> 		if (err &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -943,7 +1160,12 @@ static struct dentry *ceph_real_mount(struct ceph_fs_client *fsc,</div><div class='ctx'> 				goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		dout("mount opening path '%s'\n", path);</div><div class='add'>+		err = ceph_apply_test_dummy_encryption(fsc-&gt;sb, fc,</div><div class='add'>+						       fsc-&gt;mount_options);</div><div class='add'>+		if (err)</div><div class='add'>+			goto out;</div><div class='add'>+</div><div class='add'>+		doutc(cl, "mount opening path '%s'\n", path);</div><div class='ctx'> </div><div class='ctx'> 		ceph_fs_debugfs_init(fsc);</div><div class='ctx'> </div><div class='hunk'>@@ -958,21 +1180,23 @@ static struct dentry *ceph_real_mount(struct ceph_fs_client *fsc,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	fsc-&gt;mount_state = CEPH_MOUNT_MOUNTED;</div><div class='del'>-	dout("mount success\n");</div><div class='add'>+	doutc(cl, "mount success\n");</div><div class='ctx'> 	mutex_unlock(&amp;fsc-&gt;client-&gt;mount_mutex);</div><div class='ctx'> 	return root;</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	mutex_unlock(&amp;fsc-&gt;client-&gt;mount_mutex);</div><div class='add'>+	ceph_fscrypt_free_dummy_policy(fsc);</div><div class='ctx'> 	return ERR_PTR(err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ceph_set_super(struct super_block *s, struct fs_context *fc)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_fs_client *fsc = s-&gt;s_fs_info;</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	dout("set_super %p\n", s);</div><div class='add'>+	doutc(cl, "%p\n", s);</div><div class='ctx'> </div><div class='ctx'> 	s-&gt;s_maxbytes = MAX_LFS_FILESIZE;</div><div class='ctx'> </div><div class='hunk'>@@ -981,12 +1205,16 @@ static int ceph_set_super(struct super_block *s, struct fs_context *fc)</div><div class='ctx'> 	fsc-&gt;max_file_size = 1ULL &lt;&lt; 40; /* temp value until we get mdsmap */</div><div class='ctx'> </div><div class='ctx'> 	s-&gt;s_op = &amp;ceph_super_ops;</div><div class='del'>-	s-&gt;s_d_op = &amp;ceph_dentry_ops;</div><div class='add'>+	set_default_d_op(s, &amp;ceph_dentry_ops);</div><div class='ctx'> 	s-&gt;s_export_op = &amp;ceph_export_ops;</div><div class='ctx'> </div><div class='ctx'> 	s-&gt;s_time_gran = 1;</div><div class='ctx'> 	s-&gt;s_time_min = 0;</div><div class='ctx'> 	s-&gt;s_time_max = U32_MAX;</div><div class='add'>+	s-&gt;s_flags |= SB_NODIRATIME | SB_NOATIME;</div><div class='add'>+	s-&gt;s_magic = CEPH_SUPER_MAGIC;</div><div class='add'>+</div><div class='add'>+	ceph_fscrypt_set_ops(s);</div><div class='ctx'> </div><div class='ctx'> 	ret = set_anon_super_fc(s, fc);</div><div class='ctx'> 	if (ret != 0)</div><div class='hunk'>@@ -1002,31 +1230,32 @@ static int ceph_compare_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> 	struct ceph_fs_client *new = fc-&gt;s_fs_info;</div><div class='ctx'> 	struct ceph_mount_options *fsopt = new-&gt;mount_options;</div><div class='ctx'> 	struct ceph_options *opt = new-&gt;client-&gt;options;</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_sb_to_client(sb);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_sb_to_fs_client(sb);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='ctx'> </div><div class='del'>-	dout("ceph_compare_super %p\n", sb);</div><div class='add'>+	doutc(cl, "%p\n", sb);</div><div class='ctx'> </div><div class='ctx'> 	if (compare_mount_options(fsopt, opt, fsc)) {</div><div class='del'>-		dout("monitor(s)/mount options don't match\n");</div><div class='add'>+		doutc(cl, "monitor(s)/mount options don't match\n");</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> 	if ((opt-&gt;flags &amp; CEPH_OPT_FSID) &amp;&amp;</div><div class='ctx'> 	    ceph_fsid_compare(&amp;opt-&gt;fsid, &amp;fsc-&gt;client-&gt;fsid)) {</div><div class='del'>-		dout("fsid doesn't match\n");</div><div class='add'>+		doutc(cl, "fsid doesn't match\n");</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (fc-&gt;sb_flags != (sb-&gt;s_flags &amp; ~SB_BORN)) {</div><div class='del'>-		dout("flags differ\n");</div><div class='add'>+		doutc(cl, "flags differ\n");</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (fsc-&gt;blocklisted &amp;&amp; !ceph_test_mount_opt(fsc, CLEANRECOVER)) {</div><div class='del'>-		dout("client is blocklisted (and CLEANRECOVER is not set)\n");</div><div class='add'>+		doutc(cl, "client is blocklisted (and CLEANRECOVER is not set)\n");</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (fsc-&gt;mount_state == CEPH_MOUNT_SHUTDOWN) {</div><div class='del'>-		dout("client has been forcibly unmounted\n");</div><div class='add'>+		doutc(cl, "client has been forcibly unmounted\n");</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1059,6 +1288,7 @@ static int ceph_setup_bdi(struct super_block *sb, struct ceph_fs_client *fsc)</div><div class='ctx'> static int ceph_get_tree(struct fs_context *fc)</div><div class='ctx'> {</div><div class='ctx'> 	struct ceph_parse_opts_ctx *pctx = fc-&gt;fs_private;</div><div class='add'>+	struct ceph_mount_options *fsopt = pctx-&gt;opts;</div><div class='ctx'> 	struct super_block *sb;</div><div class='ctx'> 	struct ceph_fs_client *fsc;</div><div class='ctx'> 	struct dentry *res;</div><div class='hunk'>@@ -1070,6 +1300,8 @@ static int ceph_get_tree(struct fs_context *fc)</div><div class='ctx'> </div><div class='ctx'> 	if (!fc-&gt;source)</div><div class='ctx'> 		return invalfc(fc, "No source");</div><div class='add'>+	if (fsopt-&gt;new_dev_syntax &amp;&amp; !fsopt-&gt;mon_addr)</div><div class='add'>+		return invalfc(fc, "No monitor address");</div><div class='ctx'> </div><div class='ctx'> 	/* create client (which we may/may not use) */</div><div class='ctx'> 	fsc = create_fs_client(pctx-&gt;opts, pctx-&gt;copts);</div><div class='hunk'>@@ -1095,9 +1327,9 @@ static int ceph_get_tree(struct fs_context *fc)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (ceph_sb_to_client(sb) != fsc) {</div><div class='add'>+	if (ceph_sb_to_fs_client(sb) != fsc) {</div><div class='ctx'> 		destroy_fs_client(fsc);</div><div class='del'>-		fsc = ceph_sb_to_client(sb);</div><div class='add'>+		fsc = ceph_sb_to_fs_client(sb);</div><div class='ctx'> 		dout("get_sb got existing client %p\n", fsc);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		dout("get_sb using new client %p\n", fsc);</div><div class='hunk'>@@ -1111,8 +1343,9 @@ static int ceph_get_tree(struct fs_context *fc)</div><div class='ctx'> 		err = PTR_ERR(res);</div><div class='ctx'> 		goto out_splat;</div><div class='ctx'> 	}</div><div class='del'>-	dout("root %p inode %p ino %llx.%llx\n", res,</div><div class='del'>-	     d_inode(res), ceph_vinop(d_inode(res)));</div><div class='add'>+</div><div class='add'>+	doutc(fsc-&gt;client, "root %p inode %p ino %llx.%llx\n", res,</div><div class='add'>+		    d_inode(res), ceph_vinop(d_inode(res)));</div><div class='ctx'> 	fc-&gt;root = fsc-&gt;sb-&gt;s_root;</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='hunk'>@@ -1146,16 +1379,35 @@ static void ceph_free_fc(struct fs_context *fc)</div><div class='ctx'> </div><div class='ctx'> static int ceph_reconfigure_fc(struct fs_context *fc)</div><div class='ctx'> {</div><div class='add'>+	int err;</div><div class='ctx'> 	struct ceph_parse_opts_ctx *pctx = fc-&gt;fs_private;</div><div class='ctx'> 	struct ceph_mount_options *fsopt = pctx-&gt;opts;</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_sb_to_client(fc-&gt;root-&gt;d_sb);</div><div class='add'>+	struct super_block *sb = fc-&gt;root-&gt;d_sb;</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_sb_to_fs_client(sb);</div><div class='add'>+</div><div class='add'>+	err = ceph_apply_test_dummy_encryption(sb, fc, fsopt);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='ctx'> 	if (fsopt-&gt;flags &amp; CEPH_MOUNT_OPT_ASYNC_DIROPS)</div><div class='ctx'> 		ceph_set_mount_opt(fsc, ASYNC_DIROPS);</div><div class='ctx'> 	else</div><div class='ctx'> 		ceph_clear_mount_opt(fsc, ASYNC_DIROPS);</div><div class='ctx'> </div><div class='del'>-	sync_filesystem(fc-&gt;root-&gt;d_sb);</div><div class='add'>+	if (fsopt-&gt;flags &amp; CEPH_MOUNT_OPT_SPARSEREAD)</div><div class='add'>+		ceph_set_mount_opt(fsc, SPARSEREAD);</div><div class='add'>+	else</div><div class='add'>+		ceph_clear_mount_opt(fsc, SPARSEREAD);</div><div class='add'>+</div><div class='add'>+	if (strcmp_null(fsc-&gt;mount_options-&gt;mon_addr, fsopt-&gt;mon_addr)) {</div><div class='add'>+		kfree(fsc-&gt;mount_options-&gt;mon_addr);</div><div class='add'>+		fsc-&gt;mount_options-&gt;mon_addr = fsopt-&gt;mon_addr;</div><div class='add'>+		fsopt-&gt;mon_addr = NULL;</div><div class='add'>+		pr_notice_client(fsc-&gt;client,</div><div class='add'>+			"monitor addresses recorded, but not used for reconnection");</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	sync_filesystem(sb);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1217,15 +1469,113 @@ nomem:</div><div class='ctx'> 	return -ENOMEM;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Return true if it successfully increases the blocker counter,</div><div class='add'>+ * or false if the mdsc is in stopping and flushed state.</div><div class='add'>+ */</div><div class='add'>+static bool __inc_stopping_blocker(struct ceph_mds_client *mdsc)</div><div class='add'>+{</div><div class='add'>+	spin_lock(&amp;mdsc-&gt;stopping_lock);</div><div class='add'>+	if (mdsc-&gt;stopping &gt;= CEPH_MDSC_STOPPING_FLUSHING) {</div><div class='add'>+		spin_unlock(&amp;mdsc-&gt;stopping_lock);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+	atomic_inc(&amp;mdsc-&gt;stopping_blockers);</div><div class='add'>+	spin_unlock(&amp;mdsc-&gt;stopping_lock);</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void __dec_stopping_blocker(struct ceph_mds_client *mdsc)</div><div class='add'>+{</div><div class='add'>+	spin_lock(&amp;mdsc-&gt;stopping_lock);</div><div class='add'>+	if (!atomic_dec_return(&amp;mdsc-&gt;stopping_blockers) &amp;&amp;</div><div class='add'>+	    mdsc-&gt;stopping &gt;= CEPH_MDSC_STOPPING_FLUSHING)</div><div class='add'>+		complete_all(&amp;mdsc-&gt;stopping_waiter);</div><div class='add'>+	spin_unlock(&amp;mdsc-&gt;stopping_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* For metadata IO requests */</div><div class='add'>+bool ceph_inc_mds_stopping_blocker(struct ceph_mds_client *mdsc,</div><div class='add'>+				   struct ceph_mds_session *session)</div><div class='add'>+{</div><div class='add'>+	mutex_lock(&amp;session-&gt;s_mutex);</div><div class='add'>+	inc_session_sequence(session);</div><div class='add'>+	mutex_unlock(&amp;session-&gt;s_mutex);</div><div class='add'>+</div><div class='add'>+	return __inc_stopping_blocker(mdsc);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void ceph_dec_mds_stopping_blocker(struct ceph_mds_client *mdsc)</div><div class='add'>+{</div><div class='add'>+	__dec_stopping_blocker(mdsc);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* For data IO requests */</div><div class='add'>+bool ceph_inc_osd_stopping_blocker(struct ceph_mds_client *mdsc)</div><div class='add'>+{</div><div class='add'>+	return __inc_stopping_blocker(mdsc);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void ceph_dec_osd_stopping_blocker(struct ceph_mds_client *mdsc)</div><div class='add'>+{</div><div class='add'>+	__dec_stopping_blocker(mdsc);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void ceph_kill_sb(struct super_block *s)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_sb_to_client(s);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_sb_to_fs_client(s);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='add'>+	struct ceph_mds_client *mdsc = fsc-&gt;mdsc;</div><div class='add'>+	bool wait;</div><div class='ctx'> </div><div class='del'>-	dout("kill_sb %p\n", s);</div><div class='add'>+	doutc(cl, "%p\n", s);</div><div class='ctx'> </div><div class='del'>-	ceph_mdsc_pre_umount(fsc-&gt;mdsc);</div><div class='add'>+	ceph_mdsc_pre_umount(mdsc);</div><div class='ctx'> 	flush_fs_workqueues(fsc);</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Though the kill_anon_super() will finally trigger the</div><div class='add'>+	 * sync_filesystem() anyway, we still need to do it here and</div><div class='add'>+	 * then bump the stage of shutdown. This will allow us to</div><div class='add'>+	 * drop any further message, which will increase the inodes'</div><div class='add'>+	 * i_count reference counters but makes no sense any more,</div><div class='add'>+	 * from MDSs.</div><div class='add'>+	 *</div><div class='add'>+	 * Without this when evicting the inodes it may fail in the</div><div class='add'>+	 * kill_anon_super(), which will trigger a warning when</div><div class='add'>+	 * destroying the fscrypt keyring and then possibly trigger</div><div class='add'>+	 * a further crash in ceph module when the iput() tries to</div><div class='add'>+	 * evict the inodes later.</div><div class='add'>+	 */</div><div class='add'>+	sync_filesystem(s);</div><div class='add'>+</div><div class='add'>+	if (atomic64_read(&amp;mdsc-&gt;dirty_folios) &gt; 0) {</div><div class='add'>+		wait_queue_head_t *wq = &amp;mdsc-&gt;flush_end_wq;</div><div class='add'>+		long timeleft = wait_event_killable_timeout(*wq,</div><div class='add'>+					atomic64_read(&amp;mdsc-&gt;dirty_folios) &lt;= 0,</div><div class='add'>+					fsc-&gt;client-&gt;options-&gt;mount_timeout);</div><div class='add'>+		if (!timeleft) /* timed out */</div><div class='add'>+			pr_warn_client(cl, "umount timed out, %ld\n", timeleft);</div><div class='add'>+		else if (timeleft &lt; 0) /* killed */</div><div class='add'>+			pr_warn_client(cl, "umount was killed, %ld\n", timeleft);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;mdsc-&gt;stopping_lock);</div><div class='add'>+	mdsc-&gt;stopping = CEPH_MDSC_STOPPING_FLUSHING;</div><div class='add'>+	wait = !!atomic_read(&amp;mdsc-&gt;stopping_blockers);</div><div class='add'>+	spin_unlock(&amp;mdsc-&gt;stopping_lock);</div><div class='add'>+</div><div class='add'>+	if (wait &amp;&amp; atomic_read(&amp;mdsc-&gt;stopping_blockers)) {</div><div class='add'>+		long timeleft = wait_for_completion_killable_timeout(</div><div class='add'>+					&amp;mdsc-&gt;stopping_waiter,</div><div class='add'>+					fsc-&gt;client-&gt;options-&gt;mount_timeout);</div><div class='add'>+		if (!timeleft) /* timed out */</div><div class='add'>+			pr_warn_client(cl, "umount timed out, %ld\n", timeleft);</div><div class='add'>+		else if (timeleft &lt; 0) /* killed */</div><div class='add'>+			pr_warn_client(cl, "umount was killed, %ld\n", timeleft);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	mdsc-&gt;stopping = CEPH_MDSC_STOPPING_FLUSHED;</div><div class='ctx'> 	kill_anon_super(s);</div><div class='ctx'> </div><div class='ctx'> 	fsc-&gt;client-&gt;extra_mon_dispatch = NULL;</div><div class='hunk'>@@ -1241,13 +1591,13 @@ static struct file_system_type ceph_fs_type = {</div><div class='ctx'> 	.name		= "ceph",</div><div class='ctx'> 	.init_fs_context = ceph_init_fs_context,</div><div class='ctx'> 	.kill_sb	= ceph_kill_sb,</div><div class='del'>-	.fs_flags	= FS_RENAME_DOES_D_MOVE,</div><div class='add'>+	.fs_flags	= FS_RENAME_DOES_D_MOVE | FS_ALLOW_IDMAP,</div><div class='ctx'> };</div><div class='ctx'> MODULE_ALIAS_FS("ceph");</div><div class='ctx'> </div><div class='ctx'> int ceph_force_reconnect(struct super_block *sb)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_sb_to_client(sb);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_sb_to_fs_client(sb);</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='ctx'> 	fsc-&gt;mount_state = CEPH_MOUNT_RECOVER;</div><div class='hunk'>@@ -1332,6 +1682,19 @@ bool disable_send_metrics = false;</div><div class='ctx'> module_param_cb(disable_send_metrics, &amp;param_ops_metrics, &amp;disable_send_metrics, 0644);</div><div class='ctx'> MODULE_PARM_DESC(disable_send_metrics, "Enable sending perf metrics to ceph cluster (default: on)");</div><div class='ctx'> </div><div class='add'>+/* for both v1 and v2 syntax */</div><div class='add'>+static bool mount_support = true;</div><div class='add'>+static const struct kernel_param_ops param_ops_mount_syntax = {</div><div class='add'>+	.get = param_get_bool,</div><div class='add'>+};</div><div class='add'>+module_param_cb(mount_syntax_v1, &amp;param_ops_mount_syntax, &amp;mount_support, 0444);</div><div class='add'>+module_param_cb(mount_syntax_v2, &amp;param_ops_mount_syntax, &amp;mount_support, 0444);</div><div class='add'>+</div><div class='add'>+bool enable_unsafe_idmap = false;</div><div class='add'>+module_param(enable_unsafe_idmap, bool, 0644);</div><div class='add'>+MODULE_PARM_DESC(enable_unsafe_idmap,</div><div class='add'>+		 "Allow to use idmapped mounts with MDS without CEPHFS_FEATURE_HAS_OWNER_UIDGID");</div><div class='add'>+</div><div class='ctx'> module_init(init_ceph);</div><div class='ctx'> module_exit(exit_ceph);</div><div class='ctx'> </div><div class='head'>diff --git a/fs/ceph/super.h b/fs/ceph/super.h<br/>index 14f951cd5b61..a1f781c46b41 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ceph/super.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/super.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/super.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/super.h</a></div><div class='hunk'>@@ -3,8 +3,9 @@</div><div class='ctx'> #define _FS_CEPH_SUPER_H</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/ceph/ceph_debug.h&gt;</div><div class='add'>+#include &lt;linux/ceph/osd_client.h&gt;</div><div class='ctx'> </div><div class='del'>-#include &lt;asm/unaligned.h&gt;</div><div class='add'>+#include &lt;linux/unaligned.h&gt;</div><div class='ctx'> #include &lt;linux/backing-dev.h&gt;</div><div class='ctx'> #include &lt;linux/completion.h&gt;</div><div class='ctx'> #include &lt;linux/exportfs.h&gt;</div><div class='hunk'>@@ -17,21 +18,18 @@</div><div class='ctx'> #include &lt;linux/posix_acl.h&gt;</div><div class='ctx'> #include &lt;linux/refcount.h&gt;</div><div class='ctx'> #include &lt;linux/security.h&gt;</div><div class='del'>-</div><div class='del'>-#include &lt;linux/ceph/libceph.h&gt;</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_CEPH_FSCACHE</div><div class='del'>-#define FSCACHE_USE_NEW_IO_API</div><div class='add'>+#include &lt;linux/netfs.h&gt;</div><div class='ctx'> #include &lt;linux/fscache.h&gt;</div><div class='del'>-#endif</div><div class='add'>+#include &lt;linux/hashtable.h&gt;</div><div class='ctx'> </div><div class='del'>-/* f_type in struct statfs */</div><div class='del'>-#define CEPH_SUPER_MAGIC 0x00c36400</div><div class='add'>+#include &lt;linux/ceph/libceph.h&gt;</div><div class='add'>+#include "crypto.h"</div><div class='ctx'> </div><div class='ctx'> /* large granularity for statfs utilization stats to facilitate</div><div class='ctx'>  * large volume sizes on 32-bit machines. */</div><div class='ctx'> #define CEPH_BLOCK_SHIFT   22  /* 4 MB */</div><div class='ctx'> #define CEPH_BLOCK         (1 &lt;&lt; CEPH_BLOCK_SHIFT)</div><div class='add'>+#define CEPH_4K_BLOCK_SHIFT 12  /* 4 KB */</div><div class='ctx'> </div><div class='ctx'> #define CEPH_MOUNT_OPT_CLEANRECOVER    (1&lt;&lt;1) /* auto reonnect (clean mode) after blocklisted */</div><div class='ctx'> #define CEPH_MOUNT_OPT_DIRSTAT         (1&lt;&lt;4) /* `cat dirname` for stats */</div><div class='hunk'>@@ -45,10 +43,13 @@</div><div class='ctx'> #define CEPH_MOUNT_OPT_NOQUOTADF       (1&lt;&lt;13) /* no root dir quota in statfs */</div><div class='ctx'> #define CEPH_MOUNT_OPT_NOCOPYFROM      (1&lt;&lt;14) /* don't use RADOS 'copy-from' op */</div><div class='ctx'> #define CEPH_MOUNT_OPT_ASYNC_DIROPS    (1&lt;&lt;15) /* allow async directory ops */</div><div class='add'>+#define CEPH_MOUNT_OPT_NOPAGECACHE     (1&lt;&lt;16) /* bypass pagecache altogether */</div><div class='add'>+#define CEPH_MOUNT_OPT_SPARSEREAD      (1&lt;&lt;17) /* always do sparse reads */</div><div class='ctx'> </div><div class='ctx'> #define CEPH_MOUNT_OPT_DEFAULT			\</div><div class='ctx'> 	(CEPH_MOUNT_OPT_DCACHE |		\</div><div class='del'>-	 CEPH_MOUNT_OPT_NOCOPYFROM)</div><div class='add'>+	 CEPH_MOUNT_OPT_NOCOPYFROM |		\</div><div class='add'>+	 CEPH_MOUNT_OPT_ASYNC_DIROPS)</div><div class='ctx'> </div><div class='ctx'> #define ceph_set_mount_opt(fsc, opt) \</div><div class='ctx'> 	(fsc)-&gt;mount_options-&gt;flags |= CEPH_MOUNT_OPT_##opt</div><div class='hunk'>@@ -59,7 +60,7 @@</div><div class='ctx'> </div><div class='ctx'> /* max size of osd read request, limited by libceph */</div><div class='ctx'> #define CEPH_MAX_READ_SIZE              CEPH_MSG_MAX_DATA_LEN</div><div class='del'>-/* osd has a configurable limitaion of max write size.</div><div class='add'>+/* osd has a configurable limitation of max write size.</div><div class='ctx'>  * CEPH_MSG_MAX_DATA_LEN should be small enough. */</div><div class='ctx'> #define CEPH_MAX_WRITE_SIZE		CEPH_MSG_MAX_DATA_LEN</div><div class='ctx'> #define CEPH_RASIZE_DEFAULT             (8192*1024)    /* max readahead */</div><div class='hunk'>@@ -88,6 +89,8 @@ struct ceph_mount_options {</div><div class='ctx'> 	unsigned int max_readdir;       /* max readdir result (entries) */</div><div class='ctx'> 	unsigned int max_readdir_bytes; /* max readdir result (bytes) */</div><div class='ctx'> </div><div class='add'>+	bool new_dev_syntax;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * everything above this point can be memcmp'd; everything below</div><div class='ctx'> 	 * is handled in compare_mount_options()</div><div class='hunk'>@@ -97,8 +100,37 @@ struct ceph_mount_options {</div><div class='ctx'> 	char *mds_namespace;  /* default NULL */</div><div class='ctx'> 	char *server_path;    /* default NULL (means "/") */</div><div class='ctx'> 	char *fscache_uniq;   /* default NULL */</div><div class='add'>+	char *mon_addr;</div><div class='add'>+	struct fscrypt_dummy_policy dummy_enc_policy;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Check if the mds namespace in ceph_mount_options matches</div><div class='add'>+ * the passed in namespace string. First time match (when</div><div class='add'>+ * -&gt;mds_namespace is NULL) is treated specially, since</div><div class='add'>+ * -&gt;mds_namespace needs to be initialized by the caller.</div><div class='add'>+ */</div><div class='add'>+static inline int namespace_equals(struct ceph_mount_options *fsopt,</div><div class='add'>+				   const char *namespace, size_t len)</div><div class='add'>+{</div><div class='add'>+	return !(fsopt-&gt;mds_namespace &amp;&amp;</div><div class='add'>+		 (strlen(fsopt-&gt;mds_namespace) != len ||</div><div class='add'>+		  strncmp(fsopt-&gt;mds_namespace, namespace, len)));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* mount state */</div><div class='add'>+enum {</div><div class='add'>+	CEPH_MOUNT_MOUNTING,</div><div class='add'>+	CEPH_MOUNT_MOUNTED,</div><div class='add'>+	CEPH_MOUNT_UNMOUNTING,</div><div class='add'>+	CEPH_MOUNT_UNMOUNTED,</div><div class='add'>+	CEPH_MOUNT_SHUTDOWN,</div><div class='add'>+	CEPH_MOUNT_RECOVER,</div><div class='add'>+	CEPH_MOUNT_FENCE_IO,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+#define CEPH_ASYNC_CREATE_CONFLICT_BITS 8</div><div class='add'>+</div><div class='ctx'> struct ceph_fs_client {</div><div class='ctx'> 	struct super_block *sb;</div><div class='ctx'> </div><div class='hunk'>@@ -119,26 +151,32 @@ struct ceph_fs_client {</div><div class='ctx'> 	struct ceph_mds_client *mdsc;</div><div class='ctx'> </div><div class='ctx'> 	atomic_long_t writeback_count;</div><div class='add'>+	bool write_congested;</div><div class='ctx'> </div><div class='ctx'> 	struct workqueue_struct *inode_wq;</div><div class='ctx'> 	struct workqueue_struct *cap_wq;</div><div class='ctx'> </div><div class='add'>+	DECLARE_HASHTABLE(async_unlink_conflict, CEPH_ASYNC_CREATE_CONFLICT_BITS);</div><div class='add'>+	spinlock_t async_unlink_conflict_lock;</div><div class='add'>+</div><div class='ctx'> #ifdef CONFIG_DEBUG_FS</div><div class='ctx'> 	struct dentry *debugfs_dentry_lru, *debugfs_caps;</div><div class='ctx'> 	struct dentry *debugfs_congestion_kb;</div><div class='ctx'> 	struct dentry *debugfs_bdi;</div><div class='ctx'> 	struct dentry *debugfs_mdsc, *debugfs_mdsmap;</div><div class='del'>-	struct dentry *debugfs_metric;</div><div class='ctx'> 	struct dentry *debugfs_status;</div><div class='ctx'> 	struct dentry *debugfs_mds_sessions;</div><div class='add'>+	struct dentry *debugfs_metrics_dir;</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_CEPH_FSCACHE</div><div class='del'>-	struct fscache_cookie *fscache;</div><div class='add'>+	struct fscache_volume *fscache;</div><div class='add'>+#endif</div><div class='add'>+#ifdef CONFIG_FS_ENCRYPTION</div><div class='add'>+	struct fscrypt_dummy_policy fsc_dummy_enc_policy;</div><div class='ctx'> #endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * File i/o capability.  This tracks shared state with the metadata</div><div class='ctx'>  * server that allows us to cache or writeback attributes or to read</div><div class='hunk'>@@ -176,9 +214,10 @@ struct ceph_cap {</div><div class='ctx'> 	struct list_head caps_item;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-#define CHECK_CAPS_AUTHONLY   1  /* only check auth cap */</div><div class='del'>-#define CHECK_CAPS_FLUSH      2  /* flush any dirty caps */</div><div class='del'>-#define CHECK_CAPS_NOINVAL    4  /* don't invalidate pagecache */</div><div class='add'>+#define CHECK_CAPS_AUTHONLY     1  /* only check auth cap */</div><div class='add'>+#define CHECK_CAPS_FLUSH        2  /* flush any dirty caps */</div><div class='add'>+#define CHECK_CAPS_NOINVAL      4  /* don't invalidate pagecache */</div><div class='add'>+#define CHECK_CAPS_FLUSH_FORCE  8  /* force flush any caps */</div><div class='ctx'> </div><div class='ctx'> struct ceph_cap_flush {</div><div class='ctx'> 	u64 tid;</div><div class='hunk'>@@ -228,7 +267,7 @@ static inline void ceph_put_cap_snap(struct ceph_cap_snap *capsnap)</div><div class='ctx'> 	if (refcount_dec_and_test(&amp;capsnap-&gt;nref)) {</div><div class='ctx'> 		if (capsnap-&gt;xattr_blob)</div><div class='ctx'> 			ceph_buffer_put(capsnap-&gt;xattr_blob);</div><div class='del'>-		kfree(capsnap);</div><div class='add'>+		kmem_cache_free(ceph_cap_snap_cachep, capsnap);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -279,7 +318,8 @@ struct ceph_dentry_info {</div><div class='ctx'> 	struct dentry *dentry;</div><div class='ctx'> 	struct ceph_mds_session *lease_session;</div><div class='ctx'> 	struct list_head lease_list;</div><div class='del'>-	unsigned flags;</div><div class='add'>+	struct hlist_node hnode;</div><div class='add'>+	unsigned long flags;</div><div class='ctx'> 	int lease_shared_gen;</div><div class='ctx'> 	u32 lease_gen;</div><div class='ctx'> 	u32 lease_seq;</div><div class='hunk'>@@ -288,10 +328,14 @@ struct ceph_dentry_info {</div><div class='ctx'> 	u64 offset;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-#define CEPH_DENTRY_REFERENCED		1</div><div class='del'>-#define CEPH_DENTRY_LEASE_LIST		2</div><div class='del'>-#define CEPH_DENTRY_SHRINK_LIST		4</div><div class='del'>-#define CEPH_DENTRY_PRIMARY_LINK	8</div><div class='add'>+#define CEPH_DENTRY_REFERENCED		(1 &lt;&lt; 0)</div><div class='add'>+#define CEPH_DENTRY_LEASE_LIST		(1 &lt;&lt; 1)</div><div class='add'>+#define CEPH_DENTRY_SHRINK_LIST		(1 &lt;&lt; 2)</div><div class='add'>+#define CEPH_DENTRY_PRIMARY_LINK	(1 &lt;&lt; 3)</div><div class='add'>+#define CEPH_DENTRY_ASYNC_UNLINK_BIT	(4)</div><div class='add'>+#define CEPH_DENTRY_ASYNC_UNLINK	(1 &lt;&lt; CEPH_DENTRY_ASYNC_UNLINK_BIT)</div><div class='add'>+#define CEPH_DENTRY_ASYNC_CREATE_BIT	(5)</div><div class='add'>+#define CEPH_DENTRY_ASYNC_CREATE	(1 &lt;&lt; CEPH_DENTRY_ASYNC_CREATE_BIT)</div><div class='ctx'> </div><div class='ctx'> struct ceph_inode_xattrs_info {</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -315,6 +359,7 @@ struct ceph_inode_xattrs_info {</div><div class='ctx'>  * Ceph inode.</div><div class='ctx'>  */</div><div class='ctx'> struct ceph_inode_info {</div><div class='add'>+	struct netfs_inode netfs; /* Netfslib context and vfs inode */</div><div class='ctx'> 	struct ceph_vino i_vino;   /* ceph ino + snap */</div><div class='ctx'> </div><div class='ctx'> 	spinlock_t i_ceph_lock;</div><div class='hunk'>@@ -395,6 +440,11 @@ struct ceph_inode_info {</div><div class='ctx'> 	u32 i_truncate_seq;        /* last truncate to smaller size */</div><div class='ctx'> 	u64 i_truncate_size;       /*  and the size we last truncated down to */</div><div class='ctx'> 	int i_truncate_pending;    /*  still need to call vmtruncate */</div><div class='add'>+	/*</div><div class='add'>+	 * For none fscrypt case it equals to i_truncate_size or it will</div><div class='add'>+	 * equals to fscrypt_file_size</div><div class='add'>+	 */</div><div class='add'>+	u64 i_truncate_pagecache_size;</div><div class='ctx'> </div><div class='ctx'> 	u64 i_max_size;            /* max file size authorized by mds */</div><div class='ctx'> 	u64 i_reported_size; /* (max_)size reported to or requested of mds */</div><div class='hunk'>@@ -426,26 +476,42 @@ struct ceph_inode_info {</div><div class='ctx'> 	struct work_struct i_work;</div><div class='ctx'> 	unsigned long  i_work_mask;</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_CEPH_FSCACHE</div><div class='del'>-	struct fscache_cookie *fscache;</div><div class='add'>+#ifdef CONFIG_FS_ENCRYPTION</div><div class='add'>+	struct fscrypt_inode_info *i_crypt_info;</div><div class='add'>+	u32 fscrypt_auth_len;</div><div class='add'>+	u32 fscrypt_file_len;</div><div class='add'>+	u8 *fscrypt_auth;</div><div class='add'>+	u8 *fscrypt_file;</div><div class='ctx'> #endif</div><div class='del'>-	struct inode vfs_inode; /* at end */</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct ceph_netfs_request_data {</div><div class='add'>+	int caps;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Maximum size of a file readahead request.</div><div class='add'>+	 * The fadvise could update the bdi's default ra_pages.</div><div class='add'>+	 */</div><div class='add'>+	unsigned int file_ra_pages;</div><div class='add'>+</div><div class='add'>+	/* Set it if fadvise disables file readahead entirely */</div><div class='add'>+	bool file_ra_disabled;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static inline struct ceph_inode_info *</div><div class='ctx'> ceph_inode(const struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	return container_of(inode, struct ceph_inode_info, vfs_inode);</div><div class='add'>+	return container_of(inode, struct ceph_inode_info, netfs.inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline struct ceph_fs_client *</div><div class='del'>-ceph_inode_to_client(const struct inode *inode)</div><div class='add'>+ceph_inode_to_fs_client(const struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	return (struct ceph_fs_client *)inode-&gt;i_sb-&gt;s_fs_info;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline struct ceph_fs_client *</div><div class='del'>-ceph_sb_to_client(const struct super_block *sb)</div><div class='add'>+ceph_sb_to_fs_client(const struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	return (struct ceph_fs_client *)sb-&gt;s_fs_info;</div><div class='ctx'> }</div><div class='hunk'>@@ -453,7 +519,13 @@ ceph_sb_to_client(const struct super_block *sb)</div><div class='ctx'> static inline struct ceph_mds_client *</div><div class='ctx'> ceph_sb_to_mdsc(const struct super_block *sb)</div><div class='ctx'> {</div><div class='del'>-	return (struct ceph_mds_client *)ceph_sb_to_client(sb)-&gt;mdsc;</div><div class='add'>+	return (struct ceph_mds_client *)ceph_sb_to_fs_client(sb)-&gt;mdsc;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline struct ceph_client *</div><div class='add'>+ceph_inode_to_client(const struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	return (struct ceph_client *)ceph_inode_to_fs_client(inode)-&gt;client;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline struct ceph_vino</div><div class='hunk'>@@ -509,7 +581,7 @@ static inline u64 ceph_snap(struct inode *inode)</div><div class='ctx'>  */</div><div class='ctx'> static inline u64 ceph_present_ino(struct super_block *sb, u64 ino)</div><div class='ctx'> {</div><div class='del'>-	if (unlikely(ceph_test_mount_opt(ceph_sb_to_client(sb), INO32)))</div><div class='add'>+	if (unlikely(ceph_test_mount_opt(ceph_sb_to_fs_client(sb), INO32)))</div><div class='ctx'> 		return ceph_ino_to_ino32(ino);</div><div class='ctx'> 	return ino;</div><div class='ctx'> }</div><div class='hunk'>@@ -534,19 +606,23 @@ static inline int ceph_ino_compare(struct inode *inode, void *data)</div><div class='ctx'>  *</div><div class='ctx'>  * These come from src/mds/mdstypes.h in the ceph sources.</div><div class='ctx'>  */</div><div class='del'>-#define CEPH_MAX_MDS		0x100</div><div class='del'>-#define CEPH_NUM_STRAY		10</div><div class='add'>+#define CEPH_MAX_MDS			0x100</div><div class='add'>+#define CEPH_NUM_STRAY			10</div><div class='ctx'> #define CEPH_MDS_INO_MDSDIR_OFFSET	(1 * CEPH_MAX_MDS)</div><div class='add'>+#define CEPH_MDS_INO_LOG_OFFSET		(2 * CEPH_MAX_MDS)</div><div class='ctx'> #define CEPH_INO_SYSTEM_BASE		((6*CEPH_MAX_MDS) + (CEPH_MAX_MDS * CEPH_NUM_STRAY))</div><div class='ctx'> </div><div class='ctx'> static inline bool ceph_vino_is_reserved(const struct ceph_vino vino)</div><div class='ctx'> {</div><div class='del'>-	if (vino.ino &lt; CEPH_INO_SYSTEM_BASE &amp;&amp;</div><div class='del'>-	    vino.ino &gt;= CEPH_MDS_INO_MDSDIR_OFFSET) {</div><div class='del'>-		WARN_RATELIMIT(1, "Attempt to access reserved inode number 0x%llx", vino.ino);</div><div class='del'>-		return true;</div><div class='del'>-	}</div><div class='del'>-	return false;</div><div class='add'>+	if (vino.ino &gt;= CEPH_INO_SYSTEM_BASE ||</div><div class='add'>+	    vino.ino &lt; CEPH_MDS_INO_MDSDIR_OFFSET)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/* Don't warn on mdsdirs */</div><div class='add'>+	WARN_RATELIMIT(vino.ino &gt;= CEPH_MDS_INO_LOG_OFFSET,</div><div class='add'>+			"Attempt to access reserved inode number 0x%llx",</div><div class='add'>+			vino.ino);</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline struct inode *ceph_find_inode(struct super_block *sb,</div><div class='hunk'>@@ -577,9 +653,13 @@ static inline struct inode *ceph_find_inode(struct super_block *sb,</div><div class='ctx'> #define CEPH_I_FLUSH_SNAPS	(1 &lt;&lt; 8)  /* need flush snapss */</div><div class='ctx'> #define CEPH_I_ERROR_WRITE	(1 &lt;&lt; 9) /* have seen write errors */</div><div class='ctx'> #define CEPH_I_ERROR_FILELOCK	(1 &lt;&lt; 10) /* have seen file lock errors */</div><div class='del'>-#define CEPH_I_ODIRECT		(1 &lt;&lt; 11) /* inode in direct I/O mode */</div><div class='add'>+#define CEPH_I_ODIRECT_BIT	(11) /* inode in direct I/O mode */</div><div class='add'>+#define CEPH_I_ODIRECT		(1 &lt;&lt; CEPH_I_ODIRECT_BIT)</div><div class='ctx'> #define CEPH_ASYNC_CREATE_BIT	(12)	  /* async create in flight for this */</div><div class='ctx'> #define CEPH_I_ASYNC_CREATE	(1 &lt;&lt; CEPH_ASYNC_CREATE_BIT)</div><div class='add'>+#define CEPH_I_SHUTDOWN		(1 &lt;&lt; 13) /* inode is no longer usable */</div><div class='add'>+#define CEPH_I_ASYNC_CHECK_CAPS	(1 &lt;&lt; 14) /* check caps immediately after async</div><div class='add'>+					     creating finishes */</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Masks of ceph inode work.</div><div class='hunk'>@@ -732,7 +812,6 @@ extern int __ceph_mark_dirty_caps(struct ceph_inode_info *ci, int mask,</div><div class='ctx'> </div><div class='ctx'> extern int __ceph_caps_revoking_other(struct ceph_inode_info *ci,</div><div class='ctx'> 				      struct ceph_cap *ocap, int mask);</div><div class='del'>-extern int ceph_caps_revoking(struct ceph_inode_info *ci, int mask);</div><div class='ctx'> extern int __ceph_caps_used(struct ceph_inode_info *ci);</div><div class='ctx'> </div><div class='ctx'> static inline bool __ceph_is_file_opened(struct ceph_inode_info *ci)</div><div class='hunk'>@@ -756,6 +835,8 @@ extern void ceph_unreserve_caps(struct ceph_mds_client *mdsc,</div><div class='ctx'> extern void ceph_reservation_status(struct ceph_fs_client *client,</div><div class='ctx'> 				    int *total, int *avail, int *used,</div><div class='ctx'> 				    int *reserved, int *min);</div><div class='add'>+extern void change_auth_cap_ses(struct ceph_inode_info *ci,</div><div class='add'>+				struct ceph_mds_session *session);</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> </div><div class='hunk'>@@ -773,7 +854,6 @@ struct ceph_file_info {</div><div class='ctx'> 	struct list_head rw_contexts;</div><div class='ctx'> </div><div class='ctx'> 	u32 filp_gen;</div><div class='del'>-	atomic_t num_locks;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct ceph_dir_file_info {</div><div class='hunk'>@@ -839,7 +919,7 @@ ceph_find_rw_context(struct ceph_file_info *cf)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct ceph_readdir_cache_control {</div><div class='del'>-	struct page  *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	struct dentry **dentries;</div><div class='ctx'> 	int index;</div><div class='ctx'> };</div><div class='hunk'>@@ -876,6 +956,8 @@ struct ceph_snap_realm {</div><div class='ctx'> </div><div class='ctx'> 	struct list_head dirty_item;     /* if realm needs new context */</div><div class='ctx'> </div><div class='add'>+	struct list_head rebuild_item;   /* rebuild snap realms _downward_ in hierarchy */</div><div class='add'>+</div><div class='ctx'> 	/* the current set of snaps for this realm */</div><div class='ctx'> 	struct ceph_snap_context *cached_context;</div><div class='ctx'> </div><div class='hunk'>@@ -931,7 +1013,7 @@ extern void ceph_handle_snap(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			     struct ceph_msg *msg);</div><div class='ctx'> extern int __ceph_finish_cap_snap(struct ceph_inode_info *ci,</div><div class='ctx'> 				  struct ceph_cap_snap *capsnap);</div><div class='del'>-extern void ceph_cleanup_empty_realms(struct ceph_mds_client *mdsc);</div><div class='add'>+extern void ceph_cleanup_global_and_empty_realms(struct ceph_mds_client *mdsc);</div><div class='ctx'> </div><div class='ctx'> extern struct ceph_snapid_map *ceph_get_snapid_map(struct ceph_mds_client *mdsc,</div><div class='ctx'> 						   u64 snap);</div><div class='hunk'>@@ -939,6 +1021,7 @@ extern void ceph_put_snapid_map(struct ceph_mds_client* mdsc,</div><div class='ctx'> 				struct ceph_snapid_map *sm);</div><div class='ctx'> extern void ceph_trim_snapid_map(struct ceph_mds_client *mdsc);</div><div class='ctx'> extern void ceph_cleanup_snapid_map(struct ceph_mds_client *mdsc);</div><div class='add'>+void ceph_umount_begin(struct super_block *sb);</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -955,6 +1038,7 @@ static inline bool __ceph_have_pending_cap_snap(struct ceph_inode_info *ci)</div><div class='ctx'> /* inode.c */</div><div class='ctx'> struct ceph_mds_reply_info_in;</div><div class='ctx'> struct ceph_mds_reply_dirfrag;</div><div class='add'>+struct ceph_acl_sec_ctx;</div><div class='ctx'> </div><div class='ctx'> extern const struct inode_operations ceph_file_iops;</div><div class='ctx'> </div><div class='hunk'>@@ -962,8 +1046,14 @@ extern struct inode *ceph_alloc_inode(struct super_block *sb);</div><div class='ctx'> extern void ceph_evict_inode(struct inode *inode);</div><div class='ctx'> extern void ceph_free_inode(struct inode *inode);</div><div class='ctx'> </div><div class='add'>+struct inode *ceph_new_inode(struct inode *dir, struct dentry *dentry,</div><div class='add'>+			     umode_t *mode, struct ceph_acl_sec_ctx *as_ctx);</div><div class='add'>+void ceph_as_ctx_to_req(struct ceph_mds_request *req,</div><div class='add'>+			struct ceph_acl_sec_ctx *as_ctx);</div><div class='add'>+</div><div class='ctx'> extern struct inode *ceph_get_inode(struct super_block *sb,</div><div class='del'>-				    struct ceph_vino vino);</div><div class='add'>+				    struct ceph_vino vino,</div><div class='add'>+				    struct inode *newino);</div><div class='ctx'> extern struct inode *ceph_get_snapdir(struct inode *parent);</div><div class='ctx'> extern int ceph_fill_file_size(struct inode *inode, int issued,</div><div class='ctx'> 			       u32 truncate_seq, u64 truncate_size, u64 size);</div><div class='hunk'>@@ -981,8 +1071,6 @@ extern int ceph_fill_trace(struct super_block *sb,</div><div class='ctx'> extern int ceph_readdir_prepopulate(struct ceph_mds_request *req,</div><div class='ctx'> 				    struct ceph_mds_session *session);</div><div class='ctx'> </div><div class='del'>-extern int ceph_inode_holds_cap(struct inode *inode, int mask);</div><div class='del'>-</div><div class='ctx'> extern bool ceph_inode_set_size(struct inode *inode, loff_t size);</div><div class='ctx'> extern void __ceph_do_pending_vmtruncate(struct inode *inode);</div><div class='ctx'> </div><div class='hunk'>@@ -1013,28 +1101,46 @@ static inline void ceph_queue_flush_snaps(struct inode *inode)</div><div class='ctx'> 	ceph_queue_inode_work(inode, CEPH_I_WORK_FLUSH_SNAPS);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+extern int ceph_try_to_choose_auth_mds(struct inode *inode, int mask);</div><div class='ctx'> extern int __ceph_do_getattr(struct inode *inode, struct page *locked_page,</div><div class='ctx'> 			     int mask, bool force);</div><div class='ctx'> static inline int ceph_do_getattr(struct inode *inode, int mask, bool force)</div><div class='ctx'> {</div><div class='ctx'> 	return __ceph_do_getattr(inode, NULL, mask, force);</div><div class='ctx'> }</div><div class='del'>-extern int ceph_permission(struct user_namespace *mnt_userns,</div><div class='add'>+extern int ceph_permission(struct mnt_idmap *idmap,</div><div class='ctx'> 			   struct inode *inode, int mask);</div><div class='del'>-extern int __ceph_setattr(struct inode *inode, struct iattr *attr);</div><div class='del'>-extern int ceph_setattr(struct user_namespace *mnt_userns,</div><div class='add'>+</div><div class='add'>+struct ceph_iattr {</div><div class='add'>+	struct ceph_fscrypt_auth	*fscrypt_auth;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+extern int __ceph_setattr(struct mnt_idmap *idmap, struct inode *inode,</div><div class='add'>+			  struct iattr *attr, struct ceph_iattr *cia);</div><div class='add'>+extern int ceph_setattr(struct mnt_idmap *idmap,</div><div class='ctx'> 			struct dentry *dentry, struct iattr *attr);</div><div class='del'>-extern int ceph_getattr(struct user_namespace *mnt_userns,</div><div class='add'>+extern int ceph_getattr(struct mnt_idmap *idmap,</div><div class='ctx'> 			const struct path *path, struct kstat *stat,</div><div class='ctx'> 			u32 request_mask, unsigned int flags);</div><div class='add'>+void ceph_inode_shutdown(struct inode *inode);</div><div class='add'>+</div><div class='add'>+static inline bool ceph_inode_is_shutdown(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	unsigned long flags = READ_ONCE(ceph_inode(inode)-&gt;i_ceph_flags);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_inode_to_fs_client(inode);</div><div class='add'>+	int state = READ_ONCE(fsc-&gt;mount_state);</div><div class='add'>+</div><div class='add'>+	return (flags &amp; CEPH_I_SHUTDOWN) || state &gt;= CEPH_MOUNT_SHUTDOWN;</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /* xattr.c */</div><div class='ctx'> int __ceph_setxattr(struct inode *, const char *, const void *, size_t, int);</div><div class='add'>+int ceph_do_getvxattr(struct inode *inode, const char *name, void *value, size_t size);</div><div class='ctx'> ssize_t __ceph_getxattr(struct inode *, const char *, void *, size_t);</div><div class='ctx'> extern ssize_t ceph_listxattr(struct dentry *, char *, size_t);</div><div class='ctx'> extern struct ceph_buffer *__ceph_build_xattrs_blob(struct ceph_inode_info *ci);</div><div class='ctx'> extern void __ceph_destroy_xattrs(struct ceph_inode_info *ci);</div><div class='del'>-extern const struct xattr_handler *ceph_xattr_handlers[];</div><div class='add'>+extern const struct xattr_handler * const ceph_xattr_handlers[];</div><div class='ctx'> </div><div class='ctx'> struct ceph_acl_sec_ctx {</div><div class='ctx'> #ifdef CONFIG_CEPH_FS_POSIX_ACL</div><div class='hunk'>@@ -1042,8 +1148,10 @@ struct ceph_acl_sec_ctx {</div><div class='ctx'> 	void *acl;</div><div class='ctx'> #endif</div><div class='ctx'> #ifdef CONFIG_CEPH_FS_SECURITY_LABEL</div><div class='del'>-	void *sec_ctx;</div><div class='del'>-	u32 sec_ctxlen;</div><div class='add'>+	struct lsm_context lsmctx;</div><div class='add'>+#endif</div><div class='add'>+#ifdef CONFIG_FS_ENCRYPTION</div><div class='add'>+	struct ceph_fscrypt_auth *fscrypt_auth;</div><div class='ctx'> #endif</div><div class='ctx'> 	struct ceph_pagelist *pagelist;</div><div class='ctx'> };</div><div class='hunk'>@@ -1086,8 +1194,8 @@ void ceph_release_acl_sec_ctx(struct ceph_acl_sec_ctx *as_ctx);</div><div class='ctx'> #ifdef CONFIG_CEPH_FS_POSIX_ACL</div><div class='ctx'> </div><div class='ctx'> struct posix_acl *ceph_get_acl(struct inode *, int, bool);</div><div class='del'>-int ceph_set_acl(struct user_namespace *mnt_userns,</div><div class='del'>-		 struct inode *inode, struct posix_acl *acl, int type);</div><div class='add'>+int ceph_set_acl(struct mnt_idmap *idmap,</div><div class='add'>+		 struct dentry *dentry, struct posix_acl *acl, int type);</div><div class='ctx'> int ceph_pre_init_acls(struct inode *dir, umode_t *mode,</div><div class='ctx'> 		       struct ceph_acl_sec_ctx *as_ctx);</div><div class='ctx'> void ceph_init_inode_acls(struct inode *inode,</div><div class='hunk'>@@ -1112,10 +1220,6 @@ static inline void ceph_init_inode_acls(struct inode *inode,</div><div class='ctx'> 					struct ceph_acl_sec_ctx *as_ctx)</div><div class='ctx'> {</div><div class='ctx'> }</div><div class='del'>-static inline int ceph_acl_chmod(struct dentry *dentry, struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='ctx'> </div><div class='ctx'> static inline void ceph_forget_all_cached_acls(struct inode *inode)</div><div class='ctx'> {</div><div class='hunk'>@@ -1135,7 +1239,8 @@ extern void ceph_add_cap(struct inode *inode,</div><div class='ctx'> 			 unsigned cap, unsigned seq, u64 realmino, int flags,</div><div class='ctx'> 			 struct ceph_cap **new_cap);</div><div class='ctx'> extern void __ceph_remove_cap(struct ceph_cap *cap, bool queue_release);</div><div class='del'>-extern void ceph_remove_cap(struct ceph_cap *cap, bool queue_release);</div><div class='add'>+extern void ceph_remove_cap(struct ceph_mds_client *mdsc, struct ceph_cap *cap,</div><div class='add'>+			    bool queue_release);</div><div class='ctx'> extern void __ceph_remove_caps(struct ceph_inode_info *ci);</div><div class='ctx'> extern void ceph_put_cap(struct ceph_mds_client *mdsc,</div><div class='ctx'> 			 struct ceph_cap *cap);</div><div class='hunk'>@@ -1150,6 +1255,8 @@ extern void ceph_kick_flushing_caps(struct ceph_mds_client *mdsc,</div><div class='ctx'> 				    struct ceph_mds_session *session);</div><div class='ctx'> void ceph_kick_flushing_inode_caps(struct ceph_mds_session *session,</div><div class='ctx'> 				   struct ceph_inode_info *ci);</div><div class='add'>+extern struct ceph_cap *__get_cap_for_mds(struct ceph_inode_info *ci,</div><div class='add'>+					  int mds);</div><div class='ctx'> extern struct ceph_cap *ceph_get_cap_for_mds(struct ceph_inode_info *ci,</div><div class='ctx'> 					     int mds);</div><div class='ctx'> extern void ceph_take_cap_refs(struct ceph_inode_info *ci, int caps,</div><div class='hunk'>@@ -1157,8 +1264,6 @@ extern void ceph_take_cap_refs(struct ceph_inode_info *ci, int caps,</div><div class='ctx'> extern void ceph_get_cap_refs(struct ceph_inode_info *ci, int caps);</div><div class='ctx'> extern void ceph_put_cap_refs(struct ceph_inode_info *ci, int had);</div><div class='ctx'> extern void ceph_put_cap_refs_async(struct ceph_inode_info *ci, int had);</div><div class='del'>-extern void ceph_put_cap_refs_no_check_caps(struct ceph_inode_info *ci,</div><div class='del'>-					    int had);</div><div class='ctx'> extern void ceph_put_wrbuffer_cap_refs(struct ceph_inode_info *ci, int nr,</div><div class='ctx'> 				       struct ceph_snap_context *snapc);</div><div class='ctx'> extern void __ceph_remove_capsnap(struct inode *inode,</div><div class='hunk'>@@ -1170,10 +1275,10 @@ extern void ceph_remove_capsnap(struct inode *inode,</div><div class='ctx'> extern void ceph_flush_snaps(struct ceph_inode_info *ci,</div><div class='ctx'> 			     struct ceph_mds_session **psession);</div><div class='ctx'> extern bool __ceph_should_report_size(struct ceph_inode_info *ci);</div><div class='del'>-extern void ceph_check_caps(struct ceph_inode_info *ci, int flags,</div><div class='del'>-			    struct ceph_mds_session *session);</div><div class='add'>+extern void ceph_check_caps(struct ceph_inode_info *ci, int flags);</div><div class='ctx'> extern unsigned long ceph_check_delayed_caps(struct ceph_mds_client *mdsc);</div><div class='ctx'> extern void ceph_flush_dirty_caps(struct ceph_mds_client *mdsc);</div><div class='add'>+extern void ceph_flush_cap_releases(struct ceph_mds_client *mdsc);</div><div class='ctx'> extern int  ceph_drop_caps_for_unlink(struct inode *inode);</div><div class='ctx'> extern int ceph_encode_inode_release(void **p, struct inode *inode,</div><div class='ctx'> 				     int mds, int drop, int unless, int force);</div><div class='hunk'>@@ -1181,6 +1286,8 @@ extern int ceph_encode_dentry_release(void **p, struct dentry *dn,</div><div class='ctx'> 				      struct inode *dir,</div><div class='ctx'> 				      int mds, int drop, int unless);</div><div class='ctx'> </div><div class='add'>+extern int __ceph_get_caps(struct inode *inode, struct ceph_file_info *fi,</div><div class='add'>+			   int need, int want, loff_t endoff, int *got);</div><div class='ctx'> extern int ceph_get_caps(struct file *filp, int need, int want,</div><div class='ctx'> 			 loff_t endoff, int *got);</div><div class='ctx'> extern int ceph_try_get_caps(struct inode *inode,</div><div class='hunk'>@@ -1194,10 +1301,20 @@ extern void __ceph_touch_fmode(struct ceph_inode_info *ci,</div><div class='ctx'> </div><div class='ctx'> /* addr.c */</div><div class='ctx'> extern const struct address_space_operations ceph_aops;</div><div class='del'>-extern int ceph_mmap(struct file *file, struct vm_area_struct *vma);</div><div class='del'>-extern int ceph_uninline_data(struct file *filp, struct page *locked_page);</div><div class='add'>+extern const struct netfs_request_ops ceph_netfs_ops;</div><div class='add'>+int ceph_mmap_prepare(struct vm_area_desc *desc);</div><div class='add'>+extern int ceph_uninline_data(struct file *file);</div><div class='ctx'> extern int ceph_pool_perm_check(struct inode *inode, int need);</div><div class='ctx'> extern void ceph_pool_perm_destroy(struct ceph_mds_client* mdsc);</div><div class='add'>+int ceph_purge_inode_cap(struct inode *inode, struct ceph_cap *cap, bool *invalidate);</div><div class='add'>+</div><div class='add'>+static inline bool ceph_has_inline_data(struct ceph_inode_info *ci)</div><div class='add'>+{</div><div class='add'>+	if (ci-&gt;i_inline_version == CEPH_INLINE_NONE ||</div><div class='add'>+	    ci-&gt;i_inline_version == 1) /* initial version, no data */</div><div class='add'>+		return false;</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /* file.c */</div><div class='ctx'> extern const struct file_operations ceph_file_fops;</div><div class='hunk'>@@ -1206,6 +1323,9 @@ extern int ceph_renew_caps(struct inode *inode, int fmode);</div><div class='ctx'> extern int ceph_open(struct inode *inode, struct file *file);</div><div class='ctx'> extern int ceph_atomic_open(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 			    struct file *file, unsigned flags, umode_t mode);</div><div class='add'>+extern ssize_t __ceph_sync_read(struct inode *inode, loff_t *ki_pos,</div><div class='add'>+				struct iov_iter *to, int *retry_op,</div><div class='add'>+				u64 *last_objver);</div><div class='ctx'> extern int ceph_release(struct inode *inode, struct file *filp);</div><div class='ctx'> extern void ceph_fill_inline_data(struct inode *inode, struct page *locked_page,</div><div class='ctx'> 				  char *data, size_t len);</div><div class='hunk'>@@ -1256,9 +1376,29 @@ extern void ceph_fs_debugfs_init(struct ceph_fs_client *client);</div><div class='ctx'> extern void ceph_fs_debugfs_cleanup(struct ceph_fs_client *client);</div><div class='ctx'> </div><div class='ctx'> /* quota.c */</div><div class='del'>-static inline bool __ceph_has_any_quota(struct ceph_inode_info *ci)</div><div class='add'>+</div><div class='add'>+enum quota_get_realm {</div><div class='add'>+	QUOTA_GET_MAX_FILES,</div><div class='add'>+	QUOTA_GET_MAX_BYTES,</div><div class='add'>+	QUOTA_GET_ANY</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static inline bool __ceph_has_quota(struct ceph_inode_info *ci,</div><div class='add'>+				    enum quota_get_realm which)</div><div class='ctx'> {</div><div class='del'>-	return ci-&gt;i_max_files || ci-&gt;i_max_bytes;</div><div class='add'>+	bool has_quota = false;</div><div class='add'>+</div><div class='add'>+	switch (which) {</div><div class='add'>+	case QUOTA_GET_MAX_BYTES:</div><div class='add'>+		has_quota = !!ci-&gt;i_max_bytes;</div><div class='add'>+		break;</div><div class='add'>+	case QUOTA_GET_MAX_FILES:</div><div class='add'>+		has_quota = !!ci-&gt;i_max_files;</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		has_quota = !!(ci-&gt;i_max_files || ci-&gt;i_max_bytes);</div><div class='add'>+	}</div><div class='add'>+	return has_quota;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> extern void ceph_adjust_quota_realms_count(struct inode *inode, bool inc);</div><div class='hunk'>@@ -1267,13 +1407,26 @@ static inline void __ceph_update_quota(struct ceph_inode_info *ci,</div><div class='ctx'> 				       u64 max_bytes, u64 max_files)</div><div class='ctx'> {</div><div class='ctx'> 	bool had_quota, has_quota;</div><div class='del'>-	had_quota = __ceph_has_any_quota(ci);</div><div class='add'>+	had_quota = __ceph_has_quota(ci, QUOTA_GET_ANY);</div><div class='ctx'> 	ci-&gt;i_max_bytes = max_bytes;</div><div class='ctx'> 	ci-&gt;i_max_files = max_files;</div><div class='del'>-	has_quota = __ceph_has_any_quota(ci);</div><div class='add'>+	has_quota = __ceph_has_quota(ci, QUOTA_GET_ANY);</div><div class='ctx'> </div><div class='ctx'> 	if (had_quota != has_quota)</div><div class='del'>-		ceph_adjust_quota_realms_count(&amp;ci-&gt;vfs_inode, has_quota);</div><div class='add'>+		ceph_adjust_quota_realms_count(&amp;ci-&gt;netfs.inode, has_quota);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int __ceph_sparse_read_ext_count(struct inode *inode, u64 len)</div><div class='add'>+{</div><div class='add'>+	int cnt = 0;</div><div class='add'>+</div><div class='add'>+	if (IS_ENCRYPTED(inode)) {</div><div class='add'>+		cnt = len &gt;&gt; CEPH_FSCRYPT_BLOCK_SHIFT;</div><div class='add'>+		if (cnt &gt; CEPH_SPARSE_EXT_ARRAY_INITIAL)</div><div class='add'>+			cnt = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return cnt;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> extern void ceph_handle_quota(struct ceph_mds_client *mdsc,</div><div class='hunk'>@@ -1289,4 +1442,9 @@ extern bool ceph_quota_update_statfs(struct ceph_fs_client *fsc,</div><div class='ctx'> 				     struct kstatfs *buf);</div><div class='ctx'> extern void ceph_cleanup_quotarealms_inodes(struct ceph_mds_client *mdsc);</div><div class='ctx'> </div><div class='add'>+bool ceph_inc_mds_stopping_blocker(struct ceph_mds_client *mdsc,</div><div class='add'>+			       struct ceph_mds_session *session);</div><div class='add'>+void ceph_dec_mds_stopping_blocker(struct ceph_mds_client *mdsc);</div><div class='add'>+bool ceph_inc_osd_stopping_blocker(struct ceph_mds_client *mdsc);</div><div class='add'>+void ceph_dec_osd_stopping_blocker(struct ceph_mds_client *mdsc);</div><div class='ctx'> #endif /* _FS_CEPH_SUPER_H */</div><div class='head'>diff --git a/fs/ceph/xattr.c b/fs/ceph/xattr.c<br/>index fcf7dfdecf96..ad1f30bea175 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ceph/xattr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ceph/xattr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ceph/xattr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ceph/xattr.c</a></div><div class='hunk'>@@ -57,7 +57,8 @@ static bool ceph_vxattrcb_layout_exists(struct ceph_inode_info *ci)</div><div class='ctx'> static ssize_t ceph_vxattrcb_layout(struct ceph_inode_info *ci, char *val,</div><div class='ctx'> 				    size_t size)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_sb_to_client(ci-&gt;vfs_inode.i_sb);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_sb_to_fs_client(ci-&gt;netfs.inode.i_sb);</div><div class='add'>+	struct ceph_client *cl = fsc-&gt;client;</div><div class='ctx'> 	struct ceph_osd_client *osdc = &amp;fsc-&gt;client-&gt;osdc;</div><div class='ctx'> 	struct ceph_string *pool_ns;</div><div class='ctx'> 	s64 pool = ci-&gt;i_layout.pool_id;</div><div class='hunk'>@@ -69,7 +70,7 @@ static ssize_t ceph_vxattrcb_layout(struct ceph_inode_info *ci, char *val,</div><div class='ctx'> </div><div class='ctx'> 	pool_ns = ceph_try_get_string(ci-&gt;i_layout.pool_ns);</div><div class='ctx'> </div><div class='del'>-	dout("ceph_vxattrcb_layout %p\n", &amp;ci-&gt;vfs_inode);</div><div class='add'>+	doutc(cl, "%p\n", &amp;ci-&gt;netfs.inode);</div><div class='ctx'> 	down_read(&amp;osdc-&gt;lock);</div><div class='ctx'> 	pool_name = ceph_pg_pool_name_by_id(osdc-&gt;osdmap, pool);</div><div class='ctx'> 	if (pool_name) {</div><div class='hunk'>@@ -161,7 +162,7 @@ static ssize_t ceph_vxattrcb_layout_pool(struct ceph_inode_info *ci,</div><div class='ctx'> 					 char *val, size_t size)</div><div class='ctx'> {</div><div class='ctx'> 	ssize_t ret;</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_sb_to_client(ci-&gt;vfs_inode.i_sb);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_sb_to_fs_client(ci-&gt;netfs.inode.i_sb);</div><div class='ctx'> 	struct ceph_osd_client *osdc = &amp;fsc-&gt;client-&gt;osdc;</div><div class='ctx'> 	s64 pool = ci-&gt;i_layout.pool_id;</div><div class='ctx'> 	const char *pool_name;</div><div class='hunk'>@@ -248,8 +249,7 @@ static ssize_t ceph_vxattrcb_dir_rbytes(struct ceph_inode_info *ci, char *val,</div><div class='ctx'> static ssize_t ceph_vxattrcb_dir_rctime(struct ceph_inode_info *ci, char *val,</div><div class='ctx'> 					size_t size)</div><div class='ctx'> {</div><div class='del'>-	return ceph_fmt_xattr(val, size, "%lld.%09ld", ci-&gt;i_rctime.tv_sec,</div><div class='del'>-				ci-&gt;i_rctime.tv_nsec);</div><div class='add'>+	return ceph_fmt_xattr(val, size, "%ptSp", &amp;ci-&gt;i_rctime);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* dir pin */</div><div class='hunk'>@@ -306,14 +306,13 @@ static bool ceph_vxattrcb_snap_btime_exists(struct ceph_inode_info *ci)</div><div class='ctx'> static ssize_t ceph_vxattrcb_snap_btime(struct ceph_inode_info *ci, char *val,</div><div class='ctx'> 					size_t size)</div><div class='ctx'> {</div><div class='del'>-	return ceph_fmt_xattr(val, size, "%lld.%09ld", ci-&gt;i_snap_btime.tv_sec,</div><div class='del'>-				ci-&gt;i_snap_btime.tv_nsec);</div><div class='add'>+	return ceph_fmt_xattr(val, size, "%ptSp", &amp;ci-&gt;i_snap_btime);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t ceph_vxattrcb_cluster_fsid(struct ceph_inode_info *ci,</div><div class='ctx'> 					  char *val, size_t size)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_sb_to_client(ci-&gt;vfs_inode.i_sb);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_sb_to_fs_client(ci-&gt;netfs.inode.i_sb);</div><div class='ctx'> </div><div class='ctx'> 	return ceph_fmt_xattr(val, size, "%pU", &amp;fsc-&gt;client-&gt;fsid);</div><div class='ctx'> }</div><div class='hunk'>@@ -321,7 +320,7 @@ static ssize_t ceph_vxattrcb_cluster_fsid(struct ceph_inode_info *ci,</div><div class='ctx'> static ssize_t ceph_vxattrcb_client_id(struct ceph_inode_info *ci,</div><div class='ctx'> 				       char *val, size_t size)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_sb_to_client(ci-&gt;vfs_inode.i_sb);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_sb_to_fs_client(ci-&gt;netfs.inode.i_sb);</div><div class='ctx'> </div><div class='ctx'> 	return ceph_fmt_xattr(val, size, "client%lld",</div><div class='ctx'> 			      ceph_client_gid(fsc-&gt;client));</div><div class='hunk'>@@ -352,6 +351,24 @@ static ssize_t ceph_vxattrcb_auth_mds(struct ceph_inode_info *ci,</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#if IS_ENABLED(CONFIG_FS_ENCRYPTION)</div><div class='add'>+static bool ceph_vxattrcb_fscrypt_auth_exists(struct ceph_inode_info *ci)</div><div class='add'>+{</div><div class='add'>+	return ci-&gt;fscrypt_auth_len;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t ceph_vxattrcb_fscrypt_auth(struct ceph_inode_info *ci,</div><div class='add'>+					  char *val, size_t size)</div><div class='add'>+{</div><div class='add'>+	if (size) {</div><div class='add'>+		if (size &lt; ci-&gt;fscrypt_auth_len)</div><div class='add'>+			return -ERANGE;</div><div class='add'>+		memcpy(val, ci-&gt;fscrypt_auth, ci-&gt;fscrypt_auth_len);</div><div class='add'>+	}</div><div class='add'>+	return ci-&gt;fscrypt_auth_len;</div><div class='add'>+}</div><div class='add'>+#endif /* CONFIG_FS_ENCRYPTION */</div><div class='add'>+</div><div class='ctx'> #define CEPH_XATTR_NAME(_type, _name)	XATTR_CEPH_PREFIX #_type "." #_name</div><div class='ctx'> #define CEPH_XATTR_NAME2(_type, _name, _name2)	\</div><div class='ctx'> 	XATTR_CEPH_PREFIX #_type "." #_name "." #_name2</div><div class='hunk'>@@ -366,6 +383,14 @@ static ssize_t ceph_vxattrcb_auth_mds(struct ceph_inode_info *ci,</div><div class='ctx'> 	}</div><div class='ctx'> #define XATTR_RSTAT_FIELD(_type, _name)			\</div><div class='ctx'> 	XATTR_NAME_CEPH(_type, _name, VXATTR_FLAG_RSTAT)</div><div class='add'>+#define XATTR_RSTAT_FIELD_UPDATABLE(_type, _name)			\</div><div class='add'>+	{								\</div><div class='add'>+		.name = CEPH_XATTR_NAME(_type, _name),			\</div><div class='add'>+		.name_size = sizeof (CEPH_XATTR_NAME(_type, _name)),	\</div><div class='add'>+		.getxattr_cb = ceph_vxattrcb_ ## _type ## _ ## _name,	\</div><div class='add'>+		.exists_cb = NULL,					\</div><div class='add'>+		.flags = VXATTR_FLAG_RSTAT,				\</div><div class='add'>+	}</div><div class='ctx'> #define XATTR_LAYOUT_FIELD(_type, _name, _field)			\</div><div class='ctx'> 	{								\</div><div class='ctx'> 		.name = CEPH_XATTR_NAME2(_type, _name, _field),	\</div><div class='hunk'>@@ -404,7 +429,7 @@ static struct ceph_vxattr ceph_dir_vxattrs[] = {</div><div class='ctx'> 	XATTR_RSTAT_FIELD(dir, rsubdirs),</div><div class='ctx'> 	XATTR_RSTAT_FIELD(dir, rsnaps),</div><div class='ctx'> 	XATTR_RSTAT_FIELD(dir, rbytes),</div><div class='del'>-	XATTR_RSTAT_FIELD(dir, rctime),</div><div class='add'>+	XATTR_RSTAT_FIELD_UPDATABLE(dir, rctime),</div><div class='ctx'> 	{</div><div class='ctx'> 		.name = "ceph.dir.pin",</div><div class='ctx'> 		.name_size = sizeof("ceph.dir.pin"),</div><div class='hunk'>@@ -492,6 +517,15 @@ static struct ceph_vxattr ceph_common_vxattrs[] = {</div><div class='ctx'> 		.exists_cb = NULL,</div><div class='ctx'> 		.flags = VXATTR_FLAG_READONLY,</div><div class='ctx'> 	},</div><div class='add'>+#if IS_ENABLED(CONFIG_FS_ENCRYPTION)</div><div class='add'>+	{</div><div class='add'>+		.name = "ceph.fscrypt.auth",</div><div class='add'>+		.name_size = sizeof("ceph.fscrypt.auth"),</div><div class='add'>+		.getxattr_cb = ceph_vxattrcb_fscrypt_auth,</div><div class='add'>+		.exists_cb = ceph_vxattrcb_fscrypt_auth_exists,</div><div class='add'>+		.flags = VXATTR_FLAG_READONLY,</div><div class='add'>+	},</div><div class='add'>+#endif /* CONFIG_FS_ENCRYPTION */</div><div class='ctx'> 	{ .name = NULL, 0 }	/* Required table terminator */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -527,12 +561,16 @@ static struct ceph_vxattr *ceph_match_vxattr(struct inode *inode,</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#define MAX_XATTR_VAL_PRINT_LEN 256</div><div class='add'>+</div><div class='ctx'> static int __set_xattr(struct ceph_inode_info *ci,</div><div class='ctx'> 			   const char *name, int name_len,</div><div class='ctx'> 			   const char *val, int val_len,</div><div class='ctx'> 			   int flags, int update_xattr,</div><div class='ctx'> 			   struct ceph_inode_xattr **newxattr)</div><div class='ctx'> {</div><div class='add'>+	struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct rb_node **p;</div><div class='ctx'> 	struct rb_node *parent = NULL;</div><div class='ctx'> 	struct ceph_inode_xattr *xattr = NULL;</div><div class='hunk'>@@ -589,7 +627,7 @@ static int __set_xattr(struct ceph_inode_info *ci,</div><div class='ctx'> 		xattr-&gt;should_free_name = update_xattr;</div><div class='ctx'> </div><div class='ctx'> 		ci-&gt;i_xattrs.count++;</div><div class='del'>-		dout("__set_xattr count=%d\n", ci-&gt;i_xattrs.count);</div><div class='add'>+		doutc(cl, "count=%d\n", ci-&gt;i_xattrs.count);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		kfree(*newxattr);</div><div class='ctx'> 		*newxattr = NULL;</div><div class='hunk'>@@ -617,11 +655,13 @@ static int __set_xattr(struct ceph_inode_info *ci,</div><div class='ctx'> 	if (new) {</div><div class='ctx'> 		rb_link_node(&amp;xattr-&gt;node, parent, p);</div><div class='ctx'> 		rb_insert_color(&amp;xattr-&gt;node, &amp;ci-&gt;i_xattrs.index);</div><div class='del'>-		dout("__set_xattr_val p=%p\n", p);</div><div class='add'>+		doutc(cl, "p=%p\n", p);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("__set_xattr_val added %llx.%llx xattr %p %.*s=%.*s\n",</div><div class='del'>-	     ceph_vinop(&amp;ci-&gt;vfs_inode), xattr, name_len, name, val_len, val);</div><div class='add'>+	doutc(cl, "added %p %llx.%llx xattr %p %.*s=%.*s%s\n", inode,</div><div class='add'>+	      ceph_vinop(inode), xattr, name_len, name, min(val_len,</div><div class='add'>+	      MAX_XATTR_VAL_PRINT_LEN), val,</div><div class='add'>+	      val_len &gt; MAX_XATTR_VAL_PRINT_LEN ? "..." : "");</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -629,6 +669,7 @@ static int __set_xattr(struct ceph_inode_info *ci,</div><div class='ctx'> static struct ceph_inode_xattr *__get_xattr(struct ceph_inode_info *ci,</div><div class='ctx'> 			   const char *name)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(&amp;ci-&gt;netfs.inode);</div><div class='ctx'> 	struct rb_node **p;</div><div class='ctx'> 	struct rb_node *parent = NULL;</div><div class='ctx'> 	struct ceph_inode_xattr *xattr = NULL;</div><div class='hunk'>@@ -647,13 +688,15 @@ static struct ceph_inode_xattr *__get_xattr(struct ceph_inode_info *ci,</div><div class='ctx'> 		else if (c &gt; 0)</div><div class='ctx'> 			p = &amp;(*p)-&gt;rb_right;</div><div class='ctx'> 		else {</div><div class='del'>-			dout("__get_xattr %s: found %.*s\n", name,</div><div class='del'>-			     xattr-&gt;val_len, xattr-&gt;val);</div><div class='add'>+			int len = min(xattr-&gt;val_len, MAX_XATTR_VAL_PRINT_LEN);</div><div class='add'>+</div><div class='add'>+			doutc(cl, "%s found %.*s%s\n", name, len, xattr-&gt;val,</div><div class='add'>+			      xattr-&gt;val_len &gt; len ? "..." : "");</div><div class='ctx'> 			return xattr;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("__get_xattr %s: not found\n", name);</div><div class='add'>+	doutc(cl, "%s not found\n", name);</div><div class='ctx'> </div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='hunk'>@@ -694,19 +737,20 @@ static int __remove_xattr(struct ceph_inode_info *ci,</div><div class='ctx'> static char *__copy_xattr_names(struct ceph_inode_info *ci,</div><div class='ctx'> 				char *dest)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(&amp;ci-&gt;netfs.inode);</div><div class='ctx'> 	struct rb_node *p;</div><div class='ctx'> 	struct ceph_inode_xattr *xattr = NULL;</div><div class='ctx'> </div><div class='ctx'> 	p = rb_first(&amp;ci-&gt;i_xattrs.index);</div><div class='del'>-	dout("__copy_xattr_names count=%d\n", ci-&gt;i_xattrs.count);</div><div class='add'>+	doutc(cl, "count=%d\n", ci-&gt;i_xattrs.count);</div><div class='ctx'> </div><div class='ctx'> 	while (p) {</div><div class='ctx'> 		xattr = rb_entry(p, struct ceph_inode_xattr, node);</div><div class='ctx'> 		memcpy(dest, xattr-&gt;name, xattr-&gt;name_len);</div><div class='ctx'> 		dest[xattr-&gt;name_len] = '\0';</div><div class='ctx'> </div><div class='del'>-		dout("dest=%s %p (%s) (%d/%d)\n", dest, xattr, xattr-&gt;name,</div><div class='del'>-		     xattr-&gt;name_len, ci-&gt;i_xattrs.names_size);</div><div class='add'>+		doutc(cl, "dest=%s %p (%s) (%d/%d)\n", dest, xattr, xattr-&gt;name,</div><div class='add'>+		      xattr-&gt;name_len, ci-&gt;i_xattrs.names_size);</div><div class='ctx'> </div><div class='ctx'> 		dest += xattr-&gt;name_len + 1;</div><div class='ctx'> 		p = rb_next(p);</div><div class='hunk'>@@ -717,19 +761,19 @@ static char *__copy_xattr_names(struct ceph_inode_info *ci,</div><div class='ctx'> </div><div class='ctx'> void __ceph_destroy_xattrs(struct ceph_inode_info *ci)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(&amp;ci-&gt;netfs.inode);</div><div class='ctx'> 	struct rb_node *p, *tmp;</div><div class='ctx'> 	struct ceph_inode_xattr *xattr = NULL;</div><div class='ctx'> </div><div class='ctx'> 	p = rb_first(&amp;ci-&gt;i_xattrs.index);</div><div class='ctx'> </div><div class='del'>-	dout("__ceph_destroy_xattrs p=%p\n", p);</div><div class='add'>+	doutc(cl, "p=%p\n", p);</div><div class='ctx'> </div><div class='ctx'> 	while (p) {</div><div class='ctx'> 		xattr = rb_entry(p, struct ceph_inode_xattr, node);</div><div class='ctx'> 		tmp = p;</div><div class='ctx'> 		p = rb_next(tmp);</div><div class='del'>-		dout("__ceph_destroy_xattrs next p=%p (%.*s)\n", p,</div><div class='del'>-		     xattr-&gt;name_len, xattr-&gt;name);</div><div class='add'>+		doutc(cl, "next p=%p (%.*s)\n", p, xattr-&gt;name_len, xattr-&gt;name);</div><div class='ctx'> 		rb_erase(tmp, &amp;ci-&gt;i_xattrs.index);</div><div class='ctx'> </div><div class='ctx'> 		__free_xattr(xattr);</div><div class='hunk'>@@ -746,6 +790,7 @@ static int __build_xattrs(struct inode *inode)</div><div class='ctx'> 	__releases(ci-&gt;i_ceph_lock)</div><div class='ctx'> 	__acquires(ci-&gt;i_ceph_lock)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	u32 namelen;</div><div class='ctx'> 	u32 numattr = 0;</div><div class='ctx'> 	void *p, *end;</div><div class='hunk'>@@ -757,8 +802,8 @@ static int __build_xattrs(struct inode *inode)</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	dout("__build_xattrs() len=%d\n",</div><div class='del'>-	     ci-&gt;i_xattrs.blob ? (int)ci-&gt;i_xattrs.blob-&gt;vec.iov_len : 0);</div><div class='add'>+	doutc(cl, "len=%d\n",</div><div class='add'>+	      ci-&gt;i_xattrs.blob ? (int)ci-&gt;i_xattrs.blob-&gt;vec.iov_len : 0);</div><div class='ctx'> </div><div class='ctx'> 	if (ci-&gt;i_xattrs.index_version &gt;= ci-&gt;i_xattrs.version)</div><div class='ctx'> 		return 0; /* already built */</div><div class='hunk'>@@ -833,6 +878,8 @@ bad:</div><div class='ctx'> static int __get_required_blob_size(struct ceph_inode_info *ci, int name_size,</div><div class='ctx'> 				    int val_size)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(&amp;ci-&gt;netfs.inode);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * 4 bytes for the length, and additional 4 bytes per each xattr name,</div><div class='ctx'> 	 * 4 bytes per each value</div><div class='hunk'>@@ -840,9 +887,8 @@ static int __get_required_blob_size(struct ceph_inode_info *ci, int name_size,</div><div class='ctx'> 	int size = 4 + ci-&gt;i_xattrs.count*(4 + 4) +</div><div class='ctx'> 			     ci-&gt;i_xattrs.names_size +</div><div class='ctx'> 			     ci-&gt;i_xattrs.vals_size;</div><div class='del'>-	dout("__get_required_blob_size c=%d names.size=%d vals.size=%d\n",</div><div class='del'>-	     ci-&gt;i_xattrs.count, ci-&gt;i_xattrs.names_size,</div><div class='del'>-	     ci-&gt;i_xattrs.vals_size);</div><div class='add'>+	doutc(cl, "c=%d names.size=%d vals.size=%d\n", ci-&gt;i_xattrs.count,</div><div class='add'>+	      ci-&gt;i_xattrs.names_size, ci-&gt;i_xattrs.vals_size);</div><div class='ctx'> </div><div class='ctx'> 	if (name_size)</div><div class='ctx'> 		size += 4 + 4 + name_size + val_size;</div><div class='hunk'>@@ -851,19 +897,21 @@ static int __get_required_blob_size(struct ceph_inode_info *ci, int name_size,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * If there are dirty xattrs, reencode xattrs into the prealloc_blob</div><div class='add'>+ * If there are dirty xattrs, re-encode xattrs into the prealloc_blob</div><div class='ctx'>  * and swap into place.  It returns the old i_xattrs.blob (or NULL) so</div><div class='ctx'>  * that it can be freed by the caller as the i_ceph_lock is likely to be</div><div class='ctx'>  * held.</div><div class='ctx'>  */</div><div class='ctx'> struct ceph_buffer *__ceph_build_xattrs_blob(struct ceph_inode_info *ci)</div><div class='ctx'> {</div><div class='add'>+	struct inode *inode = &amp;ci-&gt;netfs.inode;</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct rb_node *p;</div><div class='ctx'> 	struct ceph_inode_xattr *xattr = NULL;</div><div class='ctx'> 	struct ceph_buffer *old_blob = NULL;</div><div class='ctx'> 	void *dest;</div><div class='ctx'> </div><div class='del'>-	dout("__build_xattrs_blob %p\n", &amp;ci-&gt;vfs_inode);</div><div class='add'>+	doutc(cl, "%p %llx.%llx\n", inode, ceph_vinop(inode));</div><div class='ctx'> 	if (ci-&gt;i_xattrs.dirty) {</div><div class='ctx'> 		int need = __get_required_blob_size(ci, 0, 0);</div><div class='ctx'> </div><div class='hunk'>@@ -921,12 +969,16 @@ static inline int __get_request_mask(struct inode *in) {</div><div class='ctx'> ssize_t __ceph_getxattr(struct inode *inode, const char *name, void *value,</div><div class='ctx'> 		      size_t size)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	struct ceph_inode_xattr *xattr;</div><div class='del'>-	struct ceph_vxattr *vxattr = NULL;</div><div class='add'>+	struct ceph_vxattr *vxattr;</div><div class='ctx'> 	int req_mask;</div><div class='ctx'> 	ssize_t err;</div><div class='ctx'> </div><div class='add'>+	if (strncmp(name, XATTR_CEPH_PREFIX, XATTR_CEPH_PREFIX_LEN))</div><div class='add'>+		goto handle_non_vxattrs;</div><div class='add'>+</div><div class='ctx'> 	/* let's see if a virtual xattr was requested */</div><div class='ctx'> 	vxattr = ceph_match_vxattr(inode, name);</div><div class='ctx'> 	if (vxattr) {</div><div class='hunk'>@@ -945,13 +997,20 @@ ssize_t __ceph_getxattr(struct inode *inode, const char *name, void *value,</div><div class='ctx'> 				err = -ERANGE;</div><div class='ctx'> 		}</div><div class='ctx'> 		return err;</div><div class='add'>+	} else {</div><div class='add'>+		err = ceph_do_getvxattr(inode, name, value, size);</div><div class='add'>+		/* this would happen with a new client and old server combo */</div><div class='add'>+		if (err == -EOPNOTSUPP)</div><div class='add'>+			err = -ENODATA;</div><div class='add'>+		return err;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='add'>+handle_non_vxattrs:</div><div class='ctx'> 	req_mask = __get_request_mask(inode);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-	dout("getxattr %p name '%s' ver=%lld index_ver=%lld\n", inode, name,</div><div class='del'>-	     ci-&gt;i_xattrs.version, ci-&gt;i_xattrs.index_version);</div><div class='add'>+	doutc(cl, "%p %llx.%llx name '%s' ver=%lld index_ver=%lld\n", inode,</div><div class='add'>+	      ceph_vinop(inode), name, ci-&gt;i_xattrs.version,</div><div class='add'>+	      ci-&gt;i_xattrs.index_version);</div><div class='ctx'> </div><div class='ctx'> 	if (ci-&gt;i_xattrs.version == 0 ||</div><div class='ctx'> 	    !((req_mask &amp; CEPH_CAP_XATTR_SHARED) ||</div><div class='hunk'>@@ -960,8 +1019,9 @@ ssize_t __ceph_getxattr(struct inode *inode, const char *name, void *value,</div><div class='ctx'> </div><div class='ctx'> 		/* security module gets xattr while filling trace */</div><div class='ctx'> 		if (current-&gt;journal_info) {</div><div class='del'>-			pr_warn_ratelimited("sync getxattr %p "</div><div class='del'>-					    "during filling trace\n", inode);</div><div class='add'>+			pr_warn_ratelimited_client(cl,</div><div class='add'>+				"sync %p %llx.%llx during filling trace\n",</div><div class='add'>+				inode, ceph_vinop(inode));</div><div class='ctx'> 			return -EBUSY;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -1003,14 +1063,16 @@ out:</div><div class='ctx'> ssize_t ceph_listxattr(struct dentry *dentry, char *names, size_t size)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	bool len_only = (size == 0);</div><div class='ctx'> 	u32 namelen;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='del'>-	dout("listxattr %p ver=%lld index_ver=%lld\n", inode,</div><div class='del'>-	     ci-&gt;i_xattrs.version, ci-&gt;i_xattrs.index_version);</div><div class='add'>+	doutc(cl, "%p %llx.%llx ver=%lld index_ver=%lld\n", inode,</div><div class='add'>+	      ceph_vinop(inode), ci-&gt;i_xattrs.version,</div><div class='add'>+	      ci-&gt;i_xattrs.index_version);</div><div class='ctx'> </div><div class='ctx'> 	if (ci-&gt;i_xattrs.version == 0 ||</div><div class='ctx'> 	    !__ceph_caps_issued_mask_metric(ci, CEPH_CAP_XATTR_SHARED, 1)) {</div><div class='hunk'>@@ -1044,7 +1106,8 @@ out:</div><div class='ctx'> static int ceph_sync_setxattr(struct inode *inode, const char *name,</div><div class='ctx'> 			      const char *value, size_t size, int flags)</div><div class='ctx'> {</div><div class='del'>-	struct ceph_fs_client *fsc = ceph_sb_to_client(inode-&gt;i_sb);</div><div class='add'>+	struct ceph_fs_client *fsc = ceph_sb_to_fs_client(inode-&gt;i_sb);</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='ctx'> 	struct ceph_mds_request *req;</div><div class='ctx'> 	struct ceph_mds_client *mdsc = fsc-&gt;mdsc;</div><div class='hunk'>@@ -1069,7 +1132,7 @@ static int ceph_sync_setxattr(struct inode *inode, const char *name,</div><div class='ctx'> 			flags |= CEPH_XATTR_REMOVE;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("setxattr value=%.*s\n", (int)size, value);</div><div class='add'>+	doutc(cl, "name %s value size %zu\n", name, size);</div><div class='ctx'> </div><div class='ctx'> 	/* do request */</div><div class='ctx'> 	req = ceph_mdsc_create_request(mdsc, op, USE_AUTH_MDS);</div><div class='hunk'>@@ -1098,10 +1161,10 @@ static int ceph_sync_setxattr(struct inode *inode, const char *name,</div><div class='ctx'> 	req-&gt;r_num_caps = 1;</div><div class='ctx'> 	req-&gt;r_inode_drop = CEPH_CAP_XATTR_SHARED;</div><div class='ctx'> </div><div class='del'>-	dout("xattr.ver (before): %lld\n", ci-&gt;i_xattrs.version);</div><div class='add'>+	doutc(cl, "xattr.ver (before): %lld\n", ci-&gt;i_xattrs.version);</div><div class='ctx'> 	err = ceph_mdsc_do_request(mdsc, NULL, req);</div><div class='ctx'> 	ceph_mdsc_put_request(req);</div><div class='del'>-	dout("xattr.ver (after): %lld\n", ci-&gt;i_xattrs.version);</div><div class='add'>+	doutc(cl, "xattr.ver (after): %lld\n", ci-&gt;i_xattrs.version);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	if (pagelist)</div><div class='hunk'>@@ -1112,9 +1175,10 @@ out:</div><div class='ctx'> int __ceph_setxattr(struct inode *inode, const char *name,</div><div class='ctx'> 			const void *value, size_t size, int flags)</div><div class='ctx'> {</div><div class='add'>+	struct ceph_client *cl = ceph_inode_to_client(inode);</div><div class='ctx'> 	struct ceph_vxattr *vxattr;</div><div class='ctx'> 	struct ceph_inode_info *ci = ceph_inode(inode);</div><div class='del'>-	struct ceph_mds_client *mdsc = ceph_sb_to_client(inode-&gt;i_sb)-&gt;mdsc;</div><div class='add'>+	struct ceph_mds_client *mdsc = ceph_sb_to_fs_client(inode-&gt;i_sb)-&gt;mdsc;</div><div class='ctx'> 	struct ceph_cap_flush *prealloc_cf = NULL;</div><div class='ctx'> 	struct ceph_buffer *old_blob = NULL;</div><div class='ctx'> 	int issued;</div><div class='hunk'>@@ -1167,8 +1231,14 @@ int __ceph_setxattr(struct inode *inode, const char *name,</div><div class='ctx'> 	spin_lock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> retry:</div><div class='ctx'> 	issued = __ceph_caps_issued(ci, NULL);</div><div class='del'>-	if (ci-&gt;i_xattrs.version == 0 || !(issued &amp; CEPH_CAP_XATTR_EXCL))</div><div class='add'>+	required_blob_size = __get_required_blob_size(ci, name_len, val_len);</div><div class='add'>+	if ((ci-&gt;i_xattrs.version == 0) || !(issued &amp; CEPH_CAP_XATTR_EXCL) ||</div><div class='add'>+	    (required_blob_size &gt; mdsc-&gt;mdsmap-&gt;m_max_xattr_size)) {</div><div class='add'>+		doutc(cl, "sync version: %llu size: %d max: %llu\n",</div><div class='add'>+		      ci-&gt;i_xattrs.version, required_blob_size,</div><div class='add'>+		      mdsc-&gt;mdsmap-&gt;m_max_xattr_size);</div><div class='ctx'> 		goto do_sync;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (!lock_snap_rwsem &amp;&amp; !ci-&gt;i_head_snapc) {</div><div class='ctx'> 		lock_snap_rwsem = true;</div><div class='hunk'>@@ -1180,19 +1250,18 @@ retry:</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dout("setxattr %p name '%s' issued %s\n", inode, name,</div><div class='del'>-	     ceph_cap_string(issued));</div><div class='add'>+	doutc(cl, "%p %llx.%llx name '%s' issued %s\n", inode,</div><div class='add'>+	      ceph_vinop(inode), name, ceph_cap_string(issued));</div><div class='ctx'> 	__build_xattrs(inode);</div><div class='ctx'> </div><div class='del'>-	required_blob_size = __get_required_blob_size(ci, name_len, val_len);</div><div class='del'>-</div><div class='ctx'> 	if (!ci-&gt;i_xattrs.prealloc_blob ||</div><div class='ctx'> 	    required_blob_size &gt; ci-&gt;i_xattrs.prealloc_blob-&gt;alloc_len) {</div><div class='ctx'> 		struct ceph_buffer *blob;</div><div class='ctx'> </div><div class='ctx'> 		spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='ctx'> 		ceph_buffer_put(old_blob); /* Shouldn't be required */</div><div class='del'>-		dout(" pre-allocating new blob size=%d\n", required_blob_size);</div><div class='add'>+		doutc(cl, " pre-allocating new blob size=%d\n",</div><div class='add'>+		      required_blob_size);</div><div class='ctx'> 		blob = ceph_buffer_new(required_blob_size, GFP_NOFS);</div><div class='ctx'> 		if (!blob)</div><div class='ctx'> 			goto do_sync_unlocked;</div><div class='hunk'>@@ -1211,7 +1280,7 @@ retry:</div><div class='ctx'> 		dirty = __ceph_mark_dirty_caps(ci, CEPH_CAP_XATTR_EXCL,</div><div class='ctx'> 					       &amp;prealloc_cf);</div><div class='ctx'> 		ci-&gt;i_xattrs.dirty = true;</div><div class='del'>-		inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+		inode_set_ctime_current(inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	spin_unlock(&amp;ci-&gt;i_ceph_lock);</div><div class='hunk'>@@ -1231,8 +1300,9 @@ do_sync_unlocked:</div><div class='ctx'> </div><div class='ctx'> 	/* security module set xattr while filling trace */</div><div class='ctx'> 	if (current-&gt;journal_info) {</div><div class='del'>-		pr_warn_ratelimited("sync setxattr %p "</div><div class='del'>-				    "during filling trace\n", inode);</div><div class='add'>+		pr_warn_ratelimited_client(cl,</div><div class='add'>+				"sync %p %llx.%llx during filling trace\n",</div><div class='add'>+				inode, ceph_vinop(inode));</div><div class='ctx'> 		err = -EBUSY;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		err = ceph_sync_setxattr(inode, name, value, size, flags);</div><div class='hunk'>@@ -1264,7 +1334,7 @@ static int ceph_get_xattr_handler(const struct xattr_handler *handler,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ceph_set_xattr_handler(const struct xattr_handler *handler,</div><div class='del'>-				  struct user_namespace *mnt_userns,</div><div class='add'>+				  struct mnt_idmap *idmap,</div><div class='ctx'> 				  struct dentry *unused, struct inode *inode,</div><div class='ctx'> 				  const char *name, const void *value,</div><div class='ctx'> 				  size_t size, int flags)</div><div class='hunk'>@@ -1311,8 +1381,7 @@ int ceph_security_init_secctx(struct dentry *dentry, umode_t mode,</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	err = security_dentry_init_security(dentry, mode, &amp;dentry-&gt;d_name,</div><div class='del'>-					    &amp;name, &amp;as_ctx-&gt;sec_ctx,</div><div class='del'>-					    &amp;as_ctx-&gt;sec_ctxlen);</div><div class='add'>+					    &amp;name, &amp;as_ctx-&gt;lsmctx);</div><div class='ctx'> 	if (err &lt; 0) {</div><div class='ctx'> 		WARN_ON_ONCE(err != -EOPNOTSUPP);</div><div class='ctx'> 		err = 0; /* do nothing */</div><div class='hunk'>@@ -1337,7 +1406,7 @@ int ceph_security_init_secctx(struct dentry *dentry, umode_t mode,</div><div class='ctx'> 	 */</div><div class='ctx'> 	name_len = strlen(name);</div><div class='ctx'> 	err = ceph_pagelist_reserve(pagelist,</div><div class='del'>-				    4 * 2 + name_len + as_ctx-&gt;sec_ctxlen);</div><div class='add'>+				    4 * 2 + name_len + as_ctx-&gt;lsmctx.len);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -1360,8 +1429,9 @@ int ceph_security_init_secctx(struct dentry *dentry, umode_t mode,</div><div class='ctx'> 	ceph_pagelist_encode_32(pagelist, name_len);</div><div class='ctx'> 	ceph_pagelist_append(pagelist, name, name_len);</div><div class='ctx'> </div><div class='del'>-	ceph_pagelist_encode_32(pagelist, as_ctx-&gt;sec_ctxlen);</div><div class='del'>-	ceph_pagelist_append(pagelist, as_ctx-&gt;sec_ctx, as_ctx-&gt;sec_ctxlen);</div><div class='add'>+	ceph_pagelist_encode_32(pagelist, as_ctx-&gt;lsmctx.len);</div><div class='add'>+	ceph_pagelist_append(pagelist, as_ctx-&gt;lsmctx.context,</div><div class='add'>+			     as_ctx-&gt;lsmctx.len);</div><div class='ctx'> </div><div class='ctx'> 	err = 0;</div><div class='ctx'> out:</div><div class='hunk'>@@ -1379,7 +1449,10 @@ void ceph_release_acl_sec_ctx(struct ceph_acl_sec_ctx *as_ctx)</div><div class='ctx'> 	posix_acl_release(as_ctx-&gt;default_acl);</div><div class='ctx'> #endif</div><div class='ctx'> #ifdef CONFIG_CEPH_FS_SECURITY_LABEL</div><div class='del'>-	security_release_secctx(as_ctx-&gt;sec_ctx, as_ctx-&gt;sec_ctxlen);</div><div class='add'>+	security_release_secctx(&amp;as_ctx-&gt;lsmctx);</div><div class='add'>+#endif</div><div class='add'>+#ifdef CONFIG_FS_ENCRYPTION</div><div class='add'>+	kfree(as_ctx-&gt;fscrypt_auth);</div><div class='ctx'> #endif</div><div class='ctx'> 	if (as_ctx-&gt;pagelist)</div><div class='ctx'> 		ceph_pagelist_release(as_ctx-&gt;pagelist);</div><div class='hunk'>@@ -1389,11 +1462,7 @@ void ceph_release_acl_sec_ctx(struct ceph_acl_sec_ctx *as_ctx)</div><div class='ctx'>  * List of handlers for synthetic system.* attributes. Other</div><div class='ctx'>  * attributes are handled directly.</div><div class='ctx'>  */</div><div class='del'>-const struct xattr_handler *ceph_xattr_handlers[] = {</div><div class='del'>-#ifdef CONFIG_CEPH_FS_POSIX_ACL</div><div class='del'>-	&amp;posix_acl_access_xattr_handler,</div><div class='del'>-	&amp;posix_acl_default_xattr_handler,</div><div class='del'>-#endif</div><div class='add'>+const struct xattr_handler * const ceph_xattr_handlers[] = {</div><div class='ctx'> 	&amp;ceph_other_xattr_handler,</div><div class='ctx'> 	NULL,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/char_dev.c b/fs/char_dev.c<br/>index ba0ded7842a7..c2ddb998f3c9 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/char_dev.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/char_dev.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/char_dev.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/char_dev.c</a></div><div class='hunk'>@@ -25,7 +25,7 @@</div><div class='ctx'> </div><div class='ctx'> #include "internal.h"</div><div class='ctx'> </div><div class='del'>-static struct kobj_map *cdev_map;</div><div class='add'>+static struct kobj_map *cdev_map __ro_after_init;</div><div class='ctx'> </div><div class='ctx'> static DEFINE_MUTEX(chrdevs_lock);</div><div class='ctx'> </div><div class='hunk'>@@ -150,7 +150,7 @@ __register_chrdev_region(unsigned int major, unsigned int baseminor,</div><div class='ctx'> 	cd-&gt;major = major;</div><div class='ctx'> 	cd-&gt;baseminor = baseminor;</div><div class='ctx'> 	cd-&gt;minorct = minorct;</div><div class='del'>-	strlcpy(cd-&gt;name, name, sizeof(cd-&gt;name));</div><div class='add'>+	strscpy(cd-&gt;name, name, sizeof(cd-&gt;name));</div><div class='ctx'> </div><div class='ctx'> 	if (!prev) {</div><div class='ctx'> 		cd-&gt;next = curr;</div><div class='hunk'>@@ -350,7 +350,7 @@ static struct kobject *cdev_get(struct cdev *p)</div><div class='ctx'> 	struct module *owner = p-&gt;owner;</div><div class='ctx'> 	struct kobject *kobj;</div><div class='ctx'> </div><div class='del'>-	if (owner &amp;&amp; !try_module_get(owner))</div><div class='add'>+	if (!try_module_get(owner))</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	kobj = kobject_get_unless_zero(&amp;p-&gt;kobj);</div><div class='ctx'> 	if (!kobj)</div><div class='hunk'>@@ -483,17 +483,24 @@ int cdev_add(struct cdev *p, dev_t dev, unsigned count)</div><div class='ctx'> 	p-&gt;dev = dev;</div><div class='ctx'> 	p-&gt;count = count;</div><div class='ctx'> </div><div class='del'>-	if (WARN_ON(dev == WHITEOUT_DEV))</div><div class='del'>-		return -EBUSY;</div><div class='add'>+	if (WARN_ON(dev == WHITEOUT_DEV)) {</div><div class='add'>+		error = -EBUSY;</div><div class='add'>+		goto err;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	error = kobj_map(cdev_map, dev, count, NULL,</div><div class='ctx'> 			 exact_match, exact_lock, p);</div><div class='ctx'> 	if (error)</div><div class='del'>-		return error;</div><div class='add'>+		goto err;</div><div class='ctx'> </div><div class='ctx'> 	kobject_get(p-&gt;kobj.parent);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='add'>+</div><div class='add'>+err:</div><div class='add'>+	kfree_const(p-&gt;kobj.name);</div><div class='add'>+	p-&gt;kobj.name = NULL;</div><div class='add'>+	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -547,7 +554,7 @@ int cdev_device_add(struct cdev *cdev, struct device *dev)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	rc = device_add(dev);</div><div class='del'>-	if (rc)</div><div class='add'>+	if (rc &amp;&amp; dev-&gt;devt)</div><div class='ctx'> 		cdev_del(cdev);</div><div class='ctx'> </div><div class='ctx'> 	return rc;</div><div class='hunk'>@@ -555,8 +562,8 @@ int cdev_device_add(struct cdev *cdev, struct device *dev)</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * cdev_device_del() - inverse of cdev_device_add</div><div class='del'>- * @dev: the device structure</div><div class='ctx'>  * @cdev: the cdev structure</div><div class='add'>+ * @dev: the device structure</div><div class='ctx'>  *</div><div class='ctx'>  * cdev_device_del() is a helper function to call cdev_del and device_del.</div><div class='ctx'>  * It should be used whenever cdev_device_add is used.</div><div class='head'>diff --git a/fs/cifs/cache.c b/fs/cifs/cache.c<br/>deleted file mode 100644<br/>index 8be57aaedab6..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cifs/cache.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/cache.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,105 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: LGPL-2.1</div><div class='del'>-/*</div><div class='del'>- *   CIFS filesystem cache index structure definitions</div><div class='del'>- *</div><div class='del'>- *   Copyright (c) 2010 Novell, Inc.</div><div class='del'>- *   Authors(s): Suresh Jayaraman (sjayaraman@suse.de&gt;</div><div class='del'>- *</div><div class='del'>- */</div><div class='del'>-#include "fscache.h"</div><div class='del'>-#include "cifs_debug.h"</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * CIFS filesystem definition for FS-Cache</div><div class='del'>- */</div><div class='del'>-struct fscache_netfs cifs_fscache_netfs = {</div><div class='del'>-	.name = "cifs",</div><div class='del'>-	.version = 0,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Register CIFS for caching with FS-Cache</div><div class='del'>- */</div><div class='del'>-int cifs_fscache_register(void)</div><div class='del'>-{</div><div class='del'>-	return fscache_register_netfs(&amp;cifs_fscache_netfs);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Unregister CIFS for caching</div><div class='del'>- */</div><div class='del'>-void cifs_fscache_unregister(void)</div><div class='del'>-{</div><div class='del'>-	fscache_unregister_netfs(&amp;cifs_fscache_netfs);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Server object for FS-Cache</div><div class='del'>- */</div><div class='del'>-const struct fscache_cookie_def cifs_fscache_server_index_def = {</div><div class='del'>-	.name = "CIFS.server",</div><div class='del'>-	.type = FSCACHE_COOKIE_TYPE_INDEX,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static enum</div><div class='del'>-fscache_checkaux cifs_fscache_super_check_aux(void *cookie_netfs_data,</div><div class='del'>-					      const void *data,</div><div class='del'>-					      uint16_t datalen,</div><div class='del'>-					      loff_t object_size)</div><div class='del'>-{</div><div class='del'>-	struct cifs_fscache_super_auxdata auxdata;</div><div class='del'>-	const struct cifs_tcon *tcon = cookie_netfs_data;</div><div class='del'>-</div><div class='del'>-	if (datalen != sizeof(auxdata))</div><div class='del'>-		return FSCACHE_CHECKAUX_OBSOLETE;</div><div class='del'>-</div><div class='del'>-	memset(&amp;auxdata, 0, sizeof(auxdata));</div><div class='del'>-	auxdata.resource_id = tcon-&gt;resource_id;</div><div class='del'>-	auxdata.vol_create_time = tcon-&gt;vol_create_time;</div><div class='del'>-	auxdata.vol_serial_number = tcon-&gt;vol_serial_number;</div><div class='del'>-</div><div class='del'>-	if (memcmp(data, &amp;auxdata, datalen) != 0)</div><div class='del'>-		return FSCACHE_CHECKAUX_OBSOLETE;</div><div class='del'>-</div><div class='del'>-	return FSCACHE_CHECKAUX_OKAY;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Superblock object for FS-Cache</div><div class='del'>- */</div><div class='del'>-const struct fscache_cookie_def cifs_fscache_super_index_def = {</div><div class='del'>-	.name = "CIFS.super",</div><div class='del'>-	.type = FSCACHE_COOKIE_TYPE_INDEX,</div><div class='del'>-	.check_aux = cifs_fscache_super_check_aux,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static enum</div><div class='del'>-fscache_checkaux cifs_fscache_inode_check_aux(void *cookie_netfs_data,</div><div class='del'>-					      const void *data,</div><div class='del'>-					      uint16_t datalen,</div><div class='del'>-					      loff_t object_size)</div><div class='del'>-{</div><div class='del'>-	struct cifs_fscache_inode_auxdata auxdata;</div><div class='del'>-	struct cifsInodeInfo *cifsi = cookie_netfs_data;</div><div class='del'>-</div><div class='del'>-	if (datalen != sizeof(auxdata))</div><div class='del'>-		return FSCACHE_CHECKAUX_OBSOLETE;</div><div class='del'>-</div><div class='del'>-	memset(&amp;auxdata, 0, sizeof(auxdata));</div><div class='del'>-	auxdata.eof = cifsi-&gt;server_eof;</div><div class='del'>-	auxdata.last_write_time_sec = cifsi-&gt;vfs_inode.i_mtime.tv_sec;</div><div class='del'>-	auxdata.last_change_time_sec = cifsi-&gt;vfs_inode.i_ctime.tv_sec;</div><div class='del'>-	auxdata.last_write_time_nsec = cifsi-&gt;vfs_inode.i_mtime.tv_nsec;</div><div class='del'>-	auxdata.last_change_time_nsec = cifsi-&gt;vfs_inode.i_ctime.tv_nsec;</div><div class='del'>-</div><div class='del'>-	if (memcmp(data, &amp;auxdata, datalen) != 0)</div><div class='del'>-		return FSCACHE_CHECKAUX_OBSOLETE;</div><div class='del'>-</div><div class='del'>-	return FSCACHE_CHECKAUX_OKAY;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-const struct fscache_cookie_def cifs_fscache_inode_object_def = {</div><div class='del'>-	.name		= "CIFS.uniqueid",</div><div class='del'>-	.type		= FSCACHE_COOKIE_TYPE_DATAFILE,</div><div class='del'>-	.check_aux	= cifs_fscache_inode_check_aux,</div><div class='del'>-};</div><div class='head'>diff --git a/fs/cifs/cifs_dfs_ref.c b/fs/cifs/cifs_dfs_ref.c<br/>deleted file mode 100644<br/>index 007427ba75e5..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cifs/cifs_dfs_ref.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/cifs_dfs_ref.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,429 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='del'>-/*</div><div class='del'>- *   Contains the CIFS DFS referral mounting routines used for handling</div><div class='del'>- *   traversal via DFS junction point</div><div class='del'>- *</div><div class='del'>- *   Copyright (c) 2007 Igor Mammedov</div><div class='del'>- *   Copyright (C) International Business Machines  Corp., 2008</div><div class='del'>- *   Author(s): Igor Mammedov (niallain@gmail.com)</div><div class='del'>- *		Steve French (sfrench@us.ibm.com)</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#include &lt;linux/dcache.h&gt;</div><div class='del'>-#include &lt;linux/mount.h&gt;</div><div class='del'>-#include &lt;linux/namei.h&gt;</div><div class='del'>-#include &lt;linux/slab.h&gt;</div><div class='del'>-#include &lt;linux/vfs.h&gt;</div><div class='del'>-#include &lt;linux/fs.h&gt;</div><div class='del'>-#include &lt;linux/inet.h&gt;</div><div class='del'>-#include "cifsglob.h"</div><div class='del'>-#include "cifsproto.h"</div><div class='del'>-#include "cifsfs.h"</div><div class='del'>-#include "dns_resolve.h"</div><div class='del'>-#include "cifs_debug.h"</div><div class='del'>-#include "cifs_unicode.h"</div><div class='del'>-#include "dfs_cache.h"</div><div class='del'>-#include "fs_context.h"</div><div class='del'>-</div><div class='del'>-static LIST_HEAD(cifs_dfs_automount_list);</div><div class='del'>-</div><div class='del'>-static void cifs_dfs_expire_automounts(struct work_struct *work);</div><div class='del'>-static DECLARE_DELAYED_WORK(cifs_dfs_automount_task,</div><div class='del'>-			    cifs_dfs_expire_automounts);</div><div class='del'>-static int cifs_dfs_mountpoint_expiry_timeout = 500 * HZ;</div><div class='del'>-</div><div class='del'>-static void cifs_dfs_expire_automounts(struct work_struct *work)</div><div class='del'>-{</div><div class='del'>-	struct list_head *list = &amp;cifs_dfs_automount_list;</div><div class='del'>-</div><div class='del'>-	mark_mounts_for_expiry(list);</div><div class='del'>-	if (!list_empty(list))</div><div class='del'>-		schedule_delayed_work(&amp;cifs_dfs_automount_task,</div><div class='del'>-				      cifs_dfs_mountpoint_expiry_timeout);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void cifs_dfs_release_automount_timer(void)</div><div class='del'>-{</div><div class='del'>-	BUG_ON(!list_empty(&amp;cifs_dfs_automount_list));</div><div class='del'>-	cancel_delayed_work_sync(&amp;cifs_dfs_automount_task);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * cifs_build_devname - build a devicename from a UNC and optional prepath</div><div class='del'>- * @nodename:	pointer to UNC string</div><div class='del'>- * @prepath:	pointer to prefixpath (or NULL if there isn't one)</div><div class='del'>- *</div><div class='del'>- * Build a new cifs devicename after chasing a DFS referral. Allocate a buffer</div><div class='del'>- * big enough to hold the final thing. Copy the UNC from the nodename, and</div><div class='del'>- * concatenate the prepath onto the end of it if there is one.</div><div class='del'>- *</div><div class='del'>- * Returns pointer to the built string, or a ERR_PTR. Caller is responsible</div><div class='del'>- * for freeing the returned string.</div><div class='del'>- */</div><div class='del'>-static char *</div><div class='del'>-cifs_build_devname(char *nodename, const char *prepath)</div><div class='del'>-{</div><div class='del'>-	size_t pplen;</div><div class='del'>-	size_t unclen;</div><div class='del'>-	char *dev;</div><div class='del'>-	char *pos;</div><div class='del'>-</div><div class='del'>-	/* skip over any preceding delimiters */</div><div class='del'>-	nodename += strspn(nodename, "\\");</div><div class='del'>-	if (!*nodename)</div><div class='del'>-		return ERR_PTR(-EINVAL);</div><div class='del'>-</div><div class='del'>-	/* get length of UNC and set pos to last char */</div><div class='del'>-	unclen = strlen(nodename);</div><div class='del'>-	pos = nodename + unclen - 1;</div><div class='del'>-</div><div class='del'>-	/* trim off any trailing delimiters */</div><div class='del'>-	while (*pos == '\\') {</div><div class='del'>-		--pos;</div><div class='del'>-		--unclen;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* allocate a buffer:</div><div class='del'>-	 * +2 for preceding "//"</div><div class='del'>-	 * +1 for delimiter between UNC and prepath</div><div class='del'>-	 * +1 for trailing NULL</div><div class='del'>-	 */</div><div class='del'>-	pplen = prepath ? strlen(prepath) : 0;</div><div class='del'>-	dev = kmalloc(2 + unclen + 1 + pplen + 1, GFP_KERNEL);</div><div class='del'>-	if (!dev)</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='del'>-</div><div class='del'>-	pos = dev;</div><div class='del'>-	/* add the initial "//" */</div><div class='del'>-	*pos = '/';</div><div class='del'>-	++pos;</div><div class='del'>-	*pos = '/';</div><div class='del'>-	++pos;</div><div class='del'>-</div><div class='del'>-	/* copy in the UNC portion from referral */</div><div class='del'>-	memcpy(pos, nodename, unclen);</div><div class='del'>-	pos += unclen;</div><div class='del'>-</div><div class='del'>-	/* copy the prefixpath remainder (if there is one) */</div><div class='del'>-	if (pplen) {</div><div class='del'>-		*pos = '/';</div><div class='del'>-		++pos;</div><div class='del'>-		memcpy(pos, prepath, pplen);</div><div class='del'>-		pos += pplen;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* NULL terminator */</div><div class='del'>-	*pos = '\0';</div><div class='del'>-</div><div class='del'>-	convert_delimiter(dev, '/');</div><div class='del'>-	return dev;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * cifs_compose_mount_options	-	creates mount options for referral</div><div class='del'>- * @sb_mountdata:	parent/root DFS mount options (template)</div><div class='del'>- * @fullpath:		full path in UNC format</div><div class='del'>- * @ref:		optional server's referral</div><div class='del'>- * @devname:		return the built cifs device name if passed pointer not NULL</div><div class='del'>- * creates mount options for submount based on template options sb_mountdata</div><div class='del'>- * and replacing unc,ip,prefixpath options with ones we've got form ref_unc.</div><div class='del'>- *</div><div class='del'>- * Returns: pointer to new mount options or ERR_PTR.</div><div class='del'>- * Caller is responsible for freeing returned value if it is not error.</div><div class='del'>- */</div><div class='del'>-char *cifs_compose_mount_options(const char *sb_mountdata,</div><div class='del'>-				 const char *fullpath,</div><div class='del'>-				 const struct dfs_info3_param *ref,</div><div class='del'>-				 char **devname)</div><div class='del'>-{</div><div class='del'>-	int rc;</div><div class='del'>-	char *name;</div><div class='del'>-	char *mountdata = NULL;</div><div class='del'>-	const char *prepath = NULL;</div><div class='del'>-	int md_len;</div><div class='del'>-	char *tkn_e;</div><div class='del'>-	char *srvIP = NULL;</div><div class='del'>-	char sep = ',';</div><div class='del'>-	int off, noff;</div><div class='del'>-</div><div class='del'>-	if (sb_mountdata == NULL)</div><div class='del'>-		return ERR_PTR(-EINVAL);</div><div class='del'>-</div><div class='del'>-	if (ref) {</div><div class='del'>-		if (WARN_ON_ONCE(!ref-&gt;node_name || ref-&gt;path_consumed &lt; 0))</div><div class='del'>-			return ERR_PTR(-EINVAL);</div><div class='del'>-</div><div class='del'>-		if (strlen(fullpath) - ref-&gt;path_consumed) {</div><div class='del'>-			prepath = fullpath + ref-&gt;path_consumed;</div><div class='del'>-			/* skip initial delimiter */</div><div class='del'>-			if (*prepath == '/' || *prepath == '\\')</div><div class='del'>-				prepath++;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		name = cifs_build_devname(ref-&gt;node_name, prepath);</div><div class='del'>-		if (IS_ERR(name)) {</div><div class='del'>-			rc = PTR_ERR(name);</div><div class='del'>-			name = NULL;</div><div class='del'>-			goto compose_mount_options_err;</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-		name = cifs_build_devname((char *)fullpath, NULL);</div><div class='del'>-		if (IS_ERR(name)) {</div><div class='del'>-			rc = PTR_ERR(name);</div><div class='del'>-			name = NULL;</div><div class='del'>-			goto compose_mount_options_err;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rc = dns_resolve_server_name_to_ip(name, &amp;srvIP, NULL);</div><div class='del'>-	if (rc &lt; 0) {</div><div class='del'>-		cifs_dbg(FYI, "%s: Failed to resolve server part of %s to IP: %d\n",</div><div class='del'>-			 __func__, name, rc);</div><div class='del'>-		goto compose_mount_options_err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * In most cases, we'll be building a shorter string than the original,</div><div class='del'>-	 * but we do have to assume that the address in the ip= option may be</div><div class='del'>-	 * much longer than the original. Add the max length of an address</div><div class='del'>-	 * string to the length of the original string to allow for worst case.</div><div class='del'>-	 */</div><div class='del'>-	md_len = strlen(sb_mountdata) + INET6_ADDRSTRLEN;</div><div class='del'>-	mountdata = kzalloc(md_len + sizeof("ip=") + 1, GFP_KERNEL);</div><div class='del'>-	if (mountdata == NULL) {</div><div class='del'>-		rc = -ENOMEM;</div><div class='del'>-		goto compose_mount_options_err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* copy all options except of unc,ip,prefixpath */</div><div class='del'>-	off = 0;</div><div class='del'>-	if (strncmp(sb_mountdata, "sep=", 4) == 0) {</div><div class='del'>-			sep = sb_mountdata[4];</div><div class='del'>-			strncpy(mountdata, sb_mountdata, 5);</div><div class='del'>-			off += 5;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		tkn_e = strchr(sb_mountdata + off, sep);</div><div class='del'>-		if (tkn_e == NULL)</div><div class='del'>-			noff = strlen(sb_mountdata + off);</div><div class='del'>-		else</div><div class='del'>-			noff = tkn_e - (sb_mountdata + off) + 1;</div><div class='del'>-</div><div class='del'>-		if (strncasecmp(sb_mountdata + off, "cruid=", 6) == 0) {</div><div class='del'>-			off += noff;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-		if (strncasecmp(sb_mountdata + off, "unc=", 4) == 0) {</div><div class='del'>-			off += noff;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-		if (strncasecmp(sb_mountdata + off, "ip=", 3) == 0) {</div><div class='del'>-			off += noff;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-		if (strncasecmp(sb_mountdata + off, "prefixpath=", 11) == 0) {</div><div class='del'>-			off += noff;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-		strncat(mountdata, sb_mountdata + off, noff);</div><div class='del'>-		off += noff;</div><div class='del'>-	} while (tkn_e);</div><div class='del'>-	strcat(mountdata, sb_mountdata + off);</div><div class='del'>-	mountdata[md_len] = '\0';</div><div class='del'>-</div><div class='del'>-	/* copy new IP and ref share name */</div><div class='del'>-	if (mountdata[strlen(mountdata) - 1] != sep)</div><div class='del'>-		strncat(mountdata, &amp;sep, 1);</div><div class='del'>-	strcat(mountdata, "ip=");</div><div class='del'>-	strcat(mountdata, srvIP);</div><div class='del'>-</div><div class='del'>-	if (devname)</div><div class='del'>-		*devname = name;</div><div class='del'>-	else</div><div class='del'>-		kfree(name);</div><div class='del'>-</div><div class='del'>-	/*cifs_dbg(FYI, "%s: parent mountdata: %s\n", __func__, sb_mountdata);*/</div><div class='del'>-	/*cifs_dbg(FYI, "%s: submount mountdata: %s\n", __func__, mountdata );*/</div><div class='del'>-</div><div class='del'>-compose_mount_options_out:</div><div class='del'>-	kfree(srvIP);</div><div class='del'>-	return mountdata;</div><div class='del'>-</div><div class='del'>-compose_mount_options_err:</div><div class='del'>-	kfree(mountdata);</div><div class='del'>-	mountdata = ERR_PTR(rc);</div><div class='del'>-	kfree(name);</div><div class='del'>-	goto compose_mount_options_out;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * cifs_dfs_do_mount - mounts specified path using DFS full path</div><div class='del'>- *</div><div class='del'>- * Always pass down @fullpath to smb3_do_mount() so we can use the root server</div><div class='del'>- * to perform failover in case we failed to connect to the first target in the</div><div class='del'>- * referral.</div><div class='del'>- *</div><div class='del'>- * @mntpt:		directory entry for the path we are trying to automount</div><div class='del'>- * @cifs_sb:		parent/root superblock</div><div class='del'>- * @fullpath:		full path in UNC format</div><div class='del'>- */</div><div class='del'>-static struct vfsmount *cifs_dfs_do_mount(struct dentry *mntpt,</div><div class='del'>-					  struct cifs_sb_info *cifs_sb,</div><div class='del'>-					  const char *fullpath)</div><div class='del'>-{</div><div class='del'>-	struct vfsmount *mnt;</div><div class='del'>-	char *mountdata;</div><div class='del'>-	char *devname;</div><div class='del'>-</div><div class='del'>-	devname = kstrdup(fullpath, GFP_KERNEL);</div><div class='del'>-	if (!devname)</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='del'>-</div><div class='del'>-	convert_delimiter(devname, '/');</div><div class='del'>-</div><div class='del'>-	/* TODO: change to call fs_context_for_mount(), fill in context directly, call fc_mount */</div><div class='del'>-</div><div class='del'>-	/* See afs_mntpt_do_automount in fs/afs/mntpt.c for an example */</div><div class='del'>-</div><div class='del'>-	/* strip first '\' from fullpath */</div><div class='del'>-	mountdata = cifs_compose_mount_options(cifs_sb-&gt;ctx-&gt;mount_options,</div><div class='del'>-					       fullpath + 1, NULL, NULL);</div><div class='del'>-	if (IS_ERR(mountdata)) {</div><div class='del'>-		kfree(devname);</div><div class='del'>-		return (struct vfsmount *)mountdata;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	mnt = vfs_submount(mntpt, &amp;cifs_fs_type, devname, mountdata);</div><div class='del'>-	kfree(mountdata);</div><div class='del'>-	kfree(devname);</div><div class='del'>-	return mnt;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Create a vfsmount that we can automount</div><div class='del'>- */</div><div class='del'>-static struct vfsmount *cifs_dfs_do_automount(struct dentry *mntpt)</div><div class='del'>-{</div><div class='del'>-	struct cifs_sb_info *cifs_sb;</div><div class='del'>-	struct cifs_ses *ses;</div><div class='del'>-	struct cifs_tcon *tcon;</div><div class='del'>-	void *page;</div><div class='del'>-	char *full_path, *root_path;</div><div class='del'>-	unsigned int xid;</div><div class='del'>-	int rc;</div><div class='del'>-	struct vfsmount *mnt;</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "in %s\n", __func__);</div><div class='del'>-	BUG_ON(IS_ROOT(mntpt));</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * The MSDFS spec states that paths in DFS referral requests and</div><div class='del'>-	 * responses must be prefixed by a single '\' character instead of</div><div class='del'>-	 * the double backslashes usually used in the UNC. This function</div><div class='del'>-	 * gives us the latter, so we must adjust the result.</div><div class='del'>-	 */</div><div class='del'>-	mnt = ERR_PTR(-ENOMEM);</div><div class='del'>-</div><div class='del'>-	cifs_sb = CIFS_SB(mntpt-&gt;d_sb);</div><div class='del'>-	if (cifs_sb-&gt;mnt_cifs_flags &amp; CIFS_MOUNT_NO_DFS) {</div><div class='del'>-		mnt = ERR_PTR(-EREMOTE);</div><div class='del'>-		goto cdda_exit;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	page = alloc_dentry_path();</div><div class='del'>-	/* always use tree name prefix */</div><div class='del'>-	full_path = build_path_from_dentry_optional_prefix(mntpt, page, true);</div><div class='del'>-	if (IS_ERR(full_path)) {</div><div class='del'>-		mnt = ERR_CAST(full_path);</div><div class='del'>-		goto free_full_path;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	convert_delimiter(full_path, '\\');</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "%s: full_path: %s\n", __func__, full_path);</div><div class='del'>-</div><div class='del'>-	if (!cifs_sb_master_tlink(cifs_sb)) {</div><div class='del'>-		cifs_dbg(FYI, "%s: master tlink is NULL\n", __func__);</div><div class='del'>-		goto free_full_path;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	tcon = cifs_sb_master_tcon(cifs_sb);</div><div class='del'>-	if (!tcon) {</div><div class='del'>-		cifs_dbg(FYI, "%s: master tcon is NULL\n", __func__);</div><div class='del'>-		goto free_full_path;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	root_path = kstrdup(tcon-&gt;treeName, GFP_KERNEL);</div><div class='del'>-	if (!root_path) {</div><div class='del'>-		mnt = ERR_PTR(-ENOMEM);</div><div class='del'>-		goto free_full_path;</div><div class='del'>-	}</div><div class='del'>-	cifs_dbg(FYI, "%s: root path: %s\n", __func__, root_path);</div><div class='del'>-</div><div class='del'>-	ses = tcon-&gt;ses;</div><div class='del'>-	xid = get_xid();</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If DFS root has been expired, then unconditionally fetch it again to</div><div class='del'>-	 * refresh DFS referral cache.</div><div class='del'>-	 */</div><div class='del'>-	rc = dfs_cache_find(xid, ses, cifs_sb-&gt;local_nls, cifs_remap(cifs_sb),</div><div class='del'>-			    root_path + 1, NULL, NULL);</div><div class='del'>-	if (!rc) {</div><div class='del'>-		rc = dfs_cache_find(xid, ses, cifs_sb-&gt;local_nls,</div><div class='del'>-				    cifs_remap(cifs_sb), full_path + 1,</div><div class='del'>-				    NULL, NULL);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	free_xid(xid);</div><div class='del'>-</div><div class='del'>-	if (rc) {</div><div class='del'>-		mnt = ERR_PTR(rc);</div><div class='del'>-		goto free_root_path;</div><div class='del'>-	}</div><div class='del'>-	/*</div><div class='del'>-	 * OK - we were able to get and cache a referral for @full_path.</div><div class='del'>-	 *</div><div class='del'>-	 * Now, pass it down to cifs_mount() and it will retry every available</div><div class='del'>-	 * node server in case of failures - no need to do it here.</div><div class='del'>-	 */</div><div class='del'>-	mnt = cifs_dfs_do_mount(mntpt, cifs_sb, full_path);</div><div class='del'>-	cifs_dbg(FYI, "%s: cifs_dfs_do_mount:%s , mnt:%p\n", __func__,</div><div class='del'>-		 full_path + 1, mnt);</div><div class='del'>-</div><div class='del'>-free_root_path:</div><div class='del'>-	kfree(root_path);</div><div class='del'>-free_full_path:</div><div class='del'>-	free_dentry_path(page);</div><div class='del'>-cdda_exit:</div><div class='del'>-	cifs_dbg(FYI, "leaving %s\n" , __func__);</div><div class='del'>-	return mnt;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Attempt to automount the referral</div><div class='del'>- */</div><div class='del'>-struct vfsmount *cifs_dfs_d_automount(struct path *path)</div><div class='del'>-{</div><div class='del'>-	struct vfsmount *newmnt;</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "in %s\n", __func__);</div><div class='del'>-</div><div class='del'>-	newmnt = cifs_dfs_do_automount(path-&gt;dentry);</div><div class='del'>-	if (IS_ERR(newmnt)) {</div><div class='del'>-		cifs_dbg(FYI, "leaving %s [automount failed]\n" , __func__);</div><div class='del'>-		return newmnt;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	mntget(newmnt); /* prevent immediate expiration */</div><div class='del'>-	mnt_set_expiry(newmnt, &amp;cifs_dfs_automount_list);</div><div class='del'>-	schedule_delayed_work(&amp;cifs_dfs_automount_task,</div><div class='del'>-			      cifs_dfs_mountpoint_expiry_timeout);</div><div class='del'>-	cifs_dbg(FYI, "leaving %s [ok]\n" , __func__);</div><div class='del'>-	return newmnt;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-const struct inode_operations cifs_dfs_referral_inode_operations = {</div><div class='del'>-};</div><div class='head'>diff --git a/fs/cifs/cifs_unicode.h b/fs/cifs/cifs_unicode.h<br/>deleted file mode 100644<br/>index 80b3d845419f..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cifs/cifs_unicode.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/cifs_unicode.h</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,404 +0,0 @@</div><div class='del'>-/* SPDX-License-Identifier: GPL-2.0-or-later */</div><div class='del'>-/*</div><div class='del'>- * cifs_unicode:  Unicode kernel case support</div><div class='del'>- *</div><div class='del'>- * Function:</div><div class='del'>- *     Convert a unicode character to upper or lower case using</div><div class='del'>- *     compressed tables.</div><div class='del'>- *</div><div class='del'>- *   Copyright (c) International Business Machines  Corp., 2000,2009</div><div class='del'>- *</div><div class='del'>- * Notes:</div><div class='del'>- *     These APIs are based on the C library functions.  The semantics</div><div class='del'>- *     should match the C functions but with expanded size operands.</div><div class='del'>- *</div><div class='del'>- *     The upper/lower functions are based on a table created by mkupr.</div><div class='del'>- *     This is a compressed table of upper and lower case conversion.</div><div class='del'>- */</div><div class='del'>-#ifndef _CIFS_UNICODE_H</div><div class='del'>-#define _CIFS_UNICODE_H</div><div class='del'>-</div><div class='del'>-#include &lt;asm/byteorder.h&gt;</div><div class='del'>-#include &lt;linux/types.h&gt;</div><div class='del'>-#include &lt;linux/nls.h&gt;</div><div class='del'>-</div><div class='del'>-#define  UNIUPR_NOLOWER		/* Example to not expand lower case tables */</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Windows maps these to the user defined 16 bit Unicode range since they are</div><div class='del'>- * reserved symbols (along with \ and /), otherwise illegal to store</div><div class='del'>- * in filenames in NTFS</div><div class='del'>- */</div><div class='del'>-#define UNI_ASTERISK    (__u16) ('*' + 0xF000)</div><div class='del'>-#define UNI_QUESTION    (__u16) ('?' + 0xF000)</div><div class='del'>-#define UNI_COLON       (__u16) (':' + 0xF000)</div><div class='del'>-#define UNI_GRTRTHAN    (__u16) ('&gt;' + 0xF000)</div><div class='del'>-#define UNI_LESSTHAN    (__u16) ('&lt;' + 0xF000)</div><div class='del'>-#define UNI_PIPE        (__u16) ('|' + 0xF000)</div><div class='del'>-#define UNI_SLASH       (__u16) ('\\' + 0xF000)</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Macs use an older "SFM" mapping of the symbols above. Fortunately it does</div><div class='del'>- * not conflict (although almost does) with the mapping above.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#define SFM_DOUBLEQUOTE ((__u16) 0xF020)</div><div class='del'>-#define SFM_ASTERISK    ((__u16) 0xF021)</div><div class='del'>-#define SFM_QUESTION    ((__u16) 0xF025)</div><div class='del'>-#define SFM_COLON       ((__u16) 0xF022)</div><div class='del'>-#define SFM_GRTRTHAN    ((__u16) 0xF024)</div><div class='del'>-#define SFM_LESSTHAN    ((__u16) 0xF023)</div><div class='del'>-#define SFM_PIPE        ((__u16) 0xF027)</div><div class='del'>-#define SFM_SLASH       ((__u16) 0xF026)</div><div class='del'>-#define SFM_SPACE	((__u16) 0xF028)</div><div class='del'>-#define SFM_PERIOD	((__u16) 0xF029)</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Mapping mechanism to use when one of the seven reserved characters is</div><div class='del'>- * encountered.  We can only map using one of the mechanisms at a time</div><div class='del'>- * since otherwise readdir could return directory entries which we would</div><div class='del'>- * not be able to open</div><div class='del'>- *</div><div class='del'>- * NO_MAP_UNI_RSVD  = do not perform any remapping of the character</div><div class='del'>- * SFM_MAP_UNI_RSVD = map reserved characters using SFM scheme (MAC compatible)</div><div class='del'>- * SFU_MAP_UNI_RSVD = map reserved characters ala SFU ("mapchars" option)</div><div class='del'>- *</div><div class='del'>- */</div><div class='del'>-#define NO_MAP_UNI_RSVD		0</div><div class='del'>-#define SFM_MAP_UNI_RSVD	1</div><div class='del'>-#define SFU_MAP_UNI_RSVD	2</div><div class='del'>-</div><div class='del'>-/* Just define what we want from uniupr.h.  We don't want to define the tables</div><div class='del'>- * in each source file.</div><div class='del'>- */</div><div class='del'>-#ifndef	UNICASERANGE_DEFINED</div><div class='del'>-struct UniCaseRange {</div><div class='del'>-	wchar_t start;</div><div class='del'>-	wchar_t end;</div><div class='del'>-	signed char *table;</div><div class='del'>-};</div><div class='del'>-#endif				/* UNICASERANGE_DEFINED */</div><div class='del'>-</div><div class='del'>-#ifndef UNIUPR_NOUPPER</div><div class='del'>-extern signed char CifsUniUpperTable[512];</div><div class='del'>-extern const struct UniCaseRange CifsUniUpperRange[];</div><div class='del'>-#endif				/* UNIUPR_NOUPPER */</div><div class='del'>-</div><div class='del'>-#ifndef UNIUPR_NOLOWER</div><div class='del'>-extern signed char CifsUniLowerTable[512];</div><div class='del'>-extern const struct UniCaseRange CifsUniLowerRange[];</div><div class='del'>-#endif				/* UNIUPR_NOLOWER */</div><div class='del'>-</div><div class='del'>-#ifdef __KERNEL__</div><div class='del'>-int cifs_from_utf16(char *to, const __le16 *from, int tolen, int fromlen,</div><div class='del'>-		    const struct nls_table *cp, int map_type);</div><div class='del'>-int cifs_utf16_bytes(const __le16 *from, int maxbytes,</div><div class='del'>-		     const struct nls_table *codepage);</div><div class='del'>-int cifs_strtoUTF16(__le16 *, const char *, int, const struct nls_table *);</div><div class='del'>-char *cifs_strndup_from_utf16(const char *src, const int maxlen,</div><div class='del'>-			      const bool is_unicode,</div><div class='del'>-			      const struct nls_table *codepage);</div><div class='del'>-extern int cifsConvertToUTF16(__le16 *target, const char *source, int maxlen,</div><div class='del'>-			      const struct nls_table *cp, int mapChars);</div><div class='del'>-extern int cifs_remap(struct cifs_sb_info *cifs_sb);</div><div class='del'>-extern __le16 *cifs_strndup_to_utf16(const char *src, const int maxlen,</div><div class='del'>-				     int *utf16_len, const struct nls_table *cp,</div><div class='del'>-				     int remap);</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-wchar_t cifs_toupper(wchar_t in);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * UniStrcat:  Concatenate the second string to the first</div><div class='del'>- *</div><div class='del'>- * Returns:</div><div class='del'>- *     Address of the first string</div><div class='del'>- */</div><div class='del'>-static inline __le16 *</div><div class='del'>-UniStrcat(__le16 *ucs1, const __le16 *ucs2)</div><div class='del'>-{</div><div class='del'>-	__le16 *anchor = ucs1;	/* save a pointer to start of ucs1 */</div><div class='del'>-</div><div class='del'>-	while (*ucs1++) ;	/* To end of first string */</div><div class='del'>-	ucs1--;			/* Return to the null */</div><div class='del'>-	while ((*ucs1++ = *ucs2++)) ;	/* copy string 2 over */</div><div class='del'>-	return anchor;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * UniStrchr:  Find a character in a string</div><div class='del'>- *</div><div class='del'>- * Returns:</div><div class='del'>- *     Address of first occurrence of character in string</div><div class='del'>- *     or NULL if the character is not in the string</div><div class='del'>- */</div><div class='del'>-static inline wchar_t *</div><div class='del'>-UniStrchr(const wchar_t *ucs, wchar_t uc)</div><div class='del'>-{</div><div class='del'>-	while ((*ucs != uc) &amp;&amp; *ucs)</div><div class='del'>-		ucs++;</div><div class='del'>-</div><div class='del'>-	if (*ucs == uc)</div><div class='del'>-		return (wchar_t *) ucs;</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * UniStrcmp:  Compare two strings</div><div class='del'>- *</div><div class='del'>- * Returns:</div><div class='del'>- *     &lt; 0:  First string is less than second</div><div class='del'>- *     = 0:  Strings are equal</div><div class='del'>- *     &gt; 0:  First string is greater than second</div><div class='del'>- */</div><div class='del'>-static inline int</div><div class='del'>-UniStrcmp(const wchar_t *ucs1, const wchar_t *ucs2)</div><div class='del'>-{</div><div class='del'>-	while ((*ucs1 == *ucs2) &amp;&amp; *ucs1) {</div><div class='del'>-		ucs1++;</div><div class='del'>-		ucs2++;</div><div class='del'>-	}</div><div class='del'>-	return (int) *ucs1 - (int) *ucs2;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * UniStrcpy:  Copy a string</div><div class='del'>- */</div><div class='del'>-static inline wchar_t *</div><div class='del'>-UniStrcpy(wchar_t *ucs1, const wchar_t *ucs2)</div><div class='del'>-{</div><div class='del'>-	wchar_t *anchor = ucs1;	/* save the start of result string */</div><div class='del'>-</div><div class='del'>-	while ((*ucs1++ = *ucs2++)) ;</div><div class='del'>-	return anchor;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * UniStrlen:  Return the length of a string (in 16 bit Unicode chars not bytes)</div><div class='del'>- */</div><div class='del'>-static inline size_t</div><div class='del'>-UniStrlen(const wchar_t *ucs1)</div><div class='del'>-{</div><div class='del'>-	int i = 0;</div><div class='del'>-</div><div class='del'>-	while (*ucs1++)</div><div class='del'>-		i++;</div><div class='del'>-	return i;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * UniStrnlen:  Return the length (in 16 bit Unicode chars not bytes) of a</div><div class='del'>- *		string (length limited)</div><div class='del'>- */</div><div class='del'>-static inline size_t</div><div class='del'>-UniStrnlen(const wchar_t *ucs1, int maxlen)</div><div class='del'>-{</div><div class='del'>-	int i = 0;</div><div class='del'>-</div><div class='del'>-	while (*ucs1++) {</div><div class='del'>-		i++;</div><div class='del'>-		if (i &gt;= maxlen)</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-	return i;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * UniStrncat:  Concatenate length limited string</div><div class='del'>- */</div><div class='del'>-static inline wchar_t *</div><div class='del'>-UniStrncat(wchar_t *ucs1, const wchar_t *ucs2, size_t n)</div><div class='del'>-{</div><div class='del'>-	wchar_t *anchor = ucs1;	/* save pointer to string 1 */</div><div class='del'>-</div><div class='del'>-	while (*ucs1++) ;</div><div class='del'>-	ucs1--;			/* point to null terminator of s1 */</div><div class='del'>-	while (n-- &amp;&amp; (*ucs1 = *ucs2)) {	/* copy s2 after s1 */</div><div class='del'>-		ucs1++;</div><div class='del'>-		ucs2++;</div><div class='del'>-	}</div><div class='del'>-	*ucs1 = 0;		/* Null terminate the result */</div><div class='del'>-	return (anchor);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * UniStrncmp:  Compare length limited string</div><div class='del'>- */</div><div class='del'>-static inline int</div><div class='del'>-UniStrncmp(const wchar_t *ucs1, const wchar_t *ucs2, size_t n)</div><div class='del'>-{</div><div class='del'>-	if (!n)</div><div class='del'>-		return 0;	/* Null strings are equal */</div><div class='del'>-	while ((*ucs1 == *ucs2) &amp;&amp; *ucs1 &amp;&amp; --n) {</div><div class='del'>-		ucs1++;</div><div class='del'>-		ucs2++;</div><div class='del'>-	}</div><div class='del'>-	return (int) *ucs1 - (int) *ucs2;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * UniStrncmp_le:  Compare length limited string - native to little-endian</div><div class='del'>- */</div><div class='del'>-static inline int</div><div class='del'>-UniStrncmp_le(const wchar_t *ucs1, const wchar_t *ucs2, size_t n)</div><div class='del'>-{</div><div class='del'>-	if (!n)</div><div class='del'>-		return 0;	/* Null strings are equal */</div><div class='del'>-	while ((*ucs1 == __le16_to_cpu(*ucs2)) &amp;&amp; *ucs1 &amp;&amp; --n) {</div><div class='del'>-		ucs1++;</div><div class='del'>-		ucs2++;</div><div class='del'>-	}</div><div class='del'>-	return (int) *ucs1 - (int) __le16_to_cpu(*ucs2);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * UniStrncpy:  Copy length limited string with pad</div><div class='del'>- */</div><div class='del'>-static inline wchar_t *</div><div class='del'>-UniStrncpy(wchar_t *ucs1, const wchar_t *ucs2, size_t n)</div><div class='del'>-{</div><div class='del'>-	wchar_t *anchor = ucs1;</div><div class='del'>-</div><div class='del'>-	while (n-- &amp;&amp; *ucs2)	/* Copy the strings */</div><div class='del'>-		*ucs1++ = *ucs2++;</div><div class='del'>-</div><div class='del'>-	n++;</div><div class='del'>-	while (n--)		/* Pad with nulls */</div><div class='del'>-		*ucs1++ = 0;</div><div class='del'>-	return anchor;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * UniStrncpy_le:  Copy length limited string with pad to little-endian</div><div class='del'>- */</div><div class='del'>-static inline wchar_t *</div><div class='del'>-UniStrncpy_le(wchar_t *ucs1, const wchar_t *ucs2, size_t n)</div><div class='del'>-{</div><div class='del'>-	wchar_t *anchor = ucs1;</div><div class='del'>-</div><div class='del'>-	while (n-- &amp;&amp; *ucs2)	/* Copy the strings */</div><div class='del'>-		*ucs1++ = __le16_to_cpu(*ucs2++);</div><div class='del'>-</div><div class='del'>-	n++;</div><div class='del'>-	while (n--)		/* Pad with nulls */</div><div class='del'>-		*ucs1++ = 0;</div><div class='del'>-	return anchor;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * UniStrstr:  Find a string in a string</div><div class='del'>- *</div><div class='del'>- * Returns:</div><div class='del'>- *     Address of first match found</div><div class='del'>- *     NULL if no matching string is found</div><div class='del'>- */</div><div class='del'>-static inline wchar_t *</div><div class='del'>-UniStrstr(const wchar_t *ucs1, const wchar_t *ucs2)</div><div class='del'>-{</div><div class='del'>-	const wchar_t *anchor1 = ucs1;</div><div class='del'>-	const wchar_t *anchor2 = ucs2;</div><div class='del'>-</div><div class='del'>-	while (*ucs1) {</div><div class='del'>-		if (*ucs1 == *ucs2) {</div><div class='del'>-			/* Partial match found */</div><div class='del'>-			ucs1++;</div><div class='del'>-			ucs2++;</div><div class='del'>-		} else {</div><div class='del'>-			if (!*ucs2)	/* Match found */</div><div class='del'>-				return (wchar_t *) anchor1;</div><div class='del'>-			ucs1 = ++anchor1;	/* No match */</div><div class='del'>-			ucs2 = anchor2;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!*ucs2)		/* Both end together */</div><div class='del'>-		return (wchar_t *) anchor1;	/* Match found */</div><div class='del'>-	return NULL;		/* No match */</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#ifndef UNIUPR_NOUPPER</div><div class='del'>-/*</div><div class='del'>- * UniToupper:  Convert a unicode character to upper case</div><div class='del'>- */</div><div class='del'>-static inline wchar_t</div><div class='del'>-UniToupper(register wchar_t uc)</div><div class='del'>-{</div><div class='del'>-	register const struct UniCaseRange *rp;</div><div class='del'>-</div><div class='del'>-	if (uc &lt; sizeof(CifsUniUpperTable)) {</div><div class='del'>-		/* Latin characters */</div><div class='del'>-		return uc + CifsUniUpperTable[uc];	/* Use base tables */</div><div class='del'>-	} else {</div><div class='del'>-		rp = CifsUniUpperRange;	/* Use range tables */</div><div class='del'>-		while (rp-&gt;start) {</div><div class='del'>-			if (uc &lt; rp-&gt;start)	/* Before start of range */</div><div class='del'>-				return uc;	/* Uppercase = input */</div><div class='del'>-			if (uc &lt;= rp-&gt;end)	/* In range */</div><div class='del'>-				return uc + rp-&gt;table[uc - rp-&gt;start];</div><div class='del'>-			rp++;	/* Try next range */</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	return uc;		/* Past last range */</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * UniStrupr:  Upper case a unicode string</div><div class='del'>- */</div><div class='del'>-static inline __le16 *</div><div class='del'>-UniStrupr(register __le16 *upin)</div><div class='del'>-{</div><div class='del'>-	register __le16 *up;</div><div class='del'>-</div><div class='del'>-	up = upin;</div><div class='del'>-	while (*up) {		/* For all characters */</div><div class='del'>-		*up = cpu_to_le16(UniToupper(le16_to_cpu(*up)));</div><div class='del'>-		up++;</div><div class='del'>-	}</div><div class='del'>-	return upin;		/* Return input pointer */</div><div class='del'>-}</div><div class='del'>-#endif				/* UNIUPR_NOUPPER */</div><div class='del'>-</div><div class='del'>-#ifndef UNIUPR_NOLOWER</div><div class='del'>-/*</div><div class='del'>- * UniTolower:  Convert a unicode character to lower case</div><div class='del'>- */</div><div class='del'>-static inline wchar_t</div><div class='del'>-UniTolower(register wchar_t uc)</div><div class='del'>-{</div><div class='del'>-	register const struct UniCaseRange *rp;</div><div class='del'>-</div><div class='del'>-	if (uc &lt; sizeof(CifsUniLowerTable)) {</div><div class='del'>-		/* Latin characters */</div><div class='del'>-		return uc + CifsUniLowerTable[uc];	/* Use base tables */</div><div class='del'>-	} else {</div><div class='del'>-		rp = CifsUniLowerRange;	/* Use range tables */</div><div class='del'>-		while (rp-&gt;start) {</div><div class='del'>-			if (uc &lt; rp-&gt;start)	/* Before start of range */</div><div class='del'>-				return uc;	/* Uppercase = input */</div><div class='del'>-			if (uc &lt;= rp-&gt;end)	/* In range */</div><div class='del'>-				return uc + rp-&gt;table[uc - rp-&gt;start];</div><div class='del'>-			rp++;	/* Try next range */</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	return uc;		/* Past last range */</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * UniStrlwr:  Lower case a unicode string</div><div class='del'>- */</div><div class='del'>-static inline wchar_t *</div><div class='del'>-UniStrlwr(register wchar_t *upin)</div><div class='del'>-{</div><div class='del'>-	register wchar_t *up;</div><div class='del'>-</div><div class='del'>-	up = upin;</div><div class='del'>-	while (*up) {		/* For all characters */</div><div class='del'>-		*up = UniTolower(*up);</div><div class='del'>-		up++;</div><div class='del'>-	}</div><div class='del'>-	return upin;		/* Return input pointer */</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-#endif /* _CIFS_UNICODE_H */</div><div class='head'>diff --git a/fs/cifs/cifs_uniupr.h b/fs/cifs/cifs_uniupr.h<br/>deleted file mode 100644<br/>index 7b272fcdf0d3..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cifs/cifs_uniupr.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/cifs_uniupr.h</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,239 +0,0 @@</div><div class='del'>-/* SPDX-License-Identifier: GPL-2.0-or-later */</div><div class='del'>-/*</div><div class='del'>- *   Copyright (c) International Business Machines  Corp., 2000,2002</div><div class='del'>- *</div><div class='del'>- * uniupr.h - Unicode compressed case ranges</div><div class='del'>-*/</div><div class='del'>-</div><div class='del'>-#ifndef UNIUPR_NOUPPER</div><div class='del'>-/*</div><div class='del'>- * Latin upper case</div><div class='del'>- */</div><div class='del'>-signed char CifsUniUpperTable[512] = {</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 000-00f */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 010-01f */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 020-02f */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 030-03f */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 040-04f */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 050-05f */</div><div class='del'>-	0, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32,	/* 060-06f */</div><div class='del'>-	-32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, 0, 0, 0, 0, 0,	/* 070-07f */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 080-08f */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 090-09f */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 0a0-0af */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 0b0-0bf */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 0c0-0cf */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 0d0-0df */</div><div class='del'>-	-32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32,	/* 0e0-0ef */</div><div class='del'>-	-32, -32, -32, -32, -32, -32, -32, 0, -32, -32, -32, -32, -32, -32, -32, 121,	/* 0f0-0ff */</div><div class='del'>-	0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1,	/* 100-10f */</div><div class='del'>-	0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1,	/* 110-11f */</div><div class='del'>-	0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1,	/* 120-12f */</div><div class='del'>-	0, 0, 0, -1, 0, -1, 0, -1, 0, 0, -1, 0, -1, 0, -1, 0,	/* 130-13f */</div><div class='del'>-	-1, 0, -1, 0, -1, 0, -1, 0, -1, 0, 0, -1, 0, -1, 0, -1,	/* 140-14f */</div><div class='del'>-	0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1,	/* 150-15f */</div><div class='del'>-	0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1,	/* 160-16f */</div><div class='del'>-	0, -1, 0, -1, 0, -1, 0, -1, 0, 0, -1, 0, -1, 0, -1, 0,	/* 170-17f */</div><div class='del'>-	0, 0, 0, -1, 0, -1, 0, 0, -1, 0, 0, 0, -1, 0, 0, 0,	/* 180-18f */</div><div class='del'>-	0, 0, -1, 0, 0, 0, 0, 0, 0, -1, 0, 0, 0, 0, 0, 0,	/* 190-19f */</div><div class='del'>-	0, -1, 0, -1, 0, -1, 0, 0, -1, 0, 0, 0, 0, -1, 0, 0,	/* 1a0-1af */</div><div class='del'>-	-1, 0, 0, 0, -1, 0, -1, 0, 0, -1, 0, 0, 0, -1, 0, 0,	/* 1b0-1bf */</div><div class='del'>-	0, 0, 0, 0, 0, -1, -2, 0, -1, -2, 0, -1, -2, 0, -1, 0,	/* 1c0-1cf */</div><div class='del'>-	-1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, -79, 0, -1, /* 1d0-1df */</div><div class='del'>-	0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1,	/* 1e0-1ef */</div><div class='del'>-	0, 0, -1, -2, 0, -1, 0, 0, 0, -1, 0, -1, 0, -1, 0, -1,	/* 1f0-1ff */</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/* Upper case range - Greek */</div><div class='del'>-static signed char UniCaseRangeU03a0[47] = {</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, -38, -37, -37, -37,	/* 3a0-3af */</div><div class='del'>-	0, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32,	/* 3b0-3bf */</div><div class='del'>-	-32, -32, -31, -32, -32, -32, -32, -32, -32, -32, -32, -32, -64,</div><div class='del'>-	-63, -63,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/* Upper case range - Cyrillic */</div><div class='del'>-static signed char UniCaseRangeU0430[48] = {</div><div class='del'>-	-32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32,	/* 430-43f */</div><div class='del'>-	-32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32,	/* 440-44f */</div><div class='del'>-	0, -80, -80, -80, -80, -80, -80, -80, -80, -80, -80, -80, -80, 0, -80, -80,	/* 450-45f */</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/* Upper case range - Extended cyrillic */</div><div class='del'>-static signed char UniCaseRangeU0490[61] = {</div><div class='del'>-	0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1,	/* 490-49f */</div><div class='del'>-	0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1,	/* 4a0-4af */</div><div class='del'>-	0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1,	/* 4b0-4bf */</div><div class='del'>-	0, 0, -1, 0, -1, 0, 0, 0, -1, 0, 0, 0, -1,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/* Upper case range - Extended latin and greek */</div><div class='del'>-static signed char UniCaseRangeU1e00[509] = {</div><div class='del'>-	0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1,	/* 1e00-1e0f */</div><div class='del'>-	0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1,	/* 1e10-1e1f */</div><div class='del'>-	0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1,	/* 1e20-1e2f */</div><div class='del'>-	0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1,	/* 1e30-1e3f */</div><div class='del'>-	0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1,	/* 1e40-1e4f */</div><div class='del'>-	0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1,	/* 1e50-1e5f */</div><div class='del'>-	0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1,	/* 1e60-1e6f */</div><div class='del'>-	0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1,	/* 1e70-1e7f */</div><div class='del'>-	0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1,	/* 1e80-1e8f */</div><div class='del'>-	0, -1, 0, -1, 0, -1, 0, 0, 0, 0, 0, -59, 0, -1, 0, -1,	/* 1e90-1e9f */</div><div class='del'>-	0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1,	/* 1ea0-1eaf */</div><div class='del'>-	0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1,	/* 1eb0-1ebf */</div><div class='del'>-	0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1,	/* 1ec0-1ecf */</div><div class='del'>-	0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1,	/* 1ed0-1edf */</div><div class='del'>-	0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, -1,	/* 1ee0-1eef */</div><div class='del'>-	0, -1, 0, -1, 0, -1, 0, -1, 0, -1, 0, 0, 0, 0, 0, 0,	/* 1ef0-1eff */</div><div class='del'>-	8, 8, 8, 8, 8, 8, 8, 8, 0, 0, 0, 0, 0, 0, 0, 0,	/* 1f00-1f0f */</div><div class='del'>-	8, 8, 8, 8, 8, 8, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 1f10-1f1f */</div><div class='del'>-	8, 8, 8, 8, 8, 8, 8, 8, 0, 0, 0, 0, 0, 0, 0, 0,	/* 1f20-1f2f */</div><div class='del'>-	8, 8, 8, 8, 8, 8, 8, 8, 0, 0, 0, 0, 0, 0, 0, 0,	/* 1f30-1f3f */</div><div class='del'>-	8, 8, 8, 8, 8, 8, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 1f40-1f4f */</div><div class='del'>-	0, 8, 0, 8, 0, 8, 0, 8, 0, 0, 0, 0, 0, 0, 0, 0,	/* 1f50-1f5f */</div><div class='del'>-	8, 8, 8, 8, 8, 8, 8, 8, 0, 0, 0, 0, 0, 0, 0, 0,	/* 1f60-1f6f */</div><div class='del'>-	74, 74, 86, 86, 86, 86, 100, 100, 0, 0, 112, 112, 126, 126, 0, 0,	/* 1f70-1f7f */</div><div class='del'>-	8, 8, 8, 8, 8, 8, 8, 8, 0, 0, 0, 0, 0, 0, 0, 0,	/* 1f80-1f8f */</div><div class='del'>-	8, 8, 8, 8, 8, 8, 8, 8, 0, 0, 0, 0, 0, 0, 0, 0,	/* 1f90-1f9f */</div><div class='del'>-	8, 8, 8, 8, 8, 8, 8, 8, 0, 0, 0, 0, 0, 0, 0, 0,	/* 1fa0-1faf */</div><div class='del'>-	8, 8, 0, 9, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 1fb0-1fbf */</div><div class='del'>-	0, 0, 0, 9, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 1fc0-1fcf */</div><div class='del'>-	8, 8, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 1fd0-1fdf */</div><div class='del'>-	8, 8, 0, 0, 0, 7, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 1fe0-1fef */</div><div class='del'>-	0, 0, 0, 9, 0, 0, 0, 0, 0, 0, 0, 0, 0,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/* Upper case range - Wide latin */</div><div class='del'>-static signed char UniCaseRangeUff40[27] = {</div><div class='del'>-	0, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32,	/* ff40-ff4f */</div><div class='del'>-	-32, -32, -32, -32, -32, -32, -32, -32, -32, -32, -32,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Upper Case Range</div><div class='del'>- */</div><div class='del'>-const struct UniCaseRange CifsUniUpperRange[] = {</div><div class='del'>-	{0x03a0, 0x03ce, UniCaseRangeU03a0},</div><div class='del'>-	{0x0430, 0x045f, UniCaseRangeU0430},</div><div class='del'>-	{0x0490, 0x04cc, UniCaseRangeU0490},</div><div class='del'>-	{0x1e00, 0x1ffc, UniCaseRangeU1e00},</div><div class='del'>-	{0xff40, 0xff5a, UniCaseRangeUff40},</div><div class='del'>-	{0}</div><div class='del'>-};</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-#ifndef UNIUPR_NOLOWER</div><div class='del'>-/*</div><div class='del'>- * Latin lower case</div><div class='del'>- */</div><div class='del'>-signed char CifsUniLowerTable[512] = {</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 000-00f */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 010-01f */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 020-02f */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 030-03f */</div><div class='del'>-	0, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32,	/* 040-04f */</div><div class='del'>-	32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 0, 0, 0, 0, 0,	/* 050-05f */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 060-06f */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 070-07f */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 080-08f */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 090-09f */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 0a0-0af */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 0b0-0bf */</div><div class='del'>-	32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32,	/* 0c0-0cf */</div><div class='del'>-	32, 32, 32, 32, 32, 32, 32, 0, 32, 32, 32, 32, 32, 32, 32, 0,	/* 0d0-0df */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 0e0-0ef */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 0f0-0ff */</div><div class='del'>-	1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,	/* 100-10f */</div><div class='del'>-	1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,	/* 110-11f */</div><div class='del'>-	1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,	/* 120-12f */</div><div class='del'>-	0, 0, 1, 0, 1, 0, 1, 0, 0, 1, 0, 1, 0, 1, 0, 1,	/* 130-13f */</div><div class='del'>-	0, 1, 0, 1, 0, 1, 0, 1, 0, 0, 1, 0, 1, 0, 1, 0,	/* 140-14f */</div><div class='del'>-	1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,	/* 150-15f */</div><div class='del'>-	1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,	/* 160-16f */</div><div class='del'>-	1, 0, 1, 0, 1, 0, 1, 0, -121, 1, 0, 1, 0, 1, 0, 0,	/* 170-17f */</div><div class='del'>-	0, 0, 1, 0, 1, 0, 0, 1, 0, 0, 0, 1, 0, 0, 79, 0,	/* 180-18f */</div><div class='del'>-	0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0,	/* 190-19f */</div><div class='del'>-	1, 0, 1, 0, 1, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 1,	/* 1a0-1af */</div><div class='del'>-	0, 0, 0, 1, 0, 1, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0,	/* 1b0-1bf */</div><div class='del'>-	0, 0, 0, 0, 2, 1, 0, 2, 1, 0, 2, 1, 0, 1, 0, 1,	/* 1c0-1cf */</div><div class='del'>-	0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 0, 1, 0,	/* 1d0-1df */</div><div class='del'>-	1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,	/* 1e0-1ef */</div><div class='del'>-	0, 2, 1, 0, 1, 0, 0, 0, 1, 0, 1, 0, 1, 0, 1, 0,	/* 1f0-1ff */</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/* Lower case range - Greek */</div><div class='del'>-static signed char UniCaseRangeL0380[44] = {</div><div class='del'>-	0, 0, 0, 0, 0, 0, 38, 0, 37, 37, 37, 0, 64, 0, 63, 63,	/* 380-38f */</div><div class='del'>-	0, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32,	/* 390-39f */</div><div class='del'>-	32, 32, 0, 32, 32, 32, 32, 32, 32, 32, 32, 32,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/* Lower case range - Cyrillic */</div><div class='del'>-static signed char UniCaseRangeL0400[48] = {</div><div class='del'>-	0, 80, 80, 80, 80, 80, 80, 80, 80, 80, 80, 80, 80, 0, 80, 80,	/* 400-40f */</div><div class='del'>-	32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32,	/* 410-41f */</div><div class='del'>-	32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32,	/* 420-42f */</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/* Lower case range - Extended cyrillic */</div><div class='del'>-static signed char UniCaseRangeL0490[60] = {</div><div class='del'>-	1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,	/* 490-49f */</div><div class='del'>-	1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,	/* 4a0-4af */</div><div class='del'>-	1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,	/* 4b0-4bf */</div><div class='del'>-	0, 1, 0, 1, 0, 0, 0, 1, 0, 0, 0, 1,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/* Lower case range - Extended latin and greek */</div><div class='del'>-static signed char UniCaseRangeL1e00[504] = {</div><div class='del'>-	1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,	/* 1e00-1e0f */</div><div class='del'>-	1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,	/* 1e10-1e1f */</div><div class='del'>-	1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,	/* 1e20-1e2f */</div><div class='del'>-	1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,	/* 1e30-1e3f */</div><div class='del'>-	1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,	/* 1e40-1e4f */</div><div class='del'>-	1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,	/* 1e50-1e5f */</div><div class='del'>-	1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,	/* 1e60-1e6f */</div><div class='del'>-	1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,	/* 1e70-1e7f */</div><div class='del'>-	1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,	/* 1e80-1e8f */</div><div class='del'>-	1, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0,	/* 1e90-1e9f */</div><div class='del'>-	1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,	/* 1ea0-1eaf */</div><div class='del'>-	1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,	/* 1eb0-1ebf */</div><div class='del'>-	1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,	/* 1ec0-1ecf */</div><div class='del'>-	1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,	/* 1ed0-1edf */</div><div class='del'>-	1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0,	/* 1ee0-1eef */</div><div class='del'>-	1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0,	/* 1ef0-1eff */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, -8, -8, -8, -8, -8, -8, -8, -8,	/* 1f00-1f0f */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, -8, -8, -8, -8, -8, -8, 0, 0,	/* 1f10-1f1f */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, -8, -8, -8, -8, -8, -8, -8, -8,	/* 1f20-1f2f */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, -8, -8, -8, -8, -8, -8, -8, -8,	/* 1f30-1f3f */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, -8, -8, -8, -8, -8, -8, 0, 0,	/* 1f40-1f4f */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, 0, -8, 0, -8, 0, -8, 0, -8,	/* 1f50-1f5f */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, -8, -8, -8, -8, -8, -8, -8, -8,	/* 1f60-1f6f */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,	/* 1f70-1f7f */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, -8, -8, -8, -8, -8, -8, -8, -8,	/* 1f80-1f8f */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, -8, -8, -8, -8, -8, -8, -8, -8,	/* 1f90-1f9f */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, -8, -8, -8, -8, -8, -8, -8, -8,	/* 1fa0-1faf */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, -8, -8, -74, -74, -9, 0, 0, 0,	/* 1fb0-1fbf */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, -86, -86, -86, -86, -9, 0, 0, 0,	/* 1fc0-1fcf */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, -8, -8, -100, -100, 0, 0, 0, 0,	/* 1fd0-1fdf */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0, -8, -8, -112, -112, -7, 0, 0, 0,	/* 1fe0-1fef */</div><div class='del'>-	0, 0, 0, 0, 0, 0, 0, 0,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/* Lower case range - Wide latin */</div><div class='del'>-static signed char UniCaseRangeLff20[27] = {</div><div class='del'>-	0, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32,	/* ff20-ff2f */</div><div class='del'>-	32, 32, 32, 32, 32, 32, 32, 32, 32, 32, 32,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Lower Case Range</div><div class='del'>- */</div><div class='del'>-const struct UniCaseRange CifsUniLowerRange[] = {</div><div class='del'>-	{0x0380, 0x03ab, UniCaseRangeL0380},</div><div class='del'>-	{0x0400, 0x042f, UniCaseRangeL0400},</div><div class='del'>-	{0x0490, 0x04cb, UniCaseRangeL0490},</div><div class='del'>-	{0x1e00, 0x1ff7, UniCaseRangeL1e00},</div><div class='del'>-	{0xff20, 0xff3a, UniCaseRangeLff20},</div><div class='del'>-	{0}</div><div class='del'>-};</div><div class='del'>-#endif</div><div class='head'>diff --git a/fs/cifs/cifsencrypt.c b/fs/cifs/cifsencrypt.c<br/>deleted file mode 100644<br/>index d118282071b3..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cifs/cifsencrypt.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/cifsencrypt.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,763 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: LGPL-2.1</div><div class='del'>-/*</div><div class='del'>- *</div><div class='del'>- *   Encryption and hashing operations relating to NTLM, NTLMv2.  See MS-NLMP</div><div class='del'>- *   for more detailed information</div><div class='del'>- *</div><div class='del'>- *   Copyright (C) International Business Machines  Corp., 2005,2013</div><div class='del'>- *   Author(s): Steve French (sfrench@us.ibm.com)</div><div class='del'>- *</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#include &lt;linux/fs.h&gt;</div><div class='del'>-#include &lt;linux/slab.h&gt;</div><div class='del'>-#include "cifspdu.h"</div><div class='del'>-#include "cifsglob.h"</div><div class='del'>-#include "cifs_debug.h"</div><div class='del'>-#include "cifs_unicode.h"</div><div class='del'>-#include "cifsproto.h"</div><div class='del'>-#include "ntlmssp.h"</div><div class='del'>-#include &lt;linux/ctype.h&gt;</div><div class='del'>-#include &lt;linux/random.h&gt;</div><div class='del'>-#include &lt;linux/highmem.h&gt;</div><div class='del'>-#include &lt;linux/fips.h&gt;</div><div class='del'>-#include "../smbfs_common/arc4.h"</div><div class='del'>-#include &lt;crypto/aead.h&gt;</div><div class='del'>-</div><div class='del'>-int __cifs_calc_signature(struct smb_rqst *rqst,</div><div class='del'>-			struct TCP_Server_Info *server, char *signature,</div><div class='del'>-			struct shash_desc *shash)</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-	int rc;</div><div class='del'>-	struct kvec *iov = rqst-&gt;rq_iov;</div><div class='del'>-	int n_vec = rqst-&gt;rq_nvec;</div><div class='del'>-	int is_smb2 = server-&gt;vals-&gt;header_preamble_size == 0;</div><div class='del'>-</div><div class='del'>-	/* iov[0] is actual data and not the rfc1002 length for SMB2+ */</div><div class='del'>-	if (is_smb2) {</div><div class='del'>-		if (iov[0].iov_len &lt;= 4)</div><div class='del'>-			return -EIO;</div><div class='del'>-		i = 0;</div><div class='del'>-	} else {</div><div class='del'>-		if (n_vec &lt; 2 || iov[0].iov_len != 4)</div><div class='del'>-			return -EIO;</div><div class='del'>-		i = 1; /* skip rfc1002 length */</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	for (; i &lt; n_vec; i++) {</div><div class='del'>-		if (iov[i].iov_len == 0)</div><div class='del'>-			continue;</div><div class='del'>-		if (iov[i].iov_base == NULL) {</div><div class='del'>-			cifs_dbg(VFS, "null iovec entry\n");</div><div class='del'>-			return -EIO;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		rc = crypto_shash_update(shash,</div><div class='del'>-					 iov[i].iov_base, iov[i].iov_len);</div><div class='del'>-		if (rc) {</div><div class='del'>-			cifs_dbg(VFS, "%s: Could not update with payload\n",</div><div class='del'>-				 __func__);</div><div class='del'>-			return rc;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* now hash over the rq_pages array */</div><div class='del'>-	for (i = 0; i &lt; rqst-&gt;rq_npages; i++) {</div><div class='del'>-		void *kaddr;</div><div class='del'>-		unsigned int len, offset;</div><div class='del'>-</div><div class='del'>-		rqst_page_get_length(rqst, i, &amp;len, &amp;offset);</div><div class='del'>-</div><div class='del'>-		kaddr = (char *) kmap(rqst-&gt;rq_pages[i]) + offset;</div><div class='del'>-</div><div class='del'>-		rc = crypto_shash_update(shash, kaddr, len);</div><div class='del'>-		if (rc) {</div><div class='del'>-			cifs_dbg(VFS, "%s: Could not update with payload\n",</div><div class='del'>-				 __func__);</div><div class='del'>-			kunmap(rqst-&gt;rq_pages[i]);</div><div class='del'>-			return rc;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		kunmap(rqst-&gt;rq_pages[i]);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rc = crypto_shash_final(shash, signature);</div><div class='del'>-	if (rc)</div><div class='del'>-		cifs_dbg(VFS, "%s: Could not generate hash\n", __func__);</div><div class='del'>-</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Calculate and return the CIFS signature based on the mac key and SMB PDU.</div><div class='del'>- * The 16 byte signature must be allocated by the caller. Note we only use the</div><div class='del'>- * 1st eight bytes and that the smb header signature field on input contains</div><div class='del'>- * the sequence number before this function is called. Also, this function</div><div class='del'>- * should be called with the server-&gt;srv_mutex held.</div><div class='del'>- */</div><div class='del'>-static int cifs_calc_signature(struct smb_rqst *rqst,</div><div class='del'>-			struct TCP_Server_Info *server, char *signature)</div><div class='del'>-{</div><div class='del'>-	int rc;</div><div class='del'>-</div><div class='del'>-	if (!rqst-&gt;rq_iov || !signature || !server)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	rc = cifs_alloc_hash("md5", &amp;server-&gt;secmech.md5,</div><div class='del'>-			     &amp;server-&gt;secmech.sdescmd5);</div><div class='del'>-	if (rc)</div><div class='del'>-		return -1;</div><div class='del'>-</div><div class='del'>-	rc = crypto_shash_init(&amp;server-&gt;secmech.sdescmd5-&gt;shash);</div><div class='del'>-	if (rc) {</div><div class='del'>-		cifs_dbg(VFS, "%s: Could not init md5\n", __func__);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rc = crypto_shash_update(&amp;server-&gt;secmech.sdescmd5-&gt;shash,</div><div class='del'>-		server-&gt;session_key.response, server-&gt;session_key.len);</div><div class='del'>-	if (rc) {</div><div class='del'>-		cifs_dbg(VFS, "%s: Could not update with response\n", __func__);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return __cifs_calc_signature(rqst, server, signature,</div><div class='del'>-				     &amp;server-&gt;secmech.sdescmd5-&gt;shash);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* must be called with server-&gt;srv_mutex held */</div><div class='del'>-int cifs_sign_rqst(struct smb_rqst *rqst, struct TCP_Server_Info *server,</div><div class='del'>-		   __u32 *pexpected_response_sequence_number)</div><div class='del'>-{</div><div class='del'>-	int rc = 0;</div><div class='del'>-	char smb_signature[20];</div><div class='del'>-	struct smb_hdr *cifs_pdu = (struct smb_hdr *)rqst-&gt;rq_iov[0].iov_base;</div><div class='del'>-</div><div class='del'>-	if (rqst-&gt;rq_iov[0].iov_len != 4 ||</div><div class='del'>-	    rqst-&gt;rq_iov[0].iov_base + 4 != rqst-&gt;rq_iov[1].iov_base)</div><div class='del'>-		return -EIO;</div><div class='del'>-</div><div class='del'>-	if ((cifs_pdu == NULL) || (server == NULL))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	if (!(cifs_pdu-&gt;Flags2 &amp; SMBFLG2_SECURITY_SIGNATURE) ||</div><div class='del'>-	    server-&gt;tcpStatus == CifsNeedNegotiate)</div><div class='del'>-		return rc;</div><div class='del'>-</div><div class='del'>-	if (!server-&gt;session_estab) {</div><div class='del'>-		memcpy(cifs_pdu-&gt;Signature.SecuritySignature, "BSRSPYL", 8);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	cifs_pdu-&gt;Signature.Sequence.SequenceNumber =</div><div class='del'>-				cpu_to_le32(server-&gt;sequence_number);</div><div class='del'>-	cifs_pdu-&gt;Signature.Sequence.Reserved = 0;</div><div class='del'>-</div><div class='del'>-	*pexpected_response_sequence_number = ++server-&gt;sequence_number;</div><div class='del'>-	++server-&gt;sequence_number;</div><div class='del'>-</div><div class='del'>-	rc = cifs_calc_signature(rqst, server, smb_signature);</div><div class='del'>-	if (rc)</div><div class='del'>-		memset(cifs_pdu-&gt;Signature.SecuritySignature, 0, 8);</div><div class='del'>-	else</div><div class='del'>-		memcpy(cifs_pdu-&gt;Signature.SecuritySignature, smb_signature, 8);</div><div class='del'>-</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int cifs_sign_smbv(struct kvec *iov, int n_vec, struct TCP_Server_Info *server,</div><div class='del'>-		   __u32 *pexpected_response_sequence)</div><div class='del'>-{</div><div class='del'>-	struct smb_rqst rqst = { .rq_iov = iov,</div><div class='del'>-				 .rq_nvec = n_vec };</div><div class='del'>-</div><div class='del'>-	return cifs_sign_rqst(&amp;rqst, server, pexpected_response_sequence);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* must be called with server-&gt;srv_mutex held */</div><div class='del'>-int cifs_sign_smb(struct smb_hdr *cifs_pdu, struct TCP_Server_Info *server,</div><div class='del'>-		  __u32 *pexpected_response_sequence_number)</div><div class='del'>-{</div><div class='del'>-	struct kvec iov[2];</div><div class='del'>-</div><div class='del'>-	iov[0].iov_base = cifs_pdu;</div><div class='del'>-	iov[0].iov_len = 4;</div><div class='del'>-	iov[1].iov_base = (char *)cifs_pdu + 4;</div><div class='del'>-	iov[1].iov_len = be32_to_cpu(cifs_pdu-&gt;smb_buf_length);</div><div class='del'>-</div><div class='del'>-	return cifs_sign_smbv(iov, 2, server,</div><div class='del'>-			      pexpected_response_sequence_number);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int cifs_verify_signature(struct smb_rqst *rqst,</div><div class='del'>-			  struct TCP_Server_Info *server,</div><div class='del'>-			  __u32 expected_sequence_number)</div><div class='del'>-{</div><div class='del'>-	unsigned int rc;</div><div class='del'>-	char server_response_sig[8];</div><div class='del'>-	char what_we_think_sig_should_be[20];</div><div class='del'>-	struct smb_hdr *cifs_pdu = (struct smb_hdr *)rqst-&gt;rq_iov[0].iov_base;</div><div class='del'>-</div><div class='del'>-	if (rqst-&gt;rq_iov[0].iov_len != 4 ||</div><div class='del'>-	    rqst-&gt;rq_iov[0].iov_base + 4 != rqst-&gt;rq_iov[1].iov_base)</div><div class='del'>-		return -EIO;</div><div class='del'>-</div><div class='del'>-	if (cifs_pdu == NULL || server == NULL)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	if (!server-&gt;session_estab)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	if (cifs_pdu-&gt;Command == SMB_COM_LOCKING_ANDX) {</div><div class='del'>-		struct smb_com_lock_req *pSMB =</div><div class='del'>-			(struct smb_com_lock_req *)cifs_pdu;</div><div class='del'>-		if (pSMB-&gt;LockType &amp; LOCKING_ANDX_OPLOCK_RELEASE)</div><div class='del'>-			return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* BB what if signatures are supposed to be on for session but</div><div class='del'>-	   server does not send one? BB */</div><div class='del'>-</div><div class='del'>-	/* Do not need to verify session setups with signature "BSRSPYL "  */</div><div class='del'>-	if (memcmp(cifs_pdu-&gt;Signature.SecuritySignature, "BSRSPYL ", 8) == 0)</div><div class='del'>-		cifs_dbg(FYI, "dummy signature received for smb command 0x%x\n",</div><div class='del'>-			 cifs_pdu-&gt;Command);</div><div class='del'>-</div><div class='del'>-	/* save off the origiginal signature so we can modify the smb and check</div><div class='del'>-		its signature against what the server sent */</div><div class='del'>-	memcpy(server_response_sig, cifs_pdu-&gt;Signature.SecuritySignature, 8);</div><div class='del'>-</div><div class='del'>-	cifs_pdu-&gt;Signature.Sequence.SequenceNumber =</div><div class='del'>-					cpu_to_le32(expected_sequence_number);</div><div class='del'>-	cifs_pdu-&gt;Signature.Sequence.Reserved = 0;</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;server-&gt;srv_mutex);</div><div class='del'>-	rc = cifs_calc_signature(rqst, server, what_we_think_sig_should_be);</div><div class='del'>-	mutex_unlock(&amp;server-&gt;srv_mutex);</div><div class='del'>-</div><div class='del'>-	if (rc)</div><div class='del'>-		return rc;</div><div class='del'>-</div><div class='del'>-/*	cifs_dump_mem("what we think it should be: ",</div><div class='del'>-		      what_we_think_sig_should_be, 16); */</div><div class='del'>-</div><div class='del'>-	if (memcmp(server_response_sig, what_we_think_sig_should_be, 8))</div><div class='del'>-		return -EACCES;</div><div class='del'>-	else</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* Build a proper attribute value/target info pairs blob.</div><div class='del'>- * Fill in netbios and dns domain name and workstation name</div><div class='del'>- * and client time (total five av pairs and + one end of fields indicator.</div><div class='del'>- * Allocate domain name which gets freed when session struct is deallocated.</div><div class='del'>- */</div><div class='del'>-static int</div><div class='del'>-build_avpair_blob(struct cifs_ses *ses, const struct nls_table *nls_cp)</div><div class='del'>-{</div><div class='del'>-	unsigned int dlen;</div><div class='del'>-	unsigned int size = 2 * sizeof(struct ntlmssp2_name);</div><div class='del'>-	char *defdmname = "WORKGROUP";</div><div class='del'>-	unsigned char *blobptr;</div><div class='del'>-	struct ntlmssp2_name *attrptr;</div><div class='del'>-</div><div class='del'>-	if (!ses-&gt;domainName) {</div><div class='del'>-		ses-&gt;domainName = kstrdup(defdmname, GFP_KERNEL);</div><div class='del'>-		if (!ses-&gt;domainName)</div><div class='del'>-			return -ENOMEM;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	dlen = strlen(ses-&gt;domainName);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * The length of this blob is two times the size of a</div><div class='del'>-	 * structure (av pair) which holds name/size</div><div class='del'>-	 * ( for NTLMSSP_AV_NB_DOMAIN_NAME followed by NTLMSSP_AV_EOL ) +</div><div class='del'>-	 * unicode length of a netbios domain name</div><div class='del'>-	 */</div><div class='del'>-	ses-&gt;auth_key.len = size + 2 * dlen;</div><div class='del'>-	ses-&gt;auth_key.response = kzalloc(ses-&gt;auth_key.len, GFP_KERNEL);</div><div class='del'>-	if (!ses-&gt;auth_key.response) {</div><div class='del'>-		ses-&gt;auth_key.len = 0;</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	blobptr = ses-&gt;auth_key.response;</div><div class='del'>-	attrptr = (struct ntlmssp2_name *) blobptr;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * As defined in MS-NTLM 3.3.2, just this av pair field</div><div class='del'>-	 * is sufficient as part of the temp</div><div class='del'>-	 */</div><div class='del'>-	attrptr-&gt;type = cpu_to_le16(NTLMSSP_AV_NB_DOMAIN_NAME);</div><div class='del'>-	attrptr-&gt;length = cpu_to_le16(2 * dlen);</div><div class='del'>-	blobptr = (unsigned char *)attrptr + sizeof(struct ntlmssp2_name);</div><div class='del'>-	cifs_strtoUTF16((__le16 *)blobptr, ses-&gt;domainName, dlen, nls_cp);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* Server has provided av pairs/target info in the type 2 challenge</div><div class='del'>- * packet and we have plucked it and stored within smb session.</div><div class='del'>- * We parse that blob here to find netbios domain name to be used</div><div class='del'>- * as part of ntlmv2 authentication (in Target String), if not already</div><div class='del'>- * specified on the command line.</div><div class='del'>- * If this function returns without any error but without fetching</div><div class='del'>- * domain name, authentication may fail against some server but</div><div class='del'>- * may not fail against other (those who are not very particular</div><div class='del'>- * about target string i.e. for some, just user name might suffice.</div><div class='del'>- */</div><div class='del'>-static int</div><div class='del'>-find_domain_name(struct cifs_ses *ses, const struct nls_table *nls_cp)</div><div class='del'>-{</div><div class='del'>-	unsigned int attrsize;</div><div class='del'>-	unsigned int type;</div><div class='del'>-	unsigned int onesize = sizeof(struct ntlmssp2_name);</div><div class='del'>-	unsigned char *blobptr;</div><div class='del'>-	unsigned char *blobend;</div><div class='del'>-	struct ntlmssp2_name *attrptr;</div><div class='del'>-</div><div class='del'>-	if (!ses-&gt;auth_key.len || !ses-&gt;auth_key.response)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	blobptr = ses-&gt;auth_key.response;</div><div class='del'>-	blobend = blobptr + ses-&gt;auth_key.len;</div><div class='del'>-</div><div class='del'>-	while (blobptr + onesize &lt; blobend) {</div><div class='del'>-		attrptr = (struct ntlmssp2_name *) blobptr;</div><div class='del'>-		type = le16_to_cpu(attrptr-&gt;type);</div><div class='del'>-		if (type == NTLMSSP_AV_EOL)</div><div class='del'>-			break;</div><div class='del'>-		blobptr += 2; /* advance attr type */</div><div class='del'>-		attrsize = le16_to_cpu(attrptr-&gt;length);</div><div class='del'>-		blobptr += 2; /* advance attr size */</div><div class='del'>-		if (blobptr + attrsize &gt; blobend)</div><div class='del'>-			break;</div><div class='del'>-		if (type == NTLMSSP_AV_NB_DOMAIN_NAME) {</div><div class='del'>-			if (!attrsize || attrsize &gt;= CIFS_MAX_DOMAINNAME_LEN)</div><div class='del'>-				break;</div><div class='del'>-			if (!ses-&gt;domainName) {</div><div class='del'>-				ses-&gt;domainName =</div><div class='del'>-					kmalloc(attrsize + 1, GFP_KERNEL);</div><div class='del'>-				if (!ses-&gt;domainName)</div><div class='del'>-						return -ENOMEM;</div><div class='del'>-				cifs_from_utf16(ses-&gt;domainName,</div><div class='del'>-					(__le16 *)blobptr, attrsize, attrsize,</div><div class='del'>-					nls_cp, NO_MAP_UNI_RSVD);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-		blobptr += attrsize; /* advance attr  value */</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* Server has provided av pairs/target info in the type 2 challenge</div><div class='del'>- * packet and we have plucked it and stored within smb session.</div><div class='del'>- * We parse that blob here to find the server given timestamp</div><div class='del'>- * as part of ntlmv2 authentication (or local current time as</div><div class='del'>- * default in case of failure)</div><div class='del'>- */</div><div class='del'>-static __le64</div><div class='del'>-find_timestamp(struct cifs_ses *ses)</div><div class='del'>-{</div><div class='del'>-	unsigned int attrsize;</div><div class='del'>-	unsigned int type;</div><div class='del'>-	unsigned int onesize = sizeof(struct ntlmssp2_name);</div><div class='del'>-	unsigned char *blobptr;</div><div class='del'>-	unsigned char *blobend;</div><div class='del'>-	struct ntlmssp2_name *attrptr;</div><div class='del'>-	struct timespec64 ts;</div><div class='del'>-</div><div class='del'>-	if (!ses-&gt;auth_key.len || !ses-&gt;auth_key.response)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	blobptr = ses-&gt;auth_key.response;</div><div class='del'>-	blobend = blobptr + ses-&gt;auth_key.len;</div><div class='del'>-</div><div class='del'>-	while (blobptr + onesize &lt; blobend) {</div><div class='del'>-		attrptr = (struct ntlmssp2_name *) blobptr;</div><div class='del'>-		type = le16_to_cpu(attrptr-&gt;type);</div><div class='del'>-		if (type == NTLMSSP_AV_EOL)</div><div class='del'>-			break;</div><div class='del'>-		blobptr += 2; /* advance attr type */</div><div class='del'>-		attrsize = le16_to_cpu(attrptr-&gt;length);</div><div class='del'>-		blobptr += 2; /* advance attr size */</div><div class='del'>-		if (blobptr + attrsize &gt; blobend)</div><div class='del'>-			break;</div><div class='del'>-		if (type == NTLMSSP_AV_TIMESTAMP) {</div><div class='del'>-			if (attrsize == sizeof(u64))</div><div class='del'>-				return *((__le64 *)blobptr);</div><div class='del'>-		}</div><div class='del'>-		blobptr += attrsize; /* advance attr value */</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ktime_get_real_ts64(&amp;ts);</div><div class='del'>-	return cpu_to_le64(cifs_UnixTimeToNT(ts));</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int calc_ntlmv2_hash(struct cifs_ses *ses, char *ntlmv2_hash,</div><div class='del'>-			    const struct nls_table *nls_cp)</div><div class='del'>-{</div><div class='del'>-	int rc = 0;</div><div class='del'>-	int len;</div><div class='del'>-	char nt_hash[CIFS_NTHASH_SIZE];</div><div class='del'>-	__le16 *user;</div><div class='del'>-	wchar_t *domain;</div><div class='del'>-	wchar_t *server;</div><div class='del'>-</div><div class='del'>-	if (!ses-&gt;server-&gt;secmech.sdeschmacmd5) {</div><div class='del'>-		cifs_dbg(VFS, "%s: can't generate ntlmv2 hash\n", __func__);</div><div class='del'>-		return -1;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* calculate md4 hash of password */</div><div class='del'>-	E_md4hash(ses-&gt;password, nt_hash, nls_cp);</div><div class='del'>-</div><div class='del'>-	rc = crypto_shash_setkey(ses-&gt;server-&gt;secmech.hmacmd5, nt_hash,</div><div class='del'>-				CIFS_NTHASH_SIZE);</div><div class='del'>-	if (rc) {</div><div class='del'>-		cifs_dbg(VFS, "%s: Could not set NT Hash as a key\n", __func__);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rc = crypto_shash_init(&amp;ses-&gt;server-&gt;secmech.sdeschmacmd5-&gt;shash);</div><div class='del'>-	if (rc) {</div><div class='del'>-		cifs_dbg(VFS, "%s: Could not init hmacmd5\n", __func__);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* convert ses-&gt;user_name to unicode */</div><div class='del'>-	len = ses-&gt;user_name ? strlen(ses-&gt;user_name) : 0;</div><div class='del'>-	user = kmalloc(2 + (len * 2), GFP_KERNEL);</div><div class='del'>-	if (user == NULL) {</div><div class='del'>-		rc = -ENOMEM;</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (len) {</div><div class='del'>-		len = cifs_strtoUTF16(user, ses-&gt;user_name, len, nls_cp);</div><div class='del'>-		UniStrupr(user);</div><div class='del'>-	} else {</div><div class='del'>-		memset(user, '\0', 2);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rc = crypto_shash_update(&amp;ses-&gt;server-&gt;secmech.sdeschmacmd5-&gt;shash,</div><div class='del'>-				(char *)user, 2 * len);</div><div class='del'>-	kfree(user);</div><div class='del'>-	if (rc) {</div><div class='del'>-		cifs_dbg(VFS, "%s: Could not update with user\n", __func__);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* convert ses-&gt;domainName to unicode and uppercase */</div><div class='del'>-	if (ses-&gt;domainName) {</div><div class='del'>-		len = strlen(ses-&gt;domainName);</div><div class='del'>-</div><div class='del'>-		domain = kmalloc(2 + (len * 2), GFP_KERNEL);</div><div class='del'>-		if (domain == NULL) {</div><div class='del'>-			rc = -ENOMEM;</div><div class='del'>-			return rc;</div><div class='del'>-		}</div><div class='del'>-		len = cifs_strtoUTF16((__le16 *)domain, ses-&gt;domainName, len,</div><div class='del'>-				      nls_cp);</div><div class='del'>-		rc =</div><div class='del'>-		crypto_shash_update(&amp;ses-&gt;server-&gt;secmech.sdeschmacmd5-&gt;shash,</div><div class='del'>-					(char *)domain, 2 * len);</div><div class='del'>-		kfree(domain);</div><div class='del'>-		if (rc) {</div><div class='del'>-			cifs_dbg(VFS, "%s: Could not update with domain\n",</div><div class='del'>-				 __func__);</div><div class='del'>-			return rc;</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-		/* We use ses-&gt;ip_addr if no domain name available */</div><div class='del'>-		len = strlen(ses-&gt;ip_addr);</div><div class='del'>-</div><div class='del'>-		server = kmalloc(2 + (len * 2), GFP_KERNEL);</div><div class='del'>-		if (server == NULL) {</div><div class='del'>-			rc = -ENOMEM;</div><div class='del'>-			return rc;</div><div class='del'>-		}</div><div class='del'>-		len = cifs_strtoUTF16((__le16 *)server, ses-&gt;ip_addr, len,</div><div class='del'>-					nls_cp);</div><div class='del'>-		rc =</div><div class='del'>-		crypto_shash_update(&amp;ses-&gt;server-&gt;secmech.sdeschmacmd5-&gt;shash,</div><div class='del'>-					(char *)server, 2 * len);</div><div class='del'>-		kfree(server);</div><div class='del'>-		if (rc) {</div><div class='del'>-			cifs_dbg(VFS, "%s: Could not update with server\n",</div><div class='del'>-				 __func__);</div><div class='del'>-			return rc;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rc = crypto_shash_final(&amp;ses-&gt;server-&gt;secmech.sdeschmacmd5-&gt;shash,</div><div class='del'>-					ntlmv2_hash);</div><div class='del'>-	if (rc)</div><div class='del'>-		cifs_dbg(VFS, "%s: Could not generate md5 hash\n", __func__);</div><div class='del'>-</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-CalcNTLMv2_response(const struct cifs_ses *ses, char *ntlmv2_hash)</div><div class='del'>-{</div><div class='del'>-	int rc;</div><div class='del'>-	struct ntlmv2_resp *ntlmv2 = (struct ntlmv2_resp *)</div><div class='del'>-	    (ses-&gt;auth_key.response + CIFS_SESS_KEY_SIZE);</div><div class='del'>-	unsigned int hash_len;</div><div class='del'>-</div><div class='del'>-	/* The MD5 hash starts at challenge_key.key */</div><div class='del'>-	hash_len = ses-&gt;auth_key.len - (CIFS_SESS_KEY_SIZE +</div><div class='del'>-		offsetof(struct ntlmv2_resp, challenge.key[0]));</div><div class='del'>-</div><div class='del'>-	if (!ses-&gt;server-&gt;secmech.sdeschmacmd5) {</div><div class='del'>-		cifs_dbg(VFS, "%s: can't generate ntlmv2 hash\n", __func__);</div><div class='del'>-		return -1;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rc = crypto_shash_setkey(ses-&gt;server-&gt;secmech.hmacmd5,</div><div class='del'>-				 ntlmv2_hash, CIFS_HMAC_MD5_HASH_SIZE);</div><div class='del'>-	if (rc) {</div><div class='del'>-		cifs_dbg(VFS, "%s: Could not set NTLMV2 Hash as a key\n",</div><div class='del'>-			 __func__);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rc = crypto_shash_init(&amp;ses-&gt;server-&gt;secmech.sdeschmacmd5-&gt;shash);</div><div class='del'>-	if (rc) {</div><div class='del'>-		cifs_dbg(VFS, "%s: Could not init hmacmd5\n", __func__);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (ses-&gt;server-&gt;negflavor == CIFS_NEGFLAVOR_EXTENDED)</div><div class='del'>-		memcpy(ntlmv2-&gt;challenge.key,</div><div class='del'>-		       ses-&gt;ntlmssp-&gt;cryptkey, CIFS_SERVER_CHALLENGE_SIZE);</div><div class='del'>-	else</div><div class='del'>-		memcpy(ntlmv2-&gt;challenge.key,</div><div class='del'>-		       ses-&gt;server-&gt;cryptkey, CIFS_SERVER_CHALLENGE_SIZE);</div><div class='del'>-	rc = crypto_shash_update(&amp;ses-&gt;server-&gt;secmech.sdeschmacmd5-&gt;shash,</div><div class='del'>-				 ntlmv2-&gt;challenge.key, hash_len);</div><div class='del'>-	if (rc) {</div><div class='del'>-		cifs_dbg(VFS, "%s: Could not update with response\n", __func__);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Note that the MD5 digest over writes anon.challenge_key.key */</div><div class='del'>-	rc = crypto_shash_final(&amp;ses-&gt;server-&gt;secmech.sdeschmacmd5-&gt;shash,</div><div class='del'>-				ntlmv2-&gt;ntlmv2_hash);</div><div class='del'>-	if (rc)</div><div class='del'>-		cifs_dbg(VFS, "%s: Could not generate md5 hash\n", __func__);</div><div class='del'>-</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int</div><div class='del'>-setup_ntlmv2_rsp(struct cifs_ses *ses, const struct nls_table *nls_cp)</div><div class='del'>-{</div><div class='del'>-	int rc;</div><div class='del'>-	int baselen;</div><div class='del'>-	unsigned int tilen;</div><div class='del'>-	struct ntlmv2_resp *ntlmv2;</div><div class='del'>-	char ntlmv2_hash[16];</div><div class='del'>-	unsigned char *tiblob = NULL; /* target info blob */</div><div class='del'>-	__le64 rsp_timestamp;</div><div class='del'>-</div><div class='del'>-	if (nls_cp == NULL) {</div><div class='del'>-		cifs_dbg(VFS, "%s called with nls_cp==NULL\n", __func__);</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (ses-&gt;server-&gt;negflavor == CIFS_NEGFLAVOR_EXTENDED) {</div><div class='del'>-		if (!ses-&gt;domainName) {</div><div class='del'>-			if (ses-&gt;domainAuto) {</div><div class='del'>-				rc = find_domain_name(ses, nls_cp);</div><div class='del'>-				if (rc) {</div><div class='del'>-					cifs_dbg(VFS, "error %d finding domain name\n",</div><div class='del'>-						 rc);</div><div class='del'>-					goto setup_ntlmv2_rsp_ret;</div><div class='del'>-				}</div><div class='del'>-			} else {</div><div class='del'>-				ses-&gt;domainName = kstrdup("", GFP_KERNEL);</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-		rc = build_avpair_blob(ses, nls_cp);</div><div class='del'>-		if (rc) {</div><div class='del'>-			cifs_dbg(VFS, "error %d building av pair blob\n", rc);</div><div class='del'>-			goto setup_ntlmv2_rsp_ret;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Must be within 5 minutes of the server (or in range +/-2h</div><div class='del'>-	 * in case of Mac OS X), so simply carry over server timestamp</div><div class='del'>-	 * (as Windows 7 does)</div><div class='del'>-	 */</div><div class='del'>-	rsp_timestamp = find_timestamp(ses);</div><div class='del'>-</div><div class='del'>-	baselen = CIFS_SESS_KEY_SIZE + sizeof(struct ntlmv2_resp);</div><div class='del'>-	tilen = ses-&gt;auth_key.len;</div><div class='del'>-	tiblob = ses-&gt;auth_key.response;</div><div class='del'>-</div><div class='del'>-	ses-&gt;auth_key.response = kmalloc(baselen + tilen, GFP_KERNEL);</div><div class='del'>-	if (!ses-&gt;auth_key.response) {</div><div class='del'>-		rc = -ENOMEM;</div><div class='del'>-		ses-&gt;auth_key.len = 0;</div><div class='del'>-		goto setup_ntlmv2_rsp_ret;</div><div class='del'>-	}</div><div class='del'>-	ses-&gt;auth_key.len += baselen;</div><div class='del'>-</div><div class='del'>-	ntlmv2 = (struct ntlmv2_resp *)</div><div class='del'>-			(ses-&gt;auth_key.response + CIFS_SESS_KEY_SIZE);</div><div class='del'>-	ntlmv2-&gt;blob_signature = cpu_to_le32(0x00000101);</div><div class='del'>-	ntlmv2-&gt;reserved = 0;</div><div class='del'>-	ntlmv2-&gt;time = rsp_timestamp;</div><div class='del'>-</div><div class='del'>-	get_random_bytes(&amp;ntlmv2-&gt;client_chal, sizeof(ntlmv2-&gt;client_chal));</div><div class='del'>-	ntlmv2-&gt;reserved2 = 0;</div><div class='del'>-</div><div class='del'>-	memcpy(ses-&gt;auth_key.response + baselen, tiblob, tilen);</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;ses-&gt;server-&gt;srv_mutex);</div><div class='del'>-</div><div class='del'>-	rc = cifs_alloc_hash("hmac(md5)",</div><div class='del'>-			     &amp;ses-&gt;server-&gt;secmech.hmacmd5,</div><div class='del'>-			     &amp;ses-&gt;server-&gt;secmech.sdeschmacmd5);</div><div class='del'>-	if (rc) {</div><div class='del'>-		goto unlock;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* calculate ntlmv2_hash */</div><div class='del'>-	rc = calc_ntlmv2_hash(ses, ntlmv2_hash, nls_cp);</div><div class='del'>-	if (rc) {</div><div class='del'>-		cifs_dbg(VFS, "Could not get v2 hash rc %d\n", rc);</div><div class='del'>-		goto unlock;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* calculate first part of the client response (CR1) */</div><div class='del'>-	rc = CalcNTLMv2_response(ses, ntlmv2_hash);</div><div class='del'>-	if (rc) {</div><div class='del'>-		cifs_dbg(VFS, "Could not calculate CR1 rc: %d\n", rc);</div><div class='del'>-		goto unlock;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* now calculate the session key for NTLMv2 */</div><div class='del'>-	rc = crypto_shash_setkey(ses-&gt;server-&gt;secmech.hmacmd5,</div><div class='del'>-		ntlmv2_hash, CIFS_HMAC_MD5_HASH_SIZE);</div><div class='del'>-	if (rc) {</div><div class='del'>-		cifs_dbg(VFS, "%s: Could not set NTLMV2 Hash as a key\n",</div><div class='del'>-			 __func__);</div><div class='del'>-		goto unlock;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rc = crypto_shash_init(&amp;ses-&gt;server-&gt;secmech.sdeschmacmd5-&gt;shash);</div><div class='del'>-	if (rc) {</div><div class='del'>-		cifs_dbg(VFS, "%s: Could not init hmacmd5\n", __func__);</div><div class='del'>-		goto unlock;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rc = crypto_shash_update(&amp;ses-&gt;server-&gt;secmech.sdeschmacmd5-&gt;shash,</div><div class='del'>-		ntlmv2-&gt;ntlmv2_hash,</div><div class='del'>-		CIFS_HMAC_MD5_HASH_SIZE);</div><div class='del'>-	if (rc) {</div><div class='del'>-		cifs_dbg(VFS, "%s: Could not update with response\n", __func__);</div><div class='del'>-		goto unlock;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rc = crypto_shash_final(&amp;ses-&gt;server-&gt;secmech.sdeschmacmd5-&gt;shash,</div><div class='del'>-		ses-&gt;auth_key.response);</div><div class='del'>-	if (rc)</div><div class='del'>-		cifs_dbg(VFS, "%s: Could not generate md5 hash\n", __func__);</div><div class='del'>-</div><div class='del'>-unlock:</div><div class='del'>-	mutex_unlock(&amp;ses-&gt;server-&gt;srv_mutex);</div><div class='del'>-setup_ntlmv2_rsp_ret:</div><div class='del'>-	kfree(tiblob);</div><div class='del'>-</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int</div><div class='del'>-calc_seckey(struct cifs_ses *ses)</div><div class='del'>-{</div><div class='del'>-	unsigned char sec_key[CIFS_SESS_KEY_SIZE]; /* a nonce */</div><div class='del'>-	struct arc4_ctx *ctx_arc4;</div><div class='del'>-</div><div class='del'>-	if (fips_enabled)</div><div class='del'>-		return -ENODEV;</div><div class='del'>-</div><div class='del'>-	get_random_bytes(sec_key, CIFS_SESS_KEY_SIZE);</div><div class='del'>-</div><div class='del'>-	ctx_arc4 = kmalloc(sizeof(*ctx_arc4), GFP_KERNEL);</div><div class='del'>-	if (!ctx_arc4) {</div><div class='del'>-		cifs_dbg(VFS, "Could not allocate arc4 context\n");</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	cifs_arc4_setkey(ctx_arc4, ses-&gt;auth_key.response, CIFS_SESS_KEY_SIZE);</div><div class='del'>-	cifs_arc4_crypt(ctx_arc4, ses-&gt;ntlmssp-&gt;ciphertext, sec_key,</div><div class='del'>-			CIFS_CPHTXT_SIZE);</div><div class='del'>-</div><div class='del'>-	/* make secondary_key/nonce as session key */</div><div class='del'>-	memcpy(ses-&gt;auth_key.response, sec_key, CIFS_SESS_KEY_SIZE);</div><div class='del'>-	/* and make len as that of session key only */</div><div class='del'>-	ses-&gt;auth_key.len = CIFS_SESS_KEY_SIZE;</div><div class='del'>-</div><div class='del'>-	memzero_explicit(sec_key, CIFS_SESS_KEY_SIZE);</div><div class='del'>-	kfree_sensitive(ctx_arc4);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void</div><div class='del'>-cifs_crypto_secmech_release(struct TCP_Server_Info *server)</div><div class='del'>-{</div><div class='del'>-	if (server-&gt;secmech.cmacaes) {</div><div class='del'>-		crypto_free_shash(server-&gt;secmech.cmacaes);</div><div class='del'>-		server-&gt;secmech.cmacaes = NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (server-&gt;secmech.hmacsha256) {</div><div class='del'>-		crypto_free_shash(server-&gt;secmech.hmacsha256);</div><div class='del'>-		server-&gt;secmech.hmacsha256 = NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (server-&gt;secmech.md5) {</div><div class='del'>-		crypto_free_shash(server-&gt;secmech.md5);</div><div class='del'>-		server-&gt;secmech.md5 = NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (server-&gt;secmech.sha512) {</div><div class='del'>-		crypto_free_shash(server-&gt;secmech.sha512);</div><div class='del'>-		server-&gt;secmech.sha512 = NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (server-&gt;secmech.hmacmd5) {</div><div class='del'>-		crypto_free_shash(server-&gt;secmech.hmacmd5);</div><div class='del'>-		server-&gt;secmech.hmacmd5 = NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (server-&gt;secmech.ccmaesencrypt) {</div><div class='del'>-		crypto_free_aead(server-&gt;secmech.ccmaesencrypt);</div><div class='del'>-		server-&gt;secmech.ccmaesencrypt = NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (server-&gt;secmech.ccmaesdecrypt) {</div><div class='del'>-		crypto_free_aead(server-&gt;secmech.ccmaesdecrypt);</div><div class='del'>-		server-&gt;secmech.ccmaesdecrypt = NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	kfree(server-&gt;secmech.sdesccmacaes);</div><div class='del'>-	server-&gt;secmech.sdesccmacaes = NULL;</div><div class='del'>-	kfree(server-&gt;secmech.sdeschmacsha256);</div><div class='del'>-	server-&gt;secmech.sdeschmacsha256 = NULL;</div><div class='del'>-	kfree(server-&gt;secmech.sdeschmacmd5);</div><div class='del'>-	server-&gt;secmech.sdeschmacmd5 = NULL;</div><div class='del'>-	kfree(server-&gt;secmech.sdescmd5);</div><div class='del'>-	server-&gt;secmech.sdescmd5 = NULL;</div><div class='del'>-	kfree(server-&gt;secmech.sdescsha512);</div><div class='del'>-	server-&gt;secmech.sdescsha512 = NULL;</div><div class='del'>-}</div><div class='head'>diff --git a/fs/cifs/dns_resolve.c b/fs/cifs/dns_resolve.c<br/>deleted file mode 100644<br/>index 0458d28d71aa..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cifs/dns_resolve.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/dns_resolve.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,89 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: LGPL-2.1</div><div class='del'>-/*</div><div class='del'>- *</div><div class='del'>- *   Copyright (c) 2007 Igor Mammedov</div><div class='del'>- *   Author(s): Igor Mammedov (niallain@gmail.com)</div><div class='del'>- *              Steve French (sfrench@us.ibm.com)</div><div class='del'>- *              Wang Lei (wang840925@gmail.com)</div><div class='del'>- *		David Howells (dhowells@redhat.com)</div><div class='del'>- *</div><div class='del'>- *   Contains the CIFS DFS upcall routines used for hostname to</div><div class='del'>- *   IP address translation.</div><div class='del'>- *</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#include &lt;linux/slab.h&gt;</div><div class='del'>-#include &lt;linux/dns_resolver.h&gt;</div><div class='del'>-#include "dns_resolve.h"</div><div class='del'>-#include "cifsglob.h"</div><div class='del'>-#include "cifsproto.h"</div><div class='del'>-#include "cifs_debug.h"</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * dns_resolve_server_name_to_ip - Resolve UNC server name to ip address.</div><div class='del'>- * @unc: UNC path specifying the server (with '/' as delimiter)</div><div class='del'>- * @ip_addr: Where to return the IP address.</div><div class='del'>- * @expiry: Where to return the expiry time for the dns record.</div><div class='del'>- *</div><div class='del'>- * The IP address will be returned in string form, and the caller is</div><div class='del'>- * responsible for freeing it.</div><div class='del'>- *</div><div class='del'>- * Returns length of result on success, -ve on error.</div><div class='del'>- */</div><div class='del'>-int</div><div class='del'>-dns_resolve_server_name_to_ip(const char *unc, char **ip_addr, time64_t *expiry)</div><div class='del'>-{</div><div class='del'>-	struct sockaddr_storage ss;</div><div class='del'>-	const char *hostname, *sep;</div><div class='del'>-	char *name;</div><div class='del'>-	int len, rc;</div><div class='del'>-</div><div class='del'>-	if (!ip_addr || !unc)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	len = strlen(unc);</div><div class='del'>-	if (len &lt; 3) {</div><div class='del'>-		cifs_dbg(FYI, "%s: unc is too short: %s\n", __func__, unc);</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Discount leading slashes for cifs */</div><div class='del'>-	len -= 2;</div><div class='del'>-	hostname = unc + 2;</div><div class='del'>-</div><div class='del'>-	/* Search for server name delimiter */</div><div class='del'>-	sep = memchr(hostname, '/', len);</div><div class='del'>-	if (sep)</div><div class='del'>-		len = sep - hostname;</div><div class='del'>-	else</div><div class='del'>-		cifs_dbg(FYI, "%s: probably server name is whole unc: %s\n",</div><div class='del'>-			 __func__, unc);</div><div class='del'>-</div><div class='del'>-	/* Try to interpret hostname as an IPv4 or IPv6 address */</div><div class='del'>-	rc = cifs_convert_address((struct sockaddr *)&amp;ss, hostname, len);</div><div class='del'>-	if (rc &gt; 0)</div><div class='del'>-		goto name_is_IP_address;</div><div class='del'>-</div><div class='del'>-	/* Perform the upcall */</div><div class='del'>-	rc = dns_query(current-&gt;nsproxy-&gt;net_ns, NULL, hostname, len,</div><div class='del'>-		       NULL, ip_addr, expiry, false);</div><div class='del'>-	if (rc &lt; 0)</div><div class='del'>-		cifs_dbg(FYI, "%s: unable to resolve: %*.*s\n",</div><div class='del'>-			 __func__, len, len, hostname);</div><div class='del'>-	else</div><div class='del'>-		cifs_dbg(FYI, "%s: resolved: %*.*s to %s expiry %llu\n",</div><div class='del'>-			 __func__, len, len, hostname, *ip_addr,</div><div class='del'>-			 expiry ? (*expiry) : 0);</div><div class='del'>-	return rc;</div><div class='del'>-</div><div class='del'>-name_is_IP_address:</div><div class='del'>-	name = kmalloc(len + 1, GFP_KERNEL);</div><div class='del'>-	if (!name)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	memcpy(name, hostname, len);</div><div class='del'>-	name[len] = 0;</div><div class='del'>-	cifs_dbg(FYI, "%s: unc is IP, skipping dns upcall: %s\n",</div><div class='del'>-		 __func__, name);</div><div class='del'>-	*ip_addr = name;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='head'>diff --git a/fs/cifs/dns_resolve.h b/fs/cifs/dns_resolve.h<br/>deleted file mode 100644<br/>index afc0df381246..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cifs/dns_resolve.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/dns_resolve.h</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,18 +0,0 @@</div><div class='del'>-/* SPDX-License-Identifier: LGPL-2.1 */</div><div class='del'>-/*</div><div class='del'>- *   DNS Resolver upcall management for CIFS DFS</div><div class='del'>- *   Handles host name to IP address resolution</div><div class='del'>- *</div><div class='del'>- *   Copyright (c) International Business Machines  Corp., 2008</div><div class='del'>- *   Author(s): Steve French (sfrench@us.ibm.com)</div><div class='del'>- *</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#ifndef _DNS_RESOLVE_H</div><div class='del'>-#define _DNS_RESOLVE_H</div><div class='del'>-</div><div class='del'>-#ifdef __KERNEL__</div><div class='del'>-extern int dns_resolve_server_name_to_ip(const char *unc, char **ip_addr, time64_t *expiry);</div><div class='del'>-#endif /* KERNEL */</div><div class='del'>-</div><div class='del'>-#endif /* _DNS_RESOLVE_H */</div><div class='head'>diff --git a/fs/cifs/file.c b/fs/cifs/file.c<br/>deleted file mode 100644<br/>index 1b855fcb179e..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cifs/file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/file.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,5004 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: LGPL-2.1</div><div class='del'>-/*</div><div class='del'>- *</div><div class='del'>- *   vfs operations that deal with files</div><div class='del'>- *</div><div class='del'>- *   Copyright (C) International Business Machines  Corp., 2002,2010</div><div class='del'>- *   Author(s): Steve French (sfrench@us.ibm.com)</div><div class='del'>- *              Jeremy Allison (jra@samba.org)</div><div class='del'>- *</div><div class='del'>- */</div><div class='del'>-#include &lt;linux/fs.h&gt;</div><div class='del'>-#include &lt;linux/backing-dev.h&gt;</div><div class='del'>-#include &lt;linux/stat.h&gt;</div><div class='del'>-#include &lt;linux/fcntl.h&gt;</div><div class='del'>-#include &lt;linux/pagemap.h&gt;</div><div class='del'>-#include &lt;linux/pagevec.h&gt;</div><div class='del'>-#include &lt;linux/writeback.h&gt;</div><div class='del'>-#include &lt;linux/task_io_accounting_ops.h&gt;</div><div class='del'>-#include &lt;linux/delay.h&gt;</div><div class='del'>-#include &lt;linux/mount.h&gt;</div><div class='del'>-#include &lt;linux/slab.h&gt;</div><div class='del'>-#include &lt;linux/swap.h&gt;</div><div class='del'>-#include &lt;linux/mm.h&gt;</div><div class='del'>-#include &lt;asm/div64.h&gt;</div><div class='del'>-#include "cifsfs.h"</div><div class='del'>-#include "cifspdu.h"</div><div class='del'>-#include "cifsglob.h"</div><div class='del'>-#include "cifsproto.h"</div><div class='del'>-#include "cifs_unicode.h"</div><div class='del'>-#include "cifs_debug.h"</div><div class='del'>-#include "cifs_fs_sb.h"</div><div class='del'>-#include "fscache.h"</div><div class='del'>-#include "smbdirect.h"</div><div class='del'>-#include "fs_context.h"</div><div class='del'>-#include "cifs_ioctl.h"</div><div class='del'>-</div><div class='del'>-static inline int cifs_convert_flags(unsigned int flags)</div><div class='del'>-{</div><div class='del'>-	if ((flags &amp; O_ACCMODE) == O_RDONLY)</div><div class='del'>-		return GENERIC_READ;</div><div class='del'>-	else if ((flags &amp; O_ACCMODE) == O_WRONLY)</div><div class='del'>-		return GENERIC_WRITE;</div><div class='del'>-	else if ((flags &amp; O_ACCMODE) == O_RDWR) {</div><div class='del'>-		/* GENERIC_ALL is too much permission to request</div><div class='del'>-		   can cause unnecessary access denied on create */</div><div class='del'>-		/* return GENERIC_ALL; */</div><div class='del'>-		return (GENERIC_READ | GENERIC_WRITE);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return (READ_CONTROL | FILE_WRITE_ATTRIBUTES | FILE_READ_ATTRIBUTES |</div><div class='del'>-		FILE_WRITE_EA | FILE_APPEND_DATA | FILE_WRITE_DATA |</div><div class='del'>-		FILE_READ_DATA);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static u32 cifs_posix_convert_flags(unsigned int flags)</div><div class='del'>-{</div><div class='del'>-	u32 posix_flags = 0;</div><div class='del'>-</div><div class='del'>-	if ((flags &amp; O_ACCMODE) == O_RDONLY)</div><div class='del'>-		posix_flags = SMB_O_RDONLY;</div><div class='del'>-	else if ((flags &amp; O_ACCMODE) == O_WRONLY)</div><div class='del'>-		posix_flags = SMB_O_WRONLY;</div><div class='del'>-	else if ((flags &amp; O_ACCMODE) == O_RDWR)</div><div class='del'>-		posix_flags = SMB_O_RDWR;</div><div class='del'>-</div><div class='del'>-	if (flags &amp; O_CREAT) {</div><div class='del'>-		posix_flags |= SMB_O_CREAT;</div><div class='del'>-		if (flags &amp; O_EXCL)</div><div class='del'>-			posix_flags |= SMB_O_EXCL;</div><div class='del'>-	} else if (flags &amp; O_EXCL)</div><div class='del'>-		cifs_dbg(FYI, "Application %s pid %d has incorrectly set O_EXCL flag but not O_CREAT on file open. Ignoring O_EXCL\n",</div><div class='del'>-			 current-&gt;comm, current-&gt;tgid);</div><div class='del'>-</div><div class='del'>-	if (flags &amp; O_TRUNC)</div><div class='del'>-		posix_flags |= SMB_O_TRUNC;</div><div class='del'>-	/* be safe and imply O_SYNC for O_DSYNC */</div><div class='del'>-	if (flags &amp; O_DSYNC)</div><div class='del'>-		posix_flags |= SMB_O_SYNC;</div><div class='del'>-	if (flags &amp; O_DIRECTORY)</div><div class='del'>-		posix_flags |= SMB_O_DIRECTORY;</div><div class='del'>-	if (flags &amp; O_NOFOLLOW)</div><div class='del'>-		posix_flags |= SMB_O_NOFOLLOW;</div><div class='del'>-	if (flags &amp; O_DIRECT)</div><div class='del'>-		posix_flags |= SMB_O_DIRECT;</div><div class='del'>-</div><div class='del'>-	return posix_flags;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline int cifs_get_disposition(unsigned int flags)</div><div class='del'>-{</div><div class='del'>-	if ((flags &amp; (O_CREAT | O_EXCL)) == (O_CREAT | O_EXCL))</div><div class='del'>-		return FILE_CREATE;</div><div class='del'>-	else if ((flags &amp; (O_CREAT | O_TRUNC)) == (O_CREAT | O_TRUNC))</div><div class='del'>-		return FILE_OVERWRITE_IF;</div><div class='del'>-	else if ((flags &amp; O_CREAT) == O_CREAT)</div><div class='del'>-		return FILE_OPEN_IF;</div><div class='del'>-	else if ((flags &amp; O_TRUNC) == O_TRUNC)</div><div class='del'>-		return FILE_OVERWRITE;</div><div class='del'>-	else</div><div class='del'>-		return FILE_OPEN;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int cifs_posix_open(const char *full_path, struct inode **pinode,</div><div class='del'>-			struct super_block *sb, int mode, unsigned int f_flags,</div><div class='del'>-			__u32 *poplock, __u16 *pnetfid, unsigned int xid)</div><div class='del'>-{</div><div class='del'>-	int rc;</div><div class='del'>-	FILE_UNIX_BASIC_INFO *presp_data;</div><div class='del'>-	__u32 posix_flags = 0;</div><div class='del'>-	struct cifs_sb_info *cifs_sb = CIFS_SB(sb);</div><div class='del'>-	struct cifs_fattr fattr;</div><div class='del'>-	struct tcon_link *tlink;</div><div class='del'>-	struct cifs_tcon *tcon;</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "posix open %s\n", full_path);</div><div class='del'>-</div><div class='del'>-	presp_data = kzalloc(sizeof(FILE_UNIX_BASIC_INFO), GFP_KERNEL);</div><div class='del'>-	if (presp_data == NULL)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	tlink = cifs_sb_tlink(cifs_sb);</div><div class='del'>-	if (IS_ERR(tlink)) {</div><div class='del'>-		rc = PTR_ERR(tlink);</div><div class='del'>-		goto posix_open_ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	tcon = tlink_tcon(tlink);</div><div class='del'>-	mode &amp;= ~current_umask();</div><div class='del'>-</div><div class='del'>-	posix_flags = cifs_posix_convert_flags(f_flags);</div><div class='del'>-	rc = CIFSPOSIXCreate(xid, tcon, posix_flags, mode, pnetfid, presp_data,</div><div class='del'>-			     poplock, full_path, cifs_sb-&gt;local_nls,</div><div class='del'>-			     cifs_remap(cifs_sb));</div><div class='del'>-	cifs_put_tlink(tlink);</div><div class='del'>-</div><div class='del'>-	if (rc)</div><div class='del'>-		goto posix_open_ret;</div><div class='del'>-</div><div class='del'>-	if (presp_data-&gt;Type == cpu_to_le32(-1))</div><div class='del'>-		goto posix_open_ret; /* open ok, caller does qpathinfo */</div><div class='del'>-</div><div class='del'>-	if (!pinode)</div><div class='del'>-		goto posix_open_ret; /* caller does not need info */</div><div class='del'>-</div><div class='del'>-	cifs_unix_basic_to_fattr(&amp;fattr, presp_data, cifs_sb);</div><div class='del'>-</div><div class='del'>-	/* get new inode and set it up */</div><div class='del'>-	if (*pinode == NULL) {</div><div class='del'>-		cifs_fill_uniqueid(sb, &amp;fattr);</div><div class='del'>-		*pinode = cifs_iget(sb, &amp;fattr);</div><div class='del'>-		if (!*pinode) {</div><div class='del'>-			rc = -ENOMEM;</div><div class='del'>-			goto posix_open_ret;</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-		cifs_revalidate_mapping(*pinode);</div><div class='del'>-		rc = cifs_fattr_to_inode(*pinode, &amp;fattr);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-posix_open_ret:</div><div class='del'>-	kfree(presp_data);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-cifs_nt_open(const char *full_path, struct inode *inode, struct cifs_sb_info *cifs_sb,</div><div class='del'>-	     struct cifs_tcon *tcon, unsigned int f_flags, __u32 *oplock,</div><div class='del'>-	     struct cifs_fid *fid, unsigned int xid)</div><div class='del'>-{</div><div class='del'>-	int rc;</div><div class='del'>-	int desired_access;</div><div class='del'>-	int disposition;</div><div class='del'>-	int create_options = CREATE_NOT_DIR;</div><div class='del'>-	FILE_ALL_INFO *buf;</div><div class='del'>-	struct TCP_Server_Info *server = tcon-&gt;ses-&gt;server;</div><div class='del'>-	struct cifs_open_parms oparms;</div><div class='del'>-</div><div class='del'>-	if (!server-&gt;ops-&gt;open)</div><div class='del'>-		return -ENOSYS;</div><div class='del'>-</div><div class='del'>-	desired_access = cifs_convert_flags(f_flags);</div><div class='del'>-</div><div class='del'>-/*********************************************************************</div><div class='del'>- *  open flag mapping table:</div><div class='del'>- *</div><div class='del'>- *	POSIX Flag            CIFS Disposition</div><div class='del'>- *	----------            ----------------</div><div class='del'>- *	O_CREAT               FILE_OPEN_IF</div><div class='del'>- *	O_CREAT | O_EXCL      FILE_CREATE</div><div class='del'>- *	O_CREAT | O_TRUNC     FILE_OVERWRITE_IF</div><div class='del'>- *	O_TRUNC               FILE_OVERWRITE</div><div class='del'>- *	none of the above     FILE_OPEN</div><div class='del'>- *</div><div class='del'>- *	Note that there is not a direct match between disposition</div><div class='del'>- *	FILE_SUPERSEDE (ie create whether or not file exists although</div><div class='del'>- *	O_CREAT | O_TRUNC is similar but truncates the existing</div><div class='del'>- *	file rather than creating a new file as FILE_SUPERSEDE does</div><div class='del'>- *	(which uses the attributes / metadata passed in on open call)</div><div class='del'>- *?</div><div class='del'>- *?  O_SYNC is a reasonable match to CIFS writethrough flag</div><div class='del'>- *?  and the read write flags match reasonably.  O_LARGEFILE</div><div class='del'>- *?  is irrelevant because largefile support is always used</div><div class='del'>- *?  by this client. Flags O_APPEND, O_DIRECT, O_DIRECTORY,</div><div class='del'>- *	 O_FASYNC, O_NOFOLLOW, O_NONBLOCK need further investigation</div><div class='del'>- *********************************************************************/</div><div class='del'>-</div><div class='del'>-	disposition = cifs_get_disposition(f_flags);</div><div class='del'>-</div><div class='del'>-	/* BB pass O_SYNC flag through on file attributes .. BB */</div><div class='del'>-</div><div class='del'>-	buf = kmalloc(sizeof(FILE_ALL_INFO), GFP_KERNEL);</div><div class='del'>-	if (!buf)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	/* O_SYNC also has bit for O_DSYNC so following check picks up either */</div><div class='del'>-	if (f_flags &amp; O_SYNC)</div><div class='del'>-		create_options |= CREATE_WRITE_THROUGH;</div><div class='del'>-</div><div class='del'>-	if (f_flags &amp; O_DIRECT)</div><div class='del'>-		create_options |= CREATE_NO_BUFFER;</div><div class='del'>-</div><div class='del'>-	oparms.tcon = tcon;</div><div class='del'>-	oparms.cifs_sb = cifs_sb;</div><div class='del'>-	oparms.desired_access = desired_access;</div><div class='del'>-	oparms.create_options = cifs_create_options(cifs_sb, create_options);</div><div class='del'>-	oparms.disposition = disposition;</div><div class='del'>-	oparms.path = full_path;</div><div class='del'>-	oparms.fid = fid;</div><div class='del'>-	oparms.reconnect = false;</div><div class='del'>-</div><div class='del'>-	rc = server-&gt;ops-&gt;open(xid, &amp;oparms, oplock, buf);</div><div class='del'>-</div><div class='del'>-	if (rc)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	/* TODO: Add support for calling posix query info but with passing in fid */</div><div class='del'>-	if (tcon-&gt;unix_ext)</div><div class='del'>-		rc = cifs_get_inode_info_unix(&amp;inode, full_path, inode-&gt;i_sb,</div><div class='del'>-					      xid);</div><div class='del'>-	else</div><div class='del'>-		rc = cifs_get_inode_info(&amp;inode, full_path, buf, inode-&gt;i_sb,</div><div class='del'>-					 xid, fid);</div><div class='del'>-</div><div class='del'>-	if (rc) {</div><div class='del'>-		server-&gt;ops-&gt;close(xid, tcon, fid);</div><div class='del'>-		if (rc == -ESTALE)</div><div class='del'>-			rc = -EOPENSTALE;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	kfree(buf);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool</div><div class='del'>-cifs_has_mand_locks(struct cifsInodeInfo *cinode)</div><div class='del'>-{</div><div class='del'>-	struct cifs_fid_locks *cur;</div><div class='del'>-	bool has_locks = false;</div><div class='del'>-</div><div class='del'>-	down_read(&amp;cinode-&gt;lock_sem);</div><div class='del'>-	list_for_each_entry(cur, &amp;cinode-&gt;llist, llist) {</div><div class='del'>-		if (!list_empty(&amp;cur-&gt;locks)) {</div><div class='del'>-			has_locks = true;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	up_read(&amp;cinode-&gt;lock_sem);</div><div class='del'>-	return has_locks;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void</div><div class='del'>-cifs_down_write(struct rw_semaphore *sem)</div><div class='del'>-{</div><div class='del'>-	while (!down_write_trylock(sem))</div><div class='del'>-		msleep(10);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void cifsFileInfo_put_work(struct work_struct *work);</div><div class='del'>-</div><div class='del'>-struct cifsFileInfo *</div><div class='del'>-cifs_new_fileinfo(struct cifs_fid *fid, struct file *file,</div><div class='del'>-		  struct tcon_link *tlink, __u32 oplock)</div><div class='del'>-{</div><div class='del'>-	struct dentry *dentry = file_dentry(file);</div><div class='del'>-	struct inode *inode = d_inode(dentry);</div><div class='del'>-	struct cifsInodeInfo *cinode = CIFS_I(inode);</div><div class='del'>-	struct cifsFileInfo *cfile;</div><div class='del'>-	struct cifs_fid_locks *fdlocks;</div><div class='del'>-	struct cifs_tcon *tcon = tlink_tcon(tlink);</div><div class='del'>-	struct TCP_Server_Info *server = tcon-&gt;ses-&gt;server;</div><div class='del'>-</div><div class='del'>-	cfile = kzalloc(sizeof(struct cifsFileInfo), GFP_KERNEL);</div><div class='del'>-	if (cfile == NULL)</div><div class='del'>-		return cfile;</div><div class='del'>-</div><div class='del'>-	fdlocks = kzalloc(sizeof(struct cifs_fid_locks), GFP_KERNEL);</div><div class='del'>-	if (!fdlocks) {</div><div class='del'>-		kfree(cfile);</div><div class='del'>-		return NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	INIT_LIST_HEAD(&amp;fdlocks-&gt;locks);</div><div class='del'>-	fdlocks-&gt;cfile = cfile;</div><div class='del'>-	cfile-&gt;llist = fdlocks;</div><div class='del'>-</div><div class='del'>-	cfile-&gt;count = 1;</div><div class='del'>-	cfile-&gt;pid = current-&gt;tgid;</div><div class='del'>-	cfile-&gt;uid = current_fsuid();</div><div class='del'>-	cfile-&gt;dentry = dget(dentry);</div><div class='del'>-	cfile-&gt;f_flags = file-&gt;f_flags;</div><div class='del'>-	cfile-&gt;invalidHandle = false;</div><div class='del'>-	cfile-&gt;deferred_close_scheduled = false;</div><div class='del'>-	cfile-&gt;tlink = cifs_get_tlink(tlink);</div><div class='del'>-	INIT_WORK(&amp;cfile-&gt;oplock_break, cifs_oplock_break);</div><div class='del'>-	INIT_WORK(&amp;cfile-&gt;put, cifsFileInfo_put_work);</div><div class='del'>-	INIT_DELAYED_WORK(&amp;cfile-&gt;deferred, smb2_deferred_work_close);</div><div class='del'>-	mutex_init(&amp;cfile-&gt;fh_mutex);</div><div class='del'>-	spin_lock_init(&amp;cfile-&gt;file_info_lock);</div><div class='del'>-</div><div class='del'>-	cifs_sb_active(inode-&gt;i_sb);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If the server returned a read oplock and we have mandatory brlocks,</div><div class='del'>-	 * set oplock level to None.</div><div class='del'>-	 */</div><div class='del'>-	if (server-&gt;ops-&gt;is_read_op(oplock) &amp;&amp; cifs_has_mand_locks(cinode)) {</div><div class='del'>-		cifs_dbg(FYI, "Reset oplock val from read to None due to mand locks\n");</div><div class='del'>-		oplock = 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	cifs_down_write(&amp;cinode-&gt;lock_sem);</div><div class='del'>-	list_add(&amp;fdlocks-&gt;llist, &amp;cinode-&gt;llist);</div><div class='del'>-	up_write(&amp;cinode-&gt;lock_sem);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;tcon-&gt;open_file_lock);</div><div class='del'>-	if (fid-&gt;pending_open-&gt;oplock != CIFS_OPLOCK_NO_CHANGE &amp;&amp; oplock)</div><div class='del'>-		oplock = fid-&gt;pending_open-&gt;oplock;</div><div class='del'>-	list_del(&amp;fid-&gt;pending_open-&gt;olist);</div><div class='del'>-</div><div class='del'>-	fid-&gt;purge_cache = false;</div><div class='del'>-	server-&gt;ops-&gt;set_fid(cfile, fid, oplock);</div><div class='del'>-</div><div class='del'>-	list_add(&amp;cfile-&gt;tlist, &amp;tcon-&gt;openFileList);</div><div class='del'>-	atomic_inc(&amp;tcon-&gt;num_local_opens);</div><div class='del'>-</div><div class='del'>-	/* if readable file instance put first in list*/</div><div class='del'>-	spin_lock(&amp;cinode-&gt;open_file_lock);</div><div class='del'>-	if (file-&gt;f_mode &amp; FMODE_READ)</div><div class='del'>-		list_add(&amp;cfile-&gt;flist, &amp;cinode-&gt;openFileList);</div><div class='del'>-	else</div><div class='del'>-		list_add_tail(&amp;cfile-&gt;flist, &amp;cinode-&gt;openFileList);</div><div class='del'>-	spin_unlock(&amp;cinode-&gt;open_file_lock);</div><div class='del'>-	spin_unlock(&amp;tcon-&gt;open_file_lock);</div><div class='del'>-</div><div class='del'>-	if (fid-&gt;purge_cache)</div><div class='del'>-		cifs_zap_mapping(inode);</div><div class='del'>-</div><div class='del'>-	file-&gt;private_data = cfile;</div><div class='del'>-	return cfile;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct cifsFileInfo *</div><div class='del'>-cifsFileInfo_get(struct cifsFileInfo *cifs_file)</div><div class='del'>-{</div><div class='del'>-	spin_lock(&amp;cifs_file-&gt;file_info_lock);</div><div class='del'>-	cifsFileInfo_get_locked(cifs_file);</div><div class='del'>-	spin_unlock(&amp;cifs_file-&gt;file_info_lock);</div><div class='del'>-	return cifs_file;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void cifsFileInfo_put_final(struct cifsFileInfo *cifs_file)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = d_inode(cifs_file-&gt;dentry);</div><div class='del'>-	struct cifsInodeInfo *cifsi = CIFS_I(inode);</div><div class='del'>-	struct cifsLockInfo *li, *tmp;</div><div class='del'>-	struct super_block *sb = inode-&gt;i_sb;</div><div class='del'>-</div><div class='del'>-	cifs_fscache_release_inode_cookie(inode);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Delete any outstanding lock records. We'll lose them when the file</div><div class='del'>-	 * is closed anyway.</div><div class='del'>-	 */</div><div class='del'>-	cifs_down_write(&amp;cifsi-&gt;lock_sem);</div><div class='del'>-	list_for_each_entry_safe(li, tmp, &amp;cifs_file-&gt;llist-&gt;locks, llist) {</div><div class='del'>-		list_del(&amp;li-&gt;llist);</div><div class='del'>-		cifs_del_lock_waiters(li);</div><div class='del'>-		kfree(li);</div><div class='del'>-	}</div><div class='del'>-	list_del(&amp;cifs_file-&gt;llist-&gt;llist);</div><div class='del'>-	kfree(cifs_file-&gt;llist);</div><div class='del'>-	up_write(&amp;cifsi-&gt;lock_sem);</div><div class='del'>-</div><div class='del'>-	cifs_put_tlink(cifs_file-&gt;tlink);</div><div class='del'>-	dput(cifs_file-&gt;dentry);</div><div class='del'>-	cifs_sb_deactive(sb);</div><div class='del'>-	kfree(cifs_file);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void cifsFileInfo_put_work(struct work_struct *work)</div><div class='del'>-{</div><div class='del'>-	struct cifsFileInfo *cifs_file = container_of(work,</div><div class='del'>-			struct cifsFileInfo, put);</div><div class='del'>-</div><div class='del'>-	cifsFileInfo_put_final(cifs_file);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * cifsFileInfo_put - release a reference of file priv data</div><div class='del'>- *</div><div class='del'>- * Always potentially wait for oplock handler. See _cifsFileInfo_put().</div><div class='del'>- *</div><div class='del'>- * @cifs_file:	cifs/smb3 specific info (eg refcounts) for an open file</div><div class='del'>- */</div><div class='del'>-void cifsFileInfo_put(struct cifsFileInfo *cifs_file)</div><div class='del'>-{</div><div class='del'>-	_cifsFileInfo_put(cifs_file, true, true);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * _cifsFileInfo_put - release a reference of file priv data</div><div class='del'>- *</div><div class='del'>- * This may involve closing the filehandle @cifs_file out on the</div><div class='del'>- * server. Must be called without holding tcon-&gt;open_file_lock,</div><div class='del'>- * cinode-&gt;open_file_lock and cifs_file-&gt;file_info_lock.</div><div class='del'>- *</div><div class='del'>- * If @wait_for_oplock_handler is true and we are releasing the last</div><div class='del'>- * reference, wait for any running oplock break handler of the file</div><div class='del'>- * and cancel any pending one.</div><div class='del'>- *</div><div class='del'>- * @cifs_file:	cifs/smb3 specific info (eg refcounts) for an open file</div><div class='del'>- * @wait_oplock_handler: must be false if called from oplock_break_handler</div><div class='del'>- * @offload:	not offloaded on close and oplock breaks</div><div class='del'>- *</div><div class='del'>- */</div><div class='del'>-void _cifsFileInfo_put(struct cifsFileInfo *cifs_file,</div><div class='del'>-		       bool wait_oplock_handler, bool offload)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = d_inode(cifs_file-&gt;dentry);</div><div class='del'>-	struct cifs_tcon *tcon = tlink_tcon(cifs_file-&gt;tlink);</div><div class='del'>-	struct TCP_Server_Info *server = tcon-&gt;ses-&gt;server;</div><div class='del'>-	struct cifsInodeInfo *cifsi = CIFS_I(inode);</div><div class='del'>-	struct super_block *sb = inode-&gt;i_sb;</div><div class='del'>-	struct cifs_sb_info *cifs_sb = CIFS_SB(sb);</div><div class='del'>-	struct cifs_fid fid;</div><div class='del'>-	struct cifs_pending_open open;</div><div class='del'>-	bool oplock_break_cancelled;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;tcon-&gt;open_file_lock);</div><div class='del'>-	spin_lock(&amp;cifsi-&gt;open_file_lock);</div><div class='del'>-	spin_lock(&amp;cifs_file-&gt;file_info_lock);</div><div class='del'>-	if (--cifs_file-&gt;count &gt; 0) {</div><div class='del'>-		spin_unlock(&amp;cifs_file-&gt;file_info_lock);</div><div class='del'>-		spin_unlock(&amp;cifsi-&gt;open_file_lock);</div><div class='del'>-		spin_unlock(&amp;tcon-&gt;open_file_lock);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;cifs_file-&gt;file_info_lock);</div><div class='del'>-</div><div class='del'>-	if (server-&gt;ops-&gt;get_lease_key)</div><div class='del'>-		server-&gt;ops-&gt;get_lease_key(inode, &amp;fid);</div><div class='del'>-</div><div class='del'>-	/* store open in pending opens to make sure we don't miss lease break */</div><div class='del'>-	cifs_add_pending_open_locked(&amp;fid, cifs_file-&gt;tlink, &amp;open);</div><div class='del'>-</div><div class='del'>-	/* remove it from the lists */</div><div class='del'>-	list_del(&amp;cifs_file-&gt;flist);</div><div class='del'>-	list_del(&amp;cifs_file-&gt;tlist);</div><div class='del'>-	atomic_dec(&amp;tcon-&gt;num_local_opens);</div><div class='del'>-</div><div class='del'>-	if (list_empty(&amp;cifsi-&gt;openFileList)) {</div><div class='del'>-		cifs_dbg(FYI, "closing last open instance for inode %p\n",</div><div class='del'>-			 d_inode(cifs_file-&gt;dentry));</div><div class='del'>-		/*</div><div class='del'>-		 * In strict cache mode we need invalidate mapping on the last</div><div class='del'>-		 * close  because it may cause a error when we open this file</div><div class='del'>-		 * again and get at least level II oplock.</div><div class='del'>-		 */</div><div class='del'>-		if (cifs_sb-&gt;mnt_cifs_flags &amp; CIFS_MOUNT_STRICT_IO)</div><div class='del'>-			set_bit(CIFS_INO_INVALID_MAPPING, &amp;cifsi-&gt;flags);</div><div class='del'>-		cifs_set_oplock_level(cifsi, 0);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_unlock(&amp;cifsi-&gt;open_file_lock);</div><div class='del'>-	spin_unlock(&amp;tcon-&gt;open_file_lock);</div><div class='del'>-</div><div class='del'>-	oplock_break_cancelled = wait_oplock_handler ?</div><div class='del'>-		cancel_work_sync(&amp;cifs_file-&gt;oplock_break) : false;</div><div class='del'>-</div><div class='del'>-	if (!tcon-&gt;need_reconnect &amp;&amp; !cifs_file-&gt;invalidHandle) {</div><div class='del'>-		struct TCP_Server_Info *server = tcon-&gt;ses-&gt;server;</div><div class='del'>-		unsigned int xid;</div><div class='del'>-</div><div class='del'>-		xid = get_xid();</div><div class='del'>-		if (server-&gt;ops-&gt;close_getattr)</div><div class='del'>-			server-&gt;ops-&gt;close_getattr(xid, tcon, cifs_file);</div><div class='del'>-		else if (server-&gt;ops-&gt;close)</div><div class='del'>-			server-&gt;ops-&gt;close(xid, tcon, &amp;cifs_file-&gt;fid);</div><div class='del'>-		_free_xid(xid);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (oplock_break_cancelled)</div><div class='del'>-		cifs_done_oplock_break(cifsi);</div><div class='del'>-</div><div class='del'>-	cifs_del_pending_open(&amp;open);</div><div class='del'>-</div><div class='del'>-	if (offload)</div><div class='del'>-		queue_work(fileinfo_put_wq, &amp;cifs_file-&gt;put);</div><div class='del'>-	else</div><div class='del'>-		cifsFileInfo_put_final(cifs_file);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int cifs_open(struct inode *inode, struct file *file)</div><div class='del'>-</div><div class='del'>-{</div><div class='del'>-	int rc = -EACCES;</div><div class='del'>-	unsigned int xid;</div><div class='del'>-	__u32 oplock;</div><div class='del'>-	struct cifs_sb_info *cifs_sb;</div><div class='del'>-	struct TCP_Server_Info *server;</div><div class='del'>-	struct cifs_tcon *tcon;</div><div class='del'>-	struct tcon_link *tlink;</div><div class='del'>-	struct cifsFileInfo *cfile = NULL;</div><div class='del'>-	void *page;</div><div class='del'>-	const char *full_path;</div><div class='del'>-	bool posix_open_ok = false;</div><div class='del'>-	struct cifs_fid fid;</div><div class='del'>-	struct cifs_pending_open open;</div><div class='del'>-</div><div class='del'>-	xid = get_xid();</div><div class='del'>-</div><div class='del'>-	cifs_sb = CIFS_SB(inode-&gt;i_sb);</div><div class='del'>-	if (unlikely(cifs_forced_shutdown(cifs_sb))) {</div><div class='del'>-		free_xid(xid);</div><div class='del'>-		return -EIO;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	tlink = cifs_sb_tlink(cifs_sb);</div><div class='del'>-	if (IS_ERR(tlink)) {</div><div class='del'>-		free_xid(xid);</div><div class='del'>-		return PTR_ERR(tlink);</div><div class='del'>-	}</div><div class='del'>-	tcon = tlink_tcon(tlink);</div><div class='del'>-	server = tcon-&gt;ses-&gt;server;</div><div class='del'>-</div><div class='del'>-	page = alloc_dentry_path();</div><div class='del'>-	full_path = build_path_from_dentry(file_dentry(file), page);</div><div class='del'>-	if (IS_ERR(full_path)) {</div><div class='del'>-		rc = PTR_ERR(full_path);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "inode = 0x%p file flags are 0x%x for %s\n",</div><div class='del'>-		 inode, file-&gt;f_flags, full_path);</div><div class='del'>-</div><div class='del'>-	if (file-&gt;f_flags &amp; O_DIRECT &amp;&amp;</div><div class='del'>-	    cifs_sb-&gt;mnt_cifs_flags &amp; CIFS_MOUNT_STRICT_IO) {</div><div class='del'>-		if (cifs_sb-&gt;mnt_cifs_flags &amp; CIFS_MOUNT_NO_BRL)</div><div class='del'>-			file-&gt;f_op = &amp;cifs_file_direct_nobrl_ops;</div><div class='del'>-		else</div><div class='del'>-			file-&gt;f_op = &amp;cifs_file_direct_ops;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Get the cached handle as SMB2 close is deferred */</div><div class='del'>-	rc = cifs_get_readable_path(tcon, full_path, &amp;cfile);</div><div class='del'>-	if (rc == 0) {</div><div class='del'>-		if (file-&gt;f_flags == cfile-&gt;f_flags) {</div><div class='del'>-			file-&gt;private_data = cfile;</div><div class='del'>-			spin_lock(&amp;CIFS_I(inode)-&gt;deferred_lock);</div><div class='del'>-			cifs_del_deferred_close(cfile);</div><div class='del'>-			spin_unlock(&amp;CIFS_I(inode)-&gt;deferred_lock);</div><div class='del'>-			goto out;</div><div class='del'>-		} else {</div><div class='del'>-			_cifsFileInfo_put(cfile, true, false);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (server-&gt;oplocks)</div><div class='del'>-		oplock = REQ_OPLOCK;</div><div class='del'>-	else</div><div class='del'>-		oplock = 0;</div><div class='del'>-</div><div class='del'>-	if (!tcon-&gt;broken_posix_open &amp;&amp; tcon-&gt;unix_ext &amp;&amp;</div><div class='del'>-	    cap_unix(tcon-&gt;ses) &amp;&amp; (CIFS_UNIX_POSIX_PATH_OPS_CAP &amp;</div><div class='del'>-				le64_to_cpu(tcon-&gt;fsUnixInfo.Capability))) {</div><div class='del'>-		/* can not refresh inode info since size could be stale */</div><div class='del'>-		rc = cifs_posix_open(full_path, &amp;inode, inode-&gt;i_sb,</div><div class='del'>-				cifs_sb-&gt;ctx-&gt;file_mode /* ignored */,</div><div class='del'>-				file-&gt;f_flags, &amp;oplock, &amp;fid.netfid, xid);</div><div class='del'>-		if (rc == 0) {</div><div class='del'>-			cifs_dbg(FYI, "posix open succeeded\n");</div><div class='del'>-			posix_open_ok = true;</div><div class='del'>-		} else if ((rc == -EINVAL) || (rc == -EOPNOTSUPP)) {</div><div class='del'>-			if (tcon-&gt;ses-&gt;serverNOS)</div><div class='del'>-				cifs_dbg(VFS, "server %s of type %s returned unexpected error on SMB posix open, disabling posix open support. Check if server update available.\n",</div><div class='del'>-					 tcon-&gt;ses-&gt;ip_addr,</div><div class='del'>-					 tcon-&gt;ses-&gt;serverNOS);</div><div class='del'>-			tcon-&gt;broken_posix_open = true;</div><div class='del'>-		} else if ((rc != -EIO) &amp;&amp; (rc != -EREMOTE) &amp;&amp;</div><div class='del'>-			 (rc != -EOPNOTSUPP)) /* path not found or net err */</div><div class='del'>-			goto out;</div><div class='del'>-		/*</div><div class='del'>-		 * Else fallthrough to retry open the old way on network i/o</div><div class='del'>-		 * or DFS errors.</div><div class='del'>-		 */</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (server-&gt;ops-&gt;get_lease_key)</div><div class='del'>-		server-&gt;ops-&gt;get_lease_key(inode, &amp;fid);</div><div class='del'>-</div><div class='del'>-	cifs_add_pending_open(&amp;fid, tlink, &amp;open);</div><div class='del'>-</div><div class='del'>-	if (!posix_open_ok) {</div><div class='del'>-		if (server-&gt;ops-&gt;get_lease_key)</div><div class='del'>-			server-&gt;ops-&gt;get_lease_key(inode, &amp;fid);</div><div class='del'>-</div><div class='del'>-		rc = cifs_nt_open(full_path, inode, cifs_sb, tcon,</div><div class='del'>-				  file-&gt;f_flags, &amp;oplock, &amp;fid, xid);</div><div class='del'>-		if (rc) {</div><div class='del'>-			cifs_del_pending_open(&amp;open);</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	cfile = cifs_new_fileinfo(&amp;fid, file, tlink, oplock);</div><div class='del'>-	if (cfile == NULL) {</div><div class='del'>-		if (server-&gt;ops-&gt;close)</div><div class='del'>-			server-&gt;ops-&gt;close(xid, tcon, &amp;fid);</div><div class='del'>-		cifs_del_pending_open(&amp;open);</div><div class='del'>-		rc = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	cifs_fscache_set_inode_cookie(inode, file);</div><div class='del'>-</div><div class='del'>-	if ((oplock &amp; CIFS_CREATE_ACTION) &amp;&amp; !posix_open_ok &amp;&amp; tcon-&gt;unix_ext) {</div><div class='del'>-		/*</div><div class='del'>-		 * Time to set mode which we can not set earlier due to</div><div class='del'>-		 * problems creating new read-only files.</div><div class='del'>-		 */</div><div class='del'>-		struct cifs_unix_set_info_args args = {</div><div class='del'>-			.mode	= inode-&gt;i_mode,</div><div class='del'>-			.uid	= INVALID_UID, /* no change */</div><div class='del'>-			.gid	= INVALID_GID, /* no change */</div><div class='del'>-			.ctime	= NO_CHANGE_64,</div><div class='del'>-			.atime	= NO_CHANGE_64,</div><div class='del'>-			.mtime	= NO_CHANGE_64,</div><div class='del'>-			.device	= 0,</div><div class='del'>-		};</div><div class='del'>-		CIFSSMBUnixSetFileInfo(xid, tcon, &amp;args, fid.netfid,</div><div class='del'>-				       cfile-&gt;pid);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	free_dentry_path(page);</div><div class='del'>-	free_xid(xid);</div><div class='del'>-	cifs_put_tlink(tlink);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int cifs_push_posix_locks(struct cifsFileInfo *cfile);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Try to reacquire byte range locks that were released when session</div><div class='del'>- * to server was lost.</div><div class='del'>- */</div><div class='del'>-static int</div><div class='del'>-cifs_relock_file(struct cifsFileInfo *cfile)</div><div class='del'>-{</div><div class='del'>-	struct cifs_sb_info *cifs_sb = CIFS_SB(cfile-&gt;dentry-&gt;d_sb);</div><div class='del'>-	struct cifsInodeInfo *cinode = CIFS_I(d_inode(cfile-&gt;dentry));</div><div class='del'>-	struct cifs_tcon *tcon = tlink_tcon(cfile-&gt;tlink);</div><div class='del'>-	int rc = 0;</div><div class='del'>-</div><div class='del'>-	down_read_nested(&amp;cinode-&gt;lock_sem, SINGLE_DEPTH_NESTING);</div><div class='del'>-	if (cinode-&gt;can_cache_brlcks) {</div><div class='del'>-		/* can cache locks - no need to relock */</div><div class='del'>-		up_read(&amp;cinode-&gt;lock_sem);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (cap_unix(tcon-&gt;ses) &amp;&amp;</div><div class='del'>-	    (CIFS_UNIX_FCNTL_CAP &amp; le64_to_cpu(tcon-&gt;fsUnixInfo.Capability)) &amp;&amp;</div><div class='del'>-	    ((cifs_sb-&gt;mnt_cifs_flags &amp; CIFS_MOUNT_NOPOSIXBRL) == 0))</div><div class='del'>-		rc = cifs_push_posix_locks(cfile);</div><div class='del'>-	else</div><div class='del'>-		rc = tcon-&gt;ses-&gt;server-&gt;ops-&gt;push_mand_locks(cfile);</div><div class='del'>-</div><div class='del'>-	up_read(&amp;cinode-&gt;lock_sem);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-cifs_reopen_file(struct cifsFileInfo *cfile, bool can_flush)</div><div class='del'>-{</div><div class='del'>-	int rc = -EACCES;</div><div class='del'>-	unsigned int xid;</div><div class='del'>-	__u32 oplock;</div><div class='del'>-	struct cifs_sb_info *cifs_sb;</div><div class='del'>-	struct cifs_tcon *tcon;</div><div class='del'>-	struct TCP_Server_Info *server;</div><div class='del'>-	struct cifsInodeInfo *cinode;</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	void *page;</div><div class='del'>-	const char *full_path;</div><div class='del'>-	int desired_access;</div><div class='del'>-	int disposition = FILE_OPEN;</div><div class='del'>-	int create_options = CREATE_NOT_DIR;</div><div class='del'>-	struct cifs_open_parms oparms;</div><div class='del'>-</div><div class='del'>-	xid = get_xid();</div><div class='del'>-	mutex_lock(&amp;cfile-&gt;fh_mutex);</div><div class='del'>-	if (!cfile-&gt;invalidHandle) {</div><div class='del'>-		mutex_unlock(&amp;cfile-&gt;fh_mutex);</div><div class='del'>-		free_xid(xid);</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	inode = d_inode(cfile-&gt;dentry);</div><div class='del'>-	cifs_sb = CIFS_SB(inode-&gt;i_sb);</div><div class='del'>-	tcon = tlink_tcon(cfile-&gt;tlink);</div><div class='del'>-	server = tcon-&gt;ses-&gt;server;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Can not grab rename sem here because various ops, including those</div><div class='del'>-	 * that already have the rename sem can end up causing writepage to get</div><div class='del'>-	 * called and if the server was down that means we end up here, and we</div><div class='del'>-	 * can never tell if the caller already has the rename_sem.</div><div class='del'>-	 */</div><div class='del'>-	page = alloc_dentry_path();</div><div class='del'>-	full_path = build_path_from_dentry(cfile-&gt;dentry, page);</div><div class='del'>-	if (IS_ERR(full_path)) {</div><div class='del'>-		mutex_unlock(&amp;cfile-&gt;fh_mutex);</div><div class='del'>-		free_dentry_path(page);</div><div class='del'>-		free_xid(xid);</div><div class='del'>-		return PTR_ERR(full_path);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "inode = 0x%p file flags 0x%x for %s\n",</div><div class='del'>-		 inode, cfile-&gt;f_flags, full_path);</div><div class='del'>-</div><div class='del'>-	if (tcon-&gt;ses-&gt;server-&gt;oplocks)</div><div class='del'>-		oplock = REQ_OPLOCK;</div><div class='del'>-	else</div><div class='del'>-		oplock = 0;</div><div class='del'>-</div><div class='del'>-	if (tcon-&gt;unix_ext &amp;&amp; cap_unix(tcon-&gt;ses) &amp;&amp;</div><div class='del'>-	    (CIFS_UNIX_POSIX_PATH_OPS_CAP &amp;</div><div class='del'>-				le64_to_cpu(tcon-&gt;fsUnixInfo.Capability))) {</div><div class='del'>-		/*</div><div class='del'>-		 * O_CREAT, O_EXCL and O_TRUNC already had their effect on the</div><div class='del'>-		 * original open. Must mask them off for a reopen.</div><div class='del'>-		 */</div><div class='del'>-		unsigned int oflags = cfile-&gt;f_flags &amp;</div><div class='del'>-						~(O_CREAT | O_EXCL | O_TRUNC);</div><div class='del'>-</div><div class='del'>-		rc = cifs_posix_open(full_path, NULL, inode-&gt;i_sb,</div><div class='del'>-				     cifs_sb-&gt;ctx-&gt;file_mode /* ignored */,</div><div class='del'>-				     oflags, &amp;oplock, &amp;cfile-&gt;fid.netfid, xid);</div><div class='del'>-		if (rc == 0) {</div><div class='del'>-			cifs_dbg(FYI, "posix reopen succeeded\n");</div><div class='del'>-			oparms.reconnect = true;</div><div class='del'>-			goto reopen_success;</div><div class='del'>-		}</div><div class='del'>-		/*</div><div class='del'>-		 * fallthrough to retry open the old way on errors, especially</div><div class='del'>-		 * in the reconnect path it is important to retry hard</div><div class='del'>-		 */</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	desired_access = cifs_convert_flags(cfile-&gt;f_flags);</div><div class='del'>-</div><div class='del'>-	/* O_SYNC also has bit for O_DSYNC so following check picks up either */</div><div class='del'>-	if (cfile-&gt;f_flags &amp; O_SYNC)</div><div class='del'>-		create_options |= CREATE_WRITE_THROUGH;</div><div class='del'>-</div><div class='del'>-	if (cfile-&gt;f_flags &amp; O_DIRECT)</div><div class='del'>-		create_options |= CREATE_NO_BUFFER;</div><div class='del'>-</div><div class='del'>-	if (server-&gt;ops-&gt;get_lease_key)</div><div class='del'>-		server-&gt;ops-&gt;get_lease_key(inode, &amp;cfile-&gt;fid);</div><div class='del'>-</div><div class='del'>-	oparms.tcon = tcon;</div><div class='del'>-	oparms.cifs_sb = cifs_sb;</div><div class='del'>-	oparms.desired_access = desired_access;</div><div class='del'>-	oparms.create_options = cifs_create_options(cifs_sb, create_options);</div><div class='del'>-	oparms.disposition = disposition;</div><div class='del'>-	oparms.path = full_path;</div><div class='del'>-	oparms.fid = &amp;cfile-&gt;fid;</div><div class='del'>-	oparms.reconnect = true;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Can not refresh inode by passing in file_info buf to be returned by</div><div class='del'>-	 * ops-&gt;open and then calling get_inode_info with returned buf since</div><div class='del'>-	 * file might have write behind data that needs to be flushed and server</div><div class='del'>-	 * version of file size can be stale. If we knew for sure that inode was</div><div class='del'>-	 * not dirty locally we could do this.</div><div class='del'>-	 */</div><div class='del'>-	rc = server-&gt;ops-&gt;open(xid, &amp;oparms, &amp;oplock, NULL);</div><div class='del'>-	if (rc == -ENOENT &amp;&amp; oparms.reconnect == false) {</div><div class='del'>-		/* durable handle timeout is expired - open the file again */</div><div class='del'>-		rc = server-&gt;ops-&gt;open(xid, &amp;oparms, &amp;oplock, NULL);</div><div class='del'>-		/* indicate that we need to relock the file */</div><div class='del'>-		oparms.reconnect = true;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (rc) {</div><div class='del'>-		mutex_unlock(&amp;cfile-&gt;fh_mutex);</div><div class='del'>-		cifs_dbg(FYI, "cifs_reopen returned 0x%x\n", rc);</div><div class='del'>-		cifs_dbg(FYI, "oplock: %d\n", oplock);</div><div class='del'>-		goto reopen_error_exit;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-reopen_success:</div><div class='del'>-	cfile-&gt;invalidHandle = false;</div><div class='del'>-	mutex_unlock(&amp;cfile-&gt;fh_mutex);</div><div class='del'>-	cinode = CIFS_I(inode);</div><div class='del'>-</div><div class='del'>-	if (can_flush) {</div><div class='del'>-		rc = filemap_write_and_wait(inode-&gt;i_mapping);</div><div class='del'>-		if (!is_interrupt_error(rc))</div><div class='del'>-			mapping_set_error(inode-&gt;i_mapping, rc);</div><div class='del'>-</div><div class='del'>-		if (tcon-&gt;posix_extensions)</div><div class='del'>-			rc = smb311_posix_get_inode_info(&amp;inode, full_path, inode-&gt;i_sb, xid);</div><div class='del'>-		else if (tcon-&gt;unix_ext)</div><div class='del'>-			rc = cifs_get_inode_info_unix(&amp;inode, full_path,</div><div class='del'>-						      inode-&gt;i_sb, xid);</div><div class='del'>-		else</div><div class='del'>-			rc = cifs_get_inode_info(&amp;inode, full_path, NULL,</div><div class='del'>-						 inode-&gt;i_sb, xid, NULL);</div><div class='del'>-	}</div><div class='del'>-	/*</div><div class='del'>-	 * Else we are writing out data to server already and could deadlock if</div><div class='del'>-	 * we tried to flush data, and since we do not know if we have data that</div><div class='del'>-	 * would invalidate the current end of file on the server we can not go</div><div class='del'>-	 * to the server to get the new inode info.</div><div class='del'>-	 */</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If the server returned a read oplock and we have mandatory brlocks,</div><div class='del'>-	 * set oplock level to None.</div><div class='del'>-	 */</div><div class='del'>-	if (server-&gt;ops-&gt;is_read_op(oplock) &amp;&amp; cifs_has_mand_locks(cinode)) {</div><div class='del'>-		cifs_dbg(FYI, "Reset oplock val from read to None due to mand locks\n");</div><div class='del'>-		oplock = 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	server-&gt;ops-&gt;set_fid(cfile, &amp;cfile-&gt;fid, oplock);</div><div class='del'>-	if (oparms.reconnect)</div><div class='del'>-		cifs_relock_file(cfile);</div><div class='del'>-</div><div class='del'>-reopen_error_exit:</div><div class='del'>-	free_dentry_path(page);</div><div class='del'>-	free_xid(xid);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void smb2_deferred_work_close(struct work_struct *work)</div><div class='del'>-{</div><div class='del'>-	struct cifsFileInfo *cfile = container_of(work,</div><div class='del'>-			struct cifsFileInfo, deferred.work);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;CIFS_I(d_inode(cfile-&gt;dentry))-&gt;deferred_lock);</div><div class='del'>-	cifs_del_deferred_close(cfile);</div><div class='del'>-	cfile-&gt;deferred_close_scheduled = false;</div><div class='del'>-	spin_unlock(&amp;CIFS_I(d_inode(cfile-&gt;dentry))-&gt;deferred_lock);</div><div class='del'>-	_cifsFileInfo_put(cfile, true, false);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int cifs_close(struct inode *inode, struct file *file)</div><div class='del'>-{</div><div class='del'>-	struct cifsFileInfo *cfile;</div><div class='del'>-	struct cifsInodeInfo *cinode = CIFS_I(inode);</div><div class='del'>-	struct cifs_sb_info *cifs_sb = CIFS_SB(inode-&gt;i_sb);</div><div class='del'>-	struct cifs_deferred_close *dclose;</div><div class='del'>-</div><div class='del'>-	if (file-&gt;private_data != NULL) {</div><div class='del'>-		cfile = file-&gt;private_data;</div><div class='del'>-		file-&gt;private_data = NULL;</div><div class='del'>-		dclose = kmalloc(sizeof(struct cifs_deferred_close), GFP_KERNEL);</div><div class='del'>-		if ((cinode-&gt;oplock == CIFS_CACHE_RHW_FLG) &amp;&amp;</div><div class='del'>-		    cinode-&gt;lease_granted &amp;&amp;</div><div class='del'>-		    !test_bit(CIFS_INO_CLOSE_ON_LOCK, &amp;cinode-&gt;flags) &amp;&amp;</div><div class='del'>-		    dclose) {</div><div class='del'>-			if (test_and_clear_bit(CIFS_INO_MODIFIED_ATTR, &amp;cinode-&gt;flags)) {</div><div class='del'>-				inode-&gt;i_ctime = inode-&gt;i_mtime = current_time(inode);</div><div class='del'>-				cifs_fscache_update_inode_cookie(inode);</div><div class='del'>-			}</div><div class='del'>-			spin_lock(&amp;cinode-&gt;deferred_lock);</div><div class='del'>-			cifs_add_deferred_close(cfile, dclose);</div><div class='del'>-			if (cfile-&gt;deferred_close_scheduled &amp;&amp;</div><div class='del'>-			    delayed_work_pending(&amp;cfile-&gt;deferred)) {</div><div class='del'>-				/*</div><div class='del'>-				 * If there is no pending work, mod_delayed_work queues new work.</div><div class='del'>-				 * So, Increase the ref count to avoid use-after-free.</div><div class='del'>-				 */</div><div class='del'>-				if (!mod_delayed_work(deferredclose_wq,</div><div class='del'>-						&amp;cfile-&gt;deferred, cifs_sb-&gt;ctx-&gt;acregmax))</div><div class='del'>-					cifsFileInfo_get(cfile);</div><div class='del'>-			} else {</div><div class='del'>-				/* Deferred close for files */</div><div class='del'>-				queue_delayed_work(deferredclose_wq,</div><div class='del'>-						&amp;cfile-&gt;deferred, cifs_sb-&gt;ctx-&gt;acregmax);</div><div class='del'>-				cfile-&gt;deferred_close_scheduled = true;</div><div class='del'>-				spin_unlock(&amp;cinode-&gt;deferred_lock);</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			spin_unlock(&amp;cinode-&gt;deferred_lock);</div><div class='del'>-			_cifsFileInfo_put(cfile, true, false);</div><div class='del'>-		} else {</div><div class='del'>-			_cifsFileInfo_put(cfile, true, false);</div><div class='del'>-			kfree(dclose);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* return code from the -&gt;release op is always ignored */</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void</div><div class='del'>-cifs_reopen_persistent_handles(struct cifs_tcon *tcon)</div><div class='del'>-{</div><div class='del'>-	struct cifsFileInfo *open_file;</div><div class='del'>-	struct list_head *tmp;</div><div class='del'>-	struct list_head *tmp1;</div><div class='del'>-	struct list_head tmp_list;</div><div class='del'>-</div><div class='del'>-	if (!tcon-&gt;use_persistent || !tcon-&gt;need_reopen_files)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	tcon-&gt;need_reopen_files = false;</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "Reopen persistent handles\n");</div><div class='del'>-	INIT_LIST_HEAD(&amp;tmp_list);</div><div class='del'>-</div><div class='del'>-	/* list all files open on tree connection, reopen resilient handles  */</div><div class='del'>-	spin_lock(&amp;tcon-&gt;open_file_lock);</div><div class='del'>-	list_for_each(tmp, &amp;tcon-&gt;openFileList) {</div><div class='del'>-		open_file = list_entry(tmp, struct cifsFileInfo, tlist);</div><div class='del'>-		if (!open_file-&gt;invalidHandle)</div><div class='del'>-			continue;</div><div class='del'>-		cifsFileInfo_get(open_file);</div><div class='del'>-		list_add_tail(&amp;open_file-&gt;rlist, &amp;tmp_list);</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;tcon-&gt;open_file_lock);</div><div class='del'>-</div><div class='del'>-	list_for_each_safe(tmp, tmp1, &amp;tmp_list) {</div><div class='del'>-		open_file = list_entry(tmp, struct cifsFileInfo, rlist);</div><div class='del'>-		if (cifs_reopen_file(open_file, false /* do not flush */))</div><div class='del'>-			tcon-&gt;need_reopen_files = true;</div><div class='del'>-		list_del_init(&amp;open_file-&gt;rlist);</div><div class='del'>-		cifsFileInfo_put(open_file);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int cifs_closedir(struct inode *inode, struct file *file)</div><div class='del'>-{</div><div class='del'>-	int rc = 0;</div><div class='del'>-	unsigned int xid;</div><div class='del'>-	struct cifsFileInfo *cfile = file-&gt;private_data;</div><div class='del'>-	struct cifs_tcon *tcon;</div><div class='del'>-	struct TCP_Server_Info *server;</div><div class='del'>-	char *buf;</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "Closedir inode = 0x%p\n", inode);</div><div class='del'>-</div><div class='del'>-	if (cfile == NULL)</div><div class='del'>-		return rc;</div><div class='del'>-</div><div class='del'>-	xid = get_xid();</div><div class='del'>-	tcon = tlink_tcon(cfile-&gt;tlink);</div><div class='del'>-	server = tcon-&gt;ses-&gt;server;</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "Freeing private data in close dir\n");</div><div class='del'>-	spin_lock(&amp;cfile-&gt;file_info_lock);</div><div class='del'>-	if (server-&gt;ops-&gt;dir_needs_close(cfile)) {</div><div class='del'>-		cfile-&gt;invalidHandle = true;</div><div class='del'>-		spin_unlock(&amp;cfile-&gt;file_info_lock);</div><div class='del'>-		if (server-&gt;ops-&gt;close_dir)</div><div class='del'>-			rc = server-&gt;ops-&gt;close_dir(xid, tcon, &amp;cfile-&gt;fid);</div><div class='del'>-		else</div><div class='del'>-			rc = -ENOSYS;</div><div class='del'>-		cifs_dbg(FYI, "Closing uncompleted readdir with rc %d\n", rc);</div><div class='del'>-		/* not much we can do if it fails anyway, ignore rc */</div><div class='del'>-		rc = 0;</div><div class='del'>-	} else</div><div class='del'>-		spin_unlock(&amp;cfile-&gt;file_info_lock);</div><div class='del'>-</div><div class='del'>-	buf = cfile-&gt;srch_inf.ntwrk_buf_start;</div><div class='del'>-	if (buf) {</div><div class='del'>-		cifs_dbg(FYI, "closedir free smb buf in srch struct\n");</div><div class='del'>-		cfile-&gt;srch_inf.ntwrk_buf_start = NULL;</div><div class='del'>-		if (cfile-&gt;srch_inf.smallBuf)</div><div class='del'>-			cifs_small_buf_release(buf);</div><div class='del'>-		else</div><div class='del'>-			cifs_buf_release(buf);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	cifs_put_tlink(cfile-&gt;tlink);</div><div class='del'>-	kfree(file-&gt;private_data);</div><div class='del'>-	file-&gt;private_data = NULL;</div><div class='del'>-	/* BB can we lock the filestruct while this is going on? */</div><div class='del'>-	free_xid(xid);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct cifsLockInfo *</div><div class='del'>-cifs_lock_init(__u64 offset, __u64 length, __u8 type, __u16 flags)</div><div class='del'>-{</div><div class='del'>-	struct cifsLockInfo *lock =</div><div class='del'>-		kmalloc(sizeof(struct cifsLockInfo), GFP_KERNEL);</div><div class='del'>-	if (!lock)</div><div class='del'>-		return lock;</div><div class='del'>-	lock-&gt;offset = offset;</div><div class='del'>-	lock-&gt;length = length;</div><div class='del'>-	lock-&gt;type = type;</div><div class='del'>-	lock-&gt;pid = current-&gt;tgid;</div><div class='del'>-	lock-&gt;flags = flags;</div><div class='del'>-	INIT_LIST_HEAD(&amp;lock-&gt;blist);</div><div class='del'>-	init_waitqueue_head(&amp;lock-&gt;block_q);</div><div class='del'>-	return lock;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void</div><div class='del'>-cifs_del_lock_waiters(struct cifsLockInfo *lock)</div><div class='del'>-{</div><div class='del'>-	struct cifsLockInfo *li, *tmp;</div><div class='del'>-	list_for_each_entry_safe(li, tmp, &amp;lock-&gt;blist, blist) {</div><div class='del'>-		list_del_init(&amp;li-&gt;blist);</div><div class='del'>-		wake_up(&amp;li-&gt;block_q);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#define CIFS_LOCK_OP	0</div><div class='del'>-#define CIFS_READ_OP	1</div><div class='del'>-#define CIFS_WRITE_OP	2</div><div class='del'>-</div><div class='del'>-/* @rw_check : 0 - no op, 1 - read, 2 - write */</div><div class='del'>-static bool</div><div class='del'>-cifs_find_fid_lock_conflict(struct cifs_fid_locks *fdlocks, __u64 offset,</div><div class='del'>-			    __u64 length, __u8 type, __u16 flags,</div><div class='del'>-			    struct cifsFileInfo *cfile,</div><div class='del'>-			    struct cifsLockInfo **conf_lock, int rw_check)</div><div class='del'>-{</div><div class='del'>-	struct cifsLockInfo *li;</div><div class='del'>-	struct cifsFileInfo *cur_cfile = fdlocks-&gt;cfile;</div><div class='del'>-	struct TCP_Server_Info *server = tlink_tcon(cfile-&gt;tlink)-&gt;ses-&gt;server;</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(li, &amp;fdlocks-&gt;locks, llist) {</div><div class='del'>-		if (offset + length &lt;= li-&gt;offset ||</div><div class='del'>-		    offset &gt;= li-&gt;offset + li-&gt;length)</div><div class='del'>-			continue;</div><div class='del'>-		if (rw_check != CIFS_LOCK_OP &amp;&amp; current-&gt;tgid == li-&gt;pid &amp;&amp;</div><div class='del'>-		    server-&gt;ops-&gt;compare_fids(cfile, cur_cfile)) {</div><div class='del'>-			/* shared lock prevents write op through the same fid */</div><div class='del'>-			if (!(li-&gt;type &amp; server-&gt;vals-&gt;shared_lock_type) ||</div><div class='del'>-			    rw_check != CIFS_WRITE_OP)</div><div class='del'>-				continue;</div><div class='del'>-		}</div><div class='del'>-		if ((type &amp; server-&gt;vals-&gt;shared_lock_type) &amp;&amp;</div><div class='del'>-		    ((server-&gt;ops-&gt;compare_fids(cfile, cur_cfile) &amp;&amp;</div><div class='del'>-		     current-&gt;tgid == li-&gt;pid) || type == li-&gt;type))</div><div class='del'>-			continue;</div><div class='del'>-		if (rw_check == CIFS_LOCK_OP &amp;&amp;</div><div class='del'>-		    (flags &amp; FL_OFDLCK) &amp;&amp; (li-&gt;flags &amp; FL_OFDLCK) &amp;&amp;</div><div class='del'>-		    server-&gt;ops-&gt;compare_fids(cfile, cur_cfile))</div><div class='del'>-			continue;</div><div class='del'>-		if (conf_lock)</div><div class='del'>-			*conf_lock = li;</div><div class='del'>-		return true;</div><div class='del'>-	}</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-bool</div><div class='del'>-cifs_find_lock_conflict(struct cifsFileInfo *cfile, __u64 offset, __u64 length,</div><div class='del'>-			__u8 type, __u16 flags,</div><div class='del'>-			struct cifsLockInfo **conf_lock, int rw_check)</div><div class='del'>-{</div><div class='del'>-	bool rc = false;</div><div class='del'>-	struct cifs_fid_locks *cur;</div><div class='del'>-	struct cifsInodeInfo *cinode = CIFS_I(d_inode(cfile-&gt;dentry));</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(cur, &amp;cinode-&gt;llist, llist) {</div><div class='del'>-		rc = cifs_find_fid_lock_conflict(cur, offset, length, type,</div><div class='del'>-						 flags, cfile, conf_lock,</div><div class='del'>-						 rw_check);</div><div class='del'>-		if (rc)</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Check if there is another lock that prevents us to set the lock (mandatory</div><div class='del'>- * style). If such a lock exists, update the flock structure with its</div><div class='del'>- * properties. Otherwise, set the flock type to F_UNLCK if we can cache brlocks</div><div class='del'>- * or leave it the same if we can't. Returns 0 if we don't need to request to</div><div class='del'>- * the server or 1 otherwise.</div><div class='del'>- */</div><div class='del'>-static int</div><div class='del'>-cifs_lock_test(struct cifsFileInfo *cfile, __u64 offset, __u64 length,</div><div class='del'>-	       __u8 type, struct file_lock *flock)</div><div class='del'>-{</div><div class='del'>-	int rc = 0;</div><div class='del'>-	struct cifsLockInfo *conf_lock;</div><div class='del'>-	struct cifsInodeInfo *cinode = CIFS_I(d_inode(cfile-&gt;dentry));</div><div class='del'>-	struct TCP_Server_Info *server = tlink_tcon(cfile-&gt;tlink)-&gt;ses-&gt;server;</div><div class='del'>-	bool exist;</div><div class='del'>-</div><div class='del'>-	down_read(&amp;cinode-&gt;lock_sem);</div><div class='del'>-</div><div class='del'>-	exist = cifs_find_lock_conflict(cfile, offset, length, type,</div><div class='del'>-					flock-&gt;fl_flags, &amp;conf_lock,</div><div class='del'>-					CIFS_LOCK_OP);</div><div class='del'>-	if (exist) {</div><div class='del'>-		flock-&gt;fl_start = conf_lock-&gt;offset;</div><div class='del'>-		flock-&gt;fl_end = conf_lock-&gt;offset + conf_lock-&gt;length - 1;</div><div class='del'>-		flock-&gt;fl_pid = conf_lock-&gt;pid;</div><div class='del'>-		if (conf_lock-&gt;type &amp; server-&gt;vals-&gt;shared_lock_type)</div><div class='del'>-			flock-&gt;fl_type = F_RDLCK;</div><div class='del'>-		else</div><div class='del'>-			flock-&gt;fl_type = F_WRLCK;</div><div class='del'>-	} else if (!cinode-&gt;can_cache_brlcks)</div><div class='del'>-		rc = 1;</div><div class='del'>-	else</div><div class='del'>-		flock-&gt;fl_type = F_UNLCK;</div><div class='del'>-</div><div class='del'>-	up_read(&amp;cinode-&gt;lock_sem);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void</div><div class='del'>-cifs_lock_add(struct cifsFileInfo *cfile, struct cifsLockInfo *lock)</div><div class='del'>-{</div><div class='del'>-	struct cifsInodeInfo *cinode = CIFS_I(d_inode(cfile-&gt;dentry));</div><div class='del'>-	cifs_down_write(&amp;cinode-&gt;lock_sem);</div><div class='del'>-	list_add_tail(&amp;lock-&gt;llist, &amp;cfile-&gt;llist-&gt;locks);</div><div class='del'>-	up_write(&amp;cinode-&gt;lock_sem);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Set the byte-range lock (mandatory style). Returns:</div><div class='del'>- * 1) 0, if we set the lock and don't need to request to the server;</div><div class='del'>- * 2) 1, if no locks prevent us but we need to request to the server;</div><div class='del'>- * 3) -EACCES, if there is a lock that prevents us and wait is false.</div><div class='del'>- */</div><div class='del'>-static int</div><div class='del'>-cifs_lock_add_if(struct cifsFileInfo *cfile, struct cifsLockInfo *lock,</div><div class='del'>-		 bool wait)</div><div class='del'>-{</div><div class='del'>-	struct cifsLockInfo *conf_lock;</div><div class='del'>-	struct cifsInodeInfo *cinode = CIFS_I(d_inode(cfile-&gt;dentry));</div><div class='del'>-	bool exist;</div><div class='del'>-	int rc = 0;</div><div class='del'>-</div><div class='del'>-try_again:</div><div class='del'>-	exist = false;</div><div class='del'>-	cifs_down_write(&amp;cinode-&gt;lock_sem);</div><div class='del'>-</div><div class='del'>-	exist = cifs_find_lock_conflict(cfile, lock-&gt;offset, lock-&gt;length,</div><div class='del'>-					lock-&gt;type, lock-&gt;flags, &amp;conf_lock,</div><div class='del'>-					CIFS_LOCK_OP);</div><div class='del'>-	if (!exist &amp;&amp; cinode-&gt;can_cache_brlcks) {</div><div class='del'>-		list_add_tail(&amp;lock-&gt;llist, &amp;cfile-&gt;llist-&gt;locks);</div><div class='del'>-		up_write(&amp;cinode-&gt;lock_sem);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!exist)</div><div class='del'>-		rc = 1;</div><div class='del'>-	else if (!wait)</div><div class='del'>-		rc = -EACCES;</div><div class='del'>-	else {</div><div class='del'>-		list_add_tail(&amp;lock-&gt;blist, &amp;conf_lock-&gt;blist);</div><div class='del'>-		up_write(&amp;cinode-&gt;lock_sem);</div><div class='del'>-		rc = wait_event_interruptible(lock-&gt;block_q,</div><div class='del'>-					(lock-&gt;blist.prev == &amp;lock-&gt;blist) &amp;&amp;</div><div class='del'>-					(lock-&gt;blist.next == &amp;lock-&gt;blist));</div><div class='del'>-		if (!rc)</div><div class='del'>-			goto try_again;</div><div class='del'>-		cifs_down_write(&amp;cinode-&gt;lock_sem);</div><div class='del'>-		list_del_init(&amp;lock-&gt;blist);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	up_write(&amp;cinode-&gt;lock_sem);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Check if there is another lock that prevents us to set the lock (posix</div><div class='del'>- * style). If such a lock exists, update the flock structure with its</div><div class='del'>- * properties. Otherwise, set the flock type to F_UNLCK if we can cache brlocks</div><div class='del'>- * or leave it the same if we can't. Returns 0 if we don't need to request to</div><div class='del'>- * the server or 1 otherwise.</div><div class='del'>- */</div><div class='del'>-static int</div><div class='del'>-cifs_posix_lock_test(struct file *file, struct file_lock *flock)</div><div class='del'>-{</div><div class='del'>-	int rc = 0;</div><div class='del'>-	struct cifsInodeInfo *cinode = CIFS_I(file_inode(file));</div><div class='del'>-	unsigned char saved_type = flock-&gt;fl_type;</div><div class='del'>-</div><div class='del'>-	if ((flock-&gt;fl_flags &amp; FL_POSIX) == 0)</div><div class='del'>-		return 1;</div><div class='del'>-</div><div class='del'>-	down_read(&amp;cinode-&gt;lock_sem);</div><div class='del'>-	posix_test_lock(file, flock);</div><div class='del'>-</div><div class='del'>-	if (flock-&gt;fl_type == F_UNLCK &amp;&amp; !cinode-&gt;can_cache_brlcks) {</div><div class='del'>-		flock-&gt;fl_type = saved_type;</div><div class='del'>-		rc = 1;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	up_read(&amp;cinode-&gt;lock_sem);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Set the byte-range lock (posix style). Returns:</div><div class='del'>- * 1) &lt;0, if the error occurs while setting the lock;</div><div class='del'>- * 2) 0, if we set the lock and don't need to request to the server;</div><div class='del'>- * 3) FILE_LOCK_DEFERRED, if we will wait for some other file_lock;</div><div class='del'>- * 4) FILE_LOCK_DEFERRED + 1, if we need to request to the server.</div><div class='del'>- */</div><div class='del'>-static int</div><div class='del'>-cifs_posix_lock_set(struct file *file, struct file_lock *flock)</div><div class='del'>-{</div><div class='del'>-	struct cifsInodeInfo *cinode = CIFS_I(file_inode(file));</div><div class='del'>-	int rc = FILE_LOCK_DEFERRED + 1;</div><div class='del'>-</div><div class='del'>-	if ((flock-&gt;fl_flags &amp; FL_POSIX) == 0)</div><div class='del'>-		return rc;</div><div class='del'>-</div><div class='del'>-	cifs_down_write(&amp;cinode-&gt;lock_sem);</div><div class='del'>-	if (!cinode-&gt;can_cache_brlcks) {</div><div class='del'>-		up_write(&amp;cinode-&gt;lock_sem);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rc = posix_lock_file(file, flock, NULL);</div><div class='del'>-	up_write(&amp;cinode-&gt;lock_sem);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int</div><div class='del'>-cifs_push_mandatory_locks(struct cifsFileInfo *cfile)</div><div class='del'>-{</div><div class='del'>-	unsigned int xid;</div><div class='del'>-	int rc = 0, stored_rc;</div><div class='del'>-	struct cifsLockInfo *li, *tmp;</div><div class='del'>-	struct cifs_tcon *tcon;</div><div class='del'>-	unsigned int num, max_num, max_buf;</div><div class='del'>-	LOCKING_ANDX_RANGE *buf, *cur;</div><div class='del'>-	static const int types[] = {</div><div class='del'>-		LOCKING_ANDX_LARGE_FILES,</div><div class='del'>-		LOCKING_ANDX_SHARED_LOCK | LOCKING_ANDX_LARGE_FILES</div><div class='del'>-	};</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	xid = get_xid();</div><div class='del'>-	tcon = tlink_tcon(cfile-&gt;tlink);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Accessing maxBuf is racy with cifs_reconnect - need to store value</div><div class='del'>-	 * and check it before using.</div><div class='del'>-	 */</div><div class='del'>-	max_buf = tcon-&gt;ses-&gt;server-&gt;maxBuf;</div><div class='del'>-	if (max_buf &lt; (sizeof(struct smb_hdr) + sizeof(LOCKING_ANDX_RANGE))) {</div><div class='del'>-		free_xid(xid);</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	BUILD_BUG_ON(sizeof(struct smb_hdr) + sizeof(LOCKING_ANDX_RANGE) &gt;</div><div class='del'>-		     PAGE_SIZE);</div><div class='del'>-	max_buf = min_t(unsigned int, max_buf - sizeof(struct smb_hdr),</div><div class='del'>-			PAGE_SIZE);</div><div class='del'>-	max_num = (max_buf - sizeof(struct smb_hdr)) /</div><div class='del'>-						sizeof(LOCKING_ANDX_RANGE);</div><div class='del'>-	buf = kcalloc(max_num, sizeof(LOCKING_ANDX_RANGE), GFP_KERNEL);</div><div class='del'>-	if (!buf) {</div><div class='del'>-		free_xid(xid);</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; 2; i++) {</div><div class='del'>-		cur = buf;</div><div class='del'>-		num = 0;</div><div class='del'>-		list_for_each_entry_safe(li, tmp, &amp;cfile-&gt;llist-&gt;locks, llist) {</div><div class='del'>-			if (li-&gt;type != types[i])</div><div class='del'>-				continue;</div><div class='del'>-			cur-&gt;Pid = cpu_to_le16(li-&gt;pid);</div><div class='del'>-			cur-&gt;LengthLow = cpu_to_le32((u32)li-&gt;length);</div><div class='del'>-			cur-&gt;LengthHigh = cpu_to_le32((u32)(li-&gt;length&gt;&gt;32));</div><div class='del'>-			cur-&gt;OffsetLow = cpu_to_le32((u32)li-&gt;offset);</div><div class='del'>-			cur-&gt;OffsetHigh = cpu_to_le32((u32)(li-&gt;offset&gt;&gt;32));</div><div class='del'>-			if (++num == max_num) {</div><div class='del'>-				stored_rc = cifs_lockv(xid, tcon,</div><div class='del'>-						       cfile-&gt;fid.netfid,</div><div class='del'>-						       (__u8)li-&gt;type, 0, num,</div><div class='del'>-						       buf);</div><div class='del'>-				if (stored_rc)</div><div class='del'>-					rc = stored_rc;</div><div class='del'>-				cur = buf;</div><div class='del'>-				num = 0;</div><div class='del'>-			} else</div><div class='del'>-				cur++;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (num) {</div><div class='del'>-			stored_rc = cifs_lockv(xid, tcon, cfile-&gt;fid.netfid,</div><div class='del'>-					       (__u8)types[i], 0, num, buf);</div><div class='del'>-			if (stored_rc)</div><div class='del'>-				rc = stored_rc;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	kfree(buf);</div><div class='del'>-	free_xid(xid);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __u32</div><div class='del'>-hash_lockowner(fl_owner_t owner)</div><div class='del'>-{</div><div class='del'>-	return cifs_lock_secret ^ hash32_ptr((const void *)owner);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct lock_to_push {</div><div class='del'>-	struct list_head llist;</div><div class='del'>-	__u64 offset;</div><div class='del'>-	__u64 length;</div><div class='del'>-	__u32 pid;</div><div class='del'>-	__u16 netfid;</div><div class='del'>-	__u8 type;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-cifs_push_posix_locks(struct cifsFileInfo *cfile)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = d_inode(cfile-&gt;dentry);</div><div class='del'>-	struct cifs_tcon *tcon = tlink_tcon(cfile-&gt;tlink);</div><div class='del'>-	struct file_lock *flock;</div><div class='del'>-	struct file_lock_context *flctx = inode-&gt;i_flctx;</div><div class='del'>-	unsigned int count = 0, i;</div><div class='del'>-	int rc = 0, xid, type;</div><div class='del'>-	struct list_head locks_to_send, *el;</div><div class='del'>-	struct lock_to_push *lck, *tmp;</div><div class='del'>-	__u64 length;</div><div class='del'>-</div><div class='del'>-	xid = get_xid();</div><div class='del'>-</div><div class='del'>-	if (!flctx)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;flctx-&gt;flc_lock);</div><div class='del'>-	list_for_each(el, &amp;flctx-&gt;flc_posix) {</div><div class='del'>-		count++;</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;flctx-&gt;flc_lock);</div><div class='del'>-</div><div class='del'>-	INIT_LIST_HEAD(&amp;locks_to_send);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Allocating count locks is enough because no FL_POSIX locks can be</div><div class='del'>-	 * added to the list while we are holding cinode-&gt;lock_sem that</div><div class='del'>-	 * protects locking operations of this inode.</div><div class='del'>-	 */</div><div class='del'>-	for (i = 0; i &lt; count; i++) {</div><div class='del'>-		lck = kmalloc(sizeof(struct lock_to_push), GFP_KERNEL);</div><div class='del'>-		if (!lck) {</div><div class='del'>-			rc = -ENOMEM;</div><div class='del'>-			goto err_out;</div><div class='del'>-		}</div><div class='del'>-		list_add_tail(&amp;lck-&gt;llist, &amp;locks_to_send);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	el = locks_to_send.next;</div><div class='del'>-	spin_lock(&amp;flctx-&gt;flc_lock);</div><div class='del'>-	list_for_each_entry(flock, &amp;flctx-&gt;flc_posix, fl_list) {</div><div class='del'>-		if (el == &amp;locks_to_send) {</div><div class='del'>-			/*</div><div class='del'>-			 * The list ended. We don't have enough allocated</div><div class='del'>-			 * structures - something is really wrong.</div><div class='del'>-			 */</div><div class='del'>-			cifs_dbg(VFS, "Can't push all brlocks!\n");</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		length = 1 + flock-&gt;fl_end - flock-&gt;fl_start;</div><div class='del'>-		if (flock-&gt;fl_type == F_RDLCK || flock-&gt;fl_type == F_SHLCK)</div><div class='del'>-			type = CIFS_RDLCK;</div><div class='del'>-		else</div><div class='del'>-			type = CIFS_WRLCK;</div><div class='del'>-		lck = list_entry(el, struct lock_to_push, llist);</div><div class='del'>-		lck-&gt;pid = hash_lockowner(flock-&gt;fl_owner);</div><div class='del'>-		lck-&gt;netfid = cfile-&gt;fid.netfid;</div><div class='del'>-		lck-&gt;length = length;</div><div class='del'>-		lck-&gt;type = type;</div><div class='del'>-		lck-&gt;offset = flock-&gt;fl_start;</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;flctx-&gt;flc_lock);</div><div class='del'>-</div><div class='del'>-	list_for_each_entry_safe(lck, tmp, &amp;locks_to_send, llist) {</div><div class='del'>-		int stored_rc;</div><div class='del'>-</div><div class='del'>-		stored_rc = CIFSSMBPosixLock(xid, tcon, lck-&gt;netfid, lck-&gt;pid,</div><div class='del'>-					     lck-&gt;offset, lck-&gt;length, NULL,</div><div class='del'>-					     lck-&gt;type, 0);</div><div class='del'>-		if (stored_rc)</div><div class='del'>-			rc = stored_rc;</div><div class='del'>-		list_del(&amp;lck-&gt;llist);</div><div class='del'>-		kfree(lck);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	free_xid(xid);</div><div class='del'>-	return rc;</div><div class='del'>-err_out:</div><div class='del'>-	list_for_each_entry_safe(lck, tmp, &amp;locks_to_send, llist) {</div><div class='del'>-		list_del(&amp;lck-&gt;llist);</div><div class='del'>-		kfree(lck);</div><div class='del'>-	}</div><div class='del'>-	goto out;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-cifs_push_locks(struct cifsFileInfo *cfile)</div><div class='del'>-{</div><div class='del'>-	struct cifs_sb_info *cifs_sb = CIFS_SB(cfile-&gt;dentry-&gt;d_sb);</div><div class='del'>-	struct cifsInodeInfo *cinode = CIFS_I(d_inode(cfile-&gt;dentry));</div><div class='del'>-	struct cifs_tcon *tcon = tlink_tcon(cfile-&gt;tlink);</div><div class='del'>-	int rc = 0;</div><div class='del'>-</div><div class='del'>-	/* we are going to update can_cache_brlcks here - need a write access */</div><div class='del'>-	cifs_down_write(&amp;cinode-&gt;lock_sem);</div><div class='del'>-	if (!cinode-&gt;can_cache_brlcks) {</div><div class='del'>-		up_write(&amp;cinode-&gt;lock_sem);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (cap_unix(tcon-&gt;ses) &amp;&amp;</div><div class='del'>-	    (CIFS_UNIX_FCNTL_CAP &amp; le64_to_cpu(tcon-&gt;fsUnixInfo.Capability)) &amp;&amp;</div><div class='del'>-	    ((cifs_sb-&gt;mnt_cifs_flags &amp; CIFS_MOUNT_NOPOSIXBRL) == 0))</div><div class='del'>-		rc = cifs_push_posix_locks(cfile);</div><div class='del'>-	else</div><div class='del'>-		rc = tcon-&gt;ses-&gt;server-&gt;ops-&gt;push_mand_locks(cfile);</div><div class='del'>-</div><div class='del'>-	cinode-&gt;can_cache_brlcks = false;</div><div class='del'>-	up_write(&amp;cinode-&gt;lock_sem);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void</div><div class='del'>-cifs_read_flock(struct file_lock *flock, __u32 *type, int *lock, int *unlock,</div><div class='del'>-		bool *wait_flag, struct TCP_Server_Info *server)</div><div class='del'>-{</div><div class='del'>-	if (flock-&gt;fl_flags &amp; FL_POSIX)</div><div class='del'>-		cifs_dbg(FYI, "Posix\n");</div><div class='del'>-	if (flock-&gt;fl_flags &amp; FL_FLOCK)</div><div class='del'>-		cifs_dbg(FYI, "Flock\n");</div><div class='del'>-	if (flock-&gt;fl_flags &amp; FL_SLEEP) {</div><div class='del'>-		cifs_dbg(FYI, "Blocking lock\n");</div><div class='del'>-		*wait_flag = true;</div><div class='del'>-	}</div><div class='del'>-	if (flock-&gt;fl_flags &amp; FL_ACCESS)</div><div class='del'>-		cifs_dbg(FYI, "Process suspended by mandatory locking - not implemented yet\n");</div><div class='del'>-	if (flock-&gt;fl_flags &amp; FL_LEASE)</div><div class='del'>-		cifs_dbg(FYI, "Lease on file - not implemented yet\n");</div><div class='del'>-	if (flock-&gt;fl_flags &amp;</div><div class='del'>-	    (~(FL_POSIX | FL_FLOCK | FL_SLEEP |</div><div class='del'>-	       FL_ACCESS | FL_LEASE | FL_CLOSE | FL_OFDLCK)))</div><div class='del'>-		cifs_dbg(FYI, "Unknown lock flags 0x%x\n", flock-&gt;fl_flags);</div><div class='del'>-</div><div class='del'>-	*type = server-&gt;vals-&gt;large_lock_type;</div><div class='del'>-	if (flock-&gt;fl_type == F_WRLCK) {</div><div class='del'>-		cifs_dbg(FYI, "F_WRLCK\n");</div><div class='del'>-		*type |= server-&gt;vals-&gt;exclusive_lock_type;</div><div class='del'>-		*lock = 1;</div><div class='del'>-	} else if (flock-&gt;fl_type == F_UNLCK) {</div><div class='del'>-		cifs_dbg(FYI, "F_UNLCK\n");</div><div class='del'>-		*type |= server-&gt;vals-&gt;unlock_lock_type;</div><div class='del'>-		*unlock = 1;</div><div class='del'>-		/* Check if unlock includes more than one lock range */</div><div class='del'>-	} else if (flock-&gt;fl_type == F_RDLCK) {</div><div class='del'>-		cifs_dbg(FYI, "F_RDLCK\n");</div><div class='del'>-		*type |= server-&gt;vals-&gt;shared_lock_type;</div><div class='del'>-		*lock = 1;</div><div class='del'>-	} else if (flock-&gt;fl_type == F_EXLCK) {</div><div class='del'>-		cifs_dbg(FYI, "F_EXLCK\n");</div><div class='del'>-		*type |= server-&gt;vals-&gt;exclusive_lock_type;</div><div class='del'>-		*lock = 1;</div><div class='del'>-	} else if (flock-&gt;fl_type == F_SHLCK) {</div><div class='del'>-		cifs_dbg(FYI, "F_SHLCK\n");</div><div class='del'>-		*type |= server-&gt;vals-&gt;shared_lock_type;</div><div class='del'>-		*lock = 1;</div><div class='del'>-	} else</div><div class='del'>-		cifs_dbg(FYI, "Unknown type of lock\n");</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-cifs_getlk(struct file *file, struct file_lock *flock, __u32 type,</div><div class='del'>-	   bool wait_flag, bool posix_lck, unsigned int xid)</div><div class='del'>-{</div><div class='del'>-	int rc = 0;</div><div class='del'>-	__u64 length = 1 + flock-&gt;fl_end - flock-&gt;fl_start;</div><div class='del'>-	struct cifsFileInfo *cfile = (struct cifsFileInfo *)file-&gt;private_data;</div><div class='del'>-	struct cifs_tcon *tcon = tlink_tcon(cfile-&gt;tlink);</div><div class='del'>-	struct TCP_Server_Info *server = tcon-&gt;ses-&gt;server;</div><div class='del'>-	__u16 netfid = cfile-&gt;fid.netfid;</div><div class='del'>-</div><div class='del'>-	if (posix_lck) {</div><div class='del'>-		int posix_lock_type;</div><div class='del'>-</div><div class='del'>-		rc = cifs_posix_lock_test(file, flock);</div><div class='del'>-		if (!rc)</div><div class='del'>-			return rc;</div><div class='del'>-</div><div class='del'>-		if (type &amp; server-&gt;vals-&gt;shared_lock_type)</div><div class='del'>-			posix_lock_type = CIFS_RDLCK;</div><div class='del'>-		else</div><div class='del'>-			posix_lock_type = CIFS_WRLCK;</div><div class='del'>-		rc = CIFSSMBPosixLock(xid, tcon, netfid,</div><div class='del'>-				      hash_lockowner(flock-&gt;fl_owner),</div><div class='del'>-				      flock-&gt;fl_start, length, flock,</div><div class='del'>-				      posix_lock_type, wait_flag);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rc = cifs_lock_test(cfile, flock-&gt;fl_start, length, type, flock);</div><div class='del'>-	if (!rc)</div><div class='del'>-		return rc;</div><div class='del'>-</div><div class='del'>-	/* BB we could chain these into one lock request BB */</div><div class='del'>-	rc = server-&gt;ops-&gt;mand_lock(xid, cfile, flock-&gt;fl_start, length, type,</div><div class='del'>-				    1, 0, false);</div><div class='del'>-	if (rc == 0) {</div><div class='del'>-		rc = server-&gt;ops-&gt;mand_lock(xid, cfile, flock-&gt;fl_start, length,</div><div class='del'>-					    type, 0, 1, false);</div><div class='del'>-		flock-&gt;fl_type = F_UNLCK;</div><div class='del'>-		if (rc != 0)</div><div class='del'>-			cifs_dbg(VFS, "Error unlocking previously locked range %d during test of lock\n",</div><div class='del'>-				 rc);</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (type &amp; server-&gt;vals-&gt;shared_lock_type) {</div><div class='del'>-		flock-&gt;fl_type = F_WRLCK;</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	type &amp;= ~server-&gt;vals-&gt;exclusive_lock_type;</div><div class='del'>-</div><div class='del'>-	rc = server-&gt;ops-&gt;mand_lock(xid, cfile, flock-&gt;fl_start, length,</div><div class='del'>-				    type | server-&gt;vals-&gt;shared_lock_type,</div><div class='del'>-				    1, 0, false);</div><div class='del'>-	if (rc == 0) {</div><div class='del'>-		rc = server-&gt;ops-&gt;mand_lock(xid, cfile, flock-&gt;fl_start, length,</div><div class='del'>-			type | server-&gt;vals-&gt;shared_lock_type, 0, 1, false);</div><div class='del'>-		flock-&gt;fl_type = F_RDLCK;</div><div class='del'>-		if (rc != 0)</div><div class='del'>-			cifs_dbg(VFS, "Error unlocking previously locked range %d during test of lock\n",</div><div class='del'>-				 rc);</div><div class='del'>-	} else</div><div class='del'>-		flock-&gt;fl_type = F_WRLCK;</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void</div><div class='del'>-cifs_move_llist(struct list_head *source, struct list_head *dest)</div><div class='del'>-{</div><div class='del'>-	struct list_head *li, *tmp;</div><div class='del'>-	list_for_each_safe(li, tmp, source)</div><div class='del'>-		list_move(li, dest);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void</div><div class='del'>-cifs_free_llist(struct list_head *llist)</div><div class='del'>-{</div><div class='del'>-	struct cifsLockInfo *li, *tmp;</div><div class='del'>-	list_for_each_entry_safe(li, tmp, llist, llist) {</div><div class='del'>-		cifs_del_lock_waiters(li);</div><div class='del'>-		list_del(&amp;li-&gt;llist);</div><div class='del'>-		kfree(li);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int</div><div class='del'>-cifs_unlock_range(struct cifsFileInfo *cfile, struct file_lock *flock,</div><div class='del'>-		  unsigned int xid)</div><div class='del'>-{</div><div class='del'>-	int rc = 0, stored_rc;</div><div class='del'>-	static const int types[] = {</div><div class='del'>-		LOCKING_ANDX_LARGE_FILES,</div><div class='del'>-		LOCKING_ANDX_SHARED_LOCK | LOCKING_ANDX_LARGE_FILES</div><div class='del'>-	};</div><div class='del'>-	unsigned int i;</div><div class='del'>-	unsigned int max_num, num, max_buf;</div><div class='del'>-	LOCKING_ANDX_RANGE *buf, *cur;</div><div class='del'>-	struct cifs_tcon *tcon = tlink_tcon(cfile-&gt;tlink);</div><div class='del'>-	struct cifsInodeInfo *cinode = CIFS_I(d_inode(cfile-&gt;dentry));</div><div class='del'>-	struct cifsLockInfo *li, *tmp;</div><div class='del'>-	__u64 length = 1 + flock-&gt;fl_end - flock-&gt;fl_start;</div><div class='del'>-	struct list_head tmp_llist;</div><div class='del'>-</div><div class='del'>-	INIT_LIST_HEAD(&amp;tmp_llist);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Accessing maxBuf is racy with cifs_reconnect - need to store value</div><div class='del'>-	 * and check it before using.</div><div class='del'>-	 */</div><div class='del'>-	max_buf = tcon-&gt;ses-&gt;server-&gt;maxBuf;</div><div class='del'>-	if (max_buf &lt; (sizeof(struct smb_hdr) + sizeof(LOCKING_ANDX_RANGE)))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	BUILD_BUG_ON(sizeof(struct smb_hdr) + sizeof(LOCKING_ANDX_RANGE) &gt;</div><div class='del'>-		     PAGE_SIZE);</div><div class='del'>-	max_buf = min_t(unsigned int, max_buf - sizeof(struct smb_hdr),</div><div class='del'>-			PAGE_SIZE);</div><div class='del'>-	max_num = (max_buf - sizeof(struct smb_hdr)) /</div><div class='del'>-						sizeof(LOCKING_ANDX_RANGE);</div><div class='del'>-	buf = kcalloc(max_num, sizeof(LOCKING_ANDX_RANGE), GFP_KERNEL);</div><div class='del'>-	if (!buf)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	cifs_down_write(&amp;cinode-&gt;lock_sem);</div><div class='del'>-	for (i = 0; i &lt; 2; i++) {</div><div class='del'>-		cur = buf;</div><div class='del'>-		num = 0;</div><div class='del'>-		list_for_each_entry_safe(li, tmp, &amp;cfile-&gt;llist-&gt;locks, llist) {</div><div class='del'>-			if (flock-&gt;fl_start &gt; li-&gt;offset ||</div><div class='del'>-			    (flock-&gt;fl_start + length) &lt;</div><div class='del'>-			    (li-&gt;offset + li-&gt;length))</div><div class='del'>-				continue;</div><div class='del'>-			if (current-&gt;tgid != li-&gt;pid)</div><div class='del'>-				continue;</div><div class='del'>-			if (types[i] != li-&gt;type)</div><div class='del'>-				continue;</div><div class='del'>-			if (cinode-&gt;can_cache_brlcks) {</div><div class='del'>-				/*</div><div class='del'>-				 * We can cache brlock requests - simply remove</div><div class='del'>-				 * a lock from the file's list.</div><div class='del'>-				 */</div><div class='del'>-				list_del(&amp;li-&gt;llist);</div><div class='del'>-				cifs_del_lock_waiters(li);</div><div class='del'>-				kfree(li);</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='del'>-			cur-&gt;Pid = cpu_to_le16(li-&gt;pid);</div><div class='del'>-			cur-&gt;LengthLow = cpu_to_le32((u32)li-&gt;length);</div><div class='del'>-			cur-&gt;LengthHigh = cpu_to_le32((u32)(li-&gt;length&gt;&gt;32));</div><div class='del'>-			cur-&gt;OffsetLow = cpu_to_le32((u32)li-&gt;offset);</div><div class='del'>-			cur-&gt;OffsetHigh = cpu_to_le32((u32)(li-&gt;offset&gt;&gt;32));</div><div class='del'>-			/*</div><div class='del'>-			 * We need to save a lock here to let us add it again to</div><div class='del'>-			 * the file's list if the unlock range request fails on</div><div class='del'>-			 * the server.</div><div class='del'>-			 */</div><div class='del'>-			list_move(&amp;li-&gt;llist, &amp;tmp_llist);</div><div class='del'>-			if (++num == max_num) {</div><div class='del'>-				stored_rc = cifs_lockv(xid, tcon,</div><div class='del'>-						       cfile-&gt;fid.netfid,</div><div class='del'>-						       li-&gt;type, num, 0, buf);</div><div class='del'>-				if (stored_rc) {</div><div class='del'>-					/*</div><div class='del'>-					 * We failed on the unlock range</div><div class='del'>-					 * request - add all locks from the tmp</div><div class='del'>-					 * list to the head of the file's list.</div><div class='del'>-					 */</div><div class='del'>-					cifs_move_llist(&amp;tmp_llist,</div><div class='del'>-							&amp;cfile-&gt;llist-&gt;locks);</div><div class='del'>-					rc = stored_rc;</div><div class='del'>-				} else</div><div class='del'>-					/*</div><div class='del'>-					 * The unlock range request succeed -</div><div class='del'>-					 * free the tmp list.</div><div class='del'>-					 */</div><div class='del'>-					cifs_free_llist(&amp;tmp_llist);</div><div class='del'>-				cur = buf;</div><div class='del'>-				num = 0;</div><div class='del'>-			} else</div><div class='del'>-				cur++;</div><div class='del'>-		}</div><div class='del'>-		if (num) {</div><div class='del'>-			stored_rc = cifs_lockv(xid, tcon, cfile-&gt;fid.netfid,</div><div class='del'>-					       types[i], num, 0, buf);</div><div class='del'>-			if (stored_rc) {</div><div class='del'>-				cifs_move_llist(&amp;tmp_llist,</div><div class='del'>-						&amp;cfile-&gt;llist-&gt;locks);</div><div class='del'>-				rc = stored_rc;</div><div class='del'>-			} else</div><div class='del'>-				cifs_free_llist(&amp;tmp_llist);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	up_write(&amp;cinode-&gt;lock_sem);</div><div class='del'>-	kfree(buf);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-cifs_setlk(struct file *file, struct file_lock *flock, __u32 type,</div><div class='del'>-	   bool wait_flag, bool posix_lck, int lock, int unlock,</div><div class='del'>-	   unsigned int xid)</div><div class='del'>-{</div><div class='del'>-	int rc = 0;</div><div class='del'>-	__u64 length = 1 + flock-&gt;fl_end - flock-&gt;fl_start;</div><div class='del'>-	struct cifsFileInfo *cfile = (struct cifsFileInfo *)file-&gt;private_data;</div><div class='del'>-	struct cifs_tcon *tcon = tlink_tcon(cfile-&gt;tlink);</div><div class='del'>-	struct TCP_Server_Info *server = tcon-&gt;ses-&gt;server;</div><div class='del'>-	struct inode *inode = d_inode(cfile-&gt;dentry);</div><div class='del'>-</div><div class='del'>-	if (posix_lck) {</div><div class='del'>-		int posix_lock_type;</div><div class='del'>-</div><div class='del'>-		rc = cifs_posix_lock_set(file, flock);</div><div class='del'>-		if (rc &lt;= FILE_LOCK_DEFERRED)</div><div class='del'>-			return rc;</div><div class='del'>-</div><div class='del'>-		if (type &amp; server-&gt;vals-&gt;shared_lock_type)</div><div class='del'>-			posix_lock_type = CIFS_RDLCK;</div><div class='del'>-		else</div><div class='del'>-			posix_lock_type = CIFS_WRLCK;</div><div class='del'>-</div><div class='del'>-		if (unlock == 1)</div><div class='del'>-			posix_lock_type = CIFS_UNLCK;</div><div class='del'>-</div><div class='del'>-		rc = CIFSSMBPosixLock(xid, tcon, cfile-&gt;fid.netfid,</div><div class='del'>-				      hash_lockowner(flock-&gt;fl_owner),</div><div class='del'>-				      flock-&gt;fl_start, length,</div><div class='del'>-				      NULL, posix_lock_type, wait_flag);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (lock) {</div><div class='del'>-		struct cifsLockInfo *lock;</div><div class='del'>-</div><div class='del'>-		lock = cifs_lock_init(flock-&gt;fl_start, length, type,</div><div class='del'>-				      flock-&gt;fl_flags);</div><div class='del'>-		if (!lock)</div><div class='del'>-			return -ENOMEM;</div><div class='del'>-</div><div class='del'>-		rc = cifs_lock_add_if(cfile, lock, wait_flag);</div><div class='del'>-		if (rc &lt; 0) {</div><div class='del'>-			kfree(lock);</div><div class='del'>-			return rc;</div><div class='del'>-		}</div><div class='del'>-		if (!rc)</div><div class='del'>-			goto out;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Windows 7 server can delay breaking lease from read to None</div><div class='del'>-		 * if we set a byte-range lock on a file - break it explicitly</div><div class='del'>-		 * before sending the lock to the server to be sure the next</div><div class='del'>-		 * read won't conflict with non-overlapted locks due to</div><div class='del'>-		 * pagereading.</div><div class='del'>-		 */</div><div class='del'>-		if (!CIFS_CACHE_WRITE(CIFS_I(inode)) &amp;&amp;</div><div class='del'>-					CIFS_CACHE_READ(CIFS_I(inode))) {</div><div class='del'>-			cifs_zap_mapping(inode);</div><div class='del'>-			cifs_dbg(FYI, "Set no oplock for inode=%p due to mand locks\n",</div><div class='del'>-				 inode);</div><div class='del'>-			CIFS_I(inode)-&gt;oplock = 0;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		rc = server-&gt;ops-&gt;mand_lock(xid, cfile, flock-&gt;fl_start, length,</div><div class='del'>-					    type, 1, 0, wait_flag);</div><div class='del'>-		if (rc) {</div><div class='del'>-			kfree(lock);</div><div class='del'>-			return rc;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		cifs_lock_add(cfile, lock);</div><div class='del'>-	} else if (unlock)</div><div class='del'>-		rc = server-&gt;ops-&gt;mand_unlock_range(cfile, flock, xid);</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	if ((flock-&gt;fl_flags &amp; FL_POSIX) || (flock-&gt;fl_flags &amp; FL_FLOCK)) {</div><div class='del'>-		/*</div><div class='del'>-		 * If this is a request to remove all locks because we</div><div class='del'>-		 * are closing the file, it doesn't matter if the</div><div class='del'>-		 * unlocking failed as both cifs.ko and the SMB server</div><div class='del'>-		 * remove the lock on file close</div><div class='del'>-		 */</div><div class='del'>-		if (rc) {</div><div class='del'>-			cifs_dbg(VFS, "%s failed rc=%d\n", __func__, rc);</div><div class='del'>-			if (!(flock-&gt;fl_flags &amp; FL_CLOSE))</div><div class='del'>-				return rc;</div><div class='del'>-		}</div><div class='del'>-		rc = locks_lock_file_wait(file, flock);</div><div class='del'>-	}</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int cifs_flock(struct file *file, int cmd, struct file_lock *fl)</div><div class='del'>-{</div><div class='del'>-	int rc, xid;</div><div class='del'>-	int lock = 0, unlock = 0;</div><div class='del'>-	bool wait_flag = false;</div><div class='del'>-	bool posix_lck = false;</div><div class='del'>-	struct cifs_sb_info *cifs_sb;</div><div class='del'>-	struct cifs_tcon *tcon;</div><div class='del'>-	struct cifsFileInfo *cfile;</div><div class='del'>-	__u32 type;</div><div class='del'>-</div><div class='del'>-	rc = -EACCES;</div><div class='del'>-	xid = get_xid();</div><div class='del'>-</div><div class='del'>-	if (!(fl-&gt;fl_flags &amp; FL_FLOCK))</div><div class='del'>-		return -ENOLCK;</div><div class='del'>-</div><div class='del'>-	cfile = (struct cifsFileInfo *)file-&gt;private_data;</div><div class='del'>-	tcon = tlink_tcon(cfile-&gt;tlink);</div><div class='del'>-</div><div class='del'>-	cifs_read_flock(fl, &amp;type, &amp;lock, &amp;unlock, &amp;wait_flag,</div><div class='del'>-			tcon-&gt;ses-&gt;server);</div><div class='del'>-	cifs_sb = CIFS_FILE_SB(file);</div><div class='del'>-</div><div class='del'>-	if (cap_unix(tcon-&gt;ses) &amp;&amp;</div><div class='del'>-	    (CIFS_UNIX_FCNTL_CAP &amp; le64_to_cpu(tcon-&gt;fsUnixInfo.Capability)) &amp;&amp;</div><div class='del'>-	    ((cifs_sb-&gt;mnt_cifs_flags &amp; CIFS_MOUNT_NOPOSIXBRL) == 0))</div><div class='del'>-		posix_lck = true;</div><div class='del'>-</div><div class='del'>-	if (!lock &amp;&amp; !unlock) {</div><div class='del'>-		/*</div><div class='del'>-		 * if no lock or unlock then nothing to do since we do not</div><div class='del'>-		 * know what it is</div><div class='del'>-		 */</div><div class='del'>-		free_xid(xid);</div><div class='del'>-		return -EOPNOTSUPP;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rc = cifs_setlk(file, fl, type, wait_flag, posix_lck, lock, unlock,</div><div class='del'>-			xid);</div><div class='del'>-	free_xid(xid);</div><div class='del'>-	return rc;</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int cifs_lock(struct file *file, int cmd, struct file_lock *flock)</div><div class='del'>-{</div><div class='del'>-	int rc, xid;</div><div class='del'>-	int lock = 0, unlock = 0;</div><div class='del'>-	bool wait_flag = false;</div><div class='del'>-	bool posix_lck = false;</div><div class='del'>-	struct cifs_sb_info *cifs_sb;</div><div class='del'>-	struct cifs_tcon *tcon;</div><div class='del'>-	struct cifsFileInfo *cfile;</div><div class='del'>-	__u32 type;</div><div class='del'>-</div><div class='del'>-	rc = -EACCES;</div><div class='del'>-	xid = get_xid();</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "Lock parm: 0x%x flockflags: 0x%x flocktype: 0x%x start: %lld end: %lld\n",</div><div class='del'>-		 cmd, flock-&gt;fl_flags, flock-&gt;fl_type,</div><div class='del'>-		 flock-&gt;fl_start, flock-&gt;fl_end);</div><div class='del'>-</div><div class='del'>-	cfile = (struct cifsFileInfo *)file-&gt;private_data;</div><div class='del'>-	tcon = tlink_tcon(cfile-&gt;tlink);</div><div class='del'>-</div><div class='del'>-	cifs_read_flock(flock, &amp;type, &amp;lock, &amp;unlock, &amp;wait_flag,</div><div class='del'>-			tcon-&gt;ses-&gt;server);</div><div class='del'>-	cifs_sb = CIFS_FILE_SB(file);</div><div class='del'>-	set_bit(CIFS_INO_CLOSE_ON_LOCK, &amp;CIFS_I(d_inode(cfile-&gt;dentry))-&gt;flags);</div><div class='del'>-</div><div class='del'>-	if (cap_unix(tcon-&gt;ses) &amp;&amp;</div><div class='del'>-	    (CIFS_UNIX_FCNTL_CAP &amp; le64_to_cpu(tcon-&gt;fsUnixInfo.Capability)) &amp;&amp;</div><div class='del'>-	    ((cifs_sb-&gt;mnt_cifs_flags &amp; CIFS_MOUNT_NOPOSIXBRL) == 0))</div><div class='del'>-		posix_lck = true;</div><div class='del'>-	/*</div><div class='del'>-	 * BB add code here to normalize offset and length to account for</div><div class='del'>-	 * negative length which we can not accept over the wire.</div><div class='del'>-	 */</div><div class='del'>-	if (IS_GETLK(cmd)) {</div><div class='del'>-		rc = cifs_getlk(file, flock, type, wait_flag, posix_lck, xid);</div><div class='del'>-		free_xid(xid);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!lock &amp;&amp; !unlock) {</div><div class='del'>-		/*</div><div class='del'>-		 * if no lock or unlock then nothing to do since we do not</div><div class='del'>-		 * know what it is</div><div class='del'>-		 */</div><div class='del'>-		free_xid(xid);</div><div class='del'>-		return -EOPNOTSUPP;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rc = cifs_setlk(file, flock, type, wait_flag, posix_lck, lock, unlock,</div><div class='del'>-			xid);</div><div class='del'>-	free_xid(xid);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * update the file size (if needed) after a write. Should be called with</div><div class='del'>- * the inode-&gt;i_lock held</div><div class='del'>- */</div><div class='del'>-void</div><div class='del'>-cifs_update_eof(struct cifsInodeInfo *cifsi, loff_t offset,</div><div class='del'>-		      unsigned int bytes_written)</div><div class='del'>-{</div><div class='del'>-	loff_t end_of_write = offset + bytes_written;</div><div class='del'>-</div><div class='del'>-	if (end_of_write &gt; cifsi-&gt;server_eof)</div><div class='del'>-		cifsi-&gt;server_eof = end_of_write;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static ssize_t</div><div class='del'>-cifs_write(struct cifsFileInfo *open_file, __u32 pid, const char *write_data,</div><div class='del'>-	   size_t write_size, loff_t *offset)</div><div class='del'>-{</div><div class='del'>-	int rc = 0;</div><div class='del'>-	unsigned int bytes_written = 0;</div><div class='del'>-	unsigned int total_written;</div><div class='del'>-	struct cifs_tcon *tcon;</div><div class='del'>-	struct TCP_Server_Info *server;</div><div class='del'>-	unsigned int xid;</div><div class='del'>-	struct dentry *dentry = open_file-&gt;dentry;</div><div class='del'>-	struct cifsInodeInfo *cifsi = CIFS_I(d_inode(dentry));</div><div class='del'>-	struct cifs_io_parms io_parms = {0};</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "write %zd bytes to offset %lld of %pd\n",</div><div class='del'>-		 write_size, *offset, dentry);</div><div class='del'>-</div><div class='del'>-	tcon = tlink_tcon(open_file-&gt;tlink);</div><div class='del'>-	server = tcon-&gt;ses-&gt;server;</div><div class='del'>-</div><div class='del'>-	if (!server-&gt;ops-&gt;sync_write)</div><div class='del'>-		return -ENOSYS;</div><div class='del'>-</div><div class='del'>-	xid = get_xid();</div><div class='del'>-</div><div class='del'>-	for (total_written = 0; write_size &gt; total_written;</div><div class='del'>-	     total_written += bytes_written) {</div><div class='del'>-		rc = -EAGAIN;</div><div class='del'>-		while (rc == -EAGAIN) {</div><div class='del'>-			struct kvec iov[2];</div><div class='del'>-			unsigned int len;</div><div class='del'>-</div><div class='del'>-			if (open_file-&gt;invalidHandle) {</div><div class='del'>-				/* we could deadlock if we called</div><div class='del'>-				   filemap_fdatawait from here so tell</div><div class='del'>-				   reopen_file not to flush data to</div><div class='del'>-				   server now */</div><div class='del'>-				rc = cifs_reopen_file(open_file, false);</div><div class='del'>-				if (rc != 0)</div><div class='del'>-					break;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			len = min(server-&gt;ops-&gt;wp_retry_size(d_inode(dentry)),</div><div class='del'>-				  (unsigned int)write_size - total_written);</div><div class='del'>-			/* iov[0] is reserved for smb header */</div><div class='del'>-			iov[1].iov_base = (char *)write_data + total_written;</div><div class='del'>-			iov[1].iov_len = len;</div><div class='del'>-			io_parms.pid = pid;</div><div class='del'>-			io_parms.tcon = tcon;</div><div class='del'>-			io_parms.offset = *offset;</div><div class='del'>-			io_parms.length = len;</div><div class='del'>-			rc = server-&gt;ops-&gt;sync_write(xid, &amp;open_file-&gt;fid,</div><div class='del'>-					&amp;io_parms, &amp;bytes_written, iov, 1);</div><div class='del'>-		}</div><div class='del'>-		if (rc || (bytes_written == 0)) {</div><div class='del'>-			if (total_written)</div><div class='del'>-				break;</div><div class='del'>-			else {</div><div class='del'>-				free_xid(xid);</div><div class='del'>-				return rc;</div><div class='del'>-			}</div><div class='del'>-		} else {</div><div class='del'>-			spin_lock(&amp;d_inode(dentry)-&gt;i_lock);</div><div class='del'>-			cifs_update_eof(cifsi, *offset, bytes_written);</div><div class='del'>-			spin_unlock(&amp;d_inode(dentry)-&gt;i_lock);</div><div class='del'>-			*offset += bytes_written;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	cifs_stats_bytes_written(tcon, total_written);</div><div class='del'>-</div><div class='del'>-	if (total_written &gt; 0) {</div><div class='del'>-		spin_lock(&amp;d_inode(dentry)-&gt;i_lock);</div><div class='del'>-		if (*offset &gt; d_inode(dentry)-&gt;i_size) {</div><div class='del'>-			i_size_write(d_inode(dentry), *offset);</div><div class='del'>-			d_inode(dentry)-&gt;i_blocks = (512 - 1 + *offset) &gt;&gt; 9;</div><div class='del'>-		}</div><div class='del'>-		spin_unlock(&amp;d_inode(dentry)-&gt;i_lock);</div><div class='del'>-	}</div><div class='del'>-	mark_inode_dirty_sync(d_inode(dentry));</div><div class='del'>-	free_xid(xid);</div><div class='del'>-	return total_written;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct cifsFileInfo *find_readable_file(struct cifsInodeInfo *cifs_inode,</div><div class='del'>-					bool fsuid_only)</div><div class='del'>-{</div><div class='del'>-	struct cifsFileInfo *open_file = NULL;</div><div class='del'>-	struct cifs_sb_info *cifs_sb = CIFS_SB(cifs_inode-&gt;vfs_inode.i_sb);</div><div class='del'>-</div><div class='del'>-	/* only filter by fsuid on multiuser mounts */</div><div class='del'>-	if (!(cifs_sb-&gt;mnt_cifs_flags &amp; CIFS_MOUNT_MULTIUSER))</div><div class='del'>-		fsuid_only = false;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;cifs_inode-&gt;open_file_lock);</div><div class='del'>-	/* we could simply get the first_list_entry since write-only entries</div><div class='del'>-	   are always at the end of the list but since the first entry might</div><div class='del'>-	   have a close pending, we go through the whole list */</div><div class='del'>-	list_for_each_entry(open_file, &amp;cifs_inode-&gt;openFileList, flist) {</div><div class='del'>-		if (fsuid_only &amp;&amp; !uid_eq(open_file-&gt;uid, current_fsuid()))</div><div class='del'>-			continue;</div><div class='del'>-		if (OPEN_FMODE(open_file-&gt;f_flags) &amp; FMODE_READ) {</div><div class='del'>-			if ((!open_file-&gt;invalidHandle)) {</div><div class='del'>-				/* found a good file */</div><div class='del'>-				/* lock it so it will not be closed on us */</div><div class='del'>-				cifsFileInfo_get(open_file);</div><div class='del'>-				spin_unlock(&amp;cifs_inode-&gt;open_file_lock);</div><div class='del'>-				return open_file;</div><div class='del'>-			} /* else might as well continue, and look for</div><div class='del'>-			     another, or simply have the caller reopen it</div><div class='del'>-			     again rather than trying to fix this handle */</div><div class='del'>-		} else /* write only file */</div><div class='del'>-			break; /* write only files are last so must be done */</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;cifs_inode-&gt;open_file_lock);</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* Return -EBADF if no handle is found and general rc otherwise */</div><div class='del'>-int</div><div class='del'>-cifs_get_writable_file(struct cifsInodeInfo *cifs_inode, int flags,</div><div class='del'>-		       struct cifsFileInfo **ret_file)</div><div class='del'>-{</div><div class='del'>-	struct cifsFileInfo *open_file, *inv_file = NULL;</div><div class='del'>-	struct cifs_sb_info *cifs_sb;</div><div class='del'>-	bool any_available = false;</div><div class='del'>-	int rc = -EBADF;</div><div class='del'>-	unsigned int refind = 0;</div><div class='del'>-	bool fsuid_only = flags &amp; FIND_WR_FSUID_ONLY;</div><div class='del'>-	bool with_delete = flags &amp; FIND_WR_WITH_DELETE;</div><div class='del'>-	*ret_file = NULL;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Having a null inode here (because mapping-&gt;host was set to zero by</div><div class='del'>-	 * the VFS or MM) should not happen but we had reports of on oops (due</div><div class='del'>-	 * to it being zero) during stress testcases so we need to check for it</div><div class='del'>-	 */</div><div class='del'>-</div><div class='del'>-	if (cifs_inode == NULL) {</div><div class='del'>-		cifs_dbg(VFS, "Null inode passed to cifs_writeable_file\n");</div><div class='del'>-		dump_stack();</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	cifs_sb = CIFS_SB(cifs_inode-&gt;vfs_inode.i_sb);</div><div class='del'>-</div><div class='del'>-	/* only filter by fsuid on multiuser mounts */</div><div class='del'>-	if (!(cifs_sb-&gt;mnt_cifs_flags &amp; CIFS_MOUNT_MULTIUSER))</div><div class='del'>-		fsuid_only = false;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;cifs_inode-&gt;open_file_lock);</div><div class='del'>-refind_writable:</div><div class='del'>-	if (refind &gt; MAX_REOPEN_ATT) {</div><div class='del'>-		spin_unlock(&amp;cifs_inode-&gt;open_file_lock);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-	list_for_each_entry(open_file, &amp;cifs_inode-&gt;openFileList, flist) {</div><div class='del'>-		if (!any_available &amp;&amp; open_file-&gt;pid != current-&gt;tgid)</div><div class='del'>-			continue;</div><div class='del'>-		if (fsuid_only &amp;&amp; !uid_eq(open_file-&gt;uid, current_fsuid()))</div><div class='del'>-			continue;</div><div class='del'>-		if (with_delete &amp;&amp; !(open_file-&gt;fid.access &amp; DELETE))</div><div class='del'>-			continue;</div><div class='del'>-		if (OPEN_FMODE(open_file-&gt;f_flags) &amp; FMODE_WRITE) {</div><div class='del'>-			if (!open_file-&gt;invalidHandle) {</div><div class='del'>-				/* found a good writable file */</div><div class='del'>-				cifsFileInfo_get(open_file);</div><div class='del'>-				spin_unlock(&amp;cifs_inode-&gt;open_file_lock);</div><div class='del'>-				*ret_file = open_file;</div><div class='del'>-				return 0;</div><div class='del'>-			} else {</div><div class='del'>-				if (!inv_file)</div><div class='del'>-					inv_file = open_file;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	/* couldn't find useable FH with same pid, try any available */</div><div class='del'>-	if (!any_available) {</div><div class='del'>-		any_available = true;</div><div class='del'>-		goto refind_writable;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (inv_file) {</div><div class='del'>-		any_available = false;</div><div class='del'>-		cifsFileInfo_get(inv_file);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_unlock(&amp;cifs_inode-&gt;open_file_lock);</div><div class='del'>-</div><div class='del'>-	if (inv_file) {</div><div class='del'>-		rc = cifs_reopen_file(inv_file, false);</div><div class='del'>-		if (!rc) {</div><div class='del'>-			*ret_file = inv_file;</div><div class='del'>-			return 0;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		spin_lock(&amp;cifs_inode-&gt;open_file_lock);</div><div class='del'>-		list_move_tail(&amp;inv_file-&gt;flist, &amp;cifs_inode-&gt;openFileList);</div><div class='del'>-		spin_unlock(&amp;cifs_inode-&gt;open_file_lock);</div><div class='del'>-		cifsFileInfo_put(inv_file);</div><div class='del'>-		++refind;</div><div class='del'>-		inv_file = NULL;</div><div class='del'>-		spin_lock(&amp;cifs_inode-&gt;open_file_lock);</div><div class='del'>-		goto refind_writable;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct cifsFileInfo *</div><div class='del'>-find_writable_file(struct cifsInodeInfo *cifs_inode, int flags)</div><div class='del'>-{</div><div class='del'>-	struct cifsFileInfo *cfile;</div><div class='del'>-	int rc;</div><div class='del'>-</div><div class='del'>-	rc = cifs_get_writable_file(cifs_inode, flags, &amp;cfile);</div><div class='del'>-	if (rc)</div><div class='del'>-		cifs_dbg(FYI, "Couldn't find writable handle rc=%d\n", rc);</div><div class='del'>-</div><div class='del'>-	return cfile;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int</div><div class='del'>-cifs_get_writable_path(struct cifs_tcon *tcon, const char *name,</div><div class='del'>-		       int flags,</div><div class='del'>-		       struct cifsFileInfo **ret_file)</div><div class='del'>-{</div><div class='del'>-	struct cifsFileInfo *cfile;</div><div class='del'>-	void *page = alloc_dentry_path();</div><div class='del'>-</div><div class='del'>-	*ret_file = NULL;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;tcon-&gt;open_file_lock);</div><div class='del'>-	list_for_each_entry(cfile, &amp;tcon-&gt;openFileList, tlist) {</div><div class='del'>-		struct cifsInodeInfo *cinode;</div><div class='del'>-		const char *full_path = build_path_from_dentry(cfile-&gt;dentry, page);</div><div class='del'>-		if (IS_ERR(full_path)) {</div><div class='del'>-			spin_unlock(&amp;tcon-&gt;open_file_lock);</div><div class='del'>-			free_dentry_path(page);</div><div class='del'>-			return PTR_ERR(full_path);</div><div class='del'>-		}</div><div class='del'>-		if (strcmp(full_path, name))</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		cinode = CIFS_I(d_inode(cfile-&gt;dentry));</div><div class='del'>-		spin_unlock(&amp;tcon-&gt;open_file_lock);</div><div class='del'>-		free_dentry_path(page);</div><div class='del'>-		return cifs_get_writable_file(cinode, flags, ret_file);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_unlock(&amp;tcon-&gt;open_file_lock);</div><div class='del'>-	free_dentry_path(page);</div><div class='del'>-	return -ENOENT;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int</div><div class='del'>-cifs_get_readable_path(struct cifs_tcon *tcon, const char *name,</div><div class='del'>-		       struct cifsFileInfo **ret_file)</div><div class='del'>-{</div><div class='del'>-	struct cifsFileInfo *cfile;</div><div class='del'>-	void *page = alloc_dentry_path();</div><div class='del'>-</div><div class='del'>-	*ret_file = NULL;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;tcon-&gt;open_file_lock);</div><div class='del'>-	list_for_each_entry(cfile, &amp;tcon-&gt;openFileList, tlist) {</div><div class='del'>-		struct cifsInodeInfo *cinode;</div><div class='del'>-		const char *full_path = build_path_from_dentry(cfile-&gt;dentry, page);</div><div class='del'>-		if (IS_ERR(full_path)) {</div><div class='del'>-			spin_unlock(&amp;tcon-&gt;open_file_lock);</div><div class='del'>-			free_dentry_path(page);</div><div class='del'>-			return PTR_ERR(full_path);</div><div class='del'>-		}</div><div class='del'>-		if (strcmp(full_path, name))</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		cinode = CIFS_I(d_inode(cfile-&gt;dentry));</div><div class='del'>-		spin_unlock(&amp;tcon-&gt;open_file_lock);</div><div class='del'>-		free_dentry_path(page);</div><div class='del'>-		*ret_file = find_readable_file(cinode, 0);</div><div class='del'>-		return *ret_file ? 0 : -ENOENT;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_unlock(&amp;tcon-&gt;open_file_lock);</div><div class='del'>-	free_dentry_path(page);</div><div class='del'>-	return -ENOENT;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int cifs_partialpagewrite(struct page *page, unsigned from, unsigned to)</div><div class='del'>-{</div><div class='del'>-	struct address_space *mapping = page-&gt;mapping;</div><div class='del'>-	loff_t offset = (loff_t)page-&gt;index &lt;&lt; PAGE_SHIFT;</div><div class='del'>-	char *write_data;</div><div class='del'>-	int rc = -EFAULT;</div><div class='del'>-	int bytes_written = 0;</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	struct cifsFileInfo *open_file;</div><div class='del'>-</div><div class='del'>-	if (!mapping || !mapping-&gt;host)</div><div class='del'>-		return -EFAULT;</div><div class='del'>-</div><div class='del'>-	inode = page-&gt;mapping-&gt;host;</div><div class='del'>-</div><div class='del'>-	offset += (loff_t)from;</div><div class='del'>-	write_data = kmap(page);</div><div class='del'>-	write_data += from;</div><div class='del'>-</div><div class='del'>-	if ((to &gt; PAGE_SIZE) || (from &gt; to)) {</div><div class='del'>-		kunmap(page);</div><div class='del'>-		return -EIO;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* racing with truncate? */</div><div class='del'>-	if (offset &gt; mapping-&gt;host-&gt;i_size) {</div><div class='del'>-		kunmap(page);</div><div class='del'>-		return 0; /* don't care */</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* check to make sure that we are not extending the file */</div><div class='del'>-	if (mapping-&gt;host-&gt;i_size - offset &lt; (loff_t)to)</div><div class='del'>-		to = (unsigned)(mapping-&gt;host-&gt;i_size - offset);</div><div class='del'>-</div><div class='del'>-	rc = cifs_get_writable_file(CIFS_I(mapping-&gt;host), FIND_WR_ANY,</div><div class='del'>-				    &amp;open_file);</div><div class='del'>-	if (!rc) {</div><div class='del'>-		bytes_written = cifs_write(open_file, open_file-&gt;pid,</div><div class='del'>-					   write_data, to - from, &amp;offset);</div><div class='del'>-		cifsFileInfo_put(open_file);</div><div class='del'>-		/* Does mm or vfs already set times? */</div><div class='del'>-		inode-&gt;i_atime = inode-&gt;i_mtime = current_time(inode);</div><div class='del'>-		if ((bytes_written &gt; 0) &amp;&amp; (offset))</div><div class='del'>-			rc = 0;</div><div class='del'>-		else if (bytes_written &lt; 0)</div><div class='del'>-			rc = bytes_written;</div><div class='del'>-		else</div><div class='del'>-			rc = -EFAULT;</div><div class='del'>-	} else {</div><div class='del'>-		cifs_dbg(FYI, "No writable handle for write page rc=%d\n", rc);</div><div class='del'>-		if (!is_retryable_error(rc))</div><div class='del'>-			rc = -EIO;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	kunmap(page);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct cifs_writedata *</div><div class='del'>-wdata_alloc_and_fillpages(pgoff_t tofind, struct address_space *mapping,</div><div class='del'>-			  pgoff_t end, pgoff_t *index,</div><div class='del'>-			  unsigned int *found_pages)</div><div class='del'>-{</div><div class='del'>-	struct cifs_writedata *wdata;</div><div class='del'>-</div><div class='del'>-	wdata = cifs_writedata_alloc((unsigned int)tofind,</div><div class='del'>-				     cifs_writev_complete);</div><div class='del'>-	if (!wdata)</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	*found_pages = find_get_pages_range_tag(mapping, index, end,</div><div class='del'>-				PAGECACHE_TAG_DIRTY, tofind, wdata-&gt;pages);</div><div class='del'>-	return wdata;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static unsigned int</div><div class='del'>-wdata_prepare_pages(struct cifs_writedata *wdata, unsigned int found_pages,</div><div class='del'>-		    struct address_space *mapping,</div><div class='del'>-		    struct writeback_control *wbc,</div><div class='del'>-		    pgoff_t end, pgoff_t *index, pgoff_t *next, bool *done)</div><div class='del'>-{</div><div class='del'>-	unsigned int nr_pages = 0, i;</div><div class='del'>-	struct page *page;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; found_pages; i++) {</div><div class='del'>-		page = wdata-&gt;pages[i];</div><div class='del'>-		/*</div><div class='del'>-		 * At this point we hold neither the i_pages lock nor the</div><div class='del'>-		 * page lock: the page may be truncated or invalidated</div><div class='del'>-		 * (changing page-&gt;mapping to NULL), or even swizzled</div><div class='del'>-		 * back from swapper_space to tmpfs file mapping</div><div class='del'>-		 */</div><div class='del'>-</div><div class='del'>-		if (nr_pages == 0)</div><div class='del'>-			lock_page(page);</div><div class='del'>-		else if (!trylock_page(page))</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		if (unlikely(page-&gt;mapping != mapping)) {</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (!wbc-&gt;range_cyclic &amp;&amp; page-&gt;index &gt; end) {</div><div class='del'>-			*done = true;</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (*next &amp;&amp; (page-&gt;index != *next)) {</div><div class='del'>-			/* Not next consecutive page */</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (wbc-&gt;sync_mode != WB_SYNC_NONE)</div><div class='del'>-			wait_on_page_writeback(page);</div><div class='del'>-</div><div class='del'>-		if (PageWriteback(page) ||</div><div class='del'>-				!clear_page_dirty_for_io(page)) {</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * This actually clears the dirty bit in the radix tree.</div><div class='del'>-		 * See cifs_writepage() for more commentary.</div><div class='del'>-		 */</div><div class='del'>-		set_page_writeback(page);</div><div class='del'>-		if (page_offset(page) &gt;= i_size_read(mapping-&gt;host)) {</div><div class='del'>-			*done = true;</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			end_page_writeback(page);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		wdata-&gt;pages[i] = page;</div><div class='del'>-		*next = page-&gt;index + 1;</div><div class='del'>-		++nr_pages;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* reset index to refind any pages skipped */</div><div class='del'>-	if (nr_pages == 0)</div><div class='del'>-		*index = wdata-&gt;pages[0]-&gt;index + 1;</div><div class='del'>-</div><div class='del'>-	/* put any pages we aren't going to use */</div><div class='del'>-	for (i = nr_pages; i &lt; found_pages; i++) {</div><div class='del'>-		put_page(wdata-&gt;pages[i]);</div><div class='del'>-		wdata-&gt;pages[i] = NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return nr_pages;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-wdata_send_pages(struct cifs_writedata *wdata, unsigned int nr_pages,</div><div class='del'>-		 struct address_space *mapping, struct writeback_control *wbc)</div><div class='del'>-{</div><div class='del'>-	int rc;</div><div class='del'>-</div><div class='del'>-	wdata-&gt;sync_mode = wbc-&gt;sync_mode;</div><div class='del'>-	wdata-&gt;nr_pages = nr_pages;</div><div class='del'>-	wdata-&gt;offset = page_offset(wdata-&gt;pages[0]);</div><div class='del'>-	wdata-&gt;pagesz = PAGE_SIZE;</div><div class='del'>-	wdata-&gt;tailsz = min(i_size_read(mapping-&gt;host) -</div><div class='del'>-			page_offset(wdata-&gt;pages[nr_pages - 1]),</div><div class='del'>-			(loff_t)PAGE_SIZE);</div><div class='del'>-	wdata-&gt;bytes = ((nr_pages - 1) * PAGE_SIZE) + wdata-&gt;tailsz;</div><div class='del'>-	wdata-&gt;pid = wdata-&gt;cfile-&gt;pid;</div><div class='del'>-</div><div class='del'>-	rc = adjust_credits(wdata-&gt;server, &amp;wdata-&gt;credits, wdata-&gt;bytes);</div><div class='del'>-	if (rc)</div><div class='del'>-		return rc;</div><div class='del'>-</div><div class='del'>-	if (wdata-&gt;cfile-&gt;invalidHandle)</div><div class='del'>-		rc = -EAGAIN;</div><div class='del'>-	else</div><div class='del'>-		rc = wdata-&gt;server-&gt;ops-&gt;async_writev(wdata,</div><div class='del'>-						      cifs_writedata_release);</div><div class='del'>-</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int cifs_writepages(struct address_space *mapping,</div><div class='del'>-			   struct writeback_control *wbc)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = mapping-&gt;host;</div><div class='del'>-	struct cifs_sb_info *cifs_sb = CIFS_SB(inode-&gt;i_sb);</div><div class='del'>-	struct TCP_Server_Info *server;</div><div class='del'>-	bool done = false, scanned = false, range_whole = false;</div><div class='del'>-	pgoff_t end, index;</div><div class='del'>-	struct cifs_writedata *wdata;</div><div class='del'>-	struct cifsFileInfo *cfile = NULL;</div><div class='del'>-	int rc = 0;</div><div class='del'>-	int saved_rc = 0;</div><div class='del'>-	unsigned int xid;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If wsize is smaller than the page cache size, default to writing</div><div class='del'>-	 * one page at a time via cifs_writepage</div><div class='del'>-	 */</div><div class='del'>-	if (cifs_sb-&gt;ctx-&gt;wsize &lt; PAGE_SIZE)</div><div class='del'>-		return generic_writepages(mapping, wbc);</div><div class='del'>-</div><div class='del'>-	xid = get_xid();</div><div class='del'>-	if (wbc-&gt;range_cyclic) {</div><div class='del'>-		index = mapping-&gt;writeback_index; /* Start from prev offset */</div><div class='del'>-		end = -1;</div><div class='del'>-	} else {</div><div class='del'>-		index = wbc-&gt;range_start &gt;&gt; PAGE_SHIFT;</div><div class='del'>-		end = wbc-&gt;range_end &gt;&gt; PAGE_SHIFT;</div><div class='del'>-		if (wbc-&gt;range_start == 0 &amp;&amp; wbc-&gt;range_end == LLONG_MAX)</div><div class='del'>-			range_whole = true;</div><div class='del'>-		scanned = true;</div><div class='del'>-	}</div><div class='del'>-	server = cifs_pick_channel(cifs_sb_master_tcon(cifs_sb)-&gt;ses);</div><div class='del'>-</div><div class='del'>-retry:</div><div class='del'>-	while (!done &amp;&amp; index &lt;= end) {</div><div class='del'>-		unsigned int i, nr_pages, found_pages, wsize;</div><div class='del'>-		pgoff_t next = 0, tofind, saved_index = index;</div><div class='del'>-		struct cifs_credits credits_on_stack;</div><div class='del'>-		struct cifs_credits *credits = &amp;credits_on_stack;</div><div class='del'>-		int get_file_rc = 0;</div><div class='del'>-</div><div class='del'>-		if (cfile)</div><div class='del'>-			cifsFileInfo_put(cfile);</div><div class='del'>-</div><div class='del'>-		rc = cifs_get_writable_file(CIFS_I(inode), FIND_WR_ANY, &amp;cfile);</div><div class='del'>-</div><div class='del'>-		/* in case of an error store it to return later */</div><div class='del'>-		if (rc)</div><div class='del'>-			get_file_rc = rc;</div><div class='del'>-</div><div class='del'>-		rc = server-&gt;ops-&gt;wait_mtu_credits(server, cifs_sb-&gt;ctx-&gt;wsize,</div><div class='del'>-						   &amp;wsize, credits);</div><div class='del'>-		if (rc != 0) {</div><div class='del'>-			done = true;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		tofind = min((wsize / PAGE_SIZE) - 1, end - index) + 1;</div><div class='del'>-</div><div class='del'>-		wdata = wdata_alloc_and_fillpages(tofind, mapping, end, &amp;index,</div><div class='del'>-						  &amp;found_pages);</div><div class='del'>-		if (!wdata) {</div><div class='del'>-			rc = -ENOMEM;</div><div class='del'>-			done = true;</div><div class='del'>-			add_credits_and_wake_if(server, credits, 0);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (found_pages == 0) {</div><div class='del'>-			kref_put(&amp;wdata-&gt;refcount, cifs_writedata_release);</div><div class='del'>-			add_credits_and_wake_if(server, credits, 0);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		nr_pages = wdata_prepare_pages(wdata, found_pages, mapping, wbc,</div><div class='del'>-					       end, &amp;index, &amp;next, &amp;done);</div><div class='del'>-</div><div class='del'>-		/* nothing to write? */</div><div class='del'>-		if (nr_pages == 0) {</div><div class='del'>-			kref_put(&amp;wdata-&gt;refcount, cifs_writedata_release);</div><div class='del'>-			add_credits_and_wake_if(server, credits, 0);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		wdata-&gt;credits = credits_on_stack;</div><div class='del'>-		wdata-&gt;cfile = cfile;</div><div class='del'>-		wdata-&gt;server = server;</div><div class='del'>-		cfile = NULL;</div><div class='del'>-</div><div class='del'>-		if (!wdata-&gt;cfile) {</div><div class='del'>-			cifs_dbg(VFS, "No writable handle in writepages rc=%d\n",</div><div class='del'>-				 get_file_rc);</div><div class='del'>-			if (is_retryable_error(get_file_rc))</div><div class='del'>-				rc = get_file_rc;</div><div class='del'>-			else</div><div class='del'>-				rc = -EBADF;</div><div class='del'>-		} else</div><div class='del'>-			rc = wdata_send_pages(wdata, nr_pages, mapping, wbc);</div><div class='del'>-</div><div class='del'>-		for (i = 0; i &lt; nr_pages; ++i)</div><div class='del'>-			unlock_page(wdata-&gt;pages[i]);</div><div class='del'>-</div><div class='del'>-		/* send failure -- clean up the mess */</div><div class='del'>-		if (rc != 0) {</div><div class='del'>-			add_credits_and_wake_if(server, &amp;wdata-&gt;credits, 0);</div><div class='del'>-			for (i = 0; i &lt; nr_pages; ++i) {</div><div class='del'>-				if (is_retryable_error(rc))</div><div class='del'>-					redirty_page_for_writepage(wbc,</div><div class='del'>-							   wdata-&gt;pages[i]);</div><div class='del'>-				else</div><div class='del'>-					SetPageError(wdata-&gt;pages[i]);</div><div class='del'>-				end_page_writeback(wdata-&gt;pages[i]);</div><div class='del'>-				put_page(wdata-&gt;pages[i]);</div><div class='del'>-			}</div><div class='del'>-			if (!is_retryable_error(rc))</div><div class='del'>-				mapping_set_error(mapping, rc);</div><div class='del'>-		}</div><div class='del'>-		kref_put(&amp;wdata-&gt;refcount, cifs_writedata_release);</div><div class='del'>-</div><div class='del'>-		if (wbc-&gt;sync_mode == WB_SYNC_ALL &amp;&amp; rc == -EAGAIN) {</div><div class='del'>-			index = saved_index;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/* Return immediately if we received a signal during writing */</div><div class='del'>-		if (is_interrupt_error(rc)) {</div><div class='del'>-			done = true;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (rc != 0 &amp;&amp; saved_rc == 0)</div><div class='del'>-			saved_rc = rc;</div><div class='del'>-</div><div class='del'>-		wbc-&gt;nr_to_write -= nr_pages;</div><div class='del'>-		if (wbc-&gt;nr_to_write &lt;= 0)</div><div class='del'>-			done = true;</div><div class='del'>-</div><div class='del'>-		index = next;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!scanned &amp;&amp; !done) {</div><div class='del'>-		/*</div><div class='del'>-		 * We hit the last page and there is more work to be done: wrap</div><div class='del'>-		 * back to the start of the file</div><div class='del'>-		 */</div><div class='del'>-		scanned = true;</div><div class='del'>-		index = 0;</div><div class='del'>-		goto retry;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (saved_rc != 0)</div><div class='del'>-		rc = saved_rc;</div><div class='del'>-</div><div class='del'>-	if (wbc-&gt;range_cyclic || (range_whole &amp;&amp; wbc-&gt;nr_to_write &gt; 0))</div><div class='del'>-		mapping-&gt;writeback_index = index;</div><div class='del'>-</div><div class='del'>-	if (cfile)</div><div class='del'>-		cifsFileInfo_put(cfile);</div><div class='del'>-	free_xid(xid);</div><div class='del'>-	/* Indication to update ctime and mtime as close is deferred */</div><div class='del'>-	set_bit(CIFS_INO_MODIFIED_ATTR, &amp;CIFS_I(inode)-&gt;flags);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-cifs_writepage_locked(struct page *page, struct writeback_control *wbc)</div><div class='del'>-{</div><div class='del'>-	int rc;</div><div class='del'>-	unsigned int xid;</div><div class='del'>-</div><div class='del'>-	xid = get_xid();</div><div class='del'>-/* BB add check for wbc flags */</div><div class='del'>-	get_page(page);</div><div class='del'>-	if (!PageUptodate(page))</div><div class='del'>-		cifs_dbg(FYI, "ppw - page not up to date\n");</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Set the "writeback" flag, and clear "dirty" in the radix tree.</div><div class='del'>-	 *</div><div class='del'>-	 * A writepage() implementation always needs to do either this,</div><div class='del'>-	 * or re-dirty the page with "redirty_page_for_writepage()" in</div><div class='del'>-	 * the case of a failure.</div><div class='del'>-	 *</div><div class='del'>-	 * Just unlocking the page will cause the radix tree tag-bits</div><div class='del'>-	 * to fail to update with the state of the page correctly.</div><div class='del'>-	 */</div><div class='del'>-	set_page_writeback(page);</div><div class='del'>-retry_write:</div><div class='del'>-	rc = cifs_partialpagewrite(page, 0, PAGE_SIZE);</div><div class='del'>-	if (is_retryable_error(rc)) {</div><div class='del'>-		if (wbc-&gt;sync_mode == WB_SYNC_ALL &amp;&amp; rc == -EAGAIN)</div><div class='del'>-			goto retry_write;</div><div class='del'>-		redirty_page_for_writepage(wbc, page);</div><div class='del'>-	} else if (rc != 0) {</div><div class='del'>-		SetPageError(page);</div><div class='del'>-		mapping_set_error(page-&gt;mapping, rc);</div><div class='del'>-	} else {</div><div class='del'>-		SetPageUptodate(page);</div><div class='del'>-	}</div><div class='del'>-	end_page_writeback(page);</div><div class='del'>-	put_page(page);</div><div class='del'>-	free_xid(xid);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int cifs_writepage(struct page *page, struct writeback_control *wbc)</div><div class='del'>-{</div><div class='del'>-	int rc = cifs_writepage_locked(page, wbc);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int cifs_write_end(struct file *file, struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned copied,</div><div class='del'>-			struct page *page, void *fsdata)</div><div class='del'>-{</div><div class='del'>-	int rc;</div><div class='del'>-	struct inode *inode = mapping-&gt;host;</div><div class='del'>-	struct cifsFileInfo *cfile = file-&gt;private_data;</div><div class='del'>-	struct cifs_sb_info *cifs_sb = CIFS_SB(cfile-&gt;dentry-&gt;d_sb);</div><div class='del'>-	__u32 pid;</div><div class='del'>-</div><div class='del'>-	if (cifs_sb-&gt;mnt_cifs_flags &amp; CIFS_MOUNT_RWPIDFORWARD)</div><div class='del'>-		pid = cfile-&gt;pid;</div><div class='del'>-	else</div><div class='del'>-		pid = current-&gt;tgid;</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "write_end for page %p from pos %lld with %d bytes\n",</div><div class='del'>-		 page, pos, copied);</div><div class='del'>-</div><div class='del'>-	if (PageChecked(page)) {</div><div class='del'>-		if (copied == len)</div><div class='del'>-			SetPageUptodate(page);</div><div class='del'>-		ClearPageChecked(page);</div><div class='del'>-	} else if (!PageUptodate(page) &amp;&amp; copied == PAGE_SIZE)</div><div class='del'>-		SetPageUptodate(page);</div><div class='del'>-</div><div class='del'>-	if (!PageUptodate(page)) {</div><div class='del'>-		char *page_data;</div><div class='del'>-		unsigned offset = pos &amp; (PAGE_SIZE - 1);</div><div class='del'>-		unsigned int xid;</div><div class='del'>-</div><div class='del'>-		xid = get_xid();</div><div class='del'>-		/* this is probably better than directly calling</div><div class='del'>-		   partialpage_write since in this function the file handle is</div><div class='del'>-		   known which we might as well	leverage */</div><div class='del'>-		/* BB check if anything else missing out of ppw</div><div class='del'>-		   such as updating last write time */</div><div class='del'>-		page_data = kmap(page);</div><div class='del'>-		rc = cifs_write(cfile, pid, page_data + offset, copied, &amp;pos);</div><div class='del'>-		/* if (rc &lt; 0) should we set writebehind rc? */</div><div class='del'>-		kunmap(page);</div><div class='del'>-</div><div class='del'>-		free_xid(xid);</div><div class='del'>-	} else {</div><div class='del'>-		rc = copied;</div><div class='del'>-		pos += copied;</div><div class='del'>-		set_page_dirty(page);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (rc &gt; 0) {</div><div class='del'>-		spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-		if (pos &gt; inode-&gt;i_size) {</div><div class='del'>-			i_size_write(inode, pos);</div><div class='del'>-			inode-&gt;i_blocks = (512 - 1 + pos) &gt;&gt; 9;</div><div class='del'>-		}</div><div class='del'>-		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='del'>-	/* Indication to update ctime and mtime as close is deferred */</div><div class='del'>-	set_bit(CIFS_INO_MODIFIED_ATTR, &amp;CIFS_I(inode)-&gt;flags);</div><div class='del'>-</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int cifs_strict_fsync(struct file *file, loff_t start, loff_t end,</div><div class='del'>-		      int datasync)</div><div class='del'>-{</div><div class='del'>-	unsigned int xid;</div><div class='del'>-	int rc = 0;</div><div class='del'>-	struct cifs_tcon *tcon;</div><div class='del'>-	struct TCP_Server_Info *server;</div><div class='del'>-	struct cifsFileInfo *smbfile = file-&gt;private_data;</div><div class='del'>-	struct inode *inode = file_inode(file);</div><div class='del'>-	struct cifs_sb_info *cifs_sb = CIFS_SB(inode-&gt;i_sb);</div><div class='del'>-</div><div class='del'>-	rc = file_write_and_wait_range(file, start, end);</div><div class='del'>-	if (rc) {</div><div class='del'>-		trace_cifs_fsync_err(inode-&gt;i_ino, rc);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	xid = get_xid();</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "Sync file - name: %pD datasync: 0x%x\n",</div><div class='del'>-		 file, datasync);</div><div class='del'>-</div><div class='del'>-	if (!CIFS_CACHE_READ(CIFS_I(inode))) {</div><div class='del'>-		rc = cifs_zap_mapping(inode);</div><div class='del'>-		if (rc) {</div><div class='del'>-			cifs_dbg(FYI, "rc: %d during invalidate phase\n", rc);</div><div class='del'>-			rc = 0; /* don't care about it in fsync */</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	tcon = tlink_tcon(smbfile-&gt;tlink);</div><div class='del'>-	if (!(cifs_sb-&gt;mnt_cifs_flags &amp; CIFS_MOUNT_NOSSYNC)) {</div><div class='del'>-		server = tcon-&gt;ses-&gt;server;</div><div class='del'>-		if (server-&gt;ops-&gt;flush)</div><div class='del'>-			rc = server-&gt;ops-&gt;flush(xid, tcon, &amp;smbfile-&gt;fid);</div><div class='del'>-		else</div><div class='del'>-			rc = -ENOSYS;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	free_xid(xid);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int cifs_fsync(struct file *file, loff_t start, loff_t end, int datasync)</div><div class='del'>-{</div><div class='del'>-	unsigned int xid;</div><div class='del'>-	int rc = 0;</div><div class='del'>-	struct cifs_tcon *tcon;</div><div class='del'>-	struct TCP_Server_Info *server;</div><div class='del'>-	struct cifsFileInfo *smbfile = file-&gt;private_data;</div><div class='del'>-	struct cifs_sb_info *cifs_sb = CIFS_FILE_SB(file);</div><div class='del'>-</div><div class='del'>-	rc = file_write_and_wait_range(file, start, end);</div><div class='del'>-	if (rc) {</div><div class='del'>-		trace_cifs_fsync_err(file_inode(file)-&gt;i_ino, rc);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	xid = get_xid();</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "Sync file - name: %pD datasync: 0x%x\n",</div><div class='del'>-		 file, datasync);</div><div class='del'>-</div><div class='del'>-	tcon = tlink_tcon(smbfile-&gt;tlink);</div><div class='del'>-	if (!(cifs_sb-&gt;mnt_cifs_flags &amp; CIFS_MOUNT_NOSSYNC)) {</div><div class='del'>-		server = tcon-&gt;ses-&gt;server;</div><div class='del'>-		if (server-&gt;ops-&gt;flush)</div><div class='del'>-			rc = server-&gt;ops-&gt;flush(xid, tcon, &amp;smbfile-&gt;fid);</div><div class='del'>-		else</div><div class='del'>-			rc = -ENOSYS;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	free_xid(xid);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * As file closes, flush all cached write data for this inode checking</div><div class='del'>- * for write behind errors.</div><div class='del'>- */</div><div class='del'>-int cifs_flush(struct file *file, fl_owner_t id)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = file_inode(file);</div><div class='del'>-	int rc = 0;</div><div class='del'>-</div><div class='del'>-	if (file-&gt;f_mode &amp; FMODE_WRITE)</div><div class='del'>-		rc = filemap_write_and_wait(inode-&gt;i_mapping);</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "Flush inode %p file %p rc %d\n", inode, file, rc);</div><div class='del'>-	if (rc)</div><div class='del'>-		trace_cifs_flush_err(inode-&gt;i_ino, rc);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-cifs_write_allocate_pages(struct page **pages, unsigned long num_pages)</div><div class='del'>-{</div><div class='del'>-	int rc = 0;</div><div class='del'>-	unsigned long i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; num_pages; i++) {</div><div class='del'>-		pages[i] = alloc_page(GFP_KERNEL|__GFP_HIGHMEM);</div><div class='del'>-		if (!pages[i]) {</div><div class='del'>-			/*</div><div class='del'>-			 * save number of pages we have already allocated and</div><div class='del'>-			 * return with ENOMEM error</div><div class='del'>-			 */</div><div class='del'>-			num_pages = i;</div><div class='del'>-			rc = -ENOMEM;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (rc) {</div><div class='del'>-		for (i = 0; i &lt; num_pages; i++)</div><div class='del'>-			put_page(pages[i]);</div><div class='del'>-	}</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline</div><div class='del'>-size_t get_numpages(const size_t wsize, const size_t len, size_t *cur_len)</div><div class='del'>-{</div><div class='del'>-	size_t num_pages;</div><div class='del'>-	size_t clen;</div><div class='del'>-</div><div class='del'>-	clen = min_t(const size_t, len, wsize);</div><div class='del'>-	num_pages = DIV_ROUND_UP(clen, PAGE_SIZE);</div><div class='del'>-</div><div class='del'>-	if (cur_len)</div><div class='del'>-		*cur_len = clen;</div><div class='del'>-</div><div class='del'>-	return num_pages;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void</div><div class='del'>-cifs_uncached_writedata_release(struct kref *refcount)</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-	struct cifs_writedata *wdata = container_of(refcount,</div><div class='del'>-					struct cifs_writedata, refcount);</div><div class='del'>-</div><div class='del'>-	kref_put(&amp;wdata-&gt;ctx-&gt;refcount, cifs_aio_ctx_release);</div><div class='del'>-	for (i = 0; i &lt; wdata-&gt;nr_pages; i++)</div><div class='del'>-		put_page(wdata-&gt;pages[i]);</div><div class='del'>-	cifs_writedata_release(refcount);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void collect_uncached_write_data(struct cifs_aio_ctx *ctx);</div><div class='del'>-</div><div class='del'>-static void</div><div class='del'>-cifs_uncached_writev_complete(struct work_struct *work)</div><div class='del'>-{</div><div class='del'>-	struct cifs_writedata *wdata = container_of(work,</div><div class='del'>-					struct cifs_writedata, work);</div><div class='del'>-	struct inode *inode = d_inode(wdata-&gt;cfile-&gt;dentry);</div><div class='del'>-	struct cifsInodeInfo *cifsi = CIFS_I(inode);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-	cifs_update_eof(cifsi, wdata-&gt;offset, wdata-&gt;bytes);</div><div class='del'>-	if (cifsi-&gt;server_eof &gt; inode-&gt;i_size)</div><div class='del'>-		i_size_write(inode, cifsi-&gt;server_eof);</div><div class='del'>-	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='del'>-</div><div class='del'>-	complete(&amp;wdata-&gt;done);</div><div class='del'>-	collect_uncached_write_data(wdata-&gt;ctx);</div><div class='del'>-	/* the below call can possibly free the last ref to aio ctx */</div><div class='del'>-	kref_put(&amp;wdata-&gt;refcount, cifs_uncached_writedata_release);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-wdata_fill_from_iovec(struct cifs_writedata *wdata, struct iov_iter *from,</div><div class='del'>-		      size_t *len, unsigned long *num_pages)</div><div class='del'>-{</div><div class='del'>-	size_t save_len, copied, bytes, cur_len = *len;</div><div class='del'>-	unsigned long i, nr_pages = *num_pages;</div><div class='del'>-</div><div class='del'>-	save_len = cur_len;</div><div class='del'>-	for (i = 0; i &lt; nr_pages; i++) {</div><div class='del'>-		bytes = min_t(const size_t, cur_len, PAGE_SIZE);</div><div class='del'>-		copied = copy_page_from_iter(wdata-&gt;pages[i], 0, bytes, from);</div><div class='del'>-		cur_len -= copied;</div><div class='del'>-		/*</div><div class='del'>-		 * If we didn't copy as much as we expected, then that</div><div class='del'>-		 * may mean we trod into an unmapped area. Stop copying</div><div class='del'>-		 * at that point. On the next pass through the big</div><div class='del'>-		 * loop, we'll likely end up getting a zero-length</div><div class='del'>-		 * write and bailing out of it.</div><div class='del'>-		 */</div><div class='del'>-		if (copied &lt; bytes)</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-	cur_len = save_len - cur_len;</div><div class='del'>-	*len = cur_len;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If we have no data to send, then that probably means that</div><div class='del'>-	 * the copy above failed altogether. That's most likely because</div><div class='del'>-	 * the address in the iovec was bogus. Return -EFAULT and let</div><div class='del'>-	 * the caller free anything we allocated and bail out.</div><div class='del'>-	 */</div><div class='del'>-	if (!cur_len)</div><div class='del'>-		return -EFAULT;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * i + 1 now represents the number of pages we actually used in</div><div class='del'>-	 * the copy phase above.</div><div class='del'>-	 */</div><div class='del'>-	*num_pages = i + 1;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-cifs_resend_wdata(struct cifs_writedata *wdata, struct list_head *wdata_list,</div><div class='del'>-	struct cifs_aio_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	unsigned int wsize;</div><div class='del'>-	struct cifs_credits credits;</div><div class='del'>-	int rc;</div><div class='del'>-	struct TCP_Server_Info *server = wdata-&gt;server;</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		if (wdata-&gt;cfile-&gt;invalidHandle) {</div><div class='del'>-			rc = cifs_reopen_file(wdata-&gt;cfile, false);</div><div class='del'>-			if (rc == -EAGAIN)</div><div class='del'>-				continue;</div><div class='del'>-			else if (rc)</div><div class='del'>-				break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Wait for credits to resend this wdata.</div><div class='del'>-		 * Note: we are attempting to resend the whole wdata not in</div><div class='del'>-		 * segments</div><div class='del'>-		 */</div><div class='del'>-		do {</div><div class='del'>-			rc = server-&gt;ops-&gt;wait_mtu_credits(server, wdata-&gt;bytes,</div><div class='del'>-						&amp;wsize, &amp;credits);</div><div class='del'>-			if (rc)</div><div class='del'>-				goto fail;</div><div class='del'>-</div><div class='del'>-			if (wsize &lt; wdata-&gt;bytes) {</div><div class='del'>-				add_credits_and_wake_if(server, &amp;credits, 0);</div><div class='del'>-				msleep(1000);</div><div class='del'>-			}</div><div class='del'>-		} while (wsize &lt; wdata-&gt;bytes);</div><div class='del'>-		wdata-&gt;credits = credits;</div><div class='del'>-</div><div class='del'>-		rc = adjust_credits(server, &amp;wdata-&gt;credits, wdata-&gt;bytes);</div><div class='del'>-</div><div class='del'>-		if (!rc) {</div><div class='del'>-			if (wdata-&gt;cfile-&gt;invalidHandle)</div><div class='del'>-				rc = -EAGAIN;</div><div class='del'>-			else {</div><div class='del'>-#ifdef CONFIG_CIFS_SMB_DIRECT</div><div class='del'>-				if (wdata-&gt;mr) {</div><div class='del'>-					wdata-&gt;mr-&gt;need_invalidate = true;</div><div class='del'>-					smbd_deregister_mr(wdata-&gt;mr);</div><div class='del'>-					wdata-&gt;mr = NULL;</div><div class='del'>-				}</div><div class='del'>-#endif</div><div class='del'>-				rc = server-&gt;ops-&gt;async_writev(wdata,</div><div class='del'>-					cifs_uncached_writedata_release);</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/* If the write was successfully sent, we are done */</div><div class='del'>-		if (!rc) {</div><div class='del'>-			list_add_tail(&amp;wdata-&gt;list, wdata_list);</div><div class='del'>-			return 0;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/* Roll back credits and retry if needed */</div><div class='del'>-		add_credits_and_wake_if(server, &amp;wdata-&gt;credits, 0);</div><div class='del'>-	} while (rc == -EAGAIN);</div><div class='del'>-</div><div class='del'>-fail:</div><div class='del'>-	kref_put(&amp;wdata-&gt;refcount, cifs_uncached_writedata_release);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-cifs_write_from_iter(loff_t offset, size_t len, struct iov_iter *from,</div><div class='del'>-		     struct cifsFileInfo *open_file,</div><div class='del'>-		     struct cifs_sb_info *cifs_sb, struct list_head *wdata_list,</div><div class='del'>-		     struct cifs_aio_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	int rc = 0;</div><div class='del'>-	size_t cur_len;</div><div class='del'>-	unsigned long nr_pages, num_pages, i;</div><div class='del'>-	struct cifs_writedata *wdata;</div><div class='del'>-	struct iov_iter saved_from = *from;</div><div class='del'>-	loff_t saved_offset = offset;</div><div class='del'>-	pid_t pid;</div><div class='del'>-	struct TCP_Server_Info *server;</div><div class='del'>-	struct page **pagevec;</div><div class='del'>-	size_t start;</div><div class='del'>-	unsigned int xid;</div><div class='del'>-</div><div class='del'>-	if (cifs_sb-&gt;mnt_cifs_flags &amp; CIFS_MOUNT_RWPIDFORWARD)</div><div class='del'>-		pid = open_file-&gt;pid;</div><div class='del'>-	else</div><div class='del'>-		pid = current-&gt;tgid;</div><div class='del'>-</div><div class='del'>-	server = cifs_pick_channel(tlink_tcon(open_file-&gt;tlink)-&gt;ses);</div><div class='del'>-	xid = get_xid();</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		unsigned int wsize;</div><div class='del'>-		struct cifs_credits credits_on_stack;</div><div class='del'>-		struct cifs_credits *credits = &amp;credits_on_stack;</div><div class='del'>-</div><div class='del'>-		if (open_file-&gt;invalidHandle) {</div><div class='del'>-			rc = cifs_reopen_file(open_file, false);</div><div class='del'>-			if (rc == -EAGAIN)</div><div class='del'>-				continue;</div><div class='del'>-			else if (rc)</div><div class='del'>-				break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		rc = server-&gt;ops-&gt;wait_mtu_credits(server, cifs_sb-&gt;ctx-&gt;wsize,</div><div class='del'>-						   &amp;wsize, credits);</div><div class='del'>-		if (rc)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		cur_len = min_t(const size_t, len, wsize);</div><div class='del'>-</div><div class='del'>-		if (ctx-&gt;direct_io) {</div><div class='del'>-			ssize_t result;</div><div class='del'>-</div><div class='del'>-			result = iov_iter_get_pages_alloc(</div><div class='del'>-				from, &amp;pagevec, cur_len, &amp;start);</div><div class='del'>-			if (result &lt; 0) {</div><div class='del'>-				cifs_dbg(VFS,</div><div class='del'>-					 "direct_writev couldn't get user pages (rc=%zd) iter type %d iov_offset %zd count %zd\n",</div><div class='del'>-					 result, iov_iter_type(from),</div><div class='del'>-					 from-&gt;iov_offset, from-&gt;count);</div><div class='del'>-				dump_stack();</div><div class='del'>-</div><div class='del'>-				rc = result;</div><div class='del'>-				add_credits_and_wake_if(server, credits, 0);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			cur_len = (size_t)result;</div><div class='del'>-			iov_iter_advance(from, cur_len);</div><div class='del'>-</div><div class='del'>-			nr_pages =</div><div class='del'>-				(cur_len + start + PAGE_SIZE - 1) / PAGE_SIZE;</div><div class='del'>-</div><div class='del'>-			wdata = cifs_writedata_direct_alloc(pagevec,</div><div class='del'>-					     cifs_uncached_writev_complete);</div><div class='del'>-			if (!wdata) {</div><div class='del'>-				rc = -ENOMEM;</div><div class='del'>-				add_credits_and_wake_if(server, credits, 0);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-			wdata-&gt;page_offset = start;</div><div class='del'>-			wdata-&gt;tailsz =</div><div class='del'>-				nr_pages &gt; 1 ?</div><div class='del'>-					cur_len - (PAGE_SIZE - start) -</div><div class='del'>-					(nr_pages - 2) * PAGE_SIZE :</div><div class='del'>-					cur_len;</div><div class='del'>-		} else {</div><div class='del'>-			nr_pages = get_numpages(wsize, len, &amp;cur_len);</div><div class='del'>-			wdata = cifs_writedata_alloc(nr_pages,</div><div class='del'>-					     cifs_uncached_writev_complete);</div><div class='del'>-			if (!wdata) {</div><div class='del'>-				rc = -ENOMEM;</div><div class='del'>-				add_credits_and_wake_if(server, credits, 0);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			rc = cifs_write_allocate_pages(wdata-&gt;pages, nr_pages);</div><div class='del'>-			if (rc) {</div><div class='del'>-				kvfree(wdata-&gt;pages);</div><div class='del'>-				kfree(wdata);</div><div class='del'>-				add_credits_and_wake_if(server, credits, 0);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			num_pages = nr_pages;</div><div class='del'>-			rc = wdata_fill_from_iovec(</div><div class='del'>-				wdata, from, &amp;cur_len, &amp;num_pages);</div><div class='del'>-			if (rc) {</div><div class='del'>-				for (i = 0; i &lt; nr_pages; i++)</div><div class='del'>-					put_page(wdata-&gt;pages[i]);</div><div class='del'>-				kvfree(wdata-&gt;pages);</div><div class='del'>-				kfree(wdata);</div><div class='del'>-				add_credits_and_wake_if(server, credits, 0);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			/*</div><div class='del'>-			 * Bring nr_pages down to the number of pages we</div><div class='del'>-			 * actually used, and free any pages that we didn't use.</div><div class='del'>-			 */</div><div class='del'>-			for ( ; nr_pages &gt; num_pages; nr_pages--)</div><div class='del'>-				put_page(wdata-&gt;pages[nr_pages - 1]);</div><div class='del'>-</div><div class='del'>-			wdata-&gt;tailsz = cur_len - ((nr_pages - 1) * PAGE_SIZE);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		wdata-&gt;sync_mode = WB_SYNC_ALL;</div><div class='del'>-		wdata-&gt;nr_pages = nr_pages;</div><div class='del'>-		wdata-&gt;offset = (__u64)offset;</div><div class='del'>-		wdata-&gt;cfile = cifsFileInfo_get(open_file);</div><div class='del'>-		wdata-&gt;server = server;</div><div class='del'>-		wdata-&gt;pid = pid;</div><div class='del'>-		wdata-&gt;bytes = cur_len;</div><div class='del'>-		wdata-&gt;pagesz = PAGE_SIZE;</div><div class='del'>-		wdata-&gt;credits = credits_on_stack;</div><div class='del'>-		wdata-&gt;ctx = ctx;</div><div class='del'>-		kref_get(&amp;ctx-&gt;refcount);</div><div class='del'>-</div><div class='del'>-		rc = adjust_credits(server, &amp;wdata-&gt;credits, wdata-&gt;bytes);</div><div class='del'>-</div><div class='del'>-		if (!rc) {</div><div class='del'>-			if (wdata-&gt;cfile-&gt;invalidHandle)</div><div class='del'>-				rc = -EAGAIN;</div><div class='del'>-			else</div><div class='del'>-				rc = server-&gt;ops-&gt;async_writev(wdata,</div><div class='del'>-					cifs_uncached_writedata_release);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (rc) {</div><div class='del'>-			add_credits_and_wake_if(server, &amp;wdata-&gt;credits, 0);</div><div class='del'>-			kref_put(&amp;wdata-&gt;refcount,</div><div class='del'>-				 cifs_uncached_writedata_release);</div><div class='del'>-			if (rc == -EAGAIN) {</div><div class='del'>-				*from = saved_from;</div><div class='del'>-				iov_iter_advance(from, offset - saved_offset);</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		list_add_tail(&amp;wdata-&gt;list, wdata_list);</div><div class='del'>-		offset += cur_len;</div><div class='del'>-		len -= cur_len;</div><div class='del'>-	} while (len &gt; 0);</div><div class='del'>-</div><div class='del'>-	free_xid(xid);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void collect_uncached_write_data(struct cifs_aio_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	struct cifs_writedata *wdata, *tmp;</div><div class='del'>-	struct cifs_tcon *tcon;</div><div class='del'>-	struct cifs_sb_info *cifs_sb;</div><div class='del'>-	struct dentry *dentry = ctx-&gt;cfile-&gt;dentry;</div><div class='del'>-	ssize_t rc;</div><div class='del'>-</div><div class='del'>-	tcon = tlink_tcon(ctx-&gt;cfile-&gt;tlink);</div><div class='del'>-	cifs_sb = CIFS_SB(dentry-&gt;d_sb);</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;ctx-&gt;aio_mutex);</div><div class='del'>-</div><div class='del'>-	if (list_empty(&amp;ctx-&gt;list)) {</div><div class='del'>-		mutex_unlock(&amp;ctx-&gt;aio_mutex);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rc = ctx-&gt;rc;</div><div class='del'>-	/*</div><div class='del'>-	 * Wait for and collect replies for any successful sends in order of</div><div class='del'>-	 * increasing offset. Once an error is hit, then return without waiting</div><div class='del'>-	 * for any more replies.</div><div class='del'>-	 */</div><div class='del'>-restart_loop:</div><div class='del'>-	list_for_each_entry_safe(wdata, tmp, &amp;ctx-&gt;list, list) {</div><div class='del'>-		if (!rc) {</div><div class='del'>-			if (!try_wait_for_completion(&amp;wdata-&gt;done)) {</div><div class='del'>-				mutex_unlock(&amp;ctx-&gt;aio_mutex);</div><div class='del'>-				return;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			if (wdata-&gt;result)</div><div class='del'>-				rc = wdata-&gt;result;</div><div class='del'>-			else</div><div class='del'>-				ctx-&gt;total_len += wdata-&gt;bytes;</div><div class='del'>-</div><div class='del'>-			/* resend call if it's a retryable error */</div><div class='del'>-			if (rc == -EAGAIN) {</div><div class='del'>-				struct list_head tmp_list;</div><div class='del'>-				struct iov_iter tmp_from = ctx-&gt;iter;</div><div class='del'>-</div><div class='del'>-				INIT_LIST_HEAD(&amp;tmp_list);</div><div class='del'>-				list_del_init(&amp;wdata-&gt;list);</div><div class='del'>-</div><div class='del'>-				if (ctx-&gt;direct_io)</div><div class='del'>-					rc = cifs_resend_wdata(</div><div class='del'>-						wdata, &amp;tmp_list, ctx);</div><div class='del'>-				else {</div><div class='del'>-					iov_iter_advance(&amp;tmp_from,</div><div class='del'>-						 wdata-&gt;offset - ctx-&gt;pos);</div><div class='del'>-</div><div class='del'>-					rc = cifs_write_from_iter(wdata-&gt;offset,</div><div class='del'>-						wdata-&gt;bytes, &amp;tmp_from,</div><div class='del'>-						ctx-&gt;cfile, cifs_sb, &amp;tmp_list,</div><div class='del'>-						ctx);</div><div class='del'>-</div><div class='del'>-					kref_put(&amp;wdata-&gt;refcount,</div><div class='del'>-						cifs_uncached_writedata_release);</div><div class='del'>-				}</div><div class='del'>-</div><div class='del'>-				list_splice(&amp;tmp_list, &amp;ctx-&gt;list);</div><div class='del'>-				goto restart_loop;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-		list_del_init(&amp;wdata-&gt;list);</div><div class='del'>-		kref_put(&amp;wdata-&gt;refcount, cifs_uncached_writedata_release);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	cifs_stats_bytes_written(tcon, ctx-&gt;total_len);</div><div class='del'>-	set_bit(CIFS_INO_INVALID_MAPPING, &amp;CIFS_I(dentry-&gt;d_inode)-&gt;flags);</div><div class='del'>-</div><div class='del'>-	ctx-&gt;rc = (rc == 0) ? ctx-&gt;total_len : rc;</div><div class='del'>-</div><div class='del'>-	mutex_unlock(&amp;ctx-&gt;aio_mutex);</div><div class='del'>-</div><div class='del'>-	if (ctx-&gt;iocb &amp;&amp; ctx-&gt;iocb-&gt;ki_complete)</div><div class='del'>-		ctx-&gt;iocb-&gt;ki_complete(ctx-&gt;iocb, ctx-&gt;rc);</div><div class='del'>-	else</div><div class='del'>-		complete(&amp;ctx-&gt;done);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static ssize_t __cifs_writev(</div><div class='del'>-	struct kiocb *iocb, struct iov_iter *from, bool direct)</div><div class='del'>-{</div><div class='del'>-	struct file *file = iocb-&gt;ki_filp;</div><div class='del'>-	ssize_t total_written = 0;</div><div class='del'>-	struct cifsFileInfo *cfile;</div><div class='del'>-	struct cifs_tcon *tcon;</div><div class='del'>-	struct cifs_sb_info *cifs_sb;</div><div class='del'>-	struct cifs_aio_ctx *ctx;</div><div class='del'>-	struct iov_iter saved_from = *from;</div><div class='del'>-	size_t len = iov_iter_count(from);</div><div class='del'>-	int rc;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * iov_iter_get_pages_alloc doesn't work with ITER_KVEC.</div><div class='del'>-	 * In this case, fall back to non-direct write function.</div><div class='del'>-	 * this could be improved by getting pages directly in ITER_KVEC</div><div class='del'>-	 */</div><div class='del'>-	if (direct &amp;&amp; iov_iter_is_kvec(from)) {</div><div class='del'>-		cifs_dbg(FYI, "use non-direct cifs_writev for kvec I/O\n");</div><div class='del'>-		direct = false;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rc = generic_write_checks(iocb, from);</div><div class='del'>-	if (rc &lt;= 0)</div><div class='del'>-		return rc;</div><div class='del'>-</div><div class='del'>-	cifs_sb = CIFS_FILE_SB(file);</div><div class='del'>-	cfile = file-&gt;private_data;</div><div class='del'>-	tcon = tlink_tcon(cfile-&gt;tlink);</div><div class='del'>-</div><div class='del'>-	if (!tcon-&gt;ses-&gt;server-&gt;ops-&gt;async_writev)</div><div class='del'>-		return -ENOSYS;</div><div class='del'>-</div><div class='del'>-	ctx = cifs_aio_ctx_alloc();</div><div class='del'>-	if (!ctx)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	ctx-&gt;cfile = cifsFileInfo_get(cfile);</div><div class='del'>-</div><div class='del'>-	if (!is_sync_kiocb(iocb))</div><div class='del'>-		ctx-&gt;iocb = iocb;</div><div class='del'>-</div><div class='del'>-	ctx-&gt;pos = iocb-&gt;ki_pos;</div><div class='del'>-</div><div class='del'>-	if (direct) {</div><div class='del'>-		ctx-&gt;direct_io = true;</div><div class='del'>-		ctx-&gt;iter = *from;</div><div class='del'>-		ctx-&gt;len = len;</div><div class='del'>-	} else {</div><div class='del'>-		rc = setup_aio_ctx_iter(ctx, from, WRITE);</div><div class='del'>-		if (rc) {</div><div class='del'>-			kref_put(&amp;ctx-&gt;refcount, cifs_aio_ctx_release);</div><div class='del'>-			return rc;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* grab a lock here due to read response handlers can access ctx */</div><div class='del'>-	mutex_lock(&amp;ctx-&gt;aio_mutex);</div><div class='del'>-</div><div class='del'>-	rc = cifs_write_from_iter(iocb-&gt;ki_pos, ctx-&gt;len, &amp;saved_from,</div><div class='del'>-				  cfile, cifs_sb, &amp;ctx-&gt;list, ctx);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If at least one write was successfully sent, then discard any rc</div><div class='del'>-	 * value from the later writes. If the other write succeeds, then</div><div class='del'>-	 * we'll end up returning whatever was written. If it fails, then</div><div class='del'>-	 * we'll get a new rc value from that.</div><div class='del'>-	 */</div><div class='del'>-	if (!list_empty(&amp;ctx-&gt;list))</div><div class='del'>-		rc = 0;</div><div class='del'>-</div><div class='del'>-	mutex_unlock(&amp;ctx-&gt;aio_mutex);</div><div class='del'>-</div><div class='del'>-	if (rc) {</div><div class='del'>-		kref_put(&amp;ctx-&gt;refcount, cifs_aio_ctx_release);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!is_sync_kiocb(iocb)) {</div><div class='del'>-		kref_put(&amp;ctx-&gt;refcount, cifs_aio_ctx_release);</div><div class='del'>-		return -EIOCBQUEUED;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rc = wait_for_completion_killable(&amp;ctx-&gt;done);</div><div class='del'>-	if (rc) {</div><div class='del'>-		mutex_lock(&amp;ctx-&gt;aio_mutex);</div><div class='del'>-		ctx-&gt;rc = rc = -EINTR;</div><div class='del'>-		total_written = ctx-&gt;total_len;</div><div class='del'>-		mutex_unlock(&amp;ctx-&gt;aio_mutex);</div><div class='del'>-	} else {</div><div class='del'>-		rc = ctx-&gt;rc;</div><div class='del'>-		total_written = ctx-&gt;total_len;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	kref_put(&amp;ctx-&gt;refcount, cifs_aio_ctx_release);</div><div class='del'>-</div><div class='del'>-	if (unlikely(!total_written))</div><div class='del'>-		return rc;</div><div class='del'>-</div><div class='del'>-	iocb-&gt;ki_pos += total_written;</div><div class='del'>-	return total_written;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-ssize_t cifs_direct_writev(struct kiocb *iocb, struct iov_iter *from)</div><div class='del'>-{</div><div class='del'>-	return __cifs_writev(iocb, from, true);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-ssize_t cifs_user_writev(struct kiocb *iocb, struct iov_iter *from)</div><div class='del'>-{</div><div class='del'>-	return __cifs_writev(iocb, from, false);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static ssize_t</div><div class='del'>-cifs_writev(struct kiocb *iocb, struct iov_iter *from)</div><div class='del'>-{</div><div class='del'>-	struct file *file = iocb-&gt;ki_filp;</div><div class='del'>-	struct cifsFileInfo *cfile = (struct cifsFileInfo *)file-&gt;private_data;</div><div class='del'>-	struct inode *inode = file-&gt;f_mapping-&gt;host;</div><div class='del'>-	struct cifsInodeInfo *cinode = CIFS_I(inode);</div><div class='del'>-	struct TCP_Server_Info *server = tlink_tcon(cfile-&gt;tlink)-&gt;ses-&gt;server;</div><div class='del'>-	ssize_t rc;</div><div class='del'>-</div><div class='del'>-	inode_lock(inode);</div><div class='del'>-	/*</div><div class='del'>-	 * We need to hold the sem to be sure nobody modifies lock list</div><div class='del'>-	 * with a brlock that prevents writing.</div><div class='del'>-	 */</div><div class='del'>-	down_read(&amp;cinode-&gt;lock_sem);</div><div class='del'>-</div><div class='del'>-	rc = generic_write_checks(iocb, from);</div><div class='del'>-	if (rc &lt;= 0)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	if (!cifs_find_lock_conflict(cfile, iocb-&gt;ki_pos, iov_iter_count(from),</div><div class='del'>-				     server-&gt;vals-&gt;exclusive_lock_type, 0,</div><div class='del'>-				     NULL, CIFS_WRITE_OP))</div><div class='del'>-		rc = __generic_file_write_iter(iocb, from);</div><div class='del'>-	else</div><div class='del'>-		rc = -EACCES;</div><div class='del'>-out:</div><div class='del'>-	up_read(&amp;cinode-&gt;lock_sem);</div><div class='del'>-	inode_unlock(inode);</div><div class='del'>-</div><div class='del'>-	if (rc &gt; 0)</div><div class='del'>-		rc = generic_write_sync(iocb, rc);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-ssize_t</div><div class='del'>-cifs_strict_writev(struct kiocb *iocb, struct iov_iter *from)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='del'>-	struct cifsInodeInfo *cinode = CIFS_I(inode);</div><div class='del'>-	struct cifs_sb_info *cifs_sb = CIFS_SB(inode-&gt;i_sb);</div><div class='del'>-	struct cifsFileInfo *cfile = (struct cifsFileInfo *)</div><div class='del'>-						iocb-&gt;ki_filp-&gt;private_data;</div><div class='del'>-	struct cifs_tcon *tcon = tlink_tcon(cfile-&gt;tlink);</div><div class='del'>-	ssize_t written;</div><div class='del'>-</div><div class='del'>-	written = cifs_get_writer(cinode);</div><div class='del'>-	if (written)</div><div class='del'>-		return written;</div><div class='del'>-</div><div class='del'>-	if (CIFS_CACHE_WRITE(cinode)) {</div><div class='del'>-		if (cap_unix(tcon-&gt;ses) &amp;&amp;</div><div class='del'>-		(CIFS_UNIX_FCNTL_CAP &amp; le64_to_cpu(tcon-&gt;fsUnixInfo.Capability))</div><div class='del'>-		  &amp;&amp; ((cifs_sb-&gt;mnt_cifs_flags &amp; CIFS_MOUNT_NOPOSIXBRL) == 0)) {</div><div class='del'>-			written = generic_file_write_iter(iocb, from);</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		written = cifs_writev(iocb, from);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	/*</div><div class='del'>-	 * For non-oplocked files in strict cache mode we need to write the data</div><div class='del'>-	 * to the server exactly from the pos to pos+len-1 rather than flush all</div><div class='del'>-	 * affected pages because it may cause a error with mandatory locks on</div><div class='del'>-	 * these pages but not on the region from pos to ppos+len-1.</div><div class='del'>-	 */</div><div class='del'>-	written = cifs_user_writev(iocb, from);</div><div class='del'>-	if (CIFS_CACHE_READ(cinode)) {</div><div class='del'>-		/*</div><div class='del'>-		 * We have read level caching and we have just sent a write</div><div class='del'>-		 * request to the server thus making data in the cache stale.</div><div class='del'>-		 * Zap the cache and set oplock/lease level to NONE to avoid</div><div class='del'>-		 * reading stale data from the cache. All subsequent read</div><div class='del'>-		 * operations will read new data from the server.</div><div class='del'>-		 */</div><div class='del'>-		cifs_zap_mapping(inode);</div><div class='del'>-		cifs_dbg(FYI, "Set Oplock/Lease to NONE for inode=%p after write\n",</div><div class='del'>-			 inode);</div><div class='del'>-		cinode-&gt;oplock = 0;</div><div class='del'>-	}</div><div class='del'>-out:</div><div class='del'>-	cifs_put_writer(cinode);</div><div class='del'>-	return written;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct cifs_readdata *</div><div class='del'>-cifs_readdata_direct_alloc(struct page **pages, work_func_t complete)</div><div class='del'>-{</div><div class='del'>-	struct cifs_readdata *rdata;</div><div class='del'>-</div><div class='del'>-	rdata = kzalloc(sizeof(*rdata), GFP_KERNEL);</div><div class='del'>-	if (rdata != NULL) {</div><div class='del'>-		rdata-&gt;pages = pages;</div><div class='del'>-		kref_init(&amp;rdata-&gt;refcount);</div><div class='del'>-		INIT_LIST_HEAD(&amp;rdata-&gt;list);</div><div class='del'>-		init_completion(&amp;rdata-&gt;done);</div><div class='del'>-		INIT_WORK(&amp;rdata-&gt;work, complete);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return rdata;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct cifs_readdata *</div><div class='del'>-cifs_readdata_alloc(unsigned int nr_pages, work_func_t complete)</div><div class='del'>-{</div><div class='del'>-	struct page **pages =</div><div class='del'>-		kcalloc(nr_pages, sizeof(struct page *), GFP_KERNEL);</div><div class='del'>-	struct cifs_readdata *ret = NULL;</div><div class='del'>-</div><div class='del'>-	if (pages) {</div><div class='del'>-		ret = cifs_readdata_direct_alloc(pages, complete);</div><div class='del'>-		if (!ret)</div><div class='del'>-			kfree(pages);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void</div><div class='del'>-cifs_readdata_release(struct kref *refcount)</div><div class='del'>-{</div><div class='del'>-	struct cifs_readdata *rdata = container_of(refcount,</div><div class='del'>-					struct cifs_readdata, refcount);</div><div class='del'>-#ifdef CONFIG_CIFS_SMB_DIRECT</div><div class='del'>-	if (rdata-&gt;mr) {</div><div class='del'>-		smbd_deregister_mr(rdata-&gt;mr);</div><div class='del'>-		rdata-&gt;mr = NULL;</div><div class='del'>-	}</div><div class='del'>-#endif</div><div class='del'>-	if (rdata-&gt;cfile)</div><div class='del'>-		cifsFileInfo_put(rdata-&gt;cfile);</div><div class='del'>-</div><div class='del'>-	kvfree(rdata-&gt;pages);</div><div class='del'>-	kfree(rdata);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-cifs_read_allocate_pages(struct cifs_readdata *rdata, unsigned int nr_pages)</div><div class='del'>-{</div><div class='del'>-	int rc = 0;</div><div class='del'>-	struct page *page;</div><div class='del'>-	unsigned int i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; nr_pages; i++) {</div><div class='del'>-		page = alloc_page(GFP_KERNEL|__GFP_HIGHMEM);</div><div class='del'>-		if (!page) {</div><div class='del'>-			rc = -ENOMEM;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		rdata-&gt;pages[i] = page;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (rc) {</div><div class='del'>-		unsigned int nr_page_failed = i;</div><div class='del'>-</div><div class='del'>-		for (i = 0; i &lt; nr_page_failed; i++) {</div><div class='del'>-			put_page(rdata-&gt;pages[i]);</div><div class='del'>-			rdata-&gt;pages[i] = NULL;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void</div><div class='del'>-cifs_uncached_readdata_release(struct kref *refcount)</div><div class='del'>-{</div><div class='del'>-	struct cifs_readdata *rdata = container_of(refcount,</div><div class='del'>-					struct cifs_readdata, refcount);</div><div class='del'>-	unsigned int i;</div><div class='del'>-</div><div class='del'>-	kref_put(&amp;rdata-&gt;ctx-&gt;refcount, cifs_aio_ctx_release);</div><div class='del'>-	for (i = 0; i &lt; rdata-&gt;nr_pages; i++) {</div><div class='del'>-		put_page(rdata-&gt;pages[i]);</div><div class='del'>-	}</div><div class='del'>-	cifs_readdata_release(refcount);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * cifs_readdata_to_iov - copy data from pages in response to an iovec</div><div class='del'>- * @rdata:	the readdata response with list of pages holding data</div><div class='del'>- * @iter:	destination for our data</div><div class='del'>- *</div><div class='del'>- * This function copies data from a list of pages in a readdata response into</div><div class='del'>- * an array of iovecs. It will first calculate where the data should go</div><div class='del'>- * based on the info in the readdata and then copy the data into that spot.</div><div class='del'>- */</div><div class='del'>-static int</div><div class='del'>-cifs_readdata_to_iov(struct cifs_readdata *rdata, struct iov_iter *iter)</div><div class='del'>-{</div><div class='del'>-	size_t remaining = rdata-&gt;got_bytes;</div><div class='del'>-	unsigned int i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; rdata-&gt;nr_pages; i++) {</div><div class='del'>-		struct page *page = rdata-&gt;pages[i];</div><div class='del'>-		size_t copy = min_t(size_t, remaining, PAGE_SIZE);</div><div class='del'>-		size_t written;</div><div class='del'>-</div><div class='del'>-		if (unlikely(iov_iter_is_pipe(iter))) {</div><div class='del'>-			void *addr = kmap_atomic(page);</div><div class='del'>-</div><div class='del'>-			written = copy_to_iter(addr, copy, iter);</div><div class='del'>-			kunmap_atomic(addr);</div><div class='del'>-		} else</div><div class='del'>-			written = copy_page_to_iter(page, 0, copy, iter);</div><div class='del'>-		remaining -= written;</div><div class='del'>-		if (written &lt; copy &amp;&amp; iov_iter_count(iter) &gt; 0)</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-	return remaining ? -EFAULT : 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void collect_uncached_read_data(struct cifs_aio_ctx *ctx);</div><div class='del'>-</div><div class='del'>-static void</div><div class='del'>-cifs_uncached_readv_complete(struct work_struct *work)</div><div class='del'>-{</div><div class='del'>-	struct cifs_readdata *rdata = container_of(work,</div><div class='del'>-						struct cifs_readdata, work);</div><div class='del'>-</div><div class='del'>-	complete(&amp;rdata-&gt;done);</div><div class='del'>-	collect_uncached_read_data(rdata-&gt;ctx);</div><div class='del'>-	/* the below call can possibly free the last ref to aio ctx */</div><div class='del'>-	kref_put(&amp;rdata-&gt;refcount, cifs_uncached_readdata_release);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-uncached_fill_pages(struct TCP_Server_Info *server,</div><div class='del'>-		    struct cifs_readdata *rdata, struct iov_iter *iter,</div><div class='del'>-		    unsigned int len)</div><div class='del'>-{</div><div class='del'>-	int result = 0;</div><div class='del'>-	unsigned int i;</div><div class='del'>-	unsigned int nr_pages = rdata-&gt;nr_pages;</div><div class='del'>-	unsigned int page_offset = rdata-&gt;page_offset;</div><div class='del'>-</div><div class='del'>-	rdata-&gt;got_bytes = 0;</div><div class='del'>-	rdata-&gt;tailsz = PAGE_SIZE;</div><div class='del'>-	for (i = 0; i &lt; nr_pages; i++) {</div><div class='del'>-		struct page *page = rdata-&gt;pages[i];</div><div class='del'>-		size_t n;</div><div class='del'>-		unsigned int segment_size = rdata-&gt;pagesz;</div><div class='del'>-</div><div class='del'>-		if (i == 0)</div><div class='del'>-			segment_size -= page_offset;</div><div class='del'>-		else</div><div class='del'>-			page_offset = 0;</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-		if (len &lt;= 0) {</div><div class='del'>-			/* no need to hold page hostage */</div><div class='del'>-			rdata-&gt;pages[i] = NULL;</div><div class='del'>-			rdata-&gt;nr_pages--;</div><div class='del'>-			put_page(page);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		n = len;</div><div class='del'>-		if (len &gt;= segment_size)</div><div class='del'>-			/* enough data to fill the page */</div><div class='del'>-			n = segment_size;</div><div class='del'>-		else</div><div class='del'>-			rdata-&gt;tailsz = len;</div><div class='del'>-		len -= n;</div><div class='del'>-</div><div class='del'>-		if (iter)</div><div class='del'>-			result = copy_page_from_iter(</div><div class='del'>-					page, page_offset, n, iter);</div><div class='del'>-#ifdef CONFIG_CIFS_SMB_DIRECT</div><div class='del'>-		else if (rdata-&gt;mr)</div><div class='del'>-			result = n;</div><div class='del'>-#endif</div><div class='del'>-		else</div><div class='del'>-			result = cifs_read_page_from_socket(</div><div class='del'>-					server, page, page_offset, n);</div><div class='del'>-		if (result &lt; 0)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		rdata-&gt;got_bytes += result;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return rdata-&gt;got_bytes &gt; 0 &amp;&amp; result != -ECONNABORTED ?</div><div class='del'>-						rdata-&gt;got_bytes : result;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-cifs_uncached_read_into_pages(struct TCP_Server_Info *server,</div><div class='del'>-			      struct cifs_readdata *rdata, unsigned int len)</div><div class='del'>-{</div><div class='del'>-	return uncached_fill_pages(server, rdata, NULL, len);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-cifs_uncached_copy_into_pages(struct TCP_Server_Info *server,</div><div class='del'>-			      struct cifs_readdata *rdata,</div><div class='del'>-			      struct iov_iter *iter)</div><div class='del'>-{</div><div class='del'>-	return uncached_fill_pages(server, rdata, iter, iter-&gt;count);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int cifs_resend_rdata(struct cifs_readdata *rdata,</div><div class='del'>-			struct list_head *rdata_list,</div><div class='del'>-			struct cifs_aio_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	unsigned int rsize;</div><div class='del'>-	struct cifs_credits credits;</div><div class='del'>-	int rc;</div><div class='del'>-	struct TCP_Server_Info *server;</div><div class='del'>-</div><div class='del'>-	/* XXX: should we pick a new channel here? */</div><div class='del'>-	server = rdata-&gt;server;</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		if (rdata-&gt;cfile-&gt;invalidHandle) {</div><div class='del'>-			rc = cifs_reopen_file(rdata-&gt;cfile, true);</div><div class='del'>-			if (rc == -EAGAIN)</div><div class='del'>-				continue;</div><div class='del'>-			else if (rc)</div><div class='del'>-				break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Wait for credits to resend this rdata.</div><div class='del'>-		 * Note: we are attempting to resend the whole rdata not in</div><div class='del'>-		 * segments</div><div class='del'>-		 */</div><div class='del'>-		do {</div><div class='del'>-			rc = server-&gt;ops-&gt;wait_mtu_credits(server, rdata-&gt;bytes,</div><div class='del'>-						&amp;rsize, &amp;credits);</div><div class='del'>-</div><div class='del'>-			if (rc)</div><div class='del'>-				goto fail;</div><div class='del'>-</div><div class='del'>-			if (rsize &lt; rdata-&gt;bytes) {</div><div class='del'>-				add_credits_and_wake_if(server, &amp;credits, 0);</div><div class='del'>-				msleep(1000);</div><div class='del'>-			}</div><div class='del'>-		} while (rsize &lt; rdata-&gt;bytes);</div><div class='del'>-		rdata-&gt;credits = credits;</div><div class='del'>-</div><div class='del'>-		rc = adjust_credits(server, &amp;rdata-&gt;credits, rdata-&gt;bytes);</div><div class='del'>-		if (!rc) {</div><div class='del'>-			if (rdata-&gt;cfile-&gt;invalidHandle)</div><div class='del'>-				rc = -EAGAIN;</div><div class='del'>-			else {</div><div class='del'>-#ifdef CONFIG_CIFS_SMB_DIRECT</div><div class='del'>-				if (rdata-&gt;mr) {</div><div class='del'>-					rdata-&gt;mr-&gt;need_invalidate = true;</div><div class='del'>-					smbd_deregister_mr(rdata-&gt;mr);</div><div class='del'>-					rdata-&gt;mr = NULL;</div><div class='del'>-				}</div><div class='del'>-#endif</div><div class='del'>-				rc = server-&gt;ops-&gt;async_readv(rdata);</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/* If the read was successfully sent, we are done */</div><div class='del'>-		if (!rc) {</div><div class='del'>-			/* Add to aio pending list */</div><div class='del'>-			list_add_tail(&amp;rdata-&gt;list, rdata_list);</div><div class='del'>-			return 0;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/* Roll back credits and retry if needed */</div><div class='del'>-		add_credits_and_wake_if(server, &amp;rdata-&gt;credits, 0);</div><div class='del'>-	} while (rc == -EAGAIN);</div><div class='del'>-</div><div class='del'>-fail:</div><div class='del'>-	kref_put(&amp;rdata-&gt;refcount, cifs_uncached_readdata_release);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-cifs_send_async_read(loff_t offset, size_t len, struct cifsFileInfo *open_file,</div><div class='del'>-		     struct cifs_sb_info *cifs_sb, struct list_head *rdata_list,</div><div class='del'>-		     struct cifs_aio_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	struct cifs_readdata *rdata;</div><div class='del'>-	unsigned int npages, rsize;</div><div class='del'>-	struct cifs_credits credits_on_stack;</div><div class='del'>-	struct cifs_credits *credits = &amp;credits_on_stack;</div><div class='del'>-	size_t cur_len;</div><div class='del'>-	int rc;</div><div class='del'>-	pid_t pid;</div><div class='del'>-	struct TCP_Server_Info *server;</div><div class='del'>-	struct page **pagevec;</div><div class='del'>-	size_t start;</div><div class='del'>-	struct iov_iter direct_iov = ctx-&gt;iter;</div><div class='del'>-</div><div class='del'>-	server = cifs_pick_channel(tlink_tcon(open_file-&gt;tlink)-&gt;ses);</div><div class='del'>-</div><div class='del'>-	if (cifs_sb-&gt;mnt_cifs_flags &amp; CIFS_MOUNT_RWPIDFORWARD)</div><div class='del'>-		pid = open_file-&gt;pid;</div><div class='del'>-	else</div><div class='del'>-		pid = current-&gt;tgid;</div><div class='del'>-</div><div class='del'>-	if (ctx-&gt;direct_io)</div><div class='del'>-		iov_iter_advance(&amp;direct_iov, offset - ctx-&gt;pos);</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		if (open_file-&gt;invalidHandle) {</div><div class='del'>-			rc = cifs_reopen_file(open_file, true);</div><div class='del'>-			if (rc == -EAGAIN)</div><div class='del'>-				continue;</div><div class='del'>-			else if (rc)</div><div class='del'>-				break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		rc = server-&gt;ops-&gt;wait_mtu_credits(server, cifs_sb-&gt;ctx-&gt;rsize,</div><div class='del'>-						   &amp;rsize, credits);</div><div class='del'>-		if (rc)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		cur_len = min_t(const size_t, len, rsize);</div><div class='del'>-</div><div class='del'>-		if (ctx-&gt;direct_io) {</div><div class='del'>-			ssize_t result;</div><div class='del'>-</div><div class='del'>-			result = iov_iter_get_pages_alloc(</div><div class='del'>-					&amp;direct_iov, &amp;pagevec,</div><div class='del'>-					cur_len, &amp;start);</div><div class='del'>-			if (result &lt; 0) {</div><div class='del'>-				cifs_dbg(VFS,</div><div class='del'>-					 "Couldn't get user pages (rc=%zd) iter type %d iov_offset %zd count %zd\n",</div><div class='del'>-					 result, iov_iter_type(&amp;direct_iov),</div><div class='del'>-					 direct_iov.iov_offset,</div><div class='del'>-					 direct_iov.count);</div><div class='del'>-				dump_stack();</div><div class='del'>-</div><div class='del'>-				rc = result;</div><div class='del'>-				add_credits_and_wake_if(server, credits, 0);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			cur_len = (size_t)result;</div><div class='del'>-			iov_iter_advance(&amp;direct_iov, cur_len);</div><div class='del'>-</div><div class='del'>-			rdata = cifs_readdata_direct_alloc(</div><div class='del'>-					pagevec, cifs_uncached_readv_complete);</div><div class='del'>-			if (!rdata) {</div><div class='del'>-				add_credits_and_wake_if(server, credits, 0);</div><div class='del'>-				rc = -ENOMEM;</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			npages = (cur_len + start + PAGE_SIZE-1) / PAGE_SIZE;</div><div class='del'>-			rdata-&gt;page_offset = start;</div><div class='del'>-			rdata-&gt;tailsz = npages &gt; 1 ?</div><div class='del'>-				cur_len-(PAGE_SIZE-start)-(npages-2)*PAGE_SIZE :</div><div class='del'>-				cur_len;</div><div class='del'>-</div><div class='del'>-		} else {</div><div class='del'>-</div><div class='del'>-			npages = DIV_ROUND_UP(cur_len, PAGE_SIZE);</div><div class='del'>-			/* allocate a readdata struct */</div><div class='del'>-			rdata = cifs_readdata_alloc(npages,</div><div class='del'>-					    cifs_uncached_readv_complete);</div><div class='del'>-			if (!rdata) {</div><div class='del'>-				add_credits_and_wake_if(server, credits, 0);</div><div class='del'>-				rc = -ENOMEM;</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			rc = cifs_read_allocate_pages(rdata, npages);</div><div class='del'>-			if (rc) {</div><div class='del'>-				kvfree(rdata-&gt;pages);</div><div class='del'>-				kfree(rdata);</div><div class='del'>-				add_credits_and_wake_if(server, credits, 0);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			rdata-&gt;tailsz = PAGE_SIZE;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		rdata-&gt;server = server;</div><div class='del'>-		rdata-&gt;cfile = cifsFileInfo_get(open_file);</div><div class='del'>-		rdata-&gt;nr_pages = npages;</div><div class='del'>-		rdata-&gt;offset = offset;</div><div class='del'>-		rdata-&gt;bytes = cur_len;</div><div class='del'>-		rdata-&gt;pid = pid;</div><div class='del'>-		rdata-&gt;pagesz = PAGE_SIZE;</div><div class='del'>-		rdata-&gt;read_into_pages = cifs_uncached_read_into_pages;</div><div class='del'>-		rdata-&gt;copy_into_pages = cifs_uncached_copy_into_pages;</div><div class='del'>-		rdata-&gt;credits = credits_on_stack;</div><div class='del'>-		rdata-&gt;ctx = ctx;</div><div class='del'>-		kref_get(&amp;ctx-&gt;refcount);</div><div class='del'>-</div><div class='del'>-		rc = adjust_credits(server, &amp;rdata-&gt;credits, rdata-&gt;bytes);</div><div class='del'>-</div><div class='del'>-		if (!rc) {</div><div class='del'>-			if (rdata-&gt;cfile-&gt;invalidHandle)</div><div class='del'>-				rc = -EAGAIN;</div><div class='del'>-			else</div><div class='del'>-				rc = server-&gt;ops-&gt;async_readv(rdata);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (rc) {</div><div class='del'>-			add_credits_and_wake_if(server, &amp;rdata-&gt;credits, 0);</div><div class='del'>-			kref_put(&amp;rdata-&gt;refcount,</div><div class='del'>-				cifs_uncached_readdata_release);</div><div class='del'>-			if (rc == -EAGAIN) {</div><div class='del'>-				iov_iter_revert(&amp;direct_iov, cur_len);</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		list_add_tail(&amp;rdata-&gt;list, rdata_list);</div><div class='del'>-		offset += cur_len;</div><div class='del'>-		len -= cur_len;</div><div class='del'>-	} while (len &gt; 0);</div><div class='del'>-</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void</div><div class='del'>-collect_uncached_read_data(struct cifs_aio_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	struct cifs_readdata *rdata, *tmp;</div><div class='del'>-	struct iov_iter *to = &amp;ctx-&gt;iter;</div><div class='del'>-	struct cifs_sb_info *cifs_sb;</div><div class='del'>-	int rc;</div><div class='del'>-</div><div class='del'>-	cifs_sb = CIFS_SB(ctx-&gt;cfile-&gt;dentry-&gt;d_sb);</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;ctx-&gt;aio_mutex);</div><div class='del'>-</div><div class='del'>-	if (list_empty(&amp;ctx-&gt;list)) {</div><div class='del'>-		mutex_unlock(&amp;ctx-&gt;aio_mutex);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rc = ctx-&gt;rc;</div><div class='del'>-	/* the loop below should proceed in the order of increasing offsets */</div><div class='del'>-again:</div><div class='del'>-	list_for_each_entry_safe(rdata, tmp, &amp;ctx-&gt;list, list) {</div><div class='del'>-		if (!rc) {</div><div class='del'>-			if (!try_wait_for_completion(&amp;rdata-&gt;done)) {</div><div class='del'>-				mutex_unlock(&amp;ctx-&gt;aio_mutex);</div><div class='del'>-				return;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			if (rdata-&gt;result == -EAGAIN) {</div><div class='del'>-				/* resend call if it's a retryable error */</div><div class='del'>-				struct list_head tmp_list;</div><div class='del'>-				unsigned int got_bytes = rdata-&gt;got_bytes;</div><div class='del'>-</div><div class='del'>-				list_del_init(&amp;rdata-&gt;list);</div><div class='del'>-				INIT_LIST_HEAD(&amp;tmp_list);</div><div class='del'>-</div><div class='del'>-				/*</div><div class='del'>-				 * Got a part of data and then reconnect has</div><div class='del'>-				 * happened -- fill the buffer and continue</div><div class='del'>-				 * reading.</div><div class='del'>-				 */</div><div class='del'>-				if (got_bytes &amp;&amp; got_bytes &lt; rdata-&gt;bytes) {</div><div class='del'>-					rc = 0;</div><div class='del'>-					if (!ctx-&gt;direct_io)</div><div class='del'>-						rc = cifs_readdata_to_iov(rdata, to);</div><div class='del'>-					if (rc) {</div><div class='del'>-						kref_put(&amp;rdata-&gt;refcount,</div><div class='del'>-							cifs_uncached_readdata_release);</div><div class='del'>-						continue;</div><div class='del'>-					}</div><div class='del'>-				}</div><div class='del'>-</div><div class='del'>-				if (ctx-&gt;direct_io) {</div><div class='del'>-					/*</div><div class='del'>-					 * Re-use rdata as this is a</div><div class='del'>-					 * direct I/O</div><div class='del'>-					 */</div><div class='del'>-					rc = cifs_resend_rdata(</div><div class='del'>-						rdata,</div><div class='del'>-						&amp;tmp_list, ctx);</div><div class='del'>-				} else {</div><div class='del'>-					rc = cifs_send_async_read(</div><div class='del'>-						rdata-&gt;offset + got_bytes,</div><div class='del'>-						rdata-&gt;bytes - got_bytes,</div><div class='del'>-						rdata-&gt;cfile, cifs_sb,</div><div class='del'>-						&amp;tmp_list, ctx);</div><div class='del'>-</div><div class='del'>-					kref_put(&amp;rdata-&gt;refcount,</div><div class='del'>-						cifs_uncached_readdata_release);</div><div class='del'>-				}</div><div class='del'>-</div><div class='del'>-				list_splice(&amp;tmp_list, &amp;ctx-&gt;list);</div><div class='del'>-</div><div class='del'>-				goto again;</div><div class='del'>-			} else if (rdata-&gt;result)</div><div class='del'>-				rc = rdata-&gt;result;</div><div class='del'>-			else if (!ctx-&gt;direct_io)</div><div class='del'>-				rc = cifs_readdata_to_iov(rdata, to);</div><div class='del'>-</div><div class='del'>-			/* if there was a short read -- discard anything left */</div><div class='del'>-			if (rdata-&gt;got_bytes &amp;&amp; rdata-&gt;got_bytes &lt; rdata-&gt;bytes)</div><div class='del'>-				rc = -ENODATA;</div><div class='del'>-</div><div class='del'>-			ctx-&gt;total_len += rdata-&gt;got_bytes;</div><div class='del'>-		}</div><div class='del'>-		list_del_init(&amp;rdata-&gt;list);</div><div class='del'>-		kref_put(&amp;rdata-&gt;refcount, cifs_uncached_readdata_release);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!ctx-&gt;direct_io)</div><div class='del'>-		ctx-&gt;total_len = ctx-&gt;len - iov_iter_count(to);</div><div class='del'>-</div><div class='del'>-	/* mask nodata case */</div><div class='del'>-	if (rc == -ENODATA)</div><div class='del'>-		rc = 0;</div><div class='del'>-</div><div class='del'>-	ctx-&gt;rc = (rc == 0) ? (ssize_t)ctx-&gt;total_len : rc;</div><div class='del'>-</div><div class='del'>-	mutex_unlock(&amp;ctx-&gt;aio_mutex);</div><div class='del'>-</div><div class='del'>-	if (ctx-&gt;iocb &amp;&amp; ctx-&gt;iocb-&gt;ki_complete)</div><div class='del'>-		ctx-&gt;iocb-&gt;ki_complete(ctx-&gt;iocb, ctx-&gt;rc);</div><div class='del'>-	else</div><div class='del'>-		complete(&amp;ctx-&gt;done);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static ssize_t __cifs_readv(</div><div class='del'>-	struct kiocb *iocb, struct iov_iter *to, bool direct)</div><div class='del'>-{</div><div class='del'>-	size_t len;</div><div class='del'>-	struct file *file = iocb-&gt;ki_filp;</div><div class='del'>-	struct cifs_sb_info *cifs_sb;</div><div class='del'>-	struct cifsFileInfo *cfile;</div><div class='del'>-	struct cifs_tcon *tcon;</div><div class='del'>-	ssize_t rc, total_read = 0;</div><div class='del'>-	loff_t offset = iocb-&gt;ki_pos;</div><div class='del'>-	struct cifs_aio_ctx *ctx;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * iov_iter_get_pages_alloc() doesn't work with ITER_KVEC,</div><div class='del'>-	 * fall back to data copy read path</div><div class='del'>-	 * this could be improved by getting pages directly in ITER_KVEC</div><div class='del'>-	 */</div><div class='del'>-	if (direct &amp;&amp; iov_iter_is_kvec(to)) {</div><div class='del'>-		cifs_dbg(FYI, "use non-direct cifs_user_readv for kvec I/O\n");</div><div class='del'>-		direct = false;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	len = iov_iter_count(to);</div><div class='del'>-	if (!len)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	cifs_sb = CIFS_FILE_SB(file);</div><div class='del'>-	cfile = file-&gt;private_data;</div><div class='del'>-	tcon = tlink_tcon(cfile-&gt;tlink);</div><div class='del'>-</div><div class='del'>-	if (!tcon-&gt;ses-&gt;server-&gt;ops-&gt;async_readv)</div><div class='del'>-		return -ENOSYS;</div><div class='del'>-</div><div class='del'>-	if ((file-&gt;f_flags &amp; O_ACCMODE) == O_WRONLY)</div><div class='del'>-		cifs_dbg(FYI, "attempting read on write only file instance\n");</div><div class='del'>-</div><div class='del'>-	ctx = cifs_aio_ctx_alloc();</div><div class='del'>-	if (!ctx)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	ctx-&gt;cfile = cifsFileInfo_get(cfile);</div><div class='del'>-</div><div class='del'>-	if (!is_sync_kiocb(iocb))</div><div class='del'>-		ctx-&gt;iocb = iocb;</div><div class='del'>-</div><div class='del'>-	if (iter_is_iovec(to))</div><div class='del'>-		ctx-&gt;should_dirty = true;</div><div class='del'>-</div><div class='del'>-	if (direct) {</div><div class='del'>-		ctx-&gt;pos = offset;</div><div class='del'>-		ctx-&gt;direct_io = true;</div><div class='del'>-		ctx-&gt;iter = *to;</div><div class='del'>-		ctx-&gt;len = len;</div><div class='del'>-	} else {</div><div class='del'>-		rc = setup_aio_ctx_iter(ctx, to, READ);</div><div class='del'>-		if (rc) {</div><div class='del'>-			kref_put(&amp;ctx-&gt;refcount, cifs_aio_ctx_release);</div><div class='del'>-			return rc;</div><div class='del'>-		}</div><div class='del'>-		len = ctx-&gt;len;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* grab a lock here due to read response handlers can access ctx */</div><div class='del'>-	mutex_lock(&amp;ctx-&gt;aio_mutex);</div><div class='del'>-</div><div class='del'>-	rc = cifs_send_async_read(offset, len, cfile, cifs_sb, &amp;ctx-&gt;list, ctx);</div><div class='del'>-</div><div class='del'>-	/* if at least one read request send succeeded, then reset rc */</div><div class='del'>-	if (!list_empty(&amp;ctx-&gt;list))</div><div class='del'>-		rc = 0;</div><div class='del'>-</div><div class='del'>-	mutex_unlock(&amp;ctx-&gt;aio_mutex);</div><div class='del'>-</div><div class='del'>-	if (rc) {</div><div class='del'>-		kref_put(&amp;ctx-&gt;refcount, cifs_aio_ctx_release);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!is_sync_kiocb(iocb)) {</div><div class='del'>-		kref_put(&amp;ctx-&gt;refcount, cifs_aio_ctx_release);</div><div class='del'>-		return -EIOCBQUEUED;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rc = wait_for_completion_killable(&amp;ctx-&gt;done);</div><div class='del'>-	if (rc) {</div><div class='del'>-		mutex_lock(&amp;ctx-&gt;aio_mutex);</div><div class='del'>-		ctx-&gt;rc = rc = -EINTR;</div><div class='del'>-		total_read = ctx-&gt;total_len;</div><div class='del'>-		mutex_unlock(&amp;ctx-&gt;aio_mutex);</div><div class='del'>-	} else {</div><div class='del'>-		rc = ctx-&gt;rc;</div><div class='del'>-		total_read = ctx-&gt;total_len;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	kref_put(&amp;ctx-&gt;refcount, cifs_aio_ctx_release);</div><div class='del'>-</div><div class='del'>-	if (total_read) {</div><div class='del'>-		iocb-&gt;ki_pos += total_read;</div><div class='del'>-		return total_read;</div><div class='del'>-	}</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-ssize_t cifs_direct_readv(struct kiocb *iocb, struct iov_iter *to)</div><div class='del'>-{</div><div class='del'>-	return __cifs_readv(iocb, to, true);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-ssize_t cifs_user_readv(struct kiocb *iocb, struct iov_iter *to)</div><div class='del'>-{</div><div class='del'>-	return __cifs_readv(iocb, to, false);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-ssize_t</div><div class='del'>-cifs_strict_readv(struct kiocb *iocb, struct iov_iter *to)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='del'>-	struct cifsInodeInfo *cinode = CIFS_I(inode);</div><div class='del'>-	struct cifs_sb_info *cifs_sb = CIFS_SB(inode-&gt;i_sb);</div><div class='del'>-	struct cifsFileInfo *cfile = (struct cifsFileInfo *)</div><div class='del'>-						iocb-&gt;ki_filp-&gt;private_data;</div><div class='del'>-	struct cifs_tcon *tcon = tlink_tcon(cfile-&gt;tlink);</div><div class='del'>-	int rc = -EACCES;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * In strict cache mode we need to read from the server all the time</div><div class='del'>-	 * if we don't have level II oplock because the server can delay mtime</div><div class='del'>-	 * change - so we can't make a decision about inode invalidating.</div><div class='del'>-	 * And we can also fail with pagereading if there are mandatory locks</div><div class='del'>-	 * on pages affected by this read but not on the region from pos to</div><div class='del'>-	 * pos+len-1.</div><div class='del'>-	 */</div><div class='del'>-	if (!CIFS_CACHE_READ(cinode))</div><div class='del'>-		return cifs_user_readv(iocb, to);</div><div class='del'>-</div><div class='del'>-	if (cap_unix(tcon-&gt;ses) &amp;&amp;</div><div class='del'>-	    (CIFS_UNIX_FCNTL_CAP &amp; le64_to_cpu(tcon-&gt;fsUnixInfo.Capability)) &amp;&amp;</div><div class='del'>-	    ((cifs_sb-&gt;mnt_cifs_flags &amp; CIFS_MOUNT_NOPOSIXBRL) == 0))</div><div class='del'>-		return generic_file_read_iter(iocb, to);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * We need to hold the sem to be sure nobody modifies lock list</div><div class='del'>-	 * with a brlock that prevents reading.</div><div class='del'>-	 */</div><div class='del'>-	down_read(&amp;cinode-&gt;lock_sem);</div><div class='del'>-	if (!cifs_find_lock_conflict(cfile, iocb-&gt;ki_pos, iov_iter_count(to),</div><div class='del'>-				     tcon-&gt;ses-&gt;server-&gt;vals-&gt;shared_lock_type,</div><div class='del'>-				     0, NULL, CIFS_READ_OP))</div><div class='del'>-		rc = generic_file_read_iter(iocb, to);</div><div class='del'>-	up_read(&amp;cinode-&gt;lock_sem);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static ssize_t</div><div class='del'>-cifs_read(struct file *file, char *read_data, size_t read_size, loff_t *offset)</div><div class='del'>-{</div><div class='del'>-	int rc = -EACCES;</div><div class='del'>-	unsigned int bytes_read = 0;</div><div class='del'>-	unsigned int total_read;</div><div class='del'>-	unsigned int current_read_size;</div><div class='del'>-	unsigned int rsize;</div><div class='del'>-	struct cifs_sb_info *cifs_sb;</div><div class='del'>-	struct cifs_tcon *tcon;</div><div class='del'>-	struct TCP_Server_Info *server;</div><div class='del'>-	unsigned int xid;</div><div class='del'>-	char *cur_offset;</div><div class='del'>-	struct cifsFileInfo *open_file;</div><div class='del'>-	struct cifs_io_parms io_parms = {0};</div><div class='del'>-	int buf_type = CIFS_NO_BUFFER;</div><div class='del'>-	__u32 pid;</div><div class='del'>-</div><div class='del'>-	xid = get_xid();</div><div class='del'>-	cifs_sb = CIFS_FILE_SB(file);</div><div class='del'>-</div><div class='del'>-	/* FIXME: set up handlers for larger reads and/or convert to async */</div><div class='del'>-	rsize = min_t(unsigned int, cifs_sb-&gt;ctx-&gt;rsize, CIFSMaxBufSize);</div><div class='del'>-</div><div class='del'>-	if (file-&gt;private_data == NULL) {</div><div class='del'>-		rc = -EBADF;</div><div class='del'>-		free_xid(xid);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-	open_file = file-&gt;private_data;</div><div class='del'>-	tcon = tlink_tcon(open_file-&gt;tlink);</div><div class='del'>-	server = cifs_pick_channel(tcon-&gt;ses);</div><div class='del'>-</div><div class='del'>-	if (!server-&gt;ops-&gt;sync_read) {</div><div class='del'>-		free_xid(xid);</div><div class='del'>-		return -ENOSYS;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (cifs_sb-&gt;mnt_cifs_flags &amp; CIFS_MOUNT_RWPIDFORWARD)</div><div class='del'>-		pid = open_file-&gt;pid;</div><div class='del'>-	else</div><div class='del'>-		pid = current-&gt;tgid;</div><div class='del'>-</div><div class='del'>-	if ((file-&gt;f_flags &amp; O_ACCMODE) == O_WRONLY)</div><div class='del'>-		cifs_dbg(FYI, "attempting read on write only file instance\n");</div><div class='del'>-</div><div class='del'>-	for (total_read = 0, cur_offset = read_data; read_size &gt; total_read;</div><div class='del'>-	     total_read += bytes_read, cur_offset += bytes_read) {</div><div class='del'>-		do {</div><div class='del'>-			current_read_size = min_t(uint, read_size - total_read,</div><div class='del'>-						  rsize);</div><div class='del'>-			/*</div><div class='del'>-			 * For windows me and 9x we do not want to request more</div><div class='del'>-			 * than it negotiated since it will refuse the read</div><div class='del'>-			 * then.</div><div class='del'>-			 */</div><div class='del'>-			if (!(tcon-&gt;ses-&gt;capabilities &amp;</div><div class='del'>-				tcon-&gt;ses-&gt;server-&gt;vals-&gt;cap_large_files)) {</div><div class='del'>-				current_read_size = min_t(uint,</div><div class='del'>-					current_read_size, CIFSMaxBufSize);</div><div class='del'>-			}</div><div class='del'>-			if (open_file-&gt;invalidHandle) {</div><div class='del'>-				rc = cifs_reopen_file(open_file, true);</div><div class='del'>-				if (rc != 0)</div><div class='del'>-					break;</div><div class='del'>-			}</div><div class='del'>-			io_parms.pid = pid;</div><div class='del'>-			io_parms.tcon = tcon;</div><div class='del'>-			io_parms.offset = *offset;</div><div class='del'>-			io_parms.length = current_read_size;</div><div class='del'>-			io_parms.server = server;</div><div class='del'>-			rc = server-&gt;ops-&gt;sync_read(xid, &amp;open_file-&gt;fid, &amp;io_parms,</div><div class='del'>-						    &amp;bytes_read, &amp;cur_offset,</div><div class='del'>-						    &amp;buf_type);</div><div class='del'>-		} while (rc == -EAGAIN);</div><div class='del'>-</div><div class='del'>-		if (rc || (bytes_read == 0)) {</div><div class='del'>-			if (total_read) {</div><div class='del'>-				break;</div><div class='del'>-			} else {</div><div class='del'>-				free_xid(xid);</div><div class='del'>-				return rc;</div><div class='del'>-			}</div><div class='del'>-		} else {</div><div class='del'>-			cifs_stats_bytes_read(tcon, total_read);</div><div class='del'>-			*offset += bytes_read;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	free_xid(xid);</div><div class='del'>-	return total_read;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * If the page is mmap'ed into a process' page tables, then we need to make</div><div class='del'>- * sure that it doesn't change while being written back.</div><div class='del'>- */</div><div class='del'>-static vm_fault_t</div><div class='del'>-cifs_page_mkwrite(struct vm_fault *vmf)</div><div class='del'>-{</div><div class='del'>-	struct page *page = vmf-&gt;page;</div><div class='del'>-	struct file *file = vmf-&gt;vma-&gt;vm_file;</div><div class='del'>-	struct inode *inode = file_inode(file);</div><div class='del'>-</div><div class='del'>-	cifs_fscache_wait_on_page_write(inode, page);</div><div class='del'>-</div><div class='del'>-	lock_page(page);</div><div class='del'>-	return VM_FAULT_LOCKED;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static const struct vm_operations_struct cifs_file_vm_ops = {</div><div class='del'>-	.fault = filemap_fault,</div><div class='del'>-	.map_pages = filemap_map_pages,</div><div class='del'>-	.page_mkwrite = cifs_page_mkwrite,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-int cifs_file_strict_mmap(struct file *file, struct vm_area_struct *vma)</div><div class='del'>-{</div><div class='del'>-	int xid, rc = 0;</div><div class='del'>-	struct inode *inode = file_inode(file);</div><div class='del'>-</div><div class='del'>-	xid = get_xid();</div><div class='del'>-</div><div class='del'>-	if (!CIFS_CACHE_READ(CIFS_I(inode)))</div><div class='del'>-		rc = cifs_zap_mapping(inode);</div><div class='del'>-	if (!rc)</div><div class='del'>-		rc = generic_file_mmap(file, vma);</div><div class='del'>-	if (!rc)</div><div class='del'>-		vma-&gt;vm_ops = &amp;cifs_file_vm_ops;</div><div class='del'>-</div><div class='del'>-	free_xid(xid);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int cifs_file_mmap(struct file *file, struct vm_area_struct *vma)</div><div class='del'>-{</div><div class='del'>-	int rc, xid;</div><div class='del'>-</div><div class='del'>-	xid = get_xid();</div><div class='del'>-</div><div class='del'>-	rc = cifs_revalidate_file(file);</div><div class='del'>-	if (rc)</div><div class='del'>-		cifs_dbg(FYI, "Validation prior to mmap failed, error=%d\n",</div><div class='del'>-			 rc);</div><div class='del'>-	if (!rc)</div><div class='del'>-		rc = generic_file_mmap(file, vma);</div><div class='del'>-	if (!rc)</div><div class='del'>-		vma-&gt;vm_ops = &amp;cifs_file_vm_ops;</div><div class='del'>-</div><div class='del'>-	free_xid(xid);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void</div><div class='del'>-cifs_readv_complete(struct work_struct *work)</div><div class='del'>-{</div><div class='del'>-	unsigned int i, got_bytes;</div><div class='del'>-	struct cifs_readdata *rdata = container_of(work,</div><div class='del'>-						struct cifs_readdata, work);</div><div class='del'>-</div><div class='del'>-	got_bytes = rdata-&gt;got_bytes;</div><div class='del'>-	for (i = 0; i &lt; rdata-&gt;nr_pages; i++) {</div><div class='del'>-		struct page *page = rdata-&gt;pages[i];</div><div class='del'>-</div><div class='del'>-		lru_cache_add(page);</div><div class='del'>-</div><div class='del'>-		if (rdata-&gt;result == 0 ||</div><div class='del'>-		    (rdata-&gt;result == -EAGAIN &amp;&amp; got_bytes)) {</div><div class='del'>-			flush_dcache_page(page);</div><div class='del'>-			SetPageUptodate(page);</div><div class='del'>-		} else</div><div class='del'>-			SetPageError(page);</div><div class='del'>-</div><div class='del'>-		unlock_page(page);</div><div class='del'>-</div><div class='del'>-		if (rdata-&gt;result == 0 ||</div><div class='del'>-		    (rdata-&gt;result == -EAGAIN &amp;&amp; got_bytes))</div><div class='del'>-			cifs_readpage_to_fscache(rdata-&gt;mapping-&gt;host, page);</div><div class='del'>-		else</div><div class='del'>-			cifs_fscache_uncache_page(rdata-&gt;mapping-&gt;host, page);</div><div class='del'>-</div><div class='del'>-		got_bytes -= min_t(unsigned int, PAGE_SIZE, got_bytes);</div><div class='del'>-</div><div class='del'>-		put_page(page);</div><div class='del'>-		rdata-&gt;pages[i] = NULL;</div><div class='del'>-	}</div><div class='del'>-	kref_put(&amp;rdata-&gt;refcount, cifs_readdata_release);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-readpages_fill_pages(struct TCP_Server_Info *server,</div><div class='del'>-		     struct cifs_readdata *rdata, struct iov_iter *iter,</div><div class='del'>-		     unsigned int len)</div><div class='del'>-{</div><div class='del'>-	int result = 0;</div><div class='del'>-	unsigned int i;</div><div class='del'>-	u64 eof;</div><div class='del'>-	pgoff_t eof_index;</div><div class='del'>-	unsigned int nr_pages = rdata-&gt;nr_pages;</div><div class='del'>-	unsigned int page_offset = rdata-&gt;page_offset;</div><div class='del'>-</div><div class='del'>-	/* determine the eof that the server (probably) has */</div><div class='del'>-	eof = CIFS_I(rdata-&gt;mapping-&gt;host)-&gt;server_eof;</div><div class='del'>-	eof_index = eof ? (eof - 1) &gt;&gt; PAGE_SHIFT : 0;</div><div class='del'>-	cifs_dbg(FYI, "eof=%llu eof_index=%lu\n", eof, eof_index);</div><div class='del'>-</div><div class='del'>-	rdata-&gt;got_bytes = 0;</div><div class='del'>-	rdata-&gt;tailsz = PAGE_SIZE;</div><div class='del'>-	for (i = 0; i &lt; nr_pages; i++) {</div><div class='del'>-		struct page *page = rdata-&gt;pages[i];</div><div class='del'>-		unsigned int to_read = rdata-&gt;pagesz;</div><div class='del'>-		size_t n;</div><div class='del'>-</div><div class='del'>-		if (i == 0)</div><div class='del'>-			to_read -= page_offset;</div><div class='del'>-		else</div><div class='del'>-			page_offset = 0;</div><div class='del'>-</div><div class='del'>-		n = to_read;</div><div class='del'>-</div><div class='del'>-		if (len &gt;= to_read) {</div><div class='del'>-			len -= to_read;</div><div class='del'>-		} else if (len &gt; 0) {</div><div class='del'>-			/* enough for partial page, fill and zero the rest */</div><div class='del'>-			zero_user(page, len + page_offset, to_read - len);</div><div class='del'>-			n = rdata-&gt;tailsz = len;</div><div class='del'>-			len = 0;</div><div class='del'>-		} else if (page-&gt;index &gt; eof_index) {</div><div class='del'>-			/*</div><div class='del'>-			 * The VFS will not try to do readahead past the</div><div class='del'>-			 * i_size, but it's possible that we have outstanding</div><div class='del'>-			 * writes with gaps in the middle and the i_size hasn't</div><div class='del'>-			 * caught up yet. Populate those with zeroed out pages</div><div class='del'>-			 * to prevent the VFS from repeatedly attempting to</div><div class='del'>-			 * fill them until the writes are flushed.</div><div class='del'>-			 */</div><div class='del'>-			zero_user(page, 0, PAGE_SIZE);</div><div class='del'>-			lru_cache_add(page);</div><div class='del'>-			flush_dcache_page(page);</div><div class='del'>-			SetPageUptodate(page);</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			put_page(page);</div><div class='del'>-			rdata-&gt;pages[i] = NULL;</div><div class='del'>-			rdata-&gt;nr_pages--;</div><div class='del'>-			continue;</div><div class='del'>-		} else {</div><div class='del'>-			/* no need to hold page hostage */</div><div class='del'>-			lru_cache_add(page);</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			put_page(page);</div><div class='del'>-			rdata-&gt;pages[i] = NULL;</div><div class='del'>-			rdata-&gt;nr_pages--;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (iter)</div><div class='del'>-			result = copy_page_from_iter(</div><div class='del'>-					page, page_offset, n, iter);</div><div class='del'>-#ifdef CONFIG_CIFS_SMB_DIRECT</div><div class='del'>-		else if (rdata-&gt;mr)</div><div class='del'>-			result = n;</div><div class='del'>-#endif</div><div class='del'>-		else</div><div class='del'>-			result = cifs_read_page_from_socket(</div><div class='del'>-					server, page, page_offset, n);</div><div class='del'>-		if (result &lt; 0)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		rdata-&gt;got_bytes += result;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return rdata-&gt;got_bytes &gt; 0 &amp;&amp; result != -ECONNABORTED ?</div><div class='del'>-						rdata-&gt;got_bytes : result;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-cifs_readpages_read_into_pages(struct TCP_Server_Info *server,</div><div class='del'>-			       struct cifs_readdata *rdata, unsigned int len)</div><div class='del'>-{</div><div class='del'>-	return readpages_fill_pages(server, rdata, NULL, len);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-cifs_readpages_copy_into_pages(struct TCP_Server_Info *server,</div><div class='del'>-			       struct cifs_readdata *rdata,</div><div class='del'>-			       struct iov_iter *iter)</div><div class='del'>-{</div><div class='del'>-	return readpages_fill_pages(server, rdata, iter, iter-&gt;count);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-readpages_get_pages(struct address_space *mapping, struct list_head *page_list,</div><div class='del'>-		    unsigned int rsize, struct list_head *tmplist,</div><div class='del'>-		    unsigned int *nr_pages, loff_t *offset, unsigned int *bytes)</div><div class='del'>-{</div><div class='del'>-	struct page *page, *tpage;</div><div class='del'>-	unsigned int expected_index;</div><div class='del'>-	int rc;</div><div class='del'>-	gfp_t gfp = readahead_gfp_mask(mapping);</div><div class='del'>-</div><div class='del'>-	INIT_LIST_HEAD(tmplist);</div><div class='del'>-</div><div class='del'>-	page = lru_to_page(page_list);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Lock the page and put it in the cache. Since no one else</div><div class='del'>-	 * should have access to this page, we're safe to simply set</div><div class='del'>-	 * PG_locked without checking it first.</div><div class='del'>-	 */</div><div class='del'>-	__SetPageLocked(page);</div><div class='del'>-	rc = add_to_page_cache_locked(page, mapping,</div><div class='del'>-				      page-&gt;index, gfp);</div><div class='del'>-</div><div class='del'>-	/* give up if we can't stick it in the cache */</div><div class='del'>-	if (rc) {</div><div class='del'>-		__ClearPageLocked(page);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* move first page to the tmplist */</div><div class='del'>-	*offset = (loff_t)page-&gt;index &lt;&lt; PAGE_SHIFT;</div><div class='del'>-	*bytes = PAGE_SIZE;</div><div class='del'>-	*nr_pages = 1;</div><div class='del'>-	list_move_tail(&amp;page-&gt;lru, tmplist);</div><div class='del'>-</div><div class='del'>-	/* now try and add more pages onto the request */</div><div class='del'>-	expected_index = page-&gt;index + 1;</div><div class='del'>-	list_for_each_entry_safe_reverse(page, tpage, page_list, lru) {</div><div class='del'>-		/* discontinuity ? */</div><div class='del'>-		if (page-&gt;index != expected_index)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		/* would this page push the read over the rsize? */</div><div class='del'>-		if (*bytes + PAGE_SIZE &gt; rsize)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		__SetPageLocked(page);</div><div class='del'>-		rc = add_to_page_cache_locked(page, mapping, page-&gt;index, gfp);</div><div class='del'>-		if (rc) {</div><div class='del'>-			__ClearPageLocked(page);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		list_move_tail(&amp;page-&gt;lru, tmplist);</div><div class='del'>-		(*bytes) += PAGE_SIZE;</div><div class='del'>-		expected_index++;</div><div class='del'>-		(*nr_pages)++;</div><div class='del'>-	}</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int cifs_readpages(struct file *file, struct address_space *mapping,</div><div class='del'>-	struct list_head *page_list, unsigned num_pages)</div><div class='del'>-{</div><div class='del'>-	int rc;</div><div class='del'>-	int err = 0;</div><div class='del'>-	struct list_head tmplist;</div><div class='del'>-	struct cifsFileInfo *open_file = file-&gt;private_data;</div><div class='del'>-	struct cifs_sb_info *cifs_sb = CIFS_FILE_SB(file);</div><div class='del'>-	struct TCP_Server_Info *server;</div><div class='del'>-	pid_t pid;</div><div class='del'>-	unsigned int xid;</div><div class='del'>-</div><div class='del'>-	xid = get_xid();</div><div class='del'>-	/*</div><div class='del'>-	 * Reads as many pages as possible from fscache. Returns -ENOBUFS</div><div class='del'>-	 * immediately if the cookie is negative</div><div class='del'>-	 *</div><div class='del'>-	 * After this point, every page in the list might have PG_fscache set,</div><div class='del'>-	 * so we will need to clean that up off of every page we don't use.</div><div class='del'>-	 */</div><div class='del'>-	rc = cifs_readpages_from_fscache(mapping-&gt;host, mapping, page_list,</div><div class='del'>-					 &amp;num_pages);</div><div class='del'>-	if (rc == 0) {</div><div class='del'>-		free_xid(xid);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (cifs_sb-&gt;mnt_cifs_flags &amp; CIFS_MOUNT_RWPIDFORWARD)</div><div class='del'>-		pid = open_file-&gt;pid;</div><div class='del'>-	else</div><div class='del'>-		pid = current-&gt;tgid;</div><div class='del'>-</div><div class='del'>-	rc = 0;</div><div class='del'>-	server = cifs_pick_channel(tlink_tcon(open_file-&gt;tlink)-&gt;ses);</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "%s: file=%p mapping=%p num_pages=%u\n",</div><div class='del'>-		 __func__, file, mapping, num_pages);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Start with the page at end of list and move it to private</div><div class='del'>-	 * list. Do the same with any following pages until we hit</div><div class='del'>-	 * the rsize limit, hit an index discontinuity, or run out of</div><div class='del'>-	 * pages. Issue the async read and then start the loop again</div><div class='del'>-	 * until the list is empty.</div><div class='del'>-	 *</div><div class='del'>-	 * Note that list order is important. The page_list is in</div><div class='del'>-	 * the order of declining indexes. When we put the pages in</div><div class='del'>-	 * the rdata-&gt;pages, then we want them in increasing order.</div><div class='del'>-	 */</div><div class='del'>-	while (!list_empty(page_list) &amp;&amp; !err) {</div><div class='del'>-		unsigned int i, nr_pages, bytes, rsize;</div><div class='del'>-		loff_t offset;</div><div class='del'>-		struct page *page, *tpage;</div><div class='del'>-		struct cifs_readdata *rdata;</div><div class='del'>-		struct cifs_credits credits_on_stack;</div><div class='del'>-		struct cifs_credits *credits = &amp;credits_on_stack;</div><div class='del'>-</div><div class='del'>-		if (open_file-&gt;invalidHandle) {</div><div class='del'>-			rc = cifs_reopen_file(open_file, true);</div><div class='del'>-			if (rc == -EAGAIN)</div><div class='del'>-				continue;</div><div class='del'>-			else if (rc)</div><div class='del'>-				break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		rc = server-&gt;ops-&gt;wait_mtu_credits(server, cifs_sb-&gt;ctx-&gt;rsize,</div><div class='del'>-						   &amp;rsize, credits);</div><div class='del'>-		if (rc)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Give up immediately if rsize is too small to read an entire</div><div class='del'>-		 * page. The VFS will fall back to readpage. We should never</div><div class='del'>-		 * reach this point however since we set ra_pages to 0 when the</div><div class='del'>-		 * rsize is smaller than a cache page.</div><div class='del'>-		 */</div><div class='del'>-		if (unlikely(rsize &lt; PAGE_SIZE)) {</div><div class='del'>-			add_credits_and_wake_if(server, credits, 0);</div><div class='del'>-			free_xid(xid);</div><div class='del'>-			return 0;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		nr_pages = 0;</div><div class='del'>-		err = readpages_get_pages(mapping, page_list, rsize, &amp;tmplist,</div><div class='del'>-					 &amp;nr_pages, &amp;offset, &amp;bytes);</div><div class='del'>-		if (!nr_pages) {</div><div class='del'>-			add_credits_and_wake_if(server, credits, 0);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		rdata = cifs_readdata_alloc(nr_pages, cifs_readv_complete);</div><div class='del'>-		if (!rdata) {</div><div class='del'>-			/* best to give up if we're out of mem */</div><div class='del'>-			list_for_each_entry_safe(page, tpage, &amp;tmplist, lru) {</div><div class='del'>-				list_del(&amp;page-&gt;lru);</div><div class='del'>-				lru_cache_add(page);</div><div class='del'>-				unlock_page(page);</div><div class='del'>-				put_page(page);</div><div class='del'>-			}</div><div class='del'>-			rc = -ENOMEM;</div><div class='del'>-			add_credits_and_wake_if(server, credits, 0);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		rdata-&gt;cfile = cifsFileInfo_get(open_file);</div><div class='del'>-		rdata-&gt;server = server;</div><div class='del'>-		rdata-&gt;mapping = mapping;</div><div class='del'>-		rdata-&gt;offset = offset;</div><div class='del'>-		rdata-&gt;bytes = bytes;</div><div class='del'>-		rdata-&gt;pid = pid;</div><div class='del'>-		rdata-&gt;pagesz = PAGE_SIZE;</div><div class='del'>-		rdata-&gt;tailsz = PAGE_SIZE;</div><div class='del'>-		rdata-&gt;read_into_pages = cifs_readpages_read_into_pages;</div><div class='del'>-		rdata-&gt;copy_into_pages = cifs_readpages_copy_into_pages;</div><div class='del'>-		rdata-&gt;credits = credits_on_stack;</div><div class='del'>-</div><div class='del'>-		list_for_each_entry_safe(page, tpage, &amp;tmplist, lru) {</div><div class='del'>-			list_del(&amp;page-&gt;lru);</div><div class='del'>-			rdata-&gt;pages[rdata-&gt;nr_pages++] = page;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		rc = adjust_credits(server, &amp;rdata-&gt;credits, rdata-&gt;bytes);</div><div class='del'>-</div><div class='del'>-		if (!rc) {</div><div class='del'>-			if (rdata-&gt;cfile-&gt;invalidHandle)</div><div class='del'>-				rc = -EAGAIN;</div><div class='del'>-			else</div><div class='del'>-				rc = server-&gt;ops-&gt;async_readv(rdata);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (rc) {</div><div class='del'>-			add_credits_and_wake_if(server, &amp;rdata-&gt;credits, 0);</div><div class='del'>-			for (i = 0; i &lt; rdata-&gt;nr_pages; i++) {</div><div class='del'>-				page = rdata-&gt;pages[i];</div><div class='del'>-				lru_cache_add(page);</div><div class='del'>-				unlock_page(page);</div><div class='del'>-				put_page(page);</div><div class='del'>-			}</div><div class='del'>-			/* Fallback to the readpage in error/reconnect cases */</div><div class='del'>-			kref_put(&amp;rdata-&gt;refcount, cifs_readdata_release);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		kref_put(&amp;rdata-&gt;refcount, cifs_readdata_release);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Any pages that have been shown to fscache but didn't get added to</div><div class='del'>-	 * the pagecache must be uncached before they get returned to the</div><div class='del'>-	 * allocator.</div><div class='del'>-	 */</div><div class='del'>-	cifs_fscache_readpages_cancel(mapping-&gt;host, page_list);</div><div class='del'>-	free_xid(xid);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * cifs_readpage_worker must be called with the page pinned</div><div class='del'>- */</div><div class='del'>-static int cifs_readpage_worker(struct file *file, struct page *page,</div><div class='del'>-	loff_t *poffset)</div><div class='del'>-{</div><div class='del'>-	char *read_data;</div><div class='del'>-	int rc;</div><div class='del'>-</div><div class='del'>-	/* Is the page cached? */</div><div class='del'>-	rc = cifs_readpage_from_fscache(file_inode(file), page);</div><div class='del'>-	if (rc == 0)</div><div class='del'>-		goto read_complete;</div><div class='del'>-</div><div class='del'>-	read_data = kmap(page);</div><div class='del'>-	/* for reads over a certain size could initiate async read ahead */</div><div class='del'>-</div><div class='del'>-	rc = cifs_read(file, read_data, PAGE_SIZE, poffset);</div><div class='del'>-</div><div class='del'>-	if (rc &lt; 0)</div><div class='del'>-		goto io_error;</div><div class='del'>-	else</div><div class='del'>-		cifs_dbg(FYI, "Bytes read %d\n", rc);</div><div class='del'>-</div><div class='del'>-	/* we do not want atime to be less than mtime, it broke some apps */</div><div class='del'>-	file_inode(file)-&gt;i_atime = current_time(file_inode(file));</div><div class='del'>-	if (timespec64_compare(&amp;(file_inode(file)-&gt;i_atime), &amp;(file_inode(file)-&gt;i_mtime)))</div><div class='del'>-		file_inode(file)-&gt;i_atime = file_inode(file)-&gt;i_mtime;</div><div class='del'>-	else</div><div class='del'>-		file_inode(file)-&gt;i_atime = current_time(file_inode(file));</div><div class='del'>-</div><div class='del'>-	if (PAGE_SIZE &gt; rc)</div><div class='del'>-		memset(read_data + rc, 0, PAGE_SIZE - rc);</div><div class='del'>-</div><div class='del'>-	flush_dcache_page(page);</div><div class='del'>-	SetPageUptodate(page);</div><div class='del'>-</div><div class='del'>-	/* send this page to the cache */</div><div class='del'>-	cifs_readpage_to_fscache(file_inode(file), page);</div><div class='del'>-</div><div class='del'>-	rc = 0;</div><div class='del'>-</div><div class='del'>-io_error:</div><div class='del'>-	kunmap(page);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-</div><div class='del'>-read_complete:</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int cifs_readpage(struct file *file, struct page *page)</div><div class='del'>-{</div><div class='del'>-	loff_t offset = page_file_offset(page);</div><div class='del'>-	int rc = -EACCES;</div><div class='del'>-	unsigned int xid;</div><div class='del'>-</div><div class='del'>-	xid = get_xid();</div><div class='del'>-</div><div class='del'>-	if (file-&gt;private_data == NULL) {</div><div class='del'>-		rc = -EBADF;</div><div class='del'>-		free_xid(xid);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "readpage %p at offset %d 0x%x\n",</div><div class='del'>-		 page, (int)offset, (int)offset);</div><div class='del'>-</div><div class='del'>-	rc = cifs_readpage_worker(file, page, &amp;offset);</div><div class='del'>-</div><div class='del'>-	free_xid(xid);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int is_inode_writable(struct cifsInodeInfo *cifs_inode)</div><div class='del'>-{</div><div class='del'>-	struct cifsFileInfo *open_file;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;cifs_inode-&gt;open_file_lock);</div><div class='del'>-	list_for_each_entry(open_file, &amp;cifs_inode-&gt;openFileList, flist) {</div><div class='del'>-		if (OPEN_FMODE(open_file-&gt;f_flags) &amp; FMODE_WRITE) {</div><div class='del'>-			spin_unlock(&amp;cifs_inode-&gt;open_file_lock);</div><div class='del'>-			return 1;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;cifs_inode-&gt;open_file_lock);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* We do not want to update the file size from server for inodes</div><div class='del'>-   open for write - to avoid races with writepage extending</div><div class='del'>-   the file - in the future we could consider allowing</div><div class='del'>-   refreshing the inode only on increases in the file size</div><div class='del'>-   but this is tricky to do without racing with writebehind</div><div class='del'>-   page caching in the current Linux kernel design */</div><div class='del'>-bool is_size_safe_to_change(struct cifsInodeInfo *cifsInode, __u64 end_of_file)</div><div class='del'>-{</div><div class='del'>-	if (!cifsInode)</div><div class='del'>-		return true;</div><div class='del'>-</div><div class='del'>-	if (is_inode_writable(cifsInode)) {</div><div class='del'>-		/* This inode is open for write at least once */</div><div class='del'>-		struct cifs_sb_info *cifs_sb;</div><div class='del'>-</div><div class='del'>-		cifs_sb = CIFS_SB(cifsInode-&gt;vfs_inode.i_sb);</div><div class='del'>-		if (cifs_sb-&gt;mnt_cifs_flags &amp; CIFS_MOUNT_DIRECT_IO) {</div><div class='del'>-			/* since no page cache to corrupt on directio</div><div class='del'>-			we can change size safely */</div><div class='del'>-			return true;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (i_size_read(&amp;cifsInode-&gt;vfs_inode) &lt; end_of_file)</div><div class='del'>-			return true;</div><div class='del'>-</div><div class='del'>-		return false;</div><div class='del'>-	} else</div><div class='del'>-		return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int cifs_write_begin(struct file *file, struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned flags,</div><div class='del'>-			struct page **pagep, void **fsdata)</div><div class='del'>-{</div><div class='del'>-	int oncethru = 0;</div><div class='del'>-	pgoff_t index = pos &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	loff_t offset = pos &amp; (PAGE_SIZE - 1);</div><div class='del'>-	loff_t page_start = pos &amp; PAGE_MASK;</div><div class='del'>-	loff_t i_size;</div><div class='del'>-	struct page *page;</div><div class='del'>-	int rc = 0;</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "write_begin from %lld len %d\n", (long long)pos, len);</div><div class='del'>-</div><div class='del'>-start:</div><div class='del'>-	page = grab_cache_page_write_begin(mapping, index, flags);</div><div class='del'>-	if (!page) {</div><div class='del'>-		rc = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (PageUptodate(page))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If we write a full page it will be up to date, no need to read from</div><div class='del'>-	 * the server. If the write is short, we'll end up doing a sync write</div><div class='del'>-	 * instead.</div><div class='del'>-	 */</div><div class='del'>-	if (len == PAGE_SIZE)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * optimize away the read when we have an oplock, and we're not</div><div class='del'>-	 * expecting to use any of the data we'd be reading in. That</div><div class='del'>-	 * is, when the page lies beyond the EOF, or straddles the EOF</div><div class='del'>-	 * and the write will cover all of the existing data.</div><div class='del'>-	 */</div><div class='del'>-	if (CIFS_CACHE_READ(CIFS_I(mapping-&gt;host))) {</div><div class='del'>-		i_size = i_size_read(mapping-&gt;host);</div><div class='del'>-		if (page_start &gt;= i_size ||</div><div class='del'>-		    (offset == 0 &amp;&amp; (pos + len) &gt;= i_size)) {</div><div class='del'>-			zero_user_segments(page, 0, offset,</div><div class='del'>-					   offset + len,</div><div class='del'>-					   PAGE_SIZE);</div><div class='del'>-			/*</div><div class='del'>-			 * PageChecked means that the parts of the page</div><div class='del'>-			 * to which we're not writing are considered up</div><div class='del'>-			 * to date. Once the data is copied to the</div><div class='del'>-			 * page, it can be set uptodate.</div><div class='del'>-			 */</div><div class='del'>-			SetPageChecked(page);</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if ((file-&gt;f_flags &amp; O_ACCMODE) != O_WRONLY &amp;&amp; !oncethru) {</div><div class='del'>-		/*</div><div class='del'>-		 * might as well read a page, it is fast enough. If we get</div><div class='del'>-		 * an error, we don't need to return it. cifs_write_end will</div><div class='del'>-		 * do a sync write instead since PG_uptodate isn't set.</div><div class='del'>-		 */</div><div class='del'>-		cifs_readpage_worker(file, page, &amp;page_start);</div><div class='del'>-		put_page(page);</div><div class='del'>-		oncethru = 1;</div><div class='del'>-		goto start;</div><div class='del'>-	} else {</div><div class='del'>-		/* we could try using another file handle if there is one -</div><div class='del'>-		   but how would we lock it to prevent close of that handle</div><div class='del'>-		   racing with this read? In any case</div><div class='del'>-		   this will be written out by write_end so is fine */</div><div class='del'>-	}</div><div class='del'>-out:</div><div class='del'>-	*pagep = page;</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int cifs_release_page(struct page *page, gfp_t gfp)</div><div class='del'>-{</div><div class='del'>-	if (PagePrivate(page))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	return cifs_fscache_release_page(page, gfp);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void cifs_invalidate_page(struct page *page, unsigned int offset,</div><div class='del'>-				 unsigned int length)</div><div class='del'>-{</div><div class='del'>-	struct cifsInodeInfo *cifsi = CIFS_I(page-&gt;mapping-&gt;host);</div><div class='del'>-</div><div class='del'>-	if (offset == 0 &amp;&amp; length == PAGE_SIZE)</div><div class='del'>-		cifs_fscache_invalidate_page(page, &amp;cifsi-&gt;vfs_inode);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int cifs_launder_page(struct page *page)</div><div class='del'>-{</div><div class='del'>-	int rc = 0;</div><div class='del'>-	loff_t range_start = page_offset(page);</div><div class='del'>-	loff_t range_end = range_start + (loff_t)(PAGE_SIZE - 1);</div><div class='del'>-	struct writeback_control wbc = {</div><div class='del'>-		.sync_mode = WB_SYNC_ALL,</div><div class='del'>-		.nr_to_write = 0,</div><div class='del'>-		.range_start = range_start,</div><div class='del'>-		.range_end = range_end,</div><div class='del'>-	};</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "Launder page: %p\n", page);</div><div class='del'>-</div><div class='del'>-	if (clear_page_dirty_for_io(page))</div><div class='del'>-		rc = cifs_writepage_locked(page, &amp;wbc);</div><div class='del'>-</div><div class='del'>-	cifs_fscache_invalidate_page(page, page-&gt;mapping-&gt;host);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void cifs_oplock_break(struct work_struct *work)</div><div class='del'>-{</div><div class='del'>-	struct cifsFileInfo *cfile = container_of(work, struct cifsFileInfo,</div><div class='del'>-						  oplock_break);</div><div class='del'>-	struct inode *inode = d_inode(cfile-&gt;dentry);</div><div class='del'>-	struct cifsInodeInfo *cinode = CIFS_I(inode);</div><div class='del'>-	struct cifs_tcon *tcon = tlink_tcon(cfile-&gt;tlink);</div><div class='del'>-	struct TCP_Server_Info *server = tcon-&gt;ses-&gt;server;</div><div class='del'>-	int rc = 0;</div><div class='del'>-	bool purge_cache = false;</div><div class='del'>-	bool is_deferred = false;</div><div class='del'>-	struct cifs_deferred_close *dclose;</div><div class='del'>-</div><div class='del'>-	wait_on_bit(&amp;cinode-&gt;flags, CIFS_INODE_PENDING_WRITERS,</div><div class='del'>-			TASK_UNINTERRUPTIBLE);</div><div class='del'>-</div><div class='del'>-	server-&gt;ops-&gt;downgrade_oplock(server, cinode, cfile-&gt;oplock_level,</div><div class='del'>-				      cfile-&gt;oplock_epoch, &amp;purge_cache);</div><div class='del'>-</div><div class='del'>-	if (!CIFS_CACHE_WRITE(cinode) &amp;&amp; CIFS_CACHE_READ(cinode) &amp;&amp;</div><div class='del'>-						cifs_has_mand_locks(cinode)) {</div><div class='del'>-		cifs_dbg(FYI, "Reset oplock to None for inode=%p due to mand locks\n",</div><div class='del'>-			 inode);</div><div class='del'>-		cinode-&gt;oplock = 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (inode &amp;&amp; S_ISREG(inode-&gt;i_mode)) {</div><div class='del'>-		if (CIFS_CACHE_READ(cinode))</div><div class='del'>-			break_lease(inode, O_RDONLY);</div><div class='del'>-		else</div><div class='del'>-			break_lease(inode, O_WRONLY);</div><div class='del'>-		rc = filemap_fdatawrite(inode-&gt;i_mapping);</div><div class='del'>-		if (!CIFS_CACHE_READ(cinode) || purge_cache) {</div><div class='del'>-			rc = filemap_fdatawait(inode-&gt;i_mapping);</div><div class='del'>-			mapping_set_error(inode-&gt;i_mapping, rc);</div><div class='del'>-			cifs_zap_mapping(inode);</div><div class='del'>-		}</div><div class='del'>-		cifs_dbg(FYI, "Oplock flush inode %p rc %d\n", inode, rc);</div><div class='del'>-		if (CIFS_CACHE_WRITE(cinode))</div><div class='del'>-			goto oplock_break_ack;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rc = cifs_push_locks(cfile);</div><div class='del'>-	if (rc)</div><div class='del'>-		cifs_dbg(VFS, "Push locks rc = %d\n", rc);</div><div class='del'>-</div><div class='del'>-oplock_break_ack:</div><div class='del'>-	/*</div><div class='del'>-	 * When oplock break is received and there are no active</div><div class='del'>-	 * file handles but cached, then schedule deferred close immediately.</div><div class='del'>-	 * So, new open will not use cached handle.</div><div class='del'>-	 */</div><div class='del'>-	spin_lock(&amp;CIFS_I(inode)-&gt;deferred_lock);</div><div class='del'>-	is_deferred = cifs_is_deferred_close(cfile, &amp;dclose);</div><div class='del'>-	spin_unlock(&amp;CIFS_I(inode)-&gt;deferred_lock);</div><div class='del'>-	if (is_deferred &amp;&amp;</div><div class='del'>-	    cfile-&gt;deferred_close_scheduled &amp;&amp;</div><div class='del'>-	    delayed_work_pending(&amp;cfile-&gt;deferred)) {</div><div class='del'>-		if (cancel_delayed_work(&amp;cfile-&gt;deferred)) {</div><div class='del'>-			_cifsFileInfo_put(cfile, false, false);</div><div class='del'>-			goto oplock_break_done;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	/*</div><div class='del'>-	 * releasing stale oplock after recent reconnect of smb session using</div><div class='del'>-	 * a now incorrect file handle is not a data integrity issue but do</div><div class='del'>-	 * not bother sending an oplock release if session to server still is</div><div class='del'>-	 * disconnected since oplock already released by the server</div><div class='del'>-	 */</div><div class='del'>-	if (!cfile-&gt;oplock_break_cancelled) {</div><div class='del'>-		rc = tcon-&gt;ses-&gt;server-&gt;ops-&gt;oplock_response(tcon, &amp;cfile-&gt;fid,</div><div class='del'>-							     cinode);</div><div class='del'>-		cifs_dbg(FYI, "Oplock release rc = %d\n", rc);</div><div class='del'>-	}</div><div class='del'>-oplock_break_done:</div><div class='del'>-	_cifsFileInfo_put(cfile, false /* do not wait for ourself */, false);</div><div class='del'>-	cifs_done_oplock_break(cinode);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * The presence of cifs_direct_io() in the address space ops vector</div><div class='del'>- * allowes open() O_DIRECT flags which would have failed otherwise.</div><div class='del'>- *</div><div class='del'>- * In the non-cached mode (mount with cache=none), we shunt off direct read and write requests</div><div class='del'>- * so this method should never be called.</div><div class='del'>- *</div><div class='del'>- * Direct IO is not yet supported in the cached mode. </div><div class='del'>- */</div><div class='del'>-static ssize_t</div><div class='del'>-cifs_direct_io(struct kiocb *iocb, struct iov_iter *iter)</div><div class='del'>-{</div><div class='del'>-        /*</div><div class='del'>-         * FIXME</div><div class='del'>-         * Eventually need to support direct IO for non forcedirectio mounts</div><div class='del'>-         */</div><div class='del'>-        return -EINVAL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int cifs_swap_activate(struct swap_info_struct *sis,</div><div class='del'>-			      struct file *swap_file, sector_t *span)</div><div class='del'>-{</div><div class='del'>-	struct cifsFileInfo *cfile = swap_file-&gt;private_data;</div><div class='del'>-	struct inode *inode = swap_file-&gt;f_mapping-&gt;host;</div><div class='del'>-	unsigned long blocks;</div><div class='del'>-	long long isize;</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "swap activate\n");</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-	blocks = inode-&gt;i_blocks;</div><div class='del'>-	isize = inode-&gt;i_size;</div><div class='del'>-	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='del'>-	if (blocks*512 &lt; isize) {</div><div class='del'>-		pr_warn("swap activate: swapfile has holes\n");</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-	*span = sis-&gt;pages;</div><div class='del'>-</div><div class='del'>-	pr_warn_once("Swap support over SMB3 is experimental\n");</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * TODO: consider adding ACL (or documenting how) to prevent other</div><div class='del'>-	 * users (on this or other systems) from reading it</div><div class='del'>-	 */</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-	/* TODO: add sk_set_memalloc(inet) or similar */</div><div class='del'>-</div><div class='del'>-	if (cfile)</div><div class='del'>-		cfile-&gt;swapfile = true;</div><div class='del'>-	/*</div><div class='del'>-	 * TODO: Since file already open, we can't open with DENY_ALL here</div><div class='del'>-	 * but we could add call to grab a byte range lock to prevent others</div><div class='del'>-	 * from reading or writing the file</div><div class='del'>-	 */</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void cifs_swap_deactivate(struct file *file)</div><div class='del'>-{</div><div class='del'>-	struct cifsFileInfo *cfile = file-&gt;private_data;</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "swap deactivate\n");</div><div class='del'>-</div><div class='del'>-	/* TODO: undo sk_set_memalloc(inet) will eventually be needed */</div><div class='del'>-</div><div class='del'>-	if (cfile)</div><div class='del'>-		cfile-&gt;swapfile = false;</div><div class='del'>-</div><div class='del'>-	/* do we need to unpin (or unlock) the file */</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-const struct address_space_operations cifs_addr_ops = {</div><div class='del'>-	.readpage = cifs_readpage,</div><div class='del'>-	.readpages = cifs_readpages,</div><div class='del'>-	.writepage = cifs_writepage,</div><div class='del'>-	.writepages = cifs_writepages,</div><div class='del'>-	.write_begin = cifs_write_begin,</div><div class='del'>-	.write_end = cifs_write_end,</div><div class='del'>-	.set_page_dirty = __set_page_dirty_nobuffers,</div><div class='del'>-	.releasepage = cifs_release_page,</div><div class='del'>-	.direct_IO = cifs_direct_io,</div><div class='del'>-	.invalidatepage = cifs_invalidate_page,</div><div class='del'>-	.launder_page = cifs_launder_page,</div><div class='del'>-	/*</div><div class='del'>-	 * TODO: investigate and if useful we could add an cifs_migratePage</div><div class='del'>-	 * helper (under an CONFIG_MIGRATION) in the future, and also</div><div class='del'>-	 * investigate and add an is_dirty_writeback helper if needed</div><div class='del'>-	 */</div><div class='del'>-	.swap_activate = cifs_swap_activate,</div><div class='del'>-	.swap_deactivate = cifs_swap_deactivate,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * cifs_readpages requires the server to support a buffer large enough to</div><div class='del'>- * contain the header plus one complete page of data.  Otherwise, we need</div><div class='del'>- * to leave cifs_readpages out of the address space operations.</div><div class='del'>- */</div><div class='del'>-const struct address_space_operations cifs_addr_ops_smallbuf = {</div><div class='del'>-	.readpage = cifs_readpage,</div><div class='del'>-	.writepage = cifs_writepage,</div><div class='del'>-	.writepages = cifs_writepages,</div><div class='del'>-	.write_begin = cifs_write_begin,</div><div class='del'>-	.write_end = cifs_write_end,</div><div class='del'>-	.set_page_dirty = __set_page_dirty_nobuffers,</div><div class='del'>-	.releasepage = cifs_release_page,</div><div class='del'>-	.invalidatepage = cifs_invalidate_page,</div><div class='del'>-	.launder_page = cifs_launder_page,</div><div class='del'>-};</div><div class='head'>diff --git a/fs/cifs/fscache.c b/fs/cifs/fscache.c<br/>deleted file mode 100644<br/>index 8eedd20c44ab..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cifs/fscache.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/fscache.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,361 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: LGPL-2.1</div><div class='del'>-/*</div><div class='del'>- *   CIFS filesystem cache interface</div><div class='del'>- *</div><div class='del'>- *   Copyright (c) 2010 Novell, Inc.</div><div class='del'>- *   Author(s): Suresh Jayaraman &lt;sjayaraman@suse.de&gt;</div><div class='del'>- *</div><div class='del'>- */</div><div class='del'>-#include "fscache.h"</div><div class='del'>-#include "cifsglob.h"</div><div class='del'>-#include "cifs_debug.h"</div><div class='del'>-#include "cifs_fs_sb.h"</div><div class='del'>-#include "cifsproto.h"</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Key layout of CIFS server cache index object</div><div class='del'>- */</div><div class='del'>-struct cifs_server_key {</div><div class='del'>-	struct {</div><div class='del'>-		uint16_t	family;		/* address family */</div><div class='del'>-		__be16		port;		/* IP port */</div><div class='del'>-	} hdr;</div><div class='del'>-	union {</div><div class='del'>-		struct in_addr	ipv4_addr;</div><div class='del'>-		struct in6_addr	ipv6_addr;</div><div class='del'>-	};</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Get a cookie for a server object keyed by {IPaddress,port,family} tuple</div><div class='del'>- */</div><div class='del'>-void cifs_fscache_get_client_cookie(struct TCP_Server_Info *server)</div><div class='del'>-{</div><div class='del'>-	const struct sockaddr *sa = (struct sockaddr *) &amp;server-&gt;dstaddr;</div><div class='del'>-	const struct sockaddr_in *addr = (struct sockaddr_in *) sa;</div><div class='del'>-	const struct sockaddr_in6 *addr6 = (struct sockaddr_in6 *) sa;</div><div class='del'>-	struct cifs_server_key key;</div><div class='del'>-	uint16_t key_len = sizeof(key.hdr);</div><div class='del'>-</div><div class='del'>-	memset(&amp;key, 0, sizeof(key));</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Should not be a problem as sin_family/sin6_family overlays</div><div class='del'>-	 * sa_family field</div><div class='del'>-	 */</div><div class='del'>-	key.hdr.family = sa-&gt;sa_family;</div><div class='del'>-	switch (sa-&gt;sa_family) {</div><div class='del'>-	case AF_INET:</div><div class='del'>-		key.hdr.port = addr-&gt;sin_port;</div><div class='del'>-		key.ipv4_addr = addr-&gt;sin_addr;</div><div class='del'>-		key_len += sizeof(key.ipv4_addr);</div><div class='del'>-		break;</div><div class='del'>-</div><div class='del'>-	case AF_INET6:</div><div class='del'>-		key.hdr.port = addr6-&gt;sin6_port;</div><div class='del'>-		key.ipv6_addr = addr6-&gt;sin6_addr;</div><div class='del'>-		key_len += sizeof(key.ipv6_addr);</div><div class='del'>-		break;</div><div class='del'>-</div><div class='del'>-	default:</div><div class='del'>-		cifs_dbg(VFS, "Unknown network family '%d'\n", sa-&gt;sa_family);</div><div class='del'>-		server-&gt;fscache = NULL;</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	server-&gt;fscache =</div><div class='del'>-		fscache_acquire_cookie(cifs_fscache_netfs.primary_index,</div><div class='del'>-				       &amp;cifs_fscache_server_index_def,</div><div class='del'>-				       &amp;key, key_len,</div><div class='del'>-				       NULL, 0,</div><div class='del'>-				       server, 0, true);</div><div class='del'>-	cifs_dbg(FYI, "%s: (0x%p/0x%p)\n",</div><div class='del'>-		 __func__, server, server-&gt;fscache);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void cifs_fscache_release_client_cookie(struct TCP_Server_Info *server)</div><div class='del'>-{</div><div class='del'>-	cifs_dbg(FYI, "%s: (0x%p/0x%p)\n",</div><div class='del'>-		 __func__, server, server-&gt;fscache);</div><div class='del'>-	fscache_relinquish_cookie(server-&gt;fscache, NULL, false);</div><div class='del'>-	server-&gt;fscache = NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void cifs_fscache_get_super_cookie(struct cifs_tcon *tcon)</div><div class='del'>-{</div><div class='del'>-	struct TCP_Server_Info *server = tcon-&gt;ses-&gt;server;</div><div class='del'>-	char *sharename;</div><div class='del'>-	struct cifs_fscache_super_auxdata auxdata;</div><div class='del'>-</div><div class='del'>-	sharename = extract_sharename(tcon-&gt;treeName);</div><div class='del'>-	if (IS_ERR(sharename)) {</div><div class='del'>-		cifs_dbg(FYI, "%s: couldn't extract sharename\n", __func__);</div><div class='del'>-		tcon-&gt;fscache = NULL;</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	memset(&amp;auxdata, 0, sizeof(auxdata));</div><div class='del'>-	auxdata.resource_id = tcon-&gt;resource_id;</div><div class='del'>-	auxdata.vol_create_time = tcon-&gt;vol_create_time;</div><div class='del'>-	auxdata.vol_serial_number = tcon-&gt;vol_serial_number;</div><div class='del'>-</div><div class='del'>-	tcon-&gt;fscache =</div><div class='del'>-		fscache_acquire_cookie(server-&gt;fscache,</div><div class='del'>-				       &amp;cifs_fscache_super_index_def,</div><div class='del'>-				       sharename, strlen(sharename),</div><div class='del'>-				       &amp;auxdata, sizeof(auxdata),</div><div class='del'>-				       tcon, 0, true);</div><div class='del'>-	kfree(sharename);</div><div class='del'>-	cifs_dbg(FYI, "%s: (0x%p/0x%p)\n",</div><div class='del'>-		 __func__, server-&gt;fscache, tcon-&gt;fscache);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void cifs_fscache_release_super_cookie(struct cifs_tcon *tcon)</div><div class='del'>-{</div><div class='del'>-	struct cifs_fscache_super_auxdata auxdata;</div><div class='del'>-</div><div class='del'>-	memset(&amp;auxdata, 0, sizeof(auxdata));</div><div class='del'>-	auxdata.resource_id = tcon-&gt;resource_id;</div><div class='del'>-	auxdata.vol_create_time = tcon-&gt;vol_create_time;</div><div class='del'>-	auxdata.vol_serial_number = tcon-&gt;vol_serial_number;</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "%s: (0x%p)\n", __func__, tcon-&gt;fscache);</div><div class='del'>-	fscache_relinquish_cookie(tcon-&gt;fscache, &amp;auxdata, false);</div><div class='del'>-	tcon-&gt;fscache = NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void cifs_fscache_acquire_inode_cookie(struct cifsInodeInfo *cifsi,</div><div class='del'>-					      struct cifs_tcon *tcon)</div><div class='del'>-{</div><div class='del'>-	struct cifs_fscache_inode_auxdata auxdata;</div><div class='del'>-</div><div class='del'>-	memset(&amp;auxdata, 0, sizeof(auxdata));</div><div class='del'>-	auxdata.eof = cifsi-&gt;server_eof;</div><div class='del'>-	auxdata.last_write_time_sec = cifsi-&gt;vfs_inode.i_mtime.tv_sec;</div><div class='del'>-	auxdata.last_change_time_sec = cifsi-&gt;vfs_inode.i_ctime.tv_sec;</div><div class='del'>-	auxdata.last_write_time_nsec = cifsi-&gt;vfs_inode.i_mtime.tv_nsec;</div><div class='del'>-	auxdata.last_change_time_nsec = cifsi-&gt;vfs_inode.i_ctime.tv_nsec;</div><div class='del'>-</div><div class='del'>-	cifsi-&gt;fscache =</div><div class='del'>-		fscache_acquire_cookie(tcon-&gt;fscache,</div><div class='del'>-				       &amp;cifs_fscache_inode_object_def,</div><div class='del'>-				       &amp;cifsi-&gt;uniqueid, sizeof(cifsi-&gt;uniqueid),</div><div class='del'>-				       &amp;auxdata, sizeof(auxdata),</div><div class='del'>-				       cifsi, cifsi-&gt;vfs_inode.i_size, true);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void cifs_fscache_enable_inode_cookie(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	struct cifsInodeInfo *cifsi = CIFS_I(inode);</div><div class='del'>-	struct cifs_sb_info *cifs_sb = CIFS_SB(inode-&gt;i_sb);</div><div class='del'>-	struct cifs_tcon *tcon = cifs_sb_master_tcon(cifs_sb);</div><div class='del'>-</div><div class='del'>-	if (cifsi-&gt;fscache)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	if (!(cifs_sb-&gt;mnt_cifs_flags &amp; CIFS_MOUNT_FSCACHE))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	cifs_fscache_acquire_inode_cookie(cifsi, tcon);</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "%s: got FH cookie (0x%p/0x%p)\n",</div><div class='del'>-		 __func__, tcon-&gt;fscache, cifsi-&gt;fscache);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void cifs_fscache_release_inode_cookie(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	struct cifs_fscache_inode_auxdata auxdata;</div><div class='del'>-	struct cifsInodeInfo *cifsi = CIFS_I(inode);</div><div class='del'>-</div><div class='del'>-	if (cifsi-&gt;fscache) {</div><div class='del'>-		memset(&amp;auxdata, 0, sizeof(auxdata));</div><div class='del'>-		auxdata.eof = cifsi-&gt;server_eof;</div><div class='del'>-		auxdata.last_write_time_sec = cifsi-&gt;vfs_inode.i_mtime.tv_sec;</div><div class='del'>-		auxdata.last_change_time_sec = cifsi-&gt;vfs_inode.i_ctime.tv_sec;</div><div class='del'>-		auxdata.last_write_time_nsec = cifsi-&gt;vfs_inode.i_mtime.tv_nsec;</div><div class='del'>-		auxdata.last_change_time_nsec = cifsi-&gt;vfs_inode.i_ctime.tv_nsec;</div><div class='del'>-</div><div class='del'>-		cifs_dbg(FYI, "%s: (0x%p)\n", __func__, cifsi-&gt;fscache);</div><div class='del'>-		/* fscache_relinquish_cookie does not seem to update auxdata */</div><div class='del'>-		fscache_update_cookie(cifsi-&gt;fscache, &amp;auxdata);</div><div class='del'>-		fscache_relinquish_cookie(cifsi-&gt;fscache, &amp;auxdata, false);</div><div class='del'>-		cifsi-&gt;fscache = NULL;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void cifs_fscache_update_inode_cookie(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	struct cifs_fscache_inode_auxdata auxdata;</div><div class='del'>-	struct cifsInodeInfo *cifsi = CIFS_I(inode);</div><div class='del'>-</div><div class='del'>-	if (cifsi-&gt;fscache) {</div><div class='del'>-		memset(&amp;auxdata, 0, sizeof(auxdata));</div><div class='del'>-		auxdata.eof = cifsi-&gt;server_eof;</div><div class='del'>-		auxdata.last_write_time_sec = cifsi-&gt;vfs_inode.i_mtime.tv_sec;</div><div class='del'>-		auxdata.last_change_time_sec = cifsi-&gt;vfs_inode.i_ctime.tv_sec;</div><div class='del'>-		auxdata.last_write_time_nsec = cifsi-&gt;vfs_inode.i_mtime.tv_nsec;</div><div class='del'>-		auxdata.last_change_time_nsec = cifsi-&gt;vfs_inode.i_ctime.tv_nsec;</div><div class='del'>-</div><div class='del'>-		cifs_dbg(FYI, "%s: (0x%p)\n", __func__, cifsi-&gt;fscache);</div><div class='del'>-		fscache_update_cookie(cifsi-&gt;fscache, &amp;auxdata);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void cifs_fscache_set_inode_cookie(struct inode *inode, struct file *filp)</div><div class='del'>-{</div><div class='del'>-	cifs_fscache_enable_inode_cookie(inode);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void cifs_fscache_reset_inode_cookie(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	struct cifsInodeInfo *cifsi = CIFS_I(inode);</div><div class='del'>-	struct cifs_sb_info *cifs_sb = CIFS_SB(inode-&gt;i_sb);</div><div class='del'>-	struct cifs_tcon *tcon = cifs_sb_master_tcon(cifs_sb);</div><div class='del'>-	struct fscache_cookie *old = cifsi-&gt;fscache;</div><div class='del'>-</div><div class='del'>-	if (cifsi-&gt;fscache) {</div><div class='del'>-		/* retire the current fscache cache and get a new one */</div><div class='del'>-		fscache_relinquish_cookie(cifsi-&gt;fscache, NULL, true);</div><div class='del'>-</div><div class='del'>-		cifs_fscache_acquire_inode_cookie(cifsi, tcon);</div><div class='del'>-		cifs_dbg(FYI, "%s: new cookie 0x%p oldcookie 0x%p\n",</div><div class='del'>-			 __func__, cifsi-&gt;fscache, old);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int cifs_fscache_release_page(struct page *page, gfp_t gfp)</div><div class='del'>-{</div><div class='del'>-	if (PageFsCache(page)) {</div><div class='del'>-		struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-		struct cifsInodeInfo *cifsi = CIFS_I(inode);</div><div class='del'>-</div><div class='del'>-		cifs_dbg(FYI, "%s: (0x%p/0x%p)\n",</div><div class='del'>-			 __func__, page, cifsi-&gt;fscache);</div><div class='del'>-		if (!fscache_maybe_release_page(cifsi-&gt;fscache, page, gfp))</div><div class='del'>-			return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return 1;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void cifs_readpage_from_fscache_complete(struct page *page, void *ctx,</div><div class='del'>-						int error)</div><div class='del'>-{</div><div class='del'>-	cifs_dbg(FYI, "%s: (0x%p/%d)\n", __func__, page, error);</div><div class='del'>-	if (!error)</div><div class='del'>-		SetPageUptodate(page);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Retrieve a page from FS-Cache</div><div class='del'>- */</div><div class='del'>-int __cifs_readpage_from_fscache(struct inode *inode, struct page *page)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "%s: (fsc:%p, p:%p, i:0x%p\n",</div><div class='del'>-		 __func__, CIFS_I(inode)-&gt;fscache, page, inode);</div><div class='del'>-	ret = fscache_read_or_alloc_page(CIFS_I(inode)-&gt;fscache, page,</div><div class='del'>-					 cifs_readpage_from_fscache_complete,</div><div class='del'>-					 NULL,</div><div class='del'>-					 GFP_KERNEL);</div><div class='del'>-	switch (ret) {</div><div class='del'>-</div><div class='del'>-	case 0: /* page found in fscache, read submitted */</div><div class='del'>-		cifs_dbg(FYI, "%s: submitted\n", __func__);</div><div class='del'>-		return ret;</div><div class='del'>-	case -ENOBUFS:	/* page won't be cached */</div><div class='del'>-	case -ENODATA:	/* page not in cache */</div><div class='del'>-		cifs_dbg(FYI, "%s: %d\n", __func__, ret);</div><div class='del'>-		return 1;</div><div class='del'>-</div><div class='del'>-	default:</div><div class='del'>-		cifs_dbg(VFS, "unknown error ret = %d\n", ret);</div><div class='del'>-	}</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Retrieve a set of pages from FS-Cache</div><div class='del'>- */</div><div class='del'>-int __cifs_readpages_from_fscache(struct inode *inode,</div><div class='del'>-				struct address_space *mapping,</div><div class='del'>-				struct list_head *pages,</div><div class='del'>-				unsigned *nr_pages)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "%s: (0x%p/%u/0x%p)\n",</div><div class='del'>-		 __func__, CIFS_I(inode)-&gt;fscache, *nr_pages, inode);</div><div class='del'>-	ret = fscache_read_or_alloc_pages(CIFS_I(inode)-&gt;fscache, mapping,</div><div class='del'>-					  pages, nr_pages,</div><div class='del'>-					  cifs_readpage_from_fscache_complete,</div><div class='del'>-					  NULL,</div><div class='del'>-					  mapping_gfp_mask(mapping));</div><div class='del'>-	switch (ret) {</div><div class='del'>-	case 0:	/* read submitted to the cache for all pages */</div><div class='del'>-		cifs_dbg(FYI, "%s: submitted\n", __func__);</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	case -ENOBUFS:	/* some pages are not cached and can't be */</div><div class='del'>-	case -ENODATA:	/* some pages are not cached */</div><div class='del'>-		cifs_dbg(FYI, "%s: no page\n", __func__);</div><div class='del'>-		return 1;</div><div class='del'>-</div><div class='del'>-	default:</div><div class='del'>-		cifs_dbg(FYI, "unknown error ret = %d\n", ret);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void __cifs_readpage_to_fscache(struct inode *inode, struct page *page)</div><div class='del'>-{</div><div class='del'>-	struct cifsInodeInfo *cifsi = CIFS_I(inode);</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	WARN_ON(!cifsi-&gt;fscache);</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "%s: (fsc: %p, p: %p, i: %p)\n",</div><div class='del'>-		 __func__, cifsi-&gt;fscache, page, inode);</div><div class='del'>-	ret = fscache_write_page(cifsi-&gt;fscache, page,</div><div class='del'>-				 cifsi-&gt;vfs_inode.i_size, GFP_KERNEL);</div><div class='del'>-	if (ret != 0)</div><div class='del'>-		fscache_uncache_page(cifsi-&gt;fscache, page);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void __cifs_fscache_readpages_cancel(struct inode *inode, struct list_head *pages)</div><div class='del'>-{</div><div class='del'>-	cifs_dbg(FYI, "%s: (fsc: %p, i: %p)\n",</div><div class='del'>-		 __func__, CIFS_I(inode)-&gt;fscache, inode);</div><div class='del'>-	fscache_readpages_cancel(CIFS_I(inode)-&gt;fscache, pages);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void __cifs_fscache_invalidate_page(struct page *page, struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	struct cifsInodeInfo *cifsi = CIFS_I(inode);</div><div class='del'>-	struct fscache_cookie *cookie = cifsi-&gt;fscache;</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "%s: (0x%p/0x%p)\n", __func__, page, cookie);</div><div class='del'>-	fscache_wait_on_page_write(cookie, page);</div><div class='del'>-	fscache_uncache_page(cookie, page);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void __cifs_fscache_wait_on_page_write(struct inode *inode, struct page *page)</div><div class='del'>-{</div><div class='del'>-	struct cifsInodeInfo *cifsi = CIFS_I(inode);</div><div class='del'>-	struct fscache_cookie *cookie = cifsi-&gt;fscache;</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "%s: (0x%p/0x%p)\n", __func__, page, cookie);</div><div class='del'>-	fscache_wait_on_page_write(cookie, page);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void __cifs_fscache_uncache_page(struct inode *inode, struct page *page)</div><div class='del'>-{</div><div class='del'>-	struct cifsInodeInfo *cifsi = CIFS_I(inode);</div><div class='del'>-	struct fscache_cookie *cookie = cifsi-&gt;fscache;</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "%s: (0x%p/0x%p)\n", __func__, page, cookie);</div><div class='del'>-	fscache_uncache_page(cookie, page);</div><div class='del'>-}</div><div class='head'>diff --git a/fs/cifs/fscache.h b/fs/cifs/fscache.h<br/>deleted file mode 100644<br/>index 9baa1d0f22bd..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cifs/fscache.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/fscache.h</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,183 +0,0 @@</div><div class='del'>-/* SPDX-License-Identifier: LGPL-2.1 */</div><div class='del'>-/*</div><div class='del'>- *   CIFS filesystem cache interface definitions</div><div class='del'>- *</div><div class='del'>- *   Copyright (c) 2010 Novell, Inc.</div><div class='del'>- *   Authors(s): Suresh Jayaraman (sjayaraman@suse.de&gt;</div><div class='del'>- *</div><div class='del'>- */</div><div class='del'>-#ifndef _CIFS_FSCACHE_H</div><div class='del'>-#define _CIFS_FSCACHE_H</div><div class='del'>-</div><div class='del'>-#include &lt;linux/fscache.h&gt;</div><div class='del'>-</div><div class='del'>-#include "cifsglob.h"</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_CIFS_FSCACHE</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Auxiliary data attached to CIFS superblock within the cache</div><div class='del'>- */</div><div class='del'>-struct cifs_fscache_super_auxdata {</div><div class='del'>-	u64	resource_id;		/* unique server resource id */</div><div class='del'>-	__le64	vol_create_time;</div><div class='del'>-	u32	vol_serial_number;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Auxiliary data attached to CIFS inode within the cache</div><div class='del'>- */</div><div class='del'>-struct cifs_fscache_inode_auxdata {</div><div class='del'>-	u64 last_write_time_sec;</div><div class='del'>-	u64 last_change_time_sec;</div><div class='del'>-	u32 last_write_time_nsec;</div><div class='del'>-	u32 last_change_time_nsec;</div><div class='del'>-	u64 eof;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * cache.c</div><div class='del'>- */</div><div class='del'>-extern struct fscache_netfs cifs_fscache_netfs;</div><div class='del'>-extern const struct fscache_cookie_def cifs_fscache_server_index_def;</div><div class='del'>-extern const struct fscache_cookie_def cifs_fscache_super_index_def;</div><div class='del'>-extern const struct fscache_cookie_def cifs_fscache_inode_object_def;</div><div class='del'>-</div><div class='del'>-extern int cifs_fscache_register(void);</div><div class='del'>-extern void cifs_fscache_unregister(void);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * fscache.c</div><div class='del'>- */</div><div class='del'>-extern void cifs_fscache_get_client_cookie(struct TCP_Server_Info *);</div><div class='del'>-extern void cifs_fscache_release_client_cookie(struct TCP_Server_Info *);</div><div class='del'>-extern void cifs_fscache_get_super_cookie(struct cifs_tcon *);</div><div class='del'>-extern void cifs_fscache_release_super_cookie(struct cifs_tcon *);</div><div class='del'>-</div><div class='del'>-extern void cifs_fscache_release_inode_cookie(struct inode *);</div><div class='del'>-extern void cifs_fscache_update_inode_cookie(struct inode *inode);</div><div class='del'>-extern void cifs_fscache_set_inode_cookie(struct inode *, struct file *);</div><div class='del'>-extern void cifs_fscache_reset_inode_cookie(struct inode *);</div><div class='del'>-</div><div class='del'>-extern void __cifs_fscache_invalidate_page(struct page *, struct inode *);</div><div class='del'>-extern void __cifs_fscache_wait_on_page_write(struct inode *inode, struct page *page);</div><div class='del'>-extern void __cifs_fscache_uncache_page(struct inode *inode, struct page *page);</div><div class='del'>-extern int cifs_fscache_release_page(struct page *page, gfp_t gfp);</div><div class='del'>-extern int __cifs_readpage_from_fscache(struct inode *, struct page *);</div><div class='del'>-extern int __cifs_readpages_from_fscache(struct inode *,</div><div class='del'>-					 struct address_space *,</div><div class='del'>-					 struct list_head *,</div><div class='del'>-					 unsigned *);</div><div class='del'>-extern void __cifs_fscache_readpages_cancel(struct inode *, struct list_head *);</div><div class='del'>-</div><div class='del'>-extern void __cifs_readpage_to_fscache(struct inode *, struct page *);</div><div class='del'>-</div><div class='del'>-static inline void cifs_fscache_invalidate_page(struct page *page,</div><div class='del'>-					       struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	if (PageFsCache(page))</div><div class='del'>-		__cifs_fscache_invalidate_page(page, inode);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void cifs_fscache_wait_on_page_write(struct inode *inode,</div><div class='del'>-						   struct page *page)</div><div class='del'>-{</div><div class='del'>-	if (PageFsCache(page))</div><div class='del'>-		__cifs_fscache_wait_on_page_write(inode, page);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void cifs_fscache_uncache_page(struct inode *inode,</div><div class='del'>-						   struct page *page)</div><div class='del'>-{</div><div class='del'>-	if (PageFsCache(page))</div><div class='del'>-		__cifs_fscache_uncache_page(inode, page);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline int cifs_readpage_from_fscache(struct inode *inode,</div><div class='del'>-					     struct page *page)</div><div class='del'>-{</div><div class='del'>-	if (CIFS_I(inode)-&gt;fscache)</div><div class='del'>-		return __cifs_readpage_from_fscache(inode, page);</div><div class='del'>-</div><div class='del'>-	return -ENOBUFS;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline int cifs_readpages_from_fscache(struct inode *inode,</div><div class='del'>-					      struct address_space *mapping,</div><div class='del'>-					      struct list_head *pages,</div><div class='del'>-					      unsigned *nr_pages)</div><div class='del'>-{</div><div class='del'>-	if (CIFS_I(inode)-&gt;fscache)</div><div class='del'>-		return __cifs_readpages_from_fscache(inode, mapping, pages,</div><div class='del'>-						     nr_pages);</div><div class='del'>-	return -ENOBUFS;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void cifs_readpage_to_fscache(struct inode *inode,</div><div class='del'>-					    struct page *page)</div><div class='del'>-{</div><div class='del'>-	if (PageFsCache(page))</div><div class='del'>-		__cifs_readpage_to_fscache(inode, page);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void cifs_fscache_readpages_cancel(struct inode *inode,</div><div class='del'>-						 struct list_head *pages)</div><div class='del'>-{</div><div class='del'>-	if (CIFS_I(inode)-&gt;fscache)</div><div class='del'>-		return __cifs_fscache_readpages_cancel(inode, pages);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#else /* CONFIG_CIFS_FSCACHE */</div><div class='del'>-static inline int cifs_fscache_register(void) { return 0; }</div><div class='del'>-static inline void cifs_fscache_unregister(void) {}</div><div class='del'>-</div><div class='del'>-static inline void</div><div class='del'>-cifs_fscache_get_client_cookie(struct TCP_Server_Info *server) {}</div><div class='del'>-static inline void</div><div class='del'>-cifs_fscache_release_client_cookie(struct TCP_Server_Info *server) {}</div><div class='del'>-static inline void cifs_fscache_get_super_cookie(struct cifs_tcon *tcon) {}</div><div class='del'>-static inline void</div><div class='del'>-cifs_fscache_release_super_cookie(struct cifs_tcon *tcon) {}</div><div class='del'>-</div><div class='del'>-static inline void cifs_fscache_release_inode_cookie(struct inode *inode) {}</div><div class='del'>-static inline void cifs_fscache_update_inode_cookie(struct inode *inode) {}</div><div class='del'>-static inline void cifs_fscache_set_inode_cookie(struct inode *inode,</div><div class='del'>-						 struct file *filp) {}</div><div class='del'>-static inline void cifs_fscache_reset_inode_cookie(struct inode *inode) {}</div><div class='del'>-static inline int cifs_fscache_release_page(struct page *page, gfp_t gfp)</div><div class='del'>-{</div><div class='del'>-	return 1; /* May release page */</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void cifs_fscache_invalidate_page(struct page *page,</div><div class='del'>-			struct inode *inode) {}</div><div class='del'>-static inline void cifs_fscache_wait_on_page_write(struct inode *inode,</div><div class='del'>-						   struct page *page) {}</div><div class='del'>-static inline void cifs_fscache_uncache_page(struct inode *inode,</div><div class='del'>-						   struct page *page) {}</div><div class='del'>-</div><div class='del'>-static inline int</div><div class='del'>-cifs_readpage_from_fscache(struct inode *inode, struct page *page)</div><div class='del'>-{</div><div class='del'>-	return -ENOBUFS;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline int cifs_readpages_from_fscache(struct inode *inode,</div><div class='del'>-					      struct address_space *mapping,</div><div class='del'>-					      struct list_head *pages,</div><div class='del'>-					      unsigned *nr_pages)</div><div class='del'>-{</div><div class='del'>-	return -ENOBUFS;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void cifs_readpage_to_fscache(struct inode *inode,</div><div class='del'>-			struct page *page) {}</div><div class='del'>-</div><div class='del'>-static inline void cifs_fscache_readpages_cancel(struct inode *inode,</div><div class='del'>-						 struct list_head *pages)</div><div class='del'>-{</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#endif /* CONFIG_CIFS_FSCACHE */</div><div class='del'>-</div><div class='del'>-#endif /* _CIFS_FSCACHE_H */</div><div class='head'>diff --git a/fs/cifs/smb2inode.c b/fs/cifs/smb2inode.c<br/>deleted file mode 100644<br/>index 8297703492ee..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cifs/smb2inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/smb2inode.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,738 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: LGPL-2.1</div><div class='del'>-/*</div><div class='del'>- *</div><div class='del'>- *   Copyright (C) International Business Machines  Corp., 2002, 2011</div><div class='del'>- *                 Etersoft, 2012</div><div class='del'>- *   Author(s): Pavel Shilovsky (pshilovsky@samba.org),</div><div class='del'>- *              Steve French (sfrench@us.ibm.com)</div><div class='del'>- *</div><div class='del'>- */</div><div class='del'>-#include &lt;linux/fs.h&gt;</div><div class='del'>-#include &lt;linux/stat.h&gt;</div><div class='del'>-#include &lt;linux/slab.h&gt;</div><div class='del'>-#include &lt;linux/pagemap.h&gt;</div><div class='del'>-#include &lt;asm/div64.h&gt;</div><div class='del'>-#include "cifsfs.h"</div><div class='del'>-#include "cifspdu.h"</div><div class='del'>-#include "cifsglob.h"</div><div class='del'>-#include "cifsproto.h"</div><div class='del'>-#include "cifs_debug.h"</div><div class='del'>-#include "cifs_fs_sb.h"</div><div class='del'>-#include "cifs_unicode.h"</div><div class='del'>-#include "fscache.h"</div><div class='del'>-#include "smb2glob.h"</div><div class='del'>-#include "smb2pdu.h"</div><div class='del'>-#include "smb2proto.h"</div><div class='del'>-</div><div class='del'>-static void</div><div class='del'>-free_set_inf_compound(struct smb_rqst *rqst)</div><div class='del'>-{</div><div class='del'>-	if (rqst[1].rq_iov)</div><div class='del'>-		SMB2_set_info_free(&amp;rqst[1]);</div><div class='del'>-	if (rqst[2].rq_iov)</div><div class='del'>-		SMB2_close_free(&amp;rqst[2]);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-struct cop_vars {</div><div class='del'>-	struct cifs_open_parms oparms;</div><div class='del'>-	struct kvec rsp_iov[3];</div><div class='del'>-	struct smb_rqst rqst[3];</div><div class='del'>-	struct kvec open_iov[SMB2_CREATE_IOV_SIZE];</div><div class='del'>-	struct kvec qi_iov[1];</div><div class='del'>-	struct kvec si_iov[SMB2_SET_INFO_IOV_SIZE];</div><div class='del'>-	struct kvec close_iov[1];</div><div class='del'>-	struct smb2_file_rename_info rename_info;</div><div class='del'>-	struct smb2_file_link_info link_info;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-smb2_compound_op(const unsigned int xid, struct cifs_tcon *tcon,</div><div class='del'>-		 struct cifs_sb_info *cifs_sb, const char *full_path,</div><div class='del'>-		 __u32 desired_access, __u32 create_disposition,</div><div class='del'>-		 __u32 create_options, umode_t mode, void *ptr, int command,</div><div class='del'>-		 struct cifsFileInfo *cfile)</div><div class='del'>-{</div><div class='del'>-	struct cop_vars *vars = NULL;</div><div class='del'>-	struct kvec *rsp_iov;</div><div class='del'>-	struct smb_rqst *rqst;</div><div class='del'>-	int rc;</div><div class='del'>-	__le16 *utf16_path = NULL;</div><div class='del'>-	__u8 oplock = SMB2_OPLOCK_LEVEL_NONE;</div><div class='del'>-	struct cifs_fid fid;</div><div class='del'>-	struct cifs_ses *ses = tcon-&gt;ses;</div><div class='del'>-	struct TCP_Server_Info *server;</div><div class='del'>-	int num_rqst = 0;</div><div class='del'>-	int resp_buftype[3];</div><div class='del'>-	struct smb2_query_info_rsp *qi_rsp = NULL;</div><div class='del'>-	int flags = 0;</div><div class='del'>-	__u8 delete_pending[8] = {1, 0, 0, 0, 0, 0, 0, 0};</div><div class='del'>-	unsigned int size[2];</div><div class='del'>-	void *data[2];</div><div class='del'>-	int len;</div><div class='del'>-</div><div class='del'>-	vars = kzalloc(sizeof(*vars), GFP_ATOMIC);</div><div class='del'>-	if (vars == NULL)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	rqst = &amp;vars-&gt;rqst[0];</div><div class='del'>-	rsp_iov = &amp;vars-&gt;rsp_iov[0];</div><div class='del'>-</div><div class='del'>-	server = cifs_pick_channel(ses);</div><div class='del'>-</div><div class='del'>-	if (smb3_encryption_required(tcon))</div><div class='del'>-		flags |= CIFS_TRANSFORM_REQ;</div><div class='del'>-</div><div class='del'>-	resp_buftype[0] = resp_buftype[1] = resp_buftype[2] = CIFS_NO_BUFFER;</div><div class='del'>-</div><div class='del'>-	/* We already have a handle so we can skip the open */</div><div class='del'>-	if (cfile)</div><div class='del'>-		goto after_open;</div><div class='del'>-</div><div class='del'>-	/* Open */</div><div class='del'>-	utf16_path = cifs_convert_path_to_utf16(full_path, cifs_sb);</div><div class='del'>-	if (!utf16_path) {</div><div class='del'>-		rc = -ENOMEM;</div><div class='del'>-		goto finished;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	vars-&gt;oparms.tcon = tcon;</div><div class='del'>-	vars-&gt;oparms.desired_access = desired_access;</div><div class='del'>-	vars-&gt;oparms.disposition = create_disposition;</div><div class='del'>-	vars-&gt;oparms.create_options = cifs_create_options(cifs_sb, create_options);</div><div class='del'>-	vars-&gt;oparms.fid = &amp;fid;</div><div class='del'>-	vars-&gt;oparms.reconnect = false;</div><div class='del'>-	vars-&gt;oparms.mode = mode;</div><div class='del'>-	vars-&gt;oparms.cifs_sb = cifs_sb;</div><div class='del'>-</div><div class='del'>-	rqst[num_rqst].rq_iov = &amp;vars-&gt;open_iov[0];</div><div class='del'>-	rqst[num_rqst].rq_nvec = SMB2_CREATE_IOV_SIZE;</div><div class='del'>-	rc = SMB2_open_init(tcon, server,</div><div class='del'>-			    &amp;rqst[num_rqst], &amp;oplock, &amp;vars-&gt;oparms,</div><div class='del'>-			    utf16_path);</div><div class='del'>-	kfree(utf16_path);</div><div class='del'>-	if (rc)</div><div class='del'>-		goto finished;</div><div class='del'>-</div><div class='del'>-	smb2_set_next_command(tcon, &amp;rqst[num_rqst]);</div><div class='del'>- after_open:</div><div class='del'>-	num_rqst++;</div><div class='del'>-	rc = 0;</div><div class='del'>-</div><div class='del'>-	/* Operation */</div><div class='del'>-	switch (command) {</div><div class='del'>-	case SMB2_OP_QUERY_INFO:</div><div class='del'>-		rqst[num_rqst].rq_iov = &amp;vars-&gt;qi_iov[0];</div><div class='del'>-		rqst[num_rqst].rq_nvec = 1;</div><div class='del'>-</div><div class='del'>-		if (cfile)</div><div class='del'>-			rc = SMB2_query_info_init(tcon, server,</div><div class='del'>-				&amp;rqst[num_rqst],</div><div class='del'>-				cfile-&gt;fid.persistent_fid,</div><div class='del'>-				cfile-&gt;fid.volatile_fid,</div><div class='del'>-				FILE_ALL_INFORMATION,</div><div class='del'>-				SMB2_O_INFO_FILE, 0,</div><div class='del'>-				sizeof(struct smb2_file_all_info) +</div><div class='del'>-					  PATH_MAX * 2, 0, NULL);</div><div class='del'>-		else {</div><div class='del'>-			rc = SMB2_query_info_init(tcon, server,</div><div class='del'>-				&amp;rqst[num_rqst],</div><div class='del'>-				COMPOUND_FID,</div><div class='del'>-				COMPOUND_FID,</div><div class='del'>-				FILE_ALL_INFORMATION,</div><div class='del'>-				SMB2_O_INFO_FILE, 0,</div><div class='del'>-				sizeof(struct smb2_file_all_info) +</div><div class='del'>-					  PATH_MAX * 2, 0, NULL);</div><div class='del'>-			if (!rc) {</div><div class='del'>-				smb2_set_next_command(tcon, &amp;rqst[num_rqst]);</div><div class='del'>-				smb2_set_related(&amp;rqst[num_rqst]);</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (rc)</div><div class='del'>-			goto finished;</div><div class='del'>-		num_rqst++;</div><div class='del'>-		trace_smb3_query_info_compound_enter(xid, ses-&gt;Suid, tcon-&gt;tid,</div><div class='del'>-						     full_path);</div><div class='del'>-		break;</div><div class='del'>-	case SMB2_OP_POSIX_QUERY_INFO:</div><div class='del'>-		rqst[num_rqst].rq_iov = &amp;vars-&gt;qi_iov[0];</div><div class='del'>-		rqst[num_rqst].rq_nvec = 1;</div><div class='del'>-</div><div class='del'>-		if (cfile)</div><div class='del'>-			rc = SMB2_query_info_init(tcon, server,</div><div class='del'>-				&amp;rqst[num_rqst],</div><div class='del'>-				cfile-&gt;fid.persistent_fid,</div><div class='del'>-				cfile-&gt;fid.volatile_fid,</div><div class='del'>-				SMB_FIND_FILE_POSIX_INFO,</div><div class='del'>-				SMB2_O_INFO_FILE, 0,</div><div class='del'>-				/* TBD: fix following to allow for longer SIDs */</div><div class='del'>-				sizeof(struct smb311_posix_qinfo *) + (PATH_MAX * 2) +</div><div class='del'>-				(sizeof(struct cifs_sid) * 2), 0, NULL);</div><div class='del'>-		else {</div><div class='del'>-			rc = SMB2_query_info_init(tcon, server,</div><div class='del'>-				&amp;rqst[num_rqst],</div><div class='del'>-				COMPOUND_FID,</div><div class='del'>-				COMPOUND_FID,</div><div class='del'>-				SMB_FIND_FILE_POSIX_INFO,</div><div class='del'>-				SMB2_O_INFO_FILE, 0,</div><div class='del'>-				sizeof(struct smb311_posix_qinfo *) + (PATH_MAX * 2) +</div><div class='del'>-				(sizeof(struct cifs_sid) * 2), 0, NULL);</div><div class='del'>-			if (!rc) {</div><div class='del'>-				smb2_set_next_command(tcon, &amp;rqst[num_rqst]);</div><div class='del'>-				smb2_set_related(&amp;rqst[num_rqst]);</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (rc)</div><div class='del'>-			goto finished;</div><div class='del'>-		num_rqst++;</div><div class='del'>-		trace_smb3_posix_query_info_compound_enter(xid, ses-&gt;Suid, tcon-&gt;tid, full_path);</div><div class='del'>-		break;</div><div class='del'>-	case SMB2_OP_DELETE:</div><div class='del'>-		trace_smb3_delete_enter(xid, ses-&gt;Suid, tcon-&gt;tid, full_path);</div><div class='del'>-		break;</div><div class='del'>-	case SMB2_OP_MKDIR:</div><div class='del'>-		/*</div><div class='del'>-		 * Directories are created through parameters in the</div><div class='del'>-		 * SMB2_open() call.</div><div class='del'>-		 */</div><div class='del'>-		trace_smb3_mkdir_enter(xid, ses-&gt;Suid, tcon-&gt;tid, full_path);</div><div class='del'>-		break;</div><div class='del'>-	case SMB2_OP_RMDIR:</div><div class='del'>-		rqst[num_rqst].rq_iov = &amp;vars-&gt;si_iov[0];</div><div class='del'>-		rqst[num_rqst].rq_nvec = 1;</div><div class='del'>-</div><div class='del'>-		size[0] = 1; /* sizeof __u8 See MS-FSCC section 2.4.11 */</div><div class='del'>-		data[0] = &amp;delete_pending[0];</div><div class='del'>-</div><div class='del'>-		rc = SMB2_set_info_init(tcon, server,</div><div class='del'>-					&amp;rqst[num_rqst], COMPOUND_FID,</div><div class='del'>-					COMPOUND_FID, current-&gt;tgid,</div><div class='del'>-					FILE_DISPOSITION_INFORMATION,</div><div class='del'>-					SMB2_O_INFO_FILE, 0, data, size);</div><div class='del'>-		if (rc)</div><div class='del'>-			goto finished;</div><div class='del'>-		smb2_set_next_command(tcon, &amp;rqst[num_rqst]);</div><div class='del'>-		smb2_set_related(&amp;rqst[num_rqst++]);</div><div class='del'>-		trace_smb3_rmdir_enter(xid, ses-&gt;Suid, tcon-&gt;tid, full_path);</div><div class='del'>-		break;</div><div class='del'>-	case SMB2_OP_SET_EOF:</div><div class='del'>-		rqst[num_rqst].rq_iov = &amp;vars-&gt;si_iov[0];</div><div class='del'>-		rqst[num_rqst].rq_nvec = 1;</div><div class='del'>-</div><div class='del'>-		size[0] = 8; /* sizeof __le64 */</div><div class='del'>-		data[0] = ptr;</div><div class='del'>-</div><div class='del'>-		rc = SMB2_set_info_init(tcon, server,</div><div class='del'>-					&amp;rqst[num_rqst], COMPOUND_FID,</div><div class='del'>-					COMPOUND_FID, current-&gt;tgid,</div><div class='del'>-					FILE_END_OF_FILE_INFORMATION,</div><div class='del'>-					SMB2_O_INFO_FILE, 0, data, size);</div><div class='del'>-		if (rc)</div><div class='del'>-			goto finished;</div><div class='del'>-		smb2_set_next_command(tcon, &amp;rqst[num_rqst]);</div><div class='del'>-		smb2_set_related(&amp;rqst[num_rqst++]);</div><div class='del'>-		trace_smb3_set_eof_enter(xid, ses-&gt;Suid, tcon-&gt;tid, full_path);</div><div class='del'>-		break;</div><div class='del'>-	case SMB2_OP_SET_INFO:</div><div class='del'>-		rqst[num_rqst].rq_iov = &amp;vars-&gt;si_iov[0];</div><div class='del'>-		rqst[num_rqst].rq_nvec = 1;</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-		size[0] = sizeof(FILE_BASIC_INFO);</div><div class='del'>-		data[0] = ptr;</div><div class='del'>-</div><div class='del'>-		if (cfile)</div><div class='del'>-			rc = SMB2_set_info_init(tcon, server,</div><div class='del'>-				&amp;rqst[num_rqst],</div><div class='del'>-				cfile-&gt;fid.persistent_fid,</div><div class='del'>-				cfile-&gt;fid.volatile_fid, current-&gt;tgid,</div><div class='del'>-				FILE_BASIC_INFORMATION,</div><div class='del'>-				SMB2_O_INFO_FILE, 0, data, size);</div><div class='del'>-		else {</div><div class='del'>-			rc = SMB2_set_info_init(tcon, server,</div><div class='del'>-				&amp;rqst[num_rqst],</div><div class='del'>-				COMPOUND_FID,</div><div class='del'>-				COMPOUND_FID, current-&gt;tgid,</div><div class='del'>-				FILE_BASIC_INFORMATION,</div><div class='del'>-				SMB2_O_INFO_FILE, 0, data, size);</div><div class='del'>-			if (!rc) {</div><div class='del'>-				smb2_set_next_command(tcon, &amp;rqst[num_rqst]);</div><div class='del'>-				smb2_set_related(&amp;rqst[num_rqst]);</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (rc)</div><div class='del'>-			goto finished;</div><div class='del'>-		num_rqst++;</div><div class='del'>-		trace_smb3_set_info_compound_enter(xid, ses-&gt;Suid, tcon-&gt;tid,</div><div class='del'>-						   full_path);</div><div class='del'>-		break;</div><div class='del'>-	case SMB2_OP_RENAME:</div><div class='del'>-		rqst[num_rqst].rq_iov = &amp;vars-&gt;si_iov[0];</div><div class='del'>-		rqst[num_rqst].rq_nvec = 2;</div><div class='del'>-</div><div class='del'>-		len = (2 * UniStrnlen((wchar_t *)ptr, PATH_MAX));</div><div class='del'>-</div><div class='del'>-		vars-&gt;rename_info.ReplaceIfExists = 1;</div><div class='del'>-		vars-&gt;rename_info.RootDirectory = 0;</div><div class='del'>-		vars-&gt;rename_info.FileNameLength = cpu_to_le32(len);</div><div class='del'>-</div><div class='del'>-		size[0] = sizeof(struct smb2_file_rename_info);</div><div class='del'>-		data[0] = &amp;vars-&gt;rename_info;</div><div class='del'>-</div><div class='del'>-		size[1] = len + 2 /* null */;</div><div class='del'>-		data[1] = (__le16 *)ptr;</div><div class='del'>-</div><div class='del'>-		if (cfile)</div><div class='del'>-			rc = SMB2_set_info_init(tcon, server,</div><div class='del'>-						&amp;rqst[num_rqst],</div><div class='del'>-						cfile-&gt;fid.persistent_fid,</div><div class='del'>-						cfile-&gt;fid.volatile_fid,</div><div class='del'>-					current-&gt;tgid, FILE_RENAME_INFORMATION,</div><div class='del'>-					SMB2_O_INFO_FILE, 0, data, size);</div><div class='del'>-		else {</div><div class='del'>-			rc = SMB2_set_info_init(tcon, server,</div><div class='del'>-					&amp;rqst[num_rqst],</div><div class='del'>-					COMPOUND_FID, COMPOUND_FID,</div><div class='del'>-					current-&gt;tgid, FILE_RENAME_INFORMATION,</div><div class='del'>-					SMB2_O_INFO_FILE, 0, data, size);</div><div class='del'>-			if (!rc) {</div><div class='del'>-				smb2_set_next_command(tcon, &amp;rqst[num_rqst]);</div><div class='del'>-				smb2_set_related(&amp;rqst[num_rqst]);</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-		if (rc)</div><div class='del'>-			goto finished;</div><div class='del'>-		num_rqst++;</div><div class='del'>-		trace_smb3_rename_enter(xid, ses-&gt;Suid, tcon-&gt;tid, full_path);</div><div class='del'>-		break;</div><div class='del'>-	case SMB2_OP_HARDLINK:</div><div class='del'>-		rqst[num_rqst].rq_iov = &amp;vars-&gt;si_iov[0];</div><div class='del'>-		rqst[num_rqst].rq_nvec = 2;</div><div class='del'>-</div><div class='del'>-		len = (2 * UniStrnlen((wchar_t *)ptr, PATH_MAX));</div><div class='del'>-</div><div class='del'>-		vars-&gt;link_info.ReplaceIfExists = 0;</div><div class='del'>-		vars-&gt;link_info.RootDirectory = 0;</div><div class='del'>-		vars-&gt;link_info.FileNameLength = cpu_to_le32(len);</div><div class='del'>-</div><div class='del'>-		size[0] = sizeof(struct smb2_file_link_info);</div><div class='del'>-		data[0] = &amp;vars-&gt;link_info;</div><div class='del'>-</div><div class='del'>-		size[1] = len + 2 /* null */;</div><div class='del'>-		data[1] = (__le16 *)ptr;</div><div class='del'>-</div><div class='del'>-		rc = SMB2_set_info_init(tcon, server,</div><div class='del'>-					&amp;rqst[num_rqst], COMPOUND_FID,</div><div class='del'>-					COMPOUND_FID, current-&gt;tgid,</div><div class='del'>-					FILE_LINK_INFORMATION,</div><div class='del'>-					SMB2_O_INFO_FILE, 0, data, size);</div><div class='del'>-		if (rc)</div><div class='del'>-			goto finished;</div><div class='del'>-		smb2_set_next_command(tcon, &amp;rqst[num_rqst]);</div><div class='del'>-		smb2_set_related(&amp;rqst[num_rqst++]);</div><div class='del'>-		trace_smb3_hardlink_enter(xid, ses-&gt;Suid, tcon-&gt;tid, full_path);</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		cifs_dbg(VFS, "Invalid command\n");</div><div class='del'>-		rc = -EINVAL;</div><div class='del'>-	}</div><div class='del'>-	if (rc)</div><div class='del'>-		goto finished;</div><div class='del'>-</div><div class='del'>-	/* We already have a handle so we can skip the close */</div><div class='del'>-	if (cfile)</div><div class='del'>-		goto after_close;</div><div class='del'>-	/* Close */</div><div class='del'>-	flags |= CIFS_CP_CREATE_CLOSE_OP;</div><div class='del'>-	rqst[num_rqst].rq_iov = &amp;vars-&gt;close_iov[0];</div><div class='del'>-	rqst[num_rqst].rq_nvec = 1;</div><div class='del'>-	rc = SMB2_close_init(tcon, server,</div><div class='del'>-			     &amp;rqst[num_rqst], COMPOUND_FID,</div><div class='del'>-			     COMPOUND_FID, false);</div><div class='del'>-	smb2_set_related(&amp;rqst[num_rqst]);</div><div class='del'>-	if (rc)</div><div class='del'>-		goto finished;</div><div class='del'>- after_close:</div><div class='del'>-	num_rqst++;</div><div class='del'>-</div><div class='del'>-	if (cfile) {</div><div class='del'>-		cifsFileInfo_put(cfile);</div><div class='del'>-		cfile = NULL;</div><div class='del'>-		rc = compound_send_recv(xid, ses, server,</div><div class='del'>-					flags, num_rqst - 2,</div><div class='del'>-					&amp;rqst[1], &amp;resp_buftype[1],</div><div class='del'>-					&amp;rsp_iov[1]);</div><div class='del'>-	} else</div><div class='del'>-		rc = compound_send_recv(xid, ses, server,</div><div class='del'>-					flags, num_rqst,</div><div class='del'>-					rqst, resp_buftype,</div><div class='del'>-					rsp_iov);</div><div class='del'>-</div><div class='del'>- finished:</div><div class='del'>-	if (cfile)</div><div class='del'>-		cifsFileInfo_put(cfile);</div><div class='del'>-</div><div class='del'>-	SMB2_open_free(&amp;rqst[0]);</div><div class='del'>-	if (rc == -EREMCHG) {</div><div class='del'>-		pr_warn_once("server share %s deleted\n", tcon-&gt;treeName);</div><div class='del'>-		tcon-&gt;need_reconnect = true;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	switch (command) {</div><div class='del'>-	case SMB2_OP_QUERY_INFO:</div><div class='del'>-		if (rc == 0) {</div><div class='del'>-			qi_rsp = (struct smb2_query_info_rsp *)</div><div class='del'>-				rsp_iov[1].iov_base;</div><div class='del'>-			rc = smb2_validate_and_copy_iov(</div><div class='del'>-				le16_to_cpu(qi_rsp-&gt;OutputBufferOffset),</div><div class='del'>-				le32_to_cpu(qi_rsp-&gt;OutputBufferLength),</div><div class='del'>-				&amp;rsp_iov[1], sizeof(struct smb2_file_all_info),</div><div class='del'>-				ptr);</div><div class='del'>-		}</div><div class='del'>-		if (rqst[1].rq_iov)</div><div class='del'>-			SMB2_query_info_free(&amp;rqst[1]);</div><div class='del'>-		if (rqst[2].rq_iov)</div><div class='del'>-			SMB2_close_free(&amp;rqst[2]);</div><div class='del'>-		if (rc)</div><div class='del'>-			trace_smb3_query_info_compound_err(xid,  ses-&gt;Suid,</div><div class='del'>-						tcon-&gt;tid, rc);</div><div class='del'>-		else</div><div class='del'>-			trace_smb3_query_info_compound_done(xid, ses-&gt;Suid,</div><div class='del'>-						tcon-&gt;tid);</div><div class='del'>-		break;</div><div class='del'>-	case SMB2_OP_POSIX_QUERY_INFO:</div><div class='del'>-		if (rc == 0) {</div><div class='del'>-			qi_rsp = (struct smb2_query_info_rsp *)</div><div class='del'>-				rsp_iov[1].iov_base;</div><div class='del'>-			rc = smb2_validate_and_copy_iov(</div><div class='del'>-				le16_to_cpu(qi_rsp-&gt;OutputBufferOffset),</div><div class='del'>-				le32_to_cpu(qi_rsp-&gt;OutputBufferLength),</div><div class='del'>-				&amp;rsp_iov[1], sizeof(struct smb311_posix_qinfo) /* add SIDs */, ptr);</div><div class='del'>-		}</div><div class='del'>-		if (rqst[1].rq_iov)</div><div class='del'>-			SMB2_query_info_free(&amp;rqst[1]);</div><div class='del'>-		if (rqst[2].rq_iov)</div><div class='del'>-			SMB2_close_free(&amp;rqst[2]);</div><div class='del'>-		if (rc)</div><div class='del'>-			trace_smb3_posix_query_info_compound_err(xid,  ses-&gt;Suid, tcon-&gt;tid, rc);</div><div class='del'>-		else</div><div class='del'>-			trace_smb3_posix_query_info_compound_done(xid, ses-&gt;Suid, tcon-&gt;tid);</div><div class='del'>-		break;</div><div class='del'>-	case SMB2_OP_DELETE:</div><div class='del'>-		if (rc)</div><div class='del'>-			trace_smb3_delete_err(xid,  ses-&gt;Suid, tcon-&gt;tid, rc);</div><div class='del'>-		else</div><div class='del'>-			trace_smb3_delete_done(xid, ses-&gt;Suid, tcon-&gt;tid);</div><div class='del'>-		if (rqst[1].rq_iov)</div><div class='del'>-			SMB2_close_free(&amp;rqst[1]);</div><div class='del'>-		break;</div><div class='del'>-	case SMB2_OP_MKDIR:</div><div class='del'>-		if (rc)</div><div class='del'>-			trace_smb3_mkdir_err(xid,  ses-&gt;Suid, tcon-&gt;tid, rc);</div><div class='del'>-		else</div><div class='del'>-			trace_smb3_mkdir_done(xid, ses-&gt;Suid, tcon-&gt;tid);</div><div class='del'>-		if (rqst[1].rq_iov)</div><div class='del'>-			SMB2_close_free(&amp;rqst[1]);</div><div class='del'>-		break;</div><div class='del'>-	case SMB2_OP_HARDLINK:</div><div class='del'>-		if (rc)</div><div class='del'>-			trace_smb3_hardlink_err(xid,  ses-&gt;Suid, tcon-&gt;tid, rc);</div><div class='del'>-		else</div><div class='del'>-			trace_smb3_hardlink_done(xid, ses-&gt;Suid, tcon-&gt;tid);</div><div class='del'>-		free_set_inf_compound(rqst);</div><div class='del'>-		break;</div><div class='del'>-	case SMB2_OP_RENAME:</div><div class='del'>-		if (rc)</div><div class='del'>-			trace_smb3_rename_err(xid,  ses-&gt;Suid, tcon-&gt;tid, rc);</div><div class='del'>-		else</div><div class='del'>-			trace_smb3_rename_done(xid, ses-&gt;Suid, tcon-&gt;tid);</div><div class='del'>-		free_set_inf_compound(rqst);</div><div class='del'>-		break;</div><div class='del'>-	case SMB2_OP_RMDIR:</div><div class='del'>-		if (rc)</div><div class='del'>-			trace_smb3_rmdir_err(xid,  ses-&gt;Suid, tcon-&gt;tid, rc);</div><div class='del'>-		else</div><div class='del'>-			trace_smb3_rmdir_done(xid, ses-&gt;Suid, tcon-&gt;tid);</div><div class='del'>-		free_set_inf_compound(rqst);</div><div class='del'>-		break;</div><div class='del'>-	case SMB2_OP_SET_EOF:</div><div class='del'>-		if (rc)</div><div class='del'>-			trace_smb3_set_eof_err(xid,  ses-&gt;Suid, tcon-&gt;tid, rc);</div><div class='del'>-		else</div><div class='del'>-			trace_smb3_set_eof_done(xid, ses-&gt;Suid, tcon-&gt;tid);</div><div class='del'>-		free_set_inf_compound(rqst);</div><div class='del'>-		break;</div><div class='del'>-	case SMB2_OP_SET_INFO:</div><div class='del'>-		if (rc)</div><div class='del'>-			trace_smb3_set_info_compound_err(xid,  ses-&gt;Suid,</div><div class='del'>-						tcon-&gt;tid, rc);</div><div class='del'>-		else</div><div class='del'>-			trace_smb3_set_info_compound_done(xid, ses-&gt;Suid,</div><div class='del'>-						tcon-&gt;tid);</div><div class='del'>-		free_set_inf_compound(rqst);</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-	free_rsp_buf(resp_buftype[0], rsp_iov[0].iov_base);</div><div class='del'>-	free_rsp_buf(resp_buftype[1], rsp_iov[1].iov_base);</div><div class='del'>-	free_rsp_buf(resp_buftype[2], rsp_iov[2].iov_base);</div><div class='del'>-	kfree(vars);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void</div><div class='del'>-move_smb2_info_to_cifs(FILE_ALL_INFO *dst, struct smb2_file_all_info *src)</div><div class='del'>-{</div><div class='del'>-	memcpy(dst, src, (size_t)(&amp;src-&gt;CurrentByteOffset) - (size_t)src);</div><div class='del'>-	dst-&gt;CurrentByteOffset = src-&gt;CurrentByteOffset;</div><div class='del'>-	dst-&gt;Mode = src-&gt;Mode;</div><div class='del'>-	dst-&gt;AlignmentRequirement = src-&gt;AlignmentRequirement;</div><div class='del'>-	dst-&gt;IndexNumber1 = 0; /* we don't use it */</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int</div><div class='del'>-smb2_query_path_info(const unsigned int xid, struct cifs_tcon *tcon,</div><div class='del'>-		     struct cifs_sb_info *cifs_sb, const char *full_path,</div><div class='del'>-		     FILE_ALL_INFO *data, bool *adjust_tz, bool *reparse)</div><div class='del'>-{</div><div class='del'>-	int rc;</div><div class='del'>-	struct smb2_file_all_info *smb2_data;</div><div class='del'>-	__u32 create_options = 0;</div><div class='del'>-	struct cifsFileInfo *cfile;</div><div class='del'>-	struct cached_fid *cfid = NULL;</div><div class='del'>-</div><div class='del'>-	*adjust_tz = false;</div><div class='del'>-	*reparse = false;</div><div class='del'>-</div><div class='del'>-	smb2_data = kzalloc(sizeof(struct smb2_file_all_info) + PATH_MAX * 2,</div><div class='del'>-			    GFP_KERNEL);</div><div class='del'>-	if (smb2_data == NULL)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	/* If it is a root and its handle is cached then use it */</div><div class='del'>-	rc = open_cached_dir(xid, tcon, full_path, cifs_sb, &amp;cfid);</div><div class='del'>-	if (!rc) {</div><div class='del'>-		if (tcon-&gt;crfid.file_all_info_is_valid) {</div><div class='del'>-			move_smb2_info_to_cifs(data,</div><div class='del'>-					       &amp;tcon-&gt;crfid.file_all_info);</div><div class='del'>-		} else {</div><div class='del'>-			rc = SMB2_query_info(xid, tcon,</div><div class='del'>-					     cfid-&gt;fid-&gt;persistent_fid,</div><div class='del'>-					     cfid-&gt;fid-&gt;volatile_fid, smb2_data);</div><div class='del'>-			if (!rc)</div><div class='del'>-				move_smb2_info_to_cifs(data, smb2_data);</div><div class='del'>-		}</div><div class='del'>-		close_cached_dir(cfid);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	cifs_get_readable_path(tcon, full_path, &amp;cfile);</div><div class='del'>-	rc = smb2_compound_op(xid, tcon, cifs_sb, full_path,</div><div class='del'>-			      FILE_READ_ATTRIBUTES, FILE_OPEN, create_options,</div><div class='del'>-			      ACL_NO_MODE, smb2_data, SMB2_OP_QUERY_INFO, cfile);</div><div class='del'>-	if (rc == -EOPNOTSUPP) {</div><div class='del'>-		*reparse = true;</div><div class='del'>-		create_options |= OPEN_REPARSE_POINT;</div><div class='del'>-</div><div class='del'>-		/* Failed on a symbolic link - query a reparse point info */</div><div class='del'>-		rc = smb2_compound_op(xid, tcon, cifs_sb, full_path,</div><div class='del'>-				      FILE_READ_ATTRIBUTES, FILE_OPEN,</div><div class='del'>-				      create_options, ACL_NO_MODE,</div><div class='del'>-				      smb2_data, SMB2_OP_QUERY_INFO, NULL);</div><div class='del'>-	}</div><div class='del'>-	if (rc)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	move_smb2_info_to_cifs(data, smb2_data);</div><div class='del'>-out:</div><div class='del'>-	kfree(smb2_data);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-int</div><div class='del'>-smb311_posix_query_path_info(const unsigned int xid, struct cifs_tcon *tcon,</div><div class='del'>-		     struct cifs_sb_info *cifs_sb, const char *full_path,</div><div class='del'>-		     struct smb311_posix_qinfo *data, bool *adjust_tz, bool *reparse)</div><div class='del'>-{</div><div class='del'>-	int rc;</div><div class='del'>-	__u32 create_options = 0;</div><div class='del'>-	struct cifsFileInfo *cfile;</div><div class='del'>-	struct smb311_posix_qinfo *smb2_data;</div><div class='del'>-</div><div class='del'>-	*adjust_tz = false;</div><div class='del'>-	*reparse = false;</div><div class='del'>-</div><div class='del'>-	/* BB TODO: Make struct larger when add support for parsing owner SIDs */</div><div class='del'>-	smb2_data = kzalloc(sizeof(struct smb311_posix_qinfo),</div><div class='del'>-			    GFP_KERNEL);</div><div class='del'>-	if (smb2_data == NULL)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * BB TODO: Add support for using the cached root handle.</div><div class='del'>-	 * Create SMB2_query_posix_info worker function to do non-compounded query</div><div class='del'>-	 * when we already have an open file handle for this. For now this is fast enough</div><div class='del'>-	 * (always using the compounded version).</div><div class='del'>-	 */</div><div class='del'>-</div><div class='del'>-	cifs_get_readable_path(tcon, full_path, &amp;cfile);</div><div class='del'>-	rc = smb2_compound_op(xid, tcon, cifs_sb, full_path,</div><div class='del'>-			      FILE_READ_ATTRIBUTES, FILE_OPEN, create_options,</div><div class='del'>-			      ACL_NO_MODE, smb2_data, SMB2_OP_POSIX_QUERY_INFO, cfile);</div><div class='del'>-	if (rc == -EOPNOTSUPP) {</div><div class='del'>-		/* BB TODO: When support for special files added to Samba re-verify this path */</div><div class='del'>-		*reparse = true;</div><div class='del'>-		create_options |= OPEN_REPARSE_POINT;</div><div class='del'>-</div><div class='del'>-		/* Failed on a symbolic link - query a reparse point info */</div><div class='del'>-		rc = smb2_compound_op(xid, tcon, cifs_sb, full_path,</div><div class='del'>-				      FILE_READ_ATTRIBUTES, FILE_OPEN,</div><div class='del'>-				      create_options, ACL_NO_MODE,</div><div class='del'>-				      smb2_data, SMB2_OP_POSIX_QUERY_INFO, NULL);</div><div class='del'>-	}</div><div class='del'>-	if (rc)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	 /* TODO: will need to allow for the 2 SIDs when add support for getting owner UID/GID */</div><div class='del'>-	memcpy(data, smb2_data, sizeof(struct smb311_posix_qinfo));</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	kfree(smb2_data);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int</div><div class='del'>-smb2_mkdir(const unsigned int xid, struct inode *parent_inode, umode_t mode,</div><div class='del'>-	   struct cifs_tcon *tcon, const char *name,</div><div class='del'>-	   struct cifs_sb_info *cifs_sb)</div><div class='del'>-{</div><div class='del'>-	return smb2_compound_op(xid, tcon, cifs_sb, name,</div><div class='del'>-				FILE_WRITE_ATTRIBUTES, FILE_CREATE,</div><div class='del'>-				CREATE_NOT_FILE, mode, NULL, SMB2_OP_MKDIR,</div><div class='del'>-				NULL);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void</div><div class='del'>-smb2_mkdir_setinfo(struct inode *inode, const char *name,</div><div class='del'>-		   struct cifs_sb_info *cifs_sb, struct cifs_tcon *tcon,</div><div class='del'>-		   const unsigned int xid)</div><div class='del'>-{</div><div class='del'>-	FILE_BASIC_INFO data;</div><div class='del'>-	struct cifsInodeInfo *cifs_i;</div><div class='del'>-	struct cifsFileInfo *cfile;</div><div class='del'>-	u32 dosattrs;</div><div class='del'>-	int tmprc;</div><div class='del'>-</div><div class='del'>-	memset(&amp;data, 0, sizeof(data));</div><div class='del'>-	cifs_i = CIFS_I(inode);</div><div class='del'>-	dosattrs = cifs_i-&gt;cifsAttrs | ATTR_READONLY;</div><div class='del'>-	data.Attributes = cpu_to_le32(dosattrs);</div><div class='del'>-	cifs_get_writable_path(tcon, name, FIND_WR_ANY, &amp;cfile);</div><div class='del'>-	tmprc = smb2_compound_op(xid, tcon, cifs_sb, name,</div><div class='del'>-				 FILE_WRITE_ATTRIBUTES, FILE_CREATE,</div><div class='del'>-				 CREATE_NOT_FILE, ACL_NO_MODE,</div><div class='del'>-				 &amp;data, SMB2_OP_SET_INFO, cfile);</div><div class='del'>-	if (tmprc == 0)</div><div class='del'>-		cifs_i-&gt;cifsAttrs = dosattrs;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int</div><div class='del'>-smb2_rmdir(const unsigned int xid, struct cifs_tcon *tcon, const char *name,</div><div class='del'>-	   struct cifs_sb_info *cifs_sb)</div><div class='del'>-{</div><div class='del'>-	return smb2_compound_op(xid, tcon, cifs_sb, name, DELETE, FILE_OPEN,</div><div class='del'>-				CREATE_NOT_FILE, ACL_NO_MODE,</div><div class='del'>-				NULL, SMB2_OP_RMDIR, NULL);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int</div><div class='del'>-smb2_unlink(const unsigned int xid, struct cifs_tcon *tcon, const char *name,</div><div class='del'>-	    struct cifs_sb_info *cifs_sb)</div><div class='del'>-{</div><div class='del'>-	return smb2_compound_op(xid, tcon, cifs_sb, name, DELETE, FILE_OPEN,</div><div class='del'>-				CREATE_DELETE_ON_CLOSE | OPEN_REPARSE_POINT,</div><div class='del'>-				ACL_NO_MODE, NULL, SMB2_OP_DELETE, NULL);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-smb2_set_path_attr(const unsigned int xid, struct cifs_tcon *tcon,</div><div class='del'>-		   const char *from_name, const char *to_name,</div><div class='del'>-		   struct cifs_sb_info *cifs_sb, __u32 access, int command,</div><div class='del'>-		   struct cifsFileInfo *cfile)</div><div class='del'>-{</div><div class='del'>-	__le16 *smb2_to_name = NULL;</div><div class='del'>-	int rc;</div><div class='del'>-</div><div class='del'>-	smb2_to_name = cifs_convert_path_to_utf16(to_name, cifs_sb);</div><div class='del'>-	if (smb2_to_name == NULL) {</div><div class='del'>-		rc = -ENOMEM;</div><div class='del'>-		goto smb2_rename_path;</div><div class='del'>-	}</div><div class='del'>-	rc = smb2_compound_op(xid, tcon, cifs_sb, from_name, access,</div><div class='del'>-			      FILE_OPEN, 0, ACL_NO_MODE, smb2_to_name,</div><div class='del'>-			      command, cfile);</div><div class='del'>-smb2_rename_path:</div><div class='del'>-	kfree(smb2_to_name);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int</div><div class='del'>-smb2_rename_path(const unsigned int xid, struct cifs_tcon *tcon,</div><div class='del'>-		 const char *from_name, const char *to_name,</div><div class='del'>-		 struct cifs_sb_info *cifs_sb)</div><div class='del'>-{</div><div class='del'>-	struct cifsFileInfo *cfile;</div><div class='del'>-</div><div class='del'>-	cifs_get_writable_path(tcon, from_name, FIND_WR_WITH_DELETE, &amp;cfile);</div><div class='del'>-</div><div class='del'>-	return smb2_set_path_attr(xid, tcon, from_name, to_name,</div><div class='del'>-				  cifs_sb, DELETE, SMB2_OP_RENAME, cfile);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int</div><div class='del'>-smb2_create_hardlink(const unsigned int xid, struct cifs_tcon *tcon,</div><div class='del'>-		     const char *from_name, const char *to_name,</div><div class='del'>-		     struct cifs_sb_info *cifs_sb)</div><div class='del'>-{</div><div class='del'>-	return smb2_set_path_attr(xid, tcon, from_name, to_name, cifs_sb,</div><div class='del'>-				  FILE_READ_ATTRIBUTES, SMB2_OP_HARDLINK,</div><div class='del'>-				  NULL);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int</div><div class='del'>-smb2_set_path_size(const unsigned int xid, struct cifs_tcon *tcon,</div><div class='del'>-		   const char *full_path, __u64 size,</div><div class='del'>-		   struct cifs_sb_info *cifs_sb, bool set_alloc)</div><div class='del'>-{</div><div class='del'>-	__le64 eof = cpu_to_le64(size);</div><div class='del'>-</div><div class='del'>-	return smb2_compound_op(xid, tcon, cifs_sb, full_path,</div><div class='del'>-				FILE_WRITE_DATA, FILE_OPEN, 0, ACL_NO_MODE,</div><div class='del'>-				&amp;eof, SMB2_OP_SET_EOF, NULL);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int</div><div class='del'>-smb2_set_file_info(struct inode *inode, const char *full_path,</div><div class='del'>-		   FILE_BASIC_INFO *buf, const unsigned int xid)</div><div class='del'>-{</div><div class='del'>-	struct cifs_sb_info *cifs_sb = CIFS_SB(inode-&gt;i_sb);</div><div class='del'>-	struct tcon_link *tlink;</div><div class='del'>-	int rc;</div><div class='del'>-</div><div class='del'>-	if ((buf-&gt;CreationTime == 0) &amp;&amp; (buf-&gt;LastAccessTime == 0) &amp;&amp;</div><div class='del'>-	    (buf-&gt;LastWriteTime == 0) &amp;&amp; (buf-&gt;ChangeTime == 0) &amp;&amp;</div><div class='del'>-	    (buf-&gt;Attributes == 0))</div><div class='del'>-		return 0; /* would be a no op, no sense sending this */</div><div class='del'>-</div><div class='del'>-	tlink = cifs_sb_tlink(cifs_sb);</div><div class='del'>-	if (IS_ERR(tlink))</div><div class='del'>-		return PTR_ERR(tlink);</div><div class='del'>-</div><div class='del'>-	rc = smb2_compound_op(xid, tlink_tcon(tlink), cifs_sb, full_path,</div><div class='del'>-			      FILE_WRITE_ATTRIBUTES, FILE_OPEN,</div><div class='del'>-			      0, ACL_NO_MODE, buf, SMB2_OP_SET_INFO, NULL);</div><div class='del'>-	cifs_put_tlink(tlink);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='head'>diff --git a/fs/cifs/smb2pdu.h b/fs/cifs/smb2pdu.h<br/>deleted file mode 100644<br/>index 33cfd0a1adf1..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cifs/smb2pdu.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/smb2pdu.h</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,1007 +0,0 @@</div><div class='del'>-/* SPDX-License-Identifier: LGPL-2.1 */</div><div class='del'>-/*</div><div class='del'>- *</div><div class='del'>- *   Copyright (c) International Business Machines  Corp., 2009, 2013</div><div class='del'>- *                 Etersoft, 2012</div><div class='del'>- *   Author(s): Steve French (sfrench@us.ibm.com)</div><div class='del'>- *              Pavel Shilovsky (pshilovsky@samba.org) 2012</div><div class='del'>- *</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#ifndef _SMB2PDU_H</div><div class='del'>-#define _SMB2PDU_H</div><div class='del'>-</div><div class='del'>-#include &lt;net/sock.h&gt;</div><div class='del'>-#include "cifsacl.h"</div><div class='del'>-</div><div class='del'>-/* 52 transform hdr + 64 hdr + 88 create rsp */</div><div class='del'>-#define SMB2_TRANSFORM_HEADER_SIZE 52</div><div class='del'>-#define MAX_SMB2_HDR_SIZE 204</div><div class='del'>-</div><div class='del'>-/* The total header size for SMB2 read and write */</div><div class='del'>-#define SMB2_READWRITE_PDU_HEADER_SIZE (48 + sizeof(struct smb2_hdr))</div><div class='del'>-</div><div class='del'>-/* See MS-SMB2 2.2.43 */</div><div class='del'>-struct smb2_rdma_transform {</div><div class='del'>-	__le16 RdmaDescriptorOffset;</div><div class='del'>-	__le16 RdmaDescriptorLength;</div><div class='del'>-	__le32 Channel; /* for values see channel description in smb2 read above */</div><div class='del'>-	__le16 TransformCount;</div><div class='del'>-	__le16 Reserved1;</div><div class='del'>-	__le32 Reserved2;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* TransformType */</div><div class='del'>-#define SMB2_RDMA_TRANSFORM_TYPE_ENCRYPTION	0x0001</div><div class='del'>-#define SMB2_RDMA_TRANSFORM_TYPE_SIGNING	0x0002</div><div class='del'>-</div><div class='del'>-struct smb2_rdma_crypto_transform {</div><div class='del'>-	__le16	TransformType;</div><div class='del'>-	__le16	SignatureLength;</div><div class='del'>-	__le16	NonceLength;</div><div class='del'>-	__u16	Reserved;</div><div class='del'>-	__u8	Signature[]; /* variable length */</div><div class='del'>-	/* u8 Nonce[] */</div><div class='del'>-	/* followed by padding */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- *	Definitions for SMB2 Protocol Data Units (network frames)</div><div class='del'>- *</div><div class='del'>- *  See MS-SMB2.PDF specification for protocol details.</div><div class='del'>- *  The Naming convention is the lower case version of the SMB2</div><div class='del'>- *  command code name for the struct. Note that structures must be packed.</div><div class='del'>- *</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#define COMPOUND_FID 0xFFFFFFFFFFFFFFFFULL</div><div class='del'>-</div><div class='del'>-#define SMB2_ERROR_STRUCTURE_SIZE2 cpu_to_le16(9)</div><div class='del'>-</div><div class='del'>-struct smb2_err_rsp {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize;</div><div class='del'>-	__le16 Reserved; /* MBZ */</div><div class='del'>-	__le32 ByteCount;  /* even if zero, at least one byte follows */</div><div class='del'>-	__u8   ErrorData[1];  /* variable length */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define SYMLINK_ERROR_TAG 0x4c4d5953</div><div class='del'>-</div><div class='del'>-struct smb2_symlink_err_rsp {</div><div class='del'>-	__le32 SymLinkLength;</div><div class='del'>-	__le32 SymLinkErrorTag;</div><div class='del'>-	__le32 ReparseTag;</div><div class='del'>-	__le16 ReparseDataLength;</div><div class='del'>-	__le16 UnparsedPathLength;</div><div class='del'>-	__le16 SubstituteNameOffset;</div><div class='del'>-	__le16 SubstituteNameLength;</div><div class='del'>-	__le16 PrintNameOffset;</div><div class='del'>-	__le16 PrintNameLength;</div><div class='del'>-	__le32 Flags;</div><div class='del'>-	__u8  PathBuffer[];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* SMB 3.1.1 and later dialects. See MS-SMB2 section 2.2.2.1 */</div><div class='del'>-struct smb2_error_context_rsp {</div><div class='del'>-	__le32 ErrorDataLength;</div><div class='del'>-	__le32 ErrorId;</div><div class='del'>-	__u8  ErrorContextData; /* ErrorDataLength long array */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* ErrorId values */</div><div class='del'>-#define SMB2_ERROR_ID_DEFAULT		0x00000000</div><div class='del'>-#define SMB2_ERROR_ID_SHARE_REDIRECT	cpu_to_le32(0x72645253)	/* "rdRS" */</div><div class='del'>-</div><div class='del'>-/* Defines for Type field below (see MS-SMB2 2.2.2.2.2.1) */</div><div class='del'>-#define MOVE_DST_IPADDR_V4	cpu_to_le32(0x00000001)</div><div class='del'>-#define MOVE_DST_IPADDR_V6	cpu_to_le32(0x00000002)</div><div class='del'>-</div><div class='del'>-struct move_dst_ipaddr {</div><div class='del'>-	__le32 Type;</div><div class='del'>-	__u32  Reserved;</div><div class='del'>-	__u8   address[16]; /* IPv4 followed by 12 bytes rsvd or IPv6 address */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct share_redirect_error_context_rsp {</div><div class='del'>-	__le32 StructureSize;</div><div class='del'>-	__le32 NotificationType;</div><div class='del'>-	__le32 ResourceNameOffset;</div><div class='del'>-	__le32 ResourceNameLength;</div><div class='del'>-	__le16 Reserved;</div><div class='del'>-	__le16 TargetType;</div><div class='del'>-	__le32 IPAddrCount;</div><div class='del'>-	struct move_dst_ipaddr IpAddrMoveList[];</div><div class='del'>-	/* __u8 ResourceName[] */ /* Name of share as counted Unicode string */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Maximum number of iovs we need for an open/create request.</div><div class='del'>- * [0] : struct smb2_create_req</div><div class='del'>- * [1] : path</div><div class='del'>- * [2] : lease context</div><div class='del'>- * [3] : durable context</div><div class='del'>- * [4] : posix context</div><div class='del'>- * [5] : time warp context</div><div class='del'>- * [6] : query id context</div><div class='del'>- * [7] : compound padding</div><div class='del'>- */</div><div class='del'>-#define SMB2_CREATE_IOV_SIZE 8</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Maximum size of a SMB2_CREATE response is 64 (smb2 header) +</div><div class='del'>- * 88 (fixed part of create response) + 520 (path) + 208 (contexts) +</div><div class='del'>- * 2 bytes of padding.</div><div class='del'>- */</div><div class='del'>-#define MAX_SMB2_CREATE_RESPONSE_SIZE 880</div><div class='del'>-</div><div class='del'>-#define SMB2_LEASE_READ_CACHING_HE	0x01</div><div class='del'>-#define SMB2_LEASE_HANDLE_CACHING_HE	0x02</div><div class='del'>-#define SMB2_LEASE_WRITE_CACHING_HE	0x04</div><div class='del'>-</div><div class='del'>-#define SMB2_LEASE_NONE			cpu_to_le32(0x00)</div><div class='del'>-#define SMB2_LEASE_READ_CACHING		cpu_to_le32(0x01)</div><div class='del'>-#define SMB2_LEASE_HANDLE_CACHING	cpu_to_le32(0x02)</div><div class='del'>-#define SMB2_LEASE_WRITE_CACHING	cpu_to_le32(0x04)</div><div class='del'>-</div><div class='del'>-#define SMB2_LEASE_FLAG_BREAK_IN_PROGRESS cpu_to_le32(0x00000002)</div><div class='del'>-#define SMB2_LEASE_FLAG_PARENT_LEASE_KEY_SET cpu_to_le32(0x00000004)</div><div class='del'>-</div><div class='del'>-#define SMB2_LEASE_KEY_SIZE 16</div><div class='del'>-</div><div class='del'>-struct lease_context {</div><div class='del'>-	u8 LeaseKey[SMB2_LEASE_KEY_SIZE];</div><div class='del'>-	__le32 LeaseState;</div><div class='del'>-	__le32 LeaseFlags;</div><div class='del'>-	__le64 LeaseDuration;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct lease_context_v2 {</div><div class='del'>-	u8 LeaseKey[SMB2_LEASE_KEY_SIZE];</div><div class='del'>-	__le32 LeaseState;</div><div class='del'>-	__le32 LeaseFlags;</div><div class='del'>-	__le64 LeaseDuration;</div><div class='del'>-	__le64 ParentLeaseKeyLow;</div><div class='del'>-	__le64 ParentLeaseKeyHigh;</div><div class='del'>-	__le16 Epoch;</div><div class='del'>-	__le16 Reserved;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct create_lease {</div><div class='del'>-	struct create_context ccontext;</div><div class='del'>-	__u8   Name[8];</div><div class='del'>-	struct lease_context lcontext;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct create_lease_v2 {</div><div class='del'>-	struct create_context ccontext;</div><div class='del'>-	__u8   Name[8];</div><div class='del'>-	struct lease_context_v2 lcontext;</div><div class='del'>-	__u8   Pad[4];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct create_durable {</div><div class='del'>-	struct create_context ccontext;</div><div class='del'>-	__u8   Name[8];</div><div class='del'>-	union {</div><div class='del'>-		__u8  Reserved[16];</div><div class='del'>-		struct {</div><div class='del'>-			__u64 PersistentFileId;</div><div class='del'>-			__u64 VolatileFileId;</div><div class='del'>-		} Fid;</div><div class='del'>-	} Data;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct create_posix {</div><div class='del'>-	struct create_context ccontext;</div><div class='del'>-	__u8	Name[16];</div><div class='del'>-	__le32  Mode;</div><div class='del'>-	__u32	Reserved;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* See MS-SMB2 2.2.13.2.11 */</div><div class='del'>-/* Flags */</div><div class='del'>-#define SMB2_DHANDLE_FLAG_PERSISTENT	0x00000002</div><div class='del'>-struct durable_context_v2 {</div><div class='del'>-	__le32 Timeout;</div><div class='del'>-	__le32 Flags;</div><div class='del'>-	__u64 Reserved;</div><div class='del'>-	__u8 CreateGuid[16];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct create_durable_v2 {</div><div class='del'>-	struct create_context ccontext;</div><div class='del'>-	__u8   Name[8];</div><div class='del'>-	struct durable_context_v2 dcontext;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* See MS-SMB2 2.2.13.2.12 */</div><div class='del'>-struct durable_reconnect_context_v2 {</div><div class='del'>-	struct {</div><div class='del'>-		__u64 PersistentFileId;</div><div class='del'>-		__u64 VolatileFileId;</div><div class='del'>-	} Fid;</div><div class='del'>-	__u8 CreateGuid[16];</div><div class='del'>-	__le32 Flags; /* see above DHANDLE_FLAG_PERSISTENT */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* See MS-SMB2 2.2.14.2.9 */</div><div class='del'>-struct create_on_disk_id {</div><div class='del'>-	struct create_context ccontext;</div><div class='del'>-	__u8   Name[8];</div><div class='del'>-	__le64 DiskFileId;</div><div class='del'>-	__le64 VolumeId;</div><div class='del'>-	__u32  Reserved[4];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* See MS-SMB2 2.2.14.2.12 */</div><div class='del'>-struct durable_reconnect_context_v2_rsp {</div><div class='del'>-	__le32 Timeout;</div><div class='del'>-	__le32 Flags; /* see above DHANDLE_FLAG_PERSISTENT */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct create_durable_handle_reconnect_v2 {</div><div class='del'>-	struct create_context ccontext;</div><div class='del'>-	__u8   Name[8];</div><div class='del'>-	struct durable_reconnect_context_v2 dcontext;</div><div class='del'>-	__u8   Pad[4];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* See MS-SMB2 2.2.13.2.5 */</div><div class='del'>-struct crt_twarp_ctxt {</div><div class='del'>-	struct create_context ccontext;</div><div class='del'>-	__u8	Name[8];</div><div class='del'>-	__le64	Timestamp;</div><div class='del'>-</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* See MS-SMB2 2.2.13.2.9 */</div><div class='del'>-struct crt_query_id_ctxt {</div><div class='del'>-	struct create_context ccontext;</div><div class='del'>-	__u8	Name[8];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct crt_sd_ctxt {</div><div class='del'>-	struct create_context ccontext;</div><div class='del'>-	__u8	Name[8];</div><div class='del'>-	struct smb3_sd sd;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-#define COPY_CHUNK_RES_KEY_SIZE	24</div><div class='del'>-struct resume_key_req {</div><div class='del'>-	char ResumeKey[COPY_CHUNK_RES_KEY_SIZE];</div><div class='del'>-	__le32	ContextLength;	/* MBZ */</div><div class='del'>-	char	Context[];	/* ignored, Windows sets to 4 bytes of zero */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* this goes in the ioctl buffer when doing a copychunk request */</div><div class='del'>-struct copychunk_ioctl {</div><div class='del'>-	char SourceKey[COPY_CHUNK_RES_KEY_SIZE];</div><div class='del'>-	__le32 ChunkCount; /* we are only sending 1 */</div><div class='del'>-	__le32 Reserved;</div><div class='del'>-	/* array will only be one chunk long for us */</div><div class='del'>-	__le64 SourceOffset;</div><div class='del'>-	__le64 TargetOffset;</div><div class='del'>-	__le32 Length; /* how many bytes to copy */</div><div class='del'>-	__u32 Reserved2;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* this goes in the ioctl buffer when doing FSCTL_SET_ZERO_DATA */</div><div class='del'>-struct file_zero_data_information {</div><div class='del'>-	__le64	FileOffset;</div><div class='del'>-	__le64	BeyondFinalZero;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct copychunk_ioctl_rsp {</div><div class='del'>-	__le32 ChunksWritten;</div><div class='del'>-	__le32 ChunkBytesWritten;</div><div class='del'>-	__le32 TotalBytesWritten;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* See MS-FSCC 2.3.29 and 2.3.30 */</div><div class='del'>-struct get_retrieval_pointer_count_req {</div><div class='del'>-	__le64 StartingVcn; /* virtual cluster number (signed) */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct get_retrieval_pointer_count_rsp {</div><div class='del'>-	__le32 ExtentCount;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * See MS-FSCC 2.3.33 and 2.3.34</div><div class='del'>- * request is the same as get_retrieval_point_count_req struct above</div><div class='del'>- */</div><div class='del'>-struct smb3_extents {</div><div class='del'>-	__le64 NextVcn;</div><div class='del'>-	__le64 Lcn; /* logical cluster number */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct get_retrieval_pointers_refcount_rsp {</div><div class='del'>-	__le32 ExtentCount;</div><div class='del'>-	__u32  Reserved;</div><div class='del'>-	__le64 StartingVcn;</div><div class='del'>-	struct smb3_extents extents[];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct fsctl_set_integrity_information_req {</div><div class='del'>-	__le16	ChecksumAlgorithm;</div><div class='del'>-	__le16	Reserved;</div><div class='del'>-	__le32	Flags;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct fsctl_get_integrity_information_rsp {</div><div class='del'>-	__le16	ChecksumAlgorithm;</div><div class='del'>-	__le16	Reserved;</div><div class='del'>-	__le32	Flags;</div><div class='del'>-	__le32	ChecksumChunkSizeInBytes;</div><div class='del'>-	__le32	ClusterSizeInBytes;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct file_allocated_range_buffer {</div><div class='del'>-	__le64	file_offset;</div><div class='del'>-	__le64	length;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* Integrity ChecksumAlgorithm choices for above */</div><div class='del'>-#define	CHECKSUM_TYPE_NONE	0x0000</div><div class='del'>-#define	CHECKSUM_TYPE_CRC64	0x0002</div><div class='del'>-#define CHECKSUM_TYPE_UNCHANGED	0xFFFF	/* set only */</div><div class='del'>-</div><div class='del'>-/* Integrity flags for above */</div><div class='del'>-#define FSCTL_INTEGRITY_FLAG_CHECKSUM_ENFORCEMENT_OFF	0x00000001</div><div class='del'>-</div><div class='del'>-/* Reparse structures - see MS-FSCC 2.1.2 */</div><div class='del'>-</div><div class='del'>-/* struct fsctl_reparse_info_req is empty, only response structs (see below) */</div><div class='del'>-</div><div class='del'>-struct reparse_data_buffer {</div><div class='del'>-	__le32	ReparseTag;</div><div class='del'>-	__le16	ReparseDataLength;</div><div class='del'>-	__u16	Reserved;</div><div class='del'>-	__u8	DataBuffer[]; /* Variable Length */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct reparse_guid_data_buffer {</div><div class='del'>-	__le32	ReparseTag;</div><div class='del'>-	__le16	ReparseDataLength;</div><div class='del'>-	__u16	Reserved;</div><div class='del'>-	__u8	ReparseGuid[16];</div><div class='del'>-	__u8	DataBuffer[]; /* Variable Length */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct reparse_mount_point_data_buffer {</div><div class='del'>-	__le32	ReparseTag;</div><div class='del'>-	__le16	ReparseDataLength;</div><div class='del'>-	__u16	Reserved;</div><div class='del'>-	__le16	SubstituteNameOffset;</div><div class='del'>-	__le16	SubstituteNameLength;</div><div class='del'>-	__le16	PrintNameOffset;</div><div class='del'>-	__le16	PrintNameLength;</div><div class='del'>-	__u8	PathBuffer[]; /* Variable Length */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define SYMLINK_FLAG_RELATIVE 0x00000001</div><div class='del'>-</div><div class='del'>-struct reparse_symlink_data_buffer {</div><div class='del'>-	__le32	ReparseTag;</div><div class='del'>-	__le16	ReparseDataLength;</div><div class='del'>-	__u16	Reserved;</div><div class='del'>-	__le16	SubstituteNameOffset;</div><div class='del'>-	__le16	SubstituteNameLength;</div><div class='del'>-	__le16	PrintNameOffset;</div><div class='del'>-	__le16	PrintNameLength;</div><div class='del'>-	__le32	Flags;</div><div class='del'>-	__u8	PathBuffer[]; /* Variable Length */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* See MS-FSCC 2.1.2.6 and cifspdu.h for struct reparse_posix_data */</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-/* See MS-DFSC 2.2.2 */</div><div class='del'>-struct fsctl_get_dfs_referral_req {</div><div class='del'>-	__le16 MaxReferralLevel;</div><div class='del'>-	__u8 RequestFileName[];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* DFS response is struct get_dfs_refer_rsp */</div><div class='del'>-</div><div class='del'>-/* See MS-SMB2 2.2.31.3 */</div><div class='del'>-struct network_resiliency_req {</div><div class='del'>-	__le32 Timeout;</div><div class='del'>-	__le32 Reserved;</div><div class='del'>-} __packed;</div><div class='del'>-/* There is no buffer for the response ie no struct network_resiliency_rsp */</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-struct validate_negotiate_info_req {</div><div class='del'>-	__le32 Capabilities;</div><div class='del'>-	__u8   Guid[SMB2_CLIENT_GUID_SIZE];</div><div class='del'>-	__le16 SecurityMode;</div><div class='del'>-	__le16 DialectCount;</div><div class='del'>-	__le16 Dialects[4]; /* BB expand this if autonegotiate &gt; 4 dialects */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct validate_negotiate_info_rsp {</div><div class='del'>-	__le32 Capabilities;</div><div class='del'>-	__u8   Guid[SMB2_CLIENT_GUID_SIZE];</div><div class='del'>-	__le16 SecurityMode;</div><div class='del'>-	__le16 Dialect; /* Dialect in use for the connection */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define RSS_CAPABLE	cpu_to_le32(0x00000001)</div><div class='del'>-#define RDMA_CAPABLE	cpu_to_le32(0x00000002)</div><div class='del'>-</div><div class='del'>-#define INTERNETWORK	cpu_to_le16(0x0002)</div><div class='del'>-#define INTERNETWORKV6	cpu_to_le16(0x0017)</div><div class='del'>-</div><div class='del'>-struct network_interface_info_ioctl_rsp {</div><div class='del'>-	__le32 Next; /* next interface. zero if this is last one */</div><div class='del'>-	__le32 IfIndex;</div><div class='del'>-	__le32 Capability; /* RSS or RDMA Capable */</div><div class='del'>-	__le32 Reserved;</div><div class='del'>-	__le64 LinkSpeed;</div><div class='del'>-	__le16 Family;</div><div class='del'>-	__u8 Buffer[126];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct iface_info_ipv4 {</div><div class='del'>-	__be16 Port;</div><div class='del'>-	__be32 IPv4Address;</div><div class='del'>-	__be64 Reserved;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct iface_info_ipv6 {</div><div class='del'>-	__be16 Port;</div><div class='del'>-	__be32 FlowInfo;</div><div class='del'>-	__u8   IPv6Address[16];</div><div class='del'>-	__be32 ScopeId;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define NO_FILE_ID 0xFFFFFFFFFFFFFFFFULL /* general ioctls to srv not to file */</div><div class='del'>-</div><div class='del'>-struct compress_ioctl {</div><div class='del'>-	__le16 CompressionState; /* See cifspdu.h for possible flag values */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct duplicate_extents_to_file {</div><div class='del'>-	__u64 PersistentFileHandle; /* source file handle, opaque endianness */</div><div class='del'>-	__u64 VolatileFileHandle;</div><div class='del'>-	__le64 SourceFileOffset;</div><div class='del'>-	__le64 TargetFileOffset;</div><div class='del'>-	__le64 ByteCount;  /* Bytes to be copied */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Maximum number of iovs we need for an ioctl request.</div><div class='del'>- * [0] : struct smb2_ioctl_req</div><div class='del'>- * [1] : in_data</div><div class='del'>- */</div><div class='del'>-#define SMB2_IOCTL_IOV_SIZE 2</div><div class='del'>-</div><div class='del'>-struct smb2_ioctl_req {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize;	/* Must be 57 */</div><div class='del'>-	__u16 Reserved;</div><div class='del'>-	__le32 CtlCode;</div><div class='del'>-	__u64  PersistentFileId; /* opaque endianness */</div><div class='del'>-	__u64  VolatileFileId; /* opaque endianness */</div><div class='del'>-	__le32 InputOffset;</div><div class='del'>-	__le32 InputCount;</div><div class='del'>-	__le32 MaxInputResponse;</div><div class='del'>-	__le32 OutputOffset;</div><div class='del'>-	__le32 OutputCount;</div><div class='del'>-	__le32 MaxOutputResponse;</div><div class='del'>-	__le32 Flags;</div><div class='del'>-	__u32  Reserved2;</div><div class='del'>-	__u8   Buffer[];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_ioctl_rsp {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize;	/* Must be 57 */</div><div class='del'>-	__u16 Reserved;</div><div class='del'>-	__le32 CtlCode;</div><div class='del'>-	__u64  PersistentFileId; /* opaque endianness */</div><div class='del'>-	__u64  VolatileFileId; /* opaque endianness */</div><div class='del'>-	__le32 InputOffset;</div><div class='del'>-	__le32 InputCount;</div><div class='del'>-	__le32 OutputOffset;</div><div class='del'>-	__le32 OutputCount;</div><div class='del'>-	__le32 Flags;</div><div class='del'>-	__u32  Reserved2;</div><div class='del'>-	/* char * buffer[] */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define SMB2_LOCKFLAG_SHARED_LOCK	0x0001</div><div class='del'>-#define SMB2_LOCKFLAG_EXCLUSIVE_LOCK	0x0002</div><div class='del'>-#define SMB2_LOCKFLAG_UNLOCK		0x0004</div><div class='del'>-#define SMB2_LOCKFLAG_FAIL_IMMEDIATELY	0x0010</div><div class='del'>-</div><div class='del'>-struct smb2_lock_element {</div><div class='del'>-	__le64 Offset;</div><div class='del'>-	__le64 Length;</div><div class='del'>-	__le32 Flags;</div><div class='del'>-	__le32 Reserved;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_lock_req {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 48 */</div><div class='del'>-	__le16 LockCount;</div><div class='del'>-	/*</div><div class='del'>-	 * The least significant four bits are the index, the other 28 bits are</div><div class='del'>-	 * the lock sequence number (0 to 64). See MS-SMB2 2.2.26</div><div class='del'>-	 */</div><div class='del'>-	__le32 LockSequenceNumber;</div><div class='del'>-	__u64  PersistentFileId; /* opaque endianness */</div><div class='del'>-	__u64  VolatileFileId; /* opaque endianness */</div><div class='del'>-	/* Followed by at least one */</div><div class='del'>-	struct smb2_lock_element locks[1];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_lock_rsp {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 4 */</div><div class='del'>-	__le16 Reserved;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_echo_req {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize;	/* Must be 4 */</div><div class='del'>-	__u16  Reserved;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_echo_rsp {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize;	/* Must be 4 */</div><div class='del'>-	__u16  Reserved;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* search (query_directory) Flags field */</div><div class='del'>-#define SMB2_RESTART_SCANS		0x01</div><div class='del'>-#define SMB2_RETURN_SINGLE_ENTRY	0x02</div><div class='del'>-#define SMB2_INDEX_SPECIFIED		0x04</div><div class='del'>-#define SMB2_REOPEN			0x10</div><div class='del'>-</div><div class='del'>-#define SMB2_QUERY_DIRECTORY_IOV_SIZE 2</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Valid FileInformation classes.</div><div class='del'>- *</div><div class='del'>- * Note that these are a subset of the (file) QUERY_INFO levels defined</div><div class='del'>- * later in this file (but since QUERY_DIRECTORY uses equivalent numbers</div><div class='del'>- * we do not redefine them here)</div><div class='del'>- *</div><div class='del'>- * FileDirectoryInfomation		0x01</div><div class='del'>- * FileFullDirectoryInformation		0x02</div><div class='del'>- * FileIdFullDirectoryInformation	0x26</div><div class='del'>- * FileBothDirectoryInformation		0x03</div><div class='del'>- * FileIdBothDirectoryInformation	0x25</div><div class='del'>- * FileNamesInformation			0x0C</div><div class='del'>- * FileIdExtdDirectoryInformation	0x3C</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-struct smb2_query_directory_req {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 33 */</div><div class='del'>-	__u8   FileInformationClass;</div><div class='del'>-	__u8   Flags;</div><div class='del'>-	__le32 FileIndex;</div><div class='del'>-	__u64  PersistentFileId; /* opaque endianness */</div><div class='del'>-	__u64  VolatileFileId; /* opaque endianness */</div><div class='del'>-	__le16 FileNameOffset;</div><div class='del'>-	__le16 FileNameLength;</div><div class='del'>-	__le32 OutputBufferLength;</div><div class='del'>-	__u8   Buffer[1];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_query_directory_rsp {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 9 */</div><div class='del'>-	__le16 OutputBufferOffset;</div><div class='del'>-	__le32 OutputBufferLength;</div><div class='del'>-	__u8   Buffer[1];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* Possible InfoType values */</div><div class='del'>-#define SMB2_O_INFO_FILE	0x01</div><div class='del'>-#define SMB2_O_INFO_FILESYSTEM	0x02</div><div class='del'>-#define SMB2_O_INFO_SECURITY	0x03</div><div class='del'>-#define SMB2_O_INFO_QUOTA	0x04</div><div class='del'>-</div><div class='del'>-/* Security info type additionalinfo flags. See MS-SMB2 (2.2.37) or MS-DTYP */</div><div class='del'>-#define OWNER_SECINFO   0x00000001</div><div class='del'>-#define GROUP_SECINFO   0x00000002</div><div class='del'>-#define DACL_SECINFO   0x00000004</div><div class='del'>-#define SACL_SECINFO   0x00000008</div><div class='del'>-#define LABEL_SECINFO   0x00000010</div><div class='del'>-#define ATTRIBUTE_SECINFO   0x00000020</div><div class='del'>-#define SCOPE_SECINFO   0x00000040</div><div class='del'>-#define BACKUP_SECINFO   0x00010000</div><div class='del'>-#define UNPROTECTED_SACL_SECINFO   0x10000000</div><div class='del'>-#define UNPROTECTED_DACL_SECINFO   0x20000000</div><div class='del'>-#define PROTECTED_SACL_SECINFO   0x40000000</div><div class='del'>-#define PROTECTED_DACL_SECINFO   0x80000000</div><div class='del'>-</div><div class='del'>-/* Flags used for FileFullEAinfo */</div><div class='del'>-#define SL_RESTART_SCAN		0x00000001</div><div class='del'>-#define SL_RETURN_SINGLE_ENTRY	0x00000002</div><div class='del'>-#define SL_INDEX_SPECIFIED	0x00000004</div><div class='del'>-</div><div class='del'>-struct smb2_query_info_req {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 41 */</div><div class='del'>-	__u8   InfoType;</div><div class='del'>-	__u8   FileInfoClass;</div><div class='del'>-	__le32 OutputBufferLength;</div><div class='del'>-	__le16 InputBufferOffset;</div><div class='del'>-	__u16  Reserved;</div><div class='del'>-	__le32 InputBufferLength;</div><div class='del'>-	__le32 AdditionalInformation;</div><div class='del'>-	__le32 Flags;</div><div class='del'>-	__u64  PersistentFileId; /* opaque endianness */</div><div class='del'>-	__u64  VolatileFileId; /* opaque endianness */</div><div class='del'>-	__u8   Buffer[1];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_query_info_rsp {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 9 */</div><div class='del'>-	__le16 OutputBufferOffset;</div><div class='del'>-	__le32 OutputBufferLength;</div><div class='del'>-	__u8   Buffer[1];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Maximum number of iovs we need for a set-info request.</div><div class='del'>- * The largest one is rename/hardlink</div><div class='del'>- * [0] : struct smb2_set_info_req + smb2_file_[rename|link]_info</div><div class='del'>- * [1] : path</div><div class='del'>- * [2] : compound padding</div><div class='del'>- */</div><div class='del'>-#define SMB2_SET_INFO_IOV_SIZE 3</div><div class='del'>-</div><div class='del'>-struct smb2_set_info_req {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 33 */</div><div class='del'>-	__u8   InfoType;</div><div class='del'>-	__u8   FileInfoClass;</div><div class='del'>-	__le32 BufferLength;</div><div class='del'>-	__le16 BufferOffset;</div><div class='del'>-	__u16  Reserved;</div><div class='del'>-	__le32 AdditionalInformation;</div><div class='del'>-	__u64  PersistentFileId; /* opaque endianness */</div><div class='del'>-	__u64  VolatileFileId; /* opaque endianness */</div><div class='del'>-	__u8   Buffer[1];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_set_info_rsp {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 2 */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_oplock_break {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 24 */</div><div class='del'>-	__u8   OplockLevel;</div><div class='del'>-	__u8   Reserved;</div><div class='del'>-	__le32 Reserved2;</div><div class='del'>-	__u64  PersistentFid;</div><div class='del'>-	__u64  VolatileFid;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define SMB2_NOTIFY_BREAK_LEASE_FLAG_ACK_REQUIRED cpu_to_le32(0x01)</div><div class='del'>-</div><div class='del'>-struct smb2_lease_break {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 44 */</div><div class='del'>-	__le16 Epoch;</div><div class='del'>-	__le32 Flags;</div><div class='del'>-	__u8   LeaseKey[16];</div><div class='del'>-	__le32 CurrentLeaseState;</div><div class='del'>-	__le32 NewLeaseState;</div><div class='del'>-	__le32 BreakReason;</div><div class='del'>-	__le32 AccessMaskHint;</div><div class='del'>-	__le32 ShareMaskHint;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_lease_ack {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 36 */</div><div class='del'>-	__le16 Reserved;</div><div class='del'>-	__le32 Flags;</div><div class='del'>-	__u8   LeaseKey[16];</div><div class='del'>-	__le32 LeaseState;</div><div class='del'>-	__le64 LeaseDuration;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- *	PDU infolevel structure definitions</div><div class='del'>- *	BB consider moving to a different header</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-/* File System Information Classes */</div><div class='del'>-#define FS_VOLUME_INFORMATION		1 /* Query */</div><div class='del'>-#define FS_LABEL_INFORMATION		2 /* Local only */</div><div class='del'>-#define FS_SIZE_INFORMATION		3 /* Query */</div><div class='del'>-#define FS_DEVICE_INFORMATION		4 /* Query */</div><div class='del'>-#define FS_ATTRIBUTE_INFORMATION	5 /* Query */</div><div class='del'>-#define FS_CONTROL_INFORMATION		6 /* Query, Set */</div><div class='del'>-#define FS_FULL_SIZE_INFORMATION	7 /* Query */</div><div class='del'>-#define FS_OBJECT_ID_INFORMATION	8 /* Query, Set */</div><div class='del'>-#define FS_DRIVER_PATH_INFORMATION	9 /* Local only */</div><div class='del'>-#define FS_VOLUME_FLAGS_INFORMATION	10 /* Local only */</div><div class='del'>-#define FS_SECTOR_SIZE_INFORMATION	11 /* SMB3 or later. Query */</div><div class='del'>-#define FS_POSIX_INFORMATION		100 /* SMB3.1.1 POSIX. Query */</div><div class='del'>-</div><div class='del'>-struct smb2_fs_full_size_info {</div><div class='del'>-	__le64 TotalAllocationUnits;</div><div class='del'>-	__le64 CallerAvailableAllocationUnits;</div><div class='del'>-	__le64 ActualAvailableAllocationUnits;</div><div class='del'>-	__le32 SectorsPerAllocationUnit;</div><div class='del'>-	__le32 BytesPerSector;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define SSINFO_FLAGS_ALIGNED_DEVICE		0x00000001</div><div class='del'>-#define SSINFO_FLAGS_PARTITION_ALIGNED_ON_DEVICE 0x00000002</div><div class='del'>-#define SSINFO_FLAGS_NO_SEEK_PENALTY		0x00000004</div><div class='del'>-#define SSINFO_FLAGS_TRIM_ENABLED		0x00000008</div><div class='del'>-</div><div class='del'>-/* sector size info struct */</div><div class='del'>-struct smb3_fs_ss_info {</div><div class='del'>-	__le32 LogicalBytesPerSector;</div><div class='del'>-	__le32 PhysicalBytesPerSectorForAtomicity;</div><div class='del'>-	__le32 PhysicalBytesPerSectorForPerf;</div><div class='del'>-	__le32 FileSystemEffectivePhysicalBytesPerSectorForAtomicity;</div><div class='del'>-	__le32 Flags;</div><div class='del'>-	__le32 ByteOffsetForSectorAlignment;</div><div class='del'>-	__le32 ByteOffsetForPartitionAlignment;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* volume info struct - see MS-FSCC 2.5.9 */</div><div class='del'>-#define MAX_VOL_LABEL_LEN	32</div><div class='del'>-struct smb3_fs_vol_info {</div><div class='del'>-	__le64	VolumeCreationTime;</div><div class='del'>-	__u32	VolumeSerialNumber;</div><div class='del'>-	__le32	VolumeLabelLength; /* includes trailing null */</div><div class='del'>-	__u8	SupportsObjects; /* True if eg like NTFS, supports objects */</div><div class='del'>-	__u8	Reserved;</div><div class='del'>-	__u8	VolumeLabel[]; /* variable len */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* partial list of QUERY INFO levels */</div><div class='del'>-#define FILE_DIRECTORY_INFORMATION	1</div><div class='del'>-#define FILE_FULL_DIRECTORY_INFORMATION 2</div><div class='del'>-#define FILE_BOTH_DIRECTORY_INFORMATION 3</div><div class='del'>-#define FILE_BASIC_INFORMATION		4</div><div class='del'>-#define FILE_STANDARD_INFORMATION	5</div><div class='del'>-#define FILE_INTERNAL_INFORMATION	6</div><div class='del'>-#define FILE_EA_INFORMATION	        7</div><div class='del'>-#define FILE_ACCESS_INFORMATION		8</div><div class='del'>-#define FILE_NAME_INFORMATION		9</div><div class='del'>-#define FILE_RENAME_INFORMATION		10</div><div class='del'>-#define FILE_LINK_INFORMATION		11</div><div class='del'>-#define FILE_NAMES_INFORMATION		12</div><div class='del'>-#define FILE_DISPOSITION_INFORMATION	13</div><div class='del'>-#define FILE_POSITION_INFORMATION	14</div><div class='del'>-#define FILE_FULL_EA_INFORMATION	15</div><div class='del'>-#define FILE_MODE_INFORMATION		16</div><div class='del'>-#define FILE_ALIGNMENT_INFORMATION	17</div><div class='del'>-#define FILE_ALL_INFORMATION		18</div><div class='del'>-#define FILE_ALLOCATION_INFORMATION	19</div><div class='del'>-#define FILE_END_OF_FILE_INFORMATION	20</div><div class='del'>-#define FILE_ALTERNATE_NAME_INFORMATION 21</div><div class='del'>-#define FILE_STREAM_INFORMATION		22</div><div class='del'>-#define FILE_PIPE_INFORMATION		23</div><div class='del'>-#define FILE_PIPE_LOCAL_INFORMATION	24</div><div class='del'>-#define FILE_PIPE_REMOTE_INFORMATION	25</div><div class='del'>-#define FILE_MAILSLOT_QUERY_INFORMATION 26</div><div class='del'>-#define FILE_MAILSLOT_SET_INFORMATION	27</div><div class='del'>-#define FILE_COMPRESSION_INFORMATION	28</div><div class='del'>-#define FILE_OBJECT_ID_INFORMATION	29</div><div class='del'>-/* Number 30 not defined in documents */</div><div class='del'>-#define FILE_MOVE_CLUSTER_INFORMATION	31</div><div class='del'>-#define FILE_QUOTA_INFORMATION		32</div><div class='del'>-#define FILE_REPARSE_POINT_INFORMATION	33</div><div class='del'>-#define FILE_NETWORK_OPEN_INFORMATION	34</div><div class='del'>-#define FILE_ATTRIBUTE_TAG_INFORMATION	35</div><div class='del'>-#define FILE_TRACKING_INFORMATION	36</div><div class='del'>-#define FILEID_BOTH_DIRECTORY_INFORMATION 37</div><div class='del'>-#define FILEID_FULL_DIRECTORY_INFORMATION 38</div><div class='del'>-#define FILE_VALID_DATA_LENGTH_INFORMATION 39</div><div class='del'>-#define FILE_SHORT_NAME_INFORMATION	40</div><div class='del'>-#define FILE_SFIO_RESERVE_INFORMATION	44</div><div class='del'>-#define FILE_SFIO_VOLUME_INFORMATION	45</div><div class='del'>-#define FILE_HARD_LINK_INFORMATION	46</div><div class='del'>-#define FILE_NORMALIZED_NAME_INFORMATION 48</div><div class='del'>-#define FILEID_GLOBAL_TX_DIRECTORY_INFORMATION 50</div><div class='del'>-#define FILE_STANDARD_LINK_INFORMATION	54</div><div class='del'>-#define FILE_ID_INFORMATION		59</div><div class='del'>-#define FILE_ID_EXTD_DIRECTORY_INFORMATION 60</div><div class='del'>-</div><div class='del'>-struct smb2_file_internal_info {</div><div class='del'>-	__le64 IndexNumber;</div><div class='del'>-} __packed; /* level 6 Query */</div><div class='del'>-</div><div class='del'>-struct smb2_file_rename_info { /* encoding of request for level 10 */</div><div class='del'>-	__u8   ReplaceIfExists; /* 1 = replace existing target with new */</div><div class='del'>-				/* 0 = fail if target already exists */</div><div class='del'>-	__u8   Reserved[7];</div><div class='del'>-	__u64  RootDirectory;  /* MBZ for network operations (why says spec?) */</div><div class='del'>-	__le32 FileNameLength;</div><div class='del'>-	char   FileName[];     /* New name to be assigned */</div><div class='del'>-	/* padding - overall struct size must be &gt;= 24 so filename + pad &gt;= 6 */</div><div class='del'>-} __packed; /* level 10 Set */</div><div class='del'>-</div><div class='del'>-struct smb2_file_link_info { /* encoding of request for level 11 */</div><div class='del'>-	__u8   ReplaceIfExists; /* 1 = replace existing link with new */</div><div class='del'>-				/* 0 = fail if link already exists */</div><div class='del'>-	__u8   Reserved[7];</div><div class='del'>-	__u64  RootDirectory;  /* MBZ for network operations (why says spec?) */</div><div class='del'>-	__le32 FileNameLength;</div><div class='del'>-	char   FileName[];     /* Name to be assigned to new link */</div><div class='del'>-} __packed; /* level 11 Set */</div><div class='del'>-</div><div class='del'>-struct smb2_file_full_ea_info { /* encoding of response for level 15 */</div><div class='del'>-	__le32 next_entry_offset;</div><div class='del'>-	__u8   flags;</div><div class='del'>-	__u8   ea_name_length;</div><div class='del'>-	__le16 ea_value_length;</div><div class='del'>-	char   ea_data[]; /* \0 terminated name plus value */</div><div class='del'>-} __packed; /* level 15 Set */</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * This level 18, although with struct with same name is different from cifs</div><div class='del'>- * level 0x107. Level 0x107 has an extra u64 between AccessFlags and</div><div class='del'>- * CurrentByteOffset.</div><div class='del'>- */</div><div class='del'>-struct smb2_file_all_info { /* data block encoding of response to level 18 */</div><div class='del'>-	__le64 CreationTime;	/* Beginning of FILE_BASIC_INFO equivalent */</div><div class='del'>-	__le64 LastAccessTime;</div><div class='del'>-	__le64 LastWriteTime;</div><div class='del'>-	__le64 ChangeTime;</div><div class='del'>-	__le32 Attributes;</div><div class='del'>-	__u32  Pad1;		/* End of FILE_BASIC_INFO_INFO equivalent */</div><div class='del'>-	__le64 AllocationSize;	/* Beginning of FILE_STANDARD_INFO equivalent */</div><div class='del'>-	__le64 EndOfFile;	/* size ie offset to first free byte in file */</div><div class='del'>-	__le32 NumberOfLinks;	/* hard links */</div><div class='del'>-	__u8   DeletePending;</div><div class='del'>-	__u8   Directory;</div><div class='del'>-	__u16  Pad2;		/* End of FILE_STANDARD_INFO equivalent */</div><div class='del'>-	__le64 IndexNumber;</div><div class='del'>-	__le32 EASize;</div><div class='del'>-	__le32 AccessFlags;</div><div class='del'>-	__le64 CurrentByteOffset;</div><div class='del'>-	__le32 Mode;</div><div class='del'>-	__le32 AlignmentRequirement;</div><div class='del'>-	__le32 FileNameLength;</div><div class='del'>-	char   FileName[1];</div><div class='del'>-} __packed; /* level 18 Query */</div><div class='del'>-</div><div class='del'>-struct smb2_file_eof_info { /* encoding of request for level 10 */</div><div class='del'>-	__le64 EndOfFile; /* new end of file value */</div><div class='del'>-} __packed; /* level 20 Set */</div><div class='del'>-</div><div class='del'>-struct smb2_file_reparse_point_info {</div><div class='del'>-	__le64 IndexNumber;</div><div class='del'>-	__le32 Tag;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_file_network_open_info {</div><div class='del'>-	__le64 CreationTime;</div><div class='del'>-	__le64 LastAccessTime;</div><div class='del'>-	__le64 LastWriteTime;</div><div class='del'>-	__le64 ChangeTime;</div><div class='del'>-	__le64 AllocationSize;</div><div class='del'>-	__le64 EndOfFile;</div><div class='del'>-	__le32 Attributes;</div><div class='del'>-	__le32 Reserved;</div><div class='del'>-} __packed; /* level 34 Query also similar returned in close rsp and open rsp */</div><div class='del'>-</div><div class='del'>-/* See MS-FSCC 2.4.21 */</div><div class='del'>-struct smb2_file_id_information {</div><div class='del'>-	__le64	VolumeSerialNumber;</div><div class='del'>-	__u64  PersistentFileId; /* opaque endianness */</div><div class='del'>-	__u64  VolatileFileId; /* opaque endianness */</div><div class='del'>-} __packed; /* level 59 */</div><div class='del'>-</div><div class='del'>-/* See MS-FSCC 2.4.18 */</div><div class='del'>-struct smb2_file_id_extd_directory_info {</div><div class='del'>-	__le32 NextEntryOffset;</div><div class='del'>-	__u32 FileIndex;</div><div class='del'>-	__le64 CreationTime;</div><div class='del'>-	__le64 LastAccessTime;</div><div class='del'>-	__le64 LastWriteTime;</div><div class='del'>-	__le64 ChangeTime;</div><div class='del'>-	__le64 EndOfFile;</div><div class='del'>-	__le64 AllocationSize;</div><div class='del'>-	__le32 FileAttributes;</div><div class='del'>-	__le32 FileNameLength;</div><div class='del'>-	__le32 EaSize; /* EA size */</div><div class='del'>-	__le32 ReparsePointTag; /* valid if FILE_ATTR_REPARSE_POINT set in FileAttributes */</div><div class='del'>-	__le64 UniqueId; /* inode num - le since Samba puts ino in low 32 bit */</div><div class='del'>-	char FileName[1];</div><div class='del'>-} __packed; /* level 60 */</div><div class='del'>-</div><div class='del'>-extern char smb2_padding[7];</div><div class='del'>-</div><div class='del'>-/* equivalent of the contents of SMB3.1.1 POSIX open context response */</div><div class='del'>-struct create_posix_rsp {</div><div class='del'>-	u32 nlink;</div><div class='del'>-	u32 reparse_tag;</div><div class='del'>-	u32 mode;</div><div class='del'>-	struct cifs_sid owner; /* var-sized on the wire */</div><div class='del'>-	struct cifs_sid group; /* var-sized on the wire */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * SMB2-only POSIX info level for query dir</div><div class='del'>- *</div><div class='del'>- * See posix_info_sid_size(), posix_info_extra_size() and</div><div class='del'>- * posix_info_parse() to help with the handling of this struct.</div><div class='del'>- */</div><div class='del'>-struct smb2_posix_info {</div><div class='del'>-	__le32 NextEntryOffset;</div><div class='del'>-	__u32 Ignored;</div><div class='del'>-	__le64 CreationTime;</div><div class='del'>-	__le64 LastAccessTime;</div><div class='del'>-	__le64 LastWriteTime;</div><div class='del'>-	__le64 ChangeTime;</div><div class='del'>-	__le64 EndOfFile;</div><div class='del'>-	__le64 AllocationSize;</div><div class='del'>-	__le32 DosAttributes;</div><div class='del'>-	__le64 Inode;</div><div class='del'>-	__le32 DeviceId;</div><div class='del'>-	__le32 Zero;</div><div class='del'>-	/* beginning of POSIX Create Context Response */</div><div class='del'>-	__le32 HardLinks;</div><div class='del'>-	__le32 ReparseTag;</div><div class='del'>-	__le32 Mode;</div><div class='del'>-	/*</div><div class='del'>-	 * var sized owner SID</div><div class='del'>-	 * var sized group SID</div><div class='del'>-	 * le32 filenamelength</div><div class='del'>-	 * u8  filename[]</div><div class='del'>-	 */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* Level 100 query info */</div><div class='del'>-struct smb311_posix_qinfo {</div><div class='del'>-	__le64 CreationTime;</div><div class='del'>-	__le64 LastAccessTime;</div><div class='del'>-	__le64 LastWriteTime;</div><div class='del'>-	__le64 ChangeTime;</div><div class='del'>-	__le64 EndOfFile;</div><div class='del'>-	__le64 AllocationSize;</div><div class='del'>-	__le32 DosAttributes;</div><div class='del'>-	__le64 Inode;</div><div class='del'>-	__le32 DeviceId;</div><div class='del'>-	__le32 Zero;</div><div class='del'>-	/* beginning of POSIX Create Context Response */</div><div class='del'>-	__le32 HardLinks;</div><div class='del'>-	__le32 ReparseTag;</div><div class='del'>-	__le32 Mode;</div><div class='del'>-	u8     Sids[];</div><div class='del'>-	/*</div><div class='del'>-	 * var sized owner SID</div><div class='del'>-	 * var sized group SID</div><div class='del'>-	 * le32 filenamelength</div><div class='del'>-	 * u8  filename[]</div><div class='del'>-	 */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Parsed version of the above struct. Allows direct access to the</div><div class='del'>- * variable length fields</div><div class='del'>- */</div><div class='del'>-struct smb2_posix_info_parsed {</div><div class='del'>-	const struct smb2_posix_info *base;</div><div class='del'>-	size_t size;</div><div class='del'>-	struct cifs_sid owner;</div><div class='del'>-	struct cifs_sid group;</div><div class='del'>-	int name_len;</div><div class='del'>-	const u8 *name;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-#endif				/* _SMB2PDU_H */</div><div class='head'>diff --git a/fs/cifs/smbdirect.c b/fs/cifs/smbdirect.c<br/>deleted file mode 100644<br/>index 31ef64eb7fbb..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cifs/smbdirect.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/smbdirect.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,2524 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='del'>-/*</div><div class='del'>- *   Copyright (C) 2017, Microsoft Corporation.</div><div class='del'>- *</div><div class='del'>- *   Author(s): Long Li &lt;longli@microsoft.com&gt;</div><div class='del'>- */</div><div class='del'>-#include &lt;linux/module.h&gt;</div><div class='del'>-#include &lt;linux/highmem.h&gt;</div><div class='del'>-#include "smbdirect.h"</div><div class='del'>-#include "cifs_debug.h"</div><div class='del'>-#include "cifsproto.h"</div><div class='del'>-#include "smb2proto.h"</div><div class='del'>-</div><div class='del'>-static struct smbd_response *get_empty_queue_buffer(</div><div class='del'>-		struct smbd_connection *info);</div><div class='del'>-static struct smbd_response *get_receive_buffer(</div><div class='del'>-		struct smbd_connection *info);</div><div class='del'>-static void put_receive_buffer(</div><div class='del'>-		struct smbd_connection *info,</div><div class='del'>-		struct smbd_response *response);</div><div class='del'>-static int allocate_receive_buffers(struct smbd_connection *info, int num_buf);</div><div class='del'>-static void destroy_receive_buffers(struct smbd_connection *info);</div><div class='del'>-</div><div class='del'>-static void put_empty_packet(</div><div class='del'>-		struct smbd_connection *info, struct smbd_response *response);</div><div class='del'>-static void enqueue_reassembly(</div><div class='del'>-		struct smbd_connection *info,</div><div class='del'>-		struct smbd_response *response, int data_length);</div><div class='del'>-static struct smbd_response *_get_first_reassembly(</div><div class='del'>-		struct smbd_connection *info);</div><div class='del'>-</div><div class='del'>-static int smbd_post_recv(</div><div class='del'>-		struct smbd_connection *info,</div><div class='del'>-		struct smbd_response *response);</div><div class='del'>-</div><div class='del'>-static int smbd_post_send_empty(struct smbd_connection *info);</div><div class='del'>-static int smbd_post_send_data(</div><div class='del'>-		struct smbd_connection *info,</div><div class='del'>-		struct kvec *iov, int n_vec, int remaining_data_length);</div><div class='del'>-static int smbd_post_send_page(struct smbd_connection *info,</div><div class='del'>-		struct page *page, unsigned long offset,</div><div class='del'>-		size_t size, int remaining_data_length);</div><div class='del'>-</div><div class='del'>-static void destroy_mr_list(struct smbd_connection *info);</div><div class='del'>-static int allocate_mr_list(struct smbd_connection *info);</div><div class='del'>-</div><div class='del'>-/* SMBD version number */</div><div class='del'>-#define SMBD_V1	0x0100</div><div class='del'>-</div><div class='del'>-/* Port numbers for SMBD transport */</div><div class='del'>-#define SMB_PORT	445</div><div class='del'>-#define SMBD_PORT	5445</div><div class='del'>-</div><div class='del'>-/* Address lookup and resolve timeout in ms */</div><div class='del'>-#define RDMA_RESOLVE_TIMEOUT	5000</div><div class='del'>-</div><div class='del'>-/* SMBD negotiation timeout in seconds */</div><div class='del'>-#define SMBD_NEGOTIATE_TIMEOUT	120</div><div class='del'>-</div><div class='del'>-/* SMBD minimum receive size and fragmented sized defined in [MS-SMBD] */</div><div class='del'>-#define SMBD_MIN_RECEIVE_SIZE		128</div><div class='del'>-#define SMBD_MIN_FRAGMENTED_SIZE	131072</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Default maximum number of RDMA read/write outstanding on this connection</div><div class='del'>- * This value is possibly decreased during QP creation on hardware limit</div><div class='del'>- */</div><div class='del'>-#define SMBD_CM_RESPONDER_RESOURCES	32</div><div class='del'>-</div><div class='del'>-/* Maximum number of retries on data transfer operations */</div><div class='del'>-#define SMBD_CM_RETRY			6</div><div class='del'>-/* No need to retry on Receiver Not Ready since SMBD manages credits */</div><div class='del'>-#define SMBD_CM_RNR_RETRY		0</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * User configurable initial values per SMBD transport connection</div><div class='del'>- * as defined in [MS-SMBD] 3.1.1.1</div><div class='del'>- * Those may change after a SMBD negotiation</div><div class='del'>- */</div><div class='del'>-/* The local peer's maximum number of credits to grant to the peer */</div><div class='del'>-int smbd_receive_credit_max = 255;</div><div class='del'>-</div><div class='del'>-/* The remote peer's credit request of local peer */</div><div class='del'>-int smbd_send_credit_target = 255;</div><div class='del'>-</div><div class='del'>-/* The maximum single message size can be sent to remote peer */</div><div class='del'>-int smbd_max_send_size = 1364;</div><div class='del'>-</div><div class='del'>-/*  The maximum fragmented upper-layer payload receive size supported */</div><div class='del'>-int smbd_max_fragmented_recv_size = 1024 * 1024;</div><div class='del'>-</div><div class='del'>-/*  The maximum single-message size which can be received */</div><div class='del'>-int smbd_max_receive_size = 8192;</div><div class='del'>-</div><div class='del'>-/* The timeout to initiate send of a keepalive message on idle */</div><div class='del'>-int smbd_keep_alive_interval = 120;</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * User configurable initial values for RDMA transport</div><div class='del'>- * The actual values used may be lower and are limited to hardware capabilities</div><div class='del'>- */</div><div class='del'>-/* Default maximum number of SGEs in a RDMA write/read */</div><div class='del'>-int smbd_max_frmr_depth = 2048;</div><div class='del'>-</div><div class='del'>-/* If payload is less than this byte, use RDMA send/recv not read/write */</div><div class='del'>-int rdma_readwrite_threshold = 4096;</div><div class='del'>-</div><div class='del'>-/* Transport logging functions</div><div class='del'>- * Logging are defined as classes. They can be OR'ed to define the actual</div><div class='del'>- * logging level via module parameter smbd_logging_class</div><div class='del'>- * e.g. cifs.smbd_logging_class=0xa0 will log all log_rdma_recv() and</div><div class='del'>- * log_rdma_event()</div><div class='del'>- */</div><div class='del'>-#define LOG_OUTGOING			0x1</div><div class='del'>-#define LOG_INCOMING			0x2</div><div class='del'>-#define LOG_READ			0x4</div><div class='del'>-#define LOG_WRITE			0x8</div><div class='del'>-#define LOG_RDMA_SEND			0x10</div><div class='del'>-#define LOG_RDMA_RECV			0x20</div><div class='del'>-#define LOG_KEEP_ALIVE			0x40</div><div class='del'>-#define LOG_RDMA_EVENT			0x80</div><div class='del'>-#define LOG_RDMA_MR			0x100</div><div class='del'>-static unsigned int smbd_logging_class;</div><div class='del'>-module_param(smbd_logging_class, uint, 0644);</div><div class='del'>-MODULE_PARM_DESC(smbd_logging_class,</div><div class='del'>-	"Logging class for SMBD transport 0x0 to 0x100");</div><div class='del'>-</div><div class='del'>-#define ERR		0x0</div><div class='del'>-#define INFO		0x1</div><div class='del'>-static unsigned int smbd_logging_level = ERR;</div><div class='del'>-module_param(smbd_logging_level, uint, 0644);</div><div class='del'>-MODULE_PARM_DESC(smbd_logging_level,</div><div class='del'>-	"Logging level for SMBD transport, 0 (default): error, 1: info");</div><div class='del'>-</div><div class='del'>-#define log_rdma(level, class, fmt, args...)				\</div><div class='del'>-do {									\</div><div class='del'>-	if (level &lt;= smbd_logging_level || class &amp; smbd_logging_class)	\</div><div class='del'>-		cifs_dbg(VFS, "%s:%d " fmt, __func__, __LINE__, ##args);\</div><div class='del'>-} while (0)</div><div class='del'>-</div><div class='del'>-#define log_outgoing(level, fmt, args...) \</div><div class='del'>-		log_rdma(level, LOG_OUTGOING, fmt, ##args)</div><div class='del'>-#define log_incoming(level, fmt, args...) \</div><div class='del'>-		log_rdma(level, LOG_INCOMING, fmt, ##args)</div><div class='del'>-#define log_read(level, fmt, args...)	log_rdma(level, LOG_READ, fmt, ##args)</div><div class='del'>-#define log_write(level, fmt, args...)	log_rdma(level, LOG_WRITE, fmt, ##args)</div><div class='del'>-#define log_rdma_send(level, fmt, args...) \</div><div class='del'>-		log_rdma(level, LOG_RDMA_SEND, fmt, ##args)</div><div class='del'>-#define log_rdma_recv(level, fmt, args...) \</div><div class='del'>-		log_rdma(level, LOG_RDMA_RECV, fmt, ##args)</div><div class='del'>-#define log_keep_alive(level, fmt, args...) \</div><div class='del'>-		log_rdma(level, LOG_KEEP_ALIVE, fmt, ##args)</div><div class='del'>-#define log_rdma_event(level, fmt, args...) \</div><div class='del'>-		log_rdma(level, LOG_RDMA_EVENT, fmt, ##args)</div><div class='del'>-#define log_rdma_mr(level, fmt, args...) \</div><div class='del'>-		log_rdma(level, LOG_RDMA_MR, fmt, ##args)</div><div class='del'>-</div><div class='del'>-static void smbd_disconnect_rdma_work(struct work_struct *work)</div><div class='del'>-{</div><div class='del'>-	struct smbd_connection *info =</div><div class='del'>-		container_of(work, struct smbd_connection, disconnect_work);</div><div class='del'>-</div><div class='del'>-	if (info-&gt;transport_status == SMBD_CONNECTED) {</div><div class='del'>-		info-&gt;transport_status = SMBD_DISCONNECTING;</div><div class='del'>-		rdma_disconnect(info-&gt;id);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void smbd_disconnect_rdma_connection(struct smbd_connection *info)</div><div class='del'>-{</div><div class='del'>-	queue_work(info-&gt;workqueue, &amp;info-&gt;disconnect_work);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* Upcall from RDMA CM */</div><div class='del'>-static int smbd_conn_upcall(</div><div class='del'>-		struct rdma_cm_id *id, struct rdma_cm_event *event)</div><div class='del'>-{</div><div class='del'>-	struct smbd_connection *info = id-&gt;context;</div><div class='del'>-</div><div class='del'>-	log_rdma_event(INFO, "event=%d status=%d\n",</div><div class='del'>-		event-&gt;event, event-&gt;status);</div><div class='del'>-</div><div class='del'>-	switch (event-&gt;event) {</div><div class='del'>-	case RDMA_CM_EVENT_ADDR_RESOLVED:</div><div class='del'>-	case RDMA_CM_EVENT_ROUTE_RESOLVED:</div><div class='del'>-		info-&gt;ri_rc = 0;</div><div class='del'>-		complete(&amp;info-&gt;ri_done);</div><div class='del'>-		break;</div><div class='del'>-</div><div class='del'>-	case RDMA_CM_EVENT_ADDR_ERROR:</div><div class='del'>-		info-&gt;ri_rc = -EHOSTUNREACH;</div><div class='del'>-		complete(&amp;info-&gt;ri_done);</div><div class='del'>-		break;</div><div class='del'>-</div><div class='del'>-	case RDMA_CM_EVENT_ROUTE_ERROR:</div><div class='del'>-		info-&gt;ri_rc = -ENETUNREACH;</div><div class='del'>-		complete(&amp;info-&gt;ri_done);</div><div class='del'>-		break;</div><div class='del'>-</div><div class='del'>-	case RDMA_CM_EVENT_ESTABLISHED:</div><div class='del'>-		log_rdma_event(INFO, "connected event=%d\n", event-&gt;event);</div><div class='del'>-		info-&gt;transport_status = SMBD_CONNECTED;</div><div class='del'>-		wake_up_interruptible(&amp;info-&gt;conn_wait);</div><div class='del'>-		break;</div><div class='del'>-</div><div class='del'>-	case RDMA_CM_EVENT_CONNECT_ERROR:</div><div class='del'>-	case RDMA_CM_EVENT_UNREACHABLE:</div><div class='del'>-	case RDMA_CM_EVENT_REJECTED:</div><div class='del'>-		log_rdma_event(INFO, "connecting failed event=%d\n", event-&gt;event);</div><div class='del'>-		info-&gt;transport_status = SMBD_DISCONNECTED;</div><div class='del'>-		wake_up_interruptible(&amp;info-&gt;conn_wait);</div><div class='del'>-		break;</div><div class='del'>-</div><div class='del'>-	case RDMA_CM_EVENT_DEVICE_REMOVAL:</div><div class='del'>-	case RDMA_CM_EVENT_DISCONNECTED:</div><div class='del'>-		/* This happenes when we fail the negotiation */</div><div class='del'>-		if (info-&gt;transport_status == SMBD_NEGOTIATE_FAILED) {</div><div class='del'>-			info-&gt;transport_status = SMBD_DISCONNECTED;</div><div class='del'>-			wake_up(&amp;info-&gt;conn_wait);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		info-&gt;transport_status = SMBD_DISCONNECTED;</div><div class='del'>-		wake_up_interruptible(&amp;info-&gt;disconn_wait);</div><div class='del'>-		wake_up_interruptible(&amp;info-&gt;wait_reassembly_queue);</div><div class='del'>-		wake_up_interruptible_all(&amp;info-&gt;wait_send_queue);</div><div class='del'>-		break;</div><div class='del'>-</div><div class='del'>-	default:</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* Upcall from RDMA QP */</div><div class='del'>-static void</div><div class='del'>-smbd_qp_async_error_upcall(struct ib_event *event, void *context)</div><div class='del'>-{</div><div class='del'>-	struct smbd_connection *info = context;</div><div class='del'>-</div><div class='del'>-	log_rdma_event(ERR, "%s on device %s info %p\n",</div><div class='del'>-		ib_event_msg(event-&gt;event), event-&gt;device-&gt;name, info);</div><div class='del'>-</div><div class='del'>-	switch (event-&gt;event) {</div><div class='del'>-	case IB_EVENT_CQ_ERR:</div><div class='del'>-	case IB_EVENT_QP_FATAL:</div><div class='del'>-		smbd_disconnect_rdma_connection(info);</div><div class='del'>-		break;</div><div class='del'>-</div><div class='del'>-	default:</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void *smbd_request_payload(struct smbd_request *request)</div><div class='del'>-{</div><div class='del'>-	return (void *)request-&gt;packet;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void *smbd_response_payload(struct smbd_response *response)</div><div class='del'>-{</div><div class='del'>-	return (void *)response-&gt;packet;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* Called when a RDMA send is done */</div><div class='del'>-static void send_done(struct ib_cq *cq, struct ib_wc *wc)</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-	struct smbd_request *request =</div><div class='del'>-		container_of(wc-&gt;wr_cqe, struct smbd_request, cqe);</div><div class='del'>-</div><div class='del'>-	log_rdma_send(INFO, "smbd_request %p completed wc-&gt;status=%d\n",</div><div class='del'>-		request, wc-&gt;status);</div><div class='del'>-</div><div class='del'>-	if (wc-&gt;status != IB_WC_SUCCESS || wc-&gt;opcode != IB_WC_SEND) {</div><div class='del'>-		log_rdma_send(ERR, "wc-&gt;status=%d wc-&gt;opcode=%d\n",</div><div class='del'>-			wc-&gt;status, wc-&gt;opcode);</div><div class='del'>-		smbd_disconnect_rdma_connection(request-&gt;info);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; request-&gt;num_sge; i++)</div><div class='del'>-		ib_dma_unmap_single(request-&gt;info-&gt;id-&gt;device,</div><div class='del'>-			request-&gt;sge[i].addr,</div><div class='del'>-			request-&gt;sge[i].length,</div><div class='del'>-			DMA_TO_DEVICE);</div><div class='del'>-</div><div class='del'>-	if (atomic_dec_and_test(&amp;request-&gt;info-&gt;send_pending))</div><div class='del'>-		wake_up(&amp;request-&gt;info-&gt;wait_send_pending);</div><div class='del'>-</div><div class='del'>-	wake_up(&amp;request-&gt;info-&gt;wait_post_send);</div><div class='del'>-</div><div class='del'>-	mempool_free(request, request-&gt;info-&gt;request_mempool);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void dump_smbd_negotiate_resp(struct smbd_negotiate_resp *resp)</div><div class='del'>-{</div><div class='del'>-	log_rdma_event(INFO, "resp message min_version %u max_version %u negotiated_version %u credits_requested %u credits_granted %u status %u max_readwrite_size %u preferred_send_size %u max_receive_size %u max_fragmented_size %u\n",</div><div class='del'>-		       resp-&gt;min_version, resp-&gt;max_version,</div><div class='del'>-		       resp-&gt;negotiated_version, resp-&gt;credits_requested,</div><div class='del'>-		       resp-&gt;credits_granted, resp-&gt;status,</div><div class='del'>-		       resp-&gt;max_readwrite_size, resp-&gt;preferred_send_size,</div><div class='del'>-		       resp-&gt;max_receive_size, resp-&gt;max_fragmented_size);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Process a negotiation response message, according to [MS-SMBD]3.1.5.7</div><div class='del'>- * response, packet_length: the negotiation response message</div><div class='del'>- * return value: true if negotiation is a success, false if failed</div><div class='del'>- */</div><div class='del'>-static bool process_negotiation_response(</div><div class='del'>-		struct smbd_response *response, int packet_length)</div><div class='del'>-{</div><div class='del'>-	struct smbd_connection *info = response-&gt;info;</div><div class='del'>-	struct smbd_negotiate_resp *packet = smbd_response_payload(response);</div><div class='del'>-</div><div class='del'>-	if (packet_length &lt; sizeof(struct smbd_negotiate_resp)) {</div><div class='del'>-		log_rdma_event(ERR,</div><div class='del'>-			"error: packet_length=%d\n", packet_length);</div><div class='del'>-		return false;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (le16_to_cpu(packet-&gt;negotiated_version) != SMBD_V1) {</div><div class='del'>-		log_rdma_event(ERR, "error: negotiated_version=%x\n",</div><div class='del'>-			le16_to_cpu(packet-&gt;negotiated_version));</div><div class='del'>-		return false;</div><div class='del'>-	}</div><div class='del'>-	info-&gt;protocol = le16_to_cpu(packet-&gt;negotiated_version);</div><div class='del'>-</div><div class='del'>-	if (packet-&gt;credits_requested == 0) {</div><div class='del'>-		log_rdma_event(ERR, "error: credits_requested==0\n");</div><div class='del'>-		return false;</div><div class='del'>-	}</div><div class='del'>-	info-&gt;receive_credit_target = le16_to_cpu(packet-&gt;credits_requested);</div><div class='del'>-</div><div class='del'>-	if (packet-&gt;credits_granted == 0) {</div><div class='del'>-		log_rdma_event(ERR, "error: credits_granted==0\n");</div><div class='del'>-		return false;</div><div class='del'>-	}</div><div class='del'>-	atomic_set(&amp;info-&gt;send_credits, le16_to_cpu(packet-&gt;credits_granted));</div><div class='del'>-</div><div class='del'>-	atomic_set(&amp;info-&gt;receive_credits, 0);</div><div class='del'>-</div><div class='del'>-	if (le32_to_cpu(packet-&gt;preferred_send_size) &gt; info-&gt;max_receive_size) {</div><div class='del'>-		log_rdma_event(ERR, "error: preferred_send_size=%d\n",</div><div class='del'>-			le32_to_cpu(packet-&gt;preferred_send_size));</div><div class='del'>-		return false;</div><div class='del'>-	}</div><div class='del'>-	info-&gt;max_receive_size = le32_to_cpu(packet-&gt;preferred_send_size);</div><div class='del'>-</div><div class='del'>-	if (le32_to_cpu(packet-&gt;max_receive_size) &lt; SMBD_MIN_RECEIVE_SIZE) {</div><div class='del'>-		log_rdma_event(ERR, "error: max_receive_size=%d\n",</div><div class='del'>-			le32_to_cpu(packet-&gt;max_receive_size));</div><div class='del'>-		return false;</div><div class='del'>-	}</div><div class='del'>-	info-&gt;max_send_size = min_t(int, info-&gt;max_send_size,</div><div class='del'>-					le32_to_cpu(packet-&gt;max_receive_size));</div><div class='del'>-</div><div class='del'>-	if (le32_to_cpu(packet-&gt;max_fragmented_size) &lt;</div><div class='del'>-			SMBD_MIN_FRAGMENTED_SIZE) {</div><div class='del'>-		log_rdma_event(ERR, "error: max_fragmented_size=%d\n",</div><div class='del'>-			le32_to_cpu(packet-&gt;max_fragmented_size));</div><div class='del'>-		return false;</div><div class='del'>-	}</div><div class='del'>-	info-&gt;max_fragmented_send_size =</div><div class='del'>-		le32_to_cpu(packet-&gt;max_fragmented_size);</div><div class='del'>-	info-&gt;rdma_readwrite_threshold =</div><div class='del'>-		rdma_readwrite_threshold &gt; info-&gt;max_fragmented_send_size ?</div><div class='del'>-		info-&gt;max_fragmented_send_size :</div><div class='del'>-		rdma_readwrite_threshold;</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-	info-&gt;max_readwrite_size = min_t(u32,</div><div class='del'>-			le32_to_cpu(packet-&gt;max_readwrite_size),</div><div class='del'>-			info-&gt;max_frmr_depth * PAGE_SIZE);</div><div class='del'>-	info-&gt;max_frmr_depth = info-&gt;max_readwrite_size / PAGE_SIZE;</div><div class='del'>-</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void smbd_post_send_credits(struct work_struct *work)</div><div class='del'>-{</div><div class='del'>-	int ret = 0;</div><div class='del'>-	int use_receive_queue = 1;</div><div class='del'>-	int rc;</div><div class='del'>-	struct smbd_response *response;</div><div class='del'>-	struct smbd_connection *info =</div><div class='del'>-		container_of(work, struct smbd_connection,</div><div class='del'>-			post_send_credits_work);</div><div class='del'>-</div><div class='del'>-	if (info-&gt;transport_status != SMBD_CONNECTED) {</div><div class='del'>-		wake_up(&amp;info-&gt;wait_receive_queues);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (info-&gt;receive_credit_target &gt;</div><div class='del'>-		atomic_read(&amp;info-&gt;receive_credits)) {</div><div class='del'>-		while (true) {</div><div class='del'>-			if (use_receive_queue)</div><div class='del'>-				response = get_receive_buffer(info);</div><div class='del'>-			else</div><div class='del'>-				response = get_empty_queue_buffer(info);</div><div class='del'>-			if (!response) {</div><div class='del'>-				/* now switch to emtpy packet queue */</div><div class='del'>-				if (use_receive_queue) {</div><div class='del'>-					use_receive_queue = 0;</div><div class='del'>-					continue;</div><div class='del'>-				} else</div><div class='del'>-					break;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			response-&gt;type = SMBD_TRANSFER_DATA;</div><div class='del'>-			response-&gt;first_segment = false;</div><div class='del'>-			rc = smbd_post_recv(info, response);</div><div class='del'>-			if (rc) {</div><div class='del'>-				log_rdma_recv(ERR,</div><div class='del'>-					"post_recv failed rc=%d\n", rc);</div><div class='del'>-				put_receive_buffer(info, response);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			ret++;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;info-&gt;lock_new_credits_offered);</div><div class='del'>-	info-&gt;new_credits_offered += ret;</div><div class='del'>-	spin_unlock(&amp;info-&gt;lock_new_credits_offered);</div><div class='del'>-</div><div class='del'>-	/* Promptly send an immediate packet as defined in [MS-SMBD] 3.1.1.1 */</div><div class='del'>-	info-&gt;send_immediate = true;</div><div class='del'>-	if (atomic_read(&amp;info-&gt;receive_credits) &lt;</div><div class='del'>-		info-&gt;receive_credit_target - 1) {</div><div class='del'>-		if (info-&gt;keep_alive_requested == KEEP_ALIVE_PENDING ||</div><div class='del'>-		    info-&gt;send_immediate) {</div><div class='del'>-			log_keep_alive(INFO, "send an empty message\n");</div><div class='del'>-			smbd_post_send_empty(info);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* Called from softirq, when recv is done */</div><div class='del'>-static void recv_done(struct ib_cq *cq, struct ib_wc *wc)</div><div class='del'>-{</div><div class='del'>-	struct smbd_data_transfer *data_transfer;</div><div class='del'>-	struct smbd_response *response =</div><div class='del'>-		container_of(wc-&gt;wr_cqe, struct smbd_response, cqe);</div><div class='del'>-	struct smbd_connection *info = response-&gt;info;</div><div class='del'>-	int data_length = 0;</div><div class='del'>-</div><div class='del'>-	log_rdma_recv(INFO, "response=%p type=%d wc status=%d wc opcode %d byte_len=%d pkey_index=%x\n",</div><div class='del'>-		      response, response-&gt;type, wc-&gt;status, wc-&gt;opcode,</div><div class='del'>-		      wc-&gt;byte_len, wc-&gt;pkey_index);</div><div class='del'>-</div><div class='del'>-	if (wc-&gt;status != IB_WC_SUCCESS || wc-&gt;opcode != IB_WC_RECV) {</div><div class='del'>-		log_rdma_recv(INFO, "wc-&gt;status=%d opcode=%d\n",</div><div class='del'>-			wc-&gt;status, wc-&gt;opcode);</div><div class='del'>-		smbd_disconnect_rdma_connection(info);</div><div class='del'>-		goto error;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ib_dma_sync_single_for_cpu(</div><div class='del'>-		wc-&gt;qp-&gt;device,</div><div class='del'>-		response-&gt;sge.addr,</div><div class='del'>-		response-&gt;sge.length,</div><div class='del'>-		DMA_FROM_DEVICE);</div><div class='del'>-</div><div class='del'>-	switch (response-&gt;type) {</div><div class='del'>-	/* SMBD negotiation response */</div><div class='del'>-	case SMBD_NEGOTIATE_RESP:</div><div class='del'>-		dump_smbd_negotiate_resp(smbd_response_payload(response));</div><div class='del'>-		info-&gt;full_packet_received = true;</div><div class='del'>-		info-&gt;negotiate_done =</div><div class='del'>-			process_negotiation_response(response, wc-&gt;byte_len);</div><div class='del'>-		complete(&amp;info-&gt;negotiate_completion);</div><div class='del'>-		break;</div><div class='del'>-</div><div class='del'>-	/* SMBD data transfer packet */</div><div class='del'>-	case SMBD_TRANSFER_DATA:</div><div class='del'>-		data_transfer = smbd_response_payload(response);</div><div class='del'>-		data_length = le32_to_cpu(data_transfer-&gt;data_length);</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * If this is a packet with data playload place the data in</div><div class='del'>-		 * reassembly queue and wake up the reading thread</div><div class='del'>-		 */</div><div class='del'>-		if (data_length) {</div><div class='del'>-			if (info-&gt;full_packet_received)</div><div class='del'>-				response-&gt;first_segment = true;</div><div class='del'>-</div><div class='del'>-			if (le32_to_cpu(data_transfer-&gt;remaining_data_length))</div><div class='del'>-				info-&gt;full_packet_received = false;</div><div class='del'>-			else</div><div class='del'>-				info-&gt;full_packet_received = true;</div><div class='del'>-</div><div class='del'>-			enqueue_reassembly(</div><div class='del'>-				info,</div><div class='del'>-				response,</div><div class='del'>-				data_length);</div><div class='del'>-		} else</div><div class='del'>-			put_empty_packet(info, response);</div><div class='del'>-</div><div class='del'>-		if (data_length)</div><div class='del'>-			wake_up_interruptible(&amp;info-&gt;wait_reassembly_queue);</div><div class='del'>-</div><div class='del'>-		atomic_dec(&amp;info-&gt;receive_credits);</div><div class='del'>-		info-&gt;receive_credit_target =</div><div class='del'>-			le16_to_cpu(data_transfer-&gt;credits_requested);</div><div class='del'>-		if (le16_to_cpu(data_transfer-&gt;credits_granted)) {</div><div class='del'>-			atomic_add(le16_to_cpu(data_transfer-&gt;credits_granted),</div><div class='del'>-				&amp;info-&gt;send_credits);</div><div class='del'>-			/*</div><div class='del'>-			 * We have new send credits granted from remote peer</div><div class='del'>-			 * If any sender is waiting for credits, unblock it</div><div class='del'>-			 */</div><div class='del'>-			wake_up_interruptible(&amp;info-&gt;wait_send_queue);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		log_incoming(INFO, "data flags %d data_offset %d data_length %d remaining_data_length %d\n",</div><div class='del'>-			     le16_to_cpu(data_transfer-&gt;flags),</div><div class='del'>-			     le32_to_cpu(data_transfer-&gt;data_offset),</div><div class='del'>-			     le32_to_cpu(data_transfer-&gt;data_length),</div><div class='del'>-			     le32_to_cpu(data_transfer-&gt;remaining_data_length));</div><div class='del'>-</div><div class='del'>-		/* Send a KEEP_ALIVE response right away if requested */</div><div class='del'>-		info-&gt;keep_alive_requested = KEEP_ALIVE_NONE;</div><div class='del'>-		if (le16_to_cpu(data_transfer-&gt;flags) &amp;</div><div class='del'>-				SMB_DIRECT_RESPONSE_REQUESTED) {</div><div class='del'>-			info-&gt;keep_alive_requested = KEEP_ALIVE_PENDING;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	default:</div><div class='del'>-		log_rdma_recv(ERR,</div><div class='del'>-			"unexpected response type=%d\n", response-&gt;type);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-error:</div><div class='del'>-	put_receive_buffer(info, response);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct rdma_cm_id *smbd_create_id(</div><div class='del'>-		struct smbd_connection *info,</div><div class='del'>-		struct sockaddr *dstaddr, int port)</div><div class='del'>-{</div><div class='del'>-	struct rdma_cm_id *id;</div><div class='del'>-	int rc;</div><div class='del'>-	__be16 *sport;</div><div class='del'>-</div><div class='del'>-	id = rdma_create_id(&amp;init_net, smbd_conn_upcall, info,</div><div class='del'>-		RDMA_PS_TCP, IB_QPT_RC);</div><div class='del'>-	if (IS_ERR(id)) {</div><div class='del'>-		rc = PTR_ERR(id);</div><div class='del'>-		log_rdma_event(ERR, "rdma_create_id() failed %i\n", rc);</div><div class='del'>-		return id;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (dstaddr-&gt;sa_family == AF_INET6)</div><div class='del'>-		sport = &amp;((struct sockaddr_in6 *)dstaddr)-&gt;sin6_port;</div><div class='del'>-	else</div><div class='del'>-		sport = &amp;((struct sockaddr_in *)dstaddr)-&gt;sin_port;</div><div class='del'>-</div><div class='del'>-	*sport = htons(port);</div><div class='del'>-</div><div class='del'>-	init_completion(&amp;info-&gt;ri_done);</div><div class='del'>-	info-&gt;ri_rc = -ETIMEDOUT;</div><div class='del'>-</div><div class='del'>-	rc = rdma_resolve_addr(id, NULL, (struct sockaddr *)dstaddr,</div><div class='del'>-		RDMA_RESOLVE_TIMEOUT);</div><div class='del'>-	if (rc) {</div><div class='del'>-		log_rdma_event(ERR, "rdma_resolve_addr() failed %i\n", rc);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	rc = wait_for_completion_interruptible_timeout(</div><div class='del'>-		&amp;info-&gt;ri_done, msecs_to_jiffies(RDMA_RESOLVE_TIMEOUT));</div><div class='del'>-	/* e.g. if interrupted returns -ERESTARTSYS */</div><div class='del'>-	if (rc &lt; 0) {</div><div class='del'>-		log_rdma_event(ERR, "rdma_resolve_addr timeout rc: %i\n", rc);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	rc = info-&gt;ri_rc;</div><div class='del'>-	if (rc) {</div><div class='del'>-		log_rdma_event(ERR, "rdma_resolve_addr() completed %i\n", rc);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	info-&gt;ri_rc = -ETIMEDOUT;</div><div class='del'>-	rc = rdma_resolve_route(id, RDMA_RESOLVE_TIMEOUT);</div><div class='del'>-	if (rc) {</div><div class='del'>-		log_rdma_event(ERR, "rdma_resolve_route() failed %i\n", rc);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	rc = wait_for_completion_interruptible_timeout(</div><div class='del'>-		&amp;info-&gt;ri_done, msecs_to_jiffies(RDMA_RESOLVE_TIMEOUT));</div><div class='del'>-	/* e.g. if interrupted returns -ERESTARTSYS */</div><div class='del'>-	if (rc &lt; 0)  {</div><div class='del'>-		log_rdma_event(ERR, "rdma_resolve_addr timeout rc: %i\n", rc);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	rc = info-&gt;ri_rc;</div><div class='del'>-	if (rc) {</div><div class='del'>-		log_rdma_event(ERR, "rdma_resolve_route() completed %i\n", rc);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return id;</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	rdma_destroy_id(id);</div><div class='del'>-	return ERR_PTR(rc);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Test if FRWR (Fast Registration Work Requests) is supported on the device</div><div class='del'>- * This implementation requries FRWR on RDMA read/write</div><div class='del'>- * return value: true if it is supported</div><div class='del'>- */</div><div class='del'>-static bool frwr_is_supported(struct ib_device_attr *attrs)</div><div class='del'>-{</div><div class='del'>-	if (!(attrs-&gt;device_cap_flags &amp; IB_DEVICE_MEM_MGT_EXTENSIONS))</div><div class='del'>-		return false;</div><div class='del'>-	if (attrs-&gt;max_fast_reg_page_list_len == 0)</div><div class='del'>-		return false;</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int smbd_ia_open(</div><div class='del'>-		struct smbd_connection *info,</div><div class='del'>-		struct sockaddr *dstaddr, int port)</div><div class='del'>-{</div><div class='del'>-	int rc;</div><div class='del'>-</div><div class='del'>-	info-&gt;id = smbd_create_id(info, dstaddr, port);</div><div class='del'>-	if (IS_ERR(info-&gt;id)) {</div><div class='del'>-		rc = PTR_ERR(info-&gt;id);</div><div class='del'>-		goto out1;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!frwr_is_supported(&amp;info-&gt;id-&gt;device-&gt;attrs)) {</div><div class='del'>-		log_rdma_event(ERR, "Fast Registration Work Requests (FRWR) is not supported\n");</div><div class='del'>-		log_rdma_event(ERR, "Device capability flags = %llx max_fast_reg_page_list_len = %u\n",</div><div class='del'>-			       info-&gt;id-&gt;device-&gt;attrs.device_cap_flags,</div><div class='del'>-			       info-&gt;id-&gt;device-&gt;attrs.max_fast_reg_page_list_len);</div><div class='del'>-		rc = -EPROTONOSUPPORT;</div><div class='del'>-		goto out2;</div><div class='del'>-	}</div><div class='del'>-	info-&gt;max_frmr_depth = min_t(int,</div><div class='del'>-		smbd_max_frmr_depth,</div><div class='del'>-		info-&gt;id-&gt;device-&gt;attrs.max_fast_reg_page_list_len);</div><div class='del'>-	info-&gt;mr_type = IB_MR_TYPE_MEM_REG;</div><div class='del'>-	if (info-&gt;id-&gt;device-&gt;attrs.device_cap_flags &amp; IB_DEVICE_SG_GAPS_REG)</div><div class='del'>-		info-&gt;mr_type = IB_MR_TYPE_SG_GAPS;</div><div class='del'>-</div><div class='del'>-	info-&gt;pd = ib_alloc_pd(info-&gt;id-&gt;device, 0);</div><div class='del'>-	if (IS_ERR(info-&gt;pd)) {</div><div class='del'>-		rc = PTR_ERR(info-&gt;pd);</div><div class='del'>-		log_rdma_event(ERR, "ib_alloc_pd() returned %d\n", rc);</div><div class='del'>-		goto out2;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-out2:</div><div class='del'>-	rdma_destroy_id(info-&gt;id);</div><div class='del'>-	info-&gt;id = NULL;</div><div class='del'>-</div><div class='del'>-out1:</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Send a negotiation request message to the peer</div><div class='del'>- * The negotiation procedure is in [MS-SMBD] 3.1.5.2 and 3.1.5.3</div><div class='del'>- * After negotiation, the transport is connected and ready for</div><div class='del'>- * carrying upper layer SMB payload</div><div class='del'>- */</div><div class='del'>-static int smbd_post_send_negotiate_req(struct smbd_connection *info)</div><div class='del'>-{</div><div class='del'>-	struct ib_send_wr send_wr;</div><div class='del'>-	int rc = -ENOMEM;</div><div class='del'>-	struct smbd_request *request;</div><div class='del'>-	struct smbd_negotiate_req *packet;</div><div class='del'>-</div><div class='del'>-	request = mempool_alloc(info-&gt;request_mempool, GFP_KERNEL);</div><div class='del'>-	if (!request)</div><div class='del'>-		return rc;</div><div class='del'>-</div><div class='del'>-	request-&gt;info = info;</div><div class='del'>-</div><div class='del'>-	packet = smbd_request_payload(request);</div><div class='del'>-	packet-&gt;min_version = cpu_to_le16(SMBD_V1);</div><div class='del'>-	packet-&gt;max_version = cpu_to_le16(SMBD_V1);</div><div class='del'>-	packet-&gt;reserved = 0;</div><div class='del'>-	packet-&gt;credits_requested = cpu_to_le16(info-&gt;send_credit_target);</div><div class='del'>-	packet-&gt;preferred_send_size = cpu_to_le32(info-&gt;max_send_size);</div><div class='del'>-	packet-&gt;max_receive_size = cpu_to_le32(info-&gt;max_receive_size);</div><div class='del'>-	packet-&gt;max_fragmented_size =</div><div class='del'>-		cpu_to_le32(info-&gt;max_fragmented_recv_size);</div><div class='del'>-</div><div class='del'>-	request-&gt;num_sge = 1;</div><div class='del'>-	request-&gt;sge[0].addr = ib_dma_map_single(</div><div class='del'>-				info-&gt;id-&gt;device, (void *)packet,</div><div class='del'>-				sizeof(*packet), DMA_TO_DEVICE);</div><div class='del'>-	if (ib_dma_mapping_error(info-&gt;id-&gt;device, request-&gt;sge[0].addr)) {</div><div class='del'>-		rc = -EIO;</div><div class='del'>-		goto dma_mapping_failed;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	request-&gt;sge[0].length = sizeof(*packet);</div><div class='del'>-	request-&gt;sge[0].lkey = info-&gt;pd-&gt;local_dma_lkey;</div><div class='del'>-</div><div class='del'>-	ib_dma_sync_single_for_device(</div><div class='del'>-		info-&gt;id-&gt;device, request-&gt;sge[0].addr,</div><div class='del'>-		request-&gt;sge[0].length, DMA_TO_DEVICE);</div><div class='del'>-</div><div class='del'>-	request-&gt;cqe.done = send_done;</div><div class='del'>-</div><div class='del'>-	send_wr.next = NULL;</div><div class='del'>-	send_wr.wr_cqe = &amp;request-&gt;cqe;</div><div class='del'>-	send_wr.sg_list = request-&gt;sge;</div><div class='del'>-	send_wr.num_sge = request-&gt;num_sge;</div><div class='del'>-	send_wr.opcode = IB_WR_SEND;</div><div class='del'>-	send_wr.send_flags = IB_SEND_SIGNALED;</div><div class='del'>-</div><div class='del'>-	log_rdma_send(INFO, "sge addr=%llx length=%x lkey=%x\n",</div><div class='del'>-		request-&gt;sge[0].addr,</div><div class='del'>-		request-&gt;sge[0].length, request-&gt;sge[0].lkey);</div><div class='del'>-</div><div class='del'>-	atomic_inc(&amp;info-&gt;send_pending);</div><div class='del'>-	rc = ib_post_send(info-&gt;id-&gt;qp, &amp;send_wr, NULL);</div><div class='del'>-	if (!rc)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	/* if we reach here, post send failed */</div><div class='del'>-	log_rdma_send(ERR, "ib_post_send failed rc=%d\n", rc);</div><div class='del'>-	atomic_dec(&amp;info-&gt;send_pending);</div><div class='del'>-	ib_dma_unmap_single(info-&gt;id-&gt;device, request-&gt;sge[0].addr,</div><div class='del'>-		request-&gt;sge[0].length, DMA_TO_DEVICE);</div><div class='del'>-</div><div class='del'>-	smbd_disconnect_rdma_connection(info);</div><div class='del'>-</div><div class='del'>-dma_mapping_failed:</div><div class='del'>-	mempool_free(request, info-&gt;request_mempool);</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Extend the credits to remote peer</div><div class='del'>- * This implements [MS-SMBD] 3.1.5.9</div><div class='del'>- * The idea is that we should extend credits to remote peer as quickly as</div><div class='del'>- * it's allowed, to maintain data flow. We allocate as much receive</div><div class='del'>- * buffer as possible, and extend the receive credits to remote peer</div><div class='del'>- * return value: the new credtis being granted.</div><div class='del'>- */</div><div class='del'>-static int manage_credits_prior_sending(struct smbd_connection *info)</div><div class='del'>-{</div><div class='del'>-	int new_credits;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;info-&gt;lock_new_credits_offered);</div><div class='del'>-	new_credits = info-&gt;new_credits_offered;</div><div class='del'>-	info-&gt;new_credits_offered = 0;</div><div class='del'>-	spin_unlock(&amp;info-&gt;lock_new_credits_offered);</div><div class='del'>-</div><div class='del'>-	return new_credits;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Check if we need to send a KEEP_ALIVE message</div><div class='del'>- * The idle connection timer triggers a KEEP_ALIVE message when expires</div><div class='del'>- * SMB_DIRECT_RESPONSE_REQUESTED is set in the message flag to have peer send</div><div class='del'>- * back a response.</div><div class='del'>- * return value:</div><div class='del'>- * 1 if SMB_DIRECT_RESPONSE_REQUESTED needs to be set</div><div class='del'>- * 0: otherwise</div><div class='del'>- */</div><div class='del'>-static int manage_keep_alive_before_sending(struct smbd_connection *info)</div><div class='del'>-{</div><div class='del'>-	if (info-&gt;keep_alive_requested == KEEP_ALIVE_PENDING) {</div><div class='del'>-		info-&gt;keep_alive_requested = KEEP_ALIVE_SENT;</div><div class='del'>-		return 1;</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* Post the send request */</div><div class='del'>-static int smbd_post_send(struct smbd_connection *info,</div><div class='del'>-		struct smbd_request *request)</div><div class='del'>-{</div><div class='del'>-	struct ib_send_wr send_wr;</div><div class='del'>-	int rc, i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; request-&gt;num_sge; i++) {</div><div class='del'>-		log_rdma_send(INFO,</div><div class='del'>-			"rdma_request sge[%d] addr=%llu length=%u\n",</div><div class='del'>-			i, request-&gt;sge[i].addr, request-&gt;sge[i].length);</div><div class='del'>-		ib_dma_sync_single_for_device(</div><div class='del'>-			info-&gt;id-&gt;device,</div><div class='del'>-			request-&gt;sge[i].addr,</div><div class='del'>-			request-&gt;sge[i].length,</div><div class='del'>-			DMA_TO_DEVICE);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	request-&gt;cqe.done = send_done;</div><div class='del'>-</div><div class='del'>-	send_wr.next = NULL;</div><div class='del'>-	send_wr.wr_cqe = &amp;request-&gt;cqe;</div><div class='del'>-	send_wr.sg_list = request-&gt;sge;</div><div class='del'>-	send_wr.num_sge = request-&gt;num_sge;</div><div class='del'>-	send_wr.opcode = IB_WR_SEND;</div><div class='del'>-	send_wr.send_flags = IB_SEND_SIGNALED;</div><div class='del'>-</div><div class='del'>-	rc = ib_post_send(info-&gt;id-&gt;qp, &amp;send_wr, NULL);</div><div class='del'>-	if (rc) {</div><div class='del'>-		log_rdma_send(ERR, "ib_post_send failed rc=%d\n", rc);</div><div class='del'>-		smbd_disconnect_rdma_connection(info);</div><div class='del'>-		rc = -EAGAIN;</div><div class='del'>-	} else</div><div class='del'>-		/* Reset timer for idle connection after packet is sent */</div><div class='del'>-		mod_delayed_work(info-&gt;workqueue, &amp;info-&gt;idle_timer_work,</div><div class='del'>-			info-&gt;keep_alive_interval*HZ);</div><div class='del'>-</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int smbd_post_send_sgl(struct smbd_connection *info,</div><div class='del'>-	struct scatterlist *sgl, int data_length, int remaining_data_length)</div><div class='del'>-{</div><div class='del'>-	int num_sgs;</div><div class='del'>-	int i, rc;</div><div class='del'>-	int header_length;</div><div class='del'>-	struct smbd_request *request;</div><div class='del'>-	struct smbd_data_transfer *packet;</div><div class='del'>-	int new_credits;</div><div class='del'>-	struct scatterlist *sg;</div><div class='del'>-</div><div class='del'>-wait_credit:</div><div class='del'>-	/* Wait for send credits. A SMBD packet needs one credit */</div><div class='del'>-	rc = wait_event_interruptible(info-&gt;wait_send_queue,</div><div class='del'>-		atomic_read(&amp;info-&gt;send_credits) &gt; 0 ||</div><div class='del'>-		info-&gt;transport_status != SMBD_CONNECTED);</div><div class='del'>-	if (rc)</div><div class='del'>-		goto err_wait_credit;</div><div class='del'>-</div><div class='del'>-	if (info-&gt;transport_status != SMBD_CONNECTED) {</div><div class='del'>-		log_outgoing(ERR, "disconnected not sending on wait_credit\n");</div><div class='del'>-		rc = -EAGAIN;</div><div class='del'>-		goto err_wait_credit;</div><div class='del'>-	}</div><div class='del'>-	if (unlikely(atomic_dec_return(&amp;info-&gt;send_credits) &lt; 0)) {</div><div class='del'>-		atomic_inc(&amp;info-&gt;send_credits);</div><div class='del'>-		goto wait_credit;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-wait_send_queue:</div><div class='del'>-	wait_event(info-&gt;wait_post_send,</div><div class='del'>-		atomic_read(&amp;info-&gt;send_pending) &lt; info-&gt;send_credit_target ||</div><div class='del'>-		info-&gt;transport_status != SMBD_CONNECTED);</div><div class='del'>-</div><div class='del'>-	if (info-&gt;transport_status != SMBD_CONNECTED) {</div><div class='del'>-		log_outgoing(ERR, "disconnected not sending on wait_send_queue\n");</div><div class='del'>-		rc = -EAGAIN;</div><div class='del'>-		goto err_wait_send_queue;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (unlikely(atomic_inc_return(&amp;info-&gt;send_pending) &gt;</div><div class='del'>-				info-&gt;send_credit_target)) {</div><div class='del'>-		atomic_dec(&amp;info-&gt;send_pending);</div><div class='del'>-		goto wait_send_queue;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	request = mempool_alloc(info-&gt;request_mempool, GFP_KERNEL);</div><div class='del'>-	if (!request) {</div><div class='del'>-		rc = -ENOMEM;</div><div class='del'>-		goto err_alloc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	request-&gt;info = info;</div><div class='del'>-</div><div class='del'>-	/* Fill in the packet header */</div><div class='del'>-	packet = smbd_request_payload(request);</div><div class='del'>-	packet-&gt;credits_requested = cpu_to_le16(info-&gt;send_credit_target);</div><div class='del'>-</div><div class='del'>-	new_credits = manage_credits_prior_sending(info);</div><div class='del'>-	atomic_add(new_credits, &amp;info-&gt;receive_credits);</div><div class='del'>-	packet-&gt;credits_granted = cpu_to_le16(new_credits);</div><div class='del'>-</div><div class='del'>-	info-&gt;send_immediate = false;</div><div class='del'>-</div><div class='del'>-	packet-&gt;flags = 0;</div><div class='del'>-	if (manage_keep_alive_before_sending(info))</div><div class='del'>-		packet-&gt;flags |= cpu_to_le16(SMB_DIRECT_RESPONSE_REQUESTED);</div><div class='del'>-</div><div class='del'>-	packet-&gt;reserved = 0;</div><div class='del'>-	if (!data_length)</div><div class='del'>-		packet-&gt;data_offset = 0;</div><div class='del'>-	else</div><div class='del'>-		packet-&gt;data_offset = cpu_to_le32(24);</div><div class='del'>-	packet-&gt;data_length = cpu_to_le32(data_length);</div><div class='del'>-	packet-&gt;remaining_data_length = cpu_to_le32(remaining_data_length);</div><div class='del'>-	packet-&gt;padding = 0;</div><div class='del'>-</div><div class='del'>-	log_outgoing(INFO, "credits_requested=%d credits_granted=%d data_offset=%d data_length=%d remaining_data_length=%d\n",</div><div class='del'>-		     le16_to_cpu(packet-&gt;credits_requested),</div><div class='del'>-		     le16_to_cpu(packet-&gt;credits_granted),</div><div class='del'>-		     le32_to_cpu(packet-&gt;data_offset),</div><div class='del'>-		     le32_to_cpu(packet-&gt;data_length),</div><div class='del'>-		     le32_to_cpu(packet-&gt;remaining_data_length));</div><div class='del'>-</div><div class='del'>-	/* Map the packet to DMA */</div><div class='del'>-	header_length = sizeof(struct smbd_data_transfer);</div><div class='del'>-	/* If this is a packet without payload, don't send padding */</div><div class='del'>-	if (!data_length)</div><div class='del'>-		header_length = offsetof(struct smbd_data_transfer, padding);</div><div class='del'>-</div><div class='del'>-	request-&gt;num_sge = 1;</div><div class='del'>-	request-&gt;sge[0].addr = ib_dma_map_single(info-&gt;id-&gt;device,</div><div class='del'>-						 (void *)packet,</div><div class='del'>-						 header_length,</div><div class='del'>-						 DMA_TO_DEVICE);</div><div class='del'>-	if (ib_dma_mapping_error(info-&gt;id-&gt;device, request-&gt;sge[0].addr)) {</div><div class='del'>-		rc = -EIO;</div><div class='del'>-		request-&gt;sge[0].addr = 0;</div><div class='del'>-		goto err_dma;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	request-&gt;sge[0].length = header_length;</div><div class='del'>-	request-&gt;sge[0].lkey = info-&gt;pd-&gt;local_dma_lkey;</div><div class='del'>-</div><div class='del'>-	/* Fill in the packet data payload */</div><div class='del'>-	num_sgs = sgl ? sg_nents(sgl) : 0;</div><div class='del'>-	for_each_sg(sgl, sg, num_sgs, i) {</div><div class='del'>-		request-&gt;sge[i+1].addr =</div><div class='del'>-			ib_dma_map_page(info-&gt;id-&gt;device, sg_page(sg),</div><div class='del'>-			       sg-&gt;offset, sg-&gt;length, DMA_TO_DEVICE);</div><div class='del'>-		if (ib_dma_mapping_error(</div><div class='del'>-				info-&gt;id-&gt;device, request-&gt;sge[i+1].addr)) {</div><div class='del'>-			rc = -EIO;</div><div class='del'>-			request-&gt;sge[i+1].addr = 0;</div><div class='del'>-			goto err_dma;</div><div class='del'>-		}</div><div class='del'>-		request-&gt;sge[i+1].length = sg-&gt;length;</div><div class='del'>-		request-&gt;sge[i+1].lkey = info-&gt;pd-&gt;local_dma_lkey;</div><div class='del'>-		request-&gt;num_sge++;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rc = smbd_post_send(info, request);</div><div class='del'>-	if (!rc)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-err_dma:</div><div class='del'>-	for (i = 0; i &lt; request-&gt;num_sge; i++)</div><div class='del'>-		if (request-&gt;sge[i].addr)</div><div class='del'>-			ib_dma_unmap_single(info-&gt;id-&gt;device,</div><div class='del'>-					    request-&gt;sge[i].addr,</div><div class='del'>-					    request-&gt;sge[i].length,</div><div class='del'>-					    DMA_TO_DEVICE);</div><div class='del'>-	mempool_free(request, info-&gt;request_mempool);</div><div class='del'>-</div><div class='del'>-	/* roll back receive credits and credits to be offered */</div><div class='del'>-	spin_lock(&amp;info-&gt;lock_new_credits_offered);</div><div class='del'>-	info-&gt;new_credits_offered += new_credits;</div><div class='del'>-	spin_unlock(&amp;info-&gt;lock_new_credits_offered);</div><div class='del'>-	atomic_sub(new_credits, &amp;info-&gt;receive_credits);</div><div class='del'>-</div><div class='del'>-err_alloc:</div><div class='del'>-	if (atomic_dec_and_test(&amp;info-&gt;send_pending))</div><div class='del'>-		wake_up(&amp;info-&gt;wait_send_pending);</div><div class='del'>-</div><div class='del'>-err_wait_send_queue:</div><div class='del'>-	/* roll back send credits and pending */</div><div class='del'>-	atomic_inc(&amp;info-&gt;send_credits);</div><div class='del'>-</div><div class='del'>-err_wait_credit:</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Send a page</div><div class='del'>- * page: the page to send</div><div class='del'>- * offset: offset in the page to send</div><div class='del'>- * size: length in the page to send</div><div class='del'>- * remaining_data_length: remaining data to send in this payload</div><div class='del'>- */</div><div class='del'>-static int smbd_post_send_page(struct smbd_connection *info, struct page *page,</div><div class='del'>-		unsigned long offset, size_t size, int remaining_data_length)</div><div class='del'>-{</div><div class='del'>-	struct scatterlist sgl;</div><div class='del'>-</div><div class='del'>-	sg_init_table(&amp;sgl, 1);</div><div class='del'>-	sg_set_page(&amp;sgl, page, size, offset);</div><div class='del'>-</div><div class='del'>-	return smbd_post_send_sgl(info, &amp;sgl, size, remaining_data_length);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Send an empty message</div><div class='del'>- * Empty message is used to extend credits to peer to for keep live</div><div class='del'>- * while there is no upper layer payload to send at the time</div><div class='del'>- */</div><div class='del'>-static int smbd_post_send_empty(struct smbd_connection *info)</div><div class='del'>-{</div><div class='del'>-	info-&gt;count_send_empty++;</div><div class='del'>-	return smbd_post_send_sgl(info, NULL, 0, 0);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Send a data buffer</div><div class='del'>- * iov: the iov array describing the data buffers</div><div class='del'>- * n_vec: number of iov array</div><div class='del'>- * remaining_data_length: remaining data to send following this packet</div><div class='del'>- * in segmented SMBD packet</div><div class='del'>- */</div><div class='del'>-static int smbd_post_send_data(</div><div class='del'>-	struct smbd_connection *info, struct kvec *iov, int n_vec,</div><div class='del'>-	int remaining_data_length)</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-	u32 data_length = 0;</div><div class='del'>-	struct scatterlist sgl[SMBDIRECT_MAX_SGE];</div><div class='del'>-</div><div class='del'>-	if (n_vec &gt; SMBDIRECT_MAX_SGE) {</div><div class='del'>-		cifs_dbg(VFS, "Can't fit data to SGL, n_vec=%d\n", n_vec);</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	sg_init_table(sgl, n_vec);</div><div class='del'>-	for (i = 0; i &lt; n_vec; i++) {</div><div class='del'>-		data_length += iov[i].iov_len;</div><div class='del'>-		sg_set_buf(&amp;sgl[i], iov[i].iov_base, iov[i].iov_len);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return smbd_post_send_sgl(info, sgl, data_length, remaining_data_length);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Post a receive request to the transport</div><div class='del'>- * The remote peer can only send data when a receive request is posted</div><div class='del'>- * The interaction is controlled by send/receive credit system</div><div class='del'>- */</div><div class='del'>-static int smbd_post_recv(</div><div class='del'>-		struct smbd_connection *info, struct smbd_response *response)</div><div class='del'>-{</div><div class='del'>-	struct ib_recv_wr recv_wr;</div><div class='del'>-	int rc = -EIO;</div><div class='del'>-</div><div class='del'>-	response-&gt;sge.addr = ib_dma_map_single(</div><div class='del'>-				info-&gt;id-&gt;device, response-&gt;packet,</div><div class='del'>-				info-&gt;max_receive_size, DMA_FROM_DEVICE);</div><div class='del'>-	if (ib_dma_mapping_error(info-&gt;id-&gt;device, response-&gt;sge.addr))</div><div class='del'>-		return rc;</div><div class='del'>-</div><div class='del'>-	response-&gt;sge.length = info-&gt;max_receive_size;</div><div class='del'>-	response-&gt;sge.lkey = info-&gt;pd-&gt;local_dma_lkey;</div><div class='del'>-</div><div class='del'>-	response-&gt;cqe.done = recv_done;</div><div class='del'>-</div><div class='del'>-	recv_wr.wr_cqe = &amp;response-&gt;cqe;</div><div class='del'>-	recv_wr.next = NULL;</div><div class='del'>-	recv_wr.sg_list = &amp;response-&gt;sge;</div><div class='del'>-	recv_wr.num_sge = 1;</div><div class='del'>-</div><div class='del'>-	rc = ib_post_recv(info-&gt;id-&gt;qp, &amp;recv_wr, NULL);</div><div class='del'>-	if (rc) {</div><div class='del'>-		ib_dma_unmap_single(info-&gt;id-&gt;device, response-&gt;sge.addr,</div><div class='del'>-				    response-&gt;sge.length, DMA_FROM_DEVICE);</div><div class='del'>-		smbd_disconnect_rdma_connection(info);</div><div class='del'>-		log_rdma_recv(ERR, "ib_post_recv failed rc=%d\n", rc);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* Perform SMBD negotiate according to [MS-SMBD] 3.1.5.2 */</div><div class='del'>-static int smbd_negotiate(struct smbd_connection *info)</div><div class='del'>-{</div><div class='del'>-	int rc;</div><div class='del'>-	struct smbd_response *response = get_receive_buffer(info);</div><div class='del'>-</div><div class='del'>-	response-&gt;type = SMBD_NEGOTIATE_RESP;</div><div class='del'>-	rc = smbd_post_recv(info, response);</div><div class='del'>-	log_rdma_event(INFO, "smbd_post_recv rc=%d iov.addr=%llx iov.length=%x iov.lkey=%x\n",</div><div class='del'>-		       rc, response-&gt;sge.addr,</div><div class='del'>-		       response-&gt;sge.length, response-&gt;sge.lkey);</div><div class='del'>-	if (rc)</div><div class='del'>-		return rc;</div><div class='del'>-</div><div class='del'>-	init_completion(&amp;info-&gt;negotiate_completion);</div><div class='del'>-	info-&gt;negotiate_done = false;</div><div class='del'>-	rc = smbd_post_send_negotiate_req(info);</div><div class='del'>-	if (rc)</div><div class='del'>-		return rc;</div><div class='del'>-</div><div class='del'>-	rc = wait_for_completion_interruptible_timeout(</div><div class='del'>-		&amp;info-&gt;negotiate_completion, SMBD_NEGOTIATE_TIMEOUT * HZ);</div><div class='del'>-	log_rdma_event(INFO, "wait_for_completion_timeout rc=%d\n", rc);</div><div class='del'>-</div><div class='del'>-	if (info-&gt;negotiate_done)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	if (rc == 0)</div><div class='del'>-		rc = -ETIMEDOUT;</div><div class='del'>-	else if (rc == -ERESTARTSYS)</div><div class='del'>-		rc = -EINTR;</div><div class='del'>-	else</div><div class='del'>-		rc = -ENOTCONN;</div><div class='del'>-</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void put_empty_packet(</div><div class='del'>-		struct smbd_connection *info, struct smbd_response *response)</div><div class='del'>-{</div><div class='del'>-	spin_lock(&amp;info-&gt;empty_packet_queue_lock);</div><div class='del'>-	list_add_tail(&amp;response-&gt;list, &amp;info-&gt;empty_packet_queue);</div><div class='del'>-	info-&gt;count_empty_packet_queue++;</div><div class='del'>-	spin_unlock(&amp;info-&gt;empty_packet_queue_lock);</div><div class='del'>-</div><div class='del'>-	queue_work(info-&gt;workqueue, &amp;info-&gt;post_send_credits_work);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Implement Connection.FragmentReassemblyBuffer defined in [MS-SMBD] 3.1.1.1</div><div class='del'>- * This is a queue for reassembling upper layer payload and present to upper</div><div class='del'>- * layer. All the inncoming payload go to the reassembly queue, regardless of</div><div class='del'>- * if reassembly is required. The uuper layer code reads from the queue for all</div><div class='del'>- * incoming payloads.</div><div class='del'>- * Put a received packet to the reassembly queue</div><div class='del'>- * response: the packet received</div><div class='del'>- * data_length: the size of payload in this packet</div><div class='del'>- */</div><div class='del'>-static void enqueue_reassembly(</div><div class='del'>-	struct smbd_connection *info,</div><div class='del'>-	struct smbd_response *response,</div><div class='del'>-	int data_length)</div><div class='del'>-{</div><div class='del'>-	spin_lock(&amp;info-&gt;reassembly_queue_lock);</div><div class='del'>-	list_add_tail(&amp;response-&gt;list, &amp;info-&gt;reassembly_queue);</div><div class='del'>-	info-&gt;reassembly_queue_length++;</div><div class='del'>-	/*</div><div class='del'>-	 * Make sure reassembly_data_length is updated after list and</div><div class='del'>-	 * reassembly_queue_length are updated. On the dequeue side</div><div class='del'>-	 * reassembly_data_length is checked without a lock to determine</div><div class='del'>-	 * if reassembly_queue_length and list is up to date</div><div class='del'>-	 */</div><div class='del'>-	virt_wmb();</div><div class='del'>-	info-&gt;reassembly_data_length += data_length;</div><div class='del'>-	spin_unlock(&amp;info-&gt;reassembly_queue_lock);</div><div class='del'>-	info-&gt;count_reassembly_queue++;</div><div class='del'>-	info-&gt;count_enqueue_reassembly_queue++;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Get the first entry at the front of reassembly queue</div><div class='del'>- * Caller is responsible for locking</div><div class='del'>- * return value: the first entry if any, NULL if queue is empty</div><div class='del'>- */</div><div class='del'>-static struct smbd_response *_get_first_reassembly(struct smbd_connection *info)</div><div class='del'>-{</div><div class='del'>-	struct smbd_response *ret = NULL;</div><div class='del'>-</div><div class='del'>-	if (!list_empty(&amp;info-&gt;reassembly_queue)) {</div><div class='del'>-		ret = list_first_entry(</div><div class='del'>-			&amp;info-&gt;reassembly_queue,</div><div class='del'>-			struct smbd_response, list);</div><div class='del'>-	}</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct smbd_response *get_empty_queue_buffer(</div><div class='del'>-		struct smbd_connection *info)</div><div class='del'>-{</div><div class='del'>-	struct smbd_response *ret = NULL;</div><div class='del'>-	unsigned long flags;</div><div class='del'>-</div><div class='del'>-	spin_lock_irqsave(&amp;info-&gt;empty_packet_queue_lock, flags);</div><div class='del'>-	if (!list_empty(&amp;info-&gt;empty_packet_queue)) {</div><div class='del'>-		ret = list_first_entry(</div><div class='del'>-			&amp;info-&gt;empty_packet_queue,</div><div class='del'>-			struct smbd_response, list);</div><div class='del'>-		list_del(&amp;ret-&gt;list);</div><div class='del'>-		info-&gt;count_empty_packet_queue--;</div><div class='del'>-	}</div><div class='del'>-	spin_unlock_irqrestore(&amp;info-&gt;empty_packet_queue_lock, flags);</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Get a receive buffer</div><div class='del'>- * For each remote send, we need to post a receive. The receive buffers are</div><div class='del'>- * pre-allocated in advance.</div><div class='del'>- * return value: the receive buffer, NULL if none is available</div><div class='del'>- */</div><div class='del'>-static struct smbd_response *get_receive_buffer(struct smbd_connection *info)</div><div class='del'>-{</div><div class='del'>-	struct smbd_response *ret = NULL;</div><div class='del'>-	unsigned long flags;</div><div class='del'>-</div><div class='del'>-	spin_lock_irqsave(&amp;info-&gt;receive_queue_lock, flags);</div><div class='del'>-	if (!list_empty(&amp;info-&gt;receive_queue)) {</div><div class='del'>-		ret = list_first_entry(</div><div class='del'>-			&amp;info-&gt;receive_queue,</div><div class='del'>-			struct smbd_response, list);</div><div class='del'>-		list_del(&amp;ret-&gt;list);</div><div class='del'>-		info-&gt;count_receive_queue--;</div><div class='del'>-		info-&gt;count_get_receive_buffer++;</div><div class='del'>-	}</div><div class='del'>-	spin_unlock_irqrestore(&amp;info-&gt;receive_queue_lock, flags);</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Return a receive buffer</div><div class='del'>- * Upon returning of a receive buffer, we can post new receive and extend</div><div class='del'>- * more receive credits to remote peer. This is done immediately after a</div><div class='del'>- * receive buffer is returned.</div><div class='del'>- */</div><div class='del'>-static void put_receive_buffer(</div><div class='del'>-	struct smbd_connection *info, struct smbd_response *response)</div><div class='del'>-{</div><div class='del'>-	unsigned long flags;</div><div class='del'>-</div><div class='del'>-	ib_dma_unmap_single(info-&gt;id-&gt;device, response-&gt;sge.addr,</div><div class='del'>-		response-&gt;sge.length, DMA_FROM_DEVICE);</div><div class='del'>-</div><div class='del'>-	spin_lock_irqsave(&amp;info-&gt;receive_queue_lock, flags);</div><div class='del'>-	list_add_tail(&amp;response-&gt;list, &amp;info-&gt;receive_queue);</div><div class='del'>-	info-&gt;count_receive_queue++;</div><div class='del'>-	info-&gt;count_put_receive_buffer++;</div><div class='del'>-	spin_unlock_irqrestore(&amp;info-&gt;receive_queue_lock, flags);</div><div class='del'>-</div><div class='del'>-	queue_work(info-&gt;workqueue, &amp;info-&gt;post_send_credits_work);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* Preallocate all receive buffer on transport establishment */</div><div class='del'>-static int allocate_receive_buffers(struct smbd_connection *info, int num_buf)</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-	struct smbd_response *response;</div><div class='del'>-</div><div class='del'>-	INIT_LIST_HEAD(&amp;info-&gt;reassembly_queue);</div><div class='del'>-	spin_lock_init(&amp;info-&gt;reassembly_queue_lock);</div><div class='del'>-	info-&gt;reassembly_data_length = 0;</div><div class='del'>-	info-&gt;reassembly_queue_length = 0;</div><div class='del'>-</div><div class='del'>-	INIT_LIST_HEAD(&amp;info-&gt;receive_queue);</div><div class='del'>-	spin_lock_init(&amp;info-&gt;receive_queue_lock);</div><div class='del'>-	info-&gt;count_receive_queue = 0;</div><div class='del'>-</div><div class='del'>-	INIT_LIST_HEAD(&amp;info-&gt;empty_packet_queue);</div><div class='del'>-	spin_lock_init(&amp;info-&gt;empty_packet_queue_lock);</div><div class='del'>-	info-&gt;count_empty_packet_queue = 0;</div><div class='del'>-</div><div class='del'>-	init_waitqueue_head(&amp;info-&gt;wait_receive_queues);</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; num_buf; i++) {</div><div class='del'>-		response = mempool_alloc(info-&gt;response_mempool, GFP_KERNEL);</div><div class='del'>-		if (!response)</div><div class='del'>-			goto allocate_failed;</div><div class='del'>-</div><div class='del'>-		response-&gt;info = info;</div><div class='del'>-		list_add_tail(&amp;response-&gt;list, &amp;info-&gt;receive_queue);</div><div class='del'>-		info-&gt;count_receive_queue++;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-allocate_failed:</div><div class='del'>-	while (!list_empty(&amp;info-&gt;receive_queue)) {</div><div class='del'>-		response = list_first_entry(</div><div class='del'>-				&amp;info-&gt;receive_queue,</div><div class='del'>-				struct smbd_response, list);</div><div class='del'>-		list_del(&amp;response-&gt;list);</div><div class='del'>-		info-&gt;count_receive_queue--;</div><div class='del'>-</div><div class='del'>-		mempool_free(response, info-&gt;response_mempool);</div><div class='del'>-	}</div><div class='del'>-	return -ENOMEM;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void destroy_receive_buffers(struct smbd_connection *info)</div><div class='del'>-{</div><div class='del'>-	struct smbd_response *response;</div><div class='del'>-</div><div class='del'>-	while ((response = get_receive_buffer(info)))</div><div class='del'>-		mempool_free(response, info-&gt;response_mempool);</div><div class='del'>-</div><div class='del'>-	while ((response = get_empty_queue_buffer(info)))</div><div class='del'>-		mempool_free(response, info-&gt;response_mempool);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* Implement idle connection timer [MS-SMBD] 3.1.6.2 */</div><div class='del'>-static void idle_connection_timer(struct work_struct *work)</div><div class='del'>-{</div><div class='del'>-	struct smbd_connection *info = container_of(</div><div class='del'>-					work, struct smbd_connection,</div><div class='del'>-					idle_timer_work.work);</div><div class='del'>-</div><div class='del'>-	if (info-&gt;keep_alive_requested != KEEP_ALIVE_NONE) {</div><div class='del'>-		log_keep_alive(ERR,</div><div class='del'>-			"error status info-&gt;keep_alive_requested=%d\n",</div><div class='del'>-			info-&gt;keep_alive_requested);</div><div class='del'>-		smbd_disconnect_rdma_connection(info);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	log_keep_alive(INFO, "about to send an empty idle message\n");</div><div class='del'>-	smbd_post_send_empty(info);</div><div class='del'>-</div><div class='del'>-	/* Setup the next idle timeout work */</div><div class='del'>-	queue_delayed_work(info-&gt;workqueue, &amp;info-&gt;idle_timer_work,</div><div class='del'>-			info-&gt;keep_alive_interval*HZ);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Destroy the transport and related RDMA and memory resources</div><div class='del'>- * Need to go through all the pending counters and make sure on one is using</div><div class='del'>- * the transport while it is destroyed</div><div class='del'>- */</div><div class='del'>-void smbd_destroy(struct TCP_Server_Info *server)</div><div class='del'>-{</div><div class='del'>-	struct smbd_connection *info = server-&gt;smbd_conn;</div><div class='del'>-	struct smbd_response *response;</div><div class='del'>-	unsigned long flags;</div><div class='del'>-</div><div class='del'>-	if (!info) {</div><div class='del'>-		log_rdma_event(INFO, "rdma session already destroyed\n");</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	log_rdma_event(INFO, "destroying rdma session\n");</div><div class='del'>-	if (info-&gt;transport_status != SMBD_DISCONNECTED) {</div><div class='del'>-		rdma_disconnect(server-&gt;smbd_conn-&gt;id);</div><div class='del'>-		log_rdma_event(INFO, "wait for transport being disconnected\n");</div><div class='del'>-		wait_event_interruptible(</div><div class='del'>-			info-&gt;disconn_wait,</div><div class='del'>-			info-&gt;transport_status == SMBD_DISCONNECTED);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	log_rdma_event(INFO, "destroying qp\n");</div><div class='del'>-	ib_drain_qp(info-&gt;id-&gt;qp);</div><div class='del'>-	rdma_destroy_qp(info-&gt;id);</div><div class='del'>-</div><div class='del'>-	log_rdma_event(INFO, "cancelling idle timer\n");</div><div class='del'>-	cancel_delayed_work_sync(&amp;info-&gt;idle_timer_work);</div><div class='del'>-</div><div class='del'>-	log_rdma_event(INFO, "wait for all send posted to IB to finish\n");</div><div class='del'>-	wait_event(info-&gt;wait_send_pending,</div><div class='del'>-		atomic_read(&amp;info-&gt;send_pending) == 0);</div><div class='del'>-</div><div class='del'>-	/* It's not posssible for upper layer to get to reassembly */</div><div class='del'>-	log_rdma_event(INFO, "drain the reassembly queue\n");</div><div class='del'>-	do {</div><div class='del'>-		spin_lock_irqsave(&amp;info-&gt;reassembly_queue_lock, flags);</div><div class='del'>-		response = _get_first_reassembly(info);</div><div class='del'>-		if (response) {</div><div class='del'>-			list_del(&amp;response-&gt;list);</div><div class='del'>-			spin_unlock_irqrestore(</div><div class='del'>-				&amp;info-&gt;reassembly_queue_lock, flags);</div><div class='del'>-			put_receive_buffer(info, response);</div><div class='del'>-		} else</div><div class='del'>-			spin_unlock_irqrestore(</div><div class='del'>-				&amp;info-&gt;reassembly_queue_lock, flags);</div><div class='del'>-	} while (response);</div><div class='del'>-	info-&gt;reassembly_data_length = 0;</div><div class='del'>-</div><div class='del'>-	log_rdma_event(INFO, "free receive buffers\n");</div><div class='del'>-	wait_event(info-&gt;wait_receive_queues,</div><div class='del'>-		info-&gt;count_receive_queue + info-&gt;count_empty_packet_queue</div><div class='del'>-			== info-&gt;receive_credit_max);</div><div class='del'>-	destroy_receive_buffers(info);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * For performance reasons, memory registration and deregistration</div><div class='del'>-	 * are not locked by srv_mutex. It is possible some processes are</div><div class='del'>-	 * blocked on transport srv_mutex while holding memory registration.</div><div class='del'>-	 * Release the transport srv_mutex to allow them to hit the failure</div><div class='del'>-	 * path when sending data, and then release memory registartions.</div><div class='del'>-	 */</div><div class='del'>-	log_rdma_event(INFO, "freeing mr list\n");</div><div class='del'>-	wake_up_interruptible_all(&amp;info-&gt;wait_mr);</div><div class='del'>-	while (atomic_read(&amp;info-&gt;mr_used_count)) {</div><div class='del'>-		mutex_unlock(&amp;server-&gt;srv_mutex);</div><div class='del'>-		msleep(1000);</div><div class='del'>-		mutex_lock(&amp;server-&gt;srv_mutex);</div><div class='del'>-	}</div><div class='del'>-	destroy_mr_list(info);</div><div class='del'>-</div><div class='del'>-	ib_free_cq(info-&gt;send_cq);</div><div class='del'>-	ib_free_cq(info-&gt;recv_cq);</div><div class='del'>-	ib_dealloc_pd(info-&gt;pd);</div><div class='del'>-	rdma_destroy_id(info-&gt;id);</div><div class='del'>-</div><div class='del'>-	/* free mempools */</div><div class='del'>-	mempool_destroy(info-&gt;request_mempool);</div><div class='del'>-	kmem_cache_destroy(info-&gt;request_cache);</div><div class='del'>-</div><div class='del'>-	mempool_destroy(info-&gt;response_mempool);</div><div class='del'>-	kmem_cache_destroy(info-&gt;response_cache);</div><div class='del'>-</div><div class='del'>-	info-&gt;transport_status = SMBD_DESTROYED;</div><div class='del'>-</div><div class='del'>-	destroy_workqueue(info-&gt;workqueue);</div><div class='del'>-	log_rdma_event(INFO,  "rdma session destroyed\n");</div><div class='del'>-	kfree(info);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Reconnect this SMBD connection, called from upper layer</div><div class='del'>- * return value: 0 on success, or actual error code</div><div class='del'>- */</div><div class='del'>-int smbd_reconnect(struct TCP_Server_Info *server)</div><div class='del'>-{</div><div class='del'>-	log_rdma_event(INFO, "reconnecting rdma session\n");</div><div class='del'>-</div><div class='del'>-	if (!server-&gt;smbd_conn) {</div><div class='del'>-		log_rdma_event(INFO, "rdma session already destroyed\n");</div><div class='del'>-		goto create_conn;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * This is possible if transport is disconnected and we haven't received</div><div class='del'>-	 * notification from RDMA, but upper layer has detected timeout</div><div class='del'>-	 */</div><div class='del'>-	if (server-&gt;smbd_conn-&gt;transport_status == SMBD_CONNECTED) {</div><div class='del'>-		log_rdma_event(INFO, "disconnecting transport\n");</div><div class='del'>-		smbd_destroy(server);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-create_conn:</div><div class='del'>-	log_rdma_event(INFO, "creating rdma session\n");</div><div class='del'>-	server-&gt;smbd_conn = smbd_get_connection(</div><div class='del'>-		server, (struct sockaddr *) &amp;server-&gt;dstaddr);</div><div class='del'>-</div><div class='del'>-	if (server-&gt;smbd_conn)</div><div class='del'>-		cifs_dbg(VFS, "RDMA transport re-established\n");</div><div class='del'>-</div><div class='del'>-	return server-&gt;smbd_conn ? 0 : -ENOENT;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void destroy_caches_and_workqueue(struct smbd_connection *info)</div><div class='del'>-{</div><div class='del'>-	destroy_receive_buffers(info);</div><div class='del'>-	destroy_workqueue(info-&gt;workqueue);</div><div class='del'>-	mempool_destroy(info-&gt;response_mempool);</div><div class='del'>-	kmem_cache_destroy(info-&gt;response_cache);</div><div class='del'>-	mempool_destroy(info-&gt;request_mempool);</div><div class='del'>-	kmem_cache_destroy(info-&gt;request_cache);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#define MAX_NAME_LEN	80</div><div class='del'>-static int allocate_caches_and_workqueue(struct smbd_connection *info)</div><div class='del'>-{</div><div class='del'>-	char name[MAX_NAME_LEN];</div><div class='del'>-	int rc;</div><div class='del'>-</div><div class='del'>-	scnprintf(name, MAX_NAME_LEN, "smbd_request_%p", info);</div><div class='del'>-	info-&gt;request_cache =</div><div class='del'>-		kmem_cache_create(</div><div class='del'>-			name,</div><div class='del'>-			sizeof(struct smbd_request) +</div><div class='del'>-				sizeof(struct smbd_data_transfer),</div><div class='del'>-			0, SLAB_HWCACHE_ALIGN, NULL);</div><div class='del'>-	if (!info-&gt;request_cache)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	info-&gt;request_mempool =</div><div class='del'>-		mempool_create(info-&gt;send_credit_target, mempool_alloc_slab,</div><div class='del'>-			mempool_free_slab, info-&gt;request_cache);</div><div class='del'>-	if (!info-&gt;request_mempool)</div><div class='del'>-		goto out1;</div><div class='del'>-</div><div class='del'>-	scnprintf(name, MAX_NAME_LEN, "smbd_response_%p", info);</div><div class='del'>-	info-&gt;response_cache =</div><div class='del'>-		kmem_cache_create(</div><div class='del'>-			name,</div><div class='del'>-			sizeof(struct smbd_response) +</div><div class='del'>-				info-&gt;max_receive_size,</div><div class='del'>-			0, SLAB_HWCACHE_ALIGN, NULL);</div><div class='del'>-	if (!info-&gt;response_cache)</div><div class='del'>-		goto out2;</div><div class='del'>-</div><div class='del'>-	info-&gt;response_mempool =</div><div class='del'>-		mempool_create(info-&gt;receive_credit_max, mempool_alloc_slab,</div><div class='del'>-		       mempool_free_slab, info-&gt;response_cache);</div><div class='del'>-	if (!info-&gt;response_mempool)</div><div class='del'>-		goto out3;</div><div class='del'>-</div><div class='del'>-	scnprintf(name, MAX_NAME_LEN, "smbd_%p", info);</div><div class='del'>-	info-&gt;workqueue = create_workqueue(name);</div><div class='del'>-	if (!info-&gt;workqueue)</div><div class='del'>-		goto out4;</div><div class='del'>-</div><div class='del'>-	rc = allocate_receive_buffers(info, info-&gt;receive_credit_max);</div><div class='del'>-	if (rc) {</div><div class='del'>-		log_rdma_event(ERR, "failed to allocate receive buffers\n");</div><div class='del'>-		goto out5;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-out5:</div><div class='del'>-	destroy_workqueue(info-&gt;workqueue);</div><div class='del'>-out4:</div><div class='del'>-	mempool_destroy(info-&gt;response_mempool);</div><div class='del'>-out3:</div><div class='del'>-	kmem_cache_destroy(info-&gt;response_cache);</div><div class='del'>-out2:</div><div class='del'>-	mempool_destroy(info-&gt;request_mempool);</div><div class='del'>-out1:</div><div class='del'>-	kmem_cache_destroy(info-&gt;request_cache);</div><div class='del'>-	return -ENOMEM;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* Create a SMBD connection, called by upper layer */</div><div class='del'>-static struct smbd_connection *_smbd_get_connection(</div><div class='del'>-	struct TCP_Server_Info *server, struct sockaddr *dstaddr, int port)</div><div class='del'>-{</div><div class='del'>-	int rc;</div><div class='del'>-	struct smbd_connection *info;</div><div class='del'>-	struct rdma_conn_param conn_param;</div><div class='del'>-	struct ib_qp_init_attr qp_attr;</div><div class='del'>-	struct sockaddr_in *addr_in = (struct sockaddr_in *) dstaddr;</div><div class='del'>-	struct ib_port_immutable port_immutable;</div><div class='del'>-	u32 ird_ord_hdr[2];</div><div class='del'>-</div><div class='del'>-	info = kzalloc(sizeof(struct smbd_connection), GFP_KERNEL);</div><div class='del'>-	if (!info)</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	info-&gt;transport_status = SMBD_CONNECTING;</div><div class='del'>-	rc = smbd_ia_open(info, dstaddr, port);</div><div class='del'>-	if (rc) {</div><div class='del'>-		log_rdma_event(INFO, "smbd_ia_open rc=%d\n", rc);</div><div class='del'>-		goto create_id_failed;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (smbd_send_credit_target &gt; info-&gt;id-&gt;device-&gt;attrs.max_cqe ||</div><div class='del'>-	    smbd_send_credit_target &gt; info-&gt;id-&gt;device-&gt;attrs.max_qp_wr) {</div><div class='del'>-		log_rdma_event(ERR, "consider lowering send_credit_target = %d. Possible CQE overrun, device reporting max_cpe %d max_qp_wr %d\n",</div><div class='del'>-			       smbd_send_credit_target,</div><div class='del'>-			       info-&gt;id-&gt;device-&gt;attrs.max_cqe,</div><div class='del'>-			       info-&gt;id-&gt;device-&gt;attrs.max_qp_wr);</div><div class='del'>-		goto config_failed;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (smbd_receive_credit_max &gt; info-&gt;id-&gt;device-&gt;attrs.max_cqe ||</div><div class='del'>-	    smbd_receive_credit_max &gt; info-&gt;id-&gt;device-&gt;attrs.max_qp_wr) {</div><div class='del'>-		log_rdma_event(ERR, "consider lowering receive_credit_max = %d. Possible CQE overrun, device reporting max_cpe %d max_qp_wr %d\n",</div><div class='del'>-			       smbd_receive_credit_max,</div><div class='del'>-			       info-&gt;id-&gt;device-&gt;attrs.max_cqe,</div><div class='del'>-			       info-&gt;id-&gt;device-&gt;attrs.max_qp_wr);</div><div class='del'>-		goto config_failed;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	info-&gt;receive_credit_max = smbd_receive_credit_max;</div><div class='del'>-	info-&gt;send_credit_target = smbd_send_credit_target;</div><div class='del'>-	info-&gt;max_send_size = smbd_max_send_size;</div><div class='del'>-	info-&gt;max_fragmented_recv_size = smbd_max_fragmented_recv_size;</div><div class='del'>-	info-&gt;max_receive_size = smbd_max_receive_size;</div><div class='del'>-	info-&gt;keep_alive_interval = smbd_keep_alive_interval;</div><div class='del'>-</div><div class='del'>-	if (info-&gt;id-&gt;device-&gt;attrs.max_send_sge &lt; SMBDIRECT_MAX_SGE) {</div><div class='del'>-		log_rdma_event(ERR,</div><div class='del'>-			"warning: device max_send_sge = %d too small\n",</div><div class='del'>-			info-&gt;id-&gt;device-&gt;attrs.max_send_sge);</div><div class='del'>-		log_rdma_event(ERR, "Queue Pair creation may fail\n");</div><div class='del'>-	}</div><div class='del'>-	if (info-&gt;id-&gt;device-&gt;attrs.max_recv_sge &lt; SMBDIRECT_MAX_SGE) {</div><div class='del'>-		log_rdma_event(ERR,</div><div class='del'>-			"warning: device max_recv_sge = %d too small\n",</div><div class='del'>-			info-&gt;id-&gt;device-&gt;attrs.max_recv_sge);</div><div class='del'>-		log_rdma_event(ERR, "Queue Pair creation may fail\n");</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	info-&gt;send_cq = NULL;</div><div class='del'>-	info-&gt;recv_cq = NULL;</div><div class='del'>-	info-&gt;send_cq =</div><div class='del'>-		ib_alloc_cq_any(info-&gt;id-&gt;device, info,</div><div class='del'>-				info-&gt;send_credit_target, IB_POLL_SOFTIRQ);</div><div class='del'>-	if (IS_ERR(info-&gt;send_cq)) {</div><div class='del'>-		info-&gt;send_cq = NULL;</div><div class='del'>-		goto alloc_cq_failed;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	info-&gt;recv_cq =</div><div class='del'>-		ib_alloc_cq_any(info-&gt;id-&gt;device, info,</div><div class='del'>-				info-&gt;receive_credit_max, IB_POLL_SOFTIRQ);</div><div class='del'>-	if (IS_ERR(info-&gt;recv_cq)) {</div><div class='del'>-		info-&gt;recv_cq = NULL;</div><div class='del'>-		goto alloc_cq_failed;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	memset(&amp;qp_attr, 0, sizeof(qp_attr));</div><div class='del'>-	qp_attr.event_handler = smbd_qp_async_error_upcall;</div><div class='del'>-	qp_attr.qp_context = info;</div><div class='del'>-	qp_attr.cap.max_send_wr = info-&gt;send_credit_target;</div><div class='del'>-	qp_attr.cap.max_recv_wr = info-&gt;receive_credit_max;</div><div class='del'>-	qp_attr.cap.max_send_sge = SMBDIRECT_MAX_SGE;</div><div class='del'>-	qp_attr.cap.max_recv_sge = SMBDIRECT_MAX_SGE;</div><div class='del'>-	qp_attr.cap.max_inline_data = 0;</div><div class='del'>-	qp_attr.sq_sig_type = IB_SIGNAL_REQ_WR;</div><div class='del'>-	qp_attr.qp_type = IB_QPT_RC;</div><div class='del'>-	qp_attr.send_cq = info-&gt;send_cq;</div><div class='del'>-	qp_attr.recv_cq = info-&gt;recv_cq;</div><div class='del'>-	qp_attr.port_num = ~0;</div><div class='del'>-</div><div class='del'>-	rc = rdma_create_qp(info-&gt;id, info-&gt;pd, &amp;qp_attr);</div><div class='del'>-	if (rc) {</div><div class='del'>-		log_rdma_event(ERR, "rdma_create_qp failed %i\n", rc);</div><div class='del'>-		goto create_qp_failed;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	memset(&amp;conn_param, 0, sizeof(conn_param));</div><div class='del'>-	conn_param.initiator_depth = 0;</div><div class='del'>-</div><div class='del'>-	conn_param.responder_resources =</div><div class='del'>-		info-&gt;id-&gt;device-&gt;attrs.max_qp_rd_atom</div><div class='del'>-			&lt; SMBD_CM_RESPONDER_RESOURCES ?</div><div class='del'>-		info-&gt;id-&gt;device-&gt;attrs.max_qp_rd_atom :</div><div class='del'>-		SMBD_CM_RESPONDER_RESOURCES;</div><div class='del'>-	info-&gt;responder_resources = conn_param.responder_resources;</div><div class='del'>-	log_rdma_mr(INFO, "responder_resources=%d\n",</div><div class='del'>-		info-&gt;responder_resources);</div><div class='del'>-</div><div class='del'>-	/* Need to send IRD/ORD in private data for iWARP */</div><div class='del'>-	info-&gt;id-&gt;device-&gt;ops.get_port_immutable(</div><div class='del'>-		info-&gt;id-&gt;device, info-&gt;id-&gt;port_num, &amp;port_immutable);</div><div class='del'>-	if (port_immutable.core_cap_flags &amp; RDMA_CORE_PORT_IWARP) {</div><div class='del'>-		ird_ord_hdr[0] = info-&gt;responder_resources;</div><div class='del'>-		ird_ord_hdr[1] = 1;</div><div class='del'>-		conn_param.private_data = ird_ord_hdr;</div><div class='del'>-		conn_param.private_data_len = sizeof(ird_ord_hdr);</div><div class='del'>-	} else {</div><div class='del'>-		conn_param.private_data = NULL;</div><div class='del'>-		conn_param.private_data_len = 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	conn_param.retry_count = SMBD_CM_RETRY;</div><div class='del'>-	conn_param.rnr_retry_count = SMBD_CM_RNR_RETRY;</div><div class='del'>-	conn_param.flow_control = 0;</div><div class='del'>-</div><div class='del'>-	log_rdma_event(INFO, "connecting to IP %pI4 port %d\n",</div><div class='del'>-		&amp;addr_in-&gt;sin_addr, port);</div><div class='del'>-</div><div class='del'>-	init_waitqueue_head(&amp;info-&gt;conn_wait);</div><div class='del'>-	init_waitqueue_head(&amp;info-&gt;disconn_wait);</div><div class='del'>-	init_waitqueue_head(&amp;info-&gt;wait_reassembly_queue);</div><div class='del'>-	rc = rdma_connect(info-&gt;id, &amp;conn_param);</div><div class='del'>-	if (rc) {</div><div class='del'>-		log_rdma_event(ERR, "rdma_connect() failed with %i\n", rc);</div><div class='del'>-		goto rdma_connect_failed;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	wait_event_interruptible(</div><div class='del'>-		info-&gt;conn_wait, info-&gt;transport_status != SMBD_CONNECTING);</div><div class='del'>-</div><div class='del'>-	if (info-&gt;transport_status != SMBD_CONNECTED) {</div><div class='del'>-		log_rdma_event(ERR, "rdma_connect failed port=%d\n", port);</div><div class='del'>-		goto rdma_connect_failed;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	log_rdma_event(INFO, "rdma_connect connected\n");</div><div class='del'>-</div><div class='del'>-	rc = allocate_caches_and_workqueue(info);</div><div class='del'>-	if (rc) {</div><div class='del'>-		log_rdma_event(ERR, "cache allocation failed\n");</div><div class='del'>-		goto allocate_cache_failed;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	init_waitqueue_head(&amp;info-&gt;wait_send_queue);</div><div class='del'>-	INIT_DELAYED_WORK(&amp;info-&gt;idle_timer_work, idle_connection_timer);</div><div class='del'>-	queue_delayed_work(info-&gt;workqueue, &amp;info-&gt;idle_timer_work,</div><div class='del'>-		info-&gt;keep_alive_interval*HZ);</div><div class='del'>-</div><div class='del'>-	init_waitqueue_head(&amp;info-&gt;wait_send_pending);</div><div class='del'>-	atomic_set(&amp;info-&gt;send_pending, 0);</div><div class='del'>-</div><div class='del'>-	init_waitqueue_head(&amp;info-&gt;wait_post_send);</div><div class='del'>-</div><div class='del'>-	INIT_WORK(&amp;info-&gt;disconnect_work, smbd_disconnect_rdma_work);</div><div class='del'>-	INIT_WORK(&amp;info-&gt;post_send_credits_work, smbd_post_send_credits);</div><div class='del'>-	info-&gt;new_credits_offered = 0;</div><div class='del'>-	spin_lock_init(&amp;info-&gt;lock_new_credits_offered);</div><div class='del'>-</div><div class='del'>-	rc = smbd_negotiate(info);</div><div class='del'>-	if (rc) {</div><div class='del'>-		log_rdma_event(ERR, "smbd_negotiate rc=%d\n", rc);</div><div class='del'>-		goto negotiation_failed;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rc = allocate_mr_list(info);</div><div class='del'>-	if (rc) {</div><div class='del'>-		log_rdma_mr(ERR, "memory registration allocation failed\n");</div><div class='del'>-		goto allocate_mr_failed;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return info;</div><div class='del'>-</div><div class='del'>-allocate_mr_failed:</div><div class='del'>-	/* At this point, need to a full transport shutdown */</div><div class='del'>-	smbd_destroy(server);</div><div class='del'>-	return NULL;</div><div class='del'>-</div><div class='del'>-negotiation_failed:</div><div class='del'>-	cancel_delayed_work_sync(&amp;info-&gt;idle_timer_work);</div><div class='del'>-	destroy_caches_and_workqueue(info);</div><div class='del'>-	info-&gt;transport_status = SMBD_NEGOTIATE_FAILED;</div><div class='del'>-	init_waitqueue_head(&amp;info-&gt;conn_wait);</div><div class='del'>-	rdma_disconnect(info-&gt;id);</div><div class='del'>-	wait_event(info-&gt;conn_wait,</div><div class='del'>-		info-&gt;transport_status == SMBD_DISCONNECTED);</div><div class='del'>-</div><div class='del'>-allocate_cache_failed:</div><div class='del'>-rdma_connect_failed:</div><div class='del'>-	rdma_destroy_qp(info-&gt;id);</div><div class='del'>-</div><div class='del'>-create_qp_failed:</div><div class='del'>-alloc_cq_failed:</div><div class='del'>-	if (info-&gt;send_cq)</div><div class='del'>-		ib_free_cq(info-&gt;send_cq);</div><div class='del'>-	if (info-&gt;recv_cq)</div><div class='del'>-		ib_free_cq(info-&gt;recv_cq);</div><div class='del'>-</div><div class='del'>-config_failed:</div><div class='del'>-	ib_dealloc_pd(info-&gt;pd);</div><div class='del'>-	rdma_destroy_id(info-&gt;id);</div><div class='del'>-</div><div class='del'>-create_id_failed:</div><div class='del'>-	kfree(info);</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct smbd_connection *smbd_get_connection(</div><div class='del'>-	struct TCP_Server_Info *server, struct sockaddr *dstaddr)</div><div class='del'>-{</div><div class='del'>-	struct smbd_connection *ret;</div><div class='del'>-	int port = SMBD_PORT;</div><div class='del'>-</div><div class='del'>-try_again:</div><div class='del'>-	ret = _smbd_get_connection(server, dstaddr, port);</div><div class='del'>-</div><div class='del'>-	/* Try SMB_PORT if SMBD_PORT doesn't work */</div><div class='del'>-	if (!ret &amp;&amp; port == SMBD_PORT) {</div><div class='del'>-		port = SMB_PORT;</div><div class='del'>-		goto try_again;</div><div class='del'>-	}</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Receive data from receive reassembly queue</div><div class='del'>- * All the incoming data packets are placed in reassembly queue</div><div class='del'>- * buf: the buffer to read data into</div><div class='del'>- * size: the length of data to read</div><div class='del'>- * return value: actual data read</div><div class='del'>- * Note: this implementation copies the data from reassebmly queue to receive</div><div class='del'>- * buffers used by upper layer. This is not the optimal code path. A better way</div><div class='del'>- * to do it is to not have upper layer allocate its receive buffers but rather</div><div class='del'>- * borrow the buffer from reassembly queue, and return it after data is</div><div class='del'>- * consumed. But this will require more changes to upper layer code, and also</div><div class='del'>- * need to consider packet boundaries while they still being reassembled.</div><div class='del'>- */</div><div class='del'>-static int smbd_recv_buf(struct smbd_connection *info, char *buf,</div><div class='del'>-		unsigned int size)</div><div class='del'>-{</div><div class='del'>-	struct smbd_response *response;</div><div class='del'>-	struct smbd_data_transfer *data_transfer;</div><div class='del'>-	int to_copy, to_read, data_read, offset;</div><div class='del'>-	u32 data_length, remaining_data_length, data_offset;</div><div class='del'>-	int rc;</div><div class='del'>-</div><div class='del'>-again:</div><div class='del'>-	/*</div><div class='del'>-	 * No need to hold the reassembly queue lock all the time as we are</div><div class='del'>-	 * the only one reading from the front of the queue. The transport</div><div class='del'>-	 * may add more entries to the back of the queue at the same time</div><div class='del'>-	 */</div><div class='del'>-	log_read(INFO, "size=%d info-&gt;reassembly_data_length=%d\n", size,</div><div class='del'>-		info-&gt;reassembly_data_length);</div><div class='del'>-	if (info-&gt;reassembly_data_length &gt;= size) {</div><div class='del'>-		int queue_length;</div><div class='del'>-		int queue_removed = 0;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Need to make sure reassembly_data_length is read before</div><div class='del'>-		 * reading reassembly_queue_length and calling</div><div class='del'>-		 * _get_first_reassembly. This call is lock free</div><div class='del'>-		 * as we never read at the end of the queue which are being</div><div class='del'>-		 * updated in SOFTIRQ as more data is received</div><div class='del'>-		 */</div><div class='del'>-		virt_rmb();</div><div class='del'>-		queue_length = info-&gt;reassembly_queue_length;</div><div class='del'>-		data_read = 0;</div><div class='del'>-		to_read = size;</div><div class='del'>-		offset = info-&gt;first_entry_offset;</div><div class='del'>-		while (data_read &lt; size) {</div><div class='del'>-			response = _get_first_reassembly(info);</div><div class='del'>-			data_transfer = smbd_response_payload(response);</div><div class='del'>-			data_length = le32_to_cpu(data_transfer-&gt;data_length);</div><div class='del'>-			remaining_data_length =</div><div class='del'>-				le32_to_cpu(</div><div class='del'>-					data_transfer-&gt;remaining_data_length);</div><div class='del'>-			data_offset = le32_to_cpu(data_transfer-&gt;data_offset);</div><div class='del'>-</div><div class='del'>-			/*</div><div class='del'>-			 * The upper layer expects RFC1002 length at the</div><div class='del'>-			 * beginning of the payload. Return it to indicate</div><div class='del'>-			 * the total length of the packet. This minimize the</div><div class='del'>-			 * change to upper layer packet processing logic. This</div><div class='del'>-			 * will be eventually remove when an intermediate</div><div class='del'>-			 * transport layer is added</div><div class='del'>-			 */</div><div class='del'>-			if (response-&gt;first_segment &amp;&amp; size == 4) {</div><div class='del'>-				unsigned int rfc1002_len =</div><div class='del'>-					data_length + remaining_data_length;</div><div class='del'>-				*((__be32 *)buf) = cpu_to_be32(rfc1002_len);</div><div class='del'>-				data_read = 4;</div><div class='del'>-				response-&gt;first_segment = false;</div><div class='del'>-				log_read(INFO, "returning rfc1002 length %d\n",</div><div class='del'>-					rfc1002_len);</div><div class='del'>-				goto read_rfc1002_done;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			to_copy = min_t(int, data_length - offset, to_read);</div><div class='del'>-			memcpy(</div><div class='del'>-				buf + data_read,</div><div class='del'>-				(char *)data_transfer + data_offset + offset,</div><div class='del'>-				to_copy);</div><div class='del'>-</div><div class='del'>-			/* move on to the next buffer? */</div><div class='del'>-			if (to_copy == data_length - offset) {</div><div class='del'>-				queue_length--;</div><div class='del'>-				/*</div><div class='del'>-				 * No need to lock if we are not at the</div><div class='del'>-				 * end of the queue</div><div class='del'>-				 */</div><div class='del'>-				if (queue_length)</div><div class='del'>-					list_del(&amp;response-&gt;list);</div><div class='del'>-				else {</div><div class='del'>-					spin_lock_irq(</div><div class='del'>-						&amp;info-&gt;reassembly_queue_lock);</div><div class='del'>-					list_del(&amp;response-&gt;list);</div><div class='del'>-					spin_unlock_irq(</div><div class='del'>-						&amp;info-&gt;reassembly_queue_lock);</div><div class='del'>-				}</div><div class='del'>-				queue_removed++;</div><div class='del'>-				info-&gt;count_reassembly_queue--;</div><div class='del'>-				info-&gt;count_dequeue_reassembly_queue++;</div><div class='del'>-				put_receive_buffer(info, response);</div><div class='del'>-				offset = 0;</div><div class='del'>-				log_read(INFO, "put_receive_buffer offset=0\n");</div><div class='del'>-			} else</div><div class='del'>-				offset += to_copy;</div><div class='del'>-</div><div class='del'>-			to_read -= to_copy;</div><div class='del'>-			data_read += to_copy;</div><div class='del'>-</div><div class='del'>-			log_read(INFO, "_get_first_reassembly memcpy %d bytes data_transfer_length-offset=%d after that to_read=%d data_read=%d offset=%d\n",</div><div class='del'>-				 to_copy, data_length - offset,</div><div class='del'>-				 to_read, data_read, offset);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		spin_lock_irq(&amp;info-&gt;reassembly_queue_lock);</div><div class='del'>-		info-&gt;reassembly_data_length -= data_read;</div><div class='del'>-		info-&gt;reassembly_queue_length -= queue_removed;</div><div class='del'>-		spin_unlock_irq(&amp;info-&gt;reassembly_queue_lock);</div><div class='del'>-</div><div class='del'>-		info-&gt;first_entry_offset = offset;</div><div class='del'>-		log_read(INFO, "returning to thread data_read=%d reassembly_data_length=%d first_entry_offset=%d\n",</div><div class='del'>-			 data_read, info-&gt;reassembly_data_length,</div><div class='del'>-			 info-&gt;first_entry_offset);</div><div class='del'>-read_rfc1002_done:</div><div class='del'>-		return data_read;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	log_read(INFO, "wait_event on more data\n");</div><div class='del'>-	rc = wait_event_interruptible(</div><div class='del'>-		info-&gt;wait_reassembly_queue,</div><div class='del'>-		info-&gt;reassembly_data_length &gt;= size ||</div><div class='del'>-			info-&gt;transport_status != SMBD_CONNECTED);</div><div class='del'>-	/* Don't return any data if interrupted */</div><div class='del'>-	if (rc)</div><div class='del'>-		return rc;</div><div class='del'>-</div><div class='del'>-	if (info-&gt;transport_status != SMBD_CONNECTED) {</div><div class='del'>-		log_read(ERR, "disconnected\n");</div><div class='del'>-		return -ECONNABORTED;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	goto again;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Receive a page from receive reassembly queue</div><div class='del'>- * page: the page to read data into</div><div class='del'>- * to_read: the length of data to read</div><div class='del'>- * return value: actual data read</div><div class='del'>- */</div><div class='del'>-static int smbd_recv_page(struct smbd_connection *info,</div><div class='del'>-		struct page *page, unsigned int page_offset,</div><div class='del'>-		unsigned int to_read)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-	char *to_address;</div><div class='del'>-	void *page_address;</div><div class='del'>-</div><div class='del'>-	/* make sure we have the page ready for read */</div><div class='del'>-	ret = wait_event_interruptible(</div><div class='del'>-		info-&gt;wait_reassembly_queue,</div><div class='del'>-		info-&gt;reassembly_data_length &gt;= to_read ||</div><div class='del'>-			info-&gt;transport_status != SMBD_CONNECTED);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	/* now we can read from reassembly queue and not sleep */</div><div class='del'>-	page_address = kmap_atomic(page);</div><div class='del'>-	to_address = (char *) page_address + page_offset;</div><div class='del'>-</div><div class='del'>-	log_read(INFO, "reading from page=%p address=%p to_read=%d\n",</div><div class='del'>-		page, to_address, to_read);</div><div class='del'>-</div><div class='del'>-	ret = smbd_recv_buf(info, to_address, to_read);</div><div class='del'>-	kunmap_atomic(page_address);</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Receive data from transport</div><div class='del'>- * msg: a msghdr point to the buffer, can be ITER_KVEC or ITER_BVEC</div><div class='del'>- * return: total bytes read, or 0. SMB Direct will not do partial read.</div><div class='del'>- */</div><div class='del'>-int smbd_recv(struct smbd_connection *info, struct msghdr *msg)</div><div class='del'>-{</div><div class='del'>-	char *buf;</div><div class='del'>-	struct page *page;</div><div class='del'>-	unsigned int to_read, page_offset;</div><div class='del'>-	int rc;</div><div class='del'>-</div><div class='del'>-	if (iov_iter_rw(&amp;msg-&gt;msg_iter) == WRITE) {</div><div class='del'>-		/* It's a bug in upper layer to get there */</div><div class='del'>-		cifs_dbg(VFS, "Invalid msg iter dir %u\n",</div><div class='del'>-			 iov_iter_rw(&amp;msg-&gt;msg_iter));</div><div class='del'>-		rc = -EINVAL;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	switch (iov_iter_type(&amp;msg-&gt;msg_iter)) {</div><div class='del'>-	case ITER_KVEC:</div><div class='del'>-		buf = msg-&gt;msg_iter.kvec-&gt;iov_base;</div><div class='del'>-		to_read = msg-&gt;msg_iter.kvec-&gt;iov_len;</div><div class='del'>-		rc = smbd_recv_buf(info, buf, to_read);</div><div class='del'>-		break;</div><div class='del'>-</div><div class='del'>-	case ITER_BVEC:</div><div class='del'>-		page = msg-&gt;msg_iter.bvec-&gt;bv_page;</div><div class='del'>-		page_offset = msg-&gt;msg_iter.bvec-&gt;bv_offset;</div><div class='del'>-		to_read = msg-&gt;msg_iter.bvec-&gt;bv_len;</div><div class='del'>-		rc = smbd_recv_page(info, page, page_offset, to_read);</div><div class='del'>-		break;</div><div class='del'>-</div><div class='del'>-	default:</div><div class='del'>-		/* It's a bug in upper layer to get there */</div><div class='del'>-		cifs_dbg(VFS, "Invalid msg type %d\n",</div><div class='del'>-			 iov_iter_type(&amp;msg-&gt;msg_iter));</div><div class='del'>-		rc = -EINVAL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	/* SMBDirect will read it all or nothing */</div><div class='del'>-	if (rc &gt; 0)</div><div class='del'>-		msg-&gt;msg_iter.count = 0;</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Send data to transport</div><div class='del'>- * Each rqst is transported as a SMBDirect payload</div><div class='del'>- * rqst: the data to write</div><div class='del'>- * return value: 0 if successfully write, otherwise error code</div><div class='del'>- */</div><div class='del'>-int smbd_send(struct TCP_Server_Info *server,</div><div class='del'>-	int num_rqst, struct smb_rqst *rqst_array)</div><div class='del'>-{</div><div class='del'>-	struct smbd_connection *info = server-&gt;smbd_conn;</div><div class='del'>-	struct kvec vec;</div><div class='del'>-	int nvecs;</div><div class='del'>-	int size;</div><div class='del'>-	unsigned int buflen, remaining_data_length;</div><div class='del'>-	int start, i, j;</div><div class='del'>-	int max_iov_size =</div><div class='del'>-		info-&gt;max_send_size - sizeof(struct smbd_data_transfer);</div><div class='del'>-	struct kvec *iov;</div><div class='del'>-	int rc;</div><div class='del'>-	struct smb_rqst *rqst;</div><div class='del'>-	int rqst_idx;</div><div class='del'>-</div><div class='del'>-	if (info-&gt;transport_status != SMBD_CONNECTED) {</div><div class='del'>-		rc = -EAGAIN;</div><div class='del'>-		goto done;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Add in the page array if there is one. The caller needs to set</div><div class='del'>-	 * rq_tailsz to PAGE_SIZE when the buffer has multiple pages and</div><div class='del'>-	 * ends at page boundary</div><div class='del'>-	 */</div><div class='del'>-	remaining_data_length = 0;</div><div class='del'>-	for (i = 0; i &lt; num_rqst; i++)</div><div class='del'>-		remaining_data_length += smb_rqst_len(server, &amp;rqst_array[i]);</div><div class='del'>-</div><div class='del'>-	if (remaining_data_length &gt; info-&gt;max_fragmented_send_size) {</div><div class='del'>-		log_write(ERR, "payload size %d &gt; max size %d\n",</div><div class='del'>-			remaining_data_length, info-&gt;max_fragmented_send_size);</div><div class='del'>-		rc = -EINVAL;</div><div class='del'>-		goto done;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	log_write(INFO, "num_rqst=%d total length=%u\n",</div><div class='del'>-			num_rqst, remaining_data_length);</div><div class='del'>-</div><div class='del'>-	rqst_idx = 0;</div><div class='del'>-next_rqst:</div><div class='del'>-	rqst = &amp;rqst_array[rqst_idx];</div><div class='del'>-	iov = rqst-&gt;rq_iov;</div><div class='del'>-</div><div class='del'>-	cifs_dbg(FYI, "Sending smb (RDMA): idx=%d smb_len=%lu\n",</div><div class='del'>-		rqst_idx, smb_rqst_len(server, rqst));</div><div class='del'>-	for (i = 0; i &lt; rqst-&gt;rq_nvec; i++)</div><div class='del'>-		dump_smb(iov[i].iov_base, iov[i].iov_len);</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-	log_write(INFO, "rqst_idx=%d nvec=%d rqst-&gt;rq_npages=%d rq_pagesz=%d rq_tailsz=%d buflen=%lu\n",</div><div class='del'>-		  rqst_idx, rqst-&gt;rq_nvec, rqst-&gt;rq_npages, rqst-&gt;rq_pagesz,</div><div class='del'>-		  rqst-&gt;rq_tailsz, smb_rqst_len(server, rqst));</div><div class='del'>-</div><div class='del'>-	start = i = 0;</div><div class='del'>-	buflen = 0;</div><div class='del'>-	while (true) {</div><div class='del'>-		buflen += iov[i].iov_len;</div><div class='del'>-		if (buflen &gt; max_iov_size) {</div><div class='del'>-			if (i &gt; start) {</div><div class='del'>-				remaining_data_length -=</div><div class='del'>-					(buflen-iov[i].iov_len);</div><div class='del'>-				log_write(INFO, "sending iov[] from start=%d i=%d nvecs=%d remaining_data_length=%d\n",</div><div class='del'>-					  start, i, i - start,</div><div class='del'>-					  remaining_data_length);</div><div class='del'>-				rc = smbd_post_send_data(</div><div class='del'>-					info, &amp;iov[start], i-start,</div><div class='del'>-					remaining_data_length);</div><div class='del'>-				if (rc)</div><div class='del'>-					goto done;</div><div class='del'>-			} else {</div><div class='del'>-				/* iov[start] is too big, break it */</div><div class='del'>-				nvecs = (buflen+max_iov_size-1)/max_iov_size;</div><div class='del'>-				log_write(INFO, "iov[%d] iov_base=%p buflen=%d break to %d vectors\n",</div><div class='del'>-					  start, iov[start].iov_base,</div><div class='del'>-					  buflen, nvecs);</div><div class='del'>-				for (j = 0; j &lt; nvecs; j++) {</div><div class='del'>-					vec.iov_base =</div><div class='del'>-						(char *)iov[start].iov_base +</div><div class='del'>-						j*max_iov_size;</div><div class='del'>-					vec.iov_len = max_iov_size;</div><div class='del'>-					if (j == nvecs-1)</div><div class='del'>-						vec.iov_len =</div><div class='del'>-							buflen -</div><div class='del'>-							max_iov_size*(nvecs-1);</div><div class='del'>-					remaining_data_length -= vec.iov_len;</div><div class='del'>-					log_write(INFO,</div><div class='del'>-						"sending vec j=%d iov_base=%p iov_len=%zu remaining_data_length=%d\n",</div><div class='del'>-						  j, vec.iov_base, vec.iov_len,</div><div class='del'>-						  remaining_data_length);</div><div class='del'>-					rc = smbd_post_send_data(</div><div class='del'>-						info, &amp;vec, 1,</div><div class='del'>-						remaining_data_length);</div><div class='del'>-					if (rc)</div><div class='del'>-						goto done;</div><div class='del'>-				}</div><div class='del'>-				i++;</div><div class='del'>-				if (i == rqst-&gt;rq_nvec)</div><div class='del'>-					break;</div><div class='del'>-			}</div><div class='del'>-			start = i;</div><div class='del'>-			buflen = 0;</div><div class='del'>-		} else {</div><div class='del'>-			i++;</div><div class='del'>-			if (i == rqst-&gt;rq_nvec) {</div><div class='del'>-				/* send out all remaining vecs */</div><div class='del'>-				remaining_data_length -= buflen;</div><div class='del'>-				log_write(INFO, "sending iov[] from start=%d i=%d nvecs=%d remaining_data_length=%d\n",</div><div class='del'>-					  start, i, i - start,</div><div class='del'>-					  remaining_data_length);</div><div class='del'>-				rc = smbd_post_send_data(info, &amp;iov[start],</div><div class='del'>-					i-start, remaining_data_length);</div><div class='del'>-				if (rc)</div><div class='del'>-					goto done;</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-		log_write(INFO, "looping i=%d buflen=%d\n", i, buflen);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* now sending pages if there are any */</div><div class='del'>-	for (i = 0; i &lt; rqst-&gt;rq_npages; i++) {</div><div class='del'>-		unsigned int offset;</div><div class='del'>-</div><div class='del'>-		rqst_page_get_length(rqst, i, &amp;buflen, &amp;offset);</div><div class='del'>-		nvecs = (buflen + max_iov_size - 1) / max_iov_size;</div><div class='del'>-		log_write(INFO, "sending pages buflen=%d nvecs=%d\n",</div><div class='del'>-			buflen, nvecs);</div><div class='del'>-		for (j = 0; j &lt; nvecs; j++) {</div><div class='del'>-			size = max_iov_size;</div><div class='del'>-			if (j == nvecs-1)</div><div class='del'>-				size = buflen - j*max_iov_size;</div><div class='del'>-			remaining_data_length -= size;</div><div class='del'>-			log_write(INFO, "sending pages i=%d offset=%d size=%d remaining_data_length=%d\n",</div><div class='del'>-				  i, j * max_iov_size + offset, size,</div><div class='del'>-				  remaining_data_length);</div><div class='del'>-			rc = smbd_post_send_page(</div><div class='del'>-				info, rqst-&gt;rq_pages[i],</div><div class='del'>-				j*max_iov_size + offset,</div><div class='del'>-				size, remaining_data_length);</div><div class='del'>-			if (rc)</div><div class='del'>-				goto done;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rqst_idx++;</div><div class='del'>-	if (rqst_idx &lt; num_rqst)</div><div class='del'>-		goto next_rqst;</div><div class='del'>-</div><div class='del'>-done:</div><div class='del'>-	/*</div><div class='del'>-	 * As an optimization, we don't wait for individual I/O to finish</div><div class='del'>-	 * before sending the next one.</div><div class='del'>-	 * Send them all and wait for pending send count to get to 0</div><div class='del'>-	 * that means all the I/Os have been out and we are good to return</div><div class='del'>-	 */</div><div class='del'>-</div><div class='del'>-	wait_event(info-&gt;wait_send_pending,</div><div class='del'>-		atomic_read(&amp;info-&gt;send_pending) == 0);</div><div class='del'>-</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void register_mr_done(struct ib_cq *cq, struct ib_wc *wc)</div><div class='del'>-{</div><div class='del'>-	struct smbd_mr *mr;</div><div class='del'>-	struct ib_cqe *cqe;</div><div class='del'>-</div><div class='del'>-	if (wc-&gt;status) {</div><div class='del'>-		log_rdma_mr(ERR, "status=%d\n", wc-&gt;status);</div><div class='del'>-		cqe = wc-&gt;wr_cqe;</div><div class='del'>-		mr = container_of(cqe, struct smbd_mr, cqe);</div><div class='del'>-		smbd_disconnect_rdma_connection(mr-&gt;conn);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * The work queue function that recovers MRs</div><div class='del'>- * We need to call ib_dereg_mr() and ib_alloc_mr() before this MR can be used</div><div class='del'>- * again. Both calls are slow, so finish them in a workqueue. This will not</div><div class='del'>- * block I/O path.</div><div class='del'>- * There is one workqueue that recovers MRs, there is no need to lock as the</div><div class='del'>- * I/O requests calling smbd_register_mr will never update the links in the</div><div class='del'>- * mr_list.</div><div class='del'>- */</div><div class='del'>-static void smbd_mr_recovery_work(struct work_struct *work)</div><div class='del'>-{</div><div class='del'>-	struct smbd_connection *info =</div><div class='del'>-		container_of(work, struct smbd_connection, mr_recovery_work);</div><div class='del'>-	struct smbd_mr *smbdirect_mr;</div><div class='del'>-	int rc;</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(smbdirect_mr, &amp;info-&gt;mr_list, list) {</div><div class='del'>-		if (smbdirect_mr-&gt;state == MR_ERROR) {</div><div class='del'>-</div><div class='del'>-			/* recover this MR entry */</div><div class='del'>-			rc = ib_dereg_mr(smbdirect_mr-&gt;mr);</div><div class='del'>-			if (rc) {</div><div class='del'>-				log_rdma_mr(ERR,</div><div class='del'>-					"ib_dereg_mr failed rc=%x\n",</div><div class='del'>-					rc);</div><div class='del'>-				smbd_disconnect_rdma_connection(info);</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			smbdirect_mr-&gt;mr = ib_alloc_mr(</div><div class='del'>-				info-&gt;pd, info-&gt;mr_type,</div><div class='del'>-				info-&gt;max_frmr_depth);</div><div class='del'>-			if (IS_ERR(smbdirect_mr-&gt;mr)) {</div><div class='del'>-				log_rdma_mr(ERR, "ib_alloc_mr failed mr_type=%x max_frmr_depth=%x\n",</div><div class='del'>-					    info-&gt;mr_type,</div><div class='del'>-					    info-&gt;max_frmr_depth);</div><div class='del'>-				smbd_disconnect_rdma_connection(info);</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='del'>-		} else</div><div class='del'>-			/* This MR is being used, don't recover it */</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		smbdirect_mr-&gt;state = MR_READY;</div><div class='del'>-</div><div class='del'>-		/* smbdirect_mr-&gt;state is updated by this function</div><div class='del'>-		 * and is read and updated by I/O issuing CPUs trying</div><div class='del'>-		 * to get a MR, the call to atomic_inc_return</div><div class='del'>-		 * implicates a memory barrier and guarantees this</div><div class='del'>-		 * value is updated before waking up any calls to</div><div class='del'>-		 * get_mr() from the I/O issuing CPUs</div><div class='del'>-		 */</div><div class='del'>-		if (atomic_inc_return(&amp;info-&gt;mr_ready_count) == 1)</div><div class='del'>-			wake_up_interruptible(&amp;info-&gt;wait_mr);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void destroy_mr_list(struct smbd_connection *info)</div><div class='del'>-{</div><div class='del'>-	struct smbd_mr *mr, *tmp;</div><div class='del'>-</div><div class='del'>-	cancel_work_sync(&amp;info-&gt;mr_recovery_work);</div><div class='del'>-	list_for_each_entry_safe(mr, tmp, &amp;info-&gt;mr_list, list) {</div><div class='del'>-		if (mr-&gt;state == MR_INVALIDATED)</div><div class='del'>-			ib_dma_unmap_sg(info-&gt;id-&gt;device, mr-&gt;sgl,</div><div class='del'>-				mr-&gt;sgl_count, mr-&gt;dir);</div><div class='del'>-		ib_dereg_mr(mr-&gt;mr);</div><div class='del'>-		kfree(mr-&gt;sgl);</div><div class='del'>-		kfree(mr);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Allocate MRs used for RDMA read/write</div><div class='del'>- * The number of MRs will not exceed hardware capability in responder_resources</div><div class='del'>- * All MRs are kept in mr_list. The MR can be recovered after it's used</div><div class='del'>- * Recovery is done in smbd_mr_recovery_work. The content of list entry changes</div><div class='del'>- * as MRs are used and recovered for I/O, but the list links will not change</div><div class='del'>- */</div><div class='del'>-static int allocate_mr_list(struct smbd_connection *info)</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-	struct smbd_mr *smbdirect_mr, *tmp;</div><div class='del'>-</div><div class='del'>-	INIT_LIST_HEAD(&amp;info-&gt;mr_list);</div><div class='del'>-	init_waitqueue_head(&amp;info-&gt;wait_mr);</div><div class='del'>-	spin_lock_init(&amp;info-&gt;mr_list_lock);</div><div class='del'>-	atomic_set(&amp;info-&gt;mr_ready_count, 0);</div><div class='del'>-	atomic_set(&amp;info-&gt;mr_used_count, 0);</div><div class='del'>-	init_waitqueue_head(&amp;info-&gt;wait_for_mr_cleanup);</div><div class='del'>-	/* Allocate more MRs (2x) than hardware responder_resources */</div><div class='del'>-	for (i = 0; i &lt; info-&gt;responder_resources * 2; i++) {</div><div class='del'>-		smbdirect_mr = kzalloc(sizeof(*smbdirect_mr), GFP_KERNEL);</div><div class='del'>-		if (!smbdirect_mr)</div><div class='del'>-			goto out;</div><div class='del'>-		smbdirect_mr-&gt;mr = ib_alloc_mr(info-&gt;pd, info-&gt;mr_type,</div><div class='del'>-					info-&gt;max_frmr_depth);</div><div class='del'>-		if (IS_ERR(smbdirect_mr-&gt;mr)) {</div><div class='del'>-			log_rdma_mr(ERR, "ib_alloc_mr failed mr_type=%x max_frmr_depth=%x\n",</div><div class='del'>-				    info-&gt;mr_type, info-&gt;max_frmr_depth);</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		smbdirect_mr-&gt;sgl = kcalloc(</div><div class='del'>-					info-&gt;max_frmr_depth,</div><div class='del'>-					sizeof(struct scatterlist),</div><div class='del'>-					GFP_KERNEL);</div><div class='del'>-		if (!smbdirect_mr-&gt;sgl) {</div><div class='del'>-			log_rdma_mr(ERR, "failed to allocate sgl\n");</div><div class='del'>-			ib_dereg_mr(smbdirect_mr-&gt;mr);</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		smbdirect_mr-&gt;state = MR_READY;</div><div class='del'>-		smbdirect_mr-&gt;conn = info;</div><div class='del'>-</div><div class='del'>-		list_add_tail(&amp;smbdirect_mr-&gt;list, &amp;info-&gt;mr_list);</div><div class='del'>-		atomic_inc(&amp;info-&gt;mr_ready_count);</div><div class='del'>-	}</div><div class='del'>-	INIT_WORK(&amp;info-&gt;mr_recovery_work, smbd_mr_recovery_work);</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	kfree(smbdirect_mr);</div><div class='del'>-</div><div class='del'>-	list_for_each_entry_safe(smbdirect_mr, tmp, &amp;info-&gt;mr_list, list) {</div><div class='del'>-		ib_dereg_mr(smbdirect_mr-&gt;mr);</div><div class='del'>-		kfree(smbdirect_mr-&gt;sgl);</div><div class='del'>-		kfree(smbdirect_mr);</div><div class='del'>-	}</div><div class='del'>-	return -ENOMEM;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Get a MR from mr_list. This function waits until there is at least one</div><div class='del'>- * MR available in the list. It may access the list while the</div><div class='del'>- * smbd_mr_recovery_work is recovering the MR list. This doesn't need a lock</div><div class='del'>- * as they never modify the same places. However, there may be several CPUs</div><div class='del'>- * issueing I/O trying to get MR at the same time, mr_list_lock is used to</div><div class='del'>- * protect this situation.</div><div class='del'>- */</div><div class='del'>-static struct smbd_mr *get_mr(struct smbd_connection *info)</div><div class='del'>-{</div><div class='del'>-	struct smbd_mr *ret;</div><div class='del'>-	int rc;</div><div class='del'>-again:</div><div class='del'>-	rc = wait_event_interruptible(info-&gt;wait_mr,</div><div class='del'>-		atomic_read(&amp;info-&gt;mr_ready_count) ||</div><div class='del'>-		info-&gt;transport_status != SMBD_CONNECTED);</div><div class='del'>-	if (rc) {</div><div class='del'>-		log_rdma_mr(ERR, "wait_event_interruptible rc=%x\n", rc);</div><div class='del'>-		return NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (info-&gt;transport_status != SMBD_CONNECTED) {</div><div class='del'>-		log_rdma_mr(ERR, "info-&gt;transport_status=%x\n",</div><div class='del'>-			info-&gt;transport_status);</div><div class='del'>-		return NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;info-&gt;mr_list_lock);</div><div class='del'>-	list_for_each_entry(ret, &amp;info-&gt;mr_list, list) {</div><div class='del'>-		if (ret-&gt;state == MR_READY) {</div><div class='del'>-			ret-&gt;state = MR_REGISTERED;</div><div class='del'>-			spin_unlock(&amp;info-&gt;mr_list_lock);</div><div class='del'>-			atomic_dec(&amp;info-&gt;mr_ready_count);</div><div class='del'>-			atomic_inc(&amp;info-&gt;mr_used_count);</div><div class='del'>-			return ret;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_unlock(&amp;info-&gt;mr_list_lock);</div><div class='del'>-	/*</div><div class='del'>-	 * It is possible that we could fail to get MR because other processes may</div><div class='del'>-	 * try to acquire a MR at the same time. If this is the case, retry it.</div><div class='del'>-	 */</div><div class='del'>-	goto again;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Register memory for RDMA read/write</div><div class='del'>- * pages[]: the list of pages to register memory with</div><div class='del'>- * num_pages: the number of pages to register</div><div class='del'>- * tailsz: if non-zero, the bytes to register in the last page</div><div class='del'>- * writing: true if this is a RDMA write (SMB read), false for RDMA read</div><div class='del'>- * need_invalidate: true if this MR needs to be locally invalidated after I/O</div><div class='del'>- * return value: the MR registered, NULL if failed.</div><div class='del'>- */</div><div class='del'>-struct smbd_mr *smbd_register_mr(</div><div class='del'>-	struct smbd_connection *info, struct page *pages[], int num_pages,</div><div class='del'>-	int offset, int tailsz, bool writing, bool need_invalidate)</div><div class='del'>-{</div><div class='del'>-	struct smbd_mr *smbdirect_mr;</div><div class='del'>-	int rc, i;</div><div class='del'>-	enum dma_data_direction dir;</div><div class='del'>-	struct ib_reg_wr *reg_wr;</div><div class='del'>-</div><div class='del'>-	if (num_pages &gt; info-&gt;max_frmr_depth) {</div><div class='del'>-		log_rdma_mr(ERR, "num_pages=%d max_frmr_depth=%d\n",</div><div class='del'>-			num_pages, info-&gt;max_frmr_depth);</div><div class='del'>-		return NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	smbdirect_mr = get_mr(info);</div><div class='del'>-	if (!smbdirect_mr) {</div><div class='del'>-		log_rdma_mr(ERR, "get_mr returning NULL\n");</div><div class='del'>-		return NULL;</div><div class='del'>-	}</div><div class='del'>-	smbdirect_mr-&gt;need_invalidate = need_invalidate;</div><div class='del'>-	smbdirect_mr-&gt;sgl_count = num_pages;</div><div class='del'>-	sg_init_table(smbdirect_mr-&gt;sgl, num_pages);</div><div class='del'>-</div><div class='del'>-	log_rdma_mr(INFO, "num_pages=0x%x offset=0x%x tailsz=0x%x\n",</div><div class='del'>-			num_pages, offset, tailsz);</div><div class='del'>-</div><div class='del'>-	if (num_pages == 1) {</div><div class='del'>-		sg_set_page(&amp;smbdirect_mr-&gt;sgl[0], pages[0], tailsz, offset);</div><div class='del'>-		goto skip_multiple_pages;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* We have at least two pages to register */</div><div class='del'>-	sg_set_page(</div><div class='del'>-		&amp;smbdirect_mr-&gt;sgl[0], pages[0], PAGE_SIZE - offset, offset);</div><div class='del'>-	i = 1;</div><div class='del'>-	while (i &lt; num_pages - 1) {</div><div class='del'>-		sg_set_page(&amp;smbdirect_mr-&gt;sgl[i], pages[i], PAGE_SIZE, 0);</div><div class='del'>-		i++;</div><div class='del'>-	}</div><div class='del'>-	sg_set_page(&amp;smbdirect_mr-&gt;sgl[i], pages[i],</div><div class='del'>-		tailsz ? tailsz : PAGE_SIZE, 0);</div><div class='del'>-</div><div class='del'>-skip_multiple_pages:</div><div class='del'>-	dir = writing ? DMA_FROM_DEVICE : DMA_TO_DEVICE;</div><div class='del'>-	smbdirect_mr-&gt;dir = dir;</div><div class='del'>-	rc = ib_dma_map_sg(info-&gt;id-&gt;device, smbdirect_mr-&gt;sgl, num_pages, dir);</div><div class='del'>-	if (!rc) {</div><div class='del'>-		log_rdma_mr(ERR, "ib_dma_map_sg num_pages=%x dir=%x rc=%x\n",</div><div class='del'>-			num_pages, dir, rc);</div><div class='del'>-		goto dma_map_error;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rc = ib_map_mr_sg(smbdirect_mr-&gt;mr, smbdirect_mr-&gt;sgl, num_pages,</div><div class='del'>-		NULL, PAGE_SIZE);</div><div class='del'>-	if (rc != num_pages) {</div><div class='del'>-		log_rdma_mr(ERR,</div><div class='del'>-			"ib_map_mr_sg failed rc = %d num_pages = %x\n",</div><div class='del'>-			rc, num_pages);</div><div class='del'>-		goto map_mr_error;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ib_update_fast_reg_key(smbdirect_mr-&gt;mr,</div><div class='del'>-		ib_inc_rkey(smbdirect_mr-&gt;mr-&gt;rkey));</div><div class='del'>-	reg_wr = &amp;smbdirect_mr-&gt;wr;</div><div class='del'>-	reg_wr-&gt;wr.opcode = IB_WR_REG_MR;</div><div class='del'>-	smbdirect_mr-&gt;cqe.done = register_mr_done;</div><div class='del'>-	reg_wr-&gt;wr.wr_cqe = &amp;smbdirect_mr-&gt;cqe;</div><div class='del'>-	reg_wr-&gt;wr.num_sge = 0;</div><div class='del'>-	reg_wr-&gt;wr.send_flags = IB_SEND_SIGNALED;</div><div class='del'>-	reg_wr-&gt;mr = smbdirect_mr-&gt;mr;</div><div class='del'>-	reg_wr-&gt;key = smbdirect_mr-&gt;mr-&gt;rkey;</div><div class='del'>-	reg_wr-&gt;access = writing ?</div><div class='del'>-			IB_ACCESS_REMOTE_WRITE | IB_ACCESS_LOCAL_WRITE :</div><div class='del'>-			IB_ACCESS_REMOTE_READ;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * There is no need for waiting for complemtion on ib_post_send</div><div class='del'>-	 * on IB_WR_REG_MR. Hardware enforces a barrier and order of execution</div><div class='del'>-	 * on the next ib_post_send when we actaully send I/O to remote peer</div><div class='del'>-	 */</div><div class='del'>-	rc = ib_post_send(info-&gt;id-&gt;qp, &amp;reg_wr-&gt;wr, NULL);</div><div class='del'>-	if (!rc)</div><div class='del'>-		return smbdirect_mr;</div><div class='del'>-</div><div class='del'>-	log_rdma_mr(ERR, "ib_post_send failed rc=%x reg_wr-&gt;key=%x\n",</div><div class='del'>-		rc, reg_wr-&gt;key);</div><div class='del'>-</div><div class='del'>-	/* If all failed, attempt to recover this MR by setting it MR_ERROR*/</div><div class='del'>-map_mr_error:</div><div class='del'>-	ib_dma_unmap_sg(info-&gt;id-&gt;device, smbdirect_mr-&gt;sgl,</div><div class='del'>-		smbdirect_mr-&gt;sgl_count, smbdirect_mr-&gt;dir);</div><div class='del'>-</div><div class='del'>-dma_map_error:</div><div class='del'>-	smbdirect_mr-&gt;state = MR_ERROR;</div><div class='del'>-	if (atomic_dec_and_test(&amp;info-&gt;mr_used_count))</div><div class='del'>-		wake_up(&amp;info-&gt;wait_for_mr_cleanup);</div><div class='del'>-</div><div class='del'>-	smbd_disconnect_rdma_connection(info);</div><div class='del'>-</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void local_inv_done(struct ib_cq *cq, struct ib_wc *wc)</div><div class='del'>-{</div><div class='del'>-	struct smbd_mr *smbdirect_mr;</div><div class='del'>-	struct ib_cqe *cqe;</div><div class='del'>-</div><div class='del'>-	cqe = wc-&gt;wr_cqe;</div><div class='del'>-	smbdirect_mr = container_of(cqe, struct smbd_mr, cqe);</div><div class='del'>-	smbdirect_mr-&gt;state = MR_INVALIDATED;</div><div class='del'>-	if (wc-&gt;status != IB_WC_SUCCESS) {</div><div class='del'>-		log_rdma_mr(ERR, "invalidate failed status=%x\n", wc-&gt;status);</div><div class='del'>-		smbdirect_mr-&gt;state = MR_ERROR;</div><div class='del'>-	}</div><div class='del'>-	complete(&amp;smbdirect_mr-&gt;invalidate_done);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Deregister a MR after I/O is done</div><div class='del'>- * This function may wait if remote invalidation is not used</div><div class='del'>- * and we have to locally invalidate the buffer to prevent data is being</div><div class='del'>- * modified by remote peer after upper layer consumes it</div><div class='del'>- */</div><div class='del'>-int smbd_deregister_mr(struct smbd_mr *smbdirect_mr)</div><div class='del'>-{</div><div class='del'>-	struct ib_send_wr *wr;</div><div class='del'>-	struct smbd_connection *info = smbdirect_mr-&gt;conn;</div><div class='del'>-	int rc = 0;</div><div class='del'>-</div><div class='del'>-	if (smbdirect_mr-&gt;need_invalidate) {</div><div class='del'>-		/* Need to finish local invalidation before returning */</div><div class='del'>-		wr = &amp;smbdirect_mr-&gt;inv_wr;</div><div class='del'>-		wr-&gt;opcode = IB_WR_LOCAL_INV;</div><div class='del'>-		smbdirect_mr-&gt;cqe.done = local_inv_done;</div><div class='del'>-		wr-&gt;wr_cqe = &amp;smbdirect_mr-&gt;cqe;</div><div class='del'>-		wr-&gt;num_sge = 0;</div><div class='del'>-		wr-&gt;ex.invalidate_rkey = smbdirect_mr-&gt;mr-&gt;rkey;</div><div class='del'>-		wr-&gt;send_flags = IB_SEND_SIGNALED;</div><div class='del'>-</div><div class='del'>-		init_completion(&amp;smbdirect_mr-&gt;invalidate_done);</div><div class='del'>-		rc = ib_post_send(info-&gt;id-&gt;qp, wr, NULL);</div><div class='del'>-		if (rc) {</div><div class='del'>-			log_rdma_mr(ERR, "ib_post_send failed rc=%x\n", rc);</div><div class='del'>-			smbd_disconnect_rdma_connection(info);</div><div class='del'>-			goto done;</div><div class='del'>-		}</div><div class='del'>-		wait_for_completion(&amp;smbdirect_mr-&gt;invalidate_done);</div><div class='del'>-		smbdirect_mr-&gt;need_invalidate = false;</div><div class='del'>-	} else</div><div class='del'>-		/*</div><div class='del'>-		 * For remote invalidation, just set it to MR_INVALIDATED</div><div class='del'>-		 * and defer to mr_recovery_work to recover the MR for next use</div><div class='del'>-		 */</div><div class='del'>-		smbdirect_mr-&gt;state = MR_INVALIDATED;</div><div class='del'>-</div><div class='del'>-	if (smbdirect_mr-&gt;state == MR_INVALIDATED) {</div><div class='del'>-		ib_dma_unmap_sg(</div><div class='del'>-			info-&gt;id-&gt;device, smbdirect_mr-&gt;sgl,</div><div class='del'>-			smbdirect_mr-&gt;sgl_count,</div><div class='del'>-			smbdirect_mr-&gt;dir);</div><div class='del'>-		smbdirect_mr-&gt;state = MR_READY;</div><div class='del'>-		if (atomic_inc_return(&amp;info-&gt;mr_ready_count) == 1)</div><div class='del'>-			wake_up_interruptible(&amp;info-&gt;wait_mr);</div><div class='del'>-	} else</div><div class='del'>-		/*</div><div class='del'>-		 * Schedule the work to do MR recovery for future I/Os MR</div><div class='del'>-		 * recovery is slow and don't want it to block current I/O</div><div class='del'>-		 */</div><div class='del'>-		queue_work(info-&gt;workqueue, &amp;info-&gt;mr_recovery_work);</div><div class='del'>-</div><div class='del'>-done:</div><div class='del'>-	if (atomic_dec_and_test(&amp;info-&gt;mr_used_count))</div><div class='del'>-		wake_up(&amp;info-&gt;wait_for_mr_cleanup);</div><div class='del'>-</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='head'>diff --git a/fs/cifs/smbdirect.h b/fs/cifs/smbdirect.h<br/>deleted file mode 100644<br/>index a87fca82a796..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cifs/smbdirect.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/smbdirect.h</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,316 +0,0 @@</div><div class='del'>-/* SPDX-License-Identifier: GPL-2.0-or-later */</div><div class='del'>-/*</div><div class='del'>- *   Copyright (C) 2017, Microsoft Corporation.</div><div class='del'>- *</div><div class='del'>- *   Author(s): Long Li &lt;longli@microsoft.com&gt;</div><div class='del'>- */</div><div class='del'>-#ifndef _SMBDIRECT_H</div><div class='del'>-#define _SMBDIRECT_H</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_CIFS_SMB_DIRECT</div><div class='del'>-#define cifs_rdma_enabled(server)	((server)-&gt;rdma)</div><div class='del'>-</div><div class='del'>-#include "cifsglob.h"</div><div class='del'>-#include &lt;rdma/ib_verbs.h&gt;</div><div class='del'>-#include &lt;rdma/rdma_cm.h&gt;</div><div class='del'>-#include &lt;linux/mempool.h&gt;</div><div class='del'>-</div><div class='del'>-extern int rdma_readwrite_threshold;</div><div class='del'>-extern int smbd_max_frmr_depth;</div><div class='del'>-extern int smbd_keep_alive_interval;</div><div class='del'>-extern int smbd_max_receive_size;</div><div class='del'>-extern int smbd_max_fragmented_recv_size;</div><div class='del'>-extern int smbd_max_send_size;</div><div class='del'>-extern int smbd_send_credit_target;</div><div class='del'>-extern int smbd_receive_credit_max;</div><div class='del'>-</div><div class='del'>-enum keep_alive_status {</div><div class='del'>-	KEEP_ALIVE_NONE,</div><div class='del'>-	KEEP_ALIVE_PENDING,</div><div class='del'>-	KEEP_ALIVE_SENT,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-enum smbd_connection_status {</div><div class='del'>-	SMBD_CREATED,</div><div class='del'>-	SMBD_CONNECTING,</div><div class='del'>-	SMBD_CONNECTED,</div><div class='del'>-	SMBD_NEGOTIATE_FAILED,</div><div class='del'>-	SMBD_DISCONNECTING,</div><div class='del'>-	SMBD_DISCONNECTED,</div><div class='del'>-	SMBD_DESTROYED</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * The context for the SMBDirect transport</div><div class='del'>- * Everything related to the transport is here. It has several logical parts</div><div class='del'>- * 1. RDMA related structures</div><div class='del'>- * 2. SMBDirect connection parameters</div><div class='del'>- * 3. Memory registrations</div><div class='del'>- * 4. Receive and reassembly queues for data receive path</div><div class='del'>- * 5. mempools for allocating packets</div><div class='del'>- */</div><div class='del'>-struct smbd_connection {</div><div class='del'>-	enum smbd_connection_status transport_status;</div><div class='del'>-</div><div class='del'>-	/* RDMA related */</div><div class='del'>-	struct rdma_cm_id *id;</div><div class='del'>-	struct ib_qp_init_attr qp_attr;</div><div class='del'>-	struct ib_pd *pd;</div><div class='del'>-	struct ib_cq *send_cq, *recv_cq;</div><div class='del'>-	struct ib_device_attr dev_attr;</div><div class='del'>-	int ri_rc;</div><div class='del'>-	struct completion ri_done;</div><div class='del'>-	wait_queue_head_t conn_wait;</div><div class='del'>-	wait_queue_head_t disconn_wait;</div><div class='del'>-</div><div class='del'>-	struct completion negotiate_completion;</div><div class='del'>-	bool negotiate_done;</div><div class='del'>-</div><div class='del'>-	struct work_struct disconnect_work;</div><div class='del'>-	struct work_struct post_send_credits_work;</div><div class='del'>-</div><div class='del'>-	spinlock_t lock_new_credits_offered;</div><div class='del'>-	int new_credits_offered;</div><div class='del'>-</div><div class='del'>-	/* Connection parameters defined in [MS-SMBD] 3.1.1.1 */</div><div class='del'>-	int receive_credit_max;</div><div class='del'>-	int send_credit_target;</div><div class='del'>-	int max_send_size;</div><div class='del'>-	int max_fragmented_recv_size;</div><div class='del'>-	int max_fragmented_send_size;</div><div class='del'>-	int max_receive_size;</div><div class='del'>-	int keep_alive_interval;</div><div class='del'>-	int max_readwrite_size;</div><div class='del'>-	enum keep_alive_status keep_alive_requested;</div><div class='del'>-	int protocol;</div><div class='del'>-	atomic_t send_credits;</div><div class='del'>-	atomic_t receive_credits;</div><div class='del'>-	int receive_credit_target;</div><div class='del'>-	int fragment_reassembly_remaining;</div><div class='del'>-</div><div class='del'>-	/* Memory registrations */</div><div class='del'>-	/* Maximum number of RDMA read/write outstanding on this connection */</div><div class='del'>-	int responder_resources;</div><div class='del'>-	/* Maximum number of SGEs in a RDMA write/read */</div><div class='del'>-	int max_frmr_depth;</div><div class='del'>-	/*</div><div class='del'>-	 * If payload is less than or equal to the threshold,</div><div class='del'>-	 * use RDMA send/recv to send upper layer I/O.</div><div class='del'>-	 * If payload is more than the threshold,</div><div class='del'>-	 * use RDMA read/write through memory registration for I/O.</div><div class='del'>-	 */</div><div class='del'>-	int rdma_readwrite_threshold;</div><div class='del'>-	enum ib_mr_type mr_type;</div><div class='del'>-	struct list_head mr_list;</div><div class='del'>-	spinlock_t mr_list_lock;</div><div class='del'>-	/* The number of available MRs ready for memory registration */</div><div class='del'>-	atomic_t mr_ready_count;</div><div class='del'>-	atomic_t mr_used_count;</div><div class='del'>-	wait_queue_head_t wait_mr;</div><div class='del'>-	struct work_struct mr_recovery_work;</div><div class='del'>-	/* Used by transport to wait until all MRs are returned */</div><div class='del'>-	wait_queue_head_t wait_for_mr_cleanup;</div><div class='del'>-</div><div class='del'>-	/* Activity accoutning */</div><div class='del'>-	atomic_t send_pending;</div><div class='del'>-	wait_queue_head_t wait_send_pending;</div><div class='del'>-	wait_queue_head_t wait_post_send;</div><div class='del'>-</div><div class='del'>-	/* Receive queue */</div><div class='del'>-	struct list_head receive_queue;</div><div class='del'>-	int count_receive_queue;</div><div class='del'>-	spinlock_t receive_queue_lock;</div><div class='del'>-</div><div class='del'>-	struct list_head empty_packet_queue;</div><div class='del'>-	int count_empty_packet_queue;</div><div class='del'>-	spinlock_t empty_packet_queue_lock;</div><div class='del'>-</div><div class='del'>-	wait_queue_head_t wait_receive_queues;</div><div class='del'>-</div><div class='del'>-	/* Reassembly queue */</div><div class='del'>-	struct list_head reassembly_queue;</div><div class='del'>-	spinlock_t reassembly_queue_lock;</div><div class='del'>-	wait_queue_head_t wait_reassembly_queue;</div><div class='del'>-</div><div class='del'>-	/* total data length of reassembly queue */</div><div class='del'>-	int reassembly_data_length;</div><div class='del'>-	int reassembly_queue_length;</div><div class='del'>-	/* the offset to first buffer in reassembly queue */</div><div class='del'>-	int first_entry_offset;</div><div class='del'>-</div><div class='del'>-	bool send_immediate;</div><div class='del'>-</div><div class='del'>-	wait_queue_head_t wait_send_queue;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Indicate if we have received a full packet on the connection</div><div class='del'>-	 * This is used to identify the first SMBD packet of a assembled</div><div class='del'>-	 * payload (SMB packet) in reassembly queue so we can return a</div><div class='del'>-	 * RFC1002 length to upper layer to indicate the length of the SMB</div><div class='del'>-	 * packet received</div><div class='del'>-	 */</div><div class='del'>-	bool full_packet_received;</div><div class='del'>-</div><div class='del'>-	struct workqueue_struct *workqueue;</div><div class='del'>-	struct delayed_work idle_timer_work;</div><div class='del'>-</div><div class='del'>-	/* Memory pool for preallocating buffers */</div><div class='del'>-	/* request pool for RDMA send */</div><div class='del'>-	struct kmem_cache *request_cache;</div><div class='del'>-	mempool_t *request_mempool;</div><div class='del'>-</div><div class='del'>-	/* response pool for RDMA receive */</div><div class='del'>-	struct kmem_cache *response_cache;</div><div class='del'>-	mempool_t *response_mempool;</div><div class='del'>-</div><div class='del'>-	/* for debug purposes */</div><div class='del'>-	unsigned int count_get_receive_buffer;</div><div class='del'>-	unsigned int count_put_receive_buffer;</div><div class='del'>-	unsigned int count_reassembly_queue;</div><div class='del'>-	unsigned int count_enqueue_reassembly_queue;</div><div class='del'>-	unsigned int count_dequeue_reassembly_queue;</div><div class='del'>-	unsigned int count_send_empty;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-enum smbd_message_type {</div><div class='del'>-	SMBD_NEGOTIATE_RESP,</div><div class='del'>-	SMBD_TRANSFER_DATA,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-#define SMB_DIRECT_RESPONSE_REQUESTED 0x0001</div><div class='del'>-</div><div class='del'>-/* SMBD negotiation request packet [MS-SMBD] 2.2.1 */</div><div class='del'>-struct smbd_negotiate_req {</div><div class='del'>-	__le16 min_version;</div><div class='del'>-	__le16 max_version;</div><div class='del'>-	__le16 reserved;</div><div class='del'>-	__le16 credits_requested;</div><div class='del'>-	__le32 preferred_send_size;</div><div class='del'>-	__le32 max_receive_size;</div><div class='del'>-	__le32 max_fragmented_size;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* SMBD negotiation response packet [MS-SMBD] 2.2.2 */</div><div class='del'>-struct smbd_negotiate_resp {</div><div class='del'>-	__le16 min_version;</div><div class='del'>-	__le16 max_version;</div><div class='del'>-	__le16 negotiated_version;</div><div class='del'>-	__le16 reserved;</div><div class='del'>-	__le16 credits_requested;</div><div class='del'>-	__le16 credits_granted;</div><div class='del'>-	__le32 status;</div><div class='del'>-	__le32 max_readwrite_size;</div><div class='del'>-	__le32 preferred_send_size;</div><div class='del'>-	__le32 max_receive_size;</div><div class='del'>-	__le32 max_fragmented_size;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* SMBD data transfer packet with payload [MS-SMBD] 2.2.3 */</div><div class='del'>-struct smbd_data_transfer {</div><div class='del'>-	__le16 credits_requested;</div><div class='del'>-	__le16 credits_granted;</div><div class='del'>-	__le16 flags;</div><div class='del'>-	__le16 reserved;</div><div class='del'>-	__le32 remaining_data_length;</div><div class='del'>-	__le32 data_offset;</div><div class='del'>-	__le32 data_length;</div><div class='del'>-	__le32 padding;</div><div class='del'>-	__u8 buffer[];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* The packet fields for a registered RDMA buffer */</div><div class='del'>-struct smbd_buffer_descriptor_v1 {</div><div class='del'>-	__le64 offset;</div><div class='del'>-	__le32 token;</div><div class='del'>-	__le32 length;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* Default maximum number of SGEs in a RDMA send/recv */</div><div class='del'>-#define SMBDIRECT_MAX_SGE	16</div><div class='del'>-/* The context for a SMBD request */</div><div class='del'>-struct smbd_request {</div><div class='del'>-	struct smbd_connection *info;</div><div class='del'>-	struct ib_cqe cqe;</div><div class='del'>-</div><div class='del'>-	/* the SGE entries for this packet */</div><div class='del'>-	struct ib_sge sge[SMBDIRECT_MAX_SGE];</div><div class='del'>-	int num_sge;</div><div class='del'>-</div><div class='del'>-	/* SMBD packet header follows this structure */</div><div class='del'>-	u8 packet[];</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/* The context for a SMBD response */</div><div class='del'>-struct smbd_response {</div><div class='del'>-	struct smbd_connection *info;</div><div class='del'>-	struct ib_cqe cqe;</div><div class='del'>-	struct ib_sge sge;</div><div class='del'>-</div><div class='del'>-	enum smbd_message_type type;</div><div class='del'>-</div><div class='del'>-	/* Link to receive queue or reassembly queue */</div><div class='del'>-	struct list_head list;</div><div class='del'>-</div><div class='del'>-	/* Indicate if this is the 1st packet of a payload */</div><div class='del'>-	bool first_segment;</div><div class='del'>-</div><div class='del'>-	/* SMBD packet header and payload follows this structure */</div><div class='del'>-	u8 packet[];</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/* Create a SMBDirect session */</div><div class='del'>-struct smbd_connection *smbd_get_connection(</div><div class='del'>-	struct TCP_Server_Info *server, struct sockaddr *dstaddr);</div><div class='del'>-</div><div class='del'>-/* Reconnect SMBDirect session */</div><div class='del'>-int smbd_reconnect(struct TCP_Server_Info *server);</div><div class='del'>-/* Destroy SMBDirect session */</div><div class='del'>-void smbd_destroy(struct TCP_Server_Info *server);</div><div class='del'>-</div><div class='del'>-/* Interface for carrying upper layer I/O through send/recv */</div><div class='del'>-int smbd_recv(struct smbd_connection *info, struct msghdr *msg);</div><div class='del'>-int smbd_send(struct TCP_Server_Info *server,</div><div class='del'>-	int num_rqst, struct smb_rqst *rqst);</div><div class='del'>-</div><div class='del'>-enum mr_state {</div><div class='del'>-	MR_READY,</div><div class='del'>-	MR_REGISTERED,</div><div class='del'>-	MR_INVALIDATED,</div><div class='del'>-	MR_ERROR</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct smbd_mr {</div><div class='del'>-	struct smbd_connection	*conn;</div><div class='del'>-	struct list_head	list;</div><div class='del'>-	enum mr_state		state;</div><div class='del'>-	struct ib_mr		*mr;</div><div class='del'>-	struct scatterlist	*sgl;</div><div class='del'>-	int			sgl_count;</div><div class='del'>-	enum dma_data_direction	dir;</div><div class='del'>-	union {</div><div class='del'>-		struct ib_reg_wr	wr;</div><div class='del'>-		struct ib_send_wr	inv_wr;</div><div class='del'>-	};</div><div class='del'>-	struct ib_cqe		cqe;</div><div class='del'>-	bool			need_invalidate;</div><div class='del'>-	struct completion	invalidate_done;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/* Interfaces to register and deregister MR for RDMA read/write */</div><div class='del'>-struct smbd_mr *smbd_register_mr(</div><div class='del'>-	struct smbd_connection *info, struct page *pages[], int num_pages,</div><div class='del'>-	int offset, int tailsz, bool writing, bool need_invalidate);</div><div class='del'>-int smbd_deregister_mr(struct smbd_mr *mr);</div><div class='del'>-</div><div class='del'>-#else</div><div class='del'>-#define cifs_rdma_enabled(server)	0</div><div class='del'>-struct smbd_connection {};</div><div class='del'>-static inline void *smbd_get_connection(</div><div class='del'>-	struct TCP_Server_Info *server, struct sockaddr *dstaddr) {return NULL;}</div><div class='del'>-static inline int smbd_reconnect(struct TCP_Server_Info *server) {return -1; }</div><div class='del'>-static inline void smbd_destroy(struct TCP_Server_Info *server) {}</div><div class='del'>-static inline int smbd_recv(struct smbd_connection *info, struct msghdr *msg) {return -1; }</div><div class='del'>-static inline int smbd_send(struct TCP_Server_Info *server, int num_rqst, struct smb_rqst *rqst) {return -1; }</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-#endif</div><div class='head'>diff --git a/fs/cifs/trace.h b/fs/cifs/trace.h<br/>deleted file mode 100644<br/>index 6cecf302dcfd..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cifs/trace.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cifs/trace.h</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,1016 +0,0 @@</div><div class='del'>-/* SPDX-License-Identifier: GPL-2.0 */</div><div class='del'>-/*</div><div class='del'>- *   Copyright (C) 2018, Microsoft Corporation.</div><div class='del'>- *</div><div class='del'>- *   Author(s): Steve French &lt;stfrench@microsoft.com&gt;</div><div class='del'>- */</div><div class='del'>-#undef TRACE_SYSTEM</div><div class='del'>-#define TRACE_SYSTEM cifs</div><div class='del'>-</div><div class='del'>-#if !defined(_CIFS_TRACE_H) || defined(TRACE_HEADER_MULTI_READ)</div><div class='del'>-#define _CIFS_TRACE_H</div><div class='del'>-</div><div class='del'>-#include &lt;linux/tracepoint.h&gt;</div><div class='del'>-#include &lt;linux/net.h&gt;</div><div class='del'>-#include &lt;linux/inet.h&gt;</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Please use this 3-part article as a reference for writing new tracepoints:</div><div class='del'>- * https://lwn.net/Articles/379903/</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-/* For logging errors in read or write */</div><div class='del'>-DECLARE_EVENT_CLASS(smb3_rw_err_class,</div><div class='del'>-	TP_PROTO(unsigned int xid,</div><div class='del'>-		__u64	fid,</div><div class='del'>-		__u32	tid,</div><div class='del'>-		__u64	sesid,</div><div class='del'>-		__u64	offset,</div><div class='del'>-		__u32	len,</div><div class='del'>-		int	rc),</div><div class='del'>-	TP_ARGS(xid, fid, tid, sesid, offset, len, rc),</div><div class='del'>-	TP_STRUCT__entry(</div><div class='del'>-		__field(unsigned int, xid)</div><div class='del'>-		__field(__u64, fid)</div><div class='del'>-		__field(__u32, tid)</div><div class='del'>-		__field(__u64, sesid)</div><div class='del'>-		__field(__u64, offset)</div><div class='del'>-		__field(__u32, len)</div><div class='del'>-		__field(int, rc)</div><div class='del'>-	),</div><div class='del'>-	TP_fast_assign(</div><div class='del'>-		__entry-&gt;xid = xid;</div><div class='del'>-		__entry-&gt;fid = fid;</div><div class='del'>-		__entry-&gt;tid = tid;</div><div class='del'>-		__entry-&gt;sesid = sesid;</div><div class='del'>-		__entry-&gt;offset = offset;</div><div class='del'>-		__entry-&gt;len = len;</div><div class='del'>-		__entry-&gt;rc = rc;</div><div class='del'>-	),</div><div class='del'>-	TP_printk("\txid=%u sid=0x%llx tid=0x%x fid=0x%llx offset=0x%llx len=0x%x rc=%d",</div><div class='del'>-		__entry-&gt;xid, __entry-&gt;sesid, __entry-&gt;tid, __entry-&gt;fid,</div><div class='del'>-		__entry-&gt;offset, __entry-&gt;len, __entry-&gt;rc)</div><div class='del'>-)</div><div class='del'>-</div><div class='del'>-#define DEFINE_SMB3_RW_ERR_EVENT(name)          \</div><div class='del'>-DEFINE_EVENT(smb3_rw_err_class, smb3_##name,    \</div><div class='del'>-	TP_PROTO(unsigned int xid,		\</div><div class='del'>-		__u64	fid,			\</div><div class='del'>-		__u32	tid,			\</div><div class='del'>-		__u64	sesid,			\</div><div class='del'>-		__u64	offset,			\</div><div class='del'>-		__u32	len,			\</div><div class='del'>-		int	rc),			\</div><div class='del'>-	TP_ARGS(xid, fid, tid, sesid, offset, len, rc))</div><div class='del'>-</div><div class='del'>-DEFINE_SMB3_RW_ERR_EVENT(write_err);</div><div class='del'>-DEFINE_SMB3_RW_ERR_EVENT(read_err);</div><div class='del'>-DEFINE_SMB3_RW_ERR_EVENT(query_dir_err);</div><div class='del'>-DEFINE_SMB3_RW_ERR_EVENT(zero_err);</div><div class='del'>-DEFINE_SMB3_RW_ERR_EVENT(falloc_err);</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-/* For logging successful read or write */</div><div class='del'>-DECLARE_EVENT_CLASS(smb3_rw_done_class,</div><div class='del'>-	TP_PROTO(unsigned int xid,</div><div class='del'>-		__u64	fid,</div><div class='del'>-		__u32	tid,</div><div class='del'>-		__u64	sesid,</div><div class='del'>-		__u64	offset,</div><div class='del'>-		__u32	len),</div><div class='del'>-	TP_ARGS(xid, fid, tid, sesid, offset, len),</div><div class='del'>-	TP_STRUCT__entry(</div><div class='del'>-		__field(unsigned int, xid)</div><div class='del'>-		__field(__u64, fid)</div><div class='del'>-		__field(__u32, tid)</div><div class='del'>-		__field(__u64, sesid)</div><div class='del'>-		__field(__u64, offset)</div><div class='del'>-		__field(__u32, len)</div><div class='del'>-	),</div><div class='del'>-	TP_fast_assign(</div><div class='del'>-		__entry-&gt;xid = xid;</div><div class='del'>-		__entry-&gt;fid = fid;</div><div class='del'>-		__entry-&gt;tid = tid;</div><div class='del'>-		__entry-&gt;sesid = sesid;</div><div class='del'>-		__entry-&gt;offset = offset;</div><div class='del'>-		__entry-&gt;len = len;</div><div class='del'>-	),</div><div class='del'>-	TP_printk("xid=%u sid=0x%llx tid=0x%x fid=0x%llx offset=0x%llx len=0x%x",</div><div class='del'>-		__entry-&gt;xid, __entry-&gt;sesid, __entry-&gt;tid, __entry-&gt;fid,</div><div class='del'>-		__entry-&gt;offset, __entry-&gt;len)</div><div class='del'>-)</div><div class='del'>-</div><div class='del'>-#define DEFINE_SMB3_RW_DONE_EVENT(name)         \</div><div class='del'>-DEFINE_EVENT(smb3_rw_done_class, smb3_##name,   \</div><div class='del'>-	TP_PROTO(unsigned int xid,		\</div><div class='del'>-		__u64	fid,			\</div><div class='del'>-		__u32	tid,			\</div><div class='del'>-		__u64	sesid,			\</div><div class='del'>-		__u64	offset,			\</div><div class='del'>-		__u32	len),			\</div><div class='del'>-	TP_ARGS(xid, fid, tid, sesid, offset, len))</div><div class='del'>-</div><div class='del'>-DEFINE_SMB3_RW_DONE_EVENT(write_enter);</div><div class='del'>-DEFINE_SMB3_RW_DONE_EVENT(read_enter);</div><div class='del'>-DEFINE_SMB3_RW_DONE_EVENT(query_dir_enter);</div><div class='del'>-DEFINE_SMB3_RW_DONE_EVENT(zero_enter);</div><div class='del'>-DEFINE_SMB3_RW_DONE_EVENT(falloc_enter);</div><div class='del'>-DEFINE_SMB3_RW_DONE_EVENT(write_done);</div><div class='del'>-DEFINE_SMB3_RW_DONE_EVENT(read_done);</div><div class='del'>-DEFINE_SMB3_RW_DONE_EVENT(query_dir_done);</div><div class='del'>-DEFINE_SMB3_RW_DONE_EVENT(zero_done);</div><div class='del'>-DEFINE_SMB3_RW_DONE_EVENT(falloc_done);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * For handle based calls other than read and write, and get/set info</div><div class='del'>- */</div><div class='del'>-DECLARE_EVENT_CLASS(smb3_fd_class,</div><div class='del'>-	TP_PROTO(unsigned int xid,</div><div class='del'>-		__u64	fid,</div><div class='del'>-		__u32	tid,</div><div class='del'>-		__u64	sesid),</div><div class='del'>-	TP_ARGS(xid, fid, tid, sesid),</div><div class='del'>-	TP_STRUCT__entry(</div><div class='del'>-		__field(unsigned int, xid)</div><div class='del'>-		__field(__u64, fid)</div><div class='del'>-		__field(__u32, tid)</div><div class='del'>-		__field(__u64, sesid)</div><div class='del'>-	),</div><div class='del'>-	TP_fast_assign(</div><div class='del'>-		__entry-&gt;xid = xid;</div><div class='del'>-		__entry-&gt;fid = fid;</div><div class='del'>-		__entry-&gt;tid = tid;</div><div class='del'>-		__entry-&gt;sesid = sesid;</div><div class='del'>-	),</div><div class='del'>-	TP_printk("\txid=%u sid=0x%llx tid=0x%x fid=0x%llx",</div><div class='del'>-		__entry-&gt;xid, __entry-&gt;sesid, __entry-&gt;tid, __entry-&gt;fid)</div><div class='del'>-)</div><div class='del'>-</div><div class='del'>-#define DEFINE_SMB3_FD_EVENT(name)          \</div><div class='del'>-DEFINE_EVENT(smb3_fd_class, smb3_##name,    \</div><div class='del'>-	TP_PROTO(unsigned int xid,		\</div><div class='del'>-		__u64	fid,			\</div><div class='del'>-		__u32	tid,			\</div><div class='del'>-		__u64	sesid),			\</div><div class='del'>-	TP_ARGS(xid, fid, tid, sesid))</div><div class='del'>-</div><div class='del'>-DEFINE_SMB3_FD_EVENT(flush_enter);</div><div class='del'>-DEFINE_SMB3_FD_EVENT(flush_done);</div><div class='del'>-DEFINE_SMB3_FD_EVENT(close_enter);</div><div class='del'>-DEFINE_SMB3_FD_EVENT(close_done);</div><div class='del'>-</div><div class='del'>-DECLARE_EVENT_CLASS(smb3_fd_err_class,</div><div class='del'>-	TP_PROTO(unsigned int xid,</div><div class='del'>-		__u64	fid,</div><div class='del'>-		__u32	tid,</div><div class='del'>-		__u64	sesid,</div><div class='del'>-		int	rc),</div><div class='del'>-	TP_ARGS(xid, fid, tid, sesid, rc),</div><div class='del'>-	TP_STRUCT__entry(</div><div class='del'>-		__field(unsigned int, xid)</div><div class='del'>-		__field(__u64, fid)</div><div class='del'>-		__field(__u32, tid)</div><div class='del'>-		__field(__u64, sesid)</div><div class='del'>-		__field(int, rc)</div><div class='del'>-	),</div><div class='del'>-	TP_fast_assign(</div><div class='del'>-		__entry-&gt;xid = xid;</div><div class='del'>-		__entry-&gt;fid = fid;</div><div class='del'>-		__entry-&gt;tid = tid;</div><div class='del'>-		__entry-&gt;sesid = sesid;</div><div class='del'>-		__entry-&gt;rc = rc;</div><div class='del'>-	),</div><div class='del'>-	TP_printk("\txid=%u sid=0x%llx tid=0x%x fid=0x%llx rc=%d",</div><div class='del'>-		__entry-&gt;xid, __entry-&gt;sesid, __entry-&gt;tid, __entry-&gt;fid,</div><div class='del'>-		__entry-&gt;rc)</div><div class='del'>-)</div><div class='del'>-</div><div class='del'>-#define DEFINE_SMB3_FD_ERR_EVENT(name)          \</div><div class='del'>-DEFINE_EVENT(smb3_fd_err_class, smb3_##name,    \</div><div class='del'>-	TP_PROTO(unsigned int xid,		\</div><div class='del'>-		__u64	fid,			\</div><div class='del'>-		__u32	tid,			\</div><div class='del'>-		__u64	sesid,			\</div><div class='del'>-		int	rc),			\</div><div class='del'>-	TP_ARGS(xid, fid, tid, sesid, rc))</div><div class='del'>-</div><div class='del'>-DEFINE_SMB3_FD_ERR_EVENT(flush_err);</div><div class='del'>-DEFINE_SMB3_FD_ERR_EVENT(lock_err);</div><div class='del'>-DEFINE_SMB3_FD_ERR_EVENT(close_err);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * For handle based query/set info calls</div><div class='del'>- */</div><div class='del'>-DECLARE_EVENT_CLASS(smb3_inf_enter_class,</div><div class='del'>-	TP_PROTO(unsigned int xid,</div><div class='del'>-		__u64	fid,</div><div class='del'>-		__u32	tid,</div><div class='del'>-		__u64	sesid,</div><div class='del'>-		__u8	infclass,</div><div class='del'>-		__u32	type),</div><div class='del'>-	TP_ARGS(xid, fid, tid, sesid, infclass, type),</div><div class='del'>-	TP_STRUCT__entry(</div><div class='del'>-		__field(unsigned int, xid)</div><div class='del'>-		__field(__u64, fid)</div><div class='del'>-		__field(__u32, tid)</div><div class='del'>-		__field(__u64, sesid)</div><div class='del'>-		__field(__u8, infclass)</div><div class='del'>-		__field(__u32, type)</div><div class='del'>-	),</div><div class='del'>-	TP_fast_assign(</div><div class='del'>-		__entry-&gt;xid = xid;</div><div class='del'>-		__entry-&gt;fid = fid;</div><div class='del'>-		__entry-&gt;tid = tid;</div><div class='del'>-		__entry-&gt;sesid = sesid;</div><div class='del'>-		__entry-&gt;infclass = infclass;</div><div class='del'>-		__entry-&gt;type = type;</div><div class='del'>-	),</div><div class='del'>-	TP_printk("xid=%u sid=0x%llx tid=0x%x fid=0x%llx class=%u type=0x%x",</div><div class='del'>-		__entry-&gt;xid, __entry-&gt;sesid, __entry-&gt;tid, __entry-&gt;fid,</div><div class='del'>-		__entry-&gt;infclass, __entry-&gt;type)</div><div class='del'>-)</div><div class='del'>-</div><div class='del'>-#define DEFINE_SMB3_INF_ENTER_EVENT(name)          \</div><div class='del'>-DEFINE_EVENT(smb3_inf_enter_class, smb3_##name,    \</div><div class='del'>-	TP_PROTO(unsigned int xid,		\</div><div class='del'>-		__u64	fid,			\</div><div class='del'>-		__u32	tid,			\</div><div class='del'>-		__u64	sesid,			\</div><div class='del'>-		__u8	infclass,		\</div><div class='del'>-		__u32	type),			\</div><div class='del'>-	TP_ARGS(xid, fid, tid, sesid, infclass, type))</div><div class='del'>-</div><div class='del'>-DEFINE_SMB3_INF_ENTER_EVENT(query_info_enter);</div><div class='del'>-DEFINE_SMB3_INF_ENTER_EVENT(query_info_done);</div><div class='del'>-DEFINE_SMB3_INF_ENTER_EVENT(notify_enter);</div><div class='del'>-DEFINE_SMB3_INF_ENTER_EVENT(notify_done);</div><div class='del'>-</div><div class='del'>-DECLARE_EVENT_CLASS(smb3_inf_err_class,</div><div class='del'>-	TP_PROTO(unsigned int xid,</div><div class='del'>-		__u64	fid,</div><div class='del'>-		__u32	tid,</div><div class='del'>-		__u64	sesid,</div><div class='del'>-		__u8	infclass,</div><div class='del'>-		__u32	type,</div><div class='del'>-		int	rc),</div><div class='del'>-	TP_ARGS(xid, fid, tid, sesid, infclass, type, rc),</div><div class='del'>-	TP_STRUCT__entry(</div><div class='del'>-		__field(unsigned int, xid)</div><div class='del'>-		__field(__u64, fid)</div><div class='del'>-		__field(__u32, tid)</div><div class='del'>-		__field(__u64, sesid)</div><div class='del'>-		__field(__u8, infclass)</div><div class='del'>-		__field(__u32, type)</div><div class='del'>-		__field(int, rc)</div><div class='del'>-	),</div><div class='del'>-	TP_fast_assign(</div><div class='del'>-		__entry-&gt;xid = xid;</div><div class='del'>-		__entry-&gt;fid = fid;</div><div class='del'>-		__entry-&gt;tid = tid;</div><div class='del'>-		__entry-&gt;sesid = sesid;</div><div class='del'>-		__entry-&gt;infclass = infclass;</div><div class='del'>-		__entry-&gt;type = type;</div><div class='del'>-		__entry-&gt;rc = rc;</div><div class='del'>-	),</div><div class='del'>-	TP_printk("xid=%u sid=0x%llx tid=0x%x fid=0x%llx class=%u type=0x%x rc=%d",</div><div class='del'>-		__entry-&gt;xid, __entry-&gt;sesid, __entry-&gt;tid, __entry-&gt;fid,</div><div class='del'>-		__entry-&gt;infclass, __entry-&gt;type, __entry-&gt;rc)</div><div class='del'>-)</div><div class='del'>-</div><div class='del'>-#define DEFINE_SMB3_INF_ERR_EVENT(name)          \</div><div class='del'>-DEFINE_EVENT(smb3_inf_err_class, smb3_##name,    \</div><div class='del'>-	TP_PROTO(unsigned int xid,		\</div><div class='del'>-		__u64	fid,			\</div><div class='del'>-		__u32	tid,			\</div><div class='del'>-		__u64	sesid,			\</div><div class='del'>-		__u8	infclass,		\</div><div class='del'>-		__u32	type,			\</div><div class='del'>-		int	rc),			\</div><div class='del'>-	TP_ARGS(xid, fid, tid, sesid, infclass, type, rc))</div><div class='del'>-</div><div class='del'>-DEFINE_SMB3_INF_ERR_EVENT(query_info_err);</div><div class='del'>-DEFINE_SMB3_INF_ERR_EVENT(set_info_err);</div><div class='del'>-DEFINE_SMB3_INF_ERR_EVENT(notify_err);</div><div class='del'>-DEFINE_SMB3_INF_ERR_EVENT(fsctl_err);</div><div class='del'>-</div><div class='del'>-DECLARE_EVENT_CLASS(smb3_inf_compound_enter_class,</div><div class='del'>-	TP_PROTO(unsigned int xid,</div><div class='del'>-		__u32	tid,</div><div class='del'>-		__u64	sesid,</div><div class='del'>-		const char *full_path),</div><div class='del'>-	TP_ARGS(xid, tid, sesid, full_path),</div><div class='del'>-	TP_STRUCT__entry(</div><div class='del'>-		__field(unsigned int, xid)</div><div class='del'>-		__field(__u32, tid)</div><div class='del'>-		__field(__u64, sesid)</div><div class='del'>-		__string(path, full_path)</div><div class='del'>-	),</div><div class='del'>-	TP_fast_assign(</div><div class='del'>-		__entry-&gt;xid = xid;</div><div class='del'>-		__entry-&gt;tid = tid;</div><div class='del'>-		__entry-&gt;sesid = sesid;</div><div class='del'>-		__assign_str(path, full_path);</div><div class='del'>-	),</div><div class='del'>-	TP_printk("xid=%u sid=0x%llx tid=0x%x path=%s",</div><div class='del'>-		__entry-&gt;xid, __entry-&gt;sesid, __entry-&gt;tid,</div><div class='del'>-		__get_str(path))</div><div class='del'>-)</div><div class='del'>-</div><div class='del'>-#define DEFINE_SMB3_INF_COMPOUND_ENTER_EVENT(name)     \</div><div class='del'>-DEFINE_EVENT(smb3_inf_compound_enter_class, smb3_##name,    \</div><div class='del'>-	TP_PROTO(unsigned int xid,		\</div><div class='del'>-		__u32	tid,			\</div><div class='del'>-		__u64	sesid,			\</div><div class='del'>-		const char *full_path),		\</div><div class='del'>-	TP_ARGS(xid, tid, sesid, full_path))</div><div class='del'>-</div><div class='del'>-DEFINE_SMB3_INF_COMPOUND_ENTER_EVENT(query_info_compound_enter);</div><div class='del'>-DEFINE_SMB3_INF_COMPOUND_ENTER_EVENT(posix_query_info_compound_enter);</div><div class='del'>-DEFINE_SMB3_INF_COMPOUND_ENTER_EVENT(hardlink_enter);</div><div class='del'>-DEFINE_SMB3_INF_COMPOUND_ENTER_EVENT(rename_enter);</div><div class='del'>-DEFINE_SMB3_INF_COMPOUND_ENTER_EVENT(rmdir_enter);</div><div class='del'>-DEFINE_SMB3_INF_COMPOUND_ENTER_EVENT(set_eof_enter);</div><div class='del'>-DEFINE_SMB3_INF_COMPOUND_ENTER_EVENT(set_info_compound_enter);</div><div class='del'>-DEFINE_SMB3_INF_COMPOUND_ENTER_EVENT(delete_enter);</div><div class='del'>-DEFINE_SMB3_INF_COMPOUND_ENTER_EVENT(mkdir_enter);</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-DECLARE_EVENT_CLASS(smb3_inf_compound_done_class,</div><div class='del'>-	TP_PROTO(unsigned int xid,</div><div class='del'>-		__u32	tid,</div><div class='del'>-		__u64	sesid),</div><div class='del'>-	TP_ARGS(xid, tid, sesid),</div><div class='del'>-	TP_STRUCT__entry(</div><div class='del'>-		__field(unsigned int, xid)</div><div class='del'>-		__field(__u32, tid)</div><div class='del'>-		__field(__u64, sesid)</div><div class='del'>-	),</div><div class='del'>-	TP_fast_assign(</div><div class='del'>-		__entry-&gt;xid = xid;</div><div class='del'>-		__entry-&gt;tid = tid;</div><div class='del'>-		__entry-&gt;sesid = sesid;</div><div class='del'>-	),</div><div class='del'>-	TP_printk("xid=%u sid=0x%llx tid=0x%x",</div><div class='del'>-		__entry-&gt;xid, __entry-&gt;sesid, __entry-&gt;tid)</div><div class='del'>-)</div><div class='del'>-</div><div class='del'>-#define DEFINE_SMB3_INF_COMPOUND_DONE_EVENT(name)     \</div><div class='del'>-DEFINE_EVENT(smb3_inf_compound_done_class, smb3_##name,    \</div><div class='del'>-	TP_PROTO(unsigned int xid,		\</div><div class='del'>-		__u32	tid,			\</div><div class='del'>-		__u64	sesid),			\</div><div class='del'>-	TP_ARGS(xid, tid, sesid))</div><div class='del'>-</div><div class='del'>-DEFINE_SMB3_INF_COMPOUND_DONE_EVENT(query_info_compound_done);</div><div class='del'>-DEFINE_SMB3_INF_COMPOUND_DONE_EVENT(posix_query_info_compound_done);</div><div class='del'>-DEFINE_SMB3_INF_COMPOUND_DONE_EVENT(hardlink_done);</div><div class='del'>-DEFINE_SMB3_INF_COMPOUND_DONE_EVENT(rename_done);</div><div class='del'>-DEFINE_SMB3_INF_COMPOUND_DONE_EVENT(rmdir_done);</div><div class='del'>-DEFINE_SMB3_INF_COMPOUND_DONE_EVENT(set_eof_done);</div><div class='del'>-DEFINE_SMB3_INF_COMPOUND_DONE_EVENT(set_info_compound_done);</div><div class='del'>-DEFINE_SMB3_INF_COMPOUND_DONE_EVENT(delete_done);</div><div class='del'>-DEFINE_SMB3_INF_COMPOUND_DONE_EVENT(mkdir_done);</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-DECLARE_EVENT_CLASS(smb3_inf_compound_err_class,</div><div class='del'>-	TP_PROTO(unsigned int xid,</div><div class='del'>-		__u32	tid,</div><div class='del'>-		__u64	sesid,</div><div class='del'>-		int	rc),</div><div class='del'>-	TP_ARGS(xid, tid, sesid, rc),</div><div class='del'>-	TP_STRUCT__entry(</div><div class='del'>-		__field(unsigned int, xid)</div><div class='del'>-		__field(__u32, tid)</div><div class='del'>-		__field(__u64, sesid)</div><div class='del'>-		__field(int, rc)</div><div class='del'>-	),</div><div class='del'>-	TP_fast_assign(</div><div class='del'>-		__entry-&gt;xid = xid;</div><div class='del'>-		__entry-&gt;tid = tid;</div><div class='del'>-		__entry-&gt;sesid = sesid;</div><div class='del'>-		__entry-&gt;rc = rc;</div><div class='del'>-	),</div><div class='del'>-	TP_printk("xid=%u sid=0x%llx tid=0x%x rc=%d",</div><div class='del'>-		__entry-&gt;xid, __entry-&gt;sesid, __entry-&gt;tid,</div><div class='del'>-		__entry-&gt;rc)</div><div class='del'>-)</div><div class='del'>-</div><div class='del'>-#define DEFINE_SMB3_INF_COMPOUND_ERR_EVENT(name)     \</div><div class='del'>-DEFINE_EVENT(smb3_inf_compound_err_class, smb3_##name,    \</div><div class='del'>-	TP_PROTO(unsigned int xid,		\</div><div class='del'>-		__u32	tid,			\</div><div class='del'>-		__u64	sesid,			\</div><div class='del'>-		int rc),			\</div><div class='del'>-	TP_ARGS(xid, tid, sesid, rc))</div><div class='del'>-</div><div class='del'>-DEFINE_SMB3_INF_COMPOUND_ERR_EVENT(query_info_compound_err);</div><div class='del'>-DEFINE_SMB3_INF_COMPOUND_ERR_EVENT(posix_query_info_compound_err);</div><div class='del'>-DEFINE_SMB3_INF_COMPOUND_ERR_EVENT(hardlink_err);</div><div class='del'>-DEFINE_SMB3_INF_COMPOUND_ERR_EVENT(rename_err);</div><div class='del'>-DEFINE_SMB3_INF_COMPOUND_ERR_EVENT(rmdir_err);</div><div class='del'>-DEFINE_SMB3_INF_COMPOUND_ERR_EVENT(set_eof_err);</div><div class='del'>-DEFINE_SMB3_INF_COMPOUND_ERR_EVENT(set_info_compound_err);</div><div class='del'>-DEFINE_SMB3_INF_COMPOUND_ERR_EVENT(mkdir_err);</div><div class='del'>-DEFINE_SMB3_INF_COMPOUND_ERR_EVENT(delete_err);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * For logging SMB3 Status code and Command for responses which return errors</div><div class='del'>- */</div><div class='del'>-DECLARE_EVENT_CLASS(smb3_cmd_err_class,</div><div class='del'>-	TP_PROTO(__u32	tid,</div><div class='del'>-		__u64	sesid,</div><div class='del'>-		__u16	cmd,</div><div class='del'>-		__u64	mid,</div><div class='del'>-		__u32	status,</div><div class='del'>-		int	rc),</div><div class='del'>-	TP_ARGS(tid, sesid, cmd, mid, status, rc),</div><div class='del'>-	TP_STRUCT__entry(</div><div class='del'>-		__field(__u32, tid)</div><div class='del'>-		__field(__u64, sesid)</div><div class='del'>-		__field(__u16, cmd)</div><div class='del'>-		__field(__u64, mid)</div><div class='del'>-		__field(__u32, status)</div><div class='del'>-		__field(int, rc)</div><div class='del'>-	),</div><div class='del'>-	TP_fast_assign(</div><div class='del'>-		__entry-&gt;tid = tid;</div><div class='del'>-		__entry-&gt;sesid = sesid;</div><div class='del'>-		__entry-&gt;cmd = cmd;</div><div class='del'>-		__entry-&gt;mid = mid;</div><div class='del'>-		__entry-&gt;status = status;</div><div class='del'>-		__entry-&gt;rc = rc;</div><div class='del'>-	),</div><div class='del'>-	TP_printk("\tsid=0x%llx tid=0x%x cmd=%u mid=%llu status=0x%x rc=%d",</div><div class='del'>-		__entry-&gt;sesid, __entry-&gt;tid, __entry-&gt;cmd, __entry-&gt;mid,</div><div class='del'>-		__entry-&gt;status, __entry-&gt;rc)</div><div class='del'>-)</div><div class='del'>-</div><div class='del'>-#define DEFINE_SMB3_CMD_ERR_EVENT(name)          \</div><div class='del'>-DEFINE_EVENT(smb3_cmd_err_class, smb3_##name,    \</div><div class='del'>-	TP_PROTO(__u32	tid,			\</div><div class='del'>-		__u64	sesid,			\</div><div class='del'>-		__u16	cmd,			\</div><div class='del'>-		__u64	mid,			\</div><div class='del'>-		__u32	status,			\</div><div class='del'>-		int	rc),			\</div><div class='del'>-	TP_ARGS(tid, sesid, cmd, mid, status, rc))</div><div class='del'>-</div><div class='del'>-DEFINE_SMB3_CMD_ERR_EVENT(cmd_err);</div><div class='del'>-</div><div class='del'>-DECLARE_EVENT_CLASS(smb3_cmd_done_class,</div><div class='del'>-	TP_PROTO(__u32	tid,</div><div class='del'>-		__u64	sesid,</div><div class='del'>-		__u16	cmd,</div><div class='del'>-		__u64	mid),</div><div class='del'>-	TP_ARGS(tid, sesid, cmd, mid),</div><div class='del'>-	TP_STRUCT__entry(</div><div class='del'>-		__field(__u32, tid)</div><div class='del'>-		__field(__u64, sesid)</div><div class='del'>-		__field(__u16, cmd)</div><div class='del'>-		__field(__u64, mid)</div><div class='del'>-	),</div><div class='del'>-	TP_fast_assign(</div><div class='del'>-		__entry-&gt;tid = tid;</div><div class='del'>-		__entry-&gt;sesid = sesid;</div><div class='del'>-		__entry-&gt;cmd = cmd;</div><div class='del'>-		__entry-&gt;mid = mid;</div><div class='del'>-	),</div><div class='del'>-	TP_printk("\tsid=0x%llx tid=0x%x cmd=%u mid=%llu",</div><div class='del'>-		__entry-&gt;sesid, __entry-&gt;tid,</div><div class='del'>-		__entry-&gt;cmd, __entry-&gt;mid)</div><div class='del'>-)</div><div class='del'>-</div><div class='del'>-#define DEFINE_SMB3_CMD_DONE_EVENT(name)          \</div><div class='del'>-DEFINE_EVENT(smb3_cmd_done_class, smb3_##name,    \</div><div class='del'>-	TP_PROTO(__u32	tid,			\</div><div class='del'>-		__u64	sesid,			\</div><div class='del'>-		__u16	cmd,			\</div><div class='del'>-		__u64	mid),			\</div><div class='del'>-	TP_ARGS(tid, sesid, cmd, mid))</div><div class='del'>-</div><div class='del'>-DEFINE_SMB3_CMD_DONE_EVENT(cmd_enter);</div><div class='del'>-DEFINE_SMB3_CMD_DONE_EVENT(cmd_done);</div><div class='del'>-DEFINE_SMB3_CMD_DONE_EVENT(ses_expired);</div><div class='del'>-</div><div class='del'>-DECLARE_EVENT_CLASS(smb3_mid_class,</div><div class='del'>-	TP_PROTO(__u16	cmd,</div><div class='del'>-		__u64	mid,</div><div class='del'>-		__u32	pid,</div><div class='del'>-		unsigned long when_sent,</div><div class='del'>-		unsigned long when_received),</div><div class='del'>-	TP_ARGS(cmd, mid, pid, when_sent, when_received),</div><div class='del'>-	TP_STRUCT__entry(</div><div class='del'>-		__field(__u16, cmd)</div><div class='del'>-		__field(__u64, mid)</div><div class='del'>-		__field(__u32, pid)</div><div class='del'>-		__field(unsigned long, when_sent)</div><div class='del'>-		__field(unsigned long, when_received)</div><div class='del'>-	),</div><div class='del'>-	TP_fast_assign(</div><div class='del'>-		__entry-&gt;cmd = cmd;</div><div class='del'>-		__entry-&gt;mid = mid;</div><div class='del'>-		__entry-&gt;pid = pid;</div><div class='del'>-		__entry-&gt;when_sent = when_sent;</div><div class='del'>-		__entry-&gt;when_received = when_received;</div><div class='del'>-	),</div><div class='del'>-	TP_printk("\tcmd=%u mid=%llu pid=%u, when_sent=%lu when_rcv=%lu",</div><div class='del'>-		__entry-&gt;cmd, __entry-&gt;mid, __entry-&gt;pid, __entry-&gt;when_sent,</div><div class='del'>-		__entry-&gt;when_received)</div><div class='del'>-)</div><div class='del'>-</div><div class='del'>-#define DEFINE_SMB3_MID_EVENT(name)          \</div><div class='del'>-DEFINE_EVENT(smb3_mid_class, smb3_##name,    \</div><div class='del'>-	TP_PROTO(__u16	cmd,			\</div><div class='del'>-		__u64	mid,			\</div><div class='del'>-		__u32	pid,			\</div><div class='del'>-		unsigned long when_sent,	\</div><div class='del'>-		unsigned long when_received),	\</div><div class='del'>-	TP_ARGS(cmd, mid, pid, when_sent, when_received))</div><div class='del'>-</div><div class='del'>-DEFINE_SMB3_MID_EVENT(slow_rsp);</div><div class='del'>-</div><div class='del'>-DECLARE_EVENT_CLASS(smb3_exit_err_class,</div><div class='del'>-	TP_PROTO(unsigned int xid,</div><div class='del'>-		const char *func_name,</div><div class='del'>-		int	rc),</div><div class='del'>-	TP_ARGS(xid, func_name, rc),</div><div class='del'>-	TP_STRUCT__entry(</div><div class='del'>-		__field(unsigned int, xid)</div><div class='del'>-		__string(func_name, func_name)</div><div class='del'>-		__field(int, rc)</div><div class='del'>-	),</div><div class='del'>-	TP_fast_assign(</div><div class='del'>-		__entry-&gt;xid = xid;</div><div class='del'>-		__assign_str(func_name, func_name);</div><div class='del'>-		__entry-&gt;rc = rc;</div><div class='del'>-	),</div><div class='del'>-	TP_printk("\t%s: xid=%u rc=%d",</div><div class='del'>-		__get_str(func_name), __entry-&gt;xid, __entry-&gt;rc)</div><div class='del'>-)</div><div class='del'>-</div><div class='del'>-#define DEFINE_SMB3_EXIT_ERR_EVENT(name)          \</div><div class='del'>-DEFINE_EVENT(smb3_exit_err_class, smb3_##name,    \</div><div class='del'>-	TP_PROTO(unsigned int xid,		\</div><div class='del'>-		const char *func_name,		\</div><div class='del'>-		int	rc),			\</div><div class='del'>-	TP_ARGS(xid, func_name, rc))</div><div class='del'>-</div><div class='del'>-DEFINE_SMB3_EXIT_ERR_EVENT(exit_err);</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-DECLARE_EVENT_CLASS(smb3_sync_err_class,</div><div class='del'>-	TP_PROTO(unsigned long ino,</div><div class='del'>-		int	rc),</div><div class='del'>-	TP_ARGS(ino, rc),</div><div class='del'>-	TP_STRUCT__entry(</div><div class='del'>-		__field(unsigned long, ino)</div><div class='del'>-		__field(int, rc)</div><div class='del'>-	),</div><div class='del'>-	TP_fast_assign(</div><div class='del'>-		__entry-&gt;ino = ino;</div><div class='del'>-		__entry-&gt;rc = rc;</div><div class='del'>-	),</div><div class='del'>-	TP_printk("\tino=%lu rc=%d",</div><div class='del'>-		__entry-&gt;ino, __entry-&gt;rc)</div><div class='del'>-)</div><div class='del'>-</div><div class='del'>-#define DEFINE_SMB3_SYNC_ERR_EVENT(name)          \</div><div class='del'>-DEFINE_EVENT(smb3_sync_err_class, cifs_##name,    \</div><div class='del'>-	TP_PROTO(unsigned long ino,		\</div><div class='del'>-		int	rc),			\</div><div class='del'>-	TP_ARGS(ino, rc))</div><div class='del'>-</div><div class='del'>-DEFINE_SMB3_SYNC_ERR_EVENT(fsync_err);</div><div class='del'>-DEFINE_SMB3_SYNC_ERR_EVENT(flush_err);</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-DECLARE_EVENT_CLASS(smb3_enter_exit_class,</div><div class='del'>-	TP_PROTO(unsigned int xid,</div><div class='del'>-		const char *func_name),</div><div class='del'>-	TP_ARGS(xid, func_name),</div><div class='del'>-	TP_STRUCT__entry(</div><div class='del'>-		__field(unsigned int, xid)</div><div class='del'>-		__string(func_name, func_name)</div><div class='del'>-	),</div><div class='del'>-	TP_fast_assign(</div><div class='del'>-		__entry-&gt;xid = xid;</div><div class='del'>-		__assign_str(func_name, func_name);</div><div class='del'>-	),</div><div class='del'>-	TP_printk("\t%s: xid=%u",</div><div class='del'>-		__get_str(func_name), __entry-&gt;xid)</div><div class='del'>-)</div><div class='del'>-</div><div class='del'>-#define DEFINE_SMB3_ENTER_EXIT_EVENT(name)        \</div><div class='del'>-DEFINE_EVENT(smb3_enter_exit_class, smb3_##name,  \</div><div class='del'>-	TP_PROTO(unsigned int xid,		\</div><div class='del'>-		const char *func_name),		\</div><div class='del'>-	TP_ARGS(xid, func_name))</div><div class='del'>-</div><div class='del'>-DEFINE_SMB3_ENTER_EXIT_EVENT(enter);</div><div class='del'>-DEFINE_SMB3_ENTER_EXIT_EVENT(exit_done);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * For SMB2/SMB3 tree connect</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-DECLARE_EVENT_CLASS(smb3_tcon_class,</div><div class='del'>-	TP_PROTO(unsigned int xid,</div><div class='del'>-		__u32	tid,</div><div class='del'>-		__u64	sesid,</div><div class='del'>-		const char *unc_name,</div><div class='del'>-		int	rc),</div><div class='del'>-	TP_ARGS(xid, tid, sesid, unc_name, rc),</div><div class='del'>-	TP_STRUCT__entry(</div><div class='del'>-		__field(unsigned int, xid)</div><div class='del'>-		__field(__u32, tid)</div><div class='del'>-		__field(__u64, sesid)</div><div class='del'>-		__string(name, unc_name)</div><div class='del'>-		__field(int, rc)</div><div class='del'>-	),</div><div class='del'>-	TP_fast_assign(</div><div class='del'>-		__entry-&gt;xid = xid;</div><div class='del'>-		__entry-&gt;tid = tid;</div><div class='del'>-		__entry-&gt;sesid = sesid;</div><div class='del'>-		__assign_str(name, unc_name);</div><div class='del'>-		__entry-&gt;rc = rc;</div><div class='del'>-	),</div><div class='del'>-	TP_printk("xid=%u sid=0x%llx tid=0x%x unc_name=%s rc=%d",</div><div class='del'>-		__entry-&gt;xid, __entry-&gt;sesid, __entry-&gt;tid,</div><div class='del'>-		__get_str(name), __entry-&gt;rc)</div><div class='del'>-)</div><div class='del'>-</div><div class='del'>-#define DEFINE_SMB3_TCON_EVENT(name)          \</div><div class='del'>-DEFINE_EVENT(smb3_tcon_class, smb3_##name,    \</div><div class='del'>-	TP_PROTO(unsigned int xid,		\</div><div class='del'>-		__u32	tid,			\</div><div class='del'>-		__u64	sesid,			\</div><div class='del'>-		const char *unc_name,		\</div><div class='del'>-		int	rc),			\</div><div class='del'>-	TP_ARGS(xid, tid, sesid, unc_name, rc))</div><div class='del'>-</div><div class='del'>-DEFINE_SMB3_TCON_EVENT(tcon);</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * For smb2/smb3 open (including create and mkdir) calls</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-DECLARE_EVENT_CLASS(smb3_open_enter_class,</div><div class='del'>-	TP_PROTO(unsigned int xid,</div><div class='del'>-		__u32	tid,</div><div class='del'>-		__u64	sesid,</div><div class='del'>-		int	create_options,</div><div class='del'>-		int	desired_access),</div><div class='del'>-	TP_ARGS(xid, tid, sesid, create_options, desired_access),</div><div class='del'>-	TP_STRUCT__entry(</div><div class='del'>-		__field(unsigned int, xid)</div><div class='del'>-		__field(__u32, tid)</div><div class='del'>-		__field(__u64, sesid)</div><div class='del'>-		__field(int, create_options)</div><div class='del'>-		__field(int, desired_access)</div><div class='del'>-	),</div><div class='del'>-	TP_fast_assign(</div><div class='del'>-		__entry-&gt;xid = xid;</div><div class='del'>-		__entry-&gt;tid = tid;</div><div class='del'>-		__entry-&gt;sesid = sesid;</div><div class='del'>-		__entry-&gt;create_options = create_options;</div><div class='del'>-		__entry-&gt;desired_access = desired_access;</div><div class='del'>-	),</div><div class='del'>-	TP_printk("xid=%u sid=0x%llx tid=0x%x cr_opts=0x%x des_access=0x%x",</div><div class='del'>-		__entry-&gt;xid, __entry-&gt;sesid, __entry-&gt;tid,</div><div class='del'>-		__entry-&gt;create_options, __entry-&gt;desired_access)</div><div class='del'>-)</div><div class='del'>-</div><div class='del'>-#define DEFINE_SMB3_OPEN_ENTER_EVENT(name)        \</div><div class='del'>-DEFINE_EVENT(smb3_open_enter_class, smb3_##name,  \</div><div class='del'>-	TP_PROTO(unsigned int xid,		\</div><div class='del'>-		__u32	tid,			\</div><div class='del'>-		__u64	sesid,			\</div><div class='del'>-		int	create_options,		\</div><div class='del'>-		int	desired_access),	\</div><div class='del'>-	TP_ARGS(xid, tid, sesid, create_options, desired_access))</div><div class='del'>-</div><div class='del'>-DEFINE_SMB3_OPEN_ENTER_EVENT(open_enter);</div><div class='del'>-DEFINE_SMB3_OPEN_ENTER_EVENT(posix_mkdir_enter);</div><div class='del'>-</div><div class='del'>-DECLARE_EVENT_CLASS(smb3_open_err_class,</div><div class='del'>-	TP_PROTO(unsigned int xid,</div><div class='del'>-		__u32	tid,</div><div class='del'>-		__u64	sesid,</div><div class='del'>-		int	create_options,</div><div class='del'>-		int	desired_access,</div><div class='del'>-		int	rc),</div><div class='del'>-	TP_ARGS(xid, tid, sesid, create_options, desired_access, rc),</div><div class='del'>-	TP_STRUCT__entry(</div><div class='del'>-		__field(unsigned int, xid)</div><div class='del'>-		__field(__u32, tid)</div><div class='del'>-		__field(__u64, sesid)</div><div class='del'>-		__field(int,   create_options)</div><div class='del'>-		__field(int, desired_access)</div><div class='del'>-		__field(int, rc)</div><div class='del'>-	),</div><div class='del'>-	TP_fast_assign(</div><div class='del'>-		__entry-&gt;xid = xid;</div><div class='del'>-		__entry-&gt;tid = tid;</div><div class='del'>-		__entry-&gt;sesid = sesid;</div><div class='del'>-		__entry-&gt;create_options = create_options;</div><div class='del'>-		__entry-&gt;desired_access = desired_access;</div><div class='del'>-		__entry-&gt;rc = rc;</div><div class='del'>-	),</div><div class='del'>-	TP_printk("xid=%u sid=0x%llx tid=0x%x cr_opts=0x%x des_access=0x%x rc=%d",</div><div class='del'>-		__entry-&gt;xid, __entry-&gt;sesid, __entry-&gt;tid,</div><div class='del'>-		__entry-&gt;create_options, __entry-&gt;desired_access, __entry-&gt;rc)</div><div class='del'>-)</div><div class='del'>-</div><div class='del'>-#define DEFINE_SMB3_OPEN_ERR_EVENT(name)          \</div><div class='del'>-DEFINE_EVENT(smb3_open_err_class, smb3_##name,    \</div><div class='del'>-	TP_PROTO(unsigned int xid,		\</div><div class='del'>-		__u32	tid,			\</div><div class='del'>-		__u64	sesid,			\</div><div class='del'>-		int	create_options,		\</div><div class='del'>-		int	desired_access,		\</div><div class='del'>-		int	rc),			\</div><div class='del'>-	TP_ARGS(xid, tid, sesid, create_options, desired_access, rc))</div><div class='del'>-</div><div class='del'>-DEFINE_SMB3_OPEN_ERR_EVENT(open_err);</div><div class='del'>-DEFINE_SMB3_OPEN_ERR_EVENT(posix_mkdir_err);</div><div class='del'>-</div><div class='del'>-DECLARE_EVENT_CLASS(smb3_open_done_class,</div><div class='del'>-	TP_PROTO(unsigned int xid,</div><div class='del'>-		__u64	fid,</div><div class='del'>-		__u32	tid,</div><div class='del'>-		__u64	sesid,</div><div class='del'>-		int	create_options,</div><div class='del'>-		int	desired_access),</div><div class='del'>-	TP_ARGS(xid, fid, tid, sesid, create_options, desired_access),</div><div class='del'>-	TP_STRUCT__entry(</div><div class='del'>-		__field(unsigned int, xid)</div><div class='del'>-		__field(__u64, fid)</div><div class='del'>-		__field(__u32, tid)</div><div class='del'>-		__field(__u64, sesid)</div><div class='del'>-		__field(int, create_options)</div><div class='del'>-		__field(int, desired_access)</div><div class='del'>-	),</div><div class='del'>-	TP_fast_assign(</div><div class='del'>-		__entry-&gt;xid = xid;</div><div class='del'>-		__entry-&gt;fid = fid;</div><div class='del'>-		__entry-&gt;tid = tid;</div><div class='del'>-		__entry-&gt;sesid = sesid;</div><div class='del'>-		__entry-&gt;create_options = create_options;</div><div class='del'>-		__entry-&gt;desired_access = desired_access;</div><div class='del'>-	),</div><div class='del'>-	TP_printk("xid=%u sid=0x%llx tid=0x%x fid=0x%llx cr_opts=0x%x des_access=0x%x",</div><div class='del'>-		__entry-&gt;xid, __entry-&gt;sesid, __entry-&gt;tid, __entry-&gt;fid,</div><div class='del'>-		__entry-&gt;create_options, __entry-&gt;desired_access)</div><div class='del'>-)</div><div class='del'>-</div><div class='del'>-#define DEFINE_SMB3_OPEN_DONE_EVENT(name)        \</div><div class='del'>-DEFINE_EVENT(smb3_open_done_class, smb3_##name,  \</div><div class='del'>-	TP_PROTO(unsigned int xid,		\</div><div class='del'>-		__u64	fid,			\</div><div class='del'>-		__u32	tid,			\</div><div class='del'>-		__u64	sesid,			\</div><div class='del'>-		int	create_options,		\</div><div class='del'>-		int	desired_access),	\</div><div class='del'>-	TP_ARGS(xid, fid, tid, sesid, create_options, desired_access))</div><div class='del'>-</div><div class='del'>-DEFINE_SMB3_OPEN_DONE_EVENT(open_done);</div><div class='del'>-DEFINE_SMB3_OPEN_DONE_EVENT(posix_mkdir_done);</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-DECLARE_EVENT_CLASS(smb3_lease_done_class,</div><div class='del'>-	TP_PROTO(__u32	lease_state,</div><div class='del'>-		__u32	tid,</div><div class='del'>-		__u64	sesid,</div><div class='del'>-		__u64	lease_key_low,</div><div class='del'>-		__u64	lease_key_high),</div><div class='del'>-	TP_ARGS(lease_state, tid, sesid, lease_key_low, lease_key_high),</div><div class='del'>-	TP_STRUCT__entry(</div><div class='del'>-		__field(__u32, lease_state)</div><div class='del'>-		__field(__u32, tid)</div><div class='del'>-		__field(__u64, sesid)</div><div class='del'>-		__field(__u64, lease_key_low)</div><div class='del'>-		__field(__u64, lease_key_high)</div><div class='del'>-	),</div><div class='del'>-	TP_fast_assign(</div><div class='del'>-		__entry-&gt;lease_state = lease_state;</div><div class='del'>-		__entry-&gt;tid = tid;</div><div class='del'>-		__entry-&gt;sesid = sesid;</div><div class='del'>-		__entry-&gt;lease_key_low = lease_key_low;</div><div class='del'>-		__entry-&gt;lease_key_high = lease_key_high;</div><div class='del'>-	),</div><div class='del'>-	TP_printk("sid=0x%llx tid=0x%x lease_key=0x%llx%llx lease_state=0x%x",</div><div class='del'>-		__entry-&gt;sesid, __entry-&gt;tid, __entry-&gt;lease_key_high,</div><div class='del'>-		__entry-&gt;lease_key_low, __entry-&gt;lease_state)</div><div class='del'>-)</div><div class='del'>-</div><div class='del'>-#define DEFINE_SMB3_LEASE_DONE_EVENT(name)        \</div><div class='del'>-DEFINE_EVENT(smb3_lease_done_class, smb3_##name,  \</div><div class='del'>-	TP_PROTO(__u32	lease_state,		\</div><div class='del'>-		__u32	tid,			\</div><div class='del'>-		__u64	sesid,			\</div><div class='del'>-		__u64	lease_key_low,		\</div><div class='del'>-		__u64	lease_key_high),	\</div><div class='del'>-	TP_ARGS(lease_state, tid, sesid, lease_key_low, lease_key_high))</div><div class='del'>-</div><div class='del'>-DEFINE_SMB3_LEASE_DONE_EVENT(lease_done);</div><div class='del'>-</div><div class='del'>-DECLARE_EVENT_CLASS(smb3_lease_err_class,</div><div class='del'>-	TP_PROTO(__u32	lease_state,</div><div class='del'>-		__u32	tid,</div><div class='del'>-		__u64	sesid,</div><div class='del'>-		__u64	lease_key_low,</div><div class='del'>-		__u64	lease_key_high,</div><div class='del'>-		int	rc),</div><div class='del'>-	TP_ARGS(lease_state, tid, sesid, lease_key_low, lease_key_high, rc),</div><div class='del'>-	TP_STRUCT__entry(</div><div class='del'>-		__field(__u32, lease_state)</div><div class='del'>-		__field(__u32, tid)</div><div class='del'>-		__field(__u64, sesid)</div><div class='del'>-		__field(__u64, lease_key_low)</div><div class='del'>-		__field(__u64, lease_key_high)</div><div class='del'>-		__field(int, rc)</div><div class='del'>-	),</div><div class='del'>-	TP_fast_assign(</div><div class='del'>-		__entry-&gt;lease_state = lease_state;</div><div class='del'>-		__entry-&gt;tid = tid;</div><div class='del'>-		__entry-&gt;sesid = sesid;</div><div class='del'>-		__entry-&gt;lease_key_low = lease_key_low;</div><div class='del'>-		__entry-&gt;lease_key_high = lease_key_high;</div><div class='del'>-		__entry-&gt;rc = rc;</div><div class='del'>-	),</div><div class='del'>-	TP_printk("sid=0x%llx tid=0x%x lease_key=0x%llx%llx lease_state=0x%x rc=%d",</div><div class='del'>-		__entry-&gt;sesid, __entry-&gt;tid, __entry-&gt;lease_key_high,</div><div class='del'>-		__entry-&gt;lease_key_low, __entry-&gt;lease_state, __entry-&gt;rc)</div><div class='del'>-)</div><div class='del'>-</div><div class='del'>-#define DEFINE_SMB3_LEASE_ERR_EVENT(name)        \</div><div class='del'>-DEFINE_EVENT(smb3_lease_err_class, smb3_##name,  \</div><div class='del'>-	TP_PROTO(__u32	lease_state,		\</div><div class='del'>-		__u32	tid,			\</div><div class='del'>-		__u64	sesid,			\</div><div class='del'>-		__u64	lease_key_low,		\</div><div class='del'>-		__u64	lease_key_high,		\</div><div class='del'>-		int	rc),			\</div><div class='del'>-	TP_ARGS(lease_state, tid, sesid, lease_key_low, lease_key_high, rc))</div><div class='del'>-</div><div class='del'>-DEFINE_SMB3_LEASE_ERR_EVENT(lease_err);</div><div class='del'>-</div><div class='del'>-DECLARE_EVENT_CLASS(smb3_connect_class,</div><div class='del'>-	TP_PROTO(char *hostname,</div><div class='del'>-		__u64 conn_id,</div><div class='del'>-		const struct __kernel_sockaddr_storage *dst_addr),</div><div class='del'>-	TP_ARGS(hostname, conn_id, dst_addr),</div><div class='del'>-	TP_STRUCT__entry(</div><div class='del'>-		__string(hostname, hostname)</div><div class='del'>-		__field(__u64, conn_id)</div><div class='del'>-		__array(__u8, dst_addr, sizeof(struct sockaddr_storage))</div><div class='del'>-	),</div><div class='del'>-	TP_fast_assign(</div><div class='del'>-		struct sockaddr_storage *pss = NULL;</div><div class='del'>-</div><div class='del'>-		__entry-&gt;conn_id = conn_id;</div><div class='del'>-		pss = (struct sockaddr_storage *)__entry-&gt;dst_addr;</div><div class='del'>-		*pss = *dst_addr;</div><div class='del'>-		__assign_str(hostname, hostname);</div><div class='del'>-	),</div><div class='del'>-	TP_printk("conn_id=0x%llx server=%s addr=%pISpsfc",</div><div class='del'>-		__entry-&gt;conn_id,</div><div class='del'>-		__get_str(hostname),</div><div class='del'>-		__entry-&gt;dst_addr)</div><div class='del'>-)</div><div class='del'>-</div><div class='del'>-#define DEFINE_SMB3_CONNECT_EVENT(name)        \</div><div class='del'>-DEFINE_EVENT(smb3_connect_class, smb3_##name,  \</div><div class='del'>-	TP_PROTO(char *hostname,		\</div><div class='del'>-		__u64 conn_id,			\</div><div class='del'>-		const struct __kernel_sockaddr_storage *addr),	\</div><div class='del'>-	TP_ARGS(hostname, conn_id, addr))</div><div class='del'>-</div><div class='del'>-DEFINE_SMB3_CONNECT_EVENT(connect_done);</div><div class='del'>-</div><div class='del'>-DECLARE_EVENT_CLASS(smb3_connect_err_class,</div><div class='del'>-	TP_PROTO(char *hostname, __u64 conn_id,</div><div class='del'>-		const struct __kernel_sockaddr_storage *dst_addr, int rc),</div><div class='del'>-	TP_ARGS(hostname, conn_id, dst_addr, rc),</div><div class='del'>-	TP_STRUCT__entry(</div><div class='del'>-		__string(hostname, hostname)</div><div class='del'>-		__field(__u64, conn_id)</div><div class='del'>-		__array(__u8, dst_addr, sizeof(struct sockaddr_storage))</div><div class='del'>-		__field(int, rc)</div><div class='del'>-	),</div><div class='del'>-	TP_fast_assign(</div><div class='del'>-		struct sockaddr_storage *pss = NULL;</div><div class='del'>-</div><div class='del'>-		__entry-&gt;conn_id = conn_id;</div><div class='del'>-		__entry-&gt;rc = rc;</div><div class='del'>-		pss = (struct sockaddr_storage *)__entry-&gt;dst_addr;</div><div class='del'>-		*pss = *dst_addr;</div><div class='del'>-		__assign_str(hostname, hostname);</div><div class='del'>-	),</div><div class='del'>-	TP_printk("rc=%d conn_id=0x%llx server=%s addr=%pISpsfc",</div><div class='del'>-		__entry-&gt;rc,</div><div class='del'>-		__entry-&gt;conn_id,</div><div class='del'>-		__get_str(hostname),</div><div class='del'>-		__entry-&gt;dst_addr)</div><div class='del'>-)</div><div class='del'>-</div><div class='del'>-#define DEFINE_SMB3_CONNECT_ERR_EVENT(name)        \</div><div class='del'>-DEFINE_EVENT(smb3_connect_err_class, smb3_##name,  \</div><div class='del'>-	TP_PROTO(char *hostname,		\</div><div class='del'>-		__u64 conn_id,			\</div><div class='del'>-		const struct __kernel_sockaddr_storage *addr,	\</div><div class='del'>-		int rc),			\</div><div class='del'>-	TP_ARGS(hostname, conn_id, addr, rc))</div><div class='del'>-</div><div class='del'>-DEFINE_SMB3_CONNECT_ERR_EVENT(connect_err);</div><div class='del'>-</div><div class='del'>-DECLARE_EVENT_CLASS(smb3_reconnect_class,</div><div class='del'>-	TP_PROTO(__u64	currmid,</div><div class='del'>-		__u64 conn_id,</div><div class='del'>-		char *hostname),</div><div class='del'>-	TP_ARGS(currmid, conn_id, hostname),</div><div class='del'>-	TP_STRUCT__entry(</div><div class='del'>-		__field(__u64, currmid)</div><div class='del'>-		__field(__u64, conn_id)</div><div class='del'>-		__string(hostname, hostname)</div><div class='del'>-	),</div><div class='del'>-	TP_fast_assign(</div><div class='del'>-		__entry-&gt;currmid = currmid;</div><div class='del'>-		__entry-&gt;conn_id = conn_id;</div><div class='del'>-		__assign_str(hostname, hostname);</div><div class='del'>-	),</div><div class='del'>-	TP_printk("conn_id=0x%llx server=%s current_mid=%llu",</div><div class='del'>-		__entry-&gt;conn_id,</div><div class='del'>-		__get_str(hostname),</div><div class='del'>-		__entry-&gt;currmid)</div><div class='del'>-)</div><div class='del'>-</div><div class='del'>-#define DEFINE_SMB3_RECONNECT_EVENT(name)        \</div><div class='del'>-DEFINE_EVENT(smb3_reconnect_class, smb3_##name,  \</div><div class='del'>-	TP_PROTO(__u64	currmid,		\</div><div class='del'>-		__u64 conn_id,			\</div><div class='del'>-		char *hostname),				\</div><div class='del'>-	TP_ARGS(currmid, conn_id, hostname))</div><div class='del'>-</div><div class='del'>-DEFINE_SMB3_RECONNECT_EVENT(reconnect);</div><div class='del'>-DEFINE_SMB3_RECONNECT_EVENT(partial_send_reconnect);</div><div class='del'>-</div><div class='del'>-DECLARE_EVENT_CLASS(smb3_credit_class,</div><div class='del'>-	TP_PROTO(__u64	currmid,</div><div class='del'>-		__u64 conn_id,</div><div class='del'>-		char *hostname,</div><div class='del'>-		int credits,</div><div class='del'>-		int credits_to_add,</div><div class='del'>-		int in_flight),</div><div class='del'>-	TP_ARGS(currmid, conn_id, hostname, credits, credits_to_add, in_flight),</div><div class='del'>-	TP_STRUCT__entry(</div><div class='del'>-		__field(__u64, currmid)</div><div class='del'>-		__field(__u64, conn_id)</div><div class='del'>-		__string(hostname, hostname)</div><div class='del'>-		__field(int, credits)</div><div class='del'>-		__field(int, credits_to_add)</div><div class='del'>-		__field(int, in_flight)</div><div class='del'>-	),</div><div class='del'>-	TP_fast_assign(</div><div class='del'>-		__entry-&gt;currmid = currmid;</div><div class='del'>-		__entry-&gt;conn_id = conn_id;</div><div class='del'>-		__assign_str(hostname, hostname);</div><div class='del'>-		__entry-&gt;credits = credits;</div><div class='del'>-		__entry-&gt;credits_to_add = credits_to_add;</div><div class='del'>-		__entry-&gt;in_flight = in_flight;</div><div class='del'>-	),</div><div class='del'>-	TP_printk("conn_id=0x%llx server=%s current_mid=%llu "</div><div class='del'>-			"credits=%d credit_change=%d in_flight=%d",</div><div class='del'>-		__entry-&gt;conn_id,</div><div class='del'>-		__get_str(hostname),</div><div class='del'>-		__entry-&gt;currmid,</div><div class='del'>-		__entry-&gt;credits,</div><div class='del'>-		__entry-&gt;credits_to_add,</div><div class='del'>-		__entry-&gt;in_flight)</div><div class='del'>-)</div><div class='del'>-</div><div class='del'>-#define DEFINE_SMB3_CREDIT_EVENT(name)        \</div><div class='del'>-DEFINE_EVENT(smb3_credit_class, smb3_##name,  \</div><div class='del'>-	TP_PROTO(__u64	currmid,		\</div><div class='del'>-		__u64 conn_id,			\</div><div class='del'>-		char *hostname,			\</div><div class='del'>-		int  credits,			\</div><div class='del'>-		int  credits_to_add,	\</div><div class='del'>-		int in_flight),			\</div><div class='del'>-	TP_ARGS(currmid, conn_id, hostname, credits, credits_to_add, in_flight))</div><div class='del'>-</div><div class='del'>-DEFINE_SMB3_CREDIT_EVENT(reconnect_with_invalid_credits);</div><div class='del'>-DEFINE_SMB3_CREDIT_EVENT(reconnect_detected);</div><div class='del'>-DEFINE_SMB3_CREDIT_EVENT(credit_timeout);</div><div class='del'>-DEFINE_SMB3_CREDIT_EVENT(insufficient_credits);</div><div class='del'>-DEFINE_SMB3_CREDIT_EVENT(too_many_credits);</div><div class='del'>-DEFINE_SMB3_CREDIT_EVENT(add_credits);</div><div class='del'>-DEFINE_SMB3_CREDIT_EVENT(set_credits);</div><div class='del'>-</div><div class='del'>-#endif /* _CIFS_TRACE_H */</div><div class='del'>-</div><div class='del'>-#undef TRACE_INCLUDE_PATH</div><div class='del'>-#define TRACE_INCLUDE_PATH .</div><div class='del'>-#define TRACE_INCLUDE_FILE trace</div><div class='del'>-#include &lt;trace/define_trace.h&gt;</div><div class='head'>diff --git a/fs/coda/cache.c b/fs/coda/cache.c<br/>index 3b8c4513118f..970f0022ec52 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/coda/cache.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/coda/cache.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/coda/cache.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/coda/cache.c</a></div><div class='hunk'>@@ -93,13 +93,13 @@ static void coda_flag_children(struct dentry *parent, int flag)</div><div class='ctx'> 	struct dentry *de;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;parent-&gt;d_lock);</div><div class='del'>-	list_for_each_entry(de, &amp;parent-&gt;d_subdirs, d_child) {</div><div class='add'>+	hlist_for_each_entry(de, &amp;parent-&gt;d_children, d_sib) {</div><div class='add'>+		struct inode *inode = d_inode_rcu(de);</div><div class='ctx'> 		/* don't know what to do with negative dentries */</div><div class='del'>-		if (d_inode(de) ) </div><div class='del'>-			coda_flag_inode(d_inode(de), flag);</div><div class='add'>+		if (inode)</div><div class='add'>+			coda_flag_inode(inode, flag);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;parent-&gt;d_lock);</div><div class='del'>-	return; </div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void coda_flag_inode_children(struct inode *inode, int flag)</div><div class='head'>diff --git a/fs/coda/cnode.c b/fs/coda/cnode.c<br/>index 62a3d2565c26..70bb0579b40c 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/coda/cnode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/coda/cnode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/coda/cnode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/coda/cnode.c</a></div><div class='hunk'>@@ -70,7 +70,7 @@ retry:</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='del'>-	if (inode-&gt;i_state &amp; I_NEW) {</div><div class='add'>+	if (inode_state_read_once(inode) &amp; I_NEW) {</div><div class='ctx'> 		cii = ITOC(inode);</div><div class='ctx'> 		/* we still need to set i_ino for things like stat(2) */</div><div class='ctx'> 		inode-&gt;i_ino = hash;</div><div class='hunk'>@@ -148,7 +148,7 @@ struct inode *coda_fid_to_inode(struct CodaFid *fid, struct super_block *sb)</div><div class='ctx'> </div><div class='ctx'> 	/* we should never see newly created inodes because we intentionally</div><div class='ctx'> 	 * fail in the initialization callback */</div><div class='del'>-	BUG_ON(inode-&gt;i_state &amp; I_NEW);</div><div class='add'>+	BUG_ON(inode_state_read_once(inode) &amp; I_NEW);</div><div class='ctx'> </div><div class='ctx'> 	return inode;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/coda/coda_linux.c b/fs/coda/coda_linux.c<br/>index 903ca8fa4b9b..1d2dac95f86a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/coda/coda_linux.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/coda/coda_linux.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/coda/coda_linux.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/coda/coda_linux.c</a></div><div class='hunk'>@@ -123,11 +123,14 @@ void coda_vattr_to_iattr(struct inode *inode, struct coda_vattr *attr)</div><div class='ctx'> 	if (attr-&gt;va_size != -1)</div><div class='ctx'> 		inode-&gt;i_blocks = (attr-&gt;va_size + 511) &gt;&gt; 9;</div><div class='ctx'> 	if (attr-&gt;va_atime.tv_sec != -1) </div><div class='del'>-		inode-&gt;i_atime = coda_to_timespec64(attr-&gt;va_atime);</div><div class='add'>+		inode_set_atime_to_ts(inode,</div><div class='add'>+				      coda_to_timespec64(attr-&gt;va_atime));</div><div class='ctx'> 	if (attr-&gt;va_mtime.tv_sec != -1)</div><div class='del'>-		inode-&gt;i_mtime = coda_to_timespec64(attr-&gt;va_mtime);</div><div class='add'>+		inode_set_mtime_to_ts(inode,</div><div class='add'>+				      coda_to_timespec64(attr-&gt;va_mtime));</div><div class='ctx'>         if (attr-&gt;va_ctime.tv_sec != -1)</div><div class='del'>-		inode-&gt;i_ctime = coda_to_timespec64(attr-&gt;va_ctime);</div><div class='add'>+		inode_set_ctime_to_ts(inode,</div><div class='add'>+				      coda_to_timespec64(attr-&gt;va_ctime));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> </div><div class='head'>diff --git a/fs/coda/coda_linux.h b/fs/coda/coda_linux.h<br/>index 9be281bbcc06..dd6277d87afb 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/coda/coda_linux.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/coda/coda_linux.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/coda/coda_linux.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/coda/coda_linux.h</a></div><div class='hunk'>@@ -46,12 +46,12 @@ extern const struct file_operations coda_ioctl_operations;</div><div class='ctx'> /* operations shared over more than one file */</div><div class='ctx'> int coda_open(struct inode *i, struct file *f);</div><div class='ctx'> int coda_release(struct inode *i, struct file *f);</div><div class='del'>-int coda_permission(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='add'>+int coda_permission(struct mnt_idmap *idmap, struct inode *inode,</div><div class='ctx'> 		    int mask);</div><div class='ctx'> int coda_revalidate_inode(struct inode *);</div><div class='del'>-int coda_getattr(struct user_namespace *, const struct path *, struct kstat *,</div><div class='add'>+int coda_getattr(struct mnt_idmap *, const struct path *, struct kstat *,</div><div class='ctx'> 		 u32, unsigned int);</div><div class='del'>-int coda_setattr(struct user_namespace *, struct dentry *, struct iattr *);</div><div class='add'>+int coda_setattr(struct mnt_idmap *, struct dentry *, struct iattr *);</div><div class='ctx'> </div><div class='ctx'> /* this file:  helpers */</div><div class='ctx'> char *coda_f2s(struct CodaFid *f);</div><div class='head'>diff --git a/fs/coda/dir.c b/fs/coda/dir.c<br/>index 328d7a684b63..ca9990017265 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/coda/dir.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/coda/dir.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/coda/dir.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/coda/dir.c</a></div><div class='hunk'>@@ -73,7 +73,7 @@ static struct dentry *coda_lookup(struct inode *dir, struct dentry *entry, unsig</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> </div><div class='del'>-int coda_permission(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='add'>+int coda_permission(struct mnt_idmap *idmap, struct inode *inode,</div><div class='ctx'> 		    int mask)</div><div class='ctx'> {</div><div class='ctx'> 	int error;</div><div class='hunk'>@@ -111,7 +111,7 @@ static inline void coda_dir_update_mtime(struct inode *dir)</div><div class='ctx'> 	/* optimistically we can also act as if our nose bleeds. The</div><div class='ctx'> 	 * granularity of the mtime is coarse anyways so we might actually be</div><div class='ctx'> 	 * right most of the time. Note: we only do this for directories. */</div><div class='del'>-	dir-&gt;i_mtime = dir-&gt;i_ctime = current_time(dir);</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='ctx'> #endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -133,7 +133,7 @@ static inline void coda_dir_drop_nlink(struct inode *dir)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* creation routines: create, mknod, mkdir, link, symlink */</div><div class='del'>-static int coda_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int coda_create(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		       struct dentry *de, umode_t mode, bool excl)</div><div class='ctx'> {</div><div class='ctx'> 	int error;</div><div class='hunk'>@@ -166,8 +166,8 @@ err_out:</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int coda_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-		      struct dentry *de, umode_t mode)</div><div class='add'>+static struct dentry *coda_mkdir(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+				 struct dentry *de, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct coda_vattr attrs;</div><div class='hunk'>@@ -177,14 +177,14 @@ static int coda_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	struct CodaFid newfid;</div><div class='ctx'> </div><div class='ctx'> 	if (is_root_inode(dir) &amp;&amp; coda_iscontrol(name, len))</div><div class='del'>-		return -EPERM;</div><div class='add'>+		return ERR_PTR(-EPERM);</div><div class='ctx'> </div><div class='ctx'> 	attrs.va_mode = mode;</div><div class='del'>-	error = venus_mkdir(dir-&gt;i_sb, coda_i2f(dir), </div><div class='add'>+	error = venus_mkdir(dir-&gt;i_sb, coda_i2f(dir),</div><div class='ctx'> 			       name, len, &amp;newfid, &amp;attrs);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto err_out;</div><div class='del'>-         </div><div class='add'>+</div><div class='ctx'> 	inode = coda_iget(dir-&gt;i_sb, &amp;newfid, &amp;attrs);</div><div class='ctx'> 	if (IS_ERR(inode)) {</div><div class='ctx'> 		error = PTR_ERR(inode);</div><div class='hunk'>@@ -195,10 +195,10 @@ static int coda_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	coda_dir_inc_nlink(dir);</div><div class='ctx'> 	coda_dir_update_mtime(dir);</div><div class='ctx'> 	d_instantiate(de, inode);</div><div class='del'>-	return 0;</div><div class='add'>+	return NULL;</div><div class='ctx'> err_out:</div><div class='ctx'> 	d_drop(de);</div><div class='del'>-	return error;</div><div class='add'>+	return ERR_PTR(error);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* try to make de an entry in dir_inodde linked to source_de */ </div><div class='hunk'>@@ -228,7 +228,7 @@ static int coda_link(struct dentry *source_de, struct inode *dir_inode,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> </div><div class='del'>-static int coda_symlink(struct user_namespace *mnt_userns,</div><div class='add'>+static int coda_symlink(struct mnt_idmap *idmap,</div><div class='ctx'> 			struct inode *dir_inode, struct dentry *de,</div><div class='ctx'> 			const char *symname)</div><div class='ctx'> {</div><div class='hunk'>@@ -295,7 +295,7 @@ static int coda_rmdir(struct inode *dir, struct dentry *de)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* rename */</div><div class='del'>-static int coda_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='add'>+static int coda_rename(struct mnt_idmap *idmap, struct inode *old_dir,</div><div class='ctx'> 		       struct dentry *old_dentry, struct inode *new_dir,</div><div class='ctx'> 		       struct dentry *new_dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='hunk'>@@ -429,30 +429,16 @@ static int coda_readdir(struct file *coda_file, struct dir_context *ctx)</div><div class='ctx'> 	cfi = coda_ftoc(coda_file);</div><div class='ctx'> 	host_file = cfi-&gt;cfi_container;</div><div class='ctx'> </div><div class='del'>-	if (host_file-&gt;f_op-&gt;iterate || host_file-&gt;f_op-&gt;iterate_shared) {</div><div class='del'>-		struct inode *host_inode = file_inode(host_file);</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-		if (!IS_DEADDIR(host_inode)) {</div><div class='del'>-			if (host_file-&gt;f_op-&gt;iterate_shared) {</div><div class='del'>-				inode_lock_shared(host_inode);</div><div class='del'>-				ret = host_file-&gt;f_op-&gt;iterate_shared(host_file, ctx);</div><div class='del'>-				file_accessed(host_file);</div><div class='del'>-				inode_unlock_shared(host_inode);</div><div class='del'>-			} else {</div><div class='del'>-				inode_lock(host_inode);</div><div class='del'>-				ret = host_file-&gt;f_op-&gt;iterate(host_file, ctx);</div><div class='del'>-				file_accessed(host_file);</div><div class='del'>-				inode_unlock(host_inode);</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='add'>+	ret = iterate_dir(host_file, ctx);</div><div class='add'>+	if (ret != -ENOTDIR)</div><div class='ctx'> 		return ret;</div><div class='del'>-	}</div><div class='ctx'> 	/* Venus: we must read Venus dirents from a file */</div><div class='ctx'> 	return coda_venus_readdir(coda_file, ctx);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* called when a cache lookup succeeds */</div><div class='del'>-static int coda_dentry_revalidate(struct dentry *de, unsigned int flags)</div><div class='add'>+static int coda_dentry_revalidate(struct inode *dir, const struct qstr *name,</div><div class='add'>+				  struct dentry *de, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct coda_inode_info *cii;</div><div class='hunk'>@@ -585,10 +571,11 @@ const struct inode_operations coda_dir_inode_operations = {</div><div class='ctx'> 	.setattr	= coda_setattr,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+WRAP_DIR_ITER(coda_readdir) // FIXME!</div><div class='ctx'> const struct file_operations coda_dir_operations = {</div><div class='ctx'> 	.llseek		= generic_file_llseek,</div><div class='ctx'> 	.read		= generic_read_dir,</div><div class='del'>-	.iterate	= coda_readdir,</div><div class='add'>+	.iterate_shared	= shared_coda_readdir,</div><div class='ctx'> 	.open		= coda_open,</div><div class='ctx'> 	.release	= coda_release,</div><div class='ctx'> 	.fsync		= coda_fsync,</div><div class='head'>diff --git a/fs/coda/file.c b/fs/coda/file.c<br/>index 29dd87be2fb8..a390b5d21196 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/coda/file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/coda/file.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/coda/file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/coda/file.c</a></div><div class='hunk'>@@ -14,6 +14,7 @@</div><div class='ctx'> #include &lt;linux/time.h&gt;</div><div class='ctx'> #include &lt;linux/file.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/pagemap.h&gt;</div><div class='ctx'> #include &lt;linux/stat.h&gt;</div><div class='ctx'> #include &lt;linux/cred.h&gt;</div><div class='ctx'> #include &lt;linux/errno.h&gt;</div><div class='hunk'>@@ -22,6 +23,7 @@</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/uaccess.h&gt;</div><div class='ctx'> #include &lt;linux/uio.h&gt;</div><div class='add'>+#include &lt;linux/splice.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/coda.h&gt;</div><div class='ctx'> #include "coda_psdev.h"</div><div class='hunk'>@@ -77,14 +79,12 @@ coda_file_write_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto finish_write;</div><div class='ctx'> </div><div class='del'>-	file_start_write(host_file);</div><div class='ctx'> 	inode_lock(coda_inode);</div><div class='ctx'> 	ret = vfs_iter_write(cfi-&gt;cfi_container, to, &amp;iocb-&gt;ki_pos, 0);</div><div class='ctx'> 	coda_inode-&gt;i_size = file_inode(host_file)-&gt;i_size;</div><div class='ctx'> 	coda_inode-&gt;i_blocks = (coda_inode-&gt;i_size + 511) &gt;&gt; 9;</div><div class='del'>-	coda_inode-&gt;i_mtime = coda_inode-&gt;i_ctime = current_time(coda_inode);</div><div class='add'>+	inode_set_mtime_to_ts(coda_inode, inode_set_ctime_current(coda_inode));</div><div class='ctx'> 	inode_unlock(coda_inode);</div><div class='del'>-	file_end_write(host_file);</div><div class='ctx'> </div><div class='ctx'> finish_write:</div><div class='ctx'> 	venus_access_intent(coda_inode-&gt;i_sb, coda_i2f(coda_inode),</div><div class='hunk'>@@ -93,6 +93,32 @@ finish_write:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static ssize_t</div><div class='add'>+coda_file_splice_read(struct file *coda_file, loff_t *ppos,</div><div class='add'>+		      struct pipe_inode_info *pipe,</div><div class='add'>+		      size_t len, unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	struct inode *coda_inode = file_inode(coda_file);</div><div class='add'>+	struct coda_file_info *cfi = coda_ftoc(coda_file);</div><div class='add'>+	struct file *in = cfi-&gt;cfi_container;</div><div class='add'>+	loff_t ki_pos = *ppos;</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	ret = venus_access_intent(coda_inode-&gt;i_sb, coda_i2f(coda_inode),</div><div class='add'>+				  &amp;cfi-&gt;cfi_access_intent,</div><div class='add'>+				  len, ki_pos, CODA_ACCESS_TYPE_READ);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto finish_read;</div><div class='add'>+</div><div class='add'>+	ret = vfs_splice_read(in, ppos, pipe, len, flags);</div><div class='add'>+</div><div class='add'>+finish_read:</div><div class='add'>+	venus_access_intent(coda_inode-&gt;i_sb, coda_i2f(coda_inode),</div><div class='add'>+			    &amp;cfi-&gt;cfi_access_intent,</div><div class='add'>+			    len, ki_pos, CODA_ACCESS_TYPE_READ_FINISH);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void</div><div class='ctx'> coda_vm_open(struct vm_area_struct *vma)</div><div class='ctx'> {</div><div class='hunk'>@@ -134,7 +160,7 @@ coda_file_mmap(struct file *coda_file, struct vm_area_struct *vma)</div><div class='ctx'> 	size_t count;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (!host_file-&gt;f_op-&gt;mmap)</div><div class='add'>+	if (!can_mmap_file(host_file))</div><div class='ctx'> 		return -ENODEV;</div><div class='ctx'> </div><div class='ctx'> 	if (WARN_ON(coda_file != vma-&gt;vm_file))</div><div class='hunk'>@@ -173,10 +199,10 @@ coda_file_mmap(struct file *coda_file, struct vm_area_struct *vma)</div><div class='ctx'> 	spin_unlock(&amp;cii-&gt;c_lock);</div><div class='ctx'> </div><div class='ctx'> 	vma-&gt;vm_file = get_file(host_file);</div><div class='del'>-	ret = call_mmap(vma-&gt;vm_file, vma);</div><div class='add'>+	ret = vfs_mmap(vma-&gt;vm_file, vma);</div><div class='ctx'> </div><div class='ctx'> 	if (ret) {</div><div class='del'>-		/* if call_mmap fails, our caller will put host_file so we</div><div class='add'>+		/* if vfs_mmap fails, our caller will put host_file so we</div><div class='ctx'> 		 * should drop the reference to the coda_file that we got.</div><div class='ctx'> 		 */</div><div class='ctx'> 		fput(coda_file);</div><div class='hunk'>@@ -301,5 +327,5 @@ const struct file_operations coda_file_operations = {</div><div class='ctx'> 	.open		= coda_open,</div><div class='ctx'> 	.release	= coda_release,</div><div class='ctx'> 	.fsync		= coda_fsync,</div><div class='del'>-	.splice_read	= generic_file_splice_read,</div><div class='add'>+	.splice_read	= coda_file_splice_read,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/coda/inode.c b/fs/coda/inode.c<br/>index d9f1bd7153df..08450d006016 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/coda/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/coda/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/coda/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/coda/inode.c</a></div><div class='hunk'>@@ -24,6 +24,8 @@</div><div class='ctx'> #include &lt;linux/pid_namespace.h&gt;</div><div class='ctx'> #include &lt;linux/uaccess.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/fs_context.h&gt;</div><div class='add'>+#include &lt;linux/fs_parser.h&gt;</div><div class='ctx'> #include &lt;linux/vmalloc.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/coda.h&gt;</div><div class='hunk'>@@ -43,7 +45,7 @@ static struct kmem_cache * coda_inode_cachep;</div><div class='ctx'> static struct inode *coda_alloc_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct coda_inode_info *ei;</div><div class='del'>-	ei = kmem_cache_alloc(coda_inode_cachep, GFP_KERNEL);</div><div class='add'>+	ei = alloc_inode_sb(sb, coda_inode_cachep, GFP_KERNEL);</div><div class='ctx'> 	if (!ei)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	memset(&amp;ei-&gt;c_fid, 0, sizeof(struct CodaFid));</div><div class='hunk'>@@ -70,8 +72,8 @@ int __init coda_init_inodecache(void)</div><div class='ctx'> {</div><div class='ctx'> 	coda_inode_cachep = kmem_cache_create("coda_inode_cache",</div><div class='ctx'> 				sizeof(struct coda_inode_info), 0,</div><div class='del'>-				SLAB_RECLAIM_ACCOUNT|SLAB_MEM_SPREAD|</div><div class='del'>-				SLAB_ACCOUNT, init_once);</div><div class='add'>+				SLAB_RECLAIM_ACCOUNT | SLAB_ACCOUNT,</div><div class='add'>+				init_once);</div><div class='ctx'> 	if (coda_inode_cachep == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -87,10 +89,10 @@ void coda_destroy_inodecache(void)</div><div class='ctx'> 	kmem_cache_destroy(coda_inode_cachep);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int coda_remount(struct super_block *sb, int *flags, char *data)</div><div class='add'>+static int coda_reconfigure(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	sync_filesystem(sb);</div><div class='del'>-	*flags |= SB_NOATIME;</div><div class='add'>+	sync_filesystem(fc-&gt;root-&gt;d_sb);</div><div class='add'>+	fc-&gt;sb_flags |= SB_NOATIME;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -102,78 +104,119 @@ static const struct super_operations coda_super_operations =</div><div class='ctx'> 	.evict_inode	= coda_evict_inode,</div><div class='ctx'> 	.put_super	= coda_put_super,</div><div class='ctx'> 	.statfs		= coda_statfs,</div><div class='del'>-	.remount_fs	= coda_remount,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int get_device_index(struct coda_mount_data *data)</div><div class='add'>+struct coda_fs_context {</div><div class='add'>+	int	idx;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+enum {</div><div class='add'>+	Opt_fd,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct fs_parameter_spec coda_param_specs[] = {</div><div class='add'>+	fsparam_fd	("fd",	Opt_fd),</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int coda_set_idx(struct fs_context *fc, struct file *file)</div><div class='ctx'> {</div><div class='del'>-	struct fd f;</div><div class='add'>+	struct coda_fs_context *ctx = fc-&gt;fs_private;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	int idx;</div><div class='ctx'> </div><div class='del'>-	if (data == NULL) {</div><div class='del'>-		pr_warn("%s: Bad mount data\n", __func__);</div><div class='del'>-		return -1;</div><div class='add'>+	inode = file_inode(file);</div><div class='add'>+	if (!S_ISCHR(inode-&gt;i_mode) || imajor(inode) != CODA_PSDEV_MAJOR) {</div><div class='add'>+		return invalf(fc, "coda: Not coda psdev");</div><div class='ctx'> 	}</div><div class='add'>+	idx = iminor(inode);</div><div class='add'>+	if (idx &lt; 0 || idx &gt;= MAX_CODADEVS)</div><div class='add'>+		return invalf(fc, "coda: Bad minor number");</div><div class='add'>+	ctx-&gt;idx = idx;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if (data-&gt;version != CODA_MOUNT_VERSION) {</div><div class='del'>-		pr_warn("%s: Bad mount version\n", __func__);</div><div class='del'>-		return -1;</div><div class='add'>+static int coda_parse_fd(struct fs_context *fc, struct fs_parameter *param,</div><div class='add'>+			 struct fs_parse_result *result)</div><div class='add'>+{</div><div class='add'>+	struct file *file;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	if (param-&gt;type == fs_value_is_file) {</div><div class='add'>+		file = param-&gt;file;</div><div class='add'>+		param-&gt;file = NULL;</div><div class='add'>+	} else {</div><div class='add'>+		file = fget(result-&gt;uint_32);</div><div class='ctx'> 	}</div><div class='add'>+	if (!file)</div><div class='add'>+		return -EBADF;</div><div class='ctx'> </div><div class='del'>-	f = fdget(data-&gt;fd);</div><div class='del'>-	if (!f.file)</div><div class='del'>-		goto Ebadf;</div><div class='del'>-	inode = file_inode(f.file);</div><div class='del'>-	if (!S_ISCHR(inode-&gt;i_mode) || imajor(inode) != CODA_PSDEV_MAJOR) {</div><div class='del'>-		fdput(f);</div><div class='del'>-		goto Ebadf;</div><div class='del'>-	}</div><div class='add'>+	err = coda_set_idx(fc, file);</div><div class='add'>+	fput(file);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	idx = iminor(inode);</div><div class='del'>-	fdput(f);</div><div class='add'>+static int coda_parse_param(struct fs_context *fc, struct fs_parameter *param)</div><div class='add'>+{</div><div class='add'>+	struct fs_parse_result result;</div><div class='add'>+	int opt;</div><div class='add'>+</div><div class='add'>+	opt = fs_parse(fc, coda_param_specs, param, &amp;result);</div><div class='add'>+	if (opt &lt; 0)</div><div class='add'>+		return opt;</div><div class='ctx'> </div><div class='del'>-	if (idx &lt; 0 || idx &gt;= MAX_CODADEVS) {</div><div class='del'>-		pr_warn("%s: Bad minor number\n", __func__);</div><div class='del'>-		return -1;</div><div class='add'>+	switch (opt) {</div><div class='add'>+	case Opt_fd:</div><div class='add'>+		return coda_parse_fd(fc, param, &amp;result);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return idx;</div><div class='del'>-Ebadf:</div><div class='del'>-	pr_warn("%s: Bad file\n", __func__);</div><div class='del'>-	return -1;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int coda_fill_super(struct super_block *sb, void *data, int silent)</div><div class='add'>+/*</div><div class='add'>+ * Parse coda's binary mount data form.  We ignore any errors and go with index</div><div class='add'>+ * 0 if we get one for backward compatibility.</div><div class='add'>+ */</div><div class='add'>+static int coda_parse_monolithic(struct fs_context *fc, void *_data)</div><div class='ctx'> {</div><div class='add'>+	struct file *file;</div><div class='add'>+	struct coda_mount_data *data = _data;</div><div class='add'>+</div><div class='add'>+	if (!data)</div><div class='add'>+		return invalf(fc, "coda: Bad mount data");</div><div class='add'>+</div><div class='add'>+	if (data-&gt;version != CODA_MOUNT_VERSION)</div><div class='add'>+		return invalf(fc, "coda: Bad mount version");</div><div class='add'>+</div><div class='add'>+	file = fget(data-&gt;fd);</div><div class='add'>+	if (file) {</div><div class='add'>+		coda_set_idx(fc, file);</div><div class='add'>+		fput(file);</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int coda_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct coda_fs_context *ctx = fc-&gt;fs_private;</div><div class='ctx'> 	struct inode *root = NULL;</div><div class='ctx'> 	struct venus_comm *vc;</div><div class='ctx'> 	struct CodaFid fid;</div><div class='ctx'> 	int error;</div><div class='del'>-	int idx;</div><div class='del'>-</div><div class='del'>-	if (task_active_pid_ns(current) != &amp;init_pid_ns)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	idx = get_device_index((struct coda_mount_data *) data);</div><div class='ctx'> </div><div class='del'>-	/* Ignore errors in data, for backward compatibility */</div><div class='del'>-	if(idx == -1)</div><div class='del'>-		idx = 0;</div><div class='del'>-	</div><div class='del'>-	pr_info("%s: device index: %i\n", __func__,  idx);</div><div class='add'>+	infof(fc, "coda: device index: %i\n", ctx-&gt;idx);</div><div class='ctx'> </div><div class='del'>-	vc = &amp;coda_comms[idx];</div><div class='add'>+	vc = &amp;coda_comms[ctx-&gt;idx];</div><div class='ctx'> 	mutex_lock(&amp;vc-&gt;vc_mutex);</div><div class='ctx'> </div><div class='ctx'> 	if (!vc-&gt;vc_inuse) {</div><div class='del'>-		pr_warn("%s: No pseudo device\n", __func__);</div><div class='add'>+		errorf(fc, "coda: No pseudo device");</div><div class='ctx'> 		error = -EINVAL;</div><div class='ctx'> 		goto unlock_out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (vc-&gt;vc_sb) {</div><div class='del'>-		pr_warn("%s: Device already mounted\n", __func__);</div><div class='add'>+		errorf(fc, "coda: Device already mounted");</div><div class='ctx'> 		error = -EBUSY;</div><div class='ctx'> 		goto unlock_out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -187,7 +230,7 @@ static int coda_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 	sb-&gt;s_blocksize_bits = 12;</div><div class='ctx'> 	sb-&gt;s_magic = CODA_SUPER_MAGIC;</div><div class='ctx'> 	sb-&gt;s_op = &amp;coda_super_operations;</div><div class='del'>-	sb-&gt;s_d_op = &amp;coda_dentry_operations;</div><div class='add'>+	set_default_d_op(sb, &amp;coda_dentry_operations);</div><div class='ctx'> 	sb-&gt;s_time_gran = 1;</div><div class='ctx'> 	sb-&gt;s_time_min = S64_MIN;</div><div class='ctx'> 	sb-&gt;s_time_max = S64_MAX;</div><div class='hunk'>@@ -251,16 +294,17 @@ static void coda_evict_inode(struct inode *inode)</div><div class='ctx'> 	coda_cache_clear_inode(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int coda_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='add'>+int coda_getattr(struct mnt_idmap *idmap, const struct path *path,</div><div class='ctx'> 		 struct kstat *stat, u32 request_mask, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	int err = coda_revalidate_inode(d_inode(path-&gt;dentry));</div><div class='ctx'> 	if (!err)</div><div class='del'>-		generic_fillattr(&amp;init_user_ns, d_inode(path-&gt;dentry), stat);</div><div class='add'>+		generic_fillattr(&amp;nop_mnt_idmap, request_mask,</div><div class='add'>+				 d_inode(path-&gt;dentry), stat);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int coda_setattr(struct user_namespace *mnt_userns, struct dentry *de,</div><div class='add'>+int coda_setattr(struct mnt_idmap *idmap, struct dentry *de,</div><div class='ctx'> 		 struct iattr *iattr)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(de);</div><div class='hunk'>@@ -269,7 +313,7 @@ int coda_setattr(struct user_namespace *mnt_userns, struct dentry *de,</div><div class='ctx'> </div><div class='ctx'> 	memset(&amp;vattr, 0, sizeof(vattr)); </div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> 	coda_iattr_to_vattr(iattr, &amp;vattr);</div><div class='ctx'> 	vattr.va_type = C_VNON; /* cannot set type */</div><div class='ctx'> </div><div class='hunk'>@@ -312,18 +356,45 @@ static int coda_statfs(struct dentry *dentry, struct kstatfs *buf)</div><div class='ctx'> 	return 0; </div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* init_coda: used by filesystems.c to register coda */</div><div class='add'>+static int coda_get_tree(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	if (task_active_pid_ns(current) != &amp;init_pid_ns)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	return get_tree_nodev(fc, coda_fill_super);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void coda_free_fc(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	kfree(fc-&gt;fs_private);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct fs_context_operations coda_context_ops = {</div><div class='add'>+	.free		= coda_free_fc,</div><div class='add'>+	.parse_param	= coda_parse_param,</div><div class='add'>+	.parse_monolithic = coda_parse_monolithic,</div><div class='add'>+	.get_tree	= coda_get_tree,</div><div class='add'>+	.reconfigure	= coda_reconfigure,</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-static struct dentry *coda_mount(struct file_system_type *fs_type,</div><div class='del'>-	int flags, const char *dev_name, void *data)</div><div class='add'>+static int coda_init_fs_context(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	return mount_nodev(fs_type, flags, data, coda_fill_super);</div><div class='add'>+	struct coda_fs_context *ctx;</div><div class='add'>+</div><div class='add'>+	ctx = kzalloc(sizeof(struct coda_fs_context), GFP_KERNEL);</div><div class='add'>+	if (!ctx)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	fc-&gt;fs_private = ctx;</div><div class='add'>+	fc-&gt;ops = &amp;coda_context_ops;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct file_system_type coda_fs_type = {</div><div class='ctx'> 	.owner		= THIS_MODULE,</div><div class='ctx'> 	.name		= "coda",</div><div class='del'>-	.mount		= coda_mount,</div><div class='add'>+	.init_fs_context = coda_init_fs_context,</div><div class='add'>+	.parameters	= coda_param_specs,</div><div class='ctx'> 	.kill_sb	= kill_anon_super,</div><div class='ctx'> 	.fs_flags	= FS_BINARY_MOUNTDATA,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/coda/pioctl.c b/fs/coda/pioctl.c<br/>index cb9fd59a688c..36e35c15561a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/coda/pioctl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/coda/pioctl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/coda/pioctl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/coda/pioctl.c</a></div><div class='hunk'>@@ -24,7 +24,7 @@</div><div class='ctx'> #include "coda_linux.h"</div><div class='ctx'> </div><div class='ctx'> /* pioctl ops */</div><div class='del'>-static int coda_ioctl_permission(struct user_namespace *mnt_userns,</div><div class='add'>+static int coda_ioctl_permission(struct mnt_idmap *idmap,</div><div class='ctx'> 				 struct inode *inode, int mask);</div><div class='ctx'> static long coda_pioctl(struct file *filp, unsigned int cmd,</div><div class='ctx'> 			unsigned long user_data);</div><div class='hunk'>@@ -41,7 +41,7 @@ const struct file_operations coda_ioctl_operations = {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /* the coda pioctl inode ops */</div><div class='del'>-static int coda_ioctl_permission(struct user_namespace *mnt_userns,</div><div class='add'>+static int coda_ioctl_permission(struct mnt_idmap *idmap,</div><div class='ctx'> 				 struct inode *inode, int mask)</div><div class='ctx'> {</div><div class='ctx'> 	return (mask &amp; MAY_EXEC) ? -EACCES : 0;</div><div class='head'>diff --git a/fs/coda/psdev.c b/fs/coda/psdev.c<br/>index b39580ad4ce5..3c3148588491 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/coda/psdev.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/coda/psdev.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/coda/psdev.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/coda/psdev.c</a></div><div class='hunk'>@@ -361,7 +361,7 @@ static int __init init_coda_psdev(void)</div><div class='ctx'> 		       __func__, CODA_PSDEV_MAJOR);</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='del'>-	coda_psdev_class = class_create(THIS_MODULE, "coda");</div><div class='add'>+	coda_psdev_class = class_create("coda");</div><div class='ctx'> 	if (IS_ERR(coda_psdev_class)) {</div><div class='ctx'> 		err = PTR_ERR(coda_psdev_class);</div><div class='ctx'> 		goto out_chrdev;</div><div class='head'>diff --git a/fs/coda/symlink.c b/fs/coda/symlink.c<br/>index 8907d0508198..40f84d014524 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/coda/symlink.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/coda/symlink.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/coda/symlink.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/coda/symlink.c</a></div><div class='hunk'>@@ -20,29 +20,21 @@</div><div class='ctx'> #include "coda_psdev.h"</div><div class='ctx'> #include "coda_linux.h"</div><div class='ctx'> </div><div class='del'>-static int coda_symlink_filler(struct file *file, struct page *page)</div><div class='add'>+static int coda_symlink_filler(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	int error;</div><div class='ctx'> 	struct coda_inode_info *cii;</div><div class='ctx'> 	unsigned int len = PAGE_SIZE;</div><div class='del'>-	char *p = page_address(page);</div><div class='add'>+	char *p = folio_address(folio);</div><div class='ctx'> </div><div class='ctx'> 	cii = ITOC(inode);</div><div class='ctx'> </div><div class='ctx'> 	error = venus_readlink(inode-&gt;i_sb, &amp;cii-&gt;c_fid, p, &amp;len);</div><div class='del'>-	if (error)</div><div class='del'>-		goto fail;</div><div class='del'>-	SetPageUptodate(page);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-fail:</div><div class='del'>-	SetPageError(page);</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	folio_end_read(folio, error == 0);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations coda_symlink_aops = {</div><div class='del'>-	.readpage	= coda_symlink_filler,</div><div class='add'>+	.read_folio	= coda_symlink_filler,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/coda/sysctl.c b/fs/coda/sysctl.c<br/>index fda3b702b1c5..0df46f09b6cc 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/coda/sysctl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/coda/sysctl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/coda/sysctl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/coda/sysctl.c</a></div><div class='hunk'>@@ -14,7 +14,7 @@</div><div class='ctx'> </div><div class='ctx'> static struct ctl_table_header *fs_table_header;</div><div class='ctx'> </div><div class='del'>-static struct ctl_table coda_table[] = {</div><div class='add'>+static const struct ctl_table coda_table[] = {</div><div class='ctx'> 	{</div><div class='ctx'> 		.procname	= "timeout",</div><div class='ctx'> 		.data		= &amp;coda_timeout,</div><div class='hunk'>@@ -36,22 +36,12 @@ static struct ctl_table coda_table[] = {</div><div class='ctx'> 		.mode		= 0600,</div><div class='ctx'> 		.proc_handler	= proc_dointvec</div><div class='ctx'> 	},</div><div class='del'>-	{}</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static struct ctl_table fs_table[] = {</div><div class='del'>-	{</div><div class='del'>-		.procname	= "coda",</div><div class='del'>-		.mode		= 0555,</div><div class='del'>-		.child		= coda_table</div><div class='del'>-	},</div><div class='del'>-	{}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> void coda_sysctl_init(void)</div><div class='ctx'> {</div><div class='ctx'> 	if ( !fs_table_header )</div><div class='del'>-		fs_table_header = register_sysctl_table(fs_table);</div><div class='add'>+		fs_table_header = register_sysctl("coda", coda_table);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void coda_sysctl_clean(void)</div><div class='head'>diff --git a/fs/coda/upcall.c b/fs/coda/upcall.c<br/>index 59f6cfd06f96..cd6a3721f6f6 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/coda/upcall.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/coda/upcall.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/coda/upcall.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/coda/upcall.c</a></div><div class='hunk'>@@ -791,7 +791,7 @@ static int coda_upcall(struct venus_comm *vcp,</div><div class='ctx'> 	sig_req = kmalloc(sizeof(struct upc_req), GFP_KERNEL);</div><div class='ctx'> 	if (!sig_req) goto exit;</div><div class='ctx'> </div><div class='del'>-	sig_inputArgs = kvzalloc(sizeof(struct coda_in_hdr), GFP_KERNEL);</div><div class='add'>+	sig_inputArgs = kvzalloc(sizeof(*sig_inputArgs), GFP_KERNEL);</div><div class='ctx'> 	if (!sig_inputArgs) {</div><div class='ctx'> 		kfree(sig_req);</div><div class='ctx'> 		goto exit;</div><div class='head'>diff --git a/fs/compat_binfmt_elf.c b/fs/compat_binfmt_elf.c<br/>index 95e72d271b95..d5ef5469e4e6 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/compat_binfmt_elf.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/compat_binfmt_elf.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/compat_binfmt_elf.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/compat_binfmt_elf.c</a></div><div class='hunk'>@@ -80,6 +80,16 @@</div><div class='ctx'> #define	ELF_HWCAP2		COMPAT_ELF_HWCAP2</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='add'>+#ifdef	COMPAT_ELF_HWCAP3</div><div class='add'>+#undef	ELF_HWCAP3</div><div class='add'>+#define	ELF_HWCAP3		COMPAT_ELF_HWCAP3</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+#ifdef	COMPAT_ELF_HWCAP4</div><div class='add'>+#undef	ELF_HWCAP4</div><div class='add'>+#define	ELF_HWCAP4		COMPAT_ELF_HWCAP4</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> #ifdef	COMPAT_ARCH_DLINFO</div><div class='ctx'> #undef	ARCH_DLINFO</div><div class='ctx'> #define	ARCH_DLINFO		COMPAT_ARCH_DLINFO</div><div class='hunk'>@@ -135,6 +145,8 @@</div><div class='ctx'> #define elf_format		compat_elf_format</div><div class='ctx'> #define init_elf_binfmt		init_compat_elf_binfmt</div><div class='ctx'> #define exit_elf_binfmt		exit_compat_elf_binfmt</div><div class='add'>+#define binfmt_elf_test_cases	compat_binfmt_elf_test_cases</div><div class='add'>+#define binfmt_elf_test_suite	compat_binfmt_elf_test_suite</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * We share all the actual code with the native (64-bit) version.</div><div class='head'>diff --git a/fs/configfs/Kconfig b/fs/configfs/Kconfig<br/>index 272b64456999..1fcd761fe7be 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/configfs/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/configfs/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/configfs/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/configfs/Kconfig</a></div><div class='hunk'>@@ -1,7 +1,6 @@</div><div class='ctx'> # SPDX-License-Identifier: GPL-2.0-only</div><div class='ctx'> config CONFIGFS_FS</div><div class='ctx'> 	tristate "Userspace-driven configuration filesystem"</div><div class='del'>-	select SYSFS</div><div class='ctx'> 	help</div><div class='ctx'> 	  configfs is a RAM-based filesystem that provides the converse</div><div class='ctx'> 	  of sysfs's functionality. Where sysfs is a filesystem-based</div><div class='head'>diff --git a/fs/configfs/configfs_internal.h b/fs/configfs/configfs_internal.h<br/>index c0395363eab9..0b969d0eb8ff 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/configfs/configfs_internal.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/configfs/configfs_internal.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/configfs/configfs_internal.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/configfs/configfs_internal.h</a></div><div class='hunk'>@@ -55,6 +55,8 @@ struct configfs_dirent {</div><div class='ctx'> #define CONFIGFS_USET_IN_MKDIR	0x0200</div><div class='ctx'> #define CONFIGFS_USET_CREATING	0x0400</div><div class='ctx'> #define CONFIGFS_NOT_PINNED	(CONFIGFS_ITEM_ATTR | CONFIGFS_ITEM_BIN_ATTR)</div><div class='add'>+#define CONFIGFS_PINNED \</div><div class='add'>+	(CONFIGFS_ROOT | CONFIGFS_DIR | CONFIGFS_ITEM_LINK)</div><div class='ctx'> </div><div class='ctx'> extern struct mutex configfs_symlink_mutex;</div><div class='ctx'> extern spinlock_t configfs_dirent_lock;</div><div class='hunk'>@@ -73,11 +75,9 @@ extern int configfs_make_dirent(struct configfs_dirent *, struct dentry *,</div><div class='ctx'> 				void *, umode_t, int, struct configfs_fragment *);</div><div class='ctx'> extern int configfs_dirent_is_ready(struct configfs_dirent *);</div><div class='ctx'> </div><div class='del'>-extern void configfs_hash_and_remove(struct dentry * dir, const char * name);</div><div class='del'>-</div><div class='ctx'> extern const unsigned char * configfs_get_name(struct configfs_dirent *sd);</div><div class='ctx'> extern void configfs_drop_dentry(struct configfs_dirent *sd, struct dentry *parent);</div><div class='del'>-extern int configfs_setattr(struct user_namespace *mnt_userns,</div><div class='add'>+extern int configfs_setattr(struct mnt_idmap *idmap,</div><div class='ctx'> 			    struct dentry *dentry, struct iattr *iattr);</div><div class='ctx'> </div><div class='ctx'> extern struct dentry *configfs_pin_fs(void);</div><div class='hunk'>@@ -91,7 +91,7 @@ extern const struct inode_operations configfs_root_inode_operations;</div><div class='ctx'> extern const struct inode_operations configfs_symlink_inode_operations;</div><div class='ctx'> extern const struct dentry_operations configfs_dentry_ops;</div><div class='ctx'> </div><div class='del'>-extern int configfs_symlink(struct user_namespace *mnt_userns,</div><div class='add'>+extern int configfs_symlink(struct mnt_idmap *idmap,</div><div class='ctx'> 			    struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 			    const char *symname);</div><div class='ctx'> extern int configfs_unlink(struct inode *dir, struct dentry *dentry);</div><div class='head'>diff --git a/fs/configfs/dir.c b/fs/configfs/dir.c<br/>index 1466b5d01cbb..ba95f636a5ab 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/configfs/dir.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/configfs/dir.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/configfs/dir.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/configfs/dir.c</a></div><div class='hunk'>@@ -34,6 +34,14 @@</div><div class='ctx'>  */</div><div class='ctx'> DEFINE_SPINLOCK(configfs_dirent_lock);</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * All of link_obj/unlink_obj/link_group/unlink_group require that</div><div class='add'>+ * subsys-&gt;su_mutex is held.</div><div class='add'>+ * But parent configfs_subsystem is NULL when config_item is root.</div><div class='add'>+ * Use this mutex when config_item is root.</div><div class='add'>+ */</div><div class='add'>+static DEFINE_MUTEX(configfs_subsystem_mutex);</div><div class='add'>+</div><div class='ctx'> static void configfs_d_iput(struct dentry * dentry,</div><div class='ctx'> 			    struct inode * inode)</div><div class='ctx'> {</div><div class='hunk'>@@ -59,7 +67,6 @@ static void configfs_d_iput(struct dentry * dentry,</div><div class='ctx'> </div><div class='ctx'> const struct dentry_operations configfs_dentry_ops = {</div><div class='ctx'> 	.d_iput		= configfs_d_iput,</div><div class='del'>-	.d_delete	= always_delete_dentry,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_LOCKDEP</div><div class='hunk'>@@ -199,7 +206,17 @@ static struct configfs_dirent *configfs_new_dirent(struct configfs_dirent *paren</div><div class='ctx'> 		return ERR_PTR(-ENOENT);</div><div class='ctx'> 	}</div><div class='ctx'> 	sd-&gt;s_frag = get_fragment(frag);</div><div class='del'>-	list_add(&amp;sd-&gt;s_sibling, &amp;parent_sd-&gt;s_children);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * configfs_lookup scans only for unpinned items. s_children is</div><div class='add'>+	 * partitioned so that configfs_lookup can bail out early.</div><div class='add'>+	 * CONFIGFS_PINNED and CONFIGFS_NOT_PINNED are not symmetrical.  readdir</div><div class='add'>+	 * cursors still need to be inserted at the front of the list.</div><div class='add'>+	 */</div><div class='add'>+	if (sd-&gt;s_type &amp; CONFIGFS_PINNED)</div><div class='add'>+		list_add_tail(&amp;sd-&gt;s_sibling, &amp;parent_sd-&gt;s_children);</div><div class='add'>+	else</div><div class='add'>+		list_add(&amp;sd-&gt;s_sibling, &amp;parent_sd-&gt;s_children);</div><div class='ctx'> 	spin_unlock(&amp;configfs_dirent_lock);</div><div class='ctx'> </div><div class='ctx'> 	return sd;</div><div class='hunk'>@@ -212,10 +229,11 @@ static struct configfs_dirent *configfs_new_dirent(struct configfs_dirent *paren</div><div class='ctx'>  *</div><div class='ctx'>  * called with parent inode's i_mutex held</div><div class='ctx'>  */</div><div class='del'>-static int configfs_dirent_exists(struct configfs_dirent *parent_sd,</div><div class='del'>-				  const unsigned char *new)</div><div class='add'>+static int configfs_dirent_exists(struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	struct configfs_dirent * sd;</div><div class='add'>+	struct configfs_dirent *parent_sd = dentry-&gt;d_parent-&gt;d_fsdata;</div><div class='add'>+	const unsigned char *new = dentry-&gt;d_name.name;</div><div class='add'>+	struct configfs_dirent *sd;</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(sd, &amp;parent_sd-&gt;s_children, s_sibling) {</div><div class='ctx'> 		if (sd-&gt;s_element) {</div><div class='hunk'>@@ -281,10 +299,6 @@ static int configfs_create_dir(struct config_item *item, struct dentry *dentry,</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(!item);</div><div class='ctx'> </div><div class='del'>-	error = configfs_dirent_exists(p-&gt;d_fsdata, dentry-&gt;d_name.name);</div><div class='del'>-	if (unlikely(error))</div><div class='del'>-		return error;</div><div class='del'>-</div><div class='ctx'> 	error = configfs_make_dirent(p-&gt;d_fsdata, dentry, item, mode,</div><div class='ctx'> 				     CONFIGFS_DIR | CONFIGFS_USET_CREATING,</div><div class='ctx'> 				     frag);</div><div class='hunk'>@@ -308,6 +322,7 @@ static int configfs_create_dir(struct config_item *item, struct dentry *dentry,</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> out_remove:</div><div class='add'>+	configfs_put(dentry-&gt;d_fsdata);</div><div class='ctx'> 	configfs_remove_dirent(dentry);</div><div class='ctx'> 	return PTR_ERR(inode);</div><div class='ctx'> }</div><div class='hunk'>@@ -374,6 +389,7 @@ int configfs_create_link(struct configfs_dirent *target, struct dentry *parent,</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> out_remove:</div><div class='add'>+	configfs_put(dentry-&gt;d_fsdata);</div><div class='ctx'> 	configfs_remove_dirent(dentry);</div><div class='ctx'> 	return PTR_ERR(inode);</div><div class='ctx'> }</div><div class='hunk'>@@ -384,8 +400,14 @@ static void remove_dir(struct dentry * d)</div><div class='ctx'> </div><div class='ctx'> 	configfs_remove_dirent(d);</div><div class='ctx'> </div><div class='del'>-	if (d_really_is_positive(d))</div><div class='del'>-		simple_rmdir(d_inode(parent),d);</div><div class='add'>+	if (d_really_is_positive(d)) {</div><div class='add'>+		if (likely(simple_empty(d))) {</div><div class='add'>+			__simple_rmdir(d_inode(parent),d);</div><div class='add'>+			dput(d);</div><div class='add'>+		} else {</div><div class='add'>+			pr_warn("remove_dir (%pd): attributes remain", d);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	pr_debug(" o %pd removing done (%d)\n", d, d_count(d));</div><div class='ctx'> </div><div class='hunk'>@@ -441,6 +463,18 @@ static struct dentry * configfs_lookup(struct inode *dir,</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;configfs_dirent_lock);</div><div class='ctx'> 	list_for_each_entry(sd, &amp;parent_sd-&gt;s_children, s_sibling) {</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * s_children is partitioned, see configfs_new_dirent. The first</div><div class='add'>+		 * pinned item indicates we can stop scanning.</div><div class='add'>+		 */</div><div class='add'>+		if (sd-&gt;s_type &amp; CONFIGFS_PINNED)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Note: CONFIGFS_PINNED and CONFIGFS_NOT_PINNED are asymmetric.</div><div class='add'>+		 * there may be a readdir cursor in this list</div><div class='add'>+		 */</div><div class='ctx'> 		if ((sd-&gt;s_type &amp; CONFIGFS_NOT_PINNED) &amp;&amp;</div><div class='ctx'> 		    !strcmp(configfs_get_name(sd), dentry-&gt;d_name.name)) {</div><div class='ctx'> 			struct configfs_attribute *attr = sd-&gt;s_element;</div><div class='hunk'>@@ -570,6 +604,7 @@ static void detach_attrs(struct config_item * item)</div><div class='ctx'> static int populate_attrs(struct config_item *item)</div><div class='ctx'> {</div><div class='ctx'> 	const struct config_item_type *t = item-&gt;ci_type;</div><div class='add'>+	const struct configfs_group_operations *ops;</div><div class='ctx'> 	struct configfs_attribute *attr;</div><div class='ctx'> 	struct configfs_bin_attribute *bin_attr;</div><div class='ctx'> 	int error = 0;</div><div class='hunk'>@@ -577,14 +612,23 @@ static int populate_attrs(struct config_item *item)</div><div class='ctx'> </div><div class='ctx'> 	if (!t)</div><div class='ctx'> 		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	ops = t-&gt;ct_group_ops;</div><div class='add'>+</div><div class='ctx'> 	if (t-&gt;ct_attrs) {</div><div class='ctx'> 		for (i = 0; (attr = t-&gt;ct_attrs[i]) != NULL; i++) {</div><div class='add'>+			if (ops &amp;&amp; ops-&gt;is_visible &amp;&amp; !ops-&gt;is_visible(item, attr, i))</div><div class='add'>+				continue;</div><div class='add'>+</div><div class='ctx'> 			if ((error = configfs_create_file(item, attr)))</div><div class='ctx'> 				break;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	if (t-&gt;ct_bin_attrs) {</div><div class='add'>+	if (!error &amp;&amp; t-&gt;ct_bin_attrs) {</div><div class='ctx'> 		for (i = 0; (bin_attr = t-&gt;ct_bin_attrs[i]) != NULL; i++) {</div><div class='add'>+			if (ops &amp;&amp; ops-&gt;is_bin_visible &amp;&amp; !ops-&gt;is_bin_visible(item, bin_attr, i))</div><div class='add'>+				continue;</div><div class='add'>+</div><div class='ctx'> 			error = configfs_create_bin_file(item, bin_attr);</div><div class='ctx'> 			if (error)</div><div class='ctx'> 				break;</div><div class='hunk'>@@ -931,7 +975,7 @@ static void configfs_dump_one(struct configfs_dirent *sd, int level)</div><div class='ctx'> {</div><div class='ctx'> 	pr_info("%*s\"%s\":\n", level, " ", configfs_get_name(sd));</div><div class='ctx'> </div><div class='del'>-#define type_print(_type) if (sd-&gt;s_type &amp; _type) pr_info("%*s %s\n", level, " ", #_type);</div><div class='add'>+#define type_print(_type) if (sd-&gt;s_type &amp; _type) pr_info("%*s %s\n", level, " ", #_type)</div><div class='ctx'> 	type_print(CONFIGFS_ROOT);</div><div class='ctx'> 	type_print(CONFIGFS_DIR);</div><div class='ctx'> 	type_print(CONFIGFS_ITEM_ATTR);</div><div class='hunk'>@@ -1241,8 +1285,8 @@ out_root_unlock:</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(configfs_depend_item_unlocked);</div><div class='ctx'> </div><div class='del'>-static int configfs_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-			  struct dentry *dentry, umode_t mode)</div><div class='add'>+static struct dentry *configfs_mkdir(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+				     struct dentry *dentry, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int module_got = 0;</div><div class='hunk'>@@ -1422,7 +1466,7 @@ out_put:</div><div class='ctx'> 	put_fragment(frag);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	return ret;</div><div class='add'>+	return ERR_PTR(ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int configfs_rmdir(struct inode *dir, struct dentry *dentry)</div><div class='hunk'>@@ -1563,10 +1607,7 @@ static int configfs_dir_open(struct inode *inode, struct file *file)</div><div class='ctx'> 	err = -ENOENT;</div><div class='ctx'> 	if (configfs_dirent_is_ready(parent_sd)) {</div><div class='ctx'> 		file-&gt;private_data = configfs_new_dirent(parent_sd, NULL, 0, NULL);</div><div class='del'>-		if (IS_ERR(file-&gt;private_data))</div><div class='del'>-			err = PTR_ERR(file-&gt;private_data);</div><div class='del'>-		else</div><div class='del'>-			err = 0;</div><div class='add'>+		err = PTR_ERR_OR_ZERO(file-&gt;private_data);</div><div class='ctx'> 	}</div><div class='ctx'> 	inode_unlock(d_inode(dentry));</div><div class='ctx'> </div><div class='hunk'>@@ -1589,12 +1630,6 @@ static int configfs_dir_close(struct inode *inode, struct file *file)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Relationship between s_mode and the DT_xxx types */</div><div class='del'>-static inline unsigned char dt_type(struct configfs_dirent *sd)</div><div class='del'>-{</div><div class='del'>-	return (sd-&gt;s_mode &gt;&gt; 12) &amp; 15;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int configfs_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dentry = file-&gt;f_path.dentry;</div><div class='hunk'>@@ -1644,7 +1679,8 @@ static int configfs_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 		name = configfs_get_name(next);</div><div class='ctx'> 		len = strlen(name);</div><div class='ctx'> </div><div class='del'>-		if (!dir_emit(ctx, name, len, ino, dt_type(next)))</div><div class='add'>+		if (!dir_emit(ctx, name, len, ino,</div><div class='add'>+			      fs_umode_to_dtype(next-&gt;s_mode)))</div><div class='ctx'> 			return 0;</div><div class='ctx'> </div><div class='ctx'> 		spin_lock(&amp;configfs_dirent_lock);</div><div class='hunk'>@@ -1780,8 +1816,8 @@ void configfs_unregister_group(struct config_group *group)</div><div class='ctx'> 	configfs_detach_group(&amp;group-&gt;cg_item);</div><div class='ctx'> 	d_inode(dentry)-&gt;i_flags |= S_DEAD;</div><div class='ctx'> 	dont_mount(dentry);</div><div class='add'>+	d_drop(dentry);</div><div class='ctx'> 	fsnotify_rmdir(d_inode(parent), dentry);</div><div class='del'>-	d_delete(dentry);</div><div class='ctx'> 	inode_unlock(d_inode(parent));</div><div class='ctx'> </div><div class='ctx'> 	dput(dentry);</div><div class='hunk'>@@ -1859,7 +1895,9 @@ int configfs_register_subsystem(struct configfs_subsystem *subsys)</div><div class='ctx'> 		group-&gt;cg_item.ci_name = group-&gt;cg_item.ci_namebuf;</div><div class='ctx'> </div><div class='ctx'> 	sd = root-&gt;d_fsdata;</div><div class='add'>+	mutex_lock(&amp;configfs_subsystem_mutex);</div><div class='ctx'> 	link_group(to_config_group(sd-&gt;s_element), group);</div><div class='add'>+	mutex_unlock(&amp;configfs_subsystem_mutex);</div><div class='ctx'> </div><div class='ctx'> 	inode_lock_nested(d_inode(root), I_MUTEX_PARENT);</div><div class='ctx'> </div><div class='hunk'>@@ -1868,8 +1906,11 @@ int configfs_register_subsystem(struct configfs_subsystem *subsys)</div><div class='ctx'> 	if (dentry) {</div><div class='ctx'> 		d_add(dentry, NULL);</div><div class='ctx'> </div><div class='del'>-		err = configfs_attach_group(sd-&gt;s_element, &amp;group-&gt;cg_item,</div><div class='del'>-					    dentry, frag);</div><div class='add'>+		err = configfs_dirent_exists(dentry);</div><div class='add'>+		if (!err)</div><div class='add'>+			err = configfs_attach_group(sd-&gt;s_element,</div><div class='add'>+						    &amp;group-&gt;cg_item,</div><div class='add'>+						    dentry, frag);</div><div class='ctx'> 		if (err) {</div><div class='ctx'> 			BUG_ON(d_inode(dentry));</div><div class='ctx'> 			d_drop(dentry);</div><div class='hunk'>@@ -1884,7 +1925,9 @@ int configfs_register_subsystem(struct configfs_subsystem *subsys)</div><div class='ctx'> 	inode_unlock(d_inode(root));</div><div class='ctx'> </div><div class='ctx'> 	if (err) {</div><div class='add'>+		mutex_lock(&amp;configfs_subsystem_mutex);</div><div class='ctx'> 		unlink_group(group);</div><div class='add'>+		mutex_unlock(&amp;configfs_subsystem_mutex);</div><div class='ctx'> 		configfs_release_fs();</div><div class='ctx'> 	}</div><div class='ctx'> 	put_fragment(frag);</div><div class='hunk'>@@ -1922,16 +1965,18 @@ void configfs_unregister_subsystem(struct configfs_subsystem *subsys)</div><div class='ctx'> 	configfs_detach_group(&amp;group-&gt;cg_item);</div><div class='ctx'> 	d_inode(dentry)-&gt;i_flags |= S_DEAD;</div><div class='ctx'> 	dont_mount(dentry);</div><div class='del'>-	fsnotify_rmdir(d_inode(root), dentry);</div><div class='ctx'> 	inode_unlock(d_inode(dentry));</div><div class='ctx'> </div><div class='del'>-	d_delete(dentry);</div><div class='add'>+	d_drop(dentry);</div><div class='add'>+	fsnotify_rmdir(d_inode(root), dentry);</div><div class='ctx'> </div><div class='ctx'> 	inode_unlock(d_inode(root));</div><div class='ctx'> </div><div class='ctx'> 	dput(dentry);</div><div class='ctx'> </div><div class='add'>+	mutex_lock(&amp;configfs_subsystem_mutex);</div><div class='ctx'> 	unlink_group(group);</div><div class='add'>+	mutex_unlock(&amp;configfs_subsystem_mutex);</div><div class='ctx'> 	configfs_release_fs();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/configfs/file.c b/fs/configfs/file.c<br/>index 0ad32150611e..affe4742bbb5 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/configfs/file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/configfs/file.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/configfs/file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/configfs/file.c</a></div><div class='hunk'>@@ -30,7 +30,7 @@ struct configfs_buffer {</div><div class='ctx'> 	size_t			count;</div><div class='ctx'> 	loff_t			pos;</div><div class='ctx'> 	char			* page;</div><div class='del'>-	struct configfs_item_operations	* ops;</div><div class='add'>+	const struct configfs_item_operations	*ops;</div><div class='ctx'> 	struct mutex		mutex;</div><div class='ctx'> 	int			needs_read_fill;</div><div class='ctx'> 	bool			read_in_progress;</div><div class='head'>diff --git a/fs/configfs/inode.c b/fs/configfs/inode.c<br/>index b601610e9907..bcda3372e141 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/configfs/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/configfs/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/configfs/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/configfs/inode.c</a></div><div class='hunk'>@@ -32,7 +32,7 @@ static const struct inode_operations configfs_inode_operations ={</div><div class='ctx'> 	.setattr	= configfs_setattr,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-int configfs_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='add'>+int configfs_setattr(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		     struct iattr *iattr)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode * inode = d_inode(dentry);</div><div class='hunk'>@@ -60,7 +60,7 @@ int configfs_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 	}</div><div class='ctx'> 	/* attributes were changed atleast once in past */</div><div class='ctx'> </div><div class='del'>-	error = simple_setattr(mnt_userns, dentry, iattr);</div><div class='add'>+	error = simple_setattr(idmap, dentry, iattr);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='hunk'>@@ -88,8 +88,7 @@ int configfs_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> static inline void set_default_inode_attr(struct inode * inode, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	inode-&gt;i_mode = mode;</div><div class='del'>-	inode-&gt;i_atime = inode-&gt;i_mtime =</div><div class='del'>-		inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	simple_inode_init_ts(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void set_inode_attr(struct inode * inode, struct iattr * iattr)</div><div class='hunk'>@@ -97,9 +96,9 @@ static inline void set_inode_attr(struct inode * inode, struct iattr * iattr)</div><div class='ctx'> 	inode-&gt;i_mode = iattr-&gt;ia_mode;</div><div class='ctx'> 	inode-&gt;i_uid = iattr-&gt;ia_uid;</div><div class='ctx'> 	inode-&gt;i_gid = iattr-&gt;ia_gid;</div><div class='del'>-	inode-&gt;i_atime = iattr-&gt;ia_atime;</div><div class='del'>-	inode-&gt;i_mtime = iattr-&gt;ia_mtime;</div><div class='del'>-	inode-&gt;i_ctime = iattr-&gt;ia_ctime;</div><div class='add'>+	inode_set_atime_to_ts(inode, iattr-&gt;ia_atime);</div><div class='add'>+	inode_set_mtime_to_ts(inode, iattr-&gt;ia_mtime);</div><div class='add'>+	inode_set_ctime_to_ts(inode, iattr-&gt;ia_ctime);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct inode *configfs_new_inode(umode_t mode, struct configfs_dirent *sd,</div><div class='hunk'>@@ -172,7 +171,7 @@ struct inode *configfs_create(struct dentry *dentry, umode_t mode)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='ctx'> 	p_inode = d_inode(dentry-&gt;d_parent);</div><div class='del'>-	p_inode-&gt;i_mtime = p_inode-&gt;i_ctime = current_time(p_inode);</div><div class='add'>+	inode_set_mtime_to_ts(p_inode, inode_set_ctime_current(p_inode));</div><div class='ctx'> 	configfs_set_inode_lock_class(sd, inode);</div><div class='ctx'> 	return inode;</div><div class='ctx'> }</div><div class='hunk'>@@ -212,33 +211,9 @@ void configfs_drop_dentry(struct configfs_dirent * sd, struct dentry * parent)</div><div class='ctx'> 			dget_dlock(dentry);</div><div class='ctx'> 			__d_drop(dentry);</div><div class='ctx'> 			spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='del'>-			simple_unlink(d_inode(parent), dentry);</div><div class='add'>+			__simple_unlink(d_inode(parent), dentry);</div><div class='add'>+			dput(dentry);</div><div class='ctx'> 		} else</div><div class='ctx'> 			spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='del'>-</div><div class='del'>-void configfs_hash_and_remove(struct dentry * dir, const char * name)</div><div class='del'>-{</div><div class='del'>-	struct configfs_dirent * sd;</div><div class='del'>-	struct configfs_dirent * parent_sd = dir-&gt;d_fsdata;</div><div class='del'>-</div><div class='del'>-	if (d_really_is_negative(dir))</div><div class='del'>-		/* no inode means this hasn't been made visible yet */</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	inode_lock(d_inode(dir));</div><div class='del'>-	list_for_each_entry(sd, &amp;parent_sd-&gt;s_children, s_sibling) {</div><div class='del'>-		if (!sd-&gt;s_element)</div><div class='del'>-			continue;</div><div class='del'>-		if (!strcmp(configfs_get_name(sd), name)) {</div><div class='del'>-			spin_lock(&amp;configfs_dirent_lock);</div><div class='del'>-			list_del_init(&amp;sd-&gt;s_sibling);</div><div class='del'>-			spin_unlock(&amp;configfs_dirent_lock);</div><div class='del'>-			configfs_drop_dentry(sd, dir);</div><div class='del'>-			configfs_put(sd);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	inode_unlock(d_inode(dir));</div><div class='del'>-}</div><div class='head'>diff --git a/fs/configfs/item.c b/fs/configfs/item.c<br/>index 254170a82aa3..c378b5cbf87d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/configfs/item.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/configfs/item.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/configfs/item.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/configfs/item.c</a></div><div class='hunk'>@@ -66,7 +66,7 @@ int config_item_set_name(struct config_item *item, const char *fmt, ...)</div><div class='ctx'> 		name = kvasprintf(GFP_KERNEL, fmt, args);</div><div class='ctx'> 		va_end(args);</div><div class='ctx'> 		if (!name)</div><div class='del'>-			return -EFAULT;</div><div class='add'>+			return -ENOMEM;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Free the old name, if necessary. */</div><div class='head'>diff --git a/fs/configfs/mount.c b/fs/configfs/mount.c<br/>index c2d820063ec4..4929f3431189 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/configfs/mount.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/configfs/mount.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/configfs/mount.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/configfs/mount.c</a></div><div class='hunk'>@@ -36,7 +36,7 @@ static void configfs_free_inode(struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> static const struct super_operations configfs_ops = {</div><div class='ctx'> 	.statfs		= simple_statfs,</div><div class='del'>-	.drop_inode	= generic_delete_inode,</div><div class='add'>+	.drop_inode	= inode_just_drop,</div><div class='ctx'> 	.free_inode	= configfs_free_inode,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -92,7 +92,8 @@ static int configfs_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> 	configfs_root_group.cg_item.ci_dentry = root;</div><div class='ctx'> 	root-&gt;d_fsdata = &amp;configfs_root;</div><div class='ctx'> 	sb-&gt;s_root = root;</div><div class='del'>-	sb-&gt;s_d_op = &amp;configfs_dentry_ops; /* the rest get that */</div><div class='add'>+	set_default_d_op(sb, &amp;configfs_dentry_ops); /* the rest get that */</div><div class='add'>+	sb-&gt;s_d_flags |= DCACHE_DONTCACHE;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -115,7 +116,7 @@ static struct file_system_type configfs_fs_type = {</div><div class='ctx'> 	.owner		= THIS_MODULE,</div><div class='ctx'> 	.name		= "configfs",</div><div class='ctx'> 	.init_fs_context = configfs_init_fs_context,</div><div class='del'>-	.kill_sb	= kill_litter_super,</div><div class='add'>+	.kill_sb	= kill_anon_super,</div><div class='ctx'> };</div><div class='ctx'> MODULE_ALIAS_FS("configfs");</div><div class='ctx'> </div><div class='head'>diff --git a/fs/configfs/symlink.c b/fs/configfs/symlink.c<br/>index 0623c3edcfb9..f3f79c67add5 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/configfs/symlink.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/configfs/symlink.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/configfs/symlink.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/configfs/symlink.c</a></div><div class='hunk'>@@ -114,34 +114,28 @@ static int create_link(struct config_item *parent_item,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> </div><div class='del'>-static int get_target(const char *symname, struct path *path,</div><div class='del'>-		      struct config_item **target, struct super_block *sb)</div><div class='add'>+static int get_target(const char *symname, struct config_item **target,</div><div class='add'>+		      struct super_block *sb)</div><div class='ctx'> {</div><div class='add'>+	struct path path __free(path_put) = {};</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = kern_path(symname, LOOKUP_FOLLOW|LOOKUP_DIRECTORY, path);</div><div class='del'>-	if (!ret) {</div><div class='del'>-		if (path-&gt;dentry-&gt;d_sb == sb) {</div><div class='del'>-			*target = configfs_get_config_item(path-&gt;dentry);</div><div class='del'>-			if (!*target) {</div><div class='del'>-				ret = -ENOENT;</div><div class='del'>-				path_put(path);</div><div class='del'>-			}</div><div class='del'>-		} else {</div><div class='del'>-			ret = -EPERM;</div><div class='del'>-			path_put(path);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='add'>+	ret = kern_path(symname, LOOKUP_FOLLOW|LOOKUP_DIRECTORY, &amp;path);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+	if (path.dentry-&gt;d_sb != sb)</div><div class='add'>+		return -EPERM;</div><div class='add'>+	*target = configfs_get_config_item(path.dentry);</div><div class='add'>+	if (!*target)</div><div class='add'>+		return -ENOENT;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> </div><div class='del'>-int configfs_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+int configfs_symlink(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		     struct dentry *dentry, const char *symname)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='del'>-	struct path path;</div><div class='ctx'> 	struct configfs_dirent *sd;</div><div class='ctx'> 	struct config_item *parent_item;</div><div class='ctx'> 	struct config_item *target_item = NULL;</div><div class='hunk'>@@ -188,7 +182,7 @@ int configfs_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	 *  AV, a thoroughly annoyed bastard.</div><div class='ctx'> 	 */</div><div class='ctx'> 	inode_unlock(dir);</div><div class='del'>-	ret = get_target(symname, &amp;path, &amp;target_item, dentry-&gt;d_sb);</div><div class='add'>+	ret = get_target(symname, &amp;target_item, dentry-&gt;d_sb);</div><div class='ctx'> 	inode_lock(dir);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out_put;</div><div class='hunk'>@@ -196,7 +190,7 @@ int configfs_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	if (dentry-&gt;d_inode || d_unhashed(dentry))</div><div class='ctx'> 		ret = -EEXIST;</div><div class='ctx'> 	else</div><div class='del'>-		ret = inode_permission(&amp;init_user_ns, dir,</div><div class='add'>+		ret = inode_permission(&amp;nop_mnt_idmap, dir,</div><div class='ctx'> 				       MAY_WRITE | MAY_EXEC);</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		ret = type-&gt;ct_item_ops-&gt;allow_link(parent_item, target_item);</div><div class='hunk'>@@ -210,7 +204,6 @@ int configfs_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	config_item_put(target_item);</div><div class='del'>-	path_put(&amp;path);</div><div class='ctx'> </div><div class='ctx'> out_put:</div><div class='ctx'> 	config_item_put(parent_item);</div><div class='head'>diff --git a/fs/coredump.c b/fs/coredump.c<br/>index a6b3c196cdef..8feb9c1cf83d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/coredump.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/coredump.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/coredump.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/coredump.c</a></div><div class='hunk'>@@ -18,6 +18,7 @@</div><div class='ctx'> #include &lt;linux/personality.h&gt;</div><div class='ctx'> #include &lt;linux/binfmts.h&gt;</div><div class='ctx'> #include &lt;linux/coredump.h&gt;</div><div class='add'>+#include &lt;linux/sort.h&gt;</div><div class='ctx'> #include &lt;linux/sched/coredump.h&gt;</div><div class='ctx'> #include &lt;linux/sched/signal.h&gt;</div><div class='ctx'> #include &lt;linux/sched/task_stack.h&gt;</div><div class='hunk'>@@ -31,7 +32,6 @@</div><div class='ctx'> #include &lt;linux/tsacct_kern.h&gt;</div><div class='ctx'> #include &lt;linux/cn_proc.h&gt;</div><div class='ctx'> #include &lt;linux/audit.h&gt;</div><div class='del'>-#include &lt;linux/tracehook.h&gt;</div><div class='ctx'> #include &lt;linux/kmod.h&gt;</div><div class='ctx'> #include &lt;linux/fsnotify.h&gt;</div><div class='ctx'> #include &lt;linux/fs_struct.h&gt;</div><div class='hunk'>@@ -41,6 +41,17 @@</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/path.h&gt;</div><div class='ctx'> #include &lt;linux/timekeeping.h&gt;</div><div class='add'>+#include &lt;linux/sysctl.h&gt;</div><div class='add'>+#include &lt;linux/elf.h&gt;</div><div class='add'>+#include &lt;linux/pidfs.h&gt;</div><div class='add'>+#include &lt;linux/net.h&gt;</div><div class='add'>+#include &lt;linux/socket.h&gt;</div><div class='add'>+#include &lt;net/af_unix.h&gt;</div><div class='add'>+#include &lt;net/net_namespace.h&gt;</div><div class='add'>+#include &lt;net/sock.h&gt;</div><div class='add'>+#include &lt;uapi/linux/pidfd.h&gt;</div><div class='add'>+#include &lt;uapi/linux/un.h&gt;</div><div class='add'>+#include &lt;uapi/linux/coredump.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/uaccess.h&gt;</div><div class='ctx'> #include &lt;asm/mmu_context.h&gt;</div><div class='hunk'>@@ -52,21 +63,49 @@</div><div class='ctx'> </div><div class='ctx'> #include &lt;trace/events/sched.h&gt;</div><div class='ctx'> </div><div class='del'>-int core_uses_pid;</div><div class='del'>-unsigned int core_pipe_limit;</div><div class='del'>-char core_pattern[CORENAME_MAX_SIZE] = "core";</div><div class='add'>+static bool dump_vma_snapshot(struct coredump_params *cprm);</div><div class='add'>+static void free_vma_snapshot(struct coredump_params *cprm);</div><div class='add'>+</div><div class='add'>+#define CORE_FILE_NOTE_SIZE_DEFAULT (4*1024*1024)</div><div class='add'>+/* Define a reasonable max cap */</div><div class='add'>+#define CORE_FILE_NOTE_SIZE_MAX (16*1024*1024)</div><div class='add'>+/*</div><div class='add'>+ * File descriptor number for the pidfd for the thread-group leader of</div><div class='add'>+ * the coredumping task installed into the usermode helper's file</div><div class='add'>+ * descriptor table.</div><div class='add'>+ */</div><div class='add'>+#define COREDUMP_PIDFD_NUMBER 3</div><div class='add'>+</div><div class='add'>+static int core_uses_pid;</div><div class='add'>+static unsigned int core_pipe_limit;</div><div class='add'>+static unsigned int core_sort_vma;</div><div class='add'>+static char core_pattern[CORENAME_MAX_SIZE] = "core";</div><div class='ctx'> static int core_name_size = CORENAME_MAX_SIZE;</div><div class='add'>+unsigned int core_file_note_size_limit = CORE_FILE_NOTE_SIZE_DEFAULT;</div><div class='add'>+static atomic_t core_pipe_count = ATOMIC_INIT(0);</div><div class='add'>+</div><div class='add'>+enum coredump_type_t {</div><div class='add'>+	COREDUMP_FILE		= 1,</div><div class='add'>+	COREDUMP_PIPE		= 2,</div><div class='add'>+	COREDUMP_SOCK		= 3,</div><div class='add'>+	COREDUMP_SOCK_REQ	= 4,</div><div class='add'>+};</div><div class='ctx'> </div><div class='ctx'> struct core_name {</div><div class='ctx'> 	char *corename;</div><div class='ctx'> 	int used, size;</div><div class='add'>+	unsigned int core_pipe_limit;</div><div class='add'>+	bool core_dumped;</div><div class='add'>+	enum coredump_type_t core_type;</div><div class='add'>+	u64 mask;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/* The maximal length of core_pattern is also specified in sysctl.c */</div><div class='del'>-</div><div class='ctx'> static int expand_corename(struct core_name *cn, int size)</div><div class='ctx'> {</div><div class='del'>-	char *corename = krealloc(cn-&gt;corename, size, GFP_KERNEL);</div><div class='add'>+	char *corename;</div><div class='add'>+</div><div class='add'>+	size = kmalloc_size_roundup(size);</div><div class='add'>+	corename = krealloc(cn-&gt;corename, size, GFP_KERNEL);</div><div class='ctx'> </div><div class='ctx'> 	if (!corename)</div><div class='ctx'> 		return -ENOMEM;</div><div class='hunk'>@@ -74,7 +113,7 @@ static int expand_corename(struct core_name *cn, int size)</div><div class='ctx'> 	if (size &gt; core_name_size) /* racy but harmless */</div><div class='ctx'> 		core_name_size = size;</div><div class='ctx'> </div><div class='del'>-	cn-&gt;size = ksize(corename);</div><div class='add'>+	cn-&gt;size = size;</div><div class='ctx'> 	cn-&gt;corename = corename;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -189,35 +228,104 @@ put_exe_file:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* format_corename will inspect the pattern parameter, and output a</div><div class='del'>- * name into corename, which must have space for at least</div><div class='del'>- * CORENAME_MAX_SIZE bytes plus one byte for the zero terminator.</div><div class='add'>+/*</div><div class='add'>+ * coredump_parse will inspect the pattern parameter, and output a name</div><div class='add'>+ * into corename, which must have space for at least CORENAME_MAX_SIZE</div><div class='add'>+ * bytes plus one byte for the zero terminator.</div><div class='ctx'>  */</div><div class='del'>-static int format_corename(struct core_name *cn, struct coredump_params *cprm,</div><div class='add'>+static bool coredump_parse(struct core_name *cn, struct coredump_params *cprm,</div><div class='ctx'> 			   size_t **argv, int *argc)</div><div class='ctx'> {</div><div class='ctx'> 	const struct cred *cred = current_cred();</div><div class='ctx'> 	const char *pat_ptr = core_pattern;</div><div class='del'>-	int ispipe = (*pat_ptr == '|');</div><div class='ctx'> 	bool was_space = false;</div><div class='ctx'> 	int pid_in_pattern = 0;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='add'>+	cn-&gt;mask = COREDUMP_KERNEL;</div><div class='add'>+	if (core_pipe_limit)</div><div class='add'>+		cn-&gt;mask |= COREDUMP_WAIT;</div><div class='ctx'> 	cn-&gt;used = 0;</div><div class='ctx'> 	cn-&gt;corename = NULL;</div><div class='add'>+	cn-&gt;core_pipe_limit = 0;</div><div class='add'>+	cn-&gt;core_dumped = false;</div><div class='add'>+	if (*pat_ptr == '|')</div><div class='add'>+		cn-&gt;core_type = COREDUMP_PIPE;</div><div class='add'>+	else if (*pat_ptr == '@')</div><div class='add'>+		cn-&gt;core_type = COREDUMP_SOCK;</div><div class='add'>+	else</div><div class='add'>+		cn-&gt;core_type = COREDUMP_FILE;</div><div class='ctx'> 	if (expand_corename(cn, core_name_size))</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+		return false;</div><div class='ctx'> 	cn-&gt;corename[0] = '\0';</div><div class='ctx'> </div><div class='del'>-	if (ispipe) {</div><div class='add'>+	switch (cn-&gt;core_type) {</div><div class='add'>+	case COREDUMP_PIPE: {</div><div class='ctx'> 		int argvs = sizeof(core_pattern) / 2;</div><div class='ctx'> 		(*argv) = kmalloc_array(argvs, sizeof(**argv), GFP_KERNEL);</div><div class='ctx'> 		if (!(*argv))</div><div class='del'>-			return -ENOMEM;</div><div class='add'>+			return false;</div><div class='ctx'> 		(*argv)[(*argc)++] = 0;</div><div class='ctx'> 		++pat_ptr;</div><div class='ctx'> 		if (!(*pat_ptr))</div><div class='del'>-			return -ENOMEM;</div><div class='add'>+			return false;</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+	case COREDUMP_SOCK: {</div><div class='add'>+		/* skip the @ */</div><div class='add'>+		pat_ptr++;</div><div class='add'>+		if (!(*pat_ptr))</div><div class='add'>+			return false;</div><div class='add'>+		if (*pat_ptr == '@') {</div><div class='add'>+			pat_ptr++;</div><div class='add'>+			if (!(*pat_ptr))</div><div class='add'>+				return false;</div><div class='add'>+</div><div class='add'>+			cn-&gt;core_type = COREDUMP_SOCK_REQ;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		err = cn_printf(cn, "%s", pat_ptr);</div><div class='add'>+		if (err)</div><div class='add'>+			return false;</div><div class='add'>+</div><div class='add'>+		/* Require absolute paths. */</div><div class='add'>+		if (cn-&gt;corename[0] != '/')</div><div class='add'>+			return false;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Ensure we can uses spaces to indicate additional</div><div class='add'>+		 * parameters in the future.</div><div class='add'>+		 */</div><div class='add'>+		if (strchr(cn-&gt;corename, ' ')) {</div><div class='add'>+			coredump_report_failure("Coredump socket may not %s contain spaces", cn-&gt;corename);</div><div class='add'>+			return false;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* Must not contain ".." in the path. */</div><div class='add'>+		if (name_contains_dotdot(cn-&gt;corename)) {</div><div class='add'>+			coredump_report_failure("Coredump socket may not %s contain '..' spaces", cn-&gt;corename);</div><div class='add'>+			return false;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (strlen(cn-&gt;corename) &gt;= UNIX_PATH_MAX) {</div><div class='add'>+			coredump_report_failure("Coredump socket path %s too long", cn-&gt;corename);</div><div class='add'>+			return false;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Currently no need to parse any other options.</div><div class='add'>+		 * Relevant information can be retrieved from the peer</div><div class='add'>+		 * pidfd retrievable via SO_PEERPIDFD by the receiver or</div><div class='add'>+		 * via /proc/&lt;pid&gt;, using the SO_PEERPIDFD to guard</div><div class='add'>+		 * against pid recycling when opening /proc/&lt;pid&gt;.</div><div class='add'>+		 */</div><div class='add'>+		return true;</div><div class='add'>+	}</div><div class='add'>+	case COREDUMP_FILE:</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		WARN_ON_ONCE(true);</div><div class='add'>+		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Repeat as long as we have more pattern to process and more output</div><div class='hunk'>@@ -227,7 +335,7 @@ static int format_corename(struct core_name *cn, struct coredump_params *cprm,</div><div class='ctx'> 		 * Split on spaces before doing template expansion so that</div><div class='ctx'> 		 * %e and %E don't get split if they have spaces in them</div><div class='ctx'> 		 */</div><div class='del'>-		if (ispipe) {</div><div class='add'>+		if (cn-&gt;core_type == COREDUMP_PIPE) {</div><div class='ctx'> 			if (isspace(*pat_ptr)) {</div><div class='ctx'> 				if (cn-&gt;used != 0)</div><div class='ctx'> 					was_space = true;</div><div class='hunk'>@@ -237,7 +345,7 @@ static int format_corename(struct core_name *cn, struct coredump_params *cprm,</div><div class='ctx'> 				was_space = false;</div><div class='ctx'> 				err = cn_printf(cn, "%c", '\0');</div><div class='ctx'> 				if (err)</div><div class='del'>-					return err;</div><div class='add'>+					return false;</div><div class='ctx'> 				(*argv)[(*argc)++] = cn-&gt;used;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='hunk'>@@ -323,6 +431,31 @@ static int format_corename(struct core_name *cn, struct coredump_params *cprm,</div><div class='ctx'> 				err = cn_printf(cn, "%lu",</div><div class='ctx'> 					      rlimit(RLIMIT_CORE));</div><div class='ctx'> 				break;</div><div class='add'>+			/* CPU the task ran on */</div><div class='add'>+			case 'C':</div><div class='add'>+				err = cn_printf(cn, "%d", cprm-&gt;cpu);</div><div class='add'>+				break;</div><div class='add'>+			/* pidfd number */</div><div class='add'>+			case 'F': {</div><div class='add'>+				/*</div><div class='add'>+				 * Installing a pidfd only makes sense if</div><div class='add'>+				 * we actually spawn a usermode helper.</div><div class='add'>+				 */</div><div class='add'>+				if (cn-&gt;core_type != COREDUMP_PIPE)</div><div class='add'>+					break;</div><div class='add'>+</div><div class='add'>+				/*</div><div class='add'>+				 * Note that we'll install a pidfd for the</div><div class='add'>+				 * thread-group leader. We know that task</div><div class='add'>+				 * linkage hasn't been removed yet and even if</div><div class='add'>+				 * this @current isn't the actual thread-group</div><div class='add'>+				 * leader we know that the thread-group leader</div><div class='add'>+				 * cannot be reaped until @current has exited.</div><div class='add'>+				 */</div><div class='add'>+				cprm-&gt;pid = task_tgid(current);</div><div class='add'>+				err = cn_printf(cn, "%d", COREDUMP_PIDFD_NUMBER);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='ctx'> 			default:</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -330,7 +463,7 @@ static int format_corename(struct core_name *cn, struct coredump_params *cprm,</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (err)</div><div class='del'>-			return err;</div><div class='add'>+			return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='hunk'>@@ -339,25 +472,22 @@ out:</div><div class='ctx'> 	 * If core_pattern does not include a %p (as is the default)</div><div class='ctx'> 	 * and core_uses_pid is set, then .%pid will be appended to</div><div class='ctx'> 	 * the filename. Do not do this for piped commands. */</div><div class='del'>-	if (!ispipe &amp;&amp; !pid_in_pattern &amp;&amp; core_uses_pid) {</div><div class='del'>-		err = cn_printf(cn, ".%d", task_tgid_vnr(current));</div><div class='del'>-		if (err)</div><div class='del'>-			return err;</div><div class='del'>-	}</div><div class='del'>-	return ispipe;</div><div class='add'>+	if (cn-&gt;core_type == COREDUMP_FILE &amp;&amp; !pid_in_pattern &amp;&amp; core_uses_pid)</div><div class='add'>+		return cn_printf(cn, ".%d", task_tgid_vnr(current)) == 0;</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int zap_process(struct task_struct *start, int exit_code, int flags)</div><div class='add'>+static int zap_process(struct signal_struct *signal, int exit_code)</div><div class='ctx'> {</div><div class='ctx'> 	struct task_struct *t;</div><div class='ctx'> 	int nr = 0;</div><div class='ctx'> </div><div class='del'>-	/* ignore all signals except SIGKILL, see prepare_signal() */</div><div class='del'>-	start-&gt;signal-&gt;flags = SIGNAL_GROUP_COREDUMP | flags;</div><div class='del'>-	start-&gt;signal-&gt;group_exit_code = exit_code;</div><div class='del'>-	start-&gt;signal-&gt;group_stop_count = 0;</div><div class='add'>+	signal-&gt;flags = SIGNAL_GROUP_EXIT;</div><div class='add'>+	signal-&gt;group_exit_code = exit_code;</div><div class='add'>+	signal-&gt;group_stop_count = 0;</div><div class='ctx'> </div><div class='del'>-	for_each_thread(start, t) {</div><div class='add'>+	__for_each_thread(signal, t) {</div><div class='ctx'> 		task_clear_jobctl_pending(t, JOBCTL_PENDING_MASK);</div><div class='ctx'> 		if (t != current &amp;&amp; !(t-&gt;flags &amp; PF_POSTCOREDUMP)) {</div><div class='ctx'> 			sigaddset(&amp;t-&gt;pending.signal, SIGKILL);</div><div class='hunk'>@@ -372,13 +502,14 @@ static int zap_process(struct task_struct *start, int exit_code, int flags)</div><div class='ctx'> static int zap_threads(struct task_struct *tsk,</div><div class='ctx'> 			struct core_state *core_state, int exit_code)</div><div class='ctx'> {</div><div class='add'>+	struct signal_struct *signal = tsk-&gt;signal;</div><div class='ctx'> 	int nr = -EAGAIN;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock_irq(&amp;tsk-&gt;sighand-&gt;siglock);</div><div class='del'>-	if (!signal_group_exit(tsk-&gt;signal)) {</div><div class='del'>-		tsk-&gt;signal-&gt;core_state = core_state;</div><div class='del'>-		tsk-&gt;signal-&gt;group_exit_task = tsk;</div><div class='del'>-		nr = zap_process(tsk, exit_code, 0);</div><div class='add'>+	if (!(signal-&gt;flags &amp; SIGNAL_GROUP_EXIT) &amp;&amp; !signal-&gt;group_exec_task) {</div><div class='add'>+		/* Allow SIGKILL, see prepare_signal() */</div><div class='add'>+		signal-&gt;core_state = core_state;</div><div class='add'>+		nr = zap_process(signal, exit_code);</div><div class='ctx'> 		clear_tsk_thread_flag(tsk, TIF_SIGPENDING);</div><div class='ctx'> 		tsk-&gt;flags |= PF_DUMPCORE;</div><div class='ctx'> 		atomic_set(&amp;core_state-&gt;nr_threads, nr);</div><div class='hunk'>@@ -400,9 +531,8 @@ static int coredump_wait(int exit_code, struct core_state *core_state)</div><div class='ctx'> 	if (core_waiters &gt; 0) {</div><div class='ctx'> 		struct core_thread *ptr;</div><div class='ctx'> </div><div class='del'>-		freezer_do_not_count();</div><div class='del'>-		wait_for_completion(&amp;core_state-&gt;startup);</div><div class='del'>-		freezer_count();</div><div class='add'>+		wait_for_completion_state(&amp;core_state-&gt;startup,</div><div class='add'>+					  TASK_UNINTERRUPTIBLE|TASK_FREEZABLE);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Wait for all the threads to become inactive, so that</div><div class='ctx'> 		 * all the thread context (extended register state, like</div><div class='hunk'>@@ -410,7 +540,7 @@ static int coredump_wait(int exit_code, struct core_state *core_state)</div><div class='ctx'> 		 */</div><div class='ctx'> 		ptr = core_state-&gt;dumper.next;</div><div class='ctx'> 		while (ptr != NULL) {</div><div class='del'>-			wait_task_inactive(ptr-&gt;task, 0);</div><div class='add'>+			wait_task_inactive(ptr-&gt;task, TASK_ANY);</div><div class='ctx'> 			ptr = ptr-&gt;next;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -426,8 +556,6 @@ static void coredump_finish(bool core_dumped)</div><div class='ctx'> 	spin_lock_irq(&amp;current-&gt;sighand-&gt;siglock);</div><div class='ctx'> 	if (core_dumped &amp;&amp; !__fatal_signal_pending(current))</div><div class='ctx'> 		current-&gt;signal-&gt;group_exit_code |= 0x80;</div><div class='del'>-	current-&gt;signal-&gt;group_exit_task = NULL;</div><div class='del'>-	current-&gt;signal-&gt;flags = SIGNAL_GROUP_EXIT;</div><div class='ctx'> 	next = current-&gt;signal-&gt;core_state-&gt;dumper.next;</div><div class='ctx'> 	current-&gt;signal-&gt;core_state = NULL;</div><div class='ctx'> 	spin_unlock_irq(&amp;current-&gt;sighand-&gt;siglock);</div><div class='hunk'>@@ -480,7 +608,7 @@ static void wait_for_dump_helpers(struct file *file)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * umh_pipe_setup</div><div class='add'>+ * umh_coredump_setup</div><div class='ctx'>  * helper function to customize the process used</div><div class='ctx'>  * to collect the core in userspace.  Specifically</div><div class='ctx'>  * it sets up a pipe and installs it as fd 0 (stdin)</div><div class='hunk'>@@ -490,11 +618,34 @@ static void wait_for_dump_helpers(struct file *file)</div><div class='ctx'>  * is a special value that we use to trap recursive</div><div class='ctx'>  * core dumps</div><div class='ctx'>  */</div><div class='del'>-static int umh_pipe_setup(struct subprocess_info *info, struct cred *new)</div><div class='add'>+static int umh_coredump_setup(struct subprocess_info *info, struct cred *new)</div><div class='ctx'> {</div><div class='ctx'> 	struct file *files[2];</div><div class='ctx'> 	struct coredump_params *cp = (struct coredump_params *)info-&gt;data;</div><div class='del'>-	int err = create_pipe_files(files, 0);</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	if (cp-&gt;pid) {</div><div class='add'>+		struct file *pidfs_file __free(fput) = NULL;</div><div class='add'>+</div><div class='add'>+		pidfs_file = pidfs_alloc_file(cp-&gt;pid, 0);</div><div class='add'>+		if (IS_ERR(pidfs_file))</div><div class='add'>+			return PTR_ERR(pidfs_file);</div><div class='add'>+</div><div class='add'>+		pidfs_coredump(cp);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Usermode helpers are childen of either</div><div class='add'>+		 * system_dfl_wq or of kthreadd. So we know that</div><div class='add'>+		 * we're starting off with a clean file descriptor</div><div class='add'>+		 * table. So we should always be able to use</div><div class='add'>+		 * COREDUMP_PIDFD_NUMBER as our file descriptor value.</div><div class='add'>+		 */</div><div class='add'>+		err = replace_fd(COREDUMP_PIDFD_NUMBER, pidfs_file, 0);</div><div class='add'>+		if (err &lt; 0)</div><div class='add'>+			return err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	err = create_pipe_files(files, 0);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='hunk'>@@ -502,282 +653,552 @@ static int umh_pipe_setup(struct subprocess_info *info, struct cred *new)</div><div class='ctx'> </div><div class='ctx'> 	err = replace_fd(0, files[0], 0);</div><div class='ctx'> 	fput(files[0]);</div><div class='add'>+	if (err &lt; 0)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='ctx'> 	/* and disallow core files too */</div><div class='ctx'> 	current-&gt;signal-&gt;rlim[RLIMIT_CORE] = (struct rlimit){1, 1};</div><div class='ctx'> </div><div class='del'>-	return err;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void do_coredump(const kernel_siginfo_t *siginfo)</div><div class='add'>+#ifdef CONFIG_UNIX</div><div class='add'>+static bool coredump_sock_connect(struct core_name *cn, struct coredump_params *cprm)</div><div class='ctx'> {</div><div class='del'>-	struct core_state core_state;</div><div class='del'>-	struct core_name cn;</div><div class='del'>-	struct mm_struct *mm = current-&gt;mm;</div><div class='del'>-	struct linux_binfmt * binfmt;</div><div class='del'>-	const struct cred *old_cred;</div><div class='del'>-	struct cred *cred;</div><div class='del'>-	int retval = 0;</div><div class='del'>-	int ispipe;</div><div class='del'>-	size_t *argv = NULL;</div><div class='del'>-	int argc = 0;</div><div class='del'>-	/* require nonrelative corefile path and be extra careful */</div><div class='del'>-	bool need_suid_safe = false;</div><div class='del'>-	bool core_dumped = false;</div><div class='del'>-	static atomic_t core_dump_count = ATOMIC_INIT(0);</div><div class='del'>-	struct coredump_params cprm = {</div><div class='del'>-		.siginfo = siginfo,</div><div class='del'>-		.regs = signal_pt_regs(),</div><div class='del'>-		.limit = rlimit(RLIMIT_CORE),</div><div class='del'>-		/*</div><div class='del'>-		 * We must use the same mm-&gt;flags while dumping core to avoid</div><div class='del'>-		 * inconsistency of bit flags, since this flag is not protected</div><div class='del'>-		 * by any locks.</div><div class='del'>-		 */</div><div class='del'>-		.mm_flags = mm-&gt;flags,</div><div class='add'>+	struct file *file __free(fput) = NULL;</div><div class='add'>+	struct sockaddr_un addr = {</div><div class='add'>+		.sun_family = AF_UNIX,</div><div class='ctx'> 	};</div><div class='add'>+	ssize_t addr_len;</div><div class='add'>+	int retval;</div><div class='add'>+	struct socket *socket;</div><div class='ctx'> </div><div class='del'>-	audit_core_dumps(siginfo-&gt;si_signo);</div><div class='add'>+	addr_len = strscpy(addr.sun_path, cn-&gt;corename);</div><div class='add'>+	if (addr_len &lt; 0)</div><div class='add'>+		return false;</div><div class='add'>+	addr_len += offsetof(struct sockaddr_un, sun_path) + 1;</div><div class='ctx'> </div><div class='del'>-	binfmt = mm-&gt;binfmt;</div><div class='del'>-	if (!binfmt || !binfmt-&gt;core_dump)</div><div class='del'>-		goto fail;</div><div class='del'>-	if (!__get_dumpable(cprm.mm_flags))</div><div class='del'>-		goto fail;</div><div class='add'>+	/*</div><div class='add'>+	 * It is possible that the userspace process which is supposed</div><div class='add'>+	 * to handle the coredump and is listening on the AF_UNIX socket</div><div class='add'>+	 * coredumps. Userspace should just mark itself non dumpable.</div><div class='add'>+	 */</div><div class='add'>+</div><div class='add'>+	retval = sock_create_kern(&amp;init_net, AF_UNIX, SOCK_STREAM, 0, &amp;socket);</div><div class='add'>+	if (retval &lt; 0)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	file = sock_alloc_file(socket, 0, NULL);</div><div class='add'>+	if (IS_ERR(file))</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-	cred = prepare_creds();</div><div class='del'>-	if (!cred)</div><div class='del'>-		goto fail;</div><div class='ctx'> 	/*</div><div class='del'>-	 * We cannot trust fsuid as being the "true" uid of the process</div><div class='del'>-	 * nor do we know its entire history. We only know it was tainted</div><div class='del'>-	 * so we dump it as root in mode 2, and only into a controlled</div><div class='del'>-	 * environment (pipe handler or fully qualified path).</div><div class='add'>+	 * Set the thread-group leader pid which is used for the peer</div><div class='add'>+	 * credentials during connect() below. Then immediately register</div><div class='add'>+	 * it in pidfs...</div><div class='add'>+	 */</div><div class='add'>+	cprm-&gt;pid = task_tgid(current);</div><div class='add'>+	retval = pidfs_register_pid(cprm-&gt;pid);</div><div class='add'>+	if (retval)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * ... and set the coredump information so userspace has it</div><div class='add'>+	 * available after connect()...</div><div class='ctx'> 	 */</div><div class='del'>-	if (__get_dumpable(cprm.mm_flags) == SUID_DUMP_ROOT) {</div><div class='del'>-		/* Setuid core dump mode */</div><div class='del'>-		cred-&gt;fsuid = GLOBAL_ROOT_UID;	/* Dump root private */</div><div class='del'>-		need_suid_safe = true;</div><div class='add'>+	pidfs_coredump(cprm);</div><div class='add'>+</div><div class='add'>+	retval = kernel_connect(socket, (struct sockaddr_unsized *)(&amp;addr), addr_len,</div><div class='add'>+				O_NONBLOCK | SOCK_COREDUMP);</div><div class='add'>+</div><div class='add'>+	if (retval) {</div><div class='add'>+		if (retval == -EAGAIN)</div><div class='add'>+			coredump_report_failure("Coredump socket %s receive queue full", addr.sun_path);</div><div class='add'>+		else</div><div class='add'>+			coredump_report_failure("Coredump socket connection %s failed %d", addr.sun_path, retval);</div><div class='add'>+		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	retval = coredump_wait(siginfo-&gt;si_signo, &amp;core_state);</div><div class='del'>-	if (retval &lt; 0)</div><div class='del'>-		goto fail_creds;</div><div class='add'>+	/* ... and validate that @sk_peer_pid matches @cprm.pid. */</div><div class='add'>+	if (WARN_ON_ONCE(unix_peer(socket-&gt;sk)-&gt;sk_peer_pid != cprm-&gt;pid))</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-	old_cred = override_creds(cred);</div><div class='add'>+	cprm-&gt;limit = RLIM_INFINITY;</div><div class='add'>+	cprm-&gt;file = no_free_ptr(file);</div><div class='ctx'> </div><div class='del'>-	ispipe = format_corename(&amp;cn, &amp;cprm, &amp;argv, &amp;argc);</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if (ispipe) {</div><div class='del'>-		int argi;</div><div class='del'>-		int dump_count;</div><div class='del'>-		char **helper_argv;</div><div class='del'>-		struct subprocess_info *sub_info;</div><div class='add'>+static inline bool coredump_sock_recv(struct file *file, struct coredump_ack *ack, size_t size, int flags)</div><div class='add'>+{</div><div class='add'>+	struct msghdr msg = {};</div><div class='add'>+	struct kvec iov = { .iov_base = ack, .iov_len = size };</div><div class='add'>+	ssize_t ret;</div><div class='ctx'> </div><div class='del'>-		if (ispipe &lt; 0) {</div><div class='del'>-			printk(KERN_WARNING "format_corename failed\n");</div><div class='del'>-			printk(KERN_WARNING "Aborting core\n");</div><div class='del'>-			goto fail_unlock;</div><div class='del'>-		}</div><div class='add'>+	memset(ack, 0, size);</div><div class='add'>+	ret = kernel_recvmsg(sock_from_file(file), &amp;msg, &amp;iov, 1, size, flags);</div><div class='add'>+	return ret == size;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		if (cprm.limit == 1) {</div><div class='del'>-			/* See umh_pipe_setup() which sets RLIMIT_CORE = 1.</div><div class='del'>-			 *</div><div class='del'>-			 * Normally core limits are irrelevant to pipes, since</div><div class='del'>-			 * we're not writing to the file system, but we use</div><div class='del'>-			 * cprm.limit of 1 here as a special value, this is a</div><div class='del'>-			 * consistent way to catch recursive crashes.</div><div class='del'>-			 * We can still crash if the core_pattern binary sets</div><div class='del'>-			 * RLIM_CORE = !1, but it runs as root, and can do</div><div class='del'>-			 * lots of stupid things.</div><div class='del'>-			 *</div><div class='del'>-			 * Note that we use task_tgid_vnr here to grab the pid</div><div class='del'>-			 * of the process group leader.  That way we get the</div><div class='del'>-			 * right pid if a thread in a multi-threaded</div><div class='del'>-			 * core_pattern process dies.</div><div class='del'>-			 */</div><div class='del'>-			printk(KERN_WARNING</div><div class='del'>-				"Process %d(%s) has RLIMIT_CORE set to 1\n",</div><div class='del'>-				task_tgid_vnr(current), current-&gt;comm);</div><div class='del'>-			printk(KERN_WARNING "Aborting core\n");</div><div class='del'>-			goto fail_unlock;</div><div class='del'>-		}</div><div class='del'>-		cprm.limit = RLIM_INFINITY;</div><div class='del'>-</div><div class='del'>-		dump_count = atomic_inc_return(&amp;core_dump_count);</div><div class='del'>-		if (core_pipe_limit &amp;&amp; (core_pipe_limit &lt; dump_count)) {</div><div class='del'>-			printk(KERN_WARNING "Pid %d(%s) over core_pipe_limit\n",</div><div class='del'>-			       task_tgid_vnr(current), current-&gt;comm);</div><div class='del'>-			printk(KERN_WARNING "Skipping core dump\n");</div><div class='del'>-			goto fail_dropcount;</div><div class='del'>-		}</div><div class='add'>+static inline bool coredump_sock_send(struct file *file, struct coredump_req *req)</div><div class='add'>+{</div><div class='add'>+	struct msghdr msg = { .msg_flags = MSG_NOSIGNAL };</div><div class='add'>+	struct kvec iov = { .iov_base = req, .iov_len = sizeof(*req) };</div><div class='add'>+	ssize_t ret;</div><div class='ctx'> </div><div class='del'>-		helper_argv = kmalloc_array(argc + 1, sizeof(*helper_argv),</div><div class='del'>-					    GFP_KERNEL);</div><div class='del'>-		if (!helper_argv) {</div><div class='del'>-			printk(KERN_WARNING "%s failed to allocate memory\n",</div><div class='del'>-			       __func__);</div><div class='del'>-			goto fail_dropcount;</div><div class='del'>-		}</div><div class='del'>-		for (argi = 0; argi &lt; argc; argi++)</div><div class='del'>-			helper_argv[argi] = cn.corename + argv[argi];</div><div class='del'>-		helper_argv[argi] = NULL;</div><div class='del'>-</div><div class='del'>-		retval = -ENOMEM;</div><div class='del'>-		sub_info = call_usermodehelper_setup(helper_argv[0],</div><div class='del'>-						helper_argv, NULL, GFP_KERNEL,</div><div class='del'>-						umh_pipe_setup, NULL, &amp;cprm);</div><div class='del'>-		if (sub_info)</div><div class='del'>-			retval = call_usermodehelper_exec(sub_info,</div><div class='del'>-							  UMH_WAIT_EXEC);</div><div class='del'>-</div><div class='del'>-		kfree(helper_argv);</div><div class='del'>-		if (retval) {</div><div class='del'>-			printk(KERN_INFO "Core dump to |%s pipe failed\n",</div><div class='del'>-			       cn.corename);</div><div class='del'>-			goto close_fail;</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-		struct user_namespace *mnt_userns;</div><div class='del'>-		struct inode *inode;</div><div class='del'>-		int open_flags = O_CREAT | O_RDWR | O_NOFOLLOW |</div><div class='del'>-				 O_LARGEFILE | O_EXCL;</div><div class='del'>-</div><div class='del'>-		if (cprm.limit &lt; binfmt-&gt;min_coredump)</div><div class='del'>-			goto fail_unlock;</div><div class='del'>-</div><div class='del'>-		if (need_suid_safe &amp;&amp; cn.corename[0] != '/') {</div><div class='del'>-			printk(KERN_WARNING "Pid %d(%s) can only dump core "\</div><div class='del'>-				"to fully qualified path!\n",</div><div class='del'>-				task_tgid_vnr(current), current-&gt;comm);</div><div class='del'>-			printk(KERN_WARNING "Skipping core dump\n");</div><div class='del'>-			goto fail_unlock;</div><div class='del'>-		}</div><div class='add'>+	ret = kernel_sendmsg(sock_from_file(file), &amp;msg, &amp;iov, 1, sizeof(*req));</div><div class='add'>+	return ret == sizeof(*req);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * Unlink the file if it exists unless this is a SUID</div><div class='del'>-		 * binary - in that case, we're running around with root</div><div class='del'>-		 * privs and don't want to unlink another user's coredump.</div><div class='del'>-		 */</div><div class='del'>-		if (!need_suid_safe) {</div><div class='del'>-			/*</div><div class='del'>-			 * If it doesn't exist, that's fine. If there's some</div><div class='del'>-			 * other problem, we'll catch it at the filp_open().</div><div class='del'>-			 */</div><div class='del'>-			do_unlinkat(AT_FDCWD, getname_kernel(cn.corename));</div><div class='del'>-		}</div><div class='add'>+static_assert(sizeof(enum coredump_mark) == sizeof(__u32));</div><div class='add'>+</div><div class='add'>+static inline bool coredump_sock_mark(struct file *file, enum coredump_mark mark)</div><div class='add'>+{</div><div class='add'>+	struct msghdr msg = { .msg_flags = MSG_NOSIGNAL };</div><div class='add'>+	struct kvec iov = { .iov_base = &amp;mark, .iov_len = sizeof(mark) };</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	ret = kernel_sendmsg(sock_from_file(file), &amp;msg, &amp;iov, 1, sizeof(mark));</div><div class='add'>+	return ret == sizeof(mark);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void coredump_sock_wait(struct file *file)</div><div class='add'>+{</div><div class='add'>+	ssize_t n;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We use a simple read to wait for the coredump processing to</div><div class='add'>+	 * finish. Either the socket is closed or we get sent unexpected</div><div class='add'>+	 * data. In both cases, we're done.</div><div class='add'>+	 */</div><div class='add'>+	n = __kernel_read(file, &amp;(char){ 0 }, 1, NULL);</div><div class='add'>+	if (n &gt; 0)</div><div class='add'>+		coredump_report_failure("Coredump socket had unexpected data");</div><div class='add'>+	else if (n &lt; 0)</div><div class='add'>+		coredump_report_failure("Coredump socket failed");</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void coredump_sock_shutdown(struct file *file)</div><div class='add'>+{</div><div class='add'>+	struct socket *socket;</div><div class='add'>+</div><div class='add'>+	socket = sock_from_file(file);</div><div class='add'>+	if (!socket)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/* Let userspace know we're done processing the coredump. */</div><div class='add'>+	kernel_sock_shutdown(socket, SHUT_WR);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool coredump_sock_request(struct core_name *cn, struct coredump_params *cprm)</div><div class='add'>+{</div><div class='add'>+	struct coredump_req req = {</div><div class='add'>+		.size		= sizeof(struct coredump_req),</div><div class='add'>+		.mask		= COREDUMP_KERNEL | COREDUMP_USERSPACE |</div><div class='add'>+				  COREDUMP_REJECT | COREDUMP_WAIT,</div><div class='add'>+		.size_ack	= sizeof(struct coredump_ack),</div><div class='add'>+	};</div><div class='add'>+	struct coredump_ack ack = {};</div><div class='add'>+	ssize_t usize;</div><div class='add'>+</div><div class='add'>+	if (cn-&gt;core_type != COREDUMP_SOCK_REQ)</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	/* Let userspace know what we support. */</div><div class='add'>+	if (!coredump_sock_send(cprm-&gt;file, &amp;req))</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='add'>+	/* Peek the size of the coredump_ack. */</div><div class='add'>+	if (!coredump_sock_recv(cprm-&gt;file, &amp;ack, sizeof(ack.size),</div><div class='add'>+				MSG_PEEK | MSG_WAITALL))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/* Refuse unknown coredump_ack sizes. */</div><div class='add'>+	usize = ack.size;</div><div class='add'>+	if (usize &lt; COREDUMP_ACK_SIZE_VER0) {</div><div class='add'>+		coredump_sock_mark(cprm-&gt;file, COREDUMP_MARK_MINSIZE);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (usize &gt; sizeof(ack)) {</div><div class='add'>+		coredump_sock_mark(cprm-&gt;file, COREDUMP_MARK_MAXSIZE);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Now retrieve the coredump_ack. */</div><div class='add'>+	if (!coredump_sock_recv(cprm-&gt;file, &amp;ack, usize, MSG_WAITALL))</div><div class='add'>+		return false;</div><div class='add'>+	if (ack.size != usize)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/* Refuse unknown coredump_ack flags. */</div><div class='add'>+	if (ack.mask &amp; ~req.mask) {</div><div class='add'>+		coredump_sock_mark(cprm-&gt;file, COREDUMP_MARK_UNSUPPORTED);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Refuse mutually exclusive options. */</div><div class='add'>+	if (hweight64(ack.mask &amp; (COREDUMP_USERSPACE | COREDUMP_KERNEL |</div><div class='add'>+				  COREDUMP_REJECT)) != 1) {</div><div class='add'>+		coredump_sock_mark(cprm-&gt;file, COREDUMP_MARK_CONFLICTING);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (ack.spare) {</div><div class='add'>+		coredump_sock_mark(cprm-&gt;file, COREDUMP_MARK_UNSUPPORTED);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	cn-&gt;mask = ack.mask;</div><div class='add'>+	return coredump_sock_mark(cprm-&gt;file, COREDUMP_MARK_REQACK);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool coredump_socket(struct core_name *cn, struct coredump_params *cprm)</div><div class='add'>+{</div><div class='add'>+	if (!coredump_sock_connect(cn, cprm))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	return coredump_sock_request(cn, cprm);</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+static inline void coredump_sock_wait(struct file *file) { }</div><div class='add'>+static inline void coredump_sock_shutdown(struct file *file) { }</div><div class='add'>+static inline bool coredump_socket(struct core_name *cn, struct coredump_params *cprm) { return false; }</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+/* cprm-&gt;mm_flags contains a stable snapshot of dumpability flags. */</div><div class='add'>+static inline bool coredump_force_suid_safe(const struct coredump_params *cprm)</div><div class='add'>+{</div><div class='add'>+	/* Require nonrelative corefile path and be extra careful. */</div><div class='add'>+	return __get_dumpable(cprm-&gt;mm_flags) == SUID_DUMP_ROOT;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool coredump_file(struct core_name *cn, struct coredump_params *cprm,</div><div class='add'>+			  const struct linux_binfmt *binfmt)</div><div class='add'>+{</div><div class='add'>+	struct mnt_idmap *idmap;</div><div class='add'>+	struct inode *inode;</div><div class='add'>+	struct file *file __free(fput) = NULL;</div><div class='add'>+	int open_flags = O_CREAT | O_WRONLY | O_NOFOLLOW | O_LARGEFILE | O_EXCL;</div><div class='add'>+</div><div class='add'>+	if (cprm-&gt;limit &lt; binfmt-&gt;min_coredump)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	if (coredump_force_suid_safe(cprm) &amp;&amp; cn-&gt;corename[0] != '/') {</div><div class='add'>+		coredump_report_failure("this process can only dump core to a fully qualified path, skipping core dump");</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Unlink the file if it exists unless this is a SUID</div><div class='add'>+	 * binary - in that case, we're running around with root</div><div class='add'>+	 * privs and don't want to unlink another user's coredump.</div><div class='add'>+	 */</div><div class='add'>+	if (!coredump_force_suid_safe(cprm)) {</div><div class='ctx'> 		/*</div><div class='del'>-		 * There is a race between unlinking and creating the</div><div class='del'>-		 * file, but if that causes an EEXIST here, that's</div><div class='del'>-		 * fine - another process raced with us while creating</div><div class='del'>-		 * the corefile, and the other process won. To userspace,</div><div class='del'>-		 * what matters is that at least one of the two processes</div><div class='del'>-		 * writes its coredump successfully, not which one.</div><div class='add'>+		 * If it doesn't exist, that's fine. If there's some</div><div class='add'>+		 * other problem, we'll catch it at the filp_open().</div><div class='ctx'> 		 */</div><div class='del'>-		if (need_suid_safe) {</div><div class='del'>-			/*</div><div class='del'>-			 * Using user namespaces, normal user tasks can change</div><div class='del'>-			 * their current-&gt;fs-&gt;root to point to arbitrary</div><div class='del'>-			 * directories. Since the intention of the "only dump</div><div class='del'>-			 * with a fully qualified path" rule is to control where</div><div class='del'>-			 * coredumps may be placed using root privileges,</div><div class='del'>-			 * current-&gt;fs-&gt;root must not be used. Instead, use the</div><div class='del'>-			 * root directory of init_task.</div><div class='del'>-			 */</div><div class='del'>-			struct path root;</div><div class='del'>-</div><div class='del'>-			task_lock(&amp;init_task);</div><div class='del'>-			get_fs_root(init_task.fs, &amp;root);</div><div class='del'>-			task_unlock(&amp;init_task);</div><div class='del'>-			cprm.file = file_open_root(&amp;root, cn.corename,</div><div class='del'>-						   open_flags, 0600);</div><div class='del'>-			path_put(&amp;root);</div><div class='del'>-		} else {</div><div class='del'>-			cprm.file = filp_open(cn.corename, open_flags, 0600);</div><div class='del'>-		}</div><div class='del'>-		if (IS_ERR(cprm.file))</div><div class='del'>-			goto fail_unlock;</div><div class='del'>-</div><div class='del'>-		inode = file_inode(cprm.file);</div><div class='del'>-		if (inode-&gt;i_nlink &gt; 1)</div><div class='del'>-			goto close_fail;</div><div class='del'>-		if (d_unhashed(cprm.file-&gt;f_path.dentry))</div><div class='del'>-			goto close_fail;</div><div class='add'>+		do_unlinkat(AT_FDCWD, getname_kernel(cn-&gt;corename));</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * There is a race between unlinking and creating the</div><div class='add'>+	 * file, but if that causes an EEXIST here, that's</div><div class='add'>+	 * fine - another process raced with us while creating</div><div class='add'>+	 * the corefile, and the other process won. To userspace,</div><div class='add'>+	 * what matters is that at least one of the two processes</div><div class='add'>+	 * writes its coredump successfully, not which one.</div><div class='add'>+	 */</div><div class='add'>+	if (coredump_force_suid_safe(cprm)) {</div><div class='ctx'> 		/*</div><div class='del'>-		 * AK: actually i see no reason to not allow this for named</div><div class='del'>-		 * pipes etc, but keep the previous behaviour for now.</div><div class='add'>+		 * Using user namespaces, normal user tasks can change</div><div class='add'>+		 * their current-&gt;fs-&gt;root to point to arbitrary</div><div class='add'>+		 * directories. Since the intention of the "only dump</div><div class='add'>+		 * with a fully qualified path" rule is to control where</div><div class='add'>+		 * coredumps may be placed using root privileges,</div><div class='add'>+		 * current-&gt;fs-&gt;root must not be used. Instead, use the</div><div class='add'>+		 * root directory of init_task.</div><div class='ctx'> 		 */</div><div class='del'>-		if (!S_ISREG(inode-&gt;i_mode))</div><div class='del'>-			goto close_fail;</div><div class='del'>-		/*</div><div class='del'>-		 * Don't dump core if the filesystem changed owner or mode</div><div class='del'>-		 * of the file during file creation. This is an issue when</div><div class='del'>-		 * a process dumps core while its cwd is e.g. on a vfat</div><div class='del'>-		 * filesystem.</div><div class='add'>+		struct path root;</div><div class='add'>+</div><div class='add'>+		task_lock(&amp;init_task);</div><div class='add'>+		get_fs_root(init_task.fs, &amp;root);</div><div class='add'>+		task_unlock(&amp;init_task);</div><div class='add'>+		file = file_open_root(&amp;root, cn-&gt;corename, open_flags, 0600);</div><div class='add'>+		path_put(&amp;root);</div><div class='add'>+	} else {</div><div class='add'>+		file = filp_open(cn-&gt;corename, open_flags, 0600);</div><div class='add'>+	}</div><div class='add'>+	if (IS_ERR(file))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	inode = file_inode(file);</div><div class='add'>+	if (inode-&gt;i_nlink &gt; 1)</div><div class='add'>+		return false;</div><div class='add'>+	if (d_unhashed(file-&gt;f_path.dentry))</div><div class='add'>+		return false;</div><div class='add'>+	/*</div><div class='add'>+	 * AK: actually i see no reason to not allow this for named</div><div class='add'>+	 * pipes etc, but keep the previous behaviour for now.</div><div class='add'>+	 */</div><div class='add'>+	if (!S_ISREG(inode-&gt;i_mode))</div><div class='add'>+		return false;</div><div class='add'>+	/*</div><div class='add'>+	 * Don't dump core if the filesystem changed owner or mode</div><div class='add'>+	 * of the file during file creation. This is an issue when</div><div class='add'>+	 * a process dumps core while its cwd is e.g. on a vfat</div><div class='add'>+	 * filesystem.</div><div class='add'>+	 */</div><div class='add'>+	idmap = file_mnt_idmap(file);</div><div class='add'>+	if (!vfsuid_eq_kuid(i_uid_into_vfsuid(idmap, inode), current_fsuid())) {</div><div class='add'>+		coredump_report_failure("Core dump to %s aborted: cannot preserve file owner", cn-&gt;corename);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+	if ((inode-&gt;i_mode &amp; 0677) != 0600) {</div><div class='add'>+		coredump_report_failure("Core dump to %s aborted: cannot preserve file permissions", cn-&gt;corename);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+	if (!(file-&gt;f_mode &amp; FMODE_CAN_WRITE))</div><div class='add'>+		return false;</div><div class='add'>+	if (do_truncate(idmap, file-&gt;f_path.dentry, 0, 0, file))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	cprm-&gt;file = no_free_ptr(file);</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool coredump_pipe(struct core_name *cn, struct coredump_params *cprm,</div><div class='add'>+			  size_t *argv, int argc)</div><div class='add'>+{</div><div class='add'>+	int argi;</div><div class='add'>+	char **helper_argv __free(kfree) = NULL;</div><div class='add'>+	struct subprocess_info *sub_info;</div><div class='add'>+</div><div class='add'>+	if (cprm-&gt;limit == 1) {</div><div class='add'>+		/* See umh_coredump_setup() which sets RLIMIT_CORE = 1.</div><div class='add'>+		 *</div><div class='add'>+		 * Normally core limits are irrelevant to pipes, since</div><div class='add'>+		 * we're not writing to the file system, but we use</div><div class='add'>+		 * cprm.limit of 1 here as a special value, this is a</div><div class='add'>+		 * consistent way to catch recursive crashes.</div><div class='add'>+		 * We can still crash if the core_pattern binary sets</div><div class='add'>+		 * RLIM_CORE = !1, but it runs as root, and can do</div><div class='add'>+		 * lots of stupid things.</div><div class='add'>+		 *</div><div class='add'>+		 * Note that we use task_tgid_vnr here to grab the pid</div><div class='add'>+		 * of the process group leader.  That way we get the</div><div class='add'>+		 * right pid if a thread in a multi-threaded</div><div class='add'>+		 * core_pattern process dies.</div><div class='ctx'> 		 */</div><div class='del'>-		mnt_userns = file_mnt_user_ns(cprm.file);</div><div class='del'>-		if (!uid_eq(i_uid_into_mnt(mnt_userns, inode),</div><div class='del'>-			    current_fsuid())) {</div><div class='del'>-			pr_info_ratelimited("Core dump to %s aborted: cannot preserve file owner\n",</div><div class='del'>-					    cn.corename);</div><div class='del'>-			goto close_fail;</div><div class='del'>-		}</div><div class='del'>-		if ((inode-&gt;i_mode &amp; 0677) != 0600) {</div><div class='del'>-			pr_info_ratelimited("Core dump to %s aborted: cannot preserve file permissions\n",</div><div class='del'>-					    cn.corename);</div><div class='del'>-			goto close_fail;</div><div class='del'>-		}</div><div class='del'>-		if (!(cprm.file-&gt;f_mode &amp; FMODE_CAN_WRITE))</div><div class='del'>-			goto close_fail;</div><div class='del'>-		if (do_truncate(mnt_userns, cprm.file-&gt;f_path.dentry,</div><div class='del'>-				0, 0, cprm.file))</div><div class='del'>-			goto close_fail;</div><div class='add'>+		coredump_report_failure("RLIMIT_CORE is set to 1, aborting core");</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+	cprm-&gt;limit = RLIM_INFINITY;</div><div class='add'>+</div><div class='add'>+	cn-&gt;core_pipe_limit = atomic_inc_return(&amp;core_pipe_count);</div><div class='add'>+	if (core_pipe_limit &amp;&amp; (core_pipe_limit &lt; cn-&gt;core_pipe_limit)) {</div><div class='add'>+		coredump_report_failure("over core_pipe_limit, skipping core dump");</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	helper_argv = kmalloc_array(argc + 1, sizeof(*helper_argv), GFP_KERNEL);</div><div class='add'>+	if (!helper_argv) {</div><div class='add'>+		coredump_report_failure("%s failed to allocate memory", __func__);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+	for (argi = 0; argi &lt; argc; argi++)</div><div class='add'>+		helper_argv[argi] = cn-&gt;corename + argv[argi];</div><div class='add'>+	helper_argv[argi] = NULL;</div><div class='add'>+</div><div class='add'>+	sub_info = call_usermodehelper_setup(helper_argv[0], helper_argv, NULL,</div><div class='add'>+					     GFP_KERNEL, umh_coredump_setup,</div><div class='add'>+					     NULL, cprm);</div><div class='add'>+	if (!sub_info)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	if (call_usermodehelper_exec(sub_info, UMH_WAIT_EXEC)) {</div><div class='add'>+		coredump_report_failure("|%s pipe failed", cn-&gt;corename);</div><div class='add'>+		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * umh disabled with CONFIG_STATIC_USERMODEHELPER_PATH="" would</div><div class='add'>+	 * have this set to NULL.</div><div class='add'>+	 */</div><div class='add'>+	if (!cprm-&gt;file) {</div><div class='add'>+		coredump_report_failure("Core dump to |%s disabled", cn-&gt;corename);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool coredump_write(struct core_name *cn,</div><div class='add'>+			  struct coredump_params *cprm,</div><div class='add'>+			  const struct linux_binfmt *binfmt)</div><div class='add'>+{</div><div class='add'>+</div><div class='add'>+	if (dump_interrupted())</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	if (!dump_vma_snapshot(cprm))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	file_start_write(cprm-&gt;file);</div><div class='add'>+	cn-&gt;core_dumped = binfmt-&gt;core_dump(cprm);</div><div class='add'>+	/*</div><div class='add'>+	 * Ensures that file size is big enough to contain the current</div><div class='add'>+	 * file postion. This prevents gdb from complaining about</div><div class='add'>+	 * a truncated file if the last "write" to the file was</div><div class='add'>+	 * dump_skip.</div><div class='add'>+	 */</div><div class='add'>+	if (cprm-&gt;to_skip) {</div><div class='add'>+		cprm-&gt;to_skip--;</div><div class='add'>+		dump_emit(cprm, "", 1);</div><div class='add'>+	}</div><div class='add'>+	file_end_write(cprm-&gt;file);</div><div class='add'>+	free_vma_snapshot(cprm);</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void coredump_cleanup(struct core_name *cn, struct coredump_params *cprm)</div><div class='add'>+{</div><div class='add'>+	if (cprm-&gt;file)</div><div class='add'>+		filp_close(cprm-&gt;file, NULL);</div><div class='add'>+	if (cn-&gt;core_pipe_limit) {</div><div class='add'>+		VFS_WARN_ON_ONCE(cn-&gt;core_type != COREDUMP_PIPE);</div><div class='add'>+		atomic_dec(&amp;core_pipe_count);</div><div class='add'>+	}</div><div class='add'>+	kfree(cn-&gt;corename);</div><div class='add'>+	coredump_finish(cn-&gt;core_dumped);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool coredump_skip(const struct coredump_params *cprm,</div><div class='add'>+				 const struct linux_binfmt *binfmt)</div><div class='add'>+{</div><div class='add'>+	if (!binfmt)</div><div class='add'>+		return true;</div><div class='add'>+	if (!binfmt-&gt;core_dump)</div><div class='add'>+		return true;</div><div class='add'>+	if (!__get_dumpable(cprm-&gt;mm_flags))</div><div class='add'>+		return true;</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void do_coredump(struct core_name *cn, struct coredump_params *cprm,</div><div class='add'>+			size_t **argv, int *argc, const struct linux_binfmt *binfmt)</div><div class='add'>+{</div><div class='add'>+	if (!coredump_parse(cn, cprm, argv, argc)) {</div><div class='add'>+		coredump_report_failure("format_corename failed, aborting core");</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	switch (cn-&gt;core_type) {</div><div class='add'>+	case COREDUMP_FILE:</div><div class='add'>+		if (!coredump_file(cn, cprm, binfmt))</div><div class='add'>+			return;</div><div class='add'>+		break;</div><div class='add'>+	case COREDUMP_PIPE:</div><div class='add'>+		if (!coredump_pipe(cn, cprm, *argv, *argc))</div><div class='add'>+			return;</div><div class='add'>+		break;</div><div class='add'>+	case COREDUMP_SOCK_REQ:</div><div class='add'>+		fallthrough;</div><div class='add'>+	case COREDUMP_SOCK:</div><div class='add'>+		if (!coredump_socket(cn, cprm))</div><div class='add'>+			return;</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		WARN_ON_ONCE(true);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Don't even generate the coredump. */</div><div class='add'>+	if (cn-&gt;mask &amp; COREDUMP_REJECT)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='ctx'> 	/* get us an unshared descriptor table; almost always a no-op */</div><div class='ctx'> 	/* The cell spufs coredump code reads the file descriptor tables */</div><div class='del'>-	retval = unshare_files();</div><div class='del'>-	if (retval)</div><div class='del'>-		goto close_fail;</div><div class='del'>-	if (!dump_interrupted()) {</div><div class='del'>-		/*</div><div class='del'>-		 * umh disabled with CONFIG_STATIC_USERMODEHELPER_PATH="" would</div><div class='del'>-		 * have this set to NULL.</div><div class='del'>-		 */</div><div class='del'>-		if (!cprm.file) {</div><div class='del'>-			pr_info("Core dump to |%s disabled\n", cn.corename);</div><div class='del'>-			goto close_fail;</div><div class='add'>+	if (unshare_files())</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if ((cn-&gt;mask &amp; COREDUMP_KERNEL) &amp;&amp; !coredump_write(cn, cprm, binfmt))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	coredump_sock_shutdown(cprm-&gt;file);</div><div class='add'>+</div><div class='add'>+	/* Let the parent know that a coredump was generated. */</div><div class='add'>+	if (cn-&gt;mask &amp; COREDUMP_USERSPACE)</div><div class='add'>+		cn-&gt;core_dumped = true;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * When core_pipe_limit is set we wait for the coredump server</div><div class='add'>+	 * or usermodehelper to finish before exiting so it can e.g.,</div><div class='add'>+	 * inspect /proc/&lt;pid&gt;.</div><div class='add'>+	 */</div><div class='add'>+	if (cn-&gt;mask &amp; COREDUMP_WAIT) {</div><div class='add'>+		switch (cn-&gt;core_type) {</div><div class='add'>+		case COREDUMP_PIPE:</div><div class='add'>+			wait_for_dump_helpers(cprm-&gt;file);</div><div class='add'>+			break;</div><div class='add'>+		case COREDUMP_SOCK_REQ:</div><div class='add'>+			fallthrough;</div><div class='add'>+		case COREDUMP_SOCK:</div><div class='add'>+			coredump_sock_wait(cprm-&gt;file);</div><div class='add'>+			break;</div><div class='add'>+		default:</div><div class='add'>+			break;</div><div class='ctx'> 		}</div><div class='del'>-		file_start_write(cprm.file);</div><div class='del'>-		core_dumped = binfmt-&gt;core_dump(&amp;cprm);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void vfs_coredump(const kernel_siginfo_t *siginfo)</div><div class='add'>+{</div><div class='add'>+	size_t *argv __free(kfree) = NULL;</div><div class='add'>+	struct core_state core_state;</div><div class='add'>+	struct core_name cn;</div><div class='add'>+	const struct mm_struct *mm = current-&gt;mm;</div><div class='add'>+	const struct linux_binfmt *binfmt = mm-&gt;binfmt;</div><div class='add'>+	int argc = 0;</div><div class='add'>+	struct coredump_params cprm = {</div><div class='add'>+		.siginfo = siginfo,</div><div class='add'>+		.limit = rlimit(RLIMIT_CORE),</div><div class='ctx'> 		/*</div><div class='del'>-		 * Ensures that file size is big enough to contain the current</div><div class='del'>-		 * file postion. This prevents gdb from complaining about</div><div class='del'>-		 * a truncated file if the last "write" to the file was</div><div class='del'>-		 * dump_skip.</div><div class='add'>+		 * We must use the same mm-&gt;flags while dumping core to avoid</div><div class='add'>+		 * inconsistency of bit flags, since this flag is not protected</div><div class='add'>+		 * by any locks.</div><div class='add'>+		 *</div><div class='add'>+		 * Note that we only care about MMF_DUMP* flags.</div><div class='ctx'> 		 */</div><div class='del'>-		if (cprm.to_skip) {</div><div class='del'>-			cprm.to_skip--;</div><div class='del'>-			dump_emit(&amp;cprm, "", 1);</div><div class='del'>-		}</div><div class='del'>-		file_end_write(cprm.file);</div><div class='del'>-	}</div><div class='del'>-	if (ispipe &amp;&amp; core_pipe_limit)</div><div class='del'>-		wait_for_dump_helpers(cprm.file);</div><div class='del'>-close_fail:</div><div class='del'>-	if (cprm.file)</div><div class='del'>-		filp_close(cprm.file, NULL);</div><div class='del'>-fail_dropcount:</div><div class='del'>-	if (ispipe)</div><div class='del'>-		atomic_dec(&amp;core_dump_count);</div><div class='del'>-fail_unlock:</div><div class='del'>-	kfree(argv);</div><div class='del'>-	kfree(cn.corename);</div><div class='del'>-	coredump_finish(core_dumped);</div><div class='del'>-	revert_creds(old_cred);</div><div class='del'>-fail_creds:</div><div class='del'>-	put_cred(cred);</div><div class='del'>-fail:</div><div class='add'>+		.mm_flags = __mm_flags_get_dumpable(mm),</div><div class='add'>+		.vma_meta = NULL,</div><div class='add'>+		.cpu = raw_smp_processor_id(),</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+	audit_core_dumps(siginfo-&gt;si_signo);</div><div class='add'>+</div><div class='add'>+	if (coredump_skip(&amp;cprm, binfmt))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	CLASS(prepare_creds, cred)();</div><div class='add'>+	if (!cred)</div><div class='add'>+		return;</div><div class='add'>+	/*</div><div class='add'>+	 * We cannot trust fsuid as being the "true" uid of the process</div><div class='add'>+	 * nor do we know its entire history. We only know it was tainted</div><div class='add'>+	 * so we dump it as root in mode 2, and only into a controlled</div><div class='add'>+	 * environment (pipe handler or fully qualified path).</div><div class='add'>+	 */</div><div class='add'>+	if (coredump_force_suid_safe(&amp;cprm))</div><div class='add'>+		cred-&gt;fsuid = GLOBAL_ROOT_UID;</div><div class='add'>+</div><div class='add'>+	if (coredump_wait(siginfo-&gt;si_signo, &amp;core_state) &lt; 0)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	scoped_with_creds(cred)</div><div class='add'>+		do_coredump(&amp;cn, &amp;cprm, &amp;argv, &amp;argc, binfmt);</div><div class='add'>+	coredump_cleanup(&amp;cn, &amp;cprm);</div><div class='ctx'> 	return;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -791,10 +1212,9 @@ static int __dump_emit(struct coredump_params *cprm, const void *addr, int nr)</div><div class='ctx'> 	struct file *file = cprm-&gt;file;</div><div class='ctx'> 	loff_t pos = file-&gt;f_pos;</div><div class='ctx'> 	ssize_t n;</div><div class='add'>+</div><div class='ctx'> 	if (cprm-&gt;written + nr &gt; cprm-&gt;limit)</div><div class='ctx'> 		return 0;</div><div class='del'>-</div><div class='del'>-</div><div class='ctx'> 	if (dump_interrupted())</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	n = __kernel_write(file, addr, nr, &amp;pos);</div><div class='hunk'>@@ -811,20 +1231,21 @@ static int __dump_skip(struct coredump_params *cprm, size_t nr)</div><div class='ctx'> {</div><div class='ctx'> 	static char zeroes[PAGE_SIZE];</div><div class='ctx'> 	struct file *file = cprm-&gt;file;</div><div class='del'>-	if (file-&gt;f_op-&gt;llseek &amp;&amp; file-&gt;f_op-&gt;llseek != no_llseek) {</div><div class='del'>-		if (dump_interrupted() ||</div><div class='del'>-		    file-&gt;f_op-&gt;llseek(file, nr, SEEK_CUR) &lt; 0)</div><div class='add'>+</div><div class='add'>+	if (file-&gt;f_mode &amp; FMODE_LSEEK) {</div><div class='add'>+		if (dump_interrupted() || vfs_llseek(file, nr, SEEK_CUR) &lt; 0)</div><div class='ctx'> 			return 0;</div><div class='ctx'> 		cprm-&gt;pos += nr;</div><div class='ctx'> 		return 1;</div><div class='del'>-	} else {</div><div class='del'>-		while (nr &gt; PAGE_SIZE) {</div><div class='del'>-			if (!__dump_emit(cprm, zeroes, PAGE_SIZE))</div><div class='del'>-				return 0;</div><div class='del'>-			nr -= PAGE_SIZE;</div><div class='del'>-		}</div><div class='del'>-		return __dump_emit(cprm, zeroes, nr);</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	while (nr &gt; PAGE_SIZE) {</div><div class='add'>+		if (!__dump_emit(cprm, zeroes, PAGE_SIZE))</div><div class='add'>+			return 0;</div><div class='add'>+		nr -= PAGE_SIZE;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return __dump_emit(cprm, zeroes, nr);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int dump_emit(struct coredump_params *cprm, const void *addr, int nr)</div><div class='hunk'>@@ -851,14 +1272,89 @@ void dump_skip(struct coredump_params *cprm, size_t nr)</div><div class='ctx'> EXPORT_SYMBOL(dump_skip);</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_ELF_CORE</div><div class='add'>+static int dump_emit_page(struct coredump_params *cprm, struct page *page)</div><div class='add'>+{</div><div class='add'>+	struct bio_vec bvec;</div><div class='add'>+	struct iov_iter iter;</div><div class='add'>+	struct file *file = cprm-&gt;file;</div><div class='add'>+	loff_t pos;</div><div class='add'>+	ssize_t n;</div><div class='add'>+</div><div class='add'>+	if (!page)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if (cprm-&gt;to_skip) {</div><div class='add'>+		if (!__dump_skip(cprm, cprm-&gt;to_skip))</div><div class='add'>+			return 0;</div><div class='add'>+		cprm-&gt;to_skip = 0;</div><div class='add'>+	}</div><div class='add'>+	if (cprm-&gt;written + PAGE_SIZE &gt; cprm-&gt;limit)</div><div class='add'>+		return 0;</div><div class='add'>+	if (dump_interrupted())</div><div class='add'>+		return 0;</div><div class='add'>+	pos = file-&gt;f_pos;</div><div class='add'>+	bvec_set_page(&amp;bvec, page, PAGE_SIZE, 0);</div><div class='add'>+	iov_iter_bvec(&amp;iter, ITER_SOURCE, &amp;bvec, 1, PAGE_SIZE);</div><div class='add'>+	n = __kernel_write_iter(cprm-&gt;file, &amp;iter, &amp;pos);</div><div class='add'>+	if (n != PAGE_SIZE)</div><div class='add'>+		return 0;</div><div class='add'>+	file-&gt;f_pos = pos;</div><div class='add'>+	cprm-&gt;written += PAGE_SIZE;</div><div class='add'>+	cprm-&gt;pos += PAGE_SIZE;</div><div class='add'>+</div><div class='add'>+	return 1;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * If we might get machine checks from kernel accesses during the</div><div class='add'>+ * core dump, let's get those errors early rather than during the</div><div class='add'>+ * IO. This is not performance-critical enough to warrant having</div><div class='add'>+ * all the machine check logic in the iovec paths.</div><div class='add'>+ */</div><div class='add'>+#ifdef copy_mc_to_kernel</div><div class='add'>+</div><div class='add'>+#define dump_page_alloc() alloc_page(GFP_KERNEL)</div><div class='add'>+#define dump_page_free(x) __free_page(x)</div><div class='add'>+static struct page *dump_page_copy(struct page *src, struct page *dst)</div><div class='add'>+{</div><div class='add'>+	void *buf = kmap_local_page(src);</div><div class='add'>+	size_t left = copy_mc_to_kernel(page_address(dst), buf, PAGE_SIZE);</div><div class='add'>+	kunmap_local(buf);</div><div class='add'>+	return left ? NULL : dst;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#else</div><div class='add'>+</div><div class='add'>+/* We just want to return non-NULL; it's never used. */</div><div class='add'>+#define dump_page_alloc() ERR_PTR(-EINVAL)</div><div class='add'>+#define dump_page_free(x) ((void)(x))</div><div class='add'>+static inline struct page *dump_page_copy(struct page *src, struct page *dst)</div><div class='add'>+{</div><div class='add'>+	return src;</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> int dump_user_range(struct coredump_params *cprm, unsigned long start,</div><div class='ctx'> 		    unsigned long len)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned long addr;</div><div class='add'>+	struct page *dump_page;</div><div class='add'>+	int locked, ret;</div><div class='add'>+</div><div class='add'>+	dump_page = dump_page_alloc();</div><div class='add'>+	if (!dump_page)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='add'>+	ret = 0;</div><div class='add'>+	locked = 0;</div><div class='ctx'> 	for (addr = start; addr &lt; start + len; addr += PAGE_SIZE) {</div><div class='ctx'> 		struct page *page;</div><div class='del'>-		int stop;</div><div class='add'>+</div><div class='add'>+		if (!locked) {</div><div class='add'>+			if (mmap_read_lock_killable(current-&gt;mm))</div><div class='add'>+				goto out;</div><div class='add'>+			locked = 1;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * To avoid having to allocate page tables for virtual address</div><div class='hunk'>@@ -867,20 +1363,38 @@ int dump_user_range(struct coredump_params *cprm, unsigned long start,</div><div class='ctx'> 		 * NULL when encountering an empty page table entry that would</div><div class='ctx'> 		 * otherwise have been filled with the zero page.</div><div class='ctx'> 		 */</div><div class='del'>-		page = get_dump_page(addr);</div><div class='add'>+		page = get_dump_page(addr, &amp;locked);</div><div class='ctx'> 		if (page) {</div><div class='del'>-			void *kaddr = kmap_local_page(page);</div><div class='del'>-</div><div class='del'>-			stop = !dump_emit(cprm, kaddr, PAGE_SIZE);</div><div class='del'>-			kunmap_local(kaddr);</div><div class='add'>+			if (locked) {</div><div class='add'>+				mmap_read_unlock(current-&gt;mm);</div><div class='add'>+				locked = 0;</div><div class='add'>+			}</div><div class='add'>+			int stop = !dump_emit_page(cprm, dump_page_copy(page, dump_page));</div><div class='ctx'> 			put_page(page);</div><div class='ctx'> 			if (stop)</div><div class='del'>-				return 0;</div><div class='add'>+				goto out;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			dump_skip(cprm, PAGE_SIZE);</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='add'>+		if (dump_interrupted())</div><div class='add'>+			goto out;</div><div class='add'>+</div><div class='add'>+		if (!need_resched())</div><div class='add'>+			continue;</div><div class='add'>+		if (locked) {</div><div class='add'>+			mmap_read_unlock(current-&gt;mm);</div><div class='add'>+			locked = 0;</div><div class='add'>+		}</div><div class='add'>+		cond_resched();</div><div class='ctx'> 	}</div><div class='del'>-	return 1;</div><div class='add'>+	ret = 1;</div><div class='add'>+out:</div><div class='add'>+	if (locked)</div><div class='add'>+		mmap_read_unlock(current-&gt;mm);</div><div class='add'>+</div><div class='add'>+	dump_page_free(dump_page);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='hunk'>@@ -895,6 +1409,151 @@ int dump_align(struct coredump_params *cprm, int align)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(dump_align);</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_SYSCTL</div><div class='add'>+</div><div class='add'>+void validate_coredump_safety(void)</div><div class='add'>+{</div><div class='add'>+	if (suid_dumpable == SUID_DUMP_ROOT &amp;&amp;</div><div class='add'>+	    core_pattern[0] != '/' &amp;&amp; core_pattern[0] != '|' &amp;&amp; core_pattern[0] != '@') {</div><div class='add'>+</div><div class='add'>+		coredump_report_failure("Unsafe core_pattern used with fs.suid_dumpable=2: "</div><div class='add'>+			"pipe handler or fully qualified core dump path required. "</div><div class='add'>+			"Set kernel.core_pattern before fs.suid_dumpable.");</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool check_coredump_socket(void)</div><div class='add'>+{</div><div class='add'>+	const char *p;</div><div class='add'>+</div><div class='add'>+	if (core_pattern[0] != '@')</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Coredump socket must be located in the initial mount</div><div class='add'>+	 * namespace. Don't give the impression that anything else is</div><div class='add'>+	 * supported right now.</div><div class='add'>+	 */</div><div class='add'>+	if (current-&gt;nsproxy-&gt;mnt_ns != init_task.nsproxy-&gt;mnt_ns)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/* Must be an absolute path... */</div><div class='add'>+	if (core_pattern[1] != '/') {</div><div class='add'>+		/* ... or the socket request protocol... */</div><div class='add'>+		if (core_pattern[1] != '@')</div><div class='add'>+			return false;</div><div class='add'>+		/* ... and if so must be an absolute path. */</div><div class='add'>+		if (core_pattern[2] != '/')</div><div class='add'>+			return false;</div><div class='add'>+		p = &amp;core_pattern[2];</div><div class='add'>+	} else {</div><div class='add'>+		p = &amp;core_pattern[1];</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* The path obviously cannot exceed UNIX_PATH_MAX. */</div><div class='add'>+	if (strlen(p) &gt;= UNIX_PATH_MAX)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/* Must not contain ".." in the path. */</div><div class='add'>+	if (name_contains_dotdot(core_pattern))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int proc_dostring_coredump(const struct ctl_table *table, int write,</div><div class='add'>+		  void *buffer, size_t *lenp, loff_t *ppos)</div><div class='add'>+{</div><div class='add'>+	int error;</div><div class='add'>+	ssize_t retval;</div><div class='add'>+	char old_core_pattern[CORENAME_MAX_SIZE];</div><div class='add'>+</div><div class='add'>+	if (!write)</div><div class='add'>+		return proc_dostring(table, write, buffer, lenp, ppos);</div><div class='add'>+</div><div class='add'>+	retval = strscpy(old_core_pattern, core_pattern, CORENAME_MAX_SIZE);</div><div class='add'>+</div><div class='add'>+	error = proc_dostring(table, write, buffer, lenp, ppos);</div><div class='add'>+	if (error)</div><div class='add'>+		return error;</div><div class='add'>+</div><div class='add'>+	if (!check_coredump_socket()) {</div><div class='add'>+		strscpy(core_pattern, old_core_pattern, retval + 1);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	validate_coredump_safety();</div><div class='add'>+	return error;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const unsigned int core_file_note_size_min = CORE_FILE_NOTE_SIZE_DEFAULT;</div><div class='add'>+static const unsigned int core_file_note_size_max = CORE_FILE_NOTE_SIZE_MAX;</div><div class='add'>+static char core_modes[] = {</div><div class='add'>+	"file\npipe"</div><div class='add'>+#ifdef CONFIG_UNIX</div><div class='add'>+	"\nsocket"</div><div class='add'>+#endif</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct ctl_table coredump_sysctls[] = {</div><div class='add'>+	{</div><div class='add'>+		.procname	= "core_uses_pid",</div><div class='add'>+		.data		= &amp;core_uses_pid,</div><div class='add'>+		.maxlen		= sizeof(int),</div><div class='add'>+		.mode		= 0644,</div><div class='add'>+		.proc_handler	= proc_dointvec,</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+		.procname	= "core_pattern",</div><div class='add'>+		.data		= core_pattern,</div><div class='add'>+		.maxlen		= CORENAME_MAX_SIZE,</div><div class='add'>+		.mode		= 0644,</div><div class='add'>+		.proc_handler	= proc_dostring_coredump,</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+		.procname	= "core_pipe_limit",</div><div class='add'>+		.data		= &amp;core_pipe_limit,</div><div class='add'>+		.maxlen		= sizeof(unsigned int),</div><div class='add'>+		.mode		= 0644,</div><div class='add'>+		.proc_handler	= proc_dointvec_minmax,</div><div class='add'>+		.extra1		= SYSCTL_ZERO,</div><div class='add'>+		.extra2		= SYSCTL_INT_MAX,</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+		.procname       = "core_file_note_size_limit",</div><div class='add'>+		.data           = &amp;core_file_note_size_limit,</div><div class='add'>+		.maxlen         = sizeof(unsigned int),</div><div class='add'>+		.mode           = 0644,</div><div class='add'>+		.proc_handler	= proc_douintvec_minmax,</div><div class='add'>+		.extra1		= (unsigned int *)&amp;core_file_note_size_min,</div><div class='add'>+		.extra2		= (unsigned int *)&amp;core_file_note_size_max,</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+		.procname	= "core_sort_vma",</div><div class='add'>+		.data		= &amp;core_sort_vma,</div><div class='add'>+		.maxlen		= sizeof(int),</div><div class='add'>+		.mode		= 0644,</div><div class='add'>+		.proc_handler	= proc_douintvec_minmax,</div><div class='add'>+		.extra1		= SYSCTL_ZERO,</div><div class='add'>+		.extra2		= SYSCTL_ONE,</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+		.procname	= "core_modes",</div><div class='add'>+		.data		= core_modes,</div><div class='add'>+		.maxlen		= sizeof(core_modes) - 1,</div><div class='add'>+		.mode		= 0444,</div><div class='add'>+		.proc_handler	= proc_dostring,</div><div class='add'>+	},</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int __init init_fs_coredump_sysctls(void)</div><div class='add'>+{</div><div class='add'>+	register_sysctl_init("kernel", coredump_sysctls);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+fs_initcall(init_fs_coredump_sysctls);</div><div class='add'>+#endif /* CONFIG_SYSCTL */</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * The purpose of always_dump_vma() is to make sure that special kernel mappings</div><div class='ctx'>  * that are useful for post-mortem analysis are included in every core dump.</div><div class='hunk'>@@ -926,6 +1585,8 @@ static bool always_dump_vma(struct vm_area_struct *vma)</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#define DUMP_SIZE_MAYBE_ELFHDR_PLACEHOLDER 1</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Decide how much of @vma's contents should be included in a core dump.</div><div class='ctx'>  */</div><div class='hunk'>@@ -985,9 +1646,20 @@ static unsigned long vma_dump_size(struct vm_area_struct *vma,</div><div class='ctx'> 	 * dump the first page to aid in determining what was mapped here.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (FILTER(ELF_HEADERS) &amp;&amp;</div><div class='del'>-	    vma-&gt;vm_pgoff == 0 &amp;&amp; (vma-&gt;vm_flags &amp; VM_READ) &amp;&amp;</div><div class='del'>-	    (READ_ONCE(file_inode(vma-&gt;vm_file)-&gt;i_mode) &amp; 0111) != 0)</div><div class='del'>-		return PAGE_SIZE;</div><div class='add'>+	    vma-&gt;vm_pgoff == 0 &amp;&amp; (vma-&gt;vm_flags &amp; VM_READ)) {</div><div class='add'>+		if ((READ_ONCE(file_inode(vma-&gt;vm_file)-&gt;i_mode) &amp; 0111) != 0)</div><div class='add'>+			return PAGE_SIZE;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * ELF libraries aren't always executable.</div><div class='add'>+		 * We'll want to check whether the mapping starts with the ELF</div><div class='add'>+		 * magic, but not now - we're holding the mmap lock,</div><div class='add'>+		 * so copy_from_user() doesn't work here.</div><div class='add'>+		 * Use a placeholder instead, and fix it up later in</div><div class='add'>+		 * dump_vma_snapshot().</div><div class='add'>+		 */</div><div class='add'>+		return DUMP_SIZE_MAYBE_ELFHDR_PLACEHOLDER;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> #undef	FILTER</div><div class='ctx'> </div><div class='hunk'>@@ -997,45 +1669,59 @@ whole:</div><div class='ctx'> 	return vma-&gt;vm_end - vma-&gt;vm_start;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct vm_area_struct *first_vma(struct task_struct *tsk,</div><div class='del'>-					struct vm_area_struct *gate_vma)</div><div class='del'>-{</div><div class='del'>-	struct vm_area_struct *ret = tsk-&gt;mm-&gt;mmap;</div><div class='del'>-</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-	return gate_vma;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Helper function for iterating across a vma list.  It ensures that the caller</div><div class='ctx'>  * will visit `gate_vma' prior to terminating the search.</div><div class='ctx'>  */</div><div class='del'>-static struct vm_area_struct *next_vma(struct vm_area_struct *this_vma,</div><div class='add'>+static struct vm_area_struct *coredump_next_vma(struct vma_iterator *vmi,</div><div class='add'>+				       struct vm_area_struct *vma,</div><div class='ctx'> 				       struct vm_area_struct *gate_vma)</div><div class='ctx'> {</div><div class='del'>-	struct vm_area_struct *ret;</div><div class='del'>-</div><div class='del'>-	ret = this_vma-&gt;vm_next;</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-	if (this_vma == gate_vma)</div><div class='add'>+	if (gate_vma &amp;&amp; (vma == gate_vma))</div><div class='ctx'> 		return NULL;</div><div class='add'>+</div><div class='add'>+	vma = vma_next(vmi);</div><div class='add'>+	if (vma)</div><div class='add'>+		return vma;</div><div class='ctx'> 	return gate_vma;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void free_vma_snapshot(struct coredump_params *cprm)</div><div class='add'>+{</div><div class='add'>+	if (cprm-&gt;vma_meta) {</div><div class='add'>+		int i;</div><div class='add'>+		for (i = 0; i &lt; cprm-&gt;vma_count; i++) {</div><div class='add'>+			struct file *file = cprm-&gt;vma_meta[i].file;</div><div class='add'>+			if (file)</div><div class='add'>+				fput(file);</div><div class='add'>+		}</div><div class='add'>+		kvfree(cprm-&gt;vma_meta);</div><div class='add'>+		cprm-&gt;vma_meta = NULL;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int cmp_vma_size(const void *vma_meta_lhs_ptr, const void *vma_meta_rhs_ptr)</div><div class='add'>+{</div><div class='add'>+	const struct core_vma_metadata *vma_meta_lhs = vma_meta_lhs_ptr;</div><div class='add'>+	const struct core_vma_metadata *vma_meta_rhs = vma_meta_rhs_ptr;</div><div class='add'>+</div><div class='add'>+	if (vma_meta_lhs-&gt;dump_size &lt; vma_meta_rhs-&gt;dump_size)</div><div class='add'>+		return -1;</div><div class='add'>+	if (vma_meta_lhs-&gt;dump_size &gt; vma_meta_rhs-&gt;dump_size)</div><div class='add'>+		return 1;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Under the mmap_lock, take a snapshot of relevant information about the task's</div><div class='ctx'>  * VMAs.</div><div class='ctx'>  */</div><div class='del'>-int dump_vma_snapshot(struct coredump_params *cprm, int *vma_count,</div><div class='del'>-		      struct core_vma_metadata **vma_meta,</div><div class='del'>-		      size_t *vma_data_size_ptr)</div><div class='add'>+static bool dump_vma_snapshot(struct coredump_params *cprm)</div><div class='ctx'> {</div><div class='del'>-	struct vm_area_struct *vma, *gate_vma;</div><div class='add'>+	struct vm_area_struct *gate_vma, *vma = NULL;</div><div class='ctx'> 	struct mm_struct *mm = current-&gt;mm;</div><div class='del'>-	int i;</div><div class='del'>-	size_t vma_data_size = 0;</div><div class='add'>+	VMA_ITERATOR(vmi, mm, 0);</div><div class='add'>+	int i = 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Once the stack expansion code is fixed to not change VMA bounds</div><div class='hunk'>@@ -1043,36 +1729,54 @@ int dump_vma_snapshot(struct coredump_params *cprm, int *vma_count,</div><div class='ctx'> 	 * mmap_lock in read mode.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (mmap_write_lock_killable(mm))</div><div class='del'>-		return -EINTR;</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='add'>+	cprm-&gt;vma_data_size = 0;</div><div class='ctx'> 	gate_vma = get_gate_vma(mm);</div><div class='del'>-	*vma_count = mm-&gt;map_count + (gate_vma ? 1 : 0);</div><div class='add'>+	cprm-&gt;vma_count = mm-&gt;map_count + (gate_vma ? 1 : 0);</div><div class='ctx'> </div><div class='del'>-	*vma_meta = kvmalloc_array(*vma_count, sizeof(**vma_meta), GFP_KERNEL);</div><div class='del'>-	if (!*vma_meta) {</div><div class='add'>+	cprm-&gt;vma_meta = kvmalloc_array(cprm-&gt;vma_count, sizeof(*cprm-&gt;vma_meta), GFP_KERNEL);</div><div class='add'>+	if (!cprm-&gt;vma_meta) {</div><div class='ctx'> 		mmap_write_unlock(mm);</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	for (i = 0, vma = first_vma(current, gate_vma); vma != NULL;</div><div class='del'>-			vma = next_vma(vma, gate_vma), i++) {</div><div class='del'>-		struct core_vma_metadata *m = (*vma_meta) + i;</div><div class='add'>+	while ((vma = coredump_next_vma(&amp;vmi, vma, gate_vma)) != NULL) {</div><div class='add'>+		struct core_vma_metadata *m = cprm-&gt;vma_meta + i;</div><div class='ctx'> </div><div class='ctx'> 		m-&gt;start = vma-&gt;vm_start;</div><div class='ctx'> 		m-&gt;end = vma-&gt;vm_end;</div><div class='ctx'> 		m-&gt;flags = vma-&gt;vm_flags;</div><div class='ctx'> 		m-&gt;dump_size = vma_dump_size(vma, cprm-&gt;mm_flags);</div><div class='del'>-</div><div class='del'>-		vma_data_size += m-&gt;dump_size;</div><div class='add'>+		m-&gt;pgoff = vma-&gt;vm_pgoff;</div><div class='add'>+		m-&gt;file = vma-&gt;vm_file;</div><div class='add'>+		if (m-&gt;file)</div><div class='add'>+			get_file(m-&gt;file);</div><div class='add'>+		i++;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	mmap_write_unlock(mm);</div><div class='ctx'> </div><div class='del'>-	if (WARN_ON(i != *vma_count)) {</div><div class='del'>-		kvfree(*vma_meta);</div><div class='del'>-		return -EFAULT;</div><div class='add'>+	for (i = 0; i &lt; cprm-&gt;vma_count; i++) {</div><div class='add'>+		struct core_vma_metadata *m = cprm-&gt;vma_meta + i;</div><div class='add'>+</div><div class='add'>+		if (m-&gt;dump_size == DUMP_SIZE_MAYBE_ELFHDR_PLACEHOLDER) {</div><div class='add'>+			char elfmag[SELFMAG];</div><div class='add'>+</div><div class='add'>+			if (copy_from_user(elfmag, (void __user *)m-&gt;start, SELFMAG) ||</div><div class='add'>+					memcmp(elfmag, ELFMAG, SELFMAG) != 0) {</div><div class='add'>+				m-&gt;dump_size = 0;</div><div class='add'>+			} else {</div><div class='add'>+				m-&gt;dump_size = PAGE_SIZE;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		cprm-&gt;vma_data_size += m-&gt;dump_size;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	*vma_data_size_ptr = vma_data_size;</div><div class='del'>-	return 0;</div><div class='add'>+	if (core_sort_vma)</div><div class='add'>+		sort(cprm-&gt;vma_meta, cprm-&gt;vma_count, sizeof(*cprm-&gt;vma_meta),</div><div class='add'>+		     cmp_vma_size, NULL);</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/cramfs/Kconfig b/fs/cramfs/Kconfig<br/>index d98cef0dbb6b..4612c9bbf102 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cramfs/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cramfs/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/cramfs/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/cramfs/Kconfig</a></div><div class='hunk'>@@ -38,7 +38,7 @@ config CRAMFS_MTD</div><div class='ctx'> 	default y if !CRAMFS_BLOCKDEV</div><div class='ctx'> 	help</div><div class='ctx'> 	  This option allows the CramFs driver to load data directly from</div><div class='del'>-	  a linear adressed memory range (usually non volatile memory</div><div class='add'>+	  a linear addressed memory range (usually non-volatile memory</div><div class='ctx'> 	  like flash) instead of going through the block device layer.</div><div class='ctx'> 	  This saves some memory since no intermediate buffering is</div><div class='ctx'> 	  necessary.</div><div class='head'>diff --git a/fs/cramfs/README b/fs/cramfs/README<br/>index d71b27e0ff15..778df5c4d70b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cramfs/README?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cramfs/README</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/cramfs/README?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/cramfs/README</a></div><div class='hunk'>@@ -115,7 +115,7 @@ Block Size</div><div class='ctx'> </div><div class='ctx'> (Block size in cramfs refers to the size of input data that is</div><div class='ctx'> compressed at a time.  It's intended to be somewhere around</div><div class='del'>-PAGE_SIZE for cramfs_readpage's convenience.)</div><div class='add'>+PAGE_SIZE for cramfs_read_folio's convenience.)</div><div class='ctx'> </div><div class='ctx'> The superblock ought to indicate the block size that the fs was</div><div class='ctx'> written for, since comments in &lt;linux/pagemap.h&gt; indicate that</div><div class='hunk'>@@ -161,7 +161,7 @@ size.  The options are:</div><div class='ctx'>      PAGE_SIZE.</div><div class='ctx'> </div><div class='ctx'> It's easy enough to change the kernel to use a smaller value than</div><div class='del'>-PAGE_SIZE: just make cramfs_readpage read multiple blocks.</div><div class='add'>+PAGE_SIZE: just make cramfs_read_folio read multiple blocks.</div><div class='ctx'> </div><div class='ctx'> The cost of option 1 is that kernels with a larger PAGE_SIZE</div><div class='ctx'> value don't get as good compression as they can.</div><div class='hunk'>@@ -173,9 +173,9 @@ they don't mind their cramfs being inaccessible to kernels with</div><div class='ctx'> smaller PAGE_SIZE values.</div><div class='ctx'> </div><div class='ctx'> Option 3 is easy to implement if we don't mind being CPU-inefficient:</div><div class='del'>-e.g. get readpage to decompress to a buffer of size MAX_BLKSIZE (which</div><div class='add'>+e.g. get read_folio to decompress to a buffer of size MAX_BLKSIZE (which</div><div class='ctx'> must be no larger than 32KB) and discard what it doesn't need.</div><div class='del'>-Getting readpage to read into all the covered pages is harder.</div><div class='add'>+Getting read_folio to read into all the covered pages is harder.</div><div class='ctx'> </div><div class='ctx'> The main advantage of option 3 over 1, 2, is better compression.  The</div><div class='ctx'> cost is greater complexity.  Probably not worth it, but I hope someone</div><div class='head'>diff --git a/fs/cramfs/inode.c b/fs/cramfs/inode.c<br/>index 666aa380011e..e54ebe402df7 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/cramfs/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/cramfs/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/cramfs/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/cramfs/inode.c</a></div><div class='hunk'>@@ -17,7 +17,6 @@</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/file.h&gt;</div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='del'>-#include &lt;linux/pfn_t.h&gt;</div><div class='ctx'> #include &lt;linux/ramfs.h&gt;</div><div class='ctx'> #include &lt;linux/init.h&gt;</div><div class='ctx'> #include &lt;linux/string.h&gt;</div><div class='hunk'>@@ -96,7 +95,7 @@ static struct inode *get_cramfs_inode(struct super_block *sb,</div><div class='ctx'> 	inode = iget_locked(sb, cramino(cramfs_inode, offset));</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='del'>-	if (!(inode-&gt;i_state &amp; I_NEW))</div><div class='add'>+	if (!(inode_state_read_once(inode) &amp; I_NEW))</div><div class='ctx'> 		return inode;</div><div class='ctx'> </div><div class='ctx'> 	switch (cramfs_inode-&gt;mode &amp; S_IFMT) {</div><div class='hunk'>@@ -117,9 +116,18 @@ static struct inode *get_cramfs_inode(struct super_block *sb,</div><div class='ctx'> 		inode_nohighmem(inode);</div><div class='ctx'> 		inode-&gt;i_data.a_ops = &amp;cramfs_aops;</div><div class='ctx'> 		break;</div><div class='del'>-	default:</div><div class='add'>+	case S_IFCHR:</div><div class='add'>+	case S_IFBLK:</div><div class='add'>+	case S_IFIFO:</div><div class='add'>+	case S_IFSOCK:</div><div class='ctx'> 		init_special_inode(inode, cramfs_inode-&gt;mode,</div><div class='ctx'> 				old_decode_dev(cramfs_inode-&gt;size));</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		printk(KERN_DEBUG "CRAMFS: Invalid file type 0%04o for inode %lu.\n",</div><div class='add'>+		       inode-&gt;i_mode, inode-&gt;i_ino);</div><div class='add'>+		iget_failed(inode);</div><div class='add'>+		return ERR_PTR(-EIO);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_mode = cramfs_inode-&gt;mode;</div><div class='hunk'>@@ -133,7 +141,8 @@ static struct inode *get_cramfs_inode(struct super_block *sb,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Struct copy intentional */</div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_atime = inode-&gt;i_ctime = zerotime;</div><div class='add'>+	inode_set_mtime_to_ts(inode,</div><div class='add'>+			      inode_set_atime_to_ts(inode, inode_set_ctime_to_ts(inode, zerotime)));</div><div class='ctx'> 	/* inode-&gt;i_nlink is left 1 - arguably wrong for directories,</div><div class='ctx'> 	   but it's the best we can do without reading the directory</div><div class='ctx'> 	   contents.  1 yields the right result in GNU find, even</div><div class='hunk'>@@ -182,7 +191,8 @@ static int next_buffer;</div><div class='ctx'> static void *cramfs_blkdev_read(struct super_block *sb, unsigned int offset,</div><div class='ctx'> 				unsigned int len)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *mapping = sb-&gt;s_bdev-&gt;bd_inode-&gt;i_mapping;</div><div class='add'>+	struct address_space *mapping = sb-&gt;s_bdev-&gt;bd_mapping;</div><div class='add'>+	struct file_ra_state ra = {};</div><div class='ctx'> 	struct page *pages[BLKS_PER_BUF];</div><div class='ctx'> 	unsigned i, blocknr, buffer;</div><div class='ctx'> 	unsigned long devsize;</div><div class='hunk'>@@ -212,6 +222,9 @@ static void *cramfs_blkdev_read(struct super_block *sb, unsigned int offset,</div><div class='ctx'> 	devsize = bdev_nr_bytes(sb-&gt;s_bdev) &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> </div><div class='ctx'> 	/* Ok, read in BLKS_PER_BUF pages completely first. */</div><div class='add'>+	file_ra_state_init(&amp;ra, mapping);</div><div class='add'>+	page_cache_sync_readahead(mapping, &amp;ra, NULL, blocknr, BLKS_PER_BUF);</div><div class='add'>+</div><div class='ctx'> 	for (i = 0; i &lt; BLKS_PER_BUF; i++) {</div><div class='ctx'> 		struct page *page = NULL;</div><div class='ctx'> </div><div class='hunk'>@@ -224,19 +237,6 @@ static void *cramfs_blkdev_read(struct super_block *sb, unsigned int offset,</div><div class='ctx'> 		pages[i] = page;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; BLKS_PER_BUF; i++) {</div><div class='del'>-		struct page *page = pages[i];</div><div class='del'>-</div><div class='del'>-		if (page) {</div><div class='del'>-			wait_on_page_locked(page);</div><div class='del'>-			if (!PageUptodate(page)) {</div><div class='del'>-				/* asynchronous error */</div><div class='del'>-				put_page(page);</div><div class='del'>-				pages[i] = NULL;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	buffer = next_buffer;</div><div class='ctx'> 	next_buffer = NEXT_BUFFER(buffer);</div><div class='ctx'> 	buffer_blocknr[buffer] = blocknr;</div><div class='hunk'>@@ -247,8 +247,7 @@ static void *cramfs_blkdev_read(struct super_block *sb, unsigned int offset,</div><div class='ctx'> 		struct page *page = pages[i];</div><div class='ctx'> </div><div class='ctx'> 		if (page) {</div><div class='del'>-			memcpy(data, kmap(page), PAGE_SIZE);</div><div class='del'>-			kunmap(page);</div><div class='add'>+			memcpy_from_page(data, page, 0, PAGE_SIZE);</div><div class='ctx'> 			put_page(page);</div><div class='ctx'> 		} else</div><div class='ctx'> 			memset(data, 0, PAGE_SIZE);</div><div class='hunk'>@@ -414,15 +413,15 @@ static int cramfs_physmem_mmap(struct file *file, struct vm_area_struct *vma)</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Let's create a mixed map if we can't map it all.</div><div class='ctx'> 		 * The normal paging machinery will take care of the</div><div class='del'>-		 * unpopulated ptes via cramfs_readpage().</div><div class='add'>+		 * unpopulated ptes via cramfs_read_folio().</div><div class='ctx'> 		 */</div><div class='ctx'> 		int i;</div><div class='del'>-		vma-&gt;vm_flags |= VM_MIXEDMAP;</div><div class='add'>+		vm_flags_set(vma, VM_MIXEDMAP);</div><div class='ctx'> 		for (i = 0; i &lt; pages &amp;&amp; !ret; i++) {</div><div class='ctx'> 			vm_fault_t vmf;</div><div class='ctx'> 			unsigned long off = i * PAGE_SIZE;</div><div class='del'>-			pfn_t pfn = phys_to_pfn_t(address + off, PFN_DEV);</div><div class='del'>-			vmf = vmf_insert_mixed(vma, vma-&gt;vm_start + off, pfn);</div><div class='add'>+			vmf = vmf_insert_mixed(vma, vma-&gt;vm_start + off,</div><div class='add'>+					PHYS_PFN(address + off));</div><div class='ctx'> 			if (vmf &amp; VM_FAULT_ERROR)</div><div class='ctx'> 				ret = vm_fault_to_errno(vmf, 0);</div><div class='ctx'> 		}</div><div class='hunk'>@@ -446,7 +445,7 @@ bailout:</div><div class='ctx'> </div><div class='ctx'> static int cramfs_physmem_mmap(struct file *file, struct vm_area_struct *vma)</div><div class='ctx'> {</div><div class='del'>-	return vma-&gt;vm_flags &amp; (VM_SHARED | VM_MAYSHARE) ? 0 : -ENOSYS;</div><div class='add'>+	return is_nommu_shared_mapping(vma-&gt;vm_flags) ? 0 : -ENOSYS;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static unsigned long cramfs_physmem_get_unmapped_area(struct file *file,</div><div class='hunk'>@@ -483,7 +482,7 @@ static unsigned int cramfs_physmem_mmap_capabilities(struct file *file)</div><div class='ctx'> static const struct file_operations cramfs_physmem_fops = {</div><div class='ctx'> 	.llseek			= generic_file_llseek,</div><div class='ctx'> 	.read_iter		= generic_file_read_iter,</div><div class='del'>-	.splice_read		= generic_file_splice_read,</div><div class='add'>+	.splice_read		= filemap_splice_read,</div><div class='ctx'> 	.mmap			= cramfs_physmem_mmap,</div><div class='ctx'> #ifndef CONFIG_MMU</div><div class='ctx'> 	.get_unmapped_area	= cramfs_physmem_get_unmapped_area,</div><div class='hunk'>@@ -495,12 +494,16 @@ static void cramfs_kill_sb(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct cramfs_sb_info *sbi = CRAMFS_SB(sb);</div><div class='ctx'> </div><div class='add'>+	generic_shutdown_super(sb);</div><div class='add'>+</div><div class='ctx'> 	if (IS_ENABLED(CONFIG_CRAMFS_MTD) &amp;&amp; sb-&gt;s_mtd) {</div><div class='ctx'> 		if (sbi &amp;&amp; sbi-&gt;mtd_point_size)</div><div class='ctx'> 			mtd_unpoint(sb-&gt;s_mtd, 0, sbi-&gt;mtd_point_size);</div><div class='del'>-		kill_mtd_super(sb);</div><div class='add'>+		put_mtd_device(sb-&gt;s_mtd);</div><div class='add'>+		sb-&gt;s_mtd = NULL;</div><div class='ctx'> 	} else if (IS_ENABLED(CONFIG_CRAMFS_BLOCKDEV) &amp;&amp; sb-&gt;s_bdev) {</div><div class='del'>-		kill_block_super(sb);</div><div class='add'>+		sync_blockdev(sb-&gt;s_bdev);</div><div class='add'>+		bdev_fput(sb-&gt;s_bdev_file);</div><div class='ctx'> 	}</div><div class='ctx'> 	kfree(sbi);</div><div class='ctx'> }</div><div class='hunk'>@@ -814,20 +817,21 @@ out:</div><div class='ctx'> 	return d_splice_alias(inode, dentry);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int cramfs_readpage(struct file *file, struct page *page)</div><div class='add'>+static int cramfs_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	u32 maxblock;</div><div class='ctx'> 	int bytes_filled;</div><div class='ctx'> 	void *pgdata;</div><div class='add'>+	bool success = false;</div><div class='ctx'> </div><div class='ctx'> 	maxblock = (inode-&gt;i_size + PAGE_SIZE - 1) &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> 	bytes_filled = 0;</div><div class='del'>-	pgdata = kmap(page);</div><div class='add'>+	pgdata = kmap_local_folio(folio, 0);</div><div class='ctx'> </div><div class='del'>-	if (page-&gt;index &lt; maxblock) {</div><div class='add'>+	if (folio-&gt;index &lt; maxblock) {</div><div class='ctx'> 		struct super_block *sb = inode-&gt;i_sb;</div><div class='del'>-		u32 blkptr_offset = OFFSET(inode) + page-&gt;index * 4;</div><div class='add'>+		u32 blkptr_offset = OFFSET(inode) + folio-&gt;index * 4;</div><div class='ctx'> 		u32 block_ptr, block_start, block_len;</div><div class='ctx'> 		bool uncompressed, direct;</div><div class='ctx'> </div><div class='hunk'>@@ -848,7 +852,7 @@ static int cramfs_readpage(struct file *file, struct page *page)</div><div class='ctx'> 			if (uncompressed) {</div><div class='ctx'> 				block_len = PAGE_SIZE;</div><div class='ctx'> 				/* if last block: cap to file length */</div><div class='del'>-				if (page-&gt;index == maxblock - 1)</div><div class='add'>+				if (folio-&gt;index == maxblock - 1)</div><div class='ctx'> 					block_len =</div><div class='ctx'> 						offset_in_page(inode-&gt;i_size);</div><div class='ctx'> 			} else {</div><div class='hunk'>@@ -865,7 +869,7 @@ static int cramfs_readpage(struct file *file, struct page *page)</div><div class='ctx'> 			 * from the previous block's pointer.</div><div class='ctx'> 			 */</div><div class='ctx'> 			block_start = OFFSET(inode) + maxblock * 4;</div><div class='del'>-			if (page-&gt;index)</div><div class='add'>+			if (folio-&gt;index)</div><div class='ctx'> 				block_start = *(u32 *)</div><div class='ctx'> 					cramfs_read(sb, blkptr_offset - 4, 4);</div><div class='ctx'> 			/* Beware... previous ptr might be a direct ptr */</div><div class='hunk'>@@ -910,22 +914,17 @@ static int cramfs_readpage(struct file *file, struct page *page)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	memset(pgdata + bytes_filled, 0, PAGE_SIZE - bytes_filled);</div><div class='del'>-	flush_dcache_page(page);</div><div class='del'>-	kunmap(page);</div><div class='del'>-	SetPageUptodate(page);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	return 0;</div><div class='add'>+	flush_dcache_folio(folio);</div><div class='ctx'> </div><div class='add'>+	success = true;</div><div class='ctx'> err:</div><div class='del'>-	kunmap(page);</div><div class='del'>-	ClearPageUptodate(page);</div><div class='del'>-	SetPageError(page);</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	kunmap_local(pgdata);</div><div class='add'>+	folio_end_read(folio, success);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct address_space_operations cramfs_aops = {</div><div class='del'>-	.readpage = cramfs_readpage</div><div class='add'>+	.read_folio = cramfs_read_folio</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1007,4 +1006,5 @@ static void __exit exit_cramfs_fs(void)</div><div class='ctx'> </div><div class='ctx'> module_init(init_cramfs_fs)</div><div class='ctx'> module_exit(exit_cramfs_fs)</div><div class='add'>+MODULE_DESCRIPTION("Compressed ROM file system support");</div><div class='ctx'> MODULE_LICENSE("GPL");</div><div class='head'>diff --git a/fs/crypto/Kconfig b/fs/crypto/Kconfig<br/>index 2d0c8922f635..464b54610fd3 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/crypto/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/crypto/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/crypto/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/crypto/Kconfig</a></div><div class='hunk'>@@ -2,16 +2,16 @@</div><div class='ctx'> config FS_ENCRYPTION</div><div class='ctx'> 	bool "FS Encryption (Per-file encryption)"</div><div class='ctx'> 	select CRYPTO</div><div class='del'>-	select CRYPTO_HASH</div><div class='ctx'> 	select CRYPTO_SKCIPHER</div><div class='ctx'> 	select CRYPTO_LIB_SHA256</div><div class='add'>+	select CRYPTO_LIB_SHA512</div><div class='ctx'> 	select KEYS</div><div class='ctx'> 	help</div><div class='ctx'> 	  Enable encryption of files and directories.  This</div><div class='ctx'> 	  feature is similar to ecryptfs, but it is more memory</div><div class='ctx'> 	  efficient since it avoids caching the encrypted and</div><div class='ctx'> 	  decrypted pages in the page cache.  Currently Ext4,</div><div class='del'>-	  F2FS and UBIFS make use of this feature.</div><div class='add'>+	  F2FS, UBIFS, and CephFS make use of this feature.</div><div class='ctx'> </div><div class='ctx'> # Filesystems supporting encryption must select this if FS_ENCRYPTION.  This</div><div class='ctx'> # allows the algorithms to be built as modules when all the filesystems are,</div><div class='hunk'>@@ -24,20 +24,14 @@ config FS_ENCRYPTION</div><div class='ctx'> #</div><div class='ctx'> # Also note that this option only pulls in the generic implementations of the</div><div class='ctx'> # algorithms, not any per-architecture optimized implementations.  It is</div><div class='del'>-# strongly recommended to enable optimized implementations too.  It is safe to</div><div class='del'>-# disable these generic implementations if corresponding optimized</div><div class='del'>-# implementations will always be available too; for this reason, these are soft</div><div class='del'>-# dependencies ('imply' rather than 'select').  Only disable these generic</div><div class='del'>-# implementations if you're sure they will never be needed, though.</div><div class='add'>+# strongly recommended to enable optimized implementations too.</div><div class='ctx'> config FS_ENCRYPTION_ALGS</div><div class='ctx'> 	tristate</div><div class='del'>-	imply CRYPTO_AES</div><div class='del'>-	imply CRYPTO_CBC</div><div class='del'>-	imply CRYPTO_CTS</div><div class='del'>-	imply CRYPTO_ECB</div><div class='del'>-	imply CRYPTO_HMAC</div><div class='del'>-	imply CRYPTO_SHA512</div><div class='del'>-	imply CRYPTO_XTS</div><div class='add'>+	select CRYPTO_AES</div><div class='add'>+	select CRYPTO_CBC</div><div class='add'>+	select CRYPTO_CTS</div><div class='add'>+	select CRYPTO_ECB</div><div class='add'>+	select CRYPTO_XTS</div><div class='ctx'> </div><div class='ctx'> config FS_ENCRYPTION_INLINE_CRYPT</div><div class='ctx'> 	bool "Enable fscrypt to use inline crypto"</div><div class='head'>diff --git a/fs/crypto/bio.c b/fs/crypto/bio.c<br/>index bfc2a5b74ed3..5f5599020e94 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/crypto/bio.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/crypto/bio.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/crypto/bio.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/crypto/bio.c</a></div><div class='hunk'>@@ -7,10 +7,12 @@</div><div class='ctx'>  * Copyright (C) 2015, Motorola Mobility</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-#include &lt;linux/pagemap.h&gt;</div><div class='del'>-#include &lt;linux/module.h&gt;</div><div class='ctx'> #include &lt;linux/bio.h&gt;</div><div class='add'>+#include &lt;linux/export.h&gt;</div><div class='add'>+#include &lt;linux/module.h&gt;</div><div class='ctx'> #include &lt;linux/namei.h&gt;</div><div class='add'>+#include &lt;linux/pagemap.h&gt;</div><div class='add'>+</div><div class='ctx'> #include "fscrypt_private.h"</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -25,21 +27,23 @@</div><div class='ctx'>  * then this function isn't applicable.  This function may sleep, so it must be</div><div class='ctx'>  * called from a workqueue rather than from the bio's bi_end_io callback.</div><div class='ctx'>  *</div><div class='del'>- * This function sets PG_error on any pages that contain any blocks that failed</div><div class='del'>- * to be decrypted.  The filesystem must not mark such pages uptodate.</div><div class='add'>+ * Return: %true on success; %false on failure.  On failure, bio-&gt;bi_status is</div><div class='add'>+ *	   also set to an error status.</div><div class='ctx'>  */</div><div class='del'>-void fscrypt_decrypt_bio(struct bio *bio)</div><div class='add'>+bool fscrypt_decrypt_bio(struct bio *bio)</div><div class='ctx'> {</div><div class='del'>-	struct bio_vec *bv;</div><div class='del'>-	struct bvec_iter_all iter_all;</div><div class='del'>-</div><div class='del'>-	bio_for_each_segment_all(bv, bio, iter_all) {</div><div class='del'>-		struct page *page = bv-&gt;bv_page;</div><div class='del'>-		int ret = fscrypt_decrypt_pagecache_blocks(page, bv-&gt;bv_len,</div><div class='del'>-							   bv-&gt;bv_offset);</div><div class='del'>-		if (ret)</div><div class='del'>-			SetPageError(page);</div><div class='add'>+	struct folio_iter fi;</div><div class='add'>+</div><div class='add'>+	bio_for_each_folio_all(fi, bio) {</div><div class='add'>+		int err = fscrypt_decrypt_pagecache_blocks(fi.folio, fi.length,</div><div class='add'>+							   fi.offset);</div><div class='add'>+</div><div class='add'>+		if (err) {</div><div class='add'>+			bio-&gt;bi_status = errno_to_blk_status(err);</div><div class='add'>+			return false;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(fscrypt_decrypt_bio);</div><div class='ctx'> </div><div class='hunk'>@@ -54,7 +58,8 @@ static int fscrypt_zeroout_range_inline_crypt(const struct inode *inode,</div><div class='ctx'> 	int num_pages = 0;</div><div class='ctx'> </div><div class='ctx'> 	/* This always succeeds since __GFP_DIRECT_RECLAIM is set. */</div><div class='del'>-	bio = bio_alloc(GFP_NOFS, BIO_MAX_VECS);</div><div class='add'>+	bio = bio_alloc(inode-&gt;i_sb-&gt;s_bdev, BIO_MAX_VECS, REQ_OP_WRITE,</div><div class='add'>+			GFP_NOFS);</div><div class='ctx'> </div><div class='ctx'> 	while (len) {</div><div class='ctx'> 		unsigned int blocks_this_page = min(len, blocks_per_page);</div><div class='hunk'>@@ -62,13 +67,11 @@ static int fscrypt_zeroout_range_inline_crypt(const struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 		if (num_pages == 0) {</div><div class='ctx'> 			fscrypt_set_bio_crypt_ctx(bio, inode, lblk, GFP_NOFS);</div><div class='del'>-			bio_set_dev(bio, inode-&gt;i_sb-&gt;s_bdev);</div><div class='ctx'> 			bio-&gt;bi_iter.bi_sector =</div><div class='ctx'> 					pblk &lt;&lt; (blockbits - SECTOR_SHIFT);</div><div class='del'>-			bio_set_op_attrs(bio, REQ_OP_WRITE, 0);</div><div class='ctx'> 		}</div><div class='ctx'> 		ret = bio_add_page(bio, ZERO_PAGE(0), bytes_this_page, 0);</div><div class='del'>-		if (WARN_ON(ret != bytes_this_page)) {</div><div class='add'>+		if (WARN_ON_ONCE(ret != bytes_this_page)) {</div><div class='ctx'> 			err = -EIO;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -81,7 +84,7 @@ static int fscrypt_zeroout_range_inline_crypt(const struct inode *inode,</div><div class='ctx'> 			err = submit_bio_wait(bio);</div><div class='ctx'> 			if (err)</div><div class='ctx'> 				goto out;</div><div class='del'>-			bio_reset(bio);</div><div class='add'>+			bio_reset(bio, inode-&gt;i_sb-&gt;s_bdev, REQ_OP_WRITE);</div><div class='ctx'> 			num_pages = 0;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -110,10 +113,14 @@ out:</div><div class='ctx'> int fscrypt_zeroout_range(const struct inode *inode, pgoff_t lblk,</div><div class='ctx'> 			  sector_t pblk, unsigned int len)</div><div class='ctx'> {</div><div class='del'>-	const unsigned int blockbits = inode-&gt;i_blkbits;</div><div class='del'>-	const unsigned int blocksize = 1 &lt;&lt; blockbits;</div><div class='del'>-	const unsigned int blocks_per_page_bits = PAGE_SHIFT - blockbits;</div><div class='del'>-	const unsigned int blocks_per_page = 1 &lt;&lt; blocks_per_page_bits;</div><div class='add'>+	const struct fscrypt_inode_info *ci = fscrypt_get_inode_info_raw(inode);</div><div class='add'>+	const unsigned int du_bits = ci-&gt;ci_data_unit_bits;</div><div class='add'>+	const unsigned int du_size = 1U &lt;&lt; du_bits;</div><div class='add'>+	const unsigned int du_per_page_bits = PAGE_SHIFT - du_bits;</div><div class='add'>+	const unsigned int du_per_page = 1U &lt;&lt; du_per_page_bits;</div><div class='add'>+	u64 du_index = (u64)lblk &lt;&lt; (inode-&gt;i_blkbits - du_bits);</div><div class='add'>+	u64 du_remaining = (u64)len &lt;&lt; (inode-&gt;i_blkbits - du_bits);</div><div class='add'>+	sector_t sector = pblk &lt;&lt; (inode-&gt;i_blkbits - SECTOR_SHIFT);</div><div class='ctx'> 	struct page *pages[16]; /* write up to 16 pages at a time */</div><div class='ctx'> 	unsigned int nr_pages;</div><div class='ctx'> 	unsigned int i;</div><div class='hunk'>@@ -129,8 +136,8 @@ int fscrypt_zeroout_range(const struct inode *inode, pgoff_t lblk,</div><div class='ctx'> 							  len);</div><div class='ctx'> </div><div class='ctx'> 	BUILD_BUG_ON(ARRAY_SIZE(pages) &gt; BIO_MAX_VECS);</div><div class='del'>-	nr_pages = min_t(unsigned int, ARRAY_SIZE(pages),</div><div class='del'>-			 (len + blocks_per_page - 1) &gt;&gt; blocks_per_page_bits);</div><div class='add'>+	nr_pages = min_t(u64, ARRAY_SIZE(pages),</div><div class='add'>+			 (du_remaining + du_per_page - 1) &gt;&gt; du_per_page_bits);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We need at least one page for ciphertext.  Allocate the first one</div><div class='hunk'>@@ -141,49 +148,47 @@ int fscrypt_zeroout_range(const struct inode *inode, pgoff_t lblk,</div><div class='ctx'> 	 */</div><div class='ctx'> 	for (i = 0; i &lt; nr_pages; i++) {</div><div class='ctx'> 		pages[i] = fscrypt_alloc_bounce_page(i == 0 ? GFP_NOFS :</div><div class='del'>-						     GFP_NOWAIT | __GFP_NOWARN);</div><div class='add'>+						     GFP_NOWAIT);</div><div class='ctx'> 		if (!pages[i])</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='ctx'> 	nr_pages = i;</div><div class='del'>-	if (WARN_ON(nr_pages &lt;= 0))</div><div class='add'>+	if (WARN_ON_ONCE(nr_pages &lt;= 0))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	/* This always succeeds since __GFP_DIRECT_RECLAIM is set. */</div><div class='del'>-	bio = bio_alloc(GFP_NOFS, nr_pages);</div><div class='add'>+	bio = bio_alloc(inode-&gt;i_sb-&gt;s_bdev, nr_pages, REQ_OP_WRITE, GFP_NOFS);</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='del'>-		bio_set_dev(bio, inode-&gt;i_sb-&gt;s_bdev);</div><div class='del'>-		bio-&gt;bi_iter.bi_sector = pblk &lt;&lt; (blockbits - 9);</div><div class='del'>-		bio_set_op_attrs(bio, REQ_OP_WRITE, 0);</div><div class='add'>+		bio-&gt;bi_iter.bi_sector = sector;</div><div class='ctx'> </div><div class='ctx'> 		i = 0;</div><div class='ctx'> 		offset = 0;</div><div class='ctx'> 		do {</div><div class='del'>-			err = fscrypt_crypt_block(inode, FS_ENCRYPT, lblk,</div><div class='del'>-						  ZERO_PAGE(0), pages[i],</div><div class='del'>-						  blocksize, offset, GFP_NOFS);</div><div class='add'>+			err = fscrypt_crypt_data_unit(ci, FS_ENCRYPT, du_index,</div><div class='add'>+						      ZERO_PAGE(0), pages[i],</div><div class='add'>+						      du_size, offset);</div><div class='ctx'> 			if (err)</div><div class='ctx'> 				goto out;</div><div class='del'>-			lblk++;</div><div class='del'>-			pblk++;</div><div class='del'>-			len--;</div><div class='del'>-			offset += blocksize;</div><div class='del'>-			if (offset == PAGE_SIZE || len == 0) {</div><div class='add'>+			du_index++;</div><div class='add'>+			sector += 1U &lt;&lt; (du_bits - SECTOR_SHIFT);</div><div class='add'>+			du_remaining--;</div><div class='add'>+			offset += du_size;</div><div class='add'>+			if (offset == PAGE_SIZE || du_remaining == 0) {</div><div class='ctx'> 				ret = bio_add_page(bio, pages[i++], offset, 0);</div><div class='del'>-				if (WARN_ON(ret != offset)) {</div><div class='add'>+				if (WARN_ON_ONCE(ret != offset)) {</div><div class='ctx'> 					err = -EIO;</div><div class='ctx'> 					goto out;</div><div class='ctx'> 				}</div><div class='ctx'> 				offset = 0;</div><div class='ctx'> 			}</div><div class='del'>-		} while (i != nr_pages &amp;&amp; len != 0);</div><div class='add'>+		} while (i != nr_pages &amp;&amp; du_remaining != 0);</div><div class='ctx'> </div><div class='ctx'> 		err = submit_bio_wait(bio);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto out;</div><div class='del'>-		bio_reset(bio);</div><div class='del'>-	} while (len != 0);</div><div class='add'>+		bio_reset(bio, inode-&gt;i_sb-&gt;s_bdev, REQ_OP_WRITE);</div><div class='add'>+	} while (du_remaining != 0);</div><div class='ctx'> 	err = 0;</div><div class='ctx'> out:</div><div class='ctx'> 	bio_put(bio);</div><div class='head'>diff --git a/fs/crypto/crypto.c b/fs/crypto/crypto.c<br/>index 4ef3f714046a..07f9cbfe3ea4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/crypto/crypto.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/crypto/crypto.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/crypto/crypto.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/crypto/crypto.c</a></div><div class='hunk'>@@ -20,12 +20,14 @@</div><div class='ctx'>  * Special Publication 800-38E and IEEE P1619/D16.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-#include &lt;linux/pagemap.h&gt;</div><div class='add'>+#include &lt;crypto/skcipher.h&gt;</div><div class='add'>+#include &lt;linux/export.h&gt;</div><div class='ctx'> #include &lt;linux/mempool.h&gt;</div><div class='ctx'> #include &lt;linux/module.h&gt;</div><div class='del'>-#include &lt;linux/scatterlist.h&gt;</div><div class='add'>+#include &lt;linux/pagemap.h&gt;</div><div class='ctx'> #include &lt;linux/ratelimit.h&gt;</div><div class='del'>-#include &lt;crypto/skcipher.h&gt;</div><div class='add'>+#include &lt;linux/scatterlist.h&gt;</div><div class='add'>+</div><div class='ctx'> #include "fscrypt_private.h"</div><div class='ctx'> </div><div class='ctx'> static unsigned int num_prealloc_crypto_pages = 32;</div><div class='hunk'>@@ -39,7 +41,7 @@ static mempool_t *fscrypt_bounce_page_pool = NULL;</div><div class='ctx'> static struct workqueue_struct *fscrypt_read_workqueue;</div><div class='ctx'> static DEFINE_MUTEX(fscrypt_init_mutex);</div><div class='ctx'> </div><div class='del'>-struct kmem_cache *fscrypt_info_cachep;</div><div class='add'>+struct kmem_cache *fscrypt_inode_info_cachep;</div><div class='ctx'> </div><div class='ctx'> void fscrypt_enqueue_decrypt_work(struct work_struct *work)</div><div class='ctx'> {</div><div class='hunk'>@@ -49,6 +51,13 @@ EXPORT_SYMBOL(fscrypt_enqueue_decrypt_work);</div><div class='ctx'> </div><div class='ctx'> struct page *fscrypt_alloc_bounce_page(gfp_t gfp_flags)</div><div class='ctx'> {</div><div class='add'>+	if (WARN_ON_ONCE(!fscrypt_bounce_page_pool)) {</div><div class='add'>+		/*</div><div class='add'>+		 * Oops, the filesystem called a function that uses the bounce</div><div class='add'>+		 * page pool, but it didn't set needs_bounce_pages.</div><div class='add'>+		 */</div><div class='add'>+		return NULL;</div><div class='add'>+	}</div><div class='ctx'> 	return mempool_alloc(fscrypt_bounce_page_pool, gfp_flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -69,88 +78,87 @@ void fscrypt_free_bounce_page(struct page *bounce_page)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(fscrypt_free_bounce_page);</div><div class='ctx'> </div><div class='del'>-void fscrypt_generate_iv(union fscrypt_iv *iv, u64 lblk_num,</div><div class='del'>-			 const struct fscrypt_info *ci)</div><div class='add'>+/*</div><div class='add'>+ * Generate the IV for the given data unit index within the given file.</div><div class='add'>+ * For filenames encryption, index == 0.</div><div class='add'>+ *</div><div class='add'>+ * Keep this in sync with fscrypt_limit_io_blocks().  fscrypt_limit_io_blocks()</div><div class='add'>+ * needs to know about any IV generation methods where the low bits of IV don't</div><div class='add'>+ * simply contain the data unit index (e.g., IV_INO_LBLK_32).</div><div class='add'>+ */</div><div class='add'>+void fscrypt_generate_iv(union fscrypt_iv *iv, u64 index,</div><div class='add'>+			 const struct fscrypt_inode_info *ci)</div><div class='ctx'> {</div><div class='ctx'> 	u8 flags = fscrypt_policy_flags(&amp;ci-&gt;ci_policy);</div><div class='ctx'> </div><div class='ctx'> 	memset(iv, 0, ci-&gt;ci_mode-&gt;ivsize);</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; FSCRYPT_POLICY_FLAG_IV_INO_LBLK_64) {</div><div class='del'>-		WARN_ON_ONCE(lblk_num &gt; U32_MAX);</div><div class='add'>+		WARN_ON_ONCE(index &gt; U32_MAX);</div><div class='ctx'> 		WARN_ON_ONCE(ci-&gt;ci_inode-&gt;i_ino &gt; U32_MAX);</div><div class='del'>-		lblk_num |= (u64)ci-&gt;ci_inode-&gt;i_ino &lt;&lt; 32;</div><div class='add'>+		index |= (u64)ci-&gt;ci_inode-&gt;i_ino &lt;&lt; 32;</div><div class='ctx'> 	} else if (flags &amp; FSCRYPT_POLICY_FLAG_IV_INO_LBLK_32) {</div><div class='del'>-		WARN_ON_ONCE(lblk_num &gt; U32_MAX);</div><div class='del'>-		lblk_num = (u32)(ci-&gt;ci_hashed_ino + lblk_num);</div><div class='add'>+		WARN_ON_ONCE(index &gt; U32_MAX);</div><div class='add'>+		index = (u32)(ci-&gt;ci_hashed_ino + index);</div><div class='ctx'> 	} else if (flags &amp; FSCRYPT_POLICY_FLAG_DIRECT_KEY) {</div><div class='ctx'> 		memcpy(iv-&gt;nonce, ci-&gt;ci_nonce, FSCRYPT_FILE_NONCE_SIZE);</div><div class='ctx'> 	}</div><div class='del'>-	iv-&gt;lblk_num = cpu_to_le64(lblk_num);</div><div class='add'>+	iv-&gt;index = cpu_to_le64(index);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Encrypt or decrypt a single filesystem block of file contents */</div><div class='del'>-int fscrypt_crypt_block(const struct inode *inode, fscrypt_direction_t rw,</div><div class='del'>-			u64 lblk_num, struct page *src_page,</div><div class='del'>-			struct page *dest_page, unsigned int len,</div><div class='del'>-			unsigned int offs, gfp_t gfp_flags)</div><div class='add'>+/* Encrypt or decrypt a single "data unit" of file contents. */</div><div class='add'>+int fscrypt_crypt_data_unit(const struct fscrypt_inode_info *ci,</div><div class='add'>+			    fscrypt_direction_t rw, u64 index,</div><div class='add'>+			    struct page *src_page, struct page *dest_page,</div><div class='add'>+			    unsigned int len, unsigned int offs)</div><div class='ctx'> {</div><div class='add'>+	struct crypto_sync_skcipher *tfm = ci-&gt;ci_enc_key.tfm;</div><div class='add'>+	SYNC_SKCIPHER_REQUEST_ON_STACK(req, tfm);</div><div class='ctx'> 	union fscrypt_iv iv;</div><div class='del'>-	struct skcipher_request *req = NULL;</div><div class='del'>-	DECLARE_CRYPTO_WAIT(wait);</div><div class='ctx'> 	struct scatterlist dst, src;</div><div class='del'>-	struct fscrypt_info *ci = inode-&gt;i_crypt_info;</div><div class='del'>-	struct crypto_skcipher *tfm = ci-&gt;ci_enc_key.tfm;</div><div class='del'>-	int res = 0;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (WARN_ON_ONCE(len &lt;= 0))</div><div class='ctx'> 		return -EINVAL;</div><div class='del'>-	if (WARN_ON_ONCE(len % FS_CRYPTO_BLOCK_SIZE != 0))</div><div class='add'>+	if (WARN_ON_ONCE(len % FSCRYPT_CONTENTS_ALIGNMENT != 0))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	fscrypt_generate_iv(&amp;iv, lblk_num, ci);</div><div class='del'>-</div><div class='del'>-	req = skcipher_request_alloc(tfm, gfp_flags);</div><div class='del'>-	if (!req)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	fscrypt_generate_iv(&amp;iv, index, ci);</div><div class='ctx'> </div><div class='ctx'> 	skcipher_request_set_callback(</div><div class='ctx'> 		req, CRYPTO_TFM_REQ_MAY_BACKLOG | CRYPTO_TFM_REQ_MAY_SLEEP,</div><div class='del'>-		crypto_req_done, &amp;wait);</div><div class='del'>-</div><div class='add'>+		NULL, NULL);</div><div class='ctx'> 	sg_init_table(&amp;dst, 1);</div><div class='ctx'> 	sg_set_page(&amp;dst, dest_page, len, offs);</div><div class='ctx'> 	sg_init_table(&amp;src, 1);</div><div class='ctx'> 	sg_set_page(&amp;src, src_page, len, offs);</div><div class='ctx'> 	skcipher_request_set_crypt(req, &amp;src, &amp;dst, len, &amp;iv);</div><div class='ctx'> 	if (rw == FS_DECRYPT)</div><div class='del'>-		res = crypto_wait_req(crypto_skcipher_decrypt(req), &amp;wait);</div><div class='add'>+		err = crypto_skcipher_decrypt(req);</div><div class='ctx'> 	else</div><div class='del'>-		res = crypto_wait_req(crypto_skcipher_encrypt(req), &amp;wait);</div><div class='del'>-	skcipher_request_free(req);</div><div class='del'>-	if (res) {</div><div class='del'>-		fscrypt_err(inode, "%scryption failed for block %llu: %d",</div><div class='del'>-			    (rw == FS_DECRYPT ? "De" : "En"), lblk_num, res);</div><div class='del'>-		return res;</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='add'>+		err = crypto_skcipher_encrypt(req);</div><div class='add'>+	if (err)</div><div class='add'>+		fscrypt_err(ci-&gt;ci_inode,</div><div class='add'>+			    "%scryption failed for data unit %llu: %d",</div><div class='add'>+			    (rw == FS_DECRYPT ? "De" : "En"), index, err);</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * fscrypt_encrypt_pagecache_blocks() - Encrypt filesystem blocks from a</div><div class='del'>- *					pagecache page</div><div class='del'>- * @page:      The locked pagecache page containing the block(s) to encrypt</div><div class='del'>- * @len:       Total size of the block(s) to encrypt.  Must be a nonzero</div><div class='del'>- *		multiple of the filesystem's block size.</div><div class='del'>- * @offs:      Byte offset within @page of the first block to encrypt.  Must be</div><div class='del'>- *		a multiple of the filesystem's block size.</div><div class='del'>- * @gfp_flags: Memory allocation flags.  See details below.</div><div class='add'>+ * fscrypt_encrypt_pagecache_blocks() - Encrypt data from a pagecache folio</div><div class='add'>+ * @folio: the locked pagecache folio containing the data to encrypt</div><div class='add'>+ * @len: size of the data to encrypt, in bytes</div><div class='add'>+ * @offs: offset within @page of the data to encrypt, in bytes</div><div class='add'>+ * @gfp_flags: memory allocation flags; see details below</div><div class='add'>+ *</div><div class='add'>+ * This allocates a new bounce page and encrypts the given data into it.  The</div><div class='add'>+ * length and offset of the data must be aligned to the file's crypto data unit</div><div class='add'>+ * size.  Alignment to the filesystem block size fulfills this requirement, as</div><div class='add'>+ * the filesystem block size is always a multiple of the data unit size.</div><div class='ctx'>  *</div><div class='del'>- * A new bounce page is allocated, and the specified block(s) are encrypted into</div><div class='del'>- * it.  In the bounce page, the ciphertext block(s) will be located at the same</div><div class='del'>- * offsets at which the plaintext block(s) were located in the source page; any</div><div class='del'>- * other parts of the bounce page will be left uninitialized.  However, normally</div><div class='del'>- * blocksize == PAGE_SIZE and the whole page is encrypted at once.</div><div class='add'>+ * In the bounce page, the ciphertext data will be located at the same offset at</div><div class='add'>+ * which the plaintext data was located in the source page.  Any other parts of</div><div class='add'>+ * the bounce page will be left uninitialized.</div><div class='ctx'>  *</div><div class='ctx'>  * This is for use by the filesystem's -&gt;writepages() method.</div><div class='ctx'>  *</div><div class='hunk'>@@ -161,42 +169,41 @@ int fscrypt_crypt_block(const struct inode *inode, fscrypt_direction_t rw,</div><div class='ctx'>  *</div><div class='ctx'>  * Return: the new encrypted bounce page on success; an ERR_PTR() on failure</div><div class='ctx'>  */</div><div class='del'>-struct page *fscrypt_encrypt_pagecache_blocks(struct page *page,</div><div class='del'>-					      unsigned int len,</div><div class='del'>-					      unsigned int offs,</div><div class='del'>-					      gfp_t gfp_flags)</div><div class='del'>-</div><div class='add'>+struct page *fscrypt_encrypt_pagecache_blocks(struct folio *folio,</div><div class='add'>+		size_t len, size_t offs, gfp_t gfp_flags)</div><div class='ctx'> {</div><div class='del'>-	const struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-	const unsigned int blockbits = inode-&gt;i_blkbits;</div><div class='del'>-	const unsigned int blocksize = 1 &lt;&lt; blockbits;</div><div class='add'>+	const struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+	const struct fscrypt_inode_info *ci = fscrypt_get_inode_info_raw(inode);</div><div class='add'>+	const unsigned int du_bits = ci-&gt;ci_data_unit_bits;</div><div class='add'>+	const unsigned int du_size = 1U &lt;&lt; du_bits;</div><div class='ctx'> 	struct page *ciphertext_page;</div><div class='del'>-	u64 lblk_num = ((u64)page-&gt;index &lt;&lt; (PAGE_SHIFT - blockbits)) +</div><div class='del'>-		       (offs &gt;&gt; blockbits);</div><div class='add'>+	u64 index = ((u64)folio-&gt;index &lt;&lt; (PAGE_SHIFT - du_bits)) +</div><div class='add'>+		    (offs &gt;&gt; du_bits);</div><div class='ctx'> 	unsigned int i;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	if (WARN_ON_ONCE(!PageLocked(page)))</div><div class='add'>+	VM_BUG_ON_FOLIO(folio_test_large(folio), folio);</div><div class='add'>+	if (WARN_ON_ONCE(!folio_test_locked(folio)))</div><div class='ctx'> 		return ERR_PTR(-EINVAL);</div><div class='ctx'> </div><div class='del'>-	if (WARN_ON_ONCE(len &lt;= 0 || !IS_ALIGNED(len | offs, blocksize)))</div><div class='add'>+	if (WARN_ON_ONCE(len &lt;= 0 || !IS_ALIGNED(len | offs, du_size)))</div><div class='ctx'> 		return ERR_PTR(-EINVAL);</div><div class='ctx'> </div><div class='ctx'> 	ciphertext_page = fscrypt_alloc_bounce_page(gfp_flags);</div><div class='ctx'> 	if (!ciphertext_page)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='del'>-	for (i = offs; i &lt; offs + len; i += blocksize, lblk_num++) {</div><div class='del'>-		err = fscrypt_crypt_block(inode, FS_ENCRYPT, lblk_num,</div><div class='del'>-					  page, ciphertext_page,</div><div class='del'>-					  blocksize, i, gfp_flags);</div><div class='add'>+	for (i = offs; i &lt; offs + len; i += du_size, index++) {</div><div class='add'>+		err = fscrypt_crypt_data_unit(ci, FS_ENCRYPT, index,</div><div class='add'>+					      &amp;folio-&gt;page, ciphertext_page,</div><div class='add'>+					      du_size, i);</div><div class='ctx'> 		if (err) {</div><div class='ctx'> 			fscrypt_free_bounce_page(ciphertext_page);</div><div class='ctx'> 			return ERR_PTR(err);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	SetPagePrivate(ciphertext_page);</div><div class='del'>-	set_page_private(ciphertext_page, (unsigned long)page);</div><div class='add'>+	set_page_private(ciphertext_page, (unsigned long)folio);</div><div class='ctx'> 	return ciphertext_page;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(fscrypt_encrypt_pagecache_blocks);</div><div class='hunk'>@@ -205,65 +212,69 @@ EXPORT_SYMBOL(fscrypt_encrypt_pagecache_blocks);</div><div class='ctx'>  * fscrypt_encrypt_block_inplace() - Encrypt a filesystem block in-place</div><div class='ctx'>  * @inode:     The inode to which this block belongs</div><div class='ctx'>  * @page:      The page containing the block to encrypt</div><div class='del'>- * @len:       Size of block to encrypt.  Doesn't need to be a multiple of the</div><div class='del'>- *		fs block size, but must be a multiple of FS_CRYPTO_BLOCK_SIZE.</div><div class='add'>+ * @len:       Size of block to encrypt.  This must be a multiple of</div><div class='add'>+ *		FSCRYPT_CONTENTS_ALIGNMENT.</div><div class='ctx'>  * @offs:      Byte offset within @page at which the block to encrypt begins</div><div class='ctx'>  * @lblk_num:  Filesystem logical block number of the block, i.e. the 0-based</div><div class='ctx'>  *		number of the block within the file</div><div class='del'>- * @gfp_flags: Memory allocation flags</div><div class='ctx'>  *</div><div class='ctx'>  * Encrypt a possibly-compressed filesystem block that is located in an</div><div class='ctx'>  * arbitrary page, not necessarily in the original pagecache page.  The @inode</div><div class='ctx'>  * and @lblk_num must be specified, as they can't be determined from @page.</div><div class='ctx'>  *</div><div class='add'>+ * This is not compatible with fscrypt_operations::supports_subblock_data_units.</div><div class='add'>+ *</div><div class='ctx'>  * Return: 0 on success; -errno on failure</div><div class='ctx'>  */</div><div class='ctx'> int fscrypt_encrypt_block_inplace(const struct inode *inode, struct page *page,</div><div class='ctx'> 				  unsigned int len, unsigned int offs,</div><div class='del'>-				  u64 lblk_num, gfp_t gfp_flags)</div><div class='add'>+				  u64 lblk_num)</div><div class='ctx'> {</div><div class='del'>-	return fscrypt_crypt_block(inode, FS_ENCRYPT, lblk_num, page, page,</div><div class='del'>-				   len, offs, gfp_flags);</div><div class='add'>+	if (WARN_ON_ONCE(inode-&gt;i_sb-&gt;s_cop-&gt;supports_subblock_data_units))</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+	return fscrypt_crypt_data_unit(fscrypt_get_inode_info_raw(inode),</div><div class='add'>+				       FS_ENCRYPT, lblk_num, page, page, len,</div><div class='add'>+				       offs);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(fscrypt_encrypt_block_inplace);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * fscrypt_decrypt_pagecache_blocks() - Decrypt filesystem blocks in a</div><div class='del'>- *					pagecache page</div><div class='del'>- * @page:      The locked pagecache page containing the block(s) to decrypt</div><div class='del'>- * @len:       Total size of the block(s) to decrypt.  Must be a nonzero</div><div class='del'>- *		multiple of the filesystem's block size.</div><div class='del'>- * @offs:      Byte offset within @page of the first block to decrypt.  Must be</div><div class='del'>- *		a multiple of the filesystem's block size.</div><div class='add'>+ * fscrypt_decrypt_pagecache_blocks() - Decrypt data from a pagecache folio</div><div class='add'>+ * @folio: the pagecache folio containing the data to decrypt</div><div class='add'>+ * @len: size of the data to decrypt, in bytes</div><div class='add'>+ * @offs: offset within @folio of the data to decrypt, in bytes</div><div class='ctx'>  *</div><div class='del'>- * The specified block(s) are decrypted in-place within the pagecache page,</div><div class='del'>- * which must still be locked and not uptodate.  Normally, blocksize ==</div><div class='del'>- * PAGE_SIZE and the whole page is decrypted at once.</div><div class='del'>- *</div><div class='del'>- * This is for use by the filesystem's -&gt;readpages() method.</div><div class='add'>+ * Decrypt data that has just been read from an encrypted file.  The data must</div><div class='add'>+ * be located in a pagecache folio that is still locked and not yet uptodate.</div><div class='add'>+ * The length and offset of the data must be aligned to the file's crypto data</div><div class='add'>+ * unit size.  Alignment to the filesystem block size fulfills this requirement,</div><div class='add'>+ * as the filesystem block size is always a multiple of the data unit size.</div><div class='ctx'>  *</div><div class='ctx'>  * Return: 0 on success; -errno on failure</div><div class='ctx'>  */</div><div class='del'>-int fscrypt_decrypt_pagecache_blocks(struct page *page, unsigned int len,</div><div class='del'>-				     unsigned int offs)</div><div class='add'>+int fscrypt_decrypt_pagecache_blocks(struct folio *folio, size_t len,</div><div class='add'>+				     size_t offs)</div><div class='ctx'> {</div><div class='del'>-	const struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-	const unsigned int blockbits = inode-&gt;i_blkbits;</div><div class='del'>-	const unsigned int blocksize = 1 &lt;&lt; blockbits;</div><div class='del'>-	u64 lblk_num = ((u64)page-&gt;index &lt;&lt; (PAGE_SHIFT - blockbits)) +</div><div class='del'>-		       (offs &gt;&gt; blockbits);</div><div class='del'>-	unsigned int i;</div><div class='add'>+	const struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+	const struct fscrypt_inode_info *ci = fscrypt_get_inode_info_raw(inode);</div><div class='add'>+	const unsigned int du_bits = ci-&gt;ci_data_unit_bits;</div><div class='add'>+	const unsigned int du_size = 1U &lt;&lt; du_bits;</div><div class='add'>+	u64 index = ((u64)folio-&gt;index &lt;&lt; (PAGE_SHIFT - du_bits)) +</div><div class='add'>+		    (offs &gt;&gt; du_bits);</div><div class='add'>+	size_t i;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	if (WARN_ON_ONCE(!PageLocked(page)))</div><div class='add'>+	if (WARN_ON_ONCE(!folio_test_locked(folio)))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	if (WARN_ON_ONCE(len &lt;= 0 || !IS_ALIGNED(len | offs, blocksize)))</div><div class='add'>+	if (WARN_ON_ONCE(len &lt;= 0 || !IS_ALIGNED(len | offs, du_size)))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	for (i = offs; i &lt; offs + len; i += blocksize, lblk_num++) {</div><div class='del'>-		err = fscrypt_crypt_block(inode, FS_DECRYPT, lblk_num, page,</div><div class='del'>-					  page, blocksize, i, GFP_NOFS);</div><div class='add'>+	for (i = offs; i &lt; offs + len; i += du_size, index++) {</div><div class='add'>+		struct page *page = folio_page(folio, i &gt;&gt; PAGE_SHIFT);</div><div class='add'>+</div><div class='add'>+		err = fscrypt_crypt_data_unit(ci, FS_DECRYPT, index, page,</div><div class='add'>+					      page, du_size, i &amp; ~PAGE_MASK);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			return err;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -275,8 +286,8 @@ EXPORT_SYMBOL(fscrypt_decrypt_pagecache_blocks);</div><div class='ctx'>  * fscrypt_decrypt_block_inplace() - Decrypt a filesystem block in-place</div><div class='ctx'>  * @inode:     The inode to which this block belongs</div><div class='ctx'>  * @page:      The page containing the block to decrypt</div><div class='del'>- * @len:       Size of block to decrypt.  Doesn't need to be a multiple of the</div><div class='del'>- *		fs block size, but must be a multiple of FS_CRYPTO_BLOCK_SIZE.</div><div class='add'>+ * @len:       Size of block to decrypt.  This must be a multiple of</div><div class='add'>+ *		FSCRYPT_CONTENTS_ALIGNMENT.</div><div class='ctx'>  * @offs:      Byte offset within @page at which the block to decrypt begins</div><div class='ctx'>  * @lblk_num:  Filesystem logical block number of the block, i.e. the 0-based</div><div class='ctx'>  *		number of the block within the file</div><div class='hunk'>@@ -285,32 +296,42 @@ EXPORT_SYMBOL(fscrypt_decrypt_pagecache_blocks);</div><div class='ctx'>  * arbitrary page, not necessarily in the original pagecache page.  The @inode</div><div class='ctx'>  * and @lblk_num must be specified, as they can't be determined from @page.</div><div class='ctx'>  *</div><div class='add'>+ * This is not compatible with fscrypt_operations::supports_subblock_data_units.</div><div class='add'>+ *</div><div class='ctx'>  * Return: 0 on success; -errno on failure</div><div class='ctx'>  */</div><div class='ctx'> int fscrypt_decrypt_block_inplace(const struct inode *inode, struct page *page,</div><div class='ctx'> 				  unsigned int len, unsigned int offs,</div><div class='ctx'> 				  u64 lblk_num)</div><div class='ctx'> {</div><div class='del'>-	return fscrypt_crypt_block(inode, FS_DECRYPT, lblk_num, page, page,</div><div class='del'>-				   len, offs, GFP_NOFS);</div><div class='add'>+	if (WARN_ON_ONCE(inode-&gt;i_sb-&gt;s_cop-&gt;supports_subblock_data_units))</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+	return fscrypt_crypt_data_unit(fscrypt_get_inode_info_raw(inode),</div><div class='add'>+				       FS_DECRYPT, lblk_num, page, page, len,</div><div class='add'>+				       offs);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(fscrypt_decrypt_block_inplace);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * fscrypt_initialize() - allocate major buffers for fs encryption.</div><div class='del'>- * @cop_flags:  fscrypt operations flags</div><div class='add'>+ * @sb: the filesystem superblock</div><div class='ctx'>  *</div><div class='ctx'>  * We only call this when we start accessing encrypted files, since it</div><div class='ctx'>  * results in memory getting allocated that wouldn't otherwise be used.</div><div class='ctx'>  *</div><div class='ctx'>  * Return: 0 on success; -errno on failure</div><div class='ctx'>  */</div><div class='del'>-int fscrypt_initialize(unsigned int cop_flags)</div><div class='add'>+int fscrypt_initialize(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	int err = 0;</div><div class='add'>+	mempool_t *pool;</div><div class='add'>+</div><div class='add'>+	/* pairs with smp_store_release() below */</div><div class='add'>+	if (likely(smp_load_acquire(&amp;fscrypt_bounce_page_pool)))</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/* No need to allocate a bounce page pool if this FS won't use it. */</div><div class='del'>-	if (cop_flags &amp; FS_CFLG_OWN_PAGES)</div><div class='add'>+	if (!sb-&gt;s_cop-&gt;needs_bounce_pages)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;fscrypt_init_mutex);</div><div class='hunk'>@@ -318,11 +339,11 @@ int fscrypt_initialize(unsigned int cop_flags)</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='ctx'> 	err = -ENOMEM;</div><div class='del'>-	fscrypt_bounce_page_pool =</div><div class='del'>-		mempool_create_page_pool(num_prealloc_crypto_pages, 0);</div><div class='del'>-	if (!fscrypt_bounce_page_pool)</div><div class='add'>+	pool = mempool_create_page_pool(num_prealloc_crypto_pages, 0);</div><div class='add'>+	if (!pool)</div><div class='ctx'> 		goto out_unlock;</div><div class='del'>-</div><div class='add'>+	/* pairs with smp_load_acquire() above */</div><div class='add'>+	smp_store_release(&amp;fscrypt_bounce_page_pool, pool);</div><div class='ctx'> 	err = 0;</div><div class='ctx'> out_unlock:</div><div class='ctx'> 	mutex_unlock(&amp;fscrypt_init_mutex);</div><div class='hunk'>@@ -376,18 +397,19 @@ static int __init fscrypt_init(void)</div><div class='ctx'> 	if (!fscrypt_read_workqueue)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> </div><div class='del'>-	fscrypt_info_cachep = KMEM_CACHE(fscrypt_info, SLAB_RECLAIM_ACCOUNT);</div><div class='del'>-	if (!fscrypt_info_cachep)</div><div class='add'>+	fscrypt_inode_info_cachep = KMEM_CACHE(fscrypt_inode_info,</div><div class='add'>+					       SLAB_RECLAIM_ACCOUNT);</div><div class='add'>+	if (!fscrypt_inode_info_cachep)</div><div class='ctx'> 		goto fail_free_queue;</div><div class='ctx'> </div><div class='ctx'> 	err = fscrypt_init_keyring();</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto fail_free_info;</div><div class='add'>+		goto fail_free_inode_info;</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='del'>-fail_free_info:</div><div class='del'>-	kmem_cache_destroy(fscrypt_info_cachep);</div><div class='add'>+fail_free_inode_info:</div><div class='add'>+	kmem_cache_destroy(fscrypt_inode_info_cachep);</div><div class='ctx'> fail_free_queue:</div><div class='ctx'> 	destroy_workqueue(fscrypt_read_workqueue);</div><div class='ctx'> fail:</div><div class='head'>diff --git a/fs/crypto/fname.c b/fs/crypto/fname.c<br/>index a9be4bc74a94..a9a4432d12ba 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/crypto/fname.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/crypto/fname.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/crypto/fname.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/crypto/fname.c</a></div><div class='hunk'>@@ -11,14 +11,23 @@</div><div class='ctx'>  * This has not yet undergone a rigorous security audit.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-#include &lt;linux/namei.h&gt;</div><div class='del'>-#include &lt;linux/scatterlist.h&gt;</div><div class='del'>-#include &lt;crypto/hash.h&gt;</div><div class='ctx'> #include &lt;crypto/sha2.h&gt;</div><div class='ctx'> #include &lt;crypto/skcipher.h&gt;</div><div class='add'>+#include &lt;linux/export.h&gt;</div><div class='add'>+#include &lt;linux/namei.h&gt;</div><div class='add'>+#include &lt;linux/scatterlist.h&gt;</div><div class='add'>+#include &lt;linux/base64.h&gt;</div><div class='add'>+</div><div class='ctx'> #include "fscrypt_private.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * The minimum message length (input and output length), in bytes, for all</div><div class='add'>+ * filenames encryption modes.  Filenames shorter than this will be zero-padded</div><div class='add'>+ * before being encrypted.</div><div class='add'>+ */</div><div class='add'>+#define FSCRYPT_FNAME_MIN_MSG_LEN 16</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * struct fscrypt_nokey_name - identifier for directory entry when key is absent</div><div class='ctx'>  *</div><div class='ctx'>  * When userspace lists an encrypted directory without access to the key, the</div><div class='hunk'>@@ -63,23 +72,18 @@ struct fscrypt_nokey_name {</div><div class='ctx'> </div><div class='ctx'> /* Encoded size of max-size no-key name */</div><div class='ctx'> #define FSCRYPT_NOKEY_NAME_MAX_ENCODED \</div><div class='del'>-		FSCRYPT_BASE64URL_CHARS(FSCRYPT_NOKEY_NAME_MAX)</div><div class='add'>+		BASE64_CHARS(FSCRYPT_NOKEY_NAME_MAX)</div><div class='ctx'> </div><div class='ctx'> static inline bool fscrypt_is_dot_dotdot(const struct qstr *str)</div><div class='ctx'> {</div><div class='del'>-	if (str-&gt;len == 1 &amp;&amp; str-&gt;name[0] == '.')</div><div class='del'>-		return true;</div><div class='del'>-</div><div class='del'>-	if (str-&gt;len == 2 &amp;&amp; str-&gt;name[0] == '.' &amp;&amp; str-&gt;name[1] == '.')</div><div class='del'>-		return true;</div><div class='del'>-</div><div class='del'>-	return false;</div><div class='add'>+	return is_dot_dotdot(str-&gt;name, str-&gt;len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * fscrypt_fname_encrypt() - encrypt a filename</div><div class='ctx'>  * @inode: inode of the parent directory (for regular filenames)</div><div class='del'>- *	   or of the symlink (for symlink targets)</div><div class='add'>+ *	   or of the symlink (for symlink targets). Key must already be</div><div class='add'>+ *	   set up.</div><div class='ctx'>  * @iname: the filename to encrypt</div><div class='ctx'>  * @out: (output) the encrypted filename</div><div class='ctx'>  * @olen: size of the encrypted filename.  It must be at least @iname-&gt;len.</div><div class='hunk'>@@ -90,46 +94,35 @@ static inline bool fscrypt_is_dot_dotdot(const struct qstr *str)</div><div class='ctx'> int fscrypt_fname_encrypt(const struct inode *inode, const struct qstr *iname,</div><div class='ctx'> 			  u8 *out, unsigned int olen)</div><div class='ctx'> {</div><div class='del'>-	struct skcipher_request *req = NULL;</div><div class='del'>-	DECLARE_CRYPTO_WAIT(wait);</div><div class='del'>-	const struct fscrypt_info *ci = inode-&gt;i_crypt_info;</div><div class='del'>-	struct crypto_skcipher *tfm = ci-&gt;ci_enc_key.tfm;</div><div class='add'>+	const struct fscrypt_inode_info *ci = fscrypt_get_inode_info_raw(inode);</div><div class='add'>+	struct crypto_sync_skcipher *tfm = ci-&gt;ci_enc_key.tfm;</div><div class='add'>+	SYNC_SKCIPHER_REQUEST_ON_STACK(req, tfm);</div><div class='ctx'> 	union fscrypt_iv iv;</div><div class='ctx'> 	struct scatterlist sg;</div><div class='del'>-	int res;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Copy the filename to the output buffer for encrypting in-place and</div><div class='ctx'> 	 * pad it with the needed number of NUL bytes.</div><div class='ctx'> 	 */</div><div class='del'>-	if (WARN_ON(olen &lt; iname-&gt;len))</div><div class='add'>+	if (WARN_ON_ONCE(olen &lt; iname-&gt;len))</div><div class='ctx'> 		return -ENOBUFS;</div><div class='ctx'> 	memcpy(out, iname-&gt;name, iname-&gt;len);</div><div class='ctx'> 	memset(out + iname-&gt;len, 0, olen - iname-&gt;len);</div><div class='ctx'> </div><div class='del'>-	/* Initialize the IV */</div><div class='ctx'> 	fscrypt_generate_iv(&amp;iv, 0, ci);</div><div class='ctx'> </div><div class='del'>-	/* Set up the encryption request */</div><div class='del'>-	req = skcipher_request_alloc(tfm, GFP_NOFS);</div><div class='del'>-	if (!req)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	skcipher_request_set_callback(req,</div><div class='del'>-			CRYPTO_TFM_REQ_MAY_BACKLOG | CRYPTO_TFM_REQ_MAY_SLEEP,</div><div class='del'>-			crypto_req_done, &amp;wait);</div><div class='add'>+	skcipher_request_set_callback(</div><div class='add'>+		req, CRYPTO_TFM_REQ_MAY_BACKLOG | CRYPTO_TFM_REQ_MAY_SLEEP,</div><div class='add'>+		NULL, NULL);</div><div class='ctx'> 	sg_init_one(&amp;sg, out, olen);</div><div class='ctx'> 	skcipher_request_set_crypt(req, &amp;sg, &amp;sg, olen, &amp;iv);</div><div class='del'>-</div><div class='del'>-	/* Do the encryption */</div><div class='del'>-	res = crypto_wait_req(crypto_skcipher_encrypt(req), &amp;wait);</div><div class='del'>-	skcipher_request_free(req);</div><div class='del'>-	if (res &lt; 0) {</div><div class='del'>-		fscrypt_err(inode, "Filename encryption failed: %d", res);</div><div class='del'>-		return res;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='add'>+	err = crypto_skcipher_encrypt(req);</div><div class='add'>+	if (err)</div><div class='add'>+		fscrypt_err(inode, "Filename encryption failed: %d", err);</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL_GPL(fscrypt_fname_encrypt);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * fname_decrypt() - decrypt a filename</div><div class='hunk'>@@ -145,121 +138,34 @@ static int fname_decrypt(const struct inode *inode,</div><div class='ctx'> 			 const struct fscrypt_str *iname,</div><div class='ctx'> 			 struct fscrypt_str *oname)</div><div class='ctx'> {</div><div class='del'>-	struct skcipher_request *req = NULL;</div><div class='del'>-	DECLARE_CRYPTO_WAIT(wait);</div><div class='del'>-	struct scatterlist src_sg, dst_sg;</div><div class='del'>-	const struct fscrypt_info *ci = inode-&gt;i_crypt_info;</div><div class='del'>-	struct crypto_skcipher *tfm = ci-&gt;ci_enc_key.tfm;</div><div class='add'>+	const struct fscrypt_inode_info *ci = fscrypt_get_inode_info_raw(inode);</div><div class='add'>+	struct crypto_sync_skcipher *tfm = ci-&gt;ci_enc_key.tfm;</div><div class='add'>+	SYNC_SKCIPHER_REQUEST_ON_STACK(req, tfm);</div><div class='ctx'> 	union fscrypt_iv iv;</div><div class='del'>-	int res;</div><div class='del'>-</div><div class='del'>-	/* Allocate request */</div><div class='del'>-	req = skcipher_request_alloc(tfm, GFP_NOFS);</div><div class='del'>-	if (!req)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	skcipher_request_set_callback(req,</div><div class='del'>-		CRYPTO_TFM_REQ_MAY_BACKLOG | CRYPTO_TFM_REQ_MAY_SLEEP,</div><div class='del'>-		crypto_req_done, &amp;wait);</div><div class='add'>+	struct scatterlist src_sg, dst_sg;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='del'>-	/* Initialize IV */</div><div class='ctx'> 	fscrypt_generate_iv(&amp;iv, 0, ci);</div><div class='ctx'> </div><div class='del'>-	/* Create decryption request */</div><div class='add'>+	skcipher_request_set_callback(</div><div class='add'>+		req, CRYPTO_TFM_REQ_MAY_BACKLOG | CRYPTO_TFM_REQ_MAY_SLEEP,</div><div class='add'>+		NULL, NULL);</div><div class='ctx'> 	sg_init_one(&amp;src_sg, iname-&gt;name, iname-&gt;len);</div><div class='ctx'> 	sg_init_one(&amp;dst_sg, oname-&gt;name, oname-&gt;len);</div><div class='ctx'> 	skcipher_request_set_crypt(req, &amp;src_sg, &amp;dst_sg, iname-&gt;len, &amp;iv);</div><div class='del'>-	res = crypto_wait_req(crypto_skcipher_decrypt(req), &amp;wait);</div><div class='del'>-	skcipher_request_free(req);</div><div class='del'>-	if (res &lt; 0) {</div><div class='del'>-		fscrypt_err(inode, "Filename decryption failed: %d", res);</div><div class='del'>-		return res;</div><div class='add'>+	err = crypto_skcipher_decrypt(req);</div><div class='add'>+	if (err) {</div><div class='add'>+		fscrypt_err(inode, "Filename decryption failed: %d", err);</div><div class='add'>+		return err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	oname-&gt;len = strnlen(oname-&gt;name, iname-&gt;len);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static const char base64url_table[65] =</div><div class='del'>-	"ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789-_";</div><div class='del'>-</div><div class='del'>-#define FSCRYPT_BASE64URL_CHARS(nbytes)	DIV_ROUND_UP((nbytes) * 4, 3)</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * fscrypt_base64url_encode() - base64url-encode some binary data</div><div class='del'>- * @src: the binary data to encode</div><div class='del'>- * @srclen: the length of @src in bytes</div><div class='del'>- * @dst: (output) the base64url-encoded string.  Not NUL-terminated.</div><div class='del'>- *</div><div class='del'>- * Encodes data using base64url encoding, i.e. the "Base 64 Encoding with URL</div><div class='del'>- * and Filename Safe Alphabet" specified by RFC 4648.  '='-padding isn't used,</div><div class='del'>- * as it's unneeded and not required by the RFC.  base64url is used instead of</div><div class='del'>- * base64 to avoid the '/' character, which isn't allowed in filenames.</div><div class='del'>- *</div><div class='del'>- * Return: the length of the resulting base64url-encoded string in bytes.</div><div class='del'>- *	   This will be equal to FSCRYPT_BASE64URL_CHARS(srclen).</div><div class='del'>- */</div><div class='del'>-static int fscrypt_base64url_encode(const u8 *src, int srclen, char *dst)</div><div class='del'>-{</div><div class='del'>-	u32 ac = 0;</div><div class='del'>-	int bits = 0;</div><div class='del'>-	int i;</div><div class='del'>-	char *cp = dst;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; srclen; i++) {</div><div class='del'>-		ac = (ac &lt;&lt; 8) | src[i];</div><div class='del'>-		bits += 8;</div><div class='del'>-		do {</div><div class='del'>-			bits -= 6;</div><div class='del'>-			*cp++ = base64url_table[(ac &gt;&gt; bits) &amp; 0x3f];</div><div class='del'>-		} while (bits &gt;= 6);</div><div class='del'>-	}</div><div class='del'>-	if (bits)</div><div class='del'>-		*cp++ = base64url_table[(ac &lt;&lt; (6 - bits)) &amp; 0x3f];</div><div class='del'>-	return cp - dst;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * fscrypt_base64url_decode() - base64url-decode a string</div><div class='del'>- * @src: the string to decode.  Doesn't need to be NUL-terminated.</div><div class='del'>- * @srclen: the length of @src in bytes</div><div class='del'>- * @dst: (output) the decoded binary data</div><div class='del'>- *</div><div class='del'>- * Decodes a string using base64url encoding, i.e. the "Base 64 Encoding with</div><div class='del'>- * URL and Filename Safe Alphabet" specified by RFC 4648.  '='-padding isn't</div><div class='del'>- * accepted, nor are non-encoding characters such as whitespace.</div><div class='del'>- *</div><div class='del'>- * This implementation hasn't been optimized for performance.</div><div class='del'>- *</div><div class='del'>- * Return: the length of the resulting decoded binary data in bytes,</div><div class='del'>- *	   or -1 if the string isn't a valid base64url string.</div><div class='del'>- */</div><div class='del'>-static int fscrypt_base64url_decode(const char *src, int srclen, u8 *dst)</div><div class='del'>-{</div><div class='del'>-	u32 ac = 0;</div><div class='del'>-	int bits = 0;</div><div class='del'>-	int i;</div><div class='del'>-	u8 *bp = dst;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; srclen; i++) {</div><div class='del'>-		const char *p = strchr(base64url_table, src[i]);</div><div class='del'>-</div><div class='del'>-		if (p == NULL || src[i] == 0)</div><div class='del'>-			return -1;</div><div class='del'>-		ac = (ac &lt;&lt; 6) | (p - base64url_table);</div><div class='del'>-		bits += 6;</div><div class='del'>-		if (bits &gt;= 8) {</div><div class='del'>-			bits -= 8;</div><div class='del'>-			*bp++ = (u8)(ac &gt;&gt; bits);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	if (ac &amp; ((1 &lt;&lt; bits) - 1))</div><div class='del'>-		return -1;</div><div class='del'>-	return bp - dst;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-bool fscrypt_fname_encrypted_size(const union fscrypt_policy *policy,</div><div class='del'>-				  u32 orig_len, u32 max_len,</div><div class='del'>-				  u32 *encrypted_len_ret)</div><div class='add'>+bool __fscrypt_fname_encrypted_size(const union fscrypt_policy *policy,</div><div class='add'>+				    u32 orig_len, u32 max_len,</div><div class='add'>+				    u32 *encrypted_len_ret)</div><div class='ctx'> {</div><div class='ctx'> 	int padding = 4 &lt;&lt; (fscrypt_policy_flags(policy) &amp;</div><div class='ctx'> 			    FSCRYPT_POLICY_FLAGS_PAD_MASK);</div><div class='hunk'>@@ -267,13 +173,37 @@ bool fscrypt_fname_encrypted_size(const union fscrypt_policy *policy,</div><div class='ctx'> </div><div class='ctx'> 	if (orig_len &gt; max_len)</div><div class='ctx'> 		return false;</div><div class='del'>-	encrypted_len = max(orig_len, (u32)FS_CRYPTO_BLOCK_SIZE);</div><div class='add'>+	encrypted_len = max_t(u32, orig_len, FSCRYPT_FNAME_MIN_MSG_LEN);</div><div class='ctx'> 	encrypted_len = round_up(encrypted_len, padding);</div><div class='ctx'> 	*encrypted_len_ret = min(encrypted_len, max_len);</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='add'>+ * fscrypt_fname_encrypted_size() - calculate length of encrypted filename</div><div class='add'>+ * @inode:		parent inode of dentry name being encrypted. Key must</div><div class='add'>+ *			already be set up.</div><div class='add'>+ * @orig_len:		length of the original filename</div><div class='add'>+ * @max_len:		maximum length to return</div><div class='add'>+ * @encrypted_len_ret:	where calculated length should be returned (on success)</div><div class='add'>+ *</div><div class='add'>+ * Filenames that are shorter than the maximum length may have their lengths</div><div class='add'>+ * increased slightly by encryption, due to padding that is applied.</div><div class='add'>+ *</div><div class='add'>+ * Return: false if the orig_len is greater than max_len. Otherwise, true and</div><div class='add'>+ *	   fill out encrypted_len_ret with the length (up to max_len).</div><div class='add'>+ */</div><div class='add'>+bool fscrypt_fname_encrypted_size(const struct inode *inode, u32 orig_len,</div><div class='add'>+				  u32 max_len, u32 *encrypted_len_ret)</div><div class='add'>+{</div><div class='add'>+	const struct fscrypt_inode_info *ci = fscrypt_get_inode_info_raw(inode);</div><div class='add'>+</div><div class='add'>+	return __fscrypt_fname_encrypted_size(&amp;ci-&gt;ci_policy, orig_len, max_len,</div><div class='add'>+					      encrypted_len_ret);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(fscrypt_fname_encrypted_size);</div><div class='add'>+</div><div class='add'>+/**</div><div class='ctx'>  * fscrypt_fname_alloc_buffer() - allocate a buffer for presented filenames</div><div class='ctx'>  * @max_encrypted_len: maximum length of encrypted filenames the buffer will be</div><div class='ctx'>  *		       used to present</div><div class='hunk'>@@ -350,7 +280,7 @@ int fscrypt_fname_disk_to_usr(const struct inode *inode,</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (iname-&gt;len &lt; FS_CRYPTO_BLOCK_SIZE)</div><div class='add'>+	if (iname-&gt;len &lt; FSCRYPT_FNAME_MIN_MSG_LEN)</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> </div><div class='ctx'> 	if (fscrypt_has_encryption_key(inode))</div><div class='hunk'>@@ -380,8 +310,8 @@ int fscrypt_fname_disk_to_usr(const struct inode *inode,</div><div class='ctx'> 		       nokey_name.sha256);</div><div class='ctx'> 		size = FSCRYPT_NOKEY_NAME_MAX;</div><div class='ctx'> 	}</div><div class='del'>-	oname-&gt;len = fscrypt_base64url_encode((const u8 *)&amp;nokey_name, size,</div><div class='del'>-					      oname-&gt;name);</div><div class='add'>+	oname-&gt;len = base64_encode((const u8 *)&amp;nokey_name, size,</div><div class='add'>+				   oname-&gt;name, false, BASE64_URLSAFE);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(fscrypt_fname_disk_to_usr);</div><div class='hunk'>@@ -428,8 +358,7 @@ int fscrypt_setup_filename(struct inode *dir, const struct qstr *iname,</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='ctx'> 	if (fscrypt_has_encryption_key(dir)) {</div><div class='del'>-		if (!fscrypt_fname_encrypted_size(&amp;dir-&gt;i_crypt_info-&gt;ci_policy,</div><div class='del'>-						  iname-&gt;len, NAME_MAX,</div><div class='add'>+		if (!fscrypt_fname_encrypted_size(dir, iname-&gt;len, NAME_MAX,</div><div class='ctx'> 						  &amp;fname-&gt;crypto_buf.len))</div><div class='ctx'> 			return -ENAMETOOLONG;</div><div class='ctx'> 		fname-&gt;crypto_buf.name = kmalloc(fname-&gt;crypto_buf.len,</div><div class='hunk'>@@ -461,8 +390,8 @@ int fscrypt_setup_filename(struct inode *dir, const struct qstr *iname,</div><div class='ctx'> 	if (fname-&gt;crypto_buf.name == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	ret = fscrypt_base64url_decode(iname-&gt;name, iname-&gt;len,</div><div class='del'>-				       fname-&gt;crypto_buf.name);</div><div class='add'>+	ret = base64_decode(iname-&gt;name, iname-&gt;len,</div><div class='add'>+			    fname-&gt;crypto_buf.name, false, BASE64_URLSAFE);</div><div class='ctx'> 	if (ret &lt; (int)offsetof(struct fscrypt_nokey_name, bytes[1]) ||</div><div class='ctx'> 	    (ret &gt; offsetof(struct fscrypt_nokey_name, sha256) &amp;&amp;</div><div class='ctx'> 	     ret != FSCRYPT_NOKEY_NAME_MAX)) {</div><div class='hunk'>@@ -537,9 +466,9 @@ EXPORT_SYMBOL_GPL(fscrypt_match_name);</div><div class='ctx'>  */</div><div class='ctx'> u64 fscrypt_fname_siphash(const struct inode *dir, const struct qstr *name)</div><div class='ctx'> {</div><div class='del'>-	const struct fscrypt_info *ci = dir-&gt;i_crypt_info;</div><div class='add'>+	const struct fscrypt_inode_info *ci = fscrypt_get_inode_info_raw(dir);</div><div class='ctx'> </div><div class='del'>-	WARN_ON(!ci-&gt;ci_dirhash_key_initialized);</div><div class='add'>+	WARN_ON_ONCE(!ci-&gt;ci_dirhash_key_initialized);</div><div class='ctx'> </div><div class='ctx'> 	return siphash(name-&gt;name, name-&gt;len, &amp;ci-&gt;ci_dirhash_key);</div><div class='ctx'> }</div><div class='hunk'>@@ -549,11 +478,10 @@ EXPORT_SYMBOL_GPL(fscrypt_fname_siphash);</div><div class='ctx'>  * Validate dentries in encrypted directories to make sure we aren't potentially</div><div class='ctx'>  * caching stale dentries after a key has been added.</div><div class='ctx'>  */</div><div class='del'>-int fscrypt_d_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='add'>+int fscrypt_d_revalidate(struct inode *dir, const struct qstr *name,</div><div class='add'>+			 struct dentry *dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *dir;</div><div class='ctx'> 	int err;</div><div class='del'>-	int valid;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Plaintext names are always valid, since fscrypt doesn't support</div><div class='hunk'>@@ -566,30 +494,21 @@ int fscrypt_d_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * No-key name; valid if the directory's key is still unavailable.</div><div class='ctx'> 	 *</div><div class='del'>-	 * Although fscrypt forbids rename() on no-key names, we still must use</div><div class='del'>-	 * dget_parent() here rather than use -&gt;d_parent directly.  That's</div><div class='del'>-	 * because a corrupted fs image may contain directory hard links, which</div><div class='del'>-	 * the VFS handles by moving the directory's dentry tree in the dcache</div><div class='del'>-	 * each time -&gt;lookup() finds the directory and it already has a dentry</div><div class='del'>-	 * elsewhere.  Thus -&gt;d_parent can be changing, and we must safely grab</div><div class='del'>-	 * a reference to some -&gt;d_parent to prevent it from being freed.</div><div class='add'>+	 * Note in RCU mode we have to bail if we get here -</div><div class='add'>+	 * fscrypt_get_encryption_info() may block.</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; LOOKUP_RCU)</div><div class='ctx'> 		return -ECHILD;</div><div class='ctx'> </div><div class='del'>-	dir = dget_parent(dentry);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Pass allow_unsupported=true, so that files with an unsupported</div><div class='ctx'> 	 * encryption policy can be deleted.</div><div class='ctx'> 	 */</div><div class='del'>-	err = fscrypt_get_encryption_info(d_inode(dir), true);</div><div class='del'>-	valid = !fscrypt_has_encryption_key(d_inode(dir));</div><div class='del'>-	dput(dir);</div><div class='del'>-</div><div class='add'>+	err = fscrypt_get_encryption_info(dir, true);</div><div class='ctx'> 	if (err &lt; 0)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	return valid;</div><div class='add'>+	return !fscrypt_has_encryption_key(dir);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(fscrypt_d_revalidate);</div><div class='head'>diff --git a/fs/crypto/fscrypt_private.h b/fs/crypto/fscrypt_private.h<br/>index 5b0a9e6478b5..4e8e82a9ccf9 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/crypto/fscrypt_private.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/crypto/fscrypt_private.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/crypto/fscrypt_private.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/crypto/fscrypt_private.h</a></div><div class='hunk'>@@ -11,9 +11,10 @@</div><div class='ctx'> #ifndef _FSCRYPT_PRIVATE_H</div><div class='ctx'> #define _FSCRYPT_PRIVATE_H</div><div class='ctx'> </div><div class='add'>+#include &lt;crypto/sha2.h&gt;</div><div class='ctx'> #include &lt;linux/fscrypt.h&gt;</div><div class='add'>+#include &lt;linux/minmax.h&gt;</div><div class='ctx'> #include &lt;linux/siphash.h&gt;</div><div class='del'>-#include &lt;crypto/hash.h&gt;</div><div class='ctx'> #include &lt;linux/blk-crypto.h&gt;</div><div class='ctx'> </div><div class='ctx'> #define CONST_STRLEN(str)	(sizeof(str) - 1)</div><div class='hunk'>@@ -27,11 +28,46 @@</div><div class='ctx'>  */</div><div class='ctx'> #define FSCRYPT_MIN_KEY_SIZE	16</div><div class='ctx'> </div><div class='add'>+/* Maximum size of a raw fscrypt master key */</div><div class='add'>+#define FSCRYPT_MAX_RAW_KEY_SIZE	64</div><div class='add'>+</div><div class='add'>+/* Maximum size of a hardware-wrapped fscrypt master key */</div><div class='add'>+#define FSCRYPT_MAX_HW_WRAPPED_KEY_SIZE	BLK_CRYPTO_MAX_HW_WRAPPED_KEY_SIZE</div><div class='add'>+</div><div class='add'>+/* Maximum size of an fscrypt master key across both key types */</div><div class='add'>+#define FSCRYPT_MAX_ANY_KEY_SIZE \</div><div class='add'>+	MAX(FSCRYPT_MAX_RAW_KEY_SIZE, FSCRYPT_MAX_HW_WRAPPED_KEY_SIZE)</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * FSCRYPT_MAX_KEY_SIZE is defined in the UAPI header, but the addition of</div><div class='add'>+ * hardware-wrapped keys has made it misleading as it's only for raw keys.</div><div class='add'>+ * Don't use it in kernel code; use one of the above constants instead.</div><div class='add'>+ */</div><div class='add'>+#undef FSCRYPT_MAX_KEY_SIZE</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * This mask is passed as the third argument to the crypto_alloc_*() functions</div><div class='add'>+ * to prevent fscrypt from using the Crypto API drivers for non-inline crypto</div><div class='add'>+ * engines.  Those drivers have been problematic for fscrypt.  fscrypt users</div><div class='add'>+ * have reported hangs and even incorrect en/decryption with these drivers.</div><div class='add'>+ * Since going to the driver, off CPU, and back again is really slow, such</div><div class='add'>+ * drivers can be over 50 times slower than the CPU-based code for fscrypt's</div><div class='add'>+ * workload.  Even on platforms that lack AES instructions on the CPU, using the</div><div class='add'>+ * offloads has been shown to be slower, even staying with AES.  (Of course,</div><div class='add'>+ * Adiantum is faster still, and is the recommended option on such platforms...)</div><div class='add'>+ *</div><div class='add'>+ * Note that fscrypt also supports inline crypto engines.  Those don't use the</div><div class='add'>+ * Crypto API and work much better than the old-style (non-inline) engines.</div><div class='add'>+ */</div><div class='add'>+#define FSCRYPT_CRYPTOAPI_MASK                            \</div><div class='add'>+	(CRYPTO_ALG_ASYNC | CRYPTO_ALG_ALLOCATES_MEMORY | \</div><div class='add'>+	 CRYPTO_ALG_KERN_DRIVER_ONLY)</div><div class='add'>+</div><div class='ctx'> #define FSCRYPT_CONTEXT_V1	1</div><div class='ctx'> #define FSCRYPT_CONTEXT_V2	2</div><div class='ctx'> </div><div class='ctx'> /* Keep this in sync with include/uapi/linux/fscrypt.h */</div><div class='del'>-#define FSCRYPT_MODE_MAX	FSCRYPT_MODE_ADIANTUM</div><div class='add'>+#define FSCRYPT_MODE_MAX	FSCRYPT_MODE_AES_256_HCTR2</div><div class='ctx'> </div><div class='ctx'> struct fscrypt_context_v1 {</div><div class='ctx'> 	u8 version; /* FSCRYPT_CONTEXT_V1 */</div><div class='hunk'>@@ -47,7 +83,8 @@ struct fscrypt_context_v2 {</div><div class='ctx'> 	u8 contents_encryption_mode;</div><div class='ctx'> 	u8 filenames_encryption_mode;</div><div class='ctx'> 	u8 flags;</div><div class='del'>-	u8 __reserved[4];</div><div class='add'>+	u8 log2_data_unit_size;</div><div class='add'>+	u8 __reserved[3];</div><div class='ctx'> 	u8 master_key_identifier[FSCRYPT_KEY_IDENTIFIER_SIZE];</div><div class='ctx'> 	u8 nonce[FSCRYPT_FILE_NONCE_SIZE];</div><div class='ctx'> };</div><div class='hunk'>@@ -101,7 +138,7 @@ static inline const u8 *fscrypt_context_nonce(const union fscrypt_context *ctx)</div><div class='ctx'> 	case FSCRYPT_CONTEXT_V2:</div><div class='ctx'> 		return ctx-&gt;v2.nonce;</div><div class='ctx'> 	}</div><div class='del'>-	WARN_ON(1);</div><div class='add'>+	WARN_ON_ONCE(1);</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -165,13 +202,33 @@ fscrypt_policy_flags(const union fscrypt_policy *policy)</div><div class='ctx'> 	BUG();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline int</div><div class='add'>+fscrypt_policy_v2_du_bits(const struct fscrypt_policy_v2 *policy,</div><div class='add'>+			  const struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	return policy-&gt;log2_data_unit_size ?: inode-&gt;i_blkbits;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int</div><div class='add'>+fscrypt_policy_du_bits(const union fscrypt_policy *policy,</div><div class='add'>+		       const struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	switch (policy-&gt;version) {</div><div class='add'>+	case FSCRYPT_POLICY_V1:</div><div class='add'>+		return inode-&gt;i_blkbits;</div><div class='add'>+	case FSCRYPT_POLICY_V2:</div><div class='add'>+		return fscrypt_policy_v2_du_bits(&amp;policy-&gt;v2, inode);</div><div class='add'>+	}</div><div class='add'>+	BUG();</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * For encrypted symlinks, the ciphertext length is stored at the beginning</div><div class='ctx'>  * of the string in little-endian format.</div><div class='ctx'>  */</div><div class='ctx'> struct fscrypt_symlink_data {</div><div class='ctx'> 	__le16 len;</div><div class='del'>-	char encrypted_path[1];</div><div class='add'>+	char encrypted_path[];</div><div class='ctx'> } __packed;</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -182,35 +239,51 @@ struct fscrypt_symlink_data {</div><div class='ctx'>  * Normally only one of the fields will be non-NULL.</div><div class='ctx'>  */</div><div class='ctx'> struct fscrypt_prepared_key {</div><div class='del'>-	struct crypto_skcipher *tfm;</div><div class='add'>+	struct crypto_sync_skcipher *tfm;</div><div class='ctx'> #ifdef CONFIG_FS_ENCRYPTION_INLINE_CRYPT</div><div class='del'>-	struct fscrypt_blk_crypto_key *blk_key;</div><div class='add'>+	struct blk_crypto_key *blk_key;</div><div class='ctx'> #endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * fscrypt_info - the "encryption key" for an inode</div><div class='add'>+ * fscrypt_inode_info - the "encryption key" for an inode</div><div class='ctx'>  *</div><div class='ctx'>  * When an encrypted file's key is made available, an instance of this struct is</div><div class='del'>- * allocated and stored in -&gt;i_crypt_info.  Once created, it remains until the</div><div class='del'>- * inode is evicted.</div><div class='add'>+ * allocated and a pointer to it is stored in the file's in-memory inode.  Once</div><div class='add'>+ * created, it remains until the inode is evicted.</div><div class='ctx'>  */</div><div class='del'>-struct fscrypt_info {</div><div class='add'>+struct fscrypt_inode_info {</div><div class='ctx'> </div><div class='ctx'> 	/* The key in a form prepared for actual encryption/decryption */</div><div class='ctx'> 	struct fscrypt_prepared_key ci_enc_key;</div><div class='ctx'> </div><div class='del'>-	/* True if ci_enc_key should be freed when this fscrypt_info is freed */</div><div class='del'>-	bool ci_owns_key;</div><div class='add'>+	/* True if ci_enc_key should be freed when this struct is freed */</div><div class='add'>+	u8 ci_owns_key : 1;</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_FS_ENCRYPTION_INLINE_CRYPT</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * True if this inode will use inline encryption (blk-crypto) instead of</div><div class='ctx'> 	 * the traditional filesystem-layer encryption.</div><div class='ctx'> 	 */</div><div class='del'>-	bool ci_inlinecrypt;</div><div class='add'>+	u8 ci_inlinecrypt : 1;</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='add'>+	/* True if ci_dirhash_key is initialized */</div><div class='add'>+	u8 ci_dirhash_key_initialized : 1;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * log2 of the data unit size (granularity of contents encryption) of</div><div class='add'>+	 * this file.  This is computable from ci_policy and ci_inode but is</div><div class='add'>+	 * cached here for efficiency.  Only used for regular files.</div><div class='add'>+	 */</div><div class='add'>+	u8 ci_data_unit_bits;</div><div class='add'>+</div><div class='add'>+	/* Cached value: log2 of number of data units per FS block */</div><div class='add'>+	u8 ci_data_units_per_block_bits;</div><div class='add'>+</div><div class='add'>+	/* Hashed inode number.  Only set for IV_INO_LBLK_32 */</div><div class='add'>+	u32 ci_hashed_ino;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Encryption mode used for this inode.  It corresponds to either the</div><div class='ctx'> 	 * contents or filenames encryption mode, depending on the inode type.</div><div class='hunk'>@@ -225,7 +298,7 @@ struct fscrypt_info {</div><div class='ctx'> 	 * will be NULL if the master key was found in a process-subscribed</div><div class='ctx'> 	 * keyring rather than in the filesystem-level keyring.</div><div class='ctx'> 	 */</div><div class='del'>-	struct key *ci_master_key;</div><div class='add'>+	struct fscrypt_master_key *ci_master_key;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Link in list of inodes that were unlocked with the master key.</div><div class='hunk'>@@ -245,16 +318,12 @@ struct fscrypt_info {</div><div class='ctx'> 	 * the plaintext filenames -- currently just casefolded directories.</div><div class='ctx'> 	 */</div><div class='ctx'> 	siphash_key_t ci_dirhash_key;</div><div class='del'>-	bool ci_dirhash_key_initialized;</div><div class='ctx'> </div><div class='ctx'> 	/* The encryption policy used by this inode */</div><div class='ctx'> 	union fscrypt_policy ci_policy;</div><div class='ctx'> </div><div class='ctx'> 	/* This inode's nonce, copied from the fscrypt_context */</div><div class='ctx'> 	u8 ci_nonce[FSCRYPT_FILE_NONCE_SIZE];</div><div class='del'>-</div><div class='del'>-	/* Hashed inode number.  Only set for IV_INO_LBLK_32 */</div><div class='del'>-	u32 ci_hashed_ino;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> typedef enum {</div><div class='hunk'>@@ -263,12 +332,12 @@ typedef enum {</div><div class='ctx'> } fscrypt_direction_t;</div><div class='ctx'> </div><div class='ctx'> /* crypto.c */</div><div class='del'>-extern struct kmem_cache *fscrypt_info_cachep;</div><div class='del'>-int fscrypt_initialize(unsigned int cop_flags);</div><div class='del'>-int fscrypt_crypt_block(const struct inode *inode, fscrypt_direction_t rw,</div><div class='del'>-			u64 lblk_num, struct page *src_page,</div><div class='del'>-			struct page *dest_page, unsigned int len,</div><div class='del'>-			unsigned int offs, gfp_t gfp_flags);</div><div class='add'>+extern struct kmem_cache *fscrypt_inode_info_cachep;</div><div class='add'>+int fscrypt_initialize(struct super_block *sb);</div><div class='add'>+int fscrypt_crypt_data_unit(const struct fscrypt_inode_info *ci,</div><div class='add'>+			    fscrypt_direction_t rw, u64 index,</div><div class='add'>+			    struct page *src_page, struct page *dest_page,</div><div class='add'>+			    unsigned int len, unsigned int offs);</div><div class='ctx'> struct page *fscrypt_alloc_bounce_page(gfp_t gfp_flags);</div><div class='ctx'> </div><div class='ctx'> void __printf(3, 4) __cold</div><div class='hunk'>@@ -283,8 +352,8 @@ fscrypt_msg(const struct inode *inode, const char *level, const char *fmt, ...);</div><div class='ctx'> </div><div class='ctx'> union fscrypt_iv {</div><div class='ctx'> 	struct {</div><div class='del'>-		/* logical block number within the file */</div><div class='del'>-		__le64 lblk_num;</div><div class='add'>+		/* zero-based index of data unit within the file */</div><div class='add'>+		__le64 index;</div><div class='ctx'> </div><div class='ctx'> 		/* per-file nonce; only set in DIRECT_KEY mode */</div><div class='ctx'> 		u8 nonce[FSCRYPT_FILE_NONCE_SIZE];</div><div class='hunk'>@@ -293,24 +362,27 @@ union fscrypt_iv {</div><div class='ctx'> 	__le64 dun[FSCRYPT_MAX_IV_SIZE / sizeof(__le64)];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-void fscrypt_generate_iv(union fscrypt_iv *iv, u64 lblk_num,</div><div class='del'>-			 const struct fscrypt_info *ci);</div><div class='add'>+void fscrypt_generate_iv(union fscrypt_iv *iv, u64 index,</div><div class='add'>+			 const struct fscrypt_inode_info *ci);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Return the number of bits used by the maximum file data unit index that is</div><div class='add'>+ * possible on the given filesystem, using the given log2 data unit size.</div><div class='add'>+ */</div><div class='add'>+static inline int</div><div class='add'>+fscrypt_max_file_dun_bits(const struct super_block *sb, int du_bits)</div><div class='add'>+{</div><div class='add'>+	return fls64(sb-&gt;s_maxbytes - 1) - du_bits;</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /* fname.c */</div><div class='del'>-int fscrypt_fname_encrypt(const struct inode *inode, const struct qstr *iname,</div><div class='del'>-			  u8 *out, unsigned int olen);</div><div class='del'>-bool fscrypt_fname_encrypted_size(const union fscrypt_policy *policy,</div><div class='del'>-				  u32 orig_len, u32 max_len,</div><div class='del'>-				  u32 *encrypted_len_ret);</div><div class='add'>+bool __fscrypt_fname_encrypted_size(const union fscrypt_policy *policy,</div><div class='add'>+				    u32 orig_len, u32 max_len,</div><div class='add'>+				    u32 *encrypted_len_ret);</div><div class='ctx'> </div><div class='ctx'> /* hkdf.c */</div><div class='del'>-</div><div class='del'>-struct fscrypt_hkdf {</div><div class='del'>-	struct crypto_shash *hmac_tfm;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-int fscrypt_init_hkdf(struct fscrypt_hkdf *hkdf, const u8 *master_key,</div><div class='del'>-		      unsigned int master_key_size);</div><div class='add'>+void fscrypt_init_hkdf(struct hmac_sha512_key *hkdf, const u8 *master_key,</div><div class='add'>+		       unsigned int master_key_size);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * The list of contexts in which fscrypt uses HKDF.  These values are used as</div><div class='hunk'>@@ -319,35 +391,42 @@ int fscrypt_init_hkdf(struct fscrypt_hkdf *hkdf, const u8 *master_key,</div><div class='ctx'>  * outputs are unique and cryptographically isolated, i.e. knowledge of one</div><div class='ctx'>  * output doesn't reveal another.</div><div class='ctx'>  */</div><div class='del'>-#define HKDF_CONTEXT_KEY_IDENTIFIER	1 /* info=&lt;empty&gt;		*/</div><div class='add'>+#define HKDF_CONTEXT_KEY_IDENTIFIER_FOR_RAW_KEY	1 /* info=&lt;empty&gt;	*/</div><div class='ctx'> #define HKDF_CONTEXT_PER_FILE_ENC_KEY	2 /* info=file_nonce		*/</div><div class='ctx'> #define HKDF_CONTEXT_DIRECT_KEY		3 /* info=mode_num		*/</div><div class='ctx'> #define HKDF_CONTEXT_IV_INO_LBLK_64_KEY	4 /* info=mode_num||fs_uuid	*/</div><div class='ctx'> #define HKDF_CONTEXT_DIRHASH_KEY	5 /* info=file_nonce		*/</div><div class='ctx'> #define HKDF_CONTEXT_IV_INO_LBLK_32_KEY	6 /* info=mode_num||fs_uuid	*/</div><div class='ctx'> #define HKDF_CONTEXT_INODE_HASH_KEY	7 /* info=&lt;empty&gt;		*/</div><div class='add'>+#define HKDF_CONTEXT_KEY_IDENTIFIER_FOR_HW_WRAPPED_KEY \</div><div class='add'>+					8 /* info=&lt;empty&gt;		*/</div><div class='ctx'> </div><div class='del'>-int fscrypt_hkdf_expand(const struct fscrypt_hkdf *hkdf, u8 context,</div><div class='del'>-			const u8 *info, unsigned int infolen,</div><div class='del'>-			u8 *okm, unsigned int okmlen);</div><div class='del'>-</div><div class='del'>-void fscrypt_destroy_hkdf(struct fscrypt_hkdf *hkdf);</div><div class='add'>+void fscrypt_hkdf_expand(const struct hmac_sha512_key *hkdf, u8 context,</div><div class='add'>+			 const u8 *info, unsigned int infolen,</div><div class='add'>+			 u8 *okm, unsigned int okmlen);</div><div class='ctx'> </div><div class='ctx'> /* inline_crypt.c */</div><div class='ctx'> #ifdef CONFIG_FS_ENCRYPTION_INLINE_CRYPT</div><div class='del'>-int fscrypt_select_encryption_impl(struct fscrypt_info *ci);</div><div class='add'>+int fscrypt_select_encryption_impl(struct fscrypt_inode_info *ci,</div><div class='add'>+				   bool is_hw_wrapped_key);</div><div class='ctx'> </div><div class='ctx'> static inline bool</div><div class='del'>-fscrypt_using_inline_encryption(const struct fscrypt_info *ci)</div><div class='add'>+fscrypt_using_inline_encryption(const struct fscrypt_inode_info *ci)</div><div class='ctx'> {</div><div class='ctx'> 	return ci-&gt;ci_inlinecrypt;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int fscrypt_prepare_inline_crypt_key(struct fscrypt_prepared_key *prep_key,</div><div class='del'>-				     const u8 *raw_key,</div><div class='del'>-				     const struct fscrypt_info *ci);</div><div class='add'>+				     const u8 *key_bytes, size_t key_size,</div><div class='add'>+				     bool is_hw_wrapped,</div><div class='add'>+				     const struct fscrypt_inode_info *ci);</div><div class='add'>+</div><div class='add'>+void fscrypt_destroy_inline_crypt_key(struct super_block *sb,</div><div class='add'>+				      struct fscrypt_prepared_key *prep_key);</div><div class='ctx'> </div><div class='del'>-void fscrypt_destroy_inline_crypt_key(struct fscrypt_prepared_key *prep_key);</div><div class='add'>+int fscrypt_derive_sw_secret(struct super_block *sb,</div><div class='add'>+			     const u8 *wrapped_key, size_t wrapped_key_size,</div><div class='add'>+			     u8 sw_secret[BLK_CRYPTO_SW_SECRET_SIZE]);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Check whether the crypto transform or blk-crypto key has been allocated in</div><div class='hunk'>@@ -355,7 +434,7 @@ void fscrypt_destroy_inline_crypt_key(struct fscrypt_prepared_key *prep_key);</div><div class='ctx'>  */</div><div class='ctx'> static inline bool</div><div class='ctx'> fscrypt_is_key_prepared(struct fscrypt_prepared_key *prep_key,</div><div class='del'>-			const struct fscrypt_info *ci)</div><div class='add'>+			const struct fscrypt_inode_info *ci)</div><div class='ctx'> {</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The two smp_load_acquire()'s here pair with the smp_store_release()'s</div><div class='hunk'>@@ -372,34 +451,46 @@ fscrypt_is_key_prepared(struct fscrypt_prepared_key *prep_key,</div><div class='ctx'> </div><div class='ctx'> #else /* CONFIG_FS_ENCRYPTION_INLINE_CRYPT */</div><div class='ctx'> </div><div class='del'>-static inline int fscrypt_select_encryption_impl(struct fscrypt_info *ci)</div><div class='add'>+static inline int fscrypt_select_encryption_impl(struct fscrypt_inode_info *ci,</div><div class='add'>+						 bool is_hw_wrapped_key)</div><div class='ctx'> {</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline bool</div><div class='del'>-fscrypt_using_inline_encryption(const struct fscrypt_info *ci)</div><div class='add'>+fscrypt_using_inline_encryption(const struct fscrypt_inode_info *ci)</div><div class='ctx'> {</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int</div><div class='ctx'> fscrypt_prepare_inline_crypt_key(struct fscrypt_prepared_key *prep_key,</div><div class='del'>-				 const u8 *raw_key,</div><div class='del'>-				 const struct fscrypt_info *ci)</div><div class='add'>+				 const u8 *key_bytes, size_t key_size,</div><div class='add'>+				 bool is_hw_wrapped,</div><div class='add'>+				 const struct fscrypt_inode_info *ci)</div><div class='ctx'> {</div><div class='del'>-	WARN_ON(1);</div><div class='add'>+	WARN_ON_ONCE(1);</div><div class='ctx'> 	return -EOPNOTSUPP;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void</div><div class='del'>-fscrypt_destroy_inline_crypt_key(struct fscrypt_prepared_key *prep_key)</div><div class='add'>+fscrypt_destroy_inline_crypt_key(struct super_block *sb,</div><div class='add'>+				 struct fscrypt_prepared_key *prep_key)</div><div class='ctx'> {</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline int</div><div class='add'>+fscrypt_derive_sw_secret(struct super_block *sb,</div><div class='add'>+			 const u8 *wrapped_key, size_t wrapped_key_size,</div><div class='add'>+			 u8 sw_secret[BLK_CRYPTO_SW_SECRET_SIZE])</div><div class='add'>+{</div><div class='add'>+	fscrypt_warn(NULL, "kernel doesn't support hardware-wrapped keys");</div><div class='add'>+	return -EOPNOTSUPP;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline bool</div><div class='ctx'> fscrypt_is_key_prepared(struct fscrypt_prepared_key *prep_key,</div><div class='del'>-			const struct fscrypt_info *ci)</div><div class='add'>+			const struct fscrypt_inode_info *ci)</div><div class='ctx'> {</div><div class='ctx'> 	return smp_load_acquire(&amp;prep_key-&gt;tfm) != NULL;</div><div class='ctx'> }</div><div class='hunk'>@@ -413,20 +504,38 @@ fscrypt_is_key_prepared(struct fscrypt_prepared_key *prep_key,</div><div class='ctx'> struct fscrypt_master_key_secret {</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * For v2 policy keys: HKDF context keyed by this master key.</div><div class='del'>-	 * For v1 policy keys: not set (hkdf.hmac_tfm == NULL).</div><div class='add'>+	 * The KDF with which subkeys of this key can be derived.</div><div class='add'>+	 *</div><div class='add'>+	 * For v1 policy keys, this isn't applicable and won't be set.</div><div class='add'>+	 * Otherwise, this KDF will be keyed by this master key if</div><div class='add'>+	 * -&gt;is_hw_wrapped=false, or by the "software secret" that hardware</div><div class='add'>+	 * derived from this master key if -&gt;is_hw_wrapped=true.</div><div class='add'>+	 */</div><div class='add'>+	struct hmac_sha512_key	hkdf;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * True if this key is a hardware-wrapped key; false if this key is a</div><div class='add'>+	 * raw key (i.e. a "software key").  For v1 policy keys this will always</div><div class='add'>+	 * be false, as v1 policy support is a legacy feature which doesn't</div><div class='add'>+	 * support newer functionality such as hardware-wrapped keys.</div><div class='ctx'> 	 */</div><div class='del'>-	struct fscrypt_hkdf	hkdf;</div><div class='add'>+	bool			is_hw_wrapped;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Size of the raw key in bytes.  This remains set even if -&gt;raw was</div><div class='add'>+	 * Size of the key in bytes.  This remains set even if -&gt;bytes was</div><div class='ctx'> 	 * zeroized due to no longer being needed.  I.e. we still remember the</div><div class='ctx'> 	 * size of the key even if we don't need to remember the key itself.</div><div class='ctx'> 	 */</div><div class='ctx'> 	u32			size;</div><div class='ctx'> </div><div class='del'>-	/* For v1 policy keys: the raw key.  Wiped for v2 policy keys. */</div><div class='del'>-	u8			raw[FSCRYPT_MAX_KEY_SIZE];</div><div class='add'>+	/*</div><div class='add'>+	 * The bytes of the key, when still needed.  This can be either a raw</div><div class='add'>+	 * key or a hardware-wrapped key, as indicated by -&gt;is_hw_wrapped.  In</div><div class='add'>+	 * the case of a raw, v2 policy key, there is no need to remember the</div><div class='add'>+	 * actual key separately from -&gt;hkdf so this field will be zeroized as</div><div class='add'>+	 * soon as -&gt;hkdf is initialized.</div><div class='add'>+	 */</div><div class='add'>+	u8			bytes[FSCRYPT_MAX_ANY_KEY_SIZE];</div><div class='ctx'> </div><div class='ctx'> } __randomize_layout;</div><div class='ctx'> </div><div class='hunk'>@@ -434,20 +543,64 @@ struct fscrypt_master_key_secret {</div><div class='ctx'>  * fscrypt_master_key - an in-use master key</div><div class='ctx'>  *</div><div class='ctx'>  * This represents a master encryption key which has been added to the</div><div class='del'>- * filesystem and can be used to "unlock" the encrypted files which were</div><div class='del'>- * encrypted with it.</div><div class='add'>+ * filesystem.  There are three high-level states that a key can be in:</div><div class='add'>+ *</div><div class='add'>+ * FSCRYPT_KEY_STATUS_PRESENT</div><div class='add'>+ *	Key is fully usable; it can be used to unlock inodes that are encrypted</div><div class='add'>+ *	with it (this includes being able to create new inodes).  -&gt;mk_present</div><div class='add'>+ *	indicates whether the key is in this state.  -&gt;mk_secret exists, the key</div><div class='add'>+ *	is in the keyring, and -&gt;mk_active_refs &gt; 0 due to -&gt;mk_present.</div><div class='add'>+ *</div><div class='add'>+ * FSCRYPT_KEY_STATUS_INCOMPLETELY_REMOVED</div><div class='add'>+ *	Removal of this key has been initiated, but some inodes that were</div><div class='add'>+ *	unlocked with it are still in-use.  Like ABSENT, -&gt;mk_secret is wiped,</div><div class='add'>+ *	and the key can no longer be used to unlock inodes.  Unlike ABSENT, the</div><div class='add'>+ *	key is still in the keyring; -&gt;mk_decrypted_inodes is nonempty; and</div><div class='add'>+ *	-&gt;mk_active_refs &gt; 0, being equal to the size of -&gt;mk_decrypted_inodes.</div><div class='add'>+ *</div><div class='add'>+ *	This state transitions to ABSENT if -&gt;mk_decrypted_inodes becomes empty,</div><div class='add'>+ *	or to PRESENT if FS_IOC_ADD_ENCRYPTION_KEY is called again for this key.</div><div class='add'>+ *</div><div class='add'>+ * FSCRYPT_KEY_STATUS_ABSENT</div><div class='add'>+ *	Key is fully removed.  The key is no longer in the keyring,</div><div class='add'>+ *	-&gt;mk_decrypted_inodes is empty, -&gt;mk_active_refs == 0, -&gt;mk_secret is</div><div class='add'>+ *	wiped, and the key can no longer be used to unlock inodes.</div><div class='ctx'>  */</div><div class='ctx'> struct fscrypt_master_key {</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * The secret key material.  After FS_IOC_REMOVE_ENCRYPTION_KEY is</div><div class='del'>-	 * executed, this is wiped and no new inodes can be unlocked with this</div><div class='del'>-	 * key; however, there may still be inodes in -&gt;mk_decrypted_inodes</div><div class='del'>-	 * which could not be evicted.  As long as some inodes still remain,</div><div class='del'>-	 * FS_IOC_REMOVE_ENCRYPTION_KEY can be retried, or</div><div class='del'>-	 * FS_IOC_ADD_ENCRYPTION_KEY can add the secret again.</div><div class='add'>+	 * Link in -&gt;s_master_keys-&gt;key_hashtable.</div><div class='add'>+	 * Only valid if -&gt;mk_active_refs &gt; 0.</div><div class='add'>+	 */</div><div class='add'>+	struct hlist_node			mk_node;</div><div class='add'>+</div><div class='add'>+	/* Semaphore that protects -&gt;mk_secret, -&gt;mk_users, and -&gt;mk_present */</div><div class='add'>+	struct rw_semaphore			mk_sem;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Active and structural reference counts.  An active ref guarantees</div><div class='add'>+	 * that the struct continues to exist, continues to be in the keyring</div><div class='add'>+	 * -&gt;s_master_keys, and that any embedded subkeys (e.g.</div><div class='add'>+	 * -&gt;mk_direct_keys) that have been prepared continue to exist.</div><div class='add'>+	 * A structural ref only guarantees that the struct continues to exist.</div><div class='add'>+	 *</div><div class='add'>+	 * There is one active ref associated with -&gt;mk_present being true, and</div><div class='add'>+	 * one active ref for each inode in -&gt;mk_decrypted_inodes.</div><div class='ctx'> 	 *</div><div class='del'>-	 * Locking: protected by this master key's key-&gt;sem.</div><div class='add'>+	 * There is one structural ref associated with the active refcount being</div><div class='add'>+	 * nonzero.  Finding a key in the keyring also takes a structural ref,</div><div class='add'>+	 * which is then held temporarily while the key is operated on.</div><div class='add'>+	 */</div><div class='add'>+	refcount_t				mk_active_refs;</div><div class='add'>+	refcount_t				mk_struct_refs;</div><div class='add'>+</div><div class='add'>+	struct rcu_head				mk_rcu_head;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The secret key material.  Wiped as soon as it is no longer needed;</div><div class='add'>+	 * for details, see the fscrypt_master_key struct comment.</div><div class='add'>+	 *</div><div class='add'>+	 * Locking: protected by -&gt;mk_sem.</div><div class='ctx'> 	 */</div><div class='ctx'> 	struct fscrypt_master_key_secret	mk_secret;</div><div class='ctx'> </div><div class='hunk'>@@ -468,23 +621,13 @@ struct fscrypt_master_key {</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * This is NULL for v1 policy keys; those can only be added by root.</div><div class='ctx'> 	 *</div><div class='del'>-	 * Locking: in addition to this keyring's own semaphore, this is</div><div class='del'>-	 * protected by this master key's key-&gt;sem, so we can do atomic</div><div class='del'>-	 * search+insert.  It can also be searched without taking any locks, but</div><div class='del'>-	 * in that case the returned key may have already been removed.</div><div class='add'>+	 * Locking: protected by -&gt;mk_sem.  (We don't just rely on the keyrings</div><div class='add'>+	 * subsystem semaphore -&gt;mk_users-&gt;sem, as we need support for atomic</div><div class='add'>+	 * search+insert along with proper synchronization with other fields.)</div><div class='ctx'> 	 */</div><div class='ctx'> 	struct key		*mk_users;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Length of -&gt;mk_decrypted_inodes, plus one if mk_secret is present.</div><div class='del'>-	 * Once this goes to 0, the master key is removed from -&gt;s_master_keys.</div><div class='del'>-	 * The 'struct fscrypt_master_key' will continue to live as long as the</div><div class='del'>-	 * 'struct key' whose payload it is, but we won't let this reference</div><div class='del'>-	 * count rise again.</div><div class='del'>-	 */</div><div class='del'>-	refcount_t		mk_refcount;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='ctx'> 	 * List of inodes that were unlocked using this key.  This allows the</div><div class='ctx'> 	 * inodes to be evicted efficiently if the key is removed.</div><div class='ctx'> 	 */</div><div class='hunk'>@@ -503,20 +646,17 @@ struct fscrypt_master_key {</div><div class='ctx'> 	siphash_key_t		mk_ino_hash_key;</div><div class='ctx'> 	bool			mk_ino_hash_key_initialized;</div><div class='ctx'> </div><div class='del'>-} __randomize_layout;</div><div class='del'>-</div><div class='del'>-static inline bool</div><div class='del'>-is_master_key_secret_present(const struct fscrypt_master_key_secret *secret)</div><div class='del'>-{</div><div class='ctx'> 	/*</div><div class='del'>-	 * The READ_ONCE() is only necessary for fscrypt_drop_inode() and</div><div class='del'>-	 * fscrypt_key_describe().  These run in atomic context, so they can't</div><div class='del'>-	 * take the key semaphore and thus 'secret' can change concurrently</div><div class='del'>-	 * which would be a data race.  But they only need to know whether the</div><div class='del'>-	 * secret *was* present at the time of check, so READ_ONCE() suffices.</div><div class='add'>+	 * Whether this key is in the "present" state, i.e. fully usable.  For</div><div class='add'>+	 * details, see the fscrypt_master_key struct comment.</div><div class='add'>+	 *</div><div class='add'>+	 * Locking: protected by -&gt;mk_sem, but can be read locklessly using</div><div class='add'>+	 * READ_ONCE().  Writers must use WRITE_ONCE() when concurrent readers</div><div class='add'>+	 * are possible.</div><div class='ctx'> 	 */</div><div class='del'>-	return READ_ONCE(secret-&gt;size) != 0;</div><div class='del'>-}</div><div class='add'>+	bool			mk_present;</div><div class='add'>+</div><div class='add'>+} __randomize_layout;</div><div class='ctx'> </div><div class='ctx'> static inline const char *master_key_spec_type(</div><div class='ctx'> 				const struct fscrypt_key_specifier *spec)</div><div class='hunk'>@@ -541,10 +681,18 @@ static inline int master_key_spec_len(const struct fscrypt_key_specifier *spec)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct key *</div><div class='add'>+void fscrypt_put_master_key(struct fscrypt_master_key *mk);</div><div class='add'>+</div><div class='add'>+void fscrypt_put_master_key_activeref(struct super_block *sb,</div><div class='add'>+				      struct fscrypt_master_key *mk);</div><div class='add'>+</div><div class='add'>+struct fscrypt_master_key *</div><div class='ctx'> fscrypt_find_master_key(struct super_block *sb,</div><div class='ctx'> 			const struct fscrypt_key_specifier *mk_spec);</div><div class='ctx'> </div><div class='add'>+void fscrypt_get_test_dummy_key_identifier(</div><div class='add'>+			  u8 key_identifier[FSCRYPT_KEY_IDENTIFIER_SIZE]);</div><div class='add'>+</div><div class='ctx'> int fscrypt_add_test_dummy_key(struct super_block *sb,</div><div class='ctx'> 			       struct fscrypt_key_specifier *key_spec);</div><div class='ctx'> </div><div class='hunk'>@@ -561,23 +709,27 @@ struct fscrypt_mode {</div><div class='ctx'> 	int keysize;		/* key size in bytes */</div><div class='ctx'> 	int security_strength;	/* security strength in bytes */</div><div class='ctx'> 	int ivsize;		/* IV size in bytes */</div><div class='del'>-	int logged_impl_name;</div><div class='add'>+	int logged_cryptoapi_impl;</div><div class='add'>+	int logged_blk_crypto_native;</div><div class='add'>+	int logged_blk_crypto_fallback;</div><div class='ctx'> 	enum blk_crypto_mode_num blk_crypto_mode;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> extern struct fscrypt_mode fscrypt_modes[];</div><div class='ctx'> </div><div class='ctx'> int fscrypt_prepare_key(struct fscrypt_prepared_key *prep_key,</div><div class='del'>-			const u8 *raw_key, const struct fscrypt_info *ci);</div><div class='add'>+			const u8 *raw_key, const struct fscrypt_inode_info *ci);</div><div class='ctx'> </div><div class='del'>-void fscrypt_destroy_prepared_key(struct fscrypt_prepared_key *prep_key);</div><div class='add'>+void fscrypt_destroy_prepared_key(struct super_block *sb,</div><div class='add'>+				  struct fscrypt_prepared_key *prep_key);</div><div class='ctx'> </div><div class='del'>-int fscrypt_set_per_file_enc_key(struct fscrypt_info *ci, const u8 *raw_key);</div><div class='add'>+int fscrypt_set_per_file_enc_key(struct fscrypt_inode_info *ci,</div><div class='add'>+				 const u8 *raw_key);</div><div class='ctx'> </div><div class='del'>-int fscrypt_derive_dirhash_key(struct fscrypt_info *ci,</div><div class='del'>-			       const struct fscrypt_master_key *mk);</div><div class='add'>+void fscrypt_derive_dirhash_key(struct fscrypt_inode_info *ci,</div><div class='add'>+				const struct fscrypt_master_key *mk);</div><div class='ctx'> </div><div class='del'>-void fscrypt_hash_inode_number(struct fscrypt_info *ci,</div><div class='add'>+void fscrypt_hash_inode_number(struct fscrypt_inode_info *ci,</div><div class='ctx'> 			       const struct fscrypt_master_key *mk);</div><div class='ctx'> </div><div class='ctx'> int fscrypt_get_encryption_info(struct inode *inode, bool allow_unsupported);</div><div class='hunk'>@@ -612,15 +764,19 @@ static inline int fscrypt_require_key(struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> void fscrypt_put_direct_key(struct fscrypt_direct_key *dk);</div><div class='ctx'> </div><div class='del'>-int fscrypt_setup_v1_file_key(struct fscrypt_info *ci,</div><div class='add'>+int fscrypt_setup_v1_file_key(struct fscrypt_inode_info *ci,</div><div class='ctx'> 			      const u8 *raw_master_key);</div><div class='ctx'> </div><div class='del'>-int fscrypt_setup_v1_file_key_via_subscribed_keyrings(struct fscrypt_info *ci);</div><div class='add'>+int fscrypt_setup_v1_file_key_via_subscribed_keyrings(</div><div class='add'>+				struct fscrypt_inode_info *ci);</div><div class='ctx'> </div><div class='ctx'> /* policy.c */</div><div class='ctx'> </div><div class='ctx'> bool fscrypt_policies_equal(const union fscrypt_policy *policy1,</div><div class='ctx'> 			    const union fscrypt_policy *policy2);</div><div class='add'>+int fscrypt_policy_to_key_spec(const union fscrypt_policy *policy,</div><div class='add'>+			       struct fscrypt_key_specifier *key_spec);</div><div class='add'>+const union fscrypt_policy *fscrypt_get_dummy_policy(struct super_block *sb);</div><div class='ctx'> bool fscrypt_supported_policy(const union fscrypt_policy *policy_u,</div><div class='ctx'> 			      const struct inode *inode);</div><div class='ctx'> int fscrypt_policy_from_context(union fscrypt_policy *policy_u,</div><div class='head'>diff --git a/fs/crypto/hkdf.c b/fs/crypto/hkdf.c<br/>index 7607d18b35fc..706f56d0076e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/crypto/hkdf.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/crypto/hkdf.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/crypto/hkdf.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/crypto/hkdf.c</a></div><div class='hunk'>@@ -4,14 +4,13 @@</div><div class='ctx'>  * Function"), aka RFC 5869.  See also the original paper (Krawczyk 2010):</div><div class='ctx'>  * "Cryptographic Extraction and Key Derivation: The HKDF Scheme".</div><div class='ctx'>  *</div><div class='del'>- * This is used to derive keys from the fscrypt master keys.</div><div class='add'>+ * This is used to derive keys from the fscrypt master keys (or from the</div><div class='add'>+ * "software secrets" which hardware derives from the fscrypt master keys, in</div><div class='add'>+ * the case that the fscrypt master keys are hardware-wrapped keys).</div><div class='ctx'>  *</div><div class='ctx'>  * Copyright 2019 Google LLC</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-#include &lt;crypto/hash.h&gt;</div><div class='del'>-#include &lt;crypto/sha2.h&gt;</div><div class='del'>-</div><div class='ctx'> #include "fscrypt_private.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -25,7 +24,6 @@</div><div class='ctx'>  * HKDF-SHA512 being much faster than HKDF-SHA256, as the longer digest size of</div><div class='ctx'>  * SHA-512 causes HKDF-Expand to only need to do one iteration rather than two.</div><div class='ctx'>  */</div><div class='del'>-#define HKDF_HMAC_ALG		"hmac(sha512)"</div><div class='ctx'> #define HKDF_HASHLEN		SHA512_DIGEST_SIZE</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -44,67 +42,25 @@</div><div class='ctx'>  * there's no way to persist a random salt per master key from kernel mode.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-/* HKDF-Extract (RFC 5869 section 2.2), unsalted */</div><div class='del'>-static int hkdf_extract(struct crypto_shash *hmac_tfm, const u8 *ikm,</div><div class='del'>-			unsigned int ikmlen, u8 prk[HKDF_HASHLEN])</div><div class='del'>-{</div><div class='del'>-	static const u8 default_salt[HKDF_HASHLEN];</div><div class='del'>-	int err;</div><div class='del'>-</div><div class='del'>-	err = crypto_shash_setkey(hmac_tfm, default_salt, HKDF_HASHLEN);</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='del'>-</div><div class='del'>-	return crypto_shash_tfm_digest(hmac_tfm, ikm, ikmlen, prk);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='del'>- * Compute HKDF-Extract using the given master key as the input keying material,</div><div class='del'>- * and prepare an HMAC transform object keyed by the resulting pseudorandom key.</div><div class='del'>- *</div><div class='del'>- * Afterwards, the keyed HMAC transform object can be used for HKDF-Expand many</div><div class='del'>- * times without having to recompute HKDF-Extract each time.</div><div class='add'>+ * Compute HKDF-Extract using 'master_key' as the input keying material, and</div><div class='add'>+ * prepare the resulting HMAC key in 'hkdf'.  Afterwards, 'hkdf' can be used for</div><div class='add'>+ * HKDF-Expand many times without having to recompute HKDF-Extract each time.</div><div class='ctx'>  */</div><div class='del'>-int fscrypt_init_hkdf(struct fscrypt_hkdf *hkdf, const u8 *master_key,</div><div class='del'>-		      unsigned int master_key_size)</div><div class='add'>+void fscrypt_init_hkdf(struct hmac_sha512_key *hkdf, const u8 *master_key,</div><div class='add'>+		       unsigned int master_key_size)</div><div class='ctx'> {</div><div class='del'>-	struct crypto_shash *hmac_tfm;</div><div class='add'>+	static const u8 default_salt[HKDF_HASHLEN];</div><div class='ctx'> 	u8 prk[HKDF_HASHLEN];</div><div class='del'>-	int err;</div><div class='del'>-</div><div class='del'>-	hmac_tfm = crypto_alloc_shash(HKDF_HMAC_ALG, 0, 0);</div><div class='del'>-	if (IS_ERR(hmac_tfm)) {</div><div class='del'>-		fscrypt_err(NULL, "Error allocating " HKDF_HMAC_ALG ": %ld",</div><div class='del'>-			    PTR_ERR(hmac_tfm));</div><div class='del'>-		return PTR_ERR(hmac_tfm);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (WARN_ON(crypto_shash_digestsize(hmac_tfm) != sizeof(prk))) {</div><div class='del'>-		err = -EINVAL;</div><div class='del'>-		goto err_free_tfm;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	err = hkdf_extract(hmac_tfm, master_key, master_key_size, prk);</div><div class='del'>-	if (err)</div><div class='del'>-		goto err_free_tfm;</div><div class='ctx'> </div><div class='del'>-	err = crypto_shash_setkey(hmac_tfm, prk, sizeof(prk));</div><div class='del'>-	if (err)</div><div class='del'>-		goto err_free_tfm;</div><div class='del'>-</div><div class='del'>-	hkdf-&gt;hmac_tfm = hmac_tfm;</div><div class='del'>-	goto out;</div><div class='del'>-</div><div class='del'>-err_free_tfm:</div><div class='del'>-	crypto_free_shash(hmac_tfm);</div><div class='del'>-out:</div><div class='add'>+	hmac_sha512_usingrawkey(default_salt, sizeof(default_salt),</div><div class='add'>+				master_key, master_key_size, prk);</div><div class='add'>+	hmac_sha512_preparekey(hkdf, prk, sizeof(prk));</div><div class='ctx'> 	memzero_explicit(prk, sizeof(prk));</div><div class='del'>-	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * HKDF-Expand (RFC 5869 section 2.3).  This expands the pseudorandom key, which</div><div class='del'>- * was already keyed into 'hkdf-&gt;hmac_tfm' by fscrypt_init_hkdf(), into 'okmlen'</div><div class='add'>+ * HKDF-Expand (RFC 5869 section 2.3).  Expand the HMAC key 'hkdf' into 'okmlen'</div><div class='ctx'>  * bytes of output keying material parameterized by the application-specific</div><div class='ctx'>  * 'info' of length 'infolen' bytes, prefixed by "fscrypt\0" and the 'context'</div><div class='ctx'>  * byte.  This is thread-safe and may be called by multiple threads in parallel.</div><div class='hunk'>@@ -113,70 +69,32 @@ out:</div><div class='ctx'>  * adds to its application-specific info strings to guarantee that it doesn't</div><div class='ctx'>  * accidentally repeat an info string when using HKDF for different purposes.)</div><div class='ctx'>  */</div><div class='del'>-int fscrypt_hkdf_expand(const struct fscrypt_hkdf *hkdf, u8 context,</div><div class='del'>-			const u8 *info, unsigned int infolen,</div><div class='del'>-			u8 *okm, unsigned int okmlen)</div><div class='add'>+void fscrypt_hkdf_expand(const struct hmac_sha512_key *hkdf, u8 context,</div><div class='add'>+			 const u8 *info, unsigned int infolen,</div><div class='add'>+			 u8 *okm, unsigned int okmlen)</div><div class='ctx'> {</div><div class='del'>-	SHASH_DESC_ON_STACK(desc, hkdf-&gt;hmac_tfm);</div><div class='del'>-	u8 prefix[9];</div><div class='del'>-	unsigned int i;</div><div class='del'>-	int err;</div><div class='del'>-	const u8 *prev = NULL;</div><div class='add'>+	struct hmac_sha512_ctx ctx;</div><div class='ctx'> 	u8 counter = 1;</div><div class='ctx'> 	u8 tmp[HKDF_HASHLEN];</div><div class='ctx'> </div><div class='del'>-	if (WARN_ON(okmlen &gt; 255 * HKDF_HASHLEN))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	desc-&gt;tfm = hkdf-&gt;hmac_tfm;</div><div class='del'>-</div><div class='del'>-	memcpy(prefix, "fscrypt\0", 8);</div><div class='del'>-	prefix[8] = context;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; okmlen; i += HKDF_HASHLEN) {</div><div class='del'>-</div><div class='del'>-		err = crypto_shash_init(desc);</div><div class='del'>-		if (err)</div><div class='del'>-			goto out;</div><div class='del'>-</div><div class='del'>-		if (prev) {</div><div class='del'>-			err = crypto_shash_update(desc, prev, HKDF_HASHLEN);</div><div class='del'>-			if (err)</div><div class='del'>-				goto out;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		err = crypto_shash_update(desc, prefix, sizeof(prefix));</div><div class='del'>-		if (err)</div><div class='del'>-			goto out;</div><div class='del'>-</div><div class='del'>-		err = crypto_shash_update(desc, info, infolen);</div><div class='del'>-		if (err)</div><div class='del'>-			goto out;</div><div class='del'>-</div><div class='del'>-		BUILD_BUG_ON(sizeof(counter) != 1);</div><div class='add'>+	WARN_ON_ONCE(okmlen &gt; 255 * HKDF_HASHLEN);</div><div class='add'>+</div><div class='add'>+	for (unsigned int i = 0; i &lt; okmlen; i += HKDF_HASHLEN) {</div><div class='add'>+		hmac_sha512_init(&amp;ctx, hkdf);</div><div class='add'>+		if (i != 0)</div><div class='add'>+			hmac_sha512_update(&amp;ctx, &amp;okm[i - HKDF_HASHLEN],</div><div class='add'>+					   HKDF_HASHLEN);</div><div class='add'>+		hmac_sha512_update(&amp;ctx, "fscrypt\0", 8);</div><div class='add'>+		hmac_sha512_update(&amp;ctx, &amp;context, 1);</div><div class='add'>+		hmac_sha512_update(&amp;ctx, info, infolen);</div><div class='add'>+		hmac_sha512_update(&amp;ctx, &amp;counter, 1);</div><div class='ctx'> 		if (okmlen - i &lt; HKDF_HASHLEN) {</div><div class='del'>-			err = crypto_shash_finup(desc, &amp;counter, 1, tmp);</div><div class='del'>-			if (err)</div><div class='del'>-				goto out;</div><div class='add'>+			hmac_sha512_final(&amp;ctx, tmp);</div><div class='ctx'> 			memcpy(&amp;okm[i], tmp, okmlen - i);</div><div class='ctx'> 			memzero_explicit(tmp, sizeof(tmp));</div><div class='ctx'> 		} else {</div><div class='del'>-			err = crypto_shash_finup(desc, &amp;counter, 1, &amp;okm[i]);</div><div class='del'>-			if (err)</div><div class='del'>-				goto out;</div><div class='add'>+			hmac_sha512_final(&amp;ctx, &amp;okm[i]);</div><div class='ctx'> 		}</div><div class='ctx'> 		counter++;</div><div class='del'>-		prev = &amp;okm[i];</div><div class='ctx'> 	}</div><div class='del'>-	err = 0;</div><div class='del'>-out:</div><div class='del'>-	if (unlikely(err))</div><div class='del'>-		memzero_explicit(okm, okmlen); /* so caller doesn't need to */</div><div class='del'>-	shash_desc_zero(desc);</div><div class='del'>-	return err;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void fscrypt_destroy_hkdf(struct fscrypt_hkdf *hkdf)</div><div class='del'>-{</div><div class='del'>-	crypto_free_shash(hkdf-&gt;hmac_tfm);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/crypto/hooks.c b/fs/crypto/hooks.c<br/>index af74599ae1cf..b97de0d1430f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/crypto/hooks.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/crypto/hooks.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/crypto/hooks.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/crypto/hooks.c</a></div><div class='hunk'>@@ -5,7 +5,7 @@</div><div class='ctx'>  * Encryption hooks for higher-level filesystem operations.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-#include &lt;linux/key.h&gt;</div><div class='add'>+#include &lt;linux/export.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "fscrypt_private.h"</div><div class='ctx'> </div><div class='hunk'>@@ -32,21 +32,41 @@</div><div class='ctx'> int fscrypt_file_open(struct inode *inode, struct file *filp)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='del'>-	struct dentry *dir;</div><div class='add'>+	struct dentry *dentry, *dentry_parent;</div><div class='add'>+	struct inode *inode_parent;</div><div class='ctx'> </div><div class='ctx'> 	err = fscrypt_require_key(inode);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	dir = dget_parent(file_dentry(filp));</div><div class='del'>-	if (IS_ENCRYPTED(d_inode(dir)) &amp;&amp;</div><div class='del'>-	    !fscrypt_has_permitted_context(d_inode(dir), inode)) {</div><div class='add'>+	dentry = file_dentry(filp);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Getting a reference to the parent dentry is needed for the actual</div><div class='add'>+	 * encryption policy comparison, but it's expensive on multi-core</div><div class='add'>+	 * systems.  Since this function runs on unencrypted files too, start</div><div class='add'>+	 * with a lightweight RCU-mode check for the parent directory being</div><div class='add'>+	 * unencrypted (in which case it's fine for the child to be either</div><div class='add'>+	 * unencrypted, or encrypted with any policy).  Only continue on to the</div><div class='add'>+	 * full policy check if the parent directory is actually encrypted.</div><div class='add'>+	 */</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	dentry_parent = READ_ONCE(dentry-&gt;d_parent);</div><div class='add'>+	inode_parent = d_inode_rcu(dentry_parent);</div><div class='add'>+	if (inode_parent != NULL &amp;&amp; !IS_ENCRYPTED(inode_parent)) {</div><div class='add'>+		rcu_read_unlock();</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+</div><div class='add'>+	dentry_parent = dget_parent(dentry);</div><div class='add'>+	if (!fscrypt_has_permitted_context(d_inode(dentry_parent), inode)) {</div><div class='ctx'> 		fscrypt_warn(inode,</div><div class='ctx'> 			     "Inconsistent encryption context (parent directory: %lu)",</div><div class='del'>-			     d_inode(dir)-&gt;i_ino);</div><div class='add'>+			     d_inode(dentry_parent)-&gt;i_ino);</div><div class='ctx'> 		err = -EPERM;</div><div class='ctx'> 	}</div><div class='del'>-	dput(dir);</div><div class='add'>+	dput(dentry_parent);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(fscrypt_file_open);</div><div class='hunk'>@@ -104,15 +124,40 @@ int __fscrypt_prepare_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	if (err &amp;&amp; err != -ENOENT)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	if (fname-&gt;is_nokey_name) {</div><div class='del'>-		spin_lock(&amp;dentry-&gt;d_lock);</div><div class='del'>-		dentry-&gt;d_flags |= DCACHE_NOKEY_NAME;</div><div class='del'>-		spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='del'>-	}</div><div class='add'>+	fscrypt_prepare_dentry(dentry, fname-&gt;is_nokey_name);</div><div class='add'>+</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(__fscrypt_prepare_lookup);</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * fscrypt_prepare_lookup_partial() - prepare lookup without filename setup</div><div class='add'>+ * @dir: the encrypted directory being searched</div><div class='add'>+ * @dentry: the dentry being looked up in @dir</div><div class='add'>+ *</div><div class='add'>+ * This function should be used by the -&gt;lookup and -&gt;atomic_open methods of</div><div class='add'>+ * filesystems that handle filename encryption and no-key name encoding</div><div class='add'>+ * themselves and thus can't use fscrypt_prepare_lookup().  Like</div><div class='add'>+ * fscrypt_prepare_lookup(), this will try to set up the directory's encryption</div><div class='add'>+ * key and will set DCACHE_NOKEY_NAME on the dentry if the key is unavailable.</div><div class='add'>+ * However, this function doesn't set up a struct fscrypt_name for the filename.</div><div class='add'>+ *</div><div class='add'>+ * Return: 0 on success; -errno on error.  Note that the encryption key being</div><div class='add'>+ *	   unavailable is not considered an error.  It is also not an error if</div><div class='add'>+ *	   the encryption policy is unsupported by this kernel; that is treated</div><div class='add'>+ *	   like the key being unavailable, so that files can still be deleted.</div><div class='add'>+ */</div><div class='add'>+int fscrypt_prepare_lookup_partial(struct inode *dir, struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	int err = fscrypt_get_encryption_info(dir, true);</div><div class='add'>+	bool is_nokey_name = (!err &amp;&amp; !fscrypt_has_encryption_key(dir));</div><div class='add'>+</div><div class='add'>+	fscrypt_prepare_dentry(dentry, is_nokey_name);</div><div class='add'>+</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(fscrypt_prepare_lookup_partial);</div><div class='add'>+</div><div class='ctx'> int __fscrypt_prepare_readdir(struct inode *dir)</div><div class='ctx'> {</div><div class='ctx'> 	return fscrypt_get_encryption_info(dir, true);</div><div class='hunk'>@@ -141,8 +186,7 @@ EXPORT_SYMBOL_GPL(__fscrypt_prepare_setattr);</div><div class='ctx'> int fscrypt_prepare_setflags(struct inode *inode,</div><div class='ctx'> 			     unsigned int oldflags, unsigned int flags)</div><div class='ctx'> {</div><div class='del'>-	struct fscrypt_info *ci;</div><div class='del'>-	struct key *key;</div><div class='add'>+	struct fscrypt_inode_info *ci;</div><div class='ctx'> 	struct fscrypt_master_key *mk;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='hunk'>@@ -155,17 +199,16 @@ int fscrypt_prepare_setflags(struct inode *inode,</div><div class='ctx'> 		err = fscrypt_require_key(inode);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			return err;</div><div class='del'>-		ci = inode-&gt;i_crypt_info;</div><div class='add'>+		ci = fscrypt_get_inode_info_raw(inode);</div><div class='ctx'> 		if (ci-&gt;ci_policy.version != FSCRYPT_POLICY_V2)</div><div class='ctx'> 			return -EINVAL;</div><div class='del'>-		key = ci-&gt;ci_master_key;</div><div class='del'>-		mk = key-&gt;payload.data[0];</div><div class='del'>-		down_read(&amp;key-&gt;sem);</div><div class='del'>-		if (is_master_key_secret_present(&amp;mk-&gt;mk_secret))</div><div class='del'>-			err = fscrypt_derive_dirhash_key(ci, mk);</div><div class='add'>+		mk = ci-&gt;ci_master_key;</div><div class='add'>+		down_read(&amp;mk-&gt;mk_sem);</div><div class='add'>+		if (mk-&gt;mk_present)</div><div class='add'>+			fscrypt_derive_dirhash_key(ci, mk);</div><div class='ctx'> 		else</div><div class='ctx'> 			err = -ENOKEY;</div><div class='del'>-		up_read(&amp;key-&gt;sem);</div><div class='add'>+		up_read(&amp;mk-&gt;mk_sem);</div><div class='ctx'> 		return err;</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -228,11 +271,11 @@ int fscrypt_prepare_symlink(struct inode *dir, const char *target,</div><div class='ctx'> 	 * counting it (even though it is meaningless for ciphertext) is simpler</div><div class='ctx'> 	 * for now since filesystems will assume it is there and subtract it.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!fscrypt_fname_encrypted_size(policy, len,</div><div class='del'>-					  max_len - sizeof(struct fscrypt_symlink_data),</div><div class='del'>-					  &amp;disk_link-&gt;len))</div><div class='add'>+	if (!__fscrypt_fname_encrypted_size(policy, len,</div><div class='add'>+					    max_len - sizeof(struct fscrypt_symlink_data) - 1,</div><div class='add'>+					    &amp;disk_link-&gt;len))</div><div class='ctx'> 		return -ENAMETOOLONG;</div><div class='del'>-	disk_link-&gt;len += sizeof(struct fscrypt_symlink_data);</div><div class='add'>+	disk_link-&gt;len += sizeof(struct fscrypt_symlink_data) + 1;</div><div class='ctx'> </div><div class='ctx'> 	disk_link-&gt;name = NULL;</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -263,7 +306,7 @@ int __fscrypt_encrypt_symlink(struct inode *inode, const char *target,</div><div class='ctx'> 		if (!sd)</div><div class='ctx'> 			return -ENOMEM;</div><div class='ctx'> 	}</div><div class='del'>-	ciphertext_len = disk_link-&gt;len - sizeof(*sd);</div><div class='add'>+	ciphertext_len = disk_link-&gt;len - sizeof(*sd) - 1;</div><div class='ctx'> 	sd-&gt;len = cpu_to_le16(ciphertext_len);</div><div class='ctx'> </div><div class='ctx'> 	err = fscrypt_fname_encrypt(inode, &amp;iname, sd-&gt;encrypted_path,</div><div class='hunk'>@@ -319,7 +362,7 @@ const char *fscrypt_get_symlink(struct inode *inode, const void *caddr,</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	/* This is for encrypted symlinks only */</div><div class='del'>-	if (WARN_ON(!IS_ENCRYPTED(inode)))</div><div class='add'>+	if (WARN_ON_ONCE(!IS_ENCRYPTED(inode)))</div><div class='ctx'> 		return ERR_PTR(-EINVAL);</div><div class='ctx'> </div><div class='ctx'> 	/* If the decrypted target is already cached, just return it. */</div><div class='hunk'>@@ -341,7 +384,7 @@ const char *fscrypt_get_symlink(struct inode *inode, const void *caddr,</div><div class='ctx'> 	 * the ciphertext length, even though this is redundant with i_size.</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='del'>-	if (max_size &lt; sizeof(*sd))</div><div class='add'>+	if (max_size &lt; sizeof(*sd) + 1)</div><div class='ctx'> 		return ERR_PTR(-EUCLEAN);</div><div class='ctx'> 	sd = caddr;</div><div class='ctx'> 	cstr.name = (unsigned char *)sd-&gt;encrypted_path;</div><div class='hunk'>@@ -350,7 +393,7 @@ const char *fscrypt_get_symlink(struct inode *inode, const void *caddr,</div><div class='ctx'> 	if (cstr.len == 0)</div><div class='ctx'> 		return ERR_PTR(-EUCLEAN);</div><div class='ctx'> </div><div class='del'>-	if (cstr.len + sizeof(*sd) - 1 &gt; max_size)</div><div class='add'>+	if (cstr.len + sizeof(*sd) &gt; max_size)</div><div class='ctx'> 		return ERR_PTR(-EUCLEAN);</div><div class='ctx'> </div><div class='ctx'> 	err = fscrypt_fname_alloc_buffer(cstr.len, &amp;pstr);</div><div class='head'>diff --git a/fs/crypto/inline_crypt.c b/fs/crypto/inline_crypt.c<br/>index c57bebfa48fe..ed6e926226b5 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/crypto/inline_crypt.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/crypto/inline_crypt.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/crypto/inline_crypt.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/crypto/inline_crypt.c</a></div><div class='hunk'>@@ -15,38 +15,36 @@</div><div class='ctx'> #include &lt;linux/blk-crypto.h&gt;</div><div class='ctx'> #include &lt;linux/blkdev.h&gt;</div><div class='ctx'> #include &lt;linux/buffer_head.h&gt;</div><div class='add'>+#include &lt;linux/export.h&gt;</div><div class='ctx'> #include &lt;linux/sched/mm.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='add'>+#include &lt;linux/uio.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "fscrypt_private.h"</div><div class='ctx'> </div><div class='del'>-struct fscrypt_blk_crypto_key {</div><div class='del'>-	struct blk_crypto_key base;</div><div class='del'>-	int num_devs;</div><div class='del'>-	struct request_queue *devs[];</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static int fscrypt_get_num_devices(struct super_block *sb)</div><div class='add'>+static struct block_device **fscrypt_get_devices(struct super_block *sb,</div><div class='add'>+						 unsigned int *num_devs)</div><div class='ctx'> {</div><div class='del'>-	if (sb-&gt;s_cop-&gt;get_num_devices)</div><div class='del'>-		return sb-&gt;s_cop-&gt;get_num_devices(sb);</div><div class='del'>-	return 1;</div><div class='del'>-}</div><div class='add'>+	struct block_device **devs;</div><div class='ctx'> </div><div class='del'>-static void fscrypt_get_devices(struct super_block *sb, int num_devs,</div><div class='del'>-				struct request_queue **devs)</div><div class='del'>-{</div><div class='del'>-	if (num_devs == 1)</div><div class='del'>-		devs[0] = bdev_get_queue(sb-&gt;s_bdev);</div><div class='del'>-	else</div><div class='del'>-		sb-&gt;s_cop-&gt;get_devices(sb, devs);</div><div class='add'>+	if (sb-&gt;s_cop-&gt;get_devices) {</div><div class='add'>+		devs = sb-&gt;s_cop-&gt;get_devices(sb, num_devs);</div><div class='add'>+		if (devs)</div><div class='add'>+			return devs;</div><div class='add'>+	}</div><div class='add'>+	devs = kmalloc(sizeof(*devs), GFP_KERNEL);</div><div class='add'>+	if (!devs)</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+	devs[0] = sb-&gt;s_bdev;</div><div class='add'>+	*num_devs = 1;</div><div class='add'>+	return devs;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static unsigned int fscrypt_get_dun_bytes(const struct fscrypt_info *ci)</div><div class='add'>+static unsigned int fscrypt_get_dun_bytes(const struct fscrypt_inode_info *ci)</div><div class='ctx'> {</div><div class='del'>-	struct super_block *sb = ci-&gt;ci_inode-&gt;i_sb;</div><div class='add'>+	const struct super_block *sb = ci-&gt;ci_inode-&gt;i_sb;</div><div class='ctx'> 	unsigned int flags = fscrypt_policy_flags(&amp;ci-&gt;ci_policy);</div><div class='del'>-	int ino_bits = 64, lblk_bits = 64;</div><div class='add'>+	int dun_bits;</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; FSCRYPT_POLICY_FLAG_DIRECT_KEY)</div><div class='ctx'> 		return offsetofend(union fscrypt_iv, nonce);</div><div class='hunk'>@@ -57,21 +55,50 @@ static unsigned int fscrypt_get_dun_bytes(const struct fscrypt_info *ci)</div><div class='ctx'> 	if (flags &amp; FSCRYPT_POLICY_FLAG_IV_INO_LBLK_32)</div><div class='ctx'> 		return sizeof(__le32);</div><div class='ctx'> </div><div class='del'>-	/* Default case: IVs are just the file logical block number */</div><div class='del'>-	if (sb-&gt;s_cop-&gt;get_ino_and_lblk_bits)</div><div class='del'>-		sb-&gt;s_cop-&gt;get_ino_and_lblk_bits(sb, &amp;ino_bits, &amp;lblk_bits);</div><div class='del'>-	return DIV_ROUND_UP(lblk_bits, 8);</div><div class='add'>+	/* Default case: IVs are just the file data unit index */</div><div class='add'>+	dun_bits = fscrypt_max_file_dun_bits(sb, ci-&gt;ci_data_unit_bits);</div><div class='add'>+	return DIV_ROUND_UP(dun_bits, 8);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Log a message when starting to use blk-crypto (native) or blk-crypto-fallback</div><div class='add'>+ * for an encryption mode for the first time.  This is the blk-crypto</div><div class='add'>+ * counterpart to the message logged when starting to use the crypto API for the</div><div class='add'>+ * first time.  A limitation is that these messages don't convey which specific</div><div class='add'>+ * filesystems or files are using each implementation.  However, *usually*</div><div class='add'>+ * systems use just one implementation per mode, which makes these messages</div><div class='add'>+ * helpful for debugging problems where the "wrong" implementation is used.</div><div class='add'>+ */</div><div class='add'>+static void fscrypt_log_blk_crypto_impl(struct fscrypt_mode *mode,</div><div class='add'>+					struct block_device **devs,</div><div class='add'>+					unsigned int num_devs,</div><div class='add'>+					const struct blk_crypto_config *cfg)</div><div class='add'>+{</div><div class='add'>+	unsigned int i;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; num_devs; i++) {</div><div class='add'>+		if (!IS_ENABLED(CONFIG_BLK_INLINE_ENCRYPTION_FALLBACK) ||</div><div class='add'>+		    blk_crypto_config_supported_natively(devs[i], cfg)) {</div><div class='add'>+			if (!xchg(&amp;mode-&gt;logged_blk_crypto_native, 1))</div><div class='add'>+				pr_info("fscrypt: %s using blk-crypto (native)\n",</div><div class='add'>+					mode-&gt;friendly_name);</div><div class='add'>+		} else if (!xchg(&amp;mode-&gt;logged_blk_crypto_fallback, 1)) {</div><div class='add'>+			pr_info("fscrypt: %s using blk-crypto-fallback\n",</div><div class='add'>+				mode-&gt;friendly_name);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Enable inline encryption for this file if supported. */</div><div class='del'>-int fscrypt_select_encryption_impl(struct fscrypt_info *ci)</div><div class='add'>+int fscrypt_select_encryption_impl(struct fscrypt_inode_info *ci,</div><div class='add'>+				   bool is_hw_wrapped_key)</div><div class='ctx'> {</div><div class='ctx'> 	const struct inode *inode = ci-&gt;ci_inode;</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	struct blk_crypto_config crypto_cfg;</div><div class='del'>-	int num_devs;</div><div class='del'>-	struct request_queue **devs;</div><div class='del'>-	int i;</div><div class='add'>+	struct block_device **devs;</div><div class='add'>+	unsigned int num_devs;</div><div class='add'>+	unsigned int i;</div><div class='ctx'> </div><div class='ctx'> 	/* The file must need contents encryption, not filenames encryption */</div><div class='ctx'> 	if (!S_ISREG(inode-&gt;i_mode))</div><div class='hunk'>@@ -99,23 +126,26 @@ int fscrypt_select_encryption_impl(struct fscrypt_info *ci)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * On all the filesystem's devices, blk-crypto must support the crypto</div><div class='del'>-	 * configuration that the file would use.</div><div class='add'>+	 * On all the filesystem's block devices, blk-crypto must support the</div><div class='add'>+	 * crypto configuration that the file would use.</div><div class='ctx'> 	 */</div><div class='ctx'> 	crypto_cfg.crypto_mode = ci-&gt;ci_mode-&gt;blk_crypto_mode;</div><div class='del'>-	crypto_cfg.data_unit_size = sb-&gt;s_blocksize;</div><div class='add'>+	crypto_cfg.data_unit_size = 1U &lt;&lt; ci-&gt;ci_data_unit_bits;</div><div class='ctx'> 	crypto_cfg.dun_bytes = fscrypt_get_dun_bytes(ci);</div><div class='del'>-	num_devs = fscrypt_get_num_devices(sb);</div><div class='del'>-	devs = kmalloc_array(num_devs, sizeof(*devs), GFP_KERNEL);</div><div class='del'>-	if (!devs)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	fscrypt_get_devices(sb, num_devs, devs);</div><div class='add'>+	crypto_cfg.key_type = is_hw_wrapped_key ?</div><div class='add'>+		BLK_CRYPTO_KEY_TYPE_HW_WRAPPED : BLK_CRYPTO_KEY_TYPE_RAW;</div><div class='add'>+</div><div class='add'>+	devs = fscrypt_get_devices(sb, &amp;num_devs);</div><div class='add'>+	if (IS_ERR(devs))</div><div class='add'>+		return PTR_ERR(devs);</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; num_devs; i++) {</div><div class='ctx'> 		if (!blk_crypto_config_supported(devs[i], &amp;crypto_cfg))</div><div class='ctx'> 			goto out_free_devs;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	fscrypt_log_blk_crypto_impl(ci-&gt;ci_mode, devs, num_devs, &amp;crypto_cfg);</div><div class='add'>+</div><div class='ctx'> 	ci-&gt;ci_inlinecrypt = true;</div><div class='ctx'> out_free_devs:</div><div class='ctx'> 	kfree(devs);</div><div class='hunk'>@@ -124,55 +154,50 @@ out_free_devs:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int fscrypt_prepare_inline_crypt_key(struct fscrypt_prepared_key *prep_key,</div><div class='del'>-				     const u8 *raw_key,</div><div class='del'>-				     const struct fscrypt_info *ci)</div><div class='add'>+				     const u8 *key_bytes, size_t key_size,</div><div class='add'>+				     bool is_hw_wrapped,</div><div class='add'>+				     const struct fscrypt_inode_info *ci)</div><div class='ctx'> {</div><div class='ctx'> 	const struct inode *inode = ci-&gt;ci_inode;</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	enum blk_crypto_mode_num crypto_mode = ci-&gt;ci_mode-&gt;blk_crypto_mode;</div><div class='del'>-	int num_devs = fscrypt_get_num_devices(sb);</div><div class='del'>-	int queue_refs = 0;</div><div class='del'>-	struct fscrypt_blk_crypto_key *blk_key;</div><div class='add'>+	enum blk_crypto_key_type key_type = is_hw_wrapped ?</div><div class='add'>+		BLK_CRYPTO_KEY_TYPE_HW_WRAPPED : BLK_CRYPTO_KEY_TYPE_RAW;</div><div class='add'>+	struct blk_crypto_key *blk_key;</div><div class='add'>+	struct block_device **devs;</div><div class='add'>+	unsigned int num_devs;</div><div class='add'>+	unsigned int i;</div><div class='ctx'> 	int err;</div><div class='del'>-	int i;</div><div class='ctx'> </div><div class='del'>-	blk_key = kzalloc(struct_size(blk_key, devs, num_devs), GFP_KERNEL);</div><div class='add'>+	blk_key = kmalloc(sizeof(*blk_key), GFP_KERNEL);</div><div class='ctx'> 	if (!blk_key)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	blk_key-&gt;num_devs = num_devs;</div><div class='del'>-	fscrypt_get_devices(sb, num_devs, blk_key-&gt;devs);</div><div class='del'>-</div><div class='del'>-	err = blk_crypto_init_key(&amp;blk_key-&gt;base, raw_key, crypto_mode,</div><div class='del'>-				  fscrypt_get_dun_bytes(ci), sb-&gt;s_blocksize);</div><div class='add'>+	err = blk_crypto_init_key(blk_key, key_bytes, key_size, key_type,</div><div class='add'>+				  crypto_mode, fscrypt_get_dun_bytes(ci),</div><div class='add'>+				  1U &lt;&lt; ci-&gt;ci_data_unit_bits);</div><div class='ctx'> 	if (err) {</div><div class='ctx'> 		fscrypt_err(inode, "error %d initializing blk-crypto key", err);</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * We have to start using blk-crypto on all the filesystem's devices.</div><div class='del'>-	 * We also have to save all the request_queue's for later so that the</div><div class='del'>-	 * key can be evicted from them.  This is needed because some keys</div><div class='del'>-	 * aren't destroyed until after the filesystem was already unmounted</div><div class='del'>-	 * (namely, the per-mode keys in struct fscrypt_master_key).</div><div class='del'>-	 */</div><div class='add'>+	/* Start using blk-crypto on all the filesystem's block devices. */</div><div class='add'>+	devs = fscrypt_get_devices(sb, &amp;num_devs);</div><div class='add'>+	if (IS_ERR(devs)) {</div><div class='add'>+		err = PTR_ERR(devs);</div><div class='add'>+		goto fail;</div><div class='add'>+	}</div><div class='ctx'> 	for (i = 0; i &lt; num_devs; i++) {</div><div class='del'>-		if (!blk_get_queue(blk_key-&gt;devs[i])) {</div><div class='del'>-			fscrypt_err(inode, "couldn't get request_queue");</div><div class='del'>-			err = -EAGAIN;</div><div class='del'>-			goto fail;</div><div class='del'>-		}</div><div class='del'>-		queue_refs++;</div><div class='del'>-</div><div class='del'>-		err = blk_crypto_start_using_key(&amp;blk_key-&gt;base,</div><div class='del'>-						 blk_key-&gt;devs[i]);</div><div class='del'>-		if (err) {</div><div class='del'>-			fscrypt_err(inode,</div><div class='del'>-				    "error %d starting to use blk-crypto", err);</div><div class='del'>-			goto fail;</div><div class='del'>-		}</div><div class='add'>+		err = blk_crypto_start_using_key(devs[i], blk_key);</div><div class='add'>+		if (err)</div><div class='add'>+			break;</div><div class='add'>+	}</div><div class='add'>+	kfree(devs);</div><div class='add'>+	if (err) {</div><div class='add'>+		fscrypt_err(inode, "error %d starting to use blk-crypto", err);</div><div class='add'>+		goto fail;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Pairs with the smp_load_acquire() in fscrypt_is_key_prepared().</div><div class='ctx'> 	 * I.e., here we publish -&gt;blk_key with a RELEASE barrier so that</div><div class='hunk'>@@ -183,39 +208,74 @@ int fscrypt_prepare_inline_crypt_key(struct fscrypt_prepared_key *prep_key,</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> fail:</div><div class='del'>-	for (i = 0; i &lt; queue_refs; i++)</div><div class='del'>-		blk_put_queue(blk_key-&gt;devs[i]);</div><div class='ctx'> 	kfree_sensitive(blk_key);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void fscrypt_destroy_inline_crypt_key(struct fscrypt_prepared_key *prep_key)</div><div class='add'>+void fscrypt_destroy_inline_crypt_key(struct super_block *sb,</div><div class='add'>+				      struct fscrypt_prepared_key *prep_key)</div><div class='ctx'> {</div><div class='del'>-	struct fscrypt_blk_crypto_key *blk_key = prep_key-&gt;blk_key;</div><div class='del'>-	int i;</div><div class='add'>+	struct blk_crypto_key *blk_key = prep_key-&gt;blk_key;</div><div class='add'>+	struct block_device **devs;</div><div class='add'>+	unsigned int num_devs;</div><div class='add'>+	unsigned int i;</div><div class='ctx'> </div><div class='del'>-	if (blk_key) {</div><div class='del'>-		for (i = 0; i &lt; blk_key-&gt;num_devs; i++) {</div><div class='del'>-			blk_crypto_evict_key(blk_key-&gt;devs[i], &amp;blk_key-&gt;base);</div><div class='del'>-			blk_put_queue(blk_key-&gt;devs[i]);</div><div class='del'>-		}</div><div class='del'>-		kfree_sensitive(blk_key);</div><div class='add'>+	if (!blk_key)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/* Evict the key from all the filesystem's block devices. */</div><div class='add'>+	devs = fscrypt_get_devices(sb, &amp;num_devs);</div><div class='add'>+	if (!IS_ERR(devs)) {</div><div class='add'>+		for (i = 0; i &lt; num_devs; i++)</div><div class='add'>+			blk_crypto_evict_key(devs[i], blk_key);</div><div class='add'>+		kfree(devs);</div><div class='add'>+	}</div><div class='add'>+	kfree_sensitive(blk_key);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Ask the inline encryption hardware to derive the software secret from a</div><div class='add'>+ * hardware-wrapped key.  Returns -EOPNOTSUPP if hardware-wrapped keys aren't</div><div class='add'>+ * supported on this filesystem or hardware.</div><div class='add'>+ */</div><div class='add'>+int fscrypt_derive_sw_secret(struct super_block *sb,</div><div class='add'>+			     const u8 *wrapped_key, size_t wrapped_key_size,</div><div class='add'>+			     u8 sw_secret[BLK_CRYPTO_SW_SECRET_SIZE])</div><div class='add'>+{</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	/* The filesystem must be mounted with -o inlinecrypt. */</div><div class='add'>+	if (!(sb-&gt;s_flags &amp; SB_INLINECRYPT)) {</div><div class='add'>+		fscrypt_warn(NULL,</div><div class='add'>+			     "%s: filesystem not mounted with inlinecrypt\n",</div><div class='add'>+			     sb-&gt;s_id);</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	err = blk_crypto_derive_sw_secret(sb-&gt;s_bdev, wrapped_key,</div><div class='add'>+					  wrapped_key_size, sw_secret);</div><div class='add'>+	if (err == -EOPNOTSUPP)</div><div class='add'>+		fscrypt_warn(NULL,</div><div class='add'>+			     "%s: block device doesn't support hardware-wrapped keys\n",</div><div class='add'>+			     sb-&gt;s_id);</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> bool __fscrypt_inode_uses_inline_crypto(const struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	return inode-&gt;i_crypt_info-&gt;ci_inlinecrypt;</div><div class='add'>+	return fscrypt_get_inode_info_raw(inode)-&gt;ci_inlinecrypt;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(__fscrypt_inode_uses_inline_crypto);</div><div class='ctx'> </div><div class='del'>-static void fscrypt_generate_dun(const struct fscrypt_info *ci, u64 lblk_num,</div><div class='add'>+static void fscrypt_generate_dun(const struct fscrypt_inode_info *ci,</div><div class='add'>+				 u64 lblk_num,</div><div class='ctx'> 				 u64 dun[BLK_CRYPTO_DUN_ARRAY_SIZE])</div><div class='ctx'> {</div><div class='add'>+	u64 index = lblk_num &lt;&lt; ci-&gt;ci_data_units_per_block_bits;</div><div class='ctx'> 	union fscrypt_iv iv;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	fscrypt_generate_iv(&amp;iv, lblk_num, ci);</div><div class='add'>+	fscrypt_generate_iv(&amp;iv, index, ci);</div><div class='ctx'> </div><div class='ctx'> 	BUILD_BUG_ON(FSCRYPT_MAX_IV_SIZE &gt; BLK_CRYPTO_MAX_IV_SIZE);</div><div class='ctx'> 	memset(dun, 0, BLK_CRYPTO_MAX_IV_SIZE);</div><div class='hunk'>@@ -242,15 +302,15 @@ static void fscrypt_generate_dun(const struct fscrypt_info *ci, u64 lblk_num,</div><div class='ctx'> void fscrypt_set_bio_crypt_ctx(struct bio *bio, const struct inode *inode,</div><div class='ctx'> 			       u64 first_lblk, gfp_t gfp_mask)</div><div class='ctx'> {</div><div class='del'>-	const struct fscrypt_info *ci;</div><div class='add'>+	const struct fscrypt_inode_info *ci;</div><div class='ctx'> 	u64 dun[BLK_CRYPTO_DUN_ARRAY_SIZE];</div><div class='ctx'> </div><div class='ctx'> 	if (!fscrypt_inode_uses_inline_crypto(inode))</div><div class='ctx'> 		return;</div><div class='del'>-	ci = inode-&gt;i_crypt_info;</div><div class='add'>+	ci = fscrypt_get_inode_info_raw(inode);</div><div class='ctx'> </div><div class='ctx'> 	fscrypt_generate_dun(ci, first_lblk, dun);</div><div class='del'>-	bio_crypt_set_ctx(bio, &amp;ci-&gt;ci_enc_key.blk_key-&gt;base, dun, gfp_mask);</div><div class='add'>+	bio_crypt_set_ctx(bio, ci-&gt;ci_enc_key.blk_key, dun, gfp_mask);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(fscrypt_set_bio_crypt_ctx);</div><div class='ctx'> </div><div class='hunk'>@@ -259,7 +319,7 @@ static bool bh_get_inode_and_lblk_num(const struct buffer_head *bh,</div><div class='ctx'> 				      const struct inode **inode_ret,</div><div class='ctx'> 				      u64 *lblk_num_ret)</div><div class='ctx'> {</div><div class='del'>-	struct page *page = bh-&gt;b_page;</div><div class='add'>+	struct folio *folio = bh-&gt;b_folio;</div><div class='ctx'> 	const struct address_space *mapping;</div><div class='ctx'> 	const struct inode *inode;</div><div class='ctx'> </div><div class='hunk'>@@ -267,14 +327,13 @@ static bool bh_get_inode_and_lblk_num(const struct buffer_head *bh,</div><div class='ctx'> 	 * The ext4 journal (jbd2) can submit a buffer_head it directly created</div><div class='ctx'> 	 * for a non-pagecache page.  fscrypt doesn't care about these.</div><div class='ctx'> 	 */</div><div class='del'>-	mapping = page_mapping(page);</div><div class='add'>+	mapping = folio_mapping(folio);</div><div class='ctx'> 	if (!mapping)</div><div class='ctx'> 		return false;</div><div class='ctx'> 	inode = mapping-&gt;host;</div><div class='ctx'> </div><div class='ctx'> 	*inode_ret = inode;</div><div class='del'>-	*lblk_num_ret = ((u64)page-&gt;index &lt;&lt; (PAGE_SHIFT - inode-&gt;i_blkbits)) +</div><div class='del'>-			(bh_offset(bh) &gt;&gt; inode-&gt;i_blkbits);</div><div class='add'>+	*lblk_num_ret = (folio_pos(folio) + bh_offset(bh)) &gt;&gt; inode-&gt;i_blkbits;</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -315,28 +374,34 @@ EXPORT_SYMBOL_GPL(fscrypt_set_bio_crypt_ctx_bh);</div><div class='ctx'>  *</div><div class='ctx'>  * fscrypt_set_bio_crypt_ctx() must have already been called on the bio.</div><div class='ctx'>  *</div><div class='add'>+ * This function isn't required in cases where crypto-mergeability is ensured in</div><div class='add'>+ * another way, such as I/O targeting only a single file (and thus a single key)</div><div class='add'>+ * combined with fscrypt_limit_io_blocks() to ensure DUN contiguity.</div><div class='add'>+ *</div><div class='ctx'>  * Return: true iff the I/O is mergeable</div><div class='ctx'>  */</div><div class='ctx'> bool fscrypt_mergeable_bio(struct bio *bio, const struct inode *inode,</div><div class='ctx'> 			   u64 next_lblk)</div><div class='ctx'> {</div><div class='ctx'> 	const struct bio_crypt_ctx *bc = bio-&gt;bi_crypt_context;</div><div class='add'>+	const struct fscrypt_inode_info *ci;</div><div class='ctx'> 	u64 next_dun[BLK_CRYPTO_DUN_ARRAY_SIZE];</div><div class='ctx'> </div><div class='ctx'> 	if (!!bc != fscrypt_inode_uses_inline_crypto(inode))</div><div class='ctx'> 		return false;</div><div class='ctx'> 	if (!bc)</div><div class='ctx'> 		return true;</div><div class='add'>+	ci = fscrypt_get_inode_info_raw(inode);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Comparing the key pointers is good enough, as all I/O for each key</div><div class='ctx'> 	 * uses the same pointer.  I.e., there's currently no need to support</div><div class='ctx'> 	 * merging requests where the keys are the same but the pointers differ.</div><div class='ctx'> 	 */</div><div class='del'>-	if (bc-&gt;bc_key != &amp;inode-&gt;i_crypt_info-&gt;ci_enc_key.blk_key-&gt;base)</div><div class='add'>+	if (bc-&gt;bc_key != ci-&gt;ci_enc_key.blk_key)</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	fscrypt_generate_dun(inode-&gt;i_crypt_info, next_lblk, next_dun);</div><div class='add'>+	fscrypt_generate_dun(ci, next_lblk, next_dun);</div><div class='ctx'> 	return bio_crypt_dun_is_contiguous(bc, bio-&gt;bi_iter.bi_size, next_dun);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(fscrypt_mergeable_bio);</div><div class='hunk'>@@ -363,3 +428,90 @@ bool fscrypt_mergeable_bio_bh(struct bio *bio,</div><div class='ctx'> 	return fscrypt_mergeable_bio(bio, inode, next_lblk);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(fscrypt_mergeable_bio_bh);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fscrypt_dio_supported() - check whether DIO (direct I/O) is supported on an</div><div class='add'>+ *			     inode, as far as encryption is concerned</div><div class='add'>+ * @inode: the inode in question</div><div class='add'>+ *</div><div class='add'>+ * Return: %true if there are no encryption constraints that prevent DIO from</div><div class='add'>+ *	   being supported; %false if DIO is unsupported.  (Note that in the</div><div class='add'>+ *	   %true case, the filesystem might have other, non-encryption-related</div><div class='add'>+ *	   constraints that prevent DIO from actually being supported.  Also, on</div><div class='add'>+ *	   encrypted files the filesystem is still responsible for only allowing</div><div class='add'>+ *	   DIO when requests are filesystem-block-aligned.)</div><div class='add'>+ */</div><div class='add'>+bool fscrypt_dio_supported(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	/* If the file is unencrypted, no veto from us. */</div><div class='add'>+	if (!fscrypt_needs_contents_encryption(inode))</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We only support DIO with inline crypto, not fs-layer crypto.</div><div class='add'>+	 *</div><div class='add'>+	 * To determine whether the inode is using inline crypto, we have to set</div><div class='add'>+	 * up the key if it wasn't already done.  This is because in the current</div><div class='add'>+	 * design of fscrypt, the decision of whether to use inline crypto or</div><div class='add'>+	 * not isn't made until the inode's encryption key is being set up.  In</div><div class='add'>+	 * the DIO read/write case, the key will always be set up already, since</div><div class='add'>+	 * the file will be open.  But in the case of statx(), the key might not</div><div class='add'>+	 * be set up yet, as the file might not have been opened yet.</div><div class='add'>+	 */</div><div class='add'>+	err = fscrypt_require_key(inode);</div><div class='add'>+	if (err) {</div><div class='add'>+		/*</div><div class='add'>+		 * Key unavailable or couldn't be set up.  This edge case isn't</div><div class='add'>+		 * worth worrying about; just report that DIO is unsupported.</div><div class='add'>+		 */</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+	return fscrypt_inode_uses_inline_crypto(inode);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(fscrypt_dio_supported);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fscrypt_limit_io_blocks() - limit I/O blocks to avoid discontiguous DUNs</div><div class='add'>+ * @inode: the file on which I/O is being done</div><div class='add'>+ * @lblk: the block at which the I/O is being started from</div><div class='add'>+ * @nr_blocks: the number of blocks we want to submit starting at @lblk</div><div class='add'>+ *</div><div class='add'>+ * Determine the limit to the number of blocks that can be submitted in a bio</div><div class='add'>+ * targeting @lblk without causing a data unit number (DUN) discontiguity.</div><div class='add'>+ *</div><div class='add'>+ * This is normally just @nr_blocks, as normally the DUNs just increment along</div><div class='add'>+ * with the logical blocks.  (Or the file is not encrypted.)</div><div class='add'>+ *</div><div class='add'>+ * In rare cases, fscrypt can be using an IV generation method that allows the</div><div class='add'>+ * DUN to wrap around within logically contiguous blocks, and that wraparound</div><div class='add'>+ * will occur.  If this happens, a value less than @nr_blocks will be returned</div><div class='add'>+ * so that the wraparound doesn't occur in the middle of a bio, which would</div><div class='add'>+ * cause encryption/decryption to produce wrong results.</div><div class='add'>+ *</div><div class='add'>+ * Return: the actual number of blocks that can be submitted</div><div class='add'>+ */</div><div class='add'>+u64 fscrypt_limit_io_blocks(const struct inode *inode, u64 lblk, u64 nr_blocks)</div><div class='add'>+{</div><div class='add'>+	const struct fscrypt_inode_info *ci;</div><div class='add'>+	u32 dun;</div><div class='add'>+</div><div class='add'>+	if (!fscrypt_inode_uses_inline_crypto(inode))</div><div class='add'>+		return nr_blocks;</div><div class='add'>+</div><div class='add'>+	if (nr_blocks &lt;= 1)</div><div class='add'>+		return nr_blocks;</div><div class='add'>+</div><div class='add'>+	ci = fscrypt_get_inode_info_raw(inode);</div><div class='add'>+	if (!(fscrypt_policy_flags(&amp;ci-&gt;ci_policy) &amp;</div><div class='add'>+	      FSCRYPT_POLICY_FLAG_IV_INO_LBLK_32))</div><div class='add'>+		return nr_blocks;</div><div class='add'>+</div><div class='add'>+	/* With IV_INO_LBLK_32, the DUN can wrap around from U32_MAX to 0. */</div><div class='add'>+</div><div class='add'>+	dun = ci-&gt;ci_hashed_ino + lblk;</div><div class='add'>+</div><div class='add'>+	return min_t(u64, nr_blocks, (u64)U32_MAX + 1 - dun);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(fscrypt_limit_io_blocks);</div><div class='head'>diff --git a/fs/crypto/keyring.c b/fs/crypto/keyring.c<br/>index 0b3ffbb4faf4..5e939ea3ac28 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/crypto/keyring.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/crypto/keyring.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/crypto/keyring.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/crypto/keyring.c</a></div><div class='hunk'>@@ -19,15 +19,29 @@</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> #include &lt;crypto/skcipher.h&gt;</div><div class='add'>+#include &lt;linux/export.h&gt;</div><div class='ctx'> #include &lt;linux/key-type.h&gt;</div><div class='add'>+#include &lt;linux/once.h&gt;</div><div class='ctx'> #include &lt;linux/random.h&gt;</div><div class='ctx'> #include &lt;linux/seq_file.h&gt;</div><div class='add'>+#include &lt;linux/unaligned.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "fscrypt_private.h"</div><div class='ctx'> </div><div class='add'>+/* The master encryption keys for a filesystem (-&gt;s_master_keys) */</div><div class='add'>+struct fscrypt_keyring {</div><div class='add'>+	/*</div><div class='add'>+	 * Lock that protects -&gt;key_hashtable.  It does *not* protect the</div><div class='add'>+	 * fscrypt_master_key structs themselves.</div><div class='add'>+	 */</div><div class='add'>+	spinlock_t lock;</div><div class='add'>+</div><div class='add'>+	/* Hash table that maps fscrypt_key_specifier to fscrypt_master_key */</div><div class='add'>+	struct hlist_head key_hashtable[128];</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> static void wipe_master_key_secret(struct fscrypt_master_key_secret *secret)</div><div class='ctx'> {</div><div class='del'>-	fscrypt_destroy_hkdf(&amp;secret-&gt;hkdf);</div><div class='ctx'> 	memzero_explicit(secret, sizeof(*secret));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -38,76 +52,108 @@ static void move_master_key_secret(struct fscrypt_master_key_secret *dst,</div><div class='ctx'> 	memzero_explicit(src, sizeof(*src));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void free_master_key(struct fscrypt_master_key *mk)</div><div class='add'>+static void fscrypt_free_master_key(struct rcu_head *head)</div><div class='ctx'> {</div><div class='del'>-	size_t i;</div><div class='del'>-</div><div class='del'>-	wipe_master_key_secret(&amp;mk-&gt;mk_secret);</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt;= FSCRYPT_MODE_MAX; i++) {</div><div class='del'>-		fscrypt_destroy_prepared_key(&amp;mk-&gt;mk_direct_keys[i]);</div><div class='del'>-		fscrypt_destroy_prepared_key(&amp;mk-&gt;mk_iv_ino_lblk_64_keys[i]);</div><div class='del'>-		fscrypt_destroy_prepared_key(&amp;mk-&gt;mk_iv_ino_lblk_32_keys[i]);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	key_put(mk-&gt;mk_users);</div><div class='add'>+	struct fscrypt_master_key *mk =</div><div class='add'>+		container_of(head, struct fscrypt_master_key, mk_rcu_head);</div><div class='add'>+	/*</div><div class='add'>+	 * The master key secret and any embedded subkeys should have already</div><div class='add'>+	 * been wiped when the last active reference to the fscrypt_master_key</div><div class='add'>+	 * struct was dropped; doing it here would be unnecessarily late.</div><div class='add'>+	 * Nevertheless, use kfree_sensitive() in case anything was missed.</div><div class='add'>+	 */</div><div class='ctx'> 	kfree_sensitive(mk);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline bool valid_key_spec(const struct fscrypt_key_specifier *spec)</div><div class='add'>+void fscrypt_put_master_key(struct fscrypt_master_key *mk)</div><div class='ctx'> {</div><div class='del'>-	if (spec-&gt;__reserved)</div><div class='del'>-		return false;</div><div class='del'>-	return master_key_spec_len(spec) != 0;</div><div class='add'>+	if (!refcount_dec_and_test(&amp;mk-&gt;mk_struct_refs))</div><div class='add'>+		return;</div><div class='add'>+	/*</div><div class='add'>+	 * No structural references left, so free -&gt;mk_users, and also free the</div><div class='add'>+	 * fscrypt_master_key struct itself after an RCU grace period ensures</div><div class='add'>+	 * that concurrent keyring lookups can no longer find it.</div><div class='add'>+	 */</div><div class='add'>+	WARN_ON_ONCE(refcount_read(&amp;mk-&gt;mk_active_refs) != 0);</div><div class='add'>+	if (mk-&gt;mk_users) {</div><div class='add'>+		/* Clear the keyring so the quota gets released right away. */</div><div class='add'>+		keyring_clear(mk-&gt;mk_users);</div><div class='add'>+		key_put(mk-&gt;mk_users);</div><div class='add'>+		mk-&gt;mk_users = NULL;</div><div class='add'>+	}</div><div class='add'>+	call_rcu(&amp;mk-&gt;mk_rcu_head, fscrypt_free_master_key);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fscrypt_key_instantiate(struct key *key,</div><div class='del'>-				   struct key_preparsed_payload *prep)</div><div class='add'>+void fscrypt_put_master_key_activeref(struct super_block *sb,</div><div class='add'>+				      struct fscrypt_master_key *mk)</div><div class='ctx'> {</div><div class='del'>-	key-&gt;payload.data[0] = (struct fscrypt_master_key *)prep-&gt;data;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='add'>+	size_t i;</div><div class='ctx'> </div><div class='del'>-static void fscrypt_key_destroy(struct key *key)</div><div class='del'>-{</div><div class='del'>-	free_master_key(key-&gt;payload.data[0]);</div><div class='del'>-}</div><div class='add'>+	if (!refcount_dec_and_test(&amp;mk-&gt;mk_active_refs))</div><div class='add'>+		return;</div><div class='add'>+	/*</div><div class='add'>+	 * No active references left, so complete the full removal of this</div><div class='add'>+	 * fscrypt_master_key struct by removing it from the keyring and</div><div class='add'>+	 * destroying any subkeys embedded in it.</div><div class='add'>+	 */</div><div class='ctx'> </div><div class='del'>-static void fscrypt_key_describe(const struct key *key, struct seq_file *m)</div><div class='del'>-{</div><div class='del'>-	seq_puts(m, key-&gt;description);</div><div class='add'>+	if (WARN_ON_ONCE(!sb-&gt;s_master_keys))</div><div class='add'>+		return;</div><div class='add'>+	spin_lock(&amp;sb-&gt;s_master_keys-&gt;lock);</div><div class='add'>+	hlist_del_rcu(&amp;mk-&gt;mk_node);</div><div class='add'>+	spin_unlock(&amp;sb-&gt;s_master_keys-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	if (key_is_positive(key)) {</div><div class='del'>-		const struct fscrypt_master_key *mk = key-&gt;payload.data[0];</div><div class='add'>+	/*</div><div class='add'>+	 * -&gt;mk_active_refs == 0 implies that -&gt;mk_present is false and</div><div class='add'>+	 * -&gt;mk_decrypted_inodes is empty.</div><div class='add'>+	 */</div><div class='add'>+	WARN_ON_ONCE(mk-&gt;mk_present);</div><div class='add'>+	WARN_ON_ONCE(!list_empty(&amp;mk-&gt;mk_decrypted_inodes));</div><div class='ctx'> </div><div class='del'>-		if (!is_master_key_secret_present(&amp;mk-&gt;mk_secret))</div><div class='del'>-			seq_puts(m, ": secret removed");</div><div class='add'>+	for (i = 0; i &lt;= FSCRYPT_MODE_MAX; i++) {</div><div class='add'>+		fscrypt_destroy_prepared_key(</div><div class='add'>+				sb, &amp;mk-&gt;mk_direct_keys[i]);</div><div class='add'>+		fscrypt_destroy_prepared_key(</div><div class='add'>+				sb, &amp;mk-&gt;mk_iv_ino_lblk_64_keys[i]);</div><div class='add'>+		fscrypt_destroy_prepared_key(</div><div class='add'>+				sb, &amp;mk-&gt;mk_iv_ino_lblk_32_keys[i]);</div><div class='ctx'> 	}</div><div class='add'>+	memzero_explicit(&amp;mk-&gt;mk_ino_hash_key,</div><div class='add'>+			 sizeof(mk-&gt;mk_ino_hash_key));</div><div class='add'>+	mk-&gt;mk_ino_hash_key_initialized = false;</div><div class='add'>+</div><div class='add'>+	/* Drop the structural ref associated with the active refs. */</div><div class='add'>+	fscrypt_put_master_key(mk);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Type of key in -&gt;s_master_keys.  Each key of this type represents a master</div><div class='del'>- * key which has been added to the filesystem.  Its payload is a</div><div class='del'>- * 'struct fscrypt_master_key'.  The "." prefix in the key type name prevents</div><div class='del'>- * users from adding keys of this type via the keyrings syscalls rather than via</div><div class='del'>- * the intended method of FS_IOC_ADD_ENCRYPTION_KEY.</div><div class='add'>+ * This transitions the key state from present to incompletely removed, and then</div><div class='add'>+ * potentially to absent (depending on whether inodes remain).</div><div class='ctx'>  */</div><div class='del'>-static struct key_type key_type_fscrypt = {</div><div class='del'>-	.name			= "._fscrypt",</div><div class='del'>-	.instantiate		= fscrypt_key_instantiate,</div><div class='del'>-	.destroy		= fscrypt_key_destroy,</div><div class='del'>-	.describe		= fscrypt_key_describe,</div><div class='del'>-};</div><div class='add'>+static void fscrypt_initiate_key_removal(struct super_block *sb,</div><div class='add'>+					 struct fscrypt_master_key *mk)</div><div class='add'>+{</div><div class='add'>+	WRITE_ONCE(mk-&gt;mk_present, false);</div><div class='add'>+	wipe_master_key_secret(&amp;mk-&gt;mk_secret);</div><div class='add'>+	fscrypt_put_master_key_activeref(sb, mk);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool valid_key_spec(const struct fscrypt_key_specifier *spec)</div><div class='add'>+{</div><div class='add'>+	if (spec-&gt;__reserved)</div><div class='add'>+		return false;</div><div class='add'>+	return master_key_spec_len(spec) != 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> static int fscrypt_user_key_instantiate(struct key *key,</div><div class='ctx'> 					struct key_preparsed_payload *prep)</div><div class='ctx'> {</div><div class='ctx'> 	/*</div><div class='del'>-	 * We just charge FSCRYPT_MAX_KEY_SIZE bytes to the user's key quota for</div><div class='del'>-	 * each key, regardless of the exact key size.  The amount of memory</div><div class='add'>+	 * We just charge FSCRYPT_MAX_RAW_KEY_SIZE bytes to the user's key quota</div><div class='add'>+	 * for each key, regardless of the exact key size.  The amount of memory</div><div class='ctx'> 	 * actually used is greater than the size of the raw key anyway.</div><div class='ctx'> 	 */</div><div class='del'>-	return key_payload_reserve(key, FSCRYPT_MAX_KEY_SIZE);</div><div class='add'>+	return key_payload_reserve(key, FSCRYPT_MAX_RAW_KEY_SIZE);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void fscrypt_user_key_describe(const struct key *key, struct seq_file *m)</div><div class='hunk'>@@ -131,32 +177,6 @@ static struct key_type key_type_fscrypt_user = {</div><div class='ctx'> 	.describe		= fscrypt_user_key_describe,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/* Search -&gt;s_master_keys or -&gt;mk_users */</div><div class='del'>-static struct key *search_fscrypt_keyring(struct key *keyring,</div><div class='del'>-					  struct key_type *type,</div><div class='del'>-					  const char *description)</div><div class='del'>-{</div><div class='del'>-	/*</div><div class='del'>-	 * We need to mark the keyring reference as "possessed" so that we</div><div class='del'>-	 * acquire permission to search it, via the KEY_POS_SEARCH permission.</div><div class='del'>-	 */</div><div class='del'>-	key_ref_t keyref = make_key_ref(keyring, true /* possessed */);</div><div class='del'>-</div><div class='del'>-	keyref = keyring_search(keyref, type, description, false);</div><div class='del'>-	if (IS_ERR(keyref)) {</div><div class='del'>-		if (PTR_ERR(keyref) == -EAGAIN || /* not found */</div><div class='del'>-		    PTR_ERR(keyref) == -EKEYREVOKED) /* recently invalidated */</div><div class='del'>-			keyref = ERR_PTR(-ENOKEY);</div><div class='del'>-		return ERR_CAST(keyref);</div><div class='del'>-	}</div><div class='del'>-	return key_ref_to_ptr(keyref);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#define FSCRYPT_FS_KEYRING_DESCRIPTION_SIZE	\</div><div class='del'>-	(CONST_STRLEN("fscrypt-") + sizeof_field(struct super_block, s_id))</div><div class='del'>-</div><div class='del'>-#define FSCRYPT_MK_DESCRIPTION_SIZE	(2 * FSCRYPT_KEY_IDENTIFIER_SIZE + 1)</div><div class='del'>-</div><div class='ctx'> #define FSCRYPT_MK_USERS_DESCRIPTION_SIZE	\</div><div class='ctx'> 	(CONST_STRLEN("fscrypt-") + 2 * FSCRYPT_KEY_IDENTIFIER_SIZE + \</div><div class='ctx'> 	 CONST_STRLEN("-users") + 1)</div><div class='hunk'>@@ -164,21 +184,6 @@ static struct key *search_fscrypt_keyring(struct key *keyring,</div><div class='ctx'> #define FSCRYPT_MK_USER_DESCRIPTION_SIZE	\</div><div class='ctx'> 	(2 * FSCRYPT_KEY_IDENTIFIER_SIZE + CONST_STRLEN(".uid.") + 10 + 1)</div><div class='ctx'> </div><div class='del'>-static void format_fs_keyring_description(</div><div class='del'>-			char description[FSCRYPT_FS_KEYRING_DESCRIPTION_SIZE],</div><div class='del'>-			const struct super_block *sb)</div><div class='del'>-{</div><div class='del'>-	sprintf(description, "fscrypt-%s", sb-&gt;s_id);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void format_mk_description(</div><div class='del'>-			char description[FSCRYPT_MK_DESCRIPTION_SIZE],</div><div class='del'>-			const struct fscrypt_key_specifier *mk_spec)</div><div class='del'>-{</div><div class='del'>-	sprintf(description, "%*phN",</div><div class='del'>-		master_key_spec_len(mk_spec), (u8 *)&amp;mk_spec-&gt;u);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static void format_mk_users_keyring_description(</div><div class='ctx'> 			char description[FSCRYPT_MK_USERS_DESCRIPTION_SIZE],</div><div class='ctx'> 			const u8 mk_identifier[FSCRYPT_KEY_IDENTIFIER_SIZE])</div><div class='hunk'>@@ -199,20 +204,15 @@ static void format_mk_user_description(</div><div class='ctx'> /* Create -&gt;s_master_keys if needed.  Synchronized by fscrypt_add_key_mutex. */</div><div class='ctx'> static int allocate_filesystem_keyring(struct super_block *sb)</div><div class='ctx'> {</div><div class='del'>-	char description[FSCRYPT_FS_KEYRING_DESCRIPTION_SIZE];</div><div class='del'>-	struct key *keyring;</div><div class='add'>+	struct fscrypt_keyring *keyring;</div><div class='ctx'> </div><div class='ctx'> 	if (sb-&gt;s_master_keys)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	format_fs_keyring_description(description, sb);</div><div class='del'>-	keyring = keyring_alloc(description, GLOBAL_ROOT_UID, GLOBAL_ROOT_GID,</div><div class='del'>-				current_cred(), KEY_POS_SEARCH |</div><div class='del'>-				  KEY_USR_SEARCH | KEY_USR_READ | KEY_USR_VIEW,</div><div class='del'>-				KEY_ALLOC_NOT_IN_QUOTA, NULL, NULL);</div><div class='del'>-	if (IS_ERR(keyring))</div><div class='del'>-		return PTR_ERR(keyring);</div><div class='del'>-</div><div class='add'>+	keyring = kzalloc(sizeof(*keyring), GFP_KERNEL);</div><div class='add'>+	if (!keyring)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	spin_lock_init(&amp;keyring-&gt;lock);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Pairs with the smp_load_acquire() in fscrypt_find_master_key().</div><div class='ctx'> 	 * I.e., here we publish -&gt;s_master_keys with a RELEASE barrier so that</div><div class='hunk'>@@ -222,21 +222,76 @@ static int allocate_filesystem_keyring(struct super_block *sb)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void fscrypt_sb_free(struct super_block *sb)</div><div class='add'>+/*</div><div class='add'>+ * Release all encryption keys that have been added to the filesystem, along</div><div class='add'>+ * with the keyring that contains them.</div><div class='add'>+ *</div><div class='add'>+ * This is called at unmount time, after all potentially-encrypted inodes have</div><div class='add'>+ * been evicted.  The filesystem's underlying block device(s) are still</div><div class='add'>+ * available at this time; this is important because after user file accesses</div><div class='add'>+ * have been allowed, this function may need to evict keys from the keyslots of</div><div class='add'>+ * an inline crypto engine, which requires the block device(s).</div><div class='add'>+ */</div><div class='add'>+void fscrypt_destroy_keyring(struct super_block *sb)</div><div class='ctx'> {</div><div class='del'>-	key_put(sb-&gt;s_master_keys);</div><div class='add'>+	struct fscrypt_keyring *keyring = sb-&gt;s_master_keys;</div><div class='add'>+	size_t i;</div><div class='add'>+</div><div class='add'>+	if (!keyring)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; ARRAY_SIZE(keyring-&gt;key_hashtable); i++) {</div><div class='add'>+		struct hlist_head *bucket = &amp;keyring-&gt;key_hashtable[i];</div><div class='add'>+		struct fscrypt_master_key *mk;</div><div class='add'>+		struct hlist_node *tmp;</div><div class='add'>+</div><div class='add'>+		hlist_for_each_entry_safe(mk, tmp, bucket, mk_node) {</div><div class='add'>+			/*</div><div class='add'>+			 * Since all potentially-encrypted inodes were already</div><div class='add'>+			 * evicted, every key remaining in the keyring should</div><div class='add'>+			 * have an empty inode list, and should only still be in</div><div class='add'>+			 * the keyring due to the single active ref associated</div><div class='add'>+			 * with -&gt;mk_present.  There should be no structural</div><div class='add'>+			 * refs beyond the one associated with the active ref.</div><div class='add'>+			 */</div><div class='add'>+			WARN_ON_ONCE(refcount_read(&amp;mk-&gt;mk_active_refs) != 1);</div><div class='add'>+			WARN_ON_ONCE(refcount_read(&amp;mk-&gt;mk_struct_refs) != 1);</div><div class='add'>+			WARN_ON_ONCE(!mk-&gt;mk_present);</div><div class='add'>+			fscrypt_initiate_key_removal(sb, mk);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	kfree_sensitive(keyring);</div><div class='ctx'> 	sb-&gt;s_master_keys = NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static struct hlist_head *</div><div class='add'>+fscrypt_mk_hash_bucket(struct fscrypt_keyring *keyring,</div><div class='add'>+		       const struct fscrypt_key_specifier *mk_spec)</div><div class='add'>+{</div><div class='add'>+	/*</div><div class='add'>+	 * Since key specifiers should be "random" values, it is sufficient to</div><div class='add'>+	 * use a trivial hash function that just takes the first several bits of</div><div class='add'>+	 * the key specifier.</div><div class='add'>+	 */</div><div class='add'>+	unsigned long i = get_unaligned((unsigned long *)&amp;mk_spec-&gt;u);</div><div class='add'>+</div><div class='add'>+	return &amp;keyring-&gt;key_hashtable[i % ARRAY_SIZE(keyring-&gt;key_hashtable)];</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='del'>- * Find the specified master key in -&gt;s_master_keys.</div><div class='del'>- * Returns ERR_PTR(-ENOKEY) if not found.</div><div class='add'>+ * Find the specified master key struct in -&gt;s_master_keys and take a structural</div><div class='add'>+ * ref to it.  The structural ref guarantees that the key struct continues to</div><div class='add'>+ * exist, but it does *not* guarantee that -&gt;s_master_keys continues to contain</div><div class='add'>+ * the key struct.  The structural ref needs to be dropped by</div><div class='add'>+ * fscrypt_put_master_key().  Returns NULL if the key struct is not found.</div><div class='ctx'>  */</div><div class='del'>-struct key *fscrypt_find_master_key(struct super_block *sb,</div><div class='del'>-				    const struct fscrypt_key_specifier *mk_spec)</div><div class='add'>+struct fscrypt_master_key *</div><div class='add'>+fscrypt_find_master_key(struct super_block *sb,</div><div class='add'>+			const struct fscrypt_key_specifier *mk_spec)</div><div class='ctx'> {</div><div class='del'>-	struct key *keyring;</div><div class='del'>-	char description[FSCRYPT_MK_DESCRIPTION_SIZE];</div><div class='add'>+	struct fscrypt_keyring *keyring;</div><div class='add'>+	struct hlist_head *bucket;</div><div class='add'>+	struct fscrypt_master_key *mk;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Pairs with the smp_store_release() in allocate_filesystem_keyring().</div><div class='hunk'>@@ -246,10 +301,38 @@ struct key *fscrypt_find_master_key(struct super_block *sb,</div><div class='ctx'> 	 */</div><div class='ctx'> 	keyring = smp_load_acquire(&amp;sb-&gt;s_master_keys);</div><div class='ctx'> 	if (keyring == NULL)</div><div class='del'>-		return ERR_PTR(-ENOKEY); /* No keyring yet, so no keys yet. */</div><div class='del'>-</div><div class='del'>-	format_mk_description(description, mk_spec);</div><div class='del'>-	return search_fscrypt_keyring(keyring, &amp;key_type_fscrypt, description);</div><div class='add'>+		return NULL; /* No keyring yet, so no keys yet. */</div><div class='add'>+</div><div class='add'>+	bucket = fscrypt_mk_hash_bucket(keyring, mk_spec);</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	switch (mk_spec-&gt;type) {</div><div class='add'>+	case FSCRYPT_KEY_SPEC_TYPE_DESCRIPTOR:</div><div class='add'>+		hlist_for_each_entry_rcu(mk, bucket, mk_node) {</div><div class='add'>+			if (mk-&gt;mk_spec.type ==</div><div class='add'>+				FSCRYPT_KEY_SPEC_TYPE_DESCRIPTOR &amp;&amp;</div><div class='add'>+			    memcmp(mk-&gt;mk_spec.u.descriptor,</div><div class='add'>+				   mk_spec-&gt;u.descriptor,</div><div class='add'>+				   FSCRYPT_KEY_DESCRIPTOR_SIZE) == 0 &amp;&amp;</div><div class='add'>+			    refcount_inc_not_zero(&amp;mk-&gt;mk_struct_refs))</div><div class='add'>+				goto out;</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='add'>+	case FSCRYPT_KEY_SPEC_TYPE_IDENTIFIER:</div><div class='add'>+		hlist_for_each_entry_rcu(mk, bucket, mk_node) {</div><div class='add'>+			if (mk-&gt;mk_spec.type ==</div><div class='add'>+				FSCRYPT_KEY_SPEC_TYPE_IDENTIFIER &amp;&amp;</div><div class='add'>+			    memcmp(mk-&gt;mk_spec.u.identifier,</div><div class='add'>+				   mk_spec-&gt;u.identifier,</div><div class='add'>+				   FSCRYPT_KEY_IDENTIFIER_SIZE) == 0 &amp;&amp;</div><div class='add'>+			    refcount_inc_not_zero(&amp;mk-&gt;mk_struct_refs))</div><div class='add'>+				goto out;</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+	mk = NULL;</div><div class='add'>+out:</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+	return mk;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int allocate_master_key_users_keyring(struct fscrypt_master_key *mk)</div><div class='hunk'>@@ -277,17 +360,30 @@ static int allocate_master_key_users_keyring(struct fscrypt_master_key *mk)</div><div class='ctx'> static struct key *find_master_key_user(struct fscrypt_master_key *mk)</div><div class='ctx'> {</div><div class='ctx'> 	char description[FSCRYPT_MK_USER_DESCRIPTION_SIZE];</div><div class='add'>+	key_ref_t keyref;</div><div class='ctx'> </div><div class='ctx'> 	format_mk_user_description(description, mk-&gt;mk_spec.u.identifier);</div><div class='del'>-	return search_fscrypt_keyring(mk-&gt;mk_users, &amp;key_type_fscrypt_user,</div><div class='del'>-				      description);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We need to mark the keyring reference as "possessed" so that we</div><div class='add'>+	 * acquire permission to search it, via the KEY_POS_SEARCH permission.</div><div class='add'>+	 */</div><div class='add'>+	keyref = keyring_search(make_key_ref(mk-&gt;mk_users, true /*possessed*/),</div><div class='add'>+				&amp;key_type_fscrypt_user, description, false);</div><div class='add'>+	if (IS_ERR(keyref)) {</div><div class='add'>+		if (PTR_ERR(keyref) == -EAGAIN || /* not found */</div><div class='add'>+		    PTR_ERR(keyref) == -EKEYREVOKED) /* recently invalidated */</div><div class='add'>+			keyref = ERR_PTR(-ENOKEY);</div><div class='add'>+		return ERR_CAST(keyref);</div><div class='add'>+	}</div><div class='add'>+	return key_ref_to_ptr(keyref);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Give the current user a "key" in -&gt;mk_users.  This charges the user's quota</div><div class='ctx'>  * and marks the master key as added by the current user, so that it cannot be</div><div class='del'>- * removed by another user with the key.  Either the master key's key-&gt;sem must</div><div class='del'>- * be held for write, or the master key must be still undergoing initialization.</div><div class='add'>+ * removed by another user with the key.  Either -&gt;mk_sem must be held for</div><div class='add'>+ * write, or the master key must be still undergoing initialization.</div><div class='ctx'>  */</div><div class='ctx'> static int add_master_key_user(struct fscrypt_master_key *mk)</div><div class='ctx'> {</div><div class='hunk'>@@ -309,7 +405,7 @@ static int add_master_key_user(struct fscrypt_master_key *mk)</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Remove the current user's "key" from -&gt;mk_users.</div><div class='del'>- * The master key's key-&gt;sem must be held for write.</div><div class='add'>+ * -&gt;mk_sem must be held for write.</div><div class='ctx'>  *</div><div class='ctx'>  * Returns 0 if removed, -ENOKEY if not found, or another -errno code.</div><div class='ctx'>  */</div><div class='hunk'>@@ -327,63 +423,49 @@ static int remove_master_key_user(struct fscrypt_master_key *mk)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Allocate a new fscrypt_master_key which contains the given secret, set it as</div><div class='del'>- * the payload of a new 'struct key' of type fscrypt, and link the 'struct key'</div><div class='del'>- * into the given keyring.  Synchronized by fscrypt_add_key_mutex.</div><div class='add'>+ * Allocate a new fscrypt_master_key, transfer the given secret over to it, and</div><div class='add'>+ * insert it into sb-&gt;s_master_keys.</div><div class='ctx'>  */</div><div class='del'>-static int add_new_master_key(struct fscrypt_master_key_secret *secret,</div><div class='del'>-			      const struct fscrypt_key_specifier *mk_spec,</div><div class='del'>-			      struct key *keyring)</div><div class='add'>+static int add_new_master_key(struct super_block *sb,</div><div class='add'>+			      struct fscrypt_master_key_secret *secret,</div><div class='add'>+			      const struct fscrypt_key_specifier *mk_spec)</div><div class='ctx'> {</div><div class='add'>+	struct fscrypt_keyring *keyring = sb-&gt;s_master_keys;</div><div class='ctx'> 	struct fscrypt_master_key *mk;</div><div class='del'>-	char description[FSCRYPT_MK_DESCRIPTION_SIZE];</div><div class='del'>-	struct key *key;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	mk = kzalloc(sizeof(*mk), GFP_KERNEL);</div><div class='ctx'> 	if (!mk)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='add'>+	init_rwsem(&amp;mk-&gt;mk_sem);</div><div class='add'>+	refcount_set(&amp;mk-&gt;mk_struct_refs, 1);</div><div class='ctx'> 	mk-&gt;mk_spec = *mk_spec;</div><div class='ctx'> </div><div class='del'>-	move_master_key_secret(&amp;mk-&gt;mk_secret, secret);</div><div class='del'>-</div><div class='del'>-	refcount_set(&amp;mk-&gt;mk_refcount, 1); /* secret is present */</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;mk-&gt;mk_decrypted_inodes);</div><div class='ctx'> 	spin_lock_init(&amp;mk-&gt;mk_decrypted_inodes_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (mk_spec-&gt;type == FSCRYPT_KEY_SPEC_TYPE_IDENTIFIER) {</div><div class='ctx'> 		err = allocate_master_key_users_keyring(mk);</div><div class='ctx'> 		if (err)</div><div class='del'>-			goto out_free_mk;</div><div class='add'>+			goto out_put;</div><div class='ctx'> 		err = add_master_key_user(mk);</div><div class='ctx'> 		if (err)</div><div class='del'>-			goto out_free_mk;</div><div class='add'>+			goto out_put;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Note that we don't charge this key to anyone's quota, since when</div><div class='del'>-	 * -&gt;mk_users is in use those keys are charged instead, and otherwise</div><div class='del'>-	 * (when -&gt;mk_users isn't in use) only root can add these keys.</div><div class='del'>-	 */</div><div class='del'>-	format_mk_description(description, mk_spec);</div><div class='del'>-	key = key_alloc(&amp;key_type_fscrypt, description,</div><div class='del'>-			GLOBAL_ROOT_UID, GLOBAL_ROOT_GID, current_cred(),</div><div class='del'>-			KEY_POS_SEARCH | KEY_USR_SEARCH | KEY_USR_VIEW,</div><div class='del'>-			KEY_ALLOC_NOT_IN_QUOTA, NULL);</div><div class='del'>-	if (IS_ERR(key)) {</div><div class='del'>-		err = PTR_ERR(key);</div><div class='del'>-		goto out_free_mk;</div><div class='del'>-	}</div><div class='del'>-	err = key_instantiate_and_link(key, mk, sizeof(*mk), keyring, NULL);</div><div class='del'>-	key_put(key);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out_free_mk;</div><div class='add'>+	move_master_key_secret(&amp;mk-&gt;mk_secret, secret);</div><div class='add'>+	mk-&gt;mk_present = true;</div><div class='add'>+	refcount_set(&amp;mk-&gt;mk_active_refs, 1); /* -&gt;mk_present is true */</div><div class='ctx'> </div><div class='add'>+	spin_lock(&amp;keyring-&gt;lock);</div><div class='add'>+	hlist_add_head_rcu(&amp;mk-&gt;mk_node,</div><div class='add'>+			   fscrypt_mk_hash_bucket(keyring, mk_spec));</div><div class='add'>+	spin_unlock(&amp;keyring-&gt;lock);</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='del'>-out_free_mk:</div><div class='del'>-	free_master_key(mk);</div><div class='add'>+out_put:</div><div class='add'>+	fscrypt_put_master_key(mk);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -392,42 +474,41 @@ out_free_mk:</div><div class='ctx'> static int add_existing_master_key(struct fscrypt_master_key *mk,</div><div class='ctx'> 				   struct fscrypt_master_key_secret *secret)</div><div class='ctx'> {</div><div class='del'>-	struct key *mk_user;</div><div class='del'>-	bool rekey;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If the current user is already in -&gt;mk_users, then there's nothing to</div><div class='del'>-	 * do.  (Not applicable for v1 policy keys, which have NULL -&gt;mk_users.)</div><div class='add'>+	 * do.  Otherwise, we need to add the user to -&gt;mk_users.  (Neither is</div><div class='add'>+	 * applicable for v1 policy keys, which have NULL -&gt;mk_users.)</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (mk-&gt;mk_users) {</div><div class='del'>-		mk_user = find_master_key_user(mk);</div><div class='add'>+		struct key *mk_user = find_master_key_user(mk);</div><div class='add'>+</div><div class='ctx'> 		if (mk_user != ERR_PTR(-ENOKEY)) {</div><div class='ctx'> 			if (IS_ERR(mk_user))</div><div class='ctx'> 				return PTR_ERR(mk_user);</div><div class='ctx'> 			key_put(mk_user);</div><div class='ctx'> 			return 0;</div><div class='ctx'> 		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* If we'll be re-adding -&gt;mk_secret, try to take the reference. */</div><div class='del'>-	rekey = !is_master_key_secret_present(&amp;mk-&gt;mk_secret);</div><div class='del'>-	if (rekey &amp;&amp; !refcount_inc_not_zero(&amp;mk-&gt;mk_refcount))</div><div class='del'>-		return KEY_DEAD;</div><div class='del'>-</div><div class='del'>-	/* Add the current user to -&gt;mk_users, if applicable. */</div><div class='del'>-	if (mk-&gt;mk_users) {</div><div class='ctx'> 		err = add_master_key_user(mk);</div><div class='del'>-		if (err) {</div><div class='del'>-			if (rekey &amp;&amp; refcount_dec_and_test(&amp;mk-&gt;mk_refcount))</div><div class='del'>-				return KEY_DEAD;</div><div class='add'>+		if (err)</div><div class='ctx'> 			return err;</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Re-add the secret if needed. */</div><div class='del'>-	if (rekey)</div><div class='add'>+	/* If the key is incompletely removed, make it present again. */</div><div class='add'>+	if (!mk-&gt;mk_present) {</div><div class='add'>+		if (!refcount_inc_not_zero(&amp;mk-&gt;mk_active_refs)) {</div><div class='add'>+			/*</div><div class='add'>+			 * Raced with the last active ref being dropped, so the</div><div class='add'>+			 * key has become, or is about to become, "absent".</div><div class='add'>+			 * Therefore, we need to allocate a new key struct.</div><div class='add'>+			 */</div><div class='add'>+			return KEY_DEAD;</div><div class='add'>+		}</div><div class='ctx'> 		move_master_key_secret(&amp;mk-&gt;mk_secret, secret);</div><div class='add'>+		WRITE_ONCE(mk-&gt;mk_present, true);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -436,38 +517,36 @@ static int do_add_master_key(struct super_block *sb,</div><div class='ctx'> 			     const struct fscrypt_key_specifier *mk_spec)</div><div class='ctx'> {</div><div class='ctx'> 	static DEFINE_MUTEX(fscrypt_add_key_mutex);</div><div class='del'>-	struct key *key;</div><div class='add'>+	struct fscrypt_master_key *mk;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;fscrypt_add_key_mutex); /* serialize find + link */</div><div class='del'>-retry:</div><div class='del'>-	key = fscrypt_find_master_key(sb, mk_spec);</div><div class='del'>-	if (IS_ERR(key)) {</div><div class='del'>-		err = PTR_ERR(key);</div><div class='del'>-		if (err != -ENOKEY)</div><div class='del'>-			goto out_unlock;</div><div class='add'>+</div><div class='add'>+	mk = fscrypt_find_master_key(sb, mk_spec);</div><div class='add'>+	if (!mk) {</div><div class='ctx'> 		/* Didn't find the key in -&gt;s_master_keys.  Add it. */</div><div class='ctx'> 		err = allocate_filesystem_keyring(sb);</div><div class='del'>-		if (err)</div><div class='del'>-			goto out_unlock;</div><div class='del'>-		err = add_new_master_key(secret, mk_spec, sb-&gt;s_master_keys);</div><div class='add'>+		if (!err)</div><div class='add'>+			err = add_new_master_key(sb, secret, mk_spec);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		/*</div><div class='del'>-		 * Found the key in -&gt;s_master_keys.  Re-add the secret if</div><div class='del'>-		 * needed, and add the user to -&gt;mk_users if needed.</div><div class='add'>+		 * Found the key in -&gt;s_master_keys.  Add the user to -&gt;mk_users</div><div class='add'>+		 * if needed, and make the key "present" again if possible.</div><div class='ctx'> 		 */</div><div class='del'>-		down_write(&amp;key-&gt;sem);</div><div class='del'>-		err = add_existing_master_key(key-&gt;payload.data[0], secret);</div><div class='del'>-		up_write(&amp;key-&gt;sem);</div><div class='add'>+		down_write(&amp;mk-&gt;mk_sem);</div><div class='add'>+		err = add_existing_master_key(mk, secret);</div><div class='add'>+		up_write(&amp;mk-&gt;mk_sem);</div><div class='ctx'> 		if (err == KEY_DEAD) {</div><div class='del'>-			/* Key being removed or needs to be removed */</div><div class='del'>-			key_invalidate(key);</div><div class='del'>-			key_put(key);</div><div class='del'>-			goto retry;</div><div class='add'>+			/*</div><div class='add'>+			 * We found a key struct, but it's already been fully</div><div class='add'>+			 * removed.  Ignore the old struct and add a new one.</div><div class='add'>+			 * fscrypt_add_key_mutex means we don't need to worry</div><div class='add'>+			 * about concurrent adds.</div><div class='add'>+			 */</div><div class='add'>+			err = add_new_master_key(sb, secret, mk_spec);</div><div class='ctx'> 		}</div><div class='del'>-		key_put(key);</div><div class='add'>+		fscrypt_put_master_key(mk);</div><div class='ctx'> 	}</div><div class='del'>-out_unlock:</div><div class='ctx'> 	mutex_unlock(&amp;fscrypt_add_key_mutex);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='hunk'>@@ -479,41 +558,79 @@ static int add_master_key(struct super_block *sb,</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (key_spec-&gt;type == FSCRYPT_KEY_SPEC_TYPE_IDENTIFIER) {</div><div class='del'>-		err = fscrypt_init_hkdf(&amp;secret-&gt;hkdf, secret-&gt;raw,</div><div class='del'>-					secret-&gt;size);</div><div class='del'>-		if (err)</div><div class='del'>-			return err;</div><div class='add'>+		u8 sw_secret[BLK_CRYPTO_SW_SECRET_SIZE];</div><div class='add'>+		u8 *kdf_key = secret-&gt;bytes;</div><div class='add'>+		unsigned int kdf_key_size = secret-&gt;size;</div><div class='add'>+		u8 keyid_kdf_ctx = HKDF_CONTEXT_KEY_IDENTIFIER_FOR_RAW_KEY;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * Now that the HKDF context is initialized, the raw key is no</div><div class='del'>-		 * longer needed.</div><div class='add'>+		 * For raw keys, the fscrypt master key is used directly as the</div><div class='add'>+		 * fscrypt KDF key.  For hardware-wrapped keys, we have to pass</div><div class='add'>+		 * the master key to the hardware to derive the KDF key, which</div><div class='add'>+		 * is then only used to derive non-file-contents subkeys.</div><div class='ctx'> 		 */</div><div class='del'>-		memzero_explicit(secret-&gt;raw, secret-&gt;size);</div><div class='add'>+		if (secret-&gt;is_hw_wrapped) {</div><div class='add'>+			err = fscrypt_derive_sw_secret(sb, secret-&gt;bytes,</div><div class='add'>+						       secret-&gt;size, sw_secret);</div><div class='add'>+			if (err)</div><div class='add'>+				return err;</div><div class='add'>+			kdf_key = sw_secret;</div><div class='add'>+			kdf_key_size = sizeof(sw_secret);</div><div class='add'>+			/*</div><div class='add'>+			 * To avoid weird behavior if someone manages to</div><div class='add'>+			 * determine sw_secret and add it as a raw key, ensure</div><div class='add'>+			 * that hardware-wrapped keys and raw keys will have</div><div class='add'>+			 * different key identifiers by deriving their key</div><div class='add'>+			 * identifiers using different KDF contexts.</div><div class='add'>+			 */</div><div class='add'>+			keyid_kdf_ctx =</div><div class='add'>+				HKDF_CONTEXT_KEY_IDENTIFIER_FOR_HW_WRAPPED_KEY;</div><div class='add'>+		}</div><div class='add'>+		fscrypt_init_hkdf(&amp;secret-&gt;hkdf, kdf_key, kdf_key_size);</div><div class='add'>+		/*</div><div class='add'>+		 * Now that the KDF context is initialized, the raw KDF key is</div><div class='add'>+		 * no longer needed.</div><div class='add'>+		 */</div><div class='add'>+		memzero_explicit(kdf_key, kdf_key_size);</div><div class='ctx'> </div><div class='ctx'> 		/* Calculate the key identifier */</div><div class='del'>-		err = fscrypt_hkdf_expand(&amp;secret-&gt;hkdf,</div><div class='del'>-					  HKDF_CONTEXT_KEY_IDENTIFIER, NULL, 0,</div><div class='del'>-					  key_spec-&gt;u.identifier,</div><div class='del'>-					  FSCRYPT_KEY_IDENTIFIER_SIZE);</div><div class='del'>-		if (err)</div><div class='del'>-			return err;</div><div class='add'>+		fscrypt_hkdf_expand(&amp;secret-&gt;hkdf, keyid_kdf_ctx, NULL, 0,</div><div class='add'>+				    key_spec-&gt;u.identifier,</div><div class='add'>+				    FSCRYPT_KEY_IDENTIFIER_SIZE);</div><div class='ctx'> 	}</div><div class='ctx'> 	return do_add_master_key(sb, secret, key_spec);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Validate the size of an fscrypt master key being added.  Note that this is</div><div class='add'>+ * just an initial check, as we don't know which ciphers will be used yet.</div><div class='add'>+ * There is a stricter size check later when the key is actually used by a file.</div><div class='add'>+ */</div><div class='add'>+static inline bool fscrypt_valid_key_size(size_t size, u32 add_key_flags)</div><div class='add'>+{</div><div class='add'>+	u32 max_size = (add_key_flags &amp; FSCRYPT_ADD_KEY_FLAG_HW_WRAPPED) ?</div><div class='add'>+		       FSCRYPT_MAX_HW_WRAPPED_KEY_SIZE :</div><div class='add'>+		       FSCRYPT_MAX_RAW_KEY_SIZE;</div><div class='add'>+</div><div class='add'>+	return size &gt;= FSCRYPT_MIN_KEY_SIZE &amp;&amp; size &lt;= max_size;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int fscrypt_provisioning_key_preparse(struct key_preparsed_payload *prep)</div><div class='ctx'> {</div><div class='ctx'> 	const struct fscrypt_provisioning_key_payload *payload = prep-&gt;data;</div><div class='ctx'> </div><div class='del'>-	if (prep-&gt;datalen &lt; sizeof(*payload) + FSCRYPT_MIN_KEY_SIZE ||</div><div class='del'>-	    prep-&gt;datalen &gt; sizeof(*payload) + FSCRYPT_MAX_KEY_SIZE)</div><div class='add'>+	if (prep-&gt;datalen &lt; sizeof(*payload))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	if (!fscrypt_valid_key_size(prep-&gt;datalen - sizeof(*payload),</div><div class='add'>+				    payload-&gt;flags))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	if (payload-&gt;type != FSCRYPT_KEY_SPEC_TYPE_DESCRIPTOR &amp;&amp;</div><div class='ctx'> 	    payload-&gt;type != FSCRYPT_KEY_SPEC_TYPE_IDENTIFIER)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	if (payload-&gt;__reserved)</div><div class='add'>+	if (payload-&gt;flags &amp; ~FSCRYPT_ADD_KEY_FLAG_HW_WRAPPED)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	prep-&gt;payload.data[0] = kmemdup(payload, prep-&gt;datalen, GFP_KERNEL);</div><div class='hunk'>@@ -557,21 +674,21 @@ static struct key_type key_type_fscrypt_provisioning = {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Retrieve the raw key from the Linux keyring key specified by 'key_id', and</div><div class='del'>- * store it into 'secret'.</div><div class='add'>+ * Retrieve the key from the Linux keyring key specified by 'key_id', and store</div><div class='add'>+ * it into 'secret'.</div><div class='ctx'>  *</div><div class='del'>- * The key must be of type "fscrypt-provisioning" and must have the field</div><div class='del'>- * fscrypt_provisioning_key_payload::type set to 'type', indicating that it's</div><div class='del'>- * only usable with fscrypt with the particular KDF version identified by</div><div class='del'>- * 'type'.  We don't use the "logon" key type because there's no way to</div><div class='del'>- * completely restrict the use of such keys; they can be used by any kernel API</div><div class='del'>- * that accepts "logon" keys and doesn't require a specific service prefix.</div><div class='add'>+ * The key must be of type "fscrypt-provisioning" and must have the 'type' and</div><div class='add'>+ * 'flags' field of the payload set to the given values, indicating that the key</div><div class='add'>+ * is intended for use for the specified purpose.  We don't use the "logon" key</div><div class='add'>+ * type because there's no way to completely restrict the use of such keys; they</div><div class='add'>+ * can be used by any kernel API that accepts "logon" keys and doesn't require a</div><div class='add'>+ * specific service prefix.</div><div class='ctx'>  *</div><div class='ctx'>  * The ability to specify the key via Linux keyring key is intended for cases</div><div class='ctx'>  * where userspace needs to re-add keys after the filesystem is unmounted and</div><div class='del'>- * re-mounted.  Most users should just provide the raw key directly instead.</div><div class='add'>+ * re-mounted.  Most users should just provide the key directly instead.</div><div class='ctx'>  */</div><div class='del'>-static int get_keyring_key(u32 key_id, u32 type,</div><div class='add'>+static int get_keyring_key(u32 key_id, u32 type, u32 flags,</div><div class='ctx'> 			   struct fscrypt_master_key_secret *secret)</div><div class='ctx'> {</div><div class='ctx'> 	key_ref_t ref;</div><div class='hunk'>@@ -588,12 +705,16 @@ static int get_keyring_key(u32 key_id, u32 type,</div><div class='ctx'> 		goto bad_key;</div><div class='ctx'> 	payload = key-&gt;payload.data[0];</div><div class='ctx'> </div><div class='del'>-	/* Don't allow fscrypt v1 keys to be used as v2 keys and vice versa. */</div><div class='del'>-	if (payload-&gt;type != type)</div><div class='add'>+	/*</div><div class='add'>+	 * Don't allow fscrypt v1 keys to be used as v2 keys and vice versa.</div><div class='add'>+	 * Similarly, don't allow hardware-wrapped keys to be used as</div><div class='add'>+	 * non-hardware-wrapped keys and vice versa.</div><div class='add'>+	 */</div><div class='add'>+	if (payload-&gt;type != type || payload-&gt;flags != flags)</div><div class='ctx'> 		goto bad_key;</div><div class='ctx'> </div><div class='ctx'> 	secret-&gt;size = key-&gt;datalen - sizeof(*payload);</div><div class='del'>-	memcpy(secret-&gt;raw, payload-&gt;raw, secret-&gt;size);</div><div class='add'>+	memcpy(secret-&gt;bytes, payload-&gt;raw, secret-&gt;size);</div><div class='ctx'> 	err = 0;</div><div class='ctx'> 	goto out_put;</div><div class='ctx'> </div><div class='hunk'>@@ -655,19 +776,28 @@ int fscrypt_ioctl_add_key(struct file *filp, void __user *_uarg)</div><div class='ctx'> 		return -EACCES;</div><div class='ctx'> </div><div class='ctx'> 	memset(&amp;secret, 0, sizeof(secret));</div><div class='add'>+</div><div class='add'>+	if (arg.flags) {</div><div class='add'>+		if (arg.flags &amp; ~FSCRYPT_ADD_KEY_FLAG_HW_WRAPPED)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		if (arg.key_spec.type != FSCRYPT_KEY_SPEC_TYPE_IDENTIFIER)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		secret.is_hw_wrapped = true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (arg.key_id) {</div><div class='ctx'> 		if (arg.raw_size != 0)</div><div class='ctx'> 			return -EINVAL;</div><div class='del'>-		err = get_keyring_key(arg.key_id, arg.key_spec.type, &amp;secret);</div><div class='add'>+		err = get_keyring_key(arg.key_id, arg.key_spec.type, arg.flags,</div><div class='add'>+				      &amp;secret);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto out_wipe_secret;</div><div class='ctx'> 	} else {</div><div class='del'>-		if (arg.raw_size &lt; FSCRYPT_MIN_KEY_SIZE ||</div><div class='del'>-		    arg.raw_size &gt; FSCRYPT_MAX_KEY_SIZE)</div><div class='add'>+		if (!fscrypt_valid_key_size(arg.raw_size, arg.flags))</div><div class='ctx'> 			return -EINVAL;</div><div class='ctx'> 		secret.size = arg.raw_size;</div><div class='ctx'> 		err = -EFAULT;</div><div class='del'>-		if (copy_from_user(secret.raw, uarg-&gt;raw, secret.size))</div><div class='add'>+		if (copy_from_user(secret.bytes, uarg-&gt;raw, secret.size))</div><div class='ctx'> 			goto out_wipe_secret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -688,24 +818,50 @@ out_wipe_secret:</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(fscrypt_ioctl_add_key);</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Add the key for '-o test_dummy_encryption' to the filesystem keyring.</div><div class='add'>+static void</div><div class='add'>+fscrypt_get_test_dummy_secret(struct fscrypt_master_key_secret *secret)</div><div class='add'>+{</div><div class='add'>+	static u8 test_key[FSCRYPT_MAX_RAW_KEY_SIZE];</div><div class='add'>+</div><div class='add'>+	get_random_once(test_key, sizeof(test_key));</div><div class='add'>+</div><div class='add'>+	memset(secret, 0, sizeof(*secret));</div><div class='add'>+	secret-&gt;size = sizeof(test_key);</div><div class='add'>+	memcpy(secret-&gt;bytes, test_key, sizeof(test_key));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void fscrypt_get_test_dummy_key_identifier(</div><div class='add'>+				u8 key_identifier[FSCRYPT_KEY_IDENTIFIER_SIZE])</div><div class='add'>+{</div><div class='add'>+	struct fscrypt_master_key_secret secret;</div><div class='add'>+</div><div class='add'>+	fscrypt_get_test_dummy_secret(&amp;secret);</div><div class='add'>+	fscrypt_init_hkdf(&amp;secret.hkdf, secret.bytes, secret.size);</div><div class='add'>+	fscrypt_hkdf_expand(&amp;secret.hkdf,</div><div class='add'>+			    HKDF_CONTEXT_KEY_IDENTIFIER_FOR_RAW_KEY, NULL, 0,</div><div class='add'>+			    key_identifier, FSCRYPT_KEY_IDENTIFIER_SIZE);</div><div class='add'>+	wipe_master_key_secret(&amp;secret);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fscrypt_add_test_dummy_key() - add the test dummy encryption key</div><div class='add'>+ * @sb: the filesystem instance to add the key to</div><div class='add'>+ * @key_spec: the key specifier of the test dummy encryption key</div><div class='add'>+ *</div><div class='add'>+ * Add the key for the test_dummy_encryption mount option to the filesystem.  To</div><div class='add'>+ * prevent misuse of this mount option, a per-boot random key is used instead of</div><div class='add'>+ * a hardcoded one.  This makes it so that any encrypted files created using</div><div class='add'>+ * this option won't be accessible after a reboot.</div><div class='ctx'>  *</div><div class='del'>- * Use a per-boot random key to prevent people from misusing this option.</div><div class='add'>+ * Return: 0 on success, -errno on failure</div><div class='ctx'>  */</div><div class='ctx'> int fscrypt_add_test_dummy_key(struct super_block *sb,</div><div class='ctx'> 			       struct fscrypt_key_specifier *key_spec)</div><div class='ctx'> {</div><div class='del'>-	static u8 test_key[FSCRYPT_MAX_KEY_SIZE];</div><div class='ctx'> 	struct fscrypt_master_key_secret secret;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	get_random_once(test_key, FSCRYPT_MAX_KEY_SIZE);</div><div class='del'>-</div><div class='del'>-	memset(&amp;secret, 0, sizeof(secret));</div><div class='del'>-	secret.size = FSCRYPT_MAX_KEY_SIZE;</div><div class='del'>-	memcpy(secret.raw, test_key, FSCRYPT_MAX_KEY_SIZE);</div><div class='del'>-</div><div class='add'>+	fscrypt_get_test_dummy_secret(&amp;secret);</div><div class='ctx'> 	err = add_master_key(sb, &amp;secret, key_spec);</div><div class='ctx'> 	wipe_master_key_secret(&amp;secret);</div><div class='ctx'> 	return err;</div><div class='hunk'>@@ -731,19 +887,19 @@ int fscrypt_verify_key_added(struct super_block *sb,</div><div class='ctx'> 			     const u8 identifier[FSCRYPT_KEY_IDENTIFIER_SIZE])</div><div class='ctx'> {</div><div class='ctx'> 	struct fscrypt_key_specifier mk_spec;</div><div class='del'>-	struct key *key, *mk_user;</div><div class='ctx'> 	struct fscrypt_master_key *mk;</div><div class='add'>+	struct key *mk_user;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	mk_spec.type = FSCRYPT_KEY_SPEC_TYPE_IDENTIFIER;</div><div class='ctx'> 	memcpy(mk_spec.u.identifier, identifier, FSCRYPT_KEY_IDENTIFIER_SIZE);</div><div class='ctx'> </div><div class='del'>-	key = fscrypt_find_master_key(sb, &amp;mk_spec);</div><div class='del'>-	if (IS_ERR(key)) {</div><div class='del'>-		err = PTR_ERR(key);</div><div class='add'>+	mk = fscrypt_find_master_key(sb, &amp;mk_spec);</div><div class='add'>+	if (!mk) {</div><div class='add'>+		err = -ENOKEY;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	mk = key-&gt;payload.data[0];</div><div class='add'>+	down_read(&amp;mk-&gt;mk_sem);</div><div class='ctx'> 	mk_user = find_master_key_user(mk);</div><div class='ctx'> 	if (IS_ERR(mk_user)) {</div><div class='ctx'> 		err = PTR_ERR(mk_user);</div><div class='hunk'>@@ -751,7 +907,8 @@ int fscrypt_verify_key_added(struct super_block *sb,</div><div class='ctx'> 		key_put(mk_user);</div><div class='ctx'> 		err = 0;</div><div class='ctx'> 	}</div><div class='del'>-	key_put(key);</div><div class='add'>+	up_read(&amp;mk-&gt;mk_sem);</div><div class='add'>+	fscrypt_put_master_key(mk);</div><div class='ctx'> out:</div><div class='ctx'> 	if (err == -ENOKEY &amp;&amp; capable(CAP_FOWNER))</div><div class='ctx'> 		err = 0;</div><div class='hunk'>@@ -779,7 +936,7 @@ static void shrink_dcache_inode(struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> static void evict_dentries_for_decrypted_inodes(struct fscrypt_master_key *mk)</div><div class='ctx'> {</div><div class='del'>-	struct fscrypt_info *ci;</div><div class='add'>+	struct fscrypt_inode_info *ci;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct inode *toput_inode = NULL;</div><div class='ctx'> </div><div class='hunk'>@@ -788,7 +945,7 @@ static void evict_dentries_for_decrypted_inodes(struct fscrypt_master_key *mk)</div><div class='ctx'> 	list_for_each_entry(ci, &amp;mk-&gt;mk_decrypted_inodes, ci_master_key_link) {</div><div class='ctx'> 		inode = ci-&gt;ci_inode;</div><div class='ctx'> 		spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-		if (inode-&gt;i_state &amp; (I_FREEING | I_WILL_FREE | I_NEW)) {</div><div class='add'>+		if (inode_state_read(inode) &amp; (I_FREEING | I_WILL_FREE | I_NEW)) {</div><div class='ctx'> 			spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -829,7 +986,7 @@ static int check_for_busy_inodes(struct super_block *sb,</div><div class='ctx'> 		/* select an example file to show for debugging purposes */</div><div class='ctx'> 		struct inode *inode =</div><div class='ctx'> 			list_first_entry(&amp;mk-&gt;mk_decrypted_inodes,</div><div class='del'>-					 struct fscrypt_info,</div><div class='add'>+					 struct fscrypt_inode_info,</div><div class='ctx'> 					 ci_master_key_link)-&gt;ci_inode;</div><div class='ctx'> 		ino = inode-&gt;i_ino;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -895,15 +1052,14 @@ static int try_to_lock_encrypted_files(struct super_block *sb,</div><div class='ctx'>  * FS_IOC_REMOVE_ENCRYPTION_KEY_ALL_USERS (all_users=true) always removes the</div><div class='ctx'>  * key itself.</div><div class='ctx'>  *</div><div class='del'>- * To "remove the key itself", first we wipe the actual master key secret, so</div><div class='del'>- * that no more inodes can be unlocked with it.  Then we try to evict all cached</div><div class='del'>- * inodes that had been unlocked with the key.</div><div class='add'>+ * To "remove the key itself", first we transition the key to the "incompletely</div><div class='add'>+ * removed" state, so that no more inodes can be unlocked with it.  Then we try</div><div class='add'>+ * to evict all cached inodes that had been unlocked with the key.</div><div class='ctx'>  *</div><div class='ctx'>  * If all inodes were evicted, then we unlink the fscrypt_master_key from the</div><div class='ctx'>  * keyring.  Otherwise it remains in the keyring in the "incompletely removed"</div><div class='del'>- * state (without the actual secret key) where it tracks the list of remaining</div><div class='del'>- * inodes.  Userspace can execute the ioctl again later to retry eviction, or</div><div class='del'>- * alternatively can re-add the secret key again.</div><div class='add'>+ * state where it tracks the list of remaining inodes.  Userspace can execute</div><div class='add'>+ * the ioctl again later to retry eviction, or alternatively can re-add the key.</div><div class='ctx'>  *</div><div class='ctx'>  * For more details, see the "Removing keys" section of</div><div class='ctx'>  * Documentation/filesystems/fscrypt.rst.</div><div class='hunk'>@@ -913,11 +1069,10 @@ static int do_remove_key(struct file *filp, void __user *_uarg, bool all_users)</div><div class='ctx'> 	struct super_block *sb = file_inode(filp)-&gt;i_sb;</div><div class='ctx'> 	struct fscrypt_remove_key_arg __user *uarg = _uarg;</div><div class='ctx'> 	struct fscrypt_remove_key_arg arg;</div><div class='del'>-	struct key *key;</div><div class='ctx'> 	struct fscrypt_master_key *mk;</div><div class='ctx'> 	u32 status_flags = 0;</div><div class='ctx'> 	int err;</div><div class='del'>-	bool dead;</div><div class='add'>+	bool inodes_remain;</div><div class='ctx'> </div><div class='ctx'> 	if (copy_from_user(&amp;arg, uarg, sizeof(arg)))</div><div class='ctx'> 		return -EFAULT;</div><div class='hunk'>@@ -937,12 +1092,10 @@ static int do_remove_key(struct file *filp, void __user *_uarg, bool all_users)</div><div class='ctx'> 		return -EACCES;</div><div class='ctx'> </div><div class='ctx'> 	/* Find the key being removed. */</div><div class='del'>-	key = fscrypt_find_master_key(sb, &amp;arg.key_spec);</div><div class='del'>-	if (IS_ERR(key))</div><div class='del'>-		return PTR_ERR(key);</div><div class='del'>-	mk = key-&gt;payload.data[0];</div><div class='del'>-</div><div class='del'>-	down_write(&amp;key-&gt;sem);</div><div class='add'>+	mk = fscrypt_find_master_key(sb, &amp;arg.key_spec);</div><div class='add'>+	if (!mk)</div><div class='add'>+		return -ENOKEY;</div><div class='add'>+	down_write(&amp;mk-&gt;mk_sem);</div><div class='ctx'> </div><div class='ctx'> 	/* If relevant, remove current user's (or all users) claim to the key */</div><div class='ctx'> 	if (mk-&gt;mk_users &amp;&amp; mk-&gt;mk_users-&gt;keys.nr_leaves_on_tree != 0) {</div><div class='hunk'>@@ -951,7 +1104,7 @@ static int do_remove_key(struct file *filp, void __user *_uarg, bool all_users)</div><div class='ctx'> 		else</div><div class='ctx'> 			err = remove_master_key_user(mk);</div><div class='ctx'> 		if (err) {</div><div class='del'>-			up_write(&amp;key-&gt;sem);</div><div class='add'>+			up_write(&amp;mk-&gt;mk_sem);</div><div class='ctx'> 			goto out_put_key;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (mk-&gt;mk_users-&gt;keys.nr_leaves_on_tree != 0) {</div><div class='hunk'>@@ -963,26 +1116,21 @@ static int do_remove_key(struct file *filp, void __user *_uarg, bool all_users)</div><div class='ctx'> 			status_flags |=</div><div class='ctx'> 				FSCRYPT_KEY_REMOVAL_STATUS_FLAG_OTHER_USERS;</div><div class='ctx'> 			err = 0;</div><div class='del'>-			up_write(&amp;key-&gt;sem);</div><div class='add'>+			up_write(&amp;mk-&gt;mk_sem);</div><div class='ctx'> 			goto out_put_key;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* No user claims remaining.  Go ahead and wipe the secret. */</div><div class='del'>-	dead = false;</div><div class='del'>-	if (is_master_key_secret_present(&amp;mk-&gt;mk_secret)) {</div><div class='del'>-		wipe_master_key_secret(&amp;mk-&gt;mk_secret);</div><div class='del'>-		dead = refcount_dec_and_test(&amp;mk-&gt;mk_refcount);</div><div class='del'>-	}</div><div class='del'>-	up_write(&amp;key-&gt;sem);</div><div class='del'>-	if (dead) {</div><div class='del'>-		/*</div><div class='del'>-		 * No inodes reference the key, and we wiped the secret, so the</div><div class='del'>-		 * key object is free to be removed from the keyring.</div><div class='del'>-		 */</div><div class='del'>-		key_invalidate(key);</div><div class='add'>+	/* No user claims remaining.  Initiate removal of the key. */</div><div class='add'>+	err = -ENOKEY;</div><div class='add'>+	if (mk-&gt;mk_present) {</div><div class='add'>+		fscrypt_initiate_key_removal(sb, mk);</div><div class='ctx'> 		err = 0;</div><div class='del'>-	} else {</div><div class='add'>+	}</div><div class='add'>+	inodes_remain = refcount_read(&amp;mk-&gt;mk_active_refs) &gt; 0;</div><div class='add'>+	up_write(&amp;mk-&gt;mk_sem);</div><div class='add'>+</div><div class='add'>+	if (inodes_remain) {</div><div class='ctx'> 		/* Some inodes still reference this key; try to evict them. */</div><div class='ctx'> 		err = try_to_lock_encrypted_files(sb, mk);</div><div class='ctx'> 		if (err == -EBUSY) {</div><div class='hunk'>@@ -993,12 +1141,12 @@ static int do_remove_key(struct file *filp, void __user *_uarg, bool all_users)</div><div class='ctx'> 	}</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We return 0 if we successfully did something: removed a claim to the</div><div class='del'>-	 * key, wiped the secret, or tried locking the files again.  Users need</div><div class='del'>-	 * to check the informational status flags if they care whether the key</div><div class='del'>-	 * has been fully removed including all files locked.</div><div class='add'>+	 * key, initiated removal of the key, or tried locking the files again.</div><div class='add'>+	 * Users need to check the informational status flags if they care</div><div class='add'>+	 * whether the key has been fully removed including all files locked.</div><div class='ctx'> 	 */</div><div class='ctx'> out_put_key:</div><div class='del'>-	key_put(key);</div><div class='add'>+	fscrypt_put_master_key(mk);</div><div class='ctx'> 	if (err == 0)</div><div class='ctx'> 		err = put_user(status_flags, &amp;uarg-&gt;removal_status_flags);</div><div class='ctx'> 	return err;</div><div class='hunk'>@@ -1022,12 +1170,11 @@ EXPORT_SYMBOL_GPL(fscrypt_ioctl_remove_key_all_users);</div><div class='ctx'>  * Retrieve the status of an fscrypt master encryption key.</div><div class='ctx'>  *</div><div class='ctx'>  * We set -&gt;status to indicate whether the key is absent, present, or</div><div class='del'>- * incompletely removed.  "Incompletely removed" means that the master key</div><div class='del'>- * secret has been removed, but some files which had been unlocked with it are</div><div class='del'>- * still in use.  This field allows applications to easily determine the state</div><div class='del'>- * of an encrypted directory without using a hack such as trying to open a</div><div class='del'>- * regular file in it (which can confuse the "incompletely removed" state with</div><div class='del'>- * absent or present).</div><div class='add'>+ * incompletely removed.  (For an explanation of what these statuses mean and</div><div class='add'>+ * how they are represented internally, see struct fscrypt_master_key.)  This</div><div class='add'>+ * field allows applications to easily determine the status of an encrypted</div><div class='add'>+ * directory without using a hack such as trying to open a regular file in it</div><div class='add'>+ * (which can confuse the "incompletely removed" status with absent or present).</div><div class='ctx'>  *</div><div class='ctx'>  * In addition, for v2 policy keys we allow applications to determine, via</div><div class='ctx'>  * -&gt;status_flags and -&gt;user_count, whether the key has been added by the</div><div class='hunk'>@@ -1045,7 +1192,6 @@ int fscrypt_ioctl_get_key_status(struct file *filp, void __user *uarg)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = file_inode(filp)-&gt;i_sb;</div><div class='ctx'> 	struct fscrypt_get_key_status_arg arg;</div><div class='del'>-	struct key *key;</div><div class='ctx'> 	struct fscrypt_master_key *mk;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='hunk'>@@ -1062,19 +1208,18 @@ int fscrypt_ioctl_get_key_status(struct file *filp, void __user *uarg)</div><div class='ctx'> 	arg.user_count = 0;</div><div class='ctx'> 	memset(arg.__out_reserved, 0, sizeof(arg.__out_reserved));</div><div class='ctx'> </div><div class='del'>-	key = fscrypt_find_master_key(sb, &amp;arg.key_spec);</div><div class='del'>-	if (IS_ERR(key)) {</div><div class='del'>-		if (key != ERR_PTR(-ENOKEY))</div><div class='del'>-			return PTR_ERR(key);</div><div class='add'>+	mk = fscrypt_find_master_key(sb, &amp;arg.key_spec);</div><div class='add'>+	if (!mk) {</div><div class='ctx'> 		arg.status = FSCRYPT_KEY_STATUS_ABSENT;</div><div class='ctx'> 		err = 0;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	mk = key-&gt;payload.data[0];</div><div class='del'>-	down_read(&amp;key-&gt;sem);</div><div class='add'>+	down_read(&amp;mk-&gt;mk_sem);</div><div class='ctx'> </div><div class='del'>-	if (!is_master_key_secret_present(&amp;mk-&gt;mk_secret)) {</div><div class='del'>-		arg.status = FSCRYPT_KEY_STATUS_INCOMPLETELY_REMOVED;</div><div class='add'>+	if (!mk-&gt;mk_present) {</div><div class='add'>+		arg.status = refcount_read(&amp;mk-&gt;mk_active_refs) &gt; 0 ?</div><div class='add'>+			FSCRYPT_KEY_STATUS_INCOMPLETELY_REMOVED :</div><div class='add'>+			FSCRYPT_KEY_STATUS_ABSENT /* raced with full removal */;</div><div class='ctx'> 		err = 0;</div><div class='ctx'> 		goto out_release_key;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1096,8 +1241,8 @@ int fscrypt_ioctl_get_key_status(struct file *filp, void __user *uarg)</div><div class='ctx'> 	}</div><div class='ctx'> 	err = 0;</div><div class='ctx'> out_release_key:</div><div class='del'>-	up_read(&amp;key-&gt;sem);</div><div class='del'>-	key_put(key);</div><div class='add'>+	up_read(&amp;mk-&gt;mk_sem);</div><div class='add'>+	fscrypt_put_master_key(mk);</div><div class='ctx'> out:</div><div class='ctx'> 	if (!err &amp;&amp; copy_to_user(uarg, &amp;arg, sizeof(arg)))</div><div class='ctx'> 		err = -EFAULT;</div><div class='hunk'>@@ -1109,13 +1254,9 @@ int __init fscrypt_init_keyring(void)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	err = register_key_type(&amp;key_type_fscrypt);</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='del'>-</div><div class='ctx'> 	err = register_key_type(&amp;key_type_fscrypt_user);</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto err_unregister_fscrypt;</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='ctx'> 	err = register_key_type(&amp;key_type_fscrypt_provisioning);</div><div class='ctx'> 	if (err)</div><div class='hunk'>@@ -1125,7 +1266,5 @@ int __init fscrypt_init_keyring(void)</div><div class='ctx'> </div><div class='ctx'> err_unregister_fscrypt_user:</div><div class='ctx'> 	unregister_key_type(&amp;key_type_fscrypt_user);</div><div class='del'>-err_unregister_fscrypt:</div><div class='del'>-	unregister_key_type(&amp;key_type_fscrypt);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/crypto/keysetup.c b/fs/crypto/keysetup.c<br/>index eede186b04ce..40fa05688d3a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/crypto/keysetup.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/crypto/keysetup.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/crypto/keysetup.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/crypto/keysetup.c</a></div><div class='hunk'>@@ -9,7 +9,7 @@</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> #include &lt;crypto/skcipher.h&gt;</div><div class='del'>-#include &lt;linux/key.h&gt;</div><div class='add'>+#include &lt;linux/export.h&gt;</div><div class='ctx'> #include &lt;linux/random.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "fscrypt_private.h"</div><div class='hunk'>@@ -24,7 +24,7 @@ struct fscrypt_mode fscrypt_modes[] = {</div><div class='ctx'> 		.blk_crypto_mode = BLK_ENCRYPTION_MODE_AES_256_XTS,</div><div class='ctx'> 	},</div><div class='ctx'> 	[FSCRYPT_MODE_AES_256_CTS] = {</div><div class='del'>-		.friendly_name = "AES-256-CTS-CBC",</div><div class='add'>+		.friendly_name = "AES-256-CBC-CTS",</div><div class='ctx'> 		.cipher_str = "cts(cbc(aes))",</div><div class='ctx'> 		.keysize = 32,</div><div class='ctx'> 		.security_strength = 32,</div><div class='hunk'>@@ -39,12 +39,27 @@ struct fscrypt_mode fscrypt_modes[] = {</div><div class='ctx'> 		.blk_crypto_mode = BLK_ENCRYPTION_MODE_AES_128_CBC_ESSIV,</div><div class='ctx'> 	},</div><div class='ctx'> 	[FSCRYPT_MODE_AES_128_CTS] = {</div><div class='del'>-		.friendly_name = "AES-128-CTS-CBC",</div><div class='add'>+		.friendly_name = "AES-128-CBC-CTS",</div><div class='ctx'> 		.cipher_str = "cts(cbc(aes))",</div><div class='ctx'> 		.keysize = 16,</div><div class='ctx'> 		.security_strength = 16,</div><div class='ctx'> 		.ivsize = 16,</div><div class='ctx'> 	},</div><div class='add'>+	[FSCRYPT_MODE_SM4_XTS] = {</div><div class='add'>+		.friendly_name = "SM4-XTS",</div><div class='add'>+		.cipher_str = "xts(sm4)",</div><div class='add'>+		.keysize = 32,</div><div class='add'>+		.security_strength = 16,</div><div class='add'>+		.ivsize = 16,</div><div class='add'>+		.blk_crypto_mode = BLK_ENCRYPTION_MODE_SM4_XTS,</div><div class='add'>+	},</div><div class='add'>+	[FSCRYPT_MODE_SM4_CTS] = {</div><div class='add'>+		.friendly_name = "SM4-CBC-CTS",</div><div class='add'>+		.cipher_str = "cts(cbc(sm4))",</div><div class='add'>+		.keysize = 16,</div><div class='add'>+		.security_strength = 16,</div><div class='add'>+		.ivsize = 16,</div><div class='add'>+	},</div><div class='ctx'> 	[FSCRYPT_MODE_ADIANTUM] = {</div><div class='ctx'> 		.friendly_name = "Adiantum",</div><div class='ctx'> 		.cipher_str = "adiantum(xchacha12,aes)",</div><div class='hunk'>@@ -53,6 +68,13 @@ struct fscrypt_mode fscrypt_modes[] = {</div><div class='ctx'> 		.ivsize = 32,</div><div class='ctx'> 		.blk_crypto_mode = BLK_ENCRYPTION_MODE_ADIANTUM,</div><div class='ctx'> 	},</div><div class='add'>+	[FSCRYPT_MODE_AES_256_HCTR2] = {</div><div class='add'>+		.friendly_name = "AES-256-HCTR2",</div><div class='add'>+		.cipher_str = "hctr2(aes)",</div><div class='add'>+		.keysize = 32,</div><div class='add'>+		.security_strength = 32,</div><div class='add'>+		.ivsize = 32,</div><div class='add'>+	},</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static DEFINE_MUTEX(fscrypt_mode_key_setup_mutex);</div><div class='hunk'>@@ -75,14 +97,15 @@ select_encryption_mode(const union fscrypt_policy *policy,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Create a symmetric cipher object for the given encryption mode and key */</div><div class='del'>-static struct crypto_skcipher *</div><div class='add'>+static struct crypto_sync_skcipher *</div><div class='ctx'> fscrypt_allocate_skcipher(struct fscrypt_mode *mode, const u8 *raw_key,</div><div class='ctx'> 			  const struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct crypto_skcipher *tfm;</div><div class='add'>+	struct crypto_sync_skcipher *tfm;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	tfm = crypto_alloc_skcipher(mode-&gt;cipher_str, 0, 0);</div><div class='add'>+	tfm = crypto_alloc_sync_skcipher(mode-&gt;cipher_str, 0,</div><div class='add'>+					 FSCRYPT_CRYPTOAPI_MASK);</div><div class='ctx'> 	if (IS_ERR(tfm)) {</div><div class='ctx'> 		if (PTR_ERR(tfm) == -ENOENT) {</div><div class='ctx'> 			fscrypt_warn(inode,</div><div class='hunk'>@@ -94,7 +117,7 @@ fscrypt_allocate_skcipher(struct fscrypt_mode *mode, const u8 *raw_key,</div><div class='ctx'> 			    mode-&gt;cipher_str, PTR_ERR(tfm));</div><div class='ctx'> 		return tfm;</div><div class='ctx'> 	}</div><div class='del'>-	if (!xchg(&amp;mode-&gt;logged_impl_name, 1)) {</div><div class='add'>+	if (!xchg(&amp;mode-&gt;logged_cryptoapi_impl, 1)) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * fscrypt performance can vary greatly depending on which</div><div class='ctx'> 		 * crypto algorithm implementation is used.  Help people debug</div><div class='hunk'>@@ -102,21 +125,22 @@ fscrypt_allocate_skcipher(struct fscrypt_mode *mode, const u8 *raw_key,</div><div class='ctx'> 		 * first time a mode is used.</div><div class='ctx'> 		 */</div><div class='ctx'> 		pr_info("fscrypt: %s using implementation \"%s\"\n",</div><div class='del'>-			mode-&gt;friendly_name, crypto_skcipher_driver_name(tfm));</div><div class='add'>+			mode-&gt;friendly_name,</div><div class='add'>+			crypto_skcipher_driver_name(&amp;tfm-&gt;base));</div><div class='ctx'> 	}</div><div class='del'>-	if (WARN_ON(crypto_skcipher_ivsize(tfm) != mode-&gt;ivsize)) {</div><div class='add'>+	if (WARN_ON_ONCE(crypto_sync_skcipher_ivsize(tfm) != mode-&gt;ivsize)) {</div><div class='ctx'> 		err = -EINVAL;</div><div class='ctx'> 		goto err_free_tfm;</div><div class='ctx'> 	}</div><div class='del'>-	crypto_skcipher_set_flags(tfm, CRYPTO_TFM_REQ_FORBID_WEAK_KEYS);</div><div class='del'>-	err = crypto_skcipher_setkey(tfm, raw_key, mode-&gt;keysize);</div><div class='add'>+	crypto_sync_skcipher_set_flags(tfm, CRYPTO_TFM_REQ_FORBID_WEAK_KEYS);</div><div class='add'>+	err = crypto_sync_skcipher_setkey(tfm, raw_key, mode-&gt;keysize);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto err_free_tfm;</div><div class='ctx'> </div><div class='ctx'> 	return tfm;</div><div class='ctx'> </div><div class='ctx'> err_free_tfm:</div><div class='del'>-	crypto_free_skcipher(tfm);</div><div class='add'>+	crypto_free_sync_skcipher(tfm);</div><div class='ctx'> 	return ERR_PTR(err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -127,12 +151,14 @@ err_free_tfm:</div><div class='ctx'>  * and IV generation method (@ci-&gt;ci_policy.flags).</div><div class='ctx'>  */</div><div class='ctx'> int fscrypt_prepare_key(struct fscrypt_prepared_key *prep_key,</div><div class='del'>-			const u8 *raw_key, const struct fscrypt_info *ci)</div><div class='add'>+			const u8 *raw_key, const struct fscrypt_inode_info *ci)</div><div class='ctx'> {</div><div class='del'>-	struct crypto_skcipher *tfm;</div><div class='add'>+	struct crypto_sync_skcipher *tfm;</div><div class='ctx'> </div><div class='ctx'> 	if (fscrypt_using_inline_encryption(ci))</div><div class='del'>-		return fscrypt_prepare_inline_crypt_key(prep_key, raw_key, ci);</div><div class='add'>+		return fscrypt_prepare_inline_crypt_key(prep_key, raw_key,</div><div class='add'>+							ci-&gt;ci_mode-&gt;keysize,</div><div class='add'>+							false, ci);</div><div class='ctx'> </div><div class='ctx'> 	tfm = fscrypt_allocate_skcipher(ci-&gt;ci_mode, raw_key, ci-&gt;ci_inode);</div><div class='ctx'> 	if (IS_ERR(tfm))</div><div class='hunk'>@@ -148,20 +174,23 @@ int fscrypt_prepare_key(struct fscrypt_prepared_key *prep_key,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Destroy a crypto transform object and/or blk-crypto key. */</div><div class='del'>-void fscrypt_destroy_prepared_key(struct fscrypt_prepared_key *prep_key)</div><div class='add'>+void fscrypt_destroy_prepared_key(struct super_block *sb,</div><div class='add'>+				  struct fscrypt_prepared_key *prep_key)</div><div class='ctx'> {</div><div class='del'>-	crypto_free_skcipher(prep_key-&gt;tfm);</div><div class='del'>-	fscrypt_destroy_inline_crypt_key(prep_key);</div><div class='add'>+	crypto_free_sync_skcipher(prep_key-&gt;tfm);</div><div class='add'>+	fscrypt_destroy_inline_crypt_key(sb, prep_key);</div><div class='add'>+	memzero_explicit(prep_key, sizeof(*prep_key));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Given a per-file encryption key, set up the file's crypto transform object */</div><div class='del'>-int fscrypt_set_per_file_enc_key(struct fscrypt_info *ci, const u8 *raw_key)</div><div class='add'>+int fscrypt_set_per_file_enc_key(struct fscrypt_inode_info *ci,</div><div class='add'>+				 const u8 *raw_key)</div><div class='ctx'> {</div><div class='ctx'> 	ci-&gt;ci_owns_key = true;</div><div class='ctx'> 	return fscrypt_prepare_key(&amp;ci-&gt;ci_enc_key, raw_key, ci);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int setup_per_mode_enc_key(struct fscrypt_info *ci,</div><div class='add'>+static int setup_per_mode_enc_key(struct fscrypt_inode_info *ci,</div><div class='ctx'> 				  struct fscrypt_master_key *mk,</div><div class='ctx'> 				  struct fscrypt_prepared_key *keys,</div><div class='ctx'> 				  u8 hkdf_context, bool include_fs_uuid)</div><div class='hunk'>@@ -171,14 +200,29 @@ static int setup_per_mode_enc_key(struct fscrypt_info *ci,</div><div class='ctx'> 	struct fscrypt_mode *mode = ci-&gt;ci_mode;</div><div class='ctx'> 	const u8 mode_num = mode - fscrypt_modes;</div><div class='ctx'> 	struct fscrypt_prepared_key *prep_key;</div><div class='del'>-	u8 mode_key[FSCRYPT_MAX_KEY_SIZE];</div><div class='add'>+	u8 mode_key[FSCRYPT_MAX_RAW_KEY_SIZE];</div><div class='ctx'> 	u8 hkdf_info[sizeof(mode_num) + sizeof(sb-&gt;s_uuid)];</div><div class='ctx'> 	unsigned int hkdf_infolen = 0;</div><div class='add'>+	bool use_hw_wrapped_key = false;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	if (WARN_ON(mode_num &gt; FSCRYPT_MODE_MAX))</div><div class='add'>+	if (WARN_ON_ONCE(mode_num &gt; FSCRYPT_MODE_MAX))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='add'>+	if (mk-&gt;mk_secret.is_hw_wrapped &amp;&amp; S_ISREG(inode-&gt;i_mode)) {</div><div class='add'>+		/* Using a hardware-wrapped key for file contents encryption */</div><div class='add'>+		if (!fscrypt_using_inline_encryption(ci)) {</div><div class='add'>+			if (sb-&gt;s_flags &amp; SB_INLINECRYPT)</div><div class='add'>+				fscrypt_warn(ci-&gt;ci_inode,</div><div class='add'>+					     "Hardware-wrapped key required, but no suitable inline encryption capabilities are available");</div><div class='add'>+			else</div><div class='add'>+				fscrypt_warn(ci-&gt;ci_inode,</div><div class='add'>+					     "Hardware-wrapped keys require inline encryption (-o inlinecrypt)");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		use_hw_wrapped_key = true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	prep_key = &amp;keys[mode_num];</div><div class='ctx'> 	if (fscrypt_is_key_prepared(prep_key, ci)) {</div><div class='ctx'> 		ci-&gt;ci_enc_key = *prep_key;</div><div class='hunk'>@@ -190,6 +234,16 @@ static int setup_per_mode_enc_key(struct fscrypt_info *ci,</div><div class='ctx'> 	if (fscrypt_is_key_prepared(prep_key, ci))</div><div class='ctx'> 		goto done_unlock;</div><div class='ctx'> </div><div class='add'>+	if (use_hw_wrapped_key) {</div><div class='add'>+		err = fscrypt_prepare_inline_crypt_key(prep_key,</div><div class='add'>+						       mk-&gt;mk_secret.bytes,</div><div class='add'>+						       mk-&gt;mk_secret.size, true,</div><div class='add'>+						       ci);</div><div class='add'>+		if (err)</div><div class='add'>+			goto out_unlock;</div><div class='add'>+		goto done_unlock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	BUILD_BUG_ON(sizeof(mode_num) != 1);</div><div class='ctx'> 	BUILD_BUG_ON(sizeof(sb-&gt;s_uuid) != 16);</div><div class='ctx'> 	BUILD_BUG_ON(sizeof(hkdf_info) != 17);</div><div class='hunk'>@@ -199,11 +253,8 @@ static int setup_per_mode_enc_key(struct fscrypt_info *ci,</div><div class='ctx'> 		       sizeof(sb-&gt;s_uuid));</div><div class='ctx'> 		hkdf_infolen += sizeof(sb-&gt;s_uuid);</div><div class='ctx'> 	}</div><div class='del'>-	err = fscrypt_hkdf_expand(&amp;mk-&gt;mk_secret.hkdf,</div><div class='del'>-				  hkdf_context, hkdf_info, hkdf_infolen,</div><div class='del'>-				  mode_key, mode-&gt;keysize);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out_unlock;</div><div class='add'>+	fscrypt_hkdf_expand(&amp;mk-&gt;mk_secret.hkdf, hkdf_context, hkdf_info,</div><div class='add'>+			    hkdf_infolen, mode_key, mode-&gt;keysize);</div><div class='ctx'> 	err = fscrypt_prepare_key(prep_key, mode_key, ci);</div><div class='ctx'> 	memzero_explicit(mode_key, mode-&gt;keysize);</div><div class='ctx'> 	if (err)</div><div class='hunk'>@@ -224,49 +275,38 @@ out_unlock:</div><div class='ctx'>  * as a pair of 64-bit words.  Therefore, on big endian CPUs we have to do an</div><div class='ctx'>  * endianness swap in order to get the same results as on little endian CPUs.</div><div class='ctx'>  */</div><div class='del'>-static int fscrypt_derive_siphash_key(const struct fscrypt_master_key *mk,</div><div class='del'>-				      u8 context, const u8 *info,</div><div class='del'>-				      unsigned int infolen, siphash_key_t *key)</div><div class='add'>+static void fscrypt_derive_siphash_key(const struct fscrypt_master_key *mk,</div><div class='add'>+				       u8 context, const u8 *info,</div><div class='add'>+				       unsigned int infolen, siphash_key_t *key)</div><div class='ctx'> {</div><div class='del'>-	int err;</div><div class='del'>-</div><div class='del'>-	err = fscrypt_hkdf_expand(&amp;mk-&gt;mk_secret.hkdf, context, info, infolen,</div><div class='del'>-				  (u8 *)key, sizeof(*key));</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='del'>-</div><div class='add'>+	fscrypt_hkdf_expand(&amp;mk-&gt;mk_secret.hkdf, context, info, infolen,</div><div class='add'>+			    (u8 *)key, sizeof(*key));</div><div class='ctx'> 	BUILD_BUG_ON(sizeof(*key) != 16);</div><div class='ctx'> 	BUILD_BUG_ON(ARRAY_SIZE(key-&gt;key) != 2);</div><div class='ctx'> 	le64_to_cpus(&amp;key-&gt;key[0]);</div><div class='ctx'> 	le64_to_cpus(&amp;key-&gt;key[1]);</div><div class='del'>-	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int fscrypt_derive_dirhash_key(struct fscrypt_info *ci,</div><div class='del'>-			       const struct fscrypt_master_key *mk)</div><div class='add'>+void fscrypt_derive_dirhash_key(struct fscrypt_inode_info *ci,</div><div class='add'>+				const struct fscrypt_master_key *mk)</div><div class='ctx'> {</div><div class='del'>-	int err;</div><div class='del'>-</div><div class='del'>-	err = fscrypt_derive_siphash_key(mk, HKDF_CONTEXT_DIRHASH_KEY,</div><div class='del'>-					 ci-&gt;ci_nonce, FSCRYPT_FILE_NONCE_SIZE,</div><div class='del'>-					 &amp;ci-&gt;ci_dirhash_key);</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='add'>+	fscrypt_derive_siphash_key(mk, HKDF_CONTEXT_DIRHASH_KEY,</div><div class='add'>+				   ci-&gt;ci_nonce, FSCRYPT_FILE_NONCE_SIZE,</div><div class='add'>+				   &amp;ci-&gt;ci_dirhash_key);</div><div class='ctx'> 	ci-&gt;ci_dirhash_key_initialized = true;</div><div class='del'>-	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void fscrypt_hash_inode_number(struct fscrypt_info *ci,</div><div class='add'>+void fscrypt_hash_inode_number(struct fscrypt_inode_info *ci,</div><div class='ctx'> 			       const struct fscrypt_master_key *mk)</div><div class='ctx'> {</div><div class='del'>-	WARN_ON(ci-&gt;ci_inode-&gt;i_ino == 0);</div><div class='del'>-	WARN_ON(!mk-&gt;mk_ino_hash_key_initialized);</div><div class='add'>+	WARN_ON_ONCE(ci-&gt;ci_inode-&gt;i_ino == 0);</div><div class='add'>+	WARN_ON_ONCE(!mk-&gt;mk_ino_hash_key_initialized);</div><div class='ctx'> </div><div class='ctx'> 	ci-&gt;ci_hashed_ino = (u32)siphash_1u64(ci-&gt;ci_inode-&gt;i_ino,</div><div class='ctx'> 					      &amp;mk-&gt;mk_ino_hash_key);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fscrypt_setup_iv_ino_lblk_32_key(struct fscrypt_info *ci,</div><div class='add'>+static int fscrypt_setup_iv_ino_lblk_32_key(struct fscrypt_inode_info *ci,</div><div class='ctx'> 					    struct fscrypt_master_key *mk)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='hunk'>@@ -284,17 +324,12 @@ static int fscrypt_setup_iv_ino_lblk_32_key(struct fscrypt_info *ci,</div><div class='ctx'> 		if (mk-&gt;mk_ino_hash_key_initialized)</div><div class='ctx'> 			goto unlock;</div><div class='ctx'> </div><div class='del'>-		err = fscrypt_derive_siphash_key(mk,</div><div class='del'>-						 HKDF_CONTEXT_INODE_HASH_KEY,</div><div class='del'>-						 NULL, 0, &amp;mk-&gt;mk_ino_hash_key);</div><div class='del'>-		if (err)</div><div class='del'>-			goto unlock;</div><div class='add'>+		fscrypt_derive_siphash_key(mk, HKDF_CONTEXT_INODE_HASH_KEY,</div><div class='add'>+					   NULL, 0, &amp;mk-&gt;mk_ino_hash_key);</div><div class='ctx'> 		/* pairs with smp_load_acquire() above */</div><div class='ctx'> 		smp_store_release(&amp;mk-&gt;mk_ino_hash_key_initialized, true);</div><div class='ctx'> unlock:</div><div class='ctx'> 		mutex_unlock(&amp;fscrypt_mode_key_setup_mutex);</div><div class='del'>-		if (err)</div><div class='del'>-			return err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -306,12 +341,20 @@ unlock:</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fscrypt_setup_v2_file_key(struct fscrypt_info *ci,</div><div class='add'>+static int fscrypt_setup_v2_file_key(struct fscrypt_inode_info *ci,</div><div class='ctx'> 				     struct fscrypt_master_key *mk,</div><div class='ctx'> 				     bool need_dirhash_key)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='add'>+	if (mk-&gt;mk_secret.is_hw_wrapped &amp;&amp;</div><div class='add'>+	    !(ci-&gt;ci_policy.v2.flags &amp; (FSCRYPT_POLICY_FLAG_IV_INO_LBLK_64 |</div><div class='add'>+					FSCRYPT_POLICY_FLAG_IV_INO_LBLK_32))) {</div><div class='add'>+		fscrypt_warn(ci-&gt;ci_inode,</div><div class='add'>+			     "Hardware-wrapped keys are only supported with IV_INO_LBLK policies");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (ci-&gt;ci_policy.v2.flags &amp; FSCRYPT_POLICY_FLAG_DIRECT_KEY) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * DIRECT_KEY: instead of deriving per-file encryption keys, the</div><div class='hunk'>@@ -338,15 +381,12 @@ static int fscrypt_setup_v2_file_key(struct fscrypt_info *ci,</div><div class='ctx'> 		   FSCRYPT_POLICY_FLAG_IV_INO_LBLK_32) {</div><div class='ctx'> 		err = fscrypt_setup_iv_ino_lblk_32_key(ci, mk);</div><div class='ctx'> 	} else {</div><div class='del'>-		u8 derived_key[FSCRYPT_MAX_KEY_SIZE];</div><div class='del'>-</div><div class='del'>-		err = fscrypt_hkdf_expand(&amp;mk-&gt;mk_secret.hkdf,</div><div class='del'>-					  HKDF_CONTEXT_PER_FILE_ENC_KEY,</div><div class='del'>-					  ci-&gt;ci_nonce, FSCRYPT_FILE_NONCE_SIZE,</div><div class='del'>-					  derived_key, ci-&gt;ci_mode-&gt;keysize);</div><div class='del'>-		if (err)</div><div class='del'>-			return err;</div><div class='add'>+		u8 derived_key[FSCRYPT_MAX_RAW_KEY_SIZE];</div><div class='ctx'> </div><div class='add'>+		fscrypt_hkdf_expand(&amp;mk-&gt;mk_secret.hkdf,</div><div class='add'>+				    HKDF_CONTEXT_PER_FILE_ENC_KEY,</div><div class='add'>+				    ci-&gt;ci_nonce, FSCRYPT_FILE_NONCE_SIZE,</div><div class='add'>+				    derived_key, ci-&gt;ci_mode-&gt;keysize);</div><div class='ctx'> 		err = fscrypt_set_per_file_enc_key(ci, derived_key);</div><div class='ctx'> 		memzero_explicit(derived_key, ci-&gt;ci_mode-&gt;keysize);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -354,11 +394,8 @@ static int fscrypt_setup_v2_file_key(struct fscrypt_info *ci,</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='ctx'> 	/* Derive a secret dirhash key for directories that need it. */</div><div class='del'>-	if (need_dirhash_key) {</div><div class='del'>-		err = fscrypt_derive_dirhash_key(ci, mk);</div><div class='del'>-		if (err)</div><div class='del'>-			return err;</div><div class='del'>-	}</div><div class='add'>+	if (need_dirhash_key)</div><div class='add'>+		fscrypt_derive_dirhash_key(ci, mk);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -381,7 +418,7 @@ static int fscrypt_setup_v2_file_key(struct fscrypt_info *ci,</div><div class='ctx'>  * still allow 512-bit master keys if the user chooses to use them, though.)</div><div class='ctx'>  */</div><div class='ctx'> static bool fscrypt_valid_master_key_size(const struct fscrypt_master_key *mk,</div><div class='del'>-					  const struct fscrypt_info *ci)</div><div class='add'>+					  const struct fscrypt_inode_info *ci)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int min_keysize;</div><div class='ctx'> </div><div class='hunk'>@@ -405,49 +442,52 @@ static bool fscrypt_valid_master_key_size(const struct fscrypt_master_key *mk,</div><div class='ctx'> /*</div><div class='ctx'>  * Find the master key, then set up the inode's actual encryption key.</div><div class='ctx'>  *</div><div class='del'>- * If the master key is found in the filesystem-level keyring, then the</div><div class='del'>- * corresponding 'struct key' is returned in *master_key_ret with its semaphore</div><div class='del'>- * read-locked.  This is needed to ensure that only one task links the</div><div class='del'>- * fscrypt_info into -&gt;mk_decrypted_inodes (as multiple tasks may race to create</div><div class='del'>- * an fscrypt_info for the same inode), and to synchronize the master key being</div><div class='del'>- * removed with a new inode starting to use it.</div><div class='add'>+ * If the master key is found in the filesystem-level keyring, then it is</div><div class='add'>+ * returned in *mk_ret with its semaphore read-locked.  This is needed to ensure</div><div class='add'>+ * that only one task links the fscrypt_inode_info into -&gt;mk_decrypted_inodes</div><div class='add'>+ * (as multiple tasks may race to create an fscrypt_inode_info for the same</div><div class='add'>+ * inode), and to synchronize the master key being removed with a new inode</div><div class='add'>+ * starting to use it.</div><div class='ctx'>  */</div><div class='del'>-static int setup_file_encryption_key(struct fscrypt_info *ci,</div><div class='add'>+static int setup_file_encryption_key(struct fscrypt_inode_info *ci,</div><div class='ctx'> 				     bool need_dirhash_key,</div><div class='del'>-				     struct key **master_key_ret)</div><div class='add'>+				     struct fscrypt_master_key **mk_ret)</div><div class='ctx'> {</div><div class='del'>-	struct key *key;</div><div class='del'>-	struct fscrypt_master_key *mk = NULL;</div><div class='add'>+	struct super_block *sb = ci-&gt;ci_inode-&gt;i_sb;</div><div class='ctx'> 	struct fscrypt_key_specifier mk_spec;</div><div class='add'>+	struct fscrypt_master_key *mk;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	err = fscrypt_select_encryption_impl(ci);</div><div class='add'>+	err = fscrypt_policy_to_key_spec(&amp;ci-&gt;ci_policy, &amp;mk_spec);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	switch (ci-&gt;ci_policy.version) {</div><div class='del'>-	case FSCRYPT_POLICY_V1:</div><div class='del'>-		mk_spec.type = FSCRYPT_KEY_SPEC_TYPE_DESCRIPTOR;</div><div class='del'>-		memcpy(mk_spec.u.descriptor,</div><div class='del'>-		       ci-&gt;ci_policy.v1.master_key_descriptor,</div><div class='del'>-		       FSCRYPT_KEY_DESCRIPTOR_SIZE);</div><div class='del'>-		break;</div><div class='del'>-	case FSCRYPT_POLICY_V2:</div><div class='del'>-		mk_spec.type = FSCRYPT_KEY_SPEC_TYPE_IDENTIFIER;</div><div class='del'>-		memcpy(mk_spec.u.identifier,</div><div class='del'>-		       ci-&gt;ci_policy.v2.master_key_identifier,</div><div class='del'>-		       FSCRYPT_KEY_IDENTIFIER_SIZE);</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		WARN_ON(1);</div><div class='del'>-		return -EINVAL;</div><div class='add'>+	mk = fscrypt_find_master_key(sb, &amp;mk_spec);</div><div class='add'>+	if (unlikely(!mk)) {</div><div class='add'>+		const union fscrypt_policy *dummy_policy =</div><div class='add'>+			fscrypt_get_dummy_policy(sb);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Add the test_dummy_encryption key on-demand.  In principle,</div><div class='add'>+		 * it should be added at mount time.  Do it here instead so that</div><div class='add'>+		 * the individual filesystems don't need to worry about adding</div><div class='add'>+		 * this key at mount time and cleaning up on mount failure.</div><div class='add'>+		 */</div><div class='add'>+		if (dummy_policy &amp;&amp;</div><div class='add'>+		    fscrypt_policies_equal(dummy_policy, &amp;ci-&gt;ci_policy)) {</div><div class='add'>+			err = fscrypt_add_test_dummy_key(sb, &amp;mk_spec);</div><div class='add'>+			if (err)</div><div class='add'>+				return err;</div><div class='add'>+			mk = fscrypt_find_master_key(sb, &amp;mk_spec);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='add'>+	if (unlikely(!mk)) {</div><div class='add'>+		if (ci-&gt;ci_policy.version != FSCRYPT_POLICY_V1)</div><div class='add'>+			return -ENOKEY;</div><div class='ctx'> </div><div class='del'>-	key = fscrypt_find_master_key(ci-&gt;ci_inode-&gt;i_sb, &amp;mk_spec);</div><div class='del'>-	if (IS_ERR(key)) {</div><div class='del'>-		if (key != ERR_PTR(-ENOKEY) ||</div><div class='del'>-		    ci-&gt;ci_policy.version != FSCRYPT_POLICY_V1)</div><div class='del'>-			return PTR_ERR(key);</div><div class='add'>+		err = fscrypt_select_encryption_impl(ci, false);</div><div class='add'>+		if (err)</div><div class='add'>+			return err;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * As a legacy fallback for v1 policies, search for the key in</div><div class='hunk'>@@ -457,12 +497,10 @@ static int setup_file_encryption_key(struct fscrypt_info *ci,</div><div class='ctx'> 		 */</div><div class='ctx'> 		return fscrypt_setup_v1_file_key_via_subscribed_keyrings(ci);</div><div class='ctx'> 	}</div><div class='add'>+	down_read(&amp;mk-&gt;mk_sem);</div><div class='ctx'> </div><div class='del'>-	mk = key-&gt;payload.data[0];</div><div class='del'>-	down_read(&amp;key-&gt;sem);</div><div class='del'>-</div><div class='del'>-	/* Has the secret been removed (via FS_IOC_REMOVE_ENCRYPTION_KEY)? */</div><div class='del'>-	if (!is_master_key_secret_present(&amp;mk-&gt;mk_secret)) {</div><div class='add'>+	if (!mk-&gt;mk_present) {</div><div class='add'>+		/* FS_IOC_REMOVE_ENCRYPTION_KEY has been executed on this key */</div><div class='ctx'> 		err = -ENOKEY;</div><div class='ctx'> 		goto out_release_key;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -472,33 +510,45 @@ static int setup_file_encryption_key(struct fscrypt_info *ci,</div><div class='ctx'> 		goto out_release_key;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	err = fscrypt_select_encryption_impl(ci, mk-&gt;mk_secret.is_hw_wrapped);</div><div class='add'>+	if (err)</div><div class='add'>+		goto out_release_key;</div><div class='add'>+</div><div class='ctx'> 	switch (ci-&gt;ci_policy.version) {</div><div class='ctx'> 	case FSCRYPT_POLICY_V1:</div><div class='del'>-		err = fscrypt_setup_v1_file_key(ci, mk-&gt;mk_secret.raw);</div><div class='add'>+		if (WARN_ON_ONCE(mk-&gt;mk_secret.is_hw_wrapped)) {</div><div class='add'>+			/*</div><div class='add'>+			 * This should never happen, as adding a v1 policy key</div><div class='add'>+			 * that is hardware-wrapped isn't allowed.</div><div class='add'>+			 */</div><div class='add'>+			err = -EINVAL;</div><div class='add'>+			goto out_release_key;</div><div class='add'>+		}</div><div class='add'>+		err = fscrypt_setup_v1_file_key(ci, mk-&gt;mk_secret.bytes);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case FSCRYPT_POLICY_V2:</div><div class='ctx'> 		err = fscrypt_setup_v2_file_key(ci, mk, need_dirhash_key);</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='del'>-		WARN_ON(1);</div><div class='add'>+		WARN_ON_ONCE(1);</div><div class='ctx'> 		err = -EINVAL;</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out_release_key;</div><div class='ctx'> </div><div class='del'>-	*master_key_ret = key;</div><div class='add'>+	*mk_ret = mk;</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> out_release_key:</div><div class='del'>-	up_read(&amp;key-&gt;sem);</div><div class='del'>-	key_put(key);</div><div class='add'>+	up_read(&amp;mk-&gt;mk_sem);</div><div class='add'>+	fscrypt_put_master_key(mk);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void put_crypt_info(struct fscrypt_info *ci)</div><div class='add'>+static void put_crypt_info(struct fscrypt_inode_info *ci)</div><div class='ctx'> {</div><div class='del'>-	struct key *key;</div><div class='add'>+	struct fscrypt_master_key *mk;</div><div class='ctx'> </div><div class='ctx'> 	if (!ci)</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -506,29 +556,24 @@ static void put_crypt_info(struct fscrypt_info *ci)</div><div class='ctx'> 	if (ci-&gt;ci_direct_key)</div><div class='ctx'> 		fscrypt_put_direct_key(ci-&gt;ci_direct_key);</div><div class='ctx'> 	else if (ci-&gt;ci_owns_key)</div><div class='del'>-		fscrypt_destroy_prepared_key(&amp;ci-&gt;ci_enc_key);</div><div class='del'>-</div><div class='del'>-	key = ci-&gt;ci_master_key;</div><div class='del'>-	if (key) {</div><div class='del'>-		struct fscrypt_master_key *mk = key-&gt;payload.data[0];</div><div class='add'>+		fscrypt_destroy_prepared_key(ci-&gt;ci_inode-&gt;i_sb,</div><div class='add'>+					     &amp;ci-&gt;ci_enc_key);</div><div class='ctx'> </div><div class='add'>+	mk = ci-&gt;ci_master_key;</div><div class='add'>+	if (mk) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Remove this inode from the list of inodes that were unlocked</div><div class='del'>-		 * with the master key.</div><div class='del'>-		 *</div><div class='del'>-		 * In addition, if we're removing the last inode from a key that</div><div class='del'>-		 * already had its secret removed, invalidate the key so that it</div><div class='del'>-		 * gets removed from -&gt;s_master_keys.</div><div class='add'>+		 * with the master key.  In addition, if we're removing the last</div><div class='add'>+		 * inode from an incompletely removed key, then complete the</div><div class='add'>+		 * full removal of the key.</div><div class='ctx'> 		 */</div><div class='ctx'> 		spin_lock(&amp;mk-&gt;mk_decrypted_inodes_lock);</div><div class='ctx'> 		list_del(&amp;ci-&gt;ci_master_key_link);</div><div class='ctx'> 		spin_unlock(&amp;mk-&gt;mk_decrypted_inodes_lock);</div><div class='del'>-		if (refcount_dec_and_test(&amp;mk-&gt;mk_refcount))</div><div class='del'>-			key_invalidate(key);</div><div class='del'>-		key_put(key);</div><div class='add'>+		fscrypt_put_master_key_activeref(ci-&gt;ci_inode-&gt;i_sb, mk);</div><div class='ctx'> 	}</div><div class='ctx'> 	memzero_explicit(ci, sizeof(*ci));</div><div class='del'>-	kmem_cache_free(fscrypt_info_cachep, ci);</div><div class='add'>+	kmem_cache_free(fscrypt_inode_info_cachep, ci);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='hunk'>@@ -537,16 +582,16 @@ fscrypt_setup_encryption_info(struct inode *inode,</div><div class='ctx'> 			      const u8 nonce[FSCRYPT_FILE_NONCE_SIZE],</div><div class='ctx'> 			      bool need_dirhash_key)</div><div class='ctx'> {</div><div class='del'>-	struct fscrypt_info *crypt_info;</div><div class='add'>+	struct fscrypt_inode_info *crypt_info;</div><div class='ctx'> 	struct fscrypt_mode *mode;</div><div class='del'>-	struct key *master_key = NULL;</div><div class='add'>+	struct fscrypt_master_key *mk = NULL;</div><div class='ctx'> 	int res;</div><div class='ctx'> </div><div class='del'>-	res = fscrypt_initialize(inode-&gt;i_sb-&gt;s_cop-&gt;flags);</div><div class='add'>+	res = fscrypt_initialize(inode-&gt;i_sb);</div><div class='ctx'> 	if (res)</div><div class='ctx'> 		return res;</div><div class='ctx'> </div><div class='del'>-	crypt_info = kmem_cache_zalloc(fscrypt_info_cachep, GFP_KERNEL);</div><div class='add'>+	crypt_info = kmem_cache_zalloc(fscrypt_inode_info_cachep, GFP_KERNEL);</div><div class='ctx'> 	if (!crypt_info)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='hunk'>@@ -559,31 +604,33 @@ fscrypt_setup_encryption_info(struct inode *inode,</div><div class='ctx'> 		res = PTR_ERR(mode);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	WARN_ON(mode-&gt;ivsize &gt; FSCRYPT_MAX_IV_SIZE);</div><div class='add'>+	WARN_ON_ONCE(mode-&gt;ivsize &gt; FSCRYPT_MAX_IV_SIZE);</div><div class='ctx'> 	crypt_info-&gt;ci_mode = mode;</div><div class='ctx'> </div><div class='del'>-	res = setup_file_encryption_key(crypt_info, need_dirhash_key,</div><div class='del'>-					&amp;master_key);</div><div class='add'>+	crypt_info-&gt;ci_data_unit_bits =</div><div class='add'>+		fscrypt_policy_du_bits(&amp;crypt_info-&gt;ci_policy, inode);</div><div class='add'>+	crypt_info-&gt;ci_data_units_per_block_bits =</div><div class='add'>+		inode-&gt;i_blkbits - crypt_info-&gt;ci_data_unit_bits;</div><div class='add'>+</div><div class='add'>+	res = setup_file_encryption_key(crypt_info, need_dirhash_key, &amp;mk);</div><div class='ctx'> 	if (res)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * For existing inodes, multiple tasks may race to set -&gt;i_crypt_info.</div><div class='del'>-	 * So use cmpxchg_release().  This pairs with the smp_load_acquire() in</div><div class='del'>-	 * fscrypt_get_info().  I.e., here we publish -&gt;i_crypt_info with a</div><div class='del'>-	 * RELEASE barrier so that other tasks can ACQUIRE it.</div><div class='add'>+	 * For existing inodes, multiple tasks may race to set the inode's</div><div class='add'>+	 * fscrypt info pointer.  So use cmpxchg_release().  This pairs with the</div><div class='add'>+	 * smp_load_acquire() in fscrypt_get_inode_info().  I.e., publish the</div><div class='add'>+	 * pointer with a RELEASE barrier so that other tasks can ACQUIRE it.</div><div class='ctx'> 	 */</div><div class='del'>-	if (cmpxchg_release(&amp;inode-&gt;i_crypt_info, NULL, crypt_info) == NULL) {</div><div class='add'>+	if (cmpxchg_release(fscrypt_inode_info_addr(inode), NULL, crypt_info) ==</div><div class='add'>+	    NULL) {</div><div class='ctx'> 		/*</div><div class='del'>-		 * We won the race and set -&gt;i_crypt_info to our crypt_info.</div><div class='del'>-		 * Now link it into the master key's inode list.</div><div class='add'>+		 * We won the race and set the inode's fscrypt info to our</div><div class='add'>+		 * crypt_info.  Now link it into the master key's inode list.</div><div class='ctx'> 		 */</div><div class='del'>-		if (master_key) {</div><div class='del'>-			struct fscrypt_master_key *mk =</div><div class='del'>-				master_key-&gt;payload.data[0];</div><div class='del'>-</div><div class='del'>-			refcount_inc(&amp;mk-&gt;mk_refcount);</div><div class='del'>-			crypt_info-&gt;ci_master_key = key_get(master_key);</div><div class='add'>+		if (mk) {</div><div class='add'>+			crypt_info-&gt;ci_master_key = mk;</div><div class='add'>+			refcount_inc(&amp;mk-&gt;mk_active_refs);</div><div class='ctx'> 			spin_lock(&amp;mk-&gt;mk_decrypted_inodes_lock);</div><div class='ctx'> 			list_add(&amp;crypt_info-&gt;ci_master_key_link,</div><div class='ctx'> 				 &amp;mk-&gt;mk_decrypted_inodes);</div><div class='hunk'>@@ -593,9 +640,9 @@ fscrypt_setup_encryption_info(struct inode *inode,</div><div class='ctx'> 	}</div><div class='ctx'> 	res = 0;</div><div class='ctx'> out:</div><div class='del'>-	if (master_key) {</div><div class='del'>-		up_read(&amp;master_key-&gt;sem);</div><div class='del'>-		key_put(master_key);</div><div class='add'>+	if (mk) {</div><div class='add'>+		up_read(&amp;mk-&gt;mk_sem);</div><div class='add'>+		fscrypt_put_master_key(mk);</div><div class='ctx'> 	}</div><div class='ctx'> 	put_crypt_info(crypt_info);</div><div class='ctx'> 	return res;</div><div class='hunk'>@@ -610,13 +657,13 @@ out:</div><div class='ctx'>  *		       %false unless the operation being performed is needed in</div><div class='ctx'>  *		       order for files (or directories) to be deleted.</div><div class='ctx'>  *</div><div class='del'>- * Set up -&gt;i_crypt_info, if it hasn't already been done.</div><div class='add'>+ * Set up the inode's encryption key, if it hasn't already been done.</div><div class='ctx'>  *</div><div class='del'>- * Note: unless -&gt;i_crypt_info is already set, this isn't %GFP_NOFS-safe.  So</div><div class='add'>+ * Note: unless the key setup was already done, this isn't %GFP_NOFS-safe.  So</div><div class='ctx'>  * generally this shouldn't be called from within a filesystem transaction.</div><div class='ctx'>  *</div><div class='del'>- * Return: 0 if -&gt;i_crypt_info was set or was already set, *or* if the</div><div class='del'>- *	   encryption key is unavailable.  (Use fscrypt_has_encryption_key() to</div><div class='add'>+ * Return: 0 if the key is now set up, *or* if it couldn't be set up because the</div><div class='add'>+ *	   needed master key is absent.  (Use fscrypt_has_encryption_key() to</div><div class='ctx'>  *	   distinguish these cases.)  Also can return another -errno code.</div><div class='ctx'>  */</div><div class='ctx'> int fscrypt_get_encryption_info(struct inode *inode, bool allow_unsupported)</div><div class='hunk'>@@ -666,13 +713,13 @@ int fscrypt_get_encryption_info(struct inode *inode, bool allow_unsupported)</div><div class='ctx'> /**</div><div class='ctx'>  * fscrypt_prepare_new_inode() - prepare to create a new inode in a directory</div><div class='ctx'>  * @dir: a possibly-encrypted directory</div><div class='del'>- * @inode: the new inode.  -&gt;i_mode must be set already.</div><div class='add'>+ * @inode: the new inode.  -&gt;i_mode and -&gt;i_blkbits must be set already.</div><div class='ctx'>  *	   -&gt;i_ino doesn't need to be set yet.</div><div class='ctx'>  * @encrypt_ret: (output) set to %true if the new inode will be encrypted</div><div class='ctx'>  *</div><div class='del'>- * If the directory is encrypted, set up its -&gt;i_crypt_info in preparation for</div><div class='add'>+ * If the directory is encrypted, set up its encryption key in preparation for</div><div class='ctx'>  * encrypting the name of the new file.  Also, if the new inode will be</div><div class='del'>- * encrypted, set up its -&gt;i_crypt_info and set *encrypt_ret=true.</div><div class='add'>+ * encrypted, set up its encryption key too and set *encrypt_ret=true.</div><div class='ctx'>  *</div><div class='ctx'>  * This isn't %GFP_NOFS-safe, and therefore it should be called before starting</div><div class='ctx'>  * any filesystem transaction to create the inode.  For this reason, -&gt;i_ino</div><div class='hunk'>@@ -681,8 +728,8 @@ int fscrypt_get_encryption_info(struct inode *inode, bool allow_unsupported)</div><div class='ctx'>  * This doesn't persist the new inode's encryption context.  That still needs to</div><div class='ctx'>  * be done later by calling fscrypt_set_context().</div><div class='ctx'>  *</div><div class='del'>- * Return: 0 on success, -ENOKEY if the encryption key is missing, or another</div><div class='del'>- *	   -errno code</div><div class='add'>+ * Return: 0 on success, -ENOKEY if a key needs to be set up for @dir or @inode</div><div class='add'>+ *	   but the needed master key is absent, or another -errno code</div><div class='ctx'>  */</div><div class='ctx'> int fscrypt_prepare_new_inode(struct inode *dir, struct inode *inode,</div><div class='ctx'> 			      bool *encrypt_ret)</div><div class='hunk'>@@ -696,6 +743,9 @@ int fscrypt_prepare_new_inode(struct inode *dir, struct inode *inode,</div><div class='ctx'> 	if (IS_ERR(policy))</div><div class='ctx'> 		return PTR_ERR(policy);</div><div class='ctx'> </div><div class='add'>+	if (WARN_ON_ONCE(inode-&gt;i_blkbits == 0))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='ctx'> 	if (WARN_ON_ONCE(inode-&gt;i_mode == 0))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='hunk'>@@ -721,13 +771,21 @@ EXPORT_SYMBOL_GPL(fscrypt_prepare_new_inode);</div><div class='ctx'>  * fscrypt_put_encryption_info() - free most of an inode's fscrypt data</div><div class='ctx'>  * @inode: an inode being evicted</div><div class='ctx'>  *</div><div class='del'>- * Free the inode's fscrypt_info.  Filesystems must call this when the inode is</div><div class='del'>- * being evicted.  An RCU grace period need not have elapsed yet.</div><div class='add'>+ * Free the inode's fscrypt_inode_info.  Filesystems must call this when the</div><div class='add'>+ * inode is being evicted.  An RCU grace period need not have elapsed yet.</div><div class='ctx'>  */</div><div class='ctx'> void fscrypt_put_encryption_info(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	put_crypt_info(inode-&gt;i_crypt_info);</div><div class='del'>-	inode-&gt;i_crypt_info = NULL;</div><div class='add'>+	/*</div><div class='add'>+	 * Ideally we'd start with a lightweight IS_ENCRYPTED() check here</div><div class='add'>+	 * before proceeding to retrieve and check the pointer.  However, during</div><div class='add'>+	 * inode creation, the fscrypt_inode_info is set before S_ENCRYPTED.  If</div><div class='add'>+	 * an error occurs, it needs to be cleaned up regardless.</div><div class='add'>+	 */</div><div class='add'>+	struct fscrypt_inode_info **ci_addr = fscrypt_inode_info_addr(inode);</div><div class='add'>+</div><div class='add'>+	put_crypt_info(*ci_addr);</div><div class='add'>+	*ci_addr = NULL;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(fscrypt_put_encryption_info);</div><div class='ctx'> </div><div class='hunk'>@@ -759,8 +817,7 @@ EXPORT_SYMBOL(fscrypt_free_inode);</div><div class='ctx'>  */</div><div class='ctx'> int fscrypt_drop_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	const struct fscrypt_info *ci = fscrypt_get_info(inode);</div><div class='del'>-	const struct fscrypt_master_key *mk;</div><div class='add'>+	const struct fscrypt_inode_info *ci = fscrypt_get_inode_info(inode);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If ci is NULL, then the inode doesn't have an encryption key set up</div><div class='hunk'>@@ -770,7 +827,6 @@ int fscrypt_drop_inode(struct inode *inode)</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (!ci || !ci-&gt;ci_master_key)</div><div class='ctx'> 		return 0;</div><div class='del'>-	mk = ci-&gt;ci_master_key-&gt;payload.data[0];</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * With proper, non-racy use of FS_IOC_REMOVE_ENCRYPTION_KEY, all inodes</div><div class='hunk'>@@ -778,17 +834,18 @@ int fscrypt_drop_inode(struct inode *inode)</div><div class='ctx'> 	 * userspace is still using the files, inodes can be dirtied between</div><div class='ctx'> 	 * then and now.  We mustn't lose any writes, so skip dirty inodes here.</div><div class='ctx'> 	 */</div><div class='del'>-	if (inode-&gt;i_state &amp; I_DIRTY_ALL)</div><div class='add'>+	if (inode_state_read(inode) &amp; I_DIRTY_ALL)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Note: since we aren't holding the key semaphore, the result here can</div><div class='add'>+	 * We can't take -&gt;mk_sem here, since this runs in atomic context.</div><div class='add'>+	 * Therefore, -&gt;mk_present can change concurrently, and our result may</div><div class='ctx'> 	 * immediately become outdated.  But there's no correctness problem with</div><div class='ctx'> 	 * unnecessarily evicting.  Nor is there a correctness problem with not</div><div class='ctx'> 	 * evicting while iput() is racing with the key being removed, since</div><div class='ctx'> 	 * then the thread removing the key will either evict the inode itself</div><div class='ctx'> 	 * or will correctly detect that it wasn't evicted due to the race.</div><div class='ctx'> 	 */</div><div class='del'>-	return !is_master_key_secret_present(&amp;mk-&gt;mk_secret);</div><div class='add'>+	return !READ_ONCE(ci-&gt;ci_master_key-&gt;mk_present);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(fscrypt_drop_inode);</div><div class='head'>diff --git a/fs/crypto/keysetup_v1.c b/fs/crypto/keysetup_v1.c<br/>index 2762c5350432..c4d05168522b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/crypto/keysetup_v1.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/crypto/keysetup_v1.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/crypto/keysetup_v1.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/crypto/keysetup_v1.c</a></div><div class='hunk'>@@ -20,8 +20,8 @@</div><div class='ctx'>  *    managed alongside the master keys in the filesystem-level keyring)</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-#include &lt;crypto/algapi.h&gt;</div><div class='ctx'> #include &lt;crypto/skcipher.h&gt;</div><div class='add'>+#include &lt;crypto/utils.h&gt;</div><div class='ctx'> #include &lt;keys/user-type.h&gt;</div><div class='ctx'> #include &lt;linux/hashtable.h&gt;</div><div class='ctx'> #include &lt;linux/scatterlist.h&gt;</div><div class='hunk'>@@ -48,39 +48,30 @@ static int derive_key_aes(const u8 *master_key,</div><div class='ctx'> 			  const u8 nonce[FSCRYPT_FILE_NONCE_SIZE],</div><div class='ctx'> 			  u8 *derived_key, unsigned int derived_keysize)</div><div class='ctx'> {</div><div class='del'>-	int res = 0;</div><div class='del'>-	struct skcipher_request *req = NULL;</div><div class='del'>-	DECLARE_CRYPTO_WAIT(wait);</div><div class='del'>-	struct scatterlist src_sg, dst_sg;</div><div class='del'>-	struct crypto_skcipher *tfm = crypto_alloc_skcipher("ecb(aes)", 0, 0);</div><div class='del'>-</div><div class='del'>-	if (IS_ERR(tfm)) {</div><div class='del'>-		res = PTR_ERR(tfm);</div><div class='del'>-		tfm = NULL;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	crypto_skcipher_set_flags(tfm, CRYPTO_TFM_REQ_FORBID_WEAK_KEYS);</div><div class='del'>-	req = skcipher_request_alloc(tfm, GFP_KERNEL);</div><div class='del'>-	if (!req) {</div><div class='del'>-		res = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	skcipher_request_set_callback(req,</div><div class='del'>-			CRYPTO_TFM_REQ_MAY_BACKLOG | CRYPTO_TFM_REQ_MAY_SLEEP,</div><div class='del'>-			crypto_req_done, &amp;wait);</div><div class='del'>-	res = crypto_skcipher_setkey(tfm, nonce, FSCRYPT_FILE_NONCE_SIZE);</div><div class='del'>-	if (res &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+	struct crypto_sync_skcipher *tfm;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='del'>-	sg_init_one(&amp;src_sg, master_key, derived_keysize);</div><div class='del'>-	sg_init_one(&amp;dst_sg, derived_key, derived_keysize);</div><div class='del'>-	skcipher_request_set_crypt(req, &amp;src_sg, &amp;dst_sg, derived_keysize,</div><div class='del'>-				   NULL);</div><div class='del'>-	res = crypto_wait_req(crypto_skcipher_encrypt(req), &amp;wait);</div><div class='del'>-out:</div><div class='del'>-	skcipher_request_free(req);</div><div class='del'>-	crypto_free_skcipher(tfm);</div><div class='del'>-	return res;</div><div class='add'>+	tfm = crypto_alloc_sync_skcipher("ecb(aes)", 0, FSCRYPT_CRYPTOAPI_MASK);</div><div class='add'>+	if (IS_ERR(tfm))</div><div class='add'>+		return PTR_ERR(tfm);</div><div class='add'>+</div><div class='add'>+	err = crypto_sync_skcipher_setkey(tfm, nonce, FSCRYPT_FILE_NONCE_SIZE);</div><div class='add'>+	if (err == 0) {</div><div class='add'>+		SYNC_SKCIPHER_REQUEST_ON_STACK(req, tfm);</div><div class='add'>+		struct scatterlist src_sg, dst_sg;</div><div class='add'>+</div><div class='add'>+		skcipher_request_set_callback(req,</div><div class='add'>+					      CRYPTO_TFM_REQ_MAY_BACKLOG |</div><div class='add'>+						      CRYPTO_TFM_REQ_MAY_SLEEP,</div><div class='add'>+					      NULL, NULL);</div><div class='add'>+		sg_init_one(&amp;src_sg, master_key, derived_keysize);</div><div class='add'>+		sg_init_one(&amp;dst_sg, derived_key, derived_keysize);</div><div class='add'>+		skcipher_request_set_crypt(req, &amp;src_sg, &amp;dst_sg,</div><div class='add'>+					   derived_keysize, NULL);</div><div class='add'>+		err = crypto_skcipher_encrypt(req);</div><div class='add'>+	}</div><div class='add'>+	crypto_free_sync_skcipher(tfm);</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -118,7 +109,7 @@ find_and_lock_process_key(const char *prefix,</div><div class='ctx'> 	payload = (const struct fscrypt_key *)ukp-&gt;data;</div><div class='ctx'> </div><div class='ctx'> 	if (ukp-&gt;datalen != sizeof(struct fscrypt_key) ||</div><div class='del'>-	    payload-&gt;size &lt; 1 || payload-&gt;size &gt; FSCRYPT_MAX_KEY_SIZE) {</div><div class='add'>+	    payload-&gt;size &lt; 1 || payload-&gt;size &gt; sizeof(payload-&gt;raw)) {</div><div class='ctx'> 		fscrypt_warn(NULL,</div><div class='ctx'> 			     "key with description '%s' has invalid payload",</div><div class='ctx'> 			     key-&gt;description);</div><div class='hunk'>@@ -143,18 +134,19 @@ invalid:</div><div class='ctx'> </div><div class='ctx'> /* Master key referenced by DIRECT_KEY policy */</div><div class='ctx'> struct fscrypt_direct_key {</div><div class='add'>+	struct super_block		*dk_sb;</div><div class='ctx'> 	struct hlist_node		dk_node;</div><div class='ctx'> 	refcount_t			dk_refcount;</div><div class='ctx'> 	const struct fscrypt_mode	*dk_mode;</div><div class='ctx'> 	struct fscrypt_prepared_key	dk_key;</div><div class='ctx'> 	u8				dk_descriptor[FSCRYPT_KEY_DESCRIPTOR_SIZE];</div><div class='del'>-	u8				dk_raw[FSCRYPT_MAX_KEY_SIZE];</div><div class='add'>+	u8				dk_raw[FSCRYPT_MAX_RAW_KEY_SIZE];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static void free_direct_key(struct fscrypt_direct_key *dk)</div><div class='ctx'> {</div><div class='ctx'> 	if (dk) {</div><div class='del'>-		fscrypt_destroy_prepared_key(&amp;dk-&gt;dk_key);</div><div class='add'>+		fscrypt_destroy_prepared_key(dk-&gt;dk_sb, &amp;dk-&gt;dk_key);</div><div class='ctx'> 		kfree_sensitive(dk);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -177,7 +169,8 @@ void fscrypt_put_direct_key(struct fscrypt_direct_key *dk)</div><div class='ctx'>  */</div><div class='ctx'> static struct fscrypt_direct_key *</div><div class='ctx'> find_or_insert_direct_key(struct fscrypt_direct_key *to_insert,</div><div class='del'>-			  const u8 *raw_key, const struct fscrypt_info *ci)</div><div class='add'>+			  const u8 *raw_key,</div><div class='add'>+			  const struct fscrypt_inode_info *ci)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned long hash_key;</div><div class='ctx'> 	struct fscrypt_direct_key *dk;</div><div class='hunk'>@@ -217,7 +210,7 @@ find_or_insert_direct_key(struct fscrypt_direct_key *to_insert,</div><div class='ctx'> </div><div class='ctx'> /* Prepare to encrypt directly using the master key in the given mode */</div><div class='ctx'> static struct fscrypt_direct_key *</div><div class='del'>-fscrypt_get_direct_key(const struct fscrypt_info *ci, const u8 *raw_key)</div><div class='add'>+fscrypt_get_direct_key(const struct fscrypt_inode_info *ci, const u8 *raw_key)</div><div class='ctx'> {</div><div class='ctx'> 	struct fscrypt_direct_key *dk;</div><div class='ctx'> 	int err;</div><div class='hunk'>@@ -231,6 +224,7 @@ fscrypt_get_direct_key(const struct fscrypt_info *ci, const u8 *raw_key)</div><div class='ctx'> 	dk = kzalloc(sizeof(*dk), GFP_KERNEL);</div><div class='ctx'> 	if (!dk)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='add'>+	dk-&gt;dk_sb = ci-&gt;ci_inode-&gt;i_sb;</div><div class='ctx'> 	refcount_set(&amp;dk-&gt;dk_refcount, 1);</div><div class='ctx'> 	dk-&gt;dk_mode = ci-&gt;ci_mode;</div><div class='ctx'> 	err = fscrypt_prepare_key(&amp;dk-&gt;dk_key, raw_key, ci);</div><div class='hunk'>@@ -248,7 +242,7 @@ err_free_dk:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* v1 policy, DIRECT_KEY: use the master key directly */</div><div class='del'>-static int setup_v1_file_key_direct(struct fscrypt_info *ci,</div><div class='add'>+static int setup_v1_file_key_direct(struct fscrypt_inode_info *ci,</div><div class='ctx'> 				    const u8 *raw_master_key)</div><div class='ctx'> {</div><div class='ctx'> 	struct fscrypt_direct_key *dk;</div><div class='hunk'>@@ -262,7 +256,7 @@ static int setup_v1_file_key_direct(struct fscrypt_info *ci,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* v1 policy, !DIRECT_KEY: derive the file's encryption key */</div><div class='del'>-static int setup_v1_file_key_derived(struct fscrypt_info *ci,</div><div class='add'>+static int setup_v1_file_key_derived(struct fscrypt_inode_info *ci,</div><div class='ctx'> 				     const u8 *raw_master_key)</div><div class='ctx'> {</div><div class='ctx'> 	u8 *derived_key;</div><div class='hunk'>@@ -287,7 +281,8 @@ out:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int fscrypt_setup_v1_file_key(struct fscrypt_info *ci, const u8 *raw_master_key)</div><div class='add'>+int fscrypt_setup_v1_file_key(struct fscrypt_inode_info *ci,</div><div class='add'>+			      const u8 *raw_master_key)</div><div class='ctx'> {</div><div class='ctx'> 	if (ci-&gt;ci_policy.v1.flags &amp; FSCRYPT_POLICY_FLAG_DIRECT_KEY)</div><div class='ctx'> 		return setup_v1_file_key_direct(ci, raw_master_key);</div><div class='hunk'>@@ -295,8 +290,10 @@ int fscrypt_setup_v1_file_key(struct fscrypt_info *ci, const u8 *raw_master_key)</div><div class='ctx'> 		return setup_v1_file_key_derived(ci, raw_master_key);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int fscrypt_setup_v1_file_key_via_subscribed_keyrings(struct fscrypt_info *ci)</div><div class='add'>+int</div><div class='add'>+fscrypt_setup_v1_file_key_via_subscribed_keyrings(struct fscrypt_inode_info *ci)</div><div class='ctx'> {</div><div class='add'>+	const struct super_block *sb = ci-&gt;ci_inode-&gt;i_sb;</div><div class='ctx'> 	struct key *key;</div><div class='ctx'> 	const struct fscrypt_key *payload;</div><div class='ctx'> 	int err;</div><div class='hunk'>@@ -304,8 +301,8 @@ int fscrypt_setup_v1_file_key_via_subscribed_keyrings(struct fscrypt_info *ci)</div><div class='ctx'> 	key = find_and_lock_process_key(FSCRYPT_KEY_DESC_PREFIX,</div><div class='ctx'> 					ci-&gt;ci_policy.v1.master_key_descriptor,</div><div class='ctx'> 					ci-&gt;ci_mode-&gt;keysize, &amp;payload);</div><div class='del'>-	if (key == ERR_PTR(-ENOKEY) &amp;&amp; ci-&gt;ci_inode-&gt;i_sb-&gt;s_cop-&gt;key_prefix) {</div><div class='del'>-		key = find_and_lock_process_key(ci-&gt;ci_inode-&gt;i_sb-&gt;s_cop-&gt;key_prefix,</div><div class='add'>+	if (key == ERR_PTR(-ENOKEY) &amp;&amp; sb-&gt;s_cop-&gt;legacy_key_prefix) {</div><div class='add'>+		key = find_and_lock_process_key(sb-&gt;s_cop-&gt;legacy_key_prefix,</div><div class='ctx'> 						ci-&gt;ci_policy.v1.master_key_descriptor,</div><div class='ctx'> 						ci-&gt;ci_mode-&gt;keysize, &amp;payload);</div><div class='ctx'> 	}</div><div class='head'>diff --git a/fs/crypto/policy.c b/fs/crypto/policy.c<br/>index ed3d623724cd..bbb2f5ced988 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/crypto/policy.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/crypto/policy.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/crypto/policy.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/crypto/policy.c</a></div><div class='hunk'>@@ -10,10 +10,13 @@</div><div class='ctx'>  * Modified by Eric Biggers, 2019 for v2 policy support.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/export.h&gt;</div><div class='add'>+#include &lt;linux/fs_context.h&gt;</div><div class='add'>+#include &lt;linux/mount.h&gt;</div><div class='ctx'> #include &lt;linux/random.h&gt;</div><div class='ctx'> #include &lt;linux/seq_file.h&gt;</div><div class='ctx'> #include &lt;linux/string.h&gt;</div><div class='del'>-#include &lt;linux/mount.h&gt;</div><div class='add'>+</div><div class='ctx'> #include "fscrypt_private.h"</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -32,15 +35,41 @@ bool fscrypt_policies_equal(const union fscrypt_policy *policy1,</div><div class='ctx'> 	return !memcmp(policy1, policy2, fscrypt_policy_size(policy1));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static const union fscrypt_policy *</div><div class='del'>-fscrypt_get_dummy_policy(struct super_block *sb)</div><div class='add'>+int fscrypt_policy_to_key_spec(const union fscrypt_policy *policy,</div><div class='add'>+			       struct fscrypt_key_specifier *key_spec)</div><div class='add'>+{</div><div class='add'>+	switch (policy-&gt;version) {</div><div class='add'>+	case FSCRYPT_POLICY_V1:</div><div class='add'>+		key_spec-&gt;type = FSCRYPT_KEY_SPEC_TYPE_DESCRIPTOR;</div><div class='add'>+		memcpy(key_spec-&gt;u.descriptor, policy-&gt;v1.master_key_descriptor,</div><div class='add'>+		       FSCRYPT_KEY_DESCRIPTOR_SIZE);</div><div class='add'>+		return 0;</div><div class='add'>+	case FSCRYPT_POLICY_V2:</div><div class='add'>+		key_spec-&gt;type = FSCRYPT_KEY_SPEC_TYPE_IDENTIFIER;</div><div class='add'>+		memcpy(key_spec-&gt;u.identifier, policy-&gt;v2.master_key_identifier,</div><div class='add'>+		       FSCRYPT_KEY_IDENTIFIER_SIZE);</div><div class='add'>+		return 0;</div><div class='add'>+	default:</div><div class='add'>+		WARN_ON_ONCE(1);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+const union fscrypt_policy *fscrypt_get_dummy_policy(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	if (!sb-&gt;s_cop-&gt;get_dummy_policy)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	return sb-&gt;s_cop-&gt;get_dummy_policy(sb);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool fscrypt_valid_enc_modes(u32 contents_mode, u32 filenames_mode)</div><div class='add'>+/*</div><div class='add'>+ * Return %true if the given combination of encryption modes is supported for v1</div><div class='add'>+ * (and later) encryption policies.</div><div class='add'>+ *</div><div class='add'>+ * Do *not* add anything new here, since v1 encryption policies are deprecated.</div><div class='add'>+ * New combinations of modes should go in fscrypt_valid_enc_modes_v2() only.</div><div class='add'>+ */</div><div class='add'>+static bool fscrypt_valid_enc_modes_v1(u32 contents_mode, u32 filenames_mode)</div><div class='ctx'> {</div><div class='ctx'> 	if (contents_mode == FSCRYPT_MODE_AES_256_XTS &amp;&amp;</div><div class='ctx'> 	    filenames_mode == FSCRYPT_MODE_AES_256_CTS)</div><div class='hunk'>@@ -57,6 +86,19 @@ static bool fscrypt_valid_enc_modes(u32 contents_mode, u32 filenames_mode)</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool fscrypt_valid_enc_modes_v2(u32 contents_mode, u32 filenames_mode)</div><div class='add'>+{</div><div class='add'>+	if (contents_mode == FSCRYPT_MODE_AES_256_XTS &amp;&amp;</div><div class='add'>+	    filenames_mode == FSCRYPT_MODE_AES_256_HCTR2)</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	if (contents_mode == FSCRYPT_MODE_SM4_XTS &amp;&amp;</div><div class='add'>+	    filenames_mode == FSCRYPT_MODE_SM4_CTS)</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	return fscrypt_valid_enc_modes_v1(contents_mode, filenames_mode);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static bool supported_direct_key_modes(const struct inode *inode,</div><div class='ctx'> 				       u32 contents_mode, u32 filenames_mode)</div><div class='ctx'> {</div><div class='hunk'>@@ -78,12 +120,11 @@ static bool supported_direct_key_modes(const struct inode *inode,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool supported_iv_ino_lblk_policy(const struct fscrypt_policy_v2 *policy,</div><div class='del'>-					 const struct inode *inode,</div><div class='del'>-					 const char *type,</div><div class='del'>-					 int max_ino_bits, int max_lblk_bits)</div><div class='add'>+					 const struct inode *inode)</div><div class='ctx'> {</div><div class='add'>+	const char *type = (policy-&gt;flags &amp; FSCRYPT_POLICY_FLAG_IV_INO_LBLK_64)</div><div class='add'>+				? "IV_INO_LBLK_64" : "IV_INO_LBLK_32";</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='del'>-	int ino_bits = 64, lblk_bits = 64;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * IV_INO_LBLK_* exist only because of hardware limitations, and</div><div class='hunk'>@@ -110,17 +151,29 @@ static bool supported_iv_ino_lblk_policy(const struct fscrypt_policy_v2 *policy,</div><div class='ctx'> 			     type, sb-&gt;s_id);</div><div class='ctx'> 		return false;</div><div class='ctx'> 	}</div><div class='del'>-	if (sb-&gt;s_cop-&gt;get_ino_and_lblk_bits)</div><div class='del'>-		sb-&gt;s_cop-&gt;get_ino_and_lblk_bits(sb, &amp;ino_bits, &amp;lblk_bits);</div><div class='del'>-	if (ino_bits &gt; max_ino_bits) {</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * IV_INO_LBLK_64 and IV_INO_LBLK_32 both require that inode numbers fit</div><div class='add'>+	 * in 32 bits.  In principle, IV_INO_LBLK_32 could support longer inode</div><div class='add'>+	 * numbers because it hashes the inode number; however, currently the</div><div class='add'>+	 * inode number is gotten from inode::i_ino which is 'unsigned long'.</div><div class='add'>+	 * So for now the implementation limit is 32 bits.</div><div class='add'>+	 */</div><div class='add'>+	if (!sb-&gt;s_cop-&gt;has_32bit_inodes) {</div><div class='ctx'> 		fscrypt_warn(inode,</div><div class='ctx'> 			     "Can't use %s policy on filesystem '%s' because its inode numbers are too long",</div><div class='ctx'> 			     type, sb-&gt;s_id);</div><div class='ctx'> 		return false;</div><div class='ctx'> 	}</div><div class='del'>-	if (lblk_bits &gt; max_lblk_bits) {</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * IV_INO_LBLK_64 and IV_INO_LBLK_32 both require that file data unit</div><div class='add'>+	 * indices fit in 32 bits.</div><div class='add'>+	 */</div><div class='add'>+	if (fscrypt_max_file_dun_bits(sb,</div><div class='add'>+			fscrypt_policy_v2_du_bits(policy, inode)) &gt; 32) {</div><div class='ctx'> 		fscrypt_warn(inode,</div><div class='del'>-			     "Can't use %s policy on filesystem '%s' because its block numbers are too long",</div><div class='add'>+			     "Can't use %s policy on filesystem '%s' because its maximum file size is too large",</div><div class='ctx'> 			     type, sb-&gt;s_id);</div><div class='ctx'> 		return false;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -130,7 +183,7 @@ static bool supported_iv_ino_lblk_policy(const struct fscrypt_policy_v2 *policy,</div><div class='ctx'> static bool fscrypt_supported_v1_policy(const struct fscrypt_policy_v1 *policy,</div><div class='ctx'> 					const struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	if (!fscrypt_valid_enc_modes(policy-&gt;contents_encryption_mode,</div><div class='add'>+	if (!fscrypt_valid_enc_modes_v1(policy-&gt;contents_encryption_mode,</div><div class='ctx'> 				     policy-&gt;filenames_encryption_mode)) {</div><div class='ctx'> 		fscrypt_warn(inode,</div><div class='ctx'> 			     "Unsupported encryption modes (contents %d, filenames %d)",</div><div class='hunk'>@@ -166,7 +219,7 @@ static bool fscrypt_supported_v2_policy(const struct fscrypt_policy_v2 *policy,</div><div class='ctx'> {</div><div class='ctx'> 	int count = 0;</div><div class='ctx'> </div><div class='del'>-	if (!fscrypt_valid_enc_modes(policy-&gt;contents_encryption_mode,</div><div class='add'>+	if (!fscrypt_valid_enc_modes_v2(policy-&gt;contents_encryption_mode,</div><div class='ctx'> 				     policy-&gt;filenames_encryption_mode)) {</div><div class='ctx'> 		fscrypt_warn(inode,</div><div class='ctx'> 			     "Unsupported encryption modes (contents %d, filenames %d)",</div><div class='hunk'>@@ -193,25 +246,39 @@ static bool fscrypt_supported_v2_policy(const struct fscrypt_policy_v2 *policy,</div><div class='ctx'> 		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (policy-&gt;log2_data_unit_size) {</div><div class='add'>+		if (!inode-&gt;i_sb-&gt;s_cop-&gt;supports_subblock_data_units) {</div><div class='add'>+			fscrypt_warn(inode,</div><div class='add'>+				     "Filesystem does not support configuring crypto data unit size");</div><div class='add'>+			return false;</div><div class='add'>+		}</div><div class='add'>+		if (policy-&gt;log2_data_unit_size &gt; inode-&gt;i_blkbits ||</div><div class='add'>+		    policy-&gt;log2_data_unit_size &lt; SECTOR_SHIFT /* 9 */) {</div><div class='add'>+			fscrypt_warn(inode,</div><div class='add'>+				     "Unsupported log2_data_unit_size in encryption policy: %d",</div><div class='add'>+				     policy-&gt;log2_data_unit_size);</div><div class='add'>+			return false;</div><div class='add'>+		}</div><div class='add'>+		if (policy-&gt;log2_data_unit_size != inode-&gt;i_blkbits &amp;&amp;</div><div class='add'>+		    (policy-&gt;flags &amp; FSCRYPT_POLICY_FLAG_IV_INO_LBLK_32)) {</div><div class='add'>+			/*</div><div class='add'>+			 * Not safe to enable yet, as we need to ensure that DUN</div><div class='add'>+			 * wraparound can only occur on a FS block boundary.</div><div class='add'>+			 */</div><div class='add'>+			fscrypt_warn(inode,</div><div class='add'>+				     "Sub-block data units not yet supported with IV_INO_LBLK_32");</div><div class='add'>+			return false;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if ((policy-&gt;flags &amp; FSCRYPT_POLICY_FLAG_DIRECT_KEY) &amp;&amp;</div><div class='ctx'> 	    !supported_direct_key_modes(inode, policy-&gt;contents_encryption_mode,</div><div class='ctx'> 					policy-&gt;filenames_encryption_mode))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	if ((policy-&gt;flags &amp; FSCRYPT_POLICY_FLAG_IV_INO_LBLK_64) &amp;&amp;</div><div class='del'>-	    !supported_iv_ino_lblk_policy(policy, inode, "IV_INO_LBLK_64",</div><div class='del'>-					  32, 32))</div><div class='del'>-		return false;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * IV_INO_LBLK_32 hashes the inode number, so in principle it can</div><div class='del'>-	 * support any ino_bits.  However, currently the inode number is gotten</div><div class='del'>-	 * from inode::i_ino which is 'unsigned long'.  So for now the</div><div class='del'>-	 * implementation limit is 32 bits.</div><div class='del'>-	 */</div><div class='del'>-	if ((policy-&gt;flags &amp; FSCRYPT_POLICY_FLAG_IV_INO_LBLK_32) &amp;&amp;</div><div class='del'>-	    !supported_iv_ino_lblk_policy(policy, inode, "IV_INO_LBLK_32",</div><div class='del'>-					  32, 32))</div><div class='add'>+	if ((policy-&gt;flags &amp; (FSCRYPT_POLICY_FLAG_IV_INO_LBLK_64 |</div><div class='add'>+			      FSCRYPT_POLICY_FLAG_IV_INO_LBLK_32)) &amp;&amp;</div><div class='add'>+	    !supported_iv_ino_lblk_policy(policy, inode))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='ctx'> 	if (memchr_inv(policy-&gt;__reserved, 0, sizeof(policy-&gt;__reserved))) {</div><div class='hunk'>@@ -290,6 +357,7 @@ static int fscrypt_new_context(union fscrypt_context *ctx_u,</div><div class='ctx'> 		ctx-&gt;filenames_encryption_mode =</div><div class='ctx'> 			policy-&gt;filenames_encryption_mode;</div><div class='ctx'> 		ctx-&gt;flags = policy-&gt;flags;</div><div class='add'>+		ctx-&gt;log2_data_unit_size = policy-&gt;log2_data_unit_size;</div><div class='ctx'> 		memcpy(ctx-&gt;master_key_identifier,</div><div class='ctx'> 		       policy-&gt;master_key_identifier,</div><div class='ctx'> 		       sizeof(ctx-&gt;master_key_identifier));</div><div class='hunk'>@@ -350,6 +418,7 @@ int fscrypt_policy_from_context(union fscrypt_policy *policy_u,</div><div class='ctx'> 		policy-&gt;filenames_encryption_mode =</div><div class='ctx'> 			ctx-&gt;filenames_encryption_mode;</div><div class='ctx'> 		policy-&gt;flags = ctx-&gt;flags;</div><div class='add'>+		policy-&gt;log2_data_unit_size = ctx-&gt;log2_data_unit_size;</div><div class='ctx'> 		memcpy(policy-&gt;__reserved, ctx-&gt;__reserved,</div><div class='ctx'> 		       sizeof(policy-&gt;__reserved));</div><div class='ctx'> 		memcpy(policy-&gt;master_key_identifier,</div><div class='hunk'>@@ -365,11 +434,11 @@ int fscrypt_policy_from_context(union fscrypt_policy *policy_u,</div><div class='ctx'> /* Retrieve an inode's encryption policy */</div><div class='ctx'> static int fscrypt_get_policy(struct inode *inode, union fscrypt_policy *policy)</div><div class='ctx'> {</div><div class='del'>-	const struct fscrypt_info *ci;</div><div class='add'>+	const struct fscrypt_inode_info *ci;</div><div class='ctx'> 	union fscrypt_context ctx;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ci = fscrypt_get_info(inode);</div><div class='add'>+	ci = fscrypt_get_inode_info(inode);</div><div class='ctx'> 	if (ci) {</div><div class='ctx'> 		/* key available, use the cached policy */</div><div class='ctx'> 		*policy = ci-&gt;ci_policy;</div><div class='hunk'>@@ -423,7 +492,7 @@ static int set_encryption_policy(struct inode *inode,</div><div class='ctx'> 				     current-&gt;comm, current-&gt;pid);</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='del'>-		WARN_ON(1);</div><div class='add'>+		WARN_ON_ONCE(1);</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -465,7 +534,7 @@ int fscrypt_ioctl_set_policy(struct file *filp, const void __user *arg)</div><div class='ctx'> 		return -EFAULT;</div><div class='ctx'> 	policy.version = version;</div><div class='ctx'> </div><div class='del'>-	if (!inode_owner_or_capable(&amp;init_user_ns, inode))</div><div class='add'>+	if (!inode_owner_or_capable(&amp;nop_mnt_idmap, inode))</div><div class='ctx'> 		return -EACCES;</div><div class='ctx'> </div><div class='ctx'> 	ret = mnt_want_write_file(filp);</div><div class='hunk'>@@ -607,7 +676,7 @@ int fscrypt_has_permitted_context(struct inode *parent, struct inode *child)</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Both parent and child are encrypted, so verify they use the same</div><div class='del'>-	 * encryption policy.  Compare the fscrypt_info structs if the keys are</div><div class='add'>+	 * encryption policy.  Compare the cached policies if the keys are</div><div class='ctx'> 	 * available, otherwise retrieve and compare the fscrypt_contexts.</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * Note that the fscrypt_context retrieval will be required frequently</div><div class='hunk'>@@ -658,13 +727,39 @@ const union fscrypt_policy *fscrypt_policy_to_inherit(struct inode *dir)</div><div class='ctx'> 		err = fscrypt_require_key(dir);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			return ERR_PTR(err);</div><div class='del'>-		return &amp;dir-&gt;i_crypt_info-&gt;ci_policy;</div><div class='add'>+		return &amp;fscrypt_get_inode_info_raw(dir)-&gt;ci_policy;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return fscrypt_get_dummy_policy(dir-&gt;i_sb);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='add'>+ * fscrypt_context_for_new_inode() - create an encryption context for a new inode</div><div class='add'>+ * @ctx: where context should be written</div><div class='add'>+ * @inode: inode from which to fetch policy and nonce</div><div class='add'>+ *</div><div class='add'>+ * Given an in-core "prepared" (via fscrypt_prepare_new_inode) inode,</div><div class='add'>+ * generate a new context and write it to ctx. ctx _must_ be at least</div><div class='add'>+ * FSCRYPT_SET_CONTEXT_MAX_SIZE bytes.</div><div class='add'>+ *</div><div class='add'>+ * Return: size of the resulting context or a negative error code.</div><div class='add'>+ */</div><div class='add'>+int fscrypt_context_for_new_inode(void *ctx, struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct fscrypt_inode_info *ci = fscrypt_get_inode_info_raw(inode);</div><div class='add'>+</div><div class='add'>+	BUILD_BUG_ON(sizeof(union fscrypt_context) !=</div><div class='add'>+			FSCRYPT_SET_CONTEXT_MAX_SIZE);</div><div class='add'>+</div><div class='add'>+	/* fscrypt_prepare_new_inode() should have set up the key already. */</div><div class='add'>+	if (WARN_ON_ONCE(!ci))</div><div class='add'>+		return -ENOKEY;</div><div class='add'>+</div><div class='add'>+	return fscrypt_new_context(ctx, &amp;ci-&gt;ci_policy, ci-&gt;ci_nonce);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(fscrypt_context_for_new_inode);</div><div class='add'>+</div><div class='add'>+/**</div><div class='ctx'>  * fscrypt_set_context() - Set the fscrypt context of a new inode</div><div class='ctx'>  * @inode: a new inode</div><div class='ctx'>  * @fs_data: private data given by FS and passed to -&gt;set_context()</div><div class='hunk'>@@ -676,101 +771,65 @@ const union fscrypt_policy *fscrypt_policy_to_inherit(struct inode *dir)</div><div class='ctx'>  */</div><div class='ctx'> int fscrypt_set_context(struct inode *inode, void *fs_data)</div><div class='ctx'> {</div><div class='del'>-	struct fscrypt_info *ci = inode-&gt;i_crypt_info;</div><div class='add'>+	struct fscrypt_inode_info *ci;</div><div class='ctx'> 	union fscrypt_context ctx;</div><div class='ctx'> 	int ctxsize;</div><div class='ctx'> </div><div class='del'>-	/* fscrypt_prepare_new_inode() should have set up the key already. */</div><div class='del'>-	if (WARN_ON_ONCE(!ci))</div><div class='del'>-		return -ENOKEY;</div><div class='del'>-</div><div class='del'>-	BUILD_BUG_ON(sizeof(ctx) != FSCRYPT_SET_CONTEXT_MAX_SIZE);</div><div class='del'>-	ctxsize = fscrypt_new_context(&amp;ctx, &amp;ci-&gt;ci_policy, ci-&gt;ci_nonce);</div><div class='add'>+	ctxsize = fscrypt_context_for_new_inode(&amp;ctx, inode);</div><div class='add'>+	if (ctxsize &lt; 0)</div><div class='add'>+		return ctxsize;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * This may be the first time the inode number is available, so do any</div><div class='ctx'> 	 * delayed key setup that requires the inode number.</div><div class='ctx'> 	 */</div><div class='add'>+	ci = fscrypt_get_inode_info_raw(inode);</div><div class='ctx'> 	if (ci-&gt;ci_policy.version == FSCRYPT_POLICY_V2 &amp;&amp;</div><div class='del'>-	    (ci-&gt;ci_policy.v2.flags &amp; FSCRYPT_POLICY_FLAG_IV_INO_LBLK_32)) {</div><div class='del'>-		const struct fscrypt_master_key *mk =</div><div class='del'>-			ci-&gt;ci_master_key-&gt;payload.data[0];</div><div class='del'>-</div><div class='del'>-		fscrypt_hash_inode_number(ci, mk);</div><div class='del'>-	}</div><div class='add'>+	    (ci-&gt;ci_policy.v2.flags &amp; FSCRYPT_POLICY_FLAG_IV_INO_LBLK_32))</div><div class='add'>+		fscrypt_hash_inode_number(ci, ci-&gt;ci_master_key);</div><div class='ctx'> </div><div class='ctx'> 	return inode-&gt;i_sb-&gt;s_cop-&gt;set_context(inode, &amp;ctx, ctxsize, fs_data);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(fscrypt_set_context);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * fscrypt_set_test_dummy_encryption() - handle '-o test_dummy_encryption'</div><div class='del'>- * @sb: the filesystem on which test_dummy_encryption is being specified</div><div class='del'>- * @arg: the argument to the test_dummy_encryption option.  May be NULL.</div><div class='del'>- * @dummy_policy: the filesystem's current dummy policy (input/output, see</div><div class='del'>- *		  below)</div><div class='del'>- *</div><div class='del'>- * Handle the test_dummy_encryption mount option by creating a dummy encryption</div><div class='del'>- * policy, saving it in @dummy_policy, and adding the corresponding dummy</div><div class='del'>- * encryption key to the filesystem.  If the @dummy_policy is already set, then</div><div class='del'>- * instead validate that it matches @arg.  Don't support changing it via</div><div class='del'>- * remount, as that is difficult to do safely.</div><div class='add'>+ * fscrypt_parse_test_dummy_encryption() - parse the test_dummy_encryption mount option</div><div class='add'>+ * @param: the mount option</div><div class='add'>+ * @dummy_policy: (input/output) the place to write the dummy policy that will</div><div class='add'>+ *	result from parsing the option.  Zero-initialize this.  If a policy is</div><div class='add'>+ *	already set here (due to test_dummy_encryption being given multiple</div><div class='add'>+ *	times), then this function will verify that the policies are the same.</div><div class='ctx'>  *</div><div class='del'>- * Return: 0 on success (dummy policy set, or the same policy is already set);</div><div class='del'>- *         -EEXIST if a different dummy policy is already set;</div><div class='del'>- *         or another -errno value.</div><div class='add'>+ * Return: 0 on success; -EINVAL if the argument is invalid; -EEXIST if the</div><div class='add'>+ *	   argument conflicts with one already specified; or -ENOMEM.</div><div class='ctx'>  */</div><div class='del'>-int fscrypt_set_test_dummy_encryption(struct super_block *sb, const char *arg,</div><div class='del'>-				      struct fscrypt_dummy_policy *dummy_policy)</div><div class='add'>+int fscrypt_parse_test_dummy_encryption(const struct fs_parameter *param,</div><div class='add'>+				struct fscrypt_dummy_policy *dummy_policy)</div><div class='ctx'> {</div><div class='del'>-	struct fscrypt_key_specifier key_spec = { 0 };</div><div class='del'>-	int version;</div><div class='del'>-	union fscrypt_policy *policy = NULL;</div><div class='add'>+	const char *arg = "v2";</div><div class='add'>+	union fscrypt_policy *policy;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	if (!arg)</div><div class='del'>-		arg = "v2";</div><div class='del'>-</div><div class='del'>-	if (!strcmp(arg, "v1")) {</div><div class='del'>-		version = FSCRYPT_POLICY_V1;</div><div class='del'>-		key_spec.type = FSCRYPT_KEY_SPEC_TYPE_DESCRIPTOR;</div><div class='del'>-		memset(key_spec.u.descriptor, 0x42,</div><div class='del'>-		       FSCRYPT_KEY_DESCRIPTOR_SIZE);</div><div class='del'>-	} else if (!strcmp(arg, "v2")) {</div><div class='del'>-		version = FSCRYPT_POLICY_V2;</div><div class='del'>-		key_spec.type = FSCRYPT_KEY_SPEC_TYPE_IDENTIFIER;</div><div class='del'>-		/* key_spec.u.identifier gets filled in when adding the key */</div><div class='del'>-	} else {</div><div class='del'>-		err = -EINVAL;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (param-&gt;type == fs_value_is_string &amp;&amp; *param-&gt;string)</div><div class='add'>+		arg = param-&gt;string;</div><div class='ctx'> </div><div class='ctx'> 	policy = kzalloc(sizeof(*policy), GFP_KERNEL);</div><div class='del'>-	if (!policy) {</div><div class='del'>-		err = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	err = fscrypt_add_test_dummy_key(sb, &amp;key_spec);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out;</div><div class='add'>+	if (!policy)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	policy-&gt;version = version;</div><div class='del'>-	switch (policy-&gt;version) {</div><div class='del'>-	case FSCRYPT_POLICY_V1:</div><div class='add'>+	if (!strcmp(arg, "v1")) {</div><div class='add'>+		policy-&gt;version = FSCRYPT_POLICY_V1;</div><div class='ctx'> 		policy-&gt;v1.contents_encryption_mode = FSCRYPT_MODE_AES_256_XTS;</div><div class='ctx'> 		policy-&gt;v1.filenames_encryption_mode = FSCRYPT_MODE_AES_256_CTS;</div><div class='del'>-		memcpy(policy-&gt;v1.master_key_descriptor, key_spec.u.descriptor,</div><div class='add'>+		memset(policy-&gt;v1.master_key_descriptor, 0x42,</div><div class='ctx'> 		       FSCRYPT_KEY_DESCRIPTOR_SIZE);</div><div class='del'>-		break;</div><div class='del'>-	case FSCRYPT_POLICY_V2:</div><div class='add'>+	} else if (!strcmp(arg, "v2")) {</div><div class='add'>+		policy-&gt;version = FSCRYPT_POLICY_V2;</div><div class='ctx'> 		policy-&gt;v2.contents_encryption_mode = FSCRYPT_MODE_AES_256_XTS;</div><div class='ctx'> 		policy-&gt;v2.filenames_encryption_mode = FSCRYPT_MODE_AES_256_CTS;</div><div class='del'>-		memcpy(policy-&gt;v2.master_key_identifier, key_spec.u.identifier,</div><div class='del'>-		       FSCRYPT_KEY_IDENTIFIER_SIZE);</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		WARN_ON(1);</div><div class='add'>+		fscrypt_get_test_dummy_key_identifier(</div><div class='add'>+				policy-&gt;v2.master_key_identifier);</div><div class='add'>+	} else {</div><div class='ctx'> 		err = -EINVAL;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -789,7 +848,25 @@ out:</div><div class='ctx'> 	kfree(policy);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL_GPL(fscrypt_set_test_dummy_encryption);</div><div class='add'>+EXPORT_SYMBOL_GPL(fscrypt_parse_test_dummy_encryption);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fscrypt_dummy_policies_equal() - check whether two dummy policies are equal</div><div class='add'>+ * @p1: the first test dummy policy (may be unset)</div><div class='add'>+ * @p2: the second test dummy policy (may be unset)</div><div class='add'>+ *</div><div class='add'>+ * Return: %true if the dummy policies are both set and equal, or both unset.</div><div class='add'>+ */</div><div class='add'>+bool fscrypt_dummy_policies_equal(const struct fscrypt_dummy_policy *p1,</div><div class='add'>+				  const struct fscrypt_dummy_policy *p2)</div><div class='add'>+{</div><div class='add'>+	if (!p1-&gt;policy &amp;&amp; !p2-&gt;policy)</div><div class='add'>+		return true;</div><div class='add'>+	if (!p1-&gt;policy || !p2-&gt;policy)</div><div class='add'>+		return false;</div><div class='add'>+	return fscrypt_policies_equal(p1-&gt;policy, p2-&gt;policy);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(fscrypt_dummy_policies_equal);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * fscrypt_show_test_dummy_encryption() - show '-o test_dummy_encryption'</div><div class='head'>diff --git a/fs/d_path.c b/fs/d_path.c<br/>index e4e0ebad1f15..bb365511066b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/d_path.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/d_path.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/d_path.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/d_path.c</a></div><div class='hunk'>@@ -7,6 +7,7 @@</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/prefetch.h&gt;</div><div class='ctx'> #include "mount.h"</div><div class='add'>+#include "internal.h"</div><div class='ctx'> </div><div class='ctx'> struct prepend_buffer {</div><div class='ctx'> 	char *buf;</div><div class='hunk'>@@ -34,7 +35,7 @@ static bool prepend_char(struct prepend_buffer *p, unsigned char c)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * The source of the prepend data can be an optimistoc load</div><div class='add'>+ * The source of the prepend data can be an optimistic load</div><div class='ctx'>  * of a dentry name and length. And because we don't hold any</div><div class='ctx'>  * locks, the length and the pointer to the name may not be</div><div class='ctx'>  * in sync if a concurrent rename happens, and the kernel</div><div class='hunk'>@@ -240,9 +241,9 @@ static void get_fs_root_rcu(struct fs_struct *fs, struct path *root)</div><div class='ctx'> 	unsigned seq;</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='del'>-		seq = read_seqcount_begin(&amp;fs-&gt;seq);</div><div class='add'>+		seq = read_seqbegin(&amp;fs-&gt;seq);</div><div class='ctx'> 		*root = fs-&gt;root;</div><div class='del'>-	} while (read_seqcount_retry(&amp;fs-&gt;seq, seq));</div><div class='add'>+	} while (read_seqretry(&amp;fs-&gt;seq, seq));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -297,8 +298,7 @@ EXPORT_SYMBOL(d_path);</div><div class='ctx'> /*</div><div class='ctx'>  * Helper function for dentry_operations.d_dname() members</div><div class='ctx'>  */</div><div class='del'>-char *dynamic_dname(struct dentry *dentry, char *buffer, int buflen,</div><div class='del'>-			const char *fmt, ...)</div><div class='add'>+char *dynamic_dname(char *buffer, int buflen, const char *fmt, ...)</div><div class='ctx'> {</div><div class='ctx'> 	va_list args;</div><div class='ctx'> 	char temp[64];</div><div class='hunk'>@@ -385,10 +385,10 @@ static void get_fs_root_and_pwd_rcu(struct fs_struct *fs, struct path *root,</div><div class='ctx'> 	unsigned seq;</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='del'>-		seq = read_seqcount_begin(&amp;fs-&gt;seq);</div><div class='add'>+		seq = read_seqbegin(&amp;fs-&gt;seq);</div><div class='ctx'> 		*root = fs-&gt;root;</div><div class='ctx'> 		*pwd = fs-&gt;pwd;</div><div class='del'>-	} while (read_seqcount_retry(&amp;fs-&gt;seq, seq));</div><div class='add'>+	} while (read_seqretry(&amp;fs-&gt;seq, seq));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='head'>diff --git a/fs/dax.c b/fs/dax.c<br/>index 4e3e5a283a91..289e6254aa30 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dax.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dax.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dax.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dax.c</a></div><div class='hunk'>@@ -11,7 +11,6 @@</div><div class='ctx'> #include &lt;linux/buffer_head.h&gt;</div><div class='ctx'> #include &lt;linux/dax.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='del'>-#include &lt;linux/genhd.h&gt;</div><div class='ctx'> #include &lt;linux/highmem.h&gt;</div><div class='ctx'> #include &lt;linux/memcontrol.h&gt;</div><div class='ctx'> #include &lt;linux/mm.h&gt;</div><div class='hunk'>@@ -21,26 +20,15 @@</div><div class='ctx'> #include &lt;linux/sched/signal.h&gt;</div><div class='ctx'> #include &lt;linux/uio.h&gt;</div><div class='ctx'> #include &lt;linux/vmstat.h&gt;</div><div class='del'>-#include &lt;linux/pfn_t.h&gt;</div><div class='ctx'> #include &lt;linux/sizes.h&gt;</div><div class='ctx'> #include &lt;linux/mmu_notifier.h&gt;</div><div class='ctx'> #include &lt;linux/iomap.h&gt;</div><div class='del'>-#include &lt;asm/pgalloc.h&gt;</div><div class='add'>+#include &lt;linux/rmap.h&gt;</div><div class='add'>+#include &lt;linux/pgalloc.h&gt;</div><div class='ctx'> </div><div class='ctx'> #define CREATE_TRACE_POINTS</div><div class='ctx'> #include &lt;trace/events/fs_dax.h&gt;</div><div class='ctx'> </div><div class='del'>-static inline unsigned int pe_order(enum page_entry_size pe_size)</div><div class='del'>-{</div><div class='del'>-	if (pe_size == PE_SIZE_PTE)</div><div class='del'>-		return PAGE_SHIFT - PAGE_SHIFT;</div><div class='del'>-	if (pe_size == PE_SIZE_PMD)</div><div class='del'>-		return PMD_SHIFT - PAGE_SHIFT;</div><div class='del'>-	if (pe_size == PE_SIZE_PUD)</div><div class='del'>-		return PUD_SHIFT - PAGE_SHIFT;</div><div class='del'>-	return ~0;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /* We choose 4096 entries - same as per-zone page wait tables */</div><div class='ctx'> #define DAX_WAIT_TABLE_BITS 12</div><div class='ctx'> #define DAX_WAIT_TABLE_ENTRIES (1 &lt;&lt; DAX_WAIT_TABLE_BITS)</div><div class='hunk'>@@ -49,9 +37,6 @@ static inline unsigned int pe_order(enum page_entry_size pe_size)</div><div class='ctx'> #define PG_PMD_COLOUR	((PMD_SIZE &gt;&gt; PAGE_SHIFT) - 1)</div><div class='ctx'> #define PG_PMD_NR	(PMD_SIZE &gt;&gt; PAGE_SHIFT)</div><div class='ctx'> </div><div class='del'>-/* The order of a PMD entry */</div><div class='del'>-#define PMD_ORDER	(PMD_SHIFT - PAGE_SHIFT)</div><div class='del'>-</div><div class='ctx'> static wait_queue_head_t wait_table[DAX_WAIT_TABLE_ENTRIES];</div><div class='ctx'> </div><div class='ctx'> static int __init init_dax_wait_table(void)</div><div class='hunk'>@@ -85,9 +70,14 @@ static unsigned long dax_to_pfn(void *entry)</div><div class='ctx'> 	return xa_to_value(entry) &gt;&gt; DAX_SHIFT;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void *dax_make_entry(pfn_t pfn, unsigned long flags)</div><div class='add'>+static struct folio *dax_to_folio(void *entry)</div><div class='add'>+{</div><div class='add'>+	return page_folio(pfn_to_page(dax_to_pfn(entry)));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void *dax_make_entry(unsigned long pfn, unsigned long flags)</div><div class='ctx'> {</div><div class='del'>-	return xa_mk_value(flags | (pfn_t_to_pfn(pfn) &lt;&lt; DAX_SHIFT));</div><div class='add'>+	return xa_mk_value(flags | (pfn &lt;&lt; DAX_SHIFT));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool dax_is_locked(void *entry)</div><div class='hunk'>@@ -220,7 +210,7 @@ static void dax_wake_entry(struct xa_state *xas, void *entry,</div><div class='ctx'>  *</div><div class='ctx'>  * Must be called with the i_pages lock held.</div><div class='ctx'>  */</div><div class='del'>-static void *get_unlocked_entry(struct xa_state *xas, unsigned int order)</div><div class='add'>+static void *get_next_unlocked_entry(struct xa_state *xas, unsigned int order)</div><div class='ctx'> {</div><div class='ctx'> 	void *entry;</div><div class='ctx'> 	struct wait_exceptional_entry_queue ewait;</div><div class='hunk'>@@ -250,6 +240,37 @@ static void *get_unlocked_entry(struct xa_state *xas, unsigned int order)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * Wait for the given entry to become unlocked. Caller must hold the i_pages</div><div class='add'>+ * lock and call either put_unlocked_entry() if it did not lock the entry or</div><div class='add'>+ * dax_unlock_entry() if it did. Returns an unlocked entry if still present.</div><div class='add'>+ */</div><div class='add'>+static void *wait_entry_unlocked_exclusive(struct xa_state *xas, void *entry)</div><div class='add'>+{</div><div class='add'>+	struct wait_exceptional_entry_queue ewait;</div><div class='add'>+	wait_queue_head_t *wq;</div><div class='add'>+</div><div class='add'>+	init_wait(&amp;ewait.wait);</div><div class='add'>+	ewait.wait.func = wake_exceptional_entry_func;</div><div class='add'>+</div><div class='add'>+	while (unlikely(dax_is_locked(entry))) {</div><div class='add'>+		wq = dax_entry_waitqueue(xas, entry, &amp;ewait.key);</div><div class='add'>+		prepare_to_wait_exclusive(wq, &amp;ewait.wait,</div><div class='add'>+					TASK_UNINTERRUPTIBLE);</div><div class='add'>+		xas_reset(xas);</div><div class='add'>+		xas_unlock_irq(xas);</div><div class='add'>+		schedule();</div><div class='add'>+		finish_wait(wq, &amp;ewait.wait);</div><div class='add'>+		xas_lock_irq(xas);</div><div class='add'>+		entry = xas_load(xas);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (xa_is_internal(entry))</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	return entry;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * The only thing keeping the address space around is the i_pages lock</div><div class='ctx'>  * (it's cycled in clear_inode() after removing the entries from i_pages)</div><div class='ctx'>  * After we call xas_unlock_irq(), we cannot touch xas-&gt;xa.</div><div class='hunk'>@@ -264,7 +285,7 @@ static void wait_entry_unlocked(struct xa_state *xas, void *entry)</div><div class='ctx'> </div><div class='ctx'> 	wq = dax_entry_waitqueue(xas, entry, &amp;ewait.key);</div><div class='ctx'> 	/*</div><div class='del'>-	 * Unlike get_unlocked_entry() there is no guarantee that this</div><div class='add'>+	 * Unlike get_next_unlocked_entry() there is no guarantee that this</div><div class='ctx'> 	 * path ever successfully retrieves an unlocked entry before an</div><div class='ctx'> 	 * inode dies. Perform a non-exclusive wait in case this path</div><div class='ctx'> 	 * never successfully performs its own wake up.</div><div class='hunk'>@@ -321,91 +342,170 @@ static unsigned long dax_entry_size(void *entry)</div><div class='ctx'> 		return PAGE_SIZE;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static unsigned long dax_end_pfn(void *entry)</div><div class='add'>+/*</div><div class='add'>+ * A DAX folio is considered shared if it has no mapping set and -&gt;share (which</div><div class='add'>+ * shares the -&gt;index field) is non-zero. Note this may return false even if the</div><div class='add'>+ * page is shared between multiple files but has not yet actually been mapped</div><div class='add'>+ * into multiple address spaces.</div><div class='add'>+ */</div><div class='add'>+static inline bool dax_folio_is_shared(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	return dax_to_pfn(entry) + dax_entry_size(entry) / PAGE_SIZE;</div><div class='add'>+	return !folio-&gt;mapping &amp;&amp; folio-&gt;share;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Iterate through all mapped pfns represented by an entry, i.e. skip</div><div class='del'>- * 'empty' and 'zero' entries.</div><div class='add'>+ * When it is called by dax_insert_entry(), the shared flag will indicate</div><div class='add'>+ * whether this entry is shared by multiple files. If the page has not</div><div class='add'>+ * previously been associated with any mappings the -&gt;mapping and -&gt;index</div><div class='add'>+ * fields will be set. If it has already been associated with a mapping</div><div class='add'>+ * the mapping will be cleared and the share count set. It's then up to</div><div class='add'>+ * reverse map users like memory_failure() to call back into the filesystem to</div><div class='add'>+ * recover -&gt;mapping and -&gt;index information. For example by implementing</div><div class='add'>+ * dax_holder_operations.</div><div class='ctx'>  */</div><div class='del'>-#define for_each_mapped_pfn(entry, pfn) \</div><div class='del'>-	for (pfn = dax_to_pfn(entry); \</div><div class='del'>-			pfn &lt; dax_end_pfn(entry); pfn++)</div><div class='add'>+static void dax_folio_make_shared(struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	/*</div><div class='add'>+	 * folio is not currently shared so mark it as shared by clearing</div><div class='add'>+	 * folio-&gt;mapping.</div><div class='add'>+	 */</div><div class='add'>+	folio-&gt;mapping = NULL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * folio has previously been mapped into one address space so set the</div><div class='add'>+	 * share count.</div><div class='add'>+	 */</div><div class='add'>+	folio-&gt;share = 1;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline unsigned long dax_folio_put(struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	unsigned long ref;</div><div class='add'>+	int order, i;</div><div class='add'>+</div><div class='add'>+	if (!dax_folio_is_shared(folio))</div><div class='add'>+		ref = 0;</div><div class='add'>+	else</div><div class='add'>+		ref = --folio-&gt;share;</div><div class='add'>+</div><div class='add'>+	if (ref)</div><div class='add'>+		return ref;</div><div class='add'>+</div><div class='add'>+	folio-&gt;mapping = NULL;</div><div class='add'>+	order = folio_order(folio);</div><div class='add'>+	if (!order)</div><div class='add'>+		return 0;</div><div class='add'>+	folio_reset_order(folio);</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; (1UL &lt;&lt; order); i++) {</div><div class='add'>+		struct dev_pagemap *pgmap = page_pgmap(&amp;folio-&gt;page);</div><div class='add'>+		struct page *page = folio_page(folio, i);</div><div class='add'>+		struct folio *new_folio = (struct folio *)page;</div><div class='add'>+</div><div class='add'>+		ClearPageHead(page);</div><div class='add'>+		clear_compound_head(page);</div><div class='add'>+</div><div class='add'>+		new_folio-&gt;mapping = NULL;</div><div class='add'>+		/*</div><div class='add'>+		 * Reset pgmap which was over-written by</div><div class='add'>+		 * prep_compound_page().</div><div class='add'>+		 */</div><div class='add'>+		new_folio-&gt;pgmap = pgmap;</div><div class='add'>+		new_folio-&gt;share = 0;</div><div class='add'>+		WARN_ON_ONCE(folio_ref_count(new_folio));</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return ref;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void dax_folio_init(void *entry)</div><div class='add'>+{</div><div class='add'>+	struct folio *folio = dax_to_folio(entry);</div><div class='add'>+	int order = dax_entry_order(entry);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Folio should have been split back to order-0 pages in</div><div class='add'>+	 * dax_folio_put() when they were removed from their</div><div class='add'>+	 * final mapping.</div><div class='add'>+	 */</div><div class='add'>+	WARN_ON_ONCE(folio_order(folio));</div><div class='add'>+</div><div class='add'>+	if (order &gt; 0) {</div><div class='add'>+		prep_compound_page(&amp;folio-&gt;page, order);</div><div class='add'>+		if (order &gt; 1)</div><div class='add'>+			INIT_LIST_HEAD(&amp;folio-&gt;_deferred_list);</div><div class='add'>+		WARN_ON_ONCE(folio_ref_count(folio));</div><div class='add'>+	}</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * TODO: for reflink+dax we need a way to associate a single page with</div><div class='del'>- * multiple address_space instances at different linear_page_index()</div><div class='del'>- * offsets.</div><div class='del'>- */</div><div class='ctx'> static void dax_associate_entry(void *entry, struct address_space *mapping,</div><div class='del'>-		struct vm_area_struct *vma, unsigned long address)</div><div class='add'>+				struct vm_area_struct *vma,</div><div class='add'>+				unsigned long address, bool shared)</div><div class='ctx'> {</div><div class='del'>-	unsigned long size = dax_entry_size(entry), pfn, index;</div><div class='del'>-	int i = 0;</div><div class='add'>+	unsigned long size = dax_entry_size(entry), index;</div><div class='add'>+	struct folio *folio = dax_to_folio(entry);</div><div class='ctx'> </div><div class='del'>-	if (IS_ENABLED(CONFIG_FS_DAX_LIMITED))</div><div class='add'>+	if (dax_is_zero_entry(entry) || dax_is_empty_entry(entry))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	index = linear_page_index(vma, address &amp; ~(size - 1));</div><div class='del'>-	for_each_mapped_pfn(entry, pfn) {</div><div class='del'>-		struct page *page = pfn_to_page(pfn);</div><div class='add'>+	if (shared &amp;&amp; (folio-&gt;mapping || dax_folio_is_shared(folio))) {</div><div class='add'>+		if (folio-&gt;mapping)</div><div class='add'>+			dax_folio_make_shared(folio);</div><div class='ctx'> </div><div class='del'>-		WARN_ON_ONCE(page-&gt;mapping);</div><div class='del'>-		page-&gt;mapping = mapping;</div><div class='del'>-		page-&gt;index = index + i++;</div><div class='add'>+		WARN_ON_ONCE(!folio-&gt;share);</div><div class='add'>+		WARN_ON_ONCE(dax_entry_order(entry) != folio_order(folio));</div><div class='add'>+		folio-&gt;share++;</div><div class='add'>+	} else {</div><div class='add'>+		WARN_ON_ONCE(folio-&gt;mapping);</div><div class='add'>+		dax_folio_init(entry);</div><div class='add'>+		folio = dax_to_folio(entry);</div><div class='add'>+		folio-&gt;mapping = mapping;</div><div class='add'>+		folio-&gt;index = index;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void dax_disassociate_entry(void *entry, struct address_space *mapping,</div><div class='del'>-		bool trunc)</div><div class='add'>+				bool trunc)</div><div class='ctx'> {</div><div class='del'>-	unsigned long pfn;</div><div class='add'>+	struct folio *folio = dax_to_folio(entry);</div><div class='ctx'> </div><div class='del'>-	if (IS_ENABLED(CONFIG_FS_DAX_LIMITED))</div><div class='add'>+	if (dax_is_zero_entry(entry) || dax_is_empty_entry(entry))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	for_each_mapped_pfn(entry, pfn) {</div><div class='del'>-		struct page *page = pfn_to_page(pfn);</div><div class='del'>-</div><div class='del'>-		WARN_ON_ONCE(trunc &amp;&amp; page_ref_count(page) &gt; 1);</div><div class='del'>-		WARN_ON_ONCE(page-&gt;mapping &amp;&amp; page-&gt;mapping != mapping);</div><div class='del'>-		page-&gt;mapping = NULL;</div><div class='del'>-		page-&gt;index = 0;</div><div class='del'>-	}</div><div class='add'>+	dax_folio_put(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct page *dax_busy_page(void *entry)</div><div class='ctx'> {</div><div class='del'>-	unsigned long pfn;</div><div class='add'>+	struct folio *folio = dax_to_folio(entry);</div><div class='ctx'> </div><div class='del'>-	for_each_mapped_pfn(entry, pfn) {</div><div class='del'>-		struct page *page = pfn_to_page(pfn);</div><div class='add'>+	if (dax_is_zero_entry(entry) || dax_is_empty_entry(entry))</div><div class='add'>+		return NULL;</div><div class='ctx'> </div><div class='del'>-		if (page_ref_count(page) &gt; 1)</div><div class='del'>-			return page;</div><div class='del'>-	}</div><div class='del'>-	return NULL;</div><div class='add'>+	if (folio_ref_count(folio) - folio_mapcount(folio))</div><div class='add'>+		return &amp;folio-&gt;page;</div><div class='add'>+	else</div><div class='add'>+		return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * dax_lock_mapping_entry - Lock the DAX entry corresponding to a page</div><div class='del'>- * @page: The page whose entry we want to lock</div><div class='add'>+/**</div><div class='add'>+ * dax_lock_folio - Lock the DAX entry corresponding to a folio</div><div class='add'>+ * @folio: The folio whose entry we want to lock</div><div class='ctx'>  *</div><div class='ctx'>  * Context: Process context.</div><div class='del'>- * Return: A cookie to pass to dax_unlock_page() or 0 if the entry could</div><div class='add'>+ * Return: A cookie to pass to dax_unlock_folio() or 0 if the entry could</div><div class='ctx'>  * not be locked.</div><div class='ctx'>  */</div><div class='del'>-dax_entry_t dax_lock_page(struct page *page)</div><div class='add'>+dax_entry_t dax_lock_folio(struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	XA_STATE(xas, NULL, 0);</div><div class='ctx'> 	void *entry;</div><div class='ctx'> </div><div class='del'>-	/* Ensure page-&gt;mapping isn't freed while we look at it */</div><div class='add'>+	/* Ensure folio-&gt;mapping isn't freed while we look at it */</div><div class='ctx'> 	rcu_read_lock();</div><div class='ctx'> 	for (;;) {</div><div class='del'>-		struct address_space *mapping = READ_ONCE(page-&gt;mapping);</div><div class='add'>+		struct address_space *mapping = READ_ONCE(folio-&gt;mapping);</div><div class='ctx'> </div><div class='ctx'> 		entry = NULL;</div><div class='ctx'> 		if (!mapping || !dax_mapping(mapping))</div><div class='hunk'>@@ -424,11 +524,11 @@ dax_entry_t dax_lock_page(struct page *page)</div><div class='ctx'> </div><div class='ctx'> 		xas.xa = &amp;mapping-&gt;i_pages;</div><div class='ctx'> 		xas_lock_irq(&amp;xas);</div><div class='del'>-		if (mapping != page-&gt;mapping) {</div><div class='add'>+		if (mapping != folio-&gt;mapping) {</div><div class='ctx'> 			xas_unlock_irq(&amp;xas);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='del'>-		xas_set(&amp;xas, page-&gt;index);</div><div class='add'>+		xas_set(&amp;xas, folio-&gt;index);</div><div class='ctx'> 		entry = xas_load(&amp;xas);</div><div class='ctx'> 		if (dax_is_locked(entry)) {</div><div class='ctx'> 			rcu_read_unlock();</div><div class='hunk'>@@ -444,10 +544,10 @@ dax_entry_t dax_lock_page(struct page *page)</div><div class='ctx'> 	return (dax_entry_t)entry;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void dax_unlock_page(struct page *page, dax_entry_t cookie)</div><div class='add'>+void dax_unlock_folio(struct folio *folio, dax_entry_t cookie)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *mapping = page-&gt;mapping;</div><div class='del'>-	XA_STATE(xas, &amp;mapping-&gt;i_pages, page-&gt;index);</div><div class='add'>+	struct address_space *mapping = folio-&gt;mapping;</div><div class='add'>+	XA_STATE(xas, &amp;mapping-&gt;i_pages, folio-&gt;index);</div><div class='ctx'> </div><div class='ctx'> 	if (S_ISCHR(mapping-&gt;host-&gt;i_mode))</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -456,6 +556,69 @@ void dax_unlock_page(struct page *page, dax_entry_t cookie)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * dax_lock_mapping_entry - Lock the DAX entry corresponding to a mapping</div><div class='add'>+ * @mapping: the file's mapping whose entry we want to lock</div><div class='add'>+ * @index: the offset within this file</div><div class='add'>+ * @page: output the dax page corresponding to this dax entry</div><div class='add'>+ *</div><div class='add'>+ * Return: A cookie to pass to dax_unlock_mapping_entry() or 0 if the entry</div><div class='add'>+ * could not be locked.</div><div class='add'>+ */</div><div class='add'>+dax_entry_t dax_lock_mapping_entry(struct address_space *mapping, pgoff_t index,</div><div class='add'>+		struct page **page)</div><div class='add'>+{</div><div class='add'>+	XA_STATE(xas, NULL, 0);</div><div class='add'>+	void *entry;</div><div class='add'>+</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	for (;;) {</div><div class='add'>+		entry = NULL;</div><div class='add'>+		if (!dax_mapping(mapping))</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		xas.xa = &amp;mapping-&gt;i_pages;</div><div class='add'>+		xas_lock_irq(&amp;xas);</div><div class='add'>+		xas_set(&amp;xas, index);</div><div class='add'>+		entry = xas_load(&amp;xas);</div><div class='add'>+		if (dax_is_locked(entry)) {</div><div class='add'>+			rcu_read_unlock();</div><div class='add'>+			wait_entry_unlocked(&amp;xas, entry);</div><div class='add'>+			rcu_read_lock();</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+		if (!entry ||</div><div class='add'>+		    dax_is_zero_entry(entry) || dax_is_empty_entry(entry)) {</div><div class='add'>+			/*</div><div class='add'>+			 * Because we are looking for entry from file's mapping</div><div class='add'>+			 * and index, so the entry may not be inserted for now,</div><div class='add'>+			 * or even a zero/empty entry.  We don't think this is</div><div class='add'>+			 * an error case.  So, return a special value and do</div><div class='add'>+			 * not output @page.</div><div class='add'>+			 */</div><div class='add'>+			entry = (void *)~0UL;</div><div class='add'>+		} else {</div><div class='add'>+			*page = pfn_to_page(dax_to_pfn(entry));</div><div class='add'>+			dax_lock_entry(&amp;xas, entry);</div><div class='add'>+		}</div><div class='add'>+		xas_unlock_irq(&amp;xas);</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+	return (dax_entry_t)entry;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void dax_unlock_mapping_entry(struct address_space *mapping, pgoff_t index,</div><div class='add'>+		dax_entry_t cookie)</div><div class='add'>+{</div><div class='add'>+	XA_STATE(xas, &amp;mapping-&gt;i_pages, index);</div><div class='add'>+</div><div class='add'>+	if (cookie == ~0UL)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	dax_unlock_entry(&amp;xas, (void *)cookie);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * Find page cache entry at given index. If it is a DAX entry, return it</div><div class='ctx'>  * with the entry locked. If the page cache doesn't contain an entry at</div><div class='ctx'>  * that index, add a locked empty entry.</div><div class='hunk'>@@ -494,7 +657,7 @@ static void *grab_mapping_entry(struct xa_state *xas,</div><div class='ctx'> retry:</div><div class='ctx'> 	pmd_downgrade = false;</div><div class='ctx'> 	xas_lock_irq(xas);</div><div class='del'>-	entry = get_unlocked_entry(xas, order);</div><div class='add'>+	entry = get_next_unlocked_entry(xas, order);</div><div class='ctx'> </div><div class='ctx'> 	if (entry) {</div><div class='ctx'> 		if (dax_is_conflict(entry))</div><div class='hunk'>@@ -549,7 +712,7 @@ retry:</div><div class='ctx'> </div><div class='ctx'> 		if (order &gt; 0)</div><div class='ctx'> 			flags |= DAX_PMD;</div><div class='del'>-		entry = dax_make_entry(pfn_to_pfn_t(0), flags);</div><div class='add'>+		entry = dax_make_entry(0, flags);</div><div class='ctx'> 		dax_lock_entry(xas, entry);</div><div class='ctx'> 		if (xas_error(xas))</div><div class='ctx'> 			goto out_unlock;</div><div class='hunk'>@@ -598,13 +761,7 @@ struct page *dax_layout_busy_page_range(struct address_space *mapping,</div><div class='ctx'> 	pgoff_t end_idx;</div><div class='ctx'> 	XA_STATE(xas, &amp;mapping-&gt;i_pages, start_idx);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * In the 'limited' case get_user_pages() for dax is disabled.</div><div class='del'>-	 */</div><div class='del'>-	if (IS_ENABLED(CONFIG_FS_DAX_LIMITED))</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	if (!dax_mapping(mapping) || !mapping_mapped(mapping))</div><div class='add'>+	if (!dax_mapping(mapping))</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='ctx'> 	/* If end == LLONG_MAX, all pages from start to till end of file */</div><div class='hunk'>@@ -630,8 +787,7 @@ struct page *dax_layout_busy_page_range(struct address_space *mapping,</div><div class='ctx'> 	xas_for_each(&amp;xas, entry, end_idx) {</div><div class='ctx'> 		if (WARN_ON_ONCE(!xa_is_value(entry)))</div><div class='ctx'> 			continue;</div><div class='del'>-		if (unlikely(dax_is_locked(entry)))</div><div class='del'>-			entry = get_unlocked_entry(&amp;xas, 0);</div><div class='add'>+		entry = wait_entry_unlocked_exclusive(&amp;xas, entry);</div><div class='ctx'> 		if (entry)</div><div class='ctx'> 			page = dax_busy_page(entry);</div><div class='ctx'> 		put_unlocked_entry(&amp;xas, entry, WAKE_NEXT);</div><div class='hunk'>@@ -657,14 +813,14 @@ struct page *dax_layout_busy_page(struct address_space *mapping)</div><div class='ctx'> EXPORT_SYMBOL_GPL(dax_layout_busy_page);</div><div class='ctx'> </div><div class='ctx'> static int __dax_invalidate_entry(struct address_space *mapping,</div><div class='del'>-					  pgoff_t index, bool trunc)</div><div class='add'>+				  pgoff_t index, bool trunc)</div><div class='ctx'> {</div><div class='ctx'> 	XA_STATE(xas, &amp;mapping-&gt;i_pages, index);</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	void *entry;</div><div class='ctx'> </div><div class='ctx'> 	xas_lock_irq(&amp;xas);</div><div class='del'>-	entry = get_unlocked_entry(&amp;xas, 0);</div><div class='add'>+	entry = get_next_unlocked_entry(&amp;xas, 0);</div><div class='ctx'> 	if (!entry || WARN_ON_ONCE(!xa_is_value(entry)))</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	if (!trunc &amp;&amp;</div><div class='hunk'>@@ -681,6 +837,35 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int __dax_clear_dirty_range(struct address_space *mapping,</div><div class='add'>+		pgoff_t start, pgoff_t end)</div><div class='add'>+{</div><div class='add'>+	XA_STATE(xas, &amp;mapping-&gt;i_pages, start);</div><div class='add'>+	unsigned int scanned = 0;</div><div class='add'>+	void *entry;</div><div class='add'>+</div><div class='add'>+	xas_lock_irq(&amp;xas);</div><div class='add'>+	xas_for_each(&amp;xas, entry, end) {</div><div class='add'>+		entry = wait_entry_unlocked_exclusive(&amp;xas, entry);</div><div class='add'>+		if (!entry)</div><div class='add'>+			continue;</div><div class='add'>+		xas_clear_mark(&amp;xas, PAGECACHE_TAG_DIRTY);</div><div class='add'>+		xas_clear_mark(&amp;xas, PAGECACHE_TAG_TOWRITE);</div><div class='add'>+		put_unlocked_entry(&amp;xas, entry, WAKE_NEXT);</div><div class='add'>+</div><div class='add'>+		if (++scanned % XA_CHECK_SCHED)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		xas_pause(&amp;xas);</div><div class='add'>+		xas_unlock_irq(&amp;xas);</div><div class='add'>+		cond_resched();</div><div class='add'>+		xas_lock_irq(&amp;xas);</div><div class='add'>+	}</div><div class='add'>+	xas_unlock_irq(&amp;xas);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Delete DAX entry at @index from @mapping.  Wait for it</div><div class='ctx'>  * to be unlocked before deleting it.</div><div class='hunk'>@@ -700,6 +885,107 @@ int dax_delete_mapping_entry(struct address_space *mapping, pgoff_t index)</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void dax_delete_mapping_range(struct address_space *mapping,</div><div class='add'>+				loff_t start, loff_t end)</div><div class='add'>+{</div><div class='add'>+	void *entry;</div><div class='add'>+	pgoff_t start_idx = start &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	pgoff_t end_idx;</div><div class='add'>+	XA_STATE(xas, &amp;mapping-&gt;i_pages, start_idx);</div><div class='add'>+</div><div class='add'>+	/* If end == LLONG_MAX, all pages from start to till end of file */</div><div class='add'>+	if (end == LLONG_MAX)</div><div class='add'>+		end_idx = ULONG_MAX;</div><div class='add'>+	else</div><div class='add'>+		end_idx = end &gt;&gt; PAGE_SHIFT;</div><div class='add'>+</div><div class='add'>+	xas_lock_irq(&amp;xas);</div><div class='add'>+	xas_for_each(&amp;xas, entry, end_idx) {</div><div class='add'>+		if (!xa_is_value(entry))</div><div class='add'>+			continue;</div><div class='add'>+		entry = wait_entry_unlocked_exclusive(&amp;xas, entry);</div><div class='add'>+		if (!entry)</div><div class='add'>+			continue;</div><div class='add'>+		dax_disassociate_entry(entry, mapping, true);</div><div class='add'>+		xas_store(&amp;xas, NULL);</div><div class='add'>+		mapping-&gt;nrpages -= 1UL &lt;&lt; dax_entry_order(entry);</div><div class='add'>+		put_unlocked_entry(&amp;xas, entry, WAKE_ALL);</div><div class='add'>+	}</div><div class='add'>+	xas_unlock_irq(&amp;xas);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(dax_delete_mapping_range);</div><div class='add'>+</div><div class='add'>+static int wait_page_idle(struct page *page,</div><div class='add'>+			void (cb)(struct inode *),</div><div class='add'>+			struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	return ___wait_var_event(page, dax_page_is_idle(page),</div><div class='add'>+				TASK_INTERRUPTIBLE, 0, 0, cb(inode));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void wait_page_idle_uninterruptible(struct page *page,</div><div class='add'>+					struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	___wait_var_event(page, dax_page_is_idle(page),</div><div class='add'>+			TASK_UNINTERRUPTIBLE, 0, 0, schedule());</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Unmaps the inode and waits for any DMA to complete prior to deleting the</div><div class='add'>+ * DAX mapping entries for the range.</div><div class='add'>+ *</div><div class='add'>+ * For NOWAIT behavior, pass @cb as NULL to early-exit on first found</div><div class='add'>+ * busy page</div><div class='add'>+ */</div><div class='add'>+int dax_break_layout(struct inode *inode, loff_t start, loff_t end,</div><div class='add'>+		void (cb)(struct inode *))</div><div class='add'>+{</div><div class='add'>+	struct page *page;</div><div class='add'>+	int error = 0;</div><div class='add'>+</div><div class='add'>+	if (!dax_mapping(inode-&gt;i_mapping))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		page = dax_layout_busy_page_range(inode-&gt;i_mapping, start, end);</div><div class='add'>+		if (!page)</div><div class='add'>+			break;</div><div class='add'>+		if (!cb) {</div><div class='add'>+			error = -ERESTARTSYS;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		error = wait_page_idle(page, cb, inode);</div><div class='add'>+	} while (error == 0);</div><div class='add'>+</div><div class='add'>+	if (!page)</div><div class='add'>+		dax_delete_mapping_range(inode-&gt;i_mapping, start, end);</div><div class='add'>+</div><div class='add'>+	return error;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(dax_break_layout);</div><div class='add'>+</div><div class='add'>+void dax_break_layout_final(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct page *page;</div><div class='add'>+</div><div class='add'>+	if (!dax_mapping(inode-&gt;i_mapping))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		page = dax_layout_busy_page_range(inode-&gt;i_mapping, 0,</div><div class='add'>+						LLONG_MAX);</div><div class='add'>+		if (!page)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		wait_page_idle_uninterruptible(page, inode);</div><div class='add'>+	} while (true);</div><div class='add'>+</div><div class='add'>+	if (!page)</div><div class='add'>+		dax_delete_mapping_range(inode-&gt;i_mapping, 0, LLONG_MAX);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(dax_break_layout_final);</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Invalidate DAX entry if it is clean.</div><div class='ctx'>  */</div><div class='hunk'>@@ -709,48 +995,64 @@ int dax_invalidate_mapping_entry_sync(struct address_space *mapping,</div><div class='ctx'> 	return __dax_invalidate_entry(mapping, index, false);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int copy_cow_page_dax(struct block_device *bdev, struct dax_device *dax_dev,</div><div class='del'>-			     sector_t sector, struct page *to, unsigned long vaddr)</div><div class='add'>+static pgoff_t dax_iomap_pgoff(const struct iomap *iomap, loff_t pos)</div><div class='add'>+{</div><div class='add'>+	return PHYS_PFN(iomap-&gt;addr + (pos &amp; PAGE_MASK) - iomap-&gt;offset);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int copy_cow_page_dax(struct vm_fault *vmf, const struct iomap_iter *iter)</div><div class='ctx'> {</div><div class='add'>+	pgoff_t pgoff = dax_iomap_pgoff(&amp;iter-&gt;iomap, iter-&gt;pos);</div><div class='ctx'> 	void *vto, *kaddr;</div><div class='del'>-	pgoff_t pgoff;</div><div class='ctx'> 	long rc;</div><div class='ctx'> 	int id;</div><div class='ctx'> </div><div class='del'>-	rc = bdev_dax_pgoff(bdev, sector, PAGE_SIZE, &amp;pgoff);</div><div class='del'>-	if (rc)</div><div class='del'>-		return rc;</div><div class='del'>-</div><div class='ctx'> 	id = dax_read_lock();</div><div class='del'>-	rc = dax_direct_access(dax_dev, pgoff, 1, &amp;kaddr, NULL);</div><div class='add'>+	rc = dax_direct_access(iter-&gt;iomap.dax_dev, pgoff, 1, DAX_ACCESS,</div><div class='add'>+				&amp;kaddr, NULL);</div><div class='ctx'> 	if (rc &lt; 0) {</div><div class='ctx'> 		dax_read_unlock(id);</div><div class='ctx'> 		return rc;</div><div class='ctx'> 	}</div><div class='del'>-	vto = kmap_atomic(to);</div><div class='del'>-	copy_user_page(vto, (void __force *)kaddr, vaddr, to);</div><div class='add'>+	vto = kmap_atomic(vmf-&gt;cow_page);</div><div class='add'>+	copy_user_page(vto, kaddr, vmf-&gt;address, vmf-&gt;cow_page);</div><div class='ctx'> 	kunmap_atomic(vto);</div><div class='ctx'> 	dax_read_unlock(id);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * MAP_SYNC on a dax mapping guarantees dirty metadata is</div><div class='add'>+ * flushed on write-faults (non-cow), but not read-faults.</div><div class='add'>+ */</div><div class='add'>+static bool dax_fault_is_synchronous(const struct iomap_iter *iter,</div><div class='add'>+		struct vm_area_struct *vma)</div><div class='add'>+{</div><div class='add'>+	return (iter-&gt;flags &amp; IOMAP_WRITE) &amp;&amp; (vma-&gt;vm_flags &amp; VM_SYNC) &amp;&amp;</div><div class='add'>+		(iter-&gt;iomap.flags &amp; IOMAP_F_DIRTY);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * By this point grab_mapping_entry() has ensured that we have a locked entry</div><div class='ctx'>  * of the appropriate size so we don't have to worry about downgrading PMDs to</div><div class='ctx'>  * PTEs.  If we happen to be trying to insert a PTE and there is a PMD</div><div class='ctx'>  * already in the tree, we will skip the insertion and just dirty the PMD as</div><div class='ctx'>  * appropriate.</div><div class='ctx'>  */</div><div class='del'>-static void *dax_insert_entry(struct xa_state *xas,</div><div class='del'>-		struct address_space *mapping, struct vm_fault *vmf,</div><div class='del'>-		void *entry, pfn_t pfn, unsigned long flags, bool dirty)</div><div class='add'>+static void *dax_insert_entry(struct xa_state *xas, struct vm_fault *vmf,</div><div class='add'>+		const struct iomap_iter *iter, void *entry, unsigned long pfn,</div><div class='add'>+		unsigned long flags)</div><div class='ctx'> {</div><div class='add'>+	struct address_space *mapping = vmf-&gt;vma-&gt;vm_file-&gt;f_mapping;</div><div class='ctx'> 	void *new_entry = dax_make_entry(pfn, flags);</div><div class='add'>+	bool write = iter-&gt;flags &amp; IOMAP_WRITE;</div><div class='add'>+	bool dirty = write &amp;&amp; !dax_fault_is_synchronous(iter, vmf-&gt;vma);</div><div class='add'>+	bool shared = iter-&gt;iomap.flags &amp; IOMAP_F_SHARED;</div><div class='ctx'> </div><div class='ctx'> 	if (dirty)</div><div class='ctx'> 		__mark_inode_dirty(mapping-&gt;host, I_DIRTY_PAGES);</div><div class='ctx'> </div><div class='del'>-	if (dax_is_zero_entry(entry) &amp;&amp; !(flags &amp; DAX_ZERO_PAGE)) {</div><div class='add'>+	if (shared || (dax_is_zero_entry(entry) &amp;&amp; !(flags &amp; DAX_ZERO_PAGE))) {</div><div class='ctx'> 		unsigned long index = xas-&gt;xa_index;</div><div class='ctx'> 		/* we are replacing a zero page with block mapping */</div><div class='ctx'> 		if (dax_is_pmd_entry(entry))</div><div class='hunk'>@@ -762,11 +1064,13 @@ static void *dax_insert_entry(struct xa_state *xas,</div><div class='ctx'> </div><div class='ctx'> 	xas_reset(xas);</div><div class='ctx'> 	xas_lock_irq(xas);</div><div class='del'>-	if (dax_is_zero_entry(entry) || dax_is_empty_entry(entry)) {</div><div class='add'>+	if (shared || dax_is_zero_entry(entry) || dax_is_empty_entry(entry)) {</div><div class='ctx'> 		void *old;</div><div class='ctx'> </div><div class='ctx'> 		dax_disassociate_entry(entry, mapping, false);</div><div class='del'>-		dax_associate_entry(new_entry, mapping, vmf-&gt;vma, vmf-&gt;address);</div><div class='add'>+		dax_associate_entry(new_entry, mapping, vmf-&gt;vma,</div><div class='add'>+					vmf-&gt;address, shared);</div><div class='add'>+</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Only swap our new entry into the page cache if the current</div><div class='ctx'> 		 * entry is a zero page or an empty entry.  If a normal PTE or</div><div class='hunk'>@@ -786,99 +1090,19 @@ static void *dax_insert_entry(struct xa_state *xas,</div><div class='ctx'> 	if (dirty)</div><div class='ctx'> 		xas_set_mark(xas, PAGECACHE_TAG_DIRTY);</div><div class='ctx'> </div><div class='add'>+	if (write &amp;&amp; shared)</div><div class='add'>+		xas_set_mark(xas, PAGECACHE_TAG_TOWRITE);</div><div class='add'>+</div><div class='ctx'> 	xas_unlock_irq(xas);</div><div class='ctx'> 	return entry;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline</div><div class='del'>-unsigned long pgoff_address(pgoff_t pgoff, struct vm_area_struct *vma)</div><div class='del'>-{</div><div class='del'>-	unsigned long address;</div><div class='del'>-</div><div class='del'>-	address = vma-&gt;vm_start + ((pgoff - vma-&gt;vm_pgoff) &lt;&lt; PAGE_SHIFT);</div><div class='del'>-	VM_BUG_ON_VMA(address &lt; vma-&gt;vm_start || address &gt;= vma-&gt;vm_end, vma);</div><div class='del'>-	return address;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* Walk all mappings of a given index of a file and writeprotect them */</div><div class='del'>-static void dax_entry_mkclean(struct address_space *mapping, pgoff_t index,</div><div class='del'>-		unsigned long pfn)</div><div class='del'>-{</div><div class='del'>-	struct vm_area_struct *vma;</div><div class='del'>-	pte_t pte, *ptep = NULL;</div><div class='del'>-	pmd_t *pmdp = NULL;</div><div class='del'>-	spinlock_t *ptl;</div><div class='del'>-</div><div class='del'>-	i_mmap_lock_read(mapping);</div><div class='del'>-	vma_interval_tree_foreach(vma, &amp;mapping-&gt;i_mmap, index, index) {</div><div class='del'>-		struct mmu_notifier_range range;</div><div class='del'>-		unsigned long address;</div><div class='del'>-</div><div class='del'>-		cond_resched();</div><div class='del'>-</div><div class='del'>-		if (!(vma-&gt;vm_flags &amp; VM_SHARED))</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		address = pgoff_address(index, vma);</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * follow_invalidate_pte() will use the range to call</div><div class='del'>-		 * mmu_notifier_invalidate_range_start() on our behalf before</div><div class='del'>-		 * taking any lock.</div><div class='del'>-		 */</div><div class='del'>-		if (follow_invalidate_pte(vma-&gt;vm_mm, address, &amp;range, &amp;ptep,</div><div class='del'>-					  &amp;pmdp, &amp;ptl))</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * No need to call mmu_notifier_invalidate_range() as we are</div><div class='del'>-		 * downgrading page table protection not changing it to point</div><div class='del'>-		 * to a new page.</div><div class='del'>-		 *</div><div class='del'>-		 * See Documentation/vm/mmu_notifier.rst</div><div class='del'>-		 */</div><div class='del'>-		if (pmdp) {</div><div class='del'>-#ifdef CONFIG_FS_DAX_PMD</div><div class='del'>-			pmd_t pmd;</div><div class='del'>-</div><div class='del'>-			if (pfn != pmd_pfn(*pmdp))</div><div class='del'>-				goto unlock_pmd;</div><div class='del'>-			if (!pmd_dirty(*pmdp) &amp;&amp; !pmd_write(*pmdp))</div><div class='del'>-				goto unlock_pmd;</div><div class='del'>-</div><div class='del'>-			flush_cache_page(vma, address, pfn);</div><div class='del'>-			pmd = pmdp_invalidate(vma, address, pmdp);</div><div class='del'>-			pmd = pmd_wrprotect(pmd);</div><div class='del'>-			pmd = pmd_mkclean(pmd);</div><div class='del'>-			set_pmd_at(vma-&gt;vm_mm, address, pmdp, pmd);</div><div class='del'>-unlock_pmd:</div><div class='del'>-#endif</div><div class='del'>-			spin_unlock(ptl);</div><div class='del'>-		} else {</div><div class='del'>-			if (pfn != pte_pfn(*ptep))</div><div class='del'>-				goto unlock_pte;</div><div class='del'>-			if (!pte_dirty(*ptep) &amp;&amp; !pte_write(*ptep))</div><div class='del'>-				goto unlock_pte;</div><div class='del'>-</div><div class='del'>-			flush_cache_page(vma, address, pfn);</div><div class='del'>-			pte = ptep_clear_flush(vma, address, ptep);</div><div class='del'>-			pte = pte_wrprotect(pte);</div><div class='del'>-			pte = pte_mkclean(pte);</div><div class='del'>-			set_pte_at(vma-&gt;vm_mm, address, ptep, pte);</div><div class='del'>-unlock_pte:</div><div class='del'>-			pte_unmap_unlock(ptep, ptl);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		mmu_notifier_invalidate_range_end(&amp;range);</div><div class='del'>-	}</div><div class='del'>-	i_mmap_unlock_read(mapping);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int dax_writeback_one(struct xa_state *xas, struct dax_device *dax_dev,</div><div class='ctx'> 		struct address_space *mapping, void *entry)</div><div class='ctx'> {</div><div class='del'>-	unsigned long pfn, index, count;</div><div class='add'>+	unsigned long pfn, index, count, end;</div><div class='ctx'> 	long ret = 0;</div><div class='add'>+	struct vm_area_struct *vma;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * A page got tagged dirty in DAX mapping? Something is seriously</div><div class='hunk'>@@ -890,7 +1114,7 @@ static int dax_writeback_one(struct xa_state *xas, struct dax_device *dax_dev,</div><div class='ctx'> 	if (unlikely(dax_is_locked(entry))) {</div><div class='ctx'> 		void *old_entry = entry;</div><div class='ctx'> </div><div class='del'>-		entry = get_unlocked_entry(xas, 0);</div><div class='add'>+		entry = get_next_unlocked_entry(xas, 0);</div><div class='ctx'> </div><div class='ctx'> 		/* Entry got punched out / reallocated? */</div><div class='ctx'> 		if (!entry || WARN_ON_ONCE(!xa_is_value(entry)))</div><div class='hunk'>@@ -936,8 +1160,16 @@ static int dax_writeback_one(struct xa_state *xas, struct dax_device *dax_dev,</div><div class='ctx'> 	pfn = dax_to_pfn(entry);</div><div class='ctx'> 	count = 1UL &lt;&lt; dax_entry_order(entry);</div><div class='ctx'> 	index = xas-&gt;xa_index &amp; ~(count - 1);</div><div class='add'>+	end = index + count - 1;</div><div class='add'>+</div><div class='add'>+	/* Walk all mappings of a given index of a file and writeprotect them */</div><div class='add'>+	i_mmap_lock_read(mapping);</div><div class='add'>+	vma_interval_tree_foreach(vma, &amp;mapping-&gt;i_mmap, index, end) {</div><div class='add'>+		pfn_mkclean_range(pfn, count, index, vma);</div><div class='add'>+		cond_resched();</div><div class='add'>+	}</div><div class='add'>+	i_mmap_unlock_read(mapping);</div><div class='ctx'> </div><div class='del'>-	dax_entry_mkclean(mapping, index, pfn);</div><div class='ctx'> 	dax_flush(dax_dev, page_address(pfn_to_page(pfn)), count * PAGE_SIZE);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * After we have flushed the cache, we can clear the dirty tag. There</div><div class='hunk'>@@ -1005,43 +1237,117 @@ int dax_writeback_mapping_range(struct address_space *mapping,</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(dax_writeback_mapping_range);</div><div class='ctx'> </div><div class='del'>-static sector_t dax_iomap_sector(const struct iomap *iomap, loff_t pos)</div><div class='add'>+static int dax_iomap_direct_access(const struct iomap *iomap, loff_t pos,</div><div class='add'>+		size_t size, void **kaddr, unsigned long *pfnp)</div><div class='ctx'> {</div><div class='del'>-	return (iomap-&gt;addr + (pos &amp; PAGE_MASK) - iomap-&gt;offset) &gt;&gt; 9;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int dax_iomap_pfn(const struct iomap *iomap, loff_t pos, size_t size,</div><div class='del'>-			 pfn_t *pfnp)</div><div class='del'>-{</div><div class='del'>-	const sector_t sector = dax_iomap_sector(iomap, pos);</div><div class='del'>-	pgoff_t pgoff;</div><div class='del'>-	int id, rc;</div><div class='add'>+	pgoff_t pgoff = dax_iomap_pgoff(iomap, pos);</div><div class='add'>+	int id, rc = 0;</div><div class='ctx'> 	long length;</div><div class='ctx'> </div><div class='del'>-	rc = bdev_dax_pgoff(iomap-&gt;bdev, sector, size, &amp;pgoff);</div><div class='del'>-	if (rc)</div><div class='del'>-		return rc;</div><div class='ctx'> 	id = dax_read_lock();</div><div class='ctx'> 	length = dax_direct_access(iomap-&gt;dax_dev, pgoff, PHYS_PFN(size),</div><div class='del'>-				   NULL, pfnp);</div><div class='add'>+				   DAX_ACCESS, kaddr, pfnp);</div><div class='ctx'> 	if (length &lt; 0) {</div><div class='ctx'> 		rc = length;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='add'>+	if (!pfnp)</div><div class='add'>+		goto out_check_addr;</div><div class='ctx'> 	rc = -EINVAL;</div><div class='ctx'> 	if (PFN_PHYS(length) &lt; size)</div><div class='ctx'> 		goto out;</div><div class='del'>-	if (pfn_t_to_pfn(*pfnp) &amp; (PHYS_PFN(size)-1))</div><div class='del'>-		goto out;</div><div class='del'>-	/* For larger pages we need devmap */</div><div class='del'>-	if (length &gt; 1 &amp;&amp; !pfn_t_devmap(*pfnp))</div><div class='add'>+	if (*pfnp &amp; (PHYS_PFN(size)-1))</div><div class='ctx'> 		goto out;</div><div class='add'>+</div><div class='ctx'> 	rc = 0;</div><div class='add'>+</div><div class='add'>+out_check_addr:</div><div class='add'>+	if (!kaddr)</div><div class='add'>+		goto out;</div><div class='add'>+	if (!*kaddr)</div><div class='add'>+		rc = -EFAULT;</div><div class='ctx'> out:</div><div class='ctx'> 	dax_read_unlock(id);</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * dax_iomap_copy_around - Prepare for an unaligned write to a shared/cow page</div><div class='add'>+ * by copying the data before and after the range to be written.</div><div class='add'>+ * @pos:	address to do copy from.</div><div class='add'>+ * @length:	size of copy operation.</div><div class='add'>+ * @align_size:	aligned w.r.t align_size (either PMD_SIZE or PAGE_SIZE)</div><div class='add'>+ * @srcmap:	iomap srcmap</div><div class='add'>+ * @daddr:	destination address to copy to.</div><div class='add'>+ *</div><div class='add'>+ * This can be called from two places. Either during DAX write fault (page</div><div class='add'>+ * aligned), to copy the length size data to daddr. Or, while doing normal DAX</div><div class='add'>+ * write operation, dax_iomap_iter() might call this to do the copy of either</div><div class='add'>+ * start or end unaligned address. In the latter case the rest of the copy of</div><div class='add'>+ * aligned ranges is taken care by dax_iomap_iter() itself.</div><div class='add'>+ * If the srcmap contains invalid data, such as HOLE and UNWRITTEN, zero the</div><div class='add'>+ * area to make sure no old data remains.</div><div class='add'>+ */</div><div class='add'>+static int dax_iomap_copy_around(loff_t pos, uint64_t length, size_t align_size,</div><div class='add'>+		const struct iomap *srcmap, void *daddr)</div><div class='add'>+{</div><div class='add'>+	loff_t head_off = pos &amp; (align_size - 1);</div><div class='add'>+	size_t size = ALIGN(head_off + length, align_size);</div><div class='add'>+	loff_t end = pos + length;</div><div class='add'>+	loff_t pg_end = round_up(end, align_size);</div><div class='add'>+	/* copy_all is usually in page fault case */</div><div class='add'>+	bool copy_all = head_off == 0 &amp;&amp; end == pg_end;</div><div class='add'>+	/* zero the edges if srcmap is a HOLE or IOMAP_UNWRITTEN */</div><div class='add'>+	bool zero_edge = srcmap-&gt;flags &amp; IOMAP_F_SHARED ||</div><div class='add'>+			 srcmap-&gt;type == IOMAP_UNWRITTEN;</div><div class='add'>+	void *saddr = NULL;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	if (!zero_edge) {</div><div class='add'>+		ret = dax_iomap_direct_access(srcmap, pos, size, &amp;saddr, NULL);</div><div class='add'>+		if (ret)</div><div class='add'>+			return dax_mem2blk_err(ret);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (copy_all) {</div><div class='add'>+		if (zero_edge)</div><div class='add'>+			memset(daddr, 0, size);</div><div class='add'>+		else</div><div class='add'>+			ret = copy_mc_to_kernel(daddr, saddr, length);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Copy the head part of the range */</div><div class='add'>+	if (head_off) {</div><div class='add'>+		if (zero_edge)</div><div class='add'>+			memset(daddr, 0, head_off);</div><div class='add'>+		else {</div><div class='add'>+			ret = copy_mc_to_kernel(daddr, saddr, head_off);</div><div class='add'>+			if (ret)</div><div class='add'>+				return -EIO;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Copy the tail part of the range */</div><div class='add'>+	if (end &lt; pg_end) {</div><div class='add'>+		loff_t tail_off = head_off + length;</div><div class='add'>+		loff_t tail_len = pg_end - end;</div><div class='add'>+</div><div class='add'>+		if (zero_edge)</div><div class='add'>+			memset(daddr + tail_off, 0, tail_len);</div><div class='add'>+		else {</div><div class='add'>+			ret = copy_mc_to_kernel(daddr + tail_off,</div><div class='add'>+						saddr + tail_off, tail_len);</div><div class='add'>+			if (ret)</div><div class='add'>+				return -EIO;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='add'>+	if (zero_edge)</div><div class='add'>+		dax_flush(srcmap-&gt;dax_dev, daddr, size);</div><div class='add'>+	return ret ? -EIO : 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * The user has performed a load from a hole in the file.  Allocating a new</div><div class='ctx'>  * page in the file would cause excessive storage usage for workloads with</div><div class='hunk'>@@ -1049,143 +1355,258 @@ out:</div><div class='ctx'>  * If this page is ever written to we will re-fault and change the mapping to</div><div class='ctx'>  * point to real DAX storage instead.</div><div class='ctx'>  */</div><div class='del'>-static vm_fault_t dax_load_hole(struct xa_state *xas,</div><div class='del'>-		struct address_space *mapping, void **entry,</div><div class='del'>-		struct vm_fault *vmf)</div><div class='add'>+static vm_fault_t dax_load_hole(struct xa_state *xas, struct vm_fault *vmf,</div><div class='add'>+		const struct iomap_iter *iter, void **entry)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = mapping-&gt;host;</div><div class='add'>+	struct inode *inode = iter-&gt;inode;</div><div class='ctx'> 	unsigned long vaddr = vmf-&gt;address;</div><div class='del'>-	pfn_t pfn = pfn_to_pfn_t(my_zero_pfn(vaddr));</div><div class='add'>+	unsigned long pfn = my_zero_pfn(vaddr);</div><div class='ctx'> 	vm_fault_t ret;</div><div class='ctx'> </div><div class='del'>-	*entry = dax_insert_entry(xas, mapping, vmf, *entry, pfn,</div><div class='del'>-			DAX_ZERO_PAGE, false);</div><div class='add'>+	*entry = dax_insert_entry(xas, vmf, iter, *entry, pfn, DAX_ZERO_PAGE);</div><div class='ctx'> </div><div class='del'>-	ret = vmf_insert_mixed(vmf-&gt;vma, vaddr, pfn);</div><div class='add'>+	ret = vmf_insert_page_mkwrite(vmf, pfn_to_page(pfn), false);</div><div class='ctx'> 	trace_dax_load_hole(inode, vmf, ret);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_FS_DAX_PMD</div><div class='ctx'> static vm_fault_t dax_pmd_load_hole(struct xa_state *xas, struct vm_fault *vmf,</div><div class='del'>-		const struct iomap *iomap, void **entry)</div><div class='add'>+		const struct iomap_iter *iter, void **entry)</div><div class='ctx'> {</div><div class='ctx'> 	struct address_space *mapping = vmf-&gt;vma-&gt;vm_file-&gt;f_mapping;</div><div class='del'>-	unsigned long pmd_addr = vmf-&gt;address &amp; PMD_MASK;</div><div class='del'>-	struct vm_area_struct *vma = vmf-&gt;vma;</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='del'>-	pgtable_t pgtable = NULL;</div><div class='del'>-	struct page *zero_page;</div><div class='del'>-	spinlock_t *ptl;</div><div class='del'>-	pmd_t pmd_entry;</div><div class='del'>-	pfn_t pfn;</div><div class='del'>-</div><div class='del'>-	zero_page = mm_get_huge_zero_page(vmf-&gt;vma-&gt;vm_mm);</div><div class='del'>-</div><div class='del'>-	if (unlikely(!zero_page))</div><div class='del'>-		goto fallback;</div><div class='del'>-</div><div class='del'>-	pfn = page_to_pfn_t(zero_page);</div><div class='del'>-	*entry = dax_insert_entry(xas, mapping, vmf, *entry, pfn,</div><div class='del'>-			DAX_PMD | DAX_ZERO_PAGE, false);</div><div class='add'>+	struct folio *zero_folio;</div><div class='add'>+	vm_fault_t ret;</div><div class='ctx'> </div><div class='del'>-	if (arch_needs_pgtable_deposit()) {</div><div class='del'>-		pgtable = pte_alloc_one(vma-&gt;vm_mm);</div><div class='del'>-		if (!pgtable)</div><div class='del'>-			return VM_FAULT_OOM;</div><div class='del'>-	}</div><div class='add'>+	zero_folio = mm_get_huge_zero_folio(vmf-&gt;vma-&gt;vm_mm);</div><div class='ctx'> </div><div class='del'>-	ptl = pmd_lock(vmf-&gt;vma-&gt;vm_mm, vmf-&gt;pmd);</div><div class='del'>-	if (!pmd_none(*(vmf-&gt;pmd))) {</div><div class='del'>-		spin_unlock(ptl);</div><div class='del'>-		goto fallback;</div><div class='add'>+	if (unlikely(!zero_folio)) {</div><div class='add'>+		trace_dax_pmd_load_hole_fallback(inode, vmf, zero_folio, *entry);</div><div class='add'>+		return VM_FAULT_FALLBACK;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (pgtable) {</div><div class='del'>-		pgtable_trans_huge_deposit(vma-&gt;vm_mm, vmf-&gt;pmd, pgtable);</div><div class='del'>-		mm_inc_nr_ptes(vma-&gt;vm_mm);</div><div class='del'>-	}</div><div class='del'>-	pmd_entry = mk_pmd(zero_page, vmf-&gt;vma-&gt;vm_page_prot);</div><div class='del'>-	pmd_entry = pmd_mkhuge(pmd_entry);</div><div class='del'>-	set_pmd_at(vmf-&gt;vma-&gt;vm_mm, pmd_addr, vmf-&gt;pmd, pmd_entry);</div><div class='del'>-	spin_unlock(ptl);</div><div class='del'>-	trace_dax_pmd_load_hole(inode, vmf, zero_page, *entry);</div><div class='del'>-	return VM_FAULT_NOPAGE;</div><div class='add'>+	*entry = dax_insert_entry(xas, vmf, iter, *entry, folio_pfn(zero_folio),</div><div class='add'>+				  DAX_PMD | DAX_ZERO_PAGE);</div><div class='ctx'> </div><div class='del'>-fallback:</div><div class='del'>-	if (pgtable)</div><div class='del'>-		pte_free(vma-&gt;vm_mm, pgtable);</div><div class='del'>-	trace_dax_pmd_load_hole_fallback(inode, vmf, zero_page, *entry);</div><div class='del'>-	return VM_FAULT_FALLBACK;</div><div class='add'>+	ret = vmf_insert_folio_pmd(vmf, zero_folio, false);</div><div class='add'>+	if (ret == VM_FAULT_NOPAGE)</div><div class='add'>+		trace_dax_pmd_load_hole(inode, vmf, zero_folio, *entry);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> #else</div><div class='ctx'> static vm_fault_t dax_pmd_load_hole(struct xa_state *xas, struct vm_fault *vmf,</div><div class='del'>-		const struct iomap *iomap, void **entry)</div><div class='add'>+		const struct iomap_iter *iter, void **entry)</div><div class='ctx'> {</div><div class='ctx'> 	return VM_FAULT_FALLBACK;</div><div class='ctx'> }</div><div class='ctx'> #endif /* CONFIG_FS_DAX_PMD */</div><div class='ctx'> </div><div class='del'>-s64 dax_iomap_zero(loff_t pos, u64 length, struct iomap *iomap)</div><div class='add'>+static int dax_unshare_iter(struct iomap_iter *iter)</div><div class='ctx'> {</div><div class='del'>-	sector_t sector = iomap_sector(iomap, pos &amp; PAGE_MASK);</div><div class='del'>-	pgoff_t pgoff;</div><div class='del'>-	long rc, id;</div><div class='del'>-	void *kaddr;</div><div class='del'>-	bool page_aligned = false;</div><div class='del'>-	unsigned offset = offset_in_page(pos);</div><div class='del'>-	unsigned size = min_t(u64, PAGE_SIZE - offset, length);</div><div class='add'>+	struct iomap *iomap = &amp;iter-&gt;iomap;</div><div class='add'>+	const struct iomap *srcmap = iomap_iter_srcmap(iter);</div><div class='add'>+	loff_t copy_pos = iter-&gt;pos;</div><div class='add'>+	u64 copy_len = iomap_length(iter);</div><div class='add'>+	u32 mod;</div><div class='add'>+	int id = 0;</div><div class='add'>+	s64 ret;</div><div class='add'>+	void *daddr = NULL, *saddr = NULL;</div><div class='add'>+</div><div class='add'>+	if (!iomap_want_unshare_iter(iter))</div><div class='add'>+		return iomap_iter_advance_full(iter);</div><div class='ctx'> </div><div class='del'>-	if (IS_ALIGNED(sector &lt;&lt; SECTOR_SHIFT, PAGE_SIZE) &amp;&amp;</div><div class='del'>-	    (size == PAGE_SIZE))</div><div class='del'>-		page_aligned = true;</div><div class='add'>+	/*</div><div class='add'>+	 * Extend the file range to be aligned to fsblock/pagesize, because</div><div class='add'>+	 * we need to copy entire blocks, not just the byte range specified.</div><div class='add'>+	 * Invalidate the mapping because we're about to CoW.</div><div class='add'>+	 */</div><div class='add'>+	mod = offset_in_page(copy_pos);</div><div class='add'>+	if (mod) {</div><div class='add'>+		copy_len += mod;</div><div class='add'>+		copy_pos -= mod;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	rc = bdev_dax_pgoff(iomap-&gt;bdev, sector, PAGE_SIZE, &amp;pgoff);</div><div class='del'>-	if (rc)</div><div class='del'>-		return rc;</div><div class='add'>+	mod = offset_in_page(copy_pos + copy_len);</div><div class='add'>+	if (mod)</div><div class='add'>+		copy_len += PAGE_SIZE - mod;</div><div class='add'>+</div><div class='add'>+	invalidate_inode_pages2_range(iter-&gt;inode-&gt;i_mapping,</div><div class='add'>+				      copy_pos &gt;&gt; PAGE_SHIFT,</div><div class='add'>+				      (copy_pos + copy_len - 1) &gt;&gt; PAGE_SHIFT);</div><div class='ctx'> </div><div class='ctx'> 	id = dax_read_lock();</div><div class='add'>+	ret = dax_iomap_direct_access(iomap, copy_pos, copy_len, &amp;daddr, NULL);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out_unlock;</div><div class='add'>+</div><div class='add'>+	ret = dax_iomap_direct_access(srcmap, copy_pos, copy_len, &amp;saddr, NULL);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out_unlock;</div><div class='ctx'> </div><div class='del'>-	if (page_aligned)</div><div class='del'>-		rc = dax_zero_page_range(iomap-&gt;dax_dev, pgoff, 1);</div><div class='add'>+	if (copy_mc_to_kernel(daddr, saddr, copy_len) != 0)</div><div class='add'>+		ret = -EIO;</div><div class='add'>+</div><div class='add'>+out_unlock:</div><div class='add'>+	dax_read_unlock(id);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return dax_mem2blk_err(ret);</div><div class='add'>+	return iomap_iter_advance_full(iter);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int dax_file_unshare(struct inode *inode, loff_t pos, loff_t len,</div><div class='add'>+		const struct iomap_ops *ops)</div><div class='add'>+{</div><div class='add'>+	struct iomap_iter iter = {</div><div class='add'>+		.inode		= inode,</div><div class='add'>+		.pos		= pos,</div><div class='add'>+		.flags		= IOMAP_WRITE | IOMAP_UNSHARE | IOMAP_DAX,</div><div class='add'>+	};</div><div class='add'>+	loff_t size = i_size_read(inode);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (pos &lt; 0 || pos &gt;= size)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	iter.len = min(len, size - pos);</div><div class='add'>+	while ((ret = iomap_iter(&amp;iter, ops)) &gt; 0)</div><div class='add'>+		iter.status = dax_unshare_iter(&amp;iter);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(dax_file_unshare);</div><div class='add'>+</div><div class='add'>+static int dax_memzero(struct iomap_iter *iter, loff_t pos, size_t size)</div><div class='add'>+{</div><div class='add'>+	const struct iomap *iomap = &amp;iter-&gt;iomap;</div><div class='add'>+	const struct iomap *srcmap = iomap_iter_srcmap(iter);</div><div class='add'>+	unsigned offset = offset_in_page(pos);</div><div class='add'>+	pgoff_t pgoff = dax_iomap_pgoff(iomap, pos);</div><div class='add'>+	void *kaddr;</div><div class='add'>+	long ret;</div><div class='add'>+</div><div class='add'>+	ret = dax_direct_access(iomap-&gt;dax_dev, pgoff, 1, DAX_ACCESS, &amp;kaddr,</div><div class='add'>+				NULL);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return dax_mem2blk_err(ret);</div><div class='add'>+</div><div class='add'>+	memset(kaddr + offset, 0, size);</div><div class='add'>+	if (iomap-&gt;flags &amp; IOMAP_F_SHARED)</div><div class='add'>+		ret = dax_iomap_copy_around(pos, size, PAGE_SIZE, srcmap,</div><div class='add'>+					    kaddr);</div><div class='ctx'> 	else</div><div class='del'>-		rc = dax_direct_access(iomap-&gt;dax_dev, pgoff, 1, &amp;kaddr, NULL);</div><div class='del'>-	if (rc &lt; 0) {</div><div class='add'>+		dax_flush(iomap-&gt;dax_dev, kaddr + offset, size);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int dax_zero_iter(struct iomap_iter *iter, bool *did_zero)</div><div class='add'>+{</div><div class='add'>+	const struct iomap *iomap = &amp;iter-&gt;iomap;</div><div class='add'>+	const struct iomap *srcmap = iomap_iter_srcmap(iter);</div><div class='add'>+	u64 length = iomap_length(iter);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	/* already zeroed?  we're done. */</div><div class='add'>+	if (srcmap-&gt;type == IOMAP_HOLE || srcmap-&gt;type == IOMAP_UNWRITTEN)</div><div class='add'>+		return iomap_iter_advance(iter, length);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * invalidate the pages whose sharing state is to be changed</div><div class='add'>+	 * because of CoW.</div><div class='add'>+	 */</div><div class='add'>+	if (iomap-&gt;flags &amp; IOMAP_F_SHARED)</div><div class='add'>+		invalidate_inode_pages2_range(iter-&gt;inode-&gt;i_mapping,</div><div class='add'>+				iter-&gt;pos &gt;&gt; PAGE_SHIFT,</div><div class='add'>+				(iter-&gt;pos + length - 1) &gt;&gt; PAGE_SHIFT);</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		loff_t pos = iter-&gt;pos;</div><div class='add'>+		unsigned offset = offset_in_page(pos);</div><div class='add'>+		pgoff_t pgoff = dax_iomap_pgoff(iomap, pos);</div><div class='add'>+		int id;</div><div class='add'>+</div><div class='add'>+		length = min_t(u64, PAGE_SIZE - offset, length);</div><div class='add'>+</div><div class='add'>+		id = dax_read_lock();</div><div class='add'>+		if (IS_ALIGNED(pos, PAGE_SIZE) &amp;&amp; length == PAGE_SIZE)</div><div class='add'>+			ret = dax_zero_page_range(iomap-&gt;dax_dev, pgoff, 1);</div><div class='add'>+		else</div><div class='add'>+			ret = dax_memzero(iter, pos, length);</div><div class='ctx'> 		dax_read_unlock(id);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	if (!page_aligned) {</div><div class='del'>-		memset(kaddr + offset, 0, size);</div><div class='del'>-		dax_flush(iomap-&gt;dax_dev, kaddr + offset, size);</div><div class='del'>-	}</div><div class='del'>-	dax_read_unlock(id);</div><div class='del'>-	return size;</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='add'>+</div><div class='add'>+		ret = iomap_iter_advance(iter, length);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+	} while ((length = iomap_length(iter)) &gt; 0);</div><div class='add'>+</div><div class='add'>+	if (did_zero)</div><div class='add'>+		*did_zero = true;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static loff_t dax_iomap_iter(const struct iomap_iter *iomi,</div><div class='del'>-		struct iov_iter *iter)</div><div class='add'>+int dax_zero_range(struct inode *inode, loff_t pos, loff_t len, bool *did_zero,</div><div class='add'>+		const struct iomap_ops *ops)</div><div class='add'>+{</div><div class='add'>+	struct iomap_iter iter = {</div><div class='add'>+		.inode		= inode,</div><div class='add'>+		.pos		= pos,</div><div class='add'>+		.len		= len,</div><div class='add'>+		.flags		= IOMAP_DAX | IOMAP_ZERO,</div><div class='add'>+	};</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	while ((ret = iomap_iter(&amp;iter, ops)) &gt; 0)</div><div class='add'>+		iter.status = dax_zero_iter(&amp;iter, did_zero);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(dax_zero_range);</div><div class='add'>+</div><div class='add'>+int dax_truncate_page(struct inode *inode, loff_t pos, bool *did_zero,</div><div class='add'>+		const struct iomap_ops *ops)</div><div class='add'>+{</div><div class='add'>+	unsigned int blocksize = i_blocksize(inode);</div><div class='add'>+	unsigned int off = pos &amp; (blocksize - 1);</div><div class='add'>+</div><div class='add'>+	/* Block boundary? Nothing to do */</div><div class='add'>+	if (!off)</div><div class='add'>+		return 0;</div><div class='add'>+	return dax_zero_range(inode, pos, blocksize - off, did_zero, ops);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(dax_truncate_page);</div><div class='add'>+</div><div class='add'>+static int dax_iomap_iter(struct iomap_iter *iomi, struct iov_iter *iter)</div><div class='ctx'> {</div><div class='ctx'> 	const struct iomap *iomap = &amp;iomi-&gt;iomap;</div><div class='add'>+	const struct iomap *srcmap = iomap_iter_srcmap(iomi);</div><div class='ctx'> 	loff_t length = iomap_length(iomi);</div><div class='ctx'> 	loff_t pos = iomi-&gt;pos;</div><div class='del'>-	struct block_device *bdev = iomap-&gt;bdev;</div><div class='ctx'> 	struct dax_device *dax_dev = iomap-&gt;dax_dev;</div><div class='ctx'> 	loff_t end = pos + length, done = 0;</div><div class='add'>+	bool write = iov_iter_rw(iter) == WRITE;</div><div class='add'>+	bool cow = write &amp;&amp; iomap-&gt;flags &amp; IOMAP_F_SHARED;</div><div class='ctx'> 	ssize_t ret = 0;</div><div class='ctx'> 	size_t xfer;</div><div class='ctx'> 	int id;</div><div class='ctx'> </div><div class='del'>-	if (iov_iter_rw(iter) == READ) {</div><div class='add'>+	if (!write) {</div><div class='ctx'> 		end = min(end, i_size_read(iomi-&gt;inode));</div><div class='ctx'> 		if (pos &gt;= end)</div><div class='ctx'> 			return 0;</div><div class='ctx'> </div><div class='del'>-		if (iomap-&gt;type == IOMAP_HOLE || iomap-&gt;type == IOMAP_UNWRITTEN)</div><div class='del'>-			return iov_iter_zero(min(length, end - pos), iter);</div><div class='add'>+		if (iomap-&gt;type == IOMAP_HOLE || iomap-&gt;type == IOMAP_UNWRITTEN) {</div><div class='add'>+			done = iov_iter_zero(min(length, end - pos), iter);</div><div class='add'>+			return iomap_iter_advance(iomi, done);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (WARN_ON_ONCE(iomap-&gt;type != IOMAP_MAPPED))</div><div class='add'>+	/*</div><div class='add'>+	 * In DAX mode, enforce either pure overwrites of written extents, or</div><div class='add'>+	 * writes to unwritten extents as part of a copy-on-write operation.</div><div class='add'>+	 */</div><div class='add'>+	if (WARN_ON_ONCE(iomap-&gt;type != IOMAP_MAPPED &amp;&amp;</div><div class='add'>+			!(iomap-&gt;flags &amp; IOMAP_F_SHARED)))</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1193,19 +1614,29 @@ static loff_t dax_iomap_iter(const struct iomap_iter *iomi,</div><div class='ctx'> 	 * into page tables. We have to tear down these mappings so that data</div><div class='ctx'> 	 * written by write(2) is visible in mmap.</div><div class='ctx'> 	 */</div><div class='del'>-	if (iomap-&gt;flags &amp; IOMAP_F_NEW) {</div><div class='add'>+	if (iomap-&gt;flags &amp; IOMAP_F_NEW || cow) {</div><div class='add'>+		/*</div><div class='add'>+		 * Filesystem allows CoW on non-shared extents. The src extents</div><div class='add'>+		 * may have been mmapped with dirty mark before. To be able to</div><div class='add'>+		 * invalidate its dax entries, we need to clear the dirty mark</div><div class='add'>+		 * in advance.</div><div class='add'>+		 */</div><div class='add'>+		if (cow)</div><div class='add'>+			__dax_clear_dirty_range(iomi-&gt;inode-&gt;i_mapping,</div><div class='add'>+						pos &gt;&gt; PAGE_SHIFT,</div><div class='add'>+						(end - 1) &gt;&gt; PAGE_SHIFT);</div><div class='ctx'> 		invalidate_inode_pages2_range(iomi-&gt;inode-&gt;i_mapping,</div><div class='ctx'> 					      pos &gt;&gt; PAGE_SHIFT,</div><div class='ctx'> 					      (end - 1) &gt;&gt; PAGE_SHIFT);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	id = dax_read_lock();</div><div class='del'>-	while (pos &lt; end) {</div><div class='add'>+	while ((pos = iomi-&gt;pos) &lt; end) {</div><div class='ctx'> 		unsigned offset = pos &amp; (PAGE_SIZE - 1);</div><div class='ctx'> 		const size_t size = ALIGN(length + offset, PAGE_SIZE);</div><div class='del'>-		const sector_t sector = dax_iomap_sector(iomap, pos);</div><div class='add'>+		pgoff_t pgoff = dax_iomap_pgoff(iomap, pos);</div><div class='ctx'> 		ssize_t map_len;</div><div class='del'>-		pgoff_t pgoff;</div><div class='add'>+		bool recovery = false;</div><div class='ctx'> 		void *kaddr;</div><div class='ctx'> </div><div class='ctx'> 		if (fatal_signal_pending(current)) {</div><div class='hunk'>@@ -1213,47 +1644,53 @@ static loff_t dax_iomap_iter(const struct iomap_iter *iomi,</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		ret = bdev_dax_pgoff(bdev, sector, size, &amp;pgoff);</div><div class='del'>-		if (ret)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='ctx'> 		map_len = dax_direct_access(dax_dev, pgoff, PHYS_PFN(size),</div><div class='del'>-				&amp;kaddr, NULL);</div><div class='add'>+				DAX_ACCESS, &amp;kaddr, NULL);</div><div class='add'>+		if (map_len == -EHWPOISON &amp;&amp; iov_iter_rw(iter) == WRITE) {</div><div class='add'>+			map_len = dax_direct_access(dax_dev, pgoff,</div><div class='add'>+					PHYS_PFN(size), DAX_RECOVERY_WRITE,</div><div class='add'>+					&amp;kaddr, NULL);</div><div class='add'>+			if (map_len &gt; 0)</div><div class='add'>+				recovery = true;</div><div class='add'>+		}</div><div class='ctx'> 		if (map_len &lt; 0) {</div><div class='del'>-			ret = map_len;</div><div class='add'>+			ret = dax_mem2blk_err(map_len);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		if (cow) {</div><div class='add'>+			ret = dax_iomap_copy_around(pos, length, PAGE_SIZE,</div><div class='add'>+						    srcmap, kaddr);</div><div class='add'>+			if (ret)</div><div class='add'>+				break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		map_len = PFN_PHYS(map_len);</div><div class='ctx'> 		kaddr += offset;</div><div class='ctx'> 		map_len -= offset;</div><div class='ctx'> 		if (map_len &gt; end - pos)</div><div class='ctx'> 			map_len = end - pos;</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * The userspace address for the memory copy has already been</div><div class='del'>-		 * validated via access_ok() in either vfs_read() or</div><div class='del'>-		 * vfs_write(), depending on which operation we are doing.</div><div class='del'>-		 */</div><div class='del'>-		if (iov_iter_rw(iter) == WRITE)</div><div class='add'>+		if (recovery)</div><div class='add'>+			xfer = dax_recovery_write(dax_dev, pgoff, kaddr,</div><div class='add'>+					map_len, iter);</div><div class='add'>+		else if (write)</div><div class='ctx'> 			xfer = dax_copy_from_iter(dax_dev, pgoff, kaddr,</div><div class='ctx'> 					map_len, iter);</div><div class='ctx'> 		else</div><div class='ctx'> 			xfer = dax_copy_to_iter(dax_dev, pgoff, kaddr,</div><div class='ctx'> 					map_len, iter);</div><div class='ctx'> </div><div class='del'>-		pos += xfer;</div><div class='del'>-		length -= xfer;</div><div class='del'>-		done += xfer;</div><div class='del'>-</div><div class='del'>-		if (xfer == 0)</div><div class='add'>+		ret = iomap_iter_advance(iomi, xfer);</div><div class='add'>+		if (!ret &amp;&amp; xfer == 0)</div><div class='ctx'> 			ret = -EFAULT;</div><div class='ctx'> 		if (xfer &lt; map_len)</div><div class='ctx'> 			break;</div><div class='add'>+		length = iomap_length(iomi);</div><div class='ctx'> 	}</div><div class='ctx'> 	dax_read_unlock(id);</div><div class='ctx'> </div><div class='del'>-	return done ? done : ret;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -1274,14 +1711,21 @@ dax_iomap_rw(struct kiocb *iocb, struct iov_iter *iter,</div><div class='ctx'> 		.inode		= iocb-&gt;ki_filp-&gt;f_mapping-&gt;host,</div><div class='ctx'> 		.pos		= iocb-&gt;ki_pos,</div><div class='ctx'> 		.len		= iov_iter_count(iter),</div><div class='add'>+		.flags		= IOMAP_DAX,</div><div class='ctx'> 	};</div><div class='ctx'> 	loff_t done = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='add'>+	if (WARN_ON_ONCE(iocb-&gt;ki_flags &amp; IOCB_ATOMIC))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	if (!iomi.len)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='ctx'> 	if (iov_iter_rw(iter) == WRITE) {</div><div class='ctx'> 		lockdep_assert_held_write(&amp;iomi.inode-&gt;i_rwsem);</div><div class='ctx'> 		iomi.flags |= IOMAP_WRITE;</div><div class='del'>-	} else {</div><div class='add'>+	} else if (!sb_rdonly(iomi.inode-&gt;i_sb)) {</div><div class='ctx'> 		lockdep_assert_held(&amp;iomi.inode-&gt;i_rwsem);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1289,7 +1733,7 @@ dax_iomap_rw(struct kiocb *iocb, struct iov_iter *iter,</div><div class='ctx'> 		iomi.flags |= IOMAP_NOWAIT;</div><div class='ctx'> </div><div class='ctx'> 	while ((ret = iomap_iter(&amp;iomi, ops)) &gt; 0)</div><div class='del'>-		iomi.processed = dax_iomap_iter(&amp;iomi, iter);</div><div class='add'>+		iomi.status = dax_iomap_iter(&amp;iomi, iter);</div><div class='ctx'> </div><div class='ctx'> 	done = iomi.pos - iocb-&gt;ki_pos;</div><div class='ctx'> 	iocb-&gt;ki_pos = iomi.pos;</div><div class='hunk'>@@ -1305,23 +1749,13 @@ static vm_fault_t dax_fault_return(int error)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * MAP_SYNC on a dax mapping guarantees dirty metadata is</div><div class='del'>- * flushed on write-faults (non-cow), but not read-faults.</div><div class='del'>- */</div><div class='del'>-static bool dax_fault_is_synchronous(unsigned long flags,</div><div class='del'>-		struct vm_area_struct *vma, const struct iomap *iomap)</div><div class='del'>-{</div><div class='del'>-	return (flags &amp; IOMAP_WRITE) &amp;&amp; (vma-&gt;vm_flags &amp; VM_SYNC)</div><div class='del'>-		&amp;&amp; (iomap-&gt;flags &amp; IOMAP_F_DIRTY);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * When handling a synchronous page fault and the inode need a fsync, we can</div><div class='ctx'>  * insert the PTE/PMD into page tables only after that fsync happened. Skip</div><div class='ctx'>  * insertion for now and return the pfn so that caller can insert it after the</div><div class='ctx'>  * fsync is done.</div><div class='ctx'>  */</div><div class='del'>-static vm_fault_t dax_fault_synchronous_pfnp(pfn_t *pfnp, pfn_t pfn)</div><div class='add'>+static vm_fault_t dax_fault_synchronous_pfnp(unsigned long *pfnp,</div><div class='add'>+					unsigned long pfn)</div><div class='ctx'> {</div><div class='ctx'> 	if (WARN_ON_ONCE(!pfnp))</div><div class='ctx'> 		return VM_FAULT_SIGBUS;</div><div class='hunk'>@@ -1332,19 +1766,16 @@ static vm_fault_t dax_fault_synchronous_pfnp(pfn_t *pfnp, pfn_t pfn)</div><div class='ctx'> static vm_fault_t dax_fault_cow_page(struct vm_fault *vmf,</div><div class='ctx'> 		const struct iomap_iter *iter)</div><div class='ctx'> {</div><div class='del'>-	sector_t sector = dax_iomap_sector(&amp;iter-&gt;iomap, iter-&gt;pos);</div><div class='del'>-	unsigned long vaddr = vmf-&gt;address;</div><div class='ctx'> 	vm_fault_t ret;</div><div class='ctx'> 	int error = 0;</div><div class='ctx'> </div><div class='ctx'> 	switch (iter-&gt;iomap.type) {</div><div class='ctx'> 	case IOMAP_HOLE:</div><div class='ctx'> 	case IOMAP_UNWRITTEN:</div><div class='del'>-		clear_user_highpage(vmf-&gt;cow_page, vaddr);</div><div class='add'>+		clear_user_highpage(vmf-&gt;cow_page, vmf-&gt;address);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case IOMAP_MAPPED:</div><div class='del'>-		error = copy_cow_page_dax(iter-&gt;iomap.bdev, iter-&gt;iomap.dax_dev,</div><div class='del'>-					  sector, vmf-&gt;cow_page, vaddr);</div><div class='add'>+		error = copy_cow_page_dax(vmf, iter);</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		WARN_ON_ONCE(1);</div><div class='hunk'>@@ -1372,18 +1803,19 @@ static vm_fault_t dax_fault_cow_page(struct vm_fault *vmf,</div><div class='ctx'>  * @pmd:	distinguish whether it is a pmd fault</div><div class='ctx'>  */</div><div class='ctx'> static vm_fault_t dax_fault_iter(struct vm_fault *vmf,</div><div class='del'>-		const struct iomap_iter *iter, pfn_t *pfnp,</div><div class='add'>+		const struct iomap_iter *iter, unsigned long *pfnp,</div><div class='ctx'> 		struct xa_state *xas, void **entry, bool pmd)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *mapping = vmf-&gt;vma-&gt;vm_file-&gt;f_mapping;</div><div class='ctx'> 	const struct iomap *iomap = &amp;iter-&gt;iomap;</div><div class='add'>+	const struct iomap *srcmap = iomap_iter_srcmap(iter);</div><div class='ctx'> 	size_t size = pmd ? PMD_SIZE : PAGE_SIZE;</div><div class='ctx'> 	loff_t pos = (loff_t)xas-&gt;xa_index &lt;&lt; PAGE_SHIFT;</div><div class='del'>-	bool write = vmf-&gt;flags &amp; FAULT_FLAG_WRITE;</div><div class='del'>-	bool sync = dax_fault_is_synchronous(iter-&gt;flags, vmf-&gt;vma, iomap);</div><div class='add'>+	bool write = iter-&gt;flags &amp; IOMAP_WRITE;</div><div class='ctx'> 	unsigned long entry_flags = pmd ? DAX_PMD : 0;</div><div class='del'>-	int err = 0;</div><div class='del'>-	pfn_t pfn;</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	int ret, err = 0;</div><div class='add'>+	unsigned long pfn;</div><div class='add'>+	void *kaddr;</div><div class='ctx'> </div><div class='ctx'> 	if (!pmd &amp;&amp; vmf-&gt;cow_page)</div><div class='ctx'> 		return dax_fault_cow_page(vmf, iter);</div><div class='hunk'>@@ -1392,36 +1824,42 @@ static vm_fault_t dax_fault_iter(struct vm_fault *vmf,</div><div class='ctx'> 	if (!write &amp;&amp;</div><div class='ctx'> 	    (iomap-&gt;type == IOMAP_UNWRITTEN || iomap-&gt;type == IOMAP_HOLE)) {</div><div class='ctx'> 		if (!pmd)</div><div class='del'>-			return dax_load_hole(xas, mapping, entry, vmf);</div><div class='del'>-		return dax_pmd_load_hole(xas, vmf, iomap, entry);</div><div class='add'>+			return dax_load_hole(xas, vmf, iter, entry);</div><div class='add'>+		return dax_pmd_load_hole(xas, vmf, iter, entry);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (iomap-&gt;type != IOMAP_MAPPED) {</div><div class='add'>+	if (iomap-&gt;type != IOMAP_MAPPED &amp;&amp; !(iomap-&gt;flags &amp; IOMAP_F_SHARED)) {</div><div class='ctx'> 		WARN_ON_ONCE(1);</div><div class='ctx'> 		return pmd ? VM_FAULT_FALLBACK : VM_FAULT_SIGBUS;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = dax_iomap_pfn(&amp;iter-&gt;iomap, pos, size, &amp;pfn);</div><div class='add'>+	err = dax_iomap_direct_access(iomap, pos, size, &amp;kaddr, &amp;pfn);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return pmd ? VM_FAULT_FALLBACK : dax_fault_return(err);</div><div class='ctx'> </div><div class='del'>-	*entry = dax_insert_entry(xas, mapping, vmf, *entry, pfn, entry_flags,</div><div class='del'>-				  write &amp;&amp; !sync);</div><div class='add'>+	*entry = dax_insert_entry(xas, vmf, iter, *entry, pfn, entry_flags);</div><div class='add'>+</div><div class='add'>+	if (write &amp;&amp; iomap-&gt;flags &amp; IOMAP_F_SHARED) {</div><div class='add'>+		err = dax_iomap_copy_around(pos, size, size, srcmap, kaddr);</div><div class='add'>+		if (err)</div><div class='add'>+			return dax_fault_return(err);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (sync)</div><div class='add'>+	folio = dax_to_folio(*entry);</div><div class='add'>+	if (dax_fault_is_synchronous(iter, vmf-&gt;vma))</div><div class='ctx'> 		return dax_fault_synchronous_pfnp(pfnp, pfn);</div><div class='ctx'> </div><div class='del'>-	/* insert PMD pfn */</div><div class='add'>+	folio_ref_inc(folio);</div><div class='ctx'> 	if (pmd)</div><div class='del'>-		return vmf_insert_pfn_pmd(vmf, pfn, write);</div><div class='add'>+		ret = vmf_insert_folio_pmd(vmf, pfn_folio(pfn), write);</div><div class='add'>+	else</div><div class='add'>+		ret = vmf_insert_page_mkwrite(vmf, pfn_to_page(pfn), write);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> </div><div class='del'>-	/* insert PTE pfn */</div><div class='del'>-	if (write)</div><div class='del'>-		return vmf_insert_mixed_mkwrite(vmf-&gt;vma, vmf-&gt;address, pfn);</div><div class='del'>-	return vmf_insert_mixed(vmf-&gt;vma, vmf-&gt;address, pfn);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static vm_fault_t dax_iomap_pte_fault(struct vm_fault *vmf, pfn_t *pfnp,</div><div class='add'>+static vm_fault_t dax_iomap_pte_fault(struct vm_fault *vmf, unsigned long *pfnp,</div><div class='ctx'> 			       int *iomap_errp, const struct iomap_ops *ops)</div><div class='ctx'> {</div><div class='ctx'> 	struct address_space *mapping = vmf-&gt;vma-&gt;vm_file-&gt;f_mapping;</div><div class='hunk'>@@ -1430,7 +1868,7 @@ static vm_fault_t dax_iomap_pte_fault(struct vm_fault *vmf, pfn_t *pfnp,</div><div class='ctx'> 		.inode		= mapping-&gt;host,</div><div class='ctx'> 		.pos		= (loff_t)vmf-&gt;pgoff &lt;&lt; PAGE_SHIFT,</div><div class='ctx'> 		.len		= PAGE_SIZE,</div><div class='del'>-		.flags		= IOMAP_FAULT,</div><div class='add'>+		.flags		= IOMAP_DAX | IOMAP_FAULT,</div><div class='ctx'> 	};</div><div class='ctx'> 	vm_fault_t ret = 0;</div><div class='ctx'> 	void *entry;</div><div class='hunk'>@@ -1462,14 +1900,14 @@ static vm_fault_t dax_iomap_pte_fault(struct vm_fault *vmf, pfn_t *pfnp,</div><div class='ctx'> 	 * the PTE we need to set up.  If so just return and the fault will be</div><div class='ctx'> 	 * retried.</div><div class='ctx'> 	 */</div><div class='del'>-	if (pmd_trans_huge(*vmf-&gt;pmd) || pmd_devmap(*vmf-&gt;pmd)) {</div><div class='add'>+	if (pmd_trans_huge(*vmf-&gt;pmd)) {</div><div class='ctx'> 		ret = VM_FAULT_NOPAGE;</div><div class='ctx'> 		goto unlock_entry;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	while ((error = iomap_iter(&amp;iter, ops)) &gt; 0) {</div><div class='ctx'> 		if (WARN_ON_ONCE(iomap_length(&amp;iter) &lt; PAGE_SIZE)) {</div><div class='del'>-			iter.processed = -EIO;	/* fs corruption? */</div><div class='add'>+			iter.status = -EIO;	/* fs corruption? */</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -1482,7 +1920,7 @@ static vm_fault_t dax_iomap_pte_fault(struct vm_fault *vmf, pfn_t *pfnp,</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (!(ret &amp; VM_FAULT_ERROR))</div><div class='del'>-			iter.processed = PAGE_SIZE;</div><div class='add'>+			iter.status = iomap_iter_advance(&amp;iter, PAGE_SIZE);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (iomap_errp)</div><div class='hunk'>@@ -1531,7 +1969,7 @@ static bool dax_fault_check_fallback(struct vm_fault *vmf, struct xa_state *xas,</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static vm_fault_t dax_iomap_pmd_fault(struct vm_fault *vmf, pfn_t *pfnp,</div><div class='add'>+static vm_fault_t dax_iomap_pmd_fault(struct vm_fault *vmf, unsigned long *pfnp,</div><div class='ctx'> 			       const struct iomap_ops *ops)</div><div class='ctx'> {</div><div class='ctx'> 	struct address_space *mapping = vmf-&gt;vma-&gt;vm_file-&gt;f_mapping;</div><div class='hunk'>@@ -1539,12 +1977,11 @@ static vm_fault_t dax_iomap_pmd_fault(struct vm_fault *vmf, pfn_t *pfnp,</div><div class='ctx'> 	struct iomap_iter iter = {</div><div class='ctx'> 		.inode		= mapping-&gt;host,</div><div class='ctx'> 		.len		= PMD_SIZE,</div><div class='del'>-		.flags		= IOMAP_FAULT,</div><div class='add'>+		.flags		= IOMAP_DAX | IOMAP_FAULT,</div><div class='ctx'> 	};</div><div class='ctx'> 	vm_fault_t ret = VM_FAULT_FALLBACK;</div><div class='ctx'> 	pgoff_t max_pgoff;</div><div class='ctx'> 	void *entry;</div><div class='del'>-	int error;</div><div class='ctx'> </div><div class='ctx'> 	if (vmf-&gt;flags &amp; FAULT_FLAG_WRITE)</div><div class='ctx'> 		iter.flags |= IOMAP_WRITE;</div><div class='hunk'>@@ -1584,20 +2021,19 @@ static vm_fault_t dax_iomap_pmd_fault(struct vm_fault *vmf, pfn_t *pfnp,</div><div class='ctx'> 	 * the PMD we need to set up.  If so just return and the fault will be</div><div class='ctx'> 	 * retried.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!pmd_none(*vmf-&gt;pmd) &amp;&amp; !pmd_trans_huge(*vmf-&gt;pmd) &amp;&amp;</div><div class='del'>-			!pmd_devmap(*vmf-&gt;pmd)) {</div><div class='add'>+	if (!pmd_none(*vmf-&gt;pmd) &amp;&amp; !pmd_trans_huge(*vmf-&gt;pmd)) {</div><div class='ctx'> 		ret = 0;</div><div class='ctx'> 		goto unlock_entry;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	iter.pos = (loff_t)xas.xa_index &lt;&lt; PAGE_SHIFT;</div><div class='del'>-	while ((error = iomap_iter(&amp;iter, ops)) &gt; 0) {</div><div class='add'>+	while (iomap_iter(&amp;iter, ops) &gt; 0) {</div><div class='ctx'> 		if (iomap_length(&amp;iter) &lt; PMD_SIZE)</div><div class='ctx'> 			continue; /* actually breaks out of the loop */</div><div class='ctx'> </div><div class='ctx'> 		ret = dax_fault_iter(vmf, &amp;iter, pfnp, &amp;xas, &amp;entry, true);</div><div class='ctx'> 		if (ret != VM_FAULT_FALLBACK)</div><div class='del'>-			iter.processed = PMD_SIZE;</div><div class='add'>+			iter.status = iomap_iter_advance(&amp;iter, PMD_SIZE);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> unlock_entry:</div><div class='hunk'>@@ -1612,7 +2048,7 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> #else</div><div class='del'>-static vm_fault_t dax_iomap_pmd_fault(struct vm_fault *vmf, pfn_t *pfnp,</div><div class='add'>+static vm_fault_t dax_iomap_pmd_fault(struct vm_fault *vmf, unsigned long *pfnp,</div><div class='ctx'> 			       const struct iomap_ops *ops)</div><div class='ctx'> {</div><div class='ctx'> 	return VM_FAULT_FALLBACK;</div><div class='hunk'>@@ -1622,7 +2058,7 @@ static vm_fault_t dax_iomap_pmd_fault(struct vm_fault *vmf, pfn_t *pfnp,</div><div class='ctx'> /**</div><div class='ctx'>  * dax_iomap_fault - handle a page fault on a DAX file</div><div class='ctx'>  * @vmf: The description of the fault</div><div class='del'>- * @pe_size: Size of the page to fault in</div><div class='add'>+ * @order: Order of the page to fault in</div><div class='ctx'>  * @pfnp: PFN to insert for synchronous faults if fsync is required</div><div class='ctx'>  * @iomap_errp: Storage for detailed error code in case of error</div><div class='ctx'>  * @ops: Iomap ops passed from the file system</div><div class='hunk'>@@ -1632,17 +2068,16 @@ static vm_fault_t dax_iomap_pmd_fault(struct vm_fault *vmf, pfn_t *pfnp,</div><div class='ctx'>  * has done all the necessary locking for page fault to proceed</div><div class='ctx'>  * successfully.</div><div class='ctx'>  */</div><div class='del'>-vm_fault_t dax_iomap_fault(struct vm_fault *vmf, enum page_entry_size pe_size,</div><div class='del'>-		    pfn_t *pfnp, int *iomap_errp, const struct iomap_ops *ops)</div><div class='add'>+vm_fault_t dax_iomap_fault(struct vm_fault *vmf, unsigned int order,</div><div class='add'>+			unsigned long *pfnp, int *iomap_errp,</div><div class='add'>+			const struct iomap_ops *ops)</div><div class='ctx'> {</div><div class='del'>-	switch (pe_size) {</div><div class='del'>-	case PE_SIZE_PTE:</div><div class='add'>+	if (order == 0)</div><div class='ctx'> 		return dax_iomap_pte_fault(vmf, pfnp, iomap_errp, ops);</div><div class='del'>-	case PE_SIZE_PMD:</div><div class='add'>+	else if (order == PMD_ORDER)</div><div class='ctx'> 		return dax_iomap_pmd_fault(vmf, pfnp, ops);</div><div class='del'>-	default:</div><div class='add'>+	else</div><div class='ctx'> 		return VM_FAULT_FALLBACK;</div><div class='del'>-	}</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(dax_iomap_fault);</div><div class='ctx'> </div><div class='hunk'>@@ -1655,16 +2090,17 @@ EXPORT_SYMBOL_GPL(dax_iomap_fault);</div><div class='ctx'>  * This function inserts a writeable PTE or PMD entry into the page tables</div><div class='ctx'>  * for an mmaped DAX file.  It also marks the page cache entry as dirty.</div><div class='ctx'>  */</div><div class='del'>-static vm_fault_t</div><div class='del'>-dax_insert_pfn_mkwrite(struct vm_fault *vmf, pfn_t pfn, unsigned int order)</div><div class='add'>+static vm_fault_t dax_insert_pfn_mkwrite(struct vm_fault *vmf,</div><div class='add'>+					unsigned long pfn, unsigned int order)</div><div class='ctx'> {</div><div class='ctx'> 	struct address_space *mapping = vmf-&gt;vma-&gt;vm_file-&gt;f_mapping;</div><div class='ctx'> 	XA_STATE_ORDER(xas, &amp;mapping-&gt;i_pages, vmf-&gt;pgoff, order);</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	void *entry;</div><div class='ctx'> 	vm_fault_t ret;</div><div class='ctx'> </div><div class='ctx'> 	xas_lock_irq(&amp;xas);</div><div class='del'>-	entry = get_unlocked_entry(&amp;xas, order);</div><div class='add'>+	entry = get_next_unlocked_entry(&amp;xas, order);</div><div class='ctx'> 	/* Did we race with someone splitting entry or so? */</div><div class='ctx'> 	if (!entry || dax_is_conflict(entry) ||</div><div class='ctx'> 	    (order == 0 &amp;&amp; !dax_is_pte_entry(entry))) {</div><div class='hunk'>@@ -1677,14 +2113,17 @@ dax_insert_pfn_mkwrite(struct vm_fault *vmf, pfn_t pfn, unsigned int order)</div><div class='ctx'> 	xas_set_mark(&amp;xas, PAGECACHE_TAG_DIRTY);</div><div class='ctx'> 	dax_lock_entry(&amp;xas, entry);</div><div class='ctx'> 	xas_unlock_irq(&amp;xas);</div><div class='add'>+	folio = pfn_folio(pfn);</div><div class='add'>+	folio_ref_inc(folio);</div><div class='ctx'> 	if (order == 0)</div><div class='del'>-		ret = vmf_insert_mixed_mkwrite(vmf-&gt;vma, vmf-&gt;address, pfn);</div><div class='add'>+		ret = vmf_insert_page_mkwrite(vmf, &amp;folio-&gt;page, true);</div><div class='ctx'> #ifdef CONFIG_FS_DAX_PMD</div><div class='ctx'> 	else if (order == PMD_ORDER)</div><div class='del'>-		ret = vmf_insert_pfn_pmd(vmf, pfn, FAULT_FLAG_WRITE);</div><div class='add'>+		ret = vmf_insert_folio_pmd(vmf, folio, FAULT_FLAG_WRITE);</div><div class='ctx'> #endif</div><div class='ctx'> 	else</div><div class='ctx'> 		ret = VM_FAULT_FALLBACK;</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> 	dax_unlock_entry(&amp;xas, entry);</div><div class='ctx'> 	trace_dax_insert_pfn_mkwrite(mapping-&gt;host, vmf, ret);</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -1693,19 +2132,18 @@ dax_insert_pfn_mkwrite(struct vm_fault *vmf, pfn_t pfn, unsigned int order)</div><div class='ctx'> /**</div><div class='ctx'>  * dax_finish_sync_fault - finish synchronous page fault</div><div class='ctx'>  * @vmf: The description of the fault</div><div class='del'>- * @pe_size: Size of entry to be inserted</div><div class='add'>+ * @order: Order of entry to be inserted</div><div class='ctx'>  * @pfn: PFN to insert</div><div class='ctx'>  *</div><div class='ctx'>  * This function ensures that the file range touched by the page fault is</div><div class='ctx'>  * stored persistently on the media and handles inserting of appropriate page</div><div class='ctx'>  * table entry.</div><div class='ctx'>  */</div><div class='del'>-vm_fault_t dax_finish_sync_fault(struct vm_fault *vmf,</div><div class='del'>-		enum page_entry_size pe_size, pfn_t pfn)</div><div class='add'>+vm_fault_t dax_finish_sync_fault(struct vm_fault *vmf, unsigned int order,</div><div class='add'>+		unsigned long pfn)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='ctx'> 	loff_t start = ((loff_t)vmf-&gt;pgoff) &lt;&lt; PAGE_SHIFT;</div><div class='del'>-	unsigned int order = pe_order(pe_size);</div><div class='ctx'> 	size_t len = PAGE_SIZE &lt;&lt; order;</div><div class='ctx'> </div><div class='ctx'> 	err = vfs_fsync_range(vmf-&gt;vma-&gt;vm_file, start, start + len - 1, 1);</div><div class='hunk'>@@ -1714,3 +2152,90 @@ vm_fault_t dax_finish_sync_fault(struct vm_fault *vmf,</div><div class='ctx'> 	return dax_insert_pfn_mkwrite(vmf, pfn, order);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(dax_finish_sync_fault);</div><div class='add'>+</div><div class='add'>+static int dax_range_compare_iter(struct iomap_iter *it_src,</div><div class='add'>+		struct iomap_iter *it_dest, u64 len, bool *same)</div><div class='add'>+{</div><div class='add'>+	const struct iomap *smap = &amp;it_src-&gt;iomap;</div><div class='add'>+	const struct iomap *dmap = &amp;it_dest-&gt;iomap;</div><div class='add'>+	loff_t pos1 = it_src-&gt;pos, pos2 = it_dest-&gt;pos;</div><div class='add'>+	void *saddr, *daddr;</div><div class='add'>+	int id, ret;</div><div class='add'>+</div><div class='add'>+	len = min(len, min(smap-&gt;length, dmap-&gt;length));</div><div class='add'>+</div><div class='add'>+	if (smap-&gt;type == IOMAP_HOLE &amp;&amp; dmap-&gt;type == IOMAP_HOLE) {</div><div class='add'>+		*same = true;</div><div class='add'>+		goto advance;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (smap-&gt;type == IOMAP_HOLE || dmap-&gt;type == IOMAP_HOLE) {</div><div class='add'>+		*same = false;</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	id = dax_read_lock();</div><div class='add'>+	ret = dax_iomap_direct_access(smap, pos1, ALIGN(pos1 + len, PAGE_SIZE),</div><div class='add'>+				      &amp;saddr, NULL);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out_unlock;</div><div class='add'>+</div><div class='add'>+	ret = dax_iomap_direct_access(dmap, pos2, ALIGN(pos2 + len, PAGE_SIZE),</div><div class='add'>+				      &amp;daddr, NULL);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out_unlock;</div><div class='add'>+</div><div class='add'>+	*same = !memcmp(saddr, daddr, len);</div><div class='add'>+	if (!*same)</div><div class='add'>+		len = 0;</div><div class='add'>+	dax_read_unlock(id);</div><div class='add'>+</div><div class='add'>+advance:</div><div class='add'>+	ret = iomap_iter_advance(it_src, len);</div><div class='add'>+	if (!ret)</div><div class='add'>+		ret = iomap_iter_advance(it_dest, len);</div><div class='add'>+	return ret;</div><div class='add'>+</div><div class='add'>+out_unlock:</div><div class='add'>+	dax_read_unlock(id);</div><div class='add'>+	return -EIO;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int dax_dedupe_file_range_compare(struct inode *src, loff_t srcoff,</div><div class='add'>+		struct inode *dst, loff_t dstoff, loff_t len, bool *same,</div><div class='add'>+		const struct iomap_ops *ops)</div><div class='add'>+{</div><div class='add'>+	struct iomap_iter src_iter = {</div><div class='add'>+		.inode		= src,</div><div class='add'>+		.pos		= srcoff,</div><div class='add'>+		.len		= len,</div><div class='add'>+		.flags		= IOMAP_DAX,</div><div class='add'>+	};</div><div class='add'>+	struct iomap_iter dst_iter = {</div><div class='add'>+		.inode		= dst,</div><div class='add'>+		.pos		= dstoff,</div><div class='add'>+		.len		= len,</div><div class='add'>+		.flags		= IOMAP_DAX,</div><div class='add'>+	};</div><div class='add'>+	int ret, status;</div><div class='add'>+</div><div class='add'>+	while ((ret = iomap_iter(&amp;src_iter, ops)) &gt; 0 &amp;&amp;</div><div class='add'>+	       (ret = iomap_iter(&amp;dst_iter, ops)) &gt; 0) {</div><div class='add'>+		status = dax_range_compare_iter(&amp;src_iter, &amp;dst_iter,</div><div class='add'>+				min(src_iter.len, dst_iter.len), same);</div><div class='add'>+		if (status &lt; 0)</div><div class='add'>+			return ret;</div><div class='add'>+		src_iter.status = dst_iter.status = status;</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int dax_remap_file_range_prep(struct file *file_in, loff_t pos_in,</div><div class='add'>+			      struct file *file_out, loff_t pos_out,</div><div class='add'>+			      loff_t *len, unsigned int remap_flags,</div><div class='add'>+			      const struct iomap_ops *ops)</div><div class='add'>+{</div><div class='add'>+	return __generic_remap_file_range_prep(file_in, pos_in, file_out,</div><div class='add'>+					       pos_out, len, remap_flags, ops);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(dax_remap_file_range_prep);</div><div class='head'>diff --git a/fs/dcache.c b/fs/dcache.c<br/>index cf871a81f4fd..dc2fff4811d1 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dcache.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dcache.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dcache.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dcache.c</a></div><div class='hunk'>@@ -35,6 +35,8 @@</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> #include "mount.h"</div><div class='ctx'> </div><div class='add'>+#include &lt;asm/runtime-const.h&gt;</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Usage:</div><div class='ctx'>  * dcache-&gt;d_inode-&gt;i_lock protects:</div><div class='hunk'>@@ -51,8 +53,8 @@</div><div class='ctx'>  *   - d_lru</div><div class='ctx'>  *   - d_count</div><div class='ctx'>  *   - d_unhashed()</div><div class='del'>- *   - d_parent and d_subdirs</div><div class='del'>- *   - childrens' d_child and d_parent</div><div class='add'>+ *   - d_parent and d_chilren</div><div class='add'>+ *   - childrens' d_sib and d_parent</div><div class='ctx'>  *   - d_u.d_alias, d_inode</div><div class='ctx'>  *</div><div class='ctx'>  * Ordering:</div><div class='hunk'>@@ -71,14 +73,21 @@</div><div class='ctx'>  * If no ancestor relationship:</div><div class='ctx'>  * arbitrary, since it's serialized on rename_lock</div><div class='ctx'>  */</div><div class='del'>-int sysctl_vfs_cache_pressure __read_mostly = 100;</div><div class='del'>-EXPORT_SYMBOL_GPL(sysctl_vfs_cache_pressure);</div><div class='add'>+static int sysctl_vfs_cache_pressure __read_mostly = 100;</div><div class='add'>+static int sysctl_vfs_cache_pressure_denom __read_mostly = 100;</div><div class='add'>+</div><div class='add'>+unsigned long vfs_pressure_ratio(unsigned long val)</div><div class='add'>+{</div><div class='add'>+	return mult_frac(val, sysctl_vfs_cache_pressure, sysctl_vfs_cache_pressure_denom);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(vfs_pressure_ratio);</div><div class='ctx'> </div><div class='ctx'> __cacheline_aligned_in_smp DEFINE_SEQLOCK(rename_lock);</div><div class='ctx'> </div><div class='ctx'> EXPORT_SYMBOL(rename_lock);</div><div class='ctx'> </div><div class='del'>-static struct kmem_cache *dentry_cache __read_mostly;</div><div class='add'>+static struct kmem_cache *__dentry_cache __ro_after_init;</div><div class='add'>+#define dentry_cache runtime_const_ptr(__dentry_cache)</div><div class='ctx'> </div><div class='ctx'> const struct qstr empty_name = QSTR_INIT("", 0);</div><div class='ctx'> EXPORT_SYMBOL(empty_name);</div><div class='hunk'>@@ -94,15 +103,21 @@ EXPORT_SYMBOL(dotdot_name);</div><div class='ctx'>  *</div><div class='ctx'>  * This hash-function tries to avoid losing too many bits of hash</div><div class='ctx'>  * information, yet avoid using a prime hash-size or similar.</div><div class='add'>+ *</div><div class='add'>+ * Marking the variables "used" ensures that the compiler doesn't</div><div class='add'>+ * optimize them away completely on architectures with runtime</div><div class='add'>+ * constant infrastructure, this allows debuggers to see their</div><div class='add'>+ * values. But updating these values has no effect on those arches.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static unsigned int d_hash_shift __read_mostly;</div><div class='add'>+static unsigned int d_hash_shift __ro_after_init __used;</div><div class='ctx'> </div><div class='del'>-static struct hlist_bl_head *dentry_hashtable __read_mostly;</div><div class='add'>+static struct hlist_bl_head *dentry_hashtable __ro_after_init __used;</div><div class='ctx'> </div><div class='del'>-static inline struct hlist_bl_head *d_hash(unsigned int hash)</div><div class='add'>+static inline struct hlist_bl_head *d_hash(unsigned long hashlen)</div><div class='ctx'> {</div><div class='del'>-	return dentry_hashtable + (hash &gt;&gt; d_hash_shift);</div><div class='add'>+	return runtime_const_ptr(dentry_hashtable) +</div><div class='add'>+		runtime_const_shift_right_32(hashlen, d_hash_shift);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #define IN_LOOKUP_SHIFT 10</div><div class='hunk'>@@ -115,17 +130,25 @@ static inline struct hlist_bl_head *in_lookup_hash(const struct dentry *parent,</div><div class='ctx'> 	return in_lookup_hashtable + hash_32(hash, IN_LOOKUP_SHIFT);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-</div><div class='del'>-/* Statistics gathering. */</div><div class='del'>-struct dentry_stat_t dentry_stat = {</div><div class='del'>-	.age_limit = 45,</div><div class='add'>+struct dentry_stat_t {</div><div class='add'>+	long nr_dentry;</div><div class='add'>+	long nr_unused;</div><div class='add'>+	long age_limit;		/* age in seconds */</div><div class='add'>+	long want_pages;	/* pages requested by system */</div><div class='add'>+	long nr_negative;	/* # of unused negative dentries */</div><div class='add'>+	long dummy;		/* Reserved for future use */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static DEFINE_PER_CPU(long, nr_dentry);</div><div class='ctx'> static DEFINE_PER_CPU(long, nr_dentry_unused);</div><div class='ctx'> static DEFINE_PER_CPU(long, nr_dentry_negative);</div><div class='add'>+static int dentry_negative_policy;</div><div class='ctx'> </div><div class='ctx'> #if defined(CONFIG_SYSCTL) &amp;&amp; defined(CONFIG_PROC_FS)</div><div class='add'>+/* Statistics gathering. */</div><div class='add'>+static struct dentry_stat_t dentry_stat = {</div><div class='add'>+	.age_limit = 45,</div><div class='add'>+};</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Here we resort to our own counters instead of using generic per-cpu counters</div><div class='hunk'>@@ -167,14 +190,60 @@ static long get_nr_dentry_negative(void)</div><div class='ctx'> 	return sum &lt; 0 ? 0 : sum;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int proc_nr_dentry(struct ctl_table *table, int write, void *buffer,</div><div class='del'>-		   size_t *lenp, loff_t *ppos)</div><div class='add'>+static int proc_nr_dentry(const struct ctl_table *table, int write, void *buffer,</div><div class='add'>+			  size_t *lenp, loff_t *ppos)</div><div class='ctx'> {</div><div class='ctx'> 	dentry_stat.nr_dentry = get_nr_dentry();</div><div class='ctx'> 	dentry_stat.nr_unused = get_nr_dentry_unused();</div><div class='ctx'> 	dentry_stat.nr_negative = get_nr_dentry_negative();</div><div class='ctx'> 	return proc_doulongvec_minmax(table, write, buffer, lenp, ppos);</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+static const struct ctl_table fs_dcache_sysctls[] = {</div><div class='add'>+	{</div><div class='add'>+		.procname	= "dentry-state",</div><div class='add'>+		.data		= &amp;dentry_stat,</div><div class='add'>+		.maxlen		= 6*sizeof(long),</div><div class='add'>+		.mode		= 0444,</div><div class='add'>+		.proc_handler	= proc_nr_dentry,</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+		.procname	= "dentry-negative",</div><div class='add'>+		.data		= &amp;dentry_negative_policy,</div><div class='add'>+		.maxlen		= sizeof(dentry_negative_policy),</div><div class='add'>+		.mode		= 0644,</div><div class='add'>+		.proc_handler	= proc_dointvec_minmax,</div><div class='add'>+		.extra1		= SYSCTL_ZERO,</div><div class='add'>+		.extra2		= SYSCTL_ONE,</div><div class='add'>+	},</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct ctl_table vm_dcache_sysctls[] = {</div><div class='add'>+	{</div><div class='add'>+		.procname	= "vfs_cache_pressure",</div><div class='add'>+		.data		= &amp;sysctl_vfs_cache_pressure,</div><div class='add'>+		.maxlen		= sizeof(sysctl_vfs_cache_pressure),</div><div class='add'>+		.mode		= 0644,</div><div class='add'>+		.proc_handler	= proc_dointvec_minmax,</div><div class='add'>+		.extra1		= SYSCTL_ZERO,</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+		.procname	= "vfs_cache_pressure_denom",</div><div class='add'>+		.data		= &amp;sysctl_vfs_cache_pressure_denom,</div><div class='add'>+		.maxlen		= sizeof(sysctl_vfs_cache_pressure_denom),</div><div class='add'>+		.mode		= 0644,</div><div class='add'>+		.proc_handler	= proc_dointvec_minmax,</div><div class='add'>+		.extra1		= SYSCTL_ONE_HUNDRED,</div><div class='add'>+	},</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int __init init_fs_dcache_sysctls(void)</div><div class='add'>+{</div><div class='add'>+	register_sysctl_init("vm", vm_dcache_sysctls);</div><div class='add'>+	register_sysctl_init("fs", fs_dcache_sysctls);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+fs_initcall(init_fs_dcache_sysctls);</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -253,12 +322,16 @@ static inline int dentry_cmp(const struct dentry *dentry, const unsigned char *c</div><div class='ctx'> 	return dentry_string_cmp(cs, ct, tcount);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * long names are allocated separately from dentry and never modified.</div><div class='add'>+ * Refcounted, freeing is RCU-delayed.  See take_dentry_name_snapshot()</div><div class='add'>+ * for the reason why -&gt;count and -&gt;head can't be combined into a union.</div><div class='add'>+ * dentry_string_cmp() relies upon -&gt;name[] being word-aligned.</div><div class='add'>+ */</div><div class='ctx'> struct external_name {</div><div class='del'>-	union {</div><div class='del'>-		atomic_t count;</div><div class='del'>-		struct rcu_head head;</div><div class='del'>-	} u;</div><div class='del'>-	unsigned char name[];</div><div class='add'>+	atomic_t count;</div><div class='add'>+	struct rcu_head head;</div><div class='add'>+	unsigned char name[] __aligned(sizeof(unsigned long));</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static inline struct external_name *external_name(struct dentry *dentry)</div><div class='hunk'>@@ -282,31 +355,45 @@ static void __d_free_external(struct rcu_head *head)</div><div class='ctx'> </div><div class='ctx'> static inline int dname_external(const struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	return dentry-&gt;d_name.name != dentry-&gt;d_iname;</div><div class='add'>+	return dentry-&gt;d_name.name != dentry-&gt;d_shortname.string;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void take_dentry_name_snapshot(struct name_snapshot *name, struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	spin_lock(&amp;dentry-&gt;d_lock);</div><div class='del'>-	name-&gt;name = dentry-&gt;d_name;</div><div class='del'>-	if (unlikely(dname_external(dentry))) {</div><div class='del'>-		atomic_inc(&amp;external_name(dentry)-&gt;u.count);</div><div class='add'>+	unsigned seq;</div><div class='add'>+	const unsigned char *s;</div><div class='add'>+</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+retry:</div><div class='add'>+	seq = read_seqcount_begin(&amp;dentry-&gt;d_seq);</div><div class='add'>+	s = READ_ONCE(dentry-&gt;d_name.name);</div><div class='add'>+	name-&gt;name.hash_len = dentry-&gt;d_name.hash_len;</div><div class='add'>+	name-&gt;name.name = name-&gt;inline_name.string;</div><div class='add'>+	if (likely(s == dentry-&gt;d_shortname.string)) {</div><div class='add'>+		name-&gt;inline_name = dentry-&gt;d_shortname;</div><div class='ctx'> 	} else {</div><div class='del'>-		memcpy(name-&gt;inline_name, dentry-&gt;d_iname,</div><div class='del'>-		       dentry-&gt;d_name.len + 1);</div><div class='del'>-		name-&gt;name.name = name-&gt;inline_name;</div><div class='add'>+		struct external_name *p;</div><div class='add'>+		p = container_of(s, struct external_name, name[0]);</div><div class='add'>+		// get a valid reference</div><div class='add'>+		if (unlikely(!atomic_inc_not_zero(&amp;p-&gt;count)))</div><div class='add'>+			goto retry;</div><div class='add'>+		name-&gt;name.name = s;</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='add'>+	if (read_seqcount_retry(&amp;dentry-&gt;d_seq, seq)) {</div><div class='add'>+		release_dentry_name_snapshot(name);</div><div class='add'>+		goto retry;</div><div class='add'>+	}</div><div class='add'>+	rcu_read_unlock();</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(take_dentry_name_snapshot);</div><div class='ctx'> </div><div class='ctx'> void release_dentry_name_snapshot(struct name_snapshot *name)</div><div class='ctx'> {</div><div class='del'>-	if (unlikely(name-&gt;name.name != name-&gt;inline_name)) {</div><div class='add'>+	if (unlikely(name-&gt;name.name != name-&gt;inline_name.string)) {</div><div class='ctx'> 		struct external_name *p;</div><div class='ctx'> 		p = container_of(name-&gt;name.name, struct external_name, name[0]);</div><div class='del'>-		if (unlikely(atomic_dec_and_test(&amp;p-&gt;u.count)))</div><div class='del'>-			kfree_rcu(p, u.head);</div><div class='add'>+		if (unlikely(atomic_dec_and_test(&amp;p-&gt;count)))</div><div class='add'>+			kfree_rcu(p, head);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(release_dentry_name_snapshot);</div><div class='hunk'>@@ -319,7 +406,7 @@ static inline void __d_set_inode_and_type(struct dentry *dentry,</div><div class='ctx'> </div><div class='ctx'> 	dentry-&gt;d_inode = inode;</div><div class='ctx'> 	flags = READ_ONCE(dentry-&gt;d_flags);</div><div class='del'>-	flags &amp;= ~(DCACHE_ENTRY_TYPE | DCACHE_FALLTHRU);</div><div class='add'>+	flags &amp;= ~DCACHE_ENTRY_TYPE;</div><div class='ctx'> 	flags |= type_flags;</div><div class='ctx'> 	smp_store_release(&amp;dentry-&gt;d_flags, flags);</div><div class='ctx'> }</div><div class='hunk'>@@ -328,10 +415,14 @@ static inline void __d_clear_type_and_inode(struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned flags = READ_ONCE(dentry-&gt;d_flags);</div><div class='ctx'> </div><div class='del'>-	flags &amp;= ~(DCACHE_ENTRY_TYPE | DCACHE_FALLTHRU);</div><div class='add'>+	flags &amp;= ~DCACHE_ENTRY_TYPE;</div><div class='ctx'> 	WRITE_ONCE(dentry-&gt;d_flags, flags);</div><div class='ctx'> 	dentry-&gt;d_inode = NULL;</div><div class='del'>-	if (dentry-&gt;d_flags &amp; DCACHE_LRU_LIST)</div><div class='add'>+	/*</div><div class='add'>+	 * The negative counter only tracks dentries on the LRU. Don't inc if</div><div class='add'>+	 * d_lru is on another list.</div><div class='add'>+	 */</div><div class='add'>+	if ((flags &amp; (DCACHE_LRU_LIST|DCACHE_SHRINK_LIST)) == DCACHE_LRU_LIST)</div><div class='ctx'> 		this_cpu_inc(nr_dentry_negative);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -340,7 +431,7 @@ static void dentry_free(struct dentry *dentry)</div><div class='ctx'> 	WARN_ON(!hlist_unhashed(&amp;dentry-&gt;d_u.d_alias));</div><div class='ctx'> 	if (unlikely(dname_external(dentry))) {</div><div class='ctx'> 		struct external_name *p = external_name(dentry);</div><div class='del'>-		if (likely(atomic_dec_and_test(&amp;p-&gt;u.count))) {</div><div class='add'>+		if (likely(atomic_dec_and_test(&amp;p-&gt;count))) {</div><div class='ctx'> 			call_rcu(&amp;dentry-&gt;d_u.d_rcu, __d_free_external);</div><div class='ctx'> 			return;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -403,7 +494,8 @@ static void d_lru_add(struct dentry *dentry)</div><div class='ctx'> 	this_cpu_inc(nr_dentry_unused);</div><div class='ctx'> 	if (d_is_negative(dentry))</div><div class='ctx'> 		this_cpu_inc(nr_dentry_negative);</div><div class='del'>-	WARN_ON_ONCE(!list_lru_add(&amp;dentry-&gt;d_sb-&gt;s_dentry_lru, &amp;dentry-&gt;d_lru));</div><div class='add'>+	WARN_ON_ONCE(!list_lru_add_obj(</div><div class='add'>+			&amp;dentry-&gt;d_sb-&gt;s_dentry_lru, &amp;dentry-&gt;d_lru));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void d_lru_del(struct dentry *dentry)</div><div class='hunk'>@@ -413,7 +505,8 @@ static void d_lru_del(struct dentry *dentry)</div><div class='ctx'> 	this_cpu_dec(nr_dentry_unused);</div><div class='ctx'> 	if (d_is_negative(dentry))</div><div class='ctx'> 		this_cpu_dec(nr_dentry_negative);</div><div class='del'>-	WARN_ON_ONCE(!list_lru_del(&amp;dentry-&gt;d_sb-&gt;s_dentry_lru, &amp;dentry-&gt;d_lru));</div><div class='add'>+	WARN_ON_ONCE(!list_lru_del_obj(</div><div class='add'>+			&amp;dentry-&gt;d_sb-&gt;s_dentry_lru, &amp;dentry-&gt;d_lru));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void d_shrink_del(struct dentry *dentry)</div><div class='hunk'>@@ -512,7 +605,7 @@ void d_drop(struct dentry *dentry)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(d_drop);</div><div class='ctx'> </div><div class='del'>-static inline void dentry_unlist(struct dentry *dentry, struct dentry *parent)</div><div class='add'>+static inline void dentry_unlist(struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *next;</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -520,12 +613,12 @@ static inline void dentry_unlist(struct dentry *dentry, struct dentry *parent)</div><div class='ctx'> 	 * attached to the dentry tree</div><div class='ctx'> 	 */</div><div class='ctx'> 	dentry-&gt;d_flags |= DCACHE_DENTRY_KILLED;</div><div class='del'>-	if (unlikely(list_empty(&amp;dentry-&gt;d_child)))</div><div class='add'>+	if (unlikely(hlist_unhashed(&amp;dentry-&gt;d_sib)))</div><div class='ctx'> 		return;</div><div class='del'>-	__list_del_entry(&amp;dentry-&gt;d_child);</div><div class='add'>+	__hlist_del(&amp;dentry-&gt;d_sib);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Cursors can move around the list of children.  While we'd been</div><div class='del'>-	 * a normal list member, it didn't matter - -&gt;d_child.next would've</div><div class='add'>+	 * a normal list member, it didn't matter - -&gt;d_sib.next would've</div><div class='ctx'> 	 * been updated.  However, from now on it won't be and for the</div><div class='ctx'> 	 * things like d_walk() it might end up with a nasty surprise.</div><div class='ctx'> 	 * Normally d_walk() doesn't care about cursors moving around -</div><div class='hunk'>@@ -533,29 +626,27 @@ static inline void dentry_unlist(struct dentry *dentry, struct dentry *parent)</div><div class='ctx'> 	 * of its own, we get through it without ever unlocking the parent.</div><div class='ctx'> 	 * There is one exception, though - if we ascend from a child that</div><div class='ctx'> 	 * gets killed as soon as we unlock it, the next sibling is found</div><div class='del'>-	 * using the value left in its -&gt;d_child.next.  And if _that_</div><div class='add'>+	 * using the value left in its -&gt;d_sib.next.  And if _that_</div><div class='ctx'> 	 * pointed to a cursor, and cursor got moved (e.g. by lseek())</div><div class='ctx'> 	 * before d_walk() regains parent-&gt;d_lock, we'll end up skipping</div><div class='ctx'> 	 * everything the cursor had been moved past.</div><div class='ctx'> 	 *</div><div class='del'>-	 * Solution: make sure that the pointer left behind in -&gt;d_child.next</div><div class='add'>+	 * Solution: make sure that the pointer left behind in -&gt;d_sib.next</div><div class='ctx'> 	 * points to something that won't be moving around.  I.e. skip the</div><div class='ctx'> 	 * cursors.</div><div class='ctx'> 	 */</div><div class='del'>-	while (dentry-&gt;d_child.next != &amp;parent-&gt;d_subdirs) {</div><div class='del'>-		next = list_entry(dentry-&gt;d_child.next, struct dentry, d_child);</div><div class='add'>+	while (dentry-&gt;d_sib.next) {</div><div class='add'>+		next = hlist_entry(dentry-&gt;d_sib.next, struct dentry, d_sib);</div><div class='ctx'> 		if (likely(!(next-&gt;d_flags &amp; DCACHE_DENTRY_CURSOR)))</div><div class='ctx'> 			break;</div><div class='del'>-		dentry-&gt;d_child.next = next-&gt;d_child.next;</div><div class='add'>+		dentry-&gt;d_sib.next = next-&gt;d_sib.next;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void __dentry_kill(struct dentry *dentry)</div><div class='add'>+static struct dentry *__dentry_kill(struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *parent = NULL;</div><div class='ctx'> 	bool can_free = true;</div><div class='del'>-	if (!IS_ROOT(dentry))</div><div class='del'>-		parent = dentry-&gt;d_parent;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The dentry is now unrecoverably dead to the world.</div><div class='hunk'>@@ -575,9 +666,6 @@ static void __dentry_kill(struct dentry *dentry)</div><div class='ctx'> 	}</div><div class='ctx'> 	/* if it was on the hash then remove it */</div><div class='ctx'> 	__d_drop(dentry);</div><div class='del'>-	dentry_unlist(dentry, parent);</div><div class='del'>-	if (parent)</div><div class='del'>-		spin_unlock(&amp;parent-&gt;d_lock);</div><div class='ctx'> 	if (dentry-&gt;d_inode)</div><div class='ctx'> 		dentry_unlink_inode(dentry);</div><div class='ctx'> 	else</div><div class='hunk'>@@ -586,80 +674,114 @@ static void __dentry_kill(struct dentry *dentry)</div><div class='ctx'> 	if (dentry-&gt;d_op &amp;&amp; dentry-&gt;d_op-&gt;d_release)</div><div class='ctx'> 		dentry-&gt;d_op-&gt;d_release(dentry);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;dentry-&gt;d_lock);</div><div class='del'>-	if (dentry-&gt;d_flags &amp; DCACHE_SHRINK_LIST) {</div><div class='del'>-		dentry-&gt;d_flags |= DCACHE_MAY_FREE;</div><div class='del'>-		can_free = false;</div><div class='add'>+	cond_resched();</div><div class='add'>+	/* now that it's negative, -&gt;d_parent is stable */</div><div class='add'>+	if (!IS_ROOT(dentry)) {</div><div class='add'>+		parent = dentry-&gt;d_parent;</div><div class='add'>+		spin_lock(&amp;parent-&gt;d_lock);</div><div class='ctx'> 	}</div><div class='add'>+	spin_lock_nested(&amp;dentry-&gt;d_lock, DENTRY_D_LOCK_NESTED);</div><div class='add'>+	dentry_unlist(dentry);</div><div class='add'>+	if (dentry-&gt;d_flags &amp; DCACHE_SHRINK_LIST)</div><div class='add'>+		can_free = false;</div><div class='ctx'> 	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 	if (likely(can_free))</div><div class='ctx'> 		dentry_free(dentry);</div><div class='del'>-	cond_resched();</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct dentry *__lock_parent(struct dentry *dentry)</div><div class='del'>-{</div><div class='del'>-	struct dentry *parent;</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='del'>-again:</div><div class='del'>-	parent = READ_ONCE(dentry-&gt;d_parent);</div><div class='del'>-	spin_lock(&amp;parent-&gt;d_lock);</div><div class='del'>-	/*</div><div class='del'>-	 * We can't blindly lock dentry until we are sure</div><div class='del'>-	 * that we won't violate the locking order.</div><div class='del'>-	 * Any changes of dentry-&gt;d_parent must have</div><div class='del'>-	 * been done with parent-&gt;d_lock held, so</div><div class='del'>-	 * spin_lock() above is enough of a barrier</div><div class='del'>-	 * for checking if it's still our child.</div><div class='del'>-	 */</div><div class='del'>-	if (unlikely(parent != dentry-&gt;d_parent)) {</div><div class='add'>+	if (parent &amp;&amp; --parent-&gt;d_lockref.count) {</div><div class='ctx'> 		spin_unlock(&amp;parent-&gt;d_lock);</div><div class='del'>-		goto again;</div><div class='add'>+		return NULL;</div><div class='ctx'> 	}</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-	if (parent != dentry)</div><div class='del'>-		spin_lock_nested(&amp;dentry-&gt;d_lock, DENTRY_D_LOCK_NESTED);</div><div class='del'>-	else</div><div class='del'>-		parent = NULL;</div><div class='ctx'> 	return parent;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline struct dentry *lock_parent(struct dentry *dentry)</div><div class='add'>+/*</div><div class='add'>+ * Lock a dentry for feeding it to __dentry_kill().</div><div class='add'>+ * Called under rcu_read_lock() and dentry-&gt;d_lock; the former</div><div class='add'>+ * guarantees that nothing we access will be freed under us.</div><div class='add'>+ * Note that dentry is *not* protected from concurrent dentry_kill(),</div><div class='add'>+ * d_delete(), etc.</div><div class='add'>+ *</div><div class='add'>+ * Return false if dentry is busy.  Otherwise, return true and have</div><div class='add'>+ * that dentry's inode locked.</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+static bool lock_for_kill(struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *parent = dentry-&gt;d_parent;</div><div class='del'>-	if (IS_ROOT(dentry))</div><div class='del'>-		return NULL;</div><div class='del'>-	if (likely(spin_trylock(&amp;parent-&gt;d_lock)))</div><div class='del'>-		return parent;</div><div class='del'>-	return __lock_parent(dentry);</div><div class='add'>+	struct inode *inode = dentry-&gt;d_inode;</div><div class='add'>+</div><div class='add'>+	if (unlikely(dentry-&gt;d_lockref.count))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	if (!inode || likely(spin_trylock(&amp;inode-&gt;i_lock)))</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='add'>+		spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+		spin_lock(&amp;dentry-&gt;d_lock);</div><div class='add'>+		if (likely(inode == dentry-&gt;d_inode))</div><div class='add'>+			break;</div><div class='add'>+		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+		inode = dentry-&gt;d_inode;</div><div class='add'>+	} while (inode);</div><div class='add'>+	if (likely(!dentry-&gt;d_lockref.count))</div><div class='add'>+		return true;</div><div class='add'>+	if (inode)</div><div class='add'>+		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline bool retain_dentry(struct dentry *dentry)</div><div class='add'>+/*</div><div class='add'>+ * Decide if dentry is worth retaining.  Usually this is called with dentry</div><div class='add'>+ * locked; if not locked, we are more limited and might not be able to tell</div><div class='add'>+ * without a lock.  False in this case means "punt to locked path and recheck".</div><div class='add'>+ *</div><div class='add'>+ * In case we aren't locked, these predicates are not "stable". However, it is</div><div class='add'>+ * sufficient that at some point after we dropped the reference the dentry was</div><div class='add'>+ * hashed and the flags had the proper value. Other dentry users may have</div><div class='add'>+ * re-gotten a reference to the dentry and change that, but our work is done -</div><div class='add'>+ * we can leave the dentry around with a zero refcount.</div><div class='add'>+ */</div><div class='add'>+static inline bool retain_dentry(struct dentry *dentry, bool locked)</div><div class='ctx'> {</div><div class='del'>-	WARN_ON(d_in_lookup(dentry));</div><div class='add'>+	unsigned int d_flags;</div><div class='add'>+</div><div class='add'>+	smp_rmb();</div><div class='add'>+	d_flags = READ_ONCE(dentry-&gt;d_flags);</div><div class='ctx'> </div><div class='del'>-	/* Unreachable? Get rid of it */</div><div class='add'>+	// Unreachable? Nobody would be able to look it up, no point retaining</div><div class='ctx'> 	if (unlikely(d_unhashed(dentry)))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(dentry-&gt;d_flags &amp; DCACHE_DISCONNECTED))</div><div class='add'>+	// Same if it's disconnected</div><div class='add'>+	if (unlikely(d_flags &amp; DCACHE_DISCONNECTED))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(dentry-&gt;d_flags &amp; DCACHE_OP_DELETE)) {</div><div class='del'>-		if (dentry-&gt;d_op-&gt;d_delete(dentry))</div><div class='add'>+	// -&gt;d_delete() might tell us not to bother, but that requires</div><div class='add'>+	// -&gt;d_lock; can't decide without it</div><div class='add'>+	if (unlikely(d_flags &amp; DCACHE_OP_DELETE)) {</div><div class='add'>+		if (!locked || dentry-&gt;d_op-&gt;d_delete(dentry))</div><div class='ctx'> 			return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (unlikely(dentry-&gt;d_flags &amp; DCACHE_DONTCACHE))</div><div class='add'>+	// Explicitly told not to bother</div><div class='add'>+	if (unlikely(d_flags &amp; DCACHE_DONTCACHE))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	/* retain; LRU fodder */</div><div class='del'>-	dentry-&gt;d_lockref.count--;</div><div class='del'>-	if (unlikely(!(dentry-&gt;d_flags &amp; DCACHE_LRU_LIST)))</div><div class='add'>+	// At this point it looks like we ought to keep it.  We also might</div><div class='add'>+	// need to do something - put it on LRU if it wasn't there already</div><div class='add'>+	// and mark it referenced if it was on LRU, but not marked yet.</div><div class='add'>+	// Unfortunately, both actions require -&gt;d_lock, so in lockless</div><div class='add'>+	// case we'd have to punt rather than doing those.</div><div class='add'>+	if (unlikely(!(d_flags &amp; DCACHE_LRU_LIST))) {</div><div class='add'>+		if (!locked)</div><div class='add'>+			return false;</div><div class='ctx'> 		d_lru_add(dentry);</div><div class='del'>-	else if (unlikely(!(dentry-&gt;d_flags &amp; DCACHE_REFERENCED)))</div><div class='add'>+	} else if (unlikely(!(d_flags &amp; DCACHE_REFERENCED))) {</div><div class='add'>+		if (!locked)</div><div class='add'>+			return false;</div><div class='ctx'> 		dentry-&gt;d_flags |= DCACHE_REFERENCED;</div><div class='add'>+	}</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -673,66 +795,17 @@ void d_mark_dontcache(struct inode *inode)</div><div class='ctx'> 		de-&gt;d_flags |= DCACHE_DONTCACHE;</div><div class='ctx'> 		spin_unlock(&amp;de-&gt;d_lock);</div><div class='ctx'> 	}</div><div class='del'>-	inode-&gt;i_state |= I_DONTCACHE;</div><div class='add'>+	inode_state_set(inode, I_DONTCACHE);</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(d_mark_dontcache);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Finish off a dentry we've decided to kill.</div><div class='del'>- * dentry-&gt;d_lock must be held, returns with it unlocked.</div><div class='del'>- * Returns dentry requiring refcount drop, or NULL if we're done.</div><div class='del'>- */</div><div class='del'>-static struct dentry *dentry_kill(struct dentry *dentry)</div><div class='del'>-	__releases(dentry-&gt;d_lock)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = dentry-&gt;d_inode;</div><div class='del'>-	struct dentry *parent = NULL;</div><div class='del'>-</div><div class='del'>-	if (inode &amp;&amp; unlikely(!spin_trylock(&amp;inode-&gt;i_lock)))</div><div class='del'>-		goto slow_positive;</div><div class='del'>-</div><div class='del'>-	if (!IS_ROOT(dentry)) {</div><div class='del'>-		parent = dentry-&gt;d_parent;</div><div class='del'>-		if (unlikely(!spin_trylock(&amp;parent-&gt;d_lock))) {</div><div class='del'>-			parent = __lock_parent(dentry);</div><div class='del'>-			if (likely(inode || !dentry-&gt;d_inode))</div><div class='del'>-				goto got_locks;</div><div class='del'>-			/* negative that became positive */</div><div class='del'>-			if (parent)</div><div class='del'>-				spin_unlock(&amp;parent-&gt;d_lock);</div><div class='del'>-			inode = dentry-&gt;d_inode;</div><div class='del'>-			goto slow_positive;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	__dentry_kill(dentry);</div><div class='del'>-	return parent;</div><div class='del'>-</div><div class='del'>-slow_positive:</div><div class='del'>-	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='del'>-	spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-	spin_lock(&amp;dentry-&gt;d_lock);</div><div class='del'>-	parent = lock_parent(dentry);</div><div class='del'>-got_locks:</div><div class='del'>-	if (unlikely(dentry-&gt;d_lockref.count != 1)) {</div><div class='del'>-		dentry-&gt;d_lockref.count--;</div><div class='del'>-	} else if (likely(!retain_dentry(dentry))) {</div><div class='del'>-		__dentry_kill(dentry);</div><div class='del'>-		return parent;</div><div class='del'>-	}</div><div class='del'>-	/* we are keeping it, after all */</div><div class='del'>-	if (inode)</div><div class='del'>-		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='del'>-	if (parent)</div><div class='del'>-		spin_unlock(&amp;parent-&gt;d_lock);</div><div class='del'>-	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * Try to do a lockless dput(), and return whether that was successful.</div><div class='ctx'>  *</div><div class='ctx'>  * If unsuccessful, we return false, having already taken the dentry lock.</div><div class='add'>+ * In that case refcount is guaranteed to be zero and we have already</div><div class='add'>+ * decided that it's not worth keeping around.</div><div class='ctx'>  *</div><div class='ctx'>  * The caller needs to hold the RCU read lock, so that the dentry is</div><div class='ctx'>  * guaranteed to stay around even if the refcount goes down to zero!</div><div class='hunk'>@@ -740,18 +813,9 @@ got_locks:</div><div class='ctx'> static inline bool fast_dput(struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='del'>-	unsigned int d_flags;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * If we have a d_op-&gt;d_delete() operation, we sould not</div><div class='del'>-	 * let the dentry count go to zero, so use "put_or_lock".</div><div class='del'>-	 */</div><div class='del'>-	if (unlikely(dentry-&gt;d_flags &amp; DCACHE_OP_DELETE))</div><div class='del'>-		return lockref_put_or_lock(&amp;dentry-&gt;d_lockref);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * .. otherwise, we can try to just decrement the</div><div class='del'>-	 * lockref optimistically.</div><div class='add'>+	 * try to decrement the lockref optimistically.</div><div class='ctx'> 	 */</div><div class='ctx'> 	ret = lockref_put_return(&amp;dentry-&gt;d_lockref);</div><div class='ctx'> </div><div class='hunk'>@@ -762,12 +826,12 @@ static inline bool fast_dput(struct dentry *dentry)</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (unlikely(ret &lt; 0)) {</div><div class='ctx'> 		spin_lock(&amp;dentry-&gt;d_lock);</div><div class='del'>-		if (dentry-&gt;d_lockref.count &gt; 1) {</div><div class='del'>-			dentry-&gt;d_lockref.count--;</div><div class='add'>+		if (WARN_ON_ONCE(dentry-&gt;d_lockref.count &lt;= 0)) {</div><div class='ctx'> 			spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 			return true;</div><div class='ctx'> 		}</div><div class='del'>-		return false;</div><div class='add'>+		dentry-&gt;d_lockref.count--;</div><div class='add'>+		goto locked;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -777,45 +841,18 @@ static inline bool fast_dput(struct dentry *dentry)</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Careful, careful. The reference count went down</div><div class='del'>-	 * to zero, but we don't hold the dentry lock, so</div><div class='del'>-	 * somebody else could get it again, and do another</div><div class='del'>-	 * dput(), and we need to not race with that.</div><div class='del'>-	 *</div><div class='del'>-	 * However, there is a very special and common case</div><div class='del'>-	 * where we don't care, because there is nothing to</div><div class='del'>-	 * do: the dentry is still hashed, it does not have</div><div class='del'>-	 * a 'delete' op, and it's referenced and already on</div><div class='del'>-	 * the LRU list.</div><div class='del'>-	 *</div><div class='del'>-	 * NOTE! Since we aren't locked, these values are</div><div class='del'>-	 * not "stable". However, it is sufficient that at</div><div class='del'>-	 * some point after we dropped the reference the</div><div class='del'>-	 * dentry was hashed and the flags had the proper</div><div class='del'>-	 * value. Other dentry users may have re-gotten</div><div class='del'>-	 * a reference to the dentry and change that, but</div><div class='del'>-	 * our work is done - we can leave the dentry</div><div class='del'>-	 * around with a zero refcount.</div><div class='del'>-	 *</div><div class='del'>-	 * Nevertheless, there are two cases that we should kill</div><div class='del'>-	 * the dentry anyway.</div><div class='del'>-	 * 1. free disconnected dentries as soon as their refcount</div><div class='del'>-	 *    reached zero.</div><div class='del'>-	 * 2. free dentries if they should not be cached.</div><div class='add'>+	 * Can we decide that decrement of refcount is all we needed without</div><div class='add'>+	 * taking the lock?  There's a very common case when it's all we need -</div><div class='add'>+	 * dentry looks like it ought to be retained and there's nothing else</div><div class='add'>+	 * to do.</div><div class='ctx'> 	 */</div><div class='del'>-	smp_rmb();</div><div class='del'>-	d_flags = READ_ONCE(dentry-&gt;d_flags);</div><div class='del'>-	d_flags &amp;= DCACHE_REFERENCED | DCACHE_LRU_LIST |</div><div class='del'>-			DCACHE_DISCONNECTED | DCACHE_DONTCACHE;</div><div class='del'>-</div><div class='del'>-	/* Nothing to do? Dropping the reference was all we needed? */</div><div class='del'>-	if (d_flags == (DCACHE_REFERENCED | DCACHE_LRU_LIST) &amp;&amp; !d_unhashed(dentry))</div><div class='add'>+	if (retain_dentry(dentry, false))</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Not the fast normal case? Get the lock. We've already decremented</div><div class='del'>-	 * the refcount, but we'll need to re-check the situation after</div><div class='del'>-	 * getting the lock.</div><div class='add'>+	 * Either not worth retaining or we can't tell without the lock.</div><div class='add'>+	 * Get the lock, then.  We've already decremented the refcount to 0,</div><div class='add'>+	 * but we'll need to re-check the situation after getting the lock.</div><div class='ctx'> 	 */</div><div class='ctx'> 	spin_lock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> </div><div class='hunk'>@@ -825,20 +862,32 @@ static inline bool fast_dput(struct dentry *dentry)</div><div class='ctx'> 	 * else could have killed it and marked it dead. Either way, we</div><div class='ctx'> 	 * don't need to do anything else.</div><div class='ctx'> 	 */</div><div class='del'>-	if (dentry-&gt;d_lockref.count) {</div><div class='add'>+locked:</div><div class='add'>+	if (dentry-&gt;d_lockref.count || retain_dentry(dentry, true)) {</div><div class='ctx'> 		spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 		return true;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Re-get the reference we optimistically dropped. We hold the</div><div class='del'>-	 * lock, and we just tested that it was zero, so we can just</div><div class='del'>-	 * set it to 1.</div><div class='del'>-	 */</div><div class='del'>-	dentry-&gt;d_lockref.count = 1;</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void finish_dput(struct dentry *dentry)</div><div class='add'>+	__releases(dentry-&gt;d_lock)</div><div class='add'>+	__releases(RCU)</div><div class='add'>+{</div><div class='add'>+	while (lock_for_kill(dentry)) {</div><div class='add'>+		rcu_read_unlock();</div><div class='add'>+		dentry = __dentry_kill(dentry);</div><div class='add'>+		if (!dentry)</div><div class='add'>+			return;</div><div class='add'>+		if (retain_dentry(dentry, true)) {</div><div class='add'>+			spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+		rcu_read_lock();</div><div class='add'>+	}</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /* </div><div class='ctx'>  * This is dput</div><div class='hunk'>@@ -868,39 +917,36 @@ static inline bool fast_dput(struct dentry *dentry)</div><div class='ctx'>  */</div><div class='ctx'> void dput(struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	while (dentry) {</div><div class='del'>-		might_sleep();</div><div class='del'>-</div><div class='del'>-		rcu_read_lock();</div><div class='del'>-		if (likely(fast_dput(dentry))) {</div><div class='del'>-			rcu_read_unlock();</div><div class='del'>-			return;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/* Slow case: now with the dentry lock held */</div><div class='add'>+	if (!dentry)</div><div class='add'>+		return;</div><div class='add'>+	might_sleep();</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	if (likely(fast_dput(dentry))) {</div><div class='ctx'> 		rcu_read_unlock();</div><div class='del'>-</div><div class='del'>-		if (likely(retain_dentry(dentry))) {</div><div class='del'>-			spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='del'>-			return;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		dentry = dentry_kill(dentry);</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='add'>+	finish_dput(dentry);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(dput);</div><div class='ctx'> </div><div class='del'>-static void __dput_to_list(struct dentry *dentry, struct list_head *list)</div><div class='add'>+void d_make_discardable(struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	spin_lock(&amp;dentry-&gt;d_lock);</div><div class='add'>+	WARN_ON(!(dentry-&gt;d_flags &amp; DCACHE_PERSISTENT));</div><div class='add'>+	dentry-&gt;d_flags &amp;= ~DCACHE_PERSISTENT;</div><div class='add'>+	dentry-&gt;d_lockref.count--;</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	finish_dput(dentry);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(d_make_discardable);</div><div class='add'>+</div><div class='add'>+static void to_shrink_list(struct dentry *dentry, struct list_head *list)</div><div class='ctx'> __must_hold(&amp;dentry-&gt;d_lock)</div><div class='ctx'> {</div><div class='del'>-	if (dentry-&gt;d_flags &amp; DCACHE_SHRINK_LIST) {</div><div class='del'>-		/* let the owner of the list it's on deal with it */</div><div class='del'>-		--dentry-&gt;d_lockref.count;</div><div class='del'>-	} else {</div><div class='add'>+	if (!(dentry-&gt;d_flags &amp; DCACHE_SHRINK_LIST)) {</div><div class='ctx'> 		if (dentry-&gt;d_flags &amp; DCACHE_LRU_LIST)</div><div class='ctx'> 			d_lru_del(dentry);</div><div class='del'>-		if (!--dentry-&gt;d_lockref.count)</div><div class='del'>-			d_shrink_add(dentry, list);</div><div class='add'>+		d_shrink_add(dentry, list);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -912,22 +958,10 @@ void dput_to_list(struct dentry *dentry, struct list_head *list)</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> 	rcu_read_unlock();</div><div class='del'>-	if (!retain_dentry(dentry))</div><div class='del'>-		__dput_to_list(dentry, list);</div><div class='add'>+	to_shrink_list(dentry, list);</div><div class='ctx'> 	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* This must be called with d_lock held */</div><div class='del'>-static inline void __dget_dlock(struct dentry *dentry)</div><div class='del'>-{</div><div class='del'>-	dentry-&gt;d_lockref.count++;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void __dget(struct dentry *dentry)</div><div class='del'>-{</div><div class='del'>-	lockref_get(&amp;dentry-&gt;d_lockref);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> struct dentry *dget_parent(struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	int gotref;</div><div class='hunk'>@@ -977,7 +1011,7 @@ static struct dentry * __d_find_any_alias(struct inode *inode)</div><div class='ctx'> 	if (hlist_empty(&amp;inode-&gt;i_dentry))</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	alias = hlist_entry(inode-&gt;i_dentry.first, struct dentry, d_u.d_alias);</div><div class='del'>-	__dget(alias);</div><div class='add'>+	lockref_get(&amp;alias-&gt;d_lockref);</div><div class='ctx'> 	return alias;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1009,7 +1043,7 @@ static struct dentry *__d_find_alias(struct inode *inode)</div><div class='ctx'> 	hlist_for_each_entry(alias, &amp;inode-&gt;i_dentry, d_u.d_alias) {</div><div class='ctx'> 		spin_lock(&amp;alias-&gt;d_lock);</div><div class='ctx'>  		if (!d_unhashed(alias)) {</div><div class='del'>-			__dget_dlock(alias);</div><div class='add'>+			dget_dlock(alias);</div><div class='ctx'> 			spin_unlock(&amp;alias-&gt;d_lock);</div><div class='ctx'> 			return alias;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1057,7 +1091,7 @@ struct dentry *d_find_alias_rcu(struct inode *inode)</div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	// -&gt;i_dentry and -&gt;i_rcu are colocated, but the latter won't be</div><div class='ctx'> 	// used without having I_FREEING set, which means no aliases left</div><div class='del'>-	if (likely(!(inode-&gt;i_state &amp; I_FREEING) &amp;&amp; !hlist_empty(l))) {</div><div class='add'>+	if (likely(!(inode_state_read(inode) &amp; I_FREEING) &amp;&amp; !hlist_empty(l))) {</div><div class='ctx'> 		if (S_ISDIR(inode-&gt;i_mode)) {</div><div class='ctx'> 			de = hlist_entry(l-&gt;first, struct dentry, d_u.d_alias);</div><div class='ctx'> 		} else {</div><div class='hunk'>@@ -1070,115 +1104,70 @@ struct dentry *d_find_alias_rcu(struct inode *inode)</div><div class='ctx'> 	return de;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void d_dispose_if_unused(struct dentry *dentry, struct list_head *dispose)</div><div class='add'>+{</div><div class='add'>+	spin_lock(&amp;dentry-&gt;d_lock);</div><div class='add'>+	if (!dentry-&gt;d_lockref.count)</div><div class='add'>+		to_shrink_list(dentry, dispose);</div><div class='add'>+	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(d_dispose_if_unused);</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  *	Try to kill dentries associated with this inode.</div><div class='ctx'>  * WARNING: you must own a reference to inode.</div><div class='ctx'>  */</div><div class='ctx'> void d_prune_aliases(struct inode *inode)</div><div class='ctx'> {</div><div class='add'>+	LIST_HEAD(dispose);</div><div class='ctx'> 	struct dentry *dentry;</div><div class='del'>-restart:</div><div class='add'>+</div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-	hlist_for_each_entry(dentry, &amp;inode-&gt;i_dentry, d_u.d_alias) {</div><div class='del'>-		spin_lock(&amp;dentry-&gt;d_lock);</div><div class='del'>-		if (!dentry-&gt;d_lockref.count) {</div><div class='del'>-			struct dentry *parent = lock_parent(dentry);</div><div class='del'>-			if (likely(!dentry-&gt;d_lockref.count)) {</div><div class='del'>-				__dentry_kill(dentry);</div><div class='del'>-				dput(parent);</div><div class='del'>-				goto restart;</div><div class='del'>-			}</div><div class='del'>-			if (parent)</div><div class='del'>-				spin_unlock(&amp;parent-&gt;d_lock);</div><div class='del'>-		}</div><div class='del'>-		spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='del'>-	}</div><div class='add'>+	hlist_for_each_entry(dentry, &amp;inode-&gt;i_dentry, d_u.d_alias)</div><div class='add'>+		d_dispose_if_unused(dentry, &amp;dispose);</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+	shrink_dentry_list(&amp;dispose);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(d_prune_aliases);</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Lock a dentry from shrink list.</div><div class='del'>- * Called under rcu_read_lock() and dentry-&gt;d_lock; the former</div><div class='del'>- * guarantees that nothing we access will be freed under us.</div><div class='del'>- * Note that dentry is *not* protected from concurrent dentry_kill(),</div><div class='del'>- * d_delete(), etc.</div><div class='del'>- *</div><div class='del'>- * Return false if dentry has been disrupted or grabbed, leaving</div><div class='del'>- * the caller to kick it off-list.  Otherwise, return true and have</div><div class='del'>- * that dentry's inode and parent both locked.</div><div class='del'>- */</div><div class='del'>-static bool shrink_lock_dentry(struct dentry *dentry)</div><div class='add'>+static inline void shrink_kill(struct dentry *victim)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	struct dentry *parent;</div><div class='del'>-</div><div class='del'>-	if (dentry-&gt;d_lockref.count)</div><div class='del'>-		return false;</div><div class='del'>-</div><div class='del'>-	inode = dentry-&gt;d_inode;</div><div class='del'>-	if (inode &amp;&amp; unlikely(!spin_trylock(&amp;inode-&gt;i_lock))) {</div><div class='del'>-		spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='del'>-		spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-		spin_lock(&amp;dentry-&gt;d_lock);</div><div class='del'>-		if (unlikely(dentry-&gt;d_lockref.count))</div><div class='del'>-			goto out;</div><div class='del'>-		/* changed inode means that somebody had grabbed it */</div><div class='del'>-		if (unlikely(inode != dentry-&gt;d_inode))</div><div class='del'>-			goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	parent = dentry-&gt;d_parent;</div><div class='del'>-	if (IS_ROOT(dentry) || likely(spin_trylock(&amp;parent-&gt;d_lock)))</div><div class='del'>-		return true;</div><div class='del'>-</div><div class='del'>-	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='del'>-	spin_lock(&amp;parent-&gt;d_lock);</div><div class='del'>-	if (unlikely(parent != dentry-&gt;d_parent)) {</div><div class='del'>-		spin_unlock(&amp;parent-&gt;d_lock);</div><div class='del'>-		spin_lock(&amp;dentry-&gt;d_lock);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	spin_lock_nested(&amp;dentry-&gt;d_lock, DENTRY_D_LOCK_NESTED);</div><div class='del'>-	if (likely(!dentry-&gt;d_lockref.count))</div><div class='del'>-		return true;</div><div class='del'>-	spin_unlock(&amp;parent-&gt;d_lock);</div><div class='del'>-out:</div><div class='del'>-	if (inode)</div><div class='del'>-		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='del'>-	return false;</div><div class='add'>+	do {</div><div class='add'>+		rcu_read_unlock();</div><div class='add'>+		victim = __dentry_kill(victim);</div><div class='add'>+		rcu_read_lock();</div><div class='add'>+	} while (victim &amp;&amp; lock_for_kill(victim));</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+	if (victim)</div><div class='add'>+		spin_unlock(&amp;victim-&gt;d_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void shrink_dentry_list(struct list_head *list)</div><div class='ctx'> {</div><div class='ctx'> 	while (!list_empty(list)) {</div><div class='del'>-		struct dentry *dentry, *parent;</div><div class='add'>+		struct dentry *dentry;</div><div class='ctx'> </div><div class='ctx'> 		dentry = list_entry(list-&gt;prev, struct dentry, d_lru);</div><div class='ctx'> 		spin_lock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 		rcu_read_lock();</div><div class='del'>-		if (!shrink_lock_dentry(dentry)) {</div><div class='del'>-			bool can_free = false;</div><div class='add'>+		if (!lock_for_kill(dentry)) {</div><div class='add'>+			bool can_free;</div><div class='ctx'> 			rcu_read_unlock();</div><div class='ctx'> 			d_shrink_del(dentry);</div><div class='del'>-			if (dentry-&gt;d_lockref.count &lt; 0)</div><div class='del'>-				can_free = dentry-&gt;d_flags &amp; DCACHE_MAY_FREE;</div><div class='add'>+			can_free = dentry-&gt;d_flags &amp; DCACHE_DENTRY_KILLED;</div><div class='ctx'> 			spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 			if (can_free)</div><div class='ctx'> 				dentry_free(dentry);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='del'>-		rcu_read_unlock();</div><div class='ctx'> 		d_shrink_del(dentry);</div><div class='del'>-		parent = dentry-&gt;d_parent;</div><div class='del'>-		if (parent != dentry)</div><div class='del'>-			__dput_to_list(parent, list);</div><div class='del'>-		__dentry_kill(dentry);</div><div class='add'>+		shrink_kill(dentry);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL(shrink_dentry_list);</div><div class='ctx'> </div><div class='ctx'> static enum lru_status dentry_lru_isolate(struct list_head *item,</div><div class='del'>-		struct list_lru_one *lru, spinlock_t *lru_lock, void *arg)</div><div class='add'>+		struct list_lru_one *lru, void *arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct list_head *freeable = arg;</div><div class='ctx'> 	struct dentry	*dentry = container_of(item, struct dentry, d_lru);</div><div class='hunk'>@@ -1215,7 +1204,7 @@ static enum lru_status dentry_lru_isolate(struct list_head *item,</div><div class='ctx'> 		 *</div><div class='ctx'> 		 * This is guaranteed by the fact that all LRU management</div><div class='ctx'> 		 * functions are intermediated by the LRU API calls like</div><div class='del'>-		 * list_lru_add and list_lru_del. List movement in this file</div><div class='add'>+		 * list_lru_add_obj and list_lru_del_obj. List movement in this file</div><div class='ctx'> 		 * only ever occur through this functions or through callbacks</div><div class='ctx'> 		 * like this one, that are called from the LRU API.</div><div class='ctx'> 		 *</div><div class='hunk'>@@ -1259,7 +1248,7 @@ long prune_dcache_sb(struct super_block *sb, struct shrink_control *sc)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static enum lru_status dentry_lru_isolate_shrink(struct list_head *item,</div><div class='del'>-		struct list_lru_one *lru, spinlock_t *lru_lock, void *arg)</div><div class='add'>+		struct list_lru_one *lru, void *arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct list_head *freeable = arg;</div><div class='ctx'> 	struct dentry	*dentry = container_of(item, struct dentry, d_lru);</div><div class='hunk'>@@ -1323,8 +1312,7 @@ enum d_walk_ret {</div><div class='ctx'> static void d_walk(struct dentry *parent, void *data,</div><div class='ctx'> 		   enum d_walk_ret (*enter)(void *, struct dentry *))</div><div class='ctx'> {</div><div class='del'>-	struct dentry *this_parent;</div><div class='del'>-	struct list_head *next;</div><div class='add'>+	struct dentry *this_parent, *dentry;</div><div class='ctx'> 	unsigned seq = 0;</div><div class='ctx'> 	enum d_walk_ret ret;</div><div class='ctx'> 	bool retry = true;</div><div class='hunk'>@@ -1346,13 +1334,9 @@ again:</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='ctx'> repeat:</div><div class='del'>-	next = this_parent-&gt;d_subdirs.next;</div><div class='add'>+	dentry = d_first_child(this_parent);</div><div class='ctx'> resume:</div><div class='del'>-	while (next != &amp;this_parent-&gt;d_subdirs) {</div><div class='del'>-		struct list_head *tmp = next;</div><div class='del'>-		struct dentry *dentry = list_entry(tmp, struct dentry, d_child);</div><div class='del'>-		next = tmp-&gt;next;</div><div class='del'>-</div><div class='add'>+	hlist_for_each_entry_from(dentry, d_sib) {</div><div class='ctx'> 		if (unlikely(dentry-&gt;d_flags &amp; DCACHE_DENTRY_CURSOR))</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='hunk'>@@ -1373,7 +1357,7 @@ resume:</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (!list_empty(&amp;dentry-&gt;d_subdirs)) {</div><div class='add'>+		if (!hlist_empty(&amp;dentry-&gt;d_children)) {</div><div class='ctx'> 			spin_unlock(&amp;this_parent-&gt;d_lock);</div><div class='ctx'> 			spin_release(&amp;dentry-&gt;d_lock.dep_map, _RET_IP_);</div><div class='ctx'> 			this_parent = dentry;</div><div class='hunk'>@@ -1388,24 +1372,23 @@ resume:</div><div class='ctx'> 	rcu_read_lock();</div><div class='ctx'> ascend:</div><div class='ctx'> 	if (this_parent != parent) {</div><div class='del'>-		struct dentry *child = this_parent;</div><div class='del'>-		this_parent = child-&gt;d_parent;</div><div class='add'>+		dentry = this_parent;</div><div class='add'>+		this_parent = dentry-&gt;d_parent;</div><div class='ctx'> </div><div class='del'>-		spin_unlock(&amp;child-&gt;d_lock);</div><div class='add'>+		spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 		spin_lock(&amp;this_parent-&gt;d_lock);</div><div class='ctx'> </div><div class='ctx'> 		/* might go back up the wrong parent if we have had a rename. */</div><div class='ctx'> 		if (need_seqretry(&amp;rename_lock, seq))</div><div class='ctx'> 			goto rename_retry;</div><div class='ctx'> 		/* go into the first sibling still alive */</div><div class='del'>-		do {</div><div class='del'>-			next = child-&gt;d_child.next;</div><div class='del'>-			if (next == &amp;this_parent-&gt;d_subdirs)</div><div class='del'>-				goto ascend;</div><div class='del'>-			child = list_entry(next, struct dentry, d_child);</div><div class='del'>-		} while (unlikely(child-&gt;d_flags &amp; DCACHE_DENTRY_KILLED));</div><div class='del'>-		rcu_read_unlock();</div><div class='del'>-		goto resume;</div><div class='add'>+		hlist_for_each_entry_continue(dentry, d_sib) {</div><div class='add'>+			if (likely(!(dentry-&gt;d_flags &amp; DCACHE_DENTRY_KILLED))) {</div><div class='add'>+				rcu_read_unlock();</div><div class='add'>+				goto resume;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+		goto ascend;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (need_seqretry(&amp;rename_lock, seq))</div><div class='ctx'> 		goto rename_retry;</div><div class='hunk'>@@ -1431,6 +1414,7 @@ struct check_mount {</div><div class='ctx'> 	unsigned int mounted;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+/* locks: mount_locked_reader &amp;&amp; dentry-&gt;d_lock */</div><div class='ctx'> static enum d_walk_ret path_check_mount(void *data, struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	struct check_mount *info = data;</div><div class='hunk'>@@ -1457,9 +1441,8 @@ int path_has_submounts(const struct path *parent)</div><div class='ctx'> {</div><div class='ctx'> 	struct check_mount data = { .mnt = parent-&gt;mnt, .mounted = 0 };</div><div class='ctx'> </div><div class='del'>-	read_seqlock_excl(&amp;mount_lock);</div><div class='add'>+	guard(mount_locked_reader)();</div><div class='ctx'> 	d_walk(parent-&gt;dentry, &amp;data, path_check_mount);</div><div class='del'>-	read_sequnlock_excl(&amp;mount_lock);</div><div class='ctx'> </div><div class='ctx'> 	return data.mounted;</div><div class='ctx'> }</div><div class='hunk'>@@ -1477,7 +1460,7 @@ int d_set_mounted(struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *p;</div><div class='ctx'> 	int ret = -ENOENT;</div><div class='del'>-	write_seqlock(&amp;rename_lock);</div><div class='add'>+	read_seqlock_excl(&amp;rename_lock);</div><div class='ctx'> 	for (p = dentry-&gt;d_parent; !IS_ROOT(p); p = p-&gt;d_parent) {</div><div class='ctx'> 		/* Need exclusion wrt. d_invalidate() */</div><div class='ctx'> 		spin_lock(&amp;p-&gt;d_lock);</div><div class='hunk'>@@ -1497,7 +1480,7 @@ int d_set_mounted(struct dentry *dentry)</div><div class='ctx'> 	}</div><div class='ctx'>  	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> out:</div><div class='del'>-	write_sequnlock(&amp;rename_lock);</div><div class='add'>+	read_sequnlock_excl(&amp;rename_lock);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1505,7 +1488,7 @@ out:</div><div class='ctx'>  * Search the dentry child list of the specified parent,</div><div class='ctx'>  * and move any unused dentries to the end of the unused</div><div class='ctx'>  * list for prune_dcache(). We descend to the next level</div><div class='del'>- * whenever the d_subdirs list is non-empty and continue</div><div class='add'>+ * whenever the d_children list is non-empty and continue</div><div class='ctx'>  * searching.</div><div class='ctx'>  *</div><div class='ctx'>  * It returns zero iff there are no unused children,</div><div class='hunk'>@@ -1535,13 +1518,11 @@ static enum d_walk_ret select_collect(void *_data, struct dentry *dentry)</div><div class='ctx'> </div><div class='ctx'> 	if (dentry-&gt;d_flags &amp; DCACHE_SHRINK_LIST) {</div><div class='ctx'> 		data-&gt;found++;</div><div class='del'>-	} else {</div><div class='del'>-		if (dentry-&gt;d_flags &amp; DCACHE_LRU_LIST)</div><div class='del'>-			d_lru_del(dentry);</div><div class='del'>-		if (!dentry-&gt;d_lockref.count) {</div><div class='del'>-			d_shrink_add(dentry, &amp;data-&gt;dispose);</div><div class='del'>-			data-&gt;found++;</div><div class='del'>-		}</div><div class='add'>+	} else if (!dentry-&gt;d_lockref.count) {</div><div class='add'>+		to_shrink_list(dentry, &amp;data-&gt;dispose);</div><div class='add'>+		data-&gt;found++;</div><div class='add'>+	} else if (dentry-&gt;d_lockref.count &lt; 0) {</div><div class='add'>+		data-&gt;found++;</div><div class='ctx'> 	}</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We can return to the caller if we have found some (this</div><div class='hunk'>@@ -1554,6 +1535,15 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static enum d_walk_ret select_collect_umount(void *_data, struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	if (dentry-&gt;d_flags &amp; DCACHE_PERSISTENT) {</div><div class='add'>+		dentry-&gt;d_flags &amp;= ~DCACHE_PERSISTENT;</div><div class='add'>+		dentry-&gt;d_lockref.count--;</div><div class='add'>+	}</div><div class='add'>+	return select_collect(_data, dentry);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static enum d_walk_ret select_collect2(void *_data, struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	struct select_data *data = _data;</div><div class='hunk'>@@ -1562,17 +1552,13 @@ static enum d_walk_ret select_collect2(void *_data, struct dentry *dentry)</div><div class='ctx'> 	if (data-&gt;start == dentry)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	if (dentry-&gt;d_flags &amp; DCACHE_SHRINK_LIST) {</div><div class='del'>-		if (!dentry-&gt;d_lockref.count) {</div><div class='add'>+	if (!dentry-&gt;d_lockref.count) {</div><div class='add'>+		if (dentry-&gt;d_flags &amp; DCACHE_SHRINK_LIST) {</div><div class='ctx'> 			rcu_read_lock();</div><div class='ctx'> 			data-&gt;victim = dentry;</div><div class='ctx'> 			return D_WALK_QUIT;</div><div class='ctx'> 		}</div><div class='del'>-	} else {</div><div class='del'>-		if (dentry-&gt;d_flags &amp; DCACHE_LRU_LIST)</div><div class='del'>-			d_lru_del(dentry);</div><div class='del'>-		if (!dentry-&gt;d_lockref.count)</div><div class='del'>-			d_shrink_add(dentry, &amp;data-&gt;dispose);</div><div class='add'>+		to_shrink_list(dentry, &amp;data-&gt;dispose);</div><div class='ctx'> 	}</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We can return to the caller if we have found some (this</div><div class='hunk'>@@ -1586,18 +1572,20 @@ out:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * shrink_dcache_parent - prune dcache</div><div class='add'>+ * shrink_dcache_tree - prune dcache</div><div class='ctx'>  * @parent: parent of entries to prune</div><div class='add'>+ * @for_umount: true if we want to unpin the persistent ones</div><div class='ctx'>  *</div><div class='ctx'>  * Prune the dcache to remove unused children of the parent dentry.</div><div class='ctx'>  */</div><div class='del'>-void shrink_dcache_parent(struct dentry *parent)</div><div class='add'>+static void shrink_dcache_tree(struct dentry *parent, bool for_umount)</div><div class='ctx'> {</div><div class='ctx'> 	for (;;) {</div><div class='ctx'> 		struct select_data data = {.start = parent};</div><div class='ctx'> </div><div class='ctx'> 		INIT_LIST_HEAD(&amp;data.dispose);</div><div class='del'>-		d_walk(parent, &amp;data, select_collect);</div><div class='add'>+		d_walk(parent, &amp;data,</div><div class='add'>+			for_umount ? select_collect_umount : select_collect);</div><div class='ctx'> </div><div class='ctx'> 		if (!list_empty(&amp;data.dispose)) {</div><div class='ctx'> 			shrink_dentry_list(&amp;data.dispose);</div><div class='hunk'>@@ -1610,36 +1598,36 @@ void shrink_dcache_parent(struct dentry *parent)</div><div class='ctx'> 		data.victim = NULL;</div><div class='ctx'> 		d_walk(parent, &amp;data, select_collect2);</div><div class='ctx'> 		if (data.victim) {</div><div class='del'>-			struct dentry *parent;</div><div class='ctx'> 			spin_lock(&amp;data.victim-&gt;d_lock);</div><div class='del'>-			if (!shrink_lock_dentry(data.victim)) {</div><div class='add'>+			if (!lock_for_kill(data.victim)) {</div><div class='ctx'> 				spin_unlock(&amp;data.victim-&gt;d_lock);</div><div class='ctx'> 				rcu_read_unlock();</div><div class='ctx'> 			} else {</div><div class='del'>-				rcu_read_unlock();</div><div class='del'>-				parent = data.victim-&gt;d_parent;</div><div class='del'>-				if (parent != data.victim)</div><div class='del'>-					__dput_to_list(parent, &amp;data.dispose);</div><div class='del'>-				__dentry_kill(data.victim);</div><div class='add'>+				shrink_kill(data.victim);</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 		if (!list_empty(&amp;data.dispose))</div><div class='ctx'> 			shrink_dentry_list(&amp;data.dispose);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+void shrink_dcache_parent(struct dentry *parent)</div><div class='add'>+{</div><div class='add'>+	shrink_dcache_tree(parent, false);</div><div class='add'>+}</div><div class='ctx'> EXPORT_SYMBOL(shrink_dcache_parent);</div><div class='ctx'> </div><div class='ctx'> static enum d_walk_ret umount_check(void *_data, struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	/* it has busy descendents; complain about those instead */</div><div class='del'>-	if (!list_empty(&amp;dentry-&gt;d_subdirs))</div><div class='add'>+	if (!hlist_empty(&amp;dentry-&gt;d_children))</div><div class='ctx'> 		return D_WALK_CONTINUE;</div><div class='ctx'> </div><div class='ctx'> 	/* root with refcount 1 is fine */</div><div class='ctx'> 	if (dentry == _data &amp;&amp; dentry-&gt;d_lockref.count == 1)</div><div class='ctx'> 		return D_WALK_CONTINUE;</div><div class='ctx'> </div><div class='del'>-	printk(KERN_ERR "BUG: Dentry %p{i=%lx,n=%pd} "</div><div class='add'>+	WARN(1, "BUG: Dentry %p{i=%lx,n=%pd} "</div><div class='ctx'> 			" still in use (%d) [unmount of %s %s]\n",</div><div class='ctx'> 		       dentry,</div><div class='ctx'> 		       dentry-&gt;d_inode ?</div><div class='hunk'>@@ -1648,13 +1636,12 @@ static enum d_walk_ret umount_check(void *_data, struct dentry *dentry)</div><div class='ctx'> 		       dentry-&gt;d_lockref.count,</div><div class='ctx'> 		       dentry-&gt;d_sb-&gt;s_type-&gt;name,</div><div class='ctx'> 		       dentry-&gt;d_sb-&gt;s_id);</div><div class='del'>-	WARN_ON(1);</div><div class='ctx'> 	return D_WALK_CONTINUE;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void do_one_tree(struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	shrink_dcache_parent(dentry);</div><div class='add'>+	shrink_dcache_tree(dentry, true);</div><div class='ctx'> 	d_walk(dentry, dentry, umount_check);</div><div class='ctx'> 	d_drop(dentry);</div><div class='ctx'> 	dput(dentry);</div><div class='hunk'>@@ -1667,7 +1654,7 @@ void shrink_dcache_for_umount(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dentry;</div><div class='ctx'> </div><div class='del'>-	WARN(down_read_trylock(&amp;sb-&gt;s_umount), "s_umount should've been locked");</div><div class='add'>+	rwsem_assert_held_write(&amp;sb-&gt;s_umount);</div><div class='ctx'> </div><div class='ctx'> 	dentry = sb-&gt;s_root;</div><div class='ctx'> 	sb-&gt;s_root = NULL;</div><div class='hunk'>@@ -1683,8 +1670,7 @@ static enum d_walk_ret find_submount(void *_data, struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry **victim = _data;</div><div class='ctx'> 	if (d_mountpoint(dentry)) {</div><div class='del'>-		__dget_dlock(dentry);</div><div class='del'>-		*victim = dentry;</div><div class='add'>+		*victim = dget_dlock(dentry);</div><div class='ctx'> 		return D_WALK_QUIT;</div><div class='ctx'> 	}</div><div class='ctx'> 	return D_WALK_CONTINUE;</div><div class='hunk'>@@ -1741,7 +1727,8 @@ static struct dentry *__d_alloc(struct super_block *sb, const struct qstr *name)</div><div class='ctx'> 	char *dname;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	dentry = kmem_cache_alloc(dentry_cache, GFP_KERNEL);</div><div class='add'>+	dentry = kmem_cache_alloc_lru(dentry_cache, &amp;sb-&gt;s_dentry_lru,</div><div class='add'>+				      GFP_KERNEL);</div><div class='ctx'> 	if (!dentry)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='hunk'>@@ -1751,10 +1738,10 @@ static struct dentry *__d_alloc(struct super_block *sb, const struct qstr *name)</div><div class='ctx'> 	 * will still always have a NUL at the end, even if we might</div><div class='ctx'> 	 * be overwriting an internal NUL character</div><div class='ctx'> 	 */</div><div class='del'>-	dentry-&gt;d_iname[DNAME_INLINE_LEN-1] = 0;</div><div class='add'>+	dentry-&gt;d_shortname.string[DNAME_INLINE_LEN-1] = 0;</div><div class='ctx'> 	if (unlikely(!name)) {</div><div class='ctx'> 		name = &amp;slash_name;</div><div class='del'>-		dname = dentry-&gt;d_iname;</div><div class='add'>+		dname = dentry-&gt;d_shortname.string;</div><div class='ctx'> 	} else if (name-&gt;len &gt; DNAME_INLINE_LEN-1) {</div><div class='ctx'> 		size_t size = offsetof(struct external_name, name[1]);</div><div class='ctx'> 		struct external_name *p = kmalloc(size + name-&gt;len,</div><div class='hunk'>@@ -1764,35 +1751,34 @@ static struct dentry *__d_alloc(struct super_block *sb, const struct qstr *name)</div><div class='ctx'> 			kmem_cache_free(dentry_cache, dentry); </div><div class='ctx'> 			return NULL;</div><div class='ctx'> 		}</div><div class='del'>-		atomic_set(&amp;p-&gt;u.count, 1);</div><div class='add'>+		atomic_set(&amp;p-&gt;count, 1);</div><div class='ctx'> 		dname = p-&gt;name;</div><div class='ctx'> 	} else  {</div><div class='del'>-		dname = dentry-&gt;d_iname;</div><div class='add'>+		dname = dentry-&gt;d_shortname.string;</div><div class='ctx'> 	}	</div><div class='ctx'> </div><div class='del'>-	dentry-&gt;d_name.len = name-&gt;len;</div><div class='del'>-	dentry-&gt;d_name.hash = name-&gt;hash;</div><div class='add'>+	dentry-&gt;__d_name.len = name-&gt;len;</div><div class='add'>+	dentry-&gt;__d_name.hash = name-&gt;hash;</div><div class='ctx'> 	memcpy(dname, name-&gt;name, name-&gt;len);</div><div class='ctx'> 	dname[name-&gt;len] = 0;</div><div class='ctx'> </div><div class='ctx'> 	/* Make sure we always see the terminating NUL character */</div><div class='del'>-	smp_store_release(&amp;dentry-&gt;d_name.name, dname); /* ^^^ */</div><div class='add'>+	smp_store_release(&amp;dentry-&gt;__d_name.name, dname); /* ^^^ */</div><div class='ctx'> </div><div class='del'>-	dentry-&gt;d_lockref.count = 1;</div><div class='ctx'> 	dentry-&gt;d_flags = 0;</div><div class='del'>-	spin_lock_init(&amp;dentry-&gt;d_lock);</div><div class='add'>+	lockref_init(&amp;dentry-&gt;d_lockref);</div><div class='ctx'> 	seqcount_spinlock_init(&amp;dentry-&gt;d_seq, &amp;dentry-&gt;d_lock);</div><div class='ctx'> 	dentry-&gt;d_inode = NULL;</div><div class='ctx'> 	dentry-&gt;d_parent = dentry;</div><div class='ctx'> 	dentry-&gt;d_sb = sb;</div><div class='del'>-	dentry-&gt;d_op = NULL;</div><div class='add'>+	dentry-&gt;d_op = sb-&gt;__s_d_op;</div><div class='add'>+	dentry-&gt;d_flags = sb-&gt;s_d_flags;</div><div class='ctx'> 	dentry-&gt;d_fsdata = NULL;</div><div class='ctx'> 	INIT_HLIST_BL_NODE(&amp;dentry-&gt;d_hash);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;dentry-&gt;d_lru);</div><div class='del'>-	INIT_LIST_HEAD(&amp;dentry-&gt;d_subdirs);</div><div class='add'>+	INIT_HLIST_HEAD(&amp;dentry-&gt;d_children);</div><div class='ctx'> 	INIT_HLIST_NODE(&amp;dentry-&gt;d_u.d_alias);</div><div class='del'>-	INIT_LIST_HEAD(&amp;dentry-&gt;d_child);</div><div class='del'>-	d_set_d_op(dentry, dentry-&gt;d_sb-&gt;s_d_op);</div><div class='add'>+	INIT_HLIST_NODE(&amp;dentry-&gt;d_sib);</div><div class='ctx'> </div><div class='ctx'> 	if (dentry-&gt;d_op &amp;&amp; dentry-&gt;d_op-&gt;d_init) {</div><div class='ctx'> 		err = dentry-&gt;d_op-&gt;d_init(dentry);</div><div class='hunk'>@@ -1828,9 +1814,8 @@ struct dentry *d_alloc(struct dentry * parent, const struct qstr *name)</div><div class='ctx'> 	 * don't need child lock because it is not subject</div><div class='ctx'> 	 * to concurrency here</div><div class='ctx'> 	 */</div><div class='del'>-	__dget_dlock(parent);</div><div class='del'>-	dentry-&gt;d_parent = parent;</div><div class='del'>-	list_add(&amp;dentry-&gt;d_child, &amp;parent-&gt;d_subdirs);</div><div class='add'>+	dentry-&gt;d_parent = dget_dlock(parent);</div><div class='add'>+	hlist_add_head(&amp;dentry-&gt;d_sib, &amp;parent-&gt;d_children);</div><div class='ctx'> 	spin_unlock(&amp;parent-&gt;d_lock);</div><div class='ctx'> </div><div class='ctx'> 	return dentry;</div><div class='hunk'>@@ -1870,9 +1855,16 @@ struct dentry *d_alloc_cursor(struct dentry * parent)</div><div class='ctx'>  */</div><div class='ctx'> struct dentry *d_alloc_pseudo(struct super_block *sb, const struct qstr *name)</div><div class='ctx'> {</div><div class='add'>+	static const struct dentry_operations anon_ops = {</div><div class='add'>+		.d_dname = simple_dname</div><div class='add'>+	};</div><div class='ctx'> 	struct dentry *dentry = __d_alloc(sb, name);</div><div class='del'>-	if (likely(dentry))</div><div class='add'>+	if (likely(dentry)) {</div><div class='ctx'> 		dentry-&gt;d_flags |= DCACHE_NORCU;</div><div class='add'>+		/* d_op_flags(&amp;anon_ops) is 0 */</div><div class='add'>+		if (!dentry-&gt;d_op)</div><div class='add'>+			dentry-&gt;d_op = &amp;anon_ops;</div><div class='add'>+	}</div><div class='ctx'> 	return dentry;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1886,51 +1878,50 @@ struct dentry *d_alloc_name(struct dentry *parent, const char *name)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(d_alloc_name);</div><div class='ctx'> </div><div class='del'>-void d_set_d_op(struct dentry *dentry, const struct dentry_operations *op)</div><div class='add'>+#define DCACHE_OP_FLAGS \</div><div class='add'>+	(DCACHE_OP_HASH | DCACHE_OP_COMPARE | DCACHE_OP_REVALIDATE | \</div><div class='add'>+	 DCACHE_OP_WEAK_REVALIDATE | DCACHE_OP_DELETE | DCACHE_OP_PRUNE | \</div><div class='add'>+	 DCACHE_OP_REAL)</div><div class='add'>+</div><div class='add'>+static unsigned int d_op_flags(const struct dentry_operations *op)</div><div class='add'>+{</div><div class='add'>+	unsigned int flags = 0;</div><div class='add'>+	if (op) {</div><div class='add'>+		if (op-&gt;d_hash)</div><div class='add'>+			flags |= DCACHE_OP_HASH;</div><div class='add'>+		if (op-&gt;d_compare)</div><div class='add'>+			flags |= DCACHE_OP_COMPARE;</div><div class='add'>+		if (op-&gt;d_revalidate)</div><div class='add'>+			flags |= DCACHE_OP_REVALIDATE;</div><div class='add'>+		if (op-&gt;d_weak_revalidate)</div><div class='add'>+			flags |= DCACHE_OP_WEAK_REVALIDATE;</div><div class='add'>+		if (op-&gt;d_delete)</div><div class='add'>+			flags |= DCACHE_OP_DELETE;</div><div class='add'>+		if (op-&gt;d_prune)</div><div class='add'>+			flags |= DCACHE_OP_PRUNE;</div><div class='add'>+		if (op-&gt;d_real)</div><div class='add'>+			flags |= DCACHE_OP_REAL;</div><div class='add'>+	}</div><div class='add'>+	return flags;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void d_set_d_op(struct dentry *dentry, const struct dentry_operations *op)</div><div class='ctx'> {</div><div class='add'>+	unsigned int flags = d_op_flags(op);</div><div class='ctx'> 	WARN_ON_ONCE(dentry-&gt;d_op);</div><div class='del'>-	WARN_ON_ONCE(dentry-&gt;d_flags &amp; (DCACHE_OP_HASH	|</div><div class='del'>-				DCACHE_OP_COMPARE	|</div><div class='del'>-				DCACHE_OP_REVALIDATE	|</div><div class='del'>-				DCACHE_OP_WEAK_REVALIDATE	|</div><div class='del'>-				DCACHE_OP_DELETE	|</div><div class='del'>-				DCACHE_OP_REAL));</div><div class='add'>+	WARN_ON_ONCE(dentry-&gt;d_flags &amp; DCACHE_OP_FLAGS);</div><div class='ctx'> 	dentry-&gt;d_op = op;</div><div class='del'>-	if (!op)</div><div class='del'>-		return;</div><div class='del'>-	if (op-&gt;d_hash)</div><div class='del'>-		dentry-&gt;d_flags |= DCACHE_OP_HASH;</div><div class='del'>-	if (op-&gt;d_compare)</div><div class='del'>-		dentry-&gt;d_flags |= DCACHE_OP_COMPARE;</div><div class='del'>-	if (op-&gt;d_revalidate)</div><div class='del'>-		dentry-&gt;d_flags |= DCACHE_OP_REVALIDATE;</div><div class='del'>-	if (op-&gt;d_weak_revalidate)</div><div class='del'>-		dentry-&gt;d_flags |= DCACHE_OP_WEAK_REVALIDATE;</div><div class='del'>-	if (op-&gt;d_delete)</div><div class='del'>-		dentry-&gt;d_flags |= DCACHE_OP_DELETE;</div><div class='del'>-	if (op-&gt;d_prune)</div><div class='del'>-		dentry-&gt;d_flags |= DCACHE_OP_PRUNE;</div><div class='del'>-	if (op-&gt;d_real)</div><div class='del'>-		dentry-&gt;d_flags |= DCACHE_OP_REAL;</div><div class='del'>-</div><div class='add'>+	if (flags)</div><div class='add'>+		dentry-&gt;d_flags |= flags;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(d_set_d_op);</div><div class='ctx'> </div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * d_set_fallthru - Mark a dentry as falling through to a lower layer</div><div class='del'>- * @dentry - The dentry to mark</div><div class='del'>- *</div><div class='del'>- * Mark a dentry as falling through to the lower layer (as set with</div><div class='del'>- * d_pin_lower()).  This flag may be recorded on the medium.</div><div class='del'>- */</div><div class='del'>-void d_set_fallthru(struct dentry *dentry)</div><div class='add'>+void set_default_d_op(struct super_block *s, const struct dentry_operations *ops)</div><div class='ctx'> {</div><div class='del'>-	spin_lock(&amp;dentry-&gt;d_lock);</div><div class='del'>-	dentry-&gt;d_flags |= DCACHE_FALLTHRU;</div><div class='del'>-	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='add'>+	unsigned int flags = d_op_flags(ops);</div><div class='add'>+	s-&gt;__s_d_op = ops;</div><div class='add'>+	s-&gt;s_d_flags = (s-&gt;s_d_flags &amp; ~DCACHE_OP_FLAGS) | flags;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(d_set_fallthru);</div><div class='add'>+EXPORT_SYMBOL(set_default_d_op);</div><div class='ctx'> </div><div class='ctx'> static unsigned d_flags_for_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='hunk'>@@ -1972,18 +1963,18 @@ static void __d_instantiate(struct dentry *dentry, struct inode *inode)</div><div class='ctx'> 	unsigned add_flags = d_flags_for_inode(inode);</div><div class='ctx'> 	WARN_ON(d_in_lookup(dentry));</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 	/*</div><div class='del'>-	 * Decrement negative dentry count if it was in the LRU list.</div><div class='add'>+	 * The negative counter only tracks dentries on the LRU. Don't dec if</div><div class='add'>+	 * d_lru is on another list.</div><div class='ctx'> 	 */</div><div class='del'>-	if (dentry-&gt;d_flags &amp; DCACHE_LRU_LIST)</div><div class='add'>+	if ((dentry-&gt;d_flags &amp;</div><div class='add'>+	     (DCACHE_LRU_LIST|DCACHE_SHRINK_LIST)) == DCACHE_LRU_LIST)</div><div class='ctx'> 		this_cpu_dec(nr_dentry_negative);</div><div class='ctx'> 	hlist_add_head(&amp;dentry-&gt;d_u.d_alias, &amp;inode-&gt;i_dentry);</div><div class='ctx'> 	raw_write_seqcount_begin(&amp;dentry-&gt;d_seq);</div><div class='ctx'> 	__d_set_inode_and_type(dentry, inode, add_flags);</div><div class='ctx'> 	raw_write_seqcount_end(&amp;dentry-&gt;d_seq);</div><div class='ctx'> 	fsnotify_update_flags(dentry);</div><div class='del'>-	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -2007,7 +1998,9 @@ void d_instantiate(struct dentry *entry, struct inode * inode)</div><div class='ctx'> 	if (inode) {</div><div class='ctx'> 		security_d_instantiate(entry, inode);</div><div class='ctx'> 		spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+		spin_lock(&amp;entry-&gt;d_lock);</div><div class='ctx'> 		__d_instantiate(entry, inode);</div><div class='add'>+		spin_unlock(&amp;entry-&gt;d_lock);</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -2026,11 +2019,12 @@ void d_instantiate_new(struct dentry *entry, struct inode *inode)</div><div class='ctx'> 	lockdep_annotate_inode_mutex_key(inode);</div><div class='ctx'> 	security_d_instantiate(entry, inode);</div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+	spin_lock(&amp;entry-&gt;d_lock);</div><div class='ctx'> 	__d_instantiate(entry, inode);</div><div class='del'>-	WARN_ON(!(inode-&gt;i_state &amp; I_NEW));</div><div class='del'>-	inode-&gt;i_state &amp;= ~I_NEW &amp; ~I_CREATING;</div><div class='del'>-	smp_mb();</div><div class='del'>-	wake_up_bit(&amp;inode-&gt;i_state, __I_NEW);</div><div class='add'>+	spin_unlock(&amp;entry-&gt;d_lock);</div><div class='add'>+	WARN_ON(!(inode_state_read(inode) &amp; I_NEW));</div><div class='add'>+	inode_state_clear(inode, I_NEW | I_CREATING);</div><div class='add'>+	inode_wake_up_bit(inode, __I_NEW);</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(d_instantiate_new);</div><div class='hunk'>@@ -2050,75 +2044,55 @@ struct dentry *d_make_root(struct inode *root_inode)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(d_make_root);</div><div class='ctx'> </div><div class='del'>-static struct dentry *__d_instantiate_anon(struct dentry *dentry,</div><div class='del'>-					   struct inode *inode,</div><div class='del'>-					   bool disconnected)</div><div class='del'>-{</div><div class='del'>-	struct dentry *res;</div><div class='del'>-	unsigned add_flags;</div><div class='del'>-</div><div class='del'>-	security_d_instantiate(dentry, inode);</div><div class='del'>-	spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-	res = __d_find_any_alias(inode);</div><div class='del'>-	if (res) {</div><div class='del'>-		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='del'>-		dput(dentry);</div><div class='del'>-		goto out_iput;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* attach a disconnected dentry */</div><div class='del'>-	add_flags = d_flags_for_inode(inode);</div><div class='del'>-</div><div class='del'>-	if (disconnected)</div><div class='del'>-		add_flags |= DCACHE_DISCONNECTED;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;dentry-&gt;d_lock);</div><div class='del'>-	__d_set_inode_and_type(dentry, inode, add_flags);</div><div class='del'>-	hlist_add_head(&amp;dentry-&gt;d_u.d_alias, &amp;inode-&gt;i_dentry);</div><div class='del'>-	if (!disconnected) {</div><div class='del'>-		hlist_bl_lock(&amp;dentry-&gt;d_sb-&gt;s_roots);</div><div class='del'>-		hlist_bl_add_head(&amp;dentry-&gt;d_hash, &amp;dentry-&gt;d_sb-&gt;s_roots);</div><div class='del'>-		hlist_bl_unlock(&amp;dentry-&gt;d_sb-&gt;s_roots);</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='del'>-	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='del'>-</div><div class='del'>-	return dentry;</div><div class='del'>-</div><div class='del'>- out_iput:</div><div class='del'>-	iput(inode);</div><div class='del'>-	return res;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct dentry *d_instantiate_anon(struct dentry *dentry, struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	return __d_instantiate_anon(dentry, inode, true);</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(d_instantiate_anon);</div><div class='del'>-</div><div class='ctx'> static struct dentry *__d_obtain_alias(struct inode *inode, bool disconnected)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *tmp;</div><div class='del'>-	struct dentry *res;</div><div class='add'>+	struct super_block *sb;</div><div class='add'>+	struct dentry *new, *res;</div><div class='ctx'> </div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		return ERR_PTR(-ESTALE);</div><div class='ctx'> 	if (IS_ERR(inode))</div><div class='ctx'> 		return ERR_CAST(inode);</div><div class='ctx'> </div><div class='del'>-	res = d_find_any_alias(inode);</div><div class='add'>+	sb = inode-&gt;i_sb;</div><div class='add'>+</div><div class='add'>+	res = d_find_any_alias(inode); /* existing alias? */</div><div class='ctx'> 	if (res)</div><div class='del'>-		goto out_iput;</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='del'>-	tmp = d_alloc_anon(inode-&gt;i_sb);</div><div class='del'>-	if (!tmp) {</div><div class='add'>+	new = d_alloc_anon(sb);</div><div class='add'>+	if (!new) {</div><div class='ctx'> 		res = ERR_PTR(-ENOMEM);</div><div class='del'>-		goto out_iput;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return __d_instantiate_anon(tmp, inode, disconnected);</div><div class='add'>+	security_d_instantiate(new, inode);</div><div class='add'>+	spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+	res = __d_find_any_alias(inode); /* recheck under lock */</div><div class='add'>+	if (likely(!res)) { /* still no alias, attach a disconnected dentry */</div><div class='add'>+		unsigned add_flags = d_flags_for_inode(inode);</div><div class='add'>+</div><div class='add'>+		if (disconnected)</div><div class='add'>+			add_flags |= DCACHE_DISCONNECTED;</div><div class='ctx'> </div><div class='del'>-out_iput:</div><div class='add'>+		spin_lock(&amp;new-&gt;d_lock);</div><div class='add'>+		__d_set_inode_and_type(new, inode, add_flags);</div><div class='add'>+		hlist_add_head(&amp;new-&gt;d_u.d_alias, &amp;inode-&gt;i_dentry);</div><div class='add'>+		if (!disconnected) {</div><div class='add'>+			hlist_bl_lock(&amp;sb-&gt;s_roots);</div><div class='add'>+			hlist_bl_add_head(&amp;new-&gt;d_hash, &amp;sb-&gt;s_roots);</div><div class='add'>+			hlist_bl_unlock(&amp;sb-&gt;s_roots);</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;new-&gt;d_lock);</div><div class='add'>+		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+		inode = NULL; /* consumed by new-&gt;d_inode */</div><div class='add'>+		res = new;</div><div class='add'>+	} else {</div><div class='add'>+		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+		dput(new);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+ out:</div><div class='ctx'> 	iput(inode);</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='hunk'>@@ -2170,8 +2144,8 @@ EXPORT_SYMBOL(d_obtain_root);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * d_add_ci - lookup or allocate new dentry with case-exact name</div><div class='del'>- * @inode:  the inode case-insensitive lookup has found</div><div class='ctx'>  * @dentry: the negative dentry that was passed to the parent's lookup func</div><div class='add'>+ * @inode:  the inode case-insensitive lookup has found</div><div class='ctx'>  * @name:   the case-exact name to be associated with the returned dentry</div><div class='ctx'>  *</div><div class='ctx'>  * This is to avoid filling the dcache with case-insensitive names to the</div><div class='hunk'>@@ -2214,6 +2188,7 @@ struct dentry *d_add_ci(struct dentry *dentry, struct inode *inode,</div><div class='ctx'> 	}</div><div class='ctx'> 	res = d_splice_alias(inode, found);</div><div class='ctx'> 	if (res) {</div><div class='add'>+		d_lookup_done(found);</div><div class='ctx'> 		dput(found);</div><div class='ctx'> 		return res;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2221,10 +2196,16 @@ struct dentry *d_add_ci(struct dentry *dentry, struct inode *inode,</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(d_add_ci);</div><div class='ctx'> </div><div class='del'>-</div><div class='del'>-static inline bool d_same_name(const struct dentry *dentry,</div><div class='del'>-				const struct dentry *parent,</div><div class='del'>-				const struct qstr *name)</div><div class='add'>+/**</div><div class='add'>+ * d_same_name - compare dentry name with case-exact name</div><div class='add'>+ * @dentry: the negative dentry that was passed to the parent's lookup func</div><div class='add'>+ * @parent: parent dentry</div><div class='add'>+ * @name:   the case-exact name to be associated with the returned dentry</div><div class='add'>+ *</div><div class='add'>+ * Return: true if names are same, or false</div><div class='add'>+ */</div><div class='add'>+bool d_same_name(const struct dentry *dentry, const struct dentry *parent,</div><div class='add'>+		 const struct qstr *name)</div><div class='ctx'> {</div><div class='ctx'> 	if (likely(!(parent-&gt;d_flags &amp; DCACHE_OP_COMPARE))) {</div><div class='ctx'> 		if (dentry-&gt;d_name.len != name-&gt;len)</div><div class='hunk'>@@ -2235,6 +2216,49 @@ static inline bool d_same_name(const struct dentry *dentry,</div><div class='ctx'> 				       dentry-&gt;d_name.len, dentry-&gt;d_name.name,</div><div class='ctx'> 				       name) == 0;</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL_GPL(d_same_name);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * This is __d_lookup_rcu() when the parent dentry has</div><div class='add'>+ * DCACHE_OP_COMPARE, which makes things much nastier.</div><div class='add'>+ */</div><div class='add'>+static noinline struct dentry *__d_lookup_rcu_op_compare(</div><div class='add'>+	const struct dentry *parent,</div><div class='add'>+	const struct qstr *name,</div><div class='add'>+	unsigned *seqp)</div><div class='add'>+{</div><div class='add'>+	u64 hashlen = name-&gt;hash_len;</div><div class='add'>+	struct hlist_bl_head *b = d_hash(hashlen);</div><div class='add'>+	struct hlist_bl_node *node;</div><div class='add'>+	struct dentry *dentry;</div><div class='add'>+</div><div class='add'>+	hlist_bl_for_each_entry_rcu(dentry, node, b, d_hash) {</div><div class='add'>+		int tlen;</div><div class='add'>+		const char *tname;</div><div class='add'>+		unsigned seq;</div><div class='add'>+</div><div class='add'>+seqretry:</div><div class='add'>+		seq = raw_seqcount_begin(&amp;dentry-&gt;d_seq);</div><div class='add'>+		if (dentry-&gt;d_parent != parent)</div><div class='add'>+			continue;</div><div class='add'>+		if (d_unhashed(dentry))</div><div class='add'>+			continue;</div><div class='add'>+		if (dentry-&gt;d_name.hash != hashlen_hash(hashlen))</div><div class='add'>+			continue;</div><div class='add'>+		tlen = dentry-&gt;d_name.len;</div><div class='add'>+		tname = dentry-&gt;d_name.name;</div><div class='add'>+		/* we want a consistent (name,len) pair */</div><div class='add'>+		if (read_seqcount_retry(&amp;dentry-&gt;d_seq, seq)) {</div><div class='add'>+			cpu_relax();</div><div class='add'>+			goto seqretry;</div><div class='add'>+		}</div><div class='add'>+		if (parent-&gt;d_op-&gt;d_compare(dentry, tlen, tname, name) != 0)</div><div class='add'>+			continue;</div><div class='add'>+		*seqp = seq;</div><div class='add'>+		return dentry;</div><div class='add'>+	}</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * __d_lookup_rcu - search for a dentry (racy, store-free)</div><div class='hunk'>@@ -2254,9 +2278,6 @@ static inline bool d_same_name(const struct dentry *dentry,</div><div class='ctx'>  * without taking d_lock and checking d_seq sequence count against @seq</div><div class='ctx'>  * returned here.</div><div class='ctx'>  *</div><div class='del'>- * A refcount may be taken on the found dentry with the d_rcu_to_refcount</div><div class='del'>- * function.</div><div class='del'>- *</div><div class='ctx'>  * Alternatively, __d_lookup_rcu may be called again to look up the child of</div><div class='ctx'>  * the returned dentry, so long as its parent's seqlock is checked after the</div><div class='ctx'>  * child is looked up. Thus, an interlocking stepping of sequence lock checks</div><div class='hunk'>@@ -2271,7 +2292,7 @@ struct dentry *__d_lookup_rcu(const struct dentry *parent,</div><div class='ctx'> {</div><div class='ctx'> 	u64 hashlen = name-&gt;hash_len;</div><div class='ctx'> 	const unsigned char *str = name-&gt;name;</div><div class='del'>-	struct hlist_bl_head *b = d_hash(hashlen_hash(hashlen));</div><div class='add'>+	struct hlist_bl_head *b = d_hash(hashlen);</div><div class='ctx'> 	struct hlist_bl_node *node;</div><div class='ctx'> 	struct dentry *dentry;</div><div class='ctx'> </div><div class='hunk'>@@ -2282,6 +2303,9 @@ struct dentry *__d_lookup_rcu(const struct dentry *parent,</div><div class='ctx'> 	 * Keep the two functions in sync.</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='add'>+	if (unlikely(parent-&gt;d_flags &amp; DCACHE_OP_COMPARE))</div><div class='add'>+		return __d_lookup_rcu_op_compare(parent, name, seqp);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The hash list is protected using RCU.</div><div class='ctx'> 	 *</div><div class='hunk'>@@ -2298,7 +2322,6 @@ struct dentry *__d_lookup_rcu(const struct dentry *parent,</div><div class='ctx'> 	hlist_bl_for_each_entry_rcu(dentry, node, b, d_hash) {</div><div class='ctx'> 		unsigned seq;</div><div class='ctx'> </div><div class='del'>-seqretry:</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * The dentry sequence count protects us from concurrent</div><div class='ctx'> 		 * renames, and thus protects parent and name fields.</div><div class='hunk'>@@ -2319,30 +2342,21 @@ seqretry:</div><div class='ctx'> 		seq = raw_seqcount_begin(&amp;dentry-&gt;d_seq);</div><div class='ctx'> 		if (dentry-&gt;d_parent != parent)</div><div class='ctx'> 			continue;</div><div class='del'>-		if (d_unhashed(dentry))</div><div class='add'>+		if (dentry-&gt;d_name.hash_len != hashlen)</div><div class='add'>+			continue;</div><div class='add'>+		if (unlikely(dentry_cmp(dentry, str, hashlen_len(hashlen)) != 0))</div><div class='add'>+			continue;</div><div class='add'>+		/*</div><div class='add'>+		 * Check for the dentry being unhashed.</div><div class='add'>+		 *</div><div class='add'>+		 * As tempting as it is, we *can't* skip it because of a race window</div><div class='add'>+		 * between us finding the dentry before it gets unhashed and loading</div><div class='add'>+		 * the sequence counter after unhashing is finished.</div><div class='add'>+		 *</div><div class='add'>+		 * We can at least predict on it.</div><div class='add'>+		 */</div><div class='add'>+		if (unlikely(d_unhashed(dentry)))</div><div class='ctx'> 			continue;</div><div class='del'>-</div><div class='del'>-		if (unlikely(parent-&gt;d_flags &amp; DCACHE_OP_COMPARE)) {</div><div class='del'>-			int tlen;</div><div class='del'>-			const char *tname;</div><div class='del'>-			if (dentry-&gt;d_name.hash != hashlen_hash(hashlen))</div><div class='del'>-				continue;</div><div class='del'>-			tlen = dentry-&gt;d_name.len;</div><div class='del'>-			tname = dentry-&gt;d_name.name;</div><div class='del'>-			/* we want a consistent (name,len) pair */</div><div class='del'>-			if (read_seqcount_retry(&amp;dentry-&gt;d_seq, seq)) {</div><div class='del'>-				cpu_relax();</div><div class='del'>-				goto seqretry;</div><div class='del'>-			}</div><div class='del'>-			if (parent-&gt;d_op-&gt;d_compare(dentry,</div><div class='del'>-						    tlen, tname, name) != 0)</div><div class='del'>-				continue;</div><div class='del'>-		} else {</div><div class='del'>-			if (dentry-&gt;d_name.hash_len != hashlen)</div><div class='del'>-				continue;</div><div class='del'>-			if (dentry_cmp(dentry, str, hashlen_len(hashlen)) != 0)</div><div class='del'>-				continue;</div><div class='del'>-		}</div><div class='ctx'> 		*seqp = seq;</div><div class='ctx'> 		return dentry;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2468,7 +2482,6 @@ struct dentry *d_hash_and_lookup(struct dentry *dir, struct qstr *name)</div><div class='ctx'> 	}</div><div class='ctx'> 	return d_lookup(dir, name);</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(d_hash_and_lookup);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * When a file is deleted, we have two options:</div><div class='hunk'>@@ -2501,6 +2514,8 @@ void d_delete(struct dentry * dentry)</div><div class='ctx'> 	 * Are we the only user?</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (dentry-&gt;d_lockref.count == 1) {</div><div class='add'>+		if (dentry_negative_policy)</div><div class='add'>+			__d_drop(dentry);</div><div class='ctx'> 		dentry-&gt;d_flags &amp;= ~DCACHE_CANT_MOUNT;</div><div class='ctx'> 		dentry_unlink_inode(dentry);</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -2537,18 +2552,22 @@ EXPORT_SYMBOL(d_rehash);</div><div class='ctx'> </div><div class='ctx'> static inline unsigned start_dir_add(struct inode *dir)</div><div class='ctx'> {</div><div class='del'>-</div><div class='add'>+	preempt_disable_nested();</div><div class='ctx'> 	for (;;) {</div><div class='del'>-		unsigned n = dir-&gt;i_dir_seq;</div><div class='del'>-		if (!(n &amp; 1) &amp;&amp; cmpxchg(&amp;dir-&gt;i_dir_seq, n, n + 1) == n)</div><div class='add'>+		unsigned n = READ_ONCE(dir-&gt;i_dir_seq);</div><div class='add'>+		if (!(n &amp; 1) &amp;&amp; try_cmpxchg(&amp;dir-&gt;i_dir_seq, &amp;n, n + 1))</div><div class='ctx'> 			return n;</div><div class='ctx'> 		cpu_relax();</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void end_dir_add(struct inode *dir, unsigned n)</div><div class='add'>+static inline void end_dir_add(struct inode *dir, unsigned int n,</div><div class='add'>+			       wait_queue_head_t *d_wait)</div><div class='ctx'> {</div><div class='ctx'> 	smp_store_release(&amp;dir-&gt;i_dir_seq, n + 2);</div><div class='add'>+	preempt_enable_nested();</div><div class='add'>+	if (wq_has_sleeper(d_wait))</div><div class='add'>+		wake_up_all(d_wait);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void d_wait_lookup(struct dentry *dentry)</div><div class='hunk'>@@ -2572,13 +2591,21 @@ struct dentry *d_alloc_parallel(struct dentry *parent,</div><div class='ctx'> 	unsigned int hash = name-&gt;hash;</div><div class='ctx'> 	struct hlist_bl_head *b = in_lookup_hash(parent, hash);</div><div class='ctx'> 	struct hlist_bl_node *node;</div><div class='del'>-	struct dentry *new = d_alloc(parent, name);</div><div class='add'>+	struct dentry *new = __d_alloc(parent-&gt;d_sb, name);</div><div class='ctx'> 	struct dentry *dentry;</div><div class='ctx'> 	unsigned seq, r_seq, d_seq;</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(!new))</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='add'>+	new-&gt;d_flags |= DCACHE_PAR_LOOKUP;</div><div class='add'>+	spin_lock(&amp;parent-&gt;d_lock);</div><div class='add'>+	new-&gt;d_parent = dget_dlock(parent);</div><div class='add'>+	hlist_add_head(&amp;new-&gt;d_sib, &amp;parent-&gt;d_children);</div><div class='add'>+	if (parent-&gt;d_flags &amp; DCACHE_DISCONNECTED)</div><div class='add'>+		new-&gt;d_flags |= DCACHE_DISCONNECTED;</div><div class='add'>+	spin_unlock(&amp;parent-&gt;d_lock);</div><div class='add'>+</div><div class='ctx'> retry:</div><div class='ctx'> 	rcu_read_lock();</div><div class='ctx'> 	seq = smp_load_acquire(&amp;parent-&gt;d_inode-&gt;i_dir_seq);</div><div class='hunk'>@@ -2662,10 +2689,8 @@ retry:</div><div class='ctx'> 		return dentry;</div><div class='ctx'> 	}</div><div class='ctx'> 	rcu_read_unlock();</div><div class='del'>-	/* we can't take -&gt;d_lock here; it's OK, though. */</div><div class='del'>-	new-&gt;d_flags |= DCACHE_PAR_LOOKUP;</div><div class='ctx'> 	new-&gt;d_wait = wq;</div><div class='del'>-	hlist_bl_add_head_rcu(&amp;new-&gt;d_u.d_in_lookup_hash, b);</div><div class='add'>+	hlist_bl_add_head(&amp;new-&gt;d_u.d_in_lookup_hash, b);</div><div class='ctx'> 	hlist_bl_unlock(b);</div><div class='ctx'> 	return new;</div><div class='ctx'> mismatch:</div><div class='hunk'>@@ -2675,33 +2700,54 @@ mismatch:</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(d_alloc_parallel);</div><div class='ctx'> </div><div class='del'>-void __d_lookup_done(struct dentry *dentry)</div><div class='add'>+/*</div><div class='add'>+ * - Unhash the dentry</div><div class='add'>+ * - Retrieve and clear the waitqueue head in dentry</div><div class='add'>+ * - Return the waitqueue head</div><div class='add'>+ */</div><div class='add'>+static wait_queue_head_t *__d_lookup_unhash(struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	struct hlist_bl_head *b = in_lookup_hash(dentry-&gt;d_parent,</div><div class='del'>-						 dentry-&gt;d_name.hash);</div><div class='add'>+	wait_queue_head_t *d_wait;</div><div class='add'>+	struct hlist_bl_head *b;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held(&amp;dentry-&gt;d_lock);</div><div class='add'>+</div><div class='add'>+	b = in_lookup_hash(dentry-&gt;d_parent, dentry-&gt;d_name.hash);</div><div class='ctx'> 	hlist_bl_lock(b);</div><div class='ctx'> 	dentry-&gt;d_flags &amp;= ~DCACHE_PAR_LOOKUP;</div><div class='ctx'> 	__hlist_bl_del(&amp;dentry-&gt;d_u.d_in_lookup_hash);</div><div class='del'>-	wake_up_all(dentry-&gt;d_wait);</div><div class='add'>+	d_wait = dentry-&gt;d_wait;</div><div class='ctx'> 	dentry-&gt;d_wait = NULL;</div><div class='ctx'> 	hlist_bl_unlock(b);</div><div class='ctx'> 	INIT_HLIST_NODE(&amp;dentry-&gt;d_u.d_alias);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;dentry-&gt;d_lru);</div><div class='add'>+	return d_wait;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(__d_lookup_done);</div><div class='add'>+</div><div class='add'>+void __d_lookup_unhash_wake(struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	spin_lock(&amp;dentry-&gt;d_lock);</div><div class='add'>+	wake_up_all(__d_lookup_unhash(dentry));</div><div class='add'>+	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(__d_lookup_unhash_wake);</div><div class='ctx'> </div><div class='ctx'> /* inode-&gt;i_lock held if inode is non-NULL */</div><div class='ctx'> </div><div class='del'>-static inline void __d_add(struct dentry *dentry, struct inode *inode)</div><div class='add'>+static inline void __d_add(struct dentry *dentry, struct inode *inode,</div><div class='add'>+			   const struct dentry_operations *ops)</div><div class='ctx'> {</div><div class='add'>+	wait_queue_head_t *d_wait;</div><div class='ctx'> 	struct inode *dir = NULL;</div><div class='ctx'> 	unsigned n;</div><div class='ctx'> 	spin_lock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 	if (unlikely(d_in_lookup(dentry))) {</div><div class='ctx'> 		dir = dentry-&gt;d_parent-&gt;d_inode;</div><div class='ctx'> 		n = start_dir_add(dir);</div><div class='del'>-		__d_lookup_done(dentry);</div><div class='add'>+		d_wait = __d_lookup_unhash(dentry);</div><div class='ctx'> 	}</div><div class='add'>+	if (unlikely(ops))</div><div class='add'>+		d_set_d_op(dentry, ops);</div><div class='ctx'> 	if (inode) {</div><div class='ctx'> 		unsigned add_flags = d_flags_for_inode(inode);</div><div class='ctx'> 		hlist_add_head(&amp;dentry-&gt;d_u.d_alias, &amp;inode-&gt;i_dentry);</div><div class='hunk'>@@ -2712,7 +2758,7 @@ static inline void __d_add(struct dentry *dentry, struct inode *inode)</div><div class='ctx'> 	}</div><div class='ctx'> 	__d_rehash(dentry);</div><div class='ctx'> 	if (dir)</div><div class='del'>-		end_dir_add(dir, n);</div><div class='add'>+		end_dir_add(dir, n, d_wait);</div><div class='ctx'> 	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 	if (inode)</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='hunk'>@@ -2733,55 +2779,27 @@ void d_add(struct dentry *entry, struct inode *inode)</div><div class='ctx'> 		security_d_instantiate(entry, inode);</div><div class='ctx'> 		spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	}</div><div class='del'>-	__d_add(entry, inode);</div><div class='add'>+	__d_add(entry, inode, NULL);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(d_add);</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * d_exact_alias - find and hash an exact unhashed alias</div><div class='del'>- * @entry: dentry to add</div><div class='del'>- * @inode: The inode to go with this dentry</div><div class='del'>- *</div><div class='del'>- * If an unhashed dentry with the same name/parent and desired</div><div class='del'>- * inode already exists, hash and return it.  Otherwise, return</div><div class='del'>- * NULL.</div><div class='del'>- *</div><div class='del'>- * Parent directory should be locked.</div><div class='del'>- */</div><div class='del'>-struct dentry *d_exact_alias(struct dentry *entry, struct inode *inode)</div><div class='add'>+struct dentry *d_make_persistent(struct dentry *dentry, struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *alias;</div><div class='del'>-	unsigned int hash = entry-&gt;d_name.hash;</div><div class='del'>-</div><div class='add'>+	WARN_ON(!hlist_unhashed(&amp;dentry-&gt;d_u.d_alias));</div><div class='add'>+	WARN_ON(!inode);</div><div class='add'>+	security_d_instantiate(dentry, inode);</div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-	hlist_for_each_entry(alias, &amp;inode-&gt;i_dentry, d_u.d_alias) {</div><div class='del'>-		/*</div><div class='del'>-		 * Don't need alias-&gt;d_lock here, because aliases with</div><div class='del'>-		 * d_parent == entry-&gt;d_parent are not subject to name or</div><div class='del'>-		 * parent changes, because the parent inode i_mutex is held.</div><div class='del'>-		 */</div><div class='del'>-		if (alias-&gt;d_name.hash != hash)</div><div class='del'>-			continue;</div><div class='del'>-		if (alias-&gt;d_parent != entry-&gt;d_parent)</div><div class='del'>-			continue;</div><div class='del'>-		if (!d_same_name(alias, entry-&gt;d_parent, &amp;entry-&gt;d_name))</div><div class='del'>-			continue;</div><div class='del'>-		spin_lock(&amp;alias-&gt;d_lock);</div><div class='del'>-		if (!d_unhashed(alias)) {</div><div class='del'>-			spin_unlock(&amp;alias-&gt;d_lock);</div><div class='del'>-			alias = NULL;</div><div class='del'>-		} else {</div><div class='del'>-			__dget_dlock(alias);</div><div class='del'>-			__d_rehash(alias);</div><div class='del'>-			spin_unlock(&amp;alias-&gt;d_lock);</div><div class='del'>-		}</div><div class='del'>-		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='del'>-		return alias;</div><div class='del'>-	}</div><div class='add'>+	spin_lock(&amp;dentry-&gt;d_lock);</div><div class='add'>+	__d_instantiate(dentry, inode);</div><div class='add'>+	dentry-&gt;d_flags |= DCACHE_PERSISTENT;</div><div class='add'>+	dget_dlock(dentry);</div><div class='add'>+	if (d_unhashed(dentry))</div><div class='add'>+		__d_rehash(dentry);</div><div class='add'>+	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='del'>-	return NULL;</div><div class='add'>+	return dentry;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(d_exact_alias);</div><div class='add'>+EXPORT_SYMBOL(d_make_persistent);</div><div class='ctx'> </div><div class='ctx'> static void swap_names(struct dentry *dentry, struct dentry *target)</div><div class='ctx'> {</div><div class='hunk'>@@ -2790,16 +2808,15 @@ static void swap_names(struct dentry *dentry, struct dentry *target)</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Both external: swap the pointers</div><div class='ctx'> 			 */</div><div class='del'>-			swap(target-&gt;d_name.name, dentry-&gt;d_name.name);</div><div class='add'>+			swap(target-&gt;__d_name.name, dentry-&gt;__d_name.name);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * dentry:internal, target:external.  Steal target's</div><div class='ctx'> 			 * storage and make target internal.</div><div class='ctx'> 			 */</div><div class='del'>-			memcpy(target-&gt;d_iname, dentry-&gt;d_name.name,</div><div class='del'>-					dentry-&gt;d_name.len + 1);</div><div class='del'>-			dentry-&gt;d_name.name = target-&gt;d_name.name;</div><div class='del'>-			target-&gt;d_name.name = target-&gt;d_iname;</div><div class='add'>+			dentry-&gt;__d_name.name = target-&gt;__d_name.name;</div><div class='add'>+			target-&gt;d_shortname = dentry-&gt;d_shortname;</div><div class='add'>+			target-&gt;__d_name.name = target-&gt;d_shortname.string;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='ctx'> 		if (unlikely(dname_external(dentry))) {</div><div class='hunk'>@@ -2807,23 +2824,19 @@ static void swap_names(struct dentry *dentry, struct dentry *target)</div><div class='ctx'> 			 * dentry:external, target:internal.  Give dentry's</div><div class='ctx'> 			 * storage to target and make dentry internal</div><div class='ctx'> 			 */</div><div class='del'>-			memcpy(dentry-&gt;d_iname, target-&gt;d_name.name,</div><div class='del'>-					target-&gt;d_name.len + 1);</div><div class='del'>-			target-&gt;d_name.name = dentry-&gt;d_name.name;</div><div class='del'>-			dentry-&gt;d_name.name = dentry-&gt;d_iname;</div><div class='add'>+			target-&gt;__d_name.name = dentry-&gt;__d_name.name;</div><div class='add'>+			dentry-&gt;d_shortname = target-&gt;d_shortname;</div><div class='add'>+			dentry-&gt;__d_name.name = dentry-&gt;d_shortname.string;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Both are internal.</div><div class='ctx'> 			 */</div><div class='del'>-			unsigned int i;</div><div class='del'>-			BUILD_BUG_ON(!IS_ALIGNED(DNAME_INLINE_LEN, sizeof(long)));</div><div class='del'>-			for (i = 0; i &lt; DNAME_INLINE_LEN / sizeof(long); i++) {</div><div class='del'>-				swap(((long *) &amp;dentry-&gt;d_iname)[i],</div><div class='del'>-				     ((long *) &amp;target-&gt;d_iname)[i]);</div><div class='del'>-			}</div><div class='add'>+			for (int i = 0; i &lt; DNAME_INLINE_WORDS; i++)</div><div class='add'>+				swap(dentry-&gt;d_shortname.words[i],</div><div class='add'>+				     target-&gt;d_shortname.words[i]);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	swap(dentry-&gt;d_name.hash_len, target-&gt;d_name.hash_len);</div><div class='add'>+	swap(dentry-&gt;__d_name.hash_len, target-&gt;__d_name.hash_len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void copy_name(struct dentry *dentry, struct dentry *target)</div><div class='hunk'>@@ -2832,16 +2845,15 @@ static void copy_name(struct dentry *dentry, struct dentry *target)</div><div class='ctx'> 	if (unlikely(dname_external(dentry)))</div><div class='ctx'> 		old_name = external_name(dentry);</div><div class='ctx'> 	if (unlikely(dname_external(target))) {</div><div class='del'>-		atomic_inc(&amp;external_name(target)-&gt;u.count);</div><div class='del'>-		dentry-&gt;d_name = target-&gt;d_name;</div><div class='add'>+		atomic_inc(&amp;external_name(target)-&gt;count);</div><div class='add'>+		dentry-&gt;__d_name = target-&gt;__d_name;</div><div class='ctx'> 	} else {</div><div class='del'>-		memcpy(dentry-&gt;d_iname, target-&gt;d_name.name,</div><div class='del'>-				target-&gt;d_name.len + 1);</div><div class='del'>-		dentry-&gt;d_name.name = dentry-&gt;d_iname;</div><div class='del'>-		dentry-&gt;d_name.hash_len = target-&gt;d_name.hash_len;</div><div class='add'>+		dentry-&gt;d_shortname = target-&gt;d_shortname;</div><div class='add'>+		dentry-&gt;__d_name.name = dentry-&gt;d_shortname.string;</div><div class='add'>+		dentry-&gt;__d_name.hash_len = target-&gt;__d_name.hash_len;</div><div class='ctx'> 	}</div><div class='del'>-	if (old_name &amp;&amp; likely(atomic_dec_and_test(&amp;old_name-&gt;u.count)))</div><div class='del'>-		kfree_rcu(old_name, u.head);</div><div class='add'>+	if (old_name &amp;&amp; likely(atomic_dec_and_test(&amp;old_name-&gt;count)))</div><div class='add'>+		kfree_rcu(old_name, head);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2850,15 +2862,16 @@ static void copy_name(struct dentry *dentry, struct dentry *target)</div><div class='ctx'>  * @target: new dentry</div><div class='ctx'>  * @exchange: exchange the two dentries</div><div class='ctx'>  *</div><div class='del'>- * Update the dcache to reflect the move of a file name. Negative</div><div class='del'>- * dcache entries should not be moved in this way. Caller must hold</div><div class='del'>- * rename_lock, the i_mutex of the source and target directories,</div><div class='del'>- * and the sb-&gt;s_vfs_rename_mutex if they differ. See lock_rename().</div><div class='add'>+ * Update the dcache to reflect the move of a file name. Negative dcache</div><div class='add'>+ * entries should not be moved in this way. Caller must hold rename_lock, the</div><div class='add'>+ * i_rwsem of the source and target directories (exclusively), and the sb-&gt;</div><div class='add'>+ * s_vfs_rename_mutex if they differ. See lock_rename().</div><div class='ctx'>  */</div><div class='ctx'> static void __d_move(struct dentry *dentry, struct dentry *target,</div><div class='ctx'> 		     bool exchange)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *old_parent, *p;</div><div class='add'>+	wait_queue_head_t *d_wait;</div><div class='ctx'> 	struct inode *dir = NULL;</div><div class='ctx'> 	unsigned n;</div><div class='ctx'> </div><div class='hunk'>@@ -2889,7 +2902,7 @@ static void __d_move(struct dentry *dentry, struct dentry *target,</div><div class='ctx'> 	if (unlikely(d_in_lookup(target))) {</div><div class='ctx'> 		dir = target-&gt;d_parent-&gt;d_inode;</div><div class='ctx'> 		n = start_dir_add(dir);</div><div class='del'>-		__d_lookup_done(target);</div><div class='add'>+		d_wait = __d_lookup_unhash(target);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	write_seqcount_begin(&amp;dentry-&gt;d_seq);</div><div class='hunk'>@@ -2912,11 +2925,15 @@ static void __d_move(struct dentry *dentry, struct dentry *target,</div><div class='ctx'> 	} else {</div><div class='ctx'> 		target-&gt;d_parent = old_parent;</div><div class='ctx'> 		swap_names(dentry, target);</div><div class='del'>-		list_move(&amp;target-&gt;d_child, &amp;target-&gt;d_parent-&gt;d_subdirs);</div><div class='add'>+		if (!hlist_unhashed(&amp;target-&gt;d_sib))</div><div class='add'>+			__hlist_del(&amp;target-&gt;d_sib);</div><div class='add'>+		hlist_add_head(&amp;target-&gt;d_sib, &amp;target-&gt;d_parent-&gt;d_children);</div><div class='ctx'> 		__d_rehash(target);</div><div class='ctx'> 		fsnotify_update_flags(target);</div><div class='ctx'> 	}</div><div class='del'>-	list_move(&amp;dentry-&gt;d_child, &amp;dentry-&gt;d_parent-&gt;d_subdirs);</div><div class='add'>+	if (!hlist_unhashed(&amp;dentry-&gt;d_sib))</div><div class='add'>+		__hlist_del(&amp;dentry-&gt;d_sib);</div><div class='add'>+	hlist_add_head(&amp;dentry-&gt;d_sib, &amp;dentry-&gt;d_parent-&gt;d_children);</div><div class='ctx'> 	__d_rehash(dentry);</div><div class='ctx'> 	fsnotify_update_flags(dentry);</div><div class='ctx'> 	fscrypt_handle_d_move(dentry);</div><div class='hunk'>@@ -2925,7 +2942,7 @@ static void __d_move(struct dentry *dentry, struct dentry *target,</div><div class='ctx'> 	write_seqcount_end(&amp;dentry-&gt;d_seq);</div><div class='ctx'> </div><div class='ctx'> 	if (dir)</div><div class='del'>-		end_dir_add(dir, n);</div><div class='add'>+		end_dir_add(dir, n, d_wait);</div><div class='ctx'> </div><div class='ctx'> 	if (dentry-&gt;d_parent != old_parent)</div><div class='ctx'> 		spin_unlock(&amp;dentry-&gt;d_parent-&gt;d_lock);</div><div class='hunk'>@@ -2970,6 +2987,7 @@ void d_exchange(struct dentry *dentry1, struct dentry *dentry2)</div><div class='ctx'> </div><div class='ctx'> 	write_sequnlock(&amp;rename_lock);</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL(d_exchange);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * d_ancestor - search for an ancestor</div><div class='hunk'>@@ -2994,13 +3012,12 @@ struct dentry *d_ancestor(struct dentry *p1, struct dentry *p2)</div><div class='ctx'>  * This helper attempts to cope with remotely renamed directories</div><div class='ctx'>  *</div><div class='ctx'>  * It assumes that the caller is already holding</div><div class='del'>- * dentry-&gt;d_parent-&gt;d_inode-&gt;i_mutex, and rename_lock</div><div class='add'>+ * dentry-&gt;d_parent-&gt;d_inode-&gt;i_rwsem, and rename_lock</div><div class='ctx'>  *</div><div class='ctx'>  * Note: If ever the locking in lock_rename() changes, then please</div><div class='ctx'>  * remember to update this too...</div><div class='ctx'>  */</div><div class='del'>-static int __d_unalias(struct inode *inode,</div><div class='del'>-		struct dentry *dentry, struct dentry *alias)</div><div class='add'>+static int __d_unalias(struct dentry *dentry, struct dentry *alias)</div><div class='ctx'> {</div><div class='ctx'> 	struct mutex *m1 = NULL;</div><div class='ctx'> 	struct rw_semaphore *m2 = NULL;</div><div class='hunk'>@@ -3018,7 +3035,12 @@ static int __d_unalias(struct inode *inode,</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> 	m2 = &amp;alias-&gt;d_parent-&gt;d_inode-&gt;i_rwsem;</div><div class='ctx'> out_unalias:</div><div class='add'>+	if (alias-&gt;d_op &amp;&amp; alias-&gt;d_op-&gt;d_unalias_trylock &amp;&amp;</div><div class='add'>+	    !alias-&gt;d_op-&gt;d_unalias_trylock(alias))</div><div class='add'>+		goto out_err;</div><div class='ctx'> 	__d_move(alias, dentry, false);</div><div class='add'>+	if (alias-&gt;d_op &amp;&amp; alias-&gt;d_op-&gt;d_unalias_unlock)</div><div class='add'>+		alias-&gt;d_op-&gt;d_unalias_unlock(alias);</div><div class='ctx'> 	ret = 0;</div><div class='ctx'> out_err:</div><div class='ctx'> 	if (m2)</div><div class='hunk'>@@ -3028,30 +3050,8 @@ out_err:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * d_splice_alias - splice a disconnected dentry into the tree if one exists</div><div class='del'>- * @inode:  the inode which may have a disconnected dentry</div><div class='del'>- * @dentry: a negative dentry which we want to point to the inode.</div><div class='del'>- *</div><div class='del'>- * If inode is a directory and has an IS_ROOT alias, then d_move that in</div><div class='del'>- * place of the given dentry and return it, else simply d_add the inode</div><div class='del'>- * to the dentry and return NULL.</div><div class='del'>- *</div><div class='del'>- * If a non-IS_ROOT directory is found, the filesystem is corrupt, and</div><div class='del'>- * we should error out: directories can't have multiple aliases.</div><div class='del'>- *</div><div class='del'>- * This is needed in the lookup routine of any filesystem that is exportable</div><div class='del'>- * (via knfsd) so that we can build dcache paths to directories effectively.</div><div class='del'>- *</div><div class='del'>- * If a dentry was found and moved, then it is returned.  Otherwise NULL</div><div class='del'>- * is returned.  This matches the expected return value of -&gt;lookup.</div><div class='del'>- *</div><div class='del'>- * Cluster filesystems may call this function with a negative, hashed dentry.</div><div class='del'>- * In that case, we know that the inode will be a regular file, and also this</div><div class='del'>- * will only occur during atomic_open. So we need to check for the dentry</div><div class='del'>- * being already hashed only in the final case.</div><div class='del'>- */</div><div class='del'>-struct dentry *d_splice_alias(struct inode *inode, struct dentry *dentry)</div><div class='add'>+struct dentry *d_splice_alias_ops(struct inode *inode, struct dentry *dentry,</div><div class='add'>+				  const struct dentry_operations *ops)</div><div class='ctx'> {</div><div class='ctx'> 	if (IS_ERR(inode))</div><div class='ctx'> 		return ERR_CAST(inode);</div><div class='hunk'>@@ -3081,7 +3081,7 @@ struct dentry *d_splice_alias(struct inode *inode, struct dentry *dentry)</div><div class='ctx'> 					inode-&gt;i_sb-&gt;s_id);</div><div class='ctx'> 			} else if (!IS_ROOT(new)) {</div><div class='ctx'> 				struct dentry *old_parent = dget(new-&gt;d_parent);</div><div class='del'>-				int err = __d_unalias(inode, dentry, new);</div><div class='add'>+				int err = __d_unalias(dentry, new);</div><div class='ctx'> 				write_sequnlock(&amp;rename_lock);</div><div class='ctx'> 				if (err) {</div><div class='ctx'> 					dput(new);</div><div class='hunk'>@@ -3097,9 +3097,37 @@ struct dentry *d_splice_alias(struct inode *inode, struct dentry *dentry)</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='del'>-	__d_add(dentry, inode);</div><div class='add'>+	__d_add(dentry, inode, ops);</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * d_splice_alias - splice a disconnected dentry into the tree if one exists</div><div class='add'>+ * @inode:  the inode which may have a disconnected dentry</div><div class='add'>+ * @dentry: a negative dentry which we want to point to the inode.</div><div class='add'>+ *</div><div class='add'>+ * If inode is a directory and has an IS_ROOT alias, then d_move that in</div><div class='add'>+ * place of the given dentry and return it, else simply d_add the inode</div><div class='add'>+ * to the dentry and return NULL.</div><div class='add'>+ *</div><div class='add'>+ * If a non-IS_ROOT directory is found, the filesystem is corrupt, and</div><div class='add'>+ * we should error out: directories can't have multiple aliases.</div><div class='add'>+ *</div><div class='add'>+ * This is needed in the lookup routine of any filesystem that is exportable</div><div class='add'>+ * (via knfsd) so that we can build dcache paths to directories effectively.</div><div class='add'>+ *</div><div class='add'>+ * If a dentry was found and moved, then it is returned.  Otherwise NULL</div><div class='add'>+ * is returned.  This matches the expected return value of -&gt;lookup.</div><div class='add'>+ *</div><div class='add'>+ * Cluster filesystems may call this function with a negative, hashed dentry.</div><div class='add'>+ * In that case, we know that the inode will be a regular file, and also this</div><div class='add'>+ * will only occur during atomic_open. So we need to check for the dentry</div><div class='add'>+ * being already hashed only in the final case.</div><div class='add'>+ */</div><div class='add'>+struct dentry *d_splice_alias(struct inode *inode, struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	return d_splice_alias_ops(inode, dentry, NULL);</div><div class='add'>+}</div><div class='ctx'> EXPORT_SYMBOL(d_splice_alias);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -3120,69 +3148,82 @@ EXPORT_SYMBOL(d_splice_alias);</div><div class='ctx'>   </div><div class='ctx'> bool is_subdir(struct dentry *new_dentry, struct dentry *old_dentry)</div><div class='ctx'> {</div><div class='del'>-	bool result;</div><div class='add'>+	bool subdir;</div><div class='ctx'> 	unsigned seq;</div><div class='ctx'> </div><div class='ctx'> 	if (new_dentry == old_dentry)</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='del'>-	do {</div><div class='del'>-		/* for restarting inner loop in case of seq retry */</div><div class='del'>-		seq = read_seqbegin(&amp;rename_lock);</div><div class='del'>-		/*</div><div class='del'>-		 * Need rcu_readlock to protect against the d_parent trashing</div><div class='del'>-		 * due to d_move</div><div class='del'>-		 */</div><div class='del'>-		rcu_read_lock();</div><div class='del'>-		if (d_ancestor(old_dentry, new_dentry))</div><div class='del'>-			result = true;</div><div class='del'>-		else</div><div class='del'>-			result = false;</div><div class='del'>-		rcu_read_unlock();</div><div class='del'>-	} while (read_seqretry(&amp;rename_lock, seq));</div><div class='del'>-</div><div class='del'>-	return result;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(is_subdir);</div><div class='del'>-</div><div class='del'>-static enum d_walk_ret d_genocide_kill(void *data, struct dentry *dentry)</div><div class='del'>-{</div><div class='del'>-	struct dentry *root = data;</div><div class='del'>-	if (dentry != root) {</div><div class='del'>-		if (d_unhashed(dentry) || !dentry-&gt;d_inode)</div><div class='del'>-			return D_WALK_SKIP;</div><div class='del'>-</div><div class='del'>-		if (!(dentry-&gt;d_flags &amp; DCACHE_GENOCIDE)) {</div><div class='del'>-			dentry-&gt;d_flags |= DCACHE_GENOCIDE;</div><div class='del'>-			dentry-&gt;d_lockref.count--;</div><div class='del'>-		}</div><div class='add'>+	/* Access d_parent under rcu as d_move() may change it. */</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	seq = read_seqbegin(&amp;rename_lock);</div><div class='add'>+	subdir = d_ancestor(old_dentry, new_dentry);</div><div class='add'>+	 /* Try lockless once... */</div><div class='add'>+	if (read_seqretry(&amp;rename_lock, seq)) {</div><div class='add'>+		/* ...else acquire lock for progress even on deep chains. */</div><div class='add'>+		read_seqlock_excl(&amp;rename_lock);</div><div class='add'>+		subdir = d_ancestor(old_dentry, new_dentry);</div><div class='add'>+		read_sequnlock_excl(&amp;rename_lock);</div><div class='ctx'> 	}</div><div class='del'>-	return D_WALK_CONTINUE;</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+	return subdir;</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL(is_subdir);</div><div class='ctx'> </div><div class='del'>-void d_genocide(struct dentry *parent)</div><div class='add'>+void d_mark_tmpfile(struct file *file, struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	d_walk(parent, parent, d_genocide_kill);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-EXPORT_SYMBOL(d_genocide);</div><div class='add'>+	struct dentry *dentry = file-&gt;f_path.dentry;</div><div class='ctx'> </div><div class='del'>-void d_tmpfile(struct dentry *dentry, struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	inode_dec_link_count(inode);</div><div class='del'>-	BUG_ON(dentry-&gt;d_name.name != dentry-&gt;d_iname ||</div><div class='add'>+	BUG_ON(dname_external(dentry) ||</div><div class='ctx'> 		!hlist_unhashed(&amp;dentry-&gt;d_u.d_alias) ||</div><div class='ctx'> 		!d_unlinked(dentry));</div><div class='ctx'> 	spin_lock(&amp;dentry-&gt;d_parent-&gt;d_lock);</div><div class='ctx'> 	spin_lock_nested(&amp;dentry-&gt;d_lock, DENTRY_D_LOCK_NESTED);</div><div class='del'>-	dentry-&gt;d_name.len = sprintf(dentry-&gt;d_iname, "#%llu",</div><div class='add'>+	dentry-&gt;__d_name.len = sprintf(dentry-&gt;d_shortname.string, "#%llu",</div><div class='ctx'> 				(unsigned long long)inode-&gt;i_ino);</div><div class='ctx'> 	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 	spin_unlock(&amp;dentry-&gt;d_parent-&gt;d_lock);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(d_mark_tmpfile);</div><div class='add'>+</div><div class='add'>+void d_tmpfile(struct file *file, struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct dentry *dentry = file-&gt;f_path.dentry;</div><div class='add'>+</div><div class='add'>+	inode_dec_link_count(inode);</div><div class='add'>+	d_mark_tmpfile(file, inode);</div><div class='ctx'> 	d_instantiate(dentry, inode);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(d_tmpfile);</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Obtain inode number of the parent dentry.</div><div class='add'>+ */</div><div class='add'>+ino_t d_parent_ino(struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	struct dentry *parent;</div><div class='add'>+	struct inode *iparent;</div><div class='add'>+	unsigned seq;</div><div class='add'>+	ino_t ret;</div><div class='add'>+</div><div class='add'>+	scoped_guard(rcu) {</div><div class='add'>+		seq = raw_seqcount_begin(&amp;dentry-&gt;d_seq);</div><div class='add'>+		parent = READ_ONCE(dentry-&gt;d_parent);</div><div class='add'>+		iparent = d_inode_rcu(parent);</div><div class='add'>+		if (likely(iparent)) {</div><div class='add'>+			ret = iparent-&gt;i_ino;</div><div class='add'>+			if (!read_seqcount_retry(&amp;dentry-&gt;d_seq, seq))</div><div class='add'>+				return ret;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;dentry-&gt;d_lock);</div><div class='add'>+	ret = dentry-&gt;d_parent-&gt;d_inode-&gt;i_ino;</div><div class='add'>+	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(d_parent_ino);</div><div class='add'>+</div><div class='ctx'> static __initdata unsigned long dhash_entries;</div><div class='ctx'> static int __init set_dhash_entries(char *str)</div><div class='ctx'> {</div><div class='hunk'>@@ -3212,6 +3253,9 @@ static void __init dcache_init_early(void)</div><div class='ctx'> 					0,</div><div class='ctx'> 					0);</div><div class='ctx'> 	d_hash_shift = 32 - d_hash_shift;</div><div class='add'>+</div><div class='add'>+	runtime_const_init(shift, d_hash_shift);</div><div class='add'>+	runtime_const_init(ptr, dentry_hashtable);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void __init dcache_init(void)</div><div class='hunk'>@@ -3221,9 +3265,10 @@ static void __init dcache_init(void)</div><div class='ctx'> 	 * but it is probably not worth it because of the cache nature</div><div class='ctx'> 	 * of the dcache.</div><div class='ctx'> 	 */</div><div class='del'>-	dentry_cache = KMEM_CACHE_USERCOPY(dentry,</div><div class='del'>-		SLAB_RECLAIM_ACCOUNT|SLAB_PANIC|SLAB_MEM_SPREAD|SLAB_ACCOUNT,</div><div class='del'>-		d_iname);</div><div class='add'>+	__dentry_cache = KMEM_CACHE_USERCOPY(dentry,</div><div class='add'>+		SLAB_RECLAIM_ACCOUNT|SLAB_PANIC|SLAB_ACCOUNT,</div><div class='add'>+		d_shortname.string);</div><div class='add'>+	runtime_const_init(ptr, __dentry_cache);</div><div class='ctx'> </div><div class='ctx'> 	/* Hash may have been set up in dcache_init_early */</div><div class='ctx'> 	if (!hashdist)</div><div class='hunk'>@@ -3240,10 +3285,13 @@ static void __init dcache_init(void)</div><div class='ctx'> 					0,</div><div class='ctx'> 					0);</div><div class='ctx'> 	d_hash_shift = 32 - d_hash_shift;</div><div class='add'>+</div><div class='add'>+	runtime_const_init(shift, d_hash_shift);</div><div class='add'>+	runtime_const_init(ptr, dentry_hashtable);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* SLAB cache for __getname() consumers */</div><div class='del'>-struct kmem_cache *names_cachep __read_mostly;</div><div class='add'>+struct kmem_cache *names_cachep __ro_after_init;</div><div class='ctx'> EXPORT_SYMBOL(names_cachep);</div><div class='ctx'> </div><div class='ctx'> void __init vfs_caches_init_early(void)</div><div class='head'>diff --git a/fs/debugfs/file.c b/fs/debugfs/file.c<br/>index 7d162b0efbf0..3ec3324c2060 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/debugfs/file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/debugfs/file.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/debugfs/file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/debugfs/file.c</a></div><div class='hunk'>@@ -47,58 +47,81 @@ const struct file_operations debugfs_noop_file_operations = {</div><div class='ctx'> </div><div class='ctx'> #define F_DENTRY(filp) ((filp)-&gt;f_path.dentry)</div><div class='ctx'> </div><div class='del'>-const struct file_operations *debugfs_real_fops(const struct file *filp)</div><div class='add'>+void *debugfs_get_aux(const struct file *file)</div><div class='ctx'> {</div><div class='del'>-	struct debugfs_fsdata *fsd = F_DENTRY(filp)-&gt;d_fsdata;</div><div class='del'>-</div><div class='del'>-	if ((unsigned long)fsd &amp; DEBUGFS_FSDATA_IS_REAL_FOPS_BIT) {</div><div class='del'>-		/*</div><div class='del'>-		 * Urgh, we've been called w/o a protecting</div><div class='del'>-		 * debugfs_file_get().</div><div class='del'>-		 */</div><div class='del'>-		WARN_ON(1);</div><div class='del'>-		return NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return fsd-&gt;real_fops;</div><div class='add'>+	return DEBUGFS_I(file_inode(file))-&gt;aux;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL_GPL(debugfs_real_fops);</div><div class='add'>+EXPORT_SYMBOL_GPL(debugfs_get_aux);</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * debugfs_file_get - mark the beginning of file data access</div><div class='del'>- * @dentry: the dentry object whose data is being accessed.</div><div class='del'>- *</div><div class='del'>- * Up to a matching call to debugfs_file_put(), any successive call</div><div class='del'>- * into the file removing functions debugfs_remove() and</div><div class='del'>- * debugfs_remove_recursive() will block. Since associated private</div><div class='del'>- * file data may only get freed after a successful return of any of</div><div class='del'>- * the removal functions, you may safely access it after a successful</div><div class='del'>- * call to debugfs_file_get() without worrying about lifetime issues.</div><div class='del'>- *</div><div class='del'>- * If -%EIO is returned, the file has already been removed and thus,</div><div class='del'>- * it is not safe to access any of its data. If, on the other hand,</div><div class='del'>- * it is allowed to access the file data, zero is returned.</div><div class='del'>- */</div><div class='del'>-int debugfs_file_get(struct dentry *dentry)</div><div class='add'>+enum dbgfs_get_mode {</div><div class='add'>+	DBGFS_GET_ALREADY,</div><div class='add'>+	DBGFS_GET_REGULAR,</div><div class='add'>+	DBGFS_GET_SHORT,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int __debugfs_file_get(struct dentry *dentry, enum dbgfs_get_mode mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct debugfs_fsdata *fsd;</div><div class='ctx'> 	void *d_fsd;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * This could only happen if some debugfs user erroneously calls</div><div class='add'>+	 * debugfs_file_get() on a dentry that isn't even a file, let</div><div class='add'>+	 * them know about it.</div><div class='add'>+	 */</div><div class='add'>+	if (WARN_ON(!d_is_reg(dentry)))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='ctx'> 	d_fsd = READ_ONCE(dentry-&gt;d_fsdata);</div><div class='del'>-	if (!((unsigned long)d_fsd &amp; DEBUGFS_FSDATA_IS_REAL_FOPS_BIT)) {</div><div class='add'>+	if (d_fsd) {</div><div class='ctx'> 		fsd = d_fsd;</div><div class='ctx'> 	} else {</div><div class='add'>+		struct inode *inode = dentry-&gt;d_inode;</div><div class='add'>+		unsigned int methods = 0;</div><div class='add'>+</div><div class='add'>+		if (WARN_ON(mode == DBGFS_GET_ALREADY))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+</div><div class='ctx'> 		fsd = kmalloc(sizeof(*fsd), GFP_KERNEL);</div><div class='ctx'> 		if (!fsd)</div><div class='ctx'> 			return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-		fsd-&gt;real_fops = (void *)((unsigned long)d_fsd &amp;</div><div class='del'>-					~DEBUGFS_FSDATA_IS_REAL_FOPS_BIT);</div><div class='add'>+		if (mode == DBGFS_GET_SHORT) {</div><div class='add'>+			const struct debugfs_short_fops *ops;</div><div class='add'>+			ops = fsd-&gt;short_fops = DEBUGFS_I(inode)-&gt;short_fops;</div><div class='add'>+			if (ops-&gt;llseek)</div><div class='add'>+				methods |= HAS_LSEEK;</div><div class='add'>+			if (ops-&gt;read)</div><div class='add'>+				methods |= HAS_READ;</div><div class='add'>+			if (ops-&gt;write)</div><div class='add'>+				methods |= HAS_WRITE;</div><div class='add'>+			fsd-&gt;real_fops = NULL;</div><div class='add'>+		} else {</div><div class='add'>+			const struct file_operations *ops;</div><div class='add'>+			ops = fsd-&gt;real_fops = DEBUGFS_I(inode)-&gt;real_fops;</div><div class='add'>+			if (ops-&gt;llseek)</div><div class='add'>+				methods |= HAS_LSEEK;</div><div class='add'>+			if (ops-&gt;read)</div><div class='add'>+				methods |= HAS_READ;</div><div class='add'>+			if (ops-&gt;write)</div><div class='add'>+				methods |= HAS_WRITE;</div><div class='add'>+			if (ops-&gt;unlocked_ioctl)</div><div class='add'>+				methods |= HAS_IOCTL;</div><div class='add'>+			if (ops-&gt;poll)</div><div class='add'>+				methods |= HAS_POLL;</div><div class='add'>+			fsd-&gt;short_fops = NULL;</div><div class='add'>+		}</div><div class='add'>+		fsd-&gt;methods = methods;</div><div class='ctx'> 		refcount_set(&amp;fsd-&gt;active_users, 1);</div><div class='ctx'> 		init_completion(&amp;fsd-&gt;active_users_drained);</div><div class='del'>-		if (cmpxchg(&amp;dentry-&gt;d_fsdata, d_fsd, fsd) != d_fsd) {</div><div class='add'>+		INIT_LIST_HEAD(&amp;fsd-&gt;cancellations);</div><div class='add'>+		mutex_init(&amp;fsd-&gt;cancellations_mtx);</div><div class='add'>+</div><div class='add'>+		d_fsd = cmpxchg(&amp;dentry-&gt;d_fsdata, NULL, fsd);</div><div class='add'>+		if (d_fsd) {</div><div class='add'>+			mutex_destroy(&amp;fsd-&gt;cancellations_mtx);</div><div class='ctx'> 			kfree(fsd);</div><div class='del'>-			fsd = READ_ONCE(dentry-&gt;d_fsdata);</div><div class='add'>+			fsd = d_fsd;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -118,6 +141,26 @@ int debugfs_file_get(struct dentry *dentry)</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * debugfs_file_get - mark the beginning of file data access</div><div class='add'>+ * @dentry: the dentry object whose data is being accessed.</div><div class='add'>+ *</div><div class='add'>+ * Up to a matching call to debugfs_file_put(), any successive call</div><div class='add'>+ * into the file removing functions debugfs_remove() and</div><div class='add'>+ * debugfs_remove_recursive() will block. Since associated private</div><div class='add'>+ * file data may only get freed after a successful return of any of</div><div class='add'>+ * the removal functions, you may safely access it after a successful</div><div class='add'>+ * call to debugfs_file_get() without worrying about lifetime issues.</div><div class='add'>+ *</div><div class='add'>+ * If -%EIO is returned, the file has already been removed and thus,</div><div class='add'>+ * it is not safe to access any of its data. If, on the other hand,</div><div class='add'>+ * it is allowed to access the file data, zero is returned.</div><div class='add'>+ */</div><div class='add'>+int debugfs_file_get(struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	return __debugfs_file_get(dentry, DBGFS_GET_ALREADY);</div><div class='add'>+}</div><div class='ctx'> EXPORT_SYMBOL_GPL(debugfs_file_get);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -138,6 +181,84 @@ void debugfs_file_put(struct dentry *dentry)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(debugfs_file_put);</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * debugfs_enter_cancellation - enter a debugfs cancellation</div><div class='add'>+ * @file: the file being accessed</div><div class='add'>+ * @cancellation: the cancellation object, the cancel callback</div><div class='add'>+ *	inside of it must be initialized</div><div class='add'>+ *</div><div class='add'>+ * When a debugfs file is removed it needs to wait for all active</div><div class='add'>+ * operations to complete. However, the operation itself may need</div><div class='add'>+ * to wait for hardware or completion of some asynchronous process</div><div class='add'>+ * or similar. As such, it may need to be cancelled to avoid long</div><div class='add'>+ * waits or even deadlocks.</div><div class='add'>+ *</div><div class='add'>+ * This function can be used inside a debugfs handler that may</div><div class='add'>+ * need to be cancelled. As soon as this function is called, the</div><div class='add'>+ * cancellation's 'cancel' callback may be called, at which point</div><div class='add'>+ * the caller should proceed to call debugfs_leave_cancellation()</div><div class='add'>+ * and leave the debugfs handler function as soon as possible.</div><div class='add'>+ * Note that the 'cancel' callback is only ever called in the</div><div class='add'>+ * context of some kind of debugfs_remove().</div><div class='add'>+ *</div><div class='add'>+ * This function must be paired with debugfs_leave_cancellation().</div><div class='add'>+ */</div><div class='add'>+void debugfs_enter_cancellation(struct file *file,</div><div class='add'>+				struct debugfs_cancellation *cancellation)</div><div class='add'>+{</div><div class='add'>+	struct debugfs_fsdata *fsd;</div><div class='add'>+	struct dentry *dentry = F_DENTRY(file);</div><div class='add'>+</div><div class='add'>+	INIT_LIST_HEAD(&amp;cancellation-&gt;list);</div><div class='add'>+</div><div class='add'>+	if (WARN_ON(!d_is_reg(dentry)))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (WARN_ON(!cancellation-&gt;cancel))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	fsd = READ_ONCE(dentry-&gt;d_fsdata);</div><div class='add'>+	if (WARN_ON(!fsd))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;fsd-&gt;cancellations_mtx);</div><div class='add'>+	list_add(&amp;cancellation-&gt;list, &amp;fsd-&gt;cancellations);</div><div class='add'>+	mutex_unlock(&amp;fsd-&gt;cancellations_mtx);</div><div class='add'>+</div><div class='add'>+	/* if we're already removing wake it up to cancel */</div><div class='add'>+	if (d_unlinked(dentry))</div><div class='add'>+		complete(&amp;fsd-&gt;active_users_drained);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(debugfs_enter_cancellation);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * debugfs_leave_cancellation - leave cancellation section</div><div class='add'>+ * @file: the file being accessed</div><div class='add'>+ * @cancellation: the cancellation previously registered with</div><div class='add'>+ *	debugfs_enter_cancellation()</div><div class='add'>+ *</div><div class='add'>+ * See the documentation of debugfs_enter_cancellation().</div><div class='add'>+ */</div><div class='add'>+void debugfs_leave_cancellation(struct file *file,</div><div class='add'>+				struct debugfs_cancellation *cancellation)</div><div class='add'>+{</div><div class='add'>+	struct debugfs_fsdata *fsd;</div><div class='add'>+	struct dentry *dentry = F_DENTRY(file);</div><div class='add'>+</div><div class='add'>+	if (WARN_ON(!d_is_reg(dentry)))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	fsd = READ_ONCE(dentry-&gt;d_fsdata);</div><div class='add'>+	if (WARN_ON(!fsd))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;fsd-&gt;cancellations_mtx);</div><div class='add'>+	if (!list_empty(&amp;cancellation-&gt;list))</div><div class='add'>+		list_del(&amp;cancellation-&gt;list);</div><div class='add'>+	mutex_unlock(&amp;fsd-&gt;cancellations_mtx);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(debugfs_leave_cancellation);</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Only permit access to world-readable files when the kernel is locked down.</div><div class='ctx'>  * We also need to exclude any file that has ways to write or alter it as root</div><div class='hunk'>@@ -147,11 +268,12 @@ static int debugfs_locked_down(struct inode *inode,</div><div class='ctx'> 			       struct file *filp,</div><div class='ctx'> 			       const struct file_operations *real_fops)</div><div class='ctx'> {</div><div class='del'>-	if ((inode-&gt;i_mode &amp; 07777) == 0444 &amp;&amp;</div><div class='add'>+	if ((inode-&gt;i_mode &amp; 07777 &amp; ~0444) == 0 &amp;&amp;</div><div class='ctx'> 	    !(filp-&gt;f_mode &amp; FMODE_WRITE) &amp;&amp;</div><div class='del'>-	    !real_fops-&gt;unlocked_ioctl &amp;&amp;</div><div class='del'>-	    !real_fops-&gt;compat_ioctl &amp;&amp;</div><div class='del'>-	    !real_fops-&gt;mmap)</div><div class='add'>+	    (!real_fops ||</div><div class='add'>+	     (!real_fops-&gt;unlocked_ioctl &amp;&amp;</div><div class='add'>+	      !real_fops-&gt;compat_ioctl &amp;&amp;</div><div class='add'>+	      !real_fops-&gt;mmap)))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	if (security_locked_down(LOCKDOWN_DEBUGFS))</div><div class='hunk'>@@ -163,15 +285,13 @@ static int debugfs_locked_down(struct inode *inode,</div><div class='ctx'> static int open_proxy_open(struct inode *inode, struct file *filp)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dentry = F_DENTRY(filp);</div><div class='del'>-	const struct file_operations *real_fops = NULL;</div><div class='add'>+	const struct file_operations *real_fops = DEBUGFS_I(inode)-&gt;real_fops;</div><div class='ctx'> 	int r;</div><div class='ctx'> </div><div class='del'>-	r = debugfs_file_get(dentry);</div><div class='add'>+	r = __debugfs_file_get(dentry, DBGFS_GET_REGULAR);</div><div class='ctx'> 	if (r)</div><div class='ctx'> 		return r == -EIO ? -ENOENT : r;</div><div class='ctx'> </div><div class='del'>-	real_fops = debugfs_real_fops(filp);</div><div class='del'>-</div><div class='ctx'> 	r = debugfs_locked_down(inode, filp, real_fops);</div><div class='ctx'> 	if (r)</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -208,61 +328,93 @@ const struct file_operations debugfs_open_proxy_file_operations = {</div><div class='ctx'> #define PROTO(args...) args</div><div class='ctx'> #define ARGS(args...) args</div><div class='ctx'> </div><div class='del'>-#define FULL_PROXY_FUNC(name, ret_type, filp, proto, args)		\</div><div class='add'>+#define FULL_PROXY_FUNC(name, ret_type, filp, proto, args, bit, ret)	\</div><div class='ctx'> static ret_type full_proxy_ ## name(proto)				\</div><div class='ctx'> {									\</div><div class='del'>-	struct dentry *dentry = F_DENTRY(filp);			\</div><div class='del'>-	const struct file_operations *real_fops;			\</div><div class='add'>+	struct dentry *dentry = F_DENTRY(filp);				\</div><div class='add'>+	struct debugfs_fsdata *fsd = dentry-&gt;d_fsdata;			\</div><div class='ctx'> 	ret_type r;							\</div><div class='ctx'> 									\</div><div class='add'>+	if (!(fsd-&gt;methods &amp; bit))					\</div><div class='add'>+		return ret;						\</div><div class='ctx'> 	r = debugfs_file_get(dentry);					\</div><div class='ctx'> 	if (unlikely(r))						\</div><div class='ctx'> 		return r;						\</div><div class='del'>-	real_fops = debugfs_real_fops(filp);				\</div><div class='del'>-	r = real_fops-&gt;name(args);					\</div><div class='add'>+	r = fsd-&gt;real_fops-&gt;name(args);					\</div><div class='ctx'> 	debugfs_file_put(dentry);					\</div><div class='ctx'> 	return r;							\</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#define SHORT_PROXY_FUNC(name, ret_type, filp, proto, args, bit, ret)	\</div><div class='add'>+static ret_type short_proxy_ ## name(proto)				\</div><div class='add'>+{									\</div><div class='add'>+	struct dentry *dentry = F_DENTRY(filp);				\</div><div class='add'>+	struct debugfs_fsdata *fsd = dentry-&gt;d_fsdata;			\</div><div class='add'>+	ret_type r;							\</div><div class='add'>+									\</div><div class='add'>+	if (!(fsd-&gt;methods &amp; bit))					\</div><div class='add'>+		return ret;						\</div><div class='add'>+	r = debugfs_file_get(dentry);					\</div><div class='add'>+	if (unlikely(r))						\</div><div class='add'>+		return r;						\</div><div class='add'>+	r = fsd-&gt;short_fops-&gt;name(args);				\</div><div class='add'>+	debugfs_file_put(dentry);					\</div><div class='add'>+	return r;							\</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+SHORT_PROXY_FUNC(llseek, loff_t, filp,</div><div class='add'>+		PROTO(struct file *filp, loff_t offset, int whence),</div><div class='add'>+		ARGS(filp, offset, whence), HAS_LSEEK, -ESPIPE);</div><div class='add'>+</div><div class='ctx'> FULL_PROXY_FUNC(llseek, loff_t, filp,</div><div class='ctx'> 		PROTO(struct file *filp, loff_t offset, int whence),</div><div class='del'>-		ARGS(filp, offset, whence));</div><div class='add'>+		ARGS(filp, offset, whence), HAS_LSEEK, -ESPIPE);</div><div class='add'>+</div><div class='add'>+SHORT_PROXY_FUNC(read, ssize_t, filp,</div><div class='add'>+		PROTO(struct file *filp, char __user *buf, size_t size,</div><div class='add'>+			loff_t *ppos),</div><div class='add'>+		ARGS(filp, buf, size, ppos), HAS_READ, -EINVAL);</div><div class='ctx'> </div><div class='ctx'> FULL_PROXY_FUNC(read, ssize_t, filp,</div><div class='ctx'> 		PROTO(struct file *filp, char __user *buf, size_t size,</div><div class='ctx'> 			loff_t *ppos),</div><div class='del'>-		ARGS(filp, buf, size, ppos));</div><div class='add'>+		ARGS(filp, buf, size, ppos), HAS_READ, -EINVAL);</div><div class='add'>+</div><div class='add'>+SHORT_PROXY_FUNC(write, ssize_t, filp,</div><div class='add'>+		PROTO(struct file *filp, const char __user *buf,</div><div class='add'>+			size_t size, loff_t *ppos),</div><div class='add'>+		ARGS(filp, buf, size, ppos), HAS_WRITE, -EINVAL);</div><div class='ctx'> </div><div class='ctx'> FULL_PROXY_FUNC(write, ssize_t, filp,</div><div class='del'>-		PROTO(struct file *filp, const char __user *buf, size_t size,</div><div class='del'>-			loff_t *ppos),</div><div class='del'>-		ARGS(filp, buf, size, ppos));</div><div class='add'>+		PROTO(struct file *filp, const char __user *buf,</div><div class='add'>+			size_t size, loff_t *ppos),</div><div class='add'>+		ARGS(filp, buf, size, ppos), HAS_WRITE, -EINVAL);</div><div class='ctx'> </div><div class='ctx'> FULL_PROXY_FUNC(unlocked_ioctl, long, filp,</div><div class='ctx'> 		PROTO(struct file *filp, unsigned int cmd, unsigned long arg),</div><div class='del'>-		ARGS(filp, cmd, arg));</div><div class='add'>+		ARGS(filp, cmd, arg), HAS_IOCTL, -ENOTTY);</div><div class='ctx'> </div><div class='ctx'> static __poll_t full_proxy_poll(struct file *filp,</div><div class='ctx'> 				struct poll_table_struct *wait)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dentry = F_DENTRY(filp);</div><div class='add'>+	struct debugfs_fsdata *fsd = dentry-&gt;d_fsdata;</div><div class='ctx'> 	__poll_t r = 0;</div><div class='del'>-	const struct file_operations *real_fops;</div><div class='ctx'> </div><div class='add'>+	if (!(fsd-&gt;methods &amp; HAS_POLL))</div><div class='add'>+		return DEFAULT_POLLMASK;</div><div class='ctx'> 	if (debugfs_file_get(dentry))</div><div class='ctx'> 		return EPOLLHUP;</div><div class='ctx'> </div><div class='del'>-	real_fops = debugfs_real_fops(filp);</div><div class='del'>-	r = real_fops-&gt;poll(filp, wait);</div><div class='add'>+	r = fsd-&gt;real_fops-&gt;poll(filp, wait);</div><div class='ctx'> 	debugfs_file_put(dentry);</div><div class='ctx'> 	return r;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int full_proxy_release(struct inode *inode, struct file *filp)</div><div class='add'>+static int full_proxy_release(struct inode *inode, struct file *file)</div><div class='ctx'> {</div><div class='del'>-	const struct dentry *dentry = F_DENTRY(filp);</div><div class='del'>-	const struct file_operations *real_fops = debugfs_real_fops(filp);</div><div class='del'>-	const struct file_operations *proxy_fops = filp-&gt;f_op;</div><div class='add'>+	struct debugfs_fsdata *fsd = F_DENTRY(file)-&gt;d_fsdata;</div><div class='add'>+	const struct file_operations *real_fops = fsd-&gt;real_fops;</div><div class='ctx'> 	int r = 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -272,43 +424,25 @@ static int full_proxy_release(struct inode *inode, struct file *filp)</div><div class='ctx'> 	 * -&gt;i_private is still being meaningful here.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (real_fops-&gt;release)</div><div class='del'>-		r = real_fops-&gt;release(inode, filp);</div><div class='add'>+		r = real_fops-&gt;release(inode, file);</div><div class='ctx'> </div><div class='del'>-	replace_fops(filp, d_inode(dentry)-&gt;i_fop);</div><div class='del'>-	kfree(proxy_fops);</div><div class='ctx'> 	fops_put(real_fops);</div><div class='ctx'> 	return r;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void __full_proxy_fops_init(struct file_operations *proxy_fops,</div><div class='del'>-				const struct file_operations *real_fops)</div><div class='del'>-{</div><div class='del'>-	proxy_fops-&gt;release = full_proxy_release;</div><div class='del'>-	if (real_fops-&gt;llseek)</div><div class='del'>-		proxy_fops-&gt;llseek = full_proxy_llseek;</div><div class='del'>-	if (real_fops-&gt;read)</div><div class='del'>-		proxy_fops-&gt;read = full_proxy_read;</div><div class='del'>-	if (real_fops-&gt;write)</div><div class='del'>-		proxy_fops-&gt;write = full_proxy_write;</div><div class='del'>-	if (real_fops-&gt;poll)</div><div class='del'>-		proxy_fops-&gt;poll = full_proxy_poll;</div><div class='del'>-	if (real_fops-&gt;unlocked_ioctl)</div><div class='del'>-		proxy_fops-&gt;unlocked_ioctl = full_proxy_unlocked_ioctl;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int full_proxy_open(struct inode *inode, struct file *filp)</div><div class='add'>+static int full_proxy_open_regular(struct inode *inode, struct file *filp)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dentry = F_DENTRY(filp);</div><div class='del'>-	const struct file_operations *real_fops = NULL;</div><div class='del'>-	struct file_operations *proxy_fops = NULL;</div><div class='add'>+	const struct file_operations *real_fops;</div><div class='add'>+	struct debugfs_fsdata *fsd;</div><div class='ctx'> 	int r;</div><div class='ctx'> </div><div class='del'>-	r = debugfs_file_get(dentry);</div><div class='add'>+	r = __debugfs_file_get(dentry, DBGFS_GET_REGULAR);</div><div class='ctx'> 	if (r)</div><div class='ctx'> 		return r == -EIO ? -ENOENT : r;</div><div class='ctx'> </div><div class='del'>-	real_fops = debugfs_real_fops(filp);</div><div class='del'>-</div><div class='add'>+	fsd = dentry-&gt;d_fsdata;</div><div class='add'>+	real_fops = fsd-&gt;real_fops;</div><div class='ctx'> 	r = debugfs_locked_down(inode, filp, real_fops);</div><div class='ctx'> 	if (r)</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -329,38 +463,52 @@ static int full_proxy_open(struct inode *inode, struct file *filp)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	proxy_fops = kzalloc(sizeof(*proxy_fops), GFP_KERNEL);</div><div class='del'>-	if (!proxy_fops) {</div><div class='del'>-		r = -ENOMEM;</div><div class='del'>-		goto free_proxy;</div><div class='del'>-	}</div><div class='del'>-	__full_proxy_fops_init(proxy_fops, real_fops);</div><div class='del'>-	replace_fops(filp, proxy_fops);</div><div class='del'>-</div><div class='ctx'> 	if (real_fops-&gt;open) {</div><div class='ctx'> 		r = real_fops-&gt;open(inode, filp);</div><div class='ctx'> 		if (r) {</div><div class='del'>-			replace_fops(filp, d_inode(dentry)-&gt;i_fop);</div><div class='del'>-			goto free_proxy;</div><div class='del'>-		} else if (filp-&gt;f_op != proxy_fops) {</div><div class='add'>+			fops_put(real_fops);</div><div class='add'>+		} else if (filp-&gt;f_op != &amp;debugfs_full_proxy_file_operations) {</div><div class='ctx'> 			/* No protection against file removal anymore. */</div><div class='ctx'> 			WARN(1, "debugfs file owner replaced proxy fops: %pd",</div><div class='ctx'> 				dentry);</div><div class='del'>-			goto free_proxy;</div><div class='add'>+			fops_put(real_fops);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	goto out;</div><div class='del'>-free_proxy:</div><div class='del'>-	kfree(proxy_fops);</div><div class='del'>-	fops_put(real_fops);</div><div class='ctx'> out:</div><div class='ctx'> 	debugfs_file_put(dentry);</div><div class='ctx'> 	return r;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct file_operations debugfs_full_proxy_file_operations = {</div><div class='del'>-	.open = full_proxy_open,</div><div class='add'>+	.open = full_proxy_open_regular,</div><div class='add'>+	.release = full_proxy_release,</div><div class='add'>+	.llseek = full_proxy_llseek,</div><div class='add'>+	.read = full_proxy_read,</div><div class='add'>+	.write = full_proxy_write,</div><div class='add'>+	.poll = full_proxy_poll,</div><div class='add'>+	.unlocked_ioctl = full_proxy_unlocked_ioctl</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int full_proxy_open_short(struct inode *inode, struct file *filp)</div><div class='add'>+{</div><div class='add'>+	struct dentry *dentry = F_DENTRY(filp);</div><div class='add'>+	int r;</div><div class='add'>+</div><div class='add'>+	r = __debugfs_file_get(dentry, DBGFS_GET_SHORT);</div><div class='add'>+	if (r)</div><div class='add'>+		return r == -EIO ? -ENOENT : r;</div><div class='add'>+	r = debugfs_locked_down(inode, filp, NULL);</div><div class='add'>+	if (!r)</div><div class='add'>+		r = simple_open(inode, filp);</div><div class='add'>+	debugfs_file_put(dentry);</div><div class='add'>+	return r;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+const struct file_operations debugfs_full_short_proxy_file_operations = {</div><div class='add'>+	.open = full_proxy_open_short,</div><div class='add'>+	.llseek = short_proxy_llseek,</div><div class='add'>+	.read = short_proxy_read,</div><div class='add'>+	.write = short_proxy_write,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> ssize_t debugfs_attr_read(struct file *file, char __user *buf,</div><div class='hunk'>@@ -378,8 +526,8 @@ ssize_t debugfs_attr_read(struct file *file, char __user *buf,</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(debugfs_attr_read);</div><div class='ctx'> </div><div class='del'>-ssize_t debugfs_attr_write(struct file *file, const char __user *buf,</div><div class='del'>-			 size_t len, loff_t *ppos)</div><div class='add'>+static ssize_t debugfs_attr_write_xsigned(struct file *file, const char __user *buf,</div><div class='add'>+			 size_t len, loff_t *ppos, bool is_signed)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dentry = F_DENTRY(file);</div><div class='ctx'> 	ssize_t ret;</div><div class='hunk'>@@ -387,12 +535,28 @@ ssize_t debugfs_attr_write(struct file *file, const char __user *buf,</div><div class='ctx'> 	ret = debugfs_file_get(dentry);</div><div class='ctx'> 	if (unlikely(ret))</div><div class='ctx'> 		return ret;</div><div class='del'>-	ret = simple_attr_write(file, buf, len, ppos);</div><div class='add'>+	if (is_signed)</div><div class='add'>+		ret = simple_attr_write_signed(file, buf, len, ppos);</div><div class='add'>+	else</div><div class='add'>+		ret = simple_attr_write(file, buf, len, ppos);</div><div class='ctx'> 	debugfs_file_put(dentry);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+ssize_t debugfs_attr_write(struct file *file, const char __user *buf,</div><div class='add'>+			 size_t len, loff_t *ppos)</div><div class='add'>+{</div><div class='add'>+	return debugfs_attr_write_xsigned(file, buf, len, ppos, false);</div><div class='add'>+}</div><div class='ctx'> EXPORT_SYMBOL_GPL(debugfs_attr_write);</div><div class='ctx'> </div><div class='add'>+ssize_t debugfs_attr_write_signed(struct file *file, const char __user *buf,</div><div class='add'>+			 size_t len, loff_t *ppos)</div><div class='add'>+{</div><div class='add'>+	return debugfs_attr_write_xsigned(file, buf, len, ppos, true);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(debugfs_attr_write_signed);</div><div class='add'>+</div><div class='ctx'> static struct dentry *debugfs_create_mode_unsafe(const char *name, umode_t mode,</div><div class='ctx'> 					struct dentry *parent, void *value,</div><div class='ctx'> 					const struct file_operations *fops,</div><div class='hunk'>@@ -738,11 +902,11 @@ static int debugfs_atomic_t_get(void *data, u64 *val)</div><div class='ctx'> 	*val = atomic_read((atomic_t *)data);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='del'>-DEFINE_DEBUGFS_ATTRIBUTE(fops_atomic_t, debugfs_atomic_t_get,</div><div class='add'>+DEFINE_DEBUGFS_ATTRIBUTE_SIGNED(fops_atomic_t, debugfs_atomic_t_get,</div><div class='ctx'> 			debugfs_atomic_t_set, "%lld\n");</div><div class='del'>-DEFINE_DEBUGFS_ATTRIBUTE(fops_atomic_t_ro, debugfs_atomic_t_get, NULL,</div><div class='add'>+DEFINE_DEBUGFS_ATTRIBUTE_SIGNED(fops_atomic_t_ro, debugfs_atomic_t_get, NULL,</div><div class='ctx'> 			"%lld\n");</div><div class='del'>-DEFINE_DEBUGFS_ATTRIBUTE(fops_atomic_t_wo, NULL, debugfs_atomic_t_set,</div><div class='add'>+DEFINE_DEBUGFS_ATTRIBUTE_SIGNED(fops_atomic_t_wo, NULL, debugfs_atomic_t_set,</div><div class='ctx'> 			"%lld\n");</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -883,12 +1047,57 @@ ssize_t debugfs_read_file_str(struct file *file, char __user *user_buf,</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL_GPL(debugfs_create_str);</div><div class='ctx'> </div><div class='ctx'> static ssize_t debugfs_write_file_str(struct file *file, const char __user *user_buf,</div><div class='ctx'> 				      size_t count, loff_t *ppos)</div><div class='ctx'> {</div><div class='del'>-	/* This is really only for read-only strings */</div><div class='del'>-	return -EINVAL;</div><div class='add'>+	struct dentry *dentry = F_DENTRY(file);</div><div class='add'>+	char *old, *new = NULL;</div><div class='add'>+	int pos = *ppos;</div><div class='add'>+	int r;</div><div class='add'>+</div><div class='add'>+	r = debugfs_file_get(dentry);</div><div class='add'>+	if (unlikely(r))</div><div class='add'>+		return r;</div><div class='add'>+</div><div class='add'>+	old = *(char **)file-&gt;private_data;</div><div class='add'>+</div><div class='add'>+	/* only allow strict concatenation */</div><div class='add'>+	r = -EINVAL;</div><div class='add'>+	if (pos &amp;&amp; pos != strlen(old))</div><div class='add'>+		goto error;</div><div class='add'>+</div><div class='add'>+	r = -E2BIG;</div><div class='add'>+	if (pos + count + 1 &gt; PAGE_SIZE)</div><div class='add'>+		goto error;</div><div class='add'>+</div><div class='add'>+	r = -ENOMEM;</div><div class='add'>+	new = kmalloc(pos + count + 1, GFP_KERNEL);</div><div class='add'>+	if (!new)</div><div class='add'>+		goto error;</div><div class='add'>+</div><div class='add'>+	if (pos)</div><div class='add'>+		memcpy(new, old, pos);</div><div class='add'>+</div><div class='add'>+	r = -EFAULT;</div><div class='add'>+	if (copy_from_user(new + pos, user_buf, count))</div><div class='add'>+		goto error;</div><div class='add'>+</div><div class='add'>+	new[pos + count] = '\0';</div><div class='add'>+	strim(new);</div><div class='add'>+</div><div class='add'>+	rcu_assign_pointer(*(char __rcu **)file-&gt;private_data, new);</div><div class='add'>+	synchronize_rcu();</div><div class='add'>+	kfree(old);</div><div class='add'>+</div><div class='add'>+	debugfs_file_put(dentry);</div><div class='add'>+	return count;</div><div class='add'>+</div><div class='add'>+error:</div><div class='add'>+	kfree(new);</div><div class='add'>+	debugfs_file_put(dentry);</div><div class='add'>+	return r;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct file_operations fops_str = {</div><div class='hunk'>@@ -923,15 +1132,6 @@ static const struct file_operations fops_str_wo = {</div><div class='ctx'>  * This function creates a file in debugfs with the given name that</div><div class='ctx'>  * contains the value of the variable @value.  If the @mode variable is so</div><div class='ctx'>  * set, it can be read from, and written to.</div><div class='del'>- *</div><div class='del'>- * This function will return a pointer to a dentry if it succeeds.  This</div><div class='del'>- * pointer must be passed to the debugfs_remove() function when the file is</div><div class='del'>- * to be removed (no automatic cleanup happens if your module is unloaded,</div><div class='del'>- * you are responsible here.)  If an error occurs, ERR_PTR(-ERROR) will be</div><div class='del'>- * returned.</div><div class='del'>- *</div><div class='del'>- * If debugfs is not enabled in the kernel, the value ERR_PTR(-ENODEV) will</div><div class='del'>- * be returned.</div><div class='ctx'>  */</div><div class='ctx'> void debugfs_create_str(const char *name, umode_t mode,</div><div class='ctx'> 			struct dentry *parent, char **value)</div><div class='hunk'>@@ -956,17 +1156,35 @@ static ssize_t read_file_blob(struct file *file, char __user *user_buf,</div><div class='ctx'> 	return r;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static ssize_t write_file_blob(struct file *file, const char __user *user_buf,</div><div class='add'>+			       size_t count, loff_t *ppos)</div><div class='add'>+{</div><div class='add'>+	struct debugfs_blob_wrapper *blob = file-&gt;private_data;</div><div class='add'>+	struct dentry *dentry = F_DENTRY(file);</div><div class='add'>+	ssize_t r;</div><div class='add'>+</div><div class='add'>+	r = debugfs_file_get(dentry);</div><div class='add'>+	if (unlikely(r))</div><div class='add'>+		return r;</div><div class='add'>+	r = simple_write_to_buffer(blob-&gt;data, blob-&gt;size, ppos, user_buf,</div><div class='add'>+				   count);</div><div class='add'>+</div><div class='add'>+	debugfs_file_put(dentry);</div><div class='add'>+	return r;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static const struct file_operations fops_blob = {</div><div class='ctx'> 	.read =		read_file_blob,</div><div class='add'>+	.write =	write_file_blob,</div><div class='ctx'> 	.open =		simple_open,</div><div class='ctx'> 	.llseek =	default_llseek,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * debugfs_create_blob - create a debugfs file that is used to read a binary blob</div><div class='add'>+ * debugfs_create_blob - create a debugfs file that is used to read and write</div><div class='add'>+ * a binary blob</div><div class='ctx'>  * @name: a pointer to a string containing the name of the file to create.</div><div class='del'>- * @mode: the read permission that the file should have (other permissions are</div><div class='del'>- *	  masked out)</div><div class='add'>+ * @mode: the permission that the file should have</div><div class='ctx'>  * @parent: a pointer to the parent dentry for this file.  This should be a</div><div class='ctx'>  *          directory dentry if set.  If this parameter is %NULL, then the</div><div class='ctx'>  *          file will be created in the root of the debugfs filesystem.</div><div class='hunk'>@@ -975,7 +1193,7 @@ static const struct file_operations fops_blob = {</div><div class='ctx'>  *</div><div class='ctx'>  * This function creates a file in debugfs with the given name that exports</div><div class='ctx'>  * @blob-&gt;data as a binary blob. If the @mode variable is so set it can be</div><div class='del'>- * read from. Writing is not supported.</div><div class='add'>+ * read from and written to.</div><div class='ctx'>  *</div><div class='ctx'>  * This function will return a pointer to a dentry if it succeeds.  This</div><div class='ctx'>  * pointer must be passed to the debugfs_remove() function when the file is</div><div class='hunk'>@@ -990,7 +1208,7 @@ struct dentry *debugfs_create_blob(const char *name, umode_t mode,</div><div class='ctx'> 				   struct dentry *parent,</div><div class='ctx'> 				   struct debugfs_blob_wrapper *blob)</div><div class='ctx'> {</div><div class='del'>-	return debugfs_create_file_unsafe(name, mode &amp; 0444, parent, blob, &amp;fops_blob);</div><div class='add'>+	return debugfs_create_file_unsafe(name, mode &amp; 0644, parent, blob, &amp;fops_blob);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(debugfs_create_blob);</div><div class='ctx'> </div><div class='hunk'>@@ -1056,7 +1274,6 @@ static const struct file_operations u32_array_fops = {</div><div class='ctx'> 	.open	 = u32_array_open,</div><div class='ctx'> 	.release = u32_array_release,</div><div class='ctx'> 	.read	 = u32_array_read,</div><div class='del'>-	.llseek  = no_llseek,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -1121,7 +1338,7 @@ void debugfs_print_regs32(struct seq_file *s, const struct debugfs_reg32 *regs,</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(debugfs_print_regs32);</div><div class='ctx'> </div><div class='del'>-static int debugfs_show_regset32(struct seq_file *s, void *data)</div><div class='add'>+static int debugfs_regset32_show(struct seq_file *s, void *data)</div><div class='ctx'> {</div><div class='ctx'> 	struct debugfs_regset32 *regset = s-&gt;private;</div><div class='ctx'> </div><div class='hunk'>@@ -1136,17 +1353,7 @@ static int debugfs_show_regset32(struct seq_file *s, void *data)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int debugfs_open_regset32(struct inode *inode, struct file *file)</div><div class='del'>-{</div><div class='del'>-	return single_open(file, debugfs_show_regset32, inode-&gt;i_private);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static const struct file_operations fops_regset32 = {</div><div class='del'>-	.open =		debugfs_open_regset32,</div><div class='del'>-	.read =		seq_read,</div><div class='del'>-	.llseek =	seq_lseek,</div><div class='del'>-	.release =	single_release,</div><div class='del'>-};</div><div class='add'>+DEFINE_SHOW_ATTRIBUTE(debugfs_regset32);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * debugfs_create_regset32 - create a debugfs file that returns register values</div><div class='hunk'>@@ -1167,7 +1374,7 @@ void debugfs_create_regset32(const char *name, umode_t mode,</div><div class='ctx'> 			     struct dentry *parent,</div><div class='ctx'> 			     struct debugfs_regset32 *regset)</div><div class='ctx'> {</div><div class='del'>-	debugfs_create_file(name, mode, parent, regset, &amp;fops_regset32);</div><div class='add'>+	debugfs_create_file(name, mode, parent, regset, &amp;debugfs_regset32_fops);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(debugfs_create_regset32);</div><div class='ctx'> </div><div class='head'>diff --git a/fs/debugfs/inode.c b/fs/debugfs/inode.c<br/>index 2f117c57160d..4b263c328ed2 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/debugfs/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/debugfs/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/debugfs/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/debugfs/inode.c</a></div><div class='hunk'>@@ -14,7 +14,8 @@</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/module.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='del'>-#include &lt;linux/mount.h&gt;</div><div class='add'>+#include &lt;linux/fs_context.h&gt;</div><div class='add'>+#include &lt;linux/fs_parser.h&gt;</div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='ctx'> #include &lt;linux/init.h&gt;</div><div class='ctx'> #include &lt;linux/kobject.h&gt;</div><div class='hunk'>@@ -23,7 +24,6 @@</div><div class='ctx'> #include &lt;linux/fsnotify.h&gt;</div><div class='ctx'> #include &lt;linux/string.h&gt;</div><div class='ctx'> #include &lt;linux/seq_file.h&gt;</div><div class='del'>-#include &lt;linux/parser.h&gt;</div><div class='ctx'> #include &lt;linux/magic.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/security.h&gt;</div><div class='hunk'>@@ -35,14 +35,14 @@</div><div class='ctx'> static struct vfsmount *debugfs_mount;</div><div class='ctx'> static int debugfs_mount_count;</div><div class='ctx'> static bool debugfs_registered;</div><div class='del'>-static unsigned int debugfs_allow __ro_after_init = DEFAULT_DEBUGFS_ALLOW_BITS;</div><div class='add'>+static bool debugfs_enabled __ro_after_init = IS_ENABLED(CONFIG_DEBUG_FS_ALLOW_ALL);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Don't allow access attributes to be changed whilst the kernel is locked down</div><div class='ctx'>  * so that we can use the file mode as part of a heuristic to determine whether</div><div class='ctx'>  * to lock down individual files.</div><div class='ctx'>  */</div><div class='del'>-static int debugfs_setattr(struct user_namespace *mnt_userns,</div><div class='add'>+static int debugfs_setattr(struct mnt_idmap *idmap,</div><div class='ctx'> 			   struct dentry *dentry, struct iattr *ia)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -52,7 +52,7 @@ static int debugfs_setattr(struct user_namespace *mnt_userns,</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 	}</div><div class='del'>-	return simple_setattr(&amp;init_user_ns, dentry, ia);</div><div class='add'>+	return simple_setattr(&amp;nop_mnt_idmap, dentry, ia);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct inode_operations debugfs_file_inode_operations = {</div><div class='hunk'>@@ -72,216 +72,261 @@ static struct inode *debugfs_get_inode(struct super_block *sb)</div><div class='ctx'> 	struct inode *inode = new_inode(sb);</div><div class='ctx'> 	if (inode) {</div><div class='ctx'> 		inode-&gt;i_ino = get_next_ino();</div><div class='del'>-		inode-&gt;i_atime = inode-&gt;i_mtime =</div><div class='del'>-			inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+		simple_inode_init_ts(inode);</div><div class='ctx'> 	}</div><div class='ctx'> 	return inode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct debugfs_mount_opts {</div><div class='add'>+struct debugfs_fs_info {</div><div class='ctx'> 	kuid_t uid;</div><div class='ctx'> 	kgid_t gid;</div><div class='ctx'> 	umode_t mode;</div><div class='add'>+	/* Opt_* bitfield. */</div><div class='add'>+	unsigned int opts;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> enum {</div><div class='ctx'> 	Opt_uid,</div><div class='ctx'> 	Opt_gid,</div><div class='ctx'> 	Opt_mode,</div><div class='del'>-	Opt_err</div><div class='add'>+	Opt_source,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static const match_table_t tokens = {</div><div class='del'>-	{Opt_uid, "uid=%u"},</div><div class='del'>-	{Opt_gid, "gid=%u"},</div><div class='del'>-	{Opt_mode, "mode=%o"},</div><div class='del'>-	{Opt_err, NULL}</div><div class='add'>+static const struct fs_parameter_spec debugfs_param_specs[] = {</div><div class='add'>+	fsparam_gid	("gid",		Opt_gid),</div><div class='add'>+	fsparam_u32oct	("mode",	Opt_mode),</div><div class='add'>+	fsparam_uid	("uid",		Opt_uid),</div><div class='add'>+	fsparam_string	("source",	Opt_source),</div><div class='add'>+	{}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-struct debugfs_fs_info {</div><div class='del'>-	struct debugfs_mount_opts mount_opts;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static int debugfs_parse_options(char *data, struct debugfs_mount_opts *opts)</div><div class='add'>+static int debugfs_parse_param(struct fs_context *fc, struct fs_parameter *param)</div><div class='ctx'> {</div><div class='del'>-	substring_t args[MAX_OPT_ARGS];</div><div class='del'>-	int option;</div><div class='del'>-	int token;</div><div class='del'>-	kuid_t uid;</div><div class='del'>-	kgid_t gid;</div><div class='del'>-	char *p;</div><div class='del'>-</div><div class='del'>-	opts-&gt;mode = DEBUGFS_DEFAULT_MODE;</div><div class='del'>-</div><div class='del'>-	while ((p = strsep(&amp;data, ",")) != NULL) {</div><div class='del'>-		if (!*p)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		token = match_token(p, tokens, args);</div><div class='del'>-		switch (token) {</div><div class='del'>-		case Opt_uid:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;option))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			uid = make_kuid(current_user_ns(), option);</div><div class='del'>-			if (!uid_valid(uid))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			opts-&gt;uid = uid;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_gid:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;option))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			gid = make_kgid(current_user_ns(), option);</div><div class='del'>-			if (!gid_valid(gid))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			opts-&gt;gid = gid;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_mode:</div><div class='del'>-			if (match_octal(&amp;args[0], &amp;option))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			opts-&gt;mode = option &amp; S_IALLUGO;</div><div class='del'>-			break;</div><div class='add'>+	struct debugfs_fs_info *opts = fc-&gt;s_fs_info;</div><div class='add'>+	struct fs_parse_result result;</div><div class='add'>+	int opt;</div><div class='add'>+</div><div class='add'>+	opt = fs_parse(fc, debugfs_param_specs, param, &amp;result);</div><div class='add'>+	if (opt &lt; 0) {</div><div class='ctx'> 		/*</div><div class='del'>-		 * We might like to report bad mount options here;</div><div class='del'>-		 * but traditionally debugfs has ignored all mount options</div><div class='del'>-		 */</div><div class='del'>-		}</div><div class='add'>+                * We might like to report bad mount options here; but</div><div class='add'>+                * traditionally debugfs has ignored all mount options</div><div class='add'>+                */</div><div class='add'>+		if (opt == -ENOPARAM)</div><div class='add'>+			return 0;</div><div class='add'>+</div><div class='add'>+		return opt;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	switch (opt) {</div><div class='add'>+	case Opt_uid:</div><div class='add'>+		opts-&gt;uid = result.uid;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_gid:</div><div class='add'>+		opts-&gt;gid = result.gid;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_mode:</div><div class='add'>+		opts-&gt;mode = result.uint_32 &amp; S_IALLUGO;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_source:</div><div class='add'>+		if (fc-&gt;source)</div><div class='add'>+			return invalfc(fc, "Multiple sources specified");</div><div class='add'>+		fc-&gt;source = param-&gt;string;</div><div class='add'>+		param-&gt;string = NULL;</div><div class='add'>+		break;</div><div class='add'>+	/*</div><div class='add'>+	 * We might like to report bad mount options here;</div><div class='add'>+	 * but traditionally debugfs has ignored all mount options</div><div class='add'>+	 */</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	opts-&gt;opts |= BIT(opt);</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int debugfs_apply_options(struct super_block *sb)</div><div class='add'>+static void _debugfs_apply_options(struct super_block *sb, bool remount)</div><div class='ctx'> {</div><div class='ctx'> 	struct debugfs_fs_info *fsi = sb-&gt;s_fs_info;</div><div class='ctx'> 	struct inode *inode = d_inode(sb-&gt;s_root);</div><div class='del'>-	struct debugfs_mount_opts *opts = &amp;fsi-&gt;mount_opts;</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_mode &amp;= ~S_IALLUGO;</div><div class='del'>-	inode-&gt;i_mode |= opts-&gt;mode;</div><div class='add'>+	/*</div><div class='add'>+	 * On remount, only reset mode/uid/gid if they were provided as mount</div><div class='add'>+	 * options.</div><div class='add'>+	 */</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_uid = opts-&gt;uid;</div><div class='del'>-	inode-&gt;i_gid = opts-&gt;gid;</div><div class='add'>+	if (!remount || fsi-&gt;opts &amp; BIT(Opt_mode)) {</div><div class='add'>+		inode-&gt;i_mode &amp;= ~S_IALLUGO;</div><div class='add'>+		inode-&gt;i_mode |= fsi-&gt;mode;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+	if (!remount || fsi-&gt;opts &amp; BIT(Opt_uid))</div><div class='add'>+		inode-&gt;i_uid = fsi-&gt;uid;</div><div class='add'>+</div><div class='add'>+	if (!remount || fsi-&gt;opts &amp; BIT(Opt_gid))</div><div class='add'>+		inode-&gt;i_gid = fsi-&gt;gid;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int debugfs_remount(struct super_block *sb, int *flags, char *data)</div><div class='add'>+static void debugfs_apply_options(struct super_block *sb)</div><div class='ctx'> {</div><div class='del'>-	int err;</div><div class='del'>-	struct debugfs_fs_info *fsi = sb-&gt;s_fs_info;</div><div class='add'>+	_debugfs_apply_options(sb, false);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void debugfs_apply_options_remount(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	_debugfs_apply_options(sb, true);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int debugfs_reconfigure(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = fc-&gt;root-&gt;d_sb;</div><div class='add'>+	struct debugfs_fs_info *sb_opts = sb-&gt;s_fs_info;</div><div class='add'>+	struct debugfs_fs_info *new_opts = fc-&gt;s_fs_info;</div><div class='add'>+</div><div class='add'>+	if (!new_opts)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> 	sync_filesystem(sb);</div><div class='del'>-	err = debugfs_parse_options(data, &amp;fsi-&gt;mount_opts);</div><div class='del'>-	if (err)</div><div class='del'>-		goto fail;</div><div class='ctx'> </div><div class='del'>-	debugfs_apply_options(sb);</div><div class='add'>+	/* structure copy of new mount options to sb */</div><div class='add'>+	*sb_opts = *new_opts;</div><div class='add'>+	debugfs_apply_options_remount(sb);</div><div class='ctx'> </div><div class='del'>-fail:</div><div class='del'>-	return err;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int debugfs_show_options(struct seq_file *m, struct dentry *root)</div><div class='ctx'> {</div><div class='ctx'> 	struct debugfs_fs_info *fsi = root-&gt;d_sb-&gt;s_fs_info;</div><div class='del'>-	struct debugfs_mount_opts *opts = &amp;fsi-&gt;mount_opts;</div><div class='ctx'> </div><div class='del'>-	if (!uid_eq(opts-&gt;uid, GLOBAL_ROOT_UID))</div><div class='add'>+	if (!uid_eq(fsi-&gt;uid, GLOBAL_ROOT_UID))</div><div class='ctx'> 		seq_printf(m, ",uid=%u",</div><div class='del'>-			   from_kuid_munged(&amp;init_user_ns, opts-&gt;uid));</div><div class='del'>-	if (!gid_eq(opts-&gt;gid, GLOBAL_ROOT_GID))</div><div class='add'>+			   from_kuid_munged(&amp;init_user_ns, fsi-&gt;uid));</div><div class='add'>+	if (!gid_eq(fsi-&gt;gid, GLOBAL_ROOT_GID))</div><div class='ctx'> 		seq_printf(m, ",gid=%u",</div><div class='del'>-			   from_kgid_munged(&amp;init_user_ns, opts-&gt;gid));</div><div class='del'>-	if (opts-&gt;mode != DEBUGFS_DEFAULT_MODE)</div><div class='del'>-		seq_printf(m, ",mode=%o", opts-&gt;mode);</div><div class='add'>+			   from_kgid_munged(&amp;init_user_ns, fsi-&gt;gid));</div><div class='add'>+	if (fsi-&gt;mode != DEBUGFS_DEFAULT_MODE)</div><div class='add'>+		seq_printf(m, ",mode=%o", fsi-&gt;mode);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static struct kmem_cache *debugfs_inode_cachep __ro_after_init;</div><div class='add'>+</div><div class='add'>+static void init_once(void *foo)</div><div class='add'>+{</div><div class='add'>+	struct debugfs_inode_info *info = foo;</div><div class='add'>+	inode_init_once(&amp;info-&gt;vfs_inode);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct inode *debugfs_alloc_inode(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct debugfs_inode_info *info;</div><div class='add'>+	info = alloc_inode_sb(sb, debugfs_inode_cachep, GFP_KERNEL);</div><div class='add'>+	if (!info)</div><div class='add'>+		return NULL;</div><div class='add'>+	return &amp;info-&gt;vfs_inode;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void debugfs_free_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	if (S_ISLNK(inode-&gt;i_mode))</div><div class='ctx'> 		kfree(inode-&gt;i_link);</div><div class='del'>-	free_inode_nonrcu(inode);</div><div class='add'>+	kmem_cache_free(debugfs_inode_cachep, DEBUGFS_I(inode));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct super_operations debugfs_super_operations = {</div><div class='ctx'> 	.statfs		= simple_statfs,</div><div class='del'>-	.remount_fs	= debugfs_remount,</div><div class='ctx'> 	.show_options	= debugfs_show_options,</div><div class='add'>+	.alloc_inode	= debugfs_alloc_inode,</div><div class='ctx'> 	.free_inode	= debugfs_free_inode,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static void debugfs_release_dentry(struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	void *fsd = dentry-&gt;d_fsdata;</div><div class='add'>+	struct debugfs_fsdata *fsd = dentry-&gt;d_fsdata;</div><div class='ctx'> </div><div class='del'>-	if (!((unsigned long)fsd &amp; DEBUGFS_FSDATA_IS_REAL_FOPS_BIT))</div><div class='del'>-		kfree(dentry-&gt;d_fsdata);</div><div class='add'>+	if (fsd) {</div><div class='add'>+		WARN_ON(!list_empty(&amp;fsd-&gt;cancellations));</div><div class='add'>+		mutex_destroy(&amp;fsd-&gt;cancellations_mtx);</div><div class='add'>+	}</div><div class='add'>+	kfree(fsd);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct vfsmount *debugfs_automount(struct path *path)</div><div class='ctx'> {</div><div class='del'>-	debugfs_automount_t f;</div><div class='del'>-	f = (debugfs_automount_t)path-&gt;dentry-&gt;d_fsdata;</div><div class='del'>-	return f(path-&gt;dentry, d_inode(path-&gt;dentry)-&gt;i_private);</div><div class='add'>+	struct inode *inode = path-&gt;dentry-&gt;d_inode;</div><div class='add'>+</div><div class='add'>+	return DEBUGFS_I(inode)-&gt;automount(path-&gt;dentry, inode-&gt;i_private);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct dentry_operations debugfs_dops = {</div><div class='del'>-	.d_delete = always_delete_dentry,</div><div class='ctx'> 	.d_release = debugfs_release_dentry,</div><div class='ctx'> 	.d_automount = debugfs_automount,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int debug_fill_super(struct super_block *sb, void *data, int silent)</div><div class='add'>+static int debugfs_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> {</div><div class='ctx'> 	static const struct tree_descr debug_files[] = {{""}};</div><div class='del'>-	struct debugfs_fs_info *fsi;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	fsi = kzalloc(sizeof(struct debugfs_fs_info), GFP_KERNEL);</div><div class='del'>-	sb-&gt;s_fs_info = fsi;</div><div class='del'>-	if (!fsi) {</div><div class='del'>-		err = -ENOMEM;</div><div class='del'>-		goto fail;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	err = debugfs_parse_options(data, &amp;fsi-&gt;mount_opts);</div><div class='del'>-	if (err)</div><div class='del'>-		goto fail;</div><div class='del'>-</div><div class='del'>-	err  =  simple_fill_super(sb, DEBUGFS_MAGIC, debug_files);</div><div class='add'>+	err = simple_fill_super(sb, DEBUGFS_MAGIC, debug_files);</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto fail;</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='ctx'> 	sb-&gt;s_op = &amp;debugfs_super_operations;</div><div class='del'>-	sb-&gt;s_d_op = &amp;debugfs_dops;</div><div class='add'>+	set_default_d_op(sb, &amp;debugfs_dops);</div><div class='add'>+	sb-&gt;s_d_flags |= DCACHE_DONTCACHE;</div><div class='ctx'> </div><div class='ctx'> 	debugfs_apply_options(sb);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-fail:</div><div class='del'>-	kfree(fsi);</div><div class='del'>-	sb-&gt;s_fs_info = NULL;</div><div class='del'>-	return err;</div><div class='add'>+static int debugfs_get_tree(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = get_tree_single(fc, debugfs_fill_super);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	return debugfs_reconfigure(fc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct dentry *debug_mount(struct file_system_type *fs_type,</div><div class='del'>-			int flags, const char *dev_name,</div><div class='del'>-			void *data)</div><div class='add'>+static void debugfs_free_fc(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	if (!(debugfs_allow &amp; DEBUGFS_ALLOW_API))</div><div class='del'>-		return ERR_PTR(-EPERM);</div><div class='add'>+	kfree(fc-&gt;s_fs_info);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	return mount_single(fs_type, flags, data, debug_fill_super);</div><div class='add'>+static const struct fs_context_operations debugfs_context_ops = {</div><div class='add'>+	.free		= debugfs_free_fc,</div><div class='add'>+	.parse_param	= debugfs_parse_param,</div><div class='add'>+	.get_tree	= debugfs_get_tree,</div><div class='add'>+	.reconfigure	= debugfs_reconfigure,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int debugfs_init_fs_context(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct debugfs_fs_info *fsi;</div><div class='add'>+</div><div class='add'>+	fsi = kzalloc(sizeof(struct debugfs_fs_info), GFP_KERNEL);</div><div class='add'>+	if (!fsi)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	fsi-&gt;mode = DEBUGFS_DEFAULT_MODE;</div><div class='add'>+</div><div class='add'>+	fc-&gt;s_fs_info = fsi;</div><div class='add'>+	fc-&gt;ops = &amp;debugfs_context_ops;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct file_system_type debug_fs_type = {</div><div class='ctx'> 	.owner =	THIS_MODULE,</div><div class='ctx'> 	.name =		"debugfs",</div><div class='del'>-	.mount =	debug_mount,</div><div class='del'>-	.kill_sb =	kill_litter_super,</div><div class='add'>+	.init_fs_context = debugfs_init_fs_context,</div><div class='add'>+	.parameters =	debugfs_param_specs,</div><div class='add'>+	.kill_sb =	kill_anon_super,</div><div class='ctx'> };</div><div class='ctx'> MODULE_ALIAS_FS("debugfs");</div><div class='ctx'> </div><div class='hunk'>@@ -307,19 +352,20 @@ struct dentry *debugfs_lookup(const char *name, struct dentry *parent)</div><div class='ctx'> 	if (!parent)</div><div class='ctx'> 		parent = debugfs_mount-&gt;mnt_root;</div><div class='ctx'> </div><div class='del'>-	dentry = lookup_positive_unlocked(name, parent, strlen(name));</div><div class='add'>+	dentry = lookup_noperm_positive_unlocked(&amp;QSTR(name), parent);</div><div class='ctx'> 	if (IS_ERR(dentry))</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	return dentry;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(debugfs_lookup);</div><div class='ctx'> </div><div class='del'>-static struct dentry *start_creating(const char *name, struct dentry *parent)</div><div class='add'>+static struct dentry *debugfs_start_creating(const char *name,</div><div class='add'>+					     struct dentry *parent)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dentry;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	if (!(debugfs_allow &amp; DEBUGFS_ALLOW_API))</div><div class='add'>+	if (!debugfs_enabled)</div><div class='ctx'> 		return ERR_PTR(-EPERM);</div><div class='ctx'> </div><div class='ctx'> 	if (!debugfs_initialized())</div><div class='hunk'>@@ -345,48 +391,33 @@ static struct dentry *start_creating(const char *name, struct dentry *parent)</div><div class='ctx'> 	if (!parent)</div><div class='ctx'> 		parent = debugfs_mount-&gt;mnt_root;</div><div class='ctx'> </div><div class='del'>-	inode_lock(d_inode(parent));</div><div class='del'>-	if (unlikely(IS_DEADDIR(d_inode(parent))))</div><div class='del'>-		dentry = ERR_PTR(-ENOENT);</div><div class='del'>-	else</div><div class='del'>-		dentry = lookup_one_len(name, parent, strlen(name));</div><div class='del'>-	if (!IS_ERR(dentry) &amp;&amp; d_really_is_positive(dentry)) {</div><div class='del'>-		if (d_is_dir(dentry))</div><div class='del'>-			pr_err("Directory '%s' with parent '%s' already present!\n",</div><div class='del'>-			       name, parent-&gt;d_name.name);</div><div class='del'>-		else</div><div class='del'>-			pr_err("File '%s' in directory '%s' already present!\n",</div><div class='del'>-			       name, parent-&gt;d_name.name);</div><div class='del'>-		dput(dentry);</div><div class='del'>-		dentry = ERR_PTR(-EEXIST);</div><div class='del'>-	}</div><div class='del'>-</div><div class='add'>+	dentry = simple_start_creating(parent, name);</div><div class='ctx'> 	if (IS_ERR(dentry)) {</div><div class='del'>-		inode_unlock(d_inode(parent));</div><div class='add'>+		if (dentry == ERR_PTR(-EEXIST))</div><div class='add'>+			pr_err("'%s' already exists in '%pd'\n", name, parent);</div><div class='ctx'> 		simple_release_fs(&amp;debugfs_mount, &amp;debugfs_mount_count);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='ctx'> 	return dentry;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct dentry *failed_creating(struct dentry *dentry)</div><div class='add'>+static struct dentry *debugfs_failed_creating(struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	inode_unlock(d_inode(dentry-&gt;d_parent));</div><div class='del'>-	dput(dentry);</div><div class='add'>+	simple_done_creating(dentry);</div><div class='ctx'> 	simple_release_fs(&amp;debugfs_mount, &amp;debugfs_mount_count);</div><div class='ctx'> 	return ERR_PTR(-ENOMEM);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct dentry *end_creating(struct dentry *dentry)</div><div class='add'>+static struct dentry *debugfs_end_creating(struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	inode_unlock(d_inode(dentry-&gt;d_parent));</div><div class='del'>-	return dentry;</div><div class='add'>+	simple_done_creating(dentry);</div><div class='add'>+	return dentry; // borrowed</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct dentry *__debugfs_create_file(const char *name, umode_t mode,</div><div class='ctx'> 				struct dentry *parent, void *data,</div><div class='add'>+				const void *aux,</div><div class='ctx'> 				const struct file_operations *proxy_fops,</div><div class='del'>-				const struct file_operations *real_fops)</div><div class='add'>+				const void *real_fops)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dentry;</div><div class='ctx'> 	struct inode *inode;</div><div class='hunk'>@@ -394,74 +425,54 @@ static struct dentry *__debugfs_create_file(const char *name, umode_t mode,</div><div class='ctx'> 	if (!(mode &amp; S_IFMT))</div><div class='ctx'> 		mode |= S_IFREG;</div><div class='ctx'> 	BUG_ON(!S_ISREG(mode));</div><div class='del'>-	dentry = start_creating(name, parent);</div><div class='add'>+	dentry = debugfs_start_creating(name, parent);</div><div class='ctx'> </div><div class='ctx'> 	if (IS_ERR(dentry))</div><div class='ctx'> 		return dentry;</div><div class='ctx'> </div><div class='del'>-	if (!(debugfs_allow &amp; DEBUGFS_ALLOW_API)) {</div><div class='del'>-		failed_creating(dentry);</div><div class='del'>-		return ERR_PTR(-EPERM);</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	inode = debugfs_get_inode(dentry-&gt;d_sb);</div><div class='ctx'> 	if (unlikely(!inode)) {</div><div class='ctx'> 		pr_err("out of free dentries, can not create file '%s'\n",</div><div class='ctx'> 		       name);</div><div class='del'>-		return failed_creating(dentry);</div><div class='add'>+		return debugfs_failed_creating(dentry);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_mode = mode;</div><div class='ctx'> 	inode-&gt;i_private = data;</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_op = &amp;debugfs_file_inode_operations;</div><div class='add'>+	if (!real_fops)</div><div class='add'>+		proxy_fops = &amp;debugfs_noop_file_operations;</div><div class='ctx'> 	inode-&gt;i_fop = proxy_fops;</div><div class='del'>-	dentry-&gt;d_fsdata = (void *)((unsigned long)real_fops |</div><div class='del'>-				DEBUGFS_FSDATA_IS_REAL_FOPS_BIT);</div><div class='add'>+	DEBUGFS_I(inode)-&gt;raw = real_fops;</div><div class='add'>+	DEBUGFS_I(inode)-&gt;aux = (void *)aux;</div><div class='ctx'> </div><div class='del'>-	d_instantiate(dentry, inode);</div><div class='add'>+	d_make_persistent(dentry, inode);</div><div class='ctx'> 	fsnotify_create(d_inode(dentry-&gt;d_parent), dentry);</div><div class='del'>-	return end_creating(dentry);</div><div class='add'>+	return debugfs_end_creating(dentry);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * debugfs_create_file - create a file in the debugfs filesystem</div><div class='del'>- * @name: a pointer to a string containing the name of the file to create.</div><div class='del'>- * @mode: the permission that the file should have.</div><div class='del'>- * @parent: a pointer to the parent dentry for this file.  This should be a</div><div class='del'>- *          directory dentry if set.  If this parameter is NULL, then the</div><div class='del'>- *          file will be created in the root of the debugfs filesystem.</div><div class='del'>- * @data: a pointer to something that the caller will want to get to later</div><div class='del'>- *        on.  The inode.i_private pointer will point to this value on</div><div class='del'>- *        the open() call.</div><div class='del'>- * @fops: a pointer to a struct file_operations that should be used for</div><div class='del'>- *        this file.</div><div class='del'>- *</div><div class='del'>- * This is the basic "create a file" function for debugfs.  It allows for a</div><div class='del'>- * wide range of flexibility in creating a file, or a directory (if you want</div><div class='del'>- * to create a directory, the debugfs_create_dir() function is</div><div class='del'>- * recommended to be used instead.)</div><div class='del'>- *</div><div class='del'>- * This function will return a pointer to a dentry if it succeeds.  This</div><div class='del'>- * pointer must be passed to the debugfs_remove() function when the file is</div><div class='del'>- * to be removed (no automatic cleanup happens if your module is unloaded,</div><div class='del'>- * you are responsible here.)  If an error occurs, ERR_PTR(-ERROR) will be</div><div class='del'>- * returned.</div><div class='del'>- *</div><div class='del'>- * If debugfs is not enabled in the kernel, the value -%ENODEV will be</div><div class='del'>- * returned.</div><div class='del'>- */</div><div class='del'>-struct dentry *debugfs_create_file(const char *name, umode_t mode,</div><div class='del'>-				   struct dentry *parent, void *data,</div><div class='del'>-				   const struct file_operations *fops)</div><div class='add'>+struct dentry *debugfs_create_file_full(const char *name, umode_t mode,</div><div class='add'>+					struct dentry *parent, void *data,</div><div class='add'>+					const void *aux,</div><div class='add'>+					const struct file_operations *fops)</div><div class='ctx'> {</div><div class='add'>+	return __debugfs_create_file(name, mode, parent, data, aux,</div><div class='add'>+				&amp;debugfs_full_proxy_file_operations,</div><div class='add'>+				fops);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(debugfs_create_file_full);</div><div class='ctx'> </div><div class='del'>-	return __debugfs_create_file(name, mode, parent, data,</div><div class='del'>-				fops ? &amp;debugfs_full_proxy_file_operations :</div><div class='del'>-					&amp;debugfs_noop_file_operations,</div><div class='add'>+struct dentry *debugfs_create_file_short(const char *name, umode_t mode,</div><div class='add'>+					struct dentry *parent, void *data,</div><div class='add'>+					const void *aux,</div><div class='add'>+					const struct debugfs_short_fops *fops)</div><div class='add'>+{</div><div class='add'>+	return __debugfs_create_file(name, mode, parent, data, aux,</div><div class='add'>+				&amp;debugfs_full_short_proxy_file_operations,</div><div class='ctx'> 				fops);</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL_GPL(debugfs_create_file);</div><div class='add'>+EXPORT_SYMBOL_GPL(debugfs_create_file_short);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * debugfs_create_file_unsafe - create a file in the debugfs filesystem</div><div class='hunk'>@@ -495,9 +506,8 @@ struct dentry *debugfs_create_file_unsafe(const char *name, umode_t mode,</div><div class='ctx'> 				   const struct file_operations *fops)</div><div class='ctx'> {</div><div class='ctx'> </div><div class='del'>-	return __debugfs_create_file(name, mode, parent, data,</div><div class='del'>-				fops ? &amp;debugfs_open_proxy_file_operations :</div><div class='del'>-					&amp;debugfs_noop_file_operations,</div><div class='add'>+	return __debugfs_create_file(name, mode, parent, data, NULL,</div><div class='add'>+				&amp;debugfs_open_proxy_file_operations,</div><div class='ctx'> 				fops);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(debugfs_create_file_unsafe);</div><div class='hunk'>@@ -551,25 +561,25 @@ EXPORT_SYMBOL_GPL(debugfs_create_file_size);</div><div class='ctx'>  *</div><div class='ctx'>  * If debugfs is not enabled in the kernel, the value -%ENODEV will be</div><div class='ctx'>  * returned.</div><div class='add'>+ *</div><div class='add'>+ * NOTE: it's expected that most callers should _ignore_ the errors returned</div><div class='add'>+ * by this function. Other debugfs functions handle the fact that the "dentry"</div><div class='add'>+ * passed to them could be an error and they don't crash in that case.</div><div class='add'>+ * Drivers should generally work fine even if debugfs fails to init anyway.</div><div class='ctx'>  */</div><div class='ctx'> struct dentry *debugfs_create_dir(const char *name, struct dentry *parent)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *dentry = start_creating(name, parent);</div><div class='add'>+	struct dentry *dentry = debugfs_start_creating(name, parent);</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> </div><div class='ctx'> 	if (IS_ERR(dentry))</div><div class='ctx'> 		return dentry;</div><div class='ctx'> </div><div class='del'>-	if (!(debugfs_allow &amp; DEBUGFS_ALLOW_API)) {</div><div class='del'>-		failed_creating(dentry);</div><div class='del'>-		return ERR_PTR(-EPERM);</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	inode = debugfs_get_inode(dentry-&gt;d_sb);</div><div class='ctx'> 	if (unlikely(!inode)) {</div><div class='ctx'> 		pr_err("out of free dentries, can not create directory '%s'\n",</div><div class='ctx'> 		       name);</div><div class='del'>-		return failed_creating(dentry);</div><div class='add'>+		return debugfs_failed_creating(dentry);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_mode = S_IFDIR | S_IRWXU | S_IRUGO | S_IXUGO;</div><div class='hunk'>@@ -578,10 +588,10 @@ struct dentry *debugfs_create_dir(const char *name, struct dentry *parent)</div><div class='ctx'> </div><div class='ctx'> 	/* directory inodes start off with i_nlink == 2 (for "." entry) */</div><div class='ctx'> 	inc_nlink(inode);</div><div class='del'>-	d_instantiate(dentry, inode);</div><div class='add'>+	d_make_persistent(dentry, inode);</div><div class='ctx'> 	inc_nlink(d_inode(dentry-&gt;d_parent));</div><div class='ctx'> 	fsnotify_mkdir(d_inode(dentry-&gt;d_parent), dentry);</div><div class='del'>-	return end_creating(dentry);</div><div class='add'>+	return debugfs_end_creating(dentry);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(debugfs_create_dir);</div><div class='ctx'> </div><div class='hunk'>@@ -601,34 +611,29 @@ struct dentry *debugfs_create_automount(const char *name,</div><div class='ctx'> 					debugfs_automount_t f,</div><div class='ctx'> 					void *data)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *dentry = start_creating(name, parent);</div><div class='add'>+	struct dentry *dentry = debugfs_start_creating(name, parent);</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> </div><div class='ctx'> 	if (IS_ERR(dentry))</div><div class='ctx'> 		return dentry;</div><div class='ctx'> </div><div class='del'>-	if (!(debugfs_allow &amp; DEBUGFS_ALLOW_API)) {</div><div class='del'>-		failed_creating(dentry);</div><div class='del'>-		return ERR_PTR(-EPERM);</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	inode = debugfs_get_inode(dentry-&gt;d_sb);</div><div class='ctx'> 	if (unlikely(!inode)) {</div><div class='ctx'> 		pr_err("out of free dentries, can not create automount '%s'\n",</div><div class='ctx'> 		       name);</div><div class='del'>-		return failed_creating(dentry);</div><div class='add'>+		return debugfs_failed_creating(dentry);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	make_empty_dir_inode(inode);</div><div class='ctx'> 	inode-&gt;i_flags |= S_AUTOMOUNT;</div><div class='ctx'> 	inode-&gt;i_private = data;</div><div class='del'>-	dentry-&gt;d_fsdata = (void *)f;</div><div class='add'>+	DEBUGFS_I(inode)-&gt;automount = f;</div><div class='ctx'> 	/* directory inodes start off with i_nlink == 2 (for "." entry) */</div><div class='ctx'> 	inc_nlink(inode);</div><div class='del'>-	d_instantiate(dentry, inode);</div><div class='add'>+	d_make_persistent(dentry, inode);</div><div class='ctx'> 	inc_nlink(d_inode(dentry-&gt;d_parent));</div><div class='ctx'> 	fsnotify_mkdir(d_inode(dentry-&gt;d_parent), dentry);</div><div class='del'>-	return end_creating(dentry);</div><div class='add'>+	return debugfs_end_creating(dentry);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(debugfs_create_automount);</div><div class='ctx'> </div><div class='hunk'>@@ -664,7 +669,7 @@ struct dentry *debugfs_create_symlink(const char *name, struct dentry *parent,</div><div class='ctx'> 	if (!link)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='del'>-	dentry = start_creating(name, parent);</div><div class='add'>+	dentry = debugfs_start_creating(name, parent);</div><div class='ctx'> 	if (IS_ERR(dentry)) {</div><div class='ctx'> 		kfree(link);</div><div class='ctx'> 		return dentry;</div><div class='hunk'>@@ -675,13 +680,13 @@ struct dentry *debugfs_create_symlink(const char *name, struct dentry *parent,</div><div class='ctx'> 		pr_err("out of free dentries, can not create symlink '%s'\n",</div><div class='ctx'> 		       name);</div><div class='ctx'> 		kfree(link);</div><div class='del'>-		return failed_creating(dentry);</div><div class='add'>+		return debugfs_failed_creating(dentry);</div><div class='ctx'> 	}</div><div class='ctx'> 	inode-&gt;i_mode = S_IFLNK | S_IRWXUGO;</div><div class='ctx'> 	inode-&gt;i_op = &amp;debugfs_symlink_inode_operations;</div><div class='ctx'> 	inode-&gt;i_link = link;</div><div class='del'>-	d_instantiate(dentry, inode);</div><div class='del'>-	return end_creating(dentry);</div><div class='add'>+	d_make_persistent(dentry, inode);</div><div class='add'>+	return debugfs_end_creating(dentry);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(debugfs_create_symlink);</div><div class='ctx'> </div><div class='hunk'>@@ -697,10 +702,54 @@ static void __debugfs_file_removed(struct dentry *dentry)</div><div class='ctx'> 	 */</div><div class='ctx'> 	smp_mb();</div><div class='ctx'> 	fsd = READ_ONCE(dentry-&gt;d_fsdata);</div><div class='del'>-	if ((unsigned long)fsd &amp; DEBUGFS_FSDATA_IS_REAL_FOPS_BIT)</div><div class='add'>+	if (!fsd)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/* if this was the last reference, we're done */</div><div class='add'>+	if (refcount_dec_and_test(&amp;fsd-&gt;active_users))</div><div class='ctx'> 		return;</div><div class='del'>-	if (!refcount_dec_and_test(&amp;fsd-&gt;active_users))</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If there's still a reference, the code that obtained it can</div><div class='add'>+	 * be in different states:</div><div class='add'>+	 *  - The common case of not using cancellations, or already</div><div class='add'>+	 *    after debugfs_leave_cancellation(), where we just need</div><div class='add'>+	 *    to wait for debugfs_file_put() which signals the completion;</div><div class='add'>+	 *  - inside a cancellation section, i.e. between</div><div class='add'>+	 *    debugfs_enter_cancellation() and debugfs_leave_cancellation(),</div><div class='add'>+	 *    in which case we need to trigger the -&gt;cancel() function,</div><div class='add'>+	 *    and then wait for debugfs_file_put() just like in the</div><div class='add'>+	 *    previous case;</div><div class='add'>+	 *  - before debugfs_enter_cancellation() (but obviously after</div><div class='add'>+	 *    debugfs_file_get()), in which case we may not see the</div><div class='add'>+	 *    cancellation in the list on the first round of the loop,</div><div class='add'>+	 *    but debugfs_enter_cancellation() signals the completion</div><div class='add'>+	 *    after adding it, so this code gets woken up to call the</div><div class='add'>+	 *    -&gt;cancel() function.</div><div class='add'>+	 */</div><div class='add'>+	while (refcount_read(&amp;fsd-&gt;active_users)) {</div><div class='add'>+		struct debugfs_cancellation *c;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Lock the cancellations. Note that the cancellations</div><div class='add'>+		 * structs are meant to be on the stack, so we need to</div><div class='add'>+		 * ensure we either use them here or don't touch them,</div><div class='add'>+		 * and debugfs_leave_cancellation() will wait for this</div><div class='add'>+		 * to be finished processing before exiting one. It may</div><div class='add'>+		 * of course win and remove the cancellation, but then</div><div class='add'>+		 * chances are we never even got into this bit, we only</div><div class='add'>+		 * do if the refcount isn't zero already.</div><div class='add'>+		 */</div><div class='add'>+		mutex_lock(&amp;fsd-&gt;cancellations_mtx);</div><div class='add'>+		while ((c = list_first_entry_or_null(&amp;fsd-&gt;cancellations,</div><div class='add'>+						     typeof(*c), list))) {</div><div class='add'>+			list_del_init(&amp;c-&gt;list);</div><div class='add'>+			c-&gt;cancel(dentry, c-&gt;cancel_data);</div><div class='add'>+		}</div><div class='add'>+		mutex_unlock(&amp;fsd-&gt;cancellations_mtx);</div><div class='add'>+</div><div class='ctx'> 		wait_for_completion(&amp;fsd-&gt;active_users_drained);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void remove_one(struct dentry *victim)</div><div class='hunk'>@@ -735,76 +784,88 @@ void debugfs_remove(struct dentry *dentry)</div><div class='ctx'> EXPORT_SYMBOL_GPL(debugfs_remove);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * debugfs_rename - rename a file/directory in the debugfs filesystem</div><div class='del'>- * @old_dir: a pointer to the parent dentry for the renamed object. This</div><div class='del'>- *          should be a directory dentry.</div><div class='del'>- * @old_dentry: dentry of an object to be renamed.</div><div class='del'>- * @new_dir: a pointer to the parent dentry where the object should be</div><div class='del'>- *          moved. This should be a directory dentry.</div><div class='del'>- * @new_name: a pointer to a string containing the target name.</div><div class='add'>+ * debugfs_lookup_and_remove - lookup a directory or file and recursively remove it</div><div class='add'>+ * @name: a pointer to a string containing the name of the item to look up.</div><div class='add'>+ * @parent: a pointer to the parent dentry of the item.</div><div class='add'>+ *</div><div class='add'>+ * This is the equlivant of doing something like</div><div class='add'>+ * debugfs_remove(debugfs_lookup(..)) but with the proper reference counting</div><div class='add'>+ * handled for the directory being looked up.</div><div class='add'>+ */</div><div class='add'>+void debugfs_lookup_and_remove(const char *name, struct dentry *parent)</div><div class='add'>+{</div><div class='add'>+	struct dentry *dentry;</div><div class='add'>+</div><div class='add'>+	dentry = debugfs_lookup(name, parent);</div><div class='add'>+	if (!dentry)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	debugfs_remove(dentry);</div><div class='add'>+	dput(dentry);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(debugfs_lookup_and_remove);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * debugfs_change_name - rename a file/directory in the debugfs filesystem</div><div class='add'>+ * @dentry: dentry of an object to be renamed.</div><div class='add'>+ * @fmt: format for new name</div><div class='ctx'>  *</div><div class='ctx'>  * This function renames a file/directory in debugfs.  The target must not</div><div class='ctx'>  * exist for rename to succeed.</div><div class='ctx'>  *</div><div class='del'>- * This function will return a pointer to old_dentry (which is updated to</div><div class='del'>- * reflect renaming) if it succeeds. If an error occurs, %NULL will be</div><div class='del'>- * returned.</div><div class='add'>+ * This function will return 0 on success and -E... on failure.</div><div class='ctx'>  *</div><div class='ctx'>  * If debugfs is not enabled in the kernel, the value -%ENODEV will be</div><div class='ctx'>  * returned.</div><div class='ctx'>  */</div><div class='del'>-struct dentry *debugfs_rename(struct dentry *old_dir, struct dentry *old_dentry,</div><div class='del'>-		struct dentry *new_dir, const char *new_name)</div><div class='add'>+int __printf(2, 3) debugfs_change_name(struct dentry *dentry, const char *fmt, ...)</div><div class='ctx'> {</div><div class='del'>-	int error;</div><div class='del'>-	struct dentry *dentry = NULL, *trap;</div><div class='add'>+	int error = 0;</div><div class='add'>+	const char *new_name;</div><div class='ctx'> 	struct name_snapshot old_name;</div><div class='add'>+	struct dentry *target;</div><div class='add'>+	struct renamedata rd = {};</div><div class='add'>+	struct inode *dir;</div><div class='add'>+	va_list ap;</div><div class='ctx'> </div><div class='del'>-	if (IS_ERR(old_dir))</div><div class='del'>-		return old_dir;</div><div class='del'>-	if (IS_ERR(new_dir))</div><div class='del'>-		return new_dir;</div><div class='del'>-	if (IS_ERR_OR_NULL(old_dentry))</div><div class='del'>-		return old_dentry;</div><div class='del'>-</div><div class='del'>-	trap = lock_rename(new_dir, old_dir);</div><div class='del'>-	/* Source or destination directories don't exist? */</div><div class='del'>-	if (d_really_is_negative(old_dir) || d_really_is_negative(new_dir))</div><div class='del'>-		goto exit;</div><div class='del'>-	/* Source does not exist, cyclic rename, or mountpoint? */</div><div class='del'>-	if (d_really_is_negative(old_dentry) || old_dentry == trap ||</div><div class='del'>-	    d_mountpoint(old_dentry))</div><div class='del'>-		goto exit;</div><div class='del'>-	dentry = lookup_one_len(new_name, new_dir, strlen(new_name));</div><div class='del'>-	/* Lookup failed, cyclic rename or target exists? */</div><div class='del'>-	if (IS_ERR(dentry) || dentry == trap || d_really_is_positive(dentry))</div><div class='del'>-		goto exit;</div><div class='del'>-</div><div class='del'>-	take_dentry_name_snapshot(&amp;old_name, old_dentry);</div><div class='del'>-</div><div class='del'>-	error = simple_rename(&amp;init_user_ns, d_inode(old_dir), old_dentry,</div><div class='del'>-			      d_inode(new_dir), dentry, 0);</div><div class='add'>+	if (IS_ERR_OR_NULL(dentry))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	va_start(ap, fmt);</div><div class='add'>+	new_name = kvasprintf_const(GFP_KERNEL, fmt, ap);</div><div class='add'>+	va_end(ap);</div><div class='add'>+	if (!new_name)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	rd.old_parent = dget_parent(dentry);</div><div class='add'>+	rd.new_parent = rd.old_parent;</div><div class='add'>+	rd.flags = RENAME_NOREPLACE;</div><div class='add'>+	target = lookup_noperm_unlocked(&amp;QSTR(new_name), rd.new_parent);</div><div class='add'>+	if (IS_ERR(target))</div><div class='add'>+		return PTR_ERR(target);</div><div class='add'>+</div><div class='add'>+	error = start_renaming_two_dentries(&amp;rd, dentry, target);</div><div class='ctx'> 	if (error) {</div><div class='del'>-		release_dentry_name_snapshot(&amp;old_name);</div><div class='del'>-		goto exit;</div><div class='add'>+		if (error == -EEXIST &amp;&amp; target == dentry)</div><div class='add'>+			/* it isn't an error to rename a thing to itself */</div><div class='add'>+			error = 0;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	d_move(old_dentry, dentry);</div><div class='del'>-	fsnotify_move(d_inode(old_dir), d_inode(new_dir), &amp;old_name.name,</div><div class='del'>-		d_is_dir(old_dentry),</div><div class='del'>-		NULL, old_dentry);</div><div class='add'>+</div><div class='add'>+	dir = d_inode(rd.old_parent);</div><div class='add'>+	take_dentry_name_snapshot(&amp;old_name, dentry);</div><div class='add'>+	simple_rename_timestamp(dir, dentry, dir, rd.new_dentry);</div><div class='add'>+	d_move(dentry, rd.new_dentry);</div><div class='add'>+	fsnotify_move(dir, dir, &amp;old_name.name, d_is_dir(dentry), NULL, dentry);</div><div class='ctx'> 	release_dentry_name_snapshot(&amp;old_name);</div><div class='del'>-	unlock_rename(new_dir, old_dir);</div><div class='del'>-	dput(dentry);</div><div class='del'>-	return old_dentry;</div><div class='del'>-exit:</div><div class='del'>-	if (dentry &amp;&amp; !IS_ERR(dentry))</div><div class='del'>-		dput(dentry);</div><div class='del'>-	unlock_rename(new_dir, old_dir);</div><div class='del'>-	if (IS_ERR(dentry))</div><div class='del'>-		return dentry;</div><div class='del'>-	return ERR_PTR(-EINVAL);</div><div class='add'>+	end_renaming(&amp;rd);</div><div class='add'>+out:</div><div class='add'>+	dput(rd.old_parent);</div><div class='add'>+	dput(target);</div><div class='add'>+	kfree_const(new_name);</div><div class='add'>+	return error;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL_GPL(debugfs_rename);</div><div class='add'>+EXPORT_SYMBOL_GPL(debugfs_change_name);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * debugfs_initialized - Tells whether debugfs has been registered</div><div class='hunk'>@@ -819,33 +880,47 @@ static int __init debugfs_kernel(char *str)</div><div class='ctx'> {</div><div class='ctx'> 	if (str) {</div><div class='ctx'> 		if (!strcmp(str, "on"))</div><div class='del'>-			debugfs_allow = DEBUGFS_ALLOW_API | DEBUGFS_ALLOW_MOUNT;</div><div class='del'>-		else if (!strcmp(str, "no-mount"))</div><div class='del'>-			debugfs_allow = DEBUGFS_ALLOW_API;</div><div class='add'>+			debugfs_enabled = true;</div><div class='ctx'> 		else if (!strcmp(str, "off"))</div><div class='del'>-			debugfs_allow = 0;</div><div class='add'>+			debugfs_enabled = false;</div><div class='add'>+		else if (!strcmp(str, "no-mount")) {</div><div class='add'>+			pr_notice("debugfs=no-mount is a deprecated alias "</div><div class='add'>+				  "for debugfs=off\n");</div><div class='add'>+			debugfs_enabled = false;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> early_param("debugfs", debugfs_kernel);</div><div class='add'>+</div><div class='ctx'> static int __init debugfs_init(void)</div><div class='ctx'> {</div><div class='ctx'> 	int retval;</div><div class='ctx'> </div><div class='del'>-	if (!(debugfs_allow &amp; DEBUGFS_ALLOW_MOUNT))</div><div class='add'>+	if (!debugfs_enabled)</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='ctx'> 	retval = sysfs_create_mount_point(kernel_kobj, "debug");</div><div class='ctx'> 	if (retval)</div><div class='ctx'> 		return retval;</div><div class='ctx'> </div><div class='del'>-	retval = register_filesystem(&amp;debug_fs_type);</div><div class='del'>-	if (retval)</div><div class='add'>+	debugfs_inode_cachep = kmem_cache_create("debugfs_inode_cache",</div><div class='add'>+				sizeof(struct debugfs_inode_info), 0,</div><div class='add'>+				SLAB_RECLAIM_ACCOUNT | SLAB_ACCOUNT,</div><div class='add'>+				init_once);</div><div class='add'>+	if (debugfs_inode_cachep == NULL) {</div><div class='ctx'> 		sysfs_remove_mount_point(kernel_kobj, "debug");</div><div class='del'>-	else</div><div class='del'>-		debugfs_registered = true;</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	return retval;</div><div class='add'>+	retval = register_filesystem(&amp;debug_fs_type);</div><div class='add'>+	if (retval) { // Really not going to happen</div><div class='add'>+		sysfs_remove_mount_point(kernel_kobj, "debug");</div><div class='add'>+		kmem_cache_destroy(debugfs_inode_cachep);</div><div class='add'>+		return retval;</div><div class='add'>+	}</div><div class='add'>+	debugfs_registered = true;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> core_initcall(debugfs_init);</div><div class='head'>diff --git a/fs/debugfs/internal.h b/fs/debugfs/internal.h<br/>index 92af8ae31313..c95699b27a56 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/debugfs/internal.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/debugfs/internal.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/debugfs/internal.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/debugfs/internal.h</a></div><div class='hunk'>@@ -7,40 +7,52 @@</div><div class='ctx'> </div><div class='ctx'> #ifndef _DEBUGFS_INTERNAL_H_</div><div class='ctx'> #define _DEBUGFS_INTERNAL_H_</div><div class='add'>+#include &lt;linux/list.h&gt;</div><div class='ctx'> </div><div class='ctx'> struct file_operations;</div><div class='ctx'> </div><div class='add'>+struct debugfs_inode_info {</div><div class='add'>+	struct inode vfs_inode;</div><div class='add'>+	union {</div><div class='add'>+		const void *raw;</div><div class='add'>+		const struct file_operations *real_fops;</div><div class='add'>+		const struct debugfs_short_fops *short_fops;</div><div class='add'>+		debugfs_automount_t automount;</div><div class='add'>+	};</div><div class='add'>+	void *aux;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static inline struct debugfs_inode_info *DEBUGFS_I(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	return container_of(inode, struct debugfs_inode_info, vfs_inode);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /* declared over in file.c */</div><div class='ctx'> extern const struct file_operations debugfs_noop_file_operations;</div><div class='ctx'> extern const struct file_operations debugfs_open_proxy_file_operations;</div><div class='ctx'> extern const struct file_operations debugfs_full_proxy_file_operations;</div><div class='add'>+extern const struct file_operations debugfs_full_short_proxy_file_operations;</div><div class='ctx'> </div><div class='ctx'> struct debugfs_fsdata {</div><div class='ctx'> 	const struct file_operations *real_fops;</div><div class='del'>-	refcount_t active_users;</div><div class='del'>-	struct completion active_users_drained;</div><div class='add'>+	const struct debugfs_short_fops *short_fops;</div><div class='add'>+	struct {</div><div class='add'>+		refcount_t active_users;</div><div class='add'>+		struct completion active_users_drained;</div><div class='add'>+</div><div class='add'>+		/* protect cancellations */</div><div class='add'>+		struct mutex cancellations_mtx;</div><div class='add'>+		struct list_head cancellations;</div><div class='add'>+		unsigned int methods;</div><div class='add'>+	};</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * A dentry's -&gt;d_fsdata either points to the real fops or to a</div><div class='del'>- * dynamically allocated debugfs_fsdata instance.</div><div class='del'>- * In order to distinguish between these two cases, a real fops</div><div class='del'>- * pointer gets its lowest bit set.</div><div class='del'>- */</div><div class='del'>-#define DEBUGFS_FSDATA_IS_REAL_FOPS_BIT BIT(0)</div><div class='del'>-</div><div class='del'>-/* Access BITS */</div><div class='del'>-#define DEBUGFS_ALLOW_API	BIT(0)</div><div class='del'>-#define DEBUGFS_ALLOW_MOUNT	BIT(1)</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_DEBUG_FS_ALLOW_ALL</div><div class='del'>-#define DEFAULT_DEBUGFS_ALLOW_BITS (DEBUGFS_ALLOW_MOUNT | DEBUGFS_ALLOW_API)</div><div class='del'>-#endif</div><div class='del'>-#ifdef CONFIG_DEBUG_FS_DISALLOW_MOUNT</div><div class='del'>-#define DEFAULT_DEBUGFS_ALLOW_BITS (DEBUGFS_ALLOW_API)</div><div class='del'>-#endif</div><div class='del'>-#ifdef CONFIG_DEBUG_FS_ALLOW_NONE</div><div class='del'>-#define DEFAULT_DEBUGFS_ALLOW_BITS (0)</div><div class='del'>-#endif</div><div class='add'>+enum {</div><div class='add'>+	HAS_READ = 1,</div><div class='add'>+	HAS_WRITE = 2,</div><div class='add'>+	HAS_LSEEK = 4,</div><div class='add'>+	HAS_POLL = 8,</div><div class='add'>+	HAS_IOCTL = 16</div><div class='add'>+};</div><div class='ctx'> </div><div class='ctx'> #endif /* _DEBUGFS_INTERNAL_H_ */</div><div class='head'>diff --git a/fs/devpts/inode.c b/fs/devpts/inode.c<br/>index 42e5a766d33c..9f3de528c358 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/devpts/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/devpts/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/devpts/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/devpts/inode.c</a></div><div class='hunk'>@@ -12,6 +12,8 @@</div><div class='ctx'> #include &lt;linux/module.h&gt;</div><div class='ctx'> #include &lt;linux/init.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/fs_context.h&gt;</div><div class='add'>+#include &lt;linux/fs_parser.h&gt;</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='ctx'> #include &lt;linux/namei.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='hunk'>@@ -21,7 +23,6 @@</div><div class='ctx'> #include &lt;linux/magic.h&gt;</div><div class='ctx'> #include &lt;linux/idr.h&gt;</div><div class='ctx'> #include &lt;linux/devpts_fs.h&gt;</div><div class='del'>-#include &lt;linux/parser.h&gt;</div><div class='ctx'> #include &lt;linux/fsnotify.h&gt;</div><div class='ctx'> #include &lt;linux/seq_file.h&gt;</div><div class='ctx'> </div><div class='hunk'>@@ -45,7 +46,7 @@ static int pty_limit_min;</div><div class='ctx'> static int pty_limit_max = INT_MAX;</div><div class='ctx'> static atomic_t pty_count = ATOMIC_INIT(0);</div><div class='ctx'> </div><div class='del'>-static struct ctl_table pty_table[] = {</div><div class='add'>+static const struct ctl_table pty_table[] = {</div><div class='ctx'> 	{</div><div class='ctx'> 		.procname	= "max",</div><div class='ctx'> 		.maxlen		= sizeof(int),</div><div class='hunk'>@@ -69,25 +70,6 @@ static struct ctl_table pty_table[] = {</div><div class='ctx'> 		.data		= &amp;pty_count,</div><div class='ctx'> 		.proc_handler	= proc_dointvec,</div><div class='ctx'> 	},</div><div class='del'>-	{}</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static struct ctl_table pty_kern_table[] = {</div><div class='del'>-	{</div><div class='del'>-		.procname	= "pty",</div><div class='del'>-		.mode		= 0555,</div><div class='del'>-		.child		= pty_table,</div><div class='del'>-	},</div><div class='del'>-	{}</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static struct ctl_table pty_root_table[] = {</div><div class='del'>-	{</div><div class='del'>-		.procname	= "kernel",</div><div class='del'>-		.mode		= 0555,</div><div class='del'>-		.child		= pty_kern_table,</div><div class='del'>-	},</div><div class='del'>-	{}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct pts_mount_opts {</div><div class='hunk'>@@ -106,21 +88,21 @@ enum {</div><div class='ctx'> 	Opt_err</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static const match_table_t tokens = {</div><div class='del'>-	{Opt_uid, "uid=%u"},</div><div class='del'>-	{Opt_gid, "gid=%u"},</div><div class='del'>-	{Opt_mode, "mode=%o"},</div><div class='del'>-	{Opt_ptmxmode, "ptmxmode=%o"},</div><div class='del'>-	{Opt_newinstance, "newinstance"},</div><div class='del'>-	{Opt_max, "max=%d"},</div><div class='del'>-	{Opt_err, NULL}</div><div class='add'>+static const struct fs_parameter_spec devpts_param_specs[] = {</div><div class='add'>+	fsparam_gid	("gid",		Opt_gid),</div><div class='add'>+	fsparam_s32	("max",		Opt_max),</div><div class='add'>+	fsparam_u32oct	("mode",	Opt_mode),</div><div class='add'>+	fsparam_flag	("newinstance",	Opt_newinstance),</div><div class='add'>+	fsparam_u32oct	("ptmxmode",	Opt_ptmxmode),</div><div class='add'>+	fsparam_uid	("uid",		Opt_uid),</div><div class='add'>+	{}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct pts_fs_info {</div><div class='ctx'> 	struct ida allocated_ptys;</div><div class='ctx'> 	struct pts_mount_opts mount_opts;</div><div class='ctx'> 	struct super_block *sb;</div><div class='del'>-	struct dentry *ptmx_dentry;</div><div class='add'>+	struct inode *ptmx_inode; // borrowed</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static inline struct pts_fs_info *DEVPTS_SB(struct super_block *sb)</div><div class='hunk'>@@ -233,96 +215,50 @@ void devpts_release(struct pts_fs_info *fsi)</div><div class='ctx'> 	deactivate_super(fsi-&gt;sb);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#define PARSE_MOUNT	0</div><div class='del'>-#define PARSE_REMOUNT	1</div><div class='del'>-</div><div class='ctx'> /*</div><div class='del'>- * parse_mount_options():</div><div class='del'>- *	Set @opts to mount options specified in @data. If an option is not</div><div class='del'>- *	specified in @data, set it to its default value.</div><div class='del'>- *</div><div class='del'>- * Note: @data may be NULL (in which case all options are set to default).</div><div class='add'>+ * devpts_parse_param - Parse mount parameters</div><div class='ctx'>  */</div><div class='del'>-static int parse_mount_options(char *data, int op, struct pts_mount_opts *opts)</div><div class='add'>+static int devpts_parse_param(struct fs_context *fc, struct fs_parameter *param)</div><div class='ctx'> {</div><div class='del'>-	char *p;</div><div class='del'>-	kuid_t uid;</div><div class='del'>-	kgid_t gid;</div><div class='del'>-</div><div class='del'>-	opts-&gt;setuid  = 0;</div><div class='del'>-	opts-&gt;setgid  = 0;</div><div class='del'>-	opts-&gt;uid     = GLOBAL_ROOT_UID;</div><div class='del'>-	opts-&gt;gid     = GLOBAL_ROOT_GID;</div><div class='del'>-	opts-&gt;mode    = DEVPTS_DEFAULT_MODE;</div><div class='del'>-	opts-&gt;ptmxmode = DEVPTS_DEFAULT_PTMX_MODE;</div><div class='del'>-	opts-&gt;max     = NR_UNIX98_PTY_MAX;</div><div class='del'>-</div><div class='del'>-	/* Only allow instances mounted from the initial mount</div><div class='del'>-	 * namespace to tap the reserve pool of ptys.</div><div class='del'>-	 */</div><div class='del'>-	if (op == PARSE_MOUNT)</div><div class='del'>-		opts-&gt;reserve =</div><div class='del'>-			(current-&gt;nsproxy-&gt;mnt_ns == init_task.nsproxy-&gt;mnt_ns);</div><div class='del'>-</div><div class='del'>-	while ((p = strsep(&amp;data, ",")) != NULL) {</div><div class='del'>-		substring_t args[MAX_OPT_ARGS];</div><div class='del'>-		int token;</div><div class='del'>-		int option;</div><div class='del'>-</div><div class='del'>-		if (!*p)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		token = match_token(p, tokens, args);</div><div class='del'>-		switch (token) {</div><div class='del'>-		case Opt_uid:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;option))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			uid = make_kuid(current_user_ns(), option);</div><div class='del'>-			if (!uid_valid(uid))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			opts-&gt;uid = uid;</div><div class='del'>-			opts-&gt;setuid = 1;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_gid:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;option))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			gid = make_kgid(current_user_ns(), option);</div><div class='del'>-			if (!gid_valid(gid))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			opts-&gt;gid = gid;</div><div class='del'>-			opts-&gt;setgid = 1;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_mode:</div><div class='del'>-			if (match_octal(&amp;args[0], &amp;option))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			opts-&gt;mode = option &amp; S_IALLUGO;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_ptmxmode:</div><div class='del'>-			if (match_octal(&amp;args[0], &amp;option))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			opts-&gt;ptmxmode = option &amp; S_IALLUGO;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_newinstance:</div><div class='del'>-			break;</div><div class='del'>-		case Opt_max:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;option) ||</div><div class='del'>-			    option &lt; 0 || option &gt; NR_UNIX98_PTY_MAX)</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			opts-&gt;max = option;</div><div class='del'>-			break;</div><div class='del'>-		default:</div><div class='del'>-			pr_err("called with bogus options\n");</div><div class='del'>-			return -EINVAL;</div><div class='del'>-		}</div><div class='add'>+	struct pts_fs_info *fsi = fc-&gt;s_fs_info;</div><div class='add'>+	struct pts_mount_opts *opts = &amp;fsi-&gt;mount_opts;</div><div class='add'>+	struct fs_parse_result result;</div><div class='add'>+	int opt;</div><div class='add'>+</div><div class='add'>+	opt = fs_parse(fc, devpts_param_specs, param, &amp;result);</div><div class='add'>+	if (opt &lt; 0)</div><div class='add'>+		return opt;</div><div class='add'>+</div><div class='add'>+	switch (opt) {</div><div class='add'>+	case Opt_uid:</div><div class='add'>+		opts-&gt;uid = result.uid;</div><div class='add'>+		opts-&gt;setuid = 1;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_gid:</div><div class='add'>+		opts-&gt;gid = result.gid;</div><div class='add'>+		opts-&gt;setgid = 1;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_mode:</div><div class='add'>+		opts-&gt;mode = result.uint_32 &amp; S_IALLUGO;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_ptmxmode:</div><div class='add'>+		opts-&gt;ptmxmode = result.uint_32 &amp; S_IALLUGO;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_newinstance:</div><div class='add'>+		break;</div><div class='add'>+	case Opt_max:</div><div class='add'>+		if (result.uint_32 &gt; NR_UNIX98_PTY_MAX)</div><div class='add'>+			return invalf(fc, "max out of range");</div><div class='add'>+		opts-&gt;max = result.uint_32;</div><div class='add'>+		break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int mknod_ptmx(struct super_block *sb)</div><div class='add'>+static int mknod_ptmx(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> {</div><div class='ctx'> 	int mode;</div><div class='del'>-	int rc = -ENOMEM;</div><div class='ctx'> 	struct dentry *dentry;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct dentry *root = sb-&gt;s_root;</div><div class='hunk'>@@ -331,18 +267,10 @@ static int mknod_ptmx(struct super_block *sb)</div><div class='ctx'> 	kuid_t ptmx_uid = current_fsuid();</div><div class='ctx'> 	kgid_t ptmx_gid = current_fsgid();</div><div class='ctx'> </div><div class='del'>-	inode_lock(d_inode(root));</div><div class='del'>-</div><div class='del'>-	/* If we have already created ptmx node, return */</div><div class='del'>-	if (fsi-&gt;ptmx_dentry) {</div><div class='del'>-		rc = 0;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	dentry = d_alloc_name(root, "ptmx");</div><div class='del'>-	if (!dentry) {</div><div class='add'>+	dentry = simple_start_creating(root, "ptmx");</div><div class='add'>+	if (IS_ERR(dentry)) {</div><div class='ctx'> 		pr_err("Unable to alloc dentry for ptmx node\n");</div><div class='del'>-		goto out;</div><div class='add'>+		return PTR_ERR(dentry);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -350,44 +278,49 @@ static int mknod_ptmx(struct super_block *sb)</div><div class='ctx'> 	 */</div><div class='ctx'> 	inode = new_inode(sb);</div><div class='ctx'> 	if (!inode) {</div><div class='add'>+		simple_done_creating(dentry);</div><div class='ctx'> 		pr_err("Unable to alloc inode for ptmx node\n");</div><div class='del'>-		dput(dentry);</div><div class='del'>-		goto out;</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_ino = 2;</div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_atime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	simple_inode_init_ts(inode);</div><div class='ctx'> </div><div class='ctx'> 	mode = S_IFCHR|opts-&gt;ptmxmode;</div><div class='ctx'> 	init_special_inode(inode, mode, MKDEV(TTYAUX_MAJOR, 2));</div><div class='ctx'> 	inode-&gt;i_uid = ptmx_uid;</div><div class='ctx'> 	inode-&gt;i_gid = ptmx_gid;</div><div class='add'>+	fsi-&gt;ptmx_inode = inode;</div><div class='ctx'> </div><div class='del'>-	d_add(dentry, inode);</div><div class='add'>+	d_make_persistent(dentry, inode);</div><div class='ctx'> </div><div class='del'>-	fsi-&gt;ptmx_dentry = dentry;</div><div class='del'>-	rc = 0;</div><div class='del'>-out:</div><div class='del'>-	inode_unlock(d_inode(root));</div><div class='del'>-	return rc;</div><div class='add'>+	simple_done_creating(dentry);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void update_ptmx_mode(struct pts_fs_info *fsi)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	if (fsi-&gt;ptmx_dentry) {</div><div class='del'>-		inode = d_inode(fsi-&gt;ptmx_dentry);</div><div class='del'>-		inode-&gt;i_mode = S_IFCHR|fsi-&gt;mount_opts.ptmxmode;</div><div class='del'>-	}</div><div class='add'>+	fsi-&gt;ptmx_inode-&gt;i_mode = S_IFCHR|fsi-&gt;mount_opts.ptmxmode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int devpts_remount(struct super_block *sb, int *flags, char *data)</div><div class='add'>+static int devpts_reconfigure(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	int err;</div><div class='del'>-	struct pts_fs_info *fsi = DEVPTS_SB(sb);</div><div class='del'>-	struct pts_mount_opts *opts = &amp;fsi-&gt;mount_opts;</div><div class='add'>+	struct pts_fs_info *fsi = DEVPTS_SB(fc-&gt;root-&gt;d_sb);</div><div class='add'>+	struct pts_fs_info *new = fc-&gt;s_fs_info;</div><div class='ctx'> </div><div class='del'>-	err = parse_mount_options(data, PARSE_REMOUNT, opts);</div><div class='add'>+	/* Apply the revised options.  We don't want to change -&gt;reserve.</div><div class='add'>+	 * Ideally, we'd update each option conditionally on it having been</div><div class='add'>+	 * explicitly changed, but the default is to reset everything so that</div><div class='add'>+	 * would break UAPI...</div><div class='add'>+	 */</div><div class='add'>+	fsi-&gt;mount_opts.setuid		= new-&gt;mount_opts.setuid;</div><div class='add'>+	fsi-&gt;mount_opts.setgid		= new-&gt;mount_opts.setgid;</div><div class='add'>+	fsi-&gt;mount_opts.uid		= new-&gt;mount_opts.uid;</div><div class='add'>+	fsi-&gt;mount_opts.gid		= new-&gt;mount_opts.gid;</div><div class='add'>+	fsi-&gt;mount_opts.mode		= new-&gt;mount_opts.mode;</div><div class='add'>+	fsi-&gt;mount_opts.ptmxmode	= new-&gt;mount_opts.ptmxmode;</div><div class='add'>+	fsi-&gt;mount_opts.max		= new-&gt;mount_opts.max;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * parse_mount_options() restores options to default values</div><div class='hunk'>@@ -397,7 +330,7 @@ static int devpts_remount(struct super_block *sb, int *flags, char *data)</div><div class='ctx'> 	 */</div><div class='ctx'> 	update_ptmx_mode(fsi);</div><div class='ctx'> </div><div class='del'>-	return err;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int devpts_show_options(struct seq_file *seq, struct dentry *root)</div><div class='hunk'>@@ -421,55 +354,28 @@ static int devpts_show_options(struct seq_file *seq, struct dentry *root)</div><div class='ctx'> </div><div class='ctx'> static const struct super_operations devpts_sops = {</div><div class='ctx'> 	.statfs		= simple_statfs,</div><div class='del'>-	.remount_fs	= devpts_remount,</div><div class='ctx'> 	.show_options	= devpts_show_options,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static void *new_pts_fs_info(struct super_block *sb)</div><div class='del'>-{</div><div class='del'>-	struct pts_fs_info *fsi;</div><div class='del'>-</div><div class='del'>-	fsi = kzalloc(sizeof(struct pts_fs_info), GFP_KERNEL);</div><div class='del'>-	if (!fsi)</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	ida_init(&amp;fsi-&gt;allocated_ptys);</div><div class='del'>-	fsi-&gt;mount_opts.mode = DEVPTS_DEFAULT_MODE;</div><div class='del'>-	fsi-&gt;mount_opts.ptmxmode = DEVPTS_DEFAULT_PTMX_MODE;</div><div class='del'>-	fsi-&gt;sb = sb;</div><div class='del'>-</div><div class='del'>-	return fsi;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-devpts_fill_super(struct super_block *s, void *data, int silent)</div><div class='add'>+static int devpts_fill_super(struct super_block *s, struct fs_context *fc)</div><div class='ctx'> {</div><div class='add'>+	struct pts_fs_info *fsi = DEVPTS_SB(s);</div><div class='ctx'> 	struct inode *inode;</div><div class='del'>-	int error;</div><div class='ctx'> </div><div class='ctx'> 	s-&gt;s_iflags &amp;= ~SB_I_NODEV;</div><div class='ctx'> 	s-&gt;s_blocksize = 1024;</div><div class='ctx'> 	s-&gt;s_blocksize_bits = 10;</div><div class='ctx'> 	s-&gt;s_magic = DEVPTS_SUPER_MAGIC;</div><div class='ctx'> 	s-&gt;s_op = &amp;devpts_sops;</div><div class='del'>-	s-&gt;s_d_op = &amp;simple_dentry_operations;</div><div class='add'>+	s-&gt;s_d_flags = DCACHE_DONTCACHE;</div><div class='ctx'> 	s-&gt;s_time_gran = 1;</div><div class='add'>+	fsi-&gt;sb = s;</div><div class='ctx'> </div><div class='del'>-	error = -ENOMEM;</div><div class='del'>-	s-&gt;s_fs_info = new_pts_fs_info(s);</div><div class='del'>-	if (!s-&gt;s_fs_info)</div><div class='del'>-		goto fail;</div><div class='del'>-</div><div class='del'>-	error = parse_mount_options(data, PARSE_MOUNT, &amp;DEVPTS_SB(s)-&gt;mount_opts);</div><div class='del'>-	if (error)</div><div class='del'>-		goto fail;</div><div class='del'>-</div><div class='del'>-	error = -ENOMEM;</div><div class='ctx'> 	inode = new_inode(s);</div><div class='ctx'> 	if (!inode)</div><div class='del'>-		goto fail;</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> 	inode-&gt;i_ino = 1;</div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_atime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	simple_inode_init_ts(inode);</div><div class='ctx'> 	inode-&gt;i_mode = S_IFDIR | S_IRUGO | S_IXUGO | S_IWUSR;</div><div class='ctx'> 	inode-&gt;i_op = &amp;simple_dir_inode_operations;</div><div class='ctx'> 	inode-&gt;i_fop = &amp;simple_dir_operations;</div><div class='hunk'>@@ -478,31 +384,60 @@ devpts_fill_super(struct super_block *s, void *data, int silent)</div><div class='ctx'> 	s-&gt;s_root = d_make_root(inode);</div><div class='ctx'> 	if (!s-&gt;s_root) {</div><div class='ctx'> 		pr_err("get root dentry failed\n");</div><div class='del'>-		goto fail;</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	error = mknod_ptmx(s);</div><div class='del'>-	if (error)</div><div class='del'>-		goto fail_dput;</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-fail_dput:</div><div class='del'>-	dput(s-&gt;s_root);</div><div class='del'>-	s-&gt;s_root = NULL;</div><div class='del'>-fail:</div><div class='del'>-	return error;</div><div class='add'>+	return mknod_ptmx(s, fc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * devpts_mount()</div><div class='add'>+ * devpts_get_tree()</div><div class='ctx'>  *</div><div class='ctx'>  *     Mount a new (private) instance of devpts.  PTYs created in this</div><div class='ctx'>  *     instance are independent of the PTYs in other devpts instances.</div><div class='ctx'>  */</div><div class='del'>-static struct dentry *devpts_mount(struct file_system_type *fs_type,</div><div class='del'>-	int flags, const char *dev_name, void *data)</div><div class='add'>+static int devpts_get_tree(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	return mount_nodev(fs_type, flags, data, devpts_fill_super);</div><div class='add'>+	return get_tree_nodev(fc, devpts_fill_super);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void devpts_free_fc(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	kfree(fc-&gt;s_fs_info);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct fs_context_operations devpts_context_ops = {</div><div class='add'>+	.free		= devpts_free_fc,</div><div class='add'>+	.parse_param	= devpts_parse_param,</div><div class='add'>+	.get_tree	= devpts_get_tree,</div><div class='add'>+	.reconfigure	= devpts_reconfigure,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Set up the filesystem mount context.</div><div class='add'>+ */</div><div class='add'>+static int devpts_init_fs_context(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct pts_fs_info *fsi;</div><div class='add'>+</div><div class='add'>+	fsi = kzalloc(sizeof(struct pts_fs_info), GFP_KERNEL);</div><div class='add'>+	if (!fsi)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	ida_init(&amp;fsi-&gt;allocated_ptys);</div><div class='add'>+	fsi-&gt;mount_opts.uid     = GLOBAL_ROOT_UID;</div><div class='add'>+	fsi-&gt;mount_opts.gid     = GLOBAL_ROOT_GID;</div><div class='add'>+	fsi-&gt;mount_opts.mode    = DEVPTS_DEFAULT_MODE;</div><div class='add'>+	fsi-&gt;mount_opts.ptmxmode = DEVPTS_DEFAULT_PTMX_MODE;</div><div class='add'>+	fsi-&gt;mount_opts.max     = NR_UNIX98_PTY_MAX;</div><div class='add'>+</div><div class='add'>+	if (fc-&gt;purpose == FS_CONTEXT_FOR_MOUNT &amp;&amp;</div><div class='add'>+	    current-&gt;nsproxy-&gt;mnt_ns == init_task.nsproxy-&gt;mnt_ns)</div><div class='add'>+		fsi-&gt;mount_opts.reserve = true;</div><div class='add'>+</div><div class='add'>+	fc-&gt;s_fs_info = fsi;</div><div class='add'>+	fc-&gt;ops = &amp;devpts_context_ops;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void devpts_kill_sb(struct super_block *sb)</div><div class='hunk'>@@ -512,12 +447,13 @@ static void devpts_kill_sb(struct super_block *sb)</div><div class='ctx'> 	if (fsi)</div><div class='ctx'> 		ida_destroy(&amp;fsi-&gt;allocated_ptys);</div><div class='ctx'> 	kfree(fsi);</div><div class='del'>-	kill_litter_super(sb);</div><div class='add'>+	kill_anon_super(sb);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct file_system_type devpts_fs_type = {</div><div class='ctx'> 	.name		= "devpts",</div><div class='del'>-	.mount		= devpts_mount,</div><div class='add'>+	.init_fs_context = devpts_init_fs_context,</div><div class='add'>+	.parameters	= devpts_param_specs,</div><div class='ctx'> 	.kill_sb	= devpts_kill_sb,</div><div class='ctx'> 	.fs_flags	= FS_USERNS_MOUNT,</div><div class='ctx'> };</div><div class='hunk'>@@ -552,12 +488,12 @@ void devpts_kill_index(struct pts_fs_info *fsi, int idx)</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * devpts_pty_new -- create a new inode in /dev/pts/</div><div class='del'>- * @ptmx_inode: inode of the master</div><div class='del'>- * @device: major+minor of the node to be created</div><div class='add'>+ * @fsi: Filesystem info for this instance.</div><div class='ctx'>  * @index: used as a name of the node</div><div class='ctx'>  * @priv: what's given back by devpts_get_priv</div><div class='ctx'>  *</div><div class='del'>- * The created inode is returned. Remove it from /dev/pts/ by devpts_pty_kill.</div><div class='add'>+ * The dentry for the created inode is returned.</div><div class='add'>+ * Remove it from /dev/pts/ with devpts_pty_kill().</div><div class='ctx'>  */</div><div class='ctx'> struct dentry *devpts_pty_new(struct pts_fs_info *fsi, int index, void *priv)</div><div class='ctx'> {</div><div class='hunk'>@@ -578,27 +514,26 @@ struct dentry *devpts_pty_new(struct pts_fs_info *fsi, int index, void *priv)</div><div class='ctx'> 	inode-&gt;i_ino = index + 3;</div><div class='ctx'> 	inode-&gt;i_uid = opts-&gt;setuid ? opts-&gt;uid : current_fsuid();</div><div class='ctx'> 	inode-&gt;i_gid = opts-&gt;setgid ? opts-&gt;gid : current_fsgid();</div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_atime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	simple_inode_init_ts(inode);</div><div class='ctx'> 	init_special_inode(inode, S_IFCHR|opts-&gt;mode, MKDEV(UNIX98_PTY_SLAVE_MAJOR, index));</div><div class='ctx'> </div><div class='ctx'> 	sprintf(s, "%d", index);</div><div class='ctx'> </div><div class='ctx'> 	dentry = d_alloc_name(root, s);</div><div class='del'>-	if (dentry) {</div><div class='del'>-		dentry-&gt;d_fsdata = priv;</div><div class='del'>-		d_add(dentry, inode);</div><div class='del'>-		fsnotify_create(d_inode(root), dentry);</div><div class='del'>-	} else {</div><div class='add'>+	if (!dentry) {</div><div class='ctx'> 		iput(inode);</div><div class='del'>-		dentry = ERR_PTR(-ENOMEM);</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	return dentry;</div><div class='add'>+	dentry-&gt;d_fsdata = priv;</div><div class='add'>+	d_make_persistent(dentry, inode);</div><div class='add'>+	fsnotify_create(d_inode(root), dentry);</div><div class='add'>+	dput(dentry);</div><div class='add'>+	return dentry; // borrowed</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * devpts_get_priv -- get private data for a slave</div><div class='del'>- * @pts_inode: inode of the slave</div><div class='add'>+ * @dentry: dentry of the slave</div><div class='ctx'>  *</div><div class='ctx'>  * Returns whatever was passed as priv in devpts_pty_new for a given inode.</div><div class='ctx'>  */</div><div class='hunk'>@@ -611,7 +546,7 @@ void *devpts_get_priv(struct dentry *dentry)</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * devpts_pty_kill -- remove inode form /dev/pts/</div><div class='del'>- * @inode: inode of the slave to be removed</div><div class='add'>+ * @dentry: dentry of the slave to be removed</div><div class='ctx'>  *</div><div class='ctx'>  * This is an inverse operation of devpts_pty_new.</div><div class='ctx'>  */</div><div class='hunk'>@@ -621,16 +556,16 @@ void devpts_pty_kill(struct dentry *dentry)</div><div class='ctx'> </div><div class='ctx'> 	dentry-&gt;d_fsdata = NULL;</div><div class='ctx'> 	drop_nlink(dentry-&gt;d_inode);</div><div class='del'>-	fsnotify_unlink(d_inode(dentry-&gt;d_parent), dentry);</div><div class='ctx'> 	d_drop(dentry);</div><div class='del'>-	dput(dentry);	/* d_alloc_name() in devpts_pty_new() */</div><div class='add'>+	fsnotify_unlink(d_inode(dentry-&gt;d_parent), dentry);</div><div class='add'>+	d_make_discardable(dentry);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int __init init_devpts_fs(void)</div><div class='ctx'> {</div><div class='ctx'> 	int err = register_filesystem(&amp;devpts_fs_type);</div><div class='ctx'> 	if (!err) {</div><div class='del'>-		register_sysctl_table(pty_root_table);</div><div class='add'>+		register_sysctl("kernel/pty", pty_table);</div><div class='ctx'> 	}</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/direct-io.c b/fs/direct-io.c<br/>index 654443558047..2267f5ae7f77 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/direct-io.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/direct-io.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/direct-io.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/direct-io.c</a></div><div class='hunk'>@@ -37,13 +37,12 @@</div><div class='ctx'> #include &lt;linux/rwsem.h&gt;</div><div class='ctx'> #include &lt;linux/uio.h&gt;</div><div class='ctx'> #include &lt;linux/atomic.h&gt;</div><div class='del'>-#include &lt;linux/prefetch.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "internal.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * How many user pages to map in one call to get_user_pages().  This determines</div><div class='del'>- * the size of a structure in the slab cache</div><div class='add'>+ * How many user pages to map in one call to iov_iter_extract_pages().  This</div><div class='add'>+ * determines the size of a structure in the slab cache</div><div class='ctx'>  */</div><div class='ctx'> #define DIO_PAGES	64</div><div class='ctx'> </div><div class='hunk'>@@ -86,7 +85,6 @@ struct dio_submit {</div><div class='ctx'> 	sector_t final_block_in_request;/* doesn't change */</div><div class='ctx'> 	int boundary;			/* prev block is at a boundary */</div><div class='ctx'> 	get_block_t *get_block;		/* block mapping function */</div><div class='del'>-	dio_submit_t *submit_io;	/* IO submition function */</div><div class='ctx'> </div><div class='ctx'> 	loff_t logical_offset_in_bio;	/* current first logical block in bio */</div><div class='ctx'> 	sector_t final_block_in_bio;	/* current final block in bio + 1 */</div><div class='hunk'>@@ -117,18 +115,18 @@ struct dio_submit {</div><div class='ctx'> /* dio_state communicated between submission path and end_io */</div><div class='ctx'> struct dio {</div><div class='ctx'> 	int flags;			/* doesn't change */</div><div class='del'>-	int op;</div><div class='del'>-	int op_flags;</div><div class='add'>+	blk_opf_t opf;			/* request operation type and flags */</div><div class='ctx'> 	struct gendisk *bio_disk;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	loff_t i_size;			/* i_size when submitted */</div><div class='ctx'> 	dio_iodone_t *end_io;		/* IO completion function */</div><div class='add'>+	bool is_pinned;			/* T if we have pins on the pages */</div><div class='ctx'> </div><div class='ctx'> 	void *private;			/* copy from map_bh.b_private */</div><div class='ctx'> </div><div class='ctx'> 	/* BIO completion state */</div><div class='ctx'> 	spinlock_t bio_lock;		/* protects BIO fields below */</div><div class='del'>-	int page_errors;		/* errno from get_user_pages() */</div><div class='add'>+	int page_errors;		/* err from iov_iter_extract_pages() */</div><div class='ctx'> 	int is_async;			/* is IO async ? */</div><div class='ctx'> 	bool defer_completion;		/* defer AIO completion to workqueue? */</div><div class='ctx'> 	bool should_dirty;		/* if pages should be dirtied */</div><div class='hunk'>@@ -152,7 +150,7 @@ struct dio {</div><div class='ctx'> 	};</div><div class='ctx'> } ____cacheline_aligned_in_smp;</div><div class='ctx'> </div><div class='del'>-static struct kmem_cache *dio_cache __read_mostly;</div><div class='add'>+static struct kmem_cache *dio_cache __ro_after_init;</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * How many pages are in the queue?</div><div class='hunk'>@@ -167,13 +165,14 @@ static inline unsigned dio_pages_present(struct dio_submit *sdio)</div><div class='ctx'>  */</div><div class='ctx'> static inline int dio_refill_pages(struct dio *dio, struct dio_submit *sdio)</div><div class='ctx'> {</div><div class='add'>+	struct page **pages = dio-&gt;pages;</div><div class='add'>+	const enum req_op dio_op = dio-&gt;opf &amp; REQ_OP_MASK;</div><div class='ctx'> 	ssize_t ret;</div><div class='ctx'> </div><div class='del'>-	ret = iov_iter_get_pages(sdio-&gt;iter, dio-&gt;pages, LONG_MAX, DIO_PAGES,</div><div class='del'>-				&amp;sdio-&gt;from);</div><div class='add'>+	ret = iov_iter_extract_pages(sdio-&gt;iter, &amp;pages, LONG_MAX,</div><div class='add'>+				     DIO_PAGES, 0, &amp;sdio-&gt;from);</div><div class='ctx'> </div><div class='del'>-	if (ret &lt; 0 &amp;&amp; sdio-&gt;blocks_available &amp;&amp; (dio-&gt;op == REQ_OP_WRITE)) {</div><div class='del'>-		struct page *page = ZERO_PAGE(0);</div><div class='add'>+	if (ret &lt; 0 &amp;&amp; sdio-&gt;blocks_available &amp;&amp; dio_op == REQ_OP_WRITE) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * A memory fault, but the filesystem has some outstanding</div><div class='ctx'> 		 * mapped blocks.  We need to use those blocks up to avoid</div><div class='hunk'>@@ -181,8 +180,7 @@ static inline int dio_refill_pages(struct dio *dio, struct dio_submit *sdio)</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (dio-&gt;page_errors == 0)</div><div class='ctx'> 			dio-&gt;page_errors = ret;</div><div class='del'>-		get_page(page);</div><div class='del'>-		dio-&gt;pages[0] = page;</div><div class='add'>+		dio-&gt;pages[0] = ZERO_PAGE(0);</div><div class='ctx'> 		sdio-&gt;head = 0;</div><div class='ctx'> 		sdio-&gt;tail = 1;</div><div class='ctx'> 		sdio-&gt;from = 0;</div><div class='hunk'>@@ -191,7 +189,6 @@ static inline int dio_refill_pages(struct dio *dio, struct dio_submit *sdio)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (ret &gt;= 0) {</div><div class='del'>-		iov_iter_advance(sdio-&gt;iter, ret);</div><div class='ctx'> 		ret += sdio-&gt;from;</div><div class='ctx'> 		sdio-&gt;head = 0;</div><div class='ctx'> 		sdio-&gt;tail = (ret + PAGE_SIZE - 1) / PAGE_SIZE;</div><div class='hunk'>@@ -203,9 +200,9 @@ static inline int dio_refill_pages(struct dio *dio, struct dio_submit *sdio)</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Get another userspace page.  Returns an ERR_PTR on error.  Pages are</div><div class='del'>- * buffered inside the dio so that we can call get_user_pages() against a</div><div class='del'>- * decent number of pages, less frequently.  To provide nicer use of the</div><div class='del'>- * L1 cache.</div><div class='add'>+ * buffered inside the dio so that we can call iov_iter_extract_pages()</div><div class='add'>+ * against a decent number of pages, less frequently.  To provide nicer use of</div><div class='add'>+ * the L1 cache.</div><div class='ctx'>  */</div><div class='ctx'> static inline struct page *dio_get_page(struct dio *dio,</div><div class='ctx'> 					struct dio_submit *sdio)</div><div class='hunk'>@@ -221,6 +218,18 @@ static inline struct page *dio_get_page(struct dio *dio,</div><div class='ctx'> 	return dio-&gt;pages[sdio-&gt;head];</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void dio_pin_page(struct dio *dio, struct page *page)</div><div class='add'>+{</div><div class='add'>+	if (dio-&gt;is_pinned)</div><div class='add'>+		folio_add_pin(page_folio(page));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void dio_unpin_page(struct dio *dio, struct page *page)</div><div class='add'>+{</div><div class='add'>+	if (dio-&gt;is_pinned)</div><div class='add'>+		unpin_user_page(page);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * dio_complete() - called when all DIO BIO I/O has been completed</div><div class='ctx'>  *</div><div class='hunk'>@@ -234,6 +243,7 @@ static inline struct page *dio_get_page(struct dio *dio,</div><div class='ctx'>  */</div><div class='ctx'> static ssize_t dio_complete(struct dio *dio, ssize_t ret, unsigned int flags)</div><div class='ctx'> {</div><div class='add'>+	const enum req_op dio_op = dio-&gt;opf &amp; REQ_OP_MASK;</div><div class='ctx'> 	loff_t offset = dio-&gt;iocb-&gt;ki_pos;</div><div class='ctx'> 	ssize_t transferred = 0;</div><div class='ctx'> 	int err;</div><div class='hunk'>@@ -251,7 +261,7 @@ static ssize_t dio_complete(struct dio *dio, ssize_t ret, unsigned int flags)</div><div class='ctx'> 		transferred = dio-&gt;result;</div><div class='ctx'> </div><div class='ctx'> 		/* Check for short read case */</div><div class='del'>-		if ((dio-&gt;op == REQ_OP_READ) &amp;&amp;</div><div class='add'>+		if (dio_op == REQ_OP_READ &amp;&amp;</div><div class='ctx'> 		    ((offset + transferred) &gt; dio-&gt;i_size))</div><div class='ctx'> 			transferred = dio-&gt;i_size - offset;</div><div class='ctx'> 		/* ignore EFAULT if some IO has been done */</div><div class='hunk'>@@ -286,14 +296,8 @@ static ssize_t dio_complete(struct dio *dio, ssize_t ret, unsigned int flags)</div><div class='ctx'> 	 * zeros from unwritten extents.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (flags &amp; DIO_COMPLETE_INVALIDATE &amp;&amp;</div><div class='del'>-	    ret &gt; 0 &amp;&amp; dio-&gt;op == REQ_OP_WRITE &amp;&amp;</div><div class='del'>-	    dio-&gt;inode-&gt;i_mapping-&gt;nrpages) {</div><div class='del'>-		err = invalidate_inode_pages2_range(dio-&gt;inode-&gt;i_mapping,</div><div class='del'>-					offset &gt;&gt; PAGE_SHIFT,</div><div class='del'>-					(offset + ret - 1) &gt;&gt; PAGE_SHIFT);</div><div class='del'>-		if (err)</div><div class='del'>-			dio_warn_stale_pagecache(dio-&gt;iocb-&gt;ki_filp);</div><div class='del'>-	}</div><div class='add'>+	    ret &gt; 0 &amp;&amp; dio_op == REQ_OP_WRITE)</div><div class='add'>+		kiocb_invalidate_post_direct_write(dio-&gt;iocb, ret);</div><div class='ctx'> </div><div class='ctx'> 	inode_dio_end(dio-&gt;inode);</div><div class='ctx'> </div><div class='hunk'>@@ -305,7 +309,7 @@ static ssize_t dio_complete(struct dio *dio, ssize_t ret, unsigned int flags)</div><div class='ctx'> 		 */</div><div class='ctx'> 		dio-&gt;iocb-&gt;ki_pos += transferred;</div><div class='ctx'> </div><div class='del'>-		if (ret &gt; 0 &amp;&amp; dio-&gt;op == REQ_OP_WRITE)</div><div class='add'>+		if (ret &gt; 0 &amp;&amp; dio_op == REQ_OP_WRITE)</div><div class='ctx'> 			ret = generic_write_sync(dio-&gt;iocb, ret);</div><div class='ctx'> 		dio-&gt;iocb-&gt;ki_complete(dio-&gt;iocb, ret);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -329,6 +333,7 @@ static blk_status_t dio_bio_complete(struct dio *dio, struct bio *bio);</div><div class='ctx'> static void dio_bio_end_aio(struct bio *bio)</div><div class='ctx'> {</div><div class='ctx'> 	struct dio *dio = bio-&gt;bi_private;</div><div class='add'>+	const enum req_op dio_op = dio-&gt;opf &amp; REQ_OP_MASK;</div><div class='ctx'> 	unsigned long remaining;</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> 	bool defer_completion = false;</div><div class='hunk'>@@ -353,7 +358,7 @@ static void dio_bio_end_aio(struct bio *bio)</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (dio-&gt;result)</div><div class='ctx'> 			defer_completion = dio-&gt;defer_completion ||</div><div class='del'>-					   (dio-&gt;op == REQ_OP_WRITE &amp;&amp;</div><div class='add'>+					   (dio_op == REQ_OP_WRITE &amp;&amp;</div><div class='ctx'> 					    dio-&gt;inode-&gt;i_mapping-&gt;nrpages);</div><div class='ctx'> 		if (defer_completion) {</div><div class='ctx'> 			INIT_WORK(&amp;dio-&gt;complete_work, dio_aio_complete_work);</div><div class='hunk'>@@ -396,17 +401,15 @@ dio_bio_alloc(struct dio *dio, struct dio_submit *sdio,</div><div class='ctx'> 	 * bio_alloc() is guaranteed to return a bio when allowed to sleep and</div><div class='ctx'> 	 * we request a valid number of vectors.</div><div class='ctx'> 	 */</div><div class='del'>-	bio = bio_alloc(GFP_KERNEL, nr_vecs);</div><div class='del'>-</div><div class='del'>-	bio_set_dev(bio, bdev);</div><div class='add'>+	bio = bio_alloc(bdev, nr_vecs, dio-&gt;opf, GFP_KERNEL);</div><div class='ctx'> 	bio-&gt;bi_iter.bi_sector = first_sector;</div><div class='del'>-	bio_set_op_attrs(bio, dio-&gt;op, dio-&gt;op_flags);</div><div class='ctx'> 	if (dio-&gt;is_async)</div><div class='ctx'> 		bio-&gt;bi_end_io = dio_bio_end_aio;</div><div class='ctx'> 	else</div><div class='ctx'> 		bio-&gt;bi_end_io = dio_bio_end_io;</div><div class='del'>-</div><div class='del'>-	bio-&gt;bi_write_hint = dio-&gt;iocb-&gt;ki_hint;</div><div class='add'>+	if (dio-&gt;is_pinned)</div><div class='add'>+		bio_set_flag(bio, BIO_PAGE_PINNED);</div><div class='add'>+	bio-&gt;bi_write_hint = file_inode(dio-&gt;iocb-&gt;ki_filp)-&gt;i_write_hint;</div><div class='ctx'> </div><div class='ctx'> 	sdio-&gt;bio = bio;</div><div class='ctx'> 	sdio-&gt;logical_offset_in_bio = sdio-&gt;cur_page_fs_offset;</div><div class='hunk'>@@ -421,26 +424,22 @@ dio_bio_alloc(struct dio *dio, struct dio_submit *sdio,</div><div class='ctx'>  */</div><div class='ctx'> static inline void dio_bio_submit(struct dio *dio, struct dio_submit *sdio)</div><div class='ctx'> {</div><div class='add'>+	const enum req_op dio_op = dio-&gt;opf &amp; REQ_OP_MASK;</div><div class='ctx'> 	struct bio *bio = sdio-&gt;bio;</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> </div><div class='ctx'> 	bio-&gt;bi_private = dio;</div><div class='del'>-	/* don't account direct I/O as memory stall */</div><div class='del'>-	bio_clear_flag(bio, BIO_WORKINGSET);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock_irqsave(&amp;dio-&gt;bio_lock, flags);</div><div class='ctx'> 	dio-&gt;refcount++;</div><div class='ctx'> 	spin_unlock_irqrestore(&amp;dio-&gt;bio_lock, flags);</div><div class='ctx'> </div><div class='del'>-	if (dio-&gt;is_async &amp;&amp; dio-&gt;op == REQ_OP_READ &amp;&amp; dio-&gt;should_dirty)</div><div class='add'>+	if (dio-&gt;is_async &amp;&amp; dio_op == REQ_OP_READ &amp;&amp; dio-&gt;should_dirty)</div><div class='ctx'> 		bio_set_pages_dirty(bio);</div><div class='ctx'> </div><div class='ctx'> 	dio-&gt;bio_disk = bio-&gt;bi_bdev-&gt;bd_disk;</div><div class='ctx'> </div><div class='del'>-	if (sdio-&gt;submit_io)</div><div class='del'>-		sdio-&gt;submit_io(bio, dio-&gt;inode, sdio-&gt;logical_offset_in_bio);</div><div class='del'>-	else</div><div class='del'>-		submit_bio(bio);</div><div class='add'>+	submit_bio(bio);</div><div class='ctx'> </div><div class='ctx'> 	sdio-&gt;bio = NULL;</div><div class='ctx'> 	sdio-&gt;boundary = 0;</div><div class='hunk'>@@ -452,8 +451,10 @@ static inline void dio_bio_submit(struct dio *dio, struct dio_submit *sdio)</div><div class='ctx'>  */</div><div class='ctx'> static inline void dio_cleanup(struct dio *dio, struct dio_submit *sdio)</div><div class='ctx'> {</div><div class='del'>-	while (sdio-&gt;head &lt; sdio-&gt;tail)</div><div class='del'>-		put_page(dio-&gt;pages[sdio-&gt;head++]);</div><div class='add'>+	if (dio-&gt;is_pinned)</div><div class='add'>+		unpin_user_pages(dio-&gt;pages + sdio-&gt;head,</div><div class='add'>+				 sdio-&gt;tail - sdio-&gt;head);</div><div class='add'>+	sdio-&gt;head = sdio-&gt;tail;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -498,7 +499,8 @@ static struct bio *dio_await_one(struct dio *dio)</div><div class='ctx'> static blk_status_t dio_bio_complete(struct dio *dio, struct bio *bio)</div><div class='ctx'> {</div><div class='ctx'> 	blk_status_t err = bio-&gt;bi_status;</div><div class='del'>-	bool should_dirty = dio-&gt;op == REQ_OP_READ &amp;&amp; dio-&gt;should_dirty;</div><div class='add'>+	const enum req_op dio_op = dio-&gt;opf &amp; REQ_OP_MASK;</div><div class='add'>+	bool should_dirty = dio_op == REQ_OP_READ &amp;&amp; dio-&gt;should_dirty;</div><div class='ctx'> </div><div class='ctx'> 	if (err) {</div><div class='ctx'> 		if (err == BLK_STS_AGAIN &amp;&amp; (bio-&gt;bi_opf &amp; REQ_NOWAIT))</div><div class='hunk'>@@ -563,30 +565,6 @@ static inline int dio_bio_reap(struct dio *dio, struct dio_submit *sdio)</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Create workqueue for deferred direct IO completions. We allocate the</div><div class='del'>- * workqueue when it's first needed. This avoids creating workqueue for</div><div class='del'>- * filesystems that don't need it and also allows us to create the workqueue</div><div class='del'>- * late enough so the we can include s_id in the name of the workqueue.</div><div class='del'>- */</div><div class='del'>-int sb_init_dio_done_wq(struct super_block *sb)</div><div class='del'>-{</div><div class='del'>-	struct workqueue_struct *old;</div><div class='del'>-	struct workqueue_struct *wq = alloc_workqueue("dio/%s",</div><div class='del'>-						      WQ_MEM_RECLAIM, 0,</div><div class='del'>-						      sb-&gt;s_id);</div><div class='del'>-	if (!wq)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	/*</div><div class='del'>-	 * This has to be atomic as more DIOs can race to create the workqueue</div><div class='del'>-	 */</div><div class='del'>-	old = cmpxchg(&amp;sb-&gt;s_dio_done_wq, NULL, wq);</div><div class='del'>-	/* Someone created workqueue before us? Free ours... */</div><div class='del'>-	if (old)</div><div class='del'>-		destroy_workqueue(wq);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int dio_set_defer_completion(struct dio *dio)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = dio-&gt;inode-&gt;i_sb;</div><div class='hunk'>@@ -625,6 +603,7 @@ static int dio_set_defer_completion(struct dio *dio)</div><div class='ctx'> static int get_more_blocks(struct dio *dio, struct dio_submit *sdio,</div><div class='ctx'> 			   struct buffer_head *map_bh)</div><div class='ctx'> {</div><div class='add'>+	const enum req_op dio_op = dio-&gt;opf &amp; REQ_OP_MASK;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	sector_t fs_startblk;	/* Into file, in filesystem-sized blocks */</div><div class='ctx'> 	sector_t fs_endblk;	/* Into file, in filesystem-sized blocks */</div><div class='hunk'>@@ -659,7 +638,7 @@ static int get_more_blocks(struct dio *dio, struct dio_submit *sdio,</div><div class='ctx'> 		 * which may decide to handle it or also return an unmapped</div><div class='ctx'> 		 * buffer head.</div><div class='ctx'> 		 */</div><div class='del'>-		create = dio-&gt;op == REQ_OP_WRITE;</div><div class='add'>+		create = dio_op == REQ_OP_WRITE;</div><div class='ctx'> 		if (dio-&gt;flags &amp; DIO_SKIP_HOLES) {</div><div class='ctx'> 			i_size = i_size_read(dio-&gt;inode);</div><div class='ctx'> 			if (i_size &amp;&amp; fs_startblk &lt;= (i_size - 1) &gt;&gt; i_blkbits)</div><div class='hunk'>@@ -706,7 +685,7 @@ out:</div><div class='ctx'>  *</div><div class='ctx'>  * Return zero on success.  Non-zero means the caller needs to start a new BIO.</div><div class='ctx'>  */</div><div class='del'>-static inline int dio_bio_add_page(struct dio_submit *sdio)</div><div class='add'>+static inline int dio_bio_add_page(struct dio *dio, struct dio_submit *sdio)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -718,7 +697,7 @@ static inline int dio_bio_add_page(struct dio_submit *sdio)</div><div class='ctx'> 		 */</div><div class='ctx'> 		if ((sdio-&gt;cur_page_len + sdio-&gt;cur_page_offset) == PAGE_SIZE)</div><div class='ctx'> 			sdio-&gt;pages_in_io--;</div><div class='del'>-		get_page(sdio-&gt;cur_page);</div><div class='add'>+		dio_pin_page(dio, sdio-&gt;cur_page);</div><div class='ctx'> 		sdio-&gt;final_block_in_bio = sdio-&gt;cur_page_block +</div><div class='ctx'> 			(sdio-&gt;cur_page_len &gt;&gt; sdio-&gt;blkbits);</div><div class='ctx'> 		ret = 0;</div><div class='hunk'>@@ -773,11 +752,11 @@ static inline int dio_send_cur_page(struct dio *dio, struct dio_submit *sdio,</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (dio_bio_add_page(sdio) != 0) {</div><div class='add'>+	if (dio_bio_add_page(dio, sdio) != 0) {</div><div class='ctx'> 		dio_bio_submit(dio, sdio);</div><div class='ctx'> 		ret = dio_new_bio(dio, sdio, sdio-&gt;cur_page_block, map_bh);</div><div class='ctx'> 		if (ret == 0) {</div><div class='del'>-			ret = dio_bio_add_page(sdio);</div><div class='add'>+			ret = dio_bio_add_page(dio, sdio);</div><div class='ctx'> 			BUG_ON(ret != 0);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -807,10 +786,11 @@ submit_page_section(struct dio *dio, struct dio_submit *sdio, struct page *page,</div><div class='ctx'> 		    unsigned offset, unsigned len, sector_t blocknr,</div><div class='ctx'> 		    struct buffer_head *map_bh)</div><div class='ctx'> {</div><div class='add'>+	const enum req_op dio_op = dio-&gt;opf &amp; REQ_OP_MASK;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int boundary = sdio-&gt;boundary;	/* dio_send_cur_page may clear it */</div><div class='ctx'> </div><div class='del'>-	if (dio-&gt;op == REQ_OP_WRITE) {</div><div class='add'>+	if (dio_op == REQ_OP_WRITE) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Read accounting is performed in submit_bio()</div><div class='ctx'> 		 */</div><div class='hunk'>@@ -833,13 +813,13 @@ submit_page_section(struct dio *dio, struct dio_submit *sdio, struct page *page,</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (sdio-&gt;cur_page) {</div><div class='ctx'> 		ret = dio_send_cur_page(dio, sdio, map_bh);</div><div class='del'>-		put_page(sdio-&gt;cur_page);</div><div class='add'>+		dio_unpin_page(dio, sdio-&gt;cur_page);</div><div class='ctx'> 		sdio-&gt;cur_page = NULL;</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	get_page(page);		/* It is in dio */</div><div class='add'>+	dio_pin_page(dio, page);		/* It is in dio */</div><div class='ctx'> 	sdio-&gt;cur_page = page;</div><div class='ctx'> 	sdio-&gt;cur_page_offset = offset;</div><div class='ctx'> 	sdio-&gt;cur_page_len = len;</div><div class='hunk'>@@ -854,7 +834,7 @@ out:</div><div class='ctx'> 		ret = dio_send_cur_page(dio, sdio, map_bh);</div><div class='ctx'> 		if (sdio-&gt;bio)</div><div class='ctx'> 			dio_bio_submit(dio, sdio);</div><div class='del'>-		put_page(sdio-&gt;cur_page);</div><div class='add'>+		dio_unpin_page(dio, sdio-&gt;cur_page);</div><div class='ctx'> 		sdio-&gt;cur_page = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -923,6 +903,7 @@ static inline void dio_zero_block(struct dio *dio, struct dio_submit *sdio,</div><div class='ctx'> static int do_direct_IO(struct dio *dio, struct dio_submit *sdio,</div><div class='ctx'> 			struct buffer_head *map_bh)</div><div class='ctx'> {</div><div class='add'>+	const enum req_op dio_op = dio-&gt;opf &amp; REQ_OP_MASK;</div><div class='ctx'> 	const unsigned blkbits = sdio-&gt;blkbits;</div><div class='ctx'> 	const unsigned i_blkbits = blkbits + sdio-&gt;blkfactor;</div><div class='ctx'> 	int ret = 0;</div><div class='hunk'>@@ -954,7 +935,7 @@ static int do_direct_IO(struct dio *dio, struct dio_submit *sdio,</div><div class='ctx'> </div><div class='ctx'> 				ret = get_more_blocks(dio, sdio, map_bh);</div><div class='ctx'> 				if (ret) {</div><div class='del'>-					put_page(page);</div><div class='add'>+					dio_unpin_page(dio, page);</div><div class='ctx'> 					goto out;</div><div class='ctx'> 				}</div><div class='ctx'> 				if (!buffer_mapped(map_bh))</div><div class='hunk'>@@ -998,8 +979,8 @@ do_holes:</div><div class='ctx'> 				loff_t i_size_aligned;</div><div class='ctx'> </div><div class='ctx'> 				/* AKPM: eargh, -ENOTBLK is a hack */</div><div class='del'>-				if (dio-&gt;op == REQ_OP_WRITE) {</div><div class='del'>-					put_page(page);</div><div class='add'>+				if (dio_op == REQ_OP_WRITE) {</div><div class='add'>+					dio_unpin_page(dio, page);</div><div class='ctx'> 					return -ENOTBLK;</div><div class='ctx'> 				}</div><div class='ctx'> </div><div class='hunk'>@@ -1012,10 +993,10 @@ do_holes:</div><div class='ctx'> 				if (sdio-&gt;block_in_file &gt;=</div><div class='ctx'> 						i_size_aligned &gt;&gt; blkbits) {</div><div class='ctx'> 					/* We hit eof */</div><div class='del'>-					put_page(page);</div><div class='add'>+					dio_unpin_page(dio, page);</div><div class='ctx'> 					goto out;</div><div class='ctx'> 				}</div><div class='del'>-				zero_user(page, from, 1 &lt;&lt; blkbits);</div><div class='add'>+				memzero_page(page, from, 1 &lt;&lt; blkbits);</div><div class='ctx'> 				sdio-&gt;block_in_file++;</div><div class='ctx'> 				from += 1 &lt;&lt; blkbits;</div><div class='ctx'> 				dio-&gt;result += 1 &lt;&lt; blkbits;</div><div class='hunk'>@@ -1052,7 +1033,7 @@ do_holes:</div><div class='ctx'> 						  sdio-&gt;next_block_for_io,</div><div class='ctx'> 						  map_bh);</div><div class='ctx'> 			if (ret) {</div><div class='del'>-				put_page(page);</div><div class='add'>+				dio_unpin_page(dio, page);</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='ctx'> 			sdio-&gt;next_block_for_io += this_chunk_blocks;</div><div class='hunk'>@@ -1067,8 +1048,8 @@ next_block:</div><div class='ctx'> 				break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		/* Drop the ref which was taken in get_user_pages() */</div><div class='del'>-		put_page(page);</div><div class='add'>+		/* Drop the pin which was taken in get_user_pages() */</div><div class='add'>+		dio_unpin_page(dio, page);</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -1102,8 +1083,8 @@ static inline int drop_refcount(struct dio *dio)</div><div class='ctx'>  * The locking rules are governed by the flags parameter:</div><div class='ctx'>  *  - if the flags value contains DIO_LOCKING we use a fancy locking</div><div class='ctx'>  *    scheme for dumb filesystems.</div><div class='del'>- *    For writes this function is called under i_mutex and returns with</div><div class='del'>- *    i_mutex held, for reads, i_mutex is not held on entry, but it is</div><div class='add'>+ *    For writes this function is called under i_rwsem and returns with</div><div class='add'>+ *    i_rwsem held, for reads, i_rwsem is not held on entry, but it is</div><div class='ctx'>  *    taken and dropped again before returning.</div><div class='ctx'>  *  - if the flags value does NOT contain DIO_LOCKING we don't use any</div><div class='ctx'>  *    internal locking but rather rely on the filesystem to synchronize</div><div class='hunk'>@@ -1113,7 +1094,7 @@ static inline int drop_refcount(struct dio *dio)</div><div class='ctx'>  * counter before starting direct I/O, and decrement it once we are done.</div><div class='ctx'>  * Truncate can wait for it to reach zero to provide exclusion.  It is</div><div class='ctx'>  * expected that filesystem provide exclusion between new direct I/O</div><div class='del'>- * and truncates.  For DIO_LOCKING filesystems this is done by i_mutex,</div><div class='add'>+ * and truncates.  For DIO_LOCKING filesystems this is done by i_rwsem,</div><div class='ctx'>  * but other filesystems need to take care of this on their own.</div><div class='ctx'>  *</div><div class='ctx'>  * NOTE: if you pass "sdio" to anything by pointer make sure that function</div><div class='hunk'>@@ -1121,11 +1102,10 @@ static inline int drop_refcount(struct dio *dio)</div><div class='ctx'>  * individual fields and will generate much worse code. This is important</div><div class='ctx'>  * for the whole file.</div><div class='ctx'>  */</div><div class='del'>-static inline ssize_t</div><div class='del'>-do_blockdev_direct_IO(struct kiocb *iocb, struct inode *inode,</div><div class='del'>-		      struct block_device *bdev, struct iov_iter *iter,</div><div class='del'>-		      get_block_t get_block, dio_iodone_t end_io,</div><div class='del'>-		      dio_submit_t submit_io, int flags)</div><div class='add'>+ssize_t __blockdev_direct_IO(struct kiocb *iocb, struct inode *inode,</div><div class='add'>+		struct block_device *bdev, struct iov_iter *iter,</div><div class='add'>+		get_block_t get_block, dio_iodone_t end_io,</div><div class='add'>+		int flags)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned i_blkbits = READ_ONCE(inode-&gt;i_blkbits);</div><div class='ctx'> 	unsigned blkbits = i_blkbits;</div><div class='hunk'>@@ -1135,16 +1115,11 @@ do_blockdev_direct_IO(struct kiocb *iocb, struct inode *inode,</div><div class='ctx'> 	loff_t offset = iocb-&gt;ki_pos;</div><div class='ctx'> 	const loff_t end = offset + count;</div><div class='ctx'> 	struct dio *dio;</div><div class='del'>-	struct dio_submit sdio = { 0, };</div><div class='add'>+	struct dio_submit sdio = { NULL, };</div><div class='ctx'> 	struct buffer_head map_bh = { 0, };</div><div class='ctx'> 	struct blk_plug plug;</div><div class='ctx'> 	unsigned long align = offset | iov_iter_alignment(iter);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Avoid references to bdev if not absolutely needed to give</div><div class='del'>-	 * the early prefetch in the caller enough time.</div><div class='del'>-	 */</div><div class='del'>-</div><div class='ctx'> 	/* watch out for a 0 len io from a tricksy fs */</div><div class='ctx'> 	if (iov_iter_rw(iter) == READ &amp;&amp; !count)</div><div class='ctx'> 		return 0;</div><div class='hunk'>@@ -1164,6 +1139,7 @@ do_blockdev_direct_IO(struct kiocb *iocb, struct inode *inode,</div><div class='ctx'> 		/* will be released by direct_io_worker */</div><div class='ctx'> 		inode_lock(inode);</div><div class='ctx'> 	}</div><div class='add'>+	dio-&gt;is_pinned = iov_iter_extract_will_pin(iter);</div><div class='ctx'> </div><div class='ctx'> 	/* Once we sampled i_size check for reads beyond EOF */</div><div class='ctx'> 	dio-&gt;i_size = i_size_read(inode);</div><div class='hunk'>@@ -1203,12 +1179,11 @@ do_blockdev_direct_IO(struct kiocb *iocb, struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 	dio-&gt;inode = inode;</div><div class='ctx'> 	if (iov_iter_rw(iter) == WRITE) {</div><div class='del'>-		dio-&gt;op = REQ_OP_WRITE;</div><div class='del'>-		dio-&gt;op_flags = REQ_SYNC | REQ_IDLE;</div><div class='add'>+		dio-&gt;opf = REQ_OP_WRITE | REQ_SYNC | REQ_IDLE;</div><div class='ctx'> 		if (iocb-&gt;ki_flags &amp; IOCB_NOWAIT)</div><div class='del'>-			dio-&gt;op_flags |= REQ_NOWAIT;</div><div class='add'>+			dio-&gt;opf |= REQ_NOWAIT;</div><div class='ctx'> 	} else {</div><div class='del'>-		dio-&gt;op = REQ_OP_READ;</div><div class='add'>+		dio-&gt;opf = REQ_OP_READ;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1217,7 +1192,7 @@ do_blockdev_direct_IO(struct kiocb *iocb, struct inode *inode,</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (dio-&gt;is_async &amp;&amp; iov_iter_rw(iter) == WRITE) {</div><div class='ctx'> 		retval = 0;</div><div class='del'>-		if (iocb-&gt;ki_flags &amp; IOCB_DSYNC)</div><div class='add'>+		if (iocb_is_dsync(iocb))</div><div class='ctx'> 			retval = dio_set_defer_completion(dio);</div><div class='ctx'> 		else if (!dio-&gt;inode-&gt;i_sb-&gt;s_dio_done_wq) {</div><div class='ctx'> 			/*</div><div class='hunk'>@@ -1236,14 +1211,12 @@ do_blockdev_direct_IO(struct kiocb *iocb, struct inode *inode,</div><div class='ctx'> 	 */</div><div class='ctx'> 	inode_dio_begin(inode);</div><div class='ctx'> </div><div class='del'>-	retval = 0;</div><div class='ctx'> 	sdio.blkbits = blkbits;</div><div class='ctx'> 	sdio.blkfactor = i_blkbits - blkbits;</div><div class='ctx'> 	sdio.block_in_file = offset &gt;&gt; blkbits;</div><div class='ctx'> </div><div class='ctx'> 	sdio.get_block = get_block;</div><div class='ctx'> 	dio-&gt;end_io = end_io;</div><div class='del'>-	sdio.submit_io = submit_io;</div><div class='ctx'> 	sdio.final_block_in_bio = -1;</div><div class='ctx'> 	sdio.next_block_for_io = -1;</div><div class='ctx'> </div><div class='hunk'>@@ -1252,7 +1225,7 @@ do_blockdev_direct_IO(struct kiocb *iocb, struct inode *inode,</div><div class='ctx'> 	spin_lock_init(&amp;dio-&gt;bio_lock);</div><div class='ctx'> 	dio-&gt;refcount = 1;</div><div class='ctx'> </div><div class='del'>-	dio-&gt;should_dirty = iter_is_iovec(iter) &amp;&amp; iov_iter_rw(iter) == READ;</div><div class='add'>+	dio-&gt;should_dirty = user_backed_iter(iter) &amp;&amp; iov_iter_rw(iter) == READ;</div><div class='ctx'> 	sdio.iter = iter;</div><div class='ctx'> 	sdio.final_block_in_request = end &gt;&gt; blkbits;</div><div class='ctx'> </div><div class='hunk'>@@ -1290,7 +1263,7 @@ do_blockdev_direct_IO(struct kiocb *iocb, struct inode *inode,</div><div class='ctx'> 		ret2 = dio_send_cur_page(dio, &amp;sdio, &amp;map_bh);</div><div class='ctx'> 		if (retval == 0)</div><div class='ctx'> 			retval = ret2;</div><div class='del'>-		put_page(sdio.cur_page);</div><div class='add'>+		dio_unpin_page(dio, sdio.cur_page);</div><div class='ctx'> 		sdio.cur_page = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (sdio.bio)</div><div class='hunk'>@@ -1306,7 +1279,7 @@ do_blockdev_direct_IO(struct kiocb *iocb, struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * All block lookups have been performed. For READ requests</div><div class='del'>-	 * we can let i_mutex go now that its achieved its purpose</div><div class='add'>+	 * we can let i_rwsem go now that its achieved its purpose</div><div class='ctx'> 	 * of protecting us from looking up uninitialized blocks.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (iov_iter_rw(iter) == READ &amp;&amp; (dio-&gt;flags &amp; DIO_LOCKING))</div><div class='hunk'>@@ -1340,29 +1313,6 @@ fail_dio:</div><div class='ctx'> 	kmem_cache_free(dio_cache, dio);</div><div class='ctx'> 	return retval;</div><div class='ctx'> }</div><div class='del'>-</div><div class='del'>-ssize_t __blockdev_direct_IO(struct kiocb *iocb, struct inode *inode,</div><div class='del'>-			     struct block_device *bdev, struct iov_iter *iter,</div><div class='del'>-			     get_block_t get_block,</div><div class='del'>-			     dio_iodone_t end_io, dio_submit_t submit_io,</div><div class='del'>-			     int flags)</div><div class='del'>-{</div><div class='del'>-	/*</div><div class='del'>-	 * The block device state is needed in the end to finally</div><div class='del'>-	 * submit everything.  Since it's likely to be cache cold</div><div class='del'>-	 * prefetch it here as first thing to hide some of the</div><div class='del'>-	 * latency.</div><div class='del'>-	 *</div><div class='del'>-	 * Attempt to prefetch the pieces we likely need later.</div><div class='del'>-	 */</div><div class='del'>-	prefetch(&amp;bdev-&gt;bd_disk-&gt;part_tbl);</div><div class='del'>-	prefetch(bdev-&gt;bd_disk-&gt;queue);</div><div class='del'>-	prefetch((char *)bdev-&gt;bd_disk-&gt;queue + SMP_CACHE_BYTES);</div><div class='del'>-</div><div class='del'>-	return do_blockdev_direct_IO(iocb, inode, bdev, iter, get_block,</div><div class='del'>-				     end_io, submit_io, flags);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> EXPORT_SYMBOL(__blockdev_direct_IO);</div><div class='ctx'> </div><div class='ctx'> static __init int dio_init(void)</div><div class='head'>diff --git a/fs/dlm/Kconfig b/fs/dlm/Kconfig<br/>index ee92634196a8..b46165df5a91 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/Kconfig</a></div><div class='hunk'>@@ -3,8 +3,6 @@ menuconfig DLM</div><div class='ctx'> 	tristate "Distributed Lock Manager (DLM)"</div><div class='ctx'> 	depends on INET</div><div class='ctx'> 	depends on SYSFS &amp;&amp; CONFIGFS_FS &amp;&amp; (IPV6 || IPV6=n)</div><div class='del'>-	select IP_SCTP</div><div class='del'>-	select SRCU</div><div class='ctx'> 	help</div><div class='ctx'> 	A general purpose distributed lock manager for kernel or userspace</div><div class='ctx'> 	applications.</div><div class='head'>diff --git a/fs/dlm/Makefile b/fs/dlm/Makefile<br/>index 3545fdafc6fb..5a471af1d1fe 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/Makefile?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/Makefile</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/Makefile?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/Makefile</a></div><div class='hunk'>@@ -9,7 +9,6 @@ dlm-y :=			ast.o \</div><div class='ctx'> 				member.o \</div><div class='ctx'> 				memory.o \</div><div class='ctx'> 				midcomms.o \</div><div class='del'>-				netlink.o \</div><div class='ctx'> 				lowcomms.o \</div><div class='ctx'> 				plock.o \</div><div class='ctx'> 				rcom.o \</div><div class='head'>diff --git a/fs/dlm/ast.c b/fs/dlm/ast.c<br/>index 283c7b94edda..0fe8d80ce5e8 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/ast.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/ast.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/ast.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/ast.c</a></div><div class='hunk'>@@ -9,56 +9,73 @@</div><div class='ctx'> *******************************************************************************</div><div class='ctx'> ******************************************************************************/</div><div class='ctx'> </div><div class='add'>+#include &lt;trace/events/dlm.h&gt;</div><div class='add'>+</div><div class='ctx'> #include "dlm_internal.h"</div><div class='add'>+#include "lvb_table.h"</div><div class='add'>+#include "memory.h"</div><div class='ctx'> #include "lock.h"</div><div class='ctx'> #include "user.h"</div><div class='ctx'> #include "ast.h"</div><div class='ctx'> </div><div class='del'>-static uint64_t dlm_cb_seq;</div><div class='del'>-static DEFINE_SPINLOCK(dlm_cb_seq_spin);</div><div class='del'>-</div><div class='del'>-static void dlm_dump_lkb_callbacks(struct dlm_lkb *lkb)</div><div class='add'>+static void dlm_run_callback(uint32_t ls_id, uint32_t lkb_id, int8_t mode,</div><div class='add'>+			     uint32_t flags, uint8_t sb_flags, int sb_status,</div><div class='add'>+			     struct dlm_lksb *lksb,</div><div class='add'>+			     void (*astfn)(void *astparam),</div><div class='add'>+			     void (*bastfn)(void *astparam, int mode),</div><div class='add'>+			     void *astparam, const char *res_name,</div><div class='add'>+			     size_t res_length)</div><div class='ctx'> {</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	log_print("last_bast %x %llu flags %x mode %d sb %d %x",</div><div class='del'>-		  lkb-&gt;lkb_id,</div><div class='del'>-		  (unsigned long long)lkb-&gt;lkb_last_bast.seq,</div><div class='del'>-		  lkb-&gt;lkb_last_bast.flags,</div><div class='del'>-		  lkb-&gt;lkb_last_bast.mode,</div><div class='del'>-		  lkb-&gt;lkb_last_bast.sb_status,</div><div class='del'>-		  lkb-&gt;lkb_last_bast.sb_flags);</div><div class='del'>-</div><div class='del'>-	log_print("last_cast %x %llu flags %x mode %d sb %d %x",</div><div class='del'>-		  lkb-&gt;lkb_id,</div><div class='del'>-		  (unsigned long long)lkb-&gt;lkb_last_cast.seq,</div><div class='del'>-		  lkb-&gt;lkb_last_cast.flags,</div><div class='del'>-		  lkb-&gt;lkb_last_cast.mode,</div><div class='del'>-		  lkb-&gt;lkb_last_cast.sb_status,</div><div class='del'>-		  lkb-&gt;lkb_last_cast.sb_flags);</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; DLM_CALLBACKS_SIZE; i++) {</div><div class='del'>-		log_print("cb %x %llu flags %x mode %d sb %d %x",</div><div class='del'>-			  lkb-&gt;lkb_id,</div><div class='del'>-			  (unsigned long long)lkb-&gt;lkb_callbacks[i].seq,</div><div class='del'>-			  lkb-&gt;lkb_callbacks[i].flags,</div><div class='del'>-			  lkb-&gt;lkb_callbacks[i].mode,</div><div class='del'>-			  lkb-&gt;lkb_callbacks[i].sb_status,</div><div class='del'>-			  lkb-&gt;lkb_callbacks[i].sb_flags);</div><div class='add'>+	if (flags &amp; DLM_CB_BAST) {</div><div class='add'>+		trace_dlm_bast(ls_id, lkb_id, mode, res_name, res_length);</div><div class='add'>+		bastfn(astparam, mode);</div><div class='add'>+	} else if (flags &amp; DLM_CB_CAST) {</div><div class='add'>+		trace_dlm_ast(ls_id, lkb_id, sb_flags, sb_status, res_name,</div><div class='add'>+			      res_length);</div><div class='add'>+		lksb-&gt;sb_status = sb_status;</div><div class='add'>+		lksb-&gt;sb_flags = sb_flags;</div><div class='add'>+		astfn(astparam);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int dlm_add_lkb_callback(struct dlm_lkb *lkb, uint32_t flags, int mode,</div><div class='del'>-			 int status, uint32_t sbflags, uint64_t seq)</div><div class='add'>+static void dlm_do_callback(struct dlm_callback *cb)</div><div class='add'>+{</div><div class='add'>+	dlm_run_callback(cb-&gt;ls_id, cb-&gt;lkb_id, cb-&gt;mode, cb-&gt;flags,</div><div class='add'>+			 cb-&gt;sb_flags, cb-&gt;sb_status, cb-&gt;lkb_lksb,</div><div class='add'>+			 cb-&gt;astfn, cb-&gt;bastfn, cb-&gt;astparam,</div><div class='add'>+			 cb-&gt;res_name, cb-&gt;res_length);</div><div class='add'>+	dlm_free_cb(cb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void dlm_callback_work(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct dlm_callback *cb = container_of(work, struct dlm_callback, work);</div><div class='add'>+</div><div class='add'>+	dlm_do_callback(cb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool dlm_may_skip_callback(struct dlm_lkb *lkb, uint32_t flags, int mode,</div><div class='add'>+			   int status, uint32_t sbflags, int *copy_lvb)</div><div class='ctx'> {</div><div class='del'>-	struct dlm_ls *ls = lkb-&gt;lkb_resource-&gt;res_ls;</div><div class='del'>-	uint64_t prev_seq;</div><div class='add'>+	struct dlm_rsb *rsb = lkb-&gt;lkb_resource;</div><div class='add'>+	struct dlm_ls *ls = rsb-&gt;res_ls;</div><div class='ctx'> 	int prev_mode;</div><div class='del'>-	int i, rv;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; DLM_CALLBACKS_SIZE; i++) {</div><div class='del'>-		if (lkb-&gt;lkb_callbacks[i].seq)</div><div class='del'>-			continue;</div><div class='add'>+	if (copy_lvb)</div><div class='add'>+		*copy_lvb = 0;</div><div class='add'>+</div><div class='add'>+	if (flags &amp; DLM_CB_BAST) {</div><div class='add'>+		/* if cb is a bast, it should be skipped if the blocking mode is</div><div class='add'>+		 * compatible with the last granted mode</div><div class='add'>+		 */</div><div class='add'>+		if (lkb-&gt;lkb_last_cast_cb_mode != -1) {</div><div class='add'>+			if (dlm_modes_compat(mode, lkb-&gt;lkb_last_cast_cb_mode)) {</div><div class='add'>+				log_debug(ls, "skip %x bast mode %d for cast mode %d",</div><div class='add'>+					  lkb-&gt;lkb_id, mode,</div><div class='add'>+					  lkb-&gt;lkb_last_cast_cb_mode);</div><div class='add'>+				return true;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Suppress some redundant basts here, do more on removal.</div><div class='hunk'>@@ -66,209 +83,130 @@ int dlm_add_lkb_callback(struct dlm_lkb *lkb, uint32_t flags, int mode,</div><div class='ctx'> 		 * is a bast for the same mode or a more restrictive mode.</div><div class='ctx'> 		 * (the addional &gt; PR check is needed for PR/CW inversion)</div><div class='ctx'> 		 */</div><div class='del'>-</div><div class='del'>-		if ((i &gt; 0) &amp;&amp; (flags &amp; DLM_CB_BAST) &amp;&amp;</div><div class='del'>-		    (lkb-&gt;lkb_callbacks[i-1].flags &amp; DLM_CB_BAST)) {</div><div class='del'>-</div><div class='del'>-			prev_seq = lkb-&gt;lkb_callbacks[i-1].seq;</div><div class='del'>-			prev_mode = lkb-&gt;lkb_callbacks[i-1].mode;</div><div class='add'>+		if (lkb-&gt;lkb_last_cb_mode != -1 &amp;&amp;</div><div class='add'>+		    lkb-&gt;lkb_last_cb_flags &amp; DLM_CB_BAST) {</div><div class='add'>+			prev_mode = lkb-&gt;lkb_last_cb_mode;</div><div class='ctx'> </div><div class='ctx'> 			if ((prev_mode == mode) ||</div><div class='ctx'> 			    (prev_mode &gt; mode &amp;&amp; prev_mode &gt; DLM_LOCK_PR)) {</div><div class='add'>+				log_debug(ls, "skip %x add bast mode %d for bast mode %d",</div><div class='add'>+					  lkb-&gt;lkb_id, mode, prev_mode);</div><div class='add'>+				return true;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-				log_debug(ls, "skip %x add bast %llu mode %d "</div><div class='del'>-					  "for bast %llu mode %d",</div><div class='del'>-					  lkb-&gt;lkb_id,</div><div class='del'>-					  (unsigned long long)seq,</div><div class='del'>-					  mode,</div><div class='del'>-					  (unsigned long long)prev_seq,</div><div class='del'>-					  prev_mode);</div><div class='del'>-				rv = 0;</div><div class='del'>-				goto out;</div><div class='add'>+		lkb-&gt;lkb_last_bast_time = ktime_get();</div><div class='add'>+		lkb-&gt;lkb_last_bast_cb_mode = mode;</div><div class='add'>+	} else if (flags &amp; DLM_CB_CAST) {</div><div class='add'>+		if (test_bit(DLM_DFL_USER_BIT, &amp;lkb-&gt;lkb_dflags)) {</div><div class='add'>+			prev_mode = lkb-&gt;lkb_last_cast_cb_mode;</div><div class='add'>+</div><div class='add'>+			if (!status &amp;&amp; lkb-&gt;lkb_lksb-&gt;sb_lvbptr &amp;&amp;</div><div class='add'>+			    dlm_lvb_operations[prev_mode + 1][mode + 1]) {</div><div class='add'>+				if (copy_lvb)</div><div class='add'>+					*copy_lvb = 1;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		lkb-&gt;lkb_callbacks[i].seq = seq;</div><div class='del'>-		lkb-&gt;lkb_callbacks[i].flags = flags;</div><div class='del'>-		lkb-&gt;lkb_callbacks[i].mode = mode;</div><div class='del'>-		lkb-&gt;lkb_callbacks[i].sb_status = status;</div><div class='del'>-		lkb-&gt;lkb_callbacks[i].sb_flags = (sbflags &amp; 0x000000FF);</div><div class='del'>-		rv = 0;</div><div class='del'>-		break;</div><div class='add'>+		lkb-&gt;lkb_last_cast_cb_mode = mode;</div><div class='add'>+		lkb-&gt;lkb_last_cast_time = ktime_get();</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (i == DLM_CALLBACKS_SIZE) {</div><div class='del'>-		log_error(ls, "no callbacks %x %llu flags %x mode %d sb %d %x",</div><div class='del'>-			  lkb-&gt;lkb_id, (unsigned long long)seq,</div><div class='del'>-			  flags, mode, status, sbflags);</div><div class='del'>-		dlm_dump_lkb_callbacks(lkb);</div><div class='del'>-		rv = -1;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>- out:</div><div class='del'>-	return rv;</div><div class='add'>+	lkb-&gt;lkb_last_cb_mode = mode;</div><div class='add'>+	lkb-&gt;lkb_last_cb_flags = flags;</div><div class='add'>+</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int dlm_rem_lkb_callback(struct dlm_ls *ls, struct dlm_lkb *lkb,</div><div class='del'>-			 struct dlm_callback *cb, int *resid)</div><div class='add'>+int dlm_get_cb(struct dlm_lkb *lkb, uint32_t flags, int mode,</div><div class='add'>+	       int status, uint32_t sbflags,</div><div class='add'>+	       struct dlm_callback **cb)</div><div class='ctx'> {</div><div class='del'>-	int i, rv;</div><div class='del'>-</div><div class='del'>-	*resid = 0;</div><div class='add'>+	struct dlm_rsb *rsb = lkb-&gt;lkb_resource;</div><div class='add'>+	struct dlm_ls *ls = rsb-&gt;res_ls;</div><div class='ctx'> </div><div class='del'>-	if (!lkb-&gt;lkb_callbacks[0].seq) {</div><div class='del'>-		rv = -ENOENT;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	*cb = dlm_allocate_cb();</div><div class='add'>+	if (WARN_ON_ONCE(!*cb))</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	/* oldest undelivered cb is callbacks[0] */</div><div class='add'>+	/* for tracing */</div><div class='add'>+	(*cb)-&gt;lkb_id = lkb-&gt;lkb_id;</div><div class='add'>+	(*cb)-&gt;ls_id = ls-&gt;ls_global_id;</div><div class='add'>+	memcpy((*cb)-&gt;res_name, rsb-&gt;res_name, rsb-&gt;res_length);</div><div class='add'>+	(*cb)-&gt;res_length = rsb-&gt;res_length;</div><div class='ctx'> </div><div class='del'>-	memcpy(cb, &amp;lkb-&gt;lkb_callbacks[0], sizeof(struct dlm_callback));</div><div class='del'>-	memset(&amp;lkb-&gt;lkb_callbacks[0], 0, sizeof(struct dlm_callback));</div><div class='add'>+	(*cb)-&gt;flags = flags;</div><div class='add'>+	(*cb)-&gt;mode = mode;</div><div class='add'>+	(*cb)-&gt;sb_status = status;</div><div class='add'>+	(*cb)-&gt;sb_flags = (sbflags &amp; 0x000000FF);</div><div class='add'>+	(*cb)-&gt;lkb_lksb = lkb-&gt;lkb_lksb;</div><div class='ctx'> </div><div class='del'>-	/* shift others down */</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	for (i = 1; i &lt; DLM_CALLBACKS_SIZE; i++) {</div><div class='del'>-		if (!lkb-&gt;lkb_callbacks[i].seq)</div><div class='del'>-			break;</div><div class='del'>-		memcpy(&amp;lkb-&gt;lkb_callbacks[i-1], &amp;lkb-&gt;lkb_callbacks[i],</div><div class='del'>-		       sizeof(struct dlm_callback));</div><div class='del'>-		memset(&amp;lkb-&gt;lkb_callbacks[i], 0, sizeof(struct dlm_callback));</div><div class='del'>-		(*resid)++;</div><div class='del'>-	}</div><div class='add'>+static int dlm_get_queue_cb(struct dlm_lkb *lkb, uint32_t flags, int mode,</div><div class='add'>+			    int status, uint32_t sbflags,</div><div class='add'>+			    struct dlm_callback **cb)</div><div class='add'>+{</div><div class='add'>+	int rv;</div><div class='ctx'> </div><div class='del'>-	/* if cb is a bast, it should be skipped if the blocking mode is</div><div class='del'>-	   compatible with the last granted mode */</div><div class='del'>-</div><div class='del'>-	if ((cb-&gt;flags &amp; DLM_CB_BAST) &amp;&amp; lkb-&gt;lkb_last_cast.seq) {</div><div class='del'>-		if (dlm_modes_compat(cb-&gt;mode, lkb-&gt;lkb_last_cast.mode)) {</div><div class='del'>-			cb-&gt;flags |= DLM_CB_SKIP;</div><div class='del'>-</div><div class='del'>-			log_debug(ls, "skip %x bast %llu mode %d "</div><div class='del'>-				  "for cast %llu mode %d",</div><div class='del'>-				  lkb-&gt;lkb_id,</div><div class='del'>-				  (unsigned long long)cb-&gt;seq,</div><div class='del'>-				  cb-&gt;mode,</div><div class='del'>-				  (unsigned long long)lkb-&gt;lkb_last_cast.seq,</div><div class='del'>-				  lkb-&gt;lkb_last_cast.mode);</div><div class='del'>-			rv = 0;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	rv = dlm_get_cb(lkb, flags, mode, status, sbflags, cb);</div><div class='add'>+	if (rv)</div><div class='add'>+		return rv;</div><div class='ctx'> </div><div class='del'>-	if (cb-&gt;flags &amp; DLM_CB_CAST) {</div><div class='del'>-		memcpy(&amp;lkb-&gt;lkb_last_cast, cb, sizeof(struct dlm_callback));</div><div class='del'>-		lkb-&gt;lkb_last_cast_time = ktime_get();</div><div class='del'>-	}</div><div class='add'>+	(*cb)-&gt;astfn = lkb-&gt;lkb_astfn;</div><div class='add'>+	(*cb)-&gt;bastfn = lkb-&gt;lkb_bastfn;</div><div class='add'>+	(*cb)-&gt;astparam = lkb-&gt;lkb_astparam;</div><div class='add'>+	INIT_WORK(&amp;(*cb)-&gt;work, dlm_callback_work);</div><div class='ctx'> </div><div class='del'>-	if (cb-&gt;flags &amp; DLM_CB_BAST) {</div><div class='del'>-		memcpy(&amp;lkb-&gt;lkb_last_bast, cb, sizeof(struct dlm_callback));</div><div class='del'>-		lkb-&gt;lkb_last_bast_time = ktime_get();</div><div class='del'>-	}</div><div class='del'>-	rv = 0;</div><div class='del'>- out:</div><div class='del'>-	return rv;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void dlm_add_cb(struct dlm_lkb *lkb, uint32_t flags, int mode, int status,</div><div class='ctx'> 		uint32_t sbflags)</div><div class='ctx'> {</div><div class='del'>-	struct dlm_ls *ls = lkb-&gt;lkb_resource-&gt;res_ls;</div><div class='del'>-	uint64_t new_seq, prev_seq;</div><div class='add'>+	struct dlm_rsb *rsb = lkb-&gt;lkb_resource;</div><div class='add'>+	struct dlm_ls *ls = rsb-&gt;res_ls;</div><div class='add'>+	struct dlm_callback *cb;</div><div class='ctx'> 	int rv;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;dlm_cb_seq_spin);</div><div class='del'>-	new_seq = ++dlm_cb_seq;</div><div class='del'>-	if (!dlm_cb_seq)</div><div class='del'>-		new_seq = ++dlm_cb_seq;</div><div class='del'>-	spin_unlock(&amp;dlm_cb_seq_spin);</div><div class='del'>-</div><div class='del'>-	if (lkb-&gt;lkb_flags &amp; DLM_IFL_USER) {</div><div class='del'>-		dlm_user_add_ast(lkb, flags, mode, status, sbflags, new_seq);</div><div class='add'>+	if (test_bit(DLM_DFL_USER_BIT, &amp;lkb-&gt;lkb_dflags)) {</div><div class='add'>+		dlm_user_add_ast(lkb, flags, mode, status, sbflags);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;lkb-&gt;lkb_cb_mutex);</div><div class='del'>-	prev_seq = lkb-&gt;lkb_callbacks[0].seq;</div><div class='del'>-</div><div class='del'>-	rv = dlm_add_lkb_callback(lkb, flags, mode, status, sbflags, new_seq);</div><div class='del'>-	if (rv &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	if (!prev_seq) {</div><div class='del'>-		kref_get(&amp;lkb-&gt;lkb_ref);</div><div class='add'>+	if (dlm_may_skip_callback(lkb, flags, mode, status, sbflags, NULL))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-		if (test_bit(LSFL_CB_DELAY, &amp;ls-&gt;ls_flags)) {</div><div class='del'>-			mutex_lock(&amp;ls-&gt;ls_cb_mutex);</div><div class='del'>-			list_add(&amp;lkb-&gt;lkb_cb_list, &amp;ls-&gt;ls_cb_delay);</div><div class='del'>-			mutex_unlock(&amp;ls-&gt;ls_cb_mutex);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_cb_lock);</div><div class='add'>+	if (test_bit(LSFL_CB_DELAY, &amp;ls-&gt;ls_flags)) {</div><div class='add'>+		rv = dlm_get_queue_cb(lkb, flags, mode, status, sbflags, &amp;cb);</div><div class='add'>+		if (!rv)</div><div class='add'>+			list_add(&amp;cb-&gt;list, &amp;ls-&gt;ls_cb_delay);</div><div class='add'>+	} else {</div><div class='add'>+		if (test_bit(LSFL_SOFTIRQ, &amp;ls-&gt;ls_flags)) {</div><div class='add'>+			dlm_run_callback(ls-&gt;ls_global_id, lkb-&gt;lkb_id, mode, flags,</div><div class='add'>+					 sbflags, status, lkb-&gt;lkb_lksb,</div><div class='add'>+					 lkb-&gt;lkb_astfn, lkb-&gt;lkb_bastfn,</div><div class='add'>+					 lkb-&gt;lkb_astparam, rsb-&gt;res_name,</div><div class='add'>+					 rsb-&gt;res_length);</div><div class='ctx'> 		} else {</div><div class='del'>-			queue_work(ls-&gt;ls_callback_wq, &amp;lkb-&gt;lkb_cb_work);</div><div class='add'>+			rv = dlm_get_queue_cb(lkb, flags, mode, status, sbflags, &amp;cb);</div><div class='add'>+			if (!rv)</div><div class='add'>+				queue_work(ls-&gt;ls_callback_wq, &amp;cb-&gt;work);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>- out:</div><div class='del'>-	mutex_unlock(&amp;lkb-&gt;lkb_cb_mutex);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void dlm_callback_work(struct work_struct *work)</div><div class='del'>-{</div><div class='del'>-	struct dlm_lkb *lkb = container_of(work, struct dlm_lkb, lkb_cb_work);</div><div class='del'>-	struct dlm_ls *ls = lkb-&gt;lkb_resource-&gt;res_ls;</div><div class='del'>-	void (*castfn) (void *astparam);</div><div class='del'>-	void (*bastfn) (void *astparam, int mode);</div><div class='del'>-	struct dlm_callback callbacks[DLM_CALLBACKS_SIZE];</div><div class='del'>-	int i, rv, resid;</div><div class='del'>-</div><div class='del'>-	memset(&amp;callbacks, 0, sizeof(callbacks));</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;lkb-&gt;lkb_cb_mutex);</div><div class='del'>-	if (!lkb-&gt;lkb_callbacks[0].seq) {</div><div class='del'>-		/* no callback work exists, shouldn't happen */</div><div class='del'>-		log_error(ls, "dlm_callback_work %x no work", lkb-&gt;lkb_id);</div><div class='del'>-		dlm_print_lkb(lkb);</div><div class='del'>-		dlm_dump_lkb_callbacks(lkb);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; DLM_CALLBACKS_SIZE; i++) {</div><div class='del'>-		rv = dlm_rem_lkb_callback(ls, lkb, &amp;callbacks[i], &amp;resid);</div><div class='del'>-		if (rv &lt; 0)</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (resid) {</div><div class='del'>-		/* cbs remain, loop should have removed all, shouldn't happen */</div><div class='del'>-		log_error(ls, "dlm_callback_work %x resid %d", lkb-&gt;lkb_id,</div><div class='del'>-			  resid);</div><div class='del'>-		dlm_print_lkb(lkb);</div><div class='del'>-		dlm_dump_lkb_callbacks(lkb);</div><div class='del'>-	}</div><div class='del'>-	mutex_unlock(&amp;lkb-&gt;lkb_cb_mutex);</div><div class='del'>-</div><div class='del'>-	castfn = lkb-&gt;lkb_astfn;</div><div class='del'>-	bastfn = lkb-&gt;lkb_bastfn;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; DLM_CALLBACKS_SIZE; i++) {</div><div class='del'>-		if (!callbacks[i].seq)</div><div class='del'>-			break;</div><div class='del'>-		if (callbacks[i].flags &amp; DLM_CB_SKIP) {</div><div class='del'>-			continue;</div><div class='del'>-		} else if (callbacks[i].flags &amp; DLM_CB_BAST) {</div><div class='del'>-			bastfn(lkb-&gt;lkb_astparam, callbacks[i].mode);</div><div class='del'>-		} else if (callbacks[i].flags &amp; DLM_CB_CAST) {</div><div class='del'>-			lkb-&gt;lkb_lksb-&gt;sb_status = callbacks[i].sb_status;</div><div class='del'>-			lkb-&gt;lkb_lksb-&gt;sb_flags = callbacks[i].sb_flags;</div><div class='del'>-			castfn(lkb-&gt;lkb_astparam);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* undo kref_get from dlm_add_callback, may cause lkb to be freed */</div><div class='del'>-	dlm_put_lkb(lkb);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_cb_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int dlm_callback_start(struct dlm_ls *ls)</div><div class='ctx'> {</div><div class='del'>-	ls-&gt;ls_callback_wq = alloc_workqueue("dlm_callback",</div><div class='del'>-					     WQ_HIGHPRI | WQ_MEM_RECLAIM, 0);</div><div class='add'>+	if (!test_bit(LSFL_FS, &amp;ls-&gt;ls_flags) ||</div><div class='add'>+	    test_bit(LSFL_SOFTIRQ, &amp;ls-&gt;ls_flags))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	ls-&gt;ls_callback_wq = alloc_ordered_workqueue("dlm_callback",</div><div class='add'>+						     WQ_HIGHPRI | WQ_MEM_RECLAIM);</div><div class='ctx'> 	if (!ls-&gt;ls_callback_wq) {</div><div class='ctx'> 		log_print("can't start dlm_callback workqueue");</div><div class='ctx'> 		return -ENOMEM;</div><div class='hunk'>@@ -284,7 +222,12 @@ void dlm_callback_stop(struct dlm_ls *ls)</div><div class='ctx'> </div><div class='ctx'> void dlm_callback_suspend(struct dlm_ls *ls)</div><div class='ctx'> {</div><div class='add'>+	if (!test_bit(LSFL_FS, &amp;ls-&gt;ls_flags))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_cb_lock);</div><div class='ctx'> 	set_bit(LSFL_CB_DELAY, &amp;ls-&gt;ls_flags);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_cb_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (ls-&gt;ls_callback_wq)</div><div class='ctx'> 		flush_workqueue(ls-&gt;ls_callback_wq);</div><div class='hunk'>@@ -294,31 +237,39 @@ void dlm_callback_suspend(struct dlm_ls *ls)</div><div class='ctx'> </div><div class='ctx'> void dlm_callback_resume(struct dlm_ls *ls)</div><div class='ctx'> {</div><div class='del'>-	struct dlm_lkb *lkb, *safe;</div><div class='del'>-	int count = 0;</div><div class='add'>+	struct dlm_callback *cb, *safe;</div><div class='add'>+	int count = 0, sum = 0;</div><div class='add'>+	bool empty;</div><div class='ctx'> </div><div class='del'>-	clear_bit(LSFL_CB_DELAY, &amp;ls-&gt;ls_flags);</div><div class='del'>-</div><div class='del'>-	if (!ls-&gt;ls_callback_wq)</div><div class='add'>+	if (!test_bit(LSFL_FS, &amp;ls-&gt;ls_flags))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> more:</div><div class='del'>-	mutex_lock(&amp;ls-&gt;ls_cb_mutex);</div><div class='del'>-	list_for_each_entry_safe(lkb, safe, &amp;ls-&gt;ls_cb_delay, lkb_cb_list) {</div><div class='del'>-		list_del_init(&amp;lkb-&gt;lkb_cb_list);</div><div class='del'>-		queue_work(ls-&gt;ls_callback_wq, &amp;lkb-&gt;lkb_cb_work);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_cb_lock);</div><div class='add'>+	list_for_each_entry_safe(cb, safe, &amp;ls-&gt;ls_cb_delay, list) {</div><div class='add'>+		list_del(&amp;cb-&gt;list);</div><div class='add'>+		if (test_bit(LSFL_SOFTIRQ, &amp;ls-&gt;ls_flags))</div><div class='add'>+			dlm_do_callback(cb);</div><div class='add'>+		else</div><div class='add'>+			queue_work(ls-&gt;ls_callback_wq, &amp;cb-&gt;work);</div><div class='add'>+</div><div class='ctx'> 		count++;</div><div class='ctx'> 		if (count == MAX_CB_QUEUE)</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='del'>-	mutex_unlock(&amp;ls-&gt;ls_cb_mutex);</div><div class='add'>+	empty = list_empty(&amp;ls-&gt;ls_cb_delay);</div><div class='add'>+	if (empty)</div><div class='add'>+		clear_bit(LSFL_CB_DELAY, &amp;ls-&gt;ls_flags);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_cb_lock);</div><div class='ctx'> </div><div class='del'>-	if (count)</div><div class='del'>-		log_rinfo(ls, "dlm_callback_resume %d", count);</div><div class='del'>-	if (count == MAX_CB_QUEUE) {</div><div class='add'>+	sum += count;</div><div class='add'>+	if (!empty) {</div><div class='ctx'> 		count = 0;</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 		goto more;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	if (sum)</div><div class='add'>+		log_rinfo(ls, "%s %d", __func__, sum);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/dlm/ast.h b/fs/dlm/ast.h<br/>index 181ad7d20c4d..e2b86845d331 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/ast.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/ast.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/ast.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/ast.h</a></div><div class='hunk'>@@ -11,15 +11,14 @@</div><div class='ctx'> #ifndef __ASTD_DOT_H__</div><div class='ctx'> #define __ASTD_DOT_H__</div><div class='ctx'> </div><div class='del'>-void dlm_del_ast(struct dlm_lkb *lkb);</div><div class='del'>-int dlm_add_lkb_callback(struct dlm_lkb *lkb, uint32_t flags, int mode,</div><div class='del'>-                         int status, uint32_t sbflags, uint64_t seq);</div><div class='del'>-int dlm_rem_lkb_callback(struct dlm_ls *ls, struct dlm_lkb *lkb,</div><div class='del'>-                         struct dlm_callback *cb, int *resid);</div><div class='add'>+bool dlm_may_skip_callback(struct dlm_lkb *lkb, uint32_t flags, int mode,</div><div class='add'>+			   int status, uint32_t sbflags, int *copy_lvb);</div><div class='add'>+int dlm_get_cb(struct dlm_lkb *lkb, uint32_t flags, int mode,</div><div class='add'>+	       int status, uint32_t sbflags,</div><div class='add'>+	       struct dlm_callback **cb);</div><div class='ctx'> void dlm_add_cb(struct dlm_lkb *lkb, uint32_t flags, int mode, int status,</div><div class='ctx'>                 uint32_t sbflags);</div><div class='ctx'> </div><div class='del'>-void dlm_callback_work(struct work_struct *work);</div><div class='ctx'> int dlm_callback_start(struct dlm_ls *ls);</div><div class='ctx'> void dlm_callback_stop(struct dlm_ls *ls);</div><div class='ctx'> void dlm_callback_suspend(struct dlm_ls *ls);</div><div class='head'>diff --git a/fs/dlm/config.c b/fs/dlm/config.c<br/>index 42eee2783756..a0d75b5c83c6 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/config.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/config.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/config.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/config.c</a></div><div class='hunk'>@@ -24,9 +24,10 @@</div><div class='ctx'> #include "lowcomms.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * /config/dlm/&lt;cluster&gt;/spaces/&lt;space&gt;/nodes/&lt;node&gt;/nodeid</div><div class='add'>+ * /config/dlm/&lt;cluster&gt;/spaces/&lt;space&gt;/nodes/&lt;node&gt;/nodeid (refers to &lt;node&gt;)</div><div class='ctx'>  * /config/dlm/&lt;cluster&gt;/spaces/&lt;space&gt;/nodes/&lt;node&gt;/weight</div><div class='del'>- * /config/dlm/&lt;cluster&gt;/comms/&lt;comm&gt;/nodeid</div><div class='add'>+ * /config/dlm/&lt;cluster&gt;/spaces/&lt;space&gt;/nodes/&lt;node&gt;/release_recover</div><div class='add'>+ * /config/dlm/&lt;cluster&gt;/comms/&lt;comm&gt;/nodeid (refers to &lt;comm&gt;)</div><div class='ctx'>  * /config/dlm/&lt;cluster&gt;/comms/&lt;comm&gt;/local</div><div class='ctx'>  * /config/dlm/&lt;cluster&gt;/comms/&lt;comm&gt;/addr      (write only)</div><div class='ctx'>  * /config/dlm/&lt;cluster&gt;/comms/&lt;comm&gt;/addr_list (read only)</div><div class='hunk'>@@ -63,24 +64,16 @@ static void release_node(struct config_item *);</div><div class='ctx'> static struct configfs_attribute *comm_attrs[];</div><div class='ctx'> static struct configfs_attribute *node_attrs[];</div><div class='ctx'> </div><div class='add'>+const struct rhashtable_params dlm_rhash_rsb_params = {</div><div class='add'>+	.nelem_hint = 3, /* start small */</div><div class='add'>+	.key_len = DLM_RESNAME_MAXLEN,</div><div class='add'>+	.key_offset = offsetof(struct dlm_rsb, res_name),</div><div class='add'>+	.head_offset = offsetof(struct dlm_rsb, res_node),</div><div class='add'>+	.automatic_shrinking = true,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> struct dlm_cluster {</div><div class='ctx'> 	struct config_group group;</div><div class='del'>-	unsigned int cl_tcp_port;</div><div class='del'>-	unsigned int cl_buffer_size;</div><div class='del'>-	unsigned int cl_rsbtbl_size;</div><div class='del'>-	unsigned int cl_recover_timer;</div><div class='del'>-	unsigned int cl_toss_secs;</div><div class='del'>-	unsigned int cl_scan_secs;</div><div class='del'>-	unsigned int cl_log_debug;</div><div class='del'>-	unsigned int cl_log_info;</div><div class='del'>-	unsigned int cl_protocol;</div><div class='del'>-	unsigned int cl_mark;</div><div class='del'>-	unsigned int cl_timewarn_cs;</div><div class='del'>-	unsigned int cl_waitwarn_us;</div><div class='del'>-	unsigned int cl_new_rsb_count;</div><div class='del'>-	unsigned int cl_recover_callbacks;</div><div class='del'>-	char cl_cluster_name[DLM_LOCKSPACE_LEN];</div><div class='del'>-</div><div class='ctx'> 	struct dlm_spaces *sps;</div><div class='ctx'> 	struct dlm_comms *cms;</div><div class='ctx'> };</div><div class='hunk'>@@ -102,8 +95,6 @@ enum {</div><div class='ctx'> 	CLUSTER_ATTR_LOG_INFO,</div><div class='ctx'> 	CLUSTER_ATTR_PROTOCOL,</div><div class='ctx'> 	CLUSTER_ATTR_MARK,</div><div class='del'>-	CLUSTER_ATTR_TIMEWARN_CS,</div><div class='del'>-	CLUSTER_ATTR_WAITWARN_US,</div><div class='ctx'> 	CLUSTER_ATTR_NEW_RSB_COUNT,</div><div class='ctx'> 	CLUSTER_ATTR_RECOVER_CALLBACKS,</div><div class='ctx'> 	CLUSTER_ATTR_CLUSTER_NAME,</div><div class='hunk'>@@ -111,25 +102,60 @@ enum {</div><div class='ctx'> </div><div class='ctx'> static ssize_t cluster_cluster_name_show(struct config_item *item, char *buf)</div><div class='ctx'> {</div><div class='del'>-	struct dlm_cluster *cl = config_item_to_cluster(item);</div><div class='del'>-	return sprintf(buf, "%s\n", cl-&gt;cl_cluster_name);</div><div class='add'>+	return sprintf(buf, "%s\n", dlm_config.ci_cluster_name);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t cluster_cluster_name_store(struct config_item *item,</div><div class='ctx'> 					  const char *buf, size_t len)</div><div class='ctx'> {</div><div class='del'>-	struct dlm_cluster *cl = config_item_to_cluster(item);</div><div class='del'>-</div><div class='del'>-	strlcpy(dlm_config.ci_cluster_name, buf,</div><div class='del'>-				sizeof(dlm_config.ci_cluster_name));</div><div class='del'>-	strlcpy(cl-&gt;cl_cluster_name, buf, sizeof(cl-&gt;cl_cluster_name));</div><div class='add'>+	strscpy(dlm_config.ci_cluster_name, buf,</div><div class='add'>+		sizeof(dlm_config.ci_cluster_name));</div><div class='ctx'> 	return len;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> CONFIGFS_ATTR(cluster_, cluster_name);</div><div class='ctx'> </div><div class='del'>-static ssize_t cluster_set(struct dlm_cluster *cl, unsigned int *cl_field,</div><div class='del'>-			   int *info_field, int (*check_cb)(unsigned int x),</div><div class='add'>+static ssize_t cluster_tcp_port_show(struct config_item *item, char *buf)</div><div class='add'>+{</div><div class='add'>+	return sprintf(buf, "%u\n", be16_to_cpu(dlm_config.ci_tcp_port));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int dlm_check_zero_and_dlm_running(unsigned int x)</div><div class='add'>+{</div><div class='add'>+	if (!x)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	if (dlm_lowcomms_is_running())</div><div class='add'>+		return -EBUSY;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t cluster_tcp_port_store(struct config_item *item,</div><div class='add'>+				      const char *buf, size_t len)</div><div class='add'>+{</div><div class='add'>+	int rc;</div><div class='add'>+	u16 x;</div><div class='add'>+</div><div class='add'>+	if (!capable(CAP_SYS_ADMIN))</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	rc = kstrtou16(buf, 0, &amp;x);</div><div class='add'>+	if (rc)</div><div class='add'>+		return rc;</div><div class='add'>+</div><div class='add'>+	rc = dlm_check_zero_and_dlm_running(x);</div><div class='add'>+	if (rc)</div><div class='add'>+		return rc;</div><div class='add'>+</div><div class='add'>+	dlm_config.ci_tcp_port = cpu_to_be16(x);</div><div class='add'>+	return len;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+CONFIGFS_ATTR(cluster_, tcp_port);</div><div class='add'>+</div><div class='add'>+static ssize_t cluster_set(unsigned int *info_field,</div><div class='add'>+			   int (*check_cb)(unsigned int x),</div><div class='ctx'> 			   const char *buf, size_t len)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int x;</div><div class='hunk'>@@ -147,7 +173,6 @@ static ssize_t cluster_set(struct dlm_cluster *cl, unsigned int *cl_field,</div><div class='ctx'> 			return rc;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	*cl_field = x;</div><div class='ctx'> 	*info_field = x;</div><div class='ctx'> </div><div class='ctx'> 	return len;</div><div class='hunk'>@@ -157,14 +182,11 @@ static ssize_t cluster_set(struct dlm_cluster *cl, unsigned int *cl_field,</div><div class='ctx'> static ssize_t cluster_##name##_store(struct config_item *item, \</div><div class='ctx'> 		const char *buf, size_t len) \</div><div class='ctx'> {                                                                             \</div><div class='del'>-	struct dlm_cluster *cl = config_item_to_cluster(item);		      \</div><div class='del'>-	return cluster_set(cl, &amp;cl-&gt;cl_##name, &amp;dlm_config.ci_##name,         \</div><div class='del'>-			   check_cb, buf, len);                               \</div><div class='add'>+	return cluster_set(&amp;dlm_config.ci_##name, check_cb, buf, len);        \</div><div class='ctx'> }                                                                             \</div><div class='ctx'> static ssize_t cluster_##name##_show(struct config_item *item, char *buf)     \</div><div class='ctx'> {                                                                             \</div><div class='del'>-	struct dlm_cluster *cl = config_item_to_cluster(item);		      \</div><div class='del'>-	return snprintf(buf, PAGE_SIZE, "%u\n", cl-&gt;cl_##name);               \</div><div class='add'>+	return snprintf(buf, PAGE_SIZE, "%u\n", dlm_config.ci_##name);        \</div><div class='ctx'> }                                                                             \</div><div class='ctx'> CONFIGFS_ATTR(cluster_, name);</div><div class='ctx'> </div><div class='hunk'>@@ -176,23 +198,15 @@ static int dlm_check_protocol_and_dlm_running(unsigned int x)</div><div class='ctx'> 		break;</div><div class='ctx'> 	case 1:</div><div class='ctx'> 		/* SCTP */</div><div class='add'>+		if (!IS_ENABLED(CONFIG_IP_SCTP))</div><div class='add'>+			return -EOPNOTSUPP;</div><div class='add'>+</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (dlm_allow_conn)</div><div class='del'>-		return -EBUSY;</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int dlm_check_zero_and_dlm_running(unsigned int x)</div><div class='del'>-{</div><div class='del'>-	if (!x)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	if (dlm_allow_conn)</div><div class='add'>+	if (dlm_lowcomms_is_running())</div><div class='ctx'> 		return -EBUSY;</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -214,7 +228,6 @@ static int dlm_check_buffer_size(unsigned int x)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-CLUSTER_ATTR(tcp_port, dlm_check_zero_and_dlm_running);</div><div class='ctx'> CLUSTER_ATTR(buffer_size, dlm_check_buffer_size);</div><div class='ctx'> CLUSTER_ATTR(rsbtbl_size, dlm_check_zero);</div><div class='ctx'> CLUSTER_ATTR(recover_timer, dlm_check_zero);</div><div class='hunk'>@@ -224,8 +237,6 @@ CLUSTER_ATTR(log_debug, NULL);</div><div class='ctx'> CLUSTER_ATTR(log_info, NULL);</div><div class='ctx'> CLUSTER_ATTR(protocol, dlm_check_protocol_and_dlm_running);</div><div class='ctx'> CLUSTER_ATTR(mark, NULL);</div><div class='del'>-CLUSTER_ATTR(timewarn_cs, dlm_check_zero);</div><div class='del'>-CLUSTER_ATTR(waitwarn_us, NULL);</div><div class='ctx'> CLUSTER_ATTR(new_rsb_count, NULL);</div><div class='ctx'> CLUSTER_ATTR(recover_callbacks, NULL);</div><div class='ctx'> </div><div class='hunk'>@@ -240,8 +251,6 @@ static struct configfs_attribute *cluster_attrs[] = {</div><div class='ctx'> 	[CLUSTER_ATTR_LOG_INFO] = &amp;cluster_attr_log_info,</div><div class='ctx'> 	[CLUSTER_ATTR_PROTOCOL] = &amp;cluster_attr_protocol,</div><div class='ctx'> 	[CLUSTER_ATTR_MARK] = &amp;cluster_attr_mark,</div><div class='del'>-	[CLUSTER_ATTR_TIMEWARN_CS] = &amp;cluster_attr_timewarn_cs,</div><div class='del'>-	[CLUSTER_ATTR_WAITWARN_US] = &amp;cluster_attr_waitwarn_us,</div><div class='ctx'> 	[CLUSTER_ATTR_NEW_RSB_COUNT] = &amp;cluster_attr_new_rsb_count,</div><div class='ctx'> 	[CLUSTER_ATTR_RECOVER_CALLBACKS] = &amp;cluster_attr_recover_callbacks,</div><div class='ctx'> 	[CLUSTER_ATTR_CLUSTER_NAME] = &amp;cluster_attr_cluster_name,</div><div class='hunk'>@@ -259,6 +268,7 @@ enum {</div><div class='ctx'> enum {</div><div class='ctx'> 	NODE_ATTR_NODEID = 0,</div><div class='ctx'> 	NODE_ATTR_WEIGHT,</div><div class='add'>+	NODE_ATTR_RELEASE_RECOVER,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct dlm_clusters {</div><div class='hunk'>@@ -272,6 +282,8 @@ struct dlm_spaces {</div><div class='ctx'> struct dlm_space {</div><div class='ctx'> 	struct config_group group;</div><div class='ctx'> 	struct list_head members;</div><div class='add'>+	struct list_head members_gone;</div><div class='add'>+	int members_gone_count;</div><div class='ctx'> 	struct mutex members_lock;</div><div class='ctx'> 	int members_count;</div><div class='ctx'> 	struct dlm_nodes *nds;</div><div class='hunk'>@@ -302,6 +314,14 @@ struct dlm_node {</div><div class='ctx'> 	int weight;</div><div class='ctx'> 	int new;</div><div class='ctx'> 	int comm_seq; /* copy of cm-&gt;seq when nd-&gt;nodeid is set */</div><div class='add'>+	unsigned int release_recover;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct dlm_member_gone {</div><div class='add'>+	int nodeid;</div><div class='add'>+	unsigned int release_recover;</div><div class='add'>+</div><div class='add'>+	struct list_head list; /* space-&gt;members_gone */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static struct configfs_group_operations clusters_ops = {</div><div class='hunk'>@@ -423,22 +443,6 @@ static struct config_group *make_cluster(struct config_group *g,</div><div class='ctx'> 	configfs_add_default_group(&amp;sps-&gt;ss_group, &amp;cl-&gt;group);</div><div class='ctx'> 	configfs_add_default_group(&amp;cms-&gt;cs_group, &amp;cl-&gt;group);</div><div class='ctx'> </div><div class='del'>-	cl-&gt;cl_tcp_port = dlm_config.ci_tcp_port;</div><div class='del'>-	cl-&gt;cl_buffer_size = dlm_config.ci_buffer_size;</div><div class='del'>-	cl-&gt;cl_rsbtbl_size = dlm_config.ci_rsbtbl_size;</div><div class='del'>-	cl-&gt;cl_recover_timer = dlm_config.ci_recover_timer;</div><div class='del'>-	cl-&gt;cl_toss_secs = dlm_config.ci_toss_secs;</div><div class='del'>-	cl-&gt;cl_scan_secs = dlm_config.ci_scan_secs;</div><div class='del'>-	cl-&gt;cl_log_debug = dlm_config.ci_log_debug;</div><div class='del'>-	cl-&gt;cl_log_info = dlm_config.ci_log_info;</div><div class='del'>-	cl-&gt;cl_protocol = dlm_config.ci_protocol;</div><div class='del'>-	cl-&gt;cl_timewarn_cs = dlm_config.ci_timewarn_cs;</div><div class='del'>-	cl-&gt;cl_waitwarn_us = dlm_config.ci_waitwarn_us;</div><div class='del'>-	cl-&gt;cl_new_rsb_count = dlm_config.ci_new_rsb_count;</div><div class='del'>-	cl-&gt;cl_recover_callbacks = dlm_config.ci_recover_callbacks;</div><div class='del'>-	memcpy(cl-&gt;cl_cluster_name, dlm_config.ci_cluster_name,</div><div class='del'>-	       DLM_LOCKSPACE_LEN);</div><div class='del'>-</div><div class='ctx'> 	space_list = &amp;sps-&gt;ss_group;</div><div class='ctx'> 	comm_list = &amp;cms-&gt;cs_group;</div><div class='ctx'> 	return &amp;cl-&gt;group;</div><div class='hunk'>@@ -488,6 +492,7 @@ static struct config_group *make_space(struct config_group *g, const char *name)</div><div class='ctx'> 	configfs_add_default_group(&amp;nds-&gt;ns_group, &amp;sp-&gt;group);</div><div class='ctx'> </div><div class='ctx'> 	INIT_LIST_HEAD(&amp;sp-&gt;members);</div><div class='add'>+	INIT_LIST_HEAD(&amp;sp-&gt;members_gone);</div><div class='ctx'> 	mutex_init(&amp;sp-&gt;members_lock);</div><div class='ctx'> 	sp-&gt;members_count = 0;</div><div class='ctx'> 	sp-&gt;nds = nds;</div><div class='hunk'>@@ -519,6 +524,12 @@ static void release_space(struct config_item *i)</div><div class='ctx'> static struct config_item *make_comm(struct config_group *g, const char *name)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_comm *cm;</div><div class='add'>+	unsigned int nodeid;</div><div class='add'>+	int rv;</div><div class='add'>+</div><div class='add'>+	rv = kstrtouint(name, 0, &amp;nodeid);</div><div class='add'>+	if (rv)</div><div class='add'>+		return ERR_PTR(rv);</div><div class='ctx'> </div><div class='ctx'> 	cm = kzalloc(sizeof(struct dlm_comm), GFP_NOFS);</div><div class='ctx'> 	if (!cm)</div><div class='hunk'>@@ -530,7 +541,7 @@ static struct config_item *make_comm(struct config_group *g, const char *name)</div><div class='ctx'> 	if (!cm-&gt;seq)</div><div class='ctx'> 		cm-&gt;seq = dlm_comm_count++;</div><div class='ctx'> </div><div class='del'>-	cm-&gt;nodeid = -1;</div><div class='add'>+	cm-&gt;nodeid = nodeid;</div><div class='ctx'> 	cm-&gt;local = 0;</div><div class='ctx'> 	cm-&gt;addr_count = 0;</div><div class='ctx'> 	cm-&gt;mark = 0;</div><div class='hunk'>@@ -557,16 +568,25 @@ static void release_comm(struct config_item *i)</div><div class='ctx'> static struct config_item *make_node(struct config_group *g, const char *name)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_space *sp = config_item_to_space(g-&gt;cg_item.ci_parent);</div><div class='add'>+	unsigned int nodeid;</div><div class='ctx'> 	struct dlm_node *nd;</div><div class='add'>+	uint32_t seq = 0;</div><div class='add'>+	int rv;</div><div class='add'>+</div><div class='add'>+	rv = kstrtouint(name, 0, &amp;nodeid);</div><div class='add'>+	if (rv)</div><div class='add'>+		return ERR_PTR(rv);</div><div class='ctx'> </div><div class='ctx'> 	nd = kzalloc(sizeof(struct dlm_node), GFP_NOFS);</div><div class='ctx'> 	if (!nd)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='ctx'> 	config_item_init_type_name(&amp;nd-&gt;item, name, &amp;node_type);</div><div class='del'>-	nd-&gt;nodeid = -1;</div><div class='add'>+	nd-&gt;nodeid = nodeid;</div><div class='ctx'> 	nd-&gt;weight = 1;  /* default weight of 1 if none is set */</div><div class='ctx'> 	nd-&gt;new = 1;     /* set to 0 once it's been read by dlm_nodeid_list() */</div><div class='add'>+	dlm_comm_seq(nodeid, &amp;seq, true);</div><div class='add'>+	nd-&gt;comm_seq = seq;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;sp-&gt;members_lock);</div><div class='ctx'> 	list_add(&amp;nd-&gt;list, &amp;sp-&gt;members);</div><div class='hunk'>@@ -580,10 +600,20 @@ static void drop_node(struct config_group *g, struct config_item *i)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_space *sp = config_item_to_space(g-&gt;cg_item.ci_parent);</div><div class='ctx'> 	struct dlm_node *nd = config_item_to_node(i);</div><div class='add'>+	struct dlm_member_gone *mb_gone;</div><div class='add'>+</div><div class='add'>+	mb_gone = kzalloc(sizeof(*mb_gone), GFP_KERNEL);</div><div class='add'>+	if (!mb_gone)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;sp-&gt;members_lock);</div><div class='ctx'> 	list_del(&amp;nd-&gt;list);</div><div class='ctx'> 	sp-&gt;members_count--;</div><div class='add'>+</div><div class='add'>+	mb_gone-&gt;nodeid = nd-&gt;nodeid;</div><div class='add'>+	mb_gone-&gt;release_recover = nd-&gt;release_recover;</div><div class='add'>+	list_add(&amp;mb_gone-&gt;list, &amp;sp-&gt;members_gone);</div><div class='add'>+	sp-&gt;members_gone_count++;</div><div class='ctx'> 	mutex_unlock(&amp;sp-&gt;members_lock);</div><div class='ctx'> </div><div class='ctx'> 	config_item_put(i);</div><div class='hunk'>@@ -624,16 +654,19 @@ void dlm_config_exit(void)</div><div class='ctx'> </div><div class='ctx'> static ssize_t comm_nodeid_show(struct config_item *item, char *buf)</div><div class='ctx'> {</div><div class='del'>-	return sprintf(buf, "%d\n", config_item_to_comm(item)-&gt;nodeid);</div><div class='add'>+	unsigned int nodeid;</div><div class='add'>+	int rv;</div><div class='add'>+</div><div class='add'>+	rv = kstrtouint(config_item_name(item), 0, &amp;nodeid);</div><div class='add'>+	if (WARN_ON(rv))</div><div class='add'>+		return rv;</div><div class='add'>+</div><div class='add'>+	return sprintf(buf, "%u\n", nodeid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t comm_nodeid_store(struct config_item *item, const char *buf,</div><div class='ctx'> 				 size_t len)</div><div class='ctx'> {</div><div class='del'>-	int rc = kstrtoint(buf, 0, &amp;config_item_to_comm(item)-&gt;nodeid);</div><div class='del'>-</div><div class='del'>-	if (rc)</div><div class='del'>-		return rc;</div><div class='ctx'> 	return len;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -674,7 +707,7 @@ static ssize_t comm_addr_store(struct config_item *item, const char *buf,</div><div class='ctx'> </div><div class='ctx'> 	memcpy(addr, buf, len);</div><div class='ctx'> </div><div class='del'>-	rv = dlm_lowcomms_addr(cm-&gt;nodeid, addr, len);</div><div class='add'>+	rv = dlm_midcomms_addr(cm-&gt;nodeid, addr);</div><div class='ctx'> 	if (rv) {</div><div class='ctx'> 		kfree(addr);</div><div class='ctx'> 		return rv;</div><div class='hunk'>@@ -774,20 +807,19 @@ static struct configfs_attribute *comm_attrs[] = {</div><div class='ctx'> </div><div class='ctx'> static ssize_t node_nodeid_show(struct config_item *item, char *buf)</div><div class='ctx'> {</div><div class='del'>-	return sprintf(buf, "%d\n", config_item_to_node(item)-&gt;nodeid);</div><div class='add'>+	unsigned int nodeid;</div><div class='add'>+	int rv;</div><div class='add'>+</div><div class='add'>+	rv = kstrtouint(config_item_name(item), 0, &amp;nodeid);</div><div class='add'>+	if (WARN_ON(rv))</div><div class='add'>+		return rv;</div><div class='add'>+</div><div class='add'>+	return sprintf(buf, "%u\n", nodeid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t node_nodeid_store(struct config_item *item, const char *buf,</div><div class='ctx'> 				 size_t len)</div><div class='ctx'> {</div><div class='del'>-	struct dlm_node *nd = config_item_to_node(item);</div><div class='del'>-	uint32_t seq = 0;</div><div class='del'>-	int rc = kstrtoint(buf, 0, &amp;nd-&gt;nodeid);</div><div class='del'>-</div><div class='del'>-	if (rc)</div><div class='del'>-		return rc;</div><div class='del'>-	dlm_comm_seq(nd-&gt;nodeid, &amp;seq);</div><div class='del'>-	nd-&gt;comm_seq = seq;</div><div class='ctx'> 	return len;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -806,12 +838,34 @@ static ssize_t node_weight_store(struct config_item *item, const char *buf,</div><div class='ctx'> 	return len;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static ssize_t node_release_recover_show(struct config_item *item, char *buf)</div><div class='add'>+{</div><div class='add'>+	struct dlm_node *n = config_item_to_node(item);</div><div class='add'>+</div><div class='add'>+	return sprintf(buf, "%u\n", n-&gt;release_recover);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t node_release_recover_store(struct config_item *item,</div><div class='add'>+					  const char *buf, size_t len)</div><div class='add'>+{</div><div class='add'>+	struct dlm_node *n = config_item_to_node(item);</div><div class='add'>+	int rc;</div><div class='add'>+</div><div class='add'>+	rc = kstrtouint(buf, 0, &amp;n-&gt;release_recover);</div><div class='add'>+	if (rc)</div><div class='add'>+		return rc;</div><div class='add'>+</div><div class='add'>+	return len;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> CONFIGFS_ATTR(node_, nodeid);</div><div class='ctx'> CONFIGFS_ATTR(node_, weight);</div><div class='add'>+CONFIGFS_ATTR(node_, release_recover);</div><div class='ctx'> </div><div class='ctx'> static struct configfs_attribute *node_attrs[] = {</div><div class='ctx'> 	[NODE_ATTR_NODEID] = &amp;node_attr_nodeid,</div><div class='ctx'> 	[NODE_ATTR_WEIGHT] = &amp;node_attr_weight,</div><div class='add'>+	[NODE_ATTR_RELEASE_RECOVER] = &amp;node_attr_release_recover,</div><div class='ctx'> 	NULL,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -847,7 +901,7 @@ static struct dlm_comm *get_comm(int nodeid)</div><div class='ctx'> 	if (!comm_list)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;clusters_root.subsys.su_mutex);</div><div class='add'>+	WARN_ON_ONCE(!mutex_is_locked(&amp;clusters_root.subsys.su_mutex));</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(i, &amp;comm_list-&gt;cg_children, ci_entry) {</div><div class='ctx'> 		cm = config_item_to_comm(i);</div><div class='hunk'>@@ -858,7 +912,6 @@ static struct dlm_comm *get_comm(int nodeid)</div><div class='ctx'> 		config_item_get(i);</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='del'>-	mutex_unlock(&amp;clusters_root.subsys.su_mutex);</div><div class='ctx'> </div><div class='ctx'> 	if (!found)</div><div class='ctx'> 		cm = NULL;</div><div class='hunk'>@@ -874,9 +927,10 @@ static void put_comm(struct dlm_comm *cm)</div><div class='ctx'> int dlm_config_nodes(char *lsname, struct dlm_config_node **nodes_out,</div><div class='ctx'> 		     int *count_out)</div><div class='ctx'> {</div><div class='add'>+	struct dlm_member_gone *mb_gone, *mb_safe;</div><div class='add'>+	struct dlm_config_node *nodes, *node;</div><div class='ctx'> 	struct dlm_space *sp;</div><div class='ctx'> 	struct dlm_node *nd;</div><div class='del'>-	struct dlm_config_node *nodes, *node;</div><div class='ctx'> 	int rv, count;</div><div class='ctx'> </div><div class='ctx'> 	sp = get_space(lsname);</div><div class='hunk'>@@ -890,7 +944,7 @@ int dlm_config_nodes(char *lsname, struct dlm_config_node **nodes_out,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	count = sp-&gt;members_count;</div><div class='add'>+	count = sp-&gt;members_count + sp-&gt;members_gone_count;</div><div class='ctx'> </div><div class='ctx'> 	nodes = kcalloc(count, sizeof(struct dlm_config_node), GFP_NOFS);</div><div class='ctx'> 	if (!nodes) {</div><div class='hunk'>@@ -909,6 +963,20 @@ int dlm_config_nodes(char *lsname, struct dlm_config_node **nodes_out,</div><div class='ctx'> 		nd-&gt;new = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/* we delay the remove on nodes until here as configfs does</div><div class='add'>+	 * not support addtional attributes for rmdir().</div><div class='add'>+	 */</div><div class='add'>+	list_for_each_entry_safe(mb_gone, mb_safe, &amp;sp-&gt;members_gone, list) {</div><div class='add'>+		node-&gt;nodeid = mb_gone-&gt;nodeid;</div><div class='add'>+		node-&gt;release_recover = mb_gone-&gt;release_recover;</div><div class='add'>+		node-&gt;gone = true;</div><div class='add'>+		node++;</div><div class='add'>+</div><div class='add'>+		list_del(&amp;mb_gone-&gt;list);</div><div class='add'>+		sp-&gt;members_gone_count--;</div><div class='add'>+		kfree(mb_gone);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	*count_out = count;</div><div class='ctx'> 	*nodes_out = nodes;</div><div class='ctx'> 	rv = 0;</div><div class='hunk'>@@ -918,11 +986,20 @@ int dlm_config_nodes(char *lsname, struct dlm_config_node **nodes_out,</div><div class='ctx'> 	return rv;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int dlm_comm_seq(int nodeid, uint32_t *seq)</div><div class='add'>+int dlm_comm_seq(int nodeid, uint32_t *seq, bool locked)</div><div class='ctx'> {</div><div class='del'>-	struct dlm_comm *cm = get_comm(nodeid);</div><div class='add'>+	struct dlm_comm *cm;</div><div class='add'>+</div><div class='add'>+	if (locked) {</div><div class='add'>+		cm = get_comm(nodeid);</div><div class='add'>+	} else {</div><div class='add'>+		mutex_lock(&amp;clusters_root.subsys.su_mutex);</div><div class='add'>+		cm = get_comm(nodeid);</div><div class='add'>+		mutex_unlock(&amp;clusters_root.subsys.su_mutex);</div><div class='add'>+	}</div><div class='ctx'> 	if (!cm)</div><div class='del'>-		return -EEXIST;</div><div class='add'>+		return -ENOENT;</div><div class='add'>+</div><div class='ctx'> 	*seq = cm-&gt;seq;</div><div class='ctx'> 	put_comm(cm);</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -930,7 +1007,7 @@ int dlm_comm_seq(int nodeid, uint32_t *seq)</div><div class='ctx'> </div><div class='ctx'> int dlm_our_nodeid(void)</div><div class='ctx'> {</div><div class='del'>-	return local_comm ? local_comm-&gt;nodeid : 0;</div><div class='add'>+	return local_comm-&gt;nodeid;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* num 0 is first addr, num 1 is second addr */</div><div class='hunk'>@@ -954,14 +1031,12 @@ int dlm_our_addr(struct sockaddr_storage *addr, int num)</div><div class='ctx'> #define DEFAULT_LOG_INFO           1</div><div class='ctx'> #define DEFAULT_PROTOCOL           DLM_PROTO_TCP</div><div class='ctx'> #define DEFAULT_MARK               0</div><div class='del'>-#define DEFAULT_TIMEWARN_CS      500 /* 5 sec = 500 centiseconds */</div><div class='del'>-#define DEFAULT_WAITWARN_US	   0</div><div class='ctx'> #define DEFAULT_NEW_RSB_COUNT    128</div><div class='ctx'> #define DEFAULT_RECOVER_CALLBACKS  0</div><div class='ctx'> #define DEFAULT_CLUSTER_NAME      ""</div><div class='ctx'> </div><div class='ctx'> struct dlm_config_info dlm_config = {</div><div class='del'>-	.ci_tcp_port = DEFAULT_TCP_PORT,</div><div class='add'>+	.ci_tcp_port = cpu_to_be16(DEFAULT_TCP_PORT),</div><div class='ctx'> 	.ci_buffer_size = DLM_MAX_SOCKET_BUFSIZE,</div><div class='ctx'> 	.ci_rsbtbl_size = DEFAULT_RSBTBL_SIZE,</div><div class='ctx'> 	.ci_recover_timer = DEFAULT_RECOVER_TIMER,</div><div class='hunk'>@@ -971,8 +1046,6 @@ struct dlm_config_info dlm_config = {</div><div class='ctx'> 	.ci_log_info = DEFAULT_LOG_INFO,</div><div class='ctx'> 	.ci_protocol = DEFAULT_PROTOCOL,</div><div class='ctx'> 	.ci_mark = DEFAULT_MARK,</div><div class='del'>-	.ci_timewarn_cs = DEFAULT_TIMEWARN_CS,</div><div class='del'>-	.ci_waitwarn_us = DEFAULT_WAITWARN_US,</div><div class='ctx'> 	.ci_new_rsb_count = DEFAULT_NEW_RSB_COUNT,</div><div class='ctx'> 	.ci_recover_callbacks = DEFAULT_RECOVER_CALLBACKS,</div><div class='ctx'> 	.ci_cluster_name = DEFAULT_CLUSTER_NAME</div><div class='head'>diff --git a/fs/dlm/config.h b/fs/dlm/config.h<br/>index df92b0a07fc6..4ebd45f75276 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/config.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/config.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/config.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/config.h</a></div><div class='hunk'>@@ -17,30 +17,32 @@</div><div class='ctx'> struct dlm_config_node {</div><div class='ctx'> 	int nodeid;</div><div class='ctx'> 	int weight;</div><div class='add'>+	bool gone;</div><div class='ctx'> 	int new;</div><div class='ctx'> 	uint32_t comm_seq;</div><div class='add'>+	unsigned int release_recover;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-#define DLM_MAX_ADDR_COUNT 3</div><div class='add'>+extern const struct rhashtable_params dlm_rhash_rsb_params;</div><div class='add'>+</div><div class='add'>+#define DLM_MAX_ADDR_COUNT 8</div><div class='ctx'> </div><div class='ctx'> #define DLM_PROTO_TCP	0</div><div class='ctx'> #define DLM_PROTO_SCTP	1</div><div class='ctx'> </div><div class='ctx'> struct dlm_config_info {</div><div class='del'>-	int ci_tcp_port;</div><div class='del'>-	int ci_buffer_size;</div><div class='del'>-	int ci_rsbtbl_size;</div><div class='del'>-	int ci_recover_timer;</div><div class='del'>-	int ci_toss_secs;</div><div class='del'>-	int ci_scan_secs;</div><div class='del'>-	int ci_log_debug;</div><div class='del'>-	int ci_log_info;</div><div class='del'>-	int ci_protocol;</div><div class='del'>-	int ci_mark;</div><div class='del'>-	int ci_timewarn_cs;</div><div class='del'>-	int ci_waitwarn_us;</div><div class='del'>-	int ci_new_rsb_count;</div><div class='del'>-	int ci_recover_callbacks;</div><div class='add'>+	__be16 ci_tcp_port;</div><div class='add'>+	unsigned int ci_buffer_size;</div><div class='add'>+	unsigned int ci_rsbtbl_size;</div><div class='add'>+	unsigned int ci_recover_timer;</div><div class='add'>+	unsigned int ci_toss_secs;</div><div class='add'>+	unsigned int ci_scan_secs;</div><div class='add'>+	unsigned int ci_log_debug;</div><div class='add'>+	unsigned int ci_log_info;</div><div class='add'>+	unsigned int ci_protocol;</div><div class='add'>+	unsigned int ci_mark;</div><div class='add'>+	unsigned int ci_new_rsb_count;</div><div class='add'>+	unsigned int ci_recover_callbacks;</div><div class='ctx'> 	char ci_cluster_name[DLM_LOCKSPACE_LEN];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -50,7 +52,7 @@ int dlm_config_init(void);</div><div class='ctx'> void dlm_config_exit(void);</div><div class='ctx'> int dlm_config_nodes(char *lsname, struct dlm_config_node **nodes_out,</div><div class='ctx'> 		     int *count_out);</div><div class='del'>-int dlm_comm_seq(int nodeid, uint32_t *seq);</div><div class='add'>+int dlm_comm_seq(int nodeid, uint32_t *seq, bool locked);</div><div class='ctx'> int dlm_our_nodeid(void);</div><div class='ctx'> int dlm_our_addr(struct sockaddr_storage *addr, int num);</div><div class='ctx'> </div><div class='head'>diff --git a/fs/dlm/debug_fs.c b/fs/dlm/debug_fs.c<br/>index 47e9d57e4cae..700a0cbb2f14 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/debug_fs.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/debug_fs.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/debug_fs.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/debug_fs.c</a></div><div class='hunk'>@@ -18,6 +18,7 @@</div><div class='ctx'> #include "dlm_internal.h"</div><div class='ctx'> #include "midcomms.h"</div><div class='ctx'> #include "lock.h"</div><div class='add'>+#include "ast.h"</div><div class='ctx'> </div><div class='ctx'> #define DLM_DEBUG_BUF_LEN 4096</div><div class='ctx'> static char debug_buf[DLM_DEBUG_BUF_LEN];</div><div class='hunk'>@@ -170,7 +171,7 @@ static void print_format2_lock(struct seq_file *s, struct dlm_lkb *lkb,</div><div class='ctx'> 	u64 xid = 0;</div><div class='ctx'> 	u64 us;</div><div class='ctx'> </div><div class='del'>-	if (lkb-&gt;lkb_flags &amp; DLM_IFL_USER) {</div><div class='add'>+	if (test_bit(DLM_DFL_USER_BIT, &amp;lkb-&gt;lkb_dflags)) {</div><div class='ctx'> 		if (lkb-&gt;lkb_ua)</div><div class='ctx'> 			xid = lkb-&gt;lkb_ua-&gt;xid;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -188,7 +189,7 @@ static void print_format2_lock(struct seq_file *s, struct dlm_lkb *lkb,</div><div class='ctx'> 		   lkb-&gt;lkb_ownpid,</div><div class='ctx'> 		   (unsigned long long)xid,</div><div class='ctx'> 		   lkb-&gt;lkb_exflags,</div><div class='del'>-		   lkb-&gt;lkb_flags,</div><div class='add'>+		   dlm_iflags_val(lkb),</div><div class='ctx'> 		   lkb-&gt;lkb_status,</div><div class='ctx'> 		   lkb-&gt;lkb_grmode,</div><div class='ctx'> 		   lkb-&gt;lkb_rqmode,</div><div class='hunk'>@@ -230,7 +231,7 @@ static void print_format3_lock(struct seq_file *s, struct dlm_lkb *lkb,</div><div class='ctx'> {</div><div class='ctx'> 	u64 xid = 0;</div><div class='ctx'> </div><div class='del'>-	if (lkb-&gt;lkb_flags &amp; DLM_IFL_USER) {</div><div class='add'>+	if (test_bit(DLM_DFL_USER_BIT, &amp;lkb-&gt;lkb_dflags)) {</div><div class='ctx'> 		if (lkb-&gt;lkb_ua)</div><div class='ctx'> 			xid = lkb-&gt;lkb_ua-&gt;xid;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -242,11 +243,11 @@ static void print_format3_lock(struct seq_file *s, struct dlm_lkb *lkb,</div><div class='ctx'> 		   lkb-&gt;lkb_ownpid,</div><div class='ctx'> 		   (unsigned long long)xid,</div><div class='ctx'> 		   lkb-&gt;lkb_exflags,</div><div class='del'>-		   lkb-&gt;lkb_flags,</div><div class='add'>+		   dlm_iflags_val(lkb),</div><div class='ctx'> 		   lkb-&gt;lkb_status,</div><div class='ctx'> 		   lkb-&gt;lkb_grmode,</div><div class='ctx'> 		   lkb-&gt;lkb_rqmode,</div><div class='del'>-		   lkb-&gt;lkb_last_bast.mode,</div><div class='add'>+		   lkb-&gt;lkb_last_bast_cb_mode,</div><div class='ctx'> 		   rsb_lookup,</div><div class='ctx'> 		   lkb-&gt;lkb_wait_type,</div><div class='ctx'> 		   lkb-&gt;lkb_lvbseq,</div><div class='hunk'>@@ -365,12 +366,10 @@ static void print_format4(struct dlm_rsb *r, struct seq_file *s)</div><div class='ctx'> 	unlock_rsb(r);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct rsbtbl_iter {</div><div class='del'>-	struct dlm_rsb *rsb;</div><div class='del'>-	unsigned bucket;</div><div class='del'>-	int format;</div><div class='del'>-	int header;</div><div class='del'>-};</div><div class='add'>+static const struct seq_operations format1_seq_ops;</div><div class='add'>+static const struct seq_operations format2_seq_ops;</div><div class='add'>+static const struct seq_operations format3_seq_ops;</div><div class='add'>+static const struct seq_operations format4_seq_ops;</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * If the buffer is full, seq_printf can be called again, but it</div><div class='hunk'>@@ -381,197 +380,61 @@ struct rsbtbl_iter {</div><div class='ctx'> </div><div class='ctx'> static int table_seq_show(struct seq_file *seq, void *iter_ptr)</div><div class='ctx'> {</div><div class='del'>-	struct rsbtbl_iter *ri = iter_ptr;</div><div class='del'>-</div><div class='del'>-	switch (ri-&gt;format) {</div><div class='del'>-	case 1:</div><div class='del'>-		print_format1(ri-&gt;rsb, seq);</div><div class='del'>-		break;</div><div class='del'>-	case 2:</div><div class='del'>-		if (ri-&gt;header) {</div><div class='del'>-			seq_puts(seq, "id nodeid remid pid xid exflags flags sts grmode rqmode time_ms r_nodeid r_len r_name\n");</div><div class='del'>-			ri-&gt;header = 0;</div><div class='del'>-		}</div><div class='del'>-		print_format2(ri-&gt;rsb, seq);</div><div class='del'>-		break;</div><div class='del'>-	case 3:</div><div class='del'>-		if (ri-&gt;header) {</div><div class='del'>-			seq_puts(seq, "version rsb 1.1 lvb 1.1 lkb 1.1\n");</div><div class='del'>-			ri-&gt;header = 0;</div><div class='del'>-		}</div><div class='del'>-		print_format3(ri-&gt;rsb, seq);</div><div class='del'>-		break;</div><div class='del'>-	case 4:</div><div class='del'>-		if (ri-&gt;header) {</div><div class='del'>-			seq_puts(seq, "version 4 rsb 2\n");</div><div class='del'>-			ri-&gt;header = 0;</div><div class='del'>-		}</div><div class='del'>-		print_format4(ri-&gt;rsb, seq);</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='add'>+	struct dlm_rsb *rsb = list_entry(iter_ptr, struct dlm_rsb, res_slow_list);</div><div class='add'>+</div><div class='add'>+	if (seq-&gt;op == &amp;format1_seq_ops)</div><div class='add'>+		print_format1(rsb, seq);</div><div class='add'>+	else if (seq-&gt;op == &amp;format2_seq_ops)</div><div class='add'>+		print_format2(rsb, seq);</div><div class='add'>+	else if (seq-&gt;op == &amp;format3_seq_ops)</div><div class='add'>+		print_format3(rsb, seq);</div><div class='add'>+	else if (seq-&gt;op == &amp;format4_seq_ops)</div><div class='add'>+		print_format4(rsb, seq);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static const struct seq_operations format1_seq_ops;</div><div class='del'>-static const struct seq_operations format2_seq_ops;</div><div class='del'>-static const struct seq_operations format3_seq_ops;</div><div class='del'>-static const struct seq_operations format4_seq_ops;</div><div class='del'>-</div><div class='ctx'> static void *table_seq_start(struct seq_file *seq, loff_t *pos)</div><div class='ctx'> {</div><div class='del'>-	struct rb_root *tree;</div><div class='del'>-	struct rb_node *node;</div><div class='ctx'> 	struct dlm_ls *ls = seq-&gt;private;</div><div class='del'>-	struct rsbtbl_iter *ri;</div><div class='del'>-	struct dlm_rsb *r;</div><div class='del'>-	loff_t n = *pos;</div><div class='del'>-	unsigned bucket, entry;</div><div class='del'>-	int toss = (seq-&gt;op == &amp;format4_seq_ops);</div><div class='del'>-</div><div class='del'>-	bucket = n &gt;&gt; 32;</div><div class='del'>-	entry = n &amp; ((1LL &lt;&lt; 32) - 1);</div><div class='del'>-</div><div class='del'>-	if (bucket &gt;= ls-&gt;ls_rsbtbl_size)</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	ri = kzalloc(sizeof(*ri), GFP_NOFS);</div><div class='del'>-	if (!ri)</div><div class='del'>-		return NULL;</div><div class='del'>-	if (n == 0)</div><div class='del'>-		ri-&gt;header = 1;</div><div class='del'>-	if (seq-&gt;op == &amp;format1_seq_ops)</div><div class='del'>-		ri-&gt;format = 1;</div><div class='del'>-	if (seq-&gt;op == &amp;format2_seq_ops)</div><div class='del'>-		ri-&gt;format = 2;</div><div class='del'>-	if (seq-&gt;op == &amp;format3_seq_ops)</div><div class='del'>-		ri-&gt;format = 3;</div><div class='del'>-	if (seq-&gt;op == &amp;format4_seq_ops)</div><div class='del'>-		ri-&gt;format = 4;</div><div class='del'>-</div><div class='del'>-	tree = toss ? &amp;ls-&gt;ls_rsbtbl[bucket].toss : &amp;ls-&gt;ls_rsbtbl[bucket].keep;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_rsbtbl[bucket].lock);</div><div class='del'>-	if (!RB_EMPTY_ROOT(tree)) {</div><div class='del'>-		for (node = rb_first(tree); node; node = rb_next(node)) {</div><div class='del'>-			r = rb_entry(node, struct dlm_rsb, res_hashnode);</div><div class='del'>-			if (!entry--) {</div><div class='del'>-				dlm_hold_rsb(r);</div><div class='del'>-				ri-&gt;rsb = r;</div><div class='del'>-				ri-&gt;bucket = bucket;</div><div class='del'>-				spin_unlock(&amp;ls-&gt;ls_rsbtbl[bucket].lock);</div><div class='del'>-				return ri;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_rsbtbl[bucket].lock);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * move to the first rsb in the next non-empty bucket</div><div class='del'>-	 */</div><div class='add'>+	struct list_head *list;</div><div class='ctx'> </div><div class='del'>-	/* zero the entry */</div><div class='del'>-	n &amp;= ~((1LL &lt;&lt; 32) - 1);</div><div class='add'>+	if (!*pos) {</div><div class='add'>+		if (seq-&gt;op == &amp;format2_seq_ops)</div><div class='add'>+			seq_puts(seq, "id nodeid remid pid xid exflags flags sts grmode rqmode time_ms r_nodeid r_len r_name\n");</div><div class='add'>+		else if (seq-&gt;op == &amp;format3_seq_ops)</div><div class='add'>+			seq_puts(seq, "rsb ptr nodeid first_lkid flags !root_list_empty !recover_list_empty recover_locks_count len\n");</div><div class='add'>+		else if (seq-&gt;op == &amp;format4_seq_ops)</div><div class='add'>+			seq_puts(seq, "rsb ptr nodeid master_nodeid dir_nodeid our_nodeid toss_time flags len str|hex name\n");</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	while (1) {</div><div class='del'>-		bucket++;</div><div class='del'>-		n += 1LL &lt;&lt; 32;</div><div class='add'>+	if (seq-&gt;op == &amp;format4_seq_ops)</div><div class='add'>+		list = &amp;ls-&gt;ls_slow_inactive;</div><div class='add'>+	else</div><div class='add'>+		list = &amp;ls-&gt;ls_slow_active;</div><div class='ctx'> </div><div class='del'>-		if (bucket &gt;= ls-&gt;ls_rsbtbl_size) {</div><div class='del'>-			kfree(ri);</div><div class='del'>-			return NULL;</div><div class='del'>-		}</div><div class='del'>-		tree = toss ? &amp;ls-&gt;ls_rsbtbl[bucket].toss : &amp;ls-&gt;ls_rsbtbl[bucket].keep;</div><div class='del'>-</div><div class='del'>-		spin_lock(&amp;ls-&gt;ls_rsbtbl[bucket].lock);</div><div class='del'>-		if (!RB_EMPTY_ROOT(tree)) {</div><div class='del'>-			node = rb_first(tree);</div><div class='del'>-			r = rb_entry(node, struct dlm_rsb, res_hashnode);</div><div class='del'>-			dlm_hold_rsb(r);</div><div class='del'>-			ri-&gt;rsb = r;</div><div class='del'>-			ri-&gt;bucket = bucket;</div><div class='del'>-			spin_unlock(&amp;ls-&gt;ls_rsbtbl[bucket].lock);</div><div class='del'>-			*pos = n;</div><div class='del'>-			return ri;</div><div class='del'>-		}</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_rsbtbl[bucket].lock);</div><div class='del'>-	}</div><div class='add'>+	read_lock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+	return seq_list_start(list, *pos);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void *table_seq_next(struct seq_file *seq, void *iter_ptr, loff_t *pos)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_ls *ls = seq-&gt;private;</div><div class='del'>-	struct rsbtbl_iter *ri = iter_ptr;</div><div class='del'>-	struct rb_root *tree;</div><div class='del'>-	struct rb_node *next;</div><div class='del'>-	struct dlm_rsb *r, *rp;</div><div class='del'>-	loff_t n = *pos;</div><div class='del'>-	unsigned bucket;</div><div class='del'>-	int toss = (seq-&gt;op == &amp;format4_seq_ops);</div><div class='del'>-</div><div class='del'>-	bucket = n &gt;&gt; 32;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * move to the next rsb in the same bucket</div><div class='del'>-	 */</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_rsbtbl[bucket].lock);</div><div class='del'>-	rp = ri-&gt;rsb;</div><div class='del'>-	next = rb_next(&amp;rp-&gt;res_hashnode);</div><div class='del'>-</div><div class='del'>-	if (next) {</div><div class='del'>-		r = rb_entry(next, struct dlm_rsb, res_hashnode);</div><div class='del'>-		dlm_hold_rsb(r);</div><div class='del'>-		ri-&gt;rsb = r;</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_rsbtbl[bucket].lock);</div><div class='del'>-		dlm_put_rsb(rp);</div><div class='del'>-		++*pos;</div><div class='del'>-		return ri;</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_rsbtbl[bucket].lock);</div><div class='del'>-	dlm_put_rsb(rp);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * move to the first rsb in the next non-empty bucket</div><div class='del'>-	 */</div><div class='del'>-</div><div class='del'>-	/* zero the entry */</div><div class='del'>-	n &amp;= ~((1LL &lt;&lt; 32) - 1);</div><div class='add'>+	struct list_head *list;</div><div class='ctx'> </div><div class='del'>-	while (1) {</div><div class='del'>-		bucket++;</div><div class='del'>-		n += 1LL &lt;&lt; 32;</div><div class='add'>+	if (seq-&gt;op == &amp;format4_seq_ops)</div><div class='add'>+		list = &amp;ls-&gt;ls_slow_inactive;</div><div class='add'>+	else</div><div class='add'>+		list = &amp;ls-&gt;ls_slow_active;</div><div class='ctx'> </div><div class='del'>-		if (bucket &gt;= ls-&gt;ls_rsbtbl_size) {</div><div class='del'>-			kfree(ri);</div><div class='del'>-			++*pos;</div><div class='del'>-			return NULL;</div><div class='del'>-		}</div><div class='del'>-		tree = toss ? &amp;ls-&gt;ls_rsbtbl[bucket].toss : &amp;ls-&gt;ls_rsbtbl[bucket].keep;</div><div class='del'>-</div><div class='del'>-		spin_lock(&amp;ls-&gt;ls_rsbtbl[bucket].lock);</div><div class='del'>-		if (!RB_EMPTY_ROOT(tree)) {</div><div class='del'>-			next = rb_first(tree);</div><div class='del'>-			r = rb_entry(next, struct dlm_rsb, res_hashnode);</div><div class='del'>-			dlm_hold_rsb(r);</div><div class='del'>-			ri-&gt;rsb = r;</div><div class='del'>-			ri-&gt;bucket = bucket;</div><div class='del'>-			spin_unlock(&amp;ls-&gt;ls_rsbtbl[bucket].lock);</div><div class='del'>-			*pos = n;</div><div class='del'>-			return ri;</div><div class='del'>-		}</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_rsbtbl[bucket].lock);</div><div class='del'>-	}</div><div class='add'>+	return seq_list_next(iter_ptr, list, pos);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void table_seq_stop(struct seq_file *seq, void *iter_ptr)</div><div class='ctx'> {</div><div class='del'>-	struct rsbtbl_iter *ri = iter_ptr;</div><div class='add'>+	struct dlm_ls *ls = seq-&gt;private;</div><div class='ctx'> </div><div class='del'>-	if (ri) {</div><div class='del'>-		dlm_put_rsb(ri-&gt;rsb);</div><div class='del'>-		kfree(ri);</div><div class='del'>-	}</div><div class='add'>+	read_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct seq_operations format1_seq_ops = {</div><div class='hunk'>@@ -635,6 +498,35 @@ static int table_open2(struct inode *inode, struct file *file)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static ssize_t table_write2(struct file *file, const char __user *user_buf,</div><div class='add'>+			    size_t count, loff_t *ppos)</div><div class='add'>+{</div><div class='add'>+	struct seq_file *seq = file-&gt;private_data;</div><div class='add'>+	int n, len, lkb_nodeid, lkb_status, error;</div><div class='add'>+	char name[DLM_RESNAME_MAXLEN + 1] = {};</div><div class='add'>+	struct dlm_ls *ls = seq-&gt;private;</div><div class='add'>+	unsigned int lkb_flags;</div><div class='add'>+	char buf[256] = {};</div><div class='add'>+	uint32_t lkb_id;</div><div class='add'>+</div><div class='add'>+	if (copy_from_user(buf, user_buf,</div><div class='add'>+			   min_t(size_t, sizeof(buf) - 1, count)))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+</div><div class='add'>+	n = sscanf(buf, "%x %" __stringify(DLM_RESNAME_MAXLEN) "s %x %d %d",</div><div class='add'>+		   &amp;lkb_id, name, &amp;lkb_flags, &amp;lkb_nodeid, &amp;lkb_status);</div><div class='add'>+	if (n != 5)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	len = strnlen(name, DLM_RESNAME_MAXLEN);</div><div class='add'>+	error = dlm_debug_add_lkb(ls, lkb_id, name, len, lkb_flags,</div><div class='add'>+				  lkb_nodeid, lkb_status);</div><div class='add'>+	if (error)</div><div class='add'>+		return error;</div><div class='add'>+</div><div class='add'>+	return count;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int table_open3(struct inode *inode, struct file *file)</div><div class='ctx'> {</div><div class='ctx'> 	struct seq_file *seq;</div><div class='hunk'>@@ -675,6 +567,7 @@ static const struct file_operations format2_fops = {</div><div class='ctx'> 	.owner   = THIS_MODULE,</div><div class='ctx'> 	.open    = table_open2,</div><div class='ctx'> 	.read    = seq_read,</div><div class='add'>+	.write   = table_write2,</div><div class='ctx'> 	.llseek  = seq_lseek,</div><div class='ctx'> 	.release = seq_release</div><div class='ctx'> };</div><div class='hunk'>@@ -706,7 +599,13 @@ static ssize_t waiters_read(struct file *file, char __user *userbuf,</div><div class='ctx'> 	size_t len = DLM_DEBUG_BUF_LEN, pos = 0, ret, rv;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;debug_buf_lock);</div><div class='del'>-	mutex_lock(&amp;ls-&gt;ls_waiters_mutex);</div><div class='add'>+	ret = dlm_lock_recovery_try(ls);</div><div class='add'>+	if (!ret) {</div><div class='add'>+		rv = -EAGAIN;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_waiters_lock);</div><div class='ctx'> 	memset(debug_buf, 0, sizeof(debug_buf));</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(lkb, &amp;ls-&gt;ls_waiters, lkb_wait_reply) {</div><div class='hunk'>@@ -717,17 +616,49 @@ static ssize_t waiters_read(struct file *file, char __user *userbuf,</div><div class='ctx'> 			break;</div><div class='ctx'> 		pos += ret;</div><div class='ctx'> 	}</div><div class='del'>-	mutex_unlock(&amp;ls-&gt;ls_waiters_mutex);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_waiters_lock);</div><div class='add'>+	dlm_unlock_recovery(ls);</div><div class='ctx'> </div><div class='ctx'> 	rv = simple_read_from_buffer(userbuf, count, ppos, debug_buf, pos);</div><div class='add'>+out:</div><div class='ctx'> 	mutex_unlock(&amp;debug_buf_lock);</div><div class='ctx'> 	return rv;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static ssize_t waiters_write(struct file *file, const char __user *user_buf,</div><div class='add'>+			     size_t count, loff_t *ppos)</div><div class='add'>+{</div><div class='add'>+	struct dlm_ls *ls = file-&gt;private_data;</div><div class='add'>+	int mstype, to_nodeid;</div><div class='add'>+	char buf[128] = {};</div><div class='add'>+	uint32_t lkb_id;</div><div class='add'>+	int n, error;</div><div class='add'>+</div><div class='add'>+	if (copy_from_user(buf, user_buf,</div><div class='add'>+			   min_t(size_t, sizeof(buf) - 1, count)))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+</div><div class='add'>+	n = sscanf(buf, "%x %d %d", &amp;lkb_id, &amp;mstype, &amp;to_nodeid);</div><div class='add'>+	if (n != 3)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	error = dlm_lock_recovery_try(ls);</div><div class='add'>+	if (!error)</div><div class='add'>+		return -EAGAIN;</div><div class='add'>+</div><div class='add'>+	error = dlm_debug_add_lkb_to_waiters(ls, lkb_id, mstype, to_nodeid);</div><div class='add'>+	dlm_unlock_recovery(ls);</div><div class='add'>+	if (error)</div><div class='add'>+		return error;</div><div class='add'>+</div><div class='add'>+	return count;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static const struct file_operations waiters_fops = {</div><div class='ctx'> 	.owner   = THIS_MODULE,</div><div class='ctx'> 	.open    = simple_open,</div><div class='ctx'> 	.read    = waiters_read,</div><div class='add'>+	.write   = waiters_write,</div><div class='ctx'> 	.llseek  = default_llseek,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -738,6 +669,7 @@ void dlm_delete_debug_file(struct dlm_ls *ls)</div><div class='ctx'> 	debugfs_remove(ls-&gt;ls_debug_locks_dentry);</div><div class='ctx'> 	debugfs_remove(ls-&gt;ls_debug_all_dentry);</div><div class='ctx'> 	debugfs_remove(ls-&gt;ls_debug_toss_dentry);</div><div class='add'>+	debugfs_remove(ls-&gt;ls_debug_queued_asts_dentry);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int dlm_state_show(struct seq_file *file, void *offset)</div><div class='hunk'>@@ -768,6 +700,41 @@ static int dlm_version_show(struct seq_file *file, void *offset)</div><div class='ctx'> }</div><div class='ctx'> DEFINE_SHOW_ATTRIBUTE(dlm_version);</div><div class='ctx'> </div><div class='add'>+static ssize_t dlm_rawmsg_write(struct file *fp, const char __user *user_buf,</div><div class='add'>+				size_t count, loff_t *ppos)</div><div class='add'>+{</div><div class='add'>+	void *buf;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (count &gt; PAGE_SIZE || count &lt; sizeof(struct dlm_header))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	buf = kmalloc(PAGE_SIZE, GFP_NOFS);</div><div class='add'>+	if (!buf)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	if (copy_from_user(buf, user_buf, count)) {</div><div class='add'>+		ret = -EFAULT;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = dlm_midcomms_rawmsg_send(fp-&gt;private_data, buf, count);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	kfree(buf);</div><div class='add'>+	return count;</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	kfree(buf);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct file_operations dlm_rawmsg_fops = {</div><div class='add'>+	.open	= simple_open,</div><div class='add'>+	.write	= dlm_rawmsg_write,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> void *dlm_create_debug_comms_file(int nodeid, void *data)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *d_node;</div><div class='hunk'>@@ -782,6 +749,7 @@ void *dlm_create_debug_comms_file(int nodeid, void *data)</div><div class='ctx'> 	debugfs_create_file("send_queue_count", 0444, d_node, data,</div><div class='ctx'> 			    &amp;dlm_send_queue_cnt_fops);</div><div class='ctx'> 	debugfs_create_file("version", 0444, d_node, data, &amp;dlm_version_fops);</div><div class='add'>+	debugfs_create_file("rawmsg", 0200, d_node, data, &amp;dlm_rawmsg_fops);</div><div class='ctx'> </div><div class='ctx'> 	return d_node;</div><div class='ctx'> }</div><div class='hunk'>@@ -793,7 +761,8 @@ void dlm_delete_debug_comms_file(void *ctx)</div><div class='ctx'> </div><div class='ctx'> void dlm_create_debug_file(struct dlm_ls *ls)</div><div class='ctx'> {</div><div class='del'>-	char name[DLM_LOCKSPACE_LEN + 8];</div><div class='add'>+	/* Reserve enough space for the longest file name */</div><div class='add'>+	char name[DLM_LOCKSPACE_LEN + sizeof("_queued_asts")];</div><div class='ctx'> </div><div class='ctx'> 	/* format 1 */</div><div class='ctx'> </div><div class='hunk'>@@ -805,19 +774,17 @@ void dlm_create_debug_file(struct dlm_ls *ls)</div><div class='ctx'> </div><div class='ctx'> 	/* format 2 */</div><div class='ctx'> </div><div class='del'>-	memset(name, 0, sizeof(name));</div><div class='del'>-	snprintf(name, DLM_LOCKSPACE_LEN + 8, "%s_locks", ls-&gt;ls_name);</div><div class='add'>+	snprintf(name, sizeof(name), "%s_locks", ls-&gt;ls_name);</div><div class='ctx'> </div><div class='ctx'> 	ls-&gt;ls_debug_locks_dentry = debugfs_create_file(name,</div><div class='del'>-							S_IFREG | S_IRUGO,</div><div class='add'>+							0644,</div><div class='ctx'> 							dlm_root,</div><div class='ctx'> 							ls,</div><div class='ctx'> 							&amp;format2_fops);</div><div class='ctx'> </div><div class='ctx'> 	/* format 3 */</div><div class='ctx'> </div><div class='del'>-	memset(name, 0, sizeof(name));</div><div class='del'>-	snprintf(name, DLM_LOCKSPACE_LEN + 8, "%s_all", ls-&gt;ls_name);</div><div class='add'>+	snprintf(name, sizeof(name), "%s_all", ls-&gt;ls_name);</div><div class='ctx'> </div><div class='ctx'> 	ls-&gt;ls_debug_all_dentry = debugfs_create_file(name,</div><div class='ctx'> 						      S_IFREG | S_IRUGO,</div><div class='hunk'>@@ -827,8 +794,7 @@ void dlm_create_debug_file(struct dlm_ls *ls)</div><div class='ctx'> </div><div class='ctx'> 	/* format 4 */</div><div class='ctx'> </div><div class='del'>-	memset(name, 0, sizeof(name));</div><div class='del'>-	snprintf(name, DLM_LOCKSPACE_LEN + 8, "%s_toss", ls-&gt;ls_name);</div><div class='add'>+	snprintf(name, sizeof(name), "%s_toss", ls-&gt;ls_name);</div><div class='ctx'> </div><div class='ctx'> 	ls-&gt;ls_debug_toss_dentry = debugfs_create_file(name,</div><div class='ctx'> 						       S_IFREG | S_IRUGO,</div><div class='hunk'>@@ -836,11 +802,10 @@ void dlm_create_debug_file(struct dlm_ls *ls)</div><div class='ctx'> 						       ls,</div><div class='ctx'> 						       &amp;format4_fops);</div><div class='ctx'> </div><div class='del'>-	memset(name, 0, sizeof(name));</div><div class='del'>-	snprintf(name, DLM_LOCKSPACE_LEN + 8, "%s_waiters", ls-&gt;ls_name);</div><div class='add'>+	snprintf(name, sizeof(name), "%s_waiters", ls-&gt;ls_name);</div><div class='ctx'> </div><div class='ctx'> 	ls-&gt;ls_debug_waiters_dentry = debugfs_create_file(name,</div><div class='del'>-							  S_IFREG | S_IRUGO,</div><div class='add'>+							  0644,</div><div class='ctx'> 							  dlm_root,</div><div class='ctx'> 							  ls,</div><div class='ctx'> 							  &amp;waiters_fops);</div><div class='head'>diff --git a/fs/dlm/dir.c b/fs/dlm/dir.c<br/>index 45ebbe602bbf..b1ab0adbd9d0 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/dir.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/dir.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/dir.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/dir.c</a></div><div class='hunk'>@@ -47,18 +47,16 @@ int dlm_dir_nodeid(struct dlm_rsb *r)</div><div class='ctx'> 	return r-&gt;res_dir_nodeid;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void dlm_recover_dir_nodeid(struct dlm_ls *ls)</div><div class='add'>+void dlm_recover_dir_nodeid(struct dlm_ls *ls, const struct list_head *root_list)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rsb *r;</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;ls-&gt;ls_root_sem);</div><div class='del'>-	list_for_each_entry(r, &amp;ls-&gt;ls_root_list, res_root_list) {</div><div class='add'>+	list_for_each_entry(r, root_list, res_root_list) {</div><div class='ctx'> 		r-&gt;res_dir_nodeid = dlm_hash2nodeid(ls, r-&gt;res_hash);</div><div class='ctx'> 	}</div><div class='del'>-	up_read(&amp;ls-&gt;ls_root_sem);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int dlm_recover_directory(struct dlm_ls *ls)</div><div class='add'>+int dlm_recover_directory(struct dlm_ls *ls, uint64_t seq)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_member *memb;</div><div class='ctx'> 	char *b, *last_name = NULL;</div><div class='hunk'>@@ -84,14 +82,13 @@ int dlm_recover_directory(struct dlm_ls *ls)</div><div class='ctx'> </div><div class='ctx'> 		for (;;) {</div><div class='ctx'> 			int left;</div><div class='del'>-			error = dlm_recovery_stopped(ls);</div><div class='del'>-			if (error) {</div><div class='add'>+			if (dlm_recovery_stopped(ls)) {</div><div class='ctx'> 				error = -EINTR;</div><div class='ctx'> 				goto out_free;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			error = dlm_rcom_names(ls, memb-&gt;nodeid,</div><div class='del'>-					       last_name, last_len);</div><div class='add'>+					       last_name, last_len, seq);</div><div class='ctx'> 			if (error)</div><div class='ctx'> 				goto out_free;</div><div class='ctx'> </div><div class='hunk'>@@ -102,7 +99,7 @@ int dlm_recover_directory(struct dlm_ls *ls)</div><div class='ctx'> 			 */</div><div class='ctx'> </div><div class='ctx'> 			b = ls-&gt;ls_recover_buf-&gt;rc_buf;</div><div class='del'>-			left = ls-&gt;ls_recover_buf-&gt;rc_header.h_length;</div><div class='add'>+			left = le16_to_cpu(ls-&gt;ls_recover_buf-&gt;rc_header.h_length);</div><div class='ctx'> 			left -= sizeof(struct dlm_rcom);</div><div class='ctx'> </div><div class='ctx'> 			for (;;) {</div><div class='hunk'>@@ -197,70 +194,156 @@ int dlm_recover_directory(struct dlm_ls *ls)</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct dlm_rsb *find_rsb_root(struct dlm_ls *ls, char *name, int len)</div><div class='add'>+static struct dlm_rsb *find_rsb_root(struct dlm_ls *ls, const char *name,</div><div class='add'>+				     int len)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rsb *r;</div><div class='del'>-	uint32_t hash, bucket;</div><div class='ctx'> 	int rv;</div><div class='ctx'> </div><div class='del'>-	hash = jhash(name, len, 0);</div><div class='del'>-	bucket = hash &amp; (ls-&gt;ls_rsbtbl_size - 1);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_rsbtbl[bucket].lock);</div><div class='del'>-	rv = dlm_search_rsb_tree(&amp;ls-&gt;ls_rsbtbl[bucket].keep, name, len, &amp;r);</div><div class='del'>-	if (rv)</div><div class='del'>-		rv = dlm_search_rsb_tree(&amp;ls-&gt;ls_rsbtbl[bucket].toss,</div><div class='del'>-					 name, len, &amp;r);</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_rsbtbl[bucket].lock);</div><div class='del'>-</div><div class='add'>+	read_lock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+	rv = dlm_search_rsb_tree(&amp;ls-&gt;ls_rsbtbl, name, len, &amp;r);</div><div class='add'>+	read_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='ctx'> 	if (!rv)</div><div class='ctx'> 		return r;</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;ls-&gt;ls_root_sem);</div><div class='del'>-	list_for_each_entry(r, &amp;ls-&gt;ls_root_list, res_root_list) {</div><div class='add'>+	list_for_each_entry(r, &amp;ls-&gt;ls_masters_list, res_masters_list) {</div><div class='ctx'> 		if (len == r-&gt;res_length &amp;&amp; !memcmp(name, r-&gt;res_name, len)) {</div><div class='del'>-			up_read(&amp;ls-&gt;ls_root_sem);</div><div class='ctx'> 			log_debug(ls, "find_rsb_root revert to root_list %s",</div><div class='ctx'> 				  r-&gt;res_name);</div><div class='ctx'> 			return r;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	up_read(&amp;ls-&gt;ls_root_sem);</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+struct dlm_dir_dump {</div><div class='add'>+	/* init values to match if whole</div><div class='add'>+	 * dump fits to one seq. Sanity check only.</div><div class='add'>+	 */</div><div class='add'>+	uint64_t seq_init;</div><div class='add'>+	uint64_t nodeid_init;</div><div class='add'>+	/* compare local pointer with last lookup,</div><div class='add'>+	 * just a sanity check.</div><div class='add'>+	 */</div><div class='add'>+	struct list_head *last;</div><div class='add'>+</div><div class='add'>+	unsigned int sent_res; /* for log info */</div><div class='add'>+	unsigned int sent_msg; /* for log info */</div><div class='add'>+</div><div class='add'>+	struct list_head list;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static void drop_dir_ctx(struct dlm_ls *ls, int nodeid)</div><div class='add'>+{</div><div class='add'>+	struct dlm_dir_dump *dd, *safe;</div><div class='add'>+</div><div class='add'>+	write_lock_bh(&amp;ls-&gt;ls_dir_dump_lock);</div><div class='add'>+	list_for_each_entry_safe(dd, safe, &amp;ls-&gt;ls_dir_dump_list, list) {</div><div class='add'>+		if (dd-&gt;nodeid_init == nodeid) {</div><div class='add'>+			log_error(ls, "drop dump seq %llu",</div><div class='add'>+				 (unsigned long long)dd-&gt;seq_init);</div><div class='add'>+			list_del(&amp;dd-&gt;list);</div><div class='add'>+			kfree(dd);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	write_unlock_bh(&amp;ls-&gt;ls_dir_dump_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct dlm_dir_dump *lookup_dir_dump(struct dlm_ls *ls, int nodeid)</div><div class='add'>+{</div><div class='add'>+	struct dlm_dir_dump *iter, *dd = NULL;</div><div class='add'>+</div><div class='add'>+	read_lock_bh(&amp;ls-&gt;ls_dir_dump_lock);</div><div class='add'>+	list_for_each_entry(iter, &amp;ls-&gt;ls_dir_dump_list, list) {</div><div class='add'>+		if (iter-&gt;nodeid_init == nodeid) {</div><div class='add'>+			dd = iter;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	read_unlock_bh(&amp;ls-&gt;ls_dir_dump_lock);</div><div class='add'>+</div><div class='add'>+	return dd;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct dlm_dir_dump *init_dir_dump(struct dlm_ls *ls, int nodeid)</div><div class='add'>+{</div><div class='add'>+	struct dlm_dir_dump *dd;</div><div class='add'>+</div><div class='add'>+	dd = lookup_dir_dump(ls, nodeid);</div><div class='add'>+	if (dd) {</div><div class='add'>+		log_error(ls, "found ongoing dir dump for node %d, will drop it",</div><div class='add'>+			  nodeid);</div><div class='add'>+		drop_dir_ctx(ls, nodeid);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	dd = kzalloc(sizeof(*dd), GFP_ATOMIC);</div><div class='add'>+	if (!dd)</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	dd-&gt;seq_init = ls-&gt;ls_recover_seq;</div><div class='add'>+	dd-&gt;nodeid_init = nodeid;</div><div class='add'>+</div><div class='add'>+	write_lock_bh(&amp;ls-&gt;ls_dir_dump_lock);</div><div class='add'>+	list_add(&amp;dd-&gt;list, &amp;ls-&gt;ls_dir_dump_list);</div><div class='add'>+	write_unlock_bh(&amp;ls-&gt;ls_dir_dump_lock);</div><div class='add'>+</div><div class='add'>+	return dd;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /* Find the rsb where we left off (or start again), then send rsb names</div><div class='ctx'>    for rsb's we're master of and whose directory node matches the requesting</div><div class='ctx'>    node.  inbuf is the rsb name last sent, inlen is the name's length */</div><div class='ctx'> </div><div class='del'>-void dlm_copy_master_names(struct dlm_ls *ls, char *inbuf, int inlen,</div><div class='add'>+void dlm_copy_master_names(struct dlm_ls *ls, const char *inbuf, int inlen,</div><div class='ctx'>  			   char *outbuf, int outlen, int nodeid)</div><div class='ctx'> {</div><div class='ctx'> 	struct list_head *list;</div><div class='ctx'> 	struct dlm_rsb *r;</div><div class='ctx'> 	int offset = 0, dir_nodeid;</div><div class='add'>+	struct dlm_dir_dump *dd;</div><div class='ctx'> 	__be16 be_namelen;</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;ls-&gt;ls_root_sem);</div><div class='add'>+	read_lock_bh(&amp;ls-&gt;ls_masters_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (inlen &gt; 1) {</div><div class='add'>+		dd = lookup_dir_dump(ls, nodeid);</div><div class='add'>+		if (!dd) {</div><div class='add'>+			log_error(ls, "failed to lookup dir dump context nodeid: %d",</div><div class='add'>+				  nodeid);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* next chunk in dump */</div><div class='ctx'> 		r = find_rsb_root(ls, inbuf, inlen);</div><div class='ctx'> 		if (!r) {</div><div class='del'>-			inbuf[inlen - 1] = '\0';</div><div class='del'>-			log_error(ls, "copy_master_names from %d start %d %s",</div><div class='del'>-				  nodeid, inlen, inbuf);</div><div class='add'>+			log_error(ls, "copy_master_names from %d start %d %.*s",</div><div class='add'>+				  nodeid, inlen, inlen, inbuf);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		list = r-&gt;res_masters_list.next;</div><div class='add'>+</div><div class='add'>+		/* sanity checks */</div><div class='add'>+		if (dd-&gt;last != &amp;r-&gt;res_masters_list ||</div><div class='add'>+		    dd-&gt;seq_init != ls-&gt;ls_recover_seq) {</div><div class='add'>+			log_error(ls, "failed dir dump sanity check seq_init: %llu seq: %llu",</div><div class='add'>+				  (unsigned long long)dd-&gt;seq_init,</div><div class='add'>+				  (unsigned long long)ls-&gt;ls_recover_seq);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='del'>-		list = r-&gt;res_root_list.next;</div><div class='ctx'> 	} else {</div><div class='del'>-		list = ls-&gt;ls_root_list.next;</div><div class='del'>-	}</div><div class='add'>+		dd = init_dir_dump(ls, nodeid);</div><div class='add'>+		if (!dd) {</div><div class='add'>+			log_error(ls, "failed to allocate dir dump context");</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	for (offset = 0; list != &amp;ls-&gt;ls_root_list; list = list-&gt;next) {</div><div class='del'>-		r = list_entry(list, struct dlm_rsb, res_root_list);</div><div class='del'>-		if (r-&gt;res_nodeid)</div><div class='del'>-			continue;</div><div class='add'>+		/* start dump */</div><div class='add'>+		list = ls-&gt;ls_masters_list.next;</div><div class='add'>+		dd-&gt;last = list;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='add'>+	for (offset = 0; list != &amp;ls-&gt;ls_masters_list; list = list-&gt;next) {</div><div class='add'>+		r = list_entry(list, struct dlm_rsb, res_masters_list);</div><div class='ctx'> 		dir_nodeid = dlm_dir_nodeid(r);</div><div class='ctx'> 		if (dir_nodeid != nodeid)</div><div class='ctx'> 			continue;</div><div class='hunk'>@@ -278,7 +361,7 @@ void dlm_copy_master_names(struct dlm_ls *ls, char *inbuf, int inlen,</div><div class='ctx'> 			be_namelen = cpu_to_be16(0);</div><div class='ctx'> 			memcpy(outbuf + offset, &amp;be_namelen, sizeof(__be16));</div><div class='ctx'> 			offset += sizeof(__be16);</div><div class='del'>-			ls-&gt;ls_recover_dir_sent_msg++;</div><div class='add'>+			dd-&gt;sent_msg++;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -287,7 +370,8 @@ void dlm_copy_master_names(struct dlm_ls *ls, char *inbuf, int inlen,</div><div class='ctx'> 		offset += sizeof(__be16);</div><div class='ctx'> 		memcpy(outbuf + offset, r-&gt;res_name, r-&gt;res_length);</div><div class='ctx'> 		offset += r-&gt;res_length;</div><div class='del'>-		ls-&gt;ls_recover_dir_sent_res++;</div><div class='add'>+		dd-&gt;sent_res++;</div><div class='add'>+		dd-&gt;last = list;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -295,14 +379,22 @@ void dlm_copy_master_names(struct dlm_ls *ls, char *inbuf, int inlen,</div><div class='ctx'> 	 * terminating record.</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='del'>-	if ((list == &amp;ls-&gt;ls_root_list) &amp;&amp;</div><div class='add'>+	if ((list == &amp;ls-&gt;ls_masters_list) &amp;&amp;</div><div class='ctx'> 	    (offset + sizeof(uint16_t) &lt;= outlen)) {</div><div class='add'>+		/* end dump */</div><div class='ctx'> 		be_namelen = cpu_to_be16(0xFFFF);</div><div class='ctx'> 		memcpy(outbuf + offset, &amp;be_namelen, sizeof(__be16));</div><div class='ctx'> 		offset += sizeof(__be16);</div><div class='del'>-		ls-&gt;ls_recover_dir_sent_msg++;</div><div class='add'>+		dd-&gt;sent_msg++;</div><div class='add'>+		log_rinfo(ls, "dlm_recover_directory nodeid %d sent %u res out %u messages",</div><div class='add'>+			  nodeid, dd-&gt;sent_res, dd-&gt;sent_msg);</div><div class='add'>+</div><div class='add'>+		write_lock_bh(&amp;ls-&gt;ls_dir_dump_lock);</div><div class='add'>+		list_del_init(&amp;dd-&gt;list);</div><div class='add'>+		write_unlock_bh(&amp;ls-&gt;ls_dir_dump_lock);</div><div class='add'>+		kfree(dd);</div><div class='ctx'> 	}</div><div class='ctx'>  out:</div><div class='del'>-	up_read(&amp;ls-&gt;ls_root_sem);</div><div class='add'>+	read_unlock_bh(&amp;ls-&gt;ls_masters_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/dlm/dir.h b/fs/dlm/dir.h<br/>index 03844d086be2..5b2a7ee3762d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/dir.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/dir.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/dir.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/dir.h</a></div><div class='hunk'>@@ -14,10 +14,11 @@</div><div class='ctx'> </div><div class='ctx'> int dlm_dir_nodeid(struct dlm_rsb *rsb);</div><div class='ctx'> int dlm_hash2nodeid(struct dlm_ls *ls, uint32_t hash);</div><div class='del'>-void dlm_recover_dir_nodeid(struct dlm_ls *ls);</div><div class='del'>-int dlm_recover_directory(struct dlm_ls *ls);</div><div class='del'>-void dlm_copy_master_names(struct dlm_ls *ls, char *inbuf, int inlen,</div><div class='del'>-	char *outbuf, int outlen, int nodeid);</div><div class='add'>+void dlm_recover_dir_nodeid(struct dlm_ls *ls,</div><div class='add'>+			    const struct list_head *root_list);</div><div class='add'>+int dlm_recover_directory(struct dlm_ls *ls, uint64_t seq);</div><div class='add'>+void dlm_copy_master_names(struct dlm_ls *ls, const char *inbuf, int inlen,</div><div class='add'>+			   char *outbuf, int outlen, int nodeid);</div><div class='ctx'> </div><div class='ctx'> #endif				/* __DIR_DOT_H__ */</div><div class='ctx'> </div><div class='head'>diff --git a/fs/dlm/dlm_internal.h b/fs/dlm/dlm_internal.h<br/>index 5f57538b5d45..d534a4bc162b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/dlm_internal.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/dlm_internal.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/dlm_internal.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/dlm_internal.h</a></div><div class='hunk'>@@ -16,6 +16,7 @@</div><div class='ctx'>  * This is the main header file to be included in each DLM source file.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='add'>+#include &lt;uapi/linux/dlm_device.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='ctx'> #include &lt;linux/types.h&gt;</div><div class='hunk'>@@ -33,20 +34,15 @@</div><div class='ctx'> #include &lt;linux/kernel.h&gt;</div><div class='ctx'> #include &lt;linux/jhash.h&gt;</div><div class='ctx'> #include &lt;linux/miscdevice.h&gt;</div><div class='add'>+#include &lt;linux/rhashtable.h&gt;</div><div class='ctx'> #include &lt;linux/mutex.h&gt;</div><div class='del'>-#include &lt;linux/idr.h&gt;</div><div class='add'>+#include &lt;linux/xarray.h&gt;</div><div class='ctx'> #include &lt;linux/ratelimit.h&gt;</div><div class='ctx'> #include &lt;linux/uaccess.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/dlm.h&gt;</div><div class='ctx'> #include "config.h"</div><div class='ctx'> </div><div class='del'>-/* Size of the temp buffer midcomms allocates on the stack.</div><div class='del'>-   We try to make this large enough so most messages fit.</div><div class='del'>-   FIXME: should sctp make this unnecessary? */</div><div class='del'>-</div><div class='del'>-#define DLM_INBUF_LEN		148</div><div class='del'>-</div><div class='ctx'> struct dlm_ls;</div><div class='ctx'> struct dlm_lkb;</div><div class='ctx'> struct dlm_rsb;</div><div class='hunk'>@@ -104,17 +100,6 @@ do { \</div><div class='ctx'>   } \</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-</div><div class='del'>-#define DLM_RTF_SHRINK		0x00000001</div><div class='del'>-</div><div class='del'>-struct dlm_rsbtable {</div><div class='del'>-	struct rb_root		keep;</div><div class='del'>-	struct rb_root		toss;</div><div class='del'>-	spinlock_t		lock;</div><div class='del'>-	uint32_t		flags;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Lockspace member (per node in a ls)</div><div class='ctx'>  */</div><div class='hunk'>@@ -151,7 +136,6 @@ struct dlm_args {</div><div class='ctx'> 	void			(*bastfn) (void *astparam, int mode);</div><div class='ctx'> 	int			mode;</div><div class='ctx'> 	struct dlm_lksb		*lksb;</div><div class='del'>-	unsigned long		timeout;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> </div><div class='hunk'>@@ -201,33 +185,69 @@ struct dlm_args {</div><div class='ctx'> #define DLM_LKSTS_GRANTED	2</div><div class='ctx'> #define DLM_LKSTS_CONVERT	3</div><div class='ctx'> </div><div class='del'>-/* lkb_flags */</div><div class='add'>+/* lkb_iflags */</div><div class='add'>+</div><div class='add'>+#define DLM_IFL_MSTCPY_BIT	16</div><div class='add'>+#define __DLM_IFL_MIN_BIT	DLM_IFL_MSTCPY_BIT</div><div class='add'>+#define DLM_IFL_RESEND_BIT	17</div><div class='add'>+#define DLM_IFL_DEAD_BIT	18</div><div class='add'>+#define DLM_IFL_OVERLAP_UNLOCK_BIT 19</div><div class='add'>+#define DLM_IFL_OVERLAP_CANCEL_BIT 20</div><div class='add'>+#define DLM_IFL_ENDOFLIFE_BIT	21</div><div class='add'>+#define DLM_IFL_DEADLOCK_CANCEL_BIT 24</div><div class='add'>+#define __DLM_IFL_MAX_BIT	DLM_IFL_DEADLOCK_CANCEL_BIT</div><div class='ctx'> </div><div class='del'>-#define DLM_IFL_MSTCPY		0x00010000</div><div class='del'>-#define DLM_IFL_RESEND		0x00020000</div><div class='del'>-#define DLM_IFL_DEAD		0x00040000</div><div class='del'>-#define DLM_IFL_OVERLAP_UNLOCK  0x00080000</div><div class='del'>-#define DLM_IFL_OVERLAP_CANCEL  0x00100000</div><div class='del'>-#define DLM_IFL_ENDOFLIFE	0x00200000</div><div class='del'>-#define DLM_IFL_WATCH_TIMEWARN	0x00400000</div><div class='del'>-#define DLM_IFL_TIMEOUT_CANCEL	0x00800000</div><div class='del'>-#define DLM_IFL_DEADLOCK_CANCEL	0x01000000</div><div class='del'>-#define DLM_IFL_STUB_MS		0x02000000 /* magic number for m_flags */</div><div class='del'>-#define DLM_IFL_USER		0x00000001</div><div class='del'>-#define DLM_IFL_ORPHAN		0x00000002</div><div class='add'>+/* lkb_dflags */</div><div class='ctx'> </div><div class='del'>-#define DLM_CALLBACKS_SIZE	6</div><div class='add'>+#define DLM_DFL_USER_BIT	0</div><div class='add'>+#define __DLM_DFL_MIN_BIT	DLM_DFL_USER_BIT</div><div class='add'>+#define DLM_DFL_ORPHAN_BIT	1</div><div class='add'>+#define __DLM_DFL_MAX_BIT	DLM_DFL_ORPHAN_BIT</div><div class='ctx'> </div><div class='ctx'> #define DLM_CB_CAST		0x00000001</div><div class='ctx'> #define DLM_CB_BAST		0x00000002</div><div class='del'>-#define DLM_CB_SKIP		0x00000004</div><div class='add'>+</div><div class='add'>+/* much of this is just saving user space pointers associated with the</div><div class='add'>+ * lock that we pass back to the user lib with an ast</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+struct dlm_user_args {</div><div class='add'>+	struct dlm_user_proc	*proc; /* each process that opens the lockspace</div><div class='add'>+					* device has private data</div><div class='add'>+					* (dlm_user_proc) on the struct file,</div><div class='add'>+					* the process's locks point back to it</div><div class='add'>+					*/</div><div class='add'>+	struct dlm_lksb		lksb;</div><div class='add'>+	struct dlm_lksb __user	*user_lksb;</div><div class='add'>+	void __user		*castparam;</div><div class='add'>+	void __user		*castaddr;</div><div class='add'>+	void __user		*bastparam;</div><div class='add'>+	void __user		*bastaddr;</div><div class='add'>+	uint64_t		xid;</div><div class='add'>+};</div><div class='ctx'> </div><div class='ctx'> struct dlm_callback {</div><div class='del'>-	uint64_t		seq;</div><div class='ctx'> 	uint32_t		flags;		/* DLM_CBF_ */</div><div class='ctx'> 	int			sb_status;	/* copy to lksb status */</div><div class='ctx'> 	uint8_t			sb_flags;	/* copy to lksb flags */</div><div class='ctx'> 	int8_t			mode; /* rq mode of bast, gr mode of cast */</div><div class='add'>+	bool			copy_lvb;</div><div class='add'>+	struct dlm_lksb		*lkb_lksb;</div><div class='add'>+	unsigned char		lvbptr[DLM_USER_LVB_LEN];</div><div class='add'>+</div><div class='add'>+	union {</div><div class='add'>+		void			*astparam;	/* caller's ast arg */</div><div class='add'>+		struct dlm_user_args	ua;</div><div class='add'>+	};</div><div class='add'>+	struct work_struct	work;</div><div class='add'>+	void			(*bastfn)(void *astparam, int mode);</div><div class='add'>+	void			(*astfn)(void *astparam);</div><div class='add'>+	char			res_name[DLM_RESNAME_MAXLEN];</div><div class='add'>+	size_t			res_length;</div><div class='add'>+	uint32_t		ls_id;</div><div class='add'>+	uint32_t		lkb_id;</div><div class='add'>+</div><div class='add'>+	struct list_head	list;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct dlm_lkb {</div><div class='hunk'>@@ -238,8 +258,9 @@ struct dlm_lkb {</div><div class='ctx'> 	uint32_t		lkb_id;		/* our lock ID */</div><div class='ctx'> 	uint32_t		lkb_remid;	/* lock ID on remote partner */</div><div class='ctx'> 	uint32_t		lkb_exflags;	/* external flags from caller */</div><div class='del'>-	uint32_t		lkb_sbflags;	/* lksb flags */</div><div class='del'>-	uint32_t		lkb_flags;	/* internal flags */</div><div class='add'>+	unsigned long		lkb_sbflags;	/* lksb flags */</div><div class='add'>+	unsigned long		lkb_dflags;	/* distributed flags */</div><div class='add'>+	unsigned long		lkb_iflags;	/* internal flags */</div><div class='ctx'> 	uint32_t		lkb_lvbseq;	/* lvb sequence number */</div><div class='ctx'> </div><div class='ctx'> 	int8_t			lkb_status;     /* granted, waiting, convert */</div><div class='hunk'>@@ -255,17 +276,12 @@ struct dlm_lkb {</div><div class='ctx'> 	struct list_head	lkb_rsb_lookup;	/* waiting for rsb lookup */</div><div class='ctx'> 	struct list_head	lkb_wait_reply;	/* waiting for remote reply */</div><div class='ctx'> 	struct list_head	lkb_ownqueue;	/* list of locks for a process */</div><div class='del'>-	struct list_head	lkb_time_list;</div><div class='ctx'> 	ktime_t			lkb_timestamp;</div><div class='del'>-	ktime_t			lkb_wait_time;</div><div class='del'>-	unsigned long		lkb_timeout_cs;</div><div class='del'>-</div><div class='del'>-	struct mutex		lkb_cb_mutex;</div><div class='del'>-	struct work_struct	lkb_cb_work;</div><div class='del'>-	struct list_head	lkb_cb_list; /* for ls_cb_delay or proc-&gt;asts */</div><div class='del'>-	struct dlm_callback	lkb_callbacks[DLM_CALLBACKS_SIZE];</div><div class='del'>-	struct dlm_callback	lkb_last_cast;</div><div class='del'>-	struct dlm_callback	lkb_last_bast;</div><div class='add'>+</div><div class='add'>+	int8_t			lkb_last_cast_cb_mode;</div><div class='add'>+	int8_t			lkb_last_bast_cb_mode;</div><div class='add'>+	int8_t			lkb_last_cb_mode;</div><div class='add'>+	uint8_t			lkb_last_cb_flags;</div><div class='ctx'> 	ktime_t			lkb_last_cast_time;	/* for debugging */</div><div class='ctx'> 	ktime_t			lkb_last_bast_time;	/* for debugging */</div><div class='ctx'> </div><div class='hunk'>@@ -279,6 +295,7 @@ struct dlm_lkb {</div><div class='ctx'> 		void			*lkb_astparam;	/* caller's ast arg */</div><div class='ctx'> 		struct dlm_user_args	*lkb_ua;</div><div class='ctx'> 	};</div><div class='add'>+	struct rcu_head		rcu;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -294,30 +311,30 @@ struct dlm_lkb {</div><div class='ctx'> struct dlm_rsb {</div><div class='ctx'> 	struct dlm_ls		*res_ls;	/* the lockspace */</div><div class='ctx'> 	struct kref		res_ref;</div><div class='del'>-	struct mutex		res_mutex;</div><div class='add'>+	spinlock_t		res_lock;</div><div class='ctx'> 	unsigned long		res_flags;</div><div class='ctx'> 	int			res_length;	/* length of rsb name */</div><div class='ctx'> 	int			res_nodeid;</div><div class='ctx'> 	int			res_master_nodeid;</div><div class='ctx'> 	int			res_dir_nodeid;</div><div class='del'>-	int			res_id;		/* for ls_recover_idr */</div><div class='add'>+	unsigned long		res_id;		/* for ls_recover_xa */</div><div class='ctx'> 	uint32_t                res_lvbseq;</div><div class='ctx'> 	uint32_t		res_hash;</div><div class='del'>-	uint32_t		res_bucket;	/* rsbtbl */</div><div class='ctx'> 	unsigned long		res_toss_time;</div><div class='ctx'> 	uint32_t		res_first_lkid;</div><div class='ctx'> 	struct list_head	res_lookup;	/* lkbs waiting on first */</div><div class='del'>-	union {</div><div class='del'>-		struct list_head	res_hashchain;</div><div class='del'>-		struct rb_node		res_hashnode;	/* rsbtbl */</div><div class='del'>-	};</div><div class='add'>+	struct rhash_head	res_node;	/* rsbtbl */</div><div class='ctx'> 	struct list_head	res_grantqueue;</div><div class='ctx'> 	struct list_head	res_convertqueue;</div><div class='ctx'> 	struct list_head	res_waitqueue;</div><div class='ctx'> </div><div class='add'>+	struct list_head	res_slow_list;      /* ls_slow_* */</div><div class='add'>+	struct list_head	res_scan_list;</div><div class='ctx'> 	struct list_head	res_root_list;	    /* used for recovery */</div><div class='add'>+	struct list_head	res_masters_list;   /* used for recovery */</div><div class='ctx'> 	struct list_head	res_recover_list;   /* used for recovery */</div><div class='ctx'> 	int			res_recover_locks_count;</div><div class='add'>+	struct rcu_head		rcu;</div><div class='ctx'> </div><div class='ctx'> 	char			*res_lvbptr;</div><div class='ctx'> 	char			res_name[DLM_RESNAME_MAXLEN+1];</div><div class='hunk'>@@ -350,6 +367,8 @@ enum rsb_flags {</div><div class='ctx'> 	RSB_RECOVER_CONVERT,</div><div class='ctx'> 	RSB_RECOVER_GRANT,</div><div class='ctx'> 	RSB_RECOVER_LVB_INVAL,</div><div class='add'>+	RSB_INACTIVE,</div><div class='add'>+	RSB_HASHED, /* set while rsb is on ls_rsbtbl */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static inline void rsb_set_flag(struct dlm_rsb *r, enum rsb_flags flag)</div><div class='hunk'>@@ -385,15 +404,15 @@ static inline int rsb_flag(struct dlm_rsb *r, enum rsb_flags flag)</div><div class='ctx'> #define DLM_FIN			5</div><div class='ctx'> </div><div class='ctx'> struct dlm_header {</div><div class='del'>-	uint32_t		h_version;</div><div class='add'>+	__le32			h_version;</div><div class='ctx'> 	union {</div><div class='ctx'> 		/* for DLM_MSG and DLM_RCOM */</div><div class='del'>-		uint32_t	h_lockspace;</div><div class='add'>+		__le32		h_lockspace;</div><div class='ctx'> 		/* for DLM_ACK and DLM_OPTS */</div><div class='del'>-		uint32_t	h_seq;</div><div class='add'>+		__le32		h_seq;</div><div class='ctx'> 	} u;</div><div class='del'>-	uint32_t		h_nodeid;	/* nodeid of sender */</div><div class='del'>-	uint16_t		h_length;</div><div class='add'>+	__le32			h_nodeid;	/* nodeid of sender */</div><div class='add'>+	__le16			h_length;</div><div class='ctx'> 	uint8_t			h_cmd;		/* DLM_MSG, DLM_RCOM */</div><div class='ctx'> 	uint8_t			h_pad;</div><div class='ctx'> };</div><div class='hunk'>@@ -415,24 +434,24 @@ struct dlm_header {</div><div class='ctx'> </div><div class='ctx'> struct dlm_message {</div><div class='ctx'> 	struct dlm_header	m_header;</div><div class='del'>-	uint32_t		m_type;		/* DLM_MSG_ */</div><div class='del'>-	uint32_t		m_nodeid;</div><div class='del'>-	uint32_t		m_pid;</div><div class='del'>-	uint32_t		m_lkid;		/* lkid on sender */</div><div class='del'>-	uint32_t		m_remid;	/* lkid on receiver */</div><div class='del'>-	uint32_t		m_parent_lkid;</div><div class='del'>-	uint32_t		m_parent_remid;</div><div class='del'>-	uint32_t		m_exflags;</div><div class='del'>-	uint32_t		m_sbflags;</div><div class='del'>-	uint32_t		m_flags;</div><div class='del'>-	uint32_t		m_lvbseq;</div><div class='del'>-	uint32_t		m_hash;</div><div class='del'>-	int			m_status;</div><div class='del'>-	int			m_grmode;</div><div class='del'>-	int			m_rqmode;</div><div class='del'>-	int			m_bastmode;</div><div class='del'>-	int			m_asts;</div><div class='del'>-	int			m_result;	/* 0 or -EXXX */</div><div class='add'>+	__le32			m_type;		/* DLM_MSG_ */</div><div class='add'>+	__le32			m_nodeid;</div><div class='add'>+	__le32			m_pid;</div><div class='add'>+	__le32			m_lkid;		/* lkid on sender */</div><div class='add'>+	__le32			m_remid;	/* lkid on receiver */</div><div class='add'>+	__le32			m_parent_lkid;</div><div class='add'>+	__le32			m_parent_remid;</div><div class='add'>+	__le32			m_exflags;</div><div class='add'>+	__le32			m_sbflags;</div><div class='add'>+	__le32			m_flags;</div><div class='add'>+	__le32			m_lvbseq;</div><div class='add'>+	__le32			m_hash;</div><div class='add'>+	__le32			m_status;</div><div class='add'>+	__le32			m_grmode;</div><div class='add'>+	__le32			m_rqmode;</div><div class='add'>+	__le32			m_bastmode;</div><div class='add'>+	__le32			m_asts;</div><div class='add'>+	__le32			m_result;	/* 0 or -EXXX */</div><div class='ctx'> 	char			m_extra[];	/* name or lvb */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -457,18 +476,18 @@ struct dlm_message {</div><div class='ctx'> </div><div class='ctx'> struct dlm_rcom {</div><div class='ctx'> 	struct dlm_header	rc_header;</div><div class='del'>-	uint32_t		rc_type;	/* DLM_RCOM_ */</div><div class='del'>-	int			rc_result;	/* multi-purpose */</div><div class='del'>-	uint64_t		rc_id;		/* match reply with request */</div><div class='del'>-	uint64_t		rc_seq;		/* sender's ls_recover_seq */</div><div class='del'>-	uint64_t		rc_seq_reply;	/* remote ls_recover_seq */</div><div class='add'>+	__le32			rc_type;	/* DLM_RCOM_ */</div><div class='add'>+	__le32			rc_result;	/* multi-purpose */</div><div class='add'>+	__le64			rc_id;		/* match reply with request */</div><div class='add'>+	__le64			rc_seq;		/* sender's ls_recover_seq */</div><div class='add'>+	__le64			rc_seq_reply;	/* remote ls_recover_seq */</div><div class='ctx'> 	char			rc_buf[];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct dlm_opt_header {</div><div class='del'>-	uint16_t	t_type;</div><div class='del'>-	uint16_t	t_length;</div><div class='del'>-	uint32_t	t_pad;</div><div class='add'>+	__le16		t_type;</div><div class='add'>+	__le16		t_length;</div><div class='add'>+	__le32		t_pad;</div><div class='ctx'> 	/* need to be 8 byte aligned */</div><div class='ctx'> 	char		t_value[];</div><div class='ctx'> };</div><div class='hunk'>@@ -478,8 +497,8 @@ struct dlm_opts {</div><div class='ctx'> 	struct dlm_header	o_header;</div><div class='ctx'> 	uint8_t			o_nextcmd;</div><div class='ctx'> 	uint8_t			o_pad;</div><div class='del'>-	uint16_t		o_optlen;</div><div class='del'>-	uint32_t		o_pad2;</div><div class='add'>+	__le16			o_optlen;</div><div class='add'>+	__le32			o_pad2;</div><div class='ctx'> 	char			o_opts[];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -540,52 +559,39 @@ struct rcom_lock {</div><div class='ctx'> 	char			rl_lvb[];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * The max number of resources per rsbtbl bucket that shrink will attempt</div><div class='del'>- * to remove in each iteration.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#define DLM_REMOVE_NAMES_MAX 8</div><div class='del'>-</div><div class='ctx'> struct dlm_ls {</div><div class='ctx'> 	struct list_head	ls_list;	/* list of lockspaces */</div><div class='del'>-	dlm_lockspace_t		*ls_local_handle;</div><div class='ctx'> 	uint32_t		ls_global_id;	/* global unique lockspace ID */</div><div class='ctx'> 	uint32_t		ls_generation;</div><div class='ctx'> 	uint32_t		ls_exflags;</div><div class='ctx'> 	int			ls_lvblen;</div><div class='del'>-	int			ls_count;	/* refcount of processes in</div><div class='add'>+	atomic_t		ls_count;	/* refcount of processes in</div><div class='ctx'> 						   the dlm using this ls */</div><div class='add'>+	wait_queue_head_t	ls_count_wait;</div><div class='ctx'> 	int			ls_create_count; /* create/release refcount */</div><div class='ctx'> 	unsigned long		ls_flags;	/* LSFL_ */</div><div class='del'>-	unsigned long		ls_scan_time;</div><div class='ctx'> 	struct kobject		ls_kobj;</div><div class='ctx'> </div><div class='del'>-	struct idr		ls_lkbidr;</div><div class='del'>-	spinlock_t		ls_lkbidr_spin;</div><div class='add'>+	struct xarray		ls_lkbxa;</div><div class='add'>+	rwlock_t		ls_lkbxa_lock;</div><div class='ctx'> </div><div class='del'>-	struct dlm_rsbtable	*ls_rsbtbl;</div><div class='del'>-	uint32_t		ls_rsbtbl_size;</div><div class='add'>+	/* an rsb is on rsbtl for primary locking functions,</div><div class='add'>+	   and on a slow list for recovery/dump iteration  */</div><div class='add'>+	struct rhashtable	ls_rsbtbl;</div><div class='add'>+	rwlock_t		ls_rsbtbl_lock; /* for ls_rsbtbl and ls_slow */</div><div class='add'>+	struct list_head	ls_slow_inactive; /* to iterate rsbtbl */</div><div class='add'>+	struct list_head	ls_slow_active;   /* to iterate rsbtbl */</div><div class='ctx'> </div><div class='del'>-	struct mutex		ls_waiters_mutex;</div><div class='add'>+	struct timer_list	ls_scan_timer; /* based on first scan_list rsb toss_time */</div><div class='add'>+	struct list_head	ls_scan_list;  /* rsbs ordered by res_toss_time */</div><div class='add'>+	spinlock_t		ls_scan_lock;</div><div class='add'>+</div><div class='add'>+	spinlock_t		ls_waiters_lock;</div><div class='ctx'> 	struct list_head	ls_waiters;	/* lkbs needing a reply */</div><div class='ctx'> </div><div class='del'>-	struct mutex		ls_orphans_mutex;</div><div class='add'>+	spinlock_t		ls_orphans_lock;</div><div class='ctx'> 	struct list_head	ls_orphans;</div><div class='ctx'> </div><div class='del'>-	struct mutex		ls_timeout_mutex;</div><div class='del'>-	struct list_head	ls_timeout;</div><div class='del'>-</div><div class='del'>-	spinlock_t		ls_new_rsb_spin;</div><div class='del'>-	int			ls_new_rsb_count;</div><div class='del'>-	struct list_head	ls_new_rsb;	/* new rsb structs */</div><div class='del'>-</div><div class='del'>-	spinlock_t		ls_remove_spin;</div><div class='del'>-	char			ls_remove_name[DLM_RESNAME_MAXLEN+1];</div><div class='del'>-	char			*ls_remove_names[DLM_REMOVE_NAMES_MAX];</div><div class='del'>-	int			ls_remove_len;</div><div class='del'>-	int			ls_remove_lens[DLM_REMOVE_NAMES_MAX];</div><div class='del'>-</div><div class='ctx'> 	struct list_head	ls_nodes;	/* current nodes in ls */</div><div class='ctx'> 	struct list_head	ls_nodes_gone;	/* dead node list, recovery */</div><div class='ctx'> 	int			ls_num_nodes;	/* number of nodes in ls */</div><div class='hunk'>@@ -598,20 +604,21 @@ struct dlm_ls {</div><div class='ctx'> 	int			ls_slots_size;</div><div class='ctx'> 	struct dlm_slot		*ls_slots;</div><div class='ctx'> </div><div class='del'>-	struct dlm_rsb		ls_stub_rsb;	/* for returning errors */</div><div class='del'>-	struct dlm_lkb		ls_stub_lkb;	/* for returning errors */</div><div class='del'>-	struct dlm_message	ls_stub_ms;	/* for faking a reply */</div><div class='add'>+	struct dlm_rsb		ls_local_rsb;	/* for returning errors */</div><div class='add'>+	struct dlm_lkb		ls_local_lkb;	/* for returning errors */</div><div class='add'>+	struct dlm_message	ls_local_ms;	/* for faking a reply */</div><div class='ctx'> </div><div class='ctx'> 	struct dentry		*ls_debug_rsb_dentry; /* debugfs */</div><div class='ctx'> 	struct dentry		*ls_debug_waiters_dentry; /* debugfs */</div><div class='ctx'> 	struct dentry		*ls_debug_locks_dentry; /* debugfs */</div><div class='ctx'> 	struct dentry		*ls_debug_all_dentry; /* debugfs */</div><div class='ctx'> 	struct dentry		*ls_debug_toss_dentry; /* debugfs */</div><div class='add'>+	struct dentry		*ls_debug_queued_asts_dentry; /* debugfs */</div><div class='ctx'> </div><div class='ctx'> 	wait_queue_head_t	ls_uevent_wait;	/* user part of join/leave */</div><div class='ctx'> 	int			ls_uevent_result;</div><div class='del'>-	struct completion	ls_members_done;</div><div class='del'>-	int			ls_members_result;</div><div class='add'>+	struct completion	ls_recovery_done;</div><div class='add'>+	int			ls_recovery_result;</div><div class='ctx'> </div><div class='ctx'> 	struct miscdevice       ls_device;</div><div class='ctx'> </div><div class='hunk'>@@ -619,9 +626,8 @@ struct dlm_ls {</div><div class='ctx'> </div><div class='ctx'> 	/* recovery related */</div><div class='ctx'> </div><div class='del'>-	struct mutex		ls_cb_mutex;</div><div class='add'>+	spinlock_t		ls_cb_lock;</div><div class='ctx'> 	struct list_head	ls_cb_delay; /* save for queue_work later */</div><div class='del'>-	struct timer_list	ls_timer;</div><div class='ctx'> 	struct task_struct	*ls_recoverd_task;</div><div class='ctx'> 	struct mutex		ls_recoverd_active;</div><div class='ctx'> 	spinlock_t		ls_recover_lock;</div><div class='hunk'>@@ -630,33 +636,35 @@ struct dlm_ls {</div><div class='ctx'> 	uint64_t		ls_recover_seq;</div><div class='ctx'> 	struct dlm_recover	*ls_recover_args;</div><div class='ctx'> 	struct rw_semaphore	ls_in_recovery;	/* block local requests */</div><div class='del'>-	struct rw_semaphore	ls_recv_active;	/* block dlm_recv */</div><div class='add'>+	rwlock_t		ls_recv_active;	/* block dlm_recv */</div><div class='ctx'> 	struct list_head	ls_requestqueue;/* queue remote requests */</div><div class='del'>-	struct mutex		ls_requestqueue_mutex;</div><div class='add'>+	rwlock_t		ls_requestqueue_lock;</div><div class='ctx'> 	struct dlm_rcom		*ls_recover_buf;</div><div class='ctx'> 	int			ls_recover_nodeid; /* for debugging */</div><div class='del'>-	unsigned int		ls_recover_dir_sent_res; /* for log info */</div><div class='del'>-	unsigned int		ls_recover_dir_sent_msg; /* for log info */</div><div class='ctx'> 	unsigned int		ls_recover_locks_in; /* for log info */</div><div class='ctx'> 	uint64_t		ls_rcom_seq;</div><div class='ctx'> 	spinlock_t		ls_rcom_spin;</div><div class='ctx'> 	struct list_head	ls_recover_list;</div><div class='ctx'> 	spinlock_t		ls_recover_list_lock;</div><div class='ctx'> 	int			ls_recover_list_count;</div><div class='del'>-	struct idr		ls_recover_idr;</div><div class='del'>-	spinlock_t		ls_recover_idr_lock;</div><div class='add'>+	struct xarray		ls_recover_xa;</div><div class='add'>+	spinlock_t		ls_recover_xa_lock;</div><div class='ctx'> 	wait_queue_head_t	ls_wait_general;</div><div class='ctx'> 	wait_queue_head_t	ls_recover_lock_wait;</div><div class='del'>-	struct mutex		ls_clear_proc_locks;</div><div class='add'>+	spinlock_t		ls_clear_proc_locks;</div><div class='ctx'> </div><div class='del'>-	struct list_head	ls_root_list;	/* root resources */</div><div class='del'>-	struct rw_semaphore	ls_root_sem;	/* protect root_list */</div><div class='add'>+	struct list_head	ls_masters_list; /* root resources */</div><div class='add'>+	rwlock_t		ls_masters_lock; /* protect root_list */</div><div class='add'>+	struct list_head	ls_dir_dump_list; /* root resources */</div><div class='add'>+	rwlock_t		ls_dir_dump_lock; /* protect root_list */</div><div class='ctx'> </div><div class='ctx'> 	const struct dlm_lockspace_ops *ls_ops;</div><div class='ctx'> 	void			*ls_ops_arg;</div><div class='ctx'> </div><div class='add'>+	struct work_struct	ls_free_work;</div><div class='add'>+</div><div class='ctx'> 	int			ls_namelen;</div><div class='del'>-	char			ls_name[1];</div><div class='add'>+	char			ls_name[DLM_LOCKSPACE_LEN + 1];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -690,26 +698,11 @@ struct dlm_ls {</div><div class='ctx'> #define LSFL_RCOM_READY		5</div><div class='ctx'> #define LSFL_RCOM_WAIT		6</div><div class='ctx'> #define LSFL_UEVENT_WAIT	7</div><div class='del'>-#define LSFL_TIMEWARN		8</div><div class='ctx'> #define LSFL_CB_DELAY		9</div><div class='ctx'> #define LSFL_NODIR		10</div><div class='del'>-</div><div class='del'>-/* much of this is just saving user space pointers associated with the</div><div class='del'>-   lock that we pass back to the user lib with an ast */</div><div class='del'>-</div><div class='del'>-struct dlm_user_args {</div><div class='del'>-	struct dlm_user_proc	*proc; /* each process that opens the lockspace</div><div class='del'>-					  device has private data</div><div class='del'>-					  (dlm_user_proc) on the struct file,</div><div class='del'>-					  the process's locks point back to it*/</div><div class='del'>-	struct dlm_lksb		lksb;</div><div class='del'>-	struct dlm_lksb __user	*user_lksb;</div><div class='del'>-	void __user		*castparam;</div><div class='del'>-	void __user		*castaddr;</div><div class='del'>-	void __user		*bastparam;</div><div class='del'>-	void __user		*bastaddr;</div><div class='del'>-	uint64_t		xid;</div><div class='del'>-};</div><div class='add'>+#define LSFL_RECV_MSG_BLOCKED	11</div><div class='add'>+#define LSFL_FS			12</div><div class='add'>+#define LSFL_SOFTIRQ		13</div><div class='ctx'> </div><div class='ctx'> #define DLM_PROC_FLAGS_CLOSING 1</div><div class='ctx'> #define DLM_PROC_FLAGS_COMPAT  2</div><div class='hunk'>@@ -743,9 +736,78 @@ static inline int dlm_no_directory(struct dlm_ls *ls)</div><div class='ctx'> 	return test_bit(LSFL_NODIR, &amp;ls-&gt;ls_flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int dlm_netlink_init(void);</div><div class='del'>-void dlm_netlink_exit(void);</div><div class='del'>-void dlm_timeout_warn(struct dlm_lkb *lkb);</div><div class='add'>+/* takes a snapshot from dlm atomic flags */</div><div class='add'>+static inline uint32_t dlm_flags_val(const unsigned long *addr,</div><div class='add'>+				     uint32_t min, uint32_t max)</div><div class='add'>+{</div><div class='add'>+	uint32_t bit = min, val = 0;</div><div class='add'>+</div><div class='add'>+	for_each_set_bit_from(bit, addr, max + 1) {</div><div class='add'>+		val |= BIT(bit);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return val;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline uint32_t dlm_iflags_val(const struct dlm_lkb *lkb)</div><div class='add'>+{</div><div class='add'>+	return dlm_flags_val(&amp;lkb-&gt;lkb_iflags, __DLM_IFL_MIN_BIT,</div><div class='add'>+			     __DLM_IFL_MAX_BIT);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline uint32_t dlm_dflags_val(const struct dlm_lkb *lkb)</div><div class='add'>+{</div><div class='add'>+	return dlm_flags_val(&amp;lkb-&gt;lkb_dflags, __DLM_DFL_MIN_BIT,</div><div class='add'>+			     __DLM_DFL_MAX_BIT);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* coming from UAPI header</div><div class='add'>+ *</div><div class='add'>+ * TODO:</div><div class='add'>+ * Move this to UAPI header and let other values point to them and use BIT()</div><div class='add'>+ */</div><div class='add'>+#define DLM_SBF_DEMOTED_BIT	0</div><div class='add'>+#define __DLM_SBF_MIN_BIT	DLM_SBF_DEMOTED_BIT</div><div class='add'>+#define DLM_SBF_VALNOTVALID_BIT	1</div><div class='add'>+#define DLM_SBF_ALTMODE_BIT	2</div><div class='add'>+#define __DLM_SBF_MAX_BIT	DLM_SBF_ALTMODE_BIT</div><div class='add'>+</div><div class='add'>+static inline uint32_t dlm_sbflags_val(const struct dlm_lkb *lkb)</div><div class='add'>+{</div><div class='add'>+	/* be sure the next person updates this */</div><div class='add'>+	BUILD_BUG_ON(BIT(__DLM_SBF_MAX_BIT) != DLM_SBF_ALTMODE);</div><div class='add'>+</div><div class='add'>+	return dlm_flags_val(&amp;lkb-&gt;lkb_sbflags, __DLM_SBF_MIN_BIT,</div><div class='add'>+			     __DLM_SBF_MAX_BIT);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void dlm_set_flags_val(unsigned long *addr, uint32_t val,</div><div class='add'>+				     uint32_t min, uint32_t max)</div><div class='add'>+{</div><div class='add'>+	uint32_t bit;</div><div class='add'>+</div><div class='add'>+	for (bit = min; bit &lt; (max + 1); bit++) {</div><div class='add'>+		if (val &amp; BIT(bit))</div><div class='add'>+			set_bit(bit, addr);</div><div class='add'>+		else</div><div class='add'>+			clear_bit(bit, addr);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void dlm_set_dflags_val(struct dlm_lkb *lkb, uint32_t val)</div><div class='add'>+{</div><div class='add'>+	dlm_set_flags_val(&amp;lkb-&gt;lkb_dflags, val, __DLM_DFL_MIN_BIT,</div><div class='add'>+			  __DLM_DFL_MAX_BIT);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void dlm_set_sbflags_val(struct dlm_lkb *lkb, uint32_t val)</div><div class='add'>+{</div><div class='add'>+	dlm_set_flags_val(&amp;lkb-&gt;lkb_sbflags, val, __DLM_SBF_MIN_BIT,</div><div class='add'>+			  __DLM_SBF_MAX_BIT);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+extern struct workqueue_struct *dlm_wq;</div><div class='add'>+</div><div class='ctx'> int dlm_plock_init(void);</div><div class='ctx'> void dlm_plock_exit(void);</div><div class='ctx'> </div><div class='head'>diff --git a/fs/dlm/lock.c b/fs/dlm/lock.c<br/>index c502c065d007..be938fdf17d9 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/lock.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/lock.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/lock.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/lock.c</a></div><div class='hunk'>@@ -53,6 +53,8 @@</div><div class='ctx'>                                    R: do_xxxx()</div><div class='ctx'>    L: receive_xxxx_reply()     &lt;-  R: send_xxxx_reply()</div><div class='ctx'> */</div><div class='add'>+#include &lt;trace/events/dlm.h&gt;</div><div class='add'>+</div><div class='ctx'> #include &lt;linux/types.h&gt;</div><div class='ctx'> #include &lt;linux/rbtree.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='hunk'>@@ -84,11 +86,10 @@ static int send_remove(struct dlm_rsb *r);</div><div class='ctx'> static int _request_lock(struct dlm_rsb *r, struct dlm_lkb *lkb);</div><div class='ctx'> static int _cancel_lock(struct dlm_rsb *r, struct dlm_lkb *lkb);</div><div class='ctx'> static void __receive_convert_reply(struct dlm_rsb *r, struct dlm_lkb *lkb,</div><div class='del'>-				    struct dlm_message *ms);</div><div class='del'>-static int receive_extralen(struct dlm_message *ms);</div><div class='add'>+				    const struct dlm_message *ms, bool local);</div><div class='add'>+static int receive_extralen(const struct dlm_message *ms);</div><div class='ctx'> static void do_purge(struct dlm_ls *ls, int nodeid, int pid);</div><div class='del'>-static void del_timeout(struct dlm_lkb *lkb);</div><div class='del'>-static void toss_rsb(struct kref *kref);</div><div class='add'>+static void deactivate_rsb(struct kref *kref);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Lock compatibilty matrix - thanks Steve</div><div class='hunk'>@@ -162,7 +163,7 @@ void dlm_print_lkb(struct dlm_lkb *lkb)</div><div class='ctx'> 	printk(KERN_ERR "lkb: nodeid %d id %x remid %x exflags %x flags %x "</div><div class='ctx'> 	       "sts %d rq %d gr %d wait_type %d wait_nodeid %d seq %llu\n",</div><div class='ctx'> 	       lkb-&gt;lkb_nodeid, lkb-&gt;lkb_id, lkb-&gt;lkb_remid, lkb-&gt;lkb_exflags,</div><div class='del'>-	       lkb-&gt;lkb_flags, lkb-&gt;lkb_status, lkb-&gt;lkb_rqmode,</div><div class='add'>+	       dlm_iflags_val(lkb), lkb-&gt;lkb_status, lkb-&gt;lkb_rqmode,</div><div class='ctx'> 	       lkb-&gt;lkb_grmode, lkb-&gt;lkb_wait_type, lkb-&gt;lkb_wait_nodeid,</div><div class='ctx'> 	       (unsigned long long)lkb-&gt;lkb_recover_seq);</div><div class='ctx'> }</div><div class='hunk'>@@ -200,7 +201,7 @@ void dlm_dump_rsb(struct dlm_rsb *r)</div><div class='ctx'> </div><div class='ctx'> /* Threads cannot use the lockspace while it's being recovered */</div><div class='ctx'> </div><div class='del'>-static inline void dlm_lock_recovery(struct dlm_ls *ls)</div><div class='add'>+void dlm_lock_recovery(struct dlm_ls *ls)</div><div class='ctx'> {</div><div class='ctx'> 	down_read(&amp;ls-&gt;ls_in_recovery);</div><div class='ctx'> }</div><div class='hunk'>@@ -227,12 +228,12 @@ static inline int force_blocking_asts(struct dlm_lkb *lkb)</div><div class='ctx'> </div><div class='ctx'> static inline int is_demoted(struct dlm_lkb *lkb)</div><div class='ctx'> {</div><div class='del'>-	return (lkb-&gt;lkb_sbflags &amp; DLM_SBF_DEMOTED);</div><div class='add'>+	return test_bit(DLM_SBF_DEMOTED_BIT, &amp;lkb-&gt;lkb_sbflags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int is_altmode(struct dlm_lkb *lkb)</div><div class='ctx'> {</div><div class='del'>-	return (lkb-&gt;lkb_sbflags &amp; DLM_SBF_ALTMODE);</div><div class='add'>+	return test_bit(DLM_SBF_ALTMODE_BIT, &amp;lkb-&gt;lkb_sbflags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int is_granted(struct dlm_lkb *lkb)</div><div class='hunk'>@@ -248,12 +249,13 @@ static inline int is_remote(struct dlm_rsb *r)</div><div class='ctx'> </div><div class='ctx'> static inline int is_process_copy(struct dlm_lkb *lkb)</div><div class='ctx'> {</div><div class='del'>-	return (lkb-&gt;lkb_nodeid &amp;&amp; !(lkb-&gt;lkb_flags &amp; DLM_IFL_MSTCPY));</div><div class='add'>+	return lkb-&gt;lkb_nodeid &amp;&amp;</div><div class='add'>+	       !test_bit(DLM_IFL_MSTCPY_BIT, &amp;lkb-&gt;lkb_iflags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int is_master_copy(struct dlm_lkb *lkb)</div><div class='ctx'> {</div><div class='del'>-	return (lkb-&gt;lkb_flags &amp; DLM_IFL_MSTCPY) ? 1 : 0;</div><div class='add'>+	return test_bit(DLM_IFL_MSTCPY_BIT, &amp;lkb-&gt;lkb_iflags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int middle_conversion(struct dlm_lkb *lkb)</div><div class='hunk'>@@ -271,18 +273,18 @@ static inline int down_conversion(struct dlm_lkb *lkb)</div><div class='ctx'> </div><div class='ctx'> static inline int is_overlap_unlock(struct dlm_lkb *lkb)</div><div class='ctx'> {</div><div class='del'>-	return lkb-&gt;lkb_flags &amp; DLM_IFL_OVERLAP_UNLOCK;</div><div class='add'>+	return test_bit(DLM_IFL_OVERLAP_UNLOCK_BIT, &amp;lkb-&gt;lkb_iflags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int is_overlap_cancel(struct dlm_lkb *lkb)</div><div class='ctx'> {</div><div class='del'>-	return lkb-&gt;lkb_flags &amp; DLM_IFL_OVERLAP_CANCEL;</div><div class='add'>+	return test_bit(DLM_IFL_OVERLAP_CANCEL_BIT, &amp;lkb-&gt;lkb_iflags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int is_overlap(struct dlm_lkb *lkb)</div><div class='ctx'> {</div><div class='del'>-	return (lkb-&gt;lkb_flags &amp; (DLM_IFL_OVERLAP_UNLOCK |</div><div class='del'>-				  DLM_IFL_OVERLAP_CANCEL));</div><div class='add'>+	return test_bit(DLM_IFL_OVERLAP_UNLOCK_BIT, &amp;lkb-&gt;lkb_iflags) ||</div><div class='add'>+	       test_bit(DLM_IFL_OVERLAP_CANCEL_BIT, &amp;lkb-&gt;lkb_iflags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void queue_cast(struct dlm_rsb *r, struct dlm_lkb *lkb, int rv)</div><div class='hunk'>@@ -290,23 +292,13 @@ static void queue_cast(struct dlm_rsb *r, struct dlm_lkb *lkb, int rv)</div><div class='ctx'> 	if (is_master_copy(lkb))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	del_timeout(lkb);</div><div class='del'>-</div><div class='ctx'> 	DLM_ASSERT(lkb-&gt;lkb_lksb, dlm_print_lkb(lkb););</div><div class='ctx'> </div><div class='del'>-	/* if the operation was a cancel, then return -DLM_ECANCEL, if a</div><div class='del'>-	   timeout caused the cancel then return -ETIMEDOUT */</div><div class='del'>-	if (rv == -DLM_ECANCEL &amp;&amp; (lkb-&gt;lkb_flags &amp; DLM_IFL_TIMEOUT_CANCEL)) {</div><div class='del'>-		lkb-&gt;lkb_flags &amp;= ~DLM_IFL_TIMEOUT_CANCEL;</div><div class='del'>-		rv = -ETIMEDOUT;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (rv == -DLM_ECANCEL &amp;&amp; (lkb-&gt;lkb_flags &amp; DLM_IFL_DEADLOCK_CANCEL)) {</div><div class='del'>-		lkb-&gt;lkb_flags &amp;= ~DLM_IFL_DEADLOCK_CANCEL;</div><div class='add'>+	if (rv == -DLM_ECANCEL &amp;&amp;</div><div class='add'>+	    test_and_clear_bit(DLM_IFL_DEADLOCK_CANCEL_BIT, &amp;lkb-&gt;lkb_iflags))</div><div class='ctx'> 		rv = -EDEADLK;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	dlm_add_cb(lkb, DLM_CB_CAST, lkb-&gt;lkb_grmode, rv, lkb-&gt;lkb_sbflags);</div><div class='add'>+	dlm_add_cb(lkb, DLM_CB_CAST, lkb-&gt;lkb_grmode, rv, dlm_sbflags_val(lkb));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void queue_cast_overlap(struct dlm_rsb *r, struct dlm_lkb *lkb)</div><div class='hunk'>@@ -328,11 +320,18 @@ static void queue_bast(struct dlm_rsb *r, struct dlm_lkb *lkb, int rqmode)</div><div class='ctx'>  * Basic operations on rsb's and lkb's</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='add'>+static inline unsigned long rsb_toss_jiffies(void)</div><div class='add'>+{</div><div class='add'>+	return jiffies + (READ_ONCE(dlm_config.ci_toss_secs) * HZ);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /* This is only called to add a reference when the code already holds</div><div class='ctx'>    a valid reference to the rsb, so there's no need for locking. */</div><div class='ctx'> </div><div class='ctx'> static inline void hold_rsb(struct dlm_rsb *r)</div><div class='ctx'> {</div><div class='add'>+	/* inactive rsbs are not ref counted */</div><div class='add'>+	WARN_ON(rsb_flag(r, RSB_INACTIVE));</div><div class='ctx'> 	kref_get(&amp;r-&gt;res_ref);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -341,17 +340,45 @@ void dlm_hold_rsb(struct dlm_rsb *r)</div><div class='ctx'> 	hold_rsb(r);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* When all references to the rsb are gone it's transferred to</div><div class='del'>-   the tossed list for later disposal. */</div><div class='add'>+/* TODO move this to lib/refcount.c */</div><div class='add'>+static __must_check bool</div><div class='add'>+dlm_refcount_dec_and_write_lock_bh(refcount_t *r, rwlock_t *lock)</div><div class='add'>+__cond_acquires(lock)</div><div class='add'>+{</div><div class='add'>+	if (refcount_dec_not_one(r))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	write_lock_bh(lock);</div><div class='add'>+	if (!refcount_dec_and_test(r)) {</div><div class='add'>+		write_unlock_bh(lock);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* TODO move this to include/linux/kref.h */</div><div class='add'>+static inline int dlm_kref_put_write_lock_bh(struct kref *kref,</div><div class='add'>+					     void (*release)(struct kref *kref),</div><div class='add'>+					     rwlock_t *lock)</div><div class='add'>+{</div><div class='add'>+	if (dlm_refcount_dec_and_write_lock_bh(&amp;kref-&gt;refcount, lock)) {</div><div class='add'>+		release(kref);</div><div class='add'>+		return 1;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> static void put_rsb(struct dlm_rsb *r)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_ls *ls = r-&gt;res_ls;</div><div class='del'>-	uint32_t bucket = r-&gt;res_bucket;</div><div class='add'>+	int rv;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_rsbtbl[bucket].lock);</div><div class='del'>-	kref_put(&amp;r-&gt;res_ref, toss_rsb);</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_rsbtbl[bucket].lock);</div><div class='add'>+	rv = dlm_kref_put_write_lock_bh(&amp;r-&gt;res_ref, deactivate_rsb,</div><div class='add'>+					&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+	if (rv)</div><div class='add'>+		write_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void dlm_put_rsb(struct dlm_rsb *r)</div><div class='hunk'>@@ -359,141 +386,265 @@ void dlm_put_rsb(struct dlm_rsb *r)</div><div class='ctx'> 	put_rsb(r);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int pre_rsb_struct(struct dlm_ls *ls)</div><div class='add'>+/* connected with timer_delete_sync() in dlm_ls_stop() to stop</div><div class='add'>+ * new timers when recovery is triggered and don't run them</div><div class='add'>+ * again until a resume_scan_timer() tries it again.</div><div class='add'>+ */</div><div class='add'>+static void enable_scan_timer(struct dlm_ls *ls, unsigned long jiffies)</div><div class='ctx'> {</div><div class='del'>-	struct dlm_rsb *r1, *r2;</div><div class='del'>-	int count = 0;</div><div class='add'>+	if (!dlm_locking_stopped(ls))</div><div class='add'>+		mod_timer(&amp;ls-&gt;ls_scan_timer, jiffies);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_new_rsb_spin);</div><div class='del'>-	if (ls-&gt;ls_new_rsb_count &gt; dlm_config.ci_new_rsb_count / 2) {</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_new_rsb_spin);</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_new_rsb_spin);</div><div class='add'>+/* This function tries to resume the timer callback if a rsb</div><div class='add'>+ * is on the scan list and no timer is pending. It might that</div><div class='add'>+ * the first entry is on currently executed as timer callback</div><div class='add'>+ * but we don't care if a timer queued up again and does</div><div class='add'>+ * nothing. Should be a rare case.</div><div class='add'>+ */</div><div class='add'>+void resume_scan_timer(struct dlm_ls *ls)</div><div class='add'>+{</div><div class='add'>+	struct dlm_rsb *r;</div><div class='ctx'> </div><div class='del'>-	r1 = dlm_allocate_rsb(ls);</div><div class='del'>-	r2 = dlm_allocate_rsb(ls);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_scan_lock);</div><div class='add'>+	r = list_first_entry_or_null(&amp;ls-&gt;ls_scan_list, struct dlm_rsb,</div><div class='add'>+				     res_scan_list);</div><div class='add'>+	if (r &amp;&amp; !timer_pending(&amp;ls-&gt;ls_scan_timer))</div><div class='add'>+		enable_scan_timer(ls, r-&gt;res_toss_time);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_scan_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* ls_rsbtbl_lock must be held */</div><div class='add'>+</div><div class='add'>+static void del_scan(struct dlm_ls *ls, struct dlm_rsb *r)</div><div class='add'>+{</div><div class='add'>+	struct dlm_rsb *first;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_new_rsb_spin);</div><div class='del'>-	if (r1) {</div><div class='del'>-		list_add(&amp;r1-&gt;res_hashchain, &amp;ls-&gt;ls_new_rsb);</div><div class='del'>-		ls-&gt;ls_new_rsb_count++;</div><div class='add'>+	/* active rsbs should never be on the scan list */</div><div class='add'>+	WARN_ON(!rsb_flag(r, RSB_INACTIVE));</div><div class='add'>+</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_scan_lock);</div><div class='add'>+	r-&gt;res_toss_time = 0;</div><div class='add'>+</div><div class='add'>+	/* if the rsb is not queued do nothing */</div><div class='add'>+	if (list_empty(&amp;r-&gt;res_scan_list))</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	/* get the first element before delete */</div><div class='add'>+	first = list_first_entry(&amp;ls-&gt;ls_scan_list, struct dlm_rsb,</div><div class='add'>+				 res_scan_list);</div><div class='add'>+	list_del_init(&amp;r-&gt;res_scan_list);</div><div class='add'>+	/* check if the first element was the rsb we deleted */</div><div class='add'>+	if (first == r) {</div><div class='add'>+		/* try to get the new first element, if the list</div><div class='add'>+		 * is empty now try to delete the timer, if we are</div><div class='add'>+		 * too late we don't care.</div><div class='add'>+		 *</div><div class='add'>+		 * if the list isn't empty and a new first element got</div><div class='add'>+		 * in place, set the new timer expire time.</div><div class='add'>+		 */</div><div class='add'>+		first = list_first_entry_or_null(&amp;ls-&gt;ls_scan_list, struct dlm_rsb,</div><div class='add'>+						 res_scan_list);</div><div class='add'>+		if (!first)</div><div class='add'>+			timer_delete(&amp;ls-&gt;ls_scan_timer);</div><div class='add'>+		else</div><div class='add'>+			enable_scan_timer(ls, first-&gt;res_toss_time);</div><div class='ctx'> 	}</div><div class='del'>-	if (r2) {</div><div class='del'>-		list_add(&amp;r2-&gt;res_hashchain, &amp;ls-&gt;ls_new_rsb);</div><div class='del'>-		ls-&gt;ls_new_rsb_count++;</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_scan_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void add_scan(struct dlm_ls *ls, struct dlm_rsb *r)</div><div class='add'>+{</div><div class='add'>+	int our_nodeid = dlm_our_nodeid();</div><div class='add'>+	struct dlm_rsb *first;</div><div class='add'>+</div><div class='add'>+	/* A dir record for a remote master rsb should never be on the scan list. */</div><div class='add'>+	WARN_ON(!dlm_no_directory(ls) &amp;&amp;</div><div class='add'>+		(r-&gt;res_master_nodeid != our_nodeid) &amp;&amp;</div><div class='add'>+		(dlm_dir_nodeid(r) == our_nodeid));</div><div class='add'>+</div><div class='add'>+	/* An active rsb should never be on the scan list. */</div><div class='add'>+	WARN_ON(!rsb_flag(r, RSB_INACTIVE));</div><div class='add'>+</div><div class='add'>+	/* An rsb should not already be on the scan list. */</div><div class='add'>+	WARN_ON(!list_empty(&amp;r-&gt;res_scan_list));</div><div class='add'>+</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_scan_lock);</div><div class='add'>+	/* set the new rsb absolute expire time in the rsb */</div><div class='add'>+	r-&gt;res_toss_time = rsb_toss_jiffies();</div><div class='add'>+	if (list_empty(&amp;ls-&gt;ls_scan_list)) {</div><div class='add'>+		/* if the queue is empty add the element and it's</div><div class='add'>+		 * our new expire time</div><div class='add'>+		 */</div><div class='add'>+		list_add_tail(&amp;r-&gt;res_scan_list, &amp;ls-&gt;ls_scan_list);</div><div class='add'>+		enable_scan_timer(ls, r-&gt;res_toss_time);</div><div class='add'>+	} else {</div><div class='add'>+		/* try to get the maybe new first element and then add</div><div class='add'>+		 * to this rsb with the oldest expire time to the end</div><div class='add'>+		 * of the queue. If the list was empty before this</div><div class='add'>+		 * rsb expire time is our next expiration if it wasn't</div><div class='add'>+		 * the now new first elemet is our new expiration time</div><div class='add'>+		 */</div><div class='add'>+		first = list_first_entry_or_null(&amp;ls-&gt;ls_scan_list, struct dlm_rsb,</div><div class='add'>+						 res_scan_list);</div><div class='add'>+		list_add_tail(&amp;r-&gt;res_scan_list, &amp;ls-&gt;ls_scan_list);</div><div class='add'>+		if (!first)</div><div class='add'>+			enable_scan_timer(ls, r-&gt;res_toss_time);</div><div class='add'>+		else</div><div class='add'>+			enable_scan_timer(ls, first-&gt;res_toss_time);</div><div class='ctx'> 	}</div><div class='del'>-	count = ls-&gt;ls_new_rsb_count;</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_new_rsb_spin);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_scan_lock);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if (!count)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	return 0;</div><div class='add'>+/* if we hit contention we do in 250 ms a retry to trylock.</div><div class='add'>+ * if there is any other mod_timer in between we don't care</div><div class='add'>+ * about that it expires earlier again this is only for the</div><div class='add'>+ * unlikely case nothing happened in this time.</div><div class='add'>+ */</div><div class='add'>+#define DLM_TOSS_TIMER_RETRY	(jiffies + msecs_to_jiffies(250))</div><div class='add'>+</div><div class='add'>+/* Called by lockspace scan_timer to free unused rsb's. */</div><div class='add'>+</div><div class='add'>+void dlm_rsb_scan(struct timer_list *timer)</div><div class='add'>+{</div><div class='add'>+	struct dlm_ls *ls = timer_container_of(ls, timer, ls_scan_timer);</div><div class='add'>+	int our_nodeid = dlm_our_nodeid();</div><div class='add'>+	struct dlm_rsb *r;</div><div class='add'>+	int rv;</div><div class='add'>+</div><div class='add'>+	while (1) {</div><div class='add'>+		/* interrupting point to leave iteration when</div><div class='add'>+		 * recovery waits for timer_delete_sync(), recovery</div><div class='add'>+		 * will take care to delete everything in scan list.</div><div class='add'>+		 */</div><div class='add'>+		if (dlm_locking_stopped(ls))</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		rv = spin_trylock(&amp;ls-&gt;ls_scan_lock);</div><div class='add'>+		if (!rv) {</div><div class='add'>+			/* rearm again try timer */</div><div class='add'>+			enable_scan_timer(ls, DLM_TOSS_TIMER_RETRY);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		r = list_first_entry_or_null(&amp;ls-&gt;ls_scan_list, struct dlm_rsb,</div><div class='add'>+					     res_scan_list);</div><div class='add'>+		if (!r) {</div><div class='add'>+			/* the next add_scan will enable the timer again */</div><div class='add'>+			spin_unlock(&amp;ls-&gt;ls_scan_lock);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * If the first rsb is not yet expired, then stop because the</div><div class='add'>+		 * list is sorted with nearest expiration first.</div><div class='add'>+		 */</div><div class='add'>+		if (time_before(jiffies, r-&gt;res_toss_time)) {</div><div class='add'>+			/* rearm with the next rsb to expire in the future */</div><div class='add'>+			enable_scan_timer(ls, r-&gt;res_toss_time);</div><div class='add'>+			spin_unlock(&amp;ls-&gt;ls_scan_lock);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* in find_rsb_dir/nodir there is a reverse order of this</div><div class='add'>+		 * lock, however this is only a trylock if we hit some</div><div class='add'>+		 * possible contention we try it again.</div><div class='add'>+		 */</div><div class='add'>+		rv = write_trylock(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+		if (!rv) {</div><div class='add'>+			spin_unlock(&amp;ls-&gt;ls_scan_lock);</div><div class='add'>+			/* rearm again try timer */</div><div class='add'>+			enable_scan_timer(ls, DLM_TOSS_TIMER_RETRY);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		list_del(&amp;r-&gt;res_slow_list);</div><div class='add'>+		rhashtable_remove_fast(&amp;ls-&gt;ls_rsbtbl, &amp;r-&gt;res_node,</div><div class='add'>+				       dlm_rhash_rsb_params);</div><div class='add'>+		rsb_clear_flag(r, RSB_HASHED);</div><div class='add'>+</div><div class='add'>+		/* ls_rsbtbl_lock is not needed when calling send_remove() */</div><div class='add'>+		write_unlock(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+</div><div class='add'>+		list_del_init(&amp;r-&gt;res_scan_list);</div><div class='add'>+		spin_unlock(&amp;ls-&gt;ls_scan_lock);</div><div class='add'>+</div><div class='add'>+		/* An rsb that is a dir record for a remote master rsb</div><div class='add'>+		 * cannot be removed, and should not have a timer enabled.</div><div class='add'>+		 */</div><div class='add'>+		WARN_ON(!dlm_no_directory(ls) &amp;&amp;</div><div class='add'>+			(r-&gt;res_master_nodeid != our_nodeid) &amp;&amp;</div><div class='add'>+			(dlm_dir_nodeid(r) == our_nodeid));</div><div class='add'>+</div><div class='add'>+		/* We're the master of this rsb but we're not</div><div class='add'>+		 * the directory record, so we need to tell the</div><div class='add'>+		 * dir node to remove the dir record</div><div class='add'>+		 */</div><div class='add'>+		if (!dlm_no_directory(ls) &amp;&amp;</div><div class='add'>+		    (r-&gt;res_master_nodeid == our_nodeid) &amp;&amp;</div><div class='add'>+		    (dlm_dir_nodeid(r) != our_nodeid))</div><div class='add'>+			send_remove(r);</div><div class='add'>+</div><div class='add'>+		free_inactive_rsb(r);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* If ls-&gt;ls_new_rsb is empty, return -EAGAIN, so the caller can</div><div class='ctx'>    unlock any spinlocks, go back and call pre_rsb_struct again.</div><div class='ctx'>    Otherwise, take an rsb off the list and return it. */</div><div class='ctx'> </div><div class='del'>-static int get_rsb_struct(struct dlm_ls *ls, char *name, int len,</div><div class='add'>+static int get_rsb_struct(struct dlm_ls *ls, const void *name, int len,</div><div class='ctx'> 			  struct dlm_rsb **r_ret)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rsb *r;</div><div class='del'>-	int count;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_new_rsb_spin);</div><div class='del'>-	if (list_empty(&amp;ls-&gt;ls_new_rsb)) {</div><div class='del'>-		count = ls-&gt;ls_new_rsb_count;</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_new_rsb_spin);</div><div class='del'>-		log_debug(ls, "find_rsb retry %d %d %s",</div><div class='del'>-			  count, dlm_config.ci_new_rsb_count, name);</div><div class='del'>-		return -EAGAIN;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	r = list_first_entry(&amp;ls-&gt;ls_new_rsb, struct dlm_rsb, res_hashchain);</div><div class='del'>-	list_del(&amp;r-&gt;res_hashchain);</div><div class='del'>-	/* Convert the empty list_head to a NULL rb_node for tree usage: */</div><div class='del'>-	memset(&amp;r-&gt;res_hashnode, 0, sizeof(struct rb_node));</div><div class='del'>-	ls-&gt;ls_new_rsb_count--;</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_new_rsb_spin);</div><div class='add'>+	r = dlm_allocate_rsb();</div><div class='add'>+	if (!r)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	r-&gt;res_ls = ls;</div><div class='ctx'> 	r-&gt;res_length = len;</div><div class='ctx'> 	memcpy(r-&gt;res_name, name, len);</div><div class='del'>-	mutex_init(&amp;r-&gt;res_mutex);</div><div class='add'>+	spin_lock_init(&amp;r-&gt;res_lock);</div><div class='ctx'> </div><div class='ctx'> 	INIT_LIST_HEAD(&amp;r-&gt;res_lookup);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;r-&gt;res_grantqueue);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;r-&gt;res_convertqueue);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;r-&gt;res_waitqueue);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;r-&gt;res_root_list);</div><div class='add'>+	INIT_LIST_HEAD(&amp;r-&gt;res_scan_list);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;r-&gt;res_recover_list);</div><div class='add'>+	INIT_LIST_HEAD(&amp;r-&gt;res_masters_list);</div><div class='ctx'> </div><div class='ctx'> 	*r_ret = r;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int rsb_cmp(struct dlm_rsb *r, const char *name, int nlen)</div><div class='add'>+int dlm_search_rsb_tree(struct rhashtable *rhash, const void *name, int len,</div><div class='add'>+			struct dlm_rsb **r_ret)</div><div class='ctx'> {</div><div class='del'>-	char maxname[DLM_RESNAME_MAXLEN];</div><div class='add'>+	char key[DLM_RESNAME_MAXLEN] = {};</div><div class='ctx'> </div><div class='del'>-	memset(maxname, 0, DLM_RESNAME_MAXLEN);</div><div class='del'>-	memcpy(maxname, name, nlen);</div><div class='del'>-	return memcmp(r-&gt;res_name, maxname, DLM_RESNAME_MAXLEN);</div><div class='del'>-}</div><div class='add'>+	memcpy(key, name, len);</div><div class='add'>+	*r_ret = rhashtable_lookup_fast(rhash, &amp;key, dlm_rhash_rsb_params);</div><div class='add'>+	if (*r_ret)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-int dlm_search_rsb_tree(struct rb_root *tree, char *name, int len,</div><div class='del'>-			struct dlm_rsb **r_ret)</div><div class='del'>-{</div><div class='del'>-	struct rb_node *node = tree-&gt;rb_node;</div><div class='del'>-	struct dlm_rsb *r;</div><div class='del'>-	int rc;</div><div class='del'>-</div><div class='del'>-	while (node) {</div><div class='del'>-		r = rb_entry(node, struct dlm_rsb, res_hashnode);</div><div class='del'>-		rc = rsb_cmp(r, name, len);</div><div class='del'>-		if (rc &lt; 0)</div><div class='del'>-			node = node-&gt;rb_left;</div><div class='del'>-		else if (rc &gt; 0)</div><div class='del'>-			node = node-&gt;rb_right;</div><div class='del'>-		else</div><div class='del'>-			goto found;</div><div class='del'>-	}</div><div class='del'>-	*r_ret = NULL;</div><div class='ctx'> 	return -EBADR;</div><div class='del'>-</div><div class='del'>- found:</div><div class='del'>-	*r_ret = r;</div><div class='del'>-	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int rsb_insert(struct dlm_rsb *rsb, struct rb_root *tree)</div><div class='add'>+static int rsb_insert(struct dlm_rsb *rsb, struct rhashtable *rhash)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node **newn = &amp;tree-&gt;rb_node;</div><div class='del'>-	struct rb_node *parent = NULL;</div><div class='del'>-	int rc;</div><div class='del'>-</div><div class='del'>-	while (*newn) {</div><div class='del'>-		struct dlm_rsb *cur = rb_entry(*newn, struct dlm_rsb,</div><div class='del'>-					       res_hashnode);</div><div class='add'>+	int rv;</div><div class='ctx'> </div><div class='del'>-		parent = *newn;</div><div class='del'>-		rc = rsb_cmp(cur, rsb-&gt;res_name, rsb-&gt;res_length);</div><div class='del'>-		if (rc &lt; 0)</div><div class='del'>-			newn = &amp;parent-&gt;rb_left;</div><div class='del'>-		else if (rc &gt; 0)</div><div class='del'>-			newn = &amp;parent-&gt;rb_right;</div><div class='del'>-		else {</div><div class='del'>-			log_print("rsb_insert match");</div><div class='del'>-			dlm_dump_rsb(rsb);</div><div class='del'>-			dlm_dump_rsb(cur);</div><div class='del'>-			return -EEXIST;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	rv = rhashtable_insert_fast(rhash, &amp;rsb-&gt;res_node,</div><div class='add'>+				    dlm_rhash_rsb_params);</div><div class='add'>+	if (!rv)</div><div class='add'>+		rsb_set_flag(rsb, RSB_HASHED);</div><div class='ctx'> </div><div class='del'>-	rb_link_node(&amp;rsb-&gt;res_hashnode, parent, newn);</div><div class='del'>-	rb_insert_color(&amp;rsb-&gt;res_hashnode, tree);</div><div class='del'>-	return 0;</div><div class='add'>+	return rv;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -523,7 +674,7 @@ static int rsb_insert(struct dlm_rsb *rsb, struct rb_root *tree)</div><div class='ctx'>  * So, if the given rsb is on the toss list, it is moved to the keep list</div><div class='ctx'>  * before being returned.</div><div class='ctx'>  *</div><div class='del'>- * toss_rsb() happens when all local usage of the rsb is done, i.e. no</div><div class='add'>+ * deactivate_rsb() happens when all local usage of the rsb is done, i.e. no</div><div class='ctx'>  * more refcounts exist, so the rsb is moved from the keep list to the</div><div class='ctx'>  * toss list.</div><div class='ctx'>  *</div><div class='hunk'>@@ -540,9 +691,8 @@ static int rsb_insert(struct dlm_rsb *rsb, struct rb_root *tree)</div><div class='ctx'>  * while that rsb has a potentially stale master.)</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static int find_rsb_dir(struct dlm_ls *ls, char *name, int len,</div><div class='del'>-			uint32_t hash, uint32_t b,</div><div class='del'>-			int dir_nodeid, int from_nodeid,</div><div class='add'>+static int find_rsb_dir(struct dlm_ls *ls, const void *name, int len,</div><div class='add'>+			uint32_t hash, int dir_nodeid, int from_nodeid,</div><div class='ctx'> 			unsigned int flags, struct dlm_rsb **r_ret)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rsb *r = NULL;</div><div class='hunk'>@@ -572,9 +722,9 @@ static int find_rsb_dir(struct dlm_ls *ls, char *name, int len,</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * If someone sends us a request, we are the dir node, and we do</div><div class='ctx'> 	 * not find the rsb anywhere, then recreate it.  This happens if</div><div class='del'>-	 * someone sends us a request after we have removed/freed an rsb</div><div class='del'>-	 * from our toss list.  (They sent a request instead of lookup</div><div class='del'>-	 * because they are using an rsb from their toss list.)</div><div class='add'>+	 * someone sends us a request after we have removed/freed an rsb.</div><div class='add'>+	 * (They sent a request instead of lookup because they are using</div><div class='add'>+	 * an rsb taken from their scan list.)</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='ctx'> 	if (from_local || from_dir ||</div><div class='hunk'>@@ -583,52 +733,83 @@ static int find_rsb_dir(struct dlm_ls *ls, char *name, int len,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'>  retry:</div><div class='del'>-	if (create) {</div><div class='del'>-		error = pre_rsb_struct(ls);</div><div class='del'>-		if (error &lt; 0)</div><div class='del'>-			goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='del'>-</div><div class='del'>-	error = dlm_search_rsb_tree(&amp;ls-&gt;ls_rsbtbl[b].keep, name, len, &amp;r);</div><div class='add'>+	error = dlm_search_rsb_tree(&amp;ls-&gt;ls_rsbtbl, name, len, &amp;r);</div><div class='ctx'> 	if (error)</div><div class='del'>-		goto do_toss;</div><div class='add'>+		goto do_new;</div><div class='add'>+</div><div class='add'>+	/* check if the rsb is active under read lock - likely path */</div><div class='add'>+	read_lock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+	if (!rsb_flag(r, RSB_HASHED)) {</div><div class='add'>+		read_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+		error = -EBADR;</div><div class='add'>+		goto do_new;</div><div class='add'>+	}</div><div class='ctx'> 	</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * rsb is active, so we can't check master_nodeid without lock_rsb.</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='add'>+	if (rsb_flag(r, RSB_INACTIVE)) {</div><div class='add'>+		read_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+		goto do_inactive;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	kref_get(&amp;r-&gt;res_ref);</div><div class='del'>-	error = 0;</div><div class='del'>-	goto out_unlock;</div><div class='add'>+	read_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+	goto out;</div><div class='ctx'> </div><div class='ctx'> </div><div class='del'>- do_toss:</div><div class='del'>-	error = dlm_search_rsb_tree(&amp;ls-&gt;ls_rsbtbl[b].toss, name, len, &amp;r);</div><div class='del'>-	if (error)</div><div class='add'>+ do_inactive:</div><div class='add'>+	write_lock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The expectation here is that the rsb will have HASHED and</div><div class='add'>+	 * INACTIVE flags set, and that the rsb can be moved from</div><div class='add'>+	 * inactive back to active again.  However, between releasing</div><div class='add'>+	 * the read lock and acquiring the write lock, this rsb could</div><div class='add'>+	 * have been removed from rsbtbl, and had HASHED cleared, to</div><div class='add'>+	 * be freed.  To deal with this case, we would normally need</div><div class='add'>+	 * to repeat dlm_search_rsb_tree while holding the write lock,</div><div class='add'>+	 * but rcu allows us to simply check the HASHED flag, because</div><div class='add'>+	 * the rcu read lock means the rsb will not be freed yet.</div><div class='add'>+	 * If the HASHED flag is not set, then the rsb is being freed,</div><div class='add'>+	 * so we add a new rsb struct.  If the HASHED flag is set,</div><div class='add'>+	 * and INACTIVE is not set, it means another thread has</div><div class='add'>+	 * made the rsb active, as we're expecting to do here, and</div><div class='add'>+	 * we just repeat the lookup (this will be very unlikely.)</div><div class='add'>+	 */</div><div class='add'>+	if (rsb_flag(r, RSB_HASHED)) {</div><div class='add'>+		if (!rsb_flag(r, RSB_INACTIVE)) {</div><div class='add'>+			write_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+			goto retry;</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		write_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+		error = -EBADR;</div><div class='ctx'> 		goto do_new;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * rsb found inactive (master_nodeid may be out of date unless</div><div class='ctx'> 	 * we are the dir_nodeid or were the master)  No other thread</div><div class='del'>-	 * is using this rsb because it's on the toss list, so we can</div><div class='add'>+	 * is using this rsb because it's inactive, so we can</div><div class='ctx'> 	 * look at or update res_master_nodeid without lock_rsb.</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='ctx'> 	if ((r-&gt;res_master_nodeid != our_nodeid) &amp;&amp; from_other) {</div><div class='ctx'> 		/* our rsb was not master, and another node (not the dir node)</div><div class='ctx'> 		   has sent us a request */</div><div class='del'>-		log_debug(ls, "find_rsb toss from_other %d master %d dir %d %s",</div><div class='add'>+		log_debug(ls, "find_rsb inactive from_other %d master %d dir %d %s",</div><div class='ctx'> 			  from_nodeid, r-&gt;res_master_nodeid, dir_nodeid,</div><div class='ctx'> 			  r-&gt;res_name);</div><div class='add'>+		write_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='ctx'> 		error = -ENOTBLK;</div><div class='del'>-		goto out_unlock;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if ((r-&gt;res_master_nodeid != our_nodeid) &amp;&amp; from_dir) {</div><div class='ctx'> 		/* don't think this should ever happen */</div><div class='del'>-		log_error(ls, "find_rsb toss from_dir %d master %d",</div><div class='add'>+		log_error(ls, "find_rsb inactive from_dir %d master %d",</div><div class='ctx'> 			  from_nodeid, r-&gt;res_master_nodeid);</div><div class='ctx'> 		dlm_print_rsb(r);</div><div class='ctx'> 		/* fix it and go on */</div><div class='hunk'>@@ -645,9 +826,18 @@ static int find_rsb_dir(struct dlm_ls *ls, char *name, int len,</div><div class='ctx'> 		r-&gt;res_first_lkid = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	rb_erase(&amp;r-&gt;res_hashnode, &amp;ls-&gt;ls_rsbtbl[b].toss);</div><div class='del'>-	error = rsb_insert(r, &amp;ls-&gt;ls_rsbtbl[b].keep);</div><div class='del'>-	goto out_unlock;</div><div class='add'>+	/* we always deactivate scan timer for the rsb, when</div><div class='add'>+	 * we move it out of the inactive state as rsb state</div><div class='add'>+	 * can be changed and scan timers are only for inactive</div><div class='add'>+	 * rsbs.</div><div class='add'>+	 */</div><div class='add'>+	del_scan(ls, r);</div><div class='add'>+	list_move(&amp;r-&gt;res_slow_list, &amp;ls-&gt;ls_slow_active);</div><div class='add'>+	rsb_clear_flag(r, RSB_INACTIVE);</div><div class='add'>+	kref_init(&amp;r-&gt;res_ref); /* ref is now used in active state */</div><div class='add'>+	write_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+</div><div class='add'>+	goto out;</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'>  do_new:</div><div class='hunk'>@@ -656,18 +846,13 @@ static int find_rsb_dir(struct dlm_ls *ls, char *name, int len,</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='ctx'> 	if (error == -EBADR &amp;&amp; !create)</div><div class='del'>-		goto out_unlock;</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='ctx'> 	error = get_rsb_struct(ls, name, len, &amp;r);</div><div class='del'>-	if (error == -EAGAIN) {</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='del'>-		goto retry;</div><div class='del'>-	}</div><div class='del'>-	if (error)</div><div class='del'>-		goto out_unlock;</div><div class='add'>+	if (WARN_ON_ONCE(error))</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='ctx'> 	r-&gt;res_hash = hash;</div><div class='del'>-	r-&gt;res_bucket = b;</div><div class='ctx'> 	r-&gt;res_dir_nodeid = dir_nodeid;</div><div class='ctx'> 	kref_init(&amp;r-&gt;res_ref);</div><div class='ctx'> </div><div class='hunk'>@@ -687,7 +872,7 @@ static int find_rsb_dir(struct dlm_ls *ls, char *name, int len,</div><div class='ctx'> 		dlm_free_rsb(r);</div><div class='ctx'> 		r = NULL;</div><div class='ctx'> 		error = -ENOTBLK;</div><div class='del'>-		goto out_unlock;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (from_other) {</div><div class='hunk'>@@ -707,9 +892,20 @@ static int find_rsb_dir(struct dlm_ls *ls, char *name, int len,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'>  out_add:</div><div class='del'>-	error = rsb_insert(r, &amp;ls-&gt;ls_rsbtbl[b].keep);</div><div class='del'>- out_unlock:</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='add'>+</div><div class='add'>+	write_lock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+	error = rsb_insert(r, &amp;ls-&gt;ls_rsbtbl);</div><div class='add'>+	if (error == -EEXIST) {</div><div class='add'>+		/* somebody else was faster and it seems the</div><div class='add'>+		 * rsb exists now, we do a whole relookup</div><div class='add'>+		 */</div><div class='add'>+		write_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+		dlm_free_rsb(r);</div><div class='add'>+		goto retry;</div><div class='add'>+	} else if (!error) {</div><div class='add'>+		list_add(&amp;r-&gt;res_slow_list, &amp;ls-&gt;ls_slow_active);</div><div class='add'>+	}</div><div class='add'>+	write_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='ctx'>  out:</div><div class='ctx'> 	*r_ret = r;</div><div class='ctx'> 	return error;</div><div class='hunk'>@@ -719,9 +915,8 @@ static int find_rsb_dir(struct dlm_ls *ls, char *name, int len,</div><div class='ctx'>    dlm_recover_locks) before we've made ourself master (in</div><div class='ctx'>    dlm_recover_masters). */</div><div class='ctx'> </div><div class='del'>-static int find_rsb_nodir(struct dlm_ls *ls, char *name, int len,</div><div class='del'>-			  uint32_t hash, uint32_t b,</div><div class='del'>-			  int dir_nodeid, int from_nodeid,</div><div class='add'>+static int find_rsb_nodir(struct dlm_ls *ls, const void *name, int len,</div><div class='add'>+			  uint32_t hash, int dir_nodeid, int from_nodeid,</div><div class='ctx'> 			  unsigned int flags, struct dlm_rsb **r_ret)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rsb *r = NULL;</div><div class='hunk'>@@ -730,59 +925,82 @@ static int find_rsb_nodir(struct dlm_ls *ls, char *name, int len,</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='ctx'>  retry:</div><div class='del'>-	error = pre_rsb_struct(ls);</div><div class='del'>-	if (error &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+	error = dlm_search_rsb_tree(&amp;ls-&gt;ls_rsbtbl, name, len, &amp;r);</div><div class='add'>+	if (error)</div><div class='add'>+		goto do_new;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='add'>+	/* check if the rsb is in active state under read lock - likely path */</div><div class='add'>+	read_lock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+	if (!rsb_flag(r, RSB_HASHED)) {</div><div class='add'>+		read_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+		goto do_new;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	error = dlm_search_rsb_tree(&amp;ls-&gt;ls_rsbtbl[b].keep, name, len, &amp;r);</div><div class='del'>-	if (error)</div><div class='del'>-		goto do_toss;</div><div class='add'>+	if (rsb_flag(r, RSB_INACTIVE)) {</div><div class='add'>+		read_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+		goto do_inactive;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * rsb is active, so we can't check master_nodeid without lock_rsb.</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='ctx'> 	kref_get(&amp;r-&gt;res_ref);</div><div class='del'>-	goto out_unlock;</div><div class='add'>+	read_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='ctx'> </div><div class='add'>+	goto out;</div><div class='ctx'> </div><div class='del'>- do_toss:</div><div class='del'>-	error = dlm_search_rsb_tree(&amp;ls-&gt;ls_rsbtbl[b].toss, name, len, &amp;r);</div><div class='del'>-	if (error)</div><div class='add'>+</div><div class='add'>+ do_inactive:</div><div class='add'>+	write_lock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+</div><div class='add'>+	/* See comment in find_rsb_dir. */</div><div class='add'>+	if (rsb_flag(r, RSB_HASHED)) {</div><div class='add'>+		if (!rsb_flag(r, RSB_INACTIVE)) {</div><div class='add'>+			write_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+			goto retry;</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		write_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='ctx'> 		goto do_new;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * rsb found inactive. No other thread is using this rsb because</div><div class='del'>-	 * it's on the toss list, so we can look at or update</div><div class='del'>-	 * res_master_nodeid without lock_rsb.</div><div class='add'>+	 * it's inactive, so we can look at or update res_master_nodeid</div><div class='add'>+	 * without lock_rsb.</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='ctx'> 	if (!recover &amp;&amp; (r-&gt;res_master_nodeid != our_nodeid) &amp;&amp; from_nodeid) {</div><div class='ctx'> 		/* our rsb is not master, and another node has sent us a</div><div class='ctx'> 		   request; this should never happen */</div><div class='del'>-		log_error(ls, "find_rsb toss from_nodeid %d master %d dir %d",</div><div class='add'>+		log_error(ls, "find_rsb inactive from_nodeid %d master %d dir %d",</div><div class='ctx'> 			  from_nodeid, r-&gt;res_master_nodeid, dir_nodeid);</div><div class='ctx'> 		dlm_print_rsb(r);</div><div class='add'>+		write_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='ctx'> 		error = -ENOTBLK;</div><div class='del'>-		goto out_unlock;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!recover &amp;&amp; (r-&gt;res_master_nodeid != our_nodeid) &amp;&amp;</div><div class='ctx'> 	    (dir_nodeid == our_nodeid)) {</div><div class='ctx'> 		/* our rsb is not master, and we are dir; may as well fix it;</div><div class='ctx'> 		   this should never happen */</div><div class='del'>-		log_error(ls, "find_rsb toss our %d master %d dir %d",</div><div class='add'>+		log_error(ls, "find_rsb inactive our %d master %d dir %d",</div><div class='ctx'> 			  our_nodeid, r-&gt;res_master_nodeid, dir_nodeid);</div><div class='ctx'> 		dlm_print_rsb(r);</div><div class='ctx'> 		r-&gt;res_master_nodeid = our_nodeid;</div><div class='ctx'> 		r-&gt;res_nodeid = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	rb_erase(&amp;r-&gt;res_hashnode, &amp;ls-&gt;ls_rsbtbl[b].toss);</div><div class='del'>-	error = rsb_insert(r, &amp;ls-&gt;ls_rsbtbl[b].keep);</div><div class='del'>-	goto out_unlock;</div><div class='add'>+	del_scan(ls, r);</div><div class='add'>+	list_move(&amp;r-&gt;res_slow_list, &amp;ls-&gt;ls_slow_active);</div><div class='add'>+	rsb_clear_flag(r, RSB_INACTIVE);</div><div class='add'>+	kref_init(&amp;r-&gt;res_ref);</div><div class='add'>+	write_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+</div><div class='add'>+	goto out;</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'>  do_new:</div><div class='hunk'>@@ -791,48 +1009,98 @@ static int find_rsb_nodir(struct dlm_ls *ls, char *name, int len,</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='ctx'> 	error = get_rsb_struct(ls, name, len, &amp;r);</div><div class='del'>-	if (error == -EAGAIN) {</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='del'>-		goto retry;</div><div class='del'>-	}</div><div class='del'>-	if (error)</div><div class='del'>-		goto out_unlock;</div><div class='add'>+	if (WARN_ON_ONCE(error))</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='ctx'> 	r-&gt;res_hash = hash;</div><div class='del'>-	r-&gt;res_bucket = b;</div><div class='ctx'> 	r-&gt;res_dir_nodeid = dir_nodeid;</div><div class='ctx'> 	r-&gt;res_master_nodeid = dir_nodeid;</div><div class='ctx'> 	r-&gt;res_nodeid = (dir_nodeid == our_nodeid) ? 0 : dir_nodeid;</div><div class='ctx'> 	kref_init(&amp;r-&gt;res_ref);</div><div class='ctx'> </div><div class='del'>-	error = rsb_insert(r, &amp;ls-&gt;ls_rsbtbl[b].keep);</div><div class='del'>- out_unlock:</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='add'>+	write_lock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+	error = rsb_insert(r, &amp;ls-&gt;ls_rsbtbl);</div><div class='add'>+	if (error == -EEXIST) {</div><div class='add'>+		/* somebody else was faster and it seems the</div><div class='add'>+		 * rsb exists now, we do a whole relookup</div><div class='add'>+		 */</div><div class='add'>+		write_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+		dlm_free_rsb(r);</div><div class='add'>+		goto retry;</div><div class='add'>+	} else if (!error) {</div><div class='add'>+		list_add(&amp;r-&gt;res_slow_list, &amp;ls-&gt;ls_slow_active);</div><div class='add'>+	}</div><div class='add'>+	write_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+</div><div class='ctx'>  out:</div><div class='ctx'> 	*r_ret = r;</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int find_rsb(struct dlm_ls *ls, char *name, int len, int from_nodeid,</div><div class='del'>-		    unsigned int flags, struct dlm_rsb **r_ret)</div><div class='add'>+/*</div><div class='add'>+ * rsb rcu usage</div><div class='add'>+ *</div><div class='add'>+ * While rcu read lock is held, the rsb cannot be freed,</div><div class='add'>+ * which allows a lookup optimization.</div><div class='add'>+ *</div><div class='add'>+ * Two threads are accessing the same rsb concurrently,</div><div class='add'>+ * the first (A) is trying to use the rsb, the second (B)</div><div class='add'>+ * is trying to free the rsb.</div><div class='add'>+ *</div><div class='add'>+ * thread A                 thread B</div><div class='add'>+ * (trying to use rsb)      (trying to free rsb)</div><div class='add'>+ *</div><div class='add'>+ * A1. rcu read lock</div><div class='add'>+ * A2. rsbtbl read lock</div><div class='add'>+ * A3. look up rsb in rsbtbl</div><div class='add'>+ * A4. rsbtbl read unlock</div><div class='add'>+ *                          B1. rsbtbl write lock</div><div class='add'>+ *                          B2. look up rsb in rsbtbl</div><div class='add'>+ *                          B3. remove rsb from rsbtbl</div><div class='add'>+ *                          B4. clear rsb HASHED flag</div><div class='add'>+ *                          B5. rsbtbl write unlock</div><div class='add'>+ *                          B6. begin freeing rsb using rcu...</div><div class='add'>+ *</div><div class='add'>+ * (rsb is inactive, so try to make it active again)</div><div class='add'>+ * A5. read rsb HASHED flag (safe because rsb is not freed yet)</div><div class='add'>+ * A6. the rsb HASHED flag is not set, which it means the rsb</div><div class='add'>+ *     is being removed from rsbtbl and freed, so don't use it.</div><div class='add'>+ * A7. rcu read unlock</div><div class='add'>+ *</div><div class='add'>+ *                          B7. ...finish freeing rsb using rcu</div><div class='add'>+ * A8. create a new rsb</div><div class='add'>+ *</div><div class='add'>+ * Without the rcu optimization, steps A5-8 would need to do</div><div class='add'>+ * an extra rsbtbl lookup:</div><div class='add'>+ * A5. rsbtbl write lock</div><div class='add'>+ * A6. look up rsb in rsbtbl, not found</div><div class='add'>+ * A7. rsbtbl write unlock</div><div class='add'>+ * A8. create a new rsb</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+static int find_rsb(struct dlm_ls *ls, const void *name, int len,</div><div class='add'>+		    int from_nodeid, unsigned int flags,</div><div class='add'>+		    struct dlm_rsb **r_ret)</div><div class='ctx'> {</div><div class='del'>-	uint32_t hash, b;</div><div class='ctx'> 	int dir_nodeid;</div><div class='add'>+	uint32_t hash;</div><div class='add'>+	int rv;</div><div class='ctx'> </div><div class='ctx'> 	if (len &gt; DLM_RESNAME_MAXLEN)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	hash = jhash(name, len, 0);</div><div class='del'>-	b = hash &amp; (ls-&gt;ls_rsbtbl_size - 1);</div><div class='del'>-</div><div class='ctx'> 	dir_nodeid = dlm_hash2nodeid(ls, hash);</div><div class='ctx'> </div><div class='add'>+	rcu_read_lock();</div><div class='ctx'> 	if (dlm_no_directory(ls))</div><div class='del'>-		return find_rsb_nodir(ls, name, len, hash, b, dir_nodeid,</div><div class='add'>+		rv = find_rsb_nodir(ls, name, len, hash, dir_nodeid,</div><div class='ctx'> 				      from_nodeid, flags, r_ret);</div><div class='ctx'> 	else</div><div class='del'>-		return find_rsb_dir(ls, name, len, hash, b, dir_nodeid,</div><div class='del'>-				      from_nodeid, flags, r_ret);</div><div class='add'>+		rv = find_rsb_dir(ls, name, len, hash, dir_nodeid,</div><div class='add'>+				    from_nodeid, flags, r_ret);</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+	return rv;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* we have received a request and found that res_master_nodeid != our_nodeid,</div><div class='hunk'>@@ -878,6 +1146,88 @@ static int validate_master_nodeid(struct dlm_ls *ls, struct dlm_rsb *r,</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void __dlm_master_lookup(struct dlm_ls *ls, struct dlm_rsb *r, int our_nodeid,</div><div class='add'>+				int from_nodeid, bool is_inactive, unsigned int flags,</div><div class='add'>+				int *r_nodeid, int *result)</div><div class='add'>+{</div><div class='add'>+	int fix_master = (flags &amp; DLM_LU_RECOVER_MASTER);</div><div class='add'>+	int from_master = (flags &amp; DLM_LU_RECOVER_DIR);</div><div class='add'>+</div><div class='add'>+	if (r-&gt;res_dir_nodeid != our_nodeid) {</div><div class='add'>+		/* should not happen, but may as well fix it and carry on */</div><div class='add'>+		log_error(ls, "%s res_dir %d our %d %s", __func__,</div><div class='add'>+			  r-&gt;res_dir_nodeid, our_nodeid, r-&gt;res_name);</div><div class='add'>+		r-&gt;res_dir_nodeid = our_nodeid;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (fix_master &amp;&amp; r-&gt;res_master_nodeid &amp;&amp; dlm_is_removed(ls, r-&gt;res_master_nodeid)) {</div><div class='add'>+		/* Recovery uses this function to set a new master when</div><div class='add'>+		 * the previous master failed.  Setting NEW_MASTER will</div><div class='add'>+		 * force dlm_recover_masters to call recover_master on this</div><div class='add'>+		 * rsb even though the res_nodeid is no longer removed.</div><div class='add'>+		 */</div><div class='add'>+</div><div class='add'>+		r-&gt;res_master_nodeid = from_nodeid;</div><div class='add'>+		r-&gt;res_nodeid = from_nodeid;</div><div class='add'>+		rsb_set_flag(r, RSB_NEW_MASTER);</div><div class='add'>+</div><div class='add'>+		if (is_inactive) {</div><div class='add'>+			/* I don't think we should ever find it inactive. */</div><div class='add'>+			log_error(ls, "%s fix_master inactive", __func__);</div><div class='add'>+			dlm_dump_rsb(r);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (from_master &amp;&amp; (r-&gt;res_master_nodeid != from_nodeid)) {</div><div class='add'>+		/* this will happen if from_nodeid became master during</div><div class='add'>+		 * a previous recovery cycle, and we aborted the previous</div><div class='add'>+		 * cycle before recovering this master value</div><div class='add'>+		 */</div><div class='add'>+</div><div class='add'>+		log_limit(ls, "%s from_master %d master_nodeid %d res_nodeid %d first %x %s",</div><div class='add'>+			  __func__, from_nodeid, r-&gt;res_master_nodeid,</div><div class='add'>+			  r-&gt;res_nodeid, r-&gt;res_first_lkid, r-&gt;res_name);</div><div class='add'>+</div><div class='add'>+		if (r-&gt;res_master_nodeid == our_nodeid) {</div><div class='add'>+			log_error(ls, "from_master %d our_master", from_nodeid);</div><div class='add'>+			dlm_dump_rsb(r);</div><div class='add'>+			goto ret_assign;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		r-&gt;res_master_nodeid = from_nodeid;</div><div class='add'>+		r-&gt;res_nodeid = from_nodeid;</div><div class='add'>+		rsb_set_flag(r, RSB_NEW_MASTER);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!r-&gt;res_master_nodeid) {</div><div class='add'>+		/* this will happen if recovery happens while we're looking</div><div class='add'>+		 * up the master for this rsb</div><div class='add'>+		 */</div><div class='add'>+</div><div class='add'>+		log_debug(ls, "%s master 0 to %d first %x %s", __func__,</div><div class='add'>+			  from_nodeid, r-&gt;res_first_lkid, r-&gt;res_name);</div><div class='add'>+		r-&gt;res_master_nodeid = from_nodeid;</div><div class='add'>+		r-&gt;res_nodeid = from_nodeid;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!from_master &amp;&amp; !fix_master &amp;&amp;</div><div class='add'>+	    (r-&gt;res_master_nodeid == from_nodeid)) {</div><div class='add'>+		/* this can happen when the master sends remove, the dir node</div><div class='add'>+		 * finds the rsb on the active list and ignores the remove,</div><div class='add'>+		 * and the former master sends a lookup</div><div class='add'>+		 */</div><div class='add'>+</div><div class='add'>+		log_limit(ls, "%s from master %d flags %x first %x %s",</div><div class='add'>+			  __func__, from_nodeid, flags, r-&gt;res_first_lkid,</div><div class='add'>+			  r-&gt;res_name);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+ ret_assign:</div><div class='add'>+	*r_nodeid = r-&gt;res_master_nodeid;</div><div class='add'>+	if (result)</div><div class='add'>+		*result = DLM_LU_MATCH;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * We're the dir node for this res and another node wants to know the</div><div class='ctx'>  * master nodeid.  During normal operation (non recovery) this is only</div><div class='hunk'>@@ -907,15 +1257,13 @@ static int validate_master_nodeid(struct dlm_ls *ls, struct dlm_rsb *r,</div><div class='ctx'>  * . dlm_master_lookup RECOVER_MASTER (fix_master 1, from_master 0)</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-int dlm_master_lookup(struct dlm_ls *ls, int from_nodeid, char *name, int len,</div><div class='del'>-		      unsigned int flags, int *r_nodeid, int *result)</div><div class='add'>+static int _dlm_master_lookup(struct dlm_ls *ls, int from_nodeid, const char *name,</div><div class='add'>+			      int len, unsigned int flags, int *r_nodeid, int *result)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rsb *r = NULL;</div><div class='del'>-	uint32_t hash, b;</div><div class='del'>-	int from_master = (flags &amp; DLM_LU_RECOVER_DIR);</div><div class='del'>-	int fix_master = (flags &amp; DLM_LU_RECOVER_MASTER);</div><div class='add'>+	uint32_t hash;</div><div class='ctx'> 	int our_nodeid = dlm_our_nodeid();</div><div class='del'>-	int dir_nodeid, error, toss_list = 0;</div><div class='add'>+	int dir_nodeid, error;</div><div class='ctx'> </div><div class='ctx'> 	if (len &gt; DLM_RESNAME_MAXLEN)</div><div class='ctx'> 		return -EINVAL;</div><div class='hunk'>@@ -927,8 +1275,6 @@ int dlm_master_lookup(struct dlm_ls *ls, int from_nodeid, char *name, int len,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	hash = jhash(name, len, 0);</div><div class='del'>-	b = hash &amp; (ls-&gt;ls_rsbtbl_size - 1);</div><div class='del'>-</div><div class='ctx'> 	dir_nodeid = dlm_hash2nodeid(ls, hash);</div><div class='ctx'> 	if (dir_nodeid != our_nodeid) {</div><div class='ctx'> 		log_error(ls, "dlm_master_lookup from %d dir %d our %d h %x %d",</div><div class='hunk'>@@ -939,226 +1285,199 @@ int dlm_master_lookup(struct dlm_ls *ls, int from_nodeid, char *name, int len,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'>  retry:</div><div class='del'>-	error = pre_rsb_struct(ls);</div><div class='del'>-	if (error &lt; 0)</div><div class='del'>-		return error;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='del'>-	error = dlm_search_rsb_tree(&amp;ls-&gt;ls_rsbtbl[b].keep, name, len, &amp;r);</div><div class='del'>-	if (!error) {</div><div class='del'>-		/* because the rsb is active, we need to lock_rsb before</div><div class='del'>-		   checking/changing re_master_nodeid */</div><div class='del'>-</div><div class='del'>-		hold_rsb(r);</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='del'>-		lock_rsb(r);</div><div class='del'>-		goto found;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	error = dlm_search_rsb_tree(&amp;ls-&gt;ls_rsbtbl[b].toss, name, len, &amp;r);</div><div class='add'>+	error = dlm_search_rsb_tree(&amp;ls-&gt;ls_rsbtbl, name, len, &amp;r);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto not_found;</div><div class='ctx'> </div><div class='del'>-	/* because the rsb is inactive (on toss list), it's not refcounted</div><div class='del'>-	   and lock_rsb is not used, but is protected by the rsbtbl lock */</div><div class='add'>+	/* check if the rsb is active under read lock - likely path */</div><div class='add'>+	read_lock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+	if (!rsb_flag(r, RSB_HASHED)) {</div><div class='add'>+		read_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+		goto not_found;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	toss_list = 1;</div><div class='del'>- found:</div><div class='del'>-	if (r-&gt;res_dir_nodeid != our_nodeid) {</div><div class='del'>-		/* should not happen, but may as well fix it and carry on */</div><div class='del'>-		log_error(ls, "dlm_master_lookup res_dir %d our %d %s",</div><div class='del'>-			  r-&gt;res_dir_nodeid, our_nodeid, r-&gt;res_name);</div><div class='del'>-		r-&gt;res_dir_nodeid = our_nodeid;</div><div class='add'>+	if (rsb_flag(r, RSB_INACTIVE)) {</div><div class='add'>+		read_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+		goto do_inactive;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (fix_master &amp;&amp; dlm_is_removed(ls, r-&gt;res_master_nodeid)) {</div><div class='del'>-		/* Recovery uses this function to set a new master when</div><div class='del'>-		   the previous master failed.  Setting NEW_MASTER will</div><div class='del'>-		   force dlm_recover_masters to call recover_master on this</div><div class='del'>-		   rsb even though the res_nodeid is no longer removed. */</div><div class='add'>+	/* because the rsb is active, we need to lock_rsb before</div><div class='add'>+	 * checking/changing re_master_nodeid</div><div class='add'>+	 */</div><div class='ctx'> </div><div class='del'>-		r-&gt;res_master_nodeid = from_nodeid;</div><div class='del'>-		r-&gt;res_nodeid = from_nodeid;</div><div class='del'>-		rsb_set_flag(r, RSB_NEW_MASTER);</div><div class='add'>+	hold_rsb(r);</div><div class='add'>+	read_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+	lock_rsb(r);</div><div class='ctx'> </div><div class='del'>-		if (toss_list) {</div><div class='del'>-			/* I don't think we should ever find it on toss list. */</div><div class='del'>-			log_error(ls, "dlm_master_lookup fix_master on toss");</div><div class='del'>-			dlm_dump_rsb(r);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	__dlm_master_lookup(ls, r, our_nodeid, from_nodeid, false,</div><div class='add'>+			    flags, r_nodeid, result);</div><div class='ctx'> </div><div class='del'>-	if (from_master &amp;&amp; (r-&gt;res_master_nodeid != from_nodeid)) {</div><div class='del'>-		/* this will happen if from_nodeid became master during</div><div class='del'>-		   a previous recovery cycle, and we aborted the previous</div><div class='del'>-		   cycle before recovering this master value */</div><div class='add'>+	/* the rsb was active */</div><div class='add'>+	unlock_rsb(r);</div><div class='add'>+	put_rsb(r);</div><div class='ctx'> </div><div class='del'>-		log_limit(ls, "dlm_master_lookup from_master %d "</div><div class='del'>-			  "master_nodeid %d res_nodeid %d first %x %s",</div><div class='del'>-			  from_nodeid, r-&gt;res_master_nodeid, r-&gt;res_nodeid,</div><div class='del'>-			  r-&gt;res_first_lkid, r-&gt;res_name);</div><div class='add'>+	return 0;</div><div class='ctx'> </div><div class='del'>-		if (r-&gt;res_master_nodeid == our_nodeid) {</div><div class='del'>-			log_error(ls, "from_master %d our_master", from_nodeid);</div><div class='del'>-			dlm_dump_rsb(r);</div><div class='del'>-			goto out_found;</div><div class='del'>-		}</div><div class='add'>+ do_inactive:</div><div class='add'>+	/* unlikely path - check if still part of ls_rsbtbl */</div><div class='add'>+	write_lock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='ctx'> </div><div class='del'>-		r-&gt;res_master_nodeid = from_nodeid;</div><div class='del'>-		r-&gt;res_nodeid = from_nodeid;</div><div class='del'>-		rsb_set_flag(r, RSB_NEW_MASTER);</div><div class='add'>+	/* see comment in find_rsb_dir */</div><div class='add'>+	if (rsb_flag(r, RSB_HASHED)) {</div><div class='add'>+		if (!rsb_flag(r, RSB_INACTIVE)) {</div><div class='add'>+			write_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+			/* something as changed, very unlikely but</div><div class='add'>+			 * try again</div><div class='add'>+			 */</div><div class='add'>+			goto retry;</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		write_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+		goto not_found;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!r-&gt;res_master_nodeid) {</div><div class='del'>-		/* this will happen if recovery happens while we're looking</div><div class='del'>-		   up the master for this rsb */</div><div class='add'>+	/* because the rsb is inactive, it's not refcounted and lock_rsb</div><div class='add'>+	   is not used, but is protected by the rsbtbl lock */</div><div class='ctx'> </div><div class='del'>-		log_debug(ls, "dlm_master_lookup master 0 to %d first %x %s",</div><div class='del'>-			  from_nodeid, r-&gt;res_first_lkid, r-&gt;res_name);</div><div class='del'>-		r-&gt;res_master_nodeid = from_nodeid;</div><div class='del'>-		r-&gt;res_nodeid = from_nodeid;</div><div class='del'>-	}</div><div class='add'>+	__dlm_master_lookup(ls, r, our_nodeid, from_nodeid, true, flags,</div><div class='add'>+			    r_nodeid, result);</div><div class='ctx'> </div><div class='del'>-	if (!from_master &amp;&amp; !fix_master &amp;&amp;</div><div class='del'>-	    (r-&gt;res_master_nodeid == from_nodeid)) {</div><div class='del'>-		/* this can happen when the master sends remove, the dir node</div><div class='del'>-		   finds the rsb on the keep list and ignores the remove,</div><div class='del'>-		   and the former master sends a lookup */</div><div class='add'>+	/* A dir record rsb should never be on scan list.</div><div class='add'>+	 * Except when we are the dir and master node.</div><div class='add'>+	 * This function should only be called by the dir</div><div class='add'>+	 * node.</div><div class='add'>+	 */</div><div class='add'>+	WARN_ON(!list_empty(&amp;r-&gt;res_scan_list) &amp;&amp;</div><div class='add'>+		r-&gt;res_master_nodeid != our_nodeid);</div><div class='ctx'> </div><div class='del'>-		log_limit(ls, "dlm_master_lookup from master %d flags %x "</div><div class='del'>-			  "first %x %s", from_nodeid, flags,</div><div class='del'>-			  r-&gt;res_first_lkid, r-&gt;res_name);</div><div class='del'>-	}</div><div class='add'>+	write_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='ctx'> </div><div class='del'>- out_found:</div><div class='del'>-	*r_nodeid = r-&gt;res_master_nodeid;</div><div class='del'>-	if (result)</div><div class='del'>-		*result = DLM_LU_MATCH;</div><div class='del'>-</div><div class='del'>-	if (toss_list) {</div><div class='del'>-		r-&gt;res_toss_time = jiffies;</div><div class='del'>-		/* the rsb was inactive (on toss list) */</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='del'>-	} else {</div><div class='del'>-		/* the rsb was active */</div><div class='del'>-		unlock_rsb(r);</div><div class='del'>-		put_rsb(r);</div><div class='del'>-	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'>  not_found:</div><div class='ctx'> 	error = get_rsb_struct(ls, name, len, &amp;r);</div><div class='del'>-	if (error == -EAGAIN) {</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='del'>-		goto retry;</div><div class='del'>-	}</div><div class='del'>-	if (error)</div><div class='del'>-		goto out_unlock;</div><div class='add'>+	if (WARN_ON_ONCE(error))</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='ctx'> 	r-&gt;res_hash = hash;</div><div class='del'>-	r-&gt;res_bucket = b;</div><div class='ctx'> 	r-&gt;res_dir_nodeid = our_nodeid;</div><div class='ctx'> 	r-&gt;res_master_nodeid = from_nodeid;</div><div class='ctx'> 	r-&gt;res_nodeid = from_nodeid;</div><div class='del'>-	kref_init(&amp;r-&gt;res_ref);</div><div class='del'>-	r-&gt;res_toss_time = jiffies;</div><div class='del'>-</div><div class='del'>-	error = rsb_insert(r, &amp;ls-&gt;ls_rsbtbl[b].toss);</div><div class='del'>-	if (error) {</div><div class='add'>+	rsb_set_flag(r, RSB_INACTIVE);</div><div class='add'>+</div><div class='add'>+	write_lock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+	error = rsb_insert(r, &amp;ls-&gt;ls_rsbtbl);</div><div class='add'>+	if (error == -EEXIST) {</div><div class='add'>+		/* somebody else was faster and it seems the</div><div class='add'>+		 * rsb exists now, we do a whole relookup</div><div class='add'>+		 */</div><div class='add'>+		write_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+		dlm_free_rsb(r);</div><div class='add'>+		goto retry;</div><div class='add'>+	} else if (error) {</div><div class='add'>+		write_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='ctx'> 		/* should never happen */</div><div class='ctx'> 		dlm_free_rsb(r);</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='ctx'> 		goto retry;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	list_add(&amp;r-&gt;res_slow_list, &amp;ls-&gt;ls_slow_inactive);</div><div class='add'>+	write_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+</div><div class='ctx'> 	if (result)</div><div class='ctx'> 		*result = DLM_LU_ADD;</div><div class='ctx'> 	*r_nodeid = from_nodeid;</div><div class='del'>-	error = 0;</div><div class='del'>- out_unlock:</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='add'>+ out:</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+int dlm_master_lookup(struct dlm_ls *ls, int from_nodeid, const char *name,</div><div class='add'>+		      int len, unsigned int flags, int *r_nodeid, int *result)</div><div class='add'>+{</div><div class='add'>+	int rv;</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	rv = _dlm_master_lookup(ls, from_nodeid, name, len, flags, r_nodeid, result);</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+	return rv;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void dlm_dump_rsb_hash(struct dlm_ls *ls, uint32_t hash)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node *n;</div><div class='ctx'> 	struct dlm_rsb *r;</div><div class='del'>-	int i;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; ls-&gt;ls_rsbtbl_size; i++) {</div><div class='del'>-		spin_lock(&amp;ls-&gt;ls_rsbtbl[i].lock);</div><div class='del'>-		for (n = rb_first(&amp;ls-&gt;ls_rsbtbl[i].keep); n; n = rb_next(n)) {</div><div class='del'>-			r = rb_entry(n, struct dlm_rsb, res_hashnode);</div><div class='del'>-			if (r-&gt;res_hash == hash)</div><div class='del'>-				dlm_dump_rsb(r);</div><div class='del'>-		}</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_rsbtbl[i].lock);</div><div class='add'>+	read_lock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+	list_for_each_entry(r, &amp;ls-&gt;ls_slow_active, res_slow_list) {</div><div class='add'>+		if (r-&gt;res_hash == hash)</div><div class='add'>+			dlm_dump_rsb(r);</div><div class='ctx'> 	}</div><div class='add'>+	read_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void dlm_dump_rsb_name(struct dlm_ls *ls, char *name, int len)</div><div class='add'>+void dlm_dump_rsb_name(struct dlm_ls *ls, const char *name, int len)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rsb *r = NULL;</div><div class='del'>-	uint32_t hash, b;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	hash = jhash(name, len, 0);</div><div class='del'>-	b = hash &amp; (ls-&gt;ls_rsbtbl_size - 1);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='del'>-	error = dlm_search_rsb_tree(&amp;ls-&gt;ls_rsbtbl[b].keep, name, len, &amp;r);</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	error = dlm_search_rsb_tree(&amp;ls-&gt;ls_rsbtbl, name, len, &amp;r);</div><div class='ctx'> 	if (!error)</div><div class='del'>-		goto out_dump;</div><div class='del'>-</div><div class='del'>-	error = dlm_search_rsb_tree(&amp;ls-&gt;ls_rsbtbl[b].toss, name, len, &amp;r);</div><div class='del'>-	if (error)</div><div class='ctx'> 		goto out;</div><div class='del'>- out_dump:</div><div class='add'>+</div><div class='ctx'> 	dlm_dump_rsb(r);</div><div class='ctx'>  out:</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='add'>+	rcu_read_unlock();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void toss_rsb(struct kref *kref)</div><div class='add'>+static void deactivate_rsb(struct kref *kref)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rsb *r = container_of(kref, struct dlm_rsb, res_ref);</div><div class='ctx'> 	struct dlm_ls *ls = r-&gt;res_ls;</div><div class='add'>+	int our_nodeid = dlm_our_nodeid();</div><div class='ctx'> </div><div class='ctx'> 	DLM_ASSERT(list_empty(&amp;r-&gt;res_root_list), dlm_print_rsb(r););</div><div class='del'>-	kref_init(&amp;r-&gt;res_ref);</div><div class='del'>-	rb_erase(&amp;r-&gt;res_hashnode, &amp;ls-&gt;ls_rsbtbl[r-&gt;res_bucket].keep);</div><div class='del'>-	rsb_insert(r, &amp;ls-&gt;ls_rsbtbl[r-&gt;res_bucket].toss);</div><div class='del'>-	r-&gt;res_toss_time = jiffies;</div><div class='del'>-	ls-&gt;ls_rsbtbl[r-&gt;res_bucket].flags |= DLM_RTF_SHRINK;</div><div class='add'>+	rsb_set_flag(r, RSB_INACTIVE);</div><div class='add'>+	list_move(&amp;r-&gt;res_slow_list, &amp;ls-&gt;ls_slow_inactive);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * When the rsb becomes unused, there are two possibilities:</div><div class='add'>+	 * 1. Leave the inactive rsb in place (don't remove it).</div><div class='add'>+	 * 2. Add it to the scan list to be removed.</div><div class='add'>+	 *</div><div class='add'>+	 * 1 is done when the rsb is acting as the dir record</div><div class='add'>+	 * for a remotely mastered rsb.  The rsb must be left</div><div class='add'>+	 * in place as an inactive rsb to act as the dir record.</div><div class='add'>+	 *</div><div class='add'>+	 * 2 is done when a) the rsb is not the master and not the</div><div class='add'>+	 * dir record, b) when the rsb is both the master and the</div><div class='add'>+	 * dir record, c) when the rsb is master but not dir record.</div><div class='add'>+	 *</div><div class='add'>+	 * (If no directory is used, the rsb can always be removed.)</div><div class='add'>+	 */</div><div class='add'>+	if (dlm_no_directory(ls) ||</div><div class='add'>+	    (r-&gt;res_master_nodeid == our_nodeid ||</div><div class='add'>+	     dlm_dir_nodeid(r) != our_nodeid))</div><div class='add'>+		add_scan(ls, r);</div><div class='add'>+</div><div class='ctx'> 	if (r-&gt;res_lvbptr) {</div><div class='ctx'> 		dlm_free_lvb(r-&gt;res_lvbptr);</div><div class='ctx'> 		r-&gt;res_lvbptr = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* See comment for unhold_lkb */</div><div class='del'>-</div><div class='del'>-static void unhold_rsb(struct dlm_rsb *r)</div><div class='add'>+void free_inactive_rsb(struct dlm_rsb *r)</div><div class='ctx'> {</div><div class='del'>-	int rv;</div><div class='del'>-	rv = kref_put(&amp;r-&gt;res_ref, toss_rsb);</div><div class='del'>-	DLM_ASSERT(!rv, dlm_dump_rsb(r););</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void kill_rsb(struct kref *kref)</div><div class='del'>-{</div><div class='del'>-	struct dlm_rsb *r = container_of(kref, struct dlm_rsb, res_ref);</div><div class='del'>-</div><div class='del'>-	/* All work is done after the return from kref_put() so we</div><div class='del'>-	   can release the write_lock before the remove and free. */</div><div class='add'>+	WARN_ON_ONCE(!rsb_flag(r, RSB_INACTIVE));</div><div class='ctx'> </div><div class='ctx'> 	DLM_ASSERT(list_empty(&amp;r-&gt;res_lookup), dlm_dump_rsb(r););</div><div class='ctx'> 	DLM_ASSERT(list_empty(&amp;r-&gt;res_grantqueue), dlm_dump_rsb(r););</div><div class='ctx'> 	DLM_ASSERT(list_empty(&amp;r-&gt;res_convertqueue), dlm_dump_rsb(r););</div><div class='ctx'> 	DLM_ASSERT(list_empty(&amp;r-&gt;res_waitqueue), dlm_dump_rsb(r););</div><div class='ctx'> 	DLM_ASSERT(list_empty(&amp;r-&gt;res_root_list), dlm_dump_rsb(r););</div><div class='add'>+	DLM_ASSERT(list_empty(&amp;r-&gt;res_scan_list), dlm_dump_rsb(r););</div><div class='ctx'> 	DLM_ASSERT(list_empty(&amp;r-&gt;res_recover_list), dlm_dump_rsb(r););</div><div class='add'>+	DLM_ASSERT(list_empty(&amp;r-&gt;res_masters_list), dlm_dump_rsb(r););</div><div class='add'>+</div><div class='add'>+	dlm_free_rsb(r);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Attaching/detaching lkb's from rsb's is for rsb reference counting.</div><div class='hunk'>@@ -1178,35 +1497,35 @@ static void detach_lkb(struct dlm_lkb *lkb)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int create_lkb(struct dlm_ls *ls, struct dlm_lkb **lkb_ret)</div><div class='add'>+static int _create_lkb(struct dlm_ls *ls, struct dlm_lkb **lkb_ret,</div><div class='add'>+		       unsigned long start, unsigned long end)</div><div class='ctx'> {</div><div class='add'>+	struct xa_limit limit;</div><div class='ctx'> 	struct dlm_lkb *lkb;</div><div class='ctx'> 	int rv;</div><div class='ctx'> </div><div class='del'>-	lkb = dlm_allocate_lkb(ls);</div><div class='add'>+	limit.max = end;</div><div class='add'>+	limit.min = start;</div><div class='add'>+</div><div class='add'>+	lkb = dlm_allocate_lkb();</div><div class='ctx'> 	if (!lkb)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='add'>+	lkb-&gt;lkb_last_bast_cb_mode = DLM_LOCK_IV;</div><div class='add'>+	lkb-&gt;lkb_last_cast_cb_mode = DLM_LOCK_IV;</div><div class='add'>+	lkb-&gt;lkb_last_cb_mode = DLM_LOCK_IV;</div><div class='ctx'> 	lkb-&gt;lkb_nodeid = -1;</div><div class='ctx'> 	lkb-&gt;lkb_grmode = DLM_LOCK_IV;</div><div class='ctx'> 	kref_init(&amp;lkb-&gt;lkb_ref);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;lkb-&gt;lkb_ownqueue);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;lkb-&gt;lkb_rsb_lookup);</div><div class='del'>-	INIT_LIST_HEAD(&amp;lkb-&gt;lkb_time_list);</div><div class='del'>-	INIT_LIST_HEAD(&amp;lkb-&gt;lkb_cb_list);</div><div class='del'>-	mutex_init(&amp;lkb-&gt;lkb_cb_mutex);</div><div class='del'>-	INIT_WORK(&amp;lkb-&gt;lkb_cb_work, dlm_callback_work);</div><div class='del'>-</div><div class='del'>-	idr_preload(GFP_NOFS);</div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_lkbidr_spin);</div><div class='del'>-	rv = idr_alloc(&amp;ls-&gt;ls_lkbidr, lkb, 1, 0, GFP_NOWAIT);</div><div class='del'>-	if (rv &gt;= 0)</div><div class='del'>-		lkb-&gt;lkb_id = rv;</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_lkbidr_spin);</div><div class='del'>-	idr_preload_end();</div><div class='add'>+</div><div class='add'>+	write_lock_bh(&amp;ls-&gt;ls_lkbxa_lock);</div><div class='add'>+	rv = xa_alloc(&amp;ls-&gt;ls_lkbxa, &amp;lkb-&gt;lkb_id, lkb, limit, GFP_ATOMIC);</div><div class='add'>+	write_unlock_bh(&amp;ls-&gt;ls_lkbxa_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (rv &lt; 0) {</div><div class='del'>-		log_error(ls, "create_lkb idr error %d", rv);</div><div class='add'>+		log_error(ls, "create_lkb xa error %d", rv);</div><div class='ctx'> 		dlm_free_lkb(lkb);</div><div class='ctx'> 		return rv;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1215,15 +1534,30 @@ static int create_lkb(struct dlm_ls *ls, struct dlm_lkb **lkb_ret)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int create_lkb(struct dlm_ls *ls, struct dlm_lkb **lkb_ret)</div><div class='add'>+{</div><div class='add'>+	return _create_lkb(ls, lkb_ret, 1, ULONG_MAX);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int find_lkb(struct dlm_ls *ls, uint32_t lkid, struct dlm_lkb **lkb_ret)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_lkb *lkb;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_lkbidr_spin);</div><div class='del'>-	lkb = idr_find(&amp;ls-&gt;ls_lkbidr, lkid);</div><div class='del'>-	if (lkb)</div><div class='del'>-		kref_get(&amp;lkb-&gt;lkb_ref);</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_lkbidr_spin);</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	lkb = xa_load(&amp;ls-&gt;ls_lkbxa, lkid);</div><div class='add'>+	if (lkb) {</div><div class='add'>+		/* check if lkb is still part of lkbxa under lkbxa_lock as</div><div class='add'>+		 * the lkb_ref is tight to the lkbxa data structure, see</div><div class='add'>+		 * __put_lkb().</div><div class='add'>+		 */</div><div class='add'>+		read_lock_bh(&amp;ls-&gt;ls_lkbxa_lock);</div><div class='add'>+		if (kref_read(&amp;lkb-&gt;lkb_ref))</div><div class='add'>+			kref_get(&amp;lkb-&gt;lkb_ref);</div><div class='add'>+		else</div><div class='add'>+			lkb = NULL;</div><div class='add'>+		read_unlock_bh(&amp;ls-&gt;ls_lkbxa_lock);</div><div class='add'>+	}</div><div class='add'>+	rcu_read_unlock();</div><div class='ctx'> </div><div class='ctx'> 	*lkb_ret = lkb;</div><div class='ctx'> 	return lkb ? 0 : -ENOENT;</div><div class='hunk'>@@ -1245,11 +1579,13 @@ static void kill_lkb(struct kref *kref)</div><div class='ctx'> static int __put_lkb(struct dlm_ls *ls, struct dlm_lkb *lkb)</div><div class='ctx'> {</div><div class='ctx'> 	uint32_t lkid = lkb-&gt;lkb_id;</div><div class='add'>+	int rv;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_lkbidr_spin);</div><div class='del'>-	if (kref_put(&amp;lkb-&gt;lkb_ref, kill_lkb)) {</div><div class='del'>-		idr_remove(&amp;ls-&gt;ls_lkbidr, lkid);</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_lkbidr_spin);</div><div class='add'>+	rv = dlm_kref_put_write_lock_bh(&amp;lkb-&gt;lkb_ref, kill_lkb,</div><div class='add'>+					&amp;ls-&gt;ls_lkbxa_lock);</div><div class='add'>+	if (rv) {</div><div class='add'>+		xa_erase(&amp;ls-&gt;ls_lkbxa, lkid);</div><div class='add'>+		write_unlock_bh(&amp;ls-&gt;ls_lkbxa_lock);</div><div class='ctx'> </div><div class='ctx'> 		detach_lkb(lkb);</div><div class='ctx'> </div><div class='hunk'>@@ -1257,11 +1593,9 @@ static int __put_lkb(struct dlm_ls *ls, struct dlm_lkb *lkb)</div><div class='ctx'> 		if (lkb-&gt;lkb_lvbptr &amp;&amp; is_master_copy(lkb))</div><div class='ctx'> 			dlm_free_lvb(lkb-&gt;lkb_lvbptr);</div><div class='ctx'> 		dlm_free_lkb(lkb);</div><div class='del'>-		return 1;</div><div class='del'>-	} else {</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_lkbidr_spin);</div><div class='del'>-		return 0;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	return rv;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int dlm_put_lkb(struct dlm_lkb *lkb)</div><div class='hunk'>@@ -1283,6 +1617,13 @@ static inline void hold_lkb(struct dlm_lkb *lkb)</div><div class='ctx'> 	kref_get(&amp;lkb-&gt;lkb_ref);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void unhold_lkb_assert(struct kref *kref)</div><div class='add'>+{</div><div class='add'>+	struct dlm_lkb *lkb = container_of(kref, struct dlm_lkb, lkb_ref);</div><div class='add'>+</div><div class='add'>+	DLM_ASSERT(false, dlm_print_lkb(lkb););</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /* This is called when we need to remove a reference and are certain</div><div class='ctx'>    it's not the last ref.  e.g. del_lkb is always called between a</div><div class='ctx'>    find_lkb/put_lkb and is always the inverse of a previous add_lkb.</div><div class='hunk'>@@ -1290,21 +1631,23 @@ static inline void hold_lkb(struct dlm_lkb *lkb)</div><div class='ctx'> </div><div class='ctx'> static inline void unhold_lkb(struct dlm_lkb *lkb)</div><div class='ctx'> {</div><div class='del'>-	int rv;</div><div class='del'>-	rv = kref_put(&amp;lkb-&gt;lkb_ref, kill_lkb);</div><div class='del'>-	DLM_ASSERT(!rv, dlm_print_lkb(lkb););</div><div class='add'>+	kref_put(&amp;lkb-&gt;lkb_ref, unhold_lkb_assert);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void lkb_add_ordered(struct list_head *new, struct list_head *head,</div><div class='ctx'> 			    int mode)</div><div class='ctx'> {</div><div class='del'>-	struct dlm_lkb *lkb = NULL;</div><div class='add'>+	struct dlm_lkb *lkb = NULL, *iter;</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry(lkb, head, lkb_statequeue)</div><div class='del'>-		if (lkb-&gt;lkb_rqmode &lt; mode)</div><div class='add'>+	list_for_each_entry(iter, head, lkb_statequeue)</div><div class='add'>+		if (iter-&gt;lkb_rqmode &lt; mode) {</div><div class='add'>+			lkb = iter;</div><div class='add'>+			list_add_tail(new, &amp;iter-&gt;lkb_statequeue);</div><div class='ctx'> 			break;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	__list_add(new, lkb-&gt;lkb_statequeue.prev, &amp;lkb-&gt;lkb_statequeue);</div><div class='add'>+	if (!lkb)</div><div class='add'>+		list_add_tail(new, head);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* add/remove lkb to rsb's grant/convert/wait queue */</div><div class='hunk'>@@ -1352,10 +1695,8 @@ static void del_lkb(struct dlm_rsb *r, struct dlm_lkb *lkb)</div><div class='ctx'> </div><div class='ctx'> static void move_lkb(struct dlm_rsb *r, struct dlm_lkb *lkb, int sts)</div><div class='ctx'> {</div><div class='del'>-	hold_lkb(lkb);</div><div class='ctx'> 	del_lkb(r, lkb);</div><div class='ctx'> 	add_lkb(r, lkb, sts);</div><div class='del'>-	unhold_lkb(lkb);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int msg_reply_type(int mstype)</div><div class='hunk'>@@ -1375,101 +1716,28 @@ static int msg_reply_type(int mstype)</div><div class='ctx'> 	return -1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int nodeid_warned(int nodeid, int num_nodes, int *warned)</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; num_nodes; i++) {</div><div class='del'>-		if (!warned[i]) {</div><div class='del'>-			warned[i] = nodeid;</div><div class='del'>-			return 0;</div><div class='del'>-		}</div><div class='del'>-		if (warned[i] == nodeid)</div><div class='del'>-			return 1;</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void dlm_scan_waiters(struct dlm_ls *ls)</div><div class='del'>-{</div><div class='del'>-	struct dlm_lkb *lkb;</div><div class='del'>-	s64 us;</div><div class='del'>-	s64 debug_maxus = 0;</div><div class='del'>-	u32 debug_scanned = 0;</div><div class='del'>-	u32 debug_expired = 0;</div><div class='del'>-	int num_nodes = 0;</div><div class='del'>-	int *warned = NULL;</div><div class='del'>-</div><div class='del'>-	if (!dlm_config.ci_waitwarn_us)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;ls-&gt;ls_waiters_mutex);</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(lkb, &amp;ls-&gt;ls_waiters, lkb_wait_reply) {</div><div class='del'>-		if (!lkb-&gt;lkb_wait_time)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		debug_scanned++;</div><div class='del'>-</div><div class='del'>-		us = ktime_to_us(ktime_sub(ktime_get(), lkb-&gt;lkb_wait_time));</div><div class='del'>-</div><div class='del'>-		if (us &lt; dlm_config.ci_waitwarn_us)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		lkb-&gt;lkb_wait_time = 0;</div><div class='del'>-</div><div class='del'>-		debug_expired++;</div><div class='del'>-		if (us &gt; debug_maxus)</div><div class='del'>-			debug_maxus = us;</div><div class='del'>-</div><div class='del'>-		if (!num_nodes) {</div><div class='del'>-			num_nodes = ls-&gt;ls_num_nodes;</div><div class='del'>-			warned = kcalloc(num_nodes, sizeof(int), GFP_KERNEL);</div><div class='del'>-		}</div><div class='del'>-		if (!warned)</div><div class='del'>-			continue;</div><div class='del'>-		if (nodeid_warned(lkb-&gt;lkb_wait_nodeid, num_nodes, warned))</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		log_error(ls, "waitwarn %x %lld %d us check connection to "</div><div class='del'>-			  "node %d", lkb-&gt;lkb_id, (long long)us,</div><div class='del'>-			  dlm_config.ci_waitwarn_us, lkb-&gt;lkb_wait_nodeid);</div><div class='del'>-	}</div><div class='del'>-	mutex_unlock(&amp;ls-&gt;ls_waiters_mutex);</div><div class='del'>-	kfree(warned);</div><div class='del'>-</div><div class='del'>-	if (debug_expired)</div><div class='del'>-		log_debug(ls, "scan_waiters %u warn %u over %d us max %lld us",</div><div class='del'>-			  debug_scanned, debug_expired,</div><div class='del'>-			  dlm_config.ci_waitwarn_us, (long long)debug_maxus);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /* add/remove lkb from global waiters list of lkb's waiting for</div><div class='ctx'>    a reply from a remote node */</div><div class='ctx'> </div><div class='del'>-static int add_to_waiters(struct dlm_lkb *lkb, int mstype, int to_nodeid)</div><div class='add'>+static void add_to_waiters(struct dlm_lkb *lkb, int mstype, int to_nodeid)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_ls *ls = lkb-&gt;lkb_resource-&gt;res_ls;</div><div class='del'>-	int error = 0;</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;ls-&gt;ls_waiters_mutex);</div><div class='del'>-</div><div class='del'>-	if (is_overlap_unlock(lkb) ||</div><div class='del'>-	    (is_overlap_cancel(lkb) &amp;&amp; (mstype == DLM_MSG_CANCEL))) {</div><div class='del'>-		error = -EINVAL;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_waiters_lock);</div><div class='ctx'> 	if (lkb-&gt;lkb_wait_type || is_overlap_cancel(lkb)) {</div><div class='ctx'> 		switch (mstype) {</div><div class='ctx'> 		case DLM_MSG_UNLOCK:</div><div class='del'>-			lkb-&gt;lkb_flags |= DLM_IFL_OVERLAP_UNLOCK;</div><div class='add'>+			set_bit(DLM_IFL_OVERLAP_UNLOCK_BIT, &amp;lkb-&gt;lkb_iflags);</div><div class='ctx'> 			break;</div><div class='ctx'> 		case DLM_MSG_CANCEL:</div><div class='del'>-			lkb-&gt;lkb_flags |= DLM_IFL_OVERLAP_CANCEL;</div><div class='add'>+			set_bit(DLM_IFL_OVERLAP_CANCEL_BIT, &amp;lkb-&gt;lkb_iflags);</div><div class='ctx'> 			break;</div><div class='ctx'> 		default:</div><div class='del'>-			error = -EBUSY;</div><div class='add'>+			/* should never happen as validate_lock_args() checks</div><div class='add'>+			 * on lkb_wait_type and validate_unlock_args() only</div><div class='add'>+			 * creates UNLOCK or CANCEL messages.</div><div class='add'>+			 */</div><div class='add'>+			WARN_ON_ONCE(1);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 		lkb-&gt;lkb_wait_count++;</div><div class='hunk'>@@ -1477,7 +1745,7 @@ static int add_to_waiters(struct dlm_lkb *lkb, int mstype, int to_nodeid)</div><div class='ctx'> </div><div class='ctx'> 		log_debug(ls, "addwait %x cur %d overlap %d count %d f %x",</div><div class='ctx'> 			  lkb-&gt;lkb_id, lkb-&gt;lkb_wait_type, mstype,</div><div class='del'>-			  lkb-&gt;lkb_wait_count, lkb-&gt;lkb_flags);</div><div class='add'>+			  lkb-&gt;lkb_wait_count, dlm_iflags_val(lkb));</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1487,17 +1755,11 @@ static int add_to_waiters(struct dlm_lkb *lkb, int mstype, int to_nodeid)</div><div class='ctx'> </div><div class='ctx'> 	lkb-&gt;lkb_wait_count++;</div><div class='ctx'> 	lkb-&gt;lkb_wait_type = mstype;</div><div class='del'>-	lkb-&gt;lkb_wait_time = ktime_get();</div><div class='ctx'> 	lkb-&gt;lkb_wait_nodeid = to_nodeid; /* for debugging */</div><div class='ctx'> 	hold_lkb(lkb);</div><div class='ctx'> 	list_add(&amp;lkb-&gt;lkb_wait_reply, &amp;ls-&gt;ls_waiters);</div><div class='ctx'>  out:</div><div class='del'>-	if (error)</div><div class='del'>-		log_error(ls, "addwait error %x %d flags %x %d %d %s",</div><div class='del'>-			  lkb-&gt;lkb_id, error, lkb-&gt;lkb_flags, mstype,</div><div class='del'>-			  lkb-&gt;lkb_wait_type, lkb-&gt;lkb_resource-&gt;res_name);</div><div class='del'>-	mutex_unlock(&amp;ls-&gt;ls_waiters_mutex);</div><div class='del'>-	return error;</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_waiters_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* We clear the RESEND flag because we might be taking an lkb off the waiters</div><div class='hunk'>@@ -1506,21 +1768,21 @@ static int add_to_waiters(struct dlm_lkb *lkb, int mstype, int to_nodeid)</div><div class='ctx'>    set RESEND and dlm_recover_waiters_post() */</div><div class='ctx'> </div><div class='ctx'> static int _remove_from_waiters(struct dlm_lkb *lkb, int mstype,</div><div class='del'>-				struct dlm_message *ms)</div><div class='add'>+				const struct dlm_message *ms)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_ls *ls = lkb-&gt;lkb_resource-&gt;res_ls;</div><div class='ctx'> 	int overlap_done = 0;</div><div class='ctx'> </div><div class='del'>-	if (is_overlap_unlock(lkb) &amp;&amp; (mstype == DLM_MSG_UNLOCK_REPLY)) {</div><div class='add'>+	if (mstype == DLM_MSG_UNLOCK_REPLY &amp;&amp;</div><div class='add'>+	    test_and_clear_bit(DLM_IFL_OVERLAP_UNLOCK_BIT, &amp;lkb-&gt;lkb_iflags)) {</div><div class='ctx'> 		log_debug(ls, "remwait %x unlock_reply overlap", lkb-&gt;lkb_id);</div><div class='del'>-		lkb-&gt;lkb_flags &amp;= ~DLM_IFL_OVERLAP_UNLOCK;</div><div class='ctx'> 		overlap_done = 1;</div><div class='ctx'> 		goto out_del;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (is_overlap_cancel(lkb) &amp;&amp; (mstype == DLM_MSG_CANCEL_REPLY)) {</div><div class='add'>+	if (mstype == DLM_MSG_CANCEL_REPLY &amp;&amp;</div><div class='add'>+	    test_and_clear_bit(DLM_IFL_OVERLAP_CANCEL_BIT, &amp;lkb-&gt;lkb_iflags)) {</div><div class='ctx'> 		log_debug(ls, "remwait %x cancel_reply overlap", lkb-&gt;lkb_id);</div><div class='del'>-		lkb-&gt;lkb_flags &amp;= ~DLM_IFL_OVERLAP_CANCEL;</div><div class='ctx'> 		overlap_done = 1;</div><div class='ctx'> 		goto out_del;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1544,13 +1806,13 @@ static int _remove_from_waiters(struct dlm_lkb *lkb, int mstype,</div><div class='ctx'> 	   lingering state of the cancel and fail with -EBUSY. */</div><div class='ctx'> </div><div class='ctx'> 	if ((mstype == DLM_MSG_CONVERT_REPLY) &amp;&amp;</div><div class='del'>-	    (lkb-&gt;lkb_wait_type == DLM_MSG_CONVERT) &amp;&amp;</div><div class='del'>-	    is_overlap_cancel(lkb) &amp;&amp; ms &amp;&amp; !ms-&gt;m_result) {</div><div class='add'>+	    (lkb-&gt;lkb_wait_type == DLM_MSG_CONVERT) &amp;&amp; ms &amp;&amp; !ms-&gt;m_result &amp;&amp;</div><div class='add'>+	    test_and_clear_bit(DLM_IFL_OVERLAP_CANCEL_BIT, &amp;lkb-&gt;lkb_iflags)) {</div><div class='ctx'> 		log_debug(ls, "remwait %x convert_reply zap overlap_cancel",</div><div class='ctx'> 			  lkb-&gt;lkb_id);</div><div class='ctx'> 		lkb-&gt;lkb_wait_type = 0;</div><div class='del'>-		lkb-&gt;lkb_flags &amp;= ~DLM_IFL_OVERLAP_CANCEL;</div><div class='ctx'> 		lkb-&gt;lkb_wait_count--;</div><div class='add'>+		unhold_lkb(lkb);</div><div class='ctx'> 		goto out_del;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1563,8 +1825,8 @@ static int _remove_from_waiters(struct dlm_lkb *lkb, int mstype,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	log_error(ls, "remwait error %x remote %d %x msg %d flags %x no wait",</div><div class='del'>-		  lkb-&gt;lkb_id, ms ? ms-&gt;m_header.h_nodeid : 0, lkb-&gt;lkb_remid,</div><div class='del'>-		  mstype, lkb-&gt;lkb_flags);</div><div class='add'>+		  lkb-&gt;lkb_id, ms ? le32_to_cpu(ms-&gt;m_header.h_nodeid) : 0,</div><div class='add'>+		  lkb-&gt;lkb_remid, mstype, dlm_iflags_val(lkb));</div><div class='ctx'> 	return -1;</div><div class='ctx'> </div><div class='ctx'>  out_del:</div><div class='hunk'>@@ -1577,12 +1839,13 @@ static int _remove_from_waiters(struct dlm_lkb *lkb, int mstype,</div><div class='ctx'> 		log_error(ls, "remwait error %x reply %d wait_type %d overlap",</div><div class='ctx'> 			  lkb-&gt;lkb_id, mstype, lkb-&gt;lkb_wait_type);</div><div class='ctx'> 		lkb-&gt;lkb_wait_count--;</div><div class='add'>+		unhold_lkb(lkb);</div><div class='ctx'> 		lkb-&gt;lkb_wait_type = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	DLM_ASSERT(lkb-&gt;lkb_wait_count, dlm_print_lkb(lkb););</div><div class='ctx'> </div><div class='del'>-	lkb-&gt;lkb_flags &amp;= ~DLM_IFL_RESEND;</div><div class='add'>+	clear_bit(DLM_IFL_RESEND_BIT, &amp;lkb-&gt;lkb_iflags);</div><div class='ctx'> 	lkb-&gt;lkb_wait_count--;</div><div class='ctx'> 	if (!lkb-&gt;lkb_wait_count)</div><div class='ctx'> 		list_del_init(&amp;lkb-&gt;lkb_wait_reply);</div><div class='hunk'>@@ -1595,349 +1858,34 @@ static int remove_from_waiters(struct dlm_lkb *lkb, int mstype)</div><div class='ctx'> 	struct dlm_ls *ls = lkb-&gt;lkb_resource-&gt;res_ls;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;ls-&gt;ls_waiters_mutex);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_waiters_lock);</div><div class='ctx'> 	error = _remove_from_waiters(lkb, mstype, NULL);</div><div class='del'>-	mutex_unlock(&amp;ls-&gt;ls_waiters_mutex);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_waiters_lock);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Handles situations where we might be processing a "fake" or "stub" reply in</div><div class='del'>-   which we can't try to take waiters_mutex again. */</div><div class='add'>+/* Handles situations where we might be processing a "fake" or "local" reply in</div><div class='add'>+ * the recovery context which stops any locking activity. Only debugfs might</div><div class='add'>+ * change the lockspace waiters but they will held the recovery lock to ensure</div><div class='add'>+ * remove_from_waiters_ms() in local case will be the only user manipulating the</div><div class='add'>+ * lockspace waiters in recovery context.</div><div class='add'>+ */</div><div class='ctx'> </div><div class='del'>-static int remove_from_waiters_ms(struct dlm_lkb *lkb, struct dlm_message *ms)</div><div class='add'>+static int remove_from_waiters_ms(struct dlm_lkb *lkb,</div><div class='add'>+				  const struct dlm_message *ms, bool local)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_ls *ls = lkb-&gt;lkb_resource-&gt;res_ls;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	if (ms-&gt;m_flags != DLM_IFL_STUB_MS)</div><div class='del'>-		mutex_lock(&amp;ls-&gt;ls_waiters_mutex);</div><div class='del'>-	error = _remove_from_waiters(lkb, ms-&gt;m_type, ms);</div><div class='del'>-	if (ms-&gt;m_flags != DLM_IFL_STUB_MS)</div><div class='del'>-		mutex_unlock(&amp;ls-&gt;ls_waiters_mutex);</div><div class='del'>-	return error;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* If there's an rsb for the same resource being removed, ensure</div><div class='del'>-   that the remove message is sent before the new lookup message.</div><div class='del'>-   It should be rare to need a delay here, but if not, then it may</div><div class='del'>-   be worthwhile to add a proper wait mechanism rather than a delay. */</div><div class='del'>-</div><div class='del'>-static void wait_pending_remove(struct dlm_rsb *r)</div><div class='del'>-{</div><div class='del'>-	struct dlm_ls *ls = r-&gt;res_ls;</div><div class='del'>- restart:</div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_remove_spin);</div><div class='del'>-	if (ls-&gt;ls_remove_len &amp;&amp;</div><div class='del'>-	    !rsb_cmp(r, ls-&gt;ls_remove_name, ls-&gt;ls_remove_len)) {</div><div class='del'>-		log_debug(ls, "delay lookup for remove dir %d %s",</div><div class='del'>-		  	  r-&gt;res_dir_nodeid, r-&gt;res_name);</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_remove_spin);</div><div class='del'>-		msleep(1);</div><div class='del'>-		goto restart;</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_remove_spin);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * ls_remove_spin protects ls_remove_name and ls_remove_len which are</div><div class='del'>- * read by other threads in wait_pending_remove.  ls_remove_names</div><div class='del'>- * and ls_remove_lens are only used by the scan thread, so they do</div><div class='del'>- * not need protection.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-static void shrink_bucket(struct dlm_ls *ls, int b)</div><div class='del'>-{</div><div class='del'>-	struct rb_node *n, *next;</div><div class='del'>-	struct dlm_rsb *r;</div><div class='del'>-	char *name;</div><div class='del'>-	int our_nodeid = dlm_our_nodeid();</div><div class='del'>-	int remote_count = 0;</div><div class='del'>-	int need_shrink = 0;</div><div class='del'>-	int i, len, rv;</div><div class='del'>-</div><div class='del'>-	memset(&amp;ls-&gt;ls_remove_lens, 0, sizeof(int) * DLM_REMOVE_NAMES_MAX);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='del'>-</div><div class='del'>-	if (!(ls-&gt;ls_rsbtbl[b].flags &amp; DLM_RTF_SHRINK)) {</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	for (n = rb_first(&amp;ls-&gt;ls_rsbtbl[b].toss); n; n = next) {</div><div class='del'>-		next = rb_next(n);</div><div class='del'>-		r = rb_entry(n, struct dlm_rsb, res_hashnode);</div><div class='del'>-</div><div class='del'>-		/* If we're the directory record for this rsb, and</div><div class='del'>-		   we're not the master of it, then we need to wait</div><div class='del'>-		   for the master node to send us a dir remove for</div><div class='del'>-		   before removing the dir record. */</div><div class='del'>-</div><div class='del'>-		if (!dlm_no_directory(ls) &amp;&amp;</div><div class='del'>-		    (r-&gt;res_master_nodeid != our_nodeid) &amp;&amp;</div><div class='del'>-		    (dlm_dir_nodeid(r) == our_nodeid)) {</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		need_shrink = 1;</div><div class='del'>-</div><div class='del'>-		if (!time_after_eq(jiffies, r-&gt;res_toss_time +</div><div class='del'>-				   dlm_config.ci_toss_secs * HZ)) {</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (!dlm_no_directory(ls) &amp;&amp;</div><div class='del'>-		    (r-&gt;res_master_nodeid == our_nodeid) &amp;&amp;</div><div class='del'>-		    (dlm_dir_nodeid(r) != our_nodeid)) {</div><div class='del'>-</div><div class='del'>-			/* We're the master of this rsb but we're not</div><div class='del'>-			   the directory record, so we need to tell the</div><div class='del'>-			   dir node to remove the dir record. */</div><div class='del'>-</div><div class='del'>-			ls-&gt;ls_remove_lens[remote_count] = r-&gt;res_length;</div><div class='del'>-			memcpy(ls-&gt;ls_remove_names[remote_count], r-&gt;res_name,</div><div class='del'>-			       DLM_RESNAME_MAXLEN);</div><div class='del'>-			remote_count++;</div><div class='del'>-</div><div class='del'>-			if (remote_count &gt;= DLM_REMOVE_NAMES_MAX)</div><div class='del'>-				break;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (!kref_put(&amp;r-&gt;res_ref, kill_rsb)) {</div><div class='del'>-			log_error(ls, "tossed rsb in use %s", r-&gt;res_name);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		rb_erase(&amp;r-&gt;res_hashnode, &amp;ls-&gt;ls_rsbtbl[b].toss);</div><div class='del'>-		dlm_free_rsb(r);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (need_shrink)</div><div class='del'>-		ls-&gt;ls_rsbtbl[b].flags |= DLM_RTF_SHRINK;</div><div class='add'>+	if (!local)</div><div class='add'>+		spin_lock_bh(&amp;ls-&gt;ls_waiters_lock);</div><div class='ctx'> 	else</div><div class='del'>-		ls-&gt;ls_rsbtbl[b].flags &amp;= ~DLM_RTF_SHRINK;</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * While searching for rsb's to free, we found some that require</div><div class='del'>-	 * remote removal.  We leave them in place and find them again here</div><div class='del'>-	 * so there is a very small gap between removing them from the toss</div><div class='del'>-	 * list and sending the removal.  Keeping this gap small is</div><div class='del'>-	 * important to keep us (the master node) from being out of sync</div><div class='del'>-	 * with the remote dir node for very long.</div><div class='del'>-	 *</div><div class='del'>-	 * From the time the rsb is removed from toss until just after</div><div class='del'>-	 * send_remove, the rsb name is saved in ls_remove_name.  A new</div><div class='del'>-	 * lookup checks this to ensure that a new lookup message for the</div><div class='del'>-	 * same resource name is not sent just before the remove message.</div><div class='del'>-	 */</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; remote_count; i++) {</div><div class='del'>-		name = ls-&gt;ls_remove_names[i];</div><div class='del'>-		len = ls-&gt;ls_remove_lens[i];</div><div class='del'>-</div><div class='del'>-		spin_lock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='del'>-		rv = dlm_search_rsb_tree(&amp;ls-&gt;ls_rsbtbl[b].toss, name, len, &amp;r);</div><div class='del'>-		if (rv) {</div><div class='del'>-			spin_unlock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='del'>-			log_debug(ls, "remove_name not toss %s", name);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (r-&gt;res_master_nodeid != our_nodeid) {</div><div class='del'>-			spin_unlock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='del'>-			log_debug(ls, "remove_name master %d dir %d our %d %s",</div><div class='del'>-				  r-&gt;res_master_nodeid, r-&gt;res_dir_nodeid,</div><div class='del'>-				  our_nodeid, name);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (r-&gt;res_dir_nodeid == our_nodeid) {</div><div class='del'>-			/* should never happen */</div><div class='del'>-			spin_unlock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='del'>-			log_error(ls, "remove_name dir %d master %d our %d %s",</div><div class='del'>-				  r-&gt;res_dir_nodeid, r-&gt;res_master_nodeid,</div><div class='del'>-				  our_nodeid, name);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (!time_after_eq(jiffies, r-&gt;res_toss_time +</div><div class='del'>-				   dlm_config.ci_toss_secs * HZ)) {</div><div class='del'>-			spin_unlock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='del'>-			log_debug(ls, "remove_name toss_time %lu now %lu %s",</div><div class='del'>-				  r-&gt;res_toss_time, jiffies, name);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (!kref_put(&amp;r-&gt;res_ref, kill_rsb)) {</div><div class='del'>-			spin_unlock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='del'>-			log_error(ls, "remove_name in use %s", name);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		rb_erase(&amp;r-&gt;res_hashnode, &amp;ls-&gt;ls_rsbtbl[b].toss);</div><div class='del'>-</div><div class='del'>-		/* block lookup of same name until we've sent remove */</div><div class='del'>-		spin_lock(&amp;ls-&gt;ls_remove_spin);</div><div class='del'>-		ls-&gt;ls_remove_len = len;</div><div class='del'>-		memcpy(ls-&gt;ls_remove_name, name, DLM_RESNAME_MAXLEN);</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_remove_spin);</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='del'>-</div><div class='del'>-		send_remove(r);</div><div class='del'>-</div><div class='del'>-		/* allow lookup of name again */</div><div class='del'>-		spin_lock(&amp;ls-&gt;ls_remove_spin);</div><div class='del'>-		ls-&gt;ls_remove_len = 0;</div><div class='del'>-		memset(ls-&gt;ls_remove_name, 0, DLM_RESNAME_MAXLEN);</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_remove_spin);</div><div class='del'>-</div><div class='del'>-		dlm_free_rsb(r);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void dlm_scan_rsbs(struct dlm_ls *ls)</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; ls-&gt;ls_rsbtbl_size; i++) {</div><div class='del'>-		shrink_bucket(ls, i);</div><div class='del'>-		if (dlm_locking_stopped(ls))</div><div class='del'>-			break;</div><div class='del'>-		cond_resched();</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void add_timeout(struct dlm_lkb *lkb)</div><div class='del'>-{</div><div class='del'>-	struct dlm_ls *ls = lkb-&gt;lkb_resource-&gt;res_ls;</div><div class='del'>-</div><div class='del'>-	if (is_master_copy(lkb))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	if (test_bit(LSFL_TIMEWARN, &amp;ls-&gt;ls_flags) &amp;&amp;</div><div class='del'>-	    !(lkb-&gt;lkb_exflags &amp; DLM_LKF_NODLCKWT)) {</div><div class='del'>-		lkb-&gt;lkb_flags |= DLM_IFL_WATCH_TIMEWARN;</div><div class='del'>-		goto add_it;</div><div class='del'>-	}</div><div class='del'>-	if (lkb-&gt;lkb_exflags &amp; DLM_LKF_TIMEOUT)</div><div class='del'>-		goto add_it;</div><div class='del'>-	return;</div><div class='del'>-</div><div class='del'>- add_it:</div><div class='del'>-	DLM_ASSERT(list_empty(&amp;lkb-&gt;lkb_time_list), dlm_print_lkb(lkb););</div><div class='del'>-	mutex_lock(&amp;ls-&gt;ls_timeout_mutex);</div><div class='del'>-	hold_lkb(lkb);</div><div class='del'>-	list_add_tail(&amp;lkb-&gt;lkb_time_list, &amp;ls-&gt;ls_timeout);</div><div class='del'>-	mutex_unlock(&amp;ls-&gt;ls_timeout_mutex);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void del_timeout(struct dlm_lkb *lkb)</div><div class='del'>-{</div><div class='del'>-	struct dlm_ls *ls = lkb-&gt;lkb_resource-&gt;res_ls;</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;ls-&gt;ls_timeout_mutex);</div><div class='del'>-	if (!list_empty(&amp;lkb-&gt;lkb_time_list)) {</div><div class='del'>-		list_del_init(&amp;lkb-&gt;lkb_time_list);</div><div class='del'>-		unhold_lkb(lkb);</div><div class='del'>-	}</div><div class='del'>-	mutex_unlock(&amp;ls-&gt;ls_timeout_mutex);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* FIXME: is it safe to look at lkb_exflags, lkb_flags, lkb_timestamp, and</div><div class='del'>-   lkb_lksb_timeout without lock_rsb?  Note: we can't lock timeout_mutex</div><div class='del'>-   and then lock rsb because of lock ordering in add_timeout.  We may need</div><div class='del'>-   to specify some special timeout-related bits in the lkb that are just to</div><div class='del'>-   be accessed under the timeout_mutex. */</div><div class='del'>-</div><div class='del'>-void dlm_scan_timeout(struct dlm_ls *ls)</div><div class='del'>-{</div><div class='del'>-	struct dlm_rsb *r;</div><div class='del'>-	struct dlm_lkb *lkb;</div><div class='del'>-	int do_cancel, do_warn;</div><div class='del'>-	s64 wait_us;</div><div class='del'>-</div><div class='del'>-	for (;;) {</div><div class='del'>-		if (dlm_locking_stopped(ls))</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		do_cancel = 0;</div><div class='del'>-		do_warn = 0;</div><div class='del'>-		mutex_lock(&amp;ls-&gt;ls_timeout_mutex);</div><div class='del'>-		list_for_each_entry(lkb, &amp;ls-&gt;ls_timeout, lkb_time_list) {</div><div class='del'>-</div><div class='del'>-			wait_us = ktime_to_us(ktime_sub(ktime_get(),</div><div class='del'>-					      		lkb-&gt;lkb_timestamp));</div><div class='del'>-</div><div class='del'>-			if ((lkb-&gt;lkb_exflags &amp; DLM_LKF_TIMEOUT) &amp;&amp;</div><div class='del'>-			    wait_us &gt;= (lkb-&gt;lkb_timeout_cs * 10000))</div><div class='del'>-				do_cancel = 1;</div><div class='del'>-</div><div class='del'>-			if ((lkb-&gt;lkb_flags &amp; DLM_IFL_WATCH_TIMEWARN) &amp;&amp;</div><div class='del'>-			    wait_us &gt;= dlm_config.ci_timewarn_cs * 10000)</div><div class='del'>-				do_warn = 1;</div><div class='del'>-</div><div class='del'>-			if (!do_cancel &amp;&amp; !do_warn)</div><div class='del'>-				continue;</div><div class='del'>-			hold_lkb(lkb);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		mutex_unlock(&amp;ls-&gt;ls_timeout_mutex);</div><div class='del'>-</div><div class='del'>-		if (!do_cancel &amp;&amp; !do_warn)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		r = lkb-&gt;lkb_resource;</div><div class='del'>-		hold_rsb(r);</div><div class='del'>-		lock_rsb(r);</div><div class='del'>-</div><div class='del'>-		if (do_warn) {</div><div class='del'>-			/* clear flag so we only warn once */</div><div class='del'>-			lkb-&gt;lkb_flags &amp;= ~DLM_IFL_WATCH_TIMEWARN;</div><div class='del'>-			if (!(lkb-&gt;lkb_exflags &amp; DLM_LKF_TIMEOUT))</div><div class='del'>-				del_timeout(lkb);</div><div class='del'>-			dlm_timeout_warn(lkb);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (do_cancel) {</div><div class='del'>-			log_debug(ls, "timeout cancel %x node %d %s",</div><div class='del'>-				  lkb-&gt;lkb_id, lkb-&gt;lkb_nodeid, r-&gt;res_name);</div><div class='del'>-			lkb-&gt;lkb_flags &amp;= ~DLM_IFL_WATCH_TIMEWARN;</div><div class='del'>-			lkb-&gt;lkb_flags |= DLM_IFL_TIMEOUT_CANCEL;</div><div class='del'>-			del_timeout(lkb);</div><div class='del'>-			_cancel_lock(r, lkb);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		unlock_rsb(r);</div><div class='del'>-		unhold_rsb(r);</div><div class='del'>-		dlm_put_lkb(lkb);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* This is only called by dlm_recoverd, and we rely on dlm_ls_stop() stopping</div><div class='del'>-   dlm_recoverd before checking/setting ls_recover_begin. */</div><div class='del'>-</div><div class='del'>-void dlm_adjust_timeouts(struct dlm_ls *ls)</div><div class='del'>-{</div><div class='del'>-	struct dlm_lkb *lkb;</div><div class='del'>-	u64 adj_us = jiffies_to_usecs(jiffies - ls-&gt;ls_recover_begin);</div><div class='del'>-</div><div class='del'>-	ls-&gt;ls_recover_begin = 0;</div><div class='del'>-	mutex_lock(&amp;ls-&gt;ls_timeout_mutex);</div><div class='del'>-	list_for_each_entry(lkb, &amp;ls-&gt;ls_timeout, lkb_time_list)</div><div class='del'>-		lkb-&gt;lkb_timestamp = ktime_add_us(lkb-&gt;lkb_timestamp, adj_us);</div><div class='del'>-	mutex_unlock(&amp;ls-&gt;ls_timeout_mutex);</div><div class='del'>-</div><div class='del'>-	if (!dlm_config.ci_waitwarn_us)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;ls-&gt;ls_waiters_mutex);</div><div class='del'>-	list_for_each_entry(lkb, &amp;ls-&gt;ls_waiters, lkb_wait_reply) {</div><div class='del'>-		if (ktime_to_us(lkb-&gt;lkb_wait_time))</div><div class='del'>-			lkb-&gt;lkb_wait_time = ktime_get();</div><div class='del'>-	}</div><div class='del'>-	mutex_unlock(&amp;ls-&gt;ls_waiters_mutex);</div><div class='add'>+		WARN_ON_ONCE(!rwsem_is_locked(&amp;ls-&gt;ls_in_recovery) ||</div><div class='add'>+			     !dlm_locking_stopped(ls));</div><div class='add'>+	error = _remove_from_waiters(lkb, le32_to_cpu(ms-&gt;m_type), ms);</div><div class='add'>+	if (!local)</div><div class='add'>+		spin_unlock_bh(&amp;ls-&gt;ls_waiters_lock);</div><div class='add'>+	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* lkb is master or local copy */</div><div class='hunk'>@@ -1990,7 +1938,7 @@ static void set_lvb_lock(struct dlm_rsb *r, struct dlm_lkb *lkb)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (rsb_flag(r, RSB_VALNOTVALID))</div><div class='del'>-		lkb-&gt;lkb_sbflags |= DLM_SBF_VALNOTVALID;</div><div class='add'>+		set_bit(DLM_SBF_VALNOTVALID_BIT, &amp;lkb-&gt;lkb_sbflags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void set_lvb_unlock(struct dlm_rsb *r, struct dlm_lkb *lkb)</div><div class='hunk'>@@ -2023,7 +1971,7 @@ static void set_lvb_unlock(struct dlm_rsb *r, struct dlm_lkb *lkb)</div><div class='ctx'> /* lkb is process copy (pc) */</div><div class='ctx'> </div><div class='ctx'> static void set_lvb_lock_pc(struct dlm_rsb *r, struct dlm_lkb *lkb,</div><div class='del'>-			    struct dlm_message *ms)</div><div class='add'>+			    const struct dlm_message *ms)</div><div class='ctx'> {</div><div class='ctx'> 	int b;</div><div class='ctx'> </div><div class='hunk'>@@ -2039,7 +1987,7 @@ static void set_lvb_lock_pc(struct dlm_rsb *r, struct dlm_lkb *lkb,</div><div class='ctx'> 		if (len &gt; r-&gt;res_ls-&gt;ls_lvblen)</div><div class='ctx'> 			len = r-&gt;res_ls-&gt;ls_lvblen;</div><div class='ctx'> 		memcpy(lkb-&gt;lkb_lvbptr, ms-&gt;m_extra, len);</div><div class='del'>-		lkb-&gt;lkb_lvbseq = ms-&gt;m_lvbseq;</div><div class='add'>+		lkb-&gt;lkb_lvbseq = le32_to_cpu(ms-&gt;m_lvbseq);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2130,7 +2078,7 @@ static void grant_lock(struct dlm_rsb *r, struct dlm_lkb *lkb)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void grant_lock_pc(struct dlm_rsb *r, struct dlm_lkb *lkb,</div><div class='del'>-			  struct dlm_message *ms)</div><div class='add'>+			  const struct dlm_message *ms)</div><div class='ctx'> {</div><div class='ctx'> 	set_lvb_lock_pc(r, lkb, ms);</div><div class='ctx'> 	_grant_lock(r, lkb);</div><div class='hunk'>@@ -2168,12 +2116,12 @@ static void munge_demoted(struct dlm_lkb *lkb)</div><div class='ctx'> 	lkb-&gt;lkb_grmode = DLM_LOCK_NL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void munge_altmode(struct dlm_lkb *lkb, struct dlm_message *ms)</div><div class='add'>+static void munge_altmode(struct dlm_lkb *lkb, const struct dlm_message *ms)</div><div class='ctx'> {</div><div class='del'>-	if (ms-&gt;m_type != DLM_MSG_REQUEST_REPLY &amp;&amp;</div><div class='del'>-	    ms-&gt;m_type != DLM_MSG_GRANT) {</div><div class='add'>+	if (ms-&gt;m_type != cpu_to_le32(DLM_MSG_REQUEST_REPLY) &amp;&amp;</div><div class='add'>+	    ms-&gt;m_type != cpu_to_le32(DLM_MSG_GRANT)) {</div><div class='ctx'> 		log_print("munge_altmode %x invalid reply type %d",</div><div class='del'>-			  lkb-&gt;lkb_id, ms-&gt;m_type);</div><div class='add'>+			  lkb-&gt;lkb_id, le32_to_cpu(ms-&gt;m_type));</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -2462,7 +2410,7 @@ static int can_be_granted(struct dlm_rsb *r, struct dlm_lkb *lkb, int now,</div><div class='ctx'> 	    conversion_deadlock_detect(r, lkb)) {</div><div class='ctx'> 		if (lkb-&gt;lkb_exflags &amp; DLM_LKF_CONVDEADLK) {</div><div class='ctx'> 			lkb-&gt;lkb_grmode = DLM_LOCK_NL;</div><div class='del'>-			lkb-&gt;lkb_sbflags |= DLM_SBF_DEMOTED;</div><div class='add'>+			set_bit(DLM_SBF_DEMOTED_BIT, &amp;lkb-&gt;lkb_sbflags);</div><div class='ctx'> 		} else if (err) {</div><div class='ctx'> 			*err = -EDEADLK;</div><div class='ctx'> 		} else {</div><div class='hunk'>@@ -2489,7 +2437,7 @@ static int can_be_granted(struct dlm_rsb *r, struct dlm_lkb *lkb, int now,</div><div class='ctx'> 		lkb-&gt;lkb_rqmode = alt;</div><div class='ctx'> 		rv = _can_be_granted(r, lkb, now, 0);</div><div class='ctx'> 		if (rv)</div><div class='del'>-			lkb-&gt;lkb_sbflags |= DLM_SBF_ALTMODE;</div><div class='add'>+			set_bit(DLM_SBF_ALTMODE_BIT, &amp;lkb-&gt;lkb_sbflags);</div><div class='ctx'> 		else</div><div class='ctx'> 			lkb-&gt;lkb_rqmode = rqmode;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2746,8 +2694,6 @@ static int set_master(struct dlm_rsb *r, struct dlm_lkb *lkb)</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	wait_pending_remove(r);</div><div class='del'>-</div><div class='ctx'> 	r-&gt;res_first_lkid = lkb-&gt;lkb_id;</div><div class='ctx'> 	send_lookup(r, lkb);</div><div class='ctx'> 	return 1;</div><div class='hunk'>@@ -2760,7 +2706,6 @@ static void process_lookup_list(struct dlm_rsb *r)</div><div class='ctx'> 	list_for_each_entry_safe(lkb, safe, &amp;r-&gt;res_lookup, lkb_rsb_lookup) {</div><div class='ctx'> 		list_del_init(&amp;lkb-&gt;lkb_rsb_lookup);</div><div class='ctx'> 		_request_lock(r, lkb);</div><div class='del'>-		schedule();</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2804,10 +2749,9 @@ static void confirm_master(struct dlm_rsb *r, int error)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int set_lock_args(int mode, struct dlm_lksb *lksb, uint32_t flags,</div><div class='del'>-			 int namelen, unsigned long timeout_cs,</div><div class='del'>-			 void (*ast) (void *astparam),</div><div class='add'>+			 int namelen, void (*ast)(void *astparam),</div><div class='ctx'> 			 void *astparam,</div><div class='del'>-			 void (*bast) (void *astparam, int mode),</div><div class='add'>+			 void (*bast)(void *astparam, int mode),</div><div class='ctx'> 			 struct dlm_args *args)</div><div class='ctx'> {</div><div class='ctx'> 	int rv = -EINVAL;</div><div class='hunk'>@@ -2861,7 +2805,6 @@ static int set_lock_args(int mode, struct dlm_lksb *lksb, uint32_t flags,</div><div class='ctx'> 	args-&gt;astfn = ast;</div><div class='ctx'> 	args-&gt;astparam = astparam;</div><div class='ctx'> 	args-&gt;bastfn = bast;</div><div class='del'>-	args-&gt;timeout = timeout_cs;</div><div class='ctx'> 	args-&gt;mode = mode;</div><div class='ctx'> 	args-&gt;lksb = lksb;</div><div class='ctx'> 	rv = 0;</div><div class='hunk'>@@ -2886,29 +2829,30 @@ static int set_unlock_args(uint32_t flags, void *astarg, struct dlm_args *args)</div><div class='ctx'> static int validate_lock_args(struct dlm_ls *ls, struct dlm_lkb *lkb,</div><div class='ctx'> 			      struct dlm_args *args)</div><div class='ctx'> {</div><div class='del'>-	int rv = -EINVAL;</div><div class='add'>+	int rv = -EBUSY;</div><div class='ctx'> </div><div class='ctx'> 	if (args-&gt;flags &amp; DLM_LKF_CONVERT) {</div><div class='del'>-		if (lkb-&gt;lkb_flags &amp; DLM_IFL_MSTCPY)</div><div class='add'>+		if (lkb-&gt;lkb_status != DLM_LKSTS_GRANTED)</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='del'>-		if (args-&gt;flags &amp; DLM_LKF_QUECVT &amp;&amp;</div><div class='del'>-		    !__quecvt_compat_matrix[lkb-&gt;lkb_grmode+1][args-&gt;mode+1])</div><div class='add'>+		/* lock not allowed if there's any op in progress */</div><div class='add'>+		if (lkb-&gt;lkb_wait_type || lkb-&gt;lkb_wait_count)</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='del'>-		rv = -EBUSY;</div><div class='del'>-		if (lkb-&gt;lkb_status != DLM_LKSTS_GRANTED)</div><div class='add'>+		if (is_overlap(lkb))</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='del'>-		if (lkb-&gt;lkb_wait_type)</div><div class='add'>+		rv = -EINVAL;</div><div class='add'>+		if (test_bit(DLM_IFL_MSTCPY_BIT, &amp;lkb-&gt;lkb_iflags))</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='del'>-		if (is_overlap(lkb))</div><div class='add'>+		if (args-&gt;flags &amp; DLM_LKF_QUECVT &amp;&amp;</div><div class='add'>+		    !__quecvt_compat_matrix[lkb-&gt;lkb_grmode+1][args-&gt;mode+1])</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	lkb-&gt;lkb_exflags = args-&gt;flags;</div><div class='del'>-	lkb-&gt;lkb_sbflags = 0;</div><div class='add'>+	dlm_set_sbflags_val(lkb, 0);</div><div class='ctx'> 	lkb-&gt;lkb_astfn = args-&gt;astfn;</div><div class='ctx'> 	lkb-&gt;lkb_astparam = args-&gt;astparam;</div><div class='ctx'> 	lkb-&gt;lkb_bastfn = args-&gt;bastfn;</div><div class='hunk'>@@ -2916,14 +2860,25 @@ static int validate_lock_args(struct dlm_ls *ls, struct dlm_lkb *lkb,</div><div class='ctx'> 	lkb-&gt;lkb_lksb = args-&gt;lksb;</div><div class='ctx'> 	lkb-&gt;lkb_lvbptr = args-&gt;lksb-&gt;sb_lvbptr;</div><div class='ctx'> 	lkb-&gt;lkb_ownpid = (int) current-&gt;pid;</div><div class='del'>-	lkb-&gt;lkb_timeout_cs = args-&gt;timeout;</div><div class='ctx'> 	rv = 0;</div><div class='ctx'>  out:</div><div class='del'>-	if (rv)</div><div class='del'>-		log_debug(ls, "validate_lock_args %d %x %x %x %d %d %s",</div><div class='del'>-			  rv, lkb-&gt;lkb_id, lkb-&gt;lkb_flags, args-&gt;flags,</div><div class='del'>-			  lkb-&gt;lkb_status, lkb-&gt;lkb_wait_type,</div><div class='del'>-			  lkb-&gt;lkb_resource-&gt;res_name);</div><div class='add'>+	switch (rv) {</div><div class='add'>+	case 0:</div><div class='add'>+		break;</div><div class='add'>+	case -EINVAL:</div><div class='add'>+		/* annoy the user because dlm usage is wrong */</div><div class='add'>+		WARN_ON(1);</div><div class='add'>+		log_error(ls, "%s %d %x %x %x %d %d", __func__,</div><div class='add'>+			  rv, lkb-&gt;lkb_id, dlm_iflags_val(lkb), args-&gt;flags,</div><div class='add'>+			  lkb-&gt;lkb_status, lkb-&gt;lkb_wait_type);</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		log_debug(ls, "%s %d %x %x %x %d %d", __func__,</div><div class='add'>+			  rv, lkb-&gt;lkb_id, dlm_iflags_val(lkb), args-&gt;flags,</div><div class='add'>+			  lkb-&gt;lkb_status, lkb-&gt;lkb_wait_type);</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	return rv;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2937,23 +2892,12 @@ static int validate_lock_args(struct dlm_ls *ls, struct dlm_lkb *lkb,</div><div class='ctx'> static int validate_unlock_args(struct dlm_lkb *lkb, struct dlm_args *args)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_ls *ls = lkb-&gt;lkb_resource-&gt;res_ls;</div><div class='del'>-	int rv = -EINVAL;</div><div class='add'>+	int rv = -EBUSY;</div><div class='ctx'> </div><div class='del'>-	if (lkb-&gt;lkb_flags &amp; DLM_IFL_MSTCPY) {</div><div class='del'>-		log_error(ls, "unlock on MSTCPY %x", lkb-&gt;lkb_id);</div><div class='del'>-		dlm_print_lkb(lkb);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* an lkb may still exist even though the lock is EOL'ed due to a</div><div class='del'>-	   cancel, unlock or failed noqueue request; an app can't use these</div><div class='del'>-	   locks; return same error as if the lkid had not been found at all */</div><div class='del'>-</div><div class='del'>-	if (lkb-&gt;lkb_flags &amp; DLM_IFL_ENDOFLIFE) {</div><div class='del'>-		log_debug(ls, "unlock on ENDOFLIFE %x", lkb-&gt;lkb_id);</div><div class='del'>-		rv = -ENOENT;</div><div class='add'>+	/* normal unlock not allowed if there's any op in progress */</div><div class='add'>+	if (!(args-&gt;flags &amp; (DLM_LKF_CANCEL | DLM_LKF_FORCEUNLOCK)) &amp;&amp;</div><div class='add'>+	    (lkb-&gt;lkb_wait_type || lkb-&gt;lkb_wait_count))</div><div class='ctx'> 		goto out;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	/* an lkb may be waiting for an rsb lookup to complete where the</div><div class='ctx'> 	   lookup was initiated by another lock */</div><div class='hunk'>@@ -2968,24 +2912,41 @@ static int validate_unlock_args(struct dlm_lkb *lkb, struct dlm_args *args)</div><div class='ctx'> 			unhold_lkb(lkb); /* undoes create_lkb() */</div><div class='ctx'> 		}</div><div class='ctx'> 		/* caller changes -EBUSY to 0 for CANCEL and FORCEUNLOCK */</div><div class='del'>-		rv = -EBUSY;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	rv = -EINVAL;</div><div class='add'>+	if (test_bit(DLM_IFL_MSTCPY_BIT, &amp;lkb-&gt;lkb_iflags)) {</div><div class='add'>+		log_error(ls, "unlock on MSTCPY %x", lkb-&gt;lkb_id);</div><div class='add'>+		dlm_print_lkb(lkb);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* an lkb may still exist even though the lock is EOL'ed due to a</div><div class='add'>+	 * cancel, unlock or failed noqueue request; an app can't use these</div><div class='add'>+	 * locks; return same error as if the lkid had not been found at all</div><div class='add'>+	 */</div><div class='add'>+</div><div class='add'>+	if (test_bit(DLM_IFL_ENDOFLIFE_BIT, &amp;lkb-&gt;lkb_iflags)) {</div><div class='add'>+		log_debug(ls, "unlock on ENDOFLIFE %x", lkb-&gt;lkb_id);</div><div class='add'>+		rv = -ENOENT;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (is_overlap_unlock(lkb))</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='ctx'> 	/* cancel not allowed with another cancel/unlock in progress */</div><div class='ctx'> </div><div class='ctx'> 	if (args-&gt;flags &amp; DLM_LKF_CANCEL) {</div><div class='ctx'> 		if (lkb-&gt;lkb_exflags &amp; DLM_LKF_CANCEL)</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='del'>-		if (is_overlap(lkb))</div><div class='add'>+		if (is_overlap_cancel(lkb))</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='del'>-		/* don't let scand try to do a cancel */</div><div class='del'>-		del_timeout(lkb);</div><div class='del'>-</div><div class='del'>-		if (lkb-&gt;lkb_flags &amp; DLM_IFL_RESEND) {</div><div class='del'>-			lkb-&gt;lkb_flags |= DLM_IFL_OVERLAP_CANCEL;</div><div class='add'>+		if (test_bit(DLM_IFL_RESEND_BIT, &amp;lkb-&gt;lkb_iflags)) {</div><div class='add'>+			set_bit(DLM_IFL_OVERLAP_CANCEL_BIT, &amp;lkb-&gt;lkb_iflags);</div><div class='ctx'> 			rv = -EBUSY;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -3000,7 +2961,7 @@ static int validate_unlock_args(struct dlm_lkb *lkb, struct dlm_args *args)</div><div class='ctx'> 		switch (lkb-&gt;lkb_wait_type) {</div><div class='ctx'> 		case DLM_MSG_LOOKUP:</div><div class='ctx'> 		case DLM_MSG_REQUEST:</div><div class='del'>-			lkb-&gt;lkb_flags |= DLM_IFL_OVERLAP_CANCEL;</div><div class='add'>+			set_bit(DLM_IFL_OVERLAP_CANCEL_BIT, &amp;lkb-&gt;lkb_iflags);</div><div class='ctx'> 			rv = -EBUSY;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		case DLM_MSG_UNLOCK:</div><div class='hunk'>@@ -3019,14 +2980,8 @@ static int validate_unlock_args(struct dlm_lkb *lkb, struct dlm_args *args)</div><div class='ctx'> 		if (lkb-&gt;lkb_exflags &amp; DLM_LKF_FORCEUNLOCK)</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='del'>-		if (is_overlap_unlock(lkb))</div><div class='del'>-			goto out;</div><div class='del'>-</div><div class='del'>-		/* don't let scand try to do a cancel */</div><div class='del'>-		del_timeout(lkb);</div><div class='del'>-</div><div class='del'>-		if (lkb-&gt;lkb_flags &amp; DLM_IFL_RESEND) {</div><div class='del'>-			lkb-&gt;lkb_flags |= DLM_IFL_OVERLAP_UNLOCK;</div><div class='add'>+		if (test_bit(DLM_IFL_RESEND_BIT, &amp;lkb-&gt;lkb_iflags)) {</div><div class='add'>+			set_bit(DLM_IFL_OVERLAP_UNLOCK_BIT, &amp;lkb-&gt;lkb_iflags);</div><div class='ctx'> 			rv = -EBUSY;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -3034,33 +2989,41 @@ static int validate_unlock_args(struct dlm_lkb *lkb, struct dlm_args *args)</div><div class='ctx'> 		switch (lkb-&gt;lkb_wait_type) {</div><div class='ctx'> 		case DLM_MSG_LOOKUP:</div><div class='ctx'> 		case DLM_MSG_REQUEST:</div><div class='del'>-			lkb-&gt;lkb_flags |= DLM_IFL_OVERLAP_UNLOCK;</div><div class='add'>+			set_bit(DLM_IFL_OVERLAP_UNLOCK_BIT, &amp;lkb-&gt;lkb_iflags);</div><div class='ctx'> 			rv = -EBUSY;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		case DLM_MSG_UNLOCK:</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 		/* add_to_waiters() will set OVERLAP_UNLOCK */</div><div class='del'>-		goto out_ok;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* normal unlock not allowed if there's any op in progress */</div><div class='del'>-	rv = -EBUSY;</div><div class='del'>-	if (lkb-&gt;lkb_wait_type || lkb-&gt;lkb_wait_count)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='ctx'>  out_ok:</div><div class='ctx'> 	/* an overlapping op shouldn't blow away exflags from other op */</div><div class='ctx'> 	lkb-&gt;lkb_exflags |= args-&gt;flags;</div><div class='del'>-	lkb-&gt;lkb_sbflags = 0;</div><div class='add'>+	dlm_set_sbflags_val(lkb, 0);</div><div class='ctx'> 	lkb-&gt;lkb_astparam = args-&gt;astparam;</div><div class='ctx'> 	rv = 0;</div><div class='ctx'>  out:</div><div class='del'>-	if (rv)</div><div class='del'>-		log_debug(ls, "validate_unlock_args %d %x %x %x %x %d %s", rv,</div><div class='del'>-			  lkb-&gt;lkb_id, lkb-&gt;lkb_flags, lkb-&gt;lkb_exflags,</div><div class='add'>+	switch (rv) {</div><div class='add'>+	case 0:</div><div class='add'>+		break;</div><div class='add'>+	case -EINVAL:</div><div class='add'>+		/* annoy the user because dlm usage is wrong */</div><div class='add'>+		WARN_ON(1);</div><div class='add'>+		log_error(ls, "%s %d %x %x %x %x %d %s", __func__, rv,</div><div class='add'>+			  lkb-&gt;lkb_id, dlm_iflags_val(lkb), lkb-&gt;lkb_exflags,</div><div class='ctx'> 			  args-&gt;flags, lkb-&gt;lkb_wait_type,</div><div class='ctx'> 			  lkb-&gt;lkb_resource-&gt;res_name);</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		log_debug(ls, "%s %d %x %x %x %x %d %s", __func__, rv,</div><div class='add'>+			  lkb-&gt;lkb_id, dlm_iflags_val(lkb), lkb-&gt;lkb_exflags,</div><div class='add'>+			  args-&gt;flags, lkb-&gt;lkb_wait_type,</div><div class='add'>+			  lkb-&gt;lkb_resource-&gt;res_name);</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	return rv;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3084,7 +3047,6 @@ static int do_request(struct dlm_rsb *r, struct dlm_lkb *lkb)</div><div class='ctx'> 	if (can_be_queued(lkb)) {</div><div class='ctx'> 		error = -EINPROGRESS;</div><div class='ctx'> 		add_lkb(r, lkb, DLM_LKSTS_WAITING);</div><div class='del'>-		add_timeout(lkb);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -3153,7 +3115,6 @@ static int do_convert(struct dlm_rsb *r, struct dlm_lkb *lkb)</div><div class='ctx'> 		error = -EINPROGRESS;</div><div class='ctx'> 		del_lkb(r, lkb);</div><div class='ctx'> 		add_lkb(r, lkb, DLM_LKSTS_CONVERT);</div><div class='del'>-		add_timeout(lkb);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -3311,8 +3272,9 @@ static int _cancel_lock(struct dlm_rsb *r, struct dlm_lkb *lkb)</div><div class='ctx'>  * request_lock(), convert_lock(), unlock_lock(), cancel_lock()</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static int request_lock(struct dlm_ls *ls, struct dlm_lkb *lkb, char *name,</div><div class='del'>-			int len, struct dlm_args *args)</div><div class='add'>+static int request_lock(struct dlm_ls *ls, struct dlm_lkb *lkb,</div><div class='add'>+			const void *name, int len,</div><div class='add'>+			struct dlm_args *args)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rsb *r;</div><div class='ctx'> 	int error;</div><div class='hunk'>@@ -3411,7 +3373,7 @@ int dlm_lock(dlm_lockspace_t *lockspace,</div><div class='ctx'> 	     int mode,</div><div class='ctx'> 	     struct dlm_lksb *lksb,</div><div class='ctx'> 	     uint32_t flags,</div><div class='del'>-	     void *name,</div><div class='add'>+	     const void *name,</div><div class='ctx'> 	     unsigned int namelen,</div><div class='ctx'> 	     uint32_t parent_lkid,</div><div class='ctx'> 	     void (*ast) (void *astarg),</div><div class='hunk'>@@ -3437,8 +3399,10 @@ int dlm_lock(dlm_lockspace_t *lockspace,</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	error = set_lock_args(mode, lksb, flags, namelen, 0, ast,</div><div class='del'>-			      astarg, bast, &amp;args);</div><div class='add'>+	trace_dlm_lock_start(ls, lkb, name, namelen, mode, flags);</div><div class='add'>+</div><div class='add'>+	error = set_lock_args(mode, lksb, flags, namelen, ast, astarg, bast,</div><div class='add'>+			      &amp;args);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out_put;</div><div class='ctx'> </div><div class='hunk'>@@ -3450,6 +3414,8 @@ int dlm_lock(dlm_lockspace_t *lockspace,</div><div class='ctx'> 	if (error == -EINPROGRESS)</div><div class='ctx'> 		error = 0;</div><div class='ctx'>  out_put:</div><div class='add'>+	trace_dlm_lock_end(ls, lkb, name, namelen, mode, flags, error, true);</div><div class='add'>+</div><div class='ctx'> 	if (convert || error)</div><div class='ctx'> 		__put_lkb(ls, lkb);</div><div class='ctx'> 	if (error == -EAGAIN || error == -EDEADLK)</div><div class='hunk'>@@ -3481,6 +3447,8 @@ int dlm_unlock(dlm_lockspace_t *lockspace,</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='add'>+	trace_dlm_unlock_start(ls, lkb, flags);</div><div class='add'>+</div><div class='ctx'> 	error = set_unlock_args(flags, astarg, &amp;args);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out_put;</div><div class='hunk'>@@ -3495,6 +3463,8 @@ int dlm_unlock(dlm_lockspace_t *lockspace,</div><div class='ctx'> 	if (error == -EBUSY &amp;&amp; (flags &amp; (DLM_LKF_CANCEL | DLM_LKF_FORCEUNLOCK)))</div><div class='ctx'> 		error = 0;</div><div class='ctx'>  out_put:</div><div class='add'>+	trace_dlm_unlock_end(ls, lkb, flags, error);</div><div class='add'>+</div><div class='ctx'> 	dlm_put_lkb(lkb);</div><div class='ctx'>  out:</div><div class='ctx'> 	dlm_unlock_recovery(ls);</div><div class='hunk'>@@ -3537,19 +3507,19 @@ static int _create_message(struct dlm_ls *ls, int mb_len,</div><div class='ctx'> 	   pass into midcomms_commit and a message buffer (mb) that we</div><div class='ctx'> 	   write our data into */</div><div class='ctx'> </div><div class='del'>-	mh = dlm_midcomms_get_mhandle(to_nodeid, mb_len, GFP_NOFS, &amp;mb);</div><div class='add'>+	mh = dlm_midcomms_get_mhandle(to_nodeid, mb_len, &amp;mb);</div><div class='ctx'> 	if (!mh)</div><div class='ctx'> 		return -ENOBUFS;</div><div class='ctx'> </div><div class='ctx'> 	ms = (struct dlm_message *) mb;</div><div class='ctx'> </div><div class='del'>-	ms-&gt;m_header.h_version = (DLM_HEADER_MAJOR | DLM_HEADER_MINOR);</div><div class='del'>-	ms-&gt;m_header.u.h_lockspace = ls-&gt;ls_global_id;</div><div class='del'>-	ms-&gt;m_header.h_nodeid = dlm_our_nodeid();</div><div class='del'>-	ms-&gt;m_header.h_length = mb_len;</div><div class='add'>+	ms-&gt;m_header.h_version = cpu_to_le32(DLM_HEADER_MAJOR | DLM_HEADER_MINOR);</div><div class='add'>+	ms-&gt;m_header.u.h_lockspace = cpu_to_le32(ls-&gt;ls_global_id);</div><div class='add'>+	ms-&gt;m_header.h_nodeid = cpu_to_le32(dlm_our_nodeid());</div><div class='add'>+	ms-&gt;m_header.h_length = cpu_to_le16(mb_len);</div><div class='ctx'> 	ms-&gt;m_header.h_cmd = DLM_MSG;</div><div class='ctx'> </div><div class='del'>-	ms-&gt;m_type = mstype;</div><div class='add'>+	ms-&gt;m_type = cpu_to_le32(mstype);</div><div class='ctx'> </div><div class='ctx'> 	*mh_ret = mh;</div><div class='ctx'> 	*ms_ret = ms;</div><div class='hunk'>@@ -3574,7 +3544,7 @@ static int create_message(struct dlm_rsb *r, struct dlm_lkb *lkb,</div><div class='ctx'> 	case DLM_MSG_REQUEST_REPLY:</div><div class='ctx'> 	case DLM_MSG_CONVERT_REPLY:</div><div class='ctx'> 	case DLM_MSG_GRANT:</div><div class='del'>-		if (lkb &amp;&amp; lkb-&gt;lkb_lvbptr)</div><div class='add'>+		if (lkb &amp;&amp; lkb-&gt;lkb_lvbptr &amp;&amp; (lkb-&gt;lkb_exflags &amp; DLM_LKF_VALBLK))</div><div class='ctx'> 			mb_len += r-&gt;res_ls-&gt;ls_lvblen;</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3586,51 +3556,51 @@ static int create_message(struct dlm_rsb *r, struct dlm_lkb *lkb,</div><div class='ctx'> /* further lowcomms enhancements or alternate implementations may make</div><div class='ctx'>    the return value from this function useful at some point */</div><div class='ctx'> </div><div class='del'>-static int send_message(struct dlm_mhandle *mh, struct dlm_message *ms)</div><div class='add'>+static int send_message(struct dlm_mhandle *mh, struct dlm_message *ms,</div><div class='add'>+			const void *name, int namelen)</div><div class='ctx'> {</div><div class='del'>-	dlm_message_out(ms);</div><div class='del'>-	dlm_midcomms_commit_mhandle(mh);</div><div class='add'>+	dlm_midcomms_commit_mhandle(mh, name, namelen);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void send_args(struct dlm_rsb *r, struct dlm_lkb *lkb,</div><div class='ctx'> 		      struct dlm_message *ms)</div><div class='ctx'> {</div><div class='del'>-	ms-&gt;m_nodeid   = lkb-&gt;lkb_nodeid;</div><div class='del'>-	ms-&gt;m_pid      = lkb-&gt;lkb_ownpid;</div><div class='del'>-	ms-&gt;m_lkid     = lkb-&gt;lkb_id;</div><div class='del'>-	ms-&gt;m_remid    = lkb-&gt;lkb_remid;</div><div class='del'>-	ms-&gt;m_exflags  = lkb-&gt;lkb_exflags;</div><div class='del'>-	ms-&gt;m_sbflags  = lkb-&gt;lkb_sbflags;</div><div class='del'>-	ms-&gt;m_flags    = lkb-&gt;lkb_flags;</div><div class='del'>-	ms-&gt;m_lvbseq   = lkb-&gt;lkb_lvbseq;</div><div class='del'>-	ms-&gt;m_status   = lkb-&gt;lkb_status;</div><div class='del'>-	ms-&gt;m_grmode   = lkb-&gt;lkb_grmode;</div><div class='del'>-	ms-&gt;m_rqmode   = lkb-&gt;lkb_rqmode;</div><div class='del'>-	ms-&gt;m_hash     = r-&gt;res_hash;</div><div class='add'>+	ms-&gt;m_nodeid   = cpu_to_le32(lkb-&gt;lkb_nodeid);</div><div class='add'>+	ms-&gt;m_pid      = cpu_to_le32(lkb-&gt;lkb_ownpid);</div><div class='add'>+	ms-&gt;m_lkid     = cpu_to_le32(lkb-&gt;lkb_id);</div><div class='add'>+	ms-&gt;m_remid    = cpu_to_le32(lkb-&gt;lkb_remid);</div><div class='add'>+	ms-&gt;m_exflags  = cpu_to_le32(lkb-&gt;lkb_exflags);</div><div class='add'>+	ms-&gt;m_sbflags  = cpu_to_le32(dlm_sbflags_val(lkb));</div><div class='add'>+	ms-&gt;m_flags    = cpu_to_le32(dlm_dflags_val(lkb));</div><div class='add'>+	ms-&gt;m_lvbseq   = cpu_to_le32(lkb-&gt;lkb_lvbseq);</div><div class='add'>+	ms-&gt;m_status   = cpu_to_le32(lkb-&gt;lkb_status);</div><div class='add'>+	ms-&gt;m_grmode   = cpu_to_le32(lkb-&gt;lkb_grmode);</div><div class='add'>+	ms-&gt;m_rqmode   = cpu_to_le32(lkb-&gt;lkb_rqmode);</div><div class='add'>+	ms-&gt;m_hash     = cpu_to_le32(r-&gt;res_hash);</div><div class='ctx'> </div><div class='ctx'> 	/* m_result and m_bastmode are set from function args,</div><div class='ctx'> 	   not from lkb fields */</div><div class='ctx'> </div><div class='ctx'> 	if (lkb-&gt;lkb_bastfn)</div><div class='del'>-		ms-&gt;m_asts |= DLM_CB_BAST;</div><div class='add'>+		ms-&gt;m_asts |= cpu_to_le32(DLM_CB_BAST);</div><div class='ctx'> 	if (lkb-&gt;lkb_astfn)</div><div class='del'>-		ms-&gt;m_asts |= DLM_CB_CAST;</div><div class='add'>+		ms-&gt;m_asts |= cpu_to_le32(DLM_CB_CAST);</div><div class='ctx'> </div><div class='ctx'> 	/* compare with switch in create_message; send_remove() doesn't</div><div class='ctx'> 	   use send_args() */</div><div class='ctx'> </div><div class='ctx'> 	switch (ms-&gt;m_type) {</div><div class='del'>-	case DLM_MSG_REQUEST:</div><div class='del'>-	case DLM_MSG_LOOKUP:</div><div class='add'>+	case cpu_to_le32(DLM_MSG_REQUEST):</div><div class='add'>+	case cpu_to_le32(DLM_MSG_LOOKUP):</div><div class='ctx'> 		memcpy(ms-&gt;m_extra, r-&gt;res_name, r-&gt;res_length);</div><div class='ctx'> 		break;</div><div class='del'>-	case DLM_MSG_CONVERT:</div><div class='del'>-	case DLM_MSG_UNLOCK:</div><div class='del'>-	case DLM_MSG_REQUEST_REPLY:</div><div class='del'>-	case DLM_MSG_CONVERT_REPLY:</div><div class='del'>-	case DLM_MSG_GRANT:</div><div class='del'>-		if (!lkb-&gt;lkb_lvbptr)</div><div class='add'>+	case cpu_to_le32(DLM_MSG_CONVERT):</div><div class='add'>+	case cpu_to_le32(DLM_MSG_UNLOCK):</div><div class='add'>+	case cpu_to_le32(DLM_MSG_REQUEST_REPLY):</div><div class='add'>+	case cpu_to_le32(DLM_MSG_CONVERT_REPLY):</div><div class='add'>+	case cpu_to_le32(DLM_MSG_GRANT):</div><div class='add'>+		if (!lkb-&gt;lkb_lvbptr || !(lkb-&gt;lkb_exflags &amp; DLM_LKF_VALBLK))</div><div class='ctx'> 			break;</div><div class='ctx'> 		memcpy(ms-&gt;m_extra, lkb-&gt;lkb_lvbptr, r-&gt;res_ls-&gt;ls_lvblen);</div><div class='ctx'> 		break;</div><div class='hunk'>@@ -3645,17 +3615,14 @@ static int send_common(struct dlm_rsb *r, struct dlm_lkb *lkb, int mstype)</div><div class='ctx'> </div><div class='ctx'> 	to_nodeid = r-&gt;res_nodeid;</div><div class='ctx'> </div><div class='del'>-	error = add_to_waiters(lkb, mstype, to_nodeid);</div><div class='del'>-	if (error)</div><div class='del'>-		return error;</div><div class='del'>-</div><div class='add'>+	add_to_waiters(lkb, mstype, to_nodeid);</div><div class='ctx'> 	error = create_message(r, lkb, to_nodeid, mstype, &amp;ms, &amp;mh);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> </div><div class='ctx'> 	send_args(r, lkb, ms);</div><div class='ctx'> </div><div class='del'>-	error = send_message(mh, ms);</div><div class='add'>+	error = send_message(mh, ms, r-&gt;res_name, r-&gt;res_length);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -3679,10 +3646,9 @@ static int send_convert(struct dlm_rsb *r, struct dlm_lkb *lkb)</div><div class='ctx'> 	/* down conversions go without a reply from the master */</div><div class='ctx'> 	if (!error &amp;&amp; down_conversion(lkb)) {</div><div class='ctx'> 		remove_from_waiters(lkb, DLM_MSG_CONVERT_REPLY);</div><div class='del'>-		r-&gt;res_ls-&gt;ls_stub_ms.m_flags = DLM_IFL_STUB_MS;</div><div class='del'>-		r-&gt;res_ls-&gt;ls_stub_ms.m_type = DLM_MSG_CONVERT_REPLY;</div><div class='del'>-		r-&gt;res_ls-&gt;ls_stub_ms.m_result = 0;</div><div class='del'>-		__receive_convert_reply(r, lkb, &amp;r-&gt;res_ls-&gt;ls_stub_ms);</div><div class='add'>+		r-&gt;res_ls-&gt;ls_local_ms.m_type = cpu_to_le32(DLM_MSG_CONVERT_REPLY);</div><div class='add'>+		r-&gt;res_ls-&gt;ls_local_ms.m_result = 0;</div><div class='add'>+		__receive_convert_reply(r, lkb, &amp;r-&gt;res_ls-&gt;ls_local_ms, true);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return error;</div><div class='hunk'>@@ -3718,7 +3684,7 @@ static int send_grant(struct dlm_rsb *r, struct dlm_lkb *lkb)</div><div class='ctx'> </div><div class='ctx'> 	ms-&gt;m_result = 0;</div><div class='ctx'> </div><div class='del'>-	error = send_message(mh, ms);</div><div class='add'>+	error = send_message(mh, ms, r-&gt;res_name, r-&gt;res_length);</div><div class='ctx'>  out:</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='hunk'>@@ -3737,9 +3703,9 @@ static int send_bast(struct dlm_rsb *r, struct dlm_lkb *lkb, int mode)</div><div class='ctx'> </div><div class='ctx'> 	send_args(r, lkb, ms);</div><div class='ctx'> </div><div class='del'>-	ms-&gt;m_bastmode = mode;</div><div class='add'>+	ms-&gt;m_bastmode = cpu_to_le32(mode);</div><div class='ctx'> </div><div class='del'>-	error = send_message(mh, ms);</div><div class='add'>+	error = send_message(mh, ms, r-&gt;res_name, r-&gt;res_length);</div><div class='ctx'>  out:</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='hunk'>@@ -3752,17 +3718,14 @@ static int send_lookup(struct dlm_rsb *r, struct dlm_lkb *lkb)</div><div class='ctx'> </div><div class='ctx'> 	to_nodeid = dlm_dir_nodeid(r);</div><div class='ctx'> </div><div class='del'>-	error = add_to_waiters(lkb, DLM_MSG_LOOKUP, to_nodeid);</div><div class='del'>-	if (error)</div><div class='del'>-		return error;</div><div class='del'>-</div><div class='add'>+	add_to_waiters(lkb, DLM_MSG_LOOKUP, to_nodeid);</div><div class='ctx'> 	error = create_message(r, NULL, to_nodeid, DLM_MSG_LOOKUP, &amp;ms, &amp;mh);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> </div><div class='ctx'> 	send_args(r, lkb, ms);</div><div class='ctx'> </div><div class='del'>-	error = send_message(mh, ms);</div><div class='add'>+	error = send_message(mh, ms, r-&gt;res_name, r-&gt;res_length);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -3785,9 +3748,9 @@ static int send_remove(struct dlm_rsb *r)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	memcpy(ms-&gt;m_extra, r-&gt;res_name, r-&gt;res_length);</div><div class='del'>-	ms-&gt;m_hash = r-&gt;res_hash;</div><div class='add'>+	ms-&gt;m_hash = cpu_to_le32(r-&gt;res_hash);</div><div class='ctx'> </div><div class='del'>-	error = send_message(mh, ms);</div><div class='add'>+	error = send_message(mh, ms, r-&gt;res_name, r-&gt;res_length);</div><div class='ctx'>  out:</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='hunk'>@@ -3807,9 +3770,9 @@ static int send_common_reply(struct dlm_rsb *r, struct dlm_lkb *lkb,</div><div class='ctx'> </div><div class='ctx'> 	send_args(r, lkb, ms);</div><div class='ctx'> </div><div class='del'>-	ms-&gt;m_result = rv;</div><div class='add'>+	ms-&gt;m_result = cpu_to_le32(to_dlm_errno(rv));</div><div class='ctx'> </div><div class='del'>-	error = send_message(mh, ms);</div><div class='add'>+	error = send_message(mh, ms, r-&gt;res_name, r-&gt;res_length);</div><div class='ctx'>  out:</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='hunk'>@@ -3834,23 +3797,24 @@ static int send_cancel_reply(struct dlm_rsb *r, struct dlm_lkb *lkb, int rv)</div><div class='ctx'> 	return send_common_reply(r, lkb, DLM_MSG_CANCEL_REPLY, rv);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int send_lookup_reply(struct dlm_ls *ls, struct dlm_message *ms_in,</div><div class='del'>-			     int ret_nodeid, int rv)</div><div class='add'>+static int send_lookup_reply(struct dlm_ls *ls,</div><div class='add'>+			     const struct dlm_message *ms_in, int ret_nodeid,</div><div class='add'>+			     int rv)</div><div class='ctx'> {</div><div class='del'>-	struct dlm_rsb *r = &amp;ls-&gt;ls_stub_rsb;</div><div class='add'>+	struct dlm_rsb *r = &amp;ls-&gt;ls_local_rsb;</div><div class='ctx'> 	struct dlm_message *ms;</div><div class='ctx'> 	struct dlm_mhandle *mh;</div><div class='del'>-	int error, nodeid = ms_in-&gt;m_header.h_nodeid;</div><div class='add'>+	int error, nodeid = le32_to_cpu(ms_in-&gt;m_header.h_nodeid);</div><div class='ctx'> </div><div class='ctx'> 	error = create_message(r, NULL, nodeid, DLM_MSG_LOOKUP_REPLY, &amp;ms, &amp;mh);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	ms-&gt;m_lkid = ms_in-&gt;m_lkid;</div><div class='del'>-	ms-&gt;m_result = rv;</div><div class='del'>-	ms-&gt;m_nodeid = ret_nodeid;</div><div class='add'>+	ms-&gt;m_result = cpu_to_le32(to_dlm_errno(rv));</div><div class='add'>+	ms-&gt;m_nodeid = cpu_to_le32(ret_nodeid);</div><div class='ctx'> </div><div class='del'>-	error = send_message(mh, ms);</div><div class='add'>+	error = send_message(mh, ms, ms_in-&gt;m_extra, receive_extralen(ms_in));</div><div class='ctx'>  out:</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='hunk'>@@ -3859,31 +3823,32 @@ static int send_lookup_reply(struct dlm_ls *ls, struct dlm_message *ms_in,</div><div class='ctx'>    of message, unlike the send side where we can safely send everything about</div><div class='ctx'>    the lkb for any type of message */</div><div class='ctx'> </div><div class='del'>-static void receive_flags(struct dlm_lkb *lkb, struct dlm_message *ms)</div><div class='add'>+static void receive_flags(struct dlm_lkb *lkb, const struct dlm_message *ms)</div><div class='ctx'> {</div><div class='del'>-	lkb-&gt;lkb_exflags = ms-&gt;m_exflags;</div><div class='del'>-	lkb-&gt;lkb_sbflags = ms-&gt;m_sbflags;</div><div class='del'>-	lkb-&gt;lkb_flags = (lkb-&gt;lkb_flags &amp; 0xFFFF0000) |</div><div class='del'>-		         (ms-&gt;m_flags &amp; 0x0000FFFF);</div><div class='add'>+	lkb-&gt;lkb_exflags = le32_to_cpu(ms-&gt;m_exflags);</div><div class='add'>+	dlm_set_sbflags_val(lkb, le32_to_cpu(ms-&gt;m_sbflags));</div><div class='add'>+	dlm_set_dflags_val(lkb, le32_to_cpu(ms-&gt;m_flags));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void receive_flags_reply(struct dlm_lkb *lkb, struct dlm_message *ms)</div><div class='add'>+static void receive_flags_reply(struct dlm_lkb *lkb,</div><div class='add'>+				const struct dlm_message *ms,</div><div class='add'>+				bool local)</div><div class='ctx'> {</div><div class='del'>-	if (ms-&gt;m_flags == DLM_IFL_STUB_MS)</div><div class='add'>+	if (local)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	lkb-&gt;lkb_sbflags = ms-&gt;m_sbflags;</div><div class='del'>-	lkb-&gt;lkb_flags = (lkb-&gt;lkb_flags &amp; 0xFFFF0000) |</div><div class='del'>-		         (ms-&gt;m_flags &amp; 0x0000FFFF);</div><div class='add'>+	dlm_set_sbflags_val(lkb, le32_to_cpu(ms-&gt;m_sbflags));</div><div class='add'>+	dlm_set_dflags_val(lkb, le32_to_cpu(ms-&gt;m_flags));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int receive_extralen(struct dlm_message *ms)</div><div class='add'>+static int receive_extralen(const struct dlm_message *ms)</div><div class='ctx'> {</div><div class='del'>-	return (ms-&gt;m_header.h_length - sizeof(struct dlm_message));</div><div class='add'>+	return (le16_to_cpu(ms-&gt;m_header.h_length) -</div><div class='add'>+		sizeof(struct dlm_message));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int receive_lvb(struct dlm_ls *ls, struct dlm_lkb *lkb,</div><div class='del'>-		       struct dlm_message *ms)</div><div class='add'>+		       const struct dlm_message *ms)</div><div class='ctx'> {</div><div class='ctx'> 	int len;</div><div class='ctx'> </div><div class='hunk'>@@ -3911,16 +3876,16 @@ static void fake_astfn(void *astparam)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int receive_request_args(struct dlm_ls *ls, struct dlm_lkb *lkb,</div><div class='del'>-				struct dlm_message *ms)</div><div class='add'>+				const struct dlm_message *ms)</div><div class='ctx'> {</div><div class='del'>-	lkb-&gt;lkb_nodeid = ms-&gt;m_header.h_nodeid;</div><div class='del'>-	lkb-&gt;lkb_ownpid = ms-&gt;m_pid;</div><div class='del'>-	lkb-&gt;lkb_remid = ms-&gt;m_lkid;</div><div class='add'>+	lkb-&gt;lkb_nodeid = le32_to_cpu(ms-&gt;m_header.h_nodeid);</div><div class='add'>+	lkb-&gt;lkb_ownpid = le32_to_cpu(ms-&gt;m_pid);</div><div class='add'>+	lkb-&gt;lkb_remid = le32_to_cpu(ms-&gt;m_lkid);</div><div class='ctx'> 	lkb-&gt;lkb_grmode = DLM_LOCK_IV;</div><div class='del'>-	lkb-&gt;lkb_rqmode = ms-&gt;m_rqmode;</div><div class='add'>+	lkb-&gt;lkb_rqmode = le32_to_cpu(ms-&gt;m_rqmode);</div><div class='ctx'> </div><div class='del'>-	lkb-&gt;lkb_bastfn = (ms-&gt;m_asts &amp; DLM_CB_BAST) ? &amp;fake_bastfn : NULL;</div><div class='del'>-	lkb-&gt;lkb_astfn = (ms-&gt;m_asts &amp; DLM_CB_CAST) ? &amp;fake_astfn : NULL;</div><div class='add'>+	lkb-&gt;lkb_bastfn = (ms-&gt;m_asts &amp; cpu_to_le32(DLM_CB_BAST)) ? &amp;fake_bastfn : NULL;</div><div class='add'>+	lkb-&gt;lkb_astfn = (ms-&gt;m_asts &amp; cpu_to_le32(DLM_CB_CAST)) ? &amp;fake_astfn : NULL;</div><div class='ctx'> </div><div class='ctx'> 	if (lkb-&gt;lkb_exflags &amp; DLM_LKF_VALBLK) {</div><div class='ctx'> 		/* lkb was just created so there won't be an lvb yet */</div><div class='hunk'>@@ -3933,7 +3898,7 @@ static int receive_request_args(struct dlm_ls *ls, struct dlm_lkb *lkb,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int receive_convert_args(struct dlm_ls *ls, struct dlm_lkb *lkb,</div><div class='del'>-				struct dlm_message *ms)</div><div class='add'>+				const struct dlm_message *ms)</div><div class='ctx'> {</div><div class='ctx'> 	if (lkb-&gt;lkb_status != DLM_LKSTS_GRANTED)</div><div class='ctx'> 		return -EBUSY;</div><div class='hunk'>@@ -3941,56 +3906,65 @@ static int receive_convert_args(struct dlm_ls *ls, struct dlm_lkb *lkb,</div><div class='ctx'> 	if (receive_lvb(ls, lkb, ms))</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	lkb-&gt;lkb_rqmode = ms-&gt;m_rqmode;</div><div class='del'>-	lkb-&gt;lkb_lvbseq = ms-&gt;m_lvbseq;</div><div class='add'>+	lkb-&gt;lkb_rqmode = le32_to_cpu(ms-&gt;m_rqmode);</div><div class='add'>+	lkb-&gt;lkb_lvbseq = le32_to_cpu(ms-&gt;m_lvbseq);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int receive_unlock_args(struct dlm_ls *ls, struct dlm_lkb *lkb,</div><div class='del'>-			       struct dlm_message *ms)</div><div class='add'>+			       const struct dlm_message *ms)</div><div class='ctx'> {</div><div class='ctx'> 	if (receive_lvb(ls, lkb, ms))</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* We fill in the stub-lkb fields with the info that send_xxxx_reply()</div><div class='add'>+/* We fill in the local-lkb fields with the info that send_xxxx_reply()</div><div class='ctx'>    uses to send a reply and that the remote end uses to process the reply. */</div><div class='ctx'> </div><div class='del'>-static void setup_stub_lkb(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='add'>+static void setup_local_lkb(struct dlm_ls *ls, const struct dlm_message *ms)</div><div class='ctx'> {</div><div class='del'>-	struct dlm_lkb *lkb = &amp;ls-&gt;ls_stub_lkb;</div><div class='del'>-	lkb-&gt;lkb_nodeid = ms-&gt;m_header.h_nodeid;</div><div class='del'>-	lkb-&gt;lkb_remid = ms-&gt;m_lkid;</div><div class='add'>+	struct dlm_lkb *lkb = &amp;ls-&gt;ls_local_lkb;</div><div class='add'>+	lkb-&gt;lkb_nodeid = le32_to_cpu(ms-&gt;m_header.h_nodeid);</div><div class='add'>+	lkb-&gt;lkb_remid = le32_to_cpu(ms-&gt;m_lkid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* This is called after the rsb is locked so that we can safely inspect</div><div class='ctx'>    fields in the lkb. */</div><div class='ctx'> </div><div class='del'>-static int validate_message(struct dlm_lkb *lkb, struct dlm_message *ms)</div><div class='add'>+static int validate_message(struct dlm_lkb *lkb, const struct dlm_message *ms)</div><div class='ctx'> {</div><div class='del'>-	int from = ms-&gt;m_header.h_nodeid;</div><div class='add'>+	int from = le32_to_cpu(ms-&gt;m_header.h_nodeid);</div><div class='ctx'> 	int error = 0;</div><div class='ctx'> </div><div class='add'>+	/* currently mixing of user/kernel locks are not supported */</div><div class='add'>+	if (ms-&gt;m_flags &amp; cpu_to_le32(BIT(DLM_DFL_USER_BIT)) &amp;&amp;</div><div class='add'>+	    !test_bit(DLM_DFL_USER_BIT, &amp;lkb-&gt;lkb_dflags)) {</div><div class='add'>+		log_error(lkb-&gt;lkb_resource-&gt;res_ls,</div><div class='add'>+			  "got user dlm message for a kernel lock");</div><div class='add'>+		error = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	switch (ms-&gt;m_type) {</div><div class='del'>-	case DLM_MSG_CONVERT:</div><div class='del'>-	case DLM_MSG_UNLOCK:</div><div class='del'>-	case DLM_MSG_CANCEL:</div><div class='add'>+	case cpu_to_le32(DLM_MSG_CONVERT):</div><div class='add'>+	case cpu_to_le32(DLM_MSG_UNLOCK):</div><div class='add'>+	case cpu_to_le32(DLM_MSG_CANCEL):</div><div class='ctx'> 		if (!is_master_copy(lkb) || lkb-&gt;lkb_nodeid != from)</div><div class='ctx'> 			error = -EINVAL;</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='del'>-	case DLM_MSG_CONVERT_REPLY:</div><div class='del'>-	case DLM_MSG_UNLOCK_REPLY:</div><div class='del'>-	case DLM_MSG_CANCEL_REPLY:</div><div class='del'>-	case DLM_MSG_GRANT:</div><div class='del'>-	case DLM_MSG_BAST:</div><div class='add'>+	case cpu_to_le32(DLM_MSG_CONVERT_REPLY):</div><div class='add'>+	case cpu_to_le32(DLM_MSG_UNLOCK_REPLY):</div><div class='add'>+	case cpu_to_le32(DLM_MSG_CANCEL_REPLY):</div><div class='add'>+	case cpu_to_le32(DLM_MSG_GRANT):</div><div class='add'>+	case cpu_to_le32(DLM_MSG_BAST):</div><div class='ctx'> 		if (!is_process_copy(lkb) || lkb-&gt;lkb_nodeid != from)</div><div class='ctx'> 			error = -EINVAL;</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='del'>-	case DLM_MSG_REQUEST_REPLY:</div><div class='add'>+	case cpu_to_le32(DLM_MSG_REQUEST_REPLY):</div><div class='ctx'> 		if (!is_process_copy(lkb))</div><div class='ctx'> 			error = -EINVAL;</div><div class='ctx'> 		else if (lkb-&gt;lkb_nodeid != -1 &amp;&amp; lkb-&gt;lkb_nodeid != from)</div><div class='hunk'>@@ -4001,87 +3975,31 @@ static int validate_message(struct dlm_lkb *lkb, struct dlm_message *ms)</div><div class='ctx'> 		error = -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+out:</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		log_error(lkb-&gt;lkb_resource-&gt;res_ls,</div><div class='ctx'> 			  "ignore invalid message %d from %d %x %x %x %d",</div><div class='del'>-			  ms-&gt;m_type, from, lkb-&gt;lkb_id, lkb-&gt;lkb_remid,</div><div class='del'>-			  lkb-&gt;lkb_flags, lkb-&gt;lkb_nodeid);</div><div class='add'>+			  le32_to_cpu(ms-&gt;m_type), from, lkb-&gt;lkb_id,</div><div class='add'>+			  lkb-&gt;lkb_remid, dlm_iflags_val(lkb),</div><div class='add'>+			  lkb-&gt;lkb_nodeid);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void send_repeat_remove(struct dlm_ls *ls, char *ms_name, int len)</div><div class='del'>-{</div><div class='del'>-	char name[DLM_RESNAME_MAXLEN + 1];</div><div class='del'>-	struct dlm_message *ms;</div><div class='del'>-	struct dlm_mhandle *mh;</div><div class='del'>-	struct dlm_rsb *r;</div><div class='del'>-	uint32_t hash, b;</div><div class='del'>-	int rv, dir_nodeid;</div><div class='del'>-</div><div class='del'>-	memset(name, 0, sizeof(name));</div><div class='del'>-	memcpy(name, ms_name, len);</div><div class='del'>-</div><div class='del'>-	hash = jhash(name, len, 0);</div><div class='del'>-	b = hash &amp; (ls-&gt;ls_rsbtbl_size - 1);</div><div class='del'>-</div><div class='del'>-	dir_nodeid = dlm_hash2nodeid(ls, hash);</div><div class='del'>-</div><div class='del'>-	log_error(ls, "send_repeat_remove dir %d %s", dir_nodeid, name);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='del'>-	rv = dlm_search_rsb_tree(&amp;ls-&gt;ls_rsbtbl[b].keep, name, len, &amp;r);</div><div class='del'>-	if (!rv) {</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='del'>-		log_error(ls, "repeat_remove on keep %s", name);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rv = dlm_search_rsb_tree(&amp;ls-&gt;ls_rsbtbl[b].toss, name, len, &amp;r);</div><div class='del'>-	if (!rv) {</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='del'>-		log_error(ls, "repeat_remove on toss %s", name);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* use ls-&gt;remove_name2 to avoid conflict with shrink? */</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_remove_spin);</div><div class='del'>-	ls-&gt;ls_remove_len = len;</div><div class='del'>-	memcpy(ls-&gt;ls_remove_name, name, DLM_RESNAME_MAXLEN);</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_remove_spin);</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='del'>-</div><div class='del'>-	rv = _create_message(ls, sizeof(struct dlm_message) + len,</div><div class='del'>-			     dir_nodeid, DLM_MSG_REMOVE, &amp;ms, &amp;mh);</div><div class='del'>-	if (rv)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	memcpy(ms-&gt;m_extra, name, len);</div><div class='del'>-	ms-&gt;m_hash = hash;</div><div class='del'>-</div><div class='del'>-	send_message(mh, ms);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_remove_spin);</div><div class='del'>-	ls-&gt;ls_remove_len = 0;</div><div class='del'>-	memset(ls-&gt;ls_remove_name, 0, DLM_RESNAME_MAXLEN);</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_remove_spin);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int receive_request(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='add'>+static int receive_request(struct dlm_ls *ls, const struct dlm_message *ms)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_lkb *lkb;</div><div class='ctx'> 	struct dlm_rsb *r;</div><div class='ctx'> 	int from_nodeid;</div><div class='ctx'> 	int error, namelen = 0;</div><div class='ctx'> </div><div class='del'>-	from_nodeid = ms-&gt;m_header.h_nodeid;</div><div class='add'>+	from_nodeid = le32_to_cpu(ms-&gt;m_header.h_nodeid);</div><div class='ctx'> </div><div class='ctx'> 	error = create_lkb(ls, &amp;lkb);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> </div><div class='ctx'> 	receive_flags(lkb, ms);</div><div class='del'>-	lkb-&gt;lkb_flags |= DLM_IFL_MSTCPY;</div><div class='add'>+	set_bit(DLM_IFL_MSTCPY_BIT, &amp;lkb-&gt;lkb_iflags);</div><div class='ctx'> 	error = receive_request_args(ls, lkb, ms);</div><div class='ctx'> 	if (error) {</div><div class='ctx'> 		__put_lkb(ls, lkb);</div><div class='hunk'>@@ -4136,45 +4054,32 @@ static int receive_request(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='ctx'> 	   ENOTBLK request failures when the lookup reply designating us</div><div class='ctx'> 	   as master is delayed. */</div><div class='ctx'> </div><div class='del'>-	/* We could repeatedly return -EBADR here if our send_remove() is</div><div class='del'>-	   delayed in being sent/arriving/being processed on the dir node.</div><div class='del'>-	   Another node would repeatedly lookup up the master, and the dir</div><div class='del'>-	   node would continue returning our nodeid until our send_remove</div><div class='del'>-	   took effect.</div><div class='del'>-</div><div class='del'>-	   We send another remove message in case our previous send_remove</div><div class='del'>-	   was lost/ignored/missed somehow. */</div><div class='del'>-</div><div class='ctx'> 	if (error != -ENOTBLK) {</div><div class='ctx'> 		log_limit(ls, "receive_request %x from %d %d",</div><div class='del'>-			  ms-&gt;m_lkid, from_nodeid, error);</div><div class='add'>+			  le32_to_cpu(ms-&gt;m_lkid), from_nodeid, error);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (namelen &amp;&amp; error == -EBADR) {</div><div class='del'>-		send_repeat_remove(ls, ms-&gt;m_extra, namelen);</div><div class='del'>-		msleep(1000);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	setup_stub_lkb(ls, ms);</div><div class='del'>-	send_request_reply(&amp;ls-&gt;ls_stub_rsb, &amp;ls-&gt;ls_stub_lkb, error);</div><div class='add'>+	setup_local_lkb(ls, ms);</div><div class='add'>+	send_request_reply(&amp;ls-&gt;ls_local_rsb, &amp;ls-&gt;ls_local_lkb, error);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int receive_convert(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='add'>+static int receive_convert(struct dlm_ls *ls, const struct dlm_message *ms)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_lkb *lkb;</div><div class='ctx'> 	struct dlm_rsb *r;</div><div class='ctx'> 	int error, reply = 1;</div><div class='ctx'> </div><div class='del'>-	error = find_lkb(ls, ms-&gt;m_remid, &amp;lkb);</div><div class='add'>+	error = find_lkb(ls, le32_to_cpu(ms-&gt;m_remid), &amp;lkb);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> </div><div class='del'>-	if (lkb-&gt;lkb_remid != ms-&gt;m_lkid) {</div><div class='add'>+	if (lkb-&gt;lkb_remid != le32_to_cpu(ms-&gt;m_lkid)) {</div><div class='ctx'> 		log_error(ls, "receive_convert %x remid %x recover_seq %llu "</div><div class='ctx'> 			  "remote %d %x", lkb-&gt;lkb_id, lkb-&gt;lkb_remid,</div><div class='ctx'> 			  (unsigned long long)lkb-&gt;lkb_recover_seq,</div><div class='del'>-			  ms-&gt;m_header.h_nodeid, ms-&gt;m_lkid);</div><div class='add'>+			  le32_to_cpu(ms-&gt;m_header.h_nodeid),</div><div class='add'>+			  le32_to_cpu(ms-&gt;m_lkid));</div><div class='ctx'> 		error = -ENOENT;</div><div class='ctx'> 		dlm_put_lkb(lkb);</div><div class='ctx'> 		goto fail;</div><div class='hunk'>@@ -4210,25 +4115,26 @@ static int receive_convert(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'>  fail:</div><div class='del'>-	setup_stub_lkb(ls, ms);</div><div class='del'>-	send_convert_reply(&amp;ls-&gt;ls_stub_rsb, &amp;ls-&gt;ls_stub_lkb, error);</div><div class='add'>+	setup_local_lkb(ls, ms);</div><div class='add'>+	send_convert_reply(&amp;ls-&gt;ls_local_rsb, &amp;ls-&gt;ls_local_lkb, error);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int receive_unlock(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='add'>+static int receive_unlock(struct dlm_ls *ls, const struct dlm_message *ms)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_lkb *lkb;</div><div class='ctx'> 	struct dlm_rsb *r;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	error = find_lkb(ls, ms-&gt;m_remid, &amp;lkb);</div><div class='add'>+	error = find_lkb(ls, le32_to_cpu(ms-&gt;m_remid), &amp;lkb);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> </div><div class='del'>-	if (lkb-&gt;lkb_remid != ms-&gt;m_lkid) {</div><div class='add'>+	if (lkb-&gt;lkb_remid != le32_to_cpu(ms-&gt;m_lkid)) {</div><div class='ctx'> 		log_error(ls, "receive_unlock %x remid %x remote %d %x",</div><div class='ctx'> 			  lkb-&gt;lkb_id, lkb-&gt;lkb_remid,</div><div class='del'>-			  ms-&gt;m_header.h_nodeid, ms-&gt;m_lkid);</div><div class='add'>+			  le32_to_cpu(ms-&gt;m_header.h_nodeid),</div><div class='add'>+			  le32_to_cpu(ms-&gt;m_lkid));</div><div class='ctx'> 		error = -ENOENT;</div><div class='ctx'> 		dlm_put_lkb(lkb);</div><div class='ctx'> 		goto fail;</div><div class='hunk'>@@ -4261,18 +4167,18 @@ static int receive_unlock(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'>  fail:</div><div class='del'>-	setup_stub_lkb(ls, ms);</div><div class='del'>-	send_unlock_reply(&amp;ls-&gt;ls_stub_rsb, &amp;ls-&gt;ls_stub_lkb, error);</div><div class='add'>+	setup_local_lkb(ls, ms);</div><div class='add'>+	send_unlock_reply(&amp;ls-&gt;ls_local_rsb, &amp;ls-&gt;ls_local_lkb, error);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int receive_cancel(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='add'>+static int receive_cancel(struct dlm_ls *ls, const struct dlm_message *ms)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_lkb *lkb;</div><div class='ctx'> 	struct dlm_rsb *r;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	error = find_lkb(ls, ms-&gt;m_remid, &amp;lkb);</div><div class='add'>+	error = find_lkb(ls, le32_to_cpu(ms-&gt;m_remid), &amp;lkb);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> </div><div class='hunk'>@@ -4297,18 +4203,18 @@ static int receive_cancel(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'>  fail:</div><div class='del'>-	setup_stub_lkb(ls, ms);</div><div class='del'>-	send_cancel_reply(&amp;ls-&gt;ls_stub_rsb, &amp;ls-&gt;ls_stub_lkb, error);</div><div class='add'>+	setup_local_lkb(ls, ms);</div><div class='add'>+	send_cancel_reply(&amp;ls-&gt;ls_local_rsb, &amp;ls-&gt;ls_local_lkb, error);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int receive_grant(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='add'>+static int receive_grant(struct dlm_ls *ls, const struct dlm_message *ms)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_lkb *lkb;</div><div class='ctx'> 	struct dlm_rsb *r;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	error = find_lkb(ls, ms-&gt;m_remid, &amp;lkb);</div><div class='add'>+	error = find_lkb(ls, le32_to_cpu(ms-&gt;m_remid), &amp;lkb);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='hunk'>@@ -4321,7 +4227,7 @@ static int receive_grant(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	receive_flags_reply(lkb, ms);</div><div class='add'>+	receive_flags_reply(lkb, ms, false);</div><div class='ctx'> 	if (is_altmode(lkb))</div><div class='ctx'> 		munge_altmode(lkb, ms);</div><div class='ctx'> 	grant_lock_pc(r, lkb, ms);</div><div class='hunk'>@@ -4333,13 +4239,13 @@ static int receive_grant(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int receive_bast(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='add'>+static int receive_bast(struct dlm_ls *ls, const struct dlm_message *ms)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_lkb *lkb;</div><div class='ctx'> 	struct dlm_rsb *r;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	error = find_lkb(ls, ms-&gt;m_remid, &amp;lkb);</div><div class='add'>+	error = find_lkb(ls, le32_to_cpu(ms-&gt;m_remid), &amp;lkb);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='hunk'>@@ -4352,8 +4258,8 @@ static int receive_bast(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	queue_bast(r, lkb, ms-&gt;m_bastmode);</div><div class='del'>-	lkb-&gt;lkb_highbast = ms-&gt;m_bastmode;</div><div class='add'>+	queue_bast(r, lkb, le32_to_cpu(ms-&gt;m_bastmode));</div><div class='add'>+	lkb-&gt;lkb_highbast = le32_to_cpu(ms-&gt;m_bastmode);</div><div class='ctx'>  out:</div><div class='ctx'> 	unlock_rsb(r);</div><div class='ctx'> 	put_rsb(r);</div><div class='hunk'>@@ -4361,11 +4267,11 @@ static int receive_bast(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void receive_lookup(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='add'>+static void receive_lookup(struct dlm_ls *ls, const struct dlm_message *ms)</div><div class='ctx'> {</div><div class='ctx'> 	int len, error, ret_nodeid, from_nodeid, our_nodeid;</div><div class='ctx'> </div><div class='del'>-	from_nodeid = ms-&gt;m_header.h_nodeid;</div><div class='add'>+	from_nodeid = le32_to_cpu(ms-&gt;m_header.h_nodeid);</div><div class='ctx'> 	our_nodeid = dlm_our_nodeid();</div><div class='ctx'> </div><div class='ctx'> 	len = receive_extralen(ms);</div><div class='hunk'>@@ -4381,14 +4287,13 @@ static void receive_lookup(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='ctx'> 	send_lookup_reply(ls, ms, ret_nodeid, error);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void receive_remove(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='add'>+static void receive_remove(struct dlm_ls *ls, const struct dlm_message *ms)</div><div class='ctx'> {</div><div class='ctx'> 	char name[DLM_RESNAME_MAXLEN+1];</div><div class='ctx'> 	struct dlm_rsb *r;</div><div class='del'>-	uint32_t hash, b;</div><div class='ctx'> 	int rv, len, dir_nodeid, from_nodeid;</div><div class='ctx'> </div><div class='del'>-	from_nodeid = ms-&gt;m_header.h_nodeid;</div><div class='add'>+	from_nodeid = le32_to_cpu(ms-&gt;m_header.h_nodeid);</div><div class='ctx'> </div><div class='ctx'> 	len = receive_extralen(ms);</div><div class='ctx'> </div><div class='hunk'>@@ -4398,90 +4303,99 @@ static void receive_remove(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dir_nodeid = dlm_hash2nodeid(ls, ms-&gt;m_hash);</div><div class='add'>+	dir_nodeid = dlm_hash2nodeid(ls, le32_to_cpu(ms-&gt;m_hash));</div><div class='ctx'> 	if (dir_nodeid != dlm_our_nodeid()) {</div><div class='ctx'> 		log_error(ls, "receive_remove from %d bad nodeid %d",</div><div class='ctx'> 			  from_nodeid, dir_nodeid);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Look for name on rsbtbl.toss, if it's there, kill it.</div><div class='del'>-	   If it's on rsbtbl.keep, it's being used, and we should ignore this</div><div class='del'>-	   message.  This is an expected race between the dir node sending a</div><div class='del'>-	   request to the master node at the same time as the master node sends</div><div class='del'>-	   a remove to the dir node.  The resolution to that race is for the</div><div class='del'>-	   dir node to ignore the remove message, and the master node to</div><div class='del'>-	   recreate the master rsb when it gets a request from the dir node for</div><div class='del'>-	   an rsb it doesn't have. */</div><div class='add'>+	/*</div><div class='add'>+	 * Look for inactive rsb, if it's there, free it.</div><div class='add'>+	 * If the rsb is active, it's being used, and we should ignore this</div><div class='add'>+	 * message.  This is an expected race between the dir node sending a</div><div class='add'>+	 * request to the master node at the same time as the master node sends</div><div class='add'>+	 * a remove to the dir node.  The resolution to that race is for the</div><div class='add'>+	 * dir node to ignore the remove message, and the master node to</div><div class='add'>+	 * recreate the master rsb when it gets a request from the dir node for</div><div class='add'>+	 * an rsb it doesn't have.</div><div class='add'>+	 */</div><div class='ctx'> </div><div class='ctx'> 	memset(name, 0, sizeof(name));</div><div class='ctx'> 	memcpy(name, ms-&gt;m_extra, len);</div><div class='ctx'> </div><div class='del'>-	hash = jhash(name, len, 0);</div><div class='del'>-	b = hash &amp; (ls-&gt;ls_rsbtbl_size - 1);</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	rv = dlm_search_rsb_tree(&amp;ls-&gt;ls_rsbtbl, name, len, &amp;r);</div><div class='add'>+	if (rv) {</div><div class='add'>+		rcu_read_unlock();</div><div class='add'>+		/* should not happen */</div><div class='add'>+		log_error(ls, "%s from %d not found %s", __func__,</div><div class='add'>+			  from_nodeid, name);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='add'>+	write_lock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+	if (!rsb_flag(r, RSB_HASHED)) {</div><div class='add'>+		rcu_read_unlock();</div><div class='add'>+		write_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+		/* should not happen */</div><div class='add'>+		log_error(ls, "%s from %d got removed during removal %s",</div><div class='add'>+			  __func__, from_nodeid, name);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+	/* at this stage the rsb can only being freed here */</div><div class='add'>+	rcu_read_unlock();</div><div class='ctx'> </div><div class='del'>-	rv = dlm_search_rsb_tree(&amp;ls-&gt;ls_rsbtbl[b].toss, name, len, &amp;r);</div><div class='del'>-	if (rv) {</div><div class='del'>-		/* verify the rsb is on keep list per comment above */</div><div class='del'>-		rv = dlm_search_rsb_tree(&amp;ls-&gt;ls_rsbtbl[b].keep, name, len, &amp;r);</div><div class='del'>-		if (rv) {</div><div class='del'>-			/* should not happen */</div><div class='del'>-			log_error(ls, "receive_remove from %d not found %s",</div><div class='del'>-				  from_nodeid, name);</div><div class='del'>-			spin_unlock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='del'>-			return;</div><div class='del'>-		}</div><div class='add'>+	if (!rsb_flag(r, RSB_INACTIVE)) {</div><div class='ctx'> 		if (r-&gt;res_master_nodeid != from_nodeid) {</div><div class='ctx'> 			/* should not happen */</div><div class='del'>-			log_error(ls, "receive_remove keep from %d master %d",</div><div class='add'>+			log_error(ls, "receive_remove on active rsb from %d master %d",</div><div class='ctx'> 				  from_nodeid, r-&gt;res_master_nodeid);</div><div class='ctx'> 			dlm_print_rsb(r);</div><div class='del'>-			spin_unlock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='add'>+			write_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='ctx'> 			return;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		/* Ignore the remove message, see race comment above. */</div><div class='add'>+</div><div class='ctx'> 		log_debug(ls, "receive_remove from %d master %d first %x %s",</div><div class='ctx'> 			  from_nodeid, r-&gt;res_master_nodeid, r-&gt;res_first_lkid,</div><div class='ctx'> 			  name);</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='add'>+		write_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (r-&gt;res_master_nodeid != from_nodeid) {</div><div class='del'>-		log_error(ls, "receive_remove toss from %d master %d",</div><div class='add'>+		log_error(ls, "receive_remove inactive from %d master %d",</div><div class='ctx'> 			  from_nodeid, r-&gt;res_master_nodeid);</div><div class='ctx'> 		dlm_print_rsb(r);</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='add'>+		write_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (kref_put(&amp;r-&gt;res_ref, kill_rsb)) {</div><div class='del'>-		rb_erase(&amp;r-&gt;res_hashnode, &amp;ls-&gt;ls_rsbtbl[b].toss);</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='del'>-		dlm_free_rsb(r);</div><div class='del'>-	} else {</div><div class='del'>-		log_error(ls, "receive_remove from %d rsb ref error",</div><div class='del'>-			  from_nodeid);</div><div class='del'>-		dlm_print_rsb(r);</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_rsbtbl[b].lock);</div><div class='del'>-	}</div><div class='add'>+	list_del(&amp;r-&gt;res_slow_list);</div><div class='add'>+	rhashtable_remove_fast(&amp;ls-&gt;ls_rsbtbl, &amp;r-&gt;res_node,</div><div class='add'>+			       dlm_rhash_rsb_params);</div><div class='add'>+	rsb_clear_flag(r, RSB_HASHED);</div><div class='add'>+	write_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+</div><div class='add'>+	free_inactive_rsb(r);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void receive_purge(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='add'>+static void receive_purge(struct dlm_ls *ls, const struct dlm_message *ms)</div><div class='ctx'> {</div><div class='del'>-	do_purge(ls, ms-&gt;m_nodeid, ms-&gt;m_pid);</div><div class='add'>+	do_purge(ls, le32_to_cpu(ms-&gt;m_nodeid), le32_to_cpu(ms-&gt;m_pid));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int receive_request_reply(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='add'>+static int receive_request_reply(struct dlm_ls *ls,</div><div class='add'>+				 const struct dlm_message *ms)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_lkb *lkb;</div><div class='ctx'> 	struct dlm_rsb *r;</div><div class='ctx'> 	int error, mstype, result;</div><div class='del'>-	int from_nodeid = ms-&gt;m_header.h_nodeid;</div><div class='add'>+	int from_nodeid = le32_to_cpu(ms-&gt;m_header.h_nodeid);</div><div class='ctx'> </div><div class='del'>-	error = find_lkb(ls, ms-&gt;m_remid, &amp;lkb);</div><div class='add'>+	error = find_lkb(ls, le32_to_cpu(ms-&gt;m_remid), &amp;lkb);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='hunk'>@@ -4497,7 +4411,8 @@ static int receive_request_reply(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='ctx'> 	error = remove_from_waiters(lkb, DLM_MSG_REQUEST_REPLY);</div><div class='ctx'> 	if (error) {</div><div class='ctx'> 		log_error(ls, "receive_request_reply %x remote %d %x result %d",</div><div class='del'>-			  lkb-&gt;lkb_id, from_nodeid, ms-&gt;m_lkid, ms-&gt;m_result);</div><div class='add'>+			  lkb-&gt;lkb_id, from_nodeid, le32_to_cpu(ms-&gt;m_lkid),</div><div class='add'>+			  from_dlm_errno(le32_to_cpu(ms-&gt;m_result)));</div><div class='ctx'> 		dlm_dump_rsb(r);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -4511,7 +4426,7 @@ static int receive_request_reply(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* this is the value returned from do_request() on the master */</div><div class='del'>-	result = ms-&gt;m_result;</div><div class='add'>+	result = from_dlm_errno(le32_to_cpu(ms-&gt;m_result));</div><div class='ctx'> </div><div class='ctx'> 	switch (result) {</div><div class='ctx'> 	case -EAGAIN:</div><div class='hunk'>@@ -4524,13 +4439,12 @@ static int receive_request_reply(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='ctx'> 	case -EINPROGRESS:</div><div class='ctx'> 	case 0:</div><div class='ctx'> 		/* request was queued or granted on remote master */</div><div class='del'>-		receive_flags_reply(lkb, ms);</div><div class='del'>-		lkb-&gt;lkb_remid = ms-&gt;m_lkid;</div><div class='add'>+		receive_flags_reply(lkb, ms, false);</div><div class='add'>+		lkb-&gt;lkb_remid = le32_to_cpu(ms-&gt;m_lkid);</div><div class='ctx'> 		if (is_altmode(lkb))</div><div class='ctx'> 			munge_altmode(lkb, ms);</div><div class='ctx'> 		if (result) {</div><div class='ctx'> 			add_lkb(r, lkb, DLM_LKSTS_WAITING);</div><div class='del'>-			add_timeout(lkb);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			grant_lock_pc(r, lkb, ms);</div><div class='ctx'> 			queue_cast(r, lkb, 0);</div><div class='hunk'>@@ -4572,20 +4486,21 @@ static int receive_request_reply(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='ctx'> 			  lkb-&gt;lkb_id, result);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (is_overlap_unlock(lkb) &amp;&amp; (result == 0 || result == -EINPROGRESS)) {</div><div class='add'>+	if ((result == 0 || result == -EINPROGRESS) &amp;&amp;</div><div class='add'>+	    test_and_clear_bit(DLM_IFL_OVERLAP_UNLOCK_BIT, &amp;lkb-&gt;lkb_iflags)) {</div><div class='ctx'> 		log_debug(ls, "receive_request_reply %x result %d unlock",</div><div class='ctx'> 			  lkb-&gt;lkb_id, result);</div><div class='del'>-		lkb-&gt;lkb_flags &amp;= ~DLM_IFL_OVERLAP_UNLOCK;</div><div class='del'>-		lkb-&gt;lkb_flags &amp;= ~DLM_IFL_OVERLAP_CANCEL;</div><div class='add'>+		clear_bit(DLM_IFL_OVERLAP_CANCEL_BIT, &amp;lkb-&gt;lkb_iflags);</div><div class='ctx'> 		send_unlock(r, lkb);</div><div class='del'>-	} else if (is_overlap_cancel(lkb) &amp;&amp; (result == -EINPROGRESS)) {</div><div class='add'>+	} else if ((result == -EINPROGRESS) &amp;&amp;</div><div class='add'>+		   test_and_clear_bit(DLM_IFL_OVERLAP_CANCEL_BIT,</div><div class='add'>+				      &amp;lkb-&gt;lkb_iflags)) {</div><div class='ctx'> 		log_debug(ls, "receive_request_reply %x cancel", lkb-&gt;lkb_id);</div><div class='del'>-		lkb-&gt;lkb_flags &amp;= ~DLM_IFL_OVERLAP_UNLOCK;</div><div class='del'>-		lkb-&gt;lkb_flags &amp;= ~DLM_IFL_OVERLAP_CANCEL;</div><div class='add'>+		clear_bit(DLM_IFL_OVERLAP_UNLOCK_BIT, &amp;lkb-&gt;lkb_iflags);</div><div class='ctx'> 		send_cancel(r, lkb);</div><div class='ctx'> 	} else {</div><div class='del'>-		lkb-&gt;lkb_flags &amp;= ~DLM_IFL_OVERLAP_CANCEL;</div><div class='del'>-		lkb-&gt;lkb_flags &amp;= ~DLM_IFL_OVERLAP_UNLOCK;</div><div class='add'>+		clear_bit(DLM_IFL_OVERLAP_CANCEL_BIT, &amp;lkb-&gt;lkb_iflags);</div><div class='add'>+		clear_bit(DLM_IFL_OVERLAP_UNLOCK_BIT, &amp;lkb-&gt;lkb_iflags);</div><div class='ctx'> 	}</div><div class='ctx'>  out:</div><div class='ctx'> 	unlock_rsb(r);</div><div class='hunk'>@@ -4595,34 +4510,33 @@ static int receive_request_reply(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void __receive_convert_reply(struct dlm_rsb *r, struct dlm_lkb *lkb,</div><div class='del'>-				    struct dlm_message *ms)</div><div class='add'>+				    const struct dlm_message *ms, bool local)</div><div class='ctx'> {</div><div class='ctx'> 	/* this is the value returned from do_convert() on the master */</div><div class='del'>-	switch (ms-&gt;m_result) {</div><div class='add'>+	switch (from_dlm_errno(le32_to_cpu(ms-&gt;m_result))) {</div><div class='ctx'> 	case -EAGAIN:</div><div class='ctx'> 		/* convert would block (be queued) on remote master */</div><div class='ctx'> 		queue_cast(r, lkb, -EAGAIN);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	case -EDEADLK:</div><div class='del'>-		receive_flags_reply(lkb, ms);</div><div class='add'>+		receive_flags_reply(lkb, ms, local);</div><div class='ctx'> 		revert_lock_pc(r, lkb);</div><div class='ctx'> 		queue_cast(r, lkb, -EDEADLK);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	case -EINPROGRESS:</div><div class='ctx'> 		/* convert was queued on remote master */</div><div class='del'>-		receive_flags_reply(lkb, ms);</div><div class='add'>+		receive_flags_reply(lkb, ms, local);</div><div class='ctx'> 		if (is_demoted(lkb))</div><div class='ctx'> 			munge_demoted(lkb);</div><div class='ctx'> 		del_lkb(r, lkb);</div><div class='ctx'> 		add_lkb(r, lkb, DLM_LKSTS_CONVERT);</div><div class='del'>-		add_timeout(lkb);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	case 0:</div><div class='ctx'> 		/* convert was granted on remote master */</div><div class='del'>-		receive_flags_reply(lkb, ms);</div><div class='add'>+		receive_flags_reply(lkb, ms, local);</div><div class='ctx'> 		if (is_demoted(lkb))</div><div class='ctx'> 			munge_demoted(lkb);</div><div class='ctx'> 		grant_lock_pc(r, lkb, ms);</div><div class='hunk'>@@ -4631,14 +4545,16 @@ static void __receive_convert_reply(struct dlm_rsb *r, struct dlm_lkb *lkb,</div><div class='ctx'> </div><div class='ctx'> 	default:</div><div class='ctx'> 		log_error(r-&gt;res_ls, "receive_convert_reply %x remote %d %x %d",</div><div class='del'>-			  lkb-&gt;lkb_id, ms-&gt;m_header.h_nodeid, ms-&gt;m_lkid,</div><div class='del'>-			  ms-&gt;m_result);</div><div class='add'>+			  lkb-&gt;lkb_id, le32_to_cpu(ms-&gt;m_header.h_nodeid),</div><div class='add'>+			  le32_to_cpu(ms-&gt;m_lkid),</div><div class='add'>+			  from_dlm_errno(le32_to_cpu(ms-&gt;m_result)));</div><div class='ctx'> 		dlm_print_rsb(r);</div><div class='ctx'> 		dlm_print_lkb(lkb);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void _receive_convert_reply(struct dlm_lkb *lkb, struct dlm_message *ms)</div><div class='add'>+static void _receive_convert_reply(struct dlm_lkb *lkb,</div><div class='add'>+				   const struct dlm_message *ms, bool local)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rsb *r = lkb-&gt;lkb_resource;</div><div class='ctx'> 	int error;</div><div class='hunk'>@@ -4650,32 +4566,33 @@ static void _receive_convert_reply(struct dlm_lkb *lkb, struct dlm_message *ms)</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	/* stub reply can happen with waiters_mutex held */</div><div class='del'>-	error = remove_from_waiters_ms(lkb, ms);</div><div class='add'>+	error = remove_from_waiters_ms(lkb, ms, local);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	__receive_convert_reply(r, lkb, ms);</div><div class='add'>+	__receive_convert_reply(r, lkb, ms, local);</div><div class='ctx'>  out:</div><div class='ctx'> 	unlock_rsb(r);</div><div class='ctx'> 	put_rsb(r);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int receive_convert_reply(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='add'>+static int receive_convert_reply(struct dlm_ls *ls,</div><div class='add'>+				 const struct dlm_message *ms)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_lkb *lkb;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	error = find_lkb(ls, ms-&gt;m_remid, &amp;lkb);</div><div class='add'>+	error = find_lkb(ls, le32_to_cpu(ms-&gt;m_remid), &amp;lkb);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='del'>-	_receive_convert_reply(lkb, ms);</div><div class='add'>+	_receive_convert_reply(lkb, ms, false);</div><div class='ctx'> 	dlm_put_lkb(lkb);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void _receive_unlock_reply(struct dlm_lkb *lkb, struct dlm_message *ms)</div><div class='add'>+static void _receive_unlock_reply(struct dlm_lkb *lkb,</div><div class='add'>+				  const struct dlm_message *ms, bool local)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rsb *r = lkb-&gt;lkb_resource;</div><div class='ctx'> 	int error;</div><div class='hunk'>@@ -4687,16 +4604,15 @@ static void _receive_unlock_reply(struct dlm_lkb *lkb, struct dlm_message *ms)</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	/* stub reply can happen with waiters_mutex held */</div><div class='del'>-	error = remove_from_waiters_ms(lkb, ms);</div><div class='add'>+	error = remove_from_waiters_ms(lkb, ms, local);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	/* this is the value returned from do_unlock() on the master */</div><div class='ctx'> </div><div class='del'>-	switch (ms-&gt;m_result) {</div><div class='add'>+	switch (from_dlm_errno(le32_to_cpu(ms-&gt;m_result))) {</div><div class='ctx'> 	case -DLM_EUNLOCK:</div><div class='del'>-		receive_flags_reply(lkb, ms);</div><div class='add'>+		receive_flags_reply(lkb, ms, local);</div><div class='ctx'> 		remove_lock_pc(r, lkb);</div><div class='ctx'> 		queue_cast(r, lkb, -DLM_EUNLOCK);</div><div class='ctx'> 		break;</div><div class='hunk'>@@ -4704,28 +4620,30 @@ static void _receive_unlock_reply(struct dlm_lkb *lkb, struct dlm_message *ms)</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		log_error(r-&gt;res_ls, "receive_unlock_reply %x error %d",</div><div class='del'>-			  lkb-&gt;lkb_id, ms-&gt;m_result);</div><div class='add'>+			  lkb-&gt;lkb_id, from_dlm_errno(le32_to_cpu(ms-&gt;m_result)));</div><div class='ctx'> 	}</div><div class='ctx'>  out:</div><div class='ctx'> 	unlock_rsb(r);</div><div class='ctx'> 	put_rsb(r);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int receive_unlock_reply(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='add'>+static int receive_unlock_reply(struct dlm_ls *ls,</div><div class='add'>+				const struct dlm_message *ms)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_lkb *lkb;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	error = find_lkb(ls, ms-&gt;m_remid, &amp;lkb);</div><div class='add'>+	error = find_lkb(ls, le32_to_cpu(ms-&gt;m_remid), &amp;lkb);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='del'>-	_receive_unlock_reply(lkb, ms);</div><div class='add'>+	_receive_unlock_reply(lkb, ms, false);</div><div class='ctx'> 	dlm_put_lkb(lkb);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void _receive_cancel_reply(struct dlm_lkb *lkb, struct dlm_message *ms)</div><div class='add'>+static void _receive_cancel_reply(struct dlm_lkb *lkb,</div><div class='add'>+				  const struct dlm_message *ms, bool local)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rsb *r = lkb-&gt;lkb_resource;</div><div class='ctx'> 	int error;</div><div class='hunk'>@@ -4737,16 +4655,15 @@ static void _receive_cancel_reply(struct dlm_lkb *lkb, struct dlm_message *ms)</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	/* stub reply can happen with waiters_mutex held */</div><div class='del'>-	error = remove_from_waiters_ms(lkb, ms);</div><div class='add'>+	error = remove_from_waiters_ms(lkb, ms, local);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	/* this is the value returned from do_cancel() on the master */</div><div class='ctx'> </div><div class='del'>-	switch (ms-&gt;m_result) {</div><div class='add'>+	switch (from_dlm_errno(le32_to_cpu(ms-&gt;m_result))) {</div><div class='ctx'> 	case -DLM_ECANCEL:</div><div class='del'>-		receive_flags_reply(lkb, ms);</div><div class='add'>+		receive_flags_reply(lkb, ms, local);</div><div class='ctx'> 		revert_lock_pc(r, lkb);</div><div class='ctx'> 		queue_cast(r, lkb, -DLM_ECANCEL);</div><div class='ctx'> 		break;</div><div class='hunk'>@@ -4754,37 +4671,41 @@ static void _receive_cancel_reply(struct dlm_lkb *lkb, struct dlm_message *ms)</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		log_error(r-&gt;res_ls, "receive_cancel_reply %x error %d",</div><div class='del'>-			  lkb-&gt;lkb_id, ms-&gt;m_result);</div><div class='add'>+			  lkb-&gt;lkb_id,</div><div class='add'>+			  from_dlm_errno(le32_to_cpu(ms-&gt;m_result)));</div><div class='ctx'> 	}</div><div class='ctx'>  out:</div><div class='ctx'> 	unlock_rsb(r);</div><div class='ctx'> 	put_rsb(r);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int receive_cancel_reply(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='add'>+static int receive_cancel_reply(struct dlm_ls *ls,</div><div class='add'>+				const struct dlm_message *ms)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_lkb *lkb;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	error = find_lkb(ls, ms-&gt;m_remid, &amp;lkb);</div><div class='add'>+	error = find_lkb(ls, le32_to_cpu(ms-&gt;m_remid), &amp;lkb);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='del'>-	_receive_cancel_reply(lkb, ms);</div><div class='add'>+	_receive_cancel_reply(lkb, ms, false);</div><div class='ctx'> 	dlm_put_lkb(lkb);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void receive_lookup_reply(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='add'>+static void receive_lookup_reply(struct dlm_ls *ls,</div><div class='add'>+				 const struct dlm_message *ms)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_lkb *lkb;</div><div class='ctx'> 	struct dlm_rsb *r;</div><div class='ctx'> 	int error, ret_nodeid;</div><div class='ctx'> 	int do_lookup_list = 0;</div><div class='ctx'> </div><div class='del'>-	error = find_lkb(ls, ms-&gt;m_lkid, &amp;lkb);</div><div class='add'>+	error = find_lkb(ls, le32_to_cpu(ms-&gt;m_lkid), &amp;lkb);</div><div class='ctx'> 	if (error) {</div><div class='del'>-		log_error(ls, "receive_lookup_reply no lkid %x", ms-&gt;m_lkid);</div><div class='add'>+		log_error(ls, "%s no lkid %x", __func__,</div><div class='add'>+			  le32_to_cpu(ms-&gt;m_lkid));</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -4799,7 +4720,7 @@ static void receive_lookup_reply(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	ret_nodeid = ms-&gt;m_nodeid;</div><div class='add'>+	ret_nodeid = le32_to_cpu(ms-&gt;m_nodeid);</div><div class='ctx'> </div><div class='ctx'> 	/* We sometimes receive a request from the dir node for this</div><div class='ctx'> 	   rsb before we've received the dir node's loookup_reply for it.</div><div class='hunk'>@@ -4811,8 +4732,8 @@ static void receive_lookup_reply(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='ctx'> 		/* This should never happen */</div><div class='ctx'> 		log_error(ls, "receive_lookup_reply %x from %d ret %d "</div><div class='ctx'> 			  "master %d dir %d our %d first %x %s",</div><div class='del'>-			  lkb-&gt;lkb_id, ms-&gt;m_header.h_nodeid, ret_nodeid,</div><div class='del'>-			  r-&gt;res_master_nodeid, r-&gt;res_dir_nodeid,</div><div class='add'>+			  lkb-&gt;lkb_id, le32_to_cpu(ms-&gt;m_header.h_nodeid),</div><div class='add'>+			  ret_nodeid, r-&gt;res_master_nodeid, r-&gt;res_dir_nodeid,</div><div class='ctx'> 			  dlm_our_nodeid(), r-&gt;res_first_lkid, r-&gt;res_name);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -4824,7 +4745,7 @@ static void receive_lookup_reply(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='ctx'> 	} else if (ret_nodeid == -1) {</div><div class='ctx'> 		/* the remote node doesn't believe it's the dir node */</div><div class='ctx'> 		log_error(ls, "receive_lookup_reply %x from %d bad ret_nodeid",</div><div class='del'>-			  lkb-&gt;lkb_id, ms-&gt;m_header.h_nodeid);</div><div class='add'>+			  lkb-&gt;lkb_id, le32_to_cpu(ms-&gt;m_header.h_nodeid));</div><div class='ctx'> 		r-&gt;res_master_nodeid = 0;</div><div class='ctx'> 		r-&gt;res_nodeid = -1;</div><div class='ctx'> 		lkb-&gt;lkb_nodeid = -1;</div><div class='hunk'>@@ -4836,7 +4757,7 @@ static void receive_lookup_reply(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='ctx'> </div><div class='ctx'> 	if (is_overlap(lkb)) {</div><div class='ctx'> 		log_debug(ls, "receive_lookup_reply %x unlock %x",</div><div class='del'>-			  lkb-&gt;lkb_id, lkb-&gt;lkb_flags);</div><div class='add'>+			  lkb-&gt;lkb_id, dlm_iflags_val(lkb));</div><div class='ctx'> 		queue_cast_overlap(r, lkb);</div><div class='ctx'> 		unhold_lkb(lkb); /* undoes create_lkb() */</div><div class='ctx'> 		goto out_list;</div><div class='hunk'>@@ -4853,15 +4774,17 @@ static void receive_lookup_reply(struct dlm_ls *ls, struct dlm_message *ms)</div><div class='ctx'> 	dlm_put_lkb(lkb);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void _receive_message(struct dlm_ls *ls, struct dlm_message *ms,</div><div class='add'>+static void _receive_message(struct dlm_ls *ls, const struct dlm_message *ms,</div><div class='ctx'> 			     uint32_t saved_seq)</div><div class='ctx'> {</div><div class='ctx'> 	int error = 0, noent = 0;</div><div class='ctx'> </div><div class='del'>-	if (!dlm_is_member(ls, ms-&gt;m_header.h_nodeid)) {</div><div class='add'>+	if (WARN_ON_ONCE(!dlm_is_member(ls, le32_to_cpu(ms-&gt;m_header.h_nodeid)))) {</div><div class='ctx'> 		log_limit(ls, "receive %d from non-member %d %x %x %d",</div><div class='del'>-			  ms-&gt;m_type, ms-&gt;m_header.h_nodeid, ms-&gt;m_lkid,</div><div class='del'>-			  ms-&gt;m_remid, ms-&gt;m_result);</div><div class='add'>+			  le32_to_cpu(ms-&gt;m_type),</div><div class='add'>+			  le32_to_cpu(ms-&gt;m_header.h_nodeid),</div><div class='add'>+			  le32_to_cpu(ms-&gt;m_lkid), le32_to_cpu(ms-&gt;m_remid),</div><div class='add'>+			  from_dlm_errno(le32_to_cpu(ms-&gt;m_result)));</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -4869,77 +4792,78 @@ static void _receive_message(struct dlm_ls *ls, struct dlm_message *ms,</div><div class='ctx'> </div><div class='ctx'> 	/* messages sent to a master node */</div><div class='ctx'> </div><div class='del'>-	case DLM_MSG_REQUEST:</div><div class='add'>+	case cpu_to_le32(DLM_MSG_REQUEST):</div><div class='ctx'> 		error = receive_request(ls, ms);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='del'>-	case DLM_MSG_CONVERT:</div><div class='add'>+	case cpu_to_le32(DLM_MSG_CONVERT):</div><div class='ctx'> 		error = receive_convert(ls, ms);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='del'>-	case DLM_MSG_UNLOCK:</div><div class='add'>+	case cpu_to_le32(DLM_MSG_UNLOCK):</div><div class='ctx'> 		error = receive_unlock(ls, ms);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='del'>-	case DLM_MSG_CANCEL:</div><div class='add'>+	case cpu_to_le32(DLM_MSG_CANCEL):</div><div class='ctx'> 		noent = 1;</div><div class='ctx'> 		error = receive_cancel(ls, ms);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	/* messages sent from a master node (replies to above) */</div><div class='ctx'> </div><div class='del'>-	case DLM_MSG_REQUEST_REPLY:</div><div class='add'>+	case cpu_to_le32(DLM_MSG_REQUEST_REPLY):</div><div class='ctx'> 		error = receive_request_reply(ls, ms);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='del'>-	case DLM_MSG_CONVERT_REPLY:</div><div class='add'>+	case cpu_to_le32(DLM_MSG_CONVERT_REPLY):</div><div class='ctx'> 		error = receive_convert_reply(ls, ms);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='del'>-	case DLM_MSG_UNLOCK_REPLY:</div><div class='add'>+	case cpu_to_le32(DLM_MSG_UNLOCK_REPLY):</div><div class='ctx'> 		error = receive_unlock_reply(ls, ms);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='del'>-	case DLM_MSG_CANCEL_REPLY:</div><div class='add'>+	case cpu_to_le32(DLM_MSG_CANCEL_REPLY):</div><div class='ctx'> 		error = receive_cancel_reply(ls, ms);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	/* messages sent from a master node (only two types of async msg) */</div><div class='ctx'> </div><div class='del'>-	case DLM_MSG_GRANT:</div><div class='add'>+	case cpu_to_le32(DLM_MSG_GRANT):</div><div class='ctx'> 		noent = 1;</div><div class='ctx'> 		error = receive_grant(ls, ms);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='del'>-	case DLM_MSG_BAST:</div><div class='add'>+	case cpu_to_le32(DLM_MSG_BAST):</div><div class='ctx'> 		noent = 1;</div><div class='ctx'> 		error = receive_bast(ls, ms);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	/* messages sent to a dir node */</div><div class='ctx'> </div><div class='del'>-	case DLM_MSG_LOOKUP:</div><div class='add'>+	case cpu_to_le32(DLM_MSG_LOOKUP):</div><div class='ctx'> 		receive_lookup(ls, ms);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='del'>-	case DLM_MSG_REMOVE:</div><div class='add'>+	case cpu_to_le32(DLM_MSG_REMOVE):</div><div class='ctx'> 		receive_remove(ls, ms);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	/* messages sent from a dir node (remove has no reply) */</div><div class='ctx'> </div><div class='del'>-	case DLM_MSG_LOOKUP_REPLY:</div><div class='add'>+	case cpu_to_le32(DLM_MSG_LOOKUP_REPLY):</div><div class='ctx'> 		receive_lookup_reply(ls, ms);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	/* other messages */</div><div class='ctx'> </div><div class='del'>-	case DLM_MSG_PURGE:</div><div class='add'>+	case cpu_to_le32(DLM_MSG_PURGE):</div><div class='ctx'> 		receive_purge(ls, ms);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	default:</div><div class='del'>-		log_error(ls, "unknown message type %d", ms-&gt;m_type);</div><div class='add'>+		log_error(ls, "unknown message type %d",</div><div class='add'>+			  le32_to_cpu(ms-&gt;m_type));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -4955,22 +4879,26 @@ static void _receive_message(struct dlm_ls *ls, struct dlm_message *ms,</div><div class='ctx'> </div><div class='ctx'> 	if (error == -ENOENT &amp;&amp; noent) {</div><div class='ctx'> 		log_debug(ls, "receive %d no %x remote %d %x saved_seq %u",</div><div class='del'>-			  ms-&gt;m_type, ms-&gt;m_remid, ms-&gt;m_header.h_nodeid,</div><div class='del'>-			  ms-&gt;m_lkid, saved_seq);</div><div class='add'>+			  le32_to_cpu(ms-&gt;m_type), le32_to_cpu(ms-&gt;m_remid),</div><div class='add'>+			  le32_to_cpu(ms-&gt;m_header.h_nodeid),</div><div class='add'>+			  le32_to_cpu(ms-&gt;m_lkid), saved_seq);</div><div class='ctx'> 	} else if (error == -ENOENT) {</div><div class='ctx'> 		log_error(ls, "receive %d no %x remote %d %x saved_seq %u",</div><div class='del'>-			  ms-&gt;m_type, ms-&gt;m_remid, ms-&gt;m_header.h_nodeid,</div><div class='del'>-			  ms-&gt;m_lkid, saved_seq);</div><div class='add'>+			  le32_to_cpu(ms-&gt;m_type), le32_to_cpu(ms-&gt;m_remid),</div><div class='add'>+			  le32_to_cpu(ms-&gt;m_header.h_nodeid),</div><div class='add'>+			  le32_to_cpu(ms-&gt;m_lkid), saved_seq);</div><div class='ctx'> </div><div class='del'>-		if (ms-&gt;m_type == DLM_MSG_CONVERT)</div><div class='del'>-			dlm_dump_rsb_hash(ls, ms-&gt;m_hash);</div><div class='add'>+		if (ms-&gt;m_type == cpu_to_le32(DLM_MSG_CONVERT))</div><div class='add'>+			dlm_dump_rsb_hash(ls, le32_to_cpu(ms-&gt;m_hash));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (error == -EINVAL) {</div><div class='ctx'> 		log_error(ls, "receive %d inval from %d lkid %x remid %x "</div><div class='ctx'> 			  "saved_seq %u",</div><div class='del'>-			  ms-&gt;m_type, ms-&gt;m_header.h_nodeid,</div><div class='del'>-			  ms-&gt;m_lkid, ms-&gt;m_remid, saved_seq);</div><div class='add'>+			  le32_to_cpu(ms-&gt;m_type),</div><div class='add'>+			  le32_to_cpu(ms-&gt;m_header.h_nodeid),</div><div class='add'>+			  le32_to_cpu(ms-&gt;m_lkid), le32_to_cpu(ms-&gt;m_remid),</div><div class='add'>+			  saved_seq);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -4982,30 +4910,42 @@ static void _receive_message(struct dlm_ls *ls, struct dlm_message *ms,</div><div class='ctx'>    requestqueue, to processing all the saved messages, to processing new</div><div class='ctx'>    messages as they arrive. */</div><div class='ctx'> </div><div class='del'>-static void dlm_receive_message(struct dlm_ls *ls, struct dlm_message *ms,</div><div class='add'>+static void dlm_receive_message(struct dlm_ls *ls, const struct dlm_message *ms,</div><div class='ctx'> 				int nodeid)</div><div class='ctx'> {</div><div class='del'>-	if (dlm_locking_stopped(ls)) {</div><div class='add'>+try_again:</div><div class='add'>+	read_lock_bh(&amp;ls-&gt;ls_requestqueue_lock);</div><div class='add'>+	if (test_bit(LSFL_RECV_MSG_BLOCKED, &amp;ls-&gt;ls_flags)) {</div><div class='ctx'> 		/* If we were a member of this lockspace, left, and rejoined,</div><div class='ctx'> 		   other nodes may still be sending us messages from the</div><div class='ctx'> 		   lockspace generation before we left. */</div><div class='del'>-		if (!ls-&gt;ls_generation) {</div><div class='add'>+		if (WARN_ON_ONCE(!ls-&gt;ls_generation)) {</div><div class='add'>+			read_unlock_bh(&amp;ls-&gt;ls_requestqueue_lock);</div><div class='ctx'> 			log_limit(ls, "receive %d from %d ignore old gen",</div><div class='del'>-				  ms-&gt;m_type, nodeid);</div><div class='add'>+				  le32_to_cpu(ms-&gt;m_type), nodeid);</div><div class='ctx'> 			return;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		read_unlock_bh(&amp;ls-&gt;ls_requestqueue_lock);</div><div class='add'>+		write_lock_bh(&amp;ls-&gt;ls_requestqueue_lock);</div><div class='add'>+		/* recheck because we hold writelock now */</div><div class='add'>+		if (!test_bit(LSFL_RECV_MSG_BLOCKED, &amp;ls-&gt;ls_flags)) {</div><div class='add'>+			write_unlock_bh(&amp;ls-&gt;ls_requestqueue_lock);</div><div class='add'>+			goto try_again;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		dlm_add_requestqueue(ls, nodeid, ms);</div><div class='add'>+		write_unlock_bh(&amp;ls-&gt;ls_requestqueue_lock);</div><div class='ctx'> 	} else {</div><div class='del'>-		dlm_wait_requestqueue(ls);</div><div class='ctx'> 		_receive_message(ls, ms, 0);</div><div class='add'>+		read_unlock_bh(&amp;ls-&gt;ls_requestqueue_lock);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* This is called by dlm_recoverd to process messages that were saved on</div><div class='ctx'>    the requestqueue. */</div><div class='ctx'> </div><div class='del'>-void dlm_receive_message_saved(struct dlm_ls *ls, struct dlm_message *ms,</div><div class='add'>+void dlm_receive_message_saved(struct dlm_ls *ls, const struct dlm_message *ms,</div><div class='ctx'> 			       uint32_t saved_seq)</div><div class='ctx'> {</div><div class='ctx'> 	_receive_message(ls, ms, saved_seq);</div><div class='hunk'>@@ -5016,38 +4956,38 @@ void dlm_receive_message_saved(struct dlm_ls *ls, struct dlm_message *ms,</div><div class='ctx'>    standard locking activity) or an RCOM (recovery message sent as part of</div><div class='ctx'>    lockspace recovery). */</div><div class='ctx'> </div><div class='del'>-void dlm_receive_buffer(union dlm_packet *p, int nodeid)</div><div class='add'>+void dlm_receive_buffer(const union dlm_packet *p, int nodeid)</div><div class='ctx'> {</div><div class='del'>-	struct dlm_header *hd = &amp;p-&gt;header;</div><div class='add'>+	const struct dlm_header *hd = &amp;p-&gt;header;</div><div class='ctx'> 	struct dlm_ls *ls;</div><div class='ctx'> 	int type = 0;</div><div class='ctx'> </div><div class='ctx'> 	switch (hd-&gt;h_cmd) {</div><div class='ctx'> 	case DLM_MSG:</div><div class='del'>-		dlm_message_in(&amp;p-&gt;message);</div><div class='del'>-		type = p-&gt;message.m_type;</div><div class='add'>+		type = le32_to_cpu(p-&gt;message.m_type);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case DLM_RCOM:</div><div class='del'>-		dlm_rcom_in(&amp;p-&gt;rcom);</div><div class='del'>-		type = p-&gt;rcom.rc_type;</div><div class='add'>+		type = le32_to_cpu(p-&gt;rcom.rc_type);</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		log_print("invalid h_cmd %d from %u", hd-&gt;h_cmd, nodeid);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (hd-&gt;h_nodeid != nodeid) {</div><div class='add'>+	if (le32_to_cpu(hd-&gt;h_nodeid) != nodeid) {</div><div class='ctx'> 		log_print("invalid h_nodeid %d from %d lockspace %x",</div><div class='del'>-			  hd-&gt;h_nodeid, nodeid, hd-&gt;u.h_lockspace);</div><div class='add'>+			  le32_to_cpu(hd-&gt;h_nodeid), nodeid,</div><div class='add'>+			  le32_to_cpu(hd-&gt;u.h_lockspace));</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ls = dlm_find_lockspace_global(hd-&gt;u.h_lockspace);</div><div class='add'>+	ls = dlm_find_lockspace_global(le32_to_cpu(hd-&gt;u.h_lockspace));</div><div class='ctx'> 	if (!ls) {</div><div class='ctx'> 		if (dlm_config.ci_log_debug) {</div><div class='ctx'> 			printk_ratelimited(KERN_DEBUG "dlm: invalid lockspace "</div><div class='ctx'> 				"%u from %d cmd %d type %d\n",</div><div class='del'>-				hd-&gt;u.h_lockspace, nodeid, hd-&gt;h_cmd, type);</div><div class='add'>+				le32_to_cpu(hd-&gt;u.h_lockspace), nodeid,</div><div class='add'>+				hd-&gt;h_cmd, type);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (hd-&gt;h_cmd == DLM_RCOM &amp;&amp; type == DLM_RCOM_STATUS)</div><div class='hunk'>@@ -5058,35 +4998,40 @@ void dlm_receive_buffer(union dlm_packet *p, int nodeid)</div><div class='ctx'> 	/* this rwsem allows dlm_ls_stop() to wait for all dlm_recv threads to</div><div class='ctx'> 	   be inactive (in this ls) before transitioning to recovery mode */</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;ls-&gt;ls_recv_active);</div><div class='add'>+	read_lock_bh(&amp;ls-&gt;ls_recv_active);</div><div class='ctx'> 	if (hd-&gt;h_cmd == DLM_MSG)</div><div class='ctx'> 		dlm_receive_message(ls, &amp;p-&gt;message, nodeid);</div><div class='del'>-	else</div><div class='add'>+	else if (hd-&gt;h_cmd == DLM_RCOM)</div><div class='ctx'> 		dlm_receive_rcom(ls, &amp;p-&gt;rcom, nodeid);</div><div class='del'>-	up_read(&amp;ls-&gt;ls_recv_active);</div><div class='add'>+	else</div><div class='add'>+		log_error(ls, "invalid h_cmd %d from %d lockspace %x",</div><div class='add'>+			  hd-&gt;h_cmd, nodeid, le32_to_cpu(hd-&gt;u.h_lockspace));</div><div class='add'>+	read_unlock_bh(&amp;ls-&gt;ls_recv_active);</div><div class='ctx'> </div><div class='ctx'> 	dlm_put_lockspace(ls);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void recover_convert_waiter(struct dlm_ls *ls, struct dlm_lkb *lkb,</div><div class='del'>-				   struct dlm_message *ms_stub)</div><div class='add'>+				   struct dlm_message *ms_local)</div><div class='ctx'> {</div><div class='ctx'> 	if (middle_conversion(lkb)) {</div><div class='add'>+		log_rinfo(ls, "%s %x middle convert in progress", __func__,</div><div class='add'>+			 lkb-&gt;lkb_id);</div><div class='add'>+</div><div class='add'>+		/* We sent this lock to the new master. The new master will</div><div class='add'>+		 * tell us when it's granted.  We no longer need a reply, so</div><div class='add'>+		 * use a fake reply to put the lkb into the right state.</div><div class='add'>+		 */</div><div class='ctx'> 		hold_lkb(lkb);</div><div class='del'>-		memset(ms_stub, 0, sizeof(struct dlm_message));</div><div class='del'>-		ms_stub-&gt;m_flags = DLM_IFL_STUB_MS;</div><div class='del'>-		ms_stub-&gt;m_type = DLM_MSG_CONVERT_REPLY;</div><div class='del'>-		ms_stub-&gt;m_result = -EINPROGRESS;</div><div class='del'>-		ms_stub-&gt;m_header.h_nodeid = lkb-&gt;lkb_nodeid;</div><div class='del'>-		_receive_convert_reply(lkb, ms_stub);</div><div class='del'>-</div><div class='del'>-		/* Same special case as in receive_rcom_lock_args() */</div><div class='del'>-		lkb-&gt;lkb_grmode = DLM_LOCK_IV;</div><div class='del'>-		rsb_set_flag(lkb-&gt;lkb_resource, RSB_RECOVER_CONVERT);</div><div class='add'>+		memset(ms_local, 0, sizeof(struct dlm_message));</div><div class='add'>+		ms_local-&gt;m_type = cpu_to_le32(DLM_MSG_CONVERT_REPLY);</div><div class='add'>+		ms_local-&gt;m_result = cpu_to_le32(to_dlm_errno(-EINPROGRESS));</div><div class='add'>+		ms_local-&gt;m_header.h_nodeid = cpu_to_le32(lkb-&gt;lkb_nodeid);</div><div class='add'>+		_receive_convert_reply(lkb, ms_local, true);</div><div class='ctx'> 		unhold_lkb(lkb);</div><div class='ctx'> </div><div class='ctx'> 	} else if (lkb-&gt;lkb_rqmode &gt;= lkb-&gt;lkb_grmode) {</div><div class='del'>-		lkb-&gt;lkb_flags |= DLM_IFL_RESEND;</div><div class='add'>+		set_bit(DLM_IFL_RESEND_BIT, &amp;lkb-&gt;lkb_iflags);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* lkb-&gt;lkb_rqmode &lt; lkb-&gt;lkb_grmode shouldn't happen since down</div><div class='hunk'>@@ -5117,16 +5062,14 @@ static int waiter_needs_recovery(struct dlm_ls *ls, struct dlm_lkb *lkb,</div><div class='ctx'> void dlm_recover_waiters_pre(struct dlm_ls *ls)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_lkb *lkb, *safe;</div><div class='del'>-	struct dlm_message *ms_stub;</div><div class='del'>-	int wait_type, stub_unlock_result, stub_cancel_result;</div><div class='add'>+	struct dlm_message *ms_local;</div><div class='add'>+	int wait_type, local_unlock_result, local_cancel_result;</div><div class='ctx'> 	int dir_nodeid;</div><div class='ctx'> </div><div class='del'>-	ms_stub = kmalloc(sizeof(*ms_stub), GFP_KERNEL);</div><div class='del'>-	if (!ms_stub)</div><div class='add'>+	ms_local = kmalloc(sizeof(*ms_local), GFP_KERNEL);</div><div class='add'>+	if (!ms_local)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;ls-&gt;ls_waiters_mutex);</div><div class='del'>-</div><div class='ctx'> 	list_for_each_entry_safe(lkb, safe, &amp;ls-&gt;ls_waiters, lkb_wait_reply) {</div><div class='ctx'> </div><div class='ctx'> 		dir_nodeid = dlm_dir_nodeid(lkb-&gt;lkb_resource);</div><div class='hunk'>@@ -5150,7 +5093,7 @@ void dlm_recover_waiters_pre(struct dlm_ls *ls)</div><div class='ctx'> 		   resent after recovery is done */</div><div class='ctx'> </div><div class='ctx'> 		if (lkb-&gt;lkb_wait_type == DLM_MSG_LOOKUP) {</div><div class='del'>-			lkb-&gt;lkb_flags |= DLM_IFL_RESEND;</div><div class='add'>+			set_bit(DLM_IFL_RESEND_BIT, &amp;lkb-&gt;lkb_iflags);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -5158,8 +5101,8 @@ void dlm_recover_waiters_pre(struct dlm_ls *ls)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		wait_type = lkb-&gt;lkb_wait_type;</div><div class='del'>-		stub_unlock_result = -DLM_EUNLOCK;</div><div class='del'>-		stub_cancel_result = -DLM_ECANCEL;</div><div class='add'>+		local_unlock_result = -DLM_EUNLOCK;</div><div class='add'>+		local_cancel_result = -DLM_ECANCEL;</div><div class='ctx'> </div><div class='ctx'> 		/* Main reply may have been received leaving a zero wait_type,</div><div class='ctx'> 		   but a reply for the overlapping op may not have been</div><div class='hunk'>@@ -5170,48 +5113,46 @@ void dlm_recover_waiters_pre(struct dlm_ls *ls)</div><div class='ctx'> 			if (is_overlap_cancel(lkb)) {</div><div class='ctx'> 				wait_type = DLM_MSG_CANCEL;</div><div class='ctx'> 				if (lkb-&gt;lkb_grmode == DLM_LOCK_IV)</div><div class='del'>-					stub_cancel_result = 0;</div><div class='add'>+					local_cancel_result = 0;</div><div class='ctx'> 			}</div><div class='ctx'> 			if (is_overlap_unlock(lkb)) {</div><div class='ctx'> 				wait_type = DLM_MSG_UNLOCK;</div><div class='ctx'> 				if (lkb-&gt;lkb_grmode == DLM_LOCK_IV)</div><div class='del'>-					stub_unlock_result = -ENOENT;</div><div class='add'>+					local_unlock_result = -ENOENT;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			log_debug(ls, "rwpre overlap %x %x %d %d %d",</div><div class='del'>-				  lkb-&gt;lkb_id, lkb-&gt;lkb_flags, wait_type,</div><div class='del'>-				  stub_cancel_result, stub_unlock_result);</div><div class='add'>+				  lkb-&gt;lkb_id, dlm_iflags_val(lkb), wait_type,</div><div class='add'>+				  local_cancel_result, local_unlock_result);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		switch (wait_type) {</div><div class='ctx'> </div><div class='ctx'> 		case DLM_MSG_REQUEST:</div><div class='del'>-			lkb-&gt;lkb_flags |= DLM_IFL_RESEND;</div><div class='add'>+			set_bit(DLM_IFL_RESEND_BIT, &amp;lkb-&gt;lkb_iflags);</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='ctx'> 		case DLM_MSG_CONVERT:</div><div class='del'>-			recover_convert_waiter(ls, lkb, ms_stub);</div><div class='add'>+			recover_convert_waiter(ls, lkb, ms_local);</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='ctx'> 		case DLM_MSG_UNLOCK:</div><div class='ctx'> 			hold_lkb(lkb);</div><div class='del'>-			memset(ms_stub, 0, sizeof(struct dlm_message));</div><div class='del'>-			ms_stub-&gt;m_flags = DLM_IFL_STUB_MS;</div><div class='del'>-			ms_stub-&gt;m_type = DLM_MSG_UNLOCK_REPLY;</div><div class='del'>-			ms_stub-&gt;m_result = stub_unlock_result;</div><div class='del'>-			ms_stub-&gt;m_header.h_nodeid = lkb-&gt;lkb_nodeid;</div><div class='del'>-			_receive_unlock_reply(lkb, ms_stub);</div><div class='add'>+			memset(ms_local, 0, sizeof(struct dlm_message));</div><div class='add'>+			ms_local-&gt;m_type = cpu_to_le32(DLM_MSG_UNLOCK_REPLY);</div><div class='add'>+			ms_local-&gt;m_result = cpu_to_le32(to_dlm_errno(local_unlock_result));</div><div class='add'>+			ms_local-&gt;m_header.h_nodeid = cpu_to_le32(lkb-&gt;lkb_nodeid);</div><div class='add'>+			_receive_unlock_reply(lkb, ms_local, true);</div><div class='ctx'> 			dlm_put_lkb(lkb);</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='ctx'> 		case DLM_MSG_CANCEL:</div><div class='ctx'> 			hold_lkb(lkb);</div><div class='del'>-			memset(ms_stub, 0, sizeof(struct dlm_message));</div><div class='del'>-			ms_stub-&gt;m_flags = DLM_IFL_STUB_MS;</div><div class='del'>-			ms_stub-&gt;m_type = DLM_MSG_CANCEL_REPLY;</div><div class='del'>-			ms_stub-&gt;m_result = stub_cancel_result;</div><div class='del'>-			ms_stub-&gt;m_header.h_nodeid = lkb-&gt;lkb_nodeid;</div><div class='del'>-			_receive_cancel_reply(lkb, ms_stub);</div><div class='add'>+			memset(ms_local, 0, sizeof(struct dlm_message));</div><div class='add'>+			ms_local-&gt;m_type = cpu_to_le32(DLM_MSG_CANCEL_REPLY);</div><div class='add'>+			ms_local-&gt;m_result = cpu_to_le32(to_dlm_errno(local_cancel_result));</div><div class='add'>+			ms_local-&gt;m_header.h_nodeid = cpu_to_le32(lkb-&gt;lkb_nodeid);</div><div class='add'>+			_receive_cancel_reply(lkb, ms_local, true);</div><div class='ctx'> 			dlm_put_lkb(lkb);</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='hunk'>@@ -5221,45 +5162,52 @@ void dlm_recover_waiters_pre(struct dlm_ls *ls)</div><div class='ctx'> 		}</div><div class='ctx'> 		schedule();</div><div class='ctx'> 	}</div><div class='del'>-	mutex_unlock(&amp;ls-&gt;ls_waiters_mutex);</div><div class='del'>-	kfree(ms_stub);</div><div class='add'>+	kfree(ms_local);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct dlm_lkb *find_resend_waiter(struct dlm_ls *ls)</div><div class='ctx'> {</div><div class='del'>-	struct dlm_lkb *lkb;</div><div class='del'>-	int found = 0;</div><div class='add'>+	struct dlm_lkb *lkb = NULL, *iter;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;ls-&gt;ls_waiters_mutex);</div><div class='del'>-	list_for_each_entry(lkb, &amp;ls-&gt;ls_waiters, lkb_wait_reply) {</div><div class='del'>-		if (lkb-&gt;lkb_flags &amp; DLM_IFL_RESEND) {</div><div class='del'>-			hold_lkb(lkb);</div><div class='del'>-			found = 1;</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_waiters_lock);</div><div class='add'>+	list_for_each_entry(iter, &amp;ls-&gt;ls_waiters, lkb_wait_reply) {</div><div class='add'>+		if (test_bit(DLM_IFL_RESEND_BIT, &amp;iter-&gt;lkb_iflags)) {</div><div class='add'>+			hold_lkb(iter);</div><div class='add'>+			lkb = iter;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	mutex_unlock(&amp;ls-&gt;ls_waiters_mutex);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_waiters_lock);</div><div class='ctx'> </div><div class='del'>-	if (!found)</div><div class='del'>-		lkb = NULL;</div><div class='ctx'> 	return lkb;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Deal with lookups and lkb's marked RESEND from _pre.  We may now be the</div><div class='del'>-   master or dir-node for r.  Processing the lkb may result in it being placed</div><div class='del'>-   back on waiters. */</div><div class='del'>-</div><div class='del'>-/* We do this after normal locking has been enabled and any saved messages</div><div class='del'>-   (in requestqueue) have been processed.  We should be confident that at</div><div class='del'>-   this point we won't get or process a reply to any of these waiting</div><div class='del'>-   operations.  But, new ops may be coming in on the rsbs/locks here from</div><div class='del'>-   userspace or remotely. */</div><div class='del'>-</div><div class='del'>-/* there may have been an overlap unlock/cancel prior to recovery or after</div><div class='del'>-   recovery.  if before, the lkb may still have a pos wait_count; if after, the</div><div class='del'>-   overlap flag would just have been set and nothing new sent.  we can be</div><div class='del'>-   confident here than any replies to either the initial op or overlap ops</div><div class='del'>-   prior to recovery have been received. */</div><div class='add'>+/*</div><div class='add'>+ * Forced state reset for locks that were in the middle of remote operations</div><div class='add'>+ * when recovery happened (i.e. lkbs that were on the waiters list, waiting</div><div class='add'>+ * for a reply from a remote operation.)  The lkbs remaining on the waiters</div><div class='add'>+ * list need to be reevaluated; some may need resending to a different node</div><div class='add'>+ * than previously, and some may now need local handling rather than remote.</div><div class='add'>+ *</div><div class='add'>+ * First, the lkb state for the voided remote operation is forcibly reset,</div><div class='add'>+ * equivalent to what remove_from_waiters() would normally do:</div><div class='add'>+ * . lkb removed from ls_waiters list</div><div class='add'>+ * . lkb wait_type cleared</div><div class='add'>+ * . lkb waiters_count cleared</div><div class='add'>+ * . lkb ref count decremented for each waiters_count (almost always 1,</div><div class='add'>+ *   but possibly 2 in case of cancel/unlock overlapping, which means</div><div class='add'>+ *   two remote replies were being expected for the lkb.)</div><div class='add'>+ *</div><div class='add'>+ * Second, the lkb is reprocessed like an original operation would be,</div><div class='add'>+ * by passing it to _request_lock or _convert_lock, which will either</div><div class='add'>+ * process the lkb operation locally, or send it to a remote node again</div><div class='add'>+ * and put the lkb back onto the waiters list.</div><div class='add'>+ *</div><div class='add'>+ * When reprocessing the lkb, we may find that it's flagged for an overlapping</div><div class='add'>+ * force-unlock or cancel, either from before recovery began, or after recovery</div><div class='add'>+ * finished.  If this is the case, the unlock/cancel is done directly, and the</div><div class='add'>+ * original operation is not initiated again (no _request_lock/_convert_lock.)</div><div class='add'>+ */</div><div class='ctx'> </div><div class='ctx'> int dlm_recover_waiters_post(struct dlm_ls *ls)</div><div class='ctx'> {</div><div class='hunk'>@@ -5274,6 +5222,11 @@ int dlm_recover_waiters_post(struct dlm_ls *ls)</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		/* </div><div class='add'>+		 * Find an lkb from the waiters list that's been affected by</div><div class='add'>+		 * recovery node changes, and needs to be reprocessed.  Does</div><div class='add'>+		 * hold_lkb(), adding a refcount.</div><div class='add'>+		 */</div><div class='ctx'> 		lkb = find_resend_waiter(ls);</div><div class='ctx'> 		if (!lkb)</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -5282,9 +5235,16 @@ int dlm_recover_waiters_post(struct dlm_ls *ls)</div><div class='ctx'> 		hold_rsb(r);</div><div class='ctx'> 		lock_rsb(r);</div><div class='ctx'> </div><div class='add'>+		/*</div><div class='add'>+		 * If the lkb has been flagged for a force unlock or cancel,</div><div class='add'>+		 * then the reprocessing below will be replaced by just doing</div><div class='add'>+		 * the unlock/cancel directly.</div><div class='add'>+		 */</div><div class='ctx'> 		mstype = lkb-&gt;lkb_wait_type;</div><div class='del'>-		oc = is_overlap_cancel(lkb);</div><div class='del'>-		ou = is_overlap_unlock(lkb);</div><div class='add'>+		oc = test_and_clear_bit(DLM_IFL_OVERLAP_CANCEL_BIT,</div><div class='add'>+					&amp;lkb-&gt;lkb_iflags);</div><div class='add'>+		ou = test_and_clear_bit(DLM_IFL_OVERLAP_UNLOCK_BIT,</div><div class='add'>+					&amp;lkb-&gt;lkb_iflags);</div><div class='ctx'> 		err = 0;</div><div class='ctx'> </div><div class='ctx'> 		log_debug(ls, "waiter %x remote %x msg %d r_nodeid %d "</div><div class='hunk'>@@ -5293,19 +5253,39 @@ int dlm_recover_waiters_post(struct dlm_ls *ls)</div><div class='ctx'> 			  r-&gt;res_nodeid, lkb-&gt;lkb_nodeid, lkb-&gt;lkb_wait_nodeid,</div><div class='ctx'> 			  dlm_dir_nodeid(r), oc, ou);</div><div class='ctx'> </div><div class='del'>-		/* At this point we assume that we won't get a reply to any</div><div class='del'>-		   previous op or overlap op on this lock.  First, do a big</div><div class='del'>-		   remove_from_waiters() for all previous ops. */</div><div class='add'>+		/*</div><div class='add'>+		 * No reply to the pre-recovery operation will now be received,</div><div class='add'>+		 * so a forced equivalent of remove_from_waiters() is needed to</div><div class='add'>+		 * reset the waiters state that was in place before recovery.</div><div class='add'>+		 */</div><div class='ctx'> </div><div class='del'>-		lkb-&gt;lkb_flags &amp;= ~DLM_IFL_RESEND;</div><div class='del'>-		lkb-&gt;lkb_flags &amp;= ~DLM_IFL_OVERLAP_UNLOCK;</div><div class='del'>-		lkb-&gt;lkb_flags &amp;= ~DLM_IFL_OVERLAP_CANCEL;</div><div class='add'>+		clear_bit(DLM_IFL_RESEND_BIT, &amp;lkb-&gt;lkb_iflags);</div><div class='add'>+</div><div class='add'>+		/* Forcibly clear wait_type */</div><div class='ctx'> 		lkb-&gt;lkb_wait_type = 0;</div><div class='del'>-		lkb-&gt;lkb_wait_count = 0;</div><div class='del'>-		mutex_lock(&amp;ls-&gt;ls_waiters_mutex);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Forcibly reset wait_count and associated refcount.  The</div><div class='add'>+		 * wait_count will almost always be 1, but in case of an</div><div class='add'>+		 * overlapping unlock/cancel it could be 2: see where</div><div class='add'>+		 * add_to_waiters() finds the lkb is already on the waiters</div><div class='add'>+		 * list and does lkb_wait_count++; hold_lkb().</div><div class='add'>+		 */</div><div class='add'>+		while (lkb-&gt;lkb_wait_count) {</div><div class='add'>+			lkb-&gt;lkb_wait_count--;</div><div class='add'>+			unhold_lkb(lkb);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* Forcibly remove from waiters list */</div><div class='add'>+		spin_lock_bh(&amp;ls-&gt;ls_waiters_lock);</div><div class='ctx'> 		list_del_init(&amp;lkb-&gt;lkb_wait_reply);</div><div class='del'>-		mutex_unlock(&amp;ls-&gt;ls_waiters_mutex);</div><div class='del'>-		unhold_lkb(lkb); /* for waiters list */</div><div class='add'>+		spin_unlock_bh(&amp;ls-&gt;ls_waiters_lock);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * The lkb is now clear of all prior waiters state and can be</div><div class='add'>+		 * processed locally, or sent to remote node again, or directly</div><div class='add'>+		 * cancelled/unlocked.</div><div class='add'>+		 */</div><div class='ctx'> </div><div class='ctx'> 		if (oc || ou) {</div><div class='ctx'> 			/* do an unlock or cancel instead of resending */</div><div class='hunk'>@@ -5332,7 +5312,7 @@ int dlm_recover_waiters_post(struct dlm_ls *ls)</div><div class='ctx'> 			case DLM_MSG_LOOKUP:</div><div class='ctx'> 			case DLM_MSG_REQUEST:</div><div class='ctx'> 				_request_lock(r, lkb);</div><div class='del'>-				if (is_master(r))</div><div class='add'>+				if (r-&gt;res_nodeid != -1 &amp;&amp; is_master(r))</div><div class='ctx'> 					confirm_master(r, 0);</div><div class='ctx'> 				break;</div><div class='ctx'> 			case DLM_MSG_CONVERT:</div><div class='hunk'>@@ -5424,7 +5404,7 @@ static void purge_dead_list(struct dlm_ls *ls, struct dlm_rsb *r,</div><div class='ctx'> </div><div class='ctx'> /* Get rid of locks held by nodes that are gone. */</div><div class='ctx'> </div><div class='del'>-void dlm_recover_purge(struct dlm_ls *ls)</div><div class='add'>+void dlm_recover_purge(struct dlm_ls *ls, const struct list_head *root_list)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rsb *r;</div><div class='ctx'> 	struct dlm_member *memb;</div><div class='hunk'>@@ -5443,11 +5423,9 @@ void dlm_recover_purge(struct dlm_ls *ls)</div><div class='ctx'> 	if (!nodes_count)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;ls-&gt;ls_root_sem);</div><div class='del'>-	list_for_each_entry(r, &amp;ls-&gt;ls_root_list, res_root_list) {</div><div class='del'>-		hold_rsb(r);</div><div class='add'>+	list_for_each_entry(r, root_list, res_root_list) {</div><div class='ctx'> 		lock_rsb(r);</div><div class='del'>-		if (is_master(r)) {</div><div class='add'>+		if (r-&gt;res_nodeid != -1 &amp;&amp; is_master(r)) {</div><div class='ctx'> 			purge_dead_list(ls, r, &amp;r-&gt;res_grantqueue,</div><div class='ctx'> 					nodeid_gone, &amp;lkb_count);</div><div class='ctx'> 			purge_dead_list(ls, r, &amp;r-&gt;res_convertqueue,</div><div class='hunk'>@@ -5456,25 +5434,21 @@ void dlm_recover_purge(struct dlm_ls *ls)</div><div class='ctx'> 					nodeid_gone, &amp;lkb_count);</div><div class='ctx'> 		}</div><div class='ctx'> 		unlock_rsb(r);</div><div class='del'>-		unhold_rsb(r);</div><div class='add'>+</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 	}</div><div class='del'>-	up_write(&amp;ls-&gt;ls_root_sem);</div><div class='ctx'> </div><div class='ctx'> 	if (lkb_count)</div><div class='ctx'> 		log_rinfo(ls, "dlm_recover_purge %u locks for %u nodes",</div><div class='ctx'> 			  lkb_count, nodes_count);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct dlm_rsb *find_grant_rsb(struct dlm_ls *ls, int bucket)</div><div class='add'>+static struct dlm_rsb *find_grant_rsb(struct dlm_ls *ls)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node *n;</div><div class='ctx'> 	struct dlm_rsb *r;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_rsbtbl[bucket].lock);</div><div class='del'>-	for (n = rb_first(&amp;ls-&gt;ls_rsbtbl[bucket].keep); n; n = rb_next(n)) {</div><div class='del'>-		r = rb_entry(n, struct dlm_rsb, res_hashnode);</div><div class='del'>-</div><div class='add'>+	read_lock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+	list_for_each_entry(r, &amp;ls-&gt;ls_slow_active, res_slow_list) {</div><div class='ctx'> 		if (!rsb_flag(r, RSB_RECOVER_GRANT))</div><div class='ctx'> 			continue;</div><div class='ctx'> 		if (!is_master(r)) {</div><div class='hunk'>@@ -5482,10 +5456,10 @@ static struct dlm_rsb *find_grant_rsb(struct dlm_ls *ls, int bucket)</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> 		hold_rsb(r);</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_rsbtbl[bucket].lock);</div><div class='add'>+		read_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='ctx'> 		return r;</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_rsbtbl[bucket].lock);</div><div class='add'>+	read_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5509,19 +5483,15 @@ static struct dlm_rsb *find_grant_rsb(struct dlm_ls *ls, int bucket)</div><div class='ctx'> void dlm_recover_grant(struct dlm_ls *ls)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rsb *r;</div><div class='del'>-	int bucket = 0;</div><div class='ctx'> 	unsigned int count = 0;</div><div class='ctx'> 	unsigned int rsb_count = 0;</div><div class='ctx'> 	unsigned int lkb_count = 0;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='del'>-		r = find_grant_rsb(ls, bucket);</div><div class='del'>-		if (!r) {</div><div class='del'>-			if (bucket == ls-&gt;ls_rsbtbl_size - 1)</div><div class='del'>-				break;</div><div class='del'>-			bucket++;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='add'>+		r = find_grant_rsb(ls);</div><div class='add'>+		if (!r)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='ctx'> 		rsb_count++;</div><div class='ctx'> 		count = 0;</div><div class='ctx'> 		lock_rsb(r);</div><div class='hunk'>@@ -5571,16 +5541,16 @@ static struct dlm_lkb *search_remid(struct dlm_rsb *r, int nodeid,</div><div class='ctx'> </div><div class='ctx'> /* needs at least dlm_rcom + rcom_lock */</div><div class='ctx'> static int receive_rcom_lock_args(struct dlm_ls *ls, struct dlm_lkb *lkb,</div><div class='del'>-				  struct dlm_rsb *r, struct dlm_rcom *rc)</div><div class='add'>+				  struct dlm_rsb *r, const struct dlm_rcom *rc)</div><div class='ctx'> {</div><div class='ctx'> 	struct rcom_lock *rl = (struct rcom_lock *) rc-&gt;rc_buf;</div><div class='ctx'> </div><div class='del'>-	lkb-&gt;lkb_nodeid = rc-&gt;rc_header.h_nodeid;</div><div class='add'>+	lkb-&gt;lkb_nodeid = le32_to_cpu(rc-&gt;rc_header.h_nodeid);</div><div class='ctx'> 	lkb-&gt;lkb_ownpid = le32_to_cpu(rl-&gt;rl_ownpid);</div><div class='ctx'> 	lkb-&gt;lkb_remid = le32_to_cpu(rl-&gt;rl_lkid);</div><div class='ctx'> 	lkb-&gt;lkb_exflags = le32_to_cpu(rl-&gt;rl_exflags);</div><div class='del'>-	lkb-&gt;lkb_flags = le32_to_cpu(rl-&gt;rl_flags) &amp; 0x0000FFFF;</div><div class='del'>-	lkb-&gt;lkb_flags |= DLM_IFL_MSTCPY;</div><div class='add'>+	dlm_set_dflags_val(lkb, le32_to_cpu(rl-&gt;rl_flags));</div><div class='add'>+	set_bit(DLM_IFL_MSTCPY_BIT, &amp;lkb-&gt;lkb_iflags);</div><div class='ctx'> 	lkb-&gt;lkb_lvbseq = le32_to_cpu(rl-&gt;rl_lvbseq);</div><div class='ctx'> 	lkb-&gt;lkb_rqmode = rl-&gt;rl_rqmode;</div><div class='ctx'> 	lkb-&gt;lkb_grmode = rl-&gt;rl_grmode;</div><div class='hunk'>@@ -5590,8 +5560,8 @@ static int receive_rcom_lock_args(struct dlm_ls *ls, struct dlm_lkb *lkb,</div><div class='ctx'> 	lkb-&gt;lkb_astfn = (rl-&gt;rl_asts &amp; DLM_CB_CAST) ? &amp;fake_astfn : NULL;</div><div class='ctx'> </div><div class='ctx'> 	if (lkb-&gt;lkb_exflags &amp; DLM_LKF_VALBLK) {</div><div class='del'>-		int lvblen = rc-&gt;rc_header.h_length - sizeof(struct dlm_rcom) -</div><div class='del'>-			 sizeof(struct rcom_lock);</div><div class='add'>+		int lvblen = le16_to_cpu(rc-&gt;rc_header.h_length) -</div><div class='add'>+			sizeof(struct dlm_rcom) - sizeof(struct rcom_lock);</div><div class='ctx'> 		if (lvblen &gt; ls-&gt;ls_lvblen)</div><div class='ctx'> 			return -EINVAL;</div><div class='ctx'> 		lkb-&gt;lkb_lvbptr = dlm_allocate_lvb(ls);</div><div class='hunk'>@@ -5604,10 +5574,11 @@ static int receive_rcom_lock_args(struct dlm_ls *ls, struct dlm_lkb *lkb,</div><div class='ctx'> 	   The real granted mode of these converting locks cannot be determined</div><div class='ctx'> 	   until all locks have been rebuilt on the rsb (recover_conversion) */</div><div class='ctx'> </div><div class='del'>-	if (rl-&gt;rl_wait_type == cpu_to_le16(DLM_MSG_CONVERT) &amp;&amp;</div><div class='del'>-	    middle_conversion(lkb)) {</div><div class='del'>-		rl-&gt;rl_status = DLM_LKSTS_CONVERT;</div><div class='del'>-		lkb-&gt;lkb_grmode = DLM_LOCK_IV;</div><div class='add'>+	if (rl-&gt;rl_status == DLM_LKSTS_CONVERT &amp;&amp; middle_conversion(lkb)) {</div><div class='add'>+		/* We may need to adjust grmode depending on other granted locks. */</div><div class='add'>+		log_rinfo(ls, "%s %x middle convert gr %d rq %d remote %d %x",</div><div class='add'>+			  __func__, lkb-&gt;lkb_id, lkb-&gt;lkb_grmode,</div><div class='add'>+			  lkb-&gt;lkb_rqmode, lkb-&gt;lkb_nodeid, lkb-&gt;lkb_remid);</div><div class='ctx'> 		rsb_set_flag(r, RSB_RECOVER_CONVERT);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -5621,15 +5592,19 @@ static int receive_rcom_lock_args(struct dlm_ls *ls, struct dlm_lkb *lkb,</div><div class='ctx'>    back the rcom_lock struct we got but with the remid field filled in. */</div><div class='ctx'> </div><div class='ctx'> /* needs at least dlm_rcom + rcom_lock */</div><div class='del'>-int dlm_recover_master_copy(struct dlm_ls *ls, struct dlm_rcom *rc)</div><div class='add'>+int dlm_recover_master_copy(struct dlm_ls *ls, const struct dlm_rcom *rc,</div><div class='add'>+			    __le32 *rl_remid, __le32 *rl_result)</div><div class='ctx'> {</div><div class='ctx'> 	struct rcom_lock *rl = (struct rcom_lock *) rc-&gt;rc_buf;</div><div class='ctx'> 	struct dlm_rsb *r;</div><div class='ctx'> 	struct dlm_lkb *lkb;</div><div class='ctx'> 	uint32_t remid = 0;</div><div class='del'>-	int from_nodeid = rc-&gt;rc_header.h_nodeid;</div><div class='add'>+	int from_nodeid = le32_to_cpu(rc-&gt;rc_header.h_nodeid);</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='add'>+	/* init rl_remid with rcom lock rl_remid */</div><div class='add'>+	*rl_remid = rl-&gt;rl_remid;</div><div class='add'>+</div><div class='ctx'> 	if (rl-&gt;rl_parent_lkid) {</div><div class='ctx'> 		error = -EOPNOTSUPP;</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -5677,7 +5652,6 @@ int dlm_recover_master_copy(struct dlm_ls *ls, struct dlm_rcom *rc)</div><div class='ctx'> </div><div class='ctx'> 	attach_lkb(r, lkb);</div><div class='ctx'> 	add_lkb(r, lkb, rl-&gt;rl_status);</div><div class='del'>-	error = 0;</div><div class='ctx'> 	ls-&gt;ls_recover_locks_in++;</div><div class='ctx'> </div><div class='ctx'> 	if (!list_empty(&amp;r-&gt;res_waitqueue) || !list_empty(&amp;r-&gt;res_convertqueue))</div><div class='hunk'>@@ -5686,7 +5660,7 @@ int dlm_recover_master_copy(struct dlm_ls *ls, struct dlm_rcom *rc)</div><div class='ctx'>  out_remid:</div><div class='ctx'> 	/* this is the new value returned to the lock holder for</div><div class='ctx'> 	   saving in its process-copy lkb */</div><div class='del'>-	rl-&gt;rl_remid = cpu_to_le32(lkb-&gt;lkb_id);</div><div class='add'>+	*rl_remid = cpu_to_le32(lkb-&gt;lkb_id);</div><div class='ctx'> </div><div class='ctx'> 	lkb-&gt;lkb_recover_seq = ls-&gt;ls_recover_seq;</div><div class='ctx'> </div><div class='hunk'>@@ -5697,12 +5671,13 @@ int dlm_recover_master_copy(struct dlm_ls *ls, struct dlm_rcom *rc)</div><div class='ctx'> 	if (error &amp;&amp; error != -EEXIST)</div><div class='ctx'> 		log_rinfo(ls, "dlm_recover_master_copy remote %d %x error %d",</div><div class='ctx'> 			  from_nodeid, remid, error);</div><div class='del'>-	rl-&gt;rl_result = cpu_to_le32(error);</div><div class='add'>+	*rl_result = cpu_to_le32(error);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* needs at least dlm_rcom + rcom_lock */</div><div class='del'>-int dlm_recover_process_copy(struct dlm_ls *ls, struct dlm_rcom *rc)</div><div class='add'>+int dlm_recover_process_copy(struct dlm_ls *ls, const struct dlm_rcom *rc,</div><div class='add'>+			     uint64_t seq)</div><div class='ctx'> {</div><div class='ctx'> 	struct rcom_lock *rl = (struct rcom_lock *) rc-&gt;rc_buf;</div><div class='ctx'> 	struct dlm_rsb *r;</div><div class='hunk'>@@ -5717,7 +5692,8 @@ int dlm_recover_process_copy(struct dlm_ls *ls, struct dlm_rcom *rc)</div><div class='ctx'> 	error = find_lkb(ls, lkid, &amp;lkb);</div><div class='ctx'> 	if (error) {</div><div class='ctx'> 		log_error(ls, "dlm_recover_process_copy no %x remote %d %x %d",</div><div class='del'>-			  lkid, rc-&gt;rc_header.h_nodeid, remid, result);</div><div class='add'>+			  lkid, le32_to_cpu(rc-&gt;rc_header.h_nodeid), remid,</div><div class='add'>+			  result);</div><div class='ctx'> 		return error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -5727,7 +5703,8 @@ int dlm_recover_process_copy(struct dlm_ls *ls, struct dlm_rcom *rc)</div><div class='ctx'> </div><div class='ctx'> 	if (!is_process_copy(lkb)) {</div><div class='ctx'> 		log_error(ls, "dlm_recover_process_copy bad %x remote %d %x %d",</div><div class='del'>-			  lkid, rc-&gt;rc_header.h_nodeid, remid, result);</div><div class='add'>+			  lkid, le32_to_cpu(rc-&gt;rc_header.h_nodeid), remid,</div><div class='add'>+			  result);</div><div class='ctx'> 		dlm_dump_rsb(r);</div><div class='ctx'> 		unlock_rsb(r);</div><div class='ctx'> 		put_rsb(r);</div><div class='hunk'>@@ -5742,9 +5719,10 @@ int dlm_recover_process_copy(struct dlm_ls *ls, struct dlm_rcom *rc)</div><div class='ctx'> 		   a barrier between recover_masters and recover_locks. */</div><div class='ctx'> </div><div class='ctx'> 		log_debug(ls, "dlm_recover_process_copy %x remote %d %x %d",</div><div class='del'>-			  lkid, rc-&gt;rc_header.h_nodeid, remid, result);</div><div class='add'>+			  lkid, le32_to_cpu(rc-&gt;rc_header.h_nodeid), remid,</div><div class='add'>+			  result);</div><div class='ctx'> 	</div><div class='del'>-		dlm_send_rcom_lock(r, lkb);</div><div class='add'>+		dlm_send_rcom_lock(r, lkb, seq);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	case -EEXIST:</div><div class='ctx'> 	case 0:</div><div class='hunk'>@@ -5752,7 +5730,8 @@ int dlm_recover_process_copy(struct dlm_ls *ls, struct dlm_rcom *rc)</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		log_error(ls, "dlm_recover_process_copy %x remote %d %x %d unk",</div><div class='del'>-			  lkid, rc-&gt;rc_header.h_nodeid, remid, result);</div><div class='add'>+			  lkid, le32_to_cpu(rc-&gt;rc_header.h_nodeid), remid,</div><div class='add'>+			  result);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* an ack for dlm_recover_locks() which waits for replies from</div><div class='hunk'>@@ -5767,11 +5746,11 @@ int dlm_recover_process_copy(struct dlm_ls *ls, struct dlm_rcom *rc)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int dlm_user_request(struct dlm_ls *ls, struct dlm_user_args *ua,</div><div class='del'>-		     int mode, uint32_t flags, void *name, unsigned int namelen,</div><div class='del'>-		     unsigned long timeout_cs)</div><div class='add'>+		     int mode, uint32_t flags, void *name, unsigned int namelen)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_lkb *lkb;</div><div class='ctx'> 	struct dlm_args args;</div><div class='add'>+	bool do_put = true;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='ctx'> 	dlm_lock_recovery(ls);</div><div class='hunk'>@@ -5782,29 +5761,29 @@ int dlm_user_request(struct dlm_ls *ls, struct dlm_user_args *ua,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	trace_dlm_lock_start(ls, lkb, name, namelen, mode, flags);</div><div class='add'>+</div><div class='ctx'> 	if (flags &amp; DLM_LKF_VALBLK) {</div><div class='ctx'> 		ua-&gt;lksb.sb_lvbptr = kzalloc(DLM_USER_LVB_LEN, GFP_NOFS);</div><div class='ctx'> 		if (!ua-&gt;lksb.sb_lvbptr) {</div><div class='ctx'> 			kfree(ua);</div><div class='del'>-			__put_lkb(ls, lkb);</div><div class='ctx'> 			error = -ENOMEM;</div><div class='del'>-			goto out;</div><div class='add'>+			goto out_put;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	error = set_lock_args(mode, &amp;ua-&gt;lksb, flags, namelen, timeout_cs,</div><div class='del'>-			      fake_astfn, ua, fake_bastfn, &amp;args);</div><div class='add'>+	error = set_lock_args(mode, &amp;ua-&gt;lksb, flags, namelen, fake_astfn, ua,</div><div class='add'>+			      fake_bastfn, &amp;args);</div><div class='ctx'> 	if (error) {</div><div class='ctx'> 		kfree(ua-&gt;lksb.sb_lvbptr);</div><div class='ctx'> 		ua-&gt;lksb.sb_lvbptr = NULL;</div><div class='ctx'> 		kfree(ua);</div><div class='del'>-		__put_lkb(ls, lkb);</div><div class='del'>-		goto out;</div><div class='add'>+		goto out_put;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* After ua is attached to lkb it will be freed by dlm_free_lkb().</div><div class='del'>-	   When DLM_IFL_USER is set, the dlm knows that this is a userspace</div><div class='add'>+	   When DLM_DFL_USER_BIT is set, the dlm knows that this is a userspace</div><div class='ctx'> 	   lock and that lkb_astparam is the dlm_user_args structure. */</div><div class='del'>-	lkb-&gt;lkb_flags |= DLM_IFL_USER;</div><div class='add'>+	set_bit(DLM_DFL_USER_BIT, &amp;lkb-&gt;lkb_dflags);</div><div class='ctx'> 	error = request_lock(ls, lkb, name, namelen, &amp;args);</div><div class='ctx'> </div><div class='ctx'> 	switch (error) {</div><div class='hunk'>@@ -5817,23 +5796,26 @@ int dlm_user_request(struct dlm_ls *ls, struct dlm_user_args *ua,</div><div class='ctx'> 		error = 0;</div><div class='ctx'> 		fallthrough;</div><div class='ctx'> 	default:</div><div class='del'>-		__put_lkb(ls, lkb);</div><div class='del'>-		goto out;</div><div class='add'>+		goto out_put;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* add this new lkb to the per-process list of locks */</div><div class='del'>-	spin_lock(&amp;ua-&gt;proc-&gt;locks_spin);</div><div class='add'>+	spin_lock_bh(&amp;ua-&gt;proc-&gt;locks_spin);</div><div class='ctx'> 	hold_lkb(lkb);</div><div class='ctx'> 	list_add_tail(&amp;lkb-&gt;lkb_ownqueue, &amp;ua-&gt;proc-&gt;locks);</div><div class='del'>-	spin_unlock(&amp;ua-&gt;proc-&gt;locks_spin);</div><div class='add'>+	spin_unlock_bh(&amp;ua-&gt;proc-&gt;locks_spin);</div><div class='add'>+	do_put = false;</div><div class='add'>+ out_put:</div><div class='add'>+	trace_dlm_lock_end(ls, lkb, name, namelen, mode, flags, error, false);</div><div class='add'>+	if (do_put)</div><div class='add'>+		__put_lkb(ls, lkb);</div><div class='ctx'>  out:</div><div class='ctx'> 	dlm_unlock_recovery(ls);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int dlm_user_convert(struct dlm_ls *ls, struct dlm_user_args *ua_tmp,</div><div class='del'>-		     int mode, uint32_t flags, uint32_t lkid, char *lvb_in,</div><div class='del'>-		     unsigned long timeout_cs)</div><div class='add'>+		     int mode, uint32_t flags, uint32_t lkid, char *lvb_in)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_lkb *lkb;</div><div class='ctx'> 	struct dlm_args args;</div><div class='hunk'>@@ -5846,6 +5828,8 @@ int dlm_user_convert(struct dlm_ls *ls, struct dlm_user_args *ua_tmp,</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='add'>+	trace_dlm_lock_start(ls, lkb, NULL, 0, mode, flags);</div><div class='add'>+</div><div class='ctx'> 	/* user can change the params on its lock when it converts it, or</div><div class='ctx'> 	   add an lvb that didn't exist before */</div><div class='ctx'> </div><div class='hunk'>@@ -5868,8 +5852,8 @@ int dlm_user_convert(struct dlm_ls *ls, struct dlm_user_args *ua_tmp,</div><div class='ctx'> 	ua-&gt;bastaddr = ua_tmp-&gt;bastaddr;</div><div class='ctx'> 	ua-&gt;user_lksb = ua_tmp-&gt;user_lksb;</div><div class='ctx'> </div><div class='del'>-	error = set_lock_args(mode, &amp;ua-&gt;lksb, flags, 0, timeout_cs,</div><div class='del'>-			      fake_astfn, ua, fake_bastfn, &amp;args);</div><div class='add'>+	error = set_lock_args(mode, &amp;ua-&gt;lksb, flags, 0, fake_astfn, ua,</div><div class='add'>+			      fake_bastfn, &amp;args);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out_put;</div><div class='ctx'> </div><div class='hunk'>@@ -5878,6 +5862,7 @@ int dlm_user_convert(struct dlm_ls *ls, struct dlm_user_args *ua_tmp,</div><div class='ctx'> 	if (error == -EINPROGRESS || error == -EAGAIN || error == -EDEADLK)</div><div class='ctx'> 		error = 0;</div><div class='ctx'>  out_put:</div><div class='add'>+	trace_dlm_lock_end(ls, lkb, NULL, 0, mode, flags, error, false);</div><div class='ctx'> 	dlm_put_lkb(lkb);</div><div class='ctx'>  out:</div><div class='ctx'> 	dlm_unlock_recovery(ls);</div><div class='hunk'>@@ -5893,39 +5878,38 @@ int dlm_user_convert(struct dlm_ls *ls, struct dlm_user_args *ua_tmp,</div><div class='ctx'> </div><div class='ctx'> int dlm_user_adopt_orphan(struct dlm_ls *ls, struct dlm_user_args *ua_tmp,</div><div class='ctx'> 		     int mode, uint32_t flags, void *name, unsigned int namelen,</div><div class='del'>-		     unsigned long timeout_cs, uint32_t *lkid)</div><div class='add'>+		     uint32_t *lkid)</div><div class='ctx'> {</div><div class='del'>-	struct dlm_lkb *lkb;</div><div class='add'>+	struct dlm_lkb *lkb = NULL, *iter;</div><div class='ctx'> 	struct dlm_user_args *ua;</div><div class='ctx'> 	int found_other_mode = 0;</div><div class='del'>-	int found = 0;</div><div class='ctx'> 	int rv = 0;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;ls-&gt;ls_orphans_mutex);</div><div class='del'>-	list_for_each_entry(lkb, &amp;ls-&gt;ls_orphans, lkb_ownqueue) {</div><div class='del'>-		if (lkb-&gt;lkb_resource-&gt;res_length != namelen)</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_orphans_lock);</div><div class='add'>+	list_for_each_entry(iter, &amp;ls-&gt;ls_orphans, lkb_ownqueue) {</div><div class='add'>+		if (iter-&gt;lkb_resource-&gt;res_length != namelen)</div><div class='ctx'> 			continue;</div><div class='del'>-		if (memcmp(lkb-&gt;lkb_resource-&gt;res_name, name, namelen))</div><div class='add'>+		if (memcmp(iter-&gt;lkb_resource-&gt;res_name, name, namelen))</div><div class='ctx'> 			continue;</div><div class='del'>-		if (lkb-&gt;lkb_grmode != mode) {</div><div class='add'>+		if (iter-&gt;lkb_grmode != mode) {</div><div class='ctx'> 			found_other_mode = 1;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		found = 1;</div><div class='del'>-		list_del_init(&amp;lkb-&gt;lkb_ownqueue);</div><div class='del'>-		lkb-&gt;lkb_flags &amp;= ~DLM_IFL_ORPHAN;</div><div class='del'>-		*lkid = lkb-&gt;lkb_id;</div><div class='add'>+		lkb = iter;</div><div class='add'>+		list_del_init(&amp;iter-&gt;lkb_ownqueue);</div><div class='add'>+		clear_bit(DLM_DFL_ORPHAN_BIT, &amp;iter-&gt;lkb_dflags);</div><div class='add'>+		*lkid = iter-&gt;lkb_id;</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='del'>-	mutex_unlock(&amp;ls-&gt;ls_orphans_mutex);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_orphans_lock);</div><div class='ctx'> </div><div class='del'>-	if (!found &amp;&amp; found_other_mode) {</div><div class='add'>+	if (!lkb &amp;&amp; found_other_mode) {</div><div class='ctx'> 		rv = -EAGAIN;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!found) {</div><div class='add'>+	if (!lkb) {</div><div class='ctx'> 		rv = -ENOENT;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -5949,9 +5933,9 @@ int dlm_user_adopt_orphan(struct dlm_ls *ls, struct dlm_user_args *ua_tmp,</div><div class='ctx'> 	 * for the proc locks list.</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ua-&gt;proc-&gt;locks_spin);</div><div class='add'>+	spin_lock_bh(&amp;ua-&gt;proc-&gt;locks_spin);</div><div class='ctx'> 	list_add_tail(&amp;lkb-&gt;lkb_ownqueue, &amp;ua-&gt;proc-&gt;locks);</div><div class='del'>-	spin_unlock(&amp;ua-&gt;proc-&gt;locks_spin);</div><div class='add'>+	spin_unlock_bh(&amp;ua-&gt;proc-&gt;locks_spin);</div><div class='ctx'>  out:</div><div class='ctx'> 	kfree(ua_tmp);</div><div class='ctx'> 	return rv;</div><div class='hunk'>@@ -5971,6 +5955,8 @@ int dlm_user_unlock(struct dlm_ls *ls, struct dlm_user_args *ua_tmp,</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='add'>+	trace_dlm_unlock_start(ls, lkb, flags);</div><div class='add'>+</div><div class='ctx'> 	ua = lkb-&gt;lkb_ua;</div><div class='ctx'> </div><div class='ctx'> 	if (lvb_in &amp;&amp; ua-&gt;lksb.sb_lvbptr)</div><div class='hunk'>@@ -5993,12 +5979,13 @@ int dlm_user_unlock(struct dlm_ls *ls, struct dlm_user_args *ua_tmp,</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out_put;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ua-&gt;proc-&gt;locks_spin);</div><div class='add'>+	spin_lock_bh(&amp;ua-&gt;proc-&gt;locks_spin);</div><div class='ctx'> 	/* dlm_user_add_cb() may have already taken lkb off the proc list */</div><div class='ctx'> 	if (!list_empty(&amp;lkb-&gt;lkb_ownqueue))</div><div class='ctx'> 		list_move(&amp;lkb-&gt;lkb_ownqueue, &amp;ua-&gt;proc-&gt;unlocking);</div><div class='del'>-	spin_unlock(&amp;ua-&gt;proc-&gt;locks_spin);</div><div class='add'>+	spin_unlock_bh(&amp;ua-&gt;proc-&gt;locks_spin);</div><div class='ctx'>  out_put:</div><div class='add'>+	trace_dlm_unlock_end(ls, lkb, flags, error);</div><div class='ctx'> 	dlm_put_lkb(lkb);</div><div class='ctx'>  out:</div><div class='ctx'> 	dlm_unlock_recovery(ls);</div><div class='hunk'>@@ -6020,6 +6007,8 @@ int dlm_user_cancel(struct dlm_ls *ls, struct dlm_user_args *ua_tmp,</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='add'>+	trace_dlm_unlock_start(ls, lkb, flags);</div><div class='add'>+</div><div class='ctx'> 	ua = lkb-&gt;lkb_ua;</div><div class='ctx'> 	if (ua_tmp-&gt;castparam)</div><div class='ctx'> 		ua-&gt;castparam = ua_tmp-&gt;castparam;</div><div class='hunk'>@@ -6037,6 +6026,7 @@ int dlm_user_cancel(struct dlm_ls *ls, struct dlm_user_args *ua_tmp,</div><div class='ctx'> 	if (error == -EBUSY)</div><div class='ctx'> 		error = 0;</div><div class='ctx'>  out_put:</div><div class='add'>+	trace_dlm_unlock_end(ls, lkb, flags, error);</div><div class='ctx'> 	dlm_put_lkb(lkb);</div><div class='ctx'>  out:</div><div class='ctx'> 	dlm_unlock_recovery(ls);</div><div class='hunk'>@@ -6058,6 +6048,8 @@ int dlm_user_deadlock(struct dlm_ls *ls, uint32_t flags, uint32_t lkid)</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='add'>+	trace_dlm_unlock_start(ls, lkb, flags);</div><div class='add'>+</div><div class='ctx'> 	ua = lkb-&gt;lkb_ua;</div><div class='ctx'> </div><div class='ctx'> 	error = set_unlock_args(flags, ua, &amp;args);</div><div class='hunk'>@@ -6073,7 +6065,7 @@ int dlm_user_deadlock(struct dlm_ls *ls, uint32_t flags, uint32_t lkid)</div><div class='ctx'> 	error = validate_unlock_args(lkb, &amp;args);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out_r;</div><div class='del'>-	lkb-&gt;lkb_flags |= DLM_IFL_DEADLOCK_CANCEL;</div><div class='add'>+	set_bit(DLM_IFL_DEADLOCK_CANCEL_BIT, &amp;lkb-&gt;lkb_iflags);</div><div class='ctx'> </div><div class='ctx'> 	error = _cancel_lock(r, lkb);</div><div class='ctx'>  out_r:</div><div class='hunk'>@@ -6086,6 +6078,7 @@ int dlm_user_deadlock(struct dlm_ls *ls, uint32_t flags, uint32_t lkid)</div><div class='ctx'> 	if (error == -EBUSY)</div><div class='ctx'> 		error = 0;</div><div class='ctx'>  out_put:</div><div class='add'>+	trace_dlm_unlock_end(ls, lkb, flags, error);</div><div class='ctx'> 	dlm_put_lkb(lkb);</div><div class='ctx'>  out:</div><div class='ctx'> 	dlm_unlock_recovery(ls);</div><div class='hunk'>@@ -6101,9 +6094,9 @@ static int orphan_proc_lock(struct dlm_ls *ls, struct dlm_lkb *lkb)</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='ctx'> 	hold_lkb(lkb); /* reference for the ls_orphans list */</div><div class='del'>-	mutex_lock(&amp;ls-&gt;ls_orphans_mutex);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_orphans_lock);</div><div class='ctx'> 	list_add_tail(&amp;lkb-&gt;lkb_ownqueue, &amp;ls-&gt;ls_orphans);</div><div class='del'>-	mutex_unlock(&amp;ls-&gt;ls_orphans_mutex);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_orphans_lock);</div><div class='ctx'> </div><div class='ctx'> 	set_unlock_args(0, lkb-&gt;lkb_ua, &amp;args);</div><div class='ctx'> </div><div class='hunk'>@@ -6141,7 +6134,7 @@ static struct dlm_lkb *del_proc_lock(struct dlm_ls *ls,</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_lkb *lkb = NULL;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;ls-&gt;ls_clear_proc_locks);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_clear_proc_locks);</div><div class='ctx'> 	if (list_empty(&amp;proc-&gt;locks))</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -6149,11 +6142,11 @@ static struct dlm_lkb *del_proc_lock(struct dlm_ls *ls,</div><div class='ctx'> 	list_del_init(&amp;lkb-&gt;lkb_ownqueue);</div><div class='ctx'> </div><div class='ctx'> 	if (lkb-&gt;lkb_exflags &amp; DLM_LKF_PERSISTENT)</div><div class='del'>-		lkb-&gt;lkb_flags |= DLM_IFL_ORPHAN;</div><div class='add'>+		set_bit(DLM_DFL_ORPHAN_BIT, &amp;lkb-&gt;lkb_dflags);</div><div class='ctx'> 	else</div><div class='del'>-		lkb-&gt;lkb_flags |= DLM_IFL_DEAD;</div><div class='add'>+		set_bit(DLM_IFL_DEAD_BIT, &amp;lkb-&gt;lkb_iflags);</div><div class='ctx'>  out:</div><div class='del'>-	mutex_unlock(&amp;ls-&gt;ls_clear_proc_locks);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_clear_proc_locks);</div><div class='ctx'> 	return lkb;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -6169,6 +6162,7 @@ static struct dlm_lkb *del_proc_lock(struct dlm_ls *ls,</div><div class='ctx'> </div><div class='ctx'> void dlm_clear_proc_locks(struct dlm_ls *ls, struct dlm_user_proc *proc)</div><div class='ctx'> {</div><div class='add'>+	struct dlm_callback *cb, *cb_safe;</div><div class='ctx'> 	struct dlm_lkb *lkb, *safe;</div><div class='ctx'> </div><div class='ctx'> 	dlm_lock_recovery(ls);</div><div class='hunk'>@@ -6177,7 +6171,6 @@ void dlm_clear_proc_locks(struct dlm_ls *ls, struct dlm_user_proc *proc)</div><div class='ctx'> 		lkb = del_proc_lock(ls, proc);</div><div class='ctx'> 		if (!lkb)</div><div class='ctx'> 			break;</div><div class='del'>-		del_timeout(lkb);</div><div class='ctx'> 		if (lkb-&gt;lkb_exflags &amp; DLM_LKF_PERSISTENT)</div><div class='ctx'> 			orphan_proc_lock(ls, lkb);</div><div class='ctx'> 		else</div><div class='hunk'>@@ -6190,64 +6183,61 @@ void dlm_clear_proc_locks(struct dlm_ls *ls, struct dlm_user_proc *proc)</div><div class='ctx'> 		dlm_put_lkb(lkb);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;ls-&gt;ls_clear_proc_locks);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_clear_proc_locks);</div><div class='ctx'> </div><div class='ctx'> 	/* in-progress unlocks */</div><div class='ctx'> 	list_for_each_entry_safe(lkb, safe, &amp;proc-&gt;unlocking, lkb_ownqueue) {</div><div class='ctx'> 		list_del_init(&amp;lkb-&gt;lkb_ownqueue);</div><div class='del'>-		lkb-&gt;lkb_flags |= DLM_IFL_DEAD;</div><div class='add'>+		set_bit(DLM_IFL_DEAD_BIT, &amp;lkb-&gt;lkb_iflags);</div><div class='ctx'> 		dlm_put_lkb(lkb);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry_safe(lkb, safe, &amp;proc-&gt;asts, lkb_cb_list) {</div><div class='del'>-		memset(&amp;lkb-&gt;lkb_callbacks, 0,</div><div class='del'>-		       sizeof(struct dlm_callback) * DLM_CALLBACKS_SIZE);</div><div class='del'>-		list_del_init(&amp;lkb-&gt;lkb_cb_list);</div><div class='del'>-		dlm_put_lkb(lkb);</div><div class='add'>+	list_for_each_entry_safe(cb, cb_safe, &amp;proc-&gt;asts, list) {</div><div class='add'>+		list_del(&amp;cb-&gt;list);</div><div class='add'>+		dlm_free_cb(cb);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	mutex_unlock(&amp;ls-&gt;ls_clear_proc_locks);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_clear_proc_locks);</div><div class='ctx'> 	dlm_unlock_recovery(ls);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void purge_proc_locks(struct dlm_ls *ls, struct dlm_user_proc *proc)</div><div class='ctx'> {</div><div class='add'>+	struct dlm_callback *cb, *cb_safe;</div><div class='ctx'> 	struct dlm_lkb *lkb, *safe;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		lkb = NULL;</div><div class='del'>-		spin_lock(&amp;proc-&gt;locks_spin);</div><div class='add'>+		spin_lock_bh(&amp;proc-&gt;locks_spin);</div><div class='ctx'> 		if (!list_empty(&amp;proc-&gt;locks)) {</div><div class='ctx'> 			lkb = list_entry(proc-&gt;locks.next, struct dlm_lkb,</div><div class='ctx'> 					 lkb_ownqueue);</div><div class='ctx'> 			list_del_init(&amp;lkb-&gt;lkb_ownqueue);</div><div class='ctx'> 		}</div><div class='del'>-		spin_unlock(&amp;proc-&gt;locks_spin);</div><div class='add'>+		spin_unlock_bh(&amp;proc-&gt;locks_spin);</div><div class='ctx'> </div><div class='ctx'> 		if (!lkb)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		lkb-&gt;lkb_flags |= DLM_IFL_DEAD;</div><div class='add'>+		set_bit(DLM_IFL_DEAD_BIT, &amp;lkb-&gt;lkb_iflags);</div><div class='ctx'> 		unlock_proc_lock(ls, lkb);</div><div class='ctx'> 		dlm_put_lkb(lkb); /* ref from proc-&gt;locks list */</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;proc-&gt;locks_spin);</div><div class='add'>+	spin_lock_bh(&amp;proc-&gt;locks_spin);</div><div class='ctx'> 	list_for_each_entry_safe(lkb, safe, &amp;proc-&gt;unlocking, lkb_ownqueue) {</div><div class='ctx'> 		list_del_init(&amp;lkb-&gt;lkb_ownqueue);</div><div class='del'>-		lkb-&gt;lkb_flags |= DLM_IFL_DEAD;</div><div class='add'>+		set_bit(DLM_IFL_DEAD_BIT, &amp;lkb-&gt;lkb_iflags);</div><div class='ctx'> 		dlm_put_lkb(lkb);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;proc-&gt;locks_spin);</div><div class='add'>+	spin_unlock_bh(&amp;proc-&gt;locks_spin);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;proc-&gt;asts_spin);</div><div class='del'>-	list_for_each_entry_safe(lkb, safe, &amp;proc-&gt;asts, lkb_cb_list) {</div><div class='del'>-		memset(&amp;lkb-&gt;lkb_callbacks, 0,</div><div class='del'>-		       sizeof(struct dlm_callback) * DLM_CALLBACKS_SIZE);</div><div class='del'>-		list_del_init(&amp;lkb-&gt;lkb_cb_list);</div><div class='del'>-		dlm_put_lkb(lkb);</div><div class='add'>+	spin_lock_bh(&amp;proc-&gt;asts_spin);</div><div class='add'>+	list_for_each_entry_safe(cb, cb_safe, &amp;proc-&gt;asts, list) {</div><div class='add'>+		list_del(&amp;cb-&gt;list);</div><div class='add'>+		dlm_free_cb(cb);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;proc-&gt;asts_spin);</div><div class='add'>+	spin_unlock_bh(&amp;proc-&gt;asts_spin);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* pid of 0 means purge all orphans */</div><div class='hunk'>@@ -6256,7 +6246,7 @@ static void do_purge(struct dlm_ls *ls, int nodeid, int pid)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_lkb *lkb, *safe;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;ls-&gt;ls_orphans_mutex);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_orphans_lock);</div><div class='ctx'> 	list_for_each_entry_safe(lkb, safe, &amp;ls-&gt;ls_orphans, lkb_ownqueue) {</div><div class='ctx'> 		if (pid &amp;&amp; lkb-&gt;lkb_ownpid != pid)</div><div class='ctx'> 			continue;</div><div class='hunk'>@@ -6264,7 +6254,7 @@ static void do_purge(struct dlm_ls *ls, int nodeid, int pid)</div><div class='ctx'> 		list_del_init(&amp;lkb-&gt;lkb_ownqueue);</div><div class='ctx'> 		dlm_put_lkb(lkb);</div><div class='ctx'> 	}</div><div class='del'>-	mutex_unlock(&amp;ls-&gt;ls_orphans_mutex);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_orphans_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int send_purge(struct dlm_ls *ls, int nodeid, int pid)</div><div class='hunk'>@@ -6277,10 +6267,10 @@ static int send_purge(struct dlm_ls *ls, int nodeid, int pid)</div><div class='ctx'> 				DLM_MSG_PURGE, &amp;ms, &amp;mh);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='del'>-	ms-&gt;m_nodeid = nodeid;</div><div class='del'>-	ms-&gt;m_pid = pid;</div><div class='add'>+	ms-&gt;m_nodeid = cpu_to_le32(nodeid);</div><div class='add'>+	ms-&gt;m_pid = cpu_to_le32(pid);</div><div class='ctx'> </div><div class='del'>-	return send_message(mh, ms);</div><div class='add'>+	return send_message(mh, ms, NULL, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int dlm_user_purge(struct dlm_ls *ls, struct dlm_user_proc *proc,</div><div class='hunk'>@@ -6301,3 +6291,64 @@ int dlm_user_purge(struct dlm_ls *ls, struct dlm_user_proc *proc,</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/* debug functionality */</div><div class='add'>+int dlm_debug_add_lkb(struct dlm_ls *ls, uint32_t lkb_id, char *name, int len,</div><div class='add'>+		      int lkb_nodeid, unsigned int lkb_dflags, int lkb_status)</div><div class='add'>+{</div><div class='add'>+	struct dlm_lksb *lksb;</div><div class='add'>+	struct dlm_lkb *lkb;</div><div class='add'>+	struct dlm_rsb *r;</div><div class='add'>+	int error;</div><div class='add'>+</div><div class='add'>+	/* we currently can't set a valid user lock */</div><div class='add'>+	if (lkb_dflags &amp; BIT(DLM_DFL_USER_BIT))</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+</div><div class='add'>+	lksb = kzalloc(sizeof(*lksb), GFP_NOFS);</div><div class='add'>+	if (!lksb)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	error = _create_lkb(ls, &amp;lkb, lkb_id, lkb_id + 1);</div><div class='add'>+	if (error) {</div><div class='add'>+		kfree(lksb);</div><div class='add'>+		return error;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	dlm_set_dflags_val(lkb, lkb_dflags);</div><div class='add'>+	lkb-&gt;lkb_nodeid = lkb_nodeid;</div><div class='add'>+	lkb-&gt;lkb_lksb = lksb;</div><div class='add'>+	/* user specific pointer, just don't have it NULL for kernel locks */</div><div class='add'>+	if (~lkb_dflags &amp; BIT(DLM_DFL_USER_BIT))</div><div class='add'>+		lkb-&gt;lkb_astparam = (void *)0xDEADBEEF;</div><div class='add'>+</div><div class='add'>+	error = find_rsb(ls, name, len, 0, R_REQUEST, &amp;r);</div><div class='add'>+	if (error) {</div><div class='add'>+		kfree(lksb);</div><div class='add'>+		__put_lkb(ls, lkb);</div><div class='add'>+		return error;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	lock_rsb(r);</div><div class='add'>+	attach_lkb(r, lkb);</div><div class='add'>+	add_lkb(r, lkb, lkb_status);</div><div class='add'>+	unlock_rsb(r);</div><div class='add'>+	put_rsb(r);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int dlm_debug_add_lkb_to_waiters(struct dlm_ls *ls, uint32_t lkb_id,</div><div class='add'>+				 int mstype, int to_nodeid)</div><div class='add'>+{</div><div class='add'>+	struct dlm_lkb *lkb;</div><div class='add'>+	int error;</div><div class='add'>+</div><div class='add'>+	error = find_lkb(ls, lkb_id, &amp;lkb);</div><div class='add'>+	if (error)</div><div class='add'>+		return error;</div><div class='add'>+</div><div class='add'>+	add_to_waiters(lkb, mstype, to_nodeid);</div><div class='add'>+	dlm_put_lkb(lkb);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='head'>diff --git a/fs/dlm/lock.h b/fs/dlm/lock.h<br/>index 456c6ec3ef6f..b23d7b854ed4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/lock.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/lock.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/lock.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/lock.h</a></div><div class='hunk'>@@ -12,44 +12,45 @@</div><div class='ctx'> #define __LOCK_DOT_H__</div><div class='ctx'> </div><div class='ctx'> void dlm_dump_rsb(struct dlm_rsb *r);</div><div class='del'>-void dlm_dump_rsb_name(struct dlm_ls *ls, char *name, int len);</div><div class='add'>+void dlm_dump_rsb_name(struct dlm_ls *ls, const char *name, int len);</div><div class='ctx'> void dlm_print_lkb(struct dlm_lkb *lkb);</div><div class='del'>-void dlm_receive_message_saved(struct dlm_ls *ls, struct dlm_message *ms,</div><div class='add'>+void dlm_receive_message_saved(struct dlm_ls *ls, const struct dlm_message *ms,</div><div class='ctx'> 			       uint32_t saved_seq);</div><div class='del'>-void dlm_receive_buffer(union dlm_packet *p, int nodeid);</div><div class='add'>+void dlm_receive_buffer(const union dlm_packet *p, int nodeid);</div><div class='ctx'> int dlm_modes_compat(int mode1, int mode2);</div><div class='add'>+void free_inactive_rsb(struct dlm_rsb *r);</div><div class='ctx'> void dlm_put_rsb(struct dlm_rsb *r);</div><div class='ctx'> void dlm_hold_rsb(struct dlm_rsb *r);</div><div class='ctx'> int dlm_put_lkb(struct dlm_lkb *lkb);</div><div class='del'>-void dlm_scan_rsbs(struct dlm_ls *ls);</div><div class='ctx'> int dlm_lock_recovery_try(struct dlm_ls *ls);</div><div class='add'>+void dlm_lock_recovery(struct dlm_ls *ls);</div><div class='ctx'> void dlm_unlock_recovery(struct dlm_ls *ls);</div><div class='del'>-void dlm_scan_waiters(struct dlm_ls *ls);</div><div class='del'>-void dlm_scan_timeout(struct dlm_ls *ls);</div><div class='del'>-void dlm_adjust_timeouts(struct dlm_ls *ls);</div><div class='del'>-int dlm_master_lookup(struct dlm_ls *ls, int nodeid, char *name, int len,</div><div class='del'>-		      unsigned int flags, int *r_nodeid, int *result);</div><div class='add'>+void dlm_rsb_scan(struct timer_list *timer);</div><div class='add'>+void resume_scan_timer(struct dlm_ls *ls);</div><div class='ctx'> </div><div class='del'>-int dlm_search_rsb_tree(struct rb_root *tree, char *name, int len,</div><div class='add'>+int dlm_master_lookup(struct dlm_ls *ls, int from_nodeid, const char *name,</div><div class='add'>+		      int len, unsigned int flags, int *r_nodeid, int *result);</div><div class='add'>+</div><div class='add'>+int dlm_search_rsb_tree(struct rhashtable *rhash, const void *name, int len,</div><div class='ctx'> 			struct dlm_rsb **r_ret);</div><div class='ctx'> </div><div class='del'>-void dlm_recover_purge(struct dlm_ls *ls);</div><div class='add'>+void dlm_recover_purge(struct dlm_ls *ls, const struct list_head *root_list);</div><div class='ctx'> void dlm_purge_mstcpy_locks(struct dlm_rsb *r);</div><div class='ctx'> void dlm_recover_grant(struct dlm_ls *ls);</div><div class='ctx'> int dlm_recover_waiters_post(struct dlm_ls *ls);</div><div class='ctx'> void dlm_recover_waiters_pre(struct dlm_ls *ls);</div><div class='del'>-int dlm_recover_master_copy(struct dlm_ls *ls, struct dlm_rcom *rc);</div><div class='del'>-int dlm_recover_process_copy(struct dlm_ls *ls, struct dlm_rcom *rc);</div><div class='add'>+int dlm_recover_master_copy(struct dlm_ls *ls, const struct dlm_rcom *rc,</div><div class='add'>+			    __le32 *rl_remid, __le32 *rl_result);</div><div class='add'>+int dlm_recover_process_copy(struct dlm_ls *ls, const struct dlm_rcom *rc,</div><div class='add'>+			     uint64_t seq);</div><div class='ctx'> </div><div class='ctx'> int dlm_user_request(struct dlm_ls *ls, struct dlm_user_args *ua, int mode,</div><div class='del'>-	uint32_t flags, void *name, unsigned int namelen,</div><div class='del'>-	unsigned long timeout_cs);</div><div class='add'>+	uint32_t flags, void *name, unsigned int namelen);</div><div class='ctx'> int dlm_user_convert(struct dlm_ls *ls, struct dlm_user_args *ua_tmp,</div><div class='del'>-	int mode, uint32_t flags, uint32_t lkid, char *lvb_in,</div><div class='del'>-	unsigned long timeout_cs);</div><div class='add'>+	int mode, uint32_t flags, uint32_t lkid, char *lvb_in);</div><div class='ctx'> int dlm_user_adopt_orphan(struct dlm_ls *ls, struct dlm_user_args *ua_tmp,</div><div class='ctx'> 	int mode, uint32_t flags, void *name, unsigned int namelen,</div><div class='del'>-	unsigned long timeout_cs, uint32_t *lkid);</div><div class='add'>+	uint32_t *lkid);</div><div class='ctx'> int dlm_user_unlock(struct dlm_ls *ls, struct dlm_user_args *ua_tmp,</div><div class='ctx'> 	uint32_t flags, uint32_t lkid, char *lvb_in);</div><div class='ctx'> int dlm_user_cancel(struct dlm_ls *ls,  struct dlm_user_args *ua_tmp,</div><div class='hunk'>@@ -58,20 +59,26 @@ int dlm_user_purge(struct dlm_ls *ls, struct dlm_user_proc *proc,</div><div class='ctx'> 	int nodeid, int pid);</div><div class='ctx'> int dlm_user_deadlock(struct dlm_ls *ls, uint32_t flags, uint32_t lkid);</div><div class='ctx'> void dlm_clear_proc_locks(struct dlm_ls *ls, struct dlm_user_proc *proc);</div><div class='add'>+int dlm_debug_add_lkb(struct dlm_ls *ls, uint32_t lkb_id, char *name, int len,</div><div class='add'>+		      int lkb_nodeid, unsigned int lkb_flags, int lkb_status);</div><div class='add'>+int dlm_debug_add_lkb_to_waiters(struct dlm_ls *ls, uint32_t lkb_id,</div><div class='add'>+				 int mstype, int to_nodeid);</div><div class='ctx'> </div><div class='ctx'> static inline int is_master(struct dlm_rsb *r)</div><div class='ctx'> {</div><div class='add'>+	WARN_ON_ONCE(r-&gt;res_nodeid == -1);</div><div class='add'>+</div><div class='ctx'> 	return !r-&gt;res_nodeid;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void lock_rsb(struct dlm_rsb *r)</div><div class='ctx'> {</div><div class='del'>-	mutex_lock(&amp;r-&gt;res_mutex);</div><div class='add'>+	spin_lock_bh(&amp;r-&gt;res_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void unlock_rsb(struct dlm_rsb *r)</div><div class='ctx'> {</div><div class='del'>-	mutex_unlock(&amp;r-&gt;res_mutex);</div><div class='add'>+	spin_unlock_bh(&amp;r-&gt;res_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/dlm/lockspace.c b/fs/dlm/lockspace.c<br/>index 10eddfa6c3d7..ddaa76558706 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/lockspace.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/lockspace.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/lockspace.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/lockspace.c</a></div><div class='hunk'>@@ -17,7 +17,6 @@</div><div class='ctx'> #include "recoverd.h"</div><div class='ctx'> #include "dir.h"</div><div class='ctx'> #include "midcomms.h"</div><div class='del'>-#include "lowcomms.h"</div><div class='ctx'> #include "config.h"</div><div class='ctx'> #include "memory.h"</div><div class='ctx'> #include "lock.h"</div><div class='hunk'>@@ -30,8 +29,6 @@ static int			ls_count;</div><div class='ctx'> static struct mutex		ls_lock;</div><div class='ctx'> static struct list_head		lslist;</div><div class='ctx'> static spinlock_t		lslist_lock;</div><div class='del'>-static struct task_struct *	scand_task;</div><div class='del'>-</div><div class='ctx'> </div><div class='ctx'> static ssize_t dlm_control_store(struct dlm_ls *ls, const char *buf, size_t len)</div><div class='ctx'> {</div><div class='hunk'>@@ -41,7 +38,7 @@ static ssize_t dlm_control_store(struct dlm_ls *ls, const char *buf, size_t len)</div><div class='ctx'> </div><div class='ctx'> 	if (rc)</div><div class='ctx'> 		return rc;</div><div class='del'>-	ls = dlm_find_lockspace_local(ls-&gt;ls_local_handle);</div><div class='add'>+	ls = dlm_find_lockspace_local(ls);</div><div class='ctx'> 	if (!ls)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='hunk'>@@ -177,12 +174,6 @@ static ssize_t dlm_attr_store(struct kobject *kobj, struct attribute *attr,</div><div class='ctx'> 	return a-&gt;store ? a-&gt;store(ls, buf, len) : len;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void lockspace_kobj_release(struct kobject *k)</div><div class='del'>-{</div><div class='del'>-	struct dlm_ls *ls  = container_of(k, struct dlm_ls, ls_kobj);</div><div class='del'>-	kfree(ls);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static const struct sysfs_ops dlm_attr_ops = {</div><div class='ctx'> 	.show  = dlm_attr_show,</div><div class='ctx'> 	.store = dlm_attr_store,</div><div class='hunk'>@@ -191,17 +182,21 @@ static const struct sysfs_ops dlm_attr_ops = {</div><div class='ctx'> static struct kobj_type dlm_ktype = {</div><div class='ctx'> 	.default_groups = dlm_groups,</div><div class='ctx'> 	.sysfs_ops     = &amp;dlm_attr_ops,</div><div class='del'>-	.release       = lockspace_kobj_release,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static struct kset *dlm_kset;</div><div class='ctx'> </div><div class='del'>-static int do_uevent(struct dlm_ls *ls, int in)</div><div class='add'>+static int do_uevent(struct dlm_ls *ls, int in, unsigned int release_recover)</div><div class='ctx'> {</div><div class='del'>-	if (in)</div><div class='add'>+	char message[512] = {};</div><div class='add'>+	char *envp[] = { message, NULL };</div><div class='add'>+</div><div class='add'>+	if (in) {</div><div class='ctx'> 		kobject_uevent(&amp;ls-&gt;ls_kobj, KOBJ_ONLINE);</div><div class='del'>-	else</div><div class='del'>-		kobject_uevent(&amp;ls-&gt;ls_kobj, KOBJ_OFFLINE);</div><div class='add'>+	} else {</div><div class='add'>+		snprintf(message, 511, "RELEASE_RECOVER=%u", release_recover);</div><div class='add'>+		kobject_uevent_env(&amp;ls-&gt;ls_kobj, KOBJ_OFFLINE, envp);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	log_rinfo(ls, "%s the lockspace group...", in ? "joining" : "leaving");</div><div class='ctx'> </div><div class='hunk'>@@ -216,10 +211,9 @@ static int do_uevent(struct dlm_ls *ls, int in)</div><div class='ctx'> 	return ls-&gt;ls_uevent_result;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int dlm_uevent(struct kset *kset, struct kobject *kobj,</div><div class='del'>-		      struct kobj_uevent_env *env)</div><div class='add'>+static int dlm_uevent(const struct kobject *kobj, struct kobj_uevent_env *env)</div><div class='ctx'> {</div><div class='del'>-	struct dlm_ls *ls = container_of(kobj, struct dlm_ls, ls_kobj);</div><div class='add'>+	const struct dlm_ls *ls = container_of(kobj, struct dlm_ls, ls_kobj);</div><div class='ctx'> </div><div class='ctx'> 	add_uevent_var(env, "LOCKSPACE=%s", ls-&gt;ls_name);</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -249,95 +243,29 @@ void dlm_lockspace_exit(void)</div><div class='ctx'> 	kset_unregister(dlm_kset);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct dlm_ls *find_ls_to_scan(void)</div><div class='del'>-{</div><div class='del'>-	struct dlm_ls *ls;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;lslist_lock);</div><div class='del'>-	list_for_each_entry(ls, &amp;lslist, ls_list) {</div><div class='del'>-		if (time_after_eq(jiffies, ls-&gt;ls_scan_time +</div><div class='del'>-					    dlm_config.ci_scan_secs * HZ)) {</div><div class='del'>-			spin_unlock(&amp;lslist_lock);</div><div class='del'>-			return ls;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;lslist_lock);</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int dlm_scand(void *data)</div><div class='del'>-{</div><div class='del'>-	struct dlm_ls *ls;</div><div class='del'>-</div><div class='del'>-	while (!kthread_should_stop()) {</div><div class='del'>-		ls = find_ls_to_scan();</div><div class='del'>-		if (ls) {</div><div class='del'>-			if (dlm_lock_recovery_try(ls)) {</div><div class='del'>-				ls-&gt;ls_scan_time = jiffies;</div><div class='del'>-				dlm_scan_rsbs(ls);</div><div class='del'>-				dlm_scan_timeout(ls);</div><div class='del'>-				dlm_scan_waiters(ls);</div><div class='del'>-				dlm_unlock_recovery(ls);</div><div class='del'>-			} else {</div><div class='del'>-				ls-&gt;ls_scan_time += HZ;</div><div class='del'>-			}</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-		schedule_timeout_interruptible(dlm_config.ci_scan_secs * HZ);</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int dlm_scand_start(void)</div><div class='del'>-{</div><div class='del'>-	struct task_struct *p;</div><div class='del'>-	int error = 0;</div><div class='del'>-</div><div class='del'>-	p = kthread_run(dlm_scand, NULL, "dlm_scand");</div><div class='del'>-	if (IS_ERR(p))</div><div class='del'>-		error = PTR_ERR(p);</div><div class='del'>-	else</div><div class='del'>-		scand_task = p;</div><div class='del'>-	return error;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void dlm_scand_stop(void)</div><div class='del'>-{</div><div class='del'>-	kthread_stop(scand_task);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> struct dlm_ls *dlm_find_lockspace_global(uint32_t id)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_ls *ls;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;lslist_lock);</div><div class='add'>+	spin_lock_bh(&amp;lslist_lock);</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(ls, &amp;lslist, ls_list) {</div><div class='ctx'> 		if (ls-&gt;ls_global_id == id) {</div><div class='del'>-			ls-&gt;ls_count++;</div><div class='add'>+			atomic_inc(&amp;ls-&gt;ls_count);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	ls = NULL;</div><div class='ctx'>  out:</div><div class='del'>-	spin_unlock(&amp;lslist_lock);</div><div class='add'>+	spin_unlock_bh(&amp;lslist_lock);</div><div class='ctx'> 	return ls;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct dlm_ls *dlm_find_lockspace_local(dlm_lockspace_t *lockspace)</div><div class='ctx'> {</div><div class='del'>-	struct dlm_ls *ls;</div><div class='add'>+	struct dlm_ls *ls = lockspace;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;lslist_lock);</div><div class='del'>-	list_for_each_entry(ls, &amp;lslist, ls_list) {</div><div class='del'>-		if (ls-&gt;ls_local_handle == lockspace) {</div><div class='del'>-			ls-&gt;ls_count++;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	ls = NULL;</div><div class='del'>- out:</div><div class='del'>-	spin_unlock(&amp;lslist_lock);</div><div class='add'>+	atomic_inc(&amp;ls-&gt;ls_count);</div><div class='ctx'> 	return ls;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -345,64 +273,89 @@ struct dlm_ls *dlm_find_lockspace_device(int minor)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_ls *ls;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;lslist_lock);</div><div class='add'>+	spin_lock_bh(&amp;lslist_lock);</div><div class='ctx'> 	list_for_each_entry(ls, &amp;lslist, ls_list) {</div><div class='ctx'> 		if (ls-&gt;ls_device.minor == minor) {</div><div class='del'>-			ls-&gt;ls_count++;</div><div class='add'>+			atomic_inc(&amp;ls-&gt;ls_count);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	ls = NULL;</div><div class='ctx'>  out:</div><div class='del'>-	spin_unlock(&amp;lslist_lock);</div><div class='add'>+	spin_unlock_bh(&amp;lslist_lock);</div><div class='ctx'> 	return ls;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void dlm_put_lockspace(struct dlm_ls *ls)</div><div class='ctx'> {</div><div class='del'>-	spin_lock(&amp;lslist_lock);</div><div class='del'>-	ls-&gt;ls_count--;</div><div class='del'>-	spin_unlock(&amp;lslist_lock);</div><div class='add'>+	if (atomic_dec_and_test(&amp;ls-&gt;ls_count))</div><div class='add'>+		wake_up(&amp;ls-&gt;ls_count_wait);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void remove_lockspace(struct dlm_ls *ls)</div><div class='ctx'> {</div><div class='del'>-	for (;;) {</div><div class='del'>-		spin_lock(&amp;lslist_lock);</div><div class='del'>-		if (ls-&gt;ls_count == 0) {</div><div class='del'>-			WARN_ON(ls-&gt;ls_create_count != 0);</div><div class='del'>-			list_del(&amp;ls-&gt;ls_list);</div><div class='del'>-			spin_unlock(&amp;lslist_lock);</div><div class='del'>-			return;</div><div class='del'>-		}</div><div class='del'>-		spin_unlock(&amp;lslist_lock);</div><div class='del'>-		ssleep(1);</div><div class='add'>+retry:</div><div class='add'>+	wait_event(ls-&gt;ls_count_wait, atomic_read(&amp;ls-&gt;ls_count) == 0);</div><div class='add'>+</div><div class='add'>+	spin_lock_bh(&amp;lslist_lock);</div><div class='add'>+	if (atomic_read(&amp;ls-&gt;ls_count) != 0) {</div><div class='add'>+		spin_unlock_bh(&amp;lslist_lock);</div><div class='add'>+		goto retry;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	WARN_ON(ls-&gt;ls_create_count != 0);</div><div class='add'>+	list_del(&amp;ls-&gt;ls_list);</div><div class='add'>+	spin_unlock_bh(&amp;lslist_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int threads_start(void)</div><div class='ctx'> {</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	error = dlm_scand_start();</div><div class='del'>-	if (error) {</div><div class='del'>-		log_print("cannot start dlm_scand thread %d", error);</div><div class='del'>-		goto fail;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	/* Thread for sending/receiving messages for all lockspace's */</div><div class='ctx'> 	error = dlm_midcomms_start();</div><div class='del'>-	if (error) {</div><div class='del'>-		log_print("cannot start dlm lowcomms %d", error);</div><div class='del'>-		goto scand_fail;</div><div class='del'>-	}</div><div class='add'>+	if (error)</div><div class='add'>+		log_print("cannot start dlm midcomms %d", error);</div><div class='add'>+</div><div class='add'>+	return error;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int lkb_idr_free(struct dlm_lkb *lkb)</div><div class='add'>+{</div><div class='add'>+	if (lkb-&gt;lkb_lvbptr &amp;&amp; test_bit(DLM_IFL_MSTCPY_BIT, &amp;lkb-&gt;lkb_iflags))</div><div class='add'>+		dlm_free_lvb(lkb-&gt;lkb_lvbptr);</div><div class='ctx'> </div><div class='add'>+	dlm_free_lkb(lkb);</div><div class='ctx'> 	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>- scand_fail:</div><div class='del'>-	dlm_scand_stop();</div><div class='del'>- fail:</div><div class='del'>-	return error;</div><div class='add'>+static void rhash_free_rsb(void *ptr, void *arg)</div><div class='add'>+{</div><div class='add'>+	struct dlm_rsb *rsb = ptr;</div><div class='add'>+</div><div class='add'>+	dlm_free_rsb(rsb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void free_lockspace(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct dlm_ls *ls  = container_of(work, struct dlm_ls, ls_free_work);</div><div class='add'>+	struct dlm_lkb *lkb;</div><div class='add'>+	unsigned long id;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Free all lkb's in xa</div><div class='add'>+	 */</div><div class='add'>+	xa_for_each(&amp;ls-&gt;ls_lkbxa, id, lkb) {</div><div class='add'>+		lkb_idr_free(lkb);</div><div class='add'>+	}</div><div class='add'>+	xa_destroy(&amp;ls-&gt;ls_lkbxa);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Free all rsb's on rsbtbl</div><div class='add'>+	 */</div><div class='add'>+	rhashtable_free_and_destroy(&amp;ls-&gt;ls_rsbtbl, rhash_free_rsb, NULL);</div><div class='add'>+</div><div class='add'>+	kfree(ls);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int new_lockspace(const char *name, const char *cluster,</div><div class='hunk'>@@ -411,14 +364,13 @@ static int new_lockspace(const char *name, const char *cluster,</div><div class='ctx'> 			 int *ops_result, dlm_lockspace_t **lockspace)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_ls *ls;</div><div class='del'>-	int i, size, error;</div><div class='del'>-	int do_unreg = 0;</div><div class='ctx'> 	int namelen = strlen(name);</div><div class='add'>+	int error;</div><div class='ctx'> </div><div class='ctx'> 	if (namelen &gt; DLM_LOCKSPACE_LEN || namelen == 0)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	if (!lvblen || (lvblen % 8))</div><div class='add'>+	if (lvblen % 8)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	if (!try_module_get(THIS_MODULE))</div><div class='hunk'>@@ -452,7 +404,7 @@ static int new_lockspace(const char *name, const char *cluster,</div><div class='ctx'> </div><div class='ctx'> 	error = 0;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;lslist_lock);</div><div class='add'>+	spin_lock_bh(&amp;lslist_lock);</div><div class='ctx'> 	list_for_each_entry(ls, &amp;lslist, ls_list) {</div><div class='ctx'> 		WARN_ON(ls-&gt;ls_create_count &lt;= 0);</div><div class='ctx'> 		if (ls-&gt;ls_namelen != namelen)</div><div class='hunk'>@@ -468,69 +420,52 @@ static int new_lockspace(const char *name, const char *cluster,</div><div class='ctx'> 		error = 1;</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;lslist_lock);</div><div class='add'>+	spin_unlock_bh(&amp;lslist_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	error = -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	ls = kzalloc(sizeof(struct dlm_ls) + namelen, GFP_NOFS);</div><div class='add'>+	ls = kzalloc(sizeof(*ls), GFP_NOFS);</div><div class='ctx'> 	if (!ls)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	memcpy(ls-&gt;ls_name, name, namelen);</div><div class='ctx'> 	ls-&gt;ls_namelen = namelen;</div><div class='ctx'> 	ls-&gt;ls_lvblen = lvblen;</div><div class='del'>-	ls-&gt;ls_count = 0;</div><div class='add'>+	atomic_set(&amp;ls-&gt;ls_count, 0);</div><div class='add'>+	init_waitqueue_head(&amp;ls-&gt;ls_count_wait);</div><div class='ctx'> 	ls-&gt;ls_flags = 0;</div><div class='del'>-	ls-&gt;ls_scan_time = jiffies;</div><div class='ctx'> </div><div class='ctx'> 	if (ops &amp;&amp; dlm_config.ci_recover_callbacks) {</div><div class='ctx'> 		ls-&gt;ls_ops = ops;</div><div class='ctx'> 		ls-&gt;ls_ops_arg = ops_arg;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (flags &amp; DLM_LSFL_TIMEWARN)</div><div class='del'>-		set_bit(LSFL_TIMEWARN, &amp;ls-&gt;ls_flags);</div><div class='add'>+	if (flags &amp; DLM_LSFL_SOFTIRQ)</div><div class='add'>+		set_bit(LSFL_SOFTIRQ, &amp;ls-&gt;ls_flags);</div><div class='ctx'> </div><div class='ctx'> 	/* ls_exflags are forced to match among nodes, and we don't</div><div class='del'>-	   need to require all nodes to have some flags set */</div><div class='del'>-	ls-&gt;ls_exflags = (flags &amp; ~(DLM_LSFL_TIMEWARN | DLM_LSFL_FS |</div><div class='del'>-				    DLM_LSFL_NEWEXCL));</div><div class='add'>+	 * need to require all nodes to have some flags set</div><div class='add'>+	 */</div><div class='add'>+	ls-&gt;ls_exflags = (flags &amp; ~(DLM_LSFL_FS | DLM_LSFL_NEWEXCL |</div><div class='add'>+				    DLM_LSFL_SOFTIRQ));</div><div class='ctx'> </div><div class='del'>-	size = READ_ONCE(dlm_config.ci_rsbtbl_size);</div><div class='del'>-	ls-&gt;ls_rsbtbl_size = size;</div><div class='add'>+	INIT_LIST_HEAD(&amp;ls-&gt;ls_slow_inactive);</div><div class='add'>+	INIT_LIST_HEAD(&amp;ls-&gt;ls_slow_active);</div><div class='add'>+	rwlock_init(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='ctx'> </div><div class='del'>-	ls-&gt;ls_rsbtbl = vmalloc(array_size(size, sizeof(struct dlm_rsbtable)));</div><div class='del'>-	if (!ls-&gt;ls_rsbtbl)</div><div class='add'>+	error = rhashtable_init(&amp;ls-&gt;ls_rsbtbl, &amp;dlm_rhash_rsb_params);</div><div class='add'>+	if (error)</div><div class='ctx'> 		goto out_lsfree;</div><div class='del'>-	for (i = 0; i &lt; size; i++) {</div><div class='del'>-		ls-&gt;ls_rsbtbl[i].keep.rb_node = NULL;</div><div class='del'>-		ls-&gt;ls_rsbtbl[i].toss.rb_node = NULL;</div><div class='del'>-		spin_lock_init(&amp;ls-&gt;ls_rsbtbl[i].lock);</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	spin_lock_init(&amp;ls-&gt;ls_remove_spin);</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; DLM_REMOVE_NAMES_MAX; i++) {</div><div class='del'>-		ls-&gt;ls_remove_names[i] = kzalloc(DLM_RESNAME_MAXLEN+1,</div><div class='del'>-						 GFP_KERNEL);</div><div class='del'>-		if (!ls-&gt;ls_remove_names[i])</div><div class='del'>-			goto out_rsbtbl;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	idr_init(&amp;ls-&gt;ls_lkbidr);</div><div class='del'>-	spin_lock_init(&amp;ls-&gt;ls_lkbidr_spin);</div><div class='add'>+	xa_init_flags(&amp;ls-&gt;ls_lkbxa, XA_FLAGS_ALLOC | XA_FLAGS_LOCK_BH);</div><div class='add'>+	rwlock_init(&amp;ls-&gt;ls_lkbxa_lock);</div><div class='ctx'> </div><div class='ctx'> 	INIT_LIST_HEAD(&amp;ls-&gt;ls_waiters);</div><div class='del'>-	mutex_init(&amp;ls-&gt;ls_waiters_mutex);</div><div class='add'>+	spin_lock_init(&amp;ls-&gt;ls_waiters_lock);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;ls-&gt;ls_orphans);</div><div class='del'>-	mutex_init(&amp;ls-&gt;ls_orphans_mutex);</div><div class='del'>-	INIT_LIST_HEAD(&amp;ls-&gt;ls_timeout);</div><div class='del'>-	mutex_init(&amp;ls-&gt;ls_timeout_mutex);</div><div class='del'>-</div><div class='del'>-	INIT_LIST_HEAD(&amp;ls-&gt;ls_new_rsb);</div><div class='del'>-	spin_lock_init(&amp;ls-&gt;ls_new_rsb_spin);</div><div class='add'>+	spin_lock_init(&amp;ls-&gt;ls_orphans_lock);</div><div class='ctx'> </div><div class='ctx'> 	INIT_LIST_HEAD(&amp;ls-&gt;ls_nodes);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;ls-&gt;ls_nodes_gone);</div><div class='hunk'>@@ -539,33 +474,35 @@ static int new_lockspace(const char *name, const char *cluster,</div><div class='ctx'> 	ls-&gt;ls_total_weight = 0;</div><div class='ctx'> 	ls-&gt;ls_node_array = NULL;</div><div class='ctx'> </div><div class='del'>-	memset(&amp;ls-&gt;ls_stub_rsb, 0, sizeof(struct dlm_rsb));</div><div class='del'>-	ls-&gt;ls_stub_rsb.res_ls = ls;</div><div class='add'>+	memset(&amp;ls-&gt;ls_local_rsb, 0, sizeof(struct dlm_rsb));</div><div class='add'>+	ls-&gt;ls_local_rsb.res_ls = ls;</div><div class='ctx'> </div><div class='ctx'> 	ls-&gt;ls_debug_rsb_dentry = NULL;</div><div class='ctx'> 	ls-&gt;ls_debug_waiters_dentry = NULL;</div><div class='ctx'> </div><div class='ctx'> 	init_waitqueue_head(&amp;ls-&gt;ls_uevent_wait);</div><div class='ctx'> 	ls-&gt;ls_uevent_result = 0;</div><div class='del'>-	init_completion(&amp;ls-&gt;ls_members_done);</div><div class='del'>-	ls-&gt;ls_members_result = -1;</div><div class='add'>+	init_completion(&amp;ls-&gt;ls_recovery_done);</div><div class='add'>+	ls-&gt;ls_recovery_result = -1;</div><div class='ctx'> </div><div class='del'>-	mutex_init(&amp;ls-&gt;ls_cb_mutex);</div><div class='add'>+	spin_lock_init(&amp;ls-&gt;ls_cb_lock);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;ls-&gt;ls_cb_delay);</div><div class='ctx'> </div><div class='add'>+	INIT_WORK(&amp;ls-&gt;ls_free_work, free_lockspace);</div><div class='add'>+</div><div class='ctx'> 	ls-&gt;ls_recoverd_task = NULL;</div><div class='ctx'> 	mutex_init(&amp;ls-&gt;ls_recoverd_active);</div><div class='ctx'> 	spin_lock_init(&amp;ls-&gt;ls_recover_lock);</div><div class='ctx'> 	spin_lock_init(&amp;ls-&gt;ls_rcom_spin);</div><div class='ctx'> 	get_random_bytes(&amp;ls-&gt;ls_rcom_seq, sizeof(uint64_t));</div><div class='ctx'> 	ls-&gt;ls_recover_status = 0;</div><div class='del'>-	ls-&gt;ls_recover_seq = 0;</div><div class='add'>+	ls-&gt;ls_recover_seq = get_random_u64();</div><div class='ctx'> 	ls-&gt;ls_recover_args = NULL;</div><div class='ctx'> 	init_rwsem(&amp;ls-&gt;ls_in_recovery);</div><div class='del'>-	init_rwsem(&amp;ls-&gt;ls_recv_active);</div><div class='add'>+	rwlock_init(&amp;ls-&gt;ls_recv_active);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;ls-&gt;ls_requestqueue);</div><div class='del'>-	mutex_init(&amp;ls-&gt;ls_requestqueue_mutex);</div><div class='del'>-	mutex_init(&amp;ls-&gt;ls_clear_proc_locks);</div><div class='add'>+	rwlock_init(&amp;ls-&gt;ls_requestqueue_lock);</div><div class='add'>+	spin_lock_init(&amp;ls-&gt;ls_clear_proc_locks);</div><div class='ctx'> </div><div class='ctx'> 	/* Due backwards compatibility with 3.1 we need to use maximum</div><div class='ctx'> 	 * possible dlm message size to be sure the message will fit and</div><div class='hunk'>@@ -573,8 +510,10 @@ static int new_lockspace(const char *name, const char *cluster,</div><div class='ctx'> 	 * might send less.</div><div class='ctx'> 	 */</div><div class='ctx'> 	ls-&gt;ls_recover_buf = kmalloc(DLM_MAX_SOCKET_BUFSIZE, GFP_NOFS);</div><div class='del'>-	if (!ls-&gt;ls_recover_buf)</div><div class='del'>-		goto out_lkbidr;</div><div class='add'>+	if (!ls-&gt;ls_recover_buf) {</div><div class='add'>+		error = -ENOMEM;</div><div class='add'>+		goto out_lkbxa;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	ls-&gt;ls_slot = 0;</div><div class='ctx'> 	ls-&gt;ls_num_slots = 0;</div><div class='hunk'>@@ -583,25 +522,31 @@ static int new_lockspace(const char *name, const char *cluster,</div><div class='ctx'> </div><div class='ctx'> 	INIT_LIST_HEAD(&amp;ls-&gt;ls_recover_list);</div><div class='ctx'> 	spin_lock_init(&amp;ls-&gt;ls_recover_list_lock);</div><div class='del'>-	idr_init(&amp;ls-&gt;ls_recover_idr);</div><div class='del'>-	spin_lock_init(&amp;ls-&gt;ls_recover_idr_lock);</div><div class='add'>+	xa_init_flags(&amp;ls-&gt;ls_recover_xa, XA_FLAGS_ALLOC | XA_FLAGS_LOCK_BH);</div><div class='add'>+	spin_lock_init(&amp;ls-&gt;ls_recover_xa_lock);</div><div class='ctx'> 	ls-&gt;ls_recover_list_count = 0;</div><div class='del'>-	ls-&gt;ls_local_handle = ls;</div><div class='ctx'> 	init_waitqueue_head(&amp;ls-&gt;ls_wait_general);</div><div class='del'>-	INIT_LIST_HEAD(&amp;ls-&gt;ls_root_list);</div><div class='del'>-	init_rwsem(&amp;ls-&gt;ls_root_sem);</div><div class='add'>+	INIT_LIST_HEAD(&amp;ls-&gt;ls_masters_list);</div><div class='add'>+	rwlock_init(&amp;ls-&gt;ls_masters_lock);</div><div class='add'>+	INIT_LIST_HEAD(&amp;ls-&gt;ls_dir_dump_list);</div><div class='add'>+	rwlock_init(&amp;ls-&gt;ls_dir_dump_lock);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;lslist_lock);</div><div class='add'>+	INIT_LIST_HEAD(&amp;ls-&gt;ls_scan_list);</div><div class='add'>+	spin_lock_init(&amp;ls-&gt;ls_scan_lock);</div><div class='add'>+	timer_setup(&amp;ls-&gt;ls_scan_timer, dlm_rsb_scan, TIMER_DEFERRABLE);</div><div class='add'>+</div><div class='add'>+	spin_lock_bh(&amp;lslist_lock);</div><div class='ctx'> 	ls-&gt;ls_create_count = 1;</div><div class='ctx'> 	list_add(&amp;ls-&gt;ls_list, &amp;lslist);</div><div class='del'>-	spin_unlock(&amp;lslist_lock);</div><div class='add'>+	spin_unlock_bh(&amp;lslist_lock);</div><div class='ctx'> </div><div class='del'>-	if (flags &amp; DLM_LSFL_FS) {</div><div class='del'>-		error = dlm_callback_start(ls);</div><div class='del'>-		if (error) {</div><div class='del'>-			log_error(ls, "can't start dlm_callback %d", error);</div><div class='del'>-			goto out_delist;</div><div class='del'>-		}</div><div class='add'>+	if (flags &amp; DLM_LSFL_FS)</div><div class='add'>+		set_bit(LSFL_FS, &amp;ls-&gt;ls_flags);</div><div class='add'>+</div><div class='add'>+	error = dlm_callback_start(ls);</div><div class='add'>+	if (error) {</div><div class='add'>+		log_error(ls, "can't start dlm_callback %d", error);</div><div class='add'>+		goto out_delist;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	init_waitqueue_head(&amp;ls-&gt;ls_recover_lock_wait);</div><div class='hunk'>@@ -622,9 +567,6 @@ static int new_lockspace(const char *name, const char *cluster,</div><div class='ctx'> 	wait_event(ls-&gt;ls_recover_lock_wait,</div><div class='ctx'> 		   test_bit(LSFL_RECOVER_LOCK, &amp;ls-&gt;ls_flags));</div><div class='ctx'> </div><div class='del'>-	/* let kobject handle freeing of ls if there's an error */</div><div class='del'>-	do_unreg = 1;</div><div class='del'>-</div><div class='ctx'> 	ls-&gt;ls_kobj.kset = dlm_kset;</div><div class='ctx'> 	error = kobject_init_and_add(&amp;ls-&gt;ls_kobj, &amp;dlm_ktype, NULL,</div><div class='ctx'> 				     "%s", ls-&gt;ls_name);</div><div class='hunk'>@@ -638,12 +580,13 @@ static int new_lockspace(const char *name, const char *cluster,</div><div class='ctx'> 	   current lockspace members are (via configfs) and then tells the</div><div class='ctx'> 	   lockspace to start running (via sysfs) in dlm_ls_start(). */</div><div class='ctx'> </div><div class='del'>-	error = do_uevent(ls, 1);</div><div class='del'>-	if (error)</div><div class='add'>+	error = do_uevent(ls, 1, 0);</div><div class='add'>+	if (error &lt; 0)</div><div class='ctx'> 		goto out_recoverd;</div><div class='ctx'> </div><div class='del'>-	wait_for_completion(&amp;ls-&gt;ls_members_done);</div><div class='del'>-	error = ls-&gt;ls_members_result;</div><div class='add'>+	/* wait until recovery is successful or failed */</div><div class='add'>+	wait_for_completion(&amp;ls-&gt;ls_recovery_done);</div><div class='add'>+	error = ls-&gt;ls_recovery_result;</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out_members;</div><div class='ctx'> </div><div class='hunk'>@@ -654,7 +597,7 @@ static int new_lockspace(const char *name, const char *cluster,</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'>  out_members:</div><div class='del'>-	do_uevent(ls, 0);</div><div class='add'>+	do_uevent(ls, 0, 0);</div><div class='ctx'> 	dlm_clear_members(ls);</div><div class='ctx'> 	kfree(ls-&gt;ls_node_array);</div><div class='ctx'>  out_recoverd:</div><div class='hunk'>@@ -662,31 +605,27 @@ static int new_lockspace(const char *name, const char *cluster,</div><div class='ctx'>  out_callback:</div><div class='ctx'> 	dlm_callback_stop(ls);</div><div class='ctx'>  out_delist:</div><div class='del'>-	spin_lock(&amp;lslist_lock);</div><div class='add'>+	spin_lock_bh(&amp;lslist_lock);</div><div class='ctx'> 	list_del(&amp;ls-&gt;ls_list);</div><div class='del'>-	spin_unlock(&amp;lslist_lock);</div><div class='del'>-	idr_destroy(&amp;ls-&gt;ls_recover_idr);</div><div class='add'>+	spin_unlock_bh(&amp;lslist_lock);</div><div class='add'>+	xa_destroy(&amp;ls-&gt;ls_recover_xa);</div><div class='ctx'> 	kfree(ls-&gt;ls_recover_buf);</div><div class='del'>- out_lkbidr:</div><div class='del'>-	idr_destroy(&amp;ls-&gt;ls_lkbidr);</div><div class='del'>- out_rsbtbl:</div><div class='del'>-	for (i = 0; i &lt; DLM_REMOVE_NAMES_MAX; i++)</div><div class='del'>-		kfree(ls-&gt;ls_remove_names[i]);</div><div class='del'>-	vfree(ls-&gt;ls_rsbtbl);</div><div class='add'>+ out_lkbxa:</div><div class='add'>+	xa_destroy(&amp;ls-&gt;ls_lkbxa);</div><div class='add'>+	rhashtable_destroy(&amp;ls-&gt;ls_rsbtbl);</div><div class='ctx'>  out_lsfree:</div><div class='del'>-	if (do_unreg)</div><div class='del'>-		kobject_put(&amp;ls-&gt;ls_kobj);</div><div class='del'>-	else</div><div class='del'>-		kfree(ls);</div><div class='add'>+	kobject_put(&amp;ls-&gt;ls_kobj);</div><div class='add'>+	kfree(ls);</div><div class='ctx'>  out:</div><div class='ctx'> 	module_put(THIS_MODULE);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int dlm_new_lockspace(const char *name, const char *cluster,</div><div class='del'>-		      uint32_t flags, int lvblen,</div><div class='del'>-		      const struct dlm_lockspace_ops *ops, void *ops_arg,</div><div class='del'>-		      int *ops_result, dlm_lockspace_t **lockspace)</div><div class='add'>+static int __dlm_new_lockspace(const char *name, const char *cluster,</div><div class='add'>+			       uint32_t flags, int lvblen,</div><div class='add'>+			       const struct dlm_lockspace_ops *ops,</div><div class='add'>+			       void *ops_arg, int *ops_result,</div><div class='add'>+			       dlm_lockspace_t **lockspace)</div><div class='ctx'> {</div><div class='ctx'> 	int error = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -703,67 +642,75 @@ int dlm_new_lockspace(const char *name, const char *cluster,</div><div class='ctx'> 	if (error &gt; 0)</div><div class='ctx'> 		error = 0;</div><div class='ctx'> 	if (!ls_count) {</div><div class='del'>-		dlm_scand_stop();</div><div class='ctx'> 		dlm_midcomms_shutdown();</div><div class='del'>-		dlm_lowcomms_stop();</div><div class='add'>+		dlm_midcomms_stop();</div><div class='ctx'> 	}</div><div class='ctx'>  out:</div><div class='ctx'> 	mutex_unlock(&amp;ls_lock);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int lkb_idr_is_local(int id, void *p, void *data)</div><div class='del'>-{</div><div class='del'>-	struct dlm_lkb *lkb = p;</div><div class='del'>-</div><div class='del'>-	return lkb-&gt;lkb_nodeid == 0 &amp;&amp; lkb-&gt;lkb_grmode != DLM_LOCK_IV;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int lkb_idr_is_any(int id, void *p, void *data)</div><div class='add'>+int dlm_new_lockspace(const char *name, const char *cluster, uint32_t flags,</div><div class='add'>+		      int lvblen, const struct dlm_lockspace_ops *ops,</div><div class='add'>+		      void *ops_arg, int *ops_result,</div><div class='add'>+		      dlm_lockspace_t **lockspace)</div><div class='ctx'> {</div><div class='del'>-	return 1;</div><div class='add'>+	return __dlm_new_lockspace(name, cluster, flags | DLM_LSFL_FS, lvblen,</div><div class='add'>+				   ops, ops_arg, ops_result, lockspace);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int lkb_idr_free(int id, void *p, void *data)</div><div class='add'>+int dlm_new_user_lockspace(const char *name, const char *cluster,</div><div class='add'>+			   uint32_t flags, int lvblen,</div><div class='add'>+			   const struct dlm_lockspace_ops *ops,</div><div class='add'>+			   void *ops_arg, int *ops_result,</div><div class='add'>+			   dlm_lockspace_t **lockspace)</div><div class='ctx'> {</div><div class='del'>-	struct dlm_lkb *lkb = p;</div><div class='del'>-</div><div class='del'>-	if (lkb-&gt;lkb_lvbptr &amp;&amp; lkb-&gt;lkb_flags &amp; DLM_IFL_MSTCPY)</div><div class='del'>-		dlm_free_lvb(lkb-&gt;lkb_lvbptr);</div><div class='add'>+	if (flags &amp; DLM_LSFL_SOFTIRQ)</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	dlm_free_lkb(lkb);</div><div class='del'>-	return 0;</div><div class='add'>+	return __dlm_new_lockspace(name, cluster, flags, lvblen, ops,</div><div class='add'>+				   ops_arg, ops_result, lockspace);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* NOTE: We check the lkbidr here rather than the resource table.</div><div class='add'>+/* NOTE: We check the lkbxa here rather than the resource table.</div><div class='ctx'>    This is because there may be LKBs queued as ASTs that have been unlinked</div><div class='ctx'>    from their RSBs and are pending deletion once the AST has been delivered */</div><div class='ctx'> </div><div class='del'>-static int lockspace_busy(struct dlm_ls *ls, int force)</div><div class='add'>+static int lockspace_busy(struct dlm_ls *ls, unsigned int release_option)</div><div class='ctx'> {</div><div class='del'>-	int rv;</div><div class='add'>+	struct dlm_lkb *lkb;</div><div class='add'>+	unsigned long id;</div><div class='add'>+	int rv = 0;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_lkbidr_spin);</div><div class='del'>-	if (force == 0) {</div><div class='del'>-		rv = idr_for_each(&amp;ls-&gt;ls_lkbidr, lkb_idr_is_any, ls);</div><div class='del'>-	} else if (force == 1) {</div><div class='del'>-		rv = idr_for_each(&amp;ls-&gt;ls_lkbidr, lkb_idr_is_local, ls);</div><div class='add'>+	read_lock_bh(&amp;ls-&gt;ls_lkbxa_lock);</div><div class='add'>+	if (release_option == DLM_RELEASE_NO_LOCKS) {</div><div class='add'>+		xa_for_each(&amp;ls-&gt;ls_lkbxa, id, lkb) {</div><div class='add'>+			rv = 1;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+	} else if (release_option == DLM_RELEASE_UNUSED) {</div><div class='add'>+		/* TODO: handle this UNUSED option as NO_LOCKS in later patch */</div><div class='add'>+		xa_for_each(&amp;ls-&gt;ls_lkbxa, id, lkb) {</div><div class='add'>+			if (lkb-&gt;lkb_nodeid == 0 &amp;&amp;</div><div class='add'>+			    lkb-&gt;lkb_grmode != DLM_LOCK_IV) {</div><div class='add'>+				rv = 1;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='ctx'> 	} else {</div><div class='ctx'> 		rv = 0;</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_lkbidr_spin);</div><div class='add'>+	read_unlock_bh(&amp;ls-&gt;ls_lkbxa_lock);</div><div class='ctx'> 	return rv;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int release_lockspace(struct dlm_ls *ls, int force)</div><div class='add'>+static int release_lockspace(struct dlm_ls *ls, unsigned int release_option)</div><div class='ctx'> {</div><div class='del'>-	struct dlm_rsb *rsb;</div><div class='del'>-	struct rb_node *n;</div><div class='del'>-	int i, busy, rv;</div><div class='add'>+	int busy, rv;</div><div class='ctx'> </div><div class='del'>-	busy = lockspace_busy(ls, force);</div><div class='add'>+	busy = lockspace_busy(ls, release_option);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;lslist_lock);</div><div class='add'>+	spin_lock_bh(&amp;lslist_lock);</div><div class='ctx'> 	if (ls-&gt;ls_create_count == 1) {</div><div class='ctx'> 		if (busy) {</div><div class='ctx'> 			rv = -EBUSY;</div><div class='hunk'>@@ -777,22 +724,31 @@ static int release_lockspace(struct dlm_ls *ls, int force)</div><div class='ctx'> 	} else {</div><div class='ctx'> 		rv = -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;lslist_lock);</div><div class='add'>+	spin_unlock_bh(&amp;lslist_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (rv) {</div><div class='ctx'> 		log_debug(ls, "release_lockspace no remove %d", rv);</div><div class='ctx'> 		return rv;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (ls_count == 1)</div><div class='add'>+		dlm_midcomms_version_wait();</div><div class='add'>+</div><div class='ctx'> 	dlm_device_deregister(ls);</div><div class='ctx'> </div><div class='del'>-	if (force &lt; 3 &amp;&amp; dlm_user_daemon_available())</div><div class='del'>-		do_uevent(ls, 0);</div><div class='add'>+	if (release_option != DLM_RELEASE_NO_EVENT &amp;&amp;</div><div class='add'>+	    dlm_user_daemon_available())</div><div class='add'>+		do_uevent(ls, 0, (release_option == DLM_RELEASE_RECOVER));</div><div class='ctx'> </div><div class='ctx'> 	dlm_recoverd_stop(ls);</div><div class='ctx'> </div><div class='add'>+	/* clear the LSFL_RUNNING flag to fast up</div><div class='add'>+	 * time_shutdown_sync(), we don't care anymore</div><div class='add'>+	 */</div><div class='add'>+	clear_bit(LSFL_RUNNING, &amp;ls-&gt;ls_flags);</div><div class='add'>+	timer_shutdown_sync(&amp;ls-&gt;ls_scan_timer);</div><div class='add'>+</div><div class='ctx'> 	if (ls_count == 1) {</div><div class='del'>-		dlm_scand_stop();</div><div class='ctx'> 		dlm_clear_members(ls);</div><div class='ctx'> 		dlm_midcomms_shutdown();</div><div class='ctx'> 	}</div><div class='hunk'>@@ -803,45 +759,10 @@ static int release_lockspace(struct dlm_ls *ls, int force)</div><div class='ctx'> </div><div class='ctx'> 	dlm_delete_debug_file(ls);</div><div class='ctx'> </div><div class='del'>-	idr_destroy(&amp;ls-&gt;ls_recover_idr);</div><div class='del'>-	kfree(ls-&gt;ls_recover_buf);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Free all lkb's in idr</div><div class='del'>-	 */</div><div class='del'>-</div><div class='del'>-	idr_for_each(&amp;ls-&gt;ls_lkbidr, lkb_idr_free, ls);</div><div class='del'>-	idr_destroy(&amp;ls-&gt;ls_lkbidr);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Free all rsb's on rsbtbl[] lists</div><div class='del'>-	 */</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; ls-&gt;ls_rsbtbl_size; i++) {</div><div class='del'>-		while ((n = rb_first(&amp;ls-&gt;ls_rsbtbl[i].keep))) {</div><div class='del'>-			rsb = rb_entry(n, struct dlm_rsb, res_hashnode);</div><div class='del'>-			rb_erase(n, &amp;ls-&gt;ls_rsbtbl[i].keep);</div><div class='del'>-			dlm_free_rsb(rsb);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		while ((n = rb_first(&amp;ls-&gt;ls_rsbtbl[i].toss))) {</div><div class='del'>-			rsb = rb_entry(n, struct dlm_rsb, res_hashnode);</div><div class='del'>-			rb_erase(n, &amp;ls-&gt;ls_rsbtbl[i].toss);</div><div class='del'>-			dlm_free_rsb(rsb);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	vfree(ls-&gt;ls_rsbtbl);</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; DLM_REMOVE_NAMES_MAX; i++)</div><div class='del'>-		kfree(ls-&gt;ls_remove_names[i]);</div><div class='add'>+	kobject_put(&amp;ls-&gt;ls_kobj);</div><div class='ctx'> </div><div class='del'>-	while (!list_empty(&amp;ls-&gt;ls_new_rsb)) {</div><div class='del'>-		rsb = list_first_entry(&amp;ls-&gt;ls_new_rsb, struct dlm_rsb,</div><div class='del'>-				       res_hashchain);</div><div class='del'>-		list_del(&amp;rsb-&gt;res_hashchain);</div><div class='del'>-		dlm_free_rsb(rsb);</div><div class='del'>-	}</div><div class='add'>+	xa_destroy(&amp;ls-&gt;ls_recover_xa);</div><div class='add'>+	kfree(ls-&gt;ls_recover_buf);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Free structures on any other lists</div><div class='hunk'>@@ -852,10 +773,11 @@ static int release_lockspace(struct dlm_ls *ls, int force)</div><div class='ctx'> 	dlm_clear_members(ls);</div><div class='ctx'> 	dlm_clear_members_gone(ls);</div><div class='ctx'> 	kfree(ls-&gt;ls_node_array);</div><div class='del'>-	log_rinfo(ls, "release_lockspace final free");</div><div class='del'>-	kobject_put(&amp;ls-&gt;ls_kobj);</div><div class='del'>-	/* The ls structure will be freed when the kobject is done with */</div><div class='ctx'> </div><div class='add'>+	log_rinfo(ls, "%s final free", __func__);</div><div class='add'>+</div><div class='add'>+	/* delayed free of data structures see free_lockspace() */</div><div class='add'>+	queue_work(dlm_wq, &amp;ls-&gt;ls_free_work);</div><div class='ctx'> 	module_put(THIS_MODULE);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -867,29 +789,28 @@ static int release_lockspace(struct dlm_ls *ls, int force)</div><div class='ctx'>  * lockspace must continue to function as usual, participating in recoveries,</div><div class='ctx'>  * until this returns.</div><div class='ctx'>  *</div><div class='del'>- * Force has 4 possible values:</div><div class='del'>- * 0 - don't destroy locksapce if it has any LKBs</div><div class='del'>- * 1 - destroy lockspace if it has remote LKBs but not if it has local LKBs</div><div class='del'>- * 2 - destroy lockspace regardless of LKBs</div><div class='del'>- * 3 - destroy lockspace as part of a forced shutdown</div><div class='add'>+ * See DLM_RELEASE defines for release_option values and their meaning.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-int dlm_release_lockspace(void *lockspace, int force)</div><div class='add'>+int dlm_release_lockspace(void *lockspace, unsigned int release_option)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_ls *ls;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='add'>+	if (release_option &gt; __DLM_RELEASE_MAX)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='ctx'> 	ls = dlm_find_lockspace_local(lockspace);</div><div class='ctx'> 	if (!ls)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	dlm_put_lockspace(ls);</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;ls_lock);</div><div class='del'>-	error = release_lockspace(ls, force);</div><div class='add'>+	error = release_lockspace(ls, release_option);</div><div class='ctx'> 	if (!error)</div><div class='ctx'> 		ls_count--;</div><div class='ctx'> 	if (!ls_count)</div><div class='del'>-		dlm_lowcomms_stop();</div><div class='add'>+		dlm_midcomms_stop();</div><div class='ctx'> 	mutex_unlock(&amp;ls_lock);</div><div class='ctx'> </div><div class='ctx'> 	return error;</div><div class='hunk'>@@ -902,20 +823,19 @@ void dlm_stop_lockspaces(void)</div><div class='ctx'> </div><div class='ctx'>  restart:</div><div class='ctx'> 	count = 0;</div><div class='del'>-	spin_lock(&amp;lslist_lock);</div><div class='add'>+	spin_lock_bh(&amp;lslist_lock);</div><div class='ctx'> 	list_for_each_entry(ls, &amp;lslist, ls_list) {</div><div class='ctx'> 		if (!test_bit(LSFL_RUNNING, &amp;ls-&gt;ls_flags)) {</div><div class='ctx'> 			count++;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='del'>-		spin_unlock(&amp;lslist_lock);</div><div class='add'>+		spin_unlock_bh(&amp;lslist_lock);</div><div class='ctx'> 		log_error(ls, "no userland control daemon, stopping lockspace");</div><div class='ctx'> 		dlm_ls_stop(ls);</div><div class='ctx'> 		goto restart;</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;lslist_lock);</div><div class='add'>+	spin_unlock_bh(&amp;lslist_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (count)</div><div class='ctx'> 		log_print("dlm user daemon left %d lockspaces", count);</div><div class='ctx'> }</div><div class='del'>-</div><div class='head'>diff --git a/fs/dlm/lockspace.h b/fs/dlm/lockspace.h<br/>index a78d853b9342..47ebd4411926 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/lockspace.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/lockspace.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/lockspace.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/lockspace.h</a></div><div class='hunk'>@@ -12,6 +12,14 @@</div><div class='ctx'> #ifndef __LOCKSPACE_DOT_H__</div><div class='ctx'> #define __LOCKSPACE_DOT_H__</div><div class='ctx'> </div><div class='add'>+/* DLM_LSFL_FS</div><div class='add'>+ *   The lockspace user is in the kernel (i.e. filesystem).  Enables</div><div class='add'>+ *   direct bast/cast callbacks.</div><div class='add'>+ *</div><div class='add'>+ * internal lockspace flag - will be removed in future</div><div class='add'>+ */</div><div class='add'>+#define DLM_LSFL_FS	0x00000004</div><div class='add'>+</div><div class='ctx'> int dlm_lockspace_init(void);</div><div class='ctx'> void dlm_lockspace_exit(void);</div><div class='ctx'> struct dlm_ls *dlm_find_lockspace_global(uint32_t id);</div><div class='hunk'>@@ -19,6 +27,11 @@ struct dlm_ls *dlm_find_lockspace_local(void *id);</div><div class='ctx'> struct dlm_ls *dlm_find_lockspace_device(int minor);</div><div class='ctx'> void dlm_put_lockspace(struct dlm_ls *ls);</div><div class='ctx'> void dlm_stop_lockspaces(void);</div><div class='add'>+int dlm_new_user_lockspace(const char *name, const char *cluster,</div><div class='add'>+			   uint32_t flags, int lvblen,</div><div class='add'>+			   const struct dlm_lockspace_ops *ops,</div><div class='add'>+			   void *ops_arg, int *ops_result,</div><div class='add'>+			   dlm_lockspace_t **lockspace);</div><div class='ctx'> </div><div class='ctx'> #endif				/* __LOCKSPACE_DOT_H__ */</div><div class='ctx'> </div><div class='head'>diff --git a/fs/dlm/lowcomms.c b/fs/dlm/lowcomms.c<br/>index 8f715c620e1f..b3958008ba3f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/lowcomms.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/lowcomms.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/lowcomms.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/lowcomms.c</a></div><div class='hunk'>@@ -53,49 +53,63 @@</div><div class='ctx'> #include &lt;net/sctp/sctp.h&gt;</div><div class='ctx'> #include &lt;net/ipv6.h&gt;</div><div class='ctx'> </div><div class='add'>+#include &lt;trace/events/dlm.h&gt;</div><div class='add'>+#include &lt;trace/events/sock.h&gt;</div><div class='add'>+</div><div class='ctx'> #include "dlm_internal.h"</div><div class='ctx'> #include "lowcomms.h"</div><div class='ctx'> #include "midcomms.h"</div><div class='add'>+#include "memory.h"</div><div class='ctx'> #include "config.h"</div><div class='ctx'> </div><div class='add'>+#define DLM_SHUTDOWN_WAIT_TIMEOUT msecs_to_jiffies(5000)</div><div class='add'>+#define DLM_MAX_PROCESS_BUFFERS 24</div><div class='ctx'> #define NEEDED_RMEM (4*1024*1024)</div><div class='ctx'> </div><div class='del'>-/* Number of messages to send before rescheduling */</div><div class='del'>-#define MAX_SEND_MSG_COUNT 25</div><div class='del'>-#define DLM_SHUTDOWN_WAIT_TIMEOUT msecs_to_jiffies(10000)</div><div class='del'>-</div><div class='ctx'> struct connection {</div><div class='ctx'> 	struct socket *sock;	/* NULL if not connected */</div><div class='ctx'> 	uint32_t nodeid;	/* So we know who we are in the list */</div><div class='del'>-	struct mutex sock_mutex;</div><div class='add'>+	/* this semaphore is used to allow parallel recv/send in read</div><div class='add'>+	 * lock mode. When we release a sock we need to held the write lock.</div><div class='add'>+	 *</div><div class='add'>+	 * However this is locking code and not nice. When we remove the</div><div class='add'>+	 * othercon handling we can look into other mechanism to synchronize</div><div class='add'>+	 * io handling to call sock_release() at the right time.</div><div class='add'>+	 */</div><div class='add'>+	struct rw_semaphore sock_lock;</div><div class='ctx'> 	unsigned long flags;</div><div class='del'>-#define CF_READ_PENDING 1</div><div class='del'>-#define CF_WRITE_PENDING 2</div><div class='del'>-#define CF_INIT_PENDING 4</div><div class='add'>+#define CF_APP_LIMITED 0</div><div class='add'>+#define CF_RECV_PENDING 1</div><div class='add'>+#define CF_SEND_PENDING 2</div><div class='add'>+#define CF_RECV_INTR 3</div><div class='add'>+#define CF_IO_STOP 4</div><div class='ctx'> #define CF_IS_OTHERCON 5</div><div class='del'>-#define CF_CLOSE 6</div><div class='del'>-#define CF_APP_LIMITED 7</div><div class='del'>-#define CF_CLOSING 8</div><div class='del'>-#define CF_SHUTDOWN 9</div><div class='del'>-#define CF_CONNECTED 10</div><div class='del'>-#define CF_RECONNECT 11</div><div class='del'>-#define CF_DELAY_CONNECT 12</div><div class='del'>-#define CF_EOF 13</div><div class='ctx'> 	struct list_head writequeue;  /* List of outgoing writequeue_entries */</div><div class='ctx'> 	spinlock_t writequeue_lock;</div><div class='del'>-	atomic_t writequeue_cnt;</div><div class='del'>-	struct mutex wq_alloc;</div><div class='ctx'> 	int retries;</div><div class='del'>-#define MAX_CONNECT_RETRIES 3</div><div class='ctx'> 	struct hlist_node list;</div><div class='add'>+	/* due some connect()/accept() races we currently have this cross over</div><div class='add'>+	 * connection attempt second connection for one node.</div><div class='add'>+	 *</div><div class='add'>+	 * There is a solution to avoid the race by introducing a connect</div><div class='add'>+	 * rule as e.g. our_nodeid &gt; nodeid_to_connect who is allowed to</div><div class='add'>+	 * connect. Otherside can connect but will only be considered that</div><div class='add'>+	 * the other side wants to have a reconnect.</div><div class='add'>+	 *</div><div class='add'>+	 * However changing to this behaviour will break backwards compatible.</div><div class='add'>+	 * In a DLM protocol major version upgrade we should remove this!</div><div class='add'>+	 */</div><div class='ctx'> 	struct connection *othercon;</div><div class='del'>-	struct connection *sendcon;</div><div class='del'>-	struct work_struct rwork; /* Receive workqueue */</div><div class='del'>-	struct work_struct swork; /* Send workqueue */</div><div class='del'>-	wait_queue_head_t shutdown_wait; /* wait for graceful shutdown */</div><div class='del'>-	unsigned char *rx_buf;</div><div class='del'>-	int rx_buflen;</div><div class='add'>+	struct work_struct rwork; /* receive worker */</div><div class='add'>+	struct work_struct swork; /* send worker */</div><div class='add'>+	wait_queue_head_t shutdown_wait;</div><div class='add'>+	unsigned char rx_leftover_buf[DLM_MAX_SOCKET_BUFSIZE];</div><div class='ctx'> 	int rx_leftover;</div><div class='add'>+	int mark;</div><div class='add'>+	int addr_count;</div><div class='add'>+	int curr_addr_index;</div><div class='add'>+	struct sockaddr_storage addr[DLM_MAX_ADDR_COUNT];</div><div class='add'>+	spinlock_t addrs_lock;</div><div class='ctx'> 	struct rcu_head rcu;</div><div class='ctx'> };</div><div class='ctx'> #define sock2con(x) ((struct connection *)(x)-&gt;sk_user_data)</div><div class='hunk'>@@ -134,31 +148,25 @@ struct dlm_msg {</div><div class='ctx'> 	struct kref ref;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-struct dlm_node_addr {</div><div class='del'>-	struct list_head list;</div><div class='add'>+struct processqueue_entry {</div><div class='add'>+	unsigned char *buf;</div><div class='ctx'> 	int nodeid;</div><div class='del'>-	int mark;</div><div class='del'>-	int addr_count;</div><div class='del'>-	int curr_addr_index;</div><div class='del'>-	struct sockaddr_storage *addr[DLM_MAX_ADDR_COUNT];</div><div class='add'>+	int buflen;</div><div class='add'>+</div><div class='add'>+	struct list_head list;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct dlm_proto_ops {</div><div class='ctx'> 	bool try_new_addr;</div><div class='ctx'> 	const char *name;</div><div class='ctx'> 	int proto;</div><div class='add'>+	int how;</div><div class='ctx'> </div><div class='del'>-	int (*connect)(struct connection *con, struct socket *sock,</div><div class='del'>-		       struct sockaddr *addr, int addr_len);</div><div class='ctx'> 	void (*sockopts)(struct socket *sock);</div><div class='ctx'> 	int (*bind)(struct socket *sock);</div><div class='ctx'> 	int (*listen_validate)(void);</div><div class='ctx'> 	void (*listen_sockopts)(struct socket *sock);</div><div class='ctx'> 	int (*listen_bind)(struct socket *sock);</div><div class='del'>-	/* What to do to shutdown */</div><div class='del'>-	void (*shutdown_action)(struct connection *con);</div><div class='del'>-	/* What to do to eof check */</div><div class='del'>-	bool (*eof_condition)(struct connection *con);</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static struct listen_sock_callbacks {</div><div class='hunk'>@@ -168,17 +176,13 @@ static struct listen_sock_callbacks {</div><div class='ctx'> 	void (*sk_write_space)(struct sock *);</div><div class='ctx'> } listen_sock;</div><div class='ctx'> </div><div class='del'>-static LIST_HEAD(dlm_node_addrs);</div><div class='del'>-static DEFINE_SPINLOCK(dlm_node_addrs_spin);</div><div class='del'>-</div><div class='ctx'> static struct listen_connection listen_con;</div><div class='del'>-static struct sockaddr_storage *dlm_local_addr[DLM_MAX_ADDR_COUNT];</div><div class='add'>+static struct sockaddr_storage dlm_local_addr[DLM_MAX_ADDR_COUNT];</div><div class='ctx'> static int dlm_local_count;</div><div class='del'>-int dlm_allow_conn;</div><div class='ctx'> </div><div class='ctx'> /* Work queues */</div><div class='del'>-static struct workqueue_struct *recv_workqueue;</div><div class='del'>-static struct workqueue_struct *send_workqueue;</div><div class='add'>+static struct workqueue_struct *io_workqueue;</div><div class='add'>+static struct workqueue_struct *process_workqueue;</div><div class='ctx'> </div><div class='ctx'> static struct hlist_head connection_hash[CONN_HASH_SIZE];</div><div class='ctx'> static DEFINE_SPINLOCK(connections_lock);</div><div class='hunk'>@@ -186,20 +190,78 @@ DEFINE_STATIC_SRCU(connections_srcu);</div><div class='ctx'> </div><div class='ctx'> static const struct dlm_proto_ops *dlm_proto_ops;</div><div class='ctx'> </div><div class='add'>+#define DLM_IO_SUCCESS 0</div><div class='add'>+#define DLM_IO_END 1</div><div class='add'>+#define DLM_IO_EOF 2</div><div class='add'>+#define DLM_IO_RESCHED 3</div><div class='add'>+#define DLM_IO_FLUSH 4</div><div class='add'>+</div><div class='ctx'> static void process_recv_sockets(struct work_struct *work);</div><div class='ctx'> static void process_send_sockets(struct work_struct *work);</div><div class='add'>+static void process_dlm_messages(struct work_struct *work);</div><div class='add'>+</div><div class='add'>+static DECLARE_WORK(process_work, process_dlm_messages);</div><div class='add'>+static DEFINE_SPINLOCK(processqueue_lock);</div><div class='add'>+static bool process_dlm_messages_pending;</div><div class='add'>+static DECLARE_WAIT_QUEUE_HEAD(processqueue_wq);</div><div class='add'>+static atomic_t processqueue_count;</div><div class='add'>+static LIST_HEAD(processqueue);</div><div class='add'>+</div><div class='add'>+bool dlm_lowcomms_is_running(void)</div><div class='add'>+{</div><div class='add'>+	return !!listen_con.sock;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void lowcomms_queue_swork(struct connection *con)</div><div class='add'>+{</div><div class='add'>+	assert_spin_locked(&amp;con-&gt;writequeue_lock);</div><div class='add'>+</div><div class='add'>+	if (!test_bit(CF_IO_STOP, &amp;con-&gt;flags) &amp;&amp;</div><div class='add'>+	    !test_bit(CF_APP_LIMITED, &amp;con-&gt;flags) &amp;&amp;</div><div class='add'>+	    !test_and_set_bit(CF_SEND_PENDING, &amp;con-&gt;flags))</div><div class='add'>+		queue_work(io_workqueue, &amp;con-&gt;swork);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void lowcomms_queue_rwork(struct connection *con)</div><div class='add'>+{</div><div class='add'>+#ifdef CONFIG_LOCKDEP</div><div class='add'>+	WARN_ON_ONCE(!lockdep_sock_is_held(con-&gt;sock-&gt;sk));</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+	if (!test_bit(CF_IO_STOP, &amp;con-&gt;flags) &amp;&amp;</div><div class='add'>+	    !test_and_set_bit(CF_RECV_PENDING, &amp;con-&gt;flags))</div><div class='add'>+		queue_work(io_workqueue, &amp;con-&gt;rwork);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void writequeue_entry_ctor(void *data)</div><div class='add'>+{</div><div class='add'>+	struct writequeue_entry *entry = data;</div><div class='add'>+</div><div class='add'>+	INIT_LIST_HEAD(&amp;entry-&gt;msgs);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct kmem_cache *dlm_lowcomms_writequeue_cache_create(void)</div><div class='add'>+{</div><div class='add'>+	return kmem_cache_create("dlm_writequeue", sizeof(struct writequeue_entry),</div><div class='add'>+				 0, 0, writequeue_entry_ctor);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct kmem_cache *dlm_lowcomms_msg_cache_create(void)</div><div class='add'>+{</div><div class='add'>+	return KMEM_CACHE(dlm_msg, 0);</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /* need to held writequeue_lock */</div><div class='ctx'> static struct writequeue_entry *con_next_wq(struct connection *con)</div><div class='ctx'> {</div><div class='ctx'> 	struct writequeue_entry *e;</div><div class='ctx'> </div><div class='del'>-	if (list_empty(&amp;con-&gt;writequeue))</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	e = list_first_entry(&amp;con-&gt;writequeue, struct writequeue_entry,</div><div class='del'>-			     list);</div><div class='del'>-	if (e-&gt;len == 0)</div><div class='add'>+	e = list_first_entry_or_null(&amp;con-&gt;writequeue, struct writequeue_entry,</div><div class='add'>+				     list);</div><div class='add'>+	/* if len is zero nothing is to send, if there are users filling</div><div class='add'>+	 * buffers we wait until the users are done so we can send more.</div><div class='add'>+	 */</div><div class='add'>+	if (!e || e-&gt;users || e-&gt;len == 0)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='ctx'> 	return e;</div><div class='hunk'>@@ -217,28 +279,16 @@ static struct connection *__find_con(int nodeid, int r)</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool tcp_eof_condition(struct connection *con)</div><div class='add'>+static void dlm_con_init(struct connection *con, int nodeid)</div><div class='ctx'> {</div><div class='del'>-	return atomic_read(&amp;con-&gt;writequeue_cnt);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int dlm_con_init(struct connection *con, int nodeid)</div><div class='del'>-{</div><div class='del'>-	con-&gt;rx_buflen = dlm_config.ci_buffer_size;</div><div class='del'>-	con-&gt;rx_buf = kmalloc(con-&gt;rx_buflen, GFP_NOFS);</div><div class='del'>-	if (!con-&gt;rx_buf)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='ctx'> 	con-&gt;nodeid = nodeid;</div><div class='del'>-	mutex_init(&amp;con-&gt;sock_mutex);</div><div class='add'>+	init_rwsem(&amp;con-&gt;sock_lock);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;con-&gt;writequeue);</div><div class='ctx'> 	spin_lock_init(&amp;con-&gt;writequeue_lock);</div><div class='del'>-	atomic_set(&amp;con-&gt;writequeue_cnt, 0);</div><div class='ctx'> 	INIT_WORK(&amp;con-&gt;swork, process_send_sockets);</div><div class='ctx'> 	INIT_WORK(&amp;con-&gt;rwork, process_recv_sockets);</div><div class='add'>+	spin_lock_init(&amp;con-&gt;addrs_lock);</div><div class='ctx'> 	init_waitqueue_head(&amp;con-&gt;shutdown_wait);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -248,7 +298,7 @@ static int dlm_con_init(struct connection *con, int nodeid)</div><div class='ctx'> static struct connection *nodeid2con(int nodeid, gfp_t alloc)</div><div class='ctx'> {</div><div class='ctx'> 	struct connection *con, *tmp;</div><div class='del'>-	int r, ret;</div><div class='add'>+	int r;</div><div class='ctx'> </div><div class='ctx'> 	r = nodeid_hash(nodeid);</div><div class='ctx'> 	con = __find_con(nodeid, r);</div><div class='hunk'>@@ -259,13 +309,7 @@ static struct connection *nodeid2con(int nodeid, gfp_t alloc)</div><div class='ctx'> 	if (!con)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='del'>-	ret = dlm_con_init(con, nodeid);</div><div class='del'>-	if (ret) {</div><div class='del'>-		kfree(con);</div><div class='del'>-		return NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	mutex_init(&amp;con-&gt;wq_alloc);</div><div class='add'>+	dlm_con_init(con, nodeid);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;connections_lock);</div><div class='ctx'> 	/* Because multiple workqueues/threads calls this function it can</div><div class='hunk'>@@ -277,7 +321,6 @@ static struct connection *nodeid2con(int nodeid, gfp_t alloc)</div><div class='ctx'> 	tmp = __find_con(nodeid, r);</div><div class='ctx'> 	if (tmp) {</div><div class='ctx'> 		spin_unlock(&amp;connections_lock);</div><div class='del'>-		kfree(con-&gt;rx_buf);</div><div class='ctx'> 		kfree(con);</div><div class='ctx'> 		return tmp;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -288,29 +331,6 @@ static struct connection *nodeid2con(int nodeid, gfp_t alloc)</div><div class='ctx'> 	return con;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Loop round all connections */</div><div class='del'>-static void foreach_conn(void (*conn_func)(struct connection *c))</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-	struct connection *con;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; CONN_HASH_SIZE; i++) {</div><div class='del'>-		hlist_for_each_entry_rcu(con, &amp;connection_hash[i], list)</div><div class='del'>-			conn_func(con);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct dlm_node_addr *find_node_addr(int nodeid)</div><div class='del'>-{</div><div class='del'>-	struct dlm_node_addr *na;</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(na, &amp;dlm_node_addrs, list) {</div><div class='del'>-		if (na-&gt;nodeid == nodeid)</div><div class='del'>-			return na;</div><div class='del'>-	}</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int addr_compare(const struct sockaddr_storage *x,</div><div class='ctx'> 			const struct sockaddr_storage *y)</div><div class='ctx'> {</div><div class='hunk'>@@ -344,40 +364,47 @@ static int nodeid_to_addr(int nodeid, struct sockaddr_storage *sas_out,</div><div class='ctx'> 			  unsigned int *mark)</div><div class='ctx'> {</div><div class='ctx'> 	struct sockaddr_storage sas;</div><div class='del'>-	struct dlm_node_addr *na;</div><div class='add'>+	struct connection *con;</div><div class='add'>+	int idx;</div><div class='ctx'> </div><div class='ctx'> 	if (!dlm_local_count)</div><div class='ctx'> 		return -1;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;dlm_node_addrs_spin);</div><div class='del'>-	na = find_node_addr(nodeid);</div><div class='del'>-	if (na &amp;&amp; na-&gt;addr_count) {</div><div class='del'>-		memcpy(&amp;sas, na-&gt;addr[na-&gt;curr_addr_index],</div><div class='del'>-		       sizeof(struct sockaddr_storage));</div><div class='add'>+	idx = srcu_read_lock(&amp;connections_srcu);</div><div class='add'>+	con = nodeid2con(nodeid, 0);</div><div class='add'>+	if (!con) {</div><div class='add'>+		srcu_read_unlock(&amp;connections_srcu, idx);</div><div class='add'>+		return -ENOENT;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		if (try_new_addr) {</div><div class='del'>-			na-&gt;curr_addr_index++;</div><div class='del'>-			if (na-&gt;curr_addr_index == na-&gt;addr_count)</div><div class='del'>-				na-&gt;curr_addr_index = 0;</div><div class='del'>-		}</div><div class='add'>+	spin_lock(&amp;con-&gt;addrs_lock);</div><div class='add'>+	if (!con-&gt;addr_count) {</div><div class='add'>+		spin_unlock(&amp;con-&gt;addrs_lock);</div><div class='add'>+		srcu_read_unlock(&amp;connections_srcu, idx);</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;dlm_node_addrs_spin);</div><div class='ctx'> </div><div class='del'>-	if (!na)</div><div class='del'>-		return -EEXIST;</div><div class='add'>+	memcpy(&amp;sas, &amp;con-&gt;addr[con-&gt;curr_addr_index],</div><div class='add'>+	       sizeof(struct sockaddr_storage));</div><div class='ctx'> </div><div class='del'>-	if (!na-&gt;addr_count)</div><div class='del'>-		return -ENOENT;</div><div class='add'>+	if (try_new_addr) {</div><div class='add'>+		con-&gt;curr_addr_index++;</div><div class='add'>+		if (con-&gt;curr_addr_index == con-&gt;addr_count)</div><div class='add'>+			con-&gt;curr_addr_index = 0;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	*mark = na-&gt;mark;</div><div class='add'>+	*mark = con-&gt;mark;</div><div class='add'>+	spin_unlock(&amp;con-&gt;addrs_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (sas_out)</div><div class='ctx'> 		memcpy(sas_out, &amp;sas, sizeof(struct sockaddr_storage));</div><div class='ctx'> </div><div class='del'>-	if (!sa_out)</div><div class='add'>+	if (!sa_out) {</div><div class='add'>+		srcu_read_unlock(&amp;connections_srcu, idx);</div><div class='ctx'> 		return 0;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (dlm_local_addr[0]-&gt;ss_family == AF_INET) {</div><div class='add'>+	if (dlm_local_addr[0].ss_family == AF_INET) {</div><div class='ctx'> 		struct sockaddr_in *in4  = (struct sockaddr_in *) &amp;sas;</div><div class='ctx'> 		struct sockaddr_in *ret4 = (struct sockaddr_in *) sa_out;</div><div class='ctx'> 		ret4-&gt;sin_addr.s_addr = in4-&gt;sin_addr.s_addr;</div><div class='hunk'>@@ -387,168 +414,135 @@ static int nodeid_to_addr(int nodeid, struct sockaddr_storage *sas_out,</div><div class='ctx'> 		ret6-&gt;sin6_addr = in6-&gt;sin6_addr;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	srcu_read_unlock(&amp;connections_srcu, idx);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int addr_to_nodeid(struct sockaddr_storage *addr, int *nodeid,</div><div class='ctx'> 			  unsigned int *mark)</div><div class='ctx'> {</div><div class='del'>-	struct dlm_node_addr *na;</div><div class='del'>-	int rv = -EEXIST;</div><div class='del'>-	int addr_i;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;dlm_node_addrs_spin);</div><div class='del'>-	list_for_each_entry(na, &amp;dlm_node_addrs, list) {</div><div class='del'>-		if (!na-&gt;addr_count)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		for (addr_i = 0; addr_i &lt; na-&gt;addr_count; addr_i++) {</div><div class='del'>-			if (addr_compare(na-&gt;addr[addr_i], addr)) {</div><div class='del'>-				*nodeid = na-&gt;nodeid;</div><div class='del'>-				*mark = na-&gt;mark;</div><div class='del'>-				rv = 0;</div><div class='del'>-				goto unlock;</div><div class='add'>+	struct connection *con;</div><div class='add'>+	int i, idx, addr_i;</div><div class='add'>+</div><div class='add'>+	idx = srcu_read_lock(&amp;connections_srcu);</div><div class='add'>+	for (i = 0; i &lt; CONN_HASH_SIZE; i++) {</div><div class='add'>+		hlist_for_each_entry_rcu(con, &amp;connection_hash[i], list) {</div><div class='add'>+			WARN_ON_ONCE(!con-&gt;addr_count);</div><div class='add'>+</div><div class='add'>+			spin_lock(&amp;con-&gt;addrs_lock);</div><div class='add'>+			for (addr_i = 0; addr_i &lt; con-&gt;addr_count; addr_i++) {</div><div class='add'>+				if (addr_compare(&amp;con-&gt;addr[addr_i], addr)) {</div><div class='add'>+					*nodeid = con-&gt;nodeid;</div><div class='add'>+					*mark = con-&gt;mark;</div><div class='add'>+					spin_unlock(&amp;con-&gt;addrs_lock);</div><div class='add'>+					srcu_read_unlock(&amp;connections_srcu, idx);</div><div class='add'>+					return 0;</div><div class='add'>+				}</div><div class='ctx'> 			}</div><div class='add'>+			spin_unlock(&amp;con-&gt;addrs_lock);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-unlock:</div><div class='del'>-	spin_unlock(&amp;dlm_node_addrs_spin);</div><div class='del'>-	return rv;</div><div class='add'>+	srcu_read_unlock(&amp;connections_srcu, idx);</div><div class='add'>+</div><div class='add'>+	return -ENOENT;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* caller need to held dlm_node_addrs_spin lock */</div><div class='del'>-static bool dlm_lowcomms_na_has_addr(const struct dlm_node_addr *na,</div><div class='del'>-				     const struct sockaddr_storage *addr)</div><div class='add'>+static bool dlm_lowcomms_con_has_addr(const struct connection *con,</div><div class='add'>+				      const struct sockaddr_storage *addr)</div><div class='ctx'> {</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; na-&gt;addr_count; i++) {</div><div class='del'>-		if (addr_compare(na-&gt;addr[i], addr))</div><div class='add'>+	for (i = 0; i &lt; con-&gt;addr_count; i++) {</div><div class='add'>+		if (addr_compare(&amp;con-&gt;addr[i], addr))</div><div class='ctx'> 			return true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int dlm_lowcomms_addr(int nodeid, struct sockaddr_storage *addr, int len)</div><div class='add'>+int dlm_lowcomms_addr(int nodeid, struct sockaddr_storage *addr)</div><div class='ctx'> {</div><div class='del'>-	struct sockaddr_storage *new_addr;</div><div class='del'>-	struct dlm_node_addr *new_node, *na;</div><div class='add'>+	struct connection *con;</div><div class='ctx'> 	bool ret;</div><div class='add'>+	int idx;</div><div class='ctx'> </div><div class='del'>-	new_node = kzalloc(sizeof(struct dlm_node_addr), GFP_NOFS);</div><div class='del'>-	if (!new_node)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	new_addr = kzalloc(sizeof(struct sockaddr_storage), GFP_NOFS);</div><div class='del'>-	if (!new_addr) {</div><div class='del'>-		kfree(new_node);</div><div class='add'>+	idx = srcu_read_lock(&amp;connections_srcu);</div><div class='add'>+	con = nodeid2con(nodeid, GFP_NOFS);</div><div class='add'>+	if (!con) {</div><div class='add'>+		srcu_read_unlock(&amp;connections_srcu, idx);</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	memcpy(new_addr, addr, len);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;dlm_node_addrs_spin);</div><div class='del'>-	na = find_node_addr(nodeid);</div><div class='del'>-	if (!na) {</div><div class='del'>-		new_node-&gt;nodeid = nodeid;</div><div class='del'>-		new_node-&gt;addr[0] = new_addr;</div><div class='del'>-		new_node-&gt;addr_count = 1;</div><div class='del'>-		new_node-&gt;mark = dlm_config.ci_mark;</div><div class='del'>-		list_add(&amp;new_node-&gt;list, &amp;dlm_node_addrs);</div><div class='del'>-		spin_unlock(&amp;dlm_node_addrs_spin);</div><div class='add'>+	spin_lock(&amp;con-&gt;addrs_lock);</div><div class='add'>+	if (!con-&gt;addr_count) {</div><div class='add'>+		memcpy(&amp;con-&gt;addr[0], addr, sizeof(*addr));</div><div class='add'>+		con-&gt;addr_count = 1;</div><div class='add'>+		con-&gt;mark = dlm_config.ci_mark;</div><div class='add'>+		spin_unlock(&amp;con-&gt;addrs_lock);</div><div class='add'>+		srcu_read_unlock(&amp;connections_srcu, idx);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = dlm_lowcomms_na_has_addr(na, addr);</div><div class='add'>+	ret = dlm_lowcomms_con_has_addr(con, addr);</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		spin_unlock(&amp;dlm_node_addrs_spin);</div><div class='del'>-		kfree(new_addr);</div><div class='del'>-		kfree(new_node);</div><div class='add'>+		spin_unlock(&amp;con-&gt;addrs_lock);</div><div class='add'>+		srcu_read_unlock(&amp;connections_srcu, idx);</div><div class='ctx'> 		return -EEXIST;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (na-&gt;addr_count &gt;= DLM_MAX_ADDR_COUNT) {</div><div class='del'>-		spin_unlock(&amp;dlm_node_addrs_spin);</div><div class='del'>-		kfree(new_addr);</div><div class='del'>-		kfree(new_node);</div><div class='add'>+	if (con-&gt;addr_count &gt;= DLM_MAX_ADDR_COUNT) {</div><div class='add'>+		spin_unlock(&amp;con-&gt;addrs_lock);</div><div class='add'>+		srcu_read_unlock(&amp;connections_srcu, idx);</div><div class='ctx'> 		return -ENOSPC;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	na-&gt;addr[na-&gt;addr_count++] = new_addr;</div><div class='del'>-	spin_unlock(&amp;dlm_node_addrs_spin);</div><div class='del'>-	kfree(new_node);</div><div class='add'>+	memcpy(&amp;con-&gt;addr[con-&gt;addr_count++], addr, sizeof(*addr));</div><div class='add'>+	srcu_read_unlock(&amp;connections_srcu, idx);</div><div class='add'>+	spin_unlock(&amp;con-&gt;addrs_lock);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Data available on socket or listen socket received a connect */</div><div class='ctx'> static void lowcomms_data_ready(struct sock *sk)</div><div class='ctx'> {</div><div class='del'>-	struct connection *con;</div><div class='add'>+	struct connection *con = sock2con(sk);</div><div class='ctx'> </div><div class='del'>-	read_lock_bh(&amp;sk-&gt;sk_callback_lock);</div><div class='del'>-	con = sock2con(sk);</div><div class='del'>-	if (con &amp;&amp; !test_and_set_bit(CF_READ_PENDING, &amp;con-&gt;flags))</div><div class='del'>-		queue_work(recv_workqueue, &amp;con-&gt;rwork);</div><div class='del'>-	read_unlock_bh(&amp;sk-&gt;sk_callback_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void lowcomms_listen_data_ready(struct sock *sk)</div><div class='del'>-{</div><div class='del'>-	if (!dlm_allow_conn)</div><div class='del'>-		return;</div><div class='add'>+	trace_sk_data_ready(sk);</div><div class='ctx'> </div><div class='del'>-	queue_work(recv_workqueue, &amp;listen_con.rwork);</div><div class='add'>+	set_bit(CF_RECV_INTR, &amp;con-&gt;flags);</div><div class='add'>+	lowcomms_queue_rwork(con);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void lowcomms_write_space(struct sock *sk)</div><div class='ctx'> {</div><div class='del'>-	struct connection *con;</div><div class='del'>-</div><div class='del'>-	read_lock_bh(&amp;sk-&gt;sk_callback_lock);</div><div class='del'>-	con = sock2con(sk);</div><div class='del'>-	if (!con)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	if (!test_and_set_bit(CF_CONNECTED, &amp;con-&gt;flags)) {</div><div class='del'>-		log_print("successful connected to node %d", con-&gt;nodeid);</div><div class='del'>-		queue_work(send_workqueue, &amp;con-&gt;swork);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	struct connection *con = sock2con(sk);</div><div class='ctx'> </div><div class='ctx'> 	clear_bit(SOCK_NOSPACE, &amp;con-&gt;sock-&gt;flags);</div><div class='ctx'> </div><div class='add'>+	spin_lock_bh(&amp;con-&gt;writequeue_lock);</div><div class='ctx'> 	if (test_and_clear_bit(CF_APP_LIMITED, &amp;con-&gt;flags)) {</div><div class='ctx'> 		con-&gt;sock-&gt;sk-&gt;sk_write_pending--;</div><div class='ctx'> 		clear_bit(SOCKWQ_ASYNC_NOSPACE, &amp;con-&gt;sock-&gt;flags);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	queue_work(send_workqueue, &amp;con-&gt;swork);</div><div class='del'>-out:</div><div class='del'>-	read_unlock_bh(&amp;sk-&gt;sk_callback_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void lowcomms_connect_sock(struct connection *con)</div><div class='del'>-{</div><div class='del'>-	if (test_bit(CF_CLOSE, &amp;con-&gt;flags))</div><div class='del'>-		return;</div><div class='del'>-	queue_work(send_workqueue, &amp;con-&gt;swork);</div><div class='del'>-	cond_resched();</div><div class='add'>+	lowcomms_queue_swork(con);</div><div class='add'>+	spin_unlock_bh(&amp;con-&gt;writequeue_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void lowcomms_state_change(struct sock *sk)</div><div class='ctx'> {</div><div class='ctx'> 	/* SCTP layer is not calling sk_data_ready when the connection</div><div class='del'>-	 * is done, so we catch the signal through here. Also, it</div><div class='del'>-	 * doesn't switch socket state when entering shutdown, so we</div><div class='del'>-	 * skip the write in that case.</div><div class='add'>+	 * is done, so we catch the signal through here.</div><div class='ctx'> 	 */</div><div class='del'>-	if (sk-&gt;sk_shutdown) {</div><div class='del'>-		if (sk-&gt;sk_shutdown == RCV_SHUTDOWN)</div><div class='del'>-			lowcomms_data_ready(sk);</div><div class='del'>-	} else if (sk-&gt;sk_state == TCP_ESTABLISHED) {</div><div class='del'>-		lowcomms_write_space(sk);</div><div class='del'>-	}</div><div class='add'>+	if (sk-&gt;sk_shutdown &amp; RCV_SHUTDOWN)</div><div class='add'>+		lowcomms_data_ready(sk);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void lowcomms_listen_data_ready(struct sock *sk)</div><div class='add'>+{</div><div class='add'>+	trace_sk_data_ready(sk);</div><div class='add'>+</div><div class='add'>+	queue_work(io_workqueue, &amp;listen_con.rwork);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int dlm_lowcomms_connect_node(int nodeid)</div><div class='hunk'>@@ -556,138 +550,95 @@ int dlm_lowcomms_connect_node(int nodeid)</div><div class='ctx'> 	struct connection *con;</div><div class='ctx'> 	int idx;</div><div class='ctx'> </div><div class='del'>-	if (nodeid == dlm_our_nodeid())</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='ctx'> 	idx = srcu_read_lock(&amp;connections_srcu);</div><div class='del'>-	con = nodeid2con(nodeid, GFP_NOFS);</div><div class='del'>-	if (!con) {</div><div class='add'>+	con = nodeid2con(nodeid, 0);</div><div class='add'>+	if (WARN_ON_ONCE(!con)) {</div><div class='ctx'> 		srcu_read_unlock(&amp;connections_srcu, idx);</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	lowcomms_connect_sock(con);</div><div class='add'>+	down_read(&amp;con-&gt;sock_lock);</div><div class='add'>+	if (!con-&gt;sock) {</div><div class='add'>+		spin_lock_bh(&amp;con-&gt;writequeue_lock);</div><div class='add'>+		lowcomms_queue_swork(con);</div><div class='add'>+		spin_unlock_bh(&amp;con-&gt;writequeue_lock);</div><div class='add'>+	}</div><div class='add'>+	up_read(&amp;con-&gt;sock_lock);</div><div class='ctx'> 	srcu_read_unlock(&amp;connections_srcu, idx);</div><div class='ctx'> </div><div class='add'>+	cond_resched();</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int dlm_lowcomms_nodes_set_mark(int nodeid, unsigned int mark)</div><div class='ctx'> {</div><div class='del'>-	struct dlm_node_addr *na;</div><div class='add'>+	struct connection *con;</div><div class='add'>+	int idx;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;dlm_node_addrs_spin);</div><div class='del'>-	na = find_node_addr(nodeid);</div><div class='del'>-	if (!na) {</div><div class='del'>-		spin_unlock(&amp;dlm_node_addrs_spin);</div><div class='add'>+	idx = srcu_read_lock(&amp;connections_srcu);</div><div class='add'>+	con = nodeid2con(nodeid, 0);</div><div class='add'>+	if (!con) {</div><div class='add'>+		srcu_read_unlock(&amp;connections_srcu, idx);</div><div class='ctx'> 		return -ENOENT;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	na-&gt;mark = mark;</div><div class='del'>-	spin_unlock(&amp;dlm_node_addrs_spin);</div><div class='del'>-</div><div class='add'>+	spin_lock(&amp;con-&gt;addrs_lock);</div><div class='add'>+	con-&gt;mark = mark;</div><div class='add'>+	spin_unlock(&amp;con-&gt;addrs_lock);</div><div class='add'>+	srcu_read_unlock(&amp;connections_srcu, idx);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void lowcomms_error_report(struct sock *sk)</div><div class='ctx'> {</div><div class='del'>-	struct connection *con;</div><div class='del'>-	struct sockaddr_storage saddr;</div><div class='del'>-	void (*orig_report)(struct sock *) = NULL;</div><div class='del'>-</div><div class='del'>-	read_lock_bh(&amp;sk-&gt;sk_callback_lock);</div><div class='del'>-	con = sock2con(sk);</div><div class='del'>-	if (con == NULL)</div><div class='del'>-		goto out;</div><div class='add'>+	struct connection *con = sock2con(sk);</div><div class='add'>+	struct inet_sock *inet;</div><div class='ctx'> </div><div class='del'>-	orig_report = listen_sock.sk_error_report;</div><div class='del'>-	if (kernel_getpeername(sk-&gt;sk_socket, (struct sockaddr *)&amp;saddr) &lt; 0) {</div><div class='add'>+	inet = inet_sk(sk);</div><div class='add'>+	switch (sk-&gt;sk_family) {</div><div class='add'>+	case AF_INET:</div><div class='ctx'> 		printk_ratelimited(KERN_ERR "dlm: node %d: socket error "</div><div class='del'>-				   "sending to node %d, port %d, "</div><div class='add'>+				   "sending to node %d at %pI4, dport %d, "</div><div class='ctx'> 				   "sk_err=%d/%d\n", dlm_our_nodeid(),</div><div class='del'>-				   con-&gt;nodeid, dlm_config.ci_tcp_port,</div><div class='del'>-				   sk-&gt;sk_err, sk-&gt;sk_err_soft);</div><div class='del'>-	} else if (saddr.ss_family == AF_INET) {</div><div class='del'>-		struct sockaddr_in *sin4 = (struct sockaddr_in *)&amp;saddr;</div><div class='del'>-</div><div class='del'>-		printk_ratelimited(KERN_ERR "dlm: node %d: socket error "</div><div class='del'>-				   "sending to node %d at %pI4, port %d, "</div><div class='del'>-				   "sk_err=%d/%d\n", dlm_our_nodeid(),</div><div class='del'>-				   con-&gt;nodeid, &amp;sin4-&gt;sin_addr.s_addr,</div><div class='del'>-				   dlm_config.ci_tcp_port, sk-&gt;sk_err,</div><div class='del'>-				   sk-&gt;sk_err_soft);</div><div class='del'>-	} else {</div><div class='del'>-		struct sockaddr_in6 *sin6 = (struct sockaddr_in6 *)&amp;saddr;</div><div class='del'>-</div><div class='add'>+				   con-&gt;nodeid, &amp;inet-&gt;inet_daddr,</div><div class='add'>+				   ntohs(inet-&gt;inet_dport), sk-&gt;sk_err,</div><div class='add'>+				   READ_ONCE(sk-&gt;sk_err_soft));</div><div class='add'>+		break;</div><div class='add'>+#if IS_ENABLED(CONFIG_IPV6)</div><div class='add'>+	case AF_INET6:</div><div class='ctx'> 		printk_ratelimited(KERN_ERR "dlm: node %d: socket error "</div><div class='del'>-				   "sending to node %d at %u.%u.%u.%u, "</div><div class='del'>-				   "port %d, sk_err=%d/%d\n", dlm_our_nodeid(),</div><div class='del'>-				   con-&gt;nodeid, sin6-&gt;sin6_addr.s6_addr32[0],</div><div class='del'>-				   sin6-&gt;sin6_addr.s6_addr32[1],</div><div class='del'>-				   sin6-&gt;sin6_addr.s6_addr32[2],</div><div class='del'>-				   sin6-&gt;sin6_addr.s6_addr32[3],</div><div class='del'>-				   dlm_config.ci_tcp_port, sk-&gt;sk_err,</div><div class='del'>-				   sk-&gt;sk_err_soft);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* below sendcon only handling */</div><div class='del'>-	if (test_bit(CF_IS_OTHERCON, &amp;con-&gt;flags))</div><div class='del'>-		con = con-&gt;sendcon;</div><div class='del'>-</div><div class='del'>-	switch (sk-&gt;sk_err) {</div><div class='del'>-	case ECONNREFUSED:</div><div class='del'>-		set_bit(CF_DELAY_CONNECT, &amp;con-&gt;flags);</div><div class='add'>+				   "sending to node %d at %pI6c, "</div><div class='add'>+				   "dport %d, sk_err=%d/%d\n", dlm_our_nodeid(),</div><div class='add'>+				   con-&gt;nodeid, &amp;sk-&gt;sk_v6_daddr,</div><div class='add'>+				   ntohs(inet-&gt;inet_dport), sk-&gt;sk_err,</div><div class='add'>+				   READ_ONCE(sk-&gt;sk_err_soft));</div><div class='ctx'> 		break;</div><div class='add'>+#endif</div><div class='ctx'> 	default:</div><div class='add'>+		printk_ratelimited(KERN_ERR "dlm: node %d: socket error "</div><div class='add'>+				   "invalid socket family %d set, "</div><div class='add'>+				   "sk_err=%d/%d\n", dlm_our_nodeid(),</div><div class='add'>+				   sk-&gt;sk_family, sk-&gt;sk_err,</div><div class='add'>+				   READ_ONCE(sk-&gt;sk_err_soft));</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!test_and_set_bit(CF_RECONNECT, &amp;con-&gt;flags))</div><div class='del'>-		queue_work(send_workqueue, &amp;con-&gt;swork);</div><div class='add'>+	dlm_midcomms_unack_msg_resend(con-&gt;nodeid);</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	read_unlock_bh(&amp;sk-&gt;sk_callback_lock);</div><div class='del'>-	if (orig_report)</div><div class='del'>-		orig_report(sk);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* Note: sk_callback_lock must be locked before calling this function. */</div><div class='del'>-static void save_listen_callbacks(struct socket *sock)</div><div class='del'>-{</div><div class='del'>-	struct sock *sk = sock-&gt;sk;</div><div class='del'>-</div><div class='del'>-	listen_sock.sk_data_ready = sk-&gt;sk_data_ready;</div><div class='del'>-	listen_sock.sk_state_change = sk-&gt;sk_state_change;</div><div class='del'>-	listen_sock.sk_write_space = sk-&gt;sk_write_space;</div><div class='del'>-	listen_sock.sk_error_report = sk-&gt;sk_error_report;</div><div class='add'>+	listen_sock.sk_error_report(sk);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void restore_callbacks(struct socket *sock)</div><div class='add'>+static void restore_callbacks(struct sock *sk)</div><div class='ctx'> {</div><div class='del'>-	struct sock *sk = sock-&gt;sk;</div><div class='add'>+#ifdef CONFIG_LOCKDEP</div><div class='add'>+	WARN_ON_ONCE(!lockdep_sock_is_held(sk));</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='del'>-	write_lock_bh(&amp;sk-&gt;sk_callback_lock);</div><div class='ctx'> 	sk-&gt;sk_user_data = NULL;</div><div class='ctx'> 	sk-&gt;sk_data_ready = listen_sock.sk_data_ready;</div><div class='ctx'> 	sk-&gt;sk_state_change = listen_sock.sk_state_change;</div><div class='ctx'> 	sk-&gt;sk_write_space = listen_sock.sk_write_space;</div><div class='ctx'> 	sk-&gt;sk_error_report = listen_sock.sk_error_report;</div><div class='del'>-	write_unlock_bh(&amp;sk-&gt;sk_callback_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void add_listen_sock(struct socket *sock, struct listen_connection *con)</div><div class='del'>-{</div><div class='del'>-	struct sock *sk = sock-&gt;sk;</div><div class='del'>-</div><div class='del'>-	write_lock_bh(&amp;sk-&gt;sk_callback_lock);</div><div class='del'>-	save_listen_callbacks(sock);</div><div class='del'>-	con-&gt;sock = sock;</div><div class='del'>-</div><div class='del'>-	sk-&gt;sk_user_data = con;</div><div class='del'>-	sk-&gt;sk_allocation = GFP_NOFS;</div><div class='del'>-	/* Install a data_ready callback */</div><div class='del'>-	sk-&gt;sk_data_ready = lowcomms_listen_data_ready;</div><div class='del'>-	write_unlock_bh(&amp;sk-&gt;sk_callback_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Make a socket active */</div><div class='hunk'>@@ -695,33 +646,34 @@ static void add_sock(struct socket *sock, struct connection *con)</div><div class='ctx'> {</div><div class='ctx'> 	struct sock *sk = sock-&gt;sk;</div><div class='ctx'> </div><div class='del'>-	write_lock_bh(&amp;sk-&gt;sk_callback_lock);</div><div class='add'>+	lock_sock(sk);</div><div class='ctx'> 	con-&gt;sock = sock;</div><div class='ctx'> </div><div class='ctx'> 	sk-&gt;sk_user_data = con;</div><div class='del'>-	/* Install a data_ready callback */</div><div class='ctx'> 	sk-&gt;sk_data_ready = lowcomms_data_ready;</div><div class='ctx'> 	sk-&gt;sk_write_space = lowcomms_write_space;</div><div class='del'>-	sk-&gt;sk_state_change = lowcomms_state_change;</div><div class='add'>+	if (dlm_config.ci_protocol == DLM_PROTO_SCTP)</div><div class='add'>+		sk-&gt;sk_state_change = lowcomms_state_change;</div><div class='ctx'> 	sk-&gt;sk_allocation = GFP_NOFS;</div><div class='add'>+	sk-&gt;sk_use_task_frag = false;</div><div class='ctx'> 	sk-&gt;sk_error_report = lowcomms_error_report;</div><div class='del'>-	write_unlock_bh(&amp;sk-&gt;sk_callback_lock);</div><div class='add'>+	release_sock(sk);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Add the port number to an IPv6 or 4 sockaddr and return the address</div><div class='ctx'>    length */</div><div class='del'>-static void make_sockaddr(struct sockaddr_storage *saddr, uint16_t port,</div><div class='add'>+static void make_sockaddr(struct sockaddr_storage *saddr, __be16 port,</div><div class='ctx'> 			  int *addr_len)</div><div class='ctx'> {</div><div class='del'>-	saddr-&gt;ss_family =  dlm_local_addr[0]-&gt;ss_family;</div><div class='add'>+	saddr-&gt;ss_family =  dlm_local_addr[0].ss_family;</div><div class='ctx'> 	if (saddr-&gt;ss_family == AF_INET) {</div><div class='ctx'> 		struct sockaddr_in *in4_addr = (struct sockaddr_in *)saddr;</div><div class='del'>-		in4_addr-&gt;sin_port = cpu_to_be16(port);</div><div class='add'>+		in4_addr-&gt;sin_port = port;</div><div class='ctx'> 		*addr_len = sizeof(struct sockaddr_in);</div><div class='ctx'> 		memset(&amp;in4_addr-&gt;sin_zero, 0, sizeof(in4_addr-&gt;sin_zero));</div><div class='ctx'> 	} else {</div><div class='ctx'> 		struct sockaddr_in6 *in6_addr = (struct sockaddr_in6 *)saddr;</div><div class='del'>-		in6_addr-&gt;sin6_port = cpu_to_be16(port);</div><div class='add'>+		in6_addr-&gt;sin6_port = port;</div><div class='ctx'> 		*addr_len = sizeof(struct sockaddr_in6);</div><div class='ctx'> 	}</div><div class='ctx'> 	memset((char *)saddr + *addr_len, 0, sizeof(struct sockaddr_storage) - *addr_len);</div><div class='hunk'>@@ -733,7 +685,7 @@ static void dlm_page_release(struct kref *kref)</div><div class='ctx'> 						  ref);</div><div class='ctx'> </div><div class='ctx'> 	__free_page(e-&gt;page);</div><div class='del'>-	kfree(e);</div><div class='add'>+	dlm_free_writequeue(e);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void dlm_msg_release(struct kref *kref)</div><div class='hunk'>@@ -741,7 +693,7 @@ static void dlm_msg_release(struct kref *kref)</div><div class='ctx'> 	struct dlm_msg *msg = container_of(kref, struct dlm_msg, ref);</div><div class='ctx'> </div><div class='ctx'> 	kref_put(&amp;msg-&gt;entry-&gt;ref, dlm_page_release);</div><div class='del'>-	kfree(msg);</div><div class='add'>+	dlm_free_msg(msg);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void free_entry(struct writequeue_entry *e)</div><div class='hunk'>@@ -759,43 +711,63 @@ static void free_entry(struct writequeue_entry *e)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	list_del(&amp;e-&gt;list);</div><div class='del'>-	atomic_dec(&amp;e-&gt;con-&gt;writequeue_cnt);</div><div class='ctx'> 	kref_put(&amp;e-&gt;ref, dlm_page_release);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void dlm_close_sock(struct socket **sock)</div><div class='ctx'> {</div><div class='del'>-	if (*sock) {</div><div class='del'>-		restore_callbacks(*sock);</div><div class='del'>-		sock_release(*sock);</div><div class='del'>-		*sock = NULL;</div><div class='add'>+	lock_sock((*sock)-&gt;sk);</div><div class='add'>+	restore_callbacks((*sock)-&gt;sk);</div><div class='add'>+	release_sock((*sock)-&gt;sk);</div><div class='add'>+</div><div class='add'>+	sock_release(*sock);</div><div class='add'>+	*sock = NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void allow_connection_io(struct connection *con)</div><div class='add'>+{</div><div class='add'>+	if (con-&gt;othercon)</div><div class='add'>+		clear_bit(CF_IO_STOP, &amp;con-&gt;othercon-&gt;flags);</div><div class='add'>+	clear_bit(CF_IO_STOP, &amp;con-&gt;flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void stop_connection_io(struct connection *con)</div><div class='add'>+{</div><div class='add'>+	if (con-&gt;othercon)</div><div class='add'>+		stop_connection_io(con-&gt;othercon);</div><div class='add'>+</div><div class='add'>+	spin_lock_bh(&amp;con-&gt;writequeue_lock);</div><div class='add'>+	set_bit(CF_IO_STOP, &amp;con-&gt;flags);</div><div class='add'>+	spin_unlock_bh(&amp;con-&gt;writequeue_lock);</div><div class='add'>+</div><div class='add'>+	down_write(&amp;con-&gt;sock_lock);</div><div class='add'>+	if (con-&gt;sock) {</div><div class='add'>+		lock_sock(con-&gt;sock-&gt;sk);</div><div class='add'>+		restore_callbacks(con-&gt;sock-&gt;sk);</div><div class='add'>+		release_sock(con-&gt;sock-&gt;sk);</div><div class='ctx'> 	}</div><div class='add'>+	up_write(&amp;con-&gt;sock_lock);</div><div class='add'>+</div><div class='add'>+	cancel_work_sync(&amp;con-&gt;swork);</div><div class='add'>+	cancel_work_sync(&amp;con-&gt;rwork);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Close a remote connection and tidy up */</div><div class='del'>-static void close_connection(struct connection *con, bool and_other,</div><div class='del'>-			     bool tx, bool rx)</div><div class='add'>+static void close_connection(struct connection *con, bool and_other)</div><div class='ctx'> {</div><div class='del'>-	bool closing = test_and_set_bit(CF_CLOSING, &amp;con-&gt;flags);</div><div class='ctx'> 	struct writequeue_entry *e;</div><div class='ctx'> </div><div class='del'>-	if (tx &amp;&amp; !closing &amp;&amp; cancel_work_sync(&amp;con-&gt;swork)) {</div><div class='del'>-		log_print("canceled swork for node %d", con-&gt;nodeid);</div><div class='del'>-		clear_bit(CF_WRITE_PENDING, &amp;con-&gt;flags);</div><div class='del'>-	}</div><div class='del'>-	if (rx &amp;&amp; !closing &amp;&amp; cancel_work_sync(&amp;con-&gt;rwork)) {</div><div class='del'>-		log_print("canceled rwork for node %d", con-&gt;nodeid);</div><div class='del'>-		clear_bit(CF_READ_PENDING, &amp;con-&gt;flags);</div><div class='add'>+	if (con-&gt;othercon &amp;&amp; and_other)</div><div class='add'>+		close_connection(con-&gt;othercon, false);</div><div class='add'>+</div><div class='add'>+	down_write(&amp;con-&gt;sock_lock);</div><div class='add'>+	if (!con-&gt;sock) {</div><div class='add'>+		up_write(&amp;con-&gt;sock_lock);</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;con-&gt;sock_mutex);</div><div class='ctx'> 	dlm_close_sock(&amp;con-&gt;sock);</div><div class='ctx'> </div><div class='del'>-	if (con-&gt;othercon &amp;&amp; and_other) {</div><div class='del'>-		/* Will only re-enter once. */</div><div class='del'>-		close_connection(con-&gt;othercon, false, tx, rx);</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	/* if we send a writequeue entry only a half way, we drop the</div><div class='ctx'> 	 * whole entry because reconnection and that we not start of the</div><div class='ctx'> 	 * middle of a msg which will confuse the other end.</div><div class='hunk'>@@ -807,49 +779,46 @@ static void close_connection(struct connection *con, bool and_other,</div><div class='ctx'> 	 * our policy is to start on a clean state when disconnects, we don't</div><div class='ctx'> 	 * know what's send/received on transport layer in this case.</div><div class='ctx'> 	 */</div><div class='del'>-	spin_lock(&amp;con-&gt;writequeue_lock);</div><div class='add'>+	spin_lock_bh(&amp;con-&gt;writequeue_lock);</div><div class='ctx'> 	if (!list_empty(&amp;con-&gt;writequeue)) {</div><div class='ctx'> 		e = list_first_entry(&amp;con-&gt;writequeue, struct writequeue_entry,</div><div class='ctx'> 				     list);</div><div class='ctx'> 		if (e-&gt;dirty)</div><div class='ctx'> 			free_entry(e);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;con-&gt;writequeue_lock);</div><div class='add'>+	spin_unlock_bh(&amp;con-&gt;writequeue_lock);</div><div class='ctx'> </div><div class='ctx'> 	con-&gt;rx_leftover = 0;</div><div class='ctx'> 	con-&gt;retries = 0;</div><div class='ctx'> 	clear_bit(CF_APP_LIMITED, &amp;con-&gt;flags);</div><div class='del'>-	clear_bit(CF_CONNECTED, &amp;con-&gt;flags);</div><div class='del'>-	clear_bit(CF_DELAY_CONNECT, &amp;con-&gt;flags);</div><div class='del'>-	clear_bit(CF_RECONNECT, &amp;con-&gt;flags);</div><div class='del'>-	clear_bit(CF_EOF, &amp;con-&gt;flags);</div><div class='del'>-	mutex_unlock(&amp;con-&gt;sock_mutex);</div><div class='del'>-	clear_bit(CF_CLOSING, &amp;con-&gt;flags);</div><div class='add'>+	clear_bit(CF_RECV_PENDING, &amp;con-&gt;flags);</div><div class='add'>+	clear_bit(CF_SEND_PENDING, &amp;con-&gt;flags);</div><div class='add'>+	up_write(&amp;con-&gt;sock_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void shutdown_connection(struct connection *con)</div><div class='add'>+static void shutdown_connection(struct connection *con, bool and_other)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	flush_work(&amp;con-&gt;swork);</div><div class='add'>+	if (con-&gt;othercon &amp;&amp; and_other)</div><div class='add'>+		shutdown_connection(con-&gt;othercon, false);</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;con-&gt;sock_mutex);</div><div class='add'>+	flush_workqueue(io_workqueue);</div><div class='add'>+	down_read(&amp;con-&gt;sock_lock);</div><div class='ctx'> 	/* nothing to shutdown */</div><div class='ctx'> 	if (!con-&gt;sock) {</div><div class='del'>-		mutex_unlock(&amp;con-&gt;sock_mutex);</div><div class='add'>+		up_read(&amp;con-&gt;sock_lock);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	set_bit(CF_SHUTDOWN, &amp;con-&gt;flags);</div><div class='del'>-	ret = kernel_sock_shutdown(con-&gt;sock, SHUT_WR);</div><div class='del'>-	mutex_unlock(&amp;con-&gt;sock_mutex);</div><div class='add'>+	ret = kernel_sock_shutdown(con-&gt;sock, dlm_proto_ops-&gt;how);</div><div class='add'>+	up_read(&amp;con-&gt;sock_lock);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		log_print("Connection %p failed to shutdown: %d will force close",</div><div class='ctx'> 			  con, ret);</div><div class='ctx'> 		goto force_close;</div><div class='ctx'> 	} else {</div><div class='del'>-		ret = wait_event_timeout(con-&gt;shutdown_wait,</div><div class='del'>-					 !test_bit(CF_SHUTDOWN, &amp;con-&gt;flags),</div><div class='add'>+		ret = wait_event_timeout(con-&gt;shutdown_wait, !con-&gt;sock,</div><div class='ctx'> 					 DLM_SHUTDOWN_WAIT_TIMEOUT);</div><div class='ctx'> 		if (ret == 0) {</div><div class='ctx'> 			log_print("Connection %p shutdown timed out, will force close",</div><div class='hunk'>@@ -861,145 +830,167 @@ static void shutdown_connection(struct connection *con)</div><div class='ctx'> 	return;</div><div class='ctx'> </div><div class='ctx'> force_close:</div><div class='del'>-	clear_bit(CF_SHUTDOWN, &amp;con-&gt;flags);</div><div class='del'>-	close_connection(con, false, true, true);</div><div class='add'>+	close_connection(con, false);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void dlm_tcp_shutdown(struct connection *con)</div><div class='add'>+static struct processqueue_entry *new_processqueue_entry(int nodeid,</div><div class='add'>+							 int buflen)</div><div class='ctx'> {</div><div class='del'>-	if (con-&gt;othercon)</div><div class='del'>-		shutdown_connection(con-&gt;othercon);</div><div class='del'>-	shutdown_connection(con);</div><div class='add'>+	struct processqueue_entry *pentry;</div><div class='add'>+</div><div class='add'>+	pentry = kmalloc(sizeof(*pentry), GFP_NOFS);</div><div class='add'>+	if (!pentry)</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	pentry-&gt;buf = kmalloc(buflen, GFP_NOFS);</div><div class='add'>+	if (!pentry-&gt;buf) {</div><div class='add'>+		kfree(pentry);</div><div class='add'>+		return NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	pentry-&gt;nodeid = nodeid;</div><div class='add'>+	return pentry;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int con_realloc_receive_buf(struct connection *con, int newlen)</div><div class='add'>+static void free_processqueue_entry(struct processqueue_entry *pentry)</div><div class='ctx'> {</div><div class='del'>-	unsigned char *newbuf;</div><div class='add'>+	kfree(pentry-&gt;buf);</div><div class='add'>+	kfree(pentry);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	newbuf = kmalloc(newlen, GFP_NOFS);</div><div class='del'>-	if (!newbuf)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+static void process_dlm_messages(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct processqueue_entry *pentry;</div><div class='add'>+</div><div class='add'>+	spin_lock_bh(&amp;processqueue_lock);</div><div class='add'>+	pentry = list_first_entry_or_null(&amp;processqueue,</div><div class='add'>+					  struct processqueue_entry, list);</div><div class='add'>+	if (WARN_ON_ONCE(!pentry)) {</div><div class='add'>+		process_dlm_messages_pending = false;</div><div class='add'>+		spin_unlock_bh(&amp;processqueue_lock);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	/* copy any leftover from last receive */</div><div class='del'>-	if (con-&gt;rx_leftover)</div><div class='del'>-		memmove(newbuf, con-&gt;rx_buf, con-&gt;rx_leftover);</div><div class='add'>+	list_del(&amp;pentry-&gt;list);</div><div class='add'>+	if (atomic_dec_and_test(&amp;processqueue_count))</div><div class='add'>+		wake_up(&amp;processqueue_wq);</div><div class='add'>+	spin_unlock_bh(&amp;processqueue_lock);</div><div class='ctx'> </div><div class='del'>-	/* swap to new buffer space */</div><div class='del'>-	kfree(con-&gt;rx_buf);</div><div class='del'>-	con-&gt;rx_buflen = newlen;</div><div class='del'>-	con-&gt;rx_buf = newbuf;</div><div class='add'>+	for (;;) {</div><div class='add'>+		dlm_process_incoming_buffer(pentry-&gt;nodeid, pentry-&gt;buf,</div><div class='add'>+					    pentry-&gt;buflen);</div><div class='add'>+		free_processqueue_entry(pentry);</div><div class='add'>+</div><div class='add'>+		spin_lock_bh(&amp;processqueue_lock);</div><div class='add'>+		pentry = list_first_entry_or_null(&amp;processqueue,</div><div class='add'>+						  struct processqueue_entry, list);</div><div class='add'>+		if (!pentry) {</div><div class='add'>+			process_dlm_messages_pending = false;</div><div class='add'>+			spin_unlock_bh(&amp;processqueue_lock);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+		list_del(&amp;pentry-&gt;list);</div><div class='add'>+		if (atomic_dec_and_test(&amp;processqueue_count))</div><div class='add'>+			wake_up(&amp;processqueue_wq);</div><div class='add'>+		spin_unlock_bh(&amp;processqueue_lock);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Data received from remote end */</div><div class='del'>-static int receive_from_sock(struct connection *con)</div><div class='add'>+static int receive_from_sock(struct connection *con, int buflen)</div><div class='ctx'> {</div><div class='add'>+	struct processqueue_entry *pentry;</div><div class='add'>+	int ret, buflen_real;</div><div class='ctx'> 	struct msghdr msg;</div><div class='ctx'> 	struct kvec iov;</div><div class='del'>-	int ret, buflen;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;con-&gt;sock_mutex);</div><div class='add'>+	pentry = new_processqueue_entry(con-&gt;nodeid, buflen);</div><div class='add'>+	if (!pentry)</div><div class='add'>+		return DLM_IO_RESCHED;</div><div class='ctx'> </div><div class='del'>-	if (con-&gt;sock == NULL) {</div><div class='del'>-		ret = -EAGAIN;</div><div class='del'>-		goto out_close;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* realloc if we get new buffer size to read out */</div><div class='del'>-	buflen = dlm_config.ci_buffer_size;</div><div class='del'>-	if (con-&gt;rx_buflen != buflen &amp;&amp; con-&gt;rx_leftover &lt;= buflen) {</div><div class='del'>-		ret = con_realloc_receive_buf(con, buflen);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			goto out_resched;</div><div class='del'>-	}</div><div class='add'>+	memcpy(pentry-&gt;buf, con-&gt;rx_leftover_buf, con-&gt;rx_leftover);</div><div class='ctx'> </div><div class='del'>-	for (;;) {</div><div class='del'>-		/* calculate new buffer parameter regarding last receive and</div><div class='del'>-		 * possible leftover bytes</div><div class='del'>-		 */</div><div class='del'>-		iov.iov_base = con-&gt;rx_buf + con-&gt;rx_leftover;</div><div class='del'>-		iov.iov_len = con-&gt;rx_buflen - con-&gt;rx_leftover;</div><div class='del'>-</div><div class='del'>-		memset(&amp;msg, 0, sizeof(msg));</div><div class='del'>-		msg.msg_flags = MSG_DONTWAIT | MSG_NOSIGNAL;</div><div class='del'>-		ret = kernel_recvmsg(con-&gt;sock, &amp;msg, &amp;iov, 1, iov.iov_len,</div><div class='del'>-				     msg.msg_flags);</div><div class='del'>-		if (ret == -EAGAIN)</div><div class='del'>-			break;</div><div class='del'>-		else if (ret &lt;= 0)</div><div class='del'>-			goto out_close;</div><div class='del'>-</div><div class='del'>-		/* new buflen according readed bytes and leftover from last receive */</div><div class='del'>-		buflen = ret + con-&gt;rx_leftover;</div><div class='del'>-		ret = dlm_process_incoming_buffer(con-&gt;nodeid, con-&gt;rx_buf, buflen);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			goto out_close;</div><div class='del'>-</div><div class='del'>-		/* calculate leftover bytes from process and put it into begin of</div><div class='del'>-		 * the receive buffer, so next receive we have the full message</div><div class='del'>-		 * at the start address of the receive buffer.</div><div class='del'>-		 */</div><div class='del'>-		con-&gt;rx_leftover = buflen - ret;</div><div class='del'>-		if (con-&gt;rx_leftover) {</div><div class='del'>-			memmove(con-&gt;rx_buf, con-&gt;rx_buf + ret,</div><div class='del'>-				con-&gt;rx_leftover);</div><div class='add'>+	/* calculate new buffer parameter regarding last receive and</div><div class='add'>+	 * possible leftover bytes</div><div class='add'>+	 */</div><div class='add'>+	iov.iov_base = pentry-&gt;buf + con-&gt;rx_leftover;</div><div class='add'>+	iov.iov_len = buflen - con-&gt;rx_leftover;</div><div class='add'>+</div><div class='add'>+	memset(&amp;msg, 0, sizeof(msg));</div><div class='add'>+	msg.msg_flags = MSG_DONTWAIT | MSG_NOSIGNAL;</div><div class='add'>+	clear_bit(CF_RECV_INTR, &amp;con-&gt;flags);</div><div class='add'>+again:</div><div class='add'>+	ret = kernel_recvmsg(con-&gt;sock, &amp;msg, &amp;iov, 1, iov.iov_len,</div><div class='add'>+			     msg.msg_flags);</div><div class='add'>+	trace_dlm_recv(con-&gt;nodeid, ret);</div><div class='add'>+	if (ret == -EAGAIN) {</div><div class='add'>+		lock_sock(con-&gt;sock-&gt;sk);</div><div class='add'>+		if (test_and_clear_bit(CF_RECV_INTR, &amp;con-&gt;flags)) {</div><div class='add'>+			release_sock(con-&gt;sock-&gt;sk);</div><div class='add'>+			goto again;</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='add'>+		clear_bit(CF_RECV_PENDING, &amp;con-&gt;flags);</div><div class='add'>+		release_sock(con-&gt;sock-&gt;sk);</div><div class='add'>+		free_processqueue_entry(pentry);</div><div class='add'>+		return DLM_IO_END;</div><div class='add'>+	} else if (ret == 0) {</div><div class='add'>+		/* close will clear CF_RECV_PENDING */</div><div class='add'>+		free_processqueue_entry(pentry);</div><div class='add'>+		return DLM_IO_EOF;</div><div class='add'>+	} else if (ret &lt; 0) {</div><div class='add'>+		free_processqueue_entry(pentry);</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dlm_midcomms_receive_done(con-&gt;nodeid);</div><div class='del'>-	mutex_unlock(&amp;con-&gt;sock_mutex);</div><div class='del'>-	return 0;</div><div class='add'>+	/* new buflen according readed bytes and leftover from last receive */</div><div class='add'>+	buflen_real = ret + con-&gt;rx_leftover;</div><div class='add'>+	ret = dlm_validate_incoming_buffer(con-&gt;nodeid, pentry-&gt;buf,</div><div class='add'>+					   buflen_real);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		free_processqueue_entry(pentry);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-out_resched:</div><div class='del'>-	if (!test_and_set_bit(CF_READ_PENDING, &amp;con-&gt;flags))</div><div class='del'>-		queue_work(recv_workqueue, &amp;con-&gt;rwork);</div><div class='del'>-	mutex_unlock(&amp;con-&gt;sock_mutex);</div><div class='del'>-	return -EAGAIN;</div><div class='del'>-</div><div class='del'>-out_close:</div><div class='del'>-	if (ret == 0) {</div><div class='del'>-		log_print("connection %p got EOF from %d",</div><div class='del'>-			  con, con-&gt;nodeid);</div><div class='del'>-</div><div class='del'>-		if (dlm_proto_ops-&gt;eof_condition &amp;&amp;</div><div class='del'>-		    dlm_proto_ops-&gt;eof_condition(con)) {</div><div class='del'>-			set_bit(CF_EOF, &amp;con-&gt;flags);</div><div class='del'>-			mutex_unlock(&amp;con-&gt;sock_mutex);</div><div class='del'>-		} else {</div><div class='del'>-			mutex_unlock(&amp;con-&gt;sock_mutex);</div><div class='del'>-			close_connection(con, false, true, false);</div><div class='add'>+	pentry-&gt;buflen = ret;</div><div class='ctx'> </div><div class='del'>-			/* handling for tcp shutdown */</div><div class='del'>-			clear_bit(CF_SHUTDOWN, &amp;con-&gt;flags);</div><div class='del'>-			wake_up(&amp;con-&gt;shutdown_wait);</div><div class='del'>-		}</div><div class='add'>+	/* calculate leftover bytes from process and put it into begin of</div><div class='add'>+	 * the receive buffer, so next receive we have the full message</div><div class='add'>+	 * at the start address of the receive buffer.</div><div class='add'>+	 */</div><div class='add'>+	con-&gt;rx_leftover = buflen_real - ret;</div><div class='add'>+	memmove(con-&gt;rx_leftover_buf, pentry-&gt;buf + ret,</div><div class='add'>+		con-&gt;rx_leftover);</div><div class='ctx'> </div><div class='del'>-		/* signal to breaking receive worker */</div><div class='del'>-		ret = -1;</div><div class='del'>-	} else {</div><div class='del'>-		mutex_unlock(&amp;con-&gt;sock_mutex);</div><div class='add'>+	spin_lock_bh(&amp;processqueue_lock);</div><div class='add'>+	ret = atomic_inc_return(&amp;processqueue_count);</div><div class='add'>+	list_add_tail(&amp;pentry-&gt;list, &amp;processqueue);</div><div class='add'>+	if (!process_dlm_messages_pending) {</div><div class='add'>+		process_dlm_messages_pending = true;</div><div class='add'>+		queue_work(process_workqueue, &amp;process_work);</div><div class='ctx'> 	}</div><div class='del'>-	return ret;</div><div class='add'>+	spin_unlock_bh(&amp;processqueue_lock);</div><div class='add'>+</div><div class='add'>+	if (ret &gt; DLM_MAX_PROCESS_BUFFERS)</div><div class='add'>+		return DLM_IO_FLUSH;</div><div class='add'>+</div><div class='add'>+	return DLM_IO_SUCCESS;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Listening socket is busy, accept a connection */</div><div class='del'>-static int accept_from_sock(struct listen_connection *con)</div><div class='add'>+static int accept_from_sock(void)</div><div class='ctx'> {</div><div class='del'>-	int result;</div><div class='ctx'> 	struct sockaddr_storage peeraddr;</div><div class='del'>-	struct socket *newsock;</div><div class='del'>-	int len, idx;</div><div class='del'>-	int nodeid;</div><div class='add'>+	int len, idx, result, nodeid;</div><div class='ctx'> 	struct connection *newcon;</div><div class='del'>-	struct connection *addcon;</div><div class='add'>+	struct socket *newsock;</div><div class='ctx'> 	unsigned int mark;</div><div class='ctx'> </div><div class='del'>-	if (!con-&gt;sock)</div><div class='del'>-		return -ENOTCONN;</div><div class='del'>-</div><div class='del'>-	result = kernel_accept(con-&gt;sock, &amp;newsock, O_NONBLOCK);</div><div class='del'>-	if (result &lt; 0)</div><div class='add'>+	result = kernel_accept(listen_con.sock, &amp;newsock, O_NONBLOCK);</div><div class='add'>+	if (result == -EAGAIN)</div><div class='add'>+		return DLM_IO_END;</div><div class='add'>+	else if (result &lt; 0)</div><div class='ctx'> 		goto accept_err;</div><div class='ctx'> </div><div class='ctx'> 	/* Get the connected socket's peer */</div><div class='hunk'>@@ -1013,10 +1004,28 @@ static int accept_from_sock(struct listen_connection *con)</div><div class='ctx'> 	/* Get the new node's NODEID */</div><div class='ctx'> 	make_sockaddr(&amp;peeraddr, 0, &amp;len);</div><div class='ctx'> 	if (addr_to_nodeid(&amp;peeraddr, &amp;nodeid, &amp;mark)) {</div><div class='del'>-		unsigned char *b=(unsigned char *)&amp;peeraddr;</div><div class='del'>-		log_print("connect from non cluster node");</div><div class='del'>-		print_hex_dump_bytes("ss: ", DUMP_PREFIX_NONE, </div><div class='del'>-				     b, sizeof(struct sockaddr_storage));</div><div class='add'>+		switch (peeraddr.ss_family) {</div><div class='add'>+		case AF_INET: {</div><div class='add'>+			struct sockaddr_in *sin = (struct sockaddr_in *)&amp;peeraddr;</div><div class='add'>+</div><div class='add'>+			log_print("connect from non cluster IPv4 node %pI4",</div><div class='add'>+				  &amp;sin-&gt;sin_addr);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+#if IS_ENABLED(CONFIG_IPV6)</div><div class='add'>+		case AF_INET6: {</div><div class='add'>+			struct sockaddr_in6 *sin6 = (struct sockaddr_in6 *)&amp;peeraddr;</div><div class='add'>+</div><div class='add'>+			log_print("connect from non cluster IPv6 node %pI6c",</div><div class='add'>+				  &amp;sin6-&gt;sin6_addr);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+#endif</div><div class='add'>+		default:</div><div class='add'>+			log_print("invalid family from non cluster node");</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		sock_release(newsock);</div><div class='ctx'> 		return -1;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1029,16 +1038,16 @@ static int accept_from_sock(struct listen_connection *con)</div><div class='ctx'> 	 *  In this case we store the incoming one in "othercon"</div><div class='ctx'> 	 */</div><div class='ctx'> 	idx = srcu_read_lock(&amp;connections_srcu);</div><div class='del'>-	newcon = nodeid2con(nodeid, GFP_NOFS);</div><div class='del'>-	if (!newcon) {</div><div class='add'>+	newcon = nodeid2con(nodeid, 0);</div><div class='add'>+	if (WARN_ON_ONCE(!newcon)) {</div><div class='ctx'> 		srcu_read_unlock(&amp;connections_srcu, idx);</div><div class='del'>-		result = -ENOMEM;</div><div class='add'>+		result = -ENOENT;</div><div class='ctx'> 		goto accept_err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	sock_set_mark(newsock-&gt;sk, mark);</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;newcon-&gt;sock_mutex);</div><div class='add'>+	down_write(&amp;newcon-&gt;sock_lock);</div><div class='ctx'> 	if (newcon-&gt;sock) {</div><div class='ctx'> 		struct connection *othercon = newcon-&gt;othercon;</div><div class='ctx'> </div><div class='hunk'>@@ -1046,63 +1055,50 @@ static int accept_from_sock(struct listen_connection *con)</div><div class='ctx'> 			othercon = kzalloc(sizeof(*othercon), GFP_NOFS);</div><div class='ctx'> 			if (!othercon) {</div><div class='ctx'> 				log_print("failed to allocate incoming socket");</div><div class='del'>-				mutex_unlock(&amp;newcon-&gt;sock_mutex);</div><div class='add'>+				up_write(&amp;newcon-&gt;sock_lock);</div><div class='ctx'> 				srcu_read_unlock(&amp;connections_srcu, idx);</div><div class='ctx'> 				result = -ENOMEM;</div><div class='ctx'> 				goto accept_err;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			result = dlm_con_init(othercon, nodeid);</div><div class='del'>-			if (result &lt; 0) {</div><div class='del'>-				kfree(othercon);</div><div class='del'>-				mutex_unlock(&amp;newcon-&gt;sock_mutex);</div><div class='del'>-				srcu_read_unlock(&amp;connections_srcu, idx);</div><div class='del'>-				goto accept_err;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			lockdep_set_subclass(&amp;othercon-&gt;sock_mutex, 1);</div><div class='del'>-			set_bit(CF_IS_OTHERCON, &amp;othercon-&gt;flags);</div><div class='add'>+			dlm_con_init(othercon, nodeid);</div><div class='add'>+			lockdep_set_subclass(&amp;othercon-&gt;sock_lock, 1);</div><div class='ctx'> 			newcon-&gt;othercon = othercon;</div><div class='del'>-			othercon-&gt;sendcon = newcon;</div><div class='add'>+			set_bit(CF_IS_OTHERCON, &amp;othercon-&gt;flags);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			/* close other sock con if we have something new */</div><div class='del'>-			close_connection(othercon, false, true, false);</div><div class='add'>+			close_connection(othercon, false);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		mutex_lock(&amp;othercon-&gt;sock_mutex);</div><div class='add'>+		down_write(&amp;othercon-&gt;sock_lock);</div><div class='ctx'> 		add_sock(newsock, othercon);</div><div class='del'>-		addcon = othercon;</div><div class='del'>-		mutex_unlock(&amp;othercon-&gt;sock_mutex);</div><div class='add'>+</div><div class='add'>+		/* check if we receved something while adding */</div><div class='add'>+		lock_sock(othercon-&gt;sock-&gt;sk);</div><div class='add'>+		lowcomms_queue_rwork(othercon);</div><div class='add'>+		release_sock(othercon-&gt;sock-&gt;sk);</div><div class='add'>+		up_write(&amp;othercon-&gt;sock_lock);</div><div class='ctx'> 	}</div><div class='ctx'> 	else {</div><div class='ctx'> 		/* accept copies the sk after we've saved the callbacks, so we</div><div class='ctx'> 		   don't want to save them a second time or comm errors will</div><div class='ctx'> 		   result in calling sk_error_report recursively. */</div><div class='ctx'> 		add_sock(newsock, newcon);</div><div class='del'>-		addcon = newcon;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	set_bit(CF_CONNECTED, &amp;addcon-&gt;flags);</div><div class='del'>-	mutex_unlock(&amp;newcon-&gt;sock_mutex);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Add it to the active queue in case we got data</div><div class='del'>-	 * between processing the accept adding the socket</div><div class='del'>-	 * to the read_sockets list</div><div class='del'>-	 */</div><div class='del'>-	if (!test_and_set_bit(CF_READ_PENDING, &amp;addcon-&gt;flags))</div><div class='del'>-		queue_work(recv_workqueue, &amp;addcon-&gt;rwork);</div><div class='ctx'> </div><div class='add'>+		/* check if we receved something while adding */</div><div class='add'>+		lock_sock(newcon-&gt;sock-&gt;sk);</div><div class='add'>+		lowcomms_queue_rwork(newcon);</div><div class='add'>+		release_sock(newcon-&gt;sock-&gt;sk);</div><div class='add'>+	}</div><div class='add'>+	up_write(&amp;newcon-&gt;sock_lock);</div><div class='ctx'> 	srcu_read_unlock(&amp;connections_srcu, idx);</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+	return DLM_IO_SUCCESS;</div><div class='ctx'> </div><div class='ctx'> accept_err:</div><div class='ctx'> 	if (newsock)</div><div class='ctx'> 		sock_release(newsock);</div><div class='ctx'> </div><div class='del'>-	if (result != -EAGAIN)</div><div class='del'>-		log_print("error accepting connection from node: %d", result);</div><div class='ctx'> 	return result;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1127,14 +1123,14 @@ static void writequeue_entry_complete(struct writequeue_entry *e, int completed)</div><div class='ctx'> /*</div><div class='ctx'>  * sctp_bind_addrs - bind a SCTP socket to all our addresses</div><div class='ctx'>  */</div><div class='del'>-static int sctp_bind_addrs(struct socket *sock, uint16_t port)</div><div class='add'>+static int sctp_bind_addrs(struct socket *sock, __be16 port)</div><div class='ctx'> {</div><div class='ctx'> 	struct sockaddr_storage localaddr;</div><div class='del'>-	struct sockaddr *addr = (struct sockaddr *)&amp;localaddr;</div><div class='add'>+	struct sockaddr_unsized *addr = (struct sockaddr_unsized *)&amp;localaddr;</div><div class='ctx'> 	int i, addr_len, result = 0;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; dlm_local_count; i++) {</div><div class='del'>-		memcpy(&amp;localaddr, dlm_local_addr[i], sizeof(localaddr));</div><div class='add'>+		memcpy(&amp;localaddr, &amp;dlm_local_addr[i], sizeof(localaddr));</div><div class='ctx'> 		make_sockaddr(&amp;localaddr, port, &amp;addr_len);</div><div class='ctx'> </div><div class='ctx'> 		if (!i)</div><div class='hunk'>@@ -1154,7 +1150,7 @@ static int sctp_bind_addrs(struct socket *sock, uint16_t port)</div><div class='ctx'> /* Get local addresses */</div><div class='ctx'> static void init_local(void)</div><div class='ctx'> {</div><div class='del'>-	struct sockaddr_storage sas, *addr;</div><div class='add'>+	struct sockaddr_storage sas;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='ctx'> 	dlm_local_count = 0;</div><div class='hunk'>@@ -1162,52 +1158,41 @@ static void init_local(void)</div><div class='ctx'> 		if (dlm_our_addr(&amp;sas, i))</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		addr = kmemdup(&amp;sas, sizeof(*addr), GFP_NOFS);</div><div class='del'>-		if (!addr)</div><div class='del'>-			break;</div><div class='del'>-		dlm_local_addr[dlm_local_count++] = addr;</div><div class='add'>+		memcpy(&amp;dlm_local_addr[dlm_local_count++], &amp;sas, sizeof(sas));</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void deinit_local(void)</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; dlm_local_count; i++)</div><div class='del'>-		kfree(dlm_local_addr[i]);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct writequeue_entry *new_writequeue_entry(struct connection *con,</div><div class='del'>-						     gfp_t allocation)</div><div class='add'>+static struct writequeue_entry *new_writequeue_entry(struct connection *con)</div><div class='ctx'> {</div><div class='ctx'> 	struct writequeue_entry *entry;</div><div class='ctx'> </div><div class='del'>-	entry = kzalloc(sizeof(*entry), allocation);</div><div class='add'>+	entry = dlm_allocate_writequeue();</div><div class='ctx'> 	if (!entry)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='del'>-	entry-&gt;page = alloc_page(allocation | __GFP_ZERO);</div><div class='add'>+	entry-&gt;page = alloc_page(GFP_ATOMIC | __GFP_ZERO);</div><div class='ctx'> 	if (!entry-&gt;page) {</div><div class='del'>-		kfree(entry);</div><div class='add'>+		dlm_free_writequeue(entry);</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	entry-&gt;offset = 0;</div><div class='add'>+	entry-&gt;len = 0;</div><div class='add'>+	entry-&gt;end = 0;</div><div class='add'>+	entry-&gt;dirty = false;</div><div class='ctx'> 	entry-&gt;con = con;</div><div class='ctx'> 	entry-&gt;users = 1;</div><div class='ctx'> 	kref_init(&amp;entry-&gt;ref);</div><div class='del'>-	INIT_LIST_HEAD(&amp;entry-&gt;msgs);</div><div class='del'>-</div><div class='ctx'> 	return entry;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct writequeue_entry *new_wq_entry(struct connection *con, int len,</div><div class='del'>-					     gfp_t allocation, char **ppc,</div><div class='del'>-					     void (*cb)(struct dlm_mhandle *mh),</div><div class='del'>-					     struct dlm_mhandle *mh)</div><div class='add'>+					     char **ppc, void (*cb)(void *data),</div><div class='add'>+					     void *data)</div><div class='ctx'> {</div><div class='ctx'> 	struct writequeue_entry *e;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;con-&gt;writequeue_lock);</div><div class='add'>+	spin_lock_bh(&amp;con-&gt;writequeue_lock);</div><div class='ctx'> 	if (!list_empty(&amp;con-&gt;writequeue)) {</div><div class='ctx'> 		e = list_last_entry(&amp;con-&gt;writequeue, struct writequeue_entry, list);</div><div class='ctx'> 		if (DLM_WQ_REMAIN_BYTES(e) &gt;= len) {</div><div class='hunk'>@@ -1215,74 +1200,52 @@ static struct writequeue_entry *new_wq_entry(struct connection *con, int len,</div><div class='ctx'> </div><div class='ctx'> 			*ppc = page_address(e-&gt;page) + e-&gt;end;</div><div class='ctx'> 			if (cb)</div><div class='del'>-				cb(mh);</div><div class='add'>+				cb(data);</div><div class='ctx'> </div><div class='ctx'> 			e-&gt;end += len;</div><div class='ctx'> 			e-&gt;users++;</div><div class='del'>-			spin_unlock(&amp;con-&gt;writequeue_lock);</div><div class='del'>-</div><div class='del'>-			return e;</div><div class='add'>+			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;con-&gt;writequeue_lock);</div><div class='ctx'> </div><div class='del'>-	e = new_writequeue_entry(con, allocation);</div><div class='add'>+	e = new_writequeue_entry(con);</div><div class='ctx'> 	if (!e)</div><div class='del'>-		return NULL;</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='ctx'> 	kref_get(&amp;e-&gt;ref);</div><div class='ctx'> 	*ppc = page_address(e-&gt;page);</div><div class='ctx'> 	e-&gt;end += len;</div><div class='del'>-	atomic_inc(&amp;con-&gt;writequeue_cnt);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;con-&gt;writequeue_lock);</div><div class='ctx'> 	if (cb)</div><div class='del'>-		cb(mh);</div><div class='add'>+		cb(data);</div><div class='ctx'> </div><div class='ctx'> 	list_add_tail(&amp;e-&gt;list, &amp;con-&gt;writequeue);</div><div class='del'>-	spin_unlock(&amp;con-&gt;writequeue_lock);</div><div class='ctx'> </div><div class='add'>+out:</div><div class='add'>+	spin_unlock_bh(&amp;con-&gt;writequeue_lock);</div><div class='ctx'> 	return e;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static struct dlm_msg *dlm_lowcomms_new_msg_con(struct connection *con, int len,</div><div class='del'>-						gfp_t allocation, char **ppc,</div><div class='del'>-						void (*cb)(struct dlm_mhandle *mh),</div><div class='del'>-						struct dlm_mhandle *mh)</div><div class='add'>+						char **ppc, void (*cb)(void *data),</div><div class='add'>+						void *data)</div><div class='ctx'> {</div><div class='ctx'> 	struct writequeue_entry *e;</div><div class='ctx'> 	struct dlm_msg *msg;</div><div class='del'>-	bool sleepable;</div><div class='ctx'> </div><div class='del'>-	msg = kzalloc(sizeof(*msg), allocation);</div><div class='add'>+	msg = dlm_allocate_msg();</div><div class='ctx'> 	if (!msg)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='del'>-	/* this mutex is being used as a wait to avoid multiple "fast"</div><div class='del'>-	 * new writequeue page list entry allocs in new_wq_entry in</div><div class='del'>-	 * normal operation which is sleepable context. Without it</div><div class='del'>-	 * we could end in multiple writequeue entries with one</div><div class='del'>-	 * dlm message because multiple callers were waiting at</div><div class='del'>-	 * the writequeue_lock in new_wq_entry().</div><div class='del'>-	 */</div><div class='del'>-	sleepable = gfpflags_normal_context(allocation);</div><div class='del'>-	if (sleepable)</div><div class='del'>-		mutex_lock(&amp;con-&gt;wq_alloc);</div><div class='del'>-</div><div class='ctx'> 	kref_init(&amp;msg-&gt;ref);</div><div class='ctx'> </div><div class='del'>-	e = new_wq_entry(con, len, allocation, ppc, cb, mh);</div><div class='add'>+	e = new_wq_entry(con, len, ppc, cb, data);</div><div class='ctx'> 	if (!e) {</div><div class='del'>-		if (sleepable)</div><div class='del'>-			mutex_unlock(&amp;con-&gt;wq_alloc);</div><div class='del'>-</div><div class='del'>-		kfree(msg);</div><div class='add'>+		dlm_free_msg(msg);</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (sleepable)</div><div class='del'>-		mutex_unlock(&amp;con-&gt;wq_alloc);</div><div class='del'>-</div><div class='add'>+	msg-&gt;retransmit = false;</div><div class='add'>+	msg-&gt;orig_msg = NULL;</div><div class='ctx'> 	msg-&gt;ppc = *ppc;</div><div class='ctx'> 	msg-&gt;len = len;</div><div class='ctx'> 	msg-&gt;entry = e;</div><div class='hunk'>@@ -1290,9 +1253,12 @@ static struct dlm_msg *dlm_lowcomms_new_msg_con(struct connection *con, int len,</div><div class='ctx'> 	return msg;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct dlm_msg *dlm_lowcomms_new_msg(int nodeid, int len, gfp_t allocation,</div><div class='del'>-				     char **ppc, void (*cb)(struct dlm_mhandle *mh),</div><div class='del'>-				     struct dlm_mhandle *mh)</div><div class='add'>+/* avoid false positive for nodes_srcu, unlock happens in</div><div class='add'>+ * dlm_lowcomms_commit_msg which is a must call if success</div><div class='add'>+ */</div><div class='add'>+#ifndef __CHECKER__</div><div class='add'>+struct dlm_msg *dlm_lowcomms_new_msg(int nodeid, int len, char **ppc,</div><div class='add'>+				     void (*cb)(void *data), void *data)</div><div class='ctx'> {</div><div class='ctx'> 	struct connection *con;</div><div class='ctx'> 	struct dlm_msg *msg;</div><div class='hunk'>@@ -1302,27 +1268,30 @@ struct dlm_msg *dlm_lowcomms_new_msg(int nodeid, int len, gfp_t allocation,</div><div class='ctx'> 	    len &lt; sizeof(struct dlm_header)) {</div><div class='ctx'> 		BUILD_BUG_ON(PAGE_SIZE &lt; DLM_MAX_SOCKET_BUFSIZE);</div><div class='ctx'> 		log_print("failed to allocate a buffer of size %d", len);</div><div class='del'>-		WARN_ON(1);</div><div class='add'>+		WARN_ON_ONCE(1);</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	idx = srcu_read_lock(&amp;connections_srcu);</div><div class='del'>-	con = nodeid2con(nodeid, allocation);</div><div class='del'>-	if (!con) {</div><div class='add'>+	con = nodeid2con(nodeid, 0);</div><div class='add'>+	if (WARN_ON_ONCE(!con)) {</div><div class='ctx'> 		srcu_read_unlock(&amp;connections_srcu, idx);</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	msg = dlm_lowcomms_new_msg_con(con, len, allocation, ppc, cb, mh);</div><div class='add'>+	msg = dlm_lowcomms_new_msg_con(con, len, ppc, cb, data);</div><div class='ctx'> 	if (!msg) {</div><div class='ctx'> 		srcu_read_unlock(&amp;connections_srcu, idx);</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/* for dlm_lowcomms_commit_msg() */</div><div class='add'>+	kref_get(&amp;msg-&gt;ref);</div><div class='ctx'> 	/* we assume if successful commit must called */</div><div class='ctx'> 	msg-&gt;idx = idx;</div><div class='ctx'> 	return msg;</div><div class='ctx'> }</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='ctx'> static void _dlm_lowcomms_commit_msg(struct dlm_msg *msg)</div><div class='ctx'> {</div><div class='hunk'>@@ -1330,7 +1299,7 @@ static void _dlm_lowcomms_commit_msg(struct dlm_msg *msg)</div><div class='ctx'> 	struct connection *con = e-&gt;con;</div><div class='ctx'> 	int users;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;con-&gt;writequeue_lock);</div><div class='add'>+	spin_lock_bh(&amp;con-&gt;writequeue_lock);</div><div class='ctx'> 	kref_get(&amp;msg-&gt;ref);</div><div class='ctx'> 	list_add(&amp;msg-&gt;list, &amp;e-&gt;msgs);</div><div class='ctx'> </div><div class='hunk'>@@ -1339,28 +1308,33 @@ static void _dlm_lowcomms_commit_msg(struct dlm_msg *msg)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	e-&gt;len = DLM_WQ_LENGTH_BYTES(e);</div><div class='del'>-	spin_unlock(&amp;con-&gt;writequeue_lock);</div><div class='ctx'> </div><div class='del'>-	queue_work(send_workqueue, &amp;con-&gt;swork);</div><div class='del'>-	return;</div><div class='add'>+	lowcomms_queue_swork(con);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	spin_unlock(&amp;con-&gt;writequeue_lock);</div><div class='add'>+	spin_unlock_bh(&amp;con-&gt;writequeue_lock);</div><div class='ctx'> 	return;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/* avoid false positive for nodes_srcu, lock was happen in</div><div class='add'>+ * dlm_lowcomms_new_msg</div><div class='add'>+ */</div><div class='add'>+#ifndef __CHECKER__</div><div class='ctx'> void dlm_lowcomms_commit_msg(struct dlm_msg *msg)</div><div class='ctx'> {</div><div class='ctx'> 	_dlm_lowcomms_commit_msg(msg);</div><div class='ctx'> 	srcu_read_unlock(&amp;connections_srcu, msg-&gt;idx);</div><div class='add'>+	/* because dlm_lowcomms_new_msg() */</div><div class='add'>+	kref_put(&amp;msg-&gt;ref, dlm_msg_release);</div><div class='ctx'> }</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='ctx'> void dlm_lowcomms_put_msg(struct dlm_msg *msg)</div><div class='ctx'> {</div><div class='ctx'> 	kref_put(&amp;msg-&gt;ref, dlm_msg_release);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* does not held connections_srcu, usage workqueue only */</div><div class='add'>+/* does not held connections_srcu, usage lowcomms_error_report only */</div><div class='ctx'> int dlm_lowcomms_resend_msg(struct dlm_msg *msg)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_msg *msg_resend;</div><div class='hunk'>@@ -1369,8 +1343,8 @@ int dlm_lowcomms_resend_msg(struct dlm_msg *msg)</div><div class='ctx'> 	if (msg-&gt;retransmit)</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='del'>-	msg_resend = dlm_lowcomms_new_msg_con(msg-&gt;entry-&gt;con, msg-&gt;len,</div><div class='del'>-					      GFP_ATOMIC, &amp;ppc, NULL, NULL);</div><div class='add'>+	msg_resend = dlm_lowcomms_new_msg_con(msg-&gt;entry-&gt;con, msg-&gt;len, &amp;ppc,</div><div class='add'>+					      NULL, NULL);</div><div class='ctx'> 	if (!msg_resend)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='hunk'>@@ -1386,90 +1360,83 @@ int dlm_lowcomms_resend_msg(struct dlm_msg *msg)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Send a message */</div><div class='del'>-static void send_to_sock(struct connection *con)</div><div class='add'>+static int send_to_sock(struct connection *con)</div><div class='ctx'> {</div><div class='del'>-	const int msg_flags = MSG_DONTWAIT | MSG_NOSIGNAL;</div><div class='ctx'> 	struct writequeue_entry *e;</div><div class='add'>+	struct bio_vec bvec;</div><div class='add'>+	struct msghdr msg = {</div><div class='add'>+		.msg_flags = MSG_SPLICE_PAGES | MSG_DONTWAIT | MSG_NOSIGNAL,</div><div class='add'>+	};</div><div class='ctx'> 	int len, offset, ret;</div><div class='del'>-	int count = 0;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;con-&gt;sock_mutex);</div><div class='del'>-	if (con-&gt;sock == NULL)</div><div class='del'>-		goto out_connect;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;con-&gt;writequeue_lock);</div><div class='del'>-	for (;;) {</div><div class='del'>-		e = con_next_wq(con);</div><div class='del'>-		if (!e)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		e = list_first_entry(&amp;con-&gt;writequeue, struct writequeue_entry, list);</div><div class='del'>-		len = e-&gt;len;</div><div class='del'>-		offset = e-&gt;offset;</div><div class='del'>-		BUG_ON(len == 0 &amp;&amp; e-&gt;users == 0);</div><div class='del'>-		spin_unlock(&amp;con-&gt;writequeue_lock);</div><div class='del'>-</div><div class='del'>-		ret = kernel_sendpage(con-&gt;sock, e-&gt;page, offset, len,</div><div class='del'>-				      msg_flags);</div><div class='del'>-		if (ret == -EAGAIN || ret == 0) {</div><div class='del'>-			if (ret == -EAGAIN &amp;&amp;</div><div class='del'>-			    test_bit(SOCKWQ_ASYNC_NOSPACE, &amp;con-&gt;sock-&gt;flags) &amp;&amp;</div><div class='del'>-			    !test_and_set_bit(CF_APP_LIMITED, &amp;con-&gt;flags)) {</div><div class='del'>-				/* Notify TCP that we're limited by the</div><div class='del'>-				 * application window size.</div><div class='del'>-				 */</div><div class='del'>-				set_bit(SOCK_NOSPACE, &amp;con-&gt;sock-&gt;flags);</div><div class='del'>-				con-&gt;sock-&gt;sk-&gt;sk_write_pending++;</div><div class='del'>-			}</div><div class='del'>-			cond_resched();</div><div class='del'>-			goto out;</div><div class='del'>-		} else if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='del'>-</div><div class='del'>-		/* Don't starve people filling buffers */</div><div class='del'>-		if (++count &gt;= MAX_SEND_MSG_COUNT) {</div><div class='del'>-			cond_resched();</div><div class='del'>-			count = 0;</div><div class='add'>+	spin_lock_bh(&amp;con-&gt;writequeue_lock);</div><div class='add'>+	e = con_next_wq(con);</div><div class='add'>+	if (!e) {</div><div class='add'>+		clear_bit(CF_SEND_PENDING, &amp;con-&gt;flags);</div><div class='add'>+		spin_unlock_bh(&amp;con-&gt;writequeue_lock);</div><div class='add'>+		return DLM_IO_END;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	len = e-&gt;len;</div><div class='add'>+	offset = e-&gt;offset;</div><div class='add'>+	WARN_ON_ONCE(len == 0 &amp;&amp; e-&gt;users == 0);</div><div class='add'>+	spin_unlock_bh(&amp;con-&gt;writequeue_lock);</div><div class='add'>+</div><div class='add'>+	bvec_set_page(&amp;bvec, e-&gt;page, len, offset);</div><div class='add'>+	iov_iter_bvec(&amp;msg.msg_iter, ITER_SOURCE, &amp;bvec, 1, len);</div><div class='add'>+	ret = sock_sendmsg(con-&gt;sock, &amp;msg);</div><div class='add'>+	trace_dlm_send(con-&gt;nodeid, ret);</div><div class='add'>+	if (ret == -EAGAIN || ret == 0) {</div><div class='add'>+		lock_sock(con-&gt;sock-&gt;sk);</div><div class='add'>+		spin_lock_bh(&amp;con-&gt;writequeue_lock);</div><div class='add'>+		if (test_bit(SOCKWQ_ASYNC_NOSPACE, &amp;con-&gt;sock-&gt;flags) &amp;&amp;</div><div class='add'>+		    !test_and_set_bit(CF_APP_LIMITED, &amp;con-&gt;flags)) {</div><div class='add'>+			/* Notify TCP that we're limited by the</div><div class='add'>+			 * application window size.</div><div class='add'>+			 */</div><div class='add'>+			set_bit(SOCK_NOSPACE, &amp;con-&gt;sock-&gt;sk-&gt;sk_socket-&gt;flags);</div><div class='add'>+			con-&gt;sock-&gt;sk-&gt;sk_write_pending++;</div><div class='add'>+</div><div class='add'>+			clear_bit(CF_SEND_PENDING, &amp;con-&gt;flags);</div><div class='add'>+			spin_unlock_bh(&amp;con-&gt;writequeue_lock);</div><div class='add'>+			release_sock(con-&gt;sock-&gt;sk);</div><div class='add'>+</div><div class='add'>+			/* wait for write_space() event */</div><div class='add'>+			return DLM_IO_END;</div><div class='ctx'> 		}</div><div class='add'>+		spin_unlock_bh(&amp;con-&gt;writequeue_lock);</div><div class='add'>+		release_sock(con-&gt;sock-&gt;sk);</div><div class='ctx'> </div><div class='del'>-		spin_lock(&amp;con-&gt;writequeue_lock);</div><div class='del'>-		writequeue_entry_complete(e, ret);</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;con-&gt;writequeue_lock);</div><div class='del'>-</div><div class='del'>-	/* close if we got EOF */</div><div class='del'>-	if (test_and_clear_bit(CF_EOF, &amp;con-&gt;flags)) {</div><div class='del'>-		mutex_unlock(&amp;con-&gt;sock_mutex);</div><div class='del'>-		close_connection(con, false, false, true);</div><div class='del'>-</div><div class='del'>-		/* handling for tcp shutdown */</div><div class='del'>-		clear_bit(CF_SHUTDOWN, &amp;con-&gt;flags);</div><div class='del'>-		wake_up(&amp;con-&gt;shutdown_wait);</div><div class='del'>-	} else {</div><div class='del'>-		mutex_unlock(&amp;con-&gt;sock_mutex);</div><div class='add'>+		return DLM_IO_RESCHED;</div><div class='add'>+	} else if (ret &lt; 0) {</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return;</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	mutex_unlock(&amp;con-&gt;sock_mutex);</div><div class='del'>-	return;</div><div class='add'>+	spin_lock_bh(&amp;con-&gt;writequeue_lock);</div><div class='add'>+	writequeue_entry_complete(e, ret);</div><div class='add'>+	spin_unlock_bh(&amp;con-&gt;writequeue_lock);</div><div class='ctx'> </div><div class='del'>-out_connect:</div><div class='del'>-	mutex_unlock(&amp;con-&gt;sock_mutex);</div><div class='del'>-	queue_work(send_workqueue, &amp;con-&gt;swork);</div><div class='del'>-	cond_resched();</div><div class='add'>+	return DLM_IO_SUCCESS;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void clean_one_writequeue(struct connection *con)</div><div class='ctx'> {</div><div class='ctx'> 	struct writequeue_entry *e, *safe;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;con-&gt;writequeue_lock);</div><div class='add'>+	spin_lock_bh(&amp;con-&gt;writequeue_lock);</div><div class='ctx'> 	list_for_each_entry_safe(e, safe, &amp;con-&gt;writequeue, list) {</div><div class='ctx'> 		free_entry(e);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;con-&gt;writequeue_lock);</div><div class='add'>+	spin_unlock_bh(&amp;con-&gt;writequeue_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void connection_release(struct rcu_head *rcu)</div><div class='add'>+{</div><div class='add'>+	struct connection *con = container_of(rcu, struct connection, rcu);</div><div class='add'>+</div><div class='add'>+	WARN_ON_ONCE(!list_empty(&amp;con-&gt;writequeue));</div><div class='add'>+	WARN_ON_ONCE(con-&gt;sock);</div><div class='add'>+	kfree(con);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Called from recovery when it knows that a node has</div><div class='hunk'>@@ -1477,286 +1444,309 @@ static void clean_one_writequeue(struct connection *con)</div><div class='ctx'> int dlm_lowcomms_close(int nodeid)</div><div class='ctx'> {</div><div class='ctx'> 	struct connection *con;</div><div class='del'>-	struct dlm_node_addr *na;</div><div class='ctx'> 	int idx;</div><div class='ctx'> </div><div class='ctx'> 	log_print("closing connection to node %d", nodeid);</div><div class='add'>+</div><div class='ctx'> 	idx = srcu_read_lock(&amp;connections_srcu);</div><div class='ctx'> 	con = nodeid2con(nodeid, 0);</div><div class='del'>-	if (con) {</div><div class='del'>-		set_bit(CF_CLOSE, &amp;con-&gt;flags);</div><div class='del'>-		close_connection(con, true, true, true);</div><div class='del'>-		clean_one_writequeue(con);</div><div class='del'>-		if (con-&gt;othercon)</div><div class='del'>-			clean_one_writequeue(con-&gt;othercon);</div><div class='add'>+	if (WARN_ON_ONCE(!con)) {</div><div class='add'>+		srcu_read_unlock(&amp;connections_srcu, idx);</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> 	}</div><div class='del'>-	srcu_read_unlock(&amp;connections_srcu, idx);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;dlm_node_addrs_spin);</div><div class='del'>-	na = find_node_addr(nodeid);</div><div class='del'>-	if (na) {</div><div class='del'>-		list_del(&amp;na-&gt;list);</div><div class='del'>-		while (na-&gt;addr_count--)</div><div class='del'>-			kfree(na-&gt;addr[na-&gt;addr_count]);</div><div class='del'>-		kfree(na);</div><div class='add'>+	stop_connection_io(con);</div><div class='add'>+	log_print("io handling for node: %d stopped", nodeid);</div><div class='add'>+	close_connection(con, true);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;connections_lock);</div><div class='add'>+	hlist_del_rcu(&amp;con-&gt;list);</div><div class='add'>+	spin_unlock(&amp;connections_lock);</div><div class='add'>+</div><div class='add'>+	clean_one_writequeue(con);</div><div class='add'>+	call_srcu(&amp;connections_srcu, &amp;con-&gt;rcu, connection_release);</div><div class='add'>+	if (con-&gt;othercon) {</div><div class='add'>+		clean_one_writequeue(con-&gt;othercon);</div><div class='add'>+		call_srcu(&amp;connections_srcu, &amp;con-&gt;othercon-&gt;rcu, connection_release);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;dlm_node_addrs_spin);</div><div class='add'>+	srcu_read_unlock(&amp;connections_srcu, idx);</div><div class='add'>+</div><div class='add'>+	/* for debugging we print when we are done to compare with other</div><div class='add'>+	 * messages in between. This function need to be correctly synchronized</div><div class='add'>+	 * with io handling</div><div class='add'>+	 */</div><div class='add'>+	log_print("closing connection to node %d done", nodeid);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Receive workqueue function */</div><div class='add'>+/* Receive worker function */</div><div class='ctx'> static void process_recv_sockets(struct work_struct *work)</div><div class='ctx'> {</div><div class='ctx'> 	struct connection *con = container_of(work, struct connection, rwork);</div><div class='add'>+	int ret, buflen;</div><div class='add'>+</div><div class='add'>+	down_read(&amp;con-&gt;sock_lock);</div><div class='add'>+	if (!con-&gt;sock) {</div><div class='add'>+		up_read(&amp;con-&gt;sock_lock);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	buflen = READ_ONCE(dlm_config.ci_buffer_size);</div><div class='add'>+	do {</div><div class='add'>+		ret = receive_from_sock(con, buflen);</div><div class='add'>+	} while (ret == DLM_IO_SUCCESS);</div><div class='add'>+	up_read(&amp;con-&gt;sock_lock);</div><div class='add'>+</div><div class='add'>+	switch (ret) {</div><div class='add'>+	case DLM_IO_END:</div><div class='add'>+		/* CF_RECV_PENDING cleared */</div><div class='add'>+		break;</div><div class='add'>+	case DLM_IO_EOF:</div><div class='add'>+		close_connection(con, false);</div><div class='add'>+		wake_up(&amp;con-&gt;shutdown_wait);</div><div class='add'>+		/* CF_RECV_PENDING cleared */</div><div class='add'>+		break;</div><div class='add'>+	case DLM_IO_FLUSH:</div><div class='add'>+		/* we can't flush the process_workqueue here because a</div><div class='add'>+		 * WQ_MEM_RECLAIM workequeue can occurr a deadlock for a non</div><div class='add'>+		 * WQ_MEM_RECLAIM workqueue such as process_workqueue. Instead</div><div class='add'>+		 * we have a waitqueue to wait until all messages are</div><div class='add'>+		 * processed.</div><div class='add'>+		 *</div><div class='add'>+		 * This handling is only necessary to backoff the sender and</div><div class='add'>+		 * not queue all messages from the socket layer into DLM</div><div class='add'>+		 * processqueue. When DLM is capable to parse multiple messages</div><div class='add'>+		 * on an e.g. per socket basis this handling can might be</div><div class='add'>+		 * removed. Especially in a message burst we are too slow to</div><div class='add'>+		 * process messages and the queue will fill up memory.</div><div class='add'>+		 */</div><div class='add'>+		wait_event(processqueue_wq, !atomic_read(&amp;processqueue_count));</div><div class='add'>+		fallthrough;</div><div class='add'>+	case DLM_IO_RESCHED:</div><div class='add'>+		cond_resched();</div><div class='add'>+		queue_work(io_workqueue, &amp;con-&gt;rwork);</div><div class='add'>+		/* CF_RECV_PENDING not cleared */</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			if (test_bit(CF_IS_OTHERCON, &amp;con-&gt;flags)) {</div><div class='add'>+				close_connection(con, false);</div><div class='add'>+			} else {</div><div class='add'>+				spin_lock_bh(&amp;con-&gt;writequeue_lock);</div><div class='add'>+				lowcomms_queue_swork(con);</div><div class='add'>+				spin_unlock_bh(&amp;con-&gt;writequeue_lock);</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			/* CF_RECV_PENDING cleared for othercon</div><div class='add'>+			 * we trigger send queue if not already done</div><div class='add'>+			 * and process_send_sockets will handle it</div><div class='add'>+			 */</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	clear_bit(CF_READ_PENDING, &amp;con-&gt;flags);</div><div class='del'>-	receive_from_sock(con);</div><div class='add'>+		WARN_ON_ONCE(1);</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void process_listen_recv_socket(struct work_struct *work)</div><div class='ctx'> {</div><div class='del'>-	accept_from_sock(&amp;listen_con);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (WARN_ON_ONCE(!listen_con.sock))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		ret = accept_from_sock();</div><div class='add'>+	} while (ret == DLM_IO_SUCCESS);</div><div class='add'>+</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		log_print("critical error accepting connection: %d", ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void dlm_connect(struct connection *con)</div><div class='add'>+static int dlm_connect(struct connection *con)</div><div class='ctx'> {</div><div class='ctx'> 	struct sockaddr_storage addr;</div><div class='ctx'> 	int result, addr_len;</div><div class='ctx'> 	struct socket *sock;</div><div class='ctx'> 	unsigned int mark;</div><div class='ctx'> </div><div class='del'>-	/* Some odd races can cause double-connects, ignore them */</div><div class='del'>-	if (con-&gt;retries++ &gt; MAX_CONNECT_RETRIES)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	if (con-&gt;sock) {</div><div class='del'>-		log_print("node %d already connected.", con-&gt;nodeid);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	memset(&amp;addr, 0, sizeof(addr));</div><div class='ctx'> 	result = nodeid_to_addr(con-&gt;nodeid, &amp;addr, NULL,</div><div class='ctx'> 				dlm_proto_ops-&gt;try_new_addr, &amp;mark);</div><div class='ctx'> 	if (result &lt; 0) {</div><div class='ctx'> 		log_print("no address for nodeid %d", con-&gt;nodeid);</div><div class='del'>-		return;</div><div class='add'>+		return result;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Create a socket to communicate with */</div><div class='del'>-	result = sock_create_kern(&amp;init_net, dlm_local_addr[0]-&gt;ss_family,</div><div class='add'>+	result = sock_create_kern(&amp;init_net, dlm_local_addr[0].ss_family,</div><div class='ctx'> 				  SOCK_STREAM, dlm_proto_ops-&gt;proto, &amp;sock);</div><div class='ctx'> 	if (result &lt; 0)</div><div class='del'>-		goto socket_err;</div><div class='add'>+		return result;</div><div class='ctx'> </div><div class='ctx'> 	sock_set_mark(sock-&gt;sk, mark);</div><div class='ctx'> 	dlm_proto_ops-&gt;sockopts(sock);</div><div class='ctx'> </div><div class='del'>-	add_sock(sock, con);</div><div class='del'>-</div><div class='ctx'> 	result = dlm_proto_ops-&gt;bind(sock);</div><div class='del'>-	if (result &lt; 0)</div><div class='del'>-		goto add_sock_err;</div><div class='add'>+	if (result &lt; 0) {</div><div class='add'>+		sock_release(sock);</div><div class='add'>+		return result;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	add_sock(sock, con);</div><div class='ctx'> </div><div class='ctx'> 	log_print_ratelimited("connecting to %d", con-&gt;nodeid);</div><div class='ctx'> 	make_sockaddr(&amp;addr, dlm_config.ci_tcp_port, &amp;addr_len);</div><div class='del'>-	result = dlm_proto_ops-&gt;connect(con, sock, (struct sockaddr *)&amp;addr,</div><div class='del'>-					addr_len);</div><div class='del'>-	if (result &lt; 0)</div><div class='del'>-		goto add_sock_err;</div><div class='del'>-</div><div class='del'>-	return;</div><div class='del'>-</div><div class='del'>-add_sock_err:</div><div class='del'>-	dlm_close_sock(&amp;con-&gt;sock);</div><div class='add'>+	result = kernel_connect(sock, (struct sockaddr_unsized *)&amp;addr, addr_len, 0);</div><div class='add'>+	switch (result) {</div><div class='add'>+	case -EINPROGRESS:</div><div class='add'>+		/* not an error */</div><div class='add'>+		fallthrough;</div><div class='add'>+	case 0:</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		if (result &lt; 0)</div><div class='add'>+			dlm_close_sock(&amp;con-&gt;sock);</div><div class='ctx'> </div><div class='del'>-socket_err:</div><div class='del'>-	/*</div><div class='del'>-	 * Some errors are fatal and this list might need adjusting. For other</div><div class='del'>-	 * errors we try again until the max number of retries is reached.</div><div class='del'>-	 */</div><div class='del'>-	if (result != -EHOSTUNREACH &amp;&amp;</div><div class='del'>-	    result != -ENETUNREACH &amp;&amp;</div><div class='del'>-	    result != -ENETDOWN &amp;&amp;</div><div class='del'>-	    result != -EINVAL &amp;&amp;</div><div class='del'>-	    result != -EPROTONOSUPPORT) {</div><div class='del'>-		log_print("connect %d try %d error %d", con-&gt;nodeid,</div><div class='del'>-			  con-&gt;retries, result);</div><div class='del'>-		msleep(1000);</div><div class='del'>-		lowcomms_connect_sock(con);</div><div class='add'>+		break;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	return result;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Send workqueue function */</div><div class='add'>+/* Send worker function */</div><div class='ctx'> static void process_send_sockets(struct work_struct *work)</div><div class='ctx'> {</div><div class='ctx'> 	struct connection *con = container_of(work, struct connection, swork);</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	WARN_ON(test_bit(CF_IS_OTHERCON, &amp;con-&gt;flags));</div><div class='del'>-</div><div class='del'>-	clear_bit(CF_WRITE_PENDING, &amp;con-&gt;flags);</div><div class='add'>+	WARN_ON_ONCE(test_bit(CF_IS_OTHERCON, &amp;con-&gt;flags));</div><div class='ctx'> </div><div class='del'>-	if (test_and_clear_bit(CF_RECONNECT, &amp;con-&gt;flags)) {</div><div class='del'>-		close_connection(con, false, false, true);</div><div class='del'>-		dlm_midcomms_unack_msg_resend(con-&gt;nodeid);</div><div class='add'>+	down_read(&amp;con-&gt;sock_lock);</div><div class='add'>+	if (!con-&gt;sock) {</div><div class='add'>+		up_read(&amp;con-&gt;sock_lock);</div><div class='add'>+		down_write(&amp;con-&gt;sock_lock);</div><div class='add'>+		if (!con-&gt;sock) {</div><div class='add'>+			ret = dlm_connect(con);</div><div class='add'>+			switch (ret) {</div><div class='add'>+			case 0:</div><div class='add'>+				break;</div><div class='add'>+			default:</div><div class='add'>+				/* CF_SEND_PENDING not cleared */</div><div class='add'>+				up_write(&amp;con-&gt;sock_lock);</div><div class='add'>+				log_print("connect to node %d try %d error %d",</div><div class='add'>+					  con-&gt;nodeid, con-&gt;retries++, ret);</div><div class='add'>+				msleep(1000);</div><div class='add'>+				/* For now we try forever to reconnect. In</div><div class='add'>+				 * future we should send a event to cluster</div><div class='add'>+				 * manager to fence itself after certain amount</div><div class='add'>+				 * of retries.</div><div class='add'>+				 */</div><div class='add'>+				queue_work(io_workqueue, &amp;con-&gt;swork);</div><div class='add'>+				return;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+		downgrade_write(&amp;con-&gt;sock_lock);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (con-&gt;sock == NULL) {</div><div class='del'>-		if (test_and_clear_bit(CF_DELAY_CONNECT, &amp;con-&gt;flags))</div><div class='del'>-			msleep(1000);</div><div class='add'>+	do {</div><div class='add'>+		ret = send_to_sock(con);</div><div class='add'>+	} while (ret == DLM_IO_SUCCESS);</div><div class='add'>+	up_read(&amp;con-&gt;sock_lock);</div><div class='ctx'> </div><div class='del'>-		mutex_lock(&amp;con-&gt;sock_mutex);</div><div class='del'>-		dlm_connect(con);</div><div class='del'>-		mutex_unlock(&amp;con-&gt;sock_mutex);</div><div class='del'>-	}</div><div class='add'>+	switch (ret) {</div><div class='add'>+	case DLM_IO_END:</div><div class='add'>+		/* CF_SEND_PENDING cleared */</div><div class='add'>+		break;</div><div class='add'>+	case DLM_IO_RESCHED:</div><div class='add'>+		/* CF_SEND_PENDING not cleared */</div><div class='add'>+		cond_resched();</div><div class='add'>+		queue_work(io_workqueue, &amp;con-&gt;swork);</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			close_connection(con, false);</div><div class='add'>+</div><div class='add'>+			/* CF_SEND_PENDING cleared */</div><div class='add'>+			spin_lock_bh(&amp;con-&gt;writequeue_lock);</div><div class='add'>+			lowcomms_queue_swork(con);</div><div class='add'>+			spin_unlock_bh(&amp;con-&gt;writequeue_lock);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	if (!list_empty(&amp;con-&gt;writequeue))</div><div class='del'>-		send_to_sock(con);</div><div class='add'>+		WARN_ON_ONCE(1);</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void work_stop(void)</div><div class='ctx'> {</div><div class='del'>-	if (recv_workqueue) {</div><div class='del'>-		destroy_workqueue(recv_workqueue);</div><div class='del'>-		recv_workqueue = NULL;</div><div class='add'>+	if (io_workqueue) {</div><div class='add'>+		destroy_workqueue(io_workqueue);</div><div class='add'>+		io_workqueue = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (send_workqueue) {</div><div class='del'>-		destroy_workqueue(send_workqueue);</div><div class='del'>-		send_workqueue = NULL;</div><div class='add'>+	if (process_workqueue) {</div><div class='add'>+		destroy_workqueue(process_workqueue);</div><div class='add'>+		process_workqueue = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int work_start(void)</div><div class='ctx'> {</div><div class='del'>-	recv_workqueue = alloc_ordered_workqueue("dlm_recv", WQ_MEM_RECLAIM);</div><div class='del'>-	if (!recv_workqueue) {</div><div class='del'>-		log_print("can't start dlm_recv");</div><div class='add'>+	io_workqueue = alloc_workqueue("dlm_io", WQ_HIGHPRI | WQ_MEM_RECLAIM |</div><div class='add'>+				       WQ_UNBOUND, 0);</div><div class='add'>+	if (!io_workqueue) {</div><div class='add'>+		log_print("can't start dlm_io");</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	send_workqueue = alloc_ordered_workqueue("dlm_send", WQ_MEM_RECLAIM);</div><div class='del'>-	if (!send_workqueue) {</div><div class='del'>-		log_print("can't start dlm_send");</div><div class='del'>-		destroy_workqueue(recv_workqueue);</div><div class='del'>-		recv_workqueue = NULL;</div><div class='add'>+	process_workqueue = alloc_workqueue("dlm_process", WQ_HIGHPRI | WQ_BH | WQ_PERCPU, 0);</div><div class='add'>+	if (!process_workqueue) {</div><div class='add'>+		log_print("can't start dlm_process");</div><div class='add'>+		destroy_workqueue(io_workqueue);</div><div class='add'>+		io_workqueue = NULL;</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void shutdown_conn(struct connection *con)</div><div class='del'>-{</div><div class='del'>-	if (dlm_proto_ops-&gt;shutdown_action)</div><div class='del'>-		dlm_proto_ops-&gt;shutdown_action(con);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> void dlm_lowcomms_shutdown(void)</div><div class='ctx'> {</div><div class='del'>-	int idx;</div><div class='del'>-</div><div class='del'>-	/* Set all the flags to prevent any</div><div class='del'>-	 * socket activity.</div><div class='del'>-	 */</div><div class='del'>-	dlm_allow_conn = 0;</div><div class='add'>+	struct connection *con;</div><div class='add'>+	int i, idx;</div><div class='ctx'> </div><div class='del'>-	if (recv_workqueue)</div><div class='del'>-		flush_workqueue(recv_workqueue);</div><div class='del'>-	if (send_workqueue)</div><div class='del'>-		flush_workqueue(send_workqueue);</div><div class='add'>+	/* stop lowcomms_listen_data_ready calls */</div><div class='add'>+	lock_sock(listen_con.sock-&gt;sk);</div><div class='add'>+	listen_con.sock-&gt;sk-&gt;sk_data_ready = listen_sock.sk_data_ready;</div><div class='add'>+	release_sock(listen_con.sock-&gt;sk);</div><div class='ctx'> </div><div class='add'>+	cancel_work_sync(&amp;listen_con.rwork);</div><div class='ctx'> 	dlm_close_sock(&amp;listen_con.sock);</div><div class='ctx'> </div><div class='ctx'> 	idx = srcu_read_lock(&amp;connections_srcu);</div><div class='del'>-	foreach_conn(shutdown_conn);</div><div class='del'>-	srcu_read_unlock(&amp;connections_srcu, idx);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void _stop_conn(struct connection *con, bool and_other)</div><div class='del'>-{</div><div class='del'>-	mutex_lock(&amp;con-&gt;sock_mutex);</div><div class='del'>-	set_bit(CF_CLOSE, &amp;con-&gt;flags);</div><div class='del'>-	set_bit(CF_READ_PENDING, &amp;con-&gt;flags);</div><div class='del'>-	set_bit(CF_WRITE_PENDING, &amp;con-&gt;flags);</div><div class='del'>-	if (con-&gt;sock &amp;&amp; con-&gt;sock-&gt;sk) {</div><div class='del'>-		write_lock_bh(&amp;con-&gt;sock-&gt;sk-&gt;sk_callback_lock);</div><div class='del'>-		con-&gt;sock-&gt;sk-&gt;sk_user_data = NULL;</div><div class='del'>-		write_unlock_bh(&amp;con-&gt;sock-&gt;sk-&gt;sk_callback_lock);</div><div class='del'>-	}</div><div class='del'>-	if (con-&gt;othercon &amp;&amp; and_other)</div><div class='del'>-		_stop_conn(con-&gt;othercon, false);</div><div class='del'>-	mutex_unlock(&amp;con-&gt;sock_mutex);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void stop_conn(struct connection *con)</div><div class='del'>-{</div><div class='del'>-	_stop_conn(con, true);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void connection_release(struct rcu_head *rcu)</div><div class='del'>-{</div><div class='del'>-	struct connection *con = container_of(rcu, struct connection, rcu);</div><div class='del'>-</div><div class='del'>-	kfree(con-&gt;rx_buf);</div><div class='del'>-	kfree(con);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void free_conn(struct connection *con)</div><div class='del'>-{</div><div class='del'>-	close_connection(con, true, true, true);</div><div class='del'>-	spin_lock(&amp;connections_lock);</div><div class='del'>-	hlist_del_rcu(&amp;con-&gt;list);</div><div class='del'>-	spin_unlock(&amp;connections_lock);</div><div class='del'>-	if (con-&gt;othercon) {</div><div class='del'>-		clean_one_writequeue(con-&gt;othercon);</div><div class='del'>-		call_srcu(&amp;connections_srcu, &amp;con-&gt;othercon-&gt;rcu,</div><div class='del'>-			  connection_release);</div><div class='del'>-	}</div><div class='del'>-	clean_one_writequeue(con);</div><div class='del'>-	call_srcu(&amp;connections_srcu, &amp;con-&gt;rcu, connection_release);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void work_flush(void)</div><div class='del'>-{</div><div class='del'>-	int ok;</div><div class='del'>-	int i;</div><div class='del'>-	struct connection *con;</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		ok = 1;</div><div class='del'>-		foreach_conn(stop_conn);</div><div class='del'>-		if (recv_workqueue)</div><div class='del'>-			flush_workqueue(recv_workqueue);</div><div class='del'>-		if (send_workqueue)</div><div class='del'>-			flush_workqueue(send_workqueue);</div><div class='del'>-		for (i = 0; i &lt; CONN_HASH_SIZE &amp;&amp; ok; i++) {</div><div class='del'>-			hlist_for_each_entry_rcu(con, &amp;connection_hash[i],</div><div class='del'>-						 list) {</div><div class='del'>-				ok &amp;= test_bit(CF_READ_PENDING, &amp;con-&gt;flags);</div><div class='del'>-				ok &amp;= test_bit(CF_WRITE_PENDING, &amp;con-&gt;flags);</div><div class='del'>-				if (con-&gt;othercon) {</div><div class='del'>-					ok &amp;= test_bit(CF_READ_PENDING,</div><div class='del'>-						       &amp;con-&gt;othercon-&gt;flags);</div><div class='del'>-					ok &amp;= test_bit(CF_WRITE_PENDING,</div><div class='del'>-						       &amp;con-&gt;othercon-&gt;flags);</div><div class='del'>-				}</div><div class='del'>-			}</div><div class='add'>+	for (i = 0; i &lt; CONN_HASH_SIZE; i++) {</div><div class='add'>+		hlist_for_each_entry_rcu(con, &amp;connection_hash[i], list) {</div><div class='add'>+			shutdown_connection(con, true);</div><div class='add'>+			stop_connection_io(con);</div><div class='add'>+			flush_workqueue(process_workqueue);</div><div class='add'>+			close_connection(con, true);</div><div class='add'>+</div><div class='add'>+			clean_one_writequeue(con);</div><div class='add'>+			if (con-&gt;othercon)</div><div class='add'>+				clean_one_writequeue(con-&gt;othercon);</div><div class='add'>+			allow_connection_io(con);</div><div class='ctx'> 		}</div><div class='del'>-	} while (!ok);</div><div class='add'>+	}</div><div class='add'>+	srcu_read_unlock(&amp;connections_srcu, idx);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void dlm_lowcomms_stop(void)</div><div class='ctx'> {</div><div class='del'>-	int idx;</div><div class='del'>-</div><div class='del'>-	idx = srcu_read_lock(&amp;connections_srcu);</div><div class='del'>-	work_flush();</div><div class='del'>-	foreach_conn(free_conn);</div><div class='del'>-	srcu_read_unlock(&amp;connections_srcu, idx);</div><div class='ctx'> 	work_stop();</div><div class='del'>-	deinit_local();</div><div class='del'>-</div><div class='ctx'> 	dlm_proto_ops = NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1772,11 +1762,11 @@ static int dlm_listen_for_all(void)</div><div class='ctx'> 	if (result &lt; 0)</div><div class='ctx'> 		return result;</div><div class='ctx'> </div><div class='del'>-	result = sock_create_kern(&amp;init_net, dlm_local_addr[0]-&gt;ss_family,</div><div class='add'>+	result = sock_create_kern(&amp;init_net, dlm_local_addr[0].ss_family,</div><div class='ctx'> 				  SOCK_STREAM, dlm_proto_ops-&gt;proto, &amp;sock);</div><div class='ctx'> 	if (result &lt; 0) {</div><div class='del'>-		log_print("Can't create comms socket, check SCTP is loaded");</div><div class='del'>-		goto out;</div><div class='add'>+		log_print("Can't create comms socket: %d", result);</div><div class='add'>+		return result;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	sock_set_mark(sock-&gt;sk, dlm_config.ci_mark);</div><div class='hunk'>@@ -1786,14 +1776,23 @@ static int dlm_listen_for_all(void)</div><div class='ctx'> 	if (result &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	save_listen_callbacks(sock);</div><div class='del'>-	add_listen_sock(sock, &amp;listen_con);</div><div class='add'>+	lock_sock(sock-&gt;sk);</div><div class='add'>+	listen_sock.sk_data_ready = sock-&gt;sk-&gt;sk_data_ready;</div><div class='add'>+	listen_sock.sk_write_space = sock-&gt;sk-&gt;sk_write_space;</div><div class='add'>+	listen_sock.sk_error_report = sock-&gt;sk-&gt;sk_error_report;</div><div class='add'>+	listen_sock.sk_state_change = sock-&gt;sk-&gt;sk_state_change;</div><div class='ctx'> </div><div class='del'>-	INIT_WORK(&amp;listen_con.rwork, process_listen_recv_socket);</div><div class='del'>-	result = sock-&gt;ops-&gt;listen(sock, 5);</div><div class='add'>+	listen_con.sock = sock;</div><div class='add'>+</div><div class='add'>+	sock-&gt;sk-&gt;sk_allocation = GFP_NOFS;</div><div class='add'>+	sock-&gt;sk-&gt;sk_use_task_frag = false;</div><div class='add'>+	sock-&gt;sk-&gt;sk_data_ready = lowcomms_listen_data_ready;</div><div class='add'>+	release_sock(sock-&gt;sk);</div><div class='add'>+</div><div class='add'>+	result = sock-&gt;ops-&gt;listen(sock, 128);</div><div class='ctx'> 	if (result &lt; 0) {</div><div class='ctx'> 		dlm_close_sock(&amp;listen_con.sock);</div><div class='del'>-		goto out;</div><div class='add'>+		return result;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -1811,11 +1810,11 @@ static int dlm_tcp_bind(struct socket *sock)</div><div class='ctx'> 	/* Bind to our cluster-known address connecting to avoid</div><div class='ctx'> 	 * routing problems.</div><div class='ctx'> 	 */</div><div class='del'>-	memcpy(&amp;src_addr, dlm_local_addr[0], sizeof(src_addr));</div><div class='add'>+	memcpy(&amp;src_addr, &amp;dlm_local_addr[0], sizeof(src_addr));</div><div class='ctx'> 	make_sockaddr(&amp;src_addr, 0, &amp;addr_len);</div><div class='ctx'> </div><div class='del'>-	result = sock-&gt;ops-&gt;bind(sock, (struct sockaddr *)&amp;src_addr,</div><div class='del'>-				 addr_len);</div><div class='add'>+	result = kernel_bind(sock, (struct sockaddr_unsized *)&amp;src_addr,</div><div class='add'>+			     addr_len);</div><div class='ctx'> 	if (result &lt; 0) {</div><div class='ctx'> 		/* This *may* not indicate a critical error */</div><div class='ctx'> 		log_print("could not bind for connect: %d", result);</div><div class='hunk'>@@ -1824,28 +1823,12 @@ static int dlm_tcp_bind(struct socket *sock)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int dlm_tcp_connect(struct connection *con, struct socket *sock,</div><div class='del'>-			   struct sockaddr *addr, int addr_len)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ret = sock-&gt;ops-&gt;connect(sock, addr, addr_len, O_NONBLOCK);</div><div class='del'>-	switch (ret) {</div><div class='del'>-	case -EINPROGRESS:</div><div class='del'>-		fallthrough;</div><div class='del'>-	case 0:</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int dlm_tcp_listen_validate(void)</div><div class='ctx'> {</div><div class='ctx'> 	/* We don't support multi-homed hosts */</div><div class='ctx'> 	if (dlm_local_count &gt; 1) {</div><div class='del'>-		log_print("TCP protocol can't handle multi-homed hosts, try SCTP");</div><div class='del'>-		return -EINVAL;</div><div class='add'>+		log_print("Detect multi-homed hosts but use only the first IP address.");</div><div class='add'>+		log_print("Try SCTP, if you want to enable multi-link.");</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -1868,22 +1851,20 @@ static int dlm_tcp_listen_bind(struct socket *sock)</div><div class='ctx'> 	int addr_len;</div><div class='ctx'> </div><div class='ctx'> 	/* Bind to our port */</div><div class='del'>-	make_sockaddr(dlm_local_addr[0], dlm_config.ci_tcp_port, &amp;addr_len);</div><div class='del'>-	return sock-&gt;ops-&gt;bind(sock, (struct sockaddr *)dlm_local_addr[0],</div><div class='del'>-			       addr_len);</div><div class='add'>+	make_sockaddr(&amp;dlm_local_addr[0], dlm_config.ci_tcp_port, &amp;addr_len);</div><div class='add'>+	return kernel_bind(sock, (struct sockaddr_unsized *)&amp;dlm_local_addr[0],</div><div class='add'>+			   addr_len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct dlm_proto_ops dlm_tcp_ops = {</div><div class='ctx'> 	.name = "TCP",</div><div class='ctx'> 	.proto = IPPROTO_TCP,</div><div class='del'>-	.connect = dlm_tcp_connect,</div><div class='add'>+	.how = SHUT_WR,</div><div class='ctx'> 	.sockopts = dlm_tcp_sockopts,</div><div class='ctx'> 	.bind = dlm_tcp_bind,</div><div class='ctx'> 	.listen_validate = dlm_tcp_listen_validate,</div><div class='ctx'> 	.listen_sockopts = dlm_tcp_listen_sockopts,</div><div class='ctx'> 	.listen_bind = dlm_tcp_listen_bind,</div><div class='del'>-	.shutdown_action = dlm_tcp_shutdown,</div><div class='del'>-	.eof_condition = tcp_eof_condition,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static int dlm_sctp_bind(struct socket *sock)</div><div class='hunk'>@@ -1891,28 +1872,6 @@ static int dlm_sctp_bind(struct socket *sock)</div><div class='ctx'> 	return sctp_bind_addrs(sock, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int dlm_sctp_connect(struct connection *con, struct socket *sock,</div><div class='del'>-			    struct sockaddr *addr, int addr_len)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Make sock-&gt;ops-&gt;connect() function return in specified time,</div><div class='del'>-	 * since O_NONBLOCK argument in connect() function does not work here,</div><div class='del'>-	 * then, we should restore the default value of this attribute.</div><div class='del'>-	 */</div><div class='del'>-	sock_set_sndtimeo(sock-&gt;sk, 5);</div><div class='del'>-	ret = sock-&gt;ops-&gt;connect(sock, addr, addr_len, 0);</div><div class='del'>-	sock_set_sndtimeo(sock-&gt;sk, 0);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	if (!test_and_set_bit(CF_CONNECTED, &amp;con-&gt;flags))</div><div class='del'>-		log_print("successful connected to node %d", con-&gt;nodeid);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int dlm_sctp_listen_validate(void)</div><div class='ctx'> {</div><div class='ctx'> 	if (!IS_ENABLED(CONFIG_IP_SCTP)) {</div><div class='hunk'>@@ -1939,8 +1898,8 @@ static void dlm_sctp_sockopts(struct socket *sock)</div><div class='ctx'> static const struct dlm_proto_ops dlm_sctp_ops = {</div><div class='ctx'> 	.name = "SCTP",</div><div class='ctx'> 	.proto = IPPROTO_SCTP,</div><div class='add'>+	.how = SHUT_RDWR,</div><div class='ctx'> 	.try_new_addr = true,</div><div class='del'>-	.connect = dlm_sctp_connect,</div><div class='ctx'> 	.sockopts = dlm_sctp_sockopts,</div><div class='ctx'> 	.bind = dlm_sctp_bind,</div><div class='ctx'> 	.listen_validate = dlm_sctp_listen_validate,</div><div class='hunk'>@@ -1950,11 +1909,7 @@ static const struct dlm_proto_ops dlm_sctp_ops = {</div><div class='ctx'> </div><div class='ctx'> int dlm_lowcomms_start(void)</div><div class='ctx'> {</div><div class='del'>-	int error = -EINVAL;</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; CONN_HASH_SIZE; i++)</div><div class='del'>-		INIT_HLIST_HEAD(&amp;connection_hash[i]);</div><div class='add'>+	int error;</div><div class='ctx'> </div><div class='ctx'> 	init_local();</div><div class='ctx'> 	if (!dlm_local_count) {</div><div class='hunk'>@@ -1963,13 +1918,9 @@ int dlm_lowcomms_start(void)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	INIT_WORK(&amp;listen_con.rwork, process_listen_recv_socket);</div><div class='del'>-</div><div class='ctx'> 	error = work_start();</div><div class='ctx'> 	if (error)</div><div class='del'>-		goto fail_local;</div><div class='del'>-</div><div class='del'>-	dlm_allow_conn = 1;</div><div class='add'>+		goto fail;</div><div class='ctx'> </div><div class='ctx'> 	/* Start listening */</div><div class='ctx'> 	switch (dlm_config.ci_protocol) {</div><div class='hunk'>@@ -1995,25 +1946,38 @@ int dlm_lowcomms_start(void)</div><div class='ctx'> fail_listen:</div><div class='ctx'> 	dlm_proto_ops = NULL;</div><div class='ctx'> fail_proto_ops:</div><div class='del'>-	dlm_allow_conn = 0;</div><div class='del'>-	dlm_close_sock(&amp;listen_con.sock);</div><div class='ctx'> 	work_stop();</div><div class='del'>-fail_local:</div><div class='del'>-	deinit_local();</div><div class='ctx'> fail:</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void dlm_lowcomms_init(void)</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; CONN_HASH_SIZE; i++)</div><div class='add'>+		INIT_HLIST_HEAD(&amp;connection_hash[i]);</div><div class='add'>+</div><div class='add'>+	INIT_WORK(&amp;listen_con.rwork, process_listen_recv_socket);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> void dlm_lowcomms_exit(void)</div><div class='ctx'> {</div><div class='del'>-	struct dlm_node_addr *na, *safe;</div><div class='add'>+	struct connection *con;</div><div class='add'>+	int i, idx;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;dlm_node_addrs_spin);</div><div class='del'>-	list_for_each_entry_safe(na, safe, &amp;dlm_node_addrs, list) {</div><div class='del'>-		list_del(&amp;na-&gt;list);</div><div class='del'>-		while (na-&gt;addr_count--)</div><div class='del'>-			kfree(na-&gt;addr[na-&gt;addr_count]);</div><div class='del'>-		kfree(na);</div><div class='add'>+	idx = srcu_read_lock(&amp;connections_srcu);</div><div class='add'>+	for (i = 0; i &lt; CONN_HASH_SIZE; i++) {</div><div class='add'>+		hlist_for_each_entry_rcu(con, &amp;connection_hash[i], list) {</div><div class='add'>+			spin_lock(&amp;connections_lock);</div><div class='add'>+			hlist_del_rcu(&amp;con-&gt;list);</div><div class='add'>+			spin_unlock(&amp;connections_lock);</div><div class='add'>+</div><div class='add'>+			if (con-&gt;othercon)</div><div class='add'>+				call_srcu(&amp;connections_srcu, &amp;con-&gt;othercon-&gt;rcu,</div><div class='add'>+					  connection_release);</div><div class='add'>+			call_srcu(&amp;connections_srcu, &amp;con-&gt;rcu, connection_release);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;dlm_node_addrs_spin);</div><div class='add'>+	srcu_read_unlock(&amp;connections_srcu, idx);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/dlm/lowcomms.h b/fs/dlm/lowcomms.h<br/>index 4ccae07cf005..fd0df604eb93 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/lowcomms.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/lowcomms.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/lowcomms.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/lowcomms.h</a></div><div class='hunk'>@@ -29,24 +29,27 @@ static inline int nodeid_hash(int nodeid)</div><div class='ctx'> 	return nodeid &amp; (CONN_HASH_SIZE-1);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* switch to check if dlm is running */</div><div class='del'>-extern int dlm_allow_conn;</div><div class='add'>+/* check if dlm is running */</div><div class='add'>+bool dlm_lowcomms_is_running(void);</div><div class='ctx'> </div><div class='ctx'> int dlm_lowcomms_start(void);</div><div class='ctx'> void dlm_lowcomms_shutdown(void);</div><div class='add'>+void dlm_lowcomms_shutdown_node(int nodeid, bool force);</div><div class='ctx'> void dlm_lowcomms_stop(void);</div><div class='add'>+void dlm_lowcomms_init(void);</div><div class='ctx'> void dlm_lowcomms_exit(void);</div><div class='ctx'> int dlm_lowcomms_close(int nodeid);</div><div class='del'>-struct dlm_msg *dlm_lowcomms_new_msg(int nodeid, int len, gfp_t allocation,</div><div class='del'>-				     char **ppc, void (*cb)(struct dlm_mhandle *mh),</div><div class='del'>-				     struct dlm_mhandle *mh);</div><div class='add'>+struct dlm_msg *dlm_lowcomms_new_msg(int nodeid, int len, char **ppc,</div><div class='add'>+				     void (*cb)(void *data), void *data);</div><div class='ctx'> void dlm_lowcomms_commit_msg(struct dlm_msg *msg);</div><div class='ctx'> void dlm_lowcomms_put_msg(struct dlm_msg *msg);</div><div class='ctx'> int dlm_lowcomms_resend_msg(struct dlm_msg *msg);</div><div class='ctx'> int dlm_lowcomms_connect_node(int nodeid);</div><div class='ctx'> int dlm_lowcomms_nodes_set_mark(int nodeid, unsigned int mark);</div><div class='del'>-int dlm_lowcomms_addr(int nodeid, struct sockaddr_storage *addr, int len);</div><div class='add'>+int dlm_lowcomms_addr(int nodeid, struct sockaddr_storage *addr);</div><div class='ctx'> void dlm_midcomms_receive_done(int nodeid);</div><div class='add'>+struct kmem_cache *dlm_lowcomms_writequeue_cache_create(void);</div><div class='add'>+struct kmem_cache *dlm_lowcomms_msg_cache_create(void);</div><div class='ctx'> </div><div class='ctx'> #endif				/* __LOWCOMMS_DOT_H__ */</div><div class='ctx'> </div><div class='head'>diff --git a/fs/dlm/main.c b/fs/dlm/main.c<br/>index afc66a1346d3..a44d16da7187 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/main.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/main.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/main.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/main.c</a></div><div class='hunk'>@@ -17,7 +17,12 @@</div><div class='ctx'> #include "user.h"</div><div class='ctx'> #include "memory.h"</div><div class='ctx'> #include "config.h"</div><div class='del'>-#include "lowcomms.h"</div><div class='add'>+#include "midcomms.h"</div><div class='add'>+</div><div class='add'>+#define CREATE_TRACE_POINTS</div><div class='add'>+#include &lt;trace/events/dlm.h&gt;</div><div class='add'>+</div><div class='add'>+struct workqueue_struct *dlm_wq;</div><div class='ctx'> </div><div class='ctx'> static int __init init_dlm(void)</div><div class='ctx'> {</div><div class='hunk'>@@ -27,6 +32,8 @@ static int __init init_dlm(void)</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='add'>+	dlm_midcomms_init();</div><div class='add'>+</div><div class='ctx'> 	error = dlm_lockspace_init();</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out_mem;</div><div class='hunk'>@@ -41,20 +48,22 @@ static int __init init_dlm(void)</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out_debug;</div><div class='ctx'> </div><div class='del'>-	error = dlm_netlink_init();</div><div class='add'>+	error = dlm_plock_init();</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out_user;</div><div class='ctx'> </div><div class='del'>-	error = dlm_plock_init();</div><div class='del'>-	if (error)</div><div class='del'>-		goto out_netlink;</div><div class='add'>+	dlm_wq = alloc_workqueue("dlm_wq", WQ_PERCPU, 0);</div><div class='add'>+	if (!dlm_wq) {</div><div class='add'>+		error = -ENOMEM;</div><div class='add'>+		goto out_plock;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	printk("DLM installed\n");</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='del'>- out_netlink:</div><div class='del'>-	dlm_netlink_exit();</div><div class='add'>+ out_plock:</div><div class='add'>+	dlm_plock_exit();</div><div class='ctx'>  out_user:</div><div class='ctx'> 	dlm_user_exit();</div><div class='ctx'>  out_debug:</div><div class='hunk'>@@ -63,6 +72,7 @@ static int __init init_dlm(void)</div><div class='ctx'>  out_lockspace:</div><div class='ctx'> 	dlm_lockspace_exit();</div><div class='ctx'>  out_mem:</div><div class='add'>+	dlm_midcomms_exit();</div><div class='ctx'> 	dlm_memory_exit();</div><div class='ctx'>  out:</div><div class='ctx'> 	return error;</div><div class='hunk'>@@ -70,14 +80,15 @@ static int __init init_dlm(void)</div><div class='ctx'> </div><div class='ctx'> static void __exit exit_dlm(void)</div><div class='ctx'> {</div><div class='add'>+	/* be sure every pending work e.g. freeing is done */</div><div class='add'>+	destroy_workqueue(dlm_wq);</div><div class='ctx'> 	dlm_plock_exit();</div><div class='del'>-	dlm_netlink_exit();</div><div class='ctx'> 	dlm_user_exit();</div><div class='ctx'> 	dlm_config_exit();</div><div class='del'>-	dlm_memory_exit();</div><div class='ctx'> 	dlm_lockspace_exit();</div><div class='del'>-	dlm_lowcomms_exit();</div><div class='add'>+	dlm_midcomms_exit();</div><div class='ctx'> 	dlm_unregister_debugfs();</div><div class='add'>+	dlm_memory_exit();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> module_init(init_dlm);</div><div class='head'>diff --git a/fs/dlm/member.c b/fs/dlm/member.c<br/>index 731d489aa323..c0f557a80a75 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/member.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/member.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/member.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/member.c</a></div><div class='hunk'>@@ -18,9 +18,9 @@</div><div class='ctx'> #include "midcomms.h"</div><div class='ctx'> #include "lowcomms.h"</div><div class='ctx'> </div><div class='del'>-int dlm_slots_version(struct dlm_header *h)</div><div class='add'>+int dlm_slots_version(const struct dlm_header *h)</div><div class='ctx'> {</div><div class='del'>-	if ((h-&gt;h_version &amp; 0x0000FFFF) &lt; DLM_HEADER_SLOTS)</div><div class='add'>+	if ((le32_to_cpu(h-&gt;h_version) &amp; 0x0000FFFF) &lt; DLM_HEADER_SLOTS)</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	return 1;</div><div class='ctx'> }</div><div class='hunk'>@@ -120,18 +120,13 @@ int dlm_slots_copy_in(struct dlm_ls *ls)</div><div class='ctx'> </div><div class='ctx'> 	ro0 = (struct rcom_slot *)(rc-&gt;rc_buf + sizeof(struct rcom_config));</div><div class='ctx'> </div><div class='del'>-	for (i = 0, ro = ro0; i &lt; num_slots; i++, ro++) {</div><div class='del'>-		ro-&gt;ro_nodeid = le32_to_cpu(ro-&gt;ro_nodeid);</div><div class='del'>-		ro-&gt;ro_slot = le16_to_cpu(ro-&gt;ro_slot);</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	log_slots(ls, gen, num_slots, ro0, NULL, 0);</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(memb, &amp;ls-&gt;ls_nodes, list) {</div><div class='ctx'> 		for (i = 0, ro = ro0; i &lt; num_slots; i++, ro++) {</div><div class='del'>-			if (ro-&gt;ro_nodeid != memb-&gt;nodeid)</div><div class='add'>+			if (le32_to_cpu(ro-&gt;ro_nodeid) != memb-&gt;nodeid)</div><div class='ctx'> 				continue;</div><div class='del'>-			memb-&gt;slot = ro-&gt;ro_slot;</div><div class='add'>+			memb-&gt;slot = le16_to_cpu(ro-&gt;ro_slot);</div><div class='ctx'> 			memb-&gt;slot_prev = memb-&gt;slot;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -312,6 +307,21 @@ static void add_ordered_member(struct dlm_ls *ls, struct dlm_member *new)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int add_remote_member(int nodeid)</div><div class='add'>+{</div><div class='add'>+	int error;</div><div class='add'>+</div><div class='add'>+	if (nodeid == dlm_our_nodeid())</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	error = dlm_lowcomms_connect_node(nodeid);</div><div class='add'>+	if (error &lt; 0)</div><div class='add'>+		return error;</div><div class='add'>+</div><div class='add'>+	dlm_midcomms_add_member(nodeid);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int dlm_add_member(struct dlm_ls *ls, struct dlm_config_node *node)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_member *memb;</div><div class='hunk'>@@ -321,16 +331,16 @@ static int dlm_add_member(struct dlm_ls *ls, struct dlm_config_node *node)</div><div class='ctx'> 	if (!memb)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	error = dlm_lowcomms_connect_node(node-&gt;nodeid);</div><div class='add'>+	memb-&gt;nodeid = node-&gt;nodeid;</div><div class='add'>+	memb-&gt;weight = node-&gt;weight;</div><div class='add'>+	memb-&gt;comm_seq = node-&gt;comm_seq;</div><div class='add'>+</div><div class='add'>+	error = add_remote_member(node-&gt;nodeid);</div><div class='ctx'> 	if (error &lt; 0) {</div><div class='ctx'> 		kfree(memb);</div><div class='ctx'> 		return error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	memb-&gt;nodeid = node-&gt;nodeid;</div><div class='del'>-	memb-&gt;weight = node-&gt;weight;</div><div class='del'>-	memb-&gt;comm_seq = node-&gt;comm_seq;</div><div class='del'>-	dlm_midcomms_add_member(node-&gt;nodeid);</div><div class='ctx'> 	add_ordered_member(ls, memb);</div><div class='ctx'> 	ls-&gt;ls_num_nodes++;</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -356,6 +366,8 @@ int dlm_is_member(struct dlm_ls *ls, int nodeid)</div><div class='ctx'> </div><div class='ctx'> int dlm_is_removed(struct dlm_ls *ls, int nodeid)</div><div class='ctx'> {</div><div class='add'>+	WARN_ON_ONCE(!nodeid || nodeid == -1);</div><div class='add'>+</div><div class='ctx'> 	if (find_memb(&amp;ls-&gt;ls_nodes_gone, nodeid))</div><div class='ctx'> 		return 1;</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -375,14 +387,17 @@ static void clear_memb_list(struct list_head *head,</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void clear_members_cb(int nodeid)</div><div class='add'>+static void remove_remote_member(int nodeid)</div><div class='ctx'> {</div><div class='add'>+	if (nodeid == dlm_our_nodeid())</div><div class='add'>+		return;</div><div class='add'>+</div><div class='ctx'> 	dlm_midcomms_remove_member(nodeid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void dlm_clear_members(struct dlm_ls *ls)</div><div class='ctx'> {</div><div class='del'>-	clear_memb_list(&amp;ls-&gt;ls_nodes, clear_members_cb);</div><div class='add'>+	clear_memb_list(&amp;ls-&gt;ls_nodes, remove_remote_member);</div><div class='ctx'> 	ls-&gt;ls_num_nodes = 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -436,18 +451,17 @@ static void make_member_array(struct dlm_ls *ls)</div><div class='ctx'> </div><div class='ctx'> /* send a status request to all members just to establish comms connections */</div><div class='ctx'> </div><div class='del'>-static int ping_members(struct dlm_ls *ls)</div><div class='add'>+static int ping_members(struct dlm_ls *ls, uint64_t seq)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_member *memb;</div><div class='ctx'> 	int error = 0;</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(memb, &amp;ls-&gt;ls_nodes, list) {</div><div class='del'>-		error = dlm_recovery_stopped(ls);</div><div class='del'>-		if (error) {</div><div class='add'>+		if (dlm_recovery_stopped(ls)) {</div><div class='ctx'> 			error = -EINTR;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-		error = dlm_rcom_status(ls, memb-&gt;nodeid, 0);</div><div class='add'>+		error = dlm_rcom_status(ls, memb-&gt;nodeid, 0, seq);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -464,7 +478,8 @@ static void dlm_lsop_recover_prep(struct dlm_ls *ls)</div><div class='ctx'> 	ls-&gt;ls_ops-&gt;recover_prep(ls-&gt;ls_ops_arg);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void dlm_lsop_recover_slot(struct dlm_ls *ls, struct dlm_member *memb)</div><div class='add'>+static void dlm_lsop_recover_slot(struct dlm_ls *ls, struct dlm_member *memb,</div><div class='add'>+				  unsigned int release_recover)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_slot slot;</div><div class='ctx'> 	uint32_t seq;</div><div class='hunk'>@@ -479,9 +494,9 @@ static void dlm_lsop_recover_slot(struct dlm_ls *ls, struct dlm_member *memb)</div><div class='ctx'> 	   we consider the node to have failed (versus</div><div class='ctx'> 	   being removed due to dlm_release_lockspace) */</div><div class='ctx'> </div><div class='del'>-	error = dlm_comm_seq(memb-&gt;nodeid, &amp;seq);</div><div class='add'>+	error = dlm_comm_seq(memb-&gt;nodeid, &amp;seq, false);</div><div class='ctx'> </div><div class='del'>-	if (!error &amp;&amp; seq == memb-&gt;comm_seq)</div><div class='add'>+	if (!release_recover &amp;&amp; !error &amp;&amp; seq == memb-&gt;comm_seq)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	slot.nodeid = memb-&gt;nodeid;</div><div class='hunk'>@@ -538,9 +553,14 @@ int dlm_recover_members(struct dlm_ls *ls, struct dlm_recover *rv, int *neg_out)</div><div class='ctx'> 	struct dlm_member *memb, *safe;</div><div class='ctx'> 	struct dlm_config_node *node;</div><div class='ctx'> 	int i, error, neg = 0, low = -1;</div><div class='add'>+	unsigned int release_recover;</div><div class='ctx'> </div><div class='ctx'> 	/* previously removed members that we've not finished removing need to</div><div class='del'>-	   count as a negative change so the "neg" recovery steps will happen */</div><div class='add'>+	 * count as a negative change so the "neg" recovery steps will happen</div><div class='add'>+	 *</div><div class='add'>+	 * This functionality must report all member changes to lsops or</div><div class='add'>+	 * midcomms layer and must never return before.</div><div class='add'>+	 */</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(memb, &amp;ls-&gt;ls_nodes_gone, list) {</div><div class='ctx'> 		log_rinfo(ls, "prev removed member %d", memb-&gt;nodeid);</div><div class='hunk'>@@ -551,11 +571,21 @@ int dlm_recover_members(struct dlm_ls *ls, struct dlm_recover *rv, int *neg_out)</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry_safe(memb, safe, &amp;ls-&gt;ls_nodes, list) {</div><div class='ctx'> 		node = find_config_node(rv, memb-&gt;nodeid);</div><div class='del'>-		if (node &amp;&amp; !node-&gt;new)</div><div class='add'>+		if (!node) {</div><div class='add'>+			log_error(ls, "remove member %d invalid",</div><div class='add'>+				  memb-&gt;nodeid);</div><div class='add'>+			return -EFAULT;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (!node-&gt;new &amp;&amp; !node-&gt;gone)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		if (!node) {</div><div class='del'>-			log_rinfo(ls, "remove member %d", memb-&gt;nodeid);</div><div class='add'>+		release_recover = 0;</div><div class='add'>+</div><div class='add'>+		if (node-&gt;gone) {</div><div class='add'>+			release_recover = node-&gt;release_recover;</div><div class='add'>+			log_rinfo(ls, "remove member %d%s", memb-&gt;nodeid,</div><div class='add'>+				  release_recover ? " (release_recover)" : "");</div><div class='ctx'> 		} else {</div><div class='ctx'> 			/* removed and re-added */</div><div class='ctx'> 			log_rinfo(ls, "remove member %d comm_seq %u %u",</div><div class='hunk'>@@ -564,18 +594,24 @@ int dlm_recover_members(struct dlm_ls *ls, struct dlm_recover *rv, int *neg_out)</div><div class='ctx'> </div><div class='ctx'> 		neg++;</div><div class='ctx'> 		list_move(&amp;memb-&gt;list, &amp;ls-&gt;ls_nodes_gone);</div><div class='del'>-		dlm_midcomms_remove_member(memb-&gt;nodeid);</div><div class='add'>+		remove_remote_member(memb-&gt;nodeid);</div><div class='ctx'> 		ls-&gt;ls_num_nodes--;</div><div class='del'>-		dlm_lsop_recover_slot(ls, memb);</div><div class='add'>+		dlm_lsop_recover_slot(ls, memb, release_recover);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* add new members to ls_nodes */</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; rv-&gt;nodes_count; i++) {</div><div class='ctx'> 		node = &amp;rv-&gt;nodes[i];</div><div class='add'>+		if (node-&gt;gone)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='ctx'> 		if (dlm_is_member(ls, node-&gt;nodeid))</div><div class='ctx'> 			continue;</div><div class='del'>-		dlm_add_member(ls, node);</div><div class='add'>+		error = dlm_add_member(ls, node);</div><div class='add'>+		if (error)</div><div class='add'>+			return error;</div><div class='add'>+</div><div class='ctx'> 		log_rinfo(ls, "add member %d", node-&gt;nodeid);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -588,20 +624,7 @@ int dlm_recover_members(struct dlm_ls *ls, struct dlm_recover *rv, int *neg_out)</div><div class='ctx'> 	make_member_array(ls);</div><div class='ctx'> 	*neg_out = neg;</div><div class='ctx'> </div><div class='del'>-	error = ping_members(ls);</div><div class='del'>-	/* error -EINTR means that a new recovery action is triggered.</div><div class='del'>-	 * We ignore this recovery action and let run the new one which might</div><div class='del'>-	 * have new member configuration.</div><div class='del'>-	 */</div><div class='del'>-	if (error == -EINTR)</div><div class='del'>-		error = 0;</div><div class='del'>-</div><div class='del'>-	/* new_lockspace() may be waiting to know if the config</div><div class='del'>-	 * is good or bad</div><div class='del'>-	 */</div><div class='del'>-	ls-&gt;ls_members_result = error;</div><div class='del'>-	complete(&amp;ls-&gt;ls_members_done);</div><div class='del'>-</div><div class='add'>+	error = ping_members(ls, rv-&gt;seq);</div><div class='ctx'> 	log_rinfo(ls, "dlm_recover_members %d nodes", ls-&gt;ls_num_nodes);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='hunk'>@@ -624,7 +647,7 @@ int dlm_ls_stop(struct dlm_ls *ls)</div><div class='ctx'> 	 * message to the requestqueue without races.</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;ls-&gt;ls_recv_active);</div><div class='add'>+	write_lock_bh(&amp;ls-&gt;ls_recv_active);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Abort any recovery that's in progress (see RECOVER_STOP,</div><div class='hunk'>@@ -632,18 +655,25 @@ int dlm_ls_stop(struct dlm_ls *ls)</div><div class='ctx'> 	 * dlm to quit any processing (see RUNNING, dlm_locking_stopped()).</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_recover_lock);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_recover_lock);</div><div class='ctx'> 	set_bit(LSFL_RECOVER_STOP, &amp;ls-&gt;ls_flags);</div><div class='ctx'> 	new = test_and_clear_bit(LSFL_RUNNING, &amp;ls-&gt;ls_flags);</div><div class='add'>+	if (new)</div><div class='add'>+		timer_delete_sync(&amp;ls-&gt;ls_scan_timer);</div><div class='ctx'> 	ls-&gt;ls_recover_seq++;</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_recover_lock);</div><div class='add'>+</div><div class='add'>+	/* activate requestqueue and stop processing */</div><div class='add'>+	write_lock_bh(&amp;ls-&gt;ls_requestqueue_lock);</div><div class='add'>+	set_bit(LSFL_RECV_MSG_BLOCKED, &amp;ls-&gt;ls_flags);</div><div class='add'>+	write_unlock_bh(&amp;ls-&gt;ls_requestqueue_lock);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_recover_lock);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Let dlm_recv run again, now any normal messages will be saved on the</div><div class='ctx'> 	 * requestqueue for later.</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='del'>-	up_write(&amp;ls-&gt;ls_recv_active);</div><div class='add'>+	write_unlock_bh(&amp;ls-&gt;ls_recv_active);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * This in_recovery lock does two things:</div><div class='hunk'>@@ -668,20 +698,29 @@ int dlm_ls_stop(struct dlm_ls *ls)</div><div class='ctx'> </div><div class='ctx'> 	dlm_recoverd_suspend(ls);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_recover_lock);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_recover_lock);</div><div class='ctx'> 	kfree(ls-&gt;ls_slots);</div><div class='ctx'> 	ls-&gt;ls_slots = NULL;</div><div class='ctx'> 	ls-&gt;ls_num_slots = 0;</div><div class='ctx'> 	ls-&gt;ls_slots_size = 0;</div><div class='ctx'> 	ls-&gt;ls_recover_status = 0;</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_recover_lock);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_recover_lock);</div><div class='ctx'> </div><div class='ctx'> 	dlm_recoverd_resume(ls);</div><div class='ctx'> </div><div class='ctx'> 	if (!ls-&gt;ls_recover_begin)</div><div class='ctx'> 		ls-&gt;ls_recover_begin = jiffies;</div><div class='ctx'> </div><div class='del'>-	dlm_lsop_recover_prep(ls);</div><div class='add'>+	/* call recover_prep ops only once and not multiple times</div><div class='add'>+	 * for each possible dlm_ls_stop() when recovery is already</div><div class='add'>+	 * stopped.</div><div class='add'>+	 *</div><div class='add'>+	 * If we successful was able to clear LSFL_RUNNING bit and</div><div class='add'>+	 * it was set we know it is the first dlm_ls_stop() call.</div><div class='add'>+	 */</div><div class='add'>+	if (new)</div><div class='add'>+		dlm_lsop_recover_prep(ls);</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -699,12 +738,12 @@ int dlm_ls_start(struct dlm_ls *ls)</div><div class='ctx'> 	if (error &lt; 0)</div><div class='ctx'> 		goto fail_rv;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_recover_lock);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_recover_lock);</div><div class='ctx'> </div><div class='ctx'> 	/* the lockspace needs to be stopped before it can be started */</div><div class='ctx'> </div><div class='ctx'> 	if (!dlm_locking_stopped(ls)) {</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_recover_lock);</div><div class='add'>+		spin_unlock_bh(&amp;ls-&gt;ls_recover_lock);</div><div class='ctx'> 		log_error(ls, "start ignored: lockspace running");</div><div class='ctx'> 		error = -EINVAL;</div><div class='ctx'> 		goto fail;</div><div class='hunk'>@@ -715,7 +754,7 @@ int dlm_ls_start(struct dlm_ls *ls)</div><div class='ctx'> 	rv-&gt;seq = ++ls-&gt;ls_recover_seq;</div><div class='ctx'> 	rv_old = ls-&gt;ls_recover_args;</div><div class='ctx'> 	ls-&gt;ls_recover_args = rv;</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_recover_lock);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_recover_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (rv_old) {</div><div class='ctx'> 		log_error(ls, "unused recovery %llx %d",</div><div class='head'>diff --git a/fs/dlm/member.h b/fs/dlm/member.h<br/>index 433b2fac9f4a..f61cfde46314 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/member.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/member.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/member.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/member.h</a></div><div class='hunk'>@@ -18,7 +18,7 @@ void dlm_clear_members_gone(struct dlm_ls *ls);</div><div class='ctx'> int dlm_recover_members(struct dlm_ls *ls, struct dlm_recover *rv,int *neg_out);</div><div class='ctx'> int dlm_is_removed(struct dlm_ls *ls, int nodeid);</div><div class='ctx'> int dlm_is_member(struct dlm_ls *ls, int nodeid);</div><div class='del'>-int dlm_slots_version(struct dlm_header *h);</div><div class='add'>+int dlm_slots_version(const struct dlm_header *h);</div><div class='ctx'> void dlm_slot_save(struct dlm_ls *ls, struct dlm_rcom *rc,</div><div class='ctx'> 		   struct dlm_member *memb);</div><div class='ctx'> void dlm_slots_copy_out(struct dlm_ls *ls, struct dlm_rcom *rc);</div><div class='head'>diff --git a/fs/dlm/memory.c b/fs/dlm/memory.c<br/>index 5918f4d39586..5c35cc67aca4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/memory.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/memory.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/memory.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/memory.c</a></div><div class='hunk'>@@ -10,42 +10,81 @@</div><div class='ctx'> ******************************************************************************/</div><div class='ctx'> </div><div class='ctx'> #include "dlm_internal.h"</div><div class='add'>+#include "midcomms.h"</div><div class='add'>+#include "lowcomms.h"</div><div class='ctx'> #include "config.h"</div><div class='ctx'> #include "memory.h"</div><div class='add'>+#include "ast.h"</div><div class='ctx'> </div><div class='add'>+static struct kmem_cache *writequeue_cache;</div><div class='add'>+static struct kmem_cache *mhandle_cache;</div><div class='add'>+static struct kmem_cache *msg_cache;</div><div class='ctx'> static struct kmem_cache *lkb_cache;</div><div class='ctx'> static struct kmem_cache *rsb_cache;</div><div class='add'>+static struct kmem_cache *cb_cache;</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> int __init dlm_memory_init(void)</div><div class='ctx'> {</div><div class='add'>+	writequeue_cache = dlm_lowcomms_writequeue_cache_create();</div><div class='add'>+	if (!writequeue_cache)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	mhandle_cache = dlm_midcomms_cache_create();</div><div class='add'>+	if (!mhandle_cache)</div><div class='add'>+		goto mhandle;</div><div class='add'>+</div><div class='ctx'> 	lkb_cache = kmem_cache_create("dlm_lkb", sizeof(struct dlm_lkb),</div><div class='ctx'> 				__alignof__(struct dlm_lkb), 0, NULL);</div><div class='ctx'> 	if (!lkb_cache)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+		goto lkb;</div><div class='add'>+</div><div class='add'>+	msg_cache = dlm_lowcomms_msg_cache_create();</div><div class='add'>+	if (!msg_cache)</div><div class='add'>+		goto msg;</div><div class='ctx'> </div><div class='ctx'> 	rsb_cache = kmem_cache_create("dlm_rsb", sizeof(struct dlm_rsb),</div><div class='ctx'> 				__alignof__(struct dlm_rsb), 0, NULL);</div><div class='del'>-	if (!rsb_cache) {</div><div class='del'>-		kmem_cache_destroy(lkb_cache);</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	}</div><div class='add'>+	if (!rsb_cache)</div><div class='add'>+		goto rsb;</div><div class='add'>+</div><div class='add'>+	cb_cache = kmem_cache_create("dlm_cb", sizeof(struct dlm_callback),</div><div class='add'>+				     __alignof__(struct dlm_callback), 0,</div><div class='add'>+				     NULL);</div><div class='add'>+	if (!cb_cache)</div><div class='add'>+		goto cb;</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='add'>+</div><div class='add'>+cb:</div><div class='add'>+	kmem_cache_destroy(rsb_cache);</div><div class='add'>+rsb:</div><div class='add'>+	kmem_cache_destroy(msg_cache);</div><div class='add'>+msg:</div><div class='add'>+	kmem_cache_destroy(lkb_cache);</div><div class='add'>+lkb:</div><div class='add'>+	kmem_cache_destroy(mhandle_cache);</div><div class='add'>+mhandle:</div><div class='add'>+	kmem_cache_destroy(writequeue_cache);</div><div class='add'>+out:</div><div class='add'>+	return -ENOMEM;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void dlm_memory_exit(void)</div><div class='ctx'> {</div><div class='add'>+	rcu_barrier();</div><div class='add'>+</div><div class='add'>+	kmem_cache_destroy(writequeue_cache);</div><div class='add'>+	kmem_cache_destroy(mhandle_cache);</div><div class='add'>+	kmem_cache_destroy(msg_cache);</div><div class='ctx'> 	kmem_cache_destroy(lkb_cache);</div><div class='ctx'> 	kmem_cache_destroy(rsb_cache);</div><div class='add'>+	kmem_cache_destroy(cb_cache);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> char *dlm_allocate_lvb(struct dlm_ls *ls)</div><div class='ctx'> {</div><div class='del'>-	char *p;</div><div class='del'>-</div><div class='del'>-	p = kzalloc(ls-&gt;ls_lvblen, GFP_NOFS);</div><div class='del'>-	return p;</div><div class='add'>+	return kzalloc(ls-&gt;ls_lvblen, GFP_ATOMIC);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void dlm_free_lvb(char *p)</div><div class='hunk'>@@ -53,32 +92,34 @@ void dlm_free_lvb(char *p)</div><div class='ctx'> 	kfree(p);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct dlm_rsb *dlm_allocate_rsb(struct dlm_ls *ls)</div><div class='add'>+struct dlm_rsb *dlm_allocate_rsb(void)</div><div class='ctx'> {</div><div class='del'>-	struct dlm_rsb *r;</div><div class='del'>-</div><div class='del'>-	r = kmem_cache_zalloc(rsb_cache, GFP_NOFS);</div><div class='del'>-	return r;</div><div class='add'>+	return kmem_cache_zalloc(rsb_cache, GFP_ATOMIC);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void dlm_free_rsb(struct dlm_rsb *r)</div><div class='add'>+static void __free_rsb_rcu(struct rcu_head *rcu)</div><div class='ctx'> {</div><div class='add'>+	struct dlm_rsb *r = container_of(rcu, struct dlm_rsb, rcu);</div><div class='ctx'> 	if (r-&gt;res_lvbptr)</div><div class='ctx'> 		dlm_free_lvb(r-&gt;res_lvbptr);</div><div class='ctx'> 	kmem_cache_free(rsb_cache, r);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct dlm_lkb *dlm_allocate_lkb(struct dlm_ls *ls)</div><div class='add'>+void dlm_free_rsb(struct dlm_rsb *r)</div><div class='ctx'> {</div><div class='del'>-	struct dlm_lkb *lkb;</div><div class='add'>+	call_rcu(&amp;r-&gt;rcu, __free_rsb_rcu);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	lkb = kmem_cache_zalloc(lkb_cache, GFP_NOFS);</div><div class='del'>-	return lkb;</div><div class='add'>+struct dlm_lkb *dlm_allocate_lkb(void)</div><div class='add'>+{</div><div class='add'>+	return kmem_cache_zalloc(lkb_cache, GFP_ATOMIC);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void dlm_free_lkb(struct dlm_lkb *lkb)</div><div class='add'>+static void __free_lkb_rcu(struct rcu_head *rcu)</div><div class='ctx'> {</div><div class='del'>-	if (lkb-&gt;lkb_flags &amp; DLM_IFL_USER) {</div><div class='add'>+	struct dlm_lkb *lkb = container_of(rcu, struct dlm_lkb, rcu);</div><div class='add'>+</div><div class='add'>+	if (test_bit(DLM_DFL_USER_BIT, &amp;lkb-&gt;lkb_dflags)) {</div><div class='ctx'> 		struct dlm_user_args *ua;</div><div class='ctx'> 		ua = lkb-&gt;lkb_ua;</div><div class='ctx'> 		if (ua) {</div><div class='hunk'>@@ -86,6 +127,51 @@ void dlm_free_lkb(struct dlm_lkb *lkb)</div><div class='ctx'> 			kfree(ua);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> 	kmem_cache_free(lkb_cache, lkb);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void dlm_free_lkb(struct dlm_lkb *lkb)</div><div class='add'>+{</div><div class='add'>+	call_rcu(&amp;lkb-&gt;rcu, __free_lkb_rcu);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct dlm_mhandle *dlm_allocate_mhandle(void)</div><div class='add'>+{</div><div class='add'>+	return kmem_cache_alloc(mhandle_cache, GFP_ATOMIC);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void dlm_free_mhandle(struct dlm_mhandle *mhandle)</div><div class='add'>+{</div><div class='add'>+	kmem_cache_free(mhandle_cache, mhandle);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct writequeue_entry *dlm_allocate_writequeue(void)</div><div class='add'>+{</div><div class='add'>+	return kmem_cache_alloc(writequeue_cache, GFP_ATOMIC);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void dlm_free_writequeue(struct writequeue_entry *writequeue)</div><div class='add'>+{</div><div class='add'>+	kmem_cache_free(writequeue_cache, writequeue);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct dlm_msg *dlm_allocate_msg(void)</div><div class='add'>+{</div><div class='add'>+	return kmem_cache_alloc(msg_cache, GFP_ATOMIC);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void dlm_free_msg(struct dlm_msg *msg)</div><div class='add'>+{</div><div class='add'>+	kmem_cache_free(msg_cache, msg);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct dlm_callback *dlm_allocate_cb(void)</div><div class='add'>+{</div><div class='add'>+	return kmem_cache_alloc(cb_cache, GFP_ATOMIC);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void dlm_free_cb(struct dlm_callback *cb)</div><div class='add'>+{</div><div class='add'>+	kmem_cache_free(cb_cache, cb);</div><div class='add'>+}</div><div class='head'>diff --git a/fs/dlm/memory.h b/fs/dlm/memory.h<br/>index 4f218ea4b187..551b6b788489 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/memory.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/memory.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/memory.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/memory.h</a></div><div class='hunk'>@@ -14,12 +14,20 @@</div><div class='ctx'> </div><div class='ctx'> int dlm_memory_init(void);</div><div class='ctx'> void dlm_memory_exit(void);</div><div class='del'>-struct dlm_rsb *dlm_allocate_rsb(struct dlm_ls *ls);</div><div class='add'>+struct dlm_rsb *dlm_allocate_rsb(void);</div><div class='ctx'> void dlm_free_rsb(struct dlm_rsb *r);</div><div class='del'>-struct dlm_lkb *dlm_allocate_lkb(struct dlm_ls *ls);</div><div class='add'>+struct dlm_lkb *dlm_allocate_lkb(void);</div><div class='ctx'> void dlm_free_lkb(struct dlm_lkb *l);</div><div class='ctx'> char *dlm_allocate_lvb(struct dlm_ls *ls);</div><div class='ctx'> void dlm_free_lvb(char *l);</div><div class='add'>+struct dlm_mhandle *dlm_allocate_mhandle(void);</div><div class='add'>+void dlm_free_mhandle(struct dlm_mhandle *mhandle);</div><div class='add'>+struct writequeue_entry *dlm_allocate_writequeue(void);</div><div class='add'>+void dlm_free_writequeue(struct writequeue_entry *writequeue);</div><div class='add'>+struct dlm_msg *dlm_allocate_msg(void);</div><div class='add'>+void dlm_free_msg(struct dlm_msg *msg);</div><div class='add'>+struct dlm_callback *dlm_allocate_cb(void);</div><div class='add'>+void dlm_free_cb(struct dlm_callback *cb);</div><div class='ctx'> </div><div class='ctx'> #endif		/* __MEMORY_DOT_H__ */</div><div class='ctx'> </div><div class='head'>diff --git a/fs/dlm/midcomms.c b/fs/dlm/midcomms.c<br/>index 7ae39ec8d9b0..2c101bbe261a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/midcomms.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/midcomms.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/midcomms.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/midcomms.c</a></div><div class='hunk'>@@ -132,26 +132,30 @@</div><div class='ctx'>  */</div><div class='ctx'> #define DLM_DEBUG_FENCE_TERMINATION	0</div><div class='ctx'> </div><div class='add'>+#include &lt;trace/events/dlm.h&gt;</div><div class='ctx'> #include &lt;net/tcp.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "dlm_internal.h"</div><div class='ctx'> #include "lowcomms.h"</div><div class='ctx'> #include "config.h"</div><div class='add'>+#include "memory.h"</div><div class='ctx'> #include "lock.h"</div><div class='ctx'> #include "util.h"</div><div class='ctx'> #include "midcomms.h"</div><div class='ctx'> </div><div class='ctx'> /* init value for sequence numbers for testing purpose only e.g. overflows */</div><div class='ctx'> #define DLM_SEQ_INIT		0</div><div class='del'>-/* 3 minutes wait to sync ending of dlm */</div><div class='del'>-#define DLM_SHUTDOWN_TIMEOUT	msecs_to_jiffies(3 * 60 * 1000)</div><div class='add'>+/* 5 seconds wait to sync ending of dlm */</div><div class='add'>+#define DLM_SHUTDOWN_TIMEOUT	msecs_to_jiffies(5000)</div><div class='ctx'> #define DLM_VERSION_NOT_SET	0</div><div class='add'>+#define DLM_SEND_ACK_BACK_MSG_THRESHOLD 32</div><div class='add'>+#define DLM_RECV_ACK_BACK_MSG_THRESHOLD (DLM_SEND_ACK_BACK_MSG_THRESHOLD * 8)</div><div class='ctx'> </div><div class='ctx'> struct midcomms_node {</div><div class='ctx'> 	int nodeid;</div><div class='ctx'> 	uint32_t version;</div><div class='del'>-	uint32_t seq_send;</div><div class='del'>-	uint32_t seq_next;</div><div class='add'>+	atomic_t seq_send;</div><div class='add'>+	atomic_t seq_next;</div><div class='ctx'> 	/* These queues are unbound because we cannot drop any message in dlm.</div><div class='ctx'> 	 * We could send a fence signal for a specific node to the cluster</div><div class='ctx'> 	 * manager if queues hits some maximum value, however this handling</div><div class='hunk'>@@ -163,7 +167,7 @@ struct midcomms_node {</div><div class='ctx'> #define DLM_NODE_FLAG_CLOSE	1</div><div class='ctx'> #define DLM_NODE_FLAG_STOP_TX	2</div><div class='ctx'> #define DLM_NODE_FLAG_STOP_RX	3</div><div class='del'>-#define DLM_NODE_ULP_DELIVERED	4</div><div class='add'>+	atomic_t ulp_delivered;</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> 	wait_queue_head_t shutdown_wait;</div><div class='ctx'> </div><div class='hunk'>@@ -192,7 +196,7 @@ struct midcomms_node {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct dlm_mhandle {</div><div class='del'>-	const struct dlm_header *inner_hd;</div><div class='add'>+	const union dlm_packet *inner_p;</div><div class='ctx'> 	struct midcomms_node *node;</div><div class='ctx'> 	struct dlm_opts *opts;</div><div class='ctx'> 	struct dlm_msg *msg;</div><div class='hunk'>@@ -220,6 +224,11 @@ DEFINE_STATIC_SRCU(nodes_srcu);</div><div class='ctx'>  */</div><div class='ctx'> static DEFINE_MUTEX(close_lock);</div><div class='ctx'> </div><div class='add'>+struct kmem_cache *dlm_midcomms_cache_create(void)</div><div class='add'>+{</div><div class='add'>+	return KMEM_CACHE(dlm_mhandle, 0);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline const char *dlm_state_str(int state)</div><div class='ctx'> {</div><div class='ctx'> 	switch (state) {</div><div class='hunk'>@@ -279,7 +288,7 @@ static void dlm_mhandle_release(struct rcu_head *rcu)</div><div class='ctx'> 	struct dlm_mhandle *mh = container_of(rcu, struct dlm_mhandle, rcu);</div><div class='ctx'> </div><div class='ctx'> 	dlm_lowcomms_put_msg(mh-&gt;msg);</div><div class='del'>-	kfree(mh);</div><div class='add'>+	dlm_free_mhandle(mh);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void dlm_mhandle_delete(struct midcomms_node *node,</div><div class='hunk'>@@ -297,11 +306,11 @@ static void dlm_send_queue_flush(struct midcomms_node *node)</div><div class='ctx'> 	pr_debug("flush midcomms send queue of node %d\n", node-&gt;nodeid);</div><div class='ctx'> </div><div class='ctx'> 	rcu_read_lock();</div><div class='del'>-	spin_lock(&amp;node-&gt;send_queue_lock);</div><div class='add'>+	spin_lock_bh(&amp;node-&gt;send_queue_lock);</div><div class='ctx'> 	list_for_each_entry_rcu(mh, &amp;node-&gt;send_queue, list) {</div><div class='ctx'> 		dlm_mhandle_delete(node, mh);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;node-&gt;send_queue_lock);</div><div class='add'>+	spin_unlock_bh(&amp;node-&gt;send_queue_lock);</div><div class='ctx'> 	rcu_read_unlock();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -309,8 +318,9 @@ static void midcomms_node_reset(struct midcomms_node *node)</div><div class='ctx'> {</div><div class='ctx'> 	pr_debug("reset node %d\n", node-&gt;nodeid);</div><div class='ctx'> </div><div class='del'>-	node-&gt;seq_next = DLM_SEQ_INIT;</div><div class='del'>-	node-&gt;seq_send = DLM_SEQ_INIT;</div><div class='add'>+	atomic_set(&amp;node-&gt;seq_next, DLM_SEQ_INIT);</div><div class='add'>+	atomic_set(&amp;node-&gt;seq_send, DLM_SEQ_INIT);</div><div class='add'>+	atomic_set(&amp;node-&gt;ulp_delivered, 0);</div><div class='ctx'> 	node-&gt;version = DLM_VERSION_NOT_SET;</div><div class='ctx'> 	node-&gt;flags = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -319,18 +329,31 @@ static void midcomms_node_reset(struct midcomms_node *node)</div><div class='ctx'> 	wake_up(&amp;node-&gt;shutdown_wait);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct midcomms_node *nodeid2node(int nodeid, gfp_t alloc)</div><div class='add'>+static struct midcomms_node *nodeid2node(int nodeid)</div><div class='ctx'> {</div><div class='del'>-	struct midcomms_node *node, *tmp;</div><div class='del'>-	int r = nodeid_hash(nodeid);</div><div class='add'>+	return __find_node(nodeid, nodeid_hash(nodeid));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int dlm_midcomms_addr(int nodeid, struct sockaddr_storage *addr)</div><div class='add'>+{</div><div class='add'>+	int ret, idx, r = nodeid_hash(nodeid);</div><div class='add'>+	struct midcomms_node *node;</div><div class='ctx'> </div><div class='add'>+	ret = dlm_lowcomms_addr(nodeid, addr);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	idx = srcu_read_lock(&amp;nodes_srcu);</div><div class='ctx'> 	node = __find_node(nodeid, r);</div><div class='del'>-	if (node || !alloc)</div><div class='del'>-		return node;</div><div class='add'>+	if (node) {</div><div class='add'>+		srcu_read_unlock(&amp;nodes_srcu, idx);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+	srcu_read_unlock(&amp;nodes_srcu, idx);</div><div class='ctx'> </div><div class='del'>-	node = kmalloc(sizeof(*node), alloc);</div><div class='add'>+	node = kmalloc(sizeof(*node), GFP_NOFS);</div><div class='ctx'> 	if (!node)</div><div class='del'>-		return NULL;</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	node-&gt;nodeid = nodeid;</div><div class='ctx'> 	spin_lock_init(&amp;node-&gt;state_lock);</div><div class='hunk'>@@ -341,22 +364,12 @@ static struct midcomms_node *nodeid2node(int nodeid, gfp_t alloc)</div><div class='ctx'> 	node-&gt;users = 0;</div><div class='ctx'> 	midcomms_node_reset(node);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;nodes_lock);</div><div class='del'>-	/* check again if there was somebody else</div><div class='del'>-	 * earlier here to add the node</div><div class='del'>-	 */</div><div class='del'>-	tmp = __find_node(nodeid, r);</div><div class='del'>-	if (tmp) {</div><div class='del'>-		spin_unlock(&amp;nodes_lock);</div><div class='del'>-		kfree(node);</div><div class='del'>-		return tmp;</div><div class='del'>-	}</div><div class='del'>-</div><div class='add'>+	spin_lock_bh(&amp;nodes_lock);</div><div class='ctx'> 	hlist_add_head_rcu(&amp;node-&gt;hlist, &amp;node_hash[r]);</div><div class='del'>-	spin_unlock(&amp;nodes_lock);</div><div class='add'>+	spin_unlock_bh(&amp;nodes_lock);</div><div class='ctx'> </div><div class='ctx'> 	node-&gt;debugfs = dlm_create_debug_comms_file(nodeid, node);</div><div class='del'>-	return node;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int dlm_send_ack(int nodeid, uint32_t seq)</div><div class='hunk'>@@ -366,26 +379,46 @@ static int dlm_send_ack(int nodeid, uint32_t seq)</div><div class='ctx'> 	struct dlm_msg *msg;</div><div class='ctx'> 	char *ppc;</div><div class='ctx'> </div><div class='del'>-	msg = dlm_lowcomms_new_msg(nodeid, mb_len, GFP_NOFS, &amp;ppc,</div><div class='del'>-				   NULL, NULL);</div><div class='add'>+	msg = dlm_lowcomms_new_msg(nodeid, mb_len, &amp;ppc, NULL, NULL);</div><div class='ctx'> 	if (!msg)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	m_header = (struct dlm_header *)ppc;</div><div class='ctx'> </div><div class='del'>-	m_header-&gt;h_version = (DLM_HEADER_MAJOR | DLM_HEADER_MINOR);</div><div class='del'>-	m_header-&gt;h_nodeid = dlm_our_nodeid();</div><div class='del'>-	m_header-&gt;h_length = mb_len;</div><div class='add'>+	m_header-&gt;h_version = cpu_to_le32(DLM_HEADER_MAJOR | DLM_HEADER_MINOR);</div><div class='add'>+	m_header-&gt;h_nodeid = cpu_to_le32(dlm_our_nodeid());</div><div class='add'>+	m_header-&gt;h_length = cpu_to_le16(mb_len);</div><div class='ctx'> 	m_header-&gt;h_cmd = DLM_ACK;</div><div class='del'>-	m_header-&gt;u.h_seq = seq;</div><div class='add'>+	m_header-&gt;u.h_seq = cpu_to_le32(seq);</div><div class='ctx'> </div><div class='del'>-	header_out(m_header);</div><div class='ctx'> 	dlm_lowcomms_commit_msg(msg);</div><div class='ctx'> 	dlm_lowcomms_put_msg(msg);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void dlm_send_ack_threshold(struct midcomms_node *node,</div><div class='add'>+				   uint32_t threshold)</div><div class='add'>+{</div><div class='add'>+	uint32_t oval, nval;</div><div class='add'>+	bool send_ack;</div><div class='add'>+</div><div class='add'>+	/* let only send one user trigger threshold to send ack back */</div><div class='add'>+	do {</div><div class='add'>+		oval = atomic_read(&amp;node-&gt;ulp_delivered);</div><div class='add'>+		send_ack = (oval &gt; threshold);</div><div class='add'>+		/* abort if threshold is not reached */</div><div class='add'>+		if (!send_ack)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		nval = 0;</div><div class='add'>+		/* try to reset ulp_delivered counter */</div><div class='add'>+	} while (atomic_cmpxchg(&amp;node-&gt;ulp_delivered, oval, nval) != oval);</div><div class='add'>+</div><div class='add'>+	if (send_ack)</div><div class='add'>+		dlm_send_ack(node-&gt;nodeid, atomic_read(&amp;node-&gt;seq_next));</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int dlm_send_fin(struct midcomms_node *node,</div><div class='ctx'> 			void (*ack_rcv)(struct midcomms_node *node))</div><div class='ctx'> {</div><div class='hunk'>@@ -394,24 +427,22 @@ static int dlm_send_fin(struct midcomms_node *node,</div><div class='ctx'> 	struct dlm_mhandle *mh;</div><div class='ctx'> 	char *ppc;</div><div class='ctx'> </div><div class='del'>-	mh = dlm_midcomms_get_mhandle(node-&gt;nodeid, mb_len, GFP_NOFS, &amp;ppc);</div><div class='add'>+	mh = dlm_midcomms_get_mhandle(node-&gt;nodeid, mb_len, &amp;ppc);</div><div class='ctx'> 	if (!mh)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='add'>+	set_bit(DLM_NODE_FLAG_STOP_TX, &amp;node-&gt;flags);</div><div class='ctx'> 	mh-&gt;ack_rcv = ack_rcv;</div><div class='ctx'> </div><div class='ctx'> 	m_header = (struct dlm_header *)ppc;</div><div class='ctx'> </div><div class='del'>-	m_header-&gt;h_version = (DLM_HEADER_MAJOR | DLM_HEADER_MINOR);</div><div class='del'>-	m_header-&gt;h_nodeid = dlm_our_nodeid();</div><div class='del'>-	m_header-&gt;h_length = mb_len;</div><div class='add'>+	m_header-&gt;h_version = cpu_to_le32(DLM_HEADER_MAJOR | DLM_HEADER_MINOR);</div><div class='add'>+	m_header-&gt;h_nodeid = cpu_to_le32(dlm_our_nodeid());</div><div class='add'>+	m_header-&gt;h_length = cpu_to_le16(mb_len);</div><div class='ctx'> 	m_header-&gt;h_cmd = DLM_FIN;</div><div class='ctx'> </div><div class='del'>-	header_out(m_header);</div><div class='del'>-</div><div class='ctx'> 	pr_debug("sending fin msg to node %d\n", node-&gt;nodeid);</div><div class='del'>-	dlm_midcomms_commit_mhandle(mh);</div><div class='del'>-	set_bit(DLM_NODE_FLAG_STOP_TX, &amp;node-&gt;flags);</div><div class='add'>+	dlm_midcomms_commit_mhandle(mh, NULL, 0);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -431,7 +462,7 @@ static void dlm_receive_ack(struct midcomms_node *node, uint32_t seq)</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;node-&gt;send_queue_lock);</div><div class='add'>+	spin_lock_bh(&amp;node-&gt;send_queue_lock);</div><div class='ctx'> 	list_for_each_entry_rcu(mh, &amp;node-&gt;send_queue, list) {</div><div class='ctx'> 		if (before(mh-&gt;seq, seq)) {</div><div class='ctx'> 			dlm_mhandle_delete(node, mh);</div><div class='hunk'>@@ -440,13 +471,13 @@ static void dlm_receive_ack(struct midcomms_node *node, uint32_t seq)</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;node-&gt;send_queue_lock);</div><div class='add'>+	spin_unlock_bh(&amp;node-&gt;send_queue_lock);</div><div class='ctx'> 	rcu_read_unlock();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void dlm_pas_fin_ack_rcv(struct midcomms_node *node)</div><div class='ctx'> {</div><div class='del'>-	spin_lock(&amp;node-&gt;state_lock);</div><div class='add'>+	spin_lock_bh(&amp;node-&gt;state_lock);</div><div class='ctx'> 	pr_debug("receive passive fin ack from node %d with state %s\n",</div><div class='ctx'> 		 node-&gt;nodeid, dlm_state_str(node-&gt;state));</div><div class='ctx'> </div><div class='hunk'>@@ -460,36 +491,57 @@ static void dlm_pas_fin_ack_rcv(struct midcomms_node *node)</div><div class='ctx'> 		wake_up(&amp;node-&gt;shutdown_wait);</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='del'>-		spin_unlock(&amp;node-&gt;state_lock);</div><div class='del'>-		log_print("%s: unexpected state: %d\n",</div><div class='add'>+		spin_unlock_bh(&amp;node-&gt;state_lock);</div><div class='add'>+		log_print("%s: unexpected state: %d",</div><div class='ctx'> 			  __func__, node-&gt;state);</div><div class='del'>-		WARN_ON(1);</div><div class='add'>+		WARN_ON_ONCE(1);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;node-&gt;state_lock);</div><div class='add'>+	spin_unlock_bh(&amp;node-&gt;state_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void dlm_receive_buffer_3_2_trace(uint32_t seq,</div><div class='add'>+					 const union dlm_packet *p)</div><div class='add'>+{</div><div class='add'>+	switch (p-&gt;header.h_cmd) {</div><div class='add'>+	case DLM_MSG:</div><div class='add'>+		trace_dlm_recv_message(dlm_our_nodeid(), seq, &amp;p-&gt;message);</div><div class='add'>+		break;</div><div class='add'>+	case DLM_RCOM:</div><div class='add'>+		trace_dlm_recv_rcom(dlm_our_nodeid(), seq, &amp;p-&gt;rcom);</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void dlm_midcomms_receive_buffer(union dlm_packet *p,</div><div class='add'>+static void dlm_midcomms_receive_buffer(const union dlm_packet *p,</div><div class='ctx'> 					struct midcomms_node *node,</div><div class='ctx'> 					uint32_t seq)</div><div class='ctx'> {</div><div class='del'>-	if (seq == node-&gt;seq_next) {</div><div class='del'>-		node-&gt;seq_next++;</div><div class='add'>+	bool is_expected_seq;</div><div class='add'>+	uint32_t oval, nval;</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		oval = atomic_read(&amp;node-&gt;seq_next);</div><div class='add'>+		is_expected_seq = (oval == seq);</div><div class='add'>+		if (!is_expected_seq)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		nval = oval + 1;</div><div class='add'>+	} while (atomic_cmpxchg(&amp;node-&gt;seq_next, oval, nval) != oval);</div><div class='ctx'> </div><div class='add'>+	if (is_expected_seq) {</div><div class='ctx'> 		switch (p-&gt;header.h_cmd) {</div><div class='ctx'> 		case DLM_FIN:</div><div class='del'>-			/* send ack before fin */</div><div class='del'>-			dlm_send_ack(node-&gt;nodeid, node-&gt;seq_next);</div><div class='del'>-</div><div class='del'>-			spin_lock(&amp;node-&gt;state_lock);</div><div class='add'>+			spin_lock_bh(&amp;node-&gt;state_lock);</div><div class='ctx'> 			pr_debug("receive fin msg from node %d with state %s\n",</div><div class='ctx'> 				 node-&gt;nodeid, dlm_state_str(node-&gt;state));</div><div class='ctx'> </div><div class='ctx'> 			switch (node-&gt;state) {</div><div class='ctx'> 			case DLM_ESTABLISHED:</div><div class='del'>-				node-&gt;state = DLM_CLOSE_WAIT;</div><div class='del'>-				pr_debug("switch node %d to state %s\n",</div><div class='del'>-					 node-&gt;nodeid, dlm_state_str(node-&gt;state));</div><div class='add'>+				dlm_send_ack(node-&gt;nodeid, nval);</div><div class='add'>+</div><div class='ctx'> 				/* passive shutdown DLM_LAST_ACK case 1</div><div class='ctx'> 				 * additional we check if the node is used by</div><div class='ctx'> 				 * cluster manager events at all.</div><div class='hunk'>@@ -498,173 +550,62 @@ static void dlm_midcomms_receive_buffer(union dlm_packet *p,</div><div class='ctx'> 					node-&gt;state = DLM_LAST_ACK;</div><div class='ctx'> 					pr_debug("switch node %d to state %s case 1\n",</div><div class='ctx'> 						 node-&gt;nodeid, dlm_state_str(node-&gt;state));</div><div class='del'>-					spin_unlock(&amp;node-&gt;state_lock);</div><div class='del'>-					goto send_fin;</div><div class='add'>+					set_bit(DLM_NODE_FLAG_STOP_RX, &amp;node-&gt;flags);</div><div class='add'>+					dlm_send_fin(node, dlm_pas_fin_ack_rcv);</div><div class='add'>+				} else {</div><div class='add'>+					node-&gt;state = DLM_CLOSE_WAIT;</div><div class='add'>+					pr_debug("switch node %d to state %s\n",</div><div class='add'>+						 node-&gt;nodeid, dlm_state_str(node-&gt;state));</div><div class='ctx'> 				}</div><div class='ctx'> 				break;</div><div class='ctx'> 			case DLM_FIN_WAIT1:</div><div class='add'>+				dlm_send_ack(node-&gt;nodeid, nval);</div><div class='ctx'> 				node-&gt;state = DLM_CLOSING;</div><div class='add'>+				set_bit(DLM_NODE_FLAG_STOP_RX, &amp;node-&gt;flags);</div><div class='ctx'> 				pr_debug("switch node %d to state %s\n",</div><div class='ctx'> 					 node-&gt;nodeid, dlm_state_str(node-&gt;state));</div><div class='ctx'> 				break;</div><div class='ctx'> 			case DLM_FIN_WAIT2:</div><div class='add'>+				dlm_send_ack(node-&gt;nodeid, nval);</div><div class='ctx'> 				midcomms_node_reset(node);</div><div class='ctx'> 				pr_debug("switch node %d to state %s\n",</div><div class='ctx'> 					 node-&gt;nodeid, dlm_state_str(node-&gt;state));</div><div class='del'>-				wake_up(&amp;node-&gt;shutdown_wait);</div><div class='ctx'> 				break;</div><div class='ctx'> 			case DLM_LAST_ACK:</div><div class='ctx'> 				/* probably remove_member caught it, do nothing */</div><div class='ctx'> 				break;</div><div class='ctx'> 			default:</div><div class='del'>-				spin_unlock(&amp;node-&gt;state_lock);</div><div class='del'>-				log_print("%s: unexpected state: %d\n",</div><div class='add'>+				spin_unlock_bh(&amp;node-&gt;state_lock);</div><div class='add'>+				log_print("%s: unexpected state: %d",</div><div class='ctx'> 					  __func__, node-&gt;state);</div><div class='del'>-				WARN_ON(1);</div><div class='add'>+				WARN_ON_ONCE(1);</div><div class='ctx'> 				return;</div><div class='ctx'> 			}</div><div class='del'>-			spin_unlock(&amp;node-&gt;state_lock);</div><div class='del'>-</div><div class='del'>-			set_bit(DLM_NODE_FLAG_STOP_RX, &amp;node-&gt;flags);</div><div class='add'>+			spin_unlock_bh(&amp;node-&gt;state_lock);</div><div class='ctx'> 			break;</div><div class='ctx'> 		default:</div><div class='del'>-			WARN_ON(test_bit(DLM_NODE_FLAG_STOP_RX, &amp;node-&gt;flags));</div><div class='add'>+			WARN_ON_ONCE(test_bit(DLM_NODE_FLAG_STOP_RX, &amp;node-&gt;flags));</div><div class='add'>+			dlm_receive_buffer_3_2_trace(seq, p);</div><div class='ctx'> 			dlm_receive_buffer(p, node-&gt;nodeid);</div><div class='del'>-			set_bit(DLM_NODE_ULP_DELIVERED, &amp;node-&gt;flags);</div><div class='add'>+			atomic_inc(&amp;node-&gt;ulp_delivered);</div><div class='add'>+			/* unlikely case to send ack back when we don't transmit */</div><div class='add'>+			dlm_send_ack_threshold(node, DLM_RECV_ACK_BACK_MSG_THRESHOLD);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='ctx'> 		/* retry to ack message which we already have by sending back</div><div class='ctx'> 		 * current node-&gt;seq_next number as ack.</div><div class='ctx'> 		 */</div><div class='del'>-		if (seq &lt; node-&gt;seq_next)</div><div class='del'>-			dlm_send_ack(node-&gt;nodeid, node-&gt;seq_next);</div><div class='add'>+		if (seq &lt; oval)</div><div class='add'>+			dlm_send_ack(node-&gt;nodeid, oval);</div><div class='ctx'> </div><div class='ctx'> 		log_print_ratelimited("ignore dlm msg because seq mismatch, seq: %u, expected: %u, nodeid: %d",</div><div class='del'>-				      seq, node-&gt;seq_next, node-&gt;nodeid);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return;</div><div class='del'>-</div><div class='del'>-send_fin:</div><div class='del'>-	set_bit(DLM_NODE_FLAG_STOP_RX, &amp;node-&gt;flags);</div><div class='del'>-	dlm_send_fin(node, dlm_pas_fin_ack_rcv);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct midcomms_node *</div><div class='del'>-dlm_midcomms_recv_node_lookup(int nodeid, const union dlm_packet *p,</div><div class='del'>-			      uint16_t msglen, int (*cb)(struct midcomms_node *node))</div><div class='del'>-{</div><div class='del'>-	struct midcomms_node *node = NULL;</div><div class='del'>-	gfp_t allocation = 0;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	switch (p-&gt;header.h_cmd) {</div><div class='del'>-	case DLM_RCOM:</div><div class='del'>-		if (msglen &lt; sizeof(struct dlm_rcom)) {</div><div class='del'>-			log_print("rcom msg too small: %u, will skip this message from node %d",</div><div class='del'>-				  msglen, nodeid);</div><div class='del'>-			return NULL;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		switch (le32_to_cpu(p-&gt;rcom.rc_type)) {</div><div class='del'>-		case DLM_RCOM_NAMES:</div><div class='del'>-			fallthrough;</div><div class='del'>-		case DLM_RCOM_NAMES_REPLY:</div><div class='del'>-			fallthrough;</div><div class='del'>-		case DLM_RCOM_STATUS:</div><div class='del'>-			fallthrough;</div><div class='del'>-		case DLM_RCOM_STATUS_REPLY:</div><div class='del'>-			node = nodeid2node(nodeid, 0);</div><div class='del'>-			if (node) {</div><div class='del'>-				spin_lock(&amp;node-&gt;state_lock);</div><div class='del'>-				if (node-&gt;state != DLM_ESTABLISHED)</div><div class='del'>-					pr_debug("receive begin RCOM msg from node %d with state %s\n",</div><div class='del'>-						 node-&gt;nodeid, dlm_state_str(node-&gt;state));</div><div class='del'>-</div><div class='del'>-				switch (node-&gt;state) {</div><div class='del'>-				case DLM_CLOSED:</div><div class='del'>-					node-&gt;state = DLM_ESTABLISHED;</div><div class='del'>-					pr_debug("switch node %d to state %s\n",</div><div class='del'>-						 node-&gt;nodeid, dlm_state_str(node-&gt;state));</div><div class='del'>-					break;</div><div class='del'>-				case DLM_ESTABLISHED:</div><div class='del'>-					break;</div><div class='del'>-				default:</div><div class='del'>-					/* some invalid state passive shutdown</div><div class='del'>-					 * was failed, we try to reset and</div><div class='del'>-					 * hope it will go on.</div><div class='del'>-					 */</div><div class='del'>-					log_print("reset node %d because shutdown stuck",</div><div class='del'>-						  node-&gt;nodeid);</div><div class='del'>-</div><div class='del'>-					midcomms_node_reset(node);</div><div class='del'>-					node-&gt;state = DLM_ESTABLISHED;</div><div class='del'>-					break;</div><div class='del'>-				}</div><div class='del'>-				spin_unlock(&amp;node-&gt;state_lock);</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			allocation = GFP_NOFS;</div><div class='del'>-			break;</div><div class='del'>-		default:</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	node = nodeid2node(nodeid, allocation);</div><div class='del'>-	if (!node) {</div><div class='del'>-		switch (p-&gt;header.h_cmd) {</div><div class='del'>-		case DLM_OPTS:</div><div class='del'>-			if (msglen &lt; sizeof(struct dlm_opts)) {</div><div class='del'>-				log_print("opts msg too small: %u, will skip this message from node %d",</div><div class='del'>-					  msglen, nodeid);</div><div class='del'>-				return NULL;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			log_print_ratelimited("received dlm opts message nextcmd %d from node %d in an invalid sequence",</div><div class='del'>-					      p-&gt;opts.o_nextcmd, nodeid);</div><div class='del'>-			break;</div><div class='del'>-		default:</div><div class='del'>-			log_print_ratelimited("received dlm message cmd %d from node %d in an invalid sequence",</div><div class='del'>-					      p-&gt;header.h_cmd, nodeid);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		return NULL;</div><div class='add'>+				      seq, oval, node-&gt;nodeid);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	ret = cb(node);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	return node;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int dlm_midcomms_version_check_3_2(struct midcomms_node *node)</div><div class='del'>-{</div><div class='del'>-	switch (node-&gt;version) {</div><div class='del'>-	case DLM_VERSION_NOT_SET:</div><div class='del'>-		node-&gt;version = DLM_VERSION_3_2;</div><div class='del'>-		log_print("version 0x%08x for node %d detected", DLM_VERSION_3_2,</div><div class='del'>-			  node-&gt;nodeid);</div><div class='del'>-		break;</div><div class='del'>-	case DLM_VERSION_3_2:</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		log_print_ratelimited("version mismatch detected, assumed 0x%08x but node %d has 0x%08x",</div><div class='del'>-				      DLM_VERSION_3_2, node-&gt;nodeid, node-&gt;version);</div><div class='del'>-		return -1;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int dlm_opts_check_msglen(union dlm_packet *p, uint16_t msglen, int nodeid)</div><div class='add'>+static int dlm_opts_check_msglen(const union dlm_packet *p, uint16_t msglen,</div><div class='add'>+				 int nodeid)</div><div class='ctx'> {</div><div class='ctx'> 	int len = msglen;</div><div class='ctx'> </div><div class='hunk'>@@ -713,7 +654,7 @@ static int dlm_opts_check_msglen(union dlm_packet *p, uint16_t msglen, int nodei</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void dlm_midcomms_receive_buffer_3_2(union dlm_packet *p, int nodeid)</div><div class='add'>+static void dlm_midcomms_receive_buffer_3_2(const union dlm_packet *p, int nodeid)</div><div class='ctx'> {</div><div class='ctx'> 	uint16_t msglen = le16_to_cpu(p-&gt;header.h_length);</div><div class='ctx'> 	struct midcomms_node *node;</div><div class='hunk'>@@ -721,11 +662,38 @@ static void dlm_midcomms_receive_buffer_3_2(union dlm_packet *p, int nodeid)</div><div class='ctx'> 	int ret, idx;</div><div class='ctx'> </div><div class='ctx'> 	idx = srcu_read_lock(&amp;nodes_srcu);</div><div class='del'>-	node = dlm_midcomms_recv_node_lookup(nodeid, p, msglen,</div><div class='del'>-					     dlm_midcomms_version_check_3_2);</div><div class='del'>-	if (!node)</div><div class='add'>+	node = nodeid2node(nodeid);</div><div class='add'>+	if (WARN_ON_ONCE(!node))</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='add'>+	switch (node-&gt;version) {</div><div class='add'>+	case DLM_VERSION_NOT_SET:</div><div class='add'>+		node-&gt;version = DLM_VERSION_3_2;</div><div class='add'>+		wake_up(&amp;node-&gt;shutdown_wait);</div><div class='add'>+		log_print("version 0x%08x for node %d detected", DLM_VERSION_3_2,</div><div class='add'>+			  node-&gt;nodeid);</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;node-&gt;state_lock);</div><div class='add'>+		switch (node-&gt;state) {</div><div class='add'>+		case DLM_CLOSED:</div><div class='add'>+			node-&gt;state = DLM_ESTABLISHED;</div><div class='add'>+			pr_debug("switch node %d to state %s\n",</div><div class='add'>+				 node-&gt;nodeid, dlm_state_str(node-&gt;state));</div><div class='add'>+			break;</div><div class='add'>+		default:</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;node-&gt;state_lock);</div><div class='add'>+</div><div class='add'>+		break;</div><div class='add'>+	case DLM_VERSION_3_2:</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		log_print_ratelimited("version mismatch detected, assumed 0x%08x but node %d has 0x%08x",</div><div class='add'>+				      DLM_VERSION_3_2, node-&gt;nodeid, node-&gt;version);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	switch (p-&gt;header.h_cmd) {</div><div class='ctx'> 	case DLM_RCOM:</div><div class='ctx'> 		/* these rcom message we use to determine version.</div><div class='hunk'>@@ -734,14 +702,14 @@ static void dlm_midcomms_receive_buffer_3_2(union dlm_packet *p, int nodeid)</div><div class='ctx'> 		 *</div><div class='ctx'> 		 * length already checked.</div><div class='ctx'> 		 */</div><div class='del'>-		switch (le32_to_cpu(p-&gt;rcom.rc_type)) {</div><div class='del'>-		case DLM_RCOM_NAMES:</div><div class='add'>+		switch (p-&gt;rcom.rc_type) {</div><div class='add'>+		case cpu_to_le32(DLM_RCOM_NAMES):</div><div class='ctx'> 			fallthrough;</div><div class='del'>-		case DLM_RCOM_NAMES_REPLY:</div><div class='add'>+		case cpu_to_le32(DLM_RCOM_NAMES_REPLY):</div><div class='ctx'> 			fallthrough;</div><div class='del'>-		case DLM_RCOM_STATUS:</div><div class='add'>+		case cpu_to_le32(DLM_RCOM_STATUS):</div><div class='ctx'> 			fallthrough;</div><div class='del'>-		case DLM_RCOM_STATUS_REPLY:</div><div class='add'>+		case cpu_to_le32(DLM_RCOM_STATUS_REPLY):</div><div class='ctx'> 			break;</div><div class='ctx'> 		default:</div><div class='ctx'> 			log_print("unsupported rcom type received: %u, will skip this message from node %d",</div><div class='hunk'>@@ -749,7 +717,7 @@ static void dlm_midcomms_receive_buffer_3_2(union dlm_packet *p, int nodeid)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		WARN_ON(test_bit(DLM_NODE_FLAG_STOP_RX, &amp;node-&gt;flags));</div><div class='add'>+		WARN_ON_ONCE(test_bit(DLM_NODE_FLAG_STOP_RX, &amp;node-&gt;flags));</div><div class='ctx'> 		dlm_receive_buffer(p, nodeid);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case DLM_OPTS:</div><div class='hunk'>@@ -814,11 +782,23 @@ out:</div><div class='ctx'> 	srcu_read_unlock(&amp;nodes_srcu, idx);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int dlm_midcomms_version_check_3_1(struct midcomms_node *node)</div><div class='add'>+static void dlm_midcomms_receive_buffer_3_1(const union dlm_packet *p, int nodeid)</div><div class='ctx'> {</div><div class='add'>+	uint16_t msglen = le16_to_cpu(p-&gt;header.h_length);</div><div class='add'>+	struct midcomms_node *node;</div><div class='add'>+	int idx;</div><div class='add'>+</div><div class='add'>+	idx = srcu_read_lock(&amp;nodes_srcu);</div><div class='add'>+	node = nodeid2node(nodeid);</div><div class='add'>+	if (WARN_ON_ONCE(!node)) {</div><div class='add'>+		srcu_read_unlock(&amp;nodes_srcu, idx);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	switch (node-&gt;version) {</div><div class='ctx'> 	case DLM_VERSION_NOT_SET:</div><div class='ctx'> 		node-&gt;version = DLM_VERSION_3_1;</div><div class='add'>+		wake_up(&amp;node-&gt;shutdown_wait);</div><div class='ctx'> 		log_print("version 0x%08x for node %d detected", DLM_VERSION_3_1,</div><div class='ctx'> 			  node-&gt;nodeid);</div><div class='ctx'> 		break;</div><div class='hunk'>@@ -827,22 +807,6 @@ static int dlm_midcomms_version_check_3_1(struct midcomms_node *node)</div><div class='ctx'> 	default:</div><div class='ctx'> 		log_print_ratelimited("version mismatch detected, assumed 0x%08x but node %d has 0x%08x",</div><div class='ctx'> 				      DLM_VERSION_3_1, node-&gt;nodeid, node-&gt;version);</div><div class='del'>-		return -1;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void dlm_midcomms_receive_buffer_3_1(union dlm_packet *p, int nodeid)</div><div class='del'>-{</div><div class='del'>-	uint16_t msglen = le16_to_cpu(p-&gt;header.h_length);</div><div class='del'>-	struct midcomms_node *node;</div><div class='del'>-	int idx;</div><div class='del'>-</div><div class='del'>-	idx = srcu_read_lock(&amp;nodes_srcu);</div><div class='del'>-	node = dlm_midcomms_recv_node_lookup(nodeid, p, msglen,</div><div class='del'>-					     dlm_midcomms_version_check_3_1);</div><div class='del'>-	if (!node) {</div><div class='ctx'> 		srcu_read_unlock(&amp;nodes_srcu, idx);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -869,12 +833,7 @@ static void dlm_midcomms_receive_buffer_3_1(union dlm_packet *p, int nodeid)</div><div class='ctx'> 	dlm_receive_buffer(p, nodeid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Called from the low-level comms layer to process a buffer of</div><div class='del'>- * commands.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-int dlm_process_incoming_buffer(int nodeid, unsigned char *buf, int len)</div><div class='add'>+int dlm_validate_incoming_buffer(int nodeid, unsigned char *buf, int len)</div><div class='ctx'> {</div><div class='ctx'> 	const unsigned char *ptr = buf;</div><div class='ctx'> 	const struct dlm_header *hd;</div><div class='hunk'>@@ -909,19 +868,6 @@ int dlm_process_incoming_buffer(int nodeid, unsigned char *buf, int len)</div><div class='ctx'> 		if (msglen &gt; len)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		switch (le32_to_cpu(hd-&gt;h_version)) {</div><div class='del'>-		case DLM_VERSION_3_1:</div><div class='del'>-			dlm_midcomms_receive_buffer_3_1((union dlm_packet *)ptr, nodeid);</div><div class='del'>-			break;</div><div class='del'>-		case DLM_VERSION_3_2:</div><div class='del'>-			dlm_midcomms_receive_buffer_3_2((union dlm_packet *)ptr, nodeid);</div><div class='del'>-			break;</div><div class='del'>-		default:</div><div class='del'>-			log_print("received invalid version header: %u from node %d, will skip this message",</div><div class='del'>-				  le32_to_cpu(hd-&gt;h_version), nodeid);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='ctx'> 		ret += msglen;</div><div class='ctx'> 		len -= msglen;</div><div class='ctx'> 		ptr += msglen;</div><div class='hunk'>@@ -930,47 +876,43 @@ int dlm_process_incoming_buffer(int nodeid, unsigned char *buf, int len)</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void dlm_midcomms_receive_done(int nodeid)</div><div class='add'>+/*</div><div class='add'>+ * Called from the low-level comms layer to process a buffer of</div><div class='add'>+ * commands.</div><div class='add'>+ */</div><div class='add'>+int dlm_process_incoming_buffer(int nodeid, unsigned char *buf, int len)</div><div class='ctx'> {</div><div class='del'>-	struct midcomms_node *node;</div><div class='del'>-	int idx;</div><div class='add'>+	const unsigned char *ptr = buf;</div><div class='add'>+	const struct dlm_header *hd;</div><div class='add'>+	uint16_t msglen;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	idx = srcu_read_lock(&amp;nodes_srcu);</div><div class='del'>-	node = nodeid2node(nodeid, 0);</div><div class='del'>-	if (!node) {</div><div class='del'>-		srcu_read_unlock(&amp;nodes_srcu, idx);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='add'>+	while (len &gt;= sizeof(struct dlm_header)) {</div><div class='add'>+		hd = (struct dlm_header *)ptr;</div><div class='ctx'> </div><div class='del'>-	/* old protocol, we do nothing */</div><div class='del'>-	switch (node-&gt;version) {</div><div class='del'>-	case DLM_VERSION_3_2:</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		srcu_read_unlock(&amp;nodes_srcu, idx);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='add'>+		msglen = le16_to_cpu(hd-&gt;h_length);</div><div class='add'>+		if (msglen &gt; len)</div><div class='add'>+			break;</div><div class='ctx'> </div><div class='del'>-	/* do nothing if we didn't delivered stateful to ulp */</div><div class='del'>-	if (!test_and_clear_bit(DLM_NODE_ULP_DELIVERED,</div><div class='del'>-				&amp;node-&gt;flags)) {</div><div class='del'>-		srcu_read_unlock(&amp;nodes_srcu, idx);</div><div class='del'>-		return;</div><div class='add'>+		switch (hd-&gt;h_version) {</div><div class='add'>+		case cpu_to_le32(DLM_VERSION_3_1):</div><div class='add'>+			dlm_midcomms_receive_buffer_3_1((const union dlm_packet *)ptr, nodeid);</div><div class='add'>+			break;</div><div class='add'>+		case cpu_to_le32(DLM_VERSION_3_2):</div><div class='add'>+			dlm_midcomms_receive_buffer_3_2((const union dlm_packet *)ptr, nodeid);</div><div class='add'>+			break;</div><div class='add'>+		default:</div><div class='add'>+			log_print("received invalid version header: %u from node %d, will skip this message",</div><div class='add'>+				  le32_to_cpu(hd-&gt;h_version), nodeid);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		ret += msglen;</div><div class='add'>+		len -= msglen;</div><div class='add'>+		ptr += msglen;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;node-&gt;state_lock);</div><div class='del'>-	/* we only ack if state is ESTABLISHED */</div><div class='del'>-	switch (node-&gt;state) {</div><div class='del'>-	case DLM_ESTABLISHED:</div><div class='del'>-		spin_unlock(&amp;node-&gt;state_lock);</div><div class='del'>-		dlm_send_ack(node-&gt;nodeid, node-&gt;seq_next);</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		spin_unlock(&amp;node-&gt;state_lock);</div><div class='del'>-		/* do nothing FIN has it's own ack send */</div><div class='del'>-		break;</div><div class='del'>-	};</div><div class='del'>-	srcu_read_unlock(&amp;nodes_srcu, idx);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void dlm_midcomms_unack_msg_resend(int nodeid)</div><div class='hunk'>@@ -980,8 +922,8 @@ void dlm_midcomms_unack_msg_resend(int nodeid)</div><div class='ctx'> 	int idx, ret;</div><div class='ctx'> </div><div class='ctx'> 	idx = srcu_read_lock(&amp;nodes_srcu);</div><div class='del'>-	node = nodeid2node(nodeid, 0);</div><div class='del'>-	if (!node) {</div><div class='add'>+	node = nodeid2node(nodeid);</div><div class='add'>+	if (WARN_ON_ONCE(!node)) {</div><div class='ctx'> 		srcu_read_unlock(&amp;nodes_srcu, idx);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1013,32 +955,33 @@ static void dlm_fill_opts_header(struct dlm_opts *opts, uint16_t inner_len,</div><div class='ctx'> 				 uint32_t seq)</div><div class='ctx'> {</div><div class='ctx'> 	opts-&gt;o_header.h_cmd = DLM_OPTS;</div><div class='del'>-	opts-&gt;o_header.h_version = (DLM_HEADER_MAJOR | DLM_HEADER_MINOR);</div><div class='del'>-	opts-&gt;o_header.h_nodeid = dlm_our_nodeid();</div><div class='del'>-	opts-&gt;o_header.h_length = DLM_MIDCOMMS_OPT_LEN + inner_len;</div><div class='del'>-	opts-&gt;o_header.u.h_seq = seq;</div><div class='del'>-	header_out(&amp;opts-&gt;o_header);</div><div class='add'>+	opts-&gt;o_header.h_version = cpu_to_le32(DLM_HEADER_MAJOR | DLM_HEADER_MINOR);</div><div class='add'>+	opts-&gt;o_header.h_nodeid = cpu_to_le32(dlm_our_nodeid());</div><div class='add'>+	opts-&gt;o_header.h_length = cpu_to_le16(DLM_MIDCOMMS_OPT_LEN + inner_len);</div><div class='add'>+	opts-&gt;o_header.u.h_seq = cpu_to_le32(seq);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void midcomms_new_msg_cb(struct dlm_mhandle *mh)</div><div class='add'>+static void midcomms_new_msg_cb(void *data)</div><div class='ctx'> {</div><div class='add'>+	struct dlm_mhandle *mh = data;</div><div class='add'>+</div><div class='ctx'> 	atomic_inc(&amp;mh-&gt;node-&gt;send_queue_cnt);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;mh-&gt;node-&gt;send_queue_lock);</div><div class='add'>+	spin_lock_bh(&amp;mh-&gt;node-&gt;send_queue_lock);</div><div class='ctx'> 	list_add_tail_rcu(&amp;mh-&gt;list, &amp;mh-&gt;node-&gt;send_queue);</div><div class='del'>-	spin_unlock(&amp;mh-&gt;node-&gt;send_queue_lock);</div><div class='add'>+	spin_unlock_bh(&amp;mh-&gt;node-&gt;send_queue_lock);</div><div class='ctx'> </div><div class='del'>-	mh-&gt;seq = mh-&gt;node-&gt;seq_send++;</div><div class='add'>+	mh-&gt;seq = atomic_fetch_inc(&amp;mh-&gt;node-&gt;seq_send);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct dlm_msg *dlm_midcomms_get_msg_3_2(struct dlm_mhandle *mh, int nodeid,</div><div class='del'>-						int len, gfp_t allocation, char **ppc)</div><div class='add'>+						int len, char **ppc)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_opts *opts;</div><div class='ctx'> 	struct dlm_msg *msg;</div><div class='ctx'> </div><div class='ctx'> 	msg = dlm_lowcomms_new_msg(nodeid, len + DLM_MIDCOMMS_OPT_LEN,</div><div class='del'>-				   allocation, ppc, midcomms_new_msg_cb, mh);</div><div class='add'>+				   ppc, midcomms_new_msg_cb, mh);</div><div class='ctx'> 	if (!msg)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='hunk'>@@ -1049,12 +992,15 @@ static struct dlm_msg *dlm_midcomms_get_msg_3_2(struct dlm_mhandle *mh, int node</div><div class='ctx'> 	dlm_fill_opts_header(opts, len, mh-&gt;seq);</div><div class='ctx'> </div><div class='ctx'> 	*ppc += sizeof(*opts);</div><div class='del'>-	mh-&gt;inner_hd = (const struct dlm_header *)*ppc;</div><div class='add'>+	mh-&gt;inner_p = (const union dlm_packet *)*ppc;</div><div class='ctx'> 	return msg;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct dlm_mhandle *dlm_midcomms_get_mhandle(int nodeid, int len,</div><div class='del'>-					     gfp_t allocation, char **ppc)</div><div class='add'>+/* avoid false positive for nodes_srcu, unlock happens in</div><div class='add'>+ * dlm_midcomms_commit_mhandle which is a must call if success</div><div class='add'>+ */</div><div class='add'>+#ifndef __CHECKER__</div><div class='add'>+struct dlm_mhandle *dlm_midcomms_get_mhandle(int nodeid, int len, char **ppc)</div><div class='ctx'> {</div><div class='ctx'> 	struct midcomms_node *node;</div><div class='ctx'> 	struct dlm_mhandle *mh;</div><div class='hunk'>@@ -1062,44 +1008,44 @@ struct dlm_mhandle *dlm_midcomms_get_mhandle(int nodeid, int len,</div><div class='ctx'> 	int idx;</div><div class='ctx'> </div><div class='ctx'> 	idx = srcu_read_lock(&amp;nodes_srcu);</div><div class='del'>-	node = nodeid2node(nodeid, 0);</div><div class='del'>-	if (!node) {</div><div class='del'>-		WARN_ON_ONCE(1);</div><div class='add'>+	node = nodeid2node(nodeid);</div><div class='add'>+	if (WARN_ON_ONCE(!node))</div><div class='ctx'> 		goto err;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	/* this is a bug, however we going on and hope it will be resolved */</div><div class='del'>-	WARN_ON(test_bit(DLM_NODE_FLAG_STOP_TX, &amp;node-&gt;flags));</div><div class='add'>+	WARN_ON_ONCE(test_bit(DLM_NODE_FLAG_STOP_TX, &amp;node-&gt;flags));</div><div class='ctx'> </div><div class='del'>-	mh = kzalloc(sizeof(*mh), GFP_NOFS);</div><div class='add'>+	mh = dlm_allocate_mhandle();</div><div class='ctx'> 	if (!mh)</div><div class='ctx'> 		goto err;</div><div class='ctx'> </div><div class='add'>+	mh-&gt;committed = false;</div><div class='add'>+	mh-&gt;ack_rcv = NULL;</div><div class='ctx'> 	mh-&gt;idx = idx;</div><div class='ctx'> 	mh-&gt;node = node;</div><div class='ctx'> </div><div class='ctx'> 	switch (node-&gt;version) {</div><div class='ctx'> 	case DLM_VERSION_3_1:</div><div class='del'>-		msg = dlm_lowcomms_new_msg(nodeid, len, allocation, ppc,</div><div class='del'>-					   NULL, NULL);</div><div class='add'>+		msg = dlm_lowcomms_new_msg(nodeid, len, ppc, NULL, NULL);</div><div class='ctx'> 		if (!msg) {</div><div class='del'>-			kfree(mh);</div><div class='add'>+			dlm_free_mhandle(mh);</div><div class='ctx'> 			goto err;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		break;</div><div class='ctx'> 	case DLM_VERSION_3_2:</div><div class='del'>-		msg = dlm_midcomms_get_msg_3_2(mh, nodeid, len, allocation,</div><div class='del'>-					       ppc);</div><div class='add'>+		/* send ack back if necessary */</div><div class='add'>+		dlm_send_ack_threshold(node, DLM_SEND_ACK_BACK_MSG_THRESHOLD);</div><div class='add'>+</div><div class='add'>+		msg = dlm_midcomms_get_msg_3_2(mh, nodeid, len, ppc);</div><div class='ctx'> 		if (!msg) {</div><div class='del'>-			kfree(mh);</div><div class='add'>+			dlm_free_mhandle(mh);</div><div class='ctx'> 			goto err;</div><div class='ctx'> 		}</div><div class='del'>-</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='del'>-		kfree(mh);</div><div class='del'>-		WARN_ON(1);</div><div class='add'>+		dlm_free_mhandle(mh);</div><div class='add'>+		WARN_ON_ONCE(1);</div><div class='ctx'> 		goto err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1116,17 +1062,45 @@ err:</div><div class='ctx'> 	srcu_read_unlock(&amp;nodes_srcu, idx);</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+static void dlm_midcomms_commit_msg_3_2_trace(const struct dlm_mhandle *mh,</div><div class='add'>+					      const void *name, int namelen)</div><div class='add'>+{</div><div class='add'>+	switch (mh-&gt;inner_p-&gt;header.h_cmd) {</div><div class='add'>+	case DLM_MSG:</div><div class='add'>+		trace_dlm_send_message(mh-&gt;node-&gt;nodeid, mh-&gt;seq,</div><div class='add'>+				       &amp;mh-&gt;inner_p-&gt;message,</div><div class='add'>+				       name, namelen);</div><div class='add'>+		break;</div><div class='add'>+	case DLM_RCOM:</div><div class='add'>+		trace_dlm_send_rcom(mh-&gt;node-&gt;nodeid, mh-&gt;seq,</div><div class='add'>+				    &amp;mh-&gt;inner_p-&gt;rcom);</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		/* nothing to trace */</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-static void dlm_midcomms_commit_msg_3_2(struct dlm_mhandle *mh)</div><div class='add'>+static void dlm_midcomms_commit_msg_3_2(struct dlm_mhandle *mh,</div><div class='add'>+					const void *name, int namelen)</div><div class='ctx'> {</div><div class='ctx'> 	/* nexthdr chain for fast lookup */</div><div class='del'>-	mh-&gt;opts-&gt;o_nextcmd = mh-&gt;inner_hd-&gt;h_cmd;</div><div class='add'>+	mh-&gt;opts-&gt;o_nextcmd = mh-&gt;inner_p-&gt;header.h_cmd;</div><div class='ctx'> 	mh-&gt;committed = true;</div><div class='add'>+	dlm_midcomms_commit_msg_3_2_trace(mh, name, namelen);</div><div class='ctx'> 	dlm_lowcomms_commit_msg(mh-&gt;msg);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void dlm_midcomms_commit_mhandle(struct dlm_mhandle *mh)</div><div class='add'>+/* avoid false positive for nodes_srcu, lock was happen in</div><div class='add'>+ * dlm_midcomms_get_mhandle</div><div class='add'>+ */</div><div class='add'>+#ifndef __CHECKER__</div><div class='add'>+void dlm_midcomms_commit_mhandle(struct dlm_mhandle *mh,</div><div class='add'>+				 const void *name, int namelen)</div><div class='ctx'> {</div><div class='add'>+</div><div class='ctx'> 	switch (mh-&gt;node-&gt;version) {</div><div class='ctx'> 	case DLM_VERSION_3_1:</div><div class='ctx'> 		srcu_read_unlock(&amp;nodes_srcu, mh-&gt;idx);</div><div class='hunk'>@@ -1134,32 +1108,81 @@ void dlm_midcomms_commit_mhandle(struct dlm_mhandle *mh)</div><div class='ctx'> 		dlm_lowcomms_commit_msg(mh-&gt;msg);</div><div class='ctx'> 		dlm_lowcomms_put_msg(mh-&gt;msg);</div><div class='ctx'> 		/* mh is not part of rcu list in this case */</div><div class='del'>-		kfree(mh);</div><div class='add'>+		dlm_free_mhandle(mh);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case DLM_VERSION_3_2:</div><div class='del'>-		dlm_midcomms_commit_msg_3_2(mh);</div><div class='add'>+		/* held rcu read lock here, because we sending the</div><div class='add'>+		 * dlm message out, when we do that we could receive</div><div class='add'>+		 * an ack back which releases the mhandle and we</div><div class='add'>+		 * get a use after free.</div><div class='add'>+		 */</div><div class='add'>+		rcu_read_lock();</div><div class='add'>+		dlm_midcomms_commit_msg_3_2(mh, name, namelen);</div><div class='ctx'> 		srcu_read_unlock(&amp;nodes_srcu, mh-&gt;idx);</div><div class='add'>+		rcu_read_unlock();</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		srcu_read_unlock(&amp;nodes_srcu, mh-&gt;idx);</div><div class='del'>-		WARN_ON(1);</div><div class='add'>+		WARN_ON_ONCE(1);</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='ctx'> int dlm_midcomms_start(void)</div><div class='ctx'> {</div><div class='add'>+	return dlm_lowcomms_start();</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void dlm_midcomms_stop(void)</div><div class='add'>+{</div><div class='add'>+	dlm_lowcomms_stop();</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void dlm_midcomms_init(void)</div><div class='add'>+{</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; CONN_HASH_SIZE; i++)</div><div class='ctx'> 		INIT_HLIST_HEAD(&amp;node_hash[i]);</div><div class='ctx'> </div><div class='del'>-	return dlm_lowcomms_start();</div><div class='add'>+	dlm_lowcomms_init();</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void midcomms_node_release(struct rcu_head *rcu)</div><div class='add'>+{</div><div class='add'>+	struct midcomms_node *node = container_of(rcu, struct midcomms_node, rcu);</div><div class='add'>+</div><div class='add'>+	WARN_ON_ONCE(atomic_read(&amp;node-&gt;send_queue_cnt));</div><div class='add'>+	dlm_send_queue_flush(node);</div><div class='add'>+	kfree(node);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void dlm_midcomms_exit(void)</div><div class='add'>+{</div><div class='add'>+	struct midcomms_node *node;</div><div class='add'>+	int i, idx;</div><div class='add'>+</div><div class='add'>+	idx = srcu_read_lock(&amp;nodes_srcu);</div><div class='add'>+	for (i = 0; i &lt; CONN_HASH_SIZE; i++) {</div><div class='add'>+		hlist_for_each_entry_rcu(node, &amp;node_hash[i], hlist) {</div><div class='add'>+			dlm_delete_debug_comms_file(node-&gt;debugfs);</div><div class='add'>+</div><div class='add'>+			spin_lock(&amp;nodes_lock);</div><div class='add'>+			hlist_del_rcu(&amp;node-&gt;hlist);</div><div class='add'>+			spin_unlock(&amp;nodes_lock);</div><div class='add'>+</div><div class='add'>+			call_srcu(&amp;nodes_srcu, &amp;node-&gt;rcu, midcomms_node_release);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	srcu_read_unlock(&amp;nodes_srcu, idx);</div><div class='add'>+</div><div class='add'>+	dlm_lowcomms_exit();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void dlm_act_fin_ack_rcv(struct midcomms_node *node)</div><div class='ctx'> {</div><div class='del'>-	spin_lock(&amp;node-&gt;state_lock);</div><div class='add'>+	spin_lock_bh(&amp;node-&gt;state_lock);</div><div class='ctx'> 	pr_debug("receive active fin ack from node %d with state %s\n",</div><div class='ctx'> 		 node-&gt;nodeid, dlm_state_str(node-&gt;state));</div><div class='ctx'> </div><div class='hunk'>@@ -1173,20 +1196,19 @@ static void dlm_act_fin_ack_rcv(struct midcomms_node *node)</div><div class='ctx'> 		midcomms_node_reset(node);</div><div class='ctx'> 		pr_debug("switch node %d to state %s\n",</div><div class='ctx'> 			 node-&gt;nodeid, dlm_state_str(node-&gt;state));</div><div class='del'>-		wake_up(&amp;node-&gt;shutdown_wait);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case DLM_CLOSED:</div><div class='ctx'> 		/* not valid but somehow we got what we want */</div><div class='ctx'> 		wake_up(&amp;node-&gt;shutdown_wait);</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='del'>-		spin_unlock(&amp;node-&gt;state_lock);</div><div class='del'>-		log_print("%s: unexpected state: %d\n",</div><div class='add'>+		spin_unlock_bh(&amp;node-&gt;state_lock);</div><div class='add'>+		log_print("%s: unexpected state: %d",</div><div class='ctx'> 			  __func__, node-&gt;state);</div><div class='del'>-		WARN_ON(1);</div><div class='add'>+		WARN_ON_ONCE(1);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;node-&gt;state_lock);</div><div class='add'>+	spin_unlock_bh(&amp;node-&gt;state_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void dlm_midcomms_add_member(int nodeid)</div><div class='hunk'>@@ -1194,17 +1216,14 @@ void dlm_midcomms_add_member(int nodeid)</div><div class='ctx'> 	struct midcomms_node *node;</div><div class='ctx'> 	int idx;</div><div class='ctx'> </div><div class='del'>-	if (nodeid == dlm_our_nodeid())</div><div class='del'>-		return;</div><div class='del'>-</div><div class='ctx'> 	idx = srcu_read_lock(&amp;nodes_srcu);</div><div class='del'>-	node = nodeid2node(nodeid, GFP_NOFS);</div><div class='del'>-	if (!node) {</div><div class='add'>+	node = nodeid2node(nodeid);</div><div class='add'>+	if (WARN_ON_ONCE(!node)) {</div><div class='ctx'> 		srcu_read_unlock(&amp;nodes_srcu, idx);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;node-&gt;state_lock);</div><div class='add'>+	spin_lock_bh(&amp;node-&gt;state_lock);</div><div class='ctx'> 	if (!node-&gt;users) {</div><div class='ctx'> 		pr_debug("receive add member from node %d with state %s\n",</div><div class='ctx'> 			 node-&gt;nodeid, dlm_state_str(node-&gt;state));</div><div class='hunk'>@@ -1231,8 +1250,8 @@ void dlm_midcomms_add_member(int nodeid)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	node-&gt;users++;</div><div class='del'>-	pr_debug("users inc count %d\n", node-&gt;users);</div><div class='del'>-	spin_unlock(&amp;node-&gt;state_lock);</div><div class='add'>+	pr_debug("node %d users inc count %d\n", nodeid, node-&gt;users);</div><div class='add'>+	spin_unlock_bh(&amp;node-&gt;state_lock);</div><div class='ctx'> </div><div class='ctx'> 	srcu_read_unlock(&amp;nodes_srcu, idx);</div><div class='ctx'> }</div><div class='hunk'>@@ -1242,19 +1261,27 @@ void dlm_midcomms_remove_member(int nodeid)</div><div class='ctx'> 	struct midcomms_node *node;</div><div class='ctx'> 	int idx;</div><div class='ctx'> </div><div class='del'>-	if (nodeid == dlm_our_nodeid())</div><div class='del'>-		return;</div><div class='del'>-</div><div class='ctx'> 	idx = srcu_read_lock(&amp;nodes_srcu);</div><div class='del'>-	node = nodeid2node(nodeid, 0);</div><div class='add'>+	node = nodeid2node(nodeid);</div><div class='add'>+	/* in case of dlm_midcomms_close() removes node */</div><div class='ctx'> 	if (!node) {</div><div class='ctx'> 		srcu_read_unlock(&amp;nodes_srcu, idx);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;node-&gt;state_lock);</div><div class='add'>+	spin_lock_bh(&amp;node-&gt;state_lock);</div><div class='add'>+	/* case of dlm_midcomms_addr() created node but</div><div class='add'>+	 * was not added before because dlm_midcomms_close()</div><div class='add'>+	 * removed the node</div><div class='add'>+	 */</div><div class='add'>+	if (!node-&gt;users) {</div><div class='add'>+		spin_unlock_bh(&amp;node-&gt;state_lock);</div><div class='add'>+		srcu_read_unlock(&amp;nodes_srcu, idx);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	node-&gt;users--;</div><div class='del'>-	pr_debug("users dec count %d\n", node-&gt;users);</div><div class='add'>+	pr_debug("node %d users dec count %d\n", nodeid, node-&gt;users);</div><div class='ctx'> </div><div class='ctx'> 	/* hitting users count to zero means the</div><div class='ctx'> 	 * other side is running dlm_midcomms_stop()</div><div class='hunk'>@@ -1269,11 +1296,11 @@ void dlm_midcomms_remove_member(int nodeid)</div><div class='ctx'> 		case DLM_CLOSE_WAIT:</div><div class='ctx'> 			/* passive shutdown DLM_LAST_ACK case 2 */</div><div class='ctx'> 			node-&gt;state = DLM_LAST_ACK;</div><div class='del'>-			spin_unlock(&amp;node-&gt;state_lock);</div><div class='del'>-</div><div class='ctx'> 			pr_debug("switch node %d to state %s case 2\n",</div><div class='ctx'> 				 node-&gt;nodeid, dlm_state_str(node-&gt;state));</div><div class='del'>-			goto send_fin;</div><div class='add'>+			set_bit(DLM_NODE_FLAG_STOP_RX, &amp;node-&gt;flags);</div><div class='add'>+			dlm_send_fin(node, dlm_pas_fin_ack_rcv);</div><div class='add'>+			break;</div><div class='ctx'> 		case DLM_LAST_ACK:</div><div class='ctx'> 			/* probably receive fin caught it, do nothing */</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -1281,28 +1308,35 @@ void dlm_midcomms_remove_member(int nodeid)</div><div class='ctx'> 			/* already gone, do nothing */</div><div class='ctx'> 			break;</div><div class='ctx'> 		default:</div><div class='del'>-			log_print("%s: unexpected state: %d\n",</div><div class='add'>+			log_print("%s: unexpected state: %d",</div><div class='ctx'> 				  __func__, node-&gt;state);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;node-&gt;state_lock);</div><div class='add'>+	spin_unlock_bh(&amp;node-&gt;state_lock);</div><div class='ctx'> </div><div class='ctx'> 	srcu_read_unlock(&amp;nodes_srcu, idx);</div><div class='del'>-	return;</div><div class='del'>-</div><div class='del'>-send_fin:</div><div class='del'>-	set_bit(DLM_NODE_FLAG_STOP_RX, &amp;node-&gt;flags);</div><div class='del'>-	dlm_send_fin(node, dlm_pas_fin_ack_rcv);</div><div class='del'>-	srcu_read_unlock(&amp;nodes_srcu, idx);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void midcomms_node_release(struct rcu_head *rcu)</div><div class='add'>+void dlm_midcomms_version_wait(void)</div><div class='ctx'> {</div><div class='del'>-	struct midcomms_node *node = container_of(rcu, struct midcomms_node, rcu);</div><div class='add'>+	struct midcomms_node *node;</div><div class='add'>+	int i, idx, ret;</div><div class='ctx'> </div><div class='del'>-	WARN_ON(atomic_read(&amp;node-&gt;send_queue_cnt));</div><div class='del'>-	kfree(node);</div><div class='add'>+	idx = srcu_read_lock(&amp;nodes_srcu);</div><div class='add'>+	for (i = 0; i &lt; CONN_HASH_SIZE; i++) {</div><div class='add'>+		hlist_for_each_entry_rcu(node, &amp;node_hash[i], hlist) {</div><div class='add'>+			ret = wait_event_timeout(node-&gt;shutdown_wait,</div><div class='add'>+						 node-&gt;version != DLM_VERSION_NOT_SET ||</div><div class='add'>+						 node-&gt;state == DLM_CLOSED ||</div><div class='add'>+						 test_bit(DLM_NODE_FLAG_CLOSE, &amp;node-&gt;flags),</div><div class='add'>+						 DLM_SHUTDOWN_TIMEOUT);</div><div class='add'>+			if (!ret || test_bit(DLM_NODE_FLAG_CLOSE, &amp;node-&gt;flags))</div><div class='add'>+				pr_debug("version wait timed out for node %d with state %s\n",</div><div class='add'>+					 node-&gt;nodeid, dlm_state_str(node-&gt;state));</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	srcu_read_unlock(&amp;nodes_srcu, idx);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void midcomms_shutdown(struct midcomms_node *node)</div><div class='hunk'>@@ -1317,7 +1351,7 @@ static void midcomms_shutdown(struct midcomms_node *node)</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;node-&gt;state_lock);</div><div class='add'>+	spin_lock_bh(&amp;node-&gt;state_lock);</div><div class='ctx'> 	pr_debug("receive active shutdown for node %d with state %s\n",</div><div class='ctx'> 		 node-&gt;nodeid, dlm_state_str(node-&gt;state));</div><div class='ctx'> 	switch (node-&gt;state) {</div><div class='hunk'>@@ -1325,40 +1359,33 @@ static void midcomms_shutdown(struct midcomms_node *node)</div><div class='ctx'> 		node-&gt;state = DLM_FIN_WAIT1;</div><div class='ctx'> 		pr_debug("switch node %d to state %s case 2\n",</div><div class='ctx'> 			 node-&gt;nodeid, dlm_state_str(node-&gt;state));</div><div class='add'>+		dlm_send_fin(node, dlm_act_fin_ack_rcv);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case DLM_CLOSED:</div><div class='ctx'> 		/* we have what we want */</div><div class='del'>-		spin_unlock(&amp;node-&gt;state_lock);</div><div class='del'>-		return;</div><div class='add'>+		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		/* busy to enter DLM_FIN_WAIT1, wait until passive</div><div class='ctx'> 		 * done in shutdown_wait to enter DLM_CLOSED.</div><div class='ctx'> 		 */</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;node-&gt;state_lock);</div><div class='del'>-</div><div class='del'>-	if (node-&gt;state == DLM_FIN_WAIT1) {</div><div class='del'>-		dlm_send_fin(node, dlm_act_fin_ack_rcv);</div><div class='add'>+	spin_unlock_bh(&amp;node-&gt;state_lock);</div><div class='ctx'> </div><div class='del'>-		if (DLM_DEBUG_FENCE_TERMINATION)</div><div class='del'>-			msleep(5000);</div><div class='del'>-	}</div><div class='add'>+	if (DLM_DEBUG_FENCE_TERMINATION)</div><div class='add'>+		msleep(5000);</div><div class='ctx'> </div><div class='ctx'> 	/* wait for other side dlm + fin */</div><div class='ctx'> 	ret = wait_event_timeout(node-&gt;shutdown_wait,</div><div class='ctx'> 				 node-&gt;state == DLM_CLOSED ||</div><div class='ctx'> 				 test_bit(DLM_NODE_FLAG_CLOSE, &amp;node-&gt;flags),</div><div class='ctx'> 				 DLM_SHUTDOWN_TIMEOUT);</div><div class='del'>-	if (!ret || test_bit(DLM_NODE_FLAG_CLOSE, &amp;node-&gt;flags)) {</div><div class='add'>+	if (!ret)</div><div class='ctx'> 		pr_debug("active shutdown timed out for node %d with state %s\n",</div><div class='ctx'> 			 node-&gt;nodeid, dlm_state_str(node-&gt;state));</div><div class='del'>-		midcomms_node_reset(node);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	pr_debug("active shutdown done for node %d with state %s\n",</div><div class='del'>-		 node-&gt;nodeid, dlm_state_str(node-&gt;state));</div><div class='add'>+	else</div><div class='add'>+		pr_debug("active shutdown done for node %d with state %s\n",</div><div class='add'>+			 node-&gt;nodeid, dlm_state_str(node-&gt;state));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void dlm_midcomms_shutdown(void)</div><div class='hunk'>@@ -1371,20 +1398,18 @@ void dlm_midcomms_shutdown(void)</div><div class='ctx'> 	for (i = 0; i &lt; CONN_HASH_SIZE; i++) {</div><div class='ctx'> 		hlist_for_each_entry_rcu(node, &amp;node_hash[i], hlist) {</div><div class='ctx'> 			midcomms_shutdown(node);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-			dlm_delete_debug_comms_file(node-&gt;debugfs);</div><div class='del'>-</div><div class='del'>-			spin_lock(&amp;nodes_lock);</div><div class='del'>-			hlist_del_rcu(&amp;node-&gt;hlist);</div><div class='del'>-			spin_unlock(&amp;nodes_lock);</div><div class='add'>+	dlm_lowcomms_shutdown();</div><div class='ctx'> </div><div class='del'>-			call_srcu(&amp;nodes_srcu, &amp;node-&gt;rcu, midcomms_node_release);</div><div class='add'>+	for (i = 0; i &lt; CONN_HASH_SIZE; i++) {</div><div class='add'>+		hlist_for_each_entry_rcu(node, &amp;node_hash[i], hlist) {</div><div class='add'>+			midcomms_node_reset(node);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	srcu_read_unlock(&amp;nodes_srcu, idx);</div><div class='ctx'> 	mutex_unlock(&amp;close_lock);</div><div class='del'>-</div><div class='del'>-	dlm_lowcomms_shutdown();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int dlm_midcomms_close(int nodeid)</div><div class='hunk'>@@ -1392,12 +1417,9 @@ int dlm_midcomms_close(int nodeid)</div><div class='ctx'> 	struct midcomms_node *node;</div><div class='ctx'> 	int idx, ret;</div><div class='ctx'> </div><div class='del'>-	if (nodeid == dlm_our_nodeid())</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='ctx'> 	idx = srcu_read_lock(&amp;nodes_srcu);</div><div class='ctx'> 	/* Abort pending close/remove operation */</div><div class='del'>-	node = nodeid2node(nodeid, 0);</div><div class='add'>+	node = nodeid2node(nodeid);</div><div class='ctx'> 	if (node) {</div><div class='ctx'> 		/* let shutdown waiters leave */</div><div class='ctx'> 		set_bit(DLM_NODE_FLAG_CLOSE, &amp;node-&gt;flags);</div><div class='hunk'>@@ -1407,21 +1429,81 @@ int dlm_midcomms_close(int nodeid)</div><div class='ctx'> </div><div class='ctx'> 	synchronize_srcu(&amp;nodes_srcu);</div><div class='ctx'> </div><div class='del'>-	idx = srcu_read_lock(&amp;nodes_srcu);</div><div class='ctx'> 	mutex_lock(&amp;close_lock);</div><div class='del'>-	node = nodeid2node(nodeid, 0);</div><div class='add'>+	idx = srcu_read_lock(&amp;nodes_srcu);</div><div class='add'>+	node = nodeid2node(nodeid);</div><div class='ctx'> 	if (!node) {</div><div class='del'>-		mutex_unlock(&amp;close_lock);</div><div class='ctx'> 		srcu_read_unlock(&amp;nodes_srcu, idx);</div><div class='add'>+		mutex_unlock(&amp;close_lock);</div><div class='ctx'> 		return dlm_lowcomms_close(nodeid);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = dlm_lowcomms_close(nodeid);</div><div class='del'>-	spin_lock(&amp;node-&gt;state_lock);</div><div class='del'>-	midcomms_node_reset(node);</div><div class='del'>-	spin_unlock(&amp;node-&gt;state_lock);</div><div class='add'>+	dlm_delete_debug_comms_file(node-&gt;debugfs);</div><div class='add'>+</div><div class='add'>+	spin_lock_bh(&amp;nodes_lock);</div><div class='add'>+	hlist_del_rcu(&amp;node-&gt;hlist);</div><div class='add'>+	spin_unlock_bh(&amp;nodes_lock);</div><div class='ctx'> 	srcu_read_unlock(&amp;nodes_srcu, idx);</div><div class='add'>+</div><div class='add'>+	/* wait that all readers left until flush send queue */</div><div class='add'>+	synchronize_srcu(&amp;nodes_srcu);</div><div class='add'>+</div><div class='add'>+	/* drop all pending dlm messages, this is fine as</div><div class='add'>+	 * this function get called when the node is fenced</div><div class='add'>+	 */</div><div class='add'>+	dlm_send_queue_flush(node);</div><div class='add'>+</div><div class='add'>+	call_srcu(&amp;nodes_srcu, &amp;node-&gt;rcu, midcomms_node_release);</div><div class='ctx'> 	mutex_unlock(&amp;close_lock);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+/* debug functionality to send raw dlm msg from user space */</div><div class='add'>+struct dlm_rawmsg_data {</div><div class='add'>+	struct midcomms_node *node;</div><div class='add'>+	void *buf;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static void midcomms_new_rawmsg_cb(void *data)</div><div class='add'>+{</div><div class='add'>+	struct dlm_rawmsg_data *rd = data;</div><div class='add'>+	struct dlm_header *h = rd-&gt;buf;</div><div class='add'>+</div><div class='add'>+	switch (h-&gt;h_version) {</div><div class='add'>+	case cpu_to_le32(DLM_VERSION_3_1):</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		switch (h-&gt;h_cmd) {</div><div class='add'>+		case DLM_OPTS:</div><div class='add'>+			if (!h-&gt;u.h_seq)</div><div class='add'>+				h-&gt;u.h_seq = cpu_to_le32(atomic_fetch_inc(&amp;rd-&gt;node-&gt;seq_send));</div><div class='add'>+			break;</div><div class='add'>+		default:</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int dlm_midcomms_rawmsg_send(struct midcomms_node *node, void *buf,</div><div class='add'>+			     int buflen)</div><div class='add'>+{</div><div class='add'>+	struct dlm_rawmsg_data rd;</div><div class='add'>+	struct dlm_msg *msg;</div><div class='add'>+	char *msgbuf;</div><div class='add'>+</div><div class='add'>+	rd.node = node;</div><div class='add'>+	rd.buf = buf;</div><div class='add'>+</div><div class='add'>+	msg = dlm_lowcomms_new_msg(node-&gt;nodeid, buflen, &amp;msgbuf,</div><div class='add'>+				   midcomms_new_rawmsg_cb, &amp;rd);</div><div class='add'>+	if (!msg)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	memcpy(msgbuf, buf, buflen);</div><div class='add'>+	dlm_lowcomms_commit_msg(msg);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='head'>diff --git a/fs/dlm/midcomms.h b/fs/dlm/midcomms.h<br/>index 579abc6929be..7fad1d170bba 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/midcomms.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/midcomms.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/midcomms.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/midcomms.h</a></div><div class='hunk'>@@ -14,12 +14,18 @@</div><div class='ctx'> </div><div class='ctx'> struct midcomms_node;</div><div class='ctx'> </div><div class='add'>+int dlm_validate_incoming_buffer(int nodeid, unsigned char *buf, int len);</div><div class='ctx'> int dlm_process_incoming_buffer(int nodeid, unsigned char *buf, int buflen);</div><div class='del'>-struct dlm_mhandle *dlm_midcomms_get_mhandle(int nodeid, int len,</div><div class='del'>-					     gfp_t allocation, char **ppc);</div><div class='del'>-void dlm_midcomms_commit_mhandle(struct dlm_mhandle *mh);</div><div class='add'>+struct dlm_mhandle *dlm_midcomms_get_mhandle(int nodeid, int len, char **ppc);</div><div class='add'>+void dlm_midcomms_commit_mhandle(struct dlm_mhandle *mh, const void *name,</div><div class='add'>+				 int namelen);</div><div class='add'>+int dlm_midcomms_addr(int nodeid, struct sockaddr_storage *addr);</div><div class='add'>+void dlm_midcomms_version_wait(void);</div><div class='ctx'> int dlm_midcomms_close(int nodeid);</div><div class='ctx'> int dlm_midcomms_start(void);</div><div class='add'>+void dlm_midcomms_stop(void);</div><div class='add'>+void dlm_midcomms_init(void);</div><div class='add'>+void dlm_midcomms_exit(void);</div><div class='ctx'> void dlm_midcomms_shutdown(void);</div><div class='ctx'> void dlm_midcomms_add_member(int nodeid);</div><div class='ctx'> void dlm_midcomms_remove_member(int nodeid);</div><div class='hunk'>@@ -28,6 +34,9 @@ const char *dlm_midcomms_state(struct midcomms_node *node);</div><div class='ctx'> unsigned long dlm_midcomms_flags(struct midcomms_node *node);</div><div class='ctx'> int dlm_midcomms_send_queue_cnt(struct midcomms_node *node);</div><div class='ctx'> uint32_t dlm_midcomms_version(struct midcomms_node *node);</div><div class='add'>+int dlm_midcomms_rawmsg_send(struct midcomms_node *node, void *buf,</div><div class='add'>+			     int buflen);</div><div class='add'>+struct kmem_cache *dlm_midcomms_cache_create(void);</div><div class='ctx'> </div><div class='ctx'> #endif				/* __MIDCOMMS_DOT_H__ */</div><div class='ctx'> </div><div class='head'>diff --git a/fs/dlm/netlink.c b/fs/dlm/netlink.c<br/>deleted file mode 100644<br/>index 67f68d48d60c..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/netlink.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/netlink.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,138 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0-only</div><div class='del'>-/*</div><div class='del'>- * Copyright (C) 2007 Red Hat, Inc.  All rights reserved.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#include &lt;net/genetlink.h&gt;</div><div class='del'>-#include &lt;linux/dlm.h&gt;</div><div class='del'>-#include &lt;linux/dlm_netlink.h&gt;</div><div class='del'>-#include &lt;linux/gfp.h&gt;</div><div class='del'>-</div><div class='del'>-#include "dlm_internal.h"</div><div class='del'>-</div><div class='del'>-static uint32_t dlm_nl_seqnum;</div><div class='del'>-static uint32_t listener_nlportid;</div><div class='del'>-</div><div class='del'>-static struct genl_family family;</div><div class='del'>-</div><div class='del'>-static int prepare_data(u8 cmd, struct sk_buff **skbp, size_t size)</div><div class='del'>-{</div><div class='del'>-	struct sk_buff *skb;</div><div class='del'>-	void *data;</div><div class='del'>-</div><div class='del'>-	skb = genlmsg_new(size, GFP_NOFS);</div><div class='del'>-	if (!skb)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	/* add the message headers */</div><div class='del'>-	data = genlmsg_put(skb, 0, dlm_nl_seqnum++, &amp;family, 0, cmd);</div><div class='del'>-	if (!data) {</div><div class='del'>-		nlmsg_free(skb);</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	*skbp = skb;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct dlm_lock_data *mk_data(struct sk_buff *skb)</div><div class='del'>-{</div><div class='del'>-	struct nlattr *ret;</div><div class='del'>-</div><div class='del'>-	ret = nla_reserve(skb, DLM_TYPE_LOCK, sizeof(struct dlm_lock_data));</div><div class='del'>-	if (!ret)</div><div class='del'>-		return NULL;</div><div class='del'>-	return nla_data(ret);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int send_data(struct sk_buff *skb)</div><div class='del'>-{</div><div class='del'>-	struct genlmsghdr *genlhdr = nlmsg_data((struct nlmsghdr *)skb-&gt;data);</div><div class='del'>-	void *data = genlmsg_data(genlhdr);</div><div class='del'>-</div><div class='del'>-	genlmsg_end(skb, data);</div><div class='del'>-</div><div class='del'>-	return genlmsg_unicast(&amp;init_net, skb, listener_nlportid);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int user_cmd(struct sk_buff *skb, struct genl_info *info)</div><div class='del'>-{</div><div class='del'>-	listener_nlportid = info-&gt;snd_portid;</div><div class='del'>-	printk("user_cmd nlpid %u\n", listener_nlportid);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static const struct genl_small_ops dlm_nl_ops[] = {</div><div class='del'>-	{</div><div class='del'>-		.cmd	= DLM_CMD_HELLO,</div><div class='del'>-		.validate = GENL_DONT_VALIDATE_STRICT | GENL_DONT_VALIDATE_DUMP,</div><div class='del'>-		.doit	= user_cmd,</div><div class='del'>-	},</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static struct genl_family family __ro_after_init = {</div><div class='del'>-	.name		= DLM_GENL_NAME,</div><div class='del'>-	.version	= DLM_GENL_VERSION,</div><div class='del'>-	.small_ops	= dlm_nl_ops,</div><div class='del'>-	.n_small_ops	= ARRAY_SIZE(dlm_nl_ops),</div><div class='del'>-	.module		= THIS_MODULE,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-int __init dlm_netlink_init(void)</div><div class='del'>-{</div><div class='del'>-	return genl_register_family(&amp;family);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void dlm_netlink_exit(void)</div><div class='del'>-{</div><div class='del'>-	genl_unregister_family(&amp;family);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void fill_data(struct dlm_lock_data *data, struct dlm_lkb *lkb)</div><div class='del'>-{</div><div class='del'>-	struct dlm_rsb *r = lkb-&gt;lkb_resource;</div><div class='del'>-</div><div class='del'>-	memset(data, 0, sizeof(struct dlm_lock_data));</div><div class='del'>-</div><div class='del'>-	data-&gt;version = DLM_LOCK_DATA_VERSION;</div><div class='del'>-	data-&gt;nodeid = lkb-&gt;lkb_nodeid;</div><div class='del'>-	data-&gt;ownpid = lkb-&gt;lkb_ownpid;</div><div class='del'>-	data-&gt;id = lkb-&gt;lkb_id;</div><div class='del'>-	data-&gt;remid = lkb-&gt;lkb_remid;</div><div class='del'>-	data-&gt;status = lkb-&gt;lkb_status;</div><div class='del'>-	data-&gt;grmode = lkb-&gt;lkb_grmode;</div><div class='del'>-	data-&gt;rqmode = lkb-&gt;lkb_rqmode;</div><div class='del'>-	if (lkb-&gt;lkb_ua)</div><div class='del'>-		data-&gt;xid = lkb-&gt;lkb_ua-&gt;xid;</div><div class='del'>-	if (r) {</div><div class='del'>-		data-&gt;lockspace_id = r-&gt;res_ls-&gt;ls_global_id;</div><div class='del'>-		data-&gt;resource_namelen = r-&gt;res_length;</div><div class='del'>-		memcpy(data-&gt;resource_name, r-&gt;res_name, r-&gt;res_length);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void dlm_timeout_warn(struct dlm_lkb *lkb)</div><div class='del'>-{</div><div class='del'>-	struct sk_buff *send_skb;</div><div class='del'>-	struct dlm_lock_data *data;</div><div class='del'>-	size_t size;</div><div class='del'>-	int rv;</div><div class='del'>-</div><div class='del'>-	size = nla_total_size(sizeof(struct dlm_lock_data)) +</div><div class='del'>-	       nla_total_size(0); /* why this? */</div><div class='del'>-</div><div class='del'>-	rv = prepare_data(DLM_CMD_TIMEOUT, &amp;send_skb, size);</div><div class='del'>-	if (rv &lt; 0)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	data = mk_data(send_skb);</div><div class='del'>-	if (!data) {</div><div class='del'>-		nlmsg_free(send_skb);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	fill_data(data, lkb);</div><div class='del'>-</div><div class='del'>-	send_data(send_skb);</div><div class='del'>-}</div><div class='del'>-</div><div class='head'>diff --git a/fs/dlm/plock.c b/fs/dlm/plock.c<br/>index c38b2b8ffd1d..9ca83ef70ed1 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/plock.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/plock.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/plock.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/plock.c</a></div><div class='hunk'>@@ -4,35 +4,38 @@</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/filelock.h&gt;</div><div class='ctx'> #include &lt;linux/miscdevice.h&gt;</div><div class='ctx'> #include &lt;linux/poll.h&gt;</div><div class='ctx'> #include &lt;linux/dlm.h&gt;</div><div class='ctx'> #include &lt;linux/dlm_plock.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> </div><div class='add'>+#include &lt;trace/events/dlm.h&gt;</div><div class='add'>+</div><div class='ctx'> #include "dlm_internal.h"</div><div class='ctx'> #include "lockspace.h"</div><div class='ctx'> </div><div class='del'>-static spinlock_t ops_lock;</div><div class='del'>-static struct list_head send_list;</div><div class='del'>-static struct list_head recv_list;</div><div class='del'>-static wait_queue_head_t send_wq;</div><div class='del'>-static wait_queue_head_t recv_wq;</div><div class='del'>-</div><div class='del'>-struct plock_op {</div><div class='del'>-	struct list_head list;</div><div class='del'>-	int done;</div><div class='del'>-	struct dlm_plock_info info;</div><div class='del'>-};</div><div class='add'>+static DEFINE_SPINLOCK(ops_lock);</div><div class='add'>+static LIST_HEAD(send_list);</div><div class='add'>+static LIST_HEAD(recv_list);</div><div class='add'>+static DECLARE_WAIT_QUEUE_HEAD(send_wq);</div><div class='add'>+static DECLARE_WAIT_QUEUE_HEAD(recv_wq);</div><div class='ctx'> </div><div class='del'>-struct plock_xop {</div><div class='del'>-	struct plock_op xop;</div><div class='del'>-	int (*callback)(struct file_lock *fl, int result);</div><div class='add'>+struct plock_async_data {</div><div class='ctx'> 	void *fl;</div><div class='ctx'> 	void *file;</div><div class='ctx'> 	struct file_lock flc;</div><div class='add'>+	int (*callback)(struct file_lock *fl, int result);</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+struct plock_op {</div><div class='add'>+	struct list_head list;</div><div class='add'>+	int done;</div><div class='add'>+	struct dlm_plock_info info;</div><div class='add'>+	/* if set indicates async handling */</div><div class='add'>+	struct plock_async_data *data;</div><div class='add'>+};</div><div class='ctx'> </div><div class='ctx'> static inline void set_version(struct dlm_plock_info *info)</div><div class='ctx'> {</div><div class='hunk'>@@ -41,6 +44,27 @@ static inline void set_version(struct dlm_plock_info *info)</div><div class='ctx'> 	info-&gt;version[2] = DLM_PLOCK_VERSION_PATCH;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static struct plock_op *plock_lookup_waiter(const struct dlm_plock_info *info)</div><div class='add'>+{</div><div class='add'>+	struct plock_op *op = NULL, *iter;</div><div class='add'>+</div><div class='add'>+	list_for_each_entry(iter, &amp;recv_list, list) {</div><div class='add'>+		if (iter-&gt;info.fsid == info-&gt;fsid &amp;&amp;</div><div class='add'>+		    iter-&gt;info.number == info-&gt;number &amp;&amp;</div><div class='add'>+		    iter-&gt;info.owner == info-&gt;owner &amp;&amp;</div><div class='add'>+		    iter-&gt;info.pid == info-&gt;pid &amp;&amp;</div><div class='add'>+		    iter-&gt;info.start == info-&gt;start &amp;&amp;</div><div class='add'>+		    iter-&gt;info.end == info-&gt;end &amp;&amp;</div><div class='add'>+		    iter-&gt;info.ex == info-&gt;ex &amp;&amp;</div><div class='add'>+		    iter-&gt;info.wait) {</div><div class='add'>+			op = iter;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return op;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int check_version(struct dlm_plock_info *info)</div><div class='ctx'> {</div><div class='ctx'> 	if ((DLM_PLOCK_VERSION_MAJOR != info-&gt;version[0]) ||</div><div class='hunk'>@@ -58,113 +82,142 @@ static int check_version(struct dlm_plock_info *info)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void dlm_release_plock_op(struct plock_op *op)</div><div class='add'>+{</div><div class='add'>+	kfree(op-&gt;data);</div><div class='add'>+	kfree(op);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void send_op(struct plock_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	set_version(&amp;op-&gt;info);</div><div class='del'>-	INIT_LIST_HEAD(&amp;op-&gt;list);</div><div class='ctx'> 	spin_lock(&amp;ops_lock);</div><div class='ctx'> 	list_add_tail(&amp;op-&gt;list, &amp;send_list);</div><div class='ctx'> 	spin_unlock(&amp;ops_lock);</div><div class='ctx'> 	wake_up(&amp;send_wq);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* If a process was killed while waiting for the only plock on a file,</div><div class='del'>-   locks_remove_posix will not see any lock on the file so it won't</div><div class='del'>-   send an unlock-close to us to pass on to userspace to clean up the</div><div class='del'>-   abandoned waiter.  So, we have to insert the unlock-close when the</div><div class='del'>-   lock call is interrupted. */</div><div class='del'>-</div><div class='del'>-static void do_unlock_close(struct dlm_ls *ls, u64 number,</div><div class='del'>-			    struct file *file, struct file_lock *fl)</div><div class='add'>+static int do_lock_cancel(const struct dlm_plock_info *orig_info)</div><div class='ctx'> {</div><div class='ctx'> 	struct plock_op *op;</div><div class='add'>+	int rv;</div><div class='ctx'> </div><div class='ctx'> 	op = kzalloc(sizeof(*op), GFP_NOFS);</div><div class='ctx'> 	if (!op)</div><div class='del'>-		return;</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	op-&gt;info = *orig_info;</div><div class='add'>+	op-&gt;info.optype = DLM_PLOCK_OP_CANCEL;</div><div class='add'>+	op-&gt;info.wait = 0;</div><div class='ctx'> </div><div class='del'>-	op-&gt;info.optype		= DLM_PLOCK_OP_UNLOCK;</div><div class='del'>-	op-&gt;info.pid		= fl-&gt;fl_pid;</div><div class='del'>-	op-&gt;info.fsid		= ls-&gt;ls_global_id;</div><div class='del'>-	op-&gt;info.number		= number;</div><div class='del'>-	op-&gt;info.start		= 0;</div><div class='del'>-	op-&gt;info.end		= OFFSET_MAX;</div><div class='del'>-	if (fl-&gt;fl_lmops &amp;&amp; fl-&gt;fl_lmops-&gt;lm_grant)</div><div class='del'>-		op-&gt;info.owner	= (__u64) fl-&gt;fl_pid;</div><div class='del'>-	else</div><div class='del'>-		op-&gt;info.owner	= (__u64)(long) fl-&gt;fl_owner;</div><div class='del'>-</div><div class='del'>-	op-&gt;info.flags |= DLM_PLOCK_FL_CLOSE;</div><div class='ctx'> 	send_op(op);</div><div class='add'>+	wait_event(recv_wq, (op-&gt;done != 0));</div><div class='add'>+</div><div class='add'>+	rv = op-&gt;info.rv;</div><div class='add'>+</div><div class='add'>+	dlm_release_plock_op(op);</div><div class='add'>+	return rv;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int dlm_posix_lock(dlm_lockspace_t *lockspace, u64 number, struct file *file,</div><div class='ctx'> 		   int cmd, struct file_lock *fl)</div><div class='ctx'> {</div><div class='add'>+	struct plock_async_data *op_data;</div><div class='ctx'> 	struct dlm_ls *ls;</div><div class='ctx'> 	struct plock_op *op;</div><div class='del'>-	struct plock_xop *xop;</div><div class='ctx'> 	int rv;</div><div class='ctx'> </div><div class='ctx'> 	ls = dlm_find_lockspace_local(lockspace);</div><div class='ctx'> 	if (!ls)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	xop = kzalloc(sizeof(*xop), GFP_NOFS);</div><div class='del'>-	if (!xop) {</div><div class='add'>+	op = kzalloc(sizeof(*op), GFP_NOFS);</div><div class='add'>+	if (!op) {</div><div class='ctx'> 		rv = -ENOMEM;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	op = &amp;xop-&gt;xop;</div><div class='ctx'> 	op-&gt;info.optype		= DLM_PLOCK_OP_LOCK;</div><div class='del'>-	op-&gt;info.pid		= fl-&gt;fl_pid;</div><div class='del'>-	op-&gt;info.ex		= (fl-&gt;fl_type == F_WRLCK);</div><div class='del'>-	op-&gt;info.wait		= IS_SETLKW(cmd);</div><div class='add'>+	op-&gt;info.pid		= fl-&gt;c.flc_pid;</div><div class='add'>+	op-&gt;info.ex		= lock_is_write(fl);</div><div class='add'>+	op-&gt;info.wait		= !!(fl-&gt;c.flc_flags &amp; FL_SLEEP);</div><div class='ctx'> 	op-&gt;info.fsid		= ls-&gt;ls_global_id;</div><div class='ctx'> 	op-&gt;info.number		= number;</div><div class='ctx'> 	op-&gt;info.start		= fl-&gt;fl_start;</div><div class='ctx'> 	op-&gt;info.end		= fl-&gt;fl_end;</div><div class='add'>+	op-&gt;info.owner = (__u64)(long) fl-&gt;c.flc_owner;</div><div class='add'>+	/* async handling */</div><div class='ctx'> 	if (fl-&gt;fl_lmops &amp;&amp; fl-&gt;fl_lmops-&gt;lm_grant) {</div><div class='del'>-		/* fl_owner is lockd which doesn't distinguish</div><div class='del'>-		   processes on the nfs client */</div><div class='del'>-		op-&gt;info.owner	= (__u64) fl-&gt;fl_pid;</div><div class='del'>-		xop-&gt;callback	= fl-&gt;fl_lmops-&gt;lm_grant;</div><div class='del'>-		locks_init_lock(&amp;xop-&gt;flc);</div><div class='del'>-		locks_copy_lock(&amp;xop-&gt;flc, fl);</div><div class='del'>-		xop-&gt;fl		= fl;</div><div class='del'>-		xop-&gt;file	= file;</div><div class='del'>-	} else {</div><div class='del'>-		op-&gt;info.owner	= (__u64)(long) fl-&gt;fl_owner;</div><div class='del'>-		xop-&gt;callback	= NULL;</div><div class='add'>+		op_data = kzalloc(sizeof(*op_data), GFP_NOFS);</div><div class='add'>+		if (!op_data) {</div><div class='add'>+			dlm_release_plock_op(op);</div><div class='add'>+			rv = -ENOMEM;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		op_data-&gt;callback = fl-&gt;fl_lmops-&gt;lm_grant;</div><div class='add'>+		locks_init_lock(&amp;op_data-&gt;flc);</div><div class='add'>+		locks_copy_lock(&amp;op_data-&gt;flc, fl);</div><div class='add'>+		op_data-&gt;fl		= fl;</div><div class='add'>+		op_data-&gt;file	= file;</div><div class='add'>+</div><div class='add'>+		op-&gt;data = op_data;</div><div class='add'>+</div><div class='add'>+		send_op(op);</div><div class='add'>+		rv = FILE_LOCK_DEFERRED;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	send_op(op);</div><div class='ctx'> </div><div class='del'>-	if (xop-&gt;callback == NULL) {</div><div class='add'>+	if (op-&gt;info.wait) {</div><div class='ctx'> 		rv = wait_event_interruptible(recv_wq, (op-&gt;done != 0));</div><div class='ctx'> 		if (rv == -ERESTARTSYS) {</div><div class='del'>-			log_debug(ls, "dlm_posix_lock: wait killed %llx",</div><div class='del'>-				  (unsigned long long)number);</div><div class='ctx'> 			spin_lock(&amp;ops_lock);</div><div class='del'>-			list_del(&amp;op-&gt;list);</div><div class='add'>+			/* recheck under ops_lock if we got a done != 0,</div><div class='add'>+			 * if so this interrupt case should be ignored</div><div class='add'>+			 */</div><div class='add'>+			if (op-&gt;done != 0) {</div><div class='add'>+				spin_unlock(&amp;ops_lock);</div><div class='add'>+				goto do_lock_wait;</div><div class='add'>+			}</div><div class='ctx'> 			spin_unlock(&amp;ops_lock);</div><div class='del'>-			kfree(xop);</div><div class='del'>-			do_unlock_close(ls, number, file, fl);</div><div class='add'>+</div><div class='add'>+			rv = do_lock_cancel(&amp;op-&gt;info);</div><div class='add'>+			switch (rv) {</div><div class='add'>+			case 0:</div><div class='add'>+				/* waiter was deleted in user space, answer will never come</div><div class='add'>+				 * remove original request. The original request must be</div><div class='add'>+				 * on recv_list because the answer of do_lock_cancel()</div><div class='add'>+				 * synchronized it.</div><div class='add'>+				 */</div><div class='add'>+				spin_lock(&amp;ops_lock);</div><div class='add'>+				list_del(&amp;op-&gt;list);</div><div class='add'>+				spin_unlock(&amp;ops_lock);</div><div class='add'>+				rv = -EINTR;</div><div class='add'>+				break;</div><div class='add'>+			case -ENOENT:</div><div class='add'>+				/* cancellation wasn't successful but op should be done */</div><div class='add'>+				fallthrough;</div><div class='add'>+			default:</div><div class='add'>+				/* internal error doing cancel we need to wait */</div><div class='add'>+				goto wait;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			log_debug(ls, "%s: wait interrupted %x %llx pid %d",</div><div class='add'>+				  __func__, ls-&gt;ls_global_id,</div><div class='add'>+				  (unsigned long long)number, op-&gt;info.pid);</div><div class='add'>+			dlm_release_plock_op(op);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='del'>-		rv = FILE_LOCK_DEFERRED;</div><div class='del'>-		goto out;</div><div class='add'>+wait:</div><div class='add'>+		wait_event(recv_wq, (op-&gt;done != 0));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ops_lock);</div><div class='del'>-	if (!list_empty(&amp;op-&gt;list)) {</div><div class='del'>-		log_error(ls, "dlm_posix_lock: op on list %llx",</div><div class='del'>-			  (unsigned long long)number);</div><div class='del'>-		list_del(&amp;op-&gt;list);</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;ops_lock);</div><div class='add'>+do_lock_wait:</div><div class='add'>+</div><div class='add'>+	WARN_ON(!list_empty(&amp;op-&gt;list));</div><div class='ctx'> </div><div class='ctx'> 	rv = op-&gt;info.rv;</div><div class='ctx'> </div><div class='hunk'>@@ -174,7 +227,7 @@ int dlm_posix_lock(dlm_lockspace_t *lockspace, u64 number, struct file *file,</div><div class='ctx'> 				  (unsigned long long)number);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	kfree(xop);</div><div class='add'>+	dlm_release_plock_op(op);</div><div class='ctx'> out:</div><div class='ctx'> 	dlm_put_lockspace(ls);</div><div class='ctx'> 	return rv;</div><div class='hunk'>@@ -184,26 +237,20 @@ EXPORT_SYMBOL_GPL(dlm_posix_lock);</div><div class='ctx'> /* Returns failure iff a successful lock operation should be canceled */</div><div class='ctx'> static int dlm_plock_callback(struct plock_op *op)</div><div class='ctx'> {</div><div class='add'>+	struct plock_async_data *op_data = op-&gt;data;</div><div class='ctx'> 	struct file *file;</div><div class='ctx'> 	struct file_lock *fl;</div><div class='ctx'> 	struct file_lock *flc;</div><div class='ctx'> 	int (*notify)(struct file_lock *fl, int result) = NULL;</div><div class='del'>-	struct plock_xop *xop = (struct plock_xop *)op;</div><div class='ctx'> 	int rv = 0;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ops_lock);</div><div class='del'>-	if (!list_empty(&amp;op-&gt;list)) {</div><div class='del'>-		log_print("dlm_plock_callback: op on list %llx",</div><div class='del'>-			  (unsigned long long)op-&gt;info.number);</div><div class='del'>-		list_del(&amp;op-&gt;list);</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;ops_lock);</div><div class='add'>+	WARN_ON(!list_empty(&amp;op-&gt;list));</div><div class='ctx'> </div><div class='ctx'> 	/* check if the following 2 are still valid or make a copy */</div><div class='del'>-	file = xop-&gt;file;</div><div class='del'>-	flc = &amp;xop-&gt;flc;</div><div class='del'>-	fl = xop-&gt;fl;</div><div class='del'>-	notify = xop-&gt;callback;</div><div class='add'>+	file = op_data-&gt;file;</div><div class='add'>+	flc = &amp;op_data-&gt;flc;</div><div class='add'>+	fl = op_data-&gt;fl;</div><div class='add'>+	notify = op_data-&gt;callback;</div><div class='ctx'> </div><div class='ctx'> 	if (op-&gt;info.rv) {</div><div class='ctx'> 		notify(fl, op-&gt;info.rv);</div><div class='hunk'>@@ -211,7 +258,7 @@ static int dlm_plock_callback(struct plock_op *op)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* got fs lock; bookkeep locally as well: */</div><div class='del'>-	flc-&gt;fl_flags &amp;= ~FL_SLEEP;</div><div class='add'>+	flc-&gt;c.flc_flags &amp;= ~FL_SLEEP;</div><div class='ctx'> 	if (posix_lock_file(file, flc, NULL)) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * This can only happen in the case of kmalloc() failure.</div><div class='hunk'>@@ -228,13 +275,13 @@ static int dlm_plock_callback(struct plock_op *op)</div><div class='ctx'> 	rv = notify(fl, 0);</div><div class='ctx'> 	if (rv) {</div><div class='ctx'> 		/* XXX: We need to cancel the fs lock here: */</div><div class='del'>-		log_print("dlm_plock_callback: lock granted after lock request "</div><div class='del'>-			  "failed; dangling lock!\n");</div><div class='add'>+		log_print("%s: lock granted after lock request failed; dangling lock!",</div><div class='add'>+			  __func__);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	kfree(xop);</div><div class='add'>+	dlm_release_plock_op(op);</div><div class='ctx'> 	return rv;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -244,7 +291,7 @@ int dlm_posix_unlock(dlm_lockspace_t *lockspace, u64 number, struct file *file,</div><div class='ctx'> 	struct dlm_ls *ls;</div><div class='ctx'> 	struct plock_op *op;</div><div class='ctx'> 	int rv;</div><div class='del'>-	unsigned char fl_flags = fl-&gt;fl_flags;</div><div class='add'>+	unsigned char saved_flags = fl-&gt;c.flc_flags;</div><div class='ctx'> </div><div class='ctx'> 	ls = dlm_find_lockspace_local(lockspace);</div><div class='ctx'> 	if (!ls)</div><div class='hunk'>@@ -257,7 +304,7 @@ int dlm_posix_unlock(dlm_lockspace_t *lockspace, u64 number, struct file *file,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* cause the vfs unlock to return ENOENT if lock is not found */</div><div class='del'>-	fl-&gt;fl_flags |= FL_EXISTS;</div><div class='add'>+	fl-&gt;c.flc_flags |= FL_EXISTS;</div><div class='ctx'> </div><div class='ctx'> 	rv = locks_lock_file_wait(file, fl);</div><div class='ctx'> 	if (rv == -ENOENT) {</div><div class='hunk'>@@ -270,17 +317,14 @@ int dlm_posix_unlock(dlm_lockspace_t *lockspace, u64 number, struct file *file,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	op-&gt;info.optype		= DLM_PLOCK_OP_UNLOCK;</div><div class='del'>-	op-&gt;info.pid		= fl-&gt;fl_pid;</div><div class='add'>+	op-&gt;info.pid		= fl-&gt;c.flc_pid;</div><div class='ctx'> 	op-&gt;info.fsid		= ls-&gt;ls_global_id;</div><div class='ctx'> 	op-&gt;info.number		= number;</div><div class='ctx'> 	op-&gt;info.start		= fl-&gt;fl_start;</div><div class='ctx'> 	op-&gt;info.end		= fl-&gt;fl_end;</div><div class='del'>-	if (fl-&gt;fl_lmops &amp;&amp; fl-&gt;fl_lmops-&gt;lm_grant)</div><div class='del'>-		op-&gt;info.owner	= (__u64) fl-&gt;fl_pid;</div><div class='del'>-	else</div><div class='del'>-		op-&gt;info.owner	= (__u64)(long) fl-&gt;fl_owner;</div><div class='add'>+	op-&gt;info.owner = (__u64)(long) fl-&gt;c.flc_owner;</div><div class='ctx'> </div><div class='del'>-	if (fl-&gt;fl_flags &amp; FL_CLOSE) {</div><div class='add'>+	if (fl-&gt;c.flc_flags &amp; FL_CLOSE) {</div><div class='ctx'> 		op-&gt;info.flags |= DLM_PLOCK_FL_CLOSE;</div><div class='ctx'> 		send_op(op);</div><div class='ctx'> 		rv = 0;</div><div class='hunk'>@@ -290,13 +334,7 @@ int dlm_posix_unlock(dlm_lockspace_t *lockspace, u64 number, struct file *file,</div><div class='ctx'> 	send_op(op);</div><div class='ctx'> 	wait_event(recv_wq, (op-&gt;done != 0));</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ops_lock);</div><div class='del'>-	if (!list_empty(&amp;op-&gt;list)) {</div><div class='del'>-		log_error(ls, "dlm_posix_unlock: op on list %llx",</div><div class='del'>-			  (unsigned long long)number);</div><div class='del'>-		list_del(&amp;op-&gt;list);</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;ops_lock);</div><div class='add'>+	WARN_ON(!list_empty(&amp;op-&gt;list));</div><div class='ctx'> </div><div class='ctx'> 	rv = op-&gt;info.rv;</div><div class='ctx'> </div><div class='hunk'>@@ -304,14 +342,83 @@ int dlm_posix_unlock(dlm_lockspace_t *lockspace, u64 number, struct file *file,</div><div class='ctx'> 		rv = 0;</div><div class='ctx'> </div><div class='ctx'> out_free:</div><div class='del'>-	kfree(op);</div><div class='add'>+	dlm_release_plock_op(op);</div><div class='ctx'> out:</div><div class='ctx'> 	dlm_put_lockspace(ls);</div><div class='del'>-	fl-&gt;fl_flags = fl_flags;</div><div class='add'>+	fl-&gt;c.flc_flags = saved_flags;</div><div class='ctx'> 	return rv;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(dlm_posix_unlock);</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * NOTE: This implementation can only handle async lock requests as nfs</div><div class='add'>+ * do it. It cannot handle cancellation of a pending lock request sitting</div><div class='add'>+ * in wait_event(), but for now only nfs is the only user local kernel</div><div class='add'>+ * user.</div><div class='add'>+ */</div><div class='add'>+int dlm_posix_cancel(dlm_lockspace_t *lockspace, u64 number, struct file *file,</div><div class='add'>+		     struct file_lock *fl)</div><div class='add'>+{</div><div class='add'>+	struct dlm_plock_info info;</div><div class='add'>+	struct plock_op *op;</div><div class='add'>+	struct dlm_ls *ls;</div><div class='add'>+	int rv;</div><div class='add'>+</div><div class='add'>+	/* this only works for async request for now and nfs is the only</div><div class='add'>+	 * kernel user right now.</div><div class='add'>+	 */</div><div class='add'>+	if (WARN_ON_ONCE(!fl-&gt;fl_lmops || !fl-&gt;fl_lmops-&gt;lm_grant))</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+</div><div class='add'>+	ls = dlm_find_lockspace_local(lockspace);</div><div class='add'>+	if (!ls)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	memset(&amp;info, 0, sizeof(info));</div><div class='add'>+	info.pid = fl-&gt;c.flc_pid;</div><div class='add'>+	info.ex = lock_is_write(fl);</div><div class='add'>+	info.fsid = ls-&gt;ls_global_id;</div><div class='add'>+	dlm_put_lockspace(ls);</div><div class='add'>+	info.number = number;</div><div class='add'>+	info.start = fl-&gt;fl_start;</div><div class='add'>+	info.end = fl-&gt;fl_end;</div><div class='add'>+	info.owner = (__u64)(long) fl-&gt;c.flc_owner;</div><div class='add'>+</div><div class='add'>+	rv = do_lock_cancel(&amp;info);</div><div class='add'>+	switch (rv) {</div><div class='add'>+	case 0:</div><div class='add'>+		spin_lock(&amp;ops_lock);</div><div class='add'>+		/* lock request to cancel must be on recv_list because</div><div class='add'>+		 * do_lock_cancel() synchronizes it.</div><div class='add'>+		 */</div><div class='add'>+		op = plock_lookup_waiter(&amp;info);</div><div class='add'>+		if (WARN_ON_ONCE(!op)) {</div><div class='add'>+			spin_unlock(&amp;ops_lock);</div><div class='add'>+			rv = -ENOLCK;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		list_del(&amp;op-&gt;list);</div><div class='add'>+		spin_unlock(&amp;ops_lock);</div><div class='add'>+		WARN_ON(op-&gt;info.optype != DLM_PLOCK_OP_LOCK);</div><div class='add'>+		op-&gt;data-&gt;callback(op-&gt;data-&gt;fl, -EINTR);</div><div class='add'>+		dlm_release_plock_op(op);</div><div class='add'>+		rv = -EINTR;</div><div class='add'>+		break;</div><div class='add'>+	case -ENOENT:</div><div class='add'>+		/* if cancel wasn't successful we probably were to late</div><div class='add'>+		 * or it was a non-blocking lock request, so just unlock it.</div><div class='add'>+		 */</div><div class='add'>+		rv = dlm_posix_unlock(lockspace, number, file, fl);</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return rv;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(dlm_posix_cancel);</div><div class='add'>+</div><div class='ctx'> int dlm_posix_get(dlm_lockspace_t *lockspace, u64 number, struct file *file,</div><div class='ctx'> 		  struct file_lock *fl)</div><div class='ctx'> {</div><div class='hunk'>@@ -330,47 +437,40 @@ int dlm_posix_get(dlm_lockspace_t *lockspace, u64 number, struct file *file,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	op-&gt;info.optype		= DLM_PLOCK_OP_GET;</div><div class='del'>-	op-&gt;info.pid		= fl-&gt;fl_pid;</div><div class='del'>-	op-&gt;info.ex		= (fl-&gt;fl_type == F_WRLCK);</div><div class='add'>+	op-&gt;info.pid		= fl-&gt;c.flc_pid;</div><div class='add'>+	op-&gt;info.ex		= lock_is_write(fl);</div><div class='ctx'> 	op-&gt;info.fsid		= ls-&gt;ls_global_id;</div><div class='ctx'> 	op-&gt;info.number		= number;</div><div class='ctx'> 	op-&gt;info.start		= fl-&gt;fl_start;</div><div class='ctx'> 	op-&gt;info.end		= fl-&gt;fl_end;</div><div class='del'>-	if (fl-&gt;fl_lmops &amp;&amp; fl-&gt;fl_lmops-&gt;lm_grant)</div><div class='del'>-		op-&gt;info.owner	= (__u64) fl-&gt;fl_pid;</div><div class='del'>-	else</div><div class='del'>-		op-&gt;info.owner	= (__u64)(long) fl-&gt;fl_owner;</div><div class='add'>+	op-&gt;info.owner = (__u64)(long) fl-&gt;c.flc_owner;</div><div class='ctx'> </div><div class='ctx'> 	send_op(op);</div><div class='ctx'> 	wait_event(recv_wq, (op-&gt;done != 0));</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ops_lock);</div><div class='del'>-	if (!list_empty(&amp;op-&gt;list)) {</div><div class='del'>-		log_error(ls, "dlm_posix_get: op on list %llx",</div><div class='del'>-			  (unsigned long long)number);</div><div class='del'>-		list_del(&amp;op-&gt;list);</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;ops_lock);</div><div class='add'>+	WARN_ON(!list_empty(&amp;op-&gt;list));</div><div class='ctx'> </div><div class='ctx'> 	/* info.rv from userspace is 1 for conflict, 0 for no-conflict,</div><div class='ctx'> 	   -ENOENT if there are no locks on the file */</div><div class='ctx'> </div><div class='ctx'> 	rv = op-&gt;info.rv;</div><div class='ctx'> </div><div class='del'>-	fl-&gt;fl_type = F_UNLCK;</div><div class='add'>+	fl-&gt;c.flc_type = F_UNLCK;</div><div class='ctx'> 	if (rv == -ENOENT)</div><div class='ctx'> 		rv = 0;</div><div class='ctx'> 	else if (rv &gt; 0) {</div><div class='ctx'> 		locks_init_lock(fl);</div><div class='del'>-		fl-&gt;fl_type = (op-&gt;info.ex) ? F_WRLCK : F_RDLCK;</div><div class='del'>-		fl-&gt;fl_flags = FL_POSIX;</div><div class='del'>-		fl-&gt;fl_pid = -op-&gt;info.pid;</div><div class='add'>+		fl-&gt;c.flc_type = (op-&gt;info.ex) ? F_WRLCK : F_RDLCK;</div><div class='add'>+		fl-&gt;c.flc_flags = FL_POSIX;</div><div class='add'>+		fl-&gt;c.flc_pid = op-&gt;info.pid;</div><div class='add'>+		if (op-&gt;info.nodeid != dlm_our_nodeid())</div><div class='add'>+			fl-&gt;c.flc_pid = -fl-&gt;c.flc_pid;</div><div class='ctx'> 		fl-&gt;fl_start = op-&gt;info.start;</div><div class='ctx'> 		fl-&gt;fl_end = op-&gt;info.end;</div><div class='ctx'> 		rv = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	kfree(op);</div><div class='add'>+	dlm_release_plock_op(op);</div><div class='ctx'> out:</div><div class='ctx'> 	dlm_put_lockspace(ls);</div><div class='ctx'> 	return rv;</div><div class='hunk'>@@ -389,11 +489,11 @@ static ssize_t dev_read(struct file *file, char __user *u, size_t count,</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;ops_lock);</div><div class='ctx'> 	if (!list_empty(&amp;send_list)) {</div><div class='del'>-		op = list_entry(send_list.next, struct plock_op, list);</div><div class='add'>+		op = list_first_entry(&amp;send_list, struct plock_op, list);</div><div class='ctx'> 		if (op-&gt;info.flags &amp; DLM_PLOCK_FL_CLOSE)</div><div class='ctx'> 			list_del(&amp;op-&gt;list);</div><div class='ctx'> 		else</div><div class='del'>-			list_move(&amp;op-&gt;list, &amp;recv_list);</div><div class='add'>+			list_move_tail(&amp;op-&gt;list, &amp;recv_list);</div><div class='ctx'> 		memcpy(&amp;info, &amp;op-&gt;info, sizeof(info));</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;ops_lock);</div><div class='hunk'>@@ -401,12 +501,14 @@ static ssize_t dev_read(struct file *file, char __user *u, size_t count,</div><div class='ctx'> 	if (!op)</div><div class='ctx'> 		return -EAGAIN;</div><div class='ctx'> </div><div class='add'>+	trace_dlm_plock_read(&amp;info);</div><div class='add'>+</div><div class='ctx'> 	/* there is no need to get a reply from userspace for unlocks</div><div class='ctx'> 	   that were generated by the vfs cleaning up for a close</div><div class='ctx'> 	   (the process did not make an unlock call). */</div><div class='ctx'> </div><div class='ctx'> 	if (op-&gt;info.flags &amp; DLM_PLOCK_FL_CLOSE)</div><div class='del'>-		kfree(op);</div><div class='add'>+		dlm_release_plock_op(op);</div><div class='ctx'> </div><div class='ctx'> 	if (copy_to_user(u, &amp;info, sizeof(info)))</div><div class='ctx'> 		return -EFAULT;</div><div class='hunk'>@@ -418,9 +520,9 @@ static ssize_t dev_read(struct file *file, char __user *u, size_t count,</div><div class='ctx'> static ssize_t dev_write(struct file *file, const char __user *u, size_t count,</div><div class='ctx'> 			 loff_t *ppos)</div><div class='ctx'> {</div><div class='add'>+	struct plock_op *op = NULL, *iter;</div><div class='ctx'> 	struct dlm_plock_info info;</div><div class='del'>-	struct plock_op *op;</div><div class='del'>-	int found = 0, do_callback = 0;</div><div class='add'>+	int do_callback = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (count != sizeof(info))</div><div class='ctx'> 		return -EINVAL;</div><div class='hunk'>@@ -428,35 +530,56 @@ static ssize_t dev_write(struct file *file, const char __user *u, size_t count,</div><div class='ctx'> 	if (copy_from_user(&amp;info, u, sizeof(info)))</div><div class='ctx'> 		return -EFAULT;</div><div class='ctx'> </div><div class='add'>+	trace_dlm_plock_write(&amp;info);</div><div class='add'>+</div><div class='ctx'> 	if (check_version(&amp;info))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * The results for waiting ops (SETLKW) can be returned in any</div><div class='add'>+	 * order, so match all fields to find the op.  The results for</div><div class='add'>+	 * non-waiting ops are returned in the order that they were sent</div><div class='add'>+	 * to userspace, so match the result with the first non-waiting op.</div><div class='add'>+	 */</div><div class='ctx'> 	spin_lock(&amp;ops_lock);</div><div class='del'>-	list_for_each_entry(op, &amp;recv_list, list) {</div><div class='del'>-		if (op-&gt;info.fsid == info.fsid &amp;&amp;</div><div class='del'>-		    op-&gt;info.number == info.number &amp;&amp;</div><div class='del'>-		    op-&gt;info.owner == info.owner) {</div><div class='del'>-			struct plock_xop *xop = (struct plock_xop *)op;</div><div class='del'>-			list_del_init(&amp;op-&gt;list);</div><div class='del'>-			memcpy(&amp;op-&gt;info, &amp;info, sizeof(info));</div><div class='del'>-			if (xop-&gt;callback)</div><div class='del'>-				do_callback = 1;</div><div class='del'>-			else</div><div class='del'>-				op-&gt;done = 1;</div><div class='del'>-			found = 1;</div><div class='del'>-			break;</div><div class='add'>+	if (info.wait) {</div><div class='add'>+		op = plock_lookup_waiter(&amp;info);</div><div class='add'>+	} else {</div><div class='add'>+		list_for_each_entry(iter, &amp;recv_list, list) {</div><div class='add'>+			if (!iter-&gt;info.wait &amp;&amp;</div><div class='add'>+			    iter-&gt;info.fsid == info.fsid) {</div><div class='add'>+				op = iter;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	if (op) {</div><div class='add'>+		/* Sanity check that op and info match. */</div><div class='add'>+		if (info.wait)</div><div class='add'>+			WARN_ON(op-&gt;info.optype != DLM_PLOCK_OP_LOCK);</div><div class='add'>+		else</div><div class='add'>+			WARN_ON(op-&gt;info.number != info.number ||</div><div class='add'>+				op-&gt;info.owner != info.owner ||</div><div class='add'>+				op-&gt;info.optype != info.optype);</div><div class='add'>+</div><div class='add'>+		list_del_init(&amp;op-&gt;list);</div><div class='add'>+		memcpy(&amp;op-&gt;info, &amp;info, sizeof(info));</div><div class='add'>+		if (op-&gt;data)</div><div class='add'>+			do_callback = 1;</div><div class='add'>+		else</div><div class='add'>+			op-&gt;done = 1;</div><div class='add'>+	}</div><div class='ctx'> 	spin_unlock(&amp;ops_lock);</div><div class='ctx'> </div><div class='del'>-	if (found) {</div><div class='add'>+	if (op) {</div><div class='ctx'> 		if (do_callback)</div><div class='ctx'> 			dlm_plock_callback(op);</div><div class='ctx'> 		else</div><div class='ctx'> 			wake_up(&amp;recv_wq);</div><div class='ctx'> 	} else</div><div class='del'>-		log_print("dev_write no op %x %llx", info.fsid,</div><div class='del'>-			  (unsigned long long)info.number);</div><div class='add'>+		pr_debug("%s: no op %x %llx", __func__,</div><div class='add'>+			 info.fsid, (unsigned long long)info.number);</div><div class='ctx'> 	return count;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -492,12 +615,6 @@ int dlm_plock_init(void)</div><div class='ctx'> {</div><div class='ctx'> 	int rv;</div><div class='ctx'> </div><div class='del'>-	spin_lock_init(&amp;ops_lock);</div><div class='del'>-	INIT_LIST_HEAD(&amp;send_list);</div><div class='del'>-	INIT_LIST_HEAD(&amp;recv_list);</div><div class='del'>-	init_waitqueue_head(&amp;send_wq);</div><div class='del'>-	init_waitqueue_head(&amp;recv_wq);</div><div class='del'>-</div><div class='ctx'> 	rv = misc_register(&amp;plock_dev_misc);</div><div class='ctx'> 	if (rv)</div><div class='ctx'> 		log_print("dlm_plock_init: misc_register failed %d", rv);</div><div class='hunk'>@@ -507,5 +624,7 @@ int dlm_plock_init(void)</div><div class='ctx'> void dlm_plock_exit(void)</div><div class='ctx'> {</div><div class='ctx'> 	misc_deregister(&amp;plock_dev_misc);</div><div class='add'>+	WARN_ON(!list_empty(&amp;send_list));</div><div class='add'>+	WARN_ON(!list_empty(&amp;recv_list));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/dlm/rcom.c b/fs/dlm/rcom.c<br/>index 6cba86470278..be1a71a6303a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/rcom.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/rcom.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/rcom.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/rcom.c</a></div><div class='hunk'>@@ -28,76 +28,72 @@ static int rcom_response(struct dlm_ls *ls)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void _create_rcom(struct dlm_ls *ls, int to_nodeid, int type, int len,</div><div class='del'>-			 struct dlm_rcom **rc_ret, char *mb, int mb_len)</div><div class='add'>+			 struct dlm_rcom **rc_ret, char *mb, int mb_len,</div><div class='add'>+			 uint64_t seq)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rcom *rc;</div><div class='ctx'> </div><div class='ctx'> 	rc = (struct dlm_rcom *) mb;</div><div class='ctx'> </div><div class='del'>-	rc-&gt;rc_header.h_version = (DLM_HEADER_MAJOR | DLM_HEADER_MINOR);</div><div class='del'>-	rc-&gt;rc_header.u.h_lockspace = ls-&gt;ls_global_id;</div><div class='del'>-	rc-&gt;rc_header.h_nodeid = dlm_our_nodeid();</div><div class='del'>-	rc-&gt;rc_header.h_length = mb_len;</div><div class='add'>+	rc-&gt;rc_header.h_version = cpu_to_le32(DLM_HEADER_MAJOR | DLM_HEADER_MINOR);</div><div class='add'>+	rc-&gt;rc_header.u.h_lockspace = cpu_to_le32(ls-&gt;ls_global_id);</div><div class='add'>+	rc-&gt;rc_header.h_nodeid = cpu_to_le32(dlm_our_nodeid());</div><div class='add'>+	rc-&gt;rc_header.h_length = cpu_to_le16(mb_len);</div><div class='ctx'> 	rc-&gt;rc_header.h_cmd = DLM_RCOM;</div><div class='ctx'> </div><div class='del'>-	rc-&gt;rc_type = type;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_recover_lock);</div><div class='del'>-	rc-&gt;rc_seq = ls-&gt;ls_recover_seq;</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_recover_lock);</div><div class='add'>+	rc-&gt;rc_type = cpu_to_le32(type);</div><div class='add'>+	rc-&gt;rc_seq = cpu_to_le64(seq);</div><div class='ctx'> </div><div class='ctx'> 	*rc_ret = rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int create_rcom(struct dlm_ls *ls, int to_nodeid, int type, int len,</div><div class='del'>-		       struct dlm_rcom **rc_ret, struct dlm_mhandle **mh_ret)</div><div class='add'>+		       struct dlm_rcom **rc_ret, struct dlm_mhandle **mh_ret,</div><div class='add'>+		       uint64_t seq)</div><div class='ctx'> {</div><div class='ctx'> 	int mb_len = sizeof(struct dlm_rcom) + len;</div><div class='ctx'> 	struct dlm_mhandle *mh;</div><div class='ctx'> 	char *mb;</div><div class='ctx'> </div><div class='del'>-	mh = dlm_midcomms_get_mhandle(to_nodeid, mb_len, GFP_NOFS, &amp;mb);</div><div class='add'>+	mh = dlm_midcomms_get_mhandle(to_nodeid, mb_len, &amp;mb);</div><div class='ctx'> 	if (!mh) {</div><div class='ctx'> 		log_print("%s to %d type %d len %d ENOBUFS",</div><div class='ctx'> 			  __func__, to_nodeid, type, len);</div><div class='ctx'> 		return -ENOBUFS;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	_create_rcom(ls, to_nodeid, type, len, rc_ret, mb, mb_len);</div><div class='add'>+	_create_rcom(ls, to_nodeid, type, len, rc_ret, mb, mb_len, seq);</div><div class='ctx'> 	*mh_ret = mh;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int create_rcom_stateless(struct dlm_ls *ls, int to_nodeid, int type,</div><div class='ctx'> 				 int len, struct dlm_rcom **rc_ret,</div><div class='del'>-				 struct dlm_msg **msg_ret)</div><div class='add'>+				 struct dlm_msg **msg_ret, uint64_t seq)</div><div class='ctx'> {</div><div class='ctx'> 	int mb_len = sizeof(struct dlm_rcom) + len;</div><div class='ctx'> 	struct dlm_msg *msg;</div><div class='ctx'> 	char *mb;</div><div class='ctx'> </div><div class='del'>-	msg = dlm_lowcomms_new_msg(to_nodeid, mb_len, GFP_NOFS, &amp;mb,</div><div class='del'>-				   NULL, NULL);</div><div class='add'>+	msg = dlm_lowcomms_new_msg(to_nodeid, mb_len, &amp;mb, NULL, NULL);</div><div class='ctx'> 	if (!msg) {</div><div class='ctx'> 		log_print("create_rcom to %d type %d len %d ENOBUFS",</div><div class='ctx'> 			  to_nodeid, type, len);</div><div class='ctx'> 		return -ENOBUFS;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	_create_rcom(ls, to_nodeid, type, len, rc_ret, mb, mb_len);</div><div class='add'>+	_create_rcom(ls, to_nodeid, type, len, rc_ret, mb, mb_len, seq);</div><div class='ctx'> 	*msg_ret = msg;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void send_rcom(struct dlm_mhandle *mh, struct dlm_rcom *rc)</div><div class='ctx'> {</div><div class='del'>-	dlm_rcom_out(rc);</div><div class='del'>-	dlm_midcomms_commit_mhandle(mh);</div><div class='add'>+	dlm_midcomms_commit_mhandle(mh, NULL, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void send_rcom_stateless(struct dlm_msg *msg, struct dlm_rcom *rc)</div><div class='ctx'> {</div><div class='del'>-	dlm_rcom_out(rc);</div><div class='ctx'> 	dlm_lowcomms_commit_msg(msg);</div><div class='ctx'> 	dlm_lowcomms_put_msg(msg);</div><div class='ctx'> }</div><div class='hunk'>@@ -127,10 +123,10 @@ static int check_rcom_config(struct dlm_ls *ls, struct dlm_rcom *rc, int nodeid)</div><div class='ctx'> {</div><div class='ctx'> 	struct rcom_config *rf = (struct rcom_config *) rc-&gt;rc_buf;</div><div class='ctx'> </div><div class='del'>-	if ((rc-&gt;rc_header.h_version &amp; 0xFFFF0000) != DLM_HEADER_MAJOR) {</div><div class='add'>+	if ((le32_to_cpu(rc-&gt;rc_header.h_version) &amp; 0xFFFF0000) != DLM_HEADER_MAJOR) {</div><div class='ctx'> 		log_error(ls, "version mismatch: %x nodeid %d: %x",</div><div class='ctx'> 			  DLM_HEADER_MAJOR | DLM_HEADER_MINOR, nodeid,</div><div class='del'>-			  rc-&gt;rc_header.h_version);</div><div class='add'>+			  le32_to_cpu(rc-&gt;rc_header.h_version));</div><div class='ctx'> 		return -EPROTO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -145,20 +141,20 @@ static int check_rcom_config(struct dlm_ls *ls, struct dlm_rcom *rc, int nodeid)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void allow_sync_reply(struct dlm_ls *ls, uint64_t *new_seq)</div><div class='add'>+static void allow_sync_reply(struct dlm_ls *ls, __le64 *new_seq)</div><div class='ctx'> {</div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_rcom_spin);</div><div class='del'>-	*new_seq = ++ls-&gt;ls_rcom_seq;</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_rcom_spin);</div><div class='add'>+	*new_seq = cpu_to_le64(++ls-&gt;ls_rcom_seq);</div><div class='ctx'> 	set_bit(LSFL_RCOM_WAIT, &amp;ls-&gt;ls_flags);</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_rcom_spin);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_rcom_spin);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void disallow_sync_reply(struct dlm_ls *ls)</div><div class='ctx'> {</div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_rcom_spin);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_rcom_spin);</div><div class='ctx'> 	clear_bit(LSFL_RCOM_WAIT, &amp;ls-&gt;ls_flags);</div><div class='ctx'> 	clear_bit(LSFL_RCOM_READY, &amp;ls-&gt;ls_flags);</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_rcom_spin);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_rcom_spin);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -172,7 +168,8 @@ static void disallow_sync_reply(struct dlm_ls *ls)</div><div class='ctx'>  * node's rcom_config.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-int dlm_rcom_status(struct dlm_ls *ls, int nodeid, uint32_t status_flags)</div><div class='add'>+int dlm_rcom_status(struct dlm_ls *ls, int nodeid, uint32_t status_flags,</div><div class='add'>+		    uint64_t seq)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rcom *rc;</div><div class='ctx'> 	struct dlm_msg *msg;</div><div class='hunk'>@@ -182,13 +179,14 @@ int dlm_rcom_status(struct dlm_ls *ls, int nodeid, uint32_t status_flags)</div><div class='ctx'> </div><div class='ctx'> 	if (nodeid == dlm_our_nodeid()) {</div><div class='ctx'> 		rc = ls-&gt;ls_recover_buf;</div><div class='del'>-		rc-&gt;rc_result = dlm_recover_status(ls);</div><div class='add'>+		rc-&gt;rc_result = cpu_to_le32(dlm_recover_status(ls));</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> retry:</div><div class='ctx'> 	error = create_rcom_stateless(ls, nodeid, DLM_RCOM_STATUS,</div><div class='del'>-				      sizeof(struct rcom_status), &amp;rc, &amp;msg);</div><div class='add'>+				      sizeof(struct rcom_status), &amp;rc, &amp;msg,</div><div class='add'>+				      seq);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -208,7 +206,7 @@ retry:</div><div class='ctx'> </div><div class='ctx'> 	rc = ls-&gt;ls_recover_buf;</div><div class='ctx'> </div><div class='del'>-	if (rc-&gt;rc_result == -ESRCH) {</div><div class='add'>+	if (rc-&gt;rc_result == cpu_to_le32(-ESRCH)) {</div><div class='ctx'> 		/* we pretend the remote lockspace exists with 0 status */</div><div class='ctx'> 		log_debug(ls, "remote node %d not ready", nodeid);</div><div class='ctx'> 		rc-&gt;rc_result = 0;</div><div class='hunk'>@@ -222,12 +220,14 @@ retry:</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void receive_rcom_status(struct dlm_ls *ls, struct dlm_rcom *rc_in)</div><div class='add'>+static void receive_rcom_status(struct dlm_ls *ls,</div><div class='add'>+				const struct dlm_rcom *rc_in,</div><div class='add'>+				uint64_t seq)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rcom *rc;</div><div class='ctx'> 	struct rcom_status *rs;</div><div class='ctx'> 	uint32_t status;</div><div class='del'>-	int nodeid = rc_in-&gt;rc_header.h_nodeid;</div><div class='add'>+	int nodeid = le32_to_cpu(rc_in-&gt;rc_header.h_nodeid);</div><div class='ctx'> 	int len = sizeof(struct rcom_config);</div><div class='ctx'> 	struct dlm_msg *msg;</div><div class='ctx'> 	int num_slots = 0;</div><div class='hunk'>@@ -245,30 +245,30 @@ static void receive_rcom_status(struct dlm_ls *ls, struct dlm_rcom *rc_in)</div><div class='ctx'> 		goto do_create;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_recover_lock);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_recover_lock);</div><div class='ctx'> 	status = ls-&gt;ls_recover_status;</div><div class='ctx'> 	num_slots = ls-&gt;ls_num_slots;</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_recover_lock);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_recover_lock);</div><div class='ctx'> 	len += num_slots * sizeof(struct rcom_slot);</div><div class='ctx'> </div><div class='ctx'>  do_create:</div><div class='ctx'> 	error = create_rcom_stateless(ls, nodeid, DLM_RCOM_STATUS_REPLY,</div><div class='del'>-				      len, &amp;rc, &amp;msg);</div><div class='add'>+				      len, &amp;rc, &amp;msg, seq);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	rc-&gt;rc_id = rc_in-&gt;rc_id;</div><div class='ctx'> 	rc-&gt;rc_seq_reply = rc_in-&gt;rc_seq;</div><div class='del'>-	rc-&gt;rc_result = status;</div><div class='add'>+	rc-&gt;rc_result = cpu_to_le32(status);</div><div class='ctx'> </div><div class='ctx'> 	set_rcom_config(ls, (struct rcom_config *)rc-&gt;rc_buf, num_slots);</div><div class='ctx'> </div><div class='ctx'> 	if (!num_slots)</div><div class='ctx'> 		goto do_send;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_recover_lock);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_recover_lock);</div><div class='ctx'> 	if (ls-&gt;ls_num_slots != num_slots) {</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_recover_lock);</div><div class='add'>+		spin_unlock_bh(&amp;ls-&gt;ls_recover_lock);</div><div class='ctx'> 		log_debug(ls, "receive_rcom_status num_slots %d to %d",</div><div class='ctx'> 			  num_slots, ls-&gt;ls_num_slots);</div><div class='ctx'> 		rc-&gt;rc_result = 0;</div><div class='hunk'>@@ -277,42 +277,45 @@ static void receive_rcom_status(struct dlm_ls *ls, struct dlm_rcom *rc_in)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	dlm_slots_copy_out(ls, rc);</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_recover_lock);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_recover_lock);</div><div class='ctx'> </div><div class='ctx'>  do_send:</div><div class='ctx'> 	send_rcom_stateless(msg, rc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void receive_sync_reply(struct dlm_ls *ls, struct dlm_rcom *rc_in)</div><div class='add'>+static void receive_sync_reply(struct dlm_ls *ls, const struct dlm_rcom *rc_in)</div><div class='ctx'> {</div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_rcom_spin);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_rcom_spin);</div><div class='ctx'> 	if (!test_bit(LSFL_RCOM_WAIT, &amp;ls-&gt;ls_flags) ||</div><div class='del'>-	    rc_in-&gt;rc_id != ls-&gt;ls_rcom_seq) {</div><div class='add'>+	    le64_to_cpu(rc_in-&gt;rc_id) != ls-&gt;ls_rcom_seq) {</div><div class='ctx'> 		log_debug(ls, "reject reply %d from %d seq %llx expect %llx",</div><div class='del'>-			  rc_in-&gt;rc_type, rc_in-&gt;rc_header.h_nodeid,</div><div class='del'>-			  (unsigned long long)rc_in-&gt;rc_id,</div><div class='add'>+			  le32_to_cpu(rc_in-&gt;rc_type),</div><div class='add'>+			  le32_to_cpu(rc_in-&gt;rc_header.h_nodeid),</div><div class='add'>+			  (unsigned long long)le64_to_cpu(rc_in-&gt;rc_id),</div><div class='ctx'> 			  (unsigned long long)ls-&gt;ls_rcom_seq);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	memcpy(ls-&gt;ls_recover_buf, rc_in, rc_in-&gt;rc_header.h_length);</div><div class='add'>+	memcpy(ls-&gt;ls_recover_buf, rc_in,</div><div class='add'>+	       le16_to_cpu(rc_in-&gt;rc_header.h_length));</div><div class='ctx'> 	set_bit(LSFL_RCOM_READY, &amp;ls-&gt;ls_flags);</div><div class='ctx'> 	clear_bit(LSFL_RCOM_WAIT, &amp;ls-&gt;ls_flags);</div><div class='ctx'> 	wake_up(&amp;ls-&gt;ls_wait_general);</div><div class='ctx'>  out:</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_rcom_spin);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_rcom_spin);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int dlm_rcom_names(struct dlm_ls *ls, int nodeid, char *last_name, int last_len)</div><div class='add'>+int dlm_rcom_names(struct dlm_ls *ls, int nodeid, char *last_name,</div><div class='add'>+		   int last_len, uint64_t seq)</div><div class='ctx'> {</div><div class='add'>+	struct dlm_mhandle *mh;</div><div class='ctx'> 	struct dlm_rcom *rc;</div><div class='del'>-	struct dlm_msg *msg;</div><div class='ctx'> 	int error = 0;</div><div class='ctx'> </div><div class='ctx'> 	ls-&gt;ls_recover_nodeid = nodeid;</div><div class='ctx'> </div><div class='ctx'> retry:</div><div class='del'>-	error = create_rcom_stateless(ls, nodeid, DLM_RCOM_NAMES, last_len,</div><div class='del'>-				      &amp;rc, &amp;msg);</div><div class='add'>+	error = create_rcom(ls, nodeid, DLM_RCOM_NAMES, last_len,</div><div class='add'>+			    &amp;rc, &amp;mh, seq);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	memcpy(rc-&gt;rc_buf, last_name, last_len);</div><div class='hunk'>@@ -320,7 +323,7 @@ retry:</div><div class='ctx'> 	allow_sync_reply(ls, &amp;rc-&gt;rc_id);</div><div class='ctx'> 	memset(ls-&gt;ls_recover_buf, 0, DLM_MAX_SOCKET_BUFSIZE);</div><div class='ctx'> </div><div class='del'>-	send_rcom_stateless(msg, rc);</div><div class='add'>+	send_rcom(mh, rc);</div><div class='ctx'> </div><div class='ctx'> 	error = dlm_wait_function(ls, &amp;rcom_response);</div><div class='ctx'> 	disallow_sync_reply(ls);</div><div class='hunk'>@@ -330,18 +333,20 @@ retry:</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void receive_rcom_names(struct dlm_ls *ls, struct dlm_rcom *rc_in)</div><div class='add'>+static void receive_rcom_names(struct dlm_ls *ls, const struct dlm_rcom *rc_in,</div><div class='add'>+			       uint64_t seq)</div><div class='ctx'> {</div><div class='add'>+	struct dlm_mhandle *mh;</div><div class='ctx'> 	struct dlm_rcom *rc;</div><div class='ctx'> 	int error, inlen, outlen, nodeid;</div><div class='del'>-	struct dlm_msg *msg;</div><div class='ctx'> </div><div class='del'>-	nodeid = rc_in-&gt;rc_header.h_nodeid;</div><div class='del'>-	inlen = rc_in-&gt;rc_header.h_length - sizeof(struct dlm_rcom);</div><div class='add'>+	nodeid = le32_to_cpu(rc_in-&gt;rc_header.h_nodeid);</div><div class='add'>+	inlen = le16_to_cpu(rc_in-&gt;rc_header.h_length) -</div><div class='add'>+		sizeof(struct dlm_rcom);</div><div class='ctx'> 	outlen = DLM_MAX_APP_BUFSIZE - sizeof(struct dlm_rcom);</div><div class='ctx'> </div><div class='del'>-	error = create_rcom_stateless(ls, nodeid, DLM_RCOM_NAMES_REPLY, outlen,</div><div class='del'>-				      &amp;rc, &amp;msg);</div><div class='add'>+	error = create_rcom(ls, nodeid, DLM_RCOM_NAMES_REPLY, outlen,</div><div class='add'>+			    &amp;rc, &amp;mh, seq);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return;</div><div class='ctx'> 	rc-&gt;rc_id = rc_in-&gt;rc_id;</div><div class='hunk'>@@ -349,10 +354,10 @@ static void receive_rcom_names(struct dlm_ls *ls, struct dlm_rcom *rc_in)</div><div class='ctx'> </div><div class='ctx'> 	dlm_copy_master_names(ls, rc_in-&gt;rc_buf, inlen, rc-&gt;rc_buf, outlen,</div><div class='ctx'> 			      nodeid);</div><div class='del'>-	send_rcom_stateless(msg, rc);</div><div class='add'>+	send_rcom(mh, rc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int dlm_send_rcom_lookup(struct dlm_rsb *r, int dir_nodeid)</div><div class='add'>+int dlm_send_rcom_lookup(struct dlm_rsb *r, int dir_nodeid, uint64_t seq)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rcom *rc;</div><div class='ctx'> 	struct dlm_mhandle *mh;</div><div class='hunk'>@@ -360,32 +365,35 @@ int dlm_send_rcom_lookup(struct dlm_rsb *r, int dir_nodeid)</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='ctx'> 	error = create_rcom(ls, dir_nodeid, DLM_RCOM_LOOKUP, r-&gt;res_length,</div><div class='del'>-			    &amp;rc, &amp;mh);</div><div class='add'>+			    &amp;rc, &amp;mh, seq);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	memcpy(rc-&gt;rc_buf, r-&gt;res_name, r-&gt;res_length);</div><div class='del'>-	rc-&gt;rc_id = (unsigned long) r-&gt;res_id;</div><div class='add'>+	rc-&gt;rc_id = cpu_to_le64(r-&gt;res_id);</div><div class='ctx'> </div><div class='ctx'> 	send_rcom(mh, rc);</div><div class='ctx'>  out:</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void receive_rcom_lookup(struct dlm_ls *ls, struct dlm_rcom *rc_in)</div><div class='add'>+static void receive_rcom_lookup(struct dlm_ls *ls,</div><div class='add'>+				const struct dlm_rcom *rc_in, uint64_t seq)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rcom *rc;</div><div class='ctx'> 	struct dlm_mhandle *mh;</div><div class='del'>-	int error, ret_nodeid, nodeid = rc_in-&gt;rc_header.h_nodeid;</div><div class='del'>-	int len = rc_in-&gt;rc_header.h_length - sizeof(struct dlm_rcom);</div><div class='add'>+	int error, ret_nodeid, nodeid = le32_to_cpu(rc_in-&gt;rc_header.h_nodeid);</div><div class='add'>+	int len = le16_to_cpu(rc_in-&gt;rc_header.h_length) -</div><div class='add'>+		sizeof(struct dlm_rcom);</div><div class='ctx'> </div><div class='ctx'> 	/* Old code would send this special id to trigger a debug dump. */</div><div class='del'>-	if (rc_in-&gt;rc_id == 0xFFFFFFFF) {</div><div class='add'>+	if (rc_in-&gt;rc_id == cpu_to_le64(0xFFFFFFFF)) {</div><div class='ctx'> 		log_error(ls, "receive_rcom_lookup dump from %d", nodeid);</div><div class='ctx'> 		dlm_dump_rsb_name(ls, rc_in-&gt;rc_buf, len);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	error = create_rcom(ls, nodeid, DLM_RCOM_LOOKUP_REPLY, 0, &amp;rc, &amp;mh);</div><div class='add'>+	error = create_rcom(ls, nodeid, DLM_RCOM_LOOKUP_REPLY, 0, &amp;rc, &amp;mh,</div><div class='add'>+			    seq);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='hunk'>@@ -393,14 +401,15 @@ static void receive_rcom_lookup(struct dlm_ls *ls, struct dlm_rcom *rc_in)</div><div class='ctx'> 				  DLM_LU_RECOVER_MASTER, &amp;ret_nodeid, NULL);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		ret_nodeid = error;</div><div class='del'>-	rc-&gt;rc_result = ret_nodeid;</div><div class='add'>+	rc-&gt;rc_result = cpu_to_le32(ret_nodeid);</div><div class='ctx'> 	rc-&gt;rc_id = rc_in-&gt;rc_id;</div><div class='ctx'> 	rc-&gt;rc_seq_reply = rc_in-&gt;rc_seq;</div><div class='ctx'> </div><div class='ctx'> 	send_rcom(mh, rc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void receive_rcom_lookup_reply(struct dlm_ls *ls, struct dlm_rcom *rc_in)</div><div class='add'>+static void receive_rcom_lookup_reply(struct dlm_ls *ls,</div><div class='add'>+				      const struct dlm_rcom *rc_in)</div><div class='ctx'> {</div><div class='ctx'> 	dlm_recover_master_reply(ls, rc_in);</div><div class='ctx'> }</div><div class='hunk'>@@ -413,7 +422,7 @@ static void pack_rcom_lock(struct dlm_rsb *r, struct dlm_lkb *lkb,</div><div class='ctx'> 	rl-&gt;rl_ownpid = cpu_to_le32(lkb-&gt;lkb_ownpid);</div><div class='ctx'> 	rl-&gt;rl_lkid = cpu_to_le32(lkb-&gt;lkb_id);</div><div class='ctx'> 	rl-&gt;rl_exflags = cpu_to_le32(lkb-&gt;lkb_exflags);</div><div class='del'>-	rl-&gt;rl_flags = cpu_to_le32(lkb-&gt;lkb_flags);</div><div class='add'>+	rl-&gt;rl_flags = cpu_to_le32(dlm_dflags_val(lkb));</div><div class='ctx'> 	rl-&gt;rl_lvbseq = cpu_to_le32(lkb-&gt;lkb_lvbseq);</div><div class='ctx'> 	rl-&gt;rl_rqmode = lkb-&gt;lkb_rqmode;</div><div class='ctx'> 	rl-&gt;rl_grmode = lkb-&gt;lkb_grmode;</div><div class='hunk'>@@ -435,7 +444,7 @@ static void pack_rcom_lock(struct dlm_rsb *r, struct dlm_lkb *lkb,</div><div class='ctx'> 		memcpy(rl-&gt;rl_lvb, lkb-&gt;lkb_lvbptr, r-&gt;res_ls-&gt;ls_lvblen);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int dlm_send_rcom_lock(struct dlm_rsb *r, struct dlm_lkb *lkb)</div><div class='add'>+int dlm_send_rcom_lock(struct dlm_rsb *r, struct dlm_lkb *lkb, uint64_t seq)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_ls *ls = r-&gt;res_ls;</div><div class='ctx'> 	struct dlm_rcom *rc;</div><div class='hunk'>@@ -446,13 +455,14 @@ int dlm_send_rcom_lock(struct dlm_rsb *r, struct dlm_lkb *lkb)</div><div class='ctx'> 	if (lkb-&gt;lkb_lvbptr)</div><div class='ctx'> 		len += ls-&gt;ls_lvblen;</div><div class='ctx'> </div><div class='del'>-	error = create_rcom(ls, r-&gt;res_nodeid, DLM_RCOM_LOCK, len, &amp;rc, &amp;mh);</div><div class='add'>+	error = create_rcom(ls, r-&gt;res_nodeid, DLM_RCOM_LOCK, len, &amp;rc, &amp;mh,</div><div class='add'>+			    seq);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	rl = (struct rcom_lock *) rc-&gt;rc_buf;</div><div class='ctx'> 	pack_rcom_lock(r, lkb, rl);</div><div class='del'>-	rc-&gt;rc_id = (unsigned long) r;</div><div class='add'>+	rc-&gt;rc_id = cpu_to_le64((uintptr_t)r);</div><div class='ctx'> </div><div class='ctx'> 	send_rcom(mh, rc);</div><div class='ctx'>  out:</div><div class='hunk'>@@ -460,23 +470,28 @@ int dlm_send_rcom_lock(struct dlm_rsb *r, struct dlm_lkb *lkb)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* needs at least dlm_rcom + rcom_lock */</div><div class='del'>-static void receive_rcom_lock(struct dlm_ls *ls, struct dlm_rcom *rc_in)</div><div class='add'>+static void receive_rcom_lock(struct dlm_ls *ls, const struct dlm_rcom *rc_in,</div><div class='add'>+			      uint64_t seq)</div><div class='ctx'> {</div><div class='add'>+	__le32 rl_remid, rl_result;</div><div class='add'>+	struct rcom_lock *rl;</div><div class='ctx'> 	struct dlm_rcom *rc;</div><div class='ctx'> 	struct dlm_mhandle *mh;</div><div class='del'>-	int error, nodeid = rc_in-&gt;rc_header.h_nodeid;</div><div class='add'>+	int error, nodeid = le32_to_cpu(rc_in-&gt;rc_header.h_nodeid);</div><div class='ctx'> </div><div class='del'>-	dlm_recover_master_copy(ls, rc_in);</div><div class='add'>+	dlm_recover_master_copy(ls, rc_in, &amp;rl_remid, &amp;rl_result);</div><div class='ctx'> </div><div class='ctx'> 	error = create_rcom(ls, nodeid, DLM_RCOM_LOCK_REPLY,</div><div class='del'>-			    sizeof(struct rcom_lock), &amp;rc, &amp;mh);</div><div class='add'>+			    sizeof(struct rcom_lock), &amp;rc, &amp;mh, seq);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	/* We send back the same rcom_lock struct we received, but</div><div class='del'>-	   dlm_recover_master_copy() has filled in rl_remid and rl_result */</div><div class='del'>-</div><div class='ctx'> 	memcpy(rc-&gt;rc_buf, rc_in-&gt;rc_buf, sizeof(struct rcom_lock));</div><div class='add'>+	rl = (struct rcom_lock *)rc-&gt;rc_buf;</div><div class='add'>+	/* set rl_remid and rl_result from dlm_recover_master_copy() */</div><div class='add'>+	rl-&gt;rl_remid = rl_remid;</div><div class='add'>+	rl-&gt;rl_result = rl_result;</div><div class='add'>+</div><div class='ctx'> 	rc-&gt;rc_id = rc_in-&gt;rc_id;</div><div class='ctx'> 	rc-&gt;rc_seq_reply = rc_in-&gt;rc_seq;</div><div class='ctx'> </div><div class='hunk'>@@ -486,7 +501,7 @@ static void receive_rcom_lock(struct dlm_ls *ls, struct dlm_rcom *rc_in)</div><div class='ctx'> /* If the lockspace doesn't exist then still send a status message</div><div class='ctx'>    back; it's possible that it just doesn't have its global_id yet. */</div><div class='ctx'> </div><div class='del'>-int dlm_send_ls_not_ready(int nodeid, struct dlm_rcom *rc_in)</div><div class='add'>+int dlm_send_ls_not_ready(int nodeid, const struct dlm_rcom *rc_in)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rcom *rc;</div><div class='ctx'> 	struct rcom_config *rf;</div><div class='hunk'>@@ -494,28 +509,27 @@ int dlm_send_ls_not_ready(int nodeid, struct dlm_rcom *rc_in)</div><div class='ctx'> 	char *mb;</div><div class='ctx'> 	int mb_len = sizeof(struct dlm_rcom) + sizeof(struct rcom_config);</div><div class='ctx'> </div><div class='del'>-	mh = dlm_midcomms_get_mhandle(nodeid, mb_len, GFP_NOFS, &amp;mb);</div><div class='add'>+	mh = dlm_midcomms_get_mhandle(nodeid, mb_len, &amp;mb);</div><div class='ctx'> 	if (!mh)</div><div class='ctx'> 		return -ENOBUFS;</div><div class='ctx'> </div><div class='ctx'> 	rc = (struct dlm_rcom *) mb;</div><div class='ctx'> </div><div class='del'>-	rc-&gt;rc_header.h_version = (DLM_HEADER_MAJOR | DLM_HEADER_MINOR);</div><div class='add'>+	rc-&gt;rc_header.h_version = cpu_to_le32(DLM_HEADER_MAJOR | DLM_HEADER_MINOR);</div><div class='ctx'> 	rc-&gt;rc_header.u.h_lockspace = rc_in-&gt;rc_header.u.h_lockspace;</div><div class='del'>-	rc-&gt;rc_header.h_nodeid = dlm_our_nodeid();</div><div class='del'>-	rc-&gt;rc_header.h_length = mb_len;</div><div class='add'>+	rc-&gt;rc_header.h_nodeid = cpu_to_le32(dlm_our_nodeid());</div><div class='add'>+	rc-&gt;rc_header.h_length = cpu_to_le16(mb_len);</div><div class='ctx'> 	rc-&gt;rc_header.h_cmd = DLM_RCOM;</div><div class='ctx'> </div><div class='del'>-	rc-&gt;rc_type = DLM_RCOM_STATUS_REPLY;</div><div class='add'>+	rc-&gt;rc_type = cpu_to_le32(DLM_RCOM_STATUS_REPLY);</div><div class='ctx'> 	rc-&gt;rc_id = rc_in-&gt;rc_id;</div><div class='ctx'> 	rc-&gt;rc_seq_reply = rc_in-&gt;rc_seq;</div><div class='del'>-	rc-&gt;rc_result = -ESRCH;</div><div class='add'>+	rc-&gt;rc_result = cpu_to_le32(-ESRCH);</div><div class='ctx'> </div><div class='ctx'> 	rf = (struct rcom_config *) rc-&gt;rc_buf;</div><div class='ctx'> 	rf-&gt;rf_lvblen = cpu_to_le32(~0U);</div><div class='ctx'> </div><div class='del'>-	dlm_rcom_out(rc);</div><div class='del'>-	dlm_midcomms_commit_mhandle(mh);</div><div class='add'>+	dlm_midcomms_commit_mhandle(mh, NULL, 0);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -565,7 +579,7 @@ int dlm_send_ls_not_ready(int nodeid, struct dlm_rcom *rc_in)</div><div class='ctx'> /* Called by dlm_recv; corresponds to dlm_receive_message() but special</div><div class='ctx'>    recovery-only comms are sent through here. */</div><div class='ctx'> </div><div class='del'>-void dlm_receive_rcom(struct dlm_ls *ls, struct dlm_rcom *rc, int nodeid)</div><div class='add'>+void dlm_receive_rcom(struct dlm_ls *ls, const struct dlm_rcom *rc, int nodeid)</div><div class='ctx'> {</div><div class='ctx'> 	int lock_size = sizeof(struct dlm_rcom) + sizeof(struct rcom_lock);</div><div class='ctx'> 	int stop, reply = 0, names = 0, lookup = 0, lock = 0;</div><div class='hunk'>@@ -573,42 +587,42 @@ void dlm_receive_rcom(struct dlm_ls *ls, struct dlm_rcom *rc, int nodeid)</div><div class='ctx'> 	uint64_t seq;</div><div class='ctx'> </div><div class='ctx'> 	switch (rc-&gt;rc_type) {</div><div class='del'>-	case DLM_RCOM_STATUS_REPLY:</div><div class='add'>+	case cpu_to_le32(DLM_RCOM_STATUS_REPLY):</div><div class='ctx'> 		reply = 1;</div><div class='ctx'> 		break;</div><div class='del'>-	case DLM_RCOM_NAMES:</div><div class='add'>+	case cpu_to_le32(DLM_RCOM_NAMES):</div><div class='ctx'> 		names = 1;</div><div class='ctx'> 		break;</div><div class='del'>-	case DLM_RCOM_NAMES_REPLY:</div><div class='add'>+	case cpu_to_le32(DLM_RCOM_NAMES_REPLY):</div><div class='ctx'> 		names = 1;</div><div class='ctx'> 		reply = 1;</div><div class='ctx'> 		break;</div><div class='del'>-	case DLM_RCOM_LOOKUP:</div><div class='add'>+	case cpu_to_le32(DLM_RCOM_LOOKUP):</div><div class='ctx'> 		lookup = 1;</div><div class='ctx'> 		break;</div><div class='del'>-	case DLM_RCOM_LOOKUP_REPLY:</div><div class='add'>+	case cpu_to_le32(DLM_RCOM_LOOKUP_REPLY):</div><div class='ctx'> 		lookup = 1;</div><div class='ctx'> 		reply = 1;</div><div class='ctx'> 		break;</div><div class='del'>-	case DLM_RCOM_LOCK:</div><div class='add'>+	case cpu_to_le32(DLM_RCOM_LOCK):</div><div class='ctx'> 		lock = 1;</div><div class='ctx'> 		break;</div><div class='del'>-	case DLM_RCOM_LOCK_REPLY:</div><div class='add'>+	case cpu_to_le32(DLM_RCOM_LOCK_REPLY):</div><div class='ctx'> 		lock = 1;</div><div class='ctx'> 		reply = 1;</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_recover_lock);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_recover_lock);</div><div class='ctx'> 	status = ls-&gt;ls_recover_status;</div><div class='del'>-	stop = test_bit(LSFL_RECOVER_STOP, &amp;ls-&gt;ls_flags);</div><div class='add'>+	stop = dlm_recovery_stopped(ls);</div><div class='ctx'> 	seq = ls-&gt;ls_recover_seq;</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_recover_lock);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_recover_lock);</div><div class='ctx'> </div><div class='del'>-	if (stop &amp;&amp; (rc-&gt;rc_type != DLM_RCOM_STATUS))</div><div class='add'>+	if (stop &amp;&amp; (rc-&gt;rc_type != cpu_to_le32(DLM_RCOM_STATUS)))</div><div class='ctx'> 		goto ignore;</div><div class='ctx'> </div><div class='del'>-	if (reply &amp;&amp; (rc-&gt;rc_seq_reply != seq))</div><div class='add'>+	if (reply &amp;&amp; (le64_to_cpu(rc-&gt;rc_seq_reply) != seq))</div><div class='ctx'> 		goto ignore;</div><div class='ctx'> </div><div class='ctx'> 	if (!(status &amp; DLM_RS_NODES) &amp;&amp; (names || lookup || lock))</div><div class='hunk'>@@ -618,59 +632,60 @@ void dlm_receive_rcom(struct dlm_ls *ls, struct dlm_rcom *rc, int nodeid)</div><div class='ctx'> 		goto ignore;</div><div class='ctx'> </div><div class='ctx'> 	switch (rc-&gt;rc_type) {</div><div class='del'>-	case DLM_RCOM_STATUS:</div><div class='del'>-		receive_rcom_status(ls, rc);</div><div class='add'>+	case cpu_to_le32(DLM_RCOM_STATUS):</div><div class='add'>+		receive_rcom_status(ls, rc, seq);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='del'>-	case DLM_RCOM_NAMES:</div><div class='del'>-		receive_rcom_names(ls, rc);</div><div class='add'>+	case cpu_to_le32(DLM_RCOM_NAMES):</div><div class='add'>+		receive_rcom_names(ls, rc, seq);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='del'>-	case DLM_RCOM_LOOKUP:</div><div class='del'>-		receive_rcom_lookup(ls, rc);</div><div class='add'>+	case cpu_to_le32(DLM_RCOM_LOOKUP):</div><div class='add'>+		receive_rcom_lookup(ls, rc, seq);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='del'>-	case DLM_RCOM_LOCK:</div><div class='del'>-		if (rc-&gt;rc_header.h_length &lt; lock_size)</div><div class='add'>+	case cpu_to_le32(DLM_RCOM_LOCK):</div><div class='add'>+		if (le16_to_cpu(rc-&gt;rc_header.h_length) &lt; lock_size)</div><div class='ctx'> 			goto Eshort;</div><div class='del'>-		receive_rcom_lock(ls, rc);</div><div class='add'>+		receive_rcom_lock(ls, rc, seq);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='del'>-	case DLM_RCOM_STATUS_REPLY:</div><div class='add'>+	case cpu_to_le32(DLM_RCOM_STATUS_REPLY):</div><div class='ctx'> 		receive_sync_reply(ls, rc);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='del'>-	case DLM_RCOM_NAMES_REPLY:</div><div class='add'>+	case cpu_to_le32(DLM_RCOM_NAMES_REPLY):</div><div class='ctx'> 		receive_sync_reply(ls, rc);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='del'>-	case DLM_RCOM_LOOKUP_REPLY:</div><div class='add'>+	case cpu_to_le32(DLM_RCOM_LOOKUP_REPLY):</div><div class='ctx'> 		receive_rcom_lookup_reply(ls, rc);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='del'>-	case DLM_RCOM_LOCK_REPLY:</div><div class='del'>-		if (rc-&gt;rc_header.h_length &lt; lock_size)</div><div class='add'>+	case cpu_to_le32(DLM_RCOM_LOCK_REPLY):</div><div class='add'>+		if (le16_to_cpu(rc-&gt;rc_header.h_length) &lt; lock_size)</div><div class='ctx'> 			goto Eshort;</div><div class='del'>-		dlm_recover_process_copy(ls, rc);</div><div class='add'>+		dlm_recover_process_copy(ls, rc, seq);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	default:</div><div class='del'>-		log_error(ls, "receive_rcom bad type %d", rc-&gt;rc_type);</div><div class='add'>+		log_error(ls, "receive_rcom bad type %d",</div><div class='add'>+			  le32_to_cpu(rc-&gt;rc_type));</div><div class='ctx'> 	}</div><div class='ctx'> 	return;</div><div class='ctx'> </div><div class='ctx'> ignore:</div><div class='ctx'> 	log_limit(ls, "dlm_receive_rcom ignore msg %d "</div><div class='ctx'> 		  "from %d %llu %llu recover seq %llu sts %x gen %u",</div><div class='del'>-		   rc-&gt;rc_type,</div><div class='add'>+		   le32_to_cpu(rc-&gt;rc_type),</div><div class='ctx'> 		   nodeid,</div><div class='del'>-		   (unsigned long long)rc-&gt;rc_seq,</div><div class='del'>-		   (unsigned long long)rc-&gt;rc_seq_reply,</div><div class='add'>+		   (unsigned long long)le64_to_cpu(rc-&gt;rc_seq),</div><div class='add'>+		   (unsigned long long)le64_to_cpu(rc-&gt;rc_seq_reply),</div><div class='ctx'> 		   (unsigned long long)seq,</div><div class='ctx'> 		   status, ls-&gt;ls_generation);</div><div class='ctx'> 	return;</div><div class='ctx'> Eshort:</div><div class='ctx'> 	log_error(ls, "recovery message %d from %d is too short",</div><div class='del'>-		  rc-&gt;rc_type, nodeid);</div><div class='add'>+		  le32_to_cpu(rc-&gt;rc_type), nodeid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/dlm/rcom.h b/fs/dlm/rcom.h<br/>index 454d3c4814ab..765926ae0020 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/rcom.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/rcom.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/rcom.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/rcom.h</a></div><div class='hunk'>@@ -12,12 +12,15 @@</div><div class='ctx'> #ifndef __RCOM_DOT_H__</div><div class='ctx'> #define __RCOM_DOT_H__</div><div class='ctx'> </div><div class='del'>-int dlm_rcom_status(struct dlm_ls *ls, int nodeid, uint32_t status_flags);</div><div class='del'>-int dlm_rcom_names(struct dlm_ls *ls, int nodeid, char *last_name,int last_len);</div><div class='del'>-int dlm_send_rcom_lookup(struct dlm_rsb *r, int dir_nodeid);</div><div class='del'>-int dlm_send_rcom_lock(struct dlm_rsb *r, struct dlm_lkb *lkb);</div><div class='del'>-void dlm_receive_rcom(struct dlm_ls *ls, struct dlm_rcom *rc, int nodeid);</div><div class='del'>-int dlm_send_ls_not_ready(int nodeid, struct dlm_rcom *rc_in);</div><div class='add'>+int dlm_rcom_status(struct dlm_ls *ls, int nodeid, uint32_t status_flags,</div><div class='add'>+		    uint64_t seq);</div><div class='add'>+int dlm_rcom_names(struct dlm_ls *ls, int nodeid, char *last_name,</div><div class='add'>+		   int last_len, uint64_t seq);</div><div class='add'>+int dlm_send_rcom_lookup(struct dlm_rsb *r, int dir_nodeid, uint64_t seq);</div><div class='add'>+int dlm_send_rcom_lock(struct dlm_rsb *r, struct dlm_lkb *lkb, uint64_t seq);</div><div class='add'>+void dlm_receive_rcom(struct dlm_ls *ls, const struct dlm_rcom *rc,</div><div class='add'>+		      int nodeid);</div><div class='add'>+int dlm_send_ls_not_ready(int nodeid, const struct dlm_rcom *rc_in);</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='head'>diff --git a/fs/dlm/recover.c b/fs/dlm/recover.c<br/>index 8928e99dfd47..3ac020fb8139 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/recover.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/recover.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/recover.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/recover.c</a></div><div class='hunk'>@@ -74,9 +74,9 @@ int dlm_wait_function(struct dlm_ls *ls, int (*testfn) (struct dlm_ls *ls))</div><div class='ctx'> uint32_t dlm_recover_status(struct dlm_ls *ls)</div><div class='ctx'> {</div><div class='ctx'> 	uint32_t status;</div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_recover_lock);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_recover_lock);</div><div class='ctx'> 	status = ls-&gt;ls_recover_status;</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_recover_lock);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_recover_lock);</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -87,13 +87,13 @@ static void _set_recover_status(struct dlm_ls *ls, uint32_t status)</div><div class='ctx'> </div><div class='ctx'> void dlm_set_recover_status(struct dlm_ls *ls, uint32_t status)</div><div class='ctx'> {</div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_recover_lock);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_recover_lock);</div><div class='ctx'> 	_set_recover_status(ls, status);</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_recover_lock);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_recover_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int wait_status_all(struct dlm_ls *ls, uint32_t wait_status,</div><div class='del'>-			   int save_slots)</div><div class='add'>+			   int save_slots, uint64_t seq)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rcom *rc = ls-&gt;ls_recover_buf;</div><div class='ctx'> 	struct dlm_member *memb;</div><div class='hunk'>@@ -107,14 +107,14 @@ static int wait_status_all(struct dlm_ls *ls, uint32_t wait_status,</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			error = dlm_rcom_status(ls, memb-&gt;nodeid, 0);</div><div class='add'>+			error = dlm_rcom_status(ls, memb-&gt;nodeid, 0, seq);</div><div class='ctx'> 			if (error)</div><div class='ctx'> 				goto out;</div><div class='ctx'> </div><div class='ctx'> 			if (save_slots)</div><div class='ctx'> 				dlm_slot_save(ls, rc, memb);</div><div class='ctx'> </div><div class='del'>-			if (rc-&gt;rc_result &amp; wait_status)</div><div class='add'>+			if (le32_to_cpu(rc-&gt;rc_result) &amp; wait_status)</div><div class='ctx'> 				break;</div><div class='ctx'> 			if (delay &lt; 1000)</div><div class='ctx'> 				delay += 20;</div><div class='hunk'>@@ -126,7 +126,7 @@ static int wait_status_all(struct dlm_ls *ls, uint32_t wait_status,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int wait_status_low(struct dlm_ls *ls, uint32_t wait_status,</div><div class='del'>-			   uint32_t status_flags)</div><div class='add'>+			   uint32_t status_flags, uint64_t seq)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rcom *rc = ls-&gt;ls_recover_buf;</div><div class='ctx'> 	int error = 0, delay = 0, nodeid = ls-&gt;ls_low_nodeid;</div><div class='hunk'>@@ -137,11 +137,11 @@ static int wait_status_low(struct dlm_ls *ls, uint32_t wait_status,</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		error = dlm_rcom_status(ls, nodeid, status_flags);</div><div class='add'>+		error = dlm_rcom_status(ls, nodeid, status_flags, seq);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		if (rc-&gt;rc_result &amp; wait_status)</div><div class='add'>+		if (le32_to_cpu(rc-&gt;rc_result) &amp; wait_status)</div><div class='ctx'> 			break;</div><div class='ctx'> 		if (delay &lt; 1000)</div><div class='ctx'> 			delay += 20;</div><div class='hunk'>@@ -151,22 +151,22 @@ static int wait_status_low(struct dlm_ls *ls, uint32_t wait_status,</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int wait_status(struct dlm_ls *ls, uint32_t status)</div><div class='add'>+static int wait_status(struct dlm_ls *ls, uint32_t status, uint64_t seq)</div><div class='ctx'> {</div><div class='ctx'> 	uint32_t status_all = status &lt;&lt; 1;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='ctx'> 	if (ls-&gt;ls_low_nodeid == dlm_our_nodeid()) {</div><div class='del'>-		error = wait_status_all(ls, status, 0);</div><div class='add'>+		error = wait_status_all(ls, status, 0, seq);</div><div class='ctx'> 		if (!error)</div><div class='ctx'> 			dlm_set_recover_status(ls, status_all);</div><div class='ctx'> 	} else</div><div class='del'>-		error = wait_status_low(ls, status_all, 0);</div><div class='add'>+		error = wait_status_low(ls, status_all, 0, seq);</div><div class='ctx'> </div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int dlm_recover_members_wait(struct dlm_ls *ls)</div><div class='add'>+int dlm_recover_members_wait(struct dlm_ls *ls, uint64_t seq)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_member *memb;</div><div class='ctx'> 	struct dlm_slot *slots;</div><div class='hunk'>@@ -180,7 +180,7 @@ int dlm_recover_members_wait(struct dlm_ls *ls)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (ls-&gt;ls_low_nodeid == dlm_our_nodeid()) {</div><div class='del'>-		error = wait_status_all(ls, DLM_RS_NODES, 1);</div><div class='add'>+		error = wait_status_all(ls, DLM_RS_NODES, 1, seq);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -188,18 +188,19 @@ int dlm_recover_members_wait(struct dlm_ls *ls)</div><div class='ctx'> </div><div class='ctx'> 		rv = dlm_slots_assign(ls, &amp;num_slots, &amp;slots_size, &amp;slots, &amp;gen);</div><div class='ctx'> 		if (!rv) {</div><div class='del'>-			spin_lock(&amp;ls-&gt;ls_recover_lock);</div><div class='add'>+			spin_lock_bh(&amp;ls-&gt;ls_recover_lock);</div><div class='ctx'> 			_set_recover_status(ls, DLM_RS_NODES_ALL);</div><div class='ctx'> 			ls-&gt;ls_num_slots = num_slots;</div><div class='ctx'> 			ls-&gt;ls_slots_size = slots_size;</div><div class='ctx'> 			ls-&gt;ls_slots = slots;</div><div class='ctx'> 			ls-&gt;ls_generation = gen;</div><div class='del'>-			spin_unlock(&amp;ls-&gt;ls_recover_lock);</div><div class='add'>+			spin_unlock_bh(&amp;ls-&gt;ls_recover_lock);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			dlm_set_recover_status(ls, DLM_RS_NODES_ALL);</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='del'>-		error = wait_status_low(ls, DLM_RS_NODES_ALL, DLM_RSF_NEED_SLOTS);</div><div class='add'>+		error = wait_status_low(ls, DLM_RS_NODES_ALL,</div><div class='add'>+					DLM_RSF_NEED_SLOTS, seq);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -209,19 +210,19 @@ int dlm_recover_members_wait(struct dlm_ls *ls)</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int dlm_recover_directory_wait(struct dlm_ls *ls)</div><div class='add'>+int dlm_recover_directory_wait(struct dlm_ls *ls, uint64_t seq)</div><div class='ctx'> {</div><div class='del'>-	return wait_status(ls, DLM_RS_DIR);</div><div class='add'>+	return wait_status(ls, DLM_RS_DIR, seq);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int dlm_recover_locks_wait(struct dlm_ls *ls)</div><div class='add'>+int dlm_recover_locks_wait(struct dlm_ls *ls, uint64_t seq)</div><div class='ctx'> {</div><div class='del'>-	return wait_status(ls, DLM_RS_LOCKS);</div><div class='add'>+	return wait_status(ls, DLM_RS_LOCKS, seq);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int dlm_recover_done_wait(struct dlm_ls *ls)</div><div class='add'>+int dlm_recover_done_wait(struct dlm_ls *ls, uint64_t seq)</div><div class='ctx'> {</div><div class='del'>-	return wait_status(ls, DLM_RS_DONE);</div><div class='add'>+	return wait_status(ls, DLM_RS_DONE, seq);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -240,9 +241,9 @@ static int recover_list_empty(struct dlm_ls *ls)</div><div class='ctx'> {</div><div class='ctx'> 	int empty;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_recover_list_lock);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_recover_list_lock);</div><div class='ctx'> 	empty = list_empty(&amp;ls-&gt;ls_recover_list);</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_recover_list_lock);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_recover_list_lock);</div><div class='ctx'> </div><div class='ctx'> 	return empty;</div><div class='ctx'> }</div><div class='hunk'>@@ -251,23 +252,23 @@ static void recover_list_add(struct dlm_rsb *r)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_ls *ls = r-&gt;res_ls;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_recover_list_lock);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_recover_list_lock);</div><div class='ctx'> 	if (list_empty(&amp;r-&gt;res_recover_list)) {</div><div class='ctx'> 		list_add_tail(&amp;r-&gt;res_recover_list, &amp;ls-&gt;ls_recover_list);</div><div class='ctx'> 		ls-&gt;ls_recover_list_count++;</div><div class='ctx'> 		dlm_hold_rsb(r);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_recover_list_lock);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_recover_list_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void recover_list_del(struct dlm_rsb *r)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_ls *ls = r-&gt;res_ls;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_recover_list_lock);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_recover_list_lock);</div><div class='ctx'> 	list_del_init(&amp;r-&gt;res_recover_list);</div><div class='ctx'> 	ls-&gt;ls_recover_list_count--;</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_recover_list_lock);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_recover_list_lock);</div><div class='ctx'> </div><div class='ctx'> 	dlm_put_rsb(r);</div><div class='ctx'> }</div><div class='hunk'>@@ -276,7 +277,7 @@ static void recover_list_clear(struct dlm_ls *ls)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rsb *r, *s;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_recover_list_lock);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_recover_list_lock);</div><div class='ctx'> 	list_for_each_entry_safe(r, s, &amp;ls-&gt;ls_recover_list, res_recover_list) {</div><div class='ctx'> 		list_del_init(&amp;r-&gt;res_recover_list);</div><div class='ctx'> 		r-&gt;res_recover_locks_count = 0;</div><div class='hunk'>@@ -289,78 +290,81 @@ static void recover_list_clear(struct dlm_ls *ls)</div><div class='ctx'> 			  ls-&gt;ls_recover_list_count);</div><div class='ctx'> 		ls-&gt;ls_recover_list_count = 0;</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_recover_list_lock);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_recover_list_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int recover_idr_empty(struct dlm_ls *ls)</div><div class='add'>+static int recover_xa_empty(struct dlm_ls *ls)</div><div class='ctx'> {</div><div class='ctx'> 	int empty = 1;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_recover_idr_lock);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_recover_xa_lock);</div><div class='ctx'> 	if (ls-&gt;ls_recover_list_count)</div><div class='ctx'> 		empty = 0;</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_recover_idr_lock);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_recover_xa_lock);</div><div class='ctx'> </div><div class='ctx'> 	return empty;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int recover_idr_add(struct dlm_rsb *r)</div><div class='add'>+static int recover_xa_add(struct dlm_rsb *r)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_ls *ls = r-&gt;res_ls;</div><div class='add'>+	struct xa_limit limit = {</div><div class='add'>+		.min = 1,</div><div class='add'>+		.max = UINT_MAX,</div><div class='add'>+	};</div><div class='add'>+	uint32_t id;</div><div class='ctx'> 	int rv;</div><div class='ctx'> </div><div class='del'>-	idr_preload(GFP_NOFS);</div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_recover_idr_lock);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_recover_xa_lock);</div><div class='ctx'> 	if (r-&gt;res_id) {</div><div class='ctx'> 		rv = -1;</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	}</div><div class='del'>-	rv = idr_alloc(&amp;ls-&gt;ls_recover_idr, r, 1, 0, GFP_NOWAIT);</div><div class='add'>+	rv = xa_alloc(&amp;ls-&gt;ls_recover_xa, &amp;id, r, limit, GFP_ATOMIC);</div><div class='ctx'> 	if (rv &lt; 0)</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='del'>-	r-&gt;res_id = rv;</div><div class='add'>+	r-&gt;res_id = id;</div><div class='ctx'> 	ls-&gt;ls_recover_list_count++;</div><div class='ctx'> 	dlm_hold_rsb(r);</div><div class='ctx'> 	rv = 0;</div><div class='ctx'> out_unlock:</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_recover_idr_lock);</div><div class='del'>-	idr_preload_end();</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_recover_xa_lock);</div><div class='ctx'> 	return rv;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void recover_idr_del(struct dlm_rsb *r)</div><div class='add'>+static void recover_xa_del(struct dlm_rsb *r)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_ls *ls = r-&gt;res_ls;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_recover_idr_lock);</div><div class='del'>-	idr_remove(&amp;ls-&gt;ls_recover_idr, r-&gt;res_id);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_recover_xa_lock);</div><div class='add'>+	xa_erase_bh(&amp;ls-&gt;ls_recover_xa, r-&gt;res_id);</div><div class='ctx'> 	r-&gt;res_id = 0;</div><div class='ctx'> 	ls-&gt;ls_recover_list_count--;</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_recover_idr_lock);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_recover_xa_lock);</div><div class='ctx'> </div><div class='ctx'> 	dlm_put_rsb(r);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct dlm_rsb *recover_idr_find(struct dlm_ls *ls, uint64_t id)</div><div class='add'>+static struct dlm_rsb *recover_xa_find(struct dlm_ls *ls, uint64_t id)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rsb *r;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_recover_idr_lock);</div><div class='del'>-	r = idr_find(&amp;ls-&gt;ls_recover_idr, (int)id);</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_recover_idr_lock);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_recover_xa_lock);</div><div class='add'>+	r = xa_load(&amp;ls-&gt;ls_recover_xa, (int)id);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_recover_xa_lock);</div><div class='ctx'> 	return r;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void recover_idr_clear(struct dlm_ls *ls)</div><div class='add'>+static void recover_xa_clear(struct dlm_ls *ls)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rsb *r;</div><div class='del'>-	int id;</div><div class='add'>+	unsigned long id;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_recover_idr_lock);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_recover_xa_lock);</div><div class='ctx'> </div><div class='del'>-	idr_for_each_entry(&amp;ls-&gt;ls_recover_idr, r, id) {</div><div class='del'>-		idr_remove(&amp;ls-&gt;ls_recover_idr, id);</div><div class='add'>+	xa_for_each(&amp;ls-&gt;ls_recover_xa, id, r) {</div><div class='add'>+		xa_erase_bh(&amp;ls-&gt;ls_recover_xa, id);</div><div class='ctx'> 		r-&gt;res_id = 0;</div><div class='ctx'> 		r-&gt;res_recover_locks_count = 0;</div><div class='ctx'> 		ls-&gt;ls_recover_list_count--;</div><div class='hunk'>@@ -373,7 +377,7 @@ static void recover_idr_clear(struct dlm_ls *ls)</div><div class='ctx'> 			  ls-&gt;ls_recover_list_count);</div><div class='ctx'> 		ls-&gt;ls_recover_list_count = 0;</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_recover_idr_lock);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_recover_xa_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> </div><div class='hunk'>@@ -403,7 +407,7 @@ static void set_lock_master(struct list_head *queue, int nodeid)</div><div class='ctx'> 	struct dlm_lkb *lkb;</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(lkb, queue, lkb_statequeue) {</div><div class='del'>-		if (!(lkb-&gt;lkb_flags &amp; DLM_IFL_MSTCPY)) {</div><div class='add'>+		if (!test_bit(DLM_IFL_MSTCPY_BIT, &amp;lkb-&gt;lkb_iflags)) {</div><div class='ctx'> 			lkb-&gt;lkb_nodeid = nodeid;</div><div class='ctx'> 			lkb-&gt;lkb_remid = 0;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -441,17 +445,18 @@ static void set_new_master(struct dlm_rsb *r)</div><div class='ctx'>  * equals our_nodeid below).</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static int recover_master(struct dlm_rsb *r, unsigned int *count)</div><div class='add'>+static int recover_master(struct dlm_rsb *r, unsigned int *count, uint64_t seq)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_ls *ls = r-&gt;res_ls;</div><div class='ctx'> 	int our_nodeid, dir_nodeid;</div><div class='ctx'> 	int is_removed = 0;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	if (is_master(r))</div><div class='add'>+	if (r-&gt;res_nodeid != -1 &amp;&amp; is_master(r))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	is_removed = dlm_is_removed(ls, r-&gt;res_nodeid);</div><div class='add'>+	if (r-&gt;res_nodeid != -1)</div><div class='add'>+		is_removed = dlm_is_removed(ls, r-&gt;res_nodeid);</div><div class='ctx'> </div><div class='ctx'> 	if (!is_removed &amp;&amp; !rsb_flag(r, RSB_NEW_MASTER))</div><div class='ctx'> 		return 0;</div><div class='hunk'>@@ -471,8 +476,8 @@ static int recover_master(struct dlm_rsb *r, unsigned int *count)</div><div class='ctx'> 		set_new_master(r);</div><div class='ctx'> 		error = 0;</div><div class='ctx'> 	} else {</div><div class='del'>-		recover_idr_add(r);</div><div class='del'>-		error = dlm_send_rcom_lookup(r, dir_nodeid);</div><div class='add'>+		recover_xa_add(r);</div><div class='add'>+		error = dlm_send_rcom_lookup(r, dir_nodeid, seq);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	(*count)++;</div><div class='hunk'>@@ -520,7 +525,8 @@ static int recover_master_static(struct dlm_rsb *r, unsigned int *count)</div><div class='ctx'>  * the correct dir node.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-int dlm_recover_masters(struct dlm_ls *ls)</div><div class='add'>+int dlm_recover_masters(struct dlm_ls *ls, uint64_t seq,</div><div class='add'>+			const struct list_head *root_list)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rsb *r;</div><div class='ctx'> 	unsigned int total = 0;</div><div class='hunk'>@@ -530,10 +536,8 @@ int dlm_recover_masters(struct dlm_ls *ls)</div><div class='ctx'> </div><div class='ctx'> 	log_rinfo(ls, "dlm_recover_masters");</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;ls-&gt;ls_root_sem);</div><div class='del'>-	list_for_each_entry(r, &amp;ls-&gt;ls_root_list, res_root_list) {</div><div class='add'>+	list_for_each_entry(r, root_list, res_root_list) {</div><div class='ctx'> 		if (dlm_recovery_stopped(ls)) {</div><div class='del'>-			up_read(&amp;ls-&gt;ls_root_sem);</div><div class='ctx'> 			error = -EINTR;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -542,40 +546,37 @@ int dlm_recover_masters(struct dlm_ls *ls)</div><div class='ctx'> 		if (nodir)</div><div class='ctx'> 			error = recover_master_static(r, &amp;count);</div><div class='ctx'> 		else</div><div class='del'>-			error = recover_master(r, &amp;count);</div><div class='add'>+			error = recover_master(r, &amp;count, seq);</div><div class='ctx'> 		unlock_rsb(r);</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 		total++;</div><div class='ctx'> </div><div class='del'>-		if (error) {</div><div class='del'>-			up_read(&amp;ls-&gt;ls_root_sem);</div><div class='add'>+		if (error)</div><div class='ctx'> 			goto out;</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='del'>-	up_read(&amp;ls-&gt;ls_root_sem);</div><div class='ctx'> </div><div class='ctx'> 	log_rinfo(ls, "dlm_recover_masters %u of %u", count, total);</div><div class='ctx'> </div><div class='del'>-	error = dlm_wait_function(ls, &amp;recover_idr_empty);</div><div class='add'>+	error = dlm_wait_function(ls, &amp;recover_xa_empty);</div><div class='ctx'>  out:</div><div class='ctx'> 	if (error)</div><div class='del'>-		recover_idr_clear(ls);</div><div class='add'>+		recover_xa_clear(ls);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int dlm_recover_master_reply(struct dlm_ls *ls, struct dlm_rcom *rc)</div><div class='add'>+int dlm_recover_master_reply(struct dlm_ls *ls, const struct dlm_rcom *rc)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rsb *r;</div><div class='ctx'> 	int ret_nodeid, new_master;</div><div class='ctx'> </div><div class='del'>-	r = recover_idr_find(ls, rc-&gt;rc_id);</div><div class='add'>+	r = recover_xa_find(ls, le64_to_cpu(rc-&gt;rc_id));</div><div class='ctx'> 	if (!r) {</div><div class='ctx'> 		log_error(ls, "dlm_recover_master_reply no id %llx",</div><div class='del'>-			  (unsigned long long)rc-&gt;rc_id);</div><div class='add'>+			  (unsigned long long)le64_to_cpu(rc-&gt;rc_id));</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret_nodeid = rc-&gt;rc_result;</div><div class='add'>+	ret_nodeid = le32_to_cpu(rc-&gt;rc_result);</div><div class='ctx'> </div><div class='ctx'> 	if (ret_nodeid == dlm_our_nodeid())</div><div class='ctx'> 		new_master = 0;</div><div class='hunk'>@@ -587,9 +588,9 @@ int dlm_recover_master_reply(struct dlm_ls *ls, struct dlm_rcom *rc)</div><div class='ctx'> 	r-&gt;res_nodeid = new_master;</div><div class='ctx'> 	set_new_master(r);</div><div class='ctx'> 	unlock_rsb(r);</div><div class='del'>-	recover_idr_del(r);</div><div class='add'>+	recover_xa_del(r);</div><div class='ctx'> </div><div class='del'>-	if (recover_idr_empty(ls))</div><div class='add'>+	if (recover_xa_empty(ls))</div><div class='ctx'> 		wake_up(&amp;ls-&gt;ls_wait_general);</div><div class='ctx'>  out:</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -614,13 +615,14 @@ int dlm_recover_master_reply(struct dlm_ls *ls, struct dlm_rcom *rc)</div><div class='ctx'>  * an equal number of replies then recovery for the rsb is done</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static int recover_locks_queue(struct dlm_rsb *r, struct list_head *head)</div><div class='add'>+static int recover_locks_queue(struct dlm_rsb *r, struct list_head *head,</div><div class='add'>+			       uint64_t seq)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_lkb *lkb;</div><div class='ctx'> 	int error = 0;</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(lkb, head, lkb_statequeue) {</div><div class='del'>-	   	error = dlm_send_rcom_lock(r, lkb);</div><div class='add'>+		error = dlm_send_rcom_lock(r, lkb, seq);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			break;</div><div class='ctx'> 		r-&gt;res_recover_locks_count++;</div><div class='hunk'>@@ -629,7 +631,7 @@ static int recover_locks_queue(struct dlm_rsb *r, struct list_head *head)</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int recover_locks(struct dlm_rsb *r)</div><div class='add'>+static int recover_locks(struct dlm_rsb *r, uint64_t seq)</div><div class='ctx'> {</div><div class='ctx'> 	int error = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -637,13 +639,13 @@ static int recover_locks(struct dlm_rsb *r)</div><div class='ctx'> </div><div class='ctx'> 	DLM_ASSERT(!r-&gt;res_recover_locks_count, dlm_dump_rsb(r););</div><div class='ctx'> </div><div class='del'>-	error = recover_locks_queue(r, &amp;r-&gt;res_grantqueue);</div><div class='add'>+	error = recover_locks_queue(r, &amp;r-&gt;res_grantqueue, seq);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='del'>-	error = recover_locks_queue(r, &amp;r-&gt;res_convertqueue);</div><div class='add'>+	error = recover_locks_queue(r, &amp;r-&gt;res_convertqueue, seq);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='del'>-	error = recover_locks_queue(r, &amp;r-&gt;res_waitqueue);</div><div class='add'>+	error = recover_locks_queue(r, &amp;r-&gt;res_waitqueue, seq);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -656,14 +658,14 @@ static int recover_locks(struct dlm_rsb *r)</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int dlm_recover_locks(struct dlm_ls *ls)</div><div class='add'>+int dlm_recover_locks(struct dlm_ls *ls, uint64_t seq,</div><div class='add'>+		      const struct list_head *root_list)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rsb *r;</div><div class='ctx'> 	int error, count = 0;</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;ls-&gt;ls_root_sem);</div><div class='del'>-	list_for_each_entry(r, &amp;ls-&gt;ls_root_list, res_root_list) {</div><div class='del'>-		if (is_master(r)) {</div><div class='add'>+	list_for_each_entry(r, root_list, res_root_list) {</div><div class='add'>+		if (r-&gt;res_nodeid != -1 &amp;&amp; is_master(r)) {</div><div class='ctx'> 			rsb_clear_flag(r, RSB_NEW_MASTER);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -673,19 +675,15 @@ int dlm_recover_locks(struct dlm_ls *ls)</div><div class='ctx'> </div><div class='ctx'> 		if (dlm_recovery_stopped(ls)) {</div><div class='ctx'> 			error = -EINTR;</div><div class='del'>-			up_read(&amp;ls-&gt;ls_root_sem);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		error = recover_locks(r);</div><div class='del'>-		if (error) {</div><div class='del'>-			up_read(&amp;ls-&gt;ls_root_sem);</div><div class='add'>+		error = recover_locks(r, seq);</div><div class='add'>+		if (error)</div><div class='ctx'> 			goto out;</div><div class='del'>-		}</div><div class='ctx'> </div><div class='ctx'> 		count += r-&gt;res_recover_locks_count;</div><div class='ctx'> 	}</div><div class='del'>-	up_read(&amp;ls-&gt;ls_root_sem);</div><div class='ctx'> </div><div class='ctx'> 	log_rinfo(ls, "dlm_recover_locks %d out", count);</div><div class='ctx'> </div><div class='hunk'>@@ -732,10 +730,9 @@ void dlm_recovered_lock(struct dlm_rsb *r)</div><div class='ctx'> </div><div class='ctx'> static void recover_lvb(struct dlm_rsb *r)</div><div class='ctx'> {</div><div class='del'>-	struct dlm_lkb *lkb, *high_lkb = NULL;</div><div class='add'>+	struct dlm_lkb *big_lkb = NULL, *iter, *high_lkb = NULL;</div><div class='ctx'> 	uint32_t high_seq = 0;</div><div class='ctx'> 	int lock_lvb_exists = 0;</div><div class='del'>-	int big_lock_exists = 0;</div><div class='ctx'> 	int lvblen = r-&gt;res_ls-&gt;ls_lvblen;</div><div class='ctx'> </div><div class='ctx'> 	if (!rsb_flag(r, RSB_NEW_MASTER2) &amp;&amp;</div><div class='hunk'>@@ -751,37 +748,37 @@ static void recover_lvb(struct dlm_rsb *r)</div><div class='ctx'> 	/* we are the new master, so figure out if VALNOTVALID should</div><div class='ctx'> 	   be set, and set the rsb lvb from the best lkb available. */</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry(lkb, &amp;r-&gt;res_grantqueue, lkb_statequeue) {</div><div class='del'>-		if (!(lkb-&gt;lkb_exflags &amp; DLM_LKF_VALBLK))</div><div class='add'>+	list_for_each_entry(iter, &amp;r-&gt;res_grantqueue, lkb_statequeue) {</div><div class='add'>+		if (!(iter-&gt;lkb_exflags &amp; DLM_LKF_VALBLK))</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		lock_lvb_exists = 1;</div><div class='ctx'> </div><div class='del'>-		if (lkb-&gt;lkb_grmode &gt; DLM_LOCK_CR) {</div><div class='del'>-			big_lock_exists = 1;</div><div class='add'>+		if (iter-&gt;lkb_grmode &gt; DLM_LOCK_CR) {</div><div class='add'>+			big_lkb = iter;</div><div class='ctx'> 			goto setflag;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (((int)lkb-&gt;lkb_lvbseq - (int)high_seq) &gt;= 0) {</div><div class='del'>-			high_lkb = lkb;</div><div class='del'>-			high_seq = lkb-&gt;lkb_lvbseq;</div><div class='add'>+		if (((int)iter-&gt;lkb_lvbseq - (int)high_seq) &gt;= 0) {</div><div class='add'>+			high_lkb = iter;</div><div class='add'>+			high_seq = iter-&gt;lkb_lvbseq;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry(lkb, &amp;r-&gt;res_convertqueue, lkb_statequeue) {</div><div class='del'>-		if (!(lkb-&gt;lkb_exflags &amp; DLM_LKF_VALBLK))</div><div class='add'>+	list_for_each_entry(iter, &amp;r-&gt;res_convertqueue, lkb_statequeue) {</div><div class='add'>+		if (!(iter-&gt;lkb_exflags &amp; DLM_LKF_VALBLK))</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		lock_lvb_exists = 1;</div><div class='ctx'> </div><div class='del'>-		if (lkb-&gt;lkb_grmode &gt; DLM_LOCK_CR) {</div><div class='del'>-			big_lock_exists = 1;</div><div class='add'>+		if (iter-&gt;lkb_grmode &gt; DLM_LOCK_CR) {</div><div class='add'>+			big_lkb = iter;</div><div class='ctx'> 			goto setflag;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (((int)lkb-&gt;lkb_lvbseq - (int)high_seq) &gt;= 0) {</div><div class='del'>-			high_lkb = lkb;</div><div class='del'>-			high_seq = lkb-&gt;lkb_lvbseq;</div><div class='add'>+		if (((int)iter-&gt;lkb_lvbseq - (int)high_seq) &gt;= 0) {</div><div class='add'>+			high_lkb = iter;</div><div class='add'>+			high_seq = iter-&gt;lkb_lvbseq;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -790,7 +787,7 @@ static void recover_lvb(struct dlm_rsb *r)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	/* lvb is invalidated if only NL/CR locks remain */</div><div class='del'>-	if (!big_lock_exists)</div><div class='add'>+	if (!big_lkb)</div><div class='ctx'> 		rsb_set_flag(r, RSB_VALNOTVALID);</div><div class='ctx'> </div><div class='ctx'> 	if (!r-&gt;res_lvbptr) {</div><div class='hunk'>@@ -799,9 +796,9 @@ static void recover_lvb(struct dlm_rsb *r)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (big_lock_exists) {</div><div class='del'>-		r-&gt;res_lvbseq = lkb-&gt;lkb_lvbseq;</div><div class='del'>-		memcpy(r-&gt;res_lvbptr, lkb-&gt;lkb_lvbptr, lvblen);</div><div class='add'>+	if (big_lkb) {</div><div class='add'>+		r-&gt;res_lvbseq = big_lkb-&gt;lkb_lvbseq;</div><div class='add'>+		memcpy(r-&gt;res_lvbptr, big_lkb-&gt;lkb_lvbptr, lvblen);</div><div class='ctx'> 	} else if (high_lkb) {</div><div class='ctx'> 		r-&gt;res_lvbseq = high_lkb-&gt;lkb_lvbseq;</div><div class='ctx'> 		memcpy(r-&gt;res_lvbptr, high_lkb-&gt;lkb_lvbptr, lvblen);</div><div class='hunk'>@@ -814,33 +811,42 @@ static void recover_lvb(struct dlm_rsb *r)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* All master rsb's flagged RECOVER_CONVERT need to be looked at.  The locks</div><div class='del'>-   converting PR-&gt;CW or CW-&gt;PR need to have their lkb_grmode set. */</div><div class='add'>+ * converting PR-&gt;CW or CW-&gt;PR may need to have their lkb_grmode changed.</div><div class='add'>+ */</div><div class='ctx'> </div><div class='ctx'> static void recover_conversion(struct dlm_rsb *r)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_ls *ls = r-&gt;res_ls;</div><div class='add'>+	uint32_t other_lkid = 0;</div><div class='add'>+	int other_grmode = -1;</div><div class='ctx'> 	struct dlm_lkb *lkb;</div><div class='del'>-	int grmode = -1;</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(lkb, &amp;r-&gt;res_grantqueue, lkb_statequeue) {</div><div class='ctx'> 		if (lkb-&gt;lkb_grmode == DLM_LOCK_PR ||</div><div class='ctx'> 		    lkb-&gt;lkb_grmode == DLM_LOCK_CW) {</div><div class='del'>-			grmode = lkb-&gt;lkb_grmode;</div><div class='add'>+			other_grmode = lkb-&gt;lkb_grmode;</div><div class='add'>+			other_lkid = lkb-&gt;lkb_id;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (other_grmode == -1)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='ctx'> 	list_for_each_entry(lkb, &amp;r-&gt;res_convertqueue, lkb_statequeue) {</div><div class='del'>-		if (lkb-&gt;lkb_grmode != DLM_LOCK_IV)</div><div class='del'>-			continue;</div><div class='del'>-		if (grmode == -1) {</div><div class='del'>-			log_debug(ls, "recover_conversion %x set gr to rq %d",</div><div class='del'>-				  lkb-&gt;lkb_id, lkb-&gt;lkb_rqmode);</div><div class='del'>-			lkb-&gt;lkb_grmode = lkb-&gt;lkb_rqmode;</div><div class='del'>-		} else {</div><div class='del'>-			log_debug(ls, "recover_conversion %x set gr %d",</div><div class='del'>-				  lkb-&gt;lkb_id, grmode);</div><div class='del'>-			lkb-&gt;lkb_grmode = grmode;</div><div class='add'>+		/* Lock recovery created incompatible granted modes, so</div><div class='add'>+		 * change the granted mode of the converting lock to</div><div class='add'>+		 * NL. The rqmode of the converting lock should be CW,</div><div class='add'>+		 * which means the converting lock should be granted at</div><div class='add'>+		 * the end of recovery.</div><div class='add'>+		 */</div><div class='add'>+		if (((lkb-&gt;lkb_grmode == DLM_LOCK_PR) &amp;&amp; (other_grmode == DLM_LOCK_CW)) ||</div><div class='add'>+		    ((lkb-&gt;lkb_grmode == DLM_LOCK_CW) &amp;&amp; (other_grmode == DLM_LOCK_PR))) {</div><div class='add'>+			log_rinfo(ls, "%s %x gr %d rq %d, remote %d %x, other_lkid %u, other gr %d, set gr=NL",</div><div class='add'>+				  __func__, lkb-&gt;lkb_id, lkb-&gt;lkb_grmode,</div><div class='add'>+				  lkb-&gt;lkb_rqmode, lkb-&gt;lkb_nodeid,</div><div class='add'>+				  lkb-&gt;lkb_remid, other_lkid, other_grmode);</div><div class='add'>+			lkb-&gt;lkb_grmode = DLM_LOCK_NL;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -855,15 +861,14 @@ static void recover_grant(struct dlm_rsb *r)</div><div class='ctx'> 		rsb_set_flag(r, RSB_RECOVER_GRANT);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void dlm_recover_rsbs(struct dlm_ls *ls)</div><div class='add'>+void dlm_recover_rsbs(struct dlm_ls *ls, const struct list_head *root_list)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rsb *r;</div><div class='ctx'> 	unsigned int count = 0;</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;ls-&gt;ls_root_sem);</div><div class='del'>-	list_for_each_entry(r, &amp;ls-&gt;ls_root_list, res_root_list) {</div><div class='add'>+	list_for_each_entry(r, root_list, res_root_list) {</div><div class='ctx'> 		lock_rsb(r);</div><div class='del'>-		if (is_master(r)) {</div><div class='add'>+		if (r-&gt;res_nodeid != -1 &amp;&amp; is_master(r)) {</div><div class='ctx'> 			if (rsb_flag(r, RSB_RECOVER_CONVERT))</div><div class='ctx'> 				recover_conversion(r);</div><div class='ctx'> </div><div class='hunk'>@@ -882,76 +887,31 @@ void dlm_recover_rsbs(struct dlm_ls *ls)</div><div class='ctx'> 		rsb_clear_flag(r, RSB_NEW_MASTER2);</div><div class='ctx'> 		unlock_rsb(r);</div><div class='ctx'> 	}</div><div class='del'>-	up_read(&amp;ls-&gt;ls_root_sem);</div><div class='ctx'> </div><div class='ctx'> 	if (count)</div><div class='ctx'> 		log_rinfo(ls, "dlm_recover_rsbs %d done", count);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Create a single list of all root rsb's to be used during recovery */</div><div class='del'>-</div><div class='del'>-int dlm_create_root_list(struct dlm_ls *ls)</div><div class='del'>-{</div><div class='del'>-	struct rb_node *n;</div><div class='del'>-	struct dlm_rsb *r;</div><div class='del'>-	int i, error = 0;</div><div class='del'>-</div><div class='del'>-	down_write(&amp;ls-&gt;ls_root_sem);</div><div class='del'>-	if (!list_empty(&amp;ls-&gt;ls_root_list)) {</div><div class='del'>-		log_error(ls, "root list not empty");</div><div class='del'>-		error = -EINVAL;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; ls-&gt;ls_rsbtbl_size; i++) {</div><div class='del'>-		spin_lock(&amp;ls-&gt;ls_rsbtbl[i].lock);</div><div class='del'>-		for (n = rb_first(&amp;ls-&gt;ls_rsbtbl[i].keep); n; n = rb_next(n)) {</div><div class='del'>-			r = rb_entry(n, struct dlm_rsb, res_hashnode);</div><div class='del'>-			list_add(&amp;r-&gt;res_root_list, &amp;ls-&gt;ls_root_list);</div><div class='del'>-			dlm_hold_rsb(r);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (!RB_EMPTY_ROOT(&amp;ls-&gt;ls_rsbtbl[i].toss))</div><div class='del'>-			log_error(ls, "dlm_create_root_list toss not empty");</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_rsbtbl[i].lock);</div><div class='del'>-	}</div><div class='del'>- out:</div><div class='del'>-	up_write(&amp;ls-&gt;ls_root_sem);</div><div class='del'>-	return error;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void dlm_release_root_list(struct dlm_ls *ls)</div><div class='add'>+void dlm_clear_inactive(struct dlm_ls *ls)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_rsb *r, *safe;</div><div class='add'>+	unsigned int count = 0;</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;ls-&gt;ls_root_sem);</div><div class='del'>-	list_for_each_entry_safe(r, safe, &amp;ls-&gt;ls_root_list, res_root_list) {</div><div class='del'>-		list_del_init(&amp;r-&gt;res_root_list);</div><div class='del'>-		dlm_put_rsb(r);</div><div class='del'>-	}</div><div class='del'>-	up_write(&amp;ls-&gt;ls_root_sem);</div><div class='del'>-}</div><div class='add'>+	write_lock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+	list_for_each_entry_safe(r, safe, &amp;ls-&gt;ls_slow_inactive, res_slow_list) {</div><div class='add'>+		list_del(&amp;r-&gt;res_slow_list);</div><div class='add'>+		rhashtable_remove_fast(&amp;ls-&gt;ls_rsbtbl, &amp;r-&gt;res_node,</div><div class='add'>+				       dlm_rhash_rsb_params);</div><div class='ctx'> </div><div class='del'>-void dlm_clear_toss(struct dlm_ls *ls)</div><div class='del'>-{</div><div class='del'>-	struct rb_node *n, *next;</div><div class='del'>-	struct dlm_rsb *r;</div><div class='del'>-	unsigned int count = 0;</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; ls-&gt;ls_rsbtbl_size; i++) {</div><div class='del'>-		spin_lock(&amp;ls-&gt;ls_rsbtbl[i].lock);</div><div class='del'>-		for (n = rb_first(&amp;ls-&gt;ls_rsbtbl[i].toss); n; n = next) {</div><div class='del'>-			next = rb_next(n);</div><div class='del'>-			r = rb_entry(n, struct dlm_rsb, res_hashnode);</div><div class='del'>-			rb_erase(n, &amp;ls-&gt;ls_rsbtbl[i].toss);</div><div class='del'>-			dlm_free_rsb(r);</div><div class='del'>-			count++;</div><div class='del'>-		}</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_rsbtbl[i].lock);</div><div class='add'>+		if (!list_empty(&amp;r-&gt;res_scan_list))</div><div class='add'>+			list_del_init(&amp;r-&gt;res_scan_list);</div><div class='add'>+</div><div class='add'>+		free_inactive_rsb(r);</div><div class='add'>+		count++;</div><div class='ctx'> 	}</div><div class='add'>+	write_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (count)</div><div class='del'>-		log_rinfo(ls, "dlm_clear_toss %u done", count);</div><div class='add'>+		log_rinfo(ls, "dlm_clear_inactive %u done", count);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/dlm/recover.h b/fs/dlm/recover.h<br/>index 235e0d25cd48..ec69896462fb 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/recover.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/recover.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/recover.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/recover.h</a></div><div class='hunk'>@@ -15,18 +15,18 @@</div><div class='ctx'> int dlm_wait_function(struct dlm_ls *ls, int (*testfn) (struct dlm_ls *ls));</div><div class='ctx'> uint32_t dlm_recover_status(struct dlm_ls *ls);</div><div class='ctx'> void dlm_set_recover_status(struct dlm_ls *ls, uint32_t status);</div><div class='del'>-int dlm_recover_members_wait(struct dlm_ls *ls);</div><div class='del'>-int dlm_recover_directory_wait(struct dlm_ls *ls);</div><div class='del'>-int dlm_recover_locks_wait(struct dlm_ls *ls);</div><div class='del'>-int dlm_recover_done_wait(struct dlm_ls *ls);</div><div class='del'>-int dlm_recover_masters(struct dlm_ls *ls);</div><div class='del'>-int dlm_recover_master_reply(struct dlm_ls *ls, struct dlm_rcom *rc);</div><div class='del'>-int dlm_recover_locks(struct dlm_ls *ls);</div><div class='add'>+int dlm_recover_members_wait(struct dlm_ls *ls, uint64_t seq);</div><div class='add'>+int dlm_recover_directory_wait(struct dlm_ls *ls, uint64_t seq);</div><div class='add'>+int dlm_recover_locks_wait(struct dlm_ls *ls, uint64_t seq);</div><div class='add'>+int dlm_recover_done_wait(struct dlm_ls *ls, uint64_t seq);</div><div class='add'>+int dlm_recover_masters(struct dlm_ls *ls, uint64_t seq,</div><div class='add'>+			const struct list_head *root_list);</div><div class='add'>+int dlm_recover_master_reply(struct dlm_ls *ls, const struct dlm_rcom *rc);</div><div class='add'>+int dlm_recover_locks(struct dlm_ls *ls, uint64_t seq,</div><div class='add'>+		      const struct list_head *root_list);</div><div class='ctx'> void dlm_recovered_lock(struct dlm_rsb *r);</div><div class='del'>-int dlm_create_root_list(struct dlm_ls *ls);</div><div class='del'>-void dlm_release_root_list(struct dlm_ls *ls);</div><div class='del'>-void dlm_clear_toss(struct dlm_ls *ls);</div><div class='del'>-void dlm_recover_rsbs(struct dlm_ls *ls);</div><div class='add'>+void dlm_clear_inactive(struct dlm_ls *ls);</div><div class='add'>+void dlm_recover_rsbs(struct dlm_ls *ls, const struct list_head *root_list);</div><div class='ctx'> </div><div class='ctx'> #endif				/* __RECOVER_DOT_H__ */</div><div class='ctx'> </div><div class='head'>diff --git a/fs/dlm/recoverd.c b/fs/dlm/recoverd.c<br/>index 97d052cea5a9..12272a8f6d75 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/recoverd.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/recoverd.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/recoverd.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/recoverd.c</a></div><div class='hunk'>@@ -20,6 +20,67 @@</div><div class='ctx'> #include "requestqueue.h"</div><div class='ctx'> #include "recoverd.h"</div><div class='ctx'> </div><div class='add'>+static int dlm_create_masters_list(struct dlm_ls *ls)</div><div class='add'>+{</div><div class='add'>+	struct dlm_rsb *r;</div><div class='add'>+	int error = 0;</div><div class='add'>+</div><div class='add'>+	write_lock_bh(&amp;ls-&gt;ls_masters_lock);</div><div class='add'>+	if (!list_empty(&amp;ls-&gt;ls_masters_list)) {</div><div class='add'>+		log_error(ls, "root list not empty");</div><div class='add'>+		error = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	read_lock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+	list_for_each_entry(r, &amp;ls-&gt;ls_slow_active, res_slow_list) {</div><div class='add'>+		if (r-&gt;res_nodeid)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		list_add(&amp;r-&gt;res_masters_list, &amp;ls-&gt;ls_masters_list);</div><div class='add'>+		dlm_hold_rsb(r);</div><div class='add'>+	}</div><div class='add'>+	read_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+ out:</div><div class='add'>+	write_unlock_bh(&amp;ls-&gt;ls_masters_lock);</div><div class='add'>+	return error;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void dlm_release_masters_list(struct dlm_ls *ls)</div><div class='add'>+{</div><div class='add'>+	struct dlm_rsb *r, *safe;</div><div class='add'>+</div><div class='add'>+	write_lock_bh(&amp;ls-&gt;ls_masters_lock);</div><div class='add'>+	list_for_each_entry_safe(r, safe, &amp;ls-&gt;ls_masters_list, res_masters_list) {</div><div class='add'>+		list_del_init(&amp;r-&gt;res_masters_list);</div><div class='add'>+		dlm_put_rsb(r);</div><div class='add'>+	}</div><div class='add'>+	write_unlock_bh(&amp;ls-&gt;ls_masters_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void dlm_create_root_list(struct dlm_ls *ls, struct list_head *root_list)</div><div class='add'>+{</div><div class='add'>+	struct dlm_rsb *r;</div><div class='add'>+</div><div class='add'>+	read_lock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+	list_for_each_entry(r, &amp;ls-&gt;ls_slow_active, res_slow_list) {</div><div class='add'>+		list_add(&amp;r-&gt;res_root_list, root_list);</div><div class='add'>+		dlm_hold_rsb(r);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	WARN_ON_ONCE(!list_empty(&amp;ls-&gt;ls_slow_inactive));</div><div class='add'>+	read_unlock_bh(&amp;ls-&gt;ls_rsbtbl_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void dlm_release_root_list(struct list_head *root_list)</div><div class='add'>+{</div><div class='add'>+	struct dlm_rsb *r, *safe;</div><div class='add'>+</div><div class='add'>+	list_for_each_entry_safe(r, safe, root_list, res_root_list) {</div><div class='add'>+		list_del_init(&amp;r-&gt;res_root_list);</div><div class='add'>+		dlm_put_rsb(r);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /* If the start for which we're re-enabling locking (seq) has been superseded</div><div class='ctx'>    by a newer stop (ls_recover_seq), we need to leave locking disabled.</div><div class='hunk'>@@ -32,24 +93,35 @@ static int enable_locking(struct dlm_ls *ls, uint64_t seq)</div><div class='ctx'> {</div><div class='ctx'> 	int error = -EINTR;</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;ls-&gt;ls_recv_active);</div><div class='add'>+	write_lock_bh(&amp;ls-&gt;ls_recv_active);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_recover_lock);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_recover_lock);</div><div class='ctx'> 	if (ls-&gt;ls_recover_seq == seq) {</div><div class='ctx'> 		set_bit(LSFL_RUNNING, &amp;ls-&gt;ls_flags);</div><div class='add'>+		/* Schedule next timer if recovery put something on inactive.</div><div class='add'>+		 *</div><div class='add'>+		 * The rsbs that was queued while recovery on toss hasn't</div><div class='add'>+		 * started yet because LSFL_RUNNING was set everything</div><div class='add'>+		 * else recovery hasn't started as well because ls_in_recovery</div><div class='add'>+		 * is still hold. So we should not run into the case that</div><div class='add'>+		 * resume_scan_timer() queues a timer that can occur in</div><div class='add'>+		 * a no op.</div><div class='add'>+		 */</div><div class='add'>+		resume_scan_timer(ls);</div><div class='ctx'> 		/* unblocks processes waiting to enter the dlm */</div><div class='ctx'> 		up_write(&amp;ls-&gt;ls_in_recovery);</div><div class='ctx'> 		clear_bit(LSFL_RECOVER_LOCK, &amp;ls-&gt;ls_flags);</div><div class='ctx'> 		error = 0;</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_recover_lock);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_recover_lock);</div><div class='ctx'> </div><div class='del'>-	up_write(&amp;ls-&gt;ls_recv_active);</div><div class='add'>+	write_unlock_bh(&amp;ls-&gt;ls_recv_active);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ls_recover(struct dlm_ls *ls, struct dlm_recover *rv)</div><div class='ctx'> {</div><div class='add'>+	LIST_HEAD(root_list);</div><div class='ctx'> 	unsigned long start;</div><div class='ctx'> 	int error, neg = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -59,37 +131,57 @@ static int ls_recover(struct dlm_ls *ls, struct dlm_recover *rv)</div><div class='ctx'> </div><div class='ctx'> 	dlm_callback_suspend(ls);</div><div class='ctx'> </div><div class='del'>-	dlm_clear_toss(ls);</div><div class='add'>+	dlm_clear_inactive(ls);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * This list of root rsb's will be the basis of most of the recovery</div><div class='ctx'> 	 * routines.</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='del'>-	dlm_create_root_list(ls);</div><div class='add'>+	dlm_create_root_list(ls, &amp;root_list);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Add or remove nodes from the lockspace's ls_nodes list.</div><div class='add'>+	 *</div><div class='add'>+	 * Due to the fact that we must report all membership changes to lsops</div><div class='add'>+	 * or midcomms layer, it is not permitted to abort ls_recover() until</div><div class='add'>+	 * this is done.</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='ctx'> 	error = dlm_recover_members(ls, rv, &amp;neg);</div><div class='ctx'> 	if (error) {</div><div class='ctx'> 		log_rinfo(ls, "dlm_recover_members error %d", error);</div><div class='del'>-		goto fail;</div><div class='add'>+		goto fail_root_list;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dlm_recover_dir_nodeid(ls);</div><div class='add'>+	dlm_recover_dir_nodeid(ls, &amp;root_list);</div><div class='add'>+</div><div class='add'>+	/* Create a snapshot of all active rsbs were we are the master of.</div><div class='add'>+	 * During the barrier between dlm_recover_members_wait() and</div><div class='add'>+	 * dlm_recover_directory() other nodes can dump their necessary</div><div class='add'>+	 * directory dlm_rsb (r-&gt;res_dir_nodeid == nodeid) in rcom</div><div class='add'>+	 * communication dlm_copy_master_names() handling.</div><div class='add'>+	 *</div><div class='add'>+	 * TODO We should create a per lockspace list that contains rsbs</div><div class='add'>+	 * that we are the master of. Instead of creating this list while</div><div class='add'>+	 * recovery we keep track of those rsbs while locking handling and</div><div class='add'>+	 * recovery can use it when necessary.</div><div class='add'>+	 */</div><div class='add'>+	error = dlm_create_masters_list(ls);</div><div class='add'>+	if (error) {</div><div class='add'>+		log_rinfo(ls, "dlm_create_masters_list error %d", error);</div><div class='add'>+		goto fail_root_list;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	ls-&gt;ls_recover_dir_sent_res = 0;</div><div class='del'>-	ls-&gt;ls_recover_dir_sent_msg = 0;</div><div class='ctx'> 	ls-&gt;ls_recover_locks_in = 0;</div><div class='ctx'> </div><div class='ctx'> 	dlm_set_recover_status(ls, DLM_RS_NODES);</div><div class='ctx'> </div><div class='del'>-	error = dlm_recover_members_wait(ls);</div><div class='add'>+	error = dlm_recover_members_wait(ls, rv-&gt;seq);</div><div class='ctx'> 	if (error) {</div><div class='ctx'> 		log_rinfo(ls, "dlm_recover_members_wait error %d", error);</div><div class='del'>-		goto fail;</div><div class='add'>+		dlm_release_masters_list(ls);</div><div class='add'>+		goto fail_root_list;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	start = jiffies;</div><div class='hunk'>@@ -99,22 +191,23 @@ static int ls_recover(struct dlm_ls *ls, struct dlm_recover *rv)</div><div class='ctx'> 	 * nodes their master rsb names that hash to us.</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='del'>-	error = dlm_recover_directory(ls);</div><div class='add'>+	error = dlm_recover_directory(ls, rv-&gt;seq);</div><div class='ctx'> 	if (error) {</div><div class='ctx'> 		log_rinfo(ls, "dlm_recover_directory error %d", error);</div><div class='del'>-		goto fail;</div><div class='add'>+		dlm_release_masters_list(ls);</div><div class='add'>+		goto fail_root_list;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	dlm_set_recover_status(ls, DLM_RS_DIR);</div><div class='ctx'> </div><div class='del'>-	error = dlm_recover_directory_wait(ls);</div><div class='add'>+	error = dlm_recover_directory_wait(ls, rv-&gt;seq);</div><div class='ctx'> 	if (error) {</div><div class='ctx'> 		log_rinfo(ls, "dlm_recover_directory_wait error %d", error);</div><div class='del'>-		goto fail;</div><div class='add'>+		dlm_release_masters_list(ls);</div><div class='add'>+		goto fail_root_list;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	log_rinfo(ls, "dlm_recover_directory %u out %u messages",</div><div class='del'>-		  ls-&gt;ls_recover_dir_sent_res, ls-&gt;ls_recover_dir_sent_msg);</div><div class='add'>+	dlm_release_masters_list(ls);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We may have outstanding operations that are waiting for a reply from</div><div class='hunk'>@@ -124,10 +217,9 @@ static int ls_recover(struct dlm_ls *ls, struct dlm_recover *rv)</div><div class='ctx'> </div><div class='ctx'> 	dlm_recover_waiters_pre(ls);</div><div class='ctx'> </div><div class='del'>-	error = dlm_recovery_stopped(ls);</div><div class='del'>-	if (error) {</div><div class='add'>+	if (dlm_recovery_stopped(ls)) {</div><div class='ctx'> 		error = -EINTR;</div><div class='del'>-		goto fail;</div><div class='add'>+		goto fail_root_list;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (neg || dlm_no_directory(ls)) {</div><div class='hunk'>@@ -135,35 +227,35 @@ static int ls_recover(struct dlm_ls *ls, struct dlm_recover *rv)</div><div class='ctx'> 		 * Clear lkb's for departed nodes.</div><div class='ctx'> 		 */</div><div class='ctx'> </div><div class='del'>-		dlm_recover_purge(ls);</div><div class='add'>+		dlm_recover_purge(ls, &amp;root_list);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Get new master nodeid's for rsb's that were mastered on</div><div class='ctx'> 		 * departed nodes.</div><div class='ctx'> 		 */</div><div class='ctx'> </div><div class='del'>-		error = dlm_recover_masters(ls);</div><div class='add'>+		error = dlm_recover_masters(ls, rv-&gt;seq, &amp;root_list);</div><div class='ctx'> 		if (error) {</div><div class='ctx'> 			log_rinfo(ls, "dlm_recover_masters error %d", error);</div><div class='del'>-			goto fail;</div><div class='add'>+			goto fail_root_list;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Send our locks on remastered rsb's to the new masters.</div><div class='ctx'> 		 */</div><div class='ctx'> </div><div class='del'>-		error = dlm_recover_locks(ls);</div><div class='add'>+		error = dlm_recover_locks(ls, rv-&gt;seq, &amp;root_list);</div><div class='ctx'> 		if (error) {</div><div class='ctx'> 			log_rinfo(ls, "dlm_recover_locks error %d", error);</div><div class='del'>-			goto fail;</div><div class='add'>+			goto fail_root_list;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		dlm_set_recover_status(ls, DLM_RS_LOCKS);</div><div class='ctx'> </div><div class='del'>-		error = dlm_recover_locks_wait(ls);</div><div class='add'>+		error = dlm_recover_locks_wait(ls, rv-&gt;seq);</div><div class='ctx'> 		if (error) {</div><div class='ctx'> 			log_rinfo(ls, "dlm_recover_locks_wait error %d", error);</div><div class='del'>-			goto fail;</div><div class='add'>+			goto fail_root_list;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		log_rinfo(ls, "dlm_recover_locks %u in",</div><div class='hunk'>@@ -175,7 +267,7 @@ static int ls_recover(struct dlm_ls *ls, struct dlm_recover *rv)</div><div class='ctx'> 		 * settings.</div><div class='ctx'> 		 */</div><div class='ctx'> </div><div class='del'>-		dlm_recover_rsbs(ls);</div><div class='add'>+		dlm_recover_rsbs(ls, &amp;root_list);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Other lockspace members may be going through the "neg" steps</div><div class='hunk'>@@ -184,14 +276,14 @@ static int ls_recover(struct dlm_ls *ls, struct dlm_recover *rv)</div><div class='ctx'> 		 */</div><div class='ctx'> 		dlm_set_recover_status(ls, DLM_RS_LOCKS);</div><div class='ctx'> </div><div class='del'>-		error = dlm_recover_locks_wait(ls);</div><div class='add'>+		error = dlm_recover_locks_wait(ls, rv-&gt;seq);</div><div class='ctx'> 		if (error) {</div><div class='ctx'> 			log_rinfo(ls, "dlm_recover_locks_wait error %d", error);</div><div class='del'>-			goto fail;</div><div class='add'>+			goto fail_root_list;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dlm_release_root_list(ls);</div><div class='add'>+	dlm_release_root_list(&amp;root_list);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Purge directory-related requests that are saved in requestqueue.</div><div class='hunk'>@@ -203,7 +295,7 @@ static int ls_recover(struct dlm_ls *ls, struct dlm_recover *rv)</div><div class='ctx'> </div><div class='ctx'> 	dlm_set_recover_status(ls, DLM_RS_DONE);</div><div class='ctx'> </div><div class='del'>-	error = dlm_recover_done_wait(ls);</div><div class='add'>+	error = dlm_recover_done_wait(ls, rv-&gt;seq);</div><div class='ctx'> 	if (error) {</div><div class='ctx'> 		log_rinfo(ls, "dlm_recover_done_wait error %d", error);</div><div class='ctx'> 		goto fail;</div><div class='hunk'>@@ -211,8 +303,6 @@ static int ls_recover(struct dlm_ls *ls, struct dlm_recover *rv)</div><div class='ctx'> </div><div class='ctx'> 	dlm_clear_members_gone(ls);</div><div class='ctx'> </div><div class='del'>-	dlm_adjust_timeouts(ls);</div><div class='del'>-</div><div class='ctx'> 	dlm_callback_resume(ls);</div><div class='ctx'> </div><div class='ctx'> 	error = enable_locking(ls, rv-&gt;seq);</div><div class='hunk'>@@ -240,14 +330,13 @@ static int ls_recover(struct dlm_ls *ls, struct dlm_recover *rv)</div><div class='ctx'> 		  jiffies_to_msecs(jiffies - start));</div><div class='ctx'> 	mutex_unlock(&amp;ls-&gt;ls_recoverd_active);</div><div class='ctx'> </div><div class='del'>-	dlm_lsop_recover_done(ls);</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='add'>+ fail_root_list:</div><div class='add'>+	dlm_release_root_list(&amp;root_list);</div><div class='ctx'>  fail:</div><div class='del'>-	dlm_release_root_list(ls);</div><div class='del'>-	log_rinfo(ls, "dlm_recover %llu error %d",</div><div class='del'>-		  (unsigned long long)rv-&gt;seq, error);</div><div class='ctx'> 	mutex_unlock(&amp;ls-&gt;ls_recoverd_active);</div><div class='add'>+</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -258,16 +347,41 @@ static int ls_recover(struct dlm_ls *ls, struct dlm_recover *rv)</div><div class='ctx'> static void do_ls_recovery(struct dlm_ls *ls)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_recover *rv = NULL;</div><div class='add'>+	int error;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;ls-&gt;ls_recover_lock);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_recover_lock);</div><div class='ctx'> 	rv = ls-&gt;ls_recover_args;</div><div class='ctx'> 	ls-&gt;ls_recover_args = NULL;</div><div class='ctx'> 	if (rv &amp;&amp; ls-&gt;ls_recover_seq == rv-&gt;seq)</div><div class='ctx'> 		clear_bit(LSFL_RECOVER_STOP, &amp;ls-&gt;ls_flags);</div><div class='del'>-	spin_unlock(&amp;ls-&gt;ls_recover_lock);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_recover_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (rv) {</div><div class='del'>-		ls_recover(ls, rv);</div><div class='add'>+		error = ls_recover(ls, rv);</div><div class='add'>+		switch (error) {</div><div class='add'>+		case 0:</div><div class='add'>+			ls-&gt;ls_recovery_result = 0;</div><div class='add'>+			complete(&amp;ls-&gt;ls_recovery_done);</div><div class='add'>+</div><div class='add'>+			dlm_lsop_recover_done(ls);</div><div class='add'>+			break;</div><div class='add'>+		case -EINTR:</div><div class='add'>+			/* if recovery was interrupted -EINTR we wait for the next</div><div class='add'>+			 * ls_recover() iteration until it hopefully succeeds.</div><div class='add'>+			 */</div><div class='add'>+			log_rinfo(ls, "%s %llu interrupted and should be queued to run again",</div><div class='add'>+				  __func__, (unsigned long long)rv-&gt;seq);</div><div class='add'>+			break;</div><div class='add'>+		default:</div><div class='add'>+			log_rinfo(ls, "%s %llu error %d", __func__,</div><div class='add'>+				  (unsigned long long)rv-&gt;seq, error);</div><div class='add'>+</div><div class='add'>+			/* let new_lockspace() get aware of critical error */</div><div class='add'>+			ls-&gt;ls_recovery_result = error;</div><div class='add'>+			complete(&amp;ls-&gt;ls_recovery_done);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		kfree(rv-&gt;nodes);</div><div class='ctx'> 		kfree(rv);</div><div class='ctx'> 	}</div><div class='head'>diff --git a/fs/dlm/requestqueue.c b/fs/dlm/requestqueue.c<br/>index e89e0ff8bfa3..719a5243a069 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/requestqueue.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/requestqueue.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/requestqueue.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/requestqueue.c</a></div><div class='hunk'>@@ -14,6 +14,7 @@</div><div class='ctx'> #include "dir.h"</div><div class='ctx'> #include "config.h"</div><div class='ctx'> #include "requestqueue.h"</div><div class='add'>+#include "util.h"</div><div class='ctx'> </div><div class='ctx'> struct rq_entry {</div><div class='ctx'> 	struct list_head list;</div><div class='hunk'>@@ -29,12 +30,14 @@ struct rq_entry {</div><div class='ctx'>  * lockspace is enabled on some while still suspended on others.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-void dlm_add_requestqueue(struct dlm_ls *ls, int nodeid, struct dlm_message *ms)</div><div class='add'>+void dlm_add_requestqueue(struct dlm_ls *ls, int nodeid,</div><div class='add'>+			  const struct dlm_message *ms)</div><div class='ctx'> {</div><div class='ctx'> 	struct rq_entry *e;</div><div class='del'>-	int length = ms-&gt;m_header.h_length - sizeof(struct dlm_message);</div><div class='add'>+	int length = le16_to_cpu(ms-&gt;m_header.h_length) -</div><div class='add'>+		sizeof(struct dlm_message);</div><div class='ctx'> </div><div class='del'>-	e = kmalloc(sizeof(struct rq_entry) + length, GFP_NOFS);</div><div class='add'>+	e = kmalloc(sizeof(struct rq_entry) + length, GFP_ATOMIC);</div><div class='ctx'> 	if (!e) {</div><div class='ctx'> 		log_print("dlm_add_requestqueue: out of memory len %d", length);</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -42,11 +45,10 @@ void dlm_add_requestqueue(struct dlm_ls *ls, int nodeid, struct dlm_message *ms)</div><div class='ctx'> </div><div class='ctx'> 	e-&gt;recover_seq = ls-&gt;ls_recover_seq &amp; 0xFFFFFFFF;</div><div class='ctx'> 	e-&gt;nodeid = nodeid;</div><div class='del'>-	memcpy(&amp;e-&gt;request, ms, ms-&gt;m_header.h_length);</div><div class='add'>+	memcpy(&amp;e-&gt;request, ms, sizeof(*ms));</div><div class='add'>+	memcpy(&amp;e-&gt;request.m_extra, ms-&gt;m_extra, length);</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;ls-&gt;ls_requestqueue_mutex);</div><div class='ctx'> 	list_add_tail(&amp;e-&gt;list, &amp;ls-&gt;ls_requestqueue);</div><div class='del'>-	mutex_unlock(&amp;ls-&gt;ls_requestqueue_mutex);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -66,71 +68,49 @@ int dlm_process_requestqueue(struct dlm_ls *ls)</div><div class='ctx'> 	struct dlm_message *ms;</div><div class='ctx'> 	int error = 0;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;ls-&gt;ls_requestqueue_mutex);</div><div class='del'>-</div><div class='add'>+	write_lock_bh(&amp;ls-&gt;ls_requestqueue_lock);</div><div class='ctx'> 	for (;;) {</div><div class='ctx'> 		if (list_empty(&amp;ls-&gt;ls_requestqueue)) {</div><div class='del'>-			mutex_unlock(&amp;ls-&gt;ls_requestqueue_mutex);</div><div class='add'>+			clear_bit(LSFL_RECV_MSG_BLOCKED, &amp;ls-&gt;ls_flags);</div><div class='ctx'> 			error = 0;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-		e = list_entry(ls-&gt;ls_requestqueue.next, struct rq_entry, list);</div><div class='del'>-		mutex_unlock(&amp;ls-&gt;ls_requestqueue_mutex);</div><div class='add'>+		e = list_first_entry(&amp;ls-&gt;ls_requestqueue, struct rq_entry, list);</div><div class='ctx'> </div><div class='ctx'> 		ms = &amp;e-&gt;request;</div><div class='ctx'> </div><div class='ctx'> 		log_limit(ls, "dlm_process_requestqueue msg %d from %d "</div><div class='ctx'> 			  "lkid %x remid %x result %d seq %u",</div><div class='del'>-			  ms-&gt;m_type, ms-&gt;m_header.h_nodeid,</div><div class='del'>-			  ms-&gt;m_lkid, ms-&gt;m_remid, ms-&gt;m_result,</div><div class='add'>+			  le32_to_cpu(ms-&gt;m_type),</div><div class='add'>+			  le32_to_cpu(ms-&gt;m_header.h_nodeid),</div><div class='add'>+			  le32_to_cpu(ms-&gt;m_lkid), le32_to_cpu(ms-&gt;m_remid),</div><div class='add'>+			  from_dlm_errno(le32_to_cpu(ms-&gt;m_result)),</div><div class='ctx'> 			  e-&gt;recover_seq);</div><div class='ctx'> </div><div class='ctx'> 		dlm_receive_message_saved(ls, &amp;e-&gt;request, e-&gt;recover_seq);</div><div class='del'>-</div><div class='del'>-		mutex_lock(&amp;ls-&gt;ls_requestqueue_mutex);</div><div class='ctx'> 		list_del(&amp;e-&gt;list);</div><div class='ctx'> 		kfree(e);</div><div class='ctx'> </div><div class='ctx'> 		if (dlm_locking_stopped(ls)) {</div><div class='ctx'> 			log_debug(ls, "process_requestqueue abort running");</div><div class='del'>-			mutex_unlock(&amp;ls-&gt;ls_requestqueue_mutex);</div><div class='ctx'> 			error = -EINTR;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='add'>+		write_unlock_bh(&amp;ls-&gt;ls_requestqueue_lock);</div><div class='ctx'> 		schedule();</div><div class='add'>+		write_lock_bh(&amp;ls-&gt;ls_requestqueue_lock);</div><div class='ctx'> 	}</div><div class='add'>+	write_unlock_bh(&amp;ls-&gt;ls_requestqueue_lock);</div><div class='ctx'> </div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * After recovery is done, locking is resumed and dlm_recoverd takes all the</div><div class='del'>- * saved requests and processes them as they would have been by dlm_recv.  At</div><div class='del'>- * the same time, dlm_recv will start receiving new requests from remote nodes.</div><div class='del'>- * We want to delay dlm_recv processing new requests until dlm_recoverd has</div><div class='del'>- * finished processing the old saved requests.  We don't check for locking</div><div class='del'>- * stopped here because dlm_ls_stop won't stop locking until it's suspended us</div><div class='del'>- * (dlm_recv).</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-void dlm_wait_requestqueue(struct dlm_ls *ls)</div><div class='del'>-{</div><div class='del'>-	for (;;) {</div><div class='del'>-		mutex_lock(&amp;ls-&gt;ls_requestqueue_mutex);</div><div class='del'>-		if (list_empty(&amp;ls-&gt;ls_requestqueue))</div><div class='del'>-			break;</div><div class='del'>-		mutex_unlock(&amp;ls-&gt;ls_requestqueue_mutex);</div><div class='del'>-		schedule();</div><div class='del'>-	}</div><div class='del'>-	mutex_unlock(&amp;ls-&gt;ls_requestqueue_mutex);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int purge_request(struct dlm_ls *ls, struct dlm_message *ms, int nodeid)</div><div class='ctx'> {</div><div class='del'>-	uint32_t type = ms-&gt;m_type;</div><div class='add'>+	__le32 type = ms-&gt;m_type;</div><div class='ctx'> </div><div class='ctx'> 	/* the ls is being cleaned up and freed by release_lockspace */</div><div class='del'>-	if (!ls-&gt;ls_count)</div><div class='add'>+	if (!atomic_read(&amp;ls-&gt;ls_count))</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='ctx'> 	if (dlm_is_removed(ls, nodeid))</div><div class='hunk'>@@ -139,9 +119,9 @@ static int purge_request(struct dlm_ls *ls, struct dlm_message *ms, int nodeid)</div><div class='ctx'> 	/* directory operations are always purged because the directory is</div><div class='ctx'> 	   always rebuilt during recovery and the lookups resent */</div><div class='ctx'> </div><div class='del'>-	if (type == DLM_MSG_REMOVE ||</div><div class='del'>-	    type == DLM_MSG_LOOKUP ||</div><div class='del'>-	    type == DLM_MSG_LOOKUP_REPLY)</div><div class='add'>+	if (type == cpu_to_le32(DLM_MSG_REMOVE) ||</div><div class='add'>+	    type == cpu_to_le32(DLM_MSG_LOOKUP) ||</div><div class='add'>+	    type == cpu_to_le32(DLM_MSG_LOOKUP_REPLY))</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='ctx'> 	if (!dlm_no_directory(ls))</div><div class='hunk'>@@ -155,7 +135,7 @@ void dlm_purge_requestqueue(struct dlm_ls *ls)</div><div class='ctx'> 	struct dlm_message *ms;</div><div class='ctx'> 	struct rq_entry *e, *safe;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;ls-&gt;ls_requestqueue_mutex);</div><div class='add'>+	write_lock_bh(&amp;ls-&gt;ls_requestqueue_lock);</div><div class='ctx'> 	list_for_each_entry_safe(e, safe, &amp;ls-&gt;ls_requestqueue, list) {</div><div class='ctx'> 		ms =  &amp;e-&gt;request;</div><div class='ctx'> </div><div class='hunk'>@@ -164,6 +144,6 @@ void dlm_purge_requestqueue(struct dlm_ls *ls)</div><div class='ctx'> 			kfree(e);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	mutex_unlock(&amp;ls-&gt;ls_requestqueue_mutex);</div><div class='add'>+	write_unlock_bh(&amp;ls-&gt;ls_requestqueue_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/dlm/requestqueue.h b/fs/dlm/requestqueue.h<br/>index 4e403469a845..42bfe23ceabe 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/requestqueue.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/requestqueue.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/requestqueue.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/requestqueue.h</a></div><div class='hunk'>@@ -11,7 +11,8 @@</div><div class='ctx'> #ifndef __REQUESTQUEUE_DOT_H__</div><div class='ctx'> #define __REQUESTQUEUE_DOT_H__</div><div class='ctx'> </div><div class='del'>-void dlm_add_requestqueue(struct dlm_ls *ls, int nodeid, struct dlm_message *ms);</div><div class='add'>+void dlm_add_requestqueue(struct dlm_ls *ls, int nodeid,</div><div class='add'>+			  const struct dlm_message *ms);</div><div class='ctx'> int dlm_process_requestqueue(struct dlm_ls *ls);</div><div class='ctx'> void dlm_wait_requestqueue(struct dlm_ls *ls);</div><div class='ctx'> void dlm_purge_requestqueue(struct dlm_ls *ls);</div><div class='head'>diff --git a/fs/dlm/user.c b/fs/dlm/user.c<br/>index e5cefa90b1ce..51daf4acbe31 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/user.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/user.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/user.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/user.c</a></div><div class='hunk'>@@ -16,6 +16,8 @@</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/sched/signal.h&gt;</div><div class='ctx'> </div><div class='add'>+#include &lt;trace/events/dlm.h&gt;</div><div class='add'>+</div><div class='ctx'> #include "dlm_internal.h"</div><div class='ctx'> #include "lockspace.h"</div><div class='ctx'> #include "lock.h"</div><div class='hunk'>@@ -23,6 +25,7 @@</div><div class='ctx'> #include "user.h"</div><div class='ctx'> #include "ast.h"</div><div class='ctx'> #include "config.h"</div><div class='add'>+#include "memory.h"</div><div class='ctx'> </div><div class='ctx'> static const char name_prefix[] = "dlm";</div><div class='ctx'> static const struct file_operations device_fops;</div><div class='hunk'>@@ -108,11 +111,11 @@ static void compat_input(struct dlm_write_request *kb,</div><div class='ctx'> 		kb-&gt;i.lock.parent = kb32-&gt;i.lock.parent;</div><div class='ctx'> 		kb-&gt;i.lock.xid = kb32-&gt;i.lock.xid;</div><div class='ctx'> 		kb-&gt;i.lock.timeout = kb32-&gt;i.lock.timeout;</div><div class='del'>-		kb-&gt;i.lock.castparam = (void *)(long)kb32-&gt;i.lock.castparam;</div><div class='del'>-		kb-&gt;i.lock.castaddr = (void *)(long)kb32-&gt;i.lock.castaddr;</div><div class='del'>-		kb-&gt;i.lock.bastparam = (void *)(long)kb32-&gt;i.lock.bastparam;</div><div class='del'>-		kb-&gt;i.lock.bastaddr = (void *)(long)kb32-&gt;i.lock.bastaddr;</div><div class='del'>-		kb-&gt;i.lock.lksb = (void *)(long)kb32-&gt;i.lock.lksb;</div><div class='add'>+		kb-&gt;i.lock.castparam = (__user void *)(long)kb32-&gt;i.lock.castparam;</div><div class='add'>+		kb-&gt;i.lock.castaddr = (__user void *)(long)kb32-&gt;i.lock.castaddr;</div><div class='add'>+		kb-&gt;i.lock.bastparam = (__user void *)(long)kb32-&gt;i.lock.bastparam;</div><div class='add'>+		kb-&gt;i.lock.bastaddr = (__user void *)(long)kb32-&gt;i.lock.bastaddr;</div><div class='add'>+		kb-&gt;i.lock.lksb = (__user void *)(long)kb32-&gt;i.lock.lksb;</div><div class='ctx'> 		memcpy(kb-&gt;i.lock.lvb, kb32-&gt;i.lock.lvb, DLM_USER_LVB_LEN);</div><div class='ctx'> 		memcpy(kb-&gt;i.lock.name, kb32-&gt;i.lock.name, namelen);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -127,9 +130,9 @@ static void compat_output(struct dlm_lock_result *res,</div><div class='ctx'> 	res32-&gt;version[1] = res-&gt;version[1];</div><div class='ctx'> 	res32-&gt;version[2] = res-&gt;version[2];</div><div class='ctx'> </div><div class='del'>-	res32-&gt;user_astaddr = (__u32)(long)res-&gt;user_astaddr;</div><div class='del'>-	res32-&gt;user_astparam = (__u32)(long)res-&gt;user_astparam;</div><div class='del'>-	res32-&gt;user_lksb = (__u32)(long)res-&gt;user_lksb;</div><div class='add'>+	res32-&gt;user_astaddr = (__u32)(__force long)res-&gt;user_astaddr;</div><div class='add'>+	res32-&gt;user_astparam = (__u32)(__force long)res-&gt;user_astparam;</div><div class='add'>+	res32-&gt;user_lksb = (__u32)(__force long)res-&gt;user_lksb;</div><div class='ctx'> 	res32-&gt;bast_mode = res-&gt;bast_mode;</div><div class='ctx'> </div><div class='ctx'> 	res32-&gt;lvb_offset = res-&gt;lvb_offset;</div><div class='hunk'>@@ -173,18 +176,20 @@ static int lkb_is_endoflife(int mode, int status)</div><div class='ctx'>    being removed and then remove that lkb from the orphans list and free it */</div><div class='ctx'> </div><div class='ctx'> void dlm_user_add_ast(struct dlm_lkb *lkb, uint32_t flags, int mode,</div><div class='del'>-		      int status, uint32_t sbflags, uint64_t seq)</div><div class='add'>+		      int status, uint32_t sbflags)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_ls *ls;</div><div class='ctx'> 	struct dlm_user_args *ua;</div><div class='ctx'> 	struct dlm_user_proc *proc;</div><div class='del'>-	int rv;</div><div class='add'>+	struct dlm_callback *cb;</div><div class='add'>+	int rv, copy_lvb;</div><div class='ctx'> </div><div class='del'>-	if (lkb-&gt;lkb_flags &amp; (DLM_IFL_ORPHAN | DLM_IFL_DEAD))</div><div class='add'>+	if (test_bit(DLM_DFL_ORPHAN_BIT, &amp;lkb-&gt;lkb_dflags) ||</div><div class='add'>+	    test_bit(DLM_IFL_DEAD_BIT, &amp;lkb-&gt;lkb_iflags))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	ls = lkb-&gt;lkb_resource-&gt;res_ls;</div><div class='del'>-	mutex_lock(&amp;ls-&gt;ls_clear_proc_locks);</div><div class='add'>+	spin_lock_bh(&amp;ls-&gt;ls_clear_proc_locks);</div><div class='ctx'> </div><div class='ctx'> 	/* If ORPHAN/DEAD flag is set, it means the process is dead so an ast</div><div class='ctx'> 	   can't be delivered.  For ORPHAN's, dlm_clear_proc_locks() freed</div><div class='hunk'>@@ -192,7 +197,8 @@ void dlm_user_add_ast(struct dlm_lkb *lkb, uint32_t flags, int mode,</div><div class='ctx'> 	   for cases where a completion ast is received for an operation that</div><div class='ctx'> 	   began before clear_proc_locks did its cancel/unlock. */</div><div class='ctx'> </div><div class='del'>-	if (lkb-&gt;lkb_flags &amp; (DLM_IFL_ORPHAN | DLM_IFL_DEAD))</div><div class='add'>+	if (test_bit(DLM_DFL_ORPHAN_BIT, &amp;lkb-&gt;lkb_dflags) ||</div><div class='add'>+	    test_bit(DLM_IFL_DEAD_BIT, &amp;lkb-&gt;lkb_iflags))</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	DLM_ASSERT(lkb-&gt;lkb_ua, dlm_print_lkb(lkb););</div><div class='hunk'>@@ -203,34 +209,40 @@ void dlm_user_add_ast(struct dlm_lkb *lkb, uint32_t flags, int mode,</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	if ((flags &amp; DLM_CB_CAST) &amp;&amp; lkb_is_endoflife(mode, status))</div><div class='del'>-		lkb-&gt;lkb_flags |= DLM_IFL_ENDOFLIFE;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;proc-&gt;asts_spin);</div><div class='del'>-</div><div class='del'>-	rv = dlm_add_lkb_callback(lkb, flags, mode, status, sbflags, seq);</div><div class='del'>-	if (rv &lt; 0) {</div><div class='del'>-		spin_unlock(&amp;proc-&gt;asts_spin);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (list_empty(&amp;lkb-&gt;lkb_cb_list)) {</div><div class='del'>-		kref_get(&amp;lkb-&gt;lkb_ref);</div><div class='del'>-		list_add_tail(&amp;lkb-&gt;lkb_cb_list, &amp;proc-&gt;asts);</div><div class='del'>-		wake_up_interruptible(&amp;proc-&gt;wait);</div><div class='add'>+		set_bit(DLM_IFL_ENDOFLIFE_BIT, &amp;lkb-&gt;lkb_iflags);</div><div class='add'>+</div><div class='add'>+	spin_lock_bh(&amp;proc-&gt;asts_spin);</div><div class='add'>+</div><div class='add'>+	if (!dlm_may_skip_callback(lkb, flags, mode, status, sbflags,</div><div class='add'>+				   &amp;copy_lvb)) {</div><div class='add'>+		rv = dlm_get_cb(lkb, flags, mode, status, sbflags, &amp;cb);</div><div class='add'>+		if (!rv) {</div><div class='add'>+			cb-&gt;copy_lvb = copy_lvb;</div><div class='add'>+			cb-&gt;ua = *ua;</div><div class='add'>+			cb-&gt;lkb_lksb = &amp;cb-&gt;ua.lksb;</div><div class='add'>+			if (copy_lvb) {</div><div class='add'>+				memcpy(cb-&gt;lvbptr, ua-&gt;lksb.sb_lvbptr,</div><div class='add'>+				       DLM_USER_LVB_LEN);</div><div class='add'>+				cb-&gt;lkb_lksb-&gt;sb_lvbptr = cb-&gt;lvbptr;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			list_add_tail(&amp;cb-&gt;list, &amp;proc-&gt;asts);</div><div class='add'>+			wake_up_interruptible(&amp;proc-&gt;wait);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;proc-&gt;asts_spin);</div><div class='add'>+	spin_unlock_bh(&amp;proc-&gt;asts_spin);</div><div class='ctx'> </div><div class='del'>-	if (lkb-&gt;lkb_flags &amp; DLM_IFL_ENDOFLIFE) {</div><div class='add'>+	if (test_bit(DLM_IFL_ENDOFLIFE_BIT, &amp;lkb-&gt;lkb_iflags)) {</div><div class='ctx'> 		/* N.B. spin_lock locks_spin, not asts_spin */</div><div class='del'>-		spin_lock(&amp;proc-&gt;locks_spin);</div><div class='add'>+		spin_lock_bh(&amp;proc-&gt;locks_spin);</div><div class='ctx'> 		if (!list_empty(&amp;lkb-&gt;lkb_ownqueue)) {</div><div class='ctx'> 			list_del_init(&amp;lkb-&gt;lkb_ownqueue);</div><div class='ctx'> 			dlm_put_lkb(lkb);</div><div class='ctx'> 		}</div><div class='del'>-		spin_unlock(&amp;proc-&gt;locks_spin);</div><div class='add'>+		spin_unlock_bh(&amp;proc-&gt;locks_spin);</div><div class='ctx'> 	}</div><div class='ctx'>  out:</div><div class='del'>-	mutex_unlock(&amp;ls-&gt;ls_clear_proc_locks);</div><div class='add'>+	spin_unlock_bh(&amp;ls-&gt;ls_clear_proc_locks);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int device_user_lock(struct dlm_user_proc *proc,</div><div class='hunk'>@@ -263,22 +275,19 @@ static int device_user_lock(struct dlm_user_proc *proc,</div><div class='ctx'> </div><div class='ctx'> 	if (params-&gt;flags &amp; DLM_LKF_CONVERT) {</div><div class='ctx'> 		error = dlm_user_convert(ls, ua,</div><div class='del'>-				         params-&gt;mode, params-&gt;flags,</div><div class='del'>-				         params-&gt;lkid, params-&gt;lvb,</div><div class='del'>-					 (unsigned long) params-&gt;timeout);</div><div class='add'>+					 params-&gt;mode, params-&gt;flags,</div><div class='add'>+					 params-&gt;lkid, params-&gt;lvb);</div><div class='ctx'> 	} else if (params-&gt;flags &amp; DLM_LKF_ORPHAN) {</div><div class='ctx'> 		error = dlm_user_adopt_orphan(ls, ua,</div><div class='ctx'> 					 params-&gt;mode, params-&gt;flags,</div><div class='ctx'> 					 params-&gt;name, params-&gt;namelen,</div><div class='del'>-					 (unsigned long) params-&gt;timeout,</div><div class='ctx'> 					 &amp;lkid);</div><div class='ctx'> 		if (!error)</div><div class='ctx'> 			error = lkid;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		error = dlm_user_request(ls, ua,</div><div class='ctx'> 					 params-&gt;mode, params-&gt;flags,</div><div class='del'>-					 params-&gt;name, params-&gt;namelen,</div><div class='del'>-					 (unsigned long) params-&gt;timeout);</div><div class='add'>+					 params-&gt;name, params-&gt;namelen);</div><div class='ctx'> 		if (!error)</div><div class='ctx'> 			error = ua-&gt;lksb.sb_lkid;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -402,9 +411,9 @@ static int device_create_lockspace(struct dlm_lspace_params *params)</div><div class='ctx'> 	if (!capable(CAP_SYS_ADMIN))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='del'>-	error = dlm_new_lockspace(params-&gt;name, dlm_config.ci_cluster_name, params-&gt;flags,</div><div class='del'>-				  DLM_USER_LVB_LEN, NULL, NULL, NULL,</div><div class='del'>-				  &amp;lockspace);</div><div class='add'>+	error = dlm_new_user_lockspace(params-&gt;name, dlm_config.ci_cluster_name,</div><div class='add'>+				       params-&gt;flags, DLM_USER_LVB_LEN, NULL,</div><div class='add'>+				       NULL, NULL, &amp;lockspace);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='hunk'>@@ -416,7 +425,7 @@ static int device_create_lockspace(struct dlm_lspace_params *params)</div><div class='ctx'> 	dlm_put_lockspace(ls);</div><div class='ctx'> </div><div class='ctx'> 	if (error)</div><div class='del'>-		dlm_release_lockspace(lockspace, 0);</div><div class='add'>+		dlm_release_lockspace(lockspace, DLM_RELEASE_NO_LOCKS);</div><div class='ctx'> 	else</div><div class='ctx'> 		error = ls-&gt;ls_device.minor;</div><div class='ctx'> </div><div class='hunk'>@@ -427,7 +436,7 @@ static int device_remove_lockspace(struct dlm_lspace_params *params)</div><div class='ctx'> {</div><div class='ctx'> 	dlm_lockspace_t *lockspace;</div><div class='ctx'> 	struct dlm_ls *ls;</div><div class='del'>-	int error, force = 0;</div><div class='add'>+	int error, force = DLM_RELEASE_NO_LOCKS;</div><div class='ctx'> </div><div class='ctx'> 	if (!capable(CAP_SYS_ADMIN))</div><div class='ctx'> 		return -EPERM;</div><div class='hunk'>@@ -437,9 +446,9 @@ static int device_remove_lockspace(struct dlm_lspace_params *params)</div><div class='ctx'> 		return -ENOENT;</div><div class='ctx'> </div><div class='ctx'> 	if (params-&gt;flags &amp; DLM_USER_LSFLG_FORCEFREE)</div><div class='del'>-		force = 2;</div><div class='add'>+		force = DLM_RELEASE_NORMAL;</div><div class='ctx'> </div><div class='del'>-	lockspace = ls-&gt;ls_local_handle;</div><div class='add'>+	lockspace = ls;</div><div class='ctx'> 	dlm_put_lockspace(ls);</div><div class='ctx'> </div><div class='ctx'> 	/* The final dlm_release_lockspace waits for references to go to</div><div class='hunk'>@@ -642,7 +651,7 @@ static int device_open(struct inode *inode, struct file *file)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	proc-&gt;lockspace = ls-&gt;ls_local_handle;</div><div class='add'>+	proc-&gt;lockspace = ls;</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;proc-&gt;asts);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;proc-&gt;locks);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;proc-&gt;unlocking);</div><div class='hunk'>@@ -777,11 +786,9 @@ static ssize_t device_read(struct file *file, char __user *buf, size_t count,</div><div class='ctx'> 			   loff_t *ppos)</div><div class='ctx'> {</div><div class='ctx'> 	struct dlm_user_proc *proc = file-&gt;private_data;</div><div class='del'>-	struct dlm_lkb *lkb;</div><div class='ctx'> 	DECLARE_WAITQUEUE(wait, current);</div><div class='del'>-	struct dlm_callback cb;</div><div class='del'>-	int rv, resid, copy_lvb = 0;</div><div class='del'>-	int old_mode, new_mode;</div><div class='add'>+	struct dlm_callback *cb;</div><div class='add'>+	int rv, ret;</div><div class='ctx'> </div><div class='ctx'> 	if (count == sizeof(struct dlm_device_version)) {</div><div class='ctx'> 		rv = copy_version_to_user(buf, count);</div><div class='hunk'>@@ -800,16 +807,14 @@ static ssize_t device_read(struct file *file, char __user *buf, size_t count,</div><div class='ctx'> #endif</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>- try_another:</div><div class='del'>-</div><div class='ctx'> 	/* do we really need this? can a read happen after a close? */</div><div class='ctx'> 	if (test_bit(DLM_PROC_FLAGS_CLOSING, &amp;proc-&gt;flags))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;proc-&gt;asts_spin);</div><div class='add'>+	spin_lock_bh(&amp;proc-&gt;asts_spin);</div><div class='ctx'> 	if (list_empty(&amp;proc-&gt;asts)) {</div><div class='ctx'> 		if (file-&gt;f_flags &amp; O_NONBLOCK) {</div><div class='del'>-			spin_unlock(&amp;proc-&gt;asts_spin);</div><div class='add'>+			spin_unlock_bh(&amp;proc-&gt;asts_spin);</div><div class='ctx'> 			return -EAGAIN;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -818,16 +823,16 @@ static ssize_t device_read(struct file *file, char __user *buf, size_t count,</div><div class='ctx'> 	repeat:</div><div class='ctx'> 		set_current_state(TASK_INTERRUPTIBLE);</div><div class='ctx'> 		if (list_empty(&amp;proc-&gt;asts) &amp;&amp; !signal_pending(current)) {</div><div class='del'>-			spin_unlock(&amp;proc-&gt;asts_spin);</div><div class='add'>+			spin_unlock_bh(&amp;proc-&gt;asts_spin);</div><div class='ctx'> 			schedule();</div><div class='del'>-			spin_lock(&amp;proc-&gt;asts_spin);</div><div class='add'>+			spin_lock_bh(&amp;proc-&gt;asts_spin);</div><div class='ctx'> 			goto repeat;</div><div class='ctx'> 		}</div><div class='ctx'> 		set_current_state(TASK_RUNNING);</div><div class='ctx'> 		remove_wait_queue(&amp;proc-&gt;wait, &amp;wait);</div><div class='ctx'> </div><div class='ctx'> 		if (signal_pending(current)) {</div><div class='del'>-			spin_unlock(&amp;proc-&gt;asts_spin);</div><div class='add'>+			spin_unlock_bh(&amp;proc-&gt;asts_spin);</div><div class='ctx'> 			return -ERESTARTSYS;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -836,53 +841,25 @@ static ssize_t device_read(struct file *file, char __user *buf, size_t count,</div><div class='ctx'> 	   without removing lkb_cb_list; so empty lkb_cb_list is always</div><div class='ctx'> 	   consistent with empty lkb_callbacks */</div><div class='ctx'> </div><div class='del'>-	lkb = list_entry(proc-&gt;asts.next, struct dlm_lkb, lkb_cb_list);</div><div class='del'>-</div><div class='del'>-	/* rem_lkb_callback sets a new lkb_last_cast */</div><div class='del'>-	old_mode = lkb-&gt;lkb_last_cast.mode;</div><div class='del'>-</div><div class='del'>-	rv = dlm_rem_lkb_callback(lkb-&gt;lkb_resource-&gt;res_ls, lkb, &amp;cb, &amp;resid);</div><div class='del'>-	if (rv &lt; 0) {</div><div class='del'>-		/* this shouldn't happen; lkb should have been removed from</div><div class='del'>-		   list when resid was zero */</div><div class='del'>-		log_print("dlm_rem_lkb_callback empty %x", lkb-&gt;lkb_id);</div><div class='del'>-		list_del_init(&amp;lkb-&gt;lkb_cb_list);</div><div class='del'>-		spin_unlock(&amp;proc-&gt;asts_spin);</div><div class='del'>-		/* removes ref for proc-&gt;asts, may cause lkb to be freed */</div><div class='del'>-		dlm_put_lkb(lkb);</div><div class='del'>-		goto try_another;</div><div class='add'>+	cb = list_first_entry(&amp;proc-&gt;asts, struct dlm_callback, list);</div><div class='add'>+	list_del(&amp;cb-&gt;list);</div><div class='add'>+	spin_unlock_bh(&amp;proc-&gt;asts_spin);</div><div class='add'>+</div><div class='add'>+	if (cb-&gt;flags &amp; DLM_CB_BAST) {</div><div class='add'>+		trace_dlm_bast(cb-&gt;ls_id, cb-&gt;lkb_id, cb-&gt;mode, cb-&gt;res_name,</div><div class='add'>+			       cb-&gt;res_length);</div><div class='add'>+	} else if (cb-&gt;flags &amp; DLM_CB_CAST) {</div><div class='add'>+		cb-&gt;lkb_lksb-&gt;sb_status = cb-&gt;sb_status;</div><div class='add'>+		cb-&gt;lkb_lksb-&gt;sb_flags = cb-&gt;sb_flags;</div><div class='add'>+		trace_dlm_ast(cb-&gt;ls_id, cb-&gt;lkb_id, cb-&gt;sb_status,</div><div class='add'>+			      cb-&gt;sb_flags, cb-&gt;res_name, cb-&gt;res_length);</div><div class='ctx'> 	}</div><div class='del'>-	if (!resid)</div><div class='del'>-		list_del_init(&amp;lkb-&gt;lkb_cb_list);</div><div class='del'>-	spin_unlock(&amp;proc-&gt;asts_spin);</div><div class='del'>-</div><div class='del'>-	if (cb.flags &amp; DLM_CB_SKIP) {</div><div class='del'>-		/* removes ref for proc-&gt;asts, may cause lkb to be freed */</div><div class='del'>-		if (!resid)</div><div class='del'>-			dlm_put_lkb(lkb);</div><div class='del'>-		goto try_another;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (cb.flags &amp; DLM_CB_CAST) {</div><div class='del'>-		new_mode = cb.mode;</div><div class='del'>-</div><div class='del'>-		if (!cb.sb_status &amp;&amp; lkb-&gt;lkb_lksb-&gt;sb_lvbptr &amp;&amp;</div><div class='del'>-		    dlm_lvb_operations[old_mode + 1][new_mode + 1])</div><div class='del'>-			copy_lvb = 1;</div><div class='del'>-</div><div class='del'>-		lkb-&gt;lkb_lksb-&gt;sb_status = cb.sb_status;</div><div class='del'>-		lkb-&gt;lkb_lksb-&gt;sb_flags = cb.sb_flags;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rv = copy_result_to_user(lkb-&gt;lkb_ua,</div><div class='del'>-				 test_bit(DLM_PROC_FLAGS_COMPAT, &amp;proc-&gt;flags),</div><div class='del'>-				 cb.flags, cb.mode, copy_lvb, buf, count);</div><div class='del'>-</div><div class='del'>-	/* removes ref for proc-&gt;asts, may cause lkb to be freed */</div><div class='del'>-	if (!resid)</div><div class='del'>-		dlm_put_lkb(lkb);</div><div class='ctx'> </div><div class='del'>-	return rv;</div><div class='add'>+	ret = copy_result_to_user(&amp;cb-&gt;ua,</div><div class='add'>+				  test_bit(DLM_PROC_FLAGS_COMPAT, &amp;proc-&gt;flags),</div><div class='add'>+				  cb-&gt;flags, cb-&gt;mode, cb-&gt;copy_lvb, buf, count);</div><div class='add'>+	dlm_free_cb(cb);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __poll_t device_poll(struct file *file, poll_table *wait)</div><div class='hunk'>@@ -891,12 +868,12 @@ static __poll_t device_poll(struct file *file, poll_table *wait)</div><div class='ctx'> </div><div class='ctx'> 	poll_wait(file, &amp;proc-&gt;wait, wait);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;proc-&gt;asts_spin);</div><div class='add'>+	spin_lock_bh(&amp;proc-&gt;asts_spin);</div><div class='ctx'> 	if (!list_empty(&amp;proc-&gt;asts)) {</div><div class='del'>-		spin_unlock(&amp;proc-&gt;asts_spin);</div><div class='add'>+		spin_unlock_bh(&amp;proc-&gt;asts_spin);</div><div class='ctx'> 		return EPOLLIN | EPOLLRDNORM;</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;proc-&gt;asts_spin);</div><div class='add'>+	spin_unlock_bh(&amp;proc-&gt;asts_spin);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/dlm/user.h b/fs/dlm/user.h<br/>index 6b9bce6b96e0..2caf8e6e24d5 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/user.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/user.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/user.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/user.h</a></div><div class='hunk'>@@ -6,8 +6,9 @@</div><div class='ctx'> #ifndef __USER_DOT_H__</div><div class='ctx'> #define __USER_DOT_H__</div><div class='ctx'> </div><div class='add'>+void dlm_purge_lkb_callbacks(struct dlm_lkb *lkb);</div><div class='ctx'> void dlm_user_add_ast(struct dlm_lkb *lkb, uint32_t flags, int mode,</div><div class='del'>-                      int status, uint32_t sbflags, uint64_t seq);</div><div class='add'>+		      int status, uint32_t sbflags);</div><div class='ctx'> int dlm_user_init(void);</div><div class='ctx'> void dlm_user_exit(void);</div><div class='ctx'> int dlm_device_deregister(struct dlm_ls *ls);</div><div class='head'>diff --git a/fs/dlm/util.c b/fs/dlm/util.c<br/>index 58acbcc2081a..f2bc401f312f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/util.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/util.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/util.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/util.c</a></div><div class='hunk'>@@ -20,28 +20,10 @@</div><div class='ctx'> #define DLM_ERRNO_ETIMEDOUT	       110</div><div class='ctx'> #define DLM_ERRNO_EINPROGRESS	       115</div><div class='ctx'> </div><div class='del'>-void header_out(struct dlm_header *hd)</div><div class='del'>-{</div><div class='del'>-	hd-&gt;h_version		= cpu_to_le32(hd-&gt;h_version);</div><div class='del'>-	/* does it for others u32 in union as well */</div><div class='del'>-	hd-&gt;u.h_lockspace	= cpu_to_le32(hd-&gt;u.h_lockspace);</div><div class='del'>-	hd-&gt;h_nodeid		= cpu_to_le32(hd-&gt;h_nodeid);</div><div class='del'>-	hd-&gt;h_length		= cpu_to_le16(hd-&gt;h_length);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void header_in(struct dlm_header *hd)</div><div class='del'>-{</div><div class='del'>-	hd-&gt;h_version		= le32_to_cpu(hd-&gt;h_version);</div><div class='del'>-	/* does it for others u32 in union as well */</div><div class='del'>-	hd-&gt;u.h_lockspace	= le32_to_cpu(hd-&gt;u.h_lockspace);</div><div class='del'>-	hd-&gt;h_nodeid		= le32_to_cpu(hd-&gt;h_nodeid);</div><div class='del'>-	hd-&gt;h_length		= le16_to_cpu(hd-&gt;h_length);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /* higher errno values are inconsistent across architectures, so select</div><div class='ctx'>    one set of values for on the wire */</div><div class='ctx'> </div><div class='del'>-static int to_dlm_errno(int err)</div><div class='add'>+int to_dlm_errno(int err)</div><div class='ctx'> {</div><div class='ctx'> 	switch (err) {</div><div class='ctx'> 	case -EDEADLK:</div><div class='hunk'>@@ -62,7 +44,7 @@ static int to_dlm_errno(int err)</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int from_dlm_errno(int err)</div><div class='add'>+int from_dlm_errno(int err)</div><div class='ctx'> {</div><div class='ctx'> 	switch (err) {</div><div class='ctx'> 	case -DLM_ERRNO_EDEADLK:</div><div class='hunk'>@@ -82,73 +64,3 @@ static int from_dlm_errno(int err)</div><div class='ctx'> 	}</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='del'>-</div><div class='del'>-void dlm_message_out(struct dlm_message *ms)</div><div class='del'>-{</div><div class='del'>-	header_out(&amp;ms-&gt;m_header);</div><div class='del'>-</div><div class='del'>-	ms-&gt;m_type		= cpu_to_le32(ms-&gt;m_type);</div><div class='del'>-	ms-&gt;m_nodeid		= cpu_to_le32(ms-&gt;m_nodeid);</div><div class='del'>-	ms-&gt;m_pid		= cpu_to_le32(ms-&gt;m_pid);</div><div class='del'>-	ms-&gt;m_lkid		= cpu_to_le32(ms-&gt;m_lkid);</div><div class='del'>-	ms-&gt;m_remid		= cpu_to_le32(ms-&gt;m_remid);</div><div class='del'>-	ms-&gt;m_parent_lkid	= cpu_to_le32(ms-&gt;m_parent_lkid);</div><div class='del'>-	ms-&gt;m_parent_remid	= cpu_to_le32(ms-&gt;m_parent_remid);</div><div class='del'>-	ms-&gt;m_exflags		= cpu_to_le32(ms-&gt;m_exflags);</div><div class='del'>-	ms-&gt;m_sbflags		= cpu_to_le32(ms-&gt;m_sbflags);</div><div class='del'>-	ms-&gt;m_flags		= cpu_to_le32(ms-&gt;m_flags);</div><div class='del'>-	ms-&gt;m_lvbseq		= cpu_to_le32(ms-&gt;m_lvbseq);</div><div class='del'>-	ms-&gt;m_hash		= cpu_to_le32(ms-&gt;m_hash);</div><div class='del'>-	ms-&gt;m_status		= cpu_to_le32(ms-&gt;m_status);</div><div class='del'>-	ms-&gt;m_grmode		= cpu_to_le32(ms-&gt;m_grmode);</div><div class='del'>-	ms-&gt;m_rqmode		= cpu_to_le32(ms-&gt;m_rqmode);</div><div class='del'>-	ms-&gt;m_bastmode		= cpu_to_le32(ms-&gt;m_bastmode);</div><div class='del'>-	ms-&gt;m_asts		= cpu_to_le32(ms-&gt;m_asts);</div><div class='del'>-	ms-&gt;m_result		= cpu_to_le32(to_dlm_errno(ms-&gt;m_result));</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void dlm_message_in(struct dlm_message *ms)</div><div class='del'>-{</div><div class='del'>-	header_in(&amp;ms-&gt;m_header);</div><div class='del'>-</div><div class='del'>-	ms-&gt;m_type		= le32_to_cpu(ms-&gt;m_type);</div><div class='del'>-	ms-&gt;m_nodeid		= le32_to_cpu(ms-&gt;m_nodeid);</div><div class='del'>-	ms-&gt;m_pid		= le32_to_cpu(ms-&gt;m_pid);</div><div class='del'>-	ms-&gt;m_lkid		= le32_to_cpu(ms-&gt;m_lkid);</div><div class='del'>-	ms-&gt;m_remid		= le32_to_cpu(ms-&gt;m_remid);</div><div class='del'>-	ms-&gt;m_parent_lkid	= le32_to_cpu(ms-&gt;m_parent_lkid);</div><div class='del'>-	ms-&gt;m_parent_remid	= le32_to_cpu(ms-&gt;m_parent_remid);</div><div class='del'>-	ms-&gt;m_exflags		= le32_to_cpu(ms-&gt;m_exflags);</div><div class='del'>-	ms-&gt;m_sbflags		= le32_to_cpu(ms-&gt;m_sbflags);</div><div class='del'>-	ms-&gt;m_flags		= le32_to_cpu(ms-&gt;m_flags);</div><div class='del'>-	ms-&gt;m_lvbseq		= le32_to_cpu(ms-&gt;m_lvbseq);</div><div class='del'>-	ms-&gt;m_hash		= le32_to_cpu(ms-&gt;m_hash);</div><div class='del'>-	ms-&gt;m_status		= le32_to_cpu(ms-&gt;m_status);</div><div class='del'>-	ms-&gt;m_grmode		= le32_to_cpu(ms-&gt;m_grmode);</div><div class='del'>-	ms-&gt;m_rqmode		= le32_to_cpu(ms-&gt;m_rqmode);</div><div class='del'>-	ms-&gt;m_bastmode		= le32_to_cpu(ms-&gt;m_bastmode);</div><div class='del'>-	ms-&gt;m_asts		= le32_to_cpu(ms-&gt;m_asts);</div><div class='del'>-	ms-&gt;m_result		= from_dlm_errno(le32_to_cpu(ms-&gt;m_result));</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void dlm_rcom_out(struct dlm_rcom *rc)</div><div class='del'>-{</div><div class='del'>-	header_out(&amp;rc-&gt;rc_header);</div><div class='del'>-</div><div class='del'>-	rc-&gt;rc_type		= cpu_to_le32(rc-&gt;rc_type);</div><div class='del'>-	rc-&gt;rc_result		= cpu_to_le32(rc-&gt;rc_result);</div><div class='del'>-	rc-&gt;rc_id		= cpu_to_le64(rc-&gt;rc_id);</div><div class='del'>-	rc-&gt;rc_seq		= cpu_to_le64(rc-&gt;rc_seq);</div><div class='del'>-	rc-&gt;rc_seq_reply	= cpu_to_le64(rc-&gt;rc_seq_reply);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void dlm_rcom_in(struct dlm_rcom *rc)</div><div class='del'>-{</div><div class='del'>-	header_in(&amp;rc-&gt;rc_header);</div><div class='del'>-</div><div class='del'>-	rc-&gt;rc_type		= le32_to_cpu(rc-&gt;rc_type);</div><div class='del'>-	rc-&gt;rc_result		= le32_to_cpu(rc-&gt;rc_result);</div><div class='del'>-	rc-&gt;rc_id		= le64_to_cpu(rc-&gt;rc_id);</div><div class='del'>-	rc-&gt;rc_seq		= le64_to_cpu(rc-&gt;rc_seq);</div><div class='del'>-	rc-&gt;rc_seq_reply	= le64_to_cpu(rc-&gt;rc_seq_reply);</div><div class='del'>-}</div><div class='head'>diff --git a/fs/dlm/util.h b/fs/dlm/util.h<br/>index d46f23c7a6a0..b6a4b8adca8d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/dlm/util.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/dlm/util.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/dlm/util.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/dlm/util.h</a></div><div class='hunk'>@@ -11,12 +11,8 @@</div><div class='ctx'> #ifndef __UTIL_DOT_H__</div><div class='ctx'> #define __UTIL_DOT_H__</div><div class='ctx'> </div><div class='del'>-void dlm_message_out(struct dlm_message *ms);</div><div class='del'>-void dlm_message_in(struct dlm_message *ms);</div><div class='del'>-void dlm_rcom_out(struct dlm_rcom *rc);</div><div class='del'>-void dlm_rcom_in(struct dlm_rcom *rc);</div><div class='del'>-void header_out(struct dlm_header *hd);</div><div class='del'>-void header_in(struct dlm_header *hd);</div><div class='add'>+int to_dlm_errno(int err);</div><div class='add'>+int from_dlm_errno(int err);</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='head'>diff --git a/fs/drop_caches.c b/fs/drop_caches.c<br/>index e619c31b6bd9..49f56a598ecb 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/drop_caches.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/drop_caches.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/drop_caches.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/drop_caches.c</a></div><div class='hunk'>@@ -10,10 +10,11 @@</div><div class='ctx'> #include &lt;linux/writeback.h&gt;</div><div class='ctx'> #include &lt;linux/sysctl.h&gt;</div><div class='ctx'> #include &lt;linux/gfp.h&gt;</div><div class='add'>+#include &lt;linux/swap.h&gt;</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> </div><div class='ctx'> /* A global variable is a bit ugly, but it keeps the code simple */</div><div class='del'>-int sysctl_drop_caches;</div><div class='add'>+static int sysctl_drop_caches;</div><div class='ctx'> </div><div class='ctx'> static void drop_pagecache_sb(struct super_block *sb, void *unused)</div><div class='ctx'> {</div><div class='hunk'>@@ -27,7 +28,7 @@ static void drop_pagecache_sb(struct super_block *sb, void *unused)</div><div class='ctx'> 		 * inodes without pages but we deliberately won't in case</div><div class='ctx'> 		 * we need to reschedule to avoid softlockups.</div><div class='ctx'> 		 */</div><div class='del'>-		if ((inode-&gt;i_state &amp; (I_FREEING|I_WILL_FREE|I_NEW)) ||</div><div class='add'>+		if ((inode_state_read(inode) &amp; (I_FREEING | I_WILL_FREE | I_NEW)) ||</div><div class='ctx'> 		    (mapping_empty(inode-&gt;i_mapping) &amp;&amp; !need_resched())) {</div><div class='ctx'> 			spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 			continue;</div><div class='hunk'>@@ -47,7 +48,7 @@ static void drop_pagecache_sb(struct super_block *sb, void *unused)</div><div class='ctx'> 	iput(toput_inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int drop_caches_sysctl_handler(struct ctl_table *table, int write,</div><div class='add'>+static int drop_caches_sysctl_handler(const struct ctl_table *table, int write,</div><div class='ctx'> 		void *buffer, size_t *length, loff_t *ppos)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -59,6 +60,7 @@ int drop_caches_sysctl_handler(struct ctl_table *table, int write,</div><div class='ctx'> 		static int stfu;</div><div class='ctx'> </div><div class='ctx'> 		if (sysctl_drop_caches &amp; 1) {</div><div class='add'>+			lru_add_drain_all();</div><div class='ctx'> 			iterate_supers(drop_pagecache_sb, NULL);</div><div class='ctx'> 			count_vm_event(DROP_PAGECACHE);</div><div class='ctx'> 		}</div><div class='hunk'>@@ -75,3 +77,22 @@ int drop_caches_sysctl_handler(struct ctl_table *table, int write,</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+static const struct ctl_table drop_caches_table[] = {</div><div class='add'>+	{</div><div class='add'>+		.procname	= "drop_caches",</div><div class='add'>+		.data		= &amp;sysctl_drop_caches,</div><div class='add'>+		.maxlen		= sizeof(int),</div><div class='add'>+		.mode		= 0200,</div><div class='add'>+		.proc_handler	= drop_caches_sysctl_handler,</div><div class='add'>+		.extra1		= SYSCTL_ONE,</div><div class='add'>+		.extra2		= SYSCTL_FOUR,</div><div class='add'>+	},</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int __init init_vm_drop_caches_sysctls(void)</div><div class='add'>+{</div><div class='add'>+	register_sysctl_init("vm", drop_caches_table);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+fs_initcall(init_vm_drop_caches_sysctls);</div><div class='head'>diff --git a/fs/ecryptfs/Kconfig b/fs/ecryptfs/Kconfig<br/>index 1bdeaa6d5790..c2f4fb41b4e6 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ecryptfs/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ecryptfs/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ecryptfs/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ecryptfs/Kconfig</a></div><div class='hunk'>@@ -4,7 +4,7 @@ config ECRYPT_FS</div><div class='ctx'> 	depends on KEYS &amp;&amp; CRYPTO &amp;&amp; (ENCRYPTED_KEYS || ENCRYPTED_KEYS=n)</div><div class='ctx'> 	select CRYPTO_ECB</div><div class='ctx'> 	select CRYPTO_CBC</div><div class='del'>-	select CRYPTO_MD5</div><div class='add'>+	select CRYPTO_LIB_MD5</div><div class='ctx'> 	help</div><div class='ctx'> 	  Encrypted filesystem that operates on the VFS layer.  See</div><div class='ctx'> 	  &lt;file:Documentation/filesystems/ecryptfs.rst&gt; to learn more about</div><div class='head'>diff --git a/fs/ecryptfs/crypto.c b/fs/ecryptfs/crypto.c<br/>index e3f5d7f3c8a0..260f8a4938b0 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ecryptfs/crypto.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ecryptfs/crypto.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ecryptfs/crypto.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ecryptfs/crypto.c</a></div><div class='hunk'>@@ -9,7 +9,6 @@</div><div class='ctx'>  *   		Michael C. Thompson &lt;mcthomps@us.ibm.com&gt;</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-#include &lt;crypto/hash.h&gt;</div><div class='ctx'> #include &lt;crypto/skcipher.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/mount.h&gt;</div><div class='hunk'>@@ -21,7 +20,7 @@</div><div class='ctx'> #include &lt;linux/file.h&gt;</div><div class='ctx'> #include &lt;linux/scatterlist.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='del'>-#include &lt;asm/unaligned.h&gt;</div><div class='add'>+#include &lt;linux/unaligned.h&gt;</div><div class='ctx'> #include &lt;linux/kernel.h&gt;</div><div class='ctx'> #include &lt;linux/xattr.h&gt;</div><div class='ctx'> #include "ecryptfs_kernel.h"</div><div class='hunk'>@@ -48,32 +47,6 @@ void ecryptfs_from_hex(char *dst, char *src, int dst_size)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * ecryptfs_calculate_md5 - calculates the md5 of @src</div><div class='del'>- * @dst: Pointer to 16 bytes of allocated memory</div><div class='del'>- * @crypt_stat: Pointer to crypt_stat struct for the current inode</div><div class='del'>- * @src: Data to be md5'd</div><div class='del'>- * @len: Length of @src</div><div class='del'>- *</div><div class='del'>- * Uses the allocated crypto context that crypt_stat references to</div><div class='del'>- * generate the MD5 sum of the contents of src.</div><div class='del'>- */</div><div class='del'>-static int ecryptfs_calculate_md5(char *dst,</div><div class='del'>-				  struct ecryptfs_crypt_stat *crypt_stat,</div><div class='del'>-				  char *src, int len)</div><div class='del'>-{</div><div class='del'>-	int rc = crypto_shash_tfm_digest(crypt_stat-&gt;hash_tfm, src, len, dst);</div><div class='del'>-</div><div class='del'>-	if (rc) {</div><div class='del'>-		printk(KERN_ERR</div><div class='del'>-		       "%s: Error computing crypto hash; rc = [%d]\n",</div><div class='del'>-		       __func__, rc);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-out:</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int ecryptfs_crypto_api_algify_cipher_name(char **algified_name,</div><div class='ctx'> 						  char *cipher_name,</div><div class='ctx'> 						  char *chaining_modifier)</div><div class='hunk'>@@ -104,13 +77,10 @@ out:</div><div class='ctx'>  *</div><div class='ctx'>  * Generate the initialization vector from the given root IV and page</div><div class='ctx'>  * offset.</div><div class='del'>- *</div><div class='del'>- * Returns zero on success; non-zero on error.</div><div class='ctx'>  */</div><div class='del'>-int ecryptfs_derive_iv(char *iv, struct ecryptfs_crypt_stat *crypt_stat,</div><div class='del'>-		       loff_t offset)</div><div class='add'>+void ecryptfs_derive_iv(char *iv, struct ecryptfs_crypt_stat *crypt_stat,</div><div class='add'>+			loff_t offset)</div><div class='ctx'> {</div><div class='del'>-	int rc = 0;</div><div class='ctx'> 	char dst[MD5_DIGEST_SIZE];</div><div class='ctx'> 	char src[ECRYPTFS_MAX_IV_BYTES + 16];</div><div class='ctx'> </div><div class='hunk'>@@ -129,20 +99,12 @@ int ecryptfs_derive_iv(char *iv, struct ecryptfs_crypt_stat *crypt_stat,</div><div class='ctx'> 		ecryptfs_printk(KERN_DEBUG, "source:\n");</div><div class='ctx'> 		ecryptfs_dump_hex(src, (crypt_stat-&gt;iv_bytes + 16));</div><div class='ctx'> 	}</div><div class='del'>-	rc = ecryptfs_calculate_md5(dst, crypt_stat, src,</div><div class='del'>-				    (crypt_stat-&gt;iv_bytes + 16));</div><div class='del'>-	if (rc) {</div><div class='del'>-		ecryptfs_printk(KERN_WARNING, "Error attempting to compute "</div><div class='del'>-				"MD5 while generating IV for a page\n");</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	md5(src, crypt_stat-&gt;iv_bytes + 16, dst);</div><div class='ctx'> 	memcpy(iv, dst, crypt_stat-&gt;iv_bytes);</div><div class='ctx'> 	if (unlikely(ecryptfs_verbosity &gt; 0)) {</div><div class='ctx'> 		ecryptfs_printk(KERN_DEBUG, "derived iv:\n");</div><div class='ctx'> 		ecryptfs_dump_hex(iv, crypt_stat-&gt;iv_bytes);</div><div class='ctx'> 	}</div><div class='del'>-out:</div><div class='del'>-	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -151,29 +113,14 @@ out:</div><div class='ctx'>  *</div><div class='ctx'>  * Initialize the crypt_stat structure.</div><div class='ctx'>  */</div><div class='del'>-int ecryptfs_init_crypt_stat(struct ecryptfs_crypt_stat *crypt_stat)</div><div class='add'>+void ecryptfs_init_crypt_stat(struct ecryptfs_crypt_stat *crypt_stat)</div><div class='ctx'> {</div><div class='del'>-	struct crypto_shash *tfm;</div><div class='del'>-	int rc;</div><div class='del'>-</div><div class='del'>-	tfm = crypto_alloc_shash(ECRYPTFS_DEFAULT_HASH, 0, 0);</div><div class='del'>-	if (IS_ERR(tfm)) {</div><div class='del'>-		rc = PTR_ERR(tfm);</div><div class='del'>-		ecryptfs_printk(KERN_ERR, "Error attempting to "</div><div class='del'>-				"allocate crypto context; rc = [%d]\n",</div><div class='del'>-				rc);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	memset((void *)crypt_stat, 0, sizeof(struct ecryptfs_crypt_stat));</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;crypt_stat-&gt;keysig_list);</div><div class='ctx'> 	mutex_init(&amp;crypt_stat-&gt;keysig_list_mutex);</div><div class='ctx'> 	mutex_init(&amp;crypt_stat-&gt;cs_mutex);</div><div class='ctx'> 	mutex_init(&amp;crypt_stat-&gt;cs_tfm_mutex);</div><div class='del'>-	crypt_stat-&gt;hash_tfm = tfm;</div><div class='ctx'> 	crypt_stat-&gt;flags |= ECRYPTFS_STRUCT_INITIALIZED;</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -187,7 +134,6 @@ void ecryptfs_destroy_crypt_stat(struct ecryptfs_crypt_stat *crypt_stat)</div><div class='ctx'> 	struct ecryptfs_key_sig *key_sig, *key_sig_tmp;</div><div class='ctx'> </div><div class='ctx'> 	crypto_free_skcipher(crypt_stat-&gt;tfm);</div><div class='del'>-	crypto_free_shash(crypt_stat-&gt;hash_tfm);</div><div class='ctx'> 	list_for_each_entry_safe(key_sig, key_sig_tmp,</div><div class='ctx'> 				 &amp;crypt_stat-&gt;keysig_list, crypt_stat_list) {</div><div class='ctx'> 		list_del(&amp;key_sig-&gt;crypt_stat_list);</div><div class='hunk'>@@ -260,22 +206,6 @@ int virt_to_scatterlist(const void *addr, int size, struct scatterlist *sg,</div><div class='ctx'> 	return i;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct extent_crypt_result {</div><div class='del'>-	struct completion completion;</div><div class='del'>-	int rc;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static void extent_crypt_complete(struct crypto_async_request *req, int rc)</div><div class='del'>-{</div><div class='del'>-	struct extent_crypt_result *ecr = req-&gt;data;</div><div class='del'>-</div><div class='del'>-	if (rc == -EINPROGRESS)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	ecr-&gt;rc = rc;</div><div class='del'>-	complete(&amp;ecr-&gt;completion);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /**</div><div class='ctx'>  * crypt_scatterlist</div><div class='ctx'>  * @crypt_stat: Pointer to the crypt_stat struct to initialize.</div><div class='hunk'>@@ -293,7 +223,7 @@ static int crypt_scatterlist(struct ecryptfs_crypt_stat *crypt_stat,</div><div class='ctx'> 			     unsigned char *iv, int op)</div><div class='ctx'> {</div><div class='ctx'> 	struct skcipher_request *req = NULL;</div><div class='del'>-	struct extent_crypt_result ecr;</div><div class='add'>+	DECLARE_CRYPTO_WAIT(ecr);</div><div class='ctx'> 	int rc = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(ecryptfs_verbosity &gt; 0)) {</div><div class='hunk'>@@ -303,8 +233,6 @@ static int crypt_scatterlist(struct ecryptfs_crypt_stat *crypt_stat,</div><div class='ctx'> 				  crypt_stat-&gt;key_size);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	init_completion(&amp;ecr.completion);</div><div class='del'>-</div><div class='ctx'> 	mutex_lock(&amp;crypt_stat-&gt;cs_tfm_mutex);</div><div class='ctx'> 	req = skcipher_request_alloc(crypt_stat-&gt;tfm, GFP_NOFS);</div><div class='ctx'> 	if (!req) {</div><div class='hunk'>@@ -315,7 +243,7 @@ static int crypt_scatterlist(struct ecryptfs_crypt_stat *crypt_stat,</div><div class='ctx'> </div><div class='ctx'> 	skcipher_request_set_callback(req,</div><div class='ctx'> 			CRYPTO_TFM_REQ_MAY_BACKLOG | CRYPTO_TFM_REQ_MAY_SLEEP,</div><div class='del'>-			extent_crypt_complete, &amp;ecr);</div><div class='add'>+			crypto_req_done, &amp;ecr);</div><div class='ctx'> 	/* Consider doing this once, when the file is opened */</div><div class='ctx'> 	if (!(crypt_stat-&gt;flags &amp; ECRYPTFS_KEY_SET)) {</div><div class='ctx'> 		rc = crypto_skcipher_setkey(crypt_stat-&gt;tfm, crypt_stat-&gt;key,</div><div class='hunk'>@@ -334,13 +262,7 @@ static int crypt_scatterlist(struct ecryptfs_crypt_stat *crypt_stat,</div><div class='ctx'> 	skcipher_request_set_crypt(req, src_sg, dst_sg, size, iv);</div><div class='ctx'> 	rc = op == ENCRYPT ? crypto_skcipher_encrypt(req) :</div><div class='ctx'> 			     crypto_skcipher_decrypt(req);</div><div class='del'>-	if (rc == -EINPROGRESS || rc == -EBUSY) {</div><div class='del'>-		struct extent_crypt_result *ecr = req-&gt;base.data;</div><div class='del'>-</div><div class='del'>-		wait_for_completion(&amp;ecr-&gt;completion);</div><div class='del'>-		rc = ecr-&gt;rc;</div><div class='del'>-		reinit_completion(&amp;ecr-&gt;completion);</div><div class='del'>-	}</div><div class='add'>+	rc = crypto_wait_req(rc, &amp;ecr);</div><div class='ctx'> out:</div><div class='ctx'> 	skcipher_request_free(req);</div><div class='ctx'> 	return rc;</div><div class='hunk'>@@ -352,10 +274,10 @@ out:</div><div class='ctx'>  * Convert an eCryptfs page index into a lower byte offset</div><div class='ctx'>  */</div><div class='ctx'> static loff_t lower_offset_for_page(struct ecryptfs_crypt_stat *crypt_stat,</div><div class='del'>-				    struct page *page)</div><div class='add'>+				    struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	return ecryptfs_lower_header_size(crypt_stat) +</div><div class='del'>-	       ((loff_t)page-&gt;index &lt;&lt; PAGE_SHIFT);</div><div class='add'>+	       (loff_t)folio-&gt;index * PAGE_SIZE;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -364,6 +286,7 @@ static loff_t lower_offset_for_page(struct ecryptfs_crypt_stat *crypt_stat,</div><div class='ctx'>  *              encryption operation</div><div class='ctx'>  * @dst_page: The page to write the result into</div><div class='ctx'>  * @src_page: The page to read from</div><div class='add'>+ * @page_index: The offset in the file (in units of PAGE_SIZE)</div><div class='ctx'>  * @extent_offset: Page extent offset for use in generating IV</div><div class='ctx'>  * @op: ENCRYPT or DECRYPT to indicate the desired operation</div><div class='ctx'>  *</div><div class='hunk'>@@ -374,9 +297,9 @@ static loff_t lower_offset_for_page(struct ecryptfs_crypt_stat *crypt_stat,</div><div class='ctx'> static int crypt_extent(struct ecryptfs_crypt_stat *crypt_stat,</div><div class='ctx'> 			struct page *dst_page,</div><div class='ctx'> 			struct page *src_page,</div><div class='add'>+			pgoff_t page_index,</div><div class='ctx'> 			unsigned long extent_offset, int op)</div><div class='ctx'> {</div><div class='del'>-	pgoff_t page_index = op == ENCRYPT ? src_page-&gt;index : dst_page-&gt;index;</div><div class='ctx'> 	loff_t extent_base;</div><div class='ctx'> 	char extent_iv[ECRYPTFS_MAX_IV_BYTES];</div><div class='ctx'> 	struct scatterlist src_sg, dst_sg;</div><div class='hunk'>@@ -384,14 +307,7 @@ static int crypt_extent(struct ecryptfs_crypt_stat *crypt_stat,</div><div class='ctx'> 	int rc;</div><div class='ctx'> </div><div class='ctx'> 	extent_base = (((loff_t)page_index) * (PAGE_SIZE / extent_size));</div><div class='del'>-	rc = ecryptfs_derive_iv(extent_iv, crypt_stat,</div><div class='del'>-				(extent_base + extent_offset));</div><div class='del'>-	if (rc) {</div><div class='del'>-		ecryptfs_printk(KERN_ERR, "Error attempting to derive IV for "</div><div class='del'>-			"extent [0x%.16llx]; rc = [%d]\n",</div><div class='del'>-			(unsigned long long)(extent_base + extent_offset), rc);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	ecryptfs_derive_iv(extent_iv, crypt_stat, extent_base + extent_offset);</div><div class='ctx'> </div><div class='ctx'> 	sg_init_table(&amp;src_sg, 1);</div><div class='ctx'> 	sg_init_table(&amp;dst_sg, 1);</div><div class='hunk'>@@ -416,7 +332,7 @@ out:</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * ecryptfs_encrypt_page</div><div class='del'>- * @page: Page mapped from the eCryptfs inode for the file; contains</div><div class='add'>+ * @folio: Folio mapped from the eCryptfs inode for the file; contains</div><div class='ctx'>  *        decrypted content that needs to be encrypted (to a temporary</div><div class='ctx'>  *        page; not in place) and written out to the lower file</div><div class='ctx'>  *</div><div class='hunk'>@@ -430,7 +346,7 @@ out:</div><div class='ctx'>  *</div><div class='ctx'>  * Returns zero on success; negative on error</div><div class='ctx'>  */</div><div class='del'>-int ecryptfs_encrypt_page(struct page *page)</div><div class='add'>+int ecryptfs_encrypt_page(struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *ecryptfs_inode;</div><div class='ctx'> 	struct ecryptfs_crypt_stat *crypt_stat;</div><div class='hunk'>@@ -440,7 +356,7 @@ int ecryptfs_encrypt_page(struct page *page)</div><div class='ctx'> 	loff_t lower_offset;</div><div class='ctx'> 	int rc = 0;</div><div class='ctx'> </div><div class='del'>-	ecryptfs_inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	ecryptfs_inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	crypt_stat =</div><div class='ctx'> 		&amp;(ecryptfs_inode_to_private(ecryptfs_inode)-&gt;crypt_stat);</div><div class='ctx'> 	BUG_ON(!(crypt_stat-&gt;flags &amp; ECRYPTFS_ENCRYPTED));</div><div class='hunk'>@@ -455,8 +371,9 @@ int ecryptfs_encrypt_page(struct page *page)</div><div class='ctx'> 	for (extent_offset = 0;</div><div class='ctx'> 	     extent_offset &lt; (PAGE_SIZE / crypt_stat-&gt;extent_size);</div><div class='ctx'> 	     extent_offset++) {</div><div class='del'>-		rc = crypt_extent(crypt_stat, enc_extent_page, page,</div><div class='del'>-				  extent_offset, ENCRYPT);</div><div class='add'>+		rc = crypt_extent(crypt_stat, enc_extent_page,</div><div class='add'>+				folio_page(folio, 0), folio-&gt;index,</div><div class='add'>+				extent_offset, ENCRYPT);</div><div class='ctx'> 		if (rc) {</div><div class='ctx'> 			printk(KERN_ERR "%s: Error encrypting extent; "</div><div class='ctx'> 			       "rc = [%d]\n", __func__, rc);</div><div class='hunk'>@@ -464,11 +381,11 @@ int ecryptfs_encrypt_page(struct page *page)</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	lower_offset = lower_offset_for_page(crypt_stat, page);</div><div class='del'>-	enc_extent_virt = kmap(enc_extent_page);</div><div class='add'>+	lower_offset = lower_offset_for_page(crypt_stat, folio);</div><div class='add'>+	enc_extent_virt = kmap_local_page(enc_extent_page);</div><div class='ctx'> 	rc = ecryptfs_write_lower(ecryptfs_inode, enc_extent_virt, lower_offset,</div><div class='ctx'> 				  PAGE_SIZE);</div><div class='del'>-	kunmap(enc_extent_page);</div><div class='add'>+	kunmap_local(enc_extent_virt);</div><div class='ctx'> 	if (rc &lt; 0) {</div><div class='ctx'> 		ecryptfs_printk(KERN_ERR,</div><div class='ctx'> 			"Error attempting to write lower page; rc = [%d]\n",</div><div class='hunk'>@@ -485,7 +402,7 @@ out:</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * ecryptfs_decrypt_page</div><div class='del'>- * @page: Page mapped from the eCryptfs inode for the file; data read</div><div class='add'>+ * @folio: Folio mapped from the eCryptfs inode for the file; data read</div><div class='ctx'>  *        and decrypted from the lower file will be written into this</div><div class='ctx'>  *        page</div><div class='ctx'>  *</div><div class='hunk'>@@ -499,7 +416,7 @@ out:</div><div class='ctx'>  *</div><div class='ctx'>  * Returns zero on success; negative on error</div><div class='ctx'>  */</div><div class='del'>-int ecryptfs_decrypt_page(struct page *page)</div><div class='add'>+int ecryptfs_decrypt_page(struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *ecryptfs_inode;</div><div class='ctx'> 	struct ecryptfs_crypt_stat *crypt_stat;</div><div class='hunk'>@@ -508,16 +425,16 @@ int ecryptfs_decrypt_page(struct page *page)</div><div class='ctx'> 	loff_t lower_offset;</div><div class='ctx'> 	int rc = 0;</div><div class='ctx'> </div><div class='del'>-	ecryptfs_inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	ecryptfs_inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	crypt_stat =</div><div class='ctx'> 		&amp;(ecryptfs_inode_to_private(ecryptfs_inode)-&gt;crypt_stat);</div><div class='ctx'> 	BUG_ON(!(crypt_stat-&gt;flags &amp; ECRYPTFS_ENCRYPTED));</div><div class='ctx'> </div><div class='del'>-	lower_offset = lower_offset_for_page(crypt_stat, page);</div><div class='del'>-	page_virt = kmap(page);</div><div class='add'>+	lower_offset = lower_offset_for_page(crypt_stat, folio);</div><div class='add'>+	page_virt = kmap_local_folio(folio, 0);</div><div class='ctx'> 	rc = ecryptfs_read_lower(page_virt, lower_offset, PAGE_SIZE,</div><div class='ctx'> 				 ecryptfs_inode);</div><div class='del'>-	kunmap(page);</div><div class='add'>+	kunmap_local(page_virt);</div><div class='ctx'> 	if (rc &lt; 0) {</div><div class='ctx'> 		ecryptfs_printk(KERN_ERR,</div><div class='ctx'> 			"Error attempting to read lower page; rc = [%d]\n",</div><div class='hunk'>@@ -528,8 +445,9 @@ int ecryptfs_decrypt_page(struct page *page)</div><div class='ctx'> 	for (extent_offset = 0;</div><div class='ctx'> 	     extent_offset &lt; (PAGE_SIZE / crypt_stat-&gt;extent_size);</div><div class='ctx'> 	     extent_offset++) {</div><div class='del'>-		rc = crypt_extent(crypt_stat, page, page,</div><div class='del'>-				  extent_offset, DECRYPT);</div><div class='add'>+		struct page *page = folio_page(folio, 0);</div><div class='add'>+		rc = crypt_extent(crypt_stat, page, page, folio-&gt;index,</div><div class='add'>+				extent_offset, DECRYPT);</div><div class='ctx'> 		if (rc) {</div><div class='ctx'> 			printk(KERN_ERR "%s: Error decrypting extent; "</div><div class='ctx'> 			       "rc = [%d]\n", __func__, rc);</div><div class='hunk'>@@ -630,31 +548,20 @@ void ecryptfs_set_default_sizes(struct ecryptfs_crypt_stat *crypt_stat)</div><div class='ctx'>  */</div><div class='ctx'> int ecryptfs_compute_root_iv(struct ecryptfs_crypt_stat *crypt_stat)</div><div class='ctx'> {</div><div class='del'>-	int rc = 0;</div><div class='ctx'> 	char dst[MD5_DIGEST_SIZE];</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(crypt_stat-&gt;iv_bytes &gt; MD5_DIGEST_SIZE);</div><div class='ctx'> 	BUG_ON(crypt_stat-&gt;iv_bytes &lt;= 0);</div><div class='ctx'> 	if (!(crypt_stat-&gt;flags &amp; ECRYPTFS_KEY_VALID)) {</div><div class='del'>-		rc = -EINVAL;</div><div class='ctx'> 		ecryptfs_printk(KERN_WARNING, "Session key not valid; "</div><div class='ctx'> 				"cannot generate root IV\n");</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	rc = ecryptfs_calculate_md5(dst, crypt_stat, crypt_stat-&gt;key,</div><div class='del'>-				    crypt_stat-&gt;key_size);</div><div class='del'>-	if (rc) {</div><div class='del'>-		ecryptfs_printk(KERN_WARNING, "Error attempting to compute "</div><div class='del'>-				"MD5 while generating root IV\n");</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	memcpy(crypt_stat-&gt;root_iv, dst, crypt_stat-&gt;iv_bytes);</div><div class='del'>-out:</div><div class='del'>-	if (rc) {</div><div class='ctx'> 		memset(crypt_stat-&gt;root_iv, 0, crypt_stat-&gt;iv_bytes);</div><div class='ctx'> 		crypt_stat-&gt;flags |= ECRYPTFS_SECURITY_WARNING;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-	return rc;</div><div class='add'>+	md5(crypt_stat-&gt;key, crypt_stat-&gt;key_size, dst);</div><div class='add'>+	memcpy(crypt_stat-&gt;root_iv, dst, crypt_stat-&gt;iv_bytes);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void ecryptfs_generate_new_key(struct ecryptfs_crypt_stat *crypt_stat)</div><div class='hunk'>@@ -1105,7 +1012,7 @@ ecryptfs_write_metadata_to_xattr(struct dentry *ecryptfs_dentry,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	inode_lock(lower_inode);</div><div class='del'>-	rc = __vfs_setxattr(&amp;init_user_ns, lower_dentry, lower_inode,</div><div class='add'>+	rc = __vfs_setxattr(&amp;nop_mnt_idmap, lower_dentry, lower_inode,</div><div class='ctx'> 			    ECRYPTFS_XATTR_NAME, page_virt, size, 0);</div><div class='ctx'> 	if (!rc &amp;&amp; ecryptfs_inode)</div><div class='ctx'> 		fsstack_copy_attr_all(ecryptfs_inode, lower_inode);</div><div class='hunk'>@@ -1630,9 +1537,7 @@ ecryptfs_add_new_key_tfm(struct ecryptfs_key_tfm **key_tfm, char *cipher_name,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	mutex_init(&amp;tmp_tfm-&gt;key_tfm_mutex);</div><div class='del'>-	strncpy(tmp_tfm-&gt;cipher_name, cipher_name,</div><div class='del'>-		ECRYPTFS_MAX_CIPHER_NAME_SIZE);</div><div class='del'>-	tmp_tfm-&gt;cipher_name[ECRYPTFS_MAX_CIPHER_NAME_SIZE] = '\0';</div><div class='add'>+	strscpy(tmp_tfm-&gt;cipher_name, cipher_name);</div><div class='ctx'> 	tmp_tfm-&gt;key_size = key_size;</div><div class='ctx'> 	rc = ecryptfs_process_key_cipher(&amp;tmp_tfm-&gt;key_tfm,</div><div class='ctx'> 					 tmp_tfm-&gt;cipher_name,</div><div class='hunk'>@@ -1973,16 +1878,6 @@ out:</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool is_dot_dotdot(const char *name, size_t name_size)</div><div class='del'>-{</div><div class='del'>-	if (name_size == 1 &amp;&amp; name[0] == '.')</div><div class='del'>-		return true;</div><div class='del'>-	else if (name_size == 2 &amp;&amp; name[0] == '.' &amp;&amp; name[1] == '.')</div><div class='del'>-		return true;</div><div class='del'>-</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /**</div><div class='ctx'>  * ecryptfs_decode_and_decrypt_filename - converts the encoded cipher text name to decoded plaintext</div><div class='ctx'>  * @plaintext_name: The plaintext name</div><div class='head'>diff --git a/fs/ecryptfs/dentry.c b/fs/ecryptfs/dentry.c<br/>index acaa0825e9bb..6648a924e31a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ecryptfs/dentry.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ecryptfs/dentry.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ecryptfs/dentry.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ecryptfs/dentry.c</a></div><div class='hunk'>@@ -17,7 +17,9 @@</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * ecryptfs_d_revalidate - revalidate an ecryptfs dentry</div><div class='del'>- * @dentry: The ecryptfs dentry</div><div class='add'>+ * @dir: inode of expected parent</div><div class='add'>+ * @name: expected name</div><div class='add'>+ * @dentry: dentry to revalidate</div><div class='ctx'>  * @flags: lookup flags</div><div class='ctx'>  *</div><div class='ctx'>  * Called when the VFS needs to revalidate a dentry. This</div><div class='hunk'>@@ -28,7 +30,8 @@</div><div class='ctx'>  * Returns 1 if valid, 0 otherwise.</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='del'>-static int ecryptfs_d_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='add'>+static int ecryptfs_d_revalidate(struct inode *dir, const struct qstr *name,</div><div class='add'>+				 struct dentry *dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *lower_dentry = ecryptfs_dentry_to_lower(dentry);</div><div class='ctx'> 	int rc = 1;</div><div class='hunk'>@@ -36,8 +39,15 @@ static int ecryptfs_d_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='ctx'> 	if (flags &amp; LOOKUP_RCU)</div><div class='ctx'> 		return -ECHILD;</div><div class='ctx'> </div><div class='del'>-	if (lower_dentry-&gt;d_flags &amp; DCACHE_OP_REVALIDATE)</div><div class='del'>-		rc = lower_dentry-&gt;d_op-&gt;d_revalidate(lower_dentry, flags);</div><div class='add'>+	if (lower_dentry-&gt;d_flags &amp; DCACHE_OP_REVALIDATE) {</div><div class='add'>+		struct inode *lower_dir = ecryptfs_inode_to_lower(dir);</div><div class='add'>+		struct name_snapshot n;</div><div class='add'>+</div><div class='add'>+		take_dentry_name_snapshot(&amp;n, lower_dentry);</div><div class='add'>+		rc = lower_dentry-&gt;d_op-&gt;d_revalidate(lower_dir, &amp;n.name,</div><div class='add'>+						      lower_dentry, flags);</div><div class='add'>+		release_dentry_name_snapshot(&amp;n);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (d_really_is_positive(dentry)) {</div><div class='ctx'> 		struct inode *inode = d_inode(dentry);</div><div class='hunk'>@@ -49,14 +59,6 @@ static int ecryptfs_d_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct kmem_cache *ecryptfs_dentry_info_cache;</div><div class='del'>-</div><div class='del'>-static void ecryptfs_dentry_free_rcu(struct rcu_head *head)</div><div class='del'>-{</div><div class='del'>-	kmem_cache_free(ecryptfs_dentry_info_cache,</div><div class='del'>-		container_of(head, struct ecryptfs_dentry_info, rcu));</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /**</div><div class='ctx'>  * ecryptfs_d_release</div><div class='ctx'>  * @dentry: The ecryptfs dentry</div><div class='hunk'>@@ -65,11 +67,7 @@ static void ecryptfs_dentry_free_rcu(struct rcu_head *head)</div><div class='ctx'>  */</div><div class='ctx'> static void ecryptfs_d_release(struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	struct ecryptfs_dentry_info *p = dentry-&gt;d_fsdata;</div><div class='del'>-	if (p) {</div><div class='del'>-		path_put(&amp;p-&gt;lower_path);</div><div class='del'>-		call_rcu(&amp;p-&gt;rcu, ecryptfs_dentry_free_rcu);</div><div class='del'>-	}</div><div class='add'>+	dput(dentry-&gt;d_fsdata);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct dentry_operations ecryptfs_dops = {</div><div class='head'>diff --git a/fs/ecryptfs/ecryptfs_kernel.h b/fs/ecryptfs/ecryptfs_kernel.h<br/>index 5f2b49e13731..62a2ea7f59ed 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ecryptfs/ecryptfs_kernel.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ecryptfs/ecryptfs_kernel.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ecryptfs/ecryptfs_kernel.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ecryptfs/ecryptfs_kernel.h</a></div><div class='hunk'>@@ -14,6 +14,7 @@</div><div class='ctx'> #ifndef ECRYPTFS_KERNEL_H</div><div class='ctx'> #define ECRYPTFS_KERNEL_H</div><div class='ctx'> </div><div class='add'>+#include &lt;crypto/md5.h&gt;</div><div class='ctx'> #include &lt;crypto/skcipher.h&gt;</div><div class='ctx'> #include &lt;keys/user-type.h&gt;</div><div class='ctx'> #include &lt;keys/encrypted-type.h&gt;</div><div class='hunk'>@@ -137,8 +138,6 @@ ecryptfs_get_key_payload_data(struct key *key)</div><div class='ctx'> 					+ MAGIC_ECRYPTFS_MARKER_SIZE_BYTES)</div><div class='ctx'> #define ECRYPTFS_DEFAULT_CIPHER "aes"</div><div class='ctx'> #define ECRYPTFS_DEFAULT_KEY_BYTES 16</div><div class='del'>-#define ECRYPTFS_DEFAULT_HASH "md5"</div><div class='del'>-#define ECRYPTFS_TAG_70_DIGEST ECRYPTFS_DEFAULT_HASH</div><div class='ctx'> #define ECRYPTFS_TAG_1_PACKET_TYPE 0x01</div><div class='ctx'> #define ECRYPTFS_TAG_3_PACKET_TYPE 0x8C</div><div class='ctx'> #define ECRYPTFS_TAG_11_PACKET_TYPE 0xED</div><div class='hunk'>@@ -163,8 +162,6 @@ ecryptfs_get_key_payload_data(struct key *key)</div><div class='ctx'>  * ECRYPTFS_MAX_IV_BYTES */</div><div class='ctx'> #define ECRYPTFS_FILENAME_MIN_RANDOM_PREPEND_BYTES 16</div><div class='ctx'> #define ECRYPTFS_NON_NULL 0x42 /* A reasonable substitute for NULL */</div><div class='del'>-#define MD5_DIGEST_SIZE 16</div><div class='del'>-#define ECRYPTFS_TAG_70_DIGEST_SIZE MD5_DIGEST_SIZE</div><div class='ctx'> #define ECRYPTFS_TAG_70_MIN_METADATA_SIZE (1 + ECRYPTFS_MIN_PKT_LEN_SIZE \</div><div class='ctx'> 					   + ECRYPTFS_SIG_SIZE + 1 + 1)</div><div class='ctx'> #define ECRYPTFS_TAG_70_MAX_METADATA_SIZE (1 + ECRYPTFS_MAX_PKT_LEN_SIZE \</div><div class='hunk'>@@ -237,8 +234,6 @@ struct ecryptfs_crypt_stat {</div><div class='ctx'> 	unsigned int extent_mask;</div><div class='ctx'> 	struct ecryptfs_mount_crypt_stat *mount_crypt_stat;</div><div class='ctx'> 	struct crypto_skcipher *tfm;</div><div class='del'>-	struct crypto_shash *hash_tfm; /* Crypto context for generating</div><div class='del'>-					* the initialization vectors */</div><div class='ctx'> 	unsigned char cipher[ECRYPTFS_MAX_CIPHER_NAME_SIZE + 1];</div><div class='ctx'> 	unsigned char key[ECRYPTFS_MAX_KEY_BYTES];</div><div class='ctx'> 	unsigned char root_iv[ECRYPTFS_MAX_IV_BYTES];</div><div class='hunk'>@@ -258,13 +253,6 @@ struct ecryptfs_inode_info {</div><div class='ctx'> 	struct ecryptfs_crypt_stat crypt_stat;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/* dentry private data. Each dentry must keep track of a lower</div><div class='del'>- * vfsmount too. */</div><div class='del'>-struct ecryptfs_dentry_info {</div><div class='del'>-	struct path lower_path;</div><div class='del'>-	struct rcu_head rcu;</div><div class='del'>-};</div><div class='del'>-</div><div class='ctx'> /**</div><div class='ctx'>  * ecryptfs_global_auth_tok - A key used to encrypt all new files under the mountpoint</div><div class='ctx'>  * @flags: Status flags</div><div class='hunk'>@@ -348,6 +336,7 @@ struct ecryptfs_mount_crypt_stat {</div><div class='ctx'> /* superblock private data. */</div><div class='ctx'> struct ecryptfs_sb_info {</div><div class='ctx'> 	struct super_block *wsi_sb;</div><div class='add'>+	struct vfsmount *lower_mnt;</div><div class='ctx'> 	struct ecryptfs_mount_crypt_stat mount_crypt_stat;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -494,22 +483,25 @@ ecryptfs_set_superblock_lower(struct super_block *sb,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void</div><div class='del'>-ecryptfs_set_dentry_private(struct dentry *dentry,</div><div class='del'>-			    struct ecryptfs_dentry_info *dentry_info)</div><div class='add'>+ecryptfs_set_dentry_lower(struct dentry *dentry,</div><div class='add'>+			  struct dentry *lower_dentry)</div><div class='ctx'> {</div><div class='del'>-	dentry-&gt;d_fsdata = dentry_info;</div><div class='add'>+	dentry-&gt;d_fsdata = lower_dentry;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline struct dentry *</div><div class='ctx'> ecryptfs_dentry_to_lower(struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	return ((struct ecryptfs_dentry_info *)dentry-&gt;d_fsdata)-&gt;lower_path.dentry;</div><div class='add'>+	return dentry-&gt;d_fsdata;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline struct path *</div><div class='del'>-ecryptfs_dentry_to_lower_path(struct dentry *dentry)</div><div class='add'>+static inline struct path</div><div class='add'>+ecryptfs_lower_path(struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	return &amp;((struct ecryptfs_dentry_info *)dentry-&gt;d_fsdata)-&gt;lower_path;</div><div class='add'>+	return (struct path){</div><div class='add'>+		.mnt = ecryptfs_superblock_to_private(dentry-&gt;d_sb)-&gt;lower_mnt,</div><div class='add'>+		.dentry = ecryptfs_dentry_to_lower(dentry)</div><div class='add'>+	};</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #define ecryptfs_printk(type, fmt, arg...) \</div><div class='hunk'>@@ -532,7 +524,6 @@ extern unsigned int ecryptfs_number_of_users;</div><div class='ctx'> </div><div class='ctx'> extern struct kmem_cache *ecryptfs_auth_tok_list_item_cache;</div><div class='ctx'> extern struct kmem_cache *ecryptfs_file_info_cache;</div><div class='del'>-extern struct kmem_cache *ecryptfs_dentry_info_cache;</div><div class='ctx'> extern struct kmem_cache *ecryptfs_inode_info_cache;</div><div class='ctx'> extern struct kmem_cache *ecryptfs_sb_info_cache;</div><div class='ctx'> extern struct kmem_cache *ecryptfs_header_cache;</div><div class='hunk'>@@ -557,20 +548,19 @@ int ecryptfs_encrypt_and_encode_filename(</div><div class='ctx'> 	size_t *encoded_name_size,</div><div class='ctx'> 	struct ecryptfs_mount_crypt_stat *mount_crypt_stat,</div><div class='ctx'> 	const char *name, size_t name_size);</div><div class='del'>-struct dentry *ecryptfs_lower_dentry(struct dentry *this_dentry);</div><div class='ctx'> void ecryptfs_dump_hex(char *data, int bytes);</div><div class='ctx'> int virt_to_scatterlist(const void *addr, int size, struct scatterlist *sg,</div><div class='ctx'> 			int sg_size);</div><div class='ctx'> int ecryptfs_compute_root_iv(struct ecryptfs_crypt_stat *crypt_stat);</div><div class='ctx'> void ecryptfs_rotate_iv(unsigned char *iv);</div><div class='del'>-int ecryptfs_init_crypt_stat(struct ecryptfs_crypt_stat *crypt_stat);</div><div class='add'>+void ecryptfs_init_crypt_stat(struct ecryptfs_crypt_stat *crypt_stat);</div><div class='ctx'> void ecryptfs_destroy_crypt_stat(struct ecryptfs_crypt_stat *crypt_stat);</div><div class='ctx'> void ecryptfs_destroy_mount_crypt_stat(</div><div class='ctx'> 	struct ecryptfs_mount_crypt_stat *mount_crypt_stat);</div><div class='ctx'> int ecryptfs_init_crypt_ctx(struct ecryptfs_crypt_stat *crypt_stat);</div><div class='ctx'> int ecryptfs_write_inode_size_to_metadata(struct inode *ecryptfs_inode);</div><div class='del'>-int ecryptfs_encrypt_page(struct page *page);</div><div class='del'>-int ecryptfs_decrypt_page(struct page *page);</div><div class='add'>+int ecryptfs_encrypt_page(struct folio *folio);</div><div class='add'>+int ecryptfs_decrypt_page(struct folio *folio);</div><div class='ctx'> int ecryptfs_write_metadata(struct dentry *ecryptfs_dentry,</div><div class='ctx'> 			    struct inode *ecryptfs_inode);</div><div class='ctx'> int ecryptfs_read_metadata(struct dentry *ecryptfs_dentry);</div><div class='hunk'>@@ -653,16 +643,15 @@ int ecryptfs_keyring_auth_tok_for_sig(struct key **auth_tok_key,</div><div class='ctx'> int ecryptfs_write_lower(struct inode *ecryptfs_inode, char *data,</div><div class='ctx'> 			 loff_t offset, size_t size);</div><div class='ctx'> int ecryptfs_write_lower_page_segment(struct inode *ecryptfs_inode,</div><div class='del'>-				      struct page *page_for_lower,</div><div class='add'>+				      struct folio *folio_for_lower,</div><div class='ctx'> 				      size_t offset_in_page, size_t size);</div><div class='ctx'> int ecryptfs_write(struct inode *inode, char *data, loff_t offset, size_t size);</div><div class='ctx'> int ecryptfs_read_lower(char *data, loff_t offset, size_t size,</div><div class='ctx'> 			struct inode *ecryptfs_inode);</div><div class='del'>-int ecryptfs_read_lower_page_segment(struct page *page_for_ecryptfs,</div><div class='add'>+int ecryptfs_read_lower_page_segment(struct folio *folio_for_ecryptfs,</div><div class='ctx'> 				     pgoff_t page_index,</div><div class='ctx'> 				     size_t offset_in_page, size_t size,</div><div class='ctx'> 				     struct inode *ecryptfs_inode);</div><div class='del'>-struct page *ecryptfs_get_locked_page(struct inode *inode, loff_t index);</div><div class='ctx'> int ecryptfs_parse_packet_length(unsigned char *data, size_t *size,</div><div class='ctx'> 				 size_t *length_size);</div><div class='ctx'> int ecryptfs_write_packet_length(char *dest, size_t size,</div><div class='hunk'>@@ -699,9 +688,9 @@ ecryptfs_parse_tag_70_packet(char **filename, size_t *filename_size,</div><div class='ctx'> 			     char *data, size_t max_packet_size);</div><div class='ctx'> int ecryptfs_set_f_namelen(long *namelen, long lower_namelen,</div><div class='ctx'> 			   struct ecryptfs_mount_crypt_stat *mount_crypt_stat);</div><div class='del'>-int ecryptfs_derive_iv(char *iv, struct ecryptfs_crypt_stat *crypt_stat,</div><div class='del'>-		       loff_t offset);</div><div class='add'>+void ecryptfs_derive_iv(char *iv, struct ecryptfs_crypt_stat *crypt_stat,</div><div class='add'>+			loff_t offset);</div><div class='ctx'> </div><div class='del'>-extern const struct xattr_handler *ecryptfs_xattr_handlers[];</div><div class='add'>+extern const struct xattr_handler * const ecryptfs_xattr_handlers[];</div><div class='ctx'> </div><div class='ctx'> #endif /* #ifndef ECRYPTFS_KERNEL_H */</div><div class='head'>diff --git a/fs/ecryptfs/file.c b/fs/ecryptfs/file.c<br/>index 18d5b91cb573..7929411837cf 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ecryptfs/file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ecryptfs/file.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ecryptfs/file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ecryptfs/file.c</a></div><div class='hunk'>@@ -33,13 +33,36 @@ static ssize_t ecryptfs_read_update_atime(struct kiocb *iocb,</div><div class='ctx'> 				struct iov_iter *to)</div><div class='ctx'> {</div><div class='ctx'> 	ssize_t rc;</div><div class='del'>-	struct path *path;</div><div class='ctx'> 	struct file *file = iocb-&gt;ki_filp;</div><div class='ctx'> </div><div class='ctx'> 	rc = generic_file_read_iter(iocb, to);</div><div class='ctx'> 	if (rc &gt;= 0) {</div><div class='del'>-		path = ecryptfs_dentry_to_lower_path(file-&gt;f_path.dentry);</div><div class='del'>-		touch_atime(path);</div><div class='add'>+		struct path path = ecryptfs_lower_path(file-&gt;f_path.dentry);</div><div class='add'>+		touch_atime(&amp;path);</div><div class='add'>+	}</div><div class='add'>+	return rc;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * ecryptfs_splice_read_update_atime</div><div class='add'>+ *</div><div class='add'>+ * filemap_splice_read updates the atime of upper layer inode.  But, it</div><div class='add'>+ * doesn't give us a chance to update the atime of the lower layer inode.  This</div><div class='add'>+ * function is a wrapper to generic_file_read.  It updates the atime of the</div><div class='add'>+ * lower level inode if generic_file_read returns without any errors. This is</div><div class='add'>+ * to be used only for file reads.  The function to be used for directory reads</div><div class='add'>+ * is ecryptfs_read.</div><div class='add'>+ */</div><div class='add'>+static ssize_t ecryptfs_splice_read_update_atime(struct file *in, loff_t *ppos,</div><div class='add'>+						 struct pipe_inode_info *pipe,</div><div class='add'>+						 size_t len, unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	ssize_t rc;</div><div class='add'>+</div><div class='add'>+	rc = filemap_splice_read(in, ppos, pipe, len, flags);</div><div class='add'>+	if (rc &gt;= 0) {</div><div class='add'>+		struct path path = ecryptfs_lower_path(in-&gt;f_path.dentry);</div><div class='add'>+		touch_atime(&amp;path);</div><div class='ctx'> 	}</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='hunk'>@@ -53,7 +76,7 @@ struct ecryptfs_getdents_callback {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /* Inspired by generic filldir in fs/readdir.c */</div><div class='del'>-static int</div><div class='add'>+static bool</div><div class='ctx'> ecryptfs_filldir(struct dir_context *ctx, const char *lower_name,</div><div class='ctx'> 		 int lower_namelen, loff_t offset, u64 ino, unsigned int d_type)</div><div class='ctx'> {</div><div class='hunk'>@@ -61,18 +84,19 @@ ecryptfs_filldir(struct dir_context *ctx, const char *lower_name,</div><div class='ctx'> 		container_of(ctx, struct ecryptfs_getdents_callback, ctx);</div><div class='ctx'> 	size_t name_size;</div><div class='ctx'> 	char *name;</div><div class='del'>-	int rc;</div><div class='add'>+	int err;</div><div class='add'>+	bool res;</div><div class='ctx'> </div><div class='ctx'> 	buf-&gt;filldir_called++;</div><div class='del'>-	rc = ecryptfs_decode_and_decrypt_filename(&amp;name, &amp;name_size,</div><div class='del'>-						  buf-&gt;sb, lower_name,</div><div class='del'>-						  lower_namelen);</div><div class='del'>-	if (rc) {</div><div class='del'>-		if (rc != -EINVAL) {</div><div class='add'>+	err = ecryptfs_decode_and_decrypt_filename(&amp;name, &amp;name_size,</div><div class='add'>+						   buf-&gt;sb, lower_name,</div><div class='add'>+						   lower_namelen);</div><div class='add'>+	if (err) {</div><div class='add'>+		if (err != -EINVAL) {</div><div class='ctx'> 			ecryptfs_printk(KERN_DEBUG,</div><div class='ctx'> 					"%s: Error attempting to decode and decrypt filename [%s]; rc = [%d]\n",</div><div class='del'>-					__func__, lower_name, rc);</div><div class='del'>-			return rc;</div><div class='add'>+					__func__, lower_name, err);</div><div class='add'>+			return false;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* Mask -EINVAL errors as these are most likely due a plaintext</div><div class='hunk'>@@ -81,16 +105,15 @@ ecryptfs_filldir(struct dir_context *ctx, const char *lower_name,</div><div class='ctx'> 		 * the "lost+found" dentry in the root directory of an Ext4</div><div class='ctx'> 		 * filesystem.</div><div class='ctx'> 		 */</div><div class='del'>-		return 0;</div><div class='add'>+		return true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	buf-&gt;caller-&gt;pos = buf-&gt;ctx.pos;</div><div class='del'>-	rc = !dir_emit(buf-&gt;caller, name, name_size, ino, d_type);</div><div class='add'>+	res = dir_emit(buf-&gt;caller, name, name_size, ino, d_type);</div><div class='ctx'> 	kfree(name);</div><div class='del'>-	if (!rc)</div><div class='add'>+	if (res)</div><div class='ctx'> 		buf-&gt;entries_written++;</div><div class='del'>-</div><div class='del'>-	return rc;</div><div class='add'>+	return res;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -111,14 +134,8 @@ static int ecryptfs_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 	lower_file = ecryptfs_file_to_lower(file);</div><div class='ctx'> 	rc = iterate_dir(lower_file, &amp;buf.ctx);</div><div class='ctx'> 	ctx-&gt;pos = buf.ctx.pos;</div><div class='del'>-	if (rc &lt; 0)</div><div class='del'>-		goto out;</div><div class='del'>-	if (buf.filldir_called &amp;&amp; !buf.entries_written)</div><div class='del'>-		goto out;</div><div class='del'>-	if (rc &gt;= 0)</div><div class='del'>-		fsstack_copy_attr_atime(inode,</div><div class='del'>-					file_inode(lower_file));</div><div class='del'>-out:</div><div class='add'>+	if (rc &gt;= 0 &amp;&amp; (buf.entries_written || !buf.filldir_called))</div><div class='add'>+		fsstack_copy_attr_atime(inode, file_inode(lower_file));</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -174,7 +191,7 @@ static int ecryptfs_mmap(struct file *file, struct vm_area_struct *vma)</div><div class='ctx'> 	 * natively.  If FILESYSTEM_MAX_STACK_DEPTH &gt; 2 or ecryptfs</div><div class='ctx'> 	 * allows recursive mounting, this will need to be extended.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!lower_file-&gt;f_op-&gt;mmap)</div><div class='add'>+	if (!can_mmap_file(lower_file))</div><div class='ctx'> 		return -ENODEV;</div><div class='ctx'> 	return generic_file_mmap(file, vma);</div><div class='ctx'> }</div><div class='hunk'>@@ -264,6 +281,7 @@ static int ecryptfs_dir_open(struct inode *inode, struct file *file)</div><div class='ctx'> 	 * ecryptfs_lookup() */</div><div class='ctx'> 	struct ecryptfs_file_info *file_info;</div><div class='ctx'> 	struct file *lower_file;</div><div class='add'>+	struct path path;</div><div class='ctx'> </div><div class='ctx'> 	/* Released in ecryptfs_release or end of function if failure */</div><div class='ctx'> 	file_info = kmem_cache_zalloc(ecryptfs_file_info_cache, GFP_KERNEL);</div><div class='hunk'>@@ -273,8 +291,8 @@ static int ecryptfs_dir_open(struct inode *inode, struct file *file)</div><div class='ctx'> 				"Error attempting to allocate memory\n");</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	}</div><div class='del'>-	lower_file = dentry_open(ecryptfs_dentry_to_lower_path(ecryptfs_dentry),</div><div class='del'>-				 file-&gt;f_flags, current_cred());</div><div class='add'>+	path = ecryptfs_lower_path(ecryptfs_dentry);</div><div class='add'>+	lower_file = dentry_open(&amp;path, file-&gt;f_flags, current_cred());</div><div class='ctx'> 	if (IS_ERR(lower_file)) {</div><div class='ctx'> 		printk(KERN_ERR "%s: Error attempting to initialize "</div><div class='ctx'> 			"the lower file for the dentry with name "</div><div class='hunk'>@@ -420,5 +438,5 @@ const struct file_operations ecryptfs_main_fops = {</div><div class='ctx'> 	.release = ecryptfs_release,</div><div class='ctx'> 	.fsync = ecryptfs_fsync,</div><div class='ctx'> 	.fasync = ecryptfs_fasync,</div><div class='del'>-	.splice_read = generic_file_splice_read,</div><div class='add'>+	.splice_read = ecryptfs_splice_read_update_atime,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/ecryptfs/inode.c b/fs/ecryptfs/inode.c<br/>index 16d50dface59..3978248247dc 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ecryptfs/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ecryptfs/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ecryptfs/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ecryptfs/inode.c</a></div><div class='hunk'>@@ -18,22 +18,32 @@</div><div class='ctx'> #include &lt;linux/fs_stack.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/xattr.h&gt;</div><div class='add'>+#include &lt;linux/posix_acl.h&gt;</div><div class='add'>+#include &lt;linux/posix_acl_xattr.h&gt;</div><div class='ctx'> #include &lt;linux/fileattr.h&gt;</div><div class='del'>-#include &lt;asm/unaligned.h&gt;</div><div class='add'>+#include &lt;linux/unaligned.h&gt;</div><div class='ctx'> #include "ecryptfs_kernel.h"</div><div class='ctx'> </div><div class='del'>-static int lock_parent(struct dentry *dentry,</div><div class='del'>-		       struct dentry **lower_dentry,</div><div class='del'>-		       struct inode **lower_dir)</div><div class='add'>+static struct dentry *ecryptfs_start_creating_dentry(struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *lower_dir_dentry;</div><div class='add'>+	struct dentry *parent = dget_parent(dentry);</div><div class='add'>+	struct dentry *ret;</div><div class='add'>+</div><div class='add'>+	ret = start_creating_dentry(ecryptfs_dentry_to_lower(parent),</div><div class='add'>+				    ecryptfs_dentry_to_lower(dentry));</div><div class='add'>+	dput(parent);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	lower_dir_dentry = ecryptfs_dentry_to_lower(dentry-&gt;d_parent);</div><div class='del'>-	*lower_dir = d_inode(lower_dir_dentry);</div><div class='del'>-	*lower_dentry = ecryptfs_dentry_to_lower(dentry);</div><div class='add'>+static struct dentry *ecryptfs_start_removing_dentry(struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	struct dentry *parent = dget_parent(dentry);</div><div class='add'>+	struct dentry *ret;</div><div class='ctx'> </div><div class='del'>-	inode_lock_nested(*lower_dir, I_MUTEX_PARENT);</div><div class='del'>-	return (*lower_dentry)-&gt;d_parent == lower_dir_dentry ? 0 : -EINVAL;</div><div class='add'>+	ret = start_removing_dentry(ecryptfs_dentry_to_lower(parent),</div><div class='add'>+				    ecryptfs_dentry_to_lower(dentry));</div><div class='add'>+	dput(parent);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ecryptfs_inode_test(struct inode *inode, void *lower_inode)</div><div class='hunk'>@@ -76,6 +86,14 @@ static struct inode *__ecryptfs_get_inode(struct inode *lower_inode,</div><div class='ctx'> </div><div class='ctx'> 	if (lower_inode-&gt;i_sb != ecryptfs_superblock_to_lower(sb))</div><div class='ctx'> 		return ERR_PTR(-EXDEV);</div><div class='add'>+</div><div class='add'>+	/* Reject dealing with casefold directories. */</div><div class='add'>+	if (IS_CASEFOLDED(lower_inode)) {</div><div class='add'>+		pr_err_ratelimited("%s: Can't handle casefolded directory.\n",</div><div class='add'>+				   __func__);</div><div class='add'>+		return ERR_PTR(-EREMOTE);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (!igrab(lower_inode))</div><div class='ctx'> 		return ERR_PTR(-ESTALE);</div><div class='ctx'> 	inode = iget5_locked(sb, (unsigned long)lower_inode,</div><div class='hunk'>@@ -85,7 +103,7 @@ static struct inode *__ecryptfs_get_inode(struct inode *lower_inode,</div><div class='ctx'> 		iput(lower_inode);</div><div class='ctx'> 		return ERR_PTR(-EACCES);</div><div class='ctx'> 	}</div><div class='del'>-	if (!(inode-&gt;i_state &amp; I_NEW))</div><div class='add'>+	if (!(inode_state_read_once(inode) &amp; I_NEW))</div><div class='ctx'> 		iput(lower_inode);</div><div class='ctx'> </div><div class='ctx'> 	return inode;</div><div class='hunk'>@@ -96,7 +114,7 @@ struct inode *ecryptfs_get_inode(struct inode *lower_inode,</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = __ecryptfs_get_inode(lower_inode, sb);</div><div class='ctx'> </div><div class='del'>-	if (!IS_ERR(inode) &amp;&amp; (inode-&gt;i_state &amp; I_NEW))</div><div class='add'>+	if (!IS_ERR(inode) &amp;&amp; (inode_state_read_once(inode) &amp; I_NEW))</div><div class='ctx'> 		unlock_new_inode(inode);</div><div class='ctx'> </div><div class='ctx'> 	return inode;</div><div class='hunk'>@@ -131,25 +149,21 @@ static int ecryptfs_do_unlink(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	struct inode *lower_dir;</div><div class='ctx'> 	int rc;</div><div class='ctx'> </div><div class='del'>-	rc = lock_parent(dentry, &amp;lower_dentry, &amp;lower_dir);</div><div class='del'>-	dget(lower_dentry);	// don't even try to make the lower negative</div><div class='del'>-	if (!rc) {</div><div class='del'>-		if (d_unhashed(lower_dentry))</div><div class='del'>-			rc = -EINVAL;</div><div class='del'>-		else</div><div class='del'>-			rc = vfs_unlink(&amp;init_user_ns, lower_dir, lower_dentry,</div><div class='del'>-					NULL);</div><div class='del'>-	}</div><div class='add'>+	lower_dentry = ecryptfs_start_removing_dentry(dentry);</div><div class='add'>+	if (IS_ERR(lower_dentry))</div><div class='add'>+		return PTR_ERR(lower_dentry);</div><div class='add'>+</div><div class='add'>+	lower_dir = lower_dentry-&gt;d_parent-&gt;d_inode;</div><div class='add'>+	rc = vfs_unlink(&amp;nop_mnt_idmap, lower_dir, lower_dentry, NULL);</div><div class='ctx'> 	if (rc) {</div><div class='ctx'> 		printk(KERN_ERR "Error in vfs_unlink; rc = [%d]\n", rc);</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> 	fsstack_copy_attr_times(dir, lower_dir);</div><div class='ctx'> 	set_nlink(inode, ecryptfs_inode_to_lower(inode)-&gt;i_nlink);</div><div class='del'>-	inode-&gt;i_ctime = dir-&gt;i_ctime;</div><div class='add'>+	inode_set_ctime_to_ts(inode, inode_get_ctime(dir));</div><div class='ctx'> out_unlock:</div><div class='del'>-	dput(lower_dentry);</div><div class='del'>-	inode_unlock(lower_dir);</div><div class='add'>+	end_removing(lower_dentry);</div><div class='ctx'> 	if (!rc)</div><div class='ctx'> 		d_drop(dentry);</div><div class='ctx'> 	return rc;</div><div class='hunk'>@@ -176,10 +190,11 @@ ecryptfs_do_create(struct inode *directory_inode,</div><div class='ctx'> 	struct inode *lower_dir;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> </div><div class='del'>-	rc = lock_parent(ecryptfs_dentry, &amp;lower_dentry, &amp;lower_dir);</div><div class='del'>-	if (!rc)</div><div class='del'>-		rc = vfs_create(&amp;init_user_ns, lower_dir,</div><div class='del'>-				lower_dentry, mode, true);</div><div class='add'>+	lower_dentry = ecryptfs_start_creating_dentry(ecryptfs_dentry);</div><div class='add'>+	if (IS_ERR(lower_dentry))</div><div class='add'>+		return ERR_CAST(lower_dentry);</div><div class='add'>+	lower_dir = lower_dentry-&gt;d_parent-&gt;d_inode;</div><div class='add'>+	rc = vfs_create(&amp;nop_mnt_idmap, lower_dentry, mode, NULL);</div><div class='ctx'> 	if (rc) {</div><div class='ctx'> 		printk(KERN_ERR "%s: Failure to create dentry in lower fs; "</div><div class='ctx'> 		       "rc = [%d]\n", __func__, rc);</div><div class='hunk'>@@ -189,13 +204,13 @@ ecryptfs_do_create(struct inode *directory_inode,</div><div class='ctx'> 	inode = __ecryptfs_get_inode(d_inode(lower_dentry),</div><div class='ctx'> 				     directory_inode-&gt;i_sb);</div><div class='ctx'> 	if (IS_ERR(inode)) {</div><div class='del'>-		vfs_unlink(&amp;init_user_ns, lower_dir, lower_dentry, NULL);</div><div class='add'>+		vfs_unlink(&amp;nop_mnt_idmap, lower_dir, lower_dentry, NULL);</div><div class='ctx'> 		goto out_lock;</div><div class='ctx'> 	}</div><div class='ctx'> 	fsstack_copy_attr_times(directory_inode, lower_dir);</div><div class='ctx'> 	fsstack_copy_inode_size(directory_inode, lower_dir);</div><div class='ctx'> out_lock:</div><div class='del'>-	inode_unlock(lower_dir);</div><div class='add'>+	end_creating(lower_dentry);</div><div class='ctx'> 	return inode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -251,7 +266,7 @@ out:</div><div class='ctx'>  * Returns zero on success; non-zero on error condition</div><div class='ctx'>  */</div><div class='ctx'> static int</div><div class='del'>-ecryptfs_create(struct user_namespace *mnt_userns,</div><div class='add'>+ecryptfs_create(struct mnt_idmap *idmap,</div><div class='ctx'> 		struct inode *directory_inode, struct dentry *ecryptfs_dentry,</div><div class='ctx'> 		umode_t mode, bool excl)</div><div class='ctx'> {</div><div class='hunk'>@@ -317,24 +332,15 @@ static int ecryptfs_i_size_read(struct dentry *dentry, struct inode *inode)</div><div class='ctx'> static struct dentry *ecryptfs_lookup_interpose(struct dentry *dentry,</div><div class='ctx'> 				     struct dentry *lower_dentry)</div><div class='ctx'> {</div><div class='del'>-	struct path *path = ecryptfs_dentry_to_lower_path(dentry-&gt;d_parent);</div><div class='add'>+	struct dentry *lower_parent = ecryptfs_dentry_to_lower(dentry-&gt;d_parent);</div><div class='ctx'> 	struct inode *inode, *lower_inode;</div><div class='del'>-	struct ecryptfs_dentry_info *dentry_info;</div><div class='ctx'> 	int rc = 0;</div><div class='ctx'> </div><div class='del'>-	dentry_info = kmem_cache_alloc(ecryptfs_dentry_info_cache, GFP_KERNEL);</div><div class='del'>-	if (!dentry_info) {</div><div class='del'>-		dput(lower_dentry);</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	fsstack_copy_attr_atime(d_inode(dentry-&gt;d_parent),</div><div class='del'>-				d_inode(path-&gt;dentry));</div><div class='add'>+				d_inode(lower_parent));</div><div class='ctx'> 	BUG_ON(!d_count(lower_dentry));</div><div class='ctx'> </div><div class='del'>-	ecryptfs_set_dentry_private(dentry, dentry_info);</div><div class='del'>-	dentry_info-&gt;lower_path.mnt = mntget(path-&gt;mnt);</div><div class='del'>-	dentry_info-&gt;lower_path.dentry = lower_dentry;</div><div class='add'>+	ecryptfs_set_dentry_lower(dentry, lower_dentry);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * negative dentry can go positive under us here - its parent is not</div><div class='hunk'>@@ -363,7 +369,7 @@ static struct dentry *ecryptfs_lookup_interpose(struct dentry *dentry,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (inode-&gt;i_state &amp; I_NEW)</div><div class='add'>+	if (inode_state_read_once(inode) &amp; I_NEW)</div><div class='ctx'> 		unlock_new_inode(inode);</div><div class='ctx'> 	return d_splice_alias(inode, dentry);</div><div class='ctx'> }</div><div class='hunk'>@@ -384,8 +390,8 @@ static struct dentry *ecryptfs_lookup(struct inode *ecryptfs_dir_inode,</div><div class='ctx'> 	char *encrypted_and_encoded_name = NULL;</div><div class='ctx'> 	struct ecryptfs_mount_crypt_stat *mount_crypt_stat;</div><div class='ctx'> 	struct dentry *lower_dir_dentry, *lower_dentry;</div><div class='del'>-	const char *name = ecryptfs_dentry-&gt;d_name.name;</div><div class='del'>-	size_t len = ecryptfs_dentry-&gt;d_name.len;</div><div class='add'>+	struct qstr qname = QSTR_INIT(ecryptfs_dentry-&gt;d_name.name,</div><div class='add'>+				      ecryptfs_dentry-&gt;d_name.len);</div><div class='ctx'> 	struct dentry *res;</div><div class='ctx'> 	int rc = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -394,23 +400,25 @@ static struct dentry *ecryptfs_lookup(struct inode *ecryptfs_dir_inode,</div><div class='ctx'> 	mount_crypt_stat = &amp;ecryptfs_superblock_to_private(</div><div class='ctx'> 				ecryptfs_dentry-&gt;d_sb)-&gt;mount_crypt_stat;</div><div class='ctx'> 	if (mount_crypt_stat-&gt;flags &amp; ECRYPTFS_GLOBAL_ENCRYPT_FILENAMES) {</div><div class='add'>+		size_t len = qname.len;</div><div class='ctx'> 		rc = ecryptfs_encrypt_and_encode_filename(</div><div class='ctx'> 			&amp;encrypted_and_encoded_name, &amp;len,</div><div class='del'>-			mount_crypt_stat, name, len);</div><div class='add'>+			mount_crypt_stat, qname.name, len);</div><div class='ctx'> 		if (rc) {</div><div class='ctx'> 			printk(KERN_ERR "%s: Error attempting to encrypt and encode "</div><div class='ctx'> 			       "filename; rc = [%d]\n", __func__, rc);</div><div class='ctx'> 			return ERR_PTR(rc);</div><div class='ctx'> 		}</div><div class='del'>-		name = encrypted_and_encoded_name;</div><div class='add'>+		qname.name = encrypted_and_encoded_name;</div><div class='add'>+		qname.len = len;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	lower_dentry = lookup_one_len_unlocked(name, lower_dir_dentry, len);</div><div class='add'>+	lower_dentry = lookup_noperm_unlocked(&amp;qname, lower_dir_dentry);</div><div class='ctx'> 	if (IS_ERR(lower_dentry)) {</div><div class='del'>-		ecryptfs_printk(KERN_DEBUG, "%s: lookup_one_len() returned "</div><div class='add'>+		ecryptfs_printk(KERN_DEBUG, "%s: lookup_noperm() returned "</div><div class='ctx'> 				"[%ld] on lower_dentry = [%s]\n", __func__,</div><div class='ctx'> 				PTR_ERR(lower_dentry),</div><div class='del'>-				name);</div><div class='add'>+				qname.name);</div><div class='ctx'> 		res = ERR_CAST(lower_dentry);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		res = ecryptfs_lookup_interpose(ecryptfs_dentry, lower_dentry);</div><div class='hunk'>@@ -430,10 +438,12 @@ static int ecryptfs_link(struct dentry *old_dentry, struct inode *dir,</div><div class='ctx'> </div><div class='ctx'> 	file_size_save = i_size_read(d_inode(old_dentry));</div><div class='ctx'> 	lower_old_dentry = ecryptfs_dentry_to_lower(old_dentry);</div><div class='del'>-	rc = lock_parent(new_dentry, &amp;lower_new_dentry, &amp;lower_dir);</div><div class='del'>-	if (!rc)</div><div class='del'>-		rc = vfs_link(lower_old_dentry, &amp;init_user_ns, lower_dir,</div><div class='del'>-			      lower_new_dentry, NULL);</div><div class='add'>+	lower_new_dentry = ecryptfs_start_creating_dentry(new_dentry);</div><div class='add'>+	if (IS_ERR(lower_new_dentry))</div><div class='add'>+		return PTR_ERR(lower_new_dentry);</div><div class='add'>+	lower_dir = lower_new_dentry-&gt;d_parent-&gt;d_inode;</div><div class='add'>+	rc = vfs_link(lower_old_dentry, &amp;nop_mnt_idmap, lower_dir,</div><div class='add'>+		      lower_new_dentry, NULL);</div><div class='ctx'> 	if (rc || d_really_is_negative(lower_new_dentry))</div><div class='ctx'> 		goto out_lock;</div><div class='ctx'> 	rc = ecryptfs_interpose(lower_new_dentry, new_dentry, dir-&gt;i_sb);</div><div class='hunk'>@@ -445,7 +455,7 @@ static int ecryptfs_link(struct dentry *old_dentry, struct inode *dir,</div><div class='ctx'> 		  ecryptfs_inode_to_lower(d_inode(old_dentry))-&gt;i_nlink);</div><div class='ctx'> 	i_size_write(d_inode(new_dentry), file_size_save);</div><div class='ctx'> out_lock:</div><div class='del'>-	inode_unlock(lower_dir);</div><div class='add'>+	end_creating(lower_new_dentry);</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -454,7 +464,7 @@ static int ecryptfs_unlink(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	return ecryptfs_do_unlink(dir, dentry, d_inode(dentry));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ecryptfs_symlink(struct user_namespace *mnt_userns,</div><div class='add'>+static int ecryptfs_symlink(struct mnt_idmap *idmap,</div><div class='ctx'> 			    struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 			    const char *symname)</div><div class='ctx'> {</div><div class='hunk'>@@ -465,9 +475,11 @@ static int ecryptfs_symlink(struct user_namespace *mnt_userns,</div><div class='ctx'> 	size_t encoded_symlen;</div><div class='ctx'> 	struct ecryptfs_mount_crypt_stat *mount_crypt_stat = NULL;</div><div class='ctx'> </div><div class='del'>-	rc = lock_parent(dentry, &amp;lower_dentry, &amp;lower_dir);</div><div class='del'>-	if (rc)</div><div class='del'>-		goto out_lock;</div><div class='add'>+	lower_dentry = ecryptfs_start_creating_dentry(dentry);</div><div class='add'>+	if (IS_ERR(lower_dentry))</div><div class='add'>+		return PTR_ERR(lower_dentry);</div><div class='add'>+	lower_dir = lower_dentry-&gt;d_parent-&gt;d_inode;</div><div class='add'>+</div><div class='ctx'> 	mount_crypt_stat = &amp;ecryptfs_superblock_to_private(</div><div class='ctx'> 		dir-&gt;i_sb)-&gt;mount_crypt_stat;</div><div class='ctx'> 	rc = ecryptfs_encrypt_and_encode_filename(&amp;encoded_symname,</div><div class='hunk'>@@ -476,8 +488,8 @@ static int ecryptfs_symlink(struct user_namespace *mnt_userns,</div><div class='ctx'> 						  strlen(symname));</div><div class='ctx'> 	if (rc)</div><div class='ctx'> 		goto out_lock;</div><div class='del'>-	rc = vfs_symlink(&amp;init_user_ns, lower_dir, lower_dentry,</div><div class='del'>-			 encoded_symname);</div><div class='add'>+	rc = vfs_symlink(&amp;nop_mnt_idmap, lower_dir, lower_dentry,</div><div class='add'>+			 encoded_symname, NULL);</div><div class='ctx'> 	kfree(encoded_symname);</div><div class='ctx'> 	if (rc || d_really_is_negative(lower_dentry))</div><div class='ctx'> 		goto out_lock;</div><div class='hunk'>@@ -487,24 +499,32 @@ static int ecryptfs_symlink(struct user_namespace *mnt_userns,</div><div class='ctx'> 	fsstack_copy_attr_times(dir, lower_dir);</div><div class='ctx'> 	fsstack_copy_inode_size(dir, lower_dir);</div><div class='ctx'> out_lock:</div><div class='del'>-	inode_unlock(lower_dir);</div><div class='add'>+	end_creating(lower_dentry);</div><div class='ctx'> 	if (d_really_is_negative(dentry))</div><div class='ctx'> 		d_drop(dentry);</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ecryptfs_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-			  struct dentry *dentry, umode_t mode)</div><div class='add'>+static struct dentry *ecryptfs_mkdir(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+				     struct dentry *dentry, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	int rc;</div><div class='ctx'> 	struct dentry *lower_dentry;</div><div class='add'>+	struct dentry *lower_dir_dentry;</div><div class='ctx'> 	struct inode *lower_dir;</div><div class='ctx'> </div><div class='del'>-	rc = lock_parent(dentry, &amp;lower_dentry, &amp;lower_dir);</div><div class='del'>-	if (!rc)</div><div class='del'>-		rc = vfs_mkdir(&amp;init_user_ns, lower_dir,</div><div class='del'>-			       lower_dentry, mode);</div><div class='del'>-	if (rc || d_really_is_negative(lower_dentry))</div><div class='add'>+	lower_dentry = ecryptfs_start_creating_dentry(dentry);</div><div class='add'>+	if (IS_ERR(lower_dentry))</div><div class='add'>+		return lower_dentry;</div><div class='add'>+	lower_dir_dentry = dget(lower_dentry-&gt;d_parent);</div><div class='add'>+	lower_dir = lower_dir_dentry-&gt;d_inode;</div><div class='add'>+	lower_dentry = vfs_mkdir(&amp;nop_mnt_idmap, lower_dir,</div><div class='add'>+				 lower_dentry, mode, NULL);</div><div class='add'>+	rc = PTR_ERR(lower_dentry);</div><div class='add'>+	if (IS_ERR(lower_dentry))</div><div class='add'>+		goto out;</div><div class='add'>+	rc = 0;</div><div class='add'>+	if (d_unhashed(lower_dentry))</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	rc = ecryptfs_interpose(lower_dentry, dentry, dir-&gt;i_sb);</div><div class='ctx'> 	if (rc)</div><div class='hunk'>@@ -513,10 +533,10 @@ static int ecryptfs_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	fsstack_copy_inode_size(dir, lower_dir);</div><div class='ctx'> 	set_nlink(dir, lower_dir-&gt;i_nlink);</div><div class='ctx'> out:</div><div class='del'>-	inode_unlock(lower_dir);</div><div class='add'>+	end_creating(lower_dentry);</div><div class='ctx'> 	if (d_really_is_negative(dentry))</div><div class='ctx'> 		d_drop(dentry);</div><div class='del'>-	return rc;</div><div class='add'>+	return ERR_PTR(rc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ecryptfs_rmdir(struct inode *dir, struct dentry *dentry)</div><div class='hunk'>@@ -525,38 +545,37 @@ static int ecryptfs_rmdir(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	struct inode *lower_dir;</div><div class='ctx'> 	int rc;</div><div class='ctx'> </div><div class='del'>-	rc = lock_parent(dentry, &amp;lower_dentry, &amp;lower_dir);</div><div class='del'>-	dget(lower_dentry);	// don't even try to make the lower negative</div><div class='del'>-	if (!rc) {</div><div class='del'>-		if (d_unhashed(lower_dentry))</div><div class='del'>-			rc = -EINVAL;</div><div class='del'>-		else</div><div class='del'>-			rc = vfs_rmdir(&amp;init_user_ns, lower_dir, lower_dentry);</div><div class='del'>-	}</div><div class='add'>+	lower_dentry = ecryptfs_start_removing_dentry(dentry);</div><div class='add'>+	if (IS_ERR(lower_dentry))</div><div class='add'>+		return PTR_ERR(lower_dentry);</div><div class='add'>+	lower_dir = lower_dentry-&gt;d_parent-&gt;d_inode;</div><div class='add'>+</div><div class='add'>+	rc = vfs_rmdir(&amp;nop_mnt_idmap, lower_dir, lower_dentry, NULL);</div><div class='ctx'> 	if (!rc) {</div><div class='ctx'> 		clear_nlink(d_inode(dentry));</div><div class='ctx'> 		fsstack_copy_attr_times(dir, lower_dir);</div><div class='ctx'> 		set_nlink(dir, lower_dir-&gt;i_nlink);</div><div class='ctx'> 	}</div><div class='del'>-	dput(lower_dentry);</div><div class='del'>-	inode_unlock(lower_dir);</div><div class='add'>+	end_removing(lower_dentry);</div><div class='ctx'> 	if (!rc)</div><div class='ctx'> 		d_drop(dentry);</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-ecryptfs_mknod(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+ecryptfs_mknod(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 	       struct dentry *dentry, umode_t mode, dev_t dev)</div><div class='ctx'> {</div><div class='ctx'> 	int rc;</div><div class='ctx'> 	struct dentry *lower_dentry;</div><div class='ctx'> 	struct inode *lower_dir;</div><div class='ctx'> </div><div class='del'>-	rc = lock_parent(dentry, &amp;lower_dentry, &amp;lower_dir);</div><div class='del'>-	if (!rc)</div><div class='del'>-		rc = vfs_mknod(&amp;init_user_ns, lower_dir,</div><div class='del'>-			       lower_dentry, mode, dev);</div><div class='add'>+	lower_dentry = ecryptfs_start_creating_dentry(dentry);</div><div class='add'>+	if (IS_ERR(lower_dentry))</div><div class='add'>+		return PTR_ERR(lower_dentry);</div><div class='add'>+	lower_dir = lower_dentry-&gt;d_parent-&gt;d_inode;</div><div class='add'>+</div><div class='add'>+	rc = vfs_mknod(&amp;nop_mnt_idmap, lower_dir, lower_dentry, mode, dev, NULL);</div><div class='ctx'> 	if (rc || d_really_is_negative(lower_dentry))</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	rc = ecryptfs_interpose(lower_dentry, dentry, dir-&gt;i_sb);</div><div class='hunk'>@@ -565,14 +584,14 @@ ecryptfs_mknod(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	fsstack_copy_attr_times(dir, lower_dir);</div><div class='ctx'> 	fsstack_copy_inode_size(dir, lower_dir);</div><div class='ctx'> out:</div><div class='del'>-	inode_unlock(lower_dir);</div><div class='add'>+	end_removing(lower_dentry);</div><div class='ctx'> 	if (d_really_is_negative(dentry))</div><div class='ctx'> 		d_drop(dentry);</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-ecryptfs_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='add'>+ecryptfs_rename(struct mnt_idmap *idmap, struct inode *old_dir,</div><div class='ctx'> 		struct dentry *old_dentry, struct inode *new_dir,</div><div class='ctx'> 		struct dentry *new_dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='hunk'>@@ -581,7 +600,6 @@ ecryptfs_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> 	struct dentry *lower_new_dentry;</div><div class='ctx'> 	struct dentry *lower_old_dir_dentry;</div><div class='ctx'> 	struct dentry *lower_new_dir_dentry;</div><div class='del'>-	struct dentry *trap;</div><div class='ctx'> 	struct inode *target_inode;</div><div class='ctx'> 	struct renamedata rd = {};</div><div class='ctx'> </div><div class='hunk'>@@ -596,30 +614,13 @@ ecryptfs_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> </div><div class='ctx'> 	target_inode = d_inode(new_dentry);</div><div class='ctx'> </div><div class='del'>-	trap = lock_rename(lower_old_dir_dentry, lower_new_dir_dentry);</div><div class='del'>-	dget(lower_new_dentry);</div><div class='del'>-	rc = -EINVAL;</div><div class='del'>-	if (lower_old_dentry-&gt;d_parent != lower_old_dir_dentry)</div><div class='del'>-		goto out_lock;</div><div class='del'>-	if (lower_new_dentry-&gt;d_parent != lower_new_dir_dentry)</div><div class='del'>-		goto out_lock;</div><div class='del'>-	if (d_unhashed(lower_old_dentry) || d_unhashed(lower_new_dentry))</div><div class='del'>-		goto out_lock;</div><div class='del'>-	/* source should not be ancestor of target */</div><div class='del'>-	if (trap == lower_old_dentry)</div><div class='del'>-		goto out_lock;</div><div class='del'>-	/* target should not be ancestor of source */</div><div class='del'>-	if (trap == lower_new_dentry) {</div><div class='del'>-		rc = -ENOTEMPTY;</div><div class='del'>-		goto out_lock;</div><div class='del'>-	}</div><div class='add'>+	rd.mnt_idmap  = &amp;nop_mnt_idmap;</div><div class='add'>+	rd.old_parent = lower_old_dir_dentry;</div><div class='add'>+	rd.new_parent = lower_new_dir_dentry;</div><div class='add'>+	rc = start_renaming_two_dentries(&amp;rd, lower_old_dentry, lower_new_dentry);</div><div class='add'>+	if (rc)</div><div class='add'>+		return rc;</div><div class='ctx'> </div><div class='del'>-	rd.old_mnt_userns	= &amp;init_user_ns;</div><div class='del'>-	rd.old_dir		= d_inode(lower_old_dir_dentry);</div><div class='del'>-	rd.old_dentry		= lower_old_dentry;</div><div class='del'>-	rd.new_mnt_userns	= &amp;init_user_ns;</div><div class='del'>-	rd.new_dir		= d_inode(lower_new_dir_dentry);</div><div class='del'>-	rd.new_dentry		= lower_new_dentry;</div><div class='ctx'> 	rc = vfs_rename(&amp;rd);</div><div class='ctx'> 	if (rc)</div><div class='ctx'> 		goto out_lock;</div><div class='hunk'>@@ -630,8 +631,7 @@ ecryptfs_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> 	if (new_dir != old_dir)</div><div class='ctx'> 		fsstack_copy_attr_all(old_dir, d_inode(lower_old_dir_dentry));</div><div class='ctx'> out_lock:</div><div class='del'>-	dput(lower_new_dentry);</div><div class='del'>-	unlock_rename(lower_old_dir_dentry, lower_new_dir_dentry);</div><div class='add'>+	end_renaming(&amp;rd);</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -854,7 +854,7 @@ int ecryptfs_truncate(struct dentry *dentry, loff_t new_length)</div><div class='ctx'> 		struct dentry *lower_dentry = ecryptfs_dentry_to_lower(dentry);</div><div class='ctx'> </div><div class='ctx'> 		inode_lock(d_inode(lower_dentry));</div><div class='del'>-		rc = notify_change(&amp;init_user_ns, lower_dentry,</div><div class='add'>+		rc = notify_change(&amp;nop_mnt_idmap, lower_dentry,</div><div class='ctx'> 				   &amp;lower_ia, NULL);</div><div class='ctx'> 		inode_unlock(d_inode(lower_dentry));</div><div class='ctx'> 	}</div><div class='hunk'>@@ -862,16 +862,16 @@ int ecryptfs_truncate(struct dentry *dentry, loff_t new_length)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-ecryptfs_permission(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='add'>+ecryptfs_permission(struct mnt_idmap *idmap, struct inode *inode,</div><div class='ctx'> 		    int mask)</div><div class='ctx'> {</div><div class='del'>-	return inode_permission(&amp;init_user_ns,</div><div class='add'>+	return inode_permission(&amp;nop_mnt_idmap,</div><div class='ctx'> 				ecryptfs_inode_to_lower(inode), mask);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * ecryptfs_setattr</div><div class='del'>- * @mnt_userns: user namespace of the target mount</div><div class='add'>+ * @idmap: idmap of the target mount</div><div class='ctx'>  * @dentry: dentry handle to the inode to modify</div><div class='ctx'>  * @ia: Structure with flags of what to change and values</div><div class='ctx'>  *</div><div class='hunk'>@@ -882,7 +882,7 @@ ecryptfs_permission(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='ctx'>  * All other metadata changes will be passed right to the lower filesystem,</div><div class='ctx'>  * and we will just update our inode to look like the lower.</div><div class='ctx'>  */</div><div class='del'>-static int ecryptfs_setattr(struct user_namespace *mnt_userns,</div><div class='add'>+static int ecryptfs_setattr(struct mnt_idmap *idmap,</div><div class='ctx'> 			    struct dentry *dentry, struct iattr *ia)</div><div class='ctx'> {</div><div class='ctx'> 	int rc = 0;</div><div class='hunk'>@@ -893,11 +893,8 @@ static int ecryptfs_setattr(struct user_namespace *mnt_userns,</div><div class='ctx'> 	struct ecryptfs_crypt_stat *crypt_stat;</div><div class='ctx'> </div><div class='ctx'> 	crypt_stat = &amp;ecryptfs_inode_to_private(d_inode(dentry))-&gt;crypt_stat;</div><div class='del'>-	if (!(crypt_stat-&gt;flags &amp; ECRYPTFS_STRUCT_INITIALIZED)) {</div><div class='del'>-		rc = ecryptfs_init_crypt_stat(crypt_stat);</div><div class='del'>-		if (rc)</div><div class='del'>-			return rc;</div><div class='del'>-	}</div><div class='add'>+	if (!(crypt_stat-&gt;flags &amp; ECRYPTFS_STRUCT_INITIALIZED))</div><div class='add'>+		ecryptfs_init_crypt_stat(crypt_stat);</div><div class='ctx'> 	inode = d_inode(dentry);</div><div class='ctx'> 	lower_inode = ecryptfs_inode_to_lower(inode);</div><div class='ctx'> 	lower_dentry = ecryptfs_dentry_to_lower(dentry);</div><div class='hunk'>@@ -937,7 +934,7 @@ static int ecryptfs_setattr(struct user_namespace *mnt_userns,</div><div class='ctx'> 	}</div><div class='ctx'> 	mutex_unlock(&amp;crypt_stat-&gt;cs_mutex);</div><div class='ctx'> </div><div class='del'>-	rc = setattr_prepare(&amp;init_user_ns, dentry, ia);</div><div class='add'>+	rc = setattr_prepare(&amp;nop_mnt_idmap, dentry, ia);</div><div class='ctx'> 	if (rc)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	if (ia-&gt;ia_valid &amp; ATTR_SIZE) {</div><div class='hunk'>@@ -963,14 +960,14 @@ static int ecryptfs_setattr(struct user_namespace *mnt_userns,</div><div class='ctx'> 		lower_ia.ia_valid &amp;= ~ATTR_MODE;</div><div class='ctx'> </div><div class='ctx'> 	inode_lock(d_inode(lower_dentry));</div><div class='del'>-	rc = notify_change(&amp;init_user_ns, lower_dentry, &amp;lower_ia, NULL);</div><div class='add'>+	rc = notify_change(&amp;nop_mnt_idmap, lower_dentry, &amp;lower_ia, NULL);</div><div class='ctx'> 	inode_unlock(d_inode(lower_dentry));</div><div class='ctx'> out:</div><div class='ctx'> 	fsstack_copy_attr_all(inode, lower_inode);</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ecryptfs_getattr_link(struct user_namespace *mnt_userns,</div><div class='add'>+static int ecryptfs_getattr_link(struct mnt_idmap *idmap,</div><div class='ctx'> 				 const struct path *path, struct kstat *stat,</div><div class='ctx'> 				 u32 request_mask, unsigned int flags)</div><div class='ctx'> {</div><div class='hunk'>@@ -980,7 +977,7 @@ static int ecryptfs_getattr_link(struct user_namespace *mnt_userns,</div><div class='ctx'> </div><div class='ctx'> 	mount_crypt_stat = &amp;ecryptfs_superblock_to_private(</div><div class='ctx'> 						dentry-&gt;d_sb)-&gt;mount_crypt_stat;</div><div class='del'>-	generic_fillattr(&amp;init_user_ns, d_inode(dentry), stat);</div><div class='add'>+	generic_fillattr(&amp;nop_mnt_idmap, request_mask, d_inode(dentry), stat);</div><div class='ctx'> 	if (mount_crypt_stat-&gt;flags &amp; ECRYPTFS_GLOBAL_ENCRYPT_FILENAMES) {</div><div class='ctx'> 		char *target;</div><div class='ctx'> 		size_t targetsiz;</div><div class='hunk'>@@ -996,20 +993,21 @@ static int ecryptfs_getattr_link(struct user_namespace *mnt_userns,</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ecryptfs_getattr(struct user_namespace *mnt_userns,</div><div class='add'>+static int ecryptfs_getattr(struct mnt_idmap *idmap,</div><div class='ctx'> 			    const struct path *path, struct kstat *stat,</div><div class='ctx'> 			    u32 request_mask, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dentry = path-&gt;dentry;</div><div class='ctx'> 	struct kstat lower_stat;</div><div class='add'>+	struct path lower_path = ecryptfs_lower_path(dentry);</div><div class='ctx'> 	int rc;</div><div class='ctx'> </div><div class='del'>-	rc = vfs_getattr(ecryptfs_dentry_to_lower_path(dentry), &amp;lower_stat,</div><div class='del'>-			 request_mask, flags);</div><div class='add'>+	rc = vfs_getattr_nosec(&amp;lower_path, &amp;lower_stat, request_mask, flags);</div><div class='ctx'> 	if (!rc) {</div><div class='ctx'> 		fsstack_copy_attr_all(d_inode(dentry),</div><div class='ctx'> 				      ecryptfs_inode_to_lower(d_inode(dentry)));</div><div class='del'>-		generic_fillattr(&amp;init_user_ns, d_inode(dentry), stat);</div><div class='add'>+		generic_fillattr(&amp;nop_mnt_idmap, request_mask,</div><div class='add'>+				 d_inode(dentry), stat);</div><div class='ctx'> 		stat-&gt;blocks = lower_stat.blocks;</div><div class='ctx'> 	}</div><div class='ctx'> 	return rc;</div><div class='hunk'>@@ -1031,7 +1029,7 @@ ecryptfs_setxattr(struct dentry *dentry, struct inode *inode,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	inode_lock(lower_inode);</div><div class='del'>-	rc = __vfs_setxattr_locked(&amp;init_user_ns, lower_dentry, name, value, size, flags, NULL);</div><div class='add'>+	rc = __vfs_setxattr_locked(&amp;nop_mnt_idmap, lower_dentry, name, value, size, flags, NULL);</div><div class='ctx'> 	inode_unlock(lower_inode);</div><div class='ctx'> 	if (!rc &amp;&amp; inode)</div><div class='ctx'> 		fsstack_copy_attr_all(inode, lower_inode);</div><div class='hunk'>@@ -1097,29 +1095,51 @@ static int ecryptfs_removexattr(struct dentry *dentry, struct inode *inode,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	inode_lock(lower_inode);</div><div class='del'>-	rc = __vfs_removexattr(&amp;init_user_ns, lower_dentry, name);</div><div class='add'>+	rc = __vfs_removexattr(&amp;nop_mnt_idmap, lower_dentry, name);</div><div class='ctx'> 	inode_unlock(lower_inode);</div><div class='ctx'> out:</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ecryptfs_fileattr_get(struct dentry *dentry, struct fileattr *fa)</div><div class='add'>+static int ecryptfs_fileattr_get(struct dentry *dentry, struct file_kattr *fa)</div><div class='ctx'> {</div><div class='ctx'> 	return vfs_fileattr_get(ecryptfs_dentry_to_lower(dentry), fa);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ecryptfs_fileattr_set(struct user_namespace *mnt_userns,</div><div class='del'>-				 struct dentry *dentry, struct fileattr *fa)</div><div class='add'>+static int ecryptfs_fileattr_set(struct mnt_idmap *idmap,</div><div class='add'>+				 struct dentry *dentry, struct file_kattr *fa)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *lower_dentry = ecryptfs_dentry_to_lower(dentry);</div><div class='ctx'> 	int rc;</div><div class='ctx'> </div><div class='del'>-	rc = vfs_fileattr_set(&amp;init_user_ns, lower_dentry, fa);</div><div class='add'>+	rc = vfs_fileattr_set(&amp;nop_mnt_idmap, lower_dentry, fa);</div><div class='ctx'> 	fsstack_copy_attr_all(d_inode(dentry), d_inode(lower_dentry));</div><div class='ctx'> </div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static struct posix_acl *ecryptfs_get_acl(struct mnt_idmap *idmap,</div><div class='add'>+					  struct dentry *dentry, int type)</div><div class='add'>+{</div><div class='add'>+	return vfs_get_acl(idmap, ecryptfs_dentry_to_lower(dentry),</div><div class='add'>+			   posix_acl_xattr_name(type));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ecryptfs_set_acl(struct mnt_idmap *idmap,</div><div class='add'>+			    struct dentry *dentry, struct posix_acl *acl,</div><div class='add'>+			    int type)</div><div class='add'>+{</div><div class='add'>+	int rc;</div><div class='add'>+	struct dentry *lower_dentry = ecryptfs_dentry_to_lower(dentry);</div><div class='add'>+	struct inode *lower_inode = d_inode(lower_dentry);</div><div class='add'>+</div><div class='add'>+	rc = vfs_set_acl(&amp;nop_mnt_idmap, lower_dentry,</div><div class='add'>+			 posix_acl_xattr_name(type), acl);</div><div class='add'>+	if (!rc)</div><div class='add'>+		fsstack_copy_attr_all(d_inode(dentry), lower_inode);</div><div class='add'>+	return rc;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> const struct inode_operations ecryptfs_symlink_iops = {</div><div class='ctx'> 	.get_link = ecryptfs_get_link,</div><div class='ctx'> 	.permission = ecryptfs_permission,</div><div class='hunk'>@@ -1143,6 +1163,8 @@ const struct inode_operations ecryptfs_dir_iops = {</div><div class='ctx'> 	.listxattr = ecryptfs_listxattr,</div><div class='ctx'> 	.fileattr_get = ecryptfs_fileattr_get,</div><div class='ctx'> 	.fileattr_set = ecryptfs_fileattr_set,</div><div class='add'>+	.get_acl = ecryptfs_get_acl,</div><div class='add'>+	.set_acl = ecryptfs_set_acl,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct inode_operations ecryptfs_main_iops = {</div><div class='hunk'>@@ -1152,6 +1174,8 @@ const struct inode_operations ecryptfs_main_iops = {</div><div class='ctx'> 	.listxattr = ecryptfs_listxattr,</div><div class='ctx'> 	.fileattr_get = ecryptfs_fileattr_get,</div><div class='ctx'> 	.fileattr_set = ecryptfs_fileattr_set,</div><div class='add'>+	.get_acl = ecryptfs_get_acl,</div><div class='add'>+	.set_acl = ecryptfs_set_acl,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static int ecryptfs_xattr_get(const struct xattr_handler *handler,</div><div class='hunk'>@@ -1162,7 +1186,7 @@ static int ecryptfs_xattr_get(const struct xattr_handler *handler,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ecryptfs_xattr_set(const struct xattr_handler *handler,</div><div class='del'>-			      struct user_namespace *mnt_userns,</div><div class='add'>+			      struct mnt_idmap *idmap,</div><div class='ctx'> 			      struct dentry *dentry, struct inode *inode,</div><div class='ctx'> 			      const char *name, const void *value, size_t size,</div><div class='ctx'> 			      int flags)</div><div class='hunk'>@@ -1181,7 +1205,7 @@ static const struct xattr_handler ecryptfs_xattr_handler = {</div><div class='ctx'> 	.set = ecryptfs_xattr_set,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-const struct xattr_handler *ecryptfs_xattr_handlers[] = {</div><div class='add'>+const struct xattr_handler * const ecryptfs_xattr_handlers[] = {</div><div class='ctx'> 	&amp;ecryptfs_xattr_handler,</div><div class='ctx'> 	NULL</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/ecryptfs/keystore.c b/fs/ecryptfs/keystore.c<br/>index 3fe41964c0d8..bbf8603242fa 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ecryptfs/keystore.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ecryptfs/keystore.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ecryptfs/keystore.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ecryptfs/keystore.c</a></div><div class='hunk'>@@ -11,7 +11,6 @@</div><div class='ctx'>  *              Trevor S. Highland &lt;trevor.highland@gmail.com&gt;</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-#include &lt;crypto/hash.h&gt;</div><div class='ctx'> #include &lt;crypto/skcipher.h&gt;</div><div class='ctx'> #include &lt;linux/string.h&gt;</div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='hunk'>@@ -300,9 +299,11 @@ write_tag_66_packet(char *signature, u8 cipher_code,</div><div class='ctx'> 	 *         | Key Identifier Size      | 1 or 2 bytes |</div><div class='ctx'> 	 *         | Key Identifier           | arbitrary    |</div><div class='ctx'> 	 *         | File Encryption Key Size | 1 or 2 bytes |</div><div class='add'>+	 *         | Cipher Code              | 1 byte       |</div><div class='ctx'> 	 *         | File Encryption Key      | arbitrary    |</div><div class='add'>+	 *         | Checksum                 | 2 bytes      |</div><div class='ctx'> 	 */</div><div class='del'>-	data_len = (5 + ECRYPTFS_SIG_SIZE_HEX + crypt_stat-&gt;key_size);</div><div class='add'>+	data_len = (8 + ECRYPTFS_SIG_SIZE_HEX + crypt_stat-&gt;key_size);</div><div class='ctx'> 	*packet = kmalloc(data_len, GFP_KERNEL);</div><div class='ctx'> 	message = *packet;</div><div class='ctx'> 	if (!message) {</div><div class='hunk'>@@ -599,10 +600,7 @@ struct ecryptfs_write_tag_70_packet_silly_stack {</div><div class='ctx'> 	struct crypto_skcipher *skcipher_tfm;</div><div class='ctx'> 	struct skcipher_request *skcipher_req;</div><div class='ctx'> 	char iv[ECRYPTFS_MAX_IV_BYTES];</div><div class='del'>-	char hash[ECRYPTFS_TAG_70_DIGEST_SIZE];</div><div class='del'>-	char tmp_hash[ECRYPTFS_TAG_70_DIGEST_SIZE];</div><div class='del'>-	struct crypto_shash *hash_tfm;</div><div class='del'>-	struct shash_desc *hash_desc;</div><div class='add'>+	char hash[MD5_DIGEST_SIZE];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -739,51 +737,15 @@ ecryptfs_write_tag_70_packet(char *dest, size_t *remaining_bytes,</div><div class='ctx'> 		       "password tokens\n", __func__);</div><div class='ctx'> 		goto out_free_unlock;</div><div class='ctx'> 	}</div><div class='del'>-	s-&gt;hash_tfm = crypto_alloc_shash(ECRYPTFS_TAG_70_DIGEST, 0, 0);</div><div class='del'>-	if (IS_ERR(s-&gt;hash_tfm)) {</div><div class='del'>-			rc = PTR_ERR(s-&gt;hash_tfm);</div><div class='del'>-			printk(KERN_ERR "%s: Error attempting to "</div><div class='del'>-			       "allocate hash crypto context; rc = [%d]\n",</div><div class='del'>-			       __func__, rc);</div><div class='del'>-			goto out_free_unlock;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	s-&gt;hash_desc = kmalloc(sizeof(*s-&gt;hash_desc) +</div><div class='del'>-			       crypto_shash_descsize(s-&gt;hash_tfm), GFP_KERNEL);</div><div class='del'>-	if (!s-&gt;hash_desc) {</div><div class='del'>-		rc = -ENOMEM;</div><div class='del'>-		goto out_release_free_unlock;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	s-&gt;hash_desc-&gt;tfm = s-&gt;hash_tfm;</div><div class='del'>-</div><div class='del'>-	rc = crypto_shash_digest(s-&gt;hash_desc,</div><div class='del'>-				 (u8 *)s-&gt;auth_tok-&gt;token.password.session_key_encryption_key,</div><div class='del'>-				 s-&gt;auth_tok-&gt;token.password.session_key_encryption_key_bytes,</div><div class='del'>-				 s-&gt;hash);</div><div class='del'>-	if (rc) {</div><div class='del'>-		printk(KERN_ERR</div><div class='del'>-		       "%s: Error computing crypto hash; rc = [%d]\n",</div><div class='del'>-		       __func__, rc);</div><div class='del'>-		goto out_release_free_unlock;</div><div class='del'>-	}</div><div class='add'>+	md5(s-&gt;auth_tok-&gt;token.password.session_key_encryption_key,</div><div class='add'>+	    s-&gt;auth_tok-&gt;token.password.session_key_encryption_key_bytes,</div><div class='add'>+	    s-&gt;hash);</div><div class='ctx'> 	for (s-&gt;j = 0; s-&gt;j &lt; (s-&gt;num_rand_bytes - 1); s-&gt;j++) {</div><div class='ctx'> 		s-&gt;block_aligned_filename[s-&gt;j] =</div><div class='del'>-			s-&gt;hash[(s-&gt;j % ECRYPTFS_TAG_70_DIGEST_SIZE)];</div><div class='del'>-		if ((s-&gt;j % ECRYPTFS_TAG_70_DIGEST_SIZE)</div><div class='del'>-		    == (ECRYPTFS_TAG_70_DIGEST_SIZE - 1)) {</div><div class='del'>-			rc = crypto_shash_digest(s-&gt;hash_desc, (u8 *)s-&gt;hash,</div><div class='del'>-						ECRYPTFS_TAG_70_DIGEST_SIZE,</div><div class='del'>-						s-&gt;tmp_hash);</div><div class='del'>-			if (rc) {</div><div class='del'>-				printk(KERN_ERR</div><div class='del'>-				       "%s: Error computing crypto hash; "</div><div class='del'>-				       "rc = [%d]\n", __func__, rc);</div><div class='del'>-				goto out_release_free_unlock;</div><div class='del'>-			}</div><div class='del'>-			memcpy(s-&gt;hash, s-&gt;tmp_hash,</div><div class='del'>-			       ECRYPTFS_TAG_70_DIGEST_SIZE);</div><div class='del'>-		}</div><div class='add'>+			s-&gt;hash[s-&gt;j % MD5_DIGEST_SIZE];</div><div class='add'>+		if ((s-&gt;j % MD5_DIGEST_SIZE) == (MD5_DIGEST_SIZE - 1))</div><div class='add'>+			md5(s-&gt;hash, MD5_DIGEST_SIZE, s-&gt;hash);</div><div class='ctx'> 		if (s-&gt;block_aligned_filename[s-&gt;j] == '\0')</div><div class='ctx'> 			s-&gt;block_aligned_filename[s-&gt;j] = ECRYPTFS_NON_NULL;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -796,7 +758,7 @@ ecryptfs_write_tag_70_packet(char *dest, size_t *remaining_bytes,</div><div class='ctx'> 		       "convert filename memory to scatterlist; rc = [%d]. "</div><div class='ctx'> 		       "block_aligned_filename_size = [%zd]\n", __func__, rc,</div><div class='ctx'> 		       s-&gt;block_aligned_filename_size);</div><div class='del'>-		goto out_release_free_unlock;</div><div class='add'>+		goto out_free_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> 	rc = virt_to_scatterlist(&amp;dest[s-&gt;i], s-&gt;block_aligned_filename_size,</div><div class='ctx'> 				 s-&gt;dst_sg, 2);</div><div class='hunk'>@@ -805,7 +767,7 @@ ecryptfs_write_tag_70_packet(char *dest, size_t *remaining_bytes,</div><div class='ctx'> 		       "convert encrypted filename memory to scatterlist; "</div><div class='ctx'> 		       "rc = [%d]. block_aligned_filename_size = [%zd]\n",</div><div class='ctx'> 		       __func__, rc, s-&gt;block_aligned_filename_size);</div><div class='del'>-		goto out_release_free_unlock;</div><div class='add'>+		goto out_free_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> 	/* The characters in the first block effectively do the job</div><div class='ctx'> 	 * of the IV here, so we just use 0's for the IV. Note the</div><div class='hunk'>@@ -823,7 +785,7 @@ ecryptfs_write_tag_70_packet(char *dest, size_t *remaining_bytes,</div><div class='ctx'> 		       rc,</div><div class='ctx'> 		       s-&gt;auth_tok-&gt;token.password.session_key_encryption_key,</div><div class='ctx'> 		       mount_crypt_stat-&gt;global_default_fn_cipher_key_bytes);</div><div class='del'>-		goto out_release_free_unlock;</div><div class='add'>+		goto out_free_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> 	skcipher_request_set_crypt(s-&gt;skcipher_req, s-&gt;src_sg, s-&gt;dst_sg,</div><div class='ctx'> 				   s-&gt;block_aligned_filename_size, s-&gt;iv);</div><div class='hunk'>@@ -831,13 +793,11 @@ ecryptfs_write_tag_70_packet(char *dest, size_t *remaining_bytes,</div><div class='ctx'> 	if (rc) {</div><div class='ctx'> 		printk(KERN_ERR "%s: Error attempting to encrypt filename; "</div><div class='ctx'> 		       "rc = [%d]\n", __func__, rc);</div><div class='del'>-		goto out_release_free_unlock;</div><div class='add'>+		goto out_free_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> 	s-&gt;i += s-&gt;block_aligned_filename_size;</div><div class='ctx'> 	(*packet_size) = s-&gt;i;</div><div class='ctx'> 	(*remaining_bytes) -= (*packet_size);</div><div class='del'>-out_release_free_unlock:</div><div class='del'>-	crypto_free_shash(s-&gt;hash_tfm);</div><div class='ctx'> out_free_unlock:</div><div class='ctx'> 	kfree_sensitive(s-&gt;block_aligned_filename);</div><div class='ctx'> out_unlock:</div><div class='hunk'>@@ -848,7 +808,6 @@ out:</div><div class='ctx'> 		key_put(auth_tok_key);</div><div class='ctx'> 	}</div><div class='ctx'> 	skcipher_request_free(s-&gt;skcipher_req);</div><div class='del'>-	kfree_sensitive(s-&gt;hash_desc);</div><div class='ctx'> 	kfree(s);</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/ecryptfs/main.c b/fs/ecryptfs/main.c<br/>index d66bbd2df191..c12dc680f8fe 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ecryptfs/main.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ecryptfs/main.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ecryptfs/main.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ecryptfs/main.c</a></div><div class='hunk'>@@ -12,14 +12,16 @@</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/dcache.h&gt;</div><div class='ctx'> #include &lt;linux/file.h&gt;</div><div class='add'>+#include &lt;linux/fips.h&gt;</div><div class='ctx'> #include &lt;linux/module.h&gt;</div><div class='ctx'> #include &lt;linux/namei.h&gt;</div><div class='ctx'> #include &lt;linux/skbuff.h&gt;</div><div class='del'>-#include &lt;linux/mount.h&gt;</div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='ctx'> #include &lt;linux/key.h&gt;</div><div class='del'>-#include &lt;linux/parser.h&gt;</div><div class='add'>+#include &lt;linux/fs_context.h&gt;</div><div class='add'>+#include &lt;linux/fs_parser.h&gt;</div><div class='ctx'> #include &lt;linux/fs_stack.h&gt;</div><div class='add'>+#include &lt;linux/sysfs.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/magic.h&gt;</div><div class='ctx'> #include "ecryptfs_kernel.h"</div><div class='hunk'>@@ -105,15 +107,14 @@ static int ecryptfs_init_lower_file(struct dentry *dentry,</div><div class='ctx'> 				    struct file **lower_file)</div><div class='ctx'> {</div><div class='ctx'> 	const struct cred *cred = current_cred();</div><div class='del'>-	struct path *path = ecryptfs_dentry_to_lower_path(dentry);</div><div class='add'>+	struct path path = ecryptfs_lower_path(dentry);</div><div class='ctx'> 	int rc;</div><div class='ctx'> </div><div class='del'>-	rc = ecryptfs_privileged_open(lower_file, path-&gt;dentry, path-&gt;mnt,</div><div class='del'>-				      cred);</div><div class='add'>+	rc = ecryptfs_privileged_open(lower_file, path.dentry, path.mnt, cred);</div><div class='ctx'> 	if (rc) {</div><div class='ctx'> 		printk(KERN_ERR "Error opening lower file "</div><div class='ctx'> 		       "for lower_dentry [0x%p] and lower_mnt [0x%p]; "</div><div class='del'>-		       "rc = [%d]\n", path-&gt;dentry, path-&gt;mnt, rc);</div><div class='add'>+		       "rc = [%d]\n", path.dentry, path.mnt, rc);</div><div class='ctx'> 		(*lower_file) = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> 	return rc;</div><div class='hunk'>@@ -153,32 +154,30 @@ void ecryptfs_put_lower_file(struct inode *inode)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-enum { ecryptfs_opt_sig, ecryptfs_opt_ecryptfs_sig,</div><div class='del'>-       ecryptfs_opt_cipher, ecryptfs_opt_ecryptfs_cipher,</div><div class='del'>-       ecryptfs_opt_ecryptfs_key_bytes,</div><div class='del'>-       ecryptfs_opt_passthrough, ecryptfs_opt_xattr_metadata,</div><div class='del'>-       ecryptfs_opt_encrypted_view, ecryptfs_opt_fnek_sig,</div><div class='del'>-       ecryptfs_opt_fn_cipher, ecryptfs_opt_fn_cipher_key_bytes,</div><div class='del'>-       ecryptfs_opt_unlink_sigs, ecryptfs_opt_mount_auth_tok_only,</div><div class='del'>-       ecryptfs_opt_check_dev_ruid,</div><div class='del'>-       ecryptfs_opt_err };</div><div class='del'>-</div><div class='del'>-static const match_table_t tokens = {</div><div class='del'>-	{ecryptfs_opt_sig, "sig=%s"},</div><div class='del'>-	{ecryptfs_opt_ecryptfs_sig, "ecryptfs_sig=%s"},</div><div class='del'>-	{ecryptfs_opt_cipher, "cipher=%s"},</div><div class='del'>-	{ecryptfs_opt_ecryptfs_cipher, "ecryptfs_cipher=%s"},</div><div class='del'>-	{ecryptfs_opt_ecryptfs_key_bytes, "ecryptfs_key_bytes=%u"},</div><div class='del'>-	{ecryptfs_opt_passthrough, "ecryptfs_passthrough"},</div><div class='del'>-	{ecryptfs_opt_xattr_metadata, "ecryptfs_xattr_metadata"},</div><div class='del'>-	{ecryptfs_opt_encrypted_view, "ecryptfs_encrypted_view"},</div><div class='del'>-	{ecryptfs_opt_fnek_sig, "ecryptfs_fnek_sig=%s"},</div><div class='del'>-	{ecryptfs_opt_fn_cipher, "ecryptfs_fn_cipher=%s"},</div><div class='del'>-	{ecryptfs_opt_fn_cipher_key_bytes, "ecryptfs_fn_key_bytes=%u"},</div><div class='del'>-	{ecryptfs_opt_unlink_sigs, "ecryptfs_unlink_sigs"},</div><div class='del'>-	{ecryptfs_opt_mount_auth_tok_only, "ecryptfs_mount_auth_tok_only"},</div><div class='del'>-	{ecryptfs_opt_check_dev_ruid, "ecryptfs_check_dev_ruid"},</div><div class='del'>-	{ecryptfs_opt_err, NULL}</div><div class='add'>+enum {</div><div class='add'>+	Opt_sig, Opt_ecryptfs_sig, Opt_cipher, Opt_ecryptfs_cipher,</div><div class='add'>+	Opt_ecryptfs_key_bytes, Opt_passthrough, Opt_xattr_metadata,</div><div class='add'>+	Opt_encrypted_view, Opt_fnek_sig, Opt_fn_cipher,</div><div class='add'>+	Opt_fn_cipher_key_bytes, Opt_unlink_sigs, Opt_mount_auth_tok_only,</div><div class='add'>+	Opt_check_dev_ruid</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct fs_parameter_spec ecryptfs_fs_param_spec[] = {</div><div class='add'>+	fsparam_string	("sig",			    Opt_sig),</div><div class='add'>+	fsparam_string	("ecryptfs_sig",	    Opt_ecryptfs_sig),</div><div class='add'>+	fsparam_string	("cipher",		    Opt_cipher),</div><div class='add'>+	fsparam_string	("ecryptfs_cipher",	    Opt_ecryptfs_cipher),</div><div class='add'>+	fsparam_u32	("ecryptfs_key_bytes",	    Opt_ecryptfs_key_bytes),</div><div class='add'>+	fsparam_flag	("ecryptfs_passthrough",    Opt_passthrough),</div><div class='add'>+	fsparam_flag	("ecryptfs_xattr_metadata", Opt_xattr_metadata),</div><div class='add'>+	fsparam_flag	("ecryptfs_encrypted_view", Opt_encrypted_view),</div><div class='add'>+	fsparam_string	("ecryptfs_fnek_sig",	    Opt_fnek_sig),</div><div class='add'>+	fsparam_string	("ecryptfs_fn_cipher",	    Opt_fn_cipher),</div><div class='add'>+	fsparam_u32	("ecryptfs_fn_key_bytes",   Opt_fn_cipher_key_bytes),</div><div class='add'>+	fsparam_flag	("ecryptfs_unlink_sigs",    Opt_unlink_sigs),</div><div class='add'>+	fsparam_flag	("ecryptfs_mount_auth_tok_only", Opt_mount_auth_tok_only),</div><div class='add'>+	fsparam_flag	("ecryptfs_check_dev_ruid", Opt_check_dev_ruid),</div><div class='add'>+	{}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static int ecryptfs_init_global_auth_toks(</div><div class='hunk'>@@ -219,19 +218,20 @@ static void ecryptfs_init_mount_crypt_stat(</div><div class='ctx'> 	mount_crypt_stat-&gt;flags |= ECRYPTFS_MOUNT_CRYPT_STAT_INITIALIZED;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+struct ecryptfs_fs_context {</div><div class='add'>+	/* Mount option status trackers */</div><div class='add'>+	bool check_ruid;</div><div class='add'>+	bool sig_set;</div><div class='add'>+	bool cipher_name_set;</div><div class='add'>+	bool cipher_key_bytes_set;</div><div class='add'>+	bool fn_cipher_name_set;</div><div class='add'>+	bool fn_cipher_key_bytes_set;</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> /**</div><div class='del'>- * ecryptfs_parse_options</div><div class='del'>- * @sbi: The ecryptfs super block</div><div class='del'>- * @options: The options passed to the kernel</div><div class='del'>- * @check_ruid: set to 1 if device uid should be checked against the ruid</div><div class='del'>- *</div><div class='del'>- * Parse mount options:</div><div class='del'>- * debug=N 	   - ecryptfs_verbosity level for debug output</div><div class='del'>- * sig=XXX	   - description(signature) of the key to use</div><div class='del'>- *</div><div class='del'>- * Returns the dentry object of the lower-level (lower/interposed)</div><div class='del'>- * directory; We want to mount our stackable file system on top of</div><div class='del'>- * that lower directory.</div><div class='add'>+ * ecryptfs_parse_param</div><div class='add'>+ * @fc: The ecryptfs filesystem context</div><div class='add'>+ * @param: The mount parameter to parse</div><div class='ctx'>  *</div><div class='ctx'>  * The signature of the key to use must be the description of a key</div><div class='ctx'>  * already in the keyring. Mounting will fail if the key can not be</div><div class='hunk'>@@ -239,157 +239,118 @@ static void ecryptfs_init_mount_crypt_stat(</div><div class='ctx'>  *</div><div class='ctx'>  * Returns zero on success; non-zero on error</div><div class='ctx'>  */</div><div class='del'>-static int ecryptfs_parse_options(struct ecryptfs_sb_info *sbi, char *options,</div><div class='del'>-				  uid_t *check_ruid)</div><div class='add'>+static int ecryptfs_parse_param(</div><div class='add'>+	struct fs_context *fc,</div><div class='add'>+	struct fs_parameter *param)</div><div class='ctx'> {</div><div class='del'>-	char *p;</div><div class='del'>-	int rc = 0;</div><div class='del'>-	int sig_set = 0;</div><div class='del'>-	int cipher_name_set = 0;</div><div class='del'>-	int fn_cipher_name_set = 0;</div><div class='del'>-	int cipher_key_bytes;</div><div class='del'>-	int cipher_key_bytes_set = 0;</div><div class='del'>-	int fn_cipher_key_bytes;</div><div class='del'>-	int fn_cipher_key_bytes_set = 0;</div><div class='add'>+	int rc;</div><div class='add'>+	int opt;</div><div class='add'>+	struct fs_parse_result result;</div><div class='add'>+	struct ecryptfs_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct ecryptfs_sb_info *sbi = fc-&gt;s_fs_info;</div><div class='ctx'> 	struct ecryptfs_mount_crypt_stat *mount_crypt_stat =</div><div class='ctx'> 		&amp;sbi-&gt;mount_crypt_stat;</div><div class='del'>-	substring_t args[MAX_OPT_ARGS];</div><div class='del'>-	int token;</div><div class='del'>-	char *sig_src;</div><div class='del'>-	char *cipher_name_dst;</div><div class='del'>-	char *cipher_name_src;</div><div class='del'>-	char *fn_cipher_name_dst;</div><div class='del'>-	char *fn_cipher_name_src;</div><div class='del'>-	char *fnek_dst;</div><div class='del'>-	char *fnek_src;</div><div class='del'>-	char *cipher_key_bytes_src;</div><div class='del'>-	char *fn_cipher_key_bytes_src;</div><div class='del'>-	u8 cipher_code;</div><div class='ctx'> </div><div class='del'>-	*check_ruid = 0;</div><div class='add'>+	opt = fs_parse(fc, ecryptfs_fs_param_spec, param, &amp;result);</div><div class='add'>+	if (opt &lt; 0)</div><div class='add'>+		return opt;</div><div class='ctx'> </div><div class='del'>-	if (!options) {</div><div class='del'>-		rc = -EINVAL;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	ecryptfs_init_mount_crypt_stat(mount_crypt_stat);</div><div class='del'>-	while ((p = strsep(&amp;options, ",")) != NULL) {</div><div class='del'>-		if (!*p)</div><div class='del'>-			continue;</div><div class='del'>-		token = match_token(p, tokens, args);</div><div class='del'>-		switch (token) {</div><div class='del'>-		case ecryptfs_opt_sig:</div><div class='del'>-		case ecryptfs_opt_ecryptfs_sig:</div><div class='del'>-			sig_src = args[0].from;</div><div class='del'>-			rc = ecryptfs_add_global_auth_tok(mount_crypt_stat,</div><div class='del'>-							  sig_src, 0);</div><div class='del'>-			if (rc) {</div><div class='del'>-				printk(KERN_ERR "Error attempting to register "</div><div class='del'>-				       "global sig; rc = [%d]\n", rc);</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-			sig_set = 1;</div><div class='del'>-			break;</div><div class='del'>-		case ecryptfs_opt_cipher:</div><div class='del'>-		case ecryptfs_opt_ecryptfs_cipher:</div><div class='del'>-			cipher_name_src = args[0].from;</div><div class='del'>-			cipher_name_dst =</div><div class='del'>-				mount_crypt_stat-&gt;</div><div class='del'>-				global_default_cipher_name;</div><div class='del'>-			strncpy(cipher_name_dst, cipher_name_src,</div><div class='del'>-				ECRYPTFS_MAX_CIPHER_NAME_SIZE);</div><div class='del'>-			cipher_name_dst[ECRYPTFS_MAX_CIPHER_NAME_SIZE] = '\0';</div><div class='del'>-			cipher_name_set = 1;</div><div class='del'>-			break;</div><div class='del'>-		case ecryptfs_opt_ecryptfs_key_bytes:</div><div class='del'>-			cipher_key_bytes_src = args[0].from;</div><div class='del'>-			cipher_key_bytes =</div><div class='del'>-				(int)simple_strtol(cipher_key_bytes_src,</div><div class='del'>-						   &amp;cipher_key_bytes_src, 0);</div><div class='del'>-			mount_crypt_stat-&gt;global_default_cipher_key_size =</div><div class='del'>-				cipher_key_bytes;</div><div class='del'>-			cipher_key_bytes_set = 1;</div><div class='del'>-			break;</div><div class='del'>-		case ecryptfs_opt_passthrough:</div><div class='del'>-			mount_crypt_stat-&gt;flags |=</div><div class='del'>-				ECRYPTFS_PLAINTEXT_PASSTHROUGH_ENABLED;</div><div class='del'>-			break;</div><div class='del'>-		case ecryptfs_opt_xattr_metadata:</div><div class='del'>-			mount_crypt_stat-&gt;flags |=</div><div class='del'>-				ECRYPTFS_XATTR_METADATA_ENABLED;</div><div class='del'>-			break;</div><div class='del'>-		case ecryptfs_opt_encrypted_view:</div><div class='del'>-			mount_crypt_stat-&gt;flags |=</div><div class='del'>-				ECRYPTFS_XATTR_METADATA_ENABLED;</div><div class='del'>-			mount_crypt_stat-&gt;flags |=</div><div class='del'>-				ECRYPTFS_ENCRYPTED_VIEW_ENABLED;</div><div class='del'>-			break;</div><div class='del'>-		case ecryptfs_opt_fnek_sig:</div><div class='del'>-			fnek_src = args[0].from;</div><div class='del'>-			fnek_dst =</div><div class='del'>-				mount_crypt_stat-&gt;global_default_fnek_sig;</div><div class='del'>-			strncpy(fnek_dst, fnek_src, ECRYPTFS_SIG_SIZE_HEX);</div><div class='del'>-			mount_crypt_stat-&gt;global_default_fnek_sig[</div><div class='del'>-				ECRYPTFS_SIG_SIZE_HEX] = '\0';</div><div class='del'>-			rc = ecryptfs_add_global_auth_tok(</div><div class='del'>-				mount_crypt_stat,</div><div class='del'>-				mount_crypt_stat-&gt;global_default_fnek_sig,</div><div class='del'>-				ECRYPTFS_AUTH_TOK_FNEK);</div><div class='del'>-			if (rc) {</div><div class='del'>-				printk(KERN_ERR "Error attempting to register "</div><div class='del'>-				       "global fnek sig [%s]; rc = [%d]\n",</div><div class='del'>-				       mount_crypt_stat-&gt;global_default_fnek_sig,</div><div class='del'>-				       rc);</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-			mount_crypt_stat-&gt;flags |=</div><div class='del'>-				(ECRYPTFS_GLOBAL_ENCRYPT_FILENAMES</div><div class='del'>-				 | ECRYPTFS_GLOBAL_ENCFN_USE_MOUNT_FNEK);</div><div class='del'>-			break;</div><div class='del'>-		case ecryptfs_opt_fn_cipher:</div><div class='del'>-			fn_cipher_name_src = args[0].from;</div><div class='del'>-			fn_cipher_name_dst =</div><div class='del'>-				mount_crypt_stat-&gt;global_default_fn_cipher_name;</div><div class='del'>-			strncpy(fn_cipher_name_dst, fn_cipher_name_src,</div><div class='del'>-				ECRYPTFS_MAX_CIPHER_NAME_SIZE);</div><div class='del'>-			mount_crypt_stat-&gt;global_default_fn_cipher_name[</div><div class='del'>-				ECRYPTFS_MAX_CIPHER_NAME_SIZE] = '\0';</div><div class='del'>-			fn_cipher_name_set = 1;</div><div class='del'>-			break;</div><div class='del'>-		case ecryptfs_opt_fn_cipher_key_bytes:</div><div class='del'>-			fn_cipher_key_bytes_src = args[0].from;</div><div class='del'>-			fn_cipher_key_bytes =</div><div class='del'>-				(int)simple_strtol(fn_cipher_key_bytes_src,</div><div class='del'>-						   &amp;fn_cipher_key_bytes_src, 0);</div><div class='del'>-			mount_crypt_stat-&gt;global_default_fn_cipher_key_bytes =</div><div class='del'>-				fn_cipher_key_bytes;</div><div class='del'>-			fn_cipher_key_bytes_set = 1;</div><div class='del'>-			break;</div><div class='del'>-		case ecryptfs_opt_unlink_sigs:</div><div class='del'>-			mount_crypt_stat-&gt;flags |= ECRYPTFS_UNLINK_SIGS;</div><div class='del'>-			break;</div><div class='del'>-		case ecryptfs_opt_mount_auth_tok_only:</div><div class='del'>-			mount_crypt_stat-&gt;flags |=</div><div class='del'>-				ECRYPTFS_GLOBAL_MOUNT_AUTH_TOK_ONLY;</div><div class='del'>-			break;</div><div class='del'>-		case ecryptfs_opt_check_dev_ruid:</div><div class='del'>-			*check_ruid = 1;</div><div class='del'>-			break;</div><div class='del'>-		case ecryptfs_opt_err:</div><div class='del'>-		default:</div><div class='del'>-			printk(KERN_WARNING</div><div class='del'>-			       "%s: eCryptfs: unrecognized option [%s]\n",</div><div class='del'>-			       __func__, p);</div><div class='add'>+	switch (opt) {</div><div class='add'>+	case Opt_sig:</div><div class='add'>+	case Opt_ecryptfs_sig:</div><div class='add'>+		rc = ecryptfs_add_global_auth_tok(mount_crypt_stat,</div><div class='add'>+						  param-&gt;string, 0);</div><div class='add'>+		if (rc) {</div><div class='add'>+			printk(KERN_ERR "Error attempting to register "</div><div class='add'>+			       "global sig; rc = [%d]\n", rc);</div><div class='add'>+			return rc;</div><div class='ctx'> 		}</div><div class='add'>+		ctx-&gt;sig_set = 1;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_cipher:</div><div class='add'>+	case Opt_ecryptfs_cipher:</div><div class='add'>+		strscpy(mount_crypt_stat-&gt;global_default_cipher_name,</div><div class='add'>+			param-&gt;string);</div><div class='add'>+		ctx-&gt;cipher_name_set = 1;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_ecryptfs_key_bytes:</div><div class='add'>+		mount_crypt_stat-&gt;global_default_cipher_key_size =</div><div class='add'>+			result.uint_32;</div><div class='add'>+		ctx-&gt;cipher_key_bytes_set = 1;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_passthrough:</div><div class='add'>+		mount_crypt_stat-&gt;flags |=</div><div class='add'>+			ECRYPTFS_PLAINTEXT_PASSTHROUGH_ENABLED;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_xattr_metadata:</div><div class='add'>+		mount_crypt_stat-&gt;flags |= ECRYPTFS_XATTR_METADATA_ENABLED;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_encrypted_view:</div><div class='add'>+		mount_crypt_stat-&gt;flags |= ECRYPTFS_XATTR_METADATA_ENABLED;</div><div class='add'>+		mount_crypt_stat-&gt;flags |= ECRYPTFS_ENCRYPTED_VIEW_ENABLED;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_fnek_sig:</div><div class='add'>+		strscpy(mount_crypt_stat-&gt;global_default_fnek_sig,</div><div class='add'>+			param-&gt;string);</div><div class='add'>+		rc = ecryptfs_add_global_auth_tok(</div><div class='add'>+			mount_crypt_stat,</div><div class='add'>+			mount_crypt_stat-&gt;global_default_fnek_sig,</div><div class='add'>+			ECRYPTFS_AUTH_TOK_FNEK);</div><div class='add'>+		if (rc) {</div><div class='add'>+			printk(KERN_ERR "Error attempting to register "</div><div class='add'>+			       "global fnek sig [%s]; rc = [%d]\n",</div><div class='add'>+			       mount_crypt_stat-&gt;global_default_fnek_sig, rc);</div><div class='add'>+			return rc;</div><div class='add'>+		}</div><div class='add'>+		mount_crypt_stat-&gt;flags |=</div><div class='add'>+			(ECRYPTFS_GLOBAL_ENCRYPT_FILENAMES</div><div class='add'>+			 | ECRYPTFS_GLOBAL_ENCFN_USE_MOUNT_FNEK);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_fn_cipher:</div><div class='add'>+		strscpy(mount_crypt_stat-&gt;global_default_fn_cipher_name,</div><div class='add'>+			param-&gt;string);</div><div class='add'>+		ctx-&gt;fn_cipher_name_set = 1;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_fn_cipher_key_bytes:</div><div class='add'>+		mount_crypt_stat-&gt;global_default_fn_cipher_key_bytes =</div><div class='add'>+			result.uint_32;</div><div class='add'>+		ctx-&gt;fn_cipher_key_bytes_set = 1;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_unlink_sigs:</div><div class='add'>+		mount_crypt_stat-&gt;flags |= ECRYPTFS_UNLINK_SIGS;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_mount_auth_tok_only:</div><div class='add'>+		mount_crypt_stat-&gt;flags |= ECRYPTFS_GLOBAL_MOUNT_AUTH_TOK_ONLY;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_check_dev_ruid:</div><div class='add'>+		ctx-&gt;check_ruid = 1;</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-	if (!sig_set) {</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ecryptfs_validate_options(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	int rc = 0;</div><div class='add'>+	u8 cipher_code;</div><div class='add'>+	struct ecryptfs_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct ecryptfs_sb_info *sbi = fc-&gt;s_fs_info;</div><div class='add'>+	struct ecryptfs_mount_crypt_stat *mount_crypt_stat;</div><div class='add'>+</div><div class='add'>+</div><div class='add'>+	mount_crypt_stat = &amp;sbi-&gt;mount_crypt_stat;</div><div class='add'>+</div><div class='add'>+	if (!ctx-&gt;sig_set) {</div><div class='ctx'> 		rc = -EINVAL;</div><div class='ctx'> 		ecryptfs_printk(KERN_ERR, "You must supply at least one valid "</div><div class='ctx'> 				"auth tok signature as a mount "</div><div class='ctx'> 				"parameter; see the eCryptfs README\n");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (!cipher_name_set) {</div><div class='add'>+	if (!ctx-&gt;cipher_name_set) {</div><div class='ctx'> 		int cipher_name_len = strlen(ECRYPTFS_DEFAULT_CIPHER);</div><div class='ctx'> </div><div class='ctx'> 		BUG_ON(cipher_name_len &gt; ECRYPTFS_MAX_CIPHER_NAME_SIZE);</div><div class='hunk'>@@ -397,13 +358,13 @@ static int ecryptfs_parse_options(struct ecryptfs_sb_info *sbi, char *options,</div><div class='ctx'> 		       ECRYPTFS_DEFAULT_CIPHER);</div><div class='ctx'> 	}</div><div class='ctx'> 	if ((mount_crypt_stat-&gt;flags &amp; ECRYPTFS_GLOBAL_ENCRYPT_FILENAMES)</div><div class='del'>-	    &amp;&amp; !fn_cipher_name_set)</div><div class='add'>+	    &amp;&amp; !ctx-&gt;fn_cipher_name_set)</div><div class='ctx'> 		strcpy(mount_crypt_stat-&gt;global_default_fn_cipher_name,</div><div class='ctx'> 		       mount_crypt_stat-&gt;global_default_cipher_name);</div><div class='del'>-	if (!cipher_key_bytes_set)</div><div class='add'>+	if (!ctx-&gt;cipher_key_bytes_set)</div><div class='ctx'> 		mount_crypt_stat-&gt;global_default_cipher_key_size = 0;</div><div class='ctx'> 	if ((mount_crypt_stat-&gt;flags &amp; ECRYPTFS_GLOBAL_ENCRYPT_FILENAMES)</div><div class='del'>-	    &amp;&amp; !fn_cipher_key_bytes_set)</div><div class='add'>+	    &amp;&amp; !ctx-&gt;fn_cipher_key_bytes_set)</div><div class='ctx'> 		mount_crypt_stat-&gt;global_default_fn_cipher_key_bytes =</div><div class='ctx'> 			mount_crypt_stat-&gt;global_default_cipher_key_size;</div><div class='ctx'> </div><div class='hunk'>@@ -467,45 +428,40 @@ struct kmem_cache *ecryptfs_sb_info_cache;</div><div class='ctx'> static struct file_system_type ecryptfs_fs_type;</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * ecryptfs_mount</div><div class='del'>- * @fs_type: The filesystem type that the superblock should belong to</div><div class='del'>- * @flags: The flags associated with the mount</div><div class='del'>- * @dev_name: The path to mount over</div><div class='del'>- * @raw_data: The options passed into the kernel</div><div class='add'>+ * ecryptfs_get_tree</div><div class='add'>+ * @fc: The filesystem context</div><div class='ctx'>  */</div><div class='del'>-static struct dentry *ecryptfs_mount(struct file_system_type *fs_type, int flags,</div><div class='del'>-			const char *dev_name, void *raw_data)</div><div class='add'>+static int ecryptfs_get_tree(struct fs_context *fc)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *s;</div><div class='del'>-	struct ecryptfs_sb_info *sbi;</div><div class='add'>+	struct ecryptfs_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct ecryptfs_sb_info *sbi = fc-&gt;s_fs_info;</div><div class='ctx'> 	struct ecryptfs_mount_crypt_stat *mount_crypt_stat;</div><div class='del'>-	struct ecryptfs_dentry_info *root_info;</div><div class='ctx'> 	const char *err = "Getting sb failed";</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct path path;</div><div class='del'>-	uid_t check_ruid;</div><div class='ctx'> 	int rc;</div><div class='ctx'> </div><div class='del'>-	sbi = kmem_cache_zalloc(ecryptfs_sb_info_cache, GFP_KERNEL);</div><div class='del'>-	if (!sbi) {</div><div class='del'>-		rc = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!dev_name) {</div><div class='add'>+	if (!fc-&gt;source) {</div><div class='ctx'> 		rc = -EINVAL;</div><div class='ctx'> 		err = "Device name cannot be null";</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	rc = ecryptfs_parse_options(sbi, raw_data, &amp;check_ruid);</div><div class='add'>+	mount_crypt_stat = &amp;sbi-&gt;mount_crypt_stat;</div><div class='add'>+	rc = ecryptfs_validate_options(fc);</div><div class='ctx'> 	if (rc) {</div><div class='del'>-		err = "Error parsing options";</div><div class='add'>+		err = "Error validating options";</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	mount_crypt_stat = &amp;sbi-&gt;mount_crypt_stat;</div><div class='ctx'> </div><div class='del'>-	s = sget(fs_type, NULL, set_anon_super, flags, NULL);</div><div class='add'>+	if (fips_enabled) {</div><div class='add'>+		rc = -EINVAL;</div><div class='add'>+		err = "eCryptfs support is disabled due to FIPS";</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	s = sget_fc(fc, NULL, set_anon_super_fc);</div><div class='ctx'> 	if (IS_ERR(s)) {</div><div class='ctx'> 		rc = PTR_ERR(s);</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -521,10 +477,10 @@ static struct dentry *ecryptfs_mount(struct file_system_type *fs_type, int flags</div><div class='ctx'> 	sbi = NULL;</div><div class='ctx'> 	s-&gt;s_op = &amp;ecryptfs_sops;</div><div class='ctx'> 	s-&gt;s_xattr = ecryptfs_xattr_handlers;</div><div class='del'>-	s-&gt;s_d_op = &amp;ecryptfs_dops;</div><div class='add'>+	set_default_d_op(s, &amp;ecryptfs_dops);</div><div class='ctx'> </div><div class='ctx'> 	err = "Reading sb failed";</div><div class='del'>-	rc = kern_path(dev_name, LOOKUP_FOLLOW | LOOKUP_DIRECTORY, &amp;path);</div><div class='add'>+	rc = kern_path(fc-&gt;source, LOOKUP_FOLLOW | LOOKUP_DIRECTORY, &amp;path);</div><div class='ctx'> 	if (rc) {</div><div class='ctx'> 		ecryptfs_printk(KERN_WARNING, "kern_path() failed\n");</div><div class='ctx'> 		goto out1;</div><div class='hunk'>@@ -537,13 +493,14 @@ static struct dentry *ecryptfs_mount(struct file_system_type *fs_type, int flags</div><div class='ctx'> 		goto out_free;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (mnt_user_ns(path.mnt) != &amp;init_user_ns) {</div><div class='add'>+	if (is_idmapped_mnt(path.mnt)) {</div><div class='ctx'> 		rc = -EINVAL;</div><div class='ctx'> 		printk(KERN_ERR "Mounting on idmapped mounts currently disallowed\n");</div><div class='ctx'> 		goto out_free;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (check_ruid &amp;&amp; !uid_eq(d_inode(path.dentry)-&gt;i_uid, current_uid())) {</div><div class='add'>+	if (ctx-&gt;check_ruid &amp;&amp;</div><div class='add'>+	    !uid_eq(d_inode(path.dentry)-&gt;i_uid, current_uid())) {</div><div class='ctx'> 		rc = -EPERM;</div><div class='ctx'> 		printk(KERN_ERR "Mount of device (uid: %d) not owned by "</div><div class='ctx'> 		       "requested user (uid: %d)\n",</div><div class='hunk'>@@ -558,7 +515,7 @@ static struct dentry *ecryptfs_mount(struct file_system_type *fs_type, int flags</div><div class='ctx'> 	 * Set the POSIX ACL flag based on whether they're enabled in the lower</div><div class='ctx'> 	 * mount.</div><div class='ctx'> 	 */</div><div class='del'>-	s-&gt;s_flags = flags &amp; ~SB_POSIXACL;</div><div class='add'>+	s-&gt;s_flags = fc-&gt;sb_flags &amp; ~SB_POSIXACL;</div><div class='ctx'> 	s-&gt;s_flags |= path.dentry-&gt;d_sb-&gt;s_flags &amp; SB_POSIXACL;</div><div class='ctx'> </div><div class='ctx'> 	/**</div><div class='hunk'>@@ -591,29 +548,23 @@ static struct dentry *ecryptfs_mount(struct file_system_type *fs_type, int flags</div><div class='ctx'> 		goto out_free;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	rc = -ENOMEM;</div><div class='del'>-	root_info = kmem_cache_zalloc(ecryptfs_dentry_info_cache, GFP_KERNEL);</div><div class='del'>-	if (!root_info)</div><div class='del'>-		goto out_free;</div><div class='del'>-</div><div class='del'>-	/* -&gt;kill_sb() will take care of root_info */</div><div class='del'>-	ecryptfs_set_dentry_private(s-&gt;s_root, root_info);</div><div class='del'>-	root_info-&gt;lower_path = path;</div><div class='add'>+	ecryptfs_set_dentry_lower(s-&gt;s_root, path.dentry);</div><div class='add'>+	ecryptfs_superblock_to_private(s)-&gt;lower_mnt = path.mnt;</div><div class='ctx'> </div><div class='ctx'> 	s-&gt;s_flags |= SB_ACTIVE;</div><div class='del'>-	return dget(s-&gt;s_root);</div><div class='add'>+	fc-&gt;root = dget(s-&gt;s_root);</div><div class='add'>+	return 0;</div><div class='ctx'> </div><div class='ctx'> out_free:</div><div class='ctx'> 	path_put(&amp;path);</div><div class='ctx'> out1:</div><div class='ctx'> 	deactivate_locked_super(s);</div><div class='ctx'> out:</div><div class='del'>-	if (sbi) {</div><div class='add'>+	if (sbi)</div><div class='ctx'> 		ecryptfs_destroy_mount_crypt_stat(&amp;sbi-&gt;mount_crypt_stat);</div><div class='del'>-		kmem_cache_free(ecryptfs_sb_info_cache, sbi);</div><div class='del'>-	}</div><div class='add'>+</div><div class='ctx'> 	printk(KERN_ERR "%s; rc = [%d]\n", err, rc);</div><div class='del'>-	return ERR_PTR(rc);</div><div class='add'>+	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -628,14 +579,59 @@ static void ecryptfs_kill_block_super(struct super_block *sb)</div><div class='ctx'> 	kill_anon_super(sb);</div><div class='ctx'> 	if (!sb_info)</div><div class='ctx'> 		return;</div><div class='add'>+	mntput(sb_info-&gt;lower_mnt);</div><div class='ctx'> 	ecryptfs_destroy_mount_crypt_stat(&amp;sb_info-&gt;mount_crypt_stat);</div><div class='ctx'> 	kmem_cache_free(ecryptfs_sb_info_cache, sb_info);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void ecryptfs_free_fc(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct ecryptfs_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct ecryptfs_sb_info *sbi = fc-&gt;s_fs_info;</div><div class='add'>+</div><div class='add'>+	kfree(ctx);</div><div class='add'>+</div><div class='add'>+	if (sbi) {</div><div class='add'>+		ecryptfs_destroy_mount_crypt_stat(&amp;sbi-&gt;mount_crypt_stat);</div><div class='add'>+		kmem_cache_free(ecryptfs_sb_info_cache, sbi);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct fs_context_operations ecryptfs_context_ops = {</div><div class='add'>+	.free		= ecryptfs_free_fc,</div><div class='add'>+	.parse_param	= ecryptfs_parse_param,</div><div class='add'>+	.get_tree	= ecryptfs_get_tree,</div><div class='add'>+	.reconfigure	= NULL,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int ecryptfs_init_fs_context(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct ecryptfs_fs_context *ctx;</div><div class='add'>+	struct ecryptfs_sb_info *sbi = NULL;</div><div class='add'>+</div><div class='add'>+	ctx = kzalloc(sizeof(struct ecryptfs_fs_context), GFP_KERNEL);</div><div class='add'>+	if (!ctx)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	sbi = kmem_cache_zalloc(ecryptfs_sb_info_cache, GFP_KERNEL);</div><div class='add'>+	if (!sbi) {</div><div class='add'>+		kfree(ctx);</div><div class='add'>+		ctx = NULL;</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ecryptfs_init_mount_crypt_stat(&amp;sbi-&gt;mount_crypt_stat);</div><div class='add'>+</div><div class='add'>+	fc-&gt;fs_private = ctx;</div><div class='add'>+	fc-&gt;s_fs_info = sbi;</div><div class='add'>+	fc-&gt;ops = &amp;ecryptfs_context_ops;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static struct file_system_type ecryptfs_fs_type = {</div><div class='ctx'> 	.owner = THIS_MODULE,</div><div class='ctx'> 	.name = "ecryptfs",</div><div class='del'>-	.mount = ecryptfs_mount,</div><div class='add'>+	.init_fs_context = ecryptfs_init_fs_context,</div><div class='add'>+	.parameters = ecryptfs_fs_param_spec,</div><div class='ctx'> 	.kill_sb = ecryptfs_kill_block_super,</div><div class='ctx'> 	.fs_flags = 0</div><div class='ctx'> };</div><div class='hunk'>@@ -672,11 +668,6 @@ static struct ecryptfs_cache_info {</div><div class='ctx'> 		.size = sizeof(struct ecryptfs_file_info),</div><div class='ctx'> 	},</div><div class='ctx'> 	{</div><div class='del'>-		.cache = &amp;ecryptfs_dentry_info_cache,</div><div class='del'>-		.name = "ecryptfs_dentry_info_cache",</div><div class='del'>-		.size = sizeof(struct ecryptfs_dentry_info),</div><div class='del'>-	},</div><div class='del'>-	{</div><div class='ctx'> 		.cache = &amp;ecryptfs_inode_info_cache,</div><div class='ctx'> 		.name = "ecryptfs_inode_cache",</div><div class='ctx'> 		.size = sizeof(struct ecryptfs_inode_info),</div><div class='hunk'>@@ -769,7 +760,7 @@ static struct kobject *ecryptfs_kobj;</div><div class='ctx'> static ssize_t version_show(struct kobject *kobj,</div><div class='ctx'> 			    struct kobj_attribute *attr, char *buff)</div><div class='ctx'> {</div><div class='del'>-	return snprintf(buff, PAGE_SIZE, "%d\n", ECRYPTFS_VERSIONING_MASK);</div><div class='add'>+	return sysfs_emit(buff, "%d\n", ECRYPTFS_VERSIONING_MASK);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct kobj_attribute version_attr = __ATTR_RO(version);</div><div class='head'>diff --git a/fs/ecryptfs/mmap.c b/fs/ecryptfs/mmap.c<br/>index 7d85e64ea62f..2c2b12fedeae 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ecryptfs/mmap.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ecryptfs/mmap.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ecryptfs/mmap.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ecryptfs/mmap.c</a></div><div class='hunk'>@@ -19,51 +19,33 @@</div><div class='ctx'> #include &lt;linux/scatterlist.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/xattr.h&gt;</div><div class='del'>-#include &lt;asm/unaligned.h&gt;</div><div class='add'>+#include &lt;linux/unaligned.h&gt;</div><div class='ctx'> #include "ecryptfs_kernel.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * ecryptfs_get_locked_page</div><div class='del'>- *</div><div class='del'>- * Get one page from cache or lower f/s, return error otherwise.</div><div class='del'>- *</div><div class='del'>- * Returns locked and up-to-date page (if ok), with increased</div><div class='del'>- * refcnt.</div><div class='del'>- */</div><div class='del'>-struct page *ecryptfs_get_locked_page(struct inode *inode, loff_t index)</div><div class='del'>-{</div><div class='del'>-	struct page *page = read_mapping_page(inode-&gt;i_mapping, index, NULL);</div><div class='del'>-	if (!IS_ERR(page))</div><div class='del'>-		lock_page(page);</div><div class='del'>-	return page;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * ecryptfs_writepage</div><div class='del'>- * @page: Page that is locked before this call is made</div><div class='del'>- * @wbc: Write-back control structure</div><div class='del'>- *</div><div class='del'>- * Returns zero on success; non-zero otherwise</div><div class='del'>- *</div><div class='ctx'>  * This is where we encrypt the data and pass the encrypted data to</div><div class='ctx'>  * the lower filesystem.  In OpenPGP-compatible mode, we operate on</div><div class='ctx'>  * entire underlying packets.</div><div class='ctx'>  */</div><div class='del'>-static int ecryptfs_writepage(struct page *page, struct writeback_control *wbc)</div><div class='add'>+static int ecryptfs_writepages(struct address_space *mapping,</div><div class='add'>+		struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='del'>-	int rc;</div><div class='del'>-</div><div class='del'>-	rc = ecryptfs_encrypt_page(page);</div><div class='del'>-	if (rc) {</div><div class='del'>-		ecryptfs_printk(KERN_WARNING, "Error encrypting "</div><div class='del'>-				"page (upper index [0x%.16lx])\n", page-&gt;index);</div><div class='del'>-		ClearPageUptodate(page);</div><div class='del'>-		goto out;</div><div class='add'>+	struct folio *folio = NULL;</div><div class='add'>+	int error;</div><div class='add'>+</div><div class='add'>+	while ((folio = writeback_iter(mapping, wbc, folio, &amp;error))) {</div><div class='add'>+		error = ecryptfs_encrypt_page(folio);</div><div class='add'>+		if (error) {</div><div class='add'>+			ecryptfs_printk(KERN_WARNING,</div><div class='add'>+				"Error encrypting folio (index [0x%.16lx])\n",</div><div class='add'>+				folio-&gt;index);</div><div class='add'>+			folio_clear_uptodate(folio);</div><div class='add'>+			mapping_set_error(mapping, error);</div><div class='add'>+		}</div><div class='add'>+		folio_unlock(folio);</div><div class='ctx'> 	}</div><div class='del'>-	SetPageUptodate(page);</div><div class='del'>-out:</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	return rc;</div><div class='add'>+</div><div class='add'>+	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void strip_xattr_flag(char *page_virt,</div><div class='hunk'>@@ -97,7 +79,7 @@ static void strip_xattr_flag(char *page_virt,</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * ecryptfs_copy_up_encrypted_with_header</div><div class='del'>- * @page: Sort of a ``virtual'' representation of the encrypted lower</div><div class='add'>+ * @folio: Sort of a ``virtual'' representation of the encrypted lower</div><div class='ctx'>  *        file. The actual lower file does not have the metadata in</div><div class='ctx'>  *        the header. This is locked.</div><div class='ctx'>  * @crypt_stat: The eCryptfs inode's cryptographic context</div><div class='hunk'>@@ -106,7 +88,7 @@ static void strip_xattr_flag(char *page_virt,</div><div class='ctx'>  * seeing, with the header information inserted.</div><div class='ctx'>  */</div><div class='ctx'> static int</div><div class='del'>-ecryptfs_copy_up_encrypted_with_header(struct page *page,</div><div class='add'>+ecryptfs_copy_up_encrypted_with_header(struct folio *folio,</div><div class='ctx'> 				       struct ecryptfs_crypt_stat *crypt_stat)</div><div class='ctx'> {</div><div class='ctx'> 	loff_t extent_num_in_page = 0;</div><div class='hunk'>@@ -115,9 +97,9 @@ ecryptfs_copy_up_encrypted_with_header(struct page *page,</div><div class='ctx'> 	int rc = 0;</div><div class='ctx'> </div><div class='ctx'> 	while (extent_num_in_page &lt; num_extents_per_page) {</div><div class='del'>-		loff_t view_extent_num = ((((loff_t)page-&gt;index)</div><div class='add'>+		loff_t view_extent_num = ((loff_t)folio-&gt;index</div><div class='ctx'> 					   * num_extents_per_page)</div><div class='del'>-					  + extent_num_in_page);</div><div class='add'>+					  + extent_num_in_page;</div><div class='ctx'> 		size_t num_header_extents_at_front =</div><div class='ctx'> 			(crypt_stat-&gt;metadata_size / crypt_stat-&gt;extent_size);</div><div class='ctx'> </div><div class='hunk'>@@ -125,21 +107,21 @@ ecryptfs_copy_up_encrypted_with_header(struct page *page,</div><div class='ctx'> 			/* This is a header extent */</div><div class='ctx'> 			char *page_virt;</div><div class='ctx'> </div><div class='del'>-			page_virt = kmap_atomic(page);</div><div class='add'>+			page_virt = kmap_local_folio(folio, 0);</div><div class='ctx'> 			memset(page_virt, 0, PAGE_SIZE);</div><div class='ctx'> 			/* TODO: Support more than one header extent */</div><div class='ctx'> 			if (view_extent_num == 0) {</div><div class='ctx'> 				size_t written;</div><div class='ctx'> </div><div class='ctx'> 				rc = ecryptfs_read_xattr_region(</div><div class='del'>-					page_virt, page-&gt;mapping-&gt;host);</div><div class='add'>+					page_virt, folio-&gt;mapping-&gt;host);</div><div class='ctx'> 				strip_xattr_flag(page_virt + 16, crypt_stat);</div><div class='ctx'> 				ecryptfs_write_header_metadata(page_virt + 20,</div><div class='ctx'> 							       crypt_stat,</div><div class='ctx'> 							       &amp;written);</div><div class='ctx'> 			}</div><div class='del'>-			kunmap_atomic(page_virt);</div><div class='del'>-			flush_dcache_page(page);</div><div class='add'>+			kunmap_local(page_virt);</div><div class='add'>+			flush_dcache_folio(folio);</div><div class='ctx'> 			if (rc) {</div><div class='ctx'> 				printk(KERN_ERR "%s: Error reading xattr "</div><div class='ctx'> 				       "region; rc = [%d]\n", __func__, rc);</div><div class='hunk'>@@ -152,9 +134,9 @@ ecryptfs_copy_up_encrypted_with_header(struct page *page,</div><div class='ctx'> 				 - crypt_stat-&gt;metadata_size);</div><div class='ctx'> </div><div class='ctx'> 			rc = ecryptfs_read_lower_page_segment(</div><div class='del'>-				page, (lower_offset &gt;&gt; PAGE_SHIFT),</div><div class='add'>+				folio, (lower_offset &gt;&gt; PAGE_SHIFT),</div><div class='ctx'> 				(lower_offset &amp; ~PAGE_MASK),</div><div class='del'>-				crypt_stat-&gt;extent_size, page-&gt;mapping-&gt;host);</div><div class='add'>+				crypt_stat-&gt;extent_size, folio-&gt;mapping-&gt;host);</div><div class='ctx'> 			if (rc) {</div><div class='ctx'> 				printk(KERN_ERR "%s: Error attempting to read "</div><div class='ctx'> 				       "extent at offset [%lld] in the lower "</div><div class='hunk'>@@ -170,133 +152,129 @@ out:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * ecryptfs_readpage</div><div class='add'>+ * ecryptfs_read_folio</div><div class='ctx'>  * @file: An eCryptfs file</div><div class='del'>- * @page: Page from eCryptfs inode mapping into which to stick the read data</div><div class='add'>+ * @folio: Folio from eCryptfs inode mapping into which to stick the read data</div><div class='ctx'>  *</div><div class='del'>- * Read in a page, decrypting if necessary.</div><div class='add'>+ * Read in a folio, decrypting if necessary.</div><div class='ctx'>  *</div><div class='ctx'>  * Returns zero on success; non-zero on error.</div><div class='ctx'>  */</div><div class='del'>-static int ecryptfs_readpage(struct file *file, struct page *page)</div><div class='add'>+static int ecryptfs_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	struct ecryptfs_crypt_stat *crypt_stat =</div><div class='del'>-		&amp;ecryptfs_inode_to_private(page-&gt;mapping-&gt;host)-&gt;crypt_stat;</div><div class='del'>-	int rc = 0;</div><div class='add'>+		&amp;ecryptfs_inode_to_private(inode)-&gt;crypt_stat;</div><div class='add'>+	int err = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (!crypt_stat || !(crypt_stat-&gt;flags &amp; ECRYPTFS_ENCRYPTED)) {</div><div class='del'>-		rc = ecryptfs_read_lower_page_segment(page, page-&gt;index, 0,</div><div class='del'>-						      PAGE_SIZE,</div><div class='del'>-						      page-&gt;mapping-&gt;host);</div><div class='add'>+		err = ecryptfs_read_lower_page_segment(folio, folio-&gt;index, 0,</div><div class='add'>+				folio_size(folio), inode);</div><div class='ctx'> 	} else if (crypt_stat-&gt;flags &amp; ECRYPTFS_VIEW_AS_ENCRYPTED) {</div><div class='ctx'> 		if (crypt_stat-&gt;flags &amp; ECRYPTFS_METADATA_IN_XATTR) {</div><div class='del'>-			rc = ecryptfs_copy_up_encrypted_with_header(page,</div><div class='del'>-								    crypt_stat);</div><div class='del'>-			if (rc) {</div><div class='add'>+			err = ecryptfs_copy_up_encrypted_with_header(folio,</div><div class='add'>+					crypt_stat);</div><div class='add'>+			if (err) {</div><div class='ctx'> 				printk(KERN_ERR "%s: Error attempting to copy "</div><div class='ctx'> 				       "the encrypted content from the lower "</div><div class='ctx'> 				       "file whilst inserting the metadata "</div><div class='del'>-				       "from the xattr into the header; rc = "</div><div class='del'>-				       "[%d]\n", __func__, rc);</div><div class='add'>+				       "from the xattr into the header; err = "</div><div class='add'>+				       "[%d]\n", __func__, err);</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 		} else {</div><div class='del'>-			rc = ecryptfs_read_lower_page_segment(</div><div class='del'>-				page, page-&gt;index, 0, PAGE_SIZE,</div><div class='del'>-				page-&gt;mapping-&gt;host);</div><div class='del'>-			if (rc) {</div><div class='del'>-				printk(KERN_ERR "Error reading page; rc = "</div><div class='del'>-				       "[%d]\n", rc);</div><div class='add'>+			err = ecryptfs_read_lower_page_segment(folio,</div><div class='add'>+					folio-&gt;index, 0, folio_size(folio),</div><div class='add'>+					inode);</div><div class='add'>+			if (err) {</div><div class='add'>+				printk(KERN_ERR "Error reading page; err = "</div><div class='add'>+				       "[%d]\n", err);</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='del'>-		rc = ecryptfs_decrypt_page(page);</div><div class='del'>-		if (rc) {</div><div class='add'>+		err = ecryptfs_decrypt_page(folio);</div><div class='add'>+		if (err) {</div><div class='ctx'> 			ecryptfs_printk(KERN_ERR, "Error decrypting page; "</div><div class='del'>-					"rc = [%d]\n", rc);</div><div class='add'>+					"err = [%d]\n", err);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='del'>-	if (rc)</div><div class='del'>-		ClearPageUptodate(page);</div><div class='del'>-	else</div><div class='del'>-		SetPageUptodate(page);</div><div class='del'>-	ecryptfs_printk(KERN_DEBUG, "Unlocking page with index = [0x%.16lx]\n",</div><div class='del'>-			page-&gt;index);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	return rc;</div><div class='add'>+	ecryptfs_printk(KERN_DEBUG, "Unlocking folio with index = [0x%.16lx]\n",</div><div class='add'>+			folio-&gt;index);</div><div class='add'>+	folio_end_read(folio, err == 0);</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Called with lower inode mutex held.</div><div class='ctx'>  */</div><div class='del'>-static int fill_zeros_to_end_of_page(struct page *page, unsigned int to)</div><div class='add'>+static int fill_zeros_to_end_of_page(struct folio *folio, unsigned int to)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	int end_byte_in_page;</div><div class='ctx'> </div><div class='del'>-	if ((i_size_read(inode) / PAGE_SIZE) != page-&gt;index)</div><div class='add'>+	if ((i_size_read(inode) / PAGE_SIZE) != folio-&gt;index)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	end_byte_in_page = i_size_read(inode) % PAGE_SIZE;</div><div class='ctx'> 	if (to &gt; end_byte_in_page)</div><div class='ctx'> 		end_byte_in_page = to;</div><div class='del'>-	zero_user_segment(page, end_byte_in_page, PAGE_SIZE);</div><div class='add'>+	folio_zero_segment(folio, end_byte_in_page, PAGE_SIZE);</div><div class='ctx'> out:</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * ecryptfs_write_begin</div><div class='del'>- * @file: The eCryptfs file</div><div class='add'>+ * @iocb: I/O control block for the eCryptfs file</div><div class='ctx'>  * @mapping: The eCryptfs object</div><div class='ctx'>  * @pos: The file offset at which to start writing</div><div class='ctx'>  * @len: Length of the write</div><div class='del'>- * @flags: Various flags</div><div class='del'>- * @pagep: Pointer to return the page</div><div class='add'>+ * @foliop: Pointer to return the folio</div><div class='ctx'>  * @fsdata: Pointer to return fs data (unused)</div><div class='ctx'>  *</div><div class='ctx'>  * This function must zero any hole we create</div><div class='ctx'>  *</div><div class='ctx'>  * Returns zero on success; non-zero otherwise</div><div class='ctx'>  */</div><div class='del'>-static int ecryptfs_write_begin(struct file *file,</div><div class='add'>+static int ecryptfs_write_begin(const struct kiocb *iocb,</div><div class='ctx'> 			struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned flags,</div><div class='del'>-			struct page **pagep, void **fsdata)</div><div class='add'>+			loff_t pos, unsigned len,</div><div class='add'>+			struct folio **foliop, void **fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	pgoff_t index = pos &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	loff_t prev_page_end_size;</div><div class='ctx'> 	int rc = 0;</div><div class='ctx'> </div><div class='del'>-	page = grab_cache_page_write_begin(mapping, index, flags);</div><div class='del'>-	if (!page)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	*pagep = page;</div><div class='add'>+	folio = __filemap_get_folio(mapping, index, FGP_WRITEBEGIN,</div><div class='add'>+			mapping_gfp_mask(mapping));</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio);</div><div class='add'>+	*foliop = folio;</div><div class='ctx'> </div><div class='ctx'> 	prev_page_end_size = ((loff_t)index &lt;&lt; PAGE_SHIFT);</div><div class='del'>-	if (!PageUptodate(page)) {</div><div class='add'>+	if (!folio_test_uptodate(folio)) {</div><div class='ctx'> 		struct ecryptfs_crypt_stat *crypt_stat =</div><div class='ctx'> 			&amp;ecryptfs_inode_to_private(mapping-&gt;host)-&gt;crypt_stat;</div><div class='ctx'> </div><div class='ctx'> 		if (!(crypt_stat-&gt;flags &amp; ECRYPTFS_ENCRYPTED)) {</div><div class='ctx'> 			rc = ecryptfs_read_lower_page_segment(</div><div class='del'>-				page, index, 0, PAGE_SIZE, mapping-&gt;host);</div><div class='add'>+				folio, index, 0, PAGE_SIZE, mapping-&gt;host);</div><div class='ctx'> 			if (rc) {</div><div class='ctx'> 				printk(KERN_ERR "%s: Error attempting to read "</div><div class='ctx'> 				       "lower page segment; rc = [%d]\n",</div><div class='ctx'> 				       __func__, rc);</div><div class='del'>-				ClearPageUptodate(page);</div><div class='add'>+				folio_clear_uptodate(folio);</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			} else</div><div class='del'>-				SetPageUptodate(page);</div><div class='add'>+				folio_mark_uptodate(folio);</div><div class='ctx'> 		} else if (crypt_stat-&gt;flags &amp; ECRYPTFS_VIEW_AS_ENCRYPTED) {</div><div class='ctx'> 			if (crypt_stat-&gt;flags &amp; ECRYPTFS_METADATA_IN_XATTR) {</div><div class='ctx'> 				rc = ecryptfs_copy_up_encrypted_with_header(</div><div class='del'>-					page, crypt_stat);</div><div class='add'>+					folio, crypt_stat);</div><div class='ctx'> 				if (rc) {</div><div class='ctx'> 					printk(KERN_ERR "%s: Error attempting "</div><div class='ctx'> 					       "to copy the encrypted content "</div><div class='hunk'>@@ -304,47 +282,47 @@ static int ecryptfs_write_begin(struct file *file,</div><div class='ctx'> 					       "inserting the metadata from "</div><div class='ctx'> 					       "the xattr into the header; rc "</div><div class='ctx'> 					       "= [%d]\n", __func__, rc);</div><div class='del'>-					ClearPageUptodate(page);</div><div class='add'>+					folio_clear_uptodate(folio);</div><div class='ctx'> 					goto out;</div><div class='ctx'> 				}</div><div class='del'>-				SetPageUptodate(page);</div><div class='add'>+				folio_mark_uptodate(folio);</div><div class='ctx'> 			} else {</div><div class='ctx'> 				rc = ecryptfs_read_lower_page_segment(</div><div class='del'>-					page, index, 0, PAGE_SIZE,</div><div class='add'>+					folio, index, 0, PAGE_SIZE,</div><div class='ctx'> 					mapping-&gt;host);</div><div class='ctx'> 				if (rc) {</div><div class='ctx'> 					printk(KERN_ERR "%s: Error reading "</div><div class='ctx'> 					       "page; rc = [%d]\n",</div><div class='ctx'> 					       __func__, rc);</div><div class='del'>-					ClearPageUptodate(page);</div><div class='add'>+					folio_clear_uptodate(folio);</div><div class='ctx'> 					goto out;</div><div class='ctx'> 				}</div><div class='del'>-				SetPageUptodate(page);</div><div class='add'>+				folio_mark_uptodate(folio);</div><div class='ctx'> 			}</div><div class='ctx'> 		} else {</div><div class='ctx'> 			if (prev_page_end_size</div><div class='del'>-			    &gt;= i_size_read(page-&gt;mapping-&gt;host)) {</div><div class='del'>-				zero_user(page, 0, PAGE_SIZE);</div><div class='del'>-				SetPageUptodate(page);</div><div class='add'>+			    &gt;= i_size_read(mapping-&gt;host)) {</div><div class='add'>+				folio_zero_range(folio, 0, PAGE_SIZE);</div><div class='add'>+				folio_mark_uptodate(folio);</div><div class='ctx'> 			} else if (len &lt; PAGE_SIZE) {</div><div class='del'>-				rc = ecryptfs_decrypt_page(page);</div><div class='add'>+				rc = ecryptfs_decrypt_page(folio);</div><div class='ctx'> 				if (rc) {</div><div class='ctx'> 					printk(KERN_ERR "%s: Error decrypting "</div><div class='ctx'> 					       "page at index [%ld]; "</div><div class='ctx'> 					       "rc = [%d]\n",</div><div class='del'>-					       __func__, page-&gt;index, rc);</div><div class='del'>-					ClearPageUptodate(page);</div><div class='add'>+					       __func__, folio-&gt;index, rc);</div><div class='add'>+					folio_clear_uptodate(folio);</div><div class='ctx'> 					goto out;</div><div class='ctx'> 				}</div><div class='del'>-				SetPageUptodate(page);</div><div class='add'>+				folio_mark_uptodate(folio);</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	/* If creating a page or more of holes, zero them out via truncate.</div><div class='ctx'> 	 * Note, this will increase i_size. */</div><div class='ctx'> 	if (index != 0) {</div><div class='del'>-		if (prev_page_end_size &gt; i_size_read(page-&gt;mapping-&gt;host)) {</div><div class='del'>-			rc = ecryptfs_truncate(file-&gt;f_path.dentry,</div><div class='add'>+		if (prev_page_end_size &gt; i_size_read(mapping-&gt;host)) {</div><div class='add'>+			rc = ecryptfs_truncate(iocb-&gt;ki_filp-&gt;f_path.dentry,</div><div class='ctx'> 					       prev_page_end_size);</div><div class='ctx'> 			if (rc) {</div><div class='ctx'> 				printk(KERN_ERR "%s: Error on attempt to "</div><div class='hunk'>@@ -359,12 +337,11 @@ static int ecryptfs_write_begin(struct file *file,</div><div class='ctx'> 	 * of page?  Zero it out. */</div><div class='ctx'> 	if ((i_size_read(mapping-&gt;host) == prev_page_end_size)</div><div class='ctx'> 	    &amp;&amp; (pos != 0))</div><div class='del'>-		zero_user(page, 0, PAGE_SIZE);</div><div class='add'>+		folio_zero_range(folio, 0, PAGE_SIZE);</div><div class='ctx'> out:</div><div class='ctx'> 	if (unlikely(rc)) {</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		put_page(page);</div><div class='del'>-		*pagep = NULL;</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 	}</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='hunk'>@@ -427,7 +404,7 @@ static int ecryptfs_write_inode_size_to_xattr(struct inode *ecryptfs_inode)</div><div class='ctx'> 	if (size &lt; 0)</div><div class='ctx'> 		size = 8;</div><div class='ctx'> 	put_unaligned_be64(i_size_read(ecryptfs_inode), xattr_virt);</div><div class='del'>-	rc = __vfs_setxattr(&amp;init_user_ns, lower_dentry, lower_inode,</div><div class='add'>+	rc = __vfs_setxattr(&amp;nop_mnt_idmap, lower_dentry, lower_inode,</div><div class='ctx'> 			    ECRYPTFS_XATTR_NAME, xattr_virt, size, 0);</div><div class='ctx'> 	inode_unlock(lower_inode);</div><div class='ctx'> 	if (rc)</div><div class='hunk'>@@ -452,18 +429,18 @@ int ecryptfs_write_inode_size_to_metadata(struct inode *ecryptfs_inode)</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * ecryptfs_write_end</div><div class='del'>- * @file: The eCryptfs file object</div><div class='add'>+ * @iocb: I/O control block for the eCryptfs file</div><div class='ctx'>  * @mapping: The eCryptfs object</div><div class='ctx'>  * @pos: The file position</div><div class='ctx'>  * @len: The length of the data (unused)</div><div class='ctx'>  * @copied: The amount of data copied</div><div class='del'>- * @page: The eCryptfs page</div><div class='add'>+ * @folio: The eCryptfs folio</div><div class='ctx'>  * @fsdata: The fsdata (unused)</div><div class='ctx'>  */</div><div class='del'>-static int ecryptfs_write_end(struct file *file,</div><div class='add'>+static int ecryptfs_write_end(const struct kiocb *iocb,</div><div class='ctx'> 			struct address_space *mapping,</div><div class='ctx'> 			loff_t pos, unsigned len, unsigned copied,</div><div class='del'>-			struct page *page, void *fsdata)</div><div class='add'>+			struct folio *folio, void *fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	pgoff_t index = pos &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> 	unsigned from = pos &amp; (PAGE_SIZE - 1);</div><div class='hunk'>@@ -476,8 +453,8 @@ static int ecryptfs_write_end(struct file *file,</div><div class='ctx'> 	ecryptfs_printk(KERN_DEBUG, "Calling fill_zeros_to_end_of_page"</div><div class='ctx'> 			"(page w/ index = [0x%.16lx], to = [%d])\n", index, to);</div><div class='ctx'> 	if (!(crypt_stat-&gt;flags &amp; ECRYPTFS_ENCRYPTED)) {</div><div class='del'>-		rc = ecryptfs_write_lower_page_segment(ecryptfs_inode, page, 0,</div><div class='del'>-						       to);</div><div class='add'>+		rc = ecryptfs_write_lower_page_segment(ecryptfs_inode,</div><div class='add'>+				folio, 0, to);</div><div class='ctx'> 		if (!rc) {</div><div class='ctx'> 			rc = copied;</div><div class='ctx'> 			fsstack_copy_inode_size(ecryptfs_inode,</div><div class='hunk'>@@ -485,21 +462,21 @@ static int ecryptfs_write_end(struct file *file,</div><div class='ctx'> 		}</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (!PageUptodate(page)) {</div><div class='add'>+	if (!folio_test_uptodate(folio)) {</div><div class='ctx'> 		if (copied &lt; PAGE_SIZE) {</div><div class='ctx'> 			rc = 0;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='del'>-		SetPageUptodate(page);</div><div class='add'>+		folio_mark_uptodate(folio);</div><div class='ctx'> 	}</div><div class='ctx'> 	/* Fills in zeros if 'to' goes beyond inode size */</div><div class='del'>-	rc = fill_zeros_to_end_of_page(page, to);</div><div class='add'>+	rc = fill_zeros_to_end_of_page(folio, to);</div><div class='ctx'> 	if (rc) {</div><div class='ctx'> 		ecryptfs_printk(KERN_WARNING, "Error attempting to fill "</div><div class='ctx'> 			"zeros in page with index = [0x%.16lx]\n", index);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	rc = ecryptfs_encrypt_page(page);</div><div class='add'>+	rc = ecryptfs_encrypt_page(folio);</div><div class='ctx'> 	if (rc) {</div><div class='ctx'> 		ecryptfs_printk(KERN_WARNING, "Error encrypting page (upper "</div><div class='ctx'> 				"index [0x%.16lx])\n", index);</div><div class='hunk'>@@ -518,8 +495,8 @@ static int ecryptfs_write_end(struct file *file,</div><div class='ctx'> 	else</div><div class='ctx'> 		rc = copied;</div><div class='ctx'> out:</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -540,16 +517,18 @@ const struct address_space_operations ecryptfs_aops = {</div><div class='ctx'> 	 * XXX: This is pretty broken for multiple reasons: ecryptfs does not</div><div class='ctx'> 	 * actually use buffer_heads, and ecryptfs will crash without</div><div class='ctx'> 	 * CONFIG_BLOCK.  But it matches the behavior before the default for</div><div class='del'>-	 * address_space_operations without the -&gt;set_page_dirty method was</div><div class='add'>+	 * address_space_operations without the -&gt;dirty_folio method was</div><div class='ctx'> 	 * cleaned up, so this is the best we can do without maintainer</div><div class='ctx'> 	 * feedback.</div><div class='ctx'> 	 */</div><div class='ctx'> #ifdef CONFIG_BLOCK</div><div class='del'>-	.set_page_dirty = __set_page_dirty_buffers,</div><div class='add'>+	.dirty_folio	= block_dirty_folio,</div><div class='add'>+	.invalidate_folio = block_invalidate_folio,</div><div class='ctx'> #endif</div><div class='del'>-	.writepage = ecryptfs_writepage,</div><div class='del'>-	.readpage = ecryptfs_readpage,</div><div class='add'>+	.writepages = ecryptfs_writepages,</div><div class='add'>+	.read_folio = ecryptfs_read_folio,</div><div class='ctx'> 	.write_begin = ecryptfs_write_begin,</div><div class='ctx'> 	.write_end = ecryptfs_write_end,</div><div class='add'>+	.migrate_folio = filemap_migrate_folio,</div><div class='ctx'> 	.bmap = ecryptfs_bmap,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/ecryptfs/read_write.c b/fs/ecryptfs/read_write.c<br/>index 60bdcaddcbe5..b3b451c2b941 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ecryptfs/read_write.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ecryptfs/read_write.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ecryptfs/read_write.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ecryptfs/read_write.c</a></div><div class='hunk'>@@ -41,34 +41,33 @@ int ecryptfs_write_lower(struct inode *ecryptfs_inode, char *data,</div><div class='ctx'> /**</div><div class='ctx'>  * ecryptfs_write_lower_page_segment</div><div class='ctx'>  * @ecryptfs_inode: The eCryptfs inode</div><div class='del'>- * @page_for_lower: The page containing the data to be written to the</div><div class='add'>+ * @folio_for_lower: The folio containing the data to be written to the</div><div class='ctx'>  *                  lower file</div><div class='del'>- * @offset_in_page: The offset in the @page_for_lower from which to</div><div class='add'>+ * @offset_in_page: The offset in the @folio_for_lower from which to</div><div class='ctx'>  *                  start writing the data</div><div class='del'>- * @size: The amount of data from @page_for_lower to write to the</div><div class='add'>+ * @size: The amount of data from @folio_for_lower to write to the</div><div class='ctx'>  *        lower file</div><div class='ctx'>  *</div><div class='ctx'>  * Determines the byte offset in the file for the given page and</div><div class='ctx'>  * offset within the page, maps the page, and makes the call to write</div><div class='del'>- * the contents of @page_for_lower to the lower inode.</div><div class='add'>+ * the contents of @folio_for_lower to the lower inode.</div><div class='ctx'>  *</div><div class='ctx'>  * Returns zero on success; non-zero otherwise</div><div class='ctx'>  */</div><div class='ctx'> int ecryptfs_write_lower_page_segment(struct inode *ecryptfs_inode,</div><div class='del'>-				      struct page *page_for_lower,</div><div class='add'>+				      struct folio *folio_for_lower,</div><div class='ctx'> 				      size_t offset_in_page, size_t size)</div><div class='ctx'> {</div><div class='ctx'> 	char *virt;</div><div class='ctx'> 	loff_t offset;</div><div class='ctx'> 	int rc;</div><div class='ctx'> </div><div class='del'>-	offset = ((((loff_t)page_for_lower-&gt;index) &lt;&lt; PAGE_SHIFT)</div><div class='del'>-		  + offset_in_page);</div><div class='del'>-	virt = kmap(page_for_lower);</div><div class='add'>+	offset = (loff_t)folio_for_lower-&gt;index * PAGE_SIZE + offset_in_page;</div><div class='add'>+	virt = kmap_local_folio(folio_for_lower, 0);</div><div class='ctx'> 	rc = ecryptfs_write_lower(ecryptfs_inode, virt, offset, size);</div><div class='ctx'> 	if (rc &gt; 0)</div><div class='ctx'> 		rc = 0;</div><div class='del'>-	kunmap(page_for_lower);</div><div class='add'>+	kunmap_local(virt);</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -93,7 +92,6 @@ int ecryptfs_write_lower_page_segment(struct inode *ecryptfs_inode,</div><div class='ctx'> int ecryptfs_write(struct inode *ecryptfs_inode, char *data, loff_t offset,</div><div class='ctx'> 		   size_t size)</div><div class='ctx'> {</div><div class='del'>-	struct page *ecryptfs_page;</div><div class='ctx'> 	struct ecryptfs_crypt_stat *crypt_stat;</div><div class='ctx'> 	char *ecryptfs_page_virt;</div><div class='ctx'> 	loff_t ecryptfs_file_size = i_size_read(ecryptfs_inode);</div><div class='hunk'>@@ -111,6 +109,7 @@ int ecryptfs_write(struct inode *ecryptfs_inode, char *data, loff_t offset,</div><div class='ctx'> 	else</div><div class='ctx'> 		pos = offset;</div><div class='ctx'> 	while (pos &lt; (offset + size)) {</div><div class='add'>+		struct folio *ecryptfs_folio;</div><div class='ctx'> 		pgoff_t ecryptfs_page_idx = (pos &gt;&gt; PAGE_SHIFT);</div><div class='ctx'> 		size_t start_offset_in_page = (pos &amp; ~PAGE_MASK);</div><div class='ctx'> 		size_t num_bytes = (PAGE_SIZE - start_offset_in_page);</div><div class='hunk'>@@ -130,17 +129,18 @@ int ecryptfs_write(struct inode *ecryptfs_inode, char *data, loff_t offset,</div><div class='ctx'> 			if (num_bytes &gt; total_remaining_zeros)</div><div class='ctx'> 				num_bytes = total_remaining_zeros;</div><div class='ctx'> 		}</div><div class='del'>-		ecryptfs_page = ecryptfs_get_locked_page(ecryptfs_inode,</div><div class='del'>-							 ecryptfs_page_idx);</div><div class='del'>-		if (IS_ERR(ecryptfs_page)) {</div><div class='del'>-			rc = PTR_ERR(ecryptfs_page);</div><div class='add'>+		ecryptfs_folio = read_mapping_folio(ecryptfs_inode-&gt;i_mapping,</div><div class='add'>+				ecryptfs_page_idx, NULL);</div><div class='add'>+		if (IS_ERR(ecryptfs_folio)) {</div><div class='add'>+			rc = PTR_ERR(ecryptfs_folio);</div><div class='ctx'> 			printk(KERN_ERR "%s: Error getting page at "</div><div class='ctx'> 			       "index [%ld] from eCryptfs inode "</div><div class='ctx'> 			       "mapping; rc = [%d]\n", __func__,</div><div class='ctx'> 			       ecryptfs_page_idx, rc);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='del'>-		ecryptfs_page_virt = kmap_atomic(ecryptfs_page);</div><div class='add'>+		folio_lock(ecryptfs_folio);</div><div class='add'>+		ecryptfs_page_virt = kmap_local_folio(ecryptfs_folio, 0);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * pos: where we're now writing, offset: where the request was</div><div class='hunk'>@@ -163,18 +163,18 @@ int ecryptfs_write(struct inode *ecryptfs_inode, char *data, loff_t offset,</div><div class='ctx'> 			       (data + data_offset), num_bytes);</div><div class='ctx'> 			data_offset += num_bytes;</div><div class='ctx'> 		}</div><div class='del'>-		kunmap_atomic(ecryptfs_page_virt);</div><div class='del'>-		flush_dcache_page(ecryptfs_page);</div><div class='del'>-		SetPageUptodate(ecryptfs_page);</div><div class='del'>-		unlock_page(ecryptfs_page);</div><div class='add'>+		kunmap_local(ecryptfs_page_virt);</div><div class='add'>+		flush_dcache_folio(ecryptfs_folio);</div><div class='add'>+		folio_mark_uptodate(ecryptfs_folio);</div><div class='add'>+		folio_unlock(ecryptfs_folio);</div><div class='ctx'> 		if (crypt_stat-&gt;flags &amp; ECRYPTFS_ENCRYPTED)</div><div class='del'>-			rc = ecryptfs_encrypt_page(ecryptfs_page);</div><div class='add'>+			rc = ecryptfs_encrypt_page(ecryptfs_folio);</div><div class='ctx'> 		else</div><div class='ctx'> 			rc = ecryptfs_write_lower_page_segment(ecryptfs_inode,</div><div class='del'>-						ecryptfs_page,</div><div class='add'>+						ecryptfs_folio,</div><div class='ctx'> 						start_offset_in_page,</div><div class='ctx'> 						data_offset);</div><div class='del'>-		put_page(ecryptfs_page);</div><div class='add'>+		folio_put(ecryptfs_folio);</div><div class='ctx'> 		if (rc) {</div><div class='ctx'> 			printk(KERN_ERR "%s: Error encrypting "</div><div class='ctx'> 			       "page; rc = [%d]\n", __func__, rc);</div><div class='hunk'>@@ -228,7 +228,7 @@ int ecryptfs_read_lower(char *data, loff_t offset, size_t size,</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * ecryptfs_read_lower_page_segment</div><div class='del'>- * @page_for_ecryptfs: The page into which data for eCryptfs will be</div><div class='add'>+ * @folio_for_ecryptfs: The folio into which data for eCryptfs will be</div><div class='ctx'>  *                     written</div><div class='ctx'>  * @page_index: Page index in @page_for_ecryptfs from which to start</div><div class='ctx'>  *		writing</div><div class='hunk'>@@ -243,7 +243,7 @@ int ecryptfs_read_lower(char *data, loff_t offset, size_t size,</div><div class='ctx'>  *</div><div class='ctx'>  * Returns zero on success; non-zero otherwise</div><div class='ctx'>  */</div><div class='del'>-int ecryptfs_read_lower_page_segment(struct page *page_for_ecryptfs,</div><div class='add'>+int ecryptfs_read_lower_page_segment(struct folio *folio_for_ecryptfs,</div><div class='ctx'> 				     pgoff_t page_index,</div><div class='ctx'> 				     size_t offset_in_page, size_t size,</div><div class='ctx'> 				     struct inode *ecryptfs_inode)</div><div class='hunk'>@@ -252,12 +252,12 @@ int ecryptfs_read_lower_page_segment(struct page *page_for_ecryptfs,</div><div class='ctx'> 	loff_t offset;</div><div class='ctx'> 	int rc;</div><div class='ctx'> </div><div class='del'>-	offset = ((((loff_t)page_index) &lt;&lt; PAGE_SHIFT) + offset_in_page);</div><div class='del'>-	virt = kmap(page_for_ecryptfs);</div><div class='add'>+	offset = (loff_t)page_index * PAGE_SIZE + offset_in_page;</div><div class='add'>+	virt = kmap_local_folio(folio_for_ecryptfs, 0);</div><div class='ctx'> 	rc = ecryptfs_read_lower(virt, offset, size, ecryptfs_inode);</div><div class='ctx'> 	if (rc &gt; 0)</div><div class='ctx'> 		rc = 0;</div><div class='del'>-	kunmap(page_for_ecryptfs);</div><div class='del'>-	flush_dcache_page(page_for_ecryptfs);</div><div class='add'>+	kunmap_local(virt);</div><div class='add'>+	flush_dcache_folio(folio_for_ecryptfs);</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/ecryptfs/super.c b/fs/ecryptfs/super.c<br/>index 39116af0390f..3bc21d677564 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ecryptfs/super.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ecryptfs/super.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ecryptfs/super.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ecryptfs/super.c</a></div><div class='hunk'>@@ -38,13 +38,10 @@ static struct inode *ecryptfs_alloc_inode(struct super_block *sb)</div><div class='ctx'> 	struct ecryptfs_inode_info *inode_info;</div><div class='ctx'> 	struct inode *inode = NULL;</div><div class='ctx'> </div><div class='del'>-	inode_info = kmem_cache_alloc(ecryptfs_inode_info_cache, GFP_KERNEL);</div><div class='add'>+	inode_info = alloc_inode_sb(sb, ecryptfs_inode_info_cache, GFP_KERNEL);</div><div class='ctx'> 	if (unlikely(!inode_info))</div><div class='ctx'> 		goto out;</div><div class='del'>-	if (ecryptfs_init_crypt_stat(&amp;inode_info-&gt;crypt_stat)) {</div><div class='del'>-		kmem_cache_free(ecryptfs_inode_info_cache, inode_info);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	ecryptfs_init_crypt_stat(&amp;inode_info-&gt;crypt_stat);</div><div class='ctx'> 	mutex_init(&amp;inode_info-&gt;lower_file_mutex);</div><div class='ctx'> 	atomic_set(&amp;inode_info-&gt;lower_file_count, 0);</div><div class='ctx'> 	inode_info-&gt;lower_file = NULL;</div><div class='hunk'>@@ -172,7 +169,6 @@ const struct super_operations ecryptfs_sops = {</div><div class='ctx'> 	.destroy_inode = ecryptfs_destroy_inode,</div><div class='ctx'> 	.free_inode = ecryptfs_free_inode,</div><div class='ctx'> 	.statfs = ecryptfs_statfs,</div><div class='del'>-	.remount_fs = NULL,</div><div class='ctx'> 	.evict_inode = ecryptfs_evict_inode,</div><div class='ctx'> 	.show_options = ecryptfs_show_options</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/efivarfs/Makefile b/fs/efivarfs/Makefile<br/>index 0b1c5e63eb71..7bfc2f9754a8 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/efivarfs/Makefile?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/efivarfs/Makefile</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/efivarfs/Makefile?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/efivarfs/Makefile</a></div><div class='hunk'>@@ -5,4 +5,4 @@</div><div class='ctx'> </div><div class='ctx'> obj-$(CONFIG_EFIVAR_FS)		+= efivarfs.o</div><div class='ctx'> </div><div class='del'>-efivarfs-objs			:= inode.o file.o super.o</div><div class='add'>+efivarfs-objs			:= inode.o file.o super.o vars.o</div><div class='head'>diff --git a/fs/efivarfs/file.c b/fs/efivarfs/file.c<br/>index d57ee15874f9..cb1b6d0c3454 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/efivarfs/file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/efivarfs/file.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/efivarfs/file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/efivarfs/file.c</a></div><div class='hunk'>@@ -36,28 +36,41 @@ static ssize_t efivarfs_file_write(struct file *file,</div><div class='ctx'> 	if (IS_ERR(data))</div><div class='ctx'> 		return PTR_ERR(data);</div><div class='ctx'> </div><div class='add'>+	inode_lock(inode);</div><div class='add'>+	if (var-&gt;removed) {</div><div class='add'>+		/*</div><div class='add'>+		 * file got removed; don't allow a set.  Caused by an</div><div class='add'>+		 * unsuccessful create or successful delete write</div><div class='add'>+		 * racing with us.</div><div class='add'>+		 */</div><div class='add'>+		bytes = -EIO;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	bytes = efivar_entry_set_get_size(var, attributes, &amp;datasize,</div><div class='ctx'> 					  data, &amp;set);</div><div class='del'>-	if (!set &amp;&amp; bytes) {</div><div class='add'>+	if (!set) {</div><div class='ctx'> 		if (bytes == -ENOENT)</div><div class='ctx'> 			bytes = -EIO;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (bytes == -ENOENT) {</div><div class='del'>-		drop_nlink(inode);</div><div class='del'>-		d_delete(file-&gt;f_path.dentry);</div><div class='del'>-		dput(file-&gt;f_path.dentry);</div><div class='add'>+		/*</div><div class='add'>+		 * zero size signals to release that the write deleted</div><div class='add'>+		 * the variable</div><div class='add'>+		 */</div><div class='add'>+		i_size_write(inode, 0);</div><div class='ctx'> 	} else {</div><div class='del'>-		inode_lock(inode);</div><div class='ctx'> 		i_size_write(inode, datasize + sizeof(attributes));</div><div class='del'>-		inode-&gt;i_mtime = current_time(inode);</div><div class='del'>-		inode_unlock(inode);</div><div class='add'>+		inode_set_mtime_to_ts(inode, inode_set_ctime_current(inode));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	bytes = count;</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='add'>+	inode_unlock(inode);</div><div class='add'>+</div><div class='ctx'> 	kfree(data);</div><div class='ctx'> </div><div class='ctx'> 	return bytes;</div><div class='hunk'>@@ -106,9 +119,36 @@ out_free:</div><div class='ctx'> 	return size;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int efivarfs_file_release(struct inode *inode, struct file *file)</div><div class='add'>+{</div><div class='add'>+	struct efivar_entry *var = inode-&gt;i_private;</div><div class='add'>+</div><div class='add'>+	inode_lock(inode);</div><div class='add'>+	var-&gt;removed = (--var-&gt;open_count == 0 &amp;&amp; i_size_read(inode) == 0);</div><div class='add'>+	inode_unlock(inode);</div><div class='add'>+</div><div class='add'>+	if (var-&gt;removed)</div><div class='add'>+		simple_recursive_removal(file-&gt;f_path.dentry, NULL);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int efivarfs_file_open(struct inode *inode, struct file *file)</div><div class='add'>+{</div><div class='add'>+	struct efivar_entry *entry = inode-&gt;i_private;</div><div class='add'>+</div><div class='add'>+	file-&gt;private_data = entry;</div><div class='add'>+</div><div class='add'>+	inode_lock(inode);</div><div class='add'>+	entry-&gt;open_count++;</div><div class='add'>+	inode_unlock(inode);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> const struct file_operations efivarfs_file_operations = {</div><div class='del'>-	.open	= simple_open,</div><div class='del'>-	.read	= efivarfs_file_read,</div><div class='del'>-	.write	= efivarfs_file_write,</div><div class='del'>-	.llseek	= no_llseek,</div><div class='add'>+	.open		= efivarfs_file_open,</div><div class='add'>+	.read		= efivarfs_file_read,</div><div class='add'>+	.write		= efivarfs_file_write,</div><div class='add'>+	.release	= efivarfs_file_release,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/efivarfs/inode.c b/fs/efivarfs/inode.c<br/>index 939e5e242b98..95dcad83da11 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/efivarfs/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/efivarfs/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/efivarfs/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/efivarfs/inode.c</a></div><div class='hunk'>@@ -21,11 +21,15 @@ struct inode *efivarfs_get_inode(struct super_block *sb,</div><div class='ctx'> 				dev_t dev, bool is_removable)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = new_inode(sb);</div><div class='add'>+	struct efivarfs_fs_info *fsi = sb-&gt;s_fs_info;</div><div class='add'>+	struct efivarfs_mount_opts *opts = &amp;fsi-&gt;mount_opts;</div><div class='ctx'> </div><div class='ctx'> 	if (inode) {</div><div class='add'>+		inode-&gt;i_uid = opts-&gt;uid;</div><div class='add'>+		inode-&gt;i_gid = opts-&gt;gid;</div><div class='ctx'> 		inode-&gt;i_ino = get_next_ino();</div><div class='ctx'> 		inode-&gt;i_mode = mode;</div><div class='del'>-		inode-&gt;i_atime = inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+		simple_inode_init_ts(inode);</div><div class='ctx'> 		inode-&gt;i_flags = is_removable ? 0 : S_IMMUTABLE;</div><div class='ctx'> 		switch (mode &amp; S_IFMT) {</div><div class='ctx'> 		case S_IFREG:</div><div class='hunk'>@@ -47,7 +51,7 @@ struct inode *efivarfs_get_inode(struct super_block *sb,</div><div class='ctx'>  *</div><div class='ctx'>  *	VariableName-12345678-1234-1234-1234-1234567891bc</div><div class='ctx'>  */</div><div class='del'>-bool efivarfs_valid_name(const char *str, int len)</div><div class='add'>+static bool efivarfs_valid_name(const char *str, int len)</div><div class='ctx'> {</div><div class='ctx'> 	const char *s = str + len - EFI_VARIABLE_GUID_LEN;</div><div class='ctx'> </div><div class='hunk'>@@ -70,37 +74,37 @@ bool efivarfs_valid_name(const char *str, int len)</div><div class='ctx'> 	return uuid_is_valid(s);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int efivarfs_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int efivarfs_create(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 			   struct dentry *dentry, umode_t mode, bool excl)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = NULL;</div><div class='ctx'> 	struct efivar_entry *var;</div><div class='ctx'> 	int namelen, i = 0, err = 0;</div><div class='ctx'> 	bool is_removable = false;</div><div class='add'>+	efi_guid_t vendor;</div><div class='ctx'> </div><div class='ctx'> 	if (!efivarfs_valid_name(dentry-&gt;d_name.name, dentry-&gt;d_name.len))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	var = kzalloc(sizeof(struct efivar_entry), GFP_KERNEL);</div><div class='del'>-	if (!var)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='ctx'> 	/* length of the variable name itself: remove GUID and separator */</div><div class='ctx'> 	namelen = dentry-&gt;d_name.len - EFI_VARIABLE_GUID_LEN - 1;</div><div class='ctx'> </div><div class='del'>-	err = guid_parse(dentry-&gt;d_name.name + namelen + 1, &amp;var-&gt;var.VendorGuid);</div><div class='add'>+	err = guid_parse(dentry-&gt;d_name.name + namelen + 1, &amp;vendor);</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto out;</div><div class='add'>+		return err;</div><div class='add'>+	if (guid_equal(&amp;vendor, &amp;LINUX_EFI_RANDOM_SEED_TABLE_GUID))</div><div class='add'>+		return -EPERM;</div><div class='ctx'> </div><div class='del'>-	if (efivar_variable_is_removable(var-&gt;var.VendorGuid,</div><div class='add'>+	if (efivar_variable_is_removable(vendor,</div><div class='ctx'> 					 dentry-&gt;d_name.name, namelen))</div><div class='ctx'> 		is_removable = true;</div><div class='ctx'> </div><div class='ctx'> 	inode = efivarfs_get_inode(dir-&gt;i_sb, dir, mode, 0, is_removable);</div><div class='del'>-	if (!inode) {</div><div class='del'>-		err = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (!inode)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	var = efivar_entry(inode);</div><div class='add'>+</div><div class='add'>+	var-&gt;var.VendorGuid = vendor;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; namelen; i++)</div><div class='ctx'> 		var-&gt;var.VariableName[i] = dentry-&gt;d_name.name[i];</div><div class='hunk'>@@ -108,21 +112,10 @@ static int efivarfs_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	var-&gt;var.VariableName[i] = '\0';</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_private = var;</div><div class='del'>-	kmemleak_ignore(var);</div><div class='ctx'> </div><div class='del'>-	err = efivar_entry_add(var, &amp;efivarfs_list);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	d_instantiate(dentry, inode);</div><div class='del'>-	dget(dentry);</div><div class='del'>-out:</div><div class='del'>-	if (err) {</div><div class='del'>-		kfree(var);</div><div class='del'>-		if (inode)</div><div class='del'>-			iput(inode);</div><div class='del'>-	}</div><div class='del'>-	return err;</div><div class='add'>+	d_make_persistent(dentry, inode);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int efivarfs_unlink(struct inode *dir, struct dentry *dentry)</div><div class='hunk'>@@ -132,9 +125,7 @@ static int efivarfs_unlink(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	if (efivar_entry_delete(var))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	drop_nlink(d_inode(dentry));</div><div class='del'>-	dput(dentry);</div><div class='del'>-	return 0;</div><div class='add'>+	return simple_unlink(dir, dentry);</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct inode_operations efivarfs_dir_inode_operations = {</div><div class='hunk'>@@ -144,7 +135,7 @@ const struct inode_operations efivarfs_dir_inode_operations = {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-efivarfs_fileattr_get(struct dentry *dentry, struct fileattr *fa)</div><div class='add'>+efivarfs_fileattr_get(struct dentry *dentry, struct file_kattr *fa)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int i_flags;</div><div class='ctx'> 	unsigned int flags = 0;</div><div class='hunk'>@@ -159,8 +150,8 @@ efivarfs_fileattr_get(struct dentry *dentry, struct fileattr *fa)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-efivarfs_fileattr_set(struct user_namespace *mnt_userns,</div><div class='del'>-		      struct dentry *dentry, struct fileattr *fa)</div><div class='add'>+efivarfs_fileattr_set(struct mnt_idmap *idmap,</div><div class='add'>+		      struct dentry *dentry, struct file_kattr *fa)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int i_flags = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -178,7 +169,24 @@ efivarfs_fileattr_set(struct user_namespace *mnt_userns,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/* copy of simple_setattr except that it doesn't do i_size updates */</div><div class='add'>+static int efivarfs_setattr(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='add'>+		   struct iattr *iattr)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='add'>+	int error;</div><div class='add'>+</div><div class='add'>+	error = setattr_prepare(idmap, dentry, iattr);</div><div class='add'>+	if (error)</div><div class='add'>+		return error;</div><div class='add'>+</div><div class='add'>+	setattr_copy(idmap, inode, iattr);</div><div class='add'>+	mark_inode_dirty(inode);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static const struct inode_operations efivarfs_file_inode_operations = {</div><div class='ctx'> 	.fileattr_get = efivarfs_fileattr_get,</div><div class='ctx'> 	.fileattr_set = efivarfs_fileattr_set,</div><div class='add'>+	.setattr      = efivarfs_setattr,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/efivarfs/internal.h b/fs/efivarfs/internal.h<br/>index 30ae44cb7453..f913b6824289 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/efivarfs/internal.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/efivarfs/internal.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/efivarfs/internal.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/efivarfs/internal.h</a></div><div class='hunk'>@@ -6,15 +6,62 @@</div><div class='ctx'> #ifndef EFIVAR_FS_INTERNAL_H</div><div class='ctx'> #define EFIVAR_FS_INTERNAL_H</div><div class='ctx'> </div><div class='del'>-#include &lt;linux/list.h&gt;</div><div class='add'>+#include &lt;linux/efi.h&gt;</div><div class='add'>+</div><div class='add'>+struct efivarfs_mount_opts {</div><div class='add'>+	kuid_t uid;</div><div class='add'>+	kgid_t gid;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct efivarfs_fs_info {</div><div class='add'>+	struct efivarfs_mount_opts mount_opts;</div><div class='add'>+	struct super_block *sb;</div><div class='add'>+	struct notifier_block nb;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct efi_variable {</div><div class='add'>+	efi_char16_t  VariableName[EFI_VAR_NAME_LEN/sizeof(efi_char16_t)];</div><div class='add'>+	efi_guid_t    VendorGuid;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct efivar_entry {</div><div class='add'>+	struct efi_variable var;</div><div class='add'>+	struct inode vfs_inode;</div><div class='add'>+	unsigned long open_count;</div><div class='add'>+	bool removed;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static inline struct efivar_entry *efivar_entry(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	return container_of(inode, struct efivar_entry, vfs_inode);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int efivar_init(int (*func)(efi_char16_t *, efi_guid_t, unsigned long, void *),</div><div class='add'>+		void *data, bool duplicate_check);</div><div class='add'>+</div><div class='add'>+int efivar_entry_delete(struct efivar_entry *entry);</div><div class='add'>+</div><div class='add'>+int efivar_entry_size(struct efivar_entry *entry, unsigned long *size);</div><div class='add'>+int __efivar_entry_get(struct efivar_entry *entry, u32 *attributes,</div><div class='add'>+		       unsigned long *size, void *data);</div><div class='add'>+int efivar_entry_get(struct efivar_entry *entry, u32 *attributes,</div><div class='add'>+		     unsigned long *size, void *data);</div><div class='add'>+int efivar_entry_set_get_size(struct efivar_entry *entry, u32 attributes,</div><div class='add'>+			      unsigned long *size, void *data, bool *set);</div><div class='add'>+</div><div class='add'>+</div><div class='add'>+bool efivar_validate(efi_guid_t vendor, efi_char16_t *var_name, u8 *data,</div><div class='add'>+		     unsigned long data_size);</div><div class='add'>+bool efivar_variable_is_removable(efi_guid_t vendor, const char *name,</div><div class='add'>+				  size_t len);</div><div class='add'>+char *efivar_get_utf8name(const efi_char16_t *name16, efi_guid_t *vendor);</div><div class='add'>+bool efivarfs_variable_is_present(efi_char16_t *variable_name,</div><div class='add'>+				  efi_guid_t *vendor, void *data);</div><div class='ctx'> </div><div class='ctx'> extern const struct file_operations efivarfs_file_operations;</div><div class='ctx'> extern const struct inode_operations efivarfs_dir_inode_operations;</div><div class='del'>-extern bool efivarfs_valid_name(const char *str, int len);</div><div class='ctx'> extern struct inode *efivarfs_get_inode(struct super_block *sb,</div><div class='ctx'> 			const struct inode *dir, int mode, dev_t dev,</div><div class='ctx'> 			bool is_removable);</div><div class='ctx'> </div><div class='del'>-extern struct list_head efivarfs_list;</div><div class='del'>-</div><div class='ctx'> #endif /* EFIVAR_FS_INTERNAL_H */</div><div class='head'>diff --git a/fs/efivarfs/super.c b/fs/efivarfs/super.c<br/>index 15880a68faad..9da992925920 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/efivarfs/super.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/efivarfs/super.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/efivarfs/super.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/efivarfs/super.c</a></div><div class='hunk'>@@ -8,25 +8,131 @@</div><div class='ctx'> #include &lt;linux/efi.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/fs_context.h&gt;</div><div class='add'>+#include &lt;linux/fs_parser.h&gt;</div><div class='ctx'> #include &lt;linux/module.h&gt;</div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='ctx'> #include &lt;linux/ucs2_string.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='add'>+#include &lt;linux/suspend.h&gt;</div><div class='ctx'> #include &lt;linux/magic.h&gt;</div><div class='add'>+#include &lt;linux/statfs.h&gt;</div><div class='add'>+#include &lt;linux/notifier.h&gt;</div><div class='add'>+#include &lt;linux/printk.h&gt;</div><div class='add'>+#include &lt;linux/namei.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "internal.h"</div><div class='add'>+#include "../internal.h"</div><div class='ctx'> </div><div class='del'>-LIST_HEAD(efivarfs_list);</div><div class='add'>+static int efivarfs_ops_notifier(struct notifier_block *nb, unsigned long event,</div><div class='add'>+				 void *data)</div><div class='add'>+{</div><div class='add'>+	struct efivarfs_fs_info *sfi = container_of(nb, struct efivarfs_fs_info, nb);</div><div class='add'>+</div><div class='add'>+	switch (event) {</div><div class='add'>+	case EFIVAR_OPS_RDONLY:</div><div class='add'>+		sfi-&gt;sb-&gt;s_flags |= SB_RDONLY;</div><div class='add'>+		break;</div><div class='add'>+	case EFIVAR_OPS_RDWR:</div><div class='add'>+		sfi-&gt;sb-&gt;s_flags &amp;= ~SB_RDONLY;</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		return NOTIFY_DONE;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return NOTIFY_OK;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct inode *efivarfs_alloc_inode(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct efivar_entry *entry = kzalloc(sizeof(*entry), GFP_KERNEL);</div><div class='add'>+</div><div class='add'>+	if (!entry)</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	inode_init_once(&amp;entry-&gt;vfs_inode);</div><div class='add'>+	entry-&gt;removed = false;</div><div class='add'>+</div><div class='add'>+	return &amp;entry-&gt;vfs_inode;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void efivarfs_free_inode(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct efivar_entry *entry = efivar_entry(inode);</div><div class='add'>+</div><div class='add'>+	kfree(entry);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int efivarfs_show_options(struct seq_file *m, struct dentry *root)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = root-&gt;d_sb;</div><div class='add'>+	struct efivarfs_fs_info *sbi = sb-&gt;s_fs_info;</div><div class='add'>+	struct efivarfs_mount_opts *opts = &amp;sbi-&gt;mount_opts;</div><div class='add'>+</div><div class='add'>+	if (!uid_eq(opts-&gt;uid, GLOBAL_ROOT_UID))</div><div class='add'>+		seq_printf(m, ",uid=%u",</div><div class='add'>+				from_kuid_munged(&amp;init_user_ns, opts-&gt;uid));</div><div class='add'>+	if (!gid_eq(opts-&gt;gid, GLOBAL_ROOT_GID))</div><div class='add'>+		seq_printf(m, ",gid=%u",</div><div class='add'>+				from_kgid_munged(&amp;init_user_ns, opts-&gt;gid));</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-static void efivarfs_evict_inode(struct inode *inode)</div><div class='add'>+static int efivarfs_statfs(struct dentry *dentry, struct kstatfs *buf)</div><div class='ctx'> {</div><div class='del'>-	clear_inode(inode);</div><div class='add'>+	const u32 attr = EFI_VARIABLE_NON_VOLATILE |</div><div class='add'>+			 EFI_VARIABLE_BOOTSERVICE_ACCESS |</div><div class='add'>+			 EFI_VARIABLE_RUNTIME_ACCESS;</div><div class='add'>+	u64 storage_space, remaining_space, max_variable_size;</div><div class='add'>+	u64 id = huge_encode_dev(dentry-&gt;d_sb-&gt;s_dev);</div><div class='add'>+	efi_status_t status;</div><div class='add'>+</div><div class='add'>+	/* Some UEFI firmware does not implement QueryVariableInfo() */</div><div class='add'>+	storage_space = remaining_space = 0;</div><div class='add'>+	if (efi_rt_services_supported(EFI_RT_SUPPORTED_QUERY_VARIABLE_INFO)) {</div><div class='add'>+		status = efivar_query_variable_info(attr, &amp;storage_space,</div><div class='add'>+						    &amp;remaining_space,</div><div class='add'>+						    &amp;max_variable_size);</div><div class='add'>+		if (status != EFI_SUCCESS &amp;&amp; status != EFI_UNSUPPORTED)</div><div class='add'>+			pr_warn_ratelimited("query_variable_info() failed: 0x%lx\n",</div><div class='add'>+					    status);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This is not a normal filesystem, so no point in pretending it has a block</div><div class='add'>+	 * size; we declare f_bsize to 1, so that we can then report the exact value</div><div class='add'>+	 * sent by EFI QueryVariableInfo in f_blocks and f_bfree</div><div class='add'>+	 */</div><div class='add'>+	buf-&gt;f_bsize	= 1;</div><div class='add'>+	buf-&gt;f_namelen	= NAME_MAX;</div><div class='add'>+	buf-&gt;f_blocks	= storage_space;</div><div class='add'>+	buf-&gt;f_bfree	= remaining_space;</div><div class='add'>+	buf-&gt;f_type	= dentry-&gt;d_sb-&gt;s_magic;</div><div class='add'>+	buf-&gt;f_fsid	= u64_to_fsid(id);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * In f_bavail we declare the free space that the kernel will allow writing</div><div class='add'>+	 * when the storage_paranoia x86 quirk is active. To use more, users</div><div class='add'>+	 * should boot the kernel with efi_no_storage_paranoia.</div><div class='add'>+	 */</div><div class='add'>+	if (remaining_space &gt; efivar_reserved_space())</div><div class='add'>+		buf-&gt;f_bavail = remaining_space - efivar_reserved_space();</div><div class='add'>+	else</div><div class='add'>+		buf-&gt;f_bavail = 0;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int efivarfs_freeze_fs(struct super_block *sb);</div><div class='add'>+static int efivarfs_unfreeze_fs(struct super_block *sb);</div><div class='add'>+</div><div class='ctx'> static const struct super_operations efivarfs_ops = {</div><div class='del'>-	.statfs = simple_statfs,</div><div class='del'>-	.drop_inode = generic_delete_inode,</div><div class='del'>-	.evict_inode = efivarfs_evict_inode,</div><div class='add'>+	.statfs = efivarfs_statfs,</div><div class='add'>+	.drop_inode = inode_just_drop,</div><div class='add'>+	.alloc_inode = efivarfs_alloc_inode,</div><div class='add'>+	.free_inode = efivarfs_free_inode,</div><div class='add'>+	.show_options = efivarfs_show_options,</div><div class='add'>+	.freeze_fs = efivarfs_freeze_fs,</div><div class='add'>+	.unfreeze_fs = efivarfs_unfreeze_fs,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -46,6 +152,10 @@ static int efivarfs_d_compare(const struct dentry *dentry,</div><div class='ctx'> {</div><div class='ctx'> 	int guid = len - EFI_VARIABLE_GUID_LEN;</div><div class='ctx'> </div><div class='add'>+	/* Parallel lookups may produce a temporary invalid filename */</div><div class='add'>+	if (guid &lt;= 0)</div><div class='add'>+		return 1;</div><div class='add'>+</div><div class='ctx'> 	if (name-&gt;len != len)</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='hunk'>@@ -63,9 +173,6 @@ static int efivarfs_d_hash(const struct dentry *dentry, struct qstr *qstr)</div><div class='ctx'> 	const unsigned char *s = qstr-&gt;name;</div><div class='ctx'> 	unsigned int len = qstr-&gt;len;</div><div class='ctx'> </div><div class='del'>-	if (!efivarfs_valid_name(s, len))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='ctx'> 	while (len-- &gt; EFI_VARIABLE_GUID_LEN)</div><div class='ctx'> 		hash = partial_name_hash(*s++, hash);</div><div class='ctx'> </div><div class='hunk'>@@ -80,7 +187,6 @@ static int efivarfs_d_hash(const struct dentry *dentry, struct qstr *qstr)</div><div class='ctx'> static const struct dentry_operations efivarfs_d_ops = {</div><div class='ctx'> 	.d_compare = efivarfs_d_compare,</div><div class='ctx'> 	.d_hash = efivarfs_d_hash,</div><div class='del'>-	.d_delete = always_delete_dentry,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static struct dentry *efivarfs_alloc_dentry(struct dentry *parent, char *name)</div><div class='hunk'>@@ -103,71 +209,77 @@ static struct dentry *efivarfs_alloc_dentry(struct dentry *parent, char *name)</div><div class='ctx'> 	return ERR_PTR(-ENOMEM);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int efivarfs_callback(efi_char16_t *name16, efi_guid_t vendor,</div><div class='del'>-			     unsigned long name_size, void *data)</div><div class='add'>+bool efivarfs_variable_is_present(efi_char16_t *variable_name,</div><div class='add'>+				  efi_guid_t *vendor, void *data)</div><div class='add'>+{</div><div class='add'>+	char *name = efivar_get_utf8name(variable_name, vendor);</div><div class='add'>+	struct super_block *sb = data;</div><div class='add'>+	struct dentry *dentry;</div><div class='add'>+</div><div class='add'>+	if (!name)</div><div class='add'>+		/*</div><div class='add'>+		 * If the allocation failed there'll already be an</div><div class='add'>+		 * error in the log (and likely a huge and growing</div><div class='add'>+		 * number of them since they system will be under</div><div class='add'>+		 * extreme memory pressure), so simply assume</div><div class='add'>+		 * collision for safety but don't add to the log</div><div class='add'>+		 * flood.</div><div class='add'>+		 */</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	dentry = try_lookup_noperm(&amp;QSTR(name), sb-&gt;s_root);</div><div class='add'>+	kfree(name);</div><div class='add'>+	if (!IS_ERR_OR_NULL(dentry))</div><div class='add'>+		dput(dentry);</div><div class='add'>+</div><div class='add'>+	return dentry != NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int efivarfs_create_dentry(struct super_block *sb, efi_char16_t *name16,</div><div class='add'>+				  unsigned long name_size, efi_guid_t vendor,</div><div class='add'>+				  char *name)</div><div class='ctx'> {</div><div class='del'>-	struct super_block *sb = (struct super_block *)data;</div><div class='ctx'> 	struct efivar_entry *entry;</div><div class='del'>-	struct inode *inode = NULL;</div><div class='add'>+	struct inode *inode;</div><div class='ctx'> 	struct dentry *dentry, *root = sb-&gt;s_root;</div><div class='ctx'> 	unsigned long size = 0;</div><div class='del'>-	char *name;</div><div class='ctx'> 	int len;</div><div class='ctx'> 	int err = -ENOMEM;</div><div class='ctx'> 	bool is_removable = false;</div><div class='ctx'> </div><div class='del'>-	entry = kzalloc(sizeof(*entry), GFP_KERNEL);</div><div class='del'>-	if (!entry)</div><div class='del'>-		return err;</div><div class='add'>+	/* length of the variable name itself: remove GUID and separator */</div><div class='add'>+	len = strlen(name) - EFI_VARIABLE_GUID_LEN - 1;</div><div class='ctx'> </div><div class='del'>-	memcpy(entry-&gt;var.VariableName, name16, name_size);</div><div class='del'>-	memcpy(&amp;(entry-&gt;var.VendorGuid), &amp;vendor, sizeof(efi_guid_t));</div><div class='del'>-</div><div class='del'>-	len = ucs2_utf8size(entry-&gt;var.VariableName);</div><div class='del'>-</div><div class='del'>-	/* name, plus '-', plus GUID, plus NUL*/</div><div class='del'>-	name = kmalloc(len + 1 + EFI_VARIABLE_GUID_LEN + 1, GFP_KERNEL);</div><div class='del'>-	if (!name)</div><div class='del'>-		goto fail;</div><div class='del'>-</div><div class='del'>-	ucs2_as_utf8(name, entry-&gt;var.VariableName, len);</div><div class='del'>-</div><div class='del'>-	if (efivar_variable_is_removable(entry-&gt;var.VendorGuid, name, len))</div><div class='add'>+	if (efivar_variable_is_removable(vendor, name, len))</div><div class='ctx'> 		is_removable = true;</div><div class='ctx'> </div><div class='del'>-	name[len] = '-';</div><div class='del'>-</div><div class='del'>-	efi_guid_to_str(&amp;entry-&gt;var.VendorGuid, name + len + 1);</div><div class='del'>-</div><div class='del'>-	name[len + EFI_VARIABLE_GUID_LEN+1] = '\0';</div><div class='del'>-</div><div class='del'>-	/* replace invalid slashes like kobject_set_name_vargs does for /sys/firmware/efi/vars. */</div><div class='del'>-	strreplace(name, '/', '!');</div><div class='del'>-</div><div class='ctx'> 	inode = efivarfs_get_inode(sb, d_inode(root), S_IFREG | 0644, 0,</div><div class='ctx'> 				   is_removable);</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		goto fail_name;</div><div class='ctx'> </div><div class='add'>+	entry = efivar_entry(inode);</div><div class='add'>+</div><div class='add'>+	memcpy(entry-&gt;var.VariableName, name16, name_size);</div><div class='add'>+	memcpy(&amp;(entry-&gt;var.VendorGuid), &amp;vendor, sizeof(efi_guid_t));</div><div class='add'>+</div><div class='ctx'> 	dentry = efivarfs_alloc_dentry(root, name);</div><div class='ctx'> 	if (IS_ERR(dentry)) {</div><div class='ctx'> 		err = PTR_ERR(dentry);</div><div class='ctx'> 		goto fail_inode;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	efivar_entry_size(entry, &amp;size);</div><div class='del'>-	err = efivar_entry_add(entry, &amp;efivarfs_list);</div><div class='del'>-	if (err)</div><div class='del'>-		goto fail_inode;</div><div class='add'>+	__efivar_entry_get(entry, NULL, &amp;size, NULL);</div><div class='ctx'> </div><div class='ctx'> 	/* copied by the above to local storage in the dentry. */</div><div class='ctx'> 	kfree(name);</div><div class='ctx'> </div><div class='ctx'> 	inode_lock(inode);</div><div class='ctx'> 	inode-&gt;i_private = entry;</div><div class='del'>-	i_size_write(inode, size + sizeof(entry-&gt;var.Attributes));</div><div class='add'>+	i_size_write(inode, size + sizeof(__u32)); /* attributes + data */</div><div class='ctx'> 	inode_unlock(inode);</div><div class='del'>-	d_add(dentry, inode);</div><div class='add'>+	d_make_persistent(dentry, inode);</div><div class='add'>+	dput(dentry);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='hunk'>@@ -175,23 +287,64 @@ fail_inode:</div><div class='ctx'> 	iput(inode);</div><div class='ctx'> fail_name:</div><div class='ctx'> 	kfree(name);</div><div class='del'>-fail:</div><div class='del'>-	kfree(entry);</div><div class='add'>+</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int efivarfs_destroy(struct efivar_entry *entry, void *data)</div><div class='add'>+static int efivarfs_callback(efi_char16_t *name16, efi_guid_t vendor,</div><div class='add'>+			     unsigned long name_size, void *data)</div><div class='ctx'> {</div><div class='del'>-	int err = efivar_entry_remove(entry);</div><div class='add'>+	struct super_block *sb = (struct super_block *)data;</div><div class='add'>+	char *name;</div><div class='add'>+</div><div class='add'>+	if (guid_equal(&amp;vendor, &amp;LINUX_EFI_RANDOM_SEED_TABLE_GUID))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	name = efivar_get_utf8name(name16, &amp;vendor);</div><div class='add'>+	if (!name)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	return efivarfs_create_dentry(sb, name16, name_size, vendor, name);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+enum {</div><div class='add'>+	Opt_uid, Opt_gid,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct fs_parameter_spec efivarfs_parameters[] = {</div><div class='add'>+	fsparam_uid("uid", Opt_uid),</div><div class='add'>+	fsparam_gid("gid", Opt_gid),</div><div class='add'>+	{},</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int efivarfs_parse_param(struct fs_context *fc, struct fs_parameter *param)</div><div class='add'>+{</div><div class='add'>+	struct efivarfs_fs_info *sbi = fc-&gt;s_fs_info;</div><div class='add'>+	struct efivarfs_mount_opts *opts = &amp;sbi-&gt;mount_opts;</div><div class='add'>+	struct fs_parse_result result;</div><div class='add'>+	int opt;</div><div class='add'>+</div><div class='add'>+	opt = fs_parse(fc, efivarfs_parameters, param, &amp;result);</div><div class='add'>+	if (opt &lt; 0)</div><div class='add'>+		return opt;</div><div class='add'>+</div><div class='add'>+	switch (opt) {</div><div class='add'>+	case Opt_uid:</div><div class='add'>+		opts-&gt;uid = result.uid;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_gid:</div><div class='add'>+		opts-&gt;gid = result.gid;</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='del'>-	kfree(entry);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int efivarfs_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> {</div><div class='add'>+	struct efivarfs_fs_info *sfi = sb-&gt;s_fs_info;</div><div class='ctx'> 	struct inode *inode = NULL;</div><div class='ctx'> 	struct dentry *root;</div><div class='ctx'> 	int err;</div><div class='hunk'>@@ -201,7 +354,8 @@ static int efivarfs_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> 	sb-&gt;s_blocksize_bits    = PAGE_SHIFT;</div><div class='ctx'> 	sb-&gt;s_magic             = EFIVARFS_MAGIC;</div><div class='ctx'> 	sb-&gt;s_op                = &amp;efivarfs_ops;</div><div class='del'>-	sb-&gt;s_d_op		= &amp;efivarfs_d_ops;</div><div class='add'>+	set_default_d_op(sb, &amp;efivarfs_d_ops);</div><div class='add'>+	sb-&gt;s_d_flags |= DCACHE_DONTCACHE;</div><div class='ctx'> 	sb-&gt;s_time_gran         = 1;</div><div class='ctx'> </div><div class='ctx'> 	if (!efivar_supports_writes())</div><div class='hunk'>@@ -217,13 +371,13 @@ static int efivarfs_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> 	if (!root)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	INIT_LIST_HEAD(&amp;efivarfs_list);</div><div class='del'>-</div><div class='del'>-	err = efivar_init(efivarfs_callback, (void *)sb, true, &amp;efivarfs_list);</div><div class='add'>+	sfi-&gt;sb = sb;</div><div class='add'>+	sfi-&gt;nb.notifier_call = efivarfs_ops_notifier;</div><div class='add'>+	err = blocking_notifier_chain_register(&amp;efivar_ops_nh, &amp;sfi-&gt;nb);</div><div class='ctx'> 	if (err)</div><div class='del'>-		__efivar_entry_iter(efivarfs_destroy, &amp;efivarfs_list, NULL, NULL);</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='del'>-	return err;</div><div class='add'>+	return efivar_init(efivarfs_callback, sb, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int efivarfs_get_tree(struct fs_context *fc)</div><div class='hunk'>@@ -231,22 +385,147 @@ static int efivarfs_get_tree(struct fs_context *fc)</div><div class='ctx'> 	return get_tree_single(fc, efivarfs_fill_super);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int efivarfs_reconfigure(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	if (!efivar_supports_writes() &amp;&amp; !(fc-&gt;sb_flags &amp; SB_RDONLY)) {</div><div class='add'>+		pr_err("Firmware does not support SetVariableRT. Can not remount with rw\n");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void efivarfs_free(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	kfree(fc-&gt;s_fs_info);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static const struct fs_context_operations efivarfs_context_ops = {</div><div class='ctx'> 	.get_tree	= efivarfs_get_tree,</div><div class='add'>+	.parse_param	= efivarfs_parse_param,</div><div class='add'>+	.reconfigure	= efivarfs_reconfigure,</div><div class='add'>+	.free		= efivarfs_free,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+static int efivarfs_check_missing(efi_char16_t *name16, efi_guid_t vendor,</div><div class='add'>+				  unsigned long name_size, void *data)</div><div class='add'>+{</div><div class='add'>+	char *name;</div><div class='add'>+	struct super_block *sb = data;</div><div class='add'>+	struct dentry *dentry;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	if (guid_equal(&amp;vendor, &amp;LINUX_EFI_RANDOM_SEED_TABLE_GUID))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	name = efivar_get_utf8name(name16, &amp;vendor);</div><div class='add'>+	if (!name)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	dentry = try_lookup_noperm(&amp;QSTR(name), sb-&gt;s_root);</div><div class='add'>+	if (IS_ERR(dentry)) {</div><div class='add'>+		err = PTR_ERR(dentry);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!dentry) {</div><div class='add'>+		/* found missing entry */</div><div class='add'>+		pr_info("efivarfs: creating variable %s\n", name);</div><div class='add'>+		return efivarfs_create_dentry(sb, name16, name_size, vendor, name);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	dput(dentry);</div><div class='add'>+	err = 0;</div><div class='add'>+</div><div class='add'>+ out:</div><div class='add'>+	kfree(name);</div><div class='add'>+</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct file_system_type efivarfs_type;</div><div class='add'>+</div><div class='add'>+static int efivarfs_freeze_fs(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	/* Nothing for us to do. */</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int efivarfs_unfreeze_fs(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct dentry *child = NULL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Unconditionally resync the variable state on a thaw request.</div><div class='add'>+	 * Given the size of efivarfs it really doesn't matter to simply</div><div class='add'>+	 * iterate through all of the entries and resync. Freeze/thaw</div><div class='add'>+	 * requests are rare enough for that to not matter and the</div><div class='add'>+	 * number of entries is pretty low too. So we really don't care.</div><div class='add'>+	 */</div><div class='add'>+	pr_info("efivarfs: resyncing variable state\n");</div><div class='add'>+	for (;;) {</div><div class='add'>+		int err;</div><div class='add'>+		unsigned long size = 0;</div><div class='add'>+		struct inode *inode;</div><div class='add'>+		struct efivar_entry *entry;</div><div class='add'>+</div><div class='add'>+		child = find_next_child(sb-&gt;s_root, child);</div><div class='add'>+		if (!child)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		inode = d_inode(child);</div><div class='add'>+		entry = efivar_entry(inode);</div><div class='add'>+</div><div class='add'>+		err = efivar_entry_size(entry, &amp;size);</div><div class='add'>+		if (err)</div><div class='add'>+			size = 0;</div><div class='add'>+		else</div><div class='add'>+			size += sizeof(__u32);</div><div class='add'>+</div><div class='add'>+		inode_lock(inode);</div><div class='add'>+		i_size_write(inode, size);</div><div class='add'>+		inode_unlock(inode);</div><div class='add'>+</div><div class='add'>+		/* The variable doesn't exist anymore, delete it. */</div><div class='add'>+		if (!size) {</div><div class='add'>+			pr_info("efivarfs: removing variable %pd\n", child);</div><div class='add'>+			simple_recursive_removal(child, NULL);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	efivar_init(efivarfs_check_missing, sb, false);</div><div class='add'>+	pr_info("efivarfs: finished resyncing variable state\n");</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int efivarfs_init_fs_context(struct fs_context *fc)</div><div class='ctx'> {</div><div class='add'>+	struct efivarfs_fs_info *sfi;</div><div class='add'>+</div><div class='add'>+	if (!efivar_is_available())</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+</div><div class='add'>+	sfi = kzalloc(sizeof(*sfi), GFP_KERNEL);</div><div class='add'>+	if (!sfi)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	sfi-&gt;mount_opts.uid = GLOBAL_ROOT_UID;</div><div class='add'>+	sfi-&gt;mount_opts.gid = GLOBAL_ROOT_GID;</div><div class='add'>+</div><div class='add'>+	fc-&gt;s_fs_info = sfi;</div><div class='ctx'> 	fc-&gt;ops = &amp;efivarfs_context_ops;</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void efivarfs_kill_sb(struct super_block *sb)</div><div class='ctx'> {</div><div class='del'>-	kill_litter_super(sb);</div><div class='add'>+	struct efivarfs_fs_info *sfi = sb-&gt;s_fs_info;</div><div class='ctx'> </div><div class='del'>-	/* Remove all entries and destroy */</div><div class='del'>-	__efivar_entry_iter(efivarfs_destroy, &amp;efivarfs_list, NULL, NULL);</div><div class='add'>+	blocking_notifier_chain_unregister(&amp;efivar_ops_nh, &amp;sfi-&gt;nb);</div><div class='add'>+	kill_anon_super(sb);</div><div class='add'>+</div><div class='add'>+	kfree(sfi);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct file_system_type efivarfs_type = {</div><div class='hunk'>@@ -254,13 +533,12 @@ static struct file_system_type efivarfs_type = {</div><div class='ctx'> 	.name    = "efivarfs",</div><div class='ctx'> 	.init_fs_context = efivarfs_init_fs_context,</div><div class='ctx'> 	.kill_sb = efivarfs_kill_sb,</div><div class='add'>+	.parameters = efivarfs_parameters,</div><div class='add'>+	.fs_flags = FS_POWER_FREEZE,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static __init int efivarfs_init(void)</div><div class='ctx'> {</div><div class='del'>-	if (!efivars_kobject())</div><div class='del'>-		return -ENODEV;</div><div class='del'>-</div><div class='ctx'> 	return register_filesystem(&amp;efivarfs_type);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/efivarfs/vars.c b/fs/efivarfs/vars.c<br/>new file mode 100644<br/>index 000000000000..6edc10958ecf<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/efivarfs/vars.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/efivarfs/vars.c</a></div><div class='hunk'>@@ -0,0 +1,632 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0+</div><div class='add'>+/*</div><div class='add'>+ * Originally from efivars.c</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2001,2003,2004 Dell &lt;Matt_Domsch@dell.com&gt;</div><div class='add'>+ * Copyright (C) 2004 Intel Corporation &lt;matthew.e.tolentino@intel.com&gt;</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/capability.h&gt;</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+#include &lt;linux/errno.h&gt;</div><div class='add'>+#include &lt;linux/init.h&gt;</div><div class='add'>+#include &lt;linux/mm.h&gt;</div><div class='add'>+#include &lt;linux/module.h&gt;</div><div class='add'>+#include &lt;linux/string.h&gt;</div><div class='add'>+#include &lt;linux/smp.h&gt;</div><div class='add'>+#include &lt;linux/efi.h&gt;</div><div class='add'>+#include &lt;linux/device.h&gt;</div><div class='add'>+#include &lt;linux/slab.h&gt;</div><div class='add'>+#include &lt;linux/ctype.h&gt;</div><div class='add'>+#include &lt;linux/ucs2_string.h&gt;</div><div class='add'>+</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+MODULE_IMPORT_NS("EFIVAR");</div><div class='add'>+</div><div class='add'>+static bool</div><div class='add'>+validate_device_path(efi_char16_t *var_name, int match, u8 *buffer,</div><div class='add'>+		     unsigned long len)</div><div class='add'>+{</div><div class='add'>+	struct efi_generic_dev_path *node;</div><div class='add'>+	int offset = 0;</div><div class='add'>+</div><div class='add'>+	node = (struct efi_generic_dev_path *)buffer;</div><div class='add'>+</div><div class='add'>+	if (len &lt; sizeof(*node))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	while (offset &lt;= len - sizeof(*node) &amp;&amp;</div><div class='add'>+	       node-&gt;length &gt;= sizeof(*node) &amp;&amp;</div><div class='add'>+		node-&gt;length &lt;= len - offset) {</div><div class='add'>+		offset += node-&gt;length;</div><div class='add'>+</div><div class='add'>+		if ((node-&gt;type == EFI_DEV_END_PATH ||</div><div class='add'>+		     node-&gt;type == EFI_DEV_END_PATH2) &amp;&amp;</div><div class='add'>+		    node-&gt;sub_type == EFI_DEV_END_ENTIRE)</div><div class='add'>+			return true;</div><div class='add'>+</div><div class='add'>+		node = (struct efi_generic_dev_path *)(buffer + offset);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If we're here then either node-&gt;length pointed past the end</div><div class='add'>+	 * of the buffer or we reached the end of the buffer without</div><div class='add'>+	 * finding a device path end node.</div><div class='add'>+	 */</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool</div><div class='add'>+validate_boot_order(efi_char16_t *var_name, int match, u8 *buffer,</div><div class='add'>+		    unsigned long len)</div><div class='add'>+{</div><div class='add'>+	/* An array of 16-bit integers */</div><div class='add'>+	if ((len % 2) != 0)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool</div><div class='add'>+validate_load_option(efi_char16_t *var_name, int match, u8 *buffer,</div><div class='add'>+		     unsigned long len)</div><div class='add'>+{</div><div class='add'>+	u16 filepathlength;</div><div class='add'>+	int i, desclength = 0, namelen;</div><div class='add'>+</div><div class='add'>+	namelen = ucs2_strnlen(var_name, EFI_VAR_NAME_LEN);</div><div class='add'>+</div><div class='add'>+	/* Either "Boot" or "Driver" followed by four digits of hex */</div><div class='add'>+	for (i = match; i &lt; match+4; i++) {</div><div class='add'>+		if (var_name[i] &gt; 127 ||</div><div class='add'>+		    hex_to_bin(var_name[i] &amp; 0xff) &lt; 0)</div><div class='add'>+			return true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Reject it if there's 4 digits of hex and then further content */</div><div class='add'>+	if (namelen &gt; match + 4)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/* A valid entry must be at least 8 bytes */</div><div class='add'>+	if (len &lt; 8)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	filepathlength = buffer[4] | buffer[5] &lt;&lt; 8;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * There's no stored length for the description, so it has to be</div><div class='add'>+	 * found by hand</div><div class='add'>+	 */</div><div class='add'>+	desclength = ucs2_strsize((efi_char16_t *)(buffer + 6), len - 6) + 2;</div><div class='add'>+</div><div class='add'>+	/* Each boot entry must have a descriptor */</div><div class='add'>+	if (!desclength)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If the sum of the length of the description, the claimed filepath</div><div class='add'>+	 * length and the original header are greater than the length of the</div><div class='add'>+	 * variable, it's malformed</div><div class='add'>+	 */</div><div class='add'>+	if ((desclength + filepathlength + 6) &gt; len)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * And, finally, check the filepath</div><div class='add'>+	 */</div><div class='add'>+	return validate_device_path(var_name, match, buffer + desclength + 6,</div><div class='add'>+				    filepathlength);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool</div><div class='add'>+validate_uint16(efi_char16_t *var_name, int match, u8 *buffer,</div><div class='add'>+		unsigned long len)</div><div class='add'>+{</div><div class='add'>+	/* A single 16-bit integer */</div><div class='add'>+	if (len != 2)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool</div><div class='add'>+validate_ascii_string(efi_char16_t *var_name, int match, u8 *buffer,</div><div class='add'>+		      unsigned long len)</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; len; i++) {</div><div class='add'>+		if (buffer[i] &gt; 127)</div><div class='add'>+			return false;</div><div class='add'>+</div><div class='add'>+		if (buffer[i] == 0)</div><div class='add'>+			return true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct variable_validate {</div><div class='add'>+	efi_guid_t vendor;</div><div class='add'>+	char *name;</div><div class='add'>+	bool (*validate)(efi_char16_t *var_name, int match, u8 *data,</div><div class='add'>+			 unsigned long len);</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * This is the list of variables we need to validate, as well as the</div><div class='add'>+ * whitelist for what we think is safe not to default to immutable.</div><div class='add'>+ *</div><div class='add'>+ * If it has a validate() method that's not NULL, it'll go into the</div><div class='add'>+ * validation routine.  If not, it is assumed valid, but still used for</div><div class='add'>+ * whitelisting.</div><div class='add'>+ *</div><div class='add'>+ * Note that it's sorted by {vendor,name}, but globbed names must come after</div><div class='add'>+ * any other name with the same prefix.</div><div class='add'>+ */</div><div class='add'>+static const struct variable_validate variable_validate[] = {</div><div class='add'>+	{ EFI_GLOBAL_VARIABLE_GUID, "BootNext", validate_uint16 },</div><div class='add'>+	{ EFI_GLOBAL_VARIABLE_GUID, "BootOrder", validate_boot_order },</div><div class='add'>+	{ EFI_GLOBAL_VARIABLE_GUID, "Boot*", validate_load_option },</div><div class='add'>+	{ EFI_GLOBAL_VARIABLE_GUID, "DriverOrder", validate_boot_order },</div><div class='add'>+	{ EFI_GLOBAL_VARIABLE_GUID, "Driver*", validate_load_option },</div><div class='add'>+	{ EFI_GLOBAL_VARIABLE_GUID, "ConIn", validate_device_path },</div><div class='add'>+	{ EFI_GLOBAL_VARIABLE_GUID, "ConInDev", validate_device_path },</div><div class='add'>+	{ EFI_GLOBAL_VARIABLE_GUID, "ConOut", validate_device_path },</div><div class='add'>+	{ EFI_GLOBAL_VARIABLE_GUID, "ConOutDev", validate_device_path },</div><div class='add'>+	{ EFI_GLOBAL_VARIABLE_GUID, "ErrOut", validate_device_path },</div><div class='add'>+	{ EFI_GLOBAL_VARIABLE_GUID, "ErrOutDev", validate_device_path },</div><div class='add'>+	{ EFI_GLOBAL_VARIABLE_GUID, "Lang", validate_ascii_string },</div><div class='add'>+	{ EFI_GLOBAL_VARIABLE_GUID, "OsIndications", NULL },</div><div class='add'>+	{ EFI_GLOBAL_VARIABLE_GUID, "PlatformLang", validate_ascii_string },</div><div class='add'>+	{ EFI_GLOBAL_VARIABLE_GUID, "Timeout", validate_uint16 },</div><div class='add'>+	{ LINUX_EFI_CRASH_GUID, "*", NULL },</div><div class='add'>+	{ NULL_GUID, "", NULL },</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Check if @var_name matches the pattern given in @match_name.</div><div class='add'>+ *</div><div class='add'>+ * @var_name: an array of @len non-NUL characters.</div><div class='add'>+ * @match_name: a NUL-terminated pattern string, optionally ending in "*". A</div><div class='add'>+ *              final "*" character matches any trailing characters @var_name,</div><div class='add'>+ *              including the case when there are none left in @var_name.</div><div class='add'>+ * @match: on output, the number of non-wildcard characters in @match_name</div><div class='add'>+ *         that @var_name matches, regardless of the return value.</div><div class='add'>+ * @return: whether @var_name fully matches @match_name.</div><div class='add'>+ */</div><div class='add'>+static bool</div><div class='add'>+variable_matches(const char *var_name, size_t len, const char *match_name,</div><div class='add'>+		 int *match)</div><div class='add'>+{</div><div class='add'>+	for (*match = 0; ; (*match)++) {</div><div class='add'>+		char c = match_name[*match];</div><div class='add'>+</div><div class='add'>+		switch (c) {</div><div class='add'>+		case '*':</div><div class='add'>+			/* Wildcard in @match_name means we've matched. */</div><div class='add'>+			return true;</div><div class='add'>+</div><div class='add'>+		case '\0':</div><div class='add'>+			/* @match_name has ended. Has @var_name too? */</div><div class='add'>+			return (*match == len);</div><div class='add'>+</div><div class='add'>+		default:</div><div class='add'>+			/*</div><div class='add'>+			 * We've reached a non-wildcard char in @match_name.</div><div class='add'>+			 * Continue only if there's an identical character in</div><div class='add'>+			 * @var_name.</div><div class='add'>+			 */</div><div class='add'>+			if (*match &lt; len &amp;&amp; c == var_name[*match])</div><div class='add'>+				continue;</div><div class='add'>+			return false;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+char *</div><div class='add'>+efivar_get_utf8name(const efi_char16_t *name16, efi_guid_t *vendor)</div><div class='add'>+{</div><div class='add'>+	int len = ucs2_utf8size(name16);</div><div class='add'>+	char *name;</div><div class='add'>+</div><div class='add'>+	/* name, plus '-', plus GUID, plus NUL*/</div><div class='add'>+	name = kmalloc(len + 1 + EFI_VARIABLE_GUID_LEN + 1, GFP_KERNEL);</div><div class='add'>+	if (!name)</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	ucs2_as_utf8(name, name16, len);</div><div class='add'>+</div><div class='add'>+	name[len] = '-';</div><div class='add'>+</div><div class='add'>+	efi_guid_to_str(vendor, name + len + 1);</div><div class='add'>+</div><div class='add'>+	name[len + EFI_VARIABLE_GUID_LEN+1] = '\0';</div><div class='add'>+</div><div class='add'>+	/* replace invalid slashes like kobject_set_name_vargs does for /sys/firmware/efi/vars. */</div><div class='add'>+	strreplace(name, '/', '!');</div><div class='add'>+</div><div class='add'>+	return name;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool</div><div class='add'>+efivar_validate(efi_guid_t vendor, efi_char16_t *var_name, u8 *data,</div><div class='add'>+		unsigned long data_size)</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='add'>+	unsigned long utf8_size;</div><div class='add'>+	u8 *utf8_name;</div><div class='add'>+</div><div class='add'>+	utf8_size = ucs2_utf8size(var_name);</div><div class='add'>+	utf8_name = kmalloc(utf8_size + 1, GFP_KERNEL);</div><div class='add'>+	if (!utf8_name)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	ucs2_as_utf8(utf8_name, var_name, utf8_size);</div><div class='add'>+	utf8_name[utf8_size] = '\0';</div><div class='add'>+</div><div class='add'>+	for (i = 0; variable_validate[i].name[0] != '\0'; i++) {</div><div class='add'>+		const char *name = variable_validate[i].name;</div><div class='add'>+		int match = 0;</div><div class='add'>+</div><div class='add'>+		if (efi_guidcmp(vendor, variable_validate[i].vendor))</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		if (variable_matches(utf8_name, utf8_size+1, name, &amp;match)) {</div><div class='add'>+			if (variable_validate[i].validate == NULL)</div><div class='add'>+				break;</div><div class='add'>+			kfree(utf8_name);</div><div class='add'>+			return variable_validate[i].validate(var_name, match,</div><div class='add'>+							     data, data_size);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	kfree(utf8_name);</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool</div><div class='add'>+efivar_variable_is_removable(efi_guid_t vendor, const char *var_name,</div><div class='add'>+			     size_t len)</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='add'>+	bool found = false;</div><div class='add'>+	int match = 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Check if our variable is in the validated variables list</div><div class='add'>+	 */</div><div class='add'>+	for (i = 0; variable_validate[i].name[0] != '\0'; i++) {</div><div class='add'>+		if (efi_guidcmp(variable_validate[i].vendor, vendor))</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		if (variable_matches(var_name, len,</div><div class='add'>+				     variable_validate[i].name, &amp;match)) {</div><div class='add'>+			found = true;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If it's in our list, it is removable.</div><div class='add'>+	 */</div><div class='add'>+	return found;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Returns the size of variable_name, in bytes, including the</div><div class='add'>+ * terminating NULL character, or variable_name_size if no NULL</div><div class='add'>+ * character is found among the first variable_name_size bytes.</div><div class='add'>+ */</div><div class='add'>+static unsigned long var_name_strnsize(efi_char16_t *variable_name,</div><div class='add'>+				       unsigned long variable_name_size)</div><div class='add'>+{</div><div class='add'>+	unsigned long len;</div><div class='add'>+	efi_char16_t c;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The variable name is, by definition, a NULL-terminated</div><div class='add'>+	 * string, so make absolutely sure that variable_name_size is</div><div class='add'>+	 * the value we expect it to be. If not, return the real size.</div><div class='add'>+	 */</div><div class='add'>+	for (len = 2; len &lt;= variable_name_size; len += sizeof(c)) {</div><div class='add'>+		c = variable_name[(len / sizeof(c)) - 1];</div><div class='add'>+		if (!c)</div><div class='add'>+			break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return min(len, variable_name_size);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Print a warning when duplicate EFI variables are encountered and</div><div class='add'>+ * disable the sysfs workqueue since the firmware is buggy.</div><div class='add'>+ */</div><div class='add'>+static void dup_variable_bug(efi_char16_t *str16, efi_guid_t *vendor_guid,</div><div class='add'>+			     unsigned long len16)</div><div class='add'>+{</div><div class='add'>+	size_t i, len8 = len16 / sizeof(efi_char16_t);</div><div class='add'>+	char *str8;</div><div class='add'>+</div><div class='add'>+	str8 = kzalloc(len8, GFP_KERNEL);</div><div class='add'>+	if (!str8)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; len8; i++)</div><div class='add'>+		str8[i] = str16[i];</div><div class='add'>+</div><div class='add'>+	printk(KERN_WARNING "efivars: duplicate variable: %s-%pUl\n",</div><div class='add'>+	       str8, vendor_guid);</div><div class='add'>+	kfree(str8);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * efivar_init - build the initial list of EFI variables</div><div class='add'>+ * @func: callback function to invoke for every variable</div><div class='add'>+ * @data: function-specific data to pass to @func</div><div class='add'>+ * @duplicate_check: fail if a duplicate variable is found</div><div class='add'>+ *</div><div class='add'>+ * Get every EFI variable from the firmware and invoke @func. @func</div><div class='add'>+ * should populate the initial dentry and inode tree.</div><div class='add'>+ *</div><div class='add'>+ * Returns 0 on success, or a kernel error code on failure.</div><div class='add'>+ */</div><div class='add'>+int efivar_init(int (*func)(efi_char16_t *, efi_guid_t, unsigned long, void *),</div><div class='add'>+		void *data, bool duplicate_check)</div><div class='add'>+{</div><div class='add'>+	unsigned long variable_name_size = 512;</div><div class='add'>+	efi_char16_t *variable_name;</div><div class='add'>+	efi_status_t status;</div><div class='add'>+	efi_guid_t vendor_guid;</div><div class='add'>+	int err = 0;</div><div class='add'>+</div><div class='add'>+	variable_name = kzalloc(variable_name_size, GFP_KERNEL);</div><div class='add'>+	if (!variable_name) {</div><div class='add'>+		printk(KERN_ERR "efivars: Memory allocation failed.\n");</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	err = efivar_lock();</div><div class='add'>+	if (err)</div><div class='add'>+		goto free;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * A small set of old UEFI implementations reject sizes</div><div class='add'>+	 * above a certain threshold, the lowest seen in the wild</div><div class='add'>+	 * is 512.</div><div class='add'>+	 */</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		variable_name_size = 512;</div><div class='add'>+		BUILD_BUG_ON(EFI_VAR_NAME_LEN &lt; 512);</div><div class='add'>+</div><div class='add'>+		status = efivar_get_next_variable(&amp;variable_name_size,</div><div class='add'>+						  variable_name,</div><div class='add'>+						  &amp;vendor_guid);</div><div class='add'>+		switch (status) {</div><div class='add'>+		case EFI_SUCCESS:</div><div class='add'>+			variable_name_size = var_name_strnsize(variable_name,</div><div class='add'>+							       variable_name_size);</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * Some firmware implementations return the</div><div class='add'>+			 * same variable name on multiple calls to</div><div class='add'>+			 * get_next_variable(). Terminate the loop</div><div class='add'>+			 * immediately as there is no guarantee that</div><div class='add'>+			 * we'll ever see a different variable name,</div><div class='add'>+			 * and may end up looping here forever.</div><div class='add'>+			 */</div><div class='add'>+			if (duplicate_check &amp;&amp;</div><div class='add'>+			    efivarfs_variable_is_present(variable_name,</div><div class='add'>+							 &amp;vendor_guid, data)) {</div><div class='add'>+				dup_variable_bug(variable_name, &amp;vendor_guid,</div><div class='add'>+						 variable_name_size);</div><div class='add'>+				status = EFI_NOT_FOUND;</div><div class='add'>+			} else {</div><div class='add'>+				err = func(variable_name, vendor_guid,</div><div class='add'>+					   variable_name_size, data);</div><div class='add'>+				if (err)</div><div class='add'>+					status = EFI_NOT_FOUND;</div><div class='add'>+			}</div><div class='add'>+			break;</div><div class='add'>+		case EFI_UNSUPPORTED:</div><div class='add'>+			err = -EOPNOTSUPP;</div><div class='add'>+			status = EFI_NOT_FOUND;</div><div class='add'>+			break;</div><div class='add'>+		case EFI_NOT_FOUND:</div><div class='add'>+			break;</div><div class='add'>+		case EFI_BUFFER_TOO_SMALL:</div><div class='add'>+			pr_warn("efivars: Variable name size exceeds maximum (%lu &gt; 512)\n",</div><div class='add'>+				variable_name_size);</div><div class='add'>+			status = EFI_NOT_FOUND;</div><div class='add'>+			break;</div><div class='add'>+		default:</div><div class='add'>+			pr_warn("efivars: get_next_variable: status=%lx\n", status);</div><div class='add'>+			status = EFI_NOT_FOUND;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+	} while (status != EFI_NOT_FOUND);</div><div class='add'>+</div><div class='add'>+	efivar_unlock();</div><div class='add'>+free:</div><div class='add'>+	kfree(variable_name);</div><div class='add'>+</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * efivar_entry_delete - delete variable</div><div class='add'>+ * @entry: entry containing variable to delete</div><div class='add'>+ *</div><div class='add'>+ * Delete the variable from the firmware. It is the caller's</div><div class='add'>+ * responsibility to free @entry (by deleting the dentry/inode) once</div><div class='add'>+ * we return.</div><div class='add'>+ *</div><div class='add'>+ * Returns 0 on success, -EINTR if we can't grab the semaphore,</div><div class='add'>+ * converted EFI status code if set_variable() fails.</div><div class='add'>+ */</div><div class='add'>+int efivar_entry_delete(struct efivar_entry *entry)</div><div class='add'>+{</div><div class='add'>+	efi_status_t status;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = efivar_lock();</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	status = efivar_set_variable_locked(entry-&gt;var.VariableName,</div><div class='add'>+					    &amp;entry-&gt;var.VendorGuid,</div><div class='add'>+					    0, 0, NULL, false);</div><div class='add'>+	efivar_unlock();</div><div class='add'>+	if (!(status == EFI_SUCCESS || status == EFI_NOT_FOUND))</div><div class='add'>+		return efi_status_to_err(status);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * efivar_entry_size - obtain the size of a variable</div><div class='add'>+ * @entry: entry for this variable</div><div class='add'>+ * @size: location to store the variable's size</div><div class='add'>+ */</div><div class='add'>+int efivar_entry_size(struct efivar_entry *entry, unsigned long *size)</div><div class='add'>+{</div><div class='add'>+	efi_status_t status;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	*size = 0;</div><div class='add'>+</div><div class='add'>+	err = efivar_lock();</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	status = efivar_get_variable(entry-&gt;var.VariableName,</div><div class='add'>+				     &amp;entry-&gt;var.VendorGuid, NULL, size, NULL);</div><div class='add'>+	efivar_unlock();</div><div class='add'>+</div><div class='add'>+	if (status != EFI_BUFFER_TOO_SMALL)</div><div class='add'>+		return efi_status_to_err(status);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * __efivar_entry_get - call get_variable()</div><div class='add'>+ * @entry: read data for this variable</div><div class='add'>+ * @attributes: variable attributes</div><div class='add'>+ * @size: size of @data buffer</div><div class='add'>+ * @data: buffer to store variable data</div><div class='add'>+ *</div><div class='add'>+ * The caller MUST call efivar_entry_iter_begin() and</div><div class='add'>+ * efivar_entry_iter_end() before and after the invocation of this</div><div class='add'>+ * function, respectively.</div><div class='add'>+ */</div><div class='add'>+int __efivar_entry_get(struct efivar_entry *entry, u32 *attributes,</div><div class='add'>+		       unsigned long *size, void *data)</div><div class='add'>+{</div><div class='add'>+	efi_status_t status;</div><div class='add'>+</div><div class='add'>+	status = efivar_get_variable(entry-&gt;var.VariableName,</div><div class='add'>+				     &amp;entry-&gt;var.VendorGuid,</div><div class='add'>+				     attributes, size, data);</div><div class='add'>+</div><div class='add'>+	return efi_status_to_err(status);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * efivar_entry_get - call get_variable()</div><div class='add'>+ * @entry: read data for this variable</div><div class='add'>+ * @attributes: variable attributes</div><div class='add'>+ * @size: size of @data buffer</div><div class='add'>+ * @data: buffer to store variable data</div><div class='add'>+ */</div><div class='add'>+int efivar_entry_get(struct efivar_entry *entry, u32 *attributes,</div><div class='add'>+		     unsigned long *size, void *data)</div><div class='add'>+{</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = efivar_lock();</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+	err = __efivar_entry_get(entry, attributes, size, data);</div><div class='add'>+	efivar_unlock();</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * efivar_entry_set_get_size - call set_variable() and get new size (atomic)</div><div class='add'>+ * @entry: entry containing variable to set and get</div><div class='add'>+ * @attributes: attributes of variable to be written</div><div class='add'>+ * @size: size of data buffer</div><div class='add'>+ * @data: buffer containing data to write</div><div class='add'>+ * @set: did the set_variable() call succeed?</div><div class='add'>+ *</div><div class='add'>+ * This is a pretty special (complex) function. See efivarfs_file_write().</div><div class='add'>+ *</div><div class='add'>+ * Atomically call set_variable() for @entry and if the call is</div><div class='add'>+ * successful, return the new size of the variable from get_variable()</div><div class='add'>+ * in @size. The success of set_variable() is indicated by @set.</div><div class='add'>+ *</div><div class='add'>+ * Returns 0 on success, -EINVAL if the variable data is invalid,</div><div class='add'>+ * -ENOSPC if the firmware does not have enough available space, or a</div><div class='add'>+ * converted EFI status code if either of set_variable() or</div><div class='add'>+ * get_variable() fail.</div><div class='add'>+ *</div><div class='add'>+ * If the EFI variable does not exist when calling set_variable()</div><div class='add'>+ * (EFI_NOT_FOUND).</div><div class='add'>+ */</div><div class='add'>+int efivar_entry_set_get_size(struct efivar_entry *entry, u32 attributes,</div><div class='add'>+			      unsigned long *size, void *data, bool *set)</div><div class='add'>+{</div><div class='add'>+	efi_char16_t *name = entry-&gt;var.VariableName;</div><div class='add'>+	efi_guid_t *vendor = &amp;entry-&gt;var.VendorGuid;</div><div class='add'>+	efi_status_t status;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	*set = false;</div><div class='add'>+</div><div class='add'>+	if (efivar_validate(*vendor, name, data, *size) == false)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The lock here protects the get_variable call and the</div><div class='add'>+	 * conditional set_variable call</div><div class='add'>+	 */</div><div class='add'>+	err = efivar_lock();</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	status = efivar_set_variable_locked(name, vendor, attributes, *size,</div><div class='add'>+					    data, false);</div><div class='add'>+	if (status != EFI_SUCCESS) {</div><div class='add'>+		err = efi_status_to_err(status);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	*set = true;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Writing to the variable may have caused a change in size (which</div><div class='add'>+	 * could either be an append or an overwrite), or the variable to be</div><div class='add'>+	 * deleted. Perform a GetVariable() so we can tell what actually</div><div class='add'>+	 * happened.</div><div class='add'>+	 */</div><div class='add'>+	*size = 0;</div><div class='add'>+	status = efivar_get_variable(entry-&gt;var.VariableName,</div><div class='add'>+				    &amp;entry-&gt;var.VendorGuid,</div><div class='add'>+				    NULL, size, NULL);</div><div class='add'>+</div><div class='add'>+	efivar_unlock();</div><div class='add'>+</div><div class='add'>+	if (status &amp;&amp; status != EFI_BUFFER_TOO_SMALL)</div><div class='add'>+		return efi_status_to_err(status);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	efivar_unlock();</div><div class='add'>+	return err;</div><div class='add'>+</div><div class='add'>+}</div><div class='head'>diff --git a/fs/efs/Kconfig b/fs/efs/Kconfig<br/>index 2df1bac8b375..0833e533df9d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/efs/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/efs/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/efs/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/efs/Kconfig</a></div><div class='hunk'>@@ -2,6 +2,7 @@</div><div class='ctx'> config EFS_FS</div><div class='ctx'> 	tristate "EFS file system support (read only)"</div><div class='ctx'> 	depends on BLOCK</div><div class='add'>+	select BUFFER_HEAD</div><div class='ctx'> 	help</div><div class='ctx'> 	  EFS is an older file system used for non-ISO9660 CD-ROMs and hard</div><div class='ctx'> 	  disk partitions by SGI's IRIX operating system (IRIX 6.0 and newer</div><div class='head'>diff --git a/fs/efs/efs.h b/fs/efs/efs.h<br/>index 13a4d9622633..918d2b9abb76 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/efs/efs.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/efs/efs.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/efs/efs.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/efs/efs.h</a></div><div class='hunk'>@@ -1,6 +1,6 @@</div><div class='ctx'> /* SPDX-License-Identifier: GPL-2.0 */</div><div class='ctx'> /*</div><div class='del'>- * Copyright (c) 1999 Al Smith</div><div class='add'>+ * Copyright (c) 1999 Al Smith, &lt;Al.Smith@aeschi.ch.eu.org&gt;</div><div class='ctx'>  *</div><div class='ctx'>  * Portions derived from work (c) 1995,1996 Christian Vogelgsang.</div><div class='ctx'>  * Portions derived from IRIX header files (c) 1988 Silicon Graphics</div><div class='hunk'>@@ -19,9 +19,6 @@</div><div class='ctx'> </div><div class='ctx'> #define EFS_VERSION "1.0a"</div><div class='ctx'> </div><div class='del'>-static const char cprt[] = "EFS: "EFS_VERSION" - (c) 1999 Al Smith &lt;Al.Smith@aeschi.ch.eu.org&gt;";</div><div class='del'>-</div><div class='del'>-</div><div class='ctx'> /* 1 block is 512 bytes */</div><div class='ctx'> #define	EFS_BLOCKSIZE_BITS	9</div><div class='ctx'> #define	EFS_BLOCKSIZE		(1 &lt;&lt; EFS_BLOCKSIZE_BITS)</div><div class='head'>diff --git a/fs/efs/inode.c b/fs/efs/inode.c<br/>index 89e73a6f0d36..28407578f83a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/efs/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/efs/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/efs/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/efs/inode.c</a></div><div class='hunk'>@@ -14,16 +14,18 @@</div><div class='ctx'> #include "efs.h"</div><div class='ctx'> #include &lt;linux/efs_fs_sb.h&gt;</div><div class='ctx'> </div><div class='del'>-static int efs_readpage(struct file *file, struct page *page)</div><div class='add'>+static int efs_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	return block_read_full_page(page,efs_get_block);</div><div class='add'>+	return block_read_full_folio(folio, efs_get_block);</div><div class='ctx'> }</div><div class='add'>+</div><div class='ctx'> static sector_t _efs_bmap(struct address_space *mapping, sector_t block)</div><div class='ctx'> {</div><div class='ctx'> 	return generic_block_bmap(mapping,block,efs_get_block);</div><div class='ctx'> }</div><div class='add'>+</div><div class='ctx'> static const struct address_space_operations efs_aops = {</div><div class='del'>-	.readpage = efs_readpage,</div><div class='add'>+	.read_folio = efs_read_folio,</div><div class='ctx'> 	.bmap = _efs_bmap</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -60,7 +62,7 @@ struct inode *efs_iget(struct super_block *super, unsigned long ino)</div><div class='ctx'> 	inode = iget_locked(super, ino);</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='del'>-	if (!(inode-&gt;i_state &amp; I_NEW))</div><div class='add'>+	if (!(inode_state_read_once(inode) &amp; I_NEW))</div><div class='ctx'> 		return inode;</div><div class='ctx'> </div><div class='ctx'> 	in = INODE_INFO(inode);</div><div class='hunk'>@@ -101,10 +103,9 @@ struct inode *efs_iget(struct super_block *super, unsigned long ino)</div><div class='ctx'> 	i_uid_write(inode, (uid_t)be16_to_cpu(efs_inode-&gt;di_uid));</div><div class='ctx'> 	i_gid_write(inode, (gid_t)be16_to_cpu(efs_inode-&gt;di_gid));</div><div class='ctx'> 	inode-&gt;i_size  = be32_to_cpu(efs_inode-&gt;di_size);</div><div class='del'>-	inode-&gt;i_atime.tv_sec = be32_to_cpu(efs_inode-&gt;di_atime);</div><div class='del'>-	inode-&gt;i_mtime.tv_sec = be32_to_cpu(efs_inode-&gt;di_mtime);</div><div class='del'>-	inode-&gt;i_ctime.tv_sec = be32_to_cpu(efs_inode-&gt;di_ctime);</div><div class='del'>-	inode-&gt;i_atime.tv_nsec = inode-&gt;i_mtime.tv_nsec = inode-&gt;i_ctime.tv_nsec = 0;</div><div class='add'>+	inode_set_atime(inode, be32_to_cpu(efs_inode-&gt;di_atime), 0);</div><div class='add'>+	inode_set_mtime(inode, be32_to_cpu(efs_inode-&gt;di_mtime), 0);</div><div class='add'>+	inode_set_ctime(inode, be32_to_cpu(efs_inode-&gt;di_ctime), 0);</div><div class='ctx'> </div><div class='ctx'> 	/* this is the number of blocks in the file */</div><div class='ctx'> 	if (inode-&gt;i_size == 0) {</div><div class='hunk'>@@ -310,4 +311,5 @@ efs_block_t efs_map_block(struct inode *inode, efs_block_t block) {</div><div class='ctx'> 	return 0;</div><div class='ctx'> }  </div><div class='ctx'> </div><div class='add'>+MODULE_DESCRIPTION("Extent File System (efs)");</div><div class='ctx'> MODULE_LICENSE("GPL");</div><div class='head'>diff --git a/fs/efs/super.c b/fs/efs/super.c<br/>index 62b155b9366b..c59086b7eabf 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/efs/super.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/efs/super.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/efs/super.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/efs/super.c</a></div><div class='hunk'>@@ -14,19 +14,13 @@</div><div class='ctx'> #include &lt;linux/buffer_head.h&gt;</div><div class='ctx'> #include &lt;linux/vfs.h&gt;</div><div class='ctx'> #include &lt;linux/blkdev.h&gt;</div><div class='del'>-</div><div class='add'>+#include &lt;linux/fs_context.h&gt;</div><div class='ctx'> #include "efs.h"</div><div class='ctx'> #include &lt;linux/efs_vh.h&gt;</div><div class='ctx'> #include &lt;linux/efs_fs_sb.h&gt;</div><div class='ctx'> </div><div class='ctx'> static int efs_statfs(struct dentry *dentry, struct kstatfs *buf);</div><div class='del'>-static int efs_fill_super(struct super_block *s, void *d, int silent);</div><div class='del'>-</div><div class='del'>-static struct dentry *efs_mount(struct file_system_type *fs_type,</div><div class='del'>-	int flags, const char *dev_name, void *data)</div><div class='del'>-{</div><div class='del'>-	return mount_bdev(fs_type, flags, dev_name, data, efs_fill_super);</div><div class='del'>-}</div><div class='add'>+static int efs_init_fs_context(struct fs_context *fc);</div><div class='ctx'> </div><div class='ctx'> static void efs_kill_sb(struct super_block *s)</div><div class='ctx'> {</div><div class='hunk'>@@ -35,15 +29,6 @@ static void efs_kill_sb(struct super_block *s)</div><div class='ctx'> 	kfree(sbi);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct file_system_type efs_fs_type = {</div><div class='del'>-	.owner		= THIS_MODULE,</div><div class='del'>-	.name		= "efs",</div><div class='del'>-	.mount		= efs_mount,</div><div class='del'>-	.kill_sb	= efs_kill_sb,</div><div class='del'>-	.fs_flags	= FS_REQUIRES_DEV,</div><div class='del'>-};</div><div class='del'>-MODULE_ALIAS_FS("efs");</div><div class='del'>-</div><div class='ctx'> static struct pt_types sgi_pt_types[] = {</div><div class='ctx'> 	{0x00,		"SGI vh"},</div><div class='ctx'> 	{0x01,		"SGI trkrepl"},</div><div class='hunk'>@@ -63,13 +48,24 @@ static struct pt_types sgi_pt_types[] = {</div><div class='ctx'> 	{0,		NULL}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * File system definition and registration.</div><div class='add'>+ */</div><div class='add'>+static struct file_system_type efs_fs_type = {</div><div class='add'>+	.owner			= THIS_MODULE,</div><div class='add'>+	.name			= "efs",</div><div class='add'>+	.kill_sb		= efs_kill_sb,</div><div class='add'>+	.fs_flags		= FS_REQUIRES_DEV,</div><div class='add'>+	.init_fs_context	= efs_init_fs_context,</div><div class='add'>+};</div><div class='add'>+MODULE_ALIAS_FS("efs");</div><div class='ctx'> </div><div class='ctx'> static struct kmem_cache * efs_inode_cachep;</div><div class='ctx'> </div><div class='ctx'> static struct inode *efs_alloc_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct efs_inode_info *ei;</div><div class='del'>-	ei = kmem_cache_alloc(efs_inode_cachep, GFP_KERNEL);</div><div class='add'>+	ei = alloc_inode_sb(sb, efs_inode_cachep, GFP_KERNEL);</div><div class='ctx'> 	if (!ei)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	return &amp;ei-&gt;vfs_inode;</div><div class='hunk'>@@ -91,8 +87,8 @@ static int __init init_inodecache(void)</div><div class='ctx'> {</div><div class='ctx'> 	efs_inode_cachep = kmem_cache_create("efs_inode_cache",</div><div class='ctx'> 				sizeof(struct efs_inode_info), 0,</div><div class='del'>-				SLAB_RECLAIM_ACCOUNT|SLAB_MEM_SPREAD|</div><div class='del'>-				SLAB_ACCOUNT, init_once);</div><div class='add'>+				SLAB_RECLAIM_ACCOUNT|SLAB_ACCOUNT,</div><div class='add'>+				init_once);</div><div class='ctx'> 	if (efs_inode_cachep == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -108,21 +104,14 @@ static void destroy_inodecache(void)</div><div class='ctx'> 	kmem_cache_destroy(efs_inode_cachep);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int efs_remount(struct super_block *sb, int *flags, char *data)</div><div class='del'>-{</div><div class='del'>-	sync_filesystem(sb);</div><div class='del'>-	*flags |= SB_RDONLY;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static const struct super_operations efs_superblock_operations = {</div><div class='ctx'> 	.alloc_inode	= efs_alloc_inode,</div><div class='ctx'> 	.free_inode	= efs_free_inode,</div><div class='ctx'> 	.statfs		= efs_statfs,</div><div class='del'>-	.remount_fs	= efs_remount,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct export_operations efs_export_ops = {</div><div class='add'>+	.encode_fh	= generic_encode_ino32_fh,</div><div class='ctx'> 	.fh_to_dentry	= efs_fh_to_dentry,</div><div class='ctx'> 	.fh_to_parent	= efs_fh_to_parent,</div><div class='ctx'> 	.get_parent	= efs_get_parent,</div><div class='hunk'>@@ -248,26 +237,27 @@ static int efs_validate_super(struct efs_sb_info *sb, struct efs_super *super) {</div><div class='ctx'> 	return 0;    </div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int efs_fill_super(struct super_block *s, void *d, int silent)</div><div class='add'>+static int efs_fill_super(struct super_block *s, struct fs_context *fc)</div><div class='ctx'> {</div><div class='ctx'> 	struct efs_sb_info *sb;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> 	struct inode *root;</div><div class='ctx'> </div><div class='del'>- 	sb = kzalloc(sizeof(struct efs_sb_info), GFP_KERNEL);</div><div class='add'>+	sb = kzalloc(sizeof(struct efs_sb_info), GFP_KERNEL);</div><div class='ctx'> 	if (!sb)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	s-&gt;s_fs_info = sb;</div><div class='ctx'> 	s-&gt;s_time_min = 0;</div><div class='ctx'> 	s-&gt;s_time_max = U32_MAX;</div><div class='del'>- </div><div class='add'>+</div><div class='ctx'> 	s-&gt;s_magic		= EFS_SUPER_MAGIC;</div><div class='ctx'> 	if (!sb_set_blocksize(s, EFS_BLOCKSIZE)) {</div><div class='ctx'> 		pr_err("device does not support %d byte blocks\n",</div><div class='ctx'> 			EFS_BLOCKSIZE);</div><div class='del'>-		return -EINVAL;</div><div class='add'>+		return invalf(fc, "device does not support %d byte blocks\n",</div><div class='add'>+			      EFS_BLOCKSIZE);</div><div class='ctx'> 	}</div><div class='del'>-  </div><div class='add'>+</div><div class='ctx'> 	/* read the vh (volume header) block */</div><div class='ctx'> 	bh = sb_bread(s, 0);</div><div class='ctx'> </div><div class='hunk'>@@ -293,7 +283,7 @@ static int efs_fill_super(struct super_block *s, void *d, int silent)</div><div class='ctx'> 		pr_err("cannot read superblock\n");</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='del'>-		</div><div class='add'>+</div><div class='ctx'> 	if (efs_validate_super(sb, (struct efs_super *) bh-&gt;b_data)) {</div><div class='ctx'> #ifdef DEBUG</div><div class='ctx'> 		pr_warn("invalid superblock at block %u\n",</div><div class='hunk'>@@ -327,6 +317,34 @@ static int efs_fill_super(struct super_block *s, void *d, int silent)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int efs_get_tree(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	return get_tree_bdev(fc, efs_fill_super);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int efs_reconfigure(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	sync_filesystem(fc-&gt;root-&gt;d_sb);</div><div class='add'>+	fc-&gt;sb_flags |= SB_RDONLY;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct fs_context_operations efs_context_opts = {</div><div class='add'>+	.get_tree	= efs_get_tree,</div><div class='add'>+	.reconfigure	= efs_reconfigure,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Set up the filesystem mount context.</div><div class='add'>+ */</div><div class='add'>+static int efs_init_fs_context(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	fc-&gt;ops = &amp;efs_context_opts;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int efs_statfs(struct dentry *dentry, struct kstatfs *buf) {</div><div class='ctx'> 	struct super_block *sb = dentry-&gt;d_sb;</div><div class='ctx'> 	struct efs_sb_info *sbi = SUPER_INFO(sb);</div><div class='head'>diff --git a/fs/efs/symlink.c b/fs/efs/symlink.c<br/>index 923eb91654d5..7749feded722 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/efs/symlink.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/efs/symlink.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/efs/symlink.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/efs/symlink.c</a></div><div class='hunk'>@@ -12,11 +12,11 @@</div><div class='ctx'> #include &lt;linux/buffer_head.h&gt;</div><div class='ctx'> #include "efs.h"</div><div class='ctx'> </div><div class='del'>-static int efs_symlink_readpage(struct file *file, struct page *page)</div><div class='add'>+static int efs_symlink_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	char *link = page_address(page);</div><div class='del'>-	struct buffer_head * bh;</div><div class='del'>-	struct inode * inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	char *link = folio_address(folio);</div><div class='add'>+	struct buffer_head *bh;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	efs_block_t size = inode-&gt;i_size;</div><div class='ctx'> 	int err;</div><div class='ctx'>   </div><div class='hunk'>@@ -39,15 +39,12 @@ static int efs_symlink_readpage(struct file *file, struct page *page)</div><div class='ctx'> 		brelse(bh);</div><div class='ctx'> 	}</div><div class='ctx'> 	link[size] = '\0';</div><div class='del'>-	SetPageUptodate(page);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	return 0;</div><div class='add'>+	err = 0;</div><div class='ctx'> fail:</div><div class='del'>-	SetPageError(page);</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	folio_end_read(folio, err == 0);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations efs_symlink_aops = {</div><div class='del'>-	.readpage	= efs_symlink_readpage</div><div class='add'>+	.read_folio	= efs_symlink_read_folio</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/erofs/Kconfig b/fs/erofs/Kconfig<br/>index f57255ab88ed..d81f3318417d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/erofs/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/erofs/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/erofs/Kconfig</a></div><div class='hunk'>@@ -3,8 +3,18 @@</div><div class='ctx'> config EROFS_FS</div><div class='ctx'> 	tristate "EROFS filesystem support"</div><div class='ctx'> 	depends on BLOCK</div><div class='add'>+	select CACHEFILES if EROFS_FS_ONDEMAND</div><div class='add'>+	select CRC32</div><div class='add'>+	select CRYPTO if EROFS_FS_ZIP_ACCEL</div><div class='add'>+	select CRYPTO_DEFLATE if EROFS_FS_ZIP_ACCEL</div><div class='ctx'> 	select FS_IOMAP</div><div class='del'>-	select LIBCRC32C</div><div class='add'>+	select LZ4_DECOMPRESS if EROFS_FS_ZIP</div><div class='add'>+	select NETFS_SUPPORT if EROFS_FS_ONDEMAND</div><div class='add'>+	select XXHASH if EROFS_FS_XATTR</div><div class='add'>+	select XZ_DEC if EROFS_FS_ZIP_LZMA</div><div class='add'>+	select XZ_DEC_MICROLZMA if EROFS_FS_ZIP_LZMA</div><div class='add'>+	select ZLIB_INFLATE if EROFS_FS_ZIP_DEFLATE</div><div class='add'>+	select ZSTD_DECOMPRESS if EROFS_FS_ZIP_ZSTD</div><div class='ctx'> 	help</div><div class='ctx'> 	  EROFS (Enhanced Read-Only File System) is a lightweight read-only</div><div class='ctx'> 	  file system with modern designs (e.g. no buffer heads, inline</div><div class='hunk'>@@ -13,15 +23,15 @@ config EROFS_FS</div><div class='ctx'> 	  smartphones with Android OS, LiveCDs and high-density hosts with</div><div class='ctx'> 	  numerous containers;</div><div class='ctx'> </div><div class='del'>-	  It also provides fixed-sized output compression support in order to</div><div class='del'>-	  improve storage density as well as keep relatively higher compression</div><div class='del'>-	  ratios and implements in-place decompression to reuse the file page</div><div class='del'>-	  for compressed data temporarily with proper strategies, which is</div><div class='del'>-	  quite useful to ensure guaranteed end-to-end runtime decompression</div><div class='del'>-	  performance under extremely memory pressure without extra cost.</div><div class='add'>+	  It also provides transparent compression and deduplication support to</div><div class='add'>+	  improve storage density and maintain relatively high compression</div><div class='add'>+	  ratios, and it implements in-place decompression to temporarily reuse</div><div class='add'>+	  page cache for compressed data using proper strategies, which is</div><div class='add'>+	  quite useful for ensuring guaranteed end-to-end runtime decompression</div><div class='add'>+	  performance under extreme memory pressure without extra cost.</div><div class='ctx'> </div><div class='ctx'> 	  See the documentation at &lt;file:Documentation/filesystems/erofs.rst&gt;</div><div class='del'>-	  for more details.</div><div class='add'>+	  and the web pages at &lt;https://erofs.docs.kernel.org&gt; for more details.</div><div class='ctx'> </div><div class='ctx'> 	  If unsure, say N.</div><div class='ctx'> </div><div class='hunk'>@@ -73,28 +83,114 @@ config EROFS_FS_SECURITY</div><div class='ctx'> </div><div class='ctx'> 	  If you are not using a security module, say N.</div><div class='ctx'> </div><div class='add'>+config EROFS_FS_BACKED_BY_FILE</div><div class='add'>+	bool "File-backed EROFS filesystem support"</div><div class='add'>+	depends on EROFS_FS</div><div class='add'>+	default y</div><div class='add'>+	help</div><div class='add'>+	  This allows EROFS to use filesystem image files directly, without</div><div class='add'>+	  the intercession of loopback block devices or likewise. It is</div><div class='add'>+	  particularly useful for container images with numerous blobs and</div><div class='add'>+	  other sandboxes, where loop devices behave intricately.  It can also</div><div class='add'>+	  be used to simplify error-prone lifetime management of unnecessary</div><div class='add'>+	  virtual block devices.</div><div class='add'>+</div><div class='add'>+	  Note that this feature, along with ongoing fanotify pre-content</div><div class='add'>+	  hooks, will eventually replace "EROFS over fscache."</div><div class='add'>+</div><div class='add'>+	  If you don't want to enable this feature, say N.</div><div class='add'>+</div><div class='ctx'> config EROFS_FS_ZIP</div><div class='ctx'> 	bool "EROFS Data Compression Support"</div><div class='ctx'> 	depends on EROFS_FS</div><div class='del'>-	select LZ4_DECOMPRESS</div><div class='ctx'> 	default y</div><div class='ctx'> 	help</div><div class='del'>-	  Enable fixed-sized output compression for EROFS.</div><div class='add'>+	  Enable transparent compression support for EROFS file systems.</div><div class='ctx'> </div><div class='ctx'> 	  If you don't want to enable compression feature, say N.</div><div class='ctx'> </div><div class='ctx'> config EROFS_FS_ZIP_LZMA</div><div class='ctx'> 	bool "EROFS LZMA compressed data support"</div><div class='ctx'> 	depends on EROFS_FS_ZIP</div><div class='del'>-	select XZ_DEC</div><div class='del'>-	select XZ_DEC_MICROLZMA</div><div class='ctx'> 	help</div><div class='ctx'> 	  Saying Y here includes support for reading EROFS file systems</div><div class='del'>-	  containing LZMA compressed data, specifically called microLZMA. it</div><div class='del'>-	  gives better compression ratios than the LZ4 algorithm, at the</div><div class='add'>+	  containing LZMA compressed data, specifically called microLZMA. It</div><div class='add'>+	  gives better compression ratios than the default LZ4 format, at the</div><div class='ctx'> 	  expense of more CPU overhead.</div><div class='ctx'> </div><div class='del'>-	  LZMA support is an experimental feature for now and so most file</div><div class='del'>-	  systems will be readable without selecting this option.</div><div class='add'>+	  If unsure, say N.</div><div class='add'>+</div><div class='add'>+config EROFS_FS_ZIP_DEFLATE</div><div class='add'>+	bool "EROFS DEFLATE compressed data support"</div><div class='add'>+	depends on EROFS_FS_ZIP</div><div class='add'>+	help</div><div class='add'>+	  Saying Y here includes support for reading EROFS file systems</div><div class='add'>+	  containing DEFLATE compressed data.  It gives better compression</div><div class='add'>+	  ratios than the default LZ4 format, while it costs more CPU</div><div class='add'>+	  overhead.</div><div class='add'>+</div><div class='add'>+	  DEFLATE support is an experimental feature for now and so most</div><div class='add'>+	  file systems will be readable without selecting this option.</div><div class='add'>+</div><div class='add'>+	  If unsure, say N.</div><div class='add'>+</div><div class='add'>+config EROFS_FS_ZIP_ZSTD</div><div class='add'>+	bool "EROFS Zstandard compressed data support"</div><div class='add'>+	depends on EROFS_FS_ZIP</div><div class='add'>+	help</div><div class='add'>+	  Saying Y here includes support for reading EROFS file systems</div><div class='add'>+	  containing Zstandard compressed data.  It gives better compression</div><div class='add'>+	  ratios than the default LZ4 format, while it costs more CPU</div><div class='add'>+	  overhead.</div><div class='add'>+</div><div class='add'>+	  Zstandard support is an experimental feature for now and so most</div><div class='add'>+	  file systems will be readable without selecting this option.</div><div class='add'>+</div><div class='add'>+	  If unsure, say N.</div><div class='add'>+</div><div class='add'>+config EROFS_FS_ZIP_ACCEL</div><div class='add'>+	bool "EROFS hardware decompression support"</div><div class='add'>+	depends on EROFS_FS_ZIP</div><div class='add'>+	help</div><div class='add'>+	  Saying Y here includes hardware accelerator support for reading</div><div class='add'>+	  EROFS file systems containing compressed data.  It gives better</div><div class='add'>+	  decompression speed than the software-implemented decompression, and</div><div class='add'>+	  it costs lower CPU overhead.</div><div class='add'>+</div><div class='add'>+	  Hardware accelerator support is an experimental feature for now and</div><div class='add'>+	  file systems are still readable without selecting this option.</div><div class='add'>+</div><div class='add'>+	  If unsure, say N.</div><div class='add'>+</div><div class='add'>+config EROFS_FS_ONDEMAND</div><div class='add'>+	bool "EROFS fscache-based on-demand read support (deprecated)"</div><div class='add'>+	depends on EROFS_FS</div><div class='add'>+	select FSCACHE</div><div class='add'>+	select CACHEFILES_ONDEMAND</div><div class='add'>+	help</div><div class='add'>+	  This permits EROFS to use fscache-backed data blobs with on-demand</div><div class='add'>+	  read support.</div><div class='add'>+</div><div class='add'>+	  It is now deprecated and scheduled to be removed from the kernel</div><div class='add'>+	  after fanotify pre-content hooks are landed.</div><div class='add'>+</div><div class='add'>+	  If unsure, say N.</div><div class='add'>+</div><div class='add'>+config EROFS_FS_PCPU_KTHREAD</div><div class='add'>+	bool "EROFS per-cpu decompression kthread workers"</div><div class='add'>+	depends on EROFS_FS_ZIP</div><div class='add'>+	help</div><div class='add'>+	  Saying Y here enables per-CPU kthread workers pool to carry out</div><div class='add'>+	  async decompression for low latencies on some architectures.</div><div class='add'>+</div><div class='add'>+	  If unsure, say N.</div><div class='add'>+</div><div class='add'>+config EROFS_FS_PCPU_KTHREAD_HIPRI</div><div class='add'>+	bool "EROFS high priority per-CPU kthread workers"</div><div class='add'>+	depends on EROFS_FS_ZIP &amp;&amp; EROFS_FS_PCPU_KTHREAD</div><div class='add'>+	default y</div><div class='add'>+	help</div><div class='add'>+	  This permits EROFS to configure per-CPU kthread workers to run</div><div class='add'>+	  at higher priority.</div><div class='ctx'> </div><div class='ctx'> 	  If unsure, say N.</div><div class='head'>diff --git a/fs/erofs/Makefile b/fs/erofs/Makefile<br/>index 756fe2d65272..549abc424763 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/erofs/Makefile?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/Makefile</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/erofs/Makefile?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/erofs/Makefile</a></div><div class='hunk'>@@ -1,7 +1,12 @@</div><div class='ctx'> # SPDX-License-Identifier: GPL-2.0-only</div><div class='ctx'> </div><div class='ctx'> obj-$(CONFIG_EROFS_FS) += erofs.o</div><div class='del'>-erofs-objs := super.o inode.o data.o namei.o dir.o utils.o pcpubuf.o</div><div class='add'>+erofs-objs := super.o inode.o data.o namei.o dir.o sysfs.o</div><div class='ctx'> erofs-$(CONFIG_EROFS_FS_XATTR) += xattr.o</div><div class='del'>-erofs-$(CONFIG_EROFS_FS_ZIP) += decompressor.o zmap.o zdata.o</div><div class='add'>+erofs-$(CONFIG_EROFS_FS_ZIP) += decompressor.o zmap.o zdata.o zutil.o</div><div class='ctx'> erofs-$(CONFIG_EROFS_FS_ZIP_LZMA) += decompressor_lzma.o</div><div class='add'>+erofs-$(CONFIG_EROFS_FS_ZIP_DEFLATE) += decompressor_deflate.o</div><div class='add'>+erofs-$(CONFIG_EROFS_FS_ZIP_ZSTD) += decompressor_zstd.o</div><div class='add'>+erofs-$(CONFIG_EROFS_FS_ZIP_ACCEL) += decompressor_crypto.o</div><div class='add'>+erofs-$(CONFIG_EROFS_FS_BACKED_BY_FILE) += fileio.o</div><div class='add'>+erofs-$(CONFIG_EROFS_FS_ONDEMAND) += fscache.o</div><div class='head'>diff --git a/fs/erofs/compress.h b/fs/erofs/compress.h<br/>index 579406504919..84c8e52581f4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/erofs/compress.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/compress.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/erofs/compress.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/erofs/compress.h</a></div><div class='hunk'>@@ -11,57 +11,37 @@</div><div class='ctx'> struct z_erofs_decompress_req {</div><div class='ctx'> 	struct super_block *sb;</div><div class='ctx'> 	struct page **in, **out;</div><div class='del'>-</div><div class='del'>-	unsigned short pageofs_out;</div><div class='add'>+	unsigned int inpages, outpages;</div><div class='add'>+	unsigned short pageofs_in, pageofs_out;</div><div class='ctx'> 	unsigned int inputsize, outputsize;</div><div class='ctx'> </div><div class='del'>-	/* indicate the algorithm will be used for decompression */</div><div class='del'>-	unsigned int alg;</div><div class='del'>-	bool inplace_io, partial_decoding;</div><div class='add'>+	unsigned int alg;       /* the algorithm for decompression */</div><div class='add'>+	bool inplace_io, partial_decoding, fillgaps;</div><div class='add'>+	gfp_t gfp;      /* allocation flags for extra temporary buffers */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct z_erofs_decompressor {</div><div class='del'>-	int (*decompress)(struct z_erofs_decompress_req *rq,</div><div class='del'>-			  struct page **pagepool);</div><div class='add'>+	int (*config)(struct super_block *sb, struct erofs_super_block *dsb,</div><div class='add'>+		      void *data, int size);</div><div class='add'>+	const char *(*decompress)(struct z_erofs_decompress_req *rq,</div><div class='add'>+				  struct page **pagepool);</div><div class='add'>+	int (*init)(void);</div><div class='add'>+	void (*exit)(void);</div><div class='ctx'> 	char *name;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/* some special page-&gt;private (unsigned long, see below) */</div><div class='ctx'> #define Z_EROFS_SHORTLIVED_PAGE		(-1UL &lt;&lt; 2)</div><div class='del'>-#define Z_EROFS_PREALLOCATED_PAGE	(-2UL &lt;&lt; 2)</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * For all pages in a pcluster, page-&gt;private should be one of</div><div class='del'>- * Type                         Last 2bits      page-&gt;private</div><div class='del'>- * short-lived page             00              Z_EROFS_SHORTLIVED_PAGE</div><div class='del'>- * preallocated page (tryalloc) 00              Z_EROFS_PREALLOCATED_PAGE</div><div class='del'>- * cached/managed page          00              pointer to z_erofs_pcluster</div><div class='del'>- * online page (file-backed,    01/10/11        sub-index &lt;&lt; 2 | count</div><div class='del'>- *              some pages can be used for inplace I/O)</div><div class='del'>- *</div><div class='del'>- * page-&gt;mapping should be one of</div><div class='del'>- * Type                 page-&gt;mapping</div><div class='del'>- * short-lived page     NULL</div><div class='del'>- * preallocated page    NULL</div><div class='del'>- * cached/managed page  non-NULL or NULL (invalidated/truncated page)</div><div class='del'>- * online page          non-NULL</div><div class='del'>- *</div><div class='del'>- * For all managed pages, PG_private should be set with 1 extra refcount,</div><div class='del'>- * which is used for page reclaim / migration.</div><div class='del'>- */</div><div class='add'>+#define Z_EROFS_PREALLOCATED_FOLIO	((void *)(-2UL &lt;&lt; 2))</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * short-lived pages are pages directly from buddy system with specific</div><div class='del'>- * page-&gt;private (no need to set PagePrivate since these are non-LRU /</div><div class='del'>- * non-movable pages and bypass reclaim / migration code).</div><div class='add'>+ * Currently, short-lived pages are pages directly from buddy system</div><div class='add'>+ * with specific page-&gt;private (Z_EROFS_SHORTLIVED_PAGE).</div><div class='add'>+ * In the future world of Memdescs, it should be type 0 (Misc) memory</div><div class='add'>+ * which type can be checked with a new helper.</div><div class='ctx'>  */</div><div class='ctx'> static inline bool z_erofs_is_shortlived_page(struct page *page)</div><div class='ctx'> {</div><div class='del'>-	if (page-&gt;private != Z_EROFS_SHORTLIVED_PAGE)</div><div class='del'>-		return false;</div><div class='del'>-</div><div class='del'>-	DBG_BUGON(page-&gt;mapping);</div><div class='del'>-	return true;</div><div class='add'>+	return page-&gt;private == Z_EROFS_SHORTLIVED_PAGE;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline bool z_erofs_put_shortlivedpage(struct page **pagepool,</div><div class='hunk'>@@ -69,28 +49,41 @@ static inline bool z_erofs_put_shortlivedpage(struct page **pagepool,</div><div class='ctx'> {</div><div class='ctx'> 	if (!z_erofs_is_shortlived_page(page))</div><div class='ctx'> 		return false;</div><div class='del'>-</div><div class='del'>-	/* short-lived pages should not be used by others at the same time */</div><div class='del'>-	if (page_ref_count(page) &gt; 1) {</div><div class='del'>-		put_page(page);</div><div class='del'>-	} else {</div><div class='del'>-		/* follow the pcluster rule above. */</div><div class='del'>-		erofs_pagepool_add(pagepool, page);</div><div class='del'>-	}</div><div class='add'>+	erofs_pagepool_add(pagepool, page);</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#define MNGD_MAPPING(sbi)	((sbi)-&gt;managed_cache-&gt;i_mapping)</div><div class='del'>-static inline bool erofs_page_is_managed(const struct erofs_sb_info *sbi,</div><div class='del'>-					 struct page *page)</div><div class='del'>-{</div><div class='del'>-	return page-&gt;mapping == MNGD_MAPPING(sbi);</div><div class='del'>-}</div><div class='add'>+extern const struct z_erofs_decompressor z_erofs_lzma_decomp;</div><div class='add'>+extern const struct z_erofs_decompressor z_erofs_deflate_decomp;</div><div class='add'>+extern const struct z_erofs_decompressor z_erofs_zstd_decomp;</div><div class='add'>+extern const struct z_erofs_decompressor *z_erofs_decomp[];</div><div class='ctx'> </div><div class='del'>-int z_erofs_decompress(struct z_erofs_decompress_req *rq,</div><div class='del'>-		       struct page **pagepool);</div><div class='add'>+struct z_erofs_stream_dctx {</div><div class='add'>+	struct z_erofs_decompress_req *rq;</div><div class='add'>+	int no, ni;			/* the current {en,de}coded page # */</div><div class='ctx'> </div><div class='del'>-/* prototypes for specific algorithms */</div><div class='del'>-int z_erofs_lzma_decompress(struct z_erofs_decompress_req *rq,</div><div class='del'>-			    struct page **pagepool);</div><div class='add'>+	unsigned int avail_out;		/* remaining bytes in the decoded buffer */</div><div class='add'>+	unsigned int inbuf_pos, inbuf_sz;</div><div class='add'>+					/* current status of the encoded buffer */</div><div class='add'>+	u8 *kin, *kout;			/* buffer mapped pointers */</div><div class='add'>+	void *bounce;			/* bounce buffer for inplace I/Os */</div><div class='add'>+	bool bounced;			/* is the bounce buffer used now? */</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+const char *z_erofs_stream_switch_bufs(struct z_erofs_stream_dctx *dctx,</div><div class='add'>+				void **dst, void **src, struct page **pgpl);</div><div class='add'>+const char *z_erofs_fixup_insize(struct z_erofs_decompress_req *rq,</div><div class='add'>+				 const char *padbuf, unsigned int padbufsize);</div><div class='add'>+int __init z_erofs_init_decompressor(void);</div><div class='add'>+void z_erofs_exit_decompressor(void);</div><div class='add'>+int z_erofs_crypto_decompress(struct z_erofs_decompress_req *rq,</div><div class='add'>+			      struct page **pgpl);</div><div class='add'>+int z_erofs_crypto_enable_engine(const char *name, int len);</div><div class='add'>+#ifdef CONFIG_EROFS_FS_ZIP_ACCEL</div><div class='add'>+void z_erofs_crypto_disable_all_engines(void);</div><div class='add'>+int z_erofs_crypto_show_engines(char *buf, int size, char sep);</div><div class='add'>+#else</div><div class='add'>+static inline void z_erofs_crypto_disable_all_engines(void) {}</div><div class='add'>+static inline int z_erofs_crypto_show_engines(char *buf, int size, char sep) { return 0; }</div><div class='add'>+#endif</div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/erofs/data.c b/fs/erofs/data.c<br/>index 0e35ef3f9f3d..bb13c4cb8455 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/erofs/data.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/data.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/erofs/data.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/erofs/data.c</a></div><div class='hunk'>@@ -5,100 +5,121 @@</div><div class='ctx'>  * Copyright (C) 2021, Alibaba Cloud</div><div class='ctx'>  */</div><div class='ctx'> #include "internal.h"</div><div class='del'>-#include &lt;linux/prefetch.h&gt;</div><div class='del'>-#include &lt;linux/dax.h&gt;</div><div class='add'>+#include &lt;linux/sched/mm.h&gt;</div><div class='ctx'> #include &lt;trace/events/erofs.h&gt;</div><div class='ctx'> </div><div class='del'>-struct page *erofs_get_meta_page(struct super_block *sb, erofs_blk_t blkaddr)</div><div class='add'>+void erofs_unmap_metabuf(struct erofs_buf *buf)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *const mapping = sb-&gt;s_bdev-&gt;bd_inode-&gt;i_mapping;</div><div class='del'>-	struct page *page;</div><div class='del'>-</div><div class='del'>-	page = read_cache_page_gfp(mapping, blkaddr,</div><div class='del'>-				   mapping_gfp_constraint(mapping, ~__GFP_FS));</div><div class='del'>-	/* should already be PageUptodate */</div><div class='del'>-	if (!IS_ERR(page))</div><div class='del'>-		lock_page(page);</div><div class='del'>-	return page;</div><div class='add'>+	if (!buf-&gt;base)</div><div class='add'>+		return;</div><div class='add'>+	kunmap_local(buf-&gt;base);</div><div class='add'>+	buf-&gt;base = NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int erofs_map_blocks_flatmode(struct inode *inode,</div><div class='del'>-				     struct erofs_map_blocks *map,</div><div class='del'>-				     int flags)</div><div class='add'>+void erofs_put_metabuf(struct erofs_buf *buf)</div><div class='ctx'> {</div><div class='del'>-	int err = 0;</div><div class='del'>-	erofs_blk_t nblocks, lastblk;</div><div class='del'>-	u64 offset = map-&gt;m_la;</div><div class='del'>-	struct erofs_inode *vi = EROFS_I(inode);</div><div class='del'>-	bool tailendpacking = (vi-&gt;datalayout == EROFS_INODE_FLAT_INLINE);</div><div class='del'>-</div><div class='del'>-	trace_erofs_map_blocks_flatmode_enter(inode, map, flags);</div><div class='del'>-</div><div class='del'>-	nblocks = DIV_ROUND_UP(inode-&gt;i_size, PAGE_SIZE);</div><div class='del'>-	lastblk = nblocks - tailendpacking;</div><div class='del'>-</div><div class='del'>-	/* there is no hole in flatmode */</div><div class='del'>-	map-&gt;m_flags = EROFS_MAP_MAPPED;</div><div class='add'>+	if (!buf-&gt;page)</div><div class='add'>+		return;</div><div class='add'>+	erofs_unmap_metabuf(buf);</div><div class='add'>+	folio_put(page_folio(buf-&gt;page));</div><div class='add'>+	buf-&gt;page = NULL;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if (offset &lt; blknr_to_addr(lastblk)) {</div><div class='del'>-		map-&gt;m_pa = blknr_to_addr(vi-&gt;raw_blkaddr) + map-&gt;m_la;</div><div class='del'>-		map-&gt;m_plen = blknr_to_addr(lastblk) - offset;</div><div class='del'>-	} else if (tailendpacking) {</div><div class='del'>-		/* 2 - inode inline B: inode, [xattrs], inline last blk... */</div><div class='del'>-		struct erofs_sb_info *sbi = EROFS_SB(inode-&gt;i_sb);</div><div class='add'>+void *erofs_bread(struct erofs_buf *buf, erofs_off_t offset, bool need_kmap)</div><div class='add'>+{</div><div class='add'>+	pgoff_t index = (buf-&gt;off + offset) &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	struct folio *folio = NULL;</div><div class='ctx'> </div><div class='del'>-		map-&gt;m_pa = iloc(sbi, vi-&gt;nid) + vi-&gt;inode_isize +</div><div class='del'>-			vi-&gt;xattr_isize + erofs_blkoff(map-&gt;m_la);</div><div class='del'>-		map-&gt;m_plen = inode-&gt;i_size - offset;</div><div class='add'>+	if (buf-&gt;page) {</div><div class='add'>+		folio = page_folio(buf-&gt;page);</div><div class='add'>+		if (folio_file_page(folio, index) != buf-&gt;page)</div><div class='add'>+			erofs_unmap_metabuf(buf);</div><div class='add'>+	}</div><div class='add'>+	if (!folio || !folio_contains(folio, index)) {</div><div class='add'>+		erofs_put_metabuf(buf);</div><div class='add'>+		folio = read_mapping_folio(buf-&gt;mapping, index, buf-&gt;file);</div><div class='add'>+		if (IS_ERR(folio))</div><div class='add'>+			return folio;</div><div class='add'>+	}</div><div class='add'>+	buf-&gt;page = folio_file_page(folio, index);</div><div class='add'>+	if (!need_kmap)</div><div class='add'>+		return NULL;</div><div class='add'>+	if (!buf-&gt;base)</div><div class='add'>+		buf-&gt;base = kmap_local_page(buf-&gt;page);</div><div class='add'>+	return buf-&gt;base + (offset &amp; ~PAGE_MASK);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		/* inline data should be located in one meta block */</div><div class='del'>-		if (erofs_blkoff(map-&gt;m_pa) + map-&gt;m_plen &gt; PAGE_SIZE) {</div><div class='del'>-			erofs_err(inode-&gt;i_sb,</div><div class='del'>-				  "inline data cross block boundary @ nid %llu",</div><div class='del'>-				  vi-&gt;nid);</div><div class='del'>-			DBG_BUGON(1);</div><div class='del'>-			err = -EFSCORRUPTED;</div><div class='del'>-			goto err_out;</div><div class='del'>-		}</div><div class='add'>+int erofs_init_metabuf(struct erofs_buf *buf, struct super_block *sb,</div><div class='add'>+		       bool in_metabox)</div><div class='add'>+{</div><div class='add'>+	struct erofs_sb_info *sbi = EROFS_SB(sb);</div><div class='ctx'> </div><div class='del'>-		map-&gt;m_flags |= EROFS_MAP_META;</div><div class='del'>-	} else {</div><div class='del'>-		erofs_err(inode-&gt;i_sb,</div><div class='del'>-			  "internal error @ nid: %llu (size %llu), m_la 0x%llx",</div><div class='del'>-			  vi-&gt;nid, inode-&gt;i_size, map-&gt;m_la);</div><div class='del'>-		DBG_BUGON(1);</div><div class='del'>-		err = -EIO;</div><div class='del'>-		goto err_out;</div><div class='add'>+	buf-&gt;file = NULL;</div><div class='add'>+	if (in_metabox) {</div><div class='add'>+		if (unlikely(!sbi-&gt;metabox_inode))</div><div class='add'>+			return -EFSCORRUPTED;</div><div class='add'>+		buf-&gt;mapping = sbi-&gt;metabox_inode-&gt;i_mapping;</div><div class='add'>+		return 0;</div><div class='ctx'> 	}</div><div class='add'>+	buf-&gt;off = sbi-&gt;dif0.fsoff;</div><div class='add'>+	if (erofs_is_fileio_mode(sbi)) {</div><div class='add'>+		buf-&gt;file = sbi-&gt;dif0.file;	/* some fs like FUSE needs it */</div><div class='add'>+		buf-&gt;mapping = buf-&gt;file-&gt;f_mapping;</div><div class='add'>+	} else if (erofs_is_fscache_mode(sb))</div><div class='add'>+		buf-&gt;mapping = sbi-&gt;dif0.fscache-&gt;inode-&gt;i_mapping;</div><div class='add'>+	else</div><div class='add'>+		buf-&gt;mapping = sb-&gt;s_bdev-&gt;bd_mapping;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	map-&gt;m_llen = map-&gt;m_plen;</div><div class='del'>-err_out:</div><div class='del'>-	trace_erofs_map_blocks_flatmode_exit(inode, map, flags, 0);</div><div class='del'>-	return err;</div><div class='add'>+void *erofs_read_metabuf(struct erofs_buf *buf, struct super_block *sb,</div><div class='add'>+			 erofs_off_t offset, bool in_metabox)</div><div class='add'>+{</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = erofs_init_metabuf(buf, sb, in_metabox);</div><div class='add'>+	if (err)</div><div class='add'>+		return ERR_PTR(err);</div><div class='add'>+	return erofs_bread(buf, offset, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int erofs_map_blocks(struct inode *inode,</div><div class='del'>-			    struct erofs_map_blocks *map, int flags)</div><div class='add'>+int erofs_map_blocks(struct inode *inode, struct erofs_map_blocks *map)</div><div class='ctx'> {</div><div class='add'>+	struct erofs_buf buf = __EROFS_BUF_INITIALIZER;</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='add'>+	unsigned int unit, blksz = sb-&gt;s_blocksize;</div><div class='ctx'> 	struct erofs_inode *vi = EROFS_I(inode);</div><div class='ctx'> 	struct erofs_inode_chunk_index *idx;</div><div class='del'>-	struct page *page;</div><div class='del'>-	u64 chunknr;</div><div class='del'>-	unsigned int unit;</div><div class='add'>+	erofs_blk_t startblk, addrmask;</div><div class='add'>+	bool tailpacking;</div><div class='ctx'> 	erofs_off_t pos;</div><div class='add'>+	u64 chunknr;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='add'>+	trace_erofs_map_blocks_enter(inode, map, 0);</div><div class='ctx'> 	map-&gt;m_deviceid = 0;</div><div class='del'>-	if (map-&gt;m_la &gt;= inode-&gt;i_size) {</div><div class='del'>-		/* leave out-of-bound access unmapped */</div><div class='del'>-		map-&gt;m_flags = 0;</div><div class='del'>-		map-&gt;m_plen = 0;</div><div class='add'>+	map-&gt;m_flags = 0;</div><div class='add'>+	if (map-&gt;m_la &gt;= inode-&gt;i_size)</div><div class='ctx'> 		goto out;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	if (vi-&gt;datalayout != EROFS_INODE_CHUNK_BASED)</div><div class='del'>-		return erofs_map_blocks_flatmode(inode, map, flags);</div><div class='add'>+	if (vi-&gt;datalayout != EROFS_INODE_CHUNK_BASED) {</div><div class='add'>+		tailpacking = (vi-&gt;datalayout == EROFS_INODE_FLAT_INLINE);</div><div class='add'>+		if (!tailpacking &amp;&amp; vi-&gt;startblk == EROFS_NULL_ADDR)</div><div class='add'>+			goto out;</div><div class='add'>+		pos = erofs_pos(sb, erofs_iblks(inode) - tailpacking);</div><div class='add'>+</div><div class='add'>+		map-&gt;m_flags = EROFS_MAP_MAPPED;</div><div class='add'>+		if (map-&gt;m_la &lt; pos) {</div><div class='add'>+			map-&gt;m_pa = erofs_pos(sb, vi-&gt;startblk) + map-&gt;m_la;</div><div class='add'>+			map-&gt;m_llen = pos - map-&gt;m_la;</div><div class='add'>+		} else {</div><div class='add'>+			map-&gt;m_pa = erofs_iloc(inode) + vi-&gt;inode_isize +</div><div class='add'>+				vi-&gt;xattr_isize + erofs_blkoff(sb, map-&gt;m_la);</div><div class='add'>+			map-&gt;m_llen = inode-&gt;i_size - map-&gt;m_la;</div><div class='add'>+			map-&gt;m_flags |= EROFS_MAP_META;</div><div class='add'>+		}</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (vi-&gt;chunkformat &amp; EROFS_CHUNK_FORMAT_INDEXES)</div><div class='ctx'> 		unit = sizeof(*idx);			/* chunk index */</div><div class='hunk'>@@ -106,60 +127,70 @@ static int erofs_map_blocks(struct inode *inode,</div><div class='ctx'> 		unit = EROFS_BLOCK_MAP_ENTRY_SIZE;	/* block map */</div><div class='ctx'> </div><div class='ctx'> 	chunknr = map-&gt;m_la &gt;&gt; vi-&gt;chunkbits;</div><div class='del'>-	pos = ALIGN(iloc(EROFS_SB(sb), vi-&gt;nid) + vi-&gt;inode_isize +</div><div class='add'>+	pos = ALIGN(erofs_iloc(inode) + vi-&gt;inode_isize +</div><div class='ctx'> 		    vi-&gt;xattr_isize, unit) + unit * chunknr;</div><div class='ctx'> </div><div class='del'>-	page = erofs_get_meta_page(inode-&gt;i_sb, erofs_blknr(pos));</div><div class='del'>-	if (IS_ERR(page))</div><div class='del'>-		return PTR_ERR(page);</div><div class='del'>-</div><div class='add'>+	idx = erofs_read_metabuf(&amp;buf, sb, pos, erofs_inode_in_metabox(inode));</div><div class='add'>+	if (IS_ERR(idx)) {</div><div class='add'>+		err = PTR_ERR(idx);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> 	map-&gt;m_la = chunknr &lt;&lt; vi-&gt;chunkbits;</div><div class='del'>-	map-&gt;m_plen = min_t(erofs_off_t, 1UL &lt;&lt; vi-&gt;chunkbits,</div><div class='del'>-			    roundup(inode-&gt;i_size - map-&gt;m_la, EROFS_BLKSIZ));</div><div class='del'>-</div><div class='del'>-	/* handle block map */</div><div class='del'>-	if (!(vi-&gt;chunkformat &amp; EROFS_CHUNK_FORMAT_INDEXES)) {</div><div class='del'>-		__le32 *blkaddr = page_address(page) + erofs_blkoff(pos);</div><div class='del'>-</div><div class='del'>-		if (le32_to_cpu(*blkaddr) == EROFS_NULL_ADDR) {</div><div class='del'>-			map-&gt;m_flags = 0;</div><div class='del'>-		} else {</div><div class='del'>-			map-&gt;m_pa = blknr_to_addr(le32_to_cpu(*blkaddr));</div><div class='add'>+	map-&gt;m_llen = min_t(erofs_off_t, 1UL &lt;&lt; vi-&gt;chunkbits,</div><div class='add'>+			    round_up(inode-&gt;i_size - map-&gt;m_la, blksz));</div><div class='add'>+	if (vi-&gt;chunkformat &amp; EROFS_CHUNK_FORMAT_INDEXES) {</div><div class='add'>+		addrmask = (vi-&gt;chunkformat &amp; EROFS_CHUNK_FORMAT_48BIT) ?</div><div class='add'>+			BIT_ULL(48) - 1 : BIT_ULL(32) - 1;</div><div class='add'>+		startblk = (((u64)le16_to_cpu(idx-&gt;startblk_hi) &lt;&lt; 32) |</div><div class='add'>+			    le32_to_cpu(idx-&gt;startblk_lo)) &amp; addrmask;</div><div class='add'>+		if ((startblk ^ EROFS_NULL_ADDR) &amp; addrmask) {</div><div class='add'>+			map-&gt;m_deviceid = le16_to_cpu(idx-&gt;device_id) &amp;</div><div class='add'>+				EROFS_SB(sb)-&gt;device_id_mask;</div><div class='add'>+			map-&gt;m_pa = erofs_pos(sb, startblk);</div><div class='add'>+			map-&gt;m_flags = EROFS_MAP_MAPPED;</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		startblk = le32_to_cpu(*(__le32 *)idx);</div><div class='add'>+		if (startblk != (u32)EROFS_NULL_ADDR) {</div><div class='add'>+			map-&gt;m_pa = erofs_pos(sb, startblk);</div><div class='ctx'> 			map-&gt;m_flags = EROFS_MAP_MAPPED;</div><div class='ctx'> 		}</div><div class='del'>-		goto out_unlock;</div><div class='del'>-	}</div><div class='del'>-	/* parse chunk indexes */</div><div class='del'>-	idx = page_address(page) + erofs_blkoff(pos);</div><div class='del'>-	switch (le32_to_cpu(idx-&gt;blkaddr)) {</div><div class='del'>-	case EROFS_NULL_ADDR:</div><div class='del'>-		map-&gt;m_flags = 0;</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		map-&gt;m_deviceid = le16_to_cpu(idx-&gt;device_id) &amp;</div><div class='del'>-			EROFS_SB(sb)-&gt;device_id_mask;</div><div class='del'>-		map-&gt;m_pa = blknr_to_addr(le32_to_cpu(idx-&gt;blkaddr));</div><div class='del'>-		map-&gt;m_flags = EROFS_MAP_MAPPED;</div><div class='del'>-		break;</div><div class='ctx'> 	}</div><div class='del'>-out_unlock:</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='add'>+	erofs_put_metabuf(&amp;buf);</div><div class='ctx'> out:</div><div class='del'>-	map-&gt;m_llen = map-&gt;m_plen;</div><div class='add'>+	if (!err) {</div><div class='add'>+		map-&gt;m_plen = map-&gt;m_llen;</div><div class='add'>+		/* inline data should be located in the same meta block */</div><div class='add'>+		if ((map-&gt;m_flags &amp; EROFS_MAP_META) &amp;&amp;</div><div class='add'>+		    erofs_blkoff(sb, map-&gt;m_pa) + map-&gt;m_plen &gt; blksz) {</div><div class='add'>+			erofs_err(sb, "inline data across blocks @ nid %llu", vi-&gt;nid);</div><div class='add'>+			DBG_BUGON(1);</div><div class='add'>+			return -EFSCORRUPTED;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	trace_erofs_map_blocks_exit(inode, map, 0, err);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void erofs_fill_from_devinfo(struct erofs_map_dev *map,</div><div class='add'>+		struct super_block *sb, struct erofs_device_info *dif)</div><div class='add'>+{</div><div class='add'>+	map-&gt;m_sb = sb;</div><div class='add'>+	map-&gt;m_dif = dif;</div><div class='add'>+	map-&gt;m_bdev = NULL;</div><div class='add'>+	if (dif-&gt;file &amp;&amp; S_ISBLK(file_inode(dif-&gt;file)-&gt;i_mode))</div><div class='add'>+		map-&gt;m_bdev = file_bdev(dif-&gt;file);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> int erofs_map_dev(struct super_block *sb, struct erofs_map_dev *map)</div><div class='ctx'> {</div><div class='ctx'> 	struct erofs_dev_context *devs = EROFS_SB(sb)-&gt;devs;</div><div class='ctx'> 	struct erofs_device_info *dif;</div><div class='add'>+	erofs_off_t startoff;</div><div class='ctx'> 	int id;</div><div class='ctx'> </div><div class='del'>-	/* primary device by default */</div><div class='del'>-	map-&gt;m_bdev = sb-&gt;s_bdev;</div><div class='del'>-	map-&gt;m_daxdev = EROFS_SB(sb)-&gt;dax_dev;</div><div class='del'>-</div><div class='add'>+	erofs_fill_from_devinfo(map, sb, &amp;EROFS_SB(sb)-&gt;dif0);</div><div class='add'>+	map-&gt;m_bdev = sb-&gt;s_bdev;	/* use s_bdev for the primary device */</div><div class='ctx'> 	if (map-&gt;m_deviceid) {</div><div class='ctx'> 		down_read(&amp;devs-&gt;rwsem);</div><div class='ctx'> 		dif = idr_find(&amp;devs-&gt;tree, map-&gt;m_deviceid - 1);</div><div class='hunk'>@@ -167,24 +198,24 @@ int erofs_map_dev(struct super_block *sb, struct erofs_map_dev *map)</div><div class='ctx'> 			up_read(&amp;devs-&gt;rwsem);</div><div class='ctx'> 			return -ENODEV;</div><div class='ctx'> 		}</div><div class='del'>-		map-&gt;m_bdev = dif-&gt;bdev;</div><div class='del'>-		map-&gt;m_daxdev = dif-&gt;dax_dev;</div><div class='add'>+		if (devs-&gt;flatdev) {</div><div class='add'>+			map-&gt;m_pa += erofs_pos(sb, dif-&gt;uniaddr);</div><div class='add'>+			up_read(&amp;devs-&gt;rwsem);</div><div class='add'>+			return 0;</div><div class='add'>+		}</div><div class='add'>+		erofs_fill_from_devinfo(map, sb, dif);</div><div class='ctx'> 		up_read(&amp;devs-&gt;rwsem);</div><div class='del'>-	} else if (devs-&gt;extra_devices) {</div><div class='add'>+	} else if (devs-&gt;extra_devices &amp;&amp; !devs-&gt;flatdev) {</div><div class='ctx'> 		down_read(&amp;devs-&gt;rwsem);</div><div class='ctx'> 		idr_for_each_entry(&amp;devs-&gt;tree, dif, id) {</div><div class='del'>-			erofs_off_t startoff, length;</div><div class='del'>-</div><div class='del'>-			if (!dif-&gt;mapped_blkaddr)</div><div class='add'>+			if (!dif-&gt;uniaddr)</div><div class='ctx'> 				continue;</div><div class='del'>-			startoff = blknr_to_addr(dif-&gt;mapped_blkaddr);</div><div class='del'>-			length = blknr_to_addr(dif-&gt;blocks);</div><div class='ctx'> </div><div class='add'>+			startoff = erofs_pos(sb, dif-&gt;uniaddr);</div><div class='ctx'> 			if (map-&gt;m_pa &gt;= startoff &amp;&amp;</div><div class='del'>-			    map-&gt;m_pa &lt; startoff + length) {</div><div class='add'>+			    map-&gt;m_pa &lt; startoff + erofs_pos(sb, dif-&gt;blocks)) {</div><div class='ctx'> 				map-&gt;m_pa -= startoff;</div><div class='del'>-				map-&gt;m_bdev = dif-&gt;bdev;</div><div class='del'>-				map-&gt;m_daxdev = dif-&gt;dax_dev;</div><div class='add'>+				erofs_fill_from_devinfo(map, sb, dif);</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='hunk'>@@ -193,57 +224,103 @@ int erofs_map_dev(struct super_block *sb, struct erofs_map_dev *map)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * bit 30: I/O error occurred on this folio</div><div class='add'>+ * bit 29: CPU has dirty data in D-cache (needs aliasing handling);</div><div class='add'>+ * bit 0 - 29: remaining parts to complete this folio</div><div class='add'>+ */</div><div class='add'>+#define EROFS_ONLINEFOLIO_EIO		30</div><div class='add'>+#define EROFS_ONLINEFOLIO_DIRTY		29</div><div class='add'>+</div><div class='add'>+void erofs_onlinefolio_init(struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	union {</div><div class='add'>+		atomic_t o;</div><div class='add'>+		void *v;</div><div class='add'>+	} u = { .o = ATOMIC_INIT(1) };</div><div class='add'>+</div><div class='add'>+	folio-&gt;private = u.v;	/* valid only if file-backed folio is locked */</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void erofs_onlinefolio_split(struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	atomic_inc((atomic_t *)&amp;folio-&gt;private);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void erofs_onlinefolio_end(struct folio *folio, int err, bool dirty)</div><div class='add'>+{</div><div class='add'>+	int orig, v;</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		orig = atomic_read((atomic_t *)&amp;folio-&gt;private);</div><div class='add'>+		DBG_BUGON(orig &lt;= 0);</div><div class='add'>+		v = dirty &lt;&lt; EROFS_ONLINEFOLIO_DIRTY;</div><div class='add'>+		v |= (orig - 1) | (!!err &lt;&lt; EROFS_ONLINEFOLIO_EIO);</div><div class='add'>+	} while (atomic_cmpxchg((atomic_t *)&amp;folio-&gt;private, orig, v) != orig);</div><div class='add'>+</div><div class='add'>+	if (v &amp; (BIT(EROFS_ONLINEFOLIO_DIRTY) - 1))</div><div class='add'>+		return;</div><div class='add'>+	folio-&gt;private = 0;</div><div class='add'>+	if (v &amp; BIT(EROFS_ONLINEFOLIO_DIRTY))</div><div class='add'>+		flush_dcache_folio(folio);</div><div class='add'>+	folio_end_read(folio, !(v &amp; BIT(EROFS_ONLINEFOLIO_EIO)));</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int erofs_iomap_begin(struct inode *inode, loff_t offset, loff_t length,</div><div class='ctx'> 		unsigned int flags, struct iomap *iomap, struct iomap *srcmap)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='add'>+	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	struct erofs_map_blocks map;</div><div class='ctx'> 	struct erofs_map_dev mdev;</div><div class='ctx'> </div><div class='ctx'> 	map.m_la = offset;</div><div class='ctx'> 	map.m_llen = length;</div><div class='del'>-</div><div class='del'>-	ret = erofs_map_blocks(inode, &amp;map, EROFS_GET_BLOCKS_RAW);</div><div class='add'>+	ret = erofs_map_blocks(inode, &amp;map);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	mdev = (struct erofs_map_dev) {</div><div class='del'>-		.m_deviceid = map.m_deviceid,</div><div class='del'>-		.m_pa = map.m_pa,</div><div class='del'>-	};</div><div class='del'>-	ret = erofs_map_dev(inode-&gt;i_sb, &amp;mdev);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	iomap-&gt;bdev = mdev.m_bdev;</div><div class='del'>-	iomap-&gt;dax_dev = mdev.m_daxdev;</div><div class='ctx'> 	iomap-&gt;offset = map.m_la;</div><div class='ctx'> 	iomap-&gt;length = map.m_llen;</div><div class='ctx'> 	iomap-&gt;flags = 0;</div><div class='ctx'> 	iomap-&gt;private = NULL;</div><div class='del'>-</div><div class='add'>+	iomap-&gt;addr = IOMAP_NULL_ADDR;</div><div class='ctx'> 	if (!(map.m_flags &amp; EROFS_MAP_MAPPED)) {</div><div class='ctx'> 		iomap-&gt;type = IOMAP_HOLE;</div><div class='del'>-		iomap-&gt;addr = IOMAP_NULL_ADDR;</div><div class='del'>-		if (!iomap-&gt;length)</div><div class='del'>-			iomap-&gt;length = length;</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (!(map.m_flags &amp; EROFS_MAP_META) || !erofs_inode_in_metabox(inode)) {</div><div class='add'>+		mdev = (struct erofs_map_dev) {</div><div class='add'>+			.m_deviceid = map.m_deviceid,</div><div class='add'>+			.m_pa = map.m_pa,</div><div class='add'>+		};</div><div class='add'>+		ret = erofs_map_dev(sb, &amp;mdev);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+</div><div class='add'>+		if (flags &amp; IOMAP_DAX)</div><div class='add'>+			iomap-&gt;dax_dev = mdev.m_dif-&gt;dax_dev;</div><div class='add'>+		else</div><div class='add'>+			iomap-&gt;bdev = mdev.m_bdev;</div><div class='add'>+		iomap-&gt;addr = mdev.m_dif-&gt;fsoff + mdev.m_pa;</div><div class='add'>+		if (flags &amp; IOMAP_DAX)</div><div class='add'>+			iomap-&gt;addr += mdev.m_dif-&gt;dax_part_off;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (map.m_flags &amp; EROFS_MAP_META) {</div><div class='del'>-		struct page *ipage;</div><div class='add'>+		void *ptr;</div><div class='add'>+		struct erofs_buf buf = __EROFS_BUF_INITIALIZER;</div><div class='ctx'> </div><div class='ctx'> 		iomap-&gt;type = IOMAP_INLINE;</div><div class='del'>-		ipage = erofs_get_meta_page(inode-&gt;i_sb,</div><div class='del'>-					    erofs_blknr(mdev.m_pa));</div><div class='del'>-		if (IS_ERR(ipage))</div><div class='del'>-			return PTR_ERR(ipage);</div><div class='del'>-		iomap-&gt;inline_data = page_address(ipage) +</div><div class='del'>-					erofs_blkoff(mdev.m_pa);</div><div class='del'>-		iomap-&gt;private = ipage;</div><div class='add'>+		ptr = erofs_read_metabuf(&amp;buf, sb, map.m_pa,</div><div class='add'>+					 erofs_inode_in_metabox(inode));</div><div class='add'>+		if (IS_ERR(ptr))</div><div class='add'>+			return PTR_ERR(ptr);</div><div class='add'>+		iomap-&gt;inline_data = ptr;</div><div class='add'>+		iomap-&gt;private = buf.base;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		iomap-&gt;type = IOMAP_MAPPED;</div><div class='del'>-		iomap-&gt;addr = mdev.m_pa;</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -251,12 +328,16 @@ static int erofs_iomap_begin(struct inode *inode, loff_t offset, loff_t length,</div><div class='ctx'> static int erofs_iomap_end(struct inode *inode, loff_t pos, loff_t length,</div><div class='ctx'> 		ssize_t written, unsigned int flags, struct iomap *iomap)</div><div class='ctx'> {</div><div class='del'>-	struct page *ipage = iomap-&gt;private;</div><div class='add'>+	void *ptr = iomap-&gt;private;</div><div class='add'>+</div><div class='add'>+	if (ptr) {</div><div class='add'>+		struct erofs_buf buf = {</div><div class='add'>+			.page = kmap_to_page(ptr),</div><div class='add'>+			.base = ptr,</div><div class='add'>+		};</div><div class='ctx'> </div><div class='del'>-	if (ipage) {</div><div class='ctx'> 		DBG_BUGON(iomap-&gt;type != IOMAP_INLINE);</div><div class='del'>-		unlock_page(ipage);</div><div class='del'>-		put_page(ipage);</div><div class='add'>+		erofs_put_metabuf(&amp;buf);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		DBG_BUGON(iomap-&gt;type == IOMAP_INLINE);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -286,14 +367,20 @@ int erofs_fiemap(struct inode *inode, struct fiemap_extent_info *fieinfo,</div><div class='ctx'>  * since we dont have write or truncate flows, so no inode</div><div class='ctx'>  * locking needs to be held at the moment.</div><div class='ctx'>  */</div><div class='del'>-static int erofs_readpage(struct file *file, struct page *page)</div><div class='add'>+static int erofs_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	return iomap_readpage(page, &amp;erofs_iomap_ops);</div><div class='add'>+	trace_erofs_read_folio(folio, true);</div><div class='add'>+</div><div class='add'>+	iomap_bio_read_folio(folio, &amp;erofs_iomap_ops);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void erofs_readahead(struct readahead_control *rac)</div><div class='ctx'> {</div><div class='del'>-	return iomap_readahead(rac, &amp;erofs_iomap_ops);</div><div class='add'>+	trace_erofs_readahead(rac-&gt;mapping-&gt;host, readahead_index(rac),</div><div class='add'>+					readahead_count(rac), true);</div><div class='add'>+</div><div class='add'>+	iomap_bio_readahead(rac, &amp;erofs_iomap_ops);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static sector_t erofs_bmap(struct address_space *mapping, sector_t block)</div><div class='hunk'>@@ -301,64 +388,44 @@ static sector_t erofs_bmap(struct address_space *mapping, sector_t block)</div><div class='ctx'> 	return iomap_bmap(mapping, block, &amp;erofs_iomap_ops);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int erofs_prepare_dio(struct kiocb *iocb, struct iov_iter *to)</div><div class='add'>+static ssize_t erofs_file_read_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='del'>-	loff_t align = iocb-&gt;ki_pos | iov_iter_count(to) |</div><div class='del'>-		iov_iter_alignment(to);</div><div class='del'>-	struct block_device *bdev = inode-&gt;i_sb-&gt;s_bdev;</div><div class='del'>-	unsigned int blksize_mask;</div><div class='del'>-</div><div class='del'>-	if (bdev)</div><div class='del'>-		blksize_mask = (1 &lt;&lt; ilog2(bdev_logical_block_size(bdev))) - 1;</div><div class='del'>-	else</div><div class='del'>-		blksize_mask = (1 &lt;&lt; inode-&gt;i_blkbits) - 1;</div><div class='ctx'> </div><div class='del'>-	if (align &amp; blksize_mask)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static ssize_t erofs_file_read_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='del'>-{</div><div class='ctx'> 	/* no need taking (shared) inode lock since it's a ro filesystem */</div><div class='ctx'> 	if (!iov_iter_count(to))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_FS_DAX</div><div class='del'>-	if (IS_DAX(iocb-&gt;ki_filp-&gt;f_mapping-&gt;host))</div><div class='add'>+	if (IS_DAX(inode))</div><div class='ctx'> 		return dax_iomap_rw(iocb, to, &amp;erofs_iomap_ops);</div><div class='ctx'> #endif</div><div class='del'>-	if (iocb-&gt;ki_flags &amp; IOCB_DIRECT) {</div><div class='del'>-		int err = erofs_prepare_dio(iocb, to);</div><div class='del'>-</div><div class='del'>-		if (!err)</div><div class='del'>-			return iomap_dio_rw(iocb, to, &amp;erofs_iomap_ops,</div><div class='del'>-					    NULL, 0, 0);</div><div class='del'>-		if (err &lt; 0)</div><div class='del'>-			return err;</div><div class='del'>-	}</div><div class='add'>+	if ((iocb-&gt;ki_flags &amp; IOCB_DIRECT) &amp;&amp; inode-&gt;i_sb-&gt;s_bdev)</div><div class='add'>+		return iomap_dio_rw(iocb, to, &amp;erofs_iomap_ops,</div><div class='add'>+				    NULL, 0, NULL, 0);</div><div class='ctx'> 	return filemap_read(iocb, to, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* for uncompressed (aligned) files and raw access for other files */</div><div class='del'>-const struct address_space_operations erofs_raw_access_aops = {</div><div class='del'>-	.readpage = erofs_readpage,</div><div class='add'>+const struct address_space_operations erofs_aops = {</div><div class='add'>+	.read_folio = erofs_read_folio,</div><div class='ctx'> 	.readahead = erofs_readahead,</div><div class='ctx'> 	.bmap = erofs_bmap,</div><div class='ctx'> 	.direct_IO = noop_direct_IO,</div><div class='add'>+	.release_folio = iomap_release_folio,</div><div class='add'>+	.invalidate_folio = iomap_invalidate_folio,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_FS_DAX</div><div class='ctx'> static vm_fault_t erofs_dax_huge_fault(struct vm_fault *vmf,</div><div class='del'>-		enum page_entry_size pe_size)</div><div class='add'>+		unsigned int order)</div><div class='ctx'> {</div><div class='del'>-	return dax_iomap_fault(vmf, pe_size, NULL, NULL, &amp;erofs_iomap_ops);</div><div class='add'>+	return dax_iomap_fault(vmf, order, NULL, NULL, &amp;erofs_iomap_ops);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static vm_fault_t erofs_dax_fault(struct vm_fault *vmf)</div><div class='ctx'> {</div><div class='del'>-	return erofs_dax_huge_fault(vmf, PE_SIZE_PTE);</div><div class='add'>+	return erofs_dax_huge_fault(vmf, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct vm_operations_struct erofs_dax_vm_ops = {</div><div class='hunk'>@@ -366,25 +433,54 @@ static const struct vm_operations_struct erofs_dax_vm_ops = {</div><div class='ctx'> 	.huge_fault	= erofs_dax_huge_fault,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int erofs_file_mmap(struct file *file, struct vm_area_struct *vma)</div><div class='add'>+static int erofs_file_mmap_prepare(struct vm_area_desc *desc)</div><div class='ctx'> {</div><div class='del'>-	if (!IS_DAX(file_inode(file)))</div><div class='del'>-		return generic_file_readonly_mmap(file, vma);</div><div class='add'>+	if (!IS_DAX(file_inode(desc-&gt;file)))</div><div class='add'>+		return generic_file_readonly_mmap_prepare(desc);</div><div class='ctx'> </div><div class='del'>-	if ((vma-&gt;vm_flags &amp; VM_SHARED) &amp;&amp; (vma-&gt;vm_flags &amp; VM_MAYWRITE))</div><div class='add'>+	if ((desc-&gt;vm_flags &amp; VM_SHARED) &amp;&amp; (desc-&gt;vm_flags &amp; VM_MAYWRITE))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	vma-&gt;vm_ops = &amp;erofs_dax_vm_ops;</div><div class='del'>-	vma-&gt;vm_flags |= VM_HUGEPAGE;</div><div class='add'>+	desc-&gt;vm_ops = &amp;erofs_dax_vm_ops;</div><div class='add'>+	desc-&gt;vm_flags |= VM_HUGEPAGE;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> #else</div><div class='del'>-#define erofs_file_mmap	generic_file_readonly_mmap</div><div class='add'>+#define erofs_file_mmap_prepare	generic_file_readonly_mmap_prepare</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+static loff_t erofs_file_llseek(struct file *file, loff_t offset, int whence)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file-&gt;f_mapping-&gt;host;</div><div class='add'>+	const struct iomap_ops *ops = &amp;erofs_iomap_ops;</div><div class='add'>+</div><div class='add'>+	if (erofs_inode_is_data_compressed(EROFS_I(inode)-&gt;datalayout))</div><div class='add'>+#ifdef CONFIG_EROFS_FS_ZIP</div><div class='add'>+		ops = &amp;z_erofs_iomap_report_ops;</div><div class='add'>+#else</div><div class='add'>+		return generic_file_llseek(file, offset, whence);</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='add'>+	if (whence == SEEK_HOLE)</div><div class='add'>+		offset = iomap_seek_hole(inode, offset, ops);</div><div class='add'>+	else if (whence == SEEK_DATA)</div><div class='add'>+		offset = iomap_seek_data(inode, offset, ops);</div><div class='add'>+	else</div><div class='add'>+		return generic_file_llseek(file, offset, whence);</div><div class='add'>+</div><div class='add'>+	if (offset &lt; 0)</div><div class='add'>+		return offset;</div><div class='add'>+	return vfs_setpos(file, offset, inode-&gt;i_sb-&gt;s_maxbytes);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> const struct file_operations erofs_file_fops = {</div><div class='del'>-	.llseek		= generic_file_llseek,</div><div class='add'>+	.llseek		= erofs_file_llseek,</div><div class='ctx'> 	.read_iter	= erofs_file_read_iter,</div><div class='del'>-	.mmap		= erofs_file_mmap,</div><div class='del'>-	.splice_read	= generic_file_splice_read,</div><div class='add'>+	.unlocked_ioctl = erofs_ioctl,</div><div class='add'>+#ifdef CONFIG_COMPAT</div><div class='add'>+	.compat_ioctl   = erofs_compat_ioctl,</div><div class='add'>+#endif</div><div class='add'>+	.mmap_prepare	= erofs_file_mmap_prepare,</div><div class='add'>+	.get_unmapped_area = thp_get_unmapped_area,</div><div class='add'>+	.splice_read	= filemap_splice_read,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/erofs/decompressor.c b/fs/erofs/decompressor.c<br/>index bf37fc76b182..d5d090276391 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/erofs/decompressor.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/decompressor.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/erofs/decompressor.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/erofs/decompressor.c</a></div><div class='hunk'>@@ -2,25 +2,18 @@</div><div class='ctx'> /*</div><div class='ctx'>  * Copyright (C) 2019 HUAWEI, Inc.</div><div class='ctx'>  *             https://www.huawei.com/</div><div class='add'>+ * Copyright (C) 2024 Alibaba Cloud</div><div class='ctx'>  */</div><div class='ctx'> #include "compress.h"</div><div class='del'>-#include &lt;linux/module.h&gt;</div><div class='ctx'> #include &lt;linux/lz4.h&gt;</div><div class='ctx'> </div><div class='del'>-#ifndef LZ4_DISTANCE_MAX	/* history window size */</div><div class='del'>-#define LZ4_DISTANCE_MAX 65535	/* set to maximum value by default */</div><div class='del'>-#endif</div><div class='del'>-</div><div class='ctx'> #define LZ4_MAX_DISTANCE_PAGES	(DIV_ROUND_UP(LZ4_DISTANCE_MAX, PAGE_SIZE) + 1)</div><div class='del'>-#ifndef LZ4_DECOMPRESS_INPLACE_MARGIN</div><div class='del'>-#define LZ4_DECOMPRESS_INPLACE_MARGIN(srcsize)  (((srcsize) &gt;&gt; 8) + 32)</div><div class='del'>-#endif</div><div class='ctx'> </div><div class='del'>-int z_erofs_load_lz4_config(struct super_block *sb,</div><div class='del'>-			    struct erofs_super_block *dsb,</div><div class='del'>-			    struct z_erofs_lz4_cfgs *lz4, int size)</div><div class='add'>+static int z_erofs_load_lz4_config(struct super_block *sb,</div><div class='add'>+			    struct erofs_super_block *dsb, void *data, int size)</div><div class='ctx'> {</div><div class='ctx'> 	struct erofs_sb_info *sbi = EROFS_SB(sb);</div><div class='add'>+	struct z_erofs_lz4_cfgs *lz4 = data;</div><div class='ctx'> 	u16 distance;</div><div class='ctx'> </div><div class='ctx'> 	if (lz4) {</div><div class='hunk'>@@ -34,12 +27,10 @@ int z_erofs_load_lz4_config(struct super_block *sb,</div><div class='ctx'> 		if (!sbi-&gt;lz4.max_pclusterblks) {</div><div class='ctx'> 			sbi-&gt;lz4.max_pclusterblks = 1;	/* reserved case */</div><div class='ctx'> 		} else if (sbi-&gt;lz4.max_pclusterblks &gt;</div><div class='del'>-			   Z_EROFS_PCLUSTER_MAX_SIZE / EROFS_BLKSIZ) {</div><div class='add'>+			   erofs_blknr(sb, Z_EROFS_PCLUSTER_MAX_SIZE)) {</div><div class='ctx'> 			erofs_err(sb, "too large lz4 pclusterblks %u",</div><div class='ctx'> 				  sbi-&gt;lz4.max_pclusterblks);</div><div class='ctx'> 			return -EINVAL;</div><div class='del'>-		} else if (sbi-&gt;lz4.max_pclusterblks &gt;= 2) {</div><div class='del'>-			erofs_info(sb, "EXPERIMENTAL big pcluster feature in use. Use at your own risk!");</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='ctx'> 		distance = le16_to_cpu(dsb-&gt;u1.lz4_max_distance);</div><div class='hunk'>@@ -49,7 +40,7 @@ int z_erofs_load_lz4_config(struct super_block *sb,</div><div class='ctx'> 	sbi-&gt;lz4.max_distance_pages = distance ?</div><div class='ctx'> 					DIV_ROUND_UP(distance, PAGE_SIZE) + 1 :</div><div class='ctx'> 					LZ4_MAX_DISTANCE_PAGES;</div><div class='del'>-	return erofs_pcpubuf_growsize(sbi-&gt;lz4.max_pclusterblks);</div><div class='add'>+	return z_erofs_gbuf_growsize(sbi-&gt;lz4.max_pclusterblks);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -59,8 +50,6 @@ int z_erofs_load_lz4_config(struct super_block *sb,</div><div class='ctx'> static int z_erofs_lz4_prepare_dstpages(struct z_erofs_decompress_req *rq,</div><div class='ctx'> 					struct page **pagepool)</div><div class='ctx'> {</div><div class='del'>-	const unsigned int nr =</div><div class='del'>-		PAGE_ALIGN(rq-&gt;pageofs_out + rq-&gt;outputsize) &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> 	struct page *availables[LZ4_MAX_DISTANCE_PAGES] = { NULL };</div><div class='ctx'> 	unsigned long bounced[DIV_ROUND_UP(LZ4_MAX_DISTANCE_PAGES,</div><div class='ctx'> 					   BITS_PER_LONG)] = { 0 };</div><div class='hunk'>@@ -70,7 +59,7 @@ static int z_erofs_lz4_prepare_dstpages(struct z_erofs_decompress_req *rq,</div><div class='ctx'> 	unsigned int i, j, top;</div><div class='ctx'> </div><div class='ctx'> 	top = 0;</div><div class='del'>-	for (i = j = 0; i &lt; nr; ++i, ++j) {</div><div class='add'>+	for (i = j = 0; i &lt; rq-&gt;outpages; ++i, ++j) {</div><div class='ctx'> 		struct page *const page = rq-&gt;out[i];</div><div class='ctx'> 		struct page *victim;</div><div class='ctx'> </div><div class='hunk'>@@ -78,7 +67,7 @@ static int z_erofs_lz4_prepare_dstpages(struct z_erofs_decompress_req *rq,</div><div class='ctx'> 			j = 0;</div><div class='ctx'> </div><div class='ctx'> 		/* 'valid' bounced can only be tested after a complete round */</div><div class='del'>-		if (test_bit(j, bounced)) {</div><div class='add'>+		if (!rq-&gt;fillgaps &amp;&amp; test_bit(j, bounced)) {</div><div class='ctx'> 			DBG_BUGON(i &lt; lz4_max_distance_pages);</div><div class='ctx'> 			DBG_BUGON(top &gt;= lz4_max_distance_pages);</div><div class='ctx'> 			availables[top++] = rq-&gt;out[i - lz4_max_distance_pages];</div><div class='hunk'>@@ -86,14 +75,18 @@ static int z_erofs_lz4_prepare_dstpages(struct z_erofs_decompress_req *rq,</div><div class='ctx'> </div><div class='ctx'> 		if (page) {</div><div class='ctx'> 			__clear_bit(j, bounced);</div><div class='del'>-			if (kaddr) {</div><div class='del'>-				if (kaddr + PAGE_SIZE == page_address(page))</div><div class='add'>+			if (!PageHighMem(page)) {</div><div class='add'>+				if (!i) {</div><div class='add'>+					kaddr = page_address(page);</div><div class='add'>+					continue;</div><div class='add'>+				}</div><div class='add'>+				if (kaddr &amp;&amp;</div><div class='add'>+				    kaddr + PAGE_SIZE == page_address(page)) {</div><div class='ctx'> 					kaddr += PAGE_SIZE;</div><div class='del'>-				else</div><div class='del'>-					kaddr = NULL;</div><div class='del'>-			} else if (!i) {</div><div class='del'>-				kaddr = page_address(page);</div><div class='add'>+					continue;</div><div class='add'>+				}</div><div class='ctx'> 			}</div><div class='add'>+			kaddr = NULL;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> 		kaddr = NULL;</div><div class='hunk'>@@ -101,10 +94,10 @@ static int z_erofs_lz4_prepare_dstpages(struct z_erofs_decompress_req *rq,</div><div class='ctx'> </div><div class='ctx'> 		if (top) {</div><div class='ctx'> 			victim = availables[--top];</div><div class='del'>-			get_page(victim);</div><div class='ctx'> 		} else {</div><div class='del'>-			victim = erofs_allocpage(pagepool,</div><div class='del'>-						 GFP_KERNEL | __GFP_NOFAIL);</div><div class='add'>+			victim = __erofs_allocpage(pagepool, rq-&gt;gfp, true);</div><div class='add'>+			if (!victim)</div><div class='add'>+				return -ENOMEM;</div><div class='ctx'> 			set_page_private(victim, Z_EROFS_SHORTLIVED_PAGE);</div><div class='ctx'> 		}</div><div class='ctx'> 		rq-&gt;out[i] = victim;</div><div class='hunk'>@@ -112,109 +105,128 @@ static int z_erofs_lz4_prepare_dstpages(struct z_erofs_decompress_req *rq,</div><div class='ctx'> 	return kaddr ? 1 : 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void *z_erofs_lz4_handle_inplace_io(struct z_erofs_decompress_req *rq,</div><div class='del'>-			void *inpage, unsigned int *inputmargin, int *maptype,</div><div class='del'>-			bool support_0padding)</div><div class='add'>+static void *z_erofs_lz4_handle_overlap(const struct z_erofs_decompress_req *rq,</div><div class='add'>+			void *inpage, void *out, unsigned int *inputmargin,</div><div class='add'>+			int *maptype, bool may_inplace)</div><div class='ctx'> {</div><div class='del'>-	unsigned int nrpages_in, nrpages_out;</div><div class='del'>-	unsigned int ofull, oend, inputsize, total, i, j;</div><div class='add'>+	unsigned int oend, omargin, cnt, i;</div><div class='ctx'> 	struct page **in;</div><div class='del'>-	void *src, *tmp;</div><div class='del'>-</div><div class='del'>-	inputsize = rq-&gt;inputsize;</div><div class='del'>-	nrpages_in = PAGE_ALIGN(inputsize) &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	oend = rq-&gt;pageofs_out + rq-&gt;outputsize;</div><div class='del'>-	ofull = PAGE_ALIGN(oend);</div><div class='del'>-	nrpages_out = ofull &gt;&gt; PAGE_SHIFT;</div><div class='del'>-</div><div class='del'>-	if (rq-&gt;inplace_io) {</div><div class='del'>-		if (rq-&gt;partial_decoding || !support_0padding ||</div><div class='del'>-		    ofull - oend &lt; LZ4_DECOMPRESS_INPLACE_MARGIN(inputsize))</div><div class='del'>-			goto docopy;</div><div class='del'>-</div><div class='del'>-		for (i = 0; i &lt; nrpages_in; ++i) {</div><div class='del'>-			DBG_BUGON(rq-&gt;in[i] == NULL);</div><div class='del'>-			for (j = 0; j &lt; nrpages_out - nrpages_in + i; ++j)</div><div class='del'>-				if (rq-&gt;out[j] == rq-&gt;in[i])</div><div class='del'>-					goto docopy;</div><div class='add'>+	void *src;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If in-place I/O isn't used, for example, the bounce compressed cache</div><div class='add'>+	 * can hold data for incomplete read requests. Just map the compressed</div><div class='add'>+	 * buffer as well and decompress directly.</div><div class='add'>+	 */</div><div class='add'>+	if (!rq-&gt;inplace_io) {</div><div class='add'>+		if (rq-&gt;inpages &lt;= 1) {</div><div class='add'>+			*maptype = 0;</div><div class='add'>+			return inpage;</div><div class='ctx'> 		}</div><div class='add'>+		kunmap_local(inpage);</div><div class='add'>+		src = erofs_vm_map_ram(rq-&gt;in, rq-&gt;inpages);</div><div class='add'>+		if (!src)</div><div class='add'>+			return ERR_PTR(-ENOMEM);</div><div class='add'>+		*maptype = 1;</div><div class='add'>+		return src;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	if (nrpages_in &lt;= 1) {</div><div class='del'>-		*maptype = 0;</div><div class='del'>-		return inpage;</div><div class='add'>+	/*</div><div class='add'>+	 * Then, deal with in-place I/Os. The reasons why in-place I/O is useful</div><div class='add'>+	 * are: (1) It minimizes memory footprint during the I/O submission,</div><div class='add'>+	 * which is useful for slow storage (including network devices and</div><div class='add'>+	 * low-end HDDs/eMMCs) but with a lot inflight I/Os; (2) If in-place</div><div class='add'>+	 * decompression can also be applied, it will reuse the unique buffer so</div><div class='add'>+	 * that no extra CPU D-cache is polluted with temporary compressed data</div><div class='add'>+	 * for extreme performance.</div><div class='add'>+	 */</div><div class='add'>+	oend = rq-&gt;pageofs_out + rq-&gt;outputsize;</div><div class='add'>+	omargin = PAGE_ALIGN(oend) - oend;</div><div class='add'>+	if (!rq-&gt;partial_decoding &amp;&amp; may_inplace &amp;&amp;</div><div class='add'>+	    omargin &gt;= LZ4_DECOMPRESS_INPLACE_MARGIN(rq-&gt;inputsize)) {</div><div class='add'>+		for (i = 0; i &lt; rq-&gt;inpages; ++i)</div><div class='add'>+			if (rq-&gt;out[rq-&gt;outpages - rq-&gt;inpages + i] !=</div><div class='add'>+			    rq-&gt;in[i])</div><div class='add'>+				break;</div><div class='add'>+		if (i &gt;= rq-&gt;inpages) {</div><div class='add'>+			kunmap_local(inpage);</div><div class='add'>+			*maptype = 3;</div><div class='add'>+			return out + ((rq-&gt;outpages - rq-&gt;inpages) &lt;&lt; PAGE_SHIFT);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='del'>-	kunmap_atomic(inpage);</div><div class='del'>-	might_sleep();</div><div class='del'>-	src = erofs_vm_map_ram(rq-&gt;in, nrpages_in);</div><div class='del'>-	if (!src)</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='del'>-	*maptype = 1;</div><div class='del'>-	return src;</div><div class='del'>-</div><div class='del'>-docopy:</div><div class='del'>-	/* Or copy compressed data which can be overlapped to per-CPU buffer */</div><div class='del'>-	in = rq-&gt;in;</div><div class='del'>-	src = erofs_get_pcpubuf(nrpages_in);</div><div class='add'>+	/*</div><div class='add'>+	 * If in-place decompression can't be applied, copy compressed data that</div><div class='add'>+	 * may potentially overlap during decompression to a per-CPU buffer.</div><div class='add'>+	 */</div><div class='add'>+	src = z_erofs_get_gbuf(rq-&gt;inpages);</div><div class='ctx'> 	if (!src) {</div><div class='ctx'> 		DBG_BUGON(1);</div><div class='del'>-		kunmap_atomic(inpage);</div><div class='add'>+		kunmap_local(inpage);</div><div class='ctx'> 		return ERR_PTR(-EFAULT);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	tmp = src;</div><div class='del'>-	total = rq-&gt;inputsize;</div><div class='del'>-	while (total) {</div><div class='del'>-		unsigned int page_copycnt =</div><div class='del'>-			min_t(unsigned int, total, PAGE_SIZE - *inputmargin);</div><div class='del'>-</div><div class='add'>+	for (i = 0, in = rq-&gt;in; i &lt; rq-&gt;inputsize; i += cnt, ++in) {</div><div class='add'>+		cnt = min_t(u32, rq-&gt;inputsize - i, PAGE_SIZE - *inputmargin);</div><div class='ctx'> 		if (!inpage)</div><div class='del'>-			inpage = kmap_atomic(*in);</div><div class='del'>-		memcpy(tmp, inpage + *inputmargin, page_copycnt);</div><div class='del'>-		kunmap_atomic(inpage);</div><div class='add'>+			inpage = kmap_local_page(*in);</div><div class='add'>+		memcpy(src + i, inpage + *inputmargin, cnt);</div><div class='add'>+		kunmap_local(inpage);</div><div class='ctx'> 		inpage = NULL;</div><div class='del'>-		tmp += page_copycnt;</div><div class='del'>-		total -= page_copycnt;</div><div class='del'>-		++in;</div><div class='ctx'> 		*inputmargin = 0;</div><div class='ctx'> 	}</div><div class='ctx'> 	*maptype = 2;</div><div class='ctx'> 	return src;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int z_erofs_lz4_decompress_mem(struct z_erofs_decompress_req *rq,</div><div class='del'>-				      u8 *out)</div><div class='add'>+/*</div><div class='add'>+ * Get the exact on-disk size of the compressed data:</div><div class='add'>+ *  - For LZ4, it should apply if the zero_padding feature is on (5.3+);</div><div class='add'>+ *  - For others, zero_padding is enabled all the time.</div><div class='add'>+ */</div><div class='add'>+const char *z_erofs_fixup_insize(struct z_erofs_decompress_req *rq,</div><div class='add'>+				 const char *padbuf, unsigned int padbufsize)</div><div class='add'>+{</div><div class='add'>+	const char *padend;</div><div class='add'>+</div><div class='add'>+	padend = memchr_inv(padbuf, 0, padbufsize);</div><div class='add'>+	if (!padend)</div><div class='add'>+		return "compressed data start not found";</div><div class='add'>+	rq-&gt;inputsize -= padend - padbuf;</div><div class='add'>+	rq-&gt;pageofs_in += padend - padbuf;</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int z_erofs_lz4_decompress_mem(struct z_erofs_decompress_req *rq, u8 *dst)</div><div class='ctx'> {</div><div class='add'>+	bool support_0padding = false, may_inplace = false;</div><div class='ctx'> 	unsigned int inputmargin;</div><div class='del'>-	u8 *headpage, *src;</div><div class='del'>-	bool support_0padding;</div><div class='add'>+	u8 *out, *headpage, *src;</div><div class='add'>+	const char *reason;</div><div class='ctx'> 	int ret, maptype;</div><div class='ctx'> </div><div class='ctx'> 	DBG_BUGON(*rq-&gt;in == NULL);</div><div class='del'>-	headpage = kmap_atomic(*rq-&gt;in);</div><div class='del'>-	inputmargin = 0;</div><div class='del'>-	support_0padding = false;</div><div class='add'>+	headpage = kmap_local_page(*rq-&gt;in);</div><div class='ctx'> </div><div class='del'>-	/* decompression inplace is only safe when 0padding is enabled */</div><div class='del'>-	if (erofs_sb_has_lz4_0padding(EROFS_SB(rq-&gt;sb))) {</div><div class='add'>+	/* LZ4 decompression inplace is only safe if zero_padding is enabled */</div><div class='add'>+	if (erofs_sb_has_zero_padding(EROFS_SB(rq-&gt;sb))) {</div><div class='ctx'> 		support_0padding = true;</div><div class='del'>-</div><div class='del'>-		while (!headpage[inputmargin &amp; ~PAGE_MASK])</div><div class='del'>-			if (!(++inputmargin &amp; ~PAGE_MASK))</div><div class='del'>-				break;</div><div class='del'>-</div><div class='del'>-		if (inputmargin &gt;= rq-&gt;inputsize) {</div><div class='del'>-			kunmap_atomic(headpage);</div><div class='del'>-			return -EIO;</div><div class='add'>+		reason = z_erofs_fixup_insize(rq, headpage + rq-&gt;pageofs_in,</div><div class='add'>+				min_t(unsigned int, rq-&gt;inputsize,</div><div class='add'>+				      rq-&gt;sb-&gt;s_blocksize - rq-&gt;pageofs_in));</div><div class='add'>+		if (reason) {</div><div class='add'>+			kunmap_local(headpage);</div><div class='add'>+			return IS_ERR(reason) ? PTR_ERR(reason) : -EFSCORRUPTED;</div><div class='ctx'> 		}</div><div class='add'>+		may_inplace = !((rq-&gt;pageofs_in + rq-&gt;inputsize) &amp;</div><div class='add'>+				(rq-&gt;sb-&gt;s_blocksize - 1));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	rq-&gt;inputsize -= inputmargin;</div><div class='del'>-	src = z_erofs_lz4_handle_inplace_io(rq, headpage, &amp;inputmargin,</div><div class='del'>-					    &amp;maptype, support_0padding);</div><div class='add'>+	inputmargin = rq-&gt;pageofs_in;</div><div class='add'>+	src = z_erofs_lz4_handle_overlap(rq, headpage, dst, &amp;inputmargin,</div><div class='add'>+					 &amp;maptype, may_inplace);</div><div class='ctx'> 	if (IS_ERR(src))</div><div class='ctx'> 		return PTR_ERR(src);</div><div class='ctx'> </div><div class='add'>+	out = dst + rq-&gt;pageofs_out;</div><div class='ctx'> 	/* legacy format could compress extra data in a pcluster. */</div><div class='ctx'> 	if (rq-&gt;partial_decoding || !support_0padding)</div><div class='ctx'> 		ret = LZ4_decompress_safe_partial(src + inputmargin, out,</div><div class='hunk'>@@ -224,134 +236,290 @@ static int z_erofs_lz4_decompress_mem(struct z_erofs_decompress_req *rq,</div><div class='ctx'> 					  rq-&gt;inputsize, rq-&gt;outputsize);</div><div class='ctx'> </div><div class='ctx'> 	if (ret != rq-&gt;outputsize) {</div><div class='del'>-		erofs_err(rq-&gt;sb, "failed to decompress %d in[%u, %u] out[%u]",</div><div class='del'>-			  ret, rq-&gt;inputsize, inputmargin, rq-&gt;outputsize);</div><div class='del'>-</div><div class='del'>-		print_hex_dump(KERN_DEBUG, "[ in]: ", DUMP_PREFIX_OFFSET,</div><div class='del'>-			       16, 1, src + inputmargin, rq-&gt;inputsize, true);</div><div class='del'>-		print_hex_dump(KERN_DEBUG, "[out]: ", DUMP_PREFIX_OFFSET,</div><div class='del'>-			       16, 1, out, rq-&gt;outputsize, true);</div><div class='del'>-</div><div class='ctx'> 		if (ret &gt;= 0)</div><div class='ctx'> 			memset(out + ret, 0, rq-&gt;outputsize - ret);</div><div class='del'>-		ret = -EIO;</div><div class='add'>+		ret = -EFSCORRUPTED;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		ret = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (maptype == 0) {</div><div class='del'>-		kunmap_atomic(src);</div><div class='add'>+		kunmap_local(headpage);</div><div class='ctx'> 	} else if (maptype == 1) {</div><div class='del'>-		vm_unmap_ram(src, PAGE_ALIGN(rq-&gt;inputsize) &gt;&gt; PAGE_SHIFT);</div><div class='add'>+		vm_unmap_ram(src, rq-&gt;inpages);</div><div class='ctx'> 	} else if (maptype == 2) {</div><div class='del'>-		erofs_put_pcpubuf(src);</div><div class='del'>-	} else {</div><div class='add'>+		z_erofs_put_gbuf(src);</div><div class='add'>+	} else if (maptype != 3) {</div><div class='ctx'> 		DBG_BUGON(1);</div><div class='ctx'> 		return -EFAULT;</div><div class='ctx'> 	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int z_erofs_lz4_decompress(struct z_erofs_decompress_req *rq,</div><div class='del'>-				  struct page **pagepool)</div><div class='add'>+static const char *z_erofs_lz4_decompress(struct z_erofs_decompress_req *rq,</div><div class='add'>+					  struct page **pagepool)</div><div class='ctx'> {</div><div class='del'>-	const unsigned int nrpages_out =</div><div class='del'>-		PAGE_ALIGN(rq-&gt;pageofs_out + rq-&gt;outputsize) &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> 	unsigned int dst_maptype;</div><div class='ctx'> 	void *dst;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	/* one optimized fast path only for non bigpcluster cases yet */</div><div class='del'>-	if (rq-&gt;inputsize &lt;= PAGE_SIZE &amp;&amp; nrpages_out == 1 &amp;&amp; !rq-&gt;inplace_io) {</div><div class='add'>+	if (rq-&gt;inpages == 1 &amp;&amp; rq-&gt;outpages == 1 &amp;&amp; !rq-&gt;inplace_io) {</div><div class='ctx'> 		DBG_BUGON(!*rq-&gt;out);</div><div class='del'>-		dst = kmap_atomic(*rq-&gt;out);</div><div class='add'>+		dst = kmap_local_page(*rq-&gt;out);</div><div class='ctx'> 		dst_maptype = 0;</div><div class='del'>-		goto dstmap_out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* general decoding path which can be used for all cases */</div><div class='del'>-	ret = z_erofs_lz4_prepare_dstpages(rq, pagepool);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		return ret;</div><div class='del'>-	if (ret) {</div><div class='del'>-		dst = page_address(*rq-&gt;out);</div><div class='del'>-		dst_maptype = 1;</div><div class='del'>-		goto dstmap_out;</div><div class='add'>+	} else {</div><div class='add'>+		/* general decoding path which can be used for all cases */</div><div class='add'>+		ret = z_erofs_lz4_prepare_dstpages(rq, pagepool);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ERR_PTR(ret);</div><div class='add'>+		if (ret &gt; 0) {</div><div class='add'>+			dst = page_address(*rq-&gt;out);</div><div class='add'>+			dst_maptype = 1;</div><div class='add'>+		} else {</div><div class='add'>+			dst = erofs_vm_map_ram(rq-&gt;out, rq-&gt;outpages);</div><div class='add'>+			if (!dst)</div><div class='add'>+				return ERR_PTR(-ENOMEM);</div><div class='add'>+			dst_maptype = 2;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	dst = erofs_vm_map_ram(rq-&gt;out, nrpages_out);</div><div class='del'>-	if (!dst)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	dst_maptype = 2;</div><div class='del'>-</div><div class='del'>-dstmap_out:</div><div class='del'>-	ret = z_erofs_lz4_decompress_mem(rq, dst + rq-&gt;pageofs_out);</div><div class='del'>-</div><div class='add'>+	ret = z_erofs_lz4_decompress_mem(rq, dst);</div><div class='ctx'> 	if (!dst_maptype)</div><div class='del'>-		kunmap_atomic(dst);</div><div class='add'>+		kunmap_local(dst);</div><div class='ctx'> 	else if (dst_maptype == 2)</div><div class='del'>-		vm_unmap_ram(dst, nrpages_out);</div><div class='del'>-	return ret;</div><div class='add'>+		vm_unmap_ram(dst, rq-&gt;outpages);</div><div class='add'>+	return ERR_PTR(ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int z_erofs_shifted_transform(struct z_erofs_decompress_req *rq,</div><div class='del'>-				     struct page **pagepool)</div><div class='add'>+static const char *z_erofs_transform_plain(struct z_erofs_decompress_req *rq,</div><div class='add'>+					   struct page **pagepool)</div><div class='ctx'> {</div><div class='del'>-	const unsigned int nrpages_out =</div><div class='del'>-		PAGE_ALIGN(rq-&gt;pageofs_out + rq-&gt;outputsize) &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	const unsigned int righthalf = PAGE_SIZE - rq-&gt;pageofs_out;</div><div class='del'>-	unsigned char *src, *dst;</div><div class='del'>-</div><div class='del'>-	if (nrpages_out &gt; 2) {</div><div class='del'>-		DBG_BUGON(1);</div><div class='del'>-		return -EIO;</div><div class='add'>+	const unsigned int nrpages_in = rq-&gt;inpages, nrpages_out = rq-&gt;outpages;</div><div class='add'>+	const unsigned int bs = rq-&gt;sb-&gt;s_blocksize;</div><div class='add'>+	unsigned int cur = 0, ni = 0, no, pi, po, insz, cnt;</div><div class='add'>+	u8 *kin;</div><div class='add'>+</div><div class='add'>+	if (rq-&gt;outputsize &gt; rq-&gt;inputsize)</div><div class='add'>+		return ERR_PTR(-EOPNOTSUPP);</div><div class='add'>+	if (rq-&gt;alg == Z_EROFS_COMPRESSION_INTERLACED) {</div><div class='add'>+		cur = bs - (rq-&gt;pageofs_out &amp; (bs - 1));</div><div class='add'>+		pi = (rq-&gt;pageofs_in + rq-&gt;inputsize - cur) &amp; ~PAGE_MASK;</div><div class='add'>+		cur = min(cur, rq-&gt;outputsize);</div><div class='add'>+		if (cur &amp;&amp; rq-&gt;out[0]) {</div><div class='add'>+			kin = kmap_local_page(rq-&gt;in[nrpages_in - 1]);</div><div class='add'>+			if (rq-&gt;out[0] == rq-&gt;in[nrpages_in - 1])</div><div class='add'>+				memmove(kin + rq-&gt;pageofs_out, kin + pi, cur);</div><div class='add'>+			else</div><div class='add'>+				memcpy_to_page(rq-&gt;out[0], rq-&gt;pageofs_out,</div><div class='add'>+					       kin + pi, cur);</div><div class='add'>+			kunmap_local(kin);</div><div class='add'>+		}</div><div class='add'>+		rq-&gt;outputsize -= cur;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (rq-&gt;out[0] == *rq-&gt;in) {</div><div class='del'>-		DBG_BUGON(nrpages_out != 1);</div><div class='del'>-		return 0;</div><div class='add'>+	for (; rq-&gt;outputsize; rq-&gt;pageofs_in = 0, cur += insz, ni++) {</div><div class='add'>+		insz = min(PAGE_SIZE - rq-&gt;pageofs_in, rq-&gt;outputsize);</div><div class='add'>+		rq-&gt;outputsize -= insz;</div><div class='add'>+		if (!rq-&gt;in[ni])</div><div class='add'>+			continue;</div><div class='add'>+		kin = kmap_local_page(rq-&gt;in[ni]);</div><div class='add'>+		pi = 0;</div><div class='add'>+		do {</div><div class='add'>+			no = (rq-&gt;pageofs_out + cur + pi) &gt;&gt; PAGE_SHIFT;</div><div class='add'>+			po = (rq-&gt;pageofs_out + cur + pi) &amp; ~PAGE_MASK;</div><div class='add'>+			DBG_BUGON(no &gt;= nrpages_out);</div><div class='add'>+			cnt = min(insz - pi, PAGE_SIZE - po);</div><div class='add'>+			if (rq-&gt;out[no] == rq-&gt;in[ni])</div><div class='add'>+				memmove(kin + po,</div><div class='add'>+					kin + rq-&gt;pageofs_in + pi, cnt);</div><div class='add'>+			else if (rq-&gt;out[no])</div><div class='add'>+				memcpy_to_page(rq-&gt;out[no], po,</div><div class='add'>+					       kin + rq-&gt;pageofs_in + pi, cnt);</div><div class='add'>+			pi += cnt;</div><div class='add'>+		} while (pi &lt; insz);</div><div class='add'>+		kunmap_local(kin);</div><div class='ctx'> 	}</div><div class='add'>+	DBG_BUGON(ni &gt; nrpages_in);</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	src = kmap_atomic(*rq-&gt;in);</div><div class='del'>-	if (rq-&gt;out[0]) {</div><div class='del'>-		dst = kmap_atomic(rq-&gt;out[0]);</div><div class='del'>-		memcpy(dst + rq-&gt;pageofs_out, src, righthalf);</div><div class='del'>-		kunmap_atomic(dst);</div><div class='add'>+const char *z_erofs_stream_switch_bufs(struct z_erofs_stream_dctx *dctx,</div><div class='add'>+				void **dst, void **src, struct page **pgpl)</div><div class='add'>+{</div><div class='add'>+	struct z_erofs_decompress_req *rq = dctx-&gt;rq;</div><div class='add'>+	struct page **pgo, *tmppage;</div><div class='add'>+	unsigned int j;</div><div class='add'>+</div><div class='add'>+	if (!dctx-&gt;avail_out) {</div><div class='add'>+		if (++dctx-&gt;no &gt;= rq-&gt;outpages || !rq-&gt;outputsize)</div><div class='add'>+			return "insufficient space for decompressed data";</div><div class='add'>+</div><div class='add'>+		if (dctx-&gt;kout)</div><div class='add'>+			kunmap_local(dctx-&gt;kout);</div><div class='add'>+		dctx-&gt;avail_out = min(rq-&gt;outputsize, PAGE_SIZE - rq-&gt;pageofs_out);</div><div class='add'>+		rq-&gt;outputsize -= dctx-&gt;avail_out;</div><div class='add'>+		pgo = &amp;rq-&gt;out[dctx-&gt;no];</div><div class='add'>+		if (!*pgo &amp;&amp; rq-&gt;fillgaps) {		/* deduped */</div><div class='add'>+			*pgo = erofs_allocpage(pgpl, rq-&gt;gfp);</div><div class='add'>+			if (!*pgo) {</div><div class='add'>+				dctx-&gt;kout = NULL;</div><div class='add'>+				return ERR_PTR(-ENOMEM);</div><div class='add'>+			}</div><div class='add'>+			set_page_private(*pgo, Z_EROFS_SHORTLIVED_PAGE);</div><div class='add'>+		}</div><div class='add'>+		if (*pgo) {</div><div class='add'>+			dctx-&gt;kout = kmap_local_page(*pgo);</div><div class='add'>+			*dst = dctx-&gt;kout + rq-&gt;pageofs_out;</div><div class='add'>+		} else {</div><div class='add'>+			*dst = dctx-&gt;kout = NULL;</div><div class='add'>+		}</div><div class='add'>+		rq-&gt;pageofs_out = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (nrpages_out == 2) {</div><div class='del'>-		DBG_BUGON(!rq-&gt;out[1]);</div><div class='del'>-		if (rq-&gt;out[1] == *rq-&gt;in) {</div><div class='del'>-			memmove(src, src + righthalf, rq-&gt;pageofs_out);</div><div class='del'>-		} else {</div><div class='del'>-			dst = kmap_atomic(rq-&gt;out[1]);</div><div class='del'>-			memcpy(dst, src + righthalf, rq-&gt;pageofs_out);</div><div class='del'>-			kunmap_atomic(dst);</div><div class='add'>+	if (dctx-&gt;inbuf_pos == dctx-&gt;inbuf_sz &amp;&amp; rq-&gt;inputsize) {</div><div class='add'>+		if (++dctx-&gt;ni &gt;= rq-&gt;inpages)</div><div class='add'>+			return "invalid compressed data";</div><div class='add'>+		if (dctx-&gt;kout) /* unlike kmap(), take care of the orders */</div><div class='add'>+			kunmap_local(dctx-&gt;kout);</div><div class='add'>+		kunmap_local(dctx-&gt;kin);</div><div class='add'>+</div><div class='add'>+		dctx-&gt;inbuf_sz = min_t(u32, rq-&gt;inputsize, PAGE_SIZE);</div><div class='add'>+		rq-&gt;inputsize -= dctx-&gt;inbuf_sz;</div><div class='add'>+		dctx-&gt;kin = kmap_local_page(rq-&gt;in[dctx-&gt;ni]);</div><div class='add'>+		*src = dctx-&gt;kin;</div><div class='add'>+		dctx-&gt;bounced = false;</div><div class='add'>+		if (dctx-&gt;kout) {</div><div class='add'>+			j = (u8 *)*dst - dctx-&gt;kout;</div><div class='add'>+			dctx-&gt;kout = kmap_local_page(rq-&gt;out[dctx-&gt;no]);</div><div class='add'>+			*dst = dctx-&gt;kout + j;</div><div class='ctx'> 		}</div><div class='add'>+		dctx-&gt;inbuf_pos = 0;</div><div class='ctx'> 	}</div><div class='del'>-	kunmap_atomic(src);</div><div class='del'>-	return 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Handle overlapping: Use the given bounce buffer if the input data is</div><div class='add'>+	 * under processing; Or utilize short-lived pages from the on-stack page</div><div class='add'>+	 * pool, where pages are shared among the same request.  Note that only</div><div class='add'>+	 * a few inplace I/O pages need to be doubled.</div><div class='add'>+	 */</div><div class='add'>+	if (!dctx-&gt;bounced &amp;&amp; rq-&gt;out[dctx-&gt;no] == rq-&gt;in[dctx-&gt;ni]) {</div><div class='add'>+		memcpy(dctx-&gt;bounce, *src, dctx-&gt;inbuf_sz);</div><div class='add'>+		*src = dctx-&gt;bounce;</div><div class='add'>+		dctx-&gt;bounced = true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for (j = dctx-&gt;ni + 1; j &lt; rq-&gt;inpages; ++j) {</div><div class='add'>+		if (rq-&gt;out[dctx-&gt;no] != rq-&gt;in[j])</div><div class='add'>+			continue;</div><div class='add'>+		tmppage = erofs_allocpage(pgpl, rq-&gt;gfp);</div><div class='add'>+		if (!tmppage)</div><div class='add'>+			return ERR_PTR(-ENOMEM);</div><div class='add'>+		set_page_private(tmppage, Z_EROFS_SHORTLIVED_PAGE);</div><div class='add'>+		copy_highpage(tmppage, rq-&gt;in[j]);</div><div class='add'>+		rq-&gt;in[j] = tmppage;</div><div class='add'>+	}</div><div class='add'>+	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct z_erofs_decompressor decompressors[] = {</div><div class='del'>-	[Z_EROFS_COMPRESSION_SHIFTED] = {</div><div class='del'>-		.decompress = z_erofs_shifted_transform,</div><div class='add'>+const struct z_erofs_decompressor *z_erofs_decomp[] = {</div><div class='add'>+	[Z_EROFS_COMPRESSION_SHIFTED] = &amp;(const struct z_erofs_decompressor) {</div><div class='add'>+		.decompress = z_erofs_transform_plain,</div><div class='ctx'> 		.name = "shifted"</div><div class='ctx'> 	},</div><div class='del'>-	[Z_EROFS_COMPRESSION_LZ4] = {</div><div class='add'>+	[Z_EROFS_COMPRESSION_INTERLACED] = &amp;(const struct z_erofs_decompressor) {</div><div class='add'>+		.decompress = z_erofs_transform_plain,</div><div class='add'>+		.name = "interlaced"</div><div class='add'>+	},</div><div class='add'>+	[Z_EROFS_COMPRESSION_LZ4] = &amp;(const struct z_erofs_decompressor) {</div><div class='add'>+		.config = z_erofs_load_lz4_config,</div><div class='ctx'> 		.decompress = z_erofs_lz4_decompress,</div><div class='add'>+		.init = z_erofs_gbuf_init,</div><div class='add'>+		.exit = z_erofs_gbuf_exit,</div><div class='ctx'> 		.name = "lz4"</div><div class='ctx'> 	},</div><div class='ctx'> #ifdef CONFIG_EROFS_FS_ZIP_LZMA</div><div class='del'>-	[Z_EROFS_COMPRESSION_LZMA] = {</div><div class='del'>-		.decompress = z_erofs_lzma_decompress,</div><div class='del'>-		.name = "lzma"</div><div class='del'>-	},</div><div class='add'>+	[Z_EROFS_COMPRESSION_LZMA] = &amp;z_erofs_lzma_decomp,</div><div class='add'>+#endif</div><div class='add'>+#ifdef CONFIG_EROFS_FS_ZIP_DEFLATE</div><div class='add'>+	[Z_EROFS_COMPRESSION_DEFLATE] = &amp;z_erofs_deflate_decomp,</div><div class='add'>+#endif</div><div class='add'>+#ifdef CONFIG_EROFS_FS_ZIP_ZSTD</div><div class='add'>+	[Z_EROFS_COMPRESSION_ZSTD] = &amp;z_erofs_zstd_decomp,</div><div class='ctx'> #endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-int z_erofs_decompress(struct z_erofs_decompress_req *rq,</div><div class='del'>-		       struct page **pagepool)</div><div class='add'>+int z_erofs_parse_cfgs(struct super_block *sb, struct erofs_super_block *dsb)</div><div class='add'>+{</div><div class='add'>+	struct erofs_sb_info *sbi = EROFS_SB(sb);</div><div class='add'>+	struct erofs_buf buf = __EROFS_BUF_INITIALIZER;</div><div class='add'>+	unsigned int algs, alg;</div><div class='add'>+	erofs_off_t offset;</div><div class='add'>+	int size, ret = 0;</div><div class='add'>+</div><div class='add'>+	if (!erofs_sb_has_compr_cfgs(sbi)) {</div><div class='add'>+		sbi-&gt;available_compr_algs = 1 &lt;&lt; Z_EROFS_COMPRESSION_LZ4;</div><div class='add'>+		return z_erofs_load_lz4_config(sb, dsb, NULL, 0);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	sbi-&gt;available_compr_algs = le16_to_cpu(dsb-&gt;u1.available_compr_algs);</div><div class='add'>+	if (sbi-&gt;available_compr_algs &amp; ~Z_EROFS_ALL_COMPR_ALGS) {</div><div class='add'>+		erofs_err(sb, "unidentified algorithms %x, please upgrade kernel",</div><div class='add'>+			  sbi-&gt;available_compr_algs &amp; ~Z_EROFS_ALL_COMPR_ALGS);</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	(void)erofs_init_metabuf(&amp;buf, sb, false);</div><div class='add'>+	offset = EROFS_SUPER_OFFSET + sbi-&gt;sb_size;</div><div class='add'>+	alg = 0;</div><div class='add'>+	for (algs = sbi-&gt;available_compr_algs; algs; algs &gt;&gt;= 1, ++alg) {</div><div class='add'>+		const struct z_erofs_decompressor *dec = z_erofs_decomp[alg];</div><div class='add'>+		void *data;</div><div class='add'>+</div><div class='add'>+		if (!(algs &amp; 1))</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		data = erofs_read_metadata(sb, &amp;buf, &amp;offset, &amp;size);</div><div class='add'>+		if (IS_ERR(data)) {</div><div class='add'>+			ret = PTR_ERR(data);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (alg &lt; Z_EROFS_COMPRESSION_MAX &amp;&amp; dec &amp;&amp; dec-&gt;config) {</div><div class='add'>+			ret = dec-&gt;config(sb, dsb, data, size);</div><div class='add'>+		} else {</div><div class='add'>+			erofs_err(sb, "algorithm %d isn't enabled on this kernel",</div><div class='add'>+				  alg);</div><div class='add'>+			ret = -EOPNOTSUPP;</div><div class='add'>+		}</div><div class='add'>+		kfree(data);</div><div class='add'>+		if (ret)</div><div class='add'>+			break;</div><div class='add'>+	}</div><div class='add'>+	erofs_put_metabuf(&amp;buf);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int __init z_erofs_init_decompressor(void)</div><div class='ctx'> {</div><div class='del'>-	return decompressors[rq-&gt;alg].decompress(rq, pagepool);</div><div class='add'>+	int i, err;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; Z_EROFS_COMPRESSION_MAX; ++i) {</div><div class='add'>+		err = z_erofs_decomp[i] ? z_erofs_decomp[i]-&gt;init() : 0;</div><div class='add'>+		if (err) {</div><div class='add'>+			while (i--)</div><div class='add'>+				if (z_erofs_decomp[i])</div><div class='add'>+					z_erofs_decomp[i]-&gt;exit();</div><div class='add'>+			return err;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void z_erofs_exit_decompressor(void)</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; Z_EROFS_COMPRESSION_MAX; ++i)</div><div class='add'>+		if (z_erofs_decomp[i])</div><div class='add'>+			z_erofs_decomp[i]-&gt;exit();</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/erofs/decompressor_crypto.c b/fs/erofs/decompressor_crypto.c<br/>new file mode 100644<br/>index 000000000000..5ef6f71d3b7f<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/erofs/decompressor_crypto.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/erofs/decompressor_crypto.c</a></div><div class='hunk'>@@ -0,0 +1,182 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='add'>+#include &lt;linux/scatterlist.h&gt;</div><div class='add'>+#include &lt;crypto/acompress.h&gt;</div><div class='add'>+#include "compress.h"</div><div class='add'>+</div><div class='add'>+static int __z_erofs_crypto_decompress(struct z_erofs_decompress_req *rq,</div><div class='add'>+				       struct crypto_acomp *tfm)</div><div class='add'>+{</div><div class='add'>+	struct sg_table st_src, st_dst;</div><div class='add'>+	struct acomp_req *req;</div><div class='add'>+	struct crypto_wait wait;</div><div class='add'>+	const char *reason;</div><div class='add'>+	u8 *headpage;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	headpage = kmap_local_page(*rq-&gt;in);</div><div class='add'>+	reason = z_erofs_fixup_insize(rq, headpage + rq-&gt;pageofs_in,</div><div class='add'>+				min_t(unsigned int, rq-&gt;inputsize,</div><div class='add'>+				      rq-&gt;sb-&gt;s_blocksize - rq-&gt;pageofs_in));</div><div class='add'>+	kunmap_local(headpage);</div><div class='add'>+	if (reason)</div><div class='add'>+		return IS_ERR(reason) ? PTR_ERR(reason) : -EFSCORRUPTED;</div><div class='add'>+</div><div class='add'>+	req = acomp_request_alloc(tfm);</div><div class='add'>+	if (!req)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	ret = sg_alloc_table_from_pages_segment(&amp;st_src, rq-&gt;in, rq-&gt;inpages,</div><div class='add'>+			rq-&gt;pageofs_in, rq-&gt;inputsize, UINT_MAX, GFP_KERNEL);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto failed_src_alloc;</div><div class='add'>+</div><div class='add'>+	ret = sg_alloc_table_from_pages_segment(&amp;st_dst, rq-&gt;out, rq-&gt;outpages,</div><div class='add'>+			rq-&gt;pageofs_out, rq-&gt;outputsize, UINT_MAX, GFP_KERNEL);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto failed_dst_alloc;</div><div class='add'>+</div><div class='add'>+	acomp_request_set_params(req, st_src.sgl,</div><div class='add'>+				 st_dst.sgl, rq-&gt;inputsize, rq-&gt;outputsize);</div><div class='add'>+</div><div class='add'>+	crypto_init_wait(&amp;wait);</div><div class='add'>+	acomp_request_set_callback(req, CRYPTO_TFM_REQ_MAY_BACKLOG,</div><div class='add'>+				   crypto_req_done, &amp;wait);</div><div class='add'>+</div><div class='add'>+	ret = crypto_wait_req(crypto_acomp_decompress(req), &amp;wait);</div><div class='add'>+	if (ret) {</div><div class='add'>+		erofs_err(rq-&gt;sb, "failed to decompress %d in[%u, %u] out[%u]",</div><div class='add'>+			  ret, rq-&gt;inputsize, rq-&gt;pageofs_in, rq-&gt;outputsize);</div><div class='add'>+		ret = -EIO;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	sg_free_table(&amp;st_dst);</div><div class='add'>+failed_dst_alloc:</div><div class='add'>+	sg_free_table(&amp;st_src);</div><div class='add'>+failed_src_alloc:</div><div class='add'>+	acomp_request_free(req);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct z_erofs_crypto_engine {</div><div class='add'>+	char *crypto_name;</div><div class='add'>+	struct crypto_acomp *tfm;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct z_erofs_crypto_engine *z_erofs_crypto[Z_EROFS_COMPRESSION_MAX] = {</div><div class='add'>+	[Z_EROFS_COMPRESSION_LZ4] = (struct z_erofs_crypto_engine[]) {</div><div class='add'>+		{},</div><div class='add'>+	},</div><div class='add'>+	[Z_EROFS_COMPRESSION_LZMA] = (struct z_erofs_crypto_engine[]) {</div><div class='add'>+		{},</div><div class='add'>+	},</div><div class='add'>+	[Z_EROFS_COMPRESSION_DEFLATE] = (struct z_erofs_crypto_engine[]) {</div><div class='add'>+		{ .crypto_name = "qat_deflate", },</div><div class='add'>+		{},</div><div class='add'>+	},</div><div class='add'>+	[Z_EROFS_COMPRESSION_ZSTD] = (struct z_erofs_crypto_engine[]) {</div><div class='add'>+		{},</div><div class='add'>+	},</div><div class='add'>+};</div><div class='add'>+static DECLARE_RWSEM(z_erofs_crypto_rwsem);</div><div class='add'>+</div><div class='add'>+static struct crypto_acomp *z_erofs_crypto_get_engine(int alg)</div><div class='add'>+{</div><div class='add'>+	struct z_erofs_crypto_engine *e;</div><div class='add'>+</div><div class='add'>+	for (e = z_erofs_crypto[alg]; e-&gt;crypto_name; ++e)</div><div class='add'>+		if (e-&gt;tfm)</div><div class='add'>+			return e-&gt;tfm;</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int z_erofs_crypto_decompress(struct z_erofs_decompress_req *rq,</div><div class='add'>+			      struct page **pgpl)</div><div class='add'>+{</div><div class='add'>+	struct crypto_acomp *tfm;</div><div class='add'>+	int i, err;</div><div class='add'>+</div><div class='add'>+	down_read(&amp;z_erofs_crypto_rwsem);</div><div class='add'>+	tfm = z_erofs_crypto_get_engine(rq-&gt;alg);</div><div class='add'>+	if (!tfm) {</div><div class='add'>+		err = -EOPNOTSUPP;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; rq-&gt;outpages; i++) {</div><div class='add'>+		struct page *const page = rq-&gt;out[i];</div><div class='add'>+		struct page *victim;</div><div class='add'>+</div><div class='add'>+		if (!page) {</div><div class='add'>+			victim = __erofs_allocpage(pgpl, rq-&gt;gfp, true);</div><div class='add'>+			if (!victim) {</div><div class='add'>+				err = -ENOMEM;</div><div class='add'>+				goto out;</div><div class='add'>+			}</div><div class='add'>+			set_page_private(victim, Z_EROFS_SHORTLIVED_PAGE);</div><div class='add'>+			rq-&gt;out[i] = victim;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	err = __z_erofs_crypto_decompress(rq, tfm);</div><div class='add'>+out:</div><div class='add'>+	up_read(&amp;z_erofs_crypto_rwsem);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int z_erofs_crypto_enable_engine(const char *name, int len)</div><div class='add'>+{</div><div class='add'>+	struct z_erofs_crypto_engine *e;</div><div class='add'>+	struct crypto_acomp *tfm;</div><div class='add'>+	int alg;</div><div class='add'>+</div><div class='add'>+	down_write(&amp;z_erofs_crypto_rwsem);</div><div class='add'>+	for (alg = 0; alg &lt; Z_EROFS_COMPRESSION_MAX; ++alg) {</div><div class='add'>+		for (e = z_erofs_crypto[alg]; e-&gt;crypto_name; ++e) {</div><div class='add'>+			if (!strncmp(name, e-&gt;crypto_name, len)) {</div><div class='add'>+				if (e-&gt;tfm)</div><div class='add'>+					break;</div><div class='add'>+				tfm = crypto_alloc_acomp(e-&gt;crypto_name, 0, 0);</div><div class='add'>+				if (IS_ERR(tfm)) {</div><div class='add'>+					up_write(&amp;z_erofs_crypto_rwsem);</div><div class='add'>+					return -EOPNOTSUPP;</div><div class='add'>+				}</div><div class='add'>+				e-&gt;tfm = tfm;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	up_write(&amp;z_erofs_crypto_rwsem);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void z_erofs_crypto_disable_all_engines(void)</div><div class='add'>+{</div><div class='add'>+	struct z_erofs_crypto_engine *e;</div><div class='add'>+	int alg;</div><div class='add'>+</div><div class='add'>+	down_write(&amp;z_erofs_crypto_rwsem);</div><div class='add'>+	for (alg = 0; alg &lt; Z_EROFS_COMPRESSION_MAX; ++alg) {</div><div class='add'>+		for (e = z_erofs_crypto[alg]; e-&gt;crypto_name; ++e) {</div><div class='add'>+			if (!e-&gt;tfm)</div><div class='add'>+				continue;</div><div class='add'>+			crypto_free_acomp(e-&gt;tfm);</div><div class='add'>+			e-&gt;tfm = NULL;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	up_write(&amp;z_erofs_crypto_rwsem);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int z_erofs_crypto_show_engines(char *buf, int size, char sep)</div><div class='add'>+{</div><div class='add'>+	struct z_erofs_crypto_engine *e;</div><div class='add'>+	int alg, len = 0;</div><div class='add'>+</div><div class='add'>+	for (alg = 0; alg &lt; Z_EROFS_COMPRESSION_MAX; ++alg) {</div><div class='add'>+		for (e = z_erofs_crypto[alg]; e-&gt;crypto_name; ++e) {</div><div class='add'>+			if (!e-&gt;tfm)</div><div class='add'>+				continue;</div><div class='add'>+			len += scnprintf(buf + len, size - len, "%s%c",</div><div class='add'>+					 e-&gt;crypto_name, sep);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	return len;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/erofs/decompressor_deflate.c b/fs/erofs/decompressor_deflate.c<br/>new file mode 100644<br/>index 000000000000..3fb73000ed27<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/erofs/decompressor_deflate.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/erofs/decompressor_deflate.c</a></div><div class='hunk'>@@ -0,0 +1,204 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='add'>+#include &lt;linux/zlib.h&gt;</div><div class='add'>+#include "compress.h"</div><div class='add'>+</div><div class='add'>+struct z_erofs_deflate {</div><div class='add'>+	struct z_erofs_deflate *next;</div><div class='add'>+	struct z_stream_s z;</div><div class='add'>+	u8 bounce[PAGE_SIZE];</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static DEFINE_SPINLOCK(z_erofs_deflate_lock);</div><div class='add'>+static unsigned int z_erofs_deflate_nstrms, z_erofs_deflate_avail_strms;</div><div class='add'>+static struct z_erofs_deflate *z_erofs_deflate_head;</div><div class='add'>+static DECLARE_WAIT_QUEUE_HEAD(z_erofs_deflate_wq);</div><div class='add'>+</div><div class='add'>+module_param_named(deflate_streams, z_erofs_deflate_nstrms, uint, 0444);</div><div class='add'>+</div><div class='add'>+static void z_erofs_deflate_exit(void)</div><div class='add'>+{</div><div class='add'>+	/* there should be no running fs instance */</div><div class='add'>+	while (z_erofs_deflate_avail_strms) {</div><div class='add'>+		struct z_erofs_deflate *strm;</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;z_erofs_deflate_lock);</div><div class='add'>+		strm = z_erofs_deflate_head;</div><div class='add'>+		if (!strm) {</div><div class='add'>+			spin_unlock(&amp;z_erofs_deflate_lock);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+		z_erofs_deflate_head = NULL;</div><div class='add'>+		spin_unlock(&amp;z_erofs_deflate_lock);</div><div class='add'>+</div><div class='add'>+		while (strm) {</div><div class='add'>+			struct z_erofs_deflate *n = strm-&gt;next;</div><div class='add'>+</div><div class='add'>+			vfree(strm-&gt;z.workspace);</div><div class='add'>+			kfree(strm);</div><div class='add'>+			--z_erofs_deflate_avail_strms;</div><div class='add'>+			strm = n;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int __init z_erofs_deflate_init(void)</div><div class='add'>+{</div><div class='add'>+	/* by default, use # of possible CPUs instead */</div><div class='add'>+	if (!z_erofs_deflate_nstrms)</div><div class='add'>+		z_erofs_deflate_nstrms = num_possible_cpus();</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int z_erofs_load_deflate_config(struct super_block *sb,</div><div class='add'>+			struct erofs_super_block *dsb, void *data, int size)</div><div class='add'>+{</div><div class='add'>+	struct z_erofs_deflate_cfgs *dfl = data;</div><div class='add'>+	static DEFINE_MUTEX(deflate_resize_mutex);</div><div class='add'>+	static bool inited;</div><div class='add'>+</div><div class='add'>+	if (!dfl || size &lt; sizeof(struct z_erofs_deflate_cfgs)) {</div><div class='add'>+		erofs_err(sb, "invalid deflate cfgs, size=%u", size);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (dfl-&gt;windowbits &gt; MAX_WBITS) {</div><div class='add'>+		erofs_err(sb, "unsupported windowbits %u", dfl-&gt;windowbits);</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+	}</div><div class='add'>+	mutex_lock(&amp;deflate_resize_mutex);</div><div class='add'>+	if (!inited) {</div><div class='add'>+		for (; z_erofs_deflate_avail_strms &lt; z_erofs_deflate_nstrms;</div><div class='add'>+		     ++z_erofs_deflate_avail_strms) {</div><div class='add'>+			struct z_erofs_deflate *strm;</div><div class='add'>+</div><div class='add'>+			strm = kzalloc(sizeof(*strm), GFP_KERNEL);</div><div class='add'>+			if (!strm)</div><div class='add'>+				goto failed;</div><div class='add'>+			/* XXX: in-kernel zlib cannot customize windowbits */</div><div class='add'>+			strm-&gt;z.workspace = vmalloc(zlib_inflate_workspacesize());</div><div class='add'>+			if (!strm-&gt;z.workspace) {</div><div class='add'>+				kfree(strm);</div><div class='add'>+				goto failed;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			spin_lock(&amp;z_erofs_deflate_lock);</div><div class='add'>+			strm-&gt;next = z_erofs_deflate_head;</div><div class='add'>+			z_erofs_deflate_head = strm;</div><div class='add'>+			spin_unlock(&amp;z_erofs_deflate_lock);</div><div class='add'>+		}</div><div class='add'>+		inited = true;</div><div class='add'>+	}</div><div class='add'>+	mutex_unlock(&amp;deflate_resize_mutex);</div><div class='add'>+	erofs_info(sb, "EXPERIMENTAL DEFLATE feature in use. Use at your own risk!");</div><div class='add'>+	return 0;</div><div class='add'>+failed:</div><div class='add'>+	mutex_unlock(&amp;deflate_resize_mutex);</div><div class='add'>+	z_erofs_deflate_exit();</div><div class='add'>+	return -ENOMEM;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const char *__z_erofs_deflate_decompress(struct z_erofs_decompress_req *rq,</div><div class='add'>+						struct page **pgpl)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = rq-&gt;sb;</div><div class='add'>+	struct z_erofs_stream_dctx dctx = { .rq = rq, .no = -1, .ni = 0 };</div><div class='add'>+	struct z_erofs_deflate *strm;</div><div class='add'>+	const char *reason;</div><div class='add'>+	int zerr;</div><div class='add'>+</div><div class='add'>+	/* 1. get the exact DEFLATE compressed size */</div><div class='add'>+	dctx.kin = kmap_local_page(*rq-&gt;in);</div><div class='add'>+	reason = z_erofs_fixup_insize(rq, dctx.kin + rq-&gt;pageofs_in,</div><div class='add'>+			min(rq-&gt;inputsize, sb-&gt;s_blocksize - rq-&gt;pageofs_in));</div><div class='add'>+	if (reason) {</div><div class='add'>+		kunmap_local(dctx.kin);</div><div class='add'>+		return reason;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* 2. get an available DEFLATE context */</div><div class='add'>+again:</div><div class='add'>+	spin_lock(&amp;z_erofs_deflate_lock);</div><div class='add'>+	strm = z_erofs_deflate_head;</div><div class='add'>+	if (!strm) {</div><div class='add'>+		spin_unlock(&amp;z_erofs_deflate_lock);</div><div class='add'>+		wait_event(z_erofs_deflate_wq, READ_ONCE(z_erofs_deflate_head));</div><div class='add'>+		goto again;</div><div class='add'>+	}</div><div class='add'>+	z_erofs_deflate_head = strm-&gt;next;</div><div class='add'>+	spin_unlock(&amp;z_erofs_deflate_lock);</div><div class='add'>+</div><div class='add'>+	/* 3. multi-call decompress */</div><div class='add'>+	zerr = zlib_inflateInit2(&amp;strm-&gt;z, -MAX_WBITS);</div><div class='add'>+	if (zerr != Z_OK) {</div><div class='add'>+		reason = ERR_PTR(-EINVAL);</div><div class='add'>+		goto failed_zinit;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	rq-&gt;fillgaps = true;	/* DEFLATE doesn't support NULL output buffer */</div><div class='add'>+	strm-&gt;z.avail_in = min(rq-&gt;inputsize, PAGE_SIZE - rq-&gt;pageofs_in);</div><div class='add'>+	rq-&gt;inputsize -= strm-&gt;z.avail_in;</div><div class='add'>+	strm-&gt;z.next_in = dctx.kin + rq-&gt;pageofs_in;</div><div class='add'>+	strm-&gt;z.avail_out = 0;</div><div class='add'>+	dctx.bounce = strm-&gt;bounce;</div><div class='add'>+</div><div class='add'>+	while (1) {</div><div class='add'>+		dctx.avail_out = strm-&gt;z.avail_out;</div><div class='add'>+		dctx.inbuf_sz = strm-&gt;z.avail_in;</div><div class='add'>+		reason = z_erofs_stream_switch_bufs(&amp;dctx,</div><div class='add'>+					(void **)&amp;strm-&gt;z.next_out,</div><div class='add'>+					(void **)&amp;strm-&gt;z.next_in, pgpl);</div><div class='add'>+		if (reason)</div><div class='add'>+			break;</div><div class='add'>+		strm-&gt;z.avail_out = dctx.avail_out;</div><div class='add'>+		strm-&gt;z.avail_in = dctx.inbuf_sz;</div><div class='add'>+</div><div class='add'>+		zerr = zlib_inflate(&amp;strm-&gt;z, Z_SYNC_FLUSH);</div><div class='add'>+		if (zerr != Z_OK || !(rq-&gt;outputsize + strm-&gt;z.avail_out)) {</div><div class='add'>+			if (zerr == Z_OK &amp;&amp; rq-&gt;partial_decoding)</div><div class='add'>+				break;</div><div class='add'>+			if (zerr == Z_STREAM_END &amp;&amp; !rq-&gt;outputsize)</div><div class='add'>+				break;</div><div class='add'>+			reason = (zerr == Z_DATA_ERROR ?</div><div class='add'>+				"corrupted compressed data" :</div><div class='add'>+				"unexpected end of stream");</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	if (zlib_inflateEnd(&amp;strm-&gt;z) != Z_OK &amp;&amp; !reason)</div><div class='add'>+		reason = ERR_PTR(-EIO);</div><div class='add'>+	if (dctx.kout)</div><div class='add'>+		kunmap_local(dctx.kout);</div><div class='add'>+failed_zinit:</div><div class='add'>+	kunmap_local(dctx.kin);</div><div class='add'>+	/* 4. push back DEFLATE stream context to the global list */</div><div class='add'>+	spin_lock(&amp;z_erofs_deflate_lock);</div><div class='add'>+	strm-&gt;next = z_erofs_deflate_head;</div><div class='add'>+	z_erofs_deflate_head = strm;</div><div class='add'>+	spin_unlock(&amp;z_erofs_deflate_lock);</div><div class='add'>+	wake_up(&amp;z_erofs_deflate_wq);</div><div class='add'>+	return reason;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const char *z_erofs_deflate_decompress(struct z_erofs_decompress_req *rq,</div><div class='add'>+					      struct page **pgpl)</div><div class='add'>+{</div><div class='add'>+#ifdef CONFIG_EROFS_FS_ZIP_ACCEL</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	if (!rq-&gt;partial_decoding) {</div><div class='add'>+		err = z_erofs_crypto_decompress(rq, pgpl);</div><div class='add'>+		if (err != -EOPNOTSUPP)</div><div class='add'>+			return ERR_PTR(err);</div><div class='add'>+</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='add'>+	return __z_erofs_deflate_decompress(rq, pgpl);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+const struct z_erofs_decompressor z_erofs_deflate_decomp = {</div><div class='add'>+	.config = z_erofs_load_deflate_config,</div><div class='add'>+	.decompress = z_erofs_deflate_decompress,</div><div class='add'>+	.init = z_erofs_deflate_init,</div><div class='add'>+	.exit = z_erofs_deflate_exit,</div><div class='add'>+	.name = "deflate",</div><div class='add'>+};</div><div class='head'>diff --git a/fs/erofs/decompressor_lzma.c b/fs/erofs/decompressor_lzma.c<br/>index 50045510a1f4..b4ea6978faae 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/erofs/decompressor_lzma.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/decompressor_lzma.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/erofs/decompressor_lzma.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/erofs/decompressor_lzma.c</a></div><div class='hunk'>@@ -1,12 +1,10 @@</div><div class='ctx'> // SPDX-License-Identifier: GPL-2.0-or-later</div><div class='ctx'> #include &lt;linux/xz.h&gt;</div><div class='del'>-#include &lt;linux/module.h&gt;</div><div class='ctx'> #include "compress.h"</div><div class='ctx'> </div><div class='ctx'> struct z_erofs_lzma {</div><div class='ctx'> 	struct z_erofs_lzma *next;</div><div class='ctx'> 	struct xz_dec_microlzma *state;</div><div class='del'>-	struct xz_buf buf;</div><div class='ctx'> 	u8 bounce[PAGE_SIZE];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -19,7 +17,7 @@ static DECLARE_WAIT_QUEUE_HEAD(z_erofs_lzma_wq);</div><div class='ctx'> </div><div class='ctx'> module_param_named(lzma_streams, z_erofs_lzma_nstrms, uint, 0444);</div><div class='ctx'> </div><div class='del'>-void z_erofs_lzma_exit(void)</div><div class='add'>+static void z_erofs_lzma_exit(void)</div><div class='ctx'> {</div><div class='ctx'> 	/* there should be no running fs instance */</div><div class='ctx'> 	while (z_erofs_lzma_avail_strms) {</div><div class='hunk'>@@ -47,7 +45,7 @@ void z_erofs_lzma_exit(void)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int z_erofs_lzma_init(void)</div><div class='add'>+static int __init z_erofs_lzma_init(void)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int i;</div><div class='ctx'> </div><div class='hunk'>@@ -71,11 +69,11 @@ int z_erofs_lzma_init(void)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int z_erofs_load_lzma_config(struct super_block *sb,</div><div class='del'>-			     struct erofs_super_block *dsb,</div><div class='del'>-			     struct z_erofs_lzma_cfgs *lzma, int size)</div><div class='add'>+static int z_erofs_load_lzma_config(struct super_block *sb,</div><div class='add'>+			struct erofs_super_block *dsb, void *data, int size)</div><div class='ctx'> {</div><div class='ctx'> 	static DEFINE_MUTEX(lzma_resize_mutex);</div><div class='add'>+	struct z_erofs_lzma_cfgs *lzma = data;</div><div class='ctx'> 	unsigned int dict_size, i;</div><div class='ctx'> 	struct z_erofs_lzma *strm, *head = NULL;</div><div class='ctx'> 	int err;</div><div class='hunk'>@@ -96,8 +94,6 @@ int z_erofs_load_lzma_config(struct super_block *sb,</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	erofs_info(sb, "EXPERIMENTAL MicroLZMA in use. Use at your own risk!");</div><div class='del'>-</div><div class='ctx'> 	/* in case 2 z_erofs_load_lzma_config() race to avoid deadlock */</div><div class='ctx'> 	mutex_lock(&amp;lzma_resize_mutex);</div><div class='ctx'> </div><div class='hunk'>@@ -143,37 +139,31 @@ again:</div><div class='ctx'> 	DBG_BUGON(z_erofs_lzma_head);</div><div class='ctx'> 	z_erofs_lzma_head = head;</div><div class='ctx'> 	spin_unlock(&amp;z_erofs_lzma_lock);</div><div class='add'>+	wake_up_all(&amp;z_erofs_lzma_wq);</div><div class='ctx'> </div><div class='ctx'> 	z_erofs_lzma_max_dictsize = dict_size;</div><div class='ctx'> 	mutex_unlock(&amp;lzma_resize_mutex);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int z_erofs_lzma_decompress(struct z_erofs_decompress_req *rq,</div><div class='del'>-			    struct page **pagepool)</div><div class='add'>+static const char *z_erofs_lzma_decompress(struct z_erofs_decompress_req *rq,</div><div class='add'>+					   struct page **pgpl)</div><div class='ctx'> {</div><div class='del'>-	const unsigned int nrpages_out =</div><div class='del'>-		PAGE_ALIGN(rq-&gt;pageofs_out + rq-&gt;outputsize) &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	const unsigned int nrpages_in =</div><div class='del'>-		PAGE_ALIGN(rq-&gt;inputsize) &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	unsigned int inputmargin, inlen, outlen, pageofs;</div><div class='add'>+	struct super_block *sb = rq-&gt;sb;</div><div class='add'>+	struct z_erofs_stream_dctx dctx = { .rq = rq, .no = -1, .ni = 0 };</div><div class='add'>+	struct xz_buf buf = {};</div><div class='ctx'> 	struct z_erofs_lzma *strm;</div><div class='del'>-	u8 *kin;</div><div class='del'>-	bool bounced = false;</div><div class='del'>-	int no, ni, j, err = 0;</div><div class='add'>+	enum xz_ret xz_err;</div><div class='add'>+	const char *reason;</div><div class='ctx'> </div><div class='ctx'> 	/* 1. get the exact LZMA compressed size */</div><div class='del'>-	kin = kmap(*rq-&gt;in);</div><div class='del'>-	inputmargin = 0;</div><div class='del'>-	while (!kin[inputmargin &amp; ~PAGE_MASK])</div><div class='del'>-		if (!(++inputmargin &amp; ~PAGE_MASK))</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-	if (inputmargin &gt;= PAGE_SIZE) {</div><div class='del'>-		kunmap(*rq-&gt;in);</div><div class='del'>-		return -EFSCORRUPTED;</div><div class='add'>+	dctx.kin = kmap_local_page(*rq-&gt;in);</div><div class='add'>+	reason = z_erofs_fixup_insize(rq, dctx.kin + rq-&gt;pageofs_in,</div><div class='add'>+			min(rq-&gt;inputsize, sb-&gt;s_blocksize - rq-&gt;pageofs_in));</div><div class='add'>+	if (reason) {</div><div class='add'>+		kunmap_local(dctx.kin);</div><div class='add'>+		return reason;</div><div class='ctx'> 	}</div><div class='del'>-	rq-&gt;inputsize -= inputmargin;</div><div class='ctx'> </div><div class='ctx'> 	/* 2. get an available lzma context */</div><div class='ctx'> again:</div><div class='hunk'>@@ -188,103 +178,58 @@ again:</div><div class='ctx'> 	spin_unlock(&amp;z_erofs_lzma_lock);</div><div class='ctx'> </div><div class='ctx'> 	/* 3. multi-call decompress */</div><div class='del'>-	inlen = rq-&gt;inputsize;</div><div class='del'>-	outlen = rq-&gt;outputsize;</div><div class='del'>-	xz_dec_microlzma_reset(strm-&gt;state, inlen, outlen,</div><div class='add'>+	xz_dec_microlzma_reset(strm-&gt;state, rq-&gt;inputsize, rq-&gt;outputsize,</div><div class='ctx'> 			       !rq-&gt;partial_decoding);</div><div class='del'>-	pageofs = rq-&gt;pageofs_out;</div><div class='del'>-	strm-&gt;buf.in = kin + inputmargin;</div><div class='del'>-	strm-&gt;buf.in_pos = 0;</div><div class='del'>-	strm-&gt;buf.in_size = min_t(u32, inlen, PAGE_SIZE - inputmargin);</div><div class='del'>-	inlen -= strm-&gt;buf.in_size;</div><div class='del'>-	strm-&gt;buf.out = NULL;</div><div class='del'>-	strm-&gt;buf.out_pos = 0;</div><div class='del'>-	strm-&gt;buf.out_size = 0;</div><div class='del'>-</div><div class='del'>-	for (ni = 0, no = -1;;) {</div><div class='del'>-		enum xz_ret xz_err;</div><div class='del'>-</div><div class='del'>-		if (strm-&gt;buf.out_pos == strm-&gt;buf.out_size) {</div><div class='del'>-			if (strm-&gt;buf.out) {</div><div class='del'>-				kunmap(rq-&gt;out[no]);</div><div class='del'>-				strm-&gt;buf.out = NULL;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			if (++no &gt;= nrpages_out || !outlen) {</div><div class='del'>-				erofs_err(rq-&gt;sb, "decompressed buf out of bound");</div><div class='del'>-				err = -EFSCORRUPTED;</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			strm-&gt;buf.out_pos = 0;</div><div class='del'>-			strm-&gt;buf.out_size = min_t(u32, outlen,</div><div class='del'>-						   PAGE_SIZE - pageofs);</div><div class='del'>-			outlen -= strm-&gt;buf.out_size;</div><div class='del'>-			if (rq-&gt;out[no])</div><div class='del'>-				strm-&gt;buf.out = kmap(rq-&gt;out[no]) + pageofs;</div><div class='del'>-			pageofs = 0;</div><div class='del'>-		} else if (strm-&gt;buf.in_pos == strm-&gt;buf.in_size) {</div><div class='del'>-			kunmap(rq-&gt;in[ni]);</div><div class='del'>-</div><div class='del'>-			if (++ni &gt;= nrpages_in || !inlen) {</div><div class='del'>-				erofs_err(rq-&gt;sb, "compressed buf out of bound");</div><div class='del'>-				err = -EFSCORRUPTED;</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			strm-&gt;buf.in_pos = 0;</div><div class='del'>-			strm-&gt;buf.in_size = min_t(u32, inlen, PAGE_SIZE);</div><div class='del'>-			inlen -= strm-&gt;buf.in_size;</div><div class='del'>-			kin = kmap(rq-&gt;in[ni]);</div><div class='del'>-			strm-&gt;buf.in = kin;</div><div class='del'>-			bounced = false;</div><div class='del'>-		}</div><div class='add'>+	buf.in_size = min(rq-&gt;inputsize, PAGE_SIZE - rq-&gt;pageofs_in);</div><div class='add'>+	rq-&gt;inputsize -= buf.in_size;</div><div class='add'>+	buf.in = dctx.kin + rq-&gt;pageofs_in;</div><div class='add'>+	dctx.bounce = strm-&gt;bounce;</div><div class='add'>+	do {</div><div class='add'>+		dctx.avail_out = buf.out_size - buf.out_pos;</div><div class='add'>+		dctx.inbuf_sz = buf.in_size;</div><div class='add'>+		dctx.inbuf_pos = buf.in_pos;</div><div class='add'>+		reason = z_erofs_stream_switch_bufs(&amp;dctx, (void **)&amp;buf.out,</div><div class='add'>+						    (void **)&amp;buf.in, pgpl);</div><div class='add'>+		if (reason)</div><div class='add'>+			break;</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * Handle overlapping: Use bounced buffer if the compressed</div><div class='del'>-		 * data is under processing; Otherwise, Use short-lived pages</div><div class='del'>-		 * from the on-stack pagepool where pages share with the same</div><div class='del'>-		 * request.</div><div class='del'>-		 */</div><div class='del'>-		if (!bounced &amp;&amp; rq-&gt;out[no] == rq-&gt;in[ni]) {</div><div class='del'>-			memcpy(strm-&gt;bounce, strm-&gt;buf.in, strm-&gt;buf.in_size);</div><div class='del'>-			strm-&gt;buf.in = strm-&gt;bounce;</div><div class='del'>-			bounced = true;</div><div class='add'>+		if (buf.out_size == buf.out_pos) {</div><div class='add'>+			buf.out_size = dctx.avail_out;</div><div class='add'>+			buf.out_pos = 0;</div><div class='ctx'> 		}</div><div class='del'>-		for (j = ni + 1; j &lt; nrpages_in; ++j) {</div><div class='del'>-			struct page *tmppage;</div><div class='add'>+		buf.in_size = dctx.inbuf_sz;</div><div class='add'>+		buf.in_pos = dctx.inbuf_pos;</div><div class='ctx'> </div><div class='del'>-			if (rq-&gt;out[no] != rq-&gt;in[j])</div><div class='del'>-				continue;</div><div class='del'>-</div><div class='del'>-			DBG_BUGON(erofs_page_is_managed(EROFS_SB(rq-&gt;sb),</div><div class='del'>-							rq-&gt;in[j]));</div><div class='del'>-			tmppage = erofs_allocpage(pagepool,</div><div class='del'>-						  GFP_KERNEL | __GFP_NOFAIL);</div><div class='del'>-			set_page_private(tmppage, Z_EROFS_SHORTLIVED_PAGE);</div><div class='del'>-			copy_highpage(tmppage, rq-&gt;in[j]);</div><div class='del'>-			rq-&gt;in[j] = tmppage;</div><div class='del'>-		}</div><div class='del'>-		xz_err = xz_dec_microlzma_run(strm-&gt;state, &amp;strm-&gt;buf);</div><div class='del'>-		DBG_BUGON(strm-&gt;buf.out_pos &gt; strm-&gt;buf.out_size);</div><div class='del'>-		DBG_BUGON(strm-&gt;buf.in_pos &gt; strm-&gt;buf.in_size);</div><div class='add'>+		xz_err = xz_dec_microlzma_run(strm-&gt;state, &amp;buf);</div><div class='add'>+		DBG_BUGON(buf.out_pos &gt; buf.out_size);</div><div class='add'>+		DBG_BUGON(buf.in_pos &gt; buf.in_size);</div><div class='ctx'> </div><div class='ctx'> 		if (xz_err != XZ_OK) {</div><div class='del'>-			if (xz_err == XZ_STREAM_END &amp;&amp; !outlen)</div><div class='add'>+			if (xz_err == XZ_STREAM_END &amp;&amp; !rq-&gt;outputsize)</div><div class='ctx'> 				break;</div><div class='del'>-			erofs_err(rq-&gt;sb, "failed to decompress %d in[%u] out[%u]",</div><div class='del'>-				  xz_err, rq-&gt;inputsize, rq-&gt;outputsize);</div><div class='del'>-			err = -EFSCORRUPTED;</div><div class='add'>+			reason = (xz_err == XZ_DATA_ERROR ?</div><div class='add'>+				"corrupted compressed data" :</div><div class='add'>+				"unexpected end of stream");</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-	}</div><div class='del'>-	if (no &lt; nrpages_out &amp;&amp; strm-&gt;buf.out)</div><div class='del'>-		kunmap(rq-&gt;in[no]);</div><div class='del'>-	if (ni &lt; nrpages_in)</div><div class='del'>-		kunmap(rq-&gt;in[ni]);</div><div class='add'>+	} while (1);</div><div class='add'>+</div><div class='add'>+	if (dctx.kout)</div><div class='add'>+		kunmap_local(dctx.kout);</div><div class='add'>+	kunmap_local(dctx.kin);</div><div class='ctx'> 	/* 4. push back LZMA stream context to the global list */</div><div class='ctx'> 	spin_lock(&amp;z_erofs_lzma_lock);</div><div class='ctx'> 	strm-&gt;next = z_erofs_lzma_head;</div><div class='ctx'> 	z_erofs_lzma_head = strm;</div><div class='ctx'> 	spin_unlock(&amp;z_erofs_lzma_lock);</div><div class='ctx'> 	wake_up(&amp;z_erofs_lzma_wq);</div><div class='del'>-	return err;</div><div class='add'>+	return reason;</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+const struct z_erofs_decompressor z_erofs_lzma_decomp = {</div><div class='add'>+	.config = z_erofs_load_lzma_config,</div><div class='add'>+	.decompress = z_erofs_lzma_decompress,</div><div class='add'>+	.init = z_erofs_lzma_init,</div><div class='add'>+	.exit = z_erofs_lzma_exit,</div><div class='add'>+	.name = "lzma"</div><div class='add'>+};</div><div class='head'>diff --git a/fs/erofs/decompressor_zstd.c b/fs/erofs/decompressor_zstd.c<br/>new file mode 100644<br/>index 000000000000..beae49165c69<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/erofs/decompressor_zstd.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/erofs/decompressor_zstd.c</a></div><div class='hunk'>@@ -0,0 +1,220 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='add'>+#include &lt;linux/zstd.h&gt;</div><div class='add'>+#include "compress.h"</div><div class='add'>+</div><div class='add'>+struct z_erofs_zstd {</div><div class='add'>+	struct z_erofs_zstd *next;</div><div class='add'>+	u8 bounce[PAGE_SIZE];</div><div class='add'>+	void *wksp;</div><div class='add'>+	unsigned int wkspsz;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static DEFINE_SPINLOCK(z_erofs_zstd_lock);</div><div class='add'>+static unsigned int z_erofs_zstd_max_dictsize;</div><div class='add'>+static unsigned int z_erofs_zstd_nstrms, z_erofs_zstd_avail_strms;</div><div class='add'>+static struct z_erofs_zstd *z_erofs_zstd_head;</div><div class='add'>+static DECLARE_WAIT_QUEUE_HEAD(z_erofs_zstd_wq);</div><div class='add'>+</div><div class='add'>+module_param_named(zstd_streams, z_erofs_zstd_nstrms, uint, 0444);</div><div class='add'>+</div><div class='add'>+static struct z_erofs_zstd *z_erofs_isolate_strms(bool all)</div><div class='add'>+{</div><div class='add'>+	struct z_erofs_zstd *strm;</div><div class='add'>+</div><div class='add'>+again:</div><div class='add'>+	spin_lock(&amp;z_erofs_zstd_lock);</div><div class='add'>+	strm = z_erofs_zstd_head;</div><div class='add'>+	if (!strm) {</div><div class='add'>+		spin_unlock(&amp;z_erofs_zstd_lock);</div><div class='add'>+		wait_event(z_erofs_zstd_wq, READ_ONCE(z_erofs_zstd_head));</div><div class='add'>+		goto again;</div><div class='add'>+	}</div><div class='add'>+	z_erofs_zstd_head = all ? NULL : strm-&gt;next;</div><div class='add'>+	spin_unlock(&amp;z_erofs_zstd_lock);</div><div class='add'>+	return strm;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void z_erofs_zstd_exit(void)</div><div class='add'>+{</div><div class='add'>+	while (z_erofs_zstd_avail_strms) {</div><div class='add'>+		struct z_erofs_zstd *strm, *n;</div><div class='add'>+</div><div class='add'>+		for (strm = z_erofs_isolate_strms(true); strm; strm = n) {</div><div class='add'>+			n = strm-&gt;next;</div><div class='add'>+</div><div class='add'>+			kvfree(strm-&gt;wksp);</div><div class='add'>+			kfree(strm);</div><div class='add'>+			--z_erofs_zstd_avail_strms;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int __init z_erofs_zstd_init(void)</div><div class='add'>+{</div><div class='add'>+	/* by default, use # of possible CPUs instead */</div><div class='add'>+	if (!z_erofs_zstd_nstrms)</div><div class='add'>+		z_erofs_zstd_nstrms = num_possible_cpus();</div><div class='add'>+</div><div class='add'>+	for (; z_erofs_zstd_avail_strms &lt; z_erofs_zstd_nstrms;</div><div class='add'>+	     ++z_erofs_zstd_avail_strms) {</div><div class='add'>+		struct z_erofs_zstd *strm;</div><div class='add'>+</div><div class='add'>+		strm = kzalloc(sizeof(*strm), GFP_KERNEL);</div><div class='add'>+		if (!strm) {</div><div class='add'>+			z_erofs_zstd_exit();</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+		}</div><div class='add'>+		spin_lock(&amp;z_erofs_zstd_lock);</div><div class='add'>+		strm-&gt;next = z_erofs_zstd_head;</div><div class='add'>+		z_erofs_zstd_head = strm;</div><div class='add'>+		spin_unlock(&amp;z_erofs_zstd_lock);</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int z_erofs_load_zstd_config(struct super_block *sb,</div><div class='add'>+			struct erofs_super_block *dsb, void *data, int size)</div><div class='add'>+{</div><div class='add'>+	static DEFINE_MUTEX(zstd_resize_mutex);</div><div class='add'>+	struct z_erofs_zstd_cfgs *zstd = data;</div><div class='add'>+	unsigned int dict_size, wkspsz;</div><div class='add'>+	struct z_erofs_zstd *strm, *head = NULL;</div><div class='add'>+	void *wksp;</div><div class='add'>+</div><div class='add'>+	if (!zstd || size &lt; sizeof(struct z_erofs_zstd_cfgs) || zstd-&gt;format) {</div><div class='add'>+		erofs_err(sb, "unsupported zstd format, size=%u", size);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (zstd-&gt;windowlog &gt; ilog2(Z_EROFS_ZSTD_MAX_DICT_SIZE) - 10) {</div><div class='add'>+		erofs_err(sb, "unsupported zstd window log %u", zstd-&gt;windowlog);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+	dict_size = 1U &lt;&lt; (zstd-&gt;windowlog + 10);</div><div class='add'>+</div><div class='add'>+	/* in case 2 z_erofs_load_zstd_config() race to avoid deadlock */</div><div class='add'>+	mutex_lock(&amp;zstd_resize_mutex);</div><div class='add'>+	if (z_erofs_zstd_max_dictsize &gt;= dict_size) {</div><div class='add'>+		mutex_unlock(&amp;zstd_resize_mutex);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* 1. collect/isolate all streams for the following check */</div><div class='add'>+	while (z_erofs_zstd_avail_strms) {</div><div class='add'>+		struct z_erofs_zstd *n;</div><div class='add'>+</div><div class='add'>+		for (strm = z_erofs_isolate_strms(true); strm; strm = n) {</div><div class='add'>+			n = strm-&gt;next;</div><div class='add'>+			strm-&gt;next = head;</div><div class='add'>+			head = strm;</div><div class='add'>+			--z_erofs_zstd_avail_strms;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* 2. walk each isolated stream and grow max dict_size if needed */</div><div class='add'>+	wkspsz = zstd_dstream_workspace_bound(dict_size);</div><div class='add'>+	for (strm = head; strm; strm = strm-&gt;next) {</div><div class='add'>+		wksp = kvmalloc(wkspsz, GFP_KERNEL);</div><div class='add'>+		if (!wksp)</div><div class='add'>+			break;</div><div class='add'>+		kvfree(strm-&gt;wksp);</div><div class='add'>+		strm-&gt;wksp = wksp;</div><div class='add'>+		strm-&gt;wkspsz = wkspsz;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* 3. push back all to the global list and update max dict_size */</div><div class='add'>+	spin_lock(&amp;z_erofs_zstd_lock);</div><div class='add'>+	DBG_BUGON(z_erofs_zstd_head);</div><div class='add'>+	z_erofs_zstd_head = head;</div><div class='add'>+	spin_unlock(&amp;z_erofs_zstd_lock);</div><div class='add'>+	z_erofs_zstd_avail_strms = z_erofs_zstd_nstrms;</div><div class='add'>+	wake_up_all(&amp;z_erofs_zstd_wq);</div><div class='add'>+	if (!strm)</div><div class='add'>+		z_erofs_zstd_max_dictsize = dict_size;</div><div class='add'>+	mutex_unlock(&amp;zstd_resize_mutex);</div><div class='add'>+	return strm ? -ENOMEM : 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const char *z_erofs_zstd_decompress(struct z_erofs_decompress_req *rq,</div><div class='add'>+					   struct page **pgpl)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = rq-&gt;sb;</div><div class='add'>+	struct z_erofs_stream_dctx dctx = { .rq = rq, .no = -1, .ni = 0 };</div><div class='add'>+	zstd_in_buffer in_buf = { NULL, 0, 0 };</div><div class='add'>+	zstd_out_buffer out_buf = { NULL, 0, 0 };</div><div class='add'>+	struct z_erofs_zstd *strm;</div><div class='add'>+	zstd_dstream *stream;</div><div class='add'>+	const char *reason;</div><div class='add'>+	int zerr;</div><div class='add'>+</div><div class='add'>+	/* 1. get the exact compressed size */</div><div class='add'>+	dctx.kin = kmap_local_page(*rq-&gt;in);</div><div class='add'>+	reason = z_erofs_fixup_insize(rq, dctx.kin + rq-&gt;pageofs_in,</div><div class='add'>+			min(rq-&gt;inputsize, sb-&gt;s_blocksize - rq-&gt;pageofs_in));</div><div class='add'>+	if (reason) {</div><div class='add'>+		kunmap_local(dctx.kin);</div><div class='add'>+		return reason;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* 2. get an available ZSTD context */</div><div class='add'>+	strm = z_erofs_isolate_strms(false);</div><div class='add'>+</div><div class='add'>+	/* 3. multi-call decompress */</div><div class='add'>+	stream = zstd_init_dstream(z_erofs_zstd_max_dictsize, strm-&gt;wksp, strm-&gt;wkspsz);</div><div class='add'>+	if (!stream) {</div><div class='add'>+		reason = ERR_PTR(-ENOMEM);</div><div class='add'>+		goto failed_zinit;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	rq-&gt;fillgaps = true;	/* ZSTD doesn't support NULL output buffer */</div><div class='add'>+	in_buf.size = min_t(u32, rq-&gt;inputsize, PAGE_SIZE - rq-&gt;pageofs_in);</div><div class='add'>+	rq-&gt;inputsize -= in_buf.size;</div><div class='add'>+	in_buf.src = dctx.kin + rq-&gt;pageofs_in;</div><div class='add'>+	dctx.bounce = strm-&gt;bounce;</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		dctx.inbuf_sz = in_buf.size;</div><div class='add'>+		dctx.inbuf_pos = in_buf.pos;</div><div class='add'>+		reason = z_erofs_stream_switch_bufs(&amp;dctx, &amp;out_buf.dst,</div><div class='add'>+						 (void **)&amp;in_buf.src, pgpl);</div><div class='add'>+		if (reason)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		if (out_buf.size == out_buf.pos) {</div><div class='add'>+			out_buf.size = dctx.avail_out;</div><div class='add'>+			out_buf.pos = 0;</div><div class='add'>+		}</div><div class='add'>+		in_buf.size = dctx.inbuf_sz;</div><div class='add'>+		in_buf.pos = dctx.inbuf_pos;</div><div class='add'>+</div><div class='add'>+		zerr = zstd_decompress_stream(stream, &amp;out_buf, &amp;in_buf);</div><div class='add'>+		dctx.avail_out = out_buf.size - out_buf.pos;</div><div class='add'>+		if (zstd_is_error(zerr) ||</div><div class='add'>+		    ((rq-&gt;outputsize + dctx.avail_out) &amp;&amp; (!zerr || (zerr &gt; 0 &amp;&amp;</div><div class='add'>+				!(rq-&gt;inputsize + in_buf.size - in_buf.pos))))) {</div><div class='add'>+			reason = zstd_is_error(zerr) ? zstd_get_error_name(zerr) :</div><div class='add'>+					"unexpected end of stream";</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+	} while (rq-&gt;outputsize + dctx.avail_out);</div><div class='add'>+</div><div class='add'>+	if (dctx.kout)</div><div class='add'>+		kunmap_local(dctx.kout);</div><div class='add'>+failed_zinit:</div><div class='add'>+	kunmap_local(dctx.kin);</div><div class='add'>+	/* 4. push back ZSTD stream context to the global list */</div><div class='add'>+	spin_lock(&amp;z_erofs_zstd_lock);</div><div class='add'>+	strm-&gt;next = z_erofs_zstd_head;</div><div class='add'>+	z_erofs_zstd_head = strm;</div><div class='add'>+	spin_unlock(&amp;z_erofs_zstd_lock);</div><div class='add'>+	wake_up(&amp;z_erofs_zstd_wq);</div><div class='add'>+	return reason;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+const struct z_erofs_decompressor z_erofs_zstd_decomp = {</div><div class='add'>+	.config = z_erofs_load_zstd_config,</div><div class='add'>+	.decompress = z_erofs_zstd_decompress,</div><div class='add'>+	.init = z_erofs_zstd_init,</div><div class='add'>+	.exit = z_erofs_zstd_exit,</div><div class='add'>+	.name = "zstd",</div><div class='add'>+};</div><div class='head'>diff --git a/fs/erofs/dir.c b/fs/erofs/dir.c<br/>index eee9b0b31b63..32b4f5aa60c9 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/erofs/dir.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/dir.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/erofs/dir.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/erofs/dir.c</a></div><div class='hunk'>@@ -2,40 +2,21 @@</div><div class='ctx'> /*</div><div class='ctx'>  * Copyright (C) 2017-2018 HUAWEI, Inc.</div><div class='ctx'>  *             https://www.huawei.com/</div><div class='add'>+ * Copyright (C) 2022, Alibaba Cloud</div><div class='ctx'>  */</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> </div><div class='del'>-static void debug_one_dentry(unsigned char d_type, const char *de_name,</div><div class='del'>-			     unsigned int de_namelen)</div><div class='del'>-{</div><div class='del'>-#ifdef CONFIG_EROFS_FS_DEBUG</div><div class='del'>-	/* since the on-disk name could not have the trailing '\0' */</div><div class='del'>-	unsigned char dbg_namebuf[EROFS_NAME_LEN + 1];</div><div class='del'>-</div><div class='del'>-	memcpy(dbg_namebuf, de_name, de_namelen);</div><div class='del'>-	dbg_namebuf[de_namelen] = '\0';</div><div class='del'>-</div><div class='del'>-	erofs_dbg("found dirent %s de_len %u d_type %d", dbg_namebuf,</div><div class='del'>-		  de_namelen, d_type);</div><div class='del'>-#endif</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int erofs_fill_dentries(struct inode *dir, struct dir_context *ctx,</div><div class='del'>-			       void *dentry_blk, unsigned int *ofs,</div><div class='del'>-			       unsigned int nameoff, unsigned int maxsize)</div><div class='add'>+			       void *dentry_blk, struct erofs_dirent *de,</div><div class='add'>+			       unsigned int nameoff0, unsigned int maxsize)</div><div class='ctx'> {</div><div class='del'>-	struct erofs_dirent *de = dentry_blk + *ofs;</div><div class='del'>-	const struct erofs_dirent *end = dentry_blk + nameoff;</div><div class='add'>+	const struct erofs_dirent *end = dentry_blk + nameoff0;</div><div class='ctx'> </div><div class='ctx'> 	while (de &lt; end) {</div><div class='del'>-		const char *de_name;</div><div class='add'>+		unsigned char d_type = fs_ftype_to_dtype(de-&gt;file_type);</div><div class='add'>+		unsigned int nameoff = le16_to_cpu(de-&gt;nameoff);</div><div class='add'>+		const char *de_name = (char *)dentry_blk + nameoff;</div><div class='ctx'> 		unsigned int de_namelen;</div><div class='del'>-		unsigned char d_type;</div><div class='del'>-</div><div class='del'>-		d_type = fs_ftype_to_dtype(de-&gt;file_type);</div><div class='del'>-</div><div class='del'>-		nameoff = le16_to_cpu(de-&gt;nameoff);</div><div class='del'>-		de_name = (char *)dentry_blk + nameoff;</div><div class='ctx'> </div><div class='ctx'> 		/* the last dirent in the block? */</div><div class='ctx'> 		if (de + 1 &gt;= end)</div><div class='hunk'>@@ -52,83 +33,88 @@ static int erofs_fill_dentries(struct inode *dir, struct dir_context *ctx,</div><div class='ctx'> 			return -EFSCORRUPTED;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		debug_one_dentry(d_type, de_name, de_namelen);</div><div class='ctx'> 		if (!dir_emit(ctx, de_name, de_namelen,</div><div class='del'>-			      le64_to_cpu(de-&gt;nid), d_type))</div><div class='del'>-			/* stopped by some reason */</div><div class='add'>+			      erofs_nid_to_ino64(EROFS_SB(dir-&gt;i_sb),</div><div class='add'>+						 le64_to_cpu(de-&gt;nid)), d_type))</div><div class='ctx'> 			return 1;</div><div class='ctx'> 		++de;</div><div class='del'>-		*ofs += sizeof(struct erofs_dirent);</div><div class='add'>+		ctx-&gt;pos += sizeof(struct erofs_dirent);</div><div class='ctx'> 	}</div><div class='del'>-	*ofs = maxsize;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int erofs_readdir(struct file *f, struct dir_context *ctx)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *dir = file_inode(f);</div><div class='del'>-	struct address_space *mapping = dir-&gt;i_mapping;</div><div class='del'>-	const size_t dirsize = i_size_read(dir);</div><div class='del'>-	unsigned int i = ctx-&gt;pos / EROFS_BLKSIZ;</div><div class='del'>-	unsigned int ofs = ctx-&gt;pos % EROFS_BLKSIZ;</div><div class='add'>+	struct erofs_buf buf = __EROFS_BUF_INITIALIZER;</div><div class='add'>+	struct super_block *sb = dir-&gt;i_sb;</div><div class='add'>+	struct file_ra_state *ra = &amp;f-&gt;f_ra;</div><div class='add'>+	unsigned long bsz = sb-&gt;s_blocksize;</div><div class='add'>+	unsigned int ofs = erofs_blkoff(sb, ctx-&gt;pos);</div><div class='add'>+	pgoff_t ra_pages = DIV_ROUND_UP_POW2(</div><div class='add'>+			EROFS_I_SB(dir)-&gt;dir_ra_bytes, PAGE_SIZE);</div><div class='add'>+	pgoff_t nr_pages = DIV_ROUND_UP_POW2(dir-&gt;i_size, PAGE_SIZE);</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> 	bool initial = true;</div><div class='ctx'> </div><div class='del'>-	while (ctx-&gt;pos &lt; dirsize) {</div><div class='del'>-		struct page *dentry_page;</div><div class='add'>+	buf.mapping = dir-&gt;i_mapping;</div><div class='add'>+	while (ctx-&gt;pos &lt; dir-&gt;i_size) {</div><div class='add'>+		erofs_off_t dbstart = ctx-&gt;pos - ofs;</div><div class='ctx'> 		struct erofs_dirent *de;</div><div class='ctx'> 		unsigned int nameoff, maxsize;</div><div class='ctx'> </div><div class='del'>-		dentry_page = read_mapping_page(mapping, i, NULL);</div><div class='del'>-		if (dentry_page == ERR_PTR(-ENOMEM)) {</div><div class='del'>-			err = -ENOMEM;</div><div class='del'>-			break;</div><div class='del'>-		} else if (IS_ERR(dentry_page)) {</div><div class='del'>-			erofs_err(dir-&gt;i_sb,</div><div class='del'>-				  "fail to readdir of logical block %u of nid %llu",</div><div class='del'>-				  i, EROFS_I(dir)-&gt;nid);</div><div class='del'>-			err = -EFSCORRUPTED;</div><div class='add'>+		if (fatal_signal_pending(current)) {</div><div class='add'>+			err = -ERESTARTSYS;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		de = (struct erofs_dirent *)kmap(dentry_page);</div><div class='add'>+		/* readahead blocks to enhance performance for large directories */</div><div class='add'>+		if (ra_pages) {</div><div class='add'>+			pgoff_t idx = DIV_ROUND_UP_POW2(ctx-&gt;pos, PAGE_SIZE);</div><div class='add'>+			pgoff_t pages = min(nr_pages - idx, ra_pages);</div><div class='ctx'> </div><div class='del'>-		nameoff = le16_to_cpu(de-&gt;nameoff);</div><div class='add'>+			if (pages &gt; 1 &amp;&amp; !ra_has_index(ra, idx))</div><div class='add'>+				page_cache_sync_readahead(dir-&gt;i_mapping, ra,</div><div class='add'>+							  f, idx, pages);</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-		if (nameoff &lt; sizeof(struct erofs_dirent) ||</div><div class='del'>-		    nameoff &gt;= PAGE_SIZE) {</div><div class='del'>-			erofs_err(dir-&gt;i_sb,</div><div class='del'>-				  "invalid de[0].nameoff %u @ nid %llu",</div><div class='add'>+		de = erofs_bread(&amp;buf, dbstart, true);</div><div class='add'>+		if (IS_ERR(de)) {</div><div class='add'>+			erofs_err(sb, "failed to readdir of logical block %llu of nid %llu",</div><div class='add'>+				  erofs_blknr(sb, dbstart), EROFS_I(dir)-&gt;nid);</div><div class='add'>+			err = PTR_ERR(de);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		nameoff = le16_to_cpu(de-&gt;nameoff);</div><div class='add'>+		if (nameoff &lt; sizeof(struct erofs_dirent) || nameoff &gt;= bsz) {</div><div class='add'>+			erofs_err(sb, "invalid de[0].nameoff %u @ nid %llu",</div><div class='ctx'> 				  nameoff, EROFS_I(dir)-&gt;nid);</div><div class='ctx'> 			err = -EFSCORRUPTED;</div><div class='del'>-			goto skip_this;</div><div class='add'>+			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		maxsize = min_t(unsigned int,</div><div class='del'>-				dirsize - ctx-&gt;pos + ofs, PAGE_SIZE);</div><div class='del'>-</div><div class='add'>+		maxsize = min_t(unsigned int, dir-&gt;i_size - dbstart, bsz);</div><div class='ctx'> 		/* search dirents at the arbitrary position */</div><div class='ctx'> 		if (initial) {</div><div class='ctx'> 			initial = false;</div><div class='del'>-</div><div class='ctx'> 			ofs = roundup(ofs, sizeof(struct erofs_dirent));</div><div class='del'>-			if (ofs &gt;= nameoff)</div><div class='del'>-				goto skip_this;</div><div class='add'>+			ctx-&gt;pos = dbstart + ofs;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		err = erofs_fill_dentries(dir, ctx, de, &amp;ofs,</div><div class='add'>+		err = erofs_fill_dentries(dir, ctx, de, (void *)de + ofs,</div><div class='ctx'> 					  nameoff, maxsize);</div><div class='del'>-skip_this:</div><div class='del'>-		kunmap(dentry_page);</div><div class='del'>-</div><div class='del'>-		put_page(dentry_page);</div><div class='del'>-</div><div class='del'>-		ctx-&gt;pos = blknr_to_addr(i) + ofs;</div><div class='del'>-</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			break;</div><div class='del'>-		++i;</div><div class='add'>+		ctx-&gt;pos = dbstart + maxsize;</div><div class='ctx'> 		ofs = 0;</div><div class='add'>+		cond_resched();</div><div class='add'>+	}</div><div class='add'>+	erofs_put_metabuf(&amp;buf);</div><div class='add'>+	if (EROFS_I(dir)-&gt;dot_omitted &amp;&amp; ctx-&gt;pos == dir-&gt;i_size) {</div><div class='add'>+		if (!dir_emit_dot(f, ctx))</div><div class='add'>+			return 0;</div><div class='add'>+		++ctx-&gt;pos;</div><div class='ctx'> 	}</div><div class='ctx'> 	return err &lt; 0 ? err : 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -137,4 +123,8 @@ const struct file_operations erofs_dir_fops = {</div><div class='ctx'> 	.llseek		= generic_file_llseek,</div><div class='ctx'> 	.read		= generic_read_dir,</div><div class='ctx'> 	.iterate_shared	= erofs_readdir,</div><div class='add'>+	.unlocked_ioctl = erofs_ioctl,</div><div class='add'>+#ifdef CONFIG_COMPAT</div><div class='add'>+	.compat_ioctl   = erofs_compat_ioctl,</div><div class='add'>+#endif</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/erofs/erofs_fs.h b/fs/erofs/erofs_fs.h<br/>index 083997a034e5..e24268acdd62 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/erofs/erofs_fs.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/erofs_fs.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/erofs/erofs_fs.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/erofs/erofs_fs.h</a></div><div class='hunk'>@@ -1,4 +1,4 @@</div><div class='del'>-/* SPDX-License-Identifier: GPL-2.0-only OR Apache-2.0 */</div><div class='add'>+/* SPDX-License-Identifier: MIT */</div><div class='ctx'> /*</div><div class='ctx'>  * EROFS (Enhanced ROM File System) on-disk format definition</div><div class='ctx'>  *</div><div class='hunk'>@@ -9,55 +9,62 @@</div><div class='ctx'> #ifndef __EROFS_FS_H</div><div class='ctx'> #define __EROFS_FS_H</div><div class='ctx'> </div><div class='add'>+/* to allow for x86 boot sectors and other oddities. */</div><div class='ctx'> #define EROFS_SUPER_OFFSET      1024</div><div class='ctx'> </div><div class='del'>-#define EROFS_FEATURE_COMPAT_SB_CHKSUM          0x00000001</div><div class='add'>+#define EROFS_FEATURE_COMPAT_SB_CHKSUM			0x00000001</div><div class='add'>+#define EROFS_FEATURE_COMPAT_MTIME			0x00000002</div><div class='add'>+#define EROFS_FEATURE_COMPAT_XATTR_FILTER		0x00000004</div><div class='add'>+#define EROFS_FEATURE_COMPAT_SHARED_EA_IN_METABOX	0x00000008</div><div class='add'>+#define EROFS_FEATURE_COMPAT_PLAIN_XATTR_PFX		0x00000010</div><div class='add'>+</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Any bits that aren't in EROFS_ALL_FEATURE_INCOMPAT should</div><div class='ctx'>  * be incompatible with this kernel version.</div><div class='ctx'>  */</div><div class='del'>-#define EROFS_FEATURE_INCOMPAT_LZ4_0PADDING	0x00000001</div><div class='add'>+#define EROFS_FEATURE_INCOMPAT_ZERO_PADDING	0x00000001</div><div class='ctx'> #define EROFS_FEATURE_INCOMPAT_COMPR_CFGS	0x00000002</div><div class='ctx'> #define EROFS_FEATURE_INCOMPAT_BIG_PCLUSTER	0x00000002</div><div class='ctx'> #define EROFS_FEATURE_INCOMPAT_CHUNKED_FILE	0x00000004</div><div class='ctx'> #define EROFS_FEATURE_INCOMPAT_DEVICE_TABLE	0x00000008</div><div class='ctx'> #define EROFS_FEATURE_INCOMPAT_COMPR_HEAD2	0x00000008</div><div class='add'>+#define EROFS_FEATURE_INCOMPAT_ZTAILPACKING	0x00000010</div><div class='add'>+#define EROFS_FEATURE_INCOMPAT_FRAGMENTS	0x00000020</div><div class='add'>+#define EROFS_FEATURE_INCOMPAT_DEDUPE		0x00000020</div><div class='add'>+#define EROFS_FEATURE_INCOMPAT_XATTR_PREFIXES	0x00000040</div><div class='add'>+#define EROFS_FEATURE_INCOMPAT_48BIT		0x00000080</div><div class='add'>+#define EROFS_FEATURE_INCOMPAT_METABOX		0x00000100</div><div class='ctx'> #define EROFS_ALL_FEATURE_INCOMPAT		\</div><div class='del'>-	(EROFS_FEATURE_INCOMPAT_LZ4_0PADDING | \</div><div class='del'>-	 EROFS_FEATURE_INCOMPAT_COMPR_CFGS | \</div><div class='del'>-	 EROFS_FEATURE_INCOMPAT_BIG_PCLUSTER | \</div><div class='del'>-	 EROFS_FEATURE_INCOMPAT_CHUNKED_FILE | \</div><div class='del'>-	 EROFS_FEATURE_INCOMPAT_DEVICE_TABLE | \</div><div class='del'>-	 EROFS_FEATURE_INCOMPAT_COMPR_HEAD2)</div><div class='add'>+	((EROFS_FEATURE_INCOMPAT_METABOX &lt;&lt; 1) - 1)</div><div class='ctx'> </div><div class='ctx'> #define EROFS_SB_EXTSLOT_SIZE	16</div><div class='ctx'> </div><div class='ctx'> struct erofs_deviceslot {</div><div class='del'>-	union {</div><div class='del'>-		u8 uuid[16];		/* used for device manager later */</div><div class='del'>-		u8 userdata[64];	/* digest(sha256), etc. */</div><div class='del'>-	} u;</div><div class='del'>-	__le32 blocks;			/* total fs blocks of this device */</div><div class='del'>-	__le32 mapped_blkaddr;		/* map starting at mapped_blkaddr */</div><div class='del'>-	u8 reserved[56];</div><div class='add'>+	u8 tag[64];		/* digest(sha256), etc. */</div><div class='add'>+	__le32 blocks_lo;	/* total blocks count of this device */</div><div class='add'>+	__le32 uniaddr_lo;	/* unified starting block of this device */</div><div class='add'>+	__le32 blocks_hi;	/* total blocks count MSB */</div><div class='add'>+	__le16 uniaddr_hi;	/* unified starting block MSB */</div><div class='add'>+	u8 reserved[50];</div><div class='ctx'> };</div><div class='ctx'> #define EROFS_DEVT_SLOT_SIZE	sizeof(struct erofs_deviceslot)</div><div class='ctx'> </div><div class='del'>-/* erofs on-disk super block (currently 128 bytes) */</div><div class='add'>+/* erofs on-disk super block (currently 144 bytes at maximum) */</div><div class='ctx'> struct erofs_super_block {</div><div class='ctx'> 	__le32 magic;           /* file system magic number */</div><div class='del'>-	__le32 checksum;        /* crc32c(super_block) */</div><div class='add'>+	__le32 checksum;        /* crc32c to avoid unexpected on-disk overlap */</div><div class='ctx'> 	__le32 feature_compat;</div><div class='del'>-	__u8 blkszbits;         /* support block_size == PAGE_SIZE only */</div><div class='add'>+	__u8 blkszbits;         /* filesystem block size in bit shift */</div><div class='ctx'> 	__u8 sb_extslots;	/* superblock size = 128 + sb_extslots * 16 */</div><div class='del'>-</div><div class='del'>-	__le16 root_nid;	/* nid of root directory */</div><div class='add'>+	union {</div><div class='add'>+		__le16 rootnid_2b;	/* nid of root directory */</div><div class='add'>+		__le16 blocks_hi;	/* (48BIT on) blocks count MSB */</div><div class='add'>+	} __packed rb;</div><div class='ctx'> 	__le64 inos;            /* total valid ino # (== f_files - f_favail) */</div><div class='del'>-</div><div class='del'>-	__le64 build_time;      /* inode v1 time derivation */</div><div class='del'>-	__le32 build_time_nsec;	/* inode v1 time derivation in nano scale */</div><div class='del'>-	__le32 blocks;          /* used for statfs */</div><div class='add'>+	__le64 epoch;		/* base seconds used for compact inodes */</div><div class='add'>+	__le32 fixed_nsec;	/* fixed nanoseconds for compact inodes */</div><div class='add'>+	__le32 blocks_lo;	/* blocks count LSB */</div><div class='ctx'> 	__le32 meta_blkaddr;	/* start block address of metadata area */</div><div class='ctx'> 	__le32 xattr_blkaddr;	/* start block address of shared xattr area */</div><div class='ctx'> 	__u8 uuid[16];          /* 128-bit uuid for volume */</div><div class='hunk'>@@ -71,129 +78,118 @@ struct erofs_super_block {</div><div class='ctx'> 	} __packed u1;</div><div class='ctx'> 	__le16 extra_devices;	/* # of devices besides the primary device */</div><div class='ctx'> 	__le16 devt_slotoff;	/* startoff = devt_slotoff * devt_slotsize */</div><div class='del'>-	__u8 reserved2[38];</div><div class='add'>+	__u8 dirblkbits;	/* directory block size in bit shift */</div><div class='add'>+	__u8 xattr_prefix_count;	/* # of long xattr name prefixes */</div><div class='add'>+	__le32 xattr_prefix_start;	/* start of long xattr prefixes */</div><div class='add'>+	__le64 packed_nid;	/* nid of the special packed inode */</div><div class='add'>+	__u8 xattr_filter_reserved; /* reserved for xattr name filter */</div><div class='add'>+	__u8 reserved[3];</div><div class='add'>+	__le32 build_time;	/* seconds added to epoch for mkfs time */</div><div class='add'>+	__le64 rootnid_8b;	/* (48BIT on) nid of root directory */</div><div class='add'>+	__le64 reserved2;</div><div class='add'>+	__le64 metabox_nid;     /* (METABOX on) nid of the metabox inode */</div><div class='add'>+	__le64 reserved3;	/* [align to extslot 1] */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * erofs inode datalayout (i_format in on-disk inode):</div><div class='del'>- * 0 - inode plain without inline data A:</div><div class='del'>- * inode, [xattrs], ... | ... | no-holed data</div><div class='del'>- * 1 - inode VLE compression B (legacy):</div><div class='del'>- * inode, [xattrs], extents ... | ...</div><div class='del'>- * 2 - inode plain with inline data C:</div><div class='del'>- * inode, [xattrs], last_inline_data, ... | ... | no-holed data</div><div class='del'>- * 3 - inode compression D:</div><div class='del'>- * inode, [xattrs], map_header, extents ... | ...</div><div class='del'>- * 4 - inode chunk-based E:</div><div class='del'>- * inode, [xattrs], chunk indexes ... | ...</div><div class='add'>+ * EROFS inode datalayout (i_format in on-disk inode):</div><div class='add'>+ * 0 - uncompressed flat inode without tail-packing inline data:</div><div class='add'>+ * 1 - compressed inode with non-compact indexes:</div><div class='add'>+ * 2 - uncompressed flat inode with tail-packing inline data:</div><div class='add'>+ * 3 - compressed inode with compact indexes:</div><div class='add'>+ * 4 - chunk-based inode with (optional) multi-device support:</div><div class='ctx'>  * 5~7 - reserved</div><div class='ctx'>  */</div><div class='ctx'> enum {</div><div class='ctx'> 	EROFS_INODE_FLAT_PLAIN			= 0,</div><div class='del'>-	EROFS_INODE_FLAT_COMPRESSION_LEGACY	= 1,</div><div class='add'>+	EROFS_INODE_COMPRESSED_FULL		= 1,</div><div class='ctx'> 	EROFS_INODE_FLAT_INLINE			= 2,</div><div class='del'>-	EROFS_INODE_FLAT_COMPRESSION		= 3,</div><div class='add'>+	EROFS_INODE_COMPRESSED_COMPACT		= 3,</div><div class='ctx'> 	EROFS_INODE_CHUNK_BASED			= 4,</div><div class='ctx'> 	EROFS_INODE_DATALAYOUT_MAX</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static inline bool erofs_inode_is_data_compressed(unsigned int datamode)</div><div class='ctx'> {</div><div class='del'>-	return datamode == EROFS_INODE_FLAT_COMPRESSION ||</div><div class='del'>-		datamode == EROFS_INODE_FLAT_COMPRESSION_LEGACY;</div><div class='add'>+	return datamode == EROFS_INODE_COMPRESSED_COMPACT ||</div><div class='add'>+		datamode == EROFS_INODE_COMPRESSED_FULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* bit definitions of inode i_advise */</div><div class='del'>-#define EROFS_I_VERSION_BITS            1</div><div class='del'>-#define EROFS_I_DATALAYOUT_BITS         3</div><div class='del'>-</div><div class='del'>-#define EROFS_I_VERSION_BIT             0</div><div class='del'>-#define EROFS_I_DATALAYOUT_BIT          1</div><div class='add'>+/* bit definitions of inode i_format */</div><div class='add'>+#define EROFS_I_VERSION_MASK            0x01</div><div class='add'>+#define EROFS_I_DATALAYOUT_MASK         0x07</div><div class='ctx'> </div><div class='del'>-#define EROFS_I_ALL	\</div><div class='del'>-	((1 &lt;&lt; (EROFS_I_DATALAYOUT_BIT + EROFS_I_DATALAYOUT_BITS)) - 1)</div><div class='add'>+#define EROFS_I_VERSION_BIT	0</div><div class='add'>+#define EROFS_I_DATALAYOUT_BIT	1</div><div class='add'>+#define EROFS_I_NLINK_1_BIT	4	/* non-directory compact inodes only */</div><div class='add'>+#define EROFS_I_DOT_OMITTED_BIT	4	/* (directories) omit the `.` dirent */</div><div class='add'>+#define EROFS_I_ALL		((1 &lt;&lt; (EROFS_I_NLINK_1_BIT + 1)) - 1)</div><div class='ctx'> </div><div class='ctx'> /* indicate chunk blkbits, thus 'chunksize = blocksize &lt;&lt; chunk blkbits' */</div><div class='ctx'> #define EROFS_CHUNK_FORMAT_BLKBITS_MASK		0x001F</div><div class='del'>-/* with chunk indexes or just a 4-byte blkaddr array */</div><div class='add'>+/* with chunk indexes or just a 4-byte block array */</div><div class='ctx'> #define EROFS_CHUNK_FORMAT_INDEXES		0x0020</div><div class='add'>+#define EROFS_CHUNK_FORMAT_48BIT		0x0040</div><div class='ctx'> </div><div class='del'>-#define EROFS_CHUNK_FORMAT_ALL	\</div><div class='del'>-	(EROFS_CHUNK_FORMAT_BLKBITS_MASK | EROFS_CHUNK_FORMAT_INDEXES)</div><div class='add'>+#define EROFS_CHUNK_FORMAT_ALL	((EROFS_CHUNK_FORMAT_48BIT &lt;&lt; 1) - 1)</div><div class='add'>+</div><div class='add'>+/* 32-byte on-disk inode */</div><div class='add'>+#define EROFS_INODE_LAYOUT_COMPACT	0</div><div class='add'>+/* 64-byte on-disk inode */</div><div class='add'>+#define EROFS_INODE_LAYOUT_EXTENDED	1</div><div class='ctx'> </div><div class='ctx'> struct erofs_inode_chunk_info {</div><div class='ctx'> 	__le16 format;		/* chunk blkbits, etc. */</div><div class='ctx'> 	__le16 reserved;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+union erofs_inode_i_u {</div><div class='add'>+	__le32 blocks_lo;	/* total blocks count (if compressed inodes) */</div><div class='add'>+	__le32 startblk_lo;	/* starting block number (if flat inodes) */</div><div class='add'>+	__le32 rdev;		/* device ID (if special inodes) */</div><div class='add'>+	struct erofs_inode_chunk_info c;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+union erofs_inode_i_nb {</div><div class='add'>+	__le16 nlink;		/* if EROFS_I_NLINK_1_BIT is unset */</div><div class='add'>+	__le16 blocks_hi;	/* total blocks count MSB */</div><div class='add'>+	__le16 startblk_hi;	/* starting block number MSB */</div><div class='add'>+} __packed;</div><div class='add'>+</div><div class='ctx'> /* 32-byte reduced form of an ondisk inode */</div><div class='ctx'> struct erofs_inode_compact {</div><div class='ctx'> 	__le16 i_format;	/* inode format hints */</div><div class='del'>-</div><div class='del'>-/* 1 header + n-1 * 4 bytes inline xattr to keep continuity */</div><div class='ctx'> 	__le16 i_xattr_icount;</div><div class='ctx'> 	__le16 i_mode;</div><div class='del'>-	__le16 i_nlink;</div><div class='add'>+	union erofs_inode_i_nb i_nb;</div><div class='ctx'> 	__le32 i_size;</div><div class='del'>-	__le32 i_reserved;</div><div class='del'>-	union {</div><div class='del'>-		/* file total compressed blocks for data mapping 1 */</div><div class='del'>-		__le32 compressed_blocks;</div><div class='del'>-		__le32 raw_blkaddr;</div><div class='del'>-</div><div class='del'>-		/* for device files, used to indicate old/new device # */</div><div class='del'>-		__le32 rdev;</div><div class='add'>+	__le32 i_mtime;</div><div class='add'>+	union erofs_inode_i_u i_u;</div><div class='ctx'> </div><div class='del'>-		/* for chunk-based files, it contains the summary info */</div><div class='del'>-		struct erofs_inode_chunk_info c;</div><div class='del'>-	} i_u;</div><div class='del'>-	__le32 i_ino;           /* only used for 32-bit stat compatibility */</div><div class='add'>+	__le32 i_ino;		/* only used for 32-bit stat compatibility */</div><div class='ctx'> 	__le16 i_uid;</div><div class='ctx'> 	__le16 i_gid;</div><div class='del'>-	__le32 i_reserved2;</div><div class='add'>+	__le32 i_reserved;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/* 32 bytes on-disk inode */</div><div class='del'>-#define EROFS_INODE_LAYOUT_COMPACT	0</div><div class='del'>-/* 64 bytes on-disk inode */</div><div class='del'>-#define EROFS_INODE_LAYOUT_EXTENDED	1</div><div class='del'>-</div><div class='ctx'> /* 64-byte complete form of an ondisk inode */</div><div class='ctx'> struct erofs_inode_extended {</div><div class='ctx'> 	__le16 i_format;	/* inode format hints */</div><div class='del'>-</div><div class='del'>-/* 1 header + n-1 * 4 bytes inline xattr to keep continuity */</div><div class='ctx'> 	__le16 i_xattr_icount;</div><div class='ctx'> 	__le16 i_mode;</div><div class='del'>-	__le16 i_reserved;</div><div class='add'>+	union erofs_inode_i_nb i_nb;</div><div class='ctx'> 	__le64 i_size;</div><div class='del'>-	union {</div><div class='del'>-		/* file total compressed blocks for data mapping 1 */</div><div class='del'>-		__le32 compressed_blocks;</div><div class='del'>-		__le32 raw_blkaddr;</div><div class='del'>-</div><div class='del'>-		/* for device files, used to indicate old/new device # */</div><div class='del'>-		__le32 rdev;</div><div class='del'>-</div><div class='del'>-		/* for chunk-based files, it contains the summary info */</div><div class='del'>-		struct erofs_inode_chunk_info c;</div><div class='del'>-	} i_u;</div><div class='del'>-</div><div class='del'>-	/* only used for 32-bit stat compatibility */</div><div class='del'>-	__le32 i_ino;</div><div class='add'>+	union erofs_inode_i_u i_u;</div><div class='ctx'> </div><div class='add'>+	__le32 i_ino;		/* only used for 32-bit stat compatibility */</div><div class='ctx'> 	__le32 i_uid;</div><div class='ctx'> 	__le32 i_gid;</div><div class='del'>-	__le64 i_ctime;</div><div class='del'>-	__le32 i_ctime_nsec;</div><div class='add'>+	__le64 i_mtime;</div><div class='add'>+	__le32 i_mtime_nsec;</div><div class='ctx'> 	__le32 i_nlink;</div><div class='ctx'> 	__u8   i_reserved2[16];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-#define EROFS_MAX_SHARED_XATTRS         (128)</div><div class='del'>-/* h_shared_count between 129 ... 255 are special # */</div><div class='del'>-#define EROFS_SHARED_XATTR_EXTENT       (255)</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * inline xattrs (n == i_xattr_icount):</div><div class='ctx'>  * erofs_xattr_ibody_header(1) + (n - 1) * 4 bytes</div><div class='hunk'>@@ -206,10 +202,10 @@ struct erofs_inode_extended {</div><div class='ctx'>  * for read-only fs, no need to introduce h_refcount</div><div class='ctx'>  */</div><div class='ctx'> struct erofs_xattr_ibody_header {</div><div class='del'>-	__le32 h_reserved;</div><div class='add'>+	__le32 h_name_filter;		/* bit value 1 indicates not-present */</div><div class='ctx'> 	__u8   h_shared_count;</div><div class='ctx'> 	__u8   h_reserved2[7];</div><div class='del'>-	__le32 h_shared_xattrs[0];      /* shared xattr id array */</div><div class='add'>+	__le32 h_shared_xattrs[];       /* shared xattr id array */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /* Name indexes */</div><div class='hunk'>@@ -220,13 +216,30 @@ struct erofs_xattr_ibody_header {</div><div class='ctx'> #define EROFS_XATTR_INDEX_LUSTRE            5</div><div class='ctx'> #define EROFS_XATTR_INDEX_SECURITY          6</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * bit 7 of e_name_index is set when it refers to a long xattr name prefix,</div><div class='add'>+ * while the remained lower bits represent the index of the prefix.</div><div class='add'>+ */</div><div class='add'>+#define EROFS_XATTR_LONG_PREFIX		0x80</div><div class='add'>+#define EROFS_XATTR_LONG_PREFIX_MASK	0x7f</div><div class='add'>+</div><div class='add'>+#define EROFS_XATTR_FILTER_BITS		32</div><div class='add'>+#define EROFS_XATTR_FILTER_DEFAULT	UINT32_MAX</div><div class='add'>+#define EROFS_XATTR_FILTER_SEED		0x25BBE08F</div><div class='add'>+</div><div class='ctx'> /* xattr entry (for both inline &amp; shared xattrs) */</div><div class='ctx'> struct erofs_xattr_entry {</div><div class='ctx'> 	__u8   e_name_len;      /* length of name */</div><div class='ctx'> 	__u8   e_name_index;    /* attribute name index */</div><div class='ctx'> 	__le16 e_value_size;    /* size of attribute value */</div><div class='ctx'> 	/* followed by e_name and e_value */</div><div class='del'>-	char   e_name[0];       /* attribute name */</div><div class='add'>+	char   e_name[];        /* attribute name */</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/* long xattr name prefix */</div><div class='add'>+struct erofs_xattr_long_prefix {</div><div class='add'>+	__u8   base_index;	/* short xattr name prefix index */</div><div class='add'>+	char   infix[];		/* infix apart from short prefix */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static inline unsigned int erofs_xattr_ibody_size(__le16 i_xattr_icount)</div><div class='hunk'>@@ -234,6 +247,7 @@ static inline unsigned int erofs_xattr_ibody_size(__le16 i_xattr_icount)</div><div class='ctx'> 	if (!i_xattr_icount)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='add'>+	/* 1 header + n-1 * 4 bytes inline xattr to keep continuity */</div><div class='ctx'> 	return sizeof(struct erofs_xattr_ibody_header) +</div><div class='ctx'> 		sizeof(__u32) * (le16_to_cpu(i_xattr_icount) - 1);</div><div class='ctx'> }</div><div class='hunk'>@@ -252,20 +266,44 @@ static inline unsigned int erofs_xattr_entry_size(struct erofs_xattr_entry *e)</div><div class='ctx'> /* 4-byte block address array */</div><div class='ctx'> #define EROFS_BLOCK_MAP_ENTRY_SIZE	sizeof(__le32)</div><div class='ctx'> </div><div class='del'>-/* 8-byte inode chunk indexes */</div><div class='add'>+/* 8-byte inode chunk index */</div><div class='ctx'> struct erofs_inode_chunk_index {</div><div class='del'>-	__le16 advise;		/* always 0, don't care for now */</div><div class='add'>+	__le16 startblk_hi;	/* starting block number MSB */</div><div class='ctx'> 	__le16 device_id;	/* back-end storage id (with bits masked) */</div><div class='del'>-	__le32 blkaddr;		/* start block address of this inode chunk */</div><div class='add'>+	__le32 startblk_lo;	/* starting block number of this chunk */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/* maximum supported size of a physical compression cluster */</div><div class='add'>+#define EROFS_DIRENT_NID_METABOX_BIT	63</div><div class='add'>+#define EROFS_DIRENT_NID_MASK	(BIT_ULL(EROFS_DIRENT_NID_METABOX_BIT) - 1)</div><div class='add'>+</div><div class='add'>+/* dirent sorts in alphabet order, thus we can do binary search */</div><div class='add'>+struct erofs_dirent {</div><div class='add'>+	__le64 nid;     /* node number */</div><div class='add'>+	__le16 nameoff; /* start offset of file name */</div><div class='add'>+	__u8 file_type; /* file type */</div><div class='add'>+	__u8 reserved;  /* reserved */</div><div class='add'>+} __packed;</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * EROFS file types should match generic FT_* types and</div><div class='add'>+ * it seems no need to add BUILD_BUG_ONs since potential</div><div class='add'>+ * unmatchness will break other fses as well...</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#define EROFS_NAME_LEN      255</div><div class='add'>+</div><div class='add'>+/* maximum supported encoded size of a physical compressed cluster */</div><div class='ctx'> #define Z_EROFS_PCLUSTER_MAX_SIZE	(1024 * 1024)</div><div class='ctx'> </div><div class='add'>+/* maximum supported decoded size of a physical compressed cluster */</div><div class='add'>+#define Z_EROFS_PCLUSTER_MAX_DSIZE	(12 * 1024 * 1024)</div><div class='add'>+</div><div class='ctx'> /* available compression algorithm types (for h_algorithmtype) */</div><div class='ctx'> enum {</div><div class='ctx'> 	Z_EROFS_COMPRESSION_LZ4		= 0,</div><div class='ctx'> 	Z_EROFS_COMPRESSION_LZMA	= 1,</div><div class='add'>+	Z_EROFS_COMPRESSION_DEFLATE	= 2,</div><div class='add'>+	Z_EROFS_COMPRESSION_ZSTD	= 3,</div><div class='ctx'> 	Z_EROFS_COMPRESSION_MAX</div><div class='ctx'> };</div><div class='ctx'> #define Z_EROFS_ALL_COMPR_ALGS		((1 &lt;&lt; Z_EROFS_COMPRESSION_MAX) - 1)</div><div class='hunk'>@@ -286,118 +324,126 @@ struct z_erofs_lzma_cfgs {</div><div class='ctx'> </div><div class='ctx'> #define Z_EROFS_LZMA_MAX_DICT_SIZE	(8 * Z_EROFS_PCLUSTER_MAX_SIZE)</div><div class='ctx'> </div><div class='add'>+/* 6 bytes (+ length field = 8 bytes) */</div><div class='add'>+struct z_erofs_deflate_cfgs {</div><div class='add'>+	u8 windowbits;			/* 8..15 for DEFLATE */</div><div class='add'>+	u8 reserved[5];</div><div class='add'>+} __packed;</div><div class='add'>+</div><div class='add'>+/* 6 bytes (+ length field = 8 bytes) */</div><div class='add'>+struct z_erofs_zstd_cfgs {</div><div class='add'>+	u8 format;</div><div class='add'>+	u8 windowlog;           /* windowLog - ZSTD_WINDOWLOG_ABSOLUTEMIN(10) */</div><div class='add'>+	u8 reserved[4];</div><div class='add'>+} __packed;</div><div class='add'>+</div><div class='add'>+#define Z_EROFS_ZSTD_MAX_DICT_SIZE      Z_EROFS_PCLUSTER_MAX_SIZE</div><div class='add'>+</div><div class='ctx'> /*</div><div class='del'>- * bit 0 : COMPACTED_2B indexes (0 - off; 1 - on)</div><div class='del'>- *  e.g. for 4k logical cluster size,      4B        if compacted 2B is off;</div><div class='del'>- *                                  (4B) + 2B + (4B) if compacted 2B is on.</div><div class='del'>- * bit 1 : HEAD1 big pcluster (0 - off; 1 - on)</div><div class='del'>- * bit 2 : HEAD2 big pcluster (0 - off; 1 - on)</div><div class='add'>+ * Enable COMPACTED_2B for EROFS_INODE_COMPRESSED_COMPACT inodes:</div><div class='add'>+ *   4B (disabled) vs 4B+2B+4B (enabled)</div><div class='ctx'>  */</div><div class='ctx'> #define Z_EROFS_ADVISE_COMPACTED_2B		0x0001</div><div class='add'>+/* Enable extent metadata for EROFS_INODE_COMPRESSED_FULL inodes */</div><div class='add'>+#define Z_EROFS_ADVISE_EXTENTS			0x0001</div><div class='ctx'> #define Z_EROFS_ADVISE_BIG_PCLUSTER_1		0x0002</div><div class='ctx'> #define Z_EROFS_ADVISE_BIG_PCLUSTER_2		0x0004</div><div class='del'>-</div><div class='add'>+#define Z_EROFS_ADVISE_INLINE_PCLUSTER		0x0008</div><div class='add'>+#define Z_EROFS_ADVISE_INTERLACED_PCLUSTER	0x0010</div><div class='add'>+#define Z_EROFS_ADVISE_FRAGMENT_PCLUSTER	0x0020</div><div class='add'>+/* Indicate the record size for each extent if extent metadata is used */</div><div class='add'>+#define Z_EROFS_ADVISE_EXTRECSZ_BIT		1</div><div class='add'>+#define Z_EROFS_ADVISE_EXTRECSZ_MASK		0x3</div><div class='add'>+</div><div class='add'>+#define Z_EROFS_FRAGMENT_INODE_BIT              7</div><div class='ctx'> struct z_erofs_map_header {</div><div class='del'>-	__le32	h_reserved1;</div><div class='add'>+	union {</div><div class='add'>+		/* fragment data offset in the packed inode */</div><div class='add'>+		__le32  h_fragmentoff;</div><div class='add'>+		struct {</div><div class='add'>+			__le16  h_reserved1;</div><div class='add'>+			/* indicates the encoded size of tailpacking data */</div><div class='add'>+			__le16  h_idata_size;</div><div class='add'>+		};</div><div class='add'>+		__le32 h_extents_lo;	/* extent count LSB */</div><div class='add'>+	};</div><div class='ctx'> 	__le16	h_advise;</div><div class='del'>-	/*</div><div class='del'>-	 * bit 0-3 : algorithm type of head 1 (logical cluster type 01);</div><div class='del'>-	 * bit 4-7 : algorithm type of head 2 (logical cluster type 11).</div><div class='del'>-	 */</div><div class='del'>-	__u8	h_algorithmtype;</div><div class='del'>-	/*</div><div class='del'>-	 * bit 0-2 : logical cluster bits - 12, e.g. 0 for 4096;</div><div class='del'>-	 * bit 3-7 : reserved.</div><div class='del'>-	 */</div><div class='del'>-	__u8	h_clusterbits;</div><div class='add'>+	union {</div><div class='add'>+		struct {</div><div class='add'>+			/* algorithm type (bit 0-3: HEAD1; bit 4-7: HEAD2) */</div><div class='add'>+			__u8	h_algorithmtype;</div><div class='add'>+			/*</div><div class='add'>+			 * bit 0-3 : logical cluster bits - blkszbits</div><div class='add'>+			 * bit 4-6 : reserved</div><div class='add'>+			 * bit 7   : pack the whole file into packed inode</div><div class='add'>+			 */</div><div class='add'>+			__u8	h_clusterbits;</div><div class='add'>+		} __packed;</div><div class='add'>+		__le16 h_extents_hi;	/* extent count MSB */</div><div class='add'>+	} __packed;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-#define Z_EROFS_VLE_LEGACY_HEADER_PADDING       8</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Fixed-sized output compression on-disk logical cluster type:</div><div class='del'>- *    0   - literal (uncompressed) lcluster</div><div class='del'>- *    1,3 - compressed lcluster (for HEAD lclusters)</div><div class='del'>- *    2   - compressed lcluster (for NONHEAD lclusters)</div><div class='del'>- *</div><div class='del'>- * In detail,</div><div class='del'>- *    0 - literal (uncompressed) lcluster,</div><div class='del'>- *        di_advise = 0</div><div class='del'>- *        di_clusterofs = the literal data offset of the lcluster</div><div class='del'>- *        di_blkaddr = the blkaddr of the literal pcluster</div><div class='del'>- *</div><div class='del'>- *    1,3 - compressed lcluster (for HEAD lclusters)</div><div class='del'>- *        di_advise = 1 or 3</div><div class='del'>- *        di_clusterofs = the decompressed data offset of the lcluster</div><div class='del'>- *        di_blkaddr = the blkaddr of the compressed pcluster</div><div class='del'>- *</div><div class='del'>- *    2 - compressed lcluster (for NONHEAD lclusters)</div><div class='del'>- *        di_advise = 2</div><div class='del'>- *        di_clusterofs =</div><div class='del'>- *           the decompressed data offset in its own HEAD lcluster</div><div class='del'>- *        di_u.delta[0] = distance to this HEAD lcluster</div><div class='del'>- *        di_u.delta[1] = distance to the next HEAD lcluster</div><div class='del'>- */</div><div class='ctx'> enum {</div><div class='del'>-	Z_EROFS_VLE_CLUSTER_TYPE_PLAIN		= 0,</div><div class='del'>-	Z_EROFS_VLE_CLUSTER_TYPE_HEAD1		= 1,</div><div class='del'>-	Z_EROFS_VLE_CLUSTER_TYPE_NONHEAD	= 2,</div><div class='del'>-	Z_EROFS_VLE_CLUSTER_TYPE_HEAD2		= 3,</div><div class='del'>-	Z_EROFS_VLE_CLUSTER_TYPE_MAX</div><div class='add'>+	Z_EROFS_LCLUSTER_TYPE_PLAIN	= 0,</div><div class='add'>+	Z_EROFS_LCLUSTER_TYPE_HEAD1	= 1,</div><div class='add'>+	Z_EROFS_LCLUSTER_TYPE_NONHEAD	= 2,</div><div class='add'>+	Z_EROFS_LCLUSTER_TYPE_HEAD2	= 3,</div><div class='add'>+	Z_EROFS_LCLUSTER_TYPE_MAX</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-#define Z_EROFS_VLE_DI_CLUSTER_TYPE_BITS        2</div><div class='del'>-#define Z_EROFS_VLE_DI_CLUSTER_TYPE_BIT         0</div><div class='add'>+#define Z_EROFS_LI_LCLUSTER_TYPE_MASK	(Z_EROFS_LCLUSTER_TYPE_MAX - 1)</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * D0_CBLKCNT will be marked _only_ at the 1st non-head lcluster to store the</div><div class='del'>- * compressed block count of a compressed extent (in logical clusters, aka.</div><div class='del'>- * block count of a pcluster).</div><div class='del'>- */</div><div class='del'>-#define Z_EROFS_VLE_DI_D0_CBLKCNT		(1 &lt;&lt; 11)</div><div class='add'>+/* (noncompact only, HEAD) This pcluster refers to partial decompressed data */</div><div class='add'>+#define Z_EROFS_LI_PARTIAL_REF		(1 &lt;&lt; 15)</div><div class='add'>+</div><div class='add'>+/* Set on 1st non-head lcluster to store compressed block counti (in blocks) */</div><div class='add'>+#define Z_EROFS_LI_D0_CBLKCNT		(1 &lt;&lt; 11)</div><div class='ctx'> </div><div class='del'>-struct z_erofs_vle_decompressed_index {</div><div class='add'>+struct z_erofs_lcluster_index {</div><div class='ctx'> 	__le16 di_advise;</div><div class='del'>-	/* where to decompress in the head cluster */</div><div class='add'>+	/* where to decompress in the head lcluster */</div><div class='ctx'> 	__le16 di_clusterofs;</div><div class='ctx'> </div><div class='ctx'> 	union {</div><div class='del'>-		/* for the head cluster */</div><div class='del'>-		__le32 blkaddr;</div><div class='add'>+		__le32 blkaddr;		/* for the HEAD lclusters */</div><div class='ctx'> 		/*</div><div class='del'>-		 * for the rest clusters</div><div class='del'>-		 * eg. for 4k page-sized cluster, maximum 4K*64k = 256M)</div><div class='del'>-		 * [0] - pointing to the head cluster</div><div class='del'>-		 * [1] - pointing to the tail cluster</div><div class='add'>+		 * [0] - distance to its HEAD lcluster</div><div class='add'>+		 * [1] - distance to the next HEAD lcluster</div><div class='ctx'> 		 */</div><div class='del'>-		__le16 delta[2];</div><div class='add'>+		__le16 delta[2];	/* for the NONHEAD lclusters */</div><div class='ctx'> 	} di_u;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-#define Z_EROFS_VLE_LEGACY_INDEX_ALIGN(size) \</div><div class='del'>-	(round_up(size, sizeof(struct z_erofs_vle_decompressed_index)) + \</div><div class='del'>-	 sizeof(struct z_erofs_map_header) + Z_EROFS_VLE_LEGACY_HEADER_PADDING)</div><div class='del'>-</div><div class='del'>-/* dirent sorts in alphabet order, thus we can do binary search */</div><div class='del'>-struct erofs_dirent {</div><div class='del'>-	__le64 nid;     /* node number */</div><div class='del'>-	__le16 nameoff; /* start offset of file name */</div><div class='del'>-	__u8 file_type; /* file type */</div><div class='del'>-	__u8 reserved;  /* reserved */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * EROFS file types should match generic FT_* types and</div><div class='del'>- * it seems no need to add BUILD_BUG_ONs since potential</div><div class='del'>- * unmatchness will break other fses as well...</div><div class='del'>- */</div><div class='add'>+#define Z_EROFS_MAP_HEADER_END(end)	\</div><div class='add'>+	(ALIGN(end, 8) + sizeof(struct z_erofs_map_header))</div><div class='add'>+#define Z_EROFS_FULL_INDEX_START(end)	(Z_EROFS_MAP_HEADER_END(end) + 8)</div><div class='add'>+</div><div class='add'>+#define Z_EROFS_EXTENT_PLEN_PARTIAL	BIT(27)</div><div class='add'>+#define Z_EROFS_EXTENT_PLEN_FMT_BIT	28</div><div class='add'>+#define Z_EROFS_EXTENT_PLEN_MASK	((Z_EROFS_PCLUSTER_MAX_SIZE &lt;&lt; 1) - 1)</div><div class='add'>+struct z_erofs_extent {</div><div class='add'>+	__le32 plen;		/* encoded length */</div><div class='add'>+	__le32 pstart_lo;	/* physical offset */</div><div class='add'>+	__le32 pstart_hi;	/* physical offset MSB */</div><div class='add'>+	__le32 lstart_lo;	/* logical offset */</div><div class='add'>+	__le32 lstart_hi;	/* logical offset MSB (&gt;= 4GiB inodes) */</div><div class='add'>+	__u8 reserved[12];	/* for future use */</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-#define EROFS_NAME_LEN      255</div><div class='add'>+static inline int z_erofs_extent_recsize(unsigned int advise)</div><div class='add'>+{</div><div class='add'>+	return 4 &lt;&lt; ((advise &gt;&gt; Z_EROFS_ADVISE_EXTRECSZ_BIT) &amp;</div><div class='add'>+		Z_EROFS_ADVISE_EXTRECSZ_MASK);</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /* check the EROFS on-disk layout strictly at compile time */</div><div class='ctx'> static inline void erofs_check_ondisk_layout_definitions(void)</div><div class='ctx'> {</div><div class='del'>-	BUILD_BUG_ON(sizeof(struct erofs_super_block) != 128);</div><div class='add'>+	const __le64 fmh = *(__le64 *)&amp;(struct z_erofs_map_header) {</div><div class='add'>+		.h_clusterbits = 1 &lt;&lt; Z_EROFS_FRAGMENT_INODE_BIT</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+	BUILD_BUG_ON(sizeof(struct erofs_super_block) != 144);</div><div class='ctx'> 	BUILD_BUG_ON(sizeof(struct erofs_inode_compact) != 32);</div><div class='ctx'> 	BUILD_BUG_ON(sizeof(struct erofs_inode_extended) != 64);</div><div class='ctx'> 	BUILD_BUG_ON(sizeof(struct erofs_xattr_ibody_header) != 12);</div><div class='hunk'>@@ -405,15 +451,16 @@ static inline void erofs_check_ondisk_layout_definitions(void)</div><div class='ctx'> 	BUILD_BUG_ON(sizeof(struct erofs_inode_chunk_info) != 4);</div><div class='ctx'> 	BUILD_BUG_ON(sizeof(struct erofs_inode_chunk_index) != 8);</div><div class='ctx'> 	BUILD_BUG_ON(sizeof(struct z_erofs_map_header) != 8);</div><div class='del'>-	BUILD_BUG_ON(sizeof(struct z_erofs_vle_decompressed_index) != 8);</div><div class='add'>+	BUILD_BUG_ON(sizeof(struct z_erofs_lcluster_index) != 8);</div><div class='ctx'> 	BUILD_BUG_ON(sizeof(struct erofs_dirent) != 12);</div><div class='ctx'> 	/* keep in sync between 2 index structures for better extendibility */</div><div class='ctx'> 	BUILD_BUG_ON(sizeof(struct erofs_inode_chunk_index) !=</div><div class='del'>-		     sizeof(struct z_erofs_vle_decompressed_index));</div><div class='add'>+		     sizeof(struct z_erofs_lcluster_index));</div><div class='ctx'> 	BUILD_BUG_ON(sizeof(struct erofs_deviceslot) != 128);</div><div class='ctx'> </div><div class='del'>-	BUILD_BUG_ON(BIT(Z_EROFS_VLE_DI_CLUSTER_TYPE_BITS) &lt;</div><div class='del'>-		     Z_EROFS_VLE_CLUSTER_TYPE_MAX - 1);</div><div class='add'>+	/* exclude old compiler versions like gcc 7.5.0 */</div><div class='add'>+	BUILD_BUG_ON(__builtin_constant_p(fmh) ?</div><div class='add'>+		     fmh != cpu_to_le64(1ULL &lt;&lt; 63) : 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/erofs/fileio.c b/fs/erofs/fileio.c<br/>new file mode 100644<br/>index 000000000000..932e8b353ba1<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/erofs/fileio.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/erofs/fileio.c</a></div><div class='hunk'>@@ -0,0 +1,191 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='add'>+/*</div><div class='add'>+ * Copyright (C) 2024, Alibaba Cloud</div><div class='add'>+ */</div><div class='add'>+#include "internal.h"</div><div class='add'>+#include &lt;trace/events/erofs.h&gt;</div><div class='add'>+</div><div class='add'>+struct erofs_fileio_rq {</div><div class='add'>+	struct bio_vec bvecs[16];</div><div class='add'>+	struct bio bio;</div><div class='add'>+	struct kiocb iocb;</div><div class='add'>+	struct super_block *sb;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct erofs_fileio {</div><div class='add'>+	struct erofs_map_blocks map;</div><div class='add'>+	struct erofs_map_dev dev;</div><div class='add'>+	struct erofs_fileio_rq *rq;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static void erofs_fileio_ki_complete(struct kiocb *iocb, long ret)</div><div class='add'>+{</div><div class='add'>+	struct erofs_fileio_rq *rq =</div><div class='add'>+			container_of(iocb, struct erofs_fileio_rq, iocb);</div><div class='add'>+	struct folio_iter fi;</div><div class='add'>+</div><div class='add'>+	if (ret &gt; 0) {</div><div class='add'>+		if (ret != rq-&gt;bio.bi_iter.bi_size) {</div><div class='add'>+			bio_advance(&amp;rq-&gt;bio, ret);</div><div class='add'>+			zero_fill_bio(&amp;rq-&gt;bio);</div><div class='add'>+		}</div><div class='add'>+		ret = 0;</div><div class='add'>+	}</div><div class='add'>+	if (rq-&gt;bio.bi_end_io) {</div><div class='add'>+		if (ret &lt; 0 &amp;&amp; !rq-&gt;bio.bi_status)</div><div class='add'>+			rq-&gt;bio.bi_status = errno_to_blk_status(ret);</div><div class='add'>+	} else {</div><div class='add'>+		bio_for_each_folio_all(fi, &amp;rq-&gt;bio) {</div><div class='add'>+			DBG_BUGON(folio_test_uptodate(fi.folio));</div><div class='add'>+			erofs_onlinefolio_end(fi.folio, ret, false);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	bio_endio(&amp;rq-&gt;bio);</div><div class='add'>+	bio_uninit(&amp;rq-&gt;bio);</div><div class='add'>+	kfree(rq);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void erofs_fileio_rq_submit(struct erofs_fileio_rq *rq)</div><div class='add'>+{</div><div class='add'>+	struct iov_iter iter;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (!rq)</div><div class='add'>+		return;</div><div class='add'>+	rq-&gt;iocb.ki_pos = rq-&gt;bio.bi_iter.bi_sector &lt;&lt; SECTOR_SHIFT;</div><div class='add'>+	rq-&gt;iocb.ki_ioprio = get_current_ioprio();</div><div class='add'>+	rq-&gt;iocb.ki_complete = erofs_fileio_ki_complete;</div><div class='add'>+	if (test_opt(&amp;EROFS_SB(rq-&gt;sb)-&gt;opt, DIRECT_IO) &amp;&amp;</div><div class='add'>+	    rq-&gt;iocb.ki_filp-&gt;f_mode &amp; FMODE_CAN_ODIRECT)</div><div class='add'>+		rq-&gt;iocb.ki_flags = IOCB_DIRECT;</div><div class='add'>+	iov_iter_bvec(&amp;iter, ITER_DEST, rq-&gt;bvecs, rq-&gt;bio.bi_vcnt,</div><div class='add'>+		      rq-&gt;bio.bi_iter.bi_size);</div><div class='add'>+	scoped_with_creds(rq-&gt;iocb.ki_filp-&gt;f_cred)</div><div class='add'>+		ret = vfs_iocb_iter_read(rq-&gt;iocb.ki_filp, &amp;rq-&gt;iocb, &amp;iter);</div><div class='add'>+	if (ret != -EIOCBQUEUED)</div><div class='add'>+		erofs_fileio_ki_complete(&amp;rq-&gt;iocb, ret);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct erofs_fileio_rq *erofs_fileio_rq_alloc(struct erofs_map_dev *mdev)</div><div class='add'>+{</div><div class='add'>+	struct erofs_fileio_rq *rq = kzalloc(sizeof(*rq),</div><div class='add'>+					     GFP_KERNEL | __GFP_NOFAIL);</div><div class='add'>+</div><div class='add'>+	bio_init(&amp;rq-&gt;bio, NULL, rq-&gt;bvecs, ARRAY_SIZE(rq-&gt;bvecs), REQ_OP_READ);</div><div class='add'>+	rq-&gt;iocb.ki_filp = mdev-&gt;m_dif-&gt;file;</div><div class='add'>+	rq-&gt;sb = mdev-&gt;m_sb;</div><div class='add'>+	return rq;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct bio *erofs_fileio_bio_alloc(struct erofs_map_dev *mdev)</div><div class='add'>+{</div><div class='add'>+	return &amp;erofs_fileio_rq_alloc(mdev)-&gt;bio;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void erofs_fileio_submit_bio(struct bio *bio)</div><div class='add'>+{</div><div class='add'>+	return erofs_fileio_rq_submit(container_of(bio, struct erofs_fileio_rq,</div><div class='add'>+						   bio));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int erofs_fileio_scan_folio(struct erofs_fileio *io, struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = folio_inode(folio);</div><div class='add'>+	struct erofs_map_blocks *map = &amp;io-&gt;map;</div><div class='add'>+	unsigned int cur = 0, end = folio_size(folio), len, attached = 0;</div><div class='add'>+	loff_t pos = folio_pos(folio), ofs;</div><div class='add'>+	int err = 0;</div><div class='add'>+</div><div class='add'>+	erofs_onlinefolio_init(folio);</div><div class='add'>+	while (cur &lt; end) {</div><div class='add'>+		if (!in_range(pos + cur, map-&gt;m_la, map-&gt;m_llen)) {</div><div class='add'>+			map-&gt;m_la = pos + cur;</div><div class='add'>+			map-&gt;m_llen = end - cur;</div><div class='add'>+			err = erofs_map_blocks(inode, map);</div><div class='add'>+			if (err)</div><div class='add'>+				break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		ofs = folio_pos(folio) + cur - map-&gt;m_la;</div><div class='add'>+		len = min_t(loff_t, map-&gt;m_llen - ofs, end - cur);</div><div class='add'>+		if (map-&gt;m_flags &amp; EROFS_MAP_META) {</div><div class='add'>+			struct erofs_buf buf = __EROFS_BUF_INITIALIZER;</div><div class='add'>+			void *src;</div><div class='add'>+</div><div class='add'>+			src = erofs_read_metabuf(&amp;buf, inode-&gt;i_sb,</div><div class='add'>+				map-&gt;m_pa + ofs, erofs_inode_in_metabox(inode));</div><div class='add'>+			if (IS_ERR(src)) {</div><div class='add'>+				err = PTR_ERR(src);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+			memcpy_to_folio(folio, cur, src, len);</div><div class='add'>+			erofs_put_metabuf(&amp;buf);</div><div class='add'>+		} else if (!(map-&gt;m_flags &amp; EROFS_MAP_MAPPED)) {</div><div class='add'>+			folio_zero_segment(folio, cur, cur + len);</div><div class='add'>+			attached = 0;</div><div class='add'>+		} else {</div><div class='add'>+			if (io-&gt;rq &amp;&amp; (map-&gt;m_pa + ofs != io-&gt;dev.m_pa ||</div><div class='add'>+				       map-&gt;m_deviceid != io-&gt;dev.m_deviceid)) {</div><div class='add'>+io_retry:</div><div class='add'>+				erofs_fileio_rq_submit(io-&gt;rq);</div><div class='add'>+				io-&gt;rq = NULL;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			if (!io-&gt;rq) {</div><div class='add'>+				io-&gt;dev = (struct erofs_map_dev) {</div><div class='add'>+					.m_pa = io-&gt;map.m_pa + ofs,</div><div class='add'>+					.m_deviceid = io-&gt;map.m_deviceid,</div><div class='add'>+				};</div><div class='add'>+				err = erofs_map_dev(inode-&gt;i_sb, &amp;io-&gt;dev);</div><div class='add'>+				if (err)</div><div class='add'>+					break;</div><div class='add'>+				io-&gt;rq = erofs_fileio_rq_alloc(&amp;io-&gt;dev);</div><div class='add'>+				io-&gt;rq-&gt;bio.bi_iter.bi_sector =</div><div class='add'>+					(io-&gt;dev.m_dif-&gt;fsoff + io-&gt;dev.m_pa) &gt;&gt; 9;</div><div class='add'>+				attached = 0;</div><div class='add'>+			}</div><div class='add'>+			if (!bio_add_folio(&amp;io-&gt;rq-&gt;bio, folio, len, cur))</div><div class='add'>+				goto io_retry;</div><div class='add'>+			if (!attached++)</div><div class='add'>+				erofs_onlinefolio_split(folio);</div><div class='add'>+			io-&gt;dev.m_pa += len;</div><div class='add'>+		}</div><div class='add'>+		cur += len;</div><div class='add'>+	}</div><div class='add'>+	erofs_onlinefolio_end(folio, err, false);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int erofs_fileio_read_folio(struct file *file, struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	struct erofs_fileio io = {};</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	trace_erofs_read_folio(folio, true);</div><div class='add'>+	err = erofs_fileio_scan_folio(&amp;io, folio);</div><div class='add'>+	erofs_fileio_rq_submit(io.rq);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void erofs_fileio_readahead(struct readahead_control *rac)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = rac-&gt;mapping-&gt;host;</div><div class='add'>+	struct erofs_fileio io = {};</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	trace_erofs_readahead(inode, readahead_index(rac),</div><div class='add'>+			      readahead_count(rac), true);</div><div class='add'>+	while ((folio = readahead_folio(rac))) {</div><div class='add'>+		err = erofs_fileio_scan_folio(&amp;io, folio);</div><div class='add'>+		if (err &amp;&amp; err != -EINTR)</div><div class='add'>+			erofs_err(inode-&gt;i_sb, "readahead error at folio %lu @ nid %llu",</div><div class='add'>+				  folio-&gt;index, EROFS_I(inode)-&gt;nid);</div><div class='add'>+	}</div><div class='add'>+	erofs_fileio_rq_submit(io.rq);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+const struct address_space_operations erofs_fileio_aops = {</div><div class='add'>+	.read_folio = erofs_fileio_read_folio,</div><div class='add'>+	.readahead = erofs_fileio_readahead,</div><div class='add'>+};</div><div class='head'>diff --git a/fs/erofs/fscache.c b/fs/erofs/fscache.c<br/>new file mode 100644<br/>index 000000000000..7a346e20f7b7<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/erofs/fscache.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/erofs/fscache.c</a></div><div class='hunk'>@@ -0,0 +1,677 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='add'>+/*</div><div class='add'>+ * Copyright (C) 2022, Alibaba Cloud</div><div class='add'>+ * Copyright (C) 2022, Bytedance Inc. All rights reserved.</div><div class='add'>+ */</div><div class='add'>+#include &lt;linux/pseudo_fs.h&gt;</div><div class='add'>+#include &lt;linux/fscache.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+static DEFINE_MUTEX(erofs_domain_list_lock);</div><div class='add'>+static DEFINE_MUTEX(erofs_domain_cookies_lock);</div><div class='add'>+static LIST_HEAD(erofs_domain_list);</div><div class='add'>+static LIST_HEAD(erofs_domain_cookies_list);</div><div class='add'>+static struct vfsmount *erofs_pseudo_mnt;</div><div class='add'>+</div><div class='add'>+static int erofs_anon_init_fs_context(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	return init_pseudo(fc, EROFS_SUPER_MAGIC) ? 0 : -ENOMEM;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct file_system_type erofs_anon_fs_type = {</div><div class='add'>+	.owner		= THIS_MODULE,</div><div class='add'>+	.name           = "pseudo_erofs",</div><div class='add'>+	.init_fs_context = erofs_anon_init_fs_context,</div><div class='add'>+	.kill_sb        = kill_anon_super,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct erofs_fscache_io {</div><div class='add'>+	struct netfs_cache_resources cres;</div><div class='add'>+	struct iov_iter		iter;</div><div class='add'>+	netfs_io_terminated_t	end_io;</div><div class='add'>+	void			*private;</div><div class='add'>+	refcount_t		ref;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct erofs_fscache_rq {</div><div class='add'>+	struct address_space	*mapping;	/* The mapping being accessed */</div><div class='add'>+	loff_t			start;		/* Start position */</div><div class='add'>+	size_t			len;		/* Length of the request */</div><div class='add'>+	size_t			submitted;	/* Length of submitted */</div><div class='add'>+	short			error;		/* 0 or error that occurred */</div><div class='add'>+	refcount_t		ref;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static bool erofs_fscache_io_put(struct erofs_fscache_io *io)</div><div class='add'>+{</div><div class='add'>+	if (!refcount_dec_and_test(&amp;io-&gt;ref))</div><div class='add'>+		return false;</div><div class='add'>+	if (io-&gt;cres.ops)</div><div class='add'>+		io-&gt;cres.ops-&gt;end_operation(&amp;io-&gt;cres);</div><div class='add'>+	kfree(io);</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void erofs_fscache_req_complete(struct erofs_fscache_rq *req)</div><div class='add'>+{</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	bool failed = req-&gt;error;</div><div class='add'>+	pgoff_t start_page = req-&gt;start / PAGE_SIZE;</div><div class='add'>+	pgoff_t last_page = ((req-&gt;start + req-&gt;len) / PAGE_SIZE) - 1;</div><div class='add'>+</div><div class='add'>+	XA_STATE(xas, &amp;req-&gt;mapping-&gt;i_pages, start_page);</div><div class='add'>+</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	xas_for_each(&amp;xas, folio, last_page) {</div><div class='add'>+		if (xas_retry(&amp;xas, folio))</div><div class='add'>+			continue;</div><div class='add'>+		if (!failed)</div><div class='add'>+			folio_mark_uptodate(folio);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+	}</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void erofs_fscache_req_put(struct erofs_fscache_rq *req)</div><div class='add'>+{</div><div class='add'>+	if (!refcount_dec_and_test(&amp;req-&gt;ref))</div><div class='add'>+		return;</div><div class='add'>+	erofs_fscache_req_complete(req);</div><div class='add'>+	kfree(req);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct erofs_fscache_rq *erofs_fscache_req_alloc(struct address_space *mapping,</div><div class='add'>+						loff_t start, size_t len)</div><div class='add'>+{</div><div class='add'>+	struct erofs_fscache_rq *req = kzalloc(sizeof(*req), GFP_KERNEL);</div><div class='add'>+</div><div class='add'>+	if (!req)</div><div class='add'>+		return NULL;</div><div class='add'>+	req-&gt;mapping = mapping;</div><div class='add'>+	req-&gt;start = start;</div><div class='add'>+	req-&gt;len = len;</div><div class='add'>+	refcount_set(&amp;req-&gt;ref, 1);</div><div class='add'>+	return req;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void erofs_fscache_req_io_put(struct erofs_fscache_io *io)</div><div class='add'>+{</div><div class='add'>+	struct erofs_fscache_rq *req = io-&gt;private;</div><div class='add'>+</div><div class='add'>+	if (erofs_fscache_io_put(io))</div><div class='add'>+		erofs_fscache_req_put(req);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void erofs_fscache_req_end_io(void *priv, ssize_t transferred_or_error)</div><div class='add'>+{</div><div class='add'>+	struct erofs_fscache_io *io = priv;</div><div class='add'>+	struct erofs_fscache_rq *req = io-&gt;private;</div><div class='add'>+</div><div class='add'>+	if (IS_ERR_VALUE(transferred_or_error))</div><div class='add'>+		req-&gt;error = transferred_or_error;</div><div class='add'>+	erofs_fscache_req_io_put(io);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct erofs_fscache_io *erofs_fscache_req_io_alloc(struct erofs_fscache_rq *req)</div><div class='add'>+{</div><div class='add'>+	struct erofs_fscache_io *io = kzalloc(sizeof(*io), GFP_KERNEL);</div><div class='add'>+</div><div class='add'>+	if (!io)</div><div class='add'>+		return NULL;</div><div class='add'>+	io-&gt;end_io = erofs_fscache_req_end_io;</div><div class='add'>+	io-&gt;private = req;</div><div class='add'>+	refcount_inc(&amp;req-&gt;ref);</div><div class='add'>+	refcount_set(&amp;io-&gt;ref, 1);</div><div class='add'>+	return io;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Read data from fscache described by cookie at pstart physical address</div><div class='add'>+ * offset, and fill the read data into buffer described by io-&gt;iter.</div><div class='add'>+ */</div><div class='add'>+static int erofs_fscache_read_io_async(struct fscache_cookie *cookie,</div><div class='add'>+		loff_t pstart, struct erofs_fscache_io *io)</div><div class='add'>+{</div><div class='add'>+	enum netfs_io_source source;</div><div class='add'>+	struct netfs_cache_resources *cres = &amp;io-&gt;cres;</div><div class='add'>+	struct iov_iter *iter = &amp;io-&gt;iter;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = fscache_begin_read_operation(cres, cookie);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	while (iov_iter_count(iter)) {</div><div class='add'>+		size_t orig_count = iov_iter_count(iter), len = orig_count;</div><div class='add'>+		unsigned long flags = 1 &lt;&lt; NETFS_SREQ_ONDEMAND;</div><div class='add'>+</div><div class='add'>+		source = cres-&gt;ops-&gt;prepare_ondemand_read(cres,</div><div class='add'>+				pstart, &amp;len, LLONG_MAX, &amp;flags, 0);</div><div class='add'>+		if (WARN_ON(len == 0))</div><div class='add'>+			source = NETFS_INVALID_READ;</div><div class='add'>+		if (source != NETFS_READ_FROM_CACHE) {</div><div class='add'>+			erofs_err(NULL, "prepare_ondemand_read failed (source %d)", source);</div><div class='add'>+			return -EIO;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		iov_iter_truncate(iter, len);</div><div class='add'>+		refcount_inc(&amp;io-&gt;ref);</div><div class='add'>+		ret = fscache_read(cres, pstart, iter, NETFS_READ_HOLE_FAIL,</div><div class='add'>+				   io-&gt;end_io, io);</div><div class='add'>+		if (ret == -EIOCBQUEUED)</div><div class='add'>+			ret = 0;</div><div class='add'>+		if (ret) {</div><div class='add'>+			erofs_err(NULL, "fscache_read failed (ret %d)", ret);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='add'>+		if (WARN_ON(iov_iter_count(iter)))</div><div class='add'>+			return -EIO;</div><div class='add'>+</div><div class='add'>+		iov_iter_reexpand(iter, orig_count - len);</div><div class='add'>+		pstart += len;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct erofs_fscache_bio {</div><div class='add'>+	struct erofs_fscache_io io;</div><div class='add'>+	struct bio bio;		/* w/o bdev to share bio_add_page/endio() */</div><div class='add'>+	struct bio_vec bvecs[BIO_MAX_VECS];</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static void erofs_fscache_bio_endio(void *priv, ssize_t transferred_or_error)</div><div class='add'>+{</div><div class='add'>+	struct erofs_fscache_bio *io = priv;</div><div class='add'>+</div><div class='add'>+	if (IS_ERR_VALUE(transferred_or_error))</div><div class='add'>+		io-&gt;bio.bi_status = errno_to_blk_status(transferred_or_error);</div><div class='add'>+	bio_endio(&amp;io-&gt;bio);</div><div class='add'>+	BUILD_BUG_ON(offsetof(struct erofs_fscache_bio, io) != 0);</div><div class='add'>+	erofs_fscache_io_put(&amp;io-&gt;io);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct bio *erofs_fscache_bio_alloc(struct erofs_map_dev *mdev)</div><div class='add'>+{</div><div class='add'>+	struct erofs_fscache_bio *io;</div><div class='add'>+</div><div class='add'>+	io = kmalloc(sizeof(*io), GFP_KERNEL | __GFP_NOFAIL);</div><div class='add'>+	bio_init(&amp;io-&gt;bio, NULL, io-&gt;bvecs, BIO_MAX_VECS, REQ_OP_READ);</div><div class='add'>+	io-&gt;io.private = mdev-&gt;m_dif-&gt;fscache-&gt;cookie;</div><div class='add'>+	io-&gt;io.end_io = erofs_fscache_bio_endio;</div><div class='add'>+	refcount_set(&amp;io-&gt;io.ref, 1);</div><div class='add'>+	return &amp;io-&gt;bio;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void erofs_fscache_submit_bio(struct bio *bio)</div><div class='add'>+{</div><div class='add'>+	struct erofs_fscache_bio *io = container_of(bio,</div><div class='add'>+			struct erofs_fscache_bio, bio);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	iov_iter_bvec(&amp;io-&gt;io.iter, ITER_DEST, io-&gt;bvecs, bio-&gt;bi_vcnt,</div><div class='add'>+		      bio-&gt;bi_iter.bi_size);</div><div class='add'>+	ret = erofs_fscache_read_io_async(io-&gt;io.private,</div><div class='add'>+				bio-&gt;bi_iter.bi_sector &lt;&lt; 9, &amp;io-&gt;io);</div><div class='add'>+	erofs_fscache_io_put(&amp;io-&gt;io);</div><div class='add'>+	if (!ret)</div><div class='add'>+		return;</div><div class='add'>+	bio-&gt;bi_status = errno_to_blk_status(ret);</div><div class='add'>+	bio_endio(bio);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int erofs_fscache_meta_read_folio(struct file *data, struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	struct erofs_fscache *ctx = folio-&gt;mapping-&gt;host-&gt;i_private;</div><div class='add'>+	int ret = -ENOMEM;</div><div class='add'>+	struct erofs_fscache_rq *req;</div><div class='add'>+	struct erofs_fscache_io *io;</div><div class='add'>+</div><div class='add'>+	req = erofs_fscache_req_alloc(folio-&gt;mapping,</div><div class='add'>+				folio_pos(folio), folio_size(folio));</div><div class='add'>+	if (!req) {</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	io = erofs_fscache_req_io_alloc(req);</div><div class='add'>+	if (!io) {</div><div class='add'>+		req-&gt;error = ret;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	iov_iter_xarray(&amp;io-&gt;iter, ITER_DEST, &amp;folio-&gt;mapping-&gt;i_pages,</div><div class='add'>+			folio_pos(folio), folio_size(folio));</div><div class='add'>+</div><div class='add'>+	ret = erofs_fscache_read_io_async(ctx-&gt;cookie, folio_pos(folio), io);</div><div class='add'>+	if (ret)</div><div class='add'>+		req-&gt;error = ret;</div><div class='add'>+</div><div class='add'>+	erofs_fscache_req_io_put(io);</div><div class='add'>+out:</div><div class='add'>+	erofs_fscache_req_put(req);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int erofs_fscache_data_read_slice(struct erofs_fscache_rq *req)</div><div class='add'>+{</div><div class='add'>+	struct address_space *mapping = req-&gt;mapping;</div><div class='add'>+	struct inode *inode = mapping-&gt;host;</div><div class='add'>+	struct super_block *sb = inode-&gt;i_sb;</div><div class='add'>+	struct erofs_fscache_io *io;</div><div class='add'>+	struct erofs_map_blocks map;</div><div class='add'>+	struct erofs_map_dev mdev;</div><div class='add'>+	loff_t pos = req-&gt;start + req-&gt;submitted;</div><div class='add'>+	size_t count;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	map.m_la = pos;</div><div class='add'>+	ret = erofs_map_blocks(inode, &amp;map);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	if (map.m_flags &amp; EROFS_MAP_META) {</div><div class='add'>+		struct erofs_buf buf = __EROFS_BUF_INITIALIZER;</div><div class='add'>+		struct iov_iter iter;</div><div class='add'>+		size_t size = map.m_llen;</div><div class='add'>+		void *src;</div><div class='add'>+</div><div class='add'>+		src = erofs_read_metabuf(&amp;buf, sb, map.m_pa,</div><div class='add'>+					 erofs_inode_in_metabox(inode));</div><div class='add'>+		if (IS_ERR(src))</div><div class='add'>+			return PTR_ERR(src);</div><div class='add'>+</div><div class='add'>+		iov_iter_xarray(&amp;iter, ITER_DEST, &amp;mapping-&gt;i_pages, pos, PAGE_SIZE);</div><div class='add'>+		if (copy_to_iter(src, size, &amp;iter) != size) {</div><div class='add'>+			erofs_put_metabuf(&amp;buf);</div><div class='add'>+			return -EFAULT;</div><div class='add'>+		}</div><div class='add'>+		iov_iter_zero(PAGE_SIZE - size, &amp;iter);</div><div class='add'>+		erofs_put_metabuf(&amp;buf);</div><div class='add'>+		req-&gt;submitted += PAGE_SIZE;</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	count = req-&gt;len - req-&gt;submitted;</div><div class='add'>+	if (!(map.m_flags &amp; EROFS_MAP_MAPPED)) {</div><div class='add'>+		struct iov_iter iter;</div><div class='add'>+</div><div class='add'>+		iov_iter_xarray(&amp;iter, ITER_DEST, &amp;mapping-&gt;i_pages, pos, count);</div><div class='add'>+		iov_iter_zero(count, &amp;iter);</div><div class='add'>+		req-&gt;submitted += count;</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	count = min_t(size_t, map.m_llen - (pos - map.m_la), count);</div><div class='add'>+	DBG_BUGON(!count || count % PAGE_SIZE);</div><div class='add'>+</div><div class='add'>+	mdev = (struct erofs_map_dev) {</div><div class='add'>+		.m_deviceid = map.m_deviceid,</div><div class='add'>+		.m_pa = map.m_pa,</div><div class='add'>+	};</div><div class='add'>+	ret = erofs_map_dev(sb, &amp;mdev);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	io = erofs_fscache_req_io_alloc(req);</div><div class='add'>+	if (!io)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	iov_iter_xarray(&amp;io-&gt;iter, ITER_DEST, &amp;mapping-&gt;i_pages, pos, count);</div><div class='add'>+	ret = erofs_fscache_read_io_async(mdev.m_dif-&gt;fscache-&gt;cookie,</div><div class='add'>+			mdev.m_pa + (pos - map.m_la), io);</div><div class='add'>+	erofs_fscache_req_io_put(io);</div><div class='add'>+</div><div class='add'>+	req-&gt;submitted += count;</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int erofs_fscache_data_read(struct erofs_fscache_rq *req)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		ret = erofs_fscache_data_read_slice(req);</div><div class='add'>+		if (ret)</div><div class='add'>+			req-&gt;error = ret;</div><div class='add'>+	} while (!ret &amp;&amp; req-&gt;submitted &lt; req-&gt;len);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int erofs_fscache_read_folio(struct file *file, struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	struct erofs_fscache_rq *req;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	req = erofs_fscache_req_alloc(folio-&gt;mapping,</div><div class='add'>+			folio_pos(folio), folio_size(folio));</div><div class='add'>+	if (!req) {</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = erofs_fscache_data_read(req);</div><div class='add'>+	erofs_fscache_req_put(req);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void erofs_fscache_readahead(struct readahead_control *rac)</div><div class='add'>+{</div><div class='add'>+	struct erofs_fscache_rq *req;</div><div class='add'>+</div><div class='add'>+	if (!readahead_count(rac))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	req = erofs_fscache_req_alloc(rac-&gt;mapping,</div><div class='add'>+			readahead_pos(rac), readahead_length(rac));</div><div class='add'>+	if (!req)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/* The request completion will drop refs on the folios. */</div><div class='add'>+	while (readahead_folio(rac))</div><div class='add'>+		;</div><div class='add'>+</div><div class='add'>+	erofs_fscache_data_read(req);</div><div class='add'>+	erofs_fscache_req_put(req);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct address_space_operations erofs_fscache_meta_aops = {</div><div class='add'>+	.read_folio = erofs_fscache_meta_read_folio,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+const struct address_space_operations erofs_fscache_access_aops = {</div><div class='add'>+	.read_folio = erofs_fscache_read_folio,</div><div class='add'>+	.readahead = erofs_fscache_readahead,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static void erofs_fscache_domain_put(struct erofs_domain *domain)</div><div class='add'>+{</div><div class='add'>+	mutex_lock(&amp;erofs_domain_list_lock);</div><div class='add'>+	if (refcount_dec_and_test(&amp;domain-&gt;ref)) {</div><div class='add'>+		list_del(&amp;domain-&gt;list);</div><div class='add'>+		if (list_empty(&amp;erofs_domain_list)) {</div><div class='add'>+			kern_unmount(erofs_pseudo_mnt);</div><div class='add'>+			erofs_pseudo_mnt = NULL;</div><div class='add'>+		}</div><div class='add'>+		fscache_relinquish_volume(domain-&gt;volume, NULL, false);</div><div class='add'>+		mutex_unlock(&amp;erofs_domain_list_lock);</div><div class='add'>+		kfree(domain-&gt;domain_id);</div><div class='add'>+		kfree(domain);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+	mutex_unlock(&amp;erofs_domain_list_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int erofs_fscache_register_volume(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct erofs_sb_info *sbi = EROFS_SB(sb);</div><div class='add'>+	char *domain_id = sbi-&gt;domain_id;</div><div class='add'>+	struct fscache_volume *volume;</div><div class='add'>+	char *name;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	name = kasprintf(GFP_KERNEL, "erofs,%s",</div><div class='add'>+			 domain_id ? domain_id : sbi-&gt;fsid);</div><div class='add'>+	if (!name)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	volume = fscache_acquire_volume(name, NULL, NULL, 0);</div><div class='add'>+	if (IS_ERR_OR_NULL(volume)) {</div><div class='add'>+		erofs_err(sb, "failed to register volume for %s", name);</div><div class='add'>+		ret = volume ? PTR_ERR(volume) : -EOPNOTSUPP;</div><div class='add'>+		volume = NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	sbi-&gt;volume = volume;</div><div class='add'>+	kfree(name);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int erofs_fscache_init_domain(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	int err;</div><div class='add'>+	struct erofs_domain *domain;</div><div class='add'>+	struct erofs_sb_info *sbi = EROFS_SB(sb);</div><div class='add'>+</div><div class='add'>+	domain = kzalloc(sizeof(struct erofs_domain), GFP_KERNEL);</div><div class='add'>+	if (!domain)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	domain-&gt;domain_id = kstrdup(sbi-&gt;domain_id, GFP_KERNEL);</div><div class='add'>+	if (!domain-&gt;domain_id) {</div><div class='add'>+		kfree(domain);</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	err = erofs_fscache_register_volume(sb);</div><div class='add'>+	if (err)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	if (!erofs_pseudo_mnt) {</div><div class='add'>+		struct vfsmount *mnt = kern_mount(&amp;erofs_anon_fs_type);</div><div class='add'>+		if (IS_ERR(mnt)) {</div><div class='add'>+			err = PTR_ERR(mnt);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		erofs_pseudo_mnt = mnt;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	domain-&gt;volume = sbi-&gt;volume;</div><div class='add'>+	refcount_set(&amp;domain-&gt;ref, 1);</div><div class='add'>+	list_add(&amp;domain-&gt;list, &amp;erofs_domain_list);</div><div class='add'>+	sbi-&gt;domain = domain;</div><div class='add'>+	return 0;</div><div class='add'>+out:</div><div class='add'>+	kfree(domain-&gt;domain_id);</div><div class='add'>+	kfree(domain);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int erofs_fscache_register_domain(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	int err;</div><div class='add'>+	struct erofs_domain *domain;</div><div class='add'>+	struct erofs_sb_info *sbi = EROFS_SB(sb);</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;erofs_domain_list_lock);</div><div class='add'>+	list_for_each_entry(domain, &amp;erofs_domain_list, list) {</div><div class='add'>+		if (!strcmp(domain-&gt;domain_id, sbi-&gt;domain_id)) {</div><div class='add'>+			sbi-&gt;domain = domain;</div><div class='add'>+			sbi-&gt;volume = domain-&gt;volume;</div><div class='add'>+			refcount_inc(&amp;domain-&gt;ref);</div><div class='add'>+			mutex_unlock(&amp;erofs_domain_list_lock);</div><div class='add'>+			return 0;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	err = erofs_fscache_init_domain(sb);</div><div class='add'>+	mutex_unlock(&amp;erofs_domain_list_lock);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct erofs_fscache *erofs_fscache_acquire_cookie(struct super_block *sb,</div><div class='add'>+						char *name, unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	struct fscache_volume *volume = EROFS_SB(sb)-&gt;volume;</div><div class='add'>+	struct erofs_fscache *ctx;</div><div class='add'>+	struct fscache_cookie *cookie;</div><div class='add'>+	struct super_block *isb;</div><div class='add'>+	struct inode *inode;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ctx = kzalloc(sizeof(*ctx), GFP_KERNEL);</div><div class='add'>+	if (!ctx)</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+	INIT_LIST_HEAD(&amp;ctx-&gt;node);</div><div class='add'>+	refcount_set(&amp;ctx-&gt;ref, 1);</div><div class='add'>+</div><div class='add'>+	cookie = fscache_acquire_cookie(volume, FSCACHE_ADV_WANT_CACHE_SIZE,</div><div class='add'>+					name, strlen(name), NULL, 0, 0);</div><div class='add'>+	if (!cookie) {</div><div class='add'>+		erofs_err(sb, "failed to get cookie for %s", name);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto err;</div><div class='add'>+	}</div><div class='add'>+	fscache_use_cookie(cookie, false);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Allocate anonymous inode in global pseudo mount for shareable blobs,</div><div class='add'>+	 * so that they are accessible among erofs fs instances.</div><div class='add'>+	 */</div><div class='add'>+	isb = flags &amp; EROFS_REG_COOKIE_SHARE ? erofs_pseudo_mnt-&gt;mnt_sb : sb;</div><div class='add'>+	inode = new_inode(isb);</div><div class='add'>+	if (!inode) {</div><div class='add'>+		erofs_err(sb, "failed to get anon inode for %s", name);</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto err_cookie;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	inode-&gt;i_size = OFFSET_MAX;</div><div class='add'>+	inode-&gt;i_mapping-&gt;a_ops = &amp;erofs_fscache_meta_aops;</div><div class='add'>+	mapping_set_gfp_mask(inode-&gt;i_mapping, GFP_KERNEL);</div><div class='add'>+	inode-&gt;i_blkbits = EROFS_SB(sb)-&gt;blkszbits;</div><div class='add'>+	inode-&gt;i_private = ctx;</div><div class='add'>+</div><div class='add'>+	ctx-&gt;cookie = cookie;</div><div class='add'>+	ctx-&gt;inode = inode;</div><div class='add'>+	return ctx;</div><div class='add'>+</div><div class='add'>+err_cookie:</div><div class='add'>+	fscache_unuse_cookie(cookie, NULL, NULL);</div><div class='add'>+	fscache_relinquish_cookie(cookie, false);</div><div class='add'>+err:</div><div class='add'>+	kfree(ctx);</div><div class='add'>+	return ERR_PTR(ret);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void erofs_fscache_relinquish_cookie(struct erofs_fscache *ctx)</div><div class='add'>+{</div><div class='add'>+	fscache_unuse_cookie(ctx-&gt;cookie, NULL, NULL);</div><div class='add'>+	fscache_relinquish_cookie(ctx-&gt;cookie, false);</div><div class='add'>+	iput(ctx-&gt;inode);</div><div class='add'>+	kfree(ctx-&gt;name);</div><div class='add'>+	kfree(ctx);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct erofs_fscache *erofs_domain_init_cookie(struct super_block *sb,</div><div class='add'>+						char *name, unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	struct erofs_fscache *ctx;</div><div class='add'>+	struct erofs_domain *domain = EROFS_SB(sb)-&gt;domain;</div><div class='add'>+</div><div class='add'>+	ctx = erofs_fscache_acquire_cookie(sb, name, flags);</div><div class='add'>+	if (IS_ERR(ctx))</div><div class='add'>+		return ctx;</div><div class='add'>+</div><div class='add'>+	ctx-&gt;name = kstrdup(name, GFP_KERNEL);</div><div class='add'>+	if (!ctx-&gt;name) {</div><div class='add'>+		erofs_fscache_relinquish_cookie(ctx);</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	refcount_inc(&amp;domain-&gt;ref);</div><div class='add'>+	ctx-&gt;domain = domain;</div><div class='add'>+	list_add(&amp;ctx-&gt;node, &amp;erofs_domain_cookies_list);</div><div class='add'>+	return ctx;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct erofs_fscache *erofs_domain_register_cookie(struct super_block *sb,</div><div class='add'>+						char *name, unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	struct erofs_fscache *ctx;</div><div class='add'>+	struct erofs_domain *domain = EROFS_SB(sb)-&gt;domain;</div><div class='add'>+</div><div class='add'>+	flags |= EROFS_REG_COOKIE_SHARE;</div><div class='add'>+	mutex_lock(&amp;erofs_domain_cookies_lock);</div><div class='add'>+	list_for_each_entry(ctx, &amp;erofs_domain_cookies_list, node) {</div><div class='add'>+		if (ctx-&gt;domain != domain || strcmp(ctx-&gt;name, name))</div><div class='add'>+			continue;</div><div class='add'>+		if (!(flags &amp; EROFS_REG_COOKIE_NEED_NOEXIST)) {</div><div class='add'>+			refcount_inc(&amp;ctx-&gt;ref);</div><div class='add'>+		} else {</div><div class='add'>+			erofs_err(sb, "%s already exists in domain %s", name,</div><div class='add'>+				  domain-&gt;domain_id);</div><div class='add'>+			ctx = ERR_PTR(-EEXIST);</div><div class='add'>+		}</div><div class='add'>+		mutex_unlock(&amp;erofs_domain_cookies_lock);</div><div class='add'>+		return ctx;</div><div class='add'>+	}</div><div class='add'>+	ctx = erofs_domain_init_cookie(sb, name, flags);</div><div class='add'>+	mutex_unlock(&amp;erofs_domain_cookies_lock);</div><div class='add'>+	return ctx;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct erofs_fscache *erofs_fscache_register_cookie(struct super_block *sb,</div><div class='add'>+						    char *name,</div><div class='add'>+						    unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	if (EROFS_SB(sb)-&gt;domain_id)</div><div class='add'>+		return erofs_domain_register_cookie(sb, name, flags);</div><div class='add'>+	return erofs_fscache_acquire_cookie(sb, name, flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void erofs_fscache_unregister_cookie(struct erofs_fscache *ctx)</div><div class='add'>+{</div><div class='add'>+	struct erofs_domain *domain = NULL;</div><div class='add'>+</div><div class='add'>+	if (!ctx)</div><div class='add'>+		return;</div><div class='add'>+	if (!ctx-&gt;domain)</div><div class='add'>+		return erofs_fscache_relinquish_cookie(ctx);</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;erofs_domain_cookies_lock);</div><div class='add'>+	if (refcount_dec_and_test(&amp;ctx-&gt;ref)) {</div><div class='add'>+		domain = ctx-&gt;domain;</div><div class='add'>+		list_del(&amp;ctx-&gt;node);</div><div class='add'>+		erofs_fscache_relinquish_cookie(ctx);</div><div class='add'>+	}</div><div class='add'>+	mutex_unlock(&amp;erofs_domain_cookies_lock);</div><div class='add'>+	if (domain)</div><div class='add'>+		erofs_fscache_domain_put(domain);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int erofs_fscache_register_fs(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+	struct erofs_sb_info *sbi = EROFS_SB(sb);</div><div class='add'>+	struct erofs_fscache *fscache;</div><div class='add'>+	unsigned int flags = 0;</div><div class='add'>+</div><div class='add'>+	if (sbi-&gt;domain_id)</div><div class='add'>+		ret = erofs_fscache_register_domain(sb);</div><div class='add'>+	else</div><div class='add'>+		ret = erofs_fscache_register_volume(sb);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * When shared domain is enabled, using NEED_NOEXIST to guarantee</div><div class='add'>+	 * the primary data blob (aka fsid) is unique in the shared domain.</div><div class='add'>+	 *</div><div class='add'>+	 * For non-shared-domain case, fscache_acquire_volume() invoked by</div><div class='add'>+	 * erofs_fscache_register_volume() has already guaranteed</div><div class='add'>+	 * the uniqueness of primary data blob.</div><div class='add'>+	 *</div><div class='add'>+	 * Acquired domain/volume will be relinquished in kill_sb() on error.</div><div class='add'>+	 */</div><div class='add'>+	if (sbi-&gt;domain_id)</div><div class='add'>+		flags |= EROFS_REG_COOKIE_NEED_NOEXIST;</div><div class='add'>+	fscache = erofs_fscache_register_cookie(sb, sbi-&gt;fsid, flags);</div><div class='add'>+	if (IS_ERR(fscache))</div><div class='add'>+		return PTR_ERR(fscache);</div><div class='add'>+</div><div class='add'>+	sbi-&gt;dif0.fscache = fscache;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void erofs_fscache_unregister_fs(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct erofs_sb_info *sbi = EROFS_SB(sb);</div><div class='add'>+</div><div class='add'>+	erofs_fscache_unregister_cookie(sbi-&gt;dif0.fscache);</div><div class='add'>+</div><div class='add'>+	if (sbi-&gt;domain)</div><div class='add'>+		erofs_fscache_domain_put(sbi-&gt;domain);</div><div class='add'>+	else</div><div class='add'>+		fscache_relinquish_volume(sbi-&gt;volume, NULL, false);</div><div class='add'>+</div><div class='add'>+	sbi-&gt;dif0.fscache = NULL;</div><div class='add'>+	sbi-&gt;volume = NULL;</div><div class='add'>+	sbi-&gt;domain = NULL;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/erofs/inode.c b/fs/erofs/inode.c<br/>index 2345f1de438e..bce98c845a18 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/erofs/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/erofs/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/erofs/inode.c</a></div><div class='hunk'>@@ -5,47 +5,54 @@</div><div class='ctx'>  * Copyright (C) 2021, Alibaba Cloud</div><div class='ctx'>  */</div><div class='ctx'> #include "xattr.h"</div><div class='del'>-</div><div class='add'>+#include &lt;linux/compat.h&gt;</div><div class='ctx'> #include &lt;trace/events/erofs.h&gt;</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * if inode is successfully read, return its inode page (or sometimes</div><div class='del'>- * the inode payload page if it's an extended inode) in order to fill</div><div class='del'>- * inline data if possible.</div><div class='del'>- */</div><div class='del'>-static struct page *erofs_read_inode(struct inode *inode,</div><div class='del'>-				     unsigned int *ofs)</div><div class='add'>+static int erofs_fill_symlink(struct inode *inode, void *kaddr,</div><div class='add'>+			      unsigned int m_pofs)</div><div class='add'>+{</div><div class='add'>+	struct erofs_inode *vi = EROFS_I(inode);</div><div class='add'>+	loff_t off;</div><div class='add'>+</div><div class='add'>+	m_pofs += vi-&gt;xattr_isize;</div><div class='add'>+	/* check if it cannot be handled with fast symlink scheme */</div><div class='add'>+	if (vi-&gt;datalayout != EROFS_INODE_FLAT_INLINE ||</div><div class='add'>+	    check_add_overflow(m_pofs, inode-&gt;i_size, &amp;off) ||</div><div class='add'>+	    off &gt; i_blocksize(inode))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	inode-&gt;i_link = kmemdup_nul(kaddr + m_pofs, inode-&gt;i_size, GFP_KERNEL);</div><div class='add'>+	return inode-&gt;i_link ? 0 : -ENOMEM;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int erofs_read_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='add'>+	erofs_blk_t blkaddr = erofs_blknr(sb, erofs_iloc(inode));</div><div class='add'>+	unsigned int ofs = erofs_blkoff(sb, erofs_iloc(inode));</div><div class='add'>+	bool in_mbox = erofs_inode_in_metabox(inode);</div><div class='add'>+	struct erofs_buf buf = __EROFS_BUF_INITIALIZER;</div><div class='ctx'> 	struct erofs_sb_info *sbi = EROFS_SB(sb);</div><div class='add'>+	erofs_blk_t addrmask = BIT_ULL(48) - 1;</div><div class='ctx'> 	struct erofs_inode *vi = EROFS_I(inode);</div><div class='del'>-	const erofs_off_t inode_loc = iloc(sbi, vi-&gt;nid);</div><div class='del'>-</div><div class='del'>-	erofs_blk_t blkaddr, nblks = 0;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct erofs_inode_extended *die, copied;</div><div class='ctx'> 	struct erofs_inode_compact *dic;</div><div class='del'>-	struct erofs_inode_extended *die, *copied = NULL;</div><div class='ctx'> 	unsigned int ifmt;</div><div class='del'>-	int err;</div><div class='del'>-</div><div class='del'>-	blkaddr = erofs_blknr(inode_loc);</div><div class='del'>-	*ofs = erofs_blkoff(inode_loc);</div><div class='del'>-</div><div class='del'>-	erofs_dbg("%s, reading inode nid %llu at %u of blkaddr %u",</div><div class='del'>-		  __func__, vi-&gt;nid, *ofs, blkaddr);</div><div class='add'>+	void *ptr;</div><div class='add'>+	int err = 0;</div><div class='ctx'> </div><div class='del'>-	page = erofs_get_meta_page(sb, blkaddr);</div><div class='del'>-	if (IS_ERR(page)) {</div><div class='del'>-		erofs_err(sb, "failed to get inode (nid: %llu) page, err %ld",</div><div class='del'>-			  vi-&gt;nid, PTR_ERR(page));</div><div class='del'>-		return page;</div><div class='add'>+	ptr = erofs_read_metabuf(&amp;buf, sb, erofs_pos(sb, blkaddr), in_mbox);</div><div class='add'>+	if (IS_ERR(ptr)) {</div><div class='add'>+		err = PTR_ERR(ptr);</div><div class='add'>+		erofs_err(sb, "failed to read inode meta block (nid: %llu): %d",</div><div class='add'>+			  vi-&gt;nid, err);</div><div class='add'>+		goto err_out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dic = page_address(page) + *ofs;</div><div class='add'>+	dic = ptr + ofs;</div><div class='ctx'> 	ifmt = le16_to_cpu(dic-&gt;i_format);</div><div class='del'>-</div><div class='ctx'> 	if (ifmt &amp; ~EROFS_I_ALL) {</div><div class='del'>-		erofs_err(inode-&gt;i_sb, "unsupported i_format %u of nid %llu",</div><div class='add'>+		erofs_err(sb, "unsupported i_format %u of nid %llu",</div><div class='ctx'> 			  ifmt, vi-&gt;nid);</div><div class='ctx'> 		err = -EOPNOTSUPP;</div><div class='ctx'> 		goto err_out;</div><div class='hunk'>@@ -53,7 +60,7 @@ static struct page *erofs_read_inode(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 	vi-&gt;datalayout = erofs_inode_datalayout(ifmt);</div><div class='ctx'> 	if (vi-&gt;datalayout &gt;= EROFS_INODE_DATALAYOUT_MAX) {</div><div class='del'>-		erofs_err(inode-&gt;i_sb, "unsupported datalayout %u of nid %llu",</div><div class='add'>+		erofs_err(sb, "unsupported datalayout %u of nid %llu",</div><div class='ctx'> 			  vi-&gt;datalayout, vi-&gt;nid);</div><div class='ctx'> 		err = -EOPNOTSUPP;</div><div class='ctx'> 		goto err_out;</div><div class='hunk'>@@ -62,326 +69,314 @@ static struct page *erofs_read_inode(struct inode *inode,</div><div class='ctx'> 	switch (erofs_inode_version(ifmt)) {</div><div class='ctx'> 	case EROFS_INODE_LAYOUT_EXTENDED:</div><div class='ctx'> 		vi-&gt;inode_isize = sizeof(struct erofs_inode_extended);</div><div class='del'>-		/* check if the inode acrosses page boundary */</div><div class='del'>-		if (*ofs + vi-&gt;inode_isize &lt;= PAGE_SIZE) {</div><div class='del'>-			*ofs += vi-&gt;inode_isize;</div><div class='add'>+		/* check if the extended inode acrosses block boundary */</div><div class='add'>+		if (ofs + vi-&gt;inode_isize &lt;= sb-&gt;s_blocksize) {</div><div class='add'>+			ofs += vi-&gt;inode_isize;</div><div class='ctx'> 			die = (struct erofs_inode_extended *)dic;</div><div class='add'>+			copied.i_u = die-&gt;i_u;</div><div class='add'>+			copied.i_nb = die-&gt;i_nb;</div><div class='ctx'> 		} else {</div><div class='del'>-			const unsigned int gotten = PAGE_SIZE - *ofs;</div><div class='del'>-</div><div class='del'>-			copied = kmalloc(vi-&gt;inode_isize, GFP_NOFS);</div><div class='del'>-			if (!copied) {</div><div class='del'>-				err = -ENOMEM;</div><div class='add'>+			const unsigned int gotten = sb-&gt;s_blocksize - ofs;</div><div class='add'>+</div><div class='add'>+			memcpy(&amp;copied, dic, gotten);</div><div class='add'>+			ptr = erofs_read_metabuf(&amp;buf, sb,</div><div class='add'>+					erofs_pos(sb, blkaddr + 1), in_mbox);</div><div class='add'>+			if (IS_ERR(ptr)) {</div><div class='add'>+				err = PTR_ERR(ptr);</div><div class='add'>+				erofs_err(sb, "failed to read inode payload block (nid: %llu): %d",</div><div class='add'>+					  vi-&gt;nid, err);</div><div class='ctx'> 				goto err_out;</div><div class='ctx'> 			}</div><div class='del'>-			memcpy(copied, dic, gotten);</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			put_page(page);</div><div class='del'>-</div><div class='del'>-			page = erofs_get_meta_page(sb, blkaddr + 1);</div><div class='del'>-			if (IS_ERR(page)) {</div><div class='del'>-				erofs_err(sb, "failed to get inode payload page (nid: %llu), err %ld",</div><div class='del'>-					  vi-&gt;nid, PTR_ERR(page));</div><div class='del'>-				kfree(copied);</div><div class='del'>-				return page;</div><div class='del'>-			}</div><div class='del'>-			*ofs = vi-&gt;inode_isize - gotten;</div><div class='del'>-			memcpy((u8 *)copied + gotten, page_address(page), *ofs);</div><div class='del'>-			die = copied;</div><div class='add'>+			ofs = vi-&gt;inode_isize - gotten;</div><div class='add'>+			memcpy((u8 *)&amp;copied + gotten, ptr, ofs);</div><div class='add'>+			die = &amp;copied;</div><div class='ctx'> 		}</div><div class='ctx'> 		vi-&gt;xattr_isize = erofs_xattr_ibody_size(die-&gt;i_xattr_icount);</div><div class='ctx'> </div><div class='ctx'> 		inode-&gt;i_mode = le16_to_cpu(die-&gt;i_mode);</div><div class='del'>-		switch (inode-&gt;i_mode &amp; S_IFMT) {</div><div class='del'>-		case S_IFREG:</div><div class='del'>-		case S_IFDIR:</div><div class='del'>-		case S_IFLNK:</div><div class='del'>-			vi-&gt;raw_blkaddr = le32_to_cpu(die-&gt;i_u.raw_blkaddr);</div><div class='del'>-			break;</div><div class='del'>-		case S_IFCHR:</div><div class='del'>-		case S_IFBLK:</div><div class='del'>-			inode-&gt;i_rdev =</div><div class='del'>-				new_decode_dev(le32_to_cpu(die-&gt;i_u.rdev));</div><div class='del'>-			break;</div><div class='del'>-		case S_IFIFO:</div><div class='del'>-		case S_IFSOCK:</div><div class='del'>-			inode-&gt;i_rdev = 0;</div><div class='del'>-			break;</div><div class='del'>-		default:</div><div class='del'>-			goto bogusimode;</div><div class='del'>-		}</div><div class='ctx'> 		i_uid_write(inode, le32_to_cpu(die-&gt;i_uid));</div><div class='ctx'> 		i_gid_write(inode, le32_to_cpu(die-&gt;i_gid));</div><div class='ctx'> 		set_nlink(inode, le32_to_cpu(die-&gt;i_nlink));</div><div class='del'>-</div><div class='del'>-		/* extended inode has its own timestamp */</div><div class='del'>-		inode-&gt;i_ctime.tv_sec = le64_to_cpu(die-&gt;i_ctime);</div><div class='del'>-		inode-&gt;i_ctime.tv_nsec = le32_to_cpu(die-&gt;i_ctime_nsec);</div><div class='add'>+		inode_set_mtime(inode, le64_to_cpu(die-&gt;i_mtime),</div><div class='add'>+				le32_to_cpu(die-&gt;i_mtime_nsec));</div><div class='ctx'> </div><div class='ctx'> 		inode-&gt;i_size = le64_to_cpu(die-&gt;i_size);</div><div class='del'>-</div><div class='del'>-		/* total blocks for compressed files */</div><div class='del'>-		if (erofs_inode_is_data_compressed(vi-&gt;datalayout))</div><div class='del'>-			nblks = le32_to_cpu(die-&gt;i_u.compressed_blocks);</div><div class='del'>-		else if (vi-&gt;datalayout == EROFS_INODE_CHUNK_BASED)</div><div class='del'>-			/* fill chunked inode summary info */</div><div class='del'>-			vi-&gt;chunkformat = le16_to_cpu(die-&gt;i_u.c.format);</div><div class='del'>-		kfree(copied);</div><div class='del'>-		copied = NULL;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case EROFS_INODE_LAYOUT_COMPACT:</div><div class='ctx'> 		vi-&gt;inode_isize = sizeof(struct erofs_inode_compact);</div><div class='del'>-		*ofs += vi-&gt;inode_isize;</div><div class='add'>+		ofs += vi-&gt;inode_isize;</div><div class='ctx'> 		vi-&gt;xattr_isize = erofs_xattr_ibody_size(dic-&gt;i_xattr_icount);</div><div class='ctx'> </div><div class='ctx'> 		inode-&gt;i_mode = le16_to_cpu(dic-&gt;i_mode);</div><div class='del'>-		switch (inode-&gt;i_mode &amp; S_IFMT) {</div><div class='del'>-		case S_IFREG:</div><div class='del'>-		case S_IFDIR:</div><div class='del'>-		case S_IFLNK:</div><div class='del'>-			vi-&gt;raw_blkaddr = le32_to_cpu(dic-&gt;i_u.raw_blkaddr);</div><div class='del'>-			break;</div><div class='del'>-		case S_IFCHR:</div><div class='del'>-		case S_IFBLK:</div><div class='del'>-			inode-&gt;i_rdev =</div><div class='del'>-				new_decode_dev(le32_to_cpu(dic-&gt;i_u.rdev));</div><div class='del'>-			break;</div><div class='del'>-		case S_IFIFO:</div><div class='del'>-		case S_IFSOCK:</div><div class='del'>-			inode-&gt;i_rdev = 0;</div><div class='del'>-			break;</div><div class='del'>-		default:</div><div class='del'>-			goto bogusimode;</div><div class='del'>-		}</div><div class='add'>+		copied.i_u = dic-&gt;i_u;</div><div class='ctx'> 		i_uid_write(inode, le16_to_cpu(dic-&gt;i_uid));</div><div class='ctx'> 		i_gid_write(inode, le16_to_cpu(dic-&gt;i_gid));</div><div class='del'>-		set_nlink(inode, le16_to_cpu(dic-&gt;i_nlink));</div><div class='del'>-</div><div class='del'>-		/* use build time for compact inodes */</div><div class='del'>-		inode-&gt;i_ctime.tv_sec = sbi-&gt;build_time;</div><div class='del'>-		inode-&gt;i_ctime.tv_nsec = sbi-&gt;build_time_nsec;</div><div class='add'>+		if (!S_ISDIR(inode-&gt;i_mode) &amp;&amp;</div><div class='add'>+		    ((ifmt &gt;&gt; EROFS_I_NLINK_1_BIT) &amp; 1)) {</div><div class='add'>+			set_nlink(inode, 1);</div><div class='add'>+			copied.i_nb = dic-&gt;i_nb;</div><div class='add'>+		} else {</div><div class='add'>+			set_nlink(inode, le16_to_cpu(dic-&gt;i_nb.nlink));</div><div class='add'>+			copied.i_nb.startblk_hi = 0;</div><div class='add'>+			addrmask = BIT_ULL(32) - 1;</div><div class='add'>+		}</div><div class='add'>+		inode_set_mtime(inode, sbi-&gt;epoch + le32_to_cpu(dic-&gt;i_mtime),</div><div class='add'>+				sbi-&gt;fixed_nsec);</div><div class='ctx'> </div><div class='ctx'> 		inode-&gt;i_size = le32_to_cpu(dic-&gt;i_size);</div><div class='del'>-		if (erofs_inode_is_data_compressed(vi-&gt;datalayout))</div><div class='del'>-			nblks = le32_to_cpu(dic-&gt;i_u.compressed_blocks);</div><div class='del'>-		else if (vi-&gt;datalayout == EROFS_INODE_CHUNK_BASED)</div><div class='del'>-			vi-&gt;chunkformat = le16_to_cpu(dic-&gt;i_u.c.format);</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='del'>-		erofs_err(inode-&gt;i_sb,</div><div class='del'>-			  "unsupported on-disk inode version %u of nid %llu",</div><div class='add'>+		erofs_err(sb, "unsupported on-disk inode version %u of nid %llu",</div><div class='ctx'> 			  erofs_inode_version(ifmt), vi-&gt;nid);</div><div class='ctx'> 		err = -EOPNOTSUPP;</div><div class='ctx'> 		goto err_out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (unlikely(inode-&gt;i_size &lt; 0)) {</div><div class='add'>+		erofs_err(sb, "negative i_size @ nid %llu", vi-&gt;nid);</div><div class='add'>+		err = -EFSCORRUPTED;</div><div class='add'>+		goto err_out;</div><div class='add'>+	}</div><div class='add'>+	switch (inode-&gt;i_mode &amp; S_IFMT) {</div><div class='add'>+	case S_IFDIR:</div><div class='add'>+		vi-&gt;dot_omitted = (ifmt &gt;&gt; EROFS_I_DOT_OMITTED_BIT) &amp; 1;</div><div class='add'>+		fallthrough;</div><div class='add'>+	case S_IFREG:</div><div class='add'>+	case S_IFLNK:</div><div class='add'>+		vi-&gt;startblk = le32_to_cpu(copied.i_u.startblk_lo) |</div><div class='add'>+			((u64)le16_to_cpu(copied.i_nb.startblk_hi) &lt;&lt; 32);</div><div class='add'>+		if (vi-&gt;datalayout == EROFS_INODE_FLAT_PLAIN &amp;&amp;</div><div class='add'>+		    !((vi-&gt;startblk ^ EROFS_NULL_ADDR) &amp; addrmask))</div><div class='add'>+			vi-&gt;startblk = EROFS_NULL_ADDR;</div><div class='add'>+</div><div class='add'>+		if(S_ISLNK(inode-&gt;i_mode)) {</div><div class='add'>+			err = erofs_fill_symlink(inode, ptr, ofs);</div><div class='add'>+			if (err)</div><div class='add'>+				goto err_out;</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='add'>+	case S_IFCHR:</div><div class='add'>+	case S_IFBLK:</div><div class='add'>+		inode-&gt;i_rdev = new_decode_dev(le32_to_cpu(copied.i_u.rdev));</div><div class='add'>+		break;</div><div class='add'>+	case S_IFIFO:</div><div class='add'>+	case S_IFSOCK:</div><div class='add'>+		inode-&gt;i_rdev = 0;</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		erofs_err(sb, "bogus i_mode (%o) @ nid %llu", inode-&gt;i_mode,</div><div class='add'>+			  vi-&gt;nid);</div><div class='add'>+		err = -EFSCORRUPTED;</div><div class='add'>+		goto err_out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (erofs_inode_is_data_compressed(vi-&gt;datalayout))</div><div class='add'>+		inode-&gt;i_blocks = le32_to_cpu(copied.i_u.blocks_lo) &lt;&lt;</div><div class='add'>+					(sb-&gt;s_blocksize_bits - 9);</div><div class='add'>+	else</div><div class='add'>+		inode-&gt;i_blocks = round_up(inode-&gt;i_size, sb-&gt;s_blocksize) &gt;&gt; 9;</div><div class='add'>+</div><div class='ctx'> 	if (vi-&gt;datalayout == EROFS_INODE_CHUNK_BASED) {</div><div class='add'>+		/* fill chunked inode summary info */</div><div class='add'>+		vi-&gt;chunkformat = le16_to_cpu(copied.i_u.c.format);</div><div class='ctx'> 		if (vi-&gt;chunkformat &amp; ~EROFS_CHUNK_FORMAT_ALL) {</div><div class='del'>-			erofs_err(inode-&gt;i_sb,</div><div class='del'>-				  "unsupported chunk format %x of nid %llu",</div><div class='add'>+			erofs_err(sb, "unsupported chunk format %x of nid %llu",</div><div class='ctx'> 				  vi-&gt;chunkformat, vi-&gt;nid);</div><div class='ctx'> 			err = -EOPNOTSUPP;</div><div class='ctx'> 			goto err_out;</div><div class='ctx'> 		}</div><div class='del'>-		vi-&gt;chunkbits = LOG_BLOCK_SIZE +</div><div class='add'>+		vi-&gt;chunkbits = sb-&gt;s_blocksize_bits +</div><div class='ctx'> 			(vi-&gt;chunkformat &amp; EROFS_CHUNK_FORMAT_BLKBITS_MASK);</div><div class='ctx'> 	}</div><div class='del'>-	inode-&gt;i_mtime.tv_sec = inode-&gt;i_ctime.tv_sec;</div><div class='del'>-	inode-&gt;i_atime.tv_sec = inode-&gt;i_ctime.tv_sec;</div><div class='del'>-	inode-&gt;i_mtime.tv_nsec = inode-&gt;i_ctime.tv_nsec;</div><div class='del'>-	inode-&gt;i_atime.tv_nsec = inode-&gt;i_ctime.tv_nsec;</div><div class='add'>+	inode_set_atime_to_ts(inode,</div><div class='add'>+			      inode_set_ctime_to_ts(inode, inode_get_mtime(inode)));</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_flags &amp;= ~S_DAX;</div><div class='ctx'> 	if (test_opt(&amp;sbi-&gt;opt, DAX_ALWAYS) &amp;&amp; S_ISREG(inode-&gt;i_mode) &amp;&amp;</div><div class='del'>-	    vi-&gt;datalayout == EROFS_INODE_FLAT_PLAIN)</div><div class='add'>+	    (vi-&gt;datalayout == EROFS_INODE_FLAT_PLAIN ||</div><div class='add'>+	     vi-&gt;datalayout == EROFS_INODE_CHUNK_BASED))</div><div class='ctx'> 		inode-&gt;i_flags |= S_DAX;</div><div class='del'>-	if (!nblks)</div><div class='del'>-		/* measure inode.i_blocks as generic filesystems */</div><div class='del'>-		inode-&gt;i_blocks = roundup(inode-&gt;i_size, EROFS_BLKSIZ) &gt;&gt; 9;</div><div class='del'>-	else</div><div class='del'>-		inode-&gt;i_blocks = nblks &lt;&lt; LOG_SECTORS_PER_BLOCK;</div><div class='del'>-	return page;</div><div class='del'>-</div><div class='del'>-bogusimode:</div><div class='del'>-	erofs_err(inode-&gt;i_sb, "bogus i_mode (%o) @ nid %llu",</div><div class='del'>-		  inode-&gt;i_mode, vi-&gt;nid);</div><div class='del'>-	err = -EFSCORRUPTED;</div><div class='ctx'> err_out:</div><div class='del'>-	DBG_BUGON(1);</div><div class='del'>-	kfree(copied);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='del'>-	return ERR_PTR(err);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int erofs_fill_symlink(struct inode *inode, void *data,</div><div class='del'>-			      unsigned int m_pofs)</div><div class='del'>-{</div><div class='del'>-	struct erofs_inode *vi = EROFS_I(inode);</div><div class='del'>-	char *lnk;</div><div class='del'>-</div><div class='del'>-	/* if it cannot be handled with fast symlink scheme */</div><div class='del'>-	if (vi-&gt;datalayout != EROFS_INODE_FLAT_INLINE ||</div><div class='del'>-	    inode-&gt;i_size &gt;= PAGE_SIZE) {</div><div class='del'>-		inode-&gt;i_op = &amp;erofs_symlink_iops;</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	lnk = kmalloc(inode-&gt;i_size + 1, GFP_KERNEL);</div><div class='del'>-	if (!lnk)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	m_pofs += vi-&gt;xattr_isize;</div><div class='del'>-	/* inline symlink data shouldn't cross page boundary as well */</div><div class='del'>-	if (m_pofs + inode-&gt;i_size &gt; PAGE_SIZE) {</div><div class='del'>-		kfree(lnk);</div><div class='del'>-		erofs_err(inode-&gt;i_sb,</div><div class='del'>-			  "inline data cross block boundary @ nid %llu",</div><div class='del'>-			  vi-&gt;nid);</div><div class='del'>-		DBG_BUGON(1);</div><div class='del'>-		return -EFSCORRUPTED;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	memcpy(lnk, data + m_pofs, inode-&gt;i_size);</div><div class='del'>-	lnk[inode-&gt;i_size] = '\0';</div><div class='del'>-</div><div class='del'>-	inode-&gt;i_link = lnk;</div><div class='del'>-	inode-&gt;i_op = &amp;erofs_fast_symlink_iops;</div><div class='del'>-	return 0;</div><div class='add'>+	erofs_put_metabuf(&amp;buf);</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int erofs_fill_inode(struct inode *inode, int isdir)</div><div class='add'>+static int erofs_fill_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct erofs_inode *vi = EROFS_I(inode);</div><div class='del'>-	struct page *page;</div><div class='del'>-	unsigned int ofs;</div><div class='del'>-	int err = 0;</div><div class='del'>-</div><div class='del'>-	trace_erofs_fill_inode(inode, isdir);</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='del'>-	/* read inode base data from disk */</div><div class='del'>-	page = erofs_read_inode(inode, &amp;ofs);</div><div class='del'>-	if (IS_ERR(page))</div><div class='del'>-		return PTR_ERR(page);</div><div class='add'>+	trace_erofs_fill_inode(inode);</div><div class='add'>+	err = erofs_read_inode(inode);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='del'>-	/* setup the new inode */</div><div class='ctx'> 	switch (inode-&gt;i_mode &amp; S_IFMT) {</div><div class='ctx'> 	case S_IFREG:</div><div class='ctx'> 		inode-&gt;i_op = &amp;erofs_generic_iops;</div><div class='del'>-		if (erofs_inode_is_data_compressed(vi-&gt;datalayout))</div><div class='del'>-			inode-&gt;i_fop = &amp;generic_ro_fops;</div><div class='del'>-		else</div><div class='del'>-			inode-&gt;i_fop = &amp;erofs_file_fops;</div><div class='add'>+		inode-&gt;i_fop = &amp;erofs_file_fops;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case S_IFDIR:</div><div class='ctx'> 		inode-&gt;i_op = &amp;erofs_dir_iops;</div><div class='ctx'> 		inode-&gt;i_fop = &amp;erofs_dir_fops;</div><div class='add'>+		inode_nohighmem(inode);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case S_IFLNK:</div><div class='del'>-		err = erofs_fill_symlink(inode, page_address(page), ofs);</div><div class='del'>-		if (err)</div><div class='del'>-			goto out_unlock;</div><div class='add'>+		if (inode-&gt;i_link)</div><div class='add'>+			inode-&gt;i_op = &amp;erofs_fast_symlink_iops;</div><div class='add'>+		else</div><div class='add'>+			inode-&gt;i_op = &amp;erofs_symlink_iops;</div><div class='ctx'> 		inode_nohighmem(inode);</div><div class='ctx'> 		break;</div><div class='del'>-	case S_IFCHR:</div><div class='del'>-	case S_IFBLK:</div><div class='del'>-	case S_IFIFO:</div><div class='del'>-	case S_IFSOCK:</div><div class='add'>+	default:</div><div class='ctx'> 		inode-&gt;i_op = &amp;erofs_generic_iops;</div><div class='ctx'> 		init_special_inode(inode, inode-&gt;i_mode, inode-&gt;i_rdev);</div><div class='del'>-		goto out_unlock;</div><div class='del'>-	default:</div><div class='del'>-		err = -EFSCORRUPTED;</div><div class='del'>-		goto out_unlock;</div><div class='add'>+		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	mapping_set_large_folios(inode-&gt;i_mapping);</div><div class='ctx'> 	if (erofs_inode_is_data_compressed(vi-&gt;datalayout)) {</div><div class='del'>-		err = z_erofs_fill_inode(inode);</div><div class='del'>-		goto out_unlock;</div><div class='add'>+#ifdef CONFIG_EROFS_FS_ZIP</div><div class='add'>+		DO_ONCE_LITE_IF(inode-&gt;i_blkbits != PAGE_SHIFT,</div><div class='add'>+			  erofs_info, inode-&gt;i_sb,</div><div class='add'>+			  "EXPERIMENTAL EROFS subpage compressed block support in use. Use at your own risk!");</div><div class='add'>+		inode-&gt;i_mapping-&gt;a_ops = &amp;z_erofs_aops;</div><div class='add'>+#else</div><div class='add'>+		err = -EOPNOTSUPP;</div><div class='add'>+#endif</div><div class='add'>+	} else {</div><div class='add'>+		inode-&gt;i_mapping-&gt;a_ops = &amp;erofs_aops;</div><div class='add'>+#ifdef CONFIG_EROFS_FS_ONDEMAND</div><div class='add'>+		if (erofs_is_fscache_mode(inode-&gt;i_sb))</div><div class='add'>+			inode-&gt;i_mapping-&gt;a_ops = &amp;erofs_fscache_access_aops;</div><div class='add'>+#endif</div><div class='add'>+#ifdef CONFIG_EROFS_FS_BACKED_BY_FILE</div><div class='add'>+		if (erofs_is_fileio_mode(EROFS_SB(inode-&gt;i_sb)))</div><div class='add'>+			inode-&gt;i_mapping-&gt;a_ops = &amp;erofs_fileio_aops;</div><div class='add'>+#endif</div><div class='ctx'> 	}</div><div class='del'>-	inode-&gt;i_mapping-&gt;a_ops = &amp;erofs_raw_access_aops;</div><div class='ctx'> </div><div class='del'>-out_unlock:</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * erofs nid is 64bits, but i_ino is 'unsigned long', therefore</div><div class='del'>- * we should do more for 32-bit platform to find the right inode.</div><div class='add'>+ * ino_t is 32-bits on 32-bit arch. We have to squash the 64-bit value down</div><div class='add'>+ * so that it will fit.</div><div class='ctx'>  */</div><div class='del'>-static int erofs_ilookup_test_actor(struct inode *inode, void *opaque)</div><div class='add'>+static ino_t erofs_squash_ino(struct super_block *sb, erofs_nid_t nid)</div><div class='ctx'> {</div><div class='del'>-	const erofs_nid_t nid = *(erofs_nid_t *)opaque;</div><div class='add'>+	u64 ino64 = erofs_nid_to_ino64(EROFS_SB(sb), nid);</div><div class='ctx'> </div><div class='del'>-	return EROFS_I(inode)-&gt;nid == nid;</div><div class='add'>+	if (sizeof(ino_t) &lt; sizeof(erofs_nid_t))</div><div class='add'>+		ino64 ^= ino64 &gt;&gt; (sizeof(erofs_nid_t) - sizeof(ino_t)) * 8;</div><div class='add'>+	return (ino_t)ino64;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int erofs_iget_set_actor(struct inode *inode, void *opaque)</div><div class='add'>+static int erofs_iget5_eq(struct inode *inode, void *opaque)</div><div class='ctx'> {</div><div class='del'>-	const erofs_nid_t nid = *(erofs_nid_t *)opaque;</div><div class='del'>-</div><div class='del'>-	inode-&gt;i_ino = erofs_inode_hash(nid);</div><div class='del'>-	return 0;</div><div class='add'>+	return EROFS_I(inode)-&gt;nid == *(erofs_nid_t *)opaque;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline struct inode *erofs_iget_locked(struct super_block *sb,</div><div class='del'>-					      erofs_nid_t nid)</div><div class='add'>+static int erofs_iget5_set(struct inode *inode, void *opaque)</div><div class='ctx'> {</div><div class='del'>-	const unsigned long hashval = erofs_inode_hash(nid);</div><div class='add'>+	const erofs_nid_t nid = *(erofs_nid_t *)opaque;</div><div class='ctx'> </div><div class='del'>-	return iget5_locked(sb, hashval, erofs_ilookup_test_actor,</div><div class='del'>-		erofs_iget_set_actor, &amp;nid);</div><div class='add'>+	inode-&gt;i_ino = erofs_squash_ino(inode-&gt;i_sb, nid);</div><div class='add'>+	EROFS_I(inode)-&gt;nid = nid;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct inode *erofs_iget(struct super_block *sb,</div><div class='del'>-			 erofs_nid_t nid,</div><div class='del'>-			 bool isdir)</div><div class='add'>+struct inode *erofs_iget(struct super_block *sb, erofs_nid_t nid)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = erofs_iget_locked(sb, nid);</div><div class='add'>+	struct inode *inode;</div><div class='ctx'> </div><div class='add'>+	inode = iget5_locked(sb, erofs_squash_ino(sb, nid), erofs_iget5_eq,</div><div class='add'>+			     erofs_iget5_set, &amp;nid);</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='del'>-	if (inode-&gt;i_state &amp; I_NEW) {</div><div class='del'>-		int err;</div><div class='del'>-		struct erofs_inode *vi = EROFS_I(inode);</div><div class='del'>-</div><div class='del'>-		vi-&gt;nid = nid;</div><div class='add'>+	if (inode_state_read_once(inode) &amp; I_NEW) {</div><div class='add'>+		int err = erofs_fill_inode(inode);</div><div class='ctx'> </div><div class='del'>-		err = erofs_fill_inode(inode, isdir);</div><div class='del'>-		if (!err)</div><div class='del'>-			unlock_new_inode(inode);</div><div class='del'>-		else {</div><div class='add'>+		if (err) {</div><div class='ctx'> 			iget_failed(inode);</div><div class='del'>-			inode = ERR_PTR(err);</div><div class='add'>+			return ERR_PTR(err);</div><div class='ctx'> 		}</div><div class='add'>+		unlock_new_inode(inode);</div><div class='ctx'> 	}</div><div class='ctx'> 	return inode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int erofs_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='add'>+int erofs_getattr(struct mnt_idmap *idmap, const struct path *path,</div><div class='ctx'> 		  struct kstat *stat, u32 request_mask,</div><div class='ctx'> 		  unsigned int query_flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *const inode = d_inode(path-&gt;dentry);</div><div class='add'>+	struct block_device *bdev = inode-&gt;i_sb-&gt;s_bdev;</div><div class='add'>+	bool compressed =</div><div class='add'>+		erofs_inode_is_data_compressed(EROFS_I(inode)-&gt;datalayout);</div><div class='ctx'> </div><div class='del'>-	if (erofs_inode_is_data_compressed(EROFS_I(inode)-&gt;datalayout))</div><div class='add'>+	if (compressed)</div><div class='ctx'> 		stat-&gt;attributes |= STATX_ATTR_COMPRESSED;</div><div class='del'>-</div><div class='ctx'> 	stat-&gt;attributes |= STATX_ATTR_IMMUTABLE;</div><div class='ctx'> 	stat-&gt;attributes_mask |= (STATX_ATTR_COMPRESSED |</div><div class='ctx'> 				  STATX_ATTR_IMMUTABLE);</div><div class='ctx'> </div><div class='del'>-	generic_fillattr(&amp;init_user_ns, inode, stat);</div><div class='add'>+	/*</div><div class='add'>+	 * Return the DIO alignment restrictions if requested.</div><div class='add'>+	 *</div><div class='add'>+	 * In EROFS, STATX_DIOALIGN is only supported in bdev-based mode</div><div class='add'>+	 * and uncompressed inodes, otherwise we report no DIO support.</div><div class='add'>+	 */</div><div class='add'>+	if ((request_mask &amp; STATX_DIOALIGN) &amp;&amp; S_ISREG(inode-&gt;i_mode)) {</div><div class='add'>+		stat-&gt;result_mask |= STATX_DIOALIGN;</div><div class='add'>+		if (bdev &amp;&amp; !compressed) {</div><div class='add'>+			stat-&gt;dio_mem_align = bdev_dma_alignment(bdev) + 1;</div><div class='add'>+			stat-&gt;dio_offset_align = bdev_logical_block_size(bdev);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	generic_fillattr(idmap, request_mask, inode, stat);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int erofs_ioctl_get_volume_label(struct inode *inode, void __user *arg)</div><div class='add'>+{</div><div class='add'>+	struct erofs_sb_info *sbi = EROFS_I_SB(inode);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (!sbi-&gt;volume_name)</div><div class='add'>+		ret = clear_user(arg, 1);</div><div class='add'>+	else</div><div class='add'>+		ret = copy_to_user(arg, sbi-&gt;volume_name,</div><div class='add'>+				   strlen(sbi-&gt;volume_name));</div><div class='add'>+	return ret ? -EFAULT : 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+long erofs_ioctl(struct file *filp, unsigned int cmd, unsigned long arg)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file_inode(filp);</div><div class='add'>+	void __user *argp = (void __user *)arg;</div><div class='add'>+</div><div class='add'>+	switch (cmd) {</div><div class='add'>+	case FS_IOC_GETFSLABEL:</div><div class='add'>+		return erofs_ioctl_get_volume_label(inode, argp);</div><div class='add'>+	default:</div><div class='add'>+		return -ENOTTY;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_COMPAT</div><div class='add'>+long erofs_compat_ioctl(struct file *filp, unsigned int cmd,</div><div class='add'>+			unsigned long arg)</div><div class='add'>+{</div><div class='add'>+	return erofs_ioctl(filp, cmd, (unsigned long)compat_ptr(arg));</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> const struct inode_operations erofs_generic_iops = {</div><div class='ctx'> 	.getattr = erofs_getattr,</div><div class='ctx'> 	.listxattr = erofs_listxattr,</div><div class='del'>-	.get_acl = erofs_get_acl,</div><div class='add'>+	.get_inode_acl = erofs_get_acl,</div><div class='ctx'> 	.fiemap = erofs_fiemap,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -389,12 +384,12 @@ const struct inode_operations erofs_symlink_iops = {</div><div class='ctx'> 	.get_link = page_get_link,</div><div class='ctx'> 	.getattr = erofs_getattr,</div><div class='ctx'> 	.listxattr = erofs_listxattr,</div><div class='del'>-	.get_acl = erofs_get_acl,</div><div class='add'>+	.get_inode_acl = erofs_get_acl,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct inode_operations erofs_fast_symlink_iops = {</div><div class='ctx'> 	.get_link = simple_get_link,</div><div class='ctx'> 	.getattr = erofs_getattr,</div><div class='ctx'> 	.listxattr = erofs_listxattr,</div><div class='del'>-	.get_acl = erofs_get_acl,</div><div class='add'>+	.get_inode_acl = erofs_get_acl,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/erofs/internal.h b/fs/erofs/internal.h<br/>index 3265688af7f9..f7f622836198 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/erofs/internal.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/internal.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/erofs/internal.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/erofs/internal.h</a></div><div class='hunk'>@@ -8,34 +8,27 @@</div><div class='ctx'> #define __EROFS_INTERNAL_H</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/dax.h&gt;</div><div class='ctx'> #include &lt;linux/dcache.h&gt;</div><div class='ctx'> #include &lt;linux/mm.h&gt;</div><div class='add'>+#include &lt;linux/module.h&gt;</div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='ctx'> #include &lt;linux/bio.h&gt;</div><div class='del'>-#include &lt;linux/buffer_head.h&gt;</div><div class='ctx'> #include &lt;linux/magic.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/vmalloc.h&gt;</div><div class='ctx'> #include &lt;linux/iomap.h&gt;</div><div class='ctx'> #include "erofs_fs.h"</div><div class='ctx'> </div><div class='del'>-/* redefine pr_fmt "erofs: " */</div><div class='del'>-#undef pr_fmt</div><div class='del'>-#define pr_fmt(fmt) "erofs: " fmt</div><div class='del'>-</div><div class='del'>-__printf(3, 4) void _erofs_err(struct super_block *sb,</div><div class='del'>-			       const char *function, const char *fmt, ...);</div><div class='add'>+__printf(2, 3) void _erofs_printk(struct super_block *sb, const char *fmt, ...);</div><div class='ctx'> #define erofs_err(sb, fmt, ...)	\</div><div class='del'>-	_erofs_err(sb, __func__, fmt "\n", ##__VA_ARGS__)</div><div class='del'>-__printf(3, 4) void _erofs_info(struct super_block *sb,</div><div class='del'>-			       const char *function, const char *fmt, ...);</div><div class='add'>+	_erofs_printk(sb, KERN_ERR fmt "\n", ##__VA_ARGS__)</div><div class='ctx'> #define erofs_info(sb, fmt, ...) \</div><div class='del'>-	_erofs_info(sb, __func__, fmt "\n", ##__VA_ARGS__)</div><div class='add'>+	_erofs_printk(sb, KERN_INFO fmt "\n", ##__VA_ARGS__)</div><div class='add'>+</div><div class='ctx'> #ifdef CONFIG_EROFS_FS_DEBUG</div><div class='del'>-#define erofs_dbg(x, ...)       pr_debug(x "\n", ##__VA_ARGS__)</div><div class='ctx'> #define DBG_BUGON               BUG_ON</div><div class='ctx'> #else</div><div class='del'>-#define erofs_dbg(x, ...)       ((void)0)</div><div class='ctx'> #define DBG_BUGON(x)            ((void)(x))</div><div class='ctx'> #endif	/* !CONFIG_EROFS_FS_DEBUG */</div><div class='ctx'> </div><div class='hunk'>@@ -44,28 +37,32 @@ __printf(3, 4) void _erofs_info(struct super_block *sb,</div><div class='ctx'> </div><div class='ctx'> typedef u64 erofs_nid_t;</div><div class='ctx'> typedef u64 erofs_off_t;</div><div class='del'>-/* data type for filesystem-wide blocks number */</div><div class='del'>-typedef u32 erofs_blk_t;</div><div class='add'>+typedef u64 erofs_blk_t;</div><div class='ctx'> </div><div class='ctx'> struct erofs_device_info {</div><div class='ctx'> 	char *path;</div><div class='del'>-	struct block_device *bdev;</div><div class='add'>+	struct erofs_fscache *fscache;</div><div class='add'>+	struct file *file;</div><div class='ctx'> 	struct dax_device *dax_dev;</div><div class='add'>+	u64 fsoff, dax_part_off;</div><div class='ctx'> </div><div class='del'>-	u32 blocks;</div><div class='del'>-	u32 mapped_blkaddr;</div><div class='add'>+	erofs_blk_t blocks;</div><div class='add'>+	erofs_blk_t uniaddr;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+enum {</div><div class='add'>+	EROFS_SYNC_DECOMPRESS_AUTO,</div><div class='add'>+	EROFS_SYNC_DECOMPRESS_FORCE_ON,</div><div class='add'>+	EROFS_SYNC_DECOMPRESS_FORCE_OFF</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct erofs_mount_opts {</div><div class='del'>-#ifdef CONFIG_EROFS_FS_ZIP</div><div class='ctx'> 	/* current strategy of how to use managed cache */</div><div class='ctx'> 	unsigned char cache_strategy;</div><div class='del'>-	/* strategy of sync decompression (false - auto, true - force on) */</div><div class='del'>-	bool readahead_sync_decompress;</div><div class='del'>-</div><div class='add'>+	/* strategy of sync decompression (0 - auto, 1 - force on, 2 - force off) */</div><div class='add'>+	unsigned int sync_decompress;</div><div class='ctx'> 	/* threshold for decompression synchronously */</div><div class='ctx'> 	unsigned int max_sync_decompress_pages;</div><div class='del'>-#endif</div><div class='ctx'> 	unsigned int mount_opt;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -74,11 +71,7 @@ struct erofs_dev_context {</div><div class='ctx'> 	struct rw_semaphore rwsem;</div><div class='ctx'> </div><div class='ctx'> 	unsigned int extra_devices;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct erofs_fs_context {</div><div class='del'>-	struct erofs_mount_opts opt;</div><div class='del'>-	struct erofs_dev_context *devs;</div><div class='add'>+	bool flatdev;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /* all filesystem-wide lz4 configurations */</div><div class='hunk'>@@ -89,7 +82,31 @@ struct erofs_sb_lz4_info {</div><div class='ctx'> 	u16 max_pclusterblks;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+struct erofs_domain {</div><div class='add'>+	refcount_t ref;</div><div class='add'>+	struct list_head list;</div><div class='add'>+	struct fscache_volume *volume;</div><div class='add'>+	char *domain_id;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct erofs_fscache {</div><div class='add'>+	struct fscache_cookie *cookie;</div><div class='add'>+	struct inode *inode;	/* anonymous inode for the blob */</div><div class='add'>+</div><div class='add'>+	/* used for share domain mode */</div><div class='add'>+	struct erofs_domain *domain;</div><div class='add'>+	struct list_head node;</div><div class='add'>+	refcount_t ref;</div><div class='add'>+	char *name;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct erofs_xattr_prefix_item {</div><div class='add'>+	struct erofs_xattr_long_prefix *prefix;</div><div class='add'>+	u8 infix_len;</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> struct erofs_sb_info {</div><div class='add'>+	struct erofs_device_info dif0;</div><div class='ctx'> 	struct erofs_mount_opts opt;	/* options */</div><div class='ctx'> #ifdef CONFIG_EROFS_FS_ZIP</div><div class='ctx'> 	/* list for all registered superblocks, mainly for shrinker */</div><div class='hunk'>@@ -107,33 +124,49 @@ struct erofs_sb_info {</div><div class='ctx'> </div><div class='ctx'> 	struct erofs_sb_lz4_info lz4;</div><div class='ctx'> #endif	/* CONFIG_EROFS_FS_ZIP */</div><div class='add'>+	struct inode *packed_inode;</div><div class='add'>+	struct inode *metabox_inode;</div><div class='ctx'> 	struct erofs_dev_context *devs;</div><div class='del'>-	struct dax_device *dax_dev;</div><div class='ctx'> 	u64 total_blocks;</div><div class='del'>-	u32 primarydevice_blocks;</div><div class='ctx'> </div><div class='ctx'> 	u32 meta_blkaddr;</div><div class='ctx'> #ifdef CONFIG_EROFS_FS_XATTR</div><div class='ctx'> 	u32 xattr_blkaddr;</div><div class='add'>+	u32 xattr_prefix_start;</div><div class='add'>+	u8 xattr_prefix_count;</div><div class='add'>+	struct erofs_xattr_prefix_item *xattr_prefixes;</div><div class='add'>+	unsigned int xattr_filter_reserved;</div><div class='ctx'> #endif</div><div class='ctx'> 	u16 device_id_mask;	/* valid bits of device id to be used */</div><div class='ctx'> </div><div class='del'>-	/* inode slot unit size in bit shift */</div><div class='del'>-	unsigned char islotbits;</div><div class='add'>+	unsigned char islotbits;	/* inode slot unit size in bit shift */</div><div class='add'>+	unsigned char blkszbits;	/* filesystem block size in bit shift */</div><div class='ctx'> </div><div class='ctx'> 	u32 sb_size;			/* total superblock size */</div><div class='del'>-	u32 build_time_nsec;</div><div class='del'>-	u64 build_time;</div><div class='add'>+	u32 fixed_nsec;</div><div class='add'>+	s64 epoch;</div><div class='ctx'> </div><div class='ctx'> 	/* what we really care is nid, rather than ino.. */</div><div class='ctx'> 	erofs_nid_t root_nid;</div><div class='add'>+	erofs_nid_t packed_nid;</div><div class='add'>+	erofs_nid_t metabox_nid;</div><div class='ctx'> 	/* used for statfs, f_files - f_favail */</div><div class='ctx'> 	u64 inos;</div><div class='ctx'> </div><div class='del'>-	u8 uuid[16];                    /* 128-bit uuid for volume */</div><div class='del'>-	u8 volume_name[16];             /* volume name */</div><div class='add'>+	char *volume_name;</div><div class='ctx'> 	u32 feature_compat;</div><div class='ctx'> 	u32 feature_incompat;</div><div class='add'>+</div><div class='add'>+	/* sysfs support */</div><div class='add'>+	struct kobject s_kobj;		/* /sys/fs/erofs/&lt;devname&gt; */</div><div class='add'>+	struct completion s_kobj_unregister;</div><div class='add'>+	erofs_off_t dir_ra_bytes;</div><div class='add'>+</div><div class='add'>+	/* fscache support */</div><div class='add'>+	struct fscache_volume *volume;</div><div class='add'>+	struct erofs_domain *domain;</div><div class='add'>+	char *fsid;</div><div class='add'>+	char *domain_id;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> #define EROFS_SB(sb) ((struct erofs_sb_info *)(sb)-&gt;s_fs_info)</div><div class='hunk'>@@ -144,113 +177,42 @@ struct erofs_sb_info {</div><div class='ctx'> #define EROFS_MOUNT_POSIX_ACL		0x00000020</div><div class='ctx'> #define EROFS_MOUNT_DAX_ALWAYS		0x00000040</div><div class='ctx'> #define EROFS_MOUNT_DAX_NEVER		0x00000080</div><div class='add'>+#define EROFS_MOUNT_DIRECT_IO		0x00000100</div><div class='ctx'> </div><div class='ctx'> #define clear_opt(opt, option)	((opt)-&gt;mount_opt &amp;= ~EROFS_MOUNT_##option)</div><div class='ctx'> #define set_opt(opt, option)	((opt)-&gt;mount_opt |= EROFS_MOUNT_##option)</div><div class='ctx'> #define test_opt(opt, option)	((opt)-&gt;mount_opt &amp; EROFS_MOUNT_##option)</div><div class='ctx'> </div><div class='del'>-enum {</div><div class='del'>-	EROFS_ZIP_CACHE_DISABLED,</div><div class='del'>-	EROFS_ZIP_CACHE_READAHEAD,</div><div class='del'>-	EROFS_ZIP_CACHE_READAROUND</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_EROFS_FS_ZIP</div><div class='del'>-#define EROFS_LOCKED_MAGIC     (INT_MIN | 0xE0F510CCL)</div><div class='del'>-</div><div class='del'>-/* basic unit of the workstation of a super_block */</div><div class='del'>-struct erofs_workgroup {</div><div class='del'>-	/* the workgroup index in the workstation */</div><div class='del'>-	pgoff_t index;</div><div class='del'>-</div><div class='del'>-	/* overall workgroup reference count */</div><div class='del'>-	atomic_t refcount;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-#if defined(CONFIG_SMP)</div><div class='del'>-static inline bool erofs_workgroup_try_to_freeze(struct erofs_workgroup *grp,</div><div class='del'>-						 int val)</div><div class='del'>-{</div><div class='del'>-	preempt_disable();</div><div class='del'>-	if (val != atomic_cmpxchg(&amp;grp-&gt;refcount, val, EROFS_LOCKED_MAGIC)) {</div><div class='del'>-		preempt_enable();</div><div class='del'>-		return false;</div><div class='del'>-	}</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void erofs_workgroup_unfreeze(struct erofs_workgroup *grp,</div><div class='del'>-					    int orig_val)</div><div class='add'>+static inline bool erofs_is_fileio_mode(struct erofs_sb_info *sbi)</div><div class='ctx'> {</div><div class='del'>-	/*</div><div class='del'>-	 * other observers should notice all modifications</div><div class='del'>-	 * in the freezing period.</div><div class='del'>-	 */</div><div class='del'>-	smp_mb();</div><div class='del'>-	atomic_set(&amp;grp-&gt;refcount, orig_val);</div><div class='del'>-	preempt_enable();</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline int erofs_wait_on_workgroup_freezed(struct erofs_workgroup *grp)</div><div class='del'>-{</div><div class='del'>-	return atomic_cond_read_relaxed(&amp;grp-&gt;refcount,</div><div class='del'>-					VAL != EROFS_LOCKED_MAGIC);</div><div class='del'>-}</div><div class='del'>-#else</div><div class='del'>-static inline bool erofs_workgroup_try_to_freeze(struct erofs_workgroup *grp,</div><div class='del'>-						 int val)</div><div class='del'>-{</div><div class='del'>-	preempt_disable();</div><div class='del'>-	/* no need to spin on UP platforms, let's just disable preemption. */</div><div class='del'>-	if (val != atomic_read(&amp;grp-&gt;refcount)) {</div><div class='del'>-		preempt_enable();</div><div class='del'>-		return false;</div><div class='del'>-	}</div><div class='del'>-	return true;</div><div class='add'>+	return IS_ENABLED(CONFIG_EROFS_FS_BACKED_BY_FILE) &amp;&amp; sbi-&gt;dif0.file;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void erofs_workgroup_unfreeze(struct erofs_workgroup *grp,</div><div class='del'>-					    int orig_val)</div><div class='add'>+static inline bool erofs_is_fscache_mode(struct super_block *sb)</div><div class='ctx'> {</div><div class='del'>-	preempt_enable();</div><div class='add'>+	return IS_ENABLED(CONFIG_EROFS_FS_ONDEMAND) &amp;&amp;</div><div class='add'>+			!erofs_is_fileio_mode(EROFS_SB(sb)) &amp;&amp; !sb-&gt;s_bdev;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int erofs_wait_on_workgroup_freezed(struct erofs_workgroup *grp)</div><div class='del'>-{</div><div class='del'>-	int v = atomic_read(&amp;grp-&gt;refcount);</div><div class='del'>-</div><div class='del'>-	/* workgroup is never freezed on uniprocessor systems */</div><div class='del'>-	DBG_BUGON(v == EROFS_LOCKED_MAGIC);</div><div class='del'>-	return v;</div><div class='del'>-}</div><div class='del'>-#endif	/* !CONFIG_SMP */</div><div class='del'>-#endif	/* !CONFIG_EROFS_FS_ZIP */</div><div class='del'>-</div><div class='del'>-/* we strictly follow PAGE_SIZE and no buffer head yet */</div><div class='del'>-#define LOG_BLOCK_SIZE		PAGE_SHIFT</div><div class='del'>-</div><div class='del'>-#undef LOG_SECTORS_PER_BLOCK</div><div class='del'>-#define LOG_SECTORS_PER_BLOCK	(PAGE_SHIFT - 9)</div><div class='del'>-</div><div class='del'>-#undef SECTORS_PER_BLOCK</div><div class='del'>-#define SECTORS_PER_BLOCK	(1 &lt;&lt; SECTORS_PER_BLOCK)</div><div class='del'>-</div><div class='del'>-#define EROFS_BLKSIZ		(1 &lt;&lt; LOG_BLOCK_SIZE)</div><div class='del'>-</div><div class='del'>-#if (EROFS_BLKSIZ % 4096 || !EROFS_BLKSIZ)</div><div class='del'>-#error erofs cannot be used in this platform</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-#define ROOT_NID(sb)		((sb)-&gt;root_nid)</div><div class='add'>+enum {</div><div class='add'>+	EROFS_ZIP_CACHE_DISABLED,</div><div class='add'>+	EROFS_ZIP_CACHE_READAHEAD,</div><div class='add'>+	EROFS_ZIP_CACHE_READAROUND</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-#define erofs_blknr(addr)       ((addr) / EROFS_BLKSIZ)</div><div class='del'>-#define erofs_blkoff(addr)      ((addr) % EROFS_BLKSIZ)</div><div class='del'>-#define blknr_to_addr(nr)       ((erofs_off_t)(nr) * EROFS_BLKSIZ)</div><div class='add'>+struct erofs_buf {</div><div class='add'>+	struct address_space *mapping;</div><div class='add'>+	struct file *file;</div><div class='add'>+	u64 off;</div><div class='add'>+	struct page *page;</div><div class='add'>+	void *base;</div><div class='add'>+};</div><div class='add'>+#define __EROFS_BUF_INITIALIZER	((struct erofs_buf){ .page = NULL })</div><div class='ctx'> </div><div class='del'>-static inline erofs_off_t iloc(struct erofs_sb_info *sbi, erofs_nid_t nid)</div><div class='del'>-{</div><div class='del'>-	return blknr_to_addr(sbi-&gt;meta_blkaddr) + (nid &lt;&lt; sbi-&gt;islotbits);</div><div class='del'>-}</div><div class='add'>+#define erofs_blknr(sb, pos)	((erofs_blk_t)((pos) &gt;&gt; (sb)-&gt;s_blocksize_bits))</div><div class='add'>+#define erofs_blkoff(sb, pos)	((pos) &amp; ((sb)-&gt;s_blocksize - 1))</div><div class='add'>+#define erofs_pos(sb, blk)	((erofs_off_t)(blk) &lt;&lt; (sb)-&gt;s_blocksize_bits)</div><div class='add'>+#define erofs_iblks(i)	(round_up((i)-&gt;i_size, i_blocksize(i)) &gt;&gt; (i)-&gt;i_blkbits)</div><div class='ctx'> </div><div class='ctx'> #define EROFS_FEATURE_FUNCS(name, compat, feature) \</div><div class='ctx'> static inline bool erofs_sb_has_##name(struct erofs_sb_info *sbi) \</div><div class='hunk'>@@ -258,11 +220,39 @@ static inline bool erofs_sb_has_##name(struct erofs_sb_info *sbi) \</div><div class='ctx'> 	return sbi-&gt;feature_##compat &amp; EROFS_FEATURE_##feature; \</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-EROFS_FEATURE_FUNCS(lz4_0padding, incompat, INCOMPAT_LZ4_0PADDING)</div><div class='add'>+EROFS_FEATURE_FUNCS(zero_padding, incompat, INCOMPAT_ZERO_PADDING)</div><div class='ctx'> EROFS_FEATURE_FUNCS(compr_cfgs, incompat, INCOMPAT_COMPR_CFGS)</div><div class='ctx'> EROFS_FEATURE_FUNCS(big_pcluster, incompat, INCOMPAT_BIG_PCLUSTER)</div><div class='add'>+EROFS_FEATURE_FUNCS(chunked_file, incompat, INCOMPAT_CHUNKED_FILE)</div><div class='ctx'> EROFS_FEATURE_FUNCS(device_table, incompat, INCOMPAT_DEVICE_TABLE)</div><div class='add'>+EROFS_FEATURE_FUNCS(compr_head2, incompat, INCOMPAT_COMPR_HEAD2)</div><div class='add'>+EROFS_FEATURE_FUNCS(ztailpacking, incompat, INCOMPAT_ZTAILPACKING)</div><div class='add'>+EROFS_FEATURE_FUNCS(fragments, incompat, INCOMPAT_FRAGMENTS)</div><div class='add'>+EROFS_FEATURE_FUNCS(dedupe, incompat, INCOMPAT_DEDUPE)</div><div class='add'>+EROFS_FEATURE_FUNCS(xattr_prefixes, incompat, INCOMPAT_XATTR_PREFIXES)</div><div class='add'>+EROFS_FEATURE_FUNCS(48bit, incompat, INCOMPAT_48BIT)</div><div class='add'>+EROFS_FEATURE_FUNCS(metabox, incompat, INCOMPAT_METABOX)</div><div class='ctx'> EROFS_FEATURE_FUNCS(sb_chksum, compat, COMPAT_SB_CHKSUM)</div><div class='add'>+EROFS_FEATURE_FUNCS(xattr_filter, compat, COMPAT_XATTR_FILTER)</div><div class='add'>+EROFS_FEATURE_FUNCS(shared_ea_in_metabox, compat, COMPAT_SHARED_EA_IN_METABOX)</div><div class='add'>+EROFS_FEATURE_FUNCS(plain_xattr_pfx, compat, COMPAT_PLAIN_XATTR_PFX)</div><div class='add'>+</div><div class='add'>+static inline u64 erofs_nid_to_ino64(struct erofs_sb_info *sbi, erofs_nid_t nid)</div><div class='add'>+{</div><div class='add'>+	if (!erofs_sb_has_metabox(sbi))</div><div class='add'>+		return nid;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * When metadata compression is enabled, avoid generating excessively</div><div class='add'>+	 * large inode numbers for metadata-compressed inodes.  Shift NIDs in</div><div class='add'>+	 * the 31-62 bit range left by one and move the metabox flag to bit 31.</div><div class='add'>+	 *</div><div class='add'>+	 * Note: on-disk NIDs remain unchanged as they are primarily used for</div><div class='add'>+	 * compatibility with non-LFS 32-bit applications.</div><div class='add'>+	 */</div><div class='add'>+	return ((nid &lt;&lt; 1) &amp; GENMASK_ULL(63, 32)) | (nid &amp; GENMASK(30, 0)) |</div><div class='add'>+		((nid &gt;&gt; EROFS_DIRENT_NID_METABOX_BIT) &lt;&lt; 31);</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /* atomic flag definitions */</div><div class='ctx'> #define EROFS_I_EA_INITED_BIT	0</div><div class='hunk'>@@ -272,6 +262,9 @@ EROFS_FEATURE_FUNCS(sb_chksum, compat, COMPAT_SB_CHKSUM)</div><div class='ctx'> #define EROFS_I_BL_XATTR_BIT	(BITS_PER_LONG - 1)</div><div class='ctx'> #define EROFS_I_BL_Z_BIT	(BITS_PER_LONG - 2)</div><div class='ctx'> </div><div class='add'>+/* default readahead size of directories */</div><div class='add'>+#define EROFS_DIR_RA_BYTES	16384</div><div class='add'>+</div><div class='ctx'> struct erofs_inode {</div><div class='ctx'> 	erofs_nid_t nid;</div><div class='ctx'> </div><div class='hunk'>@@ -280,13 +273,15 @@ struct erofs_inode {</div><div class='ctx'> </div><div class='ctx'> 	unsigned char datalayout;</div><div class='ctx'> 	unsigned char inode_isize;</div><div class='del'>-	unsigned short xattr_isize;</div><div class='add'>+	bool dot_omitted;</div><div class='add'>+	unsigned int xattr_isize;</div><div class='ctx'> </div><div class='add'>+	unsigned int xattr_name_filter;</div><div class='ctx'> 	unsigned int xattr_shared_count;</div><div class='ctx'> 	unsigned int *xattr_shared_xattrs;</div><div class='ctx'> </div><div class='ctx'> 	union {</div><div class='del'>-		erofs_blk_t raw_blkaddr;</div><div class='add'>+		erofs_blk_t startblk;</div><div class='ctx'> 		struct {</div><div class='ctx'> 			unsigned short	chunkformat;</div><div class='ctx'> 			unsigned char	chunkbits;</div><div class='hunk'>@@ -295,7 +290,13 @@ struct erofs_inode {</div><div class='ctx'> 		struct {</div><div class='ctx'> 			unsigned short z_advise;</div><div class='ctx'> 			unsigned char  z_algorithmtype[2];</div><div class='del'>-			unsigned char  z_logical_clusterbits;</div><div class='add'>+			unsigned char  z_lclusterbits;</div><div class='add'>+			union {</div><div class='add'>+				u64    z_tailextent_headlcn;</div><div class='add'>+				u64    z_extents;</div><div class='add'>+			};</div><div class='add'>+			erofs_off_t    z_fragmentoff;</div><div class='add'>+			unsigned short z_idata_size;</div><div class='ctx'> 		};</div><div class='ctx'> #endif	/* CONFIG_EROFS_FS_ZIP */</div><div class='ctx'> 	};</div><div class='hunk'>@@ -303,179 +304,138 @@ struct erofs_inode {</div><div class='ctx'> 	struct inode vfs_inode;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-#define EROFS_I(ptr)	\</div><div class='del'>-	container_of(ptr, struct erofs_inode, vfs_inode)</div><div class='add'>+#define EROFS_I(ptr)	container_of(ptr, struct erofs_inode, vfs_inode)</div><div class='ctx'> </div><div class='del'>-static inline unsigned long erofs_inode_datablocks(struct inode *inode)</div><div class='add'>+static inline bool erofs_inode_in_metabox(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	/* since i_size cannot be changed */</div><div class='del'>-	return DIV_ROUND_UP(inode-&gt;i_size, EROFS_BLKSIZ);</div><div class='add'>+	return EROFS_I(inode)-&gt;nid &amp; BIT_ULL(EROFS_DIRENT_NID_METABOX_BIT);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline unsigned int erofs_bitrange(unsigned int value, unsigned int bit,</div><div class='del'>-					  unsigned int bits)</div><div class='add'>+static inline erofs_off_t erofs_iloc(struct inode *inode)</div><div class='ctx'> {</div><div class='add'>+	struct erofs_sb_info *sbi = EROFS_I_SB(inode);</div><div class='add'>+	erofs_nid_t nid_lo = EROFS_I(inode)-&gt;nid &amp; EROFS_DIRENT_NID_MASK;</div><div class='ctx'> </div><div class='del'>-	return (value &gt;&gt; bit) &amp; ((1 &lt;&lt; bits) - 1);</div><div class='add'>+	if (erofs_inode_in_metabox(inode))</div><div class='add'>+		return nid_lo &lt;&lt; sbi-&gt;islotbits;</div><div class='add'>+	return erofs_pos(inode-&gt;i_sb, sbi-&gt;meta_blkaddr) +</div><div class='add'>+		(nid_lo &lt;&lt; sbi-&gt;islotbits);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-</div><div class='del'>-static inline unsigned int erofs_inode_version(unsigned int value)</div><div class='add'>+static inline unsigned int erofs_inode_version(unsigned int ifmt)</div><div class='ctx'> {</div><div class='del'>-	return erofs_bitrange(value, EROFS_I_VERSION_BIT,</div><div class='del'>-			      EROFS_I_VERSION_BITS);</div><div class='add'>+	return (ifmt &gt;&gt; EROFS_I_VERSION_BIT) &amp; EROFS_I_VERSION_MASK;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline unsigned int erofs_inode_datalayout(unsigned int value)</div><div class='add'>+static inline unsigned int erofs_inode_datalayout(unsigned int ifmt)</div><div class='ctx'> {</div><div class='del'>-	return erofs_bitrange(value, EROFS_I_DATALAYOUT_BIT,</div><div class='del'>-			      EROFS_I_DATALAYOUT_BITS);</div><div class='add'>+	return (ifmt &gt;&gt; EROFS_I_DATALAYOUT_BIT) &amp; EROFS_I_DATALAYOUT_MASK;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Different from grab_cache_page_nowait(), reclaiming is never triggered</div><div class='del'>- * when allocating new pages.</div><div class='del'>- */</div><div class='del'>-static inline</div><div class='del'>-struct page *erofs_grab_cache_page_nowait(struct address_space *mapping,</div><div class='del'>-					  pgoff_t index)</div><div class='add'>+/* reclaiming is never triggered when allocating new folios. */</div><div class='add'>+static inline struct folio *erofs_grab_folio_nowait(struct address_space *as,</div><div class='add'>+						    pgoff_t index)</div><div class='ctx'> {</div><div class='del'>-	return pagecache_get_page(mapping, index,</div><div class='add'>+	return __filemap_get_folio(as, index,</div><div class='ctx'> 			FGP_LOCK|FGP_CREAT|FGP_NOFS|FGP_NOWAIT,</div><div class='del'>-			readahead_gfp_mask(mapping) &amp; ~__GFP_RECLAIM);</div><div class='add'>+			readahead_gfp_mask(as) &amp; ~__GFP_RECLAIM);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-extern const struct super_operations erofs_sops;</div><div class='del'>-</div><div class='del'>-extern const struct address_space_operations erofs_raw_access_aops;</div><div class='del'>-extern const struct address_space_operations z_erofs_aops;</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Logical to physical block mapping</div><div class='del'>- *</div><div class='del'>- * Different with other file systems, it is used for 2 access modes:</div><div class='del'>- *</div><div class='del'>- * 1) RAW access mode:</div><div class='del'>- *</div><div class='del'>- * Users pass a valid (m_lblk, m_lofs -- usually 0) pair,</div><div class='del'>- * and get the valid m_pblk, m_pofs and the longest m_len(in bytes).</div><div class='del'>- *</div><div class='del'>- * Note that m_lblk in the RAW access mode refers to the number of</div><div class='del'>- * the compressed ondisk block rather than the uncompressed</div><div class='del'>- * in-memory block for the compressed file.</div><div class='del'>- *</div><div class='del'>- * m_pofs equals to m_lofs except for the inline data page.</div><div class='del'>- *</div><div class='del'>- * 2) Normal access mode:</div><div class='del'>- *</div><div class='del'>- * If the inode is not compressed, it has no difference with</div><div class='del'>- * the RAW access mode. However, if the inode is compressed,</div><div class='del'>- * users should pass a valid (m_lblk, m_lofs) pair, and get</div><div class='del'>- * the needed m_pblk, m_pofs, m_len to get the compressed data</div><div class='del'>- * and the updated m_lblk, m_lofs which indicates the start</div><div class='del'>- * of the corresponding uncompressed data in the file.</div><div class='del'>- */</div><div class='del'>-enum {</div><div class='del'>-	BH_Encoded = BH_PrivateStart,</div><div class='del'>-	BH_FullMapped,</div><div class='del'>-};</div><div class='del'>-</div><div class='ctx'> /* Has a disk mapping */</div><div class='del'>-#define EROFS_MAP_MAPPED	(1 &lt;&lt; BH_Mapped)</div><div class='add'>+#define EROFS_MAP_MAPPED	0x0001</div><div class='ctx'> /* Located in metadata (could be copied from bd_inode) */</div><div class='del'>-#define EROFS_MAP_META		(1 &lt;&lt; BH_Meta)</div><div class='add'>+#define EROFS_MAP_META		0x0002</div><div class='ctx'> /* The extent is encoded */</div><div class='del'>-#define EROFS_MAP_ENCODED	(1 &lt;&lt; BH_Encoded)</div><div class='add'>+#define EROFS_MAP_ENCODED	0x0004</div><div class='ctx'> /* The length of extent is full */</div><div class='del'>-#define EROFS_MAP_FULL_MAPPED	(1 &lt;&lt; BH_FullMapped)</div><div class='add'>+#define EROFS_MAP_FULL_MAPPED	0x0008</div><div class='add'>+/* Located in the special packed inode */</div><div class='add'>+#define __EROFS_MAP_FRAGMENT	0x0010</div><div class='add'>+/* The extent refers to partial decompressed data */</div><div class='add'>+#define EROFS_MAP_PARTIAL_REF	0x0020</div><div class='add'>+</div><div class='add'>+#define EROFS_MAP_FRAGMENT	(EROFS_MAP_MAPPED | __EROFS_MAP_FRAGMENT)</div><div class='ctx'> </div><div class='ctx'> struct erofs_map_blocks {</div><div class='add'>+	struct erofs_buf buf;</div><div class='add'>+</div><div class='ctx'> 	erofs_off_t m_pa, m_la;</div><div class='ctx'> 	u64 m_plen, m_llen;</div><div class='ctx'> </div><div class='ctx'> 	unsigned short m_deviceid;</div><div class='ctx'> 	char m_algorithmformat;</div><div class='ctx'> 	unsigned int m_flags;</div><div class='del'>-</div><div class='del'>-	struct page *mpage;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/* Flags used by erofs_map_blocks_flatmode() */</div><div class='del'>-#define EROFS_GET_BLOCKS_RAW    0x0001</div><div class='ctx'> /*</div><div class='ctx'>  * Used to get the exact decompressed length, e.g. fiemap (consider lookback</div><div class='ctx'>  * approach instead if possible since it's more metadata lightweight.)</div><div class='ctx'>  */</div><div class='del'>-#define EROFS_GET_BLOCKS_FIEMAP	0x0002</div><div class='add'>+#define EROFS_GET_BLOCKS_FIEMAP		0x0001</div><div class='ctx'> /* Used to map the whole extent if non-negligible data is requested for LZMA */</div><div class='del'>-#define EROFS_GET_BLOCKS_READMORE	0x0004</div><div class='add'>+#define EROFS_GET_BLOCKS_READMORE	0x0002</div><div class='add'>+/* Used to map tail extent for tailpacking inline or fragment pcluster */</div><div class='add'>+#define EROFS_GET_BLOCKS_FINDTAIL	0x0004</div><div class='ctx'> </div><div class='ctx'> enum {</div><div class='ctx'> 	Z_EROFS_COMPRESSION_SHIFTED = Z_EROFS_COMPRESSION_MAX,</div><div class='add'>+	Z_EROFS_COMPRESSION_INTERLACED,</div><div class='ctx'> 	Z_EROFS_COMPRESSION_RUNTIME_MAX</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/* zmap.c */</div><div class='del'>-extern const struct iomap_ops z_erofs_iomap_report_ops;</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_EROFS_FS_ZIP</div><div class='del'>-int z_erofs_fill_inode(struct inode *inode);</div><div class='del'>-int z_erofs_map_blocks_iter(struct inode *inode,</div><div class='del'>-			    struct erofs_map_blocks *map,</div><div class='del'>-			    int flags);</div><div class='del'>-#else</div><div class='del'>-static inline int z_erofs_fill_inode(struct inode *inode) { return -EOPNOTSUPP; }</div><div class='del'>-static inline int z_erofs_map_blocks_iter(struct inode *inode,</div><div class='del'>-					  struct erofs_map_blocks *map,</div><div class='del'>-					  int flags)</div><div class='del'>-{</div><div class='del'>-	return -EOPNOTSUPP;</div><div class='del'>-}</div><div class='del'>-#endif	/* !CONFIG_EROFS_FS_ZIP */</div><div class='del'>-</div><div class='ctx'> struct erofs_map_dev {</div><div class='add'>+	struct super_block *m_sb;</div><div class='add'>+	struct erofs_device_info *m_dif;</div><div class='ctx'> 	struct block_device *m_bdev;</div><div class='del'>-	struct dax_device *m_daxdev;</div><div class='ctx'> </div><div class='ctx'> 	erofs_off_t m_pa;</div><div class='ctx'> 	unsigned int m_deviceid;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/* data.c */</div><div class='del'>-extern const struct file_operations erofs_file_fops;</div><div class='del'>-struct page *erofs_get_meta_page(struct super_block *sb, erofs_blk_t blkaddr);</div><div class='del'>-int erofs_map_dev(struct super_block *sb, struct erofs_map_dev *dev);</div><div class='del'>-int erofs_fiemap(struct inode *inode, struct fiemap_extent_info *fieinfo,</div><div class='del'>-		 u64 start, u64 len);</div><div class='add'>+extern const struct super_operations erofs_sops;</div><div class='ctx'> </div><div class='del'>-/* inode.c */</div><div class='del'>-static inline unsigned long erofs_inode_hash(erofs_nid_t nid)</div><div class='del'>-{</div><div class='del'>-#if BITS_PER_LONG == 32</div><div class='del'>-	return (nid &gt;&gt; 32) ^ (nid &amp; 0xffffffff);</div><div class='del'>-#else</div><div class='del'>-	return nid;</div><div class='del'>-#endif</div><div class='del'>-}</div><div class='add'>+extern const struct address_space_operations erofs_aops;</div><div class='add'>+extern const struct address_space_operations erofs_fileio_aops;</div><div class='add'>+extern const struct address_space_operations z_erofs_aops;</div><div class='add'>+extern const struct address_space_operations erofs_fscache_access_aops;</div><div class='ctx'> </div><div class='ctx'> extern const struct inode_operations erofs_generic_iops;</div><div class='ctx'> extern const struct inode_operations erofs_symlink_iops;</div><div class='ctx'> extern const struct inode_operations erofs_fast_symlink_iops;</div><div class='add'>+extern const struct inode_operations erofs_dir_iops;</div><div class='ctx'> </div><div class='del'>-struct inode *erofs_iget(struct super_block *sb, erofs_nid_t nid, bool dir);</div><div class='del'>-int erofs_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='del'>-		  struct kstat *stat, u32 request_mask,</div><div class='del'>-		  unsigned int query_flags);</div><div class='add'>+extern const struct file_operations erofs_file_fops;</div><div class='add'>+extern const struct file_operations erofs_dir_fops;</div><div class='ctx'> </div><div class='del'>-/* namei.c */</div><div class='del'>-extern const struct inode_operations erofs_dir_iops;</div><div class='add'>+extern const struct iomap_ops z_erofs_iomap_report_ops;</div><div class='ctx'> </div><div class='del'>-int erofs_namei(struct inode *dir, struct qstr *name,</div><div class='add'>+/* flags for erofs_fscache_register_cookie() */</div><div class='add'>+#define EROFS_REG_COOKIE_SHARE		0x0001</div><div class='add'>+#define EROFS_REG_COOKIE_NEED_NOEXIST	0x0002</div><div class='add'>+</div><div class='add'>+void *erofs_read_metadata(struct super_block *sb, struct erofs_buf *buf,</div><div class='add'>+			  erofs_off_t *offset, int *lengthp);</div><div class='add'>+void erofs_unmap_metabuf(struct erofs_buf *buf);</div><div class='add'>+void erofs_put_metabuf(struct erofs_buf *buf);</div><div class='add'>+void *erofs_bread(struct erofs_buf *buf, erofs_off_t offset, bool need_kmap);</div><div class='add'>+int erofs_init_metabuf(struct erofs_buf *buf, struct super_block *sb,</div><div class='add'>+		       bool in_metabox);</div><div class='add'>+void *erofs_read_metabuf(struct erofs_buf *buf, struct super_block *sb,</div><div class='add'>+			 erofs_off_t offset, bool in_metabox);</div><div class='add'>+int erofs_map_dev(struct super_block *sb, struct erofs_map_dev *dev);</div><div class='add'>+int erofs_fiemap(struct inode *inode, struct fiemap_extent_info *fieinfo,</div><div class='add'>+		 u64 start, u64 len);</div><div class='add'>+int erofs_map_blocks(struct inode *inode, struct erofs_map_blocks *map);</div><div class='add'>+void erofs_onlinefolio_init(struct folio *folio);</div><div class='add'>+void erofs_onlinefolio_split(struct folio *folio);</div><div class='add'>+void erofs_onlinefolio_end(struct folio *folio, int err, bool dirty);</div><div class='add'>+struct inode *erofs_iget(struct super_block *sb, erofs_nid_t nid);</div><div class='add'>+int erofs_getattr(struct mnt_idmap *idmap, const struct path *path,</div><div class='add'>+		  struct kstat *stat, u32 request_mask,</div><div class='add'>+		  unsigned int query_flags);</div><div class='add'>+int erofs_namei(struct inode *dir, const struct qstr *name,</div><div class='ctx'> 		erofs_nid_t *nid, unsigned int *d_type);</div><div class='ctx'> </div><div class='del'>-/* dir.c */</div><div class='del'>-extern const struct file_operations erofs_dir_fops;</div><div class='del'>-</div><div class='ctx'> static inline void *erofs_vm_map_ram(struct page **pages, unsigned int count)</div><div class='ctx'> {</div><div class='ctx'> 	int retried = 0;</div><div class='hunk'>@@ -491,17 +451,17 @@ static inline void *erofs_vm_map_ram(struct page **pages, unsigned int count)</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* pcpubuf.c */</div><div class='del'>-void *erofs_get_pcpubuf(unsigned int requiredpages);</div><div class='del'>-void erofs_put_pcpubuf(void *ptr);</div><div class='del'>-int erofs_pcpubuf_growsize(unsigned int nrpages);</div><div class='del'>-void erofs_pcpubuf_init(void);</div><div class='del'>-void erofs_pcpubuf_exit(void);</div><div class='del'>-</div><div class='del'>-/* utils.c / zdata.c */</div><div class='del'>-struct page *erofs_allocpage(struct page **pagepool, gfp_t gfp);</div><div class='del'>-static inline void erofs_pagepool_add(struct page **pagepool,</div><div class='del'>-		struct page *page)</div><div class='add'>+int erofs_register_sysfs(struct super_block *sb);</div><div class='add'>+void erofs_unregister_sysfs(struct super_block *sb);</div><div class='add'>+int __init erofs_init_sysfs(void);</div><div class='add'>+void erofs_exit_sysfs(void);</div><div class='add'>+</div><div class='add'>+struct page *__erofs_allocpage(struct page **pagepool, gfp_t gfp, bool tryrsv);</div><div class='add'>+static inline struct page *erofs_allocpage(struct page **pagepool, gfp_t gfp)</div><div class='add'>+{</div><div class='add'>+	return __erofs_allocpage(pagepool, gfp, false);</div><div class='add'>+}</div><div class='add'>+static inline void erofs_pagepool_add(struct page **pagepool, struct page *page)</div><div class='ctx'> {</div><div class='ctx'> 	set_page_private(page, (unsigned long)*pagepool);</div><div class='ctx'> 	*pagepool = page;</div><div class='hunk'>@@ -509,62 +469,77 @@ static inline void erofs_pagepool_add(struct page **pagepool,</div><div class='ctx'> void erofs_release_pages(struct page **pagepool);</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_EROFS_FS_ZIP</div><div class='del'>-int erofs_workgroup_put(struct erofs_workgroup *grp);</div><div class='del'>-struct erofs_workgroup *erofs_find_workgroup(struct super_block *sb,</div><div class='del'>-					     pgoff_t index);</div><div class='del'>-struct erofs_workgroup *erofs_insert_workgroup(struct super_block *sb,</div><div class='del'>-					       struct erofs_workgroup *grp);</div><div class='del'>-void erofs_workgroup_free_rcu(struct erofs_workgroup *grp);</div><div class='add'>+#define MNGD_MAPPING(sbi)	((sbi)-&gt;managed_cache-&gt;i_mapping)</div><div class='add'>+</div><div class='add'>+extern atomic_long_t erofs_global_shrink_cnt;</div><div class='ctx'> void erofs_shrinker_register(struct super_block *sb);</div><div class='ctx'> void erofs_shrinker_unregister(struct super_block *sb);</div><div class='ctx'> int __init erofs_init_shrinker(void);</div><div class='ctx'> void erofs_exit_shrinker(void);</div><div class='del'>-int __init z_erofs_init_zip_subsystem(void);</div><div class='del'>-void z_erofs_exit_zip_subsystem(void);</div><div class='del'>-int erofs_try_to_free_all_cached_pages(struct erofs_sb_info *sbi,</div><div class='del'>-				       struct erofs_workgroup *egrp);</div><div class='del'>-int erofs_try_to_free_cached_page(struct page *page);</div><div class='del'>-int z_erofs_load_lz4_config(struct super_block *sb,</div><div class='del'>-			    struct erofs_super_block *dsb,</div><div class='del'>-			    struct z_erofs_lz4_cfgs *lz4, int len);</div><div class='add'>+int __init z_erofs_init_subsystem(void);</div><div class='add'>+void z_erofs_exit_subsystem(void);</div><div class='add'>+int z_erofs_init_super(struct super_block *sb);</div><div class='add'>+unsigned long z_erofs_shrink_scan(struct erofs_sb_info *sbi,</div><div class='add'>+				  unsigned long nr_shrink);</div><div class='add'>+int z_erofs_map_blocks_iter(struct inode *inode, struct erofs_map_blocks *map,</div><div class='add'>+			    int flags);</div><div class='add'>+void *z_erofs_get_gbuf(unsigned int requiredpages);</div><div class='add'>+void z_erofs_put_gbuf(void *ptr);</div><div class='add'>+int z_erofs_gbuf_growsize(unsigned int nrpages);</div><div class='add'>+int __init z_erofs_gbuf_init(void);</div><div class='add'>+void z_erofs_gbuf_exit(void);</div><div class='add'>+int z_erofs_parse_cfgs(struct super_block *sb, struct erofs_super_block *dsb);</div><div class='ctx'> #else</div><div class='ctx'> static inline void erofs_shrinker_register(struct super_block *sb) {}</div><div class='ctx'> static inline void erofs_shrinker_unregister(struct super_block *sb) {}</div><div class='ctx'> static inline int erofs_init_shrinker(void) { return 0; }</div><div class='ctx'> static inline void erofs_exit_shrinker(void) {}</div><div class='del'>-static inline int z_erofs_init_zip_subsystem(void) { return 0; }</div><div class='del'>-static inline void z_erofs_exit_zip_subsystem(void) {}</div><div class='del'>-static inline int z_erofs_load_lz4_config(struct super_block *sb,</div><div class='del'>-				  struct erofs_super_block *dsb,</div><div class='del'>-				  struct z_erofs_lz4_cfgs *lz4, int len)</div><div class='del'>-{</div><div class='del'>-	if (lz4 || dsb-&gt;u1.lz4_max_distance) {</div><div class='del'>-		erofs_err(sb, "lz4 algorithm isn't enabled");</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='add'>+static inline int z_erofs_init_subsystem(void) { return 0; }</div><div class='add'>+static inline void z_erofs_exit_subsystem(void) {}</div><div class='add'>+static inline int z_erofs_init_super(struct super_block *sb) { return 0; }</div><div class='ctx'> #endif	/* !CONFIG_EROFS_FS_ZIP */</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_EROFS_FS_ZIP_LZMA</div><div class='del'>-int z_erofs_lzma_init(void);</div><div class='del'>-void z_erofs_lzma_exit(void);</div><div class='del'>-int z_erofs_load_lzma_config(struct super_block *sb,</div><div class='del'>-			     struct erofs_super_block *dsb,</div><div class='del'>-			     struct z_erofs_lzma_cfgs *lzma, int size);</div><div class='add'>+#ifdef CONFIG_EROFS_FS_BACKED_BY_FILE</div><div class='add'>+struct bio *erofs_fileio_bio_alloc(struct erofs_map_dev *mdev);</div><div class='add'>+void erofs_fileio_submit_bio(struct bio *bio);</div><div class='ctx'> #else</div><div class='del'>-static inline int z_erofs_lzma_init(void) { return 0; }</div><div class='del'>-static inline int z_erofs_lzma_exit(void) { return 0; }</div><div class='del'>-static inline int z_erofs_load_lzma_config(struct super_block *sb,</div><div class='del'>-			     struct erofs_super_block *dsb,</div><div class='del'>-			     struct z_erofs_lzma_cfgs *lzma, int size) {</div><div class='del'>-	if (lzma) {</div><div class='del'>-		erofs_err(sb, "lzma algorithm isn't enabled");</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='add'>+static inline struct bio *erofs_fileio_bio_alloc(struct erofs_map_dev *mdev) { return NULL; }</div><div class='add'>+static inline void erofs_fileio_submit_bio(struct bio *bio) {}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_EROFS_FS_ONDEMAND</div><div class='add'>+int erofs_fscache_register_fs(struct super_block *sb);</div><div class='add'>+void erofs_fscache_unregister_fs(struct super_block *sb);</div><div class='add'>+</div><div class='add'>+struct erofs_fscache *erofs_fscache_register_cookie(struct super_block *sb,</div><div class='add'>+					char *name, unsigned int flags);</div><div class='add'>+void erofs_fscache_unregister_cookie(struct erofs_fscache *fscache);</div><div class='add'>+struct bio *erofs_fscache_bio_alloc(struct erofs_map_dev *mdev);</div><div class='add'>+void erofs_fscache_submit_bio(struct bio *bio);</div><div class='add'>+#else</div><div class='add'>+static inline int erofs_fscache_register_fs(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	return -EOPNOTSUPP;</div><div class='ctx'> }</div><div class='del'>-#endif	/* !CONFIG_EROFS_FS_ZIP */</div><div class='add'>+static inline void erofs_fscache_unregister_fs(struct super_block *sb) {}</div><div class='add'>+</div><div class='add'>+static inline</div><div class='add'>+struct erofs_fscache *erofs_fscache_register_cookie(struct super_block *sb,</div><div class='add'>+					char *name, unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	return ERR_PTR(-EOPNOTSUPP);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void erofs_fscache_unregister_cookie(struct erofs_fscache *fscache)</div><div class='add'>+{</div><div class='add'>+}</div><div class='add'>+static inline struct bio *erofs_fscache_bio_alloc(struct erofs_map_dev *mdev) { return NULL; }</div><div class='add'>+static inline void erofs_fscache_submit_bio(struct bio *bio) {}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+long erofs_ioctl(struct file *filp, unsigned int cmd, unsigned long arg);</div><div class='add'>+long erofs_compat_ioctl(struct file *filp, unsigned int cmd,</div><div class='add'>+			unsigned long arg);</div><div class='ctx'> </div><div class='ctx'> #define EFSCORRUPTED    EUCLEAN         /* Filesystem is corrupted */</div><div class='ctx'> </div><div class='head'>diff --git a/fs/erofs/namei.c b/fs/erofs/namei.c<br/>index 8629e616028c..f7cf4f41af28 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/erofs/namei.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/namei.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/erofs/namei.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/erofs/namei.c</a></div><div class='hunk'>@@ -2,9 +2,9 @@</div><div class='ctx'> /*</div><div class='ctx'>  * Copyright (C) 2017-2018 HUAWEI, Inc.</div><div class='ctx'>  *             https://www.huawei.com/</div><div class='add'>+ * Copyright (C) 2022, Alibaba Cloud</div><div class='ctx'>  */</div><div class='ctx'> #include "xattr.h"</div><div class='del'>-</div><div class='ctx'> #include &lt;trace/events/erofs.h&gt;</div><div class='ctx'> </div><div class='ctx'> struct erofs_qstr {</div><div class='hunk'>@@ -86,40 +86,35 @@ static struct erofs_dirent *find_target_dirent(struct erofs_qstr *name,</div><div class='ctx'> 	return ERR_PTR(-ENOENT);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct page *find_target_block_classic(struct inode *dir,</div><div class='del'>-					      struct erofs_qstr *name,</div><div class='del'>-					      int *_ndirents)</div><div class='add'>+static void *erofs_find_target_block(struct erofs_buf *target,</div><div class='add'>+		struct inode *dir, struct erofs_qstr *name, int *_ndirents)</div><div class='ctx'> {</div><div class='del'>-	unsigned int startprfx, endprfx;</div><div class='del'>-	int head, back;</div><div class='del'>-	struct address_space *const mapping = dir-&gt;i_mapping;</div><div class='del'>-	struct page *candidate = ERR_PTR(-ENOENT);</div><div class='del'>-</div><div class='del'>-	startprfx = endprfx = 0;</div><div class='del'>-	head = 0;</div><div class='del'>-	back = erofs_inode_datablocks(dir) - 1;</div><div class='add'>+	unsigned int bsz = i_blocksize(dir);</div><div class='add'>+	int head = 0, back = erofs_iblks(dir) - 1;</div><div class='add'>+	unsigned int startprfx = 0, endprfx = 0;</div><div class='add'>+	void *candidate = ERR_PTR(-ENOENT);</div><div class='ctx'> </div><div class='ctx'> 	while (head &lt;= back) {</div><div class='ctx'> 		const int mid = head + (back - head) / 2;</div><div class='del'>-		struct page *page = read_mapping_page(mapping, mid, NULL);</div><div class='add'>+		struct erofs_buf buf = __EROFS_BUF_INITIALIZER;</div><div class='add'>+		struct erofs_dirent *de;</div><div class='ctx'> </div><div class='del'>-		if (!IS_ERR(page)) {</div><div class='del'>-			struct erofs_dirent *de = kmap_atomic(page);</div><div class='del'>-			const int nameoff = nameoff_from_disk(de-&gt;nameoff,</div><div class='del'>-							      EROFS_BLKSIZ);</div><div class='add'>+		buf.mapping = dir-&gt;i_mapping;</div><div class='add'>+		de = erofs_bread(&amp;buf, erofs_pos(dir-&gt;i_sb, mid), true);</div><div class='add'>+		if (!IS_ERR(de)) {</div><div class='add'>+			const int nameoff = nameoff_from_disk(de-&gt;nameoff, bsz);</div><div class='ctx'> 			const int ndirents = nameoff / sizeof(*de);</div><div class='ctx'> 			int diff;</div><div class='ctx'> 			unsigned int matched;</div><div class='ctx'> 			struct erofs_qstr dname;</div><div class='ctx'> </div><div class='ctx'> 			if (!ndirents) {</div><div class='del'>-				kunmap_atomic(de);</div><div class='del'>-				put_page(page);</div><div class='add'>+				erofs_put_metabuf(&amp;buf);</div><div class='ctx'> 				erofs_err(dir-&gt;i_sb,</div><div class='ctx'> 					  "corrupted dir block %d @ nid %llu",</div><div class='ctx'> 					  mid, EROFS_I(dir)-&gt;nid);</div><div class='ctx'> 				DBG_BUGON(1);</div><div class='del'>-				page = ERR_PTR(-EFSCORRUPTED);</div><div class='add'>+				de = ERR_PTR(-EFSCORRUPTED);</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='hunk'>@@ -127,50 +122,47 @@ static struct page *find_target_block_classic(struct inode *dir,</div><div class='ctx'> </div><div class='ctx'> 			dname.name = (u8 *)de + nameoff;</div><div class='ctx'> 			if (ndirents == 1)</div><div class='del'>-				dname.end = (u8 *)de + EROFS_BLKSIZ;</div><div class='add'>+				dname.end = (u8 *)de + bsz;</div><div class='ctx'> 			else</div><div class='ctx'> 				dname.end = (u8 *)de +</div><div class='del'>-					nameoff_from_disk(de[1].nameoff,</div><div class='del'>-							  EROFS_BLKSIZ);</div><div class='add'>+					nameoff_from_disk(de[1].nameoff, bsz);</div><div class='ctx'> </div><div class='ctx'> 			/* string comparison without already matched prefix */</div><div class='ctx'> 			diff = erofs_dirnamecmp(name, &amp;dname, &amp;matched);</div><div class='del'>-			kunmap_atomic(de);</div><div class='del'>-</div><div class='del'>-			if (!diff) {</div><div class='del'>-				*_ndirents = 0;</div><div class='del'>-				goto out;</div><div class='del'>-			} else if (diff &gt; 0) {</div><div class='del'>-				head = mid + 1;</div><div class='del'>-				startprfx = matched;</div><div class='del'>-</div><div class='del'>-				if (!IS_ERR(candidate))</div><div class='del'>-					put_page(candidate);</div><div class='del'>-				candidate = page;</div><div class='del'>-				*_ndirents = ndirents;</div><div class='del'>-			} else {</div><div class='del'>-				put_page(page);</div><div class='ctx'> </div><div class='add'>+			if (diff &lt; 0) {</div><div class='add'>+				erofs_put_metabuf(&amp;buf);</div><div class='ctx'> 				back = mid - 1;</div><div class='ctx'> 				endprfx = matched;</div><div class='add'>+				continue;</div><div class='ctx'> 			}</div><div class='add'>+</div><div class='add'>+			if (!IS_ERR(candidate))</div><div class='add'>+				erofs_put_metabuf(target);</div><div class='add'>+			*target = buf;</div><div class='add'>+			if (!diff) {</div><div class='add'>+				*_ndirents = 0;</div><div class='add'>+				return de;</div><div class='add'>+			}</div><div class='add'>+			head = mid + 1;</div><div class='add'>+			startprfx = matched;</div><div class='add'>+			candidate = de;</div><div class='add'>+			*_ndirents = ndirents;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> out:		/* free if the candidate is valid */</div><div class='ctx'> 		if (!IS_ERR(candidate))</div><div class='del'>-			put_page(candidate);</div><div class='del'>-		return page;</div><div class='add'>+			erofs_put_metabuf(target);</div><div class='add'>+		return de;</div><div class='ctx'> 	}</div><div class='ctx'> 	return candidate;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int erofs_namei(struct inode *dir,</div><div class='del'>-		struct qstr *name,</div><div class='del'>-		erofs_nid_t *nid, unsigned int *d_type)</div><div class='add'>+int erofs_namei(struct inode *dir, const struct qstr *name, erofs_nid_t *nid,</div><div class='add'>+		unsigned int *d_type)</div><div class='ctx'> {</div><div class='ctx'> 	int ndirents;</div><div class='del'>-	struct page *page;</div><div class='del'>-	void *data;</div><div class='add'>+	struct erofs_buf buf = __EROFS_BUF_INITIALIZER;</div><div class='ctx'> 	struct erofs_dirent *de;</div><div class='ctx'> 	struct erofs_qstr qn;</div><div class='ctx'> </div><div class='hunk'>@@ -179,34 +171,26 @@ int erofs_namei(struct inode *dir,</div><div class='ctx'> </div><div class='ctx'> 	qn.name = name-&gt;name;</div><div class='ctx'> 	qn.end = name-&gt;name + name-&gt;len;</div><div class='add'>+	buf.mapping = dir-&gt;i_mapping;</div><div class='ctx'> </div><div class='ctx'> 	ndirents = 0;</div><div class='del'>-	page = find_target_block_classic(dir, &amp;qn, &amp;ndirents);</div><div class='del'>-</div><div class='del'>-	if (IS_ERR(page))</div><div class='del'>-		return PTR_ERR(page);</div><div class='add'>+	de = erofs_find_target_block(&amp;buf, dir, &amp;qn, &amp;ndirents);</div><div class='add'>+	if (IS_ERR(de))</div><div class='add'>+		return PTR_ERR(de);</div><div class='ctx'> </div><div class='del'>-	data = kmap_atomic(page);</div><div class='del'>-	/* the target page has been mapped */</div><div class='ctx'> 	if (ndirents)</div><div class='del'>-		de = find_target_dirent(&amp;qn, data, EROFS_BLKSIZ, ndirents);</div><div class='del'>-	else</div><div class='del'>-		de = (struct erofs_dirent *)data;</div><div class='add'>+		de = find_target_dirent(&amp;qn, (u8 *)de, i_blocksize(dir),</div><div class='add'>+					ndirents);</div><div class='ctx'> </div><div class='ctx'> 	if (!IS_ERR(de)) {</div><div class='ctx'> 		*nid = le64_to_cpu(de-&gt;nid);</div><div class='ctx'> 		*d_type = de-&gt;file_type;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	kunmap_atomic(data);</div><div class='del'>-	put_page(page);</div><div class='del'>-</div><div class='add'>+	erofs_put_metabuf(&amp;buf);</div><div class='ctx'> 	return PTR_ERR_OR_ZERO(de);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* NOTE: i_mutex is already held by vfs */</div><div class='del'>-static struct dentry *erofs_lookup(struct inode *dir,</div><div class='del'>-				   struct dentry *dentry,</div><div class='add'>+static struct dentry *erofs_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 				   unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='hunk'>@@ -214,29 +198,20 @@ static struct dentry *erofs_lookup(struct inode *dir,</div><div class='ctx'> 	unsigned int d_type;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> </div><div class='del'>-	DBG_BUGON(!d_really_is_negative(dentry));</div><div class='del'>-	/* dentry must be unhashed in lookup, no need to worry about */</div><div class='del'>-	DBG_BUGON(!d_unhashed(dentry));</div><div class='del'>-</div><div class='ctx'> 	trace_erofs_lookup(dir, dentry, flags);</div><div class='ctx'> </div><div class='del'>-	/* file name exceeds fs limit */</div><div class='ctx'> 	if (dentry-&gt;d_name.len &gt; EROFS_NAME_LEN)</div><div class='ctx'> 		return ERR_PTR(-ENAMETOOLONG);</div><div class='ctx'> </div><div class='del'>-	/* false uninitialized warnings on gcc 4.8.x */</div><div class='ctx'> 	err = erofs_namei(dir, &amp;dentry-&gt;d_name, &amp;nid, &amp;d_type);</div><div class='ctx'> </div><div class='del'>-	if (err == -ENOENT) {</div><div class='add'>+	if (err == -ENOENT)</div><div class='ctx'> 		/* negative dentry */</div><div class='ctx'> 		inode = NULL;</div><div class='del'>-	} else if (err) {</div><div class='add'>+	else if (err)</div><div class='ctx'> 		inode = ERR_PTR(err);</div><div class='del'>-	} else {</div><div class='del'>-		erofs_dbg("%s, %pd (nid %llu) found, d_type %u", __func__,</div><div class='del'>-			  dentry, nid, d_type);</div><div class='del'>-		inode = erofs_iget(dir-&gt;i_sb, nid, d_type == FT_DIR);</div><div class='del'>-	}</div><div class='add'>+	else</div><div class='add'>+		inode = erofs_iget(dir-&gt;i_sb, nid);</div><div class='ctx'> 	return d_splice_alias(inode, dentry);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -244,6 +219,6 @@ const struct inode_operations erofs_dir_iops = {</div><div class='ctx'> 	.lookup = erofs_lookup,</div><div class='ctx'> 	.getattr = erofs_getattr,</div><div class='ctx'> 	.listxattr = erofs_listxattr,</div><div class='del'>-	.get_acl = erofs_get_acl,</div><div class='add'>+	.get_inode_acl = erofs_get_acl,</div><div class='ctx'> 	.fiemap = erofs_fiemap,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/erofs/pcpubuf.c b/fs/erofs/pcpubuf.c<br/>deleted file mode 100644<br/>index a2efd833d1b6..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/erofs/pcpubuf.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/pcpubuf.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,148 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0-only</div><div class='del'>-/*</div><div class='del'>- * Copyright (C) Gao Xiang &lt;xiang@kernel.org&gt;</div><div class='del'>- *</div><div class='del'>- * For low-latency decompression algorithms (e.g. lz4), reserve consecutive</div><div class='del'>- * per-CPU virtual memory (in pages) in advance to store such inplace I/O</div><div class='del'>- * data if inplace decompression is failed (due to unmet inplace margin for</div><div class='del'>- * example).</div><div class='del'>- */</div><div class='del'>-#include "internal.h"</div><div class='del'>-</div><div class='del'>-struct erofs_pcpubuf {</div><div class='del'>-	raw_spinlock_t lock;</div><div class='del'>-	void *ptr;</div><div class='del'>-	struct page **pages;</div><div class='del'>-	unsigned int nrpages;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static DEFINE_PER_CPU(struct erofs_pcpubuf, erofs_pcb);</div><div class='del'>-</div><div class='del'>-void *erofs_get_pcpubuf(unsigned int requiredpages)</div><div class='del'>-	__acquires(pcb-&gt;lock)</div><div class='del'>-{</div><div class='del'>-	struct erofs_pcpubuf *pcb = &amp;get_cpu_var(erofs_pcb);</div><div class='del'>-</div><div class='del'>-	raw_spin_lock(&amp;pcb-&gt;lock);</div><div class='del'>-	/* check if the per-CPU buffer is too small */</div><div class='del'>-	if (requiredpages &gt; pcb-&gt;nrpages) {</div><div class='del'>-		raw_spin_unlock(&amp;pcb-&gt;lock);</div><div class='del'>-		put_cpu_var(erofs_pcb);</div><div class='del'>-		/* (for sparse checker) pretend pcb-&gt;lock is still taken */</div><div class='del'>-		__acquire(pcb-&gt;lock);</div><div class='del'>-		return NULL;</div><div class='del'>-	}</div><div class='del'>-	return pcb-&gt;ptr;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void erofs_put_pcpubuf(void *ptr) __releases(pcb-&gt;lock)</div><div class='del'>-{</div><div class='del'>-	struct erofs_pcpubuf *pcb = &amp;per_cpu(erofs_pcb, smp_processor_id());</div><div class='del'>-</div><div class='del'>-	DBG_BUGON(pcb-&gt;ptr != ptr);</div><div class='del'>-	raw_spin_unlock(&amp;pcb-&gt;lock);</div><div class='del'>-	put_cpu_var(erofs_pcb);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* the next step: support per-CPU page buffers hotplug */</div><div class='del'>-int erofs_pcpubuf_growsize(unsigned int nrpages)</div><div class='del'>-{</div><div class='del'>-	static DEFINE_MUTEX(pcb_resize_mutex);</div><div class='del'>-	static unsigned int pcb_nrpages;</div><div class='del'>-	struct page *pagepool = NULL;</div><div class='del'>-	int delta, cpu, ret, i;</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;pcb_resize_mutex);</div><div class='del'>-	delta = nrpages - pcb_nrpages;</div><div class='del'>-	ret = 0;</div><div class='del'>-	/* avoid shrinking pcpubuf, since no idea how many fses rely on */</div><div class='del'>-	if (delta &lt;= 0)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	for_each_possible_cpu(cpu) {</div><div class='del'>-		struct erofs_pcpubuf *pcb = &amp;per_cpu(erofs_pcb, cpu);</div><div class='del'>-		struct page **pages, **oldpages;</div><div class='del'>-		void *ptr, *old_ptr;</div><div class='del'>-</div><div class='del'>-		pages = kmalloc_array(nrpages, sizeof(*pages), GFP_KERNEL);</div><div class='del'>-		if (!pages) {</div><div class='del'>-			ret = -ENOMEM;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		for (i = 0; i &lt; nrpages; ++i) {</div><div class='del'>-			pages[i] = erofs_allocpage(&amp;pagepool, GFP_KERNEL);</div><div class='del'>-			if (!pages[i]) {</div><div class='del'>-				ret = -ENOMEM;</div><div class='del'>-				oldpages = pages;</div><div class='del'>-				goto free_pagearray;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-		ptr = vmap(pages, nrpages, VM_MAP, PAGE_KERNEL);</div><div class='del'>-		if (!ptr) {</div><div class='del'>-			ret = -ENOMEM;</div><div class='del'>-			oldpages = pages;</div><div class='del'>-			goto free_pagearray;</div><div class='del'>-		}</div><div class='del'>-		raw_spin_lock(&amp;pcb-&gt;lock);</div><div class='del'>-		old_ptr = pcb-&gt;ptr;</div><div class='del'>-		pcb-&gt;ptr = ptr;</div><div class='del'>-		oldpages = pcb-&gt;pages;</div><div class='del'>-		pcb-&gt;pages = pages;</div><div class='del'>-		i = pcb-&gt;nrpages;</div><div class='del'>-		pcb-&gt;nrpages = nrpages;</div><div class='del'>-		raw_spin_unlock(&amp;pcb-&gt;lock);</div><div class='del'>-</div><div class='del'>-		if (!oldpages) {</div><div class='del'>-			DBG_BUGON(old_ptr);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (old_ptr)</div><div class='del'>-			vunmap(old_ptr);</div><div class='del'>-free_pagearray:</div><div class='del'>-		while (i)</div><div class='del'>-			erofs_pagepool_add(&amp;pagepool, oldpages[--i]);</div><div class='del'>-		kfree(oldpages);</div><div class='del'>-		if (ret)</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-	pcb_nrpages = nrpages;</div><div class='del'>-	erofs_release_pages(&amp;pagepool);</div><div class='del'>-out:</div><div class='del'>-	mutex_unlock(&amp;pcb_resize_mutex);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void erofs_pcpubuf_init(void)</div><div class='del'>-{</div><div class='del'>-	int cpu;</div><div class='del'>-</div><div class='del'>-	for_each_possible_cpu(cpu) {</div><div class='del'>-		struct erofs_pcpubuf *pcb = &amp;per_cpu(erofs_pcb, cpu);</div><div class='del'>-</div><div class='del'>-		raw_spin_lock_init(&amp;pcb-&gt;lock);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void erofs_pcpubuf_exit(void)</div><div class='del'>-{</div><div class='del'>-	int cpu, i;</div><div class='del'>-</div><div class='del'>-	for_each_possible_cpu(cpu) {</div><div class='del'>-		struct erofs_pcpubuf *pcb = &amp;per_cpu(erofs_pcb, cpu);</div><div class='del'>-</div><div class='del'>-		if (pcb-&gt;ptr) {</div><div class='del'>-			vunmap(pcb-&gt;ptr);</div><div class='del'>-			pcb-&gt;ptr = NULL;</div><div class='del'>-		}</div><div class='del'>-		if (!pcb-&gt;pages)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		for (i = 0; i &lt; pcb-&gt;nrpages; ++i)</div><div class='del'>-			if (pcb-&gt;pages[i])</div><div class='del'>-				put_page(pcb-&gt;pages[i]);</div><div class='del'>-		kfree(pcb-&gt;pages);</div><div class='del'>-		pcb-&gt;pages = NULL;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='head'>diff --git a/fs/erofs/super.c b/fs/erofs/super.c<br/>index 6a969b1e0ee6..937a215f626c 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/erofs/super.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/super.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/erofs/super.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/erofs/super.c</a></div><div class='hunk'>@@ -2,16 +2,15 @@</div><div class='ctx'> /*</div><div class='ctx'>  * Copyright (C) 2017-2018 HUAWEI, Inc.</div><div class='ctx'>  *             https://www.huawei.com/</div><div class='add'>+ * Copyright (C) 2021, Alibaba Cloud</div><div class='ctx'>  */</div><div class='del'>-#include &lt;linux/module.h&gt;</div><div class='del'>-#include &lt;linux/buffer_head.h&gt;</div><div class='ctx'> #include &lt;linux/statfs.h&gt;</div><div class='del'>-#include &lt;linux/parser.h&gt;</div><div class='ctx'> #include &lt;linux/seq_file.h&gt;</div><div class='ctx'> #include &lt;linux/crc32c.h&gt;</div><div class='ctx'> #include &lt;linux/fs_context.h&gt;</div><div class='ctx'> #include &lt;linux/fs_parser.h&gt;</div><div class='del'>-#include &lt;linux/dax.h&gt;</div><div class='add'>+#include &lt;linux/exportfs.h&gt;</div><div class='add'>+#include &lt;linux/backing-dev.h&gt;</div><div class='ctx'> #include "xattr.h"</div><div class='ctx'> </div><div class='ctx'> #define CREATE_TRACE_POINTS</div><div class='hunk'>@@ -19,58 +18,42 @@</div><div class='ctx'> </div><div class='ctx'> static struct kmem_cache *erofs_inode_cachep __read_mostly;</div><div class='ctx'> </div><div class='del'>-void _erofs_err(struct super_block *sb, const char *function,</div><div class='del'>-		const char *fmt, ...)</div><div class='add'>+void _erofs_printk(struct super_block *sb, const char *fmt, ...)</div><div class='ctx'> {</div><div class='ctx'> 	struct va_format vaf;</div><div class='ctx'> 	va_list args;</div><div class='add'>+	int level;</div><div class='ctx'> </div><div class='ctx'> 	va_start(args, fmt);</div><div class='ctx'> </div><div class='del'>-	vaf.fmt = fmt;</div><div class='add'>+	level = printk_get_level(fmt);</div><div class='add'>+	vaf.fmt = printk_skip_level(fmt);</div><div class='ctx'> 	vaf.va = &amp;args;</div><div class='del'>-</div><div class='del'>-	pr_err("(device %s): %s: %pV", sb-&gt;s_id, function, &amp;vaf);</div><div class='del'>-	va_end(args);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void _erofs_info(struct super_block *sb, const char *function,</div><div class='del'>-		 const char *fmt, ...)</div><div class='del'>-{</div><div class='del'>-	struct va_format vaf;</div><div class='del'>-	va_list args;</div><div class='del'>-</div><div class='del'>-	va_start(args, fmt);</div><div class='del'>-</div><div class='del'>-	vaf.fmt = fmt;</div><div class='del'>-	vaf.va = &amp;args;</div><div class='del'>-</div><div class='del'>-	pr_info("(device %s): %pV", sb-&gt;s_id, &amp;vaf);</div><div class='add'>+	if (sb)</div><div class='add'>+		printk("%c%cerofs (device %s): %pV",</div><div class='add'>+				KERN_SOH_ASCII, level, sb-&gt;s_id, &amp;vaf);</div><div class='add'>+	else</div><div class='add'>+		printk("%c%cerofs: %pV", KERN_SOH_ASCII, level, &amp;vaf);</div><div class='ctx'> 	va_end(args);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int erofs_superblock_csum_verify(struct super_block *sb, void *sbdata)</div><div class='ctx'> {</div><div class='del'>-	struct erofs_super_block *dsb;</div><div class='del'>-	u32 expected_crc, crc;</div><div class='del'>-</div><div class='del'>-	dsb = kmemdup(sbdata + EROFS_SUPER_OFFSET,</div><div class='del'>-		      EROFS_BLKSIZ - EROFS_SUPER_OFFSET, GFP_KERNEL);</div><div class='del'>-	if (!dsb)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	struct erofs_super_block *dsb = sbdata + EROFS_SUPER_OFFSET;</div><div class='add'>+	u32 len = 1 &lt;&lt; EROFS_SB(sb)-&gt;blkszbits, crc;</div><div class='ctx'> </div><div class='del'>-	expected_crc = le32_to_cpu(dsb-&gt;checksum);</div><div class='del'>-	dsb-&gt;checksum = 0;</div><div class='del'>-	/* to allow for x86 boot sectors and other oddities. */</div><div class='del'>-	crc = crc32c(~0, dsb, EROFS_BLKSIZ - EROFS_SUPER_OFFSET);</div><div class='del'>-	kfree(dsb);</div><div class='add'>+	if (len &gt; EROFS_SUPER_OFFSET)</div><div class='add'>+		len -= EROFS_SUPER_OFFSET;</div><div class='add'>+	len -= offsetof(struct erofs_super_block, checksum) +</div><div class='add'>+			sizeof(dsb-&gt;checksum);</div><div class='ctx'> </div><div class='del'>-	if (crc != expected_crc) {</div><div class='del'>-		erofs_err(sb, "invalid checksum 0x%08x, 0x%08x expected",</div><div class='del'>-			  crc, expected_crc);</div><div class='del'>-		return -EBADMSG;</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='add'>+	/* skip .magic(pre-verified) and .checksum(0) fields */</div><div class='add'>+	crc = crc32c(0x5045B54A, (&amp;dsb-&gt;checksum) + 1, len);</div><div class='add'>+	if (crc == le32_to_cpu(dsb-&gt;checksum))</div><div class='add'>+		return 0;</div><div class='add'>+	erofs_err(sb, "invalid checksum 0x%08x, 0x%08x expected",</div><div class='add'>+		  crc, le32_to_cpu(dsb-&gt;checksum));</div><div class='add'>+	return -EBADMSG;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void erofs_inode_init_once(void *ptr)</div><div class='hunk'>@@ -83,7 +66,7 @@ static void erofs_inode_init_once(void *ptr)</div><div class='ctx'> static struct inode *erofs_alloc_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct erofs_inode *vi =</div><div class='del'>-		kmem_cache_alloc(erofs_inode_cachep, GFP_KERNEL);</div><div class='add'>+		alloc_inode_sb(sb, erofs_inode_cachep, GFP_KERNEL);</div><div class='ctx'> </div><div class='ctx'> 	if (!vi)</div><div class='ctx'> 		return NULL;</div><div class='hunk'>@@ -97,263 +80,217 @@ static void erofs_free_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct erofs_inode *vi = EROFS_I(inode);</div><div class='ctx'> </div><div class='del'>-	/* be careful of RCU symlink path */</div><div class='ctx'> 	if (inode-&gt;i_op == &amp;erofs_fast_symlink_iops)</div><div class='ctx'> 		kfree(inode-&gt;i_link);</div><div class='ctx'> 	kfree(vi-&gt;xattr_shared_xattrs);</div><div class='del'>-</div><div class='ctx'> 	kmem_cache_free(erofs_inode_cachep, vi);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool check_layout_compatibility(struct super_block *sb,</div><div class='del'>-				       struct erofs_super_block *dsb)</div><div class='del'>-{</div><div class='del'>-	const unsigned int feature = le32_to_cpu(dsb-&gt;feature_incompat);</div><div class='del'>-</div><div class='del'>-	EROFS_SB(sb)-&gt;feature_incompat = feature;</div><div class='del'>-</div><div class='del'>-	/* check if current kernel meets all mandatory requirements */</div><div class='del'>-	if (feature &amp; (~EROFS_ALL_FEATURE_INCOMPAT)) {</div><div class='del'>-		erofs_err(sb,</div><div class='del'>-			  "unidentified incompatible feature %x, please upgrade kernel version",</div><div class='del'>-			   feature &amp; ~EROFS_ALL_FEATURE_INCOMPAT);</div><div class='del'>-		return false;</div><div class='del'>-	}</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_EROFS_FS_ZIP</div><div class='ctx'> /* read variable-sized metadata, offset will be aligned by 4-byte */</div><div class='del'>-static void *erofs_read_metadata(struct super_block *sb, struct page **pagep,</div><div class='del'>-				 erofs_off_t *offset, int *lengthp)</div><div class='add'>+void *erofs_read_metadata(struct super_block *sb, struct erofs_buf *buf,</div><div class='add'>+			  erofs_off_t *offset, int *lengthp)</div><div class='ctx'> {</div><div class='del'>-	struct page *page = *pagep;</div><div class='ctx'> 	u8 *buffer, *ptr;</div><div class='ctx'> 	int len, i, cnt;</div><div class='del'>-	erofs_blk_t blk;</div><div class='ctx'> </div><div class='ctx'> 	*offset = round_up(*offset, 4);</div><div class='del'>-	blk = erofs_blknr(*offset);</div><div class='add'>+	ptr = erofs_bread(buf, *offset, true);</div><div class='add'>+	if (IS_ERR(ptr))</div><div class='add'>+		return ptr;</div><div class='ctx'> </div><div class='del'>-	if (!page || page-&gt;index != blk) {</div><div class='del'>-		if (page) {</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			put_page(page);</div><div class='del'>-		}</div><div class='del'>-		page = erofs_get_meta_page(sb, blk);</div><div class='del'>-		if (IS_ERR(page))</div><div class='del'>-			goto err_nullpage;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ptr = kmap(page);</div><div class='del'>-	len = le16_to_cpu(*(__le16 *)&amp;ptr[erofs_blkoff(*offset)]);</div><div class='add'>+	len = le16_to_cpu(*(__le16 *)ptr);</div><div class='ctx'> 	if (!len)</div><div class='ctx'> 		len = U16_MAX + 1;</div><div class='ctx'> 	buffer = kmalloc(len, GFP_KERNEL);</div><div class='del'>-	if (!buffer) {</div><div class='del'>-		buffer = ERR_PTR(-ENOMEM);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (!buffer)</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='ctx'> 	*offset += sizeof(__le16);</div><div class='ctx'> 	*lengthp = len;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; len; i += cnt) {</div><div class='del'>-		cnt = min(EROFS_BLKSIZ - (int)erofs_blkoff(*offset), len - i);</div><div class='del'>-		blk = erofs_blknr(*offset);</div><div class='del'>-</div><div class='del'>-		if (!page || page-&gt;index != blk) {</div><div class='del'>-			if (page) {</div><div class='del'>-				kunmap(page);</div><div class='del'>-				unlock_page(page);</div><div class='del'>-				put_page(page);</div><div class='del'>-			}</div><div class='del'>-			page = erofs_get_meta_page(sb, blk);</div><div class='del'>-			if (IS_ERR(page)) {</div><div class='del'>-				kfree(buffer);</div><div class='del'>-				goto err_nullpage;</div><div class='del'>-			}</div><div class='del'>-			ptr = kmap(page);</div><div class='add'>+		cnt = min_t(int, sb-&gt;s_blocksize - erofs_blkoff(sb, *offset),</div><div class='add'>+			    len - i);</div><div class='add'>+		ptr = erofs_bread(buf, *offset, true);</div><div class='add'>+		if (IS_ERR(ptr)) {</div><div class='add'>+			kfree(buffer);</div><div class='add'>+			return ptr;</div><div class='ctx'> 		}</div><div class='del'>-		memcpy(buffer + i, ptr + erofs_blkoff(*offset), cnt);</div><div class='add'>+		memcpy(buffer + i, ptr, cnt);</div><div class='ctx'> 		*offset += cnt;</div><div class='ctx'> 	}</div><div class='del'>-out:</div><div class='del'>-	kunmap(page);</div><div class='del'>-	*pagep = page;</div><div class='ctx'> 	return buffer;</div><div class='del'>-err_nullpage:</div><div class='del'>-	*pagep = NULL;</div><div class='del'>-	return page;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int erofs_load_compr_cfgs(struct super_block *sb,</div><div class='del'>-				 struct erofs_super_block *dsb)</div><div class='add'>+#ifndef CONFIG_EROFS_FS_ZIP</div><div class='add'>+static int z_erofs_parse_cfgs(struct super_block *sb,</div><div class='add'>+			      struct erofs_super_block *dsb)</div><div class='ctx'> {</div><div class='del'>-	struct erofs_sb_info *sbi;</div><div class='del'>-	struct page *page;</div><div class='del'>-	unsigned int algs, alg;</div><div class='del'>-	erofs_off_t offset;</div><div class='del'>-	int size, ret;</div><div class='del'>-</div><div class='del'>-	sbi = EROFS_SB(sb);</div><div class='del'>-	sbi-&gt;available_compr_algs = le16_to_cpu(dsb-&gt;u1.available_compr_algs);</div><div class='add'>+	if (!dsb-&gt;u1.available_compr_algs)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	if (sbi-&gt;available_compr_algs &amp; ~Z_EROFS_ALL_COMPR_ALGS) {</div><div class='del'>-		erofs_err(sb, "try to load compressed fs with unsupported algorithms %x",</div><div class='del'>-			  sbi-&gt;available_compr_algs &amp; ~Z_EROFS_ALL_COMPR_ALGS);</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='add'>+	erofs_err(sb, "compression disabled, unable to mount compressed EROFS");</div><div class='add'>+	return -EOPNOTSUPP;</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='del'>-	offset = EROFS_SUPER_OFFSET + sbi-&gt;sb_size;</div><div class='del'>-	page = NULL;</div><div class='del'>-	alg = 0;</div><div class='del'>-	ret = 0;</div><div class='add'>+static int erofs_init_device(struct erofs_buf *buf, struct super_block *sb,</div><div class='add'>+			     struct erofs_device_info *dif, erofs_off_t *pos)</div><div class='add'>+{</div><div class='add'>+	struct erofs_sb_info *sbi = EROFS_SB(sb);</div><div class='add'>+	struct erofs_fscache *fscache;</div><div class='add'>+	struct erofs_deviceslot *dis;</div><div class='add'>+	struct file *file;</div><div class='ctx'> </div><div class='del'>-	for (algs = sbi-&gt;available_compr_algs; algs; algs &gt;&gt;= 1, ++alg) {</div><div class='del'>-		void *data;</div><div class='add'>+	dis = erofs_read_metabuf(buf, sb, *pos, false);</div><div class='add'>+	if (IS_ERR(dis))</div><div class='add'>+		return PTR_ERR(dis);</div><div class='ctx'> </div><div class='del'>-		if (!(algs &amp; 1))</div><div class='del'>-			continue;</div><div class='add'>+	if (!sbi-&gt;devs-&gt;flatdev &amp;&amp; !dif-&gt;path) {</div><div class='add'>+		if (!dis-&gt;tag[0]) {</div><div class='add'>+			erofs_err(sb, "empty device tag @ pos %llu", *pos);</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		dif-&gt;path = kmemdup_nul(dis-&gt;tag, sizeof(dis-&gt;tag), GFP_KERNEL);</div><div class='add'>+		if (!dif-&gt;path)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		data = erofs_read_metadata(sb, &amp;page, &amp;offset, &amp;size);</div><div class='del'>-		if (IS_ERR(data)) {</div><div class='del'>-			ret = PTR_ERR(data);</div><div class='del'>-			goto err;</div><div class='add'>+	if (erofs_is_fscache_mode(sb)) {</div><div class='add'>+		fscache = erofs_fscache_register_cookie(sb, dif-&gt;path, 0);</div><div class='add'>+		if (IS_ERR(fscache))</div><div class='add'>+			return PTR_ERR(fscache);</div><div class='add'>+		dif-&gt;fscache = fscache;</div><div class='add'>+	} else if (!sbi-&gt;devs-&gt;flatdev) {</div><div class='add'>+		file = erofs_is_fileio_mode(sbi) ?</div><div class='add'>+				filp_open(dif-&gt;path, O_RDONLY | O_LARGEFILE, 0) :</div><div class='add'>+				bdev_file_open_by_path(dif-&gt;path,</div><div class='add'>+						BLK_OPEN_READ, sb-&gt;s_type, NULL);</div><div class='add'>+		if (IS_ERR(file)) {</div><div class='add'>+			if (file == ERR_PTR(-ENOTBLK))</div><div class='add'>+				return -EINVAL;</div><div class='add'>+			return PTR_ERR(file);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		switch (alg) {</div><div class='del'>-		case Z_EROFS_COMPRESSION_LZ4:</div><div class='del'>-			ret = z_erofs_load_lz4_config(sb, dsb, data, size);</div><div class='del'>-			break;</div><div class='del'>-		case Z_EROFS_COMPRESSION_LZMA:</div><div class='del'>-			ret = z_erofs_load_lzma_config(sb, dsb, data, size);</div><div class='del'>-			break;</div><div class='del'>-		default:</div><div class='del'>-			DBG_BUGON(1);</div><div class='del'>-			ret = -EFAULT;</div><div class='add'>+		if (!erofs_is_fileio_mode(sbi)) {</div><div class='add'>+			dif-&gt;dax_dev = fs_dax_get_by_bdev(file_bdev(file),</div><div class='add'>+					&amp;dif-&gt;dax_part_off, NULL, NULL);</div><div class='add'>+		} else if (!S_ISREG(file_inode(file)-&gt;i_mode)) {</div><div class='add'>+			fput(file);</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 		}</div><div class='del'>-		kfree(data);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto err;</div><div class='del'>-	}</div><div class='del'>-err:</div><div class='del'>-	if (page) {</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		put_page(page);</div><div class='del'>-	}</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-#else</div><div class='del'>-static int erofs_load_compr_cfgs(struct super_block *sb,</div><div class='del'>-				 struct erofs_super_block *dsb)</div><div class='del'>-{</div><div class='del'>-	if (dsb-&gt;u1.available_compr_algs) {</div><div class='del'>-		erofs_err(sb, "try to load compressed fs when compression is disabled");</div><div class='del'>-		return -EINVAL;</div><div class='add'>+		if (!dif-&gt;dax_dev &amp;&amp; test_opt(&amp;sbi-&gt;opt, DAX_ALWAYS)) {</div><div class='add'>+			erofs_info(sb, "DAX unsupported by %s. Turning off DAX.",</div><div class='add'>+				   dif-&gt;path);</div><div class='add'>+			clear_opt(&amp;sbi-&gt;opt, DAX_ALWAYS);</div><div class='add'>+		}</div><div class='add'>+		dif-&gt;file = file;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	dif-&gt;blocks = le32_to_cpu(dis-&gt;blocks_lo);</div><div class='add'>+	dif-&gt;uniaddr = le32_to_cpu(dis-&gt;uniaddr_lo);</div><div class='add'>+	sbi-&gt;total_blocks += dif-&gt;blocks;</div><div class='add'>+	*pos += EROFS_DEVT_SLOT_SIZE;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='del'>-#endif</div><div class='ctx'> </div><div class='del'>-static int erofs_init_devices(struct super_block *sb,</div><div class='add'>+static int erofs_scan_devices(struct super_block *sb,</div><div class='ctx'> 			      struct erofs_super_block *dsb)</div><div class='ctx'> {</div><div class='ctx'> 	struct erofs_sb_info *sbi = EROFS_SB(sb);</div><div class='ctx'> 	unsigned int ondisk_extradevs;</div><div class='ctx'> 	erofs_off_t pos;</div><div class='del'>-	struct page *page = NULL;</div><div class='add'>+	struct erofs_buf buf = __EROFS_BUF_INITIALIZER;</div><div class='ctx'> 	struct erofs_device_info *dif;</div><div class='del'>-	struct erofs_deviceslot *dis;</div><div class='del'>-	void *ptr;</div><div class='ctx'> 	int id, err = 0;</div><div class='ctx'> </div><div class='del'>-	sbi-&gt;total_blocks = sbi-&gt;primarydevice_blocks;</div><div class='add'>+	sbi-&gt;total_blocks = sbi-&gt;dif0.blocks;</div><div class='ctx'> 	if (!erofs_sb_has_device_table(sbi))</div><div class='ctx'> 		ondisk_extradevs = 0;</div><div class='ctx'> 	else</div><div class='ctx'> 		ondisk_extradevs = le16_to_cpu(dsb-&gt;extra_devices);</div><div class='ctx'> </div><div class='del'>-	if (ondisk_extradevs != sbi-&gt;devs-&gt;extra_devices) {</div><div class='add'>+	if (sbi-&gt;devs-&gt;extra_devices &amp;&amp;</div><div class='add'>+	    ondisk_extradevs != sbi-&gt;devs-&gt;extra_devices) {</div><div class='ctx'> 		erofs_err(sb, "extra devices don't match (ondisk %u, given %u)",</div><div class='ctx'> 			  ondisk_extradevs, sbi-&gt;devs-&gt;extra_devices);</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	if (test_opt(&amp;sbi-&gt;opt, DAX_ALWAYS) &amp;&amp; !sbi-&gt;dif0.dax_dev) {</div><div class='add'>+		erofs_info(sb, "DAX unsupported by block device. Turning off DAX.");</div><div class='add'>+		clear_opt(&amp;sbi-&gt;opt, DAX_ALWAYS);</div><div class='add'>+	}</div><div class='ctx'> 	if (!ondisk_extradevs)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='add'>+	if (!sbi-&gt;devs-&gt;extra_devices &amp;&amp; !erofs_is_fscache_mode(sb))</div><div class='add'>+		sbi-&gt;devs-&gt;flatdev = true;</div><div class='add'>+</div><div class='ctx'> 	sbi-&gt;device_id_mask = roundup_pow_of_two(ondisk_extradevs + 1) - 1;</div><div class='ctx'> 	pos = le16_to_cpu(dsb-&gt;devt_slotoff) * EROFS_DEVT_SLOT_SIZE;</div><div class='ctx'> 	down_read(&amp;sbi-&gt;devs-&gt;rwsem);</div><div class='del'>-	idr_for_each_entry(&amp;sbi-&gt;devs-&gt;tree, dif, id) {</div><div class='del'>-		erofs_blk_t blk = erofs_blknr(pos);</div><div class='del'>-		struct block_device *bdev;</div><div class='del'>-</div><div class='del'>-		if (!page || page-&gt;index != blk) {</div><div class='del'>-			if (page) {</div><div class='del'>-				kunmap(page);</div><div class='del'>-				unlock_page(page);</div><div class='del'>-				put_page(page);</div><div class='add'>+	if (sbi-&gt;devs-&gt;extra_devices) {</div><div class='add'>+		idr_for_each_entry(&amp;sbi-&gt;devs-&gt;tree, dif, id) {</div><div class='add'>+			err = erofs_init_device(&amp;buf, sb, dif, &amp;pos);</div><div class='add'>+			if (err)</div><div class='add'>+				break;</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		for (id = 0; id &lt; ondisk_extradevs; id++) {</div><div class='add'>+			dif = kzalloc(sizeof(*dif), GFP_KERNEL);</div><div class='add'>+			if (!dif) {</div><div class='add'>+				err = -ENOMEM;</div><div class='add'>+				break;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			page = erofs_get_meta_page(sb, blk);</div><div class='del'>-			if (IS_ERR(page)) {</div><div class='del'>-				up_read(&amp;sbi-&gt;devs-&gt;rwsem);</div><div class='del'>-				return PTR_ERR(page);</div><div class='add'>+			err = idr_alloc(&amp;sbi-&gt;devs-&gt;tree, dif, 0, 0, GFP_KERNEL);</div><div class='add'>+			if (err &lt; 0) {</div><div class='add'>+				kfree(dif);</div><div class='add'>+				break;</div><div class='ctx'> 			}</div><div class='del'>-			ptr = kmap(page);</div><div class='del'>-		}</div><div class='del'>-		dis = ptr + erofs_blkoff(pos);</div><div class='del'>-</div><div class='del'>-		bdev = blkdev_get_by_path(dif-&gt;path,</div><div class='del'>-					  FMODE_READ | FMODE_EXCL,</div><div class='del'>-					  sb-&gt;s_type);</div><div class='del'>-		if (IS_ERR(bdev)) {</div><div class='del'>-			err = PTR_ERR(bdev);</div><div class='del'>-			goto err_out;</div><div class='add'>+			++sbi-&gt;devs-&gt;extra_devices;</div><div class='add'>+</div><div class='add'>+			err = erofs_init_device(&amp;buf, sb, dif, &amp;pos);</div><div class='add'>+			if (err)</div><div class='add'>+				break;</div><div class='ctx'> 		}</div><div class='del'>-		dif-&gt;bdev = bdev;</div><div class='del'>-		dif-&gt;dax_dev = fs_dax_get_by_bdev(bdev);</div><div class='del'>-		dif-&gt;blocks = le32_to_cpu(dis-&gt;blocks);</div><div class='del'>-		dif-&gt;mapped_blkaddr = le32_to_cpu(dis-&gt;mapped_blkaddr);</div><div class='del'>-		sbi-&gt;total_blocks += dif-&gt;blocks;</div><div class='del'>-		pos += EROFS_DEVT_SLOT_SIZE;</div><div class='ctx'> 	}</div><div class='del'>-err_out:</div><div class='ctx'> 	up_read(&amp;sbi-&gt;devs-&gt;rwsem);</div><div class='del'>-	if (page) {</div><div class='del'>-		kunmap(page);</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		put_page(page);</div><div class='del'>-	}</div><div class='add'>+	erofs_put_metabuf(&amp;buf);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int erofs_read_superblock(struct super_block *sb)</div><div class='ctx'> {</div><div class='del'>-	struct erofs_sb_info *sbi;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct erofs_sb_info *sbi = EROFS_SB(sb);</div><div class='add'>+	struct erofs_buf buf = __EROFS_BUF_INITIALIZER;</div><div class='ctx'> 	struct erofs_super_block *dsb;</div><div class='del'>-	unsigned int blkszbits;</div><div class='ctx'> 	void *data;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	page = read_mapping_page(sb-&gt;s_bdev-&gt;bd_inode-&gt;i_mapping, 0, NULL);</div><div class='del'>-	if (IS_ERR(page)) {</div><div class='add'>+	data = erofs_read_metabuf(&amp;buf, sb, 0, false);</div><div class='add'>+	if (IS_ERR(data)) {</div><div class='ctx'> 		erofs_err(sb, "cannot read erofs superblock");</div><div class='del'>-		return PTR_ERR(page);</div><div class='add'>+		return PTR_ERR(data);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	sbi = EROFS_SB(sb);</div><div class='del'>-</div><div class='del'>-	data = kmap(page);</div><div class='ctx'> 	dsb = (struct erofs_super_block *)(data + EROFS_SUPER_OFFSET);</div><div class='del'>-</div><div class='ctx'> 	ret = -EINVAL;</div><div class='ctx'> 	if (le32_to_cpu(dsb-&gt;magic) != EROFS_SUPER_MAGIC_V1) {</div><div class='ctx'> 		erofs_err(sb, "cannot find valid erofs superblock");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	sbi-&gt;blkszbits = dsb-&gt;blkszbits;</div><div class='add'>+	if (sbi-&gt;blkszbits &lt; 9 || sbi-&gt;blkszbits &gt; PAGE_SHIFT) {</div><div class='add'>+		erofs_err(sb, "blkszbits %u isn't supported", sbi-&gt;blkszbits);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	if (dsb-&gt;dirblkbits) {</div><div class='add'>+		erofs_err(sb, "dirblkbits %u isn't supported", dsb-&gt;dirblkbits);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	sbi-&gt;feature_compat = le32_to_cpu(dsb-&gt;feature_compat);</div><div class='ctx'> 	if (erofs_sb_has_sb_chksum(sbi)) {</div><div class='ctx'> 		ret = erofs_superblock_csum_verify(sb, data);</div><div class='hunk'>@@ -362,85 +299,93 @@ static int erofs_read_superblock(struct super_block *sb)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = -EINVAL;</div><div class='del'>-	blkszbits = dsb-&gt;blkszbits;</div><div class='del'>-	/* 9(512 bytes) + LOG_SECTORS_PER_BLOCK == LOG_BLOCK_SIZE */</div><div class='del'>-	if (blkszbits != LOG_BLOCK_SIZE) {</div><div class='del'>-		erofs_err(sb, "blkszbits %u isn't supported on this platform",</div><div class='del'>-			  blkszbits);</div><div class='add'>+	sbi-&gt;feature_incompat = le32_to_cpu(dsb-&gt;feature_incompat);</div><div class='add'>+	if (sbi-&gt;feature_incompat &amp; ~EROFS_ALL_FEATURE_INCOMPAT) {</div><div class='add'>+		erofs_err(sb, "unidentified incompatible feature %x, please upgrade kernel",</div><div class='add'>+			  sbi-&gt;feature_incompat &amp; ~EROFS_ALL_FEATURE_INCOMPAT);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!check_layout_compatibility(sb, dsb))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='ctx'> 	sbi-&gt;sb_size = 128 + dsb-&gt;sb_extslots * EROFS_SB_EXTSLOT_SIZE;</div><div class='del'>-	if (sbi-&gt;sb_size &gt; EROFS_BLKSIZ) {</div><div class='add'>+	if (sbi-&gt;sb_size &gt; PAGE_SIZE - EROFS_SUPER_OFFSET) {</div><div class='ctx'> 		erofs_err(sb, "invalid sb_extslots %u (more than a fs block)",</div><div class='ctx'> 			  sbi-&gt;sb_size);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	sbi-&gt;primarydevice_blocks = le32_to_cpu(dsb-&gt;blocks);</div><div class='add'>+	sbi-&gt;dif0.blocks = le32_to_cpu(dsb-&gt;blocks_lo);</div><div class='ctx'> 	sbi-&gt;meta_blkaddr = le32_to_cpu(dsb-&gt;meta_blkaddr);</div><div class='ctx'> #ifdef CONFIG_EROFS_FS_XATTR</div><div class='ctx'> 	sbi-&gt;xattr_blkaddr = le32_to_cpu(dsb-&gt;xattr_blkaddr);</div><div class='add'>+	sbi-&gt;xattr_prefix_start = le32_to_cpu(dsb-&gt;xattr_prefix_start);</div><div class='add'>+	sbi-&gt;xattr_prefix_count = dsb-&gt;xattr_prefix_count;</div><div class='add'>+	sbi-&gt;xattr_filter_reserved = dsb-&gt;xattr_filter_reserved;</div><div class='ctx'> #endif</div><div class='ctx'> 	sbi-&gt;islotbits = ilog2(sizeof(struct erofs_inode_compact));</div><div class='del'>-	sbi-&gt;root_nid = le16_to_cpu(dsb-&gt;root_nid);</div><div class='add'>+	if (erofs_sb_has_48bit(sbi) &amp;&amp; dsb-&gt;rootnid_8b) {</div><div class='add'>+		sbi-&gt;root_nid = le64_to_cpu(dsb-&gt;rootnid_8b);</div><div class='add'>+		sbi-&gt;dif0.blocks = sbi-&gt;dif0.blocks |</div><div class='add'>+				((u64)le16_to_cpu(dsb-&gt;rb.blocks_hi) &lt;&lt; 32);</div><div class='add'>+	} else {</div><div class='add'>+		sbi-&gt;root_nid = le16_to_cpu(dsb-&gt;rb.rootnid_2b);</div><div class='add'>+	}</div><div class='add'>+	sbi-&gt;packed_nid = le64_to_cpu(dsb-&gt;packed_nid);</div><div class='add'>+	if (erofs_sb_has_metabox(sbi)) {</div><div class='add'>+		if (sbi-&gt;sb_size &lt;= offsetof(struct erofs_super_block,</div><div class='add'>+					     metabox_nid))</div><div class='add'>+			return -EFSCORRUPTED;</div><div class='add'>+		sbi-&gt;metabox_nid = le64_to_cpu(dsb-&gt;metabox_nid);</div><div class='add'>+		if (sbi-&gt;metabox_nid &amp; BIT_ULL(EROFS_DIRENT_NID_METABOX_BIT))</div><div class='add'>+			return -EFSCORRUPTED;	/* self-loop detection */</div><div class='add'>+	}</div><div class='ctx'> 	sbi-&gt;inos = le64_to_cpu(dsb-&gt;inos);</div><div class='ctx'> </div><div class='del'>-	sbi-&gt;build_time = le64_to_cpu(dsb-&gt;build_time);</div><div class='del'>-	sbi-&gt;build_time_nsec = le32_to_cpu(dsb-&gt;build_time_nsec);</div><div class='add'>+	sbi-&gt;epoch = (s64)le64_to_cpu(dsb-&gt;epoch);</div><div class='add'>+	sbi-&gt;fixed_nsec = le32_to_cpu(dsb-&gt;fixed_nsec);</div><div class='add'>+	super_set_uuid(sb, (void *)dsb-&gt;uuid, sizeof(dsb-&gt;uuid));</div><div class='ctx'> </div><div class='del'>-	memcpy(&amp;sb-&gt;s_uuid, dsb-&gt;uuid, sizeof(dsb-&gt;uuid));</div><div class='del'>-</div><div class='del'>-	ret = strscpy(sbi-&gt;volume_name, dsb-&gt;volume_name,</div><div class='del'>-		      sizeof(dsb-&gt;volume_name));</div><div class='del'>-	if (ret &lt; 0) {	/* -E2BIG */</div><div class='del'>-		erofs_err(sb, "bad volume name without NIL terminator");</div><div class='del'>-		ret = -EFSCORRUPTED;</div><div class='del'>-		goto out;</div><div class='add'>+	if (dsb-&gt;volume_name[0]) {</div><div class='add'>+		sbi-&gt;volume_name = kstrndup(dsb-&gt;volume_name,</div><div class='add'>+					    sizeof(dsb-&gt;volume_name), GFP_KERNEL);</div><div class='add'>+		if (!sbi-&gt;volume_name)</div><div class='add'>+			return -ENOMEM;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* parse on-disk compression configurations */</div><div class='del'>-	if (erofs_sb_has_compr_cfgs(sbi))</div><div class='del'>-		ret = erofs_load_compr_cfgs(sb, dsb);</div><div class='del'>-	else</div><div class='del'>-		ret = z_erofs_load_lz4_config(sb, dsb, NULL, 0);</div><div class='add'>+	ret = z_erofs_parse_cfgs(sb, dsb);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	/* handle multiple devices */</div><div class='del'>-	ret = erofs_init_devices(sb, dsb);</div><div class='add'>+	ret = erofs_scan_devices(sb, dsb);</div><div class='add'>+</div><div class='add'>+	if (erofs_sb_has_48bit(sbi))</div><div class='add'>+		erofs_info(sb, "EXPERIMENTAL 48-bit layout support in use. Use at your own risk!");</div><div class='add'>+	if (erofs_sb_has_metabox(sbi))</div><div class='add'>+		erofs_info(sb, "EXPERIMENTAL metadata compression support in use. Use at your own risk!");</div><div class='add'>+	if (erofs_is_fscache_mode(sb))</div><div class='add'>+		erofs_info(sb, "[deprecated] fscache-based on-demand read feature in use. Use at your own risk!");</div><div class='ctx'> out:</div><div class='del'>-	kunmap(page);</div><div class='del'>-	put_page(page);</div><div class='add'>+	erofs_put_metabuf(&amp;buf);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* set up default EROFS parameters */</div><div class='del'>-static void erofs_default_options(struct erofs_fs_context *ctx)</div><div class='add'>+static void erofs_default_options(struct erofs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> #ifdef CONFIG_EROFS_FS_ZIP</div><div class='del'>-	ctx-&gt;opt.cache_strategy = EROFS_ZIP_CACHE_READAROUND;</div><div class='del'>-	ctx-&gt;opt.max_sync_decompress_pages = 3;</div><div class='del'>-	ctx-&gt;opt.readahead_sync_decompress = false;</div><div class='add'>+	sbi-&gt;opt.cache_strategy = EROFS_ZIP_CACHE_READAROUND;</div><div class='add'>+	sbi-&gt;opt.max_sync_decompress_pages = 3;</div><div class='add'>+	sbi-&gt;opt.sync_decompress = EROFS_SYNC_DECOMPRESS_AUTO;</div><div class='ctx'> #endif</div><div class='ctx'> #ifdef CONFIG_EROFS_FS_XATTR</div><div class='del'>-	set_opt(&amp;ctx-&gt;opt, XATTR_USER);</div><div class='add'>+	set_opt(&amp;sbi-&gt;opt, XATTR_USER);</div><div class='ctx'> #endif</div><div class='ctx'> #ifdef CONFIG_EROFS_FS_POSIX_ACL</div><div class='del'>-	set_opt(&amp;ctx-&gt;opt, POSIX_ACL);</div><div class='add'>+	set_opt(&amp;sbi-&gt;opt, POSIX_ACL);</div><div class='ctx'> #endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> enum {</div><div class='del'>-	Opt_user_xattr,</div><div class='del'>-	Opt_acl,</div><div class='del'>-	Opt_cache_strategy,</div><div class='del'>-	Opt_dax,</div><div class='del'>-	Opt_dax_enum,</div><div class='del'>-	Opt_device,</div><div class='del'>-	Opt_err</div><div class='add'>+	Opt_user_xattr, Opt_acl, Opt_cache_strategy, Opt_dax, Opt_dax_enum,</div><div class='add'>+	Opt_device, Opt_fsid, Opt_domain_id, Opt_directio, Opt_fsoffset,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct constant_table erofs_param_cache_strategy[] = {</div><div class='hunk'>@@ -464,23 +409,26 @@ static const struct fs_parameter_spec erofs_fs_parameters[] = {</div><div class='ctx'> 	fsparam_flag("dax",             Opt_dax),</div><div class='ctx'> 	fsparam_enum("dax",		Opt_dax_enum, erofs_dax_param_enums),</div><div class='ctx'> 	fsparam_string("device",	Opt_device),</div><div class='add'>+	fsparam_string("fsid",		Opt_fsid),</div><div class='add'>+	fsparam_string("domain_id",	Opt_domain_id),</div><div class='add'>+	fsparam_flag_no("directio",	Opt_directio),</div><div class='add'>+	fsparam_u64("fsoffset",		Opt_fsoffset),</div><div class='ctx'> 	{}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static bool erofs_fc_set_dax_mode(struct fs_context *fc, unsigned int mode)</div><div class='ctx'> {</div><div class='ctx'> #ifdef CONFIG_FS_DAX</div><div class='del'>-	struct erofs_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct erofs_sb_info *sbi = fc-&gt;s_fs_info;</div><div class='ctx'> </div><div class='ctx'> 	switch (mode) {</div><div class='ctx'> 	case EROFS_MOUNT_DAX_ALWAYS:</div><div class='del'>-		warnfc(fc, "DAX enabled. Warning: EXPERIMENTAL, use at your own risk");</div><div class='del'>-		set_opt(&amp;ctx-&gt;opt, DAX_ALWAYS);</div><div class='del'>-		clear_opt(&amp;ctx-&gt;opt, DAX_NEVER);</div><div class='add'>+		set_opt(&amp;sbi-&gt;opt, DAX_ALWAYS);</div><div class='add'>+		clear_opt(&amp;sbi-&gt;opt, DAX_NEVER);</div><div class='ctx'> 		return true;</div><div class='ctx'> 	case EROFS_MOUNT_DAX_NEVER:</div><div class='del'>-		set_opt(&amp;ctx-&gt;opt, DAX_NEVER);</div><div class='del'>-		clear_opt(&amp;ctx-&gt;opt, DAX_ALWAYS);</div><div class='add'>+		set_opt(&amp;sbi-&gt;opt, DAX_NEVER);</div><div class='add'>+		clear_opt(&amp;sbi-&gt;opt, DAX_ALWAYS);</div><div class='ctx'> 		return true;</div><div class='ctx'> 	default:</div><div class='ctx'> 		DBG_BUGON(1);</div><div class='hunk'>@@ -495,7 +443,7 @@ static bool erofs_fc_set_dax_mode(struct fs_context *fc, unsigned int mode)</div><div class='ctx'> static int erofs_fc_parse_param(struct fs_context *fc,</div><div class='ctx'> 				struct fs_parameter *param)</div><div class='ctx'> {</div><div class='del'>-	struct erofs_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct erofs_sb_info *sbi = fc-&gt;s_fs_info;</div><div class='ctx'> 	struct fs_parse_result result;</div><div class='ctx'> 	struct erofs_device_info *dif;</div><div class='ctx'> 	int opt, ret;</div><div class='hunk'>@@ -508,9 +456,9 @@ static int erofs_fc_parse_param(struct fs_context *fc,</div><div class='ctx'> 	case Opt_user_xattr:</div><div class='ctx'> #ifdef CONFIG_EROFS_FS_XATTR</div><div class='ctx'> 		if (result.boolean)</div><div class='del'>-			set_opt(&amp;ctx-&gt;opt, XATTR_USER);</div><div class='add'>+			set_opt(&amp;sbi-&gt;opt, XATTR_USER);</div><div class='ctx'> 		else</div><div class='del'>-			clear_opt(&amp;ctx-&gt;opt, XATTR_USER);</div><div class='add'>+			clear_opt(&amp;sbi-&gt;opt, XATTR_USER);</div><div class='ctx'> #else</div><div class='ctx'> 		errorfc(fc, "{,no}user_xattr options not supported");</div><div class='ctx'> #endif</div><div class='hunk'>@@ -518,16 +466,16 @@ static int erofs_fc_parse_param(struct fs_context *fc,</div><div class='ctx'> 	case Opt_acl:</div><div class='ctx'> #ifdef CONFIG_EROFS_FS_POSIX_ACL</div><div class='ctx'> 		if (result.boolean)</div><div class='del'>-			set_opt(&amp;ctx-&gt;opt, POSIX_ACL);</div><div class='add'>+			set_opt(&amp;sbi-&gt;opt, POSIX_ACL);</div><div class='ctx'> 		else</div><div class='del'>-			clear_opt(&amp;ctx-&gt;opt, POSIX_ACL);</div><div class='add'>+			clear_opt(&amp;sbi-&gt;opt, POSIX_ACL);</div><div class='ctx'> #else</div><div class='ctx'> 		errorfc(fc, "{,no}acl options not supported");</div><div class='ctx'> #endif</div><div class='ctx'> 		break;</div><div class='ctx'> 	case Opt_cache_strategy:</div><div class='ctx'> #ifdef CONFIG_EROFS_FS_ZIP</div><div class='del'>-		ctx-&gt;opt.cache_strategy = result.uint_32;</div><div class='add'>+		sbi-&gt;opt.cache_strategy = result.uint_32;</div><div class='ctx'> #else</div><div class='ctx'> 		errorfc(fc, "compression not supported, cache_strategy ignored");</div><div class='ctx'> #endif</div><div class='hunk'>@@ -549,175 +497,319 @@ static int erofs_fc_parse_param(struct fs_context *fc,</div><div class='ctx'> 			kfree(dif);</div><div class='ctx'> 			return -ENOMEM;</div><div class='ctx'> 		}</div><div class='del'>-		down_write(&amp;ctx-&gt;devs-&gt;rwsem);</div><div class='del'>-		ret = idr_alloc(&amp;ctx-&gt;devs-&gt;tree, dif, 0, 0, GFP_KERNEL);</div><div class='del'>-		up_write(&amp;ctx-&gt;devs-&gt;rwsem);</div><div class='add'>+		down_write(&amp;sbi-&gt;devs-&gt;rwsem);</div><div class='add'>+		ret = idr_alloc(&amp;sbi-&gt;devs-&gt;tree, dif, 0, 0, GFP_KERNEL);</div><div class='add'>+		up_write(&amp;sbi-&gt;devs-&gt;rwsem);</div><div class='ctx'> 		if (ret &lt; 0) {</div><div class='ctx'> 			kfree(dif-&gt;path);</div><div class='ctx'> 			kfree(dif);</div><div class='ctx'> 			return ret;</div><div class='ctx'> 		}</div><div class='del'>-		++ctx-&gt;devs-&gt;extra_devices;</div><div class='add'>+		++sbi-&gt;devs-&gt;extra_devices;</div><div class='add'>+		break;</div><div class='add'>+#ifdef CONFIG_EROFS_FS_ONDEMAND</div><div class='add'>+	case Opt_fsid:</div><div class='add'>+		kfree(sbi-&gt;fsid);</div><div class='add'>+		sbi-&gt;fsid = kstrdup(param-&gt;string, GFP_KERNEL);</div><div class='add'>+		if (!sbi-&gt;fsid)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_domain_id:</div><div class='add'>+		kfree(sbi-&gt;domain_id);</div><div class='add'>+		sbi-&gt;domain_id = kstrdup(param-&gt;string, GFP_KERNEL);</div><div class='add'>+		if (!sbi-&gt;domain_id)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+		break;</div><div class='add'>+#else</div><div class='add'>+	case Opt_fsid:</div><div class='add'>+	case Opt_domain_id:</div><div class='add'>+		errorfc(fc, "%s option not supported", erofs_fs_parameters[opt].name);</div><div class='add'>+		break;</div><div class='add'>+#endif</div><div class='add'>+	case Opt_directio:</div><div class='add'>+#ifdef CONFIG_EROFS_FS_BACKED_BY_FILE</div><div class='add'>+		if (result.boolean)</div><div class='add'>+			set_opt(&amp;sbi-&gt;opt, DIRECT_IO);</div><div class='add'>+		else</div><div class='add'>+			clear_opt(&amp;sbi-&gt;opt, DIRECT_IO);</div><div class='add'>+#else</div><div class='add'>+		errorfc(fc, "%s option not supported", erofs_fs_parameters[opt].name);</div><div class='add'>+#endif</div><div class='add'>+		break;</div><div class='add'>+	case Opt_fsoffset:</div><div class='add'>+		sbi-&gt;dif0.fsoff = result.uint_64;</div><div class='ctx'> 		break;</div><div class='del'>-	default:</div><div class='del'>-		return -ENOPARAM;</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_EROFS_FS_ZIP</div><div class='del'>-static const struct address_space_operations managed_cache_aops;</div><div class='del'>-</div><div class='del'>-static int erofs_managed_cache_releasepage(struct page *page, gfp_t gfp_mask)</div><div class='add'>+static int erofs_encode_fh(struct inode *inode, u32 *fh, int *max_len,</div><div class='add'>+			   struct inode *parent)</div><div class='ctx'> {</div><div class='del'>-	int ret = 1;	/* 0 - busy */</div><div class='del'>-	struct address_space *const mapping = page-&gt;mapping;</div><div class='add'>+	erofs_nid_t nid = EROFS_I(inode)-&gt;nid;</div><div class='add'>+	int len = parent ? 6 : 3;</div><div class='ctx'> </div><div class='del'>-	DBG_BUGON(!PageLocked(page));</div><div class='del'>-	DBG_BUGON(mapping-&gt;a_ops != &amp;managed_cache_aops);</div><div class='add'>+	if (*max_len &lt; len) {</div><div class='add'>+		*max_len = len;</div><div class='add'>+		return FILEID_INVALID;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (PagePrivate(page))</div><div class='del'>-		ret = erofs_try_to_free_cached_page(page);</div><div class='add'>+	fh[0] = (u32)(nid &gt;&gt; 32);</div><div class='add'>+	fh[1] = (u32)(nid &amp; 0xffffffff);</div><div class='add'>+	fh[2] = inode-&gt;i_generation;</div><div class='ctx'> </div><div class='del'>-	return ret;</div><div class='add'>+	if (parent) {</div><div class='add'>+		nid = EROFS_I(parent)-&gt;nid;</div><div class='add'>+</div><div class='add'>+		fh[3] = (u32)(nid &gt;&gt; 32);</div><div class='add'>+		fh[4] = (u32)(nid &amp; 0xffffffff);</div><div class='add'>+		fh[5] = parent-&gt;i_generation;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	*max_len = len;</div><div class='add'>+	return parent ? FILEID_INO64_GEN_PARENT : FILEID_INO64_GEN;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void erofs_managed_cache_invalidatepage(struct page *page,</div><div class='del'>-					       unsigned int offset,</div><div class='del'>-					       unsigned int length)</div><div class='add'>+static struct dentry *erofs_fh_to_dentry(struct super_block *sb,</div><div class='add'>+		struct fid *fid, int fh_len, int fh_type)</div><div class='ctx'> {</div><div class='del'>-	const unsigned int stop = length + offset;</div><div class='add'>+	if ((fh_type != FILEID_INO64_GEN &amp;&amp;</div><div class='add'>+	     fh_type != FILEID_INO64_GEN_PARENT) || fh_len &lt; 3)</div><div class='add'>+		return NULL;</div><div class='ctx'> </div><div class='del'>-	DBG_BUGON(!PageLocked(page));</div><div class='add'>+	return d_obtain_alias(erofs_iget(sb,</div><div class='add'>+		((u64)fid-&gt;raw[0] &lt;&lt; 32) | fid-&gt;raw[1]));</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	/* Check for potential overflow in debug mode */</div><div class='del'>-	DBG_BUGON(stop &gt; PAGE_SIZE || stop &lt; length);</div><div class='add'>+static struct dentry *erofs_fh_to_parent(struct super_block *sb,</div><div class='add'>+		struct fid *fid, int fh_len, int fh_type)</div><div class='add'>+{</div><div class='add'>+	if (fh_type != FILEID_INO64_GEN_PARENT || fh_len &lt; 6)</div><div class='add'>+		return NULL;</div><div class='ctx'> </div><div class='del'>-	if (offset == 0 &amp;&amp; stop == PAGE_SIZE)</div><div class='del'>-		while (!erofs_managed_cache_releasepage(page, GFP_NOFS))</div><div class='del'>-			cond_resched();</div><div class='add'>+	return d_obtain_alias(erofs_iget(sb,</div><div class='add'>+		((u64)fid-&gt;raw[3] &lt;&lt; 32) | fid-&gt;raw[4]));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static const struct address_space_operations managed_cache_aops = {</div><div class='del'>-	.releasepage = erofs_managed_cache_releasepage,</div><div class='del'>-	.invalidatepage = erofs_managed_cache_invalidatepage,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static int erofs_init_managed_cache(struct super_block *sb)</div><div class='add'>+static struct dentry *erofs_get_parent(struct dentry *child)</div><div class='ctx'> {</div><div class='del'>-	struct erofs_sb_info *const sbi = EROFS_SB(sb);</div><div class='del'>-	struct inode *const inode = new_inode(sb);</div><div class='add'>+	erofs_nid_t nid;</div><div class='add'>+	unsigned int d_type;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='del'>-	if (!inode)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	err = erofs_namei(d_inode(child), &amp;dotdot_name, &amp;nid, &amp;d_type);</div><div class='add'>+	if (err)</div><div class='add'>+		return ERR_PTR(err);</div><div class='add'>+	return d_obtain_alias(erofs_iget(child-&gt;d_sb, nid));</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	set_nlink(inode, 1);</div><div class='del'>-	inode-&gt;i_size = OFFSET_MAX;</div><div class='add'>+static const struct export_operations erofs_export_ops = {</div><div class='add'>+	.encode_fh = erofs_encode_fh,</div><div class='add'>+	.fh_to_dentry = erofs_fh_to_dentry,</div><div class='add'>+	.fh_to_parent = erofs_fh_to_parent,</div><div class='add'>+	.get_parent = erofs_get_parent,</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_mapping-&gt;a_ops = &amp;managed_cache_aops;</div><div class='del'>-	mapping_set_gfp_mask(inode-&gt;i_mapping,</div><div class='del'>-			     GFP_NOFS | __GFP_HIGHMEM | __GFP_MOVABLE);</div><div class='del'>-	sbi-&gt;managed_cache = inode;</div><div class='del'>-	return 0;</div><div class='add'>+static void erofs_set_sysfs_name(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct erofs_sb_info *sbi = EROFS_SB(sb);</div><div class='add'>+</div><div class='add'>+	if (sbi-&gt;domain_id)</div><div class='add'>+		super_set_sysfs_name_generic(sb, "%s,%s", sbi-&gt;domain_id,</div><div class='add'>+					     sbi-&gt;fsid);</div><div class='add'>+	else if (sbi-&gt;fsid)</div><div class='add'>+		super_set_sysfs_name_generic(sb, "%s", sbi-&gt;fsid);</div><div class='add'>+	else if (erofs_is_fileio_mode(sbi))</div><div class='add'>+		super_set_sysfs_name_generic(sb, "%s",</div><div class='add'>+					     bdi_dev_name(sb-&gt;s_bdi));</div><div class='add'>+	else</div><div class='add'>+		super_set_sysfs_name_id(sb);</div><div class='ctx'> }</div><div class='del'>-#else</div><div class='del'>-static int erofs_init_managed_cache(struct super_block *sb) { return 0; }</div><div class='del'>-#endif</div><div class='ctx'> </div><div class='ctx'> static int erofs_fc_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='del'>-	struct erofs_sb_info *sbi;</div><div class='del'>-	struct erofs_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct erofs_sb_info *sbi = EROFS_SB(sb);</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	sb-&gt;s_magic = EROFS_SUPER_MAGIC;</div><div class='add'>+	sb-&gt;s_flags |= SB_RDONLY | SB_NOATIME;</div><div class='add'>+	sb-&gt;s_maxbytes = MAX_LFS_FILESIZE;</div><div class='add'>+	sb-&gt;s_op = &amp;erofs_sops;</div><div class='ctx'> </div><div class='del'>-	if (!sb_set_blocksize(sb, EROFS_BLKSIZ)) {</div><div class='del'>-		erofs_err(sb, "failed to set erofs blksize");</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='add'>+	sbi-&gt;blkszbits = PAGE_SHIFT;</div><div class='add'>+	if (!sb-&gt;s_bdev) {</div><div class='add'>+		/*</div><div class='add'>+		 * (File-backed mounts) EROFS claims it's safe to nest other</div><div class='add'>+		 * fs contexts (including its own) due to self-controlled RO</div><div class='add'>+		 * accesses/contexts and no side-effect changes that need to</div><div class='add'>+		 * context save &amp; restore so it can reuse the current thread</div><div class='add'>+		 * context.  However, it still needs to bump `s_stack_depth` to</div><div class='add'>+		 * avoid kernel stack overflow from nested filesystems.</div><div class='add'>+		 */</div><div class='add'>+		if (erofs_is_fileio_mode(sbi)) {</div><div class='add'>+			sb-&gt;s_stack_depth =</div><div class='add'>+				file_inode(sbi-&gt;dif0.file)-&gt;i_sb-&gt;s_stack_depth + 1;</div><div class='add'>+			if (sb-&gt;s_stack_depth &gt; FILESYSTEM_MAX_STACK_DEPTH) {</div><div class='add'>+				erofs_err(sb, "maximum fs stacking depth exceeded");</div><div class='add'>+				return -ENOTBLK;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+		sb-&gt;s_blocksize = PAGE_SIZE;</div><div class='add'>+		sb-&gt;s_blocksize_bits = PAGE_SHIFT;</div><div class='ctx'> </div><div class='del'>-	sbi = kzalloc(sizeof(*sbi), GFP_KERNEL);</div><div class='del'>-	if (!sbi)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+		if (erofs_is_fscache_mode(sb)) {</div><div class='add'>+			err = erofs_fscache_register_fs(sb);</div><div class='add'>+			if (err)</div><div class='add'>+				return err;</div><div class='add'>+		}</div><div class='add'>+		err = super_setup_bdi(sb);</div><div class='add'>+		if (err)</div><div class='add'>+			return err;</div><div class='add'>+	} else {</div><div class='add'>+		if (!sb_set_blocksize(sb, PAGE_SIZE)) {</div><div class='add'>+			errorfc(fc, "failed to set initial blksize");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	sb-&gt;s_fs_info = sbi;</div><div class='del'>-	sbi-&gt;opt = ctx-&gt;opt;</div><div class='del'>-	sbi-&gt;dax_dev = fs_dax_get_by_bdev(sb-&gt;s_bdev);</div><div class='del'>-	sbi-&gt;devs = ctx-&gt;devs;</div><div class='del'>-	ctx-&gt;devs = NULL;</div><div class='add'>+		sbi-&gt;dif0.dax_dev = fs_dax_get_by_bdev(sb-&gt;s_bdev,</div><div class='add'>+				&amp;sbi-&gt;dif0.dax_part_off, NULL, NULL);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	err = erofs_read_superblock(sb);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	if (test_opt(&amp;sbi-&gt;opt, DAX_ALWAYS) &amp;&amp;</div><div class='del'>-	    !dax_supported(sbi-&gt;dax_dev, sb-&gt;s_bdev, EROFS_BLKSIZ, 0, bdev_nr_sectors(sb-&gt;s_bdev))) {</div><div class='del'>-		errorfc(fc, "DAX unsupported by block device. Turning off DAX.");</div><div class='add'>+	if (sb-&gt;s_blocksize_bits != sbi-&gt;blkszbits) {</div><div class='add'>+		if (erofs_is_fscache_mode(sb)) {</div><div class='add'>+			errorfc(fc, "unsupported blksize for fscache mode");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (erofs_is_fileio_mode(sbi)) {</div><div class='add'>+			sb-&gt;s_blocksize = 1 &lt;&lt; sbi-&gt;blkszbits;</div><div class='add'>+			sb-&gt;s_blocksize_bits = sbi-&gt;blkszbits;</div><div class='add'>+		} else if (!sb_set_blocksize(sb, 1 &lt;&lt; sbi-&gt;blkszbits)) {</div><div class='add'>+			errorfc(fc, "failed to set erofs blksize");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (sbi-&gt;dif0.fsoff) {</div><div class='add'>+		if (sbi-&gt;dif0.fsoff &amp; (sb-&gt;s_blocksize - 1))</div><div class='add'>+			return invalfc(fc, "fsoffset %llu is not aligned to block size %lu",</div><div class='add'>+				       sbi-&gt;dif0.fsoff, sb-&gt;s_blocksize);</div><div class='add'>+		if (erofs_is_fscache_mode(sb))</div><div class='add'>+			return invalfc(fc, "cannot use fsoffset in fscache mode");</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (test_opt(&amp;sbi-&gt;opt, DAX_ALWAYS) &amp;&amp; sbi-&gt;blkszbits != PAGE_SHIFT) {</div><div class='add'>+		erofs_info(sb, "unsupported blocksize for DAX");</div><div class='ctx'> 		clear_opt(&amp;sbi-&gt;opt, DAX_ALWAYS);</div><div class='ctx'> 	}</div><div class='del'>-	sb-&gt;s_flags |= SB_RDONLY | SB_NOATIME;</div><div class='del'>-	sb-&gt;s_maxbytes = MAX_LFS_FILESIZE;</div><div class='del'>-	sb-&gt;s_time_gran = 1;</div><div class='ctx'> </div><div class='del'>-	sb-&gt;s_op = &amp;erofs_sops;</div><div class='add'>+	sb-&gt;s_time_gran = 1;</div><div class='ctx'> 	sb-&gt;s_xattr = erofs_xattr_handlers;</div><div class='add'>+	sb-&gt;s_export_op = &amp;erofs_export_ops;</div><div class='ctx'> </div><div class='ctx'> 	if (test_opt(&amp;sbi-&gt;opt, POSIX_ACL))</div><div class='ctx'> 		sb-&gt;s_flags |= SB_POSIXACL;</div><div class='ctx'> 	else</div><div class='ctx'> 		sb-&gt;s_flags &amp;= ~SB_POSIXACL;</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_EROFS_FS_ZIP</div><div class='del'>-	xa_init(&amp;sbi-&gt;managed_pslots);</div><div class='del'>-#endif</div><div class='add'>+	err = z_erofs_init_super(sb);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='del'>-	/* get the root inode */</div><div class='del'>-	inode = erofs_iget(sb, ROOT_NID(sbi), true);</div><div class='add'>+	if (erofs_sb_has_fragments(sbi) &amp;&amp; sbi-&gt;packed_nid) {</div><div class='add'>+		inode = erofs_iget(sb, sbi-&gt;packed_nid);</div><div class='add'>+		if (IS_ERR(inode))</div><div class='add'>+			return PTR_ERR(inode);</div><div class='add'>+		sbi-&gt;packed_inode = inode;</div><div class='add'>+	}</div><div class='add'>+	if (erofs_sb_has_metabox(sbi)) {</div><div class='add'>+		inode = erofs_iget(sb, sbi-&gt;metabox_nid);</div><div class='add'>+		if (IS_ERR(inode))</div><div class='add'>+			return PTR_ERR(inode);</div><div class='add'>+		sbi-&gt;metabox_inode = inode;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	inode = erofs_iget(sb, sbi-&gt;root_nid);</div><div class='ctx'> 	if (IS_ERR(inode))</div><div class='ctx'> 		return PTR_ERR(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (!S_ISDIR(inode-&gt;i_mode)) {</div><div class='ctx'> 		erofs_err(sb, "rootino(nid %llu) is not a directory(i_mode %o)",</div><div class='del'>-			  ROOT_NID(sbi), inode-&gt;i_mode);</div><div class='add'>+			  sbi-&gt;root_nid, inode-&gt;i_mode);</div><div class='ctx'> 		iput(inode);</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='ctx'> 	sb-&gt;s_root = d_make_root(inode);</div><div class='ctx'> 	if (!sb-&gt;s_root)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	erofs_shrinker_register(sb);</div><div class='del'>-	/* sb-&gt;s_umount is already locked, SB_ACTIVE and SB_BORN are not set */</div><div class='del'>-	err = erofs_init_managed_cache(sb);</div><div class='add'>+	err = erofs_xattr_prefixes_init(sb);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	erofs_info(sb, "mounted with root inode @ nid %llu.", ROOT_NID(sbi));</div><div class='add'>+	erofs_set_sysfs_name(sb);</div><div class='add'>+	err = erofs_register_sysfs(sb);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	sbi-&gt;dir_ra_bytes = EROFS_DIR_RA_BYTES;</div><div class='add'>+	erofs_info(sb, "mounted with root inode @ nid %llu.", sbi-&gt;root_nid);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int erofs_fc_get_tree(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	return get_tree_bdev(fc, erofs_fc_fill_super);</div><div class='add'>+	struct erofs_sb_info *sbi = fc-&gt;s_fs_info;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (IS_ENABLED(CONFIG_EROFS_FS_ONDEMAND) &amp;&amp; sbi-&gt;fsid)</div><div class='add'>+		return get_tree_nodev(fc, erofs_fc_fill_super);</div><div class='add'>+</div><div class='add'>+	ret = get_tree_bdev_flags(fc, erofs_fc_fill_super,</div><div class='add'>+		IS_ENABLED(CONFIG_EROFS_FS_BACKED_BY_FILE) ?</div><div class='add'>+			GET_TREE_BDEV_QUIET_LOOKUP : 0);</div><div class='add'>+#ifdef CONFIG_EROFS_FS_BACKED_BY_FILE</div><div class='add'>+	if (ret == -ENOTBLK) {</div><div class='add'>+		struct file *file;</div><div class='add'>+</div><div class='add'>+		if (!fc-&gt;source)</div><div class='add'>+			return invalf(fc, "No source specified");</div><div class='add'>+		file = filp_open(fc-&gt;source, O_RDONLY | O_LARGEFILE, 0);</div><div class='add'>+		if (IS_ERR(file))</div><div class='add'>+			return PTR_ERR(file);</div><div class='add'>+		sbi-&gt;dif0.file = file;</div><div class='add'>+</div><div class='add'>+		if (S_ISREG(file_inode(sbi-&gt;dif0.file)-&gt;i_mode) &amp;&amp;</div><div class='add'>+		    sbi-&gt;dif0.file-&gt;f_mapping-&gt;a_ops-&gt;read_folio)</div><div class='add'>+			return get_tree_nodev(fc, erofs_fc_fill_super);</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int erofs_fc_reconfigure(struct fs_context *fc)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = fc-&gt;root-&gt;d_sb;</div><div class='ctx'> 	struct erofs_sb_info *sbi = EROFS_SB(sb);</div><div class='del'>-	struct erofs_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct erofs_sb_info *new_sbi = fc-&gt;s_fs_info;</div><div class='ctx'> </div><div class='ctx'> 	DBG_BUGON(!sb_rdonly(sb));</div><div class='ctx'> </div><div class='del'>-	if (test_opt(&amp;ctx-&gt;opt, POSIX_ACL))</div><div class='add'>+	if (new_sbi-&gt;fsid || new_sbi-&gt;domain_id)</div><div class='add'>+		erofs_info(sb, "ignoring reconfiguration for fsid|domain_id.");</div><div class='add'>+</div><div class='add'>+	if (test_opt(&amp;new_sbi-&gt;opt, POSIX_ACL))</div><div class='ctx'> 		fc-&gt;sb_flags |= SB_POSIXACL;</div><div class='ctx'> 	else</div><div class='ctx'> 		fc-&gt;sb_flags &amp;= ~SB_POSIXACL;</div><div class='ctx'> </div><div class='del'>-	sbi-&gt;opt = ctx-&gt;opt;</div><div class='add'>+	sbi-&gt;opt = new_sbi-&gt;opt;</div><div class='ctx'> </div><div class='ctx'> 	fc-&gt;sb_flags |= SB_RDONLY;</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -727,9 +819,11 @@ static int erofs_release_device_info(int id, void *ptr, void *data)</div><div class='ctx'> {</div><div class='ctx'> 	struct erofs_device_info *dif = ptr;</div><div class='ctx'> </div><div class='del'>-	fs_put_dax(dif-&gt;dax_dev);</div><div class='del'>-	if (dif-&gt;bdev)</div><div class='del'>-		blkdev_put(dif-&gt;bdev, FMODE_READ | FMODE_EXCL);</div><div class='add'>+	fs_put_dax(dif-&gt;dax_dev, NULL);</div><div class='add'>+	if (dif-&gt;file)</div><div class='add'>+		fput(dif-&gt;file);</div><div class='add'>+	erofs_fscache_unregister_cookie(dif-&gt;fscache);</div><div class='add'>+	dif-&gt;fscache = NULL;</div><div class='ctx'> 	kfree(dif-&gt;path);</div><div class='ctx'> 	kfree(dif);</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -744,12 +838,23 @@ static void erofs_free_dev_context(struct erofs_dev_context *devs)</div><div class='ctx'> 	kfree(devs);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void erofs_sb_free(struct erofs_sb_info *sbi)</div><div class='add'>+{</div><div class='add'>+	erofs_free_dev_context(sbi-&gt;devs);</div><div class='add'>+	kfree(sbi-&gt;fsid);</div><div class='add'>+	kfree(sbi-&gt;domain_id);</div><div class='add'>+	if (sbi-&gt;dif0.file)</div><div class='add'>+		fput(sbi-&gt;dif0.file);</div><div class='add'>+	kfree(sbi-&gt;volume_name);</div><div class='add'>+	kfree(sbi);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void erofs_fc_free(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	struct erofs_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct erofs_sb_info *sbi = fc-&gt;s_fs_info;</div><div class='ctx'> </div><div class='del'>-	erofs_free_dev_context(ctx-&gt;devs);</div><div class='del'>-	kfree(ctx);</div><div class='add'>+	if (sbi) /* free here if an error occurs before transferring to sb */</div><div class='add'>+		erofs_sb_free(sbi);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct fs_context_operations erofs_context_ops = {</div><div class='hunk'>@@ -761,58 +866,65 @@ static const struct fs_context_operations erofs_context_ops = {</div><div class='ctx'> </div><div class='ctx'> static int erofs_init_fs_context(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	struct erofs_fs_context *ctx = kzalloc(sizeof(*ctx), GFP_KERNEL);</div><div class='add'>+	struct erofs_sb_info *sbi;</div><div class='ctx'> </div><div class='del'>-	if (!ctx)</div><div class='add'>+	sbi = kzalloc(sizeof(*sbi), GFP_KERNEL);</div><div class='add'>+	if (!sbi)</div><div class='ctx'> 		return -ENOMEM;</div><div class='del'>-	ctx-&gt;devs = kzalloc(sizeof(struct erofs_dev_context), GFP_KERNEL);</div><div class='del'>-	if (!ctx-&gt;devs) {</div><div class='del'>-		kfree(ctx);</div><div class='add'>+</div><div class='add'>+	sbi-&gt;devs = kzalloc(sizeof(struct erofs_dev_context), GFP_KERNEL);</div><div class='add'>+	if (!sbi-&gt;devs) {</div><div class='add'>+		kfree(sbi);</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	}</div><div class='del'>-	fc-&gt;fs_private = ctx;</div><div class='add'>+	fc-&gt;s_fs_info = sbi;</div><div class='ctx'> </div><div class='del'>-	idr_init(&amp;ctx-&gt;devs-&gt;tree);</div><div class='del'>-	init_rwsem(&amp;ctx-&gt;devs-&gt;rwsem);</div><div class='del'>-	erofs_default_options(ctx);</div><div class='add'>+	idr_init(&amp;sbi-&gt;devs-&gt;tree);</div><div class='add'>+	init_rwsem(&amp;sbi-&gt;devs-&gt;rwsem);</div><div class='add'>+	erofs_default_options(sbi);</div><div class='ctx'> 	fc-&gt;ops = &amp;erofs_context_ops;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * could be triggered after deactivate_locked_super()</div><div class='del'>- * is called, thus including umount and failed to initialize.</div><div class='del'>- */</div><div class='del'>-static void erofs_kill_sb(struct super_block *sb)</div><div class='add'>+static void erofs_drop_internal_inodes(struct erofs_sb_info *sbi)</div><div class='ctx'> {</div><div class='del'>-	struct erofs_sb_info *sbi;</div><div class='del'>-</div><div class='del'>-	WARN_ON(sb-&gt;s_magic != EROFS_SUPER_MAGIC);</div><div class='del'>-</div><div class='del'>-	kill_block_super(sb);</div><div class='add'>+	iput(sbi-&gt;packed_inode);</div><div class='add'>+	sbi-&gt;packed_inode = NULL;</div><div class='add'>+	iput(sbi-&gt;metabox_inode);</div><div class='add'>+	sbi-&gt;metabox_inode = NULL;</div><div class='add'>+#ifdef CONFIG_EROFS_FS_ZIP</div><div class='add'>+	iput(sbi-&gt;managed_cache);</div><div class='add'>+	sbi-&gt;managed_cache = NULL;</div><div class='add'>+#endif</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	sbi = EROFS_SB(sb);</div><div class='del'>-	if (!sbi)</div><div class='del'>-		return;</div><div class='add'>+static void erofs_kill_sb(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct erofs_sb_info *sbi = EROFS_SB(sb);</div><div class='ctx'> </div><div class='del'>-	erofs_free_dev_context(sbi-&gt;devs);</div><div class='del'>-	fs_put_dax(sbi-&gt;dax_dev);</div><div class='del'>-	kfree(sbi);</div><div class='add'>+	if ((IS_ENABLED(CONFIG_EROFS_FS_ONDEMAND) &amp;&amp; sbi-&gt;fsid) ||</div><div class='add'>+	    sbi-&gt;dif0.file)</div><div class='add'>+		kill_anon_super(sb);</div><div class='add'>+	else</div><div class='add'>+		kill_block_super(sb);</div><div class='add'>+	erofs_drop_internal_inodes(sbi);</div><div class='add'>+	fs_put_dax(sbi-&gt;dif0.dax_dev, NULL);</div><div class='add'>+	erofs_fscache_unregister_fs(sb);</div><div class='add'>+	erofs_sb_free(sbi);</div><div class='ctx'> 	sb-&gt;s_fs_info = NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* called when -&gt;s_root is non-NULL */</div><div class='ctx'> static void erofs_put_super(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct erofs_sb_info *const sbi = EROFS_SB(sb);</div><div class='ctx'> </div><div class='del'>-	DBG_BUGON(!sbi);</div><div class='del'>-</div><div class='add'>+	erofs_unregister_sysfs(sb);</div><div class='ctx'> 	erofs_shrinker_unregister(sb);</div><div class='del'>-#ifdef CONFIG_EROFS_FS_ZIP</div><div class='del'>-	iput(sbi-&gt;managed_cache);</div><div class='del'>-	sbi-&gt;managed_cache = NULL;</div><div class='del'>-#endif</div><div class='add'>+	erofs_xattr_prefixes_cleanup(sb);</div><div class='add'>+	erofs_drop_internal_inodes(sbi);</div><div class='add'>+	erofs_free_dev_context(sbi-&gt;devs);</div><div class='add'>+	sbi-&gt;devs = NULL;</div><div class='add'>+	erofs_fscache_unregister_fs(sb);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct file_system_type erofs_fs_type = {</div><div class='hunk'>@@ -820,7 +932,7 @@ static struct file_system_type erofs_fs_type = {</div><div class='ctx'> 	.name           = "erofs",</div><div class='ctx'> 	.init_fs_context = erofs_init_fs_context,</div><div class='ctx'> 	.kill_sb        = erofs_kill_sb,</div><div class='del'>-	.fs_flags       = FS_REQUIRES_DEV,</div><div class='add'>+	.fs_flags       = FS_REQUIRES_DEV | FS_ALLOW_IDMAP,</div><div class='ctx'> };</div><div class='ctx'> MODULE_ALIAS_FS("erofs");</div><div class='ctx'> </div><div class='hunk'>@@ -831,26 +943,23 @@ static int __init erofs_module_init(void)</div><div class='ctx'> 	erofs_check_ondisk_layout_definitions();</div><div class='ctx'> </div><div class='ctx'> 	erofs_inode_cachep = kmem_cache_create("erofs_inode",</div><div class='del'>-					       sizeof(struct erofs_inode), 0,</div><div class='del'>-					       SLAB_RECLAIM_ACCOUNT,</div><div class='del'>-					       erofs_inode_init_once);</div><div class='del'>-	if (!erofs_inode_cachep) {</div><div class='del'>-		err = -ENOMEM;</div><div class='del'>-		goto icache_err;</div><div class='del'>-	}</div><div class='add'>+			sizeof(struct erofs_inode), 0,</div><div class='add'>+			SLAB_RECLAIM_ACCOUNT | SLAB_ACCOUNT,</div><div class='add'>+			erofs_inode_init_once);</div><div class='add'>+	if (!erofs_inode_cachep)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	err = erofs_init_shrinker();</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto shrinker_err;</div><div class='ctx'> </div><div class='del'>-	err = z_erofs_lzma_init();</div><div class='add'>+	err = z_erofs_init_subsystem();</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto lzma_err;</div><div class='add'>+		goto zip_err;</div><div class='ctx'> </div><div class='del'>-	erofs_pcpubuf_init();</div><div class='del'>-	err = z_erofs_init_zip_subsystem();</div><div class='add'>+	err = erofs_init_sysfs();</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto zip_err;</div><div class='add'>+		goto sysfs_err;</div><div class='ctx'> </div><div class='ctx'> 	err = register_filesystem(&amp;erofs_fs_type);</div><div class='ctx'> 	if (err)</div><div class='hunk'>@@ -859,14 +968,13 @@ static int __init erofs_module_init(void)</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> fs_err:</div><div class='del'>-	z_erofs_exit_zip_subsystem();</div><div class='add'>+	erofs_exit_sysfs();</div><div class='add'>+sysfs_err:</div><div class='add'>+	z_erofs_exit_subsystem();</div><div class='ctx'> zip_err:</div><div class='del'>-	z_erofs_lzma_exit();</div><div class='del'>-lzma_err:</div><div class='ctx'> 	erofs_exit_shrinker();</div><div class='ctx'> shrinker_err:</div><div class='ctx'> 	kmem_cache_destroy(erofs_inode_cachep);</div><div class='del'>-icache_err:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -877,31 +985,30 @@ static void __exit erofs_module_exit(void)</div><div class='ctx'> 	/* Ensure all RCU free inodes / pclusters are safe to be destroyed. */</div><div class='ctx'> 	rcu_barrier();</div><div class='ctx'> </div><div class='del'>-	z_erofs_exit_zip_subsystem();</div><div class='del'>-	z_erofs_lzma_exit();</div><div class='add'>+	erofs_exit_sysfs();</div><div class='add'>+	z_erofs_exit_subsystem();</div><div class='ctx'> 	erofs_exit_shrinker();</div><div class='ctx'> 	kmem_cache_destroy(erofs_inode_cachep);</div><div class='del'>-	erofs_pcpubuf_exit();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* get filesystem statistics */</div><div class='ctx'> static int erofs_statfs(struct dentry *dentry, struct kstatfs *buf)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = dentry-&gt;d_sb;</div><div class='ctx'> 	struct erofs_sb_info *sbi = EROFS_SB(sb);</div><div class='del'>-	u64 id = huge_encode_dev(sb-&gt;s_bdev-&gt;bd_dev);</div><div class='ctx'> </div><div class='ctx'> 	buf-&gt;f_type = sb-&gt;s_magic;</div><div class='del'>-	buf-&gt;f_bsize = EROFS_BLKSIZ;</div><div class='add'>+	buf-&gt;f_bsize = sb-&gt;s_blocksize;</div><div class='ctx'> 	buf-&gt;f_blocks = sbi-&gt;total_blocks;</div><div class='ctx'> 	buf-&gt;f_bfree = buf-&gt;f_bavail = 0;</div><div class='del'>-</div><div class='ctx'> 	buf-&gt;f_files = ULLONG_MAX;</div><div class='ctx'> 	buf-&gt;f_ffree = ULLONG_MAX - sbi-&gt;inos;</div><div class='del'>-</div><div class='ctx'> 	buf-&gt;f_namelen = EROFS_NAME_LEN;</div><div class='ctx'> </div><div class='del'>-	buf-&gt;f_fsid    = u64_to_fsid(id);</div><div class='add'>+	if (uuid_is_null(&amp;sb-&gt;s_uuid))</div><div class='add'>+		buf-&gt;f_fsid = u64_to_fsid(!sb-&gt;s_bdev ? 0 :</div><div class='add'>+				huge_encode_dev(sb-&gt;s_bdev-&gt;bd_dev));</div><div class='add'>+	else</div><div class='add'>+		buf-&gt;f_fsid = uuid_to_fsid(sb-&gt;s_uuid.b);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -910,37 +1017,47 @@ static int erofs_show_options(struct seq_file *seq, struct dentry *root)</div><div class='ctx'> 	struct erofs_sb_info *sbi = EROFS_SB(root-&gt;d_sb);</div><div class='ctx'> 	struct erofs_mount_opts *opt = &amp;sbi-&gt;opt;</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_EROFS_FS_XATTR</div><div class='del'>-	if (test_opt(opt, XATTR_USER))</div><div class='del'>-		seq_puts(seq, ",user_xattr");</div><div class='del'>-	else</div><div class='del'>-		seq_puts(seq, ",nouser_xattr");</div><div class='del'>-#endif</div><div class='del'>-#ifdef CONFIG_EROFS_FS_POSIX_ACL</div><div class='del'>-	if (test_opt(opt, POSIX_ACL))</div><div class='del'>-		seq_puts(seq, ",acl");</div><div class='del'>-	else</div><div class='del'>-		seq_puts(seq, ",noacl");</div><div class='del'>-#endif</div><div class='del'>-#ifdef CONFIG_EROFS_FS_ZIP</div><div class='del'>-	if (opt-&gt;cache_strategy == EROFS_ZIP_CACHE_DISABLED)</div><div class='del'>-		seq_puts(seq, ",cache_strategy=disabled");</div><div class='del'>-	else if (opt-&gt;cache_strategy == EROFS_ZIP_CACHE_READAHEAD)</div><div class='del'>-		seq_puts(seq, ",cache_strategy=readahead");</div><div class='del'>-	else if (opt-&gt;cache_strategy == EROFS_ZIP_CACHE_READAROUND)</div><div class='del'>-		seq_puts(seq, ",cache_strategy=readaround");</div><div class='del'>-#endif</div><div class='add'>+	if (IS_ENABLED(CONFIG_EROFS_FS_XATTR))</div><div class='add'>+		seq_puts(seq, test_opt(opt, XATTR_USER) ?</div><div class='add'>+				",user_xattr" : ",nouser_xattr");</div><div class='add'>+	if (IS_ENABLED(CONFIG_EROFS_FS_POSIX_ACL))</div><div class='add'>+		seq_puts(seq, test_opt(opt, POSIX_ACL) ? ",acl" : ",noacl");</div><div class='add'>+	if (IS_ENABLED(CONFIG_EROFS_FS_ZIP))</div><div class='add'>+		seq_printf(seq, ",cache_strategy=%s",</div><div class='add'>+			  erofs_param_cache_strategy[opt-&gt;cache_strategy].name);</div><div class='ctx'> 	if (test_opt(opt, DAX_ALWAYS))</div><div class='ctx'> 		seq_puts(seq, ",dax=always");</div><div class='ctx'> 	if (test_opt(opt, DAX_NEVER))</div><div class='ctx'> 		seq_puts(seq, ",dax=never");</div><div class='add'>+	if (erofs_is_fileio_mode(sbi) &amp;&amp; test_opt(opt, DIRECT_IO))</div><div class='add'>+		seq_puts(seq, ",directio");</div><div class='add'>+#ifdef CONFIG_EROFS_FS_ONDEMAND</div><div class='add'>+	if (sbi-&gt;fsid)</div><div class='add'>+		seq_printf(seq, ",fsid=%s", sbi-&gt;fsid);</div><div class='add'>+	if (sbi-&gt;domain_id)</div><div class='add'>+		seq_printf(seq, ",domain_id=%s", sbi-&gt;domain_id);</div><div class='add'>+#endif</div><div class='add'>+	if (sbi-&gt;dif0.fsoff)</div><div class='add'>+		seq_printf(seq, ",fsoffset=%llu", sbi-&gt;dif0.fsoff);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void erofs_evict_inode(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+#ifdef CONFIG_FS_DAX</div><div class='add'>+	if (IS_DAX(inode))</div><div class='add'>+		dax_break_layout_final(inode);</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+	truncate_inode_pages_final(&amp;inode-&gt;i_data);</div><div class='add'>+	clear_inode(inode);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> const struct super_operations erofs_sops = {</div><div class='ctx'> 	.put_super = erofs_put_super,</div><div class='ctx'> 	.alloc_inode = erofs_alloc_inode,</div><div class='ctx'> 	.free_inode = erofs_free_inode,</div><div class='add'>+	.evict_inode = erofs_evict_inode,</div><div class='ctx'> 	.statfs = erofs_statfs,</div><div class='ctx'> 	.show_options = erofs_show_options,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/erofs/sysfs.c b/fs/erofs/sysfs.c<br/>new file mode 100644<br/>index 000000000000..1e0658a1d95b<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/erofs/sysfs.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/erofs/sysfs.c</a></div><div class='hunk'>@@ -0,0 +1,305 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='add'>+/*</div><div class='add'>+ * Copyright (C), 2008-2021, OPPO Mobile Comm Corp., Ltd.</div><div class='add'>+ *             https://www.oppo.com/</div><div class='add'>+ */</div><div class='add'>+#include &lt;linux/sysfs.h&gt;</div><div class='add'>+#include &lt;linux/kobject.h&gt;</div><div class='add'>+</div><div class='add'>+#include "internal.h"</div><div class='add'>+#include "compress.h"</div><div class='add'>+</div><div class='add'>+enum {</div><div class='add'>+	attr_feature,</div><div class='add'>+	attr_drop_caches,</div><div class='add'>+	attr_pointer_ui,</div><div class='add'>+	attr_pointer_bool,</div><div class='add'>+	attr_accel,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+enum {</div><div class='add'>+	struct_erofs_sb_info,</div><div class='add'>+	struct_erofs_mount_opts,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct erofs_attr {</div><div class='add'>+	struct attribute attr;</div><div class='add'>+	short attr_id;</div><div class='add'>+	int struct_type, offset;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+#define EROFS_ATTR(_name, _mode, _id)					\</div><div class='add'>+static struct erofs_attr erofs_attr_##_name = {				\</div><div class='add'>+	.attr = {.name = __stringify(_name), .mode = _mode },		\</div><div class='add'>+	.attr_id = attr_##_id,						\</div><div class='add'>+}</div><div class='add'>+#define EROFS_ATTR_FUNC(_name, _mode)	EROFS_ATTR(_name, _mode, _name)</div><div class='add'>+#define EROFS_ATTR_FEATURE(_name)	EROFS_ATTR(_name, 0444, feature)</div><div class='add'>+</div><div class='add'>+#define EROFS_ATTR_OFFSET(_name, _mode, _id, _struct)	\</div><div class='add'>+static struct erofs_attr erofs_attr_##_name = {			\</div><div class='add'>+	.attr = {.name = __stringify(_name), .mode = _mode },	\</div><div class='add'>+	.attr_id = attr_##_id,					\</div><div class='add'>+	.struct_type = struct_##_struct,			\</div><div class='add'>+	.offset = offsetof(struct _struct, _name),\</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define EROFS_ATTR_RW(_name, _id, _struct)	\</div><div class='add'>+	EROFS_ATTR_OFFSET(_name, 0644, _id, _struct)</div><div class='add'>+</div><div class='add'>+#define EROFS_RO_ATTR(_name, _id, _struct)	\</div><div class='add'>+	EROFS_ATTR_OFFSET(_name, 0444, _id, _struct)</div><div class='add'>+</div><div class='add'>+#define EROFS_ATTR_RW_UI(_name, _struct)	\</div><div class='add'>+	EROFS_ATTR_RW(_name, pointer_ui, _struct)</div><div class='add'>+</div><div class='add'>+#define EROFS_ATTR_RW_BOOL(_name, _struct)	\</div><div class='add'>+	EROFS_ATTR_RW(_name, pointer_bool, _struct)</div><div class='add'>+</div><div class='add'>+#define ATTR_LIST(name) (&amp;erofs_attr_##name.attr)</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_EROFS_FS_ZIP</div><div class='add'>+EROFS_ATTR_RW_UI(sync_decompress, erofs_mount_opts);</div><div class='add'>+EROFS_ATTR_FUNC(drop_caches, 0200);</div><div class='add'>+#endif</div><div class='add'>+#ifdef CONFIG_EROFS_FS_ZIP_ACCEL</div><div class='add'>+EROFS_ATTR_FUNC(accel, 0644);</div><div class='add'>+#endif</div><div class='add'>+EROFS_ATTR_RW_UI(dir_ra_bytes, erofs_sb_info);</div><div class='add'>+</div><div class='add'>+static struct attribute *erofs_sb_attrs[] = {</div><div class='add'>+#ifdef CONFIG_EROFS_FS_ZIP</div><div class='add'>+	ATTR_LIST(sync_decompress),</div><div class='add'>+	ATTR_LIST(drop_caches),</div><div class='add'>+#endif</div><div class='add'>+	ATTR_LIST(dir_ra_bytes),</div><div class='add'>+	NULL,</div><div class='add'>+};</div><div class='add'>+ATTRIBUTE_GROUPS(erofs_sb);</div><div class='add'>+</div><div class='add'>+static struct attribute *erofs_attrs[] = {</div><div class='add'>+#ifdef CONFIG_EROFS_FS_ZIP_ACCEL</div><div class='add'>+	ATTR_LIST(accel),</div><div class='add'>+#endif</div><div class='add'>+	NULL,</div><div class='add'>+};</div><div class='add'>+ATTRIBUTE_GROUPS(erofs);</div><div class='add'>+</div><div class='add'>+/* Features this copy of erofs supports */</div><div class='add'>+EROFS_ATTR_FEATURE(zero_padding);</div><div class='add'>+EROFS_ATTR_FEATURE(compr_cfgs);</div><div class='add'>+EROFS_ATTR_FEATURE(big_pcluster);</div><div class='add'>+EROFS_ATTR_FEATURE(chunked_file);</div><div class='add'>+EROFS_ATTR_FEATURE(device_table);</div><div class='add'>+EROFS_ATTR_FEATURE(compr_head2);</div><div class='add'>+EROFS_ATTR_FEATURE(sb_chksum);</div><div class='add'>+EROFS_ATTR_FEATURE(ztailpacking);</div><div class='add'>+EROFS_ATTR_FEATURE(fragments);</div><div class='add'>+EROFS_ATTR_FEATURE(dedupe);</div><div class='add'>+EROFS_ATTR_FEATURE(48bit);</div><div class='add'>+EROFS_ATTR_FEATURE(metabox);</div><div class='add'>+</div><div class='add'>+static struct attribute *erofs_feat_attrs[] = {</div><div class='add'>+	ATTR_LIST(zero_padding),</div><div class='add'>+	ATTR_LIST(compr_cfgs),</div><div class='add'>+	ATTR_LIST(big_pcluster),</div><div class='add'>+	ATTR_LIST(chunked_file),</div><div class='add'>+	ATTR_LIST(device_table),</div><div class='add'>+	ATTR_LIST(compr_head2),</div><div class='add'>+	ATTR_LIST(sb_chksum),</div><div class='add'>+	ATTR_LIST(ztailpacking),</div><div class='add'>+	ATTR_LIST(fragments),</div><div class='add'>+	ATTR_LIST(dedupe),</div><div class='add'>+	ATTR_LIST(48bit),</div><div class='add'>+	ATTR_LIST(metabox),</div><div class='add'>+	NULL,</div><div class='add'>+};</div><div class='add'>+ATTRIBUTE_GROUPS(erofs_feat);</div><div class='add'>+</div><div class='add'>+static unsigned char *__struct_ptr(struct erofs_sb_info *sbi,</div><div class='add'>+					  int struct_type, int offset)</div><div class='add'>+{</div><div class='add'>+	if (struct_type == struct_erofs_sb_info)</div><div class='add'>+		return (unsigned char *)sbi + offset;</div><div class='add'>+	if (struct_type == struct_erofs_mount_opts)</div><div class='add'>+		return (unsigned char *)&amp;sbi-&gt;opt + offset;</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t erofs_attr_show(struct kobject *kobj,</div><div class='add'>+				struct attribute *attr, char *buf)</div><div class='add'>+{</div><div class='add'>+	struct erofs_sb_info *sbi = container_of(kobj, struct erofs_sb_info,</div><div class='add'>+						s_kobj);</div><div class='add'>+	struct erofs_attr *a = container_of(attr, struct erofs_attr, attr);</div><div class='add'>+	unsigned char *ptr = __struct_ptr(sbi, a-&gt;struct_type, a-&gt;offset);</div><div class='add'>+</div><div class='add'>+	switch (a-&gt;attr_id) {</div><div class='add'>+	case attr_feature:</div><div class='add'>+		return sysfs_emit(buf, "supported\n");</div><div class='add'>+	case attr_pointer_ui:</div><div class='add'>+		if (!ptr)</div><div class='add'>+			return 0;</div><div class='add'>+		return sysfs_emit(buf, "%u\n", *(unsigned int *)ptr);</div><div class='add'>+	case attr_pointer_bool:</div><div class='add'>+		if (!ptr)</div><div class='add'>+			return 0;</div><div class='add'>+		return sysfs_emit(buf, "%d\n", *(bool *)ptr);</div><div class='add'>+	case attr_accel:</div><div class='add'>+		return z_erofs_crypto_show_engines(buf, PAGE_SIZE, '\n');</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t erofs_attr_store(struct kobject *kobj, struct attribute *attr,</div><div class='add'>+				const char *buf, size_t len)</div><div class='add'>+{</div><div class='add'>+	struct erofs_sb_info *sbi = container_of(kobj, struct erofs_sb_info,</div><div class='add'>+						s_kobj);</div><div class='add'>+	struct erofs_attr *a = container_of(attr, struct erofs_attr, attr);</div><div class='add'>+	unsigned char *ptr = __struct_ptr(sbi, a-&gt;struct_type, a-&gt;offset);</div><div class='add'>+	unsigned long t;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	switch (a-&gt;attr_id) {</div><div class='add'>+	case attr_pointer_ui:</div><div class='add'>+		if (!ptr)</div><div class='add'>+			return 0;</div><div class='add'>+		ret = kstrtoul(skip_spaces(buf), 0, &amp;t);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		if (t != (unsigned int)t)</div><div class='add'>+			return -ERANGE;</div><div class='add'>+#ifdef CONFIG_EROFS_FS_ZIP</div><div class='add'>+		if (!strcmp(a-&gt;attr.name, "sync_decompress") &amp;&amp;</div><div class='add'>+		    (t &gt; EROFS_SYNC_DECOMPRESS_FORCE_OFF))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+#endif</div><div class='add'>+		*(unsigned int *)ptr = t;</div><div class='add'>+		return len;</div><div class='add'>+	case attr_pointer_bool:</div><div class='add'>+		if (!ptr)</div><div class='add'>+			return 0;</div><div class='add'>+		ret = kstrtoul(skip_spaces(buf), 0, &amp;t);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		if (t != 0 &amp;&amp; t != 1)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		*(bool *)ptr = !!t;</div><div class='add'>+		return len;</div><div class='add'>+#ifdef CONFIG_EROFS_FS_ZIP</div><div class='add'>+	case attr_drop_caches:</div><div class='add'>+		ret = kstrtoul(skip_spaces(buf), 0, &amp;t);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		if (t &lt; 1 || t &gt; 3)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+</div><div class='add'>+		if (t &amp; 2)</div><div class='add'>+			z_erofs_shrink_scan(sbi, ~0UL);</div><div class='add'>+		if (t &amp; 1)</div><div class='add'>+			invalidate_mapping_pages(MNGD_MAPPING(sbi), 0, -1);</div><div class='add'>+		return len;</div><div class='add'>+#endif</div><div class='add'>+#ifdef CONFIG_EROFS_FS_ZIP_ACCEL</div><div class='add'>+	case attr_accel:</div><div class='add'>+		buf = skip_spaces(buf);</div><div class='add'>+		z_erofs_crypto_disable_all_engines();</div><div class='add'>+		while (*buf) {</div><div class='add'>+			t = strcspn(buf, "\n");</div><div class='add'>+			ret = z_erofs_crypto_enable_engine(buf, t);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				return ret;</div><div class='add'>+			buf += buf[t] != '\0' ? t + 1 : t;</div><div class='add'>+		}</div><div class='add'>+		return len;</div><div class='add'>+#endif</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void erofs_sb_release(struct kobject *kobj)</div><div class='add'>+{</div><div class='add'>+	struct erofs_sb_info *sbi = container_of(kobj, struct erofs_sb_info,</div><div class='add'>+						 s_kobj);</div><div class='add'>+	complete(&amp;sbi-&gt;s_kobj_unregister);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct sysfs_ops erofs_attr_ops = {</div><div class='add'>+	.show	= erofs_attr_show,</div><div class='add'>+	.store	= erofs_attr_store,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct kobj_type erofs_sb_ktype = {</div><div class='add'>+	.default_groups = erofs_sb_groups,</div><div class='add'>+	.sysfs_ops	= &amp;erofs_attr_ops,</div><div class='add'>+	.release	= erofs_sb_release,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct kobj_type erofs_ktype = {</div><div class='add'>+	.default_groups = erofs_groups,</div><div class='add'>+	.sysfs_ops	= &amp;erofs_attr_ops,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static struct kset erofs_root = {</div><div class='add'>+	.kobj	= {.ktype = &amp;erofs_ktype},</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct kobj_type erofs_feat_ktype = {</div><div class='add'>+	.default_groups = erofs_feat_groups,</div><div class='add'>+	.sysfs_ops	= &amp;erofs_attr_ops,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static struct kobject erofs_feat = {</div><div class='add'>+	.kset	= &amp;erofs_root,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+int erofs_register_sysfs(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct erofs_sb_info *sbi = EROFS_SB(sb);</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	sbi-&gt;s_kobj.kset = &amp;erofs_root;</div><div class='add'>+	init_completion(&amp;sbi-&gt;s_kobj_unregister);</div><div class='add'>+	err = kobject_init_and_add(&amp;sbi-&gt;s_kobj, &amp;erofs_sb_ktype, NULL, "%s",</div><div class='add'>+				   sb-&gt;s_sysfs_name);</div><div class='add'>+	if (err) {</div><div class='add'>+		kobject_put(&amp;sbi-&gt;s_kobj);</div><div class='add'>+		wait_for_completion(&amp;sbi-&gt;s_kobj_unregister);</div><div class='add'>+	}</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void erofs_unregister_sysfs(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct erofs_sb_info *sbi = EROFS_SB(sb);</div><div class='add'>+</div><div class='add'>+	if (sbi-&gt;s_kobj.state_in_sysfs) {</div><div class='add'>+		kobject_del(&amp;sbi-&gt;s_kobj);</div><div class='add'>+		kobject_put(&amp;sbi-&gt;s_kobj);</div><div class='add'>+		wait_for_completion(&amp;sbi-&gt;s_kobj_unregister);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void erofs_exit_sysfs(void)</div><div class='add'>+{</div><div class='add'>+	kobject_put(&amp;erofs_feat);</div><div class='add'>+	kset_unregister(&amp;erofs_root);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int __init erofs_init_sysfs(void)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	kobject_set_name(&amp;erofs_root.kobj, "erofs");</div><div class='add'>+	erofs_root.kobj.parent = fs_kobj;</div><div class='add'>+	ret = kset_register(&amp;erofs_root);</div><div class='add'>+	if (!ret) {</div><div class='add'>+		ret = kobject_init_and_add(&amp;erofs_feat, &amp;erofs_feat_ktype,</div><div class='add'>+					   NULL, "features");</div><div class='add'>+		if (!ret)</div><div class='add'>+			return 0;</div><div class='add'>+		erofs_exit_sysfs();</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/erofs/tagptr.h b/fs/erofs/tagptr.h<br/>deleted file mode 100644<br/>index 64ceb7270b5c..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/erofs/tagptr.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/tagptr.h</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,107 +0,0 @@</div><div class='del'>-/* SPDX-License-Identifier: GPL-2.0-only */</div><div class='del'>-/*</div><div class='del'>- * A tagged pointer implementation</div><div class='del'>- */</div><div class='del'>-#ifndef __EROFS_FS_TAGPTR_H</div><div class='del'>-#define __EROFS_FS_TAGPTR_H</div><div class='del'>-</div><div class='del'>-#include &lt;linux/types.h&gt;</div><div class='del'>-#include &lt;linux/build_bug.h&gt;</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * the name of tagged pointer types are tagptr{1, 2, 3...}_t</div><div class='del'>- * avoid directly using the internal structs __tagptr{1, 2, 3...}</div><div class='del'>- */</div><div class='del'>-#define __MAKE_TAGPTR(n) \</div><div class='del'>-typedef struct __tagptr##n {	\</div><div class='del'>-	uintptr_t v;	\</div><div class='del'>-} tagptr##n##_t;</div><div class='del'>-</div><div class='del'>-__MAKE_TAGPTR(1)</div><div class='del'>-__MAKE_TAGPTR(2)</div><div class='del'>-__MAKE_TAGPTR(3)</div><div class='del'>-__MAKE_TAGPTR(4)</div><div class='del'>-</div><div class='del'>-#undef __MAKE_TAGPTR</div><div class='del'>-</div><div class='del'>-extern void __compiletime_error("bad tagptr tags")</div><div class='del'>-	__bad_tagptr_tags(void);</div><div class='del'>-</div><div class='del'>-extern void __compiletime_error("bad tagptr type")</div><div class='del'>-	__bad_tagptr_type(void);</div><div class='del'>-</div><div class='del'>-/* fix the broken usage of "#define tagptr2_t tagptr3_t" by users */</div><div class='del'>-#define __tagptr_mask_1(ptr, n)	\</div><div class='del'>-	__builtin_types_compatible_p(typeof(ptr), struct __tagptr##n) ? \</div><div class='del'>-		(1UL &lt;&lt; (n)) - 1 :</div><div class='del'>-</div><div class='del'>-#define __tagptr_mask(ptr)	(\</div><div class='del'>-	__tagptr_mask_1(ptr, 1) ( \</div><div class='del'>-	__tagptr_mask_1(ptr, 2) ( \</div><div class='del'>-	__tagptr_mask_1(ptr, 3) ( \</div><div class='del'>-	__tagptr_mask_1(ptr, 4) ( \</div><div class='del'>-	__bad_tagptr_type(), 0)))))</div><div class='del'>-</div><div class='del'>-/* generate a tagged pointer from a raw value */</div><div class='del'>-#define tagptr_init(type, val) \</div><div class='del'>-	((typeof(type)){ .v = (uintptr_t)(val) })</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * directly cast a tagged pointer to the native pointer type, which</div><div class='del'>- * could be used for backward compatibility of existing code.</div><div class='del'>- */</div><div class='del'>-#define tagptr_cast_ptr(tptr) ((void *)(tptr).v)</div><div class='del'>-</div><div class='del'>-/* encode tagged pointers */</div><div class='del'>-#define tagptr_fold(type, ptr, _tags) ({ \</div><div class='del'>-	const typeof(_tags) tags = (_tags); \</div><div class='del'>-	if (__builtin_constant_p(tags) &amp;&amp; (tags &amp; ~__tagptr_mask(type))) \</div><div class='del'>-		__bad_tagptr_tags(); \</div><div class='del'>-tagptr_init(type, (uintptr_t)(ptr) | tags); })</div><div class='del'>-</div><div class='del'>-/* decode tagged pointers */</div><div class='del'>-#define tagptr_unfold_ptr(tptr) \</div><div class='del'>-	((void *)((tptr).v &amp; ~__tagptr_mask(tptr)))</div><div class='del'>-</div><div class='del'>-#define tagptr_unfold_tags(tptr) \</div><div class='del'>-	((tptr).v &amp; __tagptr_mask(tptr))</div><div class='del'>-</div><div class='del'>-/* operations for the tagger pointer */</div><div class='del'>-#define tagptr_eq(_tptr1, _tptr2) ({ \</div><div class='del'>-	typeof(_tptr1) tptr1 = (_tptr1); \</div><div class='del'>-	typeof(_tptr2) tptr2 = (_tptr2); \</div><div class='del'>-	(void)(&amp;tptr1 == &amp;tptr2); \</div><div class='del'>-(tptr1).v == (tptr2).v; })</div><div class='del'>-</div><div class='del'>-/* lock-free CAS operation */</div><div class='del'>-#define tagptr_cmpxchg(_ptptr, _o, _n) ({ \</div><div class='del'>-	typeof(_ptptr) ptptr = (_ptptr); \</div><div class='del'>-	typeof(_o) o = (_o); \</div><div class='del'>-	typeof(_n) n = (_n); \</div><div class='del'>-	(void)(&amp;o == &amp;n); \</div><div class='del'>-	(void)(&amp;o == ptptr); \</div><div class='del'>-tagptr_init(o, cmpxchg(&amp;ptptr-&gt;v, o.v, n.v)); })</div><div class='del'>-</div><div class='del'>-/* wrap WRITE_ONCE if atomic update is needed */</div><div class='del'>-#define tagptr_replace_tags(_ptptr, tags) ({ \</div><div class='del'>-	typeof(_ptptr) ptptr = (_ptptr); \</div><div class='del'>-	*ptptr = tagptr_fold(*ptptr, tagptr_unfold_ptr(*ptptr), tags); \</div><div class='del'>-*ptptr; })</div><div class='del'>-</div><div class='del'>-#define tagptr_set_tags(_ptptr, _tags) ({ \</div><div class='del'>-	typeof(_ptptr) ptptr = (_ptptr); \</div><div class='del'>-	const typeof(_tags) tags = (_tags); \</div><div class='del'>-	if (__builtin_constant_p(tags) &amp;&amp; (tags &amp; ~__tagptr_mask(*ptptr))) \</div><div class='del'>-		__bad_tagptr_tags(); \</div><div class='del'>-	ptptr-&gt;v |= tags; \</div><div class='del'>-*ptptr; })</div><div class='del'>-</div><div class='del'>-#define tagptr_clear_tags(_ptptr, _tags) ({ \</div><div class='del'>-	typeof(_ptptr) ptptr = (_ptptr); \</div><div class='del'>-	const typeof(_tags) tags = (_tags); \</div><div class='del'>-	if (__builtin_constant_p(tags) &amp;&amp; (tags &amp; ~__tagptr_mask(*ptptr))) \</div><div class='del'>-		__bad_tagptr_tags(); \</div><div class='del'>-	ptptr-&gt;v &amp;= ~tags; \</div><div class='del'>-*ptptr; })</div><div class='del'>-</div><div class='del'>-#endif	/* __EROFS_FS_TAGPTR_H */</div><div class='head'>diff --git a/fs/erofs/utils.c b/fs/erofs/utils.c<br/>deleted file mode 100644<br/>index 84da2c280012..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/erofs/utils.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/utils.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,288 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0-only</div><div class='del'>-/*</div><div class='del'>- * Copyright (C) 2018 HUAWEI, Inc.</div><div class='del'>- *             https://www.huawei.com/</div><div class='del'>- */</div><div class='del'>-#include "internal.h"</div><div class='del'>-#include &lt;linux/pagevec.h&gt;</div><div class='del'>-</div><div class='del'>-struct page *erofs_allocpage(struct page **pagepool, gfp_t gfp)</div><div class='del'>-{</div><div class='del'>-	struct page *page = *pagepool;</div><div class='del'>-</div><div class='del'>-	if (page) {</div><div class='del'>-		DBG_BUGON(page_ref_count(page) != 1);</div><div class='del'>-		*pagepool = (struct page *)page_private(page);</div><div class='del'>-	} else {</div><div class='del'>-		page = alloc_page(gfp);</div><div class='del'>-	}</div><div class='del'>-	return page;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void erofs_release_pages(struct page **pagepool)</div><div class='del'>-{</div><div class='del'>-	while (*pagepool) {</div><div class='del'>-		struct page *page = *pagepool;</div><div class='del'>-</div><div class='del'>-		*pagepool = (struct page *)page_private(page);</div><div class='del'>-		put_page(page);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_EROFS_FS_ZIP</div><div class='del'>-/* global shrink count (for all mounted EROFS instances) */</div><div class='del'>-static atomic_long_t erofs_global_shrink_cnt;</div><div class='del'>-</div><div class='del'>-static int erofs_workgroup_get(struct erofs_workgroup *grp)</div><div class='del'>-{</div><div class='del'>-	int o;</div><div class='del'>-</div><div class='del'>-repeat:</div><div class='del'>-	o = erofs_wait_on_workgroup_freezed(grp);</div><div class='del'>-	if (o &lt;= 0)</div><div class='del'>-		return -1;</div><div class='del'>-</div><div class='del'>-	if (atomic_cmpxchg(&amp;grp-&gt;refcount, o, o + 1) != o)</div><div class='del'>-		goto repeat;</div><div class='del'>-</div><div class='del'>-	/* decrease refcount paired by erofs_workgroup_put */</div><div class='del'>-	if (o == 1)</div><div class='del'>-		atomic_long_dec(&amp;erofs_global_shrink_cnt);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct erofs_workgroup *erofs_find_workgroup(struct super_block *sb,</div><div class='del'>-					     pgoff_t index)</div><div class='del'>-{</div><div class='del'>-	struct erofs_sb_info *sbi = EROFS_SB(sb);</div><div class='del'>-	struct erofs_workgroup *grp;</div><div class='del'>-</div><div class='del'>-repeat:</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	grp = xa_load(&amp;sbi-&gt;managed_pslots, index);</div><div class='del'>-	if (grp) {</div><div class='del'>-		if (erofs_workgroup_get(grp)) {</div><div class='del'>-			/* prefer to relax rcu read side */</div><div class='del'>-			rcu_read_unlock();</div><div class='del'>-			goto repeat;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		DBG_BUGON(index != grp-&gt;index);</div><div class='del'>-	}</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-	return grp;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct erofs_workgroup *erofs_insert_workgroup(struct super_block *sb,</div><div class='del'>-					       struct erofs_workgroup *grp)</div><div class='del'>-{</div><div class='del'>-	struct erofs_sb_info *const sbi = EROFS_SB(sb);</div><div class='del'>-	struct erofs_workgroup *pre;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Bump up a reference count before making this visible</div><div class='del'>-	 * to others for the XArray in order to avoid potential</div><div class='del'>-	 * UAF without serialized by xa_lock.</div><div class='del'>-	 */</div><div class='del'>-	atomic_inc(&amp;grp-&gt;refcount);</div><div class='del'>-</div><div class='del'>-repeat:</div><div class='del'>-	xa_lock(&amp;sbi-&gt;managed_pslots);</div><div class='del'>-	pre = __xa_cmpxchg(&amp;sbi-&gt;managed_pslots, grp-&gt;index,</div><div class='del'>-			   NULL, grp, GFP_NOFS);</div><div class='del'>-	if (pre) {</div><div class='del'>-		if (xa_is_err(pre)) {</div><div class='del'>-			pre = ERR_PTR(xa_err(pre));</div><div class='del'>-		} else if (erofs_workgroup_get(pre)) {</div><div class='del'>-			/* try to legitimize the current in-tree one */</div><div class='del'>-			xa_unlock(&amp;sbi-&gt;managed_pslots);</div><div class='del'>-			cond_resched();</div><div class='del'>-			goto repeat;</div><div class='del'>-		}</div><div class='del'>-		atomic_dec(&amp;grp-&gt;refcount);</div><div class='del'>-		grp = pre;</div><div class='del'>-	}</div><div class='del'>-	xa_unlock(&amp;sbi-&gt;managed_pslots);</div><div class='del'>-	return grp;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void  __erofs_workgroup_free(struct erofs_workgroup *grp)</div><div class='del'>-{</div><div class='del'>-	atomic_long_dec(&amp;erofs_global_shrink_cnt);</div><div class='del'>-	erofs_workgroup_free_rcu(grp);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int erofs_workgroup_put(struct erofs_workgroup *grp)</div><div class='del'>-{</div><div class='del'>-	int count = atomic_dec_return(&amp;grp-&gt;refcount);</div><div class='del'>-</div><div class='del'>-	if (count == 1)</div><div class='del'>-		atomic_long_inc(&amp;erofs_global_shrink_cnt);</div><div class='del'>-	else if (!count)</div><div class='del'>-		__erofs_workgroup_free(grp);</div><div class='del'>-	return count;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool erofs_try_to_release_workgroup(struct erofs_sb_info *sbi,</div><div class='del'>-					   struct erofs_workgroup *grp)</div><div class='del'>-{</div><div class='del'>-	/*</div><div class='del'>-	 * If managed cache is on, refcount of workgroups</div><div class='del'>-	 * themselves could be &lt; 0 (freezed). In other words,</div><div class='del'>-	 * there is no guarantee that all refcounts &gt; 0.</div><div class='del'>-	 */</div><div class='del'>-	if (!erofs_workgroup_try_to_freeze(grp, 1))</div><div class='del'>-		return false;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Note that all cached pages should be unattached</div><div class='del'>-	 * before deleted from the XArray. Otherwise some</div><div class='del'>-	 * cached pages could be still attached to the orphan</div><div class='del'>-	 * old workgroup when the new one is available in the tree.</div><div class='del'>-	 */</div><div class='del'>-	if (erofs_try_to_free_all_cached_pages(sbi, grp)) {</div><div class='del'>-		erofs_workgroup_unfreeze(grp, 1);</div><div class='del'>-		return false;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * It's impossible to fail after the workgroup is freezed,</div><div class='del'>-	 * however in order to avoid some race conditions, add a</div><div class='del'>-	 * DBG_BUGON to observe this in advance.</div><div class='del'>-	 */</div><div class='del'>-	DBG_BUGON(xa_erase(&amp;sbi-&gt;managed_pslots, grp-&gt;index) != grp);</div><div class='del'>-</div><div class='del'>-	/* last refcount should be connected with its managed pslot.  */</div><div class='del'>-	erofs_workgroup_unfreeze(grp, 0);</div><div class='del'>-	__erofs_workgroup_free(grp);</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static unsigned long erofs_shrink_workstation(struct erofs_sb_info *sbi,</div><div class='del'>-					      unsigned long nr_shrink)</div><div class='del'>-{</div><div class='del'>-	struct erofs_workgroup *grp;</div><div class='del'>-	unsigned int freed = 0;</div><div class='del'>-	unsigned long index;</div><div class='del'>-</div><div class='del'>-	xa_for_each(&amp;sbi-&gt;managed_pslots, index, grp) {</div><div class='del'>-		/* try to shrink each valid workgroup */</div><div class='del'>-		if (!erofs_try_to_release_workgroup(sbi, grp))</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		++freed;</div><div class='del'>-		if (!--nr_shrink)</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-	return freed;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* protected by 'erofs_sb_list_lock' */</div><div class='del'>-static unsigned int shrinker_run_no;</div><div class='del'>-</div><div class='del'>-/* protects the mounted 'erofs_sb_list' */</div><div class='del'>-static DEFINE_SPINLOCK(erofs_sb_list_lock);</div><div class='del'>-static LIST_HEAD(erofs_sb_list);</div><div class='del'>-</div><div class='del'>-void erofs_shrinker_register(struct super_block *sb)</div><div class='del'>-{</div><div class='del'>-	struct erofs_sb_info *sbi = EROFS_SB(sb);</div><div class='del'>-</div><div class='del'>-	mutex_init(&amp;sbi-&gt;umount_mutex);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;erofs_sb_list_lock);</div><div class='del'>-	list_add(&amp;sbi-&gt;list, &amp;erofs_sb_list);</div><div class='del'>-	spin_unlock(&amp;erofs_sb_list_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void erofs_shrinker_unregister(struct super_block *sb)</div><div class='del'>-{</div><div class='del'>-	struct erofs_sb_info *const sbi = EROFS_SB(sb);</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;sbi-&gt;umount_mutex);</div><div class='del'>-	/* clean up all remaining workgroups in memory */</div><div class='del'>-	erofs_shrink_workstation(sbi, ~0UL);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;erofs_sb_list_lock);</div><div class='del'>-	list_del(&amp;sbi-&gt;list);</div><div class='del'>-	spin_unlock(&amp;erofs_sb_list_lock);</div><div class='del'>-	mutex_unlock(&amp;sbi-&gt;umount_mutex);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static unsigned long erofs_shrink_count(struct shrinker *shrink,</div><div class='del'>-					struct shrink_control *sc)</div><div class='del'>-{</div><div class='del'>-	return atomic_long_read(&amp;erofs_global_shrink_cnt);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static unsigned long erofs_shrink_scan(struct shrinker *shrink,</div><div class='del'>-				       struct shrink_control *sc)</div><div class='del'>-{</div><div class='del'>-	struct erofs_sb_info *sbi;</div><div class='del'>-	struct list_head *p;</div><div class='del'>-</div><div class='del'>-	unsigned long nr = sc-&gt;nr_to_scan;</div><div class='del'>-	unsigned int run_no;</div><div class='del'>-	unsigned long freed = 0;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;erofs_sb_list_lock);</div><div class='del'>-	do {</div><div class='del'>-		run_no = ++shrinker_run_no;</div><div class='del'>-	} while (run_no == 0);</div><div class='del'>-</div><div class='del'>-	/* Iterate over all mounted superblocks and try to shrink them */</div><div class='del'>-	p = erofs_sb_list.next;</div><div class='del'>-	while (p != &amp;erofs_sb_list) {</div><div class='del'>-		sbi = list_entry(p, struct erofs_sb_info, list);</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * We move the ones we do to the end of the list, so we stop</div><div class='del'>-		 * when we see one we have already done.</div><div class='del'>-		 */</div><div class='del'>-		if (sbi-&gt;shrinker_run_no == run_no)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		if (!mutex_trylock(&amp;sbi-&gt;umount_mutex)) {</div><div class='del'>-			p = p-&gt;next;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		spin_unlock(&amp;erofs_sb_list_lock);</div><div class='del'>-		sbi-&gt;shrinker_run_no = run_no;</div><div class='del'>-</div><div class='del'>-		freed += erofs_shrink_workstation(sbi, nr - freed);</div><div class='del'>-</div><div class='del'>-		spin_lock(&amp;erofs_sb_list_lock);</div><div class='del'>-		/* Get the next list element before we move this one */</div><div class='del'>-		p = p-&gt;next;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Move this one to the end of the list to provide some</div><div class='del'>-		 * fairness.</div><div class='del'>-		 */</div><div class='del'>-		list_move_tail(&amp;sbi-&gt;list, &amp;erofs_sb_list);</div><div class='del'>-		mutex_unlock(&amp;sbi-&gt;umount_mutex);</div><div class='del'>-</div><div class='del'>-		if (freed &gt;= nr)</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;erofs_sb_list_lock);</div><div class='del'>-	return freed;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct shrinker erofs_shrinker_info = {</div><div class='del'>-	.scan_objects = erofs_shrink_scan,</div><div class='del'>-	.count_objects = erofs_shrink_count,</div><div class='del'>-	.seeks = DEFAULT_SEEKS,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-int __init erofs_init_shrinker(void)</div><div class='del'>-{</div><div class='del'>-	return register_shrinker(&amp;erofs_shrinker_info);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void erofs_exit_shrinker(void)</div><div class='del'>-{</div><div class='del'>-	unregister_shrinker(&amp;erofs_shrinker_info);</div><div class='del'>-}</div><div class='del'>-#endif	/* !CONFIG_EROFS_FS_ZIP */</div><div class='head'>diff --git a/fs/erofs/xattr.c b/fs/erofs/xattr.c<br/>index 01c581e93c5f..396536d9a862 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/erofs/xattr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/xattr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/erofs/xattr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/erofs/xattr.c</a></div><div class='hunk'>@@ -2,48 +2,36 @@</div><div class='ctx'> /*</div><div class='ctx'>  * Copyright (C) 2017-2018 HUAWEI, Inc.</div><div class='ctx'>  *             https://www.huawei.com/</div><div class='add'>+ * Copyright (C) 2021-2022, Alibaba Cloud</div><div class='ctx'>  */</div><div class='ctx'> #include &lt;linux/security.h&gt;</div><div class='add'>+#include &lt;linux/xxhash.h&gt;</div><div class='ctx'> #include "xattr.h"</div><div class='ctx'> </div><div class='del'>-struct xattr_iter {</div><div class='add'>+struct erofs_xattr_iter {</div><div class='ctx'> 	struct super_block *sb;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct erofs_buf buf;</div><div class='add'>+	erofs_off_t pos;</div><div class='ctx'> 	void *kaddr;</div><div class='ctx'> </div><div class='del'>-	erofs_blk_t blkaddr;</div><div class='del'>-	unsigned int ofs;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static inline void xattr_iter_end(struct xattr_iter *it, bool atomic)</div><div class='del'>-{</div><div class='del'>-	/* the only user of kunmap() is 'init_inode_xattrs' */</div><div class='del'>-	if (!atomic)</div><div class='del'>-		kunmap(it-&gt;page);</div><div class='del'>-	else</div><div class='del'>-		kunmap_atomic(it-&gt;kaddr);</div><div class='del'>-</div><div class='del'>-	unlock_page(it-&gt;page);</div><div class='del'>-	put_page(it-&gt;page);</div><div class='del'>-}</div><div class='add'>+	char *buffer;</div><div class='add'>+	int buffer_size, buffer_ofs;</div><div class='ctx'> </div><div class='del'>-static inline void xattr_iter_end_final(struct xattr_iter *it)</div><div class='del'>-{</div><div class='del'>-	if (!it-&gt;page)</div><div class='del'>-		return;</div><div class='add'>+	/* getxattr */</div><div class='add'>+	int index, infix_len;</div><div class='add'>+	struct qstr name;</div><div class='ctx'> </div><div class='del'>-	xattr_iter_end(it, true);</div><div class='del'>-}</div><div class='add'>+	/* listxattr */</div><div class='add'>+	struct dentry *dentry;</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-static int init_inode_xattrs(struct inode *inode)</div><div class='add'>+static int erofs_init_inode_xattrs(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct erofs_inode *const vi = EROFS_I(inode);</div><div class='del'>-	struct xattr_iter it;</div><div class='add'>+	struct erofs_xattr_iter it;</div><div class='ctx'> 	unsigned int i;</div><div class='ctx'> 	struct erofs_xattr_ibody_header *ih;</div><div class='del'>-	struct super_block *sb;</div><div class='del'>-	struct erofs_sb_info *sbi;</div><div class='del'>-	bool atomic_map;</div><div class='add'>+	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	/* the most case is that xattrs of this inode are initialized. */</div><div class='hunk'>@@ -72,75 +60,61 @@ static int init_inode_xattrs(struct inode *inode)</div><div class='ctx'> 	 *    undefined right now (maybe use later with some new sb feature).</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (vi-&gt;xattr_isize == sizeof(struct erofs_xattr_ibody_header)) {</div><div class='del'>-		erofs_err(inode-&gt;i_sb,</div><div class='add'>+		erofs_err(sb,</div><div class='ctx'> 			  "xattr_isize %d of nid %llu is not supported yet",</div><div class='ctx'> 			  vi-&gt;xattr_isize, vi-&gt;nid);</div><div class='ctx'> 		ret = -EOPNOTSUPP;</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	} else if (vi-&gt;xattr_isize &lt; sizeof(struct erofs_xattr_ibody_header)) {</div><div class='ctx'> 		if (vi-&gt;xattr_isize) {</div><div class='del'>-			erofs_err(inode-&gt;i_sb,</div><div class='del'>-				  "bogus xattr ibody @ nid %llu", vi-&gt;nid);</div><div class='add'>+			erofs_err(sb, "bogus xattr ibody @ nid %llu", vi-&gt;nid);</div><div class='ctx'> 			DBG_BUGON(1);</div><div class='ctx'> 			ret = -EFSCORRUPTED;</div><div class='ctx'> 			goto out_unlock;	/* xattr ondisk layout error */</div><div class='ctx'> 		}</div><div class='del'>-		ret = -ENOATTR;</div><div class='add'>+		ret = -ENODATA;</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	sb = inode-&gt;i_sb;</div><div class='del'>-	sbi = EROFS_SB(sb);</div><div class='del'>-	it.blkaddr = erofs_blknr(iloc(sbi, vi-&gt;nid) + vi-&gt;inode_isize);</div><div class='del'>-	it.ofs = erofs_blkoff(iloc(sbi, vi-&gt;nid) + vi-&gt;inode_isize);</div><div class='del'>-</div><div class='del'>-	it.page = erofs_get_meta_page(sb, it.blkaddr);</div><div class='del'>-	if (IS_ERR(it.page)) {</div><div class='del'>-		ret = PTR_ERR(it.page);</div><div class='add'>+	it.buf = __EROFS_BUF_INITIALIZER;</div><div class='add'>+	ret = erofs_init_metabuf(&amp;it.buf, sb, erofs_inode_in_metabox(inode));</div><div class='add'>+	if (ret)</div><div class='ctx'> 		goto out_unlock;</div><div class='del'>-	}</div><div class='add'>+	it.pos = erofs_iloc(inode) + vi-&gt;inode_isize;</div><div class='ctx'> </div><div class='ctx'> 	/* read in shared xattr array (non-atomic, see kmalloc below) */</div><div class='del'>-	it.kaddr = kmap(it.page);</div><div class='del'>-	atomic_map = false;</div><div class='del'>-</div><div class='del'>-	ih = (struct erofs_xattr_ibody_header *)(it.kaddr + it.ofs);</div><div class='add'>+	it.kaddr = erofs_bread(&amp;it.buf, it.pos, true);</div><div class='add'>+	if (IS_ERR(it.kaddr)) {</div><div class='add'>+		ret = PTR_ERR(it.kaddr);</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='add'>+	ih = it.kaddr;</div><div class='add'>+	vi-&gt;xattr_name_filter = le32_to_cpu(ih-&gt;h_name_filter);</div><div class='ctx'> 	vi-&gt;xattr_shared_count = ih-&gt;h_shared_count;</div><div class='ctx'> 	vi-&gt;xattr_shared_xattrs = kmalloc_array(vi-&gt;xattr_shared_count,</div><div class='ctx'> 						sizeof(uint), GFP_KERNEL);</div><div class='ctx'> 	if (!vi-&gt;xattr_shared_xattrs) {</div><div class='del'>-		xattr_iter_end(&amp;it, atomic_map);</div><div class='add'>+		erofs_put_metabuf(&amp;it.buf);</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* let's skip ibody header */</div><div class='del'>-	it.ofs += sizeof(struct erofs_xattr_ibody_header);</div><div class='add'>+	it.pos += sizeof(struct erofs_xattr_ibody_header);</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; vi-&gt;xattr_shared_count; ++i) {</div><div class='del'>-		if (it.ofs &gt;= EROFS_BLKSIZ) {</div><div class='del'>-			/* cannot be unaligned */</div><div class='del'>-			DBG_BUGON(it.ofs != EROFS_BLKSIZ);</div><div class='del'>-			xattr_iter_end(&amp;it, atomic_map);</div><div class='del'>-</div><div class='del'>-			it.page = erofs_get_meta_page(sb, ++it.blkaddr);</div><div class='del'>-			if (IS_ERR(it.page)) {</div><div class='del'>-				kfree(vi-&gt;xattr_shared_xattrs);</div><div class='del'>-				vi-&gt;xattr_shared_xattrs = NULL;</div><div class='del'>-				ret = PTR_ERR(it.page);</div><div class='del'>-				goto out_unlock;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			it.kaddr = kmap_atomic(it.page);</div><div class='del'>-			atomic_map = true;</div><div class='del'>-			it.ofs = 0;</div><div class='add'>+		it.kaddr = erofs_bread(&amp;it.buf, it.pos, true);</div><div class='add'>+		if (IS_ERR(it.kaddr)) {</div><div class='add'>+			kfree(vi-&gt;xattr_shared_xattrs);</div><div class='add'>+			vi-&gt;xattr_shared_xattrs = NULL;</div><div class='add'>+			ret = PTR_ERR(it.kaddr);</div><div class='add'>+			goto out_unlock;</div><div class='ctx'> 		}</div><div class='del'>-		vi-&gt;xattr_shared_xattrs[i] =</div><div class='del'>-			le32_to_cpu(*(__le32 *)(it.kaddr + it.ofs));</div><div class='del'>-		it.ofs += sizeof(__le32);</div><div class='add'>+		vi-&gt;xattr_shared_xattrs[i] = le32_to_cpu(*(__le32 *)it.kaddr);</div><div class='add'>+		it.pos += sizeof(__le32);</div><div class='ctx'> 	}</div><div class='del'>-	xattr_iter_end(&amp;it, atomic_map);</div><div class='add'>+	erofs_put_metabuf(&amp;it.buf);</div><div class='ctx'> </div><div class='ctx'> 	/* paired with smp_mb() at the beginning of the function. */</div><div class='ctx'> 	smp_mb();</div><div class='hunk'>@@ -151,282 +125,6 @@ out_unlock:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * the general idea for these return values is</div><div class='del'>- * if    0 is returned, go on processing the current xattr;</div><div class='del'>- *       1 (&gt; 0) is returned, skip this round to process the next xattr;</div><div class='del'>- *    -err (&lt; 0) is returned, an error (maybe ENOXATTR) occurred</div><div class='del'>- *                            and need to be handled</div><div class='del'>- */</div><div class='del'>-struct xattr_iter_handlers {</div><div class='del'>-	int (*entry)(struct xattr_iter *_it, struct erofs_xattr_entry *entry);</div><div class='del'>-	int (*name)(struct xattr_iter *_it, unsigned int processed, char *buf,</div><div class='del'>-		    unsigned int len);</div><div class='del'>-	int (*alloc_buffer)(struct xattr_iter *_it, unsigned int value_sz);</div><div class='del'>-	void (*value)(struct xattr_iter *_it, unsigned int processed, char *buf,</div><div class='del'>-		      unsigned int len);</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static inline int xattr_iter_fixup(struct xattr_iter *it)</div><div class='del'>-{</div><div class='del'>-	if (it-&gt;ofs &lt; EROFS_BLKSIZ)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	xattr_iter_end(it, true);</div><div class='del'>-</div><div class='del'>-	it-&gt;blkaddr += erofs_blknr(it-&gt;ofs);</div><div class='del'>-</div><div class='del'>-	it-&gt;page = erofs_get_meta_page(it-&gt;sb, it-&gt;blkaddr);</div><div class='del'>-	if (IS_ERR(it-&gt;page)) {</div><div class='del'>-		int err = PTR_ERR(it-&gt;page);</div><div class='del'>-</div><div class='del'>-		it-&gt;page = NULL;</div><div class='del'>-		return err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	it-&gt;kaddr = kmap_atomic(it-&gt;page);</div><div class='del'>-	it-&gt;ofs = erofs_blkoff(it-&gt;ofs);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int inline_xattr_iter_begin(struct xattr_iter *it,</div><div class='del'>-				   struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	struct erofs_inode *const vi = EROFS_I(inode);</div><div class='del'>-	struct erofs_sb_info *const sbi = EROFS_SB(inode-&gt;i_sb);</div><div class='del'>-	unsigned int xattr_header_sz, inline_xattr_ofs;</div><div class='del'>-</div><div class='del'>-	xattr_header_sz = inlinexattr_header_size(inode);</div><div class='del'>-	if (xattr_header_sz &gt;= vi-&gt;xattr_isize) {</div><div class='del'>-		DBG_BUGON(xattr_header_sz &gt; vi-&gt;xattr_isize);</div><div class='del'>-		return -ENOATTR;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	inline_xattr_ofs = vi-&gt;inode_isize + xattr_header_sz;</div><div class='del'>-</div><div class='del'>-	it-&gt;blkaddr = erofs_blknr(iloc(sbi, vi-&gt;nid) + inline_xattr_ofs);</div><div class='del'>-	it-&gt;ofs = erofs_blkoff(iloc(sbi, vi-&gt;nid) + inline_xattr_ofs);</div><div class='del'>-</div><div class='del'>-	it-&gt;page = erofs_get_meta_page(inode-&gt;i_sb, it-&gt;blkaddr);</div><div class='del'>-	if (IS_ERR(it-&gt;page))</div><div class='del'>-		return PTR_ERR(it-&gt;page);</div><div class='del'>-</div><div class='del'>-	it-&gt;kaddr = kmap_atomic(it-&gt;page);</div><div class='del'>-	return vi-&gt;xattr_isize - xattr_header_sz;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Regardless of success or failure, `xattr_foreach' will end up with</div><div class='del'>- * `ofs' pointing to the next xattr item rather than an arbitrary position.</div><div class='del'>- */</div><div class='del'>-static int xattr_foreach(struct xattr_iter *it,</div><div class='del'>-			 const struct xattr_iter_handlers *op,</div><div class='del'>-			 unsigned int *tlimit)</div><div class='del'>-{</div><div class='del'>-	struct erofs_xattr_entry entry;</div><div class='del'>-	unsigned int value_sz, processed, slice;</div><div class='del'>-	int err;</div><div class='del'>-</div><div class='del'>-	/* 0. fixup blkaddr, ofs, ipage */</div><div class='del'>-	err = xattr_iter_fixup(it);</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * 1. read xattr entry to the memory,</div><div class='del'>-	 *    since we do EROFS_XATTR_ALIGN</div><div class='del'>-	 *    therefore entry should be in the page</div><div class='del'>-	 */</div><div class='del'>-	entry = *(struct erofs_xattr_entry *)(it-&gt;kaddr + it-&gt;ofs);</div><div class='del'>-	if (tlimit) {</div><div class='del'>-		unsigned int entry_sz = erofs_xattr_entry_size(&amp;entry);</div><div class='del'>-</div><div class='del'>-		/* xattr on-disk corruption: xattr entry beyond xattr_isize */</div><div class='del'>-		if (*tlimit &lt; entry_sz) {</div><div class='del'>-			DBG_BUGON(1);</div><div class='del'>-			return -EFSCORRUPTED;</div><div class='del'>-		}</div><div class='del'>-		*tlimit -= entry_sz;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	it-&gt;ofs += sizeof(struct erofs_xattr_entry);</div><div class='del'>-	value_sz = le16_to_cpu(entry.e_value_size);</div><div class='del'>-</div><div class='del'>-	/* handle entry */</div><div class='del'>-	err = op-&gt;entry(it, &amp;entry);</div><div class='del'>-	if (err) {</div><div class='del'>-		it-&gt;ofs += entry.e_name_len + value_sz;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* 2. handle xattr name (ofs will finally be at the end of name) */</div><div class='del'>-	processed = 0;</div><div class='del'>-</div><div class='del'>-	while (processed &lt; entry.e_name_len) {</div><div class='del'>-		if (it-&gt;ofs &gt;= EROFS_BLKSIZ) {</div><div class='del'>-			DBG_BUGON(it-&gt;ofs &gt; EROFS_BLKSIZ);</div><div class='del'>-</div><div class='del'>-			err = xattr_iter_fixup(it);</div><div class='del'>-			if (err)</div><div class='del'>-				goto out;</div><div class='del'>-			it-&gt;ofs = 0;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		slice = min_t(unsigned int, PAGE_SIZE - it-&gt;ofs,</div><div class='del'>-			      entry.e_name_len - processed);</div><div class='del'>-</div><div class='del'>-		/* handle name */</div><div class='del'>-		err = op-&gt;name(it, processed, it-&gt;kaddr + it-&gt;ofs, slice);</div><div class='del'>-		if (err) {</div><div class='del'>-			it-&gt;ofs += entry.e_name_len - processed + value_sz;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		it-&gt;ofs += slice;</div><div class='del'>-		processed += slice;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* 3. handle xattr value */</div><div class='del'>-	processed = 0;</div><div class='del'>-</div><div class='del'>-	if (op-&gt;alloc_buffer) {</div><div class='del'>-		err = op-&gt;alloc_buffer(it, value_sz);</div><div class='del'>-		if (err) {</div><div class='del'>-			it-&gt;ofs += value_sz;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	while (processed &lt; value_sz) {</div><div class='del'>-		if (it-&gt;ofs &gt;= EROFS_BLKSIZ) {</div><div class='del'>-			DBG_BUGON(it-&gt;ofs &gt; EROFS_BLKSIZ);</div><div class='del'>-</div><div class='del'>-			err = xattr_iter_fixup(it);</div><div class='del'>-			if (err)</div><div class='del'>-				goto out;</div><div class='del'>-			it-&gt;ofs = 0;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		slice = min_t(unsigned int, PAGE_SIZE - it-&gt;ofs,</div><div class='del'>-			      value_sz - processed);</div><div class='del'>-		op-&gt;value(it, processed, it-&gt;kaddr + it-&gt;ofs, slice);</div><div class='del'>-		it-&gt;ofs += slice;</div><div class='del'>-		processed += slice;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	/* xattrs should be 4-byte aligned (on-disk constraint) */</div><div class='del'>-	it-&gt;ofs = EROFS_XATTR_ALIGN(it-&gt;ofs);</div><div class='del'>-	return err &lt; 0 ? err : 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct getxattr_iter {</div><div class='del'>-	struct xattr_iter it;</div><div class='del'>-</div><div class='del'>-	char *buffer;</div><div class='del'>-	int buffer_size, index;</div><div class='del'>-	struct qstr name;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static int xattr_entrymatch(struct xattr_iter *_it,</div><div class='del'>-			    struct erofs_xattr_entry *entry)</div><div class='del'>-{</div><div class='del'>-	struct getxattr_iter *it = container_of(_it, struct getxattr_iter, it);</div><div class='del'>-</div><div class='del'>-	return (it-&gt;index != entry-&gt;e_name_index ||</div><div class='del'>-		it-&gt;name.len != entry-&gt;e_name_len) ? -ENOATTR : 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int xattr_namematch(struct xattr_iter *_it,</div><div class='del'>-			   unsigned int processed, char *buf, unsigned int len)</div><div class='del'>-{</div><div class='del'>-	struct getxattr_iter *it = container_of(_it, struct getxattr_iter, it);</div><div class='del'>-</div><div class='del'>-	return memcmp(buf, it-&gt;name.name + processed, len) ? -ENOATTR : 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int xattr_checkbuffer(struct xattr_iter *_it,</div><div class='del'>-			     unsigned int value_sz)</div><div class='del'>-{</div><div class='del'>-	struct getxattr_iter *it = container_of(_it, struct getxattr_iter, it);</div><div class='del'>-	int err = it-&gt;buffer_size &lt; value_sz ? -ERANGE : 0;</div><div class='del'>-</div><div class='del'>-	it-&gt;buffer_size = value_sz;</div><div class='del'>-	return !it-&gt;buffer ? 1 : err;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void xattr_copyvalue(struct xattr_iter *_it,</div><div class='del'>-			    unsigned int processed,</div><div class='del'>-			    char *buf, unsigned int len)</div><div class='del'>-{</div><div class='del'>-	struct getxattr_iter *it = container_of(_it, struct getxattr_iter, it);</div><div class='del'>-</div><div class='del'>-	memcpy(it-&gt;buffer + processed, buf, len);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static const struct xattr_iter_handlers find_xattr_handlers = {</div><div class='del'>-	.entry = xattr_entrymatch,</div><div class='del'>-	.name = xattr_namematch,</div><div class='del'>-	.alloc_buffer = xattr_checkbuffer,</div><div class='del'>-	.value = xattr_copyvalue</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static int inline_getxattr(struct inode *inode, struct getxattr_iter *it)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-	unsigned int remaining;</div><div class='del'>-</div><div class='del'>-	ret = inline_xattr_iter_begin(&amp;it-&gt;it, inode);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	remaining = ret;</div><div class='del'>-	while (remaining) {</div><div class='del'>-		ret = xattr_foreach(&amp;it-&gt;it, &amp;find_xattr_handlers, &amp;remaining);</div><div class='del'>-		if (ret != -ENOATTR)</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-	xattr_iter_end_final(&amp;it-&gt;it);</div><div class='del'>-</div><div class='del'>-	return ret ? ret : it-&gt;buffer_size;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int shared_getxattr(struct inode *inode, struct getxattr_iter *it)</div><div class='del'>-{</div><div class='del'>-	struct erofs_inode *const vi = EROFS_I(inode);</div><div class='del'>-	struct super_block *const sb = inode-&gt;i_sb;</div><div class='del'>-	struct erofs_sb_info *const sbi = EROFS_SB(sb);</div><div class='del'>-	unsigned int i;</div><div class='del'>-	int ret = -ENOATTR;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; vi-&gt;xattr_shared_count; ++i) {</div><div class='del'>-		erofs_blk_t blkaddr =</div><div class='del'>-			xattrblock_addr(sbi, vi-&gt;xattr_shared_xattrs[i]);</div><div class='del'>-</div><div class='del'>-		it-&gt;it.ofs = xattrblock_offset(sbi, vi-&gt;xattr_shared_xattrs[i]);</div><div class='del'>-</div><div class='del'>-		if (!i || blkaddr != it-&gt;it.blkaddr) {</div><div class='del'>-			if (i)</div><div class='del'>-				xattr_iter_end(&amp;it-&gt;it, true);</div><div class='del'>-</div><div class='del'>-			it-&gt;it.page = erofs_get_meta_page(sb, blkaddr);</div><div class='del'>-			if (IS_ERR(it-&gt;it.page))</div><div class='del'>-				return PTR_ERR(it-&gt;it.page);</div><div class='del'>-</div><div class='del'>-			it-&gt;it.kaddr = kmap_atomic(it-&gt;it.page);</div><div class='del'>-			it-&gt;it.blkaddr = blkaddr;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		ret = xattr_foreach(&amp;it-&gt;it, &amp;find_xattr_handlers, NULL);</div><div class='del'>-		if (ret != -ENOATTR)</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-	if (vi-&gt;xattr_shared_count)</div><div class='del'>-		xattr_iter_end_final(&amp;it-&gt;it);</div><div class='del'>-</div><div class='del'>-	return ret ? ret : it-&gt;buffer_size;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static bool erofs_xattr_user_list(struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	return test_opt(&amp;EROFS_SB(dentry-&gt;d_sb)-&gt;opt, XATTR_USER);</div><div class='hunk'>@@ -437,55 +135,13 @@ static bool erofs_xattr_trusted_list(struct dentry *dentry)</div><div class='ctx'> 	return capable(CAP_SYS_ADMIN);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int erofs_getxattr(struct inode *inode, int index,</div><div class='del'>-		   const char *name,</div><div class='del'>-		   void *buffer, size_t buffer_size)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-	struct getxattr_iter it;</div><div class='del'>-</div><div class='del'>-	if (!name)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	ret = init_inode_xattrs(inode);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	it.index = index;</div><div class='del'>-</div><div class='del'>-	it.name.len = strlen(name);</div><div class='del'>-	if (it.name.len &gt; EROFS_NAME_LEN)</div><div class='del'>-		return -ERANGE;</div><div class='del'>-	it.name.name = name;</div><div class='del'>-</div><div class='del'>-	it.buffer = buffer;</div><div class='del'>-	it.buffer_size = buffer_size;</div><div class='del'>-</div><div class='del'>-	it.it.sb = inode-&gt;i_sb;</div><div class='del'>-	ret = inline_getxattr(inode, &amp;it);</div><div class='del'>-	if (ret == -ENOATTR)</div><div class='del'>-		ret = shared_getxattr(inode, &amp;it);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int erofs_xattr_generic_get(const struct xattr_handler *handler,</div><div class='ctx'> 				   struct dentry *unused, struct inode *inode,</div><div class='ctx'> 				   const char *name, void *buffer, size_t size)</div><div class='ctx'> {</div><div class='del'>-	struct erofs_sb_info *const sbi = EROFS_I_SB(inode);</div><div class='del'>-</div><div class='del'>-	switch (handler-&gt;flags) {</div><div class='del'>-	case EROFS_XATTR_INDEX_USER:</div><div class='del'>-		if (!test_opt(&amp;sbi-&gt;opt, XATTR_USER))</div><div class='del'>-			return -EOPNOTSUPP;</div><div class='del'>-		break;</div><div class='del'>-	case EROFS_XATTR_INDEX_TRUSTED:</div><div class='del'>-		break;</div><div class='del'>-	case EROFS_XATTR_INDEX_SECURITY:</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='add'>+	if (handler-&gt;flags == EROFS_XATTR_INDEX_USER &amp;&amp;</div><div class='add'>+	    !test_opt(&amp;EROFS_I_SB(inode)-&gt;opt, XATTR_USER))</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='ctx'> 	return erofs_getxattr(inode, handler-&gt;flags, name, buffer, size);</div><div class='ctx'> }</div><div class='hunk'>@@ -512,12 +168,8 @@ const struct xattr_handler __maybe_unused erofs_xattr_security_handler = {</div><div class='ctx'> };</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-const struct xattr_handler *erofs_xattr_handlers[] = {</div><div class='add'>+const struct xattr_handler * const erofs_xattr_handlers[] = {</div><div class='ctx'> 	&amp;erofs_xattr_user_handler,</div><div class='del'>-#ifdef CONFIG_EROFS_FS_POSIX_ACL</div><div class='del'>-	&amp;posix_acl_access_xattr_handler,</div><div class='del'>-	&amp;posix_acl_default_xattr_handler,</div><div class='del'>-#endif</div><div class='ctx'> 	&amp;erofs_xattr_trusted_handler,</div><div class='ctx'> #ifdef CONFIG_EROFS_FS_SECURITY</div><div class='ctx'> 	&amp;erofs_xattr_security_handler,</div><div class='hunk'>@@ -525,151 +177,352 @@ const struct xattr_handler *erofs_xattr_handlers[] = {</div><div class='ctx'> 	NULL,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-struct listxattr_iter {</div><div class='del'>-	struct xattr_iter it;</div><div class='del'>-</div><div class='del'>-	struct dentry *dentry;</div><div class='del'>-	char *buffer;</div><div class='del'>-	int buffer_size, buffer_ofs;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static int xattr_entrylist(struct xattr_iter *_it,</div><div class='del'>-			   struct erofs_xattr_entry *entry)</div><div class='add'>+static int erofs_xattr_copy_to_buffer(struct erofs_xattr_iter *it,</div><div class='add'>+				      unsigned int len)</div><div class='ctx'> {</div><div class='del'>-	struct listxattr_iter *it =</div><div class='del'>-		container_of(_it, struct listxattr_iter, it);</div><div class='del'>-	unsigned int prefix_len;</div><div class='del'>-	const char *prefix;</div><div class='add'>+	unsigned int slice, processed;</div><div class='add'>+	struct super_block *sb = it-&gt;sb;</div><div class='add'>+	void *src;</div><div class='add'>+</div><div class='add'>+	for (processed = 0; processed &lt; len; processed += slice) {</div><div class='add'>+		it-&gt;kaddr = erofs_bread(&amp;it-&gt;buf, it-&gt;pos, true);</div><div class='add'>+		if (IS_ERR(it-&gt;kaddr))</div><div class='add'>+			return PTR_ERR(it-&gt;kaddr);</div><div class='add'>+</div><div class='add'>+		src = it-&gt;kaddr;</div><div class='add'>+		slice = min_t(unsigned int, sb-&gt;s_blocksize -</div><div class='add'>+				erofs_blkoff(sb, it-&gt;pos), len - processed);</div><div class='add'>+		memcpy(it-&gt;buffer + it-&gt;buffer_ofs, src, slice);</div><div class='add'>+		it-&gt;buffer_ofs += slice;</div><div class='add'>+		it-&gt;pos += slice;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	const struct xattr_handler *h =</div><div class='del'>-		erofs_xattr_handler(entry-&gt;e_name_index);</div><div class='add'>+static int erofs_listxattr_foreach(struct erofs_xattr_iter *it)</div><div class='add'>+{</div><div class='add'>+	struct erofs_xattr_entry entry;</div><div class='add'>+	unsigned int base_index, name_total, prefix_len, infix_len = 0;</div><div class='add'>+	const char *prefix, *infix = NULL;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='del'>-	if (!h || (h-&gt;list &amp;&amp; !h-&gt;list(it-&gt;dentry)))</div><div class='del'>-		return 1;</div><div class='add'>+	/* 1. handle xattr entry */</div><div class='add'>+	entry = *(struct erofs_xattr_entry *)it-&gt;kaddr;</div><div class='add'>+	it-&gt;pos += sizeof(struct erofs_xattr_entry);</div><div class='add'>+</div><div class='add'>+	base_index = entry.e_name_index;</div><div class='add'>+	if (entry.e_name_index &amp; EROFS_XATTR_LONG_PREFIX) {</div><div class='add'>+		struct erofs_sb_info *sbi = EROFS_SB(it-&gt;sb);</div><div class='add'>+		struct erofs_xattr_prefix_item *pf = sbi-&gt;xattr_prefixes +</div><div class='add'>+			(entry.e_name_index &amp; EROFS_XATTR_LONG_PREFIX_MASK);</div><div class='add'>+</div><div class='add'>+		if (pf &gt;= sbi-&gt;xattr_prefixes + sbi-&gt;xattr_prefix_count)</div><div class='add'>+			return 0;</div><div class='add'>+		infix = pf-&gt;prefix-&gt;infix;</div><div class='add'>+		infix_len = pf-&gt;infix_len;</div><div class='add'>+		base_index = pf-&gt;prefix-&gt;base_index;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	prefix = xattr_prefix(h);</div><div class='add'>+	prefix = erofs_xattr_prefix(base_index, it-&gt;dentry);</div><div class='add'>+	if (!prefix)</div><div class='add'>+		return 0;</div><div class='ctx'> 	prefix_len = strlen(prefix);</div><div class='add'>+	name_total = prefix_len + infix_len + entry.e_name_len + 1;</div><div class='ctx'> </div><div class='ctx'> 	if (!it-&gt;buffer) {</div><div class='del'>-		it-&gt;buffer_ofs += prefix_len + entry-&gt;e_name_len + 1;</div><div class='del'>-		return 1;</div><div class='add'>+		it-&gt;buffer_ofs += name_total;</div><div class='add'>+		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (it-&gt;buffer_ofs + prefix_len</div><div class='del'>-		+ entry-&gt;e_name_len + 1 &gt; it-&gt;buffer_size)</div><div class='add'>+	if (it-&gt;buffer_ofs + name_total &gt; it-&gt;buffer_size)</div><div class='ctx'> 		return -ERANGE;</div><div class='ctx'> </div><div class='ctx'> 	memcpy(it-&gt;buffer + it-&gt;buffer_ofs, prefix, prefix_len);</div><div class='del'>-	it-&gt;buffer_ofs += prefix_len;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='add'>+	memcpy(it-&gt;buffer + it-&gt;buffer_ofs + prefix_len, infix, infix_len);</div><div class='add'>+	it-&gt;buffer_ofs += prefix_len + infix_len;</div><div class='ctx'> </div><div class='del'>-static int xattr_namelist(struct xattr_iter *_it,</div><div class='del'>-			  unsigned int processed, char *buf, unsigned int len)</div><div class='del'>-{</div><div class='del'>-	struct listxattr_iter *it =</div><div class='del'>-		container_of(_it, struct listxattr_iter, it);</div><div class='add'>+	/* 2. handle xattr name */</div><div class='add'>+	err = erofs_xattr_copy_to_buffer(it, entry.e_name_len);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='del'>-	memcpy(it-&gt;buffer + it-&gt;buffer_ofs, buf, len);</div><div class='del'>-	it-&gt;buffer_ofs += len;</div><div class='add'>+	it-&gt;buffer[it-&gt;buffer_ofs++] = '\0';</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int xattr_skipvalue(struct xattr_iter *_it,</div><div class='del'>-			   unsigned int value_sz)</div><div class='add'>+static int erofs_getxattr_foreach(struct erofs_xattr_iter *it)</div><div class='ctx'> {</div><div class='del'>-	struct listxattr_iter *it =</div><div class='del'>-		container_of(_it, struct listxattr_iter, it);</div><div class='add'>+	struct super_block *sb = it-&gt;sb;</div><div class='add'>+	struct erofs_xattr_entry entry;</div><div class='add'>+	unsigned int slice, processed, value_sz;</div><div class='ctx'> </div><div class='del'>-	it-&gt;buffer[it-&gt;buffer_ofs++] = '\0';</div><div class='del'>-	return 1;</div><div class='del'>-}</div><div class='add'>+	/* 1. handle xattr entry */</div><div class='add'>+	entry = *(struct erofs_xattr_entry *)it-&gt;kaddr;</div><div class='add'>+	it-&gt;pos += sizeof(struct erofs_xattr_entry);</div><div class='add'>+	value_sz = le16_to_cpu(entry.e_value_size);</div><div class='ctx'> </div><div class='del'>-static const struct xattr_iter_handlers list_xattr_handlers = {</div><div class='del'>-	.entry = xattr_entrylist,</div><div class='del'>-	.name = xattr_namelist,</div><div class='del'>-	.alloc_buffer = xattr_skipvalue,</div><div class='del'>-	.value = NULL</div><div class='del'>-};</div><div class='add'>+	/* should also match the infix for long name prefixes */</div><div class='add'>+	if (entry.e_name_index &amp; EROFS_XATTR_LONG_PREFIX) {</div><div class='add'>+		struct erofs_sb_info *sbi = EROFS_SB(sb);</div><div class='add'>+		struct erofs_xattr_prefix_item *pf = sbi-&gt;xattr_prefixes +</div><div class='add'>+			(entry.e_name_index &amp; EROFS_XATTR_LONG_PREFIX_MASK);</div><div class='add'>+</div><div class='add'>+		if (pf &gt;= sbi-&gt;xattr_prefixes + sbi-&gt;xattr_prefix_count)</div><div class='add'>+			return -ENODATA;</div><div class='ctx'> </div><div class='del'>-static int inline_listxattr(struct listxattr_iter *it)</div><div class='add'>+		if (it-&gt;index != pf-&gt;prefix-&gt;base_index ||</div><div class='add'>+		    it-&gt;name.len != entry.e_name_len + pf-&gt;infix_len)</div><div class='add'>+			return -ENODATA;</div><div class='add'>+</div><div class='add'>+		if (memcmp(it-&gt;name.name, pf-&gt;prefix-&gt;infix, pf-&gt;infix_len))</div><div class='add'>+			return -ENODATA;</div><div class='add'>+</div><div class='add'>+		it-&gt;infix_len = pf-&gt;infix_len;</div><div class='add'>+	} else {</div><div class='add'>+		if (it-&gt;index != entry.e_name_index ||</div><div class='add'>+		    it-&gt;name.len != entry.e_name_len)</div><div class='add'>+			return -ENODATA;</div><div class='add'>+</div><div class='add'>+		it-&gt;infix_len = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* 2. handle xattr name */</div><div class='add'>+	for (processed = 0; processed &lt; entry.e_name_len; processed += slice) {</div><div class='add'>+		it-&gt;kaddr = erofs_bread(&amp;it-&gt;buf, it-&gt;pos, true);</div><div class='add'>+		if (IS_ERR(it-&gt;kaddr))</div><div class='add'>+			return PTR_ERR(it-&gt;kaddr);</div><div class='add'>+</div><div class='add'>+		slice = min_t(unsigned int,</div><div class='add'>+				sb-&gt;s_blocksize - erofs_blkoff(sb, it-&gt;pos),</div><div class='add'>+				entry.e_name_len - processed);</div><div class='add'>+		if (memcmp(it-&gt;name.name + it-&gt;infix_len + processed,</div><div class='add'>+			   it-&gt;kaddr, slice))</div><div class='add'>+			return -ENODATA;</div><div class='add'>+		it-&gt;pos += slice;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* 3. handle xattr value */</div><div class='add'>+	if (!it-&gt;buffer) {</div><div class='add'>+		it-&gt;buffer_ofs = value_sz;</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (it-&gt;buffer_size &lt; value_sz)</div><div class='add'>+		return -ERANGE;</div><div class='add'>+</div><div class='add'>+	return erofs_xattr_copy_to_buffer(it, value_sz);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int erofs_xattr_iter_inline(struct erofs_xattr_iter *it,</div><div class='add'>+				   struct inode *inode, bool getxattr)</div><div class='ctx'> {</div><div class='add'>+	struct erofs_inode *const vi = EROFS_I(inode);</div><div class='add'>+	unsigned int xattr_header_sz, remaining, entry_sz;</div><div class='add'>+	erofs_off_t next_pos;</div><div class='ctx'> 	int ret;</div><div class='del'>-	unsigned int remaining;</div><div class='ctx'> </div><div class='del'>-	ret = inline_xattr_iter_begin(&amp;it-&gt;it, d_inode(it-&gt;dentry));</div><div class='del'>-	if (ret &lt; 0)</div><div class='add'>+	xattr_header_sz = sizeof(struct erofs_xattr_ibody_header) +</div><div class='add'>+			  sizeof(u32) * vi-&gt;xattr_shared_count;</div><div class='add'>+	if (xattr_header_sz &gt;= vi-&gt;xattr_isize) {</div><div class='add'>+		DBG_BUGON(xattr_header_sz &gt; vi-&gt;xattr_isize);</div><div class='add'>+		return -ENODATA;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = erofs_init_metabuf(&amp;it-&gt;buf, it-&gt;sb, erofs_inode_in_metabox(inode));</div><div class='add'>+	if (ret)</div><div class='ctx'> 		return ret;</div><div class='add'>+	remaining = vi-&gt;xattr_isize - xattr_header_sz;</div><div class='add'>+	it-&gt;pos = erofs_iloc(inode) + vi-&gt;inode_isize + xattr_header_sz;</div><div class='ctx'> </div><div class='del'>-	remaining = ret;</div><div class='ctx'> 	while (remaining) {</div><div class='del'>-		ret = xattr_foreach(&amp;it-&gt;it, &amp;list_xattr_handlers, &amp;remaining);</div><div class='del'>-		if (ret)</div><div class='add'>+		it-&gt;kaddr = erofs_bread(&amp;it-&gt;buf, it-&gt;pos, true);</div><div class='add'>+		if (IS_ERR(it-&gt;kaddr))</div><div class='add'>+			return PTR_ERR(it-&gt;kaddr);</div><div class='add'>+</div><div class='add'>+		entry_sz = erofs_xattr_entry_size(it-&gt;kaddr);</div><div class='add'>+		/* xattr on-disk corruption: xattr entry beyond xattr_isize */</div><div class='add'>+		if (remaining &lt; entry_sz) {</div><div class='add'>+			DBG_BUGON(1);</div><div class='add'>+			return -EFSCORRUPTED;</div><div class='add'>+		}</div><div class='add'>+		remaining -= entry_sz;</div><div class='add'>+		next_pos = it-&gt;pos + entry_sz;</div><div class='add'>+</div><div class='add'>+		if (getxattr)</div><div class='add'>+			ret = erofs_getxattr_foreach(it);</div><div class='add'>+		else</div><div class='add'>+			ret = erofs_listxattr_foreach(it);</div><div class='add'>+		if ((getxattr &amp;&amp; ret != -ENODATA) || (!getxattr &amp;&amp; ret))</div><div class='ctx'> 			break;</div><div class='add'>+</div><div class='add'>+		it-&gt;pos = next_pos;</div><div class='ctx'> 	}</div><div class='del'>-	xattr_iter_end_final(&amp;it-&gt;it);</div><div class='del'>-	return ret ? ret : it-&gt;buffer_ofs;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int shared_listxattr(struct listxattr_iter *it)</div><div class='add'>+static int erofs_xattr_iter_shared(struct erofs_xattr_iter *it,</div><div class='add'>+				   struct inode *inode, bool getxattr)</div><div class='ctx'> {</div><div class='del'>-	struct inode *const inode = d_inode(it-&gt;dentry);</div><div class='ctx'> 	struct erofs_inode *const vi = EROFS_I(inode);</div><div class='del'>-	struct super_block *const sb = inode-&gt;i_sb;</div><div class='del'>-	struct erofs_sb_info *const sbi = EROFS_SB(sb);</div><div class='del'>-	unsigned int i;</div><div class='del'>-	int ret = 0;</div><div class='add'>+	struct super_block *const sb = it-&gt;sb;</div><div class='add'>+	struct erofs_sb_info *sbi = EROFS_SB(sb);</div><div class='add'>+	unsigned int i = 0;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; vi-&gt;xattr_shared_count; ++i) {</div><div class='del'>-		erofs_blk_t blkaddr =</div><div class='del'>-			xattrblock_addr(sbi, vi-&gt;xattr_shared_xattrs[i]);</div><div class='add'>+	ret = erofs_init_metabuf(&amp;it-&gt;buf, sb,</div><div class='add'>+				 erofs_sb_has_shared_ea_in_metabox(sbi));</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-		it-&gt;it.ofs = xattrblock_offset(sbi, vi-&gt;xattr_shared_xattrs[i]);</div><div class='del'>-		if (!i || blkaddr != it-&gt;it.blkaddr) {</div><div class='del'>-			if (i)</div><div class='del'>-				xattr_iter_end(&amp;it-&gt;it, true);</div><div class='add'>+	while (i &lt; vi-&gt;xattr_shared_count) {</div><div class='add'>+		it-&gt;pos = erofs_pos(sb, sbi-&gt;xattr_blkaddr) +</div><div class='add'>+				vi-&gt;xattr_shared_xattrs[i++] * sizeof(__le32);</div><div class='add'>+		it-&gt;kaddr = erofs_bread(&amp;it-&gt;buf, it-&gt;pos, true);</div><div class='add'>+		if (IS_ERR(it-&gt;kaddr))</div><div class='add'>+			return PTR_ERR(it-&gt;kaddr);</div><div class='add'>+</div><div class='add'>+		if (getxattr)</div><div class='add'>+			ret = erofs_getxattr_foreach(it);</div><div class='add'>+		else</div><div class='add'>+			ret = erofs_listxattr_foreach(it);</div><div class='add'>+		if ((getxattr &amp;&amp; ret != -ENODATA) || (!getxattr &amp;&amp; ret))</div><div class='add'>+			break;</div><div class='add'>+	}</div><div class='add'>+	return i ? ret : -ENODATA;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-			it-&gt;it.page = erofs_get_meta_page(sb, blkaddr);</div><div class='del'>-			if (IS_ERR(it-&gt;it.page))</div><div class='del'>-				return PTR_ERR(it-&gt;it.page);</div><div class='add'>+int erofs_getxattr(struct inode *inode, int index, const char *name,</div><div class='add'>+		   void *buffer, size_t buffer_size)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+	unsigned int hashbit;</div><div class='add'>+	struct erofs_xattr_iter it;</div><div class='add'>+	struct erofs_inode *vi = EROFS_I(inode);</div><div class='add'>+	struct erofs_sb_info *sbi = EROFS_SB(inode-&gt;i_sb);</div><div class='ctx'> </div><div class='del'>-			it-&gt;it.kaddr = kmap_atomic(it-&gt;it.page);</div><div class='del'>-			it-&gt;it.blkaddr = blkaddr;</div><div class='del'>-		}</div><div class='add'>+	if (!name)</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-		ret = xattr_foreach(&amp;it-&gt;it, &amp;list_xattr_handlers, NULL);</div><div class='del'>-		if (ret)</div><div class='del'>-			break;</div><div class='add'>+	ret = erofs_init_inode_xattrs(inode);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	/* reserved flag is non-zero if there's any change of on-disk format */</div><div class='add'>+	if (erofs_sb_has_xattr_filter(sbi) &amp;&amp; !sbi-&gt;xattr_filter_reserved) {</div><div class='add'>+		hashbit = xxh32(name, strlen(name),</div><div class='add'>+				EROFS_XATTR_FILTER_SEED + index);</div><div class='add'>+		hashbit &amp;= EROFS_XATTR_FILTER_BITS - 1;</div><div class='add'>+		if (vi-&gt;xattr_name_filter &amp; (1U &lt;&lt; hashbit))</div><div class='add'>+			return -ENODATA;</div><div class='ctx'> 	}</div><div class='del'>-	if (vi-&gt;xattr_shared_count)</div><div class='del'>-		xattr_iter_end_final(&amp;it-&gt;it);</div><div class='ctx'> </div><div class='del'>-	return ret ? ret : it-&gt;buffer_ofs;</div><div class='add'>+	it.index = index;</div><div class='add'>+	it.name = QSTR(name);</div><div class='add'>+	if (it.name.len &gt; EROFS_NAME_LEN)</div><div class='add'>+		return -ERANGE;</div><div class='add'>+</div><div class='add'>+	it.sb = inode-&gt;i_sb;</div><div class='add'>+	it.buf = __EROFS_BUF_INITIALIZER;</div><div class='add'>+	it.buffer = buffer;</div><div class='add'>+	it.buffer_size = buffer_size;</div><div class='add'>+	it.buffer_ofs = 0;</div><div class='add'>+</div><div class='add'>+	ret = erofs_xattr_iter_inline(&amp;it, inode, true);</div><div class='add'>+	if (ret == -ENODATA)</div><div class='add'>+		ret = erofs_xattr_iter_shared(&amp;it, inode, true);</div><div class='add'>+	erofs_put_metabuf(&amp;it.buf);</div><div class='add'>+	return ret ? ret : it.buffer_ofs;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-ssize_t erofs_listxattr(struct dentry *dentry,</div><div class='del'>-			char *buffer, size_t buffer_size)</div><div class='add'>+ssize_t erofs_listxattr(struct dentry *dentry, char *buffer, size_t buffer_size)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='del'>-	struct listxattr_iter it;</div><div class='add'>+	struct erofs_xattr_iter it;</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='ctx'> </div><div class='del'>-	ret = init_inode_xattrs(d_inode(dentry));</div><div class='del'>-	if (ret == -ENOATTR)</div><div class='add'>+	ret = erofs_init_inode_xattrs(inode);</div><div class='add'>+	if (ret == -ENODATA)</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='add'>+	it.sb = dentry-&gt;d_sb;</div><div class='add'>+	it.buf = __EROFS_BUF_INITIALIZER;</div><div class='ctx'> 	it.dentry = dentry;</div><div class='ctx'> 	it.buffer = buffer;</div><div class='ctx'> 	it.buffer_size = buffer_size;</div><div class='ctx'> 	it.buffer_ofs = 0;</div><div class='ctx'> </div><div class='del'>-	it.it.sb = dentry-&gt;d_sb;</div><div class='add'>+	ret = erofs_xattr_iter_inline(&amp;it, inode, false);</div><div class='add'>+	if (!ret || ret == -ENODATA)</div><div class='add'>+		ret = erofs_xattr_iter_shared(&amp;it, inode, false);</div><div class='add'>+	if (ret == -ENODATA)</div><div class='add'>+		ret = 0;</div><div class='add'>+	erofs_put_metabuf(&amp;it.buf);</div><div class='add'>+	return ret ? ret : it.buffer_ofs;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	ret = inline_listxattr(&amp;it);</div><div class='del'>-	if (ret &lt; 0 &amp;&amp; ret != -ENOATTR)</div><div class='del'>-		return ret;</div><div class='del'>-	return shared_listxattr(&amp;it);</div><div class='add'>+void erofs_xattr_prefixes_cleanup(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct erofs_sb_info *sbi = EROFS_SB(sb);</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	if (sbi-&gt;xattr_prefixes) {</div><div class='add'>+		for (i = 0; i &lt; sbi-&gt;xattr_prefix_count; i++)</div><div class='add'>+			kfree(sbi-&gt;xattr_prefixes[i].prefix);</div><div class='add'>+		kfree(sbi-&gt;xattr_prefixes);</div><div class='add'>+		sbi-&gt;xattr_prefixes = NULL;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int erofs_xattr_prefixes_init(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct erofs_sb_info *sbi = EROFS_SB(sb);</div><div class='add'>+	struct erofs_buf buf = __EROFS_BUF_INITIALIZER;</div><div class='add'>+	erofs_off_t pos = (erofs_off_t)sbi-&gt;xattr_prefix_start &lt;&lt; 2;</div><div class='add'>+	struct erofs_xattr_prefix_item *pfs;</div><div class='add'>+	int ret = 0, i, len;</div><div class='add'>+	bool plain = erofs_sb_has_plain_xattr_pfx(sbi);</div><div class='add'>+</div><div class='add'>+	if (!sbi-&gt;xattr_prefix_count)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	pfs = kcalloc(sbi-&gt;xattr_prefix_count, sizeof(*pfs), GFP_KERNEL);</div><div class='add'>+	if (!pfs)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	if (!plain) {</div><div class='add'>+		if (erofs_sb_has_metabox(sbi))</div><div class='add'>+			(void)erofs_init_metabuf(&amp;buf, sb, true);</div><div class='add'>+		else if (sbi-&gt;packed_inode)</div><div class='add'>+			buf.mapping = sbi-&gt;packed_inode-&gt;i_mapping;</div><div class='add'>+		else</div><div class='add'>+			plain = true;</div><div class='add'>+	}</div><div class='add'>+	if (plain)</div><div class='add'>+		(void)erofs_init_metabuf(&amp;buf, sb, false);</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; sbi-&gt;xattr_prefix_count; i++) {</div><div class='add'>+		void *ptr = erofs_read_metadata(sb, &amp;buf, &amp;pos, &amp;len);</div><div class='add'>+</div><div class='add'>+		if (IS_ERR(ptr)) {</div><div class='add'>+			ret = PTR_ERR(ptr);</div><div class='add'>+			break;</div><div class='add'>+		} else if (len &lt; sizeof(*pfs-&gt;prefix) ||</div><div class='add'>+			   len &gt; EROFS_NAME_LEN + sizeof(*pfs-&gt;prefix)) {</div><div class='add'>+			kfree(ptr);</div><div class='add'>+			ret = -EFSCORRUPTED;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		pfs[i].prefix = ptr;</div><div class='add'>+		pfs[i].infix_len = len - sizeof(struct erofs_xattr_long_prefix);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	erofs_put_metabuf(&amp;buf);</div><div class='add'>+	sbi-&gt;xattr_prefixes = pfs;</div><div class='add'>+	if (ret)</div><div class='add'>+		erofs_xattr_prefixes_cleanup(sb);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_EROFS_FS_POSIX_ACL</div><div class='hunk'>@@ -701,7 +554,7 @@ struct posix_acl *erofs_get_acl(struct inode *inode, int type, bool rcu)</div><div class='ctx'> 		rc = erofs_getxattr(inode, prefix, "", value, rc);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (rc == -ENOATTR)</div><div class='add'>+	if (rc == -ENODATA)</div><div class='ctx'> 		acl = NULL;</div><div class='ctx'> 	else if (rc &lt; 0)</div><div class='ctx'> 		acl = ERR_PTR(rc);</div><div class='head'>diff --git a/fs/erofs/xattr.h b/fs/erofs/xattr.h<br/>index 94090c74b3f7..6317caa8413e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/erofs/xattr.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/xattr.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/erofs/xattr.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/erofs/xattr.h</a></div><div class='hunk'>@@ -10,48 +10,21 @@</div><div class='ctx'> #include &lt;linux/posix_acl_xattr.h&gt;</div><div class='ctx'> #include &lt;linux/xattr.h&gt;</div><div class='ctx'> </div><div class='del'>-/* Attribute not found */</div><div class='del'>-#define ENOATTR         ENODATA</div><div class='del'>-</div><div class='del'>-static inline unsigned int inlinexattr_header_size(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	return sizeof(struct erofs_xattr_ibody_header) +</div><div class='del'>-		sizeof(u32) * EROFS_I(inode)-&gt;xattr_shared_count;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline erofs_blk_t xattrblock_addr(struct erofs_sb_info *sbi,</div><div class='del'>-					  unsigned int xattr_id)</div><div class='del'>-{</div><div class='del'>-#ifdef CONFIG_EROFS_FS_XATTR</div><div class='del'>-	return sbi-&gt;xattr_blkaddr +</div><div class='del'>-		xattr_id * sizeof(__u32) / EROFS_BLKSIZ;</div><div class='del'>-#else</div><div class='del'>-	return 0;</div><div class='del'>-#endif</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline unsigned int xattrblock_offset(struct erofs_sb_info *sbi,</div><div class='del'>-					     unsigned int xattr_id)</div><div class='del'>-{</div><div class='del'>-	return (xattr_id * sizeof(__u32)) % EROFS_BLKSIZ;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> #ifdef CONFIG_EROFS_FS_XATTR</div><div class='ctx'> extern const struct xattr_handler erofs_xattr_user_handler;</div><div class='ctx'> extern const struct xattr_handler erofs_xattr_trusted_handler;</div><div class='del'>-#ifdef CONFIG_EROFS_FS_SECURITY</div><div class='ctx'> extern const struct xattr_handler erofs_xattr_security_handler;</div><div class='del'>-#endif</div><div class='ctx'> </div><div class='del'>-static inline const struct xattr_handler *erofs_xattr_handler(unsigned int idx)</div><div class='add'>+static inline const char *erofs_xattr_prefix(unsigned int idx,</div><div class='add'>+					     struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	static const struct xattr_handler *xattr_handler_map[] = {</div><div class='add'>+	const struct xattr_handler *handler = NULL;</div><div class='add'>+</div><div class='add'>+	static const struct xattr_handler * const xattr_handler_map[] = {</div><div class='ctx'> 		[EROFS_XATTR_INDEX_USER] = &amp;erofs_xattr_user_handler,</div><div class='ctx'> #ifdef CONFIG_EROFS_FS_POSIX_ACL</div><div class='del'>-		[EROFS_XATTR_INDEX_POSIX_ACL_ACCESS] =</div><div class='del'>-			&amp;posix_acl_access_xattr_handler,</div><div class='del'>-		[EROFS_XATTR_INDEX_POSIX_ACL_DEFAULT] =</div><div class='del'>-			&amp;posix_acl_default_xattr_handler,</div><div class='add'>+		[EROFS_XATTR_INDEX_POSIX_ACL_ACCESS] = &amp;nop_posix_acl_access,</div><div class='add'>+		[EROFS_XATTR_INDEX_POSIX_ACL_DEFAULT] = &amp;nop_posix_acl_default,</div><div class='ctx'> #endif</div><div class='ctx'> 		[EROFS_XATTR_INDEX_TRUSTED] = &amp;erofs_xattr_trusted_handler,</div><div class='ctx'> #ifdef CONFIG_EROFS_FS_SECURITY</div><div class='hunk'>@@ -59,15 +32,24 @@ static inline const struct xattr_handler *erofs_xattr_handler(unsigned int idx)</div><div class='ctx'> #endif</div><div class='ctx'> 	};</div><div class='ctx'> </div><div class='del'>-	return idx &amp;&amp; idx &lt; ARRAY_SIZE(xattr_handler_map) ?</div><div class='del'>-		xattr_handler_map[idx] : NULL;</div><div class='add'>+	if (idx &amp;&amp; idx &lt; ARRAY_SIZE(xattr_handler_map))</div><div class='add'>+		handler = xattr_handler_map[idx];</div><div class='add'>+</div><div class='add'>+	if (!xattr_handler_can_list(handler, dentry))</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	return xattr_prefix(handler);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-extern const struct xattr_handler *erofs_xattr_handlers[];</div><div class='add'>+extern const struct xattr_handler * const erofs_xattr_handlers[];</div><div class='ctx'> </div><div class='add'>+int erofs_xattr_prefixes_init(struct super_block *sb);</div><div class='add'>+void erofs_xattr_prefixes_cleanup(struct super_block *sb);</div><div class='ctx'> int erofs_getxattr(struct inode *, int, const char *, void *, size_t);</div><div class='ctx'> ssize_t erofs_listxattr(struct dentry *, char *, size_t);</div><div class='ctx'> #else</div><div class='add'>+static inline int erofs_xattr_prefixes_init(struct super_block *sb) { return 0; }</div><div class='add'>+static inline void erofs_xattr_prefixes_cleanup(struct super_block *sb) {}</div><div class='ctx'> static inline int erofs_getxattr(struct inode *inode, int index,</div><div class='ctx'> 				 const char *name, void *buffer,</div><div class='ctx'> 				 size_t buffer_size)</div><div class='hunk'>@@ -86,4 +68,3 @@ struct posix_acl *erofs_get_acl(struct inode *inode, int type, bool rcu);</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='del'>-</div><div class='head'>diff --git a/fs/erofs/zdata.c b/fs/erofs/zdata.c<br/>index bcb1b91b234f..65da21504632 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/erofs/zdata.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/zdata.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/erofs/zdata.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/erofs/zdata.c</a></div><div class='hunk'>@@ -2,13 +2,118 @@</div><div class='ctx'> /*</div><div class='ctx'>  * Copyright (C) 2018 HUAWEI, Inc.</div><div class='ctx'>  *             https://www.huawei.com/</div><div class='add'>+ * Copyright (C) 2022 Alibaba Cloud</div><div class='ctx'>  */</div><div class='del'>-#include "zdata.h"</div><div class='ctx'> #include "compress.h"</div><div class='del'>-#include &lt;linux/prefetch.h&gt;</div><div class='del'>-</div><div class='add'>+#include &lt;linux/psi.h&gt;</div><div class='add'>+#include &lt;linux/cpuhotplug.h&gt;</div><div class='ctx'> #include &lt;trace/events/erofs.h&gt;</div><div class='ctx'> </div><div class='add'>+#define Z_EROFS_PCLUSTER_MAX_PAGES	(Z_EROFS_PCLUSTER_MAX_SIZE / PAGE_SIZE)</div><div class='add'>+#define Z_EROFS_INLINE_BVECS		2</div><div class='add'>+</div><div class='add'>+struct z_erofs_bvec {</div><div class='add'>+	struct page *page;</div><div class='add'>+	int offset;</div><div class='add'>+	unsigned int end;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+#define __Z_EROFS_BVSET(name, total) \</div><div class='add'>+struct name { \</div><div class='add'>+	/* point to the next page which contains the following bvecs */ \</div><div class='add'>+	struct page *nextpage; \</div><div class='add'>+	struct z_erofs_bvec bvec[total]; \</div><div class='add'>+}</div><div class='add'>+__Z_EROFS_BVSET(z_erofs_bvset,);</div><div class='add'>+__Z_EROFS_BVSET(z_erofs_bvset_inline, Z_EROFS_INLINE_BVECS);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Structure fields follow one of the following exclusion rules.</div><div class='add'>+ *</div><div class='add'>+ * I: Modifiable by initialization/destruction paths and read-only</div><div class='add'>+ *    for everyone else;</div><div class='add'>+ *</div><div class='add'>+ * L: Field should be protected by the pcluster lock;</div><div class='add'>+ *</div><div class='add'>+ * A: Field should be accessed / updated in atomic for parallelized code.</div><div class='add'>+ */</div><div class='add'>+struct z_erofs_pcluster {</div><div class='add'>+	struct mutex lock;</div><div class='add'>+	struct lockref lockref;</div><div class='add'>+</div><div class='add'>+	/* A: point to next chained pcluster or TAILs */</div><div class='add'>+	struct z_erofs_pcluster *next;</div><div class='add'>+</div><div class='add'>+	/* I: start physical position of this pcluster */</div><div class='add'>+	erofs_off_t pos;</div><div class='add'>+</div><div class='add'>+	/* L: the maximum decompression size of this round */</div><div class='add'>+	unsigned int length;</div><div class='add'>+</div><div class='add'>+	/* L: total number of bvecs */</div><div class='add'>+	unsigned int vcnt;</div><div class='add'>+</div><div class='add'>+	/* I: pcluster size (compressed size) in bytes */</div><div class='add'>+	unsigned int pclustersize;</div><div class='add'>+</div><div class='add'>+	/* I: page offset of start position of decompression */</div><div class='add'>+	unsigned short pageofs_out;</div><div class='add'>+</div><div class='add'>+	/* I: page offset of inline compressed data */</div><div class='add'>+	unsigned short pageofs_in;</div><div class='add'>+</div><div class='add'>+	union {</div><div class='add'>+		/* L: inline a certain number of bvec for bootstrap */</div><div class='add'>+		struct z_erofs_bvset_inline bvset;</div><div class='add'>+</div><div class='add'>+		/* I: can be used to free the pcluster by RCU. */</div><div class='add'>+		struct rcu_head rcu;</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+	/* I: compression algorithm format */</div><div class='add'>+	unsigned char algorithmformat;</div><div class='add'>+</div><div class='add'>+	/* I: whether compressed data is in-lined or not */</div><div class='add'>+	bool from_meta;</div><div class='add'>+</div><div class='add'>+	/* L: whether partial decompression or not */</div><div class='add'>+	bool partial;</div><div class='add'>+</div><div class='add'>+	/* L: whether extra buffer allocations are best-effort */</div><div class='add'>+	bool besteffort;</div><div class='add'>+</div><div class='add'>+	/* A: compressed bvecs (can be cached or inplaced pages) */</div><div class='add'>+	struct z_erofs_bvec compressed_bvecs[];</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/* the end of a chain of pclusters */</div><div class='add'>+#define Z_EROFS_PCLUSTER_TAIL           ((void *) 0x700 + POISON_POINTER_DELTA)</div><div class='add'>+</div><div class='add'>+struct z_erofs_decompressqueue {</div><div class='add'>+	struct super_block *sb;</div><div class='add'>+	struct z_erofs_pcluster *head;</div><div class='add'>+	atomic_t pending_bios;</div><div class='add'>+</div><div class='add'>+	union {</div><div class='add'>+		struct completion done;</div><div class='add'>+		struct work_struct work;</div><div class='add'>+		struct kthread_work kthread_work;</div><div class='add'>+	} u;</div><div class='add'>+	bool eio, sync;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static inline unsigned int z_erofs_pclusterpages(struct z_erofs_pcluster *pcl)</div><div class='add'>+{</div><div class='add'>+	return PAGE_ALIGN(pcl-&gt;pageofs_in + pcl-&gt;pclustersize) &gt;&gt; PAGE_SHIFT;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool erofs_folio_is_managed(struct erofs_sb_info *sbi, struct folio *fo)</div><div class='add'>+{</div><div class='add'>+	return fo-&gt;mapping == MNGD_MAPPING(sbi);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define Z_EROFS_ONSTACK_PAGES		32</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * since pclustersize is variable for big pcluster feature, introduce slab</div><div class='ctx'>  * pools implementation for different pcluster sizes.</div><div class='hunk'>@@ -23,9 +128,92 @@ struct z_erofs_pcluster_slab {</div><div class='ctx'> </div><div class='ctx'> static struct z_erofs_pcluster_slab pcluster_pool[] __read_mostly = {</div><div class='ctx'> 	_PCLP(1), _PCLP(4), _PCLP(16), _PCLP(64), _PCLP(128),</div><div class='del'>-	_PCLP(Z_EROFS_PCLUSTER_MAX_PAGES)</div><div class='add'>+	_PCLP(Z_EROFS_PCLUSTER_MAX_PAGES + 1)</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+struct z_erofs_bvec_iter {</div><div class='add'>+	struct page *bvpage;</div><div class='add'>+	struct z_erofs_bvset *bvset;</div><div class='add'>+	unsigned int nr, cur;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static struct page *z_erofs_bvec_iter_end(struct z_erofs_bvec_iter *iter)</div><div class='add'>+{</div><div class='add'>+	if (iter-&gt;bvpage)</div><div class='add'>+		kunmap_local(iter-&gt;bvset);</div><div class='add'>+	return iter-&gt;bvpage;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct page *z_erofs_bvset_flip(struct z_erofs_bvec_iter *iter)</div><div class='add'>+{</div><div class='add'>+	unsigned long base = (unsigned long)((struct z_erofs_bvset *)0)-&gt;bvec;</div><div class='add'>+	/* have to access nextpage in advance, otherwise it will be unmapped */</div><div class='add'>+	struct page *nextpage = iter-&gt;bvset-&gt;nextpage;</div><div class='add'>+	struct page *oldpage;</div><div class='add'>+</div><div class='add'>+	DBG_BUGON(!nextpage);</div><div class='add'>+	oldpage = z_erofs_bvec_iter_end(iter);</div><div class='add'>+	iter-&gt;bvpage = nextpage;</div><div class='add'>+	iter-&gt;bvset = kmap_local_page(nextpage);</div><div class='add'>+	iter-&gt;nr = (PAGE_SIZE - base) / sizeof(struct z_erofs_bvec);</div><div class='add'>+	iter-&gt;cur = 0;</div><div class='add'>+	return oldpage;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void z_erofs_bvec_iter_begin(struct z_erofs_bvec_iter *iter,</div><div class='add'>+				    struct z_erofs_bvset_inline *bvset,</div><div class='add'>+				    unsigned int bootstrap_nr,</div><div class='add'>+				    unsigned int cur)</div><div class='add'>+{</div><div class='add'>+	*iter = (struct z_erofs_bvec_iter) {</div><div class='add'>+		.nr = bootstrap_nr,</div><div class='add'>+		.bvset = (struct z_erofs_bvset *)bvset,</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+	while (cur &gt; iter-&gt;nr) {</div><div class='add'>+		cur -= iter-&gt;nr;</div><div class='add'>+		z_erofs_bvset_flip(iter);</div><div class='add'>+	}</div><div class='add'>+	iter-&gt;cur = cur;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int z_erofs_bvec_enqueue(struct z_erofs_bvec_iter *iter,</div><div class='add'>+				struct z_erofs_bvec *bvec,</div><div class='add'>+				struct page **candidate_bvpage,</div><div class='add'>+				struct page **pagepool)</div><div class='add'>+{</div><div class='add'>+	if (iter-&gt;cur &gt;= iter-&gt;nr) {</div><div class='add'>+		struct page *nextpage = *candidate_bvpage;</div><div class='add'>+</div><div class='add'>+		if (!nextpage) {</div><div class='add'>+			nextpage = __erofs_allocpage(pagepool, GFP_KERNEL,</div><div class='add'>+					true);</div><div class='add'>+			if (!nextpage)</div><div class='add'>+				return -ENOMEM;</div><div class='add'>+			set_page_private(nextpage, Z_EROFS_SHORTLIVED_PAGE);</div><div class='add'>+		}</div><div class='add'>+		DBG_BUGON(iter-&gt;bvset-&gt;nextpage);</div><div class='add'>+		iter-&gt;bvset-&gt;nextpage = nextpage;</div><div class='add'>+		z_erofs_bvset_flip(iter);</div><div class='add'>+</div><div class='add'>+		iter-&gt;bvset-&gt;nextpage = NULL;</div><div class='add'>+		*candidate_bvpage = NULL;</div><div class='add'>+	}</div><div class='add'>+	iter-&gt;bvset-&gt;bvec[iter-&gt;cur++] = *bvec;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void z_erofs_bvec_dequeue(struct z_erofs_bvec_iter *iter,</div><div class='add'>+				 struct z_erofs_bvec *bvec,</div><div class='add'>+				 struct page **old_bvpage)</div><div class='add'>+{</div><div class='add'>+	if (iter-&gt;cur == iter-&gt;nr)</div><div class='add'>+		*old_bvpage = z_erofs_bvset_flip(iter);</div><div class='add'>+	else</div><div class='add'>+		*old_bvpage = NULL;</div><div class='add'>+	*bvec = iter-&gt;bvset-&gt;bvec[iter-&gt;cur++];</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void z_erofs_destroy_pcluster_pool(void)</div><div class='ctx'> {</div><div class='ctx'> 	int i;</div><div class='hunk'>@@ -46,7 +234,7 @@ static int z_erofs_create_pcluster_pool(void)</div><div class='ctx'> </div><div class='ctx'> 	for (pcs = pcluster_pool;</div><div class='ctx'> 	     pcs &lt; pcluster_pool + ARRAY_SIZE(pcluster_pool); ++pcs) {</div><div class='del'>-		size = struct_size(a, compressed_pages, pcs-&gt;maxpages);</div><div class='add'>+		size = struct_size(a, compressed_bvecs, pcs-&gt;maxpages);</div><div class='ctx'> </div><div class='ctx'> 		sprintf(pcs-&gt;name, "erofs_pcluster-%u", pcs-&gt;maxpages);</div><div class='ctx'> 		pcs-&gt;slab = kmem_cache_create(pcs-&gt;name, size, 0,</div><div class='hunk'>@@ -60,21 +248,20 @@ static int z_erofs_create_pcluster_pool(void)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct z_erofs_pcluster *z_erofs_alloc_pcluster(unsigned int nrpages)</div><div class='add'>+static struct z_erofs_pcluster *z_erofs_alloc_pcluster(unsigned int size)</div><div class='ctx'> {</div><div class='del'>-	int i;</div><div class='add'>+	unsigned int nrpages = PAGE_ALIGN(size) &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	struct z_erofs_pcluster_slab *pcs = pcluster_pool;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; ARRAY_SIZE(pcluster_pool); ++i) {</div><div class='del'>-		struct z_erofs_pcluster_slab *pcs = pcluster_pool + i;</div><div class='add'>+	for (; pcs &lt; pcluster_pool + ARRAY_SIZE(pcluster_pool); ++pcs) {</div><div class='ctx'> 		struct z_erofs_pcluster *pcl;</div><div class='ctx'> </div><div class='ctx'> 		if (nrpages &gt; pcs-&gt;maxpages)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		pcl = kmem_cache_zalloc(pcs-&gt;slab, GFP_NOFS);</div><div class='add'>+		pcl = kmem_cache_zalloc(pcs-&gt;slab, GFP_KERNEL);</div><div class='ctx'> 		if (!pcl)</div><div class='ctx'> 			return ERR_PTR(-ENOMEM);</div><div class='del'>-		pcl-&gt;pclusterpages = nrpages;</div><div class='ctx'> 		return pcl;</div><div class='ctx'> 	}</div><div class='ctx'> 	return ERR_PTR(-EINVAL);</div><div class='hunk'>@@ -82,12 +269,13 @@ static struct z_erofs_pcluster *z_erofs_alloc_pcluster(unsigned int nrpages)</div><div class='ctx'> </div><div class='ctx'> static void z_erofs_free_pcluster(struct z_erofs_pcluster *pcl)</div><div class='ctx'> {</div><div class='add'>+	unsigned int pclusterpages = z_erofs_pclusterpages(pcl);</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; ARRAY_SIZE(pcluster_pool); ++i) {</div><div class='ctx'> 		struct z_erofs_pcluster_slab *pcs = pcluster_pool + i;</div><div class='ctx'> </div><div class='del'>-		if (pcl-&gt;pclusterpages &gt; pcs-&gt;maxpages)</div><div class='add'>+		if (pclusterpages &gt; pcs-&gt;maxpages)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		kmem_cache_free(pcs-&gt;slab, pcl);</div><div class='hunk'>@@ -96,962 +284,1143 @@ static void z_erofs_free_pcluster(struct z_erofs_pcluster *pcl)</div><div class='ctx'> 	DBG_BUGON(1);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * a compressed_pages[] placeholder in order to avoid</div><div class='del'>- * being filled with file pages for in-place decompression.</div><div class='del'>- */</div><div class='del'>-#define PAGE_UNALLOCATED     ((void *)0x5F0E4B1D)</div><div class='add'>+static struct workqueue_struct *z_erofs_workqueue __read_mostly;</div><div class='ctx'> </div><div class='del'>-/* how to allocate cached pages for a pcluster */</div><div class='del'>-enum z_erofs_cache_alloctype {</div><div class='del'>-	DONTALLOC,	/* don't allocate any cached pages */</div><div class='del'>-	DELAYEDALLOC,	/* delayed allocation (at the time of submitting io) */</div><div class='del'>-	/*</div><div class='del'>-	 * try to use cached I/O if page allocation succeeds or fallback</div><div class='del'>-	 * to in-place I/O instead to avoid any direct reclaim.</div><div class='del'>-	 */</div><div class='del'>-	TRYALLOC,</div><div class='del'>-};</div><div class='add'>+#ifdef CONFIG_EROFS_FS_PCPU_KTHREAD</div><div class='add'>+static struct kthread_worker __rcu **z_erofs_pcpu_workers;</div><div class='add'>+static atomic_t erofs_percpu_workers_initialized = ATOMIC_INIT(0);</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * tagged pointer with 1-bit tag for all compressed pages</div><div class='del'>- * tag 0 - the page is just found with an extra page reference</div><div class='del'>- */</div><div class='del'>-typedef tagptr1_t compressed_page_t;</div><div class='add'>+static void erofs_destroy_percpu_workers(void)</div><div class='add'>+{</div><div class='add'>+	struct kthread_worker *worker;</div><div class='add'>+	unsigned int cpu;</div><div class='add'>+</div><div class='add'>+	for_each_possible_cpu(cpu) {</div><div class='add'>+		worker = rcu_dereference_protected(</div><div class='add'>+					z_erofs_pcpu_workers[cpu], 1);</div><div class='add'>+		rcu_assign_pointer(z_erofs_pcpu_workers[cpu], NULL);</div><div class='add'>+		if (worker)</div><div class='add'>+			kthread_destroy_worker(worker);</div><div class='add'>+	}</div><div class='add'>+	kfree(z_erofs_pcpu_workers);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-#define tag_compressed_page_justfound(page) \</div><div class='del'>-	tagptr_fold(compressed_page_t, page, 1)</div><div class='add'>+static struct kthread_worker *erofs_init_percpu_worker(int cpu)</div><div class='add'>+{</div><div class='add'>+	struct kthread_worker *worker =</div><div class='add'>+		kthread_run_worker_on_cpu(cpu, 0, "erofs_worker/%u");</div><div class='add'>+</div><div class='add'>+	if (IS_ERR(worker))</div><div class='add'>+		return worker;</div><div class='add'>+	if (IS_ENABLED(CONFIG_EROFS_FS_PCPU_KTHREAD_HIPRI))</div><div class='add'>+		sched_set_fifo_low(worker-&gt;task);</div><div class='add'>+	return worker;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-static struct workqueue_struct *z_erofs_workqueue __read_mostly;</div><div class='add'>+static int erofs_init_percpu_workers(void)</div><div class='add'>+{</div><div class='add'>+	struct kthread_worker *worker;</div><div class='add'>+	unsigned int cpu;</div><div class='ctx'> </div><div class='del'>-void z_erofs_exit_zip_subsystem(void)</div><div class='add'>+	z_erofs_pcpu_workers = kcalloc(num_possible_cpus(),</div><div class='add'>+			sizeof(struct kthread_worker *), GFP_ATOMIC);</div><div class='add'>+	if (!z_erofs_pcpu_workers)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	for_each_online_cpu(cpu) {	/* could miss cpu{off,on}line? */</div><div class='add'>+		worker = erofs_init_percpu_worker(cpu);</div><div class='add'>+		if (!IS_ERR(worker))</div><div class='add'>+			rcu_assign_pointer(z_erofs_pcpu_workers[cpu], worker);</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_HOTPLUG_CPU</div><div class='add'>+static DEFINE_SPINLOCK(z_erofs_pcpu_worker_lock);</div><div class='add'>+static enum cpuhp_state erofs_cpuhp_state;</div><div class='add'>+</div><div class='add'>+static int erofs_cpu_online(unsigned int cpu)</div><div class='ctx'> {</div><div class='del'>-	destroy_workqueue(z_erofs_workqueue);</div><div class='del'>-	z_erofs_destroy_pcluster_pool();</div><div class='add'>+	struct kthread_worker *worker, *old;</div><div class='add'>+</div><div class='add'>+	worker = erofs_init_percpu_worker(cpu);</div><div class='add'>+	if (IS_ERR(worker))</div><div class='add'>+		return PTR_ERR(worker);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;z_erofs_pcpu_worker_lock);</div><div class='add'>+	old = rcu_dereference_protected(z_erofs_pcpu_workers[cpu],</div><div class='add'>+			lockdep_is_held(&amp;z_erofs_pcpu_worker_lock));</div><div class='add'>+	if (!old)</div><div class='add'>+		rcu_assign_pointer(z_erofs_pcpu_workers[cpu], worker);</div><div class='add'>+	spin_unlock(&amp;z_erofs_pcpu_worker_lock);</div><div class='add'>+	if (old)</div><div class='add'>+		kthread_destroy_worker(worker);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int z_erofs_init_workqueue(void)</div><div class='add'>+static int erofs_cpu_offline(unsigned int cpu)</div><div class='ctx'> {</div><div class='del'>-	const unsigned int onlinecpus = num_possible_cpus();</div><div class='add'>+	struct kthread_worker *worker;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * no need to spawn too many threads, limiting threads could minimum</div><div class='del'>-	 * scheduling overhead, perhaps per-CPU threads should be better?</div><div class='del'>-	 */</div><div class='del'>-	z_erofs_workqueue = alloc_workqueue("erofs_unzipd",</div><div class='del'>-					    WQ_UNBOUND | WQ_HIGHPRI,</div><div class='del'>-					    onlinecpus + onlinecpus / 4);</div><div class='del'>-	return z_erofs_workqueue ? 0 : -ENOMEM;</div><div class='add'>+	spin_lock(&amp;z_erofs_pcpu_worker_lock);</div><div class='add'>+	worker = rcu_dereference_protected(z_erofs_pcpu_workers[cpu],</div><div class='add'>+			lockdep_is_held(&amp;z_erofs_pcpu_worker_lock));</div><div class='add'>+	rcu_assign_pointer(z_erofs_pcpu_workers[cpu], NULL);</div><div class='add'>+	spin_unlock(&amp;z_erofs_pcpu_worker_lock);</div><div class='add'>+</div><div class='add'>+	synchronize_rcu();</div><div class='add'>+	if (worker)</div><div class='add'>+		kthread_destroy_worker(worker);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int __init z_erofs_init_zip_subsystem(void)</div><div class='add'>+static int erofs_cpu_hotplug_init(void)</div><div class='ctx'> {</div><div class='del'>-	int err = z_erofs_create_pcluster_pool();</div><div class='add'>+	int state;</div><div class='add'>+</div><div class='add'>+	state = cpuhp_setup_state_nocalls(CPUHP_AP_ONLINE_DYN,</div><div class='add'>+			"fs/erofs:online", erofs_cpu_online, erofs_cpu_offline);</div><div class='add'>+	if (state &lt; 0)</div><div class='add'>+		return state;</div><div class='add'>+</div><div class='add'>+	erofs_cpuhp_state = state;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void erofs_cpu_hotplug_destroy(void)</div><div class='add'>+{</div><div class='add'>+	if (erofs_cpuhp_state)</div><div class='add'>+		cpuhp_remove_state_nocalls(erofs_cpuhp_state);</div><div class='add'>+}</div><div class='add'>+#else /* !CONFIG_HOTPLUG_CPU  */</div><div class='add'>+static inline int erofs_cpu_hotplug_init(void) { return 0; }</div><div class='add'>+static inline void erofs_cpu_hotplug_destroy(void) {}</div><div class='add'>+#endif/* CONFIG_HOTPLUG_CPU */</div><div class='add'>+static int z_erofs_init_pcpu_workers(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	if (atomic_xchg(&amp;erofs_percpu_workers_initialized, 1))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	err = erofs_init_percpu_workers();</div><div class='add'>+	if (err) {</div><div class='add'>+		erofs_err(sb, "per-cpu workers: failed to allocate.");</div><div class='add'>+		goto err_init_percpu_workers;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	err = erofs_cpu_hotplug_init();</div><div class='add'>+	if (err &lt; 0) {</div><div class='add'>+		erofs_err(sb, "per-cpu workers: failed CPU hotplug init.");</div><div class='add'>+		goto err_cpuhp_init;</div><div class='add'>+	}</div><div class='add'>+	erofs_info(sb, "initialized per-cpu workers successfully.");</div><div class='add'>+	return err;</div><div class='add'>+</div><div class='add'>+err_cpuhp_init:</div><div class='add'>+	erofs_destroy_percpu_workers();</div><div class='add'>+err_init_percpu_workers:</div><div class='add'>+	atomic_set(&amp;erofs_percpu_workers_initialized, 0);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void z_erofs_destroy_pcpu_workers(void)</div><div class='add'>+{</div><div class='add'>+	if (!atomic_xchg(&amp;erofs_percpu_workers_initialized, 0))</div><div class='add'>+		return;</div><div class='add'>+	erofs_cpu_hotplug_destroy();</div><div class='add'>+	erofs_destroy_percpu_workers();</div><div class='add'>+}</div><div class='add'>+#else /* !CONFIG_EROFS_FS_PCPU_KTHREAD */</div><div class='add'>+static inline int z_erofs_init_pcpu_workers(struct super_block *sb) { return 0; }</div><div class='add'>+static inline void z_erofs_destroy_pcpu_workers(void) {}</div><div class='add'>+#endif/* CONFIG_EROFS_FS_PCPU_KTHREAD */</div><div class='add'>+</div><div class='add'>+void z_erofs_exit_subsystem(void)</div><div class='add'>+{</div><div class='add'>+	z_erofs_destroy_pcpu_workers();</div><div class='add'>+	destroy_workqueue(z_erofs_workqueue);</div><div class='add'>+	z_erofs_destroy_pcluster_pool();</div><div class='add'>+	z_erofs_crypto_disable_all_engines();</div><div class='add'>+	z_erofs_exit_decompressor();</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int __init z_erofs_init_subsystem(void)</div><div class='add'>+{</div><div class='add'>+	int err = z_erofs_init_decompressor();</div><div class='ctx'> </div><div class='ctx'> 	if (err)</div><div class='del'>-		return err;</div><div class='del'>-	err = z_erofs_init_workqueue();</div><div class='add'>+		goto err_decompressor;</div><div class='add'>+</div><div class='add'>+	err = z_erofs_create_pcluster_pool();</div><div class='ctx'> 	if (err)</div><div class='del'>-		z_erofs_destroy_pcluster_pool();</div><div class='add'>+		goto err_pcluster_pool;</div><div class='add'>+</div><div class='add'>+	z_erofs_workqueue = alloc_workqueue("erofs_worker",</div><div class='add'>+			WQ_UNBOUND | WQ_HIGHPRI, num_possible_cpus());</div><div class='add'>+	if (!z_erofs_workqueue) {</div><div class='add'>+		err = -ENOMEM;</div><div class='add'>+		goto err_workqueue_init;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return err;</div><div class='add'>+</div><div class='add'>+err_workqueue_init:</div><div class='add'>+	z_erofs_destroy_pcluster_pool();</div><div class='add'>+err_pcluster_pool:</div><div class='add'>+	z_erofs_exit_decompressor();</div><div class='add'>+err_decompressor:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-enum z_erofs_collectmode {</div><div class='del'>-	COLLECT_SECONDARY,</div><div class='del'>-	COLLECT_PRIMARY,</div><div class='del'>-	/*</div><div class='del'>-	 * The current collection was the tail of an exist chain, in addition</div><div class='del'>-	 * that the previous processed chained collections are all decided to</div><div class='del'>-	 * be hooked up to it.</div><div class='del'>-	 * A new chain will be created for the remaining collections which are</div><div class='del'>-	 * not processed yet, therefore different from COLLECT_PRIMARY_FOLLOWED,</div><div class='del'>-	 * the next collection cannot reuse the whole page safely in</div><div class='del'>-	 * the following scenario:</div><div class='del'>-	 *  ________________________________________________________________</div><div class='del'>-	 * |      tail (partial) page     |       head (partial) page       |</div><div class='del'>-	 * |   (belongs to the next cl)   |   (belongs to the current cl)   |</div><div class='del'>-	 * |_______PRIMARY_FOLLOWED_______|________PRIMARY_HOOKED___________|</div><div class='del'>-	 */</div><div class='del'>-	COLLECT_PRIMARY_HOOKED,</div><div class='add'>+enum z_erofs_pclustermode {</div><div class='add'>+	/* It has previously been linked into another processing chain */</div><div class='add'>+	Z_EROFS_PCLUSTER_INFLIGHT,</div><div class='ctx'> 	/*</div><div class='del'>-	 * a weak form of COLLECT_PRIMARY_FOLLOWED, the difference is that it</div><div class='del'>-	 * could be dispatched into bypass queue later due to uptodated managed</div><div class='del'>-	 * pages. All related online pages cannot be reused for inplace I/O (or</div><div class='del'>-	 * pagevec) since it can be directly decoded without I/O submission.</div><div class='add'>+	 * A weaker form of Z_EROFS_PCLUSTER_FOLLOWED; the difference is that it</div><div class='add'>+	 * may be dispatched to the bypass queue later due to uptodated managed</div><div class='add'>+	 * folios.  All file-backed folios related to this pcluster cannot be</div><div class='add'>+	 * reused for in-place I/O (or bvpage) since the pcluster may be decoded</div><div class='add'>+	 * in a separate queue (and thus out of order).</div><div class='ctx'> 	 */</div><div class='del'>-	COLLECT_PRIMARY_FOLLOWED_NOINPLACE,</div><div class='add'>+	Z_EROFS_PCLUSTER_FOLLOWED_NOINPLACE,</div><div class='ctx'> 	/*</div><div class='del'>-	 * The current collection has been linked with the owned chain, and</div><div class='del'>-	 * could also be linked with the remaining collections, which means</div><div class='del'>-	 * if the processing page is the tail page of the collection, thus</div><div class='del'>-	 * the current collection can safely use the whole page (since</div><div class='del'>-	 * the previous collection is under control) for in-place I/O, as</div><div class='del'>-	 * illustrated below:</div><div class='del'>-	 *  ________________________________________________________________</div><div class='del'>-	 * |  tail (partial) page |          head (partial) page           |</div><div class='del'>-	 * |  (of the current cl) |      (of the previous collection)      |</div><div class='del'>-	 * |  PRIMARY_FOLLOWED or |                                        |</div><div class='del'>-	 * |_____PRIMARY_HOOKED___|____________PRIMARY_FOLLOWED____________|</div><div class='del'>-	 *</div><div class='del'>-	 * [  (*) the above page can be used as inplace I/O.               ]</div><div class='add'>+	 * The pcluster has just been linked to our processing chain.</div><div class='add'>+	 * File-backed folios (except for the head page) related to it can be</div><div class='add'>+	 * used for in-place I/O (or bvpage).</div><div class='ctx'> 	 */</div><div class='del'>-	COLLECT_PRIMARY_FOLLOWED,</div><div class='add'>+	Z_EROFS_PCLUSTER_FOLLOWED,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-struct z_erofs_collector {</div><div class='del'>-	struct z_erofs_pagevec_ctor vector;</div><div class='add'>+struct z_erofs_frontend {</div><div class='add'>+	struct inode *const inode;</div><div class='add'>+	struct erofs_map_blocks map;</div><div class='add'>+	struct z_erofs_bvec_iter biter;</div><div class='ctx'> </div><div class='del'>-	struct z_erofs_pcluster *pcl, *tailpcl;</div><div class='del'>-	struct z_erofs_collection *cl;</div><div class='del'>-	/* a pointer used to pick up inplace I/O pages */</div><div class='del'>-	struct page **icpage_ptr;</div><div class='del'>-	z_erofs_next_pcluster_t owned_head;</div><div class='add'>+	struct page *pagepool;</div><div class='add'>+	struct page *candidate_bvpage;</div><div class='add'>+	struct z_erofs_pcluster *pcl, *head;</div><div class='add'>+	enum z_erofs_pclustermode mode;</div><div class='ctx'> </div><div class='del'>-	enum z_erofs_collectmode mode;</div><div class='add'>+	erofs_off_t headoffset;</div><div class='add'>+</div><div class='add'>+	/* a pointer used to pick up inplace I/O pages */</div><div class='add'>+	unsigned int icur;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-struct z_erofs_decompress_frontend {</div><div class='del'>-	struct inode *const inode;</div><div class='add'>+#define Z_EROFS_DEFINE_FRONTEND(fe, i, ho) struct z_erofs_frontend fe = { \</div><div class='add'>+	.inode = i, .head = Z_EROFS_PCLUSTER_TAIL, \</div><div class='add'>+	.mode = Z_EROFS_PCLUSTER_FOLLOWED, .headoffset = ho }</div><div class='ctx'> </div><div class='del'>-	struct z_erofs_collector clt;</div><div class='del'>-	struct erofs_map_blocks map;</div><div class='add'>+static bool z_erofs_should_alloc_cache(struct z_erofs_frontend *fe)</div><div class='add'>+{</div><div class='add'>+	unsigned int cachestrategy = EROFS_I_SB(fe-&gt;inode)-&gt;opt.cache_strategy;</div><div class='ctx'> </div><div class='del'>-	bool readahead;</div><div class='del'>-	/* used for applying cache strategy on the fly */</div><div class='del'>-	bool backmost;</div><div class='del'>-	erofs_off_t headoffset;</div><div class='del'>-};</div><div class='add'>+	if (cachestrategy &lt;= EROFS_ZIP_CACHE_DISABLED)</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-#define COLLECTOR_INIT() { \</div><div class='del'>-	.owned_head = Z_EROFS_PCLUSTER_TAIL, \</div><div class='del'>-	.mode = COLLECT_PRIMARY_FOLLOWED }</div><div class='add'>+	if (!(fe-&gt;map.m_flags &amp; EROFS_MAP_FULL_MAPPED))</div><div class='add'>+		return true;</div><div class='ctx'> </div><div class='del'>-#define DECOMPRESS_FRONTEND_INIT(__i) { \</div><div class='del'>-	.inode = __i, .clt = COLLECTOR_INIT(), \</div><div class='del'>-	.backmost = true, }</div><div class='add'>+	if (cachestrategy &gt;= EROFS_ZIP_CACHE_READAROUND &amp;&amp;</div><div class='add'>+	    fe-&gt;map.m_la &lt; fe-&gt;headoffset)</div><div class='add'>+		return true;</div><div class='ctx'> </div><div class='del'>-static struct page *z_pagemap_global[Z_EROFS_VMAP_GLOBAL_PAGES];</div><div class='del'>-static DEFINE_MUTEX(z_pagemap_global_lock);</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-static void preload_compressed_pages(struct z_erofs_collector *clt,</div><div class='del'>-				     struct address_space *mc,</div><div class='del'>-				     enum z_erofs_cache_alloctype type,</div><div class='del'>-				     struct page **pagepool)</div><div class='add'>+static void z_erofs_bind_cache(struct z_erofs_frontend *fe)</div><div class='ctx'> {</div><div class='del'>-	struct z_erofs_pcluster *pcl = clt-&gt;pcl;</div><div class='del'>-	bool standalone = true;</div><div class='add'>+	struct address_space *mc = MNGD_MAPPING(EROFS_I_SB(fe-&gt;inode));</div><div class='add'>+	struct z_erofs_pcluster *pcl = fe-&gt;pcl;</div><div class='add'>+	unsigned int pclusterpages = z_erofs_pclusterpages(pcl);</div><div class='add'>+	bool shouldalloc = z_erofs_should_alloc_cache(fe);</div><div class='add'>+	pgoff_t poff = pcl-&gt;pos &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	bool may_bypass = true;</div><div class='add'>+	/* Optimistic allocation, as in-place I/O can be used as a fallback */</div><div class='ctx'> 	gfp_t gfp = (mapping_gfp_mask(mc) &amp; ~__GFP_DIRECT_RECLAIM) |</div><div class='ctx'> 			__GFP_NOMEMALLOC | __GFP_NORETRY | __GFP_NOWARN;</div><div class='del'>-	struct page **pages;</div><div class='del'>-	pgoff_t index;</div><div class='add'>+	struct folio *folio, *newfolio;</div><div class='add'>+	unsigned int i;</div><div class='ctx'> </div><div class='del'>-	if (clt-&gt;mode &lt; COLLECT_PRIMARY_FOLLOWED)</div><div class='add'>+	if (i_blocksize(fe-&gt;inode) != PAGE_SIZE ||</div><div class='add'>+	    fe-&gt;mode &lt; Z_EROFS_PCLUSTER_FOLLOWED)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	pages = pcl-&gt;compressed_pages;</div><div class='del'>-	index = pcl-&gt;obj.index;</div><div class='del'>-	for (; index &lt; pcl-&gt;obj.index + pcl-&gt;pclusterpages; ++index, ++pages) {</div><div class='del'>-		struct page *page;</div><div class='del'>-		compressed_page_t t;</div><div class='del'>-		struct page *newpage = NULL;</div><div class='del'>-</div><div class='del'>-		/* the compressed page was loaded before */</div><div class='del'>-		if (READ_ONCE(*pages))</div><div class='add'>+	for (i = 0; i &lt; pclusterpages; ++i) {</div><div class='add'>+		/* Inaccurate check w/o locking to avoid unneeded lookups */</div><div class='add'>+		if (READ_ONCE(pcl-&gt;compressed_bvecs[i].page))</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		page = find_get_page(mc, index);</div><div class='add'>+		folio = filemap_get_folio(mc, poff + i);</div><div class='add'>+		if (IS_ERR(folio)) {</div><div class='add'>+			may_bypass = false;</div><div class='add'>+			if (!shouldalloc)</div><div class='add'>+				continue;</div><div class='ctx'> </div><div class='del'>-		if (page) {</div><div class='del'>-			t = tag_compressed_page_justfound(page);</div><div class='del'>-		} else {</div><div class='del'>-			/* I/O is needed, no possible to decompress directly */</div><div class='del'>-			standalone = false;</div><div class='del'>-			switch (type) {</div><div class='del'>-			case DELAYEDALLOC:</div><div class='del'>-				t = tagptr_init(compressed_page_t,</div><div class='del'>-						PAGE_UNALLOCATED);</div><div class='del'>-				break;</div><div class='del'>-			case TRYALLOC:</div><div class='del'>-				newpage = erofs_allocpage(pagepool, gfp);</div><div class='del'>-				if (!newpage)</div><div class='del'>-					continue;</div><div class='del'>-				set_page_private(newpage,</div><div class='del'>-						 Z_EROFS_PREALLOCATED_PAGE);</div><div class='del'>-				t = tag_compressed_page_justfound(newpage);</div><div class='del'>-				break;</div><div class='del'>-			default:        /* DONTALLOC */</div><div class='add'>+			/*</div><div class='add'>+			 * Allocate a managed folio for cached I/O, or it may be</div><div class='add'>+			 * then filled with a file-backed folio for in-place I/O</div><div class='add'>+			 */</div><div class='add'>+			newfolio = filemap_alloc_folio(gfp, 0, NULL);</div><div class='add'>+			if (!newfolio)</div><div class='ctx'> 				continue;</div><div class='del'>-			}</div><div class='add'>+			newfolio-&gt;private = Z_EROFS_PREALLOCATED_FOLIO;</div><div class='add'>+			folio = NULL;</div><div class='ctx'> 		}</div><div class='del'>-</div><div class='del'>-		if (!cmpxchg_relaxed(pages, NULL, tagptr_cast_ptr(t)))</div><div class='add'>+		spin_lock(&amp;pcl-&gt;lockref.lock);</div><div class='add'>+		if (!pcl-&gt;compressed_bvecs[i].page) {</div><div class='add'>+			pcl-&gt;compressed_bvecs[i].page =</div><div class='add'>+				folio_page(folio ?: newfolio, 0);</div><div class='add'>+			spin_unlock(&amp;pcl-&gt;lockref.lock);</div><div class='ctx'> 			continue;</div><div class='del'>-</div><div class='del'>-		if (page)</div><div class='del'>-			put_page(page);</div><div class='del'>-		else if (newpage)</div><div class='del'>-			erofs_pagepool_add(pagepool, newpage);</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;pcl-&gt;lockref.lock);</div><div class='add'>+		folio_put(folio ?: newfolio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * don't do inplace I/O if all compressed pages are available in</div><div class='del'>-	 * managed cache since it can be moved to the bypass queue instead.</div><div class='add'>+	 * Don't perform in-place I/O if all compressed pages are available in</div><div class='add'>+	 * the managed cache, as the pcluster can be moved to the bypass queue.</div><div class='ctx'> 	 */</div><div class='del'>-	if (standalone)</div><div class='del'>-		clt-&gt;mode = COLLECT_PRIMARY_FOLLOWED_NOINPLACE;</div><div class='add'>+	if (may_bypass)</div><div class='add'>+		fe-&gt;mode = Z_EROFS_PCLUSTER_FOLLOWED_NOINPLACE;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* called by erofs_shrinker to get rid of all compressed_pages */</div><div class='del'>-int erofs_try_to_free_all_cached_pages(struct erofs_sb_info *sbi,</div><div class='del'>-				       struct erofs_workgroup *grp)</div><div class='add'>+/* (erofs_shrinker) disconnect cached encoded data with pclusters */</div><div class='add'>+static int erofs_try_to_free_all_cached_folios(struct erofs_sb_info *sbi,</div><div class='add'>+					       struct z_erofs_pcluster *pcl)</div><div class='ctx'> {</div><div class='del'>-	struct z_erofs_pcluster *const pcl =</div><div class='del'>-		container_of(grp, struct z_erofs_pcluster, obj);</div><div class='add'>+	unsigned int pclusterpages = z_erofs_pclusterpages(pcl);</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * refcount of workgroup is now freezed as 1,</div><div class='del'>-	 * therefore no need to worry about available decompression users.</div><div class='del'>-	 */</div><div class='del'>-	for (i = 0; i &lt; pcl-&gt;pclusterpages; ++i) {</div><div class='del'>-		struct page *page = pcl-&gt;compressed_pages[i];</div><div class='del'>-</div><div class='del'>-		if (!page)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		/* block other users from reclaiming or migrating the page */</div><div class='del'>-		if (!trylock_page(page))</div><div class='del'>-			return -EBUSY;</div><div class='del'>-</div><div class='del'>-		if (!erofs_page_is_managed(sbi, page))</div><div class='del'>-			continue;</div><div class='add'>+	DBG_BUGON(pcl-&gt;from_meta);</div><div class='add'>+	/* Each cached folio contains one page unless bs &gt; ps is supported */</div><div class='add'>+	for (i = 0; i &lt; pclusterpages; ++i) {</div><div class='add'>+		if (pcl-&gt;compressed_bvecs[i].page) {</div><div class='add'>+			folio = page_folio(pcl-&gt;compressed_bvecs[i].page);</div><div class='add'>+			/* Avoid reclaiming or migrating this folio */</div><div class='add'>+			if (!folio_trylock(folio))</div><div class='add'>+				return -EBUSY;</div><div class='ctx'> </div><div class='del'>-		/* barrier is implied in the following 'unlock_page' */</div><div class='del'>-		WRITE_ONCE(pcl-&gt;compressed_pages[i], NULL);</div><div class='del'>-		detach_page_private(page);</div><div class='del'>-		unlock_page(page);</div><div class='add'>+			if (!erofs_folio_is_managed(sbi, folio))</div><div class='add'>+				continue;</div><div class='add'>+			pcl-&gt;compressed_bvecs[i].page = NULL;</div><div class='add'>+			folio_detach_private(folio);</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int erofs_try_to_free_cached_page(struct page *page)</div><div class='add'>+static bool z_erofs_cache_release_folio(struct folio *folio, gfp_t gfp)</div><div class='ctx'> {</div><div class='del'>-	struct z_erofs_pcluster *const pcl = (void *)page_private(page);</div><div class='del'>-	int ret = 0;	/* 0 - busy */</div><div class='add'>+	struct z_erofs_pcluster *pcl = folio_get_private(folio);</div><div class='add'>+	struct z_erofs_bvec *bvec = pcl-&gt;compressed_bvecs;</div><div class='add'>+	struct z_erofs_bvec *end = bvec + z_erofs_pclusterpages(pcl);</div><div class='add'>+	bool ret;</div><div class='ctx'> </div><div class='del'>-	if (erofs_workgroup_try_to_freeze(&amp;pcl-&gt;obj, 1)) {</div><div class='del'>-		unsigned int i;</div><div class='add'>+	if (!folio_test_private(folio))</div><div class='add'>+		return true;</div><div class='ctx'> </div><div class='del'>-		for (i = 0; i &lt; pcl-&gt;pclusterpages; ++i) {</div><div class='del'>-			if (pcl-&gt;compressed_pages[i] == page) {</div><div class='del'>-				WRITE_ONCE(pcl-&gt;compressed_pages[i], NULL);</div><div class='del'>-				ret = 1;</div><div class='add'>+	ret = false;</div><div class='add'>+	spin_lock(&amp;pcl-&gt;lockref.lock);</div><div class='add'>+	if (pcl-&gt;lockref.count &lt;= 0) {</div><div class='add'>+		DBG_BUGON(pcl-&gt;from_meta);</div><div class='add'>+		for (; bvec &lt; end; ++bvec) {</div><div class='add'>+			if (bvec-&gt;page &amp;&amp; page_folio(bvec-&gt;page) == folio) {</div><div class='add'>+				bvec-&gt;page = NULL;</div><div class='add'>+				folio_detach_private(folio);</div><div class='add'>+				ret = true;</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		erofs_workgroup_unfreeze(&amp;pcl-&gt;obj, 1);</div><div class='del'>-</div><div class='del'>-		if (ret)</div><div class='del'>-			detach_page_private(page);</div><div class='ctx'> 	}</div><div class='add'>+	spin_unlock(&amp;pcl-&gt;lockref.lock);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* page_type must be Z_EROFS_PAGE_TYPE_EXCLUSIVE */</div><div class='del'>-static bool z_erofs_try_inplace_io(struct z_erofs_collector *clt,</div><div class='del'>-				   struct page *page)</div><div class='add'>+/*</div><div class='add'>+ * It will be called only on inode eviction. In case that there are still some</div><div class='add'>+ * decompression requests in progress, wait with rescheduling for a bit here.</div><div class='add'>+ * An extra lock could be introduced instead but it seems unnecessary.</div><div class='add'>+ */</div><div class='add'>+static void z_erofs_cache_invalidate_folio(struct folio *folio,</div><div class='add'>+					   size_t offset, size_t length)</div><div class='ctx'> {</div><div class='del'>-	struct z_erofs_pcluster *const pcl = clt-&gt;pcl;</div><div class='add'>+	const size_t stop = length + offset;</div><div class='ctx'> </div><div class='del'>-	while (clt-&gt;icpage_ptr &gt; pcl-&gt;compressed_pages)</div><div class='del'>-		if (!cmpxchg(--clt-&gt;icpage_ptr, NULL, page))</div><div class='del'>-			return true;</div><div class='del'>-	return false;</div><div class='add'>+	/* Check for potential overflow in debug mode */</div><div class='add'>+	DBG_BUGON(stop &gt; folio_size(folio) || stop &lt; length);</div><div class='add'>+</div><div class='add'>+	if (offset == 0 &amp;&amp; stop == folio_size(folio))</div><div class='add'>+		while (!z_erofs_cache_release_folio(folio, 0))</div><div class='add'>+			cond_resched();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* callers must be with collection lock held */</div><div class='del'>-static int z_erofs_attach_page(struct z_erofs_collector *clt,</div><div class='del'>-			       struct page *page,</div><div class='del'>-			       enum z_erofs_page_type type)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='add'>+static const struct address_space_operations z_erofs_cache_aops = {</div><div class='add'>+	.release_folio = z_erofs_cache_release_folio,</div><div class='add'>+	.invalidate_folio = z_erofs_cache_invalidate_folio,</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-	/* give priority for inplaceio */</div><div class='del'>-	if (clt-&gt;mode &gt;= COLLECT_PRIMARY &amp;&amp;</div><div class='del'>-	    type == Z_EROFS_PAGE_TYPE_EXCLUSIVE &amp;&amp;</div><div class='del'>-	    z_erofs_try_inplace_io(clt, page))</div><div class='del'>-		return 0;</div><div class='add'>+int z_erofs_init_super(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='del'>-	ret = z_erofs_pagevec_enqueue(&amp;clt-&gt;vector, page, type);</div><div class='del'>-	clt-&gt;cl-&gt;vcnt += (unsigned int)ret;</div><div class='add'>+	err = z_erofs_init_pcpu_workers(sb);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='del'>-	return ret ? 0 : -EAGAIN;</div><div class='add'>+	inode = new_inode(sb);</div><div class='add'>+	if (!inode)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	set_nlink(inode, 1);</div><div class='add'>+	inode-&gt;i_size = OFFSET_MAX;</div><div class='add'>+	inode-&gt;i_mapping-&gt;a_ops = &amp;z_erofs_cache_aops;</div><div class='add'>+	mapping_set_gfp_mask(inode-&gt;i_mapping, GFP_KERNEL);</div><div class='add'>+	EROFS_SB(sb)-&gt;managed_cache = inode;</div><div class='add'>+	xa_init(&amp;EROFS_SB(sb)-&gt;managed_pslots);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void z_erofs_try_to_claim_pcluster(struct z_erofs_collector *clt)</div><div class='add'>+/* callers must be with pcluster lock held */</div><div class='add'>+static int z_erofs_attach_page(struct z_erofs_frontend *fe,</div><div class='add'>+			       struct z_erofs_bvec *bvec, bool exclusive)</div><div class='ctx'> {</div><div class='del'>-	struct z_erofs_pcluster *pcl = clt-&gt;pcl;</div><div class='del'>-	z_erofs_next_pcluster_t *owned_head = &amp;clt-&gt;owned_head;</div><div class='del'>-</div><div class='del'>-	/* type 1, nil pcluster (this pcluster doesn't belong to any chain.) */</div><div class='del'>-	if (cmpxchg(&amp;pcl-&gt;next, Z_EROFS_PCLUSTER_NIL,</div><div class='del'>-		    *owned_head) == Z_EROFS_PCLUSTER_NIL) {</div><div class='del'>-		*owned_head = &amp;pcl-&gt;next;</div><div class='del'>-		/* so we can attach this pcluster to our submission chain. */</div><div class='del'>-		clt-&gt;mode = COLLECT_PRIMARY_FOLLOWED;</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='add'>+	struct z_erofs_pcluster *pcl = fe-&gt;pcl;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * type 2, link to the end of an existing open chain, be careful</div><div class='del'>-	 * that its submission is controlled by the original attached chain.</div><div class='del'>-	 */</div><div class='del'>-	if (cmpxchg(&amp;pcl-&gt;next, Z_EROFS_PCLUSTER_TAIL,</div><div class='del'>-		    *owned_head) == Z_EROFS_PCLUSTER_TAIL) {</div><div class='del'>-		*owned_head = Z_EROFS_PCLUSTER_TAIL;</div><div class='del'>-		clt-&gt;mode = COLLECT_PRIMARY_HOOKED;</div><div class='del'>-		clt-&gt;tailpcl = NULL;</div><div class='del'>-		return;</div><div class='add'>+	if (exclusive) {</div><div class='add'>+		/* Inplace I/O is limited to one page for uncompressed data */</div><div class='add'>+		if (pcl-&gt;algorithmformat &lt; Z_EROFS_COMPRESSION_MAX ||</div><div class='add'>+		    fe-&gt;icur &lt;= 1) {</div><div class='add'>+			/* Try to prioritize inplace I/O here */</div><div class='add'>+			spin_lock(&amp;pcl-&gt;lockref.lock);</div><div class='add'>+			while (fe-&gt;icur &gt; 0) {</div><div class='add'>+				if (pcl-&gt;compressed_bvecs[--fe-&gt;icur].page)</div><div class='add'>+					continue;</div><div class='add'>+				pcl-&gt;compressed_bvecs[fe-&gt;icur] = *bvec;</div><div class='add'>+				spin_unlock(&amp;pcl-&gt;lockref.lock);</div><div class='add'>+				return 0;</div><div class='add'>+			}</div><div class='add'>+			spin_unlock(&amp;pcl-&gt;lockref.lock);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* otherwise, check if it can be used as a bvpage */</div><div class='add'>+		if (fe-&gt;mode &gt;= Z_EROFS_PCLUSTER_FOLLOWED &amp;&amp;</div><div class='add'>+		    !fe-&gt;candidate_bvpage)</div><div class='add'>+			fe-&gt;candidate_bvpage = bvec-&gt;page;</div><div class='ctx'> 	}</div><div class='del'>-	/* type 3, it belongs to a chain, but it isn't the end of the chain */</div><div class='del'>-	clt-&gt;mode = COLLECT_PRIMARY;</div><div class='add'>+	ret = z_erofs_bvec_enqueue(&amp;fe-&gt;biter, bvec, &amp;fe-&gt;candidate_bvpage,</div><div class='add'>+				   &amp;fe-&gt;pagepool);</div><div class='add'>+	fe-&gt;pcl-&gt;vcnt += (ret &gt;= 0);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int z_erofs_lookup_collection(struct z_erofs_collector *clt,</div><div class='del'>-				     struct inode *inode,</div><div class='del'>-				     struct erofs_map_blocks *map)</div><div class='add'>+static bool z_erofs_get_pcluster(struct z_erofs_pcluster *pcl)</div><div class='ctx'> {</div><div class='del'>-	struct z_erofs_pcluster *pcl = clt-&gt;pcl;</div><div class='del'>-	struct z_erofs_collection *cl;</div><div class='del'>-	unsigned int length;</div><div class='del'>-</div><div class='del'>-	/* to avoid unexpected loop formed by corrupted images */</div><div class='del'>-	if (clt-&gt;owned_head == &amp;pcl-&gt;next || pcl == clt-&gt;tailpcl) {</div><div class='del'>-		DBG_BUGON(1);</div><div class='del'>-		return -EFSCORRUPTED;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	cl = z_erofs_primarycollection(pcl);</div><div class='del'>-	if (cl-&gt;pageofs != (map-&gt;m_la &amp; ~PAGE_MASK)) {</div><div class='del'>-		DBG_BUGON(1);</div><div class='del'>-		return -EFSCORRUPTED;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	length = READ_ONCE(pcl-&gt;length);</div><div class='del'>-	if (length &amp; Z_EROFS_PCLUSTER_FULL_LENGTH) {</div><div class='del'>-		if ((map-&gt;m_llen &lt;&lt; Z_EROFS_PCLUSTER_LENGTH_BIT) &gt; length) {</div><div class='del'>-			DBG_BUGON(1);</div><div class='del'>-			return -EFSCORRUPTED;</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-		unsigned int llen = map-&gt;m_llen &lt;&lt; Z_EROFS_PCLUSTER_LENGTH_BIT;</div><div class='del'>-</div><div class='del'>-		if (map-&gt;m_flags &amp; EROFS_MAP_FULL_MAPPED)</div><div class='del'>-			llen |= Z_EROFS_PCLUSTER_FULL_LENGTH;</div><div class='add'>+	if (lockref_get_not_zero(&amp;pcl-&gt;lockref))</div><div class='add'>+		return true;</div><div class='ctx'> </div><div class='del'>-		while (llen &gt; length &amp;&amp;</div><div class='del'>-		       length != cmpxchg_relaxed(&amp;pcl-&gt;length, length, llen)) {</div><div class='del'>-			cpu_relax();</div><div class='del'>-			length = READ_ONCE(pcl-&gt;length);</div><div class='del'>-		}</div><div class='add'>+	spin_lock(&amp;pcl-&gt;lockref.lock);</div><div class='add'>+	if (__lockref_is_dead(&amp;pcl-&gt;lockref)) {</div><div class='add'>+		spin_unlock(&amp;pcl-&gt;lockref.lock);</div><div class='add'>+		return false;</div><div class='ctx'> 	}</div><div class='del'>-	mutex_lock(&amp;cl-&gt;lock);</div><div class='del'>-	/* used to check tail merging loop due to corrupted images */</div><div class='del'>-	if (clt-&gt;owned_head == Z_EROFS_PCLUSTER_TAIL)</div><div class='del'>-		clt-&gt;tailpcl = pcl;</div><div class='ctx'> </div><div class='del'>-	z_erofs_try_to_claim_pcluster(clt);</div><div class='del'>-	clt-&gt;cl = cl;</div><div class='del'>-	return 0;</div><div class='add'>+	if (!pcl-&gt;lockref.count++)</div><div class='add'>+		atomic_long_dec(&amp;erofs_global_shrink_cnt);</div><div class='add'>+	spin_unlock(&amp;pcl-&gt;lockref.lock);</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int z_erofs_register_collection(struct z_erofs_collector *clt,</div><div class='del'>-				       struct inode *inode,</div><div class='del'>-				       struct erofs_map_blocks *map)</div><div class='add'>+static int z_erofs_register_pcluster(struct z_erofs_frontend *fe)</div><div class='ctx'> {</div><div class='del'>-	struct z_erofs_pcluster *pcl;</div><div class='del'>-	struct z_erofs_collection *cl;</div><div class='del'>-	struct erofs_workgroup *grp;</div><div class='add'>+	struct erofs_map_blocks *map = &amp;fe-&gt;map;</div><div class='add'>+	struct super_block *sb = fe-&gt;inode-&gt;i_sb;</div><div class='add'>+	struct erofs_sb_info *sbi = EROFS_SB(sb);</div><div class='add'>+	struct z_erofs_pcluster *pcl, *pre;</div><div class='add'>+	unsigned int pageofs_in;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	if (!(map-&gt;m_flags &amp; EROFS_MAP_ENCODED)) {</div><div class='del'>-		DBG_BUGON(1);</div><div class='del'>-		return -EFSCORRUPTED;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* no available pcluster, let's allocate one */</div><div class='del'>-	pcl = z_erofs_alloc_pcluster(map-&gt;m_plen &gt;&gt; PAGE_SHIFT);</div><div class='add'>+	pageofs_in = erofs_blkoff(sb, map-&gt;m_pa);</div><div class='add'>+	pcl = z_erofs_alloc_pcluster(pageofs_in + map-&gt;m_plen);</div><div class='ctx'> 	if (IS_ERR(pcl))</div><div class='ctx'> 		return PTR_ERR(pcl);</div><div class='ctx'> </div><div class='del'>-	atomic_set(&amp;pcl-&gt;obj.refcount, 1);</div><div class='del'>-	pcl-&gt;obj.index = map-&gt;m_pa &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	lockref_init(&amp;pcl-&gt;lockref); /* one ref for this request */</div><div class='ctx'> 	pcl-&gt;algorithmformat = map-&gt;m_algorithmformat;</div><div class='del'>-	pcl-&gt;length = (map-&gt;m_llen &lt;&lt; Z_EROFS_PCLUSTER_LENGTH_BIT) |</div><div class='del'>-		(map-&gt;m_flags &amp; EROFS_MAP_FULL_MAPPED ?</div><div class='del'>-			Z_EROFS_PCLUSTER_FULL_LENGTH : 0);</div><div class='del'>-</div><div class='del'>-	/* new pclusters should be claimed as type 1, primary and followed */</div><div class='del'>-	pcl-&gt;next = clt-&gt;owned_head;</div><div class='del'>-	clt-&gt;mode = COLLECT_PRIMARY_FOLLOWED;</div><div class='del'>-</div><div class='del'>-	cl = z_erofs_primarycollection(pcl);</div><div class='del'>-	cl-&gt;pageofs = map-&gt;m_la &amp; ~PAGE_MASK;</div><div class='add'>+	pcl-&gt;pclustersize = map-&gt;m_plen;</div><div class='add'>+	pcl-&gt;length = 0;</div><div class='add'>+	pcl-&gt;partial = true;</div><div class='add'>+	pcl-&gt;next = fe-&gt;head;</div><div class='add'>+	pcl-&gt;pos = map-&gt;m_pa;</div><div class='add'>+	pcl-&gt;pageofs_in = pageofs_in;</div><div class='add'>+	pcl-&gt;pageofs_out = map-&gt;m_la &amp; ~PAGE_MASK;</div><div class='add'>+	pcl-&gt;from_meta = map-&gt;m_flags &amp; EROFS_MAP_META;</div><div class='add'>+	fe-&gt;mode = Z_EROFS_PCLUSTER_FOLLOWED;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * lock all primary followed works before visible to others</div><div class='ctx'> 	 * and mutex_trylock *never* fails for a new pcluster.</div><div class='ctx'> 	 */</div><div class='del'>-	mutex_init(&amp;cl-&gt;lock);</div><div class='del'>-	DBG_BUGON(!mutex_trylock(&amp;cl-&gt;lock));</div><div class='del'>-</div><div class='del'>-	grp = erofs_insert_workgroup(inode-&gt;i_sb, &amp;pcl-&gt;obj);</div><div class='del'>-	if (IS_ERR(grp)) {</div><div class='del'>-		err = PTR_ERR(grp);</div><div class='del'>-		goto err_out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (grp != &amp;pcl-&gt;obj) {</div><div class='del'>-		clt-&gt;pcl = container_of(grp, struct z_erofs_pcluster, obj);</div><div class='del'>-		err = -EEXIST;</div><div class='del'>-		goto err_out;</div><div class='add'>+	mutex_init(&amp;pcl-&gt;lock);</div><div class='add'>+	DBG_BUGON(!mutex_trylock(&amp;pcl-&gt;lock));</div><div class='add'>+</div><div class='add'>+	if (!pcl-&gt;from_meta) {</div><div class='add'>+		while (1) {</div><div class='add'>+			xa_lock(&amp;sbi-&gt;managed_pslots);</div><div class='add'>+			pre = __xa_cmpxchg(&amp;sbi-&gt;managed_pslots, pcl-&gt;pos,</div><div class='add'>+					   NULL, pcl, GFP_KERNEL);</div><div class='add'>+			if (!pre || xa_is_err(pre) || z_erofs_get_pcluster(pre)) {</div><div class='add'>+				xa_unlock(&amp;sbi-&gt;managed_pslots);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+			/* try to legitimize the current in-tree one */</div><div class='add'>+			xa_unlock(&amp;sbi-&gt;managed_pslots);</div><div class='add'>+			cond_resched();</div><div class='add'>+		}</div><div class='add'>+		if (xa_is_err(pre)) {</div><div class='add'>+			err = xa_err(pre);</div><div class='add'>+			goto err_out;</div><div class='add'>+		} else if (pre) {</div><div class='add'>+			fe-&gt;pcl = pre;</div><div class='add'>+			err = -EEXIST;</div><div class='add'>+			goto err_out;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='del'>-	/* used to check tail merging loop due to corrupted images */</div><div class='del'>-	if (clt-&gt;owned_head == Z_EROFS_PCLUSTER_TAIL)</div><div class='del'>-		clt-&gt;tailpcl = pcl;</div><div class='del'>-	clt-&gt;owned_head = &amp;pcl-&gt;next;</div><div class='del'>-	clt-&gt;pcl = pcl;</div><div class='del'>-	clt-&gt;cl = cl;</div><div class='add'>+	fe-&gt;head = fe-&gt;pcl = pcl;</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> err_out:</div><div class='del'>-	mutex_unlock(&amp;cl-&gt;lock);</div><div class='add'>+	mutex_unlock(&amp;pcl-&gt;lock);</div><div class='ctx'> 	z_erofs_free_pcluster(pcl);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int z_erofs_collector_begin(struct z_erofs_collector *clt,</div><div class='del'>-				   struct inode *inode,</div><div class='del'>-				   struct erofs_map_blocks *map)</div><div class='add'>+static int z_erofs_pcluster_begin(struct z_erofs_frontend *fe)</div><div class='ctx'> {</div><div class='del'>-	struct erofs_workgroup *grp;</div><div class='add'>+	struct erofs_map_blocks *map = &amp;fe-&gt;map;</div><div class='add'>+	struct super_block *sb = fe-&gt;inode-&gt;i_sb;</div><div class='add'>+	struct z_erofs_pcluster *pcl = NULL;</div><div class='add'>+	void *ptr;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	DBG_BUGON(clt-&gt;cl);</div><div class='del'>-</div><div class='del'>-	/* must be Z_EROFS_PCLUSTER_TAIL or pointed to previous collection */</div><div class='del'>-	DBG_BUGON(clt-&gt;owned_head == Z_EROFS_PCLUSTER_NIL);</div><div class='del'>-	DBG_BUGON(clt-&gt;owned_head == Z_EROFS_PCLUSTER_TAIL_CLOSED);</div><div class='del'>-</div><div class='del'>-	if (!PAGE_ALIGNED(map-&gt;m_pa)) {</div><div class='del'>-		DBG_BUGON(1);</div><div class='del'>-		return -EINVAL;</div><div class='add'>+	DBG_BUGON(fe-&gt;pcl);</div><div class='add'>+	/* must be Z_EROFS_PCLUSTER_TAIL or pointed to previous pcluster */</div><div class='add'>+	DBG_BUGON(!fe-&gt;head);</div><div class='add'>+</div><div class='add'>+	if (!(map-&gt;m_flags &amp; EROFS_MAP_META)) {</div><div class='add'>+		while (1) {</div><div class='add'>+			rcu_read_lock();</div><div class='add'>+			pcl = xa_load(&amp;EROFS_SB(sb)-&gt;managed_pslots, map-&gt;m_pa);</div><div class='add'>+			if (!pcl || z_erofs_get_pcluster(pcl)) {</div><div class='add'>+				DBG_BUGON(pcl &amp;&amp; map-&gt;m_pa != pcl-&gt;pos);</div><div class='add'>+				rcu_read_unlock();</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+			rcu_read_unlock();</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	grp = erofs_find_workgroup(inode-&gt;i_sb, map-&gt;m_pa &gt;&gt; PAGE_SHIFT);</div><div class='del'>-	if (grp) {</div><div class='del'>-		clt-&gt;pcl = container_of(grp, struct z_erofs_pcluster, obj);</div><div class='add'>+	if (pcl) {</div><div class='add'>+		fe-&gt;pcl = pcl;</div><div class='add'>+		ret = -EEXIST;</div><div class='ctx'> 	} else {</div><div class='del'>-		ret = z_erofs_register_collection(clt, inode, map);</div><div class='del'>-</div><div class='del'>-		if (!ret)</div><div class='del'>-			goto out;</div><div class='del'>-		if (ret != -EEXIST)</div><div class='del'>-			return ret;</div><div class='add'>+		ret = z_erofs_register_pcluster(fe);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = z_erofs_lookup_collection(clt, inode, map);</div><div class='del'>-	if (ret) {</div><div class='del'>-		erofs_workgroup_put(&amp;clt-&gt;pcl-&gt;obj);</div><div class='add'>+	if (ret == -EEXIST) {</div><div class='add'>+		mutex_lock(&amp;fe-&gt;pcl-&gt;lock);</div><div class='add'>+		/* check if this pcluster hasn't been linked into any chain. */</div><div class='add'>+		if (!cmpxchg(&amp;fe-&gt;pcl-&gt;next, NULL, fe-&gt;head)) {</div><div class='add'>+			/* .. so it can be attached to our submission chain */</div><div class='add'>+			fe-&gt;head = fe-&gt;pcl;</div><div class='add'>+			fe-&gt;mode = Z_EROFS_PCLUSTER_FOLLOWED;</div><div class='add'>+		} else {	/* otherwise, it belongs to an inflight chain */</div><div class='add'>+			fe-&gt;mode = Z_EROFS_PCLUSTER_INFLIGHT;</div><div class='add'>+		}</div><div class='add'>+	} else if (ret) {</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	z_erofs_pagevec_ctor_init(&amp;clt-&gt;vector, Z_EROFS_NR_INLINE_PAGEVECS,</div><div class='del'>-				  clt-&gt;cl-&gt;pagevec, clt-&gt;cl-&gt;vcnt);</div><div class='del'>-</div><div class='del'>-	/* since file-backed online pages are traversed in reverse order */</div><div class='del'>-	clt-&gt;icpage_ptr = clt-&gt;pcl-&gt;compressed_pages + clt-&gt;pcl-&gt;pclusterpages;</div><div class='add'>+	z_erofs_bvec_iter_begin(&amp;fe-&gt;biter, &amp;fe-&gt;pcl-&gt;bvset,</div><div class='add'>+				Z_EROFS_INLINE_BVECS, fe-&gt;pcl-&gt;vcnt);</div><div class='add'>+	if (!fe-&gt;pcl-&gt;from_meta) {</div><div class='add'>+		/* bind cache first when cached decompression is preferred */</div><div class='add'>+		z_erofs_bind_cache(fe);</div><div class='add'>+	} else {</div><div class='add'>+		ret = erofs_init_metabuf(&amp;map-&gt;buf, sb,</div><div class='add'>+					 erofs_inode_in_metabox(fe-&gt;inode));</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		ptr = erofs_bread(&amp;map-&gt;buf, map-&gt;m_pa, false);</div><div class='add'>+		if (IS_ERR(ptr)) {</div><div class='add'>+			ret = PTR_ERR(ptr);</div><div class='add'>+			erofs_err(sb, "failed to get inline folio %d", ret);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='add'>+		folio_get(page_folio(map-&gt;buf.page));</div><div class='add'>+		WRITE_ONCE(fe-&gt;pcl-&gt;compressed_bvecs[0].page, map-&gt;buf.page);</div><div class='add'>+		fe-&gt;pcl-&gt;pageofs_in = map-&gt;m_pa &amp; ~PAGE_MASK;</div><div class='add'>+		fe-&gt;mode = Z_EROFS_PCLUSTER_FOLLOWED_NOINPLACE;</div><div class='add'>+	}</div><div class='add'>+	/* file-backed inplace I/O pages are traversed in reverse order */</div><div class='add'>+	fe-&gt;icur = z_erofs_pclusterpages(fe-&gt;pcl);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * keep in mind that no referenced pclusters will be freed</div><div class='del'>- * only after a RCU grace period.</div><div class='del'>- */</div><div class='ctx'> static void z_erofs_rcu_callback(struct rcu_head *head)</div><div class='ctx'> {</div><div class='del'>-	struct z_erofs_collection *const cl =</div><div class='del'>-		container_of(head, struct z_erofs_collection, rcu);</div><div class='del'>-</div><div class='del'>-	z_erofs_free_pcluster(container_of(cl, struct z_erofs_pcluster,</div><div class='del'>-					   primary_collection));</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void erofs_workgroup_free_rcu(struct erofs_workgroup *grp)</div><div class='del'>-{</div><div class='del'>-	struct z_erofs_pcluster *const pcl =</div><div class='del'>-		container_of(grp, struct z_erofs_pcluster, obj);</div><div class='del'>-	struct z_erofs_collection *const cl = z_erofs_primarycollection(pcl);</div><div class='del'>-</div><div class='del'>-	call_rcu(&amp;cl-&gt;rcu, z_erofs_rcu_callback);</div><div class='add'>+	z_erofs_free_pcluster(container_of(head, struct z_erofs_pcluster, rcu));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void z_erofs_collection_put(struct z_erofs_collection *cl)</div><div class='add'>+static bool __erofs_try_to_release_pcluster(struct erofs_sb_info *sbi,</div><div class='add'>+					  struct z_erofs_pcluster *pcl)</div><div class='ctx'> {</div><div class='del'>-	struct z_erofs_pcluster *const pcl =</div><div class='del'>-		container_of(cl, struct z_erofs_pcluster, primary_collection);</div><div class='del'>-</div><div class='del'>-	erofs_workgroup_put(&amp;pcl-&gt;obj);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool z_erofs_collector_end(struct z_erofs_collector *clt)</div><div class='del'>-{</div><div class='del'>-	struct z_erofs_collection *cl = clt-&gt;cl;</div><div class='del'>-</div><div class='del'>-	if (!cl)</div><div class='add'>+	if (pcl-&gt;lockref.count)</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	z_erofs_pagevec_ctor_exit(&amp;clt-&gt;vector, false);</div><div class='del'>-	mutex_unlock(&amp;cl-&gt;lock);</div><div class='add'>+	/*</div><div class='add'>+	 * Note that all cached folios should be detached before deleted from</div><div class='add'>+	 * the XArray.  Otherwise some folios could be still attached to the</div><div class='add'>+	 * orphan old pcluster when the new one is available in the tree.</div><div class='add'>+	 */</div><div class='add'>+	if (erofs_try_to_free_all_cached_folios(sbi, pcl))</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * if all pending pages are added, don't hold its reference</div><div class='del'>-	 * any longer if the pcluster isn't hosted by ourselves.</div><div class='add'>+	 * It's impossible to fail after the pcluster is freezed, but in order</div><div class='add'>+	 * to avoid some race conditions, add a DBG_BUGON to observe this.</div><div class='ctx'> 	 */</div><div class='del'>-	if (clt-&gt;mode &lt; COLLECT_PRIMARY_FOLLOWED_NOINPLACE)</div><div class='del'>-		z_erofs_collection_put(cl);</div><div class='add'>+	DBG_BUGON(__xa_erase(&amp;sbi-&gt;managed_pslots, pcl-&gt;pos) != pcl);</div><div class='ctx'> </div><div class='del'>-	clt-&gt;cl = NULL;</div><div class='add'>+	lockref_mark_dead(&amp;pcl-&gt;lockref);</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool should_alloc_managed_pages(struct z_erofs_decompress_frontend *fe,</div><div class='del'>-				       unsigned int cachestrategy,</div><div class='del'>-				       erofs_off_t la)</div><div class='add'>+static bool erofs_try_to_release_pcluster(struct erofs_sb_info *sbi,</div><div class='add'>+					  struct z_erofs_pcluster *pcl)</div><div class='ctx'> {</div><div class='del'>-	if (cachestrategy &lt;= EROFS_ZIP_CACHE_DISABLED)</div><div class='del'>-		return false;</div><div class='del'>-</div><div class='del'>-	if (fe-&gt;backmost)</div><div class='del'>-		return true;</div><div class='del'>-</div><div class='del'>-	return cachestrategy &gt;= EROFS_ZIP_CACHE_READAROUND &amp;&amp;</div><div class='del'>-		la &lt; fe-&gt;headoffset;</div><div class='add'>+	bool free;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;pcl-&gt;lockref.lock);</div><div class='add'>+	free = __erofs_try_to_release_pcluster(sbi, pcl);</div><div class='add'>+	spin_unlock(&amp;pcl-&gt;lockref.lock);</div><div class='add'>+	if (free) {</div><div class='add'>+		atomic_long_dec(&amp;erofs_global_shrink_cnt);</div><div class='add'>+		call_rcu(&amp;pcl-&gt;rcu, z_erofs_rcu_callback);</div><div class='add'>+	}</div><div class='add'>+	return free;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int z_erofs_do_read_page(struct z_erofs_decompress_frontend *fe,</div><div class='del'>-				struct page *page, struct page **pagepool)</div><div class='add'>+unsigned long z_erofs_shrink_scan(struct erofs_sb_info *sbi, unsigned long nr)</div><div class='ctx'> {</div><div class='del'>-	struct inode *const inode = fe-&gt;inode;</div><div class='del'>-	struct erofs_sb_info *const sbi = EROFS_I_SB(inode);</div><div class='del'>-	struct erofs_map_blocks *const map = &amp;fe-&gt;map;</div><div class='del'>-	struct z_erofs_collector *const clt = &amp;fe-&gt;clt;</div><div class='del'>-	const loff_t offset = page_offset(page);</div><div class='del'>-	bool tight = true;</div><div class='del'>-</div><div class='del'>-	enum z_erofs_cache_alloctype cache_strategy;</div><div class='del'>-	enum z_erofs_page_type page_type;</div><div class='del'>-	unsigned int cur, end, spiltted, index;</div><div class='del'>-	int err = 0;</div><div class='add'>+	struct z_erofs_pcluster *pcl;</div><div class='add'>+	unsigned long index, freed = 0;</div><div class='ctx'> </div><div class='del'>-	/* register locked file pages as online pages in pack */</div><div class='del'>-	z_erofs_onlinepage_init(page);</div><div class='add'>+	xa_lock(&amp;sbi-&gt;managed_pslots);</div><div class='add'>+	xa_for_each(&amp;sbi-&gt;managed_pslots, index, pcl) {</div><div class='add'>+		/* try to shrink each valid pcluster */</div><div class='add'>+		if (!erofs_try_to_release_pcluster(sbi, pcl))</div><div class='add'>+			continue;</div><div class='add'>+		xa_unlock(&amp;sbi-&gt;managed_pslots);</div><div class='ctx'> </div><div class='del'>-	spiltted = 0;</div><div class='del'>-	end = PAGE_SIZE;</div><div class='del'>-repeat:</div><div class='del'>-	cur = end - 1;</div><div class='del'>-</div><div class='del'>-	/* lucky, within the range of the current map_blocks */</div><div class='del'>-	if (offset + cur &gt;= map-&gt;m_la &amp;&amp;</div><div class='del'>-	    offset + cur &lt; map-&gt;m_la + map-&gt;m_llen) {</div><div class='del'>-		/* didn't get a valid collection previously (very rare) */</div><div class='del'>-		if (!clt-&gt;cl)</div><div class='del'>-			goto restart_now;</div><div class='del'>-		goto hitted;</div><div class='add'>+		++freed;</div><div class='add'>+		if (!--nr)</div><div class='add'>+			return freed;</div><div class='add'>+		xa_lock(&amp;sbi-&gt;managed_pslots);</div><div class='ctx'> 	}</div><div class='add'>+	xa_unlock(&amp;sbi-&gt;managed_pslots);</div><div class='add'>+	return freed;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	/* go ahead the next map_blocks */</div><div class='del'>-	erofs_dbg("%s: [out-of-range] pos %llu", __func__, offset + cur);</div><div class='add'>+static void z_erofs_put_pcluster(struct erofs_sb_info *sbi,</div><div class='add'>+		struct z_erofs_pcluster *pcl, bool try_free)</div><div class='add'>+{</div><div class='add'>+	bool free = false;</div><div class='ctx'> </div><div class='del'>-	if (z_erofs_collector_end(clt))</div><div class='del'>-		fe-&gt;backmost = false;</div><div class='add'>+	if (lockref_put_or_lock(&amp;pcl-&gt;lockref))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	map-&gt;m_la = offset + cur;</div><div class='del'>-	map-&gt;m_llen = 0;</div><div class='del'>-	err = z_erofs_map_blocks_iter(inode, map, 0);</div><div class='del'>-	if (err)</div><div class='del'>-		goto err_out;</div><div class='add'>+	DBG_BUGON(__lockref_is_dead(&amp;pcl-&gt;lockref));</div><div class='add'>+	if (!--pcl-&gt;lockref.count) {</div><div class='add'>+		if (try_free &amp;&amp; xa_trylock(&amp;sbi-&gt;managed_pslots)) {</div><div class='add'>+			free = __erofs_try_to_release_pcluster(sbi, pcl);</div><div class='add'>+			xa_unlock(&amp;sbi-&gt;managed_pslots);</div><div class='add'>+		}</div><div class='add'>+		atomic_long_add(!free, &amp;erofs_global_shrink_cnt);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;pcl-&gt;lockref.lock);</div><div class='add'>+	if (free)</div><div class='add'>+		call_rcu(&amp;pcl-&gt;rcu, z_erofs_rcu_callback);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-restart_now:</div><div class='del'>-	if (!(map-&gt;m_flags &amp; EROFS_MAP_MAPPED))</div><div class='del'>-		goto hitted;</div><div class='add'>+static void z_erofs_pcluster_end(struct z_erofs_frontend *fe)</div><div class='add'>+{</div><div class='add'>+	struct z_erofs_pcluster *pcl = fe-&gt;pcl;</div><div class='ctx'> </div><div class='del'>-	err = z_erofs_collector_begin(clt, inode, map);</div><div class='del'>-	if (err)</div><div class='del'>-		goto err_out;</div><div class='add'>+	if (!pcl)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	/* preload all compressed pages (maybe downgrade role if necessary) */</div><div class='del'>-	if (should_alloc_managed_pages(fe, sbi-&gt;opt.cache_strategy, map-&gt;m_la))</div><div class='del'>-		cache_strategy = TRYALLOC;</div><div class='del'>-	else</div><div class='del'>-		cache_strategy = DONTALLOC;</div><div class='add'>+	z_erofs_bvec_iter_end(&amp;fe-&gt;biter);</div><div class='add'>+	mutex_unlock(&amp;pcl-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	preload_compressed_pages(clt, MNGD_MAPPING(sbi),</div><div class='del'>-				 cache_strategy, pagepool);</div><div class='add'>+	if (fe-&gt;candidate_bvpage)</div><div class='add'>+		fe-&gt;candidate_bvpage = NULL;</div><div class='ctx'> </div><div class='del'>-hitted:</div><div class='del'>-	/*</div><div class='del'>-	 * Ensure the current partial page belongs to this submit chain rather</div><div class='del'>-	 * than other concurrent submit chains or the noio(bypass) chain since</div><div class='del'>-	 * those chains are handled asynchronously thus the page cannot be used</div><div class='del'>-	 * for inplace I/O or pagevec (should be processed in strict order.)</div><div class='del'>-	 */</div><div class='del'>-	tight &amp;= (clt-&gt;mode &gt;= COLLECT_PRIMARY_HOOKED &amp;&amp;</div><div class='del'>-		  clt-&gt;mode != COLLECT_PRIMARY_FOLLOWED_NOINPLACE);</div><div class='add'>+	/* Drop refcount if it doesn't belong to our processing chain */</div><div class='add'>+	if (fe-&gt;mode &lt; Z_EROFS_PCLUSTER_FOLLOWED_NOINPLACE)</div><div class='add'>+		z_erofs_put_pcluster(EROFS_I_SB(fe-&gt;inode), pcl, false);</div><div class='add'>+	fe-&gt;pcl = NULL;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	cur = end - min_t(unsigned int, offset + end - map-&gt;m_la, end);</div><div class='del'>-	if (!(map-&gt;m_flags &amp; EROFS_MAP_MAPPED)) {</div><div class='del'>-		zero_user_segment(page, cur, end);</div><div class='del'>-		goto next_part;</div><div class='del'>-	}</div><div class='add'>+static int z_erofs_read_fragment(struct super_block *sb, struct folio *folio,</div><div class='add'>+			unsigned int cur, unsigned int end, erofs_off_t pos)</div><div class='add'>+{</div><div class='add'>+	struct inode *packed_inode = EROFS_SB(sb)-&gt;packed_inode;</div><div class='add'>+	struct erofs_buf buf = __EROFS_BUF_INITIALIZER;</div><div class='add'>+	unsigned int cnt;</div><div class='add'>+	u8 *src;</div><div class='ctx'> </div><div class='del'>-	/* let's derive page type */</div><div class='del'>-	page_type = cur ? Z_EROFS_VLE_PAGE_TYPE_HEAD :</div><div class='del'>-		(!spiltted ? Z_EROFS_PAGE_TYPE_EXCLUSIVE :</div><div class='del'>-			(tight ? Z_EROFS_PAGE_TYPE_EXCLUSIVE :</div><div class='del'>-				Z_EROFS_VLE_PAGE_TYPE_TAIL_SHARED));</div><div class='del'>-</div><div class='del'>-	if (cur)</div><div class='del'>-		tight &amp;= (clt-&gt;mode &gt;= COLLECT_PRIMARY_FOLLOWED);</div><div class='del'>-</div><div class='del'>-retry:</div><div class='del'>-	err = z_erofs_attach_page(clt, page, page_type);</div><div class='del'>-	/* should allocate an additional short-lived page for pagevec */</div><div class='del'>-	if (err == -EAGAIN) {</div><div class='del'>-		struct page *const newpage =</div><div class='del'>-				alloc_page(GFP_NOFS | __GFP_NOFAIL);</div><div class='del'>-</div><div class='del'>-		set_page_private(newpage, Z_EROFS_SHORTLIVED_PAGE);</div><div class='del'>-		err = z_erofs_attach_page(clt, newpage,</div><div class='del'>-					  Z_EROFS_PAGE_TYPE_EXCLUSIVE);</div><div class='del'>-		if (!err)</div><div class='del'>-			goto retry;</div><div class='del'>-	}</div><div class='add'>+	if (!packed_inode)</div><div class='add'>+		return -EFSCORRUPTED;</div><div class='ctx'> </div><div class='del'>-	if (err)</div><div class='del'>-		goto err_out;</div><div class='add'>+	buf.mapping = packed_inode-&gt;i_mapping;</div><div class='add'>+	for (; cur &lt; end; cur += cnt, pos += cnt) {</div><div class='add'>+		cnt = min(end - cur, sb-&gt;s_blocksize - erofs_blkoff(sb, pos));</div><div class='add'>+		src = erofs_bread(&amp;buf, pos, true);</div><div class='add'>+		if (IS_ERR(src)) {</div><div class='add'>+			erofs_put_metabuf(&amp;buf);</div><div class='add'>+			return PTR_ERR(src);</div><div class='add'>+		}</div><div class='add'>+		memcpy_to_folio(folio, cur, src, cnt);</div><div class='add'>+	}</div><div class='add'>+	erofs_put_metabuf(&amp;buf);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	index = page-&gt;index - (map-&gt;m_la &gt;&gt; PAGE_SHIFT);</div><div class='add'>+static int z_erofs_scan_folio(struct z_erofs_frontend *f,</div><div class='add'>+			      struct folio *folio, bool ra)</div><div class='add'>+{</div><div class='add'>+	struct inode *const inode = f-&gt;inode;</div><div class='add'>+	struct erofs_map_blocks *const map = &amp;f-&gt;map;</div><div class='add'>+	const loff_t offset = folio_pos(folio);</div><div class='add'>+	const unsigned int bs = i_blocksize(inode);</div><div class='add'>+	unsigned int end = folio_size(folio), split = 0, cur, pgs;</div><div class='add'>+	bool tight, excl;</div><div class='add'>+	int err = 0;</div><div class='ctx'> </div><div class='del'>-	z_erofs_onlinepage_fixup(page, index, true);</div><div class='add'>+	tight = (bs == PAGE_SIZE);</div><div class='add'>+	erofs_onlinefolio_init(folio);</div><div class='add'>+	do {</div><div class='add'>+		if (offset + end - 1 &lt; map-&gt;m_la ||</div><div class='add'>+		    offset + end - 1 &gt;= map-&gt;m_la + map-&gt;m_llen) {</div><div class='add'>+			z_erofs_pcluster_end(f);</div><div class='add'>+			map-&gt;m_la = offset + end - 1;</div><div class='add'>+			map-&gt;m_llen = 0;</div><div class='add'>+			err = z_erofs_map_blocks_iter(inode, map, 0);</div><div class='add'>+			if (err)</div><div class='add'>+				break;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	/* bump up the number of spiltted parts of a page */</div><div class='del'>-	++spiltted;</div><div class='del'>-	/* also update nr_pages */</div><div class='del'>-	clt-&gt;cl-&gt;nr_pages = max_t(pgoff_t, clt-&gt;cl-&gt;nr_pages, index + 1);</div><div class='del'>-next_part:</div><div class='del'>-	/* can be used for verification */</div><div class='del'>-	map-&gt;m_llen = offset + cur - map-&gt;m_la;</div><div class='add'>+		cur = offset &gt; map-&gt;m_la ? 0 : map-&gt;m_la - offset;</div><div class='add'>+		pgs = round_down(cur, PAGE_SIZE);</div><div class='add'>+		/* bump split parts first to avoid several separate cases */</div><div class='add'>+		++split;</div><div class='add'>+</div><div class='add'>+		if (!(map-&gt;m_flags &amp; EROFS_MAP_MAPPED)) {</div><div class='add'>+			folio_zero_segment(folio, cur, end);</div><div class='add'>+			tight = false;</div><div class='add'>+		} else if (map-&gt;m_flags &amp; __EROFS_MAP_FRAGMENT) {</div><div class='add'>+			erofs_off_t fpos = offset + cur - map-&gt;m_la;</div><div class='add'>+</div><div class='add'>+			err = z_erofs_read_fragment(inode-&gt;i_sb, folio, cur,</div><div class='add'>+					cur + min(map-&gt;m_llen - fpos, end - cur),</div><div class='add'>+					EROFS_I(inode)-&gt;z_fragmentoff + fpos);</div><div class='add'>+			if (err)</div><div class='add'>+				break;</div><div class='add'>+			tight = false;</div><div class='add'>+		} else {</div><div class='add'>+			if (!f-&gt;pcl) {</div><div class='add'>+				err = z_erofs_pcluster_begin(f);</div><div class='add'>+				if (err)</div><div class='add'>+					break;</div><div class='add'>+				f-&gt;pcl-&gt;besteffort |= !ra;</div><div class='add'>+			}</div><div class='ctx'> </div><div class='del'>-	end = cur;</div><div class='del'>-	if (end &gt; 0)</div><div class='del'>-		goto repeat;</div><div class='add'>+			pgs = round_down(end - 1, PAGE_SIZE);</div><div class='add'>+			/*</div><div class='add'>+			 * Ensure this partial page belongs to this submit chain</div><div class='add'>+			 * rather than other concurrent submit chains or</div><div class='add'>+			 * noio(bypass) chains since those chains are handled</div><div class='add'>+			 * asynchronously thus it cannot be used for inplace I/O</div><div class='add'>+			 * or bvpage (should be processed in the strict order.)</div><div class='add'>+			 */</div><div class='add'>+			tight &amp;= (f-&gt;mode &gt;= Z_EROFS_PCLUSTER_FOLLOWED);</div><div class='add'>+			excl = false;</div><div class='add'>+			if (cur &lt;= pgs) {</div><div class='add'>+				excl = (split &lt;= 1) || tight;</div><div class='add'>+				cur = pgs;</div><div class='add'>+			}</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	z_erofs_onlinepage_endio(page);</div><div class='add'>+			err = z_erofs_attach_page(f, &amp;((struct z_erofs_bvec) {</div><div class='add'>+				.page = folio_page(folio, pgs &gt;&gt; PAGE_SHIFT),</div><div class='add'>+				.offset = offset + pgs - map-&gt;m_la,</div><div class='add'>+				.end = end - pgs, }), excl);</div><div class='add'>+			if (err)</div><div class='add'>+				break;</div><div class='ctx'> </div><div class='del'>-	erofs_dbg("%s, finish page: %pK spiltted: %u map-&gt;m_llen %llu",</div><div class='del'>-		  __func__, page, spiltted, map-&gt;m_llen);</div><div class='add'>+			erofs_onlinefolio_split(folio);</div><div class='add'>+			if (f-&gt;pcl-&gt;length &lt; offset + end - map-&gt;m_la) {</div><div class='add'>+				f-&gt;pcl-&gt;length = offset + end - map-&gt;m_la;</div><div class='add'>+				f-&gt;pcl-&gt;pageofs_out = map-&gt;m_la &amp; ~PAGE_MASK;</div><div class='add'>+			}</div><div class='add'>+			if ((map-&gt;m_flags &amp; EROFS_MAP_FULL_MAPPED) &amp;&amp;</div><div class='add'>+			    !(map-&gt;m_flags &amp; EROFS_MAP_PARTIAL_REF) &amp;&amp;</div><div class='add'>+			    f-&gt;pcl-&gt;length == map-&gt;m_llen)</div><div class='add'>+				f-&gt;pcl-&gt;partial = false;</div><div class='add'>+		}</div><div class='add'>+		/* shorten the remaining extent to update progress */</div><div class='add'>+		map-&gt;m_llen = offset + cur - map-&gt;m_la;</div><div class='add'>+		map-&gt;m_flags &amp;= ~EROFS_MAP_FULL_MAPPED;</div><div class='add'>+		if (cur &lt;= pgs) {</div><div class='add'>+			split = cur &lt; pgs;</div><div class='add'>+			tight = (bs == PAGE_SIZE);</div><div class='add'>+		}</div><div class='add'>+	} while ((end = cur) &gt; 0);</div><div class='add'>+	erofs_onlinefolio_end(folio, err, false);</div><div class='ctx'> 	return err;</div><div class='del'>-</div><div class='del'>-	/* if some error occurred while processing this page */</div><div class='del'>-err_out:</div><div class='del'>-	SetPageError(page);</div><div class='del'>-	goto out;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void z_erofs_decompressqueue_work(struct work_struct *work);</div><div class='del'>-static void z_erofs_decompress_kickoff(struct z_erofs_decompressqueue *io,</div><div class='del'>-				       bool sync, int bios)</div><div class='add'>+static bool z_erofs_is_sync_decompress(struct erofs_sb_info *sbi,</div><div class='add'>+				       unsigned int readahead_pages)</div><div class='ctx'> {</div><div class='del'>-	struct erofs_sb_info *const sbi = EROFS_SB(io-&gt;sb);</div><div class='del'>-</div><div class='del'>-	/* wake up the caller thread for sync decompression */</div><div class='del'>-	if (sync) {</div><div class='del'>-		unsigned long flags;</div><div class='add'>+	/* auto: enable for read_folio, disable for readahead */</div><div class='add'>+	if ((sbi-&gt;opt.sync_decompress == EROFS_SYNC_DECOMPRESS_AUTO) &amp;&amp;</div><div class='add'>+	    !readahead_pages)</div><div class='add'>+		return true;</div><div class='ctx'> </div><div class='del'>-		spin_lock_irqsave(&amp;io-&gt;u.wait.lock, flags);</div><div class='del'>-		if (!atomic_add_return(bios, &amp;io-&gt;pending_bios))</div><div class='del'>-			wake_up_locked(&amp;io-&gt;u.wait);</div><div class='del'>-		spin_unlock_irqrestore(&amp;io-&gt;u.wait.lock, flags);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='add'>+	if ((sbi-&gt;opt.sync_decompress == EROFS_SYNC_DECOMPRESS_FORCE_ON) &amp;&amp;</div><div class='add'>+	    (readahead_pages &lt;= sbi-&gt;opt.max_sync_decompress_pages))</div><div class='add'>+		return true;</div><div class='ctx'> </div><div class='del'>-	if (atomic_add_return(bios, &amp;io-&gt;pending_bios))</div><div class='del'>-		return;</div><div class='del'>-	/* Use workqueue and sync decompression for atomic contexts only */</div><div class='del'>-	if (in_atomic() || irqs_disabled()) {</div><div class='del'>-		queue_work(z_erofs_workqueue, &amp;io-&gt;u.work);</div><div class='del'>-		sbi-&gt;opt.readahead_sync_decompress = true;</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-	z_erofs_decompressqueue_work(&amp;io-&gt;u.work);</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool z_erofs_page_is_invalidated(struct page *page)</div><div class='ctx'> {</div><div class='del'>-	return !page-&gt;mapping &amp;&amp; !z_erofs_is_shortlived_page(page);</div><div class='add'>+	return !page_folio(page)-&gt;mapping &amp;&amp; !z_erofs_is_shortlived_page(page);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void z_erofs_decompressqueue_endio(struct bio *bio)</div><div class='del'>-{</div><div class='del'>-	tagptr1_t t = tagptr_init(tagptr1_t, bio-&gt;bi_private);</div><div class='del'>-	struct z_erofs_decompressqueue *q = tagptr_unfold_ptr(t);</div><div class='del'>-	blk_status_t err = bio-&gt;bi_status;</div><div class='del'>-	struct bio_vec *bvec;</div><div class='del'>-	struct bvec_iter_all iter_all;</div><div class='add'>+struct z_erofs_backend {</div><div class='add'>+	struct page *onstack_pages[Z_EROFS_ONSTACK_PAGES];</div><div class='add'>+	struct super_block *sb;</div><div class='add'>+	struct z_erofs_pcluster *pcl;</div><div class='add'>+	/* pages with the longest decompressed length for deduplication */</div><div class='add'>+	struct page **decompressed_pages;</div><div class='add'>+	/* pages to keep the compressed data */</div><div class='add'>+	struct page **compressed_pages;</div><div class='add'>+</div><div class='add'>+	struct list_head decompressed_secondary_bvecs;</div><div class='add'>+	struct page **pagepool;</div><div class='add'>+	unsigned int onstack_used, nr_pages;</div><div class='add'>+	/* indicate if temporary copies should be preserved for later use */</div><div class='add'>+	bool keepxcpy;</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-	bio_for_each_segment_all(bvec, bio, iter_all) {</div><div class='del'>-		struct page *page = bvec-&gt;bv_page;</div><div class='add'>+struct z_erofs_bvec_item {</div><div class='add'>+	struct z_erofs_bvec bvec;</div><div class='add'>+	struct list_head list;</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-		DBG_BUGON(PageUptodate(page));</div><div class='del'>-		DBG_BUGON(z_erofs_page_is_invalidated(page));</div><div class='add'>+static void z_erofs_do_decompressed_bvec(struct z_erofs_backend *be,</div><div class='add'>+					 struct z_erofs_bvec *bvec)</div><div class='add'>+{</div><div class='add'>+	int poff = bvec-&gt;offset + be-&gt;pcl-&gt;pageofs_out;</div><div class='add'>+	struct z_erofs_bvec_item *item;</div><div class='add'>+	struct page **page;</div><div class='add'>+</div><div class='add'>+	if (!(poff &amp; ~PAGE_MASK) &amp;&amp; (bvec-&gt;end == PAGE_SIZE ||</div><div class='add'>+			bvec-&gt;offset + bvec-&gt;end == be-&gt;pcl-&gt;length)) {</div><div class='add'>+		DBG_BUGON((poff &gt;&gt; PAGE_SHIFT) &gt;= be-&gt;nr_pages);</div><div class='add'>+		page = be-&gt;decompressed_pages + (poff &gt;&gt; PAGE_SHIFT);</div><div class='add'>+		if (!*page) {</div><div class='add'>+			*page = bvec-&gt;page;</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		be-&gt;keepxcpy = true;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		if (err)</div><div class='del'>-			SetPageError(page);</div><div class='add'>+	/* (cold path) one pcluster is requested multiple times */</div><div class='add'>+	item = kmalloc(sizeof(*item), GFP_KERNEL | __GFP_NOFAIL);</div><div class='add'>+	item-&gt;bvec = *bvec;</div><div class='add'>+	list_add(&amp;item-&gt;list, &amp;be-&gt;decompressed_secondary_bvecs);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		if (erofs_page_is_managed(EROFS_SB(q-&gt;sb), page)) {</div><div class='del'>-			if (!err)</div><div class='del'>-				SetPageUptodate(page);</div><div class='del'>-			unlock_page(page);</div><div class='add'>+static void z_erofs_fill_other_copies(struct z_erofs_backend *be, int err)</div><div class='add'>+{</div><div class='add'>+	unsigned int off0 = be-&gt;pcl-&gt;pageofs_out;</div><div class='add'>+	struct list_head *p, *n;</div><div class='add'>+</div><div class='add'>+	list_for_each_safe(p, n, &amp;be-&gt;decompressed_secondary_bvecs) {</div><div class='add'>+		struct z_erofs_bvec_item *bvi;</div><div class='add'>+		unsigned int end, cur;</div><div class='add'>+		void *dst, *src;</div><div class='add'>+</div><div class='add'>+		bvi = container_of(p, struct z_erofs_bvec_item, list);</div><div class='add'>+		cur = bvi-&gt;bvec.offset &lt; 0 ? -bvi-&gt;bvec.offset : 0;</div><div class='add'>+		end = min_t(unsigned int, be-&gt;pcl-&gt;length - bvi-&gt;bvec.offset,</div><div class='add'>+			    bvi-&gt;bvec.end);</div><div class='add'>+		dst = kmap_local_page(bvi-&gt;bvec.page);</div><div class='add'>+		while (cur &lt; end) {</div><div class='add'>+			unsigned int pgnr, scur, len;</div><div class='add'>+</div><div class='add'>+			pgnr = (bvi-&gt;bvec.offset + cur + off0) &gt;&gt; PAGE_SHIFT;</div><div class='add'>+			DBG_BUGON(pgnr &gt;= be-&gt;nr_pages);</div><div class='add'>+</div><div class='add'>+			scur = bvi-&gt;bvec.offset + cur -</div><div class='add'>+					((pgnr &lt;&lt; PAGE_SHIFT) - off0);</div><div class='add'>+			len = min_t(unsigned int, end - cur, PAGE_SIZE - scur);</div><div class='add'>+			if (!be-&gt;decompressed_pages[pgnr]) {</div><div class='add'>+				err = -EFSCORRUPTED;</div><div class='add'>+				cur += len;</div><div class='add'>+				continue;</div><div class='add'>+			}</div><div class='add'>+			src = kmap_local_page(be-&gt;decompressed_pages[pgnr]);</div><div class='add'>+			memcpy(dst + cur, src + scur, len);</div><div class='add'>+			kunmap_local(src);</div><div class='add'>+			cur += len;</div><div class='ctx'> 		}</div><div class='add'>+		kunmap_local(dst);</div><div class='add'>+		erofs_onlinefolio_end(page_folio(bvi-&gt;bvec.page), err, true);</div><div class='add'>+		list_del(p);</div><div class='add'>+		kfree(bvi);</div><div class='ctx'> 	}</div><div class='del'>-	z_erofs_decompress_kickoff(q, tagptr_unfold_tags(t), -1);</div><div class='del'>-	bio_put(bio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int z_erofs_decompress_pcluster(struct super_block *sb,</div><div class='del'>-				       struct z_erofs_pcluster *pcl,</div><div class='del'>-				       struct page **pagepool)</div><div class='add'>+static void z_erofs_parse_out_bvecs(struct z_erofs_backend *be)</div><div class='ctx'> {</div><div class='del'>-	struct erofs_sb_info *const sbi = EROFS_SB(sb);</div><div class='del'>-	struct z_erofs_pagevec_ctor ctor;</div><div class='del'>-	unsigned int i, inputsize, outputsize, llen, nr_pages;</div><div class='del'>-	struct page *pages_onstack[Z_EROFS_VMAP_ONSTACK_PAGES];</div><div class='del'>-	struct page **pages, **compressed_pages, *page;</div><div class='del'>-</div><div class='del'>-	enum z_erofs_page_type page_type;</div><div class='del'>-	bool overlapped, partial;</div><div class='del'>-	struct z_erofs_collection *cl;</div><div class='del'>-	int err;</div><div class='del'>-</div><div class='del'>-	might_sleep();</div><div class='del'>-	cl = z_erofs_primarycollection(pcl);</div><div class='del'>-	DBG_BUGON(!READ_ONCE(cl-&gt;nr_pages));</div><div class='add'>+	struct z_erofs_pcluster *pcl = be-&gt;pcl;</div><div class='add'>+	struct z_erofs_bvec_iter biter;</div><div class='add'>+	struct page *old_bvpage;</div><div class='add'>+	int i;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;cl-&gt;lock);</div><div class='del'>-	nr_pages = cl-&gt;nr_pages;</div><div class='add'>+	z_erofs_bvec_iter_begin(&amp;biter, &amp;pcl-&gt;bvset, Z_EROFS_INLINE_BVECS, 0);</div><div class='add'>+	for (i = 0; i &lt; pcl-&gt;vcnt; ++i) {</div><div class='add'>+		struct z_erofs_bvec bvec;</div><div class='ctx'> </div><div class='del'>-	if (nr_pages &lt;= Z_EROFS_VMAP_ONSTACK_PAGES) {</div><div class='del'>-		pages = pages_onstack;</div><div class='del'>-	} else if (nr_pages &lt;= Z_EROFS_VMAP_GLOBAL_PAGES &amp;&amp;</div><div class='del'>-		   mutex_trylock(&amp;z_pagemap_global_lock)) {</div><div class='del'>-		pages = z_pagemap_global;</div><div class='del'>-	} else {</div><div class='del'>-		gfp_t gfp_flags = GFP_KERNEL;</div><div class='add'>+		z_erofs_bvec_dequeue(&amp;biter, &amp;bvec, &amp;old_bvpage);</div><div class='ctx'> </div><div class='del'>-		if (nr_pages &gt; Z_EROFS_VMAP_GLOBAL_PAGES)</div><div class='del'>-			gfp_flags |= __GFP_NOFAIL;</div><div class='add'>+		if (old_bvpage)</div><div class='add'>+			z_erofs_put_shortlivedpage(be-&gt;pagepool, old_bvpage);</div><div class='ctx'> </div><div class='del'>-		pages = kvmalloc_array(nr_pages, sizeof(struct page *),</div><div class='del'>-				       gfp_flags);</div><div class='del'>-</div><div class='del'>-		/* fallback to global pagemap for the lowmem scenario */</div><div class='del'>-		if (!pages) {</div><div class='del'>-			mutex_lock(&amp;z_pagemap_global_lock);</div><div class='del'>-			pages = z_pagemap_global;</div><div class='del'>-		}</div><div class='add'>+		DBG_BUGON(z_erofs_page_is_invalidated(bvec.page));</div><div class='add'>+		z_erofs_do_decompressed_bvec(be, &amp;bvec);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; nr_pages; ++i)</div><div class='del'>-		pages[i] = NULL;</div><div class='del'>-</div><div class='del'>-	err = 0;</div><div class='del'>-	z_erofs_pagevec_ctor_init(&amp;ctor, Z_EROFS_NR_INLINE_PAGEVECS,</div><div class='del'>-				  cl-&gt;pagevec, 0);</div><div class='add'>+	old_bvpage = z_erofs_bvec_iter_end(&amp;biter);</div><div class='add'>+	if (old_bvpage)</div><div class='add'>+		z_erofs_put_shortlivedpage(be-&gt;pagepool, old_bvpage);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; cl-&gt;vcnt; ++i) {</div><div class='del'>-		unsigned int pagenr;</div><div class='add'>+static int z_erofs_parse_in_bvecs(struct z_erofs_backend *be, bool *overlapped)</div><div class='add'>+{</div><div class='add'>+	struct z_erofs_pcluster *pcl = be-&gt;pcl;</div><div class='add'>+	unsigned int pclusterpages = z_erofs_pclusterpages(pcl);</div><div class='add'>+	int i, err = 0;</div><div class='add'>+</div><div class='add'>+	*overlapped = false;</div><div class='add'>+	for (i = 0; i &lt; pclusterpages; ++i) {</div><div class='add'>+		struct z_erofs_bvec *bvec = &amp;pcl-&gt;compressed_bvecs[i];</div><div class='add'>+		struct page *page = bvec-&gt;page;</div><div class='add'>+</div><div class='add'>+		/* compressed data ought to be valid when decompressing */</div><div class='add'>+		if (IS_ERR(page) || !page) {</div><div class='add'>+			bvec-&gt;page = NULL;	/* clear the failure reason */</div><div class='add'>+			err = page ? PTR_ERR(page) : -EIO;</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+		be-&gt;compressed_pages[i] = page;</div><div class='ctx'> </div><div class='del'>-		page = z_erofs_pagevec_dequeue(&amp;ctor, &amp;page_type);</div><div class='add'>+		if (pcl-&gt;from_meta ||</div><div class='add'>+		    erofs_folio_is_managed(EROFS_SB(be-&gt;sb), page_folio(page))) {</div><div class='add'>+			if (!PageUptodate(page))</div><div class='add'>+				err = -EIO;</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-		/* all pages in pagevec ought to be valid */</div><div class='del'>-		DBG_BUGON(!page);</div><div class='ctx'> 		DBG_BUGON(z_erofs_page_is_invalidated(page));</div><div class='del'>-</div><div class='del'>-		if (z_erofs_put_shortlivedpage(pagepool, page))</div><div class='add'>+		if (z_erofs_is_shortlived_page(page))</div><div class='ctx'> 			continue;</div><div class='add'>+		z_erofs_do_decompressed_bvec(be, bvec);</div><div class='add'>+		*overlapped = true;</div><div class='add'>+	}</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		if (page_type == Z_EROFS_VLE_PAGE_TYPE_HEAD)</div><div class='del'>-			pagenr = 0;</div><div class='del'>-		else</div><div class='del'>-			pagenr = z_erofs_onlinepage_index(page);</div><div class='del'>-</div><div class='del'>-		DBG_BUGON(pagenr &gt;= nr_pages);</div><div class='add'>+static int z_erofs_decompress_pcluster(struct z_erofs_backend *be, int err)</div><div class='add'>+{</div><div class='add'>+	struct erofs_sb_info *const sbi = EROFS_SB(be-&gt;sb);</div><div class='add'>+	struct z_erofs_pcluster *pcl = be-&gt;pcl;</div><div class='add'>+	unsigned int pclusterpages = z_erofs_pclusterpages(pcl);</div><div class='add'>+	const struct z_erofs_decompressor *alg =</div><div class='add'>+				z_erofs_decomp[pcl-&gt;algorithmformat];</div><div class='add'>+	bool try_free = true;</div><div class='add'>+	int i, j, jtop, err2;</div><div class='add'>+	struct page *page;</div><div class='add'>+	bool overlapped;</div><div class='add'>+	const char *reason;</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;pcl-&gt;lock);</div><div class='add'>+	be-&gt;nr_pages = PAGE_ALIGN(pcl-&gt;length + pcl-&gt;pageofs_out) &gt;&gt; PAGE_SHIFT;</div><div class='add'>+</div><div class='add'>+	/* allocate (de)compressed page arrays if cannot be kept on stack */</div><div class='add'>+	be-&gt;decompressed_pages = NULL;</div><div class='add'>+	be-&gt;compressed_pages = NULL;</div><div class='add'>+	be-&gt;onstack_used = 0;</div><div class='add'>+	if (be-&gt;nr_pages &lt;= Z_EROFS_ONSTACK_PAGES) {</div><div class='add'>+		be-&gt;decompressed_pages = be-&gt;onstack_pages;</div><div class='add'>+		be-&gt;onstack_used = be-&gt;nr_pages;</div><div class='add'>+		memset(be-&gt;decompressed_pages, 0,</div><div class='add'>+		       sizeof(struct page *) * be-&gt;nr_pages);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * currently EROFS doesn't support multiref(dedup),</div><div class='del'>-		 * so here erroring out one multiref page.</div><div class='del'>-		 */</div><div class='del'>-		if (pages[pagenr]) {</div><div class='del'>-			DBG_BUGON(1);</div><div class='del'>-			SetPageError(pages[pagenr]);</div><div class='del'>-			z_erofs_onlinepage_endio(pages[pagenr]);</div><div class='add'>+	if (pclusterpages + be-&gt;onstack_used &lt;= Z_EROFS_ONSTACK_PAGES)</div><div class='add'>+		be-&gt;compressed_pages = be-&gt;onstack_pages + be-&gt;onstack_used;</div><div class='add'>+</div><div class='add'>+	if (!be-&gt;decompressed_pages)</div><div class='add'>+		be-&gt;decompressed_pages =</div><div class='add'>+			kvcalloc(be-&gt;nr_pages, sizeof(struct page *),</div><div class='add'>+				 GFP_KERNEL | __GFP_NOFAIL);</div><div class='add'>+	if (!be-&gt;compressed_pages)</div><div class='add'>+		be-&gt;compressed_pages =</div><div class='add'>+			kvcalloc(pclusterpages, sizeof(struct page *),</div><div class='add'>+				 GFP_KERNEL | __GFP_NOFAIL);</div><div class='add'>+</div><div class='add'>+	z_erofs_parse_out_bvecs(be);</div><div class='add'>+	err2 = z_erofs_parse_in_bvecs(be, &amp;overlapped);</div><div class='add'>+	if (err2)</div><div class='add'>+		err = err2;</div><div class='add'>+	if (!err) {</div><div class='add'>+		reason = alg-&gt;decompress(&amp;(struct z_erofs_decompress_req) {</div><div class='add'>+					.sb = be-&gt;sb,</div><div class='add'>+					.in = be-&gt;compressed_pages,</div><div class='add'>+					.out = be-&gt;decompressed_pages,</div><div class='add'>+					.inpages = pclusterpages,</div><div class='add'>+					.outpages = be-&gt;nr_pages,</div><div class='add'>+					.pageofs_in = pcl-&gt;pageofs_in,</div><div class='add'>+					.pageofs_out = pcl-&gt;pageofs_out,</div><div class='add'>+					.inputsize = pcl-&gt;pclustersize,</div><div class='add'>+					.outputsize = pcl-&gt;length,</div><div class='add'>+					.alg = pcl-&gt;algorithmformat,</div><div class='add'>+					.inplace_io = overlapped,</div><div class='add'>+					.partial_decoding = pcl-&gt;partial,</div><div class='add'>+					.fillgaps = be-&gt;keepxcpy,</div><div class='add'>+					.gfp = pcl-&gt;besteffort ? GFP_KERNEL :</div><div class='add'>+						GFP_NOWAIT | __GFP_NORETRY</div><div class='add'>+				 }, be-&gt;pagepool);</div><div class='add'>+		if (IS_ERR(reason)) {</div><div class='add'>+			erofs_err(be-&gt;sb, "failed to decompress (%s) %ld @ pa %llu size %u =&gt; %u",</div><div class='add'>+				  alg-&gt;name, PTR_ERR(reason), pcl-&gt;pos,</div><div class='add'>+				  pcl-&gt;pclustersize, pcl-&gt;length);</div><div class='add'>+			err = PTR_ERR(reason);</div><div class='add'>+		} else if (unlikely(reason)) {</div><div class='add'>+			erofs_err(be-&gt;sb, "failed to decompress (%s) %s @ pa %llu size %u =&gt; %u",</div><div class='add'>+				  alg-&gt;name, reason, pcl-&gt;pos,</div><div class='add'>+				  pcl-&gt;pclustersize, pcl-&gt;length);</div><div class='ctx'> 			err = -EFSCORRUPTED;</div><div class='ctx'> 		}</div><div class='del'>-		pages[pagenr] = page;</div><div class='ctx'> 	}</div><div class='del'>-	z_erofs_pagevec_ctor_exit(&amp;ctor, true);</div><div class='ctx'> </div><div class='del'>-	overlapped = false;</div><div class='del'>-	compressed_pages = pcl-&gt;compressed_pages;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; pcl-&gt;pclusterpages; ++i) {</div><div class='del'>-		unsigned int pagenr;</div><div class='del'>-</div><div class='del'>-		page = compressed_pages[i];</div><div class='del'>-</div><div class='del'>-		/* all compressed pages ought to be valid */</div><div class='del'>-		DBG_BUGON(!page);</div><div class='del'>-		DBG_BUGON(z_erofs_page_is_invalidated(page));</div><div class='del'>-</div><div class='del'>-		if (!z_erofs_is_shortlived_page(page)) {</div><div class='del'>-			if (erofs_page_is_managed(sbi, page)) {</div><div class='del'>-				if (!PageUptodate(page))</div><div class='del'>-					err = -EIO;</div><div class='add'>+	/* must handle all compressed pages before actual file pages */</div><div class='add'>+	if (pcl-&gt;from_meta) {</div><div class='add'>+		folio_put(page_folio(pcl-&gt;compressed_bvecs[0].page));</div><div class='add'>+		WRITE_ONCE(pcl-&gt;compressed_bvecs[0].page, NULL);</div><div class='add'>+	} else {</div><div class='add'>+		/* managed folios are still left in compressed_bvecs[] */</div><div class='add'>+		for (i = 0; i &lt; pclusterpages; ++i) {</div><div class='add'>+			page = be-&gt;compressed_pages[i];</div><div class='add'>+			if (!page)</div><div class='add'>+				continue;</div><div class='add'>+			if (erofs_folio_is_managed(sbi, page_folio(page))) {</div><div class='add'>+				try_free = false;</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='del'>-</div><div class='del'>-			/*</div><div class='del'>-			 * only if non-head page can be selected</div><div class='del'>-			 * for inplace decompression</div><div class='del'>-			 */</div><div class='del'>-			pagenr = z_erofs_onlinepage_index(page);</div><div class='del'>-</div><div class='del'>-			DBG_BUGON(pagenr &gt;= nr_pages);</div><div class='del'>-			if (pages[pagenr]) {</div><div class='del'>-				DBG_BUGON(1);</div><div class='del'>-				SetPageError(pages[pagenr]);</div><div class='del'>-				z_erofs_onlinepage_endio(pages[pagenr]);</div><div class='del'>-				err = -EFSCORRUPTED;</div><div class='del'>-			}</div><div class='del'>-			pages[pagenr] = page;</div><div class='del'>-</div><div class='del'>-			overlapped = true;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/* PG_error needs checking for all non-managed pages */</div><div class='del'>-		if (PageError(page)) {</div><div class='del'>-			DBG_BUGON(PageUptodate(page));</div><div class='del'>-			err = -EIO;</div><div class='add'>+			(void)z_erofs_put_shortlivedpage(be-&gt;pagepool, page);</div><div class='add'>+			WRITE_ONCE(pcl-&gt;compressed_bvecs[i].page, NULL);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	if (err)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	llen = pcl-&gt;length &gt;&gt; Z_EROFS_PCLUSTER_LENGTH_BIT;</div><div class='del'>-	if (nr_pages &lt;&lt; PAGE_SHIFT &gt;= cl-&gt;pageofs + llen) {</div><div class='del'>-		outputsize = llen;</div><div class='del'>-		partial = !(pcl-&gt;length &amp; Z_EROFS_PCLUSTER_FULL_LENGTH);</div><div class='del'>-	} else {</div><div class='del'>-		outputsize = (nr_pages &lt;&lt; PAGE_SHIFT) - cl-&gt;pageofs;</div><div class='del'>-		partial = true;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	inputsize = pcl-&gt;pclusterpages * PAGE_SIZE;</div><div class='del'>-	err = z_erofs_decompress(&amp;(struct z_erofs_decompress_req) {</div><div class='del'>-					.sb = sb,</div><div class='del'>-					.in = compressed_pages,</div><div class='del'>-					.out = pages,</div><div class='del'>-					.pageofs_out = cl-&gt;pageofs,</div><div class='del'>-					.inputsize = inputsize,</div><div class='del'>-					.outputsize = outputsize,</div><div class='del'>-					.alg = pcl-&gt;algorithmformat,</div><div class='del'>-					.inplace_io = overlapped,</div><div class='del'>-					.partial_decoding = partial</div><div class='del'>-				 }, pagepool);</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	/* must handle all compressed pages before ending pages */</div><div class='del'>-	for (i = 0; i &lt; pcl-&gt;pclusterpages; ++i) {</div><div class='del'>-		page = compressed_pages[i];</div><div class='del'>-</div><div class='del'>-		if (erofs_page_is_managed(sbi, page))</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		/* recycle all individual short-lived pages */</div><div class='del'>-		(void)z_erofs_put_shortlivedpage(pagepool, page);</div><div class='del'>-</div><div class='del'>-		WRITE_ONCE(compressed_pages[i], NULL);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; nr_pages; ++i) {</div><div class='del'>-		page = pages[i];</div><div class='add'>+	if (be-&gt;compressed_pages &lt; be-&gt;onstack_pages ||</div><div class='add'>+	    be-&gt;compressed_pages &gt;= be-&gt;onstack_pages + Z_EROFS_ONSTACK_PAGES)</div><div class='add'>+		kvfree(be-&gt;compressed_pages);</div><div class='add'>+</div><div class='add'>+	jtop = 0;</div><div class='add'>+	z_erofs_fill_other_copies(be, err);</div><div class='add'>+	for (i = 0; i &lt; be-&gt;nr_pages; ++i) {</div><div class='add'>+		page = be-&gt;decompressed_pages[i];</div><div class='ctx'> 		if (!page)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		DBG_BUGON(z_erofs_page_is_invalidated(page));</div><div class='del'>-</div><div class='del'>-		/* recycle all individual short-lived pages */</div><div class='del'>-		if (z_erofs_put_shortlivedpage(pagepool, page))</div><div class='add'>+		if (!z_erofs_is_shortlived_page(page)) {</div><div class='add'>+			erofs_onlinefolio_end(page_folio(page), err, true);</div><div class='ctx'> 			continue;</div><div class='del'>-</div><div class='del'>-		if (err &lt; 0)</div><div class='del'>-			SetPageError(page);</div><div class='del'>-</div><div class='del'>-		z_erofs_onlinepage_endio(page);</div><div class='add'>+		}</div><div class='add'>+		if (pcl-&gt;algorithmformat != Z_EROFS_COMPRESSION_LZ4) {</div><div class='add'>+			erofs_pagepool_add(be-&gt;pagepool, page);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+		for (j = 0; j &lt; jtop &amp;&amp; be-&gt;decompressed_pages[j] != page; ++j)</div><div class='add'>+			;</div><div class='add'>+		if (j &gt;= jtop)	/* this bounce page is newly detected */</div><div class='add'>+			be-&gt;decompressed_pages[jtop++] = page;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	if (pages == z_pagemap_global)</div><div class='del'>-		mutex_unlock(&amp;z_pagemap_global_lock);</div><div class='del'>-	else if (pages != pages_onstack)</div><div class='del'>-		kvfree(pages);</div><div class='del'>-</div><div class='del'>-	cl-&gt;nr_pages = 0;</div><div class='del'>-	cl-&gt;vcnt = 0;</div><div class='del'>-</div><div class='del'>-	/* all cl locks MUST be taken before the following line */</div><div class='del'>-	WRITE_ONCE(pcl-&gt;next, Z_EROFS_PCLUSTER_NIL);</div><div class='del'>-</div><div class='del'>-	/* all cl locks SHOULD be released right now */</div><div class='del'>-	mutex_unlock(&amp;cl-&gt;lock);</div><div class='del'>-</div><div class='del'>-	z_erofs_collection_put(cl);</div><div class='add'>+	while (jtop)</div><div class='add'>+		erofs_pagepool_add(be-&gt;pagepool,</div><div class='add'>+				   be-&gt;decompressed_pages[--jtop]);</div><div class='add'>+	if (be-&gt;decompressed_pages != be-&gt;onstack_pages)</div><div class='add'>+		kvfree(be-&gt;decompressed_pages);</div><div class='add'>+</div><div class='add'>+	pcl-&gt;length = 0;</div><div class='add'>+	pcl-&gt;partial = true;</div><div class='add'>+	pcl-&gt;besteffort = false;</div><div class='add'>+	pcl-&gt;bvset.nextpage = NULL;</div><div class='add'>+	pcl-&gt;vcnt = 0;</div><div class='add'>+</div><div class='add'>+	/* pcluster lock MUST be taken before the following line */</div><div class='add'>+	WRITE_ONCE(pcl-&gt;next, NULL);</div><div class='add'>+	mutex_unlock(&amp;pcl-&gt;lock);</div><div class='add'>+</div><div class='add'>+	if (pcl-&gt;from_meta)</div><div class='add'>+		z_erofs_free_pcluster(pcl);</div><div class='add'>+	else</div><div class='add'>+		z_erofs_put_pcluster(sbi, pcl, try_free);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void z_erofs_decompress_queue(const struct z_erofs_decompressqueue *io,</div><div class='del'>-				     struct page **pagepool)</div><div class='add'>+static int z_erofs_decompress_queue(const struct z_erofs_decompressqueue *io,</div><div class='add'>+				    struct page **pagepool)</div><div class='ctx'> {</div><div class='del'>-	z_erofs_next_pcluster_t owned = io-&gt;head;</div><div class='del'>-</div><div class='del'>-	while (owned != Z_EROFS_PCLUSTER_TAIL_CLOSED) {</div><div class='del'>-		struct z_erofs_pcluster *pcl;</div><div class='del'>-</div><div class='del'>-		/* no possible that 'owned' equals Z_EROFS_WORK_TPTR_TAIL */</div><div class='del'>-		DBG_BUGON(owned == Z_EROFS_PCLUSTER_TAIL);</div><div class='del'>-</div><div class='del'>-		/* no possible that 'owned' equals NULL */</div><div class='del'>-		DBG_BUGON(owned == Z_EROFS_PCLUSTER_NIL);</div><div class='del'>-</div><div class='del'>-		pcl = container_of(owned, struct z_erofs_pcluster, next);</div><div class='del'>-		owned = READ_ONCE(pcl-&gt;next);</div><div class='del'>-</div><div class='del'>-		z_erofs_decompress_pcluster(io-&gt;sb, pcl, pagepool);</div><div class='add'>+	struct z_erofs_backend be = {</div><div class='add'>+		.sb = io-&gt;sb,</div><div class='add'>+		.pagepool = pagepool,</div><div class='add'>+		.decompressed_secondary_bvecs =</div><div class='add'>+			LIST_HEAD_INIT(be.decompressed_secondary_bvecs),</div><div class='add'>+		.pcl = io-&gt;head,</div><div class='add'>+	};</div><div class='add'>+	struct z_erofs_pcluster *next;</div><div class='add'>+	int err = io-&gt;eio ? -EIO : 0;</div><div class='add'>+</div><div class='add'>+	for (; be.pcl != Z_EROFS_PCLUSTER_TAIL; be.pcl = next) {</div><div class='add'>+		DBG_BUGON(!be.pcl);</div><div class='add'>+		next = READ_ONCE(be.pcl-&gt;next);</div><div class='add'>+		err = z_erofs_decompress_pcluster(&amp;be, err) ?: err;</div><div class='ctx'> 	}</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void z_erofs_decompressqueue_work(struct work_struct *work)</div><div class='hunk'>@@ -1060,138 +1429,174 @@ static void z_erofs_decompressqueue_work(struct work_struct *work)</div><div class='ctx'> 		container_of(work, struct z_erofs_decompressqueue, u.work);</div><div class='ctx'> 	struct page *pagepool = NULL;</div><div class='ctx'> </div><div class='del'>-	DBG_BUGON(bgq-&gt;head == Z_EROFS_PCLUSTER_TAIL_CLOSED);</div><div class='add'>+	DBG_BUGON(bgq-&gt;head == Z_EROFS_PCLUSTER_TAIL);</div><div class='ctx'> 	z_erofs_decompress_queue(bgq, &amp;pagepool);</div><div class='del'>-</div><div class='ctx'> 	erofs_release_pages(&amp;pagepool);</div><div class='ctx'> 	kvfree(bgq);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct page *pickup_page_for_submission(struct z_erofs_pcluster *pcl,</div><div class='del'>-					       unsigned int nr,</div><div class='del'>-					       struct page **pagepool,</div><div class='del'>-					       struct address_space *mc,</div><div class='del'>-					       gfp_t gfp)</div><div class='add'>+#ifdef CONFIG_EROFS_FS_PCPU_KTHREAD</div><div class='add'>+static void z_erofs_decompressqueue_kthread_work(struct kthread_work *work)</div><div class='ctx'> {</div><div class='del'>-	const pgoff_t index = pcl-&gt;obj.index;</div><div class='del'>-	bool tocache = false;</div><div class='del'>-</div><div class='del'>-	struct address_space *mapping;</div><div class='del'>-	struct page *oldpage, *page;</div><div class='add'>+	z_erofs_decompressqueue_work((struct work_struct *)work);</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='del'>-	compressed_page_t t;</div><div class='del'>-	int justfound;</div><div class='add'>+/* Use (kthread_)work in atomic contexts to minimize scheduling overhead */</div><div class='add'>+static inline bool z_erofs_in_atomic(void)</div><div class='add'>+{</div><div class='add'>+	if (IS_ENABLED(CONFIG_PREEMPTION) &amp;&amp; rcu_preempt_depth())</div><div class='add'>+		return true;</div><div class='add'>+	if (!IS_ENABLED(CONFIG_PREEMPT_COUNT))</div><div class='add'>+		return true;</div><div class='add'>+	return !preemptible();</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-repeat:</div><div class='del'>-	page = READ_ONCE(pcl-&gt;compressed_pages[nr]);</div><div class='del'>-	oldpage = page;</div><div class='add'>+static void z_erofs_decompress_kickoff(struct z_erofs_decompressqueue *io,</div><div class='add'>+				       int bios)</div><div class='add'>+{</div><div class='add'>+	struct erofs_sb_info *const sbi = EROFS_SB(io-&gt;sb);</div><div class='ctx'> </div><div class='del'>-	if (!page)</div><div class='del'>-		goto out_allocpage;</div><div class='add'>+	/* wake up the caller thread for sync decompression */</div><div class='add'>+	if (io-&gt;sync) {</div><div class='add'>+		if (!atomic_add_return(bios, &amp;io-&gt;pending_bios))</div><div class='add'>+			complete(&amp;io-&gt;u.done);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * the cached page has not been allocated and</div><div class='del'>-	 * an placeholder is out there, prepare it now.</div><div class='del'>-	 */</div><div class='del'>-	if (page == PAGE_UNALLOCATED) {</div><div class='del'>-		tocache = true;</div><div class='del'>-		goto out_allocpage;</div><div class='add'>+	if (atomic_add_return(bios, &amp;io-&gt;pending_bios))</div><div class='add'>+		return;</div><div class='add'>+	if (z_erofs_in_atomic()) {</div><div class='add'>+#ifdef CONFIG_EROFS_FS_PCPU_KTHREAD</div><div class='add'>+		struct kthread_worker *worker;</div><div class='add'>+</div><div class='add'>+		rcu_read_lock();</div><div class='add'>+		worker = rcu_dereference(</div><div class='add'>+				z_erofs_pcpu_workers[raw_smp_processor_id()]);</div><div class='add'>+		if (!worker) {</div><div class='add'>+			INIT_WORK(&amp;io-&gt;u.work, z_erofs_decompressqueue_work);</div><div class='add'>+			queue_work(z_erofs_workqueue, &amp;io-&gt;u.work);</div><div class='add'>+		} else {</div><div class='add'>+			kthread_queue_work(worker, &amp;io-&gt;u.kthread_work);</div><div class='add'>+		}</div><div class='add'>+		rcu_read_unlock();</div><div class='add'>+#else</div><div class='add'>+		queue_work(z_erofs_workqueue, &amp;io-&gt;u.work);</div><div class='add'>+#endif</div><div class='add'>+		/* enable sync decompression for readahead */</div><div class='add'>+		if (sbi-&gt;opt.sync_decompress == EROFS_SYNC_DECOMPRESS_AUTO)</div><div class='add'>+			sbi-&gt;opt.sync_decompress = EROFS_SYNC_DECOMPRESS_FORCE_ON;</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='add'>+	z_erofs_decompressqueue_work(&amp;io-&gt;u.work);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	/* process the target tagged pointer */</div><div class='del'>-	t = tagptr_init(compressed_page_t, page);</div><div class='del'>-	justfound = tagptr_unfold_tags(t);</div><div class='del'>-	page = tagptr_unfold_ptr(t);</div><div class='add'>+static void z_erofs_fill_bio_vec(struct bio_vec *bvec,</div><div class='add'>+				 struct z_erofs_frontend *f,</div><div class='add'>+				 struct z_erofs_pcluster *pcl,</div><div class='add'>+				 unsigned int nr,</div><div class='add'>+				 struct address_space *mc)</div><div class='add'>+{</div><div class='add'>+	gfp_t gfp = mapping_gfp_mask(mc);</div><div class='add'>+	bool tocache = false;</div><div class='add'>+	struct z_erofs_bvec zbv;</div><div class='add'>+	struct address_space *mapping;</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	struct page *page;</div><div class='add'>+	int bs = i_blocksize(f-&gt;inode);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * preallocated cached pages, which is used to avoid direct reclaim</div><div class='del'>-	 * otherwise, it will go inplace I/O path instead.</div><div class='del'>-	 */</div><div class='del'>-	if (page-&gt;private == Z_EROFS_PREALLOCATED_PAGE) {</div><div class='del'>-		WRITE_ONCE(pcl-&gt;compressed_pages[nr], page);</div><div class='del'>-		set_page_private(page, 0);</div><div class='add'>+	/* Except for inplace folios, the entire folio can be used for I/Os */</div><div class='add'>+	bvec-&gt;bv_offset = 0;</div><div class='add'>+	bvec-&gt;bv_len = PAGE_SIZE;</div><div class='add'>+repeat:</div><div class='add'>+	spin_lock(&amp;pcl-&gt;lockref.lock);</div><div class='add'>+	zbv = pcl-&gt;compressed_bvecs[nr];</div><div class='add'>+	spin_unlock(&amp;pcl-&gt;lockref.lock);</div><div class='add'>+	if (!zbv.page)</div><div class='add'>+		goto out_allocfolio;</div><div class='add'>+</div><div class='add'>+	bvec-&gt;bv_page = zbv.page;</div><div class='add'>+	DBG_BUGON(z_erofs_is_shortlived_page(bvec-&gt;bv_page));</div><div class='add'>+</div><div class='add'>+	folio = page_folio(zbv.page);</div><div class='add'>+	/* For preallocated managed folios, add them to page cache here */</div><div class='add'>+	if (folio-&gt;private == Z_EROFS_PREALLOCATED_FOLIO) {</div><div class='ctx'> 		tocache = true;</div><div class='ctx'> 		goto out_tocache;</div><div class='ctx'> 	}</div><div class='del'>-	mapping = READ_ONCE(page-&gt;mapping);</div><div class='ctx'> </div><div class='add'>+	mapping = READ_ONCE(folio-&gt;mapping);</div><div class='ctx'> 	/*</div><div class='del'>-	 * file-backed online pages in plcuster are all locked steady,</div><div class='del'>-	 * therefore it is impossible for `mapping' to be NULL.</div><div class='add'>+	 * File-backed folios for inplace I/Os are all locked steady,</div><div class='add'>+	 * therefore it is impossible for `mapping` to be NULL.</div><div class='ctx'> 	 */</div><div class='del'>-	if (mapping &amp;&amp; mapping != mc)</div><div class='del'>-		/* ought to be unmanaged pages */</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	/* directly return for shortlived page as well */</div><div class='del'>-	if (z_erofs_is_shortlived_page(page))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	lock_page(page);</div><div class='del'>-</div><div class='del'>-	/* only true if page reclaim goes wrong, should never happen */</div><div class='del'>-	DBG_BUGON(justfound &amp;&amp; PagePrivate(page));</div><div class='del'>-</div><div class='del'>-	/* the page is still in manage cache */</div><div class='del'>-	if (page-&gt;mapping == mc) {</div><div class='del'>-		WRITE_ONCE(pcl-&gt;compressed_pages[nr], page);</div><div class='del'>-</div><div class='del'>-		ClearPageError(page);</div><div class='del'>-		if (!PagePrivate(page)) {</div><div class='del'>-			/*</div><div class='del'>-			 * impossible to be !PagePrivate(page) for</div><div class='del'>-			 * the current restriction as well if</div><div class='del'>-			 * the page is already in compressed_pages[].</div><div class='del'>-			 */</div><div class='del'>-			DBG_BUGON(!justfound);</div><div class='add'>+	if (mapping &amp;&amp; mapping != mc) {</div><div class='add'>+		if (zbv.offset &lt; 0)</div><div class='add'>+			bvec-&gt;bv_offset = round_up(-zbv.offset, bs);</div><div class='add'>+		bvec-&gt;bv_len = round_up(zbv.end, bs) - bvec-&gt;bv_offset;</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-			justfound = 0;</div><div class='del'>-			set_page_private(page, (unsigned long)pcl);</div><div class='del'>-			SetPagePrivate(page);</div><div class='add'>+	folio_lock(folio);</div><div class='add'>+	if (likely(folio-&gt;mapping == mc)) {</div><div class='add'>+		/*</div><div class='add'>+		 * The cached folio is still in managed cache but without</div><div class='add'>+		 * a valid `-&gt;private` pcluster hint.  Let's reconnect them.</div><div class='add'>+		 */</div><div class='add'>+		if (!folio_test_private(folio)) {</div><div class='add'>+			folio_attach_private(folio, pcl);</div><div class='add'>+			/* compressed_bvecs[] already takes a ref before */</div><div class='add'>+			folio_put(folio);</div><div class='ctx'> 		}</div><div class='del'>-</div><div class='del'>-		/* no need to submit io if it is already up-to-date */</div><div class='del'>-		if (PageUptodate(page)) {</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			page = NULL;</div><div class='add'>+		if (likely(folio-&gt;private == pcl))  {</div><div class='add'>+			/* don't submit cache I/Os again if already uptodate */</div><div class='add'>+			if (folio_test_uptodate(folio)) {</div><div class='add'>+				folio_unlock(folio);</div><div class='add'>+				bvec-&gt;bv_page = NULL;</div><div class='add'>+			}</div><div class='add'>+			return;</div><div class='ctx'> 		}</div><div class='del'>-		goto out;</div><div class='add'>+		/*</div><div class='add'>+		 * Already linked with another pcluster, which only appears in</div><div class='add'>+		 * crafted images by fuzzers for now.  But handle this anyway.</div><div class='add'>+		 */</div><div class='add'>+		tocache = false;	/* use temporary short-lived pages */</div><div class='add'>+	} else {</div><div class='add'>+		DBG_BUGON(1); /* referenced managed folios can't be truncated */</div><div class='add'>+		tocache = true;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * the managed page has been truncated, it's unsafe to</div><div class='del'>-	 * reuse this one, let's allocate a new cache-managed page.</div><div class='del'>-	 */</div><div class='del'>-	DBG_BUGON(page-&gt;mapping);</div><div class='del'>-	DBG_BUGON(!justfound);</div><div class='del'>-</div><div class='del'>-	tocache = true;</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='del'>-out_allocpage:</div><div class='del'>-	page = erofs_allocpage(pagepool, gfp | __GFP_NOFAIL);</div><div class='del'>-	if (oldpage != cmpxchg(&amp;pcl-&gt;compressed_pages[nr], oldpage, page)) {</div><div class='del'>-		erofs_pagepool_add(pagepool, page);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='add'>+out_allocfolio:</div><div class='add'>+	page = __erofs_allocpage(&amp;f-&gt;pagepool, gfp, true);</div><div class='add'>+	spin_lock(&amp;pcl-&gt;lockref.lock);</div><div class='add'>+	if (unlikely(pcl-&gt;compressed_bvecs[nr].page != zbv.page)) {</div><div class='add'>+		if (page)</div><div class='add'>+			erofs_pagepool_add(&amp;f-&gt;pagepool, page);</div><div class='add'>+		spin_unlock(&amp;pcl-&gt;lockref.lock);</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 		goto repeat;</div><div class='ctx'> 	}</div><div class='add'>+	pcl-&gt;compressed_bvecs[nr].page = page ? page : ERR_PTR(-ENOMEM);</div><div class='add'>+	spin_unlock(&amp;pcl-&gt;lockref.lock);</div><div class='add'>+	bvec-&gt;bv_page = page;</div><div class='add'>+	if (!page)</div><div class='add'>+		return;</div><div class='add'>+	folio = page_folio(page);</div><div class='ctx'> out_tocache:</div><div class='del'>-	if (!tocache || add_to_page_cache_lru(page, mc, index + nr, gfp)) {</div><div class='del'>-		/* turn into temporary page if fails (1 ref) */</div><div class='del'>-		set_page_private(page, Z_EROFS_SHORTLIVED_PAGE);</div><div class='del'>-		goto out;</div><div class='add'>+	if (!tocache || bs != PAGE_SIZE ||</div><div class='add'>+	    filemap_add_folio(mc, folio, (pcl-&gt;pos &gt;&gt; PAGE_SHIFT) + nr, gfp)) {</div><div class='add'>+		/* turn into a temporary shortlived folio (1 ref) */</div><div class='add'>+		folio-&gt;private = (void *)Z_EROFS_SHORTLIVED_PAGE;</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='del'>-	attach_page_private(page, pcl);</div><div class='del'>-	/* drop a refcount added by allocpage (then we have 2 refs here) */</div><div class='del'>-	put_page(page);</div><div class='del'>-</div><div class='del'>-out:	/* the only exit (for tracing and debugging) */</div><div class='del'>-	return page;</div><div class='add'>+	folio_attach_private(folio, pcl);</div><div class='add'>+	/* drop a refcount added by allocpage (then 2 refs in total here) */</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct z_erofs_decompressqueue *</div><div class='del'>-jobqueue_init(struct super_block *sb,</div><div class='del'>-	      struct z_erofs_decompressqueue *fgq, bool *fg)</div><div class='add'>+static struct z_erofs_decompressqueue *jobqueue_init(struct super_block *sb,</div><div class='add'>+			      struct z_erofs_decompressqueue *fgq, bool *fg)</div><div class='ctx'> {</div><div class='ctx'> 	struct z_erofs_decompressqueue *q;</div><div class='ctx'> </div><div class='hunk'>@@ -1201,15 +1606,22 @@ jobqueue_init(struct super_block *sb,</div><div class='ctx'> 			*fg = true;</div><div class='ctx'> 			goto fg_out;</div><div class='ctx'> 		}</div><div class='add'>+#ifdef CONFIG_EROFS_FS_PCPU_KTHREAD</div><div class='add'>+		kthread_init_work(&amp;q-&gt;u.kthread_work,</div><div class='add'>+				  z_erofs_decompressqueue_kthread_work);</div><div class='add'>+#else</div><div class='ctx'> 		INIT_WORK(&amp;q-&gt;u.work, z_erofs_decompressqueue_work);</div><div class='add'>+#endif</div><div class='ctx'> 	} else {</div><div class='ctx'> fg_out:</div><div class='ctx'> 		q = fgq;</div><div class='del'>-		init_waitqueue_head(&amp;fgq-&gt;u.wait);</div><div class='add'>+		init_completion(&amp;fgq-&gt;u.done);</div><div class='ctx'> 		atomic_set(&amp;fgq-&gt;pending_bios, 0);</div><div class='add'>+		q-&gt;eio = false;</div><div class='add'>+		q-&gt;sync = true;</div><div class='ctx'> 	}</div><div class='ctx'> 	q-&gt;sb = sb;</div><div class='del'>-	q-&gt;head = Z_EROFS_PCLUSTER_TAIL_CLOSED;</div><div class='add'>+	q-&gt;head = Z_EROFS_PCLUSTER_TAIL;</div><div class='ctx'> 	return q;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1220,314 +1632,312 @@ enum {</div><div class='ctx'> 	NR_JOBQUEUES,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static void *jobqueueset_init(struct super_block *sb,</div><div class='del'>-			      struct z_erofs_decompressqueue *q[],</div><div class='del'>-			      struct z_erofs_decompressqueue *fgq, bool *fg)</div><div class='add'>+static void z_erofs_move_to_bypass_queue(struct z_erofs_pcluster *pcl,</div><div class='add'>+					 struct z_erofs_pcluster *next,</div><div class='add'>+					 struct z_erofs_pcluster **qtail[])</div><div class='ctx'> {</div><div class='del'>-	/*</div><div class='del'>-	 * if managed cache is enabled, bypass jobqueue is needed,</div><div class='del'>-	 * no need to read from device for all pclusters in this queue.</div><div class='del'>-	 */</div><div class='del'>-	q[JQ_BYPASS] = jobqueue_init(sb, fgq + JQ_BYPASS, NULL);</div><div class='del'>-	q[JQ_SUBMIT] = jobqueue_init(sb, fgq + JQ_SUBMIT, fg);</div><div class='del'>-</div><div class='del'>-	return tagptr_cast_ptr(tagptr_fold(tagptr1_t, q[JQ_SUBMIT], *fg));</div><div class='add'>+	WRITE_ONCE(pcl-&gt;next, Z_EROFS_PCLUSTER_TAIL);</div><div class='add'>+	WRITE_ONCE(*qtail[JQ_SUBMIT], next);</div><div class='add'>+	WRITE_ONCE(*qtail[JQ_BYPASS], pcl);</div><div class='add'>+	qtail[JQ_BYPASS] = &amp;pcl-&gt;next;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void move_to_bypass_jobqueue(struct z_erofs_pcluster *pcl,</div><div class='del'>-				    z_erofs_next_pcluster_t qtail[],</div><div class='del'>-				    z_erofs_next_pcluster_t owned_head)</div><div class='add'>+static void z_erofs_endio(struct bio *bio)</div><div class='ctx'> {</div><div class='del'>-	z_erofs_next_pcluster_t *const submit_qtail = qtail[JQ_SUBMIT];</div><div class='del'>-	z_erofs_next_pcluster_t *const bypass_qtail = qtail[JQ_BYPASS];</div><div class='del'>-</div><div class='del'>-	DBG_BUGON(owned_head == Z_EROFS_PCLUSTER_TAIL_CLOSED);</div><div class='del'>-	if (owned_head == Z_EROFS_PCLUSTER_TAIL)</div><div class='del'>-		owned_head = Z_EROFS_PCLUSTER_TAIL_CLOSED;</div><div class='add'>+	struct z_erofs_decompressqueue *q = bio-&gt;bi_private;</div><div class='add'>+	blk_status_t err = bio-&gt;bi_status;</div><div class='add'>+	struct folio_iter fi;</div><div class='ctx'> </div><div class='del'>-	WRITE_ONCE(pcl-&gt;next, Z_EROFS_PCLUSTER_TAIL_CLOSED);</div><div class='add'>+	bio_for_each_folio_all(fi, bio) {</div><div class='add'>+		struct folio *folio = fi.folio;</div><div class='ctx'> </div><div class='del'>-	WRITE_ONCE(*submit_qtail, owned_head);</div><div class='del'>-	WRITE_ONCE(*bypass_qtail, &amp;pcl-&gt;next);</div><div class='add'>+		DBG_BUGON(folio_test_uptodate(folio));</div><div class='add'>+		DBG_BUGON(z_erofs_page_is_invalidated(&amp;folio-&gt;page));</div><div class='add'>+		if (!erofs_folio_is_managed(EROFS_SB(q-&gt;sb), folio))</div><div class='add'>+			continue;</div><div class='ctx'> </div><div class='del'>-	qtail[JQ_BYPASS] = &amp;pcl-&gt;next;</div><div class='add'>+		if (!err)</div><div class='add'>+			folio_mark_uptodate(folio);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+	}</div><div class='add'>+	if (err)</div><div class='add'>+		q-&gt;eio = true;</div><div class='add'>+	z_erofs_decompress_kickoff(q, -1);</div><div class='add'>+	if (bio-&gt;bi_bdev)</div><div class='add'>+		bio_put(bio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void z_erofs_submit_queue(struct super_block *sb,</div><div class='del'>-				 struct z_erofs_decompress_frontend *f,</div><div class='del'>-				 struct page **pagepool,</div><div class='add'>+static void z_erofs_submit_queue(struct z_erofs_frontend *f,</div><div class='ctx'> 				 struct z_erofs_decompressqueue *fgq,</div><div class='del'>-				 bool *force_fg)</div><div class='add'>+				 bool *force_fg, bool readahead)</div><div class='ctx'> {</div><div class='del'>-	struct erofs_sb_info *const sbi = EROFS_SB(sb);</div><div class='del'>-	z_erofs_next_pcluster_t qtail[NR_JOBQUEUES];</div><div class='add'>+	struct super_block *sb = f-&gt;inode-&gt;i_sb;</div><div class='add'>+	struct address_space *mc = MNGD_MAPPING(EROFS_SB(sb));</div><div class='add'>+	struct z_erofs_pcluster **qtail[NR_JOBQUEUES];</div><div class='ctx'> 	struct z_erofs_decompressqueue *q[NR_JOBQUEUES];</div><div class='del'>-	void *bi_private;</div><div class='del'>-	z_erofs_next_pcluster_t owned_head = f-&gt;clt.owned_head;</div><div class='add'>+	struct z_erofs_pcluster *pcl, *next;</div><div class='ctx'> 	/* bio is NULL initially, so no need to initialize last_{index,bdev} */</div><div class='del'>-	pgoff_t last_index;</div><div class='del'>-	struct block_device *last_bdev;</div><div class='add'>+	erofs_off_t last_pa;</div><div class='ctx'> 	unsigned int nr_bios = 0;</div><div class='ctx'> 	struct bio *bio = NULL;</div><div class='add'>+	unsigned long pflags;</div><div class='add'>+	int memstall = 0;</div><div class='add'>+</div><div class='add'>+	/* No need to read from device for pclusters in the bypass queue. */</div><div class='add'>+	q[JQ_BYPASS] = jobqueue_init(sb, fgq + JQ_BYPASS, NULL);</div><div class='add'>+	q[JQ_SUBMIT] = jobqueue_init(sb, fgq + JQ_SUBMIT, force_fg);</div><div class='ctx'> </div><div class='del'>-	bi_private = jobqueueset_init(sb, q, fgq, force_fg);</div><div class='ctx'> 	qtail[JQ_BYPASS] = &amp;q[JQ_BYPASS]-&gt;head;</div><div class='ctx'> 	qtail[JQ_SUBMIT] = &amp;q[JQ_SUBMIT]-&gt;head;</div><div class='ctx'> </div><div class='ctx'> 	/* by default, all need io submission */</div><div class='del'>-	q[JQ_SUBMIT]-&gt;head = owned_head;</div><div class='add'>+	q[JQ_SUBMIT]-&gt;head = next = f-&gt;head;</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='ctx'> 		struct erofs_map_dev mdev;</div><div class='del'>-		struct z_erofs_pcluster *pcl;</div><div class='del'>-		pgoff_t cur, end;</div><div class='add'>+		erofs_off_t cur, end;</div><div class='add'>+		struct bio_vec bvec;</div><div class='ctx'> 		unsigned int i = 0;</div><div class='ctx'> 		bool bypass = true;</div><div class='ctx'> </div><div class='del'>-		/* no possible 'owned_head' equals the following */</div><div class='del'>-		DBG_BUGON(owned_head == Z_EROFS_PCLUSTER_TAIL_CLOSED);</div><div class='del'>-		DBG_BUGON(owned_head == Z_EROFS_PCLUSTER_NIL);</div><div class='del'>-</div><div class='del'>-		pcl = container_of(owned_head, struct z_erofs_pcluster, next);</div><div class='add'>+		pcl = next;</div><div class='add'>+		next = READ_ONCE(pcl-&gt;next);</div><div class='add'>+		if (pcl-&gt;from_meta) {</div><div class='add'>+			z_erofs_move_to_bypass_queue(pcl, next, qtail);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		/* no device id here, thus it will always succeed */</div><div class='ctx'> 		mdev = (struct erofs_map_dev) {</div><div class='del'>-			.m_pa = blknr_to_addr(pcl-&gt;obj.index),</div><div class='add'>+			.m_pa = round_down(pcl-&gt;pos, sb-&gt;s_blocksize),</div><div class='ctx'> 		};</div><div class='ctx'> 		(void)erofs_map_dev(sb, &amp;mdev);</div><div class='ctx'> </div><div class='del'>-		cur = erofs_blknr(mdev.m_pa);</div><div class='del'>-		end = cur + pcl-&gt;pclusterpages;</div><div class='del'>-</div><div class='del'>-		/* close the main owned chain at first */</div><div class='del'>-		owned_head = cmpxchg(&amp;pcl-&gt;next, Z_EROFS_PCLUSTER_TAIL,</div><div class='del'>-				     Z_EROFS_PCLUSTER_TAIL_CLOSED);</div><div class='del'>-</div><div class='add'>+		cur = mdev.m_pa;</div><div class='add'>+		end = round_up(cur + pcl-&gt;pageofs_in + pcl-&gt;pclustersize,</div><div class='add'>+			       sb-&gt;s_blocksize);</div><div class='ctx'> 		do {</div><div class='del'>-			struct page *page;</div><div class='add'>+			bvec.bv_page = NULL;</div><div class='add'>+			if (bio &amp;&amp; (cur != last_pa ||</div><div class='add'>+				    bio-&gt;bi_bdev != mdev.m_bdev)) {</div><div class='add'>+drain_io:</div><div class='add'>+				if (erofs_is_fileio_mode(EROFS_SB(sb)))</div><div class='add'>+					erofs_fileio_submit_bio(bio);</div><div class='add'>+				else if (erofs_is_fscache_mode(sb))</div><div class='add'>+					erofs_fscache_submit_bio(bio);</div><div class='add'>+				else</div><div class='add'>+					submit_bio(bio);</div><div class='add'>+</div><div class='add'>+				if (memstall) {</div><div class='add'>+					psi_memstall_leave(&amp;pflags);</div><div class='add'>+					memstall = 0;</div><div class='add'>+				}</div><div class='add'>+				bio = NULL;</div><div class='add'>+			}</div><div class='ctx'> </div><div class='del'>-			page = pickup_page_for_submission(pcl, i++, pagepool,</div><div class='del'>-							  MNGD_MAPPING(sbi),</div><div class='del'>-							  GFP_NOFS);</div><div class='del'>-			if (!page)</div><div class='del'>-				continue;</div><div class='add'>+			if (!bvec.bv_page) {</div><div class='add'>+				z_erofs_fill_bio_vec(&amp;bvec, f, pcl, i++, mc);</div><div class='add'>+				if (!bvec.bv_page)</div><div class='add'>+					continue;</div><div class='add'>+				if (cur + bvec.bv_len &gt; end)</div><div class='add'>+					bvec.bv_len = end - cur;</div><div class='add'>+				DBG_BUGON(bvec.bv_len &lt; sb-&gt;s_blocksize);</div><div class='add'>+			}</div><div class='ctx'> </div><div class='del'>-			if (bio &amp;&amp; (cur != last_index + 1 ||</div><div class='del'>-				    last_bdev != mdev.m_bdev)) {</div><div class='del'>-submit_bio_retry:</div><div class='del'>-				submit_bio(bio);</div><div class='del'>-				bio = NULL;</div><div class='add'>+			if (unlikely(PageWorkingset(bvec.bv_page)) &amp;&amp;</div><div class='add'>+			    !memstall) {</div><div class='add'>+				psi_memstall_enter(&amp;pflags);</div><div class='add'>+				memstall = 1;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			if (!bio) {</div><div class='del'>-				bio = bio_alloc(GFP_NOIO, BIO_MAX_VECS);</div><div class='del'>-				bio-&gt;bi_end_io = z_erofs_decompressqueue_endio;</div><div class='del'>-</div><div class='del'>-				bio_set_dev(bio, mdev.m_bdev);</div><div class='del'>-				last_bdev = mdev.m_bdev;</div><div class='del'>-				bio-&gt;bi_iter.bi_sector = (sector_t)cur &lt;&lt;</div><div class='del'>-					LOG_SECTORS_PER_BLOCK;</div><div class='del'>-				bio-&gt;bi_private = bi_private;</div><div class='del'>-				bio-&gt;bi_opf = REQ_OP_READ;</div><div class='del'>-				if (f-&gt;readahead)</div><div class='add'>+				if (erofs_is_fileio_mode(EROFS_SB(sb)))</div><div class='add'>+					bio = erofs_fileio_bio_alloc(&amp;mdev);</div><div class='add'>+				else if (erofs_is_fscache_mode(sb))</div><div class='add'>+					bio = erofs_fscache_bio_alloc(&amp;mdev);</div><div class='add'>+				else</div><div class='add'>+					bio = bio_alloc(mdev.m_bdev, BIO_MAX_VECS,</div><div class='add'>+							REQ_OP_READ, GFP_NOIO);</div><div class='add'>+				bio-&gt;bi_end_io = z_erofs_endio;</div><div class='add'>+				bio-&gt;bi_iter.bi_sector =</div><div class='add'>+						(mdev.m_dif-&gt;fsoff + cur) &gt;&gt; 9;</div><div class='add'>+				bio-&gt;bi_private = q[JQ_SUBMIT];</div><div class='add'>+				if (readahead)</div><div class='ctx'> 					bio-&gt;bi_opf |= REQ_RAHEAD;</div><div class='ctx'> 				++nr_bios;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			if (bio_add_page(bio, page, PAGE_SIZE, 0) &lt; PAGE_SIZE)</div><div class='del'>-				goto submit_bio_retry;</div><div class='del'>-</div><div class='del'>-			last_index = cur;</div><div class='add'>+			if (!bio_add_page(bio, bvec.bv_page, bvec.bv_len,</div><div class='add'>+					  bvec.bv_offset))</div><div class='add'>+				goto drain_io;</div><div class='add'>+			last_pa = cur + bvec.bv_len;</div><div class='ctx'> 			bypass = false;</div><div class='del'>-		} while (++cur &lt; end);</div><div class='add'>+		} while ((cur += bvec.bv_len) &lt; end);</div><div class='ctx'> </div><div class='ctx'> 		if (!bypass)</div><div class='ctx'> 			qtail[JQ_SUBMIT] = &amp;pcl-&gt;next;</div><div class='ctx'> 		else</div><div class='del'>-			move_to_bypass_jobqueue(pcl, qtail, owned_head);</div><div class='del'>-	} while (owned_head != Z_EROFS_PCLUSTER_TAIL);</div><div class='del'>-</div><div class='del'>-	if (bio)</div><div class='del'>-		submit_bio(bio);</div><div class='add'>+			z_erofs_move_to_bypass_queue(pcl, next, qtail);</div><div class='add'>+	} while (next != Z_EROFS_PCLUSTER_TAIL);</div><div class='add'>+</div><div class='add'>+	if (bio) {</div><div class='add'>+		if (erofs_is_fileio_mode(EROFS_SB(sb)))</div><div class='add'>+			erofs_fileio_submit_bio(bio);</div><div class='add'>+		else if (erofs_is_fscache_mode(sb))</div><div class='add'>+			erofs_fscache_submit_bio(bio);</div><div class='add'>+		else</div><div class='add'>+			submit_bio(bio);</div><div class='add'>+	}</div><div class='add'>+	if (memstall)</div><div class='add'>+		psi_memstall_leave(&amp;pflags);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * although background is preferred, no one is pending for submission.</div><div class='del'>-	 * don't issue workqueue for decompression but drop it directly instead.</div><div class='add'>+	 * don't issue decompression but drop it directly instead.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (!*force_fg &amp;&amp; !nr_bios) {</div><div class='ctx'> 		kvfree(q[JQ_SUBMIT]);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='del'>-	z_erofs_decompress_kickoff(q[JQ_SUBMIT], *force_fg, nr_bios);</div><div class='add'>+	z_erofs_decompress_kickoff(q[JQ_SUBMIT], nr_bios);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void z_erofs_runqueue(struct super_block *sb,</div><div class='del'>-			     struct z_erofs_decompress_frontend *f,</div><div class='del'>-			     struct page **pagepool, bool force_fg)</div><div class='add'>+static int z_erofs_runqueue(struct z_erofs_frontend *f, unsigned int rapages)</div><div class='ctx'> {</div><div class='ctx'> 	struct z_erofs_decompressqueue io[NR_JOBQUEUES];</div><div class='add'>+	struct erofs_sb_info *sbi = EROFS_I_SB(f-&gt;inode);</div><div class='add'>+	bool force_fg = z_erofs_is_sync_decompress(sbi, rapages);</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='del'>-	if (f-&gt;clt.owned_head == Z_EROFS_PCLUSTER_TAIL)</div><div class='del'>-		return;</div><div class='del'>-	z_erofs_submit_queue(sb, f, pagepool, io, &amp;force_fg);</div><div class='add'>+	if (f-&gt;head == Z_EROFS_PCLUSTER_TAIL)</div><div class='add'>+		return 0;</div><div class='add'>+	z_erofs_submit_queue(f, io, &amp;force_fg, !!rapages);</div><div class='ctx'> </div><div class='ctx'> 	/* handle bypass queue (no i/o pclusters) immediately */</div><div class='del'>-	z_erofs_decompress_queue(&amp;io[JQ_BYPASS], pagepool);</div><div class='del'>-</div><div class='add'>+	err = z_erofs_decompress_queue(&amp;io[JQ_BYPASS], &amp;f-&gt;pagepool);</div><div class='ctx'> 	if (!force_fg)</div><div class='del'>-		return;</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='ctx'> 	/* wait until all bios are completed */</div><div class='del'>-	io_wait_event(io[JQ_SUBMIT].u.wait,</div><div class='del'>-		      !atomic_read(&amp;io[JQ_SUBMIT].pending_bios));</div><div class='add'>+	wait_for_completion_io(&amp;io[JQ_SUBMIT].u.done);</div><div class='ctx'> </div><div class='ctx'> 	/* handle synchronous decompress queue in the caller context */</div><div class='del'>-	z_erofs_decompress_queue(&amp;io[JQ_SUBMIT], pagepool);</div><div class='add'>+	return z_erofs_decompress_queue(&amp;io[JQ_SUBMIT], &amp;f-&gt;pagepool) ?: err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Since partial uptodate is still unimplemented for now, we have to use</div><div class='ctx'>  * approximate readmore strategies as a start.</div><div class='ctx'>  */</div><div class='del'>-static void z_erofs_pcluster_readmore(struct z_erofs_decompress_frontend *f,</div><div class='del'>-				      struct readahead_control *rac,</div><div class='del'>-				      erofs_off_t end,</div><div class='del'>-				      struct page **pagepool,</div><div class='del'>-				      bool backmost)</div><div class='add'>+static void z_erofs_pcluster_readmore(struct z_erofs_frontend *f,</div><div class='add'>+		struct readahead_control *rac, bool backmost)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = f-&gt;inode;</div><div class='ctx'> 	struct erofs_map_blocks *map = &amp;f-&gt;map;</div><div class='del'>-	erofs_off_t cur;</div><div class='add'>+	erofs_off_t cur, end, headoffset = f-&gt;headoffset;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (backmost) {</div><div class='add'>+		if (rac)</div><div class='add'>+			end = headoffset + readahead_length(rac) - 1;</div><div class='add'>+		else</div><div class='add'>+			end = headoffset + PAGE_SIZE - 1;</div><div class='ctx'> 		map-&gt;m_la = end;</div><div class='ctx'> 		err = z_erofs_map_blocks_iter(inode, map,</div><div class='ctx'> 					      EROFS_GET_BLOCKS_READMORE);</div><div class='del'>-		if (err)</div><div class='add'>+		if (err || !(map-&gt;m_flags &amp; EROFS_MAP_ENCODED))</div><div class='ctx'> 			return;</div><div class='ctx'> </div><div class='del'>-		/* expend ra for the trailing edge if readahead */</div><div class='add'>+		/* expand ra for the trailing edge if readahead */</div><div class='ctx'> 		if (rac) {</div><div class='del'>-			loff_t newstart = readahead_pos(rac);</div><div class='del'>-</div><div class='ctx'> 			cur = round_up(map-&gt;m_la + map-&gt;m_llen, PAGE_SIZE);</div><div class='del'>-			readahead_expand(rac, newstart, cur - newstart);</div><div class='add'>+			readahead_expand(rac, headoffset, cur - headoffset);</div><div class='ctx'> 			return;</div><div class='ctx'> 		}</div><div class='ctx'> 		end = round_up(end, PAGE_SIZE);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		end = round_up(map-&gt;m_la, PAGE_SIZE);</div><div class='del'>-</div><div class='del'>-		if (!map-&gt;m_llen)</div><div class='add'>+		if (!(map-&gt;m_flags &amp; EROFS_MAP_ENCODED) || !map-&gt;m_llen)</div><div class='ctx'> 			return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	cur = map-&gt;m_la + map-&gt;m_llen - 1;</div><div class='del'>-	while (cur &gt;= end) {</div><div class='add'>+	while ((cur &gt;= end) &amp;&amp; (cur &lt; i_size_read(inode))) {</div><div class='ctx'> 		pgoff_t index = cur &gt;&gt; PAGE_SHIFT;</div><div class='del'>-		struct page *page;</div><div class='del'>-</div><div class='del'>-		page = erofs_grab_cache_page_nowait(inode-&gt;i_mapping, index);</div><div class='del'>-		if (!page)</div><div class='del'>-			goto skip;</div><div class='del'>-</div><div class='del'>-		if (PageUptodate(page)) {</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			put_page(page);</div><div class='del'>-			goto skip;</div><div class='add'>+		struct folio *folio;</div><div class='add'>+</div><div class='add'>+		folio = erofs_grab_folio_nowait(inode-&gt;i_mapping, index);</div><div class='add'>+		if (!IS_ERR_OR_NULL(folio)) {</div><div class='add'>+			if (folio_test_uptodate(folio))</div><div class='add'>+				folio_unlock(folio);</div><div class='add'>+			else</div><div class='add'>+				z_erofs_scan_folio(f, folio, !!rac);</div><div class='add'>+			folio_put(folio);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		err = z_erofs_do_read_page(f, page, pagepool);</div><div class='del'>-		if (err)</div><div class='del'>-			erofs_err(inode-&gt;i_sb,</div><div class='del'>-				  "readmore error at page %lu @ nid %llu",</div><div class='del'>-				  index, EROFS_I(inode)-&gt;nid);</div><div class='del'>-		put_page(page);</div><div class='del'>-skip:</div><div class='ctx'> 		if (cur &lt; PAGE_SIZE)</div><div class='ctx'> 			break;</div><div class='ctx'> 		cur = (index &lt;&lt; PAGE_SHIFT) - 1;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int z_erofs_readpage(struct file *file, struct page *page)</div><div class='add'>+static int z_erofs_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct inode *const inode = page-&gt;mapping-&gt;host;</div><div class='del'>-	struct z_erofs_decompress_frontend f = DECOMPRESS_FRONTEND_INIT(inode);</div><div class='del'>-	struct page *pagepool = NULL;</div><div class='add'>+	struct inode *const inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+	Z_EROFS_DEFINE_FRONTEND(f, inode, folio_pos(folio));</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	trace_erofs_readpage(page, false);</div><div class='del'>-	f.headoffset = (erofs_off_t)page-&gt;index &lt;&lt; PAGE_SHIFT;</div><div class='del'>-</div><div class='del'>-	z_erofs_pcluster_readmore(&amp;f, NULL, f.headoffset + PAGE_SIZE - 1,</div><div class='del'>-				  &amp;pagepool, true);</div><div class='del'>-	err = z_erofs_do_read_page(&amp;f, page, &amp;pagepool);</div><div class='del'>-	z_erofs_pcluster_readmore(&amp;f, NULL, 0, &amp;pagepool, false);</div><div class='del'>-</div><div class='del'>-	(void)z_erofs_collector_end(&amp;f.clt);</div><div class='del'>-</div><div class='del'>-	/* if some compressed cluster ready, need submit them anyway */</div><div class='del'>-	z_erofs_runqueue(inode-&gt;i_sb, &amp;f, &amp;pagepool, true);</div><div class='add'>+	trace_erofs_read_folio(folio, false);</div><div class='add'>+	z_erofs_pcluster_readmore(&amp;f, NULL, true);</div><div class='add'>+	err = z_erofs_scan_folio(&amp;f, folio, false);</div><div class='add'>+	z_erofs_pcluster_readmore(&amp;f, NULL, false);</div><div class='add'>+	z_erofs_pcluster_end(&amp;f);</div><div class='ctx'> </div><div class='del'>-	if (err)</div><div class='del'>-		erofs_err(inode-&gt;i_sb, "failed to read, err [%d]", err);</div><div class='del'>-</div><div class='del'>-	if (f.map.mpage)</div><div class='del'>-		put_page(f.map.mpage);</div><div class='add'>+	/* if some pclusters are ready, need submit them anyway */</div><div class='add'>+	err = z_erofs_runqueue(&amp;f, 0) ?: err;</div><div class='add'>+	if (err &amp;&amp; err != -EINTR)</div><div class='add'>+		erofs_err(inode-&gt;i_sb, "read error %d @ %lu of nid %llu",</div><div class='add'>+			  err, folio-&gt;index, EROFS_I(inode)-&gt;nid);</div><div class='ctx'> </div><div class='del'>-	erofs_release_pages(&amp;pagepool);</div><div class='add'>+	erofs_put_metabuf(&amp;f.map.buf);</div><div class='add'>+	erofs_release_pages(&amp;f.pagepool);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void z_erofs_readahead(struct readahead_control *rac)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *const inode = rac-&gt;mapping-&gt;host;</div><div class='del'>-	struct erofs_sb_info *const sbi = EROFS_I_SB(inode);</div><div class='del'>-	struct z_erofs_decompress_frontend f = DECOMPRESS_FRONTEND_INIT(inode);</div><div class='del'>-	struct page *pagepool = NULL, *head = NULL, *page;</div><div class='del'>-	unsigned int nr_pages;</div><div class='del'>-</div><div class='del'>-	f.readahead = true;</div><div class='del'>-	f.headoffset = readahead_pos(rac);</div><div class='del'>-</div><div class='del'>-	z_erofs_pcluster_readmore(&amp;f, rac, f.headoffset +</div><div class='del'>-				  readahead_length(rac) - 1, &amp;pagepool, true);</div><div class='del'>-	nr_pages = readahead_count(rac);</div><div class='del'>-	trace_erofs_readpages(inode, readahead_index(rac), nr_pages, false);</div><div class='del'>-</div><div class='del'>-	while ((page = readahead_page(rac))) {</div><div class='del'>-		set_page_private(page, (unsigned long)head);</div><div class='del'>-		head = page;</div><div class='add'>+	Z_EROFS_DEFINE_FRONTEND(f, inode, readahead_pos(rac));</div><div class='add'>+	unsigned int nrpages = readahead_count(rac);</div><div class='add'>+	struct folio *head = NULL, *folio;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	trace_erofs_readahead(inode, readahead_index(rac), nrpages, false);</div><div class='add'>+	z_erofs_pcluster_readmore(&amp;f, rac, true);</div><div class='add'>+	while ((folio = readahead_folio(rac))) {</div><div class='add'>+		folio-&gt;private = head;</div><div class='add'>+		head = folio;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/* traverse in reverse order for best metadata I/O performance */</div><div class='ctx'> 	while (head) {</div><div class='del'>-		struct page *page = head;</div><div class='del'>-		int err;</div><div class='del'>-</div><div class='del'>-		/* traversal in reverse order */</div><div class='del'>-		head = (void *)page_private(page);</div><div class='del'>-</div><div class='del'>-		err = z_erofs_do_read_page(&amp;f, page, &amp;pagepool);</div><div class='del'>-		if (err)</div><div class='del'>-			erofs_err(inode-&gt;i_sb,</div><div class='del'>-				  "readahead error at page %lu @ nid %llu",</div><div class='del'>-				  page-&gt;index, EROFS_I(inode)-&gt;nid);</div><div class='del'>-		put_page(page);</div><div class='add'>+		folio = head;</div><div class='add'>+		head = folio_get_private(folio);</div><div class='add'>+</div><div class='add'>+		err = z_erofs_scan_folio(&amp;f, folio, true);</div><div class='add'>+		if (err &amp;&amp; err != -EINTR)</div><div class='add'>+			erofs_err(inode-&gt;i_sb, "readahead error at folio %lu @ nid %llu",</div><div class='add'>+				  folio-&gt;index, EROFS_I(inode)-&gt;nid);</div><div class='ctx'> 	}</div><div class='del'>-	z_erofs_pcluster_readmore(&amp;f, rac, 0, &amp;pagepool, false);</div><div class='del'>-	(void)z_erofs_collector_end(&amp;f.clt);</div><div class='del'>-</div><div class='del'>-	z_erofs_runqueue(inode-&gt;i_sb, &amp;f, &amp;pagepool,</div><div class='del'>-			 sbi-&gt;opt.readahead_sync_decompress &amp;&amp;</div><div class='del'>-			 nr_pages &lt;= sbi-&gt;opt.max_sync_decompress_pages);</div><div class='del'>-	if (f.map.mpage)</div><div class='del'>-		put_page(f.map.mpage);</div><div class='del'>-	erofs_release_pages(&amp;pagepool);</div><div class='add'>+	z_erofs_pcluster_readmore(&amp;f, rac, false);</div><div class='add'>+	z_erofs_pcluster_end(&amp;f);</div><div class='add'>+</div><div class='add'>+	(void)z_erofs_runqueue(&amp;f, nrpages);</div><div class='add'>+	erofs_put_metabuf(&amp;f.map.buf);</div><div class='add'>+	erofs_release_pages(&amp;f.pagepool);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations z_erofs_aops = {</div><div class='del'>-	.readpage = z_erofs_readpage,</div><div class='add'>+	.read_folio = z_erofs_read_folio,</div><div class='ctx'> 	.readahead = z_erofs_readahead,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/erofs/zdata.h b/fs/erofs/zdata.h<br/>deleted file mode 100644<br/>index 879df5362777..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/erofs/zdata.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/zdata.h</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,182 +0,0 @@</div><div class='del'>-/* SPDX-License-Identifier: GPL-2.0-only */</div><div class='del'>-/*</div><div class='del'>- * Copyright (C) 2018 HUAWEI, Inc.</div><div class='del'>- *             https://www.huawei.com/</div><div class='del'>- */</div><div class='del'>-#ifndef __EROFS_FS_ZDATA_H</div><div class='del'>-#define __EROFS_FS_ZDATA_H</div><div class='del'>-</div><div class='del'>-#include "internal.h"</div><div class='del'>-#include "zpvec.h"</div><div class='del'>-</div><div class='del'>-#define Z_EROFS_PCLUSTER_MAX_PAGES	(Z_EROFS_PCLUSTER_MAX_SIZE / PAGE_SIZE)</div><div class='del'>-#define Z_EROFS_NR_INLINE_PAGEVECS      3</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Structure fields follow one of the following exclusion rules.</div><div class='del'>- *</div><div class='del'>- * I: Modifiable by initialization/destruction paths and read-only</div><div class='del'>- *    for everyone else;</div><div class='del'>- *</div><div class='del'>- * L: Field should be protected by pageset lock;</div><div class='del'>- *</div><div class='del'>- * A: Field should be accessed / updated in atomic for parallelized code.</div><div class='del'>- */</div><div class='del'>-struct z_erofs_collection {</div><div class='del'>-	struct mutex lock;</div><div class='del'>-</div><div class='del'>-	/* I: page offset of start position of decompression */</div><div class='del'>-	unsigned short pageofs;</div><div class='del'>-</div><div class='del'>-	/* L: maximum relative page index in pagevec[] */</div><div class='del'>-	unsigned short nr_pages;</div><div class='del'>-</div><div class='del'>-	/* L: total number of pages in pagevec[] */</div><div class='del'>-	unsigned int vcnt;</div><div class='del'>-</div><div class='del'>-	union {</div><div class='del'>-		/* L: inline a certain number of pagevecs for bootstrap */</div><div class='del'>-		erofs_vtptr_t pagevec[Z_EROFS_NR_INLINE_PAGEVECS];</div><div class='del'>-</div><div class='del'>-		/* I: can be used to free the pcluster by RCU. */</div><div class='del'>-		struct rcu_head rcu;</div><div class='del'>-	};</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-#define Z_EROFS_PCLUSTER_FULL_LENGTH    0x00000001</div><div class='del'>-#define Z_EROFS_PCLUSTER_LENGTH_BIT     1</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * let's leave a type here in case of introducing</div><div class='del'>- * another tagged pointer later.</div><div class='del'>- */</div><div class='del'>-typedef void *z_erofs_next_pcluster_t;</div><div class='del'>-</div><div class='del'>-struct z_erofs_pcluster {</div><div class='del'>-	struct erofs_workgroup obj;</div><div class='del'>-	struct z_erofs_collection primary_collection;</div><div class='del'>-</div><div class='del'>-	/* A: point to next chained pcluster or TAILs */</div><div class='del'>-	z_erofs_next_pcluster_t next;</div><div class='del'>-</div><div class='del'>-	/* A: lower limit of decompressed length and if full length or not */</div><div class='del'>-	unsigned int length;</div><div class='del'>-</div><div class='del'>-	/* I: physical cluster size in pages */</div><div class='del'>-	unsigned short pclusterpages;</div><div class='del'>-</div><div class='del'>-	/* I: compression algorithm format */</div><div class='del'>-	unsigned char algorithmformat;</div><div class='del'>-</div><div class='del'>-	/* A: compressed pages (can be cached or inplaced pages) */</div><div class='del'>-	struct page *compressed_pages[];</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-#define z_erofs_primarycollection(pcluster) (&amp;(pcluster)-&gt;primary_collection)</div><div class='del'>-</div><div class='del'>-/* let's avoid the valid 32-bit kernel addresses */</div><div class='del'>-</div><div class='del'>-/* the chained workgroup has't submitted io (still open) */</div><div class='del'>-#define Z_EROFS_PCLUSTER_TAIL           ((void *)0x5F0ECAFE)</div><div class='del'>-/* the chained workgroup has already submitted io */</div><div class='del'>-#define Z_EROFS_PCLUSTER_TAIL_CLOSED    ((void *)0x5F0EDEAD)</div><div class='del'>-</div><div class='del'>-#define Z_EROFS_PCLUSTER_NIL            (NULL)</div><div class='del'>-</div><div class='del'>-struct z_erofs_decompressqueue {</div><div class='del'>-	struct super_block *sb;</div><div class='del'>-	atomic_t pending_bios;</div><div class='del'>-	z_erofs_next_pcluster_t head;</div><div class='del'>-</div><div class='del'>-	union {</div><div class='del'>-		wait_queue_head_t wait;</div><div class='del'>-		struct work_struct work;</div><div class='del'>-	} u;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-#define Z_EROFS_ONLINEPAGE_COUNT_BITS   2</div><div class='del'>-#define Z_EROFS_ONLINEPAGE_COUNT_MASK   ((1 &lt;&lt; Z_EROFS_ONLINEPAGE_COUNT_BITS) - 1)</div><div class='del'>-#define Z_EROFS_ONLINEPAGE_INDEX_SHIFT  (Z_EROFS_ONLINEPAGE_COUNT_BITS)</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * waiters (aka. ongoing_packs): # to unlock the page</div><div class='del'>- * sub-index: 0 - for partial page, &gt;= 1 full page sub-index</div><div class='del'>- */</div><div class='del'>-typedef atomic_t z_erofs_onlinepage_t;</div><div class='del'>-</div><div class='del'>-/* type punning */</div><div class='del'>-union z_erofs_onlinepage_converter {</div><div class='del'>-	z_erofs_onlinepage_t *o;</div><div class='del'>-	unsigned long *v;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static inline unsigned int z_erofs_onlinepage_index(struct page *page)</div><div class='del'>-{</div><div class='del'>-	union z_erofs_onlinepage_converter u;</div><div class='del'>-</div><div class='del'>-	DBG_BUGON(!PagePrivate(page));</div><div class='del'>-	u.v = &amp;page_private(page);</div><div class='del'>-</div><div class='del'>-	return atomic_read(u.o) &gt;&gt; Z_EROFS_ONLINEPAGE_INDEX_SHIFT;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void z_erofs_onlinepage_init(struct page *page)</div><div class='del'>-{</div><div class='del'>-	union {</div><div class='del'>-		z_erofs_onlinepage_t o;</div><div class='del'>-		unsigned long v;</div><div class='del'>-	/* keep from being unlocked in advance */</div><div class='del'>-	} u = { .o = ATOMIC_INIT(1) };</div><div class='del'>-</div><div class='del'>-	set_page_private(page, u.v);</div><div class='del'>-	smp_wmb();</div><div class='del'>-	SetPagePrivate(page);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void z_erofs_onlinepage_fixup(struct page *page,</div><div class='del'>-	uintptr_t index, bool down)</div><div class='del'>-{</div><div class='del'>-	union z_erofs_onlinepage_converter u = { .v = &amp;page_private(page) };</div><div class='del'>-	int orig, orig_index, val;</div><div class='del'>-</div><div class='del'>-repeat:</div><div class='del'>-	orig = atomic_read(u.o);</div><div class='del'>-	orig_index = orig &gt;&gt; Z_EROFS_ONLINEPAGE_INDEX_SHIFT;</div><div class='del'>-	if (orig_index) {</div><div class='del'>-		if (!index)</div><div class='del'>-			return;</div><div class='del'>-</div><div class='del'>-		DBG_BUGON(orig_index != index);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	val = (index &lt;&lt; Z_EROFS_ONLINEPAGE_INDEX_SHIFT) |</div><div class='del'>-		((orig &amp; Z_EROFS_ONLINEPAGE_COUNT_MASK) + (unsigned int)down);</div><div class='del'>-	if (atomic_cmpxchg(u.o, orig, val) != orig)</div><div class='del'>-		goto repeat;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void z_erofs_onlinepage_endio(struct page *page)</div><div class='del'>-{</div><div class='del'>-	union z_erofs_onlinepage_converter u;</div><div class='del'>-	unsigned int v;</div><div class='del'>-</div><div class='del'>-	DBG_BUGON(!PagePrivate(page));</div><div class='del'>-	u.v = &amp;page_private(page);</div><div class='del'>-</div><div class='del'>-	v = atomic_dec_return(u.o);</div><div class='del'>-	if (!(v &amp; Z_EROFS_ONLINEPAGE_COUNT_MASK)) {</div><div class='del'>-		set_page_private(page, 0);</div><div class='del'>-		ClearPagePrivate(page);</div><div class='del'>-		if (!PageError(page))</div><div class='del'>-			SetPageUptodate(page);</div><div class='del'>-		unlock_page(page);</div><div class='del'>-	}</div><div class='del'>-	erofs_dbg("%s, page %p value %x", __func__, page, atomic_read(u.o));</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#define Z_EROFS_VMAP_ONSTACK_PAGES	\</div><div class='del'>-	min_t(unsigned int, THREAD_SIZE / 8 / sizeof(struct page *), 96U)</div><div class='del'>-#define Z_EROFS_VMAP_GLOBAL_PAGES	2048</div><div class='del'>-</div><div class='del'>-#endif</div><div class='del'>-</div><div class='head'>diff --git a/fs/erofs/zmap.c b/fs/erofs/zmap.c<br/>index 660489a7fb64..c8d8e129eb4b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/erofs/zmap.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/zmap.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/erofs/zmap.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/erofs/zmap.c</a></div><div class='hunk'>@@ -4,285 +4,172 @@</div><div class='ctx'>  *             https://www.huawei.com/</div><div class='ctx'>  */</div><div class='ctx'> #include "internal.h"</div><div class='del'>-#include &lt;asm/unaligned.h&gt;</div><div class='add'>+#include &lt;linux/unaligned.h&gt;</div><div class='ctx'> #include &lt;trace/events/erofs.h&gt;</div><div class='ctx'> </div><div class='del'>-int z_erofs_fill_inode(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	struct erofs_inode *const vi = EROFS_I(inode);</div><div class='del'>-	struct erofs_sb_info *sbi = EROFS_SB(inode-&gt;i_sb);</div><div class='del'>-</div><div class='del'>-	if (!erofs_sb_has_big_pcluster(sbi) &amp;&amp;</div><div class='del'>-	    vi-&gt;datalayout == EROFS_INODE_FLAT_COMPRESSION_LEGACY) {</div><div class='del'>-		vi-&gt;z_advise = 0;</div><div class='del'>-		vi-&gt;z_algorithmtype[0] = 0;</div><div class='del'>-		vi-&gt;z_algorithmtype[1] = 0;</div><div class='del'>-		vi-&gt;z_logical_clusterbits = LOG_BLOCK_SIZE;</div><div class='del'>-		set_bit(EROFS_I_Z_INITED_BIT, &amp;vi-&gt;flags);</div><div class='del'>-	}</div><div class='del'>-	inode-&gt;i_mapping-&gt;a_ops = &amp;z_erofs_aops;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int z_erofs_fill_inode_lazy(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	struct erofs_inode *const vi = EROFS_I(inode);</div><div class='del'>-	struct super_block *const sb = inode-&gt;i_sb;</div><div class='del'>-	int err, headnr;</div><div class='del'>-	erofs_off_t pos;</div><div class='del'>-	struct page *page;</div><div class='del'>-	void *kaddr;</div><div class='del'>-	struct z_erofs_map_header *h;</div><div class='del'>-</div><div class='del'>-	if (test_bit(EROFS_I_Z_INITED_BIT, &amp;vi-&gt;flags)) {</div><div class='del'>-		/*</div><div class='del'>-		 * paired with smp_mb() at the end of the function to ensure</div><div class='del'>-		 * fields will only be observed after the bit is set.</div><div class='del'>-		 */</div><div class='del'>-		smp_mb();</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (wait_on_bit_lock(&amp;vi-&gt;flags, EROFS_I_BL_Z_BIT, TASK_KILLABLE))</div><div class='del'>-		return -ERESTARTSYS;</div><div class='del'>-</div><div class='del'>-	err = 0;</div><div class='del'>-	if (test_bit(EROFS_I_Z_INITED_BIT, &amp;vi-&gt;flags))</div><div class='del'>-		goto out_unlock;</div><div class='del'>-</div><div class='del'>-	DBG_BUGON(!erofs_sb_has_big_pcluster(EROFS_SB(sb)) &amp;&amp;</div><div class='del'>-		  vi-&gt;datalayout == EROFS_INODE_FLAT_COMPRESSION_LEGACY);</div><div class='del'>-</div><div class='del'>-	pos = ALIGN(iloc(EROFS_SB(sb), vi-&gt;nid) + vi-&gt;inode_isize +</div><div class='del'>-		    vi-&gt;xattr_isize, 8);</div><div class='del'>-	page = erofs_get_meta_page(sb, erofs_blknr(pos));</div><div class='del'>-	if (IS_ERR(page)) {</div><div class='del'>-		err = PTR_ERR(page);</div><div class='del'>-		goto out_unlock;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	kaddr = kmap_atomic(page);</div><div class='del'>-</div><div class='del'>-	h = kaddr + erofs_blkoff(pos);</div><div class='del'>-	vi-&gt;z_advise = le16_to_cpu(h-&gt;h_advise);</div><div class='del'>-	vi-&gt;z_algorithmtype[0] = h-&gt;h_algorithmtype &amp; 15;</div><div class='del'>-	vi-&gt;z_algorithmtype[1] = h-&gt;h_algorithmtype &gt;&gt; 4;</div><div class='del'>-</div><div class='del'>-	headnr = 0;</div><div class='del'>-	if (vi-&gt;z_algorithmtype[0] &gt;= Z_EROFS_COMPRESSION_MAX ||</div><div class='del'>-	    vi-&gt;z_algorithmtype[++headnr] &gt;= Z_EROFS_COMPRESSION_MAX) {</div><div class='del'>-		erofs_err(sb, "unknown HEAD%u format %u for nid %llu, please upgrade kernel",</div><div class='del'>-			  headnr + 1, vi-&gt;z_algorithmtype[headnr], vi-&gt;nid);</div><div class='del'>-		err = -EOPNOTSUPP;</div><div class='del'>-		goto unmap_done;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	vi-&gt;z_logical_clusterbits = LOG_BLOCK_SIZE + (h-&gt;h_clusterbits &amp; 7);</div><div class='del'>-	if (!erofs_sb_has_big_pcluster(EROFS_SB(sb)) &amp;&amp;</div><div class='del'>-	    vi-&gt;z_advise &amp; (Z_EROFS_ADVISE_BIG_PCLUSTER_1 |</div><div class='del'>-			    Z_EROFS_ADVISE_BIG_PCLUSTER_2)) {</div><div class='del'>-		erofs_err(sb, "per-inode big pcluster without sb feature for nid %llu",</div><div class='del'>-			  vi-&gt;nid);</div><div class='del'>-		err = -EFSCORRUPTED;</div><div class='del'>-		goto unmap_done;</div><div class='del'>-	}</div><div class='del'>-	if (vi-&gt;datalayout == EROFS_INODE_FLAT_COMPRESSION &amp;&amp;</div><div class='del'>-	    !(vi-&gt;z_advise &amp; Z_EROFS_ADVISE_BIG_PCLUSTER_1) ^</div><div class='del'>-	    !(vi-&gt;z_advise &amp; Z_EROFS_ADVISE_BIG_PCLUSTER_2)) {</div><div class='del'>-		erofs_err(sb, "big pcluster head1/2 of compact indexes should be consistent for nid %llu",</div><div class='del'>-			  vi-&gt;nid);</div><div class='del'>-		err = -EFSCORRUPTED;</div><div class='del'>-		goto unmap_done;</div><div class='del'>-	}</div><div class='del'>-	/* paired with smp_mb() at the beginning of the function */</div><div class='del'>-	smp_mb();</div><div class='del'>-	set_bit(EROFS_I_Z_INITED_BIT, &amp;vi-&gt;flags);</div><div class='del'>-unmap_done:</div><div class='del'>-	kunmap_atomic(kaddr);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='del'>-out_unlock:</div><div class='del'>-	clear_and_wake_up_bit(EROFS_I_BL_Z_BIT, &amp;vi-&gt;flags);</div><div class='del'>-	return err;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> struct z_erofs_maprecorder {</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct erofs_map_blocks *map;</div><div class='del'>-	void *kaddr;</div><div class='del'>-</div><div class='ctx'> 	unsigned long lcn;</div><div class='ctx'> 	/* compression extent information gathered */</div><div class='ctx'> 	u8  type, headtype;</div><div class='ctx'> 	u16 clusterofs;</div><div class='ctx'> 	u16 delta[2];</div><div class='del'>-	erofs_blk_t pblk, compressedlcs;</div><div class='add'>+	erofs_blk_t pblk, compressedblks;</div><div class='add'>+	erofs_off_t nextpackoff;</div><div class='add'>+	bool partialref, in_mbox;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int z_erofs_reload_indexes(struct z_erofs_maprecorder *m,</div><div class='del'>-				  erofs_blk_t eblk)</div><div class='del'>-{</div><div class='del'>-	struct super_block *const sb = m-&gt;inode-&gt;i_sb;</div><div class='del'>-	struct erofs_map_blocks *const map = m-&gt;map;</div><div class='del'>-	struct page *mpage = map-&gt;mpage;</div><div class='del'>-</div><div class='del'>-	if (mpage) {</div><div class='del'>-		if (mpage-&gt;index == eblk) {</div><div class='del'>-			if (!m-&gt;kaddr)</div><div class='del'>-				m-&gt;kaddr = kmap_atomic(mpage);</div><div class='del'>-			return 0;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (m-&gt;kaddr) {</div><div class='del'>-			kunmap_atomic(m-&gt;kaddr);</div><div class='del'>-			m-&gt;kaddr = NULL;</div><div class='del'>-		}</div><div class='del'>-		put_page(mpage);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	mpage = erofs_get_meta_page(sb, eblk);</div><div class='del'>-	if (IS_ERR(mpage)) {</div><div class='del'>-		map-&gt;mpage = NULL;</div><div class='del'>-		return PTR_ERR(mpage);</div><div class='del'>-	}</div><div class='del'>-	m-&gt;kaddr = kmap_atomic(mpage);</div><div class='del'>-	unlock_page(mpage);</div><div class='del'>-	map-&gt;mpage = mpage;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int legacy_load_cluster_from_disk(struct z_erofs_maprecorder *m,</div><div class='del'>-					 unsigned long lcn)</div><div class='add'>+static int z_erofs_load_full_lcluster(struct z_erofs_maprecorder *m,</div><div class='add'>+				      unsigned long lcn)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *const inode = m-&gt;inode;</div><div class='ctx'> 	struct erofs_inode *const vi = EROFS_I(inode);</div><div class='del'>-	const erofs_off_t ibase = iloc(EROFS_I_SB(inode), vi-&gt;nid);</div><div class='del'>-	const erofs_off_t pos =</div><div class='del'>-		Z_EROFS_VLE_LEGACY_INDEX_ALIGN(ibase + vi-&gt;inode_isize +</div><div class='del'>-					       vi-&gt;xattr_isize) +</div><div class='del'>-		lcn * sizeof(struct z_erofs_vle_decompressed_index);</div><div class='del'>-	struct z_erofs_vle_decompressed_index *di;</div><div class='del'>-	unsigned int advise, type;</div><div class='del'>-	int err;</div><div class='del'>-</div><div class='del'>-	err = z_erofs_reload_indexes(m, erofs_blknr(pos));</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='del'>-</div><div class='add'>+	const erofs_off_t pos = Z_EROFS_FULL_INDEX_START(erofs_iloc(inode) +</div><div class='add'>+			vi-&gt;inode_isize + vi-&gt;xattr_isize) +</div><div class='add'>+			lcn * sizeof(struct z_erofs_lcluster_index);</div><div class='add'>+	struct z_erofs_lcluster_index *di;</div><div class='add'>+	unsigned int advise;</div><div class='add'>+</div><div class='add'>+	di = erofs_read_metabuf(&amp;m-&gt;map-&gt;buf, inode-&gt;i_sb, pos, m-&gt;in_mbox);</div><div class='add'>+	if (IS_ERR(di))</div><div class='add'>+		return PTR_ERR(di);</div><div class='ctx'> 	m-&gt;lcn = lcn;</div><div class='del'>-	di = m-&gt;kaddr + erofs_blkoff(pos);</div><div class='add'>+	m-&gt;nextpackoff = pos + sizeof(struct z_erofs_lcluster_index);</div><div class='ctx'> </div><div class='ctx'> 	advise = le16_to_cpu(di-&gt;di_advise);</div><div class='del'>-	type = (advise &gt;&gt; Z_EROFS_VLE_DI_CLUSTER_TYPE_BIT) &amp;</div><div class='del'>-		((1 &lt;&lt; Z_EROFS_VLE_DI_CLUSTER_TYPE_BITS) - 1);</div><div class='del'>-	switch (type) {</div><div class='del'>-	case Z_EROFS_VLE_CLUSTER_TYPE_NONHEAD:</div><div class='del'>-		m-&gt;clusterofs = 1 &lt;&lt; vi-&gt;z_logical_clusterbits;</div><div class='add'>+	m-&gt;type = advise &amp; Z_EROFS_LI_LCLUSTER_TYPE_MASK;</div><div class='add'>+	if (m-&gt;type == Z_EROFS_LCLUSTER_TYPE_NONHEAD) {</div><div class='add'>+		m-&gt;clusterofs = 1 &lt;&lt; vi-&gt;z_lclusterbits;</div><div class='ctx'> 		m-&gt;delta[0] = le16_to_cpu(di-&gt;di_u.delta[0]);</div><div class='del'>-		if (m-&gt;delta[0] &amp; Z_EROFS_VLE_DI_D0_CBLKCNT) {</div><div class='add'>+		if (m-&gt;delta[0] &amp; Z_EROFS_LI_D0_CBLKCNT) {</div><div class='ctx'> 			if (!(vi-&gt;z_advise &amp; (Z_EROFS_ADVISE_BIG_PCLUSTER_1 |</div><div class='ctx'> 					Z_EROFS_ADVISE_BIG_PCLUSTER_2))) {</div><div class='ctx'> 				DBG_BUGON(1);</div><div class='ctx'> 				return -EFSCORRUPTED;</div><div class='ctx'> 			}</div><div class='del'>-			m-&gt;compressedlcs = m-&gt;delta[0] &amp;</div><div class='del'>-				~Z_EROFS_VLE_DI_D0_CBLKCNT;</div><div class='add'>+			m-&gt;compressedblks = m-&gt;delta[0] &amp; ~Z_EROFS_LI_D0_CBLKCNT;</div><div class='ctx'> 			m-&gt;delta[0] = 1;</div><div class='ctx'> 		}</div><div class='ctx'> 		m-&gt;delta[1] = le16_to_cpu(di-&gt;di_u.delta[1]);</div><div class='del'>-		break;</div><div class='del'>-	case Z_EROFS_VLE_CLUSTER_TYPE_PLAIN:</div><div class='del'>-	case Z_EROFS_VLE_CLUSTER_TYPE_HEAD1:</div><div class='del'>-	case Z_EROFS_VLE_CLUSTER_TYPE_HEAD2:</div><div class='add'>+	} else {</div><div class='add'>+		m-&gt;partialref = !!(advise &amp; Z_EROFS_LI_PARTIAL_REF);</div><div class='ctx'> 		m-&gt;clusterofs = le16_to_cpu(di-&gt;di_clusterofs);</div><div class='ctx'> 		m-&gt;pblk = le32_to_cpu(di-&gt;di_u.blkaddr);</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		DBG_BUGON(1);</div><div class='del'>-		return -EOPNOTSUPP;</div><div class='ctx'> 	}</div><div class='del'>-	m-&gt;type = type;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static unsigned int decode_compactedbits(unsigned int lobits,</div><div class='del'>-					 unsigned int lomask,</div><div class='ctx'> 					 u8 *in, unsigned int pos, u8 *type)</div><div class='ctx'> {</div><div class='ctx'> 	const unsigned int v = get_unaligned_le32(in + pos / 8) &gt;&gt; (pos &amp; 7);</div><div class='del'>-	const unsigned int lo = v &amp; lomask;</div><div class='add'>+	const unsigned int lo = v &amp; ((1 &lt;&lt; lobits) - 1);</div><div class='ctx'> </div><div class='ctx'> 	*type = (v &gt;&gt; lobits) &amp; 3;</div><div class='ctx'> 	return lo;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int get_compacted_la_distance(unsigned int lclusterbits,</div><div class='add'>+static int get_compacted_la_distance(unsigned int lobits,</div><div class='ctx'> 				     unsigned int encodebits,</div><div class='ctx'> 				     unsigned int vcnt, u8 *in, int i)</div><div class='ctx'> {</div><div class='del'>-	const unsigned int lomask = (1 &lt;&lt; lclusterbits) - 1;</div><div class='ctx'> 	unsigned int lo, d1 = 0;</div><div class='ctx'> 	u8 type;</div><div class='ctx'> </div><div class='ctx'> 	DBG_BUGON(i &gt;= vcnt);</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='del'>-		lo = decode_compactedbits(lclusterbits, lomask,</div><div class='del'>-					  in, encodebits * i, &amp;type);</div><div class='add'>+		lo = decode_compactedbits(lobits, in, encodebits * i, &amp;type);</div><div class='ctx'> </div><div class='del'>-		if (type != Z_EROFS_VLE_CLUSTER_TYPE_NONHEAD)</div><div class='add'>+		if (type != Z_EROFS_LCLUSTER_TYPE_NONHEAD)</div><div class='ctx'> 			return d1;</div><div class='ctx'> 		++d1;</div><div class='ctx'> 	} while (++i &lt; vcnt);</div><div class='ctx'> </div><div class='del'>-	/* vcnt - 1 (Z_EROFS_VLE_CLUSTER_TYPE_NONHEAD) item */</div><div class='del'>-	if (!(lo &amp; Z_EROFS_VLE_DI_D0_CBLKCNT))</div><div class='add'>+	/* vcnt - 1 (Z_EROFS_LCLUSTER_TYPE_NONHEAD) item */</div><div class='add'>+	if (!(lo &amp; Z_EROFS_LI_D0_CBLKCNT))</div><div class='ctx'> 		d1 += lo - 1;</div><div class='ctx'> 	return d1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int unpack_compacted_index(struct z_erofs_maprecorder *m,</div><div class='del'>-				  unsigned int amortizedshift,</div><div class='del'>-				  unsigned int eofs, bool lookahead)</div><div class='add'>+static int z_erofs_load_compact_lcluster(struct z_erofs_maprecorder *m,</div><div class='add'>+					 unsigned long lcn, bool lookahead)</div><div class='ctx'> {</div><div class='del'>-	struct erofs_inode *const vi = EROFS_I(m-&gt;inode);</div><div class='del'>-	const unsigned int lclusterbits = vi-&gt;z_logical_clusterbits;</div><div class='del'>-	const unsigned int lomask = (1 &lt;&lt; lclusterbits) - 1;</div><div class='del'>-	unsigned int vcnt, base, lo, encodebits, nblk;</div><div class='del'>-	int i;</div><div class='add'>+	struct inode *const inode = m-&gt;inode;</div><div class='add'>+	struct erofs_inode *const vi = EROFS_I(inode);</div><div class='add'>+	const erofs_off_t ebase = Z_EROFS_MAP_HEADER_END(erofs_iloc(inode) +</div><div class='add'>+			vi-&gt;inode_isize + vi-&gt;xattr_isize);</div><div class='add'>+	const unsigned int lclusterbits = vi-&gt;z_lclusterbits;</div><div class='add'>+	const unsigned int totalidx = erofs_iblks(inode);</div><div class='add'>+	unsigned int compacted_4b_initial, compacted_2b, amortizedshift;</div><div class='add'>+	unsigned int vcnt, lo, lobits, encodebits, nblk, bytes;</div><div class='add'>+	bool big_pcluster = vi-&gt;z_advise &amp; Z_EROFS_ADVISE_BIG_PCLUSTER_1;</div><div class='add'>+	erofs_off_t pos;</div><div class='ctx'> 	u8 *in, type;</div><div class='del'>-	bool big_pcluster;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	if (lcn &gt;= totalidx || lclusterbits &gt; 14)</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	if (1 &lt;&lt; amortizedshift == 4)</div><div class='add'>+	m-&gt;lcn = lcn;</div><div class='add'>+	/* used to align to 32-byte (compacted_2b) alignment */</div><div class='add'>+	compacted_4b_initial = ((32 - ebase % 32) / 4) &amp; 7;</div><div class='add'>+	compacted_2b = 0;</div><div class='add'>+	if ((vi-&gt;z_advise &amp; Z_EROFS_ADVISE_COMPACTED_2B) &amp;&amp;</div><div class='add'>+	    compacted_4b_initial &lt; totalidx)</div><div class='add'>+		compacted_2b = rounddown(totalidx - compacted_4b_initial, 16);</div><div class='add'>+</div><div class='add'>+	pos = ebase;</div><div class='add'>+	amortizedshift = 2;	/* compact_4b */</div><div class='add'>+	if (lcn &gt;= compacted_4b_initial) {</div><div class='add'>+		pos += compacted_4b_initial * 4;</div><div class='add'>+		lcn -= compacted_4b_initial;</div><div class='add'>+		if (lcn &lt; compacted_2b) {</div><div class='add'>+			amortizedshift = 1;</div><div class='add'>+		} else {</div><div class='add'>+			pos += compacted_2b * 2;</div><div class='add'>+			lcn -= compacted_2b;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	pos += lcn * (1 &lt;&lt; amortizedshift);</div><div class='add'>+</div><div class='add'>+	/* figure out the lcluster count in this pack */</div><div class='add'>+	if (1 &lt;&lt; amortizedshift == 4 &amp;&amp; lclusterbits &lt;= 14)</div><div class='ctx'> 		vcnt = 2;</div><div class='del'>-	else if (1 &lt;&lt; amortizedshift == 2 &amp;&amp; lclusterbits == 12)</div><div class='add'>+	else if (1 &lt;&lt; amortizedshift == 2 &amp;&amp; lclusterbits &lt;= 12)</div><div class='ctx'> 		vcnt = 16;</div><div class='ctx'> 	else</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='del'>-	big_pcluster = vi-&gt;z_advise &amp; Z_EROFS_ADVISE_BIG_PCLUSTER_1;</div><div class='del'>-	encodebits = ((vcnt &lt;&lt; amortizedshift) - sizeof(__le32)) * 8 / vcnt;</div><div class='del'>-	base = round_down(eofs, vcnt &lt;&lt; amortizedshift);</div><div class='del'>-	in = m-&gt;kaddr + base;</div><div class='add'>+	in = erofs_read_metabuf(&amp;m-&gt;map-&gt;buf, inode-&gt;i_sb, pos, m-&gt;in_mbox);</div><div class='add'>+	if (IS_ERR(in))</div><div class='add'>+		return PTR_ERR(in);</div><div class='ctx'> </div><div class='del'>-	i = (eofs - base) &gt;&gt; amortizedshift;</div><div class='add'>+	/* it doesn't equal to round_up(..) */</div><div class='add'>+	m-&gt;nextpackoff = round_down(pos, vcnt &lt;&lt; amortizedshift) +</div><div class='add'>+			 (vcnt &lt;&lt; amortizedshift);</div><div class='add'>+	lobits = max(lclusterbits, ilog2(Z_EROFS_LI_D0_CBLKCNT) + 1U);</div><div class='add'>+	encodebits = ((vcnt &lt;&lt; amortizedshift) - sizeof(__le32)) * 8 / vcnt;</div><div class='add'>+	bytes = pos &amp; ((vcnt &lt;&lt; amortizedshift) - 1);</div><div class='add'>+	in -= bytes;</div><div class='add'>+	i = bytes &gt;&gt; amortizedshift;</div><div class='ctx'> </div><div class='del'>-	lo = decode_compactedbits(lclusterbits, lomask,</div><div class='del'>-				  in, encodebits * i, &amp;type);</div><div class='add'>+	lo = decode_compactedbits(lobits, in, encodebits * i, &amp;type);</div><div class='ctx'> 	m-&gt;type = type;</div><div class='del'>-	if (type == Z_EROFS_VLE_CLUSTER_TYPE_NONHEAD) {</div><div class='add'>+	if (type == Z_EROFS_LCLUSTER_TYPE_NONHEAD) {</div><div class='ctx'> 		m-&gt;clusterofs = 1 &lt;&lt; lclusterbits;</div><div class='ctx'> </div><div class='ctx'> 		/* figure out lookahead_distance: delta[1] if needed */</div><div class='ctx'> 		if (lookahead)</div><div class='del'>-			m-&gt;delta[1] = get_compacted_la_distance(lclusterbits,</div><div class='add'>+			m-&gt;delta[1] = get_compacted_la_distance(lobits,</div><div class='ctx'> 						encodebits, vcnt, in, i);</div><div class='del'>-		if (lo &amp; Z_EROFS_VLE_DI_D0_CBLKCNT) {</div><div class='add'>+		if (lo &amp; Z_EROFS_LI_D0_CBLKCNT) {</div><div class='ctx'> 			if (!big_pcluster) {</div><div class='ctx'> 				DBG_BUGON(1);</div><div class='ctx'> 				return -EFSCORRUPTED;</div><div class='ctx'> 			}</div><div class='del'>-			m-&gt;compressedlcs = lo &amp; ~Z_EROFS_VLE_DI_D0_CBLKCNT;</div><div class='add'>+			m-&gt;compressedblks = lo &amp; ~Z_EROFS_LI_D0_CBLKCNT;</div><div class='ctx'> 			m-&gt;delta[0] = 1;</div><div class='ctx'> 			return 0;</div><div class='ctx'> 		} else if (i + 1 != (int)vcnt) {</div><div class='hunk'>@@ -294,11 +181,11 @@ static int unpack_compacted_index(struct z_erofs_maprecorder *m,</div><div class='ctx'> 		 * of which lo saves delta[1] rather than delta[0].</div><div class='ctx'> 		 * Hence, get delta[0] by the previous lcluster indirectly.</div><div class='ctx'> 		 */</div><div class='del'>-		lo = decode_compactedbits(lclusterbits, lomask,</div><div class='del'>-					  in, encodebits * (i - 1), &amp;type);</div><div class='del'>-		if (type != Z_EROFS_VLE_CLUSTER_TYPE_NONHEAD)</div><div class='add'>+		lo = decode_compactedbits(lobits, in,</div><div class='add'>+					  encodebits * (i - 1), &amp;type);</div><div class='add'>+		if (type != Z_EROFS_LCLUSTER_TYPE_NONHEAD)</div><div class='ctx'> 			lo = 0;</div><div class='del'>-		else if (lo &amp; Z_EROFS_VLE_DI_D0_CBLKCNT)</div><div class='add'>+		else if (lo &amp; Z_EROFS_LI_D0_CBLKCNT)</div><div class='ctx'> 			lo = 1;</div><div class='ctx'> 		m-&gt;delta[0] = lo + 1;</div><div class='ctx'> 		return 0;</div><div class='hunk'>@@ -310,9 +197,9 @@ static int unpack_compacted_index(struct z_erofs_maprecorder *m,</div><div class='ctx'> 		nblk = 1;</div><div class='ctx'> 		while (i &gt; 0) {</div><div class='ctx'> 			--i;</div><div class='del'>-			lo = decode_compactedbits(lclusterbits, lomask,</div><div class='del'>-						  in, encodebits * i, &amp;type);</div><div class='del'>-			if (type == Z_EROFS_VLE_CLUSTER_TYPE_NONHEAD)</div><div class='add'>+			lo = decode_compactedbits(lobits, in,</div><div class='add'>+						  encodebits * i, &amp;type);</div><div class='add'>+			if (type == Z_EROFS_LCLUSTER_TYPE_NONHEAD)</div><div class='ctx'> 				i -= lo;</div><div class='ctx'> </div><div class='ctx'> 			if (i &gt;= 0)</div><div class='hunk'>@@ -322,12 +209,12 @@ static int unpack_compacted_index(struct z_erofs_maprecorder *m,</div><div class='ctx'> 		nblk = 0;</div><div class='ctx'> 		while (i &gt; 0) {</div><div class='ctx'> 			--i;</div><div class='del'>-			lo = decode_compactedbits(lclusterbits, lomask,</div><div class='del'>-						  in, encodebits * i, &amp;type);</div><div class='del'>-			if (type == Z_EROFS_VLE_CLUSTER_TYPE_NONHEAD) {</div><div class='del'>-				if (lo &amp; Z_EROFS_VLE_DI_D0_CBLKCNT) {</div><div class='add'>+			lo = decode_compactedbits(lobits, in,</div><div class='add'>+						  encodebits * i, &amp;type);</div><div class='add'>+			if (type == Z_EROFS_LCLUSTER_TYPE_NONHEAD) {</div><div class='add'>+				if (lo &amp; Z_EROFS_LI_D0_CBLKCNT) {</div><div class='ctx'> 					--i;</div><div class='del'>-					nblk += lo &amp; ~Z_EROFS_VLE_DI_D0_CBLKCNT;</div><div class='add'>+					nblk += lo &amp; ~Z_EROFS_LI_D0_CBLKCNT;</div><div class='ctx'> 					continue;</div><div class='ctx'> 				}</div><div class='ctx'> 				/* bigpcluster shouldn't have plain d0 == 1 */</div><div class='hunk'>@@ -346,198 +233,118 @@ static int unpack_compacted_index(struct z_erofs_maprecorder *m,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int compacted_load_cluster_from_disk(struct z_erofs_maprecorder *m,</div><div class='del'>-					    unsigned long lcn, bool lookahead)</div><div class='add'>+static int z_erofs_load_lcluster_from_disk(struct z_erofs_maprecorder *m,</div><div class='add'>+					   unsigned int lcn, bool lookahead)</div><div class='ctx'> {</div><div class='del'>-	struct inode *const inode = m-&gt;inode;</div><div class='del'>-	struct erofs_inode *const vi = EROFS_I(inode);</div><div class='del'>-	const unsigned int lclusterbits = vi-&gt;z_logical_clusterbits;</div><div class='del'>-	const erofs_off_t ebase = ALIGN(iloc(EROFS_I_SB(inode), vi-&gt;nid) +</div><div class='del'>-					vi-&gt;inode_isize + vi-&gt;xattr_isize, 8) +</div><div class='del'>-		sizeof(struct z_erofs_map_header);</div><div class='del'>-	const unsigned int totalidx = DIV_ROUND_UP(inode-&gt;i_size, EROFS_BLKSIZ);</div><div class='del'>-	unsigned int compacted_4b_initial, compacted_2b;</div><div class='del'>-	unsigned int amortizedshift;</div><div class='del'>-	erofs_off_t pos;</div><div class='add'>+	struct erofs_inode *vi = EROFS_I(m-&gt;inode);</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	if (lclusterbits != 12)</div><div class='del'>-		return -EOPNOTSUPP;</div><div class='del'>-</div><div class='del'>-	if (lcn &gt;= totalidx)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	m-&gt;lcn = lcn;</div><div class='del'>-	/* used to align to 32-byte (compacted_2b) alignment */</div><div class='del'>-	compacted_4b_initial = (32 - ebase % 32) / 4;</div><div class='del'>-	if (compacted_4b_initial == 32 / 4)</div><div class='del'>-		compacted_4b_initial = 0;</div><div class='del'>-</div><div class='del'>-	if ((vi-&gt;z_advise &amp; Z_EROFS_ADVISE_COMPACTED_2B) &amp;&amp;</div><div class='del'>-	    compacted_4b_initial &lt; totalidx)</div><div class='del'>-		compacted_2b = rounddown(totalidx - compacted_4b_initial, 16);</div><div class='del'>-	else</div><div class='del'>-		compacted_2b = 0;</div><div class='del'>-</div><div class='del'>-	pos = ebase;</div><div class='del'>-	if (lcn &lt; compacted_4b_initial) {</div><div class='del'>-		amortizedshift = 2;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	pos += compacted_4b_initial * 4;</div><div class='del'>-	lcn -= compacted_4b_initial;</div><div class='del'>-</div><div class='del'>-	if (lcn &lt; compacted_2b) {</div><div class='del'>-		amortizedshift = 1;</div><div class='del'>-		goto out;</div><div class='add'>+	if (vi-&gt;datalayout == EROFS_INODE_COMPRESSED_COMPACT) {</div><div class='add'>+		err = z_erofs_load_compact_lcluster(m, lcn, lookahead);</div><div class='add'>+	} else {</div><div class='add'>+		DBG_BUGON(vi-&gt;datalayout != EROFS_INODE_COMPRESSED_FULL);</div><div class='add'>+		err = z_erofs_load_full_lcluster(m, lcn);</div><div class='ctx'> 	}</div><div class='del'>-	pos += compacted_2b * 2;</div><div class='del'>-	lcn -= compacted_2b;</div><div class='del'>-	amortizedshift = 2;</div><div class='del'>-out:</div><div class='del'>-	pos += lcn * (1 &lt;&lt; amortizedshift);</div><div class='del'>-	err = z_erofs_reload_indexes(m, erofs_blknr(pos));</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='del'>-	return unpack_compacted_index(m, amortizedshift, erofs_blkoff(pos),</div><div class='del'>-				      lookahead);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int z_erofs_load_cluster_from_disk(struct z_erofs_maprecorder *m,</div><div class='del'>-					  unsigned int lcn, bool lookahead)</div><div class='del'>-{</div><div class='del'>-	const unsigned int datamode = EROFS_I(m-&gt;inode)-&gt;datalayout;</div><div class='ctx'> </div><div class='del'>-	if (datamode == EROFS_INODE_FLAT_COMPRESSION_LEGACY)</div><div class='del'>-		return legacy_load_cluster_from_disk(m, lcn);</div><div class='del'>-</div><div class='del'>-	if (datamode == EROFS_INODE_FLAT_COMPRESSION)</div><div class='del'>-		return compacted_load_cluster_from_disk(m, lcn, lookahead);</div><div class='del'>-</div><div class='del'>-	return -EINVAL;</div><div class='add'>+	if (m-&gt;type &gt;= Z_EROFS_LCLUSTER_TYPE_MAX) {</div><div class='add'>+		erofs_err(m-&gt;inode-&gt;i_sb, "unknown type %u @ lcn %u of nid %llu",</div><div class='add'>+			  m-&gt;type, lcn, EROFS_I(m-&gt;inode)-&gt;nid);</div><div class='add'>+		DBG_BUGON(1);</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+	} else if (m-&gt;type != Z_EROFS_LCLUSTER_TYPE_NONHEAD &amp;&amp;</div><div class='add'>+		   m-&gt;clusterofs &gt;= (1 &lt;&lt; vi-&gt;z_lclusterbits)) {</div><div class='add'>+		DBG_BUGON(1);</div><div class='add'>+		return -EFSCORRUPTED;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int z_erofs_extent_lookback(struct z_erofs_maprecorder *m,</div><div class='ctx'> 				   unsigned int lookback_distance)</div><div class='ctx'> {</div><div class='add'>+	struct super_block *sb = m-&gt;inode-&gt;i_sb;</div><div class='ctx'> 	struct erofs_inode *const vi = EROFS_I(m-&gt;inode);</div><div class='del'>-	struct erofs_map_blocks *const map = m-&gt;map;</div><div class='del'>-	const unsigned int lclusterbits = vi-&gt;z_logical_clusterbits;</div><div class='del'>-	unsigned long lcn = m-&gt;lcn;</div><div class='del'>-	int err;</div><div class='add'>+	const unsigned int lclusterbits = vi-&gt;z_lclusterbits;</div><div class='ctx'> </div><div class='del'>-	if (lcn &lt; lookback_distance) {</div><div class='del'>-		erofs_err(m-&gt;inode-&gt;i_sb,</div><div class='del'>-			  "bogus lookback distance @ nid %llu", vi-&gt;nid);</div><div class='del'>-		DBG_BUGON(1);</div><div class='del'>-		return -EFSCORRUPTED;</div><div class='del'>-	}</div><div class='add'>+	while (m-&gt;lcn &gt;= lookback_distance) {</div><div class='add'>+		unsigned long lcn = m-&gt;lcn - lookback_distance;</div><div class='add'>+		int err;</div><div class='ctx'> </div><div class='del'>-	/* load extent head logical cluster if needed */</div><div class='del'>-	lcn -= lookback_distance;</div><div class='del'>-	err = z_erofs_load_cluster_from_disk(m, lcn, false);</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='add'>+		if (!lookback_distance)</div><div class='add'>+			break;</div><div class='ctx'> </div><div class='del'>-	switch (m-&gt;type) {</div><div class='del'>-	case Z_EROFS_VLE_CLUSTER_TYPE_NONHEAD:</div><div class='del'>-		if (!m-&gt;delta[0]) {</div><div class='del'>-			erofs_err(m-&gt;inode-&gt;i_sb,</div><div class='del'>-				  "invalid lookback distance 0 @ nid %llu",</div><div class='del'>-				  vi-&gt;nid);</div><div class='del'>-			DBG_BUGON(1);</div><div class='del'>-			return -EFSCORRUPTED;</div><div class='add'>+		err = z_erofs_load_lcluster_from_disk(m, lcn, false);</div><div class='add'>+		if (err)</div><div class='add'>+			return err;</div><div class='add'>+		if (m-&gt;type == Z_EROFS_LCLUSTER_TYPE_NONHEAD) {</div><div class='add'>+			lookback_distance = m-&gt;delta[0];</div><div class='add'>+			continue;</div><div class='ctx'> 		}</div><div class='del'>-		return z_erofs_extent_lookback(m, m-&gt;delta[0]);</div><div class='del'>-	case Z_EROFS_VLE_CLUSTER_TYPE_PLAIN:</div><div class='del'>-	case Z_EROFS_VLE_CLUSTER_TYPE_HEAD1:</div><div class='del'>-	case Z_EROFS_VLE_CLUSTER_TYPE_HEAD2:</div><div class='ctx'> 		m-&gt;headtype = m-&gt;type;</div><div class='del'>-		map-&gt;m_la = (lcn &lt;&lt; lclusterbits) | m-&gt;clusterofs;</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		erofs_err(m-&gt;inode-&gt;i_sb,</div><div class='del'>-			  "unknown type %u @ lcn %lu of nid %llu",</div><div class='del'>-			  m-&gt;type, lcn, vi-&gt;nid);</div><div class='del'>-		DBG_BUGON(1);</div><div class='del'>-		return -EOPNOTSUPP;</div><div class='add'>+		m-&gt;map-&gt;m_la = (lcn &lt;&lt; lclusterbits) | m-&gt;clusterofs;</div><div class='add'>+		return 0;</div><div class='ctx'> 	}</div><div class='del'>-	return 0;</div><div class='add'>+	erofs_err(sb, "bogus lookback distance %u @ lcn %lu of nid %llu",</div><div class='add'>+		  lookback_distance, m-&gt;lcn, vi-&gt;nid);</div><div class='add'>+	DBG_BUGON(1);</div><div class='add'>+	return -EFSCORRUPTED;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int z_erofs_get_extent_compressedlen(struct z_erofs_maprecorder *m,</div><div class='ctx'> 					    unsigned int initial_lcn)</div><div class='ctx'> {</div><div class='del'>-	struct erofs_inode *const vi = EROFS_I(m-&gt;inode);</div><div class='del'>-	struct erofs_map_blocks *const map = m-&gt;map;</div><div class='del'>-	const unsigned int lclusterbits = vi-&gt;z_logical_clusterbits;</div><div class='del'>-	unsigned long lcn;</div><div class='add'>+	struct inode *inode = m-&gt;inode;</div><div class='add'>+	struct super_block *sb = inode-&gt;i_sb;</div><div class='add'>+	struct erofs_inode *vi = EROFS_I(inode);</div><div class='add'>+	bool bigpcl1 = vi-&gt;z_advise &amp; Z_EROFS_ADVISE_BIG_PCLUSTER_1;</div><div class='add'>+	bool bigpcl2 = vi-&gt;z_advise &amp; Z_EROFS_ADVISE_BIG_PCLUSTER_2;</div><div class='add'>+	unsigned long lcn = m-&gt;lcn + 1;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	DBG_BUGON(m-&gt;type != Z_EROFS_VLE_CLUSTER_TYPE_PLAIN &amp;&amp;</div><div class='del'>-		  m-&gt;type != Z_EROFS_VLE_CLUSTER_TYPE_HEAD1 &amp;&amp;</div><div class='del'>-		  m-&gt;type != Z_EROFS_VLE_CLUSTER_TYPE_HEAD2);</div><div class='add'>+	DBG_BUGON(m-&gt;type == Z_EROFS_LCLUSTER_TYPE_NONHEAD);</div><div class='ctx'> 	DBG_BUGON(m-&gt;type != m-&gt;headtype);</div><div class='ctx'> </div><div class='del'>-	if (m-&gt;headtype == Z_EROFS_VLE_CLUSTER_TYPE_PLAIN ||</div><div class='del'>-	    ((m-&gt;headtype == Z_EROFS_VLE_CLUSTER_TYPE_HEAD1) &amp;&amp;</div><div class='del'>-	     !(vi-&gt;z_advise &amp; Z_EROFS_ADVISE_BIG_PCLUSTER_1)) ||</div><div class='del'>-	    ((m-&gt;headtype == Z_EROFS_VLE_CLUSTER_TYPE_HEAD2) &amp;&amp;</div><div class='del'>-	     !(vi-&gt;z_advise &amp; Z_EROFS_ADVISE_BIG_PCLUSTER_2))) {</div><div class='del'>-		map-&gt;m_plen = 1 &lt;&lt; lclusterbits;</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-	lcn = m-&gt;lcn + 1;</div><div class='del'>-	if (m-&gt;compressedlcs)</div><div class='add'>+	if ((m-&gt;headtype == Z_EROFS_LCLUSTER_TYPE_HEAD1 &amp;&amp; !bigpcl1) ||</div><div class='add'>+	    ((m-&gt;headtype == Z_EROFS_LCLUSTER_TYPE_PLAIN ||</div><div class='add'>+	      m-&gt;headtype == Z_EROFS_LCLUSTER_TYPE_HEAD2) &amp;&amp; !bigpcl2) ||</div><div class='add'>+	    (lcn &lt;&lt; vi-&gt;z_lclusterbits) &gt;= inode-&gt;i_size)</div><div class='add'>+		m-&gt;compressedblks = 1;</div><div class='add'>+</div><div class='add'>+	if (m-&gt;compressedblks)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	err = z_erofs_load_cluster_from_disk(m, lcn, false);</div><div class='add'>+	err = z_erofs_load_lcluster_from_disk(m, lcn, false);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If the 1st NONHEAD lcluster has already been handled initially w/o</div><div class='del'>-	 * valid compressedlcs, which means at least it mustn't be CBLKCNT, or</div><div class='add'>+	 * valid compressedblks, which means at least it mustn't be CBLKCNT, or</div><div class='ctx'> 	 * an internal implemenatation error is detected.</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * The following code can also handle it properly anyway, but let's</div><div class='ctx'> 	 * BUG_ON in the debugging mode only for developers to notice that.</div><div class='ctx'> 	 */</div><div class='ctx'> 	DBG_BUGON(lcn == initial_lcn &amp;&amp;</div><div class='del'>-		  m-&gt;type == Z_EROFS_VLE_CLUSTER_TYPE_NONHEAD);</div><div class='add'>+		  m-&gt;type == Z_EROFS_LCLUSTER_TYPE_NONHEAD);</div><div class='ctx'> </div><div class='del'>-	switch (m-&gt;type) {</div><div class='del'>-	case Z_EROFS_VLE_CLUSTER_TYPE_PLAIN:</div><div class='del'>-	case Z_EROFS_VLE_CLUSTER_TYPE_HEAD1:</div><div class='del'>-	case Z_EROFS_VLE_CLUSTER_TYPE_HEAD2:</div><div class='del'>-		/*</div><div class='del'>-		 * if the 1st NONHEAD lcluster is actually PLAIN or HEAD type</div><div class='del'>-		 * rather than CBLKCNT, it's a 1 lcluster-sized pcluster.</div><div class='del'>-		 */</div><div class='del'>-		m-&gt;compressedlcs = 1;</div><div class='del'>-		break;</div><div class='del'>-	case Z_EROFS_VLE_CLUSTER_TYPE_NONHEAD:</div><div class='del'>-		if (m-&gt;delta[0] != 1)</div><div class='del'>-			goto err_bonus_cblkcnt;</div><div class='del'>-		if (m-&gt;compressedlcs)</div><div class='del'>-			break;</div><div class='del'>-		fallthrough;</div><div class='del'>-	default:</div><div class='del'>-		erofs_err(m-&gt;inode-&gt;i_sb,</div><div class='del'>-			  "cannot found CBLKCNT @ lcn %lu of nid %llu",</div><div class='del'>-			  lcn, vi-&gt;nid);</div><div class='add'>+	if (m-&gt;type == Z_EROFS_LCLUSTER_TYPE_NONHEAD &amp;&amp; m-&gt;delta[0] != 1) {</div><div class='add'>+		erofs_err(sb, "bogus CBLKCNT @ lcn %lu of nid %llu", lcn, vi-&gt;nid);</div><div class='ctx'> 		DBG_BUGON(1);</div><div class='ctx'> 		return -EFSCORRUPTED;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * if the 1st NONHEAD lcluster is actually PLAIN or HEAD type rather</div><div class='add'>+	 * than CBLKCNT, it's a 1 block-sized pcluster.</div><div class='add'>+	 */</div><div class='add'>+	if (m-&gt;type != Z_EROFS_LCLUSTER_TYPE_NONHEAD || !m-&gt;compressedblks)</div><div class='add'>+		m-&gt;compressedblks = 1;</div><div class='ctx'> out:</div><div class='del'>-	map-&gt;m_plen = m-&gt;compressedlcs &lt;&lt; lclusterbits;</div><div class='add'>+	m-&gt;map-&gt;m_plen = erofs_pos(sb, m-&gt;compressedblks);</div><div class='ctx'> 	return 0;</div><div class='del'>-err_bonus_cblkcnt:</div><div class='del'>-	erofs_err(m-&gt;inode-&gt;i_sb,</div><div class='del'>-		  "bogus CBLKCNT @ lcn %lu of nid %llu",</div><div class='del'>-		  lcn, vi-&gt;nid);</div><div class='del'>-	DBG_BUGON(1);</div><div class='del'>-	return -EFSCORRUPTED;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int z_erofs_get_extent_decompressedlen(struct z_erofs_maprecorder *m)</div><div class='hunk'>@@ -545,154 +352,416 @@ static int z_erofs_get_extent_decompressedlen(struct z_erofs_maprecorder *m)</div><div class='ctx'> 	struct inode *inode = m-&gt;inode;</div><div class='ctx'> 	struct erofs_inode *vi = EROFS_I(inode);</div><div class='ctx'> 	struct erofs_map_blocks *map = m-&gt;map;</div><div class='del'>-	unsigned int lclusterbits = vi-&gt;z_logical_clusterbits;</div><div class='add'>+	unsigned int lclusterbits = vi-&gt;z_lclusterbits;</div><div class='ctx'> 	u64 lcn = m-&gt;lcn, headlcn = map-&gt;m_la &gt;&gt; lclusterbits;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	do {</div><div class='add'>+	while (1) {</div><div class='ctx'> 		/* handle the last EOF pcluster (no next HEAD lcluster) */</div><div class='ctx'> 		if ((lcn &lt;&lt; lclusterbits) &gt;= inode-&gt;i_size) {</div><div class='ctx'> 			map-&gt;m_llen = inode-&gt;i_size - map-&gt;m_la;</div><div class='ctx'> 			return 0;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		err = z_erofs_load_cluster_from_disk(m, lcn, true);</div><div class='add'>+		err = z_erofs_load_lcluster_from_disk(m, lcn, true);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			return err;</div><div class='ctx'> </div><div class='del'>-		if (m-&gt;type == Z_EROFS_VLE_CLUSTER_TYPE_NONHEAD) {</div><div class='del'>-			DBG_BUGON(!m-&gt;delta[1] &amp;&amp;</div><div class='del'>-				  m-&gt;clusterofs != 1 &lt;&lt; lclusterbits);</div><div class='del'>-		} else if (m-&gt;type == Z_EROFS_VLE_CLUSTER_TYPE_PLAIN ||</div><div class='del'>-			   m-&gt;type == Z_EROFS_VLE_CLUSTER_TYPE_HEAD1 ||</div><div class='del'>-			   m-&gt;type == Z_EROFS_VLE_CLUSTER_TYPE_HEAD2) {</div><div class='del'>-			/* go on until the next HEAD lcluster */</div><div class='add'>+		if (m-&gt;type == Z_EROFS_LCLUSTER_TYPE_NONHEAD) {</div><div class='add'>+			/* work around invalid d1 generated by pre-1.0 mkfs */</div><div class='add'>+			if (unlikely(!m-&gt;delta[1])) {</div><div class='add'>+				m-&gt;delta[1] = 1;</div><div class='add'>+				DBG_BUGON(1);</div><div class='add'>+			}</div><div class='add'>+		} else if (m-&gt;type &lt; Z_EROFS_LCLUSTER_TYPE_MAX) {</div><div class='ctx'> 			if (lcn != headlcn)</div><div class='del'>-				break;</div><div class='add'>+				break;	/* ends at the next HEAD lcluster */</div><div class='ctx'> 			m-&gt;delta[1] = 1;</div><div class='del'>-		} else {</div><div class='del'>-			erofs_err(inode-&gt;i_sb, "unknown type %u @ lcn %llu of nid %llu",</div><div class='del'>-				  m-&gt;type, lcn, vi-&gt;nid);</div><div class='del'>-			DBG_BUGON(1);</div><div class='del'>-			return -EOPNOTSUPP;</div><div class='ctx'> 		}</div><div class='ctx'> 		lcn += m-&gt;delta[1];</div><div class='del'>-	} while (m-&gt;delta[1]);</div><div class='del'>-</div><div class='add'>+	}</div><div class='ctx'> 	map-&gt;m_llen = (lcn &lt;&lt; lclusterbits) + m-&gt;clusterofs - map-&gt;m_la;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int z_erofs_map_blocks_iter(struct inode *inode,</div><div class='del'>-			    struct erofs_map_blocks *map,</div><div class='del'>-			    int flags)</div><div class='add'>+static int z_erofs_map_blocks_fo(struct inode *inode,</div><div class='add'>+				 struct erofs_map_blocks *map, int flags)</div><div class='ctx'> {</div><div class='del'>-	struct erofs_inode *const vi = EROFS_I(inode);</div><div class='add'>+	struct erofs_inode *vi = EROFS_I(inode);</div><div class='add'>+	struct super_block *sb = inode-&gt;i_sb;</div><div class='add'>+	bool fragment = vi-&gt;z_advise &amp; Z_EROFS_ADVISE_FRAGMENT_PCLUSTER;</div><div class='add'>+	bool ztailpacking = vi-&gt;z_idata_size;</div><div class='add'>+	unsigned int lclusterbits = vi-&gt;z_lclusterbits;</div><div class='ctx'> 	struct z_erofs_maprecorder m = {</div><div class='ctx'> 		.inode = inode,</div><div class='ctx'> 		.map = map,</div><div class='add'>+		.in_mbox = erofs_inode_in_metabox(inode),</div><div class='ctx'> 	};</div><div class='del'>-	int err = 0;</div><div class='del'>-	unsigned int lclusterbits, endoff;</div><div class='add'>+	unsigned int endoff;</div><div class='ctx'> 	unsigned long initial_lcn;</div><div class='ctx'> 	unsigned long long ofs, end;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='del'>-	trace_z_erofs_map_blocks_iter_enter(inode, map, flags);</div><div class='del'>-</div><div class='del'>-	/* when trying to read beyond EOF, leave it unmapped */</div><div class='del'>-	if (map-&gt;m_la &gt;= inode-&gt;i_size) {</div><div class='del'>-		map-&gt;m_llen = map-&gt;m_la + 1 - inode-&gt;i_size;</div><div class='del'>-		map-&gt;m_la = inode-&gt;i_size;</div><div class='del'>-		map-&gt;m_flags = 0;</div><div class='del'>-		goto out;</div><div class='add'>+	ofs = flags &amp; EROFS_GET_BLOCKS_FINDTAIL ? inode-&gt;i_size - 1 : map-&gt;m_la;</div><div class='add'>+	if (fragment &amp;&amp; !(flags &amp; EROFS_GET_BLOCKS_FINDTAIL) &amp;&amp;</div><div class='add'>+	    !vi-&gt;z_tailextent_headlcn) {</div><div class='add'>+		map-&gt;m_la = 0;</div><div class='add'>+		map-&gt;m_llen = inode-&gt;i_size;</div><div class='add'>+		map-&gt;m_flags = EROFS_MAP_FRAGMENT;</div><div class='add'>+		return 0;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	err = z_erofs_fill_inode_lazy(inode);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	lclusterbits = vi-&gt;z_logical_clusterbits;</div><div class='del'>-	ofs = map-&gt;m_la;</div><div class='ctx'> 	initial_lcn = ofs &gt;&gt; lclusterbits;</div><div class='ctx'> 	endoff = ofs &amp; ((1 &lt;&lt; lclusterbits) - 1);</div><div class='ctx'> </div><div class='del'>-	err = z_erofs_load_cluster_from_disk(&amp;m, initial_lcn, false);</div><div class='add'>+	err = z_erofs_load_lcluster_from_disk(&amp;m, initial_lcn, false);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto unmap_out;</div><div class='ctx'> </div><div class='add'>+	if ((flags &amp; EROFS_GET_BLOCKS_FINDTAIL) &amp;&amp; ztailpacking)</div><div class='add'>+		vi-&gt;z_fragmentoff = m.nextpackoff;</div><div class='ctx'> 	map-&gt;m_flags = EROFS_MAP_MAPPED | EROFS_MAP_ENCODED;</div><div class='ctx'> 	end = (m.lcn + 1ULL) &lt;&lt; lclusterbits;</div><div class='ctx'> </div><div class='del'>-	switch (m.type) {</div><div class='del'>-	case Z_EROFS_VLE_CLUSTER_TYPE_PLAIN:</div><div class='del'>-	case Z_EROFS_VLE_CLUSTER_TYPE_HEAD1:</div><div class='del'>-	case Z_EROFS_VLE_CLUSTER_TYPE_HEAD2:</div><div class='del'>-		if (endoff &gt;= m.clusterofs) {</div><div class='del'>-			m.headtype = m.type;</div><div class='del'>-			map-&gt;m_la = (m.lcn &lt;&lt; lclusterbits) | m.clusterofs;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		/* m.lcn should be &gt;= 1 if endoff &lt; m.clusterofs */</div><div class='del'>-		if (!m.lcn) {</div><div class='del'>-			erofs_err(inode-&gt;i_sb,</div><div class='del'>-				  "invalid logical cluster 0 at nid %llu",</div><div class='del'>-				  vi-&gt;nid);</div><div class='del'>-			err = -EFSCORRUPTED;</div><div class='del'>-			goto unmap_out;</div><div class='add'>+	if (m.type != Z_EROFS_LCLUSTER_TYPE_NONHEAD &amp;&amp; endoff &gt;= m.clusterofs) {</div><div class='add'>+		m.headtype = m.type;</div><div class='add'>+		map-&gt;m_la = (m.lcn &lt;&lt; lclusterbits) | m.clusterofs;</div><div class='add'>+		/*</div><div class='add'>+		 * For ztailpacking files, in order to inline data more</div><div class='add'>+		 * effectively, special EOF lclusters are now supported</div><div class='add'>+		 * which can have three parts at most.</div><div class='add'>+		 */</div><div class='add'>+		if (ztailpacking &amp;&amp; end &gt; inode-&gt;i_size)</div><div class='add'>+			end = inode-&gt;i_size;</div><div class='add'>+	} else {</div><div class='add'>+		if (m.type != Z_EROFS_LCLUSTER_TYPE_NONHEAD) {</div><div class='add'>+			end = (m.lcn &lt;&lt; lclusterbits) | m.clusterofs;</div><div class='add'>+			map-&gt;m_flags |= EROFS_MAP_FULL_MAPPED;</div><div class='add'>+			m.delta[0] = 1;</div><div class='ctx'> 		}</div><div class='del'>-		end = (m.lcn &lt;&lt; lclusterbits) | m.clusterofs;</div><div class='del'>-		map-&gt;m_flags |= EROFS_MAP_FULL_MAPPED;</div><div class='del'>-		m.delta[0] = 1;</div><div class='del'>-		fallthrough;</div><div class='del'>-	case Z_EROFS_VLE_CLUSTER_TYPE_NONHEAD:</div><div class='ctx'> 		/* get the corresponding first chunk */</div><div class='ctx'> 		err = z_erofs_extent_lookback(&amp;m, m.delta[0]);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto unmap_out;</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		erofs_err(inode-&gt;i_sb,</div><div class='del'>-			  "unknown type %u @ offset %llu of nid %llu",</div><div class='del'>-			  m.type, ofs, vi-&gt;nid);</div><div class='del'>-		err = -EOPNOTSUPP;</div><div class='del'>-		goto unmap_out;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='add'>+	if (m.partialref)</div><div class='add'>+		map-&gt;m_flags |= EROFS_MAP_PARTIAL_REF;</div><div class='ctx'> 	map-&gt;m_llen = end - map-&gt;m_la;</div><div class='del'>-	map-&gt;m_pa = blknr_to_addr(m.pblk);</div><div class='ctx'> </div><div class='del'>-	err = z_erofs_get_extent_compressedlen(&amp;m, initial_lcn);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out;</div><div class='add'>+	if (flags &amp; EROFS_GET_BLOCKS_FINDTAIL) {</div><div class='add'>+		vi-&gt;z_tailextent_headlcn = m.lcn;</div><div class='add'>+		/* for non-compact indexes, fragmentoff is 64 bits */</div><div class='add'>+		if (fragment &amp;&amp; vi-&gt;datalayout == EROFS_INODE_COMPRESSED_FULL)</div><div class='add'>+			vi-&gt;z_fragmentoff |= (u64)m.pblk &lt;&lt; 32;</div><div class='add'>+	}</div><div class='add'>+	if (ztailpacking &amp;&amp; m.lcn == vi-&gt;z_tailextent_headlcn) {</div><div class='add'>+		map-&gt;m_flags |= EROFS_MAP_META;</div><div class='add'>+		map-&gt;m_pa = vi-&gt;z_fragmentoff;</div><div class='add'>+		map-&gt;m_plen = vi-&gt;z_idata_size;</div><div class='add'>+		if (erofs_blkoff(sb, map-&gt;m_pa) + map-&gt;m_plen &gt; sb-&gt;s_blocksize) {</div><div class='add'>+			erofs_err(sb, "ztailpacking inline data across blocks @ nid %llu",</div><div class='add'>+				  vi-&gt;nid);</div><div class='add'>+			err = -EFSCORRUPTED;</div><div class='add'>+			goto unmap_out;</div><div class='add'>+		}</div><div class='add'>+	} else if (fragment &amp;&amp; m.lcn == vi-&gt;z_tailextent_headlcn) {</div><div class='add'>+		map-&gt;m_flags = EROFS_MAP_FRAGMENT;</div><div class='add'>+	} else {</div><div class='add'>+		map-&gt;m_pa = erofs_pos(sb, m.pblk);</div><div class='add'>+		err = z_erofs_get_extent_compressedlen(&amp;m, initial_lcn);</div><div class='add'>+		if (err)</div><div class='add'>+			goto unmap_out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (m.headtype == Z_EROFS_VLE_CLUSTER_TYPE_PLAIN)</div><div class='del'>-		map-&gt;m_algorithmformat = Z_EROFS_COMPRESSION_SHIFTED;</div><div class='del'>-	else if (m.headtype == Z_EROFS_VLE_CLUSTER_TYPE_HEAD2)</div><div class='add'>+	if (m.headtype == Z_EROFS_LCLUSTER_TYPE_PLAIN) {</div><div class='add'>+		if (map-&gt;m_llen &gt; map-&gt;m_plen) {</div><div class='add'>+			DBG_BUGON(1);</div><div class='add'>+			err = -EFSCORRUPTED;</div><div class='add'>+			goto unmap_out;</div><div class='add'>+		}</div><div class='add'>+		if (vi-&gt;z_advise &amp; Z_EROFS_ADVISE_INTERLACED_PCLUSTER)</div><div class='add'>+			map-&gt;m_algorithmformat = Z_EROFS_COMPRESSION_INTERLACED;</div><div class='add'>+		else</div><div class='add'>+			map-&gt;m_algorithmformat = Z_EROFS_COMPRESSION_SHIFTED;</div><div class='add'>+	} else if (m.headtype == Z_EROFS_LCLUSTER_TYPE_HEAD2) {</div><div class='ctx'> 		map-&gt;m_algorithmformat = vi-&gt;z_algorithmtype[1];</div><div class='del'>-	else</div><div class='add'>+	} else {</div><div class='ctx'> 		map-&gt;m_algorithmformat = vi-&gt;z_algorithmtype[0];</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if ((flags &amp; EROFS_GET_BLOCKS_FIEMAP) ||</div><div class='ctx'> 	    ((flags &amp; EROFS_GET_BLOCKS_READMORE) &amp;&amp;</div><div class='del'>-	     map-&gt;m_algorithmformat == Z_EROFS_COMPRESSION_LZMA &amp;&amp;</div><div class='del'>-	     map-&gt;m_llen &gt;= EROFS_BLKSIZ)) {</div><div class='add'>+	     (map-&gt;m_algorithmformat == Z_EROFS_COMPRESSION_LZMA ||</div><div class='add'>+	      map-&gt;m_algorithmformat == Z_EROFS_COMPRESSION_DEFLATE ||</div><div class='add'>+	      map-&gt;m_algorithmformat == Z_EROFS_COMPRESSION_ZSTD) &amp;&amp;</div><div class='add'>+	      map-&gt;m_llen &gt;= i_blocksize(inode))) {</div><div class='ctx'> 		err = z_erofs_get_extent_decompressedlen(&amp;m);</div><div class='ctx'> 		if (!err)</div><div class='ctx'> 			map-&gt;m_flags |= EROFS_MAP_FULL_MAPPED;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> unmap_out:</div><div class='del'>-	if (m.kaddr)</div><div class='del'>-		kunmap_atomic(m.kaddr);</div><div class='add'>+	erofs_unmap_metabuf(&amp;m.map-&gt;buf);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	erofs_dbg("%s, m_la %llu m_pa %llu m_llen %llu m_plen %llu m_flags 0%o",</div><div class='del'>-		  __func__, map-&gt;m_la, map-&gt;m_pa,</div><div class='del'>-		  map-&gt;m_llen, map-&gt;m_plen, map-&gt;m_flags);</div><div class='add'>+static int z_erofs_map_blocks_ext(struct inode *inode,</div><div class='add'>+				  struct erofs_map_blocks *map, int flags)</div><div class='add'>+{</div><div class='add'>+	struct erofs_inode *vi = EROFS_I(inode);</div><div class='add'>+	struct super_block *sb = inode-&gt;i_sb;</div><div class='add'>+	bool interlaced = vi-&gt;z_advise &amp; Z_EROFS_ADVISE_INTERLACED_PCLUSTER;</div><div class='add'>+	unsigned int recsz = z_erofs_extent_recsize(vi-&gt;z_advise);</div><div class='add'>+	erofs_off_t pos = round_up(Z_EROFS_MAP_HEADER_END(erofs_iloc(inode) +</div><div class='add'>+				   vi-&gt;inode_isize + vi-&gt;xattr_isize), recsz);</div><div class='add'>+	bool in_mbox = erofs_inode_in_metabox(inode);</div><div class='add'>+	erofs_off_t lend = inode-&gt;i_size;</div><div class='add'>+	erofs_off_t l, r, mid, pa, la, lstart;</div><div class='add'>+	struct z_erofs_extent *ext;</div><div class='add'>+	unsigned int fmt;</div><div class='add'>+	bool last;</div><div class='add'>+</div><div class='add'>+	map-&gt;m_flags = 0;</div><div class='add'>+	if (recsz &lt;= offsetof(struct z_erofs_extent, pstart_hi)) {</div><div class='add'>+		if (recsz &lt;= offsetof(struct z_erofs_extent, pstart_lo)) {</div><div class='add'>+			ext = erofs_read_metabuf(&amp;map-&gt;buf, sb, pos, in_mbox);</div><div class='add'>+			if (IS_ERR(ext))</div><div class='add'>+				return PTR_ERR(ext);</div><div class='add'>+			pa = le64_to_cpu(*(__le64 *)ext);</div><div class='add'>+			pos += sizeof(__le64);</div><div class='add'>+			lstart = 0;</div><div class='add'>+		} else {</div><div class='add'>+			lstart = round_down(map-&gt;m_la, 1 &lt;&lt; vi-&gt;z_lclusterbits);</div><div class='add'>+			pos += (lstart &gt;&gt; vi-&gt;z_lclusterbits) * recsz;</div><div class='add'>+			pa = EROFS_NULL_ADDR;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		for (; lstart &lt;= map-&gt;m_la; lstart += 1 &lt;&lt; vi-&gt;z_lclusterbits) {</div><div class='add'>+			ext = erofs_read_metabuf(&amp;map-&gt;buf, sb, pos, in_mbox);</div><div class='add'>+			if (IS_ERR(ext))</div><div class='add'>+				return PTR_ERR(ext);</div><div class='add'>+			map-&gt;m_plen = le32_to_cpu(ext-&gt;plen);</div><div class='add'>+			if (pa != EROFS_NULL_ADDR) {</div><div class='add'>+				map-&gt;m_pa = pa;</div><div class='add'>+				pa += map-&gt;m_plen &amp; Z_EROFS_EXTENT_PLEN_MASK;</div><div class='add'>+			} else {</div><div class='add'>+				map-&gt;m_pa = le32_to_cpu(ext-&gt;pstart_lo);</div><div class='add'>+			}</div><div class='add'>+			pos += recsz;</div><div class='add'>+		}</div><div class='add'>+		last = (lstart &gt;= round_up(lend, 1 &lt;&lt; vi-&gt;z_lclusterbits));</div><div class='add'>+		lend = min(lstart, lend);</div><div class='add'>+		lstart -= 1 &lt;&lt; vi-&gt;z_lclusterbits;</div><div class='add'>+	} else {</div><div class='add'>+		lstart = lend;</div><div class='add'>+		for (l = 0, r = vi-&gt;z_extents; l &lt; r; ) {</div><div class='add'>+			mid = l + (r - l) / 2;</div><div class='add'>+			ext = erofs_read_metabuf(&amp;map-&gt;buf, sb,</div><div class='add'>+						 pos + mid * recsz, in_mbox);</div><div class='add'>+			if (IS_ERR(ext))</div><div class='add'>+				return PTR_ERR(ext);</div><div class='add'>+</div><div class='add'>+			la = le32_to_cpu(ext-&gt;lstart_lo);</div><div class='add'>+			pa = le32_to_cpu(ext-&gt;pstart_lo) |</div><div class='add'>+				(u64)le32_to_cpu(ext-&gt;pstart_hi) &lt;&lt; 32;</div><div class='add'>+			if (recsz &gt; offsetof(struct z_erofs_extent, lstart_hi))</div><div class='add'>+				la |= (u64)le32_to_cpu(ext-&gt;lstart_hi) &lt;&lt; 32;</div><div class='add'>+</div><div class='add'>+			if (la &gt; map-&gt;m_la) {</div><div class='add'>+				r = mid;</div><div class='add'>+				if (la &gt; lend) {</div><div class='add'>+					DBG_BUGON(1);</div><div class='add'>+					return -EFSCORRUPTED;</div><div class='add'>+				}</div><div class='add'>+				lend = la;</div><div class='add'>+			} else {</div><div class='add'>+				l = mid + 1;</div><div class='add'>+				if (map-&gt;m_la == la)</div><div class='add'>+					r = min(l + 1, r);</div><div class='add'>+				lstart = la;</div><div class='add'>+				map-&gt;m_plen = le32_to_cpu(ext-&gt;plen);</div><div class='add'>+				map-&gt;m_pa = pa;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+		last = (l &gt;= vi-&gt;z_extents);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (lstart &lt; lend) {</div><div class='add'>+		map-&gt;m_la = lstart;</div><div class='add'>+		if (last &amp;&amp; (vi-&gt;z_advise &amp; Z_EROFS_ADVISE_FRAGMENT_PCLUSTER)) {</div><div class='add'>+			map-&gt;m_flags = EROFS_MAP_FRAGMENT;</div><div class='add'>+			vi-&gt;z_fragmentoff = map-&gt;m_plen;</div><div class='add'>+			if (recsz &gt; offsetof(struct z_erofs_extent, pstart_lo))</div><div class='add'>+				vi-&gt;z_fragmentoff |= map-&gt;m_pa &lt;&lt; 32;</div><div class='add'>+		} else if (map-&gt;m_plen &amp; Z_EROFS_EXTENT_PLEN_MASK) {</div><div class='add'>+			map-&gt;m_flags |= EROFS_MAP_MAPPED |</div><div class='add'>+				EROFS_MAP_FULL_MAPPED | EROFS_MAP_ENCODED;</div><div class='add'>+			fmt = map-&gt;m_plen &gt;&gt; Z_EROFS_EXTENT_PLEN_FMT_BIT;</div><div class='add'>+			if (fmt)</div><div class='add'>+				map-&gt;m_algorithmformat = fmt - 1;</div><div class='add'>+			else if (interlaced &amp;&amp; !erofs_blkoff(sb, map-&gt;m_pa))</div><div class='add'>+				map-&gt;m_algorithmformat =</div><div class='add'>+					Z_EROFS_COMPRESSION_INTERLACED;</div><div class='add'>+			else</div><div class='add'>+				map-&gt;m_algorithmformat =</div><div class='add'>+					Z_EROFS_COMPRESSION_SHIFTED;</div><div class='add'>+			if (map-&gt;m_plen &amp; Z_EROFS_EXTENT_PLEN_PARTIAL)</div><div class='add'>+				map-&gt;m_flags |= EROFS_MAP_PARTIAL_REF;</div><div class='add'>+			map-&gt;m_plen &amp;= Z_EROFS_EXTENT_PLEN_MASK;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	map-&gt;m_llen = lend - map-&gt;m_la;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int z_erofs_fill_inode(struct inode *inode, struct erofs_map_blocks *map)</div><div class='add'>+{</div><div class='add'>+	struct erofs_inode *const vi = EROFS_I(inode);</div><div class='add'>+	struct super_block *const sb = inode-&gt;i_sb;</div><div class='add'>+	struct z_erofs_map_header *h;</div><div class='add'>+	erofs_off_t pos;</div><div class='add'>+	int err = 0;</div><div class='ctx'> </div><div class='del'>-	trace_z_erofs_map_blocks_iter_exit(inode, map, flags, err);</div><div class='add'>+	if (test_bit(EROFS_I_Z_INITED_BIT, &amp;vi-&gt;flags)) {</div><div class='add'>+		/*</div><div class='add'>+		 * paired with smp_mb() at the end of the function to ensure</div><div class='add'>+		 * fields will only be observed after the bit is set.</div><div class='add'>+		 */</div><div class='add'>+		smp_mb();</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (wait_on_bit_lock(&amp;vi-&gt;flags, EROFS_I_BL_Z_BIT, TASK_KILLABLE))</div><div class='add'>+		return -ERESTARTSYS;</div><div class='ctx'> </div><div class='del'>-	/* aggressively BUG_ON iff CONFIG_EROFS_FS_DEBUG is on */</div><div class='del'>-	DBG_BUGON(err &lt; 0 &amp;&amp; err != -ENOMEM);</div><div class='add'>+	if (test_bit(EROFS_I_Z_INITED_BIT, &amp;vi-&gt;flags))</div><div class='add'>+		goto out_unlock;</div><div class='add'>+</div><div class='add'>+	pos = ALIGN(erofs_iloc(inode) + vi-&gt;inode_isize + vi-&gt;xattr_isize, 8);</div><div class='add'>+	h = erofs_read_metabuf(&amp;map-&gt;buf, sb, pos, erofs_inode_in_metabox(inode));</div><div class='add'>+	if (IS_ERR(h)) {</div><div class='add'>+		err = PTR_ERR(h);</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * if the highest bit of the 8-byte map header is set, the whole file</div><div class='add'>+	 * is stored in the packed inode. The rest bits keeps z_fragmentoff.</div><div class='add'>+	 */</div><div class='add'>+	if (h-&gt;h_clusterbits &gt;&gt; Z_EROFS_FRAGMENT_INODE_BIT) {</div><div class='add'>+		vi-&gt;z_advise = Z_EROFS_ADVISE_FRAGMENT_PCLUSTER;</div><div class='add'>+		vi-&gt;z_fragmentoff = le64_to_cpu(*(__le64 *)h) ^ (1ULL &lt;&lt; 63);</div><div class='add'>+		vi-&gt;z_tailextent_headlcn = 0;</div><div class='add'>+		goto done;</div><div class='add'>+	}</div><div class='add'>+	vi-&gt;z_advise = le16_to_cpu(h-&gt;h_advise);</div><div class='add'>+	vi-&gt;z_lclusterbits = sb-&gt;s_blocksize_bits + (h-&gt;h_clusterbits &amp; 15);</div><div class='add'>+	if (vi-&gt;datalayout == EROFS_INODE_COMPRESSED_FULL &amp;&amp;</div><div class='add'>+	    (vi-&gt;z_advise &amp; Z_EROFS_ADVISE_EXTENTS)) {</div><div class='add'>+		vi-&gt;z_extents = le32_to_cpu(h-&gt;h_extents_lo) |</div><div class='add'>+			((u64)le16_to_cpu(h-&gt;h_extents_hi) &lt;&lt; 32);</div><div class='add'>+		goto done;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	vi-&gt;z_algorithmtype[0] = h-&gt;h_algorithmtype &amp; 15;</div><div class='add'>+	vi-&gt;z_algorithmtype[1] = h-&gt;h_algorithmtype &gt;&gt; 4;</div><div class='add'>+	if (vi-&gt;z_advise &amp; Z_EROFS_ADVISE_FRAGMENT_PCLUSTER)</div><div class='add'>+		vi-&gt;z_fragmentoff = le32_to_cpu(h-&gt;h_fragmentoff);</div><div class='add'>+	else if (vi-&gt;z_advise &amp; Z_EROFS_ADVISE_INLINE_PCLUSTER)</div><div class='add'>+		vi-&gt;z_idata_size = le16_to_cpu(h-&gt;h_idata_size);</div><div class='add'>+</div><div class='add'>+	if (!erofs_sb_has_big_pcluster(EROFS_SB(sb)) &amp;&amp;</div><div class='add'>+	    vi-&gt;z_advise &amp; (Z_EROFS_ADVISE_BIG_PCLUSTER_1 |</div><div class='add'>+			    Z_EROFS_ADVISE_BIG_PCLUSTER_2)) {</div><div class='add'>+		erofs_err(sb, "per-inode big pcluster without sb feature for nid %llu",</div><div class='add'>+			  vi-&gt;nid);</div><div class='add'>+		err = -EFSCORRUPTED;</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	}</div><div class='add'>+	if (vi-&gt;datalayout == EROFS_INODE_COMPRESSED_COMPACT &amp;&amp;</div><div class='add'>+	    !(vi-&gt;z_advise &amp; Z_EROFS_ADVISE_BIG_PCLUSTER_1) ^</div><div class='add'>+	    !(vi-&gt;z_advise &amp; Z_EROFS_ADVISE_BIG_PCLUSTER_2)) {</div><div class='add'>+		erofs_err(sb, "big pcluster head1/2 of compact indexes should be consistent for nid %llu",</div><div class='add'>+			  vi-&gt;nid);</div><div class='add'>+		err = -EFSCORRUPTED;</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (vi-&gt;z_idata_size ||</div><div class='add'>+	    (vi-&gt;z_advise &amp; Z_EROFS_ADVISE_FRAGMENT_PCLUSTER)) {</div><div class='add'>+		struct erofs_map_blocks tm = {</div><div class='add'>+			.buf = __EROFS_BUF_INITIALIZER</div><div class='add'>+		};</div><div class='add'>+</div><div class='add'>+		err = z_erofs_map_blocks_fo(inode, &amp;tm,</div><div class='add'>+					    EROFS_GET_BLOCKS_FINDTAIL);</div><div class='add'>+		erofs_put_metabuf(&amp;tm.buf);</div><div class='add'>+		if (err &lt; 0)</div><div class='add'>+			goto out_unlock;</div><div class='add'>+	}</div><div class='add'>+done:</div><div class='add'>+	/* paired with smp_mb() at the beginning of the function */</div><div class='add'>+	smp_mb();</div><div class='add'>+	set_bit(EROFS_I_Z_INITED_BIT, &amp;vi-&gt;flags);</div><div class='add'>+out_unlock:</div><div class='add'>+	clear_and_wake_up_bit(EROFS_I_BL_Z_BIT, &amp;vi-&gt;flags);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int z_erofs_map_sanity_check(struct inode *inode,</div><div class='add'>+				    struct erofs_map_blocks *map)</div><div class='add'>+{</div><div class='add'>+	struct erofs_sb_info *sbi = EROFS_I_SB(inode);</div><div class='add'>+	u64 pend;</div><div class='add'>+</div><div class='add'>+	if (!(map-&gt;m_flags &amp; EROFS_MAP_ENCODED))</div><div class='add'>+		return 0;</div><div class='add'>+	if (unlikely(map-&gt;m_algorithmformat &gt;= Z_EROFS_COMPRESSION_RUNTIME_MAX)) {</div><div class='add'>+		erofs_err(inode-&gt;i_sb, "unknown algorithm %d @ pos %llu for nid %llu, please upgrade kernel",</div><div class='add'>+			  map-&gt;m_algorithmformat, map-&gt;m_la, EROFS_I(inode)-&gt;nid);</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+	}</div><div class='add'>+	if (unlikely(map-&gt;m_algorithmformat &lt; Z_EROFS_COMPRESSION_MAX &amp;&amp;</div><div class='add'>+		     !(sbi-&gt;available_compr_algs &amp; (1 &lt;&lt; map-&gt;m_algorithmformat)))) {</div><div class='add'>+		erofs_err(inode-&gt;i_sb, "inconsistent algorithmtype %u for nid %llu",</div><div class='add'>+			  map-&gt;m_algorithmformat, EROFS_I(inode)-&gt;nid);</div><div class='add'>+		return -EFSCORRUPTED;</div><div class='add'>+	}</div><div class='add'>+	if (unlikely(map-&gt;m_plen &gt; Z_EROFS_PCLUSTER_MAX_SIZE ||</div><div class='add'>+		     map-&gt;m_llen &gt; Z_EROFS_PCLUSTER_MAX_DSIZE))</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+	/* Filesystems beyond 48-bit physical block addresses are invalid */</div><div class='add'>+	if (unlikely(check_add_overflow(map-&gt;m_pa, map-&gt;m_plen, &amp;pend) ||</div><div class='add'>+		     (pend &gt;&gt; sbi-&gt;blkszbits) &gt;= BIT_ULL(48)))</div><div class='add'>+		return -EFSCORRUPTED;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int z_erofs_map_blocks_iter(struct inode *inode, struct erofs_map_blocks *map,</div><div class='add'>+			    int flags)</div><div class='add'>+{</div><div class='add'>+	struct erofs_inode *const vi = EROFS_I(inode);</div><div class='add'>+	int err = 0;</div><div class='add'>+</div><div class='add'>+	trace_erofs_map_blocks_enter(inode, map, flags);</div><div class='add'>+	if (map-&gt;m_la &gt;= inode-&gt;i_size) {	/* post-EOF unmapped extent */</div><div class='add'>+		map-&gt;m_llen = map-&gt;m_la + 1 - inode-&gt;i_size;</div><div class='add'>+		map-&gt;m_la = inode-&gt;i_size;</div><div class='add'>+		map-&gt;m_flags = 0;</div><div class='add'>+	} else {</div><div class='add'>+		err = z_erofs_fill_inode(inode, map);</div><div class='add'>+		if (!err) {</div><div class='add'>+			if (vi-&gt;datalayout == EROFS_INODE_COMPRESSED_FULL &amp;&amp;</div><div class='add'>+			    (vi-&gt;z_advise &amp; Z_EROFS_ADVISE_EXTENTS))</div><div class='add'>+				err = z_erofs_map_blocks_ext(inode, map, flags);</div><div class='add'>+			else</div><div class='add'>+				err = z_erofs_map_blocks_fo(inode, map, flags);</div><div class='add'>+		}</div><div class='add'>+		if (!err)</div><div class='add'>+			err = z_erofs_map_sanity_check(inode, map);</div><div class='add'>+		if (err)</div><div class='add'>+			map-&gt;m_llen = 0;</div><div class='add'>+	}</div><div class='add'>+	trace_erofs_map_blocks_exit(inode, map, flags, err);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -704,8 +773,7 @@ static int z_erofs_iomap_begin_report(struct inode *inode, loff_t offset,</div><div class='ctx'> 	struct erofs_map_blocks map = { .m_la = offset };</div><div class='ctx'> </div><div class='ctx'> 	ret = z_erofs_map_blocks_iter(inode, &amp;map, EROFS_GET_BLOCKS_FIEMAP);</div><div class='del'>-	if (map.mpage)</div><div class='del'>-		put_page(map.mpage);</div><div class='add'>+	erofs_put_metabuf(&amp;map.buf);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='hunk'>@@ -714,17 +782,22 @@ static int z_erofs_iomap_begin_report(struct inode *inode, loff_t offset,</div><div class='ctx'> 	iomap-&gt;length = map.m_llen;</div><div class='ctx'> 	if (map.m_flags &amp; EROFS_MAP_MAPPED) {</div><div class='ctx'> 		iomap-&gt;type = IOMAP_MAPPED;</div><div class='del'>-		iomap-&gt;addr = map.m_pa;</div><div class='add'>+		iomap-&gt;addr = map.m_flags &amp; __EROFS_MAP_FRAGMENT ?</div><div class='add'>+			      IOMAP_NULL_ADDR : map.m_pa;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		iomap-&gt;type = IOMAP_HOLE;</div><div class='ctx'> 		iomap-&gt;addr = IOMAP_NULL_ADDR;</div><div class='ctx'> 		/*</div><div class='del'>-		 * No strict rule how to describe extents for post EOF, yet</div><div class='del'>-		 * we need do like below. Otherwise, iomap itself will get</div><div class='add'>+		 * No strict rule on how to describe extents for post EOF, yet</div><div class='add'>+		 * we need to do like below. Otherwise, iomap itself will get</div><div class='ctx'> 		 * into an endless loop on post EOF.</div><div class='add'>+		 *</div><div class='add'>+		 * Calculate the effective offset by subtracting extent start</div><div class='add'>+		 * (map.m_la) from the requested offset, and add it to length.</div><div class='add'>+		 * (NB: offset &gt;= map.m_la always)</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (iomap-&gt;offset &gt;= inode-&gt;i_size)</div><div class='del'>-			iomap-&gt;length = length + map.m_la - offset;</div><div class='add'>+			iomap-&gt;length = length + offset - map.m_la;</div><div class='ctx'> 	}</div><div class='ctx'> 	iomap-&gt;flags = 0;</div><div class='ctx'> 	return 0;</div><div class='head'>diff --git a/fs/erofs/zpvec.h b/fs/erofs/zpvec.h<br/>deleted file mode 100644<br/>index dfd7fe0503bb..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/erofs/zpvec.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/erofs/zpvec.h</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,152 +0,0 @@</div><div class='del'>-/* SPDX-License-Identifier: GPL-2.0-only */</div><div class='del'>-/*</div><div class='del'>- * Copyright (C) 2018 HUAWEI, Inc.</div><div class='del'>- *             https://www.huawei.com/</div><div class='del'>- */</div><div class='del'>-#ifndef __EROFS_FS_ZPVEC_H</div><div class='del'>-#define __EROFS_FS_ZPVEC_H</div><div class='del'>-</div><div class='del'>-#include "tagptr.h"</div><div class='del'>-</div><div class='del'>-/* page type in pagevec for decompress subsystem */</div><div class='del'>-enum z_erofs_page_type {</div><div class='del'>-	/* including Z_EROFS_VLE_PAGE_TAIL_EXCLUSIVE */</div><div class='del'>-	Z_EROFS_PAGE_TYPE_EXCLUSIVE,</div><div class='del'>-</div><div class='del'>-	Z_EROFS_VLE_PAGE_TYPE_TAIL_SHARED,</div><div class='del'>-</div><div class='del'>-	Z_EROFS_VLE_PAGE_TYPE_HEAD,</div><div class='del'>-	Z_EROFS_VLE_PAGE_TYPE_MAX</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-extern void __compiletime_error("Z_EROFS_PAGE_TYPE_EXCLUSIVE != 0")</div><div class='del'>-	__bad_page_type_exclusive(void);</div><div class='del'>-</div><div class='del'>-/* pagevec tagged pointer */</div><div class='del'>-typedef tagptr2_t	erofs_vtptr_t;</div><div class='del'>-</div><div class='del'>-/* pagevec collector */</div><div class='del'>-struct z_erofs_pagevec_ctor {</div><div class='del'>-	struct page *curr, *next;</div><div class='del'>-	erofs_vtptr_t *pages;</div><div class='del'>-</div><div class='del'>-	unsigned int nr, index;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static inline void z_erofs_pagevec_ctor_exit(struct z_erofs_pagevec_ctor *ctor,</div><div class='del'>-					     bool atomic)</div><div class='del'>-{</div><div class='del'>-	if (!ctor-&gt;curr)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	if (atomic)</div><div class='del'>-		kunmap_atomic(ctor-&gt;pages);</div><div class='del'>-	else</div><div class='del'>-		kunmap(ctor-&gt;curr);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline struct page *</div><div class='del'>-z_erofs_pagevec_ctor_next_page(struct z_erofs_pagevec_ctor *ctor,</div><div class='del'>-			       unsigned int nr)</div><div class='del'>-{</div><div class='del'>-	unsigned int index;</div><div class='del'>-</div><div class='del'>-	/* keep away from occupied pages */</div><div class='del'>-	if (ctor-&gt;next)</div><div class='del'>-		return ctor-&gt;next;</div><div class='del'>-</div><div class='del'>-	for (index = 0; index &lt; nr; ++index) {</div><div class='del'>-		const erofs_vtptr_t t = ctor-&gt;pages[index];</div><div class='del'>-		const unsigned int tags = tagptr_unfold_tags(t);</div><div class='del'>-</div><div class='del'>-		if (tags == Z_EROFS_PAGE_TYPE_EXCLUSIVE)</div><div class='del'>-			return tagptr_unfold_ptr(t);</div><div class='del'>-	}</div><div class='del'>-	DBG_BUGON(nr &gt;= ctor-&gt;nr);</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void</div><div class='del'>-z_erofs_pagevec_ctor_pagedown(struct z_erofs_pagevec_ctor *ctor,</div><div class='del'>-			      bool atomic)</div><div class='del'>-{</div><div class='del'>-	struct page *next = z_erofs_pagevec_ctor_next_page(ctor, ctor-&gt;nr);</div><div class='del'>-</div><div class='del'>-	z_erofs_pagevec_ctor_exit(ctor, atomic);</div><div class='del'>-</div><div class='del'>-	ctor-&gt;curr = next;</div><div class='del'>-	ctor-&gt;next = NULL;</div><div class='del'>-	ctor-&gt;pages = atomic ?</div><div class='del'>-		kmap_atomic(ctor-&gt;curr) : kmap(ctor-&gt;curr);</div><div class='del'>-</div><div class='del'>-	ctor-&gt;nr = PAGE_SIZE / sizeof(struct page *);</div><div class='del'>-	ctor-&gt;index = 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void z_erofs_pagevec_ctor_init(struct z_erofs_pagevec_ctor *ctor,</div><div class='del'>-					     unsigned int nr,</div><div class='del'>-					     erofs_vtptr_t *pages,</div><div class='del'>-					     unsigned int i)</div><div class='del'>-{</div><div class='del'>-	ctor-&gt;nr = nr;</div><div class='del'>-	ctor-&gt;curr = ctor-&gt;next = NULL;</div><div class='del'>-	ctor-&gt;pages = pages;</div><div class='del'>-</div><div class='del'>-	if (i &gt;= nr) {</div><div class='del'>-		i -= nr;</div><div class='del'>-		z_erofs_pagevec_ctor_pagedown(ctor, false);</div><div class='del'>-		while (i &gt; ctor-&gt;nr) {</div><div class='del'>-			i -= ctor-&gt;nr;</div><div class='del'>-			z_erofs_pagevec_ctor_pagedown(ctor, false);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	ctor-&gt;next = z_erofs_pagevec_ctor_next_page(ctor, i);</div><div class='del'>-	ctor-&gt;index = i;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline bool z_erofs_pagevec_enqueue(struct z_erofs_pagevec_ctor *ctor,</div><div class='del'>-					   struct page *page,</div><div class='del'>-					   enum z_erofs_page_type type)</div><div class='del'>-{</div><div class='del'>-	if (!ctor-&gt;next &amp;&amp; type)</div><div class='del'>-		if (ctor-&gt;index + 1 == ctor-&gt;nr)</div><div class='del'>-			return false;</div><div class='del'>-</div><div class='del'>-	if (ctor-&gt;index &gt;= ctor-&gt;nr)</div><div class='del'>-		z_erofs_pagevec_ctor_pagedown(ctor, false);</div><div class='del'>-</div><div class='del'>-	/* exclusive page type must be 0 */</div><div class='del'>-	if (Z_EROFS_PAGE_TYPE_EXCLUSIVE != (uintptr_t)NULL)</div><div class='del'>-		__bad_page_type_exclusive();</div><div class='del'>-</div><div class='del'>-	/* should remind that collector-&gt;next never equal to 1, 2 */</div><div class='del'>-	if (type == (uintptr_t)ctor-&gt;next) {</div><div class='del'>-		ctor-&gt;next = page;</div><div class='del'>-	}</div><div class='del'>-	ctor-&gt;pages[ctor-&gt;index++] = tagptr_fold(erofs_vtptr_t, page, type);</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline struct page *</div><div class='del'>-z_erofs_pagevec_dequeue(struct z_erofs_pagevec_ctor *ctor,</div><div class='del'>-			enum z_erofs_page_type *type)</div><div class='del'>-{</div><div class='del'>-	erofs_vtptr_t t;</div><div class='del'>-</div><div class='del'>-	if (ctor-&gt;index &gt;= ctor-&gt;nr) {</div><div class='del'>-		DBG_BUGON(!ctor-&gt;next);</div><div class='del'>-		z_erofs_pagevec_ctor_pagedown(ctor, true);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	t = ctor-&gt;pages[ctor-&gt;index];</div><div class='del'>-</div><div class='del'>-	*type = tagptr_unfold_tags(t);</div><div class='del'>-</div><div class='del'>-	/* should remind that collector-&gt;next never equal to 1, 2 */</div><div class='del'>-	if (*type == (uintptr_t)ctor-&gt;next)</div><div class='del'>-		ctor-&gt;next = tagptr_unfold_ptr(t);</div><div class='del'>-</div><div class='del'>-	ctor-&gt;pages[ctor-&gt;index++] = tagptr_fold(erofs_vtptr_t, NULL, 0);</div><div class='del'>-	return tagptr_unfold_ptr(t);</div><div class='del'>-}</div><div class='del'>-#endif</div><div class='head'>diff --git a/fs/erofs/zutil.c b/fs/erofs/zutil.c<br/>new file mode 100644<br/>index 000000000000..55ff2ab5128e<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/erofs/zutil.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/erofs/zutil.c</a></div><div class='hunk'>@@ -0,0 +1,317 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-only</div><div class='add'>+/*</div><div class='add'>+ * Copyright (C) 2018 HUAWEI, Inc.</div><div class='add'>+ *             https://www.huawei.com/</div><div class='add'>+ * Copyright (C) 2024 Alibaba Cloud</div><div class='add'>+ */</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+struct z_erofs_gbuf {</div><div class='add'>+	spinlock_t lock;</div><div class='add'>+	void *ptr;</div><div class='add'>+	struct page **pages;</div><div class='add'>+	unsigned int nrpages;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static struct z_erofs_gbuf *z_erofs_gbufpool, *z_erofs_rsvbuf;</div><div class='add'>+static unsigned int z_erofs_gbuf_count, z_erofs_gbuf_nrpages,</div><div class='add'>+		z_erofs_rsv_nrpages;</div><div class='add'>+</div><div class='add'>+module_param_named(global_buffers, z_erofs_gbuf_count, uint, 0444);</div><div class='add'>+module_param_named(reserved_pages, z_erofs_rsv_nrpages, uint, 0444);</div><div class='add'>+</div><div class='add'>+atomic_long_t erofs_global_shrink_cnt;	/* for all mounted instances */</div><div class='add'>+</div><div class='add'>+/* protects `erofs_sb_list_lock` and the mounted `erofs_sb_list` */</div><div class='add'>+static DEFINE_SPINLOCK(erofs_sb_list_lock);</div><div class='add'>+static LIST_HEAD(erofs_sb_list);</div><div class='add'>+static unsigned int shrinker_run_no;</div><div class='add'>+static struct shrinker *erofs_shrinker_info;</div><div class='add'>+</div><div class='add'>+static unsigned int z_erofs_gbuf_id(void)</div><div class='add'>+{</div><div class='add'>+	return raw_smp_processor_id() % z_erofs_gbuf_count;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void *z_erofs_get_gbuf(unsigned int requiredpages)</div><div class='add'>+	__acquires(gbuf-&gt;lock)</div><div class='add'>+{</div><div class='add'>+	struct z_erofs_gbuf *gbuf;</div><div class='add'>+</div><div class='add'>+	migrate_disable();</div><div class='add'>+	gbuf = &amp;z_erofs_gbufpool[z_erofs_gbuf_id()];</div><div class='add'>+	spin_lock(&amp;gbuf-&gt;lock);</div><div class='add'>+	/* check if the buffer is too small */</div><div class='add'>+	if (requiredpages &gt; gbuf-&gt;nrpages) {</div><div class='add'>+		spin_unlock(&amp;gbuf-&gt;lock);</div><div class='add'>+		migrate_enable();</div><div class='add'>+		/* (for sparse checker) pretend gbuf-&gt;lock is still taken */</div><div class='add'>+		__acquire(gbuf-&gt;lock);</div><div class='add'>+		return NULL;</div><div class='add'>+	}</div><div class='add'>+	return gbuf-&gt;ptr;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void z_erofs_put_gbuf(void *ptr) __releases(gbuf-&gt;lock)</div><div class='add'>+{</div><div class='add'>+	struct z_erofs_gbuf *gbuf;</div><div class='add'>+</div><div class='add'>+	gbuf = &amp;z_erofs_gbufpool[z_erofs_gbuf_id()];</div><div class='add'>+	DBG_BUGON(gbuf-&gt;ptr != ptr);</div><div class='add'>+	spin_unlock(&amp;gbuf-&gt;lock);</div><div class='add'>+	migrate_enable();</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int z_erofs_gbuf_growsize(unsigned int nrpages)</div><div class='add'>+{</div><div class='add'>+	static DEFINE_MUTEX(gbuf_resize_mutex);</div><div class='add'>+	struct page **tmp_pages = NULL;</div><div class='add'>+	struct z_erofs_gbuf *gbuf;</div><div class='add'>+	void *ptr, *old_ptr;</div><div class='add'>+	int last, i, j;</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;gbuf_resize_mutex);</div><div class='add'>+	/* avoid shrinking gbufs, since no idea how many fses rely on */</div><div class='add'>+	if (nrpages &lt;= z_erofs_gbuf_nrpages) {</div><div class='add'>+		mutex_unlock(&amp;gbuf_resize_mutex);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; z_erofs_gbuf_count; ++i) {</div><div class='add'>+		gbuf = &amp;z_erofs_gbufpool[i];</div><div class='add'>+		tmp_pages = kcalloc(nrpages, sizeof(*tmp_pages), GFP_KERNEL);</div><div class='add'>+		if (!tmp_pages)</div><div class='add'>+			goto out;</div><div class='add'>+</div><div class='add'>+		for (j = 0; j &lt; gbuf-&gt;nrpages; ++j)</div><div class='add'>+			tmp_pages[j] = gbuf-&gt;pages[j];</div><div class='add'>+		do {</div><div class='add'>+			last = j;</div><div class='add'>+			j = alloc_pages_bulk(GFP_KERNEL, nrpages,</div><div class='add'>+					     tmp_pages);</div><div class='add'>+			if (last == j)</div><div class='add'>+				goto out;</div><div class='add'>+		} while (j != nrpages);</div><div class='add'>+</div><div class='add'>+		ptr = vmap(tmp_pages, nrpages, VM_MAP, PAGE_KERNEL);</div><div class='add'>+		if (!ptr)</div><div class='add'>+			goto out;</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;gbuf-&gt;lock);</div><div class='add'>+		kfree(gbuf-&gt;pages);</div><div class='add'>+		gbuf-&gt;pages = tmp_pages;</div><div class='add'>+		old_ptr = gbuf-&gt;ptr;</div><div class='add'>+		gbuf-&gt;ptr = ptr;</div><div class='add'>+		gbuf-&gt;nrpages = nrpages;</div><div class='add'>+		spin_unlock(&amp;gbuf-&gt;lock);</div><div class='add'>+		if (old_ptr)</div><div class='add'>+			vunmap(old_ptr);</div><div class='add'>+	}</div><div class='add'>+	z_erofs_gbuf_nrpages = nrpages;</div><div class='add'>+out:</div><div class='add'>+	if (i &lt; z_erofs_gbuf_count &amp;&amp; tmp_pages) {</div><div class='add'>+		for (j = 0; j &lt; nrpages; ++j)</div><div class='add'>+			if (tmp_pages[j] &amp;&amp; (j &gt;= gbuf-&gt;nrpages ||</div><div class='add'>+					     tmp_pages[j] != gbuf-&gt;pages[j]))</div><div class='add'>+				__free_page(tmp_pages[j]);</div><div class='add'>+		kfree(tmp_pages);</div><div class='add'>+	}</div><div class='add'>+	mutex_unlock(&amp;gbuf_resize_mutex);</div><div class='add'>+	return i &lt; z_erofs_gbuf_count ? -ENOMEM : 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int __init z_erofs_gbuf_init(void)</div><div class='add'>+{</div><div class='add'>+	unsigned int i, total = num_possible_cpus();</div><div class='add'>+</div><div class='add'>+	if (z_erofs_gbuf_count)</div><div class='add'>+		total = min(z_erofs_gbuf_count, total);</div><div class='add'>+	z_erofs_gbuf_count = total;</div><div class='add'>+</div><div class='add'>+	/* The last (special) global buffer is the reserved buffer */</div><div class='add'>+	total += !!z_erofs_rsv_nrpages;</div><div class='add'>+</div><div class='add'>+	z_erofs_gbufpool = kcalloc(total, sizeof(*z_erofs_gbufpool),</div><div class='add'>+				   GFP_KERNEL);</div><div class='add'>+	if (!z_erofs_gbufpool)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	if (z_erofs_rsv_nrpages) {</div><div class='add'>+		z_erofs_rsvbuf = &amp;z_erofs_gbufpool[total - 1];</div><div class='add'>+		z_erofs_rsvbuf-&gt;pages = kcalloc(z_erofs_rsv_nrpages,</div><div class='add'>+				sizeof(*z_erofs_rsvbuf-&gt;pages), GFP_KERNEL);</div><div class='add'>+		if (!z_erofs_rsvbuf-&gt;pages) {</div><div class='add'>+			z_erofs_rsvbuf = NULL;</div><div class='add'>+			z_erofs_rsv_nrpages = 0;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	for (i = 0; i &lt; total; ++i)</div><div class='add'>+		spin_lock_init(&amp;z_erofs_gbufpool[i].lock);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void z_erofs_gbuf_exit(void)</div><div class='add'>+{</div><div class='add'>+	int i, j;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; z_erofs_gbuf_count + (!!z_erofs_rsvbuf); ++i) {</div><div class='add'>+		struct z_erofs_gbuf *gbuf = &amp;z_erofs_gbufpool[i];</div><div class='add'>+</div><div class='add'>+		if (gbuf-&gt;ptr) {</div><div class='add'>+			vunmap(gbuf-&gt;ptr);</div><div class='add'>+			gbuf-&gt;ptr = NULL;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (!gbuf-&gt;pages)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		for (j = 0; j &lt; gbuf-&gt;nrpages; ++j)</div><div class='add'>+			if (gbuf-&gt;pages[j])</div><div class='add'>+				put_page(gbuf-&gt;pages[j]);</div><div class='add'>+		kfree(gbuf-&gt;pages);</div><div class='add'>+		gbuf-&gt;pages = NULL;</div><div class='add'>+	}</div><div class='add'>+	kfree(z_erofs_gbufpool);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct page *__erofs_allocpage(struct page **pagepool, gfp_t gfp, bool tryrsv)</div><div class='add'>+{</div><div class='add'>+	struct page *page = *pagepool;</div><div class='add'>+</div><div class='add'>+	if (page) {</div><div class='add'>+		*pagepool = (struct page *)page_private(page);</div><div class='add'>+	} else if (tryrsv &amp;&amp; z_erofs_rsvbuf &amp;&amp; z_erofs_rsvbuf-&gt;nrpages) {</div><div class='add'>+		spin_lock(&amp;z_erofs_rsvbuf-&gt;lock);</div><div class='add'>+		if (z_erofs_rsvbuf-&gt;nrpages)</div><div class='add'>+			page = z_erofs_rsvbuf-&gt;pages[--z_erofs_rsvbuf-&gt;nrpages];</div><div class='add'>+		spin_unlock(&amp;z_erofs_rsvbuf-&gt;lock);</div><div class='add'>+	}</div><div class='add'>+	if (!page)</div><div class='add'>+		page = alloc_page(gfp);</div><div class='add'>+	DBG_BUGON(page &amp;&amp; page_ref_count(page) != 1);</div><div class='add'>+	return page;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void erofs_release_pages(struct page **pagepool)</div><div class='add'>+{</div><div class='add'>+	while (*pagepool) {</div><div class='add'>+		struct page *page = *pagepool;</div><div class='add'>+</div><div class='add'>+		*pagepool = (struct page *)page_private(page);</div><div class='add'>+		/* try to fill reserved global pool first */</div><div class='add'>+		if (z_erofs_rsvbuf &amp;&amp; z_erofs_rsvbuf-&gt;nrpages &lt;</div><div class='add'>+				z_erofs_rsv_nrpages) {</div><div class='add'>+			spin_lock(&amp;z_erofs_rsvbuf-&gt;lock);</div><div class='add'>+			if (z_erofs_rsvbuf-&gt;nrpages &lt; z_erofs_rsv_nrpages) {</div><div class='add'>+				z_erofs_rsvbuf-&gt;pages[z_erofs_rsvbuf-&gt;nrpages++]</div><div class='add'>+						= page;</div><div class='add'>+				spin_unlock(&amp;z_erofs_rsvbuf-&gt;lock);</div><div class='add'>+				continue;</div><div class='add'>+			}</div><div class='add'>+			spin_unlock(&amp;z_erofs_rsvbuf-&gt;lock);</div><div class='add'>+		}</div><div class='add'>+		put_page(page);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void erofs_shrinker_register(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct erofs_sb_info *sbi = EROFS_SB(sb);</div><div class='add'>+</div><div class='add'>+	mutex_init(&amp;sbi-&gt;umount_mutex);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;erofs_sb_list_lock);</div><div class='add'>+	list_add(&amp;sbi-&gt;list, &amp;erofs_sb_list);</div><div class='add'>+	spin_unlock(&amp;erofs_sb_list_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void erofs_shrinker_unregister(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct erofs_sb_info *const sbi = EROFS_SB(sb);</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;sbi-&gt;umount_mutex);</div><div class='add'>+	while (!xa_empty(&amp;sbi-&gt;managed_pslots)) {</div><div class='add'>+		z_erofs_shrink_scan(sbi, ~0UL);</div><div class='add'>+		cond_resched();</div><div class='add'>+	}</div><div class='add'>+	spin_lock(&amp;erofs_sb_list_lock);</div><div class='add'>+	list_del(&amp;sbi-&gt;list);</div><div class='add'>+	spin_unlock(&amp;erofs_sb_list_lock);</div><div class='add'>+	mutex_unlock(&amp;sbi-&gt;umount_mutex);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static unsigned long erofs_shrink_count(struct shrinker *shrink,</div><div class='add'>+					struct shrink_control *sc)</div><div class='add'>+{</div><div class='add'>+	return atomic_long_read(&amp;erofs_global_shrink_cnt) ?: SHRINK_EMPTY;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static unsigned long erofs_shrink_scan(struct shrinker *shrink,</div><div class='add'>+				       struct shrink_control *sc)</div><div class='add'>+{</div><div class='add'>+	struct erofs_sb_info *sbi;</div><div class='add'>+	struct list_head *p;</div><div class='add'>+</div><div class='add'>+	unsigned long nr = sc-&gt;nr_to_scan;</div><div class='add'>+	unsigned int run_no;</div><div class='add'>+	unsigned long freed = 0;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;erofs_sb_list_lock);</div><div class='add'>+	do {</div><div class='add'>+		run_no = ++shrinker_run_no;</div><div class='add'>+	} while (run_no == 0);</div><div class='add'>+</div><div class='add'>+	/* Iterate over all mounted superblocks and try to shrink them */</div><div class='add'>+	p = erofs_sb_list.next;</div><div class='add'>+	while (p != &amp;erofs_sb_list) {</div><div class='add'>+		sbi = list_entry(p, struct erofs_sb_info, list);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * We move the ones we do to the end of the list, so we stop</div><div class='add'>+		 * when we see one we have already done.</div><div class='add'>+		 */</div><div class='add'>+		if (sbi-&gt;shrinker_run_no == run_no)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		if (!mutex_trylock(&amp;sbi-&gt;umount_mutex)) {</div><div class='add'>+			p = p-&gt;next;</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		spin_unlock(&amp;erofs_sb_list_lock);</div><div class='add'>+		sbi-&gt;shrinker_run_no = run_no;</div><div class='add'>+		freed += z_erofs_shrink_scan(sbi, nr - freed);</div><div class='add'>+		spin_lock(&amp;erofs_sb_list_lock);</div><div class='add'>+		/* Get the next list element before we move this one */</div><div class='add'>+		p = p-&gt;next;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Move this one to the end of the list to provide some</div><div class='add'>+		 * fairness.</div><div class='add'>+		 */</div><div class='add'>+		list_move_tail(&amp;sbi-&gt;list, &amp;erofs_sb_list);</div><div class='add'>+		mutex_unlock(&amp;sbi-&gt;umount_mutex);</div><div class='add'>+</div><div class='add'>+		if (freed &gt;= nr)</div><div class='add'>+			break;</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;erofs_sb_list_lock);</div><div class='add'>+	return freed;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int __init erofs_init_shrinker(void)</div><div class='add'>+{</div><div class='add'>+	erofs_shrinker_info = shrinker_alloc(0, "erofs-shrinker");</div><div class='add'>+	if (!erofs_shrinker_info)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	erofs_shrinker_info-&gt;count_objects = erofs_shrink_count;</div><div class='add'>+	erofs_shrinker_info-&gt;scan_objects = erofs_shrink_scan;</div><div class='add'>+	shrinker_register(erofs_shrinker_info);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void erofs_exit_shrinker(void)</div><div class='add'>+{</div><div class='add'>+	shrinker_free(erofs_shrinker_info);</div><div class='add'>+}</div><div class='head'>diff --git a/fs/eventfd.c b/fs/eventfd.c<br/>index 3627dd7d25db..3219e0d596fe 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/eventfd.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/eventfd.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/eventfd.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/eventfd.c</a></div><div class='hunk'>@@ -33,10 +33,10 @@ struct eventfd_ctx {</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Every time that a write(2) is performed on an eventfd, the</div><div class='ctx'> 	 * value of the __u64 being written is added to "count" and a</div><div class='del'>-	 * wakeup is performed on "wqh". A read(2) will return the "count"</div><div class='del'>-	 * value to userspace, and will reset "count" to zero. The kernel</div><div class='del'>-	 * side eventfd_signal() also, adds to the "count" counter and</div><div class='del'>-	 * issue a wakeup.</div><div class='add'>+	 * wakeup is performed on "wqh". If EFD_SEMAPHORE flag was not</div><div class='add'>+	 * specified, a read(2) will return the "count" value to userspace,</div><div class='add'>+	 * and will reset "count" to zero. The kernel side eventfd_signal()</div><div class='add'>+	 * also, adds to the "count" counter and issue a wakeup.</div><div class='ctx'> 	 */</div><div class='ctx'> 	__u64 count;</div><div class='ctx'> 	unsigned int flags;</div><div class='hunk'>@@ -44,20 +44,16 @@ struct eventfd_ctx {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * eventfd_signal - Adds @n to the eventfd counter.</div><div class='add'>+ * eventfd_signal_mask - Increment the event counter</div><div class='ctx'>  * @ctx: [in] Pointer to the eventfd context.</div><div class='del'>- * @n: [in] Value of the counter to be added to the eventfd internal counter.</div><div class='del'>- *          The value cannot be negative.</div><div class='add'>+ * @mask: [in] poll mask</div><div class='ctx'>  *</div><div class='ctx'>  * This function is supposed to be called by the kernel in paths that do not</div><div class='ctx'>  * allow sleeping. In this function we allow the counter to reach the ULLONG_MAX</div><div class='ctx'>  * value, and we signal this as overflow condition by returning a EPOLLERR</div><div class='ctx'>  * to poll(2).</div><div class='del'>- *</div><div class='del'>- * Returns the amount by which the counter was incremented.  This will be less</div><div class='del'>- * than @n if the counter has overflowed.</div><div class='ctx'>  */</div><div class='del'>-__u64 eventfd_signal(struct eventfd_ctx *ctx, __u64 n)</div><div class='add'>+void eventfd_signal_mask(struct eventfd_ctx *ctx, __poll_t mask)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> </div><div class='hunk'>@@ -69,27 +65,24 @@ __u64 eventfd_signal(struct eventfd_ctx *ctx, __u64 n)</div><div class='ctx'> 	 * it returns false, the eventfd_signal() call should be deferred to a</div><div class='ctx'> 	 * safe context.</div><div class='ctx'> 	 */</div><div class='del'>-	if (WARN_ON_ONCE(current-&gt;in_eventfd_signal))</div><div class='del'>-		return 0;</div><div class='add'>+	if (WARN_ON_ONCE(current-&gt;in_eventfd))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock_irqsave(&amp;ctx-&gt;wqh.lock, flags);</div><div class='del'>-	current-&gt;in_eventfd_signal = 1;</div><div class='del'>-	if (ULLONG_MAX - ctx-&gt;count &lt; n)</div><div class='del'>-		n = ULLONG_MAX - ctx-&gt;count;</div><div class='del'>-	ctx-&gt;count += n;</div><div class='add'>+	current-&gt;in_eventfd = 1;</div><div class='add'>+	if (ctx-&gt;count &lt; ULLONG_MAX)</div><div class='add'>+		ctx-&gt;count++;</div><div class='ctx'> 	if (waitqueue_active(&amp;ctx-&gt;wqh))</div><div class='del'>-		wake_up_locked_poll(&amp;ctx-&gt;wqh, EPOLLIN);</div><div class='del'>-	current-&gt;in_eventfd_signal = 0;</div><div class='add'>+		wake_up_locked_poll(&amp;ctx-&gt;wqh, EPOLLIN | mask);</div><div class='add'>+	current-&gt;in_eventfd = 0;</div><div class='ctx'> 	spin_unlock_irqrestore(&amp;ctx-&gt;wqh.lock, flags);</div><div class='del'>-</div><div class='del'>-	return n;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL_GPL(eventfd_signal);</div><div class='add'>+EXPORT_SYMBOL_GPL(eventfd_signal_mask);</div><div class='ctx'> </div><div class='ctx'> static void eventfd_free_ctx(struct eventfd_ctx *ctx)</div><div class='ctx'> {</div><div class='ctx'> 	if (ctx-&gt;id &gt;= 0)</div><div class='del'>-		ida_simple_remove(&amp;eventfd_ida, ctx-&gt;id);</div><div class='add'>+		ida_free(&amp;eventfd_ida, ctx-&gt;id);</div><div class='ctx'> 	kfree(ctx);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -184,7 +177,7 @@ void eventfd_ctx_do_read(struct eventfd_ctx *ctx, __u64 *cnt)</div><div class='ctx'> {</div><div class='ctx'> 	lockdep_assert_held(&amp;ctx-&gt;wqh.lock);</div><div class='ctx'> </div><div class='del'>-	*cnt = (ctx-&gt;flags &amp; EFD_SEMAPHORE) ? 1 : ctx-&gt;count;</div><div class='add'>+	*cnt = ((ctx-&gt;flags &amp; EFD_SEMAPHORE) &amp;&amp; ctx-&gt;count) ? 1 : ctx-&gt;count;</div><div class='ctx'> 	ctx-&gt;count -= *cnt;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(eventfd_ctx_do_read);</div><div class='hunk'>@@ -223,7 +216,6 @@ static ssize_t eventfd_read(struct kiocb *iocb, struct iov_iter *to)</div><div class='ctx'> 	struct file *file = iocb-&gt;ki_filp;</div><div class='ctx'> 	struct eventfd_ctx *ctx = file-&gt;private_data;</div><div class='ctx'> 	__u64 ucnt = 0;</div><div class='del'>-	DECLARE_WAITQUEUE(wait, current);</div><div class='ctx'> </div><div class='ctx'> 	if (iov_iter_count(to) &lt; sizeof(ucnt))</div><div class='ctx'> 		return -EINVAL;</div><div class='hunk'>@@ -234,27 +226,17 @@ static ssize_t eventfd_read(struct kiocb *iocb, struct iov_iter *to)</div><div class='ctx'> 			spin_unlock_irq(&amp;ctx-&gt;wqh.lock);</div><div class='ctx'> 			return -EAGAIN;</div><div class='ctx'> 		}</div><div class='del'>-		__add_wait_queue(&amp;ctx-&gt;wqh, &amp;wait);</div><div class='del'>-		for (;;) {</div><div class='del'>-			set_current_state(TASK_INTERRUPTIBLE);</div><div class='del'>-			if (ctx-&gt;count)</div><div class='del'>-				break;</div><div class='del'>-			if (signal_pending(current)) {</div><div class='del'>-				__remove_wait_queue(&amp;ctx-&gt;wqh, &amp;wait);</div><div class='del'>-				__set_current_state(TASK_RUNNING);</div><div class='del'>-				spin_unlock_irq(&amp;ctx-&gt;wqh.lock);</div><div class='del'>-				return -ERESTARTSYS;</div><div class='del'>-			}</div><div class='add'>+</div><div class='add'>+		if (wait_event_interruptible_locked_irq(ctx-&gt;wqh, ctx-&gt;count)) {</div><div class='ctx'> 			spin_unlock_irq(&amp;ctx-&gt;wqh.lock);</div><div class='del'>-			schedule();</div><div class='del'>-			spin_lock_irq(&amp;ctx-&gt;wqh.lock);</div><div class='add'>+			return -ERESTARTSYS;</div><div class='ctx'> 		}</div><div class='del'>-		__remove_wait_queue(&amp;ctx-&gt;wqh, &amp;wait);</div><div class='del'>-		__set_current_state(TASK_RUNNING);</div><div class='ctx'> 	}</div><div class='ctx'> 	eventfd_ctx_do_read(ctx, &amp;ucnt);</div><div class='add'>+	current-&gt;in_eventfd = 1;</div><div class='ctx'> 	if (waitqueue_active(&amp;ctx-&gt;wqh))</div><div class='ctx'> 		wake_up_locked_poll(&amp;ctx-&gt;wqh, EPOLLOUT);</div><div class='add'>+	current-&gt;in_eventfd = 0;</div><div class='ctx'> 	spin_unlock_irq(&amp;ctx-&gt;wqh.lock);</div><div class='ctx'> 	if (unlikely(copy_to_iter(&amp;ucnt, sizeof(ucnt), to) != sizeof(ucnt)))</div><div class='ctx'> 		return -EFAULT;</div><div class='hunk'>@@ -268,9 +250,8 @@ static ssize_t eventfd_write(struct file *file, const char __user *buf, size_t c</div><div class='ctx'> 	struct eventfd_ctx *ctx = file-&gt;private_data;</div><div class='ctx'> 	ssize_t res;</div><div class='ctx'> 	__u64 ucnt;</div><div class='del'>-	DECLARE_WAITQUEUE(wait, current);</div><div class='ctx'> </div><div class='del'>-	if (count &lt; sizeof(ucnt))</div><div class='add'>+	if (count != sizeof(ucnt))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	if (copy_from_user(&amp;ucnt, buf, sizeof(ucnt)))</div><div class='ctx'> 		return -EFAULT;</div><div class='hunk'>@@ -281,28 +262,17 @@ static ssize_t eventfd_write(struct file *file, const char __user *buf, size_t c</div><div class='ctx'> 	if (ULLONG_MAX - ctx-&gt;count &gt; ucnt)</div><div class='ctx'> 		res = sizeof(ucnt);</div><div class='ctx'> 	else if (!(file-&gt;f_flags &amp; O_NONBLOCK)) {</div><div class='del'>-		__add_wait_queue(&amp;ctx-&gt;wqh, &amp;wait);</div><div class='del'>-		for (res = 0;;) {</div><div class='del'>-			set_current_state(TASK_INTERRUPTIBLE);</div><div class='del'>-			if (ULLONG_MAX - ctx-&gt;count &gt; ucnt) {</div><div class='del'>-				res = sizeof(ucnt);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			if (signal_pending(current)) {</div><div class='del'>-				res = -ERESTARTSYS;</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			spin_unlock_irq(&amp;ctx-&gt;wqh.lock);</div><div class='del'>-			schedule();</div><div class='del'>-			spin_lock_irq(&amp;ctx-&gt;wqh.lock);</div><div class='del'>-		}</div><div class='del'>-		__remove_wait_queue(&amp;ctx-&gt;wqh, &amp;wait);</div><div class='del'>-		__set_current_state(TASK_RUNNING);</div><div class='add'>+		res = wait_event_interruptible_locked_irq(ctx-&gt;wqh,</div><div class='add'>+				ULLONG_MAX - ctx-&gt;count &gt; ucnt);</div><div class='add'>+		if (!res)</div><div class='add'>+			res = sizeof(ucnt);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (likely(res &gt; 0)) {</div><div class='ctx'> 		ctx-&gt;count += ucnt;</div><div class='add'>+		current-&gt;in_eventfd = 1;</div><div class='ctx'> 		if (waitqueue_active(&amp;ctx-&gt;wqh))</div><div class='ctx'> 			wake_up_locked_poll(&amp;ctx-&gt;wqh, EPOLLIN);</div><div class='add'>+		current-&gt;in_eventfd = 0;</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock_irq(&amp;ctx-&gt;wqh.lock);</div><div class='ctx'> </div><div class='hunk'>@@ -313,12 +283,19 @@ static ssize_t eventfd_write(struct file *file, const char __user *buf, size_t c</div><div class='ctx'> static void eventfd_show_fdinfo(struct seq_file *m, struct file *f)</div><div class='ctx'> {</div><div class='ctx'> 	struct eventfd_ctx *ctx = f-&gt;private_data;</div><div class='add'>+	__u64 cnt;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock_irq(&amp;ctx-&gt;wqh.lock);</div><div class='del'>-	seq_printf(m, "eventfd-count: %16llx\n",</div><div class='del'>-		   (unsigned long long)ctx-&gt;count);</div><div class='add'>+	cnt = ctx-&gt;count;</div><div class='ctx'> 	spin_unlock_irq(&amp;ctx-&gt;wqh.lock);</div><div class='del'>-	seq_printf(m, "eventfd-id: %d\n", ctx-&gt;id);</div><div class='add'>+</div><div class='add'>+	seq_printf(m,</div><div class='add'>+		   "eventfd-count: %16llx\n"</div><div class='add'>+		   "eventfd-id: %d\n"</div><div class='add'>+		   "eventfd-semaphore: %d\n",</div><div class='add'>+		   cnt,</div><div class='add'>+		   ctx-&gt;id,</div><div class='add'>+		   !!(ctx-&gt;flags &amp; EFD_SEMAPHORE));</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='hunk'>@@ -370,13 +347,10 @@ EXPORT_SYMBOL_GPL(eventfd_fget);</div><div class='ctx'>  */</div><div class='ctx'> struct eventfd_ctx *eventfd_ctx_fdget(int fd)</div><div class='ctx'> {</div><div class='del'>-	struct eventfd_ctx *ctx;</div><div class='del'>-	struct fd f = fdget(fd);</div><div class='del'>-	if (!f.file)</div><div class='add'>+	CLASS(fd, f)(fd);</div><div class='add'>+	if (fd_empty(f))</div><div class='ctx'> 		return ERR_PTR(-EBADF);</div><div class='del'>-	ctx = eventfd_ctx_fileget(f.file);</div><div class='del'>-	fdput(f);</div><div class='del'>-	return ctx;</div><div class='add'>+	return eventfd_ctx_fileget(fd_file(f));</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(eventfd_ctx_fdget);</div><div class='ctx'> </div><div class='hunk'>@@ -404,13 +378,12 @@ EXPORT_SYMBOL_GPL(eventfd_ctx_fileget);</div><div class='ctx'> </div><div class='ctx'> static int do_eventfd(unsigned int count, int flags)</div><div class='ctx'> {</div><div class='del'>-	struct eventfd_ctx *ctx;</div><div class='del'>-	struct file *file;</div><div class='del'>-	int fd;</div><div class='add'>+	struct eventfd_ctx *ctx __free(kfree) = NULL;</div><div class='ctx'> </div><div class='ctx'> 	/* Check the EFD_* constants for consistency.  */</div><div class='ctx'> 	BUILD_BUG_ON(EFD_CLOEXEC != O_CLOEXEC);</div><div class='ctx'> 	BUILD_BUG_ON(EFD_NONBLOCK != O_NONBLOCK);</div><div class='add'>+	BUILD_BUG_ON(EFD_SEMAPHORE != (1 &lt;&lt; 0));</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; ~EFD_FLAGS_SET)</div><div class='ctx'> 		return -EINVAL;</div><div class='hunk'>@@ -423,27 +396,19 @@ static int do_eventfd(unsigned int count, int flags)</div><div class='ctx'> 	init_waitqueue_head(&amp;ctx-&gt;wqh);</div><div class='ctx'> 	ctx-&gt;count = count;</div><div class='ctx'> 	ctx-&gt;flags = flags;</div><div class='del'>-	ctx-&gt;id = ida_simple_get(&amp;eventfd_ida, 0, 0, GFP_KERNEL);</div><div class='ctx'> </div><div class='ctx'> 	flags &amp;= EFD_SHARED_FCNTL_FLAGS;</div><div class='ctx'> 	flags |= O_RDWR;</div><div class='del'>-	fd = get_unused_fd_flags(flags);</div><div class='del'>-	if (fd &lt; 0)</div><div class='del'>-		goto err;</div><div class='del'>-</div><div class='del'>-	file = anon_inode_getfile("[eventfd]", &amp;eventfd_fops, ctx, flags);</div><div class='del'>-	if (IS_ERR(file)) {</div><div class='del'>-		put_unused_fd(fd);</div><div class='del'>-		fd = PTR_ERR(file);</div><div class='del'>-		goto err;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	file-&gt;f_mode |= FMODE_NOWAIT;</div><div class='del'>-	fd_install(fd, file);</div><div class='del'>-	return fd;</div><div class='del'>-err:</div><div class='del'>-	eventfd_free_ctx(ctx);</div><div class='del'>-	return fd;</div><div class='add'>+	FD_PREPARE(fdf, flags,</div><div class='add'>+		   anon_inode_getfile_fmode("[eventfd]", &amp;eventfd_fops, ctx,</div><div class='add'>+					    flags, FMODE_NOWAIT));</div><div class='add'>+	if (fdf.err)</div><div class='add'>+		return fdf.err;</div><div class='add'>+</div><div class='add'>+	ctx-&gt;id = ida_alloc(&amp;eventfd_ida, GFP_KERNEL);</div><div class='add'>+	retain_and_null_ptr(ctx);</div><div class='add'>+	return fd_publish(fdf);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> SYSCALL_DEFINE2(eventfd2, unsigned int, count, int, flags)</div><div class='head'>diff --git a/fs/eventpoll.c b/fs/eventpoll.c<br/>index 06f4c5ae1451..6c36d9dc6926 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/eventpoll.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/eventpoll.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/eventpoll.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/eventpoll.c</a></div><div class='hunk'>@@ -37,18 +37,19 @@</div><div class='ctx'> #include &lt;linux/seq_file.h&gt;</div><div class='ctx'> #include &lt;linux/compat.h&gt;</div><div class='ctx'> #include &lt;linux/rculist.h&gt;</div><div class='add'>+#include &lt;linux/capability.h&gt;</div><div class='ctx'> #include &lt;net/busy_poll.h&gt;</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * LOCKING:</div><div class='ctx'>  * There are three level of locking required by epoll :</div><div class='ctx'>  *</div><div class='del'>- * 1) epmutex (mutex)</div><div class='add'>+ * 1) epnested_mutex (mutex)</div><div class='ctx'>  * 2) ep-&gt;mtx (mutex)</div><div class='del'>- * 3) ep-&gt;lock (rwlock)</div><div class='add'>+ * 3) ep-&gt;lock (spinlock)</div><div class='ctx'>  *</div><div class='ctx'>  * The acquire order is the one listed above, from 1 to 3.</div><div class='del'>- * We need a rwlock (ep-&gt;lock) because we manipulate objects</div><div class='add'>+ * We need a spinlock (ep-&gt;lock) because we manipulate objects</div><div class='ctx'>  * from inside the poll callback, that might be triggered from</div><div class='ctx'>  * a wake_up() that in turn might be called from IRQ context.</div><div class='ctx'>  * So we can't sleep inside the poll callback and hence we need</div><div class='hunk'>@@ -57,14 +58,8 @@</div><div class='ctx'>  * we need a lock that will allow us to sleep. This lock is a</div><div class='ctx'>  * mutex (ep-&gt;mtx). It is acquired during the event transfer loop,</div><div class='ctx'>  * during epoll_ctl(EPOLL_CTL_DEL) and during eventpoll_release_file().</div><div class='del'>- * Then we also need a global mutex to serialize eventpoll_release_file()</div><div class='del'>- * and ep_free().</div><div class='del'>- * This mutex is acquired by ep_free() during the epoll file</div><div class='del'>- * cleanup path and it is also acquired by eventpoll_release_file()</div><div class='del'>- * if a file has been pushed inside an epoll set and it is then</div><div class='del'>- * close()d without a previous call to epoll_ctl(EPOLL_CTL_DEL).</div><div class='del'>- * It is also acquired when inserting an epoll fd onto another epoll</div><div class='del'>- * fd. We do this so that we walk the epoll tree and ensure that this</div><div class='add'>+ * The epnested_mutex is acquired when inserting an epoll fd onto another</div><div class='add'>+ * epoll fd. We do this so that we walk the epoll tree and ensure that this</div><div class='ctx'>  * insertion does not create a cycle of epoll file descriptors, which</div><div class='ctx'>  * could lead to deadlock. We need a global mutex to prevent two</div><div class='ctx'>  * simultaneous inserts (A into B and B into A) from racing and</div><div class='hunk'>@@ -80,9 +75,9 @@</div><div class='ctx'>  * of epoll file descriptors, we use the current recursion depth as</div><div class='ctx'>  * the lockdep subkey.</div><div class='ctx'>  * It is possible to drop the "ep-&gt;mtx" and to use the global</div><div class='del'>- * mutex "epmutex" (together with "ep-&gt;lock") to have it working,</div><div class='add'>+ * mutex "epnested_mutex" (together with "ep-&gt;lock") to have it working,</div><div class='ctx'>  * but having "ep-&gt;mtx" will make the interface more scalable.</div><div class='del'>- * Events that require holding "epmutex" are very rare, while for</div><div class='add'>+ * Events that require holding "epnested_mutex" are very rare, while for</div><div class='ctx'>  * normal operations the epoll private "ep-&gt;mtx" will guarantee</div><div class='ctx'>  * a better scalability.</div><div class='ctx'>  */</div><div class='hunk'>@@ -153,6 +148,13 @@ struct epitem {</div><div class='ctx'> 	/* The file descriptor information this item refers to */</div><div class='ctx'> 	struct epoll_filefd ffd;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Protected by file-&gt;f_lock, true for to-be-released epitem already</div><div class='add'>+	 * removed from the "struct file" items list; together with</div><div class='add'>+	 * eventpoll-&gt;refcount orchestrates "struct eventpoll" disposal</div><div class='add'>+	 */</div><div class='add'>+	bool dying;</div><div class='add'>+</div><div class='ctx'> 	/* List containing poll wait queues */</div><div class='ctx'> 	struct eppoll_entry *pwqlist;</div><div class='ctx'> </div><div class='hunk'>@@ -193,7 +195,7 @@ struct eventpoll {</div><div class='ctx'> 	struct list_head rdllist;</div><div class='ctx'> </div><div class='ctx'> 	/* Lock which protects rdllist and ovflist */</div><div class='del'>-	rwlock_t lock;</div><div class='add'>+	spinlock_t lock;</div><div class='ctx'> </div><div class='ctx'> 	/* RB tree root used to store monitored fd structs */</div><div class='ctx'> 	struct rb_root_cached rbr;</div><div class='hunk'>@@ -205,7 +207,7 @@ struct eventpoll {</div><div class='ctx'> 	 */</div><div class='ctx'> 	struct epitem *ovflist;</div><div class='ctx'> </div><div class='del'>-	/* wakeup_source used when ep_scan_ready_list is running */</div><div class='add'>+	/* wakeup_source used when ep_send_events or __ep_eventpoll_poll is running */</div><div class='ctx'> 	struct wakeup_source *ws;</div><div class='ctx'> </div><div class='ctx'> 	/* The user that created the eventpoll descriptor */</div><div class='hunk'>@@ -216,10 +218,22 @@ struct eventpoll {</div><div class='ctx'> 	/* used to optimize loop detection check */</div><div class='ctx'> 	u64 gen;</div><div class='ctx'> 	struct hlist_head refs;</div><div class='add'>+	u8 loop_check_depth;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * usage count, used together with epitem-&gt;dying to</div><div class='add'>+	 * orchestrate the disposal of this struct</div><div class='add'>+	 */</div><div class='add'>+	refcount_t refcount;</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_NET_RX_BUSY_POLL</div><div class='ctx'> 	/* used to track busy poll napi_id */</div><div class='ctx'> 	unsigned int napi_id;</div><div class='add'>+	/* busy poll timeout */</div><div class='add'>+	u32 busy_poll_usecs;</div><div class='add'>+	/* busy poll packet budget */</div><div class='add'>+	u16 busy_poll_budget;</div><div class='add'>+	bool prefer_busy_poll;</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_DEBUG_LOCK_ALLOC</div><div class='hunk'>@@ -240,10 +254,8 @@ struct ep_pqueue {</div><div class='ctx'> /* Maximum number of epoll watched descriptors, per user */</div><div class='ctx'> static long max_user_watches __read_mostly;</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * This mutex is used to serialize ep_free() and eventpoll_release_file().</div><div class='del'>- */</div><div class='del'>-static DEFINE_MUTEX(epmutex);</div><div class='add'>+/* Used for cycles detection */</div><div class='add'>+static DEFINE_MUTEX(epnested_mutex);</div><div class='ctx'> </div><div class='ctx'> static u64 loop_check_gen = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -251,14 +263,14 @@ static u64 loop_check_gen = 0;</div><div class='ctx'> static struct eventpoll *inserting_into;</div><div class='ctx'> </div><div class='ctx'> /* Slab cache used to allocate "struct epitem" */</div><div class='del'>-static struct kmem_cache *epi_cache __read_mostly;</div><div class='add'>+static struct kmem_cache *epi_cache __ro_after_init;</div><div class='ctx'> </div><div class='ctx'> /* Slab cache used to allocate "struct eppoll_entry" */</div><div class='del'>-static struct kmem_cache *pwq_cache __read_mostly;</div><div class='add'>+static struct kmem_cache *pwq_cache __ro_after_init;</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * List of files with newly added links, where we may need to limit the number</div><div class='del'>- * of emanating paths. Protected by the epmutex.</div><div class='add'>+ * of emanating paths. Protected by the epnested_mutex.</div><div class='ctx'>  */</div><div class='ctx'> struct epitems_head {</div><div class='ctx'> 	struct hlist_head epitems;</div><div class='hunk'>@@ -266,7 +278,7 @@ struct epitems_head {</div><div class='ctx'> };</div><div class='ctx'> static struct epitems_head *tfile_check_list = EP_UNACTIVE_PTR;</div><div class='ctx'> </div><div class='del'>-static struct kmem_cache *ephead_cache __read_mostly;</div><div class='add'>+static struct kmem_cache *ephead_cache __ro_after_init;</div><div class='ctx'> </div><div class='ctx'> static inline void free_ephead(struct epitems_head *head)</div><div class='ctx'> {</div><div class='hunk'>@@ -307,7 +319,7 @@ static void unlist_file(struct epitems_head *head)</div><div class='ctx'> static long long_zero;</div><div class='ctx'> static long long_max = LONG_MAX;</div><div class='ctx'> </div><div class='del'>-struct ctl_table epoll_table[] = {</div><div class='add'>+static const struct ctl_table epoll_table[] = {</div><div class='ctx'> 	{</div><div class='ctx'> 		.procname	= "max_user_watches",</div><div class='ctx'> 		.data		= &amp;max_user_watches,</div><div class='hunk'>@@ -317,8 +329,14 @@ struct ctl_table epoll_table[] = {</div><div class='ctx'> 		.extra1		= &amp;long_zero,</div><div class='ctx'> 		.extra2		= &amp;long_max,</div><div class='ctx'> 	},</div><div class='del'>-	{ }</div><div class='ctx'> };</div><div class='add'>+</div><div class='add'>+static void __init epoll_sysctls_init(void)</div><div class='add'>+{</div><div class='add'>+	register_sysctl("fs/epoll", epoll_table);</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+#define epoll_sysctls_init() do { } while (0)</div><div class='ctx'> #endif /* CONFIG_SYSCTL */</div><div class='ctx'> </div><div class='ctx'> static const struct file_operations eventpoll_fops;</div><div class='hunk'>@@ -376,11 +394,43 @@ static inline int ep_events_available(struct eventpoll *ep)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_NET_RX_BUSY_POLL</div><div class='add'>+/**</div><div class='add'>+ * busy_loop_ep_timeout - check if busy poll has timed out. The timeout value</div><div class='add'>+ * from the epoll instance ep is preferred, but if it is not set fallback to</div><div class='add'>+ * the system-wide global via busy_loop_timeout.</div><div class='add'>+ *</div><div class='add'>+ * @start_time: The start time used to compute the remaining time until timeout.</div><div class='add'>+ * @ep: Pointer to the eventpoll context.</div><div class='add'>+ *</div><div class='add'>+ * Return: true if the timeout has expired, false otherwise.</div><div class='add'>+ */</div><div class='add'>+static bool busy_loop_ep_timeout(unsigned long start_time,</div><div class='add'>+				 struct eventpoll *ep)</div><div class='add'>+{</div><div class='add'>+	unsigned long bp_usec = READ_ONCE(ep-&gt;busy_poll_usecs);</div><div class='add'>+</div><div class='add'>+	if (bp_usec) {</div><div class='add'>+		unsigned long end_time = start_time + bp_usec;</div><div class='add'>+		unsigned long now = busy_loop_current_time();</div><div class='add'>+</div><div class='add'>+		return time_after(now, end_time);</div><div class='add'>+	} else {</div><div class='add'>+		return busy_loop_timeout(start_time);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool ep_busy_loop_on(struct eventpoll *ep)</div><div class='add'>+{</div><div class='add'>+	return !!READ_ONCE(ep-&gt;busy_poll_usecs) ||</div><div class='add'>+	       READ_ONCE(ep-&gt;prefer_busy_poll) ||</div><div class='add'>+	       net_busy_loop_on();</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static bool ep_busy_loop_end(void *p, unsigned long start_time)</div><div class='ctx'> {</div><div class='ctx'> 	struct eventpoll *ep = p;</div><div class='ctx'> </div><div class='del'>-	return ep_events_available(ep) || busy_loop_timeout(start_time);</div><div class='add'>+	return ep_events_available(ep) || busy_loop_ep_timeout(start_time, ep);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -389,13 +439,18 @@ static bool ep_busy_loop_end(void *p, unsigned long start_time)</div><div class='ctx'>  *</div><div class='ctx'>  * we must do our busy polling with irqs enabled</div><div class='ctx'>  */</div><div class='del'>-static bool ep_busy_loop(struct eventpoll *ep, int nonblock)</div><div class='add'>+static bool ep_busy_loop(struct eventpoll *ep)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int napi_id = READ_ONCE(ep-&gt;napi_id);</div><div class='add'>+	u16 budget = READ_ONCE(ep-&gt;busy_poll_budget);</div><div class='add'>+	bool prefer_busy_poll = READ_ONCE(ep-&gt;prefer_busy_poll);</div><div class='ctx'> </div><div class='del'>-	if ((napi_id &gt;= MIN_NAPI_ID) &amp;&amp; net_busy_loop_on()) {</div><div class='del'>-		napi_busy_loop(napi_id, nonblock ? NULL : ep_busy_loop_end, ep, false,</div><div class='del'>-			       BUSY_POLL_BUDGET);</div><div class='add'>+	if (!budget)</div><div class='add'>+		budget = BUSY_POLL_BUDGET;</div><div class='add'>+</div><div class='add'>+	if (napi_id_valid(napi_id) &amp;&amp; ep_busy_loop_on(ep)) {</div><div class='add'>+		napi_busy_loop(napi_id, ep_busy_loop_end,</div><div class='add'>+			       ep, prefer_busy_poll, budget);</div><div class='ctx'> 		if (ep_events_available(ep))</div><div class='ctx'> 			return true;</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -403,6 +458,8 @@ static bool ep_busy_loop(struct eventpoll *ep, int nonblock)</div><div class='ctx'> 		 * it back in when we have moved a socket with a valid NAPI</div><div class='ctx'> 		 * ID onto the ready list.</div><div class='ctx'> 		 */</div><div class='add'>+		if (prefer_busy_poll)</div><div class='add'>+			napi_resume_irqs(napi_id);</div><div class='ctx'> 		ep-&gt;napi_id = 0;</div><div class='ctx'> 		return false;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -414,12 +471,12 @@ static bool ep_busy_loop(struct eventpoll *ep, int nonblock)</div><div class='ctx'>  */</div><div class='ctx'> static inline void ep_set_busy_poll_napi_id(struct epitem *epi)</div><div class='ctx'> {</div><div class='del'>-	struct eventpoll *ep;</div><div class='add'>+	struct eventpoll *ep = epi-&gt;ep;</div><div class='ctx'> 	unsigned int napi_id;</div><div class='ctx'> 	struct socket *sock;</div><div class='ctx'> 	struct sock *sk;</div><div class='ctx'> </div><div class='del'>-	if (!net_busy_loop_on())</div><div class='add'>+	if (!ep_busy_loop_on(ep))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	sock = sock_from_file(epi-&gt;ffd.file);</div><div class='hunk'>@@ -431,22 +488,80 @@ static inline void ep_set_busy_poll_napi_id(struct epitem *epi)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	napi_id = READ_ONCE(sk-&gt;sk_napi_id);</div><div class='del'>-	ep = epi-&gt;ep;</div><div class='ctx'> </div><div class='ctx'> 	/* Non-NAPI IDs can be rejected</div><div class='ctx'> 	 *	or</div><div class='ctx'> 	 * Nothing to do if we already have this ID</div><div class='ctx'> 	 */</div><div class='del'>-	if (napi_id &lt; MIN_NAPI_ID || napi_id == ep-&gt;napi_id)</div><div class='add'>+	if (!napi_id_valid(napi_id) || napi_id == ep-&gt;napi_id)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	/* record NAPI ID for use in next busy poll */</div><div class='ctx'> 	ep-&gt;napi_id = napi_id;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static long ep_eventpoll_bp_ioctl(struct file *file, unsigned int cmd,</div><div class='add'>+				  unsigned long arg)</div><div class='add'>+{</div><div class='add'>+	struct eventpoll *ep = file-&gt;private_data;</div><div class='add'>+	void __user *uarg = (void __user *)arg;</div><div class='add'>+	struct epoll_params epoll_params;</div><div class='add'>+</div><div class='add'>+	switch (cmd) {</div><div class='add'>+	case EPIOCSPARAMS:</div><div class='add'>+		if (copy_from_user(&amp;epoll_params, uarg, sizeof(epoll_params)))</div><div class='add'>+			return -EFAULT;</div><div class='add'>+</div><div class='add'>+		/* pad byte must be zero */</div><div class='add'>+		if (epoll_params.__pad)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+</div><div class='add'>+		if (epoll_params.busy_poll_usecs &gt; S32_MAX)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+</div><div class='add'>+		if (epoll_params.prefer_busy_poll &gt; 1)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+</div><div class='add'>+		if (epoll_params.busy_poll_budget &gt; NAPI_POLL_WEIGHT &amp;&amp;</div><div class='add'>+		    !capable(CAP_NET_ADMIN))</div><div class='add'>+			return -EPERM;</div><div class='add'>+</div><div class='add'>+		WRITE_ONCE(ep-&gt;busy_poll_usecs, epoll_params.busy_poll_usecs);</div><div class='add'>+		WRITE_ONCE(ep-&gt;busy_poll_budget, epoll_params.busy_poll_budget);</div><div class='add'>+		WRITE_ONCE(ep-&gt;prefer_busy_poll, epoll_params.prefer_busy_poll);</div><div class='add'>+		return 0;</div><div class='add'>+	case EPIOCGPARAMS:</div><div class='add'>+		memset(&amp;epoll_params, 0, sizeof(epoll_params));</div><div class='add'>+		epoll_params.busy_poll_usecs = READ_ONCE(ep-&gt;busy_poll_usecs);</div><div class='add'>+		epoll_params.busy_poll_budget = READ_ONCE(ep-&gt;busy_poll_budget);</div><div class='add'>+		epoll_params.prefer_busy_poll = READ_ONCE(ep-&gt;prefer_busy_poll);</div><div class='add'>+		if (copy_to_user(uarg, &amp;epoll_params, sizeof(epoll_params)))</div><div class='add'>+			return -EFAULT;</div><div class='add'>+		return 0;</div><div class='add'>+	default:</div><div class='add'>+		return -ENOIOCTLCMD;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void ep_suspend_napi_irqs(struct eventpoll *ep)</div><div class='add'>+{</div><div class='add'>+	unsigned int napi_id = READ_ONCE(ep-&gt;napi_id);</div><div class='add'>+</div><div class='add'>+	if (napi_id_valid(napi_id) &amp;&amp; READ_ONCE(ep-&gt;prefer_busy_poll))</div><div class='add'>+		napi_suspend_irqs(napi_id);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void ep_resume_napi_irqs(struct eventpoll *ep)</div><div class='add'>+{</div><div class='add'>+	unsigned int napi_id = READ_ONCE(ep-&gt;napi_id);</div><div class='add'>+</div><div class='add'>+	if (napi_id_valid(napi_id) &amp;&amp; READ_ONCE(ep-&gt;prefer_busy_poll))</div><div class='add'>+		napi_resume_irqs(napi_id);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> #else</div><div class='ctx'> </div><div class='del'>-static inline bool ep_busy_loop(struct eventpoll *ep, int nonblock)</div><div class='add'>+static inline bool ep_busy_loop(struct eventpoll *ep)</div><div class='ctx'> {</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='hunk'>@@ -455,6 +570,20 @@ static inline void ep_set_busy_poll_napi_id(struct epitem *epi)</div><div class='ctx'> {</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static long ep_eventpoll_bp_ioctl(struct file *file, unsigned int cmd,</div><div class='add'>+				  unsigned long arg)</div><div class='add'>+{</div><div class='add'>+	return -EOPNOTSUPP;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void ep_suspend_napi_irqs(struct eventpoll *ep)</div><div class='add'>+{</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void ep_resume_napi_irqs(struct eventpoll *ep)</div><div class='add'>+{</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> #endif /* CONFIG_NET_RX_BUSY_POLL */</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -476,15 +605,16 @@ static inline void ep_set_busy_poll_napi_id(struct epitem *epi)</div><div class='ctx'>  * (efd1) notices that it may have some event ready, so it needs to wake up</div><div class='ctx'>  * the waiters on its poll wait list (efd2). So it calls ep_poll_safewake()</div><div class='ctx'>  * that ends up in another wake_up(), after having checked about the</div><div class='del'>- * recursion constraints. That are, no more than EP_MAX_POLLWAKE_NESTS, to</div><div class='del'>- * avoid stack blasting.</div><div class='add'>+ * recursion constraints. That are, no more than EP_MAX_NESTS, to avoid</div><div class='add'>+ * stack blasting.</div><div class='ctx'>  *</div><div class='ctx'>  * When CONFIG_DEBUG_LOCK_ALLOC is enabled, make sure lockdep can handle</div><div class='ctx'>  * this special case of epoll.</div><div class='ctx'>  */</div><div class='ctx'> #ifdef CONFIG_DEBUG_LOCK_ALLOC</div><div class='ctx'> </div><div class='del'>-static void ep_poll_safewake(struct eventpoll *ep, struct epitem *epi)</div><div class='add'>+static void ep_poll_safewake(struct eventpoll *ep, struct epitem *epi,</div><div class='add'>+			     unsigned pollflags)</div><div class='ctx'> {</div><div class='ctx'> 	struct eventpoll *ep_src;</div><div class='ctx'> 	unsigned long flags;</div><div class='hunk'>@@ -515,16 +645,17 @@ static void ep_poll_safewake(struct eventpoll *ep, struct epitem *epi)</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_lock_irqsave_nested(&amp;ep-&gt;poll_wait.lock, flags, nests);</div><div class='ctx'> 	ep-&gt;nests = nests + 1;</div><div class='del'>-	wake_up_locked_poll(&amp;ep-&gt;poll_wait, EPOLLIN);</div><div class='add'>+	wake_up_locked_poll(&amp;ep-&gt;poll_wait, EPOLLIN | pollflags);</div><div class='ctx'> 	ep-&gt;nests = 0;</div><div class='ctx'> 	spin_unlock_irqrestore(&amp;ep-&gt;poll_wait.lock, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #else</div><div class='ctx'> </div><div class='del'>-static void ep_poll_safewake(struct eventpoll *ep, struct epitem *epi)</div><div class='add'>+static void ep_poll_safewake(struct eventpoll *ep, struct epitem *epi,</div><div class='add'>+			     __poll_t pollflags)</div><div class='ctx'> {</div><div class='del'>-	wake_up_poll(&amp;ep-&gt;poll_wait, EPOLLIN);</div><div class='add'>+	wake_up_poll(&amp;ep-&gt;poll_wait, EPOLLIN | pollflags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='hunk'>@@ -548,8 +679,7 @@ static void ep_remove_wait_queue(struct eppoll_entry *pwq)</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * This function unregisters poll callbacks from the associated file</div><div class='del'>- * descriptor.  Must be called with "mtx" held (or "epmutex" if called from</div><div class='del'>- * ep_free).</div><div class='add'>+ * descriptor.  Must be called with "mtx" held.</div><div class='ctx'>  */</div><div class='ctx'> static void ep_unregister_pollwait(struct eventpoll *ep, struct epitem *epi)</div><div class='ctx'> {</div><div class='hunk'>@@ -611,10 +741,10 @@ static void ep_start_scan(struct eventpoll *ep, struct list_head *txlist)</div><div class='ctx'> 	 * in a lockless way.</div><div class='ctx'> 	 */</div><div class='ctx'> 	lockdep_assert_irqs_enabled();</div><div class='del'>-	write_lock_irq(&amp;ep-&gt;lock);</div><div class='add'>+	spin_lock_irq(&amp;ep-&gt;lock);</div><div class='ctx'> 	list_splice_init(&amp;ep-&gt;rdllist, txlist);</div><div class='ctx'> 	WRITE_ONCE(ep-&gt;ovflist, NULL);</div><div class='del'>-	write_unlock_irq(&amp;ep-&gt;lock);</div><div class='add'>+	spin_unlock_irq(&amp;ep-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void ep_done_scan(struct eventpoll *ep,</div><div class='hunk'>@@ -622,7 +752,7 @@ static void ep_done_scan(struct eventpoll *ep,</div><div class='ctx'> {</div><div class='ctx'> 	struct epitem *epi, *nepi;</div><div class='ctx'> </div><div class='del'>-	write_lock_irq(&amp;ep-&gt;lock);</div><div class='add'>+	spin_lock_irq(&amp;ep-&gt;lock);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * During the time we spent inside the "sproc" callback, some</div><div class='ctx'> 	 * other events might have been queued by the poll callback.</div><div class='hunk'>@@ -663,20 +793,44 @@ static void ep_done_scan(struct eventpoll *ep,</div><div class='ctx'> 			wake_up(&amp;ep-&gt;wq);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	write_unlock_irq(&amp;ep-&gt;lock);</div><div class='add'>+	spin_unlock_irq(&amp;ep-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void epi_rcu_free(struct rcu_head *head)</div><div class='add'>+static void ep_get(struct eventpoll *ep)</div><div class='ctx'> {</div><div class='del'>-	struct epitem *epi = container_of(head, struct epitem, rcu);</div><div class='del'>-	kmem_cache_free(epi_cache, epi);</div><div class='add'>+	refcount_inc(&amp;ep-&gt;refcount);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Returns true if the event poll can be disposed</div><div class='add'>+ */</div><div class='add'>+static bool ep_refcount_dec_and_test(struct eventpoll *ep)</div><div class='add'>+{</div><div class='add'>+	if (!refcount_dec_and_test(&amp;ep-&gt;refcount))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	WARN_ON_ONCE(!RB_EMPTY_ROOT(&amp;ep-&gt;rbr.rb_root));</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void ep_free(struct eventpoll *ep)</div><div class='add'>+{</div><div class='add'>+	ep_resume_napi_irqs(ep);</div><div class='add'>+	mutex_destroy(&amp;ep-&gt;mtx);</div><div class='add'>+	free_uid(ep-&gt;user);</div><div class='add'>+	wakeup_source_unregister(ep-&gt;ws);</div><div class='add'>+	kfree(ep);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Removes a "struct epitem" from the eventpoll RB tree and deallocates</div><div class='ctx'>  * all the associated resources. Must be called with "mtx" held.</div><div class='add'>+ * If the dying flag is set, do the removal only if force is true.</div><div class='add'>+ * This prevents ep_clear_and_put() from dropping all the ep references</div><div class='add'>+ * while running concurrently with eventpoll_release_file().</div><div class='add'>+ * Returns true if the eventpoll can be disposed.</div><div class='ctx'>  */</div><div class='del'>-static int ep_remove(struct eventpoll *ep, struct epitem *epi)</div><div class='add'>+static bool __ep_remove(struct eventpoll *ep, struct epitem *epi, bool force)</div><div class='ctx'> {</div><div class='ctx'> 	struct file *file = epi-&gt;ffd.file;</div><div class='ctx'> 	struct epitems_head *to_free;</div><div class='hunk'>@@ -691,10 +845,16 @@ static int ep_remove(struct eventpoll *ep, struct epitem *epi)</div><div class='ctx'> </div><div class='ctx'> 	/* Remove the current item from the list of epoll hooks */</div><div class='ctx'> 	spin_lock(&amp;file-&gt;f_lock);</div><div class='add'>+	if (epi-&gt;dying &amp;&amp; !force) {</div><div class='add'>+		spin_unlock(&amp;file-&gt;f_lock);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	to_free = NULL;</div><div class='ctx'> 	head = file-&gt;f_ep;</div><div class='ctx'> 	if (head-&gt;first == &amp;epi-&gt;fllink &amp;&amp; !epi-&gt;fllink.next) {</div><div class='del'>-		file-&gt;f_ep = NULL;</div><div class='add'>+		/* See eventpoll_release() for details. */</div><div class='add'>+		WRITE_ONCE(file-&gt;f_ep, NULL);</div><div class='ctx'> 		if (!is_file_epoll(file)) {</div><div class='ctx'> 			struct epitems_head *v;</div><div class='ctx'> 			v = container_of(head, struct epitems_head, epitems);</div><div class='hunk'>@@ -708,10 +868,10 @@ static int ep_remove(struct eventpoll *ep, struct epitem *epi)</div><div class='ctx'> </div><div class='ctx'> 	rb_erase_cached(&amp;epi-&gt;rbn, &amp;ep-&gt;rbr);</div><div class='ctx'> </div><div class='del'>-	write_lock_irq(&amp;ep-&gt;lock);</div><div class='add'>+	spin_lock_irq(&amp;ep-&gt;lock);</div><div class='ctx'> 	if (ep_is_linked(epi))</div><div class='ctx'> 		list_del_init(&amp;epi-&gt;rdllink);</div><div class='del'>-	write_unlock_irq(&amp;ep-&gt;lock);</div><div class='add'>+	spin_unlock_irq(&amp;ep-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	wakeup_source_unregister(ep_wakeup_source(epi));</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -721,31 +881,31 @@ static int ep_remove(struct eventpoll *ep, struct epitem *epi)</div><div class='ctx'> 	 * ep-&gt;mtx. The rcu read side, reverse_path_check_proc(), does not make</div><div class='ctx'> 	 * use of the rbn field.</div><div class='ctx'> 	 */</div><div class='del'>-	call_rcu(&amp;epi-&gt;rcu, epi_rcu_free);</div><div class='add'>+	kfree_rcu(epi, rcu);</div><div class='ctx'> </div><div class='ctx'> 	percpu_counter_dec(&amp;ep-&gt;user-&gt;epoll_watches);</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+/*</div><div class='add'>+ * ep_remove variant for callers owing an additional reference to the ep</div><div class='add'>+ */</div><div class='add'>+static void ep_remove_safe(struct eventpoll *ep, struct epitem *epi)</div><div class='add'>+{</div><div class='add'>+	if (__ep_remove(ep, epi, false))</div><div class='add'>+		WARN_ON_ONCE(ep_refcount_dec_and_test(ep));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void ep_free(struct eventpoll *ep)</div><div class='add'>+static void ep_clear_and_put(struct eventpoll *ep)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node *rbp;</div><div class='add'>+	struct rb_node *rbp, *next;</div><div class='ctx'> 	struct epitem *epi;</div><div class='ctx'> </div><div class='ctx'> 	/* We need to release all tasks waiting for these file */</div><div class='ctx'> 	if (waitqueue_active(&amp;ep-&gt;poll_wait))</div><div class='del'>-		ep_poll_safewake(ep, NULL);</div><div class='add'>+		ep_poll_safewake(ep, NULL, 0);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * We need to lock this because we could be hit by</div><div class='del'>-	 * eventpoll_release_file() while we're freeing the "struct eventpoll".</div><div class='del'>-	 * We do not need to hold "ep-&gt;mtx" here because the epoll file</div><div class='del'>-	 * is on the way to be removed and no one has references to it</div><div class='del'>-	 * anymore. The only hit might come from eventpoll_release_file() but</div><div class='del'>-	 * holding "epmutex" is sufficient here.</div><div class='del'>-	 */</div><div class='del'>-	mutex_lock(&amp;epmutex);</div><div class='add'>+	mutex_lock(&amp;ep-&gt;mtx);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Walks through the whole tree by unregistering poll callbacks.</div><div class='hunk'>@@ -758,26 +918,44 @@ static void ep_free(struct eventpoll *ep)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Walks through the whole tree by freeing each "struct epitem". At this</div><div class='del'>-	 * point we are sure no poll callbacks will be lingering around, and also by</div><div class='del'>-	 * holding "epmutex" we can be sure that no file cleanup code will hit</div><div class='del'>-	 * us during this operation. So we can avoid the lock on "ep-&gt;lock".</div><div class='del'>-	 * We do not need to lock ep-&gt;mtx, either, we only do it to prevent</div><div class='del'>-	 * a lockdep warning.</div><div class='add'>+	 * Walks through the whole tree and try to free each "struct epitem".</div><div class='add'>+	 * Note that ep_remove_safe() will not remove the epitem in case of a</div><div class='add'>+	 * racing eventpoll_release_file(); the latter will do the removal.</div><div class='add'>+	 * At this point we are sure no poll callbacks will be lingering around.</div><div class='add'>+	 * Since we still own a reference to the eventpoll struct, the loop can't</div><div class='add'>+	 * dispose it.</div><div class='ctx'> 	 */</div><div class='del'>-	mutex_lock(&amp;ep-&gt;mtx);</div><div class='del'>-	while ((rbp = rb_first_cached(&amp;ep-&gt;rbr)) != NULL) {</div><div class='add'>+	for (rbp = rb_first_cached(&amp;ep-&gt;rbr); rbp; rbp = next) {</div><div class='add'>+		next = rb_next(rbp);</div><div class='ctx'> 		epi = rb_entry(rbp, struct epitem, rbn);</div><div class='del'>-		ep_remove(ep, epi);</div><div class='add'>+		ep_remove_safe(ep, epi);</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> 	mutex_unlock(&amp;ep-&gt;mtx);</div><div class='add'>+	if (ep_refcount_dec_and_test(ep))</div><div class='add'>+		ep_free(ep);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	mutex_unlock(&amp;epmutex);</div><div class='del'>-	mutex_destroy(&amp;ep-&gt;mtx);</div><div class='del'>-	free_uid(ep-&gt;user);</div><div class='del'>-	wakeup_source_unregister(ep-&gt;ws);</div><div class='del'>-	kfree(ep);</div><div class='add'>+static long ep_eventpoll_ioctl(struct file *file, unsigned int cmd,</div><div class='add'>+			       unsigned long arg)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (!is_file_epoll(file))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	switch (cmd) {</div><div class='add'>+	case EPIOCSPARAMS:</div><div class='add'>+	case EPIOCGPARAMS:</div><div class='add'>+		ret = ep_eventpoll_bp_ioctl(file, cmd, arg);</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ep_eventpoll_release(struct inode *inode, struct file *file)</div><div class='hunk'>@@ -785,7 +963,7 @@ static int ep_eventpoll_release(struct inode *inode, struct file *file)</div><div class='ctx'> 	struct eventpoll *ep = file-&gt;private_data;</div><div class='ctx'> </div><div class='ctx'> 	if (ep)</div><div class='del'>-		ep_free(ep);</div><div class='add'>+		ep_clear_and_put(ep);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -831,6 +1009,34 @@ static __poll_t __ep_eventpoll_poll(struct file *file, poll_table *wait, int dep</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * The ffd.file pointer may be in the process of being torn down due to</div><div class='add'>+ * being closed, but we may not have finished eventpoll_release() yet.</div><div class='add'>+ *</div><div class='add'>+ * Normally, even with the atomic_long_inc_not_zero, the file may have</div><div class='add'>+ * been free'd and then gotten re-allocated to something else (since</div><div class='add'>+ * files are not RCU-delayed, they are SLAB_TYPESAFE_BY_RCU).</div><div class='add'>+ *</div><div class='add'>+ * But for epoll, users hold the ep-&gt;mtx mutex, and as such any file in</div><div class='add'>+ * the process of being free'd will block in eventpoll_release_file()</div><div class='add'>+ * and thus the underlying file allocation will not be free'd, and the</div><div class='add'>+ * file re-use cannot happen.</div><div class='add'>+ *</div><div class='add'>+ * For the same reason we can avoid a rcu_read_lock() around the</div><div class='add'>+ * operation - 'ffd.file' cannot go away even if the refcount has</div><div class='add'>+ * reached zero (but we must still not call out to -&gt;poll() functions</div><div class='add'>+ * etc).</div><div class='add'>+ */</div><div class='add'>+static struct file *epi_fget(const struct epitem *epi)</div><div class='add'>+{</div><div class='add'>+	struct file *file;</div><div class='add'>+</div><div class='add'>+	file = epi-&gt;ffd.file;</div><div class='add'>+	if (!file_ref_get(&amp;file-&gt;f_ref))</div><div class='add'>+		file = NULL;</div><div class='add'>+	return file;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * Differs from ep_eventpoll_poll() in that internal callers already have</div><div class='ctx'>  * the ep-&gt;mtx so we need to start from depth=1, such that mutex_lock_nested()</div><div class='ctx'>  * is correctly annotated.</div><div class='hunk'>@@ -838,14 +1044,22 @@ static __poll_t __ep_eventpoll_poll(struct file *file, poll_table *wait, int dep</div><div class='ctx'> static __poll_t ep_item_poll(const struct epitem *epi, poll_table *pt,</div><div class='ctx'> 				 int depth)</div><div class='ctx'> {</div><div class='del'>-	struct file *file = epi-&gt;ffd.file;</div><div class='add'>+	struct file *file = epi_fget(epi);</div><div class='ctx'> 	__poll_t res;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * We could return EPOLLERR | EPOLLHUP or something, but let's</div><div class='add'>+	 * treat this more as "file doesn't exist, poll didn't happen".</div><div class='add'>+	 */</div><div class='add'>+	if (!file)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='ctx'> 	pt-&gt;_key = epi-&gt;event.events;</div><div class='ctx'> 	if (!is_file_epoll(file))</div><div class='ctx'> 		res = vfs_poll(file, pt);</div><div class='ctx'> 	else</div><div class='ctx'> 		res = __ep_eventpoll_poll(file, pt, depth);</div><div class='add'>+	fput(file);</div><div class='ctx'> 	return res &amp; epi-&gt;event.events;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -886,6 +1100,8 @@ static const struct file_operations eventpoll_fops = {</div><div class='ctx'> 	.release	= ep_eventpoll_release,</div><div class='ctx'> 	.poll		= ep_eventpoll_poll,</div><div class='ctx'> 	.llseek		= noop_llseek,</div><div class='add'>+	.unlocked_ioctl	= ep_eventpoll_ioctl,</div><div class='add'>+	.compat_ioctl   = compat_ptr_ioctl,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -897,63 +1113,57 @@ void eventpoll_release_file(struct file *file)</div><div class='ctx'> {</div><div class='ctx'> 	struct eventpoll *ep;</div><div class='ctx'> 	struct epitem *epi;</div><div class='del'>-	struct hlist_node *next;</div><div class='add'>+	bool dispose;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * We don't want to get "file-&gt;f_lock" because it is not</div><div class='del'>-	 * necessary. It is not necessary because we're in the "struct file"</div><div class='del'>-	 * cleanup path, and this means that no one is using this file anymore.</div><div class='del'>-	 * So, for example, epoll_ctl() cannot hit here since if we reach this</div><div class='del'>-	 * point, the file counter already went to zero and fget() would fail.</div><div class='del'>-	 * The only hit might come from ep_free() but by holding the mutex</div><div class='del'>-	 * will correctly serialize the operation. We do need to acquire</div><div class='del'>-	 * "ep-&gt;mtx" after "epmutex" because ep_remove() requires it when called</div><div class='del'>-	 * from anywhere but ep_free().</div><div class='del'>-	 *</div><div class='del'>-	 * Besides, ep_remove() acquires the lock, so we can't hold it here.</div><div class='add'>+	 * Use the 'dying' flag to prevent a concurrent ep_clear_and_put() from</div><div class='add'>+	 * touching the epitems list before eventpoll_release_file() can access</div><div class='add'>+	 * the ep-&gt;mtx.</div><div class='ctx'> 	 */</div><div class='del'>-	mutex_lock(&amp;epmutex);</div><div class='del'>-	if (unlikely(!file-&gt;f_ep)) {</div><div class='del'>-		mutex_unlock(&amp;epmutex);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-	hlist_for_each_entry_safe(epi, next, file-&gt;f_ep, fllink) {</div><div class='add'>+again:</div><div class='add'>+	spin_lock(&amp;file-&gt;f_lock);</div><div class='add'>+	if (file-&gt;f_ep &amp;&amp; file-&gt;f_ep-&gt;first) {</div><div class='add'>+		epi = hlist_entry(file-&gt;f_ep-&gt;first, struct epitem, fllink);</div><div class='add'>+		epi-&gt;dying = true;</div><div class='add'>+		spin_unlock(&amp;file-&gt;f_lock);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * ep access is safe as we still own a reference to the ep</div><div class='add'>+		 * struct</div><div class='add'>+		 */</div><div class='ctx'> 		ep = epi-&gt;ep;</div><div class='del'>-		mutex_lock_nested(&amp;ep-&gt;mtx, 0);</div><div class='del'>-		ep_remove(ep, epi);</div><div class='add'>+		mutex_lock(&amp;ep-&gt;mtx);</div><div class='add'>+		dispose = __ep_remove(ep, epi, true);</div><div class='ctx'> 		mutex_unlock(&amp;ep-&gt;mtx);</div><div class='add'>+</div><div class='add'>+		if (dispose &amp;&amp; ep_refcount_dec_and_test(ep))</div><div class='add'>+			ep_free(ep);</div><div class='add'>+		goto again;</div><div class='ctx'> 	}</div><div class='del'>-	mutex_unlock(&amp;epmutex);</div><div class='add'>+	spin_unlock(&amp;file-&gt;f_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ep_alloc(struct eventpoll **pep)</div><div class='ctx'> {</div><div class='del'>-	int error;</div><div class='del'>-	struct user_struct *user;</div><div class='ctx'> 	struct eventpoll *ep;</div><div class='ctx'> </div><div class='del'>-	user = get_current_user();</div><div class='del'>-	error = -ENOMEM;</div><div class='ctx'> 	ep = kzalloc(sizeof(*ep), GFP_KERNEL);</div><div class='ctx'> 	if (unlikely(!ep))</div><div class='del'>-		goto free_uid;</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	mutex_init(&amp;ep-&gt;mtx);</div><div class='del'>-	rwlock_init(&amp;ep-&gt;lock);</div><div class='add'>+	spin_lock_init(&amp;ep-&gt;lock);</div><div class='ctx'> 	init_waitqueue_head(&amp;ep-&gt;wq);</div><div class='ctx'> 	init_waitqueue_head(&amp;ep-&gt;poll_wait);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;ep-&gt;rdllist);</div><div class='ctx'> 	ep-&gt;rbr = RB_ROOT_CACHED;</div><div class='ctx'> 	ep-&gt;ovflist = EP_UNACTIVE_PTR;</div><div class='del'>-	ep-&gt;user = user;</div><div class='add'>+	ep-&gt;user = get_current_user();</div><div class='add'>+	refcount_set(&amp;ep-&gt;refcount, 1);</div><div class='ctx'> </div><div class='ctx'> 	*pep = ep;</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='del'>-</div><div class='del'>-free_uid:</div><div class='del'>-	free_uid(user);</div><div class='del'>-	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1030,99 +1240,9 @@ struct file *get_epoll_tfile_raw_ptr(struct file *file, int tfd,</div><div class='ctx'> #endif /* CONFIG_KCMP */</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Adds a new entry to the tail of the list in a lockless way, i.e.</div><div class='del'>- * multiple CPUs are allowed to call this function concurrently.</div><div class='del'>- *</div><div class='del'>- * Beware: it is necessary to prevent any other modifications of the</div><div class='del'>- *         existing list until all changes are completed, in other words</div><div class='del'>- *         concurrent list_add_tail_lockless() calls should be protected</div><div class='del'>- *         with a read lock, where write lock acts as a barrier which</div><div class='del'>- *         makes sure all list_add_tail_lockless() calls are fully</div><div class='del'>- *         completed.</div><div class='del'>- *</div><div class='del'>- *        Also an element can be locklessly added to the list only in one</div><div class='del'>- *        direction i.e. either to the tail or to the head, otherwise</div><div class='del'>- *        concurrent access will corrupt the list.</div><div class='del'>- *</div><div class='del'>- * Return: %false if element has been already added to the list, %true</div><div class='del'>- * otherwise.</div><div class='del'>- */</div><div class='del'>-static inline bool list_add_tail_lockless(struct list_head *new,</div><div class='del'>-					  struct list_head *head)</div><div class='del'>-{</div><div class='del'>-	struct list_head *prev;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * This is simple 'new-&gt;next = head' operation, but cmpxchg()</div><div class='del'>-	 * is used in order to detect that same element has been just</div><div class='del'>-	 * added to the list from another CPU: the winner observes</div><div class='del'>-	 * new-&gt;next == new.</div><div class='del'>-	 */</div><div class='del'>-	if (cmpxchg(&amp;new-&gt;next, new, head) != new)</div><div class='del'>-		return false;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Initially -&gt;next of a new element must be updated with the head</div><div class='del'>-	 * (we are inserting to the tail) and only then pointers are atomically</div><div class='del'>-	 * exchanged.  XCHG guarantees memory ordering, thus -&gt;next should be</div><div class='del'>-	 * updated before pointers are actually swapped and pointers are</div><div class='del'>-	 * swapped before prev-&gt;next is updated.</div><div class='del'>-	 */</div><div class='del'>-</div><div class='del'>-	prev = xchg(&amp;head-&gt;prev, new);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * It is safe to modify prev-&gt;next and new-&gt;prev, because a new element</div><div class='del'>-	 * is added only to the tail and new-&gt;next is updated before XCHG.</div><div class='del'>-	 */</div><div class='del'>-</div><div class='del'>-	prev-&gt;next = new;</div><div class='del'>-	new-&gt;prev = prev;</div><div class='del'>-</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Chains a new epi entry to the tail of the ep-&gt;ovflist in a lockless way,</div><div class='del'>- * i.e. multiple CPUs are allowed to call this function concurrently.</div><div class='del'>- *</div><div class='del'>- * Return: %false if epi element has been already chained, %true otherwise.</div><div class='del'>- */</div><div class='del'>-static inline bool chain_epi_lockless(struct epitem *epi)</div><div class='del'>-{</div><div class='del'>-	struct eventpoll *ep = epi-&gt;ep;</div><div class='del'>-</div><div class='del'>-	/* Fast preliminary check */</div><div class='del'>-	if (epi-&gt;next != EP_UNACTIVE_PTR)</div><div class='del'>-		return false;</div><div class='del'>-</div><div class='del'>-	/* Check that the same epi has not been just chained from another CPU */</div><div class='del'>-	if (cmpxchg(&amp;epi-&gt;next, EP_UNACTIVE_PTR, NULL) != EP_UNACTIVE_PTR)</div><div class='del'>-		return false;</div><div class='del'>-</div><div class='del'>-	/* Atomically exchange tail */</div><div class='del'>-	epi-&gt;next = xchg(&amp;ep-&gt;ovflist, epi);</div><div class='del'>-</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * This is the callback that is passed to the wait queue wakeup</div><div class='ctx'>  * mechanism. It is called by the stored file descriptors when they</div><div class='ctx'>  * have events to report.</div><div class='del'>- *</div><div class='del'>- * This callback takes a read lock in order not to contend with concurrent</div><div class='del'>- * events from another file descriptor, thus all modifications to -&gt;rdllist</div><div class='del'>- * or -&gt;ovflist are lockless.  Read lock is paired with the write lock from</div><div class='del'>- * ep_scan_ready_list(), which stops all list modifications and guarantees</div><div class='del'>- * that lists state is seen correctly.</div><div class='del'>- *</div><div class='del'>- * Another thing worth to mention is that ep_poll_callback() can be called</div><div class='del'>- * concurrently for the same @epi from different CPUs if poll table was inited</div><div class='del'>- * with several wait queues entries.  Plural wakeup from different CPUs of a</div><div class='del'>- * single wait queue is serialized by wq.lock, but the case when multiple wait</div><div class='del'>- * queues are used should be detected accordingly.  This is detected using</div><div class='del'>- * cmpxchg() operation.</div><div class='ctx'>  */</div><div class='ctx'> static int ep_poll_callback(wait_queue_entry_t *wait, unsigned mode, int sync, void *key)</div><div class='ctx'> {</div><div class='hunk'>@@ -1133,7 +1253,7 @@ static int ep_poll_callback(wait_queue_entry_t *wait, unsigned mode, int sync, v</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> 	int ewake = 0;</div><div class='ctx'> </div><div class='del'>-	read_lock_irqsave(&amp;ep-&gt;lock, flags);</div><div class='add'>+	spin_lock_irqsave(&amp;ep-&gt;lock, flags);</div><div class='ctx'> </div><div class='ctx'> 	ep_set_busy_poll_napi_id(epi);</div><div class='ctx'> </div><div class='hunk'>@@ -1162,12 +1282,15 @@ static int ep_poll_callback(wait_queue_entry_t *wait, unsigned mode, int sync, v</div><div class='ctx'> 	 * chained in ep-&gt;ovflist and requeued later on.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (READ_ONCE(ep-&gt;ovflist) != EP_UNACTIVE_PTR) {</div><div class='del'>-		if (chain_epi_lockless(epi))</div><div class='add'>+		if (epi-&gt;next == EP_UNACTIVE_PTR) {</div><div class='add'>+			epi-&gt;next = READ_ONCE(ep-&gt;ovflist);</div><div class='add'>+			WRITE_ONCE(ep-&gt;ovflist, epi);</div><div class='ctx'> 			ep_pm_stay_awake_rcu(epi);</div><div class='add'>+		}</div><div class='ctx'> 	} else if (!ep_is_linked(epi)) {</div><div class='ctx'> 		/* In the usual case, add event to ready list. */</div><div class='del'>-		if (list_add_tail_lockless(&amp;epi-&gt;rdllink, &amp;ep-&gt;rdllist))</div><div class='del'>-			ep_pm_stay_awake_rcu(epi);</div><div class='add'>+		list_add_tail(&amp;epi-&gt;rdllink, &amp;ep-&gt;rdllist);</div><div class='add'>+		ep_pm_stay_awake_rcu(epi);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1191,17 +1314,20 @@ static int ep_poll_callback(wait_queue_entry_t *wait, unsigned mode, int sync, v</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		wake_up(&amp;ep-&gt;wq);</div><div class='add'>+		if (sync)</div><div class='add'>+			wake_up_sync(&amp;ep-&gt;wq);</div><div class='add'>+		else</div><div class='add'>+			wake_up(&amp;ep-&gt;wq);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (waitqueue_active(&amp;ep-&gt;poll_wait))</div><div class='ctx'> 		pwake++;</div><div class='ctx'> </div><div class='ctx'> out_unlock:</div><div class='del'>-	read_unlock_irqrestore(&amp;ep-&gt;lock, flags);</div><div class='add'>+	spin_unlock_irqrestore(&amp;ep-&gt;lock, flags);</div><div class='ctx'> </div><div class='ctx'> 	/* We have to call this outside the lock */</div><div class='ctx'> 	if (pwake)</div><div class='del'>-		ep_poll_safewake(ep, epi);</div><div class='add'>+		ep_poll_safewake(ep, epi, pollflags &amp; EPOLL_URING_WAKE);</div><div class='ctx'> </div><div class='ctx'> 	if (!(epi-&gt;event.events &amp; EPOLLEXCLUSIVE))</div><div class='ctx'> 		ewake = 1;</div><div class='hunk'>@@ -1214,10 +1340,10 @@ out_unlock:</div><div class='ctx'> 		 */</div><div class='ctx'> 		list_del_init(&amp;wait-&gt;entry);</div><div class='ctx'> 		/*</div><div class='del'>-		 * -&gt;whead != NULL protects us from the race with ep_free()</div><div class='del'>-		 * or ep_remove(), ep_remove_wait_queue() takes whead-&gt;lock</div><div class='del'>-		 * held by the caller. Once we nullify it, nothing protects</div><div class='del'>-		 * ep/epi or even wait.</div><div class='add'>+		 * -&gt;whead != NULL protects us from the race with</div><div class='add'>+		 * ep_clear_and_put() or ep_remove(), ep_remove_wait_queue()</div><div class='add'>+		 * takes whead-&gt;lock held by the caller. Once we nullify it,</div><div class='add'>+		 * nothing protects ep/epi or even wait.</div><div class='ctx'> 		 */</div><div class='ctx'> 		smp_store_release(&amp;ep_pwq_from_wait(wait)-&gt;whead, NULL);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1289,7 +1415,7 @@ static void ep_rbtree_insert(struct eventpoll *ep, struct epitem *epi)</div><div class='ctx'>  * is connected to n file sources. In this case each file source has 1 path</div><div class='ctx'>  * of length 1. Thus, the numbers below should be more than sufficient. These</div><div class='ctx'>  * path limits are enforced during an EPOLL_CTL_ADD operation, since a modify</div><div class='del'>- * and delete can't add additional paths. Protected by the epmutex.</div><div class='add'>+ * and delete can't add additional paths. Protected by the epnested_mutex.</div><div class='ctx'>  */</div><div class='ctx'> static const int path_limits[PATH_ARR_SIZE] = { 1000, 500, 100, 50, 10 };</div><div class='ctx'> static int path_count[PATH_ARR_SIZE];</div><div class='hunk'>@@ -1422,7 +1548,8 @@ allocate:</div><div class='ctx'> 			spin_unlock(&amp;file-&gt;f_lock);</div><div class='ctx'> 			goto allocate;</div><div class='ctx'> 		}</div><div class='del'>-		file-&gt;f_ep = head;</div><div class='add'>+		/* See eventpoll_release() for details. */</div><div class='add'>+		WRITE_ONCE(file-&gt;f_ep, head);</div><div class='ctx'> 		to_free = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> 	hlist_add_head_rcu(&amp;epi-&gt;fllink, file-&gt;f_ep);</div><div class='hunk'>@@ -1487,16 +1614,22 @@ static int ep_insert(struct eventpoll *ep, const struct epoll_event *event,</div><div class='ctx'> 	if (tep)</div><div class='ctx'> 		mutex_unlock(&amp;tep-&gt;mtx);</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * ep_remove_safe() calls in the later error paths can't lead to</div><div class='add'>+	 * ep_free() as the ep file itself still holds an ep reference.</div><div class='add'>+	 */</div><div class='add'>+	ep_get(ep);</div><div class='add'>+</div><div class='ctx'> 	/* now check if we've created too many backpaths */</div><div class='ctx'> 	if (unlikely(full_check &amp;&amp; reverse_path_check())) {</div><div class='del'>-		ep_remove(ep, epi);</div><div class='add'>+		ep_remove_safe(ep, epi);</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (epi-&gt;event.events &amp; EPOLLWAKEUP) {</div><div class='ctx'> 		error = ep_create_wakeup_source(epi);</div><div class='ctx'> 		if (error) {</div><div class='del'>-			ep_remove(ep, epi);</div><div class='add'>+			ep_remove_safe(ep, epi);</div><div class='ctx'> 			return error;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1520,12 +1653,12 @@ static int ep_insert(struct eventpoll *ep, const struct epoll_event *event,</div><div class='ctx'> 	 * high memory pressure.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (unlikely(!epq.epi)) {</div><div class='del'>-		ep_remove(ep, epi);</div><div class='add'>+		ep_remove_safe(ep, epi);</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* We have to drop the new item inside our item list to keep track of it */</div><div class='del'>-	write_lock_irq(&amp;ep-&gt;lock);</div><div class='add'>+	spin_lock_irq(&amp;ep-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	/* record NAPI ID of new item if present */</div><div class='ctx'> 	ep_set_busy_poll_napi_id(epi);</div><div class='hunk'>@@ -1542,11 +1675,11 @@ static int ep_insert(struct eventpoll *ep, const struct epoll_event *event,</div><div class='ctx'> 			pwake++;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	write_unlock_irq(&amp;ep-&gt;lock);</div><div class='add'>+	spin_unlock_irq(&amp;ep-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	/* We have to call this outside the lock */</div><div class='ctx'> 	if (pwake)</div><div class='del'>-		ep_poll_safewake(ep, NULL);</div><div class='add'>+		ep_poll_safewake(ep, NULL, 0);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -1606,7 +1739,7 @@ static int ep_modify(struct eventpoll *ep, struct epitem *epi,</div><div class='ctx'> 	 * list, push it inside.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (ep_item_poll(epi, &amp;pt, 1)) {</div><div class='del'>-		write_lock_irq(&amp;ep-&gt;lock);</div><div class='add'>+		spin_lock_irq(&amp;ep-&gt;lock);</div><div class='ctx'> 		if (!ep_is_linked(epi)) {</div><div class='ctx'> 			list_add_tail(&amp;epi-&gt;rdllink, &amp;ep-&gt;rdllist);</div><div class='ctx'> 			ep_pm_stay_awake(epi);</div><div class='hunk'>@@ -1617,12 +1750,12 @@ static int ep_modify(struct eventpoll *ep, struct epitem *epi,</div><div class='ctx'> 			if (waitqueue_active(&amp;ep-&gt;poll_wait))</div><div class='ctx'> 				pwake++;</div><div class='ctx'> 		}</div><div class='del'>-		write_unlock_irq(&amp;ep-&gt;lock);</div><div class='add'>+		spin_unlock_irq(&amp;ep-&gt;lock);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* We have to call this outside the lock */</div><div class='ctx'> 	if (pwake)</div><div class='del'>-		ep_poll_safewake(ep, NULL);</div><div class='add'>+		ep_poll_safewake(ep, NULL, 0);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -1706,7 +1839,7 @@ static int ep_send_events(struct eventpoll *ep,</div><div class='ctx'> 			 * availability. At this point, no one can insert</div><div class='ctx'> 			 * into ep-&gt;rdllist besides us. The epoll_ctl()</div><div class='ctx'> 			 * callers are locked out by</div><div class='del'>-			 * ep_scan_ready_list() holding "mtx" and the</div><div class='add'>+			 * ep_send_events() holding "mtx" and the</div><div class='ctx'> 			 * poll callback will queue them in ep-&gt;ovflist.</div><div class='ctx'> 			 */</div><div class='ctx'> 			list_add_tail(&amp;epi-&gt;rdllink, &amp;ep-&gt;rdllist);</div><div class='hunk'>@@ -1740,6 +1873,49 @@ static struct timespec64 *ep_timeout_to_timespec(struct timespec64 *to, long ms)</div><div class='ctx'> 	return to;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * autoremove_wake_function, but remove even on failure to wake up, because we</div><div class='add'>+ * know that default_wake_function/ttwu will only fail if the thread is already</div><div class='add'>+ * woken, and in that case the ep_poll loop will remove the entry anyways, not</div><div class='add'>+ * try to reuse it.</div><div class='add'>+ */</div><div class='add'>+static int ep_autoremove_wake_function(struct wait_queue_entry *wq_entry,</div><div class='add'>+				       unsigned int mode, int sync, void *key)</div><div class='add'>+{</div><div class='add'>+	int ret = default_wake_function(wq_entry, mode, sync, key);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Pairs with list_empty_careful in ep_poll, and ensures future loop</div><div class='add'>+	 * iterations see the cause of this wakeup.</div><div class='add'>+	 */</div><div class='add'>+	list_del_init_careful(&amp;wq_entry-&gt;entry);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ep_try_send_events(struct eventpoll *ep,</div><div class='add'>+			      struct epoll_event __user *events, int maxevents)</div><div class='add'>+{</div><div class='add'>+	int res;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Try to transfer events to user space. In case we get 0 events and</div><div class='add'>+	 * there's still timeout left over, we go trying again in search of</div><div class='add'>+	 * more luck.</div><div class='add'>+	 */</div><div class='add'>+	res = ep_send_events(ep, events, maxevents);</div><div class='add'>+	if (res &gt; 0)</div><div class='add'>+		ep_suspend_napi_irqs(ep);</div><div class='add'>+	return res;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ep_schedule_timeout(ktime_t *to)</div><div class='add'>+{</div><div class='add'>+	if (to)</div><div class='add'>+		return ktime_after(*to, ktime_get());</div><div class='add'>+	else</div><div class='add'>+		return 1;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /**</div><div class='ctx'>  * ep_poll - Retrieves ready events, and delivers them to the caller-supplied</div><div class='ctx'>  *           event buffer.</div><div class='hunk'>@@ -1791,12 +1967,7 @@ static int ep_poll(struct eventpoll *ep, struct epoll_event __user *events,</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		if (eavail) {</div><div class='del'>-			/*</div><div class='del'>-			 * Try to transfer events to user space. In case we get</div><div class='del'>-			 * 0 events and there's still timeout left over, we go</div><div class='del'>-			 * trying again in search of more luck.</div><div class='del'>-			 */</div><div class='del'>-			res = ep_send_events(ep, events, maxevents);</div><div class='add'>+			res = ep_try_send_events(ep, events, maxevents);</div><div class='ctx'> 			if (res)</div><div class='ctx'> 				return res;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1804,7 +1975,7 @@ static int ep_poll(struct eventpoll *ep, struct epoll_event __user *events,</div><div class='ctx'> 		if (timed_out)</div><div class='ctx'> 			return 0;</div><div class='ctx'> </div><div class='del'>-		eavail = ep_busy_loop(ep, timed_out);</div><div class='add'>+		eavail = ep_busy_loop(ep);</div><div class='ctx'> 		if (eavail)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='hunk'>@@ -1821,10 +1992,17 @@ static int ep_poll(struct eventpoll *ep, struct epoll_event __user *events,</div><div class='ctx'> 		 * normal wakeup path no need to call __remove_wait_queue()</div><div class='ctx'> 		 * explicitly, thus ep-&gt;lock is not taken, which halts the</div><div class='ctx'> 		 * event delivery.</div><div class='add'>+		 *</div><div class='add'>+		 * In fact, we now use an even more aggressive function that</div><div class='add'>+		 * unconditionally removes, because we don't reuse the wait</div><div class='add'>+		 * entry between loop iterations. This lets us also avoid the</div><div class='add'>+		 * performance issue if a process is killed, causing all of its</div><div class='add'>+		 * threads to wake up without being removed normally.</div><div class='ctx'> 		 */</div><div class='ctx'> 		init_wait(&amp;wait);</div><div class='add'>+		wait.func = ep_autoremove_wake_function;</div><div class='ctx'> </div><div class='del'>-		write_lock_irq(&amp;ep-&gt;lock);</div><div class='add'>+		spin_lock_irq(&amp;ep-&gt;lock);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Barrierless variant, waitqueue_active() is called under</div><div class='ctx'> 		 * the same lock on wakeup ep_poll_callback() side, so it</div><div class='hunk'>@@ -1833,7 +2011,7 @@ static int ep_poll(struct eventpoll *ep, struct epoll_event __user *events,</div><div class='ctx'> 		__set_current_state(TASK_INTERRUPTIBLE);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * Do the final check under the lock. ep_scan_ready_list()</div><div class='add'>+		 * Do the final check under the lock. ep_start/done_scan()</div><div class='ctx'> 		 * plays with two lists (-&gt;rdllist and -&gt;ovflist) and there</div><div class='ctx'> 		 * is always a race when both lists are empty for short</div><div class='ctx'> 		 * period of time although events are pending, so lock is</div><div class='hunk'>@@ -1843,11 +2021,12 @@ static int ep_poll(struct eventpoll *ep, struct epoll_event __user *events,</div><div class='ctx'> 		if (!eavail)</div><div class='ctx'> 			__add_wait_queue_exclusive(&amp;ep-&gt;wq, &amp;wait);</div><div class='ctx'> </div><div class='del'>-		write_unlock_irq(&amp;ep-&gt;lock);</div><div class='add'>+		spin_unlock_irq(&amp;ep-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 		if (!eavail)</div><div class='del'>-			timed_out = !schedule_hrtimeout_range(to, slack,</div><div class='del'>-							      HRTIMER_MODE_ABS);</div><div class='add'>+			timed_out = !ep_schedule_timeout(to) ||</div><div class='add'>+				!schedule_hrtimeout_range(to, slack,</div><div class='add'>+							  HRTIMER_MODE_ABS);</div><div class='ctx'> 		__set_current_state(TASK_RUNNING);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='hunk'>@@ -1858,7 +2037,7 @@ static int ep_poll(struct eventpoll *ep, struct epoll_event __user *events,</div><div class='ctx'> 		eavail = 1;</div><div class='ctx'> </div><div class='ctx'> 		if (!list_empty_careful(&amp;wait.entry)) {</div><div class='del'>-			write_lock_irq(&amp;ep-&gt;lock);</div><div class='add'>+			spin_lock_irq(&amp;ep-&gt;lock);</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * If the thread timed out and is not on the wait queue,</div><div class='ctx'> 			 * it means that the thread was woken up after its</div><div class='hunk'>@@ -1869,29 +2048,30 @@ static int ep_poll(struct eventpoll *ep, struct epoll_event __user *events,</div><div class='ctx'> 			if (timed_out)</div><div class='ctx'> 				eavail = list_empty(&amp;wait.entry);</div><div class='ctx'> 			__remove_wait_queue(&amp;ep-&gt;wq, &amp;wait);</div><div class='del'>-			write_unlock_irq(&amp;ep-&gt;lock);</div><div class='add'>+			spin_unlock_irq(&amp;ep-&gt;lock);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * ep_loop_check_proc - verify that adding an epoll file inside another</div><div class='del'>- *                      epoll structure does not violate the constraints, in</div><div class='del'>- *                      terms of closed loops, or too deep chains (which can</div><div class='del'>- *                      result in excessive stack usage).</div><div class='add'>+ * ep_loop_check_proc - verify that adding an epoll file @ep inside another</div><div class='add'>+ *                      epoll file does not create closed loops, and</div><div class='add'>+ *                      determine the depth of the subtree starting at @ep</div><div class='ctx'>  *</div><div class='ctx'>  * @ep: the &amp;struct eventpoll to be currently checked.</div><div class='ctx'>  * @depth: Current depth of the path being checked.</div><div class='ctx'>  *</div><div class='del'>- * Return: %zero if adding the epoll @file inside current epoll</div><div class='del'>- *          structure @ep does not violate the constraints, or %-1 otherwise.</div><div class='add'>+ * Return: depth of the subtree, or INT_MAX if we found a loop or went too deep.</div><div class='ctx'>  */</div><div class='ctx'> static int ep_loop_check_proc(struct eventpoll *ep, int depth)</div><div class='ctx'> {</div><div class='del'>-	int error = 0;</div><div class='add'>+	int result = 0;</div><div class='ctx'> 	struct rb_node *rbp;</div><div class='ctx'> 	struct epitem *epi;</div><div class='ctx'> </div><div class='add'>+	if (ep-&gt;gen == loop_check_gen)</div><div class='add'>+		return ep-&gt;loop_check_depth;</div><div class='add'>+</div><div class='ctx'> 	mutex_lock_nested(&amp;ep-&gt;mtx, depth + 1);</div><div class='ctx'> 	ep-&gt;gen = loop_check_gen;</div><div class='ctx'> 	for (rbp = rb_first_cached(&amp;ep-&gt;rbr); rbp; rbp = rb_next(rbp)) {</div><div class='hunk'>@@ -1899,13 +2079,11 @@ static int ep_loop_check_proc(struct eventpoll *ep, int depth)</div><div class='ctx'> 		if (unlikely(is_file_epoll(epi-&gt;ffd.file))) {</div><div class='ctx'> 			struct eventpoll *ep_tovisit;</div><div class='ctx'> 			ep_tovisit = epi-&gt;ffd.file-&gt;private_data;</div><div class='del'>-			if (ep_tovisit-&gt;gen == loop_check_gen)</div><div class='del'>-				continue;</div><div class='ctx'> 			if (ep_tovisit == inserting_into || depth &gt; EP_MAX_NESTS)</div><div class='del'>-				error = -1;</div><div class='add'>+				result = INT_MAX;</div><div class='ctx'> 			else</div><div class='del'>-				error = ep_loop_check_proc(ep_tovisit, depth + 1);</div><div class='del'>-			if (error != 0)</div><div class='add'>+				result = max(result, ep_loop_check_proc(ep_tovisit, depth + 1) + 1);</div><div class='add'>+			if (result &gt; EP_MAX_NESTS)</div><div class='ctx'> 				break;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			/*</div><div class='hunk'>@@ -1919,9 +2097,25 @@ static int ep_loop_check_proc(struct eventpoll *ep, int depth)</div><div class='ctx'> 			list_file(epi-&gt;ffd.file);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='add'>+	ep-&gt;loop_check_depth = result;</div><div class='ctx'> 	mutex_unlock(&amp;ep-&gt;mtx);</div><div class='ctx'> </div><div class='del'>-	return error;</div><div class='add'>+	return result;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* ep_get_upwards_depth_proc - determine depth of @ep when traversed upwards */</div><div class='add'>+static int ep_get_upwards_depth_proc(struct eventpoll *ep, int depth)</div><div class='add'>+{</div><div class='add'>+	int result = 0;</div><div class='add'>+	struct epitem *epi;</div><div class='add'>+</div><div class='add'>+	if (ep-&gt;gen == loop_check_gen)</div><div class='add'>+		return ep-&gt;loop_check_depth;</div><div class='add'>+	hlist_for_each_entry_rcu(epi, &amp;ep-&gt;refs, fllink)</div><div class='add'>+		result = max(result, ep_get_upwards_depth_proc(epi-&gt;ep, depth + 1) + 1);</div><div class='add'>+	ep-&gt;gen = loop_check_gen;</div><div class='add'>+	ep-&gt;loop_check_depth = result;</div><div class='add'>+	return result;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -1937,8 +2131,22 @@ static int ep_loop_check_proc(struct eventpoll *ep, int depth)</div><div class='ctx'>  */</div><div class='ctx'> static int ep_loop_check(struct eventpoll *ep, struct eventpoll *to)</div><div class='ctx'> {</div><div class='add'>+	int depth, upwards_depth;</div><div class='add'>+</div><div class='ctx'> 	inserting_into = ep;</div><div class='del'>-	return ep_loop_check_proc(to, 0);</div><div class='add'>+	/*</div><div class='add'>+	 * Check how deep down we can get from @to, and whether it is possible</div><div class='add'>+	 * to loop up to @ep.</div><div class='add'>+	 */</div><div class='add'>+	depth = ep_loop_check_proc(to, 0);</div><div class='add'>+	if (depth &gt; EP_MAX_NESTS)</div><div class='add'>+		return -1;</div><div class='add'>+	/* Check how far up we can go from @ep. */</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	upwards_depth = ep_get_upwards_depth_proc(ep, 0);</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+</div><div class='add'>+	return (depth+1+upwards_depth &gt; EP_MAX_NESTS) ? -1 : 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void clear_tfile_check_list(void)</div><div class='hunk'>@@ -1957,9 +2165,8 @@ static void clear_tfile_check_list(void)</div><div class='ctx'>  */</div><div class='ctx'> static int do_epoll_create(int flags)</div><div class='ctx'> {</div><div class='del'>-	int error, fd;</div><div class='del'>-	struct eventpoll *ep = NULL;</div><div class='del'>-	struct file *file;</div><div class='add'>+	int error;</div><div class='add'>+	struct eventpoll *ep;</div><div class='ctx'> </div><div class='ctx'> 	/* Check the EPOLL_* constant for consistency.  */</div><div class='ctx'> 	BUILD_BUG_ON(EPOLL_CLOEXEC != O_CLOEXEC);</div><div class='hunk'>@@ -1976,26 +2183,15 @@ static int do_epoll_create(int flags)</div><div class='ctx'> 	 * Creates all the items needed to setup an eventpoll file. That is,</div><div class='ctx'> 	 * a file structure and a free file descriptor.</div><div class='ctx'> 	 */</div><div class='del'>-	fd = get_unused_fd_flags(O_RDWR | (flags &amp; O_CLOEXEC));</div><div class='del'>-	if (fd &lt; 0) {</div><div class='del'>-		error = fd;</div><div class='del'>-		goto out_free_ep;</div><div class='add'>+	FD_PREPARE(fdf, O_RDWR | (flags &amp; O_CLOEXEC),</div><div class='add'>+		   anon_inode_getfile("[eventpoll]", &amp;eventpoll_fops, ep,</div><div class='add'>+				      O_RDWR | (flags &amp; O_CLOEXEC)));</div><div class='add'>+	if (fdf.err) {</div><div class='add'>+		ep_clear_and_put(ep);</div><div class='add'>+		return fdf.err;</div><div class='ctx'> 	}</div><div class='del'>-	file = anon_inode_getfile("[eventpoll]", &amp;eventpoll_fops, ep,</div><div class='del'>-				 O_RDWR | (flags &amp; O_CLOEXEC));</div><div class='del'>-	if (IS_ERR(file)) {</div><div class='del'>-		error = PTR_ERR(file);</div><div class='del'>-		goto out_free_fd;</div><div class='del'>-	}</div><div class='del'>-	ep-&gt;file = file;</div><div class='del'>-	fd_install(fd, file);</div><div class='del'>-	return fd;</div><div class='del'>-</div><div class='del'>-out_free_fd:</div><div class='del'>-	put_unused_fd(fd);</div><div class='del'>-out_free_ep:</div><div class='del'>-	ep_free(ep);</div><div class='del'>-	return error;</div><div class='add'>+	ep-&gt;file = fd_prepare_file(fdf);</div><div class='add'>+	return fd_publish(fdf);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> SYSCALL_DEFINE1(epoll_create1, int, flags)</div><div class='hunk'>@@ -2011,6 +2207,19 @@ SYSCALL_DEFINE1(epoll_create, int, size)</div><div class='ctx'> 	return do_epoll_create(0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_PM_SLEEP</div><div class='add'>+static inline void ep_take_care_of_epollwakeup(struct epoll_event *epev)</div><div class='add'>+{</div><div class='add'>+	if ((epev-&gt;events &amp; EPOLLWAKEUP) &amp;&amp; !capable(CAP_BLOCK_SUSPEND))</div><div class='add'>+		epev-&gt;events &amp;= ~EPOLLWAKEUP;</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+static inline void ep_take_care_of_epollwakeup(struct epoll_event *epev)</div><div class='add'>+{</div><div class='add'>+	epev-&gt;events &amp;= ~EPOLLWAKEUP;</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> static inline int epoll_mutex_lock(struct mutex *mutex, int depth,</div><div class='ctx'> 				   bool nonblock)</div><div class='ctx'> {</div><div class='hunk'>@@ -2028,25 +2237,22 @@ int do_epoll_ctl(int epfd, int op, int fd, struct epoll_event *epds,</div><div class='ctx'> {</div><div class='ctx'> 	int error;</div><div class='ctx'> 	int full_check = 0;</div><div class='del'>-	struct fd f, tf;</div><div class='ctx'> 	struct eventpoll *ep;</div><div class='ctx'> 	struct epitem *epi;</div><div class='ctx'> 	struct eventpoll *tep = NULL;</div><div class='ctx'> </div><div class='del'>-	error = -EBADF;</div><div class='del'>-	f = fdget(epfd);</div><div class='del'>-	if (!f.file)</div><div class='del'>-		goto error_return;</div><div class='add'>+	CLASS(fd, f)(epfd);</div><div class='add'>+	if (fd_empty(f))</div><div class='add'>+		return -EBADF;</div><div class='ctx'> </div><div class='ctx'> 	/* Get the "struct file *" for the target file */</div><div class='del'>-	tf = fdget(fd);</div><div class='del'>-	if (!tf.file)</div><div class='del'>-		goto error_fput;</div><div class='add'>+	CLASS(fd, tf)(fd);</div><div class='add'>+	if (fd_empty(tf))</div><div class='add'>+		return -EBADF;</div><div class='ctx'> </div><div class='ctx'> 	/* The target file descriptor must support poll */</div><div class='del'>-	error = -EPERM;</div><div class='del'>-	if (!file_can_poll(tf.file))</div><div class='del'>-		goto error_tgt_fput;</div><div class='add'>+	if (!file_can_poll(fd_file(tf)))</div><div class='add'>+		return -EPERM;</div><div class='ctx'> </div><div class='ctx'> 	/* Check if EPOLLWAKEUP is allowed */</div><div class='ctx'> 	if (ep_op_has_event(op))</div><div class='hunk'>@@ -2058,7 +2264,7 @@ int do_epoll_ctl(int epfd, int op, int fd, struct epoll_event *epds,</div><div class='ctx'> 	 * adding an epoll file descriptor inside itself.</div><div class='ctx'> 	 */</div><div class='ctx'> 	error = -EINVAL;</div><div class='del'>-	if (f.file == tf.file || !is_file_epoll(f.file))</div><div class='add'>+	if (fd_file(f) == fd_file(tf) || !is_file_epoll(fd_file(f)))</div><div class='ctx'> 		goto error_tgt_fput;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -2069,7 +2275,7 @@ int do_epoll_ctl(int epfd, int op, int fd, struct epoll_event *epds,</div><div class='ctx'> 	if (ep_op_has_event(op) &amp;&amp; (epds-&gt;events &amp; EPOLLEXCLUSIVE)) {</div><div class='ctx'> 		if (op == EPOLL_CTL_MOD)</div><div class='ctx'> 			goto error_tgt_fput;</div><div class='del'>-		if (op == EPOLL_CTL_ADD &amp;&amp; (is_file_epoll(tf.file) ||</div><div class='add'>+		if (op == EPOLL_CTL_ADD &amp;&amp; (is_file_epoll(fd_file(tf)) ||</div><div class='ctx'> 				(epds-&gt;events &amp; ~EPOLLEXCLUSIVE_OK_BITS)))</div><div class='ctx'> 			goto error_tgt_fput;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2078,7 +2284,7 @@ int do_epoll_ctl(int epfd, int op, int fd, struct epoll_event *epds,</div><div class='ctx'> 	 * At this point it is safe to assume that the "private_data" contains</div><div class='ctx'> 	 * our own data structure.</div><div class='ctx'> 	 */</div><div class='del'>-	ep = f.file-&gt;private_data;</div><div class='add'>+	ep = fd_file(f)-&gt;private_data;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * When we insert an epoll file descriptor inside another epoll file</div><div class='hunk'>@@ -2091,7 +2297,7 @@ int do_epoll_ctl(int epfd, int op, int fd, struct epoll_event *epds,</div><div class='ctx'> 	 * We do not need to take the global 'epumutex' on EPOLL_CTL_ADD when</div><div class='ctx'> 	 * the epoll file descriptor is attaching directly to a wakeup source,</div><div class='ctx'> 	 * unless the epoll file descriptor is nested. The purpose of taking the</div><div class='del'>-	 * 'epmutex' on add is to prevent complex toplogies such as loops and</div><div class='add'>+	 * 'epnested_mutex' on add is to prevent complex toplogies such as loops and</div><div class='ctx'> 	 * deep wakeup paths from forming in parallel through multiple</div><div class='ctx'> 	 * EPOLL_CTL_ADD operations.</div><div class='ctx'> 	 */</div><div class='hunk'>@@ -2099,16 +2305,16 @@ int do_epoll_ctl(int epfd, int op, int fd, struct epoll_event *epds,</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto error_tgt_fput;</div><div class='ctx'> 	if (op == EPOLL_CTL_ADD) {</div><div class='del'>-		if (READ_ONCE(f.file-&gt;f_ep) || ep-&gt;gen == loop_check_gen ||</div><div class='del'>-		    is_file_epoll(tf.file)) {</div><div class='add'>+		if (READ_ONCE(fd_file(f)-&gt;f_ep) || ep-&gt;gen == loop_check_gen ||</div><div class='add'>+		    is_file_epoll(fd_file(tf))) {</div><div class='ctx'> 			mutex_unlock(&amp;ep-&gt;mtx);</div><div class='del'>-			error = epoll_mutex_lock(&amp;epmutex, 0, nonblock);</div><div class='add'>+			error = epoll_mutex_lock(&amp;epnested_mutex, 0, nonblock);</div><div class='ctx'> 			if (error)</div><div class='ctx'> 				goto error_tgt_fput;</div><div class='ctx'> 			loop_check_gen++;</div><div class='ctx'> 			full_check = 1;</div><div class='del'>-			if (is_file_epoll(tf.file)) {</div><div class='del'>-				tep = tf.file-&gt;private_data;</div><div class='add'>+			if (is_file_epoll(fd_file(tf))) {</div><div class='add'>+				tep = fd_file(tf)-&gt;private_data;</div><div class='ctx'> 				error = -ELOOP;</div><div class='ctx'> 				if (ep_loop_check(ep, tep) != 0)</div><div class='ctx'> 					goto error_tgt_fput;</div><div class='hunk'>@@ -2124,22 +2330,28 @@ int do_epoll_ctl(int epfd, int op, int fd, struct epoll_event *epds,</div><div class='ctx'> 	 * above, we can be sure to be able to use the item looked up by</div><div class='ctx'> 	 * ep_find() till we release the mutex.</div><div class='ctx'> 	 */</div><div class='del'>-	epi = ep_find(ep, tf.file, fd);</div><div class='add'>+	epi = ep_find(ep, fd_file(tf), fd);</div><div class='ctx'> </div><div class='ctx'> 	error = -EINVAL;</div><div class='ctx'> 	switch (op) {</div><div class='ctx'> 	case EPOLL_CTL_ADD:</div><div class='ctx'> 		if (!epi) {</div><div class='ctx'> 			epds-&gt;events |= EPOLLERR | EPOLLHUP;</div><div class='del'>-			error = ep_insert(ep, epds, tf.file, fd, full_check);</div><div class='add'>+			error = ep_insert(ep, epds, fd_file(tf), fd, full_check);</div><div class='ctx'> 		} else</div><div class='ctx'> 			error = -EEXIST;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case EPOLL_CTL_DEL:</div><div class='del'>-		if (epi)</div><div class='del'>-			error = ep_remove(ep, epi);</div><div class='del'>-		else</div><div class='add'>+		if (epi) {</div><div class='add'>+			/*</div><div class='add'>+			 * The eventpoll itself is still alive: the refcount</div><div class='add'>+			 * can't go to zero here.</div><div class='add'>+			 */</div><div class='add'>+			ep_remove_safe(ep, epi);</div><div class='add'>+			error = 0;</div><div class='add'>+		} else {</div><div class='ctx'> 			error = -ENOENT;</div><div class='add'>+		}</div><div class='ctx'> 		break;</div><div class='ctx'> 	case EPOLL_CTL_MOD:</div><div class='ctx'> 		if (epi) {</div><div class='hunk'>@@ -2157,14 +2369,8 @@ error_tgt_fput:</div><div class='ctx'> 	if (full_check) {</div><div class='ctx'> 		clear_tfile_check_list();</div><div class='ctx'> 		loop_check_gen++;</div><div class='del'>-		mutex_unlock(&amp;epmutex);</div><div class='add'>+		mutex_unlock(&amp;epnested_mutex);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	fdput(tf);</div><div class='del'>-error_fput:</div><div class='del'>-	fdput(f);</div><div class='del'>-error_return:</div><div class='del'>-</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2185,50 +2391,74 @@ SYSCALL_DEFINE4(epoll_ctl, int, epfd, int, op, int, fd,</div><div class='ctx'> 	return do_epoll_ctl(epfd, op, fd, &amp;epds, false);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Implement the event wait interface for the eventpoll file. It is the kernel</div><div class='del'>- * part of the user space epoll_wait(2).</div><div class='del'>- */</div><div class='del'>-static int do_epoll_wait(int epfd, struct epoll_event __user *events,</div><div class='del'>-			 int maxevents, struct timespec64 *to)</div><div class='add'>+static int ep_check_params(struct file *file, struct epoll_event __user *evs,</div><div class='add'>+			   int maxevents)</div><div class='ctx'> {</div><div class='del'>-	int error;</div><div class='del'>-	struct fd f;</div><div class='del'>-	struct eventpoll *ep;</div><div class='del'>-</div><div class='ctx'> 	/* The maximum number of event must be greater than zero */</div><div class='ctx'> 	if (maxevents &lt;= 0 || maxevents &gt; EP_MAX_EVENTS)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	/* Verify that the area passed by the user is writeable */</div><div class='del'>-	if (!access_ok(events, maxevents * sizeof(struct epoll_event)))</div><div class='add'>+	if (!access_ok(evs, maxevents * sizeof(struct epoll_event)))</div><div class='ctx'> 		return -EFAULT;</div><div class='ctx'> </div><div class='del'>-	/* Get the "struct file *" for the eventpoll file */</div><div class='del'>-	f = fdget(epfd);</div><div class='del'>-	if (!f.file)</div><div class='del'>-		return -EBADF;</div><div class='del'>-</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We have to check that the file structure underneath the fd</div><div class='ctx'> 	 * the user passed to us _is_ an eventpoll file.</div><div class='ctx'> 	 */</div><div class='del'>-	error = -EINVAL;</div><div class='del'>-	if (!is_file_epoll(f.file))</div><div class='del'>-		goto error_fput;</div><div class='add'>+	if (!is_file_epoll(file))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int epoll_sendevents(struct file *file, struct epoll_event __user *events,</div><div class='add'>+		     int maxevents)</div><div class='add'>+{</div><div class='add'>+	struct eventpoll *ep;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = ep_check_params(file, events, maxevents);</div><div class='add'>+	if (unlikely(ret))</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	ep = file-&gt;private_data;</div><div class='add'>+	/*</div><div class='add'>+	 * Racy call, but that's ok - it should get retried based on</div><div class='add'>+	 * poll readiness anyway.</div><div class='add'>+	 */</div><div class='add'>+	if (ep_events_available(ep))</div><div class='add'>+		return ep_try_send_events(ep, events, maxevents);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Implement the event wait interface for the eventpoll file. It is the kernel</div><div class='add'>+ * part of the user space epoll_wait(2).</div><div class='add'>+ */</div><div class='add'>+static int do_epoll_wait(int epfd, struct epoll_event __user *events,</div><div class='add'>+			 int maxevents, struct timespec64 *to)</div><div class='add'>+{</div><div class='add'>+	struct eventpoll *ep;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	/* Get the "struct file *" for the eventpoll file */</div><div class='add'>+	CLASS(fd, f)(epfd);</div><div class='add'>+	if (fd_empty(f))</div><div class='add'>+		return -EBADF;</div><div class='add'>+</div><div class='add'>+	ret = ep_check_params(fd_file(f), events, maxevents);</div><div class='add'>+	if (unlikely(ret))</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * At this point it is safe to assume that the "private_data" contains</div><div class='ctx'> 	 * our own data structure.</div><div class='ctx'> 	 */</div><div class='del'>-	ep = f.file-&gt;private_data;</div><div class='add'>+	ep = fd_file(f)-&gt;private_data;</div><div class='ctx'> </div><div class='ctx'> 	/* Time to fish for events ... */</div><div class='del'>-	error = ep_poll(ep, events, maxevents, to);</div><div class='del'>-</div><div class='del'>-error_fput:</div><div class='del'>-	fdput(f);</div><div class='del'>-	return error;</div><div class='add'>+	return ep_poll(ep, events, maxevents, to);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> SYSCALL_DEFINE4(epoll_wait, int, epfd, struct epoll_event __user *, events,</div><div class='hunk'>@@ -2378,6 +2608,7 @@ static int __init eventpoll_init(void)</div><div class='ctx'> 	/* Allocates slab cache used to allocate "struct eppoll_entry" */</div><div class='ctx'> 	pwq_cache = kmem_cache_create("eventpoll_pwq",</div><div class='ctx'> 		sizeof(struct eppoll_entry), 0, SLAB_PANIC|SLAB_ACCOUNT, NULL);</div><div class='add'>+	epoll_sysctls_init();</div><div class='ctx'> </div><div class='ctx'> 	ephead_cache = kmem_cache_create("ep_head",</div><div class='ctx'> 		sizeof(struct epitems_head), 0, SLAB_PANIC|SLAB_ACCOUNT, NULL);</div><div class='head'>diff --git a/fs/exec.c b/fs/exec.c<br/>index 537d92c41105..9d5ebc9d15b0 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/exec.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exec.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/exec.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/exec.c</a></div><div class='hunk'>@@ -28,7 +28,6 @@</div><div class='ctx'> #include &lt;linux/file.h&gt;</div><div class='ctx'> #include &lt;linux/fdtable.h&gt;</div><div class='ctx'> #include &lt;linux/mm.h&gt;</div><div class='del'>-#include &lt;linux/vmacache.h&gt;</div><div class='ctx'> #include &lt;linux/stat.h&gt;</div><div class='ctx'> #include &lt;linux/fcntl.h&gt;</div><div class='ctx'> #include &lt;linux/swap.h&gt;</div><div class='hunk'>@@ -56,7 +55,6 @@</div><div class='ctx'> #include &lt;linux/tsacct_kern.h&gt;</div><div class='ctx'> #include &lt;linux/cn_proc.h&gt;</div><div class='ctx'> #include &lt;linux/audit.h&gt;</div><div class='del'>-#include &lt;linux/tracehook.h&gt;</div><div class='ctx'> #include &lt;linux/kmod.h&gt;</div><div class='ctx'> #include &lt;linux/fsnotify.h&gt;</div><div class='ctx'> #include &lt;linux/fs_struct.h&gt;</div><div class='hunk'>@@ -65,6 +63,11 @@</div><div class='ctx'> #include &lt;linux/vmalloc.h&gt;</div><div class='ctx'> #include &lt;linux/io_uring.h&gt;</div><div class='ctx'> #include &lt;linux/syscall_user_dispatch.h&gt;</div><div class='add'>+#include &lt;linux/coredump.h&gt;</div><div class='add'>+#include &lt;linux/time_namespace.h&gt;</div><div class='add'>+#include &lt;linux/user_events.h&gt;</div><div class='add'>+#include &lt;linux/rseq.h&gt;</div><div class='add'>+#include &lt;linux/ksm.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/uaccess.h&gt;</div><div class='ctx'> #include &lt;asm/mmu_context.h&gt;</div><div class='hunk'>@@ -75,6 +78,9 @@</div><div class='ctx'> </div><div class='ctx'> #include &lt;trace/events/sched.h&gt;</div><div class='ctx'> </div><div class='add'>+/* For vma exec functions. */</div><div class='add'>+#include "../mm/internal.h"</div><div class='add'>+</div><div class='ctx'> static int bprm_creds_from_file(struct linux_binprm *bprm);</div><div class='ctx'> </div><div class='ctx'> int suid_dumpable = 0;</div><div class='hunk'>@@ -108,74 +114,13 @@ static inline void put_binfmt(struct linux_binfmt * fmt)</div><div class='ctx'> </div><div class='ctx'> bool path_noexec(const struct path *path)</div><div class='ctx'> {</div><div class='add'>+	/* If it's an anonymous inode make sure that we catch any shenanigans. */</div><div class='add'>+	VFS_WARN_ON_ONCE(IS_ANON_FILE(d_inode(path-&gt;dentry)) &amp;&amp;</div><div class='add'>+			 !(path-&gt;mnt-&gt;mnt_sb-&gt;s_iflags &amp; SB_I_NOEXEC));</div><div class='ctx'> 	return (path-&gt;mnt-&gt;mnt_flags &amp; MNT_NOEXEC) ||</div><div class='ctx'> 	       (path-&gt;mnt-&gt;mnt_sb-&gt;s_iflags &amp; SB_I_NOEXEC);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_USELIB</div><div class='del'>-/*</div><div class='del'>- * Note that a shared library must be both readable and executable due to</div><div class='del'>- * security reasons.</div><div class='del'>- *</div><div class='del'>- * Also note that we take the address to load from from the file itself.</div><div class='del'>- */</div><div class='del'>-SYSCALL_DEFINE1(uselib, const char __user *, library)</div><div class='del'>-{</div><div class='del'>-	struct linux_binfmt *fmt;</div><div class='del'>-	struct file *file;</div><div class='del'>-	struct filename *tmp = getname(library);</div><div class='del'>-	int error = PTR_ERR(tmp);</div><div class='del'>-	static const struct open_flags uselib_flags = {</div><div class='del'>-		.open_flag = O_LARGEFILE | O_RDONLY | __FMODE_EXEC,</div><div class='del'>-		.acc_mode = MAY_READ | MAY_EXEC,</div><div class='del'>-		.intent = LOOKUP_OPEN,</div><div class='del'>-		.lookup_flags = LOOKUP_FOLLOW,</div><div class='del'>-	};</div><div class='del'>-</div><div class='del'>-	if (IS_ERR(tmp))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	file = do_filp_open(AT_FDCWD, tmp, &amp;uselib_flags);</div><div class='del'>-	putname(tmp);</div><div class='del'>-	error = PTR_ERR(file);</div><div class='del'>-	if (IS_ERR(file))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * may_open() has already checked for this, so it should be</div><div class='del'>-	 * impossible to trip now. But we need to be extra cautious</div><div class='del'>-	 * and check again at the very end too.</div><div class='del'>-	 */</div><div class='del'>-	error = -EACCES;</div><div class='del'>-	if (WARN_ON_ONCE(!S_ISREG(file_inode(file)-&gt;i_mode) ||</div><div class='del'>-			 path_noexec(&amp;file-&gt;f_path)))</div><div class='del'>-		goto exit;</div><div class='del'>-</div><div class='del'>-	fsnotify_open(file);</div><div class='del'>-</div><div class='del'>-	error = -ENOEXEC;</div><div class='del'>-</div><div class='del'>-	read_lock(&amp;binfmt_lock);</div><div class='del'>-	list_for_each_entry(fmt, &amp;formats, lh) {</div><div class='del'>-		if (!fmt-&gt;load_shlib)</div><div class='del'>-			continue;</div><div class='del'>-		if (!try_module_get(fmt-&gt;module))</div><div class='del'>-			continue;</div><div class='del'>-		read_unlock(&amp;binfmt_lock);</div><div class='del'>-		error = fmt-&gt;load_shlib(file);</div><div class='del'>-		read_lock(&amp;binfmt_lock);</div><div class='del'>-		put_binfmt(fmt);</div><div class='del'>-		if (error != -ENOEXEC)</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-	read_unlock(&amp;binfmt_lock);</div><div class='del'>-exit:</div><div class='del'>-	fput(file);</div><div class='del'>-out:</div><div class='del'>-  	return error;</div><div class='del'>-}</div><div class='del'>-#endif /* #ifdef CONFIG_USELIB */</div><div class='del'>-</div><div class='ctx'> #ifdef CONFIG_MMU</div><div class='ctx'> /*</div><div class='ctx'>  * The nascent bprm-&gt;mm is not visible until exec_mmap() but it can</div><div class='hunk'>@@ -199,33 +144,31 @@ static struct page *get_arg_page(struct linux_binprm *bprm, unsigned long pos,</div><div class='ctx'> 		int write)</div><div class='ctx'> {</div><div class='ctx'> 	struct page *page;</div><div class='add'>+	struct vm_area_struct *vma = bprm-&gt;vma;</div><div class='add'>+	struct mm_struct *mm = bprm-&gt;mm;</div><div class='ctx'> 	int ret;</div><div class='del'>-	unsigned int gup_flags = FOLL_FORCE;</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_STACK_GROWSUP</div><div class='del'>-	if (write) {</div><div class='del'>-		ret = expand_downwards(bprm-&gt;vma, pos);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			return NULL;</div><div class='del'>-	}</div><div class='del'>-#endif</div><div class='ctx'> </div><div class='del'>-	if (write)</div><div class='del'>-		gup_flags |= FOLL_WRITE;</div><div class='add'>+	/*</div><div class='add'>+	 * Avoid relying on expanding the stack down in GUP (which</div><div class='add'>+	 * does not work for STACK_GROWSUP anyway), and just do it</div><div class='add'>+	 * ahead of time.</div><div class='add'>+	 */</div><div class='add'>+	if (!mmap_read_lock_maybe_expand(mm, vma, pos, write))</div><div class='add'>+		return NULL;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We are doing an exec().  'current' is the process</div><div class='del'>-	 * doing the exec and bprm-&gt;mm is the new process's mm.</div><div class='add'>+	 * doing the exec and 'mm' is the new process's mm.</div><div class='ctx'> 	 */</div><div class='del'>-	mmap_read_lock(bprm-&gt;mm);</div><div class='del'>-	ret = get_user_pages_remote(bprm-&gt;mm, pos, 1, gup_flags,</div><div class='del'>-			&amp;page, NULL, NULL);</div><div class='del'>-	mmap_read_unlock(bprm-&gt;mm);</div><div class='add'>+	ret = get_user_pages_remote(mm, pos, 1,</div><div class='add'>+			write ? FOLL_WRITE : 0,</div><div class='add'>+			&amp;page, NULL);</div><div class='add'>+	mmap_read_unlock(mm);</div><div class='ctx'> 	if (ret &lt;= 0)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='ctx'> 	if (write)</div><div class='del'>-		acct_arg_size(bprm, vma_pages(bprm-&gt;vma));</div><div class='add'>+		acct_arg_size(bprm, vma_pages(vma));</div><div class='ctx'> </div><div class='ctx'> 	return page;</div><div class='ctx'> }</div><div class='hunk'>@@ -245,50 +188,6 @@ static void flush_arg_page(struct linux_binprm *bprm, unsigned long pos,</div><div class='ctx'> 	flush_cache_page(bprm-&gt;vma, pos, page_to_pfn(page));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __bprm_mm_init(struct linux_binprm *bprm)</div><div class='del'>-{</div><div class='del'>-	int err;</div><div class='del'>-	struct vm_area_struct *vma = NULL;</div><div class='del'>-	struct mm_struct *mm = bprm-&gt;mm;</div><div class='del'>-</div><div class='del'>-	bprm-&gt;vma = vma = vm_area_alloc(mm);</div><div class='del'>-	if (!vma)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	vma_set_anonymous(vma);</div><div class='del'>-</div><div class='del'>-	if (mmap_write_lock_killable(mm)) {</div><div class='del'>-		err = -EINTR;</div><div class='del'>-		goto err_free;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Place the stack at the largest stack address the architecture</div><div class='del'>-	 * supports. Later, we'll move this to an appropriate place. We don't</div><div class='del'>-	 * use STACK_TOP because that can depend on attributes which aren't</div><div class='del'>-	 * configured yet.</div><div class='del'>-	 */</div><div class='del'>-	BUILD_BUG_ON(VM_STACK_FLAGS &amp; VM_STACK_INCOMPLETE_SETUP);</div><div class='del'>-	vma-&gt;vm_end = STACK_TOP_MAX;</div><div class='del'>-	vma-&gt;vm_start = vma-&gt;vm_end - PAGE_SIZE;</div><div class='del'>-	vma-&gt;vm_flags = VM_SOFTDIRTY | VM_STACK_FLAGS | VM_STACK_INCOMPLETE_SETUP;</div><div class='del'>-	vma-&gt;vm_page_prot = vm_get_page_prot(vma-&gt;vm_flags);</div><div class='del'>-</div><div class='del'>-	err = insert_vm_struct(mm, vma);</div><div class='del'>-	if (err)</div><div class='del'>-		goto err;</div><div class='del'>-</div><div class='del'>-	mm-&gt;stack_vm = mm-&gt;total_vm = 1;</div><div class='del'>-	mmap_write_unlock(mm);</div><div class='del'>-	bprm-&gt;p = vma-&gt;vm_end - sizeof(void *);</div><div class='del'>-	return 0;</div><div class='del'>-err:</div><div class='del'>-	mmap_write_unlock(mm);</div><div class='del'>-err_free:</div><div class='del'>-	bprm-&gt;vma = NULL;</div><div class='del'>-	vm_area_free(vma);</div><div class='del'>-	return err;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static bool valid_arg_len(struct linux_binprm *bprm, long len)</div><div class='ctx'> {</div><div class='ctx'> 	return len &lt;= MAX_ARG_STRLEN;</div><div class='hunk'>@@ -341,12 +240,6 @@ static void flush_arg_page(struct linux_binprm *bprm, unsigned long pos,</div><div class='ctx'> {</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __bprm_mm_init(struct linux_binprm *bprm)</div><div class='del'>-{</div><div class='del'>-	bprm-&gt;p = PAGE_SIZE * MAX_ARG_PAGES - sizeof(void *);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static bool valid_arg_len(struct linux_binprm *bprm, long len)</div><div class='ctx'> {</div><div class='ctx'> 	return len &lt;= bprm-&gt;p;</div><div class='hunk'>@@ -375,9 +268,13 @@ static int bprm_mm_init(struct linux_binprm *bprm)</div><div class='ctx'> 	bprm-&gt;rlim_stack = current-&gt;signal-&gt;rlim[RLIMIT_STACK];</div><div class='ctx'> 	task_unlock(current-&gt;group_leader);</div><div class='ctx'> </div><div class='del'>-	err = __bprm_mm_init(bprm);</div><div class='add'>+#ifndef CONFIG_MMU</div><div class='add'>+	bprm-&gt;p = PAGE_SIZE * MAX_ARG_PAGES - sizeof(void *);</div><div class='add'>+#else</div><div class='add'>+	err = create_init_stack_vma(bprm-&gt;mm, &amp;bprm-&gt;vma, &amp;bprm-&gt;p);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto err;</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='hunk'>@@ -469,6 +366,35 @@ static int count_strings_kernel(const char *const *argv)</div><div class='ctx'> 	return i;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline int bprm_set_stack_limit(struct linux_binprm *bprm,</div><div class='add'>+				       unsigned long limit)</div><div class='add'>+{</div><div class='add'>+#ifdef CONFIG_MMU</div><div class='add'>+	/* Avoid a pathological bprm-&gt;p. */</div><div class='add'>+	if (bprm-&gt;p &lt; limit)</div><div class='add'>+		return -E2BIG;</div><div class='add'>+	bprm-&gt;argmin = bprm-&gt;p - limit;</div><div class='add'>+#endif</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+static inline bool bprm_hit_stack_limit(struct linux_binprm *bprm)</div><div class='add'>+{</div><div class='add'>+#ifdef CONFIG_MMU</div><div class='add'>+	return bprm-&gt;p &lt; bprm-&gt;argmin;</div><div class='add'>+#else</div><div class='add'>+	return false;</div><div class='add'>+#endif</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Calculate bprm-&gt;argmin from:</div><div class='add'>+ * - _STK_LIM</div><div class='add'>+ * - ARG_MAX</div><div class='add'>+ * - bprm-&gt;rlim_stack.rlim_cur</div><div class='add'>+ * - bprm-&gt;argc</div><div class='add'>+ * - bprm-&gt;envc</div><div class='add'>+ * - bprm-&gt;p</div><div class='add'>+ */</div><div class='ctx'> static int bprm_stack_limits(struct linux_binprm *bprm)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned long limit, ptr_size;</div><div class='hunk'>@@ -488,20 +414,30 @@ static int bprm_stack_limits(struct linux_binprm *bprm)</div><div class='ctx'> 	 * of argument strings even with small stacks</div><div class='ctx'> 	 */</div><div class='ctx'> 	limit = max_t(unsigned long, limit, ARG_MAX);</div><div class='add'>+	/* Reject totally pathological counts. */</div><div class='add'>+	if (bprm-&gt;argc &lt; 0 || bprm-&gt;envc &lt; 0)</div><div class='add'>+		return -E2BIG;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We must account for the size of all the argv and envp pointers to</div><div class='ctx'> 	 * the argv and envp strings, since they will also take up space in</div><div class='ctx'> 	 * the stack. They aren't stored until much later when we can't</div><div class='ctx'> 	 * signal to the parent that the child has run out of stack space.</div><div class='ctx'> 	 * Instead, calculate it here so it's possible to fail gracefully.</div><div class='add'>+	 *</div><div class='add'>+	 * In the case of argc = 0, make sure there is space for adding a</div><div class='add'>+	 * empty string (which will bump argc to 1), to ensure confused</div><div class='add'>+	 * userspace programs don't start processing from argv[1], thinking</div><div class='add'>+	 * argc can never be 0, to keep them from walking envp by accident.</div><div class='add'>+	 * See do_execveat_common().</div><div class='ctx'> 	 */</div><div class='del'>-	ptr_size = (bprm-&gt;argc + bprm-&gt;envc) * sizeof(void *);</div><div class='add'>+	if (check_add_overflow(max(bprm-&gt;argc, 1), bprm-&gt;envc, &amp;ptr_size) ||</div><div class='add'>+	    check_mul_overflow(ptr_size, sizeof(void *), &amp;ptr_size))</div><div class='add'>+		return -E2BIG;</div><div class='ctx'> 	if (limit &lt;= ptr_size)</div><div class='ctx'> 		return -E2BIG;</div><div class='ctx'> 	limit -= ptr_size;</div><div class='ctx'> </div><div class='del'>-	bprm-&gt;argmin = bprm-&gt;p - limit;</div><div class='del'>-	return 0;</div><div class='add'>+	return bprm_set_stack_limit(bprm, limit);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -535,14 +471,12 @@ static int copy_strings(int argc, struct user_arg_ptr argv,</div><div class='ctx'> 		if (!valid_arg_len(bprm, len))</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='del'>-		/* We're going to work our way backwords. */</div><div class='add'>+		/* We're going to work our way backwards. */</div><div class='ctx'> 		pos = bprm-&gt;p;</div><div class='ctx'> 		str += len;</div><div class='ctx'> 		bprm-&gt;p -= len;</div><div class='del'>-#ifdef CONFIG_MMU</div><div class='del'>-		if (bprm-&gt;p &lt; bprm-&gt;argmin)</div><div class='add'>+		if (bprm_hit_stack_limit(bprm))</div><div class='ctx'> 			goto out;</div><div class='del'>-#endif</div><div class='ctx'> </div><div class='ctx'> 		while (len &gt; 0) {</div><div class='ctx'> 			int offset, bytes_to_copy;</div><div class='hunk'>@@ -577,11 +511,11 @@ static int copy_strings(int argc, struct user_arg_ptr argv,</div><div class='ctx'> </div><div class='ctx'> 				if (kmapped_page) {</div><div class='ctx'> 					flush_dcache_page(kmapped_page);</div><div class='del'>-					kunmap(kmapped_page);</div><div class='add'>+					kunmap_local(kaddr);</div><div class='ctx'> 					put_arg_page(kmapped_page);</div><div class='ctx'> 				}</div><div class='ctx'> 				kmapped_page = page;</div><div class='del'>-				kaddr = kmap(kmapped_page);</div><div class='add'>+				kaddr = kmap_local_page(kmapped_page);</div><div class='ctx'> 				kpos = pos &amp; PAGE_MASK;</div><div class='ctx'> 				flush_arg_page(bprm, kpos, kmapped_page);</div><div class='ctx'> 			}</div><div class='hunk'>@@ -595,7 +529,7 @@ static int copy_strings(int argc, struct user_arg_ptr argv,</div><div class='ctx'> out:</div><div class='ctx'> 	if (kmapped_page) {</div><div class='ctx'> 		flush_dcache_page(kmapped_page);</div><div class='del'>-		kunmap(kmapped_page);</div><div class='add'>+		kunmap_local(kaddr);</div><div class='ctx'> 		put_arg_page(kmapped_page);</div><div class='ctx'> 	}</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -617,14 +551,13 @@ int copy_string_kernel(const char *arg, struct linux_binprm *bprm)</div><div class='ctx'> 	/* We're going to work our way backwards. */</div><div class='ctx'> 	arg += len;</div><div class='ctx'> 	bprm-&gt;p -= len;</div><div class='del'>-	if (IS_ENABLED(CONFIG_MMU) &amp;&amp; bprm-&gt;p &lt; bprm-&gt;argmin)</div><div class='add'>+	if (bprm_hit_stack_limit(bprm))</div><div class='ctx'> 		return -E2BIG;</div><div class='ctx'> </div><div class='ctx'> 	while (len &gt; 0) {</div><div class='ctx'> 		unsigned int bytes_to_copy = min_t(unsigned int, len,</div><div class='ctx'> 				min_not_zero(offset_in_page(pos), PAGE_SIZE));</div><div class='ctx'> 		struct page *page;</div><div class='del'>-		char *kaddr;</div><div class='ctx'> </div><div class='ctx'> 		pos -= bytes_to_copy;</div><div class='ctx'> 		arg -= bytes_to_copy;</div><div class='hunk'>@@ -633,11 +566,8 @@ int copy_string_kernel(const char *arg, struct linux_binprm *bprm)</div><div class='ctx'> 		page = get_arg_page(bprm, pos, 1);</div><div class='ctx'> 		if (!page)</div><div class='ctx'> 			return -E2BIG;</div><div class='del'>-		kaddr = kmap_atomic(page);</div><div class='ctx'> 		flush_arg_page(bprm, pos &amp; PAGE_MASK, page);</div><div class='del'>-		memcpy(kaddr + offset_in_page(pos), arg, bytes_to_copy);</div><div class='del'>-		flush_dcache_page(page);</div><div class='del'>-		kunmap_atomic(kaddr);</div><div class='add'>+		memcpy_to_page(page, offset_in_page(pos), arg, bytes_to_copy);</div><div class='ctx'> 		put_arg_page(page);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -662,79 +592,6 @@ static int copy_strings_kernel(int argc, const char *const *argv,</div><div class='ctx'> #ifdef CONFIG_MMU</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * During bprm_mm_init(), we create a temporary stack at STACK_TOP_MAX.  Once</div><div class='del'>- * the binfmt code determines where the new stack should reside, we shift it to</div><div class='del'>- * its final location.  The process proceeds as follows:</div><div class='del'>- *</div><div class='del'>- * 1) Use shift to calculate the new vma endpoints.</div><div class='del'>- * 2) Extend vma to cover both the old and new ranges.  This ensures the</div><div class='del'>- *    arguments passed to subsequent functions are consistent.</div><div class='del'>- * 3) Move vma's page tables to the new range.</div><div class='del'>- * 4) Free up any cleared pgd range.</div><div class='del'>- * 5) Shrink the vma to cover only the new range.</div><div class='del'>- */</div><div class='del'>-static int shift_arg_pages(struct vm_area_struct *vma, unsigned long shift)</div><div class='del'>-{</div><div class='del'>-	struct mm_struct *mm = vma-&gt;vm_mm;</div><div class='del'>-	unsigned long old_start = vma-&gt;vm_start;</div><div class='del'>-	unsigned long old_end = vma-&gt;vm_end;</div><div class='del'>-	unsigned long length = old_end - old_start;</div><div class='del'>-	unsigned long new_start = old_start - shift;</div><div class='del'>-	unsigned long new_end = old_end - shift;</div><div class='del'>-	struct mmu_gather tlb;</div><div class='del'>-</div><div class='del'>-	BUG_ON(new_start &gt; new_end);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * ensure there are no vmas between where we want to go</div><div class='del'>-	 * and where we are</div><div class='del'>-	 */</div><div class='del'>-	if (vma != find_vma(mm, new_start))</div><div class='del'>-		return -EFAULT;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * cover the whole range: [new_start, old_end)</div><div class='del'>-	 */</div><div class='del'>-	if (vma_adjust(vma, new_start, old_end, vma-&gt;vm_pgoff, NULL))</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * move the page tables downwards, on failure we rely on</div><div class='del'>-	 * process cleanup to remove whatever mess we made.</div><div class='del'>-	 */</div><div class='del'>-	if (length != move_page_tables(vma, old_start,</div><div class='del'>-				       vma, new_start, length, false))</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	lru_add_drain();</div><div class='del'>-	tlb_gather_mmu(&amp;tlb, mm);</div><div class='del'>-	if (new_end &gt; old_start) {</div><div class='del'>-		/*</div><div class='del'>-		 * when the old and new regions overlap clear from new_end.</div><div class='del'>-		 */</div><div class='del'>-		free_pgd_range(&amp;tlb, new_end, old_end, new_end,</div><div class='del'>-			vma-&gt;vm_next ? vma-&gt;vm_next-&gt;vm_start : USER_PGTABLES_CEILING);</div><div class='del'>-	} else {</div><div class='del'>-		/*</div><div class='del'>-		 * otherwise, clean from old_start; this is done to not touch</div><div class='del'>-		 * the address space in [new_end, old_start) some architectures</div><div class='del'>-		 * have constraints on va-space that make this illegal (IA64) -</div><div class='del'>-		 * for the others its just a little faster.</div><div class='del'>-		 */</div><div class='del'>-		free_pgd_range(&amp;tlb, old_start, old_end, new_end,</div><div class='del'>-			vma-&gt;vm_next ? vma-&gt;vm_next-&gt;vm_start : USER_PGTABLES_CEILING);</div><div class='del'>-	}</div><div class='del'>-	tlb_finish_mmu(&amp;tlb);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Shrink the vma to just the new range.  Always succeeds.</div><div class='del'>-	 */</div><div class='del'>-	vma_adjust(vma, new_start, new_end, vma-&gt;vm_pgoff, NULL);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * Finalizes the stack vm_area_struct. The flags and permissions are updated,</div><div class='ctx'>  * the stack is optionally relocated, and some extra space is added.</div><div class='ctx'>  */</div><div class='hunk'>@@ -742,16 +599,18 @@ int setup_arg_pages(struct linux_binprm *bprm,</div><div class='ctx'> 		    unsigned long stack_top,</div><div class='ctx'> 		    int executable_stack)</div><div class='ctx'> {</div><div class='del'>-	unsigned long ret;</div><div class='add'>+	int ret;</div><div class='ctx'> 	unsigned long stack_shift;</div><div class='ctx'> 	struct mm_struct *mm = current-&gt;mm;</div><div class='ctx'> 	struct vm_area_struct *vma = bprm-&gt;vma;</div><div class='ctx'> 	struct vm_area_struct *prev = NULL;</div><div class='del'>-	unsigned long vm_flags;</div><div class='add'>+	vm_flags_t vm_flags;</div><div class='ctx'> 	unsigned long stack_base;</div><div class='ctx'> 	unsigned long stack_size;</div><div class='ctx'> 	unsigned long stack_expand;</div><div class='ctx'> 	unsigned long rlim_stack;</div><div class='add'>+	struct mmu_gather tlb;</div><div class='add'>+	struct vma_iterator vmi;</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_STACK_GROWSUP</div><div class='ctx'> 	/* Limit stack size */</div><div class='hunk'>@@ -760,7 +619,8 @@ int setup_arg_pages(struct linux_binprm *bprm,</div><div class='ctx'> 	stack_base = calc_max_stack_size(stack_base);</div><div class='ctx'> </div><div class='ctx'> 	/* Add space for stack randomization. */</div><div class='del'>-	stack_base += (STACK_RND_MASK &lt;&lt; PAGE_SHIFT);</div><div class='add'>+	if (current-&gt;flags &amp; PF_RANDOMIZE)</div><div class='add'>+		stack_base += (STACK_RND_MASK &lt;&lt; PAGE_SHIFT);</div><div class='ctx'> </div><div class='ctx'> 	/* Make sure we didn't let the argument array grow too large. */</div><div class='ctx'> 	if (vma-&gt;vm_end - vma-&gt;vm_start &gt; stack_base)</div><div class='hunk'>@@ -785,8 +645,6 @@ int setup_arg_pages(struct linux_binprm *bprm,</div><div class='ctx'> 	mm-&gt;arg_start = bprm-&gt;p;</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-	if (bprm-&gt;loader)</div><div class='del'>-		bprm-&gt;loader -= stack_shift;</div><div class='ctx'> 	bprm-&gt;exec -= stack_shift;</div><div class='ctx'> </div><div class='ctx'> 	if (mmap_write_lock_killable(mm))</div><div class='hunk'>@@ -806,8 +664,13 @@ int setup_arg_pages(struct linux_binprm *bprm,</div><div class='ctx'> 	vm_flags |= mm-&gt;def_flags;</div><div class='ctx'> 	vm_flags |= VM_STACK_INCOMPLETE_SETUP;</div><div class='ctx'> </div><div class='del'>-	ret = mprotect_fixup(vma, &amp;prev, vma-&gt;vm_start, vma-&gt;vm_end,</div><div class='add'>+	vma_iter_init(&amp;vmi, mm, vma-&gt;vm_start);</div><div class='add'>+</div><div class='add'>+	tlb_gather_mmu(&amp;tlb, mm);</div><div class='add'>+	ret = mprotect_fixup(&amp;vmi, &amp;tlb, vma, &amp;prev, vma-&gt;vm_start, vma-&gt;vm_end,</div><div class='ctx'> 			vm_flags);</div><div class='add'>+	tlb_finish_mmu(&amp;tlb);</div><div class='add'>+</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	BUG_ON(prev != vma);</div><div class='hunk'>@@ -819,13 +682,18 @@ int setup_arg_pages(struct linux_binprm *bprm,</div><div class='ctx'> </div><div class='ctx'> 	/* Move stack pages down in memory. */</div><div class='ctx'> 	if (stack_shift) {</div><div class='del'>-		ret = shift_arg_pages(vma, stack_shift);</div><div class='add'>+		/*</div><div class='add'>+		 * During bprm_mm_init(), we create a temporary stack at STACK_TOP_MAX.  Once</div><div class='add'>+		 * the binfmt code determines where the new stack should reside, we shift it to</div><div class='add'>+		 * its final location.</div><div class='add'>+		 */</div><div class='add'>+		ret = relocate_vma_down(vma, stack_shift);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* mprotect_fixup is overkill to remove the temporary stack flags */</div><div class='del'>-	vma-&gt;vm_flags &amp;= ~VM_STACK_INCOMPLETE_SETUP;</div><div class='add'>+	vm_flags_clear(vma, VM_STACK_INCOMPLETE_SETUP);</div><div class='ctx'> </div><div class='ctx'> 	stack_expand = 131072UL; /* randomly 32*4k (or 2*64k) pages */</div><div class='ctx'> 	stack_size = vma-&gt;vm_end - vma-&gt;vm_start;</div><div class='hunk'>@@ -834,19 +702,16 @@ int setup_arg_pages(struct linux_binprm *bprm,</div><div class='ctx'> 	 * will align it up.</div><div class='ctx'> 	 */</div><div class='ctx'> 	rlim_stack = bprm-&gt;rlim_stack.rlim_cur &amp; PAGE_MASK;</div><div class='add'>+</div><div class='add'>+	stack_expand = min(rlim_stack, stack_size + stack_expand);</div><div class='add'>+</div><div class='ctx'> #ifdef CONFIG_STACK_GROWSUP</div><div class='del'>-	if (stack_size + stack_expand &gt; rlim_stack)</div><div class='del'>-		stack_base = vma-&gt;vm_start + rlim_stack;</div><div class='del'>-	else</div><div class='del'>-		stack_base = vma-&gt;vm_end + stack_expand;</div><div class='add'>+	stack_base = vma-&gt;vm_start + stack_expand;</div><div class='ctx'> #else</div><div class='del'>-	if (stack_size + stack_expand &gt; rlim_stack)</div><div class='del'>-		stack_base = vma-&gt;vm_end - rlim_stack;</div><div class='del'>-	else</div><div class='del'>-		stack_base = vma-&gt;vm_start - stack_expand;</div><div class='add'>+	stack_base = vma-&gt;vm_end - stack_expand;</div><div class='ctx'> #endif</div><div class='ctx'> 	current-&gt;mm-&gt;start_stack = bprm-&gt;p;</div><div class='del'>-	ret = expand_stack(vma, stack_base);</div><div class='add'>+	ret = expand_stack_locked(vma, stack_base);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		ret = -EFAULT;</div><div class='ctx'> </div><div class='hunk'>@@ -873,15 +738,16 @@ int transfer_args_to_stack(struct linux_binprm *bprm,</div><div class='ctx'> </div><div class='ctx'> 	for (index = MAX_ARG_PAGES - 1; index &gt;= stop; index--) {</div><div class='ctx'> 		unsigned int offset = index == stop ? bprm-&gt;p &amp; ~PAGE_MASK : 0;</div><div class='del'>-		char *src = kmap(bprm-&gt;page[index]) + offset;</div><div class='add'>+		char *src = kmap_local_page(bprm-&gt;page[index]) + offset;</div><div class='ctx'> 		sp -= PAGE_SIZE - offset;</div><div class='ctx'> 		if (copy_to_user((void *) sp, src, PAGE_SIZE - offset) != 0)</div><div class='ctx'> 			ret = -EFAULT;</div><div class='del'>-		kunmap(bprm-&gt;page[index]);</div><div class='add'>+		kunmap_local(src);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	bprm-&gt;exec += *sp_location - MAX_ARG_PAGES * PAGE_SIZE;</div><div class='ctx'> 	*sp_location = sp;</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='hunk'>@@ -891,10 +757,14 @@ EXPORT_SYMBOL(transfer_args_to_stack);</div><div class='ctx'> </div><div class='ctx'> #endif /* CONFIG_MMU */</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * On success, caller must call do_close_execat() on the returned</div><div class='add'>+ * struct file to close it.</div><div class='add'>+ */</div><div class='ctx'> static struct file *do_open_execat(int fd, struct filename *name, int flags)</div><div class='ctx'> {</div><div class='del'>-	struct file *file;</div><div class='ctx'> 	int err;</div><div class='add'>+	struct file *file __free(fput) = NULL;</div><div class='ctx'> 	struct open_flags open_exec_flags = {</div><div class='ctx'> 		.open_flag = O_LARGEFILE | O_RDONLY | __FMODE_EXEC,</div><div class='ctx'> 		.acc_mode = MAY_EXEC,</div><div class='hunk'>@@ -902,7 +772,8 @@ static struct file *do_open_execat(int fd, struct filename *name, int flags)</div><div class='ctx'> 		.lookup_flags = LOOKUP_FOLLOW,</div><div class='ctx'> 	};</div><div class='ctx'> </div><div class='del'>-	if ((flags &amp; ~(AT_SYMLINK_NOFOLLOW | AT_EMPTY_PATH)) != 0)</div><div class='add'>+	if ((flags &amp;</div><div class='add'>+	     ~(AT_SYMLINK_NOFOLLOW | AT_EMPTY_PATH | AT_EXECVE_CHECK)) != 0)</div><div class='ctx'> 		return ERR_PTR(-EINVAL);</div><div class='ctx'> 	if (flags &amp; AT_SYMLINK_NOFOLLOW)</div><div class='ctx'> 		open_exec_flags.lookup_flags &amp;= ~LOOKUP_FOLLOW;</div><div class='hunk'>@@ -911,33 +782,37 @@ static struct file *do_open_execat(int fd, struct filename *name, int flags)</div><div class='ctx'> </div><div class='ctx'> 	file = do_filp_open(fd, name, &amp;open_exec_flags);</div><div class='ctx'> 	if (IS_ERR(file))</div><div class='del'>-		goto out;</div><div class='add'>+		return file;</div><div class='add'>+</div><div class='add'>+	if (path_noexec(&amp;file-&gt;f_path))</div><div class='add'>+		return ERR_PTR(-EACCES);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * may_open() has already checked for this, so it should be</div><div class='del'>-	 * impossible to trip now. But we need to be extra cautious</div><div class='del'>-	 * and check again at the very end too.</div><div class='add'>+	 * In the past the regular type check was here. It moved to may_open() in</div><div class='add'>+	 * 633fb6ac3980 ("exec: move S_ISREG() check earlier"). Since then it is</div><div class='add'>+	 * an invariant that all non-regular files error out before we get here.</div><div class='ctx'> 	 */</div><div class='del'>-	err = -EACCES;</div><div class='del'>-	if (WARN_ON_ONCE(!S_ISREG(file_inode(file)-&gt;i_mode) ||</div><div class='del'>-			 path_noexec(&amp;file-&gt;f_path)))</div><div class='del'>-		goto exit;</div><div class='add'>+	if (WARN_ON_ONCE(!S_ISREG(file_inode(file)-&gt;i_mode)))</div><div class='add'>+		return ERR_PTR(-EACCES);</div><div class='ctx'> </div><div class='del'>-	err = deny_write_access(file);</div><div class='add'>+	err = exe_file_deny_write_access(file);</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto exit;</div><div class='del'>-</div><div class='del'>-	if (name-&gt;name[0] != '\0')</div><div class='del'>-		fsnotify_open(file);</div><div class='add'>+		return ERR_PTR(err);</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	return file;</div><div class='del'>-</div><div class='del'>-exit:</div><div class='del'>-	fput(file);</div><div class='del'>-	return ERR_PTR(err);</div><div class='add'>+	return no_free_ptr(file);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * open_exec - Open a path name for execution</div><div class='add'>+ *</div><div class='add'>+ * @name: path name to open with the intent of executing it.</div><div class='add'>+ *</div><div class='add'>+ * Returns ERR_PTR on failure or allocated struct file on success.</div><div class='add'>+ *</div><div class='add'>+ * As this is a wrapper for the internal do_open_execat(), callers</div><div class='add'>+ * must call exe_file_allow_write_access() before fput() on release. Also see</div><div class='add'>+ * do_close_execat().</div><div class='add'>+ */</div><div class='ctx'> struct file *open_exec(const char *name)</div><div class='ctx'> {</div><div class='ctx'> 	struct filename *filename = getname_kernel(name);</div><div class='hunk'>@@ -951,8 +826,7 @@ struct file *open_exec(const char *name)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(open_exec);</div><div class='ctx'> </div><div class='del'>-#if defined(CONFIG_HAVE_AOUT) || defined(CONFIG_BINFMT_FLAT) || \</div><div class='del'>-    defined(CONFIG_BINFMT_ELF_FDPIC)</div><div class='add'>+#if defined(CONFIG_BINFMT_FLAT) || defined(CONFIG_BINFMT_ELF_FDPIC)</div><div class='ctx'> ssize_t read_code(struct file *file, unsigned long addr, loff_t pos, size_t len)</div><div class='ctx'> {</div><div class='ctx'> 	ssize_t res = vfs_read(file, (void __user *)addr, len, &amp;pos);</div><div class='hunk'>@@ -978,8 +852,6 @@ static int exec_mmap(struct mm_struct *mm)</div><div class='ctx'> 	tsk = current;</div><div class='ctx'> 	old_mm = current-&gt;mm;</div><div class='ctx'> 	exec_mm_release(tsk, old_mm);</div><div class='del'>-	if (old_mm)</div><div class='del'>-		sync_mm_rss(old_mm);</div><div class='ctx'> </div><div class='ctx'> 	ret = down_write_killable(&amp;tsk-&gt;signal-&gt;exec_update_lock);</div><div class='ctx'> 	if (ret)</div><div class='hunk'>@@ -1005,6 +877,7 @@ static int exec_mmap(struct mm_struct *mm)</div><div class='ctx'> 	active_mm = tsk-&gt;active_mm;</div><div class='ctx'> 	tsk-&gt;active_mm = mm;</div><div class='ctx'> 	tsk-&gt;mm = mm;</div><div class='add'>+	mm_init_cid(mm, tsk);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * This prevents preemption while active_mm is being loaded and</div><div class='ctx'> 	 * it and mm are being updated, which could cause problems for</div><div class='hunk'>@@ -1017,9 +890,9 @@ static int exec_mmap(struct mm_struct *mm)</div><div class='ctx'> 	activate_mm(active_mm, mm);</div><div class='ctx'> 	if (IS_ENABLED(CONFIG_ARCH_WANT_IRQS_OFF_ACTIVATE_MM))</div><div class='ctx'> 		local_irq_enable();</div><div class='del'>-	tsk-&gt;mm-&gt;vmacache_seqnum = 0;</div><div class='del'>-	vmacache_flush(tsk);</div><div class='add'>+	lru_gen_add_mm(mm);</div><div class='ctx'> 	task_unlock(tsk);</div><div class='add'>+	lru_gen_use_mm(mm);</div><div class='ctx'> 	if (old_mm) {</div><div class='ctx'> 		mmap_read_unlock(old_mm);</div><div class='ctx'> 		BUG_ON(active_mm != old_mm);</div><div class='hunk'>@@ -1028,7 +901,7 @@ static int exec_mmap(struct mm_struct *mm)</div><div class='ctx'> 		mmput(old_mm);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='del'>-	mmdrop(active_mm);</div><div class='add'>+	mmdrop_lazy_tlb(active_mm);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1045,7 +918,7 @@ static int de_thread(struct task_struct *tsk)</div><div class='ctx'> 	 * Kill all other threads in the thread group.</div><div class='ctx'> 	 */</div><div class='ctx'> 	spin_lock_irq(lock);</div><div class='del'>-	if (signal_group_exit(sig)) {</div><div class='add'>+	if ((sig-&gt;flags &amp; SIGNAL_GROUP_EXIT) || sig-&gt;group_exec_task) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Another group action in progress, just</div><div class='ctx'> 		 * return so that the signal is processed.</div><div class='hunk'>@@ -1054,7 +927,7 @@ static int de_thread(struct task_struct *tsk)</div><div class='ctx'> 		return -EAGAIN;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	sig-&gt;group_exit_task = tsk;</div><div class='add'>+	sig-&gt;group_exec_task = tsk;</div><div class='ctx'> 	sig-&gt;notify_count = zap_other_threads(tsk);</div><div class='ctx'> 	if (!thread_group_leader(tsk))</div><div class='ctx'> 		sig-&gt;notify_count--;</div><div class='hunk'>@@ -1082,7 +955,7 @@ static int de_thread(struct task_struct *tsk)</div><div class='ctx'> 			write_lock_irq(&amp;tasklist_lock);</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Do this under tasklist_lock to ensure that</div><div class='del'>-			 * exit_notify() can't miss -&gt;group_exit_task</div><div class='add'>+			 * exit_notify() can't miss -&gt;group_exec_task</div><div class='ctx'> 			 */</div><div class='ctx'> 			sig-&gt;notify_count = -1;</div><div class='ctx'> 			if (likely(leader-&gt;exit_state))</div><div class='hunk'>@@ -1135,11 +1008,10 @@ static int de_thread(struct task_struct *tsk)</div><div class='ctx'> </div><div class='ctx'> 		BUG_ON(leader-&gt;exit_state != EXIT_ZOMBIE);</div><div class='ctx'> 		leader-&gt;exit_state = EXIT_DEAD;</div><div class='del'>-</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We are going to release_task()-&gt;ptrace_unlink() silently,</div><div class='ctx'> 		 * the tracer can sleep in do_wait(). EXIT_DEAD guarantees</div><div class='del'>-		 * the tracer wont't block again waiting for this thread.</div><div class='add'>+		 * the tracer won't block again waiting for this thread.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (unlikely(leader-&gt;ptrace))</div><div class='ctx'> 			__wake_up_parent(leader, leader-&gt;parent);</div><div class='hunk'>@@ -1149,7 +1021,7 @@ static int de_thread(struct task_struct *tsk)</div><div class='ctx'> 		release_task(leader);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	sig-&gt;group_exit_task = NULL;</div><div class='add'>+	sig-&gt;group_exec_task = NULL;</div><div class='ctx'> 	sig-&gt;notify_count = 0;</div><div class='ctx'> </div><div class='ctx'> no_thread_group:</div><div class='hunk'>@@ -1162,7 +1034,7 @@ no_thread_group:</div><div class='ctx'> killed:</div><div class='ctx'> 	/* protects against exit_notify() and __exit_signal() */</div><div class='ctx'> 	read_lock(&amp;tasklist_lock);</div><div class='del'>-	sig-&gt;group_exit_task = NULL;</div><div class='add'>+	sig-&gt;group_exec_task = NULL;</div><div class='ctx'> 	sig-&gt;notify_count = 0;</div><div class='ctx'> 	read_unlock(&amp;tasklist_lock);</div><div class='ctx'> 	return -EAGAIN;</div><div class='hunk'>@@ -1190,11 +1062,11 @@ static int unshare_sighand(struct task_struct *me)</div><div class='ctx'> 			return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 		refcount_set(&amp;newsighand-&gt;count, 1);</div><div class='del'>-		memcpy(newsighand-&gt;action, oldsighand-&gt;action,</div><div class='del'>-		       sizeof(newsighand-&gt;action));</div><div class='ctx'> </div><div class='ctx'> 		write_lock_irq(&amp;tasklist_lock);</div><div class='ctx'> 		spin_lock(&amp;oldsighand-&gt;siglock);</div><div class='add'>+		memcpy(newsighand-&gt;action, oldsighand-&gt;action,</div><div class='add'>+		       sizeof(newsighand-&gt;action));</div><div class='ctx'> 		rcu_assign_pointer(me-&gt;sighand, newsighand);</div><div class='ctx'> 		spin_unlock(&amp;oldsighand-&gt;siglock);</div><div class='ctx'> 		write_unlock_irq(&amp;tasklist_lock);</div><div class='hunk'>@@ -1204,26 +1076,17 @@ static int unshare_sighand(struct task_struct *me)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-char *__get_task_comm(char *buf, size_t buf_size, struct task_struct *tsk)</div><div class='del'>-{</div><div class='del'>-	task_lock(tsk);</div><div class='del'>-	strncpy(buf, tsk-&gt;comm, buf_size);</div><div class='del'>-	task_unlock(tsk);</div><div class='del'>-	return buf;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL_GPL(__get_task_comm);</div><div class='del'>-</div><div class='ctx'> /*</div><div class='del'>- * These functions flushes out all traces of the currently running executable</div><div class='del'>- * so that a new one can be started</div><div class='add'>+ * This is unlocked -- the string will always be NUL-terminated, but</div><div class='add'>+ * may show overlapping contents if racing concurrent reads.</div><div class='ctx'>  */</div><div class='del'>-</div><div class='ctx'> void __set_task_comm(struct task_struct *tsk, const char *buf, bool exec)</div><div class='ctx'> {</div><div class='del'>-	task_lock(tsk);</div><div class='add'>+	size_t len = min(strlen(buf), sizeof(tsk-&gt;comm) - 1);</div><div class='add'>+</div><div class='ctx'> 	trace_task_rename(tsk, buf);</div><div class='del'>-	strlcpy(tsk-&gt;comm, buf, sizeof(tsk-&gt;comm));</div><div class='del'>-	task_unlock(tsk);</div><div class='add'>+	memcpy(tsk-&gt;comm, buf, len);</div><div class='add'>+	memset(&amp;tsk-&gt;comm[len], 0, sizeof(tsk-&gt;comm) - len);</div><div class='ctx'> 	perf_event_comm(tsk, exec);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1244,17 +1107,24 @@ int begin_new_exec(struct linux_binprm * bprm)</div><div class='ctx'> 		return retval;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Ensure all future errors are fatal.</div><div class='add'>+	 * This tracepoint marks the point before flushing the old exec where</div><div class='add'>+	 * the current task is still unchanged, but errors are fatal (point of</div><div class='add'>+	 * no return). The later "sched_process_exec" tracepoint is called after</div><div class='add'>+	 * the current task has successfully switched to the new exec.</div><div class='ctx'> 	 */</div><div class='del'>-	bprm-&gt;point_of_no_return = true;</div><div class='add'>+	trace_sched_prepare_exec(current, bprm);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Make this the only thread in the thread group.</div><div class='add'>+	 * Ensure all future errors are fatal.</div><div class='ctx'> 	 */</div><div class='add'>+	bprm-&gt;point_of_no_return = true;</div><div class='add'>+</div><div class='add'>+	/* Make this the only thread in the thread group */</div><div class='ctx'> 	retval = de_thread(me);</div><div class='ctx'> 	if (retval)</div><div class='ctx'> 		goto out;</div><div class='del'>-</div><div class='add'>+	/* see the comment in check_unsafe_exec() */</div><div class='add'>+	current-&gt;fs-&gt;in_exec = 0;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Cancel any io_uring activity across execve</div><div class='ctx'> 	 */</div><div class='hunk'>@@ -1267,8 +1137,8 @@ int begin_new_exec(struct linux_binprm * bprm)</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Must be called _before_ exec_mmap() as bprm-&gt;mm is</div><div class='del'>-	 * not visibile until then. This also enables the update</div><div class='del'>-	 * to be lockless.</div><div class='add'>+	 * not visible until then. Doing it here also ensures</div><div class='add'>+	 * we don't race against replace_mm_exe_file().</div><div class='ctx'> 	 */</div><div class='ctx'> 	retval = set_mm_exe_file(bprm-&gt;mm, bprm-&gt;file);</div><div class='ctx'> 	if (retval)</div><div class='hunk'>@@ -1289,8 +1159,15 @@ int begin_new_exec(struct linux_binprm * bprm)</div><div class='ctx'> </div><div class='ctx'> 	bprm-&gt;mm = NULL;</div><div class='ctx'> </div><div class='add'>+	retval = exec_task_namespaces();</div><div class='add'>+	if (retval)</div><div class='add'>+		goto out_unlock;</div><div class='add'>+</div><div class='ctx'> #ifdef CONFIG_POSIX_TIMERS</div><div class='del'>-	exit_itimers(me-&gt;signal);</div><div class='add'>+	spin_lock_irq(&amp;me-&gt;sighand-&gt;siglock);</div><div class='add'>+	posix_cpu_timers_exit(me);</div><div class='add'>+	spin_unlock_irq(&amp;me-&gt;sighand-&gt;siglock);</div><div class='add'>+	exit_itimers(me);</div><div class='ctx'> 	flush_itimer_signals();</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='hunk'>@@ -1301,13 +1178,7 @@ int begin_new_exec(struct linux_binprm * bprm)</div><div class='ctx'> 	if (retval)</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Ensure that the uaccess routines can actually operate on userspace</div><div class='del'>-	 * pointers:</div><div class='del'>-	 */</div><div class='del'>-	force_uaccess_begin();</div><div class='del'>-</div><div class='del'>-	me-&gt;flags &amp;= ~(PF_RANDOMIZE | PF_FORKNOEXEC | PF_KTHREAD |</div><div class='add'>+	me-&gt;flags &amp;= ~(PF_RANDOMIZE | PF_FORKNOEXEC |</div><div class='ctx'> 					PF_NOFREEZE | PF_NO_SETAFFINITY);</div><div class='ctx'> 	flush_thread();</div><div class='ctx'> 	me-&gt;personality &amp;= ~bprm-&gt;per_clear;</div><div class='hunk'>@@ -1352,7 +1223,28 @@ int begin_new_exec(struct linux_binprm * bprm)</div><div class='ctx'> 		set_dumpable(current-&gt;mm, SUID_DUMP_USER);</div><div class='ctx'> </div><div class='ctx'> 	perf_event_exec();</div><div class='del'>-	__set_task_comm(me, kbasename(bprm-&gt;filename), true);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If the original filename was empty, alloc_bprm() made up a path</div><div class='add'>+	 * that will probably not be useful to admins running ps or similar.</div><div class='add'>+	 * Let's fix it up to be something reasonable.</div><div class='add'>+	 */</div><div class='add'>+	if (bprm-&gt;comm_from_dentry) {</div><div class='add'>+		/*</div><div class='add'>+		 * Hold RCU lock to keep the name from being freed behind our back.</div><div class='add'>+		 * Use acquire semantics to make sure the terminating NUL from</div><div class='add'>+		 * __d_alloc() is seen.</div><div class='add'>+		 *</div><div class='add'>+		 * Note, we're deliberately sloppy here. We don't need to care about</div><div class='add'>+		 * detecting a concurrent rename and just want a terminated name.</div><div class='add'>+		 */</div><div class='add'>+		rcu_read_lock();</div><div class='add'>+		__set_task_comm(me, smp_load_acquire(&amp;bprm-&gt;file-&gt;f_path.dentry-&gt;d_name.name),</div><div class='add'>+				true);</div><div class='add'>+		rcu_read_unlock();</div><div class='add'>+	} else {</div><div class='add'>+		__set_task_comm(me, kbasename(bprm-&gt;filename), true);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* An exec changes our domain. We are no longer part of the thread</div><div class='ctx'> 	   group */</div><div class='hunk'>@@ -1388,10 +1280,9 @@ int begin_new_exec(struct linux_binprm * bprm)</div><div class='ctx'> </div><div class='ctx'> 	/* Pass the opened binary to the interpreter. */</div><div class='ctx'> 	if (bprm-&gt;have_execfd) {</div><div class='del'>-		retval = get_unused_fd_flags(0);</div><div class='add'>+		retval = FD_ADD(0, bprm-&gt;executable);</div><div class='ctx'> 		if (retval &lt; 0)</div><div class='ctx'> 			goto out_unlock;</div><div class='del'>-		fd_install(retval, bprm-&gt;executable);</div><div class='ctx'> 		bprm-&gt;executable = NULL;</div><div class='ctx'> 		bprm-&gt;execfd = retval;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1399,6 +1290,9 @@ int begin_new_exec(struct linux_binprm * bprm)</div><div class='ctx'> </div><div class='ctx'> out_unlock:</div><div class='ctx'> 	up_write(&amp;me-&gt;signal-&gt;exec_update_lock);</div><div class='add'>+	if (!bprm-&gt;cred)</div><div class='add'>+		mutex_unlock(&amp;me-&gt;signal-&gt;cred_guard_mutex);</div><div class='add'>+</div><div class='ctx'> out:</div><div class='ctx'> 	return retval;</div><div class='ctx'> }</div><div class='hunk'>@@ -1407,15 +1301,15 @@ EXPORT_SYMBOL(begin_new_exec);</div><div class='ctx'> void would_dump(struct linux_binprm *bprm, struct file *file)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='del'>-	struct user_namespace *mnt_userns = file_mnt_user_ns(file);</div><div class='del'>-	if (inode_permission(mnt_userns, inode, MAY_READ) &lt; 0) {</div><div class='add'>+	struct mnt_idmap *idmap = file_mnt_idmap(file);</div><div class='add'>+	if (inode_permission(idmap, inode, MAY_READ) &lt; 0) {</div><div class='ctx'> 		struct user_namespace *old, *user_ns;</div><div class='ctx'> 		bprm-&gt;interp_flags |= BINPRM_FLAGS_ENFORCE_NONDUMP;</div><div class='ctx'> </div><div class='ctx'> 		/* Ensure mm-&gt;user_ns contains the executable */</div><div class='ctx'> 		user_ns = old = bprm-&gt;mm-&gt;user_ns;</div><div class='ctx'> 		while ((user_ns != &amp;init_user_ns) &amp;&amp;</div><div class='del'>-		       !privileged_wrt_inode_uidgid(user_ns, mnt_userns, inode))</div><div class='add'>+		       !privileged_wrt_inode_uidgid(user_ns, idmap, inode))</div><div class='ctx'> 			user_ns = user_ns-&gt;parent;</div><div class='ctx'> </div><div class='ctx'> 		if (old != user_ns) {</div><div class='hunk'>@@ -1474,6 +1368,15 @@ static int prepare_bprm_creds(struct linux_binprm *bprm)</div><div class='ctx'> 	return -ENOMEM;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/* Matches do_open_execat() */</div><div class='add'>+static void do_close_execat(struct file *file)</div><div class='add'>+{</div><div class='add'>+	if (!file)</div><div class='add'>+		return;</div><div class='add'>+	exe_file_allow_write_access(file);</div><div class='add'>+	fput(file);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void free_bprm(struct linux_binprm *bprm)</div><div class='ctx'> {</div><div class='ctx'> 	if (bprm-&gt;mm) {</div><div class='hunk'>@@ -1482,13 +1385,12 @@ static void free_bprm(struct linux_binprm *bprm)</div><div class='ctx'> 	}</div><div class='ctx'> 	free_arg_pages(bprm);</div><div class='ctx'> 	if (bprm-&gt;cred) {</div><div class='add'>+		/* in case exec fails before de_thread() succeeds */</div><div class='add'>+		current-&gt;fs-&gt;in_exec = 0;</div><div class='ctx'> 		mutex_unlock(&amp;current-&gt;signal-&gt;cred_guard_mutex);</div><div class='ctx'> 		abort_creds(bprm-&gt;cred);</div><div class='ctx'> 	}</div><div class='del'>-	if (bprm-&gt;file) {</div><div class='del'>-		allow_write_access(bprm-&gt;file);</div><div class='del'>-		fput(bprm-&gt;file);</div><div class='del'>-	}</div><div class='add'>+	do_close_execat(bprm-&gt;file);</div><div class='ctx'> 	if (bprm-&gt;executable)</div><div class='ctx'> 		fput(bprm-&gt;executable);</div><div class='ctx'> 	/* If a binfmt changed the interp, free it. */</div><div class='hunk'>@@ -1498,36 +1400,74 @@ static void free_bprm(struct linux_binprm *bprm)</div><div class='ctx'> 	kfree(bprm);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct linux_binprm *alloc_bprm(int fd, struct filename *filename)</div><div class='add'>+static struct linux_binprm *alloc_bprm(int fd, struct filename *filename, int flags)</div><div class='ctx'> {</div><div class='del'>-	struct linux_binprm *bprm = kzalloc(sizeof(*bprm), GFP_KERNEL);</div><div class='add'>+	struct linux_binprm *bprm;</div><div class='add'>+	struct file *file;</div><div class='ctx'> 	int retval = -ENOMEM;</div><div class='del'>-	if (!bprm)</div><div class='del'>-		goto out;</div><div class='add'>+</div><div class='add'>+	file = do_open_execat(fd, filename, flags);</div><div class='add'>+	if (IS_ERR(file))</div><div class='add'>+		return ERR_CAST(file);</div><div class='add'>+</div><div class='add'>+	bprm = kzalloc(sizeof(*bprm), GFP_KERNEL);</div><div class='add'>+	if (!bprm) {</div><div class='add'>+		do_close_execat(file);</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	bprm-&gt;file = file;</div><div class='ctx'> </div><div class='ctx'> 	if (fd == AT_FDCWD || filename-&gt;name[0] == '/') {</div><div class='ctx'> 		bprm-&gt;filename = filename-&gt;name;</div><div class='ctx'> 	} else {</div><div class='del'>-		if (filename-&gt;name[0] == '\0')</div><div class='add'>+		if (filename-&gt;name[0] == '\0') {</div><div class='ctx'> 			bprm-&gt;fdpath = kasprintf(GFP_KERNEL, "/dev/fd/%d", fd);</div><div class='del'>-		else</div><div class='add'>+			bprm-&gt;comm_from_dentry = 1;</div><div class='add'>+		} else {</div><div class='ctx'> 			bprm-&gt;fdpath = kasprintf(GFP_KERNEL, "/dev/fd/%d/%s",</div><div class='ctx'> 						  fd, filename-&gt;name);</div><div class='add'>+		}</div><div class='ctx'> 		if (!bprm-&gt;fdpath)</div><div class='ctx'> 			goto out_free;</div><div class='ctx'> </div><div class='add'>+		/*</div><div class='add'>+		 * Record that a name derived from an O_CLOEXEC fd will be</div><div class='add'>+		 * inaccessible after exec.  This allows the code in exec to</div><div class='add'>+		 * choose to fail when the executable is not mmaped into the</div><div class='add'>+		 * interpreter and an open file descriptor is not passed to</div><div class='add'>+		 * the interpreter.  This makes for a better user experience</div><div class='add'>+		 * than having the interpreter start and then immediately fail</div><div class='add'>+		 * when it finds the executable is inaccessible.</div><div class='add'>+		 */</div><div class='add'>+		if (get_close_on_exec(fd))</div><div class='add'>+			bprm-&gt;interp_flags |= BINPRM_FLAGS_PATH_INACCESSIBLE;</div><div class='add'>+</div><div class='ctx'> 		bprm-&gt;filename = bprm-&gt;fdpath;</div><div class='ctx'> 	}</div><div class='ctx'> 	bprm-&gt;interp = bprm-&gt;filename;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * At this point, security_file_open() has already been called (with</div><div class='add'>+	 * __FMODE_EXEC) and access control checks for AT_EXECVE_CHECK will</div><div class='add'>+	 * stop just after the security_bprm_creds_for_exec() call in</div><div class='add'>+	 * bprm_execve().  Indeed, the kernel should not try to parse the</div><div class='add'>+	 * content of the file with exec_binprm() nor change the calling</div><div class='add'>+	 * thread, which means that the following security functions will not</div><div class='add'>+	 * be called:</div><div class='add'>+	 * - security_bprm_check()</div><div class='add'>+	 * - security_bprm_creds_from_file()</div><div class='add'>+	 * - security_bprm_committing_creds()</div><div class='add'>+	 * - security_bprm_committed_creds()</div><div class='add'>+	 */</div><div class='add'>+	bprm-&gt;is_check = !!(flags &amp; AT_EXECVE_CHECK);</div><div class='add'>+</div><div class='ctx'> 	retval = bprm_mm_init(bprm);</div><div class='del'>-	if (retval)</div><div class='del'>-		goto out_free;</div><div class='del'>-	return bprm;</div><div class='add'>+	if (!retval)</div><div class='add'>+		return bprm;</div><div class='ctx'> </div><div class='ctx'> out_free:</div><div class='ctx'> 	free_bprm(bprm);</div><div class='del'>-out:</div><div class='ctx'> 	return ERR_PTR(retval);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1563,31 +1503,42 @@ static void check_unsafe_exec(struct linux_binprm *bprm)</div><div class='ctx'> 	if (task_no_new_privs(current))</div><div class='ctx'> 		bprm-&gt;unsafe |= LSM_UNSAFE_NO_NEW_PRIVS;</div><div class='ctx'> </div><div class='del'>-	t = p;</div><div class='add'>+	/*</div><div class='add'>+	 * If another task is sharing our fs, we cannot safely</div><div class='add'>+	 * suid exec because the differently privileged task</div><div class='add'>+	 * will be able to manipulate the current directory, etc.</div><div class='add'>+	 * It would be nice to force an unshare instead...</div><div class='add'>+	 *</div><div class='add'>+	 * Otherwise we set fs-&gt;in_exec = 1 to deny clone(CLONE_FS)</div><div class='add'>+	 * from another sub-thread until de_thread() succeeds, this</div><div class='add'>+	 * state is protected by cred_guard_mutex we hold.</div><div class='add'>+	 */</div><div class='ctx'> 	n_fs = 1;</div><div class='del'>-	spin_lock(&amp;p-&gt;fs-&gt;lock);</div><div class='add'>+	read_seqlock_excl(&amp;p-&gt;fs-&gt;seq);</div><div class='ctx'> 	rcu_read_lock();</div><div class='del'>-	while_each_thread(p, t) {</div><div class='add'>+	for_other_threads(p, t) {</div><div class='ctx'> 		if (t-&gt;fs == p-&gt;fs)</div><div class='ctx'> 			n_fs++;</div><div class='ctx'> 	}</div><div class='ctx'> 	rcu_read_unlock();</div><div class='ctx'> </div><div class='add'>+	/* "users" and "in_exec" locked for copy_fs() */</div><div class='ctx'> 	if (p-&gt;fs-&gt;users &gt; n_fs)</div><div class='ctx'> 		bprm-&gt;unsafe |= LSM_UNSAFE_SHARE;</div><div class='ctx'> 	else</div><div class='ctx'> 		p-&gt;fs-&gt;in_exec = 1;</div><div class='del'>-	spin_unlock(&amp;p-&gt;fs-&gt;lock);</div><div class='add'>+	read_sequnlock_excl(&amp;p-&gt;fs-&gt;seq);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void bprm_fill_uid(struct linux_binprm *bprm, struct file *file)</div><div class='ctx'> {</div><div class='ctx'> 	/* Handle suid and sgid on files */</div><div class='del'>-	struct user_namespace *mnt_userns;</div><div class='del'>-	struct inode *inode;</div><div class='add'>+	struct mnt_idmap *idmap;</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='ctx'> 	unsigned int mode;</div><div class='del'>-	kuid_t uid;</div><div class='del'>-	kgid_t gid;</div><div class='add'>+	vfsuid_t vfsuid;</div><div class='add'>+	vfsgid_t vfsgid;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (!mnt_may_suid(file-&gt;f_path.mnt))</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -1595,35 +1546,39 @@ static void bprm_fill_uid(struct linux_binprm *bprm, struct file *file)</div><div class='ctx'> 	if (task_no_new_privs(current))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	inode = file-&gt;f_path.dentry-&gt;d_inode;</div><div class='ctx'> 	mode = READ_ONCE(inode-&gt;i_mode);</div><div class='ctx'> 	if (!(mode &amp; (S_ISUID|S_ISGID)))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	mnt_userns = file_mnt_user_ns(file);</div><div class='add'>+	idmap = file_mnt_idmap(file);</div><div class='ctx'> </div><div class='ctx'> 	/* Be careful if suid/sgid is set */</div><div class='ctx'> 	inode_lock(inode);</div><div class='ctx'> </div><div class='del'>-	/* reload atomically mode/uid/gid now that lock held */</div><div class='add'>+	/* Atomically reload and check mode/uid/gid now that lock held. */</div><div class='ctx'> 	mode = inode-&gt;i_mode;</div><div class='del'>-	uid = i_uid_into_mnt(mnt_userns, inode);</div><div class='del'>-	gid = i_gid_into_mnt(mnt_userns, inode);</div><div class='add'>+	vfsuid = i_uid_into_vfsuid(idmap, inode);</div><div class='add'>+	vfsgid = i_gid_into_vfsgid(idmap, inode);</div><div class='add'>+	err = inode_permission(idmap, inode, MAY_EXEC);</div><div class='ctx'> 	inode_unlock(inode);</div><div class='ctx'> </div><div class='add'>+	/* Did the exec bit vanish out from under us? Give up. */</div><div class='add'>+	if (err)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='ctx'> 	/* We ignore suid/sgid if there are no mappings for them in the ns */</div><div class='del'>-	if (!kuid_has_mapping(bprm-&gt;cred-&gt;user_ns, uid) ||</div><div class='del'>-		 !kgid_has_mapping(bprm-&gt;cred-&gt;user_ns, gid))</div><div class='add'>+	if (!vfsuid_has_mapping(bprm-&gt;cred-&gt;user_ns, vfsuid) ||</div><div class='add'>+	    !vfsgid_has_mapping(bprm-&gt;cred-&gt;user_ns, vfsgid))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	if (mode &amp; S_ISUID) {</div><div class='ctx'> 		bprm-&gt;per_clear |= PER_CLEAR_ON_SETID;</div><div class='del'>-		bprm-&gt;cred-&gt;euid = uid;</div><div class='add'>+		bprm-&gt;cred-&gt;euid = vfsuid_into_kuid(vfsuid);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if ((mode &amp; (S_ISGID | S_IXGRP)) == (S_ISGID | S_IXGRP)) {</div><div class='ctx'> 		bprm-&gt;per_clear |= PER_CLEAR_ON_SETID;</div><div class='del'>-		bprm-&gt;cred-&gt;egid = gid;</div><div class='add'>+		bprm-&gt;cred-&gt;egid = vfsgid_into_kgid(vfsgid);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1660,7 +1615,6 @@ static int prepare_binprm(struct linux_binprm *bprm)</div><div class='ctx'>  */</div><div class='ctx'> int remove_arg_zero(struct linux_binprm *bprm)</div><div class='ctx'> {</div><div class='del'>-	int ret = 0;</div><div class='ctx'> 	unsigned long offset;</div><div class='ctx'> 	char *kaddr;</div><div class='ctx'> 	struct page *page;</div><div class='hunk'>@@ -1671,36 +1625,30 @@ int remove_arg_zero(struct linux_binprm *bprm)</div><div class='ctx'> 	do {</div><div class='ctx'> 		offset = bprm-&gt;p &amp; ~PAGE_MASK;</div><div class='ctx'> 		page = get_arg_page(bprm, bprm-&gt;p, 0);</div><div class='del'>-		if (!page) {</div><div class='del'>-			ret = -EFAULT;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		kaddr = kmap_atomic(page);</div><div class='add'>+		if (!page)</div><div class='add'>+			return -EFAULT;</div><div class='add'>+		kaddr = kmap_local_page(page);</div><div class='ctx'> </div><div class='ctx'> 		for (; offset &lt; PAGE_SIZE &amp;&amp; kaddr[offset];</div><div class='ctx'> 				offset++, bprm-&gt;p++)</div><div class='ctx'> 			;</div><div class='ctx'> </div><div class='del'>-		kunmap_atomic(kaddr);</div><div class='add'>+		kunmap_local(kaddr);</div><div class='ctx'> 		put_arg_page(page);</div><div class='ctx'> 	} while (offset == PAGE_SIZE);</div><div class='ctx'> </div><div class='ctx'> 	bprm-&gt;p++;</div><div class='ctx'> 	bprm-&gt;argc--;</div><div class='del'>-	ret = 0;</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(remove_arg_zero);</div><div class='ctx'> </div><div class='del'>-#define printable(c) (((c)=='\t') || ((c)=='\n') || (0x20&lt;=(c) &amp;&amp; (c)&lt;=0x7e))</div><div class='ctx'> /*</div><div class='ctx'>  * cycle the list of binary formats handler, until one recognizes the image</div><div class='ctx'>  */</div><div class='ctx'> static int search_binary_handler(struct linux_binprm *bprm)</div><div class='ctx'> {</div><div class='del'>-	bool need_retry = IS_ENABLED(CONFIG_MODULES);</div><div class='ctx'> 	struct linux_binfmt *fmt;</div><div class='ctx'> 	int retval;</div><div class='ctx'> </div><div class='hunk'>@@ -1712,8 +1660,6 @@ static int search_binary_handler(struct linux_binprm *bprm)</div><div class='ctx'> 	if (retval)</div><div class='ctx'> 		return retval;</div><div class='ctx'> </div><div class='del'>-	retval = -ENOENT;</div><div class='del'>- retry:</div><div class='ctx'> 	read_lock(&amp;binfmt_lock);</div><div class='ctx'> 	list_for_each_entry(fmt, &amp;formats, lh) {</div><div class='ctx'> 		if (!try_module_get(fmt-&gt;module))</div><div class='hunk'>@@ -1731,19 +1677,10 @@ static int search_binary_handler(struct linux_binprm *bprm)</div><div class='ctx'> 	}</div><div class='ctx'> 	read_unlock(&amp;binfmt_lock);</div><div class='ctx'> </div><div class='del'>-	if (need_retry) {</div><div class='del'>-		if (printable(bprm-&gt;buf[0]) &amp;&amp; printable(bprm-&gt;buf[1]) &amp;&amp;</div><div class='del'>-		    printable(bprm-&gt;buf[2]) &amp;&amp; printable(bprm-&gt;buf[3]))</div><div class='del'>-			return retval;</div><div class='del'>-		if (request_module("binfmt-%04x", *(ushort *)(bprm-&gt;buf + 2)) &lt; 0)</div><div class='del'>-			return retval;</div><div class='del'>-		need_retry = false;</div><div class='del'>-		goto retry;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return retval;</div><div class='add'>+	return -ENOEXEC;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/* binfmt handlers will call back into begin_new_exec() on success. */</div><div class='ctx'> static int exec_binprm(struct linux_binprm *bprm)</div><div class='ctx'> {</div><div class='ctx'> 	pid_t old_pid, old_vpid;</div><div class='hunk'>@@ -1771,7 +1708,7 @@ static int exec_binprm(struct linux_binprm *bprm)</div><div class='ctx'> 		bprm-&gt;file = bprm-&gt;interpreter;</div><div class='ctx'> 		bprm-&gt;interpreter = NULL;</div><div class='ctx'> </div><div class='del'>-		allow_write_access(exec);</div><div class='add'>+		exe_file_allow_write_access(exec);</div><div class='ctx'> 		if (unlikely(bprm-&gt;have_execfd)) {</div><div class='ctx'> 			if (bprm-&gt;executable) {</div><div class='ctx'> 				fput(exec);</div><div class='hunk'>@@ -1789,55 +1726,39 @@ static int exec_binprm(struct linux_binprm *bprm)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * sys_execve() executes a new program.</div><div class='del'>- */</div><div class='del'>-static int bprm_execve(struct linux_binprm *bprm,</div><div class='del'>-		       int fd, struct filename *filename, int flags)</div><div class='add'>+static int bprm_execve(struct linux_binprm *bprm)</div><div class='ctx'> {</div><div class='del'>-	struct file *file;</div><div class='ctx'> 	int retval;</div><div class='ctx'> </div><div class='ctx'> 	retval = prepare_bprm_creds(bprm);</div><div class='ctx'> 	if (retval)</div><div class='ctx'> 		return retval;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Check for unsafe execution states before exec_binprm(), which</div><div class='add'>+	 * will call back into begin_new_exec(), into bprm_creds_from_file(),</div><div class='add'>+	 * where setuid-ness is evaluated.</div><div class='add'>+	 */</div><div class='ctx'> 	check_unsafe_exec(bprm);</div><div class='ctx'> 	current-&gt;in_execve = 1;</div><div class='del'>-</div><div class='del'>-	file = do_open_execat(fd, filename, flags);</div><div class='del'>-	retval = PTR_ERR(file);</div><div class='del'>-	if (IS_ERR(file))</div><div class='del'>-		goto out_unmark;</div><div class='add'>+	sched_mm_cid_before_execve(current);</div><div class='ctx'> </div><div class='ctx'> 	sched_exec();</div><div class='ctx'> </div><div class='del'>-	bprm-&gt;file = file;</div><div class='del'>-	/*</div><div class='del'>-	 * Record that a name derived from an O_CLOEXEC fd will be</div><div class='del'>-	 * inaccessible after exec.  This allows the code in exec to</div><div class='del'>-	 * choose to fail when the executable is not mmaped into the</div><div class='del'>-	 * interpreter and an open file descriptor is not passed to</div><div class='del'>-	 * the interpreter.  This makes for a better user experience</div><div class='del'>-	 * than having the interpreter start and then immediately fail</div><div class='del'>-	 * when it finds the executable is inaccessible.</div><div class='del'>-	 */</div><div class='del'>-	if (bprm-&gt;fdpath &amp;&amp; get_close_on_exec(fd))</div><div class='del'>-		bprm-&gt;interp_flags |= BINPRM_FLAGS_PATH_INACCESSIBLE;</div><div class='del'>-</div><div class='ctx'> 	/* Set the unchanging part of bprm-&gt;cred */</div><div class='ctx'> 	retval = security_bprm_creds_for_exec(bprm);</div><div class='del'>-	if (retval)</div><div class='add'>+	if (retval || bprm-&gt;is_check)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	retval = exec_binprm(bprm);</div><div class='ctx'> 	if (retval &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='add'>+	sched_mm_cid_after_execve(current);</div><div class='add'>+	rseq_execve(current);</div><div class='ctx'> 	/* execve succeeded */</div><div class='del'>-	current-&gt;fs-&gt;in_exec = 0;</div><div class='ctx'> 	current-&gt;in_execve = 0;</div><div class='del'>-	rseq_execve(current);</div><div class='add'>+	user_events_execve(current);</div><div class='ctx'> 	acct_update_integrals(current);</div><div class='ctx'> 	task_numa_free(current, false);</div><div class='ctx'> 	return retval;</div><div class='hunk'>@@ -1852,8 +1773,8 @@ out:</div><div class='ctx'> 	if (bprm-&gt;point_of_no_return &amp;&amp; !fatal_signal_pending(current))</div><div class='ctx'> 		force_fatal_sig(SIGSEGV);</div><div class='ctx'> </div><div class='del'>-out_unmark:</div><div class='del'>-	current-&gt;fs-&gt;in_exec = 0;</div><div class='add'>+	sched_mm_cid_after_execve(current);</div><div class='add'>+	rseq_force_update();</div><div class='ctx'> 	current-&gt;in_execve = 0;</div><div class='ctx'> </div><div class='ctx'> 	return retval;</div><div class='hunk'>@@ -1877,7 +1798,7 @@ static int do_execveat_common(int fd, struct filename *filename,</div><div class='ctx'> 	 * whether NPROC limit is still exceeded.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if ((current-&gt;flags &amp; PF_NPROC_EXCEEDED) &amp;&amp;</div><div class='del'>-	    is_ucounts_overlimit(current_ucounts(), UCOUNT_RLIMIT_NPROC, rlimit(RLIMIT_NPROC))) {</div><div class='add'>+	    is_rlimit_overlimit(current_ucounts(), UCOUNT_RLIMIT_NPROC, rlimit(RLIMIT_NPROC))) {</div><div class='ctx'> 		retval = -EAGAIN;</div><div class='ctx'> 		goto out_ret;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1886,7 +1807,7 @@ static int do_execveat_common(int fd, struct filename *filename,</div><div class='ctx'> 	 * further execve() calls fail. */</div><div class='ctx'> 	current-&gt;flags &amp;= ~PF_NPROC_EXCEEDED;</div><div class='ctx'> </div><div class='del'>-	bprm = alloc_bprm(fd, filename);</div><div class='add'>+	bprm = alloc_bprm(fd, filename, flags);</div><div class='ctx'> 	if (IS_ERR(bprm)) {</div><div class='ctx'> 		retval = PTR_ERR(bprm);</div><div class='ctx'> 		goto out_ret;</div><div class='hunk'>@@ -1919,7 +1840,23 @@ static int do_execveat_common(int fd, struct filename *filename,</div><div class='ctx'> 	if (retval &lt; 0)</div><div class='ctx'> 		goto out_free;</div><div class='ctx'> </div><div class='del'>-	retval = bprm_execve(bprm, fd, filename, flags);</div><div class='add'>+	/*</div><div class='add'>+	 * When argv is empty, add an empty string ("") as argv[0] to</div><div class='add'>+	 * ensure confused userspace programs that start processing</div><div class='add'>+	 * from argv[1] won't end up walking envp. See also</div><div class='add'>+	 * bprm_stack_limits().</div><div class='add'>+	 */</div><div class='add'>+	if (bprm-&gt;argc == 0) {</div><div class='add'>+		retval = copy_string_kernel("", bprm);</div><div class='add'>+		if (retval &lt; 0)</div><div class='add'>+			goto out_free;</div><div class='add'>+		bprm-&gt;argc = 1;</div><div class='add'>+</div><div class='add'>+		pr_warn_once("process '%s' launched '%s' with NULL argv: empty string added\n",</div><div class='add'>+			     current-&gt;comm, bprm-&gt;filename);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	retval = bprm_execve(bprm);</div><div class='ctx'> out_free:</div><div class='ctx'> 	free_bprm(bprm);</div><div class='ctx'> </div><div class='hunk'>@@ -1936,17 +1873,23 @@ int kernel_execve(const char *kernel_filename,</div><div class='ctx'> 	int fd = AT_FDCWD;</div><div class='ctx'> 	int retval;</div><div class='ctx'> </div><div class='add'>+	/* It is non-sense for kernel threads to call execve */</div><div class='add'>+	if (WARN_ON_ONCE(current-&gt;flags &amp; PF_KTHREAD))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='ctx'> 	filename = getname_kernel(kernel_filename);</div><div class='ctx'> 	if (IS_ERR(filename))</div><div class='ctx'> 		return PTR_ERR(filename);</div><div class='ctx'> </div><div class='del'>-	bprm = alloc_bprm(fd, filename);</div><div class='add'>+	bprm = alloc_bprm(fd, filename, 0);</div><div class='ctx'> 	if (IS_ERR(bprm)) {</div><div class='ctx'> 		retval = PTR_ERR(bprm);</div><div class='ctx'> 		goto out_ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	retval = count_strings_kernel(argv);</div><div class='add'>+	if (WARN_ON_ONCE(retval == 0))</div><div class='add'>+		retval = -EINVAL;</div><div class='ctx'> 	if (retval &lt; 0)</div><div class='ctx'> 		goto out_free;</div><div class='ctx'> 	bprm-&gt;argc = retval;</div><div class='hunk'>@@ -1973,7 +1916,7 @@ int kernel_execve(const char *kernel_filename,</div><div class='ctx'> 	if (retval &lt; 0)</div><div class='ctx'> 		goto out_free;</div><div class='ctx'> </div><div class='del'>-	retval = bprm_execve(bprm, fd, filename, 0);</div><div class='add'>+	retval = bprm_execve(bprm);</div><div class='ctx'> out_free:</div><div class='ctx'> 	free_bprm(bprm);</div><div class='ctx'> out_ret:</div><div class='hunk'>@@ -2055,7 +1998,7 @@ void set_dumpable(struct mm_struct *mm, int value)</div><div class='ctx'> 	if (WARN_ON((unsigned)value &gt; SUID_DUMP_ROOT))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	set_mask_bits(&amp;mm-&gt;flags, MMF_DUMPABLE_MASK, value);</div><div class='add'>+	__mm_flags_set_mask_dumpable(mm, value);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> SYSCALL_DEFINE3(execve,</div><div class='hunk'>@@ -2096,3 +2039,40 @@ COMPAT_SYSCALL_DEFINE5(execveat, int, fd,</div><div class='ctx'> 				  argv, envp, flags);</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_SYSCTL</div><div class='add'>+</div><div class='add'>+static int proc_dointvec_minmax_coredump(const struct ctl_table *table, int write,</div><div class='add'>+		void *buffer, size_t *lenp, loff_t *ppos)</div><div class='add'>+{</div><div class='add'>+	int error = proc_dointvec_minmax(table, write, buffer, lenp, ppos);</div><div class='add'>+</div><div class='add'>+	if (!error &amp;&amp; write)</div><div class='add'>+		validate_coredump_safety();</div><div class='add'>+	return error;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct ctl_table fs_exec_sysctls[] = {</div><div class='add'>+	{</div><div class='add'>+		.procname	= "suid_dumpable",</div><div class='add'>+		.data		= &amp;suid_dumpable,</div><div class='add'>+		.maxlen		= sizeof(int),</div><div class='add'>+		.mode		= 0644,</div><div class='add'>+		.proc_handler	= proc_dointvec_minmax_coredump,</div><div class='add'>+		.extra1		= SYSCTL_ZERO,</div><div class='add'>+		.extra2		= SYSCTL_TWO,</div><div class='add'>+	},</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int __init init_fs_exec_sysctls(void)</div><div class='add'>+{</div><div class='add'>+	register_sysctl_init("fs", fs_exec_sysctls);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+fs_initcall(init_fs_exec_sysctls);</div><div class='add'>+#endif /* CONFIG_SYSCTL */</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_EXEC_KUNIT_TEST</div><div class='add'>+#include "tests/exec_kunit.c"</div><div class='add'>+#endif</div><div class='head'>diff --git a/fs/exfat/Kconfig b/fs/exfat/Kconfig<br/>index 5a65071b5ecf..cbeca8e44d9b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/exfat/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exfat/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/exfat/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/exfat/Kconfig</a></div><div class='hunk'>@@ -2,7 +2,9 @@</div><div class='ctx'> </div><div class='ctx'> config EXFAT_FS</div><div class='ctx'> 	tristate "exFAT filesystem support"</div><div class='add'>+	select BUFFER_HEAD</div><div class='ctx'> 	select NLS</div><div class='add'>+	select LEGACY_DIRECT_IO</div><div class='ctx'> 	help</div><div class='ctx'> 	  This allows you to mount devices formatted with the exFAT file system.</div><div class='ctx'> 	  exFAT is typically used on SD-Cards or USB sticks.</div><div class='head'>diff --git a/fs/exfat/balloc.c b/fs/exfat/balloc.c<br/>index cc5cffc4a769..5429041c7eaf 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/exfat/balloc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exfat/balloc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/exfat/balloc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/exfat/balloc.c</a></div><div class='hunk'>@@ -5,53 +5,80 @@</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/blkdev.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='add'>+#include &lt;linux/bitmap.h&gt;</div><div class='ctx'> #include &lt;linux/buffer_head.h&gt;</div><div class='add'>+#include &lt;linux/backing-dev.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "exfat_raw.h"</div><div class='ctx'> #include "exfat_fs.h"</div><div class='ctx'> </div><div class='del'>-static const unsigned char free_bit[] = {</div><div class='del'>-	0, 1, 0, 2, 0, 1, 0, 3, 0, 1, 0, 2, 0, 1, 0, 4, 0, 1, 0, 2,/*  0 ~  19*/</div><div class='del'>-	0, 1, 0, 3, 0, 1, 0, 2, 0, 1, 0, 5, 0, 1, 0, 2, 0, 1, 0, 3,/* 20 ~  39*/</div><div class='del'>-	0, 1, 0, 2, 0, 1, 0, 4, 0, 1, 0, 2, 0, 1, 0, 3, 0, 1, 0, 2,/* 40 ~  59*/</div><div class='del'>-	0, 1, 0, 6, 0, 1, 0, 2, 0, 1, 0, 3, 0, 1, 0, 2, 0, 1, 0, 4,/* 60 ~  79*/</div><div class='del'>-	0, 1, 0, 2, 0, 1, 0, 3, 0, 1, 0, 2, 0, 1, 0, 5, 0, 1, 0, 2,/* 80 ~  99*/</div><div class='del'>-	0, 1, 0, 3, 0, 1, 0, 2, 0, 1, 0, 4, 0, 1, 0, 2, 0, 1, 0, 3,/*100 ~ 119*/</div><div class='del'>-	0, 1, 0, 2, 0, 1, 0, 7, 0, 1, 0, 2, 0, 1, 0, 3, 0, 1, 0, 2,/*120 ~ 139*/</div><div class='del'>-	0, 1, 0, 4, 0, 1, 0, 2, 0, 1, 0, 3, 0, 1, 0, 2, 0, 1, 0, 5,/*140 ~ 159*/</div><div class='del'>-	0, 1, 0, 2, 0, 1, 0, 3, 0, 1, 0, 2, 0, 1, 0, 4, 0, 1, 0, 2,/*160 ~ 179*/</div><div class='del'>-	0, 1, 0, 3, 0, 1, 0, 2, 0, 1, 0, 6, 0, 1, 0, 2, 0, 1, 0, 3,/*180 ~ 199*/</div><div class='del'>-	0, 1, 0, 2, 0, 1, 0, 4, 0, 1, 0, 2, 0, 1, 0, 3, 0, 1, 0, 2,/*200 ~ 219*/</div><div class='del'>-	0, 1, 0, 5, 0, 1, 0, 2, 0, 1, 0, 3, 0, 1, 0, 2, 0, 1, 0, 4,/*220 ~ 239*/</div><div class='del'>-	0, 1, 0, 2, 0, 1, 0, 3, 0, 1, 0, 2, 0, 1, 0                /*240 ~ 254*/</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static const unsigned char used_bit[] = {</div><div class='del'>-	0, 1, 1, 2, 1, 2, 2, 3, 1, 2, 2, 3, 2, 3, 3, 4, 1, 2, 2, 3,/*  0 ~  19*/</div><div class='del'>-	2, 3, 3, 4, 2, 3, 3, 4, 3, 4, 4, 5, 1, 2, 2, 3, 2, 3, 3, 4,/* 20 ~  39*/</div><div class='del'>-	2, 3, 3, 4, 3, 4, 4, 5, 2, 3, 3, 4, 3, 4, 4, 5, 3, 4, 4, 5,/* 40 ~  59*/</div><div class='del'>-	4, 5, 5, 6, 1, 2, 2, 3, 2, 3, 3, 4, 2, 3, 3, 4, 3, 4, 4, 5,/* 60 ~  79*/</div><div class='del'>-	2, 3, 3, 4, 3, 4, 4, 5, 3, 4, 4, 5, 4, 5, 5, 6, 2, 3, 3, 4,/* 80 ~  99*/</div><div class='del'>-	3, 4, 4, 5, 3, 4, 4, 5, 4, 5, 5, 6, 3, 4, 4, 5, 4, 5, 5, 6,/*100 ~ 119*/</div><div class='del'>-	4, 5, 5, 6, 5, 6, 6, 7, 1, 2, 2, 3, 2, 3, 3, 4, 2, 3, 3, 4,/*120 ~ 139*/</div><div class='del'>-	3, 4, 4, 5, 2, 3, 3, 4, 3, 4, 4, 5, 3, 4, 4, 5, 4, 5, 5, 6,/*140 ~ 159*/</div><div class='del'>-	2, 3, 3, 4, 3, 4, 4, 5, 3, 4, 4, 5, 4, 5, 5, 6, 3, 4, 4, 5,/*160 ~ 179*/</div><div class='del'>-	4, 5, 5, 6, 4, 5, 5, 6, 5, 6, 6, 7, 2, 3, 3, 4, 3, 4, 4, 5,/*180 ~ 199*/</div><div class='del'>-	3, 4, 4, 5, 4, 5, 5, 6, 3, 4, 4, 5, 4, 5, 5, 6, 4, 5, 5, 6,/*200 ~ 219*/</div><div class='del'>-	5, 6, 6, 7, 3, 4, 4, 5, 4, 5, 5, 6, 4, 5, 5, 6, 5, 6, 6, 7,/*220 ~ 239*/</div><div class='del'>-	4, 5, 5, 6, 5, 6, 6, 7, 5, 6, 6, 7, 6, 7, 7, 8             /*240 ~ 255*/</div><div class='del'>-};</div><div class='add'>+#if BITS_PER_LONG == 32</div><div class='add'>+#define __le_long __le32</div><div class='add'>+#define lel_to_cpu(A) le32_to_cpu(A)</div><div class='add'>+#define cpu_to_lel(A) cpu_to_le32(A)</div><div class='add'>+#elif BITS_PER_LONG == 64</div><div class='add'>+#define __le_long __le64</div><div class='add'>+#define lel_to_cpu(A) le64_to_cpu(A)</div><div class='add'>+#define cpu_to_lel(A) cpu_to_le64(A)</div><div class='add'>+#else</div><div class='add'>+#error "BITS_PER_LONG not 32 or 64"</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  *  Allocation Bitmap Management Functions</div><div class='ctx'>  */</div><div class='add'>+static bool exfat_test_bitmap_range(struct super_block *sb, unsigned int clu,</div><div class='add'>+		unsigned int count)</div><div class='add'>+{</div><div class='add'>+	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='add'>+	unsigned int start = clu;</div><div class='add'>+	unsigned int end = clu + count;</div><div class='add'>+	unsigned int ent_idx, i, b;</div><div class='add'>+	unsigned int bit_offset, bits_to_check;</div><div class='add'>+	__le_long *bitmap_le;</div><div class='add'>+	unsigned long mask, word;</div><div class='add'>+</div><div class='add'>+	if (!is_valid_cluster(sbi, start) || !is_valid_cluster(sbi, end - 1))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	while (start &lt; end) {</div><div class='add'>+		ent_idx = CLUSTER_TO_BITMAP_ENT(start);</div><div class='add'>+		i = BITMAP_OFFSET_SECTOR_INDEX(sb, ent_idx);</div><div class='add'>+		b = BITMAP_OFFSET_BIT_IN_SECTOR(sb, ent_idx);</div><div class='add'>+</div><div class='add'>+		bitmap_le = (__le_long *)sbi-&gt;vol_amap[i]-&gt;b_data;</div><div class='add'>+</div><div class='add'>+		/* Calculate how many bits we can check in the current word */</div><div class='add'>+		bit_offset = b % BITS_PER_LONG;</div><div class='add'>+		bits_to_check = min(end - start,</div><div class='add'>+				    (unsigned int)(BITS_PER_LONG - bit_offset));</div><div class='add'>+</div><div class='add'>+		/* Create a bitmask for the range of bits to check */</div><div class='add'>+		if (bits_to_check &gt;= BITS_PER_LONG)</div><div class='add'>+			mask = ~0UL;</div><div class='add'>+		else</div><div class='add'>+			mask = ((1UL &lt;&lt; bits_to_check) - 1) &lt;&lt; bit_offset;</div><div class='add'>+		word = lel_to_cpu(bitmap_le[b / BITS_PER_LONG]);</div><div class='add'>+</div><div class='add'>+		/* Check if all bits in the mask are set */</div><div class='add'>+		if ((word &amp; mask) != mask)</div><div class='add'>+			return false;</div><div class='add'>+</div><div class='add'>+		start += bits_to_check;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int exfat_allocate_bitmap(struct super_block *sb,</div><div class='ctx'> 		struct exfat_dentry *ep)</div><div class='ctx'> {</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='add'>+	struct blk_plug plug;</div><div class='ctx'> 	long long map_size;</div><div class='del'>-	unsigned int i, need_map_size;</div><div class='add'>+	unsigned int i, j, need_map_size;</div><div class='ctx'> 	sector_t sector;</div><div class='add'>+	unsigned int max_ra_count;</div><div class='ctx'> </div><div class='ctx'> 	sbi-&gt;map_clu = le32_to_cpu(ep-&gt;dentry.bitmap.start_clu);</div><div class='ctx'> 	map_size = le64_to_cpu(ep-&gt;dentry.bitmap.size);</div><div class='hunk'>@@ -69,28 +96,43 @@ static int exfat_allocate_bitmap(struct super_block *sb,</div><div class='ctx'> 	}</div><div class='ctx'> 	sbi-&gt;map_sectors = ((need_map_size - 1) &gt;&gt;</div><div class='ctx'> 			(sb-&gt;s_blocksize_bits)) + 1;</div><div class='del'>-	sbi-&gt;vol_amap = kmalloc_array(sbi-&gt;map_sectors,</div><div class='add'>+	sbi-&gt;vol_amap = kvmalloc_array(sbi-&gt;map_sectors,</div><div class='ctx'> 				sizeof(struct buffer_head *), GFP_KERNEL);</div><div class='ctx'> 	if (!sbi-&gt;vol_amap)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	sector = exfat_cluster_to_sector(sbi, sbi-&gt;map_clu);</div><div class='add'>+	max_ra_count = min(sb-&gt;s_bdi-&gt;ra_pages, sb-&gt;s_bdi-&gt;io_pages) &lt;&lt;</div><div class='add'>+		(PAGE_SHIFT - sb-&gt;s_blocksize_bits);</div><div class='ctx'> 	for (i = 0; i &lt; sbi-&gt;map_sectors; i++) {</div><div class='del'>-		sbi-&gt;vol_amap[i] = sb_bread(sb, sector + i);</div><div class='del'>-		if (!sbi-&gt;vol_amap[i]) {</div><div class='del'>-			/* release all buffers and free vol_amap */</div><div class='del'>-			int j = 0;</div><div class='del'>-</div><div class='del'>-			while (j &lt; i)</div><div class='del'>-				brelse(sbi-&gt;vol_amap[j++]);</div><div class='del'>-</div><div class='del'>-			kfree(sbi-&gt;vol_amap);</div><div class='del'>-			sbi-&gt;vol_amap = NULL;</div><div class='del'>-			return -EIO;</div><div class='add'>+		/* Trigger the next readahead in advance. */</div><div class='add'>+		if (max_ra_count &amp;&amp; 0 == (i % max_ra_count)) {</div><div class='add'>+			blk_start_plug(&amp;plug);</div><div class='add'>+			for (j = i; j &lt; min(max_ra_count, sbi-&gt;map_sectors - i) + i; j++)</div><div class='add'>+				sb_breadahead(sb, sector + j);</div><div class='add'>+			blk_finish_plug(&amp;plug);</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='add'>+		sbi-&gt;vol_amap[i] = sb_bread(sb, sector + i);</div><div class='add'>+		if (!sbi-&gt;vol_amap[i])</div><div class='add'>+			goto err_out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (exfat_test_bitmap_range(sb, sbi-&gt;map_clu,</div><div class='add'>+		EXFAT_B_TO_CLU_ROUND_UP(map_size, sbi)) == false)</div><div class='add'>+		goto err_out;</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='add'>+</div><div class='add'>+err_out:</div><div class='add'>+	j = 0;</div><div class='add'>+	/* release all buffers and free vol_amap */</div><div class='add'>+	while (j &lt; i)</div><div class='add'>+		brelse(sbi-&gt;vol_amap[j++]);</div><div class='add'>+</div><div class='add'>+	kvfree(sbi-&gt;vol_amap);</div><div class='add'>+	sbi-&gt;vol_amap = NULL;</div><div class='add'>+	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int exfat_load_bitmap(struct super_block *sb)</div><div class='hunk'>@@ -105,16 +147,13 @@ int exfat_load_bitmap(struct super_block *sb)</div><div class='ctx'> 			struct exfat_dentry *ep;</div><div class='ctx'> 			struct buffer_head *bh;</div><div class='ctx'> </div><div class='del'>-			ep = exfat_get_dentry(sb, &amp;clu, i, &amp;bh, NULL);</div><div class='add'>+			ep = exfat_get_dentry(sb, &amp;clu, i, &amp;bh);</div><div class='ctx'> 			if (!ep)</div><div class='ctx'> 				return -EIO;</div><div class='ctx'> </div><div class='ctx'> 			type = exfat_get_entry_type(ep);</div><div class='del'>-			if (type == TYPE_UNUSED)</div><div class='del'>-				break;</div><div class='del'>-			if (type != TYPE_BITMAP)</div><div class='del'>-				continue;</div><div class='del'>-			if (ep-&gt;dentry.bitmap.flags == 0x0) {</div><div class='add'>+			if (type == TYPE_BITMAP &amp;&amp;</div><div class='add'>+			    ep-&gt;dentry.bitmap.flags == 0x0) {</div><div class='ctx'> 				int err;</div><div class='ctx'> </div><div class='ctx'> 				err = exfat_allocate_bitmap(sb, ep);</div><div class='hunk'>@@ -122,6 +161,9 @@ int exfat_load_bitmap(struct super_block *sb)</div><div class='ctx'> 				return err;</div><div class='ctx'> 			}</div><div class='ctx'> 			brelse(bh);</div><div class='add'>+</div><div class='add'>+			if (type == TYPE_UNUSED)</div><div class='add'>+				return -EINVAL;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (exfat_get_next_cluster(sb, &amp;clu.dir))</div><div class='hunk'>@@ -138,17 +180,18 @@ void exfat_free_bitmap(struct exfat_sb_info *sbi)</div><div class='ctx'> 	for (i = 0; i &lt; sbi-&gt;map_sectors; i++)</div><div class='ctx'> 		__brelse(sbi-&gt;vol_amap[i]);</div><div class='ctx'> </div><div class='del'>-	kfree(sbi-&gt;vol_amap);</div><div class='add'>+	kvfree(sbi-&gt;vol_amap);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int exfat_set_bitmap(struct inode *inode, unsigned int clu, bool sync)</div><div class='add'>+int exfat_set_bitmap(struct super_block *sb, unsigned int clu, bool sync)</div><div class='ctx'> {</div><div class='ctx'> 	int i, b;</div><div class='ctx'> 	unsigned int ent_idx;</div><div class='del'>-	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='ctx'> </div><div class='del'>-	WARN_ON(clu &lt; EXFAT_FIRST_CLUSTER);</div><div class='add'>+	if (!is_valid_cluster(sbi, clu))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='ctx'> 	ent_idx = CLUSTER_TO_BITMAP_ENT(clu);</div><div class='ctx'> 	i = BITMAP_OFFSET_SECTOR_INDEX(sb, ent_idx);</div><div class='ctx'> 	b = BITMAP_OFFSET_BIT_IN_SECTOR(sb, ent_idx);</div><div class='hunk'>@@ -158,34 +201,49 @@ int exfat_set_bitmap(struct inode *inode, unsigned int clu, bool sync)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void exfat_clear_bitmap(struct inode *inode, unsigned int clu, bool sync)</div><div class='add'>+int exfat_clear_bitmap(struct super_block *sb, unsigned int clu, bool sync)</div><div class='ctx'> {</div><div class='ctx'> 	int i, b;</div><div class='ctx'> 	unsigned int ent_idx;</div><div class='del'>-	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='del'>-	struct exfat_mount_options *opts = &amp;sbi-&gt;options;</div><div class='ctx'> </div><div class='del'>-	WARN_ON(clu &lt; EXFAT_FIRST_CLUSTER);</div><div class='add'>+	if (!is_valid_cluster(sbi, clu))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='ctx'> 	ent_idx = CLUSTER_TO_BITMAP_ENT(clu);</div><div class='ctx'> 	i = BITMAP_OFFSET_SECTOR_INDEX(sb, ent_idx);</div><div class='ctx'> 	b = BITMAP_OFFSET_BIT_IN_SECTOR(sb, ent_idx);</div><div class='ctx'> </div><div class='add'>+	if (!test_bit_le(b, sbi-&gt;vol_amap[i]-&gt;b_data))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='ctx'> 	clear_bit_le(b, sbi-&gt;vol_amap[i]-&gt;b_data);</div><div class='add'>+</div><div class='ctx'> 	exfat_update_bh(sbi-&gt;vol_amap[i], sync);</div><div class='ctx'> </div><div class='del'>-	if (opts-&gt;discard) {</div><div class='del'>-		int ret_discard;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool exfat_test_bitmap(struct super_block *sb, unsigned int clu)</div><div class='add'>+{</div><div class='add'>+	int i, b;</div><div class='add'>+	unsigned int ent_idx;</div><div class='add'>+	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='add'>+</div><div class='add'>+	if (!sbi-&gt;vol_amap)</div><div class='add'>+		return true;</div><div class='ctx'> </div><div class='del'>-		ret_discard = sb_issue_discard(sb,</div><div class='del'>-			exfat_cluster_to_sector(sbi, clu),</div><div class='del'>-			(1 &lt;&lt; sbi-&gt;sect_per_clus_bits), GFP_NOFS, 0);</div><div class='add'>+	if (!is_valid_cluster(sbi, clu))</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-		if (ret_discard == -EOPNOTSUPP) {</div><div class='del'>-			exfat_err(sb, "discard not supported by device, disabling");</div><div class='del'>-			opts-&gt;discard = 0;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	ent_idx = CLUSTER_TO_BITMAP_ENT(clu);</div><div class='add'>+	i = BITMAP_OFFSET_SECTOR_INDEX(sb, ent_idx);</div><div class='add'>+	b = BITMAP_OFFSET_BIT_IN_SECTOR(sb, ent_idx);</div><div class='add'>+</div><div class='add'>+	if (!test_bit_le(b, sbi-&gt;vol_amap[i]-&gt;b_data))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -196,32 +254,35 @@ unsigned int exfat_find_free_bitmap(struct super_block *sb, unsigned int clu)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int i, map_i, map_b, ent_idx;</div><div class='ctx'> 	unsigned int clu_base, clu_free;</div><div class='del'>-	unsigned char k, clu_mask;</div><div class='add'>+	unsigned long clu_bits, clu_mask;</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='add'>+	__le_long bitval;</div><div class='ctx'> </div><div class='ctx'> 	WARN_ON(clu &lt; EXFAT_FIRST_CLUSTER);</div><div class='del'>-	ent_idx = CLUSTER_TO_BITMAP_ENT(clu);</div><div class='del'>-	clu_base = BITMAP_ENT_TO_CLUSTER(ent_idx &amp; ~(BITS_PER_BYTE_MASK));</div><div class='add'>+	ent_idx = ALIGN_DOWN(CLUSTER_TO_BITMAP_ENT(clu), BITS_PER_LONG);</div><div class='add'>+	clu_base = BITMAP_ENT_TO_CLUSTER(ent_idx);</div><div class='ctx'> 	clu_mask = IGNORED_BITS_REMAINED(clu, clu_base);</div><div class='ctx'> </div><div class='ctx'> 	map_i = BITMAP_OFFSET_SECTOR_INDEX(sb, ent_idx);</div><div class='ctx'> 	map_b = BITMAP_OFFSET_BYTE_IN_SECTOR(sb, ent_idx);</div><div class='ctx'> </div><div class='ctx'> 	for (i = EXFAT_FIRST_CLUSTER; i &lt; sbi-&gt;num_clusters;</div><div class='del'>-	     i += BITS_PER_BYTE) {</div><div class='del'>-		k = *(sbi-&gt;vol_amap[map_i]-&gt;b_data + map_b);</div><div class='add'>+	     i += BITS_PER_LONG) {</div><div class='add'>+		bitval = *(__le_long *)(sbi-&gt;vol_amap[map_i]-&gt;b_data + map_b);</div><div class='ctx'> 		if (clu_mask &gt; 0) {</div><div class='del'>-			k |= clu_mask;</div><div class='add'>+			bitval |= cpu_to_lel(clu_mask);</div><div class='ctx'> 			clu_mask = 0;</div><div class='ctx'> 		}</div><div class='del'>-		if (k &lt; 0xFF) {</div><div class='del'>-			clu_free = clu_base + free_bit[k];</div><div class='add'>+		if (lel_to_cpu(bitval) != ULONG_MAX) {</div><div class='add'>+			clu_bits = lel_to_cpu(bitval);</div><div class='add'>+			clu_free = clu_base + ffz(clu_bits);</div><div class='ctx'> 			if (clu_free &lt; sbi-&gt;num_clusters)</div><div class='ctx'> 				return clu_free;</div><div class='ctx'> 		}</div><div class='del'>-		clu_base += BITS_PER_BYTE;</div><div class='add'>+		clu_base += BITS_PER_LONG;</div><div class='add'>+		map_b += sizeof(long);</div><div class='ctx'> </div><div class='del'>-		if (++map_b &gt;= sb-&gt;s_blocksize ||</div><div class='add'>+		if (map_b &gt;= sb-&gt;s_blocksize ||</div><div class='ctx'> 		    clu_base &gt;= sbi-&gt;num_clusters) {</div><div class='ctx'> 			if (++map_i &gt;= sbi-&gt;map_sectors) {</div><div class='ctx'> 				clu_base = EXFAT_FIRST_CLUSTER;</div><div class='hunk'>@@ -240,25 +301,24 @@ int exfat_count_used_clusters(struct super_block *sb, unsigned int *ret_count)</div><div class='ctx'> 	unsigned int count = 0;</div><div class='ctx'> 	unsigned int i, map_i = 0, map_b = 0;</div><div class='ctx'> 	unsigned int total_clus = EXFAT_DATA_CLUSTER_COUNT(sbi);</div><div class='del'>-	unsigned int last_mask = total_clus &amp; BITS_PER_BYTE_MASK;</div><div class='del'>-	unsigned char clu_bits;</div><div class='del'>-	const unsigned char last_bit_mask[] = {0, 0b00000001, 0b00000011,</div><div class='del'>-		0b00000111, 0b00001111, 0b00011111, 0b00111111, 0b01111111};</div><div class='add'>+	unsigned int last_mask = total_clus &amp; (BITS_PER_LONG - 1);</div><div class='add'>+	unsigned long *bitmap, clu_bits;</div><div class='ctx'> </div><div class='ctx'> 	total_clus &amp;= ~last_mask;</div><div class='del'>-	for (i = 0; i &lt; total_clus; i += BITS_PER_BYTE) {</div><div class='del'>-		clu_bits = *(sbi-&gt;vol_amap[map_i]-&gt;b_data + map_b);</div><div class='del'>-		count += used_bit[clu_bits];</div><div class='del'>-		if (++map_b &gt;= (unsigned int)sb-&gt;s_blocksize) {</div><div class='add'>+	for (i = 0; i &lt; total_clus; i += BITS_PER_LONG) {</div><div class='add'>+		bitmap = (void *)(sbi-&gt;vol_amap[map_i]-&gt;b_data + map_b);</div><div class='add'>+		count += hweight_long(*bitmap);</div><div class='add'>+		map_b += sizeof(long);</div><div class='add'>+		if (map_b &gt;= (unsigned int)sb-&gt;s_blocksize) {</div><div class='ctx'> 			map_i++;</div><div class='ctx'> 			map_b = 0;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (last_mask) {</div><div class='del'>-		clu_bits = *(sbi-&gt;vol_amap[map_i]-&gt;b_data + map_b);</div><div class='del'>-		clu_bits &amp;= last_bit_mask[last_mask];</div><div class='del'>-		count += used_bit[clu_bits];</div><div class='add'>+		bitmap = (void *)(sbi-&gt;vol_amap[map_i]-&gt;b_data + map_b);</div><div class='add'>+		clu_bits = lel_to_cpu(*(__le_long *)bitmap);</div><div class='add'>+		count += hweight_long(clu_bits &amp; BITMAP_LAST_WORD_MASK(last_mask));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	*ret_count = count;</div><div class='head'>diff --git a/fs/exfat/cache.c b/fs/exfat/cache.c<br/>index 5a2f119b7e8c..d5ce0ae660ba 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/exfat/cache.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exfat/cache.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/exfat/cache.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/exfat/cache.c</a></div><div class='hunk'>@@ -11,7 +11,7 @@</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='del'>-#include &lt;asm/unaligned.h&gt;</div><div class='add'>+#include &lt;linux/unaligned.h&gt;</div><div class='ctx'> #include &lt;linux/buffer_head.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "exfat_raw.h"</div><div class='hunk'>@@ -46,7 +46,7 @@ int exfat_cache_init(void)</div><div class='ctx'> {</div><div class='ctx'> 	exfat_cachep = kmem_cache_create("exfat_cache",</div><div class='ctx'> 				sizeof(struct exfat_cache),</div><div class='del'>-				0, SLAB_RECLAIM_ACCOUNT|SLAB_MEM_SPREAD,</div><div class='add'>+				0, SLAB_RECLAIM_ACCOUNT,</div><div class='ctx'> 				exfat_cache_init_once);</div><div class='ctx'> 	if (!exfat_cachep)</div><div class='ctx'> 		return -ENOMEM;</div><div class='head'>diff --git a/fs/exfat/dir.c b/fs/exfat/dir.c<br/>index cb1c0d8c1714..3045a58e124a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/exfat/dir.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exfat/dir.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/exfat/dir.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/exfat/dir.c</a></div><div class='hunk'>@@ -29,15 +29,16 @@ static int exfat_extract_uni_name(struct exfat_dentry *ep,</div><div class='ctx'> </div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void exfat_get_uniname_from_ext_entry(struct super_block *sb,</div><div class='add'>+static int exfat_get_uniname_from_ext_entry(struct super_block *sb,</div><div class='ctx'> 		struct exfat_chain *p_dir, int entry, unsigned short *uniname)</div><div class='ctx'> {</div><div class='del'>-	int i;</div><div class='del'>-	struct exfat_entry_set_cache *es;</div><div class='add'>+	int i, err;</div><div class='add'>+	struct exfat_entry_set_cache es;</div><div class='add'>+	unsigned int uni_len = 0, len;</div><div class='ctx'> </div><div class='del'>-	es = exfat_get_dentry_set(sb, p_dir, entry, ES_ALL_ENTRIES);</div><div class='del'>-	if (!es)</div><div class='del'>-		return;</div><div class='add'>+	err = exfat_get_dentry_set(&amp;es, sb, p_dir, entry, ES_ALL_ENTRIES);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * First entry  : file entry</div><div class='hunk'>@@ -45,26 +46,29 @@ static void exfat_get_uniname_from_ext_entry(struct super_block *sb,</div><div class='ctx'> 	 * Third entry  : first file-name entry</div><div class='ctx'> 	 * So, the index of first file-name dentry should start from 2.</div><div class='ctx'> 	 */</div><div class='del'>-	for (i = 2; i &lt; es-&gt;num_entries; i++) {</div><div class='del'>-		struct exfat_dentry *ep = exfat_get_dentry_cached(es, i);</div><div class='add'>+	for (i = ES_IDX_FIRST_FILENAME; i &lt; es.num_entries; i++) {</div><div class='add'>+		struct exfat_dentry *ep = exfat_get_dentry_cached(&amp;es, i);</div><div class='ctx'> </div><div class='ctx'> 		/* end of name entry */</div><div class='ctx'> 		if (exfat_get_entry_type(ep) != TYPE_EXTEND)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		exfat_extract_uni_name(ep, uniname);</div><div class='add'>+		len = exfat_extract_uni_name(ep, uniname);</div><div class='add'>+		uni_len += len;</div><div class='add'>+		if (len != EXFAT_FILE_NAME_LEN || uni_len &gt;= MAX_NAME_LENGTH)</div><div class='add'>+			break;</div><div class='ctx'> 		uniname += EXFAT_FILE_NAME_LEN;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	exfat_free_dentry_set(es, false);</div><div class='add'>+	exfat_put_dentry_set(&amp;es, false);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* read a directory entry from the opened directory */</div><div class='ctx'> static int exfat_readdir(struct inode *inode, loff_t *cpos, struct exfat_dir_entry *dir_entry)</div><div class='ctx'> {</div><div class='del'>-	int i, dentries_per_clu, dentries_per_clu_bits = 0, num_ext;</div><div class='add'>+	int i, dentries_per_clu, num_ext, err;</div><div class='ctx'> 	unsigned int type, clu_offset, max_dentries;</div><div class='del'>-	sector_t sector;</div><div class='ctx'> 	struct exfat_chain dir, clu;</div><div class='ctx'> 	struct exfat_uni_name uni_name;</div><div class='ctx'> 	struct exfat_dentry *ep;</div><div class='hunk'>@@ -78,18 +82,14 @@ static int exfat_readdir(struct inode *inode, loff_t *cpos, struct exfat_dir_ent</div><div class='ctx'> 	if (ei-&gt;type != TYPE_DIR)</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='del'>-	if (ei-&gt;entry == -1)</div><div class='del'>-		exfat_chain_set(&amp;dir, sbi-&gt;root_dir, 0, ALLOC_FAT_CHAIN);</div><div class='del'>-	else</div><div class='del'>-		exfat_chain_set(&amp;dir, ei-&gt;start_clu,</div><div class='del'>-			EXFAT_B_TO_CLU(i_size_read(inode), sbi), ei-&gt;flags);</div><div class='add'>+	exfat_chain_set(&amp;dir, ei-&gt;start_clu,</div><div class='add'>+		EXFAT_B_TO_CLU(i_size_read(inode), sbi), ei-&gt;flags);</div><div class='ctx'> </div><div class='ctx'> 	dentries_per_clu = sbi-&gt;dentries_per_clu;</div><div class='del'>-	dentries_per_clu_bits = ilog2(dentries_per_clu);</div><div class='ctx'> 	max_dentries = (unsigned int)min_t(u64, MAX_EXFAT_DENTRIES,</div><div class='del'>-					   (u64)sbi-&gt;num_clusters &lt;&lt; dentries_per_clu_bits);</div><div class='add'>+				(u64)EXFAT_CLU_TO_DEN(sbi-&gt;num_clusters, sbi));</div><div class='ctx'> </div><div class='del'>-	clu_offset = dentry &gt;&gt; dentries_per_clu_bits;</div><div class='add'>+	clu_offset = EXFAT_DEN_TO_CLU(dentry, sbi);</div><div class='ctx'> 	exfat_chain_dup(&amp;clu, &amp;dir);</div><div class='ctx'> </div><div class='ctx'> 	if (clu.flags == ALLOC_NO_FAT_CHAIN) {</div><div class='hunk'>@@ -103,7 +103,7 @@ static int exfat_readdir(struct inode *inode, loff_t *cpos, struct exfat_dir_ent</div><div class='ctx'> 			clu.dir = ei-&gt;hint_bmap.clu;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		while (clu_offset &gt; 0) {</div><div class='add'>+		while (clu_offset &gt; 0 &amp;&amp; clu.dir != EXFAT_EOF_CLUSTER) {</div><div class='ctx'> 			if (exfat_get_next_cluster(sb, &amp;(clu.dir)))</div><div class='ctx'> 				return -EIO;</div><div class='ctx'> </div><div class='hunk'>@@ -115,14 +115,14 @@ static int exfat_readdir(struct inode *inode, loff_t *cpos, struct exfat_dir_ent</div><div class='ctx'> 		i = dentry &amp; (dentries_per_clu - 1);</div><div class='ctx'> </div><div class='ctx'> 		for ( ; i &lt; dentries_per_clu; i++, dentry++) {</div><div class='del'>-			ep = exfat_get_dentry(sb, &amp;clu, i, &amp;bh, &amp;sector);</div><div class='add'>+			ep = exfat_get_dentry(sb, &amp;clu, i, &amp;bh);</div><div class='ctx'> 			if (!ep)</div><div class='ctx'> 				return -EIO;</div><div class='ctx'> </div><div class='ctx'> 			type = exfat_get_entry_type(ep);</div><div class='ctx'> 			if (type == TYPE_UNUSED) {</div><div class='ctx'> 				brelse(bh);</div><div class='del'>-				break;</div><div class='add'>+				goto out;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			if (type != TYPE_FILE &amp;&amp; type != TYPE_DIR) {</div><div class='hunk'>@@ -132,39 +132,27 @@ static int exfat_readdir(struct inode *inode, loff_t *cpos, struct exfat_dir_ent</div><div class='ctx'> </div><div class='ctx'> 			num_ext = ep-&gt;dentry.file.num_ext;</div><div class='ctx'> 			dir_entry-&gt;attr = le16_to_cpu(ep-&gt;dentry.file.attr);</div><div class='del'>-			exfat_get_entry_time(sbi, &amp;dir_entry-&gt;crtime,</div><div class='del'>-					ep-&gt;dentry.file.create_tz,</div><div class='del'>-					ep-&gt;dentry.file.create_time,</div><div class='del'>-					ep-&gt;dentry.file.create_date,</div><div class='del'>-					ep-&gt;dentry.file.create_time_cs);</div><div class='del'>-			exfat_get_entry_time(sbi, &amp;dir_entry-&gt;mtime,</div><div class='del'>-					ep-&gt;dentry.file.modify_tz,</div><div class='del'>-					ep-&gt;dentry.file.modify_time,</div><div class='del'>-					ep-&gt;dentry.file.modify_date,</div><div class='del'>-					ep-&gt;dentry.file.modify_time_cs);</div><div class='del'>-			exfat_get_entry_time(sbi, &amp;dir_entry-&gt;atime,</div><div class='del'>-					ep-&gt;dentry.file.access_tz,</div><div class='del'>-					ep-&gt;dentry.file.access_time,</div><div class='del'>-					ep-&gt;dentry.file.access_date,</div><div class='del'>-					0);</div><div class='ctx'> </div><div class='ctx'> 			*uni_name.name = 0x0;</div><div class='del'>-			exfat_get_uniname_from_ext_entry(sb, &amp;clu, i,</div><div class='add'>+			err = exfat_get_uniname_from_ext_entry(sb, &amp;clu, i,</div><div class='ctx'> 				uni_name.name);</div><div class='add'>+			if (err) {</div><div class='add'>+				brelse(bh);</div><div class='add'>+				continue;</div><div class='add'>+			}</div><div class='ctx'> 			exfat_utf16_to_nls(sb, &amp;uni_name,</div><div class='ctx'> 				dir_entry-&gt;namebuf.lfn,</div><div class='ctx'> 				dir_entry-&gt;namebuf.lfnbuf_len);</div><div class='ctx'> 			brelse(bh);</div><div class='ctx'> </div><div class='del'>-			ep = exfat_get_dentry(sb, &amp;clu, i + 1, &amp;bh, NULL);</div><div class='add'>+			ep = exfat_get_dentry(sb, &amp;clu, i + 1, &amp;bh);</div><div class='ctx'> 			if (!ep)</div><div class='ctx'> 				return -EIO;</div><div class='del'>-			dir_entry-&gt;size =</div><div class='del'>-				le64_to_cpu(ep-&gt;dentry.stream.valid_size);</div><div class='del'>-			dir_entry-&gt;entry = dentry;</div><div class='add'>+			dir_entry-&gt;entry = i;</div><div class='add'>+			dir_entry-&gt;dir = clu;</div><div class='ctx'> 			brelse(bh);</div><div class='ctx'> </div><div class='del'>-			ei-&gt;hint_bmap.off = dentry &gt;&gt; dentries_per_clu_bits;</div><div class='add'>+			ei-&gt;hint_bmap.off = EXFAT_DEN_TO_CLU(dentry, sbi);</div><div class='ctx'> 			ei-&gt;hint_bmap.clu = clu.dir;</div><div class='ctx'> </div><div class='ctx'> 			*cpos = EXFAT_DEN_TO_B(dentry + 1 + num_ext);</div><div class='hunk'>@@ -182,6 +170,7 @@ static int exfat_readdir(struct inode *inode, loff_t *cpos, struct exfat_dir_ent</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+out:</div><div class='ctx'> 	dir_entry-&gt;namebuf.lfn[0] = '\0';</div><div class='ctx'> 	*cpos = EXFAT_DEN_TO_B(dentry);</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -211,11 +200,14 @@ static void exfat_free_namebuf(struct exfat_dentry_namebuf *nb)</div><div class='ctx'> 	exfat_init_namebuf(nb);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* skip iterating emit_dots when dir is empty */</div><div class='add'>+/*</div><div class='add'>+ * Before calling dir_emit*(), sbi-&gt;s_lock should be released</div><div class='add'>+ * because page fault can occur in dir_emit*().</div><div class='add'>+ */</div><div class='ctx'> #define ITER_POS_FILLED_DOTS    (2)</div><div class='del'>-static int exfat_iterate(struct file *filp, struct dir_context *ctx)</div><div class='add'>+static int exfat_iterate(struct file *file, struct dir_context *ctx)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = filp-&gt;f_path.dentry-&gt;d_inode;</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	struct inode *tmp;</div><div class='ctx'> 	struct exfat_dir_entry de;</div><div class='hunk'>@@ -226,35 +218,33 @@ static int exfat_iterate(struct file *filp, struct dir_context *ctx)</div><div class='ctx'> 	int err = 0, fake_offset = 0;</div><div class='ctx'> </div><div class='ctx'> 	exfat_init_namebuf(nb);</div><div class='del'>-	mutex_lock(&amp;EXFAT_SB(sb)-&gt;s_lock);</div><div class='ctx'> </div><div class='ctx'> 	cpos = ctx-&gt;pos;</div><div class='del'>-	if (!dir_emit_dots(filp, ctx))</div><div class='del'>-		goto unlock;</div><div class='add'>+	if (!dir_emit_dots(file, ctx))</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='ctx'> 	if (ctx-&gt;pos == ITER_POS_FILLED_DOTS) {</div><div class='ctx'> 		cpos = 0;</div><div class='ctx'> 		fake_offset = 1;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (cpos &amp; (DENTRY_SIZE - 1)) {</div><div class='del'>-		err = -ENOENT;</div><div class='del'>-		goto unlock;</div><div class='del'>-	}</div><div class='add'>+	cpos = round_up(cpos, DENTRY_SIZE);</div><div class='ctx'> </div><div class='ctx'> 	/* name buffer should be allocated before use */</div><div class='ctx'> 	err = exfat_alloc_namebuf(nb);</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto unlock;</div><div class='add'>+		goto out;</div><div class='ctx'> get_new:</div><div class='add'>+	mutex_lock(&amp;EXFAT_SB(sb)-&gt;s_lock);</div><div class='add'>+</div><div class='ctx'> 	if (ei-&gt;flags == ALLOC_NO_FAT_CHAIN &amp;&amp; cpos &gt;= i_size_read(inode))</div><div class='ctx'> 		goto end_of_dir;</div><div class='ctx'> </div><div class='ctx'> 	err = exfat_readdir(inode, &amp;cpos, &amp;de);</div><div class='ctx'> 	if (err) {</div><div class='ctx'> 		/*</div><div class='del'>-		 * At least we tried to read a sector.  Move cpos to next sector</div><div class='del'>-		 * position (should be aligned).</div><div class='add'>+		 * At least we tried to read a sector.</div><div class='add'>+		 * Move cpos to next sector position (should be aligned).</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (err == -EIO) {</div><div class='ctx'> 			cpos += 1 &lt;&lt; (sb-&gt;s_blocksize_bits);</div><div class='hunk'>@@ -268,7 +258,7 @@ get_new:</div><div class='ctx'> 	if (!nb-&gt;lfn[0])</div><div class='ctx'> 		goto end_of_dir;</div><div class='ctx'> </div><div class='del'>-	i_pos = ((loff_t)ei-&gt;start_clu &lt;&lt; 32) |	(de.entry &amp; 0xffffffff);</div><div class='add'>+	i_pos = ((loff_t)de.dir.dir &lt;&lt; 32) | (de.entry &amp; 0xffffffff);</div><div class='ctx'> 	tmp = exfat_iget(sb, i_pos);</div><div class='ctx'> 	if (tmp) {</div><div class='ctx'> 		inum = tmp-&gt;i_ino;</div><div class='hunk'>@@ -277,16 +267,10 @@ get_new:</div><div class='ctx'> 		inum = iunique(sb, EXFAT_ROOT_INO);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Before calling dir_emit(), sb_lock should be released.</div><div class='del'>-	 * Because page fault can occur in dir_emit() when the size</div><div class='del'>-	 * of buffer given from user is larger than one page size.</div><div class='del'>-	 */</div><div class='ctx'> 	mutex_unlock(&amp;EXFAT_SB(sb)-&gt;s_lock);</div><div class='ctx'> 	if (!dir_emit(ctx, nb-&gt;lfn, strlen(nb-&gt;lfn), inum,</div><div class='del'>-			(de.attr &amp; ATTR_SUBDIR) ? DT_DIR : DT_REG))</div><div class='del'>-		goto out_unlocked;</div><div class='del'>-	mutex_lock(&amp;EXFAT_SB(sb)-&gt;s_lock);</div><div class='add'>+			(de.attr &amp; EXFAT_ATTR_SUBDIR) ? DT_DIR : DT_REG))</div><div class='add'>+		goto out;</div><div class='ctx'> 	ctx-&gt;pos = cpos;</div><div class='ctx'> 	goto get_new;</div><div class='ctx'> </div><div class='hunk'>@@ -294,9 +278,8 @@ end_of_dir:</div><div class='ctx'> 	if (!cpos &amp;&amp; fake_offset)</div><div class='ctx'> 		cpos = ITER_POS_FILLED_DOTS;</div><div class='ctx'> 	ctx-&gt;pos = cpos;</div><div class='del'>-unlock:</div><div class='ctx'> 	mutex_unlock(&amp;EXFAT_SB(sb)-&gt;s_lock);</div><div class='del'>-out_unlocked:</div><div class='add'>+out:</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * To improve performance, free namebuf after unlock sb_lock.</div><div class='ctx'> 	 * If namebuf is not allocated, this function do nothing</div><div class='hunk'>@@ -305,10 +288,11 @@ out_unlocked:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+WRAP_DIR_ITER(exfat_iterate) // FIXME!</div><div class='ctx'> const struct file_operations exfat_dir_operations = {</div><div class='ctx'> 	.llseek		= generic_file_llseek,</div><div class='ctx'> 	.read		= generic_read_dir,</div><div class='del'>-	.iterate	= exfat_iterate,</div><div class='add'>+	.iterate_shared	= shared_exfat_iterate,</div><div class='ctx'> 	.unlocked_ioctl = exfat_ioctl,</div><div class='ctx'> #ifdef CONFIG_COMPAT</div><div class='ctx'> 	.compat_ioctl = exfat_compat_ioctl,</div><div class='hunk'>@@ -338,7 +322,7 @@ int exfat_calc_num_entries(struct exfat_uni_name *p_uniname)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	/* 1 file entry + 1 stream entry + name entries */</div><div class='del'>-	return ((len - 1) / EXFAT_FILE_NAME_LEN + 3);</div><div class='add'>+	return ES_ENTRY_NUM(len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> unsigned int exfat_get_entry_type(struct exfat_dentry *ep)</div><div class='hunk'>@@ -357,7 +341,7 @@ unsigned int exfat_get_entry_type(struct exfat_dentry *ep)</div><div class='ctx'> 		if (ep-&gt;type == EXFAT_VOLUME)</div><div class='ctx'> 			return TYPE_VOLUME;</div><div class='ctx'> 		if (ep-&gt;type == EXFAT_FILE) {</div><div class='del'>-			if (le16_to_cpu(ep-&gt;dentry.file.attr) &amp; ATTR_SUBDIR)</div><div class='add'>+			if (le16_to_cpu(ep-&gt;dentry.file.attr) &amp; EXFAT_ATTR_SUBDIR)</div><div class='ctx'> 				return TYPE_DIR;</div><div class='ctx'> 			return TYPE_FILE;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -381,6 +365,12 @@ unsigned int exfat_get_entry_type(struct exfat_dentry *ep)</div><div class='ctx'> 			return TYPE_ACL;</div><div class='ctx'> 		return TYPE_CRITICAL_SEC;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	if (ep-&gt;type == EXFAT_VENDOR_EXT)</div><div class='add'>+		return TYPE_VENDOR_EXT;</div><div class='add'>+	if (ep-&gt;type == EXFAT_VENDOR_ALLOC)</div><div class='add'>+		return TYPE_VENDOR_ALLOC;</div><div class='add'>+</div><div class='ctx'> 	return TYPE_BENIGN_SEC;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -402,19 +392,22 @@ static void exfat_set_entry_type(struct exfat_dentry *ep, unsigned int type)</div><div class='ctx'> 		ep-&gt;type = EXFAT_VOLUME;</div><div class='ctx'> 	} else if (type == TYPE_DIR) {</div><div class='ctx'> 		ep-&gt;type = EXFAT_FILE;</div><div class='del'>-		ep-&gt;dentry.file.attr = cpu_to_le16(ATTR_SUBDIR);</div><div class='add'>+		ep-&gt;dentry.file.attr = cpu_to_le16(EXFAT_ATTR_SUBDIR);</div><div class='ctx'> 	} else if (type == TYPE_FILE) {</div><div class='ctx'> 		ep-&gt;type = EXFAT_FILE;</div><div class='del'>-		ep-&gt;dentry.file.attr = cpu_to_le16(ATTR_ARCHIVE);</div><div class='add'>+		ep-&gt;dentry.file.attr = cpu_to_le16(EXFAT_ATTR_ARCHIVE);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void exfat_init_stream_entry(struct exfat_dentry *ep,</div><div class='del'>-		unsigned char flags, unsigned int start_clu,</div><div class='del'>-		unsigned long long size)</div><div class='add'>+		unsigned int start_clu, unsigned long long size)</div><div class='ctx'> {</div><div class='add'>+	memset(ep, 0, sizeof(*ep));</div><div class='ctx'> 	exfat_set_entry_type(ep, TYPE_STREAM);</div><div class='del'>-	ep-&gt;dentry.stream.flags = flags;</div><div class='add'>+	if (size == 0)</div><div class='add'>+		ep-&gt;dentry.stream.flags = ALLOC_FAT_CHAIN;</div><div class='add'>+	else</div><div class='add'>+		ep-&gt;dentry.stream.flags = ALLOC_NO_FAT_CHAIN;</div><div class='ctx'> 	ep-&gt;dentry.stream.start_clu = cpu_to_le32(start_clu);</div><div class='ctx'> 	ep-&gt;dentry.stream.valid_size = cpu_to_le64(size);</div><div class='ctx'> 	ep-&gt;dentry.stream.size = cpu_to_le64(size);</div><div class='hunk'>@@ -438,177 +431,116 @@ static void exfat_init_name_entry(struct exfat_dentry *ep,</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int exfat_init_dir_entry(struct inode *inode, struct exfat_chain *p_dir,</div><div class='del'>-		int entry, unsigned int type, unsigned int start_clu,</div><div class='del'>-		unsigned long long size)</div><div class='add'>+void exfat_init_dir_entry(struct exfat_entry_set_cache *es,</div><div class='add'>+		unsigned int type, unsigned int start_clu,</div><div class='add'>+		unsigned long long size, struct timespec64 *ts)</div><div class='ctx'> {</div><div class='del'>-	struct super_block *sb = inode-&gt;i_sb;</div><div class='add'>+	struct super_block *sb = es-&gt;sb;</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='del'>-	struct timespec64 ts = current_time(inode);</div><div class='del'>-	sector_t sector;</div><div class='ctx'> 	struct exfat_dentry *ep;</div><div class='del'>-	struct buffer_head *bh;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * We cannot use exfat_get_dentry_set here because file ep is not</div><div class='del'>-	 * initialized yet.</div><div class='del'>-	 */</div><div class='del'>-	ep = exfat_get_dentry(sb, p_dir, entry, &amp;bh, &amp;sector);</div><div class='del'>-	if (!ep)</div><div class='del'>-		return -EIO;</div><div class='ctx'> </div><div class='add'>+	ep = exfat_get_dentry_cached(es, ES_IDX_FILE);</div><div class='add'>+	memset(ep, 0, sizeof(*ep));</div><div class='ctx'> 	exfat_set_entry_type(ep, type);</div><div class='del'>-	exfat_set_entry_time(sbi, &amp;ts,</div><div class='add'>+	exfat_set_entry_time(sbi, ts,</div><div class='ctx'> 			&amp;ep-&gt;dentry.file.create_tz,</div><div class='ctx'> 			&amp;ep-&gt;dentry.file.create_time,</div><div class='ctx'> 			&amp;ep-&gt;dentry.file.create_date,</div><div class='ctx'> 			&amp;ep-&gt;dentry.file.create_time_cs);</div><div class='del'>-	exfat_set_entry_time(sbi, &amp;ts,</div><div class='add'>+	exfat_set_entry_time(sbi, ts,</div><div class='ctx'> 			&amp;ep-&gt;dentry.file.modify_tz,</div><div class='ctx'> 			&amp;ep-&gt;dentry.file.modify_time,</div><div class='ctx'> 			&amp;ep-&gt;dentry.file.modify_date,</div><div class='ctx'> 			&amp;ep-&gt;dentry.file.modify_time_cs);</div><div class='del'>-	exfat_set_entry_time(sbi, &amp;ts,</div><div class='add'>+	exfat_set_entry_time(sbi, ts,</div><div class='ctx'> 			&amp;ep-&gt;dentry.file.access_tz,</div><div class='ctx'> 			&amp;ep-&gt;dentry.file.access_time,</div><div class='ctx'> 			&amp;ep-&gt;dentry.file.access_date,</div><div class='ctx'> 			NULL);</div><div class='ctx'> </div><div class='del'>-	exfat_update_bh(bh, IS_DIRSYNC(inode));</div><div class='del'>-	brelse(bh);</div><div class='del'>-</div><div class='del'>-	ep = exfat_get_dentry(sb, p_dir, entry + 1, &amp;bh, &amp;sector);</div><div class='del'>-	if (!ep)</div><div class='del'>-		return -EIO;</div><div class='del'>-</div><div class='del'>-	exfat_init_stream_entry(ep,</div><div class='del'>-		(type == TYPE_FILE) ? ALLOC_FAT_CHAIN : ALLOC_NO_FAT_CHAIN,</div><div class='del'>-		start_clu, size);</div><div class='del'>-	exfat_update_bh(bh, IS_DIRSYNC(inode));</div><div class='del'>-	brelse(bh);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='add'>+	ep = exfat_get_dentry_cached(es, ES_IDX_STREAM);</div><div class='add'>+	exfat_init_stream_entry(ep, start_clu, size);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int exfat_update_dir_chksum(struct inode *inode, struct exfat_chain *p_dir,</div><div class='del'>-		int entry)</div><div class='add'>+static void exfat_free_benign_secondary_clusters(struct inode *inode,</div><div class='add'>+		struct exfat_dentry *ep)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='del'>-	int ret = 0;</div><div class='del'>-	int i, num_entries;</div><div class='del'>-	sector_t sector;</div><div class='del'>-	u16 chksum;</div><div class='del'>-	struct exfat_dentry *ep, *fep;</div><div class='del'>-	struct buffer_head *fbh, *bh;</div><div class='del'>-</div><div class='del'>-	fep = exfat_get_dentry(sb, p_dir, entry, &amp;fbh, &amp;sector);</div><div class='del'>-	if (!fep)</div><div class='del'>-		return -EIO;</div><div class='add'>+	struct exfat_chain dir;</div><div class='add'>+	unsigned int start_clu =</div><div class='add'>+		le32_to_cpu(ep-&gt;dentry.generic_secondary.start_clu);</div><div class='add'>+	u64 size = le64_to_cpu(ep-&gt;dentry.generic_secondary.size);</div><div class='add'>+	unsigned char flags = ep-&gt;dentry.generic_secondary.flags;</div><div class='ctx'> </div><div class='del'>-	num_entries = fep-&gt;dentry.file.num_ext + 1;</div><div class='del'>-	chksum = exfat_calc_chksum16(fep, DENTRY_SIZE, 0, CS_DIR_ENTRY);</div><div class='del'>-</div><div class='del'>-	for (i = 1; i &lt; num_entries; i++) {</div><div class='del'>-		ep = exfat_get_dentry(sb, p_dir, entry + i, &amp;bh, NULL);</div><div class='del'>-		if (!ep) {</div><div class='del'>-			ret = -EIO;</div><div class='del'>-			goto release_fbh;</div><div class='del'>-		}</div><div class='del'>-		chksum = exfat_calc_chksum16(ep, DENTRY_SIZE, chksum,</div><div class='del'>-				CS_DEFAULT);</div><div class='del'>-		brelse(bh);</div><div class='del'>-	}</div><div class='add'>+	if (!(flags &amp; ALLOC_POSSIBLE) || !start_clu || !size)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	fep-&gt;dentry.file.checksum = cpu_to_le16(chksum);</div><div class='del'>-	exfat_update_bh(fbh, IS_DIRSYNC(inode));</div><div class='del'>-release_fbh:</div><div class='del'>-	brelse(fbh);</div><div class='del'>-	return ret;</div><div class='add'>+	exfat_chain_set(&amp;dir, start_clu,</div><div class='add'>+			EXFAT_B_TO_CLU_ROUND_UP(size, EXFAT_SB(sb)),</div><div class='add'>+			flags);</div><div class='add'>+	exfat_free_cluster(inode, &amp;dir);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int exfat_init_ext_entry(struct inode *inode, struct exfat_chain *p_dir,</div><div class='del'>-		int entry, int num_entries, struct exfat_uni_name *p_uniname)</div><div class='add'>+void exfat_init_ext_entry(struct exfat_entry_set_cache *es, int num_entries,</div><div class='add'>+		struct exfat_uni_name *p_uniname)</div><div class='ctx'> {</div><div class='del'>-	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	int i;</div><div class='del'>-	sector_t sector;</div><div class='ctx'> 	unsigned short *uniname = p_uniname-&gt;name;</div><div class='ctx'> 	struct exfat_dentry *ep;</div><div class='del'>-	struct buffer_head *bh;</div><div class='del'>-	int sync = IS_DIRSYNC(inode);</div><div class='del'>-</div><div class='del'>-	ep = exfat_get_dentry(sb, p_dir, entry, &amp;bh, &amp;sector);</div><div class='del'>-	if (!ep)</div><div class='del'>-		return -EIO;</div><div class='ctx'> </div><div class='add'>+	ep = exfat_get_dentry_cached(es, ES_IDX_FILE);</div><div class='ctx'> 	ep-&gt;dentry.file.num_ext = (unsigned char)(num_entries - 1);</div><div class='del'>-	exfat_update_bh(bh, sync);</div><div class='del'>-	brelse(bh);</div><div class='del'>-</div><div class='del'>-	ep = exfat_get_dentry(sb, p_dir, entry + 1, &amp;bh, &amp;sector);</div><div class='del'>-	if (!ep)</div><div class='del'>-		return -EIO;</div><div class='ctx'> </div><div class='add'>+	ep = exfat_get_dentry_cached(es, ES_IDX_STREAM);</div><div class='ctx'> 	ep-&gt;dentry.stream.name_len = p_uniname-&gt;name_len;</div><div class='ctx'> 	ep-&gt;dentry.stream.name_hash = cpu_to_le16(p_uniname-&gt;name_hash);</div><div class='del'>-	exfat_update_bh(bh, sync);</div><div class='del'>-	brelse(bh);</div><div class='del'>-</div><div class='del'>-	for (i = EXFAT_FIRST_CLUSTER; i &lt; num_entries; i++) {</div><div class='del'>-		ep = exfat_get_dentry(sb, p_dir, entry + i, &amp;bh, &amp;sector);</div><div class='del'>-		if (!ep)</div><div class='del'>-			return -EIO;</div><div class='ctx'> </div><div class='add'>+	for (i = ES_IDX_FIRST_FILENAME; i &lt; num_entries; i++) {</div><div class='add'>+		ep = exfat_get_dentry_cached(es, i);</div><div class='ctx'> 		exfat_init_name_entry(ep, uniname);</div><div class='del'>-		exfat_update_bh(bh, sync);</div><div class='del'>-		brelse(bh);</div><div class='ctx'> 		uniname += EXFAT_FILE_NAME_LEN;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	exfat_update_dir_chksum(inode, p_dir, entry);</div><div class='del'>-	return 0;</div><div class='add'>+	exfat_update_dir_chksum(es);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int exfat_remove_entries(struct inode *inode, struct exfat_chain *p_dir,</div><div class='del'>-		int entry, int order, int num_entries)</div><div class='add'>+void exfat_remove_entries(struct inode *inode, struct exfat_entry_set_cache *es,</div><div class='add'>+		int order)</div><div class='ctx'> {</div><div class='del'>-	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	int i;</div><div class='del'>-	sector_t sector;</div><div class='ctx'> 	struct exfat_dentry *ep;</div><div class='del'>-	struct buffer_head *bh;</div><div class='ctx'> </div><div class='del'>-	for (i = order; i &lt; num_entries; i++) {</div><div class='del'>-		ep = exfat_get_dentry(sb, p_dir, entry + i, &amp;bh, &amp;sector);</div><div class='del'>-		if (!ep)</div><div class='del'>-			return -EIO;</div><div class='add'>+	for (i = order; i &lt; es-&gt;num_entries; i++) {</div><div class='add'>+		ep = exfat_get_dentry_cached(es, i);</div><div class='add'>+</div><div class='add'>+		if (exfat_get_entry_type(ep) &amp; TYPE_BENIGN_SEC)</div><div class='add'>+			exfat_free_benign_secondary_clusters(inode, ep);</div><div class='ctx'> </div><div class='ctx'> 		exfat_set_entry_type(ep, TYPE_DELETED);</div><div class='del'>-		exfat_update_bh(bh, IS_DIRSYNC(inode));</div><div class='del'>-		brelse(bh);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+	if (order &lt; es-&gt;num_entries)</div><div class='add'>+		es-&gt;modified = true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void exfat_update_dir_chksum_with_entry_set(struct exfat_entry_set_cache *es)</div><div class='add'>+void exfat_update_dir_chksum(struct exfat_entry_set_cache *es)</div><div class='ctx'> {</div><div class='ctx'> 	int chksum_type = CS_DIR_ENTRY, i;</div><div class='ctx'> 	unsigned short chksum = 0;</div><div class='ctx'> 	struct exfat_dentry *ep;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; es-&gt;num_entries; i++) {</div><div class='add'>+	for (i = ES_IDX_FILE; i &lt; es-&gt;num_entries; i++) {</div><div class='ctx'> 		ep = exfat_get_dentry_cached(es, i);</div><div class='ctx'> 		chksum = exfat_calc_chksum16(ep, DENTRY_SIZE, chksum,</div><div class='ctx'> 					     chksum_type);</div><div class='ctx'> 		chksum_type = CS_DEFAULT;</div><div class='ctx'> 	}</div><div class='del'>-	ep = exfat_get_dentry_cached(es, 0);</div><div class='add'>+	ep = exfat_get_dentry_cached(es, ES_IDX_FILE);</div><div class='ctx'> 	ep-&gt;dentry.file.checksum = cpu_to_le16(chksum);</div><div class='ctx'> 	es-&gt;modified = true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int exfat_free_dentry_set(struct exfat_entry_set_cache *es, int sync)</div><div class='add'>+int exfat_put_dentry_set(struct exfat_entry_set_cache *es, int sync)</div><div class='ctx'> {</div><div class='ctx'> 	int i, err = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -620,7 +552,10 @@ int exfat_free_dentry_set(struct exfat_entry_set_cache *es, int sync)</div><div class='ctx'> 			bforget(es-&gt;bh[i]);</div><div class='ctx'> 		else</div><div class='ctx'> 			brelse(es-&gt;bh[i]);</div><div class='del'>-	kfree(es);</div><div class='add'>+</div><div class='add'>+	if (IS_DYNAMIC_ES(es))</div><div class='add'>+		kfree(es-&gt;bh);</div><div class='add'>+</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -656,8 +591,8 @@ static int exfat_walk_fat_chain(struct super_block *sb,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int exfat_find_location(struct super_block *sb, struct exfat_chain *p_dir,</div><div class='del'>-		int entry, sector_t *sector, int *offset)</div><div class='add'>+static int exfat_find_location(struct super_block *sb, struct exfat_chain *p_dir,</div><div class='add'>+			       int entry, sector_t *sector, int *offset)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	unsigned int off, clu = 0;</div><div class='hunk'>@@ -669,6 +604,11 @@ int exfat_find_location(struct super_block *sb, struct exfat_chain *p_dir,</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='add'>+	if (!exfat_test_bitmap(sb, clu)) {</div><div class='add'>+		exfat_err(sb, "failed to test cluster bit(%u)", clu);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/* byte offset in cluster */</div><div class='ctx'> 	off = EXFAT_CLU_OFFSET(off, sbi);</div><div class='ctx'> </div><div class='hunk'>@@ -717,8 +657,7 @@ static int exfat_dir_readahead(struct super_block *sb, sector_t sec)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct exfat_dentry *exfat_get_dentry(struct super_block *sb,</div><div class='del'>-		struct exfat_chain *p_dir, int entry, struct buffer_head **bh,</div><div class='del'>-		sector_t *sector)</div><div class='add'>+		struct exfat_chain *p_dir, int entry, struct buffer_head **bh)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int dentries_per_page = EXFAT_B_TO_DEN(PAGE_SIZE);</div><div class='ctx'> 	int off;</div><div class='hunk'>@@ -740,17 +679,15 @@ struct exfat_dentry *exfat_get_dentry(struct super_block *sb,</div><div class='ctx'> 	if (!*bh)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='del'>-	if (sector)</div><div class='del'>-		*sector = sec;</div><div class='ctx'> 	return (struct exfat_dentry *)((*bh)-&gt;b_data + off);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> enum exfat_validate_dentry_mode {</div><div class='del'>-	ES_MODE_STARTED,</div><div class='ctx'> 	ES_MODE_GET_FILE_ENTRY,</div><div class='ctx'> 	ES_MODE_GET_STRM_ENTRY,</div><div class='ctx'> 	ES_MODE_GET_NAME_ENTRY,</div><div class='ctx'> 	ES_MODE_GET_CRITICAL_SEC_ENTRY,</div><div class='add'>+	ES_MODE_GET_BENIGN_SEC_ENTRY,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static bool exfat_validate_entry(unsigned int type,</div><div class='hunk'>@@ -760,40 +697,32 @@ static bool exfat_validate_entry(unsigned int type,</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='ctx'> 	switch (*mode) {</div><div class='del'>-	case ES_MODE_STARTED:</div><div class='del'>-		if  (type != TYPE_FILE &amp;&amp; type != TYPE_DIR)</div><div class='del'>-			return false;</div><div class='del'>-		*mode = ES_MODE_GET_FILE_ENTRY;</div><div class='del'>-		return true;</div><div class='ctx'> 	case ES_MODE_GET_FILE_ENTRY:</div><div class='ctx'> 		if (type != TYPE_STREAM)</div><div class='ctx'> 			return false;</div><div class='ctx'> 		*mode = ES_MODE_GET_STRM_ENTRY;</div><div class='del'>-		return true;</div><div class='add'>+		break;</div><div class='ctx'> 	case ES_MODE_GET_STRM_ENTRY:</div><div class='ctx'> 		if (type != TYPE_EXTEND)</div><div class='ctx'> 			return false;</div><div class='ctx'> 		*mode = ES_MODE_GET_NAME_ENTRY;</div><div class='del'>-		return true;</div><div class='add'>+		break;</div><div class='ctx'> 	case ES_MODE_GET_NAME_ENTRY:</div><div class='del'>-		if (type == TYPE_STREAM)</div><div class='add'>+		if (type &amp; TYPE_BENIGN_SEC)</div><div class='add'>+			*mode = ES_MODE_GET_BENIGN_SEC_ENTRY;</div><div class='add'>+		else if (type != TYPE_EXTEND)</div><div class='ctx'> 			return false;</div><div class='del'>-		if (type != TYPE_EXTEND) {</div><div class='del'>-			if (!(type &amp; TYPE_CRITICAL_SEC))</div><div class='del'>-				return false;</div><div class='del'>-			*mode = ES_MODE_GET_CRITICAL_SEC_ENTRY;</div><div class='del'>-		}</div><div class='del'>-		return true;</div><div class='del'>-	case ES_MODE_GET_CRITICAL_SEC_ENTRY:</div><div class='del'>-		if (type == TYPE_EXTEND || type == TYPE_STREAM)</div><div class='add'>+		break;</div><div class='add'>+	case ES_MODE_GET_BENIGN_SEC_ENTRY:</div><div class='add'>+		/* Assume unreconized benign secondary entry */</div><div class='add'>+		if (!(type &amp; TYPE_BENIGN_SEC))</div><div class='ctx'> 			return false;</div><div class='del'>-		if ((type &amp; TYPE_CRITICAL_SEC) != TYPE_CRITICAL_SEC)</div><div class='del'>-			return false;</div><div class='del'>-		return true;</div><div class='add'>+		break;</div><div class='ctx'> 	default:</div><div class='del'>-		WARN_ON_ONCE(1);</div><div class='ctx'> 		return false;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct exfat_dentry *exfat_get_dentry_cached(</div><div class='hunk'>@@ -807,7 +736,7 @@ struct exfat_dentry *exfat_get_dentry_cached(</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Returns a set of dentries for a file or dir.</div><div class='add'>+ * Returns a set of dentries.</div><div class='ctx'>  *</div><div class='ctx'>  * Note It provides a direct pointer to bh-&gt;data via exfat_get_dentry_cached().</div><div class='ctx'>  * User should call exfat_get_dentry_set() after setting 'modified' to apply</div><div class='hunk'>@@ -815,72 +744,79 @@ struct exfat_dentry *exfat_get_dentry_cached(</div><div class='ctx'>  *</div><div class='ctx'>  * in:</div><div class='ctx'>  *   sb+p_dir+entry: indicates a file/dir</div><div class='del'>- *   type:  specifies how many dentries should be included.</div><div class='add'>+ *   num_entries: specifies how many dentries should be included.</div><div class='add'>+ *                It will be set to es-&gt;num_entries if it is not 0.</div><div class='add'>+ *                If num_entries is 0, es-&gt;num_entries will be obtained</div><div class='add'>+ *                from the first dentry.</div><div class='add'>+ * out:</div><div class='add'>+ *   es: pointer of entry set on success.</div><div class='ctx'>  * return:</div><div class='del'>- *   pointer of entry set on success,</div><div class='del'>- *   NULL on failure.</div><div class='add'>+ *   0 on success</div><div class='add'>+ *   -error code on failure</div><div class='ctx'>  */</div><div class='del'>-struct exfat_entry_set_cache *exfat_get_dentry_set(struct super_block *sb,</div><div class='del'>-		struct exfat_chain *p_dir, int entry, unsigned int type)</div><div class='add'>+static int __exfat_get_dentry_set(struct exfat_entry_set_cache *es,</div><div class='add'>+		struct super_block *sb, struct exfat_chain *p_dir, int entry,</div><div class='add'>+		unsigned int num_entries)</div><div class='ctx'> {</div><div class='ctx'> 	int ret, i, num_bh;</div><div class='del'>-	unsigned int off, byte_offset, clu = 0;</div><div class='add'>+	unsigned int off;</div><div class='ctx'> 	sector_t sec;</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='del'>-	struct exfat_entry_set_cache *es;</div><div class='del'>-	struct exfat_dentry *ep;</div><div class='del'>-	int num_entries;</div><div class='del'>-	enum exfat_validate_dentry_mode mode = ES_MODE_STARTED;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> </div><div class='ctx'> 	if (p_dir-&gt;dir == DIR_DELETED) {</div><div class='ctx'> 		exfat_err(sb, "access to deleted dentry");</div><div class='del'>-		return NULL;</div><div class='add'>+		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	byte_offset = EXFAT_DEN_TO_B(entry);</div><div class='del'>-	ret = exfat_walk_fat_chain(sb, p_dir, byte_offset, &amp;clu);</div><div class='add'>+	ret = exfat_find_location(sb, p_dir, entry, &amp;sec, &amp;off);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		return NULL;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	es = kzalloc(sizeof(*es), GFP_KERNEL);</div><div class='del'>-	if (!es)</div><div class='del'>-		return NULL;</div><div class='add'>+	memset(es, 0, sizeof(*es));</div><div class='ctx'> 	es-&gt;sb = sb;</div><div class='ctx'> 	es-&gt;modified = false;</div><div class='del'>-</div><div class='del'>-	/* byte offset in cluster */</div><div class='del'>-	byte_offset = EXFAT_CLU_OFFSET(byte_offset, sbi);</div><div class='del'>-</div><div class='del'>-	/* byte offset in sector */</div><div class='del'>-	off = EXFAT_BLK_OFFSET(byte_offset, sb);</div><div class='ctx'> 	es-&gt;start_off = off;</div><div class='del'>-</div><div class='del'>-	/* sector offset in cluster */</div><div class='del'>-	sec = EXFAT_B_TO_BLK(byte_offset, sb);</div><div class='del'>-	sec += exfat_cluster_to_sector(sbi, clu);</div><div class='add'>+	es-&gt;bh = es-&gt;__bh;</div><div class='ctx'> </div><div class='ctx'> 	bh = sb_bread(sb, sec);</div><div class='ctx'> 	if (!bh)</div><div class='del'>-		goto free_es;</div><div class='add'>+		return -EIO;</div><div class='ctx'> 	es-&gt;bh[es-&gt;num_bh++] = bh;</div><div class='ctx'> </div><div class='del'>-	ep = exfat_get_dentry_cached(es, 0);</div><div class='del'>-	if (!exfat_validate_entry(exfat_get_entry_type(ep), &amp;mode))</div><div class='del'>-		goto free_es;</div><div class='add'>+	if (num_entries == ES_ALL_ENTRIES) {</div><div class='add'>+		struct exfat_dentry *ep;</div><div class='add'>+</div><div class='add'>+		ep = exfat_get_dentry_cached(es, ES_IDX_FILE);</div><div class='add'>+		if (ep-&gt;type != EXFAT_FILE) {</div><div class='add'>+			brelse(bh);</div><div class='add'>+			return -EIO;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		num_entries = ep-&gt;dentry.file.num_ext + 1;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	num_entries = type == ES_ALL_ENTRIES ?</div><div class='del'>-		ep-&gt;dentry.file.num_ext + 1 : type;</div><div class='ctx'> 	es-&gt;num_entries = num_entries;</div><div class='ctx'> </div><div class='ctx'> 	num_bh = EXFAT_B_TO_BLK_ROUND_UP(off + num_entries * DENTRY_SIZE, sb);</div><div class='add'>+	if (num_bh &gt; ARRAY_SIZE(es-&gt;__bh)) {</div><div class='add'>+		es-&gt;bh = kmalloc_array(num_bh, sizeof(*es-&gt;bh), GFP_NOFS);</div><div class='add'>+		if (!es-&gt;bh) {</div><div class='add'>+			brelse(bh);</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+		}</div><div class='add'>+		es-&gt;bh[0] = bh;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	for (i = 1; i &lt; num_bh; i++) {</div><div class='ctx'> 		/* get the next sector */</div><div class='ctx'> 		if (exfat_is_last_sector_in_cluster(sbi, sec)) {</div><div class='add'>+			unsigned int clu = exfat_sector_to_cluster(sbi, sec);</div><div class='add'>+</div><div class='ctx'> 			if (p_dir-&gt;flags == ALLOC_NO_FAT_CHAIN)</div><div class='ctx'> 				clu++;</div><div class='ctx'> 			else if (exfat_get_next_cluster(sb, &amp;clu))</div><div class='del'>-				goto free_es;</div><div class='add'>+				goto put_es;</div><div class='ctx'> 			sec = exfat_cluster_to_sector(sbi, clu);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			sec++;</div><div class='hunk'>@@ -888,21 +824,149 @@ struct exfat_entry_set_cache *exfat_get_dentry_set(struct super_block *sb,</div><div class='ctx'> </div><div class='ctx'> 		bh = sb_bread(sb, sec);</div><div class='ctx'> 		if (!bh)</div><div class='del'>-			goto free_es;</div><div class='add'>+			goto put_es;</div><div class='ctx'> 		es-&gt;bh[es-&gt;num_bh++] = bh;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* validiate cached dentries */</div><div class='del'>-	for (i = 1; i &lt; num_entries; i++) {</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+put_es:</div><div class='add'>+	exfat_put_dentry_set(es, false);</div><div class='add'>+	return -EIO;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int exfat_get_dentry_set(struct exfat_entry_set_cache *es,</div><div class='add'>+		struct super_block *sb, struct exfat_chain *p_dir,</div><div class='add'>+		int entry, unsigned int num_entries)</div><div class='add'>+{</div><div class='add'>+	int ret, i;</div><div class='add'>+	struct exfat_dentry *ep;</div><div class='add'>+	enum exfat_validate_dentry_mode mode = ES_MODE_GET_FILE_ENTRY;</div><div class='add'>+</div><div class='add'>+	ret = __exfat_get_dentry_set(es, sb, p_dir, entry, num_entries);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	/* validate cached dentries */</div><div class='add'>+	for (i = ES_IDX_STREAM; i &lt; es-&gt;num_entries; i++) {</div><div class='ctx'> 		ep = exfat_get_dentry_cached(es, i);</div><div class='ctx'> 		if (!exfat_validate_entry(exfat_get_entry_type(ep), &amp;mode))</div><div class='del'>-			goto free_es;</div><div class='add'>+			goto put_es;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+put_es:</div><div class='add'>+	exfat_put_dentry_set(es, false);</div><div class='add'>+	return -EIO;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int exfat_validate_empty_dentry_set(struct exfat_entry_set_cache *es)</div><div class='add'>+{</div><div class='add'>+	struct exfat_dentry *ep;</div><div class='add'>+	struct buffer_head *bh;</div><div class='add'>+	int i, off;</div><div class='add'>+	bool unused_hit = false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * ONLY UNUSED OR DELETED DENTRIES ARE ALLOWED:</div><div class='add'>+	 * Although it violates the specification for a deleted entry to</div><div class='add'>+	 * follow an unused entry, some exFAT implementations could work</div><div class='add'>+	 * like this. Therefore, to improve compatibility, let's allow it.</div><div class='add'>+	 */</div><div class='add'>+	for (i = 0; i &lt; es-&gt;num_entries; i++) {</div><div class='add'>+		ep = exfat_get_dentry_cached(es, i);</div><div class='add'>+		if (ep-&gt;type == EXFAT_UNUSED) {</div><div class='add'>+			unused_hit = true;</div><div class='add'>+		} else if (!IS_EXFAT_DELETED(ep-&gt;type)) {</div><div class='add'>+			if (unused_hit)</div><div class='add'>+				goto err_used_follow_unused;</div><div class='add'>+			i++;</div><div class='add'>+			goto count_skip_entries;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='del'>-	return es;</div><div class='ctx'> </div><div class='del'>-free_es:</div><div class='del'>-	exfat_free_dentry_set(es, false);</div><div class='del'>-	return NULL;</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+err_used_follow_unused:</div><div class='add'>+	off = es-&gt;start_off + (i &lt;&lt; DENTRY_SIZE_BITS);</div><div class='add'>+	bh = es-&gt;bh[EXFAT_B_TO_BLK(off, es-&gt;sb)];</div><div class='add'>+</div><div class='add'>+	exfat_fs_error(es-&gt;sb,</div><div class='add'>+		"in sector %lld, dentry %d should be unused, but 0x%x",</div><div class='add'>+		bh-&gt;b_blocknr, off &gt;&gt; DENTRY_SIZE_BITS, ep-&gt;type);</div><div class='add'>+</div><div class='add'>+	return -EIO;</div><div class='add'>+</div><div class='add'>+count_skip_entries:</div><div class='add'>+	es-&gt;num_entries = EXFAT_B_TO_DEN(EXFAT_BLK_TO_B(es-&gt;num_bh, es-&gt;sb) - es-&gt;start_off);</div><div class='add'>+	for (; i &lt; es-&gt;num_entries; i++) {</div><div class='add'>+		ep = exfat_get_dentry_cached(es, i);</div><div class='add'>+		if (IS_EXFAT_DELETED(ep-&gt;type))</div><div class='add'>+			break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return i;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Get an empty dentry set.</div><div class='add'>+ *</div><div class='add'>+ * in:</div><div class='add'>+ *   sb+p_dir+entry: indicates the empty dentry location</div><div class='add'>+ *   num_entries: specifies how many empty dentries should be included.</div><div class='add'>+ * out:</div><div class='add'>+ *   es: pointer of empty dentry set on success.</div><div class='add'>+ * return:</div><div class='add'>+ *   0  : on success</div><div class='add'>+ *   &gt;0 : the dentries are not empty, the return value is the number of</div><div class='add'>+ *        dentries to be skipped for the next lookup.</div><div class='add'>+ *   &lt;0 : on failure</div><div class='add'>+ */</div><div class='add'>+int exfat_get_empty_dentry_set(struct exfat_entry_set_cache *es,</div><div class='add'>+		struct super_block *sb, struct exfat_chain *p_dir,</div><div class='add'>+		int entry, unsigned int num_entries)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = __exfat_get_dentry_set(es, sb, p_dir, entry, num_entries);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	ret = exfat_validate_empty_dentry_set(es);</div><div class='add'>+	if (ret)</div><div class='add'>+		exfat_put_dentry_set(es, false);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void exfat_reset_empty_hint(struct exfat_hint_femp *hint_femp)</div><div class='add'>+{</div><div class='add'>+	hint_femp-&gt;eidx = EXFAT_HINT_NONE;</div><div class='add'>+	hint_femp-&gt;count = 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void exfat_set_empty_hint(struct exfat_inode_info *ei,</div><div class='add'>+		struct exfat_hint_femp *candi_empty, struct exfat_chain *clu,</div><div class='add'>+		int dentry, int num_entries, int entry_type)</div><div class='add'>+{</div><div class='add'>+	if (ei-&gt;hint_femp.eidx == EXFAT_HINT_NONE ||</div><div class='add'>+	    ei-&gt;hint_femp.eidx &gt; dentry) {</div><div class='add'>+		int total_entries = EXFAT_B_TO_DEN(i_size_read(&amp;ei-&gt;vfs_inode));</div><div class='add'>+</div><div class='add'>+		if (candi_empty-&gt;count == 0) {</div><div class='add'>+			candi_empty-&gt;cur = *clu;</div><div class='add'>+			candi_empty-&gt;eidx = dentry;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (entry_type == TYPE_UNUSED)</div><div class='add'>+			candi_empty-&gt;count += total_entries - dentry;</div><div class='add'>+		else</div><div class='add'>+			candi_empty-&gt;count++;</div><div class='add'>+</div><div class='add'>+		if (candi_empty-&gt;count == num_entries ||</div><div class='add'>+		    candi_empty-&gt;count + candi_empty-&gt;eidx == total_entries)</div><div class='add'>+			ei-&gt;hint_femp = *candi_empty;</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> enum {</div><div class='hunk'>@@ -925,17 +989,22 @@ enum {</div><div class='ctx'>  */</div><div class='ctx'> int exfat_find_dir_entry(struct super_block *sb, struct exfat_inode_info *ei,</div><div class='ctx'> 		struct exfat_chain *p_dir, struct exfat_uni_name *p_uniname,</div><div class='del'>-		int num_entries, unsigned int type, struct exfat_hint *hint_opt)</div><div class='add'>+		struct exfat_hint *hint_opt)</div><div class='ctx'> {</div><div class='ctx'> 	int i, rewind = 0, dentry = 0, end_eidx = 0, num_ext = 0, len;</div><div class='ctx'> 	int order, step, name_len = 0;</div><div class='del'>-	int dentries_per_clu, num_empty = 0;</div><div class='add'>+	int dentries_per_clu;</div><div class='ctx'> 	unsigned int entry_type;</div><div class='ctx'> 	unsigned short *uniname = NULL;</div><div class='ctx'> 	struct exfat_chain clu;</div><div class='ctx'> 	struct exfat_hint *hint_stat = &amp;ei-&gt;hint_stat;</div><div class='ctx'> 	struct exfat_hint_femp candi_empty;</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='add'>+	int num_entries = exfat_calc_num_entries(p_uniname);</div><div class='add'>+	unsigned int clu_count = 0;</div><div class='add'>+</div><div class='add'>+	if (num_entries &lt; 0)</div><div class='add'>+		return num_entries;</div><div class='ctx'> </div><div class='ctx'> 	dentries_per_clu = sbi-&gt;dentries_per_clu;</div><div class='ctx'> </div><div class='hunk'>@@ -947,10 +1016,13 @@ int exfat_find_dir_entry(struct super_block *sb, struct exfat_inode_info *ei,</div><div class='ctx'> 		end_eidx = dentry;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	candi_empty.eidx = EXFAT_HINT_NONE;</div><div class='add'>+	exfat_reset_empty_hint(&amp;ei-&gt;hint_femp);</div><div class='add'>+</div><div class='ctx'> rewind:</div><div class='ctx'> 	order = 0;</div><div class='ctx'> 	step = DIRENT_STEP_FILE;</div><div class='add'>+	exfat_reset_empty_hint(&amp;candi_empty);</div><div class='add'>+</div><div class='ctx'> 	while (clu.dir != EXFAT_EOF_CLUSTER) {</div><div class='ctx'> 		i = dentry &amp; (dentries_per_clu - 1);</div><div class='ctx'> 		for (; i &lt; dentries_per_clu; i++, dentry++) {</div><div class='hunk'>@@ -960,7 +1032,7 @@ rewind:</div><div class='ctx'> 			if (rewind &amp;&amp; dentry == end_eidx)</div><div class='ctx'> 				goto not_found;</div><div class='ctx'> </div><div class='del'>-			ep = exfat_get_dentry(sb, &amp;clu, i, &amp;bh, NULL);</div><div class='add'>+			ep = exfat_get_dentry(sb, &amp;clu, i, &amp;bh);</div><div class='ctx'> 			if (!ep)</div><div class='ctx'> 				return -EIO;</div><div class='ctx'> </div><div class='hunk'>@@ -970,26 +1042,9 @@ rewind:</div><div class='ctx'> 			    entry_type == TYPE_DELETED) {</div><div class='ctx'> 				step = DIRENT_STEP_FILE;</div><div class='ctx'> </div><div class='del'>-				num_empty++;</div><div class='del'>-				if (candi_empty.eidx == EXFAT_HINT_NONE &amp;&amp;</div><div class='del'>-						num_empty == 1) {</div><div class='del'>-					exfat_chain_set(&amp;candi_empty.cur,</div><div class='del'>-						clu.dir, clu.size, clu.flags);</div><div class='del'>-				}</div><div class='del'>-</div><div class='del'>-				if (candi_empty.eidx == EXFAT_HINT_NONE &amp;&amp;</div><div class='del'>-						num_empty &gt;= num_entries) {</div><div class='del'>-					candi_empty.eidx =</div><div class='del'>-						dentry - (num_empty - 1);</div><div class='del'>-					WARN_ON(candi_empty.eidx &lt; 0);</div><div class='del'>-					candi_empty.count = num_empty;</div><div class='del'>-</div><div class='del'>-					if (ei-&gt;hint_femp.eidx ==</div><div class='del'>-							EXFAT_HINT_NONE ||</div><div class='del'>-						candi_empty.eidx &lt;=</div><div class='del'>-							 ei-&gt;hint_femp.eidx)</div><div class='del'>-						ei-&gt;hint_femp = candi_empty;</div><div class='del'>-				}</div><div class='add'>+				exfat_set_empty_hint(ei, &amp;candi_empty, &amp;clu,</div><div class='add'>+						dentry, num_entries,</div><div class='add'>+						entry_type);</div><div class='ctx'> </div><div class='ctx'> 				brelse(bh);</div><div class='ctx'> 				if (entry_type == TYPE_UNUSED)</div><div class='hunk'>@@ -997,17 +1052,14 @@ rewind:</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			num_empty = 0;</div><div class='del'>-			candi_empty.eidx = EXFAT_HINT_NONE;</div><div class='add'>+			exfat_reset_empty_hint(&amp;candi_empty);</div><div class='ctx'> </div><div class='ctx'> 			if (entry_type == TYPE_FILE || entry_type == TYPE_DIR) {</div><div class='ctx'> 				step = DIRENT_STEP_FILE;</div><div class='ctx'> 				hint_opt-&gt;clu = clu.dir;</div><div class='ctx'> 				hint_opt-&gt;eidx = i;</div><div class='del'>-				if (type == TYPE_ALL || type == entry_type) {</div><div class='del'>-					num_ext = ep-&gt;dentry.file.num_ext;</div><div class='del'>-					step = DIRENT_STEP_STRM;</div><div class='del'>-				}</div><div class='add'>+				num_ext = ep-&gt;dentry.file.num_ext;</div><div class='add'>+				step = DIRENT_STEP_STRM;</div><div class='ctx'> 				brelse(bh);</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -1038,7 +1090,8 @@ rewind:</div><div class='ctx'> 			if (entry_type == TYPE_EXTEND) {</div><div class='ctx'> 				unsigned short entry_uniname[16], unichar;</div><div class='ctx'> </div><div class='del'>-				if (step != DIRENT_STEP_NAME) {</div><div class='add'>+				if (step != DIRENT_STEP_NAME ||</div><div class='add'>+				    name_len &gt;= MAX_NAME_LENGTH) {</div><div class='ctx'> 					step = DIRENT_STEP_FILE;</div><div class='ctx'> 					continue;</div><div class='ctx'> 				}</div><div class='hunk'>@@ -1086,6 +1139,10 @@ rewind:</div><div class='ctx'> 		} else {</div><div class='ctx'> 			if (exfat_get_next_cluster(sb, &amp;clu.dir))</div><div class='ctx'> 				return -EIO;</div><div class='add'>+</div><div class='add'>+			/* break if the cluster chain includes a loop */</div><div class='add'>+			if (unlikely(++clu_count &gt; EXFAT_DATA_CLUSTER_COUNT(sbi)))</div><div class='add'>+				goto not_found;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1098,12 +1155,19 @@ not_found:</div><div class='ctx'> 		rewind = 1;</div><div class='ctx'> 		dentry = 0;</div><div class='ctx'> 		clu.dir = p_dir-&gt;dir;</div><div class='del'>-		/* reset empty hint */</div><div class='del'>-		num_empty = 0;</div><div class='del'>-		candi_empty.eidx = EXFAT_HINT_NONE;</div><div class='ctx'> 		goto rewind;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * set the EXFAT_EOF_CLUSTER flag to avoid search</div><div class='add'>+	 * from the beginning again when allocated a new cluster</div><div class='add'>+	 */</div><div class='add'>+	if (ei-&gt;hint_femp.eidx == EXFAT_HINT_NONE) {</div><div class='add'>+		ei-&gt;hint_femp.cur.dir = EXFAT_EOF_CLUSTER;</div><div class='add'>+		ei-&gt;hint_femp.eidx = p_dir-&gt;size * dentries_per_clu;</div><div class='add'>+		ei-&gt;hint_femp.count = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/* initialized hint_stat */</div><div class='ctx'> 	hint_stat-&gt;clu = p_dir-&gt;dir;</div><div class='ctx'> 	hint_stat-&gt;eidx = 0;</div><div class='hunk'>@@ -1136,34 +1200,12 @@ found:</div><div class='ctx'> 	return dentry - num_ext;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int exfat_count_ext_entries(struct super_block *sb, struct exfat_chain *p_dir,</div><div class='del'>-		int entry, struct exfat_dentry *ep)</div><div class='del'>-{</div><div class='del'>-	int i, count = 0;</div><div class='del'>-	unsigned int type;</div><div class='del'>-	struct exfat_dentry *ext_ep;</div><div class='del'>-	struct buffer_head *bh;</div><div class='del'>-</div><div class='del'>-	for (i = 0, entry++; i &lt; ep-&gt;dentry.file.num_ext; i++, entry++) {</div><div class='del'>-		ext_ep = exfat_get_dentry(sb, p_dir, entry, &amp;bh, NULL);</div><div class='del'>-		if (!ext_ep)</div><div class='del'>-			return -EIO;</div><div class='del'>-</div><div class='del'>-		type = exfat_get_entry_type(ext_ep);</div><div class='del'>-		brelse(bh);</div><div class='del'>-		if (type == TYPE_EXTEND || type == TYPE_STREAM)</div><div class='del'>-			count++;</div><div class='del'>-		else</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-	return count;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> int exfat_count_dir_entries(struct super_block *sb, struct exfat_chain *p_dir)</div><div class='ctx'> {</div><div class='ctx'> 	int i, count = 0;</div><div class='ctx'> 	int dentries_per_clu;</div><div class='ctx'> 	unsigned int entry_type;</div><div class='add'>+	unsigned int clu_count = 0;</div><div class='ctx'> 	struct exfat_chain clu;</div><div class='ctx'> 	struct exfat_dentry *ep;</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='hunk'>@@ -1175,7 +1217,7 @@ int exfat_count_dir_entries(struct super_block *sb, struct exfat_chain *p_dir)</div><div class='ctx'> </div><div class='ctx'> 	while (clu.dir != EXFAT_EOF_CLUSTER) {</div><div class='ctx'> 		for (i = 0; i &lt; dentries_per_clu; i++) {</div><div class='del'>-			ep = exfat_get_dentry(sb, &amp;clu, i, &amp;bh, NULL);</div><div class='add'>+			ep = exfat_get_dentry(sb, &amp;clu, i, &amp;bh);</div><div class='ctx'> 			if (!ep)</div><div class='ctx'> 				return -EIO;</div><div class='ctx'> 			entry_type = exfat_get_entry_type(ep);</div><div class='hunk'>@@ -1196,8 +1238,174 @@ int exfat_count_dir_entries(struct super_block *sb, struct exfat_chain *p_dir)</div><div class='ctx'> 		} else {</div><div class='ctx'> 			if (exfat_get_next_cluster(sb, &amp;(clu.dir)))</div><div class='ctx'> 				return -EIO;</div><div class='add'>+</div><div class='add'>+			if (unlikely(++clu_count &gt; sbi-&gt;used_clusters)) {</div><div class='add'>+				exfat_fs_error(sb, "FAT or bitmap is corrupted");</div><div class='add'>+				return -EIO;</div><div class='add'>+			}</div><div class='add'>+</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return count;</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+static int exfat_get_volume_label_dentry(struct super_block *sb,</div><div class='add'>+		struct exfat_entry_set_cache *es)</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='add'>+	int dentry = 0;</div><div class='add'>+	unsigned int type;</div><div class='add'>+	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='add'>+	struct exfat_hint_femp hint_femp;</div><div class='add'>+	struct exfat_inode_info *ei = EXFAT_I(sb-&gt;s_root-&gt;d_inode);</div><div class='add'>+	struct exfat_chain clu;</div><div class='add'>+	struct exfat_dentry *ep;</div><div class='add'>+	struct buffer_head *bh;</div><div class='add'>+</div><div class='add'>+	hint_femp.eidx = EXFAT_HINT_NONE;</div><div class='add'>+	exfat_chain_set(&amp;clu, sbi-&gt;root_dir, 0, ALLOC_FAT_CHAIN);</div><div class='add'>+</div><div class='add'>+	while (clu.dir != EXFAT_EOF_CLUSTER) {</div><div class='add'>+		for (i = 0; i &lt; sbi-&gt;dentries_per_clu; i++, dentry++) {</div><div class='add'>+			ep = exfat_get_dentry(sb, &amp;clu, i, &amp;bh);</div><div class='add'>+			if (!ep)</div><div class='add'>+				return -EIO;</div><div class='add'>+</div><div class='add'>+			type = exfat_get_entry_type(ep);</div><div class='add'>+			if (hint_femp.eidx == EXFAT_HINT_NONE) {</div><div class='add'>+				if (type == TYPE_DELETED || type == TYPE_UNUSED) {</div><div class='add'>+					hint_femp.cur = clu;</div><div class='add'>+					hint_femp.eidx = dentry;</div><div class='add'>+					hint_femp.count = 1;</div><div class='add'>+				}</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			if (type == TYPE_UNUSED) {</div><div class='add'>+				brelse(bh);</div><div class='add'>+				goto not_found;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			if (type != TYPE_VOLUME) {</div><div class='add'>+				brelse(bh);</div><div class='add'>+				continue;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			memset(es, 0, sizeof(*es));</div><div class='add'>+			es-&gt;sb = sb;</div><div class='add'>+			es-&gt;bh = es-&gt;__bh;</div><div class='add'>+			es-&gt;bh[0] = bh;</div><div class='add'>+			es-&gt;num_bh = 1;</div><div class='add'>+			es-&gt;start_off = EXFAT_DEN_TO_B(i) % sb-&gt;s_blocksize;</div><div class='add'>+</div><div class='add'>+			return 0;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (exfat_get_next_cluster(sb, &amp;(clu.dir)))</div><div class='add'>+			return -EIO;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+not_found:</div><div class='add'>+	if (hint_femp.eidx == EXFAT_HINT_NONE) {</div><div class='add'>+		hint_femp.cur.dir = EXFAT_EOF_CLUSTER;</div><div class='add'>+		hint_femp.eidx = dentry;</div><div class='add'>+		hint_femp.count = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ei-&gt;hint_femp = hint_femp;</div><div class='add'>+</div><div class='add'>+	return -ENOENT;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int exfat_read_volume_label(struct super_block *sb, struct exfat_uni_name *label_out)</div><div class='add'>+{</div><div class='add'>+	int ret, i;</div><div class='add'>+	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='add'>+	struct exfat_entry_set_cache es;</div><div class='add'>+	struct exfat_dentry *ep;</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;sbi-&gt;s_lock);</div><div class='add'>+</div><div class='add'>+	memset(label_out, 0, sizeof(*label_out));</div><div class='add'>+	ret = exfat_get_volume_label_dentry(sb, &amp;es);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		/*</div><div class='add'>+		 * ENOENT signifies that a volume label dentry doesn't exist</div><div class='add'>+		 * We will treat this as an empty volume label and not fail.</div><div class='add'>+		 */</div><div class='add'>+		if (ret == -ENOENT)</div><div class='add'>+			ret = 0;</div><div class='add'>+</div><div class='add'>+		goto unlock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ep = exfat_get_dentry_cached(&amp;es, 0);</div><div class='add'>+	label_out-&gt;name_len = ep-&gt;dentry.volume_label.char_count;</div><div class='add'>+	if (label_out-&gt;name_len &gt; EXFAT_VOLUME_LABEL_LEN) {</div><div class='add'>+		ret = -EIO;</div><div class='add'>+		exfat_put_dentry_set(&amp;es, false);</div><div class='add'>+		goto unlock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; label_out-&gt;name_len; i++)</div><div class='add'>+		label_out-&gt;name[i] = le16_to_cpu(ep-&gt;dentry.volume_label.volume_label[i]);</div><div class='add'>+</div><div class='add'>+	exfat_put_dentry_set(&amp;es, false);</div><div class='add'>+unlock:</div><div class='add'>+	mutex_unlock(&amp;sbi-&gt;s_lock);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int exfat_write_volume_label(struct super_block *sb,</div><div class='add'>+			     struct exfat_uni_name *label)</div><div class='add'>+{</div><div class='add'>+	int ret, i;</div><div class='add'>+	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='add'>+	struct inode *root_inode = sb-&gt;s_root-&gt;d_inode;</div><div class='add'>+	struct exfat_entry_set_cache es;</div><div class='add'>+	struct exfat_chain clu;</div><div class='add'>+	struct exfat_dentry *ep;</div><div class='add'>+</div><div class='add'>+	if (label-&gt;name_len &gt; EXFAT_VOLUME_LABEL_LEN)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;sbi-&gt;s_lock);</div><div class='add'>+</div><div class='add'>+	ret = exfat_get_volume_label_dentry(sb, &amp;es);</div><div class='add'>+	if (ret == -ENOENT) {</div><div class='add'>+		if (label-&gt;name_len == 0) {</div><div class='add'>+			/* No volume label dentry, no need to clear */</div><div class='add'>+			ret = 0;</div><div class='add'>+			goto unlock;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		ret = exfat_find_empty_entry(root_inode, &amp;clu, 1, &amp;es);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto unlock;</div><div class='add'>+</div><div class='add'>+	ep = exfat_get_dentry_cached(&amp;es, 0);</div><div class='add'>+</div><div class='add'>+	if (label-&gt;name_len == 0 &amp;&amp; ep-&gt;dentry.volume_label.char_count == 0) {</div><div class='add'>+		/* volume label had been cleared */</div><div class='add'>+		exfat_put_dentry_set(&amp;es, 0);</div><div class='add'>+		goto unlock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	memset(ep, 0, sizeof(*ep));</div><div class='add'>+	ep-&gt;type = EXFAT_VOLUME;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; label-&gt;name_len; i++)</div><div class='add'>+		ep-&gt;dentry.volume_label.volume_label[i] =</div><div class='add'>+			cpu_to_le16(label-&gt;name[i]);</div><div class='add'>+</div><div class='add'>+	ep-&gt;dentry.volume_label.char_count = label-&gt;name_len;</div><div class='add'>+	es.modified = true;</div><div class='add'>+</div><div class='add'>+	ret = exfat_put_dentry_set(&amp;es, IS_DIRSYNC(root_inode));</div><div class='add'>+</div><div class='add'>+unlock:</div><div class='add'>+	mutex_unlock(&amp;sbi-&gt;s_lock);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/exfat/exfat_fs.h b/fs/exfat/exfat_fs.h<br/>index 1d6da61157c9..176fef62574c 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/exfat/exfat_fs.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exfat/exfat_fs.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/exfat/exfat_fs.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/exfat/exfat_fs.h</a></div><div class='hunk'>@@ -9,12 +9,11 @@</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/ratelimit.h&gt;</div><div class='ctx'> #include &lt;linux/nls.h&gt;</div><div class='add'>+#include &lt;linux/blkdev.h&gt;</div><div class='add'>+#include &lt;uapi/linux/exfat.h&gt;</div><div class='ctx'> </div><div class='del'>-#define EXFAT_SUPER_MAGIC       0x2011BAB0UL</div><div class='ctx'> #define EXFAT_ROOT_INO		1</div><div class='ctx'> </div><div class='del'>-#define EXFAT_CLUSTERS_UNTRACKED (~0u)</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * exfat error flags</div><div class='ctx'>  */</div><div class='hunk'>@@ -28,9 +27,8 @@ enum exfat_error_mode {</div><div class='ctx'>  * exfat nls lossy flag</div><div class='ctx'>  */</div><div class='ctx'> enum {</div><div class='del'>-	NLS_NAME_NO_LOSSY,	/* no lossy */</div><div class='del'>-	NLS_NAME_LOSSY,		/* just detected incorrect filename(s) */</div><div class='del'>-	NLS_NAME_OVERLEN,	/* the length is over than its limit */</div><div class='add'>+	NLS_NAME_NO_LOSSY =	0,	/* no lossy */</div><div class='add'>+	NLS_NAME_LOSSY =	1 &lt;&lt; 0,	/* just detected incorrect filename(s) */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> #define EXFAT_HASH_BITS		8</div><div class='hunk'>@@ -42,7 +40,15 @@ enum {</div><div class='ctx'> #define ES_2_ENTRIES		2</div><div class='ctx'> #define ES_ALL_ENTRIES		0</div><div class='ctx'> </div><div class='del'>-#define DIR_DELETED		0xFFFF0321</div><div class='add'>+#define ES_IDX_FILE		0</div><div class='add'>+#define ES_IDX_STREAM		1</div><div class='add'>+#define ES_IDX_FIRST_FILENAME	2</div><div class='add'>+#define EXFAT_FILENAME_ENTRY_NUM(name_len) \</div><div class='add'>+	DIV_ROUND_UP(name_len, EXFAT_FILE_NAME_LEN)</div><div class='add'>+#define ES_IDX_LAST_FILENAME(name_len)	\</div><div class='add'>+	(ES_IDX_FIRST_FILENAME + EXFAT_FILENAME_ENTRY_NUM(name_len) - 1)</div><div class='add'>+</div><div class='add'>+#define DIR_DELETED		0xFFFFFFF7</div><div class='ctx'> </div><div class='ctx'> /* type values */</div><div class='ctx'> #define TYPE_UNUSED		0x0000</div><div class='hunk'>@@ -63,15 +69,13 @@ enum {</div><div class='ctx'> #define TYPE_PADDING		0x0402</div><div class='ctx'> #define TYPE_ACLTAB		0x0403</div><div class='ctx'> #define TYPE_BENIGN_SEC		0x0800</div><div class='del'>-#define TYPE_ALL		0x0FFF</div><div class='add'>+#define TYPE_VENDOR_EXT		0x0801</div><div class='add'>+#define TYPE_VENDOR_ALLOC	0x0802</div><div class='ctx'> </div><div class='ctx'> #define MAX_CHARSET_SIZE	6 /* max size of multi-byte character */</div><div class='ctx'> #define MAX_NAME_LENGTH		255 /* max len of file name excluding NULL */</div><div class='ctx'> #define MAX_VFSNAME_BUF_SIZE	((MAX_NAME_LENGTH + 1) * MAX_CHARSET_SIZE)</div><div class='ctx'> </div><div class='del'>-/* Enough size to hold 256 dentry (even 512 Byte sector) */</div><div class='del'>-#define DIR_CACHE_SIZE		(256*sizeof(struct exfat_dentry)/512+1)</div><div class='del'>-</div><div class='ctx'> #define EXFAT_HINT_NONE		-1</div><div class='ctx'> #define EXFAT_MIN_SUBDIR	2</div><div class='ctx'> </div><div class='hunk'>@@ -96,12 +100,18 @@ enum {</div><div class='ctx'> /*</div><div class='ctx'>  * helpers for block size to dentry size conversion.</div><div class='ctx'>  */</div><div class='del'>-#define EXFAT_B_TO_DEN_IDX(b, sbi)	\</div><div class='del'>-	((b) &lt;&lt; ((sbi)-&gt;cluster_size_bits - DENTRY_SIZE_BITS))</div><div class='ctx'> #define EXFAT_B_TO_DEN(b)		((b) &gt;&gt; DENTRY_SIZE_BITS)</div><div class='ctx'> #define EXFAT_DEN_TO_B(b)		((b) &lt;&lt; DENTRY_SIZE_BITS)</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * helpers for cluster size to dentry size conversion.</div><div class='add'>+ */</div><div class='add'>+#define EXFAT_CLU_TO_DEN(clu, sbi)	\</div><div class='add'>+	((clu) &lt;&lt; ((sbi)-&gt;cluster_size_bits - DENTRY_SIZE_BITS))</div><div class='add'>+#define EXFAT_DEN_TO_CLU(dentry, sbi)	\</div><div class='add'>+	((dentry) &gt;&gt; ((sbi)-&gt;cluster_size_bits - DENTRY_SIZE_BITS))</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * helpers for fat entry.</div><div class='ctx'>  */</div><div class='ctx'> #define FAT_ENT_SIZE (4)</div><div class='hunk'>@@ -123,8 +133,21 @@ enum {</div><div class='ctx'> #define BITMAP_OFFSET_BIT_IN_SECTOR(sb, ent) (ent &amp; BITS_PER_SECTOR_MASK(sb))</div><div class='ctx'> #define BITMAP_OFFSET_BYTE_IN_SECTOR(sb, ent) \</div><div class='ctx'> 	((ent / BITS_PER_BYTE) &amp; ((sb)-&gt;s_blocksize - 1))</div><div class='del'>-#define BITS_PER_BYTE_MASK	0x7</div><div class='del'>-#define IGNORED_BITS_REMAINED(clu, clu_base) ((1 &lt;&lt; ((clu) - (clu_base))) - 1)</div><div class='add'>+#define IGNORED_BITS_REMAINED(clu, clu_base) ((1UL &lt;&lt; ((clu) - (clu_base))) - 1)</div><div class='add'>+</div><div class='add'>+#define ES_ENTRY_NUM(name_len)	(ES_IDX_LAST_FILENAME(name_len) + 1)</div><div class='add'>+/* 19 entries = 1 file entry + 1 stream entry + 17 filename entries */</div><div class='add'>+#define ES_MAX_ENTRY_NUM	ES_ENTRY_NUM(MAX_NAME_LENGTH)</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * 19 entries x 32 bytes/entry = 608 bytes.</div><div class='add'>+ * The 608 bytes are in 3 sectors at most (even 512 Byte sector).</div><div class='add'>+ */</div><div class='add'>+#define DIR_CACHE_SIZE		\</div><div class='add'>+	(DIV_ROUND_UP(EXFAT_DEN_TO_B(ES_MAX_ENTRY_NUM), SECTOR_SIZE) + 1)</div><div class='add'>+</div><div class='add'>+/* Superblock flags */</div><div class='add'>+#define EXFAT_FLAGS_SHUTDOWN	1</div><div class='ctx'> </div><div class='ctx'> struct exfat_dentry_namebuf {</div><div class='ctx'> 	char *lfn;</div><div class='hunk'>@@ -167,21 +190,27 @@ struct exfat_hint {</div><div class='ctx'> </div><div class='ctx'> struct exfat_entry_set_cache {</div><div class='ctx'> 	struct super_block *sb;</div><div class='del'>-	bool modified;</div><div class='ctx'> 	unsigned int start_off;</div><div class='ctx'> 	int num_bh;</div><div class='del'>-	struct buffer_head *bh[DIR_CACHE_SIZE];</div><div class='add'>+	struct buffer_head *__bh[DIR_CACHE_SIZE];</div><div class='add'>+	struct buffer_head **bh;</div><div class='ctx'> 	unsigned int num_entries;</div><div class='add'>+	bool modified;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+#define IS_DYNAMIC_ES(es)	((es)-&gt;__bh != (es)-&gt;bh)</div><div class='add'>+</div><div class='ctx'> struct exfat_dir_entry {</div><div class='add'>+	/* the cluster where file dentry is located */</div><div class='ctx'> 	struct exfat_chain dir;</div><div class='add'>+	/* the index of file dentry in -&gt;dir */</div><div class='ctx'> 	int entry;</div><div class='ctx'> 	unsigned int type;</div><div class='ctx'> 	unsigned int start_clu;</div><div class='ctx'> 	unsigned char flags;</div><div class='ctx'> 	unsigned short attr;</div><div class='ctx'> 	loff_t size;</div><div class='add'>+	loff_t valid_size;</div><div class='ctx'> 	unsigned int num_subdirs;</div><div class='ctx'> 	struct timespec64 atime;</div><div class='ctx'> 	struct timespec64 mtime;</div><div class='hunk'>@@ -204,8 +233,12 @@ struct exfat_mount_options {</div><div class='ctx'> 	/* on error: continue, panic, remount-ro */</div><div class='ctx'> 	enum exfat_error_mode errors;</div><div class='ctx'> 	unsigned utf8:1, /* Use of UTF-8 character set */</div><div class='del'>-		 discard:1; /* Issue discard requests on deletions */</div><div class='add'>+		 sys_tz:1, /* Use local timezone */</div><div class='add'>+		 discard:1, /* Issue discard requests on deletions */</div><div class='add'>+		 keep_last_dots:1; /* Keep trailing periods in paths */</div><div class='ctx'> 	int time_offset; /* Offset of timestamps from UTC (in minutes) */</div><div class='add'>+	/* Support creating zero-size directory, default: false */</div><div class='add'>+	bool zero_size_dir;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -237,6 +270,8 @@ struct exfat_sb_info {</div><div class='ctx'> 	unsigned int clu_srch_ptr; /* cluster search pointer */</div><div class='ctx'> 	unsigned int used_clusters; /* number of used clusters */</div><div class='ctx'> </div><div class='add'>+	unsigned long s_exfat_flags; /* Exfat superblock flags */</div><div class='add'>+</div><div class='ctx'> 	struct mutex s_lock; /* superblock lock */</div><div class='ctx'> 	struct mutex bitmap_lock; /* bitmap lock */</div><div class='ctx'> 	struct exfat_mount_options options;</div><div class='hunk'>@@ -245,7 +280,6 @@ struct exfat_sb_info {</div><div class='ctx'> </div><div class='ctx'> 	spinlock_t inode_hash_lock;</div><div class='ctx'> 	struct hlist_head inode_hashtable[EXFAT_HASH_SIZE];</div><div class='del'>-</div><div class='ctx'> 	struct rcu_head rcu;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -255,7 +289,9 @@ struct exfat_sb_info {</div><div class='ctx'>  * EXFAT file system inode in-memory data</div><div class='ctx'>  */</div><div class='ctx'> struct exfat_inode_info {</div><div class='add'>+	/* the cluster where file dentry is located */</div><div class='ctx'> 	struct exfat_chain dir;</div><div class='add'>+	/* the index of file dentry in -&gt;dir */</div><div class='ctx'> 	int entry;</div><div class='ctx'> 	unsigned int type;</div><div class='ctx'> 	unsigned short attr;</div><div class='hunk'>@@ -280,15 +316,9 @@ struct exfat_inode_info {</div><div class='ctx'> 	/* for avoiding the race between alloc and free */</div><div class='ctx'> 	unsigned int cache_valid_id;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * NOTE: i_size_ondisk is 64bits, so must hold -&gt;inode_lock to access.</div><div class='del'>-	 * physically allocated size.</div><div class='del'>-	 */</div><div class='del'>-	loff_t i_size_ondisk;</div><div class='del'>-	/* block-aligned i_size (used in cont_write_begin) */</div><div class='del'>-	loff_t i_size_aligned;</div><div class='ctx'> 	/* on-disk position of directory entry or 0 */</div><div class='ctx'> 	loff_t i_pos;</div><div class='add'>+	loff_t valid_size;</div><div class='ctx'> 	/* hash by i_location */</div><div class='ctx'> 	struct hlist_node i_hash_fat;</div><div class='ctx'> 	/* protect bmap against truncate */</div><div class='hunk'>@@ -308,6 +338,11 @@ static inline struct exfat_inode_info *EXFAT_I(struct inode *inode)</div><div class='ctx'> 	return container_of(inode, struct exfat_inode_info, vfs_inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline int exfat_forced_shutdown(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	return test_bit(EXFAT_FLAGS_SHUTDOWN, &amp;EXFAT_SB(sb)-&gt;s_exfat_flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * If -&gt;i_mode can't hold 0222 (i.e. ATTR_RO), we use -&gt;i_attrs to</div><div class='ctx'>  * save ATTR_RO instead of -&gt;i_mode.</div><div class='hunk'>@@ -331,10 +366,10 @@ static inline int exfat_mode_can_hold_ro(struct inode *inode)</div><div class='ctx'> static inline mode_t exfat_make_mode(struct exfat_sb_info *sbi,</div><div class='ctx'> 		unsigned short attr, mode_t mode)</div><div class='ctx'> {</div><div class='del'>-	if ((attr &amp; ATTR_READONLY) &amp;&amp; !(attr &amp; ATTR_SUBDIR))</div><div class='add'>+	if ((attr &amp; EXFAT_ATTR_READONLY) &amp;&amp; !(attr &amp; EXFAT_ATTR_SUBDIR))</div><div class='ctx'> 		mode &amp;= ~0222;</div><div class='ctx'> </div><div class='del'>-	if (attr &amp; ATTR_SUBDIR)</div><div class='add'>+	if (attr &amp; EXFAT_ATTR_SUBDIR)</div><div class='ctx'> 		return (mode &amp; ~sbi-&gt;options.fs_dmask) | S_IFDIR;</div><div class='ctx'> </div><div class='ctx'> 	return (mode &amp; ~sbi-&gt;options.fs_fmask) | S_IFREG;</div><div class='hunk'>@@ -346,18 +381,18 @@ static inline unsigned short exfat_make_attr(struct inode *inode)</div><div class='ctx'> 	unsigned short attr = EXFAT_I(inode)-&gt;attr;</div><div class='ctx'> </div><div class='ctx'> 	if (S_ISDIR(inode-&gt;i_mode))</div><div class='del'>-		attr |= ATTR_SUBDIR;</div><div class='add'>+		attr |= EXFAT_ATTR_SUBDIR;</div><div class='ctx'> 	if (exfat_mode_can_hold_ro(inode) &amp;&amp; !(inode-&gt;i_mode &amp; 0222))</div><div class='del'>-		attr |= ATTR_READONLY;</div><div class='add'>+		attr |= EXFAT_ATTR_READONLY;</div><div class='ctx'> 	return attr;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void exfat_save_attr(struct inode *inode, unsigned short attr)</div><div class='ctx'> {</div><div class='ctx'> 	if (exfat_mode_can_hold_ro(inode))</div><div class='del'>-		EXFAT_I(inode)-&gt;attr = attr &amp; (ATTR_RWMASK | ATTR_READONLY);</div><div class='add'>+		EXFAT_I(inode)-&gt;attr = attr &amp; (EXFAT_ATTR_RWMASK | EXFAT_ATTR_READONLY);</div><div class='ctx'> 	else</div><div class='del'>-		EXFAT_I(inode)-&gt;attr = attr &amp; ATTR_RWMASK;</div><div class='add'>+		EXFAT_I(inode)-&gt;attr = attr &amp; EXFAT_ATTR_RWMASK;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline bool exfat_is_last_sector_in_cluster(struct exfat_sb_info *sbi,</div><div class='hunk'>@@ -374,13 +409,24 @@ static inline sector_t exfat_cluster_to_sector(struct exfat_sb_info *sbi,</div><div class='ctx'> 		sbi-&gt;data_start_sector;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int exfat_sector_to_cluster(struct exfat_sb_info *sbi,</div><div class='add'>+static inline unsigned int exfat_sector_to_cluster(struct exfat_sb_info *sbi,</div><div class='ctx'> 		sector_t sec)</div><div class='ctx'> {</div><div class='ctx'> 	return ((sec - sbi-&gt;data_start_sector) &gt;&gt; sbi-&gt;sect_per_clus_bits) +</div><div class='ctx'> 		EXFAT_RESERVED_CLUSTERS;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline bool is_valid_cluster(struct exfat_sb_info *sbi,</div><div class='add'>+		unsigned int clus)</div><div class='add'>+{</div><div class='add'>+	return clus &gt;= EXFAT_FIRST_CLUSTER &amp;&amp; clus &lt; sbi-&gt;num_clusters;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline loff_t exfat_ondisk_size(const struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	return ((loff_t)inode-&gt;i_blocks) &lt;&lt; 9;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /* super.c */</div><div class='ctx'> int exfat_set_volume_dirty(struct super_block *sb);</div><div class='ctx'> int exfat_clear_volume_dirty(struct super_block *sb);</div><div class='hunk'>@@ -395,8 +441,6 @@ int exfat_ent_get(struct super_block *sb, unsigned int loc,</div><div class='ctx'> 		unsigned int *content);</div><div class='ctx'> int exfat_ent_set(struct super_block *sb, unsigned int loc,</div><div class='ctx'> 		unsigned int content);</div><div class='del'>-int exfat_count_ext_entries(struct super_block *sb, struct exfat_chain *p_dir,</div><div class='del'>-		int entry, struct exfat_dentry *p_entry);</div><div class='ctx'> int exfat_chain_cont_cluster(struct super_block *sb, unsigned int chain,</div><div class='ctx'> 		unsigned int len);</div><div class='ctx'> int exfat_zeroed_cluster(struct inode *dir, unsigned int clu);</div><div class='hunk'>@@ -408,29 +452,34 @@ int exfat_count_num_clusters(struct super_block *sb,</div><div class='ctx'> /* balloc.c */</div><div class='ctx'> int exfat_load_bitmap(struct super_block *sb);</div><div class='ctx'> void exfat_free_bitmap(struct exfat_sb_info *sbi);</div><div class='del'>-int exfat_set_bitmap(struct inode *inode, unsigned int clu, bool sync);</div><div class='del'>-void exfat_clear_bitmap(struct inode *inode, unsigned int clu, bool sync);</div><div class='add'>+int exfat_set_bitmap(struct super_block *sb, unsigned int clu, bool sync);</div><div class='add'>+int exfat_clear_bitmap(struct super_block *sb, unsigned int clu, bool sync);</div><div class='add'>+bool exfat_test_bitmap(struct super_block *sb, unsigned int clu);</div><div class='ctx'> unsigned int exfat_find_free_bitmap(struct super_block *sb, unsigned int clu);</div><div class='ctx'> int exfat_count_used_clusters(struct super_block *sb, unsigned int *ret_count);</div><div class='ctx'> int exfat_trim_fs(struct inode *inode, struct fstrim_range *range);</div><div class='ctx'> </div><div class='ctx'> /* file.c */</div><div class='ctx'> extern const struct file_operations exfat_file_operations;</div><div class='del'>-int __exfat_truncate(struct inode *inode, loff_t new_size);</div><div class='del'>-void exfat_truncate(struct inode *inode, loff_t size);</div><div class='del'>-int exfat_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='add'>+int __exfat_truncate(struct inode *inode);</div><div class='add'>+void exfat_truncate(struct inode *inode);</div><div class='add'>+int exfat_setattr(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		  struct iattr *attr);</div><div class='del'>-int exfat_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='add'>+int exfat_getattr(struct mnt_idmap *idmap, const struct path *path,</div><div class='ctx'> 		  struct kstat *stat, unsigned int request_mask,</div><div class='ctx'> 		  unsigned int query_flags);</div><div class='ctx'> int exfat_file_fsync(struct file *file, loff_t start, loff_t end, int datasync);</div><div class='ctx'> long exfat_ioctl(struct file *filp, unsigned int cmd, unsigned long arg);</div><div class='ctx'> long exfat_compat_ioctl(struct file *filp, unsigned int cmd,</div><div class='ctx'> 				unsigned long arg);</div><div class='add'>+int exfat_force_shutdown(struct super_block *sb, u32 flags);</div><div class='ctx'> </div><div class='ctx'> /* namei.c */</div><div class='ctx'> extern const struct dentry_operations exfat_dentry_ops;</div><div class='ctx'> extern const struct dentry_operations exfat_utf8_dentry_ops;</div><div class='add'>+int exfat_find_empty_entry(struct inode *inode,</div><div class='add'>+		struct exfat_chain *p_dir, int num_entries,</div><div class='add'>+			   struct exfat_entry_set_cache *es);</div><div class='ctx'> </div><div class='ctx'> /* cache.c */</div><div class='ctx'> int exfat_cache_init(void);</div><div class='hunk'>@@ -444,32 +493,37 @@ int exfat_get_cluster(struct inode *inode, unsigned int cluster,</div><div class='ctx'> extern const struct inode_operations exfat_dir_inode_operations;</div><div class='ctx'> extern const struct file_operations exfat_dir_operations;</div><div class='ctx'> unsigned int exfat_get_entry_type(struct exfat_dentry *p_entry);</div><div class='del'>-int exfat_init_dir_entry(struct inode *inode, struct exfat_chain *p_dir,</div><div class='del'>-		int entry, unsigned int type, unsigned int start_clu,</div><div class='del'>-		unsigned long long size);</div><div class='del'>-int exfat_init_ext_entry(struct inode *inode, struct exfat_chain *p_dir,</div><div class='del'>-		int entry, int num_entries, struct exfat_uni_name *p_uniname);</div><div class='del'>-int exfat_remove_entries(struct inode *inode, struct exfat_chain *p_dir,</div><div class='del'>-		int entry, int order, int num_entries);</div><div class='del'>-int exfat_update_dir_chksum(struct inode *inode, struct exfat_chain *p_dir,</div><div class='del'>-		int entry);</div><div class='del'>-void exfat_update_dir_chksum_with_entry_set(struct exfat_entry_set_cache *es);</div><div class='add'>+void exfat_init_dir_entry(struct exfat_entry_set_cache *es,</div><div class='add'>+		unsigned int type, unsigned int start_clu,</div><div class='add'>+		unsigned long long size, struct timespec64 *ts);</div><div class='add'>+void exfat_init_ext_entry(struct exfat_entry_set_cache *es, int num_entries,</div><div class='add'>+		struct exfat_uni_name *p_uniname);</div><div class='add'>+void exfat_remove_entries(struct inode *inode, struct exfat_entry_set_cache *es,</div><div class='add'>+		int order);</div><div class='add'>+void exfat_update_dir_chksum(struct exfat_entry_set_cache *es);</div><div class='ctx'> int exfat_calc_num_entries(struct exfat_uni_name *p_uniname);</div><div class='ctx'> int exfat_find_dir_entry(struct super_block *sb, struct exfat_inode_info *ei,</div><div class='ctx'> 		struct exfat_chain *p_dir, struct exfat_uni_name *p_uniname,</div><div class='del'>-		int num_entries, unsigned int type, struct exfat_hint *hint_opt);</div><div class='add'>+		struct exfat_hint *hint_opt);</div><div class='ctx'> int exfat_alloc_new_dir(struct inode *inode, struct exfat_chain *clu);</div><div class='del'>-int exfat_find_location(struct super_block *sb, struct exfat_chain *p_dir,</div><div class='del'>-		int entry, sector_t *sector, int *offset);</div><div class='ctx'> struct exfat_dentry *exfat_get_dentry(struct super_block *sb,</div><div class='del'>-		struct exfat_chain *p_dir, int entry, struct buffer_head **bh,</div><div class='del'>-		sector_t *sector);</div><div class='add'>+		struct exfat_chain *p_dir, int entry, struct buffer_head **bh);</div><div class='ctx'> struct exfat_dentry *exfat_get_dentry_cached(struct exfat_entry_set_cache *es,</div><div class='ctx'> 		int num);</div><div class='del'>-struct exfat_entry_set_cache *exfat_get_dentry_set(struct super_block *sb,</div><div class='del'>-		struct exfat_chain *p_dir, int entry, unsigned int type);</div><div class='del'>-int exfat_free_dentry_set(struct exfat_entry_set_cache *es, int sync);</div><div class='add'>+int exfat_get_dentry_set(struct exfat_entry_set_cache *es,</div><div class='add'>+		struct super_block *sb, struct exfat_chain *p_dir, int entry,</div><div class='add'>+		unsigned int num_entries);</div><div class='add'>+#define exfat_get_dentry_set_by_ei(es, sb, ei)		\</div><div class='add'>+	exfat_get_dentry_set(es, sb, &amp;(ei)-&gt;dir, (ei)-&gt;entry, ES_ALL_ENTRIES)</div><div class='add'>+int exfat_get_empty_dentry_set(struct exfat_entry_set_cache *es,</div><div class='add'>+		struct super_block *sb, struct exfat_chain *p_dir, int entry,</div><div class='add'>+		unsigned int num_entries);</div><div class='add'>+int exfat_put_dentry_set(struct exfat_entry_set_cache *es, int sync);</div><div class='ctx'> int exfat_count_dir_entries(struct super_block *sb, struct exfat_chain *p_dir);</div><div class='add'>+int exfat_read_volume_label(struct super_block *sb,</div><div class='add'>+			    struct exfat_uni_name *label_out);</div><div class='add'>+int exfat_write_volume_label(struct super_block *sb,</div><div class='add'>+			     struct exfat_uni_name *label);</div><div class='ctx'> </div><div class='ctx'> /* inode.c */</div><div class='ctx'> extern const struct inode_operations exfat_file_inode_operations;</div><div class='hunk'>@@ -479,6 +533,7 @@ struct inode *exfat_build_inode(struct super_block *sb,</div><div class='ctx'> void exfat_hash_inode(struct inode *inode, loff_t i_pos);</div><div class='ctx'> void exfat_unhash_inode(struct inode *inode);</div><div class='ctx'> struct inode *exfat_iget(struct super_block *sb, loff_t i_pos);</div><div class='add'>+int __exfat_write_inode(struct inode *inode, int sync);</div><div class='ctx'> int exfat_write_inode(struct inode *inode, struct writeback_control *wbc);</div><div class='ctx'> void exfat_evict_inode(struct inode *inode);</div><div class='ctx'> int exfat_block_truncate_page(struct inode *inode, loff_t from);</div><div class='hunk'>@@ -504,18 +559,21 @@ void __exfat_fs_error(struct super_block *sb, int report, const char *fmt, ...)</div><div class='ctx'> #define exfat_fs_error_ratelimit(sb, fmt, args...) \</div><div class='ctx'> 		__exfat_fs_error(sb, __ratelimit(&amp;EXFAT_SB(sb)-&gt;ratelimit), \</div><div class='ctx'> 		fmt, ## args)</div><div class='del'>-void exfat_msg(struct super_block *sb, const char *lv, const char *fmt, ...)</div><div class='del'>-		__printf(3, 4) __cold;</div><div class='add'>+</div><div class='add'>+/* expand to pr_*() with prefix */</div><div class='ctx'> #define exfat_err(sb, fmt, ...)						\</div><div class='del'>-	exfat_msg(sb, KERN_ERR, fmt, ##__VA_ARGS__)</div><div class='add'>+	pr_err("exFAT-fs (%s): " fmt "\n", (sb)-&gt;s_id, ##__VA_ARGS__)</div><div class='ctx'> #define exfat_warn(sb, fmt, ...)					\</div><div class='del'>-	exfat_msg(sb, KERN_WARNING, fmt, ##__VA_ARGS__)</div><div class='add'>+	pr_warn("exFAT-fs (%s): " fmt "\n", (sb)-&gt;s_id, ##__VA_ARGS__)</div><div class='ctx'> #define exfat_info(sb, fmt, ...)					\</div><div class='del'>-	exfat_msg(sb, KERN_INFO, fmt, ##__VA_ARGS__)</div><div class='add'>+	pr_info("exFAT-fs (%s): " fmt "\n", (sb)-&gt;s_id, ##__VA_ARGS__)</div><div class='add'>+#define exfat_debug(sb, fmt, ...)					\</div><div class='add'>+	pr_debug("exFAT-fs (%s): " fmt "\n", (sb)-&gt;s_id, ##__VA_ARGS__)</div><div class='ctx'> </div><div class='ctx'> void exfat_get_entry_time(struct exfat_sb_info *sbi, struct timespec64 *ts,</div><div class='ctx'> 		u8 tz, __le16 time, __le16 date, u8 time_cs);</div><div class='ctx'> void exfat_truncate_atime(struct timespec64 *ts);</div><div class='add'>+void exfat_truncate_inode_atime(struct inode *inode);</div><div class='ctx'> void exfat_set_entry_time(struct exfat_sb_info *sbi, struct timespec64 *ts,</div><div class='ctx'> 		u8 *tz, __le16 *time, __le16 *date, u8 *time_cs);</div><div class='ctx'> u16 exfat_calc_chksum16(void *data, int len, u16 chksum, int type);</div><div class='head'>diff --git a/fs/exfat/exfat_raw.h b/fs/exfat/exfat_raw.h<br/>index 7f39b1c6469c..4082fa7b8c14 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/exfat/exfat_raw.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exfat/exfat_raw.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/exfat/exfat_raw.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/exfat/exfat_raw.h</a></div><div class='hunk'>@@ -27,6 +27,7 @@</div><div class='ctx'> 	((sbi)-&gt;num_clusters - EXFAT_RESERVED_CLUSTERS)</div><div class='ctx'> </div><div class='ctx'> /* AllocationPossible and NoFatChain field in GeneralSecondaryFlags Field */</div><div class='add'>+#define ALLOC_POSSIBLE		0x01</div><div class='ctx'> #define ALLOC_FAT_CHAIN		0x01</div><div class='ctx'> #define ALLOC_NO_FAT_CHAIN	0x03</div><div class='ctx'> </div><div class='hunk'>@@ -50,6 +51,8 @@</div><div class='ctx'> #define EXFAT_STREAM		0xC0	/* stream entry */</div><div class='ctx'> #define EXFAT_NAME		0xC1	/* file name entry */</div><div class='ctx'> #define EXFAT_ACL		0xC2	/* stream entry */</div><div class='add'>+#define EXFAT_VENDOR_EXT	0xE0	/* vendor extension entry */</div><div class='add'>+#define EXFAT_VENDOR_ALLOC	0xE1	/* vendor allocation entry */</div><div class='ctx'> </div><div class='ctx'> #define IS_EXFAT_CRITICAL_PRI(x)	(x &lt; 0xA0)</div><div class='ctx'> #define IS_EXFAT_BENIGN_PRI(x)		(x &lt; 0xC0)</div><div class='hunk'>@@ -61,21 +64,23 @@</div><div class='ctx'> #define CS_DEFAULT		2</div><div class='ctx'> </div><div class='ctx'> /* file attributes */</div><div class='del'>-#define ATTR_READONLY		0x0001</div><div class='del'>-#define ATTR_HIDDEN		0x0002</div><div class='del'>-#define ATTR_SYSTEM		0x0004</div><div class='del'>-#define ATTR_VOLUME		0x0008</div><div class='del'>-#define ATTR_SUBDIR		0x0010</div><div class='del'>-#define ATTR_ARCHIVE		0x0020</div><div class='add'>+#define EXFAT_ATTR_READONLY	0x0001</div><div class='add'>+#define EXFAT_ATTR_HIDDEN	0x0002</div><div class='add'>+#define EXFAT_ATTR_SYSTEM	0x0004</div><div class='add'>+#define EXFAT_ATTR_VOLUME	0x0008</div><div class='add'>+#define EXFAT_ATTR_SUBDIR	0x0010</div><div class='add'>+#define EXFAT_ATTR_ARCHIVE	0x0020</div><div class='ctx'> </div><div class='del'>-#define ATTR_RWMASK		(ATTR_HIDDEN | ATTR_SYSTEM | ATTR_VOLUME | \</div><div class='del'>-				 ATTR_SUBDIR | ATTR_ARCHIVE)</div><div class='add'>+#define EXFAT_ATTR_RWMASK	(EXFAT_ATTR_HIDDEN | EXFAT_ATTR_SYSTEM | \</div><div class='add'>+				 EXFAT_ATTR_VOLUME | EXFAT_ATTR_SUBDIR | \</div><div class='add'>+				 EXFAT_ATTR_ARCHIVE)</div><div class='ctx'> </div><div class='ctx'> #define BOOTSEC_JUMP_BOOT_LEN		3</div><div class='ctx'> #define BOOTSEC_FS_NAME_LEN		8</div><div class='ctx'> #define BOOTSEC_OLDBPB_LEN		53</div><div class='ctx'> </div><div class='ctx'> #define EXFAT_FILE_NAME_LEN		15</div><div class='add'>+#define EXFAT_VOLUME_LABEL_LEN		11</div><div class='ctx'> </div><div class='ctx'> #define EXFAT_MIN_SECT_SIZE_BITS		9</div><div class='ctx'> #define EXFAT_MAX_SECT_SIZE_BITS		12</div><div class='hunk'>@@ -155,6 +160,29 @@ struct exfat_dentry {</div><div class='ctx'> 			__le32 start_clu;</div><div class='ctx'> 			__le64 size;</div><div class='ctx'> 		} __packed upcase; /* up-case table directory entry */</div><div class='add'>+		struct {</div><div class='add'>+			__u8 char_count;</div><div class='add'>+			__le16 volume_label[EXFAT_VOLUME_LABEL_LEN];</div><div class='add'>+			__u8 reserved[8];</div><div class='add'>+		} __packed volume_label; /* volume label directory entry */</div><div class='add'>+		struct {</div><div class='add'>+			__u8 flags;</div><div class='add'>+			__u8 vendor_guid[16];</div><div class='add'>+			__u8 vendor_defined[14];</div><div class='add'>+		} __packed vendor_ext; /* vendor extension directory entry */</div><div class='add'>+		struct {</div><div class='add'>+			__u8 flags;</div><div class='add'>+			__u8 vendor_guid[16];</div><div class='add'>+			__u8 vendor_defined[2];</div><div class='add'>+			__le32 start_clu;</div><div class='add'>+			__le64 size;</div><div class='add'>+		} __packed vendor_alloc; /* vendor allocation directory entry */</div><div class='add'>+		struct {</div><div class='add'>+			__u8 flags;</div><div class='add'>+			__u8 custom_defined[18];</div><div class='add'>+			__le32 start_clu;</div><div class='add'>+			__le64 size;</div><div class='add'>+		} __packed generic_secondary; /* generic secondary directory entry */</div><div class='ctx'> 	} __packed dentry;</div><div class='ctx'> } __packed;</div><div class='ctx'> </div><div class='head'>diff --git a/fs/exfat/fatent.c b/fs/exfat/fatent.c<br/>index e949e563443c..c9c5f2e3a05e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/exfat/fatent.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exfat/fatent.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/exfat/fatent.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/exfat/fatent.c</a></div><div class='hunk'>@@ -4,8 +4,9 @@</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='del'>-#include &lt;asm/unaligned.h&gt;</div><div class='add'>+#include &lt;linux/unaligned.h&gt;</div><div class='ctx'> #include &lt;linux/buffer_head.h&gt;</div><div class='add'>+#include &lt;linux/blkdev.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "exfat_raw.h"</div><div class='ctx'> #include "exfat_fs.h"</div><div class='hunk'>@@ -81,14 +82,6 @@ int exfat_ent_set(struct super_block *sb, unsigned int loc,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline bool is_valid_cluster(struct exfat_sb_info *sbi,</div><div class='del'>-		unsigned int clus)</div><div class='del'>-{</div><div class='del'>-	if (clus &lt; EXFAT_FIRST_CLUSTER || sbi-&gt;num_clusters &lt;= clus)</div><div class='del'>-		return false;</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> int exfat_ent_get(struct super_block *sb, unsigned int loc,</div><div class='ctx'> 		unsigned int *content)</div><div class='ctx'> {</div><div class='hunk'>@@ -96,35 +89,36 @@ int exfat_ent_get(struct super_block *sb, unsigned int loc,</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (!is_valid_cluster(sbi, loc)) {</div><div class='del'>-		exfat_fs_error(sb, "invalid access to FAT (entry 0x%08x)",</div><div class='add'>+		exfat_fs_error_ratelimit(sb,</div><div class='add'>+			"invalid access to FAT (entry 0x%08x)",</div><div class='ctx'> 			loc);</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	err = __exfat_ent_get(sb, loc, content);</div><div class='ctx'> 	if (err) {</div><div class='del'>-		exfat_fs_error(sb,</div><div class='add'>+		exfat_fs_error_ratelimit(sb,</div><div class='ctx'> 			"failed to access to FAT (entry 0x%08x, err:%d)",</div><div class='ctx'> 			loc, err);</div><div class='ctx'> 		return err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (*content == EXFAT_FREE_CLUSTER) {</div><div class='del'>-		exfat_fs_error(sb,</div><div class='add'>+		exfat_fs_error_ratelimit(sb,</div><div class='ctx'> 			"invalid access to FAT free cluster (entry 0x%08x)",</div><div class='ctx'> 			loc);</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (*content == EXFAT_BAD_CLUSTER) {</div><div class='del'>-		exfat_fs_error(sb,</div><div class='add'>+		exfat_fs_error_ratelimit(sb,</div><div class='ctx'> 			"invalid access to FAT bad cluster (entry 0x%08x)",</div><div class='ctx'> 			loc);</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (*content != EXFAT_EOF_CLUSTER &amp;&amp; !is_valid_cluster(sbi, *content)) {</div><div class='del'>-		exfat_fs_error(sb,</div><div class='add'>+		exfat_fs_error_ratelimit(sb,</div><div class='ctx'> 			"invalid access to FAT (entry 0x%08x) bogus content (0x%08x)",</div><div class='ctx'> 			loc, *content);</div><div class='ctx'> 		return -EIO;</div><div class='hunk'>@@ -151,6 +145,20 @@ int exfat_chain_cont_cluster(struct super_block *sb, unsigned int chain,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline void exfat_discard_cluster(struct super_block *sb,</div><div class='add'>+		unsigned int clu, unsigned int num_clusters)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='add'>+</div><div class='add'>+	ret = sb_issue_discard(sb, exfat_cluster_to_sector(sbi, clu),</div><div class='add'>+			sbi-&gt;sect_per_clus * num_clusters, GFP_NOFS, 0);</div><div class='add'>+	if (ret == -EOPNOTSUPP) {</div><div class='add'>+		exfat_err(sb, "discard not supported by device, disabling");</div><div class='add'>+		sbi-&gt;options.discard = 0;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /* This function must be called with bitmap_lock held */</div><div class='ctx'> static int __exfat_free_cluster(struct inode *inode, struct exfat_chain *p_chain)</div><div class='ctx'> {</div><div class='hunk'>@@ -182,6 +190,7 @@ static int __exfat_free_cluster(struct inode *inode, struct exfat_chain *p_chain</div><div class='ctx'> 		BITMAP_OFFSET_SECTOR_INDEX(sb, CLUSTER_TO_BITMAP_ENT(clu));</div><div class='ctx'> </div><div class='ctx'> 	if (p_chain-&gt;flags == ALLOC_NO_FAT_CHAIN) {</div><div class='add'>+		int err;</div><div class='ctx'> 		unsigned int last_cluster = p_chain-&gt;dir + p_chain-&gt;size - 1;</div><div class='ctx'> 		do {</div><div class='ctx'> 			bool sync = false;</div><div class='hunk'>@@ -196,11 +205,18 @@ static int __exfat_free_cluster(struct inode *inode, struct exfat_chain *p_chain</div><div class='ctx'> 				cur_cmap_i = next_cmap_i;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			exfat_clear_bitmap(inode, clu, (sync &amp;&amp; IS_DIRSYNC(inode)));</div><div class='add'>+			err = exfat_clear_bitmap(sb, clu, (sync &amp;&amp; IS_DIRSYNC(inode)));</div><div class='add'>+			if (err)</div><div class='add'>+				break;</div><div class='ctx'> 			clu++;</div><div class='ctx'> 			num_clusters++;</div><div class='ctx'> 		} while (num_clusters &lt; p_chain-&gt;size);</div><div class='add'>+</div><div class='add'>+		if (sbi-&gt;options.discard)</div><div class='add'>+			exfat_discard_cluster(sb, p_chain-&gt;dir, p_chain-&gt;size);</div><div class='ctx'> 	} else {</div><div class='add'>+		unsigned int nr_clu = 1;</div><div class='add'>+</div><div class='ctx'> 		do {</div><div class='ctx'> 			bool sync = false;</div><div class='ctx'> 			unsigned int n_clu = clu;</div><div class='hunk'>@@ -217,16 +233,36 @@ static int __exfat_free_cluster(struct inode *inode, struct exfat_chain *p_chain</div><div class='ctx'> 				cur_cmap_i = next_cmap_i;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			exfat_clear_bitmap(inode, clu, (sync &amp;&amp; IS_DIRSYNC(inode)));</div><div class='add'>+			if (exfat_clear_bitmap(sb, clu, (sync &amp;&amp; IS_DIRSYNC(inode))))</div><div class='add'>+				break;</div><div class='add'>+</div><div class='add'>+			if (sbi-&gt;options.discard) {</div><div class='add'>+				if (n_clu == clu + 1)</div><div class='add'>+					nr_clu++;</div><div class='add'>+				else {</div><div class='add'>+					exfat_discard_cluster(sb, clu - nr_clu + 1, nr_clu);</div><div class='add'>+					nr_clu = 1;</div><div class='add'>+				}</div><div class='add'>+			}</div><div class='add'>+</div><div class='ctx'> 			clu = n_clu;</div><div class='ctx'> 			num_clusters++;</div><div class='ctx'> </div><div class='ctx'> 			if (err)</div><div class='del'>-				goto dec_used_clus;</div><div class='add'>+				break;</div><div class='add'>+</div><div class='add'>+			if (num_clusters &gt;= sbi-&gt;num_clusters - EXFAT_FIRST_CLUSTER) {</div><div class='add'>+				/*</div><div class='add'>+				 * The cluster chain includes a loop, scan the</div><div class='add'>+				 * bitmap to get the number of used clusters.</div><div class='add'>+				 */</div><div class='add'>+				exfat_count_used_clusters(sb, &amp;sbi-&gt;used_clusters);</div><div class='add'>+</div><div class='add'>+				return 0;</div><div class='add'>+			}</div><div class='ctx'> 		} while (clu != EXFAT_EOF_CLUSTER);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-dec_used_clus:</div><div class='ctx'> 	sbi-&gt;used_clusters -= num_clusters;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -259,7 +295,7 @@ int exfat_find_last_cluster(struct super_block *sb, struct exfat_chain *p_chain,</div><div class='ctx'> 		clu = next;</div><div class='ctx'> 		if (exfat_ent_get(sb, clu, &amp;next))</div><div class='ctx'> 			return -EIO;</div><div class='del'>-	} while (next != EXFAT_EOF_CLUSTER);</div><div class='add'>+	} while (next != EXFAT_EOF_CLUSTER &amp;&amp; count &lt;= p_chain-&gt;size);</div><div class='ctx'> </div><div class='ctx'> 	if (p_chain-&gt;size != count) {</div><div class='ctx'> 		exfat_fs_error(sb,</div><div class='hunk'>@@ -276,10 +312,8 @@ int exfat_zeroed_cluster(struct inode *dir, unsigned int clu)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = dir-&gt;i_sb;</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='del'>-	struct buffer_head *bhs[MAX_BUF_PER_PAGE];</div><div class='del'>-	int nr_bhs = MAX_BUF_PER_PAGE;</div><div class='del'>-	sector_t blknr, last_blknr;</div><div class='del'>-	int err, i, n;</div><div class='add'>+	struct buffer_head *bh;</div><div class='add'>+	sector_t blknr, last_blknr, i;</div><div class='ctx'> </div><div class='ctx'> 	blknr = exfat_cluster_to_sector(sbi, clu);</div><div class='ctx'> 	last_blknr = blknr + sbi-&gt;sect_per_clus;</div><div class='hunk'>@@ -293,37 +327,30 @@ int exfat_zeroed_cluster(struct inode *dir, unsigned int clu)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Zeroing the unused blocks on this cluster */</div><div class='del'>-	while (blknr &lt; last_blknr) {</div><div class='del'>-		for (n = 0; n &lt; nr_bhs &amp;&amp; blknr &lt; last_blknr; n++, blknr++) {</div><div class='del'>-			bhs[n] = sb_getblk(sb, blknr);</div><div class='del'>-			if (!bhs[n]) {</div><div class='del'>-				err = -ENOMEM;</div><div class='del'>-				goto release_bhs;</div><div class='del'>-			}</div><div class='del'>-			memset(bhs[n]-&gt;b_data, 0, sb-&gt;s_blocksize);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		err = exfat_update_bhs(bhs, n, IS_DIRSYNC(dir));</div><div class='del'>-		if (err)</div><div class='del'>-			goto release_bhs;</div><div class='add'>+	for (i = blknr; i &lt; last_blknr; i++) {</div><div class='add'>+		bh = sb_getblk(sb, i);</div><div class='add'>+		if (!bh)</div><div class='add'>+			return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-		for (i = 0; i &lt; n; i++)</div><div class='del'>-			brelse(bhs[i]);</div><div class='add'>+		memset(bh-&gt;b_data, 0, sb-&gt;s_blocksize);</div><div class='add'>+		set_buffer_uptodate(bh);</div><div class='add'>+		mark_buffer_dirty(bh);</div><div class='add'>+		brelse(bh);</div><div class='ctx'> 	}</div><div class='del'>-	return 0;</div><div class='ctx'> </div><div class='del'>-release_bhs:</div><div class='del'>-	exfat_err(sb, "failed zeroed sect %llu\n", (unsigned long long)blknr);</div><div class='del'>-	for (i = 0; i &lt; n; i++)</div><div class='del'>-		bforget(bhs[i]);</div><div class='del'>-	return err;</div><div class='add'>+	if (IS_DIRSYNC(dir))</div><div class='add'>+		return sync_blockdev_range(sb-&gt;s_bdev,</div><div class='add'>+				EXFAT_BLK_TO_B(blknr, sb),</div><div class='add'>+				EXFAT_BLK_TO_B(last_blknr, sb) - 1);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int exfat_alloc_cluster(struct inode *inode, unsigned int num_alloc,</div><div class='ctx'> 		struct exfat_chain *p_chain, bool sync_bmap)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = -ENOSPC;</div><div class='del'>-	unsigned int num_clusters = 0, total_cnt;</div><div class='add'>+	unsigned int total_cnt;</div><div class='ctx'> 	unsigned int hint_clu, new_clu, last_clu = EXFAT_EOF_CLUSTER;</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='hunk'>@@ -346,7 +373,7 @@ int exfat_alloc_cluster(struct inode *inode, unsigned int num_alloc,</div><div class='ctx'> 	/* find new cluster */</div><div class='ctx'> 	if (hint_clu == EXFAT_EOF_CLUSTER) {</div><div class='ctx'> 		if (sbi-&gt;clu_srch_ptr &lt; EXFAT_FIRST_CLUSTER) {</div><div class='del'>-			exfat_err(sb, "sbi-&gt;clu_srch_ptr is invalid (%u)\n",</div><div class='add'>+			exfat_err(sb, "sbi-&gt;clu_srch_ptr is invalid (%u)",</div><div class='ctx'> 				  sbi-&gt;clu_srch_ptr);</div><div class='ctx'> 			sbi-&gt;clu_srch_ptr = EXFAT_FIRST_CLUSTER;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -360,17 +387,11 @@ int exfat_alloc_cluster(struct inode *inode, unsigned int num_alloc,</div><div class='ctx'> </div><div class='ctx'> 	/* check cluster validation */</div><div class='ctx'> 	if (!is_valid_cluster(sbi, hint_clu)) {</div><div class='del'>-		exfat_err(sb, "hint_cluster is invalid (%u)",</div><div class='del'>-			hint_clu);</div><div class='add'>+		if (hint_clu != sbi-&gt;num_clusters)</div><div class='add'>+			exfat_err(sb, "hint_cluster is invalid (%u), rewind to the first cluster",</div><div class='add'>+					hint_clu);</div><div class='ctx'> 		hint_clu = EXFAT_FIRST_CLUSTER;</div><div class='del'>-		if (p_chain-&gt;flags == ALLOC_NO_FAT_CHAIN) {</div><div class='del'>-			if (exfat_chain_cont_cluster(sb, p_chain-&gt;dir,</div><div class='del'>-					num_clusters)) {</div><div class='del'>-				ret = -EIO;</div><div class='del'>-				goto unlock;</div><div class='del'>-			}</div><div class='del'>-			p_chain-&gt;flags = ALLOC_FAT_CHAIN;</div><div class='del'>-		}</div><div class='add'>+		p_chain-&gt;flags = ALLOC_FAT_CHAIN;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	p_chain-&gt;dir = EXFAT_EOF_CLUSTER;</div><div class='hunk'>@@ -380,7 +401,7 @@ int exfat_alloc_cluster(struct inode *inode, unsigned int num_alloc,</div><div class='ctx'> 		if (new_clu != hint_clu &amp;&amp;</div><div class='ctx'> 		    p_chain-&gt;flags == ALLOC_NO_FAT_CHAIN) {</div><div class='ctx'> 			if (exfat_chain_cont_cluster(sb, p_chain-&gt;dir,</div><div class='del'>-					num_clusters)) {</div><div class='add'>+					p_chain-&gt;size)) {</div><div class='ctx'> 				ret = -EIO;</div><div class='ctx'> 				goto free_cluster;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -388,13 +409,11 @@ int exfat_alloc_cluster(struct inode *inode, unsigned int num_alloc,</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* update allocation bitmap */</div><div class='del'>-		if (exfat_set_bitmap(inode, new_clu, sync_bmap)) {</div><div class='add'>+		if (exfat_set_bitmap(sb, new_clu, sync_bmap)) {</div><div class='ctx'> 			ret = -EIO;</div><div class='ctx'> 			goto free_cluster;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		num_clusters++;</div><div class='del'>-</div><div class='ctx'> 		/* update FAT table */</div><div class='ctx'> 		if (p_chain-&gt;flags == ALLOC_FAT_CHAIN) {</div><div class='ctx'> 			if (exfat_ent_set(sb, new_clu, EXFAT_EOF_CLUSTER)) {</div><div class='hunk'>@@ -411,13 +430,14 @@ int exfat_alloc_cluster(struct inode *inode, unsigned int num_alloc,</div><div class='ctx'> 				goto free_cluster;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='add'>+		p_chain-&gt;size++;</div><div class='add'>+</div><div class='ctx'> 		last_clu = new_clu;</div><div class='ctx'> </div><div class='del'>-		if (--num_alloc == 0) {</div><div class='add'>+		if (p_chain-&gt;size == num_alloc) {</div><div class='ctx'> 			sbi-&gt;clu_srch_ptr = hint_clu;</div><div class='del'>-			sbi-&gt;used_clusters += num_clusters;</div><div class='add'>+			sbi-&gt;used_clusters += num_alloc;</div><div class='ctx'> </div><div class='del'>-			p_chain-&gt;size += num_clusters;</div><div class='ctx'> 			mutex_unlock(&amp;sbi-&gt;bitmap_lock);</div><div class='ctx'> 			return 0;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -428,7 +448,7 @@ int exfat_alloc_cluster(struct inode *inode, unsigned int num_alloc,</div><div class='ctx'> </div><div class='ctx'> 			if (p_chain-&gt;flags == ALLOC_NO_FAT_CHAIN) {</div><div class='ctx'> 				if (exfat_chain_cont_cluster(sb, p_chain-&gt;dir,</div><div class='del'>-						num_clusters)) {</div><div class='add'>+						p_chain-&gt;size)) {</div><div class='ctx'> 					ret = -EIO;</div><div class='ctx'> 					goto free_cluster;</div><div class='ctx'> 				}</div><div class='hunk'>@@ -437,8 +457,7 @@ int exfat_alloc_cluster(struct inode *inode, unsigned int num_alloc,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> free_cluster:</div><div class='del'>-	if (num_clusters)</div><div class='del'>-		__exfat_free_cluster(inode, p_chain);</div><div class='add'>+	__exfat_free_cluster(inode, p_chain);</div><div class='ctx'> unlock:</div><div class='ctx'> 	mutex_unlock(&amp;sbi-&gt;bitmap_lock);</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -472,5 +491,15 @@ int exfat_count_num_clusters(struct super_block *sb,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	*ret_count = count;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * since exfat_count_used_clusters() is not called, sbi-&gt;used_clusters</div><div class='add'>+	 * cannot be used here.</div><div class='add'>+	 */</div><div class='add'>+	if (unlikely(i == sbi-&gt;num_clusters &amp;&amp; clu != EXFAT_EOF_CLUSTER)) {</div><div class='add'>+		exfat_fs_error(sb, "The cluster chain has a loop");</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/exfat/file.c b/fs/exfat/file.c<br/>index 6af0191b648f..536c8078f0c1 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/exfat/file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exfat/file.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/exfat/file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/exfat/file.c</a></div><div class='hunk'>@@ -8,45 +8,95 @@</div><div class='ctx'> #include &lt;linux/cred.h&gt;</div><div class='ctx'> #include &lt;linux/buffer_head.h&gt;</div><div class='ctx'> #include &lt;linux/blkdev.h&gt;</div><div class='add'>+#include &lt;linux/fsnotify.h&gt;</div><div class='add'>+#include &lt;linux/security.h&gt;</div><div class='add'>+#include &lt;linux/msdos_fs.h&gt;</div><div class='add'>+#include &lt;linux/writeback.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "exfat_raw.h"</div><div class='ctx'> #include "exfat_fs.h"</div><div class='ctx'> </div><div class='ctx'> static int exfat_cont_expand(struct inode *inode, loff_t size)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='del'>-	loff_t start = i_size_read(inode), count = size - i_size_read(inode);</div><div class='del'>-	int err, err2;</div><div class='add'>+	int ret;</div><div class='add'>+	unsigned int num_clusters, new_num_clusters, last_clu;</div><div class='add'>+	struct exfat_inode_info *ei = EXFAT_I(inode);</div><div class='add'>+	struct super_block *sb = inode-&gt;i_sb;</div><div class='add'>+	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='add'>+	struct exfat_chain clu;</div><div class='ctx'> </div><div class='del'>-	err = generic_cont_expand_simple(inode, size);</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='add'>+	truncate_pagecache(inode, i_size_read(inode));</div><div class='add'>+</div><div class='add'>+	ret = inode_newsize_ok(inode, size);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	num_clusters = EXFAT_B_TO_CLU(exfat_ondisk_size(inode), sbi);</div><div class='add'>+	new_num_clusters = EXFAT_B_TO_CLU_ROUND_UP(size, sbi);</div><div class='add'>+</div><div class='add'>+	if (new_num_clusters == num_clusters)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	if (num_clusters) {</div><div class='add'>+		exfat_chain_set(&amp;clu, ei-&gt;start_clu, num_clusters, ei-&gt;flags);</div><div class='add'>+		ret = exfat_find_last_cluster(sb, &amp;clu, &amp;last_clu);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_ctime = inode-&gt;i_mtime = current_time(inode);</div><div class='add'>+		clu.dir = last_clu + 1;</div><div class='add'>+	} else {</div><div class='add'>+		last_clu = EXFAT_EOF_CLUSTER;</div><div class='add'>+		clu.dir = EXFAT_EOF_CLUSTER;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	clu.size = 0;</div><div class='add'>+	clu.flags = ei-&gt;flags;</div><div class='add'>+</div><div class='add'>+	ret = exfat_alloc_cluster(inode, new_num_clusters - num_clusters,</div><div class='add'>+			&amp;clu, inode_needs_sync(inode));</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	/* Append new clusters to chain */</div><div class='add'>+	if (num_clusters) {</div><div class='add'>+		if (clu.flags != ei-&gt;flags)</div><div class='add'>+			if (exfat_chain_cont_cluster(sb, ei-&gt;start_clu, num_clusters))</div><div class='add'>+				goto free_clu;</div><div class='add'>+</div><div class='add'>+		if (clu.flags == ALLOC_FAT_CHAIN)</div><div class='add'>+			if (exfat_ent_set(sb, last_clu, clu.dir))</div><div class='add'>+				goto free_clu;</div><div class='add'>+	} else</div><div class='add'>+		ei-&gt;start_clu = clu.dir;</div><div class='add'>+</div><div class='add'>+	ei-&gt;flags = clu.flags;</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	inode_set_mtime_to_ts(inode, inode_set_ctime_current(inode));</div><div class='add'>+	/* Expanded range not zeroed, do not update valid_size */</div><div class='add'>+	i_size_write(inode, size);</div><div class='add'>+</div><div class='add'>+	inode-&gt;i_blocks = round_up(size, sbi-&gt;cluster_size) &gt;&gt; 9;</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='ctx'> </div><div class='del'>-	if (!IS_SYNC(inode))</div><div class='del'>-		return 0;</div><div class='add'>+	if (IS_SYNC(inode))</div><div class='add'>+		return write_inode_now(inode, 1);</div><div class='ctx'> </div><div class='del'>-	err = filemap_fdatawrite_range(mapping, start, start + count - 1);</div><div class='del'>-	err2 = sync_mapping_buffers(mapping);</div><div class='del'>-	if (!err)</div><div class='del'>-		err = err2;</div><div class='del'>-	err2 = write_inode_now(inode, 1);</div><div class='del'>-	if (!err)</div><div class='del'>-		err = err2;</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='add'>+	return 0;</div><div class='ctx'> </div><div class='del'>-	return filemap_fdatawait_range(mapping, start, start + count - 1);</div><div class='add'>+free_clu:</div><div class='add'>+	exfat_free_cluster(inode, &amp;clu);</div><div class='add'>+	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool exfat_allow_set_time(struct exfat_sb_info *sbi, struct inode *inode)</div><div class='add'>+static bool exfat_allow_set_time(struct mnt_idmap *idmap,</div><div class='add'>+				 struct exfat_sb_info *sbi, struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	mode_t allow_utime = sbi-&gt;options.allow_utime;</div><div class='ctx'> </div><div class='del'>-	if (!uid_eq(current_fsuid(), inode-&gt;i_uid)) {</div><div class='del'>-		if (in_group_p(inode-&gt;i_gid))</div><div class='add'>+	if (!vfsuid_eq_kuid(i_uid_into_vfsuid(idmap, inode),</div><div class='add'>+			    current_fsuid())) {</div><div class='add'>+		if (vfsgid_in_group_p(i_gid_into_vfsgid(idmap, inode)))</div><div class='ctx'> 			allow_utime &gt;&gt;= 3;</div><div class='ctx'> 		if (allow_utime &amp; MAY_WRITE)</div><div class='ctx'> 			return true;</div><div class='hunk'>@@ -93,7 +143,7 @@ static int exfat_sanitize_mode(const struct exfat_sb_info *sbi,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* resize the file length */</div><div class='del'>-int __exfat_truncate(struct inode *inode, loff_t new_size)</div><div class='add'>+int __exfat_truncate(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int num_clusters_new, num_clusters_phys;</div><div class='ctx'> 	unsigned int last_clu = EXFAT_FREE_CLUSTER;</div><div class='hunk'>@@ -101,7 +151,6 @@ int __exfat_truncate(struct inode *inode, loff_t new_size)</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='ctx'> 	struct exfat_inode_info *ei = EXFAT_I(inode);</div><div class='del'>-	int evict = (ei-&gt;dir.dir == DIR_DELETED) ? 1 : 0;</div><div class='ctx'> </div><div class='ctx'> 	/* check if the given file ID is opened */</div><div class='ctx'> 	if (ei-&gt;type != TYPE_FILE &amp;&amp; ei-&gt;type != TYPE_DIR)</div><div class='hunk'>@@ -110,12 +159,11 @@ int __exfat_truncate(struct inode *inode, loff_t new_size)</div><div class='ctx'> 	exfat_set_volume_dirty(sb);</div><div class='ctx'> </div><div class='ctx'> 	num_clusters_new = EXFAT_B_TO_CLU_ROUND_UP(i_size_read(inode), sbi);</div><div class='del'>-	num_clusters_phys =</div><div class='del'>-		EXFAT_B_TO_CLU_ROUND_UP(EXFAT_I(inode)-&gt;i_size_ondisk, sbi);</div><div class='add'>+	num_clusters_phys = EXFAT_B_TO_CLU(exfat_ondisk_size(inode), sbi);</div><div class='ctx'> </div><div class='ctx'> 	exfat_chain_set(&amp;clu, ei-&gt;start_clu, num_clusters_phys, ei-&gt;flags);</div><div class='ctx'> </div><div class='del'>-	if (new_size &gt; 0) {</div><div class='add'>+	if (i_size_read(inode) &gt; 0) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Truncate FAT chain num_clusters after the first cluster</div><div class='ctx'> 		 * num_clusters = min(new, phys);</div><div class='hunk'>@@ -145,55 +193,25 @@ int __exfat_truncate(struct inode *inode, loff_t new_size)</div><div class='ctx'> 		ei-&gt;start_clu = EXFAT_EOF_CLUSTER;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	i_size_write(inode, new_size);</div><div class='add'>+	if (i_size_read(inode) &lt; ei-&gt;valid_size)</div><div class='add'>+		ei-&gt;valid_size = i_size_read(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (ei-&gt;type == TYPE_FILE)</div><div class='del'>-		ei-&gt;attr |= ATTR_ARCHIVE;</div><div class='del'>-</div><div class='del'>-	/* update the directory entry */</div><div class='del'>-	if (!evict) {</div><div class='del'>-		struct timespec64 ts;</div><div class='del'>-		struct exfat_dentry *ep, *ep2;</div><div class='del'>-		struct exfat_entry_set_cache *es;</div><div class='del'>-		int err;</div><div class='del'>-</div><div class='del'>-		es = exfat_get_dentry_set(sb, &amp;(ei-&gt;dir), ei-&gt;entry,</div><div class='del'>-				ES_ALL_ENTRIES);</div><div class='del'>-		if (!es)</div><div class='del'>-			return -EIO;</div><div class='del'>-		ep = exfat_get_dentry_cached(es, 0);</div><div class='del'>-		ep2 = exfat_get_dentry_cached(es, 1);</div><div class='del'>-</div><div class='del'>-		ts = current_time(inode);</div><div class='del'>-		exfat_set_entry_time(sbi, &amp;ts,</div><div class='del'>-				&amp;ep-&gt;dentry.file.modify_tz,</div><div class='del'>-				&amp;ep-&gt;dentry.file.modify_time,</div><div class='del'>-				&amp;ep-&gt;dentry.file.modify_date,</div><div class='del'>-				&amp;ep-&gt;dentry.file.modify_time_cs);</div><div class='del'>-		ep-&gt;dentry.file.attr = cpu_to_le16(ei-&gt;attr);</div><div class='del'>-</div><div class='del'>-		/* File size should be zero if there is no cluster allocated */</div><div class='del'>-		if (ei-&gt;start_clu == EXFAT_EOF_CLUSTER) {</div><div class='del'>-			ep2-&gt;dentry.stream.valid_size = 0;</div><div class='del'>-			ep2-&gt;dentry.stream.size = 0;</div><div class='del'>-		} else {</div><div class='del'>-			ep2-&gt;dentry.stream.valid_size = cpu_to_le64(new_size);</div><div class='del'>-			ep2-&gt;dentry.stream.size = ep2-&gt;dentry.stream.valid_size;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (new_size == 0) {</div><div class='del'>-			/* Any directory can not be truncated to zero */</div><div class='del'>-			WARN_ON(ei-&gt;type != TYPE_FILE);</div><div class='del'>-</div><div class='del'>-			ep2-&gt;dentry.stream.flags = ALLOC_FAT_CHAIN;</div><div class='del'>-			ep2-&gt;dentry.stream.start_clu = EXFAT_FREE_CLUSTER;</div><div class='del'>-		}</div><div class='add'>+		ei-&gt;attr |= EXFAT_ATTR_ARCHIVE;</div><div class='ctx'> </div><div class='del'>-		exfat_update_dir_chksum_with_entry_set(es);</div><div class='del'>-		err = exfat_free_dentry_set(es, inode_needs_sync(inode));</div><div class='del'>-		if (err)</div><div class='del'>-			return err;</div><div class='del'>-	}</div><div class='add'>+	/*</div><div class='add'>+	 * update the directory entry</div><div class='add'>+	 *</div><div class='add'>+	 * If the directory entry is updated by mark_inode_dirty(), the</div><div class='add'>+	 * directory entry will be written after a writeback cycle of</div><div class='add'>+	 * updating the bitmap/FAT, which may result in clusters being</div><div class='add'>+	 * freed but referenced by the directory entry in the event of a</div><div class='add'>+	 * sudden power failure.</div><div class='add'>+	 * __exfat_write_inode() is called for directory entry, bitmap</div><div class='add'>+	 * and FAT to be written in a same writeback.</div><div class='add'>+	 */</div><div class='add'>+	if (__exfat_write_inode(inode, inode_needs_sync(inode)))</div><div class='add'>+		return -EIO;</div><div class='ctx'> </div><div class='ctx'> 	/* cut off from the FAT chain */</div><div class='ctx'> 	if (ei-&gt;flags == ALLOC_FAT_CHAIN &amp;&amp; last_clu != EXFAT_FREE_CLUSTER &amp;&amp;</div><div class='hunk'>@@ -219,21 +237,18 @@ int __exfat_truncate(struct inode *inode, loff_t new_size)</div><div class='ctx'> 	if (exfat_free_cluster(inode, &amp;clu))</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> </div><div class='del'>-	exfat_clear_volume_dirty(sb);</div><div class='del'>-</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void exfat_truncate(struct inode *inode, loff_t size)</div><div class='add'>+void exfat_truncate(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='del'>-	unsigned int blocksize = i_blocksize(inode);</div><div class='del'>-	loff_t aligned_size;</div><div class='add'>+	struct exfat_inode_info *ei = EXFAT_I(inode);</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;sbi-&gt;s_lock);</div><div class='del'>-	if (EXFAT_I(inode)-&gt;start_clu == 0) {</div><div class='add'>+	if (ei-&gt;start_clu == 0) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Empty start_clu != ~0 (not allocated)</div><div class='ctx'> 		 */</div><div class='hunk'>@@ -241,41 +256,23 @@ void exfat_truncate(struct inode *inode, loff_t size)</div><div class='ctx'> 		goto write_size;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = __exfat_truncate(inode, i_size_read(inode));</div><div class='add'>+	err = __exfat_truncate(inode);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto write_size;</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_ctime = inode-&gt;i_mtime = current_time(inode);</div><div class='del'>-	if (IS_DIRSYNC(inode))</div><div class='del'>-		exfat_sync_inode(inode);</div><div class='del'>-	else</div><div class='del'>-		mark_inode_dirty(inode);</div><div class='del'>-</div><div class='del'>-	inode-&gt;i_blocks = ((i_size_read(inode) + (sbi-&gt;cluster_size - 1)) &amp;</div><div class='del'>-			~(sbi-&gt;cluster_size - 1)) &gt;&gt; inode-&gt;i_blkbits;</div><div class='add'>+	inode-&gt;i_blocks = round_up(i_size_read(inode), sbi-&gt;cluster_size) &gt;&gt; 9;</div><div class='ctx'> write_size:</div><div class='del'>-	aligned_size = i_size_read(inode);</div><div class='del'>-	if (aligned_size &amp; (blocksize - 1)) {</div><div class='del'>-		aligned_size |= (blocksize - 1);</div><div class='del'>-		aligned_size++;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (EXFAT_I(inode)-&gt;i_size_ondisk &gt; i_size_read(inode))</div><div class='del'>-		EXFAT_I(inode)-&gt;i_size_ondisk = aligned_size;</div><div class='del'>-</div><div class='del'>-	if (EXFAT_I(inode)-&gt;i_size_aligned &gt; i_size_read(inode))</div><div class='del'>-		EXFAT_I(inode)-&gt;i_size_aligned = aligned_size;</div><div class='ctx'> 	mutex_unlock(&amp;sbi-&gt;s_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int exfat_getattr(struct user_namespace *mnt_uerns, const struct path *path,</div><div class='add'>+int exfat_getattr(struct mnt_idmap *idmap, const struct path *path,</div><div class='ctx'> 		  struct kstat *stat, unsigned int request_mask,</div><div class='ctx'> 		  unsigned int query_flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_backing_inode(path-&gt;dentry);</div><div class='ctx'> 	struct exfat_inode_info *ei = EXFAT_I(inode);</div><div class='ctx'> </div><div class='del'>-	generic_fillattr(&amp;init_user_ns, inode, stat);</div><div class='add'>+	generic_fillattr(idmap, request_mask, inode, stat);</div><div class='ctx'> 	exfat_truncate_atime(&amp;stat-&gt;atime);</div><div class='ctx'> 	stat-&gt;result_mask |= STATX_BTIME;</div><div class='ctx'> 	stat-&gt;btime.tv_sec = ei-&gt;i_crtime.tv_sec;</div><div class='hunk'>@@ -284,7 +281,7 @@ int exfat_getattr(struct user_namespace *mnt_uerns, const struct path *path,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int exfat_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='add'>+int exfat_setattr(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		  struct iattr *attr)</div><div class='ctx'> {</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(dentry-&gt;d_sb);</div><div class='hunk'>@@ -292,6 +289,9 @@ int exfat_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 	unsigned int ia_valid;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='add'>+	if (unlikely(exfat_forced_shutdown(inode-&gt;i_sb)))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='ctx'> 	if ((attr-&gt;ia_valid &amp; ATTR_SIZE) &amp;&amp;</div><div class='ctx'> 	    attr-&gt;ia_size &gt; i_size_read(inode)) {</div><div class='ctx'> 		error = exfat_cont_expand(inode, attr-&gt;ia_size);</div><div class='hunk'>@@ -303,20 +303,22 @@ int exfat_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 	/* Check for setting the inode time. */</div><div class='ctx'> 	ia_valid = attr-&gt;ia_valid;</div><div class='ctx'> 	if ((ia_valid &amp; (ATTR_MTIME_SET | ATTR_ATIME_SET | ATTR_TIMES_SET)) &amp;&amp;</div><div class='del'>-	    exfat_allow_set_time(sbi, inode)) {</div><div class='add'>+	    exfat_allow_set_time(idmap, sbi, inode)) {</div><div class='ctx'> 		attr-&gt;ia_valid &amp;= ~(ATTR_MTIME_SET | ATTR_ATIME_SET |</div><div class='ctx'> 				ATTR_TIMES_SET);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	error = setattr_prepare(&amp;init_user_ns, dentry, attr);</div><div class='add'>+	error = setattr_prepare(idmap, dentry, attr);</div><div class='ctx'> 	attr-&gt;ia_valid = ia_valid;</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	if (((attr-&gt;ia_valid &amp; ATTR_UID) &amp;&amp;</div><div class='del'>-	     !uid_eq(attr-&gt;ia_uid, sbi-&gt;options.fs_uid)) ||</div><div class='add'>+	      (!uid_eq(from_vfsuid(idmap, i_user_ns(inode), attr-&gt;ia_vfsuid),</div><div class='add'>+	       sbi-&gt;options.fs_uid))) ||</div><div class='ctx'> 	    ((attr-&gt;ia_valid &amp; ATTR_GID) &amp;&amp;</div><div class='del'>-	     !gid_eq(attr-&gt;ia_gid, sbi-&gt;options.fs_gid)) ||</div><div class='add'>+	      (!gid_eq(from_vfsgid(idmap, i_user_ns(inode), attr-&gt;ia_vfsgid),</div><div class='add'>+	       sbi-&gt;options.fs_gid))) ||</div><div class='ctx'> 	    ((attr-&gt;ia_valid &amp; ATTR_MODE) &amp;&amp;</div><div class='ctx'> 	     (attr-&gt;ia_mode &amp; ~(S_IFREG | S_IFLNK | S_IFDIR | 0777)))) {</div><div class='ctx'> 		error = -EPERM;</div><div class='hunk'>@@ -332,6 +334,12 @@ int exfat_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 			attr-&gt;ia_valid &amp;= ~ATTR_MODE;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (attr-&gt;ia_valid &amp; ATTR_SIZE)</div><div class='add'>+		inode_set_mtime_to_ts(inode, inode_set_ctime_current(inode));</div><div class='add'>+</div><div class='add'>+	setattr_copy(idmap, inode, attr);</div><div class='add'>+	exfat_truncate_inode_atime(inode);</div><div class='add'>+</div><div class='ctx'> 	if (attr-&gt;ia_valid &amp; ATTR_SIZE) {</div><div class='ctx'> 		error = exfat_block_truncate_page(inode, attr-&gt;ia_size);</div><div class='ctx'> 		if (error)</div><div class='hunk'>@@ -339,35 +347,123 @@ int exfat_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> </div><div class='ctx'> 		down_write(&amp;EXFAT_I(inode)-&gt;truncate_lock);</div><div class='ctx'> 		truncate_setsize(inode, attr-&gt;ia_size);</div><div class='del'>-		exfat_truncate(inode, attr-&gt;ia_size);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * __exfat_write_inode() is called from exfat_truncate(), inode</div><div class='add'>+		 * is already written by it, so mark_inode_dirty() is unneeded.</div><div class='add'>+		 */</div><div class='add'>+		exfat_truncate(inode);</div><div class='ctx'> 		up_write(&amp;EXFAT_I(inode)-&gt;truncate_lock);</div><div class='add'>+	} else</div><div class='add'>+		mark_inode_dirty(inode);</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	return error;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * modified ioctls from fat/file.c by Welmer Almesberger</div><div class='add'>+ */</div><div class='add'>+static int exfat_ioctl_get_attributes(struct inode *inode, u32 __user *user_attr)</div><div class='add'>+{</div><div class='add'>+	u32 attr;</div><div class='add'>+</div><div class='add'>+	inode_lock_shared(inode);</div><div class='add'>+	attr = exfat_make_attr(inode);</div><div class='add'>+	inode_unlock_shared(inode);</div><div class='add'>+</div><div class='add'>+	return put_user(attr, user_attr);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int exfat_ioctl_set_attributes(struct file *file, u32 __user *user_attr)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='add'>+	struct exfat_sb_info *sbi = EXFAT_SB(inode-&gt;i_sb);</div><div class='add'>+	int is_dir = S_ISDIR(inode-&gt;i_mode);</div><div class='add'>+	u32 attr, oldattr;</div><div class='add'>+	struct iattr ia;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = get_user(attr, user_attr);</div><div class='add'>+	if (err)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	err = mnt_want_write_file(file);</div><div class='add'>+	if (err)</div><div class='add'>+		goto out;</div><div class='add'>+	inode_lock(inode);</div><div class='add'>+</div><div class='add'>+	oldattr = exfat_make_attr(inode);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Mask attributes so we don't set reserved fields.</div><div class='add'>+	 */</div><div class='add'>+	attr &amp;= (EXFAT_ATTR_READONLY | EXFAT_ATTR_HIDDEN | EXFAT_ATTR_SYSTEM |</div><div class='add'>+		 EXFAT_ATTR_ARCHIVE);</div><div class='add'>+	attr |= (is_dir ? EXFAT_ATTR_SUBDIR : 0);</div><div class='add'>+</div><div class='add'>+	/* Equivalent to a chmod() */</div><div class='add'>+	ia.ia_valid = ATTR_MODE | ATTR_CTIME;</div><div class='add'>+	ia.ia_ctime = current_time(inode);</div><div class='add'>+	if (is_dir)</div><div class='add'>+		ia.ia_mode = exfat_make_mode(sbi, attr, 0777);</div><div class='add'>+	else</div><div class='add'>+		ia.ia_mode = exfat_make_mode(sbi, attr, 0666 | (inode-&gt;i_mode &amp; 0111));</div><div class='add'>+</div><div class='add'>+	/* The root directory has no attributes */</div><div class='add'>+	if (inode-&gt;i_ino == EXFAT_ROOT_INO &amp;&amp; attr != EXFAT_ATTR_SUBDIR) {</div><div class='add'>+		err = -EINVAL;</div><div class='add'>+		goto out_unlock_inode;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	setattr_copy(&amp;init_user_ns, inode, attr);</div><div class='del'>-	exfat_truncate_atime(&amp;inode-&gt;i_atime);</div><div class='del'>-	mark_inode_dirty(inode);</div><div class='add'>+	if (((attr | oldattr) &amp; EXFAT_ATTR_SYSTEM) &amp;&amp;</div><div class='add'>+	    !capable(CAP_LINUX_IMMUTABLE)) {</div><div class='add'>+		err = -EPERM;</div><div class='add'>+		goto out_unlock_inode;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * The security check is questionable...  We single</div><div class='add'>+	 * out the RO attribute for checking by the security</div><div class='add'>+	 * module, just because it maps to a file mode.</div><div class='add'>+	 */</div><div class='add'>+	err = security_inode_setattr(file_mnt_idmap(file),</div><div class='add'>+				     file-&gt;f_path.dentry, &amp;ia);</div><div class='add'>+	if (err)</div><div class='add'>+		goto out_unlock_inode;</div><div class='add'>+</div><div class='add'>+	/* This MUST be done before doing anything irreversible... */</div><div class='add'>+	err = exfat_setattr(file_mnt_idmap(file), file-&gt;f_path.dentry, &amp;ia);</div><div class='add'>+	if (err)</div><div class='add'>+		goto out_unlock_inode;</div><div class='add'>+</div><div class='add'>+	fsnotify_change(file-&gt;f_path.dentry, ia.ia_valid);</div><div class='add'>+</div><div class='add'>+	exfat_save_attr(inode, attr);</div><div class='add'>+	mark_inode_dirty(inode);</div><div class='add'>+out_unlock_inode:</div><div class='add'>+	inode_unlock(inode);</div><div class='add'>+	mnt_drop_write_file(file);</div><div class='ctx'> out:</div><div class='del'>-	return error;</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int exfat_ioctl_fitrim(struct inode *inode, unsigned long arg)</div><div class='ctx'> {</div><div class='del'>-	struct request_queue *q = bdev_get_queue(inode-&gt;i_sb-&gt;s_bdev);</div><div class='ctx'> 	struct fstrim_range range;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (!capable(CAP_SYS_ADMIN))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='del'>-	if (!blk_queue_discard(q))</div><div class='add'>+	if (!bdev_max_discard_sectors(inode-&gt;i_sb-&gt;s_bdev))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='ctx'> 	if (copy_from_user(&amp;range, (struct fstrim_range __user *)arg, sizeof(range)))</div><div class='ctx'> 		return -EFAULT;</div><div class='ctx'> </div><div class='ctx'> 	range.minlen = max_t(unsigned int, range.minlen,</div><div class='del'>-				q-&gt;limits.discard_granularity);</div><div class='add'>+				bdev_discard_granularity(inode-&gt;i_sb-&gt;s_bdev));</div><div class='ctx'> </div><div class='ctx'> 	ret = exfat_trim_fs(inode, &amp;range);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='hunk'>@@ -379,13 +475,86 @@ static int exfat_ioctl_fitrim(struct inode *inode, unsigned long arg)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int exfat_ioctl_shutdown(struct super_block *sb, unsigned long arg)</div><div class='add'>+{</div><div class='add'>+	u32 flags;</div><div class='add'>+</div><div class='add'>+	if (!capable(CAP_SYS_ADMIN))</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	if (get_user(flags, (__u32 __user *)arg))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+</div><div class='add'>+	return exfat_force_shutdown(sb, flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int exfat_ioctl_get_volume_label(struct super_block *sb, unsigned long arg)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+	char label[FSLABEL_MAX] = {0};</div><div class='add'>+	struct exfat_uni_name uniname;</div><div class='add'>+</div><div class='add'>+	ret = exfat_read_volume_label(sb, &amp;uniname);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	ret = exfat_utf16_to_nls(sb, &amp;uniname, label, uniname.name_len);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	if (copy_to_user((char __user *)arg, label, ret + 1))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int exfat_ioctl_set_volume_label(struct super_block *sb,</div><div class='add'>+					unsigned long arg)</div><div class='add'>+{</div><div class='add'>+	int ret = 0, lossy, label_len;</div><div class='add'>+	char label[FSLABEL_MAX] = {0};</div><div class='add'>+	struct exfat_uni_name uniname;</div><div class='add'>+</div><div class='add'>+	if (!capable(CAP_SYS_ADMIN))</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	if (copy_from_user(label, (char __user *)arg, FSLABEL_MAX))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+</div><div class='add'>+	memset(&amp;uniname, 0, sizeof(uniname));</div><div class='add'>+	label_len = strnlen(label, FSLABEL_MAX - 1);</div><div class='add'>+	if (label[0]) {</div><div class='add'>+		ret = exfat_nls_to_utf16(sb, label, label_len,</div><div class='add'>+					 &amp;uniname, &amp;lossy);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='add'>+		else if (lossy &amp; NLS_NAME_LOSSY)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	uniname.name_len = ret;</div><div class='add'>+</div><div class='add'>+	return exfat_write_volume_label(sb, &amp;uniname);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> long exfat_ioctl(struct file *filp, unsigned int cmd, unsigned long arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(filp);</div><div class='add'>+	u32 __user *user_attr = (u32 __user *)arg;</div><div class='ctx'> </div><div class='ctx'> 	switch (cmd) {</div><div class='add'>+	case FAT_IOCTL_GET_ATTRIBUTES:</div><div class='add'>+		return exfat_ioctl_get_attributes(inode, user_attr);</div><div class='add'>+	case FAT_IOCTL_SET_ATTRIBUTES:</div><div class='add'>+		return exfat_ioctl_set_attributes(filp, user_attr);</div><div class='add'>+	case EXFAT_IOC_SHUTDOWN:</div><div class='add'>+		return exfat_ioctl_shutdown(inode-&gt;i_sb, arg);</div><div class='ctx'> 	case FITRIM:</div><div class='ctx'> 		return exfat_ioctl_fitrim(inode, arg);</div><div class='add'>+	case FS_IOC_GETFSLABEL:</div><div class='add'>+		return exfat_ioctl_get_volume_label(inode-&gt;i_sb, arg);</div><div class='add'>+	case FS_IOC_SETFSLABEL:</div><div class='add'>+		return exfat_ioctl_set_volume_label(inode-&gt;i_sb, arg);</div><div class='ctx'> 	default:</div><div class='ctx'> 		return -ENOTTY;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -404,6 +573,9 @@ int exfat_file_fsync(struct file *filp, loff_t start, loff_t end, int datasync)</div><div class='ctx'> 	struct inode *inode = filp-&gt;f_mapping-&gt;host;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='add'>+	if (unlikely(exfat_forced_shutdown(inode-&gt;i_sb)))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='ctx'> 	err = __generic_file_fsync(filp, start, end, datasync);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='hunk'>@@ -415,17 +587,190 @@ int exfat_file_fsync(struct file *filp, loff_t start, loff_t end, int datasync)</div><div class='ctx'> 	return blkdev_issue_flush(inode-&gt;i_sb-&gt;s_bdev);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int exfat_extend_valid_size(struct inode *inode, loff_t new_valid_size)</div><div class='add'>+{</div><div class='add'>+	int err;</div><div class='add'>+	loff_t pos;</div><div class='add'>+	struct exfat_inode_info *ei = EXFAT_I(inode);</div><div class='add'>+	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='add'>+	const struct address_space_operations *ops = mapping-&gt;a_ops;</div><div class='add'>+</div><div class='add'>+	pos = ei-&gt;valid_size;</div><div class='add'>+	while (pos &lt; new_valid_size) {</div><div class='add'>+		u32 len;</div><div class='add'>+		struct folio *folio;</div><div class='add'>+		unsigned long off;</div><div class='add'>+</div><div class='add'>+		len = PAGE_SIZE - (pos &amp; (PAGE_SIZE - 1));</div><div class='add'>+		if (pos + len &gt; new_valid_size)</div><div class='add'>+			len = new_valid_size - pos;</div><div class='add'>+</div><div class='add'>+		err = ops-&gt;write_begin(NULL, mapping, pos, len, &amp;folio, NULL);</div><div class='add'>+		if (err)</div><div class='add'>+			goto out;</div><div class='add'>+</div><div class='add'>+		off = offset_in_folio(folio, pos);</div><div class='add'>+		folio_zero_new_buffers(folio, off, off + len);</div><div class='add'>+</div><div class='add'>+		err = ops-&gt;write_end(NULL, mapping, pos, len, len, folio, NULL);</div><div class='add'>+		if (err &lt; 0)</div><div class='add'>+			goto out;</div><div class='add'>+		pos += len;</div><div class='add'>+</div><div class='add'>+		balance_dirty_pages_ratelimited(mapping);</div><div class='add'>+		cond_resched();</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t exfat_file_write_iter(struct kiocb *iocb, struct iov_iter *iter)</div><div class='add'>+{</div><div class='add'>+	ssize_t ret;</div><div class='add'>+	struct file *file = iocb-&gt;ki_filp;</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='add'>+	struct exfat_inode_info *ei = EXFAT_I(inode);</div><div class='add'>+	loff_t pos = iocb-&gt;ki_pos;</div><div class='add'>+	loff_t valid_size;</div><div class='add'>+</div><div class='add'>+	if (unlikely(exfat_forced_shutdown(inode-&gt;i_sb)))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	inode_lock(inode);</div><div class='add'>+</div><div class='add'>+	if (pos &gt; i_size_read(inode))</div><div class='add'>+		truncate_pagecache(inode, i_size_read(inode));</div><div class='add'>+</div><div class='add'>+	valid_size = ei-&gt;valid_size;</div><div class='add'>+</div><div class='add'>+	ret = generic_write_checks(iocb, iter);</div><div class='add'>+	if (ret &lt;= 0)</div><div class='add'>+		goto unlock;</div><div class='add'>+</div><div class='add'>+	if (iocb-&gt;ki_flags &amp; IOCB_DIRECT) {</div><div class='add'>+		unsigned long align = pos | iov_iter_alignment(iter);</div><div class='add'>+</div><div class='add'>+		if (!IS_ALIGNED(align, i_blocksize(inode)) &amp;&amp;</div><div class='add'>+		    !IS_ALIGNED(align, bdev_logical_block_size(inode-&gt;i_sb-&gt;s_bdev))) {</div><div class='add'>+			ret = -EINVAL;</div><div class='add'>+			goto unlock;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (pos &gt; valid_size) {</div><div class='add'>+		ret = exfat_extend_valid_size(inode, pos);</div><div class='add'>+		if (ret &lt; 0 &amp;&amp; ret != -ENOSPC) {</div><div class='add'>+			exfat_err(inode-&gt;i_sb,</div><div class='add'>+				"write: fail to zero from %llu to %llu(%zd)",</div><div class='add'>+				valid_size, pos, ret);</div><div class='add'>+		}</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto unlock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = __generic_file_write_iter(iocb, iter);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto unlock;</div><div class='add'>+</div><div class='add'>+	inode_unlock(inode);</div><div class='add'>+</div><div class='add'>+	if (pos &gt; valid_size)</div><div class='add'>+		pos = valid_size;</div><div class='add'>+</div><div class='add'>+	if (iocb-&gt;ki_pos &gt; pos) {</div><div class='add'>+		ssize_t err = generic_write_sync(iocb, iocb-&gt;ki_pos - pos);</div><div class='add'>+		if (err &lt; 0)</div><div class='add'>+			return err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+</div><div class='add'>+unlock:</div><div class='add'>+	inode_unlock(inode);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t exfat_file_read_iter(struct kiocb *iocb, struct iov_iter *iter)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='add'>+</div><div class='add'>+	if (unlikely(exfat_forced_shutdown(inode-&gt;i_sb)))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	return generic_file_read_iter(iocb, iter);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static vm_fault_t exfat_page_mkwrite(struct vm_fault *vmf)</div><div class='add'>+{</div><div class='add'>+	int err;</div><div class='add'>+	struct vm_area_struct *vma = vmf-&gt;vma;</div><div class='add'>+	struct file *file = vma-&gt;vm_file;</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='add'>+	struct exfat_inode_info *ei = EXFAT_I(inode);</div><div class='add'>+	loff_t start, end;</div><div class='add'>+</div><div class='add'>+	if (!inode_trylock(inode))</div><div class='add'>+		return VM_FAULT_RETRY;</div><div class='add'>+</div><div class='add'>+	start = ((loff_t)vma-&gt;vm_pgoff &lt;&lt; PAGE_SHIFT);</div><div class='add'>+	end = min_t(loff_t, i_size_read(inode),</div><div class='add'>+			start + vma-&gt;vm_end - vma-&gt;vm_start);</div><div class='add'>+</div><div class='add'>+	if (ei-&gt;valid_size &lt; end) {</div><div class='add'>+		err = exfat_extend_valid_size(inode, end);</div><div class='add'>+		if (err &lt; 0) {</div><div class='add'>+			inode_unlock(inode);</div><div class='add'>+			return vmf_fs_error(err);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	inode_unlock(inode);</div><div class='add'>+</div><div class='add'>+	return filemap_page_mkwrite(vmf);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct vm_operations_struct exfat_file_vm_ops = {</div><div class='add'>+	.fault		= filemap_fault,</div><div class='add'>+	.map_pages	= filemap_map_pages,</div><div class='add'>+	.page_mkwrite	= exfat_page_mkwrite,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int exfat_file_mmap_prepare(struct vm_area_desc *desc)</div><div class='add'>+{</div><div class='add'>+	struct file *file = desc-&gt;file;</div><div class='add'>+</div><div class='add'>+	if (unlikely(exfat_forced_shutdown(file_inode(desc-&gt;file)-&gt;i_sb)))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	file_accessed(file);</div><div class='add'>+	desc-&gt;vm_ops = &amp;exfat_file_vm_ops;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t exfat_splice_read(struct file *in, loff_t *ppos,</div><div class='add'>+		struct pipe_inode_info *pipe, size_t len, unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	if (unlikely(exfat_forced_shutdown(file_inode(in)-&gt;i_sb)))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	return filemap_splice_read(in, ppos, pipe, len, flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> const struct file_operations exfat_file_operations = {</div><div class='ctx'> 	.llseek		= generic_file_llseek,</div><div class='del'>-	.read_iter	= generic_file_read_iter,</div><div class='del'>-	.write_iter	= generic_file_write_iter,</div><div class='add'>+	.read_iter	= exfat_file_read_iter,</div><div class='add'>+	.write_iter	= exfat_file_write_iter,</div><div class='ctx'> 	.unlocked_ioctl = exfat_ioctl,</div><div class='ctx'> #ifdef CONFIG_COMPAT</div><div class='ctx'> 	.compat_ioctl = exfat_compat_ioctl,</div><div class='ctx'> #endif</div><div class='del'>-	.mmap		= generic_file_mmap,</div><div class='add'>+	.mmap_prepare	= exfat_file_mmap_prepare,</div><div class='ctx'> 	.fsync		= exfat_file_fsync,</div><div class='del'>-	.splice_read	= generic_file_splice_read,</div><div class='add'>+	.splice_read	= exfat_splice_read,</div><div class='ctx'> 	.splice_write	= iter_file_splice_write,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='head'>diff --git a/fs/exfat/inode.c b/fs/exfat/inode.c<br/>index 1c7aa1ea4724..f9501c3a3666 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/exfat/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exfat/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/exfat/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/exfat/inode.c</a></div><div class='hunk'>@@ -17,21 +17,22 @@</div><div class='ctx'> #include "exfat_raw.h"</div><div class='ctx'> #include "exfat_fs.h"</div><div class='ctx'> </div><div class='del'>-static int __exfat_write_inode(struct inode *inode, int sync)</div><div class='add'>+int __exfat_write_inode(struct inode *inode, int sync)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned long long on_disk_size;</div><div class='ctx'> 	struct exfat_dentry *ep, *ep2;</div><div class='del'>-	struct exfat_entry_set_cache *es = NULL;</div><div class='add'>+	struct exfat_entry_set_cache es;</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='ctx'> 	struct exfat_inode_info *ei = EXFAT_I(inode);</div><div class='del'>-	bool is_dir = (ei-&gt;type == TYPE_DIR) ? true : false;</div><div class='add'>+	bool is_dir = (ei-&gt;type == TYPE_DIR);</div><div class='add'>+	struct timespec64 ts;</div><div class='ctx'> </div><div class='ctx'> 	if (inode-&gt;i_ino == EXFAT_ROOT_INO)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * If the indode is already unlinked, there is no need for updating it.</div><div class='add'>+	 * If the inode is already unlinked, there is no need for updating it.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (ei-&gt;dir.dir == DIR_DELETED)</div><div class='ctx'> 		return 0;</div><div class='hunk'>@@ -42,11 +43,10 @@ static int __exfat_write_inode(struct inode *inode, int sync)</div><div class='ctx'> 	exfat_set_volume_dirty(sb);</div><div class='ctx'> </div><div class='ctx'> 	/* get the directory entry of given file or directory */</div><div class='del'>-	es = exfat_get_dentry_set(sb, &amp;(ei-&gt;dir), ei-&gt;entry, ES_ALL_ENTRIES);</div><div class='del'>-	if (!es)</div><div class='add'>+	if (exfat_get_dentry_set_by_ei(&amp;es, sb, ei))</div><div class='ctx'> 		return -EIO;</div><div class='del'>-	ep = exfat_get_dentry_cached(es, 0);</div><div class='del'>-	ep2 = exfat_get_dentry_cached(es, 1);</div><div class='add'>+	ep = exfat_get_dentry_cached(&amp;es, ES_IDX_FILE);</div><div class='add'>+	ep2 = exfat_get_dentry_cached(&amp;es, ES_IDX_STREAM);</div><div class='ctx'> </div><div class='ctx'> 	ep-&gt;dentry.file.attr = cpu_to_le16(exfat_make_attr(inode));</div><div class='ctx'> </div><div class='hunk'>@@ -56,16 +56,18 @@ static int __exfat_write_inode(struct inode *inode, int sync)</div><div class='ctx'> 			&amp;ep-&gt;dentry.file.create_time,</div><div class='ctx'> 			&amp;ep-&gt;dentry.file.create_date,</div><div class='ctx'> 			&amp;ep-&gt;dentry.file.create_time_cs);</div><div class='del'>-	exfat_set_entry_time(sbi, &amp;inode-&gt;i_mtime,</div><div class='del'>-			&amp;ep-&gt;dentry.file.modify_tz,</div><div class='del'>-			&amp;ep-&gt;dentry.file.modify_time,</div><div class='del'>-			&amp;ep-&gt;dentry.file.modify_date,</div><div class='del'>-			&amp;ep-&gt;dentry.file.modify_time_cs);</div><div class='del'>-	exfat_set_entry_time(sbi, &amp;inode-&gt;i_atime,</div><div class='del'>-			&amp;ep-&gt;dentry.file.access_tz,</div><div class='del'>-			&amp;ep-&gt;dentry.file.access_time,</div><div class='del'>-			&amp;ep-&gt;dentry.file.access_date,</div><div class='del'>-			NULL);</div><div class='add'>+	ts = inode_get_mtime(inode);</div><div class='add'>+	exfat_set_entry_time(sbi, &amp;ts,</div><div class='add'>+			     &amp;ep-&gt;dentry.file.modify_tz,</div><div class='add'>+			     &amp;ep-&gt;dentry.file.modify_time,</div><div class='add'>+			     &amp;ep-&gt;dentry.file.modify_date,</div><div class='add'>+			     &amp;ep-&gt;dentry.file.modify_time_cs);</div><div class='add'>+	ts = inode_get_atime(inode);</div><div class='add'>+	exfat_set_entry_time(sbi, &amp;ts,</div><div class='add'>+			     &amp;ep-&gt;dentry.file.access_tz,</div><div class='add'>+			     &amp;ep-&gt;dentry.file.access_time,</div><div class='add'>+			     &amp;ep-&gt;dentry.file.access_date,</div><div class='add'>+			     NULL);</div><div class='ctx'> </div><div class='ctx'> 	/* File size should be zero if there is no cluster allocated */</div><div class='ctx'> 	on_disk_size = i_size_read(inode);</div><div class='hunk'>@@ -73,17 +75,36 @@ static int __exfat_write_inode(struct inode *inode, int sync)</div><div class='ctx'> 	if (ei-&gt;start_clu == EXFAT_EOF_CLUSTER)</div><div class='ctx'> 		on_disk_size = 0;</div><div class='ctx'> </div><div class='del'>-	ep2-&gt;dentry.stream.valid_size = cpu_to_le64(on_disk_size);</div><div class='del'>-	ep2-&gt;dentry.stream.size = ep2-&gt;dentry.stream.valid_size;</div><div class='add'>+	ep2-&gt;dentry.stream.size = cpu_to_le64(on_disk_size);</div><div class='add'>+	/*</div><div class='add'>+	 * mmap write does not use exfat_write_end(), valid_size may be</div><div class='add'>+	 * extended to the sector-aligned length in exfat_get_block().</div><div class='add'>+	 * So we need to fixup valid_size to the writren length.</div><div class='add'>+	 */</div><div class='add'>+	if (on_disk_size &lt; ei-&gt;valid_size)</div><div class='add'>+		ep2-&gt;dentry.stream.valid_size = ep2-&gt;dentry.stream.size;</div><div class='add'>+	else</div><div class='add'>+		ep2-&gt;dentry.stream.valid_size = cpu_to_le64(ei-&gt;valid_size);</div><div class='add'>+</div><div class='add'>+	if (on_disk_size) {</div><div class='add'>+		ep2-&gt;dentry.stream.flags = ei-&gt;flags;</div><div class='add'>+		ep2-&gt;dentry.stream.start_clu = cpu_to_le32(ei-&gt;start_clu);</div><div class='add'>+	} else {</div><div class='add'>+		ep2-&gt;dentry.stream.flags = ALLOC_FAT_CHAIN;</div><div class='add'>+		ep2-&gt;dentry.stream.start_clu = EXFAT_FREE_CLUSTER;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	exfat_update_dir_chksum_with_entry_set(es);</div><div class='del'>-	return exfat_free_dentry_set(es, sync);</div><div class='add'>+	exfat_update_dir_chksum(&amp;es);</div><div class='add'>+	return exfat_put_dentry_set(&amp;es, sync);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int exfat_write_inode(struct inode *inode, struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='add'>+	if (unlikely(exfat_forced_shutdown(inode-&gt;i_sb)))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='ctx'> 	mutex_lock(&amp;EXFAT_SB(inode-&gt;i_sb)-&gt;s_lock);</div><div class='ctx'> 	ret = __exfat_write_inode(inode, wbc-&gt;sync_mode == WB_SYNC_ALL);</div><div class='ctx'> 	mutex_unlock(&amp;EXFAT_SB(inode-&gt;i_sb)-&gt;s_lock);</div><div class='hunk'>@@ -105,19 +126,16 @@ void exfat_sync_inode(struct inode *inode)</div><div class='ctx'> static int exfat_map_cluster(struct inode *inode, unsigned int clu_offset,</div><div class='ctx'> 		unsigned int *clu, int create)</div><div class='ctx'> {</div><div class='del'>-	int ret, modified = false;</div><div class='add'>+	int ret;</div><div class='ctx'> 	unsigned int last_clu;</div><div class='ctx'> 	struct exfat_chain new_clu;</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='ctx'> 	struct exfat_inode_info *ei = EXFAT_I(inode);</div><div class='ctx'> 	unsigned int local_clu_offset = clu_offset;</div><div class='del'>-	unsigned int num_to_be_allocated = 0, num_clusters = 0;</div><div class='add'>+	unsigned int num_to_be_allocated = 0, num_clusters;</div><div class='ctx'> </div><div class='del'>-	if (EXFAT_I(inode)-&gt;i_size_ondisk &gt; 0)</div><div class='del'>-		num_clusters =</div><div class='del'>-			EXFAT_B_TO_CLU_ROUND_UP(EXFAT_I(inode)-&gt;i_size_ondisk,</div><div class='del'>-			sbi);</div><div class='add'>+	num_clusters = EXFAT_B_TO_CLU(exfat_ondisk_size(inode), sbi);</div><div class='ctx'> </div><div class='ctx'> 	if (clu_offset &gt;= num_clusters)</div><div class='ctx'> 		num_to_be_allocated = clu_offset - num_clusters + 1;</div><div class='hunk'>@@ -197,7 +215,6 @@ static int exfat_map_cluster(struct inode *inode, unsigned int clu_offset,</div><div class='ctx'> 			if (new_clu.flags == ALLOC_FAT_CHAIN)</div><div class='ctx'> 				ei-&gt;flags = ALLOC_FAT_CHAIN;</div><div class='ctx'> 			ei-&gt;start_clu = new_clu.dir;</div><div class='del'>-			modified = true;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			if (new_clu.flags != ei-&gt;flags) {</div><div class='ctx'> 				/* no-fat-chain bit is disabled,</div><div class='hunk'>@@ -207,7 +224,6 @@ static int exfat_map_cluster(struct inode *inode, unsigned int clu_offset,</div><div class='ctx'> 				exfat_chain_cont_cluster(sb, ei-&gt;start_clu,</div><div class='ctx'> 					num_clusters);</div><div class='ctx'> 				ei-&gt;flags = ALLOC_FAT_CHAIN;</div><div class='del'>-				modified = true;</div><div class='ctx'> 			}</div><div class='ctx'> 			if (new_clu.flags == ALLOC_FAT_CHAIN)</div><div class='ctx'> 				if (exfat_ent_set(sb, last_clu, new_clu.dir))</div><div class='hunk'>@@ -217,35 +233,7 @@ static int exfat_map_cluster(struct inode *inode, unsigned int clu_offset,</div><div class='ctx'> 		num_clusters += num_to_be_allocated;</div><div class='ctx'> 		*clu = new_clu.dir;</div><div class='ctx'> </div><div class='del'>-		if (ei-&gt;dir.dir != DIR_DELETED &amp;&amp; modified) {</div><div class='del'>-			struct exfat_dentry *ep;</div><div class='del'>-			struct exfat_entry_set_cache *es;</div><div class='del'>-			int err;</div><div class='del'>-</div><div class='del'>-			es = exfat_get_dentry_set(sb, &amp;(ei-&gt;dir), ei-&gt;entry,</div><div class='del'>-				ES_ALL_ENTRIES);</div><div class='del'>-			if (!es)</div><div class='del'>-				return -EIO;</div><div class='del'>-			/* get stream entry */</div><div class='del'>-			ep = exfat_get_dentry_cached(es, 1);</div><div class='del'>-</div><div class='del'>-			/* update directory entry */</div><div class='del'>-			ep-&gt;dentry.stream.flags = ei-&gt;flags;</div><div class='del'>-			ep-&gt;dentry.stream.start_clu =</div><div class='del'>-				cpu_to_le32(ei-&gt;start_clu);</div><div class='del'>-			ep-&gt;dentry.stream.valid_size =</div><div class='del'>-				cpu_to_le64(i_size_read(inode));</div><div class='del'>-			ep-&gt;dentry.stream.size =</div><div class='del'>-				ep-&gt;dentry.stream.valid_size;</div><div class='del'>-</div><div class='del'>-			exfat_update_dir_chksum_with_entry_set(es);</div><div class='del'>-			err = exfat_free_dentry_set(es, inode_needs_sync(inode));</div><div class='del'>-			if (err)</div><div class='del'>-				return err;</div><div class='del'>-		} /* end of if != DIR_DELETED */</div><div class='del'>-</div><div class='del'>-		inode-&gt;i_blocks +=</div><div class='del'>-			num_to_be_allocated &lt;&lt; sbi-&gt;sect_per_clus_bits;</div><div class='add'>+		inode-&gt;i_blocks += EXFAT_CLU_TO_B(num_to_be_allocated, sbi) &gt;&gt; 9;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Move *clu pointer along FAT chains (hole care) because the</div><div class='hunk'>@@ -273,21 +261,6 @@ static int exfat_map_cluster(struct inode *inode, unsigned int clu_offset,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int exfat_map_new_buffer(struct exfat_inode_info *ei,</div><div class='del'>-		struct buffer_head *bh, loff_t pos)</div><div class='del'>-{</div><div class='del'>-	if (buffer_delay(bh) &amp;&amp; pos &gt; ei-&gt;i_size_aligned)</div><div class='del'>-		return -EIO;</div><div class='del'>-	set_buffer_new(bh);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Adjust i_size_aligned if i_size_ondisk is bigger than it.</div><div class='del'>-	 */</div><div class='del'>-	if (ei-&gt;i_size_ondisk &gt; ei-&gt;i_size_aligned)</div><div class='del'>-		ei-&gt;i_size_aligned = ei-&gt;i_size_ondisk;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int exfat_get_block(struct inode *inode, sector_t iblock,</div><div class='ctx'> 		struct buffer_head *bh_result, int create)</div><div class='ctx'> {</div><div class='hunk'>@@ -300,10 +273,12 @@ static int exfat_get_block(struct inode *inode, sector_t iblock,</div><div class='ctx'> 	unsigned int cluster, sec_offset;</div><div class='ctx'> 	sector_t last_block;</div><div class='ctx'> 	sector_t phys = 0;</div><div class='del'>-	loff_t pos;</div><div class='add'>+	sector_t valid_blks;</div><div class='add'>+	loff_t i_size;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;sbi-&gt;s_lock);</div><div class='del'>-	last_block = EXFAT_B_TO_BLK_ROUND_UP(i_size_read(inode), sb);</div><div class='add'>+	i_size = i_size_read(inode);</div><div class='add'>+	last_block = EXFAT_B_TO_BLK_ROUND_UP(i_size, sb);</div><div class='ctx'> 	if (iblock &gt;= last_block &amp;&amp; !create)</div><div class='ctx'> 		goto done;</div><div class='ctx'> </div><div class='hunk'>@@ -328,54 +303,135 @@ static int exfat_get_block(struct inode *inode, sector_t iblock,</div><div class='ctx'> 	mapped_blocks = sbi-&gt;sect_per_clus - sec_offset;</div><div class='ctx'> 	max_blocks = min(mapped_blocks, max_blocks);</div><div class='ctx'> </div><div class='del'>-	/* Treat newly added block / cluster */</div><div class='del'>-	if (iblock &lt; last_block)</div><div class='del'>-		create = 0;</div><div class='add'>+	map_bh(bh_result, sb, phys);</div><div class='add'>+	if (buffer_delay(bh_result))</div><div class='add'>+		clear_buffer_delay(bh_result);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * In most cases, we just need to set bh_result to mapped, unmapped</div><div class='add'>+	 * or new status as follows:</div><div class='add'>+	 *  1. i_size == valid_size</div><div class='add'>+	 *  2. write case (create == 1)</div><div class='add'>+	 *  3. direct_read (!bh_result-&gt;b_folio)</div><div class='add'>+	 *     -&gt; the unwritten part will be zeroed in exfat_direct_IO()</div><div class='add'>+	 *</div><div class='add'>+	 * Otherwise, in the case of buffered read, it is necessary to take</div><div class='add'>+	 * care the last nested block if valid_size is not equal to i_size.</div><div class='add'>+	 */</div><div class='add'>+	if (i_size == ei-&gt;valid_size || create || !bh_result-&gt;b_folio)</div><div class='add'>+		valid_blks = EXFAT_B_TO_BLK_ROUND_UP(ei-&gt;valid_size, sb);</div><div class='add'>+	else</div><div class='add'>+		valid_blks = EXFAT_B_TO_BLK(ei-&gt;valid_size, sb);</div><div class='add'>+</div><div class='add'>+	/* The range has been fully written, map it */</div><div class='add'>+	if (iblock + max_blocks &lt; valid_blks)</div><div class='add'>+		goto done;</div><div class='ctx'> </div><div class='del'>-	if (create || buffer_delay(bh_result)) {</div><div class='del'>-		pos = EXFAT_BLK_TO_B((iblock + 1), sb);</div><div class='del'>-		if (ei-&gt;i_size_ondisk &lt; pos)</div><div class='del'>-			ei-&gt;i_size_ondisk = pos;</div><div class='add'>+	/* The range has been partially written, map the written part */</div><div class='add'>+	if (iblock &lt; valid_blks) {</div><div class='add'>+		max_blocks = valid_blks - iblock;</div><div class='add'>+		goto done;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/* The area has not been written, map and mark as new for create case */</div><div class='ctx'> 	if (create) {</div><div class='del'>-		err = exfat_map_new_buffer(ei, bh_result, pos);</div><div class='del'>-		if (err) {</div><div class='del'>-			exfat_fs_error(sb,</div><div class='del'>-					"requested for bmap out of range(pos : (%llu) &gt; i_size_aligned(%llu)\n",</div><div class='del'>-					pos, ei-&gt;i_size_aligned);</div><div class='del'>-			goto unlock_ret;</div><div class='add'>+		set_buffer_new(bh_result);</div><div class='add'>+		ei-&gt;valid_size = EXFAT_BLK_TO_B(iblock + max_blocks, sb);</div><div class='add'>+		mark_inode_dirty(inode);</div><div class='add'>+		goto done;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The area has just one block partially written.</div><div class='add'>+	 * In that case, we should read and fill the unwritten part of</div><div class='add'>+	 * a block with zero.</div><div class='add'>+	 */</div><div class='add'>+	if (bh_result-&gt;b_folio &amp;&amp; iblock == valid_blks &amp;&amp;</div><div class='add'>+	    (ei-&gt;valid_size &amp; (sb-&gt;s_blocksize - 1))) {</div><div class='add'>+		loff_t size, pos;</div><div class='add'>+		void *addr;</div><div class='add'>+</div><div class='add'>+		max_blocks = 1;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * No buffer_head is allocated.</div><div class='add'>+		 * (1) bmap: It's enough to set blocknr without I/O.</div><div class='add'>+		 * (2) read: The unwritten part should be filled with zero.</div><div class='add'>+		 *           If a folio does not have any buffers,</div><div class='add'>+		 *           let's returns -EAGAIN to fallback to</div><div class='add'>+		 *           block_read_full_folio() for per-bh IO.</div><div class='add'>+		 */</div><div class='add'>+		if (!folio_buffers(bh_result-&gt;b_folio)) {</div><div class='add'>+			err = -EAGAIN;</div><div class='add'>+			goto done;</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='add'>+		pos = EXFAT_BLK_TO_B(iblock, sb);</div><div class='add'>+		size = ei-&gt;valid_size - pos;</div><div class='add'>+		addr = folio_address(bh_result-&gt;b_folio) +</div><div class='add'>+			offset_in_folio(bh_result-&gt;b_folio, pos);</div><div class='add'>+</div><div class='add'>+		/* Check if bh-&gt;b_data points to proper addr in folio */</div><div class='add'>+		if (bh_result-&gt;b_data != addr) {</div><div class='add'>+			exfat_fs_error_ratelimit(sb,</div><div class='add'>+					"b_data(%p) != folio_addr(%p)",</div><div class='add'>+					bh_result-&gt;b_data, addr);</div><div class='add'>+			err = -EINVAL;</div><div class='add'>+			goto done;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* Read a block */</div><div class='add'>+		err = bh_read(bh_result, 0);</div><div class='add'>+		if (err &lt; 0)</div><div class='add'>+			goto done;</div><div class='add'>+</div><div class='add'>+		/* Zero unwritten part of a block */</div><div class='add'>+		memset(bh_result-&gt;b_data + size, 0, bh_result-&gt;b_size - size);</div><div class='add'>+		err = 0;</div><div class='add'>+		goto done;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (buffer_delay(bh_result))</div><div class='del'>-		clear_buffer_delay(bh_result);</div><div class='del'>-	map_bh(bh_result, sb, phys);</div><div class='add'>+	/*</div><div class='add'>+	 * The area has not been written, clear mapped for read/bmap cases.</div><div class='add'>+	 * If so, it will be filled with zero without reading from disk.</div><div class='add'>+	 */</div><div class='add'>+	clear_buffer_mapped(bh_result);</div><div class='ctx'> done:</div><div class='ctx'> 	bh_result-&gt;b_size = EXFAT_BLK_TO_B(max_blocks, sb);</div><div class='add'>+	if (err &lt; 0)</div><div class='add'>+		clear_buffer_mapped(bh_result);</div><div class='ctx'> unlock_ret:</div><div class='ctx'> 	mutex_unlock(&amp;sbi-&gt;s_lock);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int exfat_readpage(struct file *file, struct page *page)</div><div class='add'>+static int exfat_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	return mpage_readpage(page, exfat_get_block);</div><div class='add'>+	return mpage_read_folio(folio, exfat_get_block);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void exfat_readahead(struct readahead_control *rac)</div><div class='ctx'> {</div><div class='del'>-	mpage_readahead(rac, exfat_get_block);</div><div class='del'>-}</div><div class='add'>+	struct address_space *mapping = rac-&gt;mapping;</div><div class='add'>+	struct inode *inode = mapping-&gt;host;</div><div class='add'>+	struct exfat_inode_info *ei = EXFAT_I(inode);</div><div class='add'>+	loff_t pos = readahead_pos(rac);</div><div class='ctx'> </div><div class='del'>-static int exfat_writepage(struct page *page, struct writeback_control *wbc)</div><div class='del'>-{</div><div class='del'>-	return block_write_full_page(page, exfat_get_block, wbc);</div><div class='add'>+	/* Range cross valid_size, read it page by page. */</div><div class='add'>+	if (ei-&gt;valid_size &lt; i_size_read(inode) &amp;&amp;</div><div class='add'>+	    pos &lt;= ei-&gt;valid_size &amp;&amp;</div><div class='add'>+	    ei-&gt;valid_size &lt; pos + readahead_length(rac))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	mpage_readahead(rac, exfat_get_block);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int exfat_writepages(struct address_space *mapping,</div><div class='ctx'> 		struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='add'>+	if (unlikely(exfat_forced_shutdown(mapping-&gt;host-&gt;i_sb)))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='ctx'> 	return mpage_writepages(mapping, wbc, exfat_get_block);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -385,20 +441,22 @@ static void exfat_write_failed(struct address_space *mapping, loff_t to)</div><div class='ctx'> </div><div class='ctx'> 	if (to &gt; i_size_read(inode)) {</div><div class='ctx'> 		truncate_pagecache(inode, i_size_read(inode));</div><div class='del'>-		exfat_truncate(inode, EXFAT_I(inode)-&gt;i_size_aligned);</div><div class='add'>+		inode_set_mtime_to_ts(inode, inode_set_ctime_current(inode));</div><div class='add'>+		exfat_truncate(inode);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int exfat_write_begin(struct file *file, struct address_space *mapping,</div><div class='del'>-		loff_t pos, unsigned int len, unsigned int flags,</div><div class='del'>-		struct page **pagep, void **fsdata)</div><div class='add'>+static int exfat_write_begin(const struct kiocb *iocb,</div><div class='add'>+			     struct address_space *mapping,</div><div class='add'>+			     loff_t pos, unsigned int len,</div><div class='add'>+			     struct folio **foliop, void **fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	*pagep = NULL;</div><div class='del'>-	ret = cont_write_begin(file, mapping, pos, len, flags, pagep, fsdata,</div><div class='del'>-			       exfat_get_block,</div><div class='del'>-			       &amp;EXFAT_I(mapping-&gt;host)-&gt;i_size_ondisk);</div><div class='add'>+	if (unlikely(exfat_forced_shutdown(mapping-&gt;host-&gt;i_sb)))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	ret = block_write_begin(mapping, pos, len, foliop, exfat_get_block);</div><div class='ctx'> </div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		exfat_write_failed(mapping, pos+len);</div><div class='hunk'>@@ -406,29 +464,27 @@ static int exfat_write_begin(struct file *file, struct address_space *mapping,</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int exfat_write_end(struct file *file, struct address_space *mapping,</div><div class='del'>-		loff_t pos, unsigned int len, unsigned int copied,</div><div class='del'>-		struct page *pagep, void *fsdata)</div><div class='add'>+static int exfat_write_end(const struct kiocb *iocb,</div><div class='add'>+			   struct address_space *mapping,</div><div class='add'>+			   loff_t pos, unsigned int len, unsigned int copied,</div><div class='add'>+			   struct folio *folio, void *fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='ctx'> 	struct exfat_inode_info *ei = EXFAT_I(inode);</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	err = generic_write_end(file, mapping, pos, len, copied, pagep, fsdata);</div><div class='del'>-</div><div class='del'>-	if (EXFAT_I(inode)-&gt;i_size_aligned &lt; i_size_read(inode)) {</div><div class='del'>-		exfat_fs_error(inode-&gt;i_sb,</div><div class='del'>-			"invalid size(size(%llu) &gt; aligned(%llu)\n",</div><div class='del'>-			i_size_read(inode), EXFAT_I(inode)-&gt;i_size_aligned);</div><div class='del'>-		return -EIO;</div><div class='del'>-	}</div><div class='del'>-</div><div class='add'>+	err = generic_write_end(iocb, mapping, pos, len, copied, folio, fsdata);</div><div class='ctx'> 	if (err &lt; len)</div><div class='ctx'> 		exfat_write_failed(mapping, pos+len);</div><div class='ctx'> </div><div class='del'>-	if (!(err &lt; 0) &amp;&amp; !(ei-&gt;attr &amp; ATTR_ARCHIVE)) {</div><div class='del'>-		inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='del'>-		ei-&gt;attr |= ATTR_ARCHIVE;</div><div class='add'>+	if (!(err &lt; 0) &amp;&amp; pos + err &gt; ei-&gt;valid_size) {</div><div class='add'>+		ei-&gt;valid_size = pos + err;</div><div class='add'>+		mark_inode_dirty(inode);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!(err &lt; 0) &amp;&amp; !(ei-&gt;attr &amp; EXFAT_ATTR_ARCHIVE)) {</div><div class='add'>+		inode_set_mtime_to_ts(inode, inode_set_ctime_current(inode));</div><div class='add'>+		ei-&gt;attr |= EXFAT_ATTR_ARCHIVE;</div><div class='ctx'> 		mark_inode_dirty(inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -439,31 +495,41 @@ static ssize_t exfat_direct_IO(struct kiocb *iocb, struct iov_iter *iter)</div><div class='ctx'> {</div><div class='ctx'> 	struct address_space *mapping = iocb-&gt;ki_filp-&gt;f_mapping;</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='del'>-	loff_t size = iocb-&gt;ki_pos + iov_iter_count(iter);</div><div class='add'>+	struct exfat_inode_info *ei = EXFAT_I(inode);</div><div class='add'>+	loff_t pos = iocb-&gt;ki_pos;</div><div class='add'>+	loff_t size = pos + iov_iter_count(iter);</div><div class='ctx'> 	int rw = iov_iter_rw(iter);</div><div class='ctx'> 	ssize_t ret;</div><div class='ctx'> </div><div class='del'>-	if (rw == WRITE) {</div><div class='del'>-		/*</div><div class='del'>-		 * FIXME: blockdev_direct_IO() doesn't use -&gt;write_begin(),</div><div class='del'>-		 * so we need to update the -&gt;i_size_aligned to block boundary.</div><div class='del'>-		 *</div><div class='del'>-		 * But we must fill the remaining area or hole by nul for</div><div class='del'>-		 * updating -&gt;i_size_aligned</div><div class='del'>-		 *</div><div class='del'>-		 * Return 0, and fallback to normal buffered write.</div><div class='del'>-		 */</div><div class='del'>-		if (EXFAT_I(inode)-&gt;i_size_aligned &lt; size)</div><div class='del'>-			return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Need to use the DIO_LOCKING for avoiding the race</div><div class='ctx'> 	 * condition of exfat_get_block() and -&gt;truncate().</div><div class='ctx'> 	 */</div><div class='ctx'> 	ret = blockdev_direct_IO(iocb, inode, iter, exfat_get_block);</div><div class='del'>-	if (ret &lt; 0 &amp;&amp; (rw &amp; WRITE))</div><div class='del'>-		exfat_write_failed(mapping, size);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		if (rw == WRITE &amp;&amp; ret != -EIOCBQUEUED)</div><div class='add'>+			exfat_write_failed(mapping, size);</div><div class='add'>+</div><div class='add'>+		return ret;</div><div class='add'>+	} else</div><div class='add'>+		size = pos + ret;</div><div class='add'>+</div><div class='add'>+	if (rw == WRITE) {</div><div class='add'>+		/*</div><div class='add'>+		 * If the block had been partially written before this write,</div><div class='add'>+		 * -&gt;valid_size will not be updated in exfat_get_block(),</div><div class='add'>+		 * update it here.</div><div class='add'>+		 */</div><div class='add'>+		if (ei-&gt;valid_size &lt; size) {</div><div class='add'>+			ei-&gt;valid_size = size;</div><div class='add'>+			mark_inode_dirty(inode);</div><div class='add'>+		}</div><div class='add'>+	} else if (pos &lt; ei-&gt;valid_size &amp;&amp; ei-&gt;valid_size &lt; size) {</div><div class='add'>+		/* zero the unwritten part in the partially written block */</div><div class='add'>+		iov_iter_revert(iter, size - ei-&gt;valid_size);</div><div class='add'>+		iov_iter_zero(size - ei-&gt;valid_size, iter);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -491,15 +557,16 @@ int exfat_block_truncate_page(struct inode *inode, loff_t from)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct address_space_operations exfat_aops = {</div><div class='del'>-	.set_page_dirty	= __set_page_dirty_buffers,</div><div class='del'>-	.readpage	= exfat_readpage,</div><div class='add'>+	.dirty_folio	= block_dirty_folio,</div><div class='add'>+	.invalidate_folio = block_invalidate_folio,</div><div class='add'>+	.read_folio	= exfat_read_folio,</div><div class='ctx'> 	.readahead	= exfat_readahead,</div><div class='del'>-	.writepage	= exfat_writepage,</div><div class='ctx'> 	.writepages	= exfat_writepages,</div><div class='ctx'> 	.write_begin	= exfat_write_begin,</div><div class='ctx'> 	.write_end	= exfat_write_end,</div><div class='ctx'> 	.direct_IO	= exfat_direct_IO,</div><div class='del'>-	.bmap		= exfat_aop_bmap</div><div class='add'>+	.bmap		= exfat_aop_bmap,</div><div class='add'>+	.migrate_folio	= buffer_migrate_folio,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static inline unsigned long exfat_hash(loff_t i_pos)</div><div class='hunk'>@@ -562,6 +629,7 @@ static int exfat_fill_inode(struct inode *inode, struct exfat_dir_entry *info)</div><div class='ctx'> 	ei-&gt;start_clu = info-&gt;start_clu;</div><div class='ctx'> 	ei-&gt;flags = info-&gt;flags;</div><div class='ctx'> 	ei-&gt;type = info-&gt;type;</div><div class='add'>+	ei-&gt;valid_size = info-&gt;valid_size;</div><div class='ctx'> </div><div class='ctx'> 	ei-&gt;version = 0;</div><div class='ctx'> 	ei-&gt;hint_stat.eidx = 0;</div><div class='hunk'>@@ -573,9 +641,9 @@ static int exfat_fill_inode(struct inode *inode, struct exfat_dir_entry *info)</div><div class='ctx'> 	inode-&gt;i_uid = sbi-&gt;options.fs_uid;</div><div class='ctx'> 	inode-&gt;i_gid = sbi-&gt;options.fs_gid;</div><div class='ctx'> 	inode_inc_iversion(inode);</div><div class='del'>-	inode-&gt;i_generation = prandom_u32();</div><div class='add'>+	inode-&gt;i_generation = get_random_u32();</div><div class='ctx'> </div><div class='del'>-	if (info-&gt;attr &amp; ATTR_SUBDIR) { /* directory */</div><div class='add'>+	if (info-&gt;attr &amp; EXFAT_ATTR_SUBDIR) { /* directory */</div><div class='ctx'> 		inode-&gt;i_generation &amp;= ~1;</div><div class='ctx'> 		inode-&gt;i_mode = exfat_make_mode(sbi, info-&gt;attr, 0777);</div><div class='ctx'> 		inode-&gt;i_op = &amp;exfat_dir_inode_operations;</div><div class='hunk'>@@ -592,23 +660,13 @@ static int exfat_fill_inode(struct inode *inode, struct exfat_dir_entry *info)</div><div class='ctx'> </div><div class='ctx'> 	i_size_write(inode, size);</div><div class='ctx'> </div><div class='del'>-	/* ondisk and aligned size should be aligned with block size */</div><div class='del'>-	if (size &amp; (inode-&gt;i_sb-&gt;s_blocksize - 1)) {</div><div class='del'>-		size |= (inode-&gt;i_sb-&gt;s_blocksize - 1);</div><div class='del'>-		size++;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ei-&gt;i_size_aligned = size;</div><div class='del'>-	ei-&gt;i_size_ondisk = size;</div><div class='del'>-</div><div class='ctx'> 	exfat_save_attr(inode, info-&gt;attr);</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_blocks = ((i_size_read(inode) + (sbi-&gt;cluster_size - 1)) &amp;</div><div class='del'>-		~((loff_t)sbi-&gt;cluster_size - 1)) &gt;&gt; inode-&gt;i_blkbits;</div><div class='del'>-	inode-&gt;i_mtime = info-&gt;mtime;</div><div class='del'>-	inode-&gt;i_ctime = info-&gt;mtime;</div><div class='add'>+	inode-&gt;i_blocks = round_up(i_size_read(inode), sbi-&gt;cluster_size) &gt;&gt; 9;</div><div class='add'>+	inode_set_mtime_to_ts(inode, info-&gt;mtime);</div><div class='add'>+	inode_set_ctime_to_ts(inode, info-&gt;mtime);</div><div class='ctx'> 	ei-&gt;i_crtime = info-&gt;crtime;</div><div class='del'>-	inode-&gt;i_atime = info-&gt;atime;</div><div class='add'>+	inode_set_atime_to_ts(inode, info-&gt;atime);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -648,7 +706,7 @@ void exfat_evict_inode(struct inode *inode)</div><div class='ctx'> 	if (!inode-&gt;i_nlink) {</div><div class='ctx'> 		i_size_write(inode, 0);</div><div class='ctx'> 		mutex_lock(&amp;EXFAT_SB(inode-&gt;i_sb)-&gt;s_lock);</div><div class='del'>-		__exfat_truncate(inode, 0);</div><div class='add'>+		__exfat_truncate(inode);</div><div class='ctx'> 		mutex_unlock(&amp;EXFAT_SB(inode-&gt;i_sb)-&gt;s_lock);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='head'>diff --git a/fs/exfat/misc.c b/fs/exfat/misc.c<br/>index d34e6193258d..fa8459828046 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/exfat/misc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exfat/misc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/exfat/misc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/exfat/misc.c</a></div><div class='hunk'>@@ -10,6 +10,7 @@</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/buffer_head.h&gt;</div><div class='add'>+#include &lt;linux/blk_types.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "exfat_raw.h"</div><div class='ctx'> #include "exfat_fs.h"</div><div class='hunk'>@@ -45,23 +46,6 @@ void __exfat_fs_error(struct super_block *sb, int report, const char *fmt, ...)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * exfat_msg() - print preformated EXFAT specific messages.</div><div class='del'>- * All logs except what uses exfat_fs_error() should be written by exfat_msg()</div><div class='del'>- */</div><div class='del'>-void exfat_msg(struct super_block *sb, const char *level, const char *fmt, ...)</div><div class='del'>-{</div><div class='del'>-	struct va_format vaf;</div><div class='del'>-	va_list args;</div><div class='del'>-</div><div class='del'>-	va_start(args, fmt);</div><div class='del'>-	vaf.fmt = fmt;</div><div class='del'>-	vaf.va = &amp;args;</div><div class='del'>-	/* level means KERN_ pacility level */</div><div class='del'>-	printk("%sexFAT-fs (%s): %pV\n", level, sb-&gt;s_id, &amp;vaf);</div><div class='del'>-	va_end(args);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> #define SECS_PER_MIN    (60)</div><div class='ctx'> #define TIMEZONE_SEC(x)	((x) * 15 * SECS_PER_MIN)</div><div class='ctx'> </div><div class='hunk'>@@ -73,6 +57,13 @@ static void exfat_adjust_tz(struct timespec64 *ts, u8 tz_off)</div><div class='ctx'> 		ts-&gt;tv_sec += TIMEZONE_SEC(0x80 - tz_off);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline int exfat_tz_offset(struct exfat_sb_info *sbi)</div><div class='add'>+{</div><div class='add'>+	if (sbi-&gt;options.sys_tz)</div><div class='add'>+		return -sys_tz.tz_minuteswest;</div><div class='add'>+	return sbi-&gt;options.time_offset;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /* Convert a EXFAT time/date pair to a UNIX date (seconds since 1 1 70). */</div><div class='ctx'> void exfat_get_entry_time(struct exfat_sb_info *sbi, struct timespec64 *ts,</div><div class='ctx'> 		u8 tz, __le16 time, __le16 date, u8 time_cs)</div><div class='hunk'>@@ -95,8 +86,7 @@ void exfat_get_entry_time(struct exfat_sb_info *sbi, struct timespec64 *ts,</div><div class='ctx'> 		/* Adjust timezone to UTC0. */</div><div class='ctx'> 		exfat_adjust_tz(ts, tz &amp; ~EXFAT_TZ_VALID);</div><div class='ctx'> 	else</div><div class='del'>-		/* Convert from local time to UTC using time_offset. */</div><div class='del'>-		ts-&gt;tv_sec -= sbi-&gt;options.time_offset * SECS_PER_MIN;</div><div class='add'>+		ts-&gt;tv_sec -= exfat_tz_offset(sbi) * SECS_PER_MIN;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Convert linear UNIX date to a EXFAT time/date pair. */</div><div class='hunk'>@@ -136,6 +126,14 @@ void exfat_truncate_atime(struct timespec64 *ts)</div><div class='ctx'> 	ts-&gt;tv_nsec = 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void exfat_truncate_inode_atime(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct timespec64 atime = inode_get_atime(inode);</div><div class='add'>+</div><div class='add'>+	exfat_truncate_atime(&amp;atime);</div><div class='add'>+	inode_set_atime_to_ts(inode, atime);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> u16 exfat_calc_chksum16(void *data, int len, u16 chksum, int type)</div><div class='ctx'> {</div><div class='ctx'> 	int i;</div><div class='hunk'>@@ -180,7 +178,7 @@ int exfat_update_bhs(struct buffer_head **bhs, int nr_bhs, int sync)</div><div class='ctx'> 		set_buffer_uptodate(bhs[i]);</div><div class='ctx'> 		mark_buffer_dirty(bhs[i]);</div><div class='ctx'> 		if (sync)</div><div class='del'>-			write_dirty_buffer(bhs[i], 0);</div><div class='add'>+			write_dirty_buffer(bhs[i], REQ_SYNC);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; nr_bhs &amp;&amp; sync; i++) {</div><div class='head'>diff --git a/fs/exfat/namei.c b/fs/exfat/namei.c<br/>index 24b41103d1cc..dfe957493d49 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/exfat/namei.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exfat/namei.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/exfat/namei.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/exfat/namei.c</a></div><div class='hunk'>@@ -31,10 +31,9 @@ static inline void exfat_d_version_set(struct dentry *dentry,</div><div class='ctx'>  * If it happened, the negative dentry isn't actually negative anymore.  So,</div><div class='ctx'>  * drop it.</div><div class='ctx'>  */</div><div class='del'>-static int exfat_d_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='add'>+static int exfat_d_revalidate(struct inode *dir, const struct qstr *name,</div><div class='add'>+			      struct dentry *dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='ctx'> 	if (flags &amp; LOOKUP_RCU)</div><div class='ctx'> 		return -ECHILD;</div><div class='ctx'> </div><div class='hunk'>@@ -58,18 +57,17 @@ static int exfat_d_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='ctx'> 	if (flags &amp; (LOOKUP_CREATE | LOOKUP_RENAME_TARGET))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;dentry-&gt;d_lock);</div><div class='del'>-	ret = inode_eq_iversion(d_inode(dentry-&gt;d_parent),</div><div class='del'>-			exfat_d_version(dentry));</div><div class='del'>-	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='del'>-	return ret;</div><div class='add'>+	return inode_eq_iversion(dir, exfat_d_version(dentry));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* returns the length of a struct qstr, ignoring trailing dots */</div><div class='del'>-static unsigned int exfat_striptail_len(unsigned int len, const char *name)</div><div class='add'>+/* returns the length of a struct qstr, ignoring trailing dots if necessary */</div><div class='add'>+static unsigned int exfat_striptail_len(unsigned int len, const char *name,</div><div class='add'>+					bool keep_last_dots)</div><div class='ctx'> {</div><div class='del'>-	while (len &amp;&amp; name[len - 1] == '.')</div><div class='del'>-		len--;</div><div class='add'>+	if (!keep_last_dots) {</div><div class='add'>+		while (len &amp;&amp; name[len - 1] == '.')</div><div class='add'>+			len--;</div><div class='add'>+	}</div><div class='ctx'> 	return len;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -83,7 +81,8 @@ static int exfat_d_hash(const struct dentry *dentry, struct qstr *qstr)</div><div class='ctx'> 	struct super_block *sb = dentry-&gt;d_sb;</div><div class='ctx'> 	struct nls_table *t = EXFAT_SB(sb)-&gt;nls_io;</div><div class='ctx'> 	const unsigned char *name = qstr-&gt;name;</div><div class='del'>-	unsigned int len = exfat_striptail_len(qstr-&gt;len, qstr-&gt;name);</div><div class='add'>+	unsigned int len = exfat_striptail_len(qstr-&gt;len, qstr-&gt;name,</div><div class='add'>+			   EXFAT_SB(sb)-&gt;options.keep_last_dots);</div><div class='ctx'> 	unsigned long hash = init_name_hash(dentry);</div><div class='ctx'> 	int i, charlen;</div><div class='ctx'> 	wchar_t c;</div><div class='hunk'>@@ -104,8 +103,10 @@ static int exfat_d_cmp(const struct dentry *dentry, unsigned int len,</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = dentry-&gt;d_sb;</div><div class='ctx'> 	struct nls_table *t = EXFAT_SB(sb)-&gt;nls_io;</div><div class='del'>-	unsigned int alen = exfat_striptail_len(name-&gt;len, name-&gt;name);</div><div class='del'>-	unsigned int blen = exfat_striptail_len(len, str);</div><div class='add'>+	unsigned int alen = exfat_striptail_len(name-&gt;len, name-&gt;name,</div><div class='add'>+				EXFAT_SB(sb)-&gt;options.keep_last_dots);</div><div class='add'>+	unsigned int blen = exfat_striptail_len(len, str,</div><div class='add'>+				EXFAT_SB(sb)-&gt;options.keep_last_dots);</div><div class='ctx'> 	wchar_t c1, c2;</div><div class='ctx'> 	int charlen, i;</div><div class='ctx'> </div><div class='hunk'>@@ -136,7 +137,8 @@ static int exfat_utf8_d_hash(const struct dentry *dentry, struct qstr *qstr)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = dentry-&gt;d_sb;</div><div class='ctx'> 	const unsigned char *name = qstr-&gt;name;</div><div class='del'>-	unsigned int len = exfat_striptail_len(qstr-&gt;len, qstr-&gt;name);</div><div class='add'>+	unsigned int len = exfat_striptail_len(qstr-&gt;len, qstr-&gt;name,</div><div class='add'>+			       EXFAT_SB(sb)-&gt;options.keep_last_dots);</div><div class='ctx'> 	unsigned long hash = init_name_hash(dentry);</div><div class='ctx'> 	int i, charlen;</div><div class='ctx'> 	unicode_t u;</div><div class='hunk'>@@ -161,8 +163,11 @@ static int exfat_utf8_d_cmp(const struct dentry *dentry, unsigned int len,</div><div class='ctx'> 		const char *str, const struct qstr *name)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = dentry-&gt;d_sb;</div><div class='del'>-	unsigned int alen = exfat_striptail_len(name-&gt;len, name-&gt;name);</div><div class='del'>-	unsigned int blen = exfat_striptail_len(len, str);</div><div class='add'>+	unsigned int alen = exfat_striptail_len(name-&gt;len, name-&gt;name,</div><div class='add'>+				EXFAT_SB(sb)-&gt;options.keep_last_dots);</div><div class='add'>+	unsigned int blen = exfat_striptail_len(len, str,</div><div class='add'>+				EXFAT_SB(sb)-&gt;options.keep_last_dots);</div><div class='add'>+</div><div class='ctx'> 	unicode_t u_a, u_b;</div><div class='ctx'> 	int charlen, i;</div><div class='ctx'> </div><div class='hunk'>@@ -194,95 +199,75 @@ const struct dentry_operations exfat_utf8_dentry_ops = {</div><div class='ctx'> 	.d_compare	= exfat_utf8_d_cmp,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/* used only in search empty_slot() */</div><div class='del'>-#define CNT_UNUSED_NOHIT        (-1)</div><div class='del'>-#define CNT_UNUSED_HIT          (-2)</div><div class='ctx'> /* search EMPTY CONTINUOUS "num_entries" entries */</div><div class='ctx'> static int exfat_search_empty_slot(struct super_block *sb,</div><div class='ctx'> 		struct exfat_hint_femp *hint_femp, struct exfat_chain *p_dir,</div><div class='del'>-		int num_entries)</div><div class='add'>+		int num_entries, struct exfat_entry_set_cache *es)</div><div class='ctx'> {</div><div class='del'>-	int i, dentry, num_empty = 0;</div><div class='add'>+	int i, dentry, ret;</div><div class='ctx'> 	int dentries_per_clu;</div><div class='del'>-	unsigned int type;</div><div class='ctx'> 	struct exfat_chain clu;</div><div class='del'>-	struct exfat_dentry *ep;</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='del'>-	struct buffer_head *bh;</div><div class='add'>+	int total_entries = EXFAT_CLU_TO_DEN(p_dir-&gt;size, sbi);</div><div class='ctx'> </div><div class='ctx'> 	dentries_per_clu = sbi-&gt;dentries_per_clu;</div><div class='ctx'> </div><div class='ctx'> 	if (hint_femp-&gt;eidx != EXFAT_HINT_NONE) {</div><div class='ctx'> 		dentry = hint_femp-&gt;eidx;</div><div class='del'>-		if (num_entries &lt;= hint_femp-&gt;count) {</div><div class='del'>-			hint_femp-&gt;eidx = EXFAT_HINT_NONE;</div><div class='del'>-			return dentry;</div><div class='del'>-		}</div><div class='ctx'> </div><div class='add'>+		/*</div><div class='add'>+		 * If hint_femp-&gt;count is enough, it is needed to check if</div><div class='add'>+		 * there are actual empty entries.</div><div class='add'>+		 * Otherwise, and if "dentry + hint_famp-&gt;count" is also equal</div><div class='add'>+		 * to "p_dir-&gt;size * dentries_per_clu", it means ENOSPC.</div><div class='add'>+		 */</div><div class='add'>+		if (dentry + hint_femp-&gt;count == total_entries &amp;&amp;</div><div class='add'>+		    num_entries &gt; hint_femp-&gt;count)</div><div class='add'>+			return -ENOSPC;</div><div class='add'>+</div><div class='add'>+		hint_femp-&gt;eidx = EXFAT_HINT_NONE;</div><div class='ctx'> 		exfat_chain_dup(&amp;clu, &amp;hint_femp-&gt;cur);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		exfat_chain_dup(&amp;clu, p_dir);</div><div class='ctx'> 		dentry = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	while (clu.dir != EXFAT_EOF_CLUSTER) {</div><div class='add'>+	while (dentry + num_entries &lt;= total_entries &amp;&amp;</div><div class='add'>+	       clu.dir != EXFAT_EOF_CLUSTER) {</div><div class='ctx'> 		i = dentry &amp; (dentries_per_clu - 1);</div><div class='ctx'> </div><div class='del'>-		for (; i &lt; dentries_per_clu; i++, dentry++) {</div><div class='del'>-			ep = exfat_get_dentry(sb, &amp;clu, i, &amp;bh, NULL);</div><div class='del'>-			if (!ep)</div><div class='del'>-				return -EIO;</div><div class='del'>-			type = exfat_get_entry_type(ep);</div><div class='del'>-			brelse(bh);</div><div class='add'>+		ret = exfat_get_empty_dentry_set(es, sb, &amp;clu, i, num_entries);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='add'>+		else if (ret == 0)</div><div class='add'>+			return dentry;</div><div class='add'>+</div><div class='add'>+		dentry += ret;</div><div class='add'>+		i += ret;</div><div class='ctx'> </div><div class='del'>-			if (type == TYPE_UNUSED || type == TYPE_DELETED) {</div><div class='del'>-				num_empty++;</div><div class='del'>-				if (hint_femp-&gt;eidx == EXFAT_HINT_NONE) {</div><div class='del'>-					hint_femp-&gt;eidx = dentry;</div><div class='del'>-					hint_femp-&gt;count = CNT_UNUSED_NOHIT;</div><div class='del'>-					exfat_chain_set(&amp;hint_femp-&gt;cur,</div><div class='del'>-						clu.dir, clu.size, clu.flags);</div><div class='del'>-				}</div><div class='del'>-</div><div class='del'>-				if (type == TYPE_UNUSED &amp;&amp;</div><div class='del'>-				    hint_femp-&gt;count != CNT_UNUSED_HIT)</div><div class='del'>-					hint_femp-&gt;count = CNT_UNUSED_HIT;</div><div class='add'>+		while (i &gt;= dentries_per_clu) {</div><div class='add'>+			if (clu.flags == ALLOC_NO_FAT_CHAIN) {</div><div class='add'>+				if (--clu.size &gt; 0)</div><div class='add'>+					clu.dir++;</div><div class='add'>+				else</div><div class='add'>+					clu.dir = EXFAT_EOF_CLUSTER;</div><div class='ctx'> 			} else {</div><div class='del'>-				if (hint_femp-&gt;eidx != EXFAT_HINT_NONE &amp;&amp;</div><div class='del'>-				    hint_femp-&gt;count == CNT_UNUSED_HIT) {</div><div class='del'>-					/* unused empty group means</div><div class='del'>-					 * an empty group which includes</div><div class='del'>-					 * unused dentry</div><div class='del'>-					 */</div><div class='del'>-					exfat_fs_error(sb,</div><div class='del'>-						"found bogus dentry(%d) beyond unused empty group(%d) (start_clu : %u, cur_clu : %u)",</div><div class='del'>-						dentry, hint_femp-&gt;eidx,</div><div class='del'>-						p_dir-&gt;dir, clu.dir);</div><div class='add'>+				if (exfat_get_next_cluster(sb, &amp;clu.dir))</div><div class='ctx'> 					return -EIO;</div><div class='del'>-				}</div><div class='del'>-</div><div class='del'>-				num_empty = 0;</div><div class='del'>-				hint_femp-&gt;eidx = EXFAT_HINT_NONE;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			if (num_empty &gt;= num_entries) {</div><div class='del'>-				/* found and invalidate hint_femp */</div><div class='del'>-				hint_femp-&gt;eidx = EXFAT_HINT_NONE;</div><div class='del'>-				return (dentry - (num_entries - 1));</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (clu.flags == ALLOC_NO_FAT_CHAIN) {</div><div class='del'>-			if (--clu.size &gt; 0)</div><div class='del'>-				clu.dir++;</div><div class='del'>-			else</div><div class='del'>-				clu.dir = EXFAT_EOF_CLUSTER;</div><div class='del'>-		} else {</div><div class='del'>-			if (exfat_get_next_cluster(sb, &amp;clu.dir))</div><div class='del'>-				return -EIO;</div><div class='add'>+			i -= dentries_per_clu;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	hint_femp-&gt;eidx = dentry;</div><div class='add'>+	hint_femp-&gt;count = 0;</div><div class='add'>+	if (dentry == total_entries || clu.dir == EXFAT_EOF_CLUSTER)</div><div class='add'>+		exfat_chain_set(&amp;hint_femp-&gt;cur, EXFAT_EOF_CLUSTER, 0,</div><div class='add'>+				clu.flags);</div><div class='add'>+	else</div><div class='add'>+		hint_femp-&gt;cur = clu;</div><div class='add'>+</div><div class='ctx'> 	return -ENOSPC;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -298,18 +283,31 @@ static int exfat_check_max_dentries(struct inode *inode)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* find empty directory entry.</div><div class='del'>- * if there isn't any empty slot, expand cluster chain.</div><div class='add'>+/*</div><div class='add'>+ * Find an empty directory entry set.</div><div class='add'>+ *</div><div class='add'>+ * If there isn't any empty slot, expand cluster chain.</div><div class='add'>+ *</div><div class='add'>+ * in:</div><div class='add'>+ *   inode: inode of the parent directory</div><div class='add'>+ *   num_entries: specifies how many dentries in the empty directory entry set</div><div class='add'>+ *</div><div class='add'>+ * out:</div><div class='add'>+ *   p_dir: the cluster where the empty directory entry set is located</div><div class='add'>+ *   es: The found empty directory entry set</div><div class='add'>+ *</div><div class='add'>+ * return:</div><div class='add'>+ *   the directory entry index in p_dir is returned on succeeds</div><div class='add'>+ *   -error code is returned on failure</div><div class='ctx'>  */</div><div class='del'>-static int exfat_find_empty_entry(struct inode *inode,</div><div class='del'>-		struct exfat_chain *p_dir, int num_entries)</div><div class='add'>+int exfat_find_empty_entry(struct inode *inode,</div><div class='add'>+		struct exfat_chain *p_dir, int num_entries,</div><div class='add'>+		struct exfat_entry_set_cache *es)</div><div class='ctx'> {</div><div class='ctx'> 	int dentry;</div><div class='ctx'> 	unsigned int ret, last_clu;</div><div class='del'>-	sector_t sector;</div><div class='ctx'> 	loff_t size = 0;</div><div class='ctx'> 	struct exfat_chain clu;</div><div class='del'>-	struct exfat_dentry *ep = NULL;</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='ctx'> 	struct exfat_inode_info *ei = EXFAT_I(inode);</div><div class='hunk'>@@ -322,22 +320,31 @@ static int exfat_find_empty_entry(struct inode *inode,</div><div class='ctx'> 		ei-&gt;hint_femp.eidx = EXFAT_HINT_NONE;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	exfat_chain_set(p_dir, ei-&gt;start_clu,</div><div class='add'>+			EXFAT_B_TO_CLU(i_size_read(inode), sbi), ei-&gt;flags);</div><div class='add'>+</div><div class='ctx'> 	while ((dentry = exfat_search_empty_slot(sb, &amp;hint_femp, p_dir,</div><div class='del'>-					num_entries)) &lt; 0) {</div><div class='del'>-		if (dentry == -EIO)</div><div class='del'>-			break;</div><div class='add'>+					num_entries, es)) &lt; 0) {</div><div class='add'>+		if (dentry != -ENOSPC)</div><div class='add'>+			return dentry;</div><div class='ctx'> </div><div class='ctx'> 		if (exfat_check_max_dentries(inode))</div><div class='ctx'> 			return -ENOSPC;</div><div class='ctx'> </div><div class='del'>-		/* we trust p_dir-&gt;size regardless of FAT type */</div><div class='del'>-		if (exfat_find_last_cluster(sb, p_dir, &amp;last_clu))</div><div class='del'>-			return -EIO;</div><div class='del'>-</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Allocate new cluster to this directory</div><div class='ctx'> 		 */</div><div class='del'>-		exfat_chain_set(&amp;clu, last_clu + 1, 0, p_dir-&gt;flags);</div><div class='add'>+		if (ei-&gt;start_clu != EXFAT_EOF_CLUSTER) {</div><div class='add'>+			/* we trust p_dir-&gt;size regardless of FAT type */</div><div class='add'>+			if (exfat_find_last_cluster(sb, p_dir, &amp;last_clu))</div><div class='add'>+				return -EIO;</div><div class='add'>+</div><div class='add'>+			exfat_chain_set(&amp;clu, last_clu + 1, 0, p_dir-&gt;flags);</div><div class='add'>+		} else {</div><div class='add'>+			/* This directory is empty */</div><div class='add'>+			exfat_chain_set(&amp;clu, EXFAT_EOF_CLUSTER, 0,</div><div class='add'>+					ALLOC_NO_FAT_CHAIN);</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		/* allocate a cluster */</div><div class='ctx'> 		ret = exfat_alloc_cluster(inode, 1, &amp;clu, IS_DIRSYNC(inode));</div><div class='hunk'>@@ -347,6 +354,12 @@ static int exfat_find_empty_entry(struct inode *inode,</div><div class='ctx'> 		if (exfat_zeroed_cluster(inode, clu.dir))</div><div class='ctx'> 			return -EIO;</div><div class='ctx'> </div><div class='add'>+		if (ei-&gt;start_clu == EXFAT_EOF_CLUSTER) {</div><div class='add'>+			ei-&gt;start_clu = clu.dir;</div><div class='add'>+			p_dir-&gt;dir = clu.dir;</div><div class='add'>+			hint_femp.eidx = 0;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		/* append to the FAT chain */</div><div class='ctx'> 		if (clu.flags != p_dir-&gt;flags) {</div><div class='ctx'> 			/* no-fat-chain bit is disabled,</div><div class='hunk'>@@ -361,47 +374,26 @@ static int exfat_find_empty_entry(struct inode *inode,</div><div class='ctx'> 			if (exfat_ent_set(sb, last_clu, clu.dir))</div><div class='ctx'> 				return -EIO;</div><div class='ctx'> </div><div class='del'>-		if (hint_femp.eidx == EXFAT_HINT_NONE) {</div><div class='del'>-			/* the special case that new dentry</div><div class='del'>-			 * should be allocated from the start of new cluster</div><div class='del'>-			 */</div><div class='del'>-			hint_femp.eidx = EXFAT_B_TO_DEN_IDX(p_dir-&gt;size, sbi);</div><div class='del'>-			hint_femp.count = sbi-&gt;dentries_per_clu;</div><div class='del'>-</div><div class='add'>+		if (hint_femp.cur.dir == EXFAT_EOF_CLUSTER)</div><div class='ctx'> 			exfat_chain_set(&amp;hint_femp.cur, clu.dir, 0, clu.flags);</div><div class='del'>-		}</div><div class='add'>+</div><div class='add'>+		hint_femp.count += sbi-&gt;dentries_per_clu;</div><div class='add'>+</div><div class='ctx'> 		hint_femp.cur.size++;</div><div class='ctx'> 		p_dir-&gt;size++;</div><div class='ctx'> 		size = EXFAT_CLU_TO_B(p_dir-&gt;size, sbi);</div><div class='ctx'> </div><div class='del'>-		/* update the directory entry */</div><div class='del'>-		if (p_dir-&gt;dir != sbi-&gt;root_dir) {</div><div class='del'>-			struct buffer_head *bh;</div><div class='del'>-</div><div class='del'>-			ep = exfat_get_dentry(sb,</div><div class='del'>-				&amp;(ei-&gt;dir), ei-&gt;entry + 1, &amp;bh, &amp;sector);</div><div class='del'>-			if (!ep)</div><div class='del'>-				return -EIO;</div><div class='del'>-</div><div class='del'>-			ep-&gt;dentry.stream.valid_size = cpu_to_le64(size);</div><div class='del'>-			ep-&gt;dentry.stream.size = ep-&gt;dentry.stream.valid_size;</div><div class='del'>-			ep-&gt;dentry.stream.flags = p_dir-&gt;flags;</div><div class='del'>-			exfat_update_bh(bh, IS_DIRSYNC(inode));</div><div class='del'>-			brelse(bh);</div><div class='del'>-			if (exfat_update_dir_chksum(inode, &amp;(ei-&gt;dir),</div><div class='del'>-			    ei-&gt;entry))</div><div class='del'>-				return -EIO;</div><div class='del'>-		}</div><div class='del'>-</div><div class='ctx'> 		/* directory inode should be updated in here */</div><div class='ctx'> 		i_size_write(inode, size);</div><div class='del'>-		EXFAT_I(inode)-&gt;i_size_ondisk += sbi-&gt;cluster_size;</div><div class='del'>-		EXFAT_I(inode)-&gt;i_size_aligned += sbi-&gt;cluster_size;</div><div class='del'>-		EXFAT_I(inode)-&gt;flags = p_dir-&gt;flags;</div><div class='del'>-		inode-&gt;i_blocks += 1 &lt;&lt; sbi-&gt;sect_per_clus_bits;</div><div class='add'>+		ei-&gt;valid_size += sbi-&gt;cluster_size;</div><div class='add'>+		ei-&gt;flags = p_dir-&gt;flags;</div><div class='add'>+		inode-&gt;i_blocks += sbi-&gt;cluster_size &gt;&gt; 9;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return dentry;</div><div class='add'>+	p_dir-&gt;dir = exfat_sector_to_cluster(sbi, es-&gt;bh[0]-&gt;b_blocknr);</div><div class='add'>+	p_dir-&gt;size -= dentry / sbi-&gt;dentries_per_clu;</div><div class='add'>+</div><div class='add'>+	return dentry &amp; (sbi-&gt;dentries_per_clu - 1);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -409,21 +401,30 @@ static int exfat_find_empty_entry(struct inode *inode,</div><div class='ctx'>  * Zero if it was successful; otherwise nonzero.</div><div class='ctx'>  */</div><div class='ctx'> static int __exfat_resolve_path(struct inode *inode, const unsigned char *path,</div><div class='del'>-		struct exfat_chain *p_dir, struct exfat_uni_name *p_uniname,</div><div class='del'>-		int lookup)</div><div class='add'>+		struct exfat_uni_name *p_uniname, int lookup)</div><div class='ctx'> {</div><div class='ctx'> 	int namelen;</div><div class='ctx'> 	int lossy = NLS_NAME_NO_LOSSY;</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='del'>-	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='del'>-	struct exfat_inode_info *ei = EXFAT_I(inode);</div><div class='add'>+	int pathlen = strlen(path);</div><div class='ctx'> </div><div class='del'>-	/* strip all trailing periods */</div><div class='del'>-	namelen = exfat_striptail_len(strlen(path), path);</div><div class='add'>+	/*</div><div class='add'>+	 * get the length of the pathname excluding</div><div class='add'>+	 * trailing periods, if any.</div><div class='add'>+	 */</div><div class='add'>+	namelen = exfat_striptail_len(pathlen, path, false);</div><div class='add'>+	if (EXFAT_SB(sb)-&gt;options.keep_last_dots) {</div><div class='add'>+		/*</div><div class='add'>+		 * Do not allow the creation of files with names</div><div class='add'>+		 * ending with period(s).</div><div class='add'>+		 */</div><div class='add'>+		if (!lookup &amp;&amp; (namelen &lt; pathlen))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		namelen = pathlen;</div><div class='add'>+	}</div><div class='ctx'> 	if (!namelen)</div><div class='ctx'> 		return -ENOENT;</div><div class='del'>-</div><div class='del'>-	if (strlen(path) &gt; (MAX_NAME_LENGTH * MAX_CHARSET_SIZE))</div><div class='add'>+	if (pathlen &gt; (MAX_NAME_LENGTH * MAX_CHARSET_SIZE))</div><div class='ctx'> 		return -ENAMETOOLONG;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -443,24 +444,19 @@ static int __exfat_resolve_path(struct inode *inode, const unsigned char *path,</div><div class='ctx'> 	if ((lossy &amp;&amp; !lookup) || !namelen)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	exfat_chain_set(p_dir, ei-&gt;start_clu,</div><div class='del'>-		EXFAT_B_TO_CLU(i_size_read(inode), sbi), ei-&gt;flags);</div><div class='del'>-</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int exfat_resolve_path(struct inode *inode,</div><div class='del'>-		const unsigned char *path, struct exfat_chain *dir,</div><div class='del'>-		struct exfat_uni_name *uni)</div><div class='add'>+		const unsigned char *path, struct exfat_uni_name *uni)</div><div class='ctx'> {</div><div class='del'>-	return __exfat_resolve_path(inode, path, dir, uni, 0);</div><div class='add'>+	return __exfat_resolve_path(inode, path, uni, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int exfat_resolve_path_for_lookup(struct inode *inode,</div><div class='del'>-		const unsigned char *path, struct exfat_chain *dir,</div><div class='del'>-		struct exfat_uni_name *uni)</div><div class='add'>+		const unsigned char *path, struct exfat_uni_name *uni)</div><div class='ctx'> {</div><div class='del'>-	return __exfat_resolve_path(inode, path, dir, uni, 1);</div><div class='add'>+	return __exfat_resolve_path(inode, path, uni, 1);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline loff_t exfat_make_i_pos(struct exfat_dir_entry *info)</div><div class='hunk'>@@ -469,18 +465,19 @@ static inline loff_t exfat_make_i_pos(struct exfat_dir_entry *info)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int exfat_add_entry(struct inode *inode, const char *path,</div><div class='del'>-		struct exfat_chain *p_dir, unsigned int type,</div><div class='del'>-		struct exfat_dir_entry *info)</div><div class='add'>+		unsigned int type, struct exfat_dir_entry *info)</div><div class='ctx'> {</div><div class='ctx'> 	int ret, dentry, num_entries;</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='ctx'> 	struct exfat_uni_name uniname;</div><div class='ctx'> 	struct exfat_chain clu;</div><div class='add'>+	struct timespec64 ts = current_time(inode);</div><div class='add'>+	struct exfat_entry_set_cache es;</div><div class='ctx'> 	int clu_size = 0;</div><div class='ctx'> 	unsigned int start_clu = EXFAT_FREE_CLUSTER;</div><div class='ctx'> </div><div class='del'>-	ret = exfat_resolve_path(inode, path, p_dir, &amp;uniname);</div><div class='add'>+	ret = exfat_resolve_path(inode, path, &amp;uniname);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -491,16 +488,18 @@ static int exfat_add_entry(struct inode *inode, const char *path,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* exfat_find_empty_entry must be called before alloc_cluster() */</div><div class='del'>-	dentry = exfat_find_empty_entry(inode, p_dir, num_entries);</div><div class='add'>+	dentry = exfat_find_empty_entry(inode, &amp;info-&gt;dir, num_entries, &amp;es);</div><div class='ctx'> 	if (dentry &lt; 0) {</div><div class='ctx'> 		ret = dentry; /* -EIO or -ENOSPC */</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (type == TYPE_DIR) {</div><div class='add'>+	if (type == TYPE_DIR &amp;&amp; !sbi-&gt;options.zero_size_dir) {</div><div class='ctx'> 		ret = exfat_alloc_new_dir(inode, &amp;clu);</div><div class='del'>-		if (ret)</div><div class='add'>+		if (ret) {</div><div class='add'>+			exfat_put_dentry_set(&amp;es, false);</div><div class='ctx'> 			goto out;</div><div class='add'>+		}</div><div class='ctx'> 		start_clu = clu.dir;</div><div class='ctx'> 		clu_size = sbi-&gt;cluster_size;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -509,31 +508,33 @@ static int exfat_add_entry(struct inode *inode, const char *path,</div><div class='ctx'> 	/* fill the dos name directory entry information of the created file.</div><div class='ctx'> 	 * the first cluster is not determined yet. (0)</div><div class='ctx'> 	 */</div><div class='del'>-	ret = exfat_init_dir_entry(inode, p_dir, dentry, type,</div><div class='del'>-		start_clu, clu_size);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+	exfat_init_dir_entry(&amp;es, type, start_clu, clu_size, &amp;ts);</div><div class='add'>+	exfat_init_ext_entry(&amp;es, num_entries, &amp;uniname);</div><div class='ctx'> </div><div class='del'>-	ret = exfat_init_ext_entry(inode, p_dir, dentry, num_entries, &amp;uniname);</div><div class='add'>+	ret = exfat_put_dentry_set(&amp;es, IS_DIRSYNC(inode));</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	info-&gt;dir = *p_dir;</div><div class='ctx'> 	info-&gt;entry = dentry;</div><div class='ctx'> 	info-&gt;flags = ALLOC_NO_FAT_CHAIN;</div><div class='ctx'> 	info-&gt;type = type;</div><div class='ctx'> </div><div class='ctx'> 	if (type == TYPE_FILE) {</div><div class='del'>-		info-&gt;attr = ATTR_ARCHIVE;</div><div class='add'>+		info-&gt;attr = EXFAT_ATTR_ARCHIVE;</div><div class='ctx'> 		info-&gt;start_clu = EXFAT_EOF_CLUSTER;</div><div class='ctx'> 		info-&gt;size = 0;</div><div class='ctx'> 		info-&gt;num_subdirs = 0;</div><div class='ctx'> 	} else {</div><div class='del'>-		info-&gt;attr = ATTR_SUBDIR;</div><div class='del'>-		info-&gt;start_clu = start_clu;</div><div class='add'>+		info-&gt;attr = EXFAT_ATTR_SUBDIR;</div><div class='add'>+		if (sbi-&gt;options.zero_size_dir)</div><div class='add'>+			info-&gt;start_clu = EXFAT_EOF_CLUSTER;</div><div class='add'>+		else</div><div class='add'>+			info-&gt;start_clu = start_clu;</div><div class='ctx'> 		info-&gt;size = clu_size;</div><div class='ctx'> 		info-&gt;num_subdirs = EXFAT_MIN_SUBDIR;</div><div class='ctx'> 	}</div><div class='add'>+	info-&gt;valid_size = info-&gt;size;</div><div class='add'>+</div><div class='ctx'> 	memset(&amp;info-&gt;crtime, 0, sizeof(info-&gt;crtime));</div><div class='ctx'> 	memset(&amp;info-&gt;mtime, 0, sizeof(info-&gt;mtime));</div><div class='ctx'> 	memset(&amp;info-&gt;atime, 0, sizeof(info-&gt;atime));</div><div class='hunk'>@@ -541,27 +542,28 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int exfat_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int exfat_create(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 			struct dentry *dentry, umode_t mode, bool excl)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = dir-&gt;i_sb;</div><div class='ctx'> 	struct inode *inode;</div><div class='del'>-	struct exfat_chain cdir;</div><div class='ctx'> 	struct exfat_dir_entry info;</div><div class='ctx'> 	loff_t i_pos;</div><div class='ctx'> 	int err;</div><div class='add'>+	loff_t size = i_size_read(dir);</div><div class='add'>+</div><div class='add'>+	if (unlikely(exfat_forced_shutdown(sb)))</div><div class='add'>+		return -EIO;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;EXFAT_SB(sb)-&gt;s_lock);</div><div class='ctx'> 	exfat_set_volume_dirty(sb);</div><div class='del'>-	err = exfat_add_entry(dir, dentry-&gt;d_name.name, &amp;cdir, TYPE_FILE,</div><div class='del'>-		&amp;info);</div><div class='del'>-	exfat_clear_volume_dirty(sb);</div><div class='add'>+	err = exfat_add_entry(dir, dentry-&gt;d_name.name, TYPE_FILE, &amp;info);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto unlock;</div><div class='ctx'> </div><div class='ctx'> 	inode_inc_iversion(dir);</div><div class='del'>-	dir-&gt;i_ctime = dir-&gt;i_mtime = current_time(dir);</div><div class='del'>-	if (IS_DIRSYNC(dir))</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='add'>+	if (IS_DIRSYNC(dir) &amp;&amp; size != i_size_read(dir))</div><div class='ctx'> 		exfat_sync_inode(dir);</div><div class='ctx'> 	else</div><div class='ctx'> 		mark_inode_dirty(dir);</div><div class='hunk'>@@ -573,9 +575,9 @@ static int exfat_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 		goto unlock;</div><div class='ctx'> </div><div class='ctx'> 	inode_inc_iversion(inode);</div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_atime = inode-&gt;i_ctime =</div><div class='del'>-		EXFAT_I(inode)-&gt;i_crtime = current_time(inode);</div><div class='del'>-	exfat_truncate_atime(&amp;inode-&gt;i_atime);</div><div class='add'>+	EXFAT_I(inode)-&gt;i_crtime = simple_inode_init_ts(inode);</div><div class='add'>+	exfat_truncate_inode_atime(inode);</div><div class='add'>+</div><div class='ctx'> 	/* timestamp is already written, so mark_inode_dirty() is unneeded. */</div><div class='ctx'> </div><div class='ctx'> 	d_instantiate(dentry, inode);</div><div class='hunk'>@@ -585,17 +587,17 @@ unlock:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* lookup a file */</div><div class='del'>-static int exfat_find(struct inode *dir, struct qstr *qname,</div><div class='add'>+static int exfat_find(struct inode *dir, const struct qstr *qname,</div><div class='ctx'> 		struct exfat_dir_entry *info)</div><div class='ctx'> {</div><div class='del'>-	int ret, dentry, num_entries, count;</div><div class='add'>+	int ret, dentry, count;</div><div class='ctx'> 	struct exfat_chain cdir;</div><div class='ctx'> 	struct exfat_uni_name uni_name;</div><div class='ctx'> 	struct super_block *sb = dir-&gt;i_sb;</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='ctx'> 	struct exfat_inode_info *ei = EXFAT_I(dir);</div><div class='ctx'> 	struct exfat_dentry *ep, *ep2;</div><div class='del'>-	struct exfat_entry_set_cache *es;</div><div class='add'>+	struct exfat_entry_set_cache es;</div><div class='ctx'> 	/* for optimized dir &amp; entry to prevent long traverse of cluster chain */</div><div class='ctx'> 	struct exfat_hint hint_opt;</div><div class='ctx'> </div><div class='hunk'>@@ -603,13 +605,12 @@ static int exfat_find(struct inode *dir, struct qstr *qname,</div><div class='ctx'> 		return -ENOENT;</div><div class='ctx'> </div><div class='ctx'> 	/* check the validity of directory name in the given pathname */</div><div class='del'>-	ret = exfat_resolve_path_for_lookup(dir, qname-&gt;name, &amp;cdir, &amp;uni_name);</div><div class='add'>+	ret = exfat_resolve_path_for_lookup(dir, qname-&gt;name, &amp;uni_name);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	num_entries = exfat_calc_num_entries(&amp;uni_name);</div><div class='del'>-	if (num_entries &lt; 0)</div><div class='del'>-		return num_entries;</div><div class='add'>+	exfat_chain_set(&amp;cdir, ei-&gt;start_clu,</div><div class='add'>+		EXFAT_B_TO_CLU(i_size_read(dir), sbi), ei-&gt;flags);</div><div class='ctx'> </div><div class='ctx'> 	/* check the validation of hint_stat and initialize it if required */</div><div class='ctx'> 	if (ei-&gt;version != (inode_peek_iversion_raw(dir) &amp; 0xffffffff)) {</div><div class='hunk'>@@ -620,38 +621,49 @@ static int exfat_find(struct inode *dir, struct qstr *qname,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* search the file name for directories */</div><div class='del'>-	dentry = exfat_find_dir_entry(sb, ei, &amp;cdir, &amp;uni_name,</div><div class='del'>-			num_entries, TYPE_ALL, &amp;hint_opt);</div><div class='del'>-</div><div class='add'>+	dentry = exfat_find_dir_entry(sb, ei, &amp;cdir, &amp;uni_name, &amp;hint_opt);</div><div class='ctx'> 	if (dentry &lt; 0)</div><div class='ctx'> 		return dentry; /* -error value */</div><div class='ctx'> </div><div class='del'>-	info-&gt;dir = cdir;</div><div class='del'>-	info-&gt;entry = dentry;</div><div class='del'>-	info-&gt;num_subdirs = 0;</div><div class='del'>-</div><div class='ctx'> 	/* adjust cdir to the optimized value */</div><div class='ctx'> 	cdir.dir = hint_opt.clu;</div><div class='ctx'> 	if (cdir.flags &amp; ALLOC_NO_FAT_CHAIN)</div><div class='ctx'> 		cdir.size -= dentry / sbi-&gt;dentries_per_clu;</div><div class='ctx'> 	dentry = hint_opt.eidx;</div><div class='del'>-	es = exfat_get_dentry_set(sb, &amp;cdir, dentry, ES_2_ENTRIES);</div><div class='del'>-	if (!es)</div><div class='add'>+</div><div class='add'>+	info-&gt;dir = cdir;</div><div class='add'>+	info-&gt;entry = dentry;</div><div class='add'>+	info-&gt;num_subdirs = 0;</div><div class='add'>+</div><div class='add'>+	if (exfat_get_dentry_set(&amp;es, sb, &amp;cdir, dentry, ES_2_ENTRIES))</div><div class='ctx'> 		return -EIO;</div><div class='del'>-	ep = exfat_get_dentry_cached(es, 0);</div><div class='del'>-	ep2 = exfat_get_dentry_cached(es, 1);</div><div class='add'>+	ep = exfat_get_dentry_cached(&amp;es, ES_IDX_FILE);</div><div class='add'>+	ep2 = exfat_get_dentry_cached(&amp;es, ES_IDX_STREAM);</div><div class='ctx'> </div><div class='ctx'> 	info-&gt;type = exfat_get_entry_type(ep);</div><div class='ctx'> 	info-&gt;attr = le16_to_cpu(ep-&gt;dentry.file.attr);</div><div class='del'>-	info-&gt;size = le64_to_cpu(ep2-&gt;dentry.stream.valid_size);</div><div class='del'>-	if ((info-&gt;type == TYPE_FILE) &amp;&amp; (info-&gt;size == 0)) {</div><div class='add'>+	info-&gt;valid_size = le64_to_cpu(ep2-&gt;dentry.stream.valid_size);</div><div class='add'>+	info-&gt;size = le64_to_cpu(ep2-&gt;dentry.stream.size);</div><div class='add'>+</div><div class='add'>+	info-&gt;start_clu = le32_to_cpu(ep2-&gt;dentry.stream.start_clu);</div><div class='add'>+	if (!is_valid_cluster(sbi, info-&gt;start_clu) &amp;&amp; info-&gt;size) {</div><div class='add'>+		exfat_warn(sb, "start_clu is invalid cluster(0x%x)",</div><div class='add'>+				info-&gt;start_clu);</div><div class='add'>+		info-&gt;size = 0;</div><div class='add'>+		info-&gt;valid_size = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (info-&gt;valid_size &gt; info-&gt;size) {</div><div class='add'>+		exfat_warn(sb, "valid_size(%lld) is greater than size(%lld)",</div><div class='add'>+				info-&gt;valid_size, info-&gt;size);</div><div class='add'>+		info-&gt;valid_size = info-&gt;size;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (info-&gt;size == 0) {</div><div class='ctx'> 		info-&gt;flags = ALLOC_NO_FAT_CHAIN;</div><div class='ctx'> 		info-&gt;start_clu = EXFAT_EOF_CLUSTER;</div><div class='del'>-	} else {</div><div class='add'>+	} else</div><div class='ctx'> 		info-&gt;flags = ep2-&gt;dentry.stream.flags;</div><div class='del'>-		info-&gt;start_clu =</div><div class='del'>-			le32_to_cpu(ep2-&gt;dentry.stream.start_clu);</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	exfat_get_entry_time(sbi, &amp;info-&gt;crtime,</div><div class='ctx'> 			     ep-&gt;dentry.file.create_tz,</div><div class='hunk'>@@ -668,7 +680,17 @@ static int exfat_find(struct inode *dir, struct qstr *qname,</div><div class='ctx'> 			     ep-&gt;dentry.file.access_time,</div><div class='ctx'> 			     ep-&gt;dentry.file.access_date,</div><div class='ctx'> 			     0);</div><div class='del'>-	exfat_free_dentry_set(es, false);</div><div class='add'>+	exfat_put_dentry_set(&amp;es, false);</div><div class='add'>+</div><div class='add'>+	if (info-&gt;valid_size &lt; 0) {</div><div class='add'>+		exfat_fs_error(sb, "data valid size is invalid(%lld)", info-&gt;valid_size);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (unlikely(EXFAT_B_TO_CLU_ROUND_UP(info-&gt;size, sbi) &gt; sbi-&gt;used_clusters)) {</div><div class='add'>+		exfat_fs_error(sb, "data size is invalid(%lld)", info-&gt;size);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (ei-&gt;start_clu == EXFAT_FREE_CLUSTER) {</div><div class='ctx'> 		exfat_fs_error(sb,</div><div class='hunk'>@@ -773,60 +795,48 @@ unlock:</div><div class='ctx'> /* remove an entry, BUT don't truncate */</div><div class='ctx'> static int exfat_unlink(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	struct exfat_chain cdir;</div><div class='del'>-	struct exfat_dentry *ep;</div><div class='ctx'> 	struct super_block *sb = dir-&gt;i_sb;</div><div class='ctx'> 	struct inode *inode = dentry-&gt;d_inode;</div><div class='ctx'> 	struct exfat_inode_info *ei = EXFAT_I(inode);</div><div class='del'>-	struct buffer_head *bh;</div><div class='del'>-	sector_t sector;</div><div class='del'>-	int num_entries, entry, err = 0;</div><div class='add'>+	struct exfat_entry_set_cache es;</div><div class='add'>+	int err = 0;</div><div class='add'>+</div><div class='add'>+	if (unlikely(exfat_forced_shutdown(sb)))</div><div class='add'>+		return -EIO;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;EXFAT_SB(sb)-&gt;s_lock);</div><div class='del'>-	exfat_chain_dup(&amp;cdir, &amp;ei-&gt;dir);</div><div class='del'>-	entry = ei-&gt;entry;</div><div class='ctx'> 	if (ei-&gt;dir.dir == DIR_DELETED) {</div><div class='ctx'> 		exfat_err(sb, "abnormal access to deleted dentry");</div><div class='ctx'> 		err = -ENOENT;</div><div class='ctx'> 		goto unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ep = exfat_get_dentry(sb, &amp;cdir, entry, &amp;bh, &amp;sector);</div><div class='del'>-	if (!ep) {</div><div class='del'>-		err = -EIO;</div><div class='del'>-		goto unlock;</div><div class='del'>-	}</div><div class='del'>-	num_entries = exfat_count_ext_entries(sb, &amp;cdir, entry, ep);</div><div class='del'>-	if (num_entries &lt; 0) {</div><div class='add'>+	err = exfat_get_dentry_set_by_ei(&amp;es, sb, ei);</div><div class='add'>+	if (err) {</div><div class='ctx'> 		err = -EIO;</div><div class='del'>-		brelse(bh);</div><div class='ctx'> 		goto unlock;</div><div class='ctx'> 	}</div><div class='del'>-	num_entries++;</div><div class='del'>-	brelse(bh);</div><div class='ctx'> </div><div class='ctx'> 	exfat_set_volume_dirty(sb);</div><div class='add'>+</div><div class='ctx'> 	/* update the directory entry */</div><div class='del'>-	if (exfat_remove_entries(dir, &amp;cdir, entry, 0, num_entries)) {</div><div class='del'>-		err = -EIO;</div><div class='add'>+	exfat_remove_entries(inode, &amp;es, ES_IDX_FILE);</div><div class='add'>+</div><div class='add'>+	err = exfat_put_dentry_set(&amp;es, IS_DIRSYNC(inode));</div><div class='add'>+	if (err)</div><div class='ctx'> 		goto unlock;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	/* This doesn't modify ei */</div><div class='ctx'> 	ei-&gt;dir.dir = DIR_DELETED;</div><div class='del'>-	exfat_clear_volume_dirty(sb);</div><div class='ctx'> </div><div class='ctx'> 	inode_inc_iversion(dir);</div><div class='del'>-	dir-&gt;i_mtime = dir-&gt;i_atime = current_time(dir);</div><div class='del'>-	exfat_truncate_atime(&amp;dir-&gt;i_atime);</div><div class='del'>-	if (IS_DIRSYNC(dir))</div><div class='del'>-		exfat_sync_inode(dir);</div><div class='del'>-	else</div><div class='del'>-		mark_inode_dirty(dir);</div><div class='add'>+	simple_inode_init_ts(dir);</div><div class='add'>+	exfat_truncate_inode_atime(dir);</div><div class='add'>+	mark_inode_dirty(dir);</div><div class='ctx'> </div><div class='ctx'> 	clear_nlink(inode);</div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_atime = current_time(inode);</div><div class='del'>-	exfat_truncate_atime(&amp;inode-&gt;i_atime);</div><div class='add'>+	simple_inode_init_ts(inode);</div><div class='add'>+	exfat_truncate_inode_atime(inode);</div><div class='ctx'> 	exfat_unhash_inode(inode);</div><div class='ctx'> 	exfat_d_version_set(dentry, inode_query_iversion(dir));</div><div class='ctx'> unlock:</div><div class='hunk'>@@ -834,27 +844,28 @@ unlock:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int exfat_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-		       struct dentry *dentry, umode_t mode)</div><div class='add'>+static struct dentry *exfat_mkdir(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+				  struct dentry *dentry, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = dir-&gt;i_sb;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct exfat_dir_entry info;</div><div class='del'>-	struct exfat_chain cdir;</div><div class='ctx'> 	loff_t i_pos;</div><div class='ctx'> 	int err;</div><div class='add'>+	loff_t size = i_size_read(dir);</div><div class='add'>+</div><div class='add'>+	if (unlikely(exfat_forced_shutdown(sb)))</div><div class='add'>+		return ERR_PTR(-EIO);</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;EXFAT_SB(sb)-&gt;s_lock);</div><div class='ctx'> 	exfat_set_volume_dirty(sb);</div><div class='del'>-	err = exfat_add_entry(dir, dentry-&gt;d_name.name, &amp;cdir, TYPE_DIR,</div><div class='del'>-		&amp;info);</div><div class='del'>-	exfat_clear_volume_dirty(sb);</div><div class='add'>+	err = exfat_add_entry(dir, dentry-&gt;d_name.name, TYPE_DIR, &amp;info);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto unlock;</div><div class='ctx'> </div><div class='ctx'> 	inode_inc_iversion(dir);</div><div class='del'>-	dir-&gt;i_ctime = dir-&gt;i_mtime = current_time(dir);</div><div class='del'>-	if (IS_DIRSYNC(dir))</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='add'>+	if (IS_DIRSYNC(dir) &amp;&amp; size != i_size_read(dir))</div><div class='ctx'> 		exfat_sync_inode(dir);</div><div class='ctx'> 	else</div><div class='ctx'> 		mark_inode_dirty(dir);</div><div class='hunk'>@@ -867,16 +878,15 @@ static int exfat_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 		goto unlock;</div><div class='ctx'> </div><div class='ctx'> 	inode_inc_iversion(inode);</div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_atime = inode-&gt;i_ctime =</div><div class='del'>-		EXFAT_I(inode)-&gt;i_crtime = current_time(inode);</div><div class='del'>-	exfat_truncate_atime(&amp;inode-&gt;i_atime);</div><div class='add'>+	EXFAT_I(inode)-&gt;i_crtime = simple_inode_init_ts(inode);</div><div class='add'>+	exfat_truncate_inode_atime(inode);</div><div class='ctx'> 	/* timestamp is already written, so mark_inode_dirty() is unneeded. */</div><div class='ctx'> </div><div class='ctx'> 	d_instantiate(dentry, inode);</div><div class='ctx'> </div><div class='ctx'> unlock:</div><div class='ctx'> 	mutex_unlock(&amp;EXFAT_SB(sb)-&gt;s_lock);</div><div class='del'>-	return err;</div><div class='add'>+	return ERR_PTR(err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int exfat_check_dir_empty(struct super_block *sb,</div><div class='hunk'>@@ -884,6 +894,7 @@ static int exfat_check_dir_empty(struct super_block *sb,</div><div class='ctx'> {</div><div class='ctx'> 	int i, dentries_per_clu;</div><div class='ctx'> 	unsigned int type;</div><div class='add'>+	unsigned int clu_count = 0;</div><div class='ctx'> 	struct exfat_chain clu;</div><div class='ctx'> 	struct exfat_dentry *ep;</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='hunk'>@@ -891,11 +902,14 @@ static int exfat_check_dir_empty(struct super_block *sb,</div><div class='ctx'> </div><div class='ctx'> 	dentries_per_clu = sbi-&gt;dentries_per_clu;</div><div class='ctx'> </div><div class='add'>+	if (p_dir-&gt;dir == EXFAT_EOF_CLUSTER)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='ctx'> 	exfat_chain_dup(&amp;clu, p_dir);</div><div class='ctx'> </div><div class='ctx'> 	while (clu.dir != EXFAT_EOF_CLUSTER) {</div><div class='ctx'> 		for (i = 0; i &lt; dentries_per_clu; i++) {</div><div class='del'>-			ep = exfat_get_dentry(sb, &amp;clu, i, &amp;bh, NULL);</div><div class='add'>+			ep = exfat_get_dentry(sb, &amp;clu, i, &amp;bh);</div><div class='ctx'> 			if (!ep)</div><div class='ctx'> 				return -EIO;</div><div class='ctx'> 			type = exfat_get_entry_type(ep);</div><div class='hunk'>@@ -917,6 +931,10 @@ static int exfat_check_dir_empty(struct super_block *sb,</div><div class='ctx'> 		} else {</div><div class='ctx'> 			if (exfat_get_next_cluster(sb, &amp;(clu.dir)))</div><div class='ctx'> 				return -EIO;</div><div class='add'>+</div><div class='add'>+			/* break if the cluster chain includes a loop */</div><div class='add'>+			if (unlikely(++clu_count &gt; EXFAT_DATA_CLUSTER_COUNT(sbi)))</div><div class='add'>+				break;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -926,19 +944,17 @@ static int exfat_check_dir_empty(struct super_block *sb,</div><div class='ctx'> static int exfat_rmdir(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = dentry-&gt;d_inode;</div><div class='del'>-	struct exfat_dentry *ep;</div><div class='del'>-	struct exfat_chain cdir, clu_to_free;</div><div class='add'>+	struct exfat_chain clu_to_free;</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='ctx'> 	struct exfat_inode_info *ei = EXFAT_I(inode);</div><div class='del'>-	struct buffer_head *bh;</div><div class='del'>-	sector_t sector;</div><div class='del'>-	int num_entries, entry, err;</div><div class='add'>+	struct exfat_entry_set_cache es;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;EXFAT_SB(inode-&gt;i_sb)-&gt;s_lock);</div><div class='add'>+	if (unlikely(exfat_forced_shutdown(sb)))</div><div class='add'>+		return -EIO;</div><div class='ctx'> </div><div class='del'>-	exfat_chain_dup(&amp;cdir, &amp;ei-&gt;dir);</div><div class='del'>-	entry = ei-&gt;entry;</div><div class='add'>+	mutex_lock(&amp;EXFAT_SB(inode-&gt;i_sb)-&gt;s_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (ei-&gt;dir.dir == DIR_DELETED) {</div><div class='ctx'> 		exfat_err(sb, "abnormal access to deleted dentry");</div><div class='hunk'>@@ -957,33 +973,25 @@ static int exfat_rmdir(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 		goto unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ep = exfat_get_dentry(sb, &amp;cdir, entry, &amp;bh, &amp;sector);</div><div class='del'>-	if (!ep) {</div><div class='del'>-		err = -EIO;</div><div class='del'>-		goto unlock;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	num_entries = exfat_count_ext_entries(sb, &amp;cdir, entry, ep);</div><div class='del'>-	if (num_entries &lt; 0) {</div><div class='add'>+	err = exfat_get_dentry_set_by_ei(&amp;es, sb, ei);</div><div class='add'>+	if (err) {</div><div class='ctx'> 		err = -EIO;</div><div class='del'>-		brelse(bh);</div><div class='ctx'> 		goto unlock;</div><div class='ctx'> 	}</div><div class='del'>-	num_entries++;</div><div class='del'>-	brelse(bh);</div><div class='ctx'> </div><div class='ctx'> 	exfat_set_volume_dirty(sb);</div><div class='del'>-	err = exfat_remove_entries(dir, &amp;cdir, entry, 0, num_entries);</div><div class='del'>-	if (err) {</div><div class='del'>-		exfat_err(sb, "failed to exfat_remove_entries : err(%d)", err);</div><div class='add'>+</div><div class='add'>+	exfat_remove_entries(inode, &amp;es, ES_IDX_FILE);</div><div class='add'>+</div><div class='add'>+	err = exfat_put_dentry_set(&amp;es, IS_DIRSYNC(dir));</div><div class='add'>+	if (err)</div><div class='ctx'> 		goto unlock;</div><div class='del'>-	}</div><div class='add'>+</div><div class='ctx'> 	ei-&gt;dir.dir = DIR_DELETED;</div><div class='del'>-	exfat_clear_volume_dirty(sb);</div><div class='ctx'> </div><div class='ctx'> 	inode_inc_iversion(dir);</div><div class='del'>-	dir-&gt;i_mtime = dir-&gt;i_atime = current_time(dir);</div><div class='del'>-	exfat_truncate_atime(&amp;dir-&gt;i_atime);</div><div class='add'>+	simple_inode_init_ts(dir);</div><div class='add'>+	exfat_truncate_inode_atime(dir);</div><div class='ctx'> 	if (IS_DIRSYNC(dir))</div><div class='ctx'> 		exfat_sync_inode(dir);</div><div class='ctx'> 	else</div><div class='hunk'>@@ -991,8 +999,8 @@ static int exfat_rmdir(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	drop_nlink(dir);</div><div class='ctx'> </div><div class='ctx'> 	clear_nlink(inode);</div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_atime = current_time(inode);</div><div class='del'>-	exfat_truncate_atime(&amp;inode-&gt;i_atime);</div><div class='add'>+	simple_inode_init_ts(inode);</div><div class='add'>+	exfat_truncate_inode_atime(inode);</div><div class='ctx'> 	exfat_unhash_inode(inode);</div><div class='ctx'> 	exfat_d_version_set(dentry, inode_query_iversion(dir));</div><div class='ctx'> unlock:</div><div class='hunk'>@@ -1000,185 +1008,128 @@ unlock:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int exfat_rename_file(struct inode *inode, struct exfat_chain *p_dir,</div><div class='del'>-		int oldentry, struct exfat_uni_name *p_uniname,</div><div class='del'>-		struct exfat_inode_info *ei)</div><div class='add'>+static int exfat_rename_file(struct inode *parent_inode,</div><div class='add'>+		struct exfat_uni_name *p_uniname, struct exfat_inode_info *ei)</div><div class='ctx'> {</div><div class='del'>-	int ret, num_old_entries, num_new_entries;</div><div class='del'>-	sector_t sector_old, sector_new;</div><div class='add'>+	int ret, num_new_entries;</div><div class='ctx'> 	struct exfat_dentry *epold, *epnew;</div><div class='del'>-	struct super_block *sb = inode-&gt;i_sb;</div><div class='del'>-	struct buffer_head *new_bh, *old_bh;</div><div class='del'>-	int sync = IS_DIRSYNC(inode);</div><div class='del'>-</div><div class='del'>-	epold = exfat_get_dentry(sb, p_dir, oldentry, &amp;old_bh, &amp;sector_old);</div><div class='del'>-	if (!epold)</div><div class='del'>-		return -EIO;</div><div class='add'>+	struct super_block *sb = parent_inode-&gt;i_sb;</div><div class='add'>+	struct exfat_entry_set_cache old_es, new_es;</div><div class='add'>+	int sync = IS_DIRSYNC(parent_inode);</div><div class='ctx'> </div><div class='del'>-	num_old_entries = exfat_count_ext_entries(sb, p_dir, oldentry, epold);</div><div class='del'>-	if (num_old_entries &lt; 0)</div><div class='add'>+	if (unlikely(exfat_forced_shutdown(sb)))</div><div class='ctx'> 		return -EIO;</div><div class='del'>-	num_old_entries++;</div><div class='ctx'> </div><div class='ctx'> 	num_new_entries = exfat_calc_num_entries(p_uniname);</div><div class='ctx'> 	if (num_new_entries &lt; 0)</div><div class='ctx'> 		return num_new_entries;</div><div class='ctx'> </div><div class='del'>-	if (num_old_entries &lt; num_new_entries) {</div><div class='del'>-		int newentry;</div><div class='add'>+	ret = exfat_get_dentry_set_by_ei(&amp;old_es, sb, ei);</div><div class='add'>+	if (ret) {</div><div class='add'>+		ret = -EIO;</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		newentry =</div><div class='del'>-			exfat_find_empty_entry(inode, p_dir, num_new_entries);</div><div class='del'>-		if (newentry &lt; 0)</div><div class='del'>-			return newentry; /* -EIO or -ENOSPC */</div><div class='add'>+	epold = exfat_get_dentry_cached(&amp;old_es, ES_IDX_FILE);</div><div class='ctx'> </div><div class='del'>-		epnew = exfat_get_dentry(sb, p_dir, newentry, &amp;new_bh,</div><div class='del'>-			&amp;sector_new);</div><div class='del'>-		if (!epnew)</div><div class='del'>-			return -EIO;</div><div class='add'>+	if (old_es.num_entries &lt; num_new_entries) {</div><div class='add'>+		int newentry;</div><div class='add'>+		struct exfat_chain dir;</div><div class='ctx'> </div><div class='del'>-		*epnew = *epold;</div><div class='del'>-		if (exfat_get_entry_type(epnew) == TYPE_FILE) {</div><div class='del'>-			epnew-&gt;dentry.file.attr |= cpu_to_le16(ATTR_ARCHIVE);</div><div class='del'>-			ei-&gt;attr |= ATTR_ARCHIVE;</div><div class='add'>+		newentry = exfat_find_empty_entry(parent_inode, &amp;dir,</div><div class='add'>+				num_new_entries, &amp;new_es);</div><div class='add'>+		if (newentry &lt; 0) {</div><div class='add'>+			ret = newentry; /* -EIO or -ENOSPC */</div><div class='add'>+			goto put_old_es;</div><div class='ctx'> 		}</div><div class='del'>-		exfat_update_bh(new_bh, sync);</div><div class='del'>-		brelse(old_bh);</div><div class='del'>-		brelse(new_bh);</div><div class='ctx'> </div><div class='del'>-		epold = exfat_get_dentry(sb, p_dir, oldentry + 1, &amp;old_bh,</div><div class='del'>-			&amp;sector_old);</div><div class='del'>-		if (!epold)</div><div class='del'>-			return -EIO;</div><div class='del'>-		epnew = exfat_get_dentry(sb, p_dir, newentry + 1, &amp;new_bh,</div><div class='del'>-			&amp;sector_new);</div><div class='del'>-		if (!epnew) {</div><div class='del'>-			brelse(old_bh);</div><div class='del'>-			return -EIO;</div><div class='add'>+		epnew = exfat_get_dentry_cached(&amp;new_es, ES_IDX_FILE);</div><div class='add'>+		*epnew = *epold;</div><div class='add'>+		if (exfat_get_entry_type(epnew) == TYPE_FILE) {</div><div class='add'>+			epnew-&gt;dentry.file.attr |= cpu_to_le16(EXFAT_ATTR_ARCHIVE);</div><div class='add'>+			ei-&gt;attr |= EXFAT_ATTR_ARCHIVE;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		epold = exfat_get_dentry_cached(&amp;old_es, ES_IDX_STREAM);</div><div class='add'>+		epnew = exfat_get_dentry_cached(&amp;new_es, ES_IDX_STREAM);</div><div class='ctx'> 		*epnew = *epold;</div><div class='del'>-		exfat_update_bh(new_bh, sync);</div><div class='del'>-		brelse(old_bh);</div><div class='del'>-		brelse(new_bh);</div><div class='ctx'> </div><div class='del'>-		ret = exfat_init_ext_entry(inode, p_dir, newentry,</div><div class='del'>-			num_new_entries, p_uniname);</div><div class='add'>+		exfat_init_ext_entry(&amp;new_es, num_new_entries, p_uniname);</div><div class='add'>+</div><div class='add'>+		ret = exfat_put_dentry_set(&amp;new_es, sync);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			return ret;</div><div class='add'>+			goto put_old_es;</div><div class='ctx'> </div><div class='del'>-		exfat_remove_entries(inode, p_dir, oldentry, 0,</div><div class='del'>-			num_old_entries);</div><div class='add'>+		exfat_remove_entries(parent_inode, &amp;old_es, ES_IDX_FILE);</div><div class='add'>+		ei-&gt;dir = dir;</div><div class='ctx'> 		ei-&gt;entry = newentry;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		if (exfat_get_entry_type(epold) == TYPE_FILE) {</div><div class='del'>-			epold-&gt;dentry.file.attr |= cpu_to_le16(ATTR_ARCHIVE);</div><div class='del'>-			ei-&gt;attr |= ATTR_ARCHIVE;</div><div class='add'>+			epold-&gt;dentry.file.attr |= cpu_to_le16(EXFAT_ATTR_ARCHIVE);</div><div class='add'>+			ei-&gt;attr |= EXFAT_ATTR_ARCHIVE;</div><div class='ctx'> 		}</div><div class='del'>-		exfat_update_bh(old_bh, sync);</div><div class='del'>-		brelse(old_bh);</div><div class='del'>-		ret = exfat_init_ext_entry(inode, p_dir, oldentry,</div><div class='del'>-			num_new_entries, p_uniname);</div><div class='del'>-		if (ret)</div><div class='del'>-			return ret;</div><div class='ctx'> </div><div class='del'>-		exfat_remove_entries(inode, p_dir, oldentry, num_new_entries,</div><div class='del'>-			num_old_entries);</div><div class='add'>+		exfat_remove_entries(parent_inode, &amp;old_es, ES_IDX_FIRST_FILENAME + 1);</div><div class='add'>+		exfat_init_ext_entry(&amp;old_es, num_new_entries, p_uniname);</div><div class='ctx'> 	}</div><div class='del'>-	return 0;</div><div class='add'>+	return exfat_put_dentry_set(&amp;old_es, sync);</div><div class='add'>+</div><div class='add'>+put_old_es:</div><div class='add'>+	exfat_put_dentry_set(&amp;old_es, false);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int exfat_move_file(struct inode *inode, struct exfat_chain *p_olddir,</div><div class='del'>-		int oldentry, struct exfat_chain *p_newdir,</div><div class='add'>+static int exfat_move_file(struct inode *parent_inode,</div><div class='ctx'> 		struct exfat_uni_name *p_uniname, struct exfat_inode_info *ei)</div><div class='ctx'> {</div><div class='del'>-	int ret, newentry, num_new_entries, num_old_entries;</div><div class='del'>-	sector_t sector_mov, sector_new;</div><div class='add'>+	int ret, newentry, num_new_entries;</div><div class='ctx'> 	struct exfat_dentry *epmov, *epnew;</div><div class='del'>-	struct super_block *sb = inode-&gt;i_sb;</div><div class='del'>-	struct buffer_head *mov_bh, *new_bh;</div><div class='del'>-</div><div class='del'>-	epmov = exfat_get_dentry(sb, p_olddir, oldentry, &amp;mov_bh, &amp;sector_mov);</div><div class='del'>-	if (!epmov)</div><div class='del'>-		return -EIO;</div><div class='del'>-</div><div class='del'>-	num_old_entries = exfat_count_ext_entries(sb, p_olddir, oldentry,</div><div class='del'>-		epmov);</div><div class='del'>-	if (num_old_entries &lt; 0)</div><div class='del'>-		return -EIO;</div><div class='del'>-	num_old_entries++;</div><div class='add'>+	struct exfat_entry_set_cache mov_es, new_es;</div><div class='add'>+	struct exfat_chain newdir;</div><div class='ctx'> </div><div class='ctx'> 	num_new_entries = exfat_calc_num_entries(p_uniname);</div><div class='ctx'> 	if (num_new_entries &lt; 0)</div><div class='ctx'> 		return num_new_entries;</div><div class='ctx'> </div><div class='del'>-	newentry = exfat_find_empty_entry(inode, p_newdir, num_new_entries);</div><div class='del'>-	if (newentry &lt; 0)</div><div class='del'>-		return newentry; /* -EIO or -ENOSPC */</div><div class='del'>-</div><div class='del'>-	epnew = exfat_get_dentry(sb, p_newdir, newentry, &amp;new_bh, &amp;sector_new);</div><div class='del'>-	if (!epnew)</div><div class='add'>+	ret = exfat_get_dentry_set_by_ei(&amp;mov_es, parent_inode-&gt;i_sb, ei);</div><div class='add'>+	if (ret)</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> </div><div class='del'>-	*epnew = *epmov;</div><div class='del'>-	if (exfat_get_entry_type(epnew) == TYPE_FILE) {</div><div class='del'>-		epnew-&gt;dentry.file.attr |= cpu_to_le16(ATTR_ARCHIVE);</div><div class='del'>-		ei-&gt;attr |= ATTR_ARCHIVE;</div><div class='add'>+	newentry = exfat_find_empty_entry(parent_inode, &amp;newdir,</div><div class='add'>+			num_new_entries, &amp;new_es);</div><div class='add'>+	if (newentry &lt; 0) {</div><div class='add'>+		ret = newentry; /* -EIO or -ENOSPC */</div><div class='add'>+		goto put_mov_es;</div><div class='ctx'> 	}</div><div class='del'>-	exfat_update_bh(new_bh, IS_DIRSYNC(inode));</div><div class='del'>-	brelse(mov_bh);</div><div class='del'>-	brelse(new_bh);</div><div class='ctx'> </div><div class='del'>-	epmov = exfat_get_dentry(sb, p_olddir, oldentry + 1, &amp;mov_bh,</div><div class='del'>-		&amp;sector_mov);</div><div class='del'>-	if (!epmov)</div><div class='del'>-		return -EIO;</div><div class='del'>-	epnew = exfat_get_dentry(sb, p_newdir, newentry + 1, &amp;new_bh,</div><div class='del'>-		&amp;sector_new);</div><div class='del'>-	if (!epnew) {</div><div class='del'>-		brelse(mov_bh);</div><div class='del'>-		return -EIO;</div><div class='add'>+	epmov = exfat_get_dentry_cached(&amp;mov_es, ES_IDX_FILE);</div><div class='add'>+	epnew = exfat_get_dentry_cached(&amp;new_es, ES_IDX_FILE);</div><div class='add'>+	*epnew = *epmov;</div><div class='add'>+	if (exfat_get_entry_type(epnew) == TYPE_FILE) {</div><div class='add'>+		epnew-&gt;dentry.file.attr |= cpu_to_le16(EXFAT_ATTR_ARCHIVE);</div><div class='add'>+		ei-&gt;attr |= EXFAT_ATTR_ARCHIVE;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	epmov = exfat_get_dentry_cached(&amp;mov_es, ES_IDX_STREAM);</div><div class='add'>+	epnew = exfat_get_dentry_cached(&amp;new_es, ES_IDX_STREAM);</div><div class='ctx'> 	*epnew = *epmov;</div><div class='del'>-	exfat_update_bh(new_bh, IS_DIRSYNC(inode));</div><div class='del'>-	brelse(mov_bh);</div><div class='del'>-	brelse(new_bh);</div><div class='ctx'> </div><div class='del'>-	ret = exfat_init_ext_entry(inode, p_newdir, newentry, num_new_entries,</div><div class='del'>-		p_uniname);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='add'>+	exfat_init_ext_entry(&amp;new_es, num_new_entries, p_uniname);</div><div class='add'>+	exfat_remove_entries(parent_inode, &amp;mov_es, ES_IDX_FILE);</div><div class='ctx'> </div><div class='del'>-	exfat_remove_entries(inode, p_olddir, oldentry, 0, num_old_entries);</div><div class='add'>+	ei-&gt;dir = newdir;</div><div class='add'>+	ei-&gt;entry = newentry;</div><div class='ctx'> </div><div class='del'>-	exfat_chain_set(&amp;ei-&gt;dir, p_newdir-&gt;dir, p_newdir-&gt;size,</div><div class='del'>-		p_newdir-&gt;flags);</div><div class='add'>+	ret = exfat_put_dentry_set(&amp;new_es, IS_DIRSYNC(parent_inode));</div><div class='add'>+	if (ret)</div><div class='add'>+		goto put_mov_es;</div><div class='ctx'> </div><div class='del'>-	ei-&gt;entry = newentry;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='add'>+	return exfat_put_dentry_set(&amp;mov_es, IS_DIRSYNC(parent_inode));</div><div class='ctx'> </div><div class='del'>-static void exfat_update_parent_info(struct exfat_inode_info *ei,</div><div class='del'>-		struct inode *parent_inode)</div><div class='del'>-{</div><div class='del'>-	struct exfat_sb_info *sbi = EXFAT_SB(parent_inode-&gt;i_sb);</div><div class='del'>-	struct exfat_inode_info *parent_ei = EXFAT_I(parent_inode);</div><div class='del'>-	loff_t parent_isize = i_size_read(parent_inode);</div><div class='add'>+put_mov_es:</div><div class='add'>+	exfat_put_dentry_set(&amp;mov_es, false);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * the problem that struct exfat_inode_info caches wrong parent info.</div><div class='del'>-	 *</div><div class='del'>-	 * because of flag-mismatch of ei-&gt;dir,</div><div class='del'>-	 * there is abnormal traversing cluster chain.</div><div class='del'>-	 */</div><div class='del'>-	if (unlikely(parent_ei-&gt;flags != ei-&gt;dir.flags ||</div><div class='del'>-		     parent_isize != EXFAT_CLU_TO_B(ei-&gt;dir.size, sbi) ||</div><div class='del'>-		     parent_ei-&gt;start_clu != ei-&gt;dir.dir)) {</div><div class='del'>-		exfat_chain_set(&amp;ei-&gt;dir, parent_ei-&gt;start_clu,</div><div class='del'>-			EXFAT_B_TO_CLU_ROUND_UP(parent_isize, sbi),</div><div class='del'>-			parent_ei-&gt;flags);</div><div class='del'>-	}</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* rename or move a old file into a new file */</div><div class='hunk'>@@ -1187,20 +1138,12 @@ static int __exfat_rename(struct inode *old_parent_inode,</div><div class='ctx'> 		struct dentry *new_dentry)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='del'>-	int dentry;</div><div class='del'>-	struct exfat_chain olddir, newdir;</div><div class='del'>-	struct exfat_chain *p_dir = NULL;</div><div class='ctx'> 	struct exfat_uni_name uni_name;</div><div class='del'>-	struct exfat_dentry *ep;</div><div class='ctx'> 	struct super_block *sb = old_parent_inode-&gt;i_sb;</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='ctx'> 	const unsigned char *new_path = new_dentry-&gt;d_name.name;</div><div class='ctx'> 	struct inode *new_inode = new_dentry-&gt;d_inode;</div><div class='del'>-	int num_entries;</div><div class='ctx'> 	struct exfat_inode_info *new_ei = NULL;</div><div class='del'>-	unsigned int new_entry_type = TYPE_UNUSED;</div><div class='del'>-	int new_entry = 0;</div><div class='del'>-	struct buffer_head *old_bh, *new_bh = NULL;</div><div class='ctx'> </div><div class='ctx'> 	/* check the validity of pointer parameters */</div><div class='ctx'> 	if (new_path == NULL || strlen(new_path) == 0)</div><div class='hunk'>@@ -1211,18 +1154,6 @@ static int __exfat_rename(struct inode *old_parent_inode,</div><div class='ctx'> 		return -ENOENT;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	exfat_update_parent_info(ei, old_parent_inode);</div><div class='del'>-</div><div class='del'>-	exfat_chain_dup(&amp;olddir, &amp;ei-&gt;dir);</div><div class='del'>-	dentry = ei-&gt;entry;</div><div class='del'>-</div><div class='del'>-	ep = exfat_get_dentry(sb, &amp;olddir, dentry, &amp;old_bh, NULL);</div><div class='del'>-	if (!ep) {</div><div class='del'>-		ret = -EIO;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	brelse(old_bh);</div><div class='del'>-</div><div class='ctx'> 	/* check whether new dir is existing directory and empty */</div><div class='ctx'> 	if (new_inode) {</div><div class='ctx'> 		ret = -EIO;</div><div class='hunk'>@@ -1233,19 +1164,8 @@ static int __exfat_rename(struct inode *old_parent_inode,</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		exfat_update_parent_info(new_ei, new_parent_inode);</div><div class='del'>-</div><div class='del'>-		p_dir = &amp;(new_ei-&gt;dir);</div><div class='del'>-		new_entry = new_ei-&gt;entry;</div><div class='del'>-		ep = exfat_get_dentry(sb, p_dir, new_entry, &amp;new_bh, NULL);</div><div class='del'>-		if (!ep)</div><div class='del'>-			goto out;</div><div class='del'>-</div><div class='del'>-		new_entry_type = exfat_get_entry_type(ep);</div><div class='del'>-		brelse(new_bh);</div><div class='del'>-</div><div class='ctx'> 		/* if new_inode exists, update ei */</div><div class='del'>-		if (new_entry_type == TYPE_DIR) {</div><div class='add'>+		if (S_ISDIR(new_inode-&gt;i_mode)) {</div><div class='ctx'> 			struct exfat_chain new_clu;</div><div class='ctx'> </div><div class='ctx'> 			new_clu.dir = new_ei-&gt;start_clu;</div><div class='hunk'>@@ -1261,43 +1181,36 @@ static int __exfat_rename(struct inode *old_parent_inode,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* check the validity of directory name in the given new pathname */</div><div class='del'>-	ret = exfat_resolve_path(new_parent_inode, new_path, &amp;newdir,</div><div class='del'>-			&amp;uni_name);</div><div class='add'>+	ret = exfat_resolve_path(new_parent_inode, new_path, &amp;uni_name);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	exfat_set_volume_dirty(sb);</div><div class='ctx'> </div><div class='del'>-	if (olddir.dir == newdir.dir)</div><div class='del'>-		ret = exfat_rename_file(new_parent_inode, &amp;olddir, dentry,</div><div class='del'>-				&amp;uni_name, ei);</div><div class='add'>+	if (new_parent_inode == old_parent_inode)</div><div class='add'>+		ret = exfat_rename_file(new_parent_inode, &amp;uni_name, ei);</div><div class='ctx'> 	else</div><div class='del'>-		ret = exfat_move_file(new_parent_inode, &amp;olddir, dentry,</div><div class='del'>-				&amp;newdir, &amp;uni_name, ei);</div><div class='add'>+		ret = exfat_move_file(new_parent_inode, &amp;uni_name, ei);</div><div class='ctx'> </div><div class='ctx'> 	if (!ret &amp;&amp; new_inode) {</div><div class='add'>+		struct exfat_entry_set_cache es;</div><div class='add'>+</div><div class='ctx'> 		/* delete entries of new_dir */</div><div class='del'>-		ep = exfat_get_dentry(sb, p_dir, new_entry, &amp;new_bh, NULL);</div><div class='del'>-		if (!ep) {</div><div class='add'>+		ret = exfat_get_dentry_set_by_ei(&amp;es, sb, new_ei);</div><div class='add'>+		if (ret) {</div><div class='ctx'> 			ret = -EIO;</div><div class='ctx'> 			goto del_out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		num_entries = exfat_count_ext_entries(sb, p_dir, new_entry, ep);</div><div class='del'>-		if (num_entries &lt; 0) {</div><div class='del'>-			ret = -EIO;</div><div class='del'>-			goto del_out;</div><div class='del'>-		}</div><div class='del'>-		brelse(new_bh);</div><div class='add'>+		exfat_remove_entries(new_inode, &amp;es, ES_IDX_FILE);</div><div class='ctx'> </div><div class='del'>-		if (exfat_remove_entries(new_inode, p_dir, new_entry, 0,</div><div class='del'>-				num_entries + 1)) {</div><div class='del'>-			ret = -EIO;</div><div class='add'>+		ret = exfat_put_dentry_set(&amp;es, IS_DIRSYNC(new_inode));</div><div class='add'>+		if (ret)</div><div class='ctx'> 			goto del_out;</div><div class='del'>-		}</div><div class='ctx'> </div><div class='ctx'> 		/* Free the clusters if new_inode is a dir(as if exfat_rmdir) */</div><div class='del'>-		if (new_entry_type == TYPE_DIR) {</div><div class='add'>+		if (S_ISDIR(new_inode-&gt;i_mode) &amp;&amp;</div><div class='add'>+		    new_ei-&gt;start_clu != EXFAT_EOF_CLUSTER) {</div><div class='ctx'> 			/* new_ei, new_clu_to_free */</div><div class='ctx'> 			struct exfat_chain new_clu_to_free;</div><div class='ctx'> </div><div class='hunk'>@@ -1311,6 +1224,7 @@ static int __exfat_rename(struct inode *old_parent_inode,</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			i_size_write(new_inode, 0);</div><div class='add'>+			new_ei-&gt;valid_size = 0;</div><div class='ctx'> 			new_ei-&gt;start_clu = EXFAT_EOF_CLUSTER;</div><div class='ctx'> 			new_ei-&gt;flags = ALLOC_NO_FAT_CHAIN;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1321,12 +1235,11 @@ del_out:</div><div class='ctx'> 		 */</div><div class='ctx'> 		new_ei-&gt;dir.dir = DIR_DELETED;</div><div class='ctx'> 	}</div><div class='del'>-	exfat_clear_volume_dirty(sb);</div><div class='ctx'> out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int exfat_rename(struct user_namespace *mnt_userns,</div><div class='add'>+static int exfat_rename(struct mnt_idmap *idmap,</div><div class='ctx'> 			struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> 			struct inode *new_dir, struct dentry *new_dentry,</div><div class='ctx'> 			unsigned int flags)</div><div class='hunk'>@@ -1335,6 +1248,7 @@ static int exfat_rename(struct user_namespace *mnt_userns,</div><div class='ctx'> 	struct super_block *sb = old_dir-&gt;i_sb;</div><div class='ctx'> 	loff_t i_pos;</div><div class='ctx'> 	int err;</div><div class='add'>+	loff_t size = i_size_read(new_dir);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The VFS already checks for existence, so for local filesystems</div><div class='hunk'>@@ -1353,10 +1267,10 @@ static int exfat_rename(struct user_namespace *mnt_userns,</div><div class='ctx'> 		goto unlock;</div><div class='ctx'> </div><div class='ctx'> 	inode_inc_iversion(new_dir);</div><div class='del'>-	new_dir-&gt;i_ctime = new_dir-&gt;i_mtime = new_dir-&gt;i_atime =</div><div class='del'>-		EXFAT_I(new_dir)-&gt;i_crtime = current_time(new_dir);</div><div class='del'>-	exfat_truncate_atime(&amp;new_dir-&gt;i_atime);</div><div class='del'>-	if (IS_DIRSYNC(new_dir))</div><div class='add'>+	simple_rename_timestamp(old_dir, old_dentry, new_dir, new_dentry);</div><div class='add'>+	EXFAT_I(new_dir)-&gt;i_crtime = current_time(new_dir);</div><div class='add'>+	exfat_truncate_inode_atime(new_dir);</div><div class='add'>+	if (IS_DIRSYNC(new_dir) &amp;&amp; size != i_size_read(new_dir))</div><div class='ctx'> 		exfat_sync_inode(new_dir);</div><div class='ctx'> 	else</div><div class='ctx'> 		mark_inode_dirty(new_dir);</div><div class='hunk'>@@ -1377,10 +1291,7 @@ static int exfat_rename(struct user_namespace *mnt_userns,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	inode_inc_iversion(old_dir);</div><div class='del'>-	old_dir-&gt;i_ctime = old_dir-&gt;i_mtime = current_time(old_dir);</div><div class='del'>-	if (IS_DIRSYNC(old_dir))</div><div class='del'>-		exfat_sync_inode(old_dir);</div><div class='del'>-	else</div><div class='add'>+	if (new_dir != old_dir)</div><div class='ctx'> 		mark_inode_dirty(old_dir);</div><div class='ctx'> </div><div class='ctx'> 	if (new_inode) {</div><div class='hunk'>@@ -1395,8 +1306,7 @@ static int exfat_rename(struct user_namespace *mnt_userns,</div><div class='ctx'> 			exfat_warn(sb, "abnormal access to an inode dropped");</div><div class='ctx'> 			WARN_ON(new_inode-&gt;i_nlink == 0);</div><div class='ctx'> 		}</div><div class='del'>-		new_inode-&gt;i_ctime = EXFAT_I(new_inode)-&gt;i_crtime =</div><div class='del'>-			current_time(new_inode);</div><div class='add'>+		EXFAT_I(new_inode)-&gt;i_crtime = current_time(new_inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> unlock:</div><div class='head'>diff --git a/fs/exfat/nls.c b/fs/exfat/nls.c<br/>index 314d5407a1be..57db08a5271c 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/exfat/nls.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exfat/nls.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/exfat/nls.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/exfat/nls.c</a></div><div class='hunk'>@@ -6,7 +6,7 @@</div><div class='ctx'> #include &lt;linux/string.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/buffer_head.h&gt;</div><div class='del'>-#include &lt;asm/unaligned.h&gt;</div><div class='add'>+#include &lt;linux/unaligned.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "exfat_raw.h"</div><div class='ctx'> #include "exfat_fs.h"</div><div class='hunk'>@@ -509,7 +509,7 @@ static int exfat_utf8_to_utf16(struct super_block *sb,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (unilen &gt; MAX_NAME_LENGTH) {</div><div class='del'>-		exfat_err(sb, "failed to %s (estr:ENAMETOOLONG) nls len : %d, unilen : %d &gt; %d",</div><div class='add'>+		exfat_debug(sb, "failed to %s (estr:ENAMETOOLONG) nls len : %d, unilen : %d &gt; %d",</div><div class='ctx'> 			  __func__, len, unilen, MAX_NAME_LENGTH);</div><div class='ctx'> 		return -ENAMETOOLONG;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -616,9 +616,6 @@ static int exfat_nls_to_ucs2(struct super_block *sb,</div><div class='ctx'> 		unilen++;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (p_cstring[i] != '\0')</div><div class='del'>-		lossy |= NLS_NAME_OVERLEN;</div><div class='del'>-</div><div class='ctx'> 	*uniname = '\0';</div><div class='ctx'> 	p_uniname-&gt;name_len = unilen;</div><div class='ctx'> 	p_uniname-&gt;name_hash = exfat_calc_chksum16(upname, unilen &lt;&lt; 1, 0,</div><div class='hunk'>@@ -655,7 +652,6 @@ static int exfat_load_upcase_table(struct super_block *sb,</div><div class='ctx'> 	unsigned int sect_size = sb-&gt;s_blocksize;</div><div class='ctx'> 	unsigned int i, index = 0;</div><div class='ctx'> 	u32 chksum = 0;</div><div class='del'>-	int ret;</div><div class='ctx'> 	unsigned char skip = false;</div><div class='ctx'> 	unsigned short *upcase_table;</div><div class='ctx'> </div><div class='hunk'>@@ -671,10 +667,9 @@ static int exfat_load_upcase_table(struct super_block *sb,</div><div class='ctx'> </div><div class='ctx'> 		bh = sb_bread(sb, sector);</div><div class='ctx'> 		if (!bh) {</div><div class='del'>-			exfat_err(sb, "failed to read sector(0x%llx)\n",</div><div class='add'>+			exfat_err(sb, "failed to read sector(0x%llx)",</div><div class='ctx'> 				  (unsigned long long)sector);</div><div class='del'>-			ret = -EIO;</div><div class='del'>-			goto free_table;</div><div class='add'>+			return -EIO;</div><div class='ctx'> 		}</div><div class='ctx'> 		sector++;</div><div class='ctx'> 		for (i = 0; i &lt; sect_size &amp;&amp; index &lt;= 0xFFFF; i += 2) {</div><div class='hunk'>@@ -701,15 +696,12 @@ static int exfat_load_upcase_table(struct super_block *sb,</div><div class='ctx'> </div><div class='ctx'> 	exfat_err(sb, "failed to load upcase table (idx : 0x%08x, chksum : 0x%08x, utbl_chksum : 0x%08x)",</div><div class='ctx'> 		  index, chksum, utbl_checksum);</div><div class='del'>-	ret = -EINVAL;</div><div class='del'>-free_table:</div><div class='del'>-	exfat_free_upcase_table(sbi);</div><div class='del'>-	return ret;</div><div class='add'>+	return -EINVAL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int exfat_load_default_upcase_table(struct super_block *sb)</div><div class='ctx'> {</div><div class='del'>-	int i, ret = -EIO;</div><div class='add'>+	int i;</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='ctx'> 	unsigned char skip = false;</div><div class='ctx'> 	unsigned short uni = 0, *upcase_table;</div><div class='hunk'>@@ -740,8 +732,7 @@ static int exfat_load_default_upcase_table(struct super_block *sb)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/* FATAL error: default upcase table has error */</div><div class='del'>-	exfat_free_upcase_table(sbi);</div><div class='del'>-	return ret;</div><div class='add'>+	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int exfat_create_upcase_table(struct super_block *sb)</div><div class='hunk'>@@ -761,7 +752,7 @@ int exfat_create_upcase_table(struct super_block *sb)</div><div class='ctx'> </div><div class='ctx'> 	while (clu.dir != EXFAT_EOF_CLUSTER) {</div><div class='ctx'> 		for (i = 0; i &lt; sbi-&gt;dentries_per_clu; i++) {</div><div class='del'>-			ep = exfat_get_dentry(sb, &amp;clu, i, &amp;bh, NULL);</div><div class='add'>+			ep = exfat_get_dentry(sb, &amp;clu, i, &amp;bh);</div><div class='ctx'> 			if (!ep)</div><div class='ctx'> 				return -EIO;</div><div class='ctx'> </div><div class='hunk'>@@ -785,14 +776,17 @@ int exfat_create_upcase_table(struct super_block *sb)</div><div class='ctx'> 				le32_to_cpu(ep-&gt;dentry.upcase.checksum));</div><div class='ctx'> </div><div class='ctx'> 			brelse(bh);</div><div class='del'>-			if (ret &amp;&amp; ret != -EIO)</div><div class='add'>+			if (ret &amp;&amp; ret != -EIO) {</div><div class='add'>+				/* free memory from exfat_load_upcase_table call */</div><div class='add'>+				exfat_free_upcase_table(sbi);</div><div class='ctx'> 				goto load_default;</div><div class='add'>+			}</div><div class='ctx'> </div><div class='ctx'> 			/* load successfully */</div><div class='ctx'> 			return ret;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (exfat_get_next_cluster(sb, &amp;(clu.dir)))</div><div class='add'>+		if (exfat_get_next_cluster(sb, &amp;clu.dir))</div><div class='ctx'> 			return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -804,4 +798,5 @@ load_default:</div><div class='ctx'> void exfat_free_upcase_table(struct exfat_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	kvfree(sbi-&gt;vol_utbl);</div><div class='add'>+	sbi-&gt;vol_utbl = NULL;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/exfat/super.c b/fs/exfat/super.c<br/>index 5539ffc20d16..10e872a99663 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/exfat/super.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exfat/super.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/exfat/super.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/exfat/super.c</a></div><div class='hunk'>@@ -17,6 +17,7 @@</div><div class='ctx'> #include &lt;linux/iversion.h&gt;</div><div class='ctx'> #include &lt;linux/nls.h&gt;</div><div class='ctx'> #include &lt;linux/buffer_head.h&gt;</div><div class='add'>+#include &lt;linux/magic.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "exfat_raw.h"</div><div class='ctx'> #include "exfat_fs.h"</div><div class='hunk'>@@ -30,14 +31,14 @@ static void exfat_free_iocharset(struct exfat_sb_info *sbi)</div><div class='ctx'> 		kfree(sbi-&gt;options.iocharset);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void exfat_delayed_free(struct rcu_head *p)</div><div class='add'>+static void exfat_set_iocharset(struct exfat_mount_options *opts,</div><div class='add'>+				char *iocharset)</div><div class='ctx'> {</div><div class='del'>-	struct exfat_sb_info *sbi = container_of(p, struct exfat_sb_info, rcu);</div><div class='del'>-</div><div class='del'>-	unload_nls(sbi-&gt;nls_io);</div><div class='del'>-	exfat_free_iocharset(sbi);</div><div class='del'>-	exfat_free_upcase_table(sbi);</div><div class='del'>-	kfree(sbi);</div><div class='add'>+	opts-&gt;iocharset = iocharset;</div><div class='add'>+	if (!strcmp(opts-&gt;iocharset, "utf8"))</div><div class='add'>+		opts-&gt;utf8 = 1;</div><div class='add'>+	else</div><div class='add'>+		opts-&gt;utf8 = 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void exfat_put_super(struct super_block *sb)</div><div class='hunk'>@@ -45,28 +46,10 @@ static void exfat_put_super(struct super_block *sb)</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;sbi-&gt;s_lock);</div><div class='add'>+	exfat_clear_volume_dirty(sb);</div><div class='ctx'> 	exfat_free_bitmap(sbi);</div><div class='ctx'> 	brelse(sbi-&gt;boot_bh);</div><div class='ctx'> 	mutex_unlock(&amp;sbi-&gt;s_lock);</div><div class='del'>-</div><div class='del'>-	call_rcu(&amp;sbi-&gt;rcu, exfat_delayed_free);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int exfat_sync_fs(struct super_block *sb, int wait)</div><div class='del'>-{</div><div class='del'>-	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='del'>-	int err = 0;</div><div class='del'>-</div><div class='del'>-	if (!wait)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	/* If there are some dirty buffers in the bdev inode */</div><div class='del'>-	mutex_lock(&amp;sbi-&gt;s_lock);</div><div class='del'>-	sync_blockdev(sb-&gt;s_bdev);</div><div class='del'>-	if (exfat_clear_volume_dirty(sb))</div><div class='del'>-		err = -EIO;</div><div class='del'>-	mutex_unlock(&amp;sbi-&gt;s_lock);</div><div class='del'>-	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int exfat_statfs(struct dentry *dentry, struct kstatfs *buf)</div><div class='hunk'>@@ -75,15 +58,6 @@ static int exfat_statfs(struct dentry *dentry, struct kstatfs *buf)</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='ctx'> 	unsigned long long id = huge_encode_dev(sb-&gt;s_bdev-&gt;bd_dev);</div><div class='ctx'> </div><div class='del'>-	if (sbi-&gt;used_clusters == EXFAT_CLUSTERS_UNTRACKED) {</div><div class='del'>-		mutex_lock(&amp;sbi-&gt;s_lock);</div><div class='del'>-		if (exfat_count_used_clusters(sb, &amp;sbi-&gt;used_clusters)) {</div><div class='del'>-			mutex_unlock(&amp;sbi-&gt;s_lock);</div><div class='del'>-			return -EIO;</div><div class='del'>-		}</div><div class='del'>-		mutex_unlock(&amp;sbi-&gt;s_lock);</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	buf-&gt;f_type = sb-&gt;s_magic;</div><div class='ctx'> 	buf-&gt;f_bsize = sbi-&gt;cluster_size;</div><div class='ctx'> 	buf-&gt;f_blocks = sbi-&gt;num_clusters - 2; /* clu 0 &amp; 1 */</div><div class='hunk'>@@ -99,7 +73,6 @@ static int exfat_set_vol_flags(struct super_block *sb, unsigned short new_flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='ctx'> 	struct boot_sector *p_boot = (struct boot_sector *)sbi-&gt;boot_bh-&gt;b_data;</div><div class='del'>-	bool sync;</div><div class='ctx'> </div><div class='ctx'> 	/* retain persistent-flags */</div><div class='ctx'> 	new_flags |= sbi-&gt;vol_flags_persistent;</div><div class='hunk'>@@ -118,16 +91,11 @@ static int exfat_set_vol_flags(struct super_block *sb, unsigned short new_flags)</div><div class='ctx'> </div><div class='ctx'> 	p_boot-&gt;vol_flags = cpu_to_le16(new_flags);</div><div class='ctx'> </div><div class='del'>-	if ((new_flags &amp; VOLUME_DIRTY) &amp;&amp; !buffer_dirty(sbi-&gt;boot_bh))</div><div class='del'>-		sync = true;</div><div class='del'>-	else</div><div class='del'>-		sync = false;</div><div class='del'>-</div><div class='ctx'> 	set_buffer_uptodate(sbi-&gt;boot_bh);</div><div class='ctx'> 	mark_buffer_dirty(sbi-&gt;boot_bh);</div><div class='ctx'> </div><div class='del'>-	if (sync)</div><div class='del'>-		sync_dirty_buffer(sbi-&gt;boot_bh);</div><div class='add'>+	__sync_dirty_buffer(sbi-&gt;boot_bh, REQ_SYNC | REQ_FUA | REQ_PREFLUSH);</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -173,16 +141,57 @@ static int exfat_show_options(struct seq_file *m, struct dentry *root)</div><div class='ctx'> 		seq_puts(m, ",errors=remount-ro");</div><div class='ctx'> 	if (opts-&gt;discard)</div><div class='ctx'> 		seq_puts(m, ",discard");</div><div class='del'>-	if (opts-&gt;time_offset)</div><div class='add'>+	if (opts-&gt;keep_last_dots)</div><div class='add'>+		seq_puts(m, ",keep_last_dots");</div><div class='add'>+	if (opts-&gt;sys_tz)</div><div class='add'>+		seq_puts(m, ",sys_tz");</div><div class='add'>+	else if (opts-&gt;time_offset)</div><div class='ctx'> 		seq_printf(m, ",time_offset=%d", opts-&gt;time_offset);</div><div class='add'>+	if (opts-&gt;zero_size_dir)</div><div class='add'>+		seq_puts(m, ",zero_size_dir");</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+int exfat_force_shutdown(struct super_block *sb, u32 flags)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+	struct exfat_sb_info *sbi = sb-&gt;s_fs_info;</div><div class='add'>+	struct exfat_mount_options *opts = &amp;sbi-&gt;options;</div><div class='add'>+</div><div class='add'>+	if (exfat_forced_shutdown(sb))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	switch (flags) {</div><div class='add'>+	case EXFAT_GOING_DOWN_DEFAULT:</div><div class='add'>+	case EXFAT_GOING_DOWN_FULLSYNC:</div><div class='add'>+		ret = bdev_freeze(sb-&gt;s_bdev);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		bdev_thaw(sb-&gt;s_bdev);</div><div class='add'>+		set_bit(EXFAT_FLAGS_SHUTDOWN, &amp;sbi-&gt;s_exfat_flags);</div><div class='add'>+		break;</div><div class='add'>+	case EXFAT_GOING_DOWN_NOSYNC:</div><div class='add'>+		set_bit(EXFAT_FLAGS_SHUTDOWN, &amp;sbi-&gt;s_exfat_flags);</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (opts-&gt;discard)</div><div class='add'>+		opts-&gt;discard = 0;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void exfat_shutdown(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	exfat_force_shutdown(sb, EXFAT_GOING_DOWN_NOSYNC);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static struct inode *exfat_alloc_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct exfat_inode_info *ei;</div><div class='ctx'> </div><div class='del'>-	ei = kmem_cache_alloc(exfat_inode_cachep, GFP_NOFS);</div><div class='add'>+	ei = alloc_inode_sb(sb, exfat_inode_cachep, GFP_NOFS);</div><div class='ctx'> 	if (!ei)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='hunk'>@@ -201,9 +210,9 @@ static const struct super_operations exfat_sops = {</div><div class='ctx'> 	.write_inode	= exfat_write_inode,</div><div class='ctx'> 	.evict_inode	= exfat_evict_inode,</div><div class='ctx'> 	.put_super	= exfat_put_super,</div><div class='del'>-	.sync_fs	= exfat_sync_fs,</div><div class='ctx'> 	.statfs		= exfat_statfs,</div><div class='ctx'> 	.show_options	= exfat_show_options,</div><div class='add'>+	.shutdown	= exfat_shutdown,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> enum {</div><div class='hunk'>@@ -216,7 +225,10 @@ enum {</div><div class='ctx'> 	Opt_charset,</div><div class='ctx'> 	Opt_errors,</div><div class='ctx'> 	Opt_discard,</div><div class='add'>+	Opt_keep_last_dots,</div><div class='add'>+	Opt_sys_tz,</div><div class='ctx'> 	Opt_time_offset,</div><div class='add'>+	Opt_zero_size_dir,</div><div class='ctx'> </div><div class='ctx'> 	/* Deprecated options */</div><div class='ctx'> 	Opt_utf8,</div><div class='hunk'>@@ -233,16 +245,19 @@ static const struct constant_table exfat_param_enums[] = {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct fs_parameter_spec exfat_parameters[] = {</div><div class='del'>-	fsparam_u32("uid",			Opt_uid),</div><div class='del'>-	fsparam_u32("gid",			Opt_gid),</div><div class='add'>+	fsparam_uid("uid",			Opt_uid),</div><div class='add'>+	fsparam_gid("gid",			Opt_gid),</div><div class='ctx'> 	fsparam_u32oct("umask",			Opt_umask),</div><div class='ctx'> 	fsparam_u32oct("dmask",			Opt_dmask),</div><div class='ctx'> 	fsparam_u32oct("fmask",			Opt_fmask),</div><div class='ctx'> 	fsparam_u32oct("allow_utime",		Opt_allow_utime),</div><div class='ctx'> 	fsparam_string("iocharset",		Opt_charset),</div><div class='ctx'> 	fsparam_enum("errors",			Opt_errors, exfat_param_enums),</div><div class='del'>-	fsparam_flag("discard",			Opt_discard),</div><div class='add'>+	fsparam_flag_no("discard",		Opt_discard),</div><div class='add'>+	fsparam_flag("keep_last_dots",		Opt_keep_last_dots),</div><div class='add'>+	fsparam_flag("sys_tz",			Opt_sys_tz),</div><div class='ctx'> 	fsparam_s32("time_offset",		Opt_time_offset),</div><div class='add'>+	fsparam_flag_no("zero_size_dir",	Opt_zero_size_dir),</div><div class='ctx'> 	__fsparam(NULL, "utf8",			Opt_utf8, fs_param_deprecated,</div><div class='ctx'> 		  NULL),</div><div class='ctx'> 	__fsparam(NULL, "debug",		Opt_debug, fs_param_deprecated,</div><div class='hunk'>@@ -267,10 +282,10 @@ static int exfat_parse_param(struct fs_context *fc, struct fs_parameter *param)</div><div class='ctx'> </div><div class='ctx'> 	switch (opt) {</div><div class='ctx'> 	case Opt_uid:</div><div class='del'>-		opts-&gt;fs_uid = make_kuid(current_user_ns(), result.uint_32);</div><div class='add'>+		opts-&gt;fs_uid = result.uid;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case Opt_gid:</div><div class='del'>-		opts-&gt;fs_gid = make_kgid(current_user_ns(), result.uint_32);</div><div class='add'>+		opts-&gt;fs_gid = result.gid;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case Opt_umask:</div><div class='ctx'> 		opts-&gt;fs_fmask = result.uint_32;</div><div class='hunk'>@@ -287,14 +302,20 @@ static int exfat_parse_param(struct fs_context *fc, struct fs_parameter *param)</div><div class='ctx'> 		break;</div><div class='ctx'> 	case Opt_charset:</div><div class='ctx'> 		exfat_free_iocharset(sbi);</div><div class='del'>-		opts-&gt;iocharset = param-&gt;string;</div><div class='add'>+		exfat_set_iocharset(opts, param-&gt;string);</div><div class='ctx'> 		param-&gt;string = NULL;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case Opt_errors:</div><div class='ctx'> 		opts-&gt;errors = result.uint_32;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case Opt_discard:</div><div class='del'>-		opts-&gt;discard = 1;</div><div class='add'>+		opts-&gt;discard = !result.negated;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_keep_last_dots:</div><div class='add'>+		opts-&gt;keep_last_dots = 1;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_sys_tz:</div><div class='add'>+		opts-&gt;sys_tz = 1;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case Opt_time_offset:</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -305,6 +326,9 @@ static int exfat_parse_param(struct fs_context *fc, struct fs_parameter *param)</div><div class='ctx'> 			return -EINVAL;</div><div class='ctx'> 		opts-&gt;time_offset = result.int_32;</div><div class='ctx'> 		break;</div><div class='add'>+	case Opt_zero_size_dir:</div><div class='add'>+		opts-&gt;zero_size_dir = !result.negated;</div><div class='add'>+		break;</div><div class='ctx'> 	case Opt_utf8:</div><div class='ctx'> 	case Opt_debug:</div><div class='ctx'> 	case Opt_namecase:</div><div class='hunk'>@@ -327,13 +351,12 @@ static void exfat_hash_init(struct super_block *sb)</div><div class='ctx'> 		INIT_HLIST_HEAD(&amp;sbi-&gt;inode_hashtable[i]);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int exfat_read_root(struct inode *inode)</div><div class='add'>+static int exfat_read_root(struct inode *inode, struct exfat_chain *root_clu)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='ctx'> 	struct exfat_inode_info *ei = EXFAT_I(inode);</div><div class='del'>-	struct exfat_chain cdir;</div><div class='del'>-	int num_subdirs, num_clu = 0;</div><div class='add'>+	int num_subdirs;</div><div class='ctx'> </div><div class='ctx'> 	exfat_chain_set(&amp;ei-&gt;dir, sbi-&gt;root_dir, 0, ALLOC_FAT_CHAIN);</div><div class='ctx'> 	ei-&gt;entry = -1;</div><div class='hunk'>@@ -346,12 +369,9 @@ static int exfat_read_root(struct inode *inode)</div><div class='ctx'> 	ei-&gt;hint_stat.clu = sbi-&gt;root_dir;</div><div class='ctx'> 	ei-&gt;hint_femp.eidx = EXFAT_HINT_NONE;</div><div class='ctx'> </div><div class='del'>-	exfat_chain_set(&amp;cdir, sbi-&gt;root_dir, 0, ALLOC_FAT_CHAIN);</div><div class='del'>-	if (exfat_count_num_clusters(sb, &amp;cdir, &amp;num_clu))</div><div class='del'>-		return -EIO;</div><div class='del'>-	i_size_write(inode, num_clu &lt;&lt; sbi-&gt;cluster_size_bits);</div><div class='add'>+	i_size_write(inode, EXFAT_CLU_TO_B(root_clu-&gt;size, sbi));</div><div class='ctx'> </div><div class='del'>-	num_subdirs = exfat_count_dir_entries(sb, &amp;cdir);</div><div class='add'>+	num_subdirs = exfat_count_dir_entries(sb, root_clu);</div><div class='ctx'> 	if (num_subdirs &lt; 0)</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	set_nlink(inode, num_subdirs + EXFAT_MIN_SUBDIR);</div><div class='hunk'>@@ -360,20 +380,16 @@ static int exfat_read_root(struct inode *inode)</div><div class='ctx'> 	inode-&gt;i_gid = sbi-&gt;options.fs_gid;</div><div class='ctx'> 	inode_inc_iversion(inode);</div><div class='ctx'> 	inode-&gt;i_generation = 0;</div><div class='del'>-	inode-&gt;i_mode = exfat_make_mode(sbi, ATTR_SUBDIR, 0777);</div><div class='add'>+	inode-&gt;i_mode = exfat_make_mode(sbi, EXFAT_ATTR_SUBDIR, 0777);</div><div class='ctx'> 	inode-&gt;i_op = &amp;exfat_dir_inode_operations;</div><div class='ctx'> 	inode-&gt;i_fop = &amp;exfat_dir_operations;</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_blocks = ((i_size_read(inode) + (sbi-&gt;cluster_size - 1))</div><div class='del'>-			&amp; ~(sbi-&gt;cluster_size - 1)) &gt;&gt; inode-&gt;i_blkbits;</div><div class='del'>-	EXFAT_I(inode)-&gt;i_pos = ((loff_t)sbi-&gt;root_dir &lt;&lt; 32) | 0xffffffff;</div><div class='del'>-	EXFAT_I(inode)-&gt;i_size_aligned = i_size_read(inode);</div><div class='del'>-	EXFAT_I(inode)-&gt;i_size_ondisk = i_size_read(inode);</div><div class='add'>+	inode-&gt;i_blocks = round_up(i_size_read(inode), sbi-&gt;cluster_size) &gt;&gt; 9;</div><div class='add'>+	ei-&gt;i_pos = ((loff_t)sbi-&gt;root_dir &lt;&lt; 32) | 0xffffffff;</div><div class='ctx'> </div><div class='del'>-	exfat_save_attr(inode, ATTR_SUBDIR);</div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_atime = inode-&gt;i_ctime = ei-&gt;i_crtime =</div><div class='del'>-		current_time(inode);</div><div class='del'>-	exfat_truncate_atime(&amp;inode-&gt;i_atime);</div><div class='add'>+	exfat_save_attr(inode, EXFAT_ATTR_SUBDIR);</div><div class='add'>+	ei-&gt;i_crtime = simple_inode_init_ts(inode);</div><div class='add'>+	exfat_truncate_inode_atime(inode);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -417,7 +433,10 @@ static int exfat_read_boot_sector(struct super_block *sb)</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='ctx'> </div><div class='ctx'> 	/* set block size to read super block */</div><div class='del'>-	sb_min_blocksize(sb, 512);</div><div class='add'>+	if (!sb_min_blocksize(sb, 512)) {</div><div class='add'>+		exfat_err(sb, "unable to set blocksize");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* read boot sector */</div><div class='ctx'> 	sbi-&gt;boot_bh = sb_bread(sb, 0);</div><div class='hunk'>@@ -455,7 +474,7 @@ static int exfat_read_boot_sector(struct super_block *sb)</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (p_boot-&gt;sect_size_bits &lt; EXFAT_MIN_SECT_SIZE_BITS ||</div><div class='ctx'> 	    p_boot-&gt;sect_size_bits &gt; EXFAT_MAX_SECT_SIZE_BITS) {</div><div class='del'>-		exfat_err(sb, "bogus sector size bits : %u\n",</div><div class='add'>+		exfat_err(sb, "bogus sector size bits : %u",</div><div class='ctx'> 				p_boot-&gt;sect_size_bits);</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -464,7 +483,7 @@ static int exfat_read_boot_sector(struct super_block *sb)</div><div class='ctx'> 	 * sect_per_clus_bits could be at least 0 and at most 25 - sect_size_bits.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (p_boot-&gt;sect_per_clus_bits &gt; EXFAT_MAX_SECT_PER_CLUS_BITS(p_boot)) {</div><div class='del'>-		exfat_err(sb, "bogus sectors bits per cluster : %u\n",</div><div class='add'>+		exfat_err(sb, "bogus sectors bits per cluster : %u",</div><div class='ctx'> 				p_boot-&gt;sect_per_clus_bits);</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -492,7 +511,6 @@ static int exfat_read_boot_sector(struct super_block *sb)</div><div class='ctx'> 	sbi-&gt;vol_flags = le16_to_cpu(p_boot-&gt;vol_flags);</div><div class='ctx'> 	sbi-&gt;vol_flags_persistent = sbi-&gt;vol_flags &amp; (VOLUME_DIRTY | MEDIA_FAILURE);</div><div class='ctx'> 	sbi-&gt;clu_srch_ptr = EXFAT_FIRST_CLUSTER;</div><div class='del'>-	sbi-&gt;used_clusters = EXFAT_CLUSTERS_UNTRACKED;</div><div class='ctx'> </div><div class='ctx'> 	/* check consistencies */</div><div class='ctx'> 	if ((u64)sbi-&gt;num_FAT_sectors &lt;&lt; p_boot-&gt;sect_size_bits &lt;</div><div class='hunk'>@@ -569,7 +587,8 @@ static int exfat_verify_boot_region(struct super_block *sb)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* mount the file system volume */</div><div class='del'>-static int __exfat_fill_super(struct super_block *sb)</div><div class='add'>+static int __exfat_fill_super(struct super_block *sb,</div><div class='add'>+		struct exfat_chain *root_clu)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='hunk'>@@ -586,6 +605,18 @@ static int __exfat_fill_super(struct super_block *sb)</div><div class='ctx'> 		goto free_bh;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Call exfat_count_num_cluster() before searching for up-case and</div><div class='add'>+	 * bitmap directory entries to avoid infinite loop if they are missing</div><div class='add'>+	 * and the cluster chain includes a loop.</div><div class='add'>+	 */</div><div class='add'>+	exfat_chain_set(root_clu, sbi-&gt;root_dir, 0, ALLOC_FAT_CHAIN);</div><div class='add'>+	ret = exfat_count_num_clusters(sb, root_clu, &amp;root_clu-&gt;size);</div><div class='add'>+	if (ret) {</div><div class='add'>+		exfat_err(sb, "failed to count the number of clusters in root");</div><div class='add'>+		goto free_bh;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	ret = exfat_create_upcase_table(sb);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		exfat_err(sb, "failed to load upcase table");</div><div class='hunk'>@@ -595,7 +626,18 @@ static int __exfat_fill_super(struct super_block *sb)</div><div class='ctx'> 	ret = exfat_load_bitmap(sb);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		exfat_err(sb, "failed to load alloc-bitmap");</div><div class='del'>-		goto free_upcase_table;</div><div class='add'>+		goto free_bh;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!exfat_test_bitmap(sb, sbi-&gt;root_dir)) {</div><div class='add'>+		exfat_warn(sb, "failed to test first cluster bit of root dir(%u)",</div><div class='add'>+			   sbi-&gt;root_dir);</div><div class='add'>+		/*</div><div class='add'>+		 * The first cluster bit of the root directory should never</div><div class='add'>+		 * be unset except when storage is corrupted. This bit is</div><div class='add'>+		 * set to allow operations after mount.</div><div class='add'>+		 */</div><div class='add'>+		exfat_set_bitmap(sb, sbi-&gt;root_dir, false);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = exfat_count_used_clusters(sb, &amp;sbi-&gt;used_clusters);</div><div class='hunk'>@@ -608,8 +650,6 @@ static int __exfat_fill_super(struct super_block *sb)</div><div class='ctx'> </div><div class='ctx'> free_alloc_bitmap:</div><div class='ctx'> 	exfat_free_bitmap(sbi);</div><div class='del'>-free_upcase_table:</div><div class='del'>-	exfat_free_upcase_table(sbi);</div><div class='ctx'> free_bh:</div><div class='ctx'> 	brelse(sbi-&gt;boot_bh);</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -620,18 +660,15 @@ static int exfat_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> 	struct exfat_sb_info *sbi = sb-&gt;s_fs_info;</div><div class='ctx'> 	struct exfat_mount_options *opts = &amp;sbi-&gt;options;</div><div class='ctx'> 	struct inode *root_inode;</div><div class='add'>+	struct exfat_chain root_clu;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (opts-&gt;allow_utime == (unsigned short)-1)</div><div class='ctx'> 		opts-&gt;allow_utime = ~opts-&gt;fs_dmask &amp; 0022;</div><div class='ctx'> </div><div class='del'>-	if (opts-&gt;discard) {</div><div class='del'>-		struct request_queue *q = bdev_get_queue(sb-&gt;s_bdev);</div><div class='del'>-</div><div class='del'>-		if (!blk_queue_discard(q)) {</div><div class='del'>-			exfat_warn(sb, "mounting with \"discard\" option, but the device does not support discard");</div><div class='del'>-			opts-&gt;discard = 0;</div><div class='del'>-		}</div><div class='add'>+	if (opts-&gt;discard &amp;&amp; !bdev_max_discard_sectors(sb-&gt;s_bdev)) {</div><div class='add'>+		exfat_warn(sb, "mounting with \"discard\" option, but the device does not support discard");</div><div class='add'>+		opts-&gt;discard = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	sb-&gt;s_flags |= SB_NODIRATIME;</div><div class='hunk'>@@ -642,7 +679,7 @@ static int exfat_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> 	sb-&gt;s_time_min = EXFAT_MIN_TIMESTAMP_SECS;</div><div class='ctx'> 	sb-&gt;s_time_max = EXFAT_MAX_TIMESTAMP_SECS;</div><div class='ctx'> </div><div class='del'>-	err = __exfat_fill_super(sb);</div><div class='add'>+	err = __exfat_fill_super(sb, &amp;root_clu);</div><div class='ctx'> 	if (err) {</div><div class='ctx'> 		exfat_err(sb, "failed to recognize exfat type");</div><div class='ctx'> 		goto check_nls_io;</div><div class='hunk'>@@ -651,8 +688,8 @@ static int exfat_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> 	/* set up enough so that it can read an inode */</div><div class='ctx'> 	exfat_hash_init(sb);</div><div class='ctx'> </div><div class='del'>-	if (!strcmp(sbi-&gt;options.iocharset, "utf8"))</div><div class='del'>-		opts-&gt;utf8 = 1;</div><div class='add'>+	if (sbi-&gt;options.utf8)</div><div class='add'>+		set_default_d_op(sb, &amp;exfat_utf8_dentry_ops);</div><div class='ctx'> 	else {</div><div class='ctx'> 		sbi-&gt;nls_io = load_nls(sbi-&gt;options.iocharset);</div><div class='ctx'> 		if (!sbi-&gt;nls_io) {</div><div class='hunk'>@@ -661,13 +698,9 @@ static int exfat_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> 			err = -EINVAL;</div><div class='ctx'> 			goto free_table;</div><div class='ctx'> 		}</div><div class='add'>+		set_default_d_op(sb, &amp;exfat_dentry_ops);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (sbi-&gt;options.utf8)</div><div class='del'>-		sb-&gt;s_d_op = &amp;exfat_utf8_dentry_ops;</div><div class='del'>-	else</div><div class='del'>-		sb-&gt;s_d_op = &amp;exfat_dentry_ops;</div><div class='del'>-</div><div class='ctx'> 	root_inode = new_inode(sb);</div><div class='ctx'> 	if (!root_inode) {</div><div class='ctx'> 		exfat_err(sb, "failed to allocate root inode");</div><div class='hunk'>@@ -677,7 +710,7 @@ static int exfat_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> </div><div class='ctx'> 	root_inode-&gt;i_ino = EXFAT_ROOT_INO;</div><div class='ctx'> 	inode_set_iversion(root_inode, 1);</div><div class='del'>-	err = exfat_read_root(root_inode);</div><div class='add'>+	err = exfat_read_root(root_inode, &amp;root_clu);</div><div class='ctx'> 	if (err) {</div><div class='ctx'> 		exfat_err(sb, "failed to initialize root inode");</div><div class='ctx'> 		goto put_inode;</div><div class='hunk'>@@ -700,15 +733,10 @@ put_inode:</div><div class='ctx'> 	sb-&gt;s_root = NULL;</div><div class='ctx'> </div><div class='ctx'> free_table:</div><div class='del'>-	exfat_free_upcase_table(sbi);</div><div class='ctx'> 	exfat_free_bitmap(sbi);</div><div class='ctx'> 	brelse(sbi-&gt;boot_bh);</div><div class='ctx'> </div><div class='ctx'> check_nls_io:</div><div class='del'>-	unload_nls(sbi-&gt;nls_io);</div><div class='del'>-	exfat_free_iocharset(sbi);</div><div class='del'>-	sb-&gt;s_fs_info = NULL;</div><div class='del'>-	kfree(sbi);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -717,22 +745,62 @@ static int exfat_get_tree(struct fs_context *fc)</div><div class='ctx'> 	return get_tree_bdev(fc, exfat_fill_super);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void exfat_free_sbi(struct exfat_sb_info *sbi)</div><div class='add'>+{</div><div class='add'>+	exfat_free_iocharset(sbi);</div><div class='add'>+	kfree(sbi);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void exfat_free(struct fs_context *fc)</div><div class='ctx'> {</div><div class='ctx'> 	struct exfat_sb_info *sbi = fc-&gt;s_fs_info;</div><div class='ctx'> </div><div class='del'>-	if (sbi) {</div><div class='del'>-		exfat_free_iocharset(sbi);</div><div class='del'>-		kfree(sbi);</div><div class='del'>-	}</div><div class='add'>+	if (sbi)</div><div class='add'>+		exfat_free_sbi(sbi);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int exfat_reconfigure(struct fs_context *fc)</div><div class='ctx'> {</div><div class='add'>+	struct super_block *sb = fc-&gt;root-&gt;d_sb;</div><div class='add'>+	struct exfat_sb_info *remount_sbi = fc-&gt;s_fs_info;</div><div class='add'>+	struct exfat_sb_info *sbi = EXFAT_SB(sb);</div><div class='add'>+	struct exfat_mount_options *new_opts = &amp;remount_sbi-&gt;options;</div><div class='add'>+	struct exfat_mount_options *cur_opts = &amp;sbi-&gt;options;</div><div class='add'>+</div><div class='ctx'> 	fc-&gt;sb_flags |= SB_NODIRATIME;</div><div class='ctx'> </div><div class='del'>-	/* volume flag will be updated in exfat_sync_fs */</div><div class='del'>-	sync_filesystem(fc-&gt;root-&gt;d_sb);</div><div class='add'>+	sync_filesystem(sb);</div><div class='add'>+	mutex_lock(&amp;sbi-&gt;s_lock);</div><div class='add'>+	exfat_clear_volume_dirty(sb);</div><div class='add'>+	mutex_unlock(&amp;sbi-&gt;s_lock);</div><div class='add'>+</div><div class='add'>+	if (new_opts-&gt;allow_utime == (unsigned short)-1)</div><div class='add'>+		new_opts-&gt;allow_utime = ~new_opts-&gt;fs_dmask &amp; 0022;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Since the old settings of these mount options are cached in</div><div class='add'>+	 * inodes or dentries, they cannot be modified dynamically.</div><div class='add'>+	 */</div><div class='add'>+	if (strcmp(new_opts-&gt;iocharset, cur_opts-&gt;iocharset) ||</div><div class='add'>+	    new_opts-&gt;keep_last_dots != cur_opts-&gt;keep_last_dots ||</div><div class='add'>+	    new_opts-&gt;sys_tz != cur_opts-&gt;sys_tz ||</div><div class='add'>+	    new_opts-&gt;time_offset != cur_opts-&gt;time_offset ||</div><div class='add'>+	    !uid_eq(new_opts-&gt;fs_uid, cur_opts-&gt;fs_uid) ||</div><div class='add'>+	    !gid_eq(new_opts-&gt;fs_gid, cur_opts-&gt;fs_gid) ||</div><div class='add'>+	    new_opts-&gt;fs_fmask != cur_opts-&gt;fs_fmask ||</div><div class='add'>+	    new_opts-&gt;fs_dmask != cur_opts-&gt;fs_dmask ||</div><div class='add'>+	    new_opts-&gt;allow_utime != cur_opts-&gt;allow_utime)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	if (new_opts-&gt;discard != cur_opts-&gt;discard &amp;&amp;</div><div class='add'>+	    new_opts-&gt;discard &amp;&amp;</div><div class='add'>+	    !bdev_max_discard_sectors(sb-&gt;s_bdev)) {</div><div class='add'>+		exfat_warn(sb, "remounting with \"discard\" option, but the device does not support discard");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	swap(*cur_opts, *new_opts);</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -756,26 +824,55 @@ static int exfat_init_fs_context(struct fs_context *fc)</div><div class='ctx'> 	ratelimit_state_init(&amp;sbi-&gt;ratelimit, DEFAULT_RATELIMIT_INTERVAL,</div><div class='ctx'> 			DEFAULT_RATELIMIT_BURST);</div><div class='ctx'> </div><div class='del'>-	sbi-&gt;options.fs_uid = current_uid();</div><div class='del'>-	sbi-&gt;options.fs_gid = current_gid();</div><div class='del'>-	sbi-&gt;options.fs_fmask = current-&gt;fs-&gt;umask;</div><div class='del'>-	sbi-&gt;options.fs_dmask = current-&gt;fs-&gt;umask;</div><div class='add'>+	if (fc-&gt;purpose == FS_CONTEXT_FOR_RECONFIGURE &amp;&amp; fc-&gt;root) {</div><div class='add'>+		struct super_block *sb = fc-&gt;root-&gt;d_sb;</div><div class='add'>+		struct exfat_mount_options *cur_opts = &amp;EXFAT_SB(sb)-&gt;options;</div><div class='add'>+</div><div class='add'>+		sbi-&gt;options.fs_uid = cur_opts-&gt;fs_uid;</div><div class='add'>+		sbi-&gt;options.fs_gid = cur_opts-&gt;fs_gid;</div><div class='add'>+		sbi-&gt;options.fs_fmask = cur_opts-&gt;fs_fmask;</div><div class='add'>+		sbi-&gt;options.fs_dmask = cur_opts-&gt;fs_dmask;</div><div class='add'>+	} else {</div><div class='add'>+		sbi-&gt;options.fs_uid = current_uid();</div><div class='add'>+		sbi-&gt;options.fs_gid = current_gid();</div><div class='add'>+		sbi-&gt;options.fs_fmask = current-&gt;fs-&gt;umask;</div><div class='add'>+		sbi-&gt;options.fs_dmask = current-&gt;fs-&gt;umask;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	sbi-&gt;options.allow_utime = -1;</div><div class='del'>-	sbi-&gt;options.iocharset = exfat_default_iocharset;</div><div class='ctx'> 	sbi-&gt;options.errors = EXFAT_ERRORS_RO;</div><div class='add'>+	exfat_set_iocharset(&amp;sbi-&gt;options, exfat_default_iocharset);</div><div class='ctx'> </div><div class='ctx'> 	fc-&gt;s_fs_info = sbi;</div><div class='ctx'> 	fc-&gt;ops = &amp;exfat_context_ops;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void delayed_free(struct rcu_head *p)</div><div class='add'>+{</div><div class='add'>+	struct exfat_sb_info *sbi = container_of(p, struct exfat_sb_info, rcu);</div><div class='add'>+</div><div class='add'>+	unload_nls(sbi-&gt;nls_io);</div><div class='add'>+	exfat_free_upcase_table(sbi);</div><div class='add'>+	exfat_free_sbi(sbi);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void exfat_kill_sb(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct exfat_sb_info *sbi = sb-&gt;s_fs_info;</div><div class='add'>+</div><div class='add'>+	kill_block_super(sb);</div><div class='add'>+	if (sbi)</div><div class='add'>+		call_rcu(&amp;sbi-&gt;rcu, delayed_free);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static struct file_system_type exfat_fs_type = {</div><div class='ctx'> 	.owner			= THIS_MODULE,</div><div class='ctx'> 	.name			= "exfat",</div><div class='ctx'> 	.init_fs_context	= exfat_init_fs_context,</div><div class='ctx'> 	.parameters		= exfat_parameters,</div><div class='del'>-	.kill_sb		= kill_block_super,</div><div class='del'>-	.fs_flags		= FS_REQUIRES_DEV,</div><div class='add'>+	.kill_sb		= exfat_kill_sb,</div><div class='add'>+	.fs_flags		= FS_REQUIRES_DEV | FS_ALLOW_IDMAP,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static void exfat_inode_init_once(void *foo)</div><div class='hunk'>@@ -800,7 +897,7 @@ static int __init init_exfat_fs(void)</div><div class='ctx'> </div><div class='ctx'> 	exfat_inode_cachep = kmem_cache_create("exfat_inode_cache",</div><div class='ctx'> 			sizeof(struct exfat_inode_info),</div><div class='del'>-			0, SLAB_RECLAIM_ACCOUNT | SLAB_MEM_SPREAD,</div><div class='add'>+			0, SLAB_RECLAIM_ACCOUNT,</div><div class='ctx'> 			exfat_inode_init_once);</div><div class='ctx'> 	if (!exfat_inode_cachep) {</div><div class='ctx'> 		err = -ENOMEM;</div><div class='head'>diff --git a/fs/exportfs/expfs.c b/fs/exportfs/expfs.c<br/>index 0106eba46d5a..d3e55de4a2a2 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/exportfs/expfs.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/exportfs/expfs.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/exportfs/expfs.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/exportfs/expfs.c</a></div><div class='hunk'>@@ -18,7 +18,7 @@</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='ctx'> #include &lt;linux/cred.h&gt;</div><div class='ctx'> </div><div class='del'>-#define dprintk(fmt, args...) do{}while(0)</div><div class='add'>+#define dprintk(fmt, args...) pr_debug(fmt, ##args)</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> static int get_name(const struct path *path, char *name, struct dentry *child);</div><div class='hunk'>@@ -126,14 +126,12 @@ static struct dentry *reconnect_one(struct vfsmount *mnt,</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	parent = ERR_PTR(-EACCES);</div><div class='del'>-	inode_lock(dentry-&gt;d_inode);</div><div class='ctx'> 	if (mnt-&gt;mnt_sb-&gt;s_export_op-&gt;get_parent)</div><div class='ctx'> 		parent = mnt-&gt;mnt_sb-&gt;s_export_op-&gt;get_parent(dentry);</div><div class='del'>-	inode_unlock(dentry-&gt;d_inode);</div><div class='ctx'> </div><div class='ctx'> 	if (IS_ERR(parent)) {</div><div class='del'>-		dprintk("%s: get_parent of %ld failed, err %d\n",</div><div class='del'>-			__func__, dentry-&gt;d_inode-&gt;i_ino, PTR_ERR(parent));</div><div class='add'>+		dprintk("get_parent of %lu failed, err %ld\n",</div><div class='add'>+			dentry-&gt;d_inode-&gt;i_ino, PTR_ERR(parent));</div><div class='ctx'> 		return parent;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -145,9 +143,9 @@ static struct dentry *reconnect_one(struct vfsmount *mnt,</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> 	dprintk("%s: found name: %s\n", __func__, nbuf);</div><div class='del'>-	tmp = lookup_one_len_unlocked(nbuf, parent, strlen(nbuf));</div><div class='add'>+	tmp = lookup_one_unlocked(mnt_idmap(mnt), &amp;QSTR(nbuf), parent);</div><div class='ctx'> 	if (IS_ERR(tmp)) {</div><div class='del'>-		dprintk("%s: lookup failed: %d\n", __func__, PTR_ERR(tmp));</div><div class='add'>+		dprintk("lookup failed: %ld\n", PTR_ERR(tmp));</div><div class='ctx'> 		err = PTR_ERR(tmp);</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -248,21 +246,20 @@ struct getdents_callback {</div><div class='ctx'>  * A rather strange filldir function to capture</div><div class='ctx'>  * the name matching the specified inode number.</div><div class='ctx'>  */</div><div class='del'>-static int filldir_one(struct dir_context *ctx, const char *name, int len,</div><div class='add'>+static bool filldir_one(struct dir_context *ctx, const char *name, int len,</div><div class='ctx'> 			loff_t pos, u64 ino, unsigned int d_type)</div><div class='ctx'> {</div><div class='ctx'> 	struct getdents_callback *buf =</div><div class='ctx'> 		container_of(ctx, struct getdents_callback, ctx);</div><div class='del'>-	int result = 0;</div><div class='ctx'> </div><div class='ctx'> 	buf-&gt;sequence++;</div><div class='del'>-	if (buf-&gt;ino == ino &amp;&amp; len &lt;= NAME_MAX) {</div><div class='add'>+	if (buf-&gt;ino == ino &amp;&amp; len &lt;= NAME_MAX &amp;&amp; !is_dot_dotdot(name, len)) {</div><div class='ctx'> 		memcpy(buf-&gt;name, name, len);</div><div class='ctx'> 		buf-&gt;name[len] = '\0';</div><div class='ctx'> 		buf-&gt;found = 1;</div><div class='del'>-		result = -1;</div><div class='add'>+		return false;	// no more</div><div class='ctx'> 	}</div><div class='del'>-	return result;</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -287,6 +284,7 @@ static int get_name(const struct path *path, char *name, struct dentry *child)</div><div class='ctx'> 	};</div><div class='ctx'> 	struct getdents_callback buffer = {</div><div class='ctx'> 		.ctx.actor = filldir_one,</div><div class='add'>+		.ctx.count = INT_MAX,</div><div class='ctx'> 		.name = name,</div><div class='ctx'> 	};</div><div class='ctx'> </div><div class='hunk'>@@ -316,7 +314,7 @@ static int get_name(const struct path *path, char *name, struct dentry *child)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	error = -EINVAL;</div><div class='del'>-	if (!file-&gt;f_op-&gt;iterate &amp;&amp; !file-&gt;f_op-&gt;iterate_shared)</div><div class='add'>+	if (!file-&gt;f_op-&gt;iterate_shared)</div><div class='ctx'> 		goto out_close;</div><div class='ctx'> </div><div class='ctx'> 	buffer.sequence = 0;</div><div class='hunk'>@@ -343,65 +341,84 @@ out:</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#define FILEID_INO64_GEN_LEN 3</div><div class='add'>+</div><div class='ctx'> /**</div><div class='del'>- * export_encode_fh - default export_operations-&gt;encode_fh function</div><div class='add'>+ * exportfs_encode_ino64_fid - encode non-decodeable 64bit ino file id</div><div class='ctx'>  * @inode:   the object to encode</div><div class='ctx'>  * @fid:     where to store the file handle fragment</div><div class='del'>- * @max_len: maximum length to store there</div><div class='del'>- * @parent:  parent directory inode, if wanted</div><div class='add'>+ * @max_len: maximum length to store there (in 4 byte units)</div><div class='ctx'>  *</div><div class='del'>- * This default encode_fh function assumes that the 32 inode number</div><div class='del'>- * is suitable for locating an inode, and that the generation number</div><div class='del'>- * can be used to check that it is still valid.  It places them in the</div><div class='del'>- * filehandle fragment where export_decode_fh expects to find them.</div><div class='add'>+ * This generic function is used to encode a non-decodeable file id for</div><div class='add'>+ * fanotify for filesystems that do not support NFS export.</div><div class='ctx'>  */</div><div class='del'>-static int export_encode_fh(struct inode *inode, struct fid *fid,</div><div class='del'>-		int *max_len, struct inode *parent)</div><div class='add'>+static int exportfs_encode_ino64_fid(struct inode *inode, struct fid *fid,</div><div class='add'>+				     int *max_len)</div><div class='ctx'> {</div><div class='del'>-	int len = *max_len;</div><div class='del'>-	int type = FILEID_INO32_GEN;</div><div class='del'>-</div><div class='del'>-	if (parent &amp;&amp; (len &lt; 4)) {</div><div class='del'>-		*max_len = 4;</div><div class='del'>-		return FILEID_INVALID;</div><div class='del'>-	} else if (len &lt; 2) {</div><div class='del'>-		*max_len = 2;</div><div class='add'>+	if (*max_len &lt; FILEID_INO64_GEN_LEN) {</div><div class='add'>+		*max_len = FILEID_INO64_GEN_LEN;</div><div class='ctx'> 		return FILEID_INVALID;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	len = 2;</div><div class='del'>-	fid-&gt;i32.ino = inode-&gt;i_ino;</div><div class='del'>-	fid-&gt;i32.gen = inode-&gt;i_generation;</div><div class='del'>-	if (parent) {</div><div class='del'>-		fid-&gt;i32.parent_ino = parent-&gt;i_ino;</div><div class='del'>-		fid-&gt;i32.parent_gen = parent-&gt;i_generation;</div><div class='del'>-		len = 4;</div><div class='del'>-		type = FILEID_INO32_GEN_PARENT;</div><div class='del'>-	}</div><div class='del'>-	*max_len = len;</div><div class='del'>-	return type;</div><div class='add'>+	fid-&gt;i64.ino = inode-&gt;i_ino;</div><div class='add'>+	fid-&gt;i64.gen = inode-&gt;i_generation;</div><div class='add'>+	*max_len = FILEID_INO64_GEN_LEN;</div><div class='add'>+</div><div class='add'>+	return FILEID_INO64_GEN;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * exportfs_encode_inode_fh - encode a file handle from inode</div><div class='add'>+ * @inode:   the object to encode</div><div class='add'>+ * @fid:     where to store the file handle fragment</div><div class='add'>+ * @max_len: maximum length to store there</div><div class='add'>+ * @parent:  parent directory inode, if wanted</div><div class='add'>+ * @flags:   properties of the requested file handle</div><div class='add'>+ *</div><div class='add'>+ * Returns an enum fid_type or a negative errno.</div><div class='add'>+ */</div><div class='ctx'> int exportfs_encode_inode_fh(struct inode *inode, struct fid *fid,</div><div class='del'>-			     int *max_len, struct inode *parent)</div><div class='add'>+			     int *max_len, struct inode *parent, int flags)</div><div class='ctx'> {</div><div class='ctx'> 	const struct export_operations *nop = inode-&gt;i_sb-&gt;s_export_op;</div><div class='add'>+	enum fid_type type;</div><div class='add'>+</div><div class='add'>+	if (!exportfs_can_encode_fh(nop, flags))</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+</div><div class='add'>+	if (!nop &amp;&amp; (flags &amp; EXPORT_FH_FID))</div><div class='add'>+		type = exportfs_encode_ino64_fid(inode, fid, max_len);</div><div class='add'>+	else</div><div class='add'>+		type = nop-&gt;encode_fh(inode, fid-&gt;raw, max_len, parent);</div><div class='ctx'> </div><div class='del'>-	if (nop &amp;&amp; nop-&gt;encode_fh)</div><div class='del'>-		return nop-&gt;encode_fh(inode, fid-&gt;raw, max_len, parent);</div><div class='add'>+	if (type &gt; 0 &amp;&amp; FILEID_USER_FLAGS(type)) {</div><div class='add'>+		pr_warn_once("%s: unexpected fh type value 0x%x from fstype %s.\n",</div><div class='add'>+			     __func__, type, inode-&gt;i_sb-&gt;s_type-&gt;name);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return type;</div><div class='ctx'> </div><div class='del'>-	return export_encode_fh(inode, fid, max_len, parent);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(exportfs_encode_inode_fh);</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * exportfs_encode_fh - encode a file handle from dentry</div><div class='add'>+ * @dentry:  the object to encode</div><div class='add'>+ * @fid:     where to store the file handle fragment</div><div class='add'>+ * @max_len: maximum length to store there</div><div class='add'>+ * @flags:   properties of the requested file handle</div><div class='add'>+ *</div><div class='add'>+ * Returns an enum fid_type or a negative errno.</div><div class='add'>+ */</div><div class='ctx'> int exportfs_encode_fh(struct dentry *dentry, struct fid *fid, int *max_len,</div><div class='del'>-		int connectable)</div><div class='add'>+		       int flags)</div><div class='ctx'> {</div><div class='ctx'> 	int error;</div><div class='ctx'> 	struct dentry *p = NULL;</div><div class='ctx'> 	struct inode *inode = dentry-&gt;d_inode, *parent = NULL;</div><div class='ctx'> </div><div class='del'>-	if (connectable &amp;&amp; !S_ISDIR(inode-&gt;i_mode)) {</div><div class='add'>+	if ((flags &amp; EXPORT_FH_CONNECTABLE) &amp;&amp; !S_ISDIR(inode-&gt;i_mode)) {</div><div class='ctx'> 		p = dget_parent(dentry);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * note that while p might've ceased to be our parent already,</div><div class='hunk'>@@ -410,7 +427,7 @@ int exportfs_encode_fh(struct dentry *dentry, struct fid *fid, int *max_len,</div><div class='ctx'> 		parent = p-&gt;d_inode;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	error = exportfs_encode_inode_fh(inode, fid, max_len, parent);</div><div class='add'>+	error = exportfs_encode_inode_fh(inode, fid, max_len, parent, flags);</div><div class='ctx'> 	dput(p);</div><div class='ctx'> </div><div class='ctx'> 	return error;</div><div class='hunk'>@@ -419,7 +436,7 @@ EXPORT_SYMBOL_GPL(exportfs_encode_fh);</div><div class='ctx'> </div><div class='ctx'> struct dentry *</div><div class='ctx'> exportfs_decode_fh_raw(struct vfsmount *mnt, struct fid *fid, int fh_len,</div><div class='del'>-		       int fileid_type,</div><div class='add'>+		       int fileid_type, unsigned int flags,</div><div class='ctx'> 		       int (*acceptable)(void *, struct dentry *),</div><div class='ctx'> 		       void *context)</div><div class='ctx'> {</div><div class='hunk'>@@ -428,15 +445,23 @@ exportfs_decode_fh_raw(struct vfsmount *mnt, struct fid *fid, int fh_len,</div><div class='ctx'> 	char nbuf[NAME_MAX+1];</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='add'>+	if (fileid_type &lt; 0 || FILEID_USER_FLAGS(fileid_type))</div><div class='add'>+		return ERR_PTR(-EINVAL);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Try to get any dentry for the given file handle from the filesystem.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!nop || !nop-&gt;fh_to_dentry)</div><div class='add'>+	if (!exportfs_can_decode_fh(nop))</div><div class='ctx'> 		return ERR_PTR(-ESTALE);</div><div class='ctx'> 	result = nop-&gt;fh_to_dentry(mnt-&gt;mnt_sb, fid, fh_len, fileid_type);</div><div class='ctx'> 	if (IS_ERR_OR_NULL(result))</div><div class='ctx'> 		return result;</div><div class='ctx'> </div><div class='add'>+	if ((flags &amp; EXPORT_FH_DIR_ONLY) &amp;&amp; !d_is_dir(result)) {</div><div class='add'>+		err = -ENOTDIR;</div><div class='add'>+		goto err_result;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If no acceptance criteria was specified by caller, a disconnected</div><div class='ctx'> 	 * dentry is also accepatable. Callers may use this mode to query if</div><div class='hunk'>@@ -524,15 +549,13 @@ exportfs_decode_fh_raw(struct vfsmount *mnt, struct fid *fid, int fh_len,</div><div class='ctx'> 			goto err_result;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		inode_lock(target_dir-&gt;d_inode);</div><div class='del'>-		nresult = lookup_one_len(nbuf, target_dir, strlen(nbuf));</div><div class='add'>+		nresult = lookup_one_unlocked(mnt_idmap(mnt), &amp;QSTR(nbuf), target_dir);</div><div class='ctx'> 		if (!IS_ERR(nresult)) {</div><div class='ctx'> 			if (unlikely(nresult-&gt;d_inode != result-&gt;d_inode)) {</div><div class='ctx'> 				dput(nresult);</div><div class='ctx'> 				nresult = ERR_PTR(-ESTALE);</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		inode_unlock(target_dir-&gt;d_inode);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * At this point we are done with the parent, but it's pinned</div><div class='ctx'> 		 * by the child dentry anyway.</div><div class='hunk'>@@ -572,7 +595,7 @@ struct dentry *exportfs_decode_fh(struct vfsmount *mnt, struct fid *fid,</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *ret;</div><div class='ctx'> </div><div class='del'>-	ret = exportfs_decode_fh_raw(mnt, fid, fh_len, fileid_type,</div><div class='add'>+	ret = exportfs_decode_fh_raw(mnt, fid, fh_len, fileid_type, 0,</div><div class='ctx'> 				     acceptable, context);</div><div class='ctx'> 	if (IS_ERR_OR_NULL(ret)) {</div><div class='ctx'> 		if (ret == ERR_PTR(-ENOMEM))</div><div class='hunk'>@@ -583,4 +606,5 @@ struct dentry *exportfs_decode_fh(struct vfsmount *mnt, struct fid *fid,</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(exportfs_decode_fh);</div><div class='ctx'> </div><div class='add'>+MODULE_DESCRIPTION("Code mapping from inodes to file handles");</div><div class='ctx'> MODULE_LICENSE("GPL");</div><div class='head'>diff --git a/fs/ext2/Kconfig b/fs/ext2/Kconfig<br/>index 1248ff4ef562..d5bce83ad905 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext2/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext2/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext2/Kconfig</a></div><div class='hunk'>@@ -1,14 +1,22 @@</div><div class='ctx'> # SPDX-License-Identifier: GPL-2.0-only</div><div class='ctx'> config EXT2_FS</div><div class='del'>-	tristate "Second extended fs support"</div><div class='add'>+	tristate "Second extended fs support (DEPRECATED)"</div><div class='add'>+	select BUFFER_HEAD</div><div class='ctx'> 	select FS_IOMAP</div><div class='ctx'> 	help</div><div class='ctx'> 	  Ext2 is a standard Linux file system for hard disks.</div><div class='ctx'> </div><div class='del'>-	  To compile this file system support as a module, choose M here: the</div><div class='del'>-	  module will be called ext2.</div><div class='add'>+	  This filesystem driver is deprecated because it does not properly</div><div class='add'>+	  support inode time stamps beyond 03:14:07 UTC on 19 January 2038.</div><div class='ctx'> </div><div class='del'>-	  If unsure, say Y.</div><div class='add'>+	  Ext2 users are advised to use ext4 driver to access their filesystem.</div><div class='add'>+	  The driver is fully compatible, supports filesystems without journal</div><div class='add'>+          or extents, and also supports larger time stamps if the filesystem</div><div class='add'>+          is created with at least 256 byte inodes.</div><div class='add'>+</div><div class='add'>+	  This code is kept as a simple reference for filesystem developers.</div><div class='add'>+</div><div class='add'>+	  If unsure, say N.</div><div class='ctx'> </div><div class='ctx'> config EXT2_FS_XATTR</div><div class='ctx'> 	bool "Ext2 extended attributes"</div><div class='head'>diff --git a/fs/ext2/Makefile b/fs/ext2/Makefile<br/>index 311479d864a7..8860948ef9ca 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext2/Makefile?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/Makefile</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext2/Makefile?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext2/Makefile</a></div><div class='hunk'>@@ -6,7 +6,10 @@</div><div class='ctx'> obj-$(CONFIG_EXT2_FS) += ext2.o</div><div class='ctx'> </div><div class='ctx'> ext2-y := balloc.o dir.o file.o ialloc.o inode.o \</div><div class='del'>-	  ioctl.o namei.o super.o symlink.o</div><div class='add'>+	  ioctl.o namei.o super.o symlink.o trace.o</div><div class='add'>+</div><div class='add'>+# For tracepoints to include our trace.h from tracepoint infrastructure</div><div class='add'>+CFLAGS_trace.o := -I$(src)</div><div class='ctx'> </div><div class='ctx'> ext2-$(CONFIG_EXT2_FS_XATTR)	 += xattr.o xattr_user.o xattr_trusted.o</div><div class='ctx'> ext2-$(CONFIG_EXT2_FS_POSIX_ACL) += acl.o</div><div class='head'>diff --git a/fs/ext2/acl.c b/fs/ext2/acl.c<br/>index bf298967c5b8..7e54c31589c7 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext2/acl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/acl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext2/acl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext2/acl.c</a></div><div class='hunk'>@@ -219,15 +219,16 @@ __ext2_set_acl(struct inode *inode, struct posix_acl *acl, int type)</div><div class='ctx'>  * inode-&gt;i_mutex: down</div><div class='ctx'>  */</div><div class='ctx'> int</div><div class='del'>-ext2_set_acl(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='add'>+ext2_set_acl(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 	     struct posix_acl *acl, int type)</div><div class='ctx'> {</div><div class='ctx'> 	int error;</div><div class='ctx'> 	int update_mode = 0;</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	umode_t mode = inode-&gt;i_mode;</div><div class='ctx'> </div><div class='ctx'> 	if (type == ACL_TYPE_ACCESS &amp;&amp; acl) {</div><div class='del'>-		error = posix_acl_update_mode(&amp;init_user_ns, inode, &amp;mode,</div><div class='add'>+		error = posix_acl_update_mode(&amp;nop_mnt_idmap, inode, &amp;mode,</div><div class='ctx'> 					      &amp;acl);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			return error;</div><div class='hunk'>@@ -236,7 +237,7 @@ ext2_set_acl(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='ctx'> 	error = __ext2_set_acl(inode, acl, type);</div><div class='ctx'> 	if (!error &amp;&amp; update_mode) {</div><div class='ctx'> 		inode-&gt;i_mode = mode;</div><div class='del'>-		inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+		inode_set_ctime_current(inode);</div><div class='ctx'> 		mark_inode_dirty(inode);</div><div class='ctx'> 	}</div><div class='ctx'> 	return error;</div><div class='head'>diff --git a/fs/ext2/acl.h b/fs/ext2/acl.h<br/>index 925ab6287d35..4a8443a2b8ec 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext2/acl.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/acl.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext2/acl.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext2/acl.h</a></div><div class='hunk'>@@ -56,7 +56,7 @@ static inline int ext2_acl_count(size_t size)</div><div class='ctx'> </div><div class='ctx'> /* acl.c */</div><div class='ctx'> extern struct posix_acl *ext2_get_acl(struct inode *inode, int type, bool rcu);</div><div class='del'>-extern int ext2_set_acl(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='add'>+extern int ext2_set_acl(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 			struct posix_acl *acl, int type);</div><div class='ctx'> extern int ext2_init_acl (struct inode *, struct inode *);</div><div class='ctx'> </div><div class='head'>diff --git a/fs/ext2/balloc.c b/fs/ext2/balloc.c<br/>index c17ccc19b938..b8cfab8f98b9 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext2/balloc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/balloc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext2/balloc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext2/balloc.c</a></div><div class='hunk'>@@ -36,8 +36,6 @@</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> </div><div class='del'>-#define in_range(b, first, len)	((b) &gt;= (first) &amp;&amp; (b) &lt;= (first) + (len) - 1)</div><div class='del'>-</div><div class='ctx'> struct ext2_group_desc * ext2_get_group_desc(struct super_block * sb,</div><div class='ctx'> 					     unsigned int block_group,</div><div class='ctx'> 					     struct buffer_head ** bh)</div><div class='hunk'>@@ -79,26 +77,33 @@ static int ext2_valid_block_bitmap(struct super_block *sb,</div><div class='ctx'> 	ext2_grpblk_t next_zero_bit;</div><div class='ctx'> 	ext2_fsblk_t bitmap_blk;</div><div class='ctx'> 	ext2_fsblk_t group_first_block;</div><div class='add'>+	ext2_grpblk_t max_bit;</div><div class='ctx'> </div><div class='ctx'> 	group_first_block = ext2_group_first_block_no(sb, block_group);</div><div class='add'>+	max_bit = ext2_group_last_block_no(sb, block_group) - group_first_block;</div><div class='ctx'> </div><div class='ctx'> 	/* check whether block bitmap block number is set */</div><div class='ctx'> 	bitmap_blk = le32_to_cpu(desc-&gt;bg_block_bitmap);</div><div class='ctx'> 	offset = bitmap_blk - group_first_block;</div><div class='del'>-	if (!ext2_test_bit(offset, bh-&gt;b_data))</div><div class='add'>+	if (offset &lt; 0 || offset &gt; max_bit ||</div><div class='add'>+	    !ext2_test_bit(offset, bh-&gt;b_data))</div><div class='ctx'> 		/* bad block bitmap */</div><div class='ctx'> 		goto err_out;</div><div class='ctx'> </div><div class='ctx'> 	/* check whether the inode bitmap block number is set */</div><div class='ctx'> 	bitmap_blk = le32_to_cpu(desc-&gt;bg_inode_bitmap);</div><div class='ctx'> 	offset = bitmap_blk - group_first_block;</div><div class='del'>-	if (!ext2_test_bit(offset, bh-&gt;b_data))</div><div class='add'>+	if (offset &lt; 0 || offset &gt; max_bit ||</div><div class='add'>+	    !ext2_test_bit(offset, bh-&gt;b_data))</div><div class='ctx'> 		/* bad block bitmap */</div><div class='ctx'> 		goto err_out;</div><div class='ctx'> </div><div class='ctx'> 	/* check whether the inode table block number is set */</div><div class='ctx'> 	bitmap_blk = le32_to_cpu(desc-&gt;bg_inode_table);</div><div class='ctx'> 	offset = bitmap_blk - group_first_block;</div><div class='add'>+	if (offset &lt; 0 || offset &gt; max_bit ||</div><div class='add'>+	    offset + EXT2_SB(sb)-&gt;s_itb_per_group - 1 &gt; max_bit)</div><div class='add'>+		goto err_out;</div><div class='ctx'> 	next_zero_bit = ext2_find_next_zero_bit(bh-&gt;b_data,</div><div class='ctx'> 				offset + EXT2_SB(sb)-&gt;s_itb_per_group,</div><div class='ctx'> 				offset);</div><div class='hunk'>@@ -126,6 +131,7 @@ read_block_bitmap(struct super_block *sb, unsigned int block_group)</div><div class='ctx'> 	struct ext2_group_desc * desc;</div><div class='ctx'> 	struct buffer_head * bh = NULL;</div><div class='ctx'> 	ext2_fsblk_t bitmap_blk;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	desc = ext2_get_group_desc(sb, block_group, NULL);</div><div class='ctx'> 	if (!desc)</div><div class='hunk'>@@ -139,10 +145,10 @@ read_block_bitmap(struct super_block *sb, unsigned int block_group)</div><div class='ctx'> 			    block_group, le32_to_cpu(desc-&gt;bg_block_bitmap));</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	}</div><div class='del'>-	if (likely(bh_uptodate_or_lock(bh)))</div><div class='add'>+	ret = bh_read(bh, 0);</div><div class='add'>+	if (ret &gt; 0)</div><div class='ctx'> 		return bh;</div><div class='del'>-</div><div class='del'>-	if (bh_submit_read(bh) &lt; 0) {</div><div class='add'>+	if (ret &lt; 0) {</div><div class='ctx'> 		brelse(bh);</div><div class='ctx'> 		ext2_error(sb, __func__,</div><div class='ctx'> 			    "Cannot read block bitmap - "</div><div class='hunk'>@@ -413,7 +419,7 @@ void ext2_init_block_alloc_info(struct inode *inode)</div><div class='ctx'> 	struct ext2_block_alloc_info *block_i;</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> </div><div class='del'>-	block_i = kmalloc(sizeof(*block_i), GFP_NOFS);</div><div class='add'>+	block_i = kmalloc(sizeof(*block_i), GFP_KERNEL);</div><div class='ctx'> 	if (block_i) {</div><div class='ctx'> 		struct ext2_reserve_window_node *rsv = &amp;block_i-&gt;rsv_window_node;</div><div class='ctx'> </div><div class='hunk'>@@ -473,8 +479,8 @@ void ext2_discard_reservation(struct inode *inode)</div><div class='ctx'>  * @block:		start physical block to free</div><div class='ctx'>  * @count:		number of blocks to free</div><div class='ctx'>  */</div><div class='del'>-void ext2_free_blocks (struct inode * inode, unsigned long block,</div><div class='del'>-		       unsigned long count)</div><div class='add'>+void ext2_free_blocks(struct inode * inode, ext2_fsblk_t block,</div><div class='add'>+		      unsigned long count)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *bitmap_bh = NULL;</div><div class='ctx'> 	struct buffer_head * bh2;</div><div class='hunk'>@@ -666,7 +672,7 @@ ext2_try_to_allocate(struct super_block *sb, int group,</div><div class='ctx'> {</div><div class='ctx'> 	ext2_fsblk_t group_first_block = ext2_group_first_block_no(sb, group);</div><div class='ctx'> 	ext2_fsblk_t group_last_block = ext2_group_last_block_no(sb, group);</div><div class='del'>-       	ext2_grpblk_t start, end;</div><div class='add'>+	ext2_grpblk_t start, end;</div><div class='ctx'> 	unsigned long num = 0;</div><div class='ctx'> </div><div class='ctx'> 	start = 0;</div><div class='hunk'>@@ -717,36 +723,34 @@ fail_access:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * 	find_next_reservable_window():</div><div class='del'>- *		find a reservable space within the given range.</div><div class='del'>- *		It does not allocate the reservation window for now:</div><div class='del'>- *		alloc_new_reservation() will do the work later.</div><div class='del'>- *</div><div class='del'>- * 	@search_head: the head of the searching list;</div><div class='del'>- *		This is not necessarily the list head of the whole filesystem</div><div class='del'>- *</div><div class='del'>- *		We have both head and start_block to assist the search</div><div class='del'>- *		for the reservable space. The list starts from head,</div><div class='del'>- *		but we will shift to the place where start_block is,</div><div class='del'>- *		then start from there, when looking for a reservable space.</div><div class='add'>+ * find_next_reservable_window - Find a reservable space within the given range.</div><div class='add'>+ * @search_head: The list to search.</div><div class='add'>+ * @my_rsv: The reservation we're currently using.</div><div class='add'>+ * @sb: The super block.</div><div class='add'>+ * @start_block: The first block we consider to start the real search from</div><div class='add'>+ * @last_block: The maximum block number that our goal reservable space</div><div class='add'>+ *	could start from.</div><div class='ctx'>  *</div><div class='del'>- *	@sb: the super block.</div><div class='add'>+ * It does not allocate the reservation window: alloc_new_reservation()</div><div class='add'>+ * will do the work later.</div><div class='ctx'>  *</div><div class='del'>- * 	@start_block: the first block we consider to start the real search from</div><div class='add'>+ * We search the given range, rather than the whole reservation double</div><div class='add'>+ * linked list, (start_block, last_block) to find a free region that is</div><div class='add'>+ * of my size and has not been reserved.</div><div class='ctx'>  *</div><div class='del'>- * 	@last_block:</div><div class='del'>- *		the maximum block number that our goal reservable space</div><div class='del'>- *		could start from. This is normally the last block in this</div><div class='del'>- *		group. The search will end when we found the start of next</div><div class='del'>- *		possible reservable space is out of this boundary.</div><div class='del'>- *		This could handle the cross boundary reservation window</div><div class='del'>- *		request.</div><div class='add'>+ * @search_head is not necessarily the list head of the whole filesystem.</div><div class='add'>+ * We have both head and @start_block to assist the search for the</div><div class='add'>+ * reservable space. The list starts from head, but we will shift to</div><div class='add'>+ * the place where start_block is, then start from there, when looking</div><div class='add'>+ * for a reservable space.</div><div class='ctx'>  *</div><div class='del'>- * 	basically we search from the given range, rather than the whole</div><div class='del'>- * 	reservation double linked list, (start_block, last_block)</div><div class='del'>- * 	to find a free region that is of my size and has not</div><div class='del'>- * 	been reserved.</div><div class='add'>+ * @last_block is normally the last block in this group. The search will end</div><div class='add'>+ * when we found the start of next possible reservable space is out</div><div class='add'>+ * of this boundary.  This could handle the cross boundary reservation</div><div class='add'>+ * window request.</div><div class='ctx'>  *</div><div class='add'>+ * Return: -1 if we could not find a range of sufficient size.  If we could,</div><div class='add'>+ * return 0 and fill in @my_rsv with the range information.</div><div class='ctx'>  */</div><div class='ctx'> static int find_next_reservable_window(</div><div class='ctx'> 				struct ext2_reserve_window_node *search_head,</div><div class='hunk'>@@ -834,41 +838,34 @@ static int find_next_reservable_window(</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * 	alloc_new_reservation()--allocate a new reservation window</div><div class='add'>+ * alloc_new_reservation - Allocate a new reservation window.</div><div class='add'>+ * @my_rsv: The reservation we're currently using.</div><div class='add'>+ * @grp_goal: The goal block relative to the start of the group.</div><div class='add'>+ * @sb: The super block.</div><div class='add'>+ * @group: The group we are trying to allocate in.</div><div class='add'>+ * @bitmap_bh: The block group block bitmap.</div><div class='ctx'>  *</div><div class='del'>- *		To make a new reservation, we search part of the filesystem</div><div class='del'>- *		reservation list (the list that inside the group). We try to</div><div class='del'>- *		allocate a new reservation window near the allocation goal,</div><div class='del'>- *		or the beginning of the group, if there is no goal.</div><div class='add'>+ * To make a new reservation, we search part of the filesystem reservation</div><div class='add'>+ * list (the list inside the group). We try to allocate a new</div><div class='add'>+ * reservation window near @grp_goal, or the beginning of the</div><div class='add'>+ * group, if @grp_goal is negative.</div><div class='ctx'>  *</div><div class='del'>- *		We first find a reservable space after the goal, then from</div><div class='del'>- *		there, we check the bitmap for the first free block after</div><div class='del'>- *		it. If there is no free block until the end of group, then the</div><div class='del'>- *		whole group is full, we failed. Otherwise, check if the free</div><div class='del'>- *		block is inside the expected reservable space, if so, we</div><div class='del'>- *		succeed.</div><div class='del'>- *		If the first free block is outside the reservable space, then</div><div class='del'>- *		start from the first free block, we search for next available</div><div class='del'>- *		space, and go on.</div><div class='add'>+ * We first find a reservable space after the goal, then from there,</div><div class='add'>+ * we check the bitmap for the first free block after it. If there is</div><div class='add'>+ * no free block until the end of group, then the whole group is full,</div><div class='add'>+ * we failed. Otherwise, check if the free block is inside the expected</div><div class='add'>+ * reservable space, if so, we succeed.</div><div class='ctx'>  *</div><div class='del'>- *	on succeed, a new reservation will be found and inserted into the list</div><div class='del'>- *	It contains at least one free block, and it does not overlap with other</div><div class='del'>- *	reservation windows.</div><div class='add'>+ * If the first free block is outside the reservable space, then start</div><div class='add'>+ * from the first free block, we search for next available space, and</div><div class='add'>+ * go on.</div><div class='ctx'>  *</div><div class='del'>- *	failed: we failed to find a reservation window in this group</div><div class='del'>- *</div><div class='del'>- *	@my_rsv: the reservation</div><div class='del'>- *</div><div class='del'>- *	@grp_goal: The goal (group-relative).  It is where the search for a</div><div class='del'>- *		free reservable space should start from.</div><div class='del'>- *		if we have a goal(goal &gt;0 ), then start from there,</div><div class='del'>- *		no goal(goal = -1), we start from the first block</div><div class='del'>- *		of the group.</div><div class='del'>- *</div><div class='del'>- *	@sb: the super block</div><div class='del'>- *	@group: the group we are trying to allocate in</div><div class='del'>- *	@bitmap_bh: the block group block bitmap</div><div class='add'>+ * on succeed, a new reservation will be found and inserted into the</div><div class='add'>+ * list. It contains at least one free block, and it does not overlap</div><div class='add'>+ * with other reservation windows.</div><div class='ctx'>  *</div><div class='add'>+ * Return: 0 on success, -1 if we failed to find a reservation window</div><div class='add'>+ * in this group</div><div class='ctx'>  */</div><div class='ctx'> static int alloc_new_reservation(struct ext2_reserve_window_node *my_rsv,</div><div class='ctx'> 		ext2_grpblk_t grp_goal, struct super_block *sb,</div><div class='hunk'>@@ -1132,8 +1129,13 @@ ext2_try_to_allocate_with_rsv(struct super_block *sb, unsigned int group,</div><div class='ctx'> </div><div class='ctx'> 		if ((my_rsv-&gt;rsv_start &gt; group_last_block) ||</div><div class='ctx'> 				(my_rsv-&gt;rsv_end &lt; group_first_block)) {</div><div class='add'>+			ext2_error(sb, __func__,</div><div class='add'>+				   "Reservation out of group %u range goal %d fsb[%lu,%lu] rsv[%lu, %lu]",</div><div class='add'>+				   group, grp_goal, group_first_block,</div><div class='add'>+				   group_last_block, my_rsv-&gt;rsv_start,</div><div class='add'>+				   my_rsv-&gt;rsv_end);</div><div class='ctx'> 			rsv_window_dump(&amp;EXT2_SB(sb)-&gt;s_rsv_window_root, 1);</div><div class='del'>-			BUG();</div><div class='add'>+			return -1;</div><div class='ctx'> 		}</div><div class='ctx'> 		ret = ext2_try_to_allocate(sb, group, bitmap_bh, grp_goal,</div><div class='ctx'> 					   &amp;num, &amp;my_rsv-&gt;rsv_window);</div><div class='hunk'>@@ -1194,6 +1196,7 @@ int ext2_data_block_valid(struct ext2_sb_info *sbi, ext2_fsblk_t start_blk,</div><div class='ctx'>  * @goal:		given target block(filesystem wide)</div><div class='ctx'>  * @count:		target number of blocks to allocate</div><div class='ctx'>  * @errp:		error code</div><div class='add'>+ * @flags:		allocate flags</div><div class='ctx'>  *</div><div class='ctx'>  * ext2_new_blocks uses a goal block to assist allocation.  If the goal is</div><div class='ctx'>  * free, or there is a free block within 32 blocks of the goal, that block</div><div class='hunk'>@@ -1203,7 +1206,7 @@ int ext2_data_block_valid(struct ext2_sb_info *sbi, ext2_fsblk_t start_blk,</div><div class='ctx'>  * This function also updates quota and i_blocks field.</div><div class='ctx'>  */</div><div class='ctx'> ext2_fsblk_t ext2_new_blocks(struct inode *inode, ext2_fsblk_t goal,</div><div class='del'>-		    unsigned long *count, int *errp)</div><div class='add'>+		    unsigned long *count, int *errp, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *bitmap_bh = NULL;</div><div class='ctx'> 	struct buffer_head *gdp_bh;</div><div class='hunk'>@@ -1242,15 +1245,15 @@ ext2_fsblk_t ext2_new_blocks(struct inode *inode, ext2_fsblk_t goal,</div><div class='ctx'> 	es = EXT2_SB(sb)-&gt;s_es;</div><div class='ctx'> 	ext2_debug("goal=%lu.\n", goal);</div><div class='ctx'> 	/*</div><div class='del'>-	 * Allocate a block from reservation only when</div><div class='del'>-	 * filesystem is mounted with reservation(default,-o reservation), and</div><div class='del'>-	 * it's a regular file, and</div><div class='del'>-	 * the desired window size is greater than 0 (One could use ioctl</div><div class='del'>-	 * command EXT2_IOC_SETRSVSZ to set the window size to 0 to turn off</div><div class='del'>-	 * reservation on that particular file)</div><div class='add'>+	 * Allocate a block from reservation only when the filesystem is</div><div class='add'>+	 * mounted with reservation(default,-o reservation), and it's a regular</div><div class='add'>+	 * file, and the desired window size is greater than 0 (One could use</div><div class='add'>+	 * ioctl command EXT2_IOC_SETRSVSZ to set the window size to 0 to turn</div><div class='add'>+	 * off reservation on that particular file). Also do not use the</div><div class='add'>+	 * reservation window if the caller asked us not to do it.</div><div class='ctx'> 	 */</div><div class='ctx'> 	block_i = EXT2_I(inode)-&gt;i_block_alloc_info;</div><div class='del'>-	if (block_i) {</div><div class='add'>+	if (!(flags &amp; EXT2_ALLOC_NORESERVE) &amp;&amp; block_i) {</div><div class='ctx'> 		windowsz = block_i-&gt;rsv_window_node.rsv_goal_size;</div><div class='ctx'> 		if (windowsz &gt; 0)</div><div class='ctx'> 			my_rsv = &amp;block_i-&gt;rsv_window_node;</div><div class='hunk'>@@ -1430,13 +1433,6 @@ out:</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-ext2_fsblk_t ext2_new_block(struct inode *inode, unsigned long goal, int *errp)</div><div class='del'>-{</div><div class='del'>-	unsigned long count = 1;</div><div class='del'>-</div><div class='del'>-	return ext2_new_blocks(inode, goal, &amp;count, errp);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> #ifdef EXT2FS_DEBUG</div><div class='ctx'> </div><div class='ctx'> unsigned long ext2_count_free(struct buffer_head *map, unsigned int numchars)</div><div class='hunk'>@@ -1480,11 +1476,11 @@ unsigned long ext2_count_free_blocks (struct super_block * sb)</div><div class='ctx'> 		desc_count, bitmap_count);</div><div class='ctx'> 	return bitmap_count;</div><div class='ctx'> #else</div><div class='del'>-        for (i = 0; i &lt; EXT2_SB(sb)-&gt;s_groups_count; i++) {</div><div class='del'>-                desc = ext2_get_group_desc (sb, i, NULL);</div><div class='del'>-                if (!desc)</div><div class='del'>-                        continue;</div><div class='del'>-                desc_count += le16_to_cpu(desc-&gt;bg_free_blocks_count);</div><div class='add'>+	for (i = 0; i &lt; EXT2_SB(sb)-&gt;s_groups_count; i++) {</div><div class='add'>+		desc = ext2_get_group_desc(sb, i, NULL);</div><div class='add'>+		if (!desc)</div><div class='add'>+			continue;</div><div class='add'>+		desc_count += le16_to_cpu(desc-&gt;bg_free_blocks_count);</div><div class='ctx'> 	}</div><div class='ctx'> 	return desc_count;</div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/ext2/dir.c b/fs/ext2/dir.c<br/>index 2c2f179b6977..b07b3b369710 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext2/dir.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/dir.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext2/dir.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext2/dir.c</a></div><div class='hunk'>@@ -81,44 +81,34 @@ ext2_last_byte(struct inode *inode, unsigned long page_nr)</div><div class='ctx'> 	return last_byte;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext2_commit_chunk(struct page *page, loff_t pos, unsigned len)</div><div class='add'>+static void ext2_commit_chunk(struct folio *folio, loff_t pos, unsigned len)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *mapping = page-&gt;mapping;</div><div class='add'>+	struct address_space *mapping = folio-&gt;mapping;</div><div class='ctx'> 	struct inode *dir = mapping-&gt;host;</div><div class='del'>-	int err = 0;</div><div class='ctx'> </div><div class='ctx'> 	inode_inc_iversion(dir);</div><div class='del'>-	block_write_end(NULL, mapping, pos, len, len, page, NULL);</div><div class='add'>+	block_write_end(pos, len, len, folio);</div><div class='ctx'> </div><div class='ctx'> 	if (pos+len &gt; dir-&gt;i_size) {</div><div class='ctx'> 		i_size_write(dir, pos+len);</div><div class='ctx'> 		mark_inode_dirty(dir);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	if (IS_DIRSYNC(dir)) {</div><div class='del'>-		err = write_one_page(page);</div><div class='del'>-		if (!err)</div><div class='del'>-			err = sync_inode_metadata(dir, 1);</div><div class='del'>-	} else {</div><div class='del'>-		unlock_page(page);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return err;</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool ext2_check_page(struct page *page, int quiet, char *kaddr)</div><div class='add'>+static bool ext2_check_folio(struct folio *folio, int quiet, char *kaddr)</div><div class='ctx'> {</div><div class='del'>-	struct inode *dir = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *dir = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	struct super_block *sb = dir-&gt;i_sb;</div><div class='ctx'> 	unsigned chunk_size = ext2_chunk_size(dir);</div><div class='ctx'> 	u32 max_inumber = le32_to_cpu(EXT2_SB(sb)-&gt;s_es-&gt;s_inodes_count);</div><div class='ctx'> 	unsigned offs, rec_len;</div><div class='del'>-	unsigned limit = PAGE_SIZE;</div><div class='add'>+	unsigned limit = folio_size(folio);</div><div class='ctx'> 	ext2_dirent *p;</div><div class='ctx'> 	char *error;</div><div class='ctx'> </div><div class='del'>-	if ((dir-&gt;i_size &gt;&gt; PAGE_SHIFT) == page-&gt;index) {</div><div class='del'>-		limit = dir-&gt;i_size &amp; ~PAGE_MASK;</div><div class='add'>+	if (dir-&gt;i_size &lt; folio_pos(folio) + limit) {</div><div class='add'>+		limit = offset_in_folio(folio, dir-&gt;i_size);</div><div class='ctx'> 		if (limit &amp; (chunk_size - 1))</div><div class='ctx'> 			goto Ebadsize;</div><div class='ctx'> 		if (!limit)</div><div class='hunk'>@@ -142,7 +132,7 @@ static bool ext2_check_page(struct page *page, int quiet, char *kaddr)</div><div class='ctx'> 	if (offs != limit)</div><div class='ctx'> 		goto Eend;</div><div class='ctx'> out:</div><div class='del'>-	SetPageChecked(page);</div><div class='add'>+	folio_set_checked(folio);</div><div class='ctx'> 	return true;</div><div class='ctx'> </div><div class='ctx'> 	/* Too bad, we had an error */</div><div class='hunk'>@@ -170,49 +160,51 @@ Einumber:</div><div class='ctx'> bad_entry:</div><div class='ctx'> 	if (!quiet)</div><div class='ctx'> 		ext2_error(sb, __func__, "bad entry in directory #%lu: : %s - "</div><div class='del'>-			"offset=%lu, inode=%lu, rec_len=%d, name_len=%d",</div><div class='del'>-			dir-&gt;i_ino, error, (page-&gt;index&lt;&lt;PAGE_SHIFT)+offs,</div><div class='add'>+			"offset=%llu, inode=%lu, rec_len=%d, name_len=%d",</div><div class='add'>+			dir-&gt;i_ino, error, folio_pos(folio) + offs,</div><div class='ctx'> 			(unsigned long) le32_to_cpu(p-&gt;inode),</div><div class='ctx'> 			rec_len, p-&gt;name_len);</div><div class='ctx'> 	goto fail;</div><div class='ctx'> Eend:</div><div class='ctx'> 	if (!quiet) {</div><div class='ctx'> 		p = (ext2_dirent *)(kaddr + offs);</div><div class='del'>-		ext2_error(sb, "ext2_check_page",</div><div class='add'>+		ext2_error(sb, "ext2_check_folio",</div><div class='ctx'> 			"entry in directory #%lu spans the page boundary"</div><div class='del'>-			"offset=%lu, inode=%lu",</div><div class='del'>-			dir-&gt;i_ino, (page-&gt;index&lt;&lt;PAGE_SHIFT)+offs,</div><div class='add'>+			"offset=%llu, inode=%lu",</div><div class='add'>+			dir-&gt;i_ino, folio_pos(folio) + offs,</div><div class='ctx'> 			(unsigned long) le32_to_cpu(p-&gt;inode));</div><div class='ctx'> 	}</div><div class='ctx'> fail:</div><div class='del'>-	SetPageError(page);</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Calls to ext2_get_page()/ext2_put_page() must be nested according to the</div><div class='del'>- * rules documented in kmap_local_page()/kunmap_local().</div><div class='add'>+ * Calls to ext2_get_folio()/folio_release_kmap() must be nested according</div><div class='add'>+ * to the rules documented in kmap_local_folio()/kunmap_local().</div><div class='ctx'>  *</div><div class='del'>- * NOTE: ext2_find_entry() and ext2_dotdot() act as a call to ext2_get_page()</div><div class='del'>- * and should be treated as a call to ext2_get_page() for nesting purposes.</div><div class='add'>+ * NOTE: ext2_find_entry() and ext2_dotdot() act as a call</div><div class='add'>+ * to folio_release_kmap() and should be treated as a call to</div><div class='add'>+ * folio_release_kmap() for nesting purposes.</div><div class='ctx'>  */</div><div class='del'>-static struct page * ext2_get_page(struct inode *dir, unsigned long n,</div><div class='del'>-				   int quiet, void **page_addr)</div><div class='add'>+static void *ext2_get_folio(struct inode *dir, unsigned long n,</div><div class='add'>+				   int quiet, struct folio **foliop)</div><div class='ctx'> {</div><div class='ctx'> 	struct address_space *mapping = dir-&gt;i_mapping;</div><div class='del'>-	struct page *page = read_mapping_page(mapping, n, NULL);</div><div class='del'>-	if (!IS_ERR(page)) {</div><div class='del'>-		*page_addr = kmap_local_page(page);</div><div class='del'>-		if (unlikely(!PageChecked(page))) {</div><div class='del'>-			if (PageError(page) || !ext2_check_page(page, quiet,</div><div class='del'>-								*page_addr))</div><div class='del'>-				goto fail;</div><div class='del'>-		}</div><div class='add'>+	struct folio *folio = read_mapping_folio(mapping, n, NULL);</div><div class='add'>+	void *kaddr;</div><div class='add'>+</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return ERR_CAST(folio);</div><div class='add'>+	kaddr = kmap_local_folio(folio, 0);</div><div class='add'>+	if (unlikely(!folio_test_checked(folio))) {</div><div class='add'>+		if (!ext2_check_folio(folio, quiet, kaddr))</div><div class='add'>+			goto fail;</div><div class='ctx'> 	}</div><div class='del'>-	return page;</div><div class='add'>+	*foliop = folio;</div><div class='add'>+	return kaddr;</div><div class='ctx'> </div><div class='ctx'> fail:</div><div class='del'>-	ext2_put_page(page, *page_addr);</div><div class='add'>+	folio_release_kmap(folio, kaddr);</div><div class='ctx'> 	return ERR_PTR(-EIO);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -250,7 +242,7 @@ ext2_validate_entry(char *base, unsigned offset, unsigned mask)</div><div class='ctx'> 			break;</div><div class='ctx'> 		p = ext2_next_entry(p);</div><div class='ctx'> 	}</div><div class='del'>-	return (char *)p - base;</div><div class='add'>+	return offset_in_page(p);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void ext2_set_de_type(ext2_dirent *de, struct inode *inode)</div><div class='hunk'>@@ -271,7 +263,7 @@ ext2_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 	unsigned long n = pos &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> 	unsigned long npages = dir_pages(inode);</div><div class='ctx'> 	unsigned chunk_mask = ~(ext2_chunk_size(inode)-1);</div><div class='del'>-	bool need_revalidate = !inode_eq_iversion(inode, file-&gt;f_version);</div><div class='add'>+	bool need_revalidate = !inode_eq_iversion(inode, *(u64 *)file-&gt;private_data);</div><div class='ctx'> 	bool has_filetype;</div><div class='ctx'> </div><div class='ctx'> 	if (pos &gt; inode-&gt;i_size - EXT2_DIR_REC_LEN(1))</div><div class='hunk'>@@ -281,23 +273,24 @@ ext2_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 		EXT2_HAS_INCOMPAT_FEATURE(sb, EXT2_FEATURE_INCOMPAT_FILETYPE);</div><div class='ctx'> </div><div class='ctx'> 	for ( ; n &lt; npages; n++, offset = 0) {</div><div class='del'>-		char *kaddr, *limit;</div><div class='ctx'> 		ext2_dirent *de;</div><div class='del'>-		struct page *page = ext2_get_page(inode, n, 0, (void **)&amp;kaddr);</div><div class='add'>+		struct folio *folio;</div><div class='add'>+		char *kaddr = ext2_get_folio(inode, n, 0, &amp;folio);</div><div class='add'>+		char *limit;</div><div class='ctx'> </div><div class='del'>-		if (IS_ERR(page)) {</div><div class='add'>+		if (IS_ERR(kaddr)) {</div><div class='ctx'> 			ext2_error(sb, __func__,</div><div class='ctx'> 				   "bad page in #%lu",</div><div class='ctx'> 				   inode-&gt;i_ino);</div><div class='ctx'> 			ctx-&gt;pos += PAGE_SIZE - offset;</div><div class='del'>-			return PTR_ERR(page);</div><div class='add'>+			return PTR_ERR(kaddr);</div><div class='ctx'> 		}</div><div class='ctx'> 		if (unlikely(need_revalidate)) {</div><div class='ctx'> 			if (offset) {</div><div class='ctx'> 				offset = ext2_validate_entry(kaddr, offset, chunk_mask);</div><div class='ctx'> 				ctx-&gt;pos = (n&lt;&lt;PAGE_SHIFT) + offset;</div><div class='ctx'> 			}</div><div class='del'>-			file-&gt;f_version = inode_query_iversion(inode);</div><div class='add'>+			*(u64 *)file-&gt;private_data = inode_query_iversion(inode);</div><div class='ctx'> 			need_revalidate = false;</div><div class='ctx'> 		}</div><div class='ctx'> 		de = (ext2_dirent *)(kaddr+offset);</div><div class='hunk'>@@ -306,7 +299,7 @@ ext2_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 			if (de-&gt;rec_len == 0) {</div><div class='ctx'> 				ext2_error(sb, __func__,</div><div class='ctx'> 					"zero-length directory entry");</div><div class='del'>-				ext2_put_page(page, kaddr);</div><div class='add'>+				folio_release_kmap(folio, de);</div><div class='ctx'> 				return -EIO;</div><div class='ctx'> 			}</div><div class='ctx'> 			if (de-&gt;inode) {</div><div class='hunk'>@@ -318,13 +311,13 @@ ext2_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 				if (!dir_emit(ctx, de-&gt;name, de-&gt;name_len,</div><div class='ctx'> 						le32_to_cpu(de-&gt;inode),</div><div class='ctx'> 						d_type)) {</div><div class='del'>-					ext2_put_page(page, kaddr);</div><div class='add'>+					folio_release_kmap(folio, de);</div><div class='ctx'> 					return 0;</div><div class='ctx'> 				}</div><div class='ctx'> 			}</div><div class='ctx'> 			ctx-&gt;pos += ext2_rec_len_from_disk(de-&gt;rec_len);</div><div class='ctx'> 		}</div><div class='del'>-		ext2_put_page(page, kaddr);</div><div class='add'>+		folio_release_kmap(folio, kaddr);</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -337,64 +330,56 @@ ext2_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'>  * and the entry itself. Page is returned mapped and unlocked.</div><div class='ctx'>  * Entry is guaranteed to be valid.</div><div class='ctx'>  *</div><div class='del'>- * On Success ext2_put_page() should be called on *res_page.</div><div class='add'>+ * On Success folio_release_kmap() should be called on *foliop.</div><div class='ctx'>  *</div><div class='del'>- * NOTE: Calls to ext2_get_page()/ext2_put_page() must be nested according to</div><div class='del'>- * the rules documented in kmap_local_page()/kunmap_local().</div><div class='add'>+ * NOTE: Calls to ext2_get_folio()/folio_release_kmap() must be nested</div><div class='add'>+ * according to the rules documented in kmap_local_folio()/kunmap_local().</div><div class='ctx'>  *</div><div class='del'>- * ext2_find_entry() and ext2_dotdot() act as a call to ext2_get_page() and</div><div class='del'>- * should be treated as a call to ext2_get_page() for nesting purposes.</div><div class='add'>+ * ext2_find_entry() and ext2_dotdot() act as a call to ext2_get_folio()</div><div class='add'>+ * and should be treated as a call to ext2_get_folio() for nesting</div><div class='add'>+ * purposes.</div><div class='ctx'>  */</div><div class='ctx'> struct ext2_dir_entry_2 *ext2_find_entry (struct inode *dir,</div><div class='del'>-			const struct qstr *child, struct page **res_page,</div><div class='del'>-			void **res_page_addr)</div><div class='add'>+			const struct qstr *child, struct folio **foliop)</div><div class='ctx'> {</div><div class='ctx'> 	const char *name = child-&gt;name;</div><div class='ctx'> 	int namelen = child-&gt;len;</div><div class='ctx'> 	unsigned reclen = EXT2_DIR_REC_LEN(namelen);</div><div class='ctx'> 	unsigned long start, n;</div><div class='ctx'> 	unsigned long npages = dir_pages(dir);</div><div class='del'>-	struct page *page = NULL;</div><div class='ctx'> 	struct ext2_inode_info *ei = EXT2_I(dir);</div><div class='ctx'> 	ext2_dirent * de;</div><div class='del'>-	void *page_addr;</div><div class='ctx'> </div><div class='ctx'> 	if (npages == 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	/* OFFSET_CACHE */</div><div class='del'>-	*res_page = NULL;</div><div class='del'>-	*res_page_addr = NULL;</div><div class='del'>-</div><div class='ctx'> 	start = ei-&gt;i_dir_start_lookup;</div><div class='ctx'> 	if (start &gt;= npages)</div><div class='ctx'> 		start = 0;</div><div class='ctx'> 	n = start;</div><div class='ctx'> 	do {</div><div class='del'>-		char *kaddr;</div><div class='del'>-		page = ext2_get_page(dir, n, 0, &amp;page_addr);</div><div class='del'>-		if (IS_ERR(page))</div><div class='del'>-			return ERR_CAST(page);</div><div class='add'>+		char *kaddr = ext2_get_folio(dir, n, 0, foliop);</div><div class='add'>+		if (IS_ERR(kaddr))</div><div class='add'>+			return ERR_CAST(kaddr);</div><div class='ctx'> </div><div class='del'>-		kaddr = page_addr;</div><div class='ctx'> 		de = (ext2_dirent *) kaddr;</div><div class='ctx'> 		kaddr += ext2_last_byte(dir, n) - reclen;</div><div class='ctx'> 		while ((char *) de &lt;= kaddr) {</div><div class='ctx'> 			if (de-&gt;rec_len == 0) {</div><div class='ctx'> 				ext2_error(dir-&gt;i_sb, __func__,</div><div class='ctx'> 					"zero-length directory entry");</div><div class='del'>-				ext2_put_page(page, page_addr);</div><div class='add'>+				folio_release_kmap(*foliop, de);</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='ctx'> 			if (ext2_match(namelen, name, de))</div><div class='ctx'> 				goto found;</div><div class='ctx'> 			de = ext2_next_entry(de);</div><div class='ctx'> 		}</div><div class='del'>-		ext2_put_page(page, page_addr);</div><div class='add'>+		folio_release_kmap(*foliop, kaddr);</div><div class='ctx'> </div><div class='ctx'> 		if (++n &gt;= npages)</div><div class='ctx'> 			n = 0;</div><div class='del'>-		/* next page is past the blocks we've got */</div><div class='add'>+		/* next folio is past the blocks we've got */</div><div class='ctx'> 		if (unlikely(n &gt; (dir-&gt;i_blocks &gt;&gt; (PAGE_SHIFT - 9)))) {</div><div class='ctx'> 			ext2_error(dir-&gt;i_sb, __func__,</div><div class='ctx'> 				"dir %lu size %lld exceeds block count %llu",</div><div class='hunk'>@@ -407,78 +392,82 @@ out:</div><div class='ctx'> 	return ERR_PTR(-ENOENT);</div><div class='ctx'> </div><div class='ctx'> found:</div><div class='del'>-	*res_page = page;</div><div class='del'>-	*res_page_addr = page_addr;</div><div class='ctx'> 	ei-&gt;i_dir_start_lookup = n;</div><div class='ctx'> 	return de;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='add'>+/*</div><div class='ctx'>  * Return the '..' directory entry and the page in which the entry was found</div><div class='ctx'>  * (as a parameter - p).</div><div class='ctx'>  *</div><div class='del'>- * On Success ext2_put_page() should be called on *p.</div><div class='add'>+ * On Success folio_release_kmap() should be called on *foliop.</div><div class='ctx'>  *</div><div class='del'>- * NOTE: Calls to ext2_get_page()/ext2_put_page() must be nested according to</div><div class='del'>- * the rules documented in kmap_local_page()/kunmap_local().</div><div class='add'>+ * NOTE: Calls to ext2_get_folio()/folio_release_kmap() must be nested</div><div class='add'>+ * according to the rules documented in kmap_local_folio()/kunmap_local().</div><div class='ctx'>  *</div><div class='del'>- * ext2_find_entry() and ext2_dotdot() act as a call to ext2_get_page() and</div><div class='del'>- * should be treated as a call to ext2_get_page() for nesting purposes.</div><div class='add'>+ * ext2_find_entry() and ext2_dotdot() act as a call to ext2_get_folio()</div><div class='add'>+ * and should be treated as a call to ext2_get_folio() for nesting</div><div class='add'>+ * purposes.</div><div class='ctx'>  */</div><div class='del'>-struct ext2_dir_entry_2 *ext2_dotdot(struct inode *dir, struct page **p,</div><div class='del'>-				     void **pa)</div><div class='add'>+struct ext2_dir_entry_2 *ext2_dotdot(struct inode *dir, struct folio **foliop)</div><div class='ctx'> {</div><div class='del'>-	void *page_addr;</div><div class='del'>-	struct page *page = ext2_get_page(dir, 0, 0, &amp;page_addr);</div><div class='del'>-	ext2_dirent *de = NULL;</div><div class='del'>-</div><div class='del'>-	if (!IS_ERR(page)) {</div><div class='del'>-		de = ext2_next_entry((ext2_dirent *) page_addr);</div><div class='del'>-		*p = page;</div><div class='del'>-		*pa = page_addr;</div><div class='del'>-	}</div><div class='del'>-	return de;</div><div class='add'>+	ext2_dirent *de = ext2_get_folio(dir, 0, 0, foliop);</div><div class='add'>+</div><div class='add'>+	if (!IS_ERR(de))</div><div class='add'>+		return ext2_next_entry(de);</div><div class='add'>+	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int ext2_inode_by_name(struct inode *dir, const struct qstr *child, ino_t *ino)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext2_dir_entry_2 *de;</div><div class='del'>-	struct page *page;</div><div class='del'>-	void *page_addr;</div><div class='del'>-	</div><div class='del'>-	de = ext2_find_entry(dir, child, &amp;page, &amp;page_addr);</div><div class='add'>+	struct folio *folio;</div><div class='add'>+</div><div class='add'>+	de = ext2_find_entry(dir, child, &amp;folio);</div><div class='ctx'> 	if (IS_ERR(de))</div><div class='ctx'> 		return PTR_ERR(de);</div><div class='ctx'> </div><div class='ctx'> 	*ino = le32_to_cpu(de-&gt;inode);</div><div class='del'>-	ext2_put_page(page, page_addr);</div><div class='add'>+	folio_release_kmap(folio, de);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext2_prepare_chunk(struct page *page, loff_t pos, unsigned len)</div><div class='add'>+static int ext2_prepare_chunk(struct folio *folio, loff_t pos, unsigned len)</div><div class='ctx'> {</div><div class='del'>-	return __block_write_begin(page, pos, len, ext2_get_block);</div><div class='add'>+	return __block_write_begin(folio, pos, len, ext2_get_block);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void ext2_set_link(struct inode *dir, struct ext2_dir_entry_2 *de,</div><div class='del'>-		   struct page *page, void *page_addr, struct inode *inode,</div><div class='del'>-		   int update_times)</div><div class='add'>+static int ext2_handle_dirsync(struct inode *dir)</div><div class='ctx'> {</div><div class='del'>-	loff_t pos = page_offset(page) +</div><div class='del'>-			(char *) de - (char *) page_addr;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = filemap_write_and_wait(dir-&gt;i_mapping);</div><div class='add'>+	if (!err)</div><div class='add'>+		err = sync_inode_metadata(dir, 1);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int ext2_set_link(struct inode *dir, struct ext2_dir_entry_2 *de,</div><div class='add'>+		struct folio *folio, struct inode *inode, bool update_times)</div><div class='add'>+{</div><div class='add'>+	loff_t pos = folio_pos(folio) + offset_in_folio(folio, de);</div><div class='ctx'> 	unsigned len = ext2_rec_len_from_disk(de-&gt;rec_len);</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	lock_page(page);</div><div class='del'>-	err = ext2_prepare_chunk(page, pos, len);</div><div class='del'>-	BUG_ON(err);</div><div class='add'>+	folio_lock(folio);</div><div class='add'>+	err = ext2_prepare_chunk(folio, pos, len);</div><div class='add'>+	if (err) {</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		return err;</div><div class='add'>+	}</div><div class='ctx'> 	de-&gt;inode = cpu_to_le32(inode-&gt;i_ino);</div><div class='ctx'> 	ext2_set_de_type(de, inode);</div><div class='del'>-	err = ext2_commit_chunk(page, pos, len);</div><div class='add'>+	ext2_commit_chunk(folio, pos, len);</div><div class='ctx'> 	if (update_times)</div><div class='del'>-		dir-&gt;i_mtime = dir-&gt;i_ctime = current_time(dir);</div><div class='add'>+		inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='ctx'> 	EXT2_I(dir)-&gt;i_flags &amp;= ~EXT2_BTREE_FL;</div><div class='ctx'> 	mark_inode_dirty(dir);</div><div class='add'>+	return ext2_handle_dirsync(dir);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -492,8 +481,7 @@ int ext2_add_link (struct dentry *dentry, struct inode *inode)</div><div class='ctx'> 	unsigned chunk_size = ext2_chunk_size(dir);</div><div class='ctx'> 	unsigned reclen = EXT2_DIR_REC_LEN(namelen);</div><div class='ctx'> 	unsigned short rec_len, name_len;</div><div class='del'>-	struct page *page = NULL;</div><div class='del'>-	void *page_addr = NULL;</div><div class='add'>+	struct folio *folio = NULL;</div><div class='ctx'> 	ext2_dirent * de;</div><div class='ctx'> 	unsigned long npages = dir_pages(dir);</div><div class='ctx'> 	unsigned long n;</div><div class='hunk'>@@ -502,22 +490,19 @@ int ext2_add_link (struct dentry *dentry, struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We take care of directory expansion in the same loop.</div><div class='del'>-	 * This code plays outside i_size, so it locks the page</div><div class='add'>+	 * This code plays outside i_size, so it locks the folio</div><div class='ctx'> 	 * to protect that region.</div><div class='ctx'> 	 */</div><div class='ctx'> 	for (n = 0; n &lt;= npages; n++) {</div><div class='del'>-		char *kaddr;</div><div class='add'>+		char *kaddr = ext2_get_folio(dir, n, 0, &amp;folio);</div><div class='ctx'> 		char *dir_end;</div><div class='ctx'> </div><div class='del'>-		page = ext2_get_page(dir, n, 0, &amp;page_addr);</div><div class='del'>-		err = PTR_ERR(page);</div><div class='del'>-		if (IS_ERR(page))</div><div class='del'>-			goto out;</div><div class='del'>-		lock_page(page);</div><div class='del'>-		kaddr = page_addr;</div><div class='add'>+		if (IS_ERR(kaddr))</div><div class='add'>+			return PTR_ERR(kaddr);</div><div class='add'>+		folio_lock(folio);</div><div class='ctx'> 		dir_end = kaddr + ext2_last_byte(dir, n);</div><div class='ctx'> 		de = (ext2_dirent *)kaddr;</div><div class='del'>-		kaddr += PAGE_SIZE - reclen;</div><div class='add'>+		kaddr += folio_size(folio) - reclen;</div><div class='ctx'> 		while ((char *)de &lt;= kaddr) {</div><div class='ctx'> 			if ((char *)de == dir_end) {</div><div class='ctx'> 				/* We hit i_size */</div><div class='hunk'>@@ -544,16 +529,15 @@ int ext2_add_link (struct dentry *dentry, struct inode *inode)</div><div class='ctx'> 				goto got_it;</div><div class='ctx'> 			de = (ext2_dirent *) ((char *) de + rec_len);</div><div class='ctx'> 		}</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		ext2_put_page(page, page_addr);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_release_kmap(folio, kaddr);</div><div class='ctx'> 	}</div><div class='ctx'> 	BUG();</div><div class='ctx'> 	return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> got_it:</div><div class='del'>-	pos = page_offset(page) +</div><div class='del'>-		(char *)de - (char *)page_addr;</div><div class='del'>-	err = ext2_prepare_chunk(page, pos, rec_len);</div><div class='add'>+	pos = folio_pos(folio) + offset_in_folio(folio, de);</div><div class='add'>+	err = ext2_prepare_chunk(folio, pos, rec_len);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	if (de-&gt;inode) {</div><div class='hunk'>@@ -566,17 +550,17 @@ got_it:</div><div class='ctx'> 	memcpy(de-&gt;name, name, namelen);</div><div class='ctx'> 	de-&gt;inode = cpu_to_le32(inode-&gt;i_ino);</div><div class='ctx'> 	ext2_set_de_type (de, inode);</div><div class='del'>-	err = ext2_commit_chunk(page, pos, rec_len);</div><div class='del'>-	dir-&gt;i_mtime = dir-&gt;i_ctime = current_time(dir);</div><div class='add'>+	ext2_commit_chunk(folio, pos, rec_len);</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='ctx'> 	EXT2_I(dir)-&gt;i_flags &amp;= ~EXT2_BTREE_FL;</div><div class='ctx'> 	mark_inode_dirty(dir);</div><div class='add'>+	err = ext2_handle_dirsync(dir);</div><div class='ctx'> 	/* OFFSET_CACHE */</div><div class='ctx'> out_put:</div><div class='del'>-	ext2_put_page(page, page_addr);</div><div class='del'>-out:</div><div class='add'>+	folio_release_kmap(folio, de);</div><div class='ctx'> 	return err;</div><div class='ctx'> out_unlock:</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> 	goto out_put;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -584,43 +568,47 @@ out_unlock:</div><div class='ctx'>  * ext2_delete_entry deletes a directory entry by merging it with the</div><div class='ctx'>  * previous entry. Page is up-to-date.</div><div class='ctx'>  */</div><div class='del'>-int ext2_delete_entry (struct ext2_dir_entry_2 *dir, struct page *page,</div><div class='del'>-			char *kaddr)</div><div class='add'>+int ext2_delete_entry(struct ext2_dir_entry_2 *dir, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-	unsigned from = ((char*)dir - kaddr) &amp; ~(ext2_chunk_size(inode)-1);</div><div class='del'>-	unsigned to = ((char *)dir - kaddr) +</div><div class='del'>-				ext2_rec_len_from_disk(dir-&gt;rec_len);</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+	size_t from, to;</div><div class='add'>+	char *kaddr;</div><div class='ctx'> 	loff_t pos;</div><div class='del'>-	ext2_dirent * pde = NULL;</div><div class='del'>-	ext2_dirent * de = (ext2_dirent *) (kaddr + from);</div><div class='add'>+	ext2_dirent *de, *pde = NULL;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='add'>+	from = offset_in_folio(folio, dir);</div><div class='add'>+	to = from + ext2_rec_len_from_disk(dir-&gt;rec_len);</div><div class='add'>+	kaddr = (char *)dir - from;</div><div class='add'>+	from &amp;= ~(ext2_chunk_size(inode)-1);</div><div class='add'>+	de = (ext2_dirent *)(kaddr + from);</div><div class='add'>+</div><div class='ctx'> 	while ((char*)de &lt; (char*)dir) {</div><div class='ctx'> 		if (de-&gt;rec_len == 0) {</div><div class='ctx'> 			ext2_error(inode-&gt;i_sb, __func__,</div><div class='ctx'> 				"zero-length directory entry");</div><div class='del'>-			err = -EIO;</div><div class='del'>-			goto out;</div><div class='add'>+			return -EIO;</div><div class='ctx'> 		}</div><div class='ctx'> 		pde = de;</div><div class='ctx'> 		de = ext2_next_entry(de);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (pde)</div><div class='del'>-		from = (char *)pde - kaddr;</div><div class='del'>-	pos = page_offset(page) + from;</div><div class='del'>-	lock_page(page);</div><div class='del'>-	err = ext2_prepare_chunk(page, pos, to - from);</div><div class='del'>-	BUG_ON(err);</div><div class='add'>+		from = offset_in_folio(folio, pde);</div><div class='add'>+	pos = folio_pos(folio) + from;</div><div class='add'>+	folio_lock(folio);</div><div class='add'>+	err = ext2_prepare_chunk(folio, pos, to - from);</div><div class='add'>+	if (err) {</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		return err;</div><div class='add'>+	}</div><div class='ctx'> 	if (pde)</div><div class='ctx'> 		pde-&gt;rec_len = ext2_rec_len_to_disk(to - from);</div><div class='ctx'> 	dir-&gt;inode = 0;</div><div class='del'>-	err = ext2_commit_chunk(page, pos, to - from);</div><div class='del'>-	inode-&gt;i_ctime = inode-&gt;i_mtime = current_time(inode);</div><div class='add'>+	ext2_commit_chunk(folio, pos, to - from);</div><div class='add'>+	inode_set_mtime_to_ts(inode, inode_set_ctime_current(inode));</div><div class='ctx'> 	EXT2_I(inode)-&gt;i_flags &amp;= ~EXT2_BTREE_FL;</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='del'>-out:</div><div class='del'>-	return err;</div><div class='add'>+	return ext2_handle_dirsync(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -628,21 +616,21 @@ out:</div><div class='ctx'>  */</div><div class='ctx'> int ext2_make_empty(struct inode *inode, struct inode *parent)</div><div class='ctx'> {</div><div class='del'>-	struct page *page = grab_cache_page(inode-&gt;i_mapping, 0);</div><div class='add'>+	struct folio *folio = filemap_grab_folio(inode-&gt;i_mapping, 0);</div><div class='ctx'> 	unsigned chunk_size = ext2_chunk_size(inode);</div><div class='ctx'> 	struct ext2_dir_entry_2 * de;</div><div class='ctx'> 	int err;</div><div class='ctx'> 	void *kaddr;</div><div class='ctx'> </div><div class='del'>-	if (!page)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio);</div><div class='ctx'> </div><div class='del'>-	err = ext2_prepare_chunk(page, 0, chunk_size);</div><div class='add'>+	err = ext2_prepare_chunk(folio, 0, chunk_size);</div><div class='ctx'> 	if (err) {</div><div class='del'>-		unlock_page(page);</div><div class='add'>+		folio_unlock(folio);</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='del'>-	kaddr = kmap_atomic(page);</div><div class='add'>+	kaddr = kmap_local_folio(folio, 0);</div><div class='ctx'> 	memset(kaddr, 0, chunk_size);</div><div class='ctx'> 	de = (struct ext2_dir_entry_2 *)kaddr;</div><div class='ctx'> 	de-&gt;name_len = 1;</div><div class='hunk'>@@ -657,34 +645,30 @@ int ext2_make_empty(struct inode *inode, struct inode *parent)</div><div class='ctx'> 	de-&gt;inode = cpu_to_le32(parent-&gt;i_ino);</div><div class='ctx'> 	memcpy (de-&gt;name, "..\0", 4);</div><div class='ctx'> 	ext2_set_de_type (de, inode);</div><div class='del'>-	kunmap_atomic(kaddr);</div><div class='del'>-	err = ext2_commit_chunk(page, 0, chunk_size);</div><div class='add'>+	kunmap_local(kaddr);</div><div class='add'>+	ext2_commit_chunk(folio, 0, chunk_size);</div><div class='add'>+	err = ext2_handle_dirsync(inode);</div><div class='ctx'> fail:</div><div class='del'>-	put_page(page);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * routine to check that the specified directory is empty (for rmdir)</div><div class='ctx'>  */</div><div class='del'>-int ext2_empty_dir (struct inode * inode)</div><div class='add'>+int ext2_empty_dir(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	void *page_addr = NULL;</div><div class='del'>-	struct page *page = NULL;</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	char *kaddr;</div><div class='ctx'> 	unsigned long i, npages = dir_pages(inode);</div><div class='del'>-	int dir_has_error = 0;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; npages; i++) {</div><div class='del'>-		char *kaddr;</div><div class='del'>-		ext2_dirent * de;</div><div class='del'>-		page = ext2_get_page(inode, i, dir_has_error, &amp;page_addr);</div><div class='add'>+		ext2_dirent *de;</div><div class='ctx'> </div><div class='del'>-		if (IS_ERR(page)) {</div><div class='del'>-			dir_has_error = 1;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='add'>+		kaddr = ext2_get_folio(inode, i, 0, &amp;folio);</div><div class='add'>+		if (IS_ERR(kaddr))</div><div class='add'>+			return 0;</div><div class='ctx'> </div><div class='del'>-		kaddr = page_addr;</div><div class='ctx'> 		de = (ext2_dirent *)kaddr;</div><div class='ctx'> 		kaddr += ext2_last_byte(inode, i) - EXT2_DIR_REC_LEN(1);</div><div class='ctx'> </div><div class='hunk'>@@ -710,17 +694,39 @@ int ext2_empty_dir (struct inode * inode)</div><div class='ctx'> 			}</div><div class='ctx'> 			de = ext2_next_entry(de);</div><div class='ctx'> 		}</div><div class='del'>-		ext2_put_page(page, page_addr);</div><div class='add'>+		folio_release_kmap(folio, kaddr);</div><div class='ctx'> 	}</div><div class='ctx'> 	return 1;</div><div class='ctx'> </div><div class='ctx'> not_empty:</div><div class='del'>-	ext2_put_page(page, page_addr);</div><div class='add'>+	folio_release_kmap(folio, kaddr);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ext2_dir_open(struct inode *inode, struct file *file)</div><div class='add'>+{</div><div class='add'>+	file-&gt;private_data = kzalloc(sizeof(u64), GFP_KERNEL);</div><div class='add'>+	if (!file-&gt;private_data)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int ext2_dir_release(struct inode *inode, struct file *file)</div><div class='add'>+{</div><div class='add'>+	kfree(file-&gt;private_data);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static loff_t ext2_dir_llseek(struct file *file, loff_t offset, int whence)</div><div class='add'>+{</div><div class='add'>+	return generic_llseek_cookie(file, offset, whence,</div><div class='add'>+				     (u64 *)file-&gt;private_data);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> const struct file_operations ext2_dir_operations = {</div><div class='del'>-	.llseek		= generic_file_llseek,</div><div class='add'>+	.open		= ext2_dir_open,</div><div class='add'>+	.release	= ext2_dir_release,</div><div class='add'>+	.llseek		= ext2_dir_llseek,</div><div class='ctx'> 	.read		= generic_read_dir,</div><div class='ctx'> 	.iterate_shared	= ext2_readdir,</div><div class='ctx'> 	.unlocked_ioctl = ext2_ioctl,</div><div class='head'>diff --git a/fs/ext2/ext2.h b/fs/ext2/ext2.h<br/>index 3be9dd6412b7..cf97b76e9fd3 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext2/ext2.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/ext2.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext2/ext2.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext2/ext2.h</a></div><div class='hunk'>@@ -70,10 +70,7 @@ struct mb_cache;</div><div class='ctx'>  * second extended-fs super-block data in memory</div><div class='ctx'>  */</div><div class='ctx'> struct ext2_sb_info {</div><div class='del'>-	unsigned long s_frag_size;	/* Size of a fragment in bytes */</div><div class='del'>-	unsigned long s_frags_per_block;/* Number of fragments per block */</div><div class='ctx'> 	unsigned long s_inodes_per_block;/* Number of inodes per block */</div><div class='del'>-	unsigned long s_frags_per_group;/* Number of fragments in a group */</div><div class='ctx'> 	unsigned long s_blocks_per_group;/* Number of blocks in a group */</div><div class='ctx'> 	unsigned long s_inodes_per_group;/* Number of inodes in a group */</div><div class='ctx'> 	unsigned long s_itb_per_group;	/* Number of inode table blocks per group */</div><div class='hunk'>@@ -118,6 +115,7 @@ struct ext2_sb_info {</div><div class='ctx'> 	spinlock_t s_lock;</div><div class='ctx'> 	struct mb_cache *s_ea_block_cache;</div><div class='ctx'> 	struct dax_device *s_daxdev;</div><div class='add'>+	u64 s_dax_part_off;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static inline spinlock_t *</div><div class='hunk'>@@ -177,8 +175,9 @@ static inline struct ext2_sb_info *EXT2_SB(struct super_block *sb)</div><div class='ctx'>  * Macro-instructions used to manage several block sizes</div><div class='ctx'>  */</div><div class='ctx'> #define EXT2_MIN_BLOCK_SIZE		1024</div><div class='del'>-#define	EXT2_MAX_BLOCK_SIZE		4096</div><div class='add'>+#define	EXT2_MAX_BLOCK_SIZE		65536</div><div class='ctx'> #define EXT2_MIN_BLOCK_LOG_SIZE		  10</div><div class='add'>+#define EXT2_MAX_BLOCK_LOG_SIZE		  16</div><div class='ctx'> #define EXT2_BLOCK_SIZE(s)		((s)-&gt;s_blocksize)</div><div class='ctx'> #define	EXT2_ADDR_PER_BLOCK(s)		(EXT2_BLOCK_SIZE(s) / sizeof (__u32))</div><div class='ctx'> #define EXT2_BLOCK_SIZE_BITS(s)		((s)-&gt;s_blocksize_bits)</div><div class='hunk'>@@ -187,15 +186,6 @@ static inline struct ext2_sb_info *EXT2_SB(struct super_block *sb)</div><div class='ctx'> #define EXT2_FIRST_INO(s)		(EXT2_SB(s)-&gt;s_first_ino)</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Macro-instructions used to manage fragments</div><div class='del'>- */</div><div class='del'>-#define EXT2_MIN_FRAG_SIZE		1024</div><div class='del'>-#define	EXT2_MAX_FRAG_SIZE		4096</div><div class='del'>-#define EXT2_MIN_FRAG_LOG_SIZE		  10</div><div class='del'>-#define EXT2_FRAG_SIZE(s)		(EXT2_SB(s)-&gt;s_frag_size)</div><div class='del'>-#define EXT2_FRAGS_PER_BLOCK(s)		(EXT2_SB(s)-&gt;s_frags_per_block)</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * Structure of a blocks group descriptor</div><div class='ctx'>  */</div><div class='ctx'> struct ext2_group_desc</div><div class='hunk'>@@ -378,6 +368,7 @@ struct ext2_inode {</div><div class='ctx'> #define EXT2_MOUNT_ERRORS_CONT		0x000010  /* Continue on errors */</div><div class='ctx'> #define EXT2_MOUNT_ERRORS_RO		0x000020  /* Remount fs ro on errors */</div><div class='ctx'> #define EXT2_MOUNT_ERRORS_PANIC		0x000040  /* Panic on errors */</div><div class='add'>+#define EXT2_MOUNT_ERRORS_MASK		0x000070</div><div class='ctx'> #define EXT2_MOUNT_MINIX_DF		0x000080  /* Mimics the Minix statfs */</div><div class='ctx'> #define EXT2_MOUNT_NOBH			0x000100  /* No buffer_heads */</div><div class='ctx'> #define EXT2_MOUNT_NO_UID32		0x000200  /* Disable 32-bit UIDs */</div><div class='hunk'>@@ -409,6 +400,12 @@ struct ext2_inode {</div><div class='ctx'> #define EXT2_ERRORS_DEFAULT		EXT2_ERRORS_CONTINUE</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * Allocation flags</div><div class='add'>+ */</div><div class='add'>+#define EXT2_ALLOC_NORESERVE            0x1	/* Do not use reservation</div><div class='add'>+						 * window for allocation */</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * Structure of the super block</div><div class='ctx'>  */</div><div class='ctx'> struct ext2_super_block {</div><div class='hunk'>@@ -678,7 +675,7 @@ struct ext2_inode_info {</div><div class='ctx'> 	struct inode	vfs_inode;</div><div class='ctx'> 	struct list_head i_orphan;	/* unlinked but open inodes */</div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='del'>-	struct dquot *i_dquot[MAXQUOTAS];</div><div class='add'>+	struct dquot __rcu *i_dquot[MAXQUOTAS];</div><div class='ctx'> #endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -705,13 +702,11 @@ static inline struct ext2_inode_info *EXT2_I(struct inode *inode)</div><div class='ctx'> /* balloc.c */</div><div class='ctx'> extern int ext2_bg_has_super(struct super_block *sb, int group);</div><div class='ctx'> extern unsigned long ext2_bg_num_gdb(struct super_block *sb, int group);</div><div class='del'>-extern ext2_fsblk_t ext2_new_block(struct inode *, unsigned long, int *);</div><div class='del'>-extern ext2_fsblk_t ext2_new_blocks(struct inode *, unsigned long,</div><div class='del'>-				unsigned long *, int *);</div><div class='add'>+extern ext2_fsblk_t ext2_new_blocks(struct inode *, ext2_fsblk_t,</div><div class='add'>+				unsigned long *, int *, unsigned int);</div><div class='ctx'> extern int ext2_data_block_valid(struct ext2_sb_info *sbi, ext2_fsblk_t start_blk,</div><div class='ctx'> 				 unsigned int count);</div><div class='del'>-extern void ext2_free_blocks (struct inode *, unsigned long,</div><div class='del'>-			      unsigned long);</div><div class='add'>+extern void ext2_free_blocks(struct inode *, ext2_fsblk_t, unsigned long);</div><div class='ctx'> extern unsigned long ext2_count_free_blocks (struct super_block *);</div><div class='ctx'> extern unsigned long ext2_count_dirs (struct super_block *);</div><div class='ctx'> extern struct ext2_group_desc * ext2_get_group_desc(struct super_block * sb,</div><div class='hunk'>@@ -723,23 +718,17 @@ extern void ext2_init_block_alloc_info(struct inode *);</div><div class='ctx'> extern void ext2_rsv_window_add(struct super_block *sb, struct ext2_reserve_window_node *rsv);</div><div class='ctx'> </div><div class='ctx'> /* dir.c */</div><div class='del'>-extern int ext2_add_link (struct dentry *, struct inode *);</div><div class='del'>-extern int ext2_inode_by_name(struct inode *dir,</div><div class='add'>+int ext2_add_link(struct dentry *, struct inode *);</div><div class='add'>+int ext2_inode_by_name(struct inode *dir,</div><div class='ctx'> 			      const struct qstr *child, ino_t *ino);</div><div class='del'>-extern int ext2_make_empty(struct inode *, struct inode *);</div><div class='del'>-extern struct ext2_dir_entry_2 *ext2_find_entry(struct inode *, const struct qstr *,</div><div class='del'>-						struct page **, void **res_page_addr);</div><div class='del'>-extern int ext2_delete_entry(struct ext2_dir_entry_2 *dir, struct page *page,</div><div class='del'>-			     char *kaddr);</div><div class='del'>-extern int ext2_empty_dir (struct inode *);</div><div class='del'>-extern struct ext2_dir_entry_2 *ext2_dotdot(struct inode *dir, struct page **p, void **pa);</div><div class='del'>-extern void ext2_set_link(struct inode *, struct ext2_dir_entry_2 *, struct page *, void *,</div><div class='del'>-			  struct inode *, int);</div><div class='del'>-static inline void ext2_put_page(struct page *page, void *page_addr)</div><div class='del'>-{</div><div class='del'>-	kunmap_local(page_addr);</div><div class='del'>-	put_page(page);</div><div class='del'>-}</div><div class='add'>+int ext2_make_empty(struct inode *, struct inode *);</div><div class='add'>+struct ext2_dir_entry_2 *ext2_find_entry(struct inode *, const struct qstr *,</div><div class='add'>+		struct folio **foliop);</div><div class='add'>+int ext2_delete_entry(struct ext2_dir_entry_2 *dir, struct folio *folio);</div><div class='add'>+int ext2_empty_dir(struct inode *);</div><div class='add'>+struct ext2_dir_entry_2 *ext2_dotdot(struct inode *dir, struct folio **foliop);</div><div class='add'>+int ext2_set_link(struct inode *dir, struct ext2_dir_entry_2 *de,</div><div class='add'>+		struct folio *folio, struct inode *inode, bool update_times);</div><div class='ctx'> </div><div class='ctx'> /* ialloc.c */</div><div class='ctx'> extern struct inode * ext2_new_inode (struct inode *, umode_t, const struct qstr *);</div><div class='hunk'>@@ -751,18 +740,19 @@ extern unsigned long ext2_count_free (struct buffer_head *, unsigned);</div><div class='ctx'> extern struct inode *ext2_iget (struct super_block *, unsigned long);</div><div class='ctx'> extern int ext2_write_inode (struct inode *, struct writeback_control *);</div><div class='ctx'> extern void ext2_evict_inode(struct inode *);</div><div class='add'>+void ext2_write_failed(struct address_space *mapping, loff_t to);</div><div class='ctx'> extern int ext2_get_block(struct inode *, sector_t, struct buffer_head *, int);</div><div class='del'>-extern int ext2_setattr (struct user_namespace *, struct dentry *, struct iattr *);</div><div class='del'>-extern int ext2_getattr (struct user_namespace *, const struct path *,</div><div class='add'>+extern int ext2_setattr (struct mnt_idmap *, struct dentry *, struct iattr *);</div><div class='add'>+extern int ext2_getattr (struct mnt_idmap *, const struct path *,</div><div class='ctx'> 			 struct kstat *, u32, unsigned int);</div><div class='ctx'> extern void ext2_set_inode_flags(struct inode *inode);</div><div class='ctx'> extern int ext2_fiemap(struct inode *inode, struct fiemap_extent_info *fieinfo,</div><div class='ctx'> 		       u64 start, u64 len);</div><div class='ctx'> </div><div class='ctx'> /* ioctl.c */</div><div class='del'>-extern int ext2_fileattr_get(struct dentry *dentry, struct fileattr *fa);</div><div class='del'>-extern int ext2_fileattr_set(struct user_namespace *mnt_userns,</div><div class='del'>-			     struct dentry *dentry, struct fileattr *fa);</div><div class='add'>+extern int ext2_fileattr_get(struct dentry *dentry, struct file_kattr *fa);</div><div class='add'>+extern int ext2_fileattr_set(struct mnt_idmap *idmap,</div><div class='add'>+			     struct dentry *dentry, struct file_kattr *fa);</div><div class='ctx'> extern long ext2_ioctl(struct file *, unsigned int, unsigned long);</div><div class='ctx'> extern long ext2_compat_ioctl(struct file *, unsigned int, unsigned long);</div><div class='ctx'> </div><div class='hunk'>@@ -794,7 +784,6 @@ extern const struct file_operations ext2_file_operations;</div><div class='ctx'> /* inode.c */</div><div class='ctx'> extern void ext2_set_file_ops(struct inode *inode);</div><div class='ctx'> extern const struct address_space_operations ext2_aops;</div><div class='del'>-extern const struct address_space_operations ext2_nobh_aops;</div><div class='ctx'> extern const struct iomap_ops ext2_iomap_ops;</div><div class='ctx'> </div><div class='ctx'> /* namei.c */</div><div class='head'>diff --git a/fs/ext2/file.c b/fs/ext2/file.c<br/>index eb97aa3d700e..76bddce462fc 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext2/file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/file.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext2/file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext2/file.c</a></div><div class='hunk'>@@ -25,9 +25,11 @@</div><div class='ctx'> #include &lt;linux/quotaops.h&gt;</div><div class='ctx'> #include &lt;linux/iomap.h&gt;</div><div class='ctx'> #include &lt;linux/uio.h&gt;</div><div class='add'>+#include &lt;linux/buffer_head.h&gt;</div><div class='ctx'> #include "ext2.h"</div><div class='ctx'> #include "xattr.h"</div><div class='ctx'> #include "acl.h"</div><div class='add'>+#include "trace.h"</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_FS_DAX</div><div class='ctx'> static ssize_t ext2_dax_read_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='hunk'>@@ -101,7 +103,7 @@ static vm_fault_t ext2_dax_fault(struct vm_fault *vmf)</div><div class='ctx'> 	}</div><div class='ctx'> 	filemap_invalidate_lock_shared(inode-&gt;i_mapping);</div><div class='ctx'> </div><div class='del'>-	ret = dax_iomap_fault(vmf, PE_SIZE_PTE, NULL, NULL, &amp;ext2_iomap_ops);</div><div class='add'>+	ret = dax_iomap_fault(vmf, 0, NULL, NULL, &amp;ext2_iomap_ops);</div><div class='ctx'> </div><div class='ctx'> 	filemap_invalidate_unlock_shared(inode-&gt;i_mapping);</div><div class='ctx'> 	if (write)</div><div class='hunk'>@@ -120,17 +122,19 @@ static const struct vm_operations_struct ext2_dax_vm_ops = {</div><div class='ctx'> 	.pfn_mkwrite	= ext2_dax_fault,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int ext2_file_mmap(struct file *file, struct vm_area_struct *vma)</div><div class='add'>+static int ext2_file_mmap_prepare(struct vm_area_desc *desc)</div><div class='ctx'> {</div><div class='add'>+	struct file *file = desc-&gt;file;</div><div class='add'>+</div><div class='ctx'> 	if (!IS_DAX(file_inode(file)))</div><div class='del'>-		return generic_file_mmap(file, vma);</div><div class='add'>+		return generic_file_mmap_prepare(desc);</div><div class='ctx'> </div><div class='ctx'> 	file_accessed(file);</div><div class='del'>-	vma-&gt;vm_ops = &amp;ext2_dax_vm_ops;</div><div class='add'>+	desc-&gt;vm_ops = &amp;ext2_dax_vm_ops;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> #else</div><div class='del'>-#define ext2_file_mmap	generic_file_mmap</div><div class='add'>+#define ext2_file_mmap_prepare	generic_file_mmap_prepare</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -153,7 +157,7 @@ int ext2_fsync(struct file *file, loff_t start, loff_t end, int datasync)</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct super_block *sb = file-&gt;f_mapping-&gt;host-&gt;i_sb;</div><div class='ctx'> </div><div class='del'>-	ret = generic_file_fsync(file, start, end, datasync);</div><div class='add'>+	ret = generic_buffers_fsync(file, start, end, datasync);</div><div class='ctx'> 	if (ret == -EIO)</div><div class='ctx'> 		/* We don't really know where the IO error happened... */</div><div class='ctx'> 		ext2_error(sb, __func__,</div><div class='hunk'>@@ -161,12 +165,130 @@ int ext2_fsync(struct file *file, loff_t start, loff_t end, int datasync)</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static ssize_t ext2_dio_read_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='add'>+{</div><div class='add'>+	struct file *file = iocb-&gt;ki_filp;</div><div class='add'>+	struct inode *inode = file-&gt;f_mapping-&gt;host;</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	trace_ext2_dio_read_begin(iocb, to, 0);</div><div class='add'>+	inode_lock_shared(inode);</div><div class='add'>+	ret = iomap_dio_rw(iocb, to, &amp;ext2_iomap_ops, NULL, 0, NULL, 0);</div><div class='add'>+	inode_unlock_shared(inode);</div><div class='add'>+	trace_ext2_dio_read_end(iocb, to, ret);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ext2_dio_write_end_io(struct kiocb *iocb, ssize_t size,</div><div class='add'>+				 int error, unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	loff_t pos = iocb-&gt;ki_pos;</div><div class='add'>+	struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='add'>+</div><div class='add'>+	if (error)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If we are extending the file, we have to update i_size here before</div><div class='add'>+	 * page cache gets invalidated in iomap_dio_rw(). This prevents racing</div><div class='add'>+	 * buffered reads from zeroing out too much from page cache pages.</div><div class='add'>+	 * Note that all extending writes always happens synchronously with</div><div class='add'>+	 * inode lock held by ext2_dio_write_iter(). So it is safe to update</div><div class='add'>+	 * inode size here for extending file writes.</div><div class='add'>+	 */</div><div class='add'>+	pos += size;</div><div class='add'>+	if (pos &gt; i_size_read(inode)) {</div><div class='add'>+		i_size_write(inode, pos);</div><div class='add'>+		mark_inode_dirty(inode);</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='add'>+	trace_ext2_dio_write_endio(iocb, size, error);</div><div class='add'>+	return error;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct iomap_dio_ops ext2_dio_write_ops = {</div><div class='add'>+	.end_io = ext2_dio_write_end_io,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static ssize_t ext2_dio_write_iter(struct kiocb *iocb, struct iov_iter *from)</div><div class='add'>+{</div><div class='add'>+	struct file *file = iocb-&gt;ki_filp;</div><div class='add'>+	struct inode *inode = file-&gt;f_mapping-&gt;host;</div><div class='add'>+	ssize_t ret;</div><div class='add'>+	unsigned int flags = 0;</div><div class='add'>+	unsigned long blocksize = inode-&gt;i_sb-&gt;s_blocksize;</div><div class='add'>+	loff_t offset = iocb-&gt;ki_pos;</div><div class='add'>+	loff_t count = iov_iter_count(from);</div><div class='add'>+	ssize_t status = 0;</div><div class='add'>+</div><div class='add'>+	trace_ext2_dio_write_begin(iocb, from, 0);</div><div class='add'>+	inode_lock(inode);</div><div class='add'>+	ret = generic_write_checks(iocb, from);</div><div class='add'>+	if (ret &lt;= 0)</div><div class='add'>+		goto out_unlock;</div><div class='add'>+</div><div class='add'>+	ret = kiocb_modified(iocb);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_unlock;</div><div class='add'>+</div><div class='add'>+	/* use IOMAP_DIO_FORCE_WAIT for unaligned or extending writes */</div><div class='add'>+	if (iocb-&gt;ki_pos + iov_iter_count(from) &gt; i_size_read(inode) ||</div><div class='add'>+	   (!IS_ALIGNED(iocb-&gt;ki_pos | iov_iter_alignment(from), blocksize)))</div><div class='add'>+		flags |= IOMAP_DIO_FORCE_WAIT;</div><div class='add'>+</div><div class='add'>+	ret = iomap_dio_rw(iocb, from, &amp;ext2_iomap_ops, &amp;ext2_dio_write_ops,</div><div class='add'>+			   flags, NULL, 0);</div><div class='add'>+</div><div class='add'>+	/* ENOTBLK is magic return value for fallback to buffered-io */</div><div class='add'>+	if (ret == -ENOTBLK)</div><div class='add'>+		ret = 0;</div><div class='add'>+</div><div class='add'>+	if (ret &lt; 0 &amp;&amp; ret != -EIOCBQUEUED)</div><div class='add'>+		ext2_write_failed(inode-&gt;i_mapping, offset + count);</div><div class='add'>+</div><div class='add'>+	/* handle case for partial write and for fallback to buffered write */</div><div class='add'>+	if (ret &gt;= 0 &amp;&amp; iov_iter_count(from)) {</div><div class='add'>+		loff_t pos, endbyte;</div><div class='add'>+		int ret2;</div><div class='add'>+</div><div class='add'>+		iocb-&gt;ki_flags &amp;= ~IOCB_DIRECT;</div><div class='add'>+		pos = iocb-&gt;ki_pos;</div><div class='add'>+		status = generic_perform_write(iocb, from);</div><div class='add'>+		if (unlikely(status &lt; 0)) {</div><div class='add'>+			ret = status;</div><div class='add'>+			goto out_unlock;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		ret += status;</div><div class='add'>+		endbyte = pos + status - 1;</div><div class='add'>+		ret2 = filemap_write_and_wait_range(inode-&gt;i_mapping, pos,</div><div class='add'>+						    endbyte);</div><div class='add'>+		if (!ret2)</div><div class='add'>+			invalidate_mapping_pages(inode-&gt;i_mapping,</div><div class='add'>+						 pos &gt;&gt; PAGE_SHIFT,</div><div class='add'>+						 endbyte &gt;&gt; PAGE_SHIFT);</div><div class='add'>+		if (ret &gt; 0)</div><div class='add'>+			generic_write_sync(iocb, ret);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+out_unlock:</div><div class='add'>+	inode_unlock(inode);</div><div class='add'>+	if (status)</div><div class='add'>+		trace_ext2_dio_write_buff_end(iocb, from, status);</div><div class='add'>+	trace_ext2_dio_write_end(iocb, from, ret);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static ssize_t ext2_file_read_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='ctx'> {</div><div class='ctx'> #ifdef CONFIG_FS_DAX</div><div class='ctx'> 	if (IS_DAX(iocb-&gt;ki_filp-&gt;f_mapping-&gt;host))</div><div class='ctx'> 		return ext2_dax_read_iter(iocb, to);</div><div class='ctx'> #endif</div><div class='add'>+	if (iocb-&gt;ki_flags &amp; IOCB_DIRECT)</div><div class='add'>+		return ext2_dio_read_iter(iocb, to);</div><div class='add'>+</div><div class='ctx'> 	return generic_file_read_iter(iocb, to);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -176,9 +298,18 @@ static ssize_t ext2_file_write_iter(struct kiocb *iocb, struct iov_iter *from)</div><div class='ctx'> 	if (IS_DAX(iocb-&gt;ki_filp-&gt;f_mapping-&gt;host))</div><div class='ctx'> 		return ext2_dax_write_iter(iocb, from);</div><div class='ctx'> #endif</div><div class='add'>+	if (iocb-&gt;ki_flags &amp; IOCB_DIRECT)</div><div class='add'>+		return ext2_dio_write_iter(iocb, from);</div><div class='add'>+</div><div class='ctx'> 	return generic_file_write_iter(iocb, from);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int ext2_file_open(struct inode *inode, struct file *filp)</div><div class='add'>+{</div><div class='add'>+	filp-&gt;f_mode |= FMODE_CAN_ODIRECT;</div><div class='add'>+	return dquot_file_open(inode, filp);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> const struct file_operations ext2_file_operations = {</div><div class='ctx'> 	.llseek		= generic_file_llseek,</div><div class='ctx'> 	.read_iter	= ext2_file_read_iter,</div><div class='hunk'>@@ -187,12 +318,12 @@ const struct file_operations ext2_file_operations = {</div><div class='ctx'> #ifdef CONFIG_COMPAT</div><div class='ctx'> 	.compat_ioctl	= ext2_compat_ioctl,</div><div class='ctx'> #endif</div><div class='del'>-	.mmap		= ext2_file_mmap,</div><div class='del'>-	.open		= dquot_file_open,</div><div class='add'>+	.mmap_prepare	= ext2_file_mmap_prepare,</div><div class='add'>+	.open		= ext2_file_open,</div><div class='ctx'> 	.release	= ext2_release_file,</div><div class='ctx'> 	.fsync		= ext2_fsync,</div><div class='ctx'> 	.get_unmapped_area = thp_get_unmapped_area,</div><div class='del'>-	.splice_read	= generic_file_splice_read,</div><div class='add'>+	.splice_read	= filemap_splice_read,</div><div class='ctx'> 	.splice_write	= iter_file_splice_write,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -200,7 +331,7 @@ const struct inode_operations ext2_file_inode_operations = {</div><div class='ctx'> 	.listxattr	= ext2_listxattr,</div><div class='ctx'> 	.getattr	= ext2_getattr,</div><div class='ctx'> 	.setattr	= ext2_setattr,</div><div class='del'>-	.get_acl	= ext2_get_acl,</div><div class='add'>+	.get_inode_acl	= ext2_get_acl,</div><div class='ctx'> 	.set_acl	= ext2_set_acl,</div><div class='ctx'> 	.fiemap		= ext2_fiemap,</div><div class='ctx'> 	.fileattr_get	= ext2_fileattr_get,</div><div class='head'>diff --git a/fs/ext2/ialloc.c b/fs/ext2/ialloc.c<br/>index df14e750e9fe..fdf63e9c6e7c 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext2/ialloc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/ialloc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext2/ialloc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext2/ialloc.c</a></div><div class='hunk'>@@ -170,11 +170,6 @@ static void ext2_preread_inode(struct inode *inode)</div><div class='ctx'> 	unsigned long offset;</div><div class='ctx'> 	unsigned long block;</div><div class='ctx'> 	struct ext2_group_desc * gdp;</div><div class='del'>-	struct backing_dev_info *bdi;</div><div class='del'>-</div><div class='del'>-	bdi = inode_to_bdi(inode);</div><div class='del'>-	if (bdi_rw_congested(bdi))</div><div class='del'>-		return;</div><div class='ctx'> </div><div class='ctx'> 	block_group = (inode-&gt;i_ino - 1) / EXT2_INODES_PER_GROUP(inode-&gt;i_sb);</div><div class='ctx'> 	gdp = ext2_get_group_desc(inode-&gt;i_sb, block_group, NULL);</div><div class='hunk'>@@ -278,12 +273,10 @@ static int find_group_orlov(struct super_block *sb, struct inode *parent)</div><div class='ctx'> </div><div class='ctx'> 	if ((parent == d_inode(sb-&gt;s_root)) ||</div><div class='ctx'> 	    (EXT2_I(parent)-&gt;i_flags &amp; EXT2_TOPDIR_FL)) {</div><div class='del'>-		struct ext2_group_desc *best_desc = NULL;</div><div class='ctx'> 		int best_ndir = inodes_per_group;</div><div class='ctx'> 		int best_group = -1;</div><div class='ctx'> </div><div class='del'>-		group = prandom_u32();</div><div class='del'>-		parent_group = (unsigned)group % ngroups;</div><div class='add'>+		parent_group = get_random_u32_below(ngroups);</div><div class='ctx'> 		for (i = 0; i &lt; ngroups; i++) {</div><div class='ctx'> 			group = (parent_group + i) % ngroups;</div><div class='ctx'> 			desc = ext2_get_group_desc (sb, group, NULL);</div><div class='hunk'>@@ -297,10 +290,8 @@ static int find_group_orlov(struct super_block *sb, struct inode *parent)</div><div class='ctx'> 				continue;</div><div class='ctx'> 			best_group = group;</div><div class='ctx'> 			best_ndir = le16_to_cpu(desc-&gt;bg_used_dirs_count);</div><div class='del'>-			best_desc = desc;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (best_group &gt;= 0) {</div><div class='del'>-			desc = best_desc;</div><div class='ctx'> 			group = best_group;</div><div class='ctx'> 			goto found;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -551,11 +542,11 @@ got:</div><div class='ctx'> 		inode-&gt;i_uid = current_fsuid();</div><div class='ctx'> 		inode-&gt;i_gid = dir-&gt;i_gid;</div><div class='ctx'> 	} else</div><div class='del'>-		inode_init_owner(&amp;init_user_ns, inode, dir, mode);</div><div class='add'>+		inode_init_owner(&amp;nop_mnt_idmap, inode, dir, mode);</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_ino = ino;</div><div class='ctx'> 	inode-&gt;i_blocks = 0;</div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_atime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	simple_inode_init_ts(inode);</div><div class='ctx'> 	memset(ei-&gt;i_data, 0, sizeof(ei-&gt;i_data));</div><div class='ctx'> 	ei-&gt;i_flags =</div><div class='ctx'> 		ext2_mask_flags(mode, EXT2_I(dir)-&gt;i_flags &amp; EXT2_FL_INHERITED);</div><div class='head'>diff --git a/fs/ext2/inode.c b/fs/ext2/inode.c<br/>index 333fa62661d5..dbfe9098a124 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext2/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext2/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext2/inode.c</a></div><div class='hunk'>@@ -56,7 +56,7 @@ static inline int ext2_inode_is_fast_symlink(struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> static void ext2_truncate_blocks(struct inode *inode, loff_t offset);</div><div class='ctx'> </div><div class='del'>-static void ext2_write_failed(struct address_space *mapping, loff_t to)</div><div class='add'>+void ext2_write_failed(struct address_space *mapping, loff_t to)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='ctx'> </div><div class='hunk'>@@ -385,12 +385,16 @@ ext2_blks_to_allocate(Indirect * branch, int k, unsigned long blks,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- *	ext2_alloc_blocks: multiple allocate blocks needed for a branch</div><div class='del'>- *	@indirect_blks: the number of blocks need to allocate for indirect</div><div class='del'>- *			blocks</div><div class='del'>- *	@blks: the number of blocks need to allocate for direct blocks</div><div class='del'>- *	@new_blocks: on return it will store the new block numbers for</div><div class='del'>- *	the indirect blocks(if needed) and the first direct block,</div><div class='add'>+ * ext2_alloc_blocks: Allocate multiple blocks needed for a branch.</div><div class='add'>+ * @inode: Owner.</div><div class='add'>+ * @goal: Preferred place for allocation.</div><div class='add'>+ * @indirect_blks: The number of blocks needed to allocate for indirect blocks.</div><div class='add'>+ * @blks: The number of blocks need to allocate for direct blocks.</div><div class='add'>+ * @new_blocks: On return it will store the new block numbers for</div><div class='add'>+ *	the indirect blocks(if needed) and the first direct block.</div><div class='add'>+ * @err: Error pointer.</div><div class='add'>+ *</div><div class='add'>+ * Return: Number of blocks allocated.</div><div class='ctx'>  */</div><div class='ctx'> static int ext2_alloc_blocks(struct inode *inode,</div><div class='ctx'> 			ext2_fsblk_t goal, int indirect_blks, int blks,</div><div class='hunk'>@@ -415,7 +419,7 @@ static int ext2_alloc_blocks(struct inode *inode,</div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		count = target;</div><div class='ctx'> 		/* allocating blocks for indirect blocks and direct blocks */</div><div class='del'>-		current_block = ext2_new_blocks(inode,goal,&amp;count,err);</div><div class='add'>+		current_block = ext2_new_blocks(inode, goal, &amp;count, err, 0);</div><div class='ctx'> 		if (*err)</div><div class='ctx'> 			goto failed_out;</div><div class='ctx'> </div><div class='hunk'>@@ -595,7 +599,7 @@ static void ext2_splice_branch(struct inode *inode,</div><div class='ctx'> 	if (where-&gt;bh)</div><div class='ctx'> 		mark_buffer_dirty_inode(where-&gt;bh, inode);</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -750,7 +754,7 @@ static int ext2_get_blocks(struct inode *inode,</div><div class='ctx'> 		 */</div><div class='ctx'> 		err = sb_issue_zeroout(inode-&gt;i_sb,</div><div class='ctx'> 				le32_to_cpu(chain[depth-1].key), count,</div><div class='del'>-				GFP_NOFS);</div><div class='add'>+				GFP_KERNEL);</div><div class='ctx'> 		if (err) {</div><div class='ctx'> 			mutex_unlock(&amp;ei-&gt;truncate_mutex);</div><div class='ctx'> 			goto cleanup;</div><div class='hunk'>@@ -809,24 +813,52 @@ static int ext2_iomap_begin(struct inode *inode, loff_t offset, loff_t length,</div><div class='ctx'> 	bool new = false, boundary = false;</div><div class='ctx'> 	u32 bno;</div><div class='ctx'> 	int ret;</div><div class='add'>+	bool create = flags &amp; IOMAP_WRITE;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * For writes that could fill holes inside i_size on a</div><div class='add'>+	 * DIO_SKIP_HOLES filesystem we forbid block creations: only</div><div class='add'>+	 * overwrites are permitted.</div><div class='add'>+	 */</div><div class='add'>+	if ((flags &amp; IOMAP_DIRECT) &amp;&amp;</div><div class='add'>+	    (first_block &lt;&lt; blkbits) &lt; i_size_read(inode))</div><div class='add'>+		create = 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Writes that span EOF might trigger an IO size update on completion,</div><div class='add'>+	 * so consider them to be dirty for the purposes of O_DSYNC even if</div><div class='add'>+	 * there is no other metadata changes pending or have been made here.</div><div class='add'>+	 */</div><div class='add'>+	if ((flags &amp; IOMAP_WRITE) &amp;&amp; offset + length &gt; i_size_read(inode))</div><div class='add'>+		iomap-&gt;flags |= IOMAP_F_DIRTY;</div><div class='ctx'> </div><div class='ctx'> 	ret = ext2_get_blocks(inode, first_block, max_blocks,</div><div class='del'>-			&amp;bno, &amp;new, &amp;boundary, flags &amp; IOMAP_WRITE);</div><div class='add'>+			&amp;bno, &amp;new, &amp;boundary, create);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='ctx'> 	iomap-&gt;flags = 0;</div><div class='del'>-	iomap-&gt;bdev = inode-&gt;i_sb-&gt;s_bdev;</div><div class='ctx'> 	iomap-&gt;offset = (u64)first_block &lt;&lt; blkbits;</div><div class='del'>-	iomap-&gt;dax_dev = sbi-&gt;s_daxdev;</div><div class='add'>+	if (flags &amp; IOMAP_DAX)</div><div class='add'>+		iomap-&gt;dax_dev = sbi-&gt;s_daxdev;</div><div class='add'>+	else</div><div class='add'>+		iomap-&gt;bdev = inode-&gt;i_sb-&gt;s_bdev;</div><div class='ctx'> </div><div class='ctx'> 	if (ret == 0) {</div><div class='add'>+		/*</div><div class='add'>+		 * Switch to buffered-io for writing to holes in a non-extent</div><div class='add'>+		 * based filesystem to avoid stale data exposure problem.</div><div class='add'>+		 */</div><div class='add'>+		if (!create &amp;&amp; (flags &amp; IOMAP_WRITE) &amp;&amp; (flags &amp; IOMAP_DIRECT))</div><div class='add'>+			return -ENOTBLK;</div><div class='ctx'> 		iomap-&gt;type = IOMAP_HOLE;</div><div class='ctx'> 		iomap-&gt;addr = IOMAP_NULL_ADDR;</div><div class='ctx'> 		iomap-&gt;length = 1 &lt;&lt; blkbits;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		iomap-&gt;type = IOMAP_MAPPED;</div><div class='ctx'> 		iomap-&gt;addr = (u64)bno &lt;&lt; blkbits;</div><div class='add'>+		if (flags &amp; IOMAP_DAX)</div><div class='add'>+			iomap-&gt;addr += sbi-&gt;s_dax_part_off;</div><div class='ctx'> 		iomap-&gt;length = (u64)ret &lt;&lt; blkbits;</div><div class='ctx'> 		iomap-&gt;flags |= IOMAP_F_MERGED;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -840,6 +872,13 @@ static int</div><div class='ctx'> ext2_iomap_end(struct inode *inode, loff_t offset, loff_t length,</div><div class='ctx'> 		ssize_t written, unsigned flags, struct iomap *iomap)</div><div class='ctx'> {</div><div class='add'>+	/*</div><div class='add'>+	 * Switch to buffered-io in case of any error.</div><div class='add'>+	 * Blocks allocated can be used by the buffered-io path.</div><div class='add'>+	 */</div><div class='add'>+	if ((flags &amp; IOMAP_DIRECT) &amp;&amp; (flags &amp; IOMAP_WRITE) &amp;&amp; written == 0)</div><div class='add'>+		return -ENOTBLK;</div><div class='add'>+</div><div class='ctx'> 	if (iomap-&gt;type == IOMAP_MAPPED &amp;&amp;</div><div class='ctx'> 	    written &lt; length &amp;&amp;</div><div class='ctx'> 	    (flags &amp; IOMAP_WRITE))</div><div class='hunk'>@@ -856,23 +895,28 @@ int ext2_fiemap(struct inode *inode, struct fiemap_extent_info *fieinfo,</div><div class='ctx'> 		u64 start, u64 len)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='add'>+	loff_t i_size;</div><div class='ctx'> </div><div class='ctx'> 	inode_lock(inode);</div><div class='del'>-	len = min_t(u64, len, i_size_read(inode));</div><div class='add'>+	i_size = i_size_read(inode);</div><div class='add'>+	/*</div><div class='add'>+	 * iomap_fiemap() returns EINVAL for 0 length. Make sure we don't trim</div><div class='add'>+	 * length to 0 but still trim the range as much as possible since</div><div class='add'>+	 * ext2_get_blocks() iterates unmapped space block by block which is</div><div class='add'>+	 * slow.</div><div class='add'>+	 */</div><div class='add'>+	if (i_size == 0)</div><div class='add'>+		i_size = 1;</div><div class='add'>+	len = min_t(u64, len, i_size);</div><div class='ctx'> 	ret = iomap_fiemap(inode, fieinfo, start, len, &amp;ext2_iomap_ops);</div><div class='ctx'> 	inode_unlock(inode);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext2_writepage(struct page *page, struct writeback_control *wbc)</div><div class='del'>-{</div><div class='del'>-	return block_write_full_page(page, ext2_get_block, wbc);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int ext2_readpage(struct file *file, struct page *page)</div><div class='add'>+static int ext2_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	return mpage_readpage(page, ext2_get_block);</div><div class='add'>+	return mpage_read_folio(folio, ext2_get_block);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void ext2_readahead(struct readahead_control *rac)</div><div class='hunk'>@@ -881,72 +925,35 @@ static void ext2_readahead(struct readahead_control *rac)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-ext2_write_begin(struct file *file, struct address_space *mapping,</div><div class='del'>-		loff_t pos, unsigned len, unsigned flags,</div><div class='del'>-		struct page **pagep, void **fsdata)</div><div class='add'>+ext2_write_begin(const struct kiocb *iocb, struct address_space *mapping,</div><div class='add'>+		loff_t pos, unsigned len, struct folio **foliop, void **fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = block_write_begin(mapping, pos, len, flags, pagep,</div><div class='del'>-				ext2_get_block);</div><div class='add'>+	ret = block_write_begin(mapping, pos, len, foliop, ext2_get_block);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		ext2_write_failed(mapping, pos + len);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext2_write_end(struct file *file, struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned copied,</div><div class='del'>-			struct page *page, void *fsdata)</div><div class='add'>+static int ext2_write_end(const struct kiocb *iocb,</div><div class='add'>+			  struct address_space *mapping,</div><div class='add'>+			  loff_t pos, unsigned len, unsigned copied,</div><div class='add'>+			  struct folio *folio, void *fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = generic_write_end(file, mapping, pos, len, copied, page, fsdata);</div><div class='add'>+	ret = generic_write_end(iocb, mapping, pos, len, copied, folio, fsdata);</div><div class='ctx'> 	if (ret &lt; len)</div><div class='ctx'> 		ext2_write_failed(mapping, pos + len);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int</div><div class='del'>-ext2_nobh_write_begin(struct file *file, struct address_space *mapping,</div><div class='del'>-		loff_t pos, unsigned len, unsigned flags,</div><div class='del'>-		struct page **pagep, void **fsdata)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ret = nobh_write_begin(mapping, pos, len, flags, pagep, fsdata,</div><div class='del'>-			       ext2_get_block);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		ext2_write_failed(mapping, pos + len);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int ext2_nobh_writepage(struct page *page,</div><div class='del'>-			struct writeback_control *wbc)</div><div class='del'>-{</div><div class='del'>-	return nobh_writepage(page, ext2_get_block, wbc);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static sector_t ext2_bmap(struct address_space *mapping, sector_t block)</div><div class='ctx'> {</div><div class='ctx'> 	return generic_block_bmap(mapping,block,ext2_get_block);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static ssize_t</div><div class='del'>-ext2_direct_IO(struct kiocb *iocb, struct iov_iter *iter)</div><div class='del'>-{</div><div class='del'>-	struct file *file = iocb-&gt;ki_filp;</div><div class='del'>-	struct address_space *mapping = file-&gt;f_mapping;</div><div class='del'>-	struct inode *inode = mapping-&gt;host;</div><div class='del'>-	size_t count = iov_iter_count(iter);</div><div class='del'>-	loff_t offset = iocb-&gt;ki_pos;</div><div class='del'>-	ssize_t ret;</div><div class='del'>-</div><div class='del'>-	ret = blockdev_direct_IO(iocb, inode, iter, ext2_get_block);</div><div class='del'>-	if (ret &lt; 0 &amp;&amp; iov_iter_rw(iter) == WRITE)</div><div class='del'>-		ext2_write_failed(mapping, offset + count);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int</div><div class='ctx'> ext2_writepages(struct address_space *mapping, struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='hunk'>@@ -962,39 +969,22 @@ ext2_dax_writepages(struct address_space *mapping, struct writeback_control *wbc</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations ext2_aops = {</div><div class='del'>-	.set_page_dirty		= __set_page_dirty_buffers,</div><div class='del'>-	.readpage		= ext2_readpage,</div><div class='add'>+	.dirty_folio		= block_dirty_folio,</div><div class='add'>+	.invalidate_folio	= block_invalidate_folio,</div><div class='add'>+	.read_folio		= ext2_read_folio,</div><div class='ctx'> 	.readahead		= ext2_readahead,</div><div class='del'>-	.writepage		= ext2_writepage,</div><div class='ctx'> 	.write_begin		= ext2_write_begin,</div><div class='ctx'> 	.write_end		= ext2_write_end,</div><div class='ctx'> 	.bmap			= ext2_bmap,</div><div class='del'>-	.direct_IO		= ext2_direct_IO,</div><div class='ctx'> 	.writepages		= ext2_writepages,</div><div class='del'>-	.migratepage		= buffer_migrate_page,</div><div class='add'>+	.migrate_folio		= buffer_migrate_folio,</div><div class='ctx'> 	.is_partially_uptodate	= block_is_partially_uptodate,</div><div class='del'>-	.error_remove_page	= generic_error_remove_page,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-const struct address_space_operations ext2_nobh_aops = {</div><div class='del'>-	.set_page_dirty		= __set_page_dirty_buffers,</div><div class='del'>-	.readpage		= ext2_readpage,</div><div class='del'>-	.readahead		= ext2_readahead,</div><div class='del'>-	.writepage		= ext2_nobh_writepage,</div><div class='del'>-	.write_begin		= ext2_nobh_write_begin,</div><div class='del'>-	.write_end		= nobh_write_end,</div><div class='del'>-	.bmap			= ext2_bmap,</div><div class='del'>-	.direct_IO		= ext2_direct_IO,</div><div class='del'>-	.writepages		= ext2_writepages,</div><div class='del'>-	.migratepage		= buffer_migrate_page,</div><div class='del'>-	.error_remove_page	= generic_error_remove_page,</div><div class='add'>+	.error_remove_folio	= generic_error_remove_folio,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct address_space_operations ext2_dax_aops = {</div><div class='ctx'> 	.writepages		= ext2_dax_writepages,</div><div class='del'>-	.direct_IO		= noop_direct_IO,</div><div class='del'>-	.set_page_dirty		= __set_page_dirty_no_writeback,</div><div class='del'>-	.invalidatepage		= noop_invalidatepage,</div><div class='add'>+	.dirty_folio		= noop_dirty_folio,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1105,8 +1095,8 @@ no_top:</div><div class='ctx'>  */</div><div class='ctx'> static inline void ext2_free_data(struct inode *inode, __le32 *p, __le32 *q)</div><div class='ctx'> {</div><div class='del'>-	unsigned long block_to_free = 0, count = 0;</div><div class='del'>-	unsigned long nr;</div><div class='add'>+	ext2_fsblk_t block_to_free = 0, count = 0;</div><div class='add'>+	ext2_fsblk_t nr;</div><div class='ctx'> </div><div class='ctx'> 	for ( ; p &lt; q ; p++) {</div><div class='ctx'> 		nr = le32_to_cpu(*p);</div><div class='hunk'>@@ -1146,7 +1136,7 @@ static inline void ext2_free_data(struct inode *inode, __le32 *p, __le32 *q)</div><div class='ctx'> static void ext2_free_branches(struct inode *inode, __le32 *p, __le32 *q, int depth)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head * bh;</div><div class='del'>-	unsigned long nr;</div><div class='add'>+	ext2_fsblk_t nr;</div><div class='ctx'> </div><div class='ctx'> 	if (depth--) {</div><div class='ctx'> 		int addr_per_block = EXT2_ADDR_PER_BLOCK(inode-&gt;i_sb);</div><div class='hunk'>@@ -1296,13 +1286,9 @@ static int ext2_setsize(struct inode *inode, loff_t newsize)</div><div class='ctx'> </div><div class='ctx'> 	inode_dio_wait(inode);</div><div class='ctx'> </div><div class='del'>-	if (IS_DAX(inode)) {</div><div class='del'>-		error = iomap_zero_range(inode, newsize,</div><div class='del'>-					 PAGE_ALIGN(newsize) - newsize, NULL,</div><div class='del'>-					 &amp;ext2_iomap_ops);</div><div class='del'>-	} else if (test_opt(inode-&gt;i_sb, NOBH))</div><div class='del'>-		error = nobh_truncate_page(inode-&gt;i_mapping,</div><div class='del'>-				newsize, ext2_get_block);</div><div class='add'>+	if (IS_DAX(inode))</div><div class='add'>+		error = dax_truncate_page(inode, newsize, NULL,</div><div class='add'>+					  &amp;ext2_iomap_ops);</div><div class='ctx'> 	else</div><div class='ctx'> 		error = block_truncate_page(inode-&gt;i_mapping,</div><div class='ctx'> 				newsize, ext2_get_block);</div><div class='hunk'>@@ -1314,7 +1300,7 @@ static int ext2_setsize(struct inode *inode, loff_t newsize)</div><div class='ctx'> 	__ext2_truncate_blocks(inode, newsize);</div><div class='ctx'> 	filemap_invalidate_unlock(inode-&gt;i_mapping);</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_mtime_to_ts(inode, inode_set_ctime_current(inode));</div><div class='ctx'> 	if (inode_needs_sync(inode)) {</div><div class='ctx'> 		sync_mapping_buffers(inode-&gt;i_mapping);</div><div class='ctx'> 		sync_inode_metadata(inode, 1);</div><div class='hunk'>@@ -1394,8 +1380,6 @@ void ext2_set_file_ops(struct inode *inode)</div><div class='ctx'> 	inode-&gt;i_fop = &amp;ext2_file_operations;</div><div class='ctx'> 	if (IS_DAX(inode))</div><div class='ctx'> 		inode-&gt;i_mapping-&gt;a_ops = &amp;ext2_dax_aops;</div><div class='del'>-	else if (test_opt(inode-&gt;i_sb, NOBH))</div><div class='del'>-		inode-&gt;i_mapping-&gt;a_ops = &amp;ext2_nobh_aops;</div><div class='ctx'> 	else</div><div class='ctx'> 		inode-&gt;i_mapping-&gt;a_ops = &amp;ext2_aops;</div><div class='ctx'> }</div><div class='hunk'>@@ -1414,7 +1398,7 @@ struct inode *ext2_iget (struct super_block *sb, unsigned long ino)</div><div class='ctx'> 	inode = iget_locked(sb, ino);</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='del'>-	if (!(inode-&gt;i_state &amp; I_NEW))</div><div class='add'>+	if (!(inode_state_read_once(inode) &amp; I_NEW))</div><div class='ctx'> 		return inode;</div><div class='ctx'> </div><div class='ctx'> 	ei = EXT2_I(inode);</div><div class='hunk'>@@ -1437,10 +1421,9 @@ struct inode *ext2_iget (struct super_block *sb, unsigned long ino)</div><div class='ctx'> 	i_gid_write(inode, i_gid);</div><div class='ctx'> 	set_nlink(inode, le16_to_cpu(raw_inode-&gt;i_links_count));</div><div class='ctx'> 	inode-&gt;i_size = le32_to_cpu(raw_inode-&gt;i_size);</div><div class='del'>-	inode-&gt;i_atime.tv_sec = (signed)le32_to_cpu(raw_inode-&gt;i_atime);</div><div class='del'>-	inode-&gt;i_ctime.tv_sec = (signed)le32_to_cpu(raw_inode-&gt;i_ctime);</div><div class='del'>-	inode-&gt;i_mtime.tv_sec = (signed)le32_to_cpu(raw_inode-&gt;i_mtime);</div><div class='del'>-	inode-&gt;i_atime.tv_nsec = inode-&gt;i_mtime.tv_nsec = inode-&gt;i_ctime.tv_nsec = 0;</div><div class='add'>+	inode_set_atime(inode, (signed)le32_to_cpu(raw_inode-&gt;i_atime), 0);</div><div class='add'>+	inode_set_ctime(inode, (signed)le32_to_cpu(raw_inode-&gt;i_ctime), 0);</div><div class='add'>+	inode_set_mtime(inode, (signed)le32_to_cpu(raw_inode-&gt;i_mtime), 0);</div><div class='ctx'> 	ei-&gt;i_dtime = le32_to_cpu(raw_inode-&gt;i_dtime);</div><div class='ctx'> 	/* We now have enough fields to check if the inode was active or not.</div><div class='ctx'> 	 * This is needed because nfsd might try to access dead inodes</div><div class='hunk'>@@ -1495,10 +1478,7 @@ struct inode *ext2_iget (struct super_block *sb, unsigned long ino)</div><div class='ctx'> 	} else if (S_ISDIR(inode-&gt;i_mode)) {</div><div class='ctx'> 		inode-&gt;i_op = &amp;ext2_dir_inode_operations;</div><div class='ctx'> 		inode-&gt;i_fop = &amp;ext2_dir_operations;</div><div class='del'>-		if (test_opt(inode-&gt;i_sb, NOBH))</div><div class='del'>-			inode-&gt;i_mapping-&gt;a_ops = &amp;ext2_nobh_aops;</div><div class='del'>-		else</div><div class='del'>-			inode-&gt;i_mapping-&gt;a_ops = &amp;ext2_aops;</div><div class='add'>+		inode-&gt;i_mapping-&gt;a_ops = &amp;ext2_aops;</div><div class='ctx'> 	} else if (S_ISLNK(inode-&gt;i_mode)) {</div><div class='ctx'> 		if (ext2_inode_is_fast_symlink(inode)) {</div><div class='ctx'> 			inode-&gt;i_link = (char *)ei-&gt;i_data;</div><div class='hunk'>@@ -1508,10 +1488,7 @@ struct inode *ext2_iget (struct super_block *sb, unsigned long ino)</div><div class='ctx'> 		} else {</div><div class='ctx'> 			inode-&gt;i_op = &amp;ext2_symlink_inode_operations;</div><div class='ctx'> 			inode_nohighmem(inode);</div><div class='del'>-			if (test_opt(inode-&gt;i_sb, NOBH))</div><div class='del'>-				inode-&gt;i_mapping-&gt;a_ops = &amp;ext2_nobh_aops;</div><div class='del'>-			else</div><div class='del'>-				inode-&gt;i_mapping-&gt;a_ops = &amp;ext2_aops;</div><div class='add'>+			inode-&gt;i_mapping-&gt;a_ops = &amp;ext2_aops;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='ctx'> 		inode-&gt;i_op = &amp;ext2_special_inode_operations;</div><div class='hunk'>@@ -1547,7 +1524,7 @@ static int __ext2_write_inode(struct inode *inode, int do_sync)</div><div class='ctx'> 	if (IS_ERR(raw_inode))</div><div class='ctx'>  		return -EIO;</div><div class='ctx'> </div><div class='del'>-	/* For fields not not tracking in the in-memory inode,</div><div class='add'>+	/* For fields not tracking in the in-memory inode,</div><div class='ctx'> 	 * initialise them to zero for new inodes. */</div><div class='ctx'> 	if (ei-&gt;i_state &amp; EXT2_STATE_NEW)</div><div class='ctx'> 		memset(raw_inode, 0, EXT2_SB(sb)-&gt;s_inode_size);</div><div class='hunk'>@@ -1575,9 +1552,9 @@ static int __ext2_write_inode(struct inode *inode, int do_sync)</div><div class='ctx'> 	}</div><div class='ctx'> 	raw_inode-&gt;i_links_count = cpu_to_le16(inode-&gt;i_nlink);</div><div class='ctx'> 	raw_inode-&gt;i_size = cpu_to_le32(inode-&gt;i_size);</div><div class='del'>-	raw_inode-&gt;i_atime = cpu_to_le32(inode-&gt;i_atime.tv_sec);</div><div class='del'>-	raw_inode-&gt;i_ctime = cpu_to_le32(inode-&gt;i_ctime.tv_sec);</div><div class='del'>-	raw_inode-&gt;i_mtime = cpu_to_le32(inode-&gt;i_mtime.tv_sec);</div><div class='add'>+	raw_inode-&gt;i_atime = cpu_to_le32(inode_get_atime_sec(inode));</div><div class='add'>+	raw_inode-&gt;i_ctime = cpu_to_le32(inode_get_ctime_sec(inode));</div><div class='add'>+	raw_inode-&gt;i_mtime = cpu_to_le32(inode_get_mtime_sec(inode));</div><div class='ctx'> </div><div class='ctx'> 	raw_inode-&gt;i_blocks = cpu_to_le32(inode-&gt;i_blocks);</div><div class='ctx'> 	raw_inode-&gt;i_dtime = cpu_to_le32(ei-&gt;i_dtime);</div><div class='hunk'>@@ -1641,7 +1618,7 @@ int ext2_write_inode(struct inode *inode, struct writeback_control *wbc)</div><div class='ctx'> 	return __ext2_write_inode(inode, wbc-&gt;sync_mode == WB_SYNC_ALL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int ext2_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='add'>+int ext2_getattr(struct mnt_idmap *idmap, const struct path *path,</div><div class='ctx'> 		 struct kstat *stat, u32 request_mask, unsigned int query_flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(path-&gt;dentry);</div><div class='hunk'>@@ -1663,28 +1640,28 @@ int ext2_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='ctx'> 			STATX_ATTR_IMMUTABLE |</div><div class='ctx'> 			STATX_ATTR_NODUMP);</div><div class='ctx'> </div><div class='del'>-	generic_fillattr(&amp;init_user_ns, inode, stat);</div><div class='add'>+	generic_fillattr(&amp;nop_mnt_idmap, request_mask, inode, stat);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int ext2_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='add'>+int ext2_setattr(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		 struct iattr *iattr)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	error = setattr_prepare(&amp;init_user_ns, dentry, iattr);</div><div class='add'>+	error = setattr_prepare(&amp;nop_mnt_idmap, dentry, iattr);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='del'>-	if (is_quota_modification(inode, iattr)) {</div><div class='add'>+	if (is_quota_modification(&amp;nop_mnt_idmap, inode, iattr)) {</div><div class='ctx'> 		error = dquot_initialize(inode);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			return error;</div><div class='ctx'> 	}</div><div class='del'>-	if ((iattr-&gt;ia_valid &amp; ATTR_UID &amp;&amp; !uid_eq(iattr-&gt;ia_uid, inode-&gt;i_uid)) ||</div><div class='del'>-	    (iattr-&gt;ia_valid &amp; ATTR_GID &amp;&amp; !gid_eq(iattr-&gt;ia_gid, inode-&gt;i_gid))) {</div><div class='del'>-		error = dquot_transfer(inode, iattr);</div><div class='add'>+	if (i_uid_needs_update(&amp;nop_mnt_idmap, iattr, inode) ||</div><div class='add'>+	    i_gid_needs_update(&amp;nop_mnt_idmap, iattr, inode)) {</div><div class='add'>+		error = dquot_transfer(&amp;nop_mnt_idmap, inode, iattr);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			return error;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1693,9 +1670,9 @@ int ext2_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			return error;</div><div class='ctx'> 	}</div><div class='del'>-	setattr_copy(&amp;init_user_ns, inode, iattr);</div><div class='add'>+	setattr_copy(&amp;nop_mnt_idmap, inode, iattr);</div><div class='ctx'> 	if (iattr-&gt;ia_valid &amp; ATTR_MODE)</div><div class='del'>-		error = posix_acl_chmod(&amp;init_user_ns, inode, inode-&gt;i_mode);</div><div class='add'>+		error = posix_acl_chmod(&amp;nop_mnt_idmap, dentry, inode-&gt;i_mode);</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='ctx'> </div><div class='ctx'> 	return error;</div><div class='head'>diff --git a/fs/ext2/ioctl.c b/fs/ext2/ioctl.c<br/>index e8340bf09b10..c3fea55b8efa 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext2/ioctl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/ioctl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext2/ioctl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext2/ioctl.c</a></div><div class='hunk'>@@ -18,7 +18,7 @@</div><div class='ctx'> #include &lt;linux/uaccess.h&gt;</div><div class='ctx'> #include &lt;linux/fileattr.h&gt;</div><div class='ctx'> </div><div class='del'>-int ext2_fileattr_get(struct dentry *dentry, struct fileattr *fa)</div><div class='add'>+int ext2_fileattr_get(struct dentry *dentry, struct file_kattr *fa)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext2_inode_info *ei = EXT2_I(d_inode(dentry));</div><div class='ctx'> </div><div class='hunk'>@@ -27,8 +27,8 @@ int ext2_fileattr_get(struct dentry *dentry, struct fileattr *fa)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int ext2_fileattr_set(struct user_namespace *mnt_userns,</div><div class='del'>-		      struct dentry *dentry, struct fileattr *fa)</div><div class='add'>+int ext2_fileattr_set(struct mnt_idmap *idmap,</div><div class='add'>+		      struct dentry *dentry, struct file_kattr *fa)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	struct ext2_inode_info *ei = EXT2_I(inode);</div><div class='hunk'>@@ -44,7 +44,7 @@ int ext2_fileattr_set(struct user_namespace *mnt_userns,</div><div class='ctx'> 		(fa-&gt;flags &amp; EXT2_FL_USER_MODIFIABLE);</div><div class='ctx'> </div><div class='ctx'> 	ext2_set_inode_flags(inode);</div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -66,7 +66,7 @@ long ext2_ioctl(struct file *filp, unsigned int cmd, unsigned long arg)</div><div class='ctx'> 	case EXT2_IOC_SETVERSION: {</div><div class='ctx'> 		__u32 generation;</div><div class='ctx'> </div><div class='del'>-		if (!inode_owner_or_capable(&amp;init_user_ns, inode))</div><div class='add'>+		if (!inode_owner_or_capable(&amp;nop_mnt_idmap, inode))</div><div class='ctx'> 			return -EPERM;</div><div class='ctx'> 		ret = mnt_want_write_file(filp);</div><div class='ctx'> 		if (ret)</div><div class='hunk'>@@ -77,7 +77,7 @@ long ext2_ioctl(struct file *filp, unsigned int cmd, unsigned long arg)</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		inode_lock(inode);</div><div class='del'>-		inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+		inode_set_ctime_current(inode);</div><div class='ctx'> 		inode-&gt;i_generation = generation;</div><div class='ctx'> 		inode_unlock(inode);</div><div class='ctx'> </div><div class='hunk'>@@ -99,7 +99,7 @@ setversion_out:</div><div class='ctx'> 		if (!test_opt(inode-&gt;i_sb, RESERVATION) ||!S_ISREG(inode-&gt;i_mode))</div><div class='ctx'> 			return -ENOTTY;</div><div class='ctx'> </div><div class='del'>-		if (!inode_owner_or_capable(&amp;init_user_ns, inode))</div><div class='add'>+		if (!inode_owner_or_capable(&amp;nop_mnt_idmap, inode))</div><div class='ctx'> 			return -EACCES;</div><div class='ctx'> </div><div class='ctx'> 		if (get_user(rsv_window_size, (int __user *)arg))</div><div class='head'>diff --git a/fs/ext2/namei.c b/fs/ext2/namei.c<br/>index 5f6b7560eb3f..bde617a66cec 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext2/namei.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/namei.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext2/namei.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext2/namei.c</a></div><div class='hunk'>@@ -99,7 +99,7 @@ struct dentry *ext2_get_parent(struct dentry *child)</div><div class='ctx'>  * If the create succeeds, we fill in the inode information</div><div class='ctx'>  * with d_instantiate(). </div><div class='ctx'>  */</div><div class='del'>-static int ext2_create (struct user_namespace * mnt_userns,</div><div class='add'>+static int ext2_create (struct mnt_idmap * idmap,</div><div class='ctx'> 			struct inode * dir, struct dentry * dentry,</div><div class='ctx'> 			umode_t mode, bool excl)</div><div class='ctx'> {</div><div class='hunk'>@@ -119,8 +119,8 @@ static int ext2_create (struct user_namespace * mnt_userns,</div><div class='ctx'> 	return ext2_add_nondir(dentry, inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext2_tmpfile(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-			struct dentry *dentry, umode_t mode)</div><div class='add'>+static int ext2_tmpfile(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+			struct file *file, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = ext2_new_inode(dir, mode, NULL);</div><div class='ctx'> 	if (IS_ERR(inode))</div><div class='hunk'>@@ -128,12 +128,12 @@ static int ext2_tmpfile(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> </div><div class='ctx'> 	ext2_set_file_ops(inode);</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='del'>-	d_tmpfile(dentry, inode);</div><div class='add'>+	d_tmpfile(file, inode);</div><div class='ctx'> 	unlock_new_inode(inode);</div><div class='del'>-	return 0;</div><div class='add'>+	return finish_open_simple(file, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext2_mknod (struct user_namespace * mnt_userns, struct inode * dir,</div><div class='add'>+static int ext2_mknod (struct mnt_idmap * idmap, struct inode * dir,</div><div class='ctx'> 	struct dentry *dentry, umode_t mode, dev_t rdev)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode * inode;</div><div class='hunk'>@@ -154,7 +154,7 @@ static int ext2_mknod (struct user_namespace * mnt_userns, struct inode * dir,</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext2_symlink (struct user_namespace * mnt_userns, struct inode * dir,</div><div class='add'>+static int ext2_symlink (struct mnt_idmap * idmap, struct inode * dir,</div><div class='ctx'> 	struct dentry * dentry, const char * symname)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block * sb = dir-&gt;i_sb;</div><div class='hunk'>@@ -178,10 +178,7 @@ static int ext2_symlink (struct user_namespace * mnt_userns, struct inode * dir,</div><div class='ctx'> 		/* slow symlink */</div><div class='ctx'> 		inode-&gt;i_op = &amp;ext2_symlink_inode_operations;</div><div class='ctx'> 		inode_nohighmem(inode);</div><div class='del'>-		if (test_opt(inode-&gt;i_sb, NOBH))</div><div class='del'>-			inode-&gt;i_mapping-&gt;a_ops = &amp;ext2_nobh_aops;</div><div class='del'>-		else</div><div class='del'>-			inode-&gt;i_mapping-&gt;a_ops = &amp;ext2_aops;</div><div class='add'>+		inode-&gt;i_mapping-&gt;a_ops = &amp;ext2_aops;</div><div class='ctx'> 		err = page_symlink(inode, symname, l);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto out_fail;</div><div class='hunk'>@@ -214,7 +211,7 @@ static int ext2_link (struct dentry * old_dentry, struct inode * dir,</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> 	inode_inc_link_count(inode);</div><div class='ctx'> 	ihold(inode);</div><div class='ctx'> </div><div class='hunk'>@@ -228,15 +225,16 @@ static int ext2_link (struct dentry * old_dentry, struct inode * dir,</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext2_mkdir(struct user_namespace * mnt_userns,</div><div class='del'>-	struct inode * dir, struct dentry * dentry, umode_t mode)</div><div class='add'>+static struct dentry *ext2_mkdir(struct mnt_idmap * idmap,</div><div class='add'>+				 struct inode * dir, struct dentry * dentry,</div><div class='add'>+				 umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode * inode;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	err = dquot_initialize(dir);</div><div class='ctx'> 	if (err)</div><div class='del'>-		return err;</div><div class='add'>+		return ERR_PTR(err);</div><div class='ctx'> </div><div class='ctx'> 	inode_inc_link_count(dir);</div><div class='ctx'> </div><div class='hunk'>@@ -247,10 +245,7 @@ static int ext2_mkdir(struct user_namespace * mnt_userns,</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_op = &amp;ext2_dir_inode_operations;</div><div class='ctx'> 	inode-&gt;i_fop = &amp;ext2_dir_operations;</div><div class='del'>-	if (test_opt(inode-&gt;i_sb, NOBH))</div><div class='del'>-		inode-&gt;i_mapping-&gt;a_ops = &amp;ext2_nobh_aops;</div><div class='del'>-	else</div><div class='del'>-		inode-&gt;i_mapping-&gt;a_ops = &amp;ext2_aops;</div><div class='add'>+	inode-&gt;i_mapping-&gt;a_ops = &amp;ext2_aops;</div><div class='ctx'> </div><div class='ctx'> 	inode_inc_link_count(inode);</div><div class='ctx'> </div><div class='hunk'>@@ -264,7 +259,7 @@ static int ext2_mkdir(struct user_namespace * mnt_userns,</div><div class='ctx'> </div><div class='ctx'> 	d_instantiate_new(dentry, inode);</div><div class='ctx'> out:</div><div class='del'>-	return err;</div><div class='add'>+	return ERR_PTR(err);</div><div class='ctx'> </div><div class='ctx'> out_fail:</div><div class='ctx'> 	inode_dec_link_count(inode);</div><div class='hunk'>@@ -275,30 +270,29 @@ out_dir:</div><div class='ctx'> 	goto out;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext2_unlink(struct inode * dir, struct dentry *dentry)</div><div class='add'>+static int ext2_unlink(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	struct inode * inode = d_inode(dentry);</div><div class='del'>-	struct ext2_dir_entry_2 * de;</div><div class='del'>-	struct page * page;</div><div class='del'>-	void *page_addr;</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='add'>+	struct ext2_dir_entry_2 *de;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	err = dquot_initialize(dir);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	de = ext2_find_entry(dir, &amp;dentry-&gt;d_name, &amp;page, &amp;page_addr);</div><div class='add'>+	de = ext2_find_entry(dir, &amp;dentry-&gt;d_name, &amp;folio);</div><div class='ctx'> 	if (IS_ERR(de)) {</div><div class='ctx'> 		err = PTR_ERR(de);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = ext2_delete_entry (de, page, page_addr);</div><div class='del'>-	ext2_put_page(page, page_addr);</div><div class='add'>+	err = ext2_delete_entry(de, folio);</div><div class='add'>+	folio_release_kmap(folio, de);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_ctime = dir-&gt;i_ctime;</div><div class='add'>+	inode_set_ctime_to_ts(inode, inode_get_ctime(dir));</div><div class='ctx'> 	inode_dec_link_count(inode);</div><div class='ctx'> 	err = 0;</div><div class='ctx'> out:</div><div class='hunk'>@@ -321,19 +315,18 @@ static int ext2_rmdir (struct inode * dir, struct dentry *dentry)</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext2_rename (struct user_namespace * mnt_userns,</div><div class='add'>+static int ext2_rename (struct mnt_idmap * idmap,</div><div class='ctx'> 			struct inode * old_dir, struct dentry * old_dentry,</div><div class='ctx'> 			struct inode * new_dir, struct dentry * new_dentry,</div><div class='ctx'> 			unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode * old_inode = d_inode(old_dentry);</div><div class='ctx'> 	struct inode * new_inode = d_inode(new_dentry);</div><div class='del'>-	struct page * dir_page = NULL;</div><div class='del'>-	void *dir_page_addr;</div><div class='add'>+	struct folio *dir_folio = NULL;</div><div class='ctx'> 	struct ext2_dir_entry_2 * dir_de = NULL;</div><div class='del'>-	struct page * old_page;</div><div class='del'>-	void *old_page_addr;</div><div class='add'>+	struct folio * old_folio;</div><div class='ctx'> 	struct ext2_dir_entry_2 * old_de;</div><div class='add'>+	bool old_is_dir = S_ISDIR(old_inode-&gt;i_mode);</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; ~RENAME_NOREPLACE)</div><div class='hunk'>@@ -341,52 +334,50 @@ static int ext2_rename (struct user_namespace * mnt_userns,</div><div class='ctx'> </div><div class='ctx'> 	err = dquot_initialize(old_dir);</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto out;</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='ctx'> 	err = dquot_initialize(new_dir);</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto out;</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='del'>-	old_de = ext2_find_entry(old_dir, &amp;old_dentry-&gt;d_name, &amp;old_page,</div><div class='del'>-				 &amp;old_page_addr);</div><div class='del'>-	if (IS_ERR(old_de)) {</div><div class='del'>-		err = PTR_ERR(old_de);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	old_de = ext2_find_entry(old_dir, &amp;old_dentry-&gt;d_name, &amp;old_folio);</div><div class='add'>+	if (IS_ERR(old_de))</div><div class='add'>+		return PTR_ERR(old_de);</div><div class='ctx'> </div><div class='del'>-	if (S_ISDIR(old_inode-&gt;i_mode)) {</div><div class='add'>+	if (old_is_dir &amp;&amp; old_dir != new_dir) {</div><div class='ctx'> 		err = -EIO;</div><div class='del'>-		dir_de = ext2_dotdot(old_inode, &amp;dir_page, &amp;dir_page_addr);</div><div class='add'>+		dir_de = ext2_dotdot(old_inode, &amp;dir_folio);</div><div class='ctx'> 		if (!dir_de)</div><div class='ctx'> 			goto out_old;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (new_inode) {</div><div class='del'>-		void *page_addr;</div><div class='del'>-		struct page *new_page;</div><div class='add'>+		struct folio *new_folio;</div><div class='ctx'> 		struct ext2_dir_entry_2 *new_de;</div><div class='ctx'> </div><div class='ctx'> 		err = -ENOTEMPTY;</div><div class='del'>-		if (dir_de &amp;&amp; !ext2_empty_dir (new_inode))</div><div class='add'>+		if (old_is_dir &amp;&amp; !ext2_empty_dir(new_inode))</div><div class='ctx'> 			goto out_dir;</div><div class='ctx'> </div><div class='ctx'> 		new_de = ext2_find_entry(new_dir, &amp;new_dentry-&gt;d_name,</div><div class='del'>-					 &amp;new_page, &amp;page_addr);</div><div class='add'>+					 &amp;new_folio);</div><div class='ctx'> 		if (IS_ERR(new_de)) {</div><div class='ctx'> 			err = PTR_ERR(new_de);</div><div class='ctx'> 			goto out_dir;</div><div class='ctx'> 		}</div><div class='del'>-		ext2_set_link(new_dir, new_de, new_page, page_addr, old_inode, 1);</div><div class='del'>-		ext2_put_page(new_page, page_addr);</div><div class='del'>-		new_inode-&gt;i_ctime = current_time(new_inode);</div><div class='del'>-		if (dir_de)</div><div class='add'>+		err = ext2_set_link(new_dir, new_de, new_folio, old_inode, true);</div><div class='add'>+		folio_release_kmap(new_folio, new_de);</div><div class='add'>+		if (err)</div><div class='add'>+			goto out_dir;</div><div class='add'>+		inode_set_ctime_current(new_inode);</div><div class='add'>+		if (old_is_dir)</div><div class='ctx'> 			drop_nlink(new_inode);</div><div class='ctx'> 		inode_dec_link_count(new_inode);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		err = ext2_add_link(new_dentry, old_inode);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto out_dir;</div><div class='del'>-		if (dir_de)</div><div class='add'>+		if (old_is_dir)</div><div class='ctx'> 			inode_inc_link_count(new_dir);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -394,29 +385,22 @@ static int ext2_rename (struct user_namespace * mnt_userns,</div><div class='ctx'> 	 * Like most other Unix systems, set the ctime for inodes on a</div><div class='ctx'>  	 * rename.</div><div class='ctx'> 	 */</div><div class='del'>-	old_inode-&gt;i_ctime = current_time(old_inode);</div><div class='add'>+	inode_set_ctime_current(old_inode);</div><div class='ctx'> 	mark_inode_dirty(old_inode);</div><div class='ctx'> </div><div class='del'>-	ext2_delete_entry(old_de, old_page, old_page_addr);</div><div class='del'>-</div><div class='del'>-	if (dir_de) {</div><div class='add'>+	err = ext2_delete_entry(old_de, old_folio);</div><div class='add'>+	if (!err &amp;&amp; old_is_dir) {</div><div class='ctx'> 		if (old_dir != new_dir)</div><div class='del'>-			ext2_set_link(old_inode, dir_de, dir_page,</div><div class='del'>-				      dir_page_addr, new_dir, 0);</div><div class='add'>+			err = ext2_set_link(old_inode, dir_de, dir_folio,</div><div class='add'>+					    new_dir, false);</div><div class='ctx'> </div><div class='del'>-		ext2_put_page(dir_page, dir_page_addr);</div><div class='ctx'> 		inode_dec_link_count(old_dir);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	ext2_put_page(old_page, old_page_addr);</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='ctx'> out_dir:</div><div class='ctx'> 	if (dir_de)</div><div class='del'>-		ext2_put_page(dir_page, dir_page_addr);</div><div class='add'>+		folio_release_kmap(dir_folio, dir_de);</div><div class='ctx'> out_old:</div><div class='del'>-	ext2_put_page(old_page, old_page_addr);</div><div class='del'>-out:</div><div class='add'>+	folio_release_kmap(old_folio, old_de);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -433,7 +417,7 @@ const struct inode_operations ext2_dir_inode_operations = {</div><div class='ctx'> 	.listxattr	= ext2_listxattr,</div><div class='ctx'> 	.getattr	= ext2_getattr,</div><div class='ctx'> 	.setattr	= ext2_setattr,</div><div class='del'>-	.get_acl	= ext2_get_acl,</div><div class='add'>+	.get_inode_acl	= ext2_get_acl,</div><div class='ctx'> 	.set_acl	= ext2_set_acl,</div><div class='ctx'> 	.tmpfile	= ext2_tmpfile,</div><div class='ctx'> 	.fileattr_get	= ext2_fileattr_get,</div><div class='hunk'>@@ -444,6 +428,6 @@ const struct inode_operations ext2_special_inode_operations = {</div><div class='ctx'> 	.listxattr	= ext2_listxattr,</div><div class='ctx'> 	.getattr	= ext2_getattr,</div><div class='ctx'> 	.setattr	= ext2_setattr,</div><div class='del'>-	.get_acl	= ext2_get_acl,</div><div class='add'>+	.get_inode_acl	= ext2_get_acl,</div><div class='ctx'> 	.set_acl	= ext2_set_acl,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/ext2/super.c b/fs/ext2/super.c<br/>index d8d580b609ba..121e634c792a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext2/super.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/super.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext2/super.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext2/super.c</a></div><div class='hunk'>@@ -23,7 +23,8 @@</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/init.h&gt;</div><div class='ctx'> #include &lt;linux/blkdev.h&gt;</div><div class='del'>-#include &lt;linux/parser.h&gt;</div><div class='add'>+#include &lt;linux/fs_context.h&gt;</div><div class='add'>+#include &lt;linux/fs_parser.h&gt;</div><div class='ctx'> #include &lt;linux/random.h&gt;</div><div class='ctx'> #include &lt;linux/buffer_head.h&gt;</div><div class='ctx'> #include &lt;linux/exportfs.h&gt;</div><div class='hunk'>@@ -40,7 +41,6 @@</div><div class='ctx'> #include "acl.h"</div><div class='ctx'> </div><div class='ctx'> static void ext2_write_super(struct super_block *sb);</div><div class='del'>-static int ext2_remount (struct super_block * sb, int * flags, char * data);</div><div class='ctx'> static int ext2_statfs (struct dentry * dentry, struct kstatfs * buf);</div><div class='ctx'> static int ext2_sync_fs(struct super_block *sb, int wait);</div><div class='ctx'> static int ext2_freeze(struct super_block *sb);</div><div class='hunk'>@@ -81,6 +81,33 @@ void ext2_error(struct super_block *sb, const char *function,</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void ext2_msg_fc(struct fs_context *fc, const char *prefix,</div><div class='add'>+			const char *fmt, ...)</div><div class='add'>+{</div><div class='add'>+	struct va_format vaf;</div><div class='add'>+	va_list args;</div><div class='add'>+	const char *s_id;</div><div class='add'>+</div><div class='add'>+	if (fc-&gt;purpose == FS_CONTEXT_FOR_RECONFIGURE) {</div><div class='add'>+		s_id = fc-&gt;root-&gt;d_sb-&gt;s_id;</div><div class='add'>+	} else {</div><div class='add'>+		/* get last path component of source */</div><div class='add'>+		s_id = strrchr(fc-&gt;source, '/');</div><div class='add'>+		if (s_id)</div><div class='add'>+			s_id++;</div><div class='add'>+		else</div><div class='add'>+			s_id = fc-&gt;source;</div><div class='add'>+	}</div><div class='add'>+	va_start(args, fmt);</div><div class='add'>+</div><div class='add'>+	vaf.fmt = fmt;</div><div class='add'>+	vaf.va = &amp;args;</div><div class='add'>+</div><div class='add'>+	printk("%sEXT2-fs (%s): %pV\n", prefix, s_id, &amp;vaf);</div><div class='add'>+</div><div class='add'>+	va_end(args);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> void ext2_msg(struct super_block *sb, const char *prefix,</div><div class='ctx'> 		const char *fmt, ...)</div><div class='ctx'> {</div><div class='hunk'>@@ -163,7 +190,7 @@ static void ext2_put_super (struct super_block * sb)</div><div class='ctx'> 	db_count = sbi-&gt;s_gdb_count;</div><div class='ctx'> 	for (i = 0; i &lt; db_count; i++)</div><div class='ctx'> 		brelse(sbi-&gt;s_group_desc[i]);</div><div class='del'>-	kfree(sbi-&gt;s_group_desc);</div><div class='add'>+	kvfree(sbi-&gt;s_group_desc);</div><div class='ctx'> 	kfree(sbi-&gt;s_debts);</div><div class='ctx'> 	percpu_counter_destroy(&amp;sbi-&gt;s_freeblocks_counter);</div><div class='ctx'> 	percpu_counter_destroy(&amp;sbi-&gt;s_freeinodes_counter);</div><div class='hunk'>@@ -171,7 +198,7 @@ static void ext2_put_super (struct super_block * sb)</div><div class='ctx'> 	brelse (sbi-&gt;s_sbh);</div><div class='ctx'> 	sb-&gt;s_fs_info = NULL;</div><div class='ctx'> 	kfree(sbi-&gt;s_blockgroup_lock);</div><div class='del'>-	fs_put_dax(sbi-&gt;s_daxdev);</div><div class='add'>+	fs_put_dax(sbi-&gt;s_daxdev, NULL);</div><div class='ctx'> 	kfree(sbi);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -180,7 +207,7 @@ static struct kmem_cache * ext2_inode_cachep;</div><div class='ctx'> static struct inode *ext2_alloc_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext2_inode_info *ei;</div><div class='del'>-	ei = kmem_cache_alloc(ext2_inode_cachep, GFP_KERNEL);</div><div class='add'>+	ei = alloc_inode_sb(sb, ext2_inode_cachep, GFP_KERNEL);</div><div class='ctx'> 	if (!ei)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	ei-&gt;i_block_alloc_info = NULL;</div><div class='hunk'>@@ -213,8 +240,7 @@ static int __init init_inodecache(void)</div><div class='ctx'> {</div><div class='ctx'> 	ext2_inode_cachep = kmem_cache_create_usercopy("ext2_inode_cache",</div><div class='ctx'> 				sizeof(struct ext2_inode_info), 0,</div><div class='del'>-				(SLAB_RECLAIM_ACCOUNT|SLAB_MEM_SPREAD|</div><div class='del'>-					SLAB_ACCOUNT),</div><div class='add'>+				SLAB_RECLAIM_ACCOUNT | SLAB_ACCOUNT,</div><div class='ctx'> 				offsetof(struct ext2_inode_info, i_data),</div><div class='ctx'> 				sizeof_field(struct ext2_inode_info, i_data),</div><div class='ctx'> 				init_once);</div><div class='hunk'>@@ -296,9 +322,6 @@ static int ext2_show_options(struct seq_file *seq, struct dentry *root)</div><div class='ctx'> 		seq_puts(seq, ",noacl");</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-	if (test_opt(sb, NOBH))</div><div class='del'>-		seq_puts(seq, ",nobh");</div><div class='del'>-</div><div class='ctx'> 	if (test_opt(sb, USRQUOTA))</div><div class='ctx'> 		seq_puts(seq, ",usrquota");</div><div class='ctx'> </div><div class='hunk'>@@ -323,7 +346,7 @@ static ssize_t ext2_quota_read(struct super_block *sb, int type, char *data, siz</div><div class='ctx'> static ssize_t ext2_quota_write(struct super_block *sb, int type, const char *data, size_t len, loff_t off);</div><div class='ctx'> static int ext2_quota_on(struct super_block *sb, int type, int format_id,</div><div class='ctx'> 			 const struct path *path);</div><div class='del'>-static struct dquot **ext2_get_dquots(struct inode *inode)</div><div class='add'>+static struct dquot __rcu **ext2_get_dquots(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	return EXT2_I(inode)-&gt;i_dquot;</div><div class='ctx'> }</div><div class='hunk'>@@ -350,7 +373,6 @@ static const struct super_operations ext2_sops = {</div><div class='ctx'> 	.freeze_fs	= ext2_freeze,</div><div class='ctx'> 	.unfreeze_fs	= ext2_unfreeze,</div><div class='ctx'> 	.statfs		= ext2_statfs,</div><div class='del'>-	.remount_fs	= ext2_remount,</div><div class='ctx'> 	.show_options	= ext2_show_options,</div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='ctx'> 	.quota_read	= ext2_quota_read,</div><div class='hunk'>@@ -400,234 +422,224 @@ static struct dentry *ext2_fh_to_parent(struct super_block *sb, struct fid *fid,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct export_operations ext2_export_ops = {</div><div class='add'>+	.encode_fh = generic_encode_ino32_fh,</div><div class='ctx'> 	.fh_to_dentry = ext2_fh_to_dentry,</div><div class='ctx'> 	.fh_to_parent = ext2_fh_to_parent,</div><div class='ctx'> 	.get_parent = ext2_get_parent,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static unsigned long get_sb_block(void **data)</div><div class='del'>-{</div><div class='del'>-	unsigned long 	sb_block;</div><div class='del'>-	char 		*options = (char *) *data;</div><div class='del'>-</div><div class='del'>-	if (!options || strncmp(options, "sb=", 3) != 0)</div><div class='del'>-		return 1;	/* Default location */</div><div class='del'>-	options += 3;</div><div class='del'>-	sb_block = simple_strtoul(options, &amp;options, 0);</div><div class='del'>-	if (*options &amp;&amp; *options != ',') {</div><div class='del'>-		printk("EXT2-fs: Invalid sb specification: %s\n",</div><div class='del'>-		       (char *) *data);</div><div class='del'>-		return 1;</div><div class='del'>-	}</div><div class='del'>-	if (*options == ',')</div><div class='del'>-		options++;</div><div class='del'>-	*data = (void *) options;</div><div class='del'>-	return sb_block;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> enum {</div><div class='del'>-	Opt_bsd_df, Opt_minix_df, Opt_grpid, Opt_nogrpid,</div><div class='del'>-	Opt_resgid, Opt_resuid, Opt_sb, Opt_err_cont, Opt_err_panic,</div><div class='del'>-	Opt_err_ro, Opt_nouid32, Opt_debug,</div><div class='del'>-	Opt_oldalloc, Opt_orlov, Opt_nobh, Opt_user_xattr, Opt_nouser_xattr,</div><div class='del'>-	Opt_acl, Opt_noacl, Opt_xip, Opt_dax, Opt_ignore, Opt_err, Opt_quota,</div><div class='del'>-	Opt_usrquota, Opt_grpquota, Opt_reservation, Opt_noreservation</div><div class='add'>+	Opt_bsd_df, Opt_minix_df, Opt_grpid, Opt_nogrpid, Opt_resgid, Opt_resuid,</div><div class='add'>+	Opt_sb, Opt_errors, Opt_nouid32, Opt_debug, Opt_oldalloc, Opt_orlov,</div><div class='add'>+	Opt_nobh, Opt_user_xattr, Opt_acl, Opt_xip, Opt_dax, Opt_ignore,</div><div class='add'>+	Opt_quota, Opt_usrquota, Opt_grpquota, Opt_reservation,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct constant_table ext2_param_errors[] = {</div><div class='add'>+	{"continue",	EXT2_MOUNT_ERRORS_CONT},</div><div class='add'>+	{"panic",	EXT2_MOUNT_ERRORS_PANIC},</div><div class='add'>+	{"remount-ro",	EXT2_MOUNT_ERRORS_RO},</div><div class='add'>+	{}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static const match_table_t tokens = {</div><div class='del'>-	{Opt_bsd_df, "bsddf"},</div><div class='del'>-	{Opt_minix_df, "minixdf"},</div><div class='del'>-	{Opt_grpid, "grpid"},</div><div class='del'>-	{Opt_grpid, "bsdgroups"},</div><div class='del'>-	{Opt_nogrpid, "nogrpid"},</div><div class='del'>-	{Opt_nogrpid, "sysvgroups"},</div><div class='del'>-	{Opt_resgid, "resgid=%u"},</div><div class='del'>-	{Opt_resuid, "resuid=%u"},</div><div class='del'>-	{Opt_sb, "sb=%u"},</div><div class='del'>-	{Opt_err_cont, "errors=continue"},</div><div class='del'>-	{Opt_err_panic, "errors=panic"},</div><div class='del'>-	{Opt_err_ro, "errors=remount-ro"},</div><div class='del'>-	{Opt_nouid32, "nouid32"},</div><div class='del'>-	{Opt_debug, "debug"},</div><div class='del'>-	{Opt_oldalloc, "oldalloc"},</div><div class='del'>-	{Opt_orlov, "orlov"},</div><div class='del'>-	{Opt_nobh, "nobh"},</div><div class='del'>-	{Opt_user_xattr, "user_xattr"},</div><div class='del'>-	{Opt_nouser_xattr, "nouser_xattr"},</div><div class='del'>-	{Opt_acl, "acl"},</div><div class='del'>-	{Opt_noacl, "noacl"},</div><div class='del'>-	{Opt_xip, "xip"},</div><div class='del'>-	{Opt_dax, "dax"},</div><div class='del'>-	{Opt_grpquota, "grpquota"},</div><div class='del'>-	{Opt_ignore, "noquota"},</div><div class='del'>-	{Opt_quota, "quota"},</div><div class='del'>-	{Opt_usrquota, "usrquota"},</div><div class='del'>-	{Opt_reservation, "reservation"},</div><div class='del'>-	{Opt_noreservation, "noreservation"},</div><div class='del'>-	{Opt_err, NULL}</div><div class='add'>+static const struct fs_parameter_spec ext2_param_spec[] = {</div><div class='add'>+	fsparam_flag	("bsddf", Opt_bsd_df),</div><div class='add'>+	fsparam_flag	("minixdf", Opt_minix_df),</div><div class='add'>+	fsparam_flag	("grpid", Opt_grpid),</div><div class='add'>+	fsparam_flag	("bsdgroups", Opt_grpid),</div><div class='add'>+	fsparam_flag	("nogrpid", Opt_nogrpid),</div><div class='add'>+	fsparam_flag	("sysvgroups", Opt_nogrpid),</div><div class='add'>+	fsparam_gid	("resgid", Opt_resgid),</div><div class='add'>+	fsparam_uid	("resuid", Opt_resuid),</div><div class='add'>+	fsparam_u32	("sb", Opt_sb),</div><div class='add'>+	fsparam_enum	("errors", Opt_errors, ext2_param_errors),</div><div class='add'>+	fsparam_flag	("nouid32", Opt_nouid32),</div><div class='add'>+	fsparam_flag	("debug", Opt_debug),</div><div class='add'>+	fsparam_flag	("oldalloc", Opt_oldalloc),</div><div class='add'>+	fsparam_flag	("orlov", Opt_orlov),</div><div class='add'>+	fsparam_flag	("nobh", Opt_nobh),</div><div class='add'>+	fsparam_flag_no	("user_xattr", Opt_user_xattr),</div><div class='add'>+	fsparam_flag_no	("acl", Opt_acl),</div><div class='add'>+	fsparam_flag	("xip", Opt_xip),</div><div class='add'>+	fsparam_flag	("dax", Opt_dax),</div><div class='add'>+	fsparam_flag	("grpquota", Opt_grpquota),</div><div class='add'>+	fsparam_flag	("noquota", Opt_ignore),</div><div class='add'>+	fsparam_flag	("quota", Opt_quota),</div><div class='add'>+	fsparam_flag	("usrquota", Opt_usrquota),</div><div class='add'>+	fsparam_flag_no	("reservation", Opt_reservation),</div><div class='add'>+	{}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int parse_options(char *options, struct super_block *sb,</div><div class='del'>-			 struct ext2_mount_options *opts)</div><div class='add'>+#define EXT2_SPEC_s_resuid                      (1 &lt;&lt; 0)</div><div class='add'>+#define EXT2_SPEC_s_resgid                      (1 &lt;&lt; 1)</div><div class='add'>+</div><div class='add'>+struct ext2_fs_context {</div><div class='add'>+	unsigned long	vals_s_flags;	/* Bits to set in s_flags */</div><div class='add'>+	unsigned long	mask_s_flags;	/* Bits changed in s_flags */</div><div class='add'>+	unsigned int	vals_s_mount_opt;</div><div class='add'>+	unsigned int	mask_s_mount_opt;</div><div class='add'>+	kuid_t		s_resuid;</div><div class='add'>+	kgid_t		s_resgid;</div><div class='add'>+	unsigned long	s_sb_block;</div><div class='add'>+	unsigned int	spec;</div><div class='add'>+</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static inline void ctx_set_mount_opt(struct ext2_fs_context *ctx,</div><div class='add'>+				  unsigned long flag)</div><div class='ctx'> {</div><div class='del'>-	char *p;</div><div class='del'>-	substring_t args[MAX_OPT_ARGS];</div><div class='del'>-	int option;</div><div class='del'>-	kuid_t uid;</div><div class='del'>-	kgid_t gid;</div><div class='del'>-</div><div class='del'>-	if (!options)</div><div class='del'>-		return 1;</div><div class='del'>-</div><div class='del'>-	while ((p = strsep (&amp;options, ",")) != NULL) {</div><div class='del'>-		int token;</div><div class='del'>-		if (!*p)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		token = match_token(p, tokens, args);</div><div class='del'>-		switch (token) {</div><div class='del'>-		case Opt_bsd_df:</div><div class='del'>-			clear_opt (opts-&gt;s_mount_opt, MINIX_DF);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_minix_df:</div><div class='del'>-			set_opt (opts-&gt;s_mount_opt, MINIX_DF);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_grpid:</div><div class='del'>-			set_opt (opts-&gt;s_mount_opt, GRPID);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_nogrpid:</div><div class='del'>-			clear_opt (opts-&gt;s_mount_opt, GRPID);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_resuid:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;option))</div><div class='del'>-				return 0;</div><div class='del'>-			uid = make_kuid(current_user_ns(), option);</div><div class='del'>-			if (!uid_valid(uid)) {</div><div class='del'>-				ext2_msg(sb, KERN_ERR, "Invalid uid value %d", option);</div><div class='del'>-				return 0;</div><div class='del'>-</div><div class='del'>-			}</div><div class='del'>-			opts-&gt;s_resuid = uid;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_resgid:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;option))</div><div class='del'>-				return 0;</div><div class='del'>-			gid = make_kgid(current_user_ns(), option);</div><div class='del'>-			if (!gid_valid(gid)) {</div><div class='del'>-				ext2_msg(sb, KERN_ERR, "Invalid gid value %d", option);</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			opts-&gt;s_resgid = gid;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_sb:</div><div class='del'>-			/* handled by get_sb_block() instead of here */</div><div class='del'>-			/* *sb_block = match_int(&amp;args[0]); */</div><div class='del'>-			break;</div><div class='del'>-		case Opt_err_panic:</div><div class='del'>-			clear_opt (opts-&gt;s_mount_opt, ERRORS_CONT);</div><div class='del'>-			clear_opt (opts-&gt;s_mount_opt, ERRORS_RO);</div><div class='del'>-			set_opt (opts-&gt;s_mount_opt, ERRORS_PANIC);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_err_ro:</div><div class='del'>-			clear_opt (opts-&gt;s_mount_opt, ERRORS_CONT);</div><div class='del'>-			clear_opt (opts-&gt;s_mount_opt, ERRORS_PANIC);</div><div class='del'>-			set_opt (opts-&gt;s_mount_opt, ERRORS_RO);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_err_cont:</div><div class='del'>-			clear_opt (opts-&gt;s_mount_opt, ERRORS_RO);</div><div class='del'>-			clear_opt (opts-&gt;s_mount_opt, ERRORS_PANIC);</div><div class='del'>-			set_opt (opts-&gt;s_mount_opt, ERRORS_CONT);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_nouid32:</div><div class='del'>-			set_opt (opts-&gt;s_mount_opt, NO_UID32);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_debug:</div><div class='del'>-			set_opt (opts-&gt;s_mount_opt, DEBUG);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_oldalloc:</div><div class='del'>-			set_opt (opts-&gt;s_mount_opt, OLDALLOC);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_orlov:</div><div class='del'>-			clear_opt (opts-&gt;s_mount_opt, OLDALLOC);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_nobh:</div><div class='del'>-			set_opt (opts-&gt;s_mount_opt, NOBH);</div><div class='del'>-			break;</div><div class='add'>+	ctx-&gt;mask_s_mount_opt |= flag;</div><div class='add'>+	ctx-&gt;vals_s_mount_opt |= flag;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void ctx_clear_mount_opt(struct ext2_fs_context *ctx,</div><div class='add'>+				    unsigned long flag)</div><div class='add'>+{</div><div class='add'>+	ctx-&gt;mask_s_mount_opt |= flag;</div><div class='add'>+	ctx-&gt;vals_s_mount_opt &amp;= ~flag;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline unsigned long</div><div class='add'>+ctx_test_mount_opt(struct ext2_fs_context *ctx, unsigned long flag)</div><div class='add'>+{</div><div class='add'>+	return (ctx-&gt;vals_s_mount_opt &amp; flag);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool</div><div class='add'>+ctx_parsed_mount_opt(struct ext2_fs_context *ctx, unsigned long flag)</div><div class='add'>+{</div><div class='add'>+	return (ctx-&gt;mask_s_mount_opt &amp; flag);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void ext2_free_fc(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	kfree(fc-&gt;fs_private);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ext2_parse_param(struct fs_context *fc, struct fs_parameter *param)</div><div class='add'>+{</div><div class='add'>+	struct ext2_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	int opt;</div><div class='add'>+	struct fs_parse_result result;</div><div class='add'>+</div><div class='add'>+	opt = fs_parse(fc, ext2_param_spec, param, &amp;result);</div><div class='add'>+	if (opt &lt; 0)</div><div class='add'>+		return opt;</div><div class='add'>+</div><div class='add'>+	switch (opt) {</div><div class='add'>+	case Opt_bsd_df:</div><div class='add'>+		ctx_clear_mount_opt(ctx, EXT2_MOUNT_MINIX_DF);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_minix_df:</div><div class='add'>+		ctx_set_mount_opt(ctx, EXT2_MOUNT_MINIX_DF);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_grpid:</div><div class='add'>+		ctx_set_mount_opt(ctx, EXT2_MOUNT_GRPID);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_nogrpid:</div><div class='add'>+		ctx_clear_mount_opt(ctx, EXT2_MOUNT_GRPID);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_resuid:</div><div class='add'>+		ctx-&gt;s_resuid = result.uid;</div><div class='add'>+		ctx-&gt;spec |= EXT2_SPEC_s_resuid;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_resgid:</div><div class='add'>+		ctx-&gt;s_resgid = result.gid;</div><div class='add'>+		ctx-&gt;spec |= EXT2_SPEC_s_resgid;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_sb:</div><div class='add'>+		/* Note that this is silently ignored on remount */</div><div class='add'>+		ctx-&gt;s_sb_block = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_errors:</div><div class='add'>+		ctx_clear_mount_opt(ctx, EXT2_MOUNT_ERRORS_MASK);</div><div class='add'>+		ctx_set_mount_opt(ctx, result.uint_32);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_nouid32:</div><div class='add'>+		ctx_set_mount_opt(ctx, EXT2_MOUNT_NO_UID32);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_debug:</div><div class='add'>+		ctx_set_mount_opt(ctx, EXT2_MOUNT_DEBUG);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_oldalloc:</div><div class='add'>+		ctx_set_mount_opt(ctx, EXT2_MOUNT_OLDALLOC);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_orlov:</div><div class='add'>+		ctx_clear_mount_opt(ctx, EXT2_MOUNT_OLDALLOC);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_nobh:</div><div class='add'>+		ext2_msg_fc(fc, KERN_INFO, "nobh option not supported\n");</div><div class='add'>+		break;</div><div class='ctx'> #ifdef CONFIG_EXT2_FS_XATTR</div><div class='del'>-		case Opt_user_xattr:</div><div class='del'>-			set_opt (opts-&gt;s_mount_opt, XATTR_USER);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_nouser_xattr:</div><div class='del'>-			clear_opt (opts-&gt;s_mount_opt, XATTR_USER);</div><div class='del'>-			break;</div><div class='add'>+	case Opt_user_xattr:</div><div class='add'>+		if (!result.negated)</div><div class='add'>+			ctx_set_mount_opt(ctx, EXT2_MOUNT_XATTR_USER);</div><div class='add'>+		else</div><div class='add'>+			ctx_clear_mount_opt(ctx, EXT2_MOUNT_XATTR_USER);</div><div class='add'>+		break;</div><div class='ctx'> #else</div><div class='del'>-		case Opt_user_xattr:</div><div class='del'>-		case Opt_nouser_xattr:</div><div class='del'>-			ext2_msg(sb, KERN_INFO, "(no)user_xattr options"</div><div class='del'>-				"not supported");</div><div class='del'>-			break;</div><div class='add'>+	case Opt_user_xattr:</div><div class='add'>+		ext2_msg_fc(fc, KERN_INFO, "(no)user_xattr options not supported");</div><div class='add'>+		break;</div><div class='ctx'> #endif</div><div class='ctx'> #ifdef CONFIG_EXT2_FS_POSIX_ACL</div><div class='del'>-		case Opt_acl:</div><div class='del'>-			set_opt(opts-&gt;s_mount_opt, POSIX_ACL);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_noacl:</div><div class='del'>-			clear_opt(opts-&gt;s_mount_opt, POSIX_ACL);</div><div class='del'>-			break;</div><div class='add'>+	case Opt_acl:</div><div class='add'>+		if (!result.negated)</div><div class='add'>+			ctx_set_mount_opt(ctx, EXT2_MOUNT_POSIX_ACL);</div><div class='add'>+		else</div><div class='add'>+			ctx_clear_mount_opt(ctx, EXT2_MOUNT_POSIX_ACL);</div><div class='add'>+		break;</div><div class='ctx'> #else</div><div class='del'>-		case Opt_acl:</div><div class='del'>-		case Opt_noacl:</div><div class='del'>-			ext2_msg(sb, KERN_INFO,</div><div class='del'>-				"(no)acl options not supported");</div><div class='del'>-			break;</div><div class='add'>+	case Opt_acl:</div><div class='add'>+		ext2_msg_fc(fc, KERN_INFO, "(no)acl options not supported");</div><div class='add'>+		break;</div><div class='ctx'> #endif</div><div class='del'>-		case Opt_xip:</div><div class='del'>-			ext2_msg(sb, KERN_INFO, "use dax instead of xip");</div><div class='del'>-			set_opt(opts-&gt;s_mount_opt, XIP);</div><div class='del'>-			fallthrough;</div><div class='del'>-		case Opt_dax:</div><div class='add'>+	case Opt_xip:</div><div class='add'>+		ext2_msg_fc(fc, KERN_INFO, "use dax instead of xip");</div><div class='add'>+		ctx_set_mount_opt(ctx, EXT2_MOUNT_XIP);</div><div class='add'>+		fallthrough;</div><div class='add'>+	case Opt_dax:</div><div class='ctx'> #ifdef CONFIG_FS_DAX</div><div class='del'>-			ext2_msg(sb, KERN_WARNING,</div><div class='del'>-		"DAX enabled. Warning: EXPERIMENTAL, use at your own risk");</div><div class='del'>-			set_opt(opts-&gt;s_mount_opt, DAX);</div><div class='add'>+		ext2_msg_fc(fc, KERN_WARNING,</div><div class='add'>+		    "DAX enabled. Warning: DAX support in ext2 driver is deprecated"</div><div class='add'>+		    " and will be removed at the end of 2025. Please use ext4 driver instead.");</div><div class='add'>+		ctx_set_mount_opt(ctx, EXT2_MOUNT_DAX);</div><div class='ctx'> #else</div><div class='del'>-			ext2_msg(sb, KERN_INFO, "dax option not supported");</div><div class='add'>+		ext2_msg_fc(fc, KERN_INFO, "dax option not supported");</div><div class='ctx'> #endif</div><div class='del'>-			break;</div><div class='add'>+		break;</div><div class='ctx'> </div><div class='ctx'> #if defined(CONFIG_QUOTA)</div><div class='del'>-		case Opt_quota:</div><div class='del'>-		case Opt_usrquota:</div><div class='del'>-			set_opt(opts-&gt;s_mount_opt, USRQUOTA);</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		case Opt_grpquota:</div><div class='del'>-			set_opt(opts-&gt;s_mount_opt, GRPQUOTA);</div><div class='del'>-			break;</div><div class='add'>+	case Opt_quota:</div><div class='add'>+	case Opt_usrquota:</div><div class='add'>+		ctx_set_mount_opt(ctx, EXT2_MOUNT_USRQUOTA);</div><div class='add'>+		break;</div><div class='add'>+</div><div class='add'>+	case Opt_grpquota:</div><div class='add'>+		ctx_set_mount_opt(ctx, EXT2_MOUNT_GRPQUOTA);</div><div class='add'>+		break;</div><div class='ctx'> #else</div><div class='del'>-		case Opt_quota:</div><div class='del'>-		case Opt_usrquota:</div><div class='del'>-		case Opt_grpquota:</div><div class='del'>-			ext2_msg(sb, KERN_INFO,</div><div class='del'>-				"quota operations not supported");</div><div class='del'>-			break;</div><div class='add'>+	case Opt_quota:</div><div class='add'>+	case Opt_usrquota:</div><div class='add'>+	case Opt_grpquota:</div><div class='add'>+		ext2_msg_fc(fc, KERN_INFO, "quota operations not supported");</div><div class='add'>+		break;</div><div class='ctx'> #endif</div><div class='del'>-</div><div class='del'>-		case Opt_reservation:</div><div class='del'>-			set_opt(opts-&gt;s_mount_opt, RESERVATION);</div><div class='del'>-			ext2_msg(sb, KERN_INFO, "reservations ON");</div><div class='del'>-			break;</div><div class='del'>-		case Opt_noreservation:</div><div class='del'>-			clear_opt(opts-&gt;s_mount_opt, RESERVATION);</div><div class='del'>-			ext2_msg(sb, KERN_INFO, "reservations OFF");</div><div class='del'>-			break;</div><div class='del'>-		case Opt_ignore:</div><div class='del'>-			break;</div><div class='del'>-		default:</div><div class='del'>-			return 0;</div><div class='add'>+	case Opt_reservation:</div><div class='add'>+		if (!result.negated) {</div><div class='add'>+			ctx_set_mount_opt(ctx, EXT2_MOUNT_RESERVATION);</div><div class='add'>+			ext2_msg_fc(fc, KERN_INFO, "reservations ON");</div><div class='add'>+		} else {</div><div class='add'>+			ctx_clear_mount_opt(ctx, EXT2_MOUNT_RESERVATION);</div><div class='add'>+			ext2_msg_fc(fc, KERN_INFO, "reservations OFF");</div><div class='ctx'> 		}</div><div class='add'>+		break;</div><div class='add'>+	case Opt_ignore:</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-	return 1;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ext2_setup_super (struct super_block * sb,</div><div class='hunk'>@@ -670,10 +682,9 @@ static int ext2_setup_super (struct super_block * sb,</div><div class='ctx'> 		es-&gt;s_max_mnt_count = cpu_to_le16(EXT2_DFL_MAX_MNT_COUNT);</div><div class='ctx'> 	le16_add_cpu(&amp;es-&gt;s_mnt_count, 1);</div><div class='ctx'> 	if (test_opt (sb, DEBUG))</div><div class='del'>-		ext2_msg(sb, KERN_INFO, "%s, %s, bs=%lu, fs=%lu, gc=%lu, "</div><div class='add'>+		ext2_msg(sb, KERN_INFO, "%s, %s, bs=%lu, gc=%lu, "</div><div class='ctx'> 			"bpg=%lu, ipg=%lu, mo=%04lx]",</div><div class='ctx'> 			EXT2FS_VERSION, EXT2FS_DATE, sb-&gt;s_blocksize,</div><div class='del'>-			sbi-&gt;s_frag_size,</div><div class='ctx'> 			sbi-&gt;s_groups_count,</div><div class='ctx'> 			EXT2_BLOCKS_PER_GROUP(sb),</div><div class='ctx'> 			EXT2_INODES_PER_GROUP(sb),</div><div class='hunk'>@@ -753,8 +764,12 @@ static loff_t ext2_max_size(int bits)</div><div class='ctx'> 	res += 1LL &lt;&lt; (bits-2);</div><div class='ctx'> 	res += 1LL &lt;&lt; (2*(bits-2));</div><div class='ctx'> 	res += 1LL &lt;&lt; (3*(bits-2));</div><div class='add'>+	/* Compute how many metadata blocks are needed */</div><div class='add'>+	meta_blocks = 1;</div><div class='add'>+	meta_blocks += 1 + ppb;</div><div class='add'>+	meta_blocks += 1 + ppb + ppb * ppb;</div><div class='ctx'> 	/* Does block tree limit file size? */</div><div class='del'>-	if (res &lt; upper_limit)</div><div class='add'>+	if (res + meta_blocks &lt;= upper_limit)</div><div class='ctx'> 		goto check_lfs;</div><div class='ctx'> </div><div class='ctx'> 	res = upper_limit;</div><div class='hunk'>@@ -800,39 +815,98 @@ static unsigned long descriptor_loc(struct super_block *sb,</div><div class='ctx'> 	return ext2_group_first_block_no(sb, bg) + ext2_bg_has_super(sb, bg);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext2_fill_super(struct super_block *sb, void *data, int silent)</div><div class='add'>+/*</div><div class='add'>+ * Set all mount options either from defaults on disk, or from parsed</div><div class='add'>+ * options. Parsed/specified options override on-disk defaults.</div><div class='add'>+ */</div><div class='add'>+static void ext2_set_options(struct fs_context *fc, struct ext2_sb_info *sbi)</div><div class='ctx'> {</div><div class='del'>-	struct dax_device *dax_dev = fs_dax_get_by_bdev(sb-&gt;s_bdev);</div><div class='add'>+	struct ext2_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct ext2_super_block *es = sbi-&gt;s_es;</div><div class='add'>+	unsigned long def_mount_opts = le32_to_cpu(es-&gt;s_default_mount_opts);</div><div class='add'>+</div><div class='add'>+	/* Copy parsed mount options to sbi */</div><div class='add'>+	sbi-&gt;s_mount_opt = ctx-&gt;vals_s_mount_opt;</div><div class='add'>+</div><div class='add'>+	/* Use in-superblock defaults only if not specified during parsing */</div><div class='add'>+	if (!ctx_parsed_mount_opt(ctx, EXT2_MOUNT_DEBUG) &amp;&amp;</div><div class='add'>+	    def_mount_opts &amp; EXT2_DEFM_DEBUG)</div><div class='add'>+		set_opt(sbi-&gt;s_mount_opt, DEBUG);</div><div class='add'>+</div><div class='add'>+	if (!ctx_parsed_mount_opt(ctx, EXT2_MOUNT_GRPID) &amp;&amp;</div><div class='add'>+	    def_mount_opts &amp; EXT2_DEFM_BSDGROUPS)</div><div class='add'>+		set_opt(sbi-&gt;s_mount_opt, GRPID);</div><div class='add'>+</div><div class='add'>+	if (!ctx_parsed_mount_opt(ctx, EXT2_MOUNT_NO_UID32) &amp;&amp;</div><div class='add'>+	    def_mount_opts &amp; EXT2_DEFM_UID16)</div><div class='add'>+		set_opt(sbi-&gt;s_mount_opt, NO_UID32);</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_EXT2_FS_XATTR</div><div class='add'>+	if (!ctx_parsed_mount_opt(ctx, EXT2_MOUNT_XATTR_USER) &amp;&amp;</div><div class='add'>+	    def_mount_opts &amp; EXT2_DEFM_XATTR_USER)</div><div class='add'>+		set_opt(sbi-&gt;s_mount_opt, XATTR_USER);</div><div class='add'>+#endif</div><div class='add'>+#ifdef CONFIG_EXT2_FS_POSIX_ACL</div><div class='add'>+	if (!ctx_parsed_mount_opt(ctx, EXT2_MOUNT_POSIX_ACL) &amp;&amp;</div><div class='add'>+	    def_mount_opts &amp; EXT2_DEFM_ACL)</div><div class='add'>+		set_opt(sbi-&gt;s_mount_opt, POSIX_ACL);</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+	if (!ctx_parsed_mount_opt(ctx, EXT2_MOUNT_ERRORS_MASK)) {</div><div class='add'>+		if (le16_to_cpu(sbi-&gt;s_es-&gt;s_errors) == EXT2_ERRORS_PANIC)</div><div class='add'>+			set_opt(sbi-&gt;s_mount_opt, ERRORS_PANIC);</div><div class='add'>+		else if (le16_to_cpu(sbi-&gt;s_es-&gt;s_errors) == EXT2_ERRORS_CONTINUE)</div><div class='add'>+			set_opt(sbi-&gt;s_mount_opt, ERRORS_CONT);</div><div class='add'>+		else</div><div class='add'>+			set_opt(sbi-&gt;s_mount_opt, ERRORS_RO);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (ctx-&gt;spec &amp; EXT2_SPEC_s_resuid)</div><div class='add'>+		sbi-&gt;s_resuid = ctx-&gt;s_resuid;</div><div class='add'>+	else</div><div class='add'>+		sbi-&gt;s_resuid = make_kuid(&amp;init_user_ns,</div><div class='add'>+					   le16_to_cpu(es-&gt;s_def_resuid));</div><div class='add'>+</div><div class='add'>+	if (ctx-&gt;spec &amp; EXT2_SPEC_s_resgid)</div><div class='add'>+		sbi-&gt;s_resgid = ctx-&gt;s_resgid;</div><div class='add'>+	else</div><div class='add'>+		sbi-&gt;s_resgid = make_kgid(&amp;init_user_ns,</div><div class='add'>+					   le16_to_cpu(es-&gt;s_def_resgid));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ext2_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct ext2_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	int silent = fc-&gt;sb_flags &amp; SB_SILENT;</div><div class='ctx'> 	struct buffer_head * bh;</div><div class='ctx'> 	struct ext2_sb_info * sbi;</div><div class='ctx'> 	struct ext2_super_block * es;</div><div class='ctx'> 	struct inode *root;</div><div class='ctx'> 	unsigned long block;</div><div class='del'>-	unsigned long sb_block = get_sb_block(&amp;data);</div><div class='add'>+	unsigned long sb_block = ctx-&gt;s_sb_block;</div><div class='ctx'> 	unsigned long logic_sb_block;</div><div class='ctx'> 	unsigned long offset = 0;</div><div class='del'>-	unsigned long def_mount_opts;</div><div class='ctx'> 	long ret = -ENOMEM;</div><div class='ctx'> 	int blocksize = BLOCK_SIZE;</div><div class='ctx'> 	int db_count;</div><div class='ctx'> 	int i, j;</div><div class='ctx'> 	__le32 features;</div><div class='ctx'> 	int err;</div><div class='del'>-	struct ext2_mount_options opts;</div><div class='ctx'> </div><div class='ctx'> 	sbi = kzalloc(sizeof(*sbi), GFP_KERNEL);</div><div class='ctx'> 	if (!sbi)</div><div class='del'>-		goto failed;</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	sbi-&gt;s_blockgroup_lock =</div><div class='ctx'> 		kzalloc(sizeof(struct blockgroup_lock), GFP_KERNEL);</div><div class='ctx'> 	if (!sbi-&gt;s_blockgroup_lock) {</div><div class='ctx'> 		kfree(sbi);</div><div class='del'>-		goto failed;</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> 	}</div><div class='ctx'> 	sb-&gt;s_fs_info = sbi;</div><div class='ctx'> 	sbi-&gt;s_sb_block = sb_block;</div><div class='del'>-	sbi-&gt;s_daxdev = dax_dev;</div><div class='add'>+	sbi-&gt;s_daxdev = fs_dax_get_by_bdev(sb-&gt;s_bdev, &amp;sbi-&gt;s_dax_part_off,</div><div class='add'>+					   NULL, NULL);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock_init(&amp;sbi-&gt;s_lock);</div><div class='ctx'> 	ret = -EINVAL;</div><div class='hunk'>@@ -876,42 +950,7 @@ static int ext2_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 	if (sb-&gt;s_magic != EXT2_SUPER_MAGIC)</div><div class='ctx'> 		goto cantfind_ext2;</div><div class='ctx'> </div><div class='del'>-	opts.s_mount_opt = 0;</div><div class='del'>-	/* Set defaults before we parse the mount options */</div><div class='del'>-	def_mount_opts = le32_to_cpu(es-&gt;s_default_mount_opts);</div><div class='del'>-	if (def_mount_opts &amp; EXT2_DEFM_DEBUG)</div><div class='del'>-		set_opt(opts.s_mount_opt, DEBUG);</div><div class='del'>-	if (def_mount_opts &amp; EXT2_DEFM_BSDGROUPS)</div><div class='del'>-		set_opt(opts.s_mount_opt, GRPID);</div><div class='del'>-	if (def_mount_opts &amp; EXT2_DEFM_UID16)</div><div class='del'>-		set_opt(opts.s_mount_opt, NO_UID32);</div><div class='del'>-#ifdef CONFIG_EXT2_FS_XATTR</div><div class='del'>-	if (def_mount_opts &amp; EXT2_DEFM_XATTR_USER)</div><div class='del'>-		set_opt(opts.s_mount_opt, XATTR_USER);</div><div class='del'>-#endif</div><div class='del'>-#ifdef CONFIG_EXT2_FS_POSIX_ACL</div><div class='del'>-	if (def_mount_opts &amp; EXT2_DEFM_ACL)</div><div class='del'>-		set_opt(opts.s_mount_opt, POSIX_ACL);</div><div class='del'>-#endif</div><div class='del'>-	</div><div class='del'>-	if (le16_to_cpu(sbi-&gt;s_es-&gt;s_errors) == EXT2_ERRORS_PANIC)</div><div class='del'>-		set_opt(opts.s_mount_opt, ERRORS_PANIC);</div><div class='del'>-	else if (le16_to_cpu(sbi-&gt;s_es-&gt;s_errors) == EXT2_ERRORS_CONTINUE)</div><div class='del'>-		set_opt(opts.s_mount_opt, ERRORS_CONT);</div><div class='del'>-	else</div><div class='del'>-		set_opt(opts.s_mount_opt, ERRORS_RO);</div><div class='del'>-</div><div class='del'>-	opts.s_resuid = make_kuid(&amp;init_user_ns, le16_to_cpu(es-&gt;s_def_resuid));</div><div class='del'>-	opts.s_resgid = make_kgid(&amp;init_user_ns, le16_to_cpu(es-&gt;s_def_resgid));</div><div class='del'>-	</div><div class='del'>-	set_opt(opts.s_mount_opt, RESERVATION);</div><div class='del'>-</div><div class='del'>-	if (!parse_options((char *) data, sb, &amp;opts))</div><div class='del'>-		goto failed_mount;</div><div class='del'>-</div><div class='del'>-	sbi-&gt;s_mount_opt = opts.s_mount_opt;</div><div class='del'>-	sbi-&gt;s_resuid = opts.s_resuid;</div><div class='del'>-	sbi-&gt;s_resgid = opts.s_resgid;</div><div class='add'>+	ext2_set_options(fc, sbi);</div><div class='ctx'> </div><div class='ctx'> 	sb-&gt;s_flags = (sb-&gt;s_flags &amp; ~SB_POSIXACL) |</div><div class='ctx'> 		(test_opt(sb, POSIX_ACL) ? SB_POSIXACL : 0);</div><div class='hunk'>@@ -943,14 +982,23 @@ static int ext2_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 		goto failed_mount;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (le32_to_cpu(es-&gt;s_log_block_size) &gt;</div><div class='add'>+	    (EXT2_MAX_BLOCK_LOG_SIZE - BLOCK_SIZE_BITS)) {</div><div class='add'>+		ext2_msg(sb, KERN_ERR,</div><div class='add'>+			 "Invalid log block size: %u",</div><div class='add'>+			 le32_to_cpu(es-&gt;s_log_block_size));</div><div class='add'>+		goto failed_mount;</div><div class='add'>+	}</div><div class='ctx'> 	blocksize = BLOCK_SIZE &lt;&lt; le32_to_cpu(sbi-&gt;s_es-&gt;s_log_block_size);</div><div class='ctx'> </div><div class='ctx'> 	if (test_opt(sb, DAX)) {</div><div class='del'>-		if (!dax_supported(dax_dev, sb-&gt;s_bdev, blocksize, 0,</div><div class='del'>-				bdev_nr_sectors(sb-&gt;s_bdev))) {</div><div class='add'>+		if (!sbi-&gt;s_daxdev) {</div><div class='ctx'> 			ext2_msg(sb, KERN_ERR,</div><div class='ctx'> 				"DAX unsupported by block device. Turning off DAX.");</div><div class='ctx'> 			clear_opt(sbi-&gt;s_mount_opt, DAX);</div><div class='add'>+		} else if (blocksize != PAGE_SIZE) {</div><div class='add'>+			ext2_msg(sb, KERN_ERR, "unsupported blocksize for DAX\n");</div><div class='add'>+			clear_opt(sbi-&gt;s_mount_opt, DAX);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1001,14 +1049,7 @@ static int ext2_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	sbi-&gt;s_frag_size = EXT2_MIN_FRAG_SIZE &lt;&lt;</div><div class='del'>-				   le32_to_cpu(es-&gt;s_log_frag_size);</div><div class='del'>-	if (sbi-&gt;s_frag_size == 0)</div><div class='del'>-		goto cantfind_ext2;</div><div class='del'>-	sbi-&gt;s_frags_per_block = sb-&gt;s_blocksize / sbi-&gt;s_frag_size;</div><div class='del'>-</div><div class='ctx'> 	sbi-&gt;s_blocks_per_group = le32_to_cpu(es-&gt;s_blocks_per_group);</div><div class='del'>-	sbi-&gt;s_frags_per_group = le32_to_cpu(es-&gt;s_frags_per_group);</div><div class='ctx'> 	sbi-&gt;s_inodes_per_group = le32_to_cpu(es-&gt;s_inodes_per_group);</div><div class='ctx'> </div><div class='ctx'> 	sbi-&gt;s_inodes_per_block = sb-&gt;s_blocksize / EXT2_INODE_SIZE(sb);</div><div class='hunk'>@@ -1034,11 +1075,10 @@ static int ext2_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 		goto failed_mount;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (sb-&gt;s_blocksize != sbi-&gt;s_frag_size) {</div><div class='add'>+	if (es-&gt;s_log_frag_size != es-&gt;s_log_block_size) {</div><div class='ctx'> 		ext2_msg(sb, KERN_ERR,</div><div class='del'>-			"error: fragsize %lu != blocksize %lu"</div><div class='del'>-			"(not supported yet)",</div><div class='del'>-			sbi-&gt;s_frag_size, sb-&gt;s_blocksize);</div><div class='add'>+			"error: fragsize log %u != blocksize log %u",</div><div class='add'>+			le32_to_cpu(es-&gt;s_log_frag_size), sb-&gt;s_blocksize_bits);</div><div class='ctx'> 		goto failed_mount;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1048,27 +1088,41 @@ static int ext2_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 			sbi-&gt;s_blocks_per_group);</div><div class='ctx'> 		goto failed_mount;</div><div class='ctx'> 	}</div><div class='del'>-	if (sbi-&gt;s_frags_per_group &gt; sb-&gt;s_blocksize * 8) {</div><div class='add'>+	/* At least inode table, bitmaps, and sb have to fit in one group */</div><div class='add'>+	if (sbi-&gt;s_blocks_per_group &lt;= sbi-&gt;s_itb_per_group + 3) {</div><div class='ctx'> 		ext2_msg(sb, KERN_ERR,</div><div class='del'>-			"error: #fragments per group too big: %lu",</div><div class='del'>-			sbi-&gt;s_frags_per_group);</div><div class='add'>+			"error: #blocks per group smaller than metadata size: %lu &lt;= %lu",</div><div class='add'>+			sbi-&gt;s_blocks_per_group, sbi-&gt;s_inodes_per_group + 3);</div><div class='ctx'> 		goto failed_mount;</div><div class='ctx'> 	}</div><div class='del'>-	if (sbi-&gt;s_inodes_per_group &gt; sb-&gt;s_blocksize * 8) {</div><div class='add'>+	if (sbi-&gt;s_inodes_per_group &lt; sbi-&gt;s_inodes_per_block ||</div><div class='add'>+	    sbi-&gt;s_inodes_per_group &gt; sb-&gt;s_blocksize * 8) {</div><div class='ctx'> 		ext2_msg(sb, KERN_ERR,</div><div class='del'>-			"error: #inodes per group too big: %lu",</div><div class='add'>+			"error: invalid #inodes per group: %lu",</div><div class='ctx'> 			sbi-&gt;s_inodes_per_group);</div><div class='ctx'> 		goto failed_mount;</div><div class='ctx'> 	}</div><div class='add'>+	if (sb_bdev_nr_blocks(sb) &lt; le32_to_cpu(es-&gt;s_blocks_count)) {</div><div class='add'>+		ext2_msg(sb, KERN_ERR,</div><div class='add'>+			 "bad geometry: block count %u exceeds size of device (%u blocks)",</div><div class='add'>+			 le32_to_cpu(es-&gt;s_blocks_count),</div><div class='add'>+			 (unsigned)sb_bdev_nr_blocks(sb));</div><div class='add'>+		goto failed_mount;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (EXT2_BLOCKS_PER_GROUP(sb) == 0)</div><div class='del'>-		goto cantfind_ext2;</div><div class='ctx'> 	sbi-&gt;s_groups_count = ((le32_to_cpu(es-&gt;s_blocks_count) -</div><div class='ctx'> 				le32_to_cpu(es-&gt;s_first_data_block) - 1)</div><div class='ctx'> 					/ EXT2_BLOCKS_PER_GROUP(sb)) + 1;</div><div class='add'>+	if ((u64)sbi-&gt;s_groups_count * sbi-&gt;s_inodes_per_group !=</div><div class='add'>+	    le32_to_cpu(es-&gt;s_inodes_count)) {</div><div class='add'>+		ext2_msg(sb, KERN_ERR, "error: invalid #inodes: %u vs computed %llu",</div><div class='add'>+			 le32_to_cpu(es-&gt;s_inodes_count),</div><div class='add'>+			 (u64)sbi-&gt;s_groups_count * sbi-&gt;s_inodes_per_group);</div><div class='add'>+		goto failed_mount;</div><div class='add'>+	}</div><div class='ctx'> 	db_count = (sbi-&gt;s_groups_count + EXT2_DESC_PER_BLOCK(sb) - 1) /</div><div class='ctx'> 		   EXT2_DESC_PER_BLOCK(sb);</div><div class='del'>-	sbi-&gt;s_group_desc = kmalloc_array(db_count,</div><div class='add'>+	sbi-&gt;s_group_desc = kvmalloc_array(db_count,</div><div class='ctx'> 					   sizeof(struct buffer_head *),</div><div class='ctx'> 					   GFP_KERNEL);</div><div class='ctx'> 	if (sbi-&gt;s_group_desc == NULL) {</div><div class='hunk'>@@ -1194,16 +1248,15 @@ failed_mount2:</div><div class='ctx'> 	for (i = 0; i &lt; db_count; i++)</div><div class='ctx'> 		brelse(sbi-&gt;s_group_desc[i]);</div><div class='ctx'> failed_mount_group_desc:</div><div class='del'>-	kfree(sbi-&gt;s_group_desc);</div><div class='add'>+	kvfree(sbi-&gt;s_group_desc);</div><div class='ctx'> 	kfree(sbi-&gt;s_debts);</div><div class='ctx'> failed_mount:</div><div class='ctx'> 	brelse(bh);</div><div class='ctx'> failed_sbi:</div><div class='add'>+	fs_put_dax(sbi-&gt;s_daxdev, NULL);</div><div class='ctx'> 	sb-&gt;s_fs_info = NULL;</div><div class='ctx'> 	kfree(sbi-&gt;s_blockgroup_lock);</div><div class='ctx'> 	kfree(sbi);</div><div class='del'>-failed:</div><div class='del'>-	fs_put_dax(dax_dev);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1309,23 +1362,21 @@ static void ext2_write_super(struct super_block *sb)</div><div class='ctx'> 		ext2_sync_fs(sb, 1);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext2_remount (struct super_block * sb, int * flags, char * data)</div><div class='add'>+static int ext2_reconfigure(struct fs_context *fc)</div><div class='ctx'> {</div><div class='add'>+	struct ext2_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct super_block *sb = fc-&gt;root-&gt;d_sb;</div><div class='ctx'> 	struct ext2_sb_info * sbi = EXT2_SB(sb);</div><div class='ctx'> 	struct ext2_super_block * es;</div><div class='ctx'> 	struct ext2_mount_options new_opts;</div><div class='add'>+	int flags = fc-&gt;sb_flags;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	sync_filesystem(sb);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;sbi-&gt;s_lock);</div><div class='del'>-	new_opts.s_mount_opt = sbi-&gt;s_mount_opt;</div><div class='del'>-	new_opts.s_resuid = sbi-&gt;s_resuid;</div><div class='del'>-	new_opts.s_resgid = sbi-&gt;s_resgid;</div><div class='del'>-	spin_unlock(&amp;sbi-&gt;s_lock);</div><div class='del'>-</div><div class='del'>-	if (!parse_options(data, sb, &amp;new_opts))</div><div class='del'>-		return -EINVAL;</div><div class='add'>+	new_opts.s_mount_opt = ctx-&gt;vals_s_mount_opt;</div><div class='add'>+	new_opts.s_resuid = ctx-&gt;s_resuid;</div><div class='add'>+	new_opts.s_resgid = ctx-&gt;s_resgid;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;sbi-&gt;s_lock);</div><div class='ctx'> 	es = sbi-&gt;s_es;</div><div class='hunk'>@@ -1334,9 +1385,9 @@ static int ext2_remount (struct super_block * sb, int * flags, char * data)</div><div class='ctx'> 			 "dax flag with busy inodes while remounting");</div><div class='ctx'> 		new_opts.s_mount_opt ^= EXT2_MOUNT_DAX;</div><div class='ctx'> 	}</div><div class='del'>-	if ((bool)(*flags &amp; SB_RDONLY) == sb_rdonly(sb))</div><div class='add'>+	if ((bool)(flags &amp; SB_RDONLY) == sb_rdonly(sb))</div><div class='ctx'> 		goto out_set;</div><div class='del'>-	if (*flags &amp; SB_RDONLY) {</div><div class='add'>+	if (flags &amp; SB_RDONLY) {</div><div class='ctx'> 		if (le16_to_cpu(es-&gt;s_state) &amp; EXT2_VALID_FS ||</div><div class='ctx'> 		    !(sbi-&gt;s_mount_state &amp; EXT2_VALID_FS))</div><div class='ctx'> 			goto out_set;</div><div class='hunk'>@@ -1455,10 +1506,9 @@ static int ext2_statfs (struct dentry * dentry, struct kstatfs * buf)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct dentry *ext2_mount(struct file_system_type *fs_type,</div><div class='del'>-	int flags, const char *dev_name, void *data)</div><div class='add'>+static int ext2_get_tree(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	return mount_bdev(fs_type, flags, dev_name, data, ext2_fill_super);</div><div class='add'>+	return get_tree_bdev(fc, ext2_fill_super);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='hunk'>@@ -1486,8 +1536,7 @@ static ssize_t ext2_quota_read(struct super_block *sb, int type, char *data,</div><div class='ctx'> 		len = i_size-off;</div><div class='ctx'> 	toread = len;</div><div class='ctx'> 	while (toread &gt; 0) {</div><div class='del'>-		tocopy = sb-&gt;s_blocksize - offset &lt; toread ?</div><div class='del'>-				sb-&gt;s_blocksize - offset : toread;</div><div class='add'>+		tocopy = min_t(size_t, sb-&gt;s_blocksize - offset, toread);</div><div class='ctx'> </div><div class='ctx'> 		tmp_bh.b_state = 0;</div><div class='ctx'> 		tmp_bh.b_size = sb-&gt;s_blocksize;</div><div class='hunk'>@@ -1525,8 +1574,7 @@ static ssize_t ext2_quota_write(struct super_block *sb, int type,</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> </div><div class='ctx'> 	while (towrite &gt; 0) {</div><div class='del'>-		tocopy = sb-&gt;s_blocksize - offset &lt; towrite ?</div><div class='del'>-				sb-&gt;s_blocksize - offset : towrite;</div><div class='add'>+		tocopy = min_t(size_t, sb-&gt;s_blocksize - offset, towrite);</div><div class='ctx'> </div><div class='ctx'> 		tmp_bh.b_state = 0;</div><div class='ctx'> 		tmp_bh.b_size = sb-&gt;s_blocksize;</div><div class='hunk'>@@ -1543,7 +1591,7 @@ static ssize_t ext2_quota_write(struct super_block *sb, int type,</div><div class='ctx'> 		}</div><div class='ctx'> 		lock_buffer(bh);</div><div class='ctx'> 		memcpy(bh-&gt;b_data+offset, data, tocopy);</div><div class='del'>-		flush_dcache_page(bh-&gt;b_page);</div><div class='add'>+		flush_dcache_folio(bh-&gt;b_folio);</div><div class='ctx'> 		set_buffer_uptodate(bh);</div><div class='ctx'> 		mark_buffer_dirty(bh);</div><div class='ctx'> 		unlock_buffer(bh);</div><div class='hunk'>@@ -1559,7 +1607,7 @@ out:</div><div class='ctx'> 	if (inode-&gt;i_size &lt; off+len-towrite)</div><div class='ctx'> 		i_size_write(inode, off+len-towrite);</div><div class='ctx'> 	inode_inc_iversion(inode);</div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_mtime_to_ts(inode, inode_set_ctime_current(inode));</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='ctx'> 	return len - towrite;</div><div class='ctx'> }</div><div class='hunk'>@@ -1611,12 +1659,49 @@ out:</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='add'>+static const struct fs_context_operations ext2_context_ops = {</div><div class='add'>+	.parse_param	= ext2_parse_param,</div><div class='add'>+	.get_tree	= ext2_get_tree,</div><div class='add'>+	.reconfigure	= ext2_reconfigure,</div><div class='add'>+	.free		= ext2_free_fc,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int ext2_init_fs_context(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct ext2_fs_context *ctx;</div><div class='add'>+</div><div class='add'>+	ctx = kzalloc(sizeof(*ctx), GFP_KERNEL);</div><div class='add'>+	if (!ctx)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	if (fc-&gt;purpose == FS_CONTEXT_FOR_RECONFIGURE) {</div><div class='add'>+		struct super_block *sb = fc-&gt;root-&gt;d_sb;</div><div class='add'>+		struct ext2_sb_info *sbi = EXT2_SB(sb);</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;sbi-&gt;s_lock);</div><div class='add'>+		ctx-&gt;vals_s_mount_opt = sbi-&gt;s_mount_opt;</div><div class='add'>+		ctx-&gt;vals_s_flags = sb-&gt;s_flags;</div><div class='add'>+		ctx-&gt;s_resuid = sbi-&gt;s_resuid;</div><div class='add'>+		ctx-&gt;s_resgid = sbi-&gt;s_resgid;</div><div class='add'>+		spin_unlock(&amp;sbi-&gt;s_lock);</div><div class='add'>+	} else {</div><div class='add'>+		ctx-&gt;s_sb_block = 1;</div><div class='add'>+		ctx_set_mount_opt(ctx, EXT2_MOUNT_RESERVATION);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	fc-&gt;fs_private = ctx;</div><div class='add'>+	fc-&gt;ops = &amp;ext2_context_ops;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static struct file_system_type ext2_fs_type = {</div><div class='ctx'> 	.owner		= THIS_MODULE,</div><div class='ctx'> 	.name		= "ext2",</div><div class='del'>-	.mount		= ext2_mount,</div><div class='ctx'> 	.kill_sb	= kill_block_super,</div><div class='ctx'> 	.fs_flags	= FS_REQUIRES_DEV,</div><div class='add'>+	.init_fs_context = ext2_init_fs_context,</div><div class='add'>+	.parameters	= ext2_param_spec,</div><div class='ctx'> };</div><div class='ctx'> MODULE_ALIAS_FS("ext2");</div><div class='ctx'> </div><div class='hunk'>@@ -1627,7 +1712,7 @@ static int __init init_ext2_fs(void)</div><div class='ctx'> 	err = init_inodecache();</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='del'>-        err = register_filesystem(&amp;ext2_fs_type);</div><div class='add'>+	err = register_filesystem(&amp;ext2_fs_type);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	return 0;</div><div class='head'>diff --git a/fs/ext2/trace.c b/fs/ext2/trace.c<br/>new file mode 100644<br/>index 000000000000..b01cdf6526fd<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext2/trace.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext2/trace.c</a></div><div class='hunk'>@@ -0,0 +1,6 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+#include "ext2.h"</div><div class='add'>+#include &lt;linux/uio.h&gt;</div><div class='add'>+</div><div class='add'>+#define CREATE_TRACE_POINTS</div><div class='add'>+#include "trace.h"</div><div class='head'>diff --git a/fs/ext2/trace.h b/fs/ext2/trace.h<br/>new file mode 100644<br/>index 000000000000..7d230e13576e<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext2/trace.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext2/trace.h</a></div><div class='hunk'>@@ -0,0 +1,94 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+</div><div class='add'>+#undef TRACE_SYSTEM</div><div class='add'>+#define TRACE_SYSTEM ext2</div><div class='add'>+</div><div class='add'>+#if !defined(_EXT2_TRACE_H) || defined(TRACE_HEADER_MULTI_READ)</div><div class='add'>+#define _EXT2_TRACE_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/tracepoint.h&gt;</div><div class='add'>+</div><div class='add'>+DECLARE_EVENT_CLASS(ext2_dio_class,</div><div class='add'>+	TP_PROTO(struct kiocb *iocb, struct iov_iter *iter, ssize_t ret),</div><div class='add'>+	TP_ARGS(iocb, iter, ret),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(dev_t,	dev)</div><div class='add'>+		__field(ino_t,	ino)</div><div class='add'>+		__field(loff_t, isize)</div><div class='add'>+		__field(loff_t, pos)</div><div class='add'>+		__field(size_t,	count)</div><div class='add'>+		__field(int,	ki_flags)</div><div class='add'>+		__field(bool,	aio)</div><div class='add'>+		__field(ssize_t, ret)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;dev = file_inode(iocb-&gt;ki_filp)-&gt;i_sb-&gt;s_dev;</div><div class='add'>+		__entry-&gt;ino = file_inode(iocb-&gt;ki_filp)-&gt;i_ino;</div><div class='add'>+		__entry-&gt;isize = file_inode(iocb-&gt;ki_filp)-&gt;i_size;</div><div class='add'>+		__entry-&gt;pos = iocb-&gt;ki_pos;</div><div class='add'>+		__entry-&gt;count = iov_iter_count(iter);</div><div class='add'>+		__entry-&gt;ki_flags = iocb-&gt;ki_flags;</div><div class='add'>+		__entry-&gt;aio = !is_sync_kiocb(iocb);</div><div class='add'>+		__entry-&gt;ret = ret;</div><div class='add'>+	),</div><div class='add'>+	TP_printk("dev %d:%d ino 0x%lx isize 0x%llx pos 0x%llx len %zu flags %s aio %d ret %zd",</div><div class='add'>+		  MAJOR(__entry-&gt;dev), MINOR(__entry-&gt;dev),</div><div class='add'>+		  __entry-&gt;ino,</div><div class='add'>+		  __entry-&gt;isize,</div><div class='add'>+		  __entry-&gt;pos,</div><div class='add'>+		  __entry-&gt;count,</div><div class='add'>+		  __print_flags(__entry-&gt;ki_flags, "|", TRACE_IOCB_STRINGS),</div><div class='add'>+		  __entry-&gt;aio,</div><div class='add'>+		  __entry-&gt;ret)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+#define DEFINE_DIO_RW_EVENT(name)					  \</div><div class='add'>+DEFINE_EVENT(ext2_dio_class, name,					  \</div><div class='add'>+	TP_PROTO(struct kiocb *iocb, struct iov_iter *iter, ssize_t ret), \</div><div class='add'>+	TP_ARGS(iocb, iter, ret))</div><div class='add'>+DEFINE_DIO_RW_EVENT(ext2_dio_write_begin);</div><div class='add'>+DEFINE_DIO_RW_EVENT(ext2_dio_write_end);</div><div class='add'>+DEFINE_DIO_RW_EVENT(ext2_dio_write_buff_end);</div><div class='add'>+DEFINE_DIO_RW_EVENT(ext2_dio_read_begin);</div><div class='add'>+DEFINE_DIO_RW_EVENT(ext2_dio_read_end);</div><div class='add'>+</div><div class='add'>+TRACE_EVENT(ext2_dio_write_endio,</div><div class='add'>+	TP_PROTO(struct kiocb *iocb, ssize_t size, int ret),</div><div class='add'>+	TP_ARGS(iocb, size, ret),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(dev_t,	dev)</div><div class='add'>+		__field(ino_t,	ino)</div><div class='add'>+		__field(loff_t, isize)</div><div class='add'>+		__field(loff_t, pos)</div><div class='add'>+		__field(ssize_t, size)</div><div class='add'>+		__field(int,	ki_flags)</div><div class='add'>+		__field(bool,	aio)</div><div class='add'>+		__field(int,	ret)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;dev = file_inode(iocb-&gt;ki_filp)-&gt;i_sb-&gt;s_dev;</div><div class='add'>+		__entry-&gt;ino = file_inode(iocb-&gt;ki_filp)-&gt;i_ino;</div><div class='add'>+		__entry-&gt;isize = file_inode(iocb-&gt;ki_filp)-&gt;i_size;</div><div class='add'>+		__entry-&gt;pos = iocb-&gt;ki_pos;</div><div class='add'>+		__entry-&gt;size = size;</div><div class='add'>+		__entry-&gt;ki_flags = iocb-&gt;ki_flags;</div><div class='add'>+		__entry-&gt;aio = !is_sync_kiocb(iocb);</div><div class='add'>+		__entry-&gt;ret = ret;</div><div class='add'>+	),</div><div class='add'>+	TP_printk("dev %d:%d ino 0x%lx isize 0x%llx pos 0x%llx len %zd flags %s aio %d ret %d",</div><div class='add'>+		  MAJOR(__entry-&gt;dev), MINOR(__entry-&gt;dev),</div><div class='add'>+		  __entry-&gt;ino,</div><div class='add'>+		  __entry-&gt;isize,</div><div class='add'>+		  __entry-&gt;pos,</div><div class='add'>+		  __entry-&gt;size,</div><div class='add'>+		  __print_flags(__entry-&gt;ki_flags, "|", TRACE_IOCB_STRINGS),</div><div class='add'>+		  __entry-&gt;aio,</div><div class='add'>+		  __entry-&gt;ret)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+#endif /* _EXT2_TRACE_H */</div><div class='add'>+</div><div class='add'>+#undef TRACE_INCLUDE_PATH</div><div class='add'>+#define TRACE_INCLUDE_PATH .</div><div class='add'>+#define TRACE_INCLUDE_FILE trace</div><div class='add'>+#include &lt;trace/define_trace.h&gt;</div><div class='head'>diff --git a/fs/ext2/xattr.c b/fs/ext2/xattr.c<br/>index 841fa6d9d744..c885dcc3bd0d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext2/xattr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/xattr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext2/xattr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext2/xattr.c</a></div><div class='hunk'>@@ -98,11 +98,11 @@ static struct buffer_head *ext2_xattr_cache_find(struct inode *,</div><div class='ctx'> static void ext2_xattr_rehash(struct ext2_xattr_header *,</div><div class='ctx'> 			      struct ext2_xattr_entry *);</div><div class='ctx'> </div><div class='del'>-static const struct xattr_handler *ext2_xattr_handler_map[] = {</div><div class='add'>+static const struct xattr_handler * const ext2_xattr_handler_map[] = {</div><div class='ctx'> 	[EXT2_XATTR_INDEX_USER]		     = &amp;ext2_xattr_user_handler,</div><div class='ctx'> #ifdef CONFIG_EXT2_FS_POSIX_ACL</div><div class='del'>-	[EXT2_XATTR_INDEX_POSIX_ACL_ACCESS]  = &amp;posix_acl_access_xattr_handler,</div><div class='del'>-	[EXT2_XATTR_INDEX_POSIX_ACL_DEFAULT] = &amp;posix_acl_default_xattr_handler,</div><div class='add'>+	[EXT2_XATTR_INDEX_POSIX_ACL_ACCESS]  = &amp;nop_posix_acl_access,</div><div class='add'>+	[EXT2_XATTR_INDEX_POSIX_ACL_DEFAULT] = &amp;nop_posix_acl_default,</div><div class='ctx'> #endif</div><div class='ctx'> 	[EXT2_XATTR_INDEX_TRUSTED]	     = &amp;ext2_xattr_trusted_handler,</div><div class='ctx'> #ifdef CONFIG_EXT2_FS_SECURITY</div><div class='hunk'>@@ -110,13 +110,9 @@ static const struct xattr_handler *ext2_xattr_handler_map[] = {</div><div class='ctx'> #endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-const struct xattr_handler *ext2_xattr_handlers[] = {</div><div class='add'>+const struct xattr_handler * const ext2_xattr_handlers[] = {</div><div class='ctx'> 	&amp;ext2_xattr_user_handler,</div><div class='ctx'> 	&amp;ext2_xattr_trusted_handler,</div><div class='del'>-#ifdef CONFIG_EXT2_FS_POSIX_ACL</div><div class='del'>-	&amp;posix_acl_access_xattr_handler,</div><div class='del'>-	&amp;posix_acl_default_xattr_handler,</div><div class='del'>-#endif</div><div class='ctx'> #ifdef CONFIG_EXT2_FS_SECURITY</div><div class='ctx'> 	&amp;ext2_xattr_security_handler,</div><div class='ctx'> #endif</div><div class='hunk'>@@ -125,14 +121,18 @@ const struct xattr_handler *ext2_xattr_handlers[] = {</div><div class='ctx'> </div><div class='ctx'> #define EA_BLOCK_CACHE(inode)	(EXT2_SB(inode-&gt;i_sb)-&gt;s_ea_block_cache)</div><div class='ctx'> </div><div class='del'>-static inline const struct xattr_handler *</div><div class='del'>-ext2_xattr_handler(int name_index)</div><div class='add'>+static inline const char *ext2_xattr_prefix(int name_index,</div><div class='add'>+					    struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	const struct xattr_handler *handler = NULL;</div><div class='ctx'> </div><div class='ctx'> 	if (name_index &gt; 0 &amp;&amp; name_index &lt; ARRAY_SIZE(ext2_xattr_handler_map))</div><div class='ctx'> 		handler = ext2_xattr_handler_map[name_index];</div><div class='del'>-	return handler;</div><div class='add'>+</div><div class='add'>+	if (!xattr_handler_can_list(handler, dentry))</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	return xattr_prefix(handler);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool</div><div class='hunk'>@@ -333,11 +333,10 @@ bad_block:</div><div class='ctx'> 	/* list the attribute names */</div><div class='ctx'> 	for (entry = FIRST_ENTRY(bh); !IS_LAST_ENTRY(entry);</div><div class='ctx'> 	     entry = EXT2_XATTR_NEXT(entry)) {</div><div class='del'>-		const struct xattr_handler *handler =</div><div class='del'>-			ext2_xattr_handler(entry-&gt;e_name_index);</div><div class='add'>+		const char *prefix;</div><div class='ctx'> </div><div class='del'>-		if (handler &amp;&amp; (!handler-&gt;list || handler-&gt;list(dentry))) {</div><div class='del'>-			const char *prefix = handler-&gt;prefix ?: handler-&gt;name;</div><div class='add'>+		prefix = ext2_xattr_prefix(entry-&gt;e_name_index, dentry);</div><div class='add'>+		if (prefix) {</div><div class='ctx'> 			size_t prefix_len = strlen(prefix);</div><div class='ctx'> 			size_t size = prefix_len + entry-&gt;e_name_len + 1;</div><div class='ctx'> </div><div class='hunk'>@@ -517,48 +516,48 @@ bad_block:</div><div class='ctx'> 	/* Here we know that we can set the new attribute. */</div><div class='ctx'> </div><div class='ctx'> 	if (header) {</div><div class='del'>-		/* assert(header == HDR(bh)); */</div><div class='add'>+		int offset;</div><div class='add'>+</div><div class='ctx'> 		lock_buffer(bh);</div><div class='ctx'> 		if (header-&gt;h_refcount == cpu_to_le32(1)) {</div><div class='ctx'> 			__u32 hash = le32_to_cpu(header-&gt;h_hash);</div><div class='add'>+			struct mb_cache_entry *oe;</div><div class='ctx'> </div><div class='del'>-			ea_bdebug(bh, "modifying in-place");</div><div class='add'>+			oe = mb_cache_entry_delete_or_get(EA_BLOCK_CACHE(inode),</div><div class='add'>+					hash, bh-&gt;b_blocknr);</div><div class='add'>+			if (!oe) {</div><div class='add'>+				ea_bdebug(bh, "modifying in-place");</div><div class='add'>+				goto update_block;</div><div class='add'>+			}</div><div class='ctx'> 			/*</div><div class='del'>-			 * This must happen under buffer lock for</div><div class='del'>-			 * ext2_xattr_set2() to reliably detect modified block</div><div class='add'>+			 * Someone is trying to reuse the block, leave it alone</div><div class='ctx'> 			 */</div><div class='del'>-			mb_cache_entry_delete(EA_BLOCK_CACHE(inode), hash,</div><div class='del'>-					      bh-&gt;b_blocknr);</div><div class='del'>-</div><div class='del'>-			/* keep the buffer locked while modifying it. */</div><div class='del'>-		} else {</div><div class='del'>-			int offset;</div><div class='del'>-</div><div class='del'>-			unlock_buffer(bh);</div><div class='del'>-			ea_bdebug(bh, "cloning");</div><div class='del'>-			header = kmemdup(HDR(bh), bh-&gt;b_size, GFP_KERNEL);</div><div class='del'>-			error = -ENOMEM;</div><div class='del'>-			if (header == NULL)</div><div class='del'>-				goto cleanup;</div><div class='del'>-			header-&gt;h_refcount = cpu_to_le32(1);</div><div class='del'>-</div><div class='del'>-			offset = (char *)here - bh-&gt;b_data;</div><div class='del'>-			here = ENTRY((char *)header + offset);</div><div class='del'>-			offset = (char *)last - bh-&gt;b_data;</div><div class='del'>-			last = ENTRY((char *)header + offset);</div><div class='add'>+			mb_cache_entry_put(EA_BLOCK_CACHE(inode), oe);</div><div class='ctx'> 		}</div><div class='add'>+		unlock_buffer(bh);</div><div class='add'>+		ea_bdebug(bh, "cloning");</div><div class='add'>+		header = kmemdup(HDR(bh), bh-&gt;b_size, GFP_KERNEL);</div><div class='add'>+		error = -ENOMEM;</div><div class='add'>+		if (header == NULL)</div><div class='add'>+			goto cleanup;</div><div class='add'>+		header-&gt;h_refcount = cpu_to_le32(1);</div><div class='add'>+</div><div class='add'>+		offset = (char *)here - bh-&gt;b_data;</div><div class='add'>+		here = ENTRY((char *)header + offset);</div><div class='add'>+		offset = (char *)last - bh-&gt;b_data;</div><div class='add'>+		last = ENTRY((char *)header + offset);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		/* Allocate a buffer where we construct the new block. */</div><div class='ctx'> 		header = kzalloc(sb-&gt;s_blocksize, GFP_KERNEL);</div><div class='ctx'> 		error = -ENOMEM;</div><div class='ctx'> 		if (header == NULL)</div><div class='ctx'> 			goto cleanup;</div><div class='del'>-		end = (char *)header + sb-&gt;s_blocksize;</div><div class='ctx'> 		header-&gt;h_magic = cpu_to_le32(EXT2_XATTR_MAGIC);</div><div class='ctx'> 		header-&gt;h_blocks = header-&gt;h_refcount = cpu_to_le32(1);</div><div class='ctx'> 		last = here = ENTRY(header+1);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+update_block:</div><div class='ctx'> 	/* Iff we are modifying the block in-place, bh is locked here. */</div><div class='ctx'> </div><div class='ctx'> 	if (not_found) {</div><div class='hunk'>@@ -651,6 +650,55 @@ cleanup:</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void ext2_xattr_release_block(struct inode *inode,</div><div class='add'>+				     struct buffer_head *bh)</div><div class='add'>+{</div><div class='add'>+	struct mb_cache *ea_block_cache = EA_BLOCK_CACHE(inode);</div><div class='add'>+</div><div class='add'>+retry_ref:</div><div class='add'>+	lock_buffer(bh);</div><div class='add'>+	if (HDR(bh)-&gt;h_refcount == cpu_to_le32(1)) {</div><div class='add'>+		__u32 hash = le32_to_cpu(HDR(bh)-&gt;h_hash);</div><div class='add'>+		struct mb_cache_entry *oe;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * This must happen under buffer lock to properly</div><div class='add'>+		 * serialize with ext2_xattr_set() reusing the block.</div><div class='add'>+		 */</div><div class='add'>+		oe = mb_cache_entry_delete_or_get(ea_block_cache, hash,</div><div class='add'>+						  bh-&gt;b_blocknr);</div><div class='add'>+		if (oe) {</div><div class='add'>+			/*</div><div class='add'>+			 * Someone is trying to reuse the block. Wait</div><div class='add'>+			 * and retry.</div><div class='add'>+			 */</div><div class='add'>+			unlock_buffer(bh);</div><div class='add'>+			mb_cache_entry_wait_unused(oe);</div><div class='add'>+			mb_cache_entry_put(ea_block_cache, oe);</div><div class='add'>+			goto retry_ref;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* Free the old block. */</div><div class='add'>+		ea_bdebug(bh, "freeing");</div><div class='add'>+		ext2_free_blocks(inode, bh-&gt;b_blocknr, 1);</div><div class='add'>+		/* We let our caller release bh, so we</div><div class='add'>+		 * need to duplicate the buffer before. */</div><div class='add'>+		get_bh(bh);</div><div class='add'>+		bforget(bh);</div><div class='add'>+		unlock_buffer(bh);</div><div class='add'>+	} else {</div><div class='add'>+		/* Decrement the refcount only. */</div><div class='add'>+		le32_add_cpu(&amp;HDR(bh)-&gt;h_refcount, -1);</div><div class='add'>+		dquot_free_block(inode, 1);</div><div class='add'>+		mark_buffer_dirty(bh);</div><div class='add'>+		unlock_buffer(bh);</div><div class='add'>+		ea_bdebug(bh, "refcount now=%d",</div><div class='add'>+			le32_to_cpu(HDR(bh)-&gt;h_refcount));</div><div class='add'>+		if (IS_SYNC(inode))</div><div class='add'>+			sync_dirty_buffer(bh);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Second half of ext2_xattr_set(): Update the file system.</div><div class='ctx'>  */</div><div class='hunk'>@@ -694,10 +742,13 @@ ext2_xattr_set2(struct inode *inode, struct buffer_head *old_bh,</div><div class='ctx'> 			/* We need to allocate a new block */</div><div class='ctx'> 			ext2_fsblk_t goal = ext2_group_first_block_no(sb,</div><div class='ctx'> 						EXT2_I(inode)-&gt;i_block_group);</div><div class='del'>-			int block = ext2_new_block(inode, goal, &amp;error);</div><div class='add'>+			unsigned long count = 1;</div><div class='add'>+			ext2_fsblk_t block = ext2_new_blocks(inode, goal,</div><div class='add'>+						&amp;count, &amp;error,</div><div class='add'>+						EXT2_ALLOC_NORESERVE);</div><div class='ctx'> 			if (error)</div><div class='ctx'> 				goto cleanup;</div><div class='del'>-			ea_idebug(inode, "creating block %d", block);</div><div class='add'>+			ea_idebug(inode, "creating block %lu", block);</div><div class='ctx'> </div><div class='ctx'> 			new_bh = sb_getblk(sb, block);</div><div class='ctx'> 			if (unlikely(!new_bh)) {</div><div class='hunk'>@@ -725,7 +776,7 @@ ext2_xattr_set2(struct inode *inode, struct buffer_head *old_bh,</div><div class='ctx'> </div><div class='ctx'> 	/* Update the inode. */</div><div class='ctx'> 	EXT2_I(inode)-&gt;i_file_acl = new_bh ? new_bh-&gt;b_blocknr : 0;</div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> 	if (IS_SYNC(inode)) {</div><div class='ctx'> 		error = sync_inode_metadata(inode, 1);</div><div class='ctx'> 		/* In case sync failed due to ENOSPC the inode was actually</div><div class='hunk'>@@ -747,34 +798,7 @@ ext2_xattr_set2(struct inode *inode, struct buffer_head *old_bh,</div><div class='ctx'> 		 * If there was an old block and we are no longer using it,</div><div class='ctx'> 		 * release the old block.</div><div class='ctx'> 		 */</div><div class='del'>-		lock_buffer(old_bh);</div><div class='del'>-		if (HDR(old_bh)-&gt;h_refcount == cpu_to_le32(1)) {</div><div class='del'>-			__u32 hash = le32_to_cpu(HDR(old_bh)-&gt;h_hash);</div><div class='del'>-</div><div class='del'>-			/*</div><div class='del'>-			 * This must happen under buffer lock for</div><div class='del'>-			 * ext2_xattr_set2() to reliably detect freed block</div><div class='del'>-			 */</div><div class='del'>-			mb_cache_entry_delete(ea_block_cache, hash,</div><div class='del'>-					      old_bh-&gt;b_blocknr);</div><div class='del'>-			/* Free the old block. */</div><div class='del'>-			ea_bdebug(old_bh, "freeing");</div><div class='del'>-			ext2_free_blocks(inode, old_bh-&gt;b_blocknr, 1);</div><div class='del'>-			mark_inode_dirty(inode);</div><div class='del'>-			/* We let our caller release old_bh, so we</div><div class='del'>-			 * need to duplicate the buffer before. */</div><div class='del'>-			get_bh(old_bh);</div><div class='del'>-			bforget(old_bh);</div><div class='del'>-		} else {</div><div class='del'>-			/* Decrement the refcount only. */</div><div class='del'>-			le32_add_cpu(&amp;HDR(old_bh)-&gt;h_refcount, -1);</div><div class='del'>-			dquot_free_block_nodirty(inode, 1);</div><div class='del'>-			mark_inode_dirty(inode);</div><div class='del'>-			mark_buffer_dirty(old_bh);</div><div class='del'>-			ea_bdebug(old_bh, "refcount now=%d",</div><div class='del'>-				le32_to_cpu(HDR(old_bh)-&gt;h_refcount));</div><div class='del'>-		}</div><div class='del'>-		unlock_buffer(old_bh);</div><div class='add'>+		ext2_xattr_release_block(inode, old_bh);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> cleanup:</div><div class='hunk'>@@ -828,30 +852,7 @@ ext2_xattr_delete_inode(struct inode *inode)</div><div class='ctx'> 			EXT2_I(inode)-&gt;i_file_acl);</div><div class='ctx'> 		goto cleanup;</div><div class='ctx'> 	}</div><div class='del'>-	lock_buffer(bh);</div><div class='del'>-	if (HDR(bh)-&gt;h_refcount == cpu_to_le32(1)) {</div><div class='del'>-		__u32 hash = le32_to_cpu(HDR(bh)-&gt;h_hash);</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * This must happen under buffer lock for ext2_xattr_set2() to</div><div class='del'>-		 * reliably detect freed block</div><div class='del'>-		 */</div><div class='del'>-		mb_cache_entry_delete(EA_BLOCK_CACHE(inode), hash,</div><div class='del'>-				      bh-&gt;b_blocknr);</div><div class='del'>-		ext2_free_blocks(inode, EXT2_I(inode)-&gt;i_file_acl, 1);</div><div class='del'>-		get_bh(bh);</div><div class='del'>-		bforget(bh);</div><div class='del'>-		unlock_buffer(bh);</div><div class='del'>-	} else {</div><div class='del'>-		le32_add_cpu(&amp;HDR(bh)-&gt;h_refcount, -1);</div><div class='del'>-		ea_bdebug(bh, "refcount now=%d",</div><div class='del'>-			le32_to_cpu(HDR(bh)-&gt;h_refcount));</div><div class='del'>-		unlock_buffer(bh);</div><div class='del'>-		mark_buffer_dirty(bh);</div><div class='del'>-		if (IS_SYNC(inode))</div><div class='del'>-			sync_dirty_buffer(bh);</div><div class='del'>-		dquot_free_block_nodirty(inode, 1);</div><div class='del'>-	}</div><div class='add'>+	ext2_xattr_release_block(inode, bh);</div><div class='ctx'> 	EXT2_I(inode)-&gt;i_file_acl = 0;</div><div class='ctx'> </div><div class='ctx'> cleanup:</div><div class='hunk'>@@ -873,7 +874,7 @@ ext2_xattr_cache_insert(struct mb_cache *cache, struct buffer_head *bh)</div><div class='ctx'> 	__u32 hash = le32_to_cpu(HDR(bh)-&gt;h_hash);</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	error = mb_cache_entry_create(cache, GFP_NOFS, hash, bh-&gt;b_blocknr,</div><div class='add'>+	error = mb_cache_entry_create(cache, GFP_KERNEL, hash, bh-&gt;b_blocknr,</div><div class='ctx'> 				      true);</div><div class='ctx'> 	if (error) {</div><div class='ctx'> 		if (error == -EBUSY) {</div><div class='hunk'>@@ -943,7 +944,7 @@ ext2_xattr_cache_find(struct inode *inode, struct ext2_xattr_header *header)</div><div class='ctx'> 	if (!header-&gt;h_hash)</div><div class='ctx'> 		return NULL;  /* never share */</div><div class='ctx'> 	ea_idebug(inode, "looking for cached blocks [%x]", (int)hash);</div><div class='del'>-again:</div><div class='add'>+</div><div class='ctx'> 	ce = mb_cache_entry_find_first(ea_block_cache, hash);</div><div class='ctx'> 	while (ce) {</div><div class='ctx'> 		struct buffer_head *bh;</div><div class='hunk'>@@ -955,22 +956,8 @@ again:</div><div class='ctx'> 				inode-&gt;i_ino, (unsigned long) ce-&gt;e_value);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			lock_buffer(bh);</div><div class='del'>-			/*</div><div class='del'>-			 * We have to be careful about races with freeing or</div><div class='del'>-			 * rehashing of xattr block. Once we hold buffer lock</div><div class='del'>-			 * xattr block's state is stable so we can check</div><div class='del'>-			 * whether the block got freed / rehashed or not.</div><div class='del'>-			 * Since we unhash mbcache entry under buffer lock when</div><div class='del'>-			 * freeing / rehashing xattr block, checking whether</div><div class='del'>-			 * entry is still hashed is reliable.</div><div class='del'>-			 */</div><div class='del'>-			if (hlist_bl_unhashed(&amp;ce-&gt;e_hash_list)) {</div><div class='del'>-				mb_cache_entry_put(ea_block_cache, ce);</div><div class='del'>-				unlock_buffer(bh);</div><div class='del'>-				brelse(bh);</div><div class='del'>-				goto again;</div><div class='del'>-			} else if (le32_to_cpu(HDR(bh)-&gt;h_refcount) &gt;</div><div class='del'>-				   EXT2_XATTR_REFCOUNT_MAX) {</div><div class='add'>+			if (le32_to_cpu(HDR(bh)-&gt;h_refcount) &gt;</div><div class='add'>+			    EXT2_XATTR_REFCOUNT_MAX) {</div><div class='ctx'> 				ea_idebug(inode, "block %ld refcount %d&gt;%d",</div><div class='ctx'> 					  (unsigned long) ce-&gt;e_value,</div><div class='ctx'> 					  le32_to_cpu(HDR(bh)-&gt;h_refcount),</div><div class='head'>diff --git a/fs/ext2/xattr.h b/fs/ext2/xattr.h<br/>index 7925f596e8e2..6a4966949047 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext2/xattr.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/xattr.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext2/xattr.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext2/xattr.h</a></div><div class='hunk'>@@ -72,7 +72,7 @@ extern void ext2_xattr_delete_inode(struct inode *);</div><div class='ctx'> extern struct mb_cache *ext2_xattr_create_cache(void);</div><div class='ctx'> extern void ext2_xattr_destroy_cache(struct mb_cache *cache);</div><div class='ctx'> </div><div class='del'>-extern const struct xattr_handler *ext2_xattr_handlers[];</div><div class='add'>+extern const struct xattr_handler * const ext2_xattr_handlers[];</div><div class='ctx'> </div><div class='ctx'> # else  /* CONFIG_EXT2_FS_XATTR */</div><div class='ctx'> </div><div class='head'>diff --git a/fs/ext2/xattr_security.c b/fs/ext2/xattr_security.c<br/>index ebade1f52451..db47b8ab153e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext2/xattr_security.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/xattr_security.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext2/xattr_security.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext2/xattr_security.c</a></div><div class='hunk'>@@ -19,7 +19,7 @@ ext2_xattr_security_get(const struct xattr_handler *handler,</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='ctx'> ext2_xattr_security_set(const struct xattr_handler *handler,</div><div class='del'>-			struct user_namespace *mnt_userns,</div><div class='add'>+			struct mnt_idmap *idmap,</div><div class='ctx'> 			struct dentry *unused, struct inode *inode,</div><div class='ctx'> 			const char *name, const void *value,</div><div class='ctx'> 			size_t size, int flags)</div><div class='head'>diff --git a/fs/ext2/xattr_trusted.c b/fs/ext2/xattr_trusted.c<br/>index 18a87d5dd1ab..995f931228ce 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext2/xattr_trusted.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/xattr_trusted.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext2/xattr_trusted.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext2/xattr_trusted.c</a></div><div class='hunk'>@@ -26,7 +26,7 @@ ext2_xattr_trusted_get(const struct xattr_handler *handler,</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='ctx'> ext2_xattr_trusted_set(const struct xattr_handler *handler,</div><div class='del'>-		       struct user_namespace *mnt_userns,</div><div class='add'>+		       struct mnt_idmap *idmap,</div><div class='ctx'> 		       struct dentry *unused, struct inode *inode,</div><div class='ctx'> 		       const char *name, const void *value,</div><div class='ctx'> 		       size_t size, int flags)</div><div class='head'>diff --git a/fs/ext2/xattr_user.c b/fs/ext2/xattr_user.c<br/>index 58092449f8ff..dd1507231081 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext2/xattr_user.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext2/xattr_user.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext2/xattr_user.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext2/xattr_user.c</a></div><div class='hunk'>@@ -30,7 +30,7 @@ ext2_xattr_user_get(const struct xattr_handler *handler,</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='ctx'> ext2_xattr_user_set(const struct xattr_handler *handler,</div><div class='del'>-		    struct user_namespace *mnt_userns,</div><div class='add'>+		    struct mnt_idmap *idmap,</div><div class='ctx'> 		    struct dentry *unused, struct inode *inode,</div><div class='ctx'> 		    const char *name, const void *value,</div><div class='ctx'> 		    size_t size, int flags)</div><div class='head'>diff --git a/fs/ext4/Kconfig b/fs/ext4/Kconfig<br/>index 86699c8cab28..01873c2a34ad 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/Kconfig</a></div><div class='hunk'>@@ -1,37 +1,10 @@</div><div class='ctx'> # SPDX-License-Identifier: GPL-2.0-only</div><div class='del'>-# Ext3 configs are here for backward compatibility with old configs which may</div><div class='del'>-# have EXT3_FS set but not EXT4_FS set and thus would result in non-bootable</div><div class='del'>-# kernels after the removal of ext3 driver.</div><div class='del'>-config EXT3_FS</div><div class='del'>-	tristate "The Extended 3 (ext3) filesystem"</div><div class='del'>-	select EXT4_FS</div><div class='del'>-	help</div><div class='del'>-	  This config option is here only for backward compatibility. ext3</div><div class='del'>-	  filesystem is now handled by the ext4 driver.</div><div class='del'>-</div><div class='del'>-config EXT3_FS_POSIX_ACL</div><div class='del'>-	bool "Ext3 POSIX Access Control Lists"</div><div class='del'>-	depends on EXT3_FS</div><div class='del'>-	select EXT4_FS_POSIX_ACL</div><div class='del'>-	select FS_POSIX_ACL</div><div class='del'>-	help</div><div class='del'>-	  This config option is here only for backward compatibility. ext3</div><div class='del'>-	  filesystem is now handled by the ext4 driver.</div><div class='del'>-</div><div class='del'>-config EXT3_FS_SECURITY</div><div class='del'>-	bool "Ext3 Security Labels"</div><div class='del'>-	depends on EXT3_FS</div><div class='del'>-	select EXT4_FS_SECURITY</div><div class='del'>-	help</div><div class='del'>-	  This config option is here only for backward compatibility. ext3</div><div class='del'>-	  filesystem is now handled by the ext4 driver.</div><div class='del'>-</div><div class='ctx'> config EXT4_FS</div><div class='ctx'> 	tristate "The Extended 4 (ext4) filesystem"</div><div class='add'>+	select BUFFER_HEAD</div><div class='ctx'> 	select JBD2</div><div class='ctx'> 	select CRC16</div><div class='del'>-	select CRYPTO</div><div class='del'>-	select CRYPTO_CRC32C</div><div class='add'>+	select CRC32</div><div class='ctx'> 	select FS_IOMAP</div><div class='ctx'> 	select FS_ENCRYPTION_ALGS if FS_ENCRYPTION</div><div class='ctx'> 	help</div><div class='head'>diff --git a/fs/ext4/Makefile b/fs/ext4/Makefile<br/>index 7d89142e1421..72206a292676 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/Makefile?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/Makefile</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/Makefile?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/Makefile</a></div><div class='hunk'>@@ -17,3 +17,4 @@ ext4-$(CONFIG_EXT4_FS_SECURITY)		+= xattr_security.o</div><div class='ctx'> ext4-inode-test-objs			+= inode-test.o</div><div class='ctx'> obj-$(CONFIG_EXT4_KUNIT_TESTS)		+= ext4-inode-test.o</div><div class='ctx'> ext4-$(CONFIG_FS_VERITY)		+= verity.o</div><div class='add'>+ext4-$(CONFIG_FS_ENCRYPTION)		+= crypto.o</div><div class='head'>diff --git a/fs/ext4/acl.c b/fs/ext4/acl.c<br/>index 0613dfcbfd4a..3bffe862f954 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/acl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/acl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/acl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/acl.c</a></div><div class='hunk'>@@ -139,7 +139,7 @@ fail:</div><div class='ctx'> /*</div><div class='ctx'>  * Inode operation get_posix_acl().</div><div class='ctx'>  *</div><div class='del'>- * inode-&gt;i_mutex: don't care</div><div class='add'>+ * inode-&gt;i_rwsem: don't care</div><div class='ctx'>  */</div><div class='ctx'> struct posix_acl *</div><div class='ctx'> ext4_get_acl(struct inode *inode, int type, bool rcu)</div><div class='hunk'>@@ -183,7 +183,7 @@ ext4_get_acl(struct inode *inode, int type, bool rcu)</div><div class='ctx'> /*</div><div class='ctx'>  * Set the access or default ACL of an inode.</div><div class='ctx'>  *</div><div class='del'>- * inode-&gt;i_mutex: down unless called from ext4_new_inode</div><div class='add'>+ * inode-&gt;i_rwsem: down unless called from ext4_new_inode</div><div class='ctx'>  */</div><div class='ctx'> static int</div><div class='ctx'> __ext4_set_acl(handle_t *handle, struct inode *inode, int type,</div><div class='hunk'>@@ -225,12 +225,13 @@ __ext4_set_acl(handle_t *handle, struct inode *inode, int type,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int</div><div class='del'>-ext4_set_acl(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='add'>+ext4_set_acl(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 	     struct posix_acl *acl, int type)</div><div class='ctx'> {</div><div class='ctx'> 	handle_t *handle;</div><div class='ctx'> 	int error, credits, retries = 0;</div><div class='ctx'> 	size_t acl_size = acl ? ext4_acl_size(acl-&gt;a_count) : 0;</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	umode_t mode = inode-&gt;i_mode;</div><div class='ctx'> 	int update_mode = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -246,10 +247,9 @@ retry:</div><div class='ctx'> 	handle = ext4_journal_start(inode, EXT4_HT_XATTR, credits);</div><div class='ctx'> 	if (IS_ERR(handle))</div><div class='ctx'> 		return PTR_ERR(handle);</div><div class='del'>-	ext4_fc_start_update(inode);</div><div class='ctx'> </div><div class='ctx'> 	if ((type == ACL_TYPE_ACCESS) &amp;&amp; acl) {</div><div class='del'>-		error = posix_acl_update_mode(mnt_userns, inode, &amp;mode, &amp;acl);</div><div class='add'>+		error = posix_acl_update_mode(idmap, inode, &amp;mode, &amp;acl);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			goto out_stop;</div><div class='ctx'> 		if (mode != inode-&gt;i_mode)</div><div class='hunk'>@@ -259,12 +259,11 @@ retry:</div><div class='ctx'> 	error = __ext4_set_acl(handle, inode, type, acl, 0 /* xattr_flags */);</div><div class='ctx'> 	if (!error &amp;&amp; update_mode) {</div><div class='ctx'> 		inode-&gt;i_mode = mode;</div><div class='del'>-		inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+		inode_set_ctime_current(inode);</div><div class='ctx'> 		error = ext4_mark_inode_dirty(handle, inode);</div><div class='ctx'> 	}</div><div class='ctx'> out_stop:</div><div class='ctx'> 	ext4_journal_stop(handle);</div><div class='del'>-	ext4_fc_stop_update(inode);</div><div class='ctx'> 	if (error == -ENOSPC &amp;&amp; ext4_should_retry_alloc(inode-&gt;i_sb, &amp;retries))</div><div class='ctx'> 		goto retry;</div><div class='ctx'> 	return error;</div><div class='hunk'>@@ -273,8 +272,8 @@ out_stop:</div><div class='ctx'> /*</div><div class='ctx'>  * Initialize the ACLs of a new inode. Called from ext4_new_inode.</div><div class='ctx'>  *</div><div class='del'>- * dir-&gt;i_mutex: down</div><div class='del'>- * inode-&gt;i_mutex: up (access to inode is still exclusive)</div><div class='add'>+ * dir-&gt;i_rwsem: down</div><div class='add'>+ * inode-&gt;i_rwsem: up (access to inode is still exclusive)</div><div class='ctx'>  */</div><div class='ctx'> int</div><div class='ctx'> ext4_init_acl(handle_t *handle, struct inode *inode, struct inode *dir)</div><div class='head'>diff --git a/fs/ext4/acl.h b/fs/ext4/acl.h<br/>index 3219669732bf..0c5a79c3b5d4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/acl.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/acl.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/acl.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/acl.h</a></div><div class='hunk'>@@ -56,7 +56,7 @@ static inline int ext4_acl_count(size_t size)</div><div class='ctx'> </div><div class='ctx'> /* acl.c */</div><div class='ctx'> struct posix_acl *ext4_get_acl(struct inode *inode, int type, bool rcu);</div><div class='del'>-int ext4_set_acl(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='add'>+int ext4_set_acl(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		 struct posix_acl *acl, int type);</div><div class='ctx'> extern int ext4_init_acl(handle_t *, struct inode *, struct inode *);</div><div class='ctx'> </div><div class='head'>diff --git a/fs/ext4/balloc.c b/fs/ext4/balloc.c<br/>index a0fb0c4bdc7c..8040c731b3e4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/balloc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/balloc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/balloc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/balloc.c</a></div><div class='hunk'>@@ -22,6 +22,7 @@</div><div class='ctx'> #include "mballoc.h"</div><div class='ctx'> </div><div class='ctx'> #include &lt;trace/events/ext4.h&gt;</div><div class='add'>+#include &lt;kunit/static_stub.h&gt;</div><div class='ctx'> </div><div class='ctx'> static unsigned ext4_num_base_meta_clusters(struct super_block *sb,</div><div class='ctx'> 					    ext4_group_t block_group);</div><div class='hunk'>@@ -80,32 +81,54 @@ static inline int ext4_block_in_group(struct super_block *sb,</div><div class='ctx'> 	return (actual_group == block_group) ? 1 : 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Return the number of clusters used for file system metadata; this</div><div class='add'>+/*</div><div class='add'>+ * Return the number of clusters used for file system metadata; this</div><div class='ctx'>  * represents the overhead needed by the file system.</div><div class='ctx'>  */</div><div class='ctx'> static unsigned ext4_num_overhead_clusters(struct super_block *sb,</div><div class='ctx'> 					   ext4_group_t block_group,</div><div class='ctx'> 					   struct ext4_group_desc *gdp)</div><div class='ctx'> {</div><div class='del'>-	unsigned num_clusters;</div><div class='del'>-	int block_cluster = -1, inode_cluster = -1, itbl_cluster = -1, i, c;</div><div class='add'>+	unsigned base_clusters, num_clusters;</div><div class='add'>+	int block_cluster = -1, inode_cluster;</div><div class='add'>+	int itbl_cluster_start = -1, itbl_cluster_end = -1;</div><div class='ctx'> 	ext4_fsblk_t start = ext4_group_first_block_no(sb, block_group);</div><div class='del'>-	ext4_fsblk_t itbl_blk;</div><div class='add'>+	ext4_fsblk_t end = start + EXT4_BLOCKS_PER_GROUP(sb) - 1;</div><div class='add'>+	ext4_fsblk_t itbl_blk_start, itbl_blk_end;</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> </div><div class='ctx'> 	/* This is the number of clusters used by the superblock,</div><div class='ctx'> 	 * block group descriptors, and reserved block group</div><div class='ctx'> 	 * descriptor blocks */</div><div class='del'>-	num_clusters = ext4_num_base_meta_clusters(sb, block_group);</div><div class='add'>+	base_clusters = ext4_num_base_meta_clusters(sb, block_group);</div><div class='add'>+	num_clusters = base_clusters;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * For the allocation bitmaps and inode table, we first need</div><div class='del'>-	 * to check to see if the block is in the block group.  If it</div><div class='del'>-	 * is, then check to see if the cluster is already accounted</div><div class='del'>-	 * for in the clusters used for the base metadata cluster, or</div><div class='del'>-	 * if we can increment the base metadata cluster to include</div><div class='del'>-	 * that block.  Otherwise, we will have to track the cluster</div><div class='del'>-	 * used for the allocation bitmap or inode table explicitly.</div><div class='add'>+	 * Account and record inode table clusters if any cluster</div><div class='add'>+	 * is in the block group, or inode table cluster range is</div><div class='add'>+	 * [-1, -1] and won't overlap with block/inode bitmap cluster</div><div class='add'>+	 * accounted below.</div><div class='add'>+	 */</div><div class='add'>+	itbl_blk_start = ext4_inode_table(sb, gdp);</div><div class='add'>+	itbl_blk_end = itbl_blk_start + sbi-&gt;s_itb_per_group - 1;</div><div class='add'>+	if (itbl_blk_start &lt;= end &amp;&amp; itbl_blk_end &gt;= start) {</div><div class='add'>+		itbl_blk_start = max(itbl_blk_start, start);</div><div class='add'>+		itbl_blk_end = min(itbl_blk_end, end);</div><div class='add'>+</div><div class='add'>+		itbl_cluster_start = EXT4_B2C(sbi, itbl_blk_start - start);</div><div class='add'>+		itbl_cluster_end = EXT4_B2C(sbi, itbl_blk_end - start);</div><div class='add'>+</div><div class='add'>+		num_clusters += itbl_cluster_end - itbl_cluster_start + 1;</div><div class='add'>+		/* check if border cluster is overlapped */</div><div class='add'>+		if (itbl_cluster_start == base_clusters - 1)</div><div class='add'>+			num_clusters--;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * For the allocation bitmaps, we first need to check to see</div><div class='add'>+	 * if the block is in the block group.  If it is, then check</div><div class='add'>+	 * to see if the cluster is already accounted for in the clusters</div><div class='add'>+	 * used for the base metadata cluster and inode tables cluster.</div><div class='ctx'> 	 * Normally all of these blocks are contiguous, so the special</div><div class='ctx'> 	 * case handling shouldn't be necessary except for *very*</div><div class='ctx'> 	 * unusual file system layouts.</div><div class='hunk'>@@ -113,46 +136,26 @@ static unsigned ext4_num_overhead_clusters(struct super_block *sb,</div><div class='ctx'> 	if (ext4_block_in_group(sb, ext4_block_bitmap(sb, gdp), block_group)) {</div><div class='ctx'> 		block_cluster = EXT4_B2C(sbi,</div><div class='ctx'> 					 ext4_block_bitmap(sb, gdp) - start);</div><div class='del'>-		if (block_cluster &lt; num_clusters)</div><div class='del'>-			block_cluster = -1;</div><div class='del'>-		else if (block_cluster == num_clusters) {</div><div class='add'>+		if (block_cluster &gt;= base_clusters &amp;&amp;</div><div class='add'>+		    (block_cluster &lt; itbl_cluster_start ||</div><div class='add'>+		    block_cluster &gt; itbl_cluster_end))</div><div class='ctx'> 			num_clusters++;</div><div class='del'>-			block_cluster = -1;</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (ext4_block_in_group(sb, ext4_inode_bitmap(sb, gdp), block_group)) {</div><div class='ctx'> 		inode_cluster = EXT4_B2C(sbi,</div><div class='ctx'> 					 ext4_inode_bitmap(sb, gdp) - start);</div><div class='del'>-		if (inode_cluster &lt; num_clusters)</div><div class='del'>-			inode_cluster = -1;</div><div class='del'>-		else if (inode_cluster == num_clusters) {</div><div class='del'>-			num_clusters++;</div><div class='del'>-			inode_cluster = -1;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	itbl_blk = ext4_inode_table(sb, gdp);</div><div class='del'>-	for (i = 0; i &lt; sbi-&gt;s_itb_per_group; i++) {</div><div class='del'>-		if (ext4_block_in_group(sb, itbl_blk + i, block_group)) {</div><div class='del'>-			c = EXT4_B2C(sbi, itbl_blk + i - start);</div><div class='del'>-			if ((c &lt; num_clusters) || (c == inode_cluster) ||</div><div class='del'>-			    (c == block_cluster) || (c == itbl_cluster))</div><div class='del'>-				continue;</div><div class='del'>-			if (c == num_clusters) {</div><div class='del'>-				num_clusters++;</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='add'>+		/*</div><div class='add'>+		 * Additional check if inode bitmap is in just accounted</div><div class='add'>+		 * block_cluster</div><div class='add'>+		 */</div><div class='add'>+		if (inode_cluster != block_cluster &amp;&amp;</div><div class='add'>+		    inode_cluster &gt;= base_clusters &amp;&amp;</div><div class='add'>+		    (inode_cluster &lt; itbl_cluster_start ||</div><div class='add'>+		    inode_cluster &gt; itbl_cluster_end))</div><div class='ctx'> 			num_clusters++;</div><div class='del'>-			itbl_cluster = c;</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (block_cluster != -1)</div><div class='del'>-		num_clusters++;</div><div class='del'>-	if (inode_cluster != -1)</div><div class='del'>-		num_clusters++;</div><div class='del'>-</div><div class='ctx'> 	return num_clusters;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -187,8 +190,6 @@ static int ext4_init_block_bitmap(struct super_block *sb,</div><div class='ctx'> </div><div class='ctx'> 	ASSERT(buffer_locked(bh));</div><div class='ctx'> </div><div class='del'>-	/* If checksum is bad mark all blocks used to prevent allocation</div><div class='del'>-	 * essentially implementing a per-group read-only flag. */</div><div class='ctx'> 	if (!ext4_group_desc_csum_verify(sb, block_group, gdp)) {</div><div class='ctx'> 		ext4_mark_group_bitmap_corrupted(sb, block_group,</div><div class='ctx'> 					EXT4_GROUP_INFO_BBITMAP_CORRUPT |</div><div class='hunk'>@@ -272,6 +273,9 @@ struct ext4_group_desc * ext4_get_group_desc(struct super_block *sb,</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> 	struct buffer_head *bh_p;</div><div class='ctx'> </div><div class='add'>+	KUNIT_STATIC_STUB_REDIRECT(ext4_get_group_desc,</div><div class='add'>+				   sb, block_group, bh);</div><div class='add'>+</div><div class='ctx'> 	if (block_group &gt;= ngroups) {</div><div class='ctx'> 		ext4_error(sb, "block_group &gt;= groups_count - block_group = %u,"</div><div class='ctx'> 			   " groups_count = %u", block_group, ngroups);</div><div class='hunk'>@@ -303,6 +307,36 @@ struct ext4_group_desc * ext4_get_group_desc(struct super_block *sb,</div><div class='ctx'> 	return desc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static ext4_fsblk_t ext4_valid_block_bitmap_padding(struct super_block *sb,</div><div class='add'>+						    ext4_group_t block_group,</div><div class='add'>+						    struct buffer_head *bh)</div><div class='add'>+{</div><div class='add'>+	ext4_grpblk_t next_zero_bit;</div><div class='add'>+	unsigned long bitmap_size = sb-&gt;s_blocksize * 8;</div><div class='add'>+	unsigned int offset = num_clusters_in_group(sb, block_group);</div><div class='add'>+</div><div class='add'>+	if (bitmap_size &lt;= offset)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	next_zero_bit = ext4_find_next_zero_bit(bh-&gt;b_data, bitmap_size, offset);</div><div class='add'>+</div><div class='add'>+	return (next_zero_bit &lt; bitmap_size ? next_zero_bit : 0);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct ext4_group_info *ext4_get_group_info(struct super_block *sb,</div><div class='add'>+					    ext4_group_t group)</div><div class='add'>+{</div><div class='add'>+	struct ext4_group_info **grp_info;</div><div class='add'>+	long indexv, indexh;</div><div class='add'>+</div><div class='add'>+	if (unlikely(group &gt;= EXT4_SB(sb)-&gt;s_groups_count))</div><div class='add'>+		return NULL;</div><div class='add'>+	indexv = group &gt;&gt; (EXT4_DESC_PER_BLOCK_BITS(sb));</div><div class='add'>+	indexh = group &amp; ((EXT4_DESC_PER_BLOCK(sb)) - 1);</div><div class='add'>+	grp_info = sbi_array_rcu_deref(EXT4_SB(sb), s_group_info, indexv);</div><div class='add'>+	return grp_info[indexh];</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Return the block number which was discovered to be invalid, or 0 if</div><div class='ctx'>  * the block bitmap is valid.</div><div class='hunk'>@@ -350,13 +384,13 @@ static ext4_fsblk_t ext4_valid_block_bitmap(struct super_block *sb,</div><div class='ctx'> 	blk = ext4_inode_table(sb, desc);</div><div class='ctx'> 	offset = blk - group_first_block;</div><div class='ctx'> 	if (offset &lt; 0 || EXT4_B2C(sbi, offset) &gt;= max_bit ||</div><div class='del'>-	    EXT4_B2C(sbi, offset + sbi-&gt;s_itb_per_group) &gt;= max_bit)</div><div class='add'>+	    EXT4_B2C(sbi, offset + sbi-&gt;s_itb_per_group - 1) &gt;= max_bit)</div><div class='ctx'> 		return blk;</div><div class='ctx'> 	next_zero_bit = ext4_find_next_zero_bit(bh-&gt;b_data,</div><div class='del'>-			EXT4_B2C(sbi, offset + sbi-&gt;s_itb_per_group),</div><div class='add'>+			EXT4_B2C(sbi, offset + sbi-&gt;s_itb_per_group - 1) + 1,</div><div class='ctx'> 			EXT4_B2C(sbi, offset));</div><div class='ctx'> 	if (next_zero_bit &lt;</div><div class='del'>-	    EXT4_B2C(sbi, offset + sbi-&gt;s_itb_per_group))</div><div class='add'>+	    EXT4_B2C(sbi, offset + sbi-&gt;s_itb_per_group - 1) + 1)</div><div class='ctx'> 		/* bad bitmap for inode tables */</div><div class='ctx'> 		return blk;</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -377,14 +411,13 @@ static int ext4_validate_block_bitmap(struct super_block *sb,</div><div class='ctx'> </div><div class='ctx'> 	if (buffer_verified(bh))</div><div class='ctx'> 		return 0;</div><div class='del'>-	if (EXT4_MB_GRP_BBITMAP_CORRUPT(grp))</div><div class='add'>+	if (!grp || EXT4_MB_GRP_BBITMAP_CORRUPT(grp))</div><div class='ctx'> 		return -EFSCORRUPTED;</div><div class='ctx'> </div><div class='ctx'> 	ext4_lock_group(sb, block_group);</div><div class='ctx'> 	if (buffer_verified(bh))</div><div class='ctx'> 		goto verified;</div><div class='del'>-	if (unlikely(!ext4_block_bitmap_csum_verify(sb, block_group,</div><div class='del'>-						    desc, bh) ||</div><div class='add'>+	if (unlikely(!ext4_block_bitmap_csum_verify(sb, desc, bh) ||</div><div class='ctx'> 		     ext4_simulate_fail(sb, EXT4_SIM_BBITMAP_CRC))) {</div><div class='ctx'> 		ext4_unlock_group(sb, block_group);</div><div class='ctx'> 		ext4_error(sb, "bg %u: bad block bitmap checksum", block_group);</div><div class='hunk'>@@ -401,6 +434,15 @@ static int ext4_validate_block_bitmap(struct super_block *sb,</div><div class='ctx'> 					EXT4_GROUP_INFO_BBITMAP_CORRUPT);</div><div class='ctx'> 		return -EFSCORRUPTED;</div><div class='ctx'> 	}</div><div class='add'>+	blk = ext4_valid_block_bitmap_padding(sb, block_group, bh);</div><div class='add'>+	if (unlikely(blk != 0)) {</div><div class='add'>+		ext4_unlock_group(sb, block_group);</div><div class='add'>+		ext4_error(sb, "bg %u: block %llu: padding at end of block bitmap is not set",</div><div class='add'>+			   block_group, blk);</div><div class='add'>+		ext4_mark_group_bitmap_corrupted(sb, block_group,</div><div class='add'>+						 EXT4_GROUP_INFO_BBITMAP_CORRUPT);</div><div class='add'>+		return -EFSCORRUPTED;</div><div class='add'>+	}</div><div class='ctx'> 	set_buffer_verified(bh);</div><div class='ctx'> verified:</div><div class='ctx'> 	ext4_unlock_group(sb, block_group);</div><div class='hunk'>@@ -411,6 +453,7 @@ verified:</div><div class='ctx'>  * ext4_read_block_bitmap_nowait()</div><div class='ctx'>  * @sb:			super block</div><div class='ctx'>  * @block_group:	given block group</div><div class='add'>+ * @ignore_locked:	ignore locked buffers</div><div class='ctx'>  *</div><div class='ctx'>  * Read the bitmap for a given block_group,and validate the</div><div class='ctx'>  * bits for block/inode/inode tables are set in the bitmaps</div><div class='hunk'>@@ -427,6 +470,9 @@ ext4_read_block_bitmap_nowait(struct super_block *sb, ext4_group_t block_group,</div><div class='ctx'> 	ext4_fsblk_t bitmap_blk;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='add'>+	KUNIT_STATIC_STUB_REDIRECT(ext4_read_block_bitmap_nowait,</div><div class='add'>+				   sb, block_group, ignore_locked);</div><div class='add'>+</div><div class='ctx'> 	desc = ext4_get_group_desc(sb, block_group, NULL);</div><div class='ctx'> 	if (!desc)</div><div class='ctx'> 		return ERR_PTR(-EFSCORRUPTED);</div><div class='hunk'>@@ -473,17 +519,19 @@ ext4_read_block_bitmap_nowait(struct super_block *sb, ext4_group_t block_group,</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 		err = ext4_init_block_bitmap(sb, bh, block_group, desc);</div><div class='del'>-		set_bitmap_uptodate(bh);</div><div class='del'>-		set_buffer_uptodate(bh);</div><div class='del'>-		set_buffer_verified(bh);</div><div class='del'>-		ext4_unlock_group(sb, block_group);</div><div class='del'>-		unlock_buffer(bh);</div><div class='ctx'> 		if (err) {</div><div class='add'>+			ext4_unlock_group(sb, block_group);</div><div class='add'>+			unlock_buffer(bh);</div><div class='ctx'> 			ext4_error(sb, "Failed to init block bitmap for group "</div><div class='ctx'> 				   "%u: %d", block_group, err);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='del'>-		goto verify;</div><div class='add'>+		set_bitmap_uptodate(bh);</div><div class='add'>+		set_buffer_uptodate(bh);</div><div class='add'>+		set_buffer_verified(bh);</div><div class='add'>+		ext4_unlock_group(sb, block_group);</div><div class='add'>+		unlock_buffer(bh);</div><div class='add'>+		return bh;</div><div class='ctx'> 	}</div><div class='ctx'> 	ext4_unlock_group(sb, block_group);</div><div class='ctx'> 	if (buffer_uptodate(bh)) {</div><div class='hunk'>@@ -502,7 +550,8 @@ ext4_read_block_bitmap_nowait(struct super_block *sb, ext4_group_t block_group,</div><div class='ctx'> 	trace_ext4_read_block_bitmap_load(sb, block_group, ignore_locked);</div><div class='ctx'> 	ext4_read_bh_nowait(bh, REQ_META | REQ_PRIO |</div><div class='ctx'> 			    (ignore_locked ? REQ_RAHEAD : 0),</div><div class='del'>-			    ext4_end_bitmap_read);</div><div class='add'>+			    ext4_end_bitmap_read,</div><div class='add'>+			    ext4_simulate_fail(sb, EXT4_SIM_BBITMAP_EIO));</div><div class='ctx'> 	return bh;</div><div class='ctx'> verify:</div><div class='ctx'> 	err = ext4_validate_block_bitmap(sb, desc, block_group, bh);</div><div class='hunk'>@@ -520,13 +569,15 @@ int ext4_wait_block_bitmap(struct super_block *sb, ext4_group_t block_group,</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_group_desc *desc;</div><div class='ctx'> </div><div class='add'>+	KUNIT_STATIC_STUB_REDIRECT(ext4_wait_block_bitmap,</div><div class='add'>+				   sb, block_group, bh);</div><div class='add'>+</div><div class='ctx'> 	if (!buffer_new(bh))</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	desc = ext4_get_group_desc(sb, block_group, NULL);</div><div class='ctx'> 	if (!desc)</div><div class='ctx'> 		return -EFSCORRUPTED;</div><div class='ctx'> 	wait_on_buffer(bh);</div><div class='del'>-	ext4_simulate_fail_bh(sb, bh, EXT4_SIM_BBITMAP_EIO);</div><div class='ctx'> 	if (!buffer_uptodate(bh)) {</div><div class='ctx'> 		ext4_error_err(sb, EIO, "Cannot read block bitmap - "</div><div class='ctx'> 			       "block_group = %u, block_bitmap = %llu",</div><div class='hunk'>@@ -598,8 +649,8 @@ static int ext4_has_free_clusters(struct ext4_sb_info *sbi,</div><div class='ctx'> 	/* Hm, nope.  Are (enough) root reserved clusters available? */</div><div class='ctx'> 	if (uid_eq(sbi-&gt;s_resuid, current_fsuid()) ||</div><div class='ctx'> 	    (!gid_eq(sbi-&gt;s_resgid, GLOBAL_ROOT_GID) &amp;&amp; in_group_p(sbi-&gt;s_resgid)) ||</div><div class='del'>-	    capable(CAP_SYS_RESOURCE) ||</div><div class='del'>-	    (flags &amp; EXT4_MB_USE_ROOT_BLOCKS)) {</div><div class='add'>+	    (flags &amp; EXT4_MB_USE_ROOT_BLOCKS) ||</div><div class='add'>+	    capable(CAP_SYS_RESOURCE)) {</div><div class='ctx'> </div><div class='ctx'> 		if (free_clusters &gt;= (nclusters + dirty_clusters +</div><div class='ctx'> 				      resv_clusters))</div><div class='hunk'>@@ -652,7 +703,7 @@ int ext4_should_retry_alloc(struct super_block *sb, int *retries)</div><div class='ctx'> 	 * possible we just missed a transaction commit that did so</div><div class='ctx'> 	 */</div><div class='ctx'> 	smp_mb();</div><div class='del'>-	if (sbi-&gt;s_mb_free_pending == 0) {</div><div class='add'>+	if (atomic_read(&amp;sbi-&gt;s_mb_free_pending) == 0) {</div><div class='ctx'> 		if (test_opt(sb, DISCARD)) {</div><div class='ctx'> 			atomic_inc(&amp;sbi-&gt;s_retry_alloc_pending);</div><div class='ctx'> 			flush_work(&amp;sbi-&gt;s_discard_work);</div><div class='hunk'>@@ -665,7 +716,7 @@ int ext4_should_retry_alloc(struct super_block *sb, int *retries)</div><div class='ctx'> 	 * it's possible we've just missed a transaction commit here,</div><div class='ctx'> 	 * so ignore the returned status</div><div class='ctx'> 	 */</div><div class='del'>-	jbd_debug(1, "%s: retrying operation after ENOSPC\n", sb-&gt;s_id);</div><div class='add'>+	ext4_debug("%s: retrying operation after ENOSPC\n", sb-&gt;s_id);</div><div class='ctx'> 	(void) jbd2_journal_force_commit_nested(sbi-&gt;s_journal);</div><div class='ctx'> 	return 1;</div><div class='ctx'> }</div><div class='hunk'>@@ -701,7 +752,7 @@ ext4_fsblk_t ext4_new_meta_blocks(handle_t *handle, struct inode *inode,</div><div class='ctx'> 		*count = ar.len;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Account for the allocated meta blocks.  We will never</div><div class='del'>-	 * fail EDQUOT for metdata, but we do account for it.</div><div class='add'>+	 * fail EDQUOT for metadata, but we do account for it.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (!(*errp) &amp;&amp; (flags &amp; EXT4_MB_DELALLOC_RESERVED)) {</div><div class='ctx'> 		dquot_alloc_block_nofail(inode,</div><div class='hunk'>@@ -870,11 +921,11 @@ unsigned long ext4_bg_num_gdb(struct super_block *sb, ext4_group_t group)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * This function returns the number of file system metadata clusters at</div><div class='add'>+ * This function returns the number of file system metadata blocks at</div><div class='ctx'>  * the beginning of a block group, including the reserved gdt blocks.</div><div class='ctx'>  */</div><div class='del'>-static unsigned ext4_num_base_meta_clusters(struct super_block *sb,</div><div class='del'>-				     ext4_group_t block_group)</div><div class='add'>+unsigned int ext4_num_base_meta_blocks(struct super_block *sb,</div><div class='add'>+				       ext4_group_t block_group)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> 	unsigned num;</div><div class='hunk'>@@ -886,14 +937,21 @@ static unsigned ext4_num_base_meta_clusters(struct super_block *sb,</div><div class='ctx'> 	    block_group &lt; le32_to_cpu(sbi-&gt;s_es-&gt;s_first_meta_bg) *</div><div class='ctx'> 			  sbi-&gt;s_desc_per_block) {</div><div class='ctx'> 		if (num) {</div><div class='del'>-			num += ext4_bg_num_gdb(sb, block_group);</div><div class='add'>+			num += ext4_bg_num_gdb_nometa(sb, block_group);</div><div class='ctx'> 			num += le16_to_cpu(sbi-&gt;s_es-&gt;s_reserved_gdt_blocks);</div><div class='ctx'> 		}</div><div class='ctx'> 	} else { /* For META_BG_BLOCK_GROUPS */</div><div class='del'>-		num += ext4_bg_num_gdb(sb, block_group);</div><div class='add'>+		num += ext4_bg_num_gdb_meta(sb, block_group);</div><div class='ctx'> 	}</div><div class='del'>-	return EXT4_NUM_B2C(sbi, num);</div><div class='add'>+	return num;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static unsigned int ext4_num_base_meta_clusters(struct super_block *sb,</div><div class='add'>+						ext4_group_t block_group)</div><div class='add'>+{</div><div class='add'>+	return EXT4_NUM_B2C(EXT4_SB(sb), ext4_num_base_meta_blocks(sb, block_group));</div><div class='ctx'> }</div><div class='add'>+</div><div class='ctx'> /**</div><div class='ctx'>  *	ext4_inode_to_goal_block - return a hint for block allocation</div><div class='ctx'>  *	@inode: inode for block allocation</div><div class='head'>diff --git a/fs/ext4/bitmap.c b/fs/ext4/bitmap.c<br/>index f63e028c638c..87760fabdd2e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/bitmap.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/bitmap.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/bitmap.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/bitmap.c</a></div><div class='hunk'>@@ -16,19 +16,21 @@ unsigned int ext4_count_free(char *bitmap, unsigned int numchars)</div><div class='ctx'> 	return numchars * BITS_PER_BYTE - memweight(bitmap, numchars);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int ext4_inode_bitmap_csum_verify(struct super_block *sb, ext4_group_t group,</div><div class='add'>+int ext4_inode_bitmap_csum_verify(struct super_block *sb,</div><div class='ctx'> 				  struct ext4_group_desc *gdp,</div><div class='del'>-				  struct buffer_head *bh, int sz)</div><div class='add'>+				  struct buffer_head *bh)</div><div class='ctx'> {</div><div class='ctx'> 	__u32 hi;</div><div class='ctx'> 	__u32 provided, calculated;</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	int sz;</div><div class='ctx'> </div><div class='del'>-	if (!ext4_has_metadata_csum(sb))</div><div class='add'>+	if (!ext4_has_feature_metadata_csum(sb))</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='add'>+	sz = EXT4_INODES_PER_GROUP(sb) &gt;&gt; 3;</div><div class='ctx'> 	provided = le16_to_cpu(gdp-&gt;bg_inode_bitmap_csum_lo);</div><div class='del'>-	calculated = ext4_chksum(sbi, sbi-&gt;s_csum_seed, (__u8 *)bh-&gt;b_data, sz);</div><div class='add'>+	calculated = ext4_chksum(sbi-&gt;s_csum_seed, (__u8 *)bh-&gt;b_data, sz);</div><div class='ctx'> 	if (sbi-&gt;s_desc_size &gt;= EXT4_BG_INODE_BITMAP_CSUM_HI_END) {</div><div class='ctx'> 		hi = le16_to_cpu(gdp-&gt;bg_inode_bitmap_csum_hi);</div><div class='ctx'> 		provided |= (hi &lt;&lt; 16);</div><div class='hunk'>@@ -38,23 +40,25 @@ int ext4_inode_bitmap_csum_verify(struct super_block *sb, ext4_group_t group,</div><div class='ctx'> 	return provided == calculated;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void ext4_inode_bitmap_csum_set(struct super_block *sb, ext4_group_t group,</div><div class='add'>+void ext4_inode_bitmap_csum_set(struct super_block *sb,</div><div class='ctx'> 				struct ext4_group_desc *gdp,</div><div class='del'>-				struct buffer_head *bh, int sz)</div><div class='add'>+				struct buffer_head *bh)</div><div class='ctx'> {</div><div class='ctx'> 	__u32 csum;</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	int sz;</div><div class='ctx'> </div><div class='del'>-	if (!ext4_has_metadata_csum(sb))</div><div class='add'>+	if (!ext4_has_feature_metadata_csum(sb))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	csum = ext4_chksum(sbi, sbi-&gt;s_csum_seed, (__u8 *)bh-&gt;b_data, sz);</div><div class='add'>+	sz = EXT4_INODES_PER_GROUP(sb) &gt;&gt; 3;</div><div class='add'>+	csum = ext4_chksum(sbi-&gt;s_csum_seed, (__u8 *)bh-&gt;b_data, sz);</div><div class='ctx'> 	gdp-&gt;bg_inode_bitmap_csum_lo = cpu_to_le16(csum &amp; 0xFFFF);</div><div class='ctx'> 	if (sbi-&gt;s_desc_size &gt;= EXT4_BG_INODE_BITMAP_CSUM_HI_END)</div><div class='ctx'> 		gdp-&gt;bg_inode_bitmap_csum_hi = cpu_to_le16(csum &gt;&gt; 16);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int ext4_block_bitmap_csum_verify(struct super_block *sb, ext4_group_t group,</div><div class='add'>+int ext4_block_bitmap_csum_verify(struct super_block *sb,</div><div class='ctx'> 				  struct ext4_group_desc *gdp,</div><div class='ctx'> 				  struct buffer_head *bh)</div><div class='ctx'> {</div><div class='hunk'>@@ -63,24 +67,21 @@ int ext4_block_bitmap_csum_verify(struct super_block *sb, ext4_group_t group,</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> 	int sz = EXT4_CLUSTERS_PER_GROUP(sb) / 8;</div><div class='ctx'> </div><div class='del'>-	if (!ext4_has_metadata_csum(sb))</div><div class='add'>+	if (!ext4_has_feature_metadata_csum(sb))</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='ctx'> 	provided = le16_to_cpu(gdp-&gt;bg_block_bitmap_csum_lo);</div><div class='del'>-	calculated = ext4_chksum(sbi, sbi-&gt;s_csum_seed, (__u8 *)bh-&gt;b_data, sz);</div><div class='add'>+	calculated = ext4_chksum(sbi-&gt;s_csum_seed, (__u8 *)bh-&gt;b_data, sz);</div><div class='ctx'> 	if (sbi-&gt;s_desc_size &gt;= EXT4_BG_BLOCK_BITMAP_CSUM_HI_END) {</div><div class='ctx'> 		hi = le16_to_cpu(gdp-&gt;bg_block_bitmap_csum_hi);</div><div class='ctx'> 		provided |= (hi &lt;&lt; 16);</div><div class='ctx'> 	} else</div><div class='ctx'> 		calculated &amp;= 0xFFFF;</div><div class='ctx'> </div><div class='del'>-	if (provided == calculated)</div><div class='del'>-		return 1;</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='add'>+	return provided == calculated;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void ext4_block_bitmap_csum_set(struct super_block *sb, ext4_group_t group,</div><div class='add'>+void ext4_block_bitmap_csum_set(struct super_block *sb,</div><div class='ctx'> 				struct ext4_group_desc *gdp,</div><div class='ctx'> 				struct buffer_head *bh)</div><div class='ctx'> {</div><div class='hunk'>@@ -88,10 +89,10 @@ void ext4_block_bitmap_csum_set(struct super_block *sb, ext4_group_t group,</div><div class='ctx'> 	__u32 csum;</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> </div><div class='del'>-	if (!ext4_has_metadata_csum(sb))</div><div class='add'>+	if (!ext4_has_feature_metadata_csum(sb))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	csum = ext4_chksum(sbi, sbi-&gt;s_csum_seed, (__u8 *)bh-&gt;b_data, sz);</div><div class='add'>+	csum = ext4_chksum(sbi-&gt;s_csum_seed, (__u8 *)bh-&gt;b_data, sz);</div><div class='ctx'> 	gdp-&gt;bg_block_bitmap_csum_lo = cpu_to_le16(csum &amp; 0xFFFF);</div><div class='ctx'> 	if (sbi-&gt;s_desc_size &gt;= EXT4_BG_BLOCK_BITMAP_CSUM_HI_END)</div><div class='ctx'> 		gdp-&gt;bg_block_bitmap_csum_hi = cpu_to_le16(csum &gt;&gt; 16);</div><div class='head'>diff --git a/fs/ext4/block_validity.c b/fs/ext4/block_validity.c<br/>index 4666b55b736e..e8c5525afc67 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/block_validity.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/block_validity.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/block_validity.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/block_validity.c</a></div><div class='hunk'>@@ -72,7 +72,7 @@ static int add_system_zone(struct ext4_system_blocks *system_blks,</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_system_zone *new_entry, *entry;</div><div class='ctx'> 	struct rb_node **n = &amp;system_blks-&gt;root.rb_node, *node;</div><div class='del'>-	struct rb_node *parent = NULL, *new_node = NULL;</div><div class='add'>+	struct rb_node *parent = NULL, *new_node;</div><div class='ctx'> </div><div class='ctx'> 	while (*n) {</div><div class='ctx'> 		parent = *n;</div><div class='hunk'>@@ -215,7 +215,6 @@ int ext4_setup_system_zone(struct super_block *sb)</div><div class='ctx'> 	struct ext4_system_blocks *system_blks;</div><div class='ctx'> 	struct ext4_group_desc *gdp;</div><div class='ctx'> 	ext4_group_t i;</div><div class='del'>-	int flex_size = ext4_flex_bg_size(sbi);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	system_blks = kzalloc(sizeof(*system_blks), GFP_KERNEL);</div><div class='hunk'>@@ -223,12 +222,13 @@ int ext4_setup_system_zone(struct super_block *sb)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	for (i=0; i &lt; ngroups; i++) {</div><div class='add'>+		unsigned int meta_blks = ext4_num_base_meta_blocks(sb, i);</div><div class='add'>+</div><div class='ctx'> 		cond_resched();</div><div class='del'>-		if (ext4_bg_has_super(sb, i) &amp;&amp;</div><div class='del'>-		    ((i &lt; 5) || ((i % flex_size) == 0))) {</div><div class='add'>+		if (meta_blks != 0) {</div><div class='ctx'> 			ret = add_system_zone(system_blks,</div><div class='ctx'> 					ext4_group_first_block_no(sb, i),</div><div class='del'>-					ext4_bg_num_gdb(sb, i) + 1, 0);</div><div class='add'>+					meta_blks, 0);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				goto err;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -292,15 +292,10 @@ void ext4_release_system_zone(struct super_block *sb)</div><div class='ctx'> 		call_rcu(&amp;system_blks-&gt;rcu, ext4_destroy_system_zone);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Returns 1 if the passed-in block region (start_blk,</div><div class='del'>- * start_blk+count) is valid; 0 if some part of the block region</div><div class='del'>- * overlaps with some other filesystem metadata blocks.</div><div class='del'>- */</div><div class='del'>-int ext4_inode_block_valid(struct inode *inode, ext4_fsblk_t start_blk,</div><div class='del'>-			  unsigned int count)</div><div class='add'>+int ext4_sb_block_valid(struct super_block *sb, struct inode *inode,</div><div class='add'>+				ext4_fsblk_t start_blk, unsigned int count)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_sb_info *sbi = EXT4_SB(inode-&gt;i_sb);</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> 	struct ext4_system_blocks *system_blks;</div><div class='ctx'> 	struct ext4_system_zone *entry;</div><div class='ctx'> 	struct rb_node *n;</div><div class='hunk'>@@ -329,7 +324,9 @@ int ext4_inode_block_valid(struct inode *inode, ext4_fsblk_t start_blk,</div><div class='ctx'> 		else if (start_blk &gt;= (entry-&gt;start_blk + entry-&gt;count))</div><div class='ctx'> 			n = n-&gt;rb_right;</div><div class='ctx'> 		else {</div><div class='del'>-			ret = (entry-&gt;ino == inode-&gt;i_ino);</div><div class='add'>+			ret = 0;</div><div class='add'>+			if (inode)</div><div class='add'>+				ret = (entry-&gt;ino == inode-&gt;i_ino);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -338,15 +335,25 @@ out_rcu:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Returns 1 if the passed-in block region (start_blk,</div><div class='add'>+ * start_blk+count) is valid; 0 if some part of the block region</div><div class='add'>+ * overlaps with some other filesystem metadata blocks.</div><div class='add'>+ */</div><div class='add'>+int ext4_inode_block_valid(struct inode *inode, ext4_fsblk_t start_blk,</div><div class='add'>+			  unsigned int count)</div><div class='add'>+{</div><div class='add'>+	return ext4_sb_block_valid(inode-&gt;i_sb, inode, start_blk, count);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> int ext4_check_blockref(const char *function, unsigned int line,</div><div class='ctx'> 			struct inode *inode, __le32 *p, unsigned int max)</div><div class='ctx'> {</div><div class='ctx'> 	__le32 *bref = p;</div><div class='ctx'> 	unsigned int blk;</div><div class='add'>+	journal_t *journal = EXT4_SB(inode-&gt;i_sb)-&gt;s_journal;</div><div class='ctx'> </div><div class='del'>-	if (ext4_has_feature_journal(inode-&gt;i_sb) &amp;&amp;</div><div class='del'>-	    (inode-&gt;i_ino ==</div><div class='del'>-	     le32_to_cpu(EXT4_SB(inode-&gt;i_sb)-&gt;s_es-&gt;s_journal_inum)))</div><div class='add'>+	if (journal &amp;&amp; inode == journal-&gt;j_inode)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	while (bref &lt; p+max) {</div><div class='head'>diff --git a/fs/ext4/crypto.c b/fs/ext4/crypto.c<br/>new file mode 100644<br/>index 000000000000..cf0a0970c095<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/crypto.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/crypto.c</a></div><div class='hunk'>@@ -0,0 +1,241 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+</div><div class='add'>+#include &lt;linux/quotaops.h&gt;</div><div class='add'>+#include &lt;linux/uuid.h&gt;</div><div class='add'>+</div><div class='add'>+#include "ext4.h"</div><div class='add'>+#include "xattr.h"</div><div class='add'>+#include "ext4_jbd2.h"</div><div class='add'>+</div><div class='add'>+static void ext4_fname_from_fscrypt_name(struct ext4_filename *dst,</div><div class='add'>+					 const struct fscrypt_name *src)</div><div class='add'>+{</div><div class='add'>+	memset(dst, 0, sizeof(*dst));</div><div class='add'>+</div><div class='add'>+	dst-&gt;usr_fname = src-&gt;usr_fname;</div><div class='add'>+	dst-&gt;disk_name = src-&gt;disk_name;</div><div class='add'>+	dst-&gt;hinfo.hash = src-&gt;hash;</div><div class='add'>+	dst-&gt;hinfo.minor_hash = src-&gt;minor_hash;</div><div class='add'>+	dst-&gt;crypto_buf = src-&gt;crypto_buf;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int ext4_fname_setup_filename(struct inode *dir, const struct qstr *iname,</div><div class='add'>+			      int lookup, struct ext4_filename *fname)</div><div class='add'>+{</div><div class='add'>+	struct fscrypt_name name;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = fscrypt_setup_filename(dir, iname, lookup, &amp;name);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	ext4_fname_from_fscrypt_name(fname, &amp;name);</div><div class='add'>+</div><div class='add'>+	err = ext4_fname_setup_ci_filename(dir, iname, fname);</div><div class='add'>+	if (err)</div><div class='add'>+		ext4_fname_free_filename(fname);</div><div class='add'>+</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int ext4_fname_prepare_lookup(struct inode *dir, struct dentry *dentry,</div><div class='add'>+			      struct ext4_filename *fname)</div><div class='add'>+{</div><div class='add'>+	struct fscrypt_name name;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = fscrypt_prepare_lookup(dir, dentry, &amp;name);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	ext4_fname_from_fscrypt_name(fname, &amp;name);</div><div class='add'>+</div><div class='add'>+	err = ext4_fname_setup_ci_filename(dir, &amp;dentry-&gt;d_name, fname);</div><div class='add'>+	if (err)</div><div class='add'>+		ext4_fname_free_filename(fname);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void ext4_fname_free_filename(struct ext4_filename *fname)</div><div class='add'>+{</div><div class='add'>+	struct fscrypt_name name;</div><div class='add'>+</div><div class='add'>+	name.crypto_buf = fname-&gt;crypto_buf;</div><div class='add'>+	fscrypt_free_filename(&amp;name);</div><div class='add'>+</div><div class='add'>+	fname-&gt;crypto_buf.name = NULL;</div><div class='add'>+	fname-&gt;usr_fname = NULL;</div><div class='add'>+	fname-&gt;disk_name.name = NULL;</div><div class='add'>+</div><div class='add'>+	ext4_fname_free_ci_filename(fname);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool uuid_is_zero(__u8 u[16])</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; 16; i++)</div><div class='add'>+		if (u[i])</div><div class='add'>+			return false;</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int ext4_ioctl_get_encryption_pwsalt(struct file *filp, void __user *arg)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = file_inode(filp)-&gt;i_sb;</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	int err, err2;</div><div class='add'>+	handle_t *handle;</div><div class='add'>+</div><div class='add'>+	if (!ext4_has_feature_encrypt(sb))</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+</div><div class='add'>+	if (uuid_is_zero(sbi-&gt;s_es-&gt;s_encrypt_pw_salt)) {</div><div class='add'>+		err = mnt_want_write_file(filp);</div><div class='add'>+		if (err)</div><div class='add'>+			return err;</div><div class='add'>+		handle = ext4_journal_start_sb(sb, EXT4_HT_MISC, 1);</div><div class='add'>+		if (IS_ERR(handle)) {</div><div class='add'>+			err = PTR_ERR(handle);</div><div class='add'>+			goto pwsalt_err_exit;</div><div class='add'>+		}</div><div class='add'>+		err = ext4_journal_get_write_access(handle, sb, sbi-&gt;s_sbh,</div><div class='add'>+						    EXT4_JTR_NONE);</div><div class='add'>+		if (err)</div><div class='add'>+			goto pwsalt_err_journal;</div><div class='add'>+		lock_buffer(sbi-&gt;s_sbh);</div><div class='add'>+		generate_random_uuid(sbi-&gt;s_es-&gt;s_encrypt_pw_salt);</div><div class='add'>+		ext4_superblock_csum_set(sb);</div><div class='add'>+		unlock_buffer(sbi-&gt;s_sbh);</div><div class='add'>+		err = ext4_handle_dirty_metadata(handle, NULL, sbi-&gt;s_sbh);</div><div class='add'>+pwsalt_err_journal:</div><div class='add'>+		err2 = ext4_journal_stop(handle);</div><div class='add'>+		if (err2 &amp;&amp; !err)</div><div class='add'>+			err = err2;</div><div class='add'>+pwsalt_err_exit:</div><div class='add'>+		mnt_drop_write_file(filp);</div><div class='add'>+		if (err)</div><div class='add'>+			return err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (copy_to_user(arg, sbi-&gt;s_es-&gt;s_encrypt_pw_salt, 16))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ext4_get_context(struct inode *inode, void *ctx, size_t len)</div><div class='add'>+{</div><div class='add'>+	return ext4_xattr_get(inode, EXT4_XATTR_INDEX_ENCRYPTION,</div><div class='add'>+				 EXT4_XATTR_NAME_ENCRYPTION_CONTEXT, ctx, len);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ext4_set_context(struct inode *inode, const void *ctx, size_t len,</div><div class='add'>+							void *fs_data)</div><div class='add'>+{</div><div class='add'>+	handle_t *handle = fs_data;</div><div class='add'>+	int res, res2, credits, retries = 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Encrypting the root directory is not allowed because e2fsck expects</div><div class='add'>+	 * lost+found to exist and be unencrypted, and encrypting the root</div><div class='add'>+	 * directory would imply encrypting the lost+found directory as well as</div><div class='add'>+	 * the filename "lost+found" itself.</div><div class='add'>+	 */</div><div class='add'>+	if (inode-&gt;i_ino == EXT4_ROOT_INO)</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	if (WARN_ON_ONCE(IS_DAX(inode) &amp;&amp; i_size_read(inode)))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	if (ext4_test_inode_flag(inode, EXT4_INODE_DAX))</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+</div><div class='add'>+	res = ext4_convert_inline_data(inode);</div><div class='add'>+	if (res)</div><div class='add'>+		return res;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If a journal handle was specified, then the encryption context is</div><div class='add'>+	 * being set on a new inode via inheritance and is part of a larger</div><div class='add'>+	 * transaction to create the inode.  Otherwise the encryption context is</div><div class='add'>+	 * being set on an existing inode in its own transaction.  Only in the</div><div class='add'>+	 * latter case should the "retry on ENOSPC" logic be used.</div><div class='add'>+	 */</div><div class='add'>+</div><div class='add'>+	if (handle) {</div><div class='add'>+		res = ext4_xattr_set_handle(handle, inode,</div><div class='add'>+					    EXT4_XATTR_INDEX_ENCRYPTION,</div><div class='add'>+					    EXT4_XATTR_NAME_ENCRYPTION_CONTEXT,</div><div class='add'>+					    ctx, len, 0);</div><div class='add'>+		if (!res) {</div><div class='add'>+			ext4_set_inode_flag(inode, EXT4_INODE_ENCRYPT);</div><div class='add'>+			ext4_clear_inode_state(inode,</div><div class='add'>+					EXT4_STATE_MAY_INLINE_DATA);</div><div class='add'>+			/*</div><div class='add'>+			 * Update inode-&gt;i_flags - S_ENCRYPTED will be enabled,</div><div class='add'>+			 * S_DAX may be disabled</div><div class='add'>+			 */</div><div class='add'>+			ext4_set_inode_flags(inode, false);</div><div class='add'>+		}</div><div class='add'>+		return res;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	res = dquot_initialize(inode);</div><div class='add'>+	if (res)</div><div class='add'>+		return res;</div><div class='add'>+retry:</div><div class='add'>+	res = ext4_xattr_set_credits(inode, len, false /* is_create */,</div><div class='add'>+				     &amp;credits);</div><div class='add'>+	if (res)</div><div class='add'>+		return res;</div><div class='add'>+</div><div class='add'>+	handle = ext4_journal_start(inode, EXT4_HT_MISC, credits);</div><div class='add'>+	if (IS_ERR(handle))</div><div class='add'>+		return PTR_ERR(handle);</div><div class='add'>+</div><div class='add'>+	res = ext4_xattr_set_handle(handle, inode, EXT4_XATTR_INDEX_ENCRYPTION,</div><div class='add'>+				    EXT4_XATTR_NAME_ENCRYPTION_CONTEXT,</div><div class='add'>+				    ctx, len, 0);</div><div class='add'>+	if (!res) {</div><div class='add'>+		ext4_set_inode_flag(inode, EXT4_INODE_ENCRYPT);</div><div class='add'>+		/*</div><div class='add'>+		 * Update inode-&gt;i_flags - S_ENCRYPTED will be enabled,</div><div class='add'>+		 * S_DAX may be disabled</div><div class='add'>+		 */</div><div class='add'>+		ext4_set_inode_flags(inode, false);</div><div class='add'>+		res = ext4_mark_inode_dirty(handle, inode);</div><div class='add'>+		if (res)</div><div class='add'>+			EXT4_ERROR_INODE(inode, "Failed to mark inode dirty");</div><div class='add'>+	}</div><div class='add'>+	res2 = ext4_journal_stop(handle);</div><div class='add'>+</div><div class='add'>+	if (res == -ENOSPC &amp;&amp; ext4_should_retry_alloc(inode-&gt;i_sb, &amp;retries))</div><div class='add'>+		goto retry;</div><div class='add'>+	if (!res)</div><div class='add'>+		res = res2;</div><div class='add'>+	return res;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const union fscrypt_policy *ext4_get_dummy_policy(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	return EXT4_SB(sb)-&gt;s_dummy_enc_policy.policy;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool ext4_has_stable_inodes(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	return ext4_has_feature_stable_inodes(sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+const struct fscrypt_operations ext4_cryptops = {</div><div class='add'>+	.inode_info_offs	= (int)offsetof(struct ext4_inode_info, i_crypt_info) -</div><div class='add'>+				  (int)offsetof(struct ext4_inode_info, vfs_inode),</div><div class='add'>+	.needs_bounce_pages	= 1,</div><div class='add'>+	.has_32bit_inodes	= 1,</div><div class='add'>+	.supports_subblock_data_units = 1,</div><div class='add'>+	.legacy_key_prefix	= "ext4:",</div><div class='add'>+	.get_context		= ext4_get_context,</div><div class='add'>+	.set_context		= ext4_set_context,</div><div class='add'>+	.get_dummy_policy	= ext4_get_dummy_policy,</div><div class='add'>+	.empty_dir		= ext4_empty_dir,</div><div class='add'>+	.has_stable_inodes	= ext4_has_stable_inodes,</div><div class='add'>+};</div><div class='head'>diff --git a/fs/ext4/dir.c b/fs/ext4/dir.c<br/>index 74b172a4adda..256fe2c1d4c1 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/dir.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/dir.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/dir.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/dir.c</a></div><div class='hunk'>@@ -86,7 +86,7 @@ int __ext4_check_dir_entry(const char *function, unsigned int line,</div><div class='ctx'> 						dir-&gt;i_sb-&gt;s_blocksize);</div><div class='ctx'> 	const int next_offset = ((char *) de - buf) + rlen;</div><div class='ctx'> 	bool fake = is_fake_dir_entry(de);</div><div class='del'>-	bool has_csum = ext4_has_metadata_csum(dir-&gt;i_sb);</div><div class='add'>+	bool has_csum = ext4_has_feature_metadata_csum(dir-&gt;i_sb);</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(rlen &lt; ext4_dir_rec_len(1, fake ? NULL : dir)))</div><div class='ctx'> 		error_msg = "rec_len is smaller than minimal";</div><div class='hunk'>@@ -104,6 +104,9 @@ int __ext4_check_dir_entry(const char *function, unsigned int line,</div><div class='ctx'> 	else if (unlikely(le32_to_cpu(de-&gt;inode) &gt;</div><div class='ctx'> 			le32_to_cpu(EXT4_SB(dir-&gt;i_sb)-&gt;s_es-&gt;s_inodes_count)))</div><div class='ctx'> 		error_msg = "inode out of bounds";</div><div class='add'>+	else if (unlikely(next_offset == size &amp;&amp; de-&gt;name_len == 1 &amp;&amp;</div><div class='add'>+			  de-&gt;name[0] == '.'))</div><div class='add'>+		error_msg = "'.' directory cannot be the last in data block";</div><div class='ctx'> 	else</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='hunk'>@@ -133,6 +136,7 @@ static int ext4_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	struct buffer_head *bh = NULL;</div><div class='ctx'> 	struct fscrypt_str fstr = FSTR_INIT(NULL, 0);</div><div class='add'>+	struct dir_private_info *info = file-&gt;private_data;</div><div class='ctx'> </div><div class='ctx'> 	err = fscrypt_prepare_readdir(inode);</div><div class='ctx'> 	if (err)</div><div class='hunk'>@@ -144,7 +148,7 @@ static int ext4_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 			return err;</div><div class='ctx'> </div><div class='ctx'> 		/* Can we just clear INDEX flag to ignore htree information? */</div><div class='del'>-		if (!ext4_has_metadata_csum(sb)) {</div><div class='add'>+		if (!ext4_has_feature_metadata_csum(sb)) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * We don't set the inode dirty flag since it's not</div><div class='ctx'> 			 * critical that it gets flushed back to the disk.</div><div class='hunk'>@@ -188,13 +192,13 @@ static int ext4_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (err &gt; 0) {</div><div class='del'>-			pgoff_t index = map.m_pblk &gt;&gt;</div><div class='del'>-					(PAGE_SHIFT - inode-&gt;i_blkbits);</div><div class='add'>+			pgoff_t index = map.m_pblk &lt;&lt; inode-&gt;i_blkbits &gt;&gt;</div><div class='add'>+					PAGE_SHIFT;</div><div class='ctx'> 			if (!ra_has_index(&amp;file-&gt;f_ra, index))</div><div class='ctx'> 				page_cache_sync_readahead(</div><div class='del'>-					sb-&gt;s_bdev-&gt;bd_inode-&gt;i_mapping,</div><div class='del'>-					&amp;file-&gt;f_ra, file,</div><div class='del'>-					index, 1);</div><div class='add'>+					sb-&gt;s_bdev-&gt;bd_mapping,</div><div class='add'>+					&amp;file-&gt;f_ra, file, index,</div><div class='add'>+					1 &lt;&lt; EXT4_SB(sb)-&gt;s_min_folio_order);</div><div class='ctx'> 			file-&gt;f_ra.prev_pos = (loff_t)index &lt;&lt; PAGE_SHIFT;</div><div class='ctx'> 			bh = ext4_bread(NULL, inode, map.m_lblk, 0);</div><div class='ctx'> 			if (IS_ERR(bh)) {</div><div class='hunk'>@@ -229,7 +233,7 @@ static int ext4_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 		 * readdir(2), then we might be pointing to an invalid</div><div class='ctx'> 		 * dirent right now.  Scan from the start of the block</div><div class='ctx'> 		 * to make sure. */</div><div class='del'>-		if (!inode_eq_iversion(inode, file-&gt;f_version)) {</div><div class='add'>+		if (!inode_eq_iversion(inode, info-&gt;cookie)) {</div><div class='ctx'> 			for (i = 0; i &lt; sb-&gt;s_blocksize &amp;&amp; i &lt; offset; ) {</div><div class='ctx'> 				de = (struct ext4_dir_entry_2 *)</div><div class='ctx'> 					(bh-&gt;b_data + i);</div><div class='hunk'>@@ -249,7 +253,7 @@ static int ext4_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 			offset = i;</div><div class='ctx'> 			ctx-&gt;pos = (ctx-&gt;pos &amp; ~(sb-&gt;s_blocksize - 1))</div><div class='ctx'> 				| offset;</div><div class='del'>-			file-&gt;f_version = inode_query_iversion(inode);</div><div class='add'>+			info-&gt;cookie = inode_query_iversion(inode);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		while (ctx-&gt;pos &lt; inode-&gt;i_size</div><div class='hunk'>@@ -279,12 +283,20 @@ static int ext4_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 					struct fscrypt_str de_name =</div><div class='ctx'> 							FSTR_INIT(de-&gt;name,</div><div class='ctx'> 								de-&gt;name_len);</div><div class='add'>+					u32 hash;</div><div class='add'>+					u32 minor_hash;</div><div class='add'>+</div><div class='add'>+					if (IS_CASEFOLDED(inode)) {</div><div class='add'>+						hash = EXT4_DIRENT_HASH(de);</div><div class='add'>+						minor_hash = EXT4_DIRENT_MINOR_HASH(de);</div><div class='add'>+					} else {</div><div class='add'>+						hash = 0;</div><div class='add'>+						minor_hash = 0;</div><div class='add'>+					}</div><div class='ctx'> </div><div class='ctx'> 					/* Directory is encrypted */</div><div class='ctx'> 					err = fscrypt_fname_disk_to_usr(inode,</div><div class='del'>-						EXT4_DIRENT_HASH(de),</div><div class='del'>-						EXT4_DIRENT_MINOR_HASH(de),</div><div class='del'>-						&amp;de_name, &amp;fstr);</div><div class='add'>+						hash, minor_hash, &amp;de_name, &amp;fstr);</div><div class='ctx'> 					de_name = fstr;</div><div class='ctx'> 					fstr.len = save_len;</div><div class='ctx'> 					if (err)</div><div class='hunk'>@@ -303,7 +315,6 @@ static int ext4_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 			goto done;</div><div class='ctx'> 		brelse(bh);</div><div class='ctx'> 		bh = NULL;</div><div class='del'>-		offset = 0;</div><div class='ctx'> 	}</div><div class='ctx'> done:</div><div class='ctx'> 	err = 0;</div><div class='hunk'>@@ -385,6 +396,7 @@ static inline loff_t ext4_get_htree_eof(struct file *filp)</div><div class='ctx'> static loff_t ext4_dir_llseek(struct file *file, loff_t offset, int whence)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file-&gt;f_mapping-&gt;host;</div><div class='add'>+	struct dir_private_info *info = file-&gt;private_data;</div><div class='ctx'> 	int dx_dir = is_dx_dir(inode);</div><div class='ctx'> 	loff_t ret, htree_max = ext4_get_htree_eof(file);</div><div class='ctx'> </div><div class='hunk'>@@ -393,7 +405,7 @@ static loff_t ext4_dir_llseek(struct file *file, loff_t offset, int whence)</div><div class='ctx'> 						    htree_max, htree_max);</div><div class='ctx'> 	else</div><div class='ctx'> 		ret = ext4_llseek(file, offset, whence);</div><div class='del'>-	file-&gt;f_version = inode_peek_iversion(inode) - 1;</div><div class='add'>+	info-&gt;cookie = inode_peek_iversion(inode) - 1;</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -409,11 +421,11 @@ struct fname {</div><div class='ctx'> 	__u32		inode;</div><div class='ctx'> 	__u8		name_len;</div><div class='ctx'> 	__u8		file_type;</div><div class='del'>-	char		name[];</div><div class='add'>+	char		name[] __counted_by(name_len);</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * This functoin implements a non-recursive way of freeing all of the</div><div class='add'>+ * This function implements a non-recursive way of freeing all of the</div><div class='ctx'>  * nodes in the red-black tree.</div><div class='ctx'>  */</div><div class='ctx'> static void free_rb_tree_fname(struct rb_root *root)</div><div class='hunk'>@@ -430,18 +442,15 @@ static void free_rb_tree_fname(struct rb_root *root)</div><div class='ctx'> 	*root = RB_ROOT;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-</div><div class='del'>-static struct dir_private_info *ext4_htree_create_dir_info(struct file *filp,</div><div class='del'>-							   loff_t pos)</div><div class='add'>+static void ext4_htree_init_dir_info(struct file *filp, loff_t pos)</div><div class='ctx'> {</div><div class='del'>-	struct dir_private_info *p;</div><div class='del'>-</div><div class='del'>-	p = kzalloc(sizeof(*p), GFP_KERNEL);</div><div class='del'>-	if (!p)</div><div class='del'>-		return NULL;</div><div class='del'>-	p-&gt;curr_hash = pos2maj_hash(filp, pos);</div><div class='del'>-	p-&gt;curr_minor_hash = pos2min_hash(filp, pos);</div><div class='del'>-	return p;</div><div class='add'>+	struct dir_private_info *p = filp-&gt;private_data;</div><div class='add'>+</div><div class='add'>+	if (is_dx_dir(file_inode(filp)) &amp;&amp; !p-&gt;initialized) {</div><div class='add'>+		p-&gt;curr_hash = pos2maj_hash(filp, pos);</div><div class='add'>+		p-&gt;curr_minor_hash = pos2min_hash(filp, pos);</div><div class='add'>+		p-&gt;initialized = true;</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void ext4_htree_free_dir_info(struct dir_private_info *p)</div><div class='hunk'>@@ -465,14 +474,13 @@ int ext4_htree_store_dirent(struct file *dir_file, __u32 hash,</div><div class='ctx'> 	struct rb_node **p, *parent = NULL;</div><div class='ctx'> 	struct fname *fname, *new_fn;</div><div class='ctx'> 	struct dir_private_info *info;</div><div class='del'>-	int len;</div><div class='ctx'> </div><div class='ctx'> 	info = dir_file-&gt;private_data;</div><div class='ctx'> 	p = &amp;info-&gt;root.rb_node;</div><div class='ctx'> </div><div class='ctx'> 	/* Create and allocate the fname structure */</div><div class='del'>-	len = sizeof(struct fname) + ent_name-&gt;len + 1;</div><div class='del'>-	new_fn = kzalloc(len, GFP_KERNEL);</div><div class='add'>+	new_fn = kzalloc(struct_size(new_fn, name, ent_name-&gt;len + 1),</div><div class='add'>+			 GFP_KERNEL);</div><div class='ctx'> 	if (!new_fn)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	new_fn-&gt;hash = hash;</div><div class='hunk'>@@ -516,7 +524,7 @@ int ext4_htree_store_dirent(struct file *dir_file, __u32 hash,</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * This is a helper function for ext4_dx_readdir.  It calls filldir</div><div class='del'>- * for all entres on the fname linked list.  (Normally there is only</div><div class='add'>+ * for all entries on the fname linked list.  (Normally there is only</div><div class='ctx'>  * one entry on the linked list, unless there are 62 bit hash collisions.)</div><div class='ctx'>  */</div><div class='ctx'> static int call_filldir(struct file *file, struct dir_context *ctx,</div><div class='hunk'>@@ -553,12 +561,7 @@ static int ext4_dx_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 	struct fname *fname;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	if (!info) {</div><div class='del'>-		info = ext4_htree_create_dir_info(file, ctx-&gt;pos);</div><div class='del'>-		if (!info)</div><div class='del'>-			return -ENOMEM;</div><div class='del'>-		file-&gt;private_data = info;</div><div class='del'>-	}</div><div class='add'>+	ext4_htree_init_dir_info(file, ctx-&gt;pos);</div><div class='ctx'> </div><div class='ctx'> 	if (ctx-&gt;pos == ext4_get_htree_eof(file))</div><div class='ctx'> 		return 0;	/* EOF */</div><div class='hunk'>@@ -591,10 +594,10 @@ static int ext4_dx_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 		 * cached entries.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if ((!info-&gt;curr_node) ||</div><div class='del'>-		    !inode_eq_iversion(inode, file-&gt;f_version)) {</div><div class='add'>+		    !inode_eq_iversion(inode, info-&gt;cookie)) {</div><div class='ctx'> 			info-&gt;curr_node = NULL;</div><div class='ctx'> 			free_rb_tree_fname(&amp;info-&gt;root);</div><div class='del'>-			file-&gt;f_version = inode_query_iversion(inode);</div><div class='add'>+			info-&gt;cookie = inode_query_iversion(inode);</div><div class='ctx'> 			ret = ext4_htree_fill_tree(file, info-&gt;curr_hash,</div><div class='ctx'> 						   info-&gt;curr_minor_hash,</div><div class='ctx'> 						   &amp;info-&gt;next_hash);</div><div class='hunk'>@@ -649,7 +652,7 @@ int ext4_check_all_de(struct inode *dir, struct buffer_head *bh, void *buf,</div><div class='ctx'> 	unsigned int offset = 0;</div><div class='ctx'> 	char *top;</div><div class='ctx'> </div><div class='del'>-	de = (struct ext4_dir_entry_2 *)buf;</div><div class='add'>+	de = buf;</div><div class='ctx'> 	top = buf + buf_size;</div><div class='ctx'> 	while ((char *) de &lt; top) {</div><div class='ctx'> 		if (ext4_check_dir_entry(dir, NULL, de, bh,</div><div class='hunk'>@@ -665,7 +668,19 @@ int ext4_check_all_de(struct inode *dir, struct buffer_head *bh, void *buf,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int ext4_dir_open(struct inode *inode, struct file *file)</div><div class='add'>+{</div><div class='add'>+	struct dir_private_info *info;</div><div class='add'>+</div><div class='add'>+	info = kzalloc(sizeof(*info), GFP_KERNEL);</div><div class='add'>+	if (!info)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	file-&gt;private_data = info;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> const struct file_operations ext4_dir_operations = {</div><div class='add'>+	.open		= ext4_dir_open,</div><div class='ctx'> 	.llseek		= ext4_dir_llseek,</div><div class='ctx'> 	.read		= generic_read_dir,</div><div class='ctx'> 	.iterate_shared	= ext4_readdir,</div><div class='head'>diff --git a/fs/ext4/ext4.h b/fs/ext4/ext4.h<br/>index 404dd50856e5..56112f201cac 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/ext4.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/ext4.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/ext4.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/ext4.h</a></div><div class='hunk'>@@ -33,13 +33,14 @@</div><div class='ctx'> #include &lt;linux/blockgroup_lock.h&gt;</div><div class='ctx'> #include &lt;linux/percpu_counter.h&gt;</div><div class='ctx'> #include &lt;linux/ratelimit.h&gt;</div><div class='del'>-#include &lt;crypto/hash.h&gt;</div><div class='add'>+#include &lt;linux/crc32c.h&gt;</div><div class='ctx'> #include &lt;linux/falloc.h&gt;</div><div class='ctx'> #include &lt;linux/percpu-rwsem.h&gt;</div><div class='ctx'> #include &lt;linux/fiemap.h&gt;</div><div class='ctx'> #ifdef __KERNEL__</div><div class='ctx'> #include &lt;linux/compat.h&gt;</div><div class='ctx'> #endif</div><div class='add'>+#include &lt;uapi/linux/ext4.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/fscrypt.h&gt;</div><div class='ctx'> #include &lt;linux/fsverity.h&gt;</div><div class='hunk'>@@ -127,6 +128,55 @@ enum SHIFT_DIRECTION {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * For each criteria, mballoc has slightly different way of finding</div><div class='add'>+ * the required blocks nad usually, higher the criteria the slower the</div><div class='add'>+ * allocation.  We start at lower criterias and keep falling back to</div><div class='add'>+ * higher ones if we are not able to find any blocks.  Lower (earlier)</div><div class='add'>+ * criteria are faster.</div><div class='add'>+ */</div><div class='add'>+enum criteria {</div><div class='add'>+	/*</div><div class='add'>+	 * Used when number of blocks needed is a power of 2. This</div><div class='add'>+	 * doesn't trigger any disk IO except prefetch and is the</div><div class='add'>+	 * fastest criteria.</div><div class='add'>+	 */</div><div class='add'>+	CR_POWER2_ALIGNED,</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Tries to lookup in-memory data structures to find the most</div><div class='add'>+	 * suitable group that satisfies goal request. No disk IO</div><div class='add'>+	 * except block prefetch.</div><div class='add'>+	 */</div><div class='add'>+	CR_GOAL_LEN_FAST,</div><div class='add'>+</div><div class='add'>+        /*</div><div class='add'>+	 * Same as CR_GOAL_LEN_FAST but is allowed to reduce the goal</div><div class='add'>+         * length to the best available length for faster allocation.</div><div class='add'>+	 */</div><div class='add'>+	CR_BEST_AVAIL_LEN,</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Reads each block group sequentially, performing disk IO if</div><div class='add'>+	 * necessary, to find suitable block group. Tries to</div><div class='add'>+	 * allocate goal length but might trim the request if nothing</div><div class='add'>+	 * is found after enough tries.</div><div class='add'>+	 */</div><div class='add'>+	CR_GOAL_LEN_SLOW,</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Finds the first free set of blocks and allocates</div><div class='add'>+	 * those. This is only used in rare cases when</div><div class='add'>+	 * CR_GOAL_LEN_SLOW also fails to allocate anything.</div><div class='add'>+	 */</div><div class='add'>+	CR_ANY_FREE,</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Number of criterias defined.</div><div class='add'>+	 */</div><div class='add'>+	EXT4_MB_NUM_CRS</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * Flags used in mballoc's allocation_context flags field.</div><div class='ctx'>  *</div><div class='ctx'>  * Also used to show what's going on for debugging purposes when the</div><div class='hunk'>@@ -135,14 +185,8 @@ enum SHIFT_DIRECTION {</div><div class='ctx'> </div><div class='ctx'> /* prefer goal again. length */</div><div class='ctx'> #define EXT4_MB_HINT_MERGE		0x0001</div><div class='del'>-/* blocks already reserved */</div><div class='del'>-#define EXT4_MB_HINT_RESERVED		0x0002</div><div class='del'>-/* metadata is being allocated */</div><div class='del'>-#define EXT4_MB_HINT_METADATA		0x0004</div><div class='ctx'> /* first blocks in the file */</div><div class='ctx'> #define EXT4_MB_HINT_FIRST		0x0008</div><div class='del'>-/* search for the best chunk */</div><div class='del'>-#define EXT4_MB_HINT_BEST		0x0010</div><div class='ctx'> /* data is being allocated */</div><div class='ctx'> #define EXT4_MB_HINT_DATA		0x0020</div><div class='ctx'> /* don't preallocate (for tails) */</div><div class='hunk'>@@ -163,12 +207,7 @@ enum SHIFT_DIRECTION {</div><div class='ctx'> #define EXT4_MB_USE_RESERVED		0x2000</div><div class='ctx'> /* Do strict check for free blocks while retrying block allocation */</div><div class='ctx'> #define EXT4_MB_STRICT_CHECK		0x4000</div><div class='del'>-/* Large fragment size list lookup succeeded at least once for cr = 0 */</div><div class='del'>-#define EXT4_MB_CR0_OPTIMIZED		0x8000</div><div class='del'>-/* Avg fragment size rb tree lookup succeeded at least once for cr = 1 */</div><div class='del'>-#define EXT4_MB_CR1_OPTIMIZED		0x00010000</div><div class='del'>-/* Perform linear traversal for one group */</div><div class='del'>-#define EXT4_MB_SEARCH_NEXT_LINEAR	0x00020000</div><div class='add'>+</div><div class='ctx'> struct ext4_allocation_request {</div><div class='ctx'> 	/* target inode for block we're allocating */</div><div class='ctx'> 	struct inode *inode;</div><div class='hunk'>@@ -201,14 +240,27 @@ struct ext4_allocation_request {</div><div class='ctx'> #define EXT4_MAP_MAPPED		BIT(BH_Mapped)</div><div class='ctx'> #define EXT4_MAP_UNWRITTEN	BIT(BH_Unwritten)</div><div class='ctx'> #define EXT4_MAP_BOUNDARY	BIT(BH_Boundary)</div><div class='add'>+#define EXT4_MAP_DELAYED	BIT(BH_Delay)</div><div class='add'>+/*</div><div class='add'>+ * This is for use in ext4_map_query_blocks() for a special case where we can</div><div class='add'>+ * have a physically and logically contiguous blocks split across two leaf</div><div class='add'>+ * nodes instead of a single extent. This is required in case of atomic writes</div><div class='add'>+ * to know whether the returned extent is last in leaf. If yes, then lookup for</div><div class='add'>+ * next in leaf block in ext4_map_query_blocks_next_in_leaf().</div><div class='add'>+ * - This is never going to be added to any buffer head state.</div><div class='add'>+ * - We use the next available bit after BH_BITMAP_UPTODATE.</div><div class='add'>+ */</div><div class='add'>+#define EXT4_MAP_QUERY_LAST_IN_LEAF	BIT(BH_BITMAP_UPTODATE + 1)</div><div class='ctx'> #define EXT4_MAP_FLAGS		(EXT4_MAP_NEW | EXT4_MAP_MAPPED |\</div><div class='del'>-				 EXT4_MAP_UNWRITTEN | EXT4_MAP_BOUNDARY)</div><div class='add'>+				 EXT4_MAP_UNWRITTEN | EXT4_MAP_BOUNDARY |\</div><div class='add'>+				 EXT4_MAP_DELAYED | EXT4_MAP_QUERY_LAST_IN_LEAF)</div><div class='ctx'> </div><div class='ctx'> struct ext4_map_blocks {</div><div class='ctx'> 	ext4_fsblk_t m_pblk;</div><div class='ctx'> 	ext4_lblk_t m_lblk;</div><div class='ctx'> 	unsigned int m_len;</div><div class='ctx'> 	unsigned int m_flags;</div><div class='add'>+	u64 m_seq;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -222,7 +274,10 @@ struct ext4_system_blocks {</div><div class='ctx'> /*</div><div class='ctx'>  * Flags for ext4_io_end-&gt;flags</div><div class='ctx'>  */</div><div class='del'>-#define	EXT4_IO_END_UNWRITTEN	0x0001</div><div class='add'>+#define EXT4_IO_END_UNWRITTEN	0x0001</div><div class='add'>+#define EXT4_IO_END_FAILED	0x0002</div><div class='add'>+</div><div class='add'>+#define EXT4_IO_END_DEFER_COMPLETION (EXT4_IO_END_UNWRITTEN | EXT4_IO_END_FAILED)</div><div class='ctx'> </div><div class='ctx'> struct ext4_io_end_vec {</div><div class='ctx'> 	struct list_head list;		/* list of io_end_vec */</div><div class='hunk'>@@ -311,7 +366,16 @@ struct ext4_io_submit {</div><div class='ctx'> #define EXT4_MAX_BLOCKS(size, offset, blkbits) \</div><div class='ctx'> 	((EXT4_BLOCK_ALIGN(size + offset, blkbits) &gt;&gt; blkbits) - (offset &gt;&gt; \</div><div class='ctx'> 								  blkbits))</div><div class='del'>-</div><div class='add'>+#define EXT4_B_TO_LBLK(inode, offset) \</div><div class='add'>+	(round_up((offset), i_blocksize(inode)) &gt;&gt; (inode)-&gt;i_blkbits)</div><div class='add'>+#define EXT4_LBLK_TO_B(inode, lblk) ((loff_t)(lblk) &lt;&lt; (inode)-&gt;i_blkbits)</div><div class='add'>+</div><div class='add'>+/* Translate a block number to a page index */</div><div class='add'>+#define EXT4_LBLK_TO_PG(inode, lblk)	(EXT4_LBLK_TO_B((inode), (lblk)) &gt;&gt; \</div><div class='add'>+					 PAGE_SHIFT)</div><div class='add'>+/* Translate a page index to a block number */</div><div class='add'>+#define EXT4_PG_TO_LBLK(inode, pnum)	(((loff_t)(pnum) &lt;&lt; PAGE_SHIFT) &gt;&gt; \</div><div class='add'>+					 (inode)-&gt;i_blkbits)</div><div class='ctx'> /* Translate a block number to a cluster number */</div><div class='ctx'> #define EXT4_B2C(sbi, blk)	((blk) &gt;&gt; (sbi)-&gt;s_cluster_bits)</div><div class='ctx'> /* Translate a cluster number to a block number */</div><div class='hunk'>@@ -560,7 +624,7 @@ enum {</div><div class='ctx'>  *</div><div class='ctx'>  * It's not paranoia if the Murphy's Law really *is* out to get you.  :-)</div><div class='ctx'>  */</div><div class='del'>-#define TEST_FLAG_VALUE(FLAG) (EXT4_##FLAG##_FL == (1 &lt;&lt; EXT4_INODE_##FLAG))</div><div class='add'>+#define TEST_FLAG_VALUE(FLAG) (EXT4_##FLAG##_FL == (1U &lt;&lt; EXT4_INODE_##FLAG))</div><div class='ctx'> #define CHECK_FLAG_VALUE(FLAG) BUILD_BUG_ON(!TEST_FLAG_VALUE(FLAG))</div><div class='ctx'> </div><div class='ctx'> static inline void ext4_check_flag_values(void)</div><div class='hunk'>@@ -593,17 +657,6 @@ static inline void ext4_check_flag_values(void)</div><div class='ctx'> 	CHECK_FLAG_VALUE(RESERVED);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Used to pass group descriptor data when online resize is done */</div><div class='del'>-struct ext4_new_group_input {</div><div class='del'>-	__u32 group;		/* Group number for this data */</div><div class='del'>-	__u64 block_bitmap;	/* Absolute block number of block bitmap */</div><div class='del'>-	__u64 inode_bitmap;	/* Absolute block number of inode bitmap */</div><div class='del'>-	__u64 inode_table;	/* Absolute block number of inode table start */</div><div class='del'>-	__u32 blocks_count;	/* Total number of blocks in this group */</div><div class='del'>-	__u16 reserved_blocks;	/* Number of reserved blocks in this group */</div><div class='del'>-	__u16 unused;</div><div class='del'>-};</div><div class='del'>-</div><div class='ctx'> #if defined(__KERNEL__) &amp;&amp; defined(CONFIG_COMPAT)</div><div class='ctx'> struct compat_ext4_new_group_input {</div><div class='ctx'> 	u32 group;</div><div class='hunk'>@@ -649,16 +702,22 @@ enum {</div><div class='ctx'> 	/* Caller is from the delayed allocation writeout path</div><div class='ctx'> 	 * finally doing the actual allocation of delayed blocks */</div><div class='ctx'> #define EXT4_GET_BLOCKS_DELALLOC_RESERVE	0x0004</div><div class='del'>-	/* caller is from the direct IO path, request to creation of an</div><div class='del'>-	unwritten extents if not allocated, split the unwritten</div><div class='del'>-	extent if blocks has been preallocated already*/</div><div class='del'>-#define EXT4_GET_BLOCKS_PRE_IO			0x0008</div><div class='del'>-#define EXT4_GET_BLOCKS_CONVERT			0x0010</div><div class='del'>-#define EXT4_GET_BLOCKS_IO_CREATE_EXT		(EXT4_GET_BLOCKS_PRE_IO|\</div><div class='del'>-					 EXT4_GET_BLOCKS_CREATE_UNWRIT_EXT)</div><div class='del'>-	/* Convert extent to initialized after IO complete */</div><div class='del'>-#define EXT4_GET_BLOCKS_IO_CONVERT_EXT		(EXT4_GET_BLOCKS_CONVERT|\</div><div class='add'>+	/*</div><div class='add'>+	 * This means that we cannot merge newly allocated extents, and if we</div><div class='add'>+	 * found an unwritten extent, we need to split it.</div><div class='add'>+	 */</div><div class='add'>+#define EXT4_GET_BLOCKS_SPLIT_NOMERGE		0x0008</div><div class='add'>+	/*</div><div class='add'>+	 * Caller is from the dio or dioread_nolock buffered IO, reqest to</div><div class='add'>+	 * create an unwritten extent if it does not exist or split the</div><div class='add'>+	 * found unwritten extent. Also do not merge the newly created</div><div class='add'>+	 * unwritten extent, io end will convert unwritten to written,</div><div class='add'>+	 * and try to merge the written extent.</div><div class='add'>+	 */</div><div class='add'>+#define EXT4_GET_BLOCKS_IO_CREATE_EXT		(EXT4_GET_BLOCKS_SPLIT_NOMERGE|\</div><div class='ctx'> 					 EXT4_GET_BLOCKS_CREATE_UNWRIT_EXT)</div><div class='add'>+	/* Convert unwritten extent to initialized. */</div><div class='add'>+#define EXT4_GET_BLOCKS_CONVERT			0x0010</div><div class='ctx'> 	/* Eventual metadata allocation (due to growing extent tree)</div><div class='ctx'> 	 * should not fail, so try to use reserved blocks for that.*/</div><div class='ctx'> #define EXT4_GET_BLOCKS_METADATA_NOFAIL		0x0020</div><div class='hunk'>@@ -670,9 +729,23 @@ enum {</div><div class='ctx'> #define EXT4_GET_BLOCKS_ZERO			0x0200</div><div class='ctx'> #define EXT4_GET_BLOCKS_CREATE_ZERO		(EXT4_GET_BLOCKS_CREATE |\</div><div class='ctx'> 					EXT4_GET_BLOCKS_ZERO)</div><div class='del'>-	/* Caller will submit data before dropping transaction handle. This</div><div class='del'>-	 * allows jbd2 to avoid submitting data before commit. */</div><div class='add'>+	/* Caller is in the context of data submission, such as writeback,</div><div class='add'>+	 * fsync, etc. Especially, in the generic writeback path, caller will</div><div class='add'>+	 * submit data before dropping transaction handle. This allows jbd2</div><div class='add'>+	 * to avoid submitting data before commit. */</div><div class='ctx'> #define EXT4_GET_BLOCKS_IO_SUBMIT		0x0400</div><div class='add'>+	/* Convert extent to initialized after IO complete */</div><div class='add'>+#define EXT4_GET_BLOCKS_IO_CONVERT_EXT		(EXT4_GET_BLOCKS_CONVERT |\</div><div class='add'>+					 EXT4_GET_BLOCKS_CREATE_UNWRIT_EXT |\</div><div class='add'>+					 EXT4_GET_BLOCKS_IO_SUBMIT)</div><div class='add'>+	/* Caller is in the atomic contex, find extent if it has been cached */</div><div class='add'>+#define EXT4_GET_BLOCKS_CACHED_NOWAIT		0x0800</div><div class='add'>+/*</div><div class='add'>+ * Atomic write caller needs this to query in the slow path of mixed mapping</div><div class='add'>+ * case, when a contiguous extent can be split across two adjacent leaf nodes.</div><div class='add'>+ * Look EXT4_MAP_QUERY_LAST_IN_LEAF.</div><div class='add'>+ */</div><div class='add'>+#define EXT4_GET_BLOCKS_QUERY_LAST_IN_LEAF	0x1000</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * The bit position of these flags must not overlap with any of the</div><div class='hunk'>@@ -686,6 +759,13 @@ enum {</div><div class='ctx'> #define EXT4_EX_NOCACHE				0x40000000</div><div class='ctx'> #define EXT4_EX_FORCE_CACHE			0x20000000</div><div class='ctx'> #define EXT4_EX_NOFAIL				0x10000000</div><div class='add'>+/*</div><div class='add'>+ * ext4_map_query_blocks() uses this filter mask to filter the flags needed to</div><div class='add'>+ * pass while lookup/querying of on disk extent tree.</div><div class='add'>+ */</div><div class='add'>+#define EXT4_EX_QUERY_FILTER	(EXT4_EX_NOCACHE | EXT4_EX_FORCE_CACHE |\</div><div class='add'>+				 EXT4_EX_NOFAIL |\</div><div class='add'>+				 EXT4_GET_BLOCKS_QUERY_LAST_IN_LEAF)</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Flags used by ext4_free_blocks</div><div class='hunk'>@@ -698,59 +778,6 @@ enum {</div><div class='ctx'> #define EXT4_FREE_BLOCKS_NOFREE_LAST_CLUSTER	0x0020</div><div class='ctx'> #define EXT4_FREE_BLOCKS_RERESERVE_CLUSTER      0x0040</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * ioctl commands</div><div class='del'>- */</div><div class='del'>-#define	EXT4_IOC_GETVERSION		_IOR('f', 3, long)</div><div class='del'>-#define	EXT4_IOC_SETVERSION		_IOW('f', 4, long)</div><div class='del'>-#define	EXT4_IOC_GETVERSION_OLD		FS_IOC_GETVERSION</div><div class='del'>-#define	EXT4_IOC_SETVERSION_OLD		FS_IOC_SETVERSION</div><div class='del'>-#define EXT4_IOC_GETRSVSZ		_IOR('f', 5, long)</div><div class='del'>-#define EXT4_IOC_SETRSVSZ		_IOW('f', 6, long)</div><div class='del'>-#define EXT4_IOC_GROUP_EXTEND		_IOW('f', 7, unsigned long)</div><div class='del'>-#define EXT4_IOC_GROUP_ADD		_IOW('f', 8, struct ext4_new_group_input)</div><div class='del'>-#define EXT4_IOC_MIGRATE		_IO('f', 9)</div><div class='del'>- /* note ioctl 10 reserved for an early version of the FIEMAP ioctl */</div><div class='del'>- /* note ioctl 11 reserved for filesystem-independent FIEMAP ioctl */</div><div class='del'>-#define EXT4_IOC_ALLOC_DA_BLKS		_IO('f', 12)</div><div class='del'>-#define EXT4_IOC_MOVE_EXT		_IOWR('f', 15, struct move_extent)</div><div class='del'>-#define EXT4_IOC_RESIZE_FS		_IOW('f', 16, __u64)</div><div class='del'>-#define EXT4_IOC_SWAP_BOOT		_IO('f', 17)</div><div class='del'>-#define EXT4_IOC_PRECACHE_EXTENTS	_IO('f', 18)</div><div class='del'>-/* ioctl codes 19--39 are reserved for fscrypt */</div><div class='del'>-#define EXT4_IOC_CLEAR_ES_CACHE		_IO('f', 40)</div><div class='del'>-#define EXT4_IOC_GETSTATE		_IOW('f', 41, __u32)</div><div class='del'>-#define EXT4_IOC_GET_ES_CACHE		_IOWR('f', 42, struct fiemap)</div><div class='del'>-#define EXT4_IOC_CHECKPOINT		_IOW('f', 43, __u32)</div><div class='del'>-</div><div class='del'>-#define EXT4_IOC_SHUTDOWN _IOR ('X', 125, __u32)</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Flags for going down operation</div><div class='del'>- */</div><div class='del'>-#define EXT4_GOING_FLAGS_DEFAULT		0x0	/* going down */</div><div class='del'>-#define EXT4_GOING_FLAGS_LOGFLUSH		0x1	/* flush log but not data */</div><div class='del'>-#define EXT4_GOING_FLAGS_NOLOGFLUSH		0x2	/* don't flush log nor data */</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Flags returned by EXT4_IOC_GETSTATE</div><div class='del'>- *</div><div class='del'>- * We only expose to userspace a subset of the state flags in</div><div class='del'>- * i_state_flags</div><div class='del'>- */</div><div class='del'>-#define EXT4_STATE_FLAG_EXT_PRECACHED	0x00000001</div><div class='del'>-#define EXT4_STATE_FLAG_NEW		0x00000002</div><div class='del'>-#define EXT4_STATE_FLAG_NEWENTRY	0x00000004</div><div class='del'>-#define EXT4_STATE_FLAG_DA_ALLOC_CLOSE	0x00000008</div><div class='del'>-</div><div class='del'>-/* flags for ioctl EXT4_IOC_CHECKPOINT */</div><div class='del'>-#define EXT4_IOC_CHECKPOINT_FLAG_DISCARD	0x1</div><div class='del'>-#define EXT4_IOC_CHECKPOINT_FLAG_ZEROOUT	0x2</div><div class='del'>-#define EXT4_IOC_CHECKPOINT_FLAG_DRY_RUN	0x4</div><div class='del'>-#define EXT4_IOC_CHECKPOINT_FLAG_VALID		(EXT4_IOC_CHECKPOINT_FLAG_DISCARD | \</div><div class='del'>-						EXT4_IOC_CHECKPOINT_FLAG_ZEROOUT | \</div><div class='del'>-						EXT4_IOC_CHECKPOINT_FLAG_DRY_RUN)</div><div class='del'>-</div><div class='ctx'> #if defined(__KERNEL__) &amp;&amp; defined(CONFIG_COMPAT)</div><div class='ctx'> /*</div><div class='ctx'>  * ioctl commands in 32 bit emulation</div><div class='hunk'>@@ -765,12 +792,6 @@ enum {</div><div class='ctx'> #define EXT4_IOC32_SETVERSION_OLD	FS_IOC32_SETVERSION</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Returned by EXT4_IOC_GET_ES_CACHE as an additional possible flag.</div><div class='del'>- * It indicates that the entry in extent status cache is for a hole.</div><div class='del'>- */</div><div class='del'>-#define EXT4_FIEMAP_EXTENT_HOLE		0x08000000</div><div class='del'>-</div><div class='ctx'> /* Max physical block we can address w/o extents */</div><div class='ctx'> #define EXT4_MAX_BLOCK_FILE_PHYS	0xFFFFFFFF</div><div class='ctx'> </div><div class='hunk'>@@ -841,15 +862,6 @@ struct ext4_inode {</div><div class='ctx'> 	__le32	i_projid;	/* Project ID */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-struct move_extent {</div><div class='del'>-	__u32 reserved;		/* should be zero */</div><div class='del'>-	__u32 donor_fd;		/* donor file descriptor */</div><div class='del'>-	__u64 orig_start;	/* logical start offset in block for orig */</div><div class='del'>-	__u64 donor_start;	/* logical start offset in block for donor */</div><div class='del'>-	__u64 len;		/* block length to be moved */</div><div class='del'>-	__u64 moved_len;	/* moved block length */</div><div class='del'>-};</div><div class='del'>-</div><div class='ctx'> #define EXT4_EPOCH_BITS 2</div><div class='ctx'> #define EXT4_EPOCH_MASK ((1 &lt;&lt; EXT4_EPOCH_BITS) - 1)</div><div class='ctx'> #define EXT4_NSEC_MASK  (~0UL &lt;&lt; EXT4_EPOCH_BITS)</div><div class='hunk'>@@ -891,64 +903,80 @@ struct move_extent {</div><div class='ctx'>  * affected filesystem before 2242.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static inline __le32 ext4_encode_extra_time(struct timespec64 *time)</div><div class='add'>+static inline __le32 ext4_encode_extra_time(struct timespec64 ts)</div><div class='ctx'> {</div><div class='del'>-	u32 extra =((time-&gt;tv_sec - (s32)time-&gt;tv_sec) &gt;&gt; 32) &amp; EXT4_EPOCH_MASK;</div><div class='del'>-	return cpu_to_le32(extra | (time-&gt;tv_nsec &lt;&lt; EXT4_EPOCH_BITS));</div><div class='add'>+	u32 extra = ((ts.tv_sec - (s32)ts.tv_sec) &gt;&gt; 32) &amp; EXT4_EPOCH_MASK;</div><div class='add'>+	return cpu_to_le32(extra | (ts.tv_nsec &lt;&lt; EXT4_EPOCH_BITS));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void ext4_decode_extra_time(struct timespec64 *time,</div><div class='del'>-					  __le32 extra)</div><div class='add'>+static inline struct timespec64 ext4_decode_extra_time(__le32 base,</div><div class='add'>+						       __le32 extra)</div><div class='ctx'> {</div><div class='add'>+	struct timespec64 ts = { .tv_sec = (signed)le32_to_cpu(base) };</div><div class='add'>+</div><div class='ctx'> 	if (unlikely(extra &amp; cpu_to_le32(EXT4_EPOCH_MASK)))</div><div class='del'>-		time-&gt;tv_sec += (u64)(le32_to_cpu(extra) &amp; EXT4_EPOCH_MASK) &lt;&lt; 32;</div><div class='del'>-	time-&gt;tv_nsec = (le32_to_cpu(extra) &amp; EXT4_NSEC_MASK) &gt;&gt; EXT4_EPOCH_BITS;</div><div class='add'>+		ts.tv_sec += (u64)(le32_to_cpu(extra) &amp; EXT4_EPOCH_MASK) &lt;&lt; 32;</div><div class='add'>+	ts.tv_nsec = (le32_to_cpu(extra) &amp; EXT4_NSEC_MASK) &gt;&gt; EXT4_EPOCH_BITS;</div><div class='add'>+	return ts;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#define EXT4_INODE_SET_XTIME(xtime, inode, raw_inode)				\</div><div class='add'>+#define EXT4_INODE_SET_XTIME_VAL(xtime, inode, raw_inode, ts)			\</div><div class='ctx'> do {										\</div><div class='del'>-	if (EXT4_FITS_IN_INODE(raw_inode, EXT4_I(inode), xtime ## _extra))     {\</div><div class='del'>-		(raw_inode)-&gt;xtime = cpu_to_le32((inode)-&gt;xtime.tv_sec);	\</div><div class='del'>-		(raw_inode)-&gt;xtime ## _extra =					\</div><div class='del'>-				ext4_encode_extra_time(&amp;(inode)-&gt;xtime);	\</div><div class='del'>-		}								\</div><div class='del'>-	else	\</div><div class='del'>-		(raw_inode)-&gt;xtime = cpu_to_le32(clamp_t(int32_t, (inode)-&gt;xtime.tv_sec, S32_MIN, S32_MAX));	\</div><div class='add'>+	if (EXT4_FITS_IN_INODE(raw_inode, EXT4_I(inode), xtime ## _extra)) {	\</div><div class='add'>+		(raw_inode)-&gt;xtime = cpu_to_le32((ts).tv_sec);			\</div><div class='add'>+		(raw_inode)-&gt;xtime ## _extra = ext4_encode_extra_time(ts);	\</div><div class='add'>+	} else									\</div><div class='add'>+		(raw_inode)-&gt;xtime = cpu_to_le32(clamp_t(int32_t, (ts).tv_sec, S32_MIN, S32_MAX));	\</div><div class='ctx'> } while (0)</div><div class='ctx'> </div><div class='del'>-#define EXT4_EINODE_SET_XTIME(xtime, einode, raw_inode)			       \</div><div class='del'>-do {									       \</div><div class='del'>-	if (EXT4_FITS_IN_INODE(raw_inode, einode, xtime))		       \</div><div class='del'>-		(raw_inode)-&gt;xtime = cpu_to_le32((einode)-&gt;xtime.tv_sec);      \</div><div class='del'>-	if (EXT4_FITS_IN_INODE(raw_inode, einode, xtime ## _extra))	       \</div><div class='del'>-		(raw_inode)-&gt;xtime ## _extra =				       \</div><div class='del'>-				ext4_encode_extra_time(&amp;(einode)-&gt;xtime);      \</div><div class='add'>+#define EXT4_INODE_SET_ATIME(inode, raw_inode)						\</div><div class='add'>+	EXT4_INODE_SET_XTIME_VAL(i_atime, inode, raw_inode, inode_get_atime(inode))</div><div class='add'>+</div><div class='add'>+#define EXT4_INODE_SET_MTIME(inode, raw_inode)						\</div><div class='add'>+	EXT4_INODE_SET_XTIME_VAL(i_mtime, inode, raw_inode, inode_get_mtime(inode))</div><div class='add'>+</div><div class='add'>+#define EXT4_INODE_SET_CTIME(inode, raw_inode)						\</div><div class='add'>+	EXT4_INODE_SET_XTIME_VAL(i_ctime, inode, raw_inode, inode_get_ctime(inode))</div><div class='add'>+</div><div class='add'>+#define EXT4_EINODE_SET_XTIME(xtime, einode, raw_inode)				\</div><div class='add'>+	if (EXT4_FITS_IN_INODE(raw_inode, einode, xtime))			\</div><div class='add'>+		EXT4_INODE_SET_XTIME_VAL(xtime, &amp;((einode)-&gt;vfs_inode),		\</div><div class='add'>+					 raw_inode, (einode)-&gt;xtime)</div><div class='add'>+</div><div class='add'>+#define EXT4_INODE_GET_XTIME_VAL(xtime, inode, raw_inode)			\</div><div class='add'>+	(EXT4_FITS_IN_INODE(raw_inode, EXT4_I(inode), xtime ## _extra) ?	\</div><div class='add'>+		ext4_decode_extra_time((raw_inode)-&gt;xtime,				\</div><div class='add'>+				       (raw_inode)-&gt;xtime ## _extra) :		\</div><div class='add'>+		(struct timespec64) {						\</div><div class='add'>+			.tv_sec = (signed)le32_to_cpu((raw_inode)-&gt;xtime)	\</div><div class='add'>+		})</div><div class='add'>+</div><div class='add'>+#define EXT4_INODE_GET_ATIME(inode, raw_inode)					\</div><div class='add'>+do {										\</div><div class='add'>+	inode_set_atime_to_ts(inode,						\</div><div class='add'>+		EXT4_INODE_GET_XTIME_VAL(i_atime, inode, raw_inode));		\</div><div class='ctx'> } while (0)</div><div class='ctx'> </div><div class='del'>-#define EXT4_INODE_GET_XTIME(xtime, inode, raw_inode)				\</div><div class='add'>+#define EXT4_INODE_GET_MTIME(inode, raw_inode)					\</div><div class='ctx'> do {										\</div><div class='del'>-	(inode)-&gt;xtime.tv_sec = (signed)le32_to_cpu((raw_inode)-&gt;xtime);	\</div><div class='del'>-	if (EXT4_FITS_IN_INODE(raw_inode, EXT4_I(inode), xtime ## _extra)) {	\</div><div class='del'>-		ext4_decode_extra_time(&amp;(inode)-&gt;xtime,				\</div><div class='del'>-				       raw_inode-&gt;xtime ## _extra);		\</div><div class='del'>-		}								\</div><div class='del'>-	else									\</div><div class='del'>-		(inode)-&gt;xtime.tv_nsec = 0;					\</div><div class='add'>+	inode_set_mtime_to_ts(inode,						\</div><div class='add'>+		EXT4_INODE_GET_XTIME_VAL(i_mtime, inode, raw_inode));		\</div><div class='ctx'> } while (0)</div><div class='ctx'> </div><div class='add'>+#define EXT4_INODE_GET_CTIME(inode, raw_inode)					\</div><div class='add'>+do {										\</div><div class='add'>+	inode_set_ctime_to_ts(inode,						\</div><div class='add'>+		EXT4_INODE_GET_XTIME_VAL(i_ctime, inode, raw_inode));		\</div><div class='add'>+} while (0)</div><div class='ctx'> </div><div class='del'>-#define EXT4_EINODE_GET_XTIME(xtime, einode, raw_inode)			       \</div><div class='del'>-do {									       \</div><div class='del'>-	if (EXT4_FITS_IN_INODE(raw_inode, einode, xtime))		       \</div><div class='del'>-		(einode)-&gt;xtime.tv_sec = 				       \</div><div class='del'>-			(signed)le32_to_cpu((raw_inode)-&gt;xtime);	       \</div><div class='del'>-	else								       \</div><div class='del'>-		(einode)-&gt;xtime.tv_sec = 0;				       \</div><div class='del'>-	if (EXT4_FITS_IN_INODE(raw_inode, einode, xtime ## _extra))	       \</div><div class='del'>-		ext4_decode_extra_time(&amp;(einode)-&gt;xtime,		       \</div><div class='del'>-				       raw_inode-&gt;xtime ## _extra);	       \</div><div class='del'>-	else								       \</div><div class='del'>-		(einode)-&gt;xtime.tv_nsec = 0;				       \</div><div class='add'>+#define EXT4_EINODE_GET_XTIME(xtime, einode, raw_inode)				\</div><div class='add'>+do {										\</div><div class='add'>+	if (EXT4_FITS_IN_INODE(raw_inode, einode, xtime)) 			\</div><div class='add'>+		(einode)-&gt;xtime =						\</div><div class='add'>+			EXT4_INODE_GET_XTIME_VAL(xtime, &amp;(einode-&gt;vfs_inode),	\</div><div class='add'>+						 raw_inode);			\</div><div class='add'>+	else									\</div><div class='add'>+		(einode)-&gt;xtime = (struct timespec64){0, 0};			\</div><div class='ctx'> } while (0)</div><div class='ctx'> </div><div class='ctx'> #define i_disk_version osd1.linux1.l_i_version</div><div class='hunk'>@@ -996,11 +1024,13 @@ do {									       \</div><div class='ctx'>  *			  where the second inode has larger inode number</div><div class='ctx'>  *			  than the first</div><div class='ctx'>  *  I_DATA_SEM_QUOTA  - Used for quota inodes only</div><div class='add'>+ *  I_DATA_SEM_EA     - Used for ea_inodes only</div><div class='ctx'>  */</div><div class='ctx'> enum {</div><div class='ctx'> 	I_DATA_SEM_NORMAL = 0,</div><div class='ctx'> 	I_DATA_SEM_OTHER,</div><div class='ctx'> 	I_DATA_SEM_QUOTA,</div><div class='add'>+	I_DATA_SEM_EA</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> </div><div class='hunk'>@@ -1028,7 +1058,7 @@ struct ext4_inode_info {</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Extended attributes can be read independently of the main file</div><div class='del'>-	 * data. Taking i_mutex even when reading would cause contention</div><div class='add'>+	 * data. Taking i_rwsem even when reading would cause contention</div><div class='ctx'> 	 * between readers of EAs and writers of regular file data, so</div><div class='ctx'> 	 * instead we synchronize on xattr_sem when reading or changing</div><div class='ctx'> 	 * EAs.</div><div class='hunk'>@@ -1046,6 +1076,8 @@ struct ext4_inode_info {</div><div class='ctx'> </div><div class='ctx'> 	/* Fast commit related info */</div><div class='ctx'> </div><div class='add'>+	/* For tracking dentry create updates */</div><div class='add'>+	struct list_head i_fc_dilist;</div><div class='ctx'> 	struct list_head i_fc_list;	/*</div><div class='ctx'> 					 * inodes that need fast commit</div><div class='ctx'> 					 * protected by sbi-&gt;s_fc_lock.</div><div class='hunk'>@@ -1057,14 +1089,16 @@ struct ext4_inode_info {</div><div class='ctx'> 	/* End of lblk range that needs to be committed in this fast commit */</div><div class='ctx'> 	ext4_lblk_t i_fc_lblk_len;</div><div class='ctx'> </div><div class='del'>-	/* Number of ongoing updates on this inode */</div><div class='del'>-	atomic_t  i_fc_updates;</div><div class='add'>+	spinlock_t i_raw_lock;	/* protects updates to the raw inode */</div><div class='ctx'> </div><div class='ctx'> 	/* Fast commit wait queue for this inode */</div><div class='ctx'> 	wait_queue_head_t i_fc_wait;</div><div class='ctx'> </div><div class='del'>-	/* Protect concurrent accesses on i_fc_lblk_start, i_fc_lblk_len */</div><div class='del'>-	struct mutex i_fc_lock;</div><div class='add'>+	/*</div><div class='add'>+	 * Protect concurrent accesses on i_fc_lblk_start, i_fc_lblk_len</div><div class='add'>+	 * and inode's EXT4_FC_STATE_COMMITTING state bit.</div><div class='add'>+	 */</div><div class='add'>+	spinlock_t i_fc_lock;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * i_disksize keeps track of what the inode size is ON DISK, not</div><div class='hunk'>@@ -1097,8 +1131,6 @@ struct ext4_inode_info {</div><div class='ctx'> 	struct inode vfs_inode;</div><div class='ctx'> 	struct jbd2_inode *jinode;</div><div class='ctx'> </div><div class='del'>-	spinlock_t i_raw_lock;	/* protects updates to the raw inode */</div><div class='del'>-</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * File creation time. Its function is same as that of</div><div class='ctx'> 	 * struct timespec64 i_{a,c,m}time in the generic inode.</div><div class='hunk'>@@ -1107,8 +1139,12 @@ struct ext4_inode_info {</div><div class='ctx'> </div><div class='ctx'> 	/* mballoc */</div><div class='ctx'> 	atomic_t i_prealloc_active;</div><div class='del'>-	struct list_head i_prealloc_list;</div><div class='del'>-	spinlock_t i_prealloc_lock;</div><div class='add'>+</div><div class='add'>+	/* allocation reservation info for delalloc */</div><div class='add'>+	/* In case of bigalloc, this refer to clusters rather than blocks */</div><div class='add'>+	unsigned int i_reserved_data_blocks;</div><div class='add'>+	struct rb_root i_prealloc_node;</div><div class='add'>+	rwlock_t i_prealloc_lock;</div><div class='ctx'> </div><div class='ctx'> 	/* extents status tree */</div><div class='ctx'> 	struct ext4_es_tree i_es_tree;</div><div class='hunk'>@@ -1119,14 +1155,12 @@ struct ext4_inode_info {</div><div class='ctx'> 	ext4_lblk_t i_es_shrink_lblk;	/* Offset where we start searching for</div><div class='ctx'> 					   extents to shrink. Protected by</div><div class='ctx'> 					   i_es_lock  */</div><div class='add'>+	u64 i_es_seq;			/* Change counter for extents.</div><div class='add'>+					   Protected by i_es_lock */</div><div class='ctx'> </div><div class='ctx'> 	/* ialloc */</div><div class='ctx'> 	ext4_group_t	i_last_alloc_group;</div><div class='ctx'> </div><div class='del'>-	/* allocation reservation info for delalloc */</div><div class='del'>-	/* In case of bigalloc, this refer to clusters rather than blocks */</div><div class='del'>-	unsigned int i_reserved_data_blocks;</div><div class='del'>-</div><div class='ctx'> 	/* pending cluster reservations for bigalloc file systems */</div><div class='ctx'> 	struct ext4_pending_tree i_pending_tree;</div><div class='ctx'> </div><div class='hunk'>@@ -1141,6 +1175,7 @@ struct ext4_inode_info {</div><div class='ctx'> 	/* quota space reservation, managed internally by quota code */</div><div class='ctx'> 	qsize_t i_reserved_quota;</div><div class='ctx'> #endif</div><div class='add'>+	spinlock_t i_block_reservation_lock;</div><div class='ctx'> </div><div class='ctx'> 	/* Lock protecting lists below */</div><div class='ctx'> 	spinlock_t i_completed_io_lock;</div><div class='hunk'>@@ -1150,9 +1185,6 @@ struct ext4_inode_info {</div><div class='ctx'> 	 */</div><div class='ctx'> 	struct list_head i_rsv_conversion_list;</div><div class='ctx'> 	struct work_struct i_rsv_conversion_work;</div><div class='del'>-	atomic_t i_unwritten; /* Nr. of inflight conversions pending */</div><div class='del'>-</div><div class='del'>-	spinlock_t i_block_reservation_lock;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Transactions that contain inode's metadata needed to complete</div><div class='hunk'>@@ -1162,13 +1194,21 @@ struct ext4_inode_info {</div><div class='ctx'> 	tid_t i_datasync_tid;</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='del'>-	struct dquot *i_dquot[MAXQUOTAS];</div><div class='add'>+	struct dquot __rcu *i_dquot[MAXQUOTAS];</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> 	/* Precomputed uuid+inum+igen checksum for seeding inode checksums */</div><div class='ctx'> 	__u32 i_csum_seed;</div><div class='ctx'> </div><div class='ctx'> 	kprojid_t i_projid;</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_FS_ENCRYPTION</div><div class='add'>+	struct fscrypt_inode_info *i_crypt_info;</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_FS_VERITY</div><div class='add'>+	struct fsverity_info *i_verity_info;</div><div class='add'>+#endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1254,6 +1294,7 @@ struct ext4_inode_info {</div><div class='ctx'> #define EXT4_MOUNT2_MB_OPTIMIZE_SCAN	0x00000080 /* Optimize group</div><div class='ctx'> 						    * scanning in mballoc</div><div class='ctx'> 						    */</div><div class='add'>+#define EXT4_MOUNT2_ABORT		0x00000100 /* Abort filesystem */</div><div class='ctx'> </div><div class='ctx'> #define clear_opt(sb, opt)		EXT4_SB(sb)-&gt;s_mount_opt &amp;= \</div><div class='ctx'> 						~EXT4_MOUNT_##opt</div><div class='hunk'>@@ -1271,15 +1312,13 @@ struct ext4_inode_info {</div><div class='ctx'> </div><div class='ctx'> #define ext4_test_and_set_bit		__test_and_set_bit_le</div><div class='ctx'> #define ext4_set_bit			__set_bit_le</div><div class='del'>-#define ext4_set_bit_atomic		ext2_set_bit_atomic</div><div class='ctx'> #define ext4_test_and_clear_bit		__test_and_clear_bit_le</div><div class='ctx'> #define ext4_clear_bit			__clear_bit_le</div><div class='del'>-#define ext4_clear_bit_atomic		ext2_clear_bit_atomic</div><div class='ctx'> #define ext4_test_bit			test_bit_le</div><div class='ctx'> #define ext4_find_next_zero_bit		find_next_zero_bit_le</div><div class='ctx'> #define ext4_find_next_bit		find_next_bit_le</div><div class='ctx'> </div><div class='del'>-extern void ext4_set_bits(void *bm, int cur, int len);</div><div class='add'>+extern void mb_set_bits(void *bm, int cur, int len);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Maximal mount counts between two filesystem checks</div><div class='hunk'>@@ -1298,6 +1337,8 @@ extern void ext4_set_bits(void *bm, int cur, int len);</div><div class='ctx'> /* Metadata checksum algorithm codes */</div><div class='ctx'> #define EXT4_CRC32C_CHKSUM		1</div><div class='ctx'> </div><div class='add'>+#define EXT4_LABEL_MAX			16</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Structure of the super block</div><div class='ctx'>  */</div><div class='hunk'>@@ -1347,7 +1388,7 @@ struct ext4_super_block {</div><div class='ctx'> /*60*/	__le32	s_feature_incompat;	/* incompatible feature set */</div><div class='ctx'> 	__le32	s_feature_ro_compat;	/* readonly-compatible feature set */</div><div class='ctx'> /*68*/	__u8	s_uuid[16];		/* 128-bit uuid for volume */</div><div class='del'>-/*78*/	char	s_volume_name[16];	/* volume name */</div><div class='add'>+/*78*/	char	s_volume_name[EXT4_LABEL_MAX] __nonstring; /* volume name */</div><div class='ctx'> /*88*/	char	s_last_mounted[64] __nonstring;	/* directory where last mounted */</div><div class='ctx'> /*C8*/	__le32	s_algorithm_usage_bitmap; /* For compression */</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1372,7 +1413,7 @@ struct ext4_super_block {</div><div class='ctx'> 	__le32	s_first_meta_bg;	/* First metablock block group */</div><div class='ctx'> 	__le32	s_mkfs_time;		/* When the filesystem was created */</div><div class='ctx'> 	__le32	s_jnl_blocks[17];	/* Backup of the journal inode */</div><div class='del'>-	/* 64bit support valid if EXT4_FEATURE_COMPAT_64BIT */</div><div class='add'>+	/* 64bit support valid if EXT4_FEATURE_INCOMPAT_64BIT */</div><div class='ctx'> /*150*/	__le32	s_blocks_count_hi;	/* Blocks count */</div><div class='ctx'> 	__le32	s_r_blocks_count_hi;	/* Reserved blocks count */</div><div class='ctx'> 	__le32	s_free_blocks_count_hi;	/* Free blocks count */</div><div class='hunk'>@@ -1428,7 +1469,9 @@ struct ext4_super_block {</div><div class='ctx'> 	__le16  s_encoding;		/* Filename charset encoding */</div><div class='ctx'> 	__le16  s_encoding_flags;	/* Filename charset encoding flags */</div><div class='ctx'> 	__le32  s_orphan_file_inum;	/* Inode for tracking orphan inodes */</div><div class='del'>-	__le32	s_reserved[94];		/* Padding to the end of the block */</div><div class='add'>+	__le16	s_def_resuid_hi;</div><div class='add'>+	__le16	s_def_resgid_hi;</div><div class='add'>+	__le32	s_reserved[93];		/* Padding to the end of the block */</div><div class='ctx'> 	__le32	s_checksum;		/* crc32c(superblock) */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -1436,12 +1479,6 @@ struct ext4_super_block {</div><div class='ctx'> </div><div class='ctx'> #ifdef __KERNEL__</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_FS_ENCRYPTION</div><div class='del'>-#define DUMMY_ENCRYPTION_ENABLED(sbi) ((sbi)-&gt;s_dummy_enc_policy.policy != NULL)</div><div class='del'>-#else</div><div class='del'>-#define DUMMY_ENCRYPTION_ENABLED(sbi) (0)</div><div class='del'>-#endif</div><div class='del'>-</div><div class='ctx'> /* Number of quota types we support */</div><div class='ctx'> #define EXT4_MAXQUOTAS 3</div><div class='ctx'> </div><div class='hunk'>@@ -1515,11 +1552,13 @@ struct ext4_sb_info {</div><div class='ctx'> 	loff_t s_bitmap_maxbytes;	/* max bytes for bitmap files */</div><div class='ctx'> 	struct buffer_head * s_sbh;	/* Buffer containing the super block */</div><div class='ctx'> 	struct ext4_super_block *s_es;	/* Pointer to the super block in the buffer */</div><div class='add'>+	/* Array of bh's for the block group descriptors */</div><div class='ctx'> 	struct buffer_head * __rcu *s_group_desc;</div><div class='ctx'> 	unsigned int s_mount_opt;</div><div class='ctx'> 	unsigned int s_mount_opt2;</div><div class='ctx'> 	unsigned long s_mount_flags;</div><div class='ctx'> 	unsigned int s_def_mount_opt;</div><div class='add'>+	unsigned int s_def_mount_opt2;</div><div class='ctx'> 	ext4_fsblk_t s_sb_block;</div><div class='ctx'> 	atomic64_t s_resv_clusters;</div><div class='ctx'> 	kuid_t s_resuid;</div><div class='hunk'>@@ -1557,7 +1596,7 @@ struct ext4_sb_info {</div><div class='ctx'> 	unsigned long s_commit_interval;</div><div class='ctx'> 	u32 s_max_batch_time;</div><div class='ctx'> 	u32 s_min_batch_time;</div><div class='del'>-	struct block_device *s_journal_bdev;</div><div class='add'>+	struct file *s_journal_bdev_file;</div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='ctx'> 	/* Names of quota files with journalled quota */</div><div class='ctx'> 	char __rcu *s_qf_names[EXT4_MAXQUOTAS];</div><div class='hunk'>@@ -1583,16 +1622,14 @@ struct ext4_sb_info {</div><div class='ctx'> 	unsigned short *s_mb_offsets;</div><div class='ctx'> 	unsigned int *s_mb_maxs;</div><div class='ctx'> 	unsigned int s_group_info_size;</div><div class='del'>-	unsigned int s_mb_free_pending;</div><div class='del'>-	struct list_head s_freed_data_list;	/* List of blocks to be freed</div><div class='add'>+	atomic_t s_mb_free_pending;</div><div class='add'>+	struct list_head s_freed_data_list[2];	/* List of blocks to be freed</div><div class='ctx'> 						   after commit completed */</div><div class='ctx'> 	struct list_head s_discard_list;</div><div class='ctx'> 	struct work_struct s_discard_work;</div><div class='ctx'> 	atomic_t s_retry_alloc_pending;</div><div class='del'>-	struct rb_root s_mb_avg_fragment_size_root;</div><div class='del'>-	rwlock_t s_mb_rb_lock;</div><div class='del'>-	struct list_head *s_mb_largest_free_orders;</div><div class='del'>-	rwlock_t *s_mb_largest_free_orders_locks;</div><div class='add'>+	struct xarray *s_mb_avg_fragment_size;</div><div class='add'>+	struct xarray *s_mb_largest_free_orders;</div><div class='ctx'> </div><div class='ctx'> 	/* tunables */</div><div class='ctx'> 	unsigned long s_stripe;</div><div class='hunk'>@@ -1603,28 +1640,32 @@ struct ext4_sb_info {</div><div class='ctx'> 	unsigned int s_mb_stats;</div><div class='ctx'> 	unsigned int s_mb_order2_reqs;</div><div class='ctx'> 	unsigned int s_mb_group_prealloc;</div><div class='del'>-	unsigned int s_mb_max_inode_prealloc;</div><div class='ctx'> 	unsigned int s_max_dir_size_kb;</div><div class='del'>-	/* where last allocation was done - for stream allocation */</div><div class='del'>-	unsigned long s_mb_last_group;</div><div class='del'>-	unsigned long s_mb_last_start;</div><div class='ctx'> 	unsigned int s_mb_prefetch;</div><div class='ctx'> 	unsigned int s_mb_prefetch_limit;</div><div class='add'>+	unsigned int s_mb_best_avail_max_trim_order;</div><div class='add'>+	unsigned int s_sb_update_sec;</div><div class='add'>+	unsigned int s_sb_update_kb;</div><div class='add'>+</div><div class='add'>+	/* where last allocation was done - for stream allocation */</div><div class='add'>+	ext4_group_t *s_mb_last_groups;</div><div class='add'>+	unsigned int s_mb_nr_global_goals;</div><div class='ctx'> </div><div class='ctx'> 	/* stats for buddy allocator */</div><div class='ctx'> 	atomic_t s_bal_reqs;	/* number of reqs with len &gt; 1 */</div><div class='ctx'> 	atomic_t s_bal_success;	/* we found long enough chunks */</div><div class='ctx'> 	atomic_t s_bal_allocated;	/* in blocks */</div><div class='ctx'> 	atomic_t s_bal_ex_scanned;	/* total extents scanned */</div><div class='add'>+	atomic_t s_bal_cX_ex_scanned[EXT4_MB_NUM_CRS];	/* total extents scanned */</div><div class='ctx'> 	atomic_t s_bal_groups_scanned;	/* number of groups scanned */</div><div class='ctx'> 	atomic_t s_bal_goals;	/* goal hits */</div><div class='add'>+	atomic_t s_bal_stream_goals;	/* stream allocation global goal hits */</div><div class='add'>+	atomic_t s_bal_len_goals;	/* len goal hits */</div><div class='ctx'> 	atomic_t s_bal_breaks;	/* too long searches */</div><div class='ctx'> 	atomic_t s_bal_2orders;	/* 2^order hits */</div><div class='del'>-	atomic_t s_bal_cr0_bad_suggestions;</div><div class='del'>-	atomic_t s_bal_cr1_bad_suggestions;</div><div class='del'>-	atomic64_t s_bal_cX_groups_considered[4];</div><div class='del'>-	atomic64_t s_bal_cX_hits[4];</div><div class='del'>-	atomic64_t s_bal_cX_failed[4];		/* cX loop didn't find blocks */</div><div class='add'>+	atomic64_t s_bal_cX_groups_considered[EXT4_MB_NUM_CRS];</div><div class='add'>+	atomic64_t s_bal_cX_hits[EXT4_MB_NUM_CRS];</div><div class='add'>+	atomic64_t s_bal_cX_failed[EXT4_MB_NUM_CRS];		/* cX loop didn't find blocks */</div><div class='ctx'> 	atomic_t s_mb_buddies_generated;	/* number of buddies generated */</div><div class='ctx'> 	atomic64_t s_mb_generation_time;</div><div class='ctx'> 	atomic_t s_mb_lost_chunks;</div><div class='hunk'>@@ -1661,16 +1702,18 @@ struct ext4_sb_info {</div><div class='ctx'> 	struct task_struct *s_mmp_tsk;</div><div class='ctx'> </div><div class='ctx'> 	/* record the last minlen when FITRIM is called. */</div><div class='del'>-	atomic_t s_last_trim_minblks;</div><div class='add'>+	unsigned long s_last_trim_minblks;</div><div class='ctx'> </div><div class='del'>-	/* Reference to checksum algorithm driver via cryptoapi */</div><div class='del'>-	struct crypto_shash *s_chksum_driver;</div><div class='add'>+	/* minimum folio order of a page cache allocation */</div><div class='add'>+	u16 s_min_folio_order;</div><div class='add'>+	/* supported maximum folio order, 0 means not supported */</div><div class='add'>+	u16 s_max_folio_order;</div><div class='ctx'> </div><div class='ctx'> 	/* Precomputed FS UUID checksum for seeding other checksums */</div><div class='ctx'> 	__u32 s_csum_seed;</div><div class='ctx'> </div><div class='ctx'> 	/* Reclaim extents from extent status tree */</div><div class='del'>-	struct shrinker s_es_shrinker;</div><div class='add'>+	struct shrinker *s_es_shrinker;</div><div class='ctx'> 	struct list_head s_es_list;	/* List of inodes with reclaimable extents */</div><div class='ctx'> 	long s_es_nr_inode;</div><div class='ctx'> 	struct ext4_es_stats s_es_stats;</div><div class='hunk'>@@ -1693,10 +1736,12 @@ struct ext4_sb_info {</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Barrier between writepages ops and changing any inode's JOURNAL_DATA</div><div class='del'>-	 * or EXTENTS flag.</div><div class='add'>+	 * or EXTENTS flag or between writepages ops and changing DELALLOC or</div><div class='add'>+	 * DIOREAD_NOLOCK mount options on remount.</div><div class='ctx'> 	 */</div><div class='ctx'> 	struct percpu_rw_semaphore s_writepages_rwsem;</div><div class='ctx'> 	struct dax_device *s_daxdev;</div><div class='add'>+	u64 s_dax_part_off;</div><div class='ctx'> #ifdef CONFIG_EXT4_DEBUG</div><div class='ctx'> 	unsigned long s_simulate_fail;</div><div class='ctx'> #endif</div><div class='hunk'>@@ -1720,14 +1765,21 @@ struct ext4_sb_info {</div><div class='ctx'> 	const char *s_last_error_func;</div><div class='ctx'> 	time64_t s_last_error_time;</div><div class='ctx'> 	/*</div><div class='del'>-	 * If we are in a context where we cannot update error information in</div><div class='del'>-	 * the on-disk superblock, we queue this work to do it.</div><div class='add'>+	 * If we are in a context where we cannot update the on-disk</div><div class='add'>+	 * superblock, we queue the work here.  This is used to update</div><div class='add'>+	 * the error information in the superblock, and for periodic</div><div class='add'>+	 * updates of the superblock called from the commit callback</div><div class='add'>+	 * function.</div><div class='ctx'> 	 */</div><div class='del'>-	struct work_struct s_error_work;</div><div class='add'>+	struct work_struct s_sb_upd_work;</div><div class='ctx'> </div><div class='del'>-	/* Ext4 fast commit stuff */</div><div class='add'>+	/* Atomic write unit values in bytes */</div><div class='add'>+	unsigned int s_awu_min;</div><div class='add'>+	unsigned int s_awu_max;</div><div class='add'>+</div><div class='add'>+	/* Ext4 fast commit sub transaction ID */</div><div class='ctx'> 	atomic_t s_fc_subtid;</div><div class='del'>-	atomic_t s_fc_ineligible_updates;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * After commit starts, the main queue gets locked, and the further</div><div class='ctx'> 	 * updates get added in the staging queue.</div><div class='hunk'>@@ -1744,10 +1796,10 @@ struct ext4_sb_info {</div><div class='ctx'> 	 * following fields:</div><div class='ctx'> 	 * ei-&gt;i_fc_list, s_fc_dentry_q, s_fc_q, s_fc_bytes, s_fc_bh.</div><div class='ctx'> 	 */</div><div class='del'>-	spinlock_t s_fc_lock;</div><div class='add'>+	struct mutex s_fc_lock;</div><div class='ctx'> 	struct buffer_head *s_fc_bh;</div><div class='ctx'> 	struct ext4_fc_stats s_fc_stats;</div><div class='del'>-	u64 s_fc_avg_commit_time;</div><div class='add'>+	tid_t s_fc_ineligible_tid;</div><div class='ctx'> #ifdef CONFIG_EXT4_DEBUG</div><div class='ctx'> 	int s_fc_debug_max_replay;</div><div class='ctx'> #endif</div><div class='hunk'>@@ -1763,6 +1815,30 @@ static inline struct ext4_inode_info *EXT4_I(struct inode *inode)</div><div class='ctx'> 	return container_of(inode, struct ext4_inode_info, vfs_inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline int ext4_writepages_down_read(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	percpu_down_read(&amp;EXT4_SB(sb)-&gt;s_writepages_rwsem);</div><div class='add'>+	return memalloc_nofs_save();</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void ext4_writepages_up_read(struct super_block *sb, int ctx)</div><div class='add'>+{</div><div class='add'>+	memalloc_nofs_restore(ctx);</div><div class='add'>+	percpu_up_read(&amp;EXT4_SB(sb)-&gt;s_writepages_rwsem);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int ext4_writepages_down_write(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	percpu_down_write(&amp;EXT4_SB(sb)-&gt;s_writepages_rwsem);</div><div class='add'>+	return memalloc_nofs_save();</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void ext4_writepages_up_write(struct super_block *sb, int ctx)</div><div class='add'>+{</div><div class='add'>+	memalloc_nofs_restore(ctx);</div><div class='add'>+	percpu_up_write(&amp;EXT4_SB(sb)-&gt;s_writepages_rwsem);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline int ext4_valid_inum(struct super_block *sb, unsigned long ino)</div><div class='ctx'> {</div><div class='ctx'> 	return ino == EXT4_ROOT_INO ||</div><div class='hunk'>@@ -1770,6 +1846,18 @@ static inline int ext4_valid_inum(struct super_block *sb, unsigned long ino)</div><div class='ctx'> 		 ino &lt;= le32_to_cpu(EXT4_SB(sb)-&gt;s_es-&gt;s_inodes_count));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline int ext4_get_resuid(struct ext4_super_block *es)</div><div class='add'>+{</div><div class='add'>+	return le16_to_cpu(es-&gt;s_def_resuid) |</div><div class='add'>+		le16_to_cpu(es-&gt;s_def_resuid_hi) &lt;&lt; 16;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int ext4_get_resgid(struct ext4_super_block *es)</div><div class='add'>+{</div><div class='add'>+	return le16_to_cpu(es-&gt;s_def_resgid) |</div><div class='add'>+		le16_to_cpu(es-&gt;s_def_resgid_hi) &lt;&lt; 16;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Returns: sbi-&gt;field[index]</div><div class='ctx'>  * Used to access an array element from the following sbi fields which require</div><div class='hunk'>@@ -1792,11 +1880,8 @@ static inline int ext4_valid_inum(struct super_block *sb, unsigned long ino)</div><div class='ctx'>  */</div><div class='ctx'> enum {</div><div class='ctx'> 	EXT4_MF_MNTDIR_SAMPLED,</div><div class='del'>-	EXT4_MF_FS_ABORTED,	/* Fatal error detected */</div><div class='ctx'> 	EXT4_MF_FC_INELIGIBLE,	/* Fast commit ineligible */</div><div class='del'>-	EXT4_MF_FC_COMMITTING	/* File system underoing a fast</div><div class='del'>-				 * commit.</div><div class='del'>-				 */</div><div class='add'>+	EXT4_MF_JOURNAL_DESTROY	/* Journal is in process of destroying */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static inline void ext4_set_mount_flag(struct super_block *sb, int bit)</div><div class='hunk'>@@ -1841,14 +1926,6 @@ static inline bool ext4_simulate_fail(struct super_block *sb,</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void ext4_simulate_fail_bh(struct super_block *sb,</div><div class='del'>-					 struct buffer_head *bh,</div><div class='del'>-					 unsigned long code)</div><div class='del'>-{</div><div class='del'>-	if (!IS_ERR(bh) &amp;&amp; ext4_simulate_fail(sb, code))</div><div class='del'>-		clear_buffer_uptodate(bh);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Error number codes for s_{first,last}_error_errno</div><div class='ctx'>  *</div><div class='hunk'>@@ -1879,7 +1956,6 @@ static inline void ext4_simulate_fail_bh(struct super_block *sb,</div><div class='ctx'>  * Inode dynamic state flags</div><div class='ctx'>  */</div><div class='ctx'> enum {</div><div class='del'>-	EXT4_STATE_JDATA,		/* journaled data exists */</div><div class='ctx'> 	EXT4_STATE_NEW,			/* inode is newly created */</div><div class='ctx'> 	EXT4_STATE_XATTR,		/* has in-inode xattrs */</div><div class='ctx'> 	EXT4_STATE_NO_EXPAND,		/* No space for expansion */</div><div class='hunk'>@@ -1891,6 +1967,7 @@ enum {</div><div class='ctx'> 	EXT4_STATE_LUSTRE_EA_INODE,	/* Lustre-style ea_inode */</div><div class='ctx'> 	EXT4_STATE_VERITY_IN_PROGRESS,	/* building fs-verity Merkle tree */</div><div class='ctx'> 	EXT4_STATE_FC_COMMITTING,	/* Fast commit ongoing */</div><div class='add'>+	EXT4_STATE_FC_FLUSHING_DATA,	/* Fast commit flushing data */</div><div class='ctx'> 	EXT4_STATE_ORPHAN_FILE,		/* Inode orphaned in orphan file */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -1951,6 +2028,16 @@ static inline bool ext4_verity_in_progress(struct inode *inode)</div><div class='ctx'> #define NEXT_ORPHAN(inode) EXT4_I(inode)-&gt;i_dtime</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * Check whether the inode is tracked as orphan (either in orphan file or</div><div class='add'>+ * orphan list).</div><div class='add'>+ */</div><div class='add'>+static inline bool ext4_inode_orphan_tracked(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	return ext4_test_inode_state(inode, EXT4_STATE_ORPHAN_FILE) ||</div><div class='add'>+		!list_empty(&amp;EXT4_I(inode)-&gt;i_orphan);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * Codes for operating systems</div><div class='ctx'>  */</div><div class='ctx'> #define EXT4_OS_LINUX		0</div><div class='hunk'>@@ -2216,13 +2303,30 @@ extern int ext4_feature_set_ok(struct super_block *sb, int readonly);</div><div class='ctx'> /*</div><div class='ctx'>  * Superblock flags</div><div class='ctx'>  */</div><div class='del'>-#define EXT4_FLAGS_RESIZING	0</div><div class='del'>-#define EXT4_FLAGS_SHUTDOWN	1</div><div class='del'>-#define EXT4_FLAGS_BDEV_IS_DAX	2</div><div class='add'>+enum {</div><div class='add'>+	EXT4_FLAGS_RESIZING,	/* Avoid superblock update and resize race */</div><div class='add'>+	EXT4_FLAGS_SHUTDOWN,	/* Prevent access to the file system */</div><div class='add'>+	EXT4_FLAGS_BDEV_IS_DAX,	/* Current block device support DAX */</div><div class='add'>+	EXT4_FLAGS_EMERGENCY_RO,/* Emergency read-only due to fs errors */</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static inline int ext4_forced_shutdown(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	return test_bit(EXT4_FLAGS_SHUTDOWN, &amp;EXT4_SB(sb)-&gt;s_ext4_flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int ext4_emergency_ro(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	return test_bit(EXT4_FLAGS_EMERGENCY_RO, &amp;EXT4_SB(sb)-&gt;s_ext4_flags);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-static inline int ext4_forced_shutdown(struct ext4_sb_info *sbi)</div><div class='add'>+static inline int ext4_emergency_state(struct super_block *sb)</div><div class='ctx'> {</div><div class='del'>-	return test_bit(EXT4_FLAGS_SHUTDOWN, &amp;sbi-&gt;s_ext4_flags);</div><div class='add'>+	if (unlikely(ext4_forced_shutdown(sb)))</div><div class='add'>+		return -EIO;</div><div class='add'>+	if (unlikely(ext4_emergency_ro(sb)))</div><div class='add'>+		return -EROFS;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2256,10 +2360,19 @@ static inline int ext4_forced_shutdown(struct ext4_sb_info *sbi)</div><div class='ctx'> #define EXT4_DEFM_NODELALLOC	0x0800</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Default journal batch times</div><div class='add'>+ * Default journal batch times and ioprio.</div><div class='ctx'>  */</div><div class='ctx'> #define EXT4_DEF_MIN_BATCH_TIME	0</div><div class='ctx'> #define EXT4_DEF_MAX_BATCH_TIME	15000 /* 15ms */</div><div class='add'>+#define EXT4_DEF_JOURNAL_IOPRIO (IOPRIO_PRIO_VALUE(IOPRIO_CLASS_BE, 3))</div><div class='add'>+</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Default values for superblock update</div><div class='add'>+ */</div><div class='add'>+#define EXT4_DEF_SB_UPDATE_INTERVAL_SEC (3600) /* seconds (1 hour) */</div><div class='add'>+#define EXT4_DEF_SB_UPDATE_INTERVAL_KB (16384) /* kilobytes (16MB) */</div><div class='add'>+</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Minimum number of groups in a flexgroup before we separate out</div><div class='hunk'>@@ -2271,6 +2384,10 @@ static inline int ext4_forced_shutdown(struct ext4_sb_info *sbi)</div><div class='ctx'>  * Structure of a directory entry</div><div class='ctx'>  */</div><div class='ctx'> #define EXT4_NAME_LEN 255</div><div class='add'>+/*</div><div class='add'>+ * Base length of the ext4 directory entry excluding the name length</div><div class='add'>+ */</div><div class='add'>+#define EXT4_BASE_DIR_LEN (sizeof(struct ext4_dir_entry_2) - EXT4_NAME_LEN)</div><div class='ctx'> </div><div class='ctx'> struct ext4_dir_entry {</div><div class='ctx'> 	__le32	inode;			/* Inode number */</div><div class='hunk'>@@ -2311,9 +2428,9 @@ struct ext4_dir_entry_2 {</div><div class='ctx'> 	((struct ext4_dir_entry_hash *) \</div><div class='ctx'> 		(((void *)(entry)) + \</div><div class='ctx'> 		((8 + (entry)-&gt;name_len + EXT4_DIR_ROUND) &amp; ~EXT4_DIR_ROUND)))</div><div class='del'>-#define EXT4_DIRENT_HASH(entry) le32_to_cpu(EXT4_DIRENT_HASHES(de)-&gt;hash)</div><div class='add'>+#define EXT4_DIRENT_HASH(entry) le32_to_cpu(EXT4_DIRENT_HASHES(entry)-&gt;hash)</div><div class='ctx'> #define EXT4_DIRENT_MINOR_HASH(entry) \</div><div class='del'>-		le32_to_cpu(EXT4_DIRENT_HASHES(de)-&gt;minor_hash)</div><div class='add'>+		le32_to_cpu(EXT4_DIRENT_HASHES(entry)-&gt;minor_hash)</div><div class='ctx'> </div><div class='ctx'> static inline bool ext4_hash_in_dirent(const struct inode *inode)</div><div class='ctx'> {</div><div class='hunk'>@@ -2379,29 +2496,19 @@ static inline unsigned int ext4_dir_rec_len(__u8 name_len,</div><div class='ctx'> 	return (rec_len &amp; ~EXT4_DIR_ROUND);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * If we ever get support for fs block sizes &gt; page_size, we'll need</div><div class='del'>- * to remove the #if statements in the next two functions...</div><div class='del'>- */</div><div class='ctx'> static inline unsigned int</div><div class='ctx'> ext4_rec_len_from_disk(__le16 dlen, unsigned blocksize)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned len = le16_to_cpu(dlen);</div><div class='ctx'> </div><div class='del'>-#if (PAGE_SIZE &gt;= 65536)</div><div class='ctx'> 	if (len == EXT4_MAX_REC_LEN || len == 0)</div><div class='ctx'> 		return blocksize;</div><div class='ctx'> 	return (len &amp; 65532) | ((len &amp; 3) &lt;&lt; 16);</div><div class='del'>-#else</div><div class='del'>-	return len;</div><div class='del'>-#endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline __le16 ext4_rec_len_to_disk(unsigned len, unsigned blocksize)</div><div class='ctx'> {</div><div class='del'>-	if ((len &gt; blocksize) || (blocksize &gt; (1 &lt;&lt; 18)) || (len &amp; 3))</div><div class='del'>-		BUG();</div><div class='del'>-#if (PAGE_SIZE &gt;= 65536)</div><div class='add'>+	BUG_ON((len &gt; blocksize) || (blocksize &gt; (1 &lt;&lt; 18)) || (len &amp; 3));</div><div class='ctx'> 	if (len &lt; 65536)</div><div class='ctx'> 		return cpu_to_le16(len);</div><div class='ctx'> 	if (len == blocksize) {</div><div class='hunk'>@@ -2411,9 +2518,6 @@ static inline __le16 ext4_rec_len_to_disk(unsigned len, unsigned blocksize)</div><div class='ctx'> 			return cpu_to_le16(0);</div><div class='ctx'> 	}</div><div class='ctx'> 	return cpu_to_le16((len &amp; 65532) | ((len &gt;&gt; 16) &amp; 3));</div><div class='del'>-#else</div><div class='del'>-	return cpu_to_le16(len);</div><div class='del'>-#endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2436,23 +2540,11 @@ static inline __le16 ext4_rec_len_to_disk(unsigned len, unsigned blocksize)</div><div class='ctx'> #define DX_HASH_HALF_MD4_UNSIGNED	4</div><div class='ctx'> #define DX_HASH_TEA_UNSIGNED		5</div><div class='ctx'> #define DX_HASH_SIPHASH			6</div><div class='add'>+#define DX_HASH_LAST 			DX_HASH_SIPHASH</div><div class='ctx'> </div><div class='del'>-static inline u32 ext4_chksum(struct ext4_sb_info *sbi, u32 crc,</div><div class='del'>-			      const void *address, unsigned int length)</div><div class='add'>+static inline u32 ext4_chksum(u32 crc, const void *address, unsigned int length)</div><div class='ctx'> {</div><div class='del'>-	struct {</div><div class='del'>-		struct shash_desc shash;</div><div class='del'>-		char ctx[4];</div><div class='del'>-	} desc;</div><div class='del'>-</div><div class='del'>-	BUG_ON(crypto_shash_descsize(sbi-&gt;s_chksum_driver)!=sizeof(desc.ctx));</div><div class='del'>-</div><div class='del'>-	desc.shash.tfm = sbi-&gt;s_chksum_driver;</div><div class='del'>-	*(u32 *)desc.ctx = crc;</div><div class='del'>-</div><div class='del'>-	BUG_ON(crypto_shash_update(&amp;desc.shash, address, length));</div><div class='del'>-</div><div class='del'>-	return *(u32 *)desc.ctx;</div><div class='add'>+	return crc32c(crc, address, length);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef __KERNEL__</div><div class='hunk'>@@ -2484,8 +2576,8 @@ struct ext4_filename {</div><div class='ctx'> #ifdef CONFIG_FS_ENCRYPTION</div><div class='ctx'> 	struct fscrypt_str crypto_buf;</div><div class='ctx'> #endif</div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='del'>-	struct fscrypt_str cf_name;</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='add'>+	struct qstr cf_name;</div><div class='ctx'> #endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -2527,6 +2619,8 @@ struct dir_private_info {</div><div class='ctx'> 	__u32		curr_hash;</div><div class='ctx'> 	__u32		curr_minor_hash;</div><div class='ctx'> 	__u32		next_hash;</div><div class='add'>+	u64		cookie;</div><div class='add'>+	bool		initialized;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /* calculate the first block number of the group */</div><div class='hunk'>@@ -2665,16 +2759,16 @@ struct mmpd_data {</div><div class='ctx'> </div><div class='ctx'> /* bitmap.c */</div><div class='ctx'> extern unsigned int ext4_count_free(char *bitmap, unsigned numchars);</div><div class='del'>-void ext4_inode_bitmap_csum_set(struct super_block *sb, ext4_group_t group,</div><div class='add'>+void ext4_inode_bitmap_csum_set(struct super_block *sb,</div><div class='ctx'> 				struct ext4_group_desc *gdp,</div><div class='del'>-				struct buffer_head *bh, int sz);</div><div class='del'>-int ext4_inode_bitmap_csum_verify(struct super_block *sb, ext4_group_t group,</div><div class='add'>+				struct buffer_head *bh);</div><div class='add'>+int ext4_inode_bitmap_csum_verify(struct super_block *sb,</div><div class='ctx'> 				  struct ext4_group_desc *gdp,</div><div class='del'>-				  struct buffer_head *bh, int sz);</div><div class='del'>-void ext4_block_bitmap_csum_set(struct super_block *sb, ext4_group_t group,</div><div class='add'>+				  struct buffer_head *bh);</div><div class='add'>+void ext4_block_bitmap_csum_set(struct super_block *sb,</div><div class='ctx'> 				struct ext4_group_desc *gdp,</div><div class='ctx'> 				struct buffer_head *bh);</div><div class='del'>-int ext4_block_bitmap_csum_verify(struct super_block *sb, ext4_group_t group,</div><div class='add'>+int ext4_block_bitmap_csum_verify(struct super_block *sb,</div><div class='ctx'> 				  struct ext4_group_desc *gdp,</div><div class='ctx'> 				  struct buffer_head *bh);</div><div class='ctx'> </div><div class='hunk'>@@ -2686,10 +2780,6 @@ extern void ext4_get_group_no_and_offset(struct super_block *sb,</div><div class='ctx'> extern ext4_group_t ext4_get_group_number(struct super_block *sb,</div><div class='ctx'> 					  ext4_fsblk_t block);</div><div class='ctx'> </div><div class='del'>-extern unsigned int ext4_block_group(struct super_block *sb,</div><div class='del'>-			ext4_fsblk_t blocknr);</div><div class='del'>-extern ext4_grpblk_t ext4_block_group_offset(struct super_block *sb,</div><div class='del'>-			ext4_fsblk_t blocknr);</div><div class='ctx'> extern int ext4_bg_has_super(struct super_block *sb, ext4_group_t group);</div><div class='ctx'> extern unsigned long ext4_bg_num_gdb(struct super_block *sb,</div><div class='ctx'> 			ext4_group_t group);</div><div class='hunk'>@@ -2701,10 +2791,11 @@ extern ext4_fsblk_t ext4_new_meta_blocks(handle_t *handle, struct inode *inode,</div><div class='ctx'> extern int ext4_claim_free_clusters(struct ext4_sb_info *sbi,</div><div class='ctx'> 				    s64 nclusters, unsigned int flags);</div><div class='ctx'> extern ext4_fsblk_t ext4_count_free_clusters(struct super_block *);</div><div class='del'>-extern void ext4_check_blocks_bitmap(struct super_block *);</div><div class='ctx'> extern struct ext4_group_desc * ext4_get_group_desc(struct super_block * sb,</div><div class='ctx'> 						    ext4_group_t block_group,</div><div class='ctx'> 						    struct buffer_head ** bh);</div><div class='add'>+extern struct ext4_group_info *ext4_get_group_info(struct super_block *sb,</div><div class='add'>+						   ext4_group_t group);</div><div class='ctx'> extern int ext4_should_retry_alloc(struct super_block *sb, int *retries);</div><div class='ctx'> </div><div class='ctx'> extern struct buffer_head *ext4_read_block_bitmap_nowait(struct super_block *sb,</div><div class='hunk'>@@ -2720,96 +2811,54 @@ extern unsigned ext4_free_clusters_after_init(struct super_block *sb,</div><div class='ctx'> 					      struct ext4_group_desc *gdp);</div><div class='ctx'> ext4_fsblk_t ext4_inode_to_goal_block(struct inode *);</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='ctx'> extern int ext4_fname_setup_ci_filename(struct inode *dir,</div><div class='del'>-					 const struct qstr *iname,</div><div class='del'>-					 struct ext4_filename *fname);</div><div class='del'>-#endif</div><div class='add'>+					const struct qstr *iname,</div><div class='add'>+					struct ext4_filename *fname);</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_FS_ENCRYPTION</div><div class='del'>-static inline void ext4_fname_from_fscrypt_name(struct ext4_filename *dst,</div><div class='del'>-						const struct fscrypt_name *src)</div><div class='add'>+static inline void ext4_fname_free_ci_filename(struct ext4_filename *fname)</div><div class='ctx'> {</div><div class='del'>-	memset(dst, 0, sizeof(*dst));</div><div class='del'>-</div><div class='del'>-	dst-&gt;usr_fname = src-&gt;usr_fname;</div><div class='del'>-	dst-&gt;disk_name = src-&gt;disk_name;</div><div class='del'>-	dst-&gt;hinfo.hash = src-&gt;hash;</div><div class='del'>-	dst-&gt;hinfo.minor_hash = src-&gt;minor_hash;</div><div class='del'>-	dst-&gt;crypto_buf = src-&gt;crypto_buf;</div><div class='add'>+	kfree(fname-&gt;cf_name.name);</div><div class='add'>+	fname-&gt;cf_name.name = NULL;</div><div class='ctx'> }</div><div class='del'>-</div><div class='del'>-static inline int ext4_fname_setup_filename(struct inode *dir,</div><div class='del'>-					    const struct qstr *iname,</div><div class='del'>-					    int lookup,</div><div class='del'>-					    struct ext4_filename *fname)</div><div class='add'>+#else</div><div class='add'>+static inline int ext4_fname_setup_ci_filename(struct inode *dir,</div><div class='add'>+					       const struct qstr *iname,</div><div class='add'>+					       struct ext4_filename *fname)</div><div class='ctx'> {</div><div class='del'>-	struct fscrypt_name name;</div><div class='del'>-	int err;</div><div class='del'>-</div><div class='del'>-	err = fscrypt_setup_filename(dir, iname, lookup, &amp;name);</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='del'>-</div><div class='del'>-	ext4_fname_from_fscrypt_name(fname, &amp;name);</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='del'>-	err = ext4_fname_setup_ci_filename(dir, iname, fname);</div><div class='del'>-#endif</div><div class='del'>-	return err;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int ext4_fname_prepare_lookup(struct inode *dir,</div><div class='del'>-					    struct dentry *dentry,</div><div class='del'>-					    struct ext4_filename *fname)</div><div class='add'>+static inline void ext4_fname_free_ci_filename(struct ext4_filename *fname)</div><div class='ctx'> {</div><div class='del'>-	struct fscrypt_name name;</div><div class='del'>-	int err;</div><div class='del'>-</div><div class='del'>-	err = fscrypt_prepare_lookup(dir, dentry, &amp;name);</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='del'>-	ext4_fname_from_fscrypt_name(fname, &amp;name);</div><div class='add'>+/* ext4 encryption related stuff goes here crypto.c */</div><div class='add'>+#ifdef CONFIG_FS_ENCRYPTION</div><div class='add'>+extern const struct fscrypt_operations ext4_cryptops;</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='del'>-	err = ext4_fname_setup_ci_filename(dir, &amp;dentry-&gt;d_name, fname);</div><div class='del'>-#endif</div><div class='del'>-	return err;</div><div class='del'>-}</div><div class='add'>+int ext4_fname_setup_filename(struct inode *dir, const struct qstr *iname,</div><div class='add'>+			      int lookup, struct ext4_filename *fname);</div><div class='ctx'> </div><div class='del'>-static inline void ext4_fname_free_filename(struct ext4_filename *fname)</div><div class='del'>-{</div><div class='del'>-	struct fscrypt_name name;</div><div class='add'>+int ext4_fname_prepare_lookup(struct inode *dir, struct dentry *dentry,</div><div class='add'>+			      struct ext4_filename *fname);</div><div class='ctx'> </div><div class='del'>-	name.crypto_buf = fname-&gt;crypto_buf;</div><div class='del'>-	fscrypt_free_filename(&amp;name);</div><div class='add'>+void ext4_fname_free_filename(struct ext4_filename *fname);</div><div class='ctx'> </div><div class='del'>-	fname-&gt;crypto_buf.name = NULL;</div><div class='del'>-	fname-&gt;usr_fname = NULL;</div><div class='del'>-	fname-&gt;disk_name.name = NULL;</div><div class='add'>+int ext4_ioctl_get_encryption_pwsalt(struct file *filp, void __user *arg);</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='del'>-	kfree(fname-&gt;cf_name.name);</div><div class='del'>-	fname-&gt;cf_name.name = NULL;</div><div class='del'>-#endif</div><div class='del'>-}</div><div class='ctx'> #else /* !CONFIG_FS_ENCRYPTION */</div><div class='ctx'> static inline int ext4_fname_setup_filename(struct inode *dir,</div><div class='ctx'> 					    const struct qstr *iname,</div><div class='ctx'> 					    int lookup,</div><div class='ctx'> 					    struct ext4_filename *fname)</div><div class='ctx'> {</div><div class='del'>-	int err = 0;</div><div class='ctx'> 	fname-&gt;usr_fname = iname;</div><div class='ctx'> 	fname-&gt;disk_name.name = (unsigned char *) iname-&gt;name;</div><div class='ctx'> 	fname-&gt;disk_name.len = iname-&gt;len;</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='del'>-	err = ext4_fname_setup_ci_filename(dir, iname, fname);</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-	return err;</div><div class='add'>+	return ext4_fname_setup_ci_filename(dir, iname, fname);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int ext4_fname_prepare_lookup(struct inode *dir,</div><div class='hunk'>@@ -2821,10 +2870,13 @@ static inline int ext4_fname_prepare_lookup(struct inode *dir,</div><div class='ctx'> </div><div class='ctx'> static inline void ext4_fname_free_filename(struct ext4_filename *fname)</div><div class='ctx'> {</div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='del'>-	kfree(fname-&gt;cf_name.name);</div><div class='del'>-	fname-&gt;cf_name.name = NULL;</div><div class='del'>-#endif</div><div class='add'>+	ext4_fname_free_ci_filename(fname);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int ext4_ioctl_get_encryption_pwsalt(struct file *filp,</div><div class='add'>+						   void __user *arg)</div><div class='add'>+{</div><div class='add'>+	return -EOPNOTSUPP;</div><div class='ctx'> }</div><div class='ctx'> #endif /* !CONFIG_FS_ENCRYPTION */</div><div class='ctx'> </div><div class='hunk'>@@ -2842,8 +2894,7 @@ extern int ext4_htree_store_dirent(struct file *dir_file, __u32 hash,</div><div class='ctx'> 				struct ext4_dir_entry_2 *dirent,</div><div class='ctx'> 				struct fscrypt_str *ent_name);</div><div class='ctx'> extern void ext4_htree_free_dir_info(struct dir_private_info *p);</div><div class='del'>-extern int ext4_find_dest_de(struct inode *dir, struct inode *inode,</div><div class='del'>-			     struct buffer_head *bh,</div><div class='add'>+extern int ext4_find_dest_de(struct inode *dir, struct buffer_head *bh,</div><div class='ctx'> 			     void *buf, int buf_size,</div><div class='ctx'> 			     struct ext4_filename *fname,</div><div class='ctx'> 			     struct ext4_dir_entry_2 **dest_de);</div><div class='hunk'>@@ -2883,7 +2934,7 @@ extern int ext4fs_dirhash(const struct inode *dir, const char *name, int len,</div><div class='ctx'> </div><div class='ctx'> /* ialloc.c */</div><div class='ctx'> extern int ext4_mark_inode_used(struct super_block *sb, int ino);</div><div class='del'>-extern struct inode *__ext4_new_inode(struct user_namespace *, handle_t *,</div><div class='add'>+extern struct inode *__ext4_new_inode(struct mnt_idmap *, handle_t *,</div><div class='ctx'> 				      struct inode *, umode_t,</div><div class='ctx'> 				      const struct qstr *qstr, __u32 goal,</div><div class='ctx'> 				      uid_t *owner, __u32 i_flags,</div><div class='hunk'>@@ -2891,11 +2942,11 @@ extern struct inode *__ext4_new_inode(struct user_namespace *, handle_t *,</div><div class='ctx'> 				      int nblocks);</div><div class='ctx'> </div><div class='ctx'> #define ext4_new_inode(handle, dir, mode, qstr, goal, owner, i_flags)          \</div><div class='del'>-	__ext4_new_inode(&amp;init_user_ns, (handle), (dir), (mode), (qstr),       \</div><div class='add'>+	__ext4_new_inode(&amp;nop_mnt_idmap, (handle), (dir), (mode), (qstr),      \</div><div class='ctx'> 			 (goal), (owner), i_flags, 0, 0, 0)</div><div class='del'>-#define ext4_new_inode_start_handle(mnt_userns, dir, mode, qstr, goal, owner, \</div><div class='add'>+#define ext4_new_inode_start_handle(idmap, dir, mode, qstr, goal, owner, \</div><div class='ctx'> 				    type, nblocks)		    \</div><div class='del'>-	__ext4_new_inode((mnt_userns), NULL, (dir), (mode), (qstr), (goal), (owner), \</div><div class='add'>+	__ext4_new_inode((idmap), NULL, (dir), (mode), (qstr), (goal), (owner), \</div><div class='ctx'> 			 0, (type), __LINE__, (nblocks))</div><div class='ctx'> </div><div class='ctx'> </div><div class='hunk'>@@ -2903,7 +2954,6 @@ extern void ext4_free_inode(handle_t *, struct inode *);</div><div class='ctx'> extern struct inode * ext4_orphan_get(struct super_block *, unsigned long);</div><div class='ctx'> extern unsigned long ext4_count_free_inodes(struct super_block *);</div><div class='ctx'> extern unsigned long ext4_count_dirs(struct super_block *);</div><div class='del'>-extern void ext4_check_inodes_bitmap(struct super_block *);</div><div class='ctx'> extern void ext4_mark_bitmap_end(int start_bit, int end_bit, char *bitmap);</div><div class='ctx'> extern int ext4_init_inode_table(struct super_block *sb,</div><div class='ctx'> 				 ext4_group_t group, int barrier);</div><div class='hunk'>@@ -2925,29 +2975,26 @@ void __ext4_fc_track_create(handle_t *handle, struct inode *inode,</div><div class='ctx'> 			    struct dentry *dentry);</div><div class='ctx'> void ext4_fc_track_create(handle_t *handle, struct dentry *dentry);</div><div class='ctx'> void ext4_fc_track_inode(handle_t *handle, struct inode *inode);</div><div class='del'>-void ext4_fc_mark_ineligible(struct super_block *sb, int reason);</div><div class='del'>-void ext4_fc_start_ineligible(struct super_block *sb, int reason);</div><div class='del'>-void ext4_fc_stop_ineligible(struct super_block *sb);</div><div class='del'>-void ext4_fc_start_update(struct inode *inode);</div><div class='del'>-void ext4_fc_stop_update(struct inode *inode);</div><div class='add'>+void ext4_fc_mark_ineligible(struct super_block *sb, int reason, handle_t *handle);</div><div class='ctx'> void ext4_fc_del(struct inode *inode);</div><div class='ctx'> bool ext4_fc_replay_check_excluded(struct super_block *sb, ext4_fsblk_t block);</div><div class='ctx'> void ext4_fc_replay_cleanup(struct super_block *sb);</div><div class='ctx'> int ext4_fc_commit(journal_t *journal, tid_t commit_tid);</div><div class='ctx'> int __init ext4_fc_init_dentry_cache(void);</div><div class='add'>+void ext4_fc_destroy_dentry_cache(void);</div><div class='add'>+int ext4_fc_record_regions(struct super_block *sb, int ino,</div><div class='add'>+			   ext4_lblk_t lblk, ext4_fsblk_t pblk,</div><div class='add'>+			   int len, int replay);</div><div class='ctx'> </div><div class='ctx'> /* mballoc.c */</div><div class='ctx'> extern const struct seq_operations ext4_mb_seq_groups_ops;</div><div class='ctx'> extern const struct seq_operations ext4_mb_seq_structs_summary_ops;</div><div class='del'>-extern long ext4_mb_stats;</div><div class='del'>-extern long ext4_mb_max_to_scan;</div><div class='ctx'> extern int ext4_seq_mb_stats_show(struct seq_file *seq, void *offset);</div><div class='ctx'> extern int ext4_mb_init(struct super_block *);</div><div class='del'>-extern int ext4_mb_release(struct super_block *);</div><div class='add'>+extern void ext4_mb_release(struct super_block *);</div><div class='ctx'> extern ext4_fsblk_t ext4_mb_new_blocks(handle_t *,</div><div class='ctx'> 				struct ext4_allocation_request *, int *);</div><div class='del'>-extern int ext4_mb_reserve_blocks(struct super_block *, int);</div><div class='del'>-extern void ext4_discard_preallocations(struct inode *, unsigned int);</div><div class='add'>+extern void ext4_discard_preallocations(struct inode *);</div><div class='ctx'> extern int __init ext4_init_mballoc(void);</div><div class='ctx'> extern void ext4_exit_mballoc(void);</div><div class='ctx'> extern ext4_group_t ext4_mb_prefetch(struct super_block *sb,</div><div class='hunk'>@@ -2968,12 +3015,17 @@ extern int ext4_group_add_blocks(handle_t *handle, struct super_block *sb,</div><div class='ctx'> extern int ext4_trim_fs(struct super_block *, struct fstrim_range *);</div><div class='ctx'> extern void ext4_process_freed_data(struct super_block *sb, tid_t commit_tid);</div><div class='ctx'> extern void ext4_mb_mark_bb(struct super_block *sb, ext4_fsblk_t block,</div><div class='del'>-		       int len, int state);</div><div class='add'>+			    int len, bool state);</div><div class='add'>+static inline bool ext4_mb_cr_expensive(enum criteria cr)</div><div class='add'>+{</div><div class='add'>+	return cr &gt;= CR_GOAL_LEN_SLOW;</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /* inode.c */</div><div class='ctx'> void ext4_inode_csum_set(struct inode *inode, struct ext4_inode *raw,</div><div class='ctx'> 			 struct ext4_inode_info *ei);</div><div class='ctx'> int ext4_inode_is_fast_symlink(struct inode *inode);</div><div class='add'>+void ext4_check_map_extents_env(struct inode *inode);</div><div class='ctx'> struct buffer_head *ext4_getblk(handle_t *, struct inode *, ext4_lblk_t, int);</div><div class='ctx'> struct buffer_head *ext4_bread(handle_t *, struct inode *, ext4_lblk_t, int);</div><div class='ctx'> int ext4_bread_batch(struct inode *inode, ext4_lblk_t block, int bh_count,</div><div class='hunk'>@@ -2994,13 +3046,16 @@ int ext4_walk_page_buffers(handle_t *handle,</div><div class='ctx'> 				     struct buffer_head *bh));</div><div class='ctx'> int do_journal_get_write_access(handle_t *handle, struct inode *inode,</div><div class='ctx'> 				struct buffer_head *bh);</div><div class='add'>+void ext4_set_inode_mapping_order(struct inode *inode);</div><div class='ctx'> #define FALL_BACK_TO_NONDELALLOC 1</div><div class='ctx'> #define CONVERT_INLINE_DATA	 2</div><div class='ctx'> </div><div class='ctx'> typedef enum {</div><div class='ctx'> 	EXT4_IGET_NORMAL =	0,</div><div class='ctx'> 	EXT4_IGET_SPECIAL =	0x0001, /* OK to iget a system inode */</div><div class='del'>-	EXT4_IGET_HANDLE = 	0x0002	/* Inode # is from a handle */</div><div class='add'>+	EXT4_IGET_HANDLE = 	0x0002,	/* Inode # is from a handle */</div><div class='add'>+	EXT4_IGET_BAD =		0x0004, /* Allow to iget a bad inode */</div><div class='add'>+	EXT4_IGET_EA_INODE =	0x0008	/* Inode should contain an EA value */</div><div class='ctx'> } ext4_iget_flags;</div><div class='ctx'> </div><div class='ctx'> extern struct inode *__ext4_iget(struct super_block *sb, unsigned long ino,</div><div class='hunk'>@@ -3011,15 +3066,15 @@ extern struct inode *__ext4_iget(struct super_block *sb, unsigned long ino,</div><div class='ctx'> 	__ext4_iget((sb), (ino), (flags), __func__, __LINE__)</div><div class='ctx'> </div><div class='ctx'> extern int  ext4_write_inode(struct inode *, struct writeback_control *);</div><div class='del'>-extern int  ext4_setattr(struct user_namespace *, struct dentry *,</div><div class='add'>+extern int  ext4_setattr(struct mnt_idmap *, struct dentry *,</div><div class='ctx'> 			 struct iattr *);</div><div class='del'>-extern int  ext4_getattr(struct user_namespace *, const struct path *,</div><div class='add'>+extern u32  ext4_dio_alignment(struct inode *inode);</div><div class='add'>+extern int  ext4_getattr(struct mnt_idmap *, const struct path *,</div><div class='ctx'> 			 struct kstat *, u32, unsigned int);</div><div class='ctx'> extern void ext4_evict_inode(struct inode *);</div><div class='ctx'> extern void ext4_clear_inode(struct inode *);</div><div class='del'>-extern int  ext4_file_getattr(struct user_namespace *, const struct path *,</div><div class='add'>+extern int  ext4_file_getattr(struct mnt_idmap *, const struct path *,</div><div class='ctx'> 			      struct kstat *, u32, unsigned int);</div><div class='del'>-extern int  ext4_sync_inode(handle_t *, struct inode *);</div><div class='ctx'> extern void ext4_dirty_inode(struct inode *, int);</div><div class='ctx'> extern int ext4_change_inode_journal_flag(struct inode *, int);</div><div class='ctx'> extern int ext4_get_inode_loc(struct inode *, struct ext4_iloc *);</div><div class='hunk'>@@ -3029,12 +3084,17 @@ extern int ext4_inode_attach_jinode(struct inode *inode);</div><div class='ctx'> extern int ext4_can_truncate(struct inode *inode);</div><div class='ctx'> extern int ext4_truncate(struct inode *);</div><div class='ctx'> extern int ext4_break_layouts(struct inode *);</div><div class='del'>-extern int ext4_punch_hole(struct inode *inode, loff_t offset, loff_t length);</div><div class='add'>+extern int ext4_truncate_page_cache_block_range(struct inode *inode,</div><div class='add'>+						loff_t start, loff_t end);</div><div class='add'>+extern int ext4_punch_hole(struct file *file, loff_t offset, loff_t length);</div><div class='ctx'> extern void ext4_set_inode_flags(struct inode *, bool init);</div><div class='ctx'> extern int ext4_alloc_da_blocks(struct inode *inode);</div><div class='ctx'> extern void ext4_set_aops(struct inode *inode);</div><div class='del'>-extern int ext4_writepage_trans_blocks(struct inode *);</div><div class='add'>+extern int ext4_normal_submit_inode_data_buffers(struct jbd2_inode *jinode);</div><div class='ctx'> extern int ext4_chunk_trans_blocks(struct inode *, int nrblocks);</div><div class='add'>+extern int ext4_chunk_trans_extent(struct inode *inode, int nrblocks);</div><div class='add'>+extern int ext4_meta_trans_blocks(struct inode *inode, int lblocks,</div><div class='add'>+				  int pextents);</div><div class='ctx'> extern int ext4_zero_partial_blocks(handle_t *handle, struct inode *inode,</div><div class='ctx'> 			     loff_t lstart, loff_t lend);</div><div class='ctx'> extern vm_fault_t ext4_page_mkwrite(struct vm_fault *vmf);</div><div class='hunk'>@@ -3046,6 +3106,17 @@ extern void ext4_da_update_reserve_space(struct inode *inode,</div><div class='ctx'> extern int ext4_issue_zeroout(struct inode *inode, ext4_lblk_t lblk,</div><div class='ctx'> 			      ext4_fsblk_t pblk, ext4_lblk_t len);</div><div class='ctx'> </div><div class='add'>+static inline bool is_special_ino(struct super_block *sb, unsigned long ino)</div><div class='add'>+{</div><div class='add'>+	struct ext4_super_block *es = EXT4_SB(sb)-&gt;s_es;</div><div class='add'>+</div><div class='add'>+	return (ino &lt; EXT4_FIRST_INO(sb) &amp;&amp; ino != EXT4_ROOT_INO) ||</div><div class='add'>+		ino == le32_to_cpu(es-&gt;s_usr_quota_inum) ||</div><div class='add'>+		ino == le32_to_cpu(es-&gt;s_grp_quota_inum) ||</div><div class='add'>+		ino == le32_to_cpu(es-&gt;s_prj_quota_inum) ||</div><div class='add'>+		ino == le32_to_cpu(es-&gt;s_orphan_file_inum);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /* indirect.c */</div><div class='ctx'> extern int ext4_ind_map_blocks(handle_t *handle, struct inode *inode,</div><div class='ctx'> 				struct ext4_map_blocks *map, int flags);</div><div class='hunk'>@@ -3057,10 +3128,12 @@ extern int ext4_ind_remove_space(handle_t *handle, struct inode *inode,</div><div class='ctx'> /* ioctl.c */</div><div class='ctx'> extern long ext4_ioctl(struct file *, unsigned int, unsigned long);</div><div class='ctx'> extern long ext4_compat_ioctl(struct file *, unsigned int, unsigned long);</div><div class='del'>-int ext4_fileattr_set(struct user_namespace *mnt_userns,</div><div class='del'>-		      struct dentry *dentry, struct fileattr *fa);</div><div class='del'>-int ext4_fileattr_get(struct dentry *dentry, struct fileattr *fa);</div><div class='add'>+int ext4_fileattr_set(struct mnt_idmap *idmap,</div><div class='add'>+		      struct dentry *dentry, struct file_kattr *fa);</div><div class='add'>+int ext4_fileattr_get(struct dentry *dentry, struct file_kattr *fa);</div><div class='ctx'> extern void ext4_reset_inode_seed(struct inode *inode);</div><div class='add'>+int ext4_update_overhead(struct super_block *sb, bool force);</div><div class='add'>+int ext4_force_shutdown(struct super_block *sb, u32 flags);</div><div class='ctx'> </div><div class='ctx'> /* migrate.c */</div><div class='ctx'> extern int ext4_ext_migrate(struct inode *);</div><div class='hunk'>@@ -3096,20 +3169,26 @@ extern int ext4_group_extend(struct super_block *sb,</div><div class='ctx'> 				struct ext4_super_block *es,</div><div class='ctx'> 				ext4_fsblk_t n_blocks_count);</div><div class='ctx'> extern int ext4_resize_fs(struct super_block *sb, ext4_fsblk_t n_blocks_count);</div><div class='add'>+extern unsigned int ext4_list_backups(struct super_block *sb,</div><div class='add'>+				      unsigned int *three, unsigned int *five,</div><div class='add'>+				      unsigned int *seven);</div><div class='ctx'> </div><div class='ctx'> /* super.c */</div><div class='ctx'> extern struct buffer_head *ext4_sb_bread(struct super_block *sb,</div><div class='del'>-					 sector_t block, int op_flags);</div><div class='add'>+					 sector_t block, blk_opf_t op_flags);</div><div class='ctx'> extern struct buffer_head *ext4_sb_bread_unmovable(struct super_block *sb,</div><div class='ctx'> 						   sector_t block);</div><div class='del'>-extern void ext4_read_bh_nowait(struct buffer_head *bh, int op_flags,</div><div class='del'>-				bh_end_io_t *end_io);</div><div class='del'>-extern int ext4_read_bh(struct buffer_head *bh, int op_flags,</div><div class='del'>-			bh_end_io_t *end_io);</div><div class='del'>-extern int ext4_read_bh_lock(struct buffer_head *bh, int op_flags, bool wait);</div><div class='add'>+extern struct buffer_head *ext4_sb_bread_nofail(struct super_block *sb,</div><div class='add'>+						sector_t block);</div><div class='add'>+extern void ext4_read_bh_nowait(struct buffer_head *bh, blk_opf_t op_flags,</div><div class='add'>+				bh_end_io_t *end_io, bool simu_fail);</div><div class='add'>+extern int ext4_read_bh(struct buffer_head *bh, blk_opf_t op_flags,</div><div class='add'>+			bh_end_io_t *end_io, bool simu_fail);</div><div class='add'>+extern int ext4_read_bh_lock(struct buffer_head *bh, blk_opf_t op_flags, bool wait);</div><div class='ctx'> extern void ext4_sb_breadahead_unmovable(struct super_block *sb, sector_t block);</div><div class='ctx'> extern int ext4_seq_options_show(struct seq_file *seq, void *offset);</div><div class='ctx'> extern int ext4_calculate_overhead(struct super_block *sb);</div><div class='add'>+extern __le32 ext4_superblock_csum(struct ext4_super_block *es);</div><div class='ctx'> extern void ext4_superblock_csum_set(struct super_block *sb);</div><div class='ctx'> extern int ext4_alloc_flex_bg_array(struct super_block *sb,</div><div class='ctx'> 				    ext4_group_t ngroup);</div><div class='hunk'>@@ -3118,6 +3197,8 @@ extern const char *ext4_decode_error(struct super_block *sb, int errno,</div><div class='ctx'> extern void ext4_mark_group_bitmap_corrupted(struct super_block *sb,</div><div class='ctx'> 					     ext4_group_t block_group,</div><div class='ctx'> 					     unsigned int flags);</div><div class='add'>+extern unsigned int ext4_num_base_meta_blocks(struct super_block *sb,</div><div class='add'>+					      ext4_group_t block_group);</div><div class='ctx'> </div><div class='ctx'> extern __printf(7, 8)</div><div class='ctx'> void __ext4_error(struct super_block *, const char *, unsigned int, bool,</div><div class='hunk'>@@ -3277,18 +3358,10 @@ extern void ext4_group_desc_csum_set(struct super_block *sb, __u32 group,</div><div class='ctx'> extern int ext4_register_li_request(struct super_block *sb,</div><div class='ctx'> 				    ext4_group_t first_not_zeroed);</div><div class='ctx'> </div><div class='del'>-static inline int ext4_has_metadata_csum(struct super_block *sb)</div><div class='del'>-{</div><div class='del'>-	WARN_ON_ONCE(ext4_has_feature_metadata_csum(sb) &amp;&amp;</div><div class='del'>-		     !EXT4_SB(sb)-&gt;s_chksum_driver);</div><div class='del'>-</div><div class='del'>-	return ext4_has_feature_metadata_csum(sb) &amp;&amp;</div><div class='del'>-	       (EXT4_SB(sb)-&gt;s_chksum_driver != NULL);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static inline int ext4_has_group_desc_csum(struct super_block *sb)</div><div class='ctx'> {</div><div class='del'>-	return ext4_has_feature_gdt_csum(sb) || ext4_has_metadata_csum(sb);</div><div class='add'>+	return ext4_has_feature_gdt_csum(sb) ||</div><div class='add'>+	       ext4_has_feature_metadata_csum(sb);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #define ext4_read_incompat_64bit_val(es, name) \</div><div class='hunk'>@@ -3349,19 +3422,6 @@ static inline void ext4_isize_set(struct ext4_inode *raw_inode, loff_t i_size)</div><div class='ctx'> 	raw_inode-&gt;i_size_high = cpu_to_le32(i_size &gt;&gt; 32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline</div><div class='del'>-struct ext4_group_info *ext4_get_group_info(struct super_block *sb,</div><div class='del'>-					    ext4_group_t group)</div><div class='del'>-{</div><div class='del'>-	 struct ext4_group_info **grp_info;</div><div class='del'>-	 long indexv, indexh;</div><div class='del'>-	 BUG_ON(group &gt;= EXT4_SB(sb)-&gt;s_groups_count);</div><div class='del'>-	 indexv = group &gt;&gt; (EXT4_DESC_PER_BLOCK_BITS(sb));</div><div class='del'>-	 indexh = group &amp; ((EXT4_DESC_PER_BLOCK(sb)) - 1);</div><div class='del'>-	 grp_info = sbi_array_rcu_deref(EXT4_SB(sb), s_group_info, indexv);</div><div class='del'>-	 return grp_info[indexh];</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Reading s_groups_count requires using smp_rmb() afterwards.  See</div><div class='ctx'>  * the locking protocol documented in the comments of ext4_group_add()</div><div class='hunk'>@@ -3386,6 +3446,13 @@ static inline unsigned int ext4_flex_bg_size(struct ext4_sb_info *sbi)</div><div class='ctx'> 	return 1 &lt;&lt; sbi-&gt;s_log_groups_per_flex;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline loff_t ext4_get_maxbytes(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	if (ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS))</div><div class='add'>+		return inode-&gt;i_sb-&gt;s_maxbytes;</div><div class='add'>+	return EXT4_SB(inode-&gt;i_sb)-&gt;s_bitmap_maxbytes;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> #define ext4_std_error(sb, errno)				\</div><div class='ctx'> do {								\</div><div class='ctx'> 	if ((errno))						\</div><div class='hunk'>@@ -3402,7 +3469,7 @@ do {								\</div><div class='ctx'> #define EXT4_FREECLUSTERS_WATERMARK 0</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-/* Update i_disksize. Requires i_mutex to avoid races with truncate */</div><div class='add'>+/* Update i_disksize. Requires i_rwsem to avoid races with truncate */</div><div class='ctx'> static inline void ext4_update_i_disksize(struct inode *inode, loff_t newsize)</div><div class='ctx'> {</div><div class='ctx'> 	WARN_ON_ONCE(S_ISREG(inode-&gt;i_mode) &amp;&amp;</div><div class='hunk'>@@ -3413,7 +3480,7 @@ static inline void ext4_update_i_disksize(struct inode *inode, loff_t newsize)</div><div class='ctx'> 	up_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Update i_size, i_disksize. Requires i_mutex to avoid races with truncate */</div><div class='add'>+/* Update i_size, i_disksize. Requires i_rwsem to avoid races with truncate */</div><div class='ctx'> static inline int ext4_update_inode_size(struct inode *inode, loff_t newsize)</div><div class='ctx'> {</div><div class='ctx'> 	int changed = 0;</div><div class='hunk'>@@ -3441,6 +3508,8 @@ struct ext4_group_info {</div><div class='ctx'> 	ext4_grpblk_t	bb_first_free;	/* first free block */</div><div class='ctx'> 	ext4_grpblk_t	bb_free;	/* total free blocks */</div><div class='ctx'> 	ext4_grpblk_t	bb_fragments;	/* nr of freespace fragments */</div><div class='add'>+	int		bb_avg_fragment_size_order;	/* order of average</div><div class='add'>+							   fragment in BG */</div><div class='ctx'> 	ext4_grpblk_t	bb_largest_free_order;/* order of largest frag in BG */</div><div class='ctx'> 	ext4_group_t	bb_group;	/* Group number */</div><div class='ctx'> 	struct          list_head bb_prealloc_list;</div><div class='hunk'>@@ -3448,8 +3517,6 @@ struct ext4_group_info {</div><div class='ctx'> 	void            *bb_bitmap;</div><div class='ctx'> #endif</div><div class='ctx'> 	struct rw_semaphore alloc_sem;</div><div class='del'>-	struct rb_node	bb_avg_fragment_size_rb;</div><div class='del'>-	struct list_head bb_largest_free_order_node;</div><div class='ctx'> 	ext4_grpblk_t	bb_counters[];	/* Nr of free power-of-two-block</div><div class='ctx'> 					 * regions, index is order.</div><div class='ctx'> 					 * bb_counters[3] = 5 means</div><div class='hunk'>@@ -3500,23 +3567,28 @@ static inline int ext4_fs_is_busy(struct ext4_sb_info *sbi)</div><div class='ctx'> 	return (atomic_read(&amp;sbi-&gt;s_lock_busy) &gt; EXT4_CONTENTION_THRESHOLD);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline bool ext4_try_lock_group(struct super_block *sb, ext4_group_t group)</div><div class='add'>+{</div><div class='add'>+	if (!spin_trylock(ext4_group_lock_ptr(sb, group)))</div><div class='add'>+		return false;</div><div class='add'>+	/*</div><div class='add'>+	 * We're able to grab the lock right away, so drop the lock</div><div class='add'>+	 * contention counter.</div><div class='add'>+	 */</div><div class='add'>+	atomic_add_unless(&amp;EXT4_SB(sb)-&gt;s_lock_busy, -1, 0);</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline void ext4_lock_group(struct super_block *sb, ext4_group_t group)</div><div class='ctx'> {</div><div class='del'>-	spinlock_t *lock = ext4_group_lock_ptr(sb, group);</div><div class='del'>-	if (spin_trylock(lock))</div><div class='del'>-		/*</div><div class='del'>-		 * We're able to grab the lock right away, so drop the</div><div class='del'>-		 * lock contention counter.</div><div class='del'>-		 */</div><div class='del'>-		atomic_add_unless(&amp;EXT4_SB(sb)-&gt;s_lock_busy, -1, 0);</div><div class='del'>-	else {</div><div class='add'>+	if (!ext4_try_lock_group(sb, group)) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * The lock is busy, so bump the contention counter,</div><div class='ctx'> 		 * and then wait on the spin lock.</div><div class='ctx'> 		 */</div><div class='ctx'> 		atomic_add_unless(&amp;EXT4_SB(sb)-&gt;s_lock_busy, 1,</div><div class='ctx'> 				  EXT4_MAX_CONTENTION);</div><div class='del'>-		spin_lock(lock);</div><div class='add'>+		spin_lock(ext4_group_lock_ptr(sb, group));</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3570,30 +3642,21 @@ extern loff_t ext4_llseek(struct file *file, loff_t offset, int origin);</div><div class='ctx'> /* inline.c */</div><div class='ctx'> extern int ext4_get_max_inline_size(struct inode *inode);</div><div class='ctx'> extern int ext4_find_inline_data_nolock(struct inode *inode);</div><div class='del'>-extern int ext4_init_inline_data(handle_t *handle, struct inode *inode,</div><div class='del'>-				 unsigned int len);</div><div class='ctx'> extern int ext4_destroy_inline_data(handle_t *handle, struct inode *inode);</div><div class='add'>+extern void ext4_update_final_de(void *de_buf, int old_size, int new_size);</div><div class='ctx'> </div><div class='del'>-extern int ext4_readpage_inline(struct inode *inode, struct page *page);</div><div class='add'>+int ext4_readpage_inline(struct inode *inode, struct folio *folio);</div><div class='ctx'> extern int ext4_try_to_write_inline_data(struct address_space *mapping,</div><div class='ctx'> 					 struct inode *inode,</div><div class='ctx'> 					 loff_t pos, unsigned len,</div><div class='del'>-					 unsigned flags,</div><div class='del'>-					 struct page **pagep);</div><div class='del'>-extern int ext4_write_inline_data_end(struct inode *inode,</div><div class='del'>-				      loff_t pos, unsigned len,</div><div class='del'>-				      unsigned copied,</div><div class='del'>-				      struct page *page);</div><div class='del'>-extern struct buffer_head *</div><div class='del'>-ext4_journalled_write_inline_data(struct inode *inode,</div><div class='del'>-				  unsigned len,</div><div class='del'>-				  struct page *page);</div><div class='del'>-extern int ext4_da_write_inline_data_begin(struct address_space *mapping,</div><div class='del'>-					   struct inode *inode,</div><div class='del'>-					   loff_t pos, unsigned len,</div><div class='del'>-					   unsigned flags,</div><div class='del'>-					   struct page **pagep,</div><div class='del'>-					   void **fsdata);</div><div class='add'>+					 struct folio **foliop);</div><div class='add'>+int ext4_write_inline_data_end(struct inode *inode, loff_t pos, unsigned len,</div><div class='add'>+			       unsigned copied, struct folio *folio);</div><div class='add'>+extern int ext4_generic_write_inline_data(struct address_space *mapping,</div><div class='add'>+					  struct inode *inode,</div><div class='add'>+					  loff_t pos, unsigned len,</div><div class='add'>+					  struct folio **foliop,</div><div class='add'>+					  void **fsdata, bool da);</div><div class='ctx'> extern int ext4_try_add_inline_entry(handle_t *handle,</div><div class='ctx'> 				     struct ext4_filename *fname,</div><div class='ctx'> 				     struct inode *dir, struct inode *inode);</div><div class='hunk'>@@ -3621,9 +3684,7 @@ extern bool empty_inline_dir(struct inode *dir, int *has_inline_data);</div><div class='ctx'> extern struct buffer_head *ext4_get_first_inline_block(struct inode *inode,</div><div class='ctx'> 					struct ext4_dir_entry_2 **parent_de,</div><div class='ctx'> 					int *retval);</div><div class='del'>-extern int ext4_inline_data_fiemap(struct inode *inode,</div><div class='del'>-				   struct fiemap_extent_info *fieinfo,</div><div class='del'>-				   int *has_inline, __u64 start, __u64 len);</div><div class='add'>+extern void *ext4_read_inline_link(struct inode *inode);</div><div class='ctx'> </div><div class='ctx'> struct iomap;</div><div class='ctx'> extern int ext4_inline_data_iomap(struct inode *inode, struct iomap *iomap);</div><div class='hunk'>@@ -3642,16 +3703,16 @@ static inline int ext4_has_inline_data(struct inode *inode)</div><div class='ctx'> extern const struct inode_operations ext4_dir_inode_operations;</div><div class='ctx'> extern const struct inode_operations ext4_special_inode_operations;</div><div class='ctx'> extern struct dentry *ext4_get_parent(struct dentry *child);</div><div class='del'>-extern struct ext4_dir_entry_2 *ext4_init_dot_dotdot(struct inode *inode,</div><div class='del'>-				 struct ext4_dir_entry_2 *de,</div><div class='del'>-				 int blocksize, int csum_size,</div><div class='del'>-				 unsigned int parent_ino, int dotdot_real_len);</div><div class='add'>+extern int ext4_init_dirblock(handle_t *handle, struct inode *inode,</div><div class='add'>+			      struct buffer_head *dir_block,</div><div class='add'>+			      unsigned int parent_ino, void *inline_buf,</div><div class='add'>+			      int inline_size);</div><div class='ctx'> extern void ext4_initialize_dirent_tail(struct buffer_head *bh,</div><div class='ctx'> 					unsigned int blocksize);</div><div class='ctx'> extern int ext4_handle_dirty_dirblock(handle_t *handle, struct inode *inode,</div><div class='ctx'> 				      struct buffer_head *bh);</div><div class='del'>-extern int __ext4_unlink(handle_t *handle, struct inode *dir, const struct qstr *d_name,</div><div class='del'>-			 struct inode *inode);</div><div class='add'>+extern int __ext4_unlink(struct inode *dir, const struct qstr *d_name,</div><div class='add'>+			 struct inode *inode, struct dentry *dentry);</div><div class='ctx'> extern int __ext4_link(struct inode *dir, struct inode *inode,</div><div class='ctx'> 		       struct dentry *dentry);</div><div class='ctx'> </div><div class='hunk'>@@ -3675,7 +3736,7 @@ static inline void ext4_set_de_type(struct super_block *sb,</div><div class='ctx'> </div><div class='ctx'> /* readpages.c */</div><div class='ctx'> extern int ext4_mpage_readpages(struct inode *inode,</div><div class='del'>-		struct readahead_control *rac, struct page *page);</div><div class='add'>+		struct readahead_control *rac, struct folio *folio);</div><div class='ctx'> extern int __init ext4_init_post_read_processing(void);</div><div class='ctx'> extern void ext4_exit_post_read_processing(void);</div><div class='ctx'> </div><div class='hunk'>@@ -3701,6 +3762,9 @@ extern int ext4_inode_block_valid(struct inode *inode,</div><div class='ctx'> 				  unsigned int count);</div><div class='ctx'> extern int ext4_check_blockref(const char *, unsigned int,</div><div class='ctx'> 			       struct inode *, __le32 *, unsigned int);</div><div class='add'>+extern int ext4_sb_block_valid(struct super_block *sb, struct inode *inode,</div><div class='add'>+				ext4_fsblk_t start_blk, unsigned int count);</div><div class='add'>+</div><div class='ctx'> </div><div class='ctx'> /* extents.c */</div><div class='ctx'> struct ext4_ext_path;</div><div class='hunk'>@@ -3725,6 +3789,8 @@ extern long ext4_fallocate(struct file *file, int mode, loff_t offset,</div><div class='ctx'> 			  loff_t len);</div><div class='ctx'> extern int ext4_convert_unwritten_extents(handle_t *handle, struct inode *inode,</div><div class='ctx'> 					  loff_t offset, ssize_t len);</div><div class='add'>+extern int ext4_convert_unwritten_extents_atomic(handle_t *handle,</div><div class='add'>+			struct inode *inode, loff_t offset, ssize_t len);</div><div class='ctx'> extern int ext4_convert_unwritten_io_end_vec(handle_t *handle,</div><div class='ctx'> 					     ext4_io_end_t *io_end);</div><div class='ctx'> extern int ext4_map_blocks(handle_t *handle, struct inode *inode,</div><div class='hunk'>@@ -3732,13 +3798,14 @@ extern int ext4_map_blocks(handle_t *handle, struct inode *inode,</div><div class='ctx'> extern int ext4_ext_calc_credits_for_single_extent(struct inode *inode,</div><div class='ctx'> 						   int num,</div><div class='ctx'> 						   struct ext4_ext_path *path);</div><div class='del'>-extern int ext4_ext_insert_extent(handle_t *, struct inode *,</div><div class='del'>-				  struct ext4_ext_path **,</div><div class='del'>-				  struct ext4_extent *, int);</div><div class='add'>+extern struct ext4_ext_path *ext4_ext_insert_extent(</div><div class='add'>+				handle_t *handle, struct inode *inode,</div><div class='add'>+				struct ext4_ext_path *path,</div><div class='add'>+				struct ext4_extent *newext, int gb_flags);</div><div class='ctx'> extern struct ext4_ext_path *ext4_find_extent(struct inode *, ext4_lblk_t,</div><div class='del'>-					      struct ext4_ext_path **,</div><div class='add'>+					      struct ext4_ext_path *,</div><div class='ctx'> 					      int flags);</div><div class='del'>-extern void ext4_ext_drop_refs(struct ext4_ext_path *);</div><div class='add'>+extern void ext4_free_ext_path(struct ext4_ext_path *);</div><div class='ctx'> extern int ext4_ext_check_inode(struct inode *inode);</div><div class='ctx'> extern ext4_lblk_t ext4_ext_next_allocated_block(struct ext4_ext_path *path);</div><div class='ctx'> extern int ext4_fiemap(struct inode *inode, struct fiemap_extent_info *fieinfo,</div><div class='hunk'>@@ -3782,10 +3849,8 @@ extern void ext4_io_submit_init(struct ext4_io_submit *io,</div><div class='ctx'> 				struct writeback_control *wbc);</div><div class='ctx'> extern void ext4_end_io_rsv_work(struct work_struct *work);</div><div class='ctx'> extern void ext4_io_submit(struct ext4_io_submit *io);</div><div class='del'>-extern int ext4_bio_write_page(struct ext4_io_submit *io,</div><div class='del'>-			       struct page *page,</div><div class='del'>-			       int len,</div><div class='del'>-			       bool keep_towrite);</div><div class='add'>+int ext4_bio_write_folio(struct ext4_io_submit *io, struct folio *page,</div><div class='add'>+		size_t len);</div><div class='ctx'> extern struct ext4_io_end_vec *ext4_alloc_io_end_vec(ext4_io_end_t *io_end);</div><div class='ctx'> extern struct ext4_io_end_vec *ext4_last_io_end_vec(ext4_io_end_t *io_end);</div><div class='ctx'> </div><div class='hunk'>@@ -3828,36 +3893,19 @@ static inline void set_bitmap_uptodate(struct buffer_head *bh)</div><div class='ctx'> 	set_bit(BH_BITMAP_UPTODATE, &amp;(bh)-&gt;b_state);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#define in_range(b, first, len)	((b) &gt;= (first) &amp;&amp; (b) &lt;= (first) + (len) - 1)</div><div class='del'>-</div><div class='del'>-/* For ioend &amp; aio unwritten conversion wait queues */</div><div class='del'>-#define EXT4_WQ_HASH_SZ		37</div><div class='del'>-#define ext4_ioend_wq(v)   (&amp;ext4__ioend_wq[((unsigned long)(v)) %\</div><div class='del'>-					    EXT4_WQ_HASH_SZ])</div><div class='del'>-extern wait_queue_head_t ext4__ioend_wq[EXT4_WQ_HASH_SZ];</div><div class='del'>-</div><div class='ctx'> extern int ext4_resize_begin(struct super_block *sb);</div><div class='del'>-extern void ext4_resize_end(struct super_block *sb);</div><div class='add'>+extern int ext4_resize_end(struct super_block *sb, bool update_backups);</div><div class='ctx'> </div><div class='del'>-static inline void ext4_set_io_unwritten_flag(struct inode *inode,</div><div class='del'>-					      struct ext4_io_end *io_end)</div><div class='add'>+static inline void ext4_set_io_unwritten_flag(struct ext4_io_end *io_end)</div><div class='ctx'> {</div><div class='del'>-	if (!(io_end-&gt;flag &amp; EXT4_IO_END_UNWRITTEN)) {</div><div class='add'>+	if (!(io_end-&gt;flag &amp; EXT4_IO_END_UNWRITTEN))</div><div class='ctx'> 		io_end-&gt;flag |= EXT4_IO_END_UNWRITTEN;</div><div class='del'>-		atomic_inc(&amp;EXT4_I(inode)-&gt;i_unwritten);</div><div class='del'>-	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void ext4_clear_io_unwritten_flag(ext4_io_end_t *io_end)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = io_end-&gt;inode;</div><div class='del'>-</div><div class='del'>-	if (io_end-&gt;flag &amp; EXT4_IO_END_UNWRITTEN) {</div><div class='add'>+	if (io_end-&gt;flag &amp; EXT4_IO_END_UNWRITTEN)</div><div class='ctx'> 		io_end-&gt;flag &amp;= ~EXT4_IO_END_UNWRITTEN;</div><div class='del'>-		/* Wake up anyone waiting on unwritten extent conversion */</div><div class='del'>-		if (atomic_dec_and_test(&amp;EXT4_I(inode)-&gt;i_unwritten))</div><div class='del'>-			wake_up_all(ext4_ioend_wq(inode));</div><div class='del'>-	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> extern const struct iomap_ops ext4_iomap_ops;</div><div class='hunk'>@@ -3877,6 +3925,17 @@ static inline int ext4_buffer_uptodate(struct buffer_head *bh)</div><div class='ctx'> 	return buffer_uptodate(bh);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline bool ext4_inode_can_atomic_write(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+</div><div class='add'>+	return S_ISREG(inode-&gt;i_mode) &amp;&amp;</div><div class='add'>+		ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS) &amp;&amp;</div><div class='add'>+		EXT4_SB(inode-&gt;i_sb)-&gt;s_awu_min &gt; 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+extern int ext4_block_write_begin(handle_t *handle, struct folio *folio,</div><div class='add'>+				  loff_t pos, unsigned len,</div><div class='add'>+				  get_block_t *get_block);</div><div class='ctx'> #endif	/* __KERNEL__ */</div><div class='ctx'> </div><div class='ctx'> #define EFSBADCRC	EBADMSG		/* Bad CRC detected */</div><div class='head'>diff --git a/fs/ext4/ext4_extents.h b/fs/ext4/ext4_extents.h<br/>index 26435f3a3094..c484125d963f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/ext4_extents.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/ext4_extents.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/ext4_extents.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/ext4_extents.h</a></div><div class='hunk'>@@ -31,13 +31,6 @@</div><div class='ctx'> #define CHECK_BINSEARCH__</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * If EXT_STATS is defined then stats numbers are collected.</div><div class='del'>- * These number will be displayed at umount time.</div><div class='del'>- */</div><div class='del'>-#define EXT_STATS_</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * ext4_inode has i_block array (60 bytes total).</div><div class='ctx'>  * The first 12 bytes store ext4_extent_header;</div><div class='ctx'>  * the remainder stores an array of ext4_extent.</div><div class='head'>diff --git a/fs/ext4/ext4_jbd2.c b/fs/ext4/ext4_jbd2.c<br/>index 6def7339056d..05e5946ed9b3 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/ext4_jbd2.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/ext4_jbd2.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/ext4_jbd2.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/ext4_jbd2.c</a></div><div class='hunk'>@@ -63,15 +63,18 @@ static void ext4_put_nojournal(handle_t *handle)</div><div class='ctx'>  */</div><div class='ctx'> static int ext4_journal_check_start(struct super_block *sb)</div><div class='ctx'> {</div><div class='add'>+	int ret;</div><div class='ctx'> 	journal_t *journal;</div><div class='ctx'> </div><div class='ctx'> 	might_sleep();</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ext4_forced_shutdown(EXT4_SB(sb))))</div><div class='del'>-		return -EIO;</div><div class='add'>+	ret = ext4_emergency_state(sb);</div><div class='add'>+	if (unlikely(ret))</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	if (sb_rdonly(sb))</div><div class='add'>+	if (WARN_ON_ONCE(sb_rdonly(sb)))</div><div class='ctx'> 		return -EROFS;</div><div class='add'>+</div><div class='ctx'> 	WARN_ON(sb-&gt;s_writers.frozen == SB_FREEZE_COMPLETE);</div><div class='ctx'> 	journal = EXT4_SB(sb)-&gt;s_journal;</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -86,15 +89,21 @@ static int ext4_journal_check_start(struct super_block *sb)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-handle_t *__ext4_journal_start_sb(struct super_block *sb, unsigned int line,</div><div class='add'>+handle_t *__ext4_journal_start_sb(struct inode *inode,</div><div class='add'>+				  struct super_block *sb, unsigned int line,</div><div class='ctx'> 				  int type, int blocks, int rsv_blocks,</div><div class='ctx'> 				  int revoke_creds)</div><div class='ctx'> {</div><div class='ctx'> 	journal_t *journal;</div><div class='ctx'> 	int err;</div><div class='del'>-</div><div class='del'>-	trace_ext4_journal_start(sb, blocks, rsv_blocks, revoke_creds,</div><div class='del'>-				 _RET_IP_);</div><div class='add'>+	if (inode)</div><div class='add'>+		trace_ext4_journal_start_inode(inode, blocks, rsv_blocks,</div><div class='add'>+					revoke_creds, type,</div><div class='add'>+					_RET_IP_);</div><div class='add'>+	else</div><div class='add'>+		trace_ext4_journal_start_sb(sb, blocks, rsv_blocks,</div><div class='add'>+					revoke_creds, type,</div><div class='add'>+					_RET_IP_);</div><div class='ctx'> 	err = ext4_journal_check_start(sb);</div><div class='ctx'> 	if (err &lt; 0)</div><div class='ctx'> 		return ERR_PTR(err);</div><div class='hunk'>@@ -162,6 +171,8 @@ int __ext4_journal_ensure_credits(handle_t *handle, int check_cred,</div><div class='ctx'> {</div><div class='ctx'> 	if (!ext4_handle_valid(handle))</div><div class='ctx'> 		return 0;</div><div class='add'>+	if (is_handle_aborted(handle))</div><div class='add'>+		return -EROFS;</div><div class='ctx'> 	if (jbd2_handle_buffer_credits(handle) &gt;= check_cred &amp;&amp;</div><div class='ctx'> 	    handle-&gt;h_revoke_credits &gt;= revoke_cred)</div><div class='ctx'> 		return 0;</div><div class='hunk'>@@ -197,7 +208,7 @@ static void ext4_journal_abort_handle(const char *caller, unsigned int line,</div><div class='ctx'> </div><div class='ctx'> static void ext4_check_bdev_write_error(struct super_block *sb)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *mapping = sb-&gt;s_bdev-&gt;bd_inode-&gt;i_mapping;</div><div class='add'>+	struct address_space *mapping = sb-&gt;s_bdev-&gt;bd_mapping;</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='hunk'>@@ -226,9 +237,6 @@ int __ext4_journal_get_write_access(const char *where, unsigned int line,</div><div class='ctx'> </div><div class='ctx'> 	might_sleep();</div><div class='ctx'> </div><div class='del'>-	if (bh-&gt;b_bdev-&gt;bd_super)</div><div class='del'>-		ext4_check_bdev_write_error(bh-&gt;b_bdev-&gt;bd_super);</div><div class='del'>-</div><div class='ctx'> 	if (ext4_handle_valid(handle)) {</div><div class='ctx'> 		err = jbd2_journal_get_write_access(handle, bh);</div><div class='ctx'> 		if (err) {</div><div class='hunk'>@@ -236,8 +244,10 @@ int __ext4_journal_get_write_access(const char *where, unsigned int line,</div><div class='ctx'> 						  handle, err);</div><div class='ctx'> 			return err;</div><div class='ctx'> 		}</div><div class='del'>-	}</div><div class='del'>-	if (trigger_type == EXT4_JTR_NONE || !ext4_has_metadata_csum(sb))</div><div class='add'>+	} else</div><div class='add'>+		ext4_check_bdev_write_error(sb);</div><div class='add'>+	if (trigger_type == EXT4_JTR_NONE ||</div><div class='add'>+	    !ext4_has_feature_metadata_csum(sb))</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	BUG_ON(trigger_type &gt;= EXT4_JOURNAL_TRIGGER_COUNT);</div><div class='ctx'> 	jbd2_journal_set_triggers(bh,</div><div class='hunk'>@@ -265,14 +275,20 @@ int __ext4_forget(const char *where, unsigned int line, handle_t *handle,</div><div class='ctx'> 	trace_ext4_forget(inode, is_metadata, blocknr);</div><div class='ctx'> 	BUFFER_TRACE(bh, "enter");</div><div class='ctx'> </div><div class='del'>-	jbd_debug(4, "forgetting bh %p: is_metadata = %d, mode %o, "</div><div class='del'>-		  "data mode %x\n",</div><div class='add'>+	ext4_debug("forgetting bh %p: is_metadata=%d, mode %o, data mode %x\n",</div><div class='ctx'> 		  bh, is_metadata, inode-&gt;i_mode,</div><div class='ctx'> 		  test_opt(inode-&gt;i_sb, DATA_FLAGS));</div><div class='ctx'> </div><div class='del'>-	/* In the no journal case, we can just do a bforget and return */</div><div class='add'>+	/*</div><div class='add'>+	 * In the no journal case, we should wait for the ongoing buffer</div><div class='add'>+	 * to complete and do a forget.</div><div class='add'>+	 */</div><div class='ctx'> 	if (!ext4_handle_valid(handle)) {</div><div class='del'>-		bforget(bh);</div><div class='add'>+		if (bh) {</div><div class='add'>+			clear_buffer_dirty(bh);</div><div class='add'>+			wait_on_buffer(bh);</div><div class='add'>+			__bforget(bh);</div><div class='add'>+		}</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -325,7 +341,8 @@ int __ext4_journal_get_create_access(const char *where, unsigned int line,</div><div class='ctx'> 					  err);</div><div class='ctx'> 		return err;</div><div class='ctx'> 	}</div><div class='del'>-	if (trigger_type == EXT4_JTR_NONE || !ext4_has_metadata_csum(sb))</div><div class='add'>+	if (trigger_type == EXT4_JTR_NONE ||</div><div class='add'>+	    !ext4_has_feature_metadata_csum(sb))</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	BUG_ON(trigger_type &gt;= EXT4_JOURNAL_TRIGGER_COUNT);</div><div class='ctx'> 	jbd2_journal_set_triggers(bh,</div><div class='head'>diff --git a/fs/ext4/ext4_jbd2.h b/fs/ext4/ext4_jbd2.h<br/>index 0e4fa644df01..63d17c5201b5 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/ext4_jbd2.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/ext4_jbd2.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/ext4_jbd2.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/ext4_jbd2.h</a></div><div class='hunk'>@@ -122,90 +122,6 @@</div><div class='ctx'> #define EXT4_HT_EXT_CONVERT     11</div><div class='ctx'> #define EXT4_HT_MAX             12</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- *   struct ext4_journal_cb_entry - Base structure for callback information.</div><div class='del'>- *</div><div class='del'>- *   This struct is a 'seed' structure for a using with your own callback</div><div class='del'>- *   structs. If you are using callbacks you must allocate one of these</div><div class='del'>- *   or another struct of your own definition which has this struct</div><div class='del'>- *   as it's first element and pass it to ext4_journal_callback_add().</div><div class='del'>- */</div><div class='del'>-struct ext4_journal_cb_entry {</div><div class='del'>-	/* list information for other callbacks attached to the same handle */</div><div class='del'>-	struct list_head jce_list;</div><div class='del'>-</div><div class='del'>-	/*  Function to call with this callback structure */</div><div class='del'>-	void (*jce_func)(struct super_block *sb,</div><div class='del'>-			 struct ext4_journal_cb_entry *jce, int error);</div><div class='del'>-</div><div class='del'>-	/* user data goes here */</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * ext4_journal_callback_add: add a function to call after transaction commit</div><div class='del'>- * @handle: active journal transaction handle to register callback on</div><div class='del'>- * @func: callback function to call after the transaction has committed:</div><div class='del'>- *        @sb: superblock of current filesystem for transaction</div><div class='del'>- *        @jce: returned journal callback data</div><div class='del'>- *        @rc: journal state at commit (0 = transaction committed properly)</div><div class='del'>- * @jce: journal callback data (internal and function private data struct)</div><div class='del'>- *</div><div class='del'>- * The registered function will be called in the context of the journal thread</div><div class='del'>- * after the transaction for which the handle was created has completed.</div><div class='del'>- *</div><div class='del'>- * No locks are held when the callback function is called, so it is safe to</div><div class='del'>- * call blocking functions from within the callback, but the callback should</div><div class='del'>- * not block or run for too long, or the filesystem will be blocked waiting for</div><div class='del'>- * the next transaction to commit. No journaling functions can be used, or</div><div class='del'>- * there is a risk of deadlock.</div><div class='del'>- *</div><div class='del'>- * There is no guaranteed calling order of multiple registered callbacks on</div><div class='del'>- * the same transaction.</div><div class='del'>- */</div><div class='del'>-static inline void _ext4_journal_callback_add(handle_t *handle,</div><div class='del'>-			struct ext4_journal_cb_entry *jce)</div><div class='del'>-{</div><div class='del'>-	/* Add the jce to transaction's private list */</div><div class='del'>-	list_add_tail(&amp;jce-&gt;jce_list, &amp;handle-&gt;h_transaction-&gt;t_private_list);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void ext4_journal_callback_add(handle_t *handle,</div><div class='del'>-			void (*func)(struct super_block *sb,</div><div class='del'>-				     struct ext4_journal_cb_entry *jce,</div><div class='del'>-				     int rc),</div><div class='del'>-			struct ext4_journal_cb_entry *jce)</div><div class='del'>-{</div><div class='del'>-	struct ext4_sb_info *sbi =</div><div class='del'>-			EXT4_SB(handle-&gt;h_transaction-&gt;t_journal-&gt;j_private);</div><div class='del'>-</div><div class='del'>-	/* Add the jce to transaction's private list */</div><div class='del'>-	jce-&gt;jce_func = func;</div><div class='del'>-	spin_lock(&amp;sbi-&gt;s_md_lock);</div><div class='del'>-	_ext4_journal_callback_add(handle, jce);</div><div class='del'>-	spin_unlock(&amp;sbi-&gt;s_md_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * ext4_journal_callback_del: delete a registered callback</div><div class='del'>- * @handle: active journal transaction handle on which callback was registered</div><div class='del'>- * @jce: registered journal callback entry to unregister</div><div class='del'>- * Return true if object was successfully removed</div><div class='del'>- */</div><div class='del'>-static inline bool ext4_journal_callback_try_del(handle_t *handle,</div><div class='del'>-					     struct ext4_journal_cb_entry *jce)</div><div class='del'>-{</div><div class='del'>-	bool deleted;</div><div class='del'>-	struct ext4_sb_info *sbi =</div><div class='del'>-			EXT4_SB(handle-&gt;h_transaction-&gt;t_journal-&gt;j_private);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;sbi-&gt;s_md_lock);</div><div class='del'>-	deleted = !list_empty(&amp;jce-&gt;jce_list);</div><div class='del'>-	list_del_init(&amp;jce-&gt;jce_list);</div><div class='del'>-	spin_unlock(&amp;sbi-&gt;s_md_lock);</div><div class='del'>-	return deleted;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> int</div><div class='ctx'> ext4_mark_iloc_dirty(handle_t *handle,</div><div class='ctx'> 		     struct inode *inode,</div><div class='hunk'>@@ -261,9 +177,9 @@ int __ext4_handle_dirty_metadata(const char *where, unsigned int line,</div><div class='ctx'> 	__ext4_handle_dirty_metadata(__func__, __LINE__, (handle), (inode), \</div><div class='ctx'> 				     (bh))</div><div class='ctx'> </div><div class='del'>-handle_t *__ext4_journal_start_sb(struct super_block *sb, unsigned int line,</div><div class='del'>-				  int type, int blocks, int rsv_blocks,</div><div class='del'>-				  int revoke_creds);</div><div class='add'>+handle_t *__ext4_journal_start_sb(struct inode *inode, struct super_block *sb,</div><div class='add'>+				  unsigned int line, int type, int blocks,</div><div class='add'>+				  int rsv_blocks, int revoke_creds);</div><div class='ctx'> int __ext4_journal_stop(const char *where, unsigned int line, handle_t *handle);</div><div class='ctx'> </div><div class='ctx'> #define EXT4_NOJOURNAL_MAX_REF_COUNT ((unsigned long) 4096)</div><div class='hunk'>@@ -303,7 +219,7 @@ static inline int ext4_trans_default_revoke_credits(struct super_block *sb)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #define ext4_journal_start_sb(sb, type, nblocks)			\</div><div class='del'>-	__ext4_journal_start_sb((sb), __LINE__, (type), (nblocks), 0,	\</div><div class='add'>+	__ext4_journal_start_sb(NULL, (sb), __LINE__, (type), (nblocks), 0,\</div><div class='ctx'> 				ext4_trans_default_revoke_credits(sb))</div><div class='ctx'> </div><div class='ctx'> #define ext4_journal_start(inode, type, nblocks)			\</div><div class='hunk'>@@ -323,7 +239,7 @@ static inline handle_t *__ext4_journal_start(struct inode *inode,</div><div class='ctx'> 					     int blocks, int rsv_blocks,</div><div class='ctx'> 					     int revoke_creds)</div><div class='ctx'> {</div><div class='del'>-	return __ext4_journal_start_sb(inode-&gt;i_sb, line, type, blocks,</div><div class='add'>+	return __ext4_journal_start_sb(inode, inode-&gt;i_sb, line, type, blocks,</div><div class='ctx'> 				       rsv_blocks, revoke_creds);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -403,10 +319,10 @@ static inline int ext4_journal_ensure_credits(handle_t *handle, int credits,</div><div class='ctx'> 				revoke_creds, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int ext4_journal_blocks_per_page(struct inode *inode)</div><div class='add'>+static inline int ext4_journal_blocks_per_folio(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	if (EXT4_JOURNAL(inode) != NULL)</div><div class='del'>-		return jbd2_journal_blocks_per_page(inode);</div><div class='add'>+		return jbd2_journal_blocks_per_folio(inode);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -491,7 +407,7 @@ static inline int ext4_free_data_revoke_credits(struct inode *inode, int blocks)</div><div class='ctx'> /*</div><div class='ctx'>  * This function controls whether or not we should try to go down the</div><div class='ctx'>  * dioread_nolock code paths, which makes it safe to avoid taking</div><div class='del'>- * i_mutex for direct I/O reads.  This only works for extent-based</div><div class='add'>+ * i_rwsem for direct I/O reads.  This only works for extent-based</div><div class='ctx'>  * files, and it doesn't work if data journaling is enabled, since the</div><div class='ctx'>  * dioread_nolock code uses b_private to pass information back to the</div><div class='ctx'>  * I/O completion handler, and this conflicts with the jbd's use of</div><div class='hunk'>@@ -513,4 +429,33 @@ static inline int ext4_should_dioread_nolock(struct inode *inode)</div><div class='ctx'> 	return 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Pass journal explicitly as it may not be cached in the sbi-&gt;s_journal in some</div><div class='add'>+ * cases</div><div class='add'>+ */</div><div class='add'>+static inline int ext4_journal_destroy(struct ext4_sb_info *sbi, journal_t *journal)</div><div class='add'>+{</div><div class='add'>+	int err = 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * At this point only two things can be operating on the journal.</div><div class='add'>+	 * JBD2 thread performing transaction commit and s_sb_upd_work</div><div class='add'>+	 * issuing sb update through the journal. Once we set</div><div class='add'>+	 * EXT4_JOURNAL_DESTROY, new ext4_handle_error() calls will not</div><div class='add'>+	 * queue s_sb_upd_work and ext4_force_commit() makes sure any</div><div class='add'>+	 * ext4_handle_error() calls from the running transaction commit are</div><div class='add'>+	 * finished. Hence no new s_sb_upd_work can be queued after we</div><div class='add'>+	 * flush it here.</div><div class='add'>+	 */</div><div class='add'>+	ext4_set_mount_flag(sbi-&gt;s_sb, EXT4_MF_JOURNAL_DESTROY);</div><div class='add'>+</div><div class='add'>+	ext4_force_commit(sbi-&gt;s_sb);</div><div class='add'>+	flush_work(&amp;sbi-&gt;s_sb_upd_work);</div><div class='add'>+</div><div class='add'>+	err = jbd2_journal_destroy(journal);</div><div class='add'>+	sbi-&gt;s_journal = NULL;</div><div class='add'>+</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> #endif	/* _EXT4_JBD2_H */</div><div class='head'>diff --git a/fs/ext4/extents.c b/fs/ext4/extents.c<br/>index 0ecf819bf189..2cf5759ba689 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/extents.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/extents.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/extents.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/extents.c</a></div><div class='hunk'>@@ -27,8 +27,8 @@</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/uaccess.h&gt;</div><div class='ctx'> #include &lt;linux/fiemap.h&gt;</div><div class='del'>-#include &lt;linux/backing-dev.h&gt;</div><div class='ctx'> #include &lt;linux/iomap.h&gt;</div><div class='add'>+#include &lt;linux/sched/mm.h&gt;</div><div class='ctx'> #include "ext4_jbd2.h"</div><div class='ctx'> #include "ext4_extents.h"</div><div class='ctx'> #include "xattr.h"</div><div class='hunk'>@@ -50,10 +50,9 @@ static __le32 ext4_extent_block_csum(struct inode *inode,</div><div class='ctx'> 				     struct ext4_extent_header *eh)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_inode_info *ei = EXT4_I(inode);</div><div class='del'>-	struct ext4_sb_info *sbi = EXT4_SB(inode-&gt;i_sb);</div><div class='ctx'> 	__u32 csum;</div><div class='ctx'> </div><div class='del'>-	csum = ext4_chksum(sbi, ei-&gt;i_csum_seed, (__u8 *)eh,</div><div class='add'>+	csum = ext4_chksum(ei-&gt;i_csum_seed, (__u8 *)eh,</div><div class='ctx'> 			   EXT4_EXTENT_TAIL_OFFSET(eh));</div><div class='ctx'> 	return cpu_to_le32(csum);</div><div class='ctx'> }</div><div class='hunk'>@@ -63,7 +62,7 @@ static int ext4_extent_block_csum_verify(struct inode *inode,</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_extent_tail *et;</div><div class='ctx'> </div><div class='del'>-	if (!ext4_has_metadata_csum(inode-&gt;i_sb))</div><div class='add'>+	if (!ext4_has_feature_metadata_csum(inode-&gt;i_sb))</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='ctx'> 	et = find_ext4_extent_tail(eh);</div><div class='hunk'>@@ -77,19 +76,18 @@ static void ext4_extent_block_csum_set(struct inode *inode,</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_extent_tail *et;</div><div class='ctx'> </div><div class='del'>-	if (!ext4_has_metadata_csum(inode-&gt;i_sb))</div><div class='add'>+	if (!ext4_has_feature_metadata_csum(inode-&gt;i_sb))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	et = find_ext4_extent_tail(eh);</div><div class='ctx'> 	et-&gt;et_checksum = ext4_extent_block_csum(inode, eh);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext4_split_extent_at(handle_t *handle,</div><div class='del'>-			     struct inode *inode,</div><div class='del'>-			     struct ext4_ext_path **ppath,</div><div class='del'>-			     ext4_lblk_t split,</div><div class='del'>-			     int split_flag,</div><div class='del'>-			     int flags);</div><div class='add'>+static struct ext4_ext_path *ext4_split_extent_at(handle_t *handle,</div><div class='add'>+						  struct inode *inode,</div><div class='add'>+						  struct ext4_ext_path *path,</div><div class='add'>+						  ext4_lblk_t split,</div><div class='add'>+						  int split_flag, int flags);</div><div class='ctx'> </div><div class='ctx'> static int ext4_ext_trunc_restart_fn(struct inode *inode, int *dropped)</div><div class='ctx'> {</div><div class='hunk'>@@ -97,15 +95,40 @@ static int ext4_ext_trunc_restart_fn(struct inode *inode, int *dropped)</div><div class='ctx'> 	 * Drop i_data_sem to avoid deadlock with ext4_map_blocks.  At this</div><div class='ctx'> 	 * moment, get_block can be called only for blocks inside i_size since</div><div class='ctx'> 	 * page cache has been already dropped and writes are blocked by</div><div class='del'>-	 * i_mutex. So we can safely drop the i_data_sem here.</div><div class='add'>+	 * i_rwsem. So we can safely drop the i_data_sem here.</div><div class='ctx'> 	 */</div><div class='ctx'> 	BUG_ON(EXT4_JOURNAL(inode) == NULL);</div><div class='del'>-	ext4_discard_preallocations(inode, 0);</div><div class='add'>+	ext4_discard_preallocations(inode);</div><div class='ctx'> 	up_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='ctx'> 	*dropped = 1;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline void ext4_ext_path_brelse(struct ext4_ext_path *path)</div><div class='add'>+{</div><div class='add'>+	brelse(path-&gt;p_bh);</div><div class='add'>+	path-&gt;p_bh = NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void ext4_ext_drop_refs(struct ext4_ext_path *path)</div><div class='add'>+{</div><div class='add'>+	int depth, i;</div><div class='add'>+</div><div class='add'>+	if (IS_ERR_OR_NULL(path))</div><div class='add'>+		return;</div><div class='add'>+	depth = path-&gt;p_depth;</div><div class='add'>+	for (i = 0; i &lt;= depth; i++, path++)</div><div class='add'>+		ext4_ext_path_brelse(path);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void ext4_free_ext_path(struct ext4_ext_path *path)</div><div class='add'>+{</div><div class='add'>+	if (IS_ERR_OR_NULL(path))</div><div class='add'>+		return;</div><div class='add'>+	ext4_ext_drop_refs(path);</div><div class='add'>+	kfree(path);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Make sure 'handle' has at least 'check_cred' credits. If not, restart</div><div class='ctx'>  * transaction with 'restart_cred' credits. The function drops i_data_sem</div><div class='hunk'>@@ -304,19 +327,18 @@ static inline int ext4_ext_space_root_idx(struct inode *inode, int check)</div><div class='ctx'> 	return size;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int</div><div class='add'>+static inline struct ext4_ext_path *</div><div class='ctx'> ext4_force_split_extent_at(handle_t *handle, struct inode *inode,</div><div class='del'>-			   struct ext4_ext_path **ppath, ext4_lblk_t lblk,</div><div class='add'>+			   struct ext4_ext_path *path, ext4_lblk_t lblk,</div><div class='ctx'> 			   int nofail)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_ext_path *path = *ppath;</div><div class='ctx'> 	int unwritten = ext4_ext_is_unwritten(path[path-&gt;p_depth].p_ext);</div><div class='del'>-	int flags = EXT4_EX_NOCACHE | EXT4_GET_BLOCKS_PRE_IO;</div><div class='add'>+	int flags = EXT4_EX_NOCACHE | EXT4_GET_BLOCKS_SPLIT_NOMERGE;</div><div class='ctx'> </div><div class='ctx'> 	if (nofail)</div><div class='ctx'> 		flags |= EXT4_GET_BLOCKS_METADATA_NOFAIL | EXT4_EX_NOFAIL;</div><div class='ctx'> </div><div class='del'>-	return ext4_split_extent_at(handle, inode, ppath, lblk, unwritten ?</div><div class='add'>+	return ext4_split_extent_at(handle, inode, path, lblk, unwritten ?</div><div class='ctx'> 			EXT4_EXT_MARK_UNWRIT1|EXT4_EXT_MARK_UNWRIT2 : 0,</div><div class='ctx'> 			flags);</div><div class='ctx'> }</div><div class='hunk'>@@ -372,7 +394,7 @@ static int ext4_valid_extent_entries(struct inode *inode,</div><div class='ctx'> {</div><div class='ctx'> 	unsigned short entries;</div><div class='ctx'> 	ext4_lblk_t lblock = 0;</div><div class='del'>-	ext4_lblk_t prev = 0;</div><div class='add'>+	ext4_lblk_t cur = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (eh-&gt;eh_entries == 0)</div><div class='ctx'> 		return 1;</div><div class='hunk'>@@ -396,11 +418,11 @@ static int ext4_valid_extent_entries(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 			/* Check for overlapping extents */</div><div class='ctx'> 			lblock = le32_to_cpu(ext-&gt;ee_block);</div><div class='del'>-			if ((lblock &lt;= prev) &amp;&amp; prev) {</div><div class='add'>+			if (lblock &lt; cur) {</div><div class='ctx'> 				*pblk = ext4_ext_pblock(ext);</div><div class='ctx'> 				return 0;</div><div class='ctx'> 			}</div><div class='del'>-			prev = lblock + ext4_ext_get_actual_len(ext) - 1;</div><div class='add'>+			cur = lblock + ext4_ext_get_actual_len(ext);</div><div class='ctx'> 			ext++;</div><div class='ctx'> 			entries--;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -420,13 +442,13 @@ static int ext4_valid_extent_entries(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 			/* Check for overlapping index extents */</div><div class='ctx'> 			lblock = le32_to_cpu(ext_idx-&gt;ei_block);</div><div class='del'>-			if ((lblock &lt;= prev) &amp;&amp; prev) {</div><div class='add'>+			if (lblock &lt; cur) {</div><div class='ctx'> 				*pblk = ext4_idx_pblock(ext_idx);</div><div class='ctx'> 				return 0;</div><div class='ctx'> 			}</div><div class='ctx'> 			ext_idx++;</div><div class='ctx'> 			entries--;</div><div class='del'>-			prev = lblock;</div><div class='add'>+			cur = lblock + 1;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	return 1;</div><div class='hunk'>@@ -460,6 +482,10 @@ static int __ext4_ext_check(const char *function, unsigned int line,</div><div class='ctx'> 		error_msg = "invalid eh_entries";</div><div class='ctx'> 		goto corrupted;</div><div class='ctx'> 	}</div><div class='add'>+	if (unlikely((eh-&gt;eh_entries == 0) &amp;&amp; (depth &gt; 0))) {</div><div class='add'>+		error_msg = "eh_entries is 0 but eh_depth is &gt; 0";</div><div class='add'>+		goto corrupted;</div><div class='add'>+	}</div><div class='ctx'> 	if (!ext4_valid_extent_entries(inode, eh, lblk, &amp;pblk, depth)) {</div><div class='ctx'> 		error_msg = "invalid extent entries";</div><div class='ctx'> 		goto corrupted;</div><div class='hunk'>@@ -541,7 +567,7 @@ __read_extent_tree_block(const char *function, unsigned int line,</div><div class='ctx'> </div><div class='ctx'> 	if (!bh_uptodate_or_lock(bh)) {</div><div class='ctx'> 		trace_ext4_ext_load_extent(inode, pblk, _RET_IP_);</div><div class='del'>-		err = ext4_read_bh(bh, 0, NULL);</div><div class='add'>+		err = ext4_read_bh(bh, 0, NULL, false);</div><div class='ctx'> 		if (err &lt; 0)</div><div class='ctx'> 			goto errout;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -584,6 +610,8 @@ int ext4_ext_precache(struct inode *inode)</div><div class='ctx'> 	if (!ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS))</div><div class='ctx'> 		return 0;	/* not an extent-mapped inode */</div><div class='ctx'> </div><div class='add'>+	ext4_check_map_extents_env(inode);</div><div class='add'>+</div><div class='ctx'> 	down_read(&amp;ei-&gt;i_data_sem);</div><div class='ctx'> 	depth = ext_depth(inode);</div><div class='ctx'> </div><div class='hunk'>@@ -612,8 +640,7 @@ int ext4_ext_precache(struct inode *inode)</div><div class='ctx'> 		 */</div><div class='ctx'> 		if ((i == depth) ||</div><div class='ctx'> 		    path[i].p_idx &gt; EXT_LAST_INDEX(path[i].p_hdr)) {</div><div class='del'>-			brelse(path[i].p_bh);</div><div class='del'>-			path[i].p_bh = NULL;</div><div class='add'>+			ext4_ext_path_brelse(path + i);</div><div class='ctx'> 			i--;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -632,8 +659,7 @@ int ext4_ext_precache(struct inode *inode)</div><div class='ctx'> 	ext4_set_inode_state(inode, EXT4_STATE_EXT_PRECACHED);</div><div class='ctx'> out:</div><div class='ctx'> 	up_read(&amp;ei-&gt;i_data_sem);</div><div class='del'>-	ext4_ext_drop_refs(path);</div><div class='del'>-	kfree(path);</div><div class='add'>+	ext4_free_ext_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -667,7 +693,7 @@ static void ext4_ext_show_leaf(struct inode *inode, struct ext4_ext_path *path)</div><div class='ctx'> 	struct ext4_extent *ex;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	if (!path)</div><div class='add'>+	if (IS_ERR_OR_NULL(path))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	eh = path[depth].p_hdr;</div><div class='hunk'>@@ -720,19 +746,6 @@ static void ext4_ext_show_move(struct inode *inode, struct ext4_ext_path *path,</div><div class='ctx'> #define ext4_ext_show_move(inode, path, newblock, level)</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-void ext4_ext_drop_refs(struct ext4_ext_path *path)</div><div class='del'>-{</div><div class='del'>-	int depth, i;</div><div class='del'>-</div><div class='del'>-	if (!path)</div><div class='del'>-		return;</div><div class='del'>-	depth = path-&gt;p_depth;</div><div class='del'>-	for (i = 0; i &lt;= depth; i++, path++) {</div><div class='del'>-		brelse(path-&gt;p_bh);</div><div class='del'>-		path-&gt;p_bh = NULL;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * ext4_ext_binsearch_idx:</div><div class='ctx'>  * binary search for the closest index of the given block</div><div class='hunk'>@@ -872,11 +885,10 @@ void ext4_ext_tree_init(handle_t *handle, struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> struct ext4_ext_path *</div><div class='ctx'> ext4_find_extent(struct inode *inode, ext4_lblk_t block,</div><div class='del'>-		 struct ext4_ext_path **orig_path, int flags)</div><div class='add'>+		 struct ext4_ext_path *path, int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_extent_header *eh;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='del'>-	struct ext4_ext_path *path = orig_path ? *orig_path : NULL;</div><div class='ctx'> 	short int depth, i, ppos = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	gfp_t gfp_flags = GFP_NOFS;</div><div class='hunk'>@@ -897,7 +909,7 @@ ext4_find_extent(struct inode *inode, ext4_lblk_t block,</div><div class='ctx'> 		ext4_ext_drop_refs(path);</div><div class='ctx'> 		if (depth &gt; path[0].p_maxdepth) {</div><div class='ctx'> 			kfree(path);</div><div class='del'>-			*orig_path = path = NULL;</div><div class='add'>+			path = NULL;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!path) {</div><div class='hunk'>@@ -951,10 +963,7 @@ ext4_find_extent(struct inode *inode, ext4_lblk_t block,</div><div class='ctx'> 	return path;</div><div class='ctx'> </div><div class='ctx'> err:</div><div class='del'>-	ext4_ext_drop_refs(path);</div><div class='del'>-	kfree(path);</div><div class='del'>-	if (orig_path)</div><div class='del'>-		*orig_path = NULL;</div><div class='add'>+	ext4_free_ext_path(path);</div><div class='ctx'> 	return ERR_PTR(ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1002,6 +1011,11 @@ static int ext4_ext_insert_index(handle_t *handle, struct inode *inode,</div><div class='ctx'> 		ix = curp-&gt;p_idx;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (unlikely(ix &gt; EXT_MAX_INDEX(curp-&gt;p_hdr))) {</div><div class='add'>+		EXT4_ERROR_INODE(inode, "ix &gt; EXT_MAX_INDEX!");</div><div class='add'>+		return -EFSCORRUPTED;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	len = EXT_LAST_INDEX(curp-&gt;p_hdr) - ix + 1;</div><div class='ctx'> 	BUG_ON(len &lt; 0);</div><div class='ctx'> 	if (len &gt; 0) {</div><div class='hunk'>@@ -1011,11 +1025,6 @@ static int ext4_ext_insert_index(handle_t *handle, struct inode *inode,</div><div class='ctx'> 		memmove(ix + 1, ix, len * sizeof(struct ext4_extent_idx));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ix &gt; EXT_MAX_INDEX(curp-&gt;p_hdr))) {</div><div class='del'>-		EXT4_ERROR_INODE(inode, "ix &gt; EXT_MAX_INDEX!");</div><div class='del'>-		return -EFSCORRUPTED;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	ix-&gt;ei_block = cpu_to_le32(logical);</div><div class='ctx'> 	ext4_idx_store_pblock(ix, ptr);</div><div class='ctx'> 	le16_add_cpu(&amp;curp-&gt;p_hdr-&gt;eh_entries, 1);</div><div class='hunk'>@@ -1387,15 +1396,15 @@ out:</div><div class='ctx'>  * finds empty index and adds new leaf.</div><div class='ctx'>  * if no free index is found, then it requests in-depth growing.</div><div class='ctx'>  */</div><div class='del'>-static int ext4_ext_create_new_leaf(handle_t *handle, struct inode *inode,</div><div class='del'>-				    unsigned int mb_flags,</div><div class='del'>-				    unsigned int gb_flags,</div><div class='del'>-				    struct ext4_ext_path **ppath,</div><div class='del'>-				    struct ext4_extent *newext)</div><div class='add'>+static struct ext4_ext_path *</div><div class='add'>+ext4_ext_create_new_leaf(handle_t *handle, struct inode *inode,</div><div class='add'>+			 unsigned int mb_flags, unsigned int gb_flags,</div><div class='add'>+			 struct ext4_ext_path *path,</div><div class='add'>+			 struct ext4_extent *newext)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_ext_path *path = *ppath;</div><div class='ctx'> 	struct ext4_ext_path *curp;</div><div class='ctx'> 	int depth, i, err = 0;</div><div class='add'>+	ext4_lblk_t ee_block = le32_to_cpu(newext-&gt;ee_block);</div><div class='ctx'> </div><div class='ctx'> repeat:</div><div class='ctx'> 	i = depth = ext_depth(inode);</div><div class='hunk'>@@ -1414,42 +1423,38 @@ repeat:</div><div class='ctx'> 		 * entry: create all needed subtree and add new leaf */</div><div class='ctx'> 		err = ext4_ext_split(handle, inode, mb_flags, path, newext, i);</div><div class='ctx'> 		if (err)</div><div class='del'>-			goto out;</div><div class='add'>+			goto errout;</div><div class='ctx'> </div><div class='ctx'> 		/* refill path */</div><div class='del'>-		path = ext4_find_extent(inode,</div><div class='del'>-				    (ext4_lblk_t)le32_to_cpu(newext-&gt;ee_block),</div><div class='del'>-				    ppath, gb_flags);</div><div class='del'>-		if (IS_ERR(path))</div><div class='del'>-			err = PTR_ERR(path);</div><div class='del'>-	} else {</div><div class='del'>-		/* tree is full, time to grow in depth */</div><div class='del'>-		err = ext4_ext_grow_indepth(handle, inode, mb_flags);</div><div class='del'>-		if (err)</div><div class='del'>-			goto out;</div><div class='add'>+		path = ext4_find_extent(inode, ee_block, path, gb_flags);</div><div class='add'>+		return path;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		/* refill path */</div><div class='del'>-		path = ext4_find_extent(inode,</div><div class='del'>-				   (ext4_lblk_t)le32_to_cpu(newext-&gt;ee_block),</div><div class='del'>-				    ppath, gb_flags);</div><div class='del'>-		if (IS_ERR(path)) {</div><div class='del'>-			err = PTR_ERR(path);</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+	/* tree is full, time to grow in depth */</div><div class='add'>+	err = ext4_ext_grow_indepth(handle, inode, mb_flags);</div><div class='add'>+	if (err)</div><div class='add'>+		goto errout;</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * only first (depth 0 -&gt; 1) produces free space;</div><div class='del'>-		 * in all other cases we have to split the grown tree</div><div class='del'>-		 */</div><div class='del'>-		depth = ext_depth(inode);</div><div class='del'>-		if (path[depth].p_hdr-&gt;eh_entries == path[depth].p_hdr-&gt;eh_max) {</div><div class='del'>-			/* now we need to split */</div><div class='del'>-			goto repeat;</div><div class='del'>-		}</div><div class='add'>+	/* refill path */</div><div class='add'>+	path = ext4_find_extent(inode, ee_block, path, gb_flags);</div><div class='add'>+	if (IS_ERR(path))</div><div class='add'>+		return path;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * only first (depth 0 -&gt; 1) produces free space;</div><div class='add'>+	 * in all other cases we have to split the grown tree</div><div class='add'>+	 */</div><div class='add'>+	depth = ext_depth(inode);</div><div class='add'>+	if (path[depth].p_hdr-&gt;eh_entries == path[depth].p_hdr-&gt;eh_max) {</div><div class='add'>+		/* now we need to split */</div><div class='add'>+		goto repeat;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	return err;</div><div class='add'>+	return path;</div><div class='add'>+</div><div class='add'>+errout:</div><div class='add'>+	ext4_free_ext_path(path);</div><div class='add'>+	return ERR_PTR(err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1496,8 +1501,7 @@ static int ext4_ext_search_left(struct inode *inode,</div><div class='ctx'> 				EXT4_ERROR_INODE(inode,</div><div class='ctx'> 				  "ix (%d) != EXT_FIRST_INDEX (%d) (depth %d)!",</div><div class='ctx'> 				  ix != NULL ? le32_to_cpu(ix-&gt;ei_block) : 0,</div><div class='del'>-				  EXT_FIRST_INDEX(path[depth].p_hdr) != NULL ?</div><div class='del'>-		le32_to_cpu(EXT_FIRST_INDEX(path[depth].p_hdr)-&gt;ei_block) : 0,</div><div class='add'>+				  le32_to_cpu(EXT_FIRST_INDEX(path[depth].p_hdr)-&gt;ei_block),</div><div class='ctx'> 				  depth);</div><div class='ctx'> 				return -EFSCORRUPTED;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -1527,7 +1531,7 @@ static int ext4_ext_search_left(struct inode *inode,</div><div class='ctx'> static int ext4_ext_search_right(struct inode *inode,</div><div class='ctx'> 				 struct ext4_ext_path *path,</div><div class='ctx'> 				 ext4_lblk_t *logical, ext4_fsblk_t *phys,</div><div class='del'>-				 struct ext4_extent *ret_ex)</div><div class='add'>+				 struct ext4_extent *ret_ex, int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *bh = NULL;</div><div class='ctx'> 	struct ext4_extent_header *eh;</div><div class='hunk'>@@ -1601,7 +1605,8 @@ got_index:</div><div class='ctx'> 	ix++;</div><div class='ctx'> 	while (++depth &lt; path-&gt;p_depth) {</div><div class='ctx'> 		/* subtract from p_depth to get proper eh_depth */</div><div class='del'>-		bh = read_extent_tree_block(inode, ix, path-&gt;p_depth - depth, 0);</div><div class='add'>+		bh = read_extent_tree_block(inode, ix, path-&gt;p_depth - depth,</div><div class='add'>+					    flags);</div><div class='ctx'> 		if (IS_ERR(bh))</div><div class='ctx'> 			return PTR_ERR(bh);</div><div class='ctx'> 		eh = ext_block_hdr(bh);</div><div class='hunk'>@@ -1609,7 +1614,7 @@ got_index:</div><div class='ctx'> 		put_bh(bh);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	bh = read_extent_tree_block(inode, ix, path-&gt;p_depth - depth, 0);</div><div class='add'>+	bh = read_extent_tree_block(inode, ix, path-&gt;p_depth - depth, flags);</div><div class='ctx'> 	if (IS_ERR(bh))</div><div class='ctx'> 		return PTR_ERR(bh);</div><div class='ctx'> 	eh = ext_block_hdr(bh);</div><div class='hunk'>@@ -1742,12 +1747,23 @@ static int ext4_ext_correct_indexes(handle_t *handle, struct inode *inode,</div><div class='ctx'> 			break;</div><div class='ctx'> 		err = ext4_ext_get_access(handle, inode, path + k);</div><div class='ctx'> 		if (err)</div><div class='del'>-			break;</div><div class='add'>+			goto clean;</div><div class='ctx'> 		path[k].p_idx-&gt;ei_block = border;</div><div class='ctx'> 		err = ext4_ext_dirty(handle, inode, path + k);</div><div class='ctx'> 		if (err)</div><div class='del'>-			break;</div><div class='add'>+			goto clean;</div><div class='ctx'> 	}</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+clean:</div><div class='add'>+	/*</div><div class='add'>+	 * The path[k].p_bh is either unmodified or with no verified bit</div><div class='add'>+	 * set (see ext4_ext_get_access()). So just clear the verified bit</div><div class='add'>+	 * of the successfully modified extents buffers, which will force</div><div class='add'>+	 * these extents to be checked to avoid using inconsistent data.</div><div class='add'>+	 */</div><div class='add'>+	while (++k &lt; depth)</div><div class='add'>+		clear_buffer_verified(path[k].p_bh);</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='hunk'>@@ -1869,7 +1885,7 @@ static void ext4_ext_try_to_merge_up(handle_t *handle,</div><div class='ctx'> 		(path[1].p_ext - EXT_FIRST_EXTENT(path[1].p_hdr));</div><div class='ctx'> 	path[0].p_hdr-&gt;eh_max = cpu_to_le16(max_root);</div><div class='ctx'> </div><div class='del'>-	brelse(path[1].p_bh);</div><div class='add'>+	ext4_ext_path_brelse(path + 1);</div><div class='ctx'> 	ext4_free_blocks(handle, inode, NULL, blk, 1,</div><div class='ctx'> 			 EXT4_FREE_BLOCKS_METADATA | EXT4_FREE_BLOCKS_FORGET);</div><div class='ctx'> }</div><div class='hunk'>@@ -1957,16 +1973,15 @@ out:</div><div class='ctx'>  * inserts requested extent as new one into the tree,</div><div class='ctx'>  * creating new leaf in the no-space case.</div><div class='ctx'>  */</div><div class='del'>-int ext4_ext_insert_extent(handle_t *handle, struct inode *inode,</div><div class='del'>-				struct ext4_ext_path **ppath,</div><div class='del'>-				struct ext4_extent *newext, int gb_flags)</div><div class='add'>+struct ext4_ext_path *</div><div class='add'>+ext4_ext_insert_extent(handle_t *handle, struct inode *inode,</div><div class='add'>+		       struct ext4_ext_path *path,</div><div class='add'>+		       struct ext4_extent *newext, int gb_flags)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_ext_path *path = *ppath;</div><div class='ctx'> 	struct ext4_extent_header *eh;</div><div class='ctx'> 	struct ext4_extent *ex, *fex;</div><div class='ctx'> 	struct ext4_extent *nearex; /* nearest extent */</div><div class='del'>-	struct ext4_ext_path *npath = NULL;</div><div class='del'>-	int depth, len, err;</div><div class='add'>+	int depth, len, err = 0;</div><div class='ctx'> 	ext4_lblk_t next;</div><div class='ctx'> 	int mb_flags = 0, unwritten;</div><div class='ctx'> </div><div class='hunk'>@@ -1974,18 +1989,20 @@ int ext4_ext_insert_extent(handle_t *handle, struct inode *inode,</div><div class='ctx'> 		mb_flags |= EXT4_MB_DELALLOC_RESERVED;</div><div class='ctx'> 	if (unlikely(ext4_ext_get_actual_len(newext) == 0)) {</div><div class='ctx'> 		EXT4_ERROR_INODE(inode, "ext4_ext_get_actual_len(newext) == 0");</div><div class='del'>-		return -EFSCORRUPTED;</div><div class='add'>+		err = -EFSCORRUPTED;</div><div class='add'>+		goto errout;</div><div class='ctx'> 	}</div><div class='ctx'> 	depth = ext_depth(inode);</div><div class='ctx'> 	ex = path[depth].p_ext;</div><div class='ctx'> 	eh = path[depth].p_hdr;</div><div class='ctx'> 	if (unlikely(path[depth].p_hdr == NULL)) {</div><div class='ctx'> 		EXT4_ERROR_INODE(inode, "path[%d].p_hdr == NULL", depth);</div><div class='del'>-		return -EFSCORRUPTED;</div><div class='add'>+		err = -EFSCORRUPTED;</div><div class='add'>+		goto errout;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* try to insert block into found extent and return */</div><div class='del'>-	if (ex &amp;&amp; !(gb_flags &amp; EXT4_GET_BLOCKS_PRE_IO)) {</div><div class='add'>+	if (ex &amp;&amp; !(gb_flags &amp; EXT4_GET_BLOCKS_SPLIT_NOMERGE)) {</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Try to see whether we should rather test the extent on</div><div class='hunk'>@@ -2019,13 +2036,12 @@ int ext4_ext_insert_extent(handle_t *handle, struct inode *inode,</div><div class='ctx'> 			err = ext4_ext_get_access(handle, inode,</div><div class='ctx'> 						  path + depth);</div><div class='ctx'> 			if (err)</div><div class='del'>-				return err;</div><div class='add'>+				goto errout;</div><div class='ctx'> 			unwritten = ext4_ext_is_unwritten(ex);</div><div class='ctx'> 			ex-&gt;ee_len = cpu_to_le16(ext4_ext_get_actual_len(ex)</div><div class='ctx'> 					+ ext4_ext_get_actual_len(newext));</div><div class='ctx'> 			if (unwritten)</div><div class='ctx'> 				ext4_ext_mark_unwritten(ex);</div><div class='del'>-			eh = path[depth].p_hdr;</div><div class='ctx'> 			nearex = ex;</div><div class='ctx'> 			goto merge;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2045,7 +2061,7 @@ prepend:</div><div class='ctx'> 			err = ext4_ext_get_access(handle, inode,</div><div class='ctx'> 						  path + depth);</div><div class='ctx'> 			if (err)</div><div class='del'>-				return err;</div><div class='add'>+				goto errout;</div><div class='ctx'> </div><div class='ctx'> 			unwritten = ext4_ext_is_unwritten(ex);</div><div class='ctx'> 			ex-&gt;ee_block = newext-&gt;ee_block;</div><div class='hunk'>@@ -2054,7 +2070,6 @@ prepend:</div><div class='ctx'> 					+ ext4_ext_get_actual_len(newext));</div><div class='ctx'> 			if (unwritten)</div><div class='ctx'> 				ext4_ext_mark_unwritten(ex);</div><div class='del'>-			eh = path[depth].p_hdr;</div><div class='ctx'> 			nearex = ex;</div><div class='ctx'> 			goto merge;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2071,21 +2086,26 @@ prepend:</div><div class='ctx'> 	if (le32_to_cpu(newext-&gt;ee_block) &gt; le32_to_cpu(fex-&gt;ee_block))</div><div class='ctx'> 		next = ext4_ext_next_leaf_block(path);</div><div class='ctx'> 	if (next != EXT_MAX_BLOCKS) {</div><div class='add'>+		struct ext4_ext_path *npath;</div><div class='add'>+</div><div class='ctx'> 		ext_debug(inode, "next leaf block - %u\n", next);</div><div class='del'>-		BUG_ON(npath != NULL);</div><div class='ctx'> 		npath = ext4_find_extent(inode, next, NULL, gb_flags);</div><div class='del'>-		if (IS_ERR(npath))</div><div class='del'>-			return PTR_ERR(npath);</div><div class='add'>+		if (IS_ERR(npath)) {</div><div class='add'>+			err = PTR_ERR(npath);</div><div class='add'>+			goto errout;</div><div class='add'>+		}</div><div class='ctx'> 		BUG_ON(npath-&gt;p_depth != path-&gt;p_depth);</div><div class='ctx'> 		eh = npath[depth].p_hdr;</div><div class='ctx'> 		if (le16_to_cpu(eh-&gt;eh_entries) &lt; le16_to_cpu(eh-&gt;eh_max)) {</div><div class='ctx'> 			ext_debug(inode, "next leaf isn't full(%d)\n",</div><div class='ctx'> 				  le16_to_cpu(eh-&gt;eh_entries));</div><div class='add'>+			ext4_free_ext_path(path);</div><div class='ctx'> 			path = npath;</div><div class='ctx'> 			goto has_space;</div><div class='ctx'> 		}</div><div class='ctx'> 		ext_debug(inode, "next leaf has no free space(%d,%d)\n",</div><div class='ctx'> 			  le16_to_cpu(eh-&gt;eh_entries), le16_to_cpu(eh-&gt;eh_max));</div><div class='add'>+		ext4_free_ext_path(npath);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -2094,10 +2114,10 @@ prepend:</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (gb_flags &amp; EXT4_GET_BLOCKS_METADATA_NOFAIL)</div><div class='ctx'> 		mb_flags |= EXT4_MB_USE_RESERVED;</div><div class='del'>-	err = ext4_ext_create_new_leaf(handle, inode, mb_flags, gb_flags,</div><div class='del'>-				       ppath, newext);</div><div class='del'>-	if (err)</div><div class='del'>-		goto cleanup;</div><div class='add'>+	path = ext4_ext_create_new_leaf(handle, inode, mb_flags, gb_flags,</div><div class='add'>+					path, newext);</div><div class='add'>+	if (IS_ERR(path))</div><div class='add'>+		return path;</div><div class='ctx'> 	depth = ext_depth(inode);</div><div class='ctx'> 	eh = path[depth].p_hdr;</div><div class='ctx'> </div><div class='hunk'>@@ -2106,7 +2126,7 @@ has_space:</div><div class='ctx'> </div><div class='ctx'> 	err = ext4_ext_get_access(handle, inode, path + depth);</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto cleanup;</div><div class='add'>+		goto errout;</div><div class='ctx'> </div><div class='ctx'> 	if (!nearex) {</div><div class='ctx'> 		/* there is no extent in this leaf, create first one */</div><div class='hunk'>@@ -2161,21 +2181,23 @@ has_space:</div><div class='ctx'> </div><div class='ctx'> merge:</div><div class='ctx'> 	/* try to merge extents */</div><div class='del'>-	if (!(gb_flags &amp; EXT4_GET_BLOCKS_PRE_IO))</div><div class='add'>+	if (!(gb_flags &amp; EXT4_GET_BLOCKS_SPLIT_NOMERGE))</div><div class='ctx'> 		ext4_ext_try_to_merge(handle, inode, path, nearex);</div><div class='ctx'> </div><div class='del'>-</div><div class='ctx'> 	/* time to correct all indexes above */</div><div class='ctx'> 	err = ext4_ext_correct_indexes(handle, inode, path);</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto cleanup;</div><div class='add'>+		goto errout;</div><div class='ctx'> </div><div class='ctx'> 	err = ext4_ext_dirty(handle, inode, path + path-&gt;p_depth);</div><div class='add'>+	if (err)</div><div class='add'>+		goto errout;</div><div class='ctx'> </div><div class='del'>-cleanup:</div><div class='del'>-	ext4_ext_drop_refs(npath);</div><div class='del'>-	kfree(npath);</div><div class='del'>-	return err;</div><div class='add'>+	return path;</div><div class='add'>+</div><div class='add'>+errout:</div><div class='add'>+	ext4_free_ext_path(path);</div><div class='add'>+	return ERR_PTR(err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ext4_fill_es_cache_info(struct inode *inode,</div><div class='hunk'>@@ -2191,7 +2213,7 @@ static int ext4_fill_es_cache_info(struct inode *inode,</div><div class='ctx'> 	while (block &lt;= end) {</div><div class='ctx'> 		next = 0;</div><div class='ctx'> 		flags = 0;</div><div class='del'>-		if (!ext4_es_lookup_extent(inode, block, &amp;next, &amp;es))</div><div class='add'>+		if (!ext4_es_lookup_extent(inode, block, &amp;next, &amp;es, NULL))</div><div class='ctx'> 			break;</div><div class='ctx'> 		if (ext4_es_is_unwritten(&amp;es))</div><div class='ctx'> 			flags |= FIEMAP_EXTENT_UNWRITTEN;</div><div class='hunk'>@@ -2225,7 +2247,7 @@ static int ext4_fill_es_cache_info(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * ext4_ext_determine_hole - determine hole around given block</div><div class='add'>+ * ext4_ext_find_hole - find hole around given block according to the given path</div><div class='ctx'>  * @inode:	inode we lookup in</div><div class='ctx'>  * @path:	path in extent tree to @lblk</div><div class='ctx'>  * @lblk:	pointer to logical block around which we want to determine hole</div><div class='hunk'>@@ -2237,9 +2259,9 @@ static int ext4_fill_es_cache_info(struct inode *inode,</div><div class='ctx'>  * The function returns the length of a hole starting at @lblk. We update @lblk</div><div class='ctx'>  * to the beginning of the hole if we managed to find it.</div><div class='ctx'>  */</div><div class='del'>-static ext4_lblk_t ext4_ext_determine_hole(struct inode *inode,</div><div class='del'>-					   struct ext4_ext_path *path,</div><div class='del'>-					   ext4_lblk_t *lblk)</div><div class='add'>+static ext4_lblk_t ext4_ext_find_hole(struct inode *inode,</div><div class='add'>+				      struct ext4_ext_path *path,</div><div class='add'>+				      ext4_lblk_t *lblk)</div><div class='ctx'> {</div><div class='ctx'> 	int depth = ext_depth(inode);</div><div class='ctx'> 	struct ext4_extent *ex;</div><div class='hunk'>@@ -2267,30 +2289,6 @@ static ext4_lblk_t ext4_ext_determine_hole(struct inode *inode,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * ext4_ext_put_gap_in_cache:</div><div class='del'>- * calculate boundaries of the gap that the requested block fits into</div><div class='del'>- * and cache this gap</div><div class='del'>- */</div><div class='del'>-static void</div><div class='del'>-ext4_ext_put_gap_in_cache(struct inode *inode, ext4_lblk_t hole_start,</div><div class='del'>-			  ext4_lblk_t hole_len)</div><div class='del'>-{</div><div class='del'>-	struct extent_status es;</div><div class='del'>-</div><div class='del'>-	ext4_es_find_extent_range(inode, &amp;ext4_es_is_delayed, hole_start,</div><div class='del'>-				  hole_start + hole_len - 1, &amp;es);</div><div class='del'>-	if (es.es_len) {</div><div class='del'>-		/* There's delayed extent containing lblock? */</div><div class='del'>-		if (es.es_lblk &lt;= hole_start)</div><div class='del'>-			return;</div><div class='del'>-		hole_len = min(es.es_lblk - hole_start, hole_len);</div><div class='del'>-	}</div><div class='del'>-	ext_debug(inode, " -&gt; %u:%u\n", hole_start, hole_len);</div><div class='del'>-	ext4_es_insert_extent(inode, hole_start, hole_len, ~0,</div><div class='del'>-			      EXTENT_STATUS_HOLE);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * ext4_ext_rm_idx:</div><div class='ctx'>  * removes index from the index block.</div><div class='ctx'>  */</div><div class='hunk'>@@ -2299,27 +2297,26 @@ static int ext4_ext_rm_idx(handle_t *handle, struct inode *inode,</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='ctx'> 	ext4_fsblk_t leaf;</div><div class='add'>+	int k = depth - 1;</div><div class='ctx'> </div><div class='ctx'> 	/* free index block */</div><div class='del'>-	depth--;</div><div class='del'>-	path = path + depth;</div><div class='del'>-	leaf = ext4_idx_pblock(path-&gt;p_idx);</div><div class='del'>-	if (unlikely(path-&gt;p_hdr-&gt;eh_entries == 0)) {</div><div class='del'>-		EXT4_ERROR_INODE(inode, "path-&gt;p_hdr-&gt;eh_entries == 0");</div><div class='add'>+	leaf = ext4_idx_pblock(path[k].p_idx);</div><div class='add'>+	if (unlikely(path[k].p_hdr-&gt;eh_entries == 0)) {</div><div class='add'>+		EXT4_ERROR_INODE(inode, "path[%d].p_hdr-&gt;eh_entries == 0", k);</div><div class='ctx'> 		return -EFSCORRUPTED;</div><div class='ctx'> 	}</div><div class='del'>-	err = ext4_ext_get_access(handle, inode, path);</div><div class='add'>+	err = ext4_ext_get_access(handle, inode, path + k);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	if (path-&gt;p_idx != EXT_LAST_INDEX(path-&gt;p_hdr)) {</div><div class='del'>-		int len = EXT_LAST_INDEX(path-&gt;p_hdr) - path-&gt;p_idx;</div><div class='add'>+	if (path[k].p_idx != EXT_LAST_INDEX(path[k].p_hdr)) {</div><div class='add'>+		int len = EXT_LAST_INDEX(path[k].p_hdr) - path[k].p_idx;</div><div class='ctx'> 		len *= sizeof(struct ext4_extent_idx);</div><div class='del'>-		memmove(path-&gt;p_idx, path-&gt;p_idx + 1, len);</div><div class='add'>+		memmove(path[k].p_idx, path[k].p_idx + 1, len);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	le16_add_cpu(&amp;path-&gt;p_hdr-&gt;eh_entries, -1);</div><div class='del'>-	err = ext4_ext_dirty(handle, inode, path);</div><div class='add'>+	le16_add_cpu(&amp;path[k].p_hdr-&gt;eh_entries, -1);</div><div class='add'>+	err = ext4_ext_dirty(handle, inode, path + k);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> 	ext_debug(inode, "index is empty, remove it, free block %llu\n", leaf);</div><div class='hunk'>@@ -2328,18 +2325,29 @@ static int ext4_ext_rm_idx(handle_t *handle, struct inode *inode,</div><div class='ctx'> 	ext4_free_blocks(handle, inode, NULL, leaf, 1,</div><div class='ctx'> 			 EXT4_FREE_BLOCKS_METADATA | EXT4_FREE_BLOCKS_FORGET);</div><div class='ctx'> </div><div class='del'>-	while (--depth &gt;= 0) {</div><div class='del'>-		if (path-&gt;p_idx != EXT_FIRST_INDEX(path-&gt;p_hdr))</div><div class='add'>+	while (--k &gt;= 0) {</div><div class='add'>+		if (path[k + 1].p_idx != EXT_FIRST_INDEX(path[k + 1].p_hdr))</div><div class='ctx'> 			break;</div><div class='del'>-		path--;</div><div class='del'>-		err = ext4_ext_get_access(handle, inode, path);</div><div class='add'>+		err = ext4_ext_get_access(handle, inode, path + k);</div><div class='ctx'> 		if (err)</div><div class='del'>-			break;</div><div class='del'>-		path-&gt;p_idx-&gt;ei_block = (path+1)-&gt;p_idx-&gt;ei_block;</div><div class='del'>-		err = ext4_ext_dirty(handle, inode, path);</div><div class='add'>+			goto clean;</div><div class='add'>+		path[k].p_idx-&gt;ei_block = path[k + 1].p_idx-&gt;ei_block;</div><div class='add'>+		err = ext4_ext_dirty(handle, inode, path + k);</div><div class='ctx'> 		if (err)</div><div class='del'>-			break;</div><div class='add'>+			goto clean;</div><div class='ctx'> 	}</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+clean:</div><div class='add'>+	/*</div><div class='add'>+	 * The path[k].p_bh is either unmodified or with no verified bit</div><div class='add'>+	 * set (see ext4_ext_get_access()). So just clear the verified bit</div><div class='add'>+	 * of the successfully modified extents buffers, which will force</div><div class='add'>+	 * these extents to be checked to avoid using inconsistent data.</div><div class='add'>+	 */</div><div class='add'>+	while (++k &lt; depth)</div><div class='add'>+		clear_buffer_verified(path[k].p_bh);</div><div class='add'>+</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2390,18 +2398,20 @@ int ext4_ext_calc_credits_for_single_extent(struct inode *inode, int nrblocks,</div><div class='ctx'> int ext4_ext_index_trans_blocks(struct inode *inode, int extents)</div><div class='ctx'> {</div><div class='ctx'> 	int index;</div><div class='del'>-	int depth;</div><div class='ctx'> </div><div class='ctx'> 	/* If we are converting the inline data, only one is needed here. */</div><div class='ctx'> 	if (ext4_has_inline_data(inode))</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='del'>-	depth = ext_depth(inode);</div><div class='del'>-</div><div class='add'>+	/*</div><div class='add'>+	 * Extent tree can change between the time we estimate credits and</div><div class='add'>+	 * the time we actually modify the tree. Assume the worst case.</div><div class='add'>+	 */</div><div class='ctx'> 	if (extents &lt;= 1)</div><div class='del'>-		index = depth * 2;</div><div class='add'>+		index = (EXT4_MAX_EXTENT_DEPTH * 2) + extents;</div><div class='ctx'> 	else</div><div class='del'>-		index = depth * 3;</div><div class='add'>+		index = (EXT4_MAX_EXTENT_DEPTH * 3) +</div><div class='add'>+			DIV_ROUND_UP(extents, ext4_ext_space_block(inode, 0));</div><div class='ctx'> </div><div class='ctx'> 	return index;</div><div class='ctx'> }</div><div class='hunk'>@@ -2631,9 +2641,8 @@ ext4_ext_rm_leaf(handle_t *handle, struct inode *inode,</div><div class='ctx'> 			  unwritten, ex_ee_len);</div><div class='ctx'> 		path[depth].p_ext = ex;</div><div class='ctx'> </div><div class='del'>-		a = ex_ee_block &gt; start ? ex_ee_block : start;</div><div class='del'>-		b = ex_ee_block+ex_ee_len - 1 &lt; end ?</div><div class='del'>-			ex_ee_block+ex_ee_len - 1 : end;</div><div class='add'>+		a = max(ex_ee_block, start);</div><div class='add'>+		b = min(ex_ee_block + ex_ee_len - 1, end);</div><div class='ctx'> </div><div class='ctx'> 		ext_debug(inode, "  border %u:%u\n", a, b);</div><div class='ctx'> </div><div class='hunk'>@@ -2816,6 +2825,7 @@ int ext4_ext_remove_space(struct inode *inode, ext4_lblk_t start,</div><div class='ctx'> 	struct partial_cluster partial;</div><div class='ctx'> 	handle_t *handle;</div><div class='ctx'> 	int i = 0, err = 0;</div><div class='add'>+	int flags = EXT4_EX_NOCACHE | EXT4_EX_NOFAIL;</div><div class='ctx'> </div><div class='ctx'> 	partial.pclu = 0;</div><div class='ctx'> 	partial.lblk = 0;</div><div class='hunk'>@@ -2846,8 +2856,7 @@ again:</div><div class='ctx'> 		ext4_fsblk_t pblk;</div><div class='ctx'> </div><div class='ctx'> 		/* find extent for or closest extent to this block */</div><div class='del'>-		path = ext4_find_extent(inode, end, NULL,</div><div class='del'>-					EXT4_EX_NOCACHE | EXT4_EX_NOFAIL);</div><div class='add'>+		path = ext4_find_extent(inode, end, NULL, flags);</div><div class='ctx'> 		if (IS_ERR(path)) {</div><div class='ctx'> 			ext4_journal_stop(handle);</div><div class='ctx'> 			return PTR_ERR(path);</div><div class='hunk'>@@ -2893,11 +2902,12 @@ again:</div><div class='ctx'> 			 * fail removing space due to ENOSPC so try to use</div><div class='ctx'> 			 * reserved block if that happens.</div><div class='ctx'> 			 */</div><div class='del'>-			err = ext4_force_split_extent_at(handle, inode, &amp;path,</div><div class='del'>-							 end + 1, 1);</div><div class='del'>-			if (err &lt; 0)</div><div class='add'>+			path = ext4_force_split_extent_at(handle, inode, path,</div><div class='add'>+							  end + 1, 1);</div><div class='add'>+			if (IS_ERR(path)) {</div><div class='add'>+				err = PTR_ERR(path);</div><div class='ctx'> 				goto out;</div><div class='del'>-</div><div class='add'>+			}</div><div class='ctx'> 		} else if (sbi-&gt;s_cluster_ratio &gt; 1 &amp;&amp; end &gt;= ex_end &amp;&amp;</div><div class='ctx'> 			   partial.state == initial) {</div><div class='ctx'> 			/*</div><div class='hunk'>@@ -2912,7 +2922,7 @@ again:</div><div class='ctx'> 			 */</div><div class='ctx'> 			lblk = ex_end + 1;</div><div class='ctx'> 			err = ext4_ext_search_right(inode, path, &amp;lblk, &amp;pblk,</div><div class='del'>-						    NULL);</div><div class='add'>+						    NULL, flags);</div><div class='ctx'> 			if (err &lt; 0)</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			if (pblk) {</div><div class='hunk'>@@ -2955,8 +2965,7 @@ again:</div><div class='ctx'> 			err = ext4_ext_rm_leaf(handle, inode, path,</div><div class='ctx'> 					       &amp;partial, start, end);</div><div class='ctx'> 			/* root level has p_bh == NULL, brelse() eats this */</div><div class='del'>-			brelse(path[i].p_bh);</div><div class='del'>-			path[i].p_bh = NULL;</div><div class='add'>+			ext4_ext_path_brelse(path + i);</div><div class='ctx'> 			i--;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2989,8 +2998,7 @@ again:</div><div class='ctx'> 				  i + 1, ext4_idx_pblock(path[i].p_idx));</div><div class='ctx'> 			memset(path + i + 1, 0, sizeof(*path));</div><div class='ctx'> 			bh = read_extent_tree_block(inode, path[i].p_idx,</div><div class='del'>-						    depth - i - 1,</div><div class='del'>-						    EXT4_EX_NOCACHE);</div><div class='add'>+						    depth - i - 1, flags);</div><div class='ctx'> 			if (IS_ERR(bh)) {</div><div class='ctx'> 				/* should we reset i_size? */</div><div class='ctx'> 				err = PTR_ERR(bh);</div><div class='hunk'>@@ -3018,8 +3026,7 @@ again:</div><div class='ctx'> 				err = ext4_ext_rm_idx(handle, inode, path, i);</div><div class='ctx'> 			}</div><div class='ctx'> 			/* root level has p_bh == NULL, brelse() eats this */</div><div class='del'>-			brelse(path[i].p_bh);</div><div class='del'>-			path[i].p_bh = NULL;</div><div class='add'>+			ext4_ext_path_brelse(path + i);</div><div class='ctx'> 			i--;</div><div class='ctx'> 			ext_debug(inode, "return to level %d\n", i);</div><div class='ctx'> 		}</div><div class='hunk'>@@ -3060,8 +3067,7 @@ again:</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='del'>-	ext4_ext_drop_refs(path);</div><div class='del'>-	kfree(path);</div><div class='add'>+	ext4_free_ext_path(path);</div><div class='ctx'> 	path = NULL;</div><div class='ctx'> 	if (err == -EAGAIN)</div><div class='ctx'> 		goto again;</div><div class='hunk'>@@ -3121,7 +3127,7 @@ void ext4_ext_release(struct super_block *sb)</div><div class='ctx'> #endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext4_zeroout_es(struct inode *inode, struct ext4_extent *ex)</div><div class='add'>+static void ext4_zeroout_es(struct inode *inode, struct ext4_extent *ex)</div><div class='ctx'> {</div><div class='ctx'> 	ext4_lblk_t  ee_block;</div><div class='ctx'> 	ext4_fsblk_t ee_pblock;</div><div class='hunk'>@@ -3132,10 +3138,10 @@ static int ext4_zeroout_es(struct inode *inode, struct ext4_extent *ex)</div><div class='ctx'> 	ee_pblock = ext4_ext_pblock(ex);</div><div class='ctx'> </div><div class='ctx'> 	if (ee_len == 0)</div><div class='del'>-		return 0;</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	return ext4_es_insert_extent(inode, ee_block, ee_len, ee_pblock,</div><div class='del'>-				     EXTENT_STATUS_WRITTEN);</div><div class='add'>+	ext4_es_insert_extent(inode, ee_block, ee_len, ee_pblock,</div><div class='add'>+			      EXTENT_STATUS_WRITTEN, false);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* FIXME!! we need to try to merge to left or right after zero-out  */</div><div class='hunk'>@@ -3169,16 +3175,14 @@ static int ext4_ext_zeroout(struct inode *inode, struct ext4_extent *ex)</div><div class='ctx'>  *  a&gt; the extent are splitted into two extent.</div><div class='ctx'>  *  b&gt; split is not needed, and just mark the extent.</div><div class='ctx'>  *</div><div class='del'>- * return 0 on success.</div><div class='add'>+ * Return an extent path pointer on success, or an error pointer on failure.</div><div class='ctx'>  */</div><div class='del'>-static int ext4_split_extent_at(handle_t *handle,</div><div class='del'>-			     struct inode *inode,</div><div class='del'>-			     struct ext4_ext_path **ppath,</div><div class='del'>-			     ext4_lblk_t split,</div><div class='del'>-			     int split_flag,</div><div class='del'>-			     int flags)</div><div class='add'>+static struct ext4_ext_path *ext4_split_extent_at(handle_t *handle,</div><div class='add'>+						  struct inode *inode,</div><div class='add'>+						  struct ext4_ext_path *path,</div><div class='add'>+						  ext4_lblk_t split,</div><div class='add'>+						  int split_flag, int flags)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_ext_path *path = *ppath;</div><div class='ctx'> 	ext4_fsblk_t newblock;</div><div class='ctx'> 	ext4_lblk_t ee_block;</div><div class='ctx'> 	struct ext4_extent *ex, newex, orig_ex, zero_ex;</div><div class='hunk'>@@ -3220,7 +3224,7 @@ static int ext4_split_extent_at(handle_t *handle,</div><div class='ctx'> 		else</div><div class='ctx'> 			ext4_ext_mark_initialized(ex);</div><div class='ctx'> </div><div class='del'>-		if (!(flags &amp; EXT4_GET_BLOCKS_PRE_IO))</div><div class='add'>+		if (!(flags &amp; EXT4_GET_BLOCKS_SPLIT_NOMERGE))</div><div class='ctx'> 			ext4_ext_try_to_merge(handle, inode, path, ex);</div><div class='ctx'> </div><div class='ctx'> 		err = ext4_ext_dirty(handle, inode, path + path-&gt;p_depth);</div><div class='hunk'>@@ -3248,10 +3252,31 @@ static int ext4_split_extent_at(handle_t *handle,</div><div class='ctx'> 	if (split_flag &amp; EXT4_EXT_MARK_UNWRIT2)</div><div class='ctx'> 		ext4_ext_mark_unwritten(ex2);</div><div class='ctx'> </div><div class='del'>-	err = ext4_ext_insert_extent(handle, inode, ppath, &amp;newex, flags);</div><div class='del'>-	if (err != -ENOSPC &amp;&amp; err != -EDQUOT)</div><div class='add'>+	path = ext4_ext_insert_extent(handle, inode, path, &amp;newex, flags);</div><div class='add'>+	if (!IS_ERR(path))</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='add'>+	err = PTR_ERR(path);</div><div class='add'>+	if (err != -ENOSPC &amp;&amp; err != -EDQUOT &amp;&amp; err != -ENOMEM)</div><div class='add'>+		return path;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Get a new path to try to zeroout or fix the extent length.</div><div class='add'>+	 * Using EXT4_EX_NOFAIL guarantees that ext4_find_extent()</div><div class='add'>+	 * will not return -ENOMEM, otherwise -ENOMEM will cause a</div><div class='add'>+	 * retry in do_writepages(), and a WARN_ON may be triggered</div><div class='add'>+	 * in ext4_da_update_reserve_space() due to an incorrect</div><div class='add'>+	 * ee_len causing the i_reserved_data_blocks exception.</div><div class='add'>+	 */</div><div class='add'>+	path = ext4_find_extent(inode, ee_block, NULL, flags | EXT4_EX_NOFAIL);</div><div class='add'>+	if (IS_ERR(path)) {</div><div class='add'>+		EXT4_ERROR_INODE(inode, "Failed split extent on %u, err %ld",</div><div class='add'>+				 split, PTR_ERR(path));</div><div class='add'>+		return path;</div><div class='add'>+	}</div><div class='add'>+	depth = ext_depth(inode);</div><div class='add'>+	ex = path[depth].p_ext;</div><div class='add'>+</div><div class='ctx'> 	if (EXT4_EXT_MAY_ZEROOUT &amp; split_flag) {</div><div class='ctx'> 		if (split_flag &amp; (EXT4_EXT_DATA_VALID1|EXT4_EXT_DATA_VALID2)) {</div><div class='ctx'> 			if (split_flag &amp; EXT4_EXT_DATA_VALID1) {</div><div class='hunk'>@@ -3285,7 +3310,7 @@ static int ext4_split_extent_at(handle_t *handle,</div><div class='ctx'> 			err = ext4_ext_dirty(handle, inode, path + path-&gt;p_depth);</div><div class='ctx'> 			if (!err)</div><div class='ctx'> 				/* update extent status tree */</div><div class='del'>-				err = ext4_zeroout_es(inode, &amp;zero_ex);</div><div class='add'>+				ext4_zeroout_es(inode, &amp;zero_ex);</div><div class='ctx'> 			/* If we failed at this point, we don't know in which</div><div class='ctx'> 			 * state the extent tree exactly is so don't try to fix</div><div class='ctx'> 			 * length of the original extent as it may do even more</div><div class='hunk'>@@ -3302,14 +3327,17 @@ fix_extent_len:</div><div class='ctx'> 	 * and err is a non-zero error code.</div><div class='ctx'> 	 */</div><div class='ctx'> 	ext4_ext_dirty(handle, inode, path + path-&gt;p_depth);</div><div class='del'>-	return err;</div><div class='ctx'> out:</div><div class='add'>+	if (err) {</div><div class='add'>+		ext4_free_ext_path(path);</div><div class='add'>+		path = ERR_PTR(err);</div><div class='add'>+	}</div><div class='ctx'> 	ext4_ext_show_leaf(inode, path);</div><div class='del'>-	return err;</div><div class='add'>+	return path;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * ext4_split_extents() splits an extent and mark extent which is covered</div><div class='add'>+ * ext4_split_extent() splits an extent and mark extent which is covered</div><div class='ctx'>  * by @map as split_flags indicates</div><div class='ctx'>  *</div><div class='ctx'>  * It may result in splitting the extent into multiple extents (up to three)</div><div class='hunk'>@@ -3319,21 +3347,18 @@ out:</div><div class='ctx'>  *   c&gt; Splits in three extents: Somone is splitting in middle of the extent</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='del'>-static int ext4_split_extent(handle_t *handle,</div><div class='del'>-			      struct inode *inode,</div><div class='del'>-			      struct ext4_ext_path **ppath,</div><div class='del'>-			      struct ext4_map_blocks *map,</div><div class='del'>-			      int split_flag,</div><div class='del'>-			      int flags)</div><div class='add'>+static struct ext4_ext_path *ext4_split_extent(handle_t *handle,</div><div class='add'>+					       struct inode *inode,</div><div class='add'>+					       struct ext4_ext_path *path,</div><div class='add'>+					       struct ext4_map_blocks *map,</div><div class='add'>+					       int split_flag, int flags,</div><div class='add'>+					       unsigned int *allocated)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_ext_path *path = *ppath;</div><div class='ctx'> 	ext4_lblk_t ee_block;</div><div class='ctx'> 	struct ext4_extent *ex;</div><div class='ctx'> 	unsigned int ee_len, depth;</div><div class='del'>-	int err = 0;</div><div class='ctx'> 	int unwritten;</div><div class='ctx'> 	int split_flag1, flags1;</div><div class='del'>-	int allocated = map-&gt;m_len;</div><div class='ctx'> </div><div class='ctx'> 	depth = ext_depth(inode);</div><div class='ctx'> 	ex = path[depth].p_ext;</div><div class='hunk'>@@ -3343,35 +3368,33 @@ static int ext4_split_extent(handle_t *handle,</div><div class='ctx'> </div><div class='ctx'> 	if (map-&gt;m_lblk + map-&gt;m_len &lt; ee_block + ee_len) {</div><div class='ctx'> 		split_flag1 = split_flag &amp; EXT4_EXT_MAY_ZEROOUT;</div><div class='del'>-		flags1 = flags | EXT4_GET_BLOCKS_PRE_IO;</div><div class='add'>+		flags1 = flags | EXT4_GET_BLOCKS_SPLIT_NOMERGE;</div><div class='ctx'> 		if (unwritten)</div><div class='ctx'> 			split_flag1 |= EXT4_EXT_MARK_UNWRIT1 |</div><div class='ctx'> 				       EXT4_EXT_MARK_UNWRIT2;</div><div class='ctx'> 		if (split_flag &amp; EXT4_EXT_DATA_VALID2)</div><div class='ctx'> 			split_flag1 |= EXT4_EXT_DATA_VALID1;</div><div class='del'>-		err = ext4_split_extent_at(handle, inode, ppath,</div><div class='add'>+		path = ext4_split_extent_at(handle, inode, path,</div><div class='ctx'> 				map-&gt;m_lblk + map-&gt;m_len, split_flag1, flags1);</div><div class='del'>-		if (err)</div><div class='del'>-			goto out;</div><div class='del'>-	} else {</div><div class='del'>-		allocated = ee_len - (map-&gt;m_lblk - ee_block);</div><div class='del'>-	}</div><div class='del'>-	/*</div><div class='del'>-	 * Update path is required because previous ext4_split_extent_at() may</div><div class='del'>-	 * result in split of original leaf or extent zeroout.</div><div class='del'>-	 */</div><div class='del'>-	path = ext4_find_extent(inode, map-&gt;m_lblk, ppath, flags);</div><div class='del'>-	if (IS_ERR(path))</div><div class='del'>-		return PTR_ERR(path);</div><div class='del'>-	depth = ext_depth(inode);</div><div class='del'>-	ex = path[depth].p_ext;</div><div class='del'>-	if (!ex) {</div><div class='del'>-		EXT4_ERROR_INODE(inode, "unexpected hole at %lu",</div><div class='del'>-				 (unsigned long) map-&gt;m_lblk);</div><div class='del'>-		return -EFSCORRUPTED;</div><div class='add'>+		if (IS_ERR(path))</div><div class='add'>+			return path;</div><div class='add'>+		/*</div><div class='add'>+		 * Update path is required because previous ext4_split_extent_at</div><div class='add'>+		 * may result in split of original leaf or extent zeroout.</div><div class='add'>+		 */</div><div class='add'>+		path = ext4_find_extent(inode, map-&gt;m_lblk, path, flags);</div><div class='add'>+		if (IS_ERR(path))</div><div class='add'>+			return path;</div><div class='add'>+		depth = ext_depth(inode);</div><div class='add'>+		ex = path[depth].p_ext;</div><div class='add'>+		if (!ex) {</div><div class='add'>+			EXT4_ERROR_INODE(inode, "unexpected hole at %lu",</div><div class='add'>+					(unsigned long) map-&gt;m_lblk);</div><div class='add'>+			ext4_free_ext_path(path);</div><div class='add'>+			return ERR_PTR(-EFSCORRUPTED);</div><div class='add'>+		}</div><div class='add'>+		unwritten = ext4_ext_is_unwritten(ex);</div><div class='ctx'> 	}</div><div class='del'>-	unwritten = ext4_ext_is_unwritten(ex);</div><div class='del'>-	split_flag1 = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (map-&gt;m_lblk &gt;= ee_block) {</div><div class='ctx'> 		split_flag1 = split_flag &amp; EXT4_EXT_DATA_VALID2;</div><div class='hunk'>@@ -3380,15 +3403,20 @@ static int ext4_split_extent(handle_t *handle,</div><div class='ctx'> 			split_flag1 |= split_flag &amp; (EXT4_EXT_MAY_ZEROOUT |</div><div class='ctx'> 						     EXT4_EXT_MARK_UNWRIT2);</div><div class='ctx'> 		}</div><div class='del'>-		err = ext4_split_extent_at(handle, inode, ppath,</div><div class='add'>+		path = ext4_split_extent_at(handle, inode, path,</div><div class='ctx'> 				map-&gt;m_lblk, split_flag1, flags);</div><div class='del'>-		if (err)</div><div class='del'>-			goto out;</div><div class='add'>+		if (IS_ERR(path))</div><div class='add'>+			return path;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (allocated) {</div><div class='add'>+		if (map-&gt;m_lblk + map-&gt;m_len &gt; ee_block + ee_len)</div><div class='add'>+			*allocated = ee_len - (map-&gt;m_lblk - ee_block);</div><div class='add'>+		else</div><div class='add'>+			*allocated = map-&gt;m_len;</div><div class='add'>+	}</div><div class='ctx'> 	ext4_ext_show_leaf(inode, path);</div><div class='del'>-out:</div><div class='del'>-	return err ? err : allocated;</div><div class='add'>+	return path;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -3411,13 +3439,11 @@ out:</div><div class='ctx'>  *    that are allocated and initialized.</div><div class='ctx'>  *    It is guaranteed to be &gt;= map-&gt;m_len.</div><div class='ctx'>  */</div><div class='del'>-static int ext4_ext_convert_to_initialized(handle_t *handle,</div><div class='del'>-					   struct inode *inode,</div><div class='del'>-					   struct ext4_map_blocks *map,</div><div class='del'>-					   struct ext4_ext_path **ppath,</div><div class='del'>-					   int flags)</div><div class='add'>+static struct ext4_ext_path *</div><div class='add'>+ext4_ext_convert_to_initialized(handle_t *handle, struct inode *inode,</div><div class='add'>+			struct ext4_map_blocks *map, struct ext4_ext_path *path,</div><div class='add'>+			int flags, unsigned int *allocated)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_ext_path *path = *ppath;</div><div class='ctx'> 	struct ext4_sb_info *sbi;</div><div class='ctx'> 	struct ext4_extent_header *eh;</div><div class='ctx'> 	struct ext4_map_blocks split_map;</div><div class='hunk'>@@ -3425,9 +3451,9 @@ static int ext4_ext_convert_to_initialized(handle_t *handle,</div><div class='ctx'> 	struct ext4_extent *ex, *abut_ex;</div><div class='ctx'> 	ext4_lblk_t ee_block, eof_block;</div><div class='ctx'> 	unsigned int ee_len, depth, map_len = map-&gt;m_len;</div><div class='del'>-	int allocated = 0, max_zeroout = 0;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> 	int split_flag = EXT4_EXT_DATA_VALID2;</div><div class='add'>+	unsigned int max_zeroout = 0;</div><div class='ctx'> </div><div class='ctx'> 	ext_debug(inode, "logical block %llu, max_blocks %u\n",</div><div class='ctx'> 		  (unsigned long long)map-&gt;m_lblk, map_len);</div><div class='hunk'>@@ -3467,6 +3493,7 @@ static int ext4_ext_convert_to_initialized(handle_t *handle,</div><div class='ctx'> 	 *  - L2: we only attempt to merge with an extent stored in the</div><div class='ctx'> 	 *    same extent tree node.</div><div class='ctx'> 	 */</div><div class='add'>+	*allocated = 0;</div><div class='ctx'> 	if ((map-&gt;m_lblk == ee_block) &amp;&amp;</div><div class='ctx'> 		/* See if we can merge left */</div><div class='ctx'> 		(map_len &lt; ee_len) &amp;&amp;		/*L1*/</div><div class='hunk'>@@ -3496,7 +3523,7 @@ static int ext4_ext_convert_to_initialized(handle_t *handle,</div><div class='ctx'> 			(prev_len &lt; (EXT_INIT_MAX_LEN - map_len))) {	/*C4*/</div><div class='ctx'> 			err = ext4_ext_get_access(handle, inode, path + depth);</div><div class='ctx'> 			if (err)</div><div class='del'>-				goto out;</div><div class='add'>+				goto errout;</div><div class='ctx'> </div><div class='ctx'> 			trace_ext4_ext_convert_to_initialized_fastpath(inode,</div><div class='ctx'> 				map, ex, abut_ex);</div><div class='hunk'>@@ -3511,7 +3538,7 @@ static int ext4_ext_convert_to_initialized(handle_t *handle,</div><div class='ctx'> 			abut_ex-&gt;ee_len = cpu_to_le16(prev_len + map_len);</div><div class='ctx'> </div><div class='ctx'> 			/* Result: number of initialized blocks past m_lblk */</div><div class='del'>-			allocated = map_len;</div><div class='add'>+			*allocated = map_len;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else if (((map-&gt;m_lblk + map_len) == (ee_block + ee_len)) &amp;&amp;</div><div class='ctx'> 		   (map_len &lt; ee_len) &amp;&amp;	/*L1*/</div><div class='hunk'>@@ -3542,7 +3569,7 @@ static int ext4_ext_convert_to_initialized(handle_t *handle,</div><div class='ctx'> 		    (next_len &lt; (EXT_INIT_MAX_LEN - map_len))) {	/*C4*/</div><div class='ctx'> 			err = ext4_ext_get_access(handle, inode, path + depth);</div><div class='ctx'> 			if (err)</div><div class='del'>-				goto out;</div><div class='add'>+				goto errout;</div><div class='ctx'> </div><div class='ctx'> 			trace_ext4_ext_convert_to_initialized_fastpath(inode,</div><div class='ctx'> 				map, ex, abut_ex);</div><div class='hunk'>@@ -3557,18 +3584,20 @@ static int ext4_ext_convert_to_initialized(handle_t *handle,</div><div class='ctx'> 			abut_ex-&gt;ee_len = cpu_to_le16(next_len + map_len);</div><div class='ctx'> </div><div class='ctx'> 			/* Result: number of initialized blocks past m_lblk */</div><div class='del'>-			allocated = map_len;</div><div class='add'>+			*allocated = map_len;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	if (allocated) {</div><div class='add'>+	if (*allocated) {</div><div class='ctx'> 		/* Mark the block containing both extents as dirty */</div><div class='ctx'> 		err = ext4_ext_dirty(handle, inode, path + depth);</div><div class='ctx'> </div><div class='ctx'> 		/* Update path to point to the right extent */</div><div class='ctx'> 		path[depth].p_ext = abut_ex;</div><div class='add'>+		if (err)</div><div class='add'>+			goto errout;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	} else</div><div class='del'>-		allocated = ee_len - (map-&gt;m_lblk - ee_block);</div><div class='add'>+		*allocated = ee_len - (map-&gt;m_lblk - ee_block);</div><div class='ctx'> </div><div class='ctx'> 	WARN_ON(map-&gt;m_lblk &lt; ee_block);</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -3595,21 +3624,21 @@ static int ext4_ext_convert_to_initialized(handle_t *handle,</div><div class='ctx'> 	split_map.m_lblk = map-&gt;m_lblk;</div><div class='ctx'> 	split_map.m_len = map-&gt;m_len;</div><div class='ctx'> </div><div class='del'>-	if (max_zeroout &amp;&amp; (allocated &gt; split_map.m_len)) {</div><div class='del'>-		if (allocated &lt;= max_zeroout) {</div><div class='add'>+	if (max_zeroout &amp;&amp; (*allocated &gt; split_map.m_len)) {</div><div class='add'>+		if (*allocated &lt;= max_zeroout) {</div><div class='ctx'> 			/* case 3 or 5 */</div><div class='ctx'> 			zero_ex1.ee_block =</div><div class='ctx'> 				 cpu_to_le32(split_map.m_lblk +</div><div class='ctx'> 					     split_map.m_len);</div><div class='ctx'> 			zero_ex1.ee_len =</div><div class='del'>-				cpu_to_le16(allocated - split_map.m_len);</div><div class='add'>+				cpu_to_le16(*allocated - split_map.m_len);</div><div class='ctx'> 			ext4_ext_store_pblock(&amp;zero_ex1,</div><div class='ctx'> 				ext4_ext_pblock(ex) + split_map.m_lblk +</div><div class='ctx'> 				split_map.m_len - ee_block);</div><div class='ctx'> 			err = ext4_ext_zeroout(inode, &amp;zero_ex1);</div><div class='ctx'> 			if (err)</div><div class='ctx'> 				goto fallback;</div><div class='del'>-			split_map.m_len = allocated;</div><div class='add'>+			split_map.m_len = *allocated;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (split_map.m_lblk - ee_block + split_map.m_len &lt;</div><div class='ctx'> 								max_zeroout) {</div><div class='hunk'>@@ -3627,23 +3656,24 @@ static int ext4_ext_convert_to_initialized(handle_t *handle,</div><div class='ctx'> </div><div class='ctx'> 			split_map.m_len += split_map.m_lblk - ee_block;</div><div class='ctx'> 			split_map.m_lblk = ee_block;</div><div class='del'>-			allocated = map-&gt;m_len;</div><div class='add'>+			*allocated = map-&gt;m_len;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> fallback:</div><div class='del'>-	err = ext4_split_extent(handle, inode, ppath, &amp;split_map, split_flag,</div><div class='del'>-				flags);</div><div class='del'>-	if (err &gt; 0)</div><div class='del'>-		err = 0;</div><div class='add'>+	path = ext4_split_extent(handle, inode, path, &amp;split_map, split_flag,</div><div class='add'>+				 flags, NULL);</div><div class='add'>+	if (IS_ERR(path))</div><div class='add'>+		return path;</div><div class='ctx'> out:</div><div class='ctx'> 	/* If we have gotten a failure, don't zero out status tree */</div><div class='del'>-	if (!err) {</div><div class='del'>-		err = ext4_zeroout_es(inode, &amp;zero_ex1);</div><div class='del'>-		if (!err)</div><div class='del'>-			err = ext4_zeroout_es(inode, &amp;zero_ex2);</div><div class='del'>-	}</div><div class='del'>-	return err ? err : allocated;</div><div class='add'>+	ext4_zeroout_es(inode, &amp;zero_ex1);</div><div class='add'>+	ext4_zeroout_es(inode, &amp;zero_ex2);</div><div class='add'>+	return path;</div><div class='add'>+</div><div class='add'>+errout:</div><div class='add'>+	ext4_free_ext_path(path);</div><div class='add'>+	return ERR_PTR(err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -3668,15 +3698,16 @@ out:</div><div class='ctx'>  * being filled will be convert to initialized by the end_io callback function</div><div class='ctx'>  * via ext4_convert_unwritten_extents().</div><div class='ctx'>  *</div><div class='del'>- * Returns the size of unwritten extent to be written on success.</div><div class='add'>+ * The size of unwritten extent to be written is passed to the caller via the</div><div class='add'>+ * allocated pointer. Return an extent path pointer on success, or an error</div><div class='add'>+ * pointer on failure.</div><div class='ctx'>  */</div><div class='del'>-static int ext4_split_convert_extents(handle_t *handle,</div><div class='add'>+static struct ext4_ext_path *ext4_split_convert_extents(handle_t *handle,</div><div class='ctx'> 					struct inode *inode,</div><div class='ctx'> 					struct ext4_map_blocks *map,</div><div class='del'>-					struct ext4_ext_path **ppath,</div><div class='del'>-					int flags)</div><div class='add'>+					struct ext4_ext_path *path,</div><div class='add'>+					int flags, unsigned int *allocated)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_ext_path *path = *ppath;</div><div class='ctx'> 	ext4_lblk_t eof_block;</div><div class='ctx'> 	ext4_lblk_t ee_block;</div><div class='ctx'> 	struct ext4_extent *ex;</div><div class='hunk'>@@ -3690,10 +3721,6 @@ static int ext4_split_convert_extents(handle_t *handle,</div><div class='ctx'> 			&gt;&gt; inode-&gt;i_sb-&gt;s_blocksize_bits;</div><div class='ctx'> 	if (eof_block &lt; map-&gt;m_lblk + map-&gt;m_len)</div><div class='ctx'> 		eof_block = map-&gt;m_lblk + map-&gt;m_len;</div><div class='del'>-	/*</div><div class='del'>-	 * It is safe to convert extent to initialized via explicit</div><div class='del'>-	 * zeroout only if extent is fully inside i_size or new_size.</div><div class='del'>-	 */</div><div class='ctx'> 	depth = ext_depth(inode);</div><div class='ctx'> 	ex = path[depth].p_ext;</div><div class='ctx'> 	ee_block = le32_to_cpu(ex-&gt;ee_block);</div><div class='hunk'>@@ -3704,20 +3731,24 @@ static int ext4_split_convert_extents(handle_t *handle,</div><div class='ctx'> 		split_flag |= EXT4_EXT_DATA_VALID1;</div><div class='ctx'> 	/* Convert to initialized */</div><div class='ctx'> 	} else if (flags &amp; EXT4_GET_BLOCKS_CONVERT) {</div><div class='add'>+		/*</div><div class='add'>+		 * It is safe to convert extent to initialized via explicit</div><div class='add'>+		 * zeroout only if extent is fully inside i_size or new_size.</div><div class='add'>+		 */</div><div class='ctx'> 		split_flag |= ee_block + ee_len &lt;= eof_block ?</div><div class='ctx'> 			      EXT4_EXT_MAY_ZEROOUT : 0;</div><div class='ctx'> 		split_flag |= (EXT4_EXT_MARK_UNWRIT2 | EXT4_EXT_DATA_VALID2);</div><div class='ctx'> 	}</div><div class='del'>-	flags |= EXT4_GET_BLOCKS_PRE_IO;</div><div class='del'>-	return ext4_split_extent(handle, inode, ppath, map, split_flag, flags);</div><div class='add'>+	flags |= EXT4_GET_BLOCKS_SPLIT_NOMERGE;</div><div class='add'>+	return ext4_split_extent(handle, inode, path, map, split_flag, flags,</div><div class='add'>+				 allocated);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext4_convert_unwritten_extents_endio(handle_t *handle,</div><div class='del'>-						struct inode *inode,</div><div class='del'>-						struct ext4_map_blocks *map,</div><div class='del'>-						struct ext4_ext_path **ppath)</div><div class='add'>+static struct ext4_ext_path *</div><div class='add'>+ext4_convert_unwritten_extents_endio(handle_t *handle, struct inode *inode,</div><div class='add'>+				     struct ext4_map_blocks *map,</div><div class='add'>+				     struct ext4_ext_path *path)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_ext_path *path = *ppath;</div><div class='ctx'> 	struct ext4_extent *ex;</div><div class='ctx'> 	ext4_lblk_t ee_block;</div><div class='ctx'> 	unsigned int ee_len;</div><div class='hunk'>@@ -3745,20 +3776,21 @@ static int ext4_convert_unwritten_extents_endio(handle_t *handle,</div><div class='ctx'> 			     inode-&gt;i_ino, (unsigned long long)ee_block, ee_len,</div><div class='ctx'> 			     (unsigned long long)map-&gt;m_lblk, map-&gt;m_len);</div><div class='ctx'> #endif</div><div class='del'>-		err = ext4_split_convert_extents(handle, inode, map, ppath,</div><div class='del'>-						 EXT4_GET_BLOCKS_CONVERT);</div><div class='del'>-		if (err &lt; 0)</div><div class='del'>-			return err;</div><div class='del'>-		path = ext4_find_extent(inode, map-&gt;m_lblk, ppath, 0);</div><div class='add'>+		path = ext4_split_convert_extents(handle, inode, map, path,</div><div class='add'>+						EXT4_GET_BLOCKS_CONVERT, NULL);</div><div class='ctx'> 		if (IS_ERR(path))</div><div class='del'>-			return PTR_ERR(path);</div><div class='add'>+			return path;</div><div class='add'>+</div><div class='add'>+		path = ext4_find_extent(inode, map-&gt;m_lblk, path, 0);</div><div class='add'>+		if (IS_ERR(path))</div><div class='add'>+			return path;</div><div class='ctx'> 		depth = ext_depth(inode);</div><div class='ctx'> 		ex = path[depth].p_ext;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	err = ext4_ext_get_access(handle, inode, path + depth);</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto out;</div><div class='add'>+		goto errout;</div><div class='ctx'> 	/* first mark the extent as initialized */</div><div class='ctx'> 	ext4_ext_mark_initialized(ex);</div><div class='ctx'> </div><div class='hunk'>@@ -3769,18 +3801,23 @@ static int ext4_convert_unwritten_extents_endio(handle_t *handle,</div><div class='ctx'> </div><div class='ctx'> 	/* Mark modified extent as dirty */</div><div class='ctx'> 	err = ext4_ext_dirty(handle, inode, path + path-&gt;p_depth);</div><div class='del'>-out:</div><div class='add'>+	if (err)</div><div class='add'>+		goto errout;</div><div class='add'>+</div><div class='ctx'> 	ext4_ext_show_leaf(inode, path);</div><div class='del'>-	return err;</div><div class='add'>+	return path;</div><div class='add'>+</div><div class='add'>+errout:</div><div class='add'>+	ext4_free_ext_path(path);</div><div class='add'>+	return ERR_PTR(err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int</div><div class='add'>+static struct ext4_ext_path *</div><div class='ctx'> convert_initialized_extent(handle_t *handle, struct inode *inode,</div><div class='ctx'> 			   struct ext4_map_blocks *map,</div><div class='del'>-			   struct ext4_ext_path **ppath,</div><div class='add'>+			   struct ext4_ext_path *path,</div><div class='ctx'> 			   unsigned int *allocated)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_ext_path *path = *ppath;</div><div class='ctx'> 	struct ext4_extent *ex;</div><div class='ctx'> 	ext4_lblk_t ee_block;</div><div class='ctx'> 	unsigned int ee_len;</div><div class='hunk'>@@ -3803,25 +3840,27 @@ convert_initialized_extent(handle_t *handle, struct inode *inode,</div><div class='ctx'> 		  (unsigned long long)ee_block, ee_len);</div><div class='ctx'> </div><div class='ctx'> 	if (ee_block != map-&gt;m_lblk || ee_len &gt; map-&gt;m_len) {</div><div class='del'>-		err = ext4_split_convert_extents(handle, inode, map, ppath,</div><div class='del'>-				EXT4_GET_BLOCKS_CONVERT_UNWRITTEN);</div><div class='del'>-		if (err &lt; 0)</div><div class='del'>-			return err;</div><div class='del'>-		path = ext4_find_extent(inode, map-&gt;m_lblk, ppath, 0);</div><div class='add'>+		path = ext4_split_convert_extents(handle, inode, map, path,</div><div class='add'>+				EXT4_GET_BLOCKS_CONVERT_UNWRITTEN, NULL);</div><div class='ctx'> 		if (IS_ERR(path))</div><div class='del'>-			return PTR_ERR(path);</div><div class='add'>+			return path;</div><div class='add'>+</div><div class='add'>+		path = ext4_find_extent(inode, map-&gt;m_lblk, path, 0);</div><div class='add'>+		if (IS_ERR(path))</div><div class='add'>+			return path;</div><div class='ctx'> 		depth = ext_depth(inode);</div><div class='ctx'> 		ex = path[depth].p_ext;</div><div class='ctx'> 		if (!ex) {</div><div class='ctx'> 			EXT4_ERROR_INODE(inode, "unexpected hole at %lu",</div><div class='ctx'> 					 (unsigned long) map-&gt;m_lblk);</div><div class='del'>-			return -EFSCORRUPTED;</div><div class='add'>+			err = -EFSCORRUPTED;</div><div class='add'>+			goto errout;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	err = ext4_ext_get_access(handle, inode, path + depth);</div><div class='ctx'> 	if (err)</div><div class='del'>-		return err;</div><div class='add'>+		goto errout;</div><div class='ctx'> 	/* first mark the extent as unwritten */</div><div class='ctx'> 	ext4_ext_mark_unwritten(ex);</div><div class='ctx'> </div><div class='hunk'>@@ -3833,7 +3872,7 @@ convert_initialized_extent(handle_t *handle, struct inode *inode,</div><div class='ctx'> 	/* Mark modified extent as dirty */</div><div class='ctx'> 	err = ext4_ext_dirty(handle, inode, path + path-&gt;p_depth);</div><div class='ctx'> 	if (err)</div><div class='del'>-		return err;</div><div class='add'>+		goto errout;</div><div class='ctx'> 	ext4_ext_show_leaf(inode, path);</div><div class='ctx'> </div><div class='ctx'> 	ext4_update_inode_fsync_trans(handle, inode, 1);</div><div class='hunk'>@@ -3842,22 +3881,24 @@ convert_initialized_extent(handle_t *handle, struct inode *inode,</div><div class='ctx'> 	if (*allocated &gt; map-&gt;m_len)</div><div class='ctx'> 		*allocated = map-&gt;m_len;</div><div class='ctx'> 	map-&gt;m_len = *allocated;</div><div class='del'>-	return 0;</div><div class='add'>+	return path;</div><div class='add'>+</div><div class='add'>+errout:</div><div class='add'>+	ext4_free_ext_path(path);</div><div class='add'>+	return ERR_PTR(err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int</div><div class='add'>+static struct ext4_ext_path *</div><div class='ctx'> ext4_ext_handle_unwritten_extents(handle_t *handle, struct inode *inode,</div><div class='ctx'> 			struct ext4_map_blocks *map,</div><div class='del'>-			struct ext4_ext_path **ppath, int flags,</div><div class='del'>-			unsigned int allocated, ext4_fsblk_t newblock)</div><div class='add'>+			struct ext4_ext_path *path, int flags,</div><div class='add'>+			unsigned int *allocated, ext4_fsblk_t newblock)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_ext_path __maybe_unused *path = *ppath;</div><div class='del'>-	int ret = 0;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='ctx'> 	ext_debug(inode, "logical block %llu, max_blocks %u, flags 0x%x, allocated %u\n",</div><div class='ctx'> 		  (unsigned long long)map-&gt;m_lblk, map-&gt;m_len, flags,</div><div class='del'>-		  allocated);</div><div class='add'>+		  *allocated);</div><div class='ctx'> 	ext4_ext_show_leaf(inode, path);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -3867,36 +3908,34 @@ ext4_ext_handle_unwritten_extents(handle_t *handle, struct inode *inode,</div><div class='ctx'> 	flags |= EXT4_GET_BLOCKS_METADATA_NOFAIL;</div><div class='ctx'> </div><div class='ctx'> 	trace_ext4_ext_handle_unwritten_extents(inode, map, flags,</div><div class='del'>-						    allocated, newblock);</div><div class='add'>+						*allocated, newblock);</div><div class='ctx'> </div><div class='ctx'> 	/* get_block() before submitting IO, split the extent */</div><div class='del'>-	if (flags &amp; EXT4_GET_BLOCKS_PRE_IO) {</div><div class='del'>-		ret = ext4_split_convert_extents(handle, inode, map, ppath,</div><div class='del'>-					 flags | EXT4_GET_BLOCKS_CONVERT);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			err = ret;</div><div class='del'>-			goto out2;</div><div class='del'>-		}</div><div class='add'>+	if (flags &amp; EXT4_GET_BLOCKS_SPLIT_NOMERGE) {</div><div class='add'>+		path = ext4_split_convert_extents(handle, inode, map, path,</div><div class='add'>+				flags | EXT4_GET_BLOCKS_CONVERT, allocated);</div><div class='add'>+		if (IS_ERR(path))</div><div class='add'>+			return path;</div><div class='ctx'> 		/*</div><div class='del'>-		 * shouldn't get a 0 return when splitting an extent unless</div><div class='add'>+		 * shouldn't get a 0 allocated when splitting an extent unless</div><div class='ctx'> 		 * m_len is 0 (bug) or extent has been corrupted</div><div class='ctx'> 		 */</div><div class='del'>-		if (unlikely(ret == 0)) {</div><div class='add'>+		if (unlikely(*allocated == 0)) {</div><div class='ctx'> 			EXT4_ERROR_INODE(inode,</div><div class='del'>-					 "unexpected ret == 0, m_len = %u",</div><div class='add'>+					 "unexpected allocated == 0, m_len = %u",</div><div class='ctx'> 					 map-&gt;m_len);</div><div class='ctx'> 			err = -EFSCORRUPTED;</div><div class='del'>-			goto out2;</div><div class='add'>+			goto errout;</div><div class='ctx'> 		}</div><div class='ctx'> 		map-&gt;m_flags |= EXT4_MAP_UNWRITTEN;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	/* IO end_io complete, convert the filled extent to written */</div><div class='ctx'> 	if (flags &amp; EXT4_GET_BLOCKS_CONVERT) {</div><div class='del'>-		err = ext4_convert_unwritten_extents_endio(handle, inode, map,</div><div class='del'>-							   ppath);</div><div class='del'>-		if (err &lt; 0)</div><div class='del'>-			goto out2;</div><div class='add'>+		path = ext4_convert_unwritten_extents_endio(handle, inode,</div><div class='add'>+							    map, path);</div><div class='add'>+		if (IS_ERR(path))</div><div class='add'>+			return path;</div><div class='ctx'> 		ext4_update_inode_fsync_trans(handle, inode, 1);</div><div class='ctx'> 		goto map_out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3928,36 +3967,37 @@ ext4_ext_handle_unwritten_extents(handle_t *handle, struct inode *inode,</div><div class='ctx'> 	 * For buffered writes, at writepage time, etc.  Convert a</div><div class='ctx'> 	 * discovered unwritten extent to written.</div><div class='ctx'> 	 */</div><div class='del'>-	ret = ext4_ext_convert_to_initialized(handle, inode, map, ppath, flags);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		err = ret;</div><div class='del'>-		goto out2;</div><div class='del'>-	}</div><div class='add'>+	path = ext4_ext_convert_to_initialized(handle, inode, map, path,</div><div class='add'>+					       flags, allocated);</div><div class='add'>+	if (IS_ERR(path))</div><div class='add'>+		return path;</div><div class='ctx'> 	ext4_update_inode_fsync_trans(handle, inode, 1);</div><div class='ctx'> 	/*</div><div class='del'>-	 * shouldn't get a 0 return when converting an unwritten extent</div><div class='add'>+	 * shouldn't get a 0 allocated when converting an unwritten extent</div><div class='ctx'> 	 * unless m_len is 0 (bug) or extent has been corrupted</div><div class='ctx'> 	 */</div><div class='del'>-	if (unlikely(ret == 0)) {</div><div class='del'>-		EXT4_ERROR_INODE(inode, "unexpected ret == 0, m_len = %u",</div><div class='add'>+	if (unlikely(*allocated == 0)) {</div><div class='add'>+		EXT4_ERROR_INODE(inode, "unexpected allocated == 0, m_len = %u",</div><div class='ctx'> 				 map-&gt;m_len);</div><div class='ctx'> 		err = -EFSCORRUPTED;</div><div class='del'>-		goto out2;</div><div class='add'>+		goto errout;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	allocated = ret;</div><div class='ctx'> 	map-&gt;m_flags |= EXT4_MAP_NEW;</div><div class='ctx'> map_out:</div><div class='ctx'> 	map-&gt;m_flags |= EXT4_MAP_MAPPED;</div><div class='ctx'> out1:</div><div class='ctx'> 	map-&gt;m_pblk = newblock;</div><div class='del'>-	if (allocated &gt; map-&gt;m_len)</div><div class='del'>-		allocated = map-&gt;m_len;</div><div class='del'>-	map-&gt;m_len = allocated;</div><div class='add'>+	if (*allocated &gt; map-&gt;m_len)</div><div class='add'>+		*allocated = map-&gt;m_len;</div><div class='add'>+	map-&gt;m_len = *allocated;</div><div class='ctx'> 	ext4_ext_show_leaf(inode, path);</div><div class='del'>-out2:</div><div class='del'>-	return err ? err : allocated;</div><div class='add'>+	return path;</div><div class='add'>+</div><div class='add'>+errout:</div><div class='add'>+	ext4_free_ext_path(path);</div><div class='add'>+	return ERR_PTR(err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -4062,6 +4102,73 @@ static int get_implied_cluster_alloc(struct super_block *sb,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Determine hole length around the given logical block, first try to</div><div class='add'>+ * locate and expand the hole from the given @path, and then adjust it</div><div class='add'>+ * if it's partially or completely converted to delayed extents, insert</div><div class='add'>+ * it into the extent cache tree if it's indeed a hole, finally return</div><div class='add'>+ * the length of the determined extent.</div><div class='add'>+ */</div><div class='add'>+static ext4_lblk_t ext4_ext_determine_insert_hole(struct inode *inode,</div><div class='add'>+						  struct ext4_ext_path *path,</div><div class='add'>+						  ext4_lblk_t lblk)</div><div class='add'>+{</div><div class='add'>+	ext4_lblk_t hole_start, len;</div><div class='add'>+	struct extent_status es;</div><div class='add'>+</div><div class='add'>+	hole_start = lblk;</div><div class='add'>+	len = ext4_ext_find_hole(inode, path, &amp;hole_start);</div><div class='add'>+again:</div><div class='add'>+	ext4_es_find_extent_range(inode, &amp;ext4_es_is_delayed, hole_start,</div><div class='add'>+				  hole_start + len - 1, &amp;es);</div><div class='add'>+	if (!es.es_len)</div><div class='add'>+		goto insert_hole;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * There's a delalloc extent in the hole, handle it if the delalloc</div><div class='add'>+	 * extent is in front of, behind and straddle the queried range.</div><div class='add'>+	 */</div><div class='add'>+	if (lblk &gt;= es.es_lblk + es.es_len) {</div><div class='add'>+		/*</div><div class='add'>+		 * The delalloc extent is in front of the queried range,</div><div class='add'>+		 * find again from the queried start block.</div><div class='add'>+		 */</div><div class='add'>+		len -= lblk - hole_start;</div><div class='add'>+		hole_start = lblk;</div><div class='add'>+		goto again;</div><div class='add'>+	} else if (in_range(lblk, es.es_lblk, es.es_len)) {</div><div class='add'>+		/*</div><div class='add'>+		 * The delalloc extent containing lblk, it must have been</div><div class='add'>+		 * added after ext4_map_blocks() checked the extent status</div><div class='add'>+		 * tree so we are not holding i_rwsem and delalloc info is</div><div class='add'>+		 * only stabilized by i_data_sem we are going to release</div><div class='add'>+		 * soon. Don't modify the extent status tree and report</div><div class='add'>+		 * extent as a hole, just adjust the length to the delalloc</div><div class='add'>+		 * extent's after lblk.</div><div class='add'>+		 */</div><div class='add'>+		len = es.es_lblk + es.es_len - lblk;</div><div class='add'>+		return len;</div><div class='add'>+	} else {</div><div class='add'>+		/*</div><div class='add'>+		 * The delalloc extent is partially or completely behind</div><div class='add'>+		 * the queried range, update hole length until the</div><div class='add'>+		 * beginning of the delalloc extent.</div><div class='add'>+		 */</div><div class='add'>+		len = min(es.es_lblk - hole_start, len);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+insert_hole:</div><div class='add'>+	/* Put just found gap into cache to speed up subsequent requests */</div><div class='add'>+	ext_debug(inode, " -&gt; %u:%u\n", hole_start, len);</div><div class='add'>+	ext4_es_insert_extent(inode, hole_start, len, ~0,</div><div class='add'>+			      EXTENT_STATUS_HOLE, false);</div><div class='add'>+</div><div class='add'>+	/* Update hole_len to reflect hole size after lblk */</div><div class='add'>+	if (hole_start != lblk)</div><div class='add'>+		len -= lblk - hole_start;</div><div class='add'>+</div><div class='add'>+	return len;</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Block allocation/map/preallocation routine for extents based files</div><div class='hunk'>@@ -4069,10 +4176,10 @@ static int get_implied_cluster_alloc(struct super_block *sb,</div><div class='ctx'>  *</div><div class='ctx'>  * Need to be called with</div><div class='ctx'>  * down_read(&amp;EXT4_I(inode)-&gt;i_data_sem) if not allocating file system block</div><div class='del'>- * (ie, create is zero). Otherwise down_write(&amp;EXT4_I(inode)-&gt;i_data_sem)</div><div class='add'>+ * (ie, flags is zero). Otherwise down_write(&amp;EXT4_I(inode)-&gt;i_data_sem)</div><div class='ctx'>  *</div><div class='ctx'>  * return &gt; 0, number of blocks already mapped/allocated</div><div class='del'>- *          if create == 0 and these are pre-allocated blocks</div><div class='add'>+ *          if flags doesn't contain EXT4_GET_BLOCKS_CREATE and these are pre-allocated blocks</div><div class='ctx'>  *          	buffer head is unmapped</div><div class='ctx'>  *          otherwise blocks are mapped</div><div class='ctx'>  *</div><div class='hunk'>@@ -4088,7 +4195,7 @@ int ext4_ext_map_blocks(handle_t *handle, struct inode *inode,</div><div class='ctx'> 	struct ext4_extent newex, *ex, ex2;</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(inode-&gt;i_sb);</div><div class='ctx'> 	ext4_fsblk_t newblock = 0, pblk;</div><div class='del'>-	int err = 0, depth, ret;</div><div class='add'>+	int err = 0, depth;</div><div class='ctx'> 	unsigned int allocated = 0, offset = 0;</div><div class='ctx'> 	unsigned int allocated_clusters = 0;</div><div class='ctx'> 	struct ext4_allocation_request ar;</div><div class='hunk'>@@ -4098,10 +4205,9 @@ int ext4_ext_map_blocks(handle_t *handle, struct inode *inode,</div><div class='ctx'> 	trace_ext4_ext_map_blocks_enter(inode, map-&gt;m_lblk, map-&gt;m_len, flags);</div><div class='ctx'> </div><div class='ctx'> 	/* find extent for this block */</div><div class='del'>-	path = ext4_find_extent(inode, map-&gt;m_lblk, NULL, 0);</div><div class='add'>+	path = ext4_find_extent(inode, map-&gt;m_lblk, NULL, flags);</div><div class='ctx'> 	if (IS_ERR(path)) {</div><div class='ctx'> 		err = PTR_ERR(path);</div><div class='del'>-		path = NULL;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -4150,8 +4256,10 @@ int ext4_ext_map_blocks(handle_t *handle, struct inode *inode,</div><div class='ctx'> 			 */</div><div class='ctx'> 			if ((!ext4_ext_is_unwritten(ex)) &amp;&amp;</div><div class='ctx'> 			    (flags &amp; EXT4_GET_BLOCKS_CONVERT_UNWRITTEN)) {</div><div class='del'>-				err = convert_initialized_extent(handle,</div><div class='del'>-					inode, map, &amp;path, &amp;allocated);</div><div class='add'>+				path = convert_initialized_extent(handle,</div><div class='add'>+					inode, map, path, &amp;allocated);</div><div class='add'>+				if (IS_ERR(path))</div><div class='add'>+					err = PTR_ERR(path);</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			} else if (!ext4_ext_is_unwritten(ex)) {</div><div class='ctx'> 				map-&gt;m_flags |= EXT4_MAP_MAPPED;</div><div class='hunk'>@@ -4163,38 +4271,26 @@ int ext4_ext_map_blocks(handle_t *handle, struct inode *inode,</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			ret = ext4_ext_handle_unwritten_extents(</div><div class='del'>-				handle, inode, map, &amp;path, flags,</div><div class='del'>-				allocated, newblock);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				err = ret;</div><div class='del'>-			else</div><div class='del'>-				allocated = ret;</div><div class='add'>+			path = ext4_ext_handle_unwritten_extents(</div><div class='add'>+				handle, inode, map, path, flags,</div><div class='add'>+				&amp;allocated, newblock);</div><div class='add'>+			if (IS_ERR(path))</div><div class='add'>+				err = PTR_ERR(path);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * requested block isn't allocated yet;</div><div class='del'>-	 * we couldn't try to create block if create flag is zero</div><div class='add'>+	 * we couldn't try to create block if flags doesn't contain EXT4_GET_BLOCKS_CREATE</div><div class='ctx'> 	 */</div><div class='ctx'> 	if ((flags &amp; EXT4_GET_BLOCKS_CREATE) == 0) {</div><div class='del'>-		ext4_lblk_t hole_start, hole_len;</div><div class='add'>+		ext4_lblk_t len;</div><div class='ctx'> </div><div class='del'>-		hole_start = map-&gt;m_lblk;</div><div class='del'>-		hole_len = ext4_ext_determine_hole(inode, path, &amp;hole_start);</div><div class='del'>-		/*</div><div class='del'>-		 * put just found gap into cache to speed up</div><div class='del'>-		 * subsequent requests</div><div class='del'>-		 */</div><div class='del'>-		ext4_ext_put_gap_in_cache(inode, hole_start, hole_len);</div><div class='add'>+		len = ext4_ext_determine_insert_hole(inode, path, map-&gt;m_lblk);</div><div class='ctx'> </div><div class='del'>-		/* Update hole_len to reflect hole size after map-&gt;m_lblk */</div><div class='del'>-		if (hole_start != map-&gt;m_lblk)</div><div class='del'>-			hole_len -= map-&gt;m_lblk - hole_start;</div><div class='ctx'> 		map-&gt;m_pblk = 0;</div><div class='del'>-		map-&gt;m_len = min_t(unsigned int, map-&gt;m_len, hole_len);</div><div class='del'>-</div><div class='add'>+		map-&gt;m_len = min_t(unsigned int, map-&gt;m_len, len);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -4221,7 +4317,8 @@ int ext4_ext_map_blocks(handle_t *handle, struct inode *inode,</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	ar.lright = map-&gt;m_lblk;</div><div class='del'>-	err = ext4_ext_search_right(inode, path, &amp;ar.lright, &amp;ar.pright, &amp;ex2);</div><div class='add'>+	err = ext4_ext_search_right(inode, path, &amp;ar.lright, &amp;ar.pright,</div><div class='add'>+				    &amp;ex2, flags);</div><div class='ctx'> 	if (err &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -4231,6 +4328,7 @@ int ext4_ext_map_blocks(handle_t *handle, struct inode *inode,</div><div class='ctx'> 	    get_implied_cluster_alloc(inode-&gt;i_sb, map, &amp;ex2, path)) {</div><div class='ctx'> 		ar.len = allocated = map-&gt;m_len;</div><div class='ctx'> 		newblock = map-&gt;m_pblk;</div><div class='add'>+		err = 0;</div><div class='ctx'> 		goto got_allocated_blocks;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -4303,8 +4401,9 @@ got_allocated_blocks:</div><div class='ctx'> 		map-&gt;m_flags |= EXT4_MAP_UNWRITTEN;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = ext4_ext_insert_extent(handle, inode, &amp;path, &amp;newex, flags);</div><div class='del'>-	if (err) {</div><div class='add'>+	path = ext4_ext_insert_extent(handle, inode, path, &amp;newex, flags);</div><div class='add'>+	if (IS_ERR(path)) {</div><div class='add'>+		err = PTR_ERR(path);</div><div class='ctx'> 		if (allocated_clusters) {</div><div class='ctx'> 			int fb_flags = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -4313,7 +4412,7 @@ got_allocated_blocks:</div><div class='ctx'> 			 * not a good idea to call discard here directly,</div><div class='ctx'> 			 * but otherwise we'd need to call it every free().</div><div class='ctx'> 			 */</div><div class='del'>-			ext4_discard_preallocations(inode, 0);</div><div class='add'>+			ext4_discard_preallocations(inode);</div><div class='ctx'> 			if (flags &amp; EXT4_GET_BLOCKS_DELALLOC_RESERVE)</div><div class='ctx'> 				fb_flags = EXT4_FREE_BLOCKS_NO_QUOT_UPDATE;</div><div class='ctx'> 			ext4_free_blocks(handle, inode, NULL, newblock,</div><div class='hunk'>@@ -4324,43 +4423,6 @@ got_allocated_blocks:</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Reduce the reserved cluster count to reflect successful deferred</div><div class='del'>-	 * allocation of delayed allocated clusters or direct allocation of</div><div class='del'>-	 * clusters discovered to be delayed allocated.  Once allocated, a</div><div class='del'>-	 * cluster is not included in the reserved count.</div><div class='del'>-	 */</div><div class='del'>-	if (test_opt(inode-&gt;i_sb, DELALLOC) &amp;&amp; allocated_clusters) {</div><div class='del'>-		if (flags &amp; EXT4_GET_BLOCKS_DELALLOC_RESERVE) {</div><div class='del'>-			/*</div><div class='del'>-			 * When allocating delayed allocated clusters, simply</div><div class='del'>-			 * reduce the reserved cluster count and claim quota</div><div class='del'>-			 */</div><div class='del'>-			ext4_da_update_reserve_space(inode, allocated_clusters,</div><div class='del'>-							1);</div><div class='del'>-		} else {</div><div class='del'>-			ext4_lblk_t lblk, len;</div><div class='del'>-			unsigned int n;</div><div class='del'>-</div><div class='del'>-			/*</div><div class='del'>-			 * When allocating non-delayed allocated clusters</div><div class='del'>-			 * (from fallocate, filemap, DIO, or clusters</div><div class='del'>-			 * allocated when delalloc has been disabled by</div><div class='del'>-			 * ext4_nonda_switch), reduce the reserved cluster</div><div class='del'>-			 * count by the number of allocated clusters that</div><div class='del'>-			 * have previously been delayed allocated.  Quota</div><div class='del'>-			 * has been claimed by ext4_mb_new_blocks() above,</div><div class='del'>-			 * so release the quota reservations made for any</div><div class='del'>-			 * previously delayed allocated clusters.</div><div class='del'>-			 */</div><div class='del'>-			lblk = EXT4_LBLK_CMASK(sbi, map-&gt;m_lblk);</div><div class='del'>-			len = allocated_clusters &lt;&lt; sbi-&gt;s_cluster_bits;</div><div class='del'>-			n = ext4_es_delayed_clu(inode, lblk, len);</div><div class='del'>-			if (n &gt; 0)</div><div class='del'>-				ext4_da_update_reserve_space(inode, (int) n, 0);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='ctx'> 	 * Cache the extent and update transaction to commit on fdatasync only</div><div class='ctx'> 	 * when it is _not_ an unwritten extent.</div><div class='ctx'> 	 */</div><div class='hunk'>@@ -4375,8 +4437,21 @@ got_allocated_blocks:</div><div class='ctx'> 	allocated = map-&gt;m_len;</div><div class='ctx'> 	ext4_ext_show_leaf(inode, path);</div><div class='ctx'> out:</div><div class='del'>-	ext4_ext_drop_refs(path);</div><div class='del'>-	kfree(path);</div><div class='add'>+	/*</div><div class='add'>+	 * We never use EXT4_GET_BLOCKS_QUERY_LAST_IN_LEAF with CREATE flag.</div><div class='add'>+	 * So we know that the depth used here is correct, since there was no</div><div class='add'>+	 * block allocation done if EXT4_GET_BLOCKS_QUERY_LAST_IN_LEAF is set.</div><div class='add'>+	 * If tomorrow we start using this QUERY flag with CREATE, then we will</div><div class='add'>+	 * need to re-calculate the depth as it might have changed due to block</div><div class='add'>+	 * allocation.</div><div class='add'>+	 */</div><div class='add'>+	if (flags &amp; EXT4_GET_BLOCKS_QUERY_LAST_IN_LEAF) {</div><div class='add'>+		WARN_ON_ONCE(flags &amp; EXT4_GET_BLOCKS_CREATE);</div><div class='add'>+		if (!err &amp;&amp; ex &amp;&amp; (ex == EXT_LAST_EXTENT(path[depth].p_hdr)))</div><div class='add'>+			map-&gt;m_flags |= EXT4_MAP_QUERY_LAST_IN_LEAF;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ext4_free_ext_path(path);</div><div class='ctx'> </div><div class='ctx'> 	trace_ext4_ext_map_blocks_exit(inode, flags, map,</div><div class='ctx'> 				       err ? err : allocated);</div><div class='hunk'>@@ -4403,21 +4478,12 @@ int ext4_ext_truncate(handle_t *handle, struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> 	last_block = (inode-&gt;i_size + sb-&gt;s_blocksize - 1)</div><div class='ctx'> 			&gt;&gt; EXT4_BLOCK_SIZE_BITS(sb);</div><div class='del'>-retry:</div><div class='del'>-	err = ext4_es_remove_extent(inode, last_block,</div><div class='del'>-				    EXT_MAX_BLOCKS - last_block);</div><div class='del'>-	if (err == -ENOMEM) {</div><div class='del'>-		cond_resched();</div><div class='del'>-		congestion_wait(BLK_RW_ASYNC, HZ/50);</div><div class='del'>-		goto retry;</div><div class='del'>-	}</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='add'>+	ext4_es_remove_extent(inode, last_block, EXT_MAX_BLOCKS - last_block);</div><div class='add'>+</div><div class='ctx'> retry_remove_space:</div><div class='ctx'> 	err = ext4_ext_remove_space(inode, last_block, EXT_MAX_BLOCKS - 1);</div><div class='ctx'> 	if (err == -ENOMEM) {</div><div class='del'>-		cond_resched();</div><div class='del'>-		congestion_wait(BLK_RW_ASYNC, HZ/50);</div><div class='add'>+		memalloc_retry_wait(GFP_ATOMIC);</div><div class='ctx'> 		goto retry_remove_space;</div><div class='ctx'> 	}</div><div class='ctx'> 	return err;</div><div class='hunk'>@@ -4434,7 +4500,9 @@ static int ext4_alloc_file_blocks(struct file *file, ext4_lblk_t offset,</div><div class='ctx'> 	int depth = 0;</div><div class='ctx'> 	struct ext4_map_blocks map;</div><div class='ctx'> 	unsigned int credits;</div><div class='del'>-	loff_t epos;</div><div class='add'>+	loff_t epos, old_size = i_size_read(inode);</div><div class='add'>+	unsigned int blkbits = inode-&gt;i_blkbits;</div><div class='add'>+	bool alloc_zero = false;</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(!ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS));</div><div class='ctx'> 	map.m_lblk = offset;</div><div class='hunk'>@@ -4448,6 +4516,17 @@ static int ext4_alloc_file_blocks(struct file *file, ext4_lblk_t offset,</div><div class='ctx'> 		flags |= EXT4_GET_BLOCKS_NO_NORMALIZE;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='add'>+	 * Do the actual write zero during a running journal transaction</div><div class='add'>+	 * costs a lot. First allocate an unwritten extent and then</div><div class='add'>+	 * convert it to written after zeroing it out.</div><div class='add'>+	 */</div><div class='add'>+	if (flags &amp; EXT4_GET_BLOCKS_ZERO) {</div><div class='add'>+		flags &amp;= ~EXT4_GET_BLOCKS_ZERO;</div><div class='add'>+		flags |= EXT4_GET_BLOCKS_UNWRIT_EXT;</div><div class='add'>+		alloc_zero = true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='ctx'> 	 * credits to insert 1 extent into extent tree</div><div class='ctx'> 	 */</div><div class='ctx'> 	credits = ext4_chunk_trans_blocks(inode, len);</div><div class='hunk'>@@ -4483,15 +4562,19 @@ retry:</div><div class='ctx'> 		 * allow a full retry cycle for any remaining allocations</div><div class='ctx'> 		 */</div><div class='ctx'> 		retries = 0;</div><div class='del'>-		map.m_lblk += ret;</div><div class='del'>-		map.m_len = len = len - ret;</div><div class='del'>-		epos = (loff_t)map.m_lblk &lt;&lt; inode-&gt;i_blkbits;</div><div class='del'>-		inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+		epos = EXT4_LBLK_TO_B(inode, map.m_lblk + ret);</div><div class='add'>+		inode_set_ctime_current(inode);</div><div class='ctx'> 		if (new_size) {</div><div class='ctx'> 			if (epos &gt; new_size)</div><div class='ctx'> 				epos = new_size;</div><div class='ctx'> 			if (ext4_update_inode_size(inode, epos) &amp; 0x1)</div><div class='del'>-				inode-&gt;i_mtime = inode-&gt;i_ctime;</div><div class='add'>+				inode_set_mtime_to_ts(inode,</div><div class='add'>+						      inode_get_ctime(inode));</div><div class='add'>+			if (epos &gt; old_size) {</div><div class='add'>+				pagecache_isize_extended(inode, old_size, epos);</div><div class='add'>+				ext4_zero_partial_blocks(handle, inode,</div><div class='add'>+						     old_size, epos - old_size);</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> 		ret2 = ext4_mark_inode_dirty(handle, inode);</div><div class='ctx'> 		ext4_update_inode_fsync_trans(handle, inode, 1);</div><div class='hunk'>@@ -4499,6 +4582,21 @@ retry:</div><div class='ctx'> 		ret2 = ret3 ? ret3 : ret2;</div><div class='ctx'> 		if (unlikely(ret2))</div><div class='ctx'> 			break;</div><div class='add'>+</div><div class='add'>+		if (alloc_zero &amp;&amp;</div><div class='add'>+		    (map.m_flags &amp; (EXT4_MAP_MAPPED | EXT4_MAP_UNWRITTEN))) {</div><div class='add'>+			ret2 = ext4_issue_zeroout(inode, map.m_lblk, map.m_pblk,</div><div class='add'>+						  map.m_len);</div><div class='add'>+			if (likely(!ret2))</div><div class='add'>+				ret2 = ext4_convert_unwritten_extents(NULL,</div><div class='add'>+					inode, (loff_t)map.m_lblk &lt;&lt; blkbits,</div><div class='add'>+					(loff_t)map.m_len &lt;&lt; blkbits);</div><div class='add'>+			if (ret2)</div><div class='add'>+				break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		map.m_lblk += ret;</div><div class='add'>+		map.m_len = len = len - ret;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (ret == -ENOSPC &amp;&amp; ext4_should_retry_alloc(inode-&gt;i_sb, &amp;retries))</div><div class='ctx'> 		goto retry;</div><div class='hunk'>@@ -4506,126 +4604,77 @@ retry:</div><div class='ctx'> 	return ret &gt; 0 ? ret2 : ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext4_collapse_range(struct inode *inode, loff_t offset, loff_t len);</div><div class='add'>+static int ext4_collapse_range(struct file *file, loff_t offset, loff_t len);</div><div class='ctx'> </div><div class='del'>-static int ext4_insert_range(struct inode *inode, loff_t offset, loff_t len);</div><div class='add'>+static int ext4_insert_range(struct file *file, loff_t offset, loff_t len);</div><div class='ctx'> </div><div class='ctx'> static long ext4_zero_range(struct file *file, loff_t offset,</div><div class='ctx'> 			    loff_t len, int mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='del'>-	struct address_space *mapping = file-&gt;f_mapping;</div><div class='ctx'> 	handle_t *handle = NULL;</div><div class='del'>-	unsigned int max_blocks;</div><div class='ctx'> 	loff_t new_size = 0;</div><div class='del'>-	int ret = 0;</div><div class='del'>-	int flags;</div><div class='del'>-	int credits;</div><div class='del'>-	int partial_begin, partial_end;</div><div class='del'>-	loff_t start, end;</div><div class='del'>-	ext4_lblk_t lblk;</div><div class='add'>+	loff_t end = offset + len;</div><div class='add'>+	ext4_lblk_t start_lblk, end_lblk;</div><div class='add'>+	unsigned int blocksize = i_blocksize(inode);</div><div class='ctx'> 	unsigned int blkbits = inode-&gt;i_blkbits;</div><div class='add'>+	int ret, flags, credits;</div><div class='ctx'> </div><div class='ctx'> 	trace_ext4_zero_range(inode, offset, len, mode);</div><div class='add'>+	WARN_ON_ONCE(!inode_is_locked(inode));</div><div class='ctx'> </div><div class='del'>-	/* Call ext4_force_commit to flush all data in case of data=journal. */</div><div class='del'>-	if (ext4_should_journal_data(inode)) {</div><div class='del'>-		ret = ext4_force_commit(inode-&gt;i_sb);</div><div class='del'>-		if (ret)</div><div class='del'>-			return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Round up offset. This is not fallocate, we need to zero out</div><div class='del'>-	 * blocks, so convert interior block aligned part of the range to</div><div class='del'>-	 * unwritten and possibly manually zero out unaligned parts of the</div><div class='del'>-	 * range.</div><div class='del'>-	 */</div><div class='del'>-	start = round_up(offset, 1 &lt;&lt; blkbits);</div><div class='del'>-	end = round_down((offset + len), 1 &lt;&lt; blkbits);</div><div class='del'>-</div><div class='del'>-	if (start &lt; offset || end &gt; offset + len)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	partial_begin = offset &amp; ((1 &lt;&lt; blkbits) - 1);</div><div class='del'>-	partial_end = (offset + len) &amp; ((1 &lt;&lt; blkbits) - 1);</div><div class='del'>-</div><div class='del'>-	lblk = start &gt;&gt; blkbits;</div><div class='del'>-	max_blocks = (end &gt;&gt; blkbits);</div><div class='del'>-	if (max_blocks &lt; lblk)</div><div class='del'>-		max_blocks = 0;</div><div class='del'>-	else</div><div class='del'>-		max_blocks -= lblk;</div><div class='del'>-</div><div class='del'>-	inode_lock(inode);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Indirect files do not support unwritten extents</div><div class='del'>-	 */</div><div class='del'>-	if (!(ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS))) {</div><div class='del'>-		ret = -EOPNOTSUPP;</div><div class='del'>-		goto out_mutex;</div><div class='del'>-	}</div><div class='add'>+	/* Indirect files do not support unwritten extents */</div><div class='add'>+	if (!(ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS)))</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='ctx'> 	if (!(mode &amp; FALLOC_FL_KEEP_SIZE) &amp;&amp;</div><div class='del'>-	    (offset + len &gt; inode-&gt;i_size ||</div><div class='del'>-	     offset + len &gt; EXT4_I(inode)-&gt;i_disksize)) {</div><div class='del'>-		new_size = offset + len;</div><div class='add'>+	    (end &gt; inode-&gt;i_size || end &gt; EXT4_I(inode)-&gt;i_disksize)) {</div><div class='add'>+		new_size = end;</div><div class='ctx'> 		ret = inode_newsize_ok(inode, new_size);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			goto out_mutex;</div><div class='add'>+			return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	flags = EXT4_GET_BLOCKS_CREATE_UNWRIT_EXT;</div><div class='del'>-</div><div class='del'>-	/* Wait all existing dio workers, newcomers will block on i_mutex */</div><div class='del'>-	inode_dio_wait(inode);</div><div class='del'>-</div><div class='ctx'> 	/* Preallocate the range including the unaligned edges */</div><div class='del'>-	if (partial_begin || partial_end) {</div><div class='del'>-		ret = ext4_alloc_file_blocks(file,</div><div class='del'>-				round_down(offset, 1 &lt;&lt; blkbits) &gt;&gt; blkbits,</div><div class='del'>-				(round_up((offset + len), 1 &lt;&lt; blkbits) -</div><div class='del'>-				 round_down(offset, 1 &lt;&lt; blkbits)) &gt;&gt; blkbits,</div><div class='del'>-				new_size, flags);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto out_mutex;</div><div class='add'>+	if (!IS_ALIGNED(offset | end, blocksize)) {</div><div class='add'>+		ext4_lblk_t alloc_lblk = offset &gt;&gt; blkbits;</div><div class='add'>+		ext4_lblk_t len_lblk = EXT4_MAX_BLOCKS(len, offset, blkbits);</div><div class='ctx'> </div><div class='add'>+		ret = ext4_alloc_file_blocks(file, alloc_lblk, len_lblk,</div><div class='add'>+					     new_size, flags);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Zero range excluding the unaligned edges */</div><div class='del'>-	if (max_blocks &gt; 0) {</div><div class='del'>-		flags |= (EXT4_GET_BLOCKS_CONVERT_UNWRITTEN |</div><div class='del'>-			  EXT4_EX_NOCACHE);</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Prevent page faults from reinstantiating pages we have</div><div class='del'>-		 * released from page cache.</div><div class='del'>-		 */</div><div class='del'>-		filemap_invalidate_lock(mapping);</div><div class='add'>+	ret = ext4_update_disksize_before_punch(inode, offset, len);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-		ret = ext4_break_layouts(inode);</div><div class='del'>-		if (ret) {</div><div class='del'>-			filemap_invalidate_unlock(mapping);</div><div class='del'>-			goto out_mutex;</div><div class='del'>-		}</div><div class='add'>+	/* Now release the pages and zero block aligned part of pages */</div><div class='add'>+	ret = ext4_truncate_page_cache_block_range(inode, offset, end);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-		ret = ext4_update_disksize_before_punch(inode, offset, len);</div><div class='del'>-		if (ret) {</div><div class='del'>-			filemap_invalidate_unlock(mapping);</div><div class='del'>-			goto out_mutex;</div><div class='del'>-		}</div><div class='del'>-		/* Now release the pages and zero block aligned part of pages */</div><div class='del'>-		truncate_pagecache_range(inode, start, end - 1);</div><div class='del'>-		inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	/* Zero range excluding the unaligned edges */</div><div class='add'>+	start_lblk = EXT4_B_TO_LBLK(inode, offset);</div><div class='add'>+	end_lblk = end &gt;&gt; blkbits;</div><div class='add'>+	if (end_lblk &gt; start_lblk) {</div><div class='add'>+		ext4_lblk_t zero_blks = end_lblk - start_lblk;</div><div class='ctx'> </div><div class='del'>-		ret = ext4_alloc_file_blocks(file, lblk, max_blocks, new_size,</div><div class='del'>-					     flags);</div><div class='del'>-		filemap_invalidate_unlock(mapping);</div><div class='add'>+		if (mode &amp; FALLOC_FL_WRITE_ZEROES)</div><div class='add'>+			flags = EXT4_GET_BLOCKS_CREATE_ZERO | EXT4_EX_NOCACHE;</div><div class='add'>+		else</div><div class='add'>+			flags |= (EXT4_GET_BLOCKS_CONVERT_UNWRITTEN |</div><div class='add'>+				  EXT4_EX_NOCACHE);</div><div class='add'>+		ret = ext4_alloc_file_blocks(file, start_lblk, zero_blks,</div><div class='add'>+					     new_size, flags);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			goto out_mutex;</div><div class='add'>+			return ret;</div><div class='ctx'> 	}</div><div class='del'>-	if (!partial_begin &amp;&amp; !partial_end)</div><div class='del'>-		goto out_mutex;</div><div class='add'>+	/* Finish zeroing out if it doesn't contain partial block */</div><div class='add'>+	if (IS_ALIGNED(offset | end, blocksize))</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * In worst case we have to writeout two nonadjacent unwritten</div><div class='hunk'>@@ -4638,29 +4687,69 @@ static long ext4_zero_range(struct file *file, loff_t offset,</div><div class='ctx'> 	if (IS_ERR(handle)) {</div><div class='ctx'> 		ret = PTR_ERR(handle);</div><div class='ctx'> 		ext4_std_error(inode-&gt;i_sb, ret);</div><div class='del'>-		goto out_mutex;</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	/* Zero out partial block at the edges of the range */</div><div class='add'>+	ret = ext4_zero_partial_blocks(handle, inode, offset, len);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_handle;</div><div class='add'>+</div><div class='ctx'> 	if (new_size)</div><div class='ctx'> 		ext4_update_inode_size(inode, new_size);</div><div class='ctx'> 	ret = ext4_mark_inode_dirty(handle, inode);</div><div class='ctx'> 	if (unlikely(ret))</div><div class='ctx'> 		goto out_handle;</div><div class='del'>-	ext4_fc_track_range(handle, inode, offset &gt;&gt; inode-&gt;i_sb-&gt;s_blocksize_bits,</div><div class='del'>-			(offset + len - 1) &gt;&gt; inode-&gt;i_sb-&gt;s_blocksize_bits);</div><div class='del'>-	/* Zero out partial block at the edges of the range */</div><div class='del'>-	ret = ext4_zero_partial_blocks(handle, inode, offset, len);</div><div class='del'>-	if (ret &gt;= 0)</div><div class='del'>-		ext4_update_inode_fsync_trans(handle, inode, 1);</div><div class='ctx'> </div><div class='add'>+	ext4_update_inode_fsync_trans(handle, inode, 1);</div><div class='ctx'> 	if (file-&gt;f_flags &amp; O_SYNC)</div><div class='ctx'> 		ext4_handle_sync(handle);</div><div class='ctx'> </div><div class='ctx'> out_handle:</div><div class='ctx'> 	ext4_journal_stop(handle);</div><div class='del'>-out_mutex:</div><div class='del'>-	inode_unlock(inode);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static long ext4_do_fallocate(struct file *file, loff_t offset,</div><div class='add'>+			      loff_t len, int mode)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='add'>+	loff_t end = offset + len;</div><div class='add'>+	loff_t new_size = 0;</div><div class='add'>+	ext4_lblk_t start_lblk, len_lblk;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	trace_ext4_fallocate_enter(inode, offset, len, mode);</div><div class='add'>+	WARN_ON_ONCE(!inode_is_locked(inode));</div><div class='add'>+</div><div class='add'>+	start_lblk = offset &gt;&gt; inode-&gt;i_blkbits;</div><div class='add'>+	len_lblk = EXT4_MAX_BLOCKS(len, offset, inode-&gt;i_blkbits);</div><div class='add'>+</div><div class='add'>+	/* We only support preallocation for extent-based files only. */</div><div class='add'>+	if (!(ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS))) {</div><div class='add'>+		ret = -EOPNOTSUPP;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!(mode &amp; FALLOC_FL_KEEP_SIZE) &amp;&amp;</div><div class='add'>+	    (end &gt; inode-&gt;i_size || end &gt; EXT4_I(inode)-&gt;i_disksize)) {</div><div class='add'>+		new_size = end;</div><div class='add'>+		ret = inode_newsize_ok(inode, new_size);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = ext4_alloc_file_blocks(file, start_lblk, len_lblk, new_size,</div><div class='add'>+				     EXT4_GET_BLOCKS_CREATE_UNWRIT_EXT);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	if (file-&gt;f_flags &amp; O_SYNC &amp;&amp; EXT4_SB(inode-&gt;i_sb)-&gt;s_journal) {</div><div class='add'>+		ret = ext4_fc_commit(EXT4_SB(inode-&gt;i_sb)-&gt;s_journal,</div><div class='add'>+					EXT4_I(inode)-&gt;i_sync_tid);</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='add'>+	trace_ext4_fallocate_exit(inode, offset, len_lblk, ret);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -4674,12 +4763,8 @@ out_mutex:</div><div class='ctx'> long ext4_fallocate(struct file *file, int mode, loff_t offset, loff_t len)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='del'>-	loff_t new_size = 0;</div><div class='del'>-	unsigned int max_blocks;</div><div class='del'>-	int ret = 0;</div><div class='del'>-	int flags;</div><div class='del'>-	ext4_lblk_t lblk;</div><div class='del'>-	unsigned int blkbits = inode-&gt;i_blkbits;</div><div class='add'>+	struct address_space *mapping = file-&gt;f_mapping;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Encrypted inodes can't handle collapse range or insert</div><div class='hunk'>@@ -4690,80 +4775,158 @@ long ext4_fallocate(struct file *file, int mode, loff_t offset, loff_t len)</div><div class='ctx'> 	if (IS_ENCRYPTED(inode) &amp;&amp;</div><div class='ctx'> 	    (mode &amp; (FALLOC_FL_COLLAPSE_RANGE | FALLOC_FL_INSERT_RANGE)))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='add'>+	/*</div><div class='add'>+	 * Don't allow writing zeroes if the underlying device does not</div><div class='add'>+	 * enable the unmap write zeroes operation.</div><div class='add'>+	 */</div><div class='add'>+	if ((mode &amp; FALLOC_FL_WRITE_ZEROES) &amp;&amp;</div><div class='add'>+	    !bdev_write_zeroes_unmap_sectors(inode-&gt;i_sb-&gt;s_bdev))</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='ctx'> 	/* Return error if mode is not supported */</div><div class='ctx'> 	if (mode &amp; ~(FALLOC_FL_KEEP_SIZE | FALLOC_FL_PUNCH_HOLE |</div><div class='del'>-		     FALLOC_FL_COLLAPSE_RANGE | FALLOC_FL_ZERO_RANGE |</div><div class='del'>-		     FALLOC_FL_INSERT_RANGE))</div><div class='add'>+		     FALLOC_FL_ZERO_RANGE | FALLOC_FL_COLLAPSE_RANGE |</div><div class='add'>+		     FALLOC_FL_INSERT_RANGE | FALLOC_FL_WRITE_ZEROES))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='del'>-	ext4_fc_start_update(inode);</div><div class='add'>+	inode_lock(inode);</div><div class='add'>+	ret = ext4_convert_inline_data(inode);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_inode_lock;</div><div class='ctx'> </div><div class='del'>-	if (mode &amp; FALLOC_FL_PUNCH_HOLE) {</div><div class='del'>-		ret = ext4_punch_hole(inode, offset, len);</div><div class='del'>-		goto exit;</div><div class='del'>-	}</div><div class='add'>+	/* Wait all existing dio workers, newcomers will block on i_rwsem */</div><div class='add'>+	inode_dio_wait(inode);</div><div class='ctx'> </div><div class='del'>-	ret = ext4_convert_inline_data(inode);</div><div class='add'>+	ret = file_modified(file);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto exit;</div><div class='add'>+		goto out_inode_lock;</div><div class='ctx'> </div><div class='del'>-	if (mode &amp; FALLOC_FL_COLLAPSE_RANGE) {</div><div class='del'>-		ret = ext4_collapse_range(inode, offset, len);</div><div class='del'>-		goto exit;</div><div class='add'>+	if ((mode &amp; FALLOC_FL_MODE_MASK) == FALLOC_FL_ALLOCATE_RANGE) {</div><div class='add'>+		ret = ext4_do_fallocate(file, offset, len, mode);</div><div class='add'>+		goto out_inode_lock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (mode &amp; FALLOC_FL_INSERT_RANGE) {</div><div class='del'>-		ret = ext4_insert_range(inode, offset, len);</div><div class='del'>-		goto exit;</div><div class='del'>-	}</div><div class='add'>+	/*</div><div class='add'>+	 * Follow-up operations will drop page cache, hold invalidate lock</div><div class='add'>+	 * to prevent page faults from reinstantiating pages we have</div><div class='add'>+	 * released from page cache.</div><div class='add'>+	 */</div><div class='add'>+	filemap_invalidate_lock(mapping);</div><div class='ctx'> </div><div class='del'>-	if (mode &amp; FALLOC_FL_ZERO_RANGE) {</div><div class='add'>+	ret = ext4_break_layouts(inode);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_invalidate_lock;</div><div class='add'>+</div><div class='add'>+	switch (mode &amp; FALLOC_FL_MODE_MASK) {</div><div class='add'>+	case FALLOC_FL_PUNCH_HOLE:</div><div class='add'>+		ret = ext4_punch_hole(file, offset, len);</div><div class='add'>+		break;</div><div class='add'>+	case FALLOC_FL_COLLAPSE_RANGE:</div><div class='add'>+		ret = ext4_collapse_range(file, offset, len);</div><div class='add'>+		break;</div><div class='add'>+	case FALLOC_FL_INSERT_RANGE:</div><div class='add'>+		ret = ext4_insert_range(file, offset, len);</div><div class='add'>+		break;</div><div class='add'>+	case FALLOC_FL_ZERO_RANGE:</div><div class='add'>+	case FALLOC_FL_WRITE_ZEROES:</div><div class='ctx'> 		ret = ext4_zero_range(file, offset, len, mode);</div><div class='del'>-		goto exit;</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		ret = -EOPNOTSUPP;</div><div class='ctx'> 	}</div><div class='del'>-	trace_ext4_fallocate_enter(inode, offset, len, mode);</div><div class='del'>-	lblk = offset &gt;&gt; blkbits;</div><div class='ctx'> </div><div class='del'>-	max_blocks = EXT4_MAX_BLOCKS(len, offset, blkbits);</div><div class='del'>-	flags = EXT4_GET_BLOCKS_CREATE_UNWRIT_EXT;</div><div class='add'>+out_invalidate_lock:</div><div class='add'>+	filemap_invalidate_unlock(mapping);</div><div class='add'>+out_inode_lock:</div><div class='add'>+	inode_unlock(inode);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	inode_lock(inode);</div><div class='add'>+/*</div><div class='add'>+ * This function converts a range of blocks to written extents. The caller of</div><div class='add'>+ * this function will pass the start offset and the size. all unwritten extents</div><div class='add'>+ * within this range will be converted to written extents.</div><div class='add'>+ *</div><div class='add'>+ * This function is called from the direct IO end io call back function for</div><div class='add'>+ * atomic writes, to convert the unwritten extents after IO is completed.</div><div class='add'>+ *</div><div class='add'>+ * Note that the requirement for atomic writes is that all conversion should</div><div class='add'>+ * happen atomically in a single fs journal transaction. We mainly only allocate</div><div class='add'>+ * unwritten extents either on a hole on a pre-exiting unwritten extent range in</div><div class='add'>+ * ext4_map_blocks_atomic_write(). The only case where we can have multiple</div><div class='add'>+ * unwritten extents in a range [offset, offset+len) is when there is a split</div><div class='add'>+ * unwritten extent between two leaf nodes which was cached in extent status</div><div class='add'>+ * cache during ext4_iomap_alloc() time. That will allow</div><div class='add'>+ * ext4_map_blocks_atomic_write() to return the unwritten extent range w/o going</div><div class='add'>+ * into the slow path. That means we might need a loop for conversion of this</div><div class='add'>+ * unwritten extent split across leaf block within a single journal transaction.</div><div class='add'>+ * Split extents across leaf nodes is a rare case, but let's still handle that</div><div class='add'>+ * to meet the requirements of multi-fsblock atomic writes.</div><div class='add'>+ *</div><div class='add'>+ * Returns 0 on success.</div><div class='add'>+ */</div><div class='add'>+int ext4_convert_unwritten_extents_atomic(handle_t *handle, struct inode *inode,</div><div class='add'>+					  loff_t offset, ssize_t len)</div><div class='add'>+{</div><div class='add'>+	unsigned int max_blocks;</div><div class='add'>+	int ret = 0, ret2 = 0, ret3 = 0;</div><div class='add'>+	struct ext4_map_blocks map;</div><div class='add'>+	unsigned int blkbits = inode-&gt;i_blkbits;</div><div class='add'>+	unsigned int credits = 0;</div><div class='add'>+	int flags = EXT4_GET_BLOCKS_IO_CONVERT_EXT | EXT4_EX_NOCACHE;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * We only support preallocation for extent-based files only</div><div class='del'>-	 */</div><div class='del'>-	if (!(ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS))) {</div><div class='del'>-		ret = -EOPNOTSUPP;</div><div class='del'>-		goto out;</div><div class='add'>+	map.m_lblk = offset &gt;&gt; blkbits;</div><div class='add'>+	max_blocks = EXT4_MAX_BLOCKS(len, offset, blkbits);</div><div class='add'>+</div><div class='add'>+	if (!handle) {</div><div class='add'>+		/*</div><div class='add'>+		 * TODO: An optimization can be added later by having an extent</div><div class='add'>+		 * status flag e.g. EXTENT_STATUS_SPLIT_LEAF. If we query that</div><div class='add'>+		 * it can tell if the extent in the cache is a split extent.</div><div class='add'>+		 * But for now let's assume pextents as 2 always.</div><div class='add'>+		 */</div><div class='add'>+		credits = ext4_meta_trans_blocks(inode, max_blocks, 2);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!(mode &amp; FALLOC_FL_KEEP_SIZE) &amp;&amp;</div><div class='del'>-	    (offset + len &gt; inode-&gt;i_size ||</div><div class='del'>-	     offset + len &gt; EXT4_I(inode)-&gt;i_disksize)) {</div><div class='del'>-		new_size = offset + len;</div><div class='del'>-		ret = inode_newsize_ok(inode, new_size);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto out;</div><div class='add'>+	if (credits) {</div><div class='add'>+		handle = ext4_journal_start(inode, EXT4_HT_MAP_BLOCKS, credits);</div><div class='add'>+		if (IS_ERR(handle)) {</div><div class='add'>+			ret = PTR_ERR(handle);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Wait all existing dio workers, newcomers will block on i_mutex */</div><div class='del'>-	inode_dio_wait(inode);</div><div class='add'>+	while (ret &gt;= 0 &amp;&amp; ret &lt; max_blocks) {</div><div class='add'>+		map.m_lblk += ret;</div><div class='add'>+		map.m_len = (max_blocks -= ret);</div><div class='add'>+		ret = ext4_map_blocks(handle, inode, &amp;map, flags);</div><div class='add'>+		if (ret != max_blocks)</div><div class='add'>+			ext4_msg(inode-&gt;i_sb, KERN_INFO,</div><div class='add'>+				     "inode #%lu: block %u: len %u: "</div><div class='add'>+				     "split block mapping found for atomic write, "</div><div class='add'>+				     "ret = %d",</div><div class='add'>+				     inode-&gt;i_ino, map.m_lblk,</div><div class='add'>+				     map.m_len, ret);</div><div class='add'>+		if (ret &lt;= 0)</div><div class='add'>+			break;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	ret = ext4_alloc_file_blocks(file, lblk, max_blocks, new_size, flags);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+	ret2 = ext4_mark_inode_dirty(handle, inode);</div><div class='ctx'> </div><div class='del'>-	if (file-&gt;f_flags &amp; O_SYNC &amp;&amp; EXT4_SB(inode-&gt;i_sb)-&gt;s_journal) {</div><div class='del'>-		ret = ext4_fc_commit(EXT4_SB(inode-&gt;i_sb)-&gt;s_journal,</div><div class='del'>-					EXT4_I(inode)-&gt;i_sync_tid);</div><div class='add'>+	if (credits) {</div><div class='add'>+		ret3 = ext4_journal_stop(handle);</div><div class='add'>+		if (unlikely(ret3))</div><div class='add'>+			ret2 = ret3;</div><div class='ctx'> 	}</div><div class='del'>-out:</div><div class='del'>-	inode_unlock(inode);</div><div class='del'>-	trace_ext4_fallocate_exit(inode, offset, max_blocks, ret);</div><div class='del'>-exit:</div><div class='del'>-	ext4_fc_stop_update(inode);</div><div class='del'>-	return ret;</div><div class='add'>+</div><div class='add'>+	if (ret &lt;= 0 || ret2)</div><div class='add'>+		ext4_warning(inode-&gt;i_sb,</div><div class='add'>+			     "inode #%lu: block %u: len %u: "</div><div class='add'>+			     "returned %d or %d",</div><div class='add'>+			     inode-&gt;i_ino, map.m_lblk,</div><div class='add'>+			     map.m_len, ret, ret2);</div><div class='add'>+</div><div class='add'>+	return ret &gt; 0 ? ret2 : ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -4805,8 +4968,14 @@ int ext4_convert_unwritten_extents(handle_t *handle, struct inode *inode,</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='add'>+		/*</div><div class='add'>+		 * Do not cache any unrelated extents, as it does not hold the</div><div class='add'>+		 * i_rwsem or invalidate_lock, which could corrupt the extent</div><div class='add'>+		 * status tree.</div><div class='add'>+		 */</div><div class='ctx'> 		ret = ext4_map_blocks(handle, inode, &amp;map,</div><div class='del'>-				      EXT4_GET_BLOCKS_IO_CONVERT_EXT);</div><div class='add'>+				      EXT4_GET_BLOCKS_IO_CONVERT_EXT |</div><div class='add'>+				      EXT4_EX_NOCACHE);</div><div class='ctx'> 		if (ret &lt;= 0)</div><div class='ctx'> 			ext4_warning(inode-&gt;i_sb,</div><div class='ctx'> 				     "inode #%lu: block %u: len %u: "</div><div class='hunk'>@@ -4917,12 +5086,7 @@ static const struct iomap_ops ext4_iomap_xattr_ops = {</div><div class='ctx'> </div><div class='ctx'> static int ext4_fiemap_check_ranges(struct inode *inode, u64 start, u64 *len)</div><div class='ctx'> {</div><div class='del'>-	u64 maxbytes;</div><div class='del'>-</div><div class='del'>-	if (ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS))</div><div class='del'>-		maxbytes = inode-&gt;i_sb-&gt;s_maxbytes;</div><div class='del'>-	else</div><div class='del'>-		maxbytes = EXT4_SB(inode-&gt;i_sb)-&gt;s_bitmap_maxbytes;</div><div class='add'>+	u64 maxbytes = ext4_get_maxbytes(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (*len == 0)</div><div class='ctx'> 		return -EINVAL;</div><div class='hunk'>@@ -4942,10 +5106,11 @@ int ext4_fiemap(struct inode *inode, struct fiemap_extent_info *fieinfo,</div><div class='ctx'> {</div><div class='ctx'> 	int error = 0;</div><div class='ctx'> </div><div class='add'>+	inode_lock_shared(inode);</div><div class='ctx'> 	if (fieinfo-&gt;fi_flags &amp; FIEMAP_FLAG_CACHE) {</div><div class='ctx'> 		error = ext4_ext_precache(inode);</div><div class='ctx'> 		if (error)</div><div class='del'>-			return error;</div><div class='add'>+			goto unlock;</div><div class='ctx'> 		fieinfo-&gt;fi_flags &amp;= ~FIEMAP_FLAG_CACHE;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -4956,15 +5121,19 @@ int ext4_fiemap(struct inode *inode, struct fiemap_extent_info *fieinfo,</div><div class='ctx'> 	 */</div><div class='ctx'> 	error = ext4_fiemap_check_ranges(inode, start, &amp;len);</div><div class='ctx'> 	if (error)</div><div class='del'>-		return error;</div><div class='add'>+		goto unlock;</div><div class='ctx'> </div><div class='ctx'> 	if (fieinfo-&gt;fi_flags &amp; FIEMAP_FLAG_XATTR) {</div><div class='ctx'> 		fieinfo-&gt;fi_flags &amp;= ~FIEMAP_FLAG_XATTR;</div><div class='del'>-		return iomap_fiemap(inode, fieinfo, start, len,</div><div class='del'>-				    &amp;ext4_iomap_xattr_ops);</div><div class='add'>+		error = iomap_fiemap(inode, fieinfo, start, len,</div><div class='add'>+				     &amp;ext4_iomap_xattr_ops);</div><div class='add'>+	} else {</div><div class='add'>+		error = iomap_fiemap(inode, fieinfo, start, len,</div><div class='add'>+				     &amp;ext4_iomap_report_ops);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	return iomap_fiemap(inode, fieinfo, start, len, &amp;ext4_iomap_report_ops);</div><div class='add'>+unlock:</div><div class='add'>+	inode_unlock_shared(inode);</div><div class='add'>+	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int ext4_get_es_cache(struct inode *inode, struct fiemap_extent_info *fieinfo,</div><div class='hunk'>@@ -4985,7 +5154,9 @@ int ext4_get_es_cache(struct inode *inode, struct fiemap_extent_info *fieinfo,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (fieinfo-&gt;fi_flags &amp; FIEMAP_FLAG_CACHE) {</div><div class='add'>+		inode_lock_shared(inode);</div><div class='ctx'> 		error = ext4_ext_precache(inode);</div><div class='add'>+		inode_unlock_shared(inode);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			return error;</div><div class='ctx'> 		fieinfo-&gt;fi_flags &amp;= ~FIEMAP_FLAG_CACHE;</div><div class='hunk'>@@ -5044,7 +5215,7 @@ ext4_ext_shift_path_extents(struct ext4_ext_path *path, ext4_lblk_t shift,</div><div class='ctx'> 				credits = depth + 2;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			restart_credits = ext4_writepage_trans_blocks(inode);</div><div class='add'>+			restart_credits = ext4_chunk_trans_extent(inode, 0);</div><div class='ctx'> 			err = ext4_datasem_ensure_credits(handle, inode, credits,</div><div class='ctx'> 					restart_credits, 0);</div><div class='ctx'> 			if (err) {</div><div class='hunk'>@@ -5146,7 +5317,7 @@ ext4_ext_shift_extents(struct inode *inode, handle_t *handle,</div><div class='ctx'> 	* won't be shifted beyond EXT_MAX_BLOCKS.</div><div class='ctx'> 	*/</div><div class='ctx'> 	if (SHIFT == SHIFT_LEFT) {</div><div class='del'>-		path = ext4_find_extent(inode, start - 1, &amp;path,</div><div class='add'>+		path = ext4_find_extent(inode, start - 1, path,</div><div class='ctx'> 					EXT4_EX_NOCACHE);</div><div class='ctx'> 		if (IS_ERR(path))</div><div class='ctx'> 			return PTR_ERR(path);</div><div class='hunk'>@@ -5180,6 +5351,7 @@ ext4_ext_shift_extents(struct inode *inode, handle_t *handle,</div><div class='ctx'> 	 * and it is decreased till we reach start.</div><div class='ctx'> 	 */</div><div class='ctx'> again:</div><div class='add'>+	ret = 0;</div><div class='ctx'> 	if (SHIFT == SHIFT_LEFT)</div><div class='ctx'> 		iterator = &amp;start;</div><div class='ctx'> 	else</div><div class='hunk'>@@ -5194,7 +5366,7 @@ again:</div><div class='ctx'> 	 * becomes NULL to indicate the end of the loop.</div><div class='ctx'> 	 */</div><div class='ctx'> 	while (iterator &amp;&amp; start &lt;= stop) {</div><div class='del'>-		path = ext4_find_extent(inode, *iterator, &amp;path,</div><div class='add'>+		path = ext4_find_extent(inode, *iterator, path,</div><div class='ctx'> 					EXT4_EX_NOCACHE);</div><div class='ctx'> 		if (IS_ERR(path))</div><div class='ctx'> 			return PTR_ERR(path);</div><div class='hunk'>@@ -5223,14 +5395,21 @@ again:</div><div class='ctx'> 					ext4_ext_get_actual_len(extent);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			extent = EXT_FIRST_EXTENT(path[depth].p_hdr);</div><div class='del'>-			if (le32_to_cpu(extent-&gt;ee_block) &gt; 0)</div><div class='add'>+			if (le32_to_cpu(extent-&gt;ee_block) &gt; start)</div><div class='ctx'> 				*iterator = le32_to_cpu(extent-&gt;ee_block) - 1;</div><div class='del'>-			else</div><div class='del'>-				/* Beginning is reached, end of the loop */</div><div class='add'>+			else if (le32_to_cpu(extent-&gt;ee_block) == start)</div><div class='ctx'> 				iterator = NULL;</div><div class='del'>-			/* Update path extent in case we need to stop */</div><div class='del'>-			while (le32_to_cpu(extent-&gt;ee_block) &lt; start)</div><div class='add'>+			else {</div><div class='add'>+				extent = EXT_LAST_EXTENT(path[depth].p_hdr);</div><div class='add'>+				while (le32_to_cpu(extent-&gt;ee_block) &gt;= start)</div><div class='add'>+					extent--;</div><div class='add'>+</div><div class='add'>+				if (extent == EXT_LAST_EXTENT(path[depth].p_hdr))</div><div class='add'>+					break;</div><div class='add'>+</div><div class='ctx'> 				extent++;</div><div class='add'>+				iterator = NULL;</div><div class='add'>+			}</div><div class='ctx'> 			path[depth].p_ext = extent;</div><div class='ctx'> 		}</div><div class='ctx'> 		ret = ext4_ext_shift_path_extents(path, shift, inode,</div><div class='hunk'>@@ -5242,8 +5421,7 @@ again:</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='del'>-	ext4_ext_drop_refs(path);</div><div class='del'>-	kfree(path);</div><div class='add'>+	ext4_free_ext_path(path);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5252,122 +5430,79 @@ out:</div><div class='ctx'>  * This implements the fallocate's collapse range functionality for ext4</div><div class='ctx'>  * Returns: 0 and non-zero on error.</div><div class='ctx'>  */</div><div class='del'>-static int ext4_collapse_range(struct inode *inode, loff_t offset, loff_t len)</div><div class='add'>+static int ext4_collapse_range(struct file *file, loff_t offset, loff_t len)</div><div class='ctx'> {</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='del'>-	ext4_lblk_t punch_start, punch_stop;</div><div class='add'>+	loff_t end = offset + len;</div><div class='add'>+	ext4_lblk_t start_lblk, end_lblk;</div><div class='ctx'> 	handle_t *handle;</div><div class='ctx'> 	unsigned int credits;</div><div class='del'>-	loff_t new_size, ioffset;</div><div class='add'>+	loff_t start, new_size;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * We need to test this early because xfstests assumes that a</div><div class='del'>-	 * collapse range of (0, 1) will return EOPNOTSUPP if the file</div><div class='del'>-	 * system does not support collapse range.</div><div class='del'>-	 */</div><div class='add'>+	trace_ext4_collapse_range(inode, offset, len);</div><div class='add'>+	WARN_ON_ONCE(!inode_is_locked(inode));</div><div class='add'>+</div><div class='add'>+	/* Currently just for extent based files */</div><div class='ctx'> 	if (!ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='del'>-</div><div class='ctx'> 	/* Collapse range works only on fs cluster size aligned regions. */</div><div class='ctx'> 	if (!IS_ALIGNED(offset | len, EXT4_CLUSTER_SIZE(sb)))</div><div class='ctx'> 		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	trace_ext4_collapse_range(inode, offset, len);</div><div class='del'>-</div><div class='del'>-	punch_start = offset &gt;&gt; EXT4_BLOCK_SIZE_BITS(sb);</div><div class='del'>-	punch_stop = (offset + len) &gt;&gt; EXT4_BLOCK_SIZE_BITS(sb);</div><div class='del'>-</div><div class='del'>-	/* Call ext4_force_commit to flush all data in case of data=journal. */</div><div class='del'>-	if (ext4_should_journal_data(inode)) {</div><div class='del'>-		ret = ext4_force_commit(inode-&gt;i_sb);</div><div class='del'>-		if (ret)</div><div class='del'>-			return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	inode_lock(inode);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * There is no need to overlap collapse range with EOF, in which case</div><div class='ctx'> 	 * it is effectively a truncate operation</div><div class='ctx'> 	 */</div><div class='del'>-	if (offset + len &gt;= inode-&gt;i_size) {</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		goto out_mutex;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Currently just for extent based files */</div><div class='del'>-	if (!ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS)) {</div><div class='del'>-		ret = -EOPNOTSUPP;</div><div class='del'>-		goto out_mutex;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Wait for existing dio to complete */</div><div class='del'>-	inode_dio_wait(inode);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Prevent page faults from reinstantiating pages we have released from</div><div class='del'>-	 * page cache.</div><div class='del'>-	 */</div><div class='del'>-	filemap_invalidate_lock(mapping);</div><div class='del'>-</div><div class='del'>-	ret = ext4_break_layouts(inode);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto out_mmap;</div><div class='add'>+	if (end &gt;= inode-&gt;i_size)</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='add'>+	 * Write tail of the last page before removed range and data that</div><div class='add'>+	 * will be shifted since they will get removed from the page cache</div><div class='add'>+	 * below. We are also protected from pages becoming dirty by</div><div class='add'>+	 * i_rwsem and invalidate_lock.</div><div class='ctx'> 	 * Need to round down offset to be aligned with page size boundary</div><div class='ctx'> 	 * for page size &gt; block size.</div><div class='ctx'> 	 */</div><div class='del'>-	ioffset = round_down(offset, PAGE_SIZE);</div><div class='del'>-	/*</div><div class='del'>-	 * Write tail of the last page before removed range since it will get</div><div class='del'>-	 * removed from the page cache below.</div><div class='del'>-	 */</div><div class='del'>-	ret = filemap_write_and_wait_range(mapping, ioffset, offset);</div><div class='add'>+	start = round_down(offset, PAGE_SIZE);</div><div class='add'>+	ret = filemap_write_and_wait_range(mapping, start, offset);</div><div class='add'>+	if (!ret)</div><div class='add'>+		ret = filemap_write_and_wait_range(mapping, end, LLONG_MAX);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out_mmap;</div><div class='del'>-	/*</div><div class='del'>-	 * Write data that will be shifted to preserve them when discarding</div><div class='del'>-	 * page cache below. We are also protected from pages becoming dirty</div><div class='del'>-	 * by i_rwsem and invalidate_lock.</div><div class='del'>-	 */</div><div class='del'>-	ret = filemap_write_and_wait_range(mapping, offset + len,</div><div class='del'>-					   LLONG_MAX);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto out_mmap;</div><div class='del'>-	truncate_pagecache(inode, ioffset);</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	truncate_pagecache(inode, start);</div><div class='ctx'> </div><div class='del'>-	credits = ext4_writepage_trans_blocks(inode);</div><div class='add'>+	credits = ext4_chunk_trans_extent(inode, 0);</div><div class='ctx'> 	handle = ext4_journal_start(inode, EXT4_HT_TRUNCATE, credits);</div><div class='del'>-	if (IS_ERR(handle)) {</div><div class='del'>-		ret = PTR_ERR(handle);</div><div class='del'>-		goto out_mmap;</div><div class='del'>-	}</div><div class='del'>-	ext4_fc_start_ineligible(sb, EXT4_FC_REASON_FALLOC_RANGE);</div><div class='add'>+	if (IS_ERR(handle))</div><div class='add'>+		return PTR_ERR(handle);</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='del'>-	ext4_discard_preallocations(inode, 0);</div><div class='add'>+	ext4_fc_mark_ineligible(sb, EXT4_FC_REASON_FALLOC_RANGE, handle);</div><div class='ctx'> </div><div class='del'>-	ret = ext4_es_remove_extent(inode, punch_start,</div><div class='del'>-				    EXT_MAX_BLOCKS - punch_start);</div><div class='del'>-	if (ret) {</div><div class='del'>-		up_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='del'>-		goto out_stop;</div><div class='del'>-	}</div><div class='add'>+	start_lblk = offset &gt;&gt; inode-&gt;i_blkbits;</div><div class='add'>+	end_lblk = (offset + len) &gt;&gt; inode-&gt;i_blkbits;</div><div class='add'>+</div><div class='add'>+	ext4_check_map_extents_env(inode);</div><div class='add'>+</div><div class='add'>+	down_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='add'>+	ext4_discard_preallocations(inode);</div><div class='add'>+	ext4_es_remove_extent(inode, start_lblk, EXT_MAX_BLOCKS - start_lblk);</div><div class='ctx'> </div><div class='del'>-	ret = ext4_ext_remove_space(inode, punch_start, punch_stop - 1);</div><div class='add'>+	ret = ext4_ext_remove_space(inode, start_lblk, end_lblk - 1);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		up_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='del'>-		goto out_stop;</div><div class='add'>+		goto out_handle;</div><div class='ctx'> 	}</div><div class='del'>-	ext4_discard_preallocations(inode, 0);</div><div class='add'>+	ext4_discard_preallocations(inode);</div><div class='ctx'> </div><div class='del'>-	ret = ext4_ext_shift_extents(inode, handle, punch_stop,</div><div class='del'>-				     punch_stop - punch_start, SHIFT_LEFT);</div><div class='add'>+	ret = ext4_ext_shift_extents(inode, handle, end_lblk,</div><div class='add'>+				     end_lblk - start_lblk, SHIFT_LEFT);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		up_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='del'>-		goto out_stop;</div><div class='add'>+		goto out_handle;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	new_size = inode-&gt;i_size - len;</div><div class='hunk'>@@ -5375,19 +5510,16 @@ static int ext4_collapse_range(struct inode *inode, loff_t offset, loff_t len)</div><div class='ctx'> 	EXT4_I(inode)-&gt;i_disksize = new_size;</div><div class='ctx'> </div><div class='ctx'> 	up_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='del'>-	if (IS_SYNC(inode))</div><div class='del'>-		ext4_handle_sync(handle);</div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='ctx'> 	ret = ext4_mark_inode_dirty(handle, inode);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_handle;</div><div class='add'>+</div><div class='ctx'> 	ext4_update_inode_fsync_trans(handle, inode, 1);</div><div class='add'>+	if (IS_SYNC(inode))</div><div class='add'>+		ext4_handle_sync(handle);</div><div class='ctx'> </div><div class='del'>-out_stop:</div><div class='add'>+out_handle:</div><div class='ctx'> 	ext4_journal_stop(handle);</div><div class='del'>-	ext4_fc_stop_ineligible(sb);</div><div class='del'>-out_mmap:</div><div class='del'>-	filemap_invalidate_unlock(mapping);</div><div class='del'>-out_mutex:</div><div class='del'>-	inode_unlock(inode);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5399,109 +5531,73 @@ out_mutex:</div><div class='ctx'>  * by len bytes.</div><div class='ctx'>  * Returns 0 on success, error otherwise.</div><div class='ctx'>  */</div><div class='del'>-static int ext4_insert_range(struct inode *inode, loff_t offset, loff_t len)</div><div class='add'>+static int ext4_insert_range(struct file *file, loff_t offset, loff_t len)</div><div class='ctx'> {</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='ctx'> 	handle_t *handle;</div><div class='ctx'> 	struct ext4_ext_path *path;</div><div class='ctx'> 	struct ext4_extent *extent;</div><div class='del'>-	ext4_lblk_t offset_lblk, len_lblk, ee_start_lblk = 0;</div><div class='add'>+	ext4_lblk_t start_lblk, len_lblk, ee_start_lblk = 0;</div><div class='ctx'> 	unsigned int credits, ee_len;</div><div class='del'>-	int ret = 0, depth, split_flag = 0;</div><div class='del'>-	loff_t ioffset;</div><div class='add'>+	int ret, depth, split_flag = 0;</div><div class='add'>+	loff_t start;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * We need to test this early because xfstests assumes that an</div><div class='del'>-	 * insert range of (0, 1) will return EOPNOTSUPP if the file</div><div class='del'>-	 * system does not support insert range.</div><div class='del'>-	 */</div><div class='add'>+	trace_ext4_insert_range(inode, offset, len);</div><div class='add'>+	WARN_ON_ONCE(!inode_is_locked(inode));</div><div class='add'>+</div><div class='add'>+	/* Currently just for extent based files */</div><div class='ctx'> 	if (!ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='del'>-</div><div class='ctx'> 	/* Insert range works only on fs cluster size aligned regions. */</div><div class='ctx'> 	if (!IS_ALIGNED(offset | len, EXT4_CLUSTER_SIZE(sb)))</div><div class='ctx'> 		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	trace_ext4_insert_range(inode, offset, len);</div><div class='del'>-</div><div class='del'>-	offset_lblk = offset &gt;&gt; EXT4_BLOCK_SIZE_BITS(sb);</div><div class='del'>-	len_lblk = len &gt;&gt; EXT4_BLOCK_SIZE_BITS(sb);</div><div class='del'>-</div><div class='del'>-	/* Call ext4_force_commit to flush all data in case of data=journal */</div><div class='del'>-	if (ext4_should_journal_data(inode)) {</div><div class='del'>-		ret = ext4_force_commit(inode-&gt;i_sb);</div><div class='del'>-		if (ret)</div><div class='del'>-			return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	inode_lock(inode);</div><div class='del'>-	/* Currently just for extent based files */</div><div class='del'>-	if (!ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS)) {</div><div class='del'>-		ret = -EOPNOTSUPP;</div><div class='del'>-		goto out_mutex;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Check whether the maximum file size would be exceeded */</div><div class='del'>-	if (len &gt; inode-&gt;i_sb-&gt;s_maxbytes - inode-&gt;i_size) {</div><div class='del'>-		ret = -EFBIG;</div><div class='del'>-		goto out_mutex;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	/* Offset must be less than i_size */</div><div class='del'>-	if (offset &gt;= inode-&gt;i_size) {</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		goto out_mutex;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Wait for existing dio to complete */</div><div class='del'>-	inode_dio_wait(inode);</div><div class='add'>+	if (offset &gt;= inode-&gt;i_size)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	/* Check whether the maximum file size would be exceeded */</div><div class='add'>+	if (len &gt; inode-&gt;i_sb-&gt;s_maxbytes - inode-&gt;i_size)</div><div class='add'>+		return -EFBIG;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Prevent page faults from reinstantiating pages we have released from</div><div class='del'>-	 * page cache.</div><div class='add'>+	 * Write out all dirty pages. Need to round down to align start offset</div><div class='add'>+	 * to page size boundary for page size &gt; block size.</div><div class='ctx'> 	 */</div><div class='del'>-	filemap_invalidate_lock(mapping);</div><div class='del'>-</div><div class='del'>-	ret = ext4_break_layouts(inode);</div><div class='add'>+	start = round_down(offset, PAGE_SIZE);</div><div class='add'>+	ret = filemap_write_and_wait_range(mapping, start, LLONG_MAX);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out_mmap;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Need to round down to align start offset to page size boundary</div><div class='del'>-	 * for page size &gt; block size.</div><div class='del'>-	 */</div><div class='del'>-	ioffset = round_down(offset, PAGE_SIZE);</div><div class='del'>-	/* Write out all dirty pages */</div><div class='del'>-	ret = filemap_write_and_wait_range(inode-&gt;i_mapping, ioffset,</div><div class='del'>-			LLONG_MAX);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto out_mmap;</div><div class='del'>-	truncate_pagecache(inode, ioffset);</div><div class='add'>+	truncate_pagecache(inode, start);</div><div class='ctx'> </div><div class='del'>-	credits = ext4_writepage_trans_blocks(inode);</div><div class='add'>+	credits = ext4_chunk_trans_extent(inode, 0);</div><div class='ctx'> 	handle = ext4_journal_start(inode, EXT4_HT_TRUNCATE, credits);</div><div class='del'>-	if (IS_ERR(handle)) {</div><div class='del'>-		ret = PTR_ERR(handle);</div><div class='del'>-		goto out_mmap;</div><div class='del'>-	}</div><div class='del'>-	ext4_fc_start_ineligible(sb, EXT4_FC_REASON_FALLOC_RANGE);</div><div class='add'>+	if (IS_ERR(handle))</div><div class='add'>+		return PTR_ERR(handle);</div><div class='add'>+</div><div class='add'>+	ext4_fc_mark_ineligible(sb, EXT4_FC_REASON_FALLOC_RANGE, handle);</div><div class='ctx'> </div><div class='ctx'> 	/* Expand file to avoid data loss if there is error while shifting */</div><div class='ctx'> 	inode-&gt;i_size += len;</div><div class='ctx'> 	EXT4_I(inode)-&gt;i_disksize += len;</div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='ctx'> 	ret = ext4_mark_inode_dirty(handle, inode);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out_stop;</div><div class='add'>+		goto out_handle;</div><div class='add'>+</div><div class='add'>+	start_lblk = offset &gt;&gt; inode-&gt;i_blkbits;</div><div class='add'>+	len_lblk = len &gt;&gt; inode-&gt;i_blkbits;</div><div class='add'>+</div><div class='add'>+	ext4_check_map_extents_env(inode);</div><div class='ctx'> </div><div class='ctx'> 	down_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='del'>-	ext4_discard_preallocations(inode, 0);</div><div class='add'>+	ext4_discard_preallocations(inode);</div><div class='ctx'> </div><div class='del'>-	path = ext4_find_extent(inode, offset_lblk, NULL, 0);</div><div class='add'>+	path = ext4_find_extent(inode, start_lblk, NULL, 0);</div><div class='ctx'> 	if (IS_ERR(path)) {</div><div class='ctx'> 		up_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='del'>-		goto out_stop;</div><div class='add'>+		ret = PTR_ERR(path);</div><div class='add'>+		goto out_handle;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	depth = ext_depth(inode);</div><div class='hunk'>@@ -5511,60 +5607,47 @@ static int ext4_insert_range(struct inode *inode, loff_t offset, loff_t len)</div><div class='ctx'> 		ee_len = ext4_ext_get_actual_len(extent);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * If offset_lblk is not the starting block of extent, split</div><div class='del'>-		 * the extent @offset_lblk</div><div class='add'>+		 * If start_lblk is not the starting block of extent, split</div><div class='add'>+		 * the extent @start_lblk</div><div class='ctx'> 		 */</div><div class='del'>-		if ((offset_lblk &gt; ee_start_lblk) &amp;&amp;</div><div class='del'>-				(offset_lblk &lt; (ee_start_lblk + ee_len))) {</div><div class='add'>+		if ((start_lblk &gt; ee_start_lblk) &amp;&amp;</div><div class='add'>+				(start_lblk &lt; (ee_start_lblk + ee_len))) {</div><div class='ctx'> 			if (ext4_ext_is_unwritten(extent))</div><div class='ctx'> 				split_flag = EXT4_EXT_MARK_UNWRIT1 |</div><div class='ctx'> 					EXT4_EXT_MARK_UNWRIT2;</div><div class='del'>-			ret = ext4_split_extent_at(handle, inode, &amp;path,</div><div class='del'>-					offset_lblk, split_flag,</div><div class='add'>+			path = ext4_split_extent_at(handle, inode, path,</div><div class='add'>+					start_lblk, split_flag,</div><div class='ctx'> 					EXT4_EX_NOCACHE |</div><div class='del'>-					EXT4_GET_BLOCKS_PRE_IO |</div><div class='add'>+					EXT4_GET_BLOCKS_SPLIT_NOMERGE |</div><div class='ctx'> 					EXT4_GET_BLOCKS_METADATA_NOFAIL);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		ext4_ext_drop_refs(path);</div><div class='del'>-		kfree(path);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='add'>+		if (IS_ERR(path)) {</div><div class='ctx'> 			up_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='del'>-			goto out_stop;</div><div class='add'>+			ret = PTR_ERR(path);</div><div class='add'>+			goto out_handle;</div><div class='ctx'> 		}</div><div class='del'>-	} else {</div><div class='del'>-		ext4_ext_drop_refs(path);</div><div class='del'>-		kfree(path);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = ext4_es_remove_extent(inode, offset_lblk,</div><div class='del'>-			EXT_MAX_BLOCKS - offset_lblk);</div><div class='del'>-	if (ret) {</div><div class='del'>-		up_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='del'>-		goto out_stop;</div><div class='del'>-	}</div><div class='add'>+	ext4_free_ext_path(path);</div><div class='add'>+	ext4_es_remove_extent(inode, start_lblk, EXT_MAX_BLOCKS - start_lblk);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * if offset_lblk lies in a hole which is at start of file, use</div><div class='add'>+	 * if start_lblk lies in a hole which is at start of file, use</div><div class='ctx'> 	 * ee_start_lblk to shift extents</div><div class='ctx'> 	 */</div><div class='ctx'> 	ret = ext4_ext_shift_extents(inode, handle,</div><div class='del'>-		ee_start_lblk &gt; offset_lblk ? ee_start_lblk : offset_lblk,</div><div class='del'>-		len_lblk, SHIFT_RIGHT);</div><div class='del'>-</div><div class='add'>+		max(ee_start_lblk, start_lblk), len_lblk, SHIFT_RIGHT);</div><div class='ctx'> 	up_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_handle;</div><div class='add'>+</div><div class='add'>+	ext4_update_inode_fsync_trans(handle, inode, 1);</div><div class='ctx'> 	if (IS_SYNC(inode))</div><div class='ctx'> 		ext4_handle_sync(handle);</div><div class='del'>-	if (ret &gt;= 0)</div><div class='del'>-		ext4_update_inode_fsync_trans(handle, inode, 1);</div><div class='ctx'> </div><div class='del'>-out_stop:</div><div class='add'>+out_handle:</div><div class='ctx'> 	ext4_journal_stop(handle);</div><div class='del'>-	ext4_fc_stop_ineligible(sb);</div><div class='del'>-out_mmap:</div><div class='del'>-	filemap_invalidate_unlock(mapping);</div><div class='del'>-out_mutex:</div><div class='del'>-	inode_unlock(inode);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5583,7 +5666,7 @@ out_mutex:</div><div class='ctx'>  * stuff such as page-cache locking consistency, bh mapping consistency or</div><div class='ctx'>  * extent's data copying must be performed by caller.</div><div class='ctx'>  * Locking:</div><div class='del'>- * 		i_mutex is held for both inodes</div><div class='add'>+ *		i_rwsem is held for both inodes</div><div class='ctx'>  * 		i_data_sem is locked for write for both inodes</div><div class='ctx'>  * Assumptions:</div><div class='ctx'>  *		All pages from requested range are locked for both inodes</div><div class='hunk'>@@ -5602,12 +5685,8 @@ ext4_swap_extents(handle_t *handle, struct inode *inode1,</div><div class='ctx'> 	BUG_ON(!inode_is_locked(inode1));</div><div class='ctx'> 	BUG_ON(!inode_is_locked(inode2));</div><div class='ctx'> </div><div class='del'>-	*erp = ext4_es_remove_extent(inode1, lblk1, count);</div><div class='del'>-	if (unlikely(*erp))</div><div class='del'>-		return 0;</div><div class='del'>-	*erp = ext4_es_remove_extent(inode2, lblk2, count);</div><div class='del'>-	if (unlikely(*erp))</div><div class='del'>-		return 0;</div><div class='add'>+	ext4_es_remove_extent(inode1, lblk1, count);</div><div class='add'>+	ext4_es_remove_extent(inode2, lblk2, count);</div><div class='ctx'> </div><div class='ctx'> 	while (count) {</div><div class='ctx'> 		struct ext4_extent *ex1, *ex2, tmp_ex;</div><div class='hunk'>@@ -5615,25 +5694,21 @@ ext4_swap_extents(handle_t *handle, struct inode *inode1,</div><div class='ctx'> 		int e1_len, e2_len, len;</div><div class='ctx'> 		int split = 0;</div><div class='ctx'> </div><div class='del'>-		path1 = ext4_find_extent(inode1, lblk1, NULL, EXT4_EX_NOCACHE);</div><div class='add'>+		path1 = ext4_find_extent(inode1, lblk1, path1, EXT4_EX_NOCACHE);</div><div class='ctx'> 		if (IS_ERR(path1)) {</div><div class='ctx'> 			*erp = PTR_ERR(path1);</div><div class='del'>-			path1 = NULL;</div><div class='del'>-		finish:</div><div class='del'>-			count = 0;</div><div class='del'>-			goto repeat;</div><div class='add'>+			goto errout;</div><div class='ctx'> 		}</div><div class='del'>-		path2 = ext4_find_extent(inode2, lblk2, NULL, EXT4_EX_NOCACHE);</div><div class='add'>+		path2 = ext4_find_extent(inode2, lblk2, path2, EXT4_EX_NOCACHE);</div><div class='ctx'> 		if (IS_ERR(path2)) {</div><div class='ctx'> 			*erp = PTR_ERR(path2);</div><div class='del'>-			path2 = NULL;</div><div class='del'>-			goto finish;</div><div class='add'>+			goto errout;</div><div class='ctx'> 		}</div><div class='ctx'> 		ex1 = path1[path1-&gt;p_depth].p_ext;</div><div class='ctx'> 		ex2 = path2[path2-&gt;p_depth].p_ext;</div><div class='ctx'> 		/* Do we have something to swap ? */</div><div class='ctx'> 		if (unlikely(!ex2 || !ex1))</div><div class='del'>-			goto finish;</div><div class='add'>+			goto errout;</div><div class='ctx'> </div><div class='ctx'> 		e1_blk = le32_to_cpu(ex1-&gt;ee_block);</div><div class='ctx'> 		e2_blk = le32_to_cpu(ex2-&gt;ee_block);</div><div class='hunk'>@@ -5655,7 +5730,7 @@ ext4_swap_extents(handle_t *handle, struct inode *inode1,</div><div class='ctx'> 				next2 = e2_blk;</div><div class='ctx'> 			/* Do we have something to swap */</div><div class='ctx'> 			if (next1 == EXT_MAX_BLOCKS || next2 == EXT_MAX_BLOCKS)</div><div class='del'>-				goto finish;</div><div class='add'>+				goto errout;</div><div class='ctx'> 			/* Move to the rightest boundary */</div><div class='ctx'> 			len = next1 - lblk1;</div><div class='ctx'> 			if (len &lt; next2 - lblk2)</div><div class='hunk'>@@ -5665,28 +5740,32 @@ ext4_swap_extents(handle_t *handle, struct inode *inode1,</div><div class='ctx'> 			lblk1 += len;</div><div class='ctx'> 			lblk2 += len;</div><div class='ctx'> 			count -= len;</div><div class='del'>-			goto repeat;</div><div class='add'>+			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* Prepare left boundary */</div><div class='ctx'> 		if (e1_blk &lt; lblk1) {</div><div class='ctx'> 			split = 1;</div><div class='del'>-			*erp = ext4_force_split_extent_at(handle, inode1,</div><div class='del'>-						&amp;path1, lblk1, 0);</div><div class='del'>-			if (unlikely(*erp))</div><div class='del'>-				goto finish;</div><div class='add'>+			path1 = ext4_force_split_extent_at(handle, inode1,</div><div class='add'>+							   path1, lblk1, 0);</div><div class='add'>+			if (IS_ERR(path1)) {</div><div class='add'>+				*erp = PTR_ERR(path1);</div><div class='add'>+				goto errout;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> 		if (e2_blk &lt; lblk2) {</div><div class='ctx'> 			split = 1;</div><div class='del'>-			*erp = ext4_force_split_extent_at(handle, inode2,</div><div class='del'>-						&amp;path2,  lblk2, 0);</div><div class='del'>-			if (unlikely(*erp))</div><div class='del'>-				goto finish;</div><div class='add'>+			path2 = ext4_force_split_extent_at(handle, inode2,</div><div class='add'>+							   path2, lblk2, 0);</div><div class='add'>+			if (IS_ERR(path2)) {</div><div class='add'>+				*erp = PTR_ERR(path2);</div><div class='add'>+				goto errout;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> 		/* ext4_split_extent_at() may result in leaf extent split,</div><div class='ctx'> 		 * path must to be revalidated. */</div><div class='ctx'> 		if (split)</div><div class='del'>-			goto repeat;</div><div class='add'>+			continue;</div><div class='ctx'> </div><div class='ctx'> 		/* Prepare right boundary */</div><div class='ctx'> 		len = count;</div><div class='hunk'>@@ -5697,30 +5776,34 @@ ext4_swap_extents(handle_t *handle, struct inode *inode1,</div><div class='ctx'> </div><div class='ctx'> 		if (len != e1_len) {</div><div class='ctx'> 			split = 1;</div><div class='del'>-			*erp = ext4_force_split_extent_at(handle, inode1,</div><div class='del'>-						&amp;path1, lblk1 + len, 0);</div><div class='del'>-			if (unlikely(*erp))</div><div class='del'>-				goto finish;</div><div class='add'>+			path1 = ext4_force_split_extent_at(handle, inode1,</div><div class='add'>+							path1, lblk1 + len, 0);</div><div class='add'>+			if (IS_ERR(path1)) {</div><div class='add'>+				*erp = PTR_ERR(path1);</div><div class='add'>+				goto errout;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> 		if (len != e2_len) {</div><div class='ctx'> 			split = 1;</div><div class='del'>-			*erp = ext4_force_split_extent_at(handle, inode2,</div><div class='del'>-						&amp;path2, lblk2 + len, 0);</div><div class='del'>-			if (*erp)</div><div class='del'>-				goto finish;</div><div class='add'>+			path2 = ext4_force_split_extent_at(handle, inode2,</div><div class='add'>+							path2, lblk2 + len, 0);</div><div class='add'>+			if (IS_ERR(path2)) {</div><div class='add'>+				*erp = PTR_ERR(path2);</div><div class='add'>+				goto errout;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> 		/* ext4_split_extent_at() may result in leaf extent split,</div><div class='ctx'> 		 * path must to be revalidated. */</div><div class='ctx'> 		if (split)</div><div class='del'>-			goto repeat;</div><div class='add'>+			continue;</div><div class='ctx'> </div><div class='ctx'> 		BUG_ON(e2_len != e1_len);</div><div class='ctx'> 		*erp = ext4_ext_get_access(handle, inode1, path1 + path1-&gt;p_depth);</div><div class='ctx'> 		if (unlikely(*erp))</div><div class='del'>-			goto finish;</div><div class='add'>+			goto errout;</div><div class='ctx'> 		*erp = ext4_ext_get_access(handle, inode2, path2 + path2-&gt;p_depth);</div><div class='ctx'> 		if (unlikely(*erp))</div><div class='del'>-			goto finish;</div><div class='add'>+			goto errout;</div><div class='ctx'> </div><div class='ctx'> 		/* Both extents are fully inside boundaries. Swap it now */</div><div class='ctx'> 		tmp_ex = *ex1;</div><div class='hunk'>@@ -5738,7 +5821,7 @@ ext4_swap_extents(handle_t *handle, struct inode *inode1,</div><div class='ctx'> 		*erp = ext4_ext_dirty(handle, inode2, path2 +</div><div class='ctx'> 				      path2-&gt;p_depth);</div><div class='ctx'> 		if (unlikely(*erp))</div><div class='del'>-			goto finish;</div><div class='add'>+			goto errout;</div><div class='ctx'> 		*erp = ext4_ext_dirty(handle, inode1, path1 +</div><div class='ctx'> 				      path1-&gt;p_depth);</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -5748,19 +5831,17 @@ ext4_swap_extents(handle_t *handle, struct inode *inode1,</div><div class='ctx'> 		 * aborted anyway.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (unlikely(*erp))</div><div class='del'>-			goto finish;</div><div class='add'>+			goto errout;</div><div class='add'>+</div><div class='ctx'> 		lblk1 += len;</div><div class='ctx'> 		lblk2 += len;</div><div class='ctx'> 		replaced_count += len;</div><div class='ctx'> 		count -= len;</div><div class='del'>-</div><div class='del'>-	repeat:</div><div class='del'>-		ext4_ext_drop_refs(path1);</div><div class='del'>-		kfree(path1);</div><div class='del'>-		ext4_ext_drop_refs(path2);</div><div class='del'>-		kfree(path2);</div><div class='del'>-		path1 = path2 = NULL;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+errout:</div><div class='add'>+	ext4_free_ext_path(path1);</div><div class='add'>+	ext4_free_ext_path(path2);</div><div class='ctx'> 	return replaced_count;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5784,13 +5865,19 @@ int ext4_clu_mapped(struct inode *inode, ext4_lblk_t lclu)</div><div class='ctx'> 	struct ext4_extent *extent;</div><div class='ctx'> 	ext4_lblk_t first_lblk, first_lclu, last_lclu;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * if data can be stored inline, the logical cluster isn't</div><div class='add'>+	 * mapped - no physical clusters have been allocated, and the</div><div class='add'>+	 * file has no extents</div><div class='add'>+	 */</div><div class='add'>+	if (ext4_test_inode_state(inode, EXT4_STATE_MAY_INLINE_DATA) ||</div><div class='add'>+	    ext4_has_inline_data(inode))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='ctx'> 	/* search for the extent closest to the first block in the cluster */</div><div class='ctx'> 	path = ext4_find_extent(inode, EXT4_C2B(sbi, lclu), NULL, 0);</div><div class='del'>-	if (IS_ERR(path)) {</div><div class='del'>-		err = PTR_ERR(path);</div><div class='del'>-		path = NULL;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (IS_ERR(path))</div><div class='add'>+		return PTR_ERR(path);</div><div class='ctx'> </div><div class='ctx'> 	depth = ext_depth(inode);</div><div class='ctx'> </div><div class='hunk'>@@ -5837,8 +5924,7 @@ int ext4_clu_mapped(struct inode *inode, ext4_lblk_t lclu)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	ext4_ext_drop_refs(path);</div><div class='del'>-	kfree(path);</div><div class='add'>+	ext4_free_ext_path(path);</div><div class='ctx'> </div><div class='ctx'> 	return err ? err : mapped;</div><div class='ctx'> }</div><div class='hunk'>@@ -5853,7 +5939,7 @@ out:</div><div class='ctx'> int ext4_ext_replay_update_ex(struct inode *inode, ext4_lblk_t start,</div><div class='ctx'> 			      int len, int unwritten, ext4_fsblk_t pblk)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_ext_path *path = NULL, *ppath;</div><div class='add'>+	struct ext4_ext_path *path;</div><div class='ctx'> 	struct ext4_extent *ex;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -5869,30 +5955,34 @@ int ext4_ext_replay_update_ex(struct inode *inode, ext4_lblk_t start,</div><div class='ctx'> 	if (le32_to_cpu(ex-&gt;ee_block) != start ||</div><div class='ctx'> 		ext4_ext_get_actual_len(ex) != len) {</div><div class='ctx'> 		/* We need to split this extent to match our extent first */</div><div class='del'>-		ppath = path;</div><div class='ctx'> 		down_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='del'>-		ret = ext4_force_split_extent_at(NULL, inode, &amp;ppath, start, 1);</div><div class='add'>+		path = ext4_force_split_extent_at(NULL, inode, path, start, 1);</div><div class='ctx'> 		up_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='del'>-		if (ret)</div><div class='add'>+		if (IS_ERR(path)) {</div><div class='add'>+			ret = PTR_ERR(path);</div><div class='ctx'> 			goto out;</div><div class='del'>-		kfree(path);</div><div class='del'>-		path = ext4_find_extent(inode, start, NULL, 0);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		path = ext4_find_extent(inode, start, path, 0);</div><div class='ctx'> 		if (IS_ERR(path))</div><div class='del'>-			return -1;</div><div class='del'>-		ppath = path;</div><div class='add'>+			return PTR_ERR(path);</div><div class='add'>+</div><div class='ctx'> 		ex = path[path-&gt;p_depth].p_ext;</div><div class='ctx'> 		WARN_ON(le32_to_cpu(ex-&gt;ee_block) != start);</div><div class='add'>+</div><div class='ctx'> 		if (ext4_ext_get_actual_len(ex) != len) {</div><div class='ctx'> 			down_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='del'>-			ret = ext4_force_split_extent_at(NULL, inode, &amp;ppath,</div><div class='del'>-							 start + len, 1);</div><div class='add'>+			path = ext4_force_split_extent_at(NULL, inode, path,</div><div class='add'>+							  start + len, 1);</div><div class='ctx'> 			up_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='del'>-			if (ret)</div><div class='add'>+			if (IS_ERR(path)) {</div><div class='add'>+				ret = PTR_ERR(path);</div><div class='ctx'> 				goto out;</div><div class='del'>-			kfree(path);</div><div class='del'>-			path = ext4_find_extent(inode, start, NULL, 0);</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			path = ext4_find_extent(inode, start, path, 0);</div><div class='ctx'> 			if (IS_ERR(path))</div><div class='del'>-				return -EINVAL;</div><div class='add'>+				return PTR_ERR(path);</div><div class='ctx'> 			ex = path[path-&gt;p_depth].p_ext;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -5905,8 +5995,7 @@ int ext4_ext_replay_update_ex(struct inode *inode, ext4_lblk_t start,</div><div class='ctx'> 	ret = ext4_ext_dirty(NULL, inode, &amp;path[path-&gt;p_depth]);</div><div class='ctx'> 	up_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='ctx'> out:</div><div class='del'>-	ext4_ext_drop_refs(path);</div><div class='del'>-	kfree(path);</div><div class='add'>+	ext4_free_ext_path(path);</div><div class='ctx'> 	ext4_mark_inode_dirty(NULL, inode);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -5924,8 +6013,7 @@ void ext4_ext_replay_shrink_inode(struct inode *inode, ext4_lblk_t end)</div><div class='ctx'> 			return;</div><div class='ctx'> 		ex = path[path-&gt;p_depth].p_ext;</div><div class='ctx'> 		if (!ex) {</div><div class='del'>-			ext4_ext_drop_refs(path);</div><div class='del'>-			kfree(path);</div><div class='add'>+			ext4_free_ext_path(path);</div><div class='ctx'> 			ext4_mark_inode_dirty(NULL, inode);</div><div class='ctx'> 			return;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -5938,8 +6026,7 @@ void ext4_ext_replay_shrink_inode(struct inode *inode, ext4_lblk_t end)</div><div class='ctx'> 		ext4_ext_dirty(NULL, inode, &amp;path[path-&gt;p_depth]);</div><div class='ctx'> 		up_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='ctx'> 		ext4_mark_inode_dirty(NULL, inode);</div><div class='del'>-		ext4_ext_drop_refs(path);</div><div class='del'>-		kfree(path);</div><div class='add'>+		ext4_free_ext_path(path);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5977,14 +6064,9 @@ int ext4_ext_replay_set_iblocks(struct inode *inode)</div><div class='ctx'> 	if (IS_ERR(path))</div><div class='ctx'> 		return PTR_ERR(path);</div><div class='ctx'> 	ex = path[path-&gt;p_depth].p_ext;</div><div class='del'>-	if (!ex) {</div><div class='del'>-		ext4_ext_drop_refs(path);</div><div class='del'>-		kfree(path);</div><div class='add'>+	if (!ex)</div><div class='ctx'> 		goto out;</div><div class='del'>-	}</div><div class='ctx'> 	end = le32_to_cpu(ex-&gt;ee_block) + ext4_ext_get_actual_len(ex);</div><div class='del'>-	ext4_ext_drop_refs(path);</div><div class='del'>-	kfree(path);</div><div class='ctx'> </div><div class='ctx'> 	/* Count the number of data blocks */</div><div class='ctx'> 	cur = 0;</div><div class='hunk'>@@ -6010,36 +6092,28 @@ int ext4_ext_replay_set_iblocks(struct inode *inode)</div><div class='ctx'> 	ret = skip_hole(inode, &amp;cur);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='del'>-	path = ext4_find_extent(inode, cur, NULL, 0);</div><div class='add'>+	path = ext4_find_extent(inode, cur, path, 0);</div><div class='ctx'> 	if (IS_ERR(path))</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	numblks += path-&gt;p_depth;</div><div class='del'>-	ext4_ext_drop_refs(path);</div><div class='del'>-	kfree(path);</div><div class='ctx'> 	while (cur &lt; end) {</div><div class='del'>-		path = ext4_find_extent(inode, cur, NULL, 0);</div><div class='add'>+		path = ext4_find_extent(inode, cur, path, 0);</div><div class='ctx'> 		if (IS_ERR(path))</div><div class='ctx'> 			break;</div><div class='ctx'> 		ex = path[path-&gt;p_depth].p_ext;</div><div class='del'>-		if (!ex) {</div><div class='del'>-			ext4_ext_drop_refs(path);</div><div class='del'>-			kfree(path);</div><div class='del'>-			return 0;</div><div class='del'>-		}</div><div class='add'>+		if (!ex)</div><div class='add'>+			goto cleanup;</div><div class='add'>+</div><div class='ctx'> 		cur = max(cur + 1, le32_to_cpu(ex-&gt;ee_block) +</div><div class='ctx'> 					ext4_ext_get_actual_len(ex));</div><div class='ctx'> 		ret = skip_hole(inode, &amp;cur);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			ext4_ext_drop_refs(path);</div><div class='del'>-			kfree(path);</div><div class='add'>+		if (ret &lt; 0)</div><div class='ctx'> 			break;</div><div class='del'>-		}</div><div class='del'>-		path2 = ext4_find_extent(inode, cur, NULL, 0);</div><div class='del'>-		if (IS_ERR(path2)) {</div><div class='del'>-			ext4_ext_drop_refs(path);</div><div class='del'>-			kfree(path);</div><div class='add'>+</div><div class='add'>+		path2 = ext4_find_extent(inode, cur, path2, 0);</div><div class='add'>+		if (IS_ERR(path2))</div><div class='ctx'> 			break;</div><div class='del'>-		}</div><div class='add'>+</div><div class='ctx'> 		for (i = 0; i &lt;= max(path-&gt;p_depth, path2-&gt;p_depth); i++) {</div><div class='ctx'> 			cmp1 = cmp2 = 0;</div><div class='ctx'> 			if (i &lt;= path-&gt;p_depth)</div><div class='hunk'>@@ -6051,15 +6125,14 @@ int ext4_ext_replay_set_iblocks(struct inode *inode)</div><div class='ctx'> 			if (cmp1 != cmp2 &amp;&amp; cmp2 != 0)</div><div class='ctx'> 				numblks++;</div><div class='ctx'> 		}</div><div class='del'>-		ext4_ext_drop_refs(path);</div><div class='del'>-		ext4_ext_drop_refs(path2);</div><div class='del'>-		kfree(path);</div><div class='del'>-		kfree(path2);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	inode-&gt;i_blocks = numblks &lt;&lt; (inode-&gt;i_sb-&gt;s_blocksize_bits - 9);</div><div class='ctx'> 	ext4_mark_inode_dirty(NULL, inode);</div><div class='add'>+cleanup:</div><div class='add'>+	ext4_free_ext_path(path);</div><div class='add'>+	ext4_free_ext_path(path2);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -6080,14 +6153,9 @@ int ext4_ext_clear_bb(struct inode *inode)</div><div class='ctx'> 	if (IS_ERR(path))</div><div class='ctx'> 		return PTR_ERR(path);</div><div class='ctx'> 	ex = path[path-&gt;p_depth].p_ext;</div><div class='del'>-	if (!ex) {</div><div class='del'>-		ext4_ext_drop_refs(path);</div><div class='del'>-		kfree(path);</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='add'>+	if (!ex)</div><div class='add'>+		goto out;</div><div class='ctx'> 	end = le32_to_cpu(ex-&gt;ee_block) + ext4_ext_get_actual_len(ex);</div><div class='del'>-	ext4_ext_drop_refs(path);</div><div class='del'>-	kfree(path);</div><div class='ctx'> </div><div class='ctx'> 	cur = 0;</div><div class='ctx'> 	while (cur &lt; end) {</div><div class='hunk'>@@ -6097,20 +6165,25 @@ int ext4_ext_clear_bb(struct inode *inode)</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			break;</div><div class='ctx'> 		if (ret &gt; 0) {</div><div class='del'>-			path = ext4_find_extent(inode, map.m_lblk, NULL, 0);</div><div class='del'>-			if (!IS_ERR_OR_NULL(path)) {</div><div class='add'>+			path = ext4_find_extent(inode, map.m_lblk, path, 0);</div><div class='add'>+			if (!IS_ERR(path)) {</div><div class='ctx'> 				for (j = 0; j &lt; path-&gt;p_depth; j++) {</div><div class='del'>-</div><div class='ctx'> 					ext4_mb_mark_bb(inode-&gt;i_sb,</div><div class='del'>-							path[j].p_block, 1, 0);</div><div class='add'>+							path[j].p_block, 1, false);</div><div class='add'>+					ext4_fc_record_regions(inode-&gt;i_sb, inode-&gt;i_ino,</div><div class='add'>+							0, path[j].p_block, 1, 1);</div><div class='ctx'> 				}</div><div class='del'>-				ext4_ext_drop_refs(path);</div><div class='del'>-				kfree(path);</div><div class='add'>+			} else {</div><div class='add'>+				path = NULL;</div><div class='ctx'> 			}</div><div class='del'>-			ext4_mb_mark_bb(inode-&gt;i_sb, map.m_pblk, map.m_len, 0);</div><div class='add'>+			ext4_mb_mark_bb(inode-&gt;i_sb, map.m_pblk, map.m_len, false);</div><div class='add'>+			ext4_fc_record_regions(inode-&gt;i_sb, inode-&gt;i_ino,</div><div class='add'>+					map.m_lblk, map.m_pblk, map.m_len, 1);</div><div class='ctx'> 		}</div><div class='ctx'> 		cur = cur + map.m_len;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+out:</div><div class='add'>+	ext4_free_ext_path(path);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/ext4/extents_status.c b/fs/ext4/extents_status.c<br/>index 9a3a8996aacf..e04fbf10fe4f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/extents_status.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/extents_status.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/extents_status.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/extents_status.c</a></div><div class='hunk'>@@ -120,9 +120,40 @@</div><div class='ctx'>  *      memory.  Hence, we will reclaim written/unwritten/hole extents from</div><div class='ctx'>  *      the tree under a heavy memory pressure.</div><div class='ctx'>  *</div><div class='add'>+ * ==========================================================================</div><div class='add'>+ * 3. Assurance of Ext4 extent status tree consistency</div><div class='add'>+ *</div><div class='add'>+ * When mapping blocks, Ext4 queries the extent status tree first and should</div><div class='add'>+ * always trusts that the extent status tree is consistent and up to date.</div><div class='add'>+ * Therefore, it is important to adheres to the following rules when createing,</div><div class='add'>+ * modifying and removing extents.</div><div class='add'>+ *</div><div class='add'>+ *  1. Besides fastcommit replay, when Ext4 creates or queries block mappings,</div><div class='add'>+ *     the extent information should always be processed through the extent</div><div class='add'>+ *     status tree instead of being organized manually through the on-disk</div><div class='add'>+ *     extent tree.</div><div class='add'>+ *</div><div class='add'>+ *  2. When updating the extent tree, Ext4 should acquire the i_data_sem</div><div class='add'>+ *     exclusively and update the extent status tree atomically. If the extents</div><div class='add'>+ *     to be modified are large enough to exceed the range that a single</div><div class='add'>+ *     i_data_sem can process (as ext4_datasem_ensure_credits() may drop</div><div class='add'>+ *     i_data_sem to restart a transaction), it must (e.g. as ext4_punch_hole()</div><div class='add'>+ *     does):</div><div class='add'>+ *</div><div class='add'>+ *     a) Hold the i_rwsem and invalidate_lock exclusively. This ensures</div><div class='add'>+ *        exclusion against page faults, as well as reads and writes that may</div><div class='add'>+ *        concurrently modify the extent status tree.</div><div class='add'>+ *     b) Evict all page cache in the affected range and recommend rebuilding</div><div class='add'>+ *        or dropping the extent status tree after modifying the on-disk</div><div class='add'>+ *        extent tree. This ensures exclusion against concurrent writebacks</div><div class='add'>+ *        that do not hold those locks but only holds a folio lock.</div><div class='add'>+ *</div><div class='add'>+ *  3. Based on the rules above, when querying block mappings, Ext4 should at</div><div class='add'>+ *     least hold the i_rwsem or invalidate_lock or folio lock(s) for the</div><div class='add'>+ *     specified querying range.</div><div class='ctx'>  *</div><div class='ctx'>  * ==========================================================================</div><div class='del'>- * 3. Performance analysis</div><div class='add'>+ * 4. Performance analysis</div><div class='ctx'>  *</div><div class='ctx'>  *   --	overhead</div><div class='ctx'>  *	1. There is a cache extent for write access, so if writes are</div><div class='hunk'>@@ -134,7 +165,7 @@</div><div class='ctx'>  *</div><div class='ctx'>  *</div><div class='ctx'>  * ==========================================================================</div><div class='del'>- * 4. TODO list</div><div class='add'>+ * 5. TODO list</div><div class='ctx'>  *</div><div class='ctx'>  *   -- Refactor delayed space reservation</div><div class='ctx'>  *</div><div class='hunk'>@@ -144,20 +175,21 @@</div><div class='ctx'> static struct kmem_cache *ext4_es_cachep;</div><div class='ctx'> static struct kmem_cache *ext4_pending_cachep;</div><div class='ctx'> </div><div class='del'>-static int __es_insert_extent(struct inode *inode, struct extent_status *newes);</div><div class='add'>+static int __es_insert_extent(struct inode *inode, struct extent_status *newes,</div><div class='add'>+			      struct extent_status *prealloc);</div><div class='ctx'> static int __es_remove_extent(struct inode *inode, ext4_lblk_t lblk,</div><div class='del'>-			      ext4_lblk_t end, int *reserved);</div><div class='add'>+			      ext4_lblk_t end, int *reserved,</div><div class='add'>+			      struct extent_status *prealloc);</div><div class='ctx'> static int es_reclaim_extents(struct ext4_inode_info *ei, int *nr_to_scan);</div><div class='ctx'> static int __es_shrink(struct ext4_sb_info *sbi, int nr_to_scan,</div><div class='ctx'> 		       struct ext4_inode_info *locked_ei);</div><div class='del'>-static void __revise_pending(struct inode *inode, ext4_lblk_t lblk,</div><div class='del'>-			     ext4_lblk_t len);</div><div class='add'>+static int __revise_pending(struct inode *inode, ext4_lblk_t lblk,</div><div class='add'>+			    ext4_lblk_t len,</div><div class='add'>+			    struct pending_reservation **prealloc);</div><div class='ctx'> </div><div class='ctx'> int __init ext4_init_es(void)</div><div class='ctx'> {</div><div class='del'>-	ext4_es_cachep = kmem_cache_create("ext4_extent_status",</div><div class='del'>-					   sizeof(struct extent_status),</div><div class='del'>-					   0, (SLAB_RECLAIM_ACCOUNT), NULL);</div><div class='add'>+	ext4_es_cachep = KMEM_CACHE(extent_status, SLAB_RECLAIM_ACCOUNT);</div><div class='ctx'> 	if (ext4_es_cachep == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -203,6 +235,13 @@ static inline ext4_lblk_t ext4_es_end(struct extent_status *es)</div><div class='ctx'> 	return es-&gt;es_lblk + es-&gt;es_len - 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline void ext4_es_inc_seq(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct ext4_inode_info *ei = EXT4_I(inode);</div><div class='add'>+</div><div class='add'>+	WRITE_ONCE(ei-&gt;i_es_seq, ei-&gt;i_es_seq + 1);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * search through the tree for an delayed extent with a given offset.  If</div><div class='ctx'>  * it can't be found, try to find next extent.</div><div class='hunk'>@@ -269,14 +308,12 @@ static void __es_find_extent_range(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 	/* see if the extent has been cached */</div><div class='ctx'> 	es-&gt;es_lblk = es-&gt;es_len = es-&gt;es_pblk = 0;</div><div class='del'>-	if (tree-&gt;cache_es) {</div><div class='del'>-		es1 = tree-&gt;cache_es;</div><div class='del'>-		if (in_range(lblk, es1-&gt;es_lblk, es1-&gt;es_len)) {</div><div class='del'>-			es_debug("%u cached by [%u/%u) %llu %x\n",</div><div class='del'>-				 lblk, es1-&gt;es_lblk, es1-&gt;es_len,</div><div class='del'>-				 ext4_es_pblock(es1), ext4_es_status(es1));</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+	es1 = READ_ONCE(tree-&gt;cache_es);</div><div class='add'>+	if (es1 &amp;&amp; in_range(lblk, es1-&gt;es_lblk, es1-&gt;es_len)) {</div><div class='add'>+		es_debug("%u cached by [%u/%u) %llu %x\n",</div><div class='add'>+			 lblk, es1-&gt;es_lblk, es1-&gt;es_len,</div><div class='add'>+			 ext4_es_pblock(es1), ext4_es_status(es1));</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	es1 = __es_tree_search(&amp;tree-&gt;root, lblk);</div><div class='hunk'>@@ -295,7 +332,7 @@ out:</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (es1 &amp;&amp; matching_fn(es1)) {</div><div class='del'>-		tree-&gt;cache_es = es1;</div><div class='add'>+		WRITE_ONCE(tree-&gt;cache_es, es1);</div><div class='ctx'> 		es-&gt;es_lblk = es1-&gt;es_lblk;</div><div class='ctx'> 		es-&gt;es_len = es1-&gt;es_len;</div><div class='ctx'> 		es-&gt;es_pblk = es1-&gt;es_pblk;</div><div class='hunk'>@@ -311,6 +348,8 @@ void ext4_es_find_extent_range(struct inode *inode,</div><div class='ctx'> 			       ext4_lblk_t lblk, ext4_lblk_t end,</div><div class='ctx'> 			       struct extent_status *es)</div><div class='ctx'> {</div><div class='add'>+	es-&gt;es_lblk = es-&gt;es_len = es-&gt;es_pblk = 0;</div><div class='add'>+</div><div class='ctx'> 	if (EXT4_SB(inode-&gt;i_sb)-&gt;s_mount_state &amp; EXT4_FC_REPLAY)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='hunk'>@@ -450,22 +489,49 @@ static void ext4_es_list_del(struct inode *inode)</div><div class='ctx'> 	spin_unlock(&amp;sbi-&gt;s_es_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct extent_status *</div><div class='del'>-ext4_es_alloc_extent(struct inode *inode, ext4_lblk_t lblk, ext4_lblk_t len,</div><div class='del'>-		     ext4_fsblk_t pblk)</div><div class='add'>+static inline struct pending_reservation *__alloc_pending(bool nofail)</div><div class='add'>+{</div><div class='add'>+	if (!nofail)</div><div class='add'>+		return kmem_cache_alloc(ext4_pending_cachep, GFP_ATOMIC);</div><div class='add'>+</div><div class='add'>+	return kmem_cache_zalloc(ext4_pending_cachep, GFP_KERNEL | __GFP_NOFAIL);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void __free_pending(struct pending_reservation *pr)</div><div class='add'>+{</div><div class='add'>+	kmem_cache_free(ext4_pending_cachep, pr);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Returns true if we cannot fail to allocate memory for this extent_status</div><div class='add'>+ * entry and cannot reclaim it until its status changes.</div><div class='add'>+ */</div><div class='add'>+static inline bool ext4_es_must_keep(struct extent_status *es)</div><div class='add'>+{</div><div class='add'>+	/* fiemap, bigalloc, and seek_data/hole need to use it. */</div><div class='add'>+	if (ext4_es_is_delayed(es))</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline struct extent_status *__es_alloc_extent(bool nofail)</div><div class='add'>+{</div><div class='add'>+	if (!nofail)</div><div class='add'>+		return kmem_cache_alloc(ext4_es_cachep, GFP_ATOMIC);</div><div class='add'>+</div><div class='add'>+	return kmem_cache_zalloc(ext4_es_cachep, GFP_KERNEL | __GFP_NOFAIL);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void ext4_es_init_extent(struct inode *inode, struct extent_status *es,</div><div class='add'>+		ext4_lblk_t lblk, ext4_lblk_t len, ext4_fsblk_t pblk)</div><div class='ctx'> {</div><div class='del'>-	struct extent_status *es;</div><div class='del'>-	es = kmem_cache_alloc(ext4_es_cachep, GFP_ATOMIC);</div><div class='del'>-	if (es == NULL)</div><div class='del'>-		return NULL;</div><div class='ctx'> 	es-&gt;es_lblk = lblk;</div><div class='ctx'> 	es-&gt;es_len = len;</div><div class='ctx'> 	es-&gt;es_pblk = pblk;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * We don't count delayed extent because we never try to reclaim them</div><div class='del'>-	 */</div><div class='del'>-	if (!ext4_es_is_delayed(es)) {</div><div class='add'>+	/* We never try to reclaim a must kept extent, so we don't count it. */</div><div class='add'>+	if (!ext4_es_must_keep(es)) {</div><div class='ctx'> 		if (!EXT4_I(inode)-&gt;i_es_shk_nr++)</div><div class='ctx'> 			ext4_es_list_add(inode);</div><div class='ctx'> 		percpu_counter_inc(&amp;EXT4_SB(inode-&gt;i_sb)-&gt;</div><div class='hunk'>@@ -474,8 +540,11 @@ ext4_es_alloc_extent(struct inode *inode, ext4_lblk_t lblk, ext4_lblk_t len,</div><div class='ctx'> </div><div class='ctx'> 	EXT4_I(inode)-&gt;i_es_all_nr++;</div><div class='ctx'> 	percpu_counter_inc(&amp;EXT4_SB(inode-&gt;i_sb)-&gt;s_es_stats.es_stats_all_cnt);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	return es;</div><div class='add'>+static inline void __es_free_extent(struct extent_status *es)</div><div class='add'>+{</div><div class='add'>+	kmem_cache_free(ext4_es_cachep, es);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void ext4_es_free_extent(struct inode *inode, struct extent_status *es)</div><div class='hunk'>@@ -483,8 +552,8 @@ static void ext4_es_free_extent(struct inode *inode, struct extent_status *es)</div><div class='ctx'> 	EXT4_I(inode)-&gt;i_es_all_nr--;</div><div class='ctx'> 	percpu_counter_dec(&amp;EXT4_SB(inode-&gt;i_sb)-&gt;s_es_stats.es_stats_all_cnt);</div><div class='ctx'> </div><div class='del'>-	/* Decrease the shrink counter when this es is not delayed */</div><div class='del'>-	if (!ext4_es_is_delayed(es)) {</div><div class='add'>+	/* Decrease the shrink counter when we can reclaim the extent. */</div><div class='add'>+	if (!ext4_es_must_keep(es)) {</div><div class='ctx'> 		BUG_ON(EXT4_I(inode)-&gt;i_es_shk_nr == 0);</div><div class='ctx'> 		if (!--EXT4_I(inode)-&gt;i_es_shk_nr)</div><div class='ctx'> 			ext4_es_list_del(inode);</div><div class='hunk'>@@ -492,7 +561,7 @@ static void ext4_es_free_extent(struct inode *inode, struct extent_status *es)</div><div class='ctx'> 					s_es_stats.es_stats_shk_cnt);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	kmem_cache_free(ext4_es_cachep, es);</div><div class='add'>+	__es_free_extent(es);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -527,8 +596,8 @@ static int ext4_es_can_be_merged(struct extent_status *es1,</div><div class='ctx'> 	if (ext4_es_is_hole(es1))</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='del'>-	/* we need to check delayed extent is without unwritten status */</div><div class='del'>-	if (ext4_es_is_delayed(es1) &amp;&amp; !ext4_es_is_unwritten(es1))</div><div class='add'>+	/* we need to check delayed extent */</div><div class='add'>+	if (ext4_es_is_delayed(es1))</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -667,8 +736,7 @@ static void ext4_es_insert_extent_ext_check(struct inode *inode,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='del'>-	ext4_ext_drop_refs(path);</div><div class='del'>-	kfree(path);</div><div class='add'>+	ext4_free_ext_path(path);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void ext4_es_insert_extent_ind_check(struct inode *inode,</div><div class='hunk'>@@ -754,7 +822,8 @@ static inline void ext4_es_insert_extent_check(struct inode *inode,</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-static int __es_insert_extent(struct inode *inode, struct extent_status *newes)</div><div class='add'>+static int __es_insert_extent(struct inode *inode, struct extent_status *newes,</div><div class='add'>+			      struct extent_status *prealloc)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_es_tree *tree = &amp;EXT4_I(inode)-&gt;i_es_tree;</div><div class='ctx'> 	struct rb_node **p = &amp;tree-&gt;root.rb_node;</div><div class='hunk'>@@ -794,10 +863,15 @@ static int __es_insert_extent(struct inode *inode, struct extent_status *newes)</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	es = ext4_es_alloc_extent(inode, newes-&gt;es_lblk, newes-&gt;es_len,</div><div class='del'>-				  newes-&gt;es_pblk);</div><div class='add'>+	if (prealloc)</div><div class='add'>+		es = prealloc;</div><div class='add'>+	else</div><div class='add'>+		es = __es_alloc_extent(false);</div><div class='ctx'> 	if (!es)</div><div class='ctx'> 		return -ENOMEM;</div><div class='add'>+	ext4_es_init_extent(inode, es, newes-&gt;es_lblk, newes-&gt;es_len,</div><div class='add'>+			    newes-&gt;es_pblk);</div><div class='add'>+</div><div class='ctx'> 	rb_link_node(&amp;es-&gt;rb_node, parent, p);</div><div class='ctx'> 	rb_insert_color(&amp;es-&gt;rb_node, &amp;tree-&gt;root);</div><div class='ctx'> </div><div class='hunk'>@@ -809,67 +883,118 @@ out:</div><div class='ctx'> /*</div><div class='ctx'>  * ext4_es_insert_extent() adds information to an inode's extent</div><div class='ctx'>  * status tree.</div><div class='del'>- *</div><div class='del'>- * Return 0 on success, error code on failure.</div><div class='ctx'>  */</div><div class='del'>-int ext4_es_insert_extent(struct inode *inode, ext4_lblk_t lblk,</div><div class='del'>-			  ext4_lblk_t len, ext4_fsblk_t pblk,</div><div class='del'>-			  unsigned int status)</div><div class='add'>+void ext4_es_insert_extent(struct inode *inode, ext4_lblk_t lblk,</div><div class='add'>+			   ext4_lblk_t len, ext4_fsblk_t pblk,</div><div class='add'>+			   unsigned int status, bool delalloc_reserve_used)</div><div class='ctx'> {</div><div class='ctx'> 	struct extent_status newes;</div><div class='ctx'> 	ext4_lblk_t end = lblk + len - 1;</div><div class='del'>-	int err = 0;</div><div class='add'>+	int err1 = 0, err2 = 0, err3 = 0;</div><div class='add'>+	int resv_used = 0, pending = 0;</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(inode-&gt;i_sb);</div><div class='add'>+	struct extent_status *es1 = NULL;</div><div class='add'>+	struct extent_status *es2 = NULL;</div><div class='add'>+	struct pending_reservation *pr = NULL;</div><div class='add'>+	bool revise_pending = false;</div><div class='ctx'> </div><div class='ctx'> 	if (EXT4_SB(inode-&gt;i_sb)-&gt;s_mount_state &amp; EXT4_FC_REPLAY)</div><div class='del'>-		return 0;</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	es_debug("add [%u/%u) %llu %x to extent status tree of inode %lu\n",</div><div class='del'>-		 lblk, len, pblk, status, inode-&gt;i_ino);</div><div class='add'>+	es_debug("add [%u/%u) %llu %x %d to extent status tree of inode %lu\n",</div><div class='add'>+		 lblk, len, pblk, status, delalloc_reserve_used, inode-&gt;i_ino);</div><div class='ctx'> </div><div class='ctx'> 	if (!len)</div><div class='del'>-		return 0;</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(end &lt; lblk);</div><div class='del'>-</div><div class='del'>-	if ((status &amp; EXTENT_STATUS_DELAYED) &amp;&amp;</div><div class='del'>-	    (status &amp; EXTENT_STATUS_WRITTEN)) {</div><div class='del'>-		ext4_warning(inode-&gt;i_sb, "Inserting extent [%u/%u] as "</div><div class='del'>-				" delayed and written which can potentially "</div><div class='del'>-				" cause data loss.", lblk, len);</div><div class='del'>-		WARN_ON(1);</div><div class='del'>-	}</div><div class='add'>+	WARN_ON_ONCE(status &amp; EXTENT_STATUS_DELAYED);</div><div class='ctx'> </div><div class='ctx'> 	newes.es_lblk = lblk;</div><div class='ctx'> 	newes.es_len = len;</div><div class='ctx'> 	ext4_es_store_pblock_status(&amp;newes, pblk, status);</div><div class='del'>-	trace_ext4_es_insert_extent(inode, &amp;newes);</div><div class='ctx'> </div><div class='ctx'> 	ext4_es_insert_extent_check(inode, &amp;newes);</div><div class='ctx'> </div><div class='add'>+	revise_pending = sbi-&gt;s_cluster_ratio &gt; 1 &amp;&amp;</div><div class='add'>+			 test_opt(inode-&gt;i_sb, DELALLOC) &amp;&amp;</div><div class='add'>+			 (status &amp; (EXTENT_STATUS_WRITTEN |</div><div class='add'>+				    EXTENT_STATUS_UNWRITTEN));</div><div class='add'>+retry:</div><div class='add'>+	if (err1 &amp;&amp; !es1)</div><div class='add'>+		es1 = __es_alloc_extent(true);</div><div class='add'>+	if ((err1 || err2) &amp;&amp; !es2)</div><div class='add'>+		es2 = __es_alloc_extent(true);</div><div class='add'>+	if ((err1 || err2 || err3 &lt; 0) &amp;&amp; revise_pending &amp;&amp; !pr)</div><div class='add'>+		pr = __alloc_pending(true);</div><div class='ctx'> 	write_lock(&amp;EXT4_I(inode)-&gt;i_es_lock);</div><div class='del'>-	err = __es_remove_extent(inode, lblk, end, NULL);</div><div class='del'>-	if (err != 0)</div><div class='add'>+</div><div class='add'>+	err1 = __es_remove_extent(inode, lblk, end, &amp;resv_used, es1);</div><div class='add'>+	if (err1 != 0)</div><div class='ctx'> 		goto error;</div><div class='del'>-retry:</div><div class='del'>-	err = __es_insert_extent(inode, &amp;newes);</div><div class='del'>-	if (err == -ENOMEM &amp;&amp; __es_shrink(EXT4_SB(inode-&gt;i_sb),</div><div class='del'>-					  128, EXT4_I(inode)))</div><div class='del'>-		goto retry;</div><div class='del'>-	if (err == -ENOMEM &amp;&amp; !ext4_es_is_delayed(&amp;newes))</div><div class='del'>-		err = 0;</div><div class='add'>+	/* Free preallocated extent if it didn't get used. */</div><div class='add'>+	if (es1) {</div><div class='add'>+		if (!es1-&gt;es_len)</div><div class='add'>+			__es_free_extent(es1);</div><div class='add'>+		es1 = NULL;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (sbi-&gt;s_cluster_ratio &gt; 1 &amp;&amp; test_opt(inode-&gt;i_sb, DELALLOC) &amp;&amp;</div><div class='del'>-	    (status &amp; EXTENT_STATUS_WRITTEN ||</div><div class='del'>-	     status &amp; EXTENT_STATUS_UNWRITTEN))</div><div class='del'>-		__revise_pending(inode, lblk, len);</div><div class='add'>+	err2 = __es_insert_extent(inode, &amp;newes, es2);</div><div class='add'>+	if (err2 == -ENOMEM &amp;&amp; !ext4_es_must_keep(&amp;newes))</div><div class='add'>+		err2 = 0;</div><div class='add'>+	if (err2 != 0)</div><div class='add'>+		goto error;</div><div class='add'>+	/* Free preallocated extent if it didn't get used. */</div><div class='add'>+	if (es2) {</div><div class='add'>+		if (!es2-&gt;es_len)</div><div class='add'>+			__es_free_extent(es2);</div><div class='add'>+		es2 = NULL;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='add'>+	if (revise_pending) {</div><div class='add'>+		err3 = __revise_pending(inode, lblk, len, &amp;pr);</div><div class='add'>+		if (err3 &lt; 0)</div><div class='add'>+			goto error;</div><div class='add'>+		if (pr) {</div><div class='add'>+			__free_pending(pr);</div><div class='add'>+			pr = NULL;</div><div class='add'>+		}</div><div class='add'>+		pending = err3;</div><div class='add'>+	}</div><div class='add'>+	/*</div><div class='add'>+	 * TODO: For cache on-disk extents, there is no need to increment</div><div class='add'>+	 * the sequence counter, this requires future optimization.</div><div class='add'>+	 */</div><div class='add'>+	ext4_es_inc_seq(inode);</div><div class='ctx'> error:</div><div class='ctx'> 	write_unlock(&amp;EXT4_I(inode)-&gt;i_es_lock);</div><div class='add'>+	/*</div><div class='add'>+	 * Reduce the reserved cluster count to reflect successful deferred</div><div class='add'>+	 * allocation of delayed allocated clusters or direct allocation of</div><div class='add'>+	 * clusters discovered to be delayed allocated.  Once allocated, a</div><div class='add'>+	 * cluster is not included in the reserved count.</div><div class='add'>+	 *</div><div class='add'>+	 * When direct allocating (from fallocate, filemap, DIO, or clusters</div><div class='add'>+	 * allocated when delalloc has been disabled by ext4_nonda_switch())</div><div class='add'>+	 * an extent either 1) contains delayed blocks but start with</div><div class='add'>+	 * non-delayed allocated blocks (e.g. hole) or 2) contains non-delayed</div><div class='add'>+	 * allocated blocks which belong to delayed allocated clusters when</div><div class='add'>+	 * bigalloc feature is enabled, quota has already been claimed by</div><div class='add'>+	 * ext4_mb_new_blocks(), so release the quota reservations made for</div><div class='add'>+	 * any previously delayed allocated clusters instead of claim them</div><div class='add'>+	 * again.</div><div class='add'>+	 */</div><div class='add'>+	resv_used += pending;</div><div class='add'>+	if (resv_used)</div><div class='add'>+		ext4_da_update_reserve_space(inode, resv_used,</div><div class='add'>+					     delalloc_reserve_used);</div><div class='ctx'> </div><div class='del'>-	ext4_es_print_tree(inode);</div><div class='add'>+	if (err1 || err2 || err3 &lt; 0)</div><div class='add'>+		goto retry;</div><div class='ctx'> </div><div class='del'>-	return err;</div><div class='add'>+	trace_ext4_es_insert_extent(inode, &amp;newes);</div><div class='add'>+	ext4_es_print_tree(inode);</div><div class='add'>+	return;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -902,7 +1027,7 @@ void ext4_es_cache_extent(struct inode *inode, ext4_lblk_t lblk,</div><div class='ctx'> </div><div class='ctx'> 	es = __es_tree_search(&amp;EXT4_I(inode)-&gt;i_es_tree.root, lblk);</div><div class='ctx'> 	if (!es || es-&gt;es_lblk &gt; end)</div><div class='del'>-		__es_insert_extent(inode, &amp;newes);</div><div class='add'>+		__es_insert_extent(inode, &amp;newes, NULL);</div><div class='ctx'> 	write_unlock(&amp;EXT4_I(inode)-&gt;i_es_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -914,8 +1039,8 @@ void ext4_es_cache_extent(struct inode *inode, ext4_lblk_t lblk,</div><div class='ctx'>  * Return: 1 on found, 0 on not</div><div class='ctx'>  */</div><div class='ctx'> int ext4_es_lookup_extent(struct inode *inode, ext4_lblk_t lblk,</div><div class='del'>-			  ext4_lblk_t *next_lblk,</div><div class='del'>-			  struct extent_status *es)</div><div class='add'>+			  ext4_lblk_t *next_lblk, struct extent_status *es,</div><div class='add'>+			  u64 *pseq)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_es_tree *tree;</div><div class='ctx'> 	struct ext4_es_stats *stats;</div><div class='hunk'>@@ -934,14 +1059,12 @@ int ext4_es_lookup_extent(struct inode *inode, ext4_lblk_t lblk,</div><div class='ctx'> </div><div class='ctx'> 	/* find extent in cache firstly */</div><div class='ctx'> 	es-&gt;es_lblk = es-&gt;es_len = es-&gt;es_pblk = 0;</div><div class='del'>-	if (tree-&gt;cache_es) {</div><div class='del'>-		es1 = tree-&gt;cache_es;</div><div class='del'>-		if (in_range(lblk, es1-&gt;es_lblk, es1-&gt;es_len)) {</div><div class='del'>-			es_debug("%u cached by [%u/%u)\n",</div><div class='del'>-				 lblk, es1-&gt;es_lblk, es1-&gt;es_len);</div><div class='del'>-			found = 1;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+	es1 = READ_ONCE(tree-&gt;cache_es);</div><div class='add'>+	if (es1 &amp;&amp; in_range(lblk, es1-&gt;es_lblk, es1-&gt;es_len)) {</div><div class='add'>+		es_debug("%u cached by [%u/%u)\n",</div><div class='add'>+			 lblk, es1-&gt;es_lblk, es1-&gt;es_len);</div><div class='add'>+		found = 1;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	node = tree-&gt;root.rb_node;</div><div class='hunk'>@@ -976,6 +1099,8 @@ out:</div><div class='ctx'> 			} else</div><div class='ctx'> 				*next_lblk = 0;</div><div class='ctx'> 		}</div><div class='add'>+		if (pseq)</div><div class='add'>+			*pseq = EXT4_I(inode)-&gt;i_es_seq;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		percpu_counter_inc(&amp;stats-&gt;es_stats_cache_misses);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -987,7 +1112,7 @@ out:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct rsvd_count {</div><div class='del'>-	int ndelonly;</div><div class='add'>+	int ndelayed;</div><div class='ctx'> 	bool first_do_lblk_found;</div><div class='ctx'> 	ext4_lblk_t first_do_lblk;</div><div class='ctx'> 	ext4_lblk_t last_do_lblk;</div><div class='hunk'>@@ -1013,10 +1138,10 @@ static void init_rsvd(struct inode *inode, ext4_lblk_t lblk,</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(inode-&gt;i_sb);</div><div class='ctx'> 	struct rb_node *node;</div><div class='ctx'> </div><div class='del'>-	rc-&gt;ndelonly = 0;</div><div class='add'>+	rc-&gt;ndelayed = 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * for bigalloc, note the first delonly block in the range has not</div><div class='add'>+	 * for bigalloc, note the first delayed block in the range has not</div><div class='ctx'> 	 * been found, record the extent containing the block to the left of</div><div class='ctx'> 	 * the region to be removed, if any, and note that there's no partial</div><div class='ctx'> 	 * cluster to track</div><div class='hunk'>@@ -1036,9 +1161,8 @@ static void init_rsvd(struct inode *inode, ext4_lblk_t lblk,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * count_rsvd - count the clusters containing delayed and not unwritten</div><div class='del'>- *		(delonly) blocks in a range within an extent and add to</div><div class='del'>- *	        the running tally in rsvd_count</div><div class='add'>+ * count_rsvd - count the clusters containing delayed blocks in a range</div><div class='add'>+ *	        within an extent and add to the running tally in rsvd_count</div><div class='ctx'>  *</div><div class='ctx'>  * @inode - file containing extent</div><div class='ctx'>  * @lblk - first block in range</div><div class='hunk'>@@ -1055,13 +1179,13 @@ static void count_rsvd(struct inode *inode, ext4_lblk_t lblk, long len,</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(inode-&gt;i_sb);</div><div class='ctx'> 	ext4_lblk_t i, end, nclu;</div><div class='ctx'> </div><div class='del'>-	if (!ext4_es_is_delonly(es))</div><div class='add'>+	if (!ext4_es_is_delayed(es))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	WARN_ON(len &lt;= 0);</div><div class='ctx'> </div><div class='ctx'> 	if (sbi-&gt;s_cluster_ratio == 1) {</div><div class='del'>-		rc-&gt;ndelonly += (int) len;</div><div class='add'>+		rc-&gt;ndelayed += (int) len;</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1071,7 +1195,7 @@ static void count_rsvd(struct inode *inode, ext4_lblk_t lblk, long len,</div><div class='ctx'> 	end = lblk + (ext4_lblk_t) len - 1;</div><div class='ctx'> 	end = (end &gt; ext4_es_end(es)) ? ext4_es_end(es) : end;</div><div class='ctx'> </div><div class='del'>-	/* record the first block of the first delonly extent seen */</div><div class='add'>+	/* record the first block of the first delayed extent seen */</div><div class='ctx'> 	if (!rc-&gt;first_do_lblk_found) {</div><div class='ctx'> 		rc-&gt;first_do_lblk = i;</div><div class='ctx'> 		rc-&gt;first_do_lblk_found = true;</div><div class='hunk'>@@ -1085,7 +1209,7 @@ static void count_rsvd(struct inode *inode, ext4_lblk_t lblk, long len,</div><div class='ctx'> 	 * doesn't start with it, count it and stop tracking</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (rc-&gt;partial &amp;&amp; (rc-&gt;lclu != EXT4_B2C(sbi, i))) {</div><div class='del'>-		rc-&gt;ndelonly++;</div><div class='add'>+		rc-&gt;ndelayed++;</div><div class='ctx'> 		rc-&gt;partial = false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1095,7 +1219,7 @@ static void count_rsvd(struct inode *inode, ext4_lblk_t lblk, long len,</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (EXT4_LBLK_COFF(sbi, i) != 0) {</div><div class='ctx'> 		if (end &gt;= EXT4_LBLK_CFILL(sbi, i)) {</div><div class='del'>-			rc-&gt;ndelonly++;</div><div class='add'>+			rc-&gt;ndelayed++;</div><div class='ctx'> 			rc-&gt;partial = false;</div><div class='ctx'> 			i = EXT4_LBLK_CFILL(sbi, i) + 1;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1103,11 +1227,11 @@ static void count_rsvd(struct inode *inode, ext4_lblk_t lblk, long len,</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * if the current cluster starts on a cluster boundary, count the</div><div class='del'>-	 * number of whole delonly clusters in the extent</div><div class='add'>+	 * number of whole delayed clusters in the extent</div><div class='ctx'> 	 */</div><div class='ctx'> 	if ((i + sbi-&gt;s_cluster_ratio - 1) &lt;= end) {</div><div class='ctx'> 		nclu = (end - i + 1) &gt;&gt; sbi-&gt;s_cluster_bits;</div><div class='del'>-		rc-&gt;ndelonly += nclu;</div><div class='add'>+		rc-&gt;ndelayed += nclu;</div><div class='ctx'> 		i += nclu &lt;&lt; sbi-&gt;s_cluster_bits;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1167,10 +1291,9 @@ static struct pending_reservation *__pr_tree_search(struct rb_root *root,</div><div class='ctx'>  * @rc - pointer to reserved count data</div><div class='ctx'>  *</div><div class='ctx'>  * The number of reservations to be released is equal to the number of</div><div class='del'>- * clusters containing delayed and not unwritten (delonly) blocks within</div><div class='del'>- * the range, minus the number of clusters still containing delonly blocks</div><div class='del'>- * at the ends of the range, and minus the number of pending reservations</div><div class='del'>- * within the range.</div><div class='add'>+ * clusters containing delayed blocks within the range, minus the number of</div><div class='add'>+ * clusters still containing delayed blocks at the ends of the range, and</div><div class='add'>+ * minus the number of pending reservations within the range.</div><div class='ctx'>  */</div><div class='ctx'> static unsigned int get_rsvd(struct inode *inode, ext4_lblk_t end,</div><div class='ctx'> 			     struct extent_status *right_es,</div><div class='hunk'>@@ -1181,33 +1304,33 @@ static unsigned int get_rsvd(struct inode *inode, ext4_lblk_t end,</div><div class='ctx'> 	struct ext4_pending_tree *tree = &amp;EXT4_I(inode)-&gt;i_pending_tree;</div><div class='ctx'> 	struct rb_node *node;</div><div class='ctx'> 	ext4_lblk_t first_lclu, last_lclu;</div><div class='del'>-	bool left_delonly, right_delonly, count_pending;</div><div class='add'>+	bool left_delayed, right_delayed, count_pending;</div><div class='ctx'> 	struct extent_status *es;</div><div class='ctx'> </div><div class='ctx'> 	if (sbi-&gt;s_cluster_ratio &gt; 1) {</div><div class='ctx'> 		/* count any remaining partial cluster */</div><div class='ctx'> 		if (rc-&gt;partial)</div><div class='del'>-			rc-&gt;ndelonly++;</div><div class='add'>+			rc-&gt;ndelayed++;</div><div class='ctx'> </div><div class='del'>-		if (rc-&gt;ndelonly == 0)</div><div class='add'>+		if (rc-&gt;ndelayed == 0)</div><div class='ctx'> 			return 0;</div><div class='ctx'> </div><div class='ctx'> 		first_lclu = EXT4_B2C(sbi, rc-&gt;first_do_lblk);</div><div class='ctx'> 		last_lclu = EXT4_B2C(sbi, rc-&gt;last_do_lblk);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * decrease the delonly count by the number of clusters at the</div><div class='del'>-		 * ends of the range that still contain delonly blocks -</div><div class='add'>+		 * decrease the delayed count by the number of clusters at the</div><div class='add'>+		 * ends of the range that still contain delayed blocks -</div><div class='ctx'> 		 * these clusters still need to be reserved</div><div class='ctx'> 		 */</div><div class='del'>-		left_delonly = right_delonly = false;</div><div class='add'>+		left_delayed = right_delayed = false;</div><div class='ctx'> </div><div class='ctx'> 		es = rc-&gt;left_es;</div><div class='ctx'> 		while (es &amp;&amp; ext4_es_end(es) &gt;=</div><div class='ctx'> 		       EXT4_LBLK_CMASK(sbi, rc-&gt;first_do_lblk)) {</div><div class='del'>-			if (ext4_es_is_delonly(es)) {</div><div class='del'>-				rc-&gt;ndelonly--;</div><div class='del'>-				left_delonly = true;</div><div class='add'>+			if (ext4_es_is_delayed(es)) {</div><div class='add'>+				rc-&gt;ndelayed--;</div><div class='add'>+				left_delayed = true;</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> 			node = rb_prev(&amp;es-&gt;rb_node);</div><div class='hunk'>@@ -1215,7 +1338,7 @@ static unsigned int get_rsvd(struct inode *inode, ext4_lblk_t end,</div><div class='ctx'> 				break;</div><div class='ctx'> 			es = rb_entry(node, struct extent_status, rb_node);</div><div class='ctx'> 		}</div><div class='del'>-		if (right_es &amp;&amp; (!left_delonly || first_lclu != last_lclu)) {</div><div class='add'>+		if (right_es &amp;&amp; (!left_delayed || first_lclu != last_lclu)) {</div><div class='ctx'> 			if (end &lt; ext4_es_end(right_es)) {</div><div class='ctx'> 				es = right_es;</div><div class='ctx'> 			} else {</div><div class='hunk'>@@ -1225,9 +1348,9 @@ static unsigned int get_rsvd(struct inode *inode, ext4_lblk_t end,</div><div class='ctx'> 			}</div><div class='ctx'> 			while (es &amp;&amp; es-&gt;es_lblk &lt;=</div><div class='ctx'> 			       EXT4_LBLK_CFILL(sbi, rc-&gt;last_do_lblk)) {</div><div class='del'>-				if (ext4_es_is_delonly(es)) {</div><div class='del'>-					rc-&gt;ndelonly--;</div><div class='del'>-					right_delonly = true;</div><div class='add'>+				if (ext4_es_is_delayed(es)) {</div><div class='add'>+					rc-&gt;ndelayed--;</div><div class='add'>+					right_delayed = true;</div><div class='ctx'> 					break;</div><div class='ctx'> 				}</div><div class='ctx'> 				node = rb_next(&amp;es-&gt;rb_node);</div><div class='hunk'>@@ -1241,21 +1364,21 @@ static unsigned int get_rsvd(struct inode *inode, ext4_lblk_t end,</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Determine the block range that should be searched for</div><div class='ctx'> 		 * pending reservations, if any.  Clusters on the ends of the</div><div class='del'>-		 * original removed range containing delonly blocks are</div><div class='add'>+		 * original removed range containing delayed blocks are</div><div class='ctx'> 		 * excluded.  They've already been accounted for and it's not</div><div class='ctx'> 		 * possible to determine if an associated pending reservation</div><div class='ctx'> 		 * should be released with the information available in the</div><div class='ctx'> 		 * extents status tree.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (first_lclu == last_lclu) {</div><div class='del'>-			if (left_delonly | right_delonly)</div><div class='add'>+			if (left_delayed | right_delayed)</div><div class='ctx'> 				count_pending = false;</div><div class='ctx'> 			else</div><div class='ctx'> 				count_pending = true;</div><div class='ctx'> 		} else {</div><div class='del'>-			if (left_delonly)</div><div class='add'>+			if (left_delayed)</div><div class='ctx'> 				first_lclu++;</div><div class='del'>-			if (right_delonly)</div><div class='add'>+			if (right_delayed)</div><div class='ctx'> 				last_lclu--;</div><div class='ctx'> 			if (first_lclu &lt;= last_lclu)</div><div class='ctx'> 				count_pending = true;</div><div class='hunk'>@@ -1266,16 +1389,16 @@ static unsigned int get_rsvd(struct inode *inode, ext4_lblk_t end,</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * a pending reservation found between first_lclu and last_lclu</div><div class='ctx'> 		 * represents an allocated cluster that contained at least one</div><div class='del'>-		 * delonly block, so the delonly total must be reduced by one</div><div class='add'>+		 * delayed block, so the delayed total must be reduced by one</div><div class='ctx'> 		 * for each pending reservation found and released</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (count_pending) {</div><div class='ctx'> 			pr = __pr_tree_search(&amp;tree-&gt;root, first_lclu);</div><div class='ctx'> 			while (pr &amp;&amp; pr-&gt;lclu &lt;= last_lclu) {</div><div class='del'>-				rc-&gt;ndelonly--;</div><div class='add'>+				rc-&gt;ndelayed--;</div><div class='ctx'> 				node = rb_next(&amp;pr-&gt;rb_node);</div><div class='ctx'> 				rb_erase(&amp;pr-&gt;rb_node, &amp;tree-&gt;root);</div><div class='del'>-				kmem_cache_free(ext4_pending_cachep, pr);</div><div class='add'>+				__free_pending(pr);</div><div class='ctx'> 				if (!node)</div><div class='ctx'> 					break;</div><div class='ctx'> 				pr = rb_entry(node, struct pending_reservation,</div><div class='hunk'>@@ -1283,7 +1406,7 @@ static unsigned int get_rsvd(struct inode *inode, ext4_lblk_t end,</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	return rc-&gt;ndelonly;</div><div class='add'>+	return rc-&gt;ndelayed;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> </div><div class='hunk'>@@ -1294,6 +1417,7 @@ static unsigned int get_rsvd(struct inode *inode, ext4_lblk_t end,</div><div class='ctx'>  * @lblk - first block in range</div><div class='ctx'>  * @end - last block in range</div><div class='ctx'>  * @reserved - number of cluster reservations released</div><div class='add'>+ * @prealloc - pre-allocated es to avoid memory allocation failures</div><div class='ctx'>  *</div><div class='ctx'>  * If @reserved is not NULL and delayed allocation is enabled, counts</div><div class='ctx'>  * block/cluster reservations freed by removing range and if bigalloc</div><div class='hunk'>@@ -1301,7 +1425,8 @@ static unsigned int get_rsvd(struct inode *inode, ext4_lblk_t end,</div><div class='ctx'>  * error code on failure.</div><div class='ctx'>  */</div><div class='ctx'> static int __es_remove_extent(struct inode *inode, ext4_lblk_t lblk,</div><div class='del'>-			      ext4_lblk_t end, int *reserved)</div><div class='add'>+			      ext4_lblk_t end, int *reserved,</div><div class='add'>+			      struct extent_status *prealloc)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_es_tree *tree = &amp;EXT4_I(inode)-&gt;i_es_tree;</div><div class='ctx'> 	struct rb_node *node;</div><div class='hunk'>@@ -1309,14 +1434,12 @@ static int __es_remove_extent(struct inode *inode, ext4_lblk_t lblk,</div><div class='ctx'> 	struct extent_status orig_es;</div><div class='ctx'> 	ext4_lblk_t len1, len2;</div><div class='ctx'> 	ext4_fsblk_t block;</div><div class='del'>-	int err;</div><div class='add'>+	int err = 0;</div><div class='ctx'> 	bool count_reserved = true;</div><div class='ctx'> 	struct rsvd_count rc;</div><div class='ctx'> </div><div class='ctx'> 	if (reserved == NULL || !test_opt(inode-&gt;i_sb, DELALLOC))</div><div class='ctx'> 		count_reserved = false;</div><div class='del'>-retry:</div><div class='del'>-	err = 0;</div><div class='ctx'> </div><div class='ctx'> 	es = __es_tree_search(&amp;tree-&gt;root, lblk);</div><div class='ctx'> 	if (!es)</div><div class='hunk'>@@ -1350,14 +1473,13 @@ retry:</div><div class='ctx'> 					orig_es.es_len - len2;</div><div class='ctx'> 			ext4_es_store_pblock_status(&amp;newes, block,</div><div class='ctx'> 						    ext4_es_status(&amp;orig_es));</div><div class='del'>-			err = __es_insert_extent(inode, &amp;newes);</div><div class='add'>+			err = __es_insert_extent(inode, &amp;newes, prealloc);</div><div class='ctx'> 			if (err) {</div><div class='add'>+				if (!ext4_es_must_keep(&amp;newes))</div><div class='add'>+					return 0;</div><div class='add'>+</div><div class='ctx'> 				es-&gt;es_lblk = orig_es.es_lblk;</div><div class='ctx'> 				es-&gt;es_len = orig_es.es_len;</div><div class='del'>-				if ((err == -ENOMEM) &amp;&amp;</div><div class='del'>-				    __es_shrink(EXT4_SB(inode-&gt;i_sb),</div><div class='del'>-							128, EXT4_I(inode)))</div><div class='del'>-					goto retry;</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='ctx'> 		} else {</div><div class='hunk'>@@ -1370,9 +1492,9 @@ retry:</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 		if (count_reserved)</div><div class='del'>-			count_rsvd(inode, lblk, orig_es.es_len - len1 - len2,</div><div class='del'>-				   &amp;orig_es, &amp;rc);</div><div class='del'>-		goto out;</div><div class='add'>+			count_rsvd(inode, orig_es.es_lblk + len1,</div><div class='add'>+				   orig_es.es_len - len1 - len2, &amp;orig_es, &amp;rc);</div><div class='add'>+		goto out_get_reserved;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (len1 &gt; 0) {</div><div class='hunk'>@@ -1414,6 +1536,7 @@ retry:</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+out_get_reserved:</div><div class='ctx'> 	if (count_reserved)</div><div class='ctx'> 		*reserved = get_rsvd(inode, end, es, &amp;rc);</div><div class='ctx'> out:</div><div class='hunk'>@@ -1428,39 +1551,55 @@ out:</div><div class='ctx'>  * @len - number of blocks to remove</div><div class='ctx'>  *</div><div class='ctx'>  * Reduces block/cluster reservation count and for bigalloc cancels pending</div><div class='del'>- * reservations as needed. Returns 0 on success, error code on failure.</div><div class='add'>+ * reservations as needed.</div><div class='ctx'>  */</div><div class='del'>-int ext4_es_remove_extent(struct inode *inode, ext4_lblk_t lblk,</div><div class='del'>-			  ext4_lblk_t len)</div><div class='add'>+void ext4_es_remove_extent(struct inode *inode, ext4_lblk_t lblk,</div><div class='add'>+			   ext4_lblk_t len)</div><div class='ctx'> {</div><div class='ctx'> 	ext4_lblk_t end;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> 	int reserved = 0;</div><div class='add'>+	struct extent_status *es = NULL;</div><div class='ctx'> </div><div class='ctx'> 	if (EXT4_SB(inode-&gt;i_sb)-&gt;s_mount_state &amp; EXT4_FC_REPLAY)</div><div class='del'>-		return 0;</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	trace_ext4_es_remove_extent(inode, lblk, len);</div><div class='ctx'> 	es_debug("remove [%u/%u) from extent status tree of inode %lu\n",</div><div class='ctx'> 		 lblk, len, inode-&gt;i_ino);</div><div class='ctx'> </div><div class='ctx'> 	if (!len)</div><div class='del'>-		return err;</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='ctx'> 	end = lblk + len - 1;</div><div class='ctx'> 	BUG_ON(end &lt; lblk);</div><div class='ctx'> </div><div class='add'>+retry:</div><div class='add'>+	if (err &amp;&amp; !es)</div><div class='add'>+		es = __es_alloc_extent(true);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * ext4_clear_inode() depends on us taking i_es_lock unconditionally</div><div class='ctx'> 	 * so that we are sure __es_shrink() is done with the inode before it</div><div class='ctx'> 	 * is reclaimed.</div><div class='ctx'> 	 */</div><div class='ctx'> 	write_lock(&amp;EXT4_I(inode)-&gt;i_es_lock);</div><div class='del'>-	err = __es_remove_extent(inode, lblk, end, &amp;reserved);</div><div class='add'>+	err = __es_remove_extent(inode, lblk, end, &amp;reserved, es);</div><div class='add'>+	if (err)</div><div class='add'>+		goto error;</div><div class='add'>+	/* Free preallocated extent if it didn't get used. */</div><div class='add'>+	if (es) {</div><div class='add'>+		if (!es-&gt;es_len)</div><div class='add'>+			__es_free_extent(es);</div><div class='add'>+		es = NULL;</div><div class='add'>+	}</div><div class='add'>+	ext4_es_inc_seq(inode);</div><div class='add'>+error:</div><div class='ctx'> 	write_unlock(&amp;EXT4_I(inode)-&gt;i_es_lock);</div><div class='add'>+	if (err)</div><div class='add'>+		goto retry;</div><div class='add'>+</div><div class='add'>+	trace_ext4_es_remove_extent(inode, lblk, len);</div><div class='ctx'> 	ext4_es_print_tree(inode);</div><div class='ctx'> 	ext4_da_release_space(inode, reserved);</div><div class='del'>-	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int __es_shrink(struct ext4_sb_info *sbi, int nr_to_scan,</div><div class='hunk'>@@ -1557,7 +1696,7 @@ static unsigned long ext4_es_count(struct shrinker *shrink,</div><div class='ctx'> 	unsigned long nr;</div><div class='ctx'> 	struct ext4_sb_info *sbi;</div><div class='ctx'> </div><div class='del'>-	sbi = container_of(shrink, struct ext4_sb_info, s_es_shrinker);</div><div class='add'>+	sbi = shrink-&gt;private_data;</div><div class='ctx'> 	nr = percpu_counter_read_positive(&amp;sbi-&gt;s_es_stats.es_stats_shk_cnt);</div><div class='ctx'> 	trace_ext4_es_shrink_count(sbi-&gt;s_sb, sc-&gt;nr_to_scan, nr);</div><div class='ctx'> 	return nr;</div><div class='hunk'>@@ -1566,8 +1705,7 @@ static unsigned long ext4_es_count(struct shrinker *shrink,</div><div class='ctx'> static unsigned long ext4_es_scan(struct shrinker *shrink,</div><div class='ctx'> 				  struct shrink_control *sc)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_sb_info *sbi = container_of(shrink,</div><div class='del'>-					struct ext4_sb_info, s_es_shrinker);</div><div class='add'>+	struct ext4_sb_info *sbi = shrink-&gt;private_data;</div><div class='ctx'> 	int nr_to_scan = sc-&gt;nr_to_scan;</div><div class='ctx'> 	int ret, nr_shrunk;</div><div class='ctx'> </div><div class='hunk'>@@ -1651,12 +1789,17 @@ int ext4_es_register_shrinker(struct ext4_sb_info *sbi)</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto err3;</div><div class='ctx'> </div><div class='del'>-	sbi-&gt;s_es_shrinker.scan_objects = ext4_es_scan;</div><div class='del'>-	sbi-&gt;s_es_shrinker.count_objects = ext4_es_count;</div><div class='del'>-	sbi-&gt;s_es_shrinker.seeks = DEFAULT_SEEKS;</div><div class='del'>-	err = register_shrinker(&amp;sbi-&gt;s_es_shrinker);</div><div class='del'>-	if (err)</div><div class='add'>+	sbi-&gt;s_es_shrinker = shrinker_alloc(0, "ext4-es:%s", sbi-&gt;s_sb-&gt;s_id);</div><div class='add'>+	if (!sbi-&gt;s_es_shrinker) {</div><div class='add'>+		err = -ENOMEM;</div><div class='ctx'> 		goto err4;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	sbi-&gt;s_es_shrinker-&gt;scan_objects = ext4_es_scan;</div><div class='add'>+	sbi-&gt;s_es_shrinker-&gt;count_objects = ext4_es_count;</div><div class='add'>+	sbi-&gt;s_es_shrinker-&gt;private_data = sbi;</div><div class='add'>+</div><div class='add'>+	shrinker_register(sbi-&gt;s_es_shrinker);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> err4:</div><div class='hunk'>@@ -1676,7 +1819,7 @@ void ext4_es_unregister_shrinker(struct ext4_sb_info *sbi)</div><div class='ctx'> 	percpu_counter_destroy(&amp;sbi-&gt;s_es_stats.es_stats_cache_misses);</div><div class='ctx'> 	percpu_counter_destroy(&amp;sbi-&gt;s_es_stats.es_stats_all_cnt);</div><div class='ctx'> 	percpu_counter_destroy(&amp;sbi-&gt;s_es_stats.es_stats_shk_cnt);</div><div class='del'>-	unregister_shrinker(&amp;sbi-&gt;s_es_shrinker);</div><div class='add'>+	shrinker_free(sbi-&gt;s_es_shrinker);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1707,11 +1850,8 @@ static int es_do_reclaim_extents(struct ext4_inode_info *ei, ext4_lblk_t end,</div><div class='ctx'> </div><div class='ctx'> 		(*nr_to_scan)--;</div><div class='ctx'> 		node = rb_next(&amp;es-&gt;rb_node);</div><div class='del'>-		/*</div><div class='del'>-		 * We can't reclaim delayed extent from status tree because</div><div class='del'>-		 * fiemap, bigallic, and seek_data/hole need to use it.</div><div class='del'>-		 */</div><div class='del'>-		if (ext4_es_is_delayed(es))</div><div class='add'>+</div><div class='add'>+		if (ext4_es_must_keep(es))</div><div class='ctx'> 			goto next;</div><div class='ctx'> 		if (ext4_es_is_referenced(es)) {</div><div class='ctx'> 			ext4_es_clear_referenced(es);</div><div class='hunk'>@@ -1775,7 +1915,7 @@ void ext4_clear_inode_es(struct inode *inode)</div><div class='ctx'> 	while (node) {</div><div class='ctx'> 		es = rb_entry(node, struct extent_status, rb_node);</div><div class='ctx'> 		node = rb_next(node);</div><div class='del'>-		if (!ext4_es_is_delayed(es)) {</div><div class='add'>+		if (!ext4_es_must_keep(es)) {</div><div class='ctx'> 			rb_erase(&amp;es-&gt;rb_node, &amp;tree-&gt;root);</div><div class='ctx'> 			ext4_es_free_extent(inode, es);</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1807,9 +1947,7 @@ static void ext4_print_pending_tree(struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> int __init ext4_init_pending(void)</div><div class='ctx'> {</div><div class='del'>-	ext4_pending_cachep = kmem_cache_create("ext4_pending_reservation",</div><div class='del'>-					   sizeof(struct pending_reservation),</div><div class='del'>-					   0, (SLAB_RECLAIM_ACCOUNT), NULL);</div><div class='add'>+	ext4_pending_cachep = KMEM_CACHE(pending_reservation, SLAB_RECLAIM_ACCOUNT);</div><div class='ctx'> 	if (ext4_pending_cachep == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -1862,11 +2000,13 @@ static struct pending_reservation *__get_pending(struct inode *inode,</div><div class='ctx'>  *</div><div class='ctx'>  * @inode - file containing the cluster</div><div class='ctx'>  * @lblk - logical block in the cluster to be added</div><div class='add'>+ * @prealloc - preallocated pending entry</div><div class='ctx'>  *</div><div class='del'>- * Returns 0 on successful insertion and -ENOMEM on failure.  If the</div><div class='add'>+ * Returns 1 on successful insertion and -ENOMEM on failure.  If the</div><div class='ctx'>  * pending reservation is already in the set, returns successfully.</div><div class='ctx'>  */</div><div class='del'>-static int __insert_pending(struct inode *inode, ext4_lblk_t lblk)</div><div class='add'>+static int __insert_pending(struct inode *inode, ext4_lblk_t lblk,</div><div class='add'>+			    struct pending_reservation **prealloc)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(inode-&gt;i_sb);</div><div class='ctx'> 	struct ext4_pending_tree *tree = &amp;EXT4_I(inode)-&gt;i_pending_tree;</div><div class='hunk'>@@ -1892,15 +2032,21 @@ static int __insert_pending(struct inode *inode, ext4_lblk_t lblk)</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	pr = kmem_cache_alloc(ext4_pending_cachep, GFP_ATOMIC);</div><div class='del'>-	if (pr == NULL) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='add'>+	if (likely(*prealloc == NULL)) {</div><div class='add'>+		pr = __alloc_pending(false);</div><div class='add'>+		if (!pr) {</div><div class='add'>+			ret = -ENOMEM;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		pr = *prealloc;</div><div class='add'>+		*prealloc = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> 	pr-&gt;lclu = lclu;</div><div class='ctx'> </div><div class='ctx'> 	rb_link_node(&amp;pr-&gt;rb_node, parent, p);</div><div class='ctx'> 	rb_insert_color(&amp;pr-&gt;rb_node, &amp;tree-&gt;root);</div><div class='add'>+	ret = 1;</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -1925,7 +2071,7 @@ static void __remove_pending(struct inode *inode, ext4_lblk_t lblk)</div><div class='ctx'> 	if (pr != NULL) {</div><div class='ctx'> 		tree = &amp;EXT4_I(inode)-&gt;i_pending_tree;</div><div class='ctx'> 		rb_erase(&amp;pr-&gt;rb_node, &amp;tree-&gt;root);</div><div class='del'>-		kmem_cache_free(ext4_pending_cachep, pr);</div><div class='add'>+		__free_pending(pr);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1971,147 +2117,112 @@ bool ext4_is_pending(struct inode *inode, ext4_lblk_t lblk)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * ext4_es_insert_delayed_block - adds a delayed block to the extents status</div><div class='del'>- *                                tree, adding a pending reservation where</div><div class='del'>- *                                needed</div><div class='add'>+ * ext4_es_insert_delayed_extent - adds some delayed blocks to the extents</div><div class='add'>+ *                                 status tree, adding a pending reservation</div><div class='add'>+ *                                 where needed</div><div class='ctx'>  *</div><div class='ctx'>  * @inode - file containing the newly added block</div><div class='del'>- * @lblk - logical block to be added</div><div class='del'>- * @allocated - indicates whether a physical cluster has been allocated for</div><div class='del'>- *              the logical cluster that contains the block</div><div class='del'>- *</div><div class='del'>- * Returns 0 on success, negative error code on failure.</div><div class='add'>+ * @lblk - start logical block to be added</div><div class='add'>+ * @len - length of blocks to be added</div><div class='add'>+ * @lclu_allocated/end_allocated - indicates whether a physical cluster has</div><div class='add'>+ *                                 been allocated for the logical cluster</div><div class='add'>+ *                                 that contains the start/end block. Note that</div><div class='add'>+ *                                 end_allocated should always be set to false</div><div class='add'>+ *                                 if the start and the end block are in the</div><div class='add'>+ *                                 same cluster</div><div class='ctx'>  */</div><div class='del'>-int ext4_es_insert_delayed_block(struct inode *inode, ext4_lblk_t lblk,</div><div class='del'>-				 bool allocated)</div><div class='add'>+void ext4_es_insert_delayed_extent(struct inode *inode, ext4_lblk_t lblk,</div><div class='add'>+				   ext4_lblk_t len, bool lclu_allocated,</div><div class='add'>+				   bool end_allocated)</div><div class='ctx'> {</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(inode-&gt;i_sb);</div><div class='ctx'> 	struct extent_status newes;</div><div class='del'>-	int err = 0;</div><div class='add'>+	ext4_lblk_t end = lblk + len - 1;</div><div class='add'>+	int err1 = 0, err2 = 0, err3 = 0;</div><div class='add'>+	struct extent_status *es1 = NULL;</div><div class='add'>+	struct extent_status *es2 = NULL;</div><div class='add'>+	struct pending_reservation *pr1 = NULL;</div><div class='add'>+	struct pending_reservation *pr2 = NULL;</div><div class='ctx'> </div><div class='ctx'> 	if (EXT4_SB(inode-&gt;i_sb)-&gt;s_mount_state &amp; EXT4_FC_REPLAY)</div><div class='del'>-		return 0;</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	es_debug("add [%u/%u) delayed to extent status tree of inode %lu\n",</div><div class='add'>+		 lblk, len, inode-&gt;i_ino);</div><div class='add'>+	if (!len)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	es_debug("add [%u/1) delayed to extent status tree of inode %lu\n",</div><div class='del'>-		 lblk, inode-&gt;i_ino);</div><div class='add'>+	WARN_ON_ONCE((EXT4_B2C(sbi, lblk) == EXT4_B2C(sbi, end)) &amp;&amp;</div><div class='add'>+		     end_allocated);</div><div class='ctx'> </div><div class='ctx'> 	newes.es_lblk = lblk;</div><div class='del'>-	newes.es_len = 1;</div><div class='add'>+	newes.es_len = len;</div><div class='ctx'> 	ext4_es_store_pblock_status(&amp;newes, ~0, EXTENT_STATUS_DELAYED);</div><div class='del'>-	trace_ext4_es_insert_delayed_block(inode, &amp;newes, allocated);</div><div class='ctx'> </div><div class='ctx'> 	ext4_es_insert_extent_check(inode, &amp;newes);</div><div class='ctx'> </div><div class='add'>+retry:</div><div class='add'>+	if (err1 &amp;&amp; !es1)</div><div class='add'>+		es1 = __es_alloc_extent(true);</div><div class='add'>+	if ((err1 || err2) &amp;&amp; !es2)</div><div class='add'>+		es2 = __es_alloc_extent(true);</div><div class='add'>+	if (err1 || err2 || err3 &lt; 0) {</div><div class='add'>+		if (lclu_allocated &amp;&amp; !pr1)</div><div class='add'>+			pr1 = __alloc_pending(true);</div><div class='add'>+		if (end_allocated &amp;&amp; !pr2)</div><div class='add'>+			pr2 = __alloc_pending(true);</div><div class='add'>+	}</div><div class='ctx'> 	write_lock(&amp;EXT4_I(inode)-&gt;i_es_lock);</div><div class='ctx'> </div><div class='del'>-	err = __es_remove_extent(inode, lblk, lblk, NULL);</div><div class='del'>-	if (err != 0)</div><div class='del'>-		goto error;</div><div class='del'>-retry:</div><div class='del'>-	err = __es_insert_extent(inode, &amp;newes);</div><div class='del'>-	if (err == -ENOMEM &amp;&amp; __es_shrink(EXT4_SB(inode-&gt;i_sb),</div><div class='del'>-					  128, EXT4_I(inode)))</div><div class='del'>-		goto retry;</div><div class='del'>-	if (err != 0)</div><div class='add'>+	err1 = __es_remove_extent(inode, lblk, end, NULL, es1);</div><div class='add'>+	if (err1 != 0)</div><div class='ctx'> 		goto error;</div><div class='add'>+	/* Free preallocated extent if it didn't get used. */</div><div class='add'>+	if (es1) {</div><div class='add'>+		if (!es1-&gt;es_len)</div><div class='add'>+			__es_free_extent(es1);</div><div class='add'>+		es1 = NULL;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (allocated)</div><div class='del'>-		__insert_pending(inode, lblk);</div><div class='add'>+	err2 = __es_insert_extent(inode, &amp;newes, es2);</div><div class='add'>+	if (err2 != 0)</div><div class='add'>+		goto error;</div><div class='add'>+	/* Free preallocated extent if it didn't get used. */</div><div class='add'>+	if (es2) {</div><div class='add'>+		if (!es2-&gt;es_len)</div><div class='add'>+			__es_free_extent(es2);</div><div class='add'>+		es2 = NULL;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='add'>+	if (lclu_allocated) {</div><div class='add'>+		err3 = __insert_pending(inode, lblk, &amp;pr1);</div><div class='add'>+		if (err3 &lt; 0)</div><div class='add'>+			goto error;</div><div class='add'>+		if (pr1) {</div><div class='add'>+			__free_pending(pr1);</div><div class='add'>+			pr1 = NULL;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	if (end_allocated) {</div><div class='add'>+		err3 = __insert_pending(inode, end, &amp;pr2);</div><div class='add'>+		if (err3 &lt; 0)</div><div class='add'>+			goto error;</div><div class='add'>+		if (pr2) {</div><div class='add'>+			__free_pending(pr2);</div><div class='add'>+			pr2 = NULL;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	ext4_es_inc_seq(inode);</div><div class='ctx'> error:</div><div class='ctx'> 	write_unlock(&amp;EXT4_I(inode)-&gt;i_es_lock);</div><div class='add'>+	if (err1 || err2 || err3 &lt; 0)</div><div class='add'>+		goto retry;</div><div class='ctx'> </div><div class='add'>+	trace_ext4_es_insert_delayed_extent(inode, &amp;newes, lclu_allocated,</div><div class='add'>+					    end_allocated);</div><div class='ctx'> 	ext4_es_print_tree(inode);</div><div class='ctx'> 	ext4_print_pending_tree(inode);</div><div class='del'>-</div><div class='del'>-	return err;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * __es_delayed_clu - count number of clusters containing blocks that</div><div class='del'>- *                    are delayed only</div><div class='del'>- *</div><div class='del'>- * @inode - file containing block range</div><div class='del'>- * @start - logical block defining start of range</div><div class='del'>- * @end - logical block defining end of range</div><div class='del'>- *</div><div class='del'>- * Returns the number of clusters containing only delayed (not delayed</div><div class='del'>- * and unwritten) blocks in the range specified by @start and @end.  Any</div><div class='del'>- * cluster or part of a cluster within the range and containing a delayed</div><div class='del'>- * and not unwritten block within the range is counted as a whole cluster.</div><div class='del'>- */</div><div class='del'>-static unsigned int __es_delayed_clu(struct inode *inode, ext4_lblk_t start,</div><div class='del'>-				     ext4_lblk_t end)</div><div class='del'>-{</div><div class='del'>-	struct ext4_es_tree *tree = &amp;EXT4_I(inode)-&gt;i_es_tree;</div><div class='del'>-	struct extent_status *es;</div><div class='del'>-	struct ext4_sb_info *sbi = EXT4_SB(inode-&gt;i_sb);</div><div class='del'>-	struct rb_node *node;</div><div class='del'>-	ext4_lblk_t first_lclu, last_lclu;</div><div class='del'>-	unsigned long long last_counted_lclu;</div><div class='del'>-	unsigned int n = 0;</div><div class='del'>-</div><div class='del'>-	/* guaranteed to be unequal to any ext4_lblk_t value */</div><div class='del'>-	last_counted_lclu = ~0ULL;</div><div class='del'>-</div><div class='del'>-	es = __es_tree_search(&amp;tree-&gt;root, start);</div><div class='del'>-</div><div class='del'>-	while (es &amp;&amp; (es-&gt;es_lblk &lt;= end)) {</div><div class='del'>-		if (ext4_es_is_delonly(es)) {</div><div class='del'>-			if (es-&gt;es_lblk &lt;= start)</div><div class='del'>-				first_lclu = EXT4_B2C(sbi, start);</div><div class='del'>-			else</div><div class='del'>-				first_lclu = EXT4_B2C(sbi, es-&gt;es_lblk);</div><div class='del'>-</div><div class='del'>-			if (ext4_es_end(es) &gt;= end)</div><div class='del'>-				last_lclu = EXT4_B2C(sbi, end);</div><div class='del'>-			else</div><div class='del'>-				last_lclu = EXT4_B2C(sbi, ext4_es_end(es));</div><div class='del'>-</div><div class='del'>-			if (first_lclu == last_counted_lclu)</div><div class='del'>-				n += last_lclu - first_lclu;</div><div class='del'>-			else</div><div class='del'>-				n += last_lclu - first_lclu + 1;</div><div class='del'>-			last_counted_lclu = last_lclu;</div><div class='del'>-		}</div><div class='del'>-		node = rb_next(&amp;es-&gt;rb_node);</div><div class='del'>-		if (!node)</div><div class='del'>-			break;</div><div class='del'>-		es = rb_entry(node, struct extent_status, rb_node);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return n;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * ext4_es_delayed_clu - count number of clusters containing blocks that</div><div class='del'>- *                       are both delayed and unwritten</div><div class='del'>- *</div><div class='del'>- * @inode - file containing block range</div><div class='del'>- * @lblk - logical block defining start of range</div><div class='del'>- * @len - number of blocks in range</div><div class='del'>- *</div><div class='del'>- * Locking for external use of __es_delayed_clu().</div><div class='del'>- */</div><div class='del'>-unsigned int ext4_es_delayed_clu(struct inode *inode, ext4_lblk_t lblk,</div><div class='del'>-				 ext4_lblk_t len)</div><div class='del'>-{</div><div class='del'>-	struct ext4_inode_info *ei = EXT4_I(inode);</div><div class='del'>-	ext4_lblk_t end;</div><div class='del'>-	unsigned int n;</div><div class='del'>-</div><div class='del'>-	if (len == 0)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	end = lblk + len - 1;</div><div class='del'>-	WARN_ON(end &lt; lblk);</div><div class='del'>-</div><div class='del'>-	read_lock(&amp;ei-&gt;i_es_lock);</div><div class='del'>-</div><div class='del'>-	n = __es_delayed_clu(inode, lblk, end);</div><div class='del'>-</div><div class='del'>-	read_unlock(&amp;ei-&gt;i_es_lock);</div><div class='del'>-</div><div class='del'>-	return n;</div><div class='add'>+	return;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2124,21 +2235,27 @@ unsigned int ext4_es_delayed_clu(struct inode *inode, ext4_lblk_t lblk,</div><div class='ctx'>  * @inode - file containing the range</div><div class='ctx'>  * @lblk - logical block defining the start of range</div><div class='ctx'>  * @len  - length of range in blocks</div><div class='add'>+ * @prealloc - preallocated pending entry</div><div class='ctx'>  *</div><div class='ctx'>  * Used after a newly allocated extent is added to the extents status tree.</div><div class='ctx'>  * Requires that the extents in the range have either written or unwritten</div><div class='del'>- * status.  Must be called while holding i_es_lock.</div><div class='add'>+ * status.  Must be called while holding i_es_lock. Returns number of new</div><div class='add'>+ * inserts pending cluster on insert pendings, returns 0 on remove pendings,</div><div class='add'>+ * return -ENOMEM on failure.</div><div class='ctx'>  */</div><div class='del'>-static void __revise_pending(struct inode *inode, ext4_lblk_t lblk,</div><div class='del'>-			     ext4_lblk_t len)</div><div class='add'>+static int __revise_pending(struct inode *inode, ext4_lblk_t lblk,</div><div class='add'>+			    ext4_lblk_t len,</div><div class='add'>+			    struct pending_reservation **prealloc)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(inode-&gt;i_sb);</div><div class='ctx'> 	ext4_lblk_t end = lblk + len - 1;</div><div class='ctx'> 	ext4_lblk_t first, last;</div><div class='ctx'> 	bool f_del = false, l_del = false;</div><div class='add'>+	int pendings = 0;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (len == 0)</div><div class='del'>-		return;</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Two cases - block range within single cluster and block range</div><div class='hunk'>@@ -2156,39 +2273,53 @@ static void __revise_pending(struct inode *inode, ext4_lblk_t lblk,</div><div class='ctx'> 	if (EXT4_B2C(sbi, lblk) == EXT4_B2C(sbi, end)) {</div><div class='ctx'> 		first = EXT4_LBLK_CMASK(sbi, lblk);</div><div class='ctx'> 		if (first != lblk)</div><div class='del'>-			f_del = __es_scan_range(inode, &amp;ext4_es_is_delonly,</div><div class='add'>+			f_del = __es_scan_range(inode, &amp;ext4_es_is_delayed,</div><div class='ctx'> 						first, lblk - 1);</div><div class='ctx'> 		if (f_del) {</div><div class='del'>-			__insert_pending(inode, first);</div><div class='add'>+			ret = __insert_pending(inode, first, prealloc);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				goto out;</div><div class='add'>+			pendings += ret;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			last = EXT4_LBLK_CMASK(sbi, end) +</div><div class='ctx'> 			       sbi-&gt;s_cluster_ratio - 1;</div><div class='ctx'> 			if (last != end)</div><div class='ctx'> 				l_del = __es_scan_range(inode,</div><div class='del'>-							&amp;ext4_es_is_delonly,</div><div class='add'>+							&amp;ext4_es_is_delayed,</div><div class='ctx'> 							end + 1, last);</div><div class='del'>-			if (l_del)</div><div class='del'>-				__insert_pending(inode, last);</div><div class='del'>-			else</div><div class='add'>+			if (l_del) {</div><div class='add'>+				ret = __insert_pending(inode, last, prealloc);</div><div class='add'>+				if (ret &lt; 0)</div><div class='add'>+					goto out;</div><div class='add'>+				pendings += ret;</div><div class='add'>+			} else</div><div class='ctx'> 				__remove_pending(inode, last);</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='ctx'> 		first = EXT4_LBLK_CMASK(sbi, lblk);</div><div class='ctx'> 		if (first != lblk)</div><div class='del'>-			f_del = __es_scan_range(inode, &amp;ext4_es_is_delonly,</div><div class='add'>+			f_del = __es_scan_range(inode, &amp;ext4_es_is_delayed,</div><div class='ctx'> 						first, lblk - 1);</div><div class='del'>-		if (f_del)</div><div class='del'>-			__insert_pending(inode, first);</div><div class='del'>-		else</div><div class='add'>+		if (f_del) {</div><div class='add'>+			ret = __insert_pending(inode, first, prealloc);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				goto out;</div><div class='add'>+			pendings += ret;</div><div class='add'>+		} else</div><div class='ctx'> 			__remove_pending(inode, first);</div><div class='ctx'> </div><div class='ctx'> 		last = EXT4_LBLK_CMASK(sbi, end) + sbi-&gt;s_cluster_ratio - 1;</div><div class='ctx'> 		if (last != end)</div><div class='del'>-			l_del = __es_scan_range(inode, &amp;ext4_es_is_delonly,</div><div class='add'>+			l_del = __es_scan_range(inode, &amp;ext4_es_is_delayed,</div><div class='ctx'> 						end + 1, last);</div><div class='del'>-		if (l_del)</div><div class='del'>-			__insert_pending(inode, last);</div><div class='del'>-		else</div><div class='add'>+		if (l_del) {</div><div class='add'>+			ret = __insert_pending(inode, last, prealloc);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				goto out;</div><div class='add'>+			pendings += ret;</div><div class='add'>+		} else</div><div class='ctx'> 			__remove_pending(inode, last);</div><div class='ctx'> 	}</div><div class='add'>+out:</div><div class='add'>+	return (ret &lt; 0) ? ret : pendings;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/ext4/extents_status.h b/fs/ext4/extents_status.h<br/>index 4ec30a798260..f3396cf32b44 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/extents_status.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/extents_status.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/extents_status.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/extents_status.h</a></div><div class='hunk'>@@ -42,6 +42,10 @@ enum {</div><div class='ctx'> #define ES_SHIFT (sizeof(ext4_fsblk_t)*8 - ES_FLAGS)</div><div class='ctx'> #define ES_MASK (~((ext4_fsblk_t)0) &lt;&lt; ES_SHIFT)</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Besides EXTENT_STATUS_REFERENCED, all these extent type masks</div><div class='add'>+ * are exclusive, only one type can be set at a time.</div><div class='add'>+ */</div><div class='ctx'> #define EXTENT_STATUS_WRITTEN	(1 &lt;&lt; ES_WRITTEN_B)</div><div class='ctx'> #define EXTENT_STATUS_UNWRITTEN (1 &lt;&lt; ES_UNWRITTEN_B)</div><div class='ctx'> #define EXTENT_STATUS_DELAYED	(1 &lt;&lt; ES_DELAYED_B)</div><div class='hunk'>@@ -51,7 +55,9 @@ enum {</div><div class='ctx'> #define ES_TYPE_MASK	((ext4_fsblk_t)(EXTENT_STATUS_WRITTEN | \</div><div class='ctx'> 			  EXTENT_STATUS_UNWRITTEN | \</div><div class='ctx'> 			  EXTENT_STATUS_DELAYED | \</div><div class='del'>-			  EXTENT_STATUS_HOLE) &lt;&lt; ES_SHIFT)</div><div class='add'>+			  EXTENT_STATUS_HOLE))</div><div class='add'>+</div><div class='add'>+#define ES_TYPE_VALID(type)	((type) &amp;&amp; !((type) &amp; ((type) - 1)))</div><div class='ctx'> </div><div class='ctx'> struct ext4_sb_info;</div><div class='ctx'> struct ext4_extent;</div><div class='hunk'>@@ -127,21 +133,22 @@ extern int __init ext4_init_es(void);</div><div class='ctx'> extern void ext4_exit_es(void);</div><div class='ctx'> extern void ext4_es_init_tree(struct ext4_es_tree *tree);</div><div class='ctx'> </div><div class='del'>-extern int ext4_es_insert_extent(struct inode *inode, ext4_lblk_t lblk,</div><div class='del'>-				 ext4_lblk_t len, ext4_fsblk_t pblk,</div><div class='del'>-				 unsigned int status);</div><div class='add'>+extern void ext4_es_insert_extent(struct inode *inode, ext4_lblk_t lblk,</div><div class='add'>+				  ext4_lblk_t len, ext4_fsblk_t pblk,</div><div class='add'>+				  unsigned int status,</div><div class='add'>+				  bool delalloc_reserve_used);</div><div class='ctx'> extern void ext4_es_cache_extent(struct inode *inode, ext4_lblk_t lblk,</div><div class='ctx'> 				 ext4_lblk_t len, ext4_fsblk_t pblk,</div><div class='ctx'> 				 unsigned int status);</div><div class='del'>-extern int ext4_es_remove_extent(struct inode *inode, ext4_lblk_t lblk,</div><div class='del'>-				 ext4_lblk_t len);</div><div class='add'>+extern void ext4_es_remove_extent(struct inode *inode, ext4_lblk_t lblk,</div><div class='add'>+				  ext4_lblk_t len);</div><div class='ctx'> extern void ext4_es_find_extent_range(struct inode *inode,</div><div class='ctx'> 				      int (*match_fn)(struct extent_status *es),</div><div class='ctx'> 				      ext4_lblk_t lblk, ext4_lblk_t end,</div><div class='ctx'> 				      struct extent_status *es);</div><div class='ctx'> extern int ext4_es_lookup_extent(struct inode *inode, ext4_lblk_t lblk,</div><div class='ctx'> 				 ext4_lblk_t *next_lblk,</div><div class='del'>-				 struct extent_status *es);</div><div class='add'>+				 struct extent_status *es, u64 *pseq);</div><div class='ctx'> extern bool ext4_es_scan_range(struct inode *inode,</div><div class='ctx'> 			       int (*matching_fn)(struct extent_status *es),</div><div class='ctx'> 			       ext4_lblk_t lblk, ext4_lblk_t end);</div><div class='hunk'>@@ -156,7 +163,7 @@ static inline unsigned int ext4_es_status(struct extent_status *es)</div><div class='ctx'> </div><div class='ctx'> static inline unsigned int ext4_es_type(struct extent_status *es)</div><div class='ctx'> {</div><div class='del'>-	return (es-&gt;es_pblk &amp; ES_TYPE_MASK) &gt;&gt; ES_SHIFT;</div><div class='add'>+	return (es-&gt;es_pblk &gt;&gt; ES_SHIFT) &amp; ES_TYPE_MASK;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int ext4_es_is_written(struct extent_status *es)</div><div class='hunk'>@@ -184,11 +191,6 @@ static inline int ext4_es_is_mapped(struct extent_status *es)</div><div class='ctx'> 	return (ext4_es_is_written(es) || ext4_es_is_unwritten(es));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int ext4_es_is_delonly(struct extent_status *es)</div><div class='del'>-{</div><div class='del'>-	return (ext4_es_is_delayed(es) &amp;&amp; !ext4_es_is_unwritten(es));</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static inline void ext4_es_set_referenced(struct extent_status *es)</div><div class='ctx'> {</div><div class='ctx'> 	es-&gt;es_pblk |= ((ext4_fsblk_t)EXTENT_STATUS_REFERENCED) &lt;&lt; ES_SHIFT;</div><div class='hunk'>@@ -224,17 +226,12 @@ static inline void ext4_es_store_pblock(struct extent_status *es,</div><div class='ctx'> 	es-&gt;es_pblk = block;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void ext4_es_store_status(struct extent_status *es,</div><div class='del'>-					unsigned int status)</div><div class='del'>-{</div><div class='del'>-	es-&gt;es_pblk = (((ext4_fsblk_t)status &lt;&lt; ES_SHIFT) &amp; ES_MASK) |</div><div class='del'>-		      (es-&gt;es_pblk &amp; ~ES_MASK);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static inline void ext4_es_store_pblock_status(struct extent_status *es,</div><div class='ctx'> 					       ext4_fsblk_t pb,</div><div class='ctx'> 					       unsigned int status)</div><div class='ctx'> {</div><div class='add'>+	WARN_ON_ONCE(!ES_TYPE_VALID(status &amp; ES_TYPE_MASK));</div><div class='add'>+</div><div class='ctx'> 	es-&gt;es_pblk = (((ext4_fsblk_t)status &lt;&lt; ES_SHIFT) &amp; ES_MASK) |</div><div class='ctx'> 		      (pb &amp; ~ES_MASK);</div><div class='ctx'> }</div><div class='hunk'>@@ -249,10 +246,9 @@ extern void ext4_exit_pending(void);</div><div class='ctx'> extern void ext4_init_pending_tree(struct ext4_pending_tree *tree);</div><div class='ctx'> extern void ext4_remove_pending(struct inode *inode, ext4_lblk_t lblk);</div><div class='ctx'> extern bool ext4_is_pending(struct inode *inode, ext4_lblk_t lblk);</div><div class='del'>-extern int ext4_es_insert_delayed_block(struct inode *inode, ext4_lblk_t lblk,</div><div class='del'>-					bool allocated);</div><div class='del'>-extern unsigned int ext4_es_delayed_clu(struct inode *inode, ext4_lblk_t lblk,</div><div class='del'>-					ext4_lblk_t len);</div><div class='add'>+extern void ext4_es_insert_delayed_extent(struct inode *inode, ext4_lblk_t lblk,</div><div class='add'>+					  ext4_lblk_t len, bool lclu_allocated,</div><div class='add'>+					  bool end_allocated);</div><div class='ctx'> extern void ext4_clear_inode_es(struct inode *inode);</div><div class='ctx'> </div><div class='ctx'> #endif /* _EXT4_EXTENTS_STATUS_H */</div><div class='head'>diff --git a/fs/ext4/fast_commit.c b/fs/ext4/fast_commit.c<br/>index 0f32b445582a..fa66b08de999 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/fast_commit.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/fast_commit.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/fast_commit.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/fast_commit.c</a></div><div class='hunk'>@@ -12,6 +12,7 @@</div><div class='ctx'> #include "ext4_extents.h"</div><div class='ctx'> #include "mballoc.h"</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/lockdep.h&gt;</div><div class='ctx'> /*</div><div class='ctx'>  * Ext4 Fast Commits</div><div class='ctx'>  * -----------------</div><div class='hunk'>@@ -49,37 +50,35 @@</div><div class='ctx'>  * that need to be committed during a fast commit in another in memory queue of</div><div class='ctx'>  * inodes. During the commit operation, we commit in the following order:</div><div class='ctx'>  *</div><div class='del'>- * [1] Lock inodes for any further data updates by setting COMMITTING state</div><div class='del'>- * [2] Submit data buffers of all the inodes</div><div class='del'>- * [3] Wait for [2] to complete</div><div class='del'>- * [4] Commit all the directory entry updates in the fast commit space</div><div class='del'>- * [5] Commit all the changed inode structures</div><div class='del'>- * [6] Write tail tag (this tag ensures the atomicity, please read the following</div><div class='add'>+ * [1] Prepare all the inodes to write out their data by setting</div><div class='add'>+ *     "EXT4_STATE_FC_FLUSHING_DATA". This ensures that inode cannot be</div><div class='add'>+ *     deleted while it is being flushed.</div><div class='add'>+ * [2] Flush data buffers to disk and clear "EXT4_STATE_FC_FLUSHING_DATA"</div><div class='add'>+ *     state.</div><div class='add'>+ * [3] Lock the journal by calling jbd2_journal_lock_updates. This ensures that</div><div class='add'>+ *     all the exsiting handles finish and no new handles can start.</div><div class='add'>+ * [4] Mark all the fast commit eligible inodes as undergoing fast commit</div><div class='add'>+ *     by setting "EXT4_STATE_FC_COMMITTING" state.</div><div class='add'>+ * [5] Unlock the journal by calling jbd2_journal_unlock_updates. This allows</div><div class='add'>+ *     starting of new handles. If new handles try to start an update on</div><div class='add'>+ *     any of the inodes that are being committed, ext4_fc_track_inode()</div><div class='add'>+ *     will block until those inodes have finished the fast commit.</div><div class='add'>+ * [6] Commit all the directory entry updates in the fast commit space.</div><div class='add'>+ * [7] Commit all the changed inodes in the fast commit space and clear</div><div class='add'>+ *     "EXT4_STATE_FC_COMMITTING" for these inodes.</div><div class='add'>+ * [8] Write tail tag (this tag ensures the atomicity, please read the following</div><div class='ctx'>  *     section for more details).</div><div class='del'>- * [7] Wait for [4], [5] and [6] to complete.</div><div class='ctx'>  *</div><div class='del'>- * All the inode updates must call ext4_fc_start_update() before starting an</div><div class='del'>- * update. If such an ongoing update is present, fast commit waits for it to</div><div class='del'>- * complete. The completion of such an update is marked by</div><div class='del'>- * ext4_fc_stop_update().</div><div class='add'>+ * All the inode updates must be enclosed within jbd2_jounrnal_start()</div><div class='add'>+ * and jbd2_journal_stop() similar to JBD2 journaling.</div><div class='ctx'>  *</div><div class='ctx'>  * Fast Commit Ineligibility</div><div class='ctx'>  * -------------------------</div><div class='del'>- * Not all operations are supported by fast commits today (e.g extended</div><div class='del'>- * attributes). Fast commit ineligibility is marked by calling one of the</div><div class='del'>- * two following functions:</div><div class='del'>- *</div><div class='del'>- * - ext4_fc_mark_ineligible(): This makes next fast commit operation to fall</div><div class='del'>- *   back to full commit. This is useful in case of transient errors.</div><div class='ctx'>  *</div><div class='del'>- * - ext4_fc_start_ineligible() and ext4_fc_stop_ineligible() - This makes all</div><div class='del'>- *   the fast commits happening between ext4_fc_start_ineligible() and</div><div class='del'>- *   ext4_fc_stop_ineligible() and one fast commit after the call to</div><div class='del'>- *   ext4_fc_stop_ineligible() to fall back to full commits. It is important to</div><div class='del'>- *   make one more fast commit to fall back to full commit after stop call so</div><div class='del'>- *   that it guaranteed that the fast commit ineligible operation contained</div><div class='del'>- *   within ext4_fc_start_ineligible() and ext4_fc_stop_ineligible() is</div><div class='del'>- *   followed by at least 1 full commit.</div><div class='add'>+ * Not all operations are supported by fast commits today (e.g extended</div><div class='add'>+ * attributes). Fast commit ineligibility is marked by calling</div><div class='add'>+ * ext4_fc_mark_ineligible(): This makes next fast commit operation to fall back</div><div class='add'>+ * to full commit.</div><div class='ctx'>  *</div><div class='ctx'>  * Atomicity of commits</div><div class='ctx'>  * --------------------</div><div class='hunk'>@@ -152,6 +151,13 @@</div><div class='ctx'>  * similarly. Thus, by converting a non-idempotent procedure into a series of</div><div class='ctx'>  * idempotent outcomes, fast commits ensured idempotence during the replay.</div><div class='ctx'>  *</div><div class='add'>+ * Locking</div><div class='add'>+ * -------</div><div class='add'>+ * sbi-&gt;s_fc_lock protects the fast commit inodes queue and the fast commit</div><div class='add'>+ * dentry queue. ei-&gt;i_fc_lock protects the fast commit related info in a given</div><div class='add'>+ * inode. Most of the code avoids acquiring both the locks, but if one must do</div><div class='add'>+ * that then sbi-&gt;s_fc_lock must be acquired before ei-&gt;i_fc_lock.</div><div class='add'>+ *</div><div class='ctx'>  * TODOs</div><div class='ctx'>  * -----</div><div class='ctx'>  *</div><div class='hunk'>@@ -166,15 +172,12 @@</div><div class='ctx'>  *    fast commit recovery even if that area is invalidated by later full</div><div class='ctx'>  *    commits.</div><div class='ctx'>  *</div><div class='del'>- * 1) Make fast commit atomic updates more fine grained. Today, a fast commit</div><div class='del'>- *    eligible update must be protected within ext4_fc_start_update() and</div><div class='del'>- *    ext4_fc_stop_update(). These routines are called at much higher</div><div class='del'>- *    routines. This can be made more fine grained by combining with</div><div class='del'>- *    ext4_journal_start().</div><div class='del'>- *</div><div class='del'>- * 2) Same above for ext4_fc_start_ineligible() and ext4_fc_stop_ineligible()</div><div class='add'>+ * 1) Handle more ineligible cases.</div><div class='ctx'>  *</div><div class='del'>- * 3) Handle more ineligible cases.</div><div class='add'>+ * 2) Change ext4_fc_commit() to lookup logical to physical mapping using extent</div><div class='add'>+ *    status tree. This would get rid of the need to call ext4_fc_track_inode()</div><div class='add'>+ *    before acquiring i_data_sem. To do that we would need to ensure that</div><div class='add'>+ *    modified extents from the extent status tree are not evicted from memory.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> #include &lt;trace/events/ext4.h&gt;</div><div class='hunk'>@@ -211,77 +214,14 @@ void ext4_fc_init_inode(struct inode *inode)</div><div class='ctx'> 	ext4_fc_reset_inode(inode);</div><div class='ctx'> 	ext4_clear_inode_state(inode, EXT4_STATE_FC_COMMITTING);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;ei-&gt;i_fc_list);</div><div class='add'>+	INIT_LIST_HEAD(&amp;ei-&gt;i_fc_dilist);</div><div class='ctx'> 	init_waitqueue_head(&amp;ei-&gt;i_fc_wait);</div><div class='del'>-	atomic_set(&amp;ei-&gt;i_fc_updates, 0);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* This function must be called with sbi-&gt;s_fc_lock held. */</div><div class='del'>-static void ext4_fc_wait_committing_inode(struct inode *inode)</div><div class='del'>-__releases(&amp;EXT4_SB(inode-&gt;i_sb)-&gt;s_fc_lock)</div><div class='del'>-{</div><div class='del'>-	wait_queue_head_t *wq;</div><div class='del'>-	struct ext4_inode_info *ei = EXT4_I(inode);</div><div class='del'>-</div><div class='del'>-#if (BITS_PER_LONG &lt; 64)</div><div class='del'>-	DEFINE_WAIT_BIT(wait, &amp;ei-&gt;i_state_flags,</div><div class='del'>-			EXT4_STATE_FC_COMMITTING);</div><div class='del'>-	wq = bit_waitqueue(&amp;ei-&gt;i_state_flags,</div><div class='del'>-				EXT4_STATE_FC_COMMITTING);</div><div class='del'>-#else</div><div class='del'>-	DEFINE_WAIT_BIT(wait, &amp;ei-&gt;i_flags,</div><div class='del'>-			EXT4_STATE_FC_COMMITTING);</div><div class='del'>-	wq = bit_waitqueue(&amp;ei-&gt;i_flags,</div><div class='del'>-				EXT4_STATE_FC_COMMITTING);</div><div class='del'>-#endif</div><div class='del'>-	lockdep_assert_held(&amp;EXT4_SB(inode-&gt;i_sb)-&gt;s_fc_lock);</div><div class='del'>-	prepare_to_wait(wq, &amp;wait.wq_entry, TASK_UNINTERRUPTIBLE);</div><div class='del'>-	spin_unlock(&amp;EXT4_SB(inode-&gt;i_sb)-&gt;s_fc_lock);</div><div class='del'>-	schedule();</div><div class='del'>-	finish_wait(wq, &amp;wait.wq_entry);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Inform Ext4's fast about start of an inode update</div><div class='del'>- *</div><div class='del'>- * This function is called by the high level call VFS callbacks before</div><div class='del'>- * performing any inode update. This function blocks if there's an ongoing</div><div class='del'>- * fast commit on the inode in question.</div><div class='del'>- */</div><div class='del'>-void ext4_fc_start_update(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	struct ext4_inode_info *ei = EXT4_I(inode);</div><div class='del'>-</div><div class='del'>-	if (!test_opt2(inode-&gt;i_sb, JOURNAL_FAST_COMMIT) ||</div><div class='del'>-	    (EXT4_SB(inode-&gt;i_sb)-&gt;s_mount_state &amp; EXT4_FC_REPLAY))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-restart:</div><div class='del'>-	spin_lock(&amp;EXT4_SB(inode-&gt;i_sb)-&gt;s_fc_lock);</div><div class='del'>-	if (list_empty(&amp;ei-&gt;i_fc_list))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	if (ext4_test_inode_state(inode, EXT4_STATE_FC_COMMITTING)) {</div><div class='del'>-		ext4_fc_wait_committing_inode(inode);</div><div class='del'>-		goto restart;</div><div class='del'>-	}</div><div class='del'>-out:</div><div class='del'>-	atomic_inc(&amp;ei-&gt;i_fc_updates);</div><div class='del'>-	spin_unlock(&amp;EXT4_SB(inode-&gt;i_sb)-&gt;s_fc_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Stop inode update and wake up waiting fast commits if any.</div><div class='del'>- */</div><div class='del'>-void ext4_fc_stop_update(struct inode *inode)</div><div class='add'>+static bool ext4_fc_disabled(struct super_block *sb)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_inode_info *ei = EXT4_I(inode);</div><div class='del'>-</div><div class='del'>-	if (!test_opt2(inode-&gt;i_sb, JOURNAL_FAST_COMMIT) ||</div><div class='del'>-	    (EXT4_SB(inode-&gt;i_sb)-&gt;s_mount_state &amp; EXT4_FC_REPLAY))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	if (atomic_dec_and_test(&amp;ei-&gt;i_fc_updates))</div><div class='del'>-		wake_up_all(&amp;ei-&gt;i_fc_wait);</div><div class='add'>+	return (!test_opt2(sb, JOURNAL_FAST_COMMIT) ||</div><div class='add'>+		(EXT4_SB(sb)-&gt;s_mount_state &amp; EXT4_FC_REPLAY));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -291,79 +231,112 @@ void ext4_fc_stop_update(struct inode *inode)</div><div class='ctx'> void ext4_fc_del(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_inode_info *ei = EXT4_I(inode);</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(inode-&gt;i_sb);</div><div class='add'>+	struct ext4_fc_dentry_update *fc_dentry;</div><div class='add'>+	wait_queue_head_t *wq;</div><div class='ctx'> </div><div class='del'>-	if (!test_opt2(inode-&gt;i_sb, JOURNAL_FAST_COMMIT) ||</div><div class='del'>-	    (EXT4_SB(inode-&gt;i_sb)-&gt;s_mount_state &amp; EXT4_FC_REPLAY))</div><div class='add'>+	if (ext4_fc_disabled(inode-&gt;i_sb))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-restart:</div><div class='del'>-	spin_lock(&amp;EXT4_SB(inode-&gt;i_sb)-&gt;s_fc_lock);</div><div class='del'>-	if (list_empty(&amp;ei-&gt;i_fc_list)) {</div><div class='del'>-		spin_unlock(&amp;EXT4_SB(inode-&gt;i_sb)-&gt;s_fc_lock);</div><div class='add'>+	mutex_lock(&amp;sbi-&gt;s_fc_lock);</div><div class='add'>+	if (list_empty(&amp;ei-&gt;i_fc_list) &amp;&amp; list_empty(&amp;ei-&gt;i_fc_dilist)) {</div><div class='add'>+		mutex_unlock(&amp;sbi-&gt;s_fc_lock);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (ext4_test_inode_state(inode, EXT4_STATE_FC_COMMITTING)) {</div><div class='del'>-		ext4_fc_wait_committing_inode(inode);</div><div class='del'>-		goto restart;</div><div class='add'>+	/*</div><div class='add'>+	 * Since ext4_fc_del is called from ext4_evict_inode while having a</div><div class='add'>+	 * handle open, there is no need for us to wait here even if a fast</div><div class='add'>+	 * commit is going on. That is because, if this inode is being</div><div class='add'>+	 * committed, ext4_mark_inode_dirty would have waited for inode commit</div><div class='add'>+	 * operation to finish before we come here. So, by the time we come</div><div class='add'>+	 * here, inode's EXT4_STATE_FC_COMMITTING would have been cleared. So,</div><div class='add'>+	 * we shouldn't see EXT4_STATE_FC_COMMITTING to be set on this inode</div><div class='add'>+	 * here.</div><div class='add'>+	 *</div><div class='add'>+	 * We may come here without any handles open in the "no_delete" case of</div><div class='add'>+	 * ext4_evict_inode as well. However, if that happens, we first mark the</div><div class='add'>+	 * file system as fast commit ineligible anyway. So, even in that case,</div><div class='add'>+	 * it is okay to remove the inode from the fc list.</div><div class='add'>+	 */</div><div class='add'>+	WARN_ON(ext4_test_inode_state(inode, EXT4_STATE_FC_COMMITTING)</div><div class='add'>+		&amp;&amp; !ext4_test_mount_flag(inode-&gt;i_sb, EXT4_MF_FC_INELIGIBLE));</div><div class='add'>+	while (ext4_test_inode_state(inode, EXT4_STATE_FC_FLUSHING_DATA)) {</div><div class='add'>+#if (BITS_PER_LONG &lt; 64)</div><div class='add'>+		DEFINE_WAIT_BIT(wait, &amp;ei-&gt;i_state_flags,</div><div class='add'>+				EXT4_STATE_FC_FLUSHING_DATA);</div><div class='add'>+		wq = bit_waitqueue(&amp;ei-&gt;i_state_flags,</div><div class='add'>+				   EXT4_STATE_FC_FLUSHING_DATA);</div><div class='add'>+#else</div><div class='add'>+		DEFINE_WAIT_BIT(wait, &amp;ei-&gt;i_flags,</div><div class='add'>+				EXT4_STATE_FC_FLUSHING_DATA);</div><div class='add'>+		wq = bit_waitqueue(&amp;ei-&gt;i_flags,</div><div class='add'>+				   EXT4_STATE_FC_FLUSHING_DATA);</div><div class='add'>+#endif</div><div class='add'>+		prepare_to_wait(wq, &amp;wait.wq_entry, TASK_UNINTERRUPTIBLE);</div><div class='add'>+		if (ext4_test_inode_state(inode, EXT4_STATE_FC_FLUSHING_DATA)) {</div><div class='add'>+			mutex_unlock(&amp;sbi-&gt;s_fc_lock);</div><div class='add'>+			schedule();</div><div class='add'>+			mutex_lock(&amp;sbi-&gt;s_fc_lock);</div><div class='add'>+		}</div><div class='add'>+		finish_wait(wq, &amp;wait.wq_entry);</div><div class='ctx'> 	}</div><div class='ctx'> 	list_del_init(&amp;ei-&gt;i_fc_list);</div><div class='del'>-	spin_unlock(&amp;EXT4_SB(inode-&gt;i_sb)-&gt;s_fc_lock);</div><div class='del'>-}</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Mark file system as fast commit ineligible. This means that next commit</div><div class='del'>- * operation would result in a full jbd2 commit.</div><div class='del'>- */</div><div class='del'>-void ext4_fc_mark_ineligible(struct super_block *sb, int reason)</div><div class='del'>-{</div><div class='del'>-	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='del'>-</div><div class='del'>-	if (!test_opt2(sb, JOURNAL_FAST_COMMIT) ||</div><div class='del'>-	    (EXT4_SB(sb)-&gt;s_mount_state &amp; EXT4_FC_REPLAY))</div><div class='add'>+	/*</div><div class='add'>+	 * Since this inode is getting removed, let's also remove all FC</div><div class='add'>+	 * dentry create references, since it is not needed to log it anyways.</div><div class='add'>+	 */</div><div class='add'>+	if (list_empty(&amp;ei-&gt;i_fc_dilist)) {</div><div class='add'>+		mutex_unlock(&amp;sbi-&gt;s_fc_lock);</div><div class='ctx'> 		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	ext4_set_mount_flag(sb, EXT4_MF_FC_INELIGIBLE);</div><div class='del'>-	WARN_ON(reason &gt;= EXT4_FC_REASON_MAX);</div><div class='del'>-	sbi-&gt;s_fc_stats.fc_ineligible_reason_count[reason]++;</div><div class='add'>+	fc_dentry = list_first_entry(&amp;ei-&gt;i_fc_dilist, struct ext4_fc_dentry_update, fcd_dilist);</div><div class='add'>+	WARN_ON(fc_dentry-&gt;fcd_op != EXT4_FC_TAG_CREAT);</div><div class='add'>+	list_del_init(&amp;fc_dentry-&gt;fcd_list);</div><div class='add'>+	list_del_init(&amp;fc_dentry-&gt;fcd_dilist);</div><div class='add'>+</div><div class='add'>+	WARN_ON(!list_empty(&amp;ei-&gt;i_fc_dilist));</div><div class='add'>+	mutex_unlock(&amp;sbi-&gt;s_fc_lock);</div><div class='add'>+</div><div class='add'>+	release_dentry_name_snapshot(&amp;fc_dentry-&gt;fcd_name);</div><div class='add'>+	kmem_cache_free(ext4_fc_dentry_cachep, fc_dentry);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Start a fast commit ineligible update. Any commits that happen while</div><div class='del'>- * such an operation is in progress fall back to full commits.</div><div class='add'>+ * Mark file system as fast commit ineligible, and record latest</div><div class='add'>+ * ineligible transaction tid. This means until the recorded</div><div class='add'>+ * transaction, commit operation would result in a full jbd2 commit.</div><div class='ctx'>  */</div><div class='del'>-void ext4_fc_start_ineligible(struct super_block *sb, int reason)</div><div class='add'>+void ext4_fc_mark_ineligible(struct super_block *sb, int reason, handle_t *handle)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	tid_t tid;</div><div class='add'>+	bool has_transaction = true;</div><div class='add'>+	bool is_ineligible;</div><div class='ctx'> </div><div class='del'>-	if (!test_opt2(sb, JOURNAL_FAST_COMMIT) ||</div><div class='del'>-	    (EXT4_SB(sb)-&gt;s_mount_state &amp; EXT4_FC_REPLAY))</div><div class='add'>+	if (ext4_fc_disabled(sb))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='add'>+	if (handle &amp;&amp; !IS_ERR(handle))</div><div class='add'>+		tid = handle-&gt;h_transaction-&gt;t_tid;</div><div class='add'>+	else {</div><div class='add'>+		read_lock(&amp;sbi-&gt;s_journal-&gt;j_state_lock);</div><div class='add'>+		if (sbi-&gt;s_journal-&gt;j_running_transaction)</div><div class='add'>+			tid = sbi-&gt;s_journal-&gt;j_running_transaction-&gt;t_tid;</div><div class='add'>+		else</div><div class='add'>+			has_transaction = false;</div><div class='add'>+		read_unlock(&amp;sbi-&gt;s_journal-&gt;j_state_lock);</div><div class='add'>+	}</div><div class='add'>+	mutex_lock(&amp;sbi-&gt;s_fc_lock);</div><div class='add'>+	is_ineligible = ext4_test_mount_flag(sb, EXT4_MF_FC_INELIGIBLE);</div><div class='add'>+	if (has_transaction &amp;&amp; (!is_ineligible || tid_gt(tid, sbi-&gt;s_fc_ineligible_tid)))</div><div class='add'>+		sbi-&gt;s_fc_ineligible_tid = tid;</div><div class='add'>+	ext4_set_mount_flag(sb, EXT4_MF_FC_INELIGIBLE);</div><div class='add'>+	mutex_unlock(&amp;sbi-&gt;s_fc_lock);</div><div class='ctx'> 	WARN_ON(reason &gt;= EXT4_FC_REASON_MAX);</div><div class='ctx'> 	sbi-&gt;s_fc_stats.fc_ineligible_reason_count[reason]++;</div><div class='del'>-	atomic_inc(&amp;sbi-&gt;s_fc_ineligible_updates);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Stop a fast commit ineligible update. We set EXT4_MF_FC_INELIGIBLE flag here</div><div class='del'>- * to ensure that after stopping the ineligible update, at least one full</div><div class='del'>- * commit takes place.</div><div class='del'>- */</div><div class='del'>-void ext4_fc_stop_ineligible(struct super_block *sb)</div><div class='del'>-{</div><div class='del'>-	if (!test_opt2(sb, JOURNAL_FAST_COMMIT) ||</div><div class='del'>-	    (EXT4_SB(sb)-&gt;s_mount_state &amp; EXT4_FC_REPLAY))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	ext4_set_mount_flag(sb, EXT4_MF_FC_INELIGIBLE);</div><div class='del'>-	atomic_dec(&amp;EXT4_SB(sb)-&gt;s_fc_ineligible_updates);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline int ext4_fc_is_ineligible(struct super_block *sb)</div><div class='del'>-{</div><div class='del'>-	return (ext4_test_mount_flag(sb, EXT4_MF_FC_INELIGIBLE) ||</div><div class='del'>-		atomic_read(&amp;EXT4_SB(sb)-&gt;s_fc_ineligible_updates));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -378,7 +351,7 @@ static inline int ext4_fc_is_ineligible(struct super_block *sb)</div><div class='ctx'>  */</div><div class='ctx'> static int ext4_fc_track_template(</div><div class='ctx'> 	handle_t *handle, struct inode *inode,</div><div class='del'>-	int (*__fc_track_fn)(struct inode *, void *, bool),</div><div class='add'>+	int (*__fc_track_fn)(handle_t *handle, struct inode *, void *, bool),</div><div class='ctx'> 	void *args, int enqueue)</div><div class='ctx'> {</div><div class='ctx'> 	bool update = false;</div><div class='hunk'>@@ -387,34 +360,27 @@ static int ext4_fc_track_template(</div><div class='ctx'> 	tid_t tid = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (!test_opt2(inode-&gt;i_sb, JOURNAL_FAST_COMMIT) ||</div><div class='del'>-	    (sbi-&gt;s_mount_state &amp; EXT4_FC_REPLAY))</div><div class='del'>-		return -EOPNOTSUPP;</div><div class='del'>-</div><div class='del'>-	if (ext4_fc_is_ineligible(inode-&gt;i_sb))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='ctx'> 	tid = handle-&gt;h_transaction-&gt;t_tid;</div><div class='del'>-	mutex_lock(&amp;ei-&gt;i_fc_lock);</div><div class='add'>+	spin_lock(&amp;ei-&gt;i_fc_lock);</div><div class='ctx'> 	if (tid == ei-&gt;i_sync_tid) {</div><div class='ctx'> 		update = true;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		ext4_fc_reset_inode(inode);</div><div class='ctx'> 		ei-&gt;i_sync_tid = tid;</div><div class='ctx'> 	}</div><div class='del'>-	ret = __fc_track_fn(inode, args, update);</div><div class='del'>-	mutex_unlock(&amp;ei-&gt;i_fc_lock);</div><div class='del'>-</div><div class='add'>+	ret = __fc_track_fn(handle, inode, args, update);</div><div class='add'>+	spin_unlock(&amp;ei-&gt;i_fc_lock);</div><div class='ctx'> 	if (!enqueue)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;sbi-&gt;s_fc_lock);</div><div class='add'>+	mutex_lock(&amp;sbi-&gt;s_fc_lock);</div><div class='ctx'> 	if (list_empty(&amp;EXT4_I(inode)-&gt;i_fc_list))</div><div class='ctx'> 		list_add_tail(&amp;EXT4_I(inode)-&gt;i_fc_list,</div><div class='del'>-				(ext4_test_mount_flag(inode-&gt;i_sb, EXT4_MF_FC_COMMITTING)) ?</div><div class='add'>+				(sbi-&gt;s_journal-&gt;j_flags &amp; JBD2_FULL_COMMIT_ONGOING ||</div><div class='add'>+				 sbi-&gt;s_journal-&gt;j_flags &amp; JBD2_FAST_COMMIT_ONGOING) ?</div><div class='ctx'> 				&amp;sbi-&gt;s_fc_q[FC_Q_STAGING] :</div><div class='ctx'> 				&amp;sbi-&gt;s_fc_q[FC_Q_MAIN]);</div><div class='del'>-	spin_unlock(&amp;sbi-&gt;s_fc_lock);</div><div class='add'>+	mutex_unlock(&amp;sbi-&gt;s_fc_lock);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -425,52 +391,63 @@ struct __track_dentry_update_args {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /* __track_fn for directory entry updates. Called with ei-&gt;i_fc_lock. */</div><div class='del'>-static int __track_dentry_update(struct inode *inode, void *arg, bool update)</div><div class='add'>+static int __track_dentry_update(handle_t *handle, struct inode *inode,</div><div class='add'>+				 void *arg, bool update)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_fc_dentry_update *node;</div><div class='ctx'> 	struct ext4_inode_info *ei = EXT4_I(inode);</div><div class='ctx'> 	struct __track_dentry_update_args *dentry_update =</div><div class='ctx'> 		(struct __track_dentry_update_args *)arg;</div><div class='ctx'> 	struct dentry *dentry = dentry_update-&gt;dentry;</div><div class='del'>-	struct ext4_sb_info *sbi = EXT4_SB(inode-&gt;i_sb);</div><div class='add'>+	struct inode *dir = dentry-&gt;d_parent-&gt;d_inode;</div><div class='add'>+	struct super_block *sb = inode-&gt;i_sb;</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+</div><div class='add'>+	spin_unlock(&amp;ei-&gt;i_fc_lock);</div><div class='add'>+</div><div class='add'>+	if (IS_ENCRYPTED(dir)) {</div><div class='add'>+		ext4_fc_mark_ineligible(sb, EXT4_FC_REASON_ENCRYPTED_FILENAME,</div><div class='add'>+					handle);</div><div class='add'>+		spin_lock(&amp;ei-&gt;i_fc_lock);</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	mutex_unlock(&amp;ei-&gt;i_fc_lock);</div><div class='ctx'> 	node = kmem_cache_alloc(ext4_fc_dentry_cachep, GFP_NOFS);</div><div class='ctx'> 	if (!node) {</div><div class='del'>-		ext4_fc_mark_ineligible(inode-&gt;i_sb, EXT4_FC_REASON_NOMEM);</div><div class='del'>-		mutex_lock(&amp;ei-&gt;i_fc_lock);</div><div class='add'>+		ext4_fc_mark_ineligible(sb, EXT4_FC_REASON_NOMEM, handle);</div><div class='add'>+		spin_lock(&amp;ei-&gt;i_fc_lock);</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	node-&gt;fcd_op = dentry_update-&gt;op;</div><div class='del'>-	node-&gt;fcd_parent = dentry-&gt;d_parent-&gt;d_inode-&gt;i_ino;</div><div class='add'>+	node-&gt;fcd_parent = dir-&gt;i_ino;</div><div class='ctx'> 	node-&gt;fcd_ino = inode-&gt;i_ino;</div><div class='del'>-	if (dentry-&gt;d_name.len &gt; DNAME_INLINE_LEN) {</div><div class='del'>-		node-&gt;fcd_name.name = kmalloc(dentry-&gt;d_name.len, GFP_NOFS);</div><div class='del'>-		if (!node-&gt;fcd_name.name) {</div><div class='del'>-			kmem_cache_free(ext4_fc_dentry_cachep, node);</div><div class='del'>-			ext4_fc_mark_ineligible(inode-&gt;i_sb,</div><div class='del'>-				EXT4_FC_REASON_NOMEM);</div><div class='del'>-			mutex_lock(&amp;ei-&gt;i_fc_lock);</div><div class='del'>-			return -ENOMEM;</div><div class='del'>-		}</div><div class='del'>-		memcpy((u8 *)node-&gt;fcd_name.name, dentry-&gt;d_name.name,</div><div class='del'>-			dentry-&gt;d_name.len);</div><div class='del'>-	} else {</div><div class='del'>-		memcpy(node-&gt;fcd_iname, dentry-&gt;d_name.name,</div><div class='del'>-			dentry-&gt;d_name.len);</div><div class='del'>-		node-&gt;fcd_name.name = node-&gt;fcd_iname;</div><div class='del'>-	}</div><div class='del'>-	node-&gt;fcd_name.len = dentry-&gt;d_name.len;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;sbi-&gt;s_fc_lock);</div><div class='del'>-	if (ext4_test_mount_flag(inode-&gt;i_sb, EXT4_MF_FC_COMMITTING))</div><div class='add'>+	take_dentry_name_snapshot(&amp;node-&gt;fcd_name, dentry);</div><div class='add'>+	INIT_LIST_HEAD(&amp;node-&gt;fcd_dilist);</div><div class='add'>+	INIT_LIST_HEAD(&amp;node-&gt;fcd_list);</div><div class='add'>+	mutex_lock(&amp;sbi-&gt;s_fc_lock);</div><div class='add'>+	if (sbi-&gt;s_journal-&gt;j_flags &amp; JBD2_FULL_COMMIT_ONGOING ||</div><div class='add'>+		sbi-&gt;s_journal-&gt;j_flags &amp; JBD2_FAST_COMMIT_ONGOING)</div><div class='ctx'> 		list_add_tail(&amp;node-&gt;fcd_list,</div><div class='ctx'> 				&amp;sbi-&gt;s_fc_dentry_q[FC_Q_STAGING]);</div><div class='ctx'> 	else</div><div class='ctx'> 		list_add_tail(&amp;node-&gt;fcd_list, &amp;sbi-&gt;s_fc_dentry_q[FC_Q_MAIN]);</div><div class='del'>-	spin_unlock(&amp;sbi-&gt;s_fc_lock);</div><div class='del'>-	mutex_lock(&amp;ei-&gt;i_fc_lock);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This helps us keep a track of all fc_dentry updates which is part of</div><div class='add'>+	 * this ext4 inode. So in case the inode is getting unlinked, before</div><div class='add'>+	 * even we get a chance to fsync, we could remove all fc_dentry</div><div class='add'>+	 * references while evicting the inode in ext4_fc_del().</div><div class='add'>+	 * Also with this, we don't need to loop over all the inodes in</div><div class='add'>+	 * sbi-&gt;s_fc_q to get the corresponding inode in</div><div class='add'>+	 * ext4_fc_commit_dentry_updates().</div><div class='add'>+	 */</div><div class='add'>+	if (dentry_update-&gt;op == EXT4_FC_TAG_CREAT) {</div><div class='add'>+		WARN_ON(!list_empty(&amp;ei-&gt;i_fc_dilist));</div><div class='add'>+		list_add_tail(&amp;node-&gt;fcd_dilist, &amp;ei-&gt;i_fc_dilist);</div><div class='add'>+	}</div><div class='add'>+	mutex_unlock(&amp;sbi-&gt;s_fc_lock);</div><div class='add'>+	spin_lock(&amp;ei-&gt;i_fc_lock);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -486,12 +463,20 @@ void __ext4_fc_track_unlink(handle_t *handle,</div><div class='ctx'> </div><div class='ctx'> 	ret = ext4_fc_track_template(handle, inode, __track_dentry_update,</div><div class='ctx'> 					(void *)&amp;args, 0);</div><div class='del'>-	trace_ext4_fc_track_unlink(inode, dentry, ret);</div><div class='add'>+	trace_ext4_fc_track_unlink(handle, inode, dentry, ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void ext4_fc_track_unlink(handle_t *handle, struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	__ext4_fc_track_unlink(handle, d_inode(dentry), dentry);</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='add'>+</div><div class='add'>+	if (ext4_fc_disabled(inode-&gt;i_sb))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (ext4_test_mount_flag(inode-&gt;i_sb, EXT4_MF_FC_INELIGIBLE))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	__ext4_fc_track_unlink(handle, inode, dentry);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void __ext4_fc_track_link(handle_t *handle,</div><div class='hunk'>@@ -505,12 +490,20 @@ void __ext4_fc_track_link(handle_t *handle,</div><div class='ctx'> </div><div class='ctx'> 	ret = ext4_fc_track_template(handle, inode, __track_dentry_update,</div><div class='ctx'> 					(void *)&amp;args, 0);</div><div class='del'>-	trace_ext4_fc_track_link(inode, dentry, ret);</div><div class='add'>+	trace_ext4_fc_track_link(handle, inode, dentry, ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void ext4_fc_track_link(handle_t *handle, struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	__ext4_fc_track_link(handle, d_inode(dentry), dentry);</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='add'>+</div><div class='add'>+	if (ext4_fc_disabled(inode-&gt;i_sb))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (ext4_test_mount_flag(inode-&gt;i_sb, EXT4_MF_FC_INELIGIBLE))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	__ext4_fc_track_link(handle, inode, dentry);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void __ext4_fc_track_create(handle_t *handle, struct inode *inode,</div><div class='hunk'>@@ -524,16 +517,25 @@ void __ext4_fc_track_create(handle_t *handle, struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 	ret = ext4_fc_track_template(handle, inode, __track_dentry_update,</div><div class='ctx'> 					(void *)&amp;args, 0);</div><div class='del'>-	trace_ext4_fc_track_create(inode, dentry, ret);</div><div class='add'>+	trace_ext4_fc_track_create(handle, inode, dentry, ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void ext4_fc_track_create(handle_t *handle, struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	__ext4_fc_track_create(handle, d_inode(dentry), dentry);</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='add'>+</div><div class='add'>+	if (ext4_fc_disabled(inode-&gt;i_sb))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (ext4_test_mount_flag(inode-&gt;i_sb, EXT4_MF_FC_INELIGIBLE))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	__ext4_fc_track_create(handle, inode, dentry);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* __track_fn for inode tracking */</div><div class='del'>-static int __track_inode(struct inode *inode, void *arg, bool update)</div><div class='add'>+static int __track_inode(handle_t *handle, struct inode *inode, void *arg,</div><div class='add'>+			 bool update)</div><div class='ctx'> {</div><div class='ctx'> 	if (update)</div><div class='ctx'> 		return -EEXIST;</div><div class='hunk'>@@ -545,19 +547,56 @@ static int __track_inode(struct inode *inode, void *arg, bool update)</div><div class='ctx'> </div><div class='ctx'> void ext4_fc_track_inode(handle_t *handle, struct inode *inode)</div><div class='ctx'> {</div><div class='add'>+	struct ext4_inode_info *ei = EXT4_I(inode);</div><div class='add'>+	wait_queue_head_t *wq;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (S_ISDIR(inode-&gt;i_mode))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='add'>+	if (ext4_fc_disabled(inode-&gt;i_sb))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='ctx'> 	if (ext4_should_journal_data(inode)) {</div><div class='ctx'> 		ext4_fc_mark_ineligible(inode-&gt;i_sb,</div><div class='del'>-					EXT4_FC_REASON_INODE_JOURNAL_DATA);</div><div class='add'>+					EXT4_FC_REASON_INODE_JOURNAL_DATA, handle);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (ext4_test_mount_flag(inode-&gt;i_sb, EXT4_MF_FC_INELIGIBLE))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If we come here, we may sleep while waiting for the inode to</div><div class='add'>+	 * commit. We shouldn't be holding i_data_sem when we go to sleep since</div><div class='add'>+	 * the commit path needs to grab the lock while committing the inode.</div><div class='add'>+	 */</div><div class='add'>+	lockdep_assert_not_held(&amp;ei-&gt;i_data_sem);</div><div class='add'>+</div><div class='add'>+	while (ext4_test_inode_state(inode, EXT4_STATE_FC_COMMITTING)) {</div><div class='add'>+#if (BITS_PER_LONG &lt; 64)</div><div class='add'>+		DEFINE_WAIT_BIT(wait, &amp;ei-&gt;i_state_flags,</div><div class='add'>+				EXT4_STATE_FC_COMMITTING);</div><div class='add'>+		wq = bit_waitqueue(&amp;ei-&gt;i_state_flags,</div><div class='add'>+				   EXT4_STATE_FC_COMMITTING);</div><div class='add'>+#else</div><div class='add'>+		DEFINE_WAIT_BIT(wait, &amp;ei-&gt;i_flags,</div><div class='add'>+				EXT4_STATE_FC_COMMITTING);</div><div class='add'>+		wq = bit_waitqueue(&amp;ei-&gt;i_flags,</div><div class='add'>+				   EXT4_STATE_FC_COMMITTING);</div><div class='add'>+#endif</div><div class='add'>+		prepare_to_wait(wq, &amp;wait.wq_entry, TASK_UNINTERRUPTIBLE);</div><div class='add'>+		if (ext4_test_inode_state(inode, EXT4_STATE_FC_COMMITTING))</div><div class='add'>+			schedule();</div><div class='add'>+		finish_wait(wq, &amp;wait.wq_entry);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * From this point on, this inode will not be committed either</div><div class='add'>+	 * by fast or full commit as long as the handle is open.</div><div class='add'>+	 */</div><div class='ctx'> 	ret = ext4_fc_track_template(handle, inode, __track_inode, NULL, 1);</div><div class='del'>-	trace_ext4_fc_track_inode(inode, ret);</div><div class='add'>+	trace_ext4_fc_track_inode(handle, inode, ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct __track_range_args {</div><div class='hunk'>@@ -565,7 +604,8 @@ struct __track_range_args {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /* __track_fn for tracking data updates */</div><div class='del'>-static int __track_range(struct inode *inode, void *arg, bool update)</div><div class='add'>+static int __track_range(handle_t *handle, struct inode *inode, void *arg,</div><div class='add'>+			 bool update)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_inode_info *ei = EXT4_I(inode);</div><div class='ctx'> 	ext4_lblk_t oldstart;</div><div class='hunk'>@@ -601,17 +641,29 @@ void ext4_fc_track_range(handle_t *handle, struct inode *inode, ext4_lblk_t star</div><div class='ctx'> 	if (S_ISDIR(inode-&gt;i_mode))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='add'>+	if (ext4_fc_disabled(inode-&gt;i_sb))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (ext4_test_mount_flag(inode-&gt;i_sb, EXT4_MF_FC_INELIGIBLE))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (ext4_has_inline_data(inode)) {</div><div class='add'>+		ext4_fc_mark_ineligible(inode-&gt;i_sb, EXT4_FC_REASON_XATTR,</div><div class='add'>+					handle);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	args.start = start;</div><div class='ctx'> 	args.end = end;</div><div class='ctx'> </div><div class='ctx'> 	ret = ext4_fc_track_template(handle, inode,  __track_range, &amp;args, 1);</div><div class='ctx'> </div><div class='del'>-	trace_ext4_fc_track_range(inode, start, end, ret);</div><div class='add'>+	trace_ext4_fc_track_range(handle, inode, start, end, ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void ext4_fc_submit_bh(struct super_block *sb, bool is_tail)</div><div class='ctx'> {</div><div class='del'>-	int write_flags = REQ_SYNC;</div><div class='add'>+	blk_opf_t write_flags = JBD2_JOURNAL_REQ_FLAGS;</div><div class='ctx'> 	struct buffer_head *bh = EXT4_SB(sb)-&gt;s_fc_bh;</div><div class='ctx'> </div><div class='ctx'> 	/* Add REQ_FUA | REQ_PREFLUSH only its tail */</div><div class='hunk'>@@ -621,24 +673,12 @@ static void ext4_fc_submit_bh(struct super_block *sb, bool is_tail)</div><div class='ctx'> 	set_buffer_dirty(bh);</div><div class='ctx'> 	set_buffer_uptodate(bh);</div><div class='ctx'> 	bh-&gt;b_end_io = ext4_end_buffer_io_sync;</div><div class='del'>-	submit_bh(REQ_OP_WRITE, write_flags, bh);</div><div class='add'>+	submit_bh(REQ_OP_WRITE | write_flags, bh);</div><div class='ctx'> 	EXT4_SB(sb)-&gt;s_fc_bh = NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Ext4 commit path routines */</div><div class='ctx'> </div><div class='del'>-/* memzero and update CRC */</div><div class='del'>-static void *ext4_fc_memzero(struct super_block *sb, void *dst, int len,</div><div class='del'>-				u32 *crc)</div><div class='del'>-{</div><div class='del'>-	void *ret;</div><div class='del'>-</div><div class='del'>-	ret = memset(dst, 0, len);</div><div class='del'>-	if (crc)</div><div class='del'>-		*crc = ext4_chksum(EXT4_SB(sb), *crc, dst, len);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Allocate len bytes on a fast commit buffer.</div><div class='ctx'>  *</div><div class='hunk'>@@ -652,62 +692,60 @@ static void *ext4_fc_memzero(struct super_block *sb, void *dst, int len,</div><div class='ctx'>  */</div><div class='ctx'> static u8 *ext4_fc_reserve_space(struct super_block *sb, int len, u32 *crc)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_fc_tl *tl;</div><div class='add'>+	struct ext4_fc_tl tl;</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> 	int bsize = sbi-&gt;s_journal-&gt;j_blocksize;</div><div class='ctx'> 	int ret, off = sbi-&gt;s_fc_bytes % bsize;</div><div class='del'>-	int pad_len;</div><div class='add'>+	int remaining;</div><div class='add'>+	u8 *dst;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * After allocating len, we should have space at least for a 0 byte</div><div class='del'>-	 * padding.</div><div class='add'>+	 * If 'len' is too long to fit in any block alongside a PAD tlv, then we</div><div class='add'>+	 * cannot fulfill the request.</div><div class='ctx'> 	 */</div><div class='del'>-	if (len + sizeof(struct ext4_fc_tl) &gt; bsize)</div><div class='add'>+	if (len &gt; bsize - EXT4_FC_TAG_BASE_LEN)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='del'>-	if (bsize - off - 1 &gt; len + sizeof(struct ext4_fc_tl)) {</div><div class='del'>-		/*</div><div class='del'>-		 * Only allocate from current buffer if we have enough space for</div><div class='del'>-		 * this request AND we have space to add a zero byte padding.</div><div class='del'>-		 */</div><div class='del'>-		if (!sbi-&gt;s_fc_bh) {</div><div class='del'>-			ret = jbd2_fc_get_buf(EXT4_SB(sb)-&gt;s_journal, &amp;bh);</div><div class='del'>-			if (ret)</div><div class='del'>-				return NULL;</div><div class='del'>-			sbi-&gt;s_fc_bh = bh;</div><div class='del'>-		}</div><div class='add'>+	if (!sbi-&gt;s_fc_bh) {</div><div class='add'>+		ret = jbd2_fc_get_buf(EXT4_SB(sb)-&gt;s_journal, &amp;bh);</div><div class='add'>+		if (ret)</div><div class='add'>+			return NULL;</div><div class='add'>+		sbi-&gt;s_fc_bh = bh;</div><div class='add'>+	}</div><div class='add'>+	dst = sbi-&gt;s_fc_bh-&gt;b_data + off;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Allocate the bytes in the current block if we can do so while still</div><div class='add'>+	 * leaving enough space for a PAD tlv.</div><div class='add'>+	 */</div><div class='add'>+	remaining = bsize - EXT4_FC_TAG_BASE_LEN - off;</div><div class='add'>+	if (len &lt;= remaining) {</div><div class='ctx'> 		sbi-&gt;s_fc_bytes += len;</div><div class='del'>-		return sbi-&gt;s_fc_bh-&gt;b_data + off;</div><div class='del'>-	}</div><div class='del'>-	/* Need to add PAD tag */</div><div class='del'>-	tl = (struct ext4_fc_tl *)(sbi-&gt;s_fc_bh-&gt;b_data + off);</div><div class='del'>-	tl-&gt;fc_tag = cpu_to_le16(EXT4_FC_TAG_PAD);</div><div class='del'>-	pad_len = bsize - off - 1 - sizeof(struct ext4_fc_tl);</div><div class='del'>-	tl-&gt;fc_len = cpu_to_le16(pad_len);</div><div class='del'>-	if (crc)</div><div class='del'>-		*crc = ext4_chksum(sbi, *crc, tl, sizeof(*tl));</div><div class='del'>-	if (pad_len &gt; 0)</div><div class='del'>-		ext4_fc_memzero(sb, tl + 1, pad_len, crc);</div><div class='add'>+		return dst;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Else, terminate the current block with a PAD tlv, then allocate a new</div><div class='add'>+	 * block and allocate the bytes at the start of that new block.</div><div class='add'>+	 */</div><div class='add'>+</div><div class='add'>+	tl.fc_tag = cpu_to_le16(EXT4_FC_TAG_PAD);</div><div class='add'>+	tl.fc_len = cpu_to_le16(remaining);</div><div class='add'>+	memcpy(dst, &amp;tl, EXT4_FC_TAG_BASE_LEN);</div><div class='add'>+	memset(dst + EXT4_FC_TAG_BASE_LEN, 0, remaining);</div><div class='add'>+	*crc = ext4_chksum(*crc, sbi-&gt;s_fc_bh-&gt;b_data, bsize);</div><div class='add'>+</div><div class='ctx'> 	ext4_fc_submit_bh(sb, false);</div><div class='ctx'> </div><div class='ctx'> 	ret = jbd2_fc_get_buf(EXT4_SB(sb)-&gt;s_journal, &amp;bh);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	sbi-&gt;s_fc_bh = bh;</div><div class='del'>-	sbi-&gt;s_fc_bytes = (sbi-&gt;s_fc_bytes / bsize + 1) * bsize + len;</div><div class='add'>+	sbi-&gt;s_fc_bytes += bsize - off + len;</div><div class='ctx'> 	return sbi-&gt;s_fc_bh-&gt;b_data;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* memcpy to fc reserved space and update CRC */</div><div class='del'>-static void *ext4_fc_memcpy(struct super_block *sb, void *dst, const void *src,</div><div class='del'>-				int len, u32 *crc)</div><div class='del'>-{</div><div class='del'>-	if (crc)</div><div class='del'>-		*crc = ext4_chksum(EXT4_SB(sb), *crc, src, len);</div><div class='del'>-	return memcpy(dst, src, len);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Complete a fast commit by writing tail tag.</div><div class='ctx'>  *</div><div class='hunk'>@@ -728,23 +766,27 @@ static int ext4_fc_write_tail(struct super_block *sb, u32 crc)</div><div class='ctx'> 	 * ext4_fc_reserve_space takes care of allocating an extra block if</div><div class='ctx'> 	 * there's no enough space on this block for accommodating this tail.</div><div class='ctx'> 	 */</div><div class='del'>-	dst = ext4_fc_reserve_space(sb, sizeof(tl) + sizeof(tail), &amp;crc);</div><div class='add'>+	dst = ext4_fc_reserve_space(sb, EXT4_FC_TAG_BASE_LEN + sizeof(tail), &amp;crc);</div><div class='ctx'> 	if (!dst)</div><div class='ctx'> 		return -ENOSPC;</div><div class='ctx'> </div><div class='ctx'> 	off = sbi-&gt;s_fc_bytes % bsize;</div><div class='ctx'> </div><div class='ctx'> 	tl.fc_tag = cpu_to_le16(EXT4_FC_TAG_TAIL);</div><div class='del'>-	tl.fc_len = cpu_to_le16(bsize - off - 1 + sizeof(struct ext4_fc_tail));</div><div class='add'>+	tl.fc_len = cpu_to_le16(bsize - off + sizeof(struct ext4_fc_tail));</div><div class='ctx'> 	sbi-&gt;s_fc_bytes = round_up(sbi-&gt;s_fc_bytes, bsize);</div><div class='ctx'> </div><div class='del'>-	ext4_fc_memcpy(sb, dst, &amp;tl, sizeof(tl), &amp;crc);</div><div class='del'>-	dst += sizeof(tl);</div><div class='add'>+	memcpy(dst, &amp;tl, EXT4_FC_TAG_BASE_LEN);</div><div class='add'>+	dst += EXT4_FC_TAG_BASE_LEN;</div><div class='ctx'> 	tail.fc_tid = cpu_to_le32(sbi-&gt;s_journal-&gt;j_running_transaction-&gt;t_tid);</div><div class='del'>-	ext4_fc_memcpy(sb, dst, &amp;tail.fc_tid, sizeof(tail.fc_tid), &amp;crc);</div><div class='add'>+	memcpy(dst, &amp;tail.fc_tid, sizeof(tail.fc_tid));</div><div class='ctx'> 	dst += sizeof(tail.fc_tid);</div><div class='add'>+	crc = ext4_chksum(crc, sbi-&gt;s_fc_bh-&gt;b_data,</div><div class='add'>+			  dst - (u8 *)sbi-&gt;s_fc_bh-&gt;b_data);</div><div class='ctx'> 	tail.fc_crc = cpu_to_le32(crc);</div><div class='del'>-	ext4_fc_memcpy(sb, dst, &amp;tail.fc_crc, sizeof(tail.fc_crc), NULL);</div><div class='add'>+	memcpy(dst, &amp;tail.fc_crc, sizeof(tail.fc_crc));</div><div class='add'>+	dst += sizeof(tail.fc_crc);</div><div class='add'>+	memset(dst, 0, bsize - off); /* Don't leak uninitialized memory. */</div><div class='ctx'> </div><div class='ctx'> 	ext4_fc_submit_bh(sb, true);</div><div class='ctx'> </div><div class='hunk'>@@ -761,15 +803,15 @@ static bool ext4_fc_add_tlv(struct super_block *sb, u16 tag, u16 len, u8 *val,</div><div class='ctx'> 	struct ext4_fc_tl tl;</div><div class='ctx'> 	u8 *dst;</div><div class='ctx'> </div><div class='del'>-	dst = ext4_fc_reserve_space(sb, sizeof(tl) + len, crc);</div><div class='add'>+	dst = ext4_fc_reserve_space(sb, EXT4_FC_TAG_BASE_LEN + len, crc);</div><div class='ctx'> 	if (!dst)</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='ctx'> 	tl.fc_tag = cpu_to_le16(tag);</div><div class='ctx'> 	tl.fc_len = cpu_to_le16(len);</div><div class='ctx'> </div><div class='del'>-	ext4_fc_memcpy(sb, dst, &amp;tl, sizeof(tl), crc);</div><div class='del'>-	ext4_fc_memcpy(sb, dst + sizeof(tl), val, len, crc);</div><div class='add'>+	memcpy(dst, &amp;tl, EXT4_FC_TAG_BASE_LEN);</div><div class='add'>+	memcpy(dst + EXT4_FC_TAG_BASE_LEN, val, len);</div><div class='ctx'> </div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='hunk'>@@ -780,9 +822,9 @@ static bool ext4_fc_add_dentry_tlv(struct super_block *sb, u32 *crc,</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_fc_dentry_info fcd;</div><div class='ctx'> 	struct ext4_fc_tl tl;</div><div class='del'>-	int dlen = fc_dentry-&gt;fcd_name.len;</div><div class='del'>-	u8 *dst = ext4_fc_reserve_space(sb, sizeof(tl) + sizeof(fcd) + dlen,</div><div class='del'>-					crc);</div><div class='add'>+	int dlen = fc_dentry-&gt;fcd_name.name.len;</div><div class='add'>+	u8 *dst = ext4_fc_reserve_space(sb,</div><div class='add'>+			EXT4_FC_TAG_BASE_LEN + sizeof(fcd) + dlen, crc);</div><div class='ctx'> </div><div class='ctx'> 	if (!dst)</div><div class='ctx'> 		return false;</div><div class='hunk'>@@ -791,12 +833,11 @@ static bool ext4_fc_add_dentry_tlv(struct super_block *sb, u32 *crc,</div><div class='ctx'> 	fcd.fc_ino = cpu_to_le32(fc_dentry-&gt;fcd_ino);</div><div class='ctx'> 	tl.fc_tag = cpu_to_le16(fc_dentry-&gt;fcd_op);</div><div class='ctx'> 	tl.fc_len = cpu_to_le16(sizeof(fcd) + dlen);</div><div class='del'>-	ext4_fc_memcpy(sb, dst, &amp;tl, sizeof(tl), crc);</div><div class='del'>-	dst += sizeof(tl);</div><div class='del'>-	ext4_fc_memcpy(sb, dst, &amp;fcd, sizeof(fcd), crc);</div><div class='add'>+	memcpy(dst, &amp;tl, EXT4_FC_TAG_BASE_LEN);</div><div class='add'>+	dst += EXT4_FC_TAG_BASE_LEN;</div><div class='add'>+	memcpy(dst, &amp;fcd, sizeof(fcd));</div><div class='ctx'> 	dst += sizeof(fcd);</div><div class='del'>-	ext4_fc_memcpy(sb, dst, fc_dentry-&gt;fcd_name.name, dlen, crc);</div><div class='del'>-	dst += dlen;</div><div class='add'>+	memcpy(dst, fc_dentry-&gt;fcd_name.name.name, dlen);</div><div class='ctx'> </div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='hunk'>@@ -828,22 +869,21 @@ static int ext4_fc_write_inode(struct inode *inode, u32 *crc)</div><div class='ctx'> 	tl.fc_tag = cpu_to_le16(EXT4_FC_TAG_INODE);</div><div class='ctx'> 	tl.fc_len = cpu_to_le16(inode_len + sizeof(fc_inode.fc_ino));</div><div class='ctx'> </div><div class='add'>+	ret = -ECANCELED;</div><div class='ctx'> 	dst = ext4_fc_reserve_space(inode-&gt;i_sb,</div><div class='del'>-			sizeof(tl) + inode_len + sizeof(fc_inode.fc_ino), crc);</div><div class='add'>+		EXT4_FC_TAG_BASE_LEN + inode_len + sizeof(fc_inode.fc_ino), crc);</div><div class='ctx'> 	if (!dst)</div><div class='del'>-		return -ECANCELED;</div><div class='add'>+		goto err;</div><div class='ctx'> </div><div class='del'>-	if (!ext4_fc_memcpy(inode-&gt;i_sb, dst, &amp;tl, sizeof(tl), crc))</div><div class='del'>-		return -ECANCELED;</div><div class='del'>-	dst += sizeof(tl);</div><div class='del'>-	if (!ext4_fc_memcpy(inode-&gt;i_sb, dst, &amp;fc_inode, sizeof(fc_inode), crc))</div><div class='del'>-		return -ECANCELED;</div><div class='add'>+	memcpy(dst, &amp;tl, EXT4_FC_TAG_BASE_LEN);</div><div class='add'>+	dst += EXT4_FC_TAG_BASE_LEN;</div><div class='add'>+	memcpy(dst, &amp;fc_inode, sizeof(fc_inode));</div><div class='ctx'> 	dst += sizeof(fc_inode);</div><div class='del'>-	if (!ext4_fc_memcpy(inode-&gt;i_sb, dst, (u8 *)ext4_raw_inode(&amp;iloc),</div><div class='del'>-					inode_len, crc))</div><div class='del'>-		return -ECANCELED;</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='add'>+	memcpy(dst, (u8 *)ext4_raw_inode(&amp;iloc), inode_len);</div><div class='add'>+	ret = 0;</div><div class='add'>+err:</div><div class='add'>+	brelse(iloc.bh);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -860,24 +900,26 @@ static int ext4_fc_write_inode_data(struct inode *inode, u32 *crc)</div><div class='ctx'> 	struct ext4_extent *ex;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;ei-&gt;i_fc_lock);</div><div class='add'>+	spin_lock(&amp;ei-&gt;i_fc_lock);</div><div class='ctx'> 	if (ei-&gt;i_fc_lblk_len == 0) {</div><div class='del'>-		mutex_unlock(&amp;ei-&gt;i_fc_lock);</div><div class='add'>+		spin_unlock(&amp;ei-&gt;i_fc_lock);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> 	old_blk_size = ei-&gt;i_fc_lblk_start;</div><div class='ctx'> 	new_blk_size = ei-&gt;i_fc_lblk_start + ei-&gt;i_fc_lblk_len - 1;</div><div class='ctx'> 	ei-&gt;i_fc_lblk_len = 0;</div><div class='del'>-	mutex_unlock(&amp;ei-&gt;i_fc_lock);</div><div class='add'>+	spin_unlock(&amp;ei-&gt;i_fc_lock);</div><div class='ctx'> </div><div class='ctx'> 	cur_lblk_off = old_blk_size;</div><div class='del'>-	jbd_debug(1, "%s: will try writing %d to %d for inode %ld\n",</div><div class='del'>-		  __func__, cur_lblk_off, new_blk_size, inode-&gt;i_ino);</div><div class='add'>+	ext4_debug("will try writing %d to %d for inode %ld\n",</div><div class='add'>+		   cur_lblk_off, new_blk_size, inode-&gt;i_ino);</div><div class='ctx'> </div><div class='ctx'> 	while (cur_lblk_off &lt;= new_blk_size) {</div><div class='ctx'> 		map.m_lblk = cur_lblk_off;</div><div class='ctx'> 		map.m_len = new_blk_size - cur_lblk_off + 1;</div><div class='del'>-		ret = ext4_map_blocks(NULL, inode, &amp;map, 0);</div><div class='add'>+		ret = ext4_map_blocks(NULL, inode, &amp;map,</div><div class='add'>+				      EXT4_GET_BLOCKS_IO_SUBMIT |</div><div class='add'>+				      EXT4_EX_NOCACHE);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			return -ECANCELED;</div><div class='ctx'> </div><div class='hunk'>@@ -921,76 +963,37 @@ static int ext4_fc_write_inode_data(struct inode *inode, u32 *crc)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> </div><div class='del'>-/* Submit data for all the fast commit inodes */</div><div class='del'>-static int ext4_fc_submit_inode_data_all(journal_t *journal)</div><div class='add'>+/* Flushes data of all the inodes in the commit queue. */</div><div class='add'>+static int ext4_fc_flush_data(journal_t *journal)</div><div class='ctx'> {</div><div class='del'>-	struct super_block *sb = (struct super_block *)(journal-&gt;j_private);</div><div class='add'>+	struct super_block *sb = journal-&gt;j_private;</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> 	struct ext4_inode_info *ei;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;sbi-&gt;s_fc_lock);</div><div class='del'>-	ext4_set_mount_flag(sb, EXT4_MF_FC_COMMITTING);</div><div class='ctx'> 	list_for_each_entry(ei, &amp;sbi-&gt;s_fc_q[FC_Q_MAIN], i_fc_list) {</div><div class='del'>-		ext4_set_inode_state(&amp;ei-&gt;vfs_inode, EXT4_STATE_FC_COMMITTING);</div><div class='del'>-		while (atomic_read(&amp;ei-&gt;i_fc_updates)) {</div><div class='del'>-			DEFINE_WAIT(wait);</div><div class='del'>-</div><div class='del'>-			prepare_to_wait(&amp;ei-&gt;i_fc_wait, &amp;wait,</div><div class='del'>-						TASK_UNINTERRUPTIBLE);</div><div class='del'>-			if (atomic_read(&amp;ei-&gt;i_fc_updates)) {</div><div class='del'>-				spin_unlock(&amp;sbi-&gt;s_fc_lock);</div><div class='del'>-				schedule();</div><div class='del'>-				spin_lock(&amp;sbi-&gt;s_fc_lock);</div><div class='del'>-			}</div><div class='del'>-			finish_wait(&amp;ei-&gt;i_fc_wait, &amp;wait);</div><div class='del'>-		}</div><div class='del'>-		spin_unlock(&amp;sbi-&gt;s_fc_lock);</div><div class='del'>-		ret = jbd2_submit_inode_data(ei-&gt;jinode);</div><div class='add'>+		ret = jbd2_submit_inode_data(journal, ei-&gt;jinode);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='del'>-		spin_lock(&amp;sbi-&gt;s_fc_lock);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;sbi-&gt;s_fc_lock);</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='ctx'> </div><div class='del'>-/* Wait for completion of data for all the fast commit inodes */</div><div class='del'>-static int ext4_fc_wait_inode_data_all(journal_t *journal)</div><div class='del'>-{</div><div class='del'>-	struct super_block *sb = (struct super_block *)(journal-&gt;j_private);</div><div class='del'>-	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='del'>-	struct ext4_inode_info *pos, *n;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;sbi-&gt;s_fc_lock);</div><div class='del'>-	list_for_each_entry_safe(pos, n, &amp;sbi-&gt;s_fc_q[FC_Q_MAIN], i_fc_list) {</div><div class='del'>-		if (!ext4_test_inode_state(&amp;pos-&gt;vfs_inode,</div><div class='del'>-					   EXT4_STATE_FC_COMMITTING))</div><div class='del'>-			continue;</div><div class='del'>-		spin_unlock(&amp;sbi-&gt;s_fc_lock);</div><div class='del'>-</div><div class='del'>-		ret = jbd2_wait_inode_data(journal, pos-&gt;jinode);</div><div class='add'>+	list_for_each_entry(ei, &amp;sbi-&gt;s_fc_q[FC_Q_MAIN], i_fc_list) {</div><div class='add'>+		ret = jbd2_wait_inode_data(journal, ei-&gt;jinode);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='del'>-		spin_lock(&amp;sbi-&gt;s_fc_lock);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;sbi-&gt;s_fc_lock);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Commit all the directory entry updates */</div><div class='ctx'> static int ext4_fc_commit_dentry_updates(journal_t *journal, u32 *crc)</div><div class='del'>-__acquires(&amp;sbi-&gt;s_fc_lock)</div><div class='del'>-__releases(&amp;sbi-&gt;s_fc_lock)</div><div class='ctx'> {</div><div class='del'>-	struct super_block *sb = (struct super_block *)(journal-&gt;j_private);</div><div class='add'>+	struct super_block *sb = journal-&gt;j_private;</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> 	struct ext4_fc_dentry_update *fc_dentry, *fc_dentry_n;</div><div class='ctx'> 	struct inode *inode;</div><div class='del'>-	struct ext4_inode_info *ei, *ei_n;</div><div class='add'>+	struct ext4_inode_info *ei;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (list_empty(&amp;sbi-&gt;s_fc_dentry_q[FC_Q_MAIN]))</div><div class='hunk'>@@ -998,30 +1001,21 @@ __releases(&amp;sbi-&gt;s_fc_lock)</div><div class='ctx'> 	list_for_each_entry_safe(fc_dentry, fc_dentry_n,</div><div class='ctx'> 				 &amp;sbi-&gt;s_fc_dentry_q[FC_Q_MAIN], fcd_list) {</div><div class='ctx'> 		if (fc_dentry-&gt;fcd_op != EXT4_FC_TAG_CREAT) {</div><div class='del'>-			spin_unlock(&amp;sbi-&gt;s_fc_lock);</div><div class='del'>-			if (!ext4_fc_add_dentry_tlv(sb, crc, fc_dentry)) {</div><div class='del'>-				ret = -ENOSPC;</div><div class='del'>-				goto lock_and_exit;</div><div class='del'>-			}</div><div class='del'>-			spin_lock(&amp;sbi-&gt;s_fc_lock);</div><div class='add'>+			if (!ext4_fc_add_dentry_tlv(sb, crc, fc_dentry))</div><div class='add'>+				return -ENOSPC;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='del'>-</div><div class='del'>-		inode = NULL;</div><div class='del'>-		list_for_each_entry_safe(ei, ei_n, &amp;sbi-&gt;s_fc_q[FC_Q_MAIN],</div><div class='del'>-					 i_fc_list) {</div><div class='del'>-			if (ei-&gt;vfs_inode.i_ino == fc_dentry-&gt;fcd_ino) {</div><div class='del'>-				inode = &amp;ei-&gt;vfs_inode;</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='ctx'> 		/*</div><div class='del'>-		 * If we don't find inode in our list, then it was deleted,</div><div class='del'>-		 * in which case, we don't need to record it's create tag.</div><div class='add'>+		 * With fcd_dilist we need not loop in sbi-&gt;s_fc_q to get the</div><div class='add'>+		 * corresponding inode. Also, the corresponding inode could have been</div><div class='add'>+		 * deleted, in which case, we don't need to do anything.</div><div class='ctx'> 		 */</div><div class='del'>-		if (!inode)</div><div class='add'>+		if (list_empty(&amp;fc_dentry-&gt;fcd_dilist))</div><div class='ctx'> 			continue;</div><div class='del'>-		spin_unlock(&amp;sbi-&gt;s_fc_lock);</div><div class='add'>+		ei = list_first_entry(&amp;fc_dentry-&gt;fcd_dilist,</div><div class='add'>+				struct ext4_inode_info, i_fc_dilist);</div><div class='add'>+		inode = &amp;ei-&gt;vfs_inode;</div><div class='add'>+		WARN_ON(inode-&gt;i_ino != fc_dentry-&gt;fcd_ino);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We first write the inode and then the create dirent. This</div><div class='hunk'>@@ -1032,28 +1026,19 @@ __releases(&amp;sbi-&gt;s_fc_lock)</div><div class='ctx'> 		 */</div><div class='ctx'> 		ret = ext4_fc_write_inode(inode, crc);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			goto lock_and_exit;</div><div class='del'>-</div><div class='add'>+			return ret;</div><div class='ctx'> 		ret = ext4_fc_write_inode_data(inode, crc);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			goto lock_and_exit;</div><div class='del'>-</div><div class='del'>-		if (!ext4_fc_add_dentry_tlv(sb, crc, fc_dentry)) {</div><div class='del'>-			ret = -ENOSPC;</div><div class='del'>-			goto lock_and_exit;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		spin_lock(&amp;sbi-&gt;s_fc_lock);</div><div class='add'>+			return ret;</div><div class='add'>+		if (!ext4_fc_add_dentry_tlv(sb, crc, fc_dentry))</div><div class='add'>+			return -ENOSPC;</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='del'>-lock_and_exit:</div><div class='del'>-	spin_lock(&amp;sbi-&gt;s_fc_lock);</div><div class='del'>-	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ext4_fc_perform_commit(journal_t *journal)</div><div class='ctx'> {</div><div class='del'>-	struct super_block *sb = (struct super_block *)(journal-&gt;j_private);</div><div class='add'>+	struct super_block *sb = journal-&gt;j_private;</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> 	struct ext4_inode_info *iter;</div><div class='ctx'> 	struct ext4_fc_head head;</div><div class='hunk'>@@ -1062,26 +1047,81 @@ static int ext4_fc_perform_commit(journal_t *journal)</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	u32 crc = 0;</div><div class='ctx'> </div><div class='del'>-	ret = ext4_fc_submit_inode_data_all(journal);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='add'>+	/*</div><div class='add'>+	 * Step 1: Mark all inodes on s_fc_q[MAIN] with</div><div class='add'>+	 * EXT4_STATE_FC_FLUSHING_DATA. This prevents these inodes from being</div><div class='add'>+	 * freed until the data flush is over.</div><div class='add'>+	 */</div><div class='add'>+	mutex_lock(&amp;sbi-&gt;s_fc_lock);</div><div class='add'>+	list_for_each_entry(iter, &amp;sbi-&gt;s_fc_q[FC_Q_MAIN], i_fc_list) {</div><div class='add'>+		ext4_set_inode_state(&amp;iter-&gt;vfs_inode,</div><div class='add'>+				     EXT4_STATE_FC_FLUSHING_DATA);</div><div class='add'>+	}</div><div class='add'>+	mutex_unlock(&amp;sbi-&gt;s_fc_lock);</div><div class='add'>+</div><div class='add'>+	/* Step 2: Flush data for all the eligible inodes. */</div><div class='add'>+	ret = ext4_fc_flush_data(journal);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Step 3: Clear EXT4_STATE_FC_FLUSHING_DATA flag, before returning</div><div class='add'>+	 * any error from step 2. This ensures that waiters waiting on</div><div class='add'>+	 * EXT4_STATE_FC_FLUSHING_DATA can resume.</div><div class='add'>+	 */</div><div class='add'>+	mutex_lock(&amp;sbi-&gt;s_fc_lock);</div><div class='add'>+	list_for_each_entry(iter, &amp;sbi-&gt;s_fc_q[FC_Q_MAIN], i_fc_list) {</div><div class='add'>+		ext4_clear_inode_state(&amp;iter-&gt;vfs_inode,</div><div class='add'>+				       EXT4_STATE_FC_FLUSHING_DATA);</div><div class='add'>+#if (BITS_PER_LONG &lt; 64)</div><div class='add'>+		wake_up_bit(&amp;iter-&gt;i_state_flags, EXT4_STATE_FC_FLUSHING_DATA);</div><div class='add'>+#else</div><div class='add'>+		wake_up_bit(&amp;iter-&gt;i_flags, EXT4_STATE_FC_FLUSHING_DATA);</div><div class='add'>+#endif</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Make sure clearing of EXT4_STATE_FC_FLUSHING_DATA is visible before</div><div class='add'>+	 * the waiter checks the bit. Pairs with implicit barrier in</div><div class='add'>+	 * prepare_to_wait() in ext4_fc_del().</div><div class='add'>+	 */</div><div class='add'>+	smp_mb();</div><div class='add'>+	mutex_unlock(&amp;sbi-&gt;s_fc_lock);</div><div class='ctx'> </div><div class='del'>-	ret = ext4_fc_wait_inode_data_all(journal);</div><div class='add'>+	/*</div><div class='add'>+	 * If we encountered error in Step 2, return it now after clearing</div><div class='add'>+	 * EXT4_STATE_FC_FLUSHING_DATA bit.</div><div class='add'>+	 */</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='add'>+</div><div class='add'>+	/* Step 4: Mark all inodes as being committed. */</div><div class='add'>+	jbd2_journal_lock_updates(journal);</div><div class='ctx'> 	/*</div><div class='del'>-	 * If file system device is different from journal device, issue a cache</div><div class='del'>-	 * flush before we start writing fast commit blocks.</div><div class='add'>+	 * The journal is now locked. No more handles can start and all the</div><div class='add'>+	 * previous handles are now drained. We now mark the inodes on the</div><div class='add'>+	 * commit queue as being committed.</div><div class='add'>+	 */</div><div class='add'>+	mutex_lock(&amp;sbi-&gt;s_fc_lock);</div><div class='add'>+	list_for_each_entry(iter, &amp;sbi-&gt;s_fc_q[FC_Q_MAIN], i_fc_list) {</div><div class='add'>+		ext4_set_inode_state(&amp;iter-&gt;vfs_inode,</div><div class='add'>+				     EXT4_STATE_FC_COMMITTING);</div><div class='add'>+	}</div><div class='add'>+	mutex_unlock(&amp;sbi-&gt;s_fc_lock);</div><div class='add'>+	jbd2_journal_unlock_updates(journal);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Step 5: If file system device is different from journal device,</div><div class='add'>+	 * issue a cache flush before we start writing fast commit blocks.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (journal-&gt;j_fs_dev != journal-&gt;j_dev)</div><div class='ctx'> 		blkdev_issue_flush(journal-&gt;j_fs_dev);</div><div class='ctx'> </div><div class='ctx'> 	blk_start_plug(&amp;plug);</div><div class='add'>+	/* Step 6: Write fast commit blocks to disk. */</div><div class='ctx'> 	if (sbi-&gt;s_fc_bytes == 0) {</div><div class='ctx'> 		/*</div><div class='del'>-		 * Add a head tag only if this is the first fast commit</div><div class='del'>-		 * in this TID.</div><div class='add'>+		 * Step 6.1: Add a head tag only if this is the first fast</div><div class='add'>+		 * commit in this TID.</div><div class='ctx'> 		 */</div><div class='ctx'> 		head.fc_features = cpu_to_le32(EXT4_FC_SUPPORTED_FEATURES);</div><div class='ctx'> 		head.fc_tid = cpu_to_le32(</div><div class='hunk'>@@ -1093,36 +1133,61 @@ static int ext4_fc_perform_commit(journal_t *journal)</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;sbi-&gt;s_fc_lock);</div><div class='add'>+	/* Step 6.2: Now write all the dentry updates. */</div><div class='add'>+	mutex_lock(&amp;sbi-&gt;s_fc_lock);</div><div class='ctx'> 	ret = ext4_fc_commit_dentry_updates(journal, &amp;crc);</div><div class='del'>-	if (ret) {</div><div class='del'>-		spin_unlock(&amp;sbi-&gt;s_fc_lock);</div><div class='add'>+	if (ret)</div><div class='ctx'> 		goto out;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='add'>+	/* Step 6.3: Now write all the changed inodes to disk. */</div><div class='ctx'> 	list_for_each_entry(iter, &amp;sbi-&gt;s_fc_q[FC_Q_MAIN], i_fc_list) {</div><div class='ctx'> 		inode = &amp;iter-&gt;vfs_inode;</div><div class='ctx'> 		if (!ext4_test_inode_state(inode, EXT4_STATE_FC_COMMITTING))</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		spin_unlock(&amp;sbi-&gt;s_fc_lock);</div><div class='ctx'> 		ret = ext4_fc_write_inode_data(inode, &amp;crc);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		ret = ext4_fc_write_inode(inode, &amp;crc);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto out;</div><div class='del'>-		spin_lock(&amp;sbi-&gt;s_fc_lock);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;sbi-&gt;s_fc_lock);</div><div class='del'>-</div><div class='add'>+	/* Step 6.4: Finally write tail tag to conclude this fast commit. */</div><div class='ctx'> 	ret = ext4_fc_write_tail(sb, crc);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='add'>+	mutex_unlock(&amp;sbi-&gt;s_fc_lock);</div><div class='ctx'> 	blk_finish_plug(&amp;plug);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void ext4_fc_update_stats(struct super_block *sb, int status,</div><div class='add'>+				 u64 commit_time, int nblks, tid_t commit_tid)</div><div class='add'>+{</div><div class='add'>+	struct ext4_fc_stats *stats = &amp;EXT4_SB(sb)-&gt;s_fc_stats;</div><div class='add'>+</div><div class='add'>+	ext4_debug("Fast commit ended with status = %d for tid %u",</div><div class='add'>+			status, commit_tid);</div><div class='add'>+	if (status == EXT4_FC_STATUS_OK) {</div><div class='add'>+		stats-&gt;fc_num_commits++;</div><div class='add'>+		stats-&gt;fc_numblks += nblks;</div><div class='add'>+		if (likely(stats-&gt;s_fc_avg_commit_time))</div><div class='add'>+			stats-&gt;s_fc_avg_commit_time =</div><div class='add'>+				(commit_time +</div><div class='add'>+				 stats-&gt;s_fc_avg_commit_time * 3) / 4;</div><div class='add'>+		else</div><div class='add'>+			stats-&gt;s_fc_avg_commit_time = commit_time;</div><div class='add'>+	} else if (status == EXT4_FC_STATUS_FAILED ||</div><div class='add'>+		   status == EXT4_FC_STATUS_INELIGIBLE) {</div><div class='add'>+		if (status == EXT4_FC_STATUS_FAILED)</div><div class='add'>+			stats-&gt;fc_failed_commits++;</div><div class='add'>+		stats-&gt;fc_ineligible_commits++;</div><div class='add'>+	} else {</div><div class='add'>+		stats-&gt;fc_skipped_commits++;</div><div class='add'>+	}</div><div class='add'>+	trace_ext4_fc_commit_stop(sb, nblks, status, commit_tid);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * The main commit entry point. Performs a fast commit for transaction</div><div class='ctx'>  * commit_tid if needed. If it's not possible to perform a fast commit</div><div class='hunk'>@@ -1131,122 +1196,140 @@ out:</div><div class='ctx'>  */</div><div class='ctx'> int ext4_fc_commit(journal_t *journal, tid_t commit_tid)</div><div class='ctx'> {</div><div class='del'>-	struct super_block *sb = (struct super_block *)(journal-&gt;j_private);</div><div class='add'>+	struct super_block *sb = journal-&gt;j_private;</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> 	int nblks = 0, ret, bsize = journal-&gt;j_blocksize;</div><div class='ctx'> 	int subtid = atomic_read(&amp;sbi-&gt;s_fc_subtid);</div><div class='del'>-	int reason = EXT4_FC_REASON_OK, fc_bufs_before = 0;</div><div class='add'>+	int status = EXT4_FC_STATUS_OK, fc_bufs_before = 0;</div><div class='ctx'> 	ktime_t start_time, commit_time;</div><div class='add'>+	int old_ioprio, journal_ioprio;</div><div class='ctx'> </div><div class='del'>-	trace_ext4_fc_commit_start(sb);</div><div class='add'>+	if (!test_opt2(sb, JOURNAL_FAST_COMMIT))</div><div class='add'>+		return jbd2_complete_transaction(journal, commit_tid);</div><div class='ctx'> </div><div class='del'>-	start_time = ktime_get();</div><div class='add'>+	trace_ext4_fc_commit_start(sb, commit_tid);</div><div class='ctx'> </div><div class='del'>-	if (!test_opt2(sb, JOURNAL_FAST_COMMIT) ||</div><div class='del'>-		(ext4_fc_is_ineligible(sb))) {</div><div class='del'>-		reason = EXT4_FC_REASON_INELIGIBLE;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	start_time = ktime_get();</div><div class='add'>+	old_ioprio = get_current_ioprio();</div><div class='ctx'> </div><div class='ctx'> restart_fc:</div><div class='ctx'> 	ret = jbd2_fc_begin_commit(journal, commit_tid);</div><div class='ctx'> 	if (ret == -EALREADY) {</div><div class='ctx'> 		/* There was an ongoing commit, check if we need to restart */</div><div class='ctx'> 		if (atomic_read(&amp;sbi-&gt;s_fc_subtid) &lt;= subtid &amp;&amp;</div><div class='del'>-			commit_tid &gt; journal-&gt;j_commit_sequence)</div><div class='add'>+		    tid_gt(commit_tid, journal-&gt;j_commit_sequence))</div><div class='ctx'> 			goto restart_fc;</div><div class='del'>-		reason = EXT4_FC_REASON_ALREADY_COMMITTED;</div><div class='del'>-		goto out;</div><div class='add'>+		ext4_fc_update_stats(sb, EXT4_FC_STATUS_SKIPPED, 0, 0,</div><div class='add'>+				commit_tid);</div><div class='add'>+		return 0;</div><div class='ctx'> 	} else if (ret) {</div><div class='del'>-		sbi-&gt;s_fc_stats.fc_ineligible_reason_count[EXT4_FC_COMMIT_FAILED]++;</div><div class='del'>-		reason = EXT4_FC_REASON_FC_START_FAILED;</div><div class='del'>-		goto out;</div><div class='add'>+		/*</div><div class='add'>+		 * Commit couldn't start. Just update stats and perform a</div><div class='add'>+		 * full commit.</div><div class='add'>+		 */</div><div class='add'>+		ext4_fc_update_stats(sb, EXT4_FC_STATUS_FAILED, 0, 0,</div><div class='add'>+				commit_tid);</div><div class='add'>+		return jbd2_complete_transaction(journal, commit_tid);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * After establishing journal barrier via jbd2_fc_begin_commit(), check</div><div class='add'>+	 * if we are fast commit ineligible.</div><div class='add'>+	 */</div><div class='add'>+	if (ext4_test_mount_flag(sb, EXT4_MF_FC_INELIGIBLE)) {</div><div class='add'>+		status = EXT4_FC_STATUS_INELIGIBLE;</div><div class='add'>+		goto fallback;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Now that we know that this thread is going to do a fast commit,</div><div class='add'>+	 * elevate the priority to match that of the journal thread.</div><div class='add'>+	 */</div><div class='add'>+	if (journal-&gt;j_task-&gt;io_context)</div><div class='add'>+		journal_ioprio = sbi-&gt;s_journal-&gt;j_task-&gt;io_context-&gt;ioprio;</div><div class='add'>+	else</div><div class='add'>+		journal_ioprio = EXT4_DEF_JOURNAL_IOPRIO;</div><div class='add'>+	set_task_ioprio(current, journal_ioprio);</div><div class='ctx'> 	fc_bufs_before = (sbi-&gt;s_fc_bytes + bsize - 1) / bsize;</div><div class='ctx'> 	ret = ext4_fc_perform_commit(journal);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='del'>-		sbi-&gt;s_fc_stats.fc_ineligible_reason_count[EXT4_FC_COMMIT_FAILED]++;</div><div class='del'>-		reason = EXT4_FC_REASON_FC_FAILED;</div><div class='del'>-		goto out;</div><div class='add'>+		status = EXT4_FC_STATUS_FAILED;</div><div class='add'>+		goto fallback;</div><div class='ctx'> 	}</div><div class='ctx'> 	nblks = (sbi-&gt;s_fc_bytes + bsize - 1) / bsize - fc_bufs_before;</div><div class='ctx'> 	ret = jbd2_fc_wait_bufs(journal, nblks);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='del'>-		sbi-&gt;s_fc_stats.fc_ineligible_reason_count[EXT4_FC_COMMIT_FAILED]++;</div><div class='del'>-		reason = EXT4_FC_REASON_FC_FAILED;</div><div class='del'>-		goto out;</div><div class='add'>+		status = EXT4_FC_STATUS_FAILED;</div><div class='add'>+		goto fallback;</div><div class='ctx'> 	}</div><div class='ctx'> 	atomic_inc(&amp;sbi-&gt;s_fc_subtid);</div><div class='del'>-	jbd2_fc_end_commit(journal);</div><div class='del'>-out:</div><div class='del'>-	/* Has any ineligible update happened since we started? */</div><div class='del'>-	if (reason == EXT4_FC_REASON_OK &amp;&amp; ext4_fc_is_ineligible(sb)) {</div><div class='del'>-		sbi-&gt;s_fc_stats.fc_ineligible_reason_count[EXT4_FC_COMMIT_FAILED]++;</div><div class='del'>-		reason = EXT4_FC_REASON_INELIGIBLE;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;sbi-&gt;s_fc_lock);</div><div class='del'>-	if (reason != EXT4_FC_REASON_OK &amp;&amp;</div><div class='del'>-		reason != EXT4_FC_REASON_ALREADY_COMMITTED) {</div><div class='del'>-		sbi-&gt;s_fc_stats.fc_ineligible_commits++;</div><div class='del'>-	} else {</div><div class='del'>-		sbi-&gt;s_fc_stats.fc_num_commits++;</div><div class='del'>-		sbi-&gt;s_fc_stats.fc_numblks += nblks;</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;sbi-&gt;s_fc_lock);</div><div class='del'>-	nblks = (reason == EXT4_FC_REASON_OK) ? nblks : 0;</div><div class='del'>-	trace_ext4_fc_commit_stop(sb, nblks, reason);</div><div class='del'>-	commit_time = ktime_to_ns(ktime_sub(ktime_get(), start_time));</div><div class='add'>+	ret = jbd2_fc_end_commit(journal);</div><div class='add'>+	set_task_ioprio(current, old_ioprio);</div><div class='ctx'> 	/*</div><div class='del'>-	 * weight the commit time higher than the average time so we don't</div><div class='del'>-	 * react too strongly to vast changes in the commit time</div><div class='add'>+	 * weight the commit time higher than the average time so we</div><div class='add'>+	 * don't react too strongly to vast changes in the commit time</div><div class='ctx'> 	 */</div><div class='del'>-	if (likely(sbi-&gt;s_fc_avg_commit_time))</div><div class='del'>-		sbi-&gt;s_fc_avg_commit_time = (commit_time +</div><div class='del'>-				sbi-&gt;s_fc_avg_commit_time * 3) / 4;</div><div class='del'>-	else</div><div class='del'>-		sbi-&gt;s_fc_avg_commit_time = commit_time;</div><div class='del'>-	jbd_debug(1,</div><div class='del'>-		"Fast commit ended with blks = %d, reason = %d, subtid - %d",</div><div class='del'>-		nblks, reason, subtid);</div><div class='del'>-	if (reason == EXT4_FC_REASON_FC_FAILED)</div><div class='del'>-		return jbd2_fc_end_commit_fallback(journal);</div><div class='del'>-	if (reason == EXT4_FC_REASON_FC_START_FAILED ||</div><div class='del'>-		reason == EXT4_FC_REASON_INELIGIBLE)</div><div class='del'>-		return jbd2_complete_transaction(journal, commit_tid);</div><div class='del'>-	return 0;</div><div class='add'>+	commit_time = ktime_to_ns(ktime_sub(ktime_get(), start_time));</div><div class='add'>+	ext4_fc_update_stats(sb, status, commit_time, nblks, commit_tid);</div><div class='add'>+	return ret;</div><div class='add'>+</div><div class='add'>+fallback:</div><div class='add'>+	set_task_ioprio(current, old_ioprio);</div><div class='add'>+	ret = jbd2_fc_end_commit_fallback(journal);</div><div class='add'>+	ext4_fc_update_stats(sb, status, 0, 0, commit_tid);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Fast commit cleanup routine. This is called after every fast commit and</div><div class='ctx'>  * full commit. full is true if we are called after a full commit.</div><div class='ctx'>  */</div><div class='del'>-static void ext4_fc_cleanup(journal_t *journal, int full)</div><div class='add'>+static void ext4_fc_cleanup(journal_t *journal, int full, tid_t tid)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = journal-&gt;j_private;</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='del'>-	struct ext4_inode_info *iter, *iter_n;</div><div class='add'>+	struct ext4_inode_info *ei;</div><div class='ctx'> 	struct ext4_fc_dentry_update *fc_dentry;</div><div class='ctx'> </div><div class='ctx'> 	if (full &amp;&amp; sbi-&gt;s_fc_bh)</div><div class='ctx'> 		sbi-&gt;s_fc_bh = NULL;</div><div class='ctx'> </div><div class='add'>+	trace_ext4_fc_cleanup(journal, full, tid);</div><div class='ctx'> 	jbd2_fc_release_bufs(journal);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;sbi-&gt;s_fc_lock);</div><div class='del'>-	list_for_each_entry_safe(iter, iter_n, &amp;sbi-&gt;s_fc_q[FC_Q_MAIN],</div><div class='del'>-				 i_fc_list) {</div><div class='del'>-		list_del_init(&amp;iter-&gt;i_fc_list);</div><div class='del'>-		ext4_clear_inode_state(&amp;iter-&gt;vfs_inode,</div><div class='add'>+	mutex_lock(&amp;sbi-&gt;s_fc_lock);</div><div class='add'>+	while (!list_empty(&amp;sbi-&gt;s_fc_q[FC_Q_MAIN])) {</div><div class='add'>+		ei = list_first_entry(&amp;sbi-&gt;s_fc_q[FC_Q_MAIN],</div><div class='add'>+					struct ext4_inode_info,</div><div class='add'>+					i_fc_list);</div><div class='add'>+		list_del_init(&amp;ei-&gt;i_fc_list);</div><div class='add'>+		ext4_clear_inode_state(&amp;ei-&gt;vfs_inode,</div><div class='ctx'> 				       EXT4_STATE_FC_COMMITTING);</div><div class='del'>-		ext4_fc_reset_inode(&amp;iter-&gt;vfs_inode);</div><div class='del'>-		/* Make sure EXT4_STATE_FC_COMMITTING bit is clear */</div><div class='add'>+		if (tid_geq(tid, ei-&gt;i_sync_tid)) {</div><div class='add'>+			ext4_fc_reset_inode(&amp;ei-&gt;vfs_inode);</div><div class='add'>+		} else if (full) {</div><div class='add'>+			/*</div><div class='add'>+			 * We are called after a full commit, inode has been</div><div class='add'>+			 * modified while the commit was running. Re-enqueue</div><div class='add'>+			 * the inode into STAGING, which will then be splice</div><div class='add'>+			 * back into MAIN. This cannot happen during</div><div class='add'>+			 * fastcommit because the journal is locked all the</div><div class='add'>+			 * time in that case (and tid doesn't increase so</div><div class='add'>+			 * tid check above isn't reliable).</div><div class='add'>+			 */</div><div class='add'>+			list_add_tail(&amp;ei-&gt;i_fc_list,</div><div class='add'>+				      &amp;sbi-&gt;s_fc_q[FC_Q_STAGING]);</div><div class='add'>+		}</div><div class='add'>+		/*</div><div class='add'>+		 * Make sure clearing of EXT4_STATE_FC_COMMITTING is</div><div class='add'>+		 * visible before we send the wakeup. Pairs with implicit</div><div class='add'>+		 * barrier in prepare_to_wait() in ext4_fc_track_inode().</div><div class='add'>+		 */</div><div class='ctx'> 		smp_mb();</div><div class='ctx'> #if (BITS_PER_LONG &lt; 64)</div><div class='del'>-		wake_up_bit(&amp;iter-&gt;i_state_flags, EXT4_STATE_FC_COMMITTING);</div><div class='add'>+		wake_up_bit(&amp;ei-&gt;i_state_flags, EXT4_STATE_FC_COMMITTING);</div><div class='ctx'> #else</div><div class='del'>-		wake_up_bit(&amp;iter-&gt;i_flags, EXT4_STATE_FC_COMMITTING);</div><div class='add'>+		wake_up_bit(&amp;ei-&gt;i_flags, EXT4_STATE_FC_COMMITTING);</div><div class='ctx'> #endif</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1255,13 +1338,10 @@ static void ext4_fc_cleanup(journal_t *journal, int full)</div><div class='ctx'> 					     struct ext4_fc_dentry_update,</div><div class='ctx'> 					     fcd_list);</div><div class='ctx'> 		list_del_init(&amp;fc_dentry-&gt;fcd_list);</div><div class='del'>-		spin_unlock(&amp;sbi-&gt;s_fc_lock);</div><div class='add'>+		list_del_init(&amp;fc_dentry-&gt;fcd_dilist);</div><div class='ctx'> </div><div class='del'>-		if (fc_dentry-&gt;fcd_name.name &amp;&amp;</div><div class='del'>-			fc_dentry-&gt;fcd_name.len &gt; DNAME_INLINE_LEN)</div><div class='del'>-			kfree(fc_dentry-&gt;fcd_name.name);</div><div class='add'>+		release_dentry_name_snapshot(&amp;fc_dentry-&gt;fcd_name);</div><div class='ctx'> 		kmem_cache_free(ext4_fc_dentry_cachep, fc_dentry);</div><div class='del'>-		spin_lock(&amp;sbi-&gt;s_fc_lock);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	list_splice_init(&amp;sbi-&gt;s_fc_dentry_q[FC_Q_STAGING],</div><div class='hunk'>@@ -1269,12 +1349,14 @@ static void ext4_fc_cleanup(journal_t *journal, int full)</div><div class='ctx'> 	list_splice_init(&amp;sbi-&gt;s_fc_q[FC_Q_STAGING],</div><div class='ctx'> 				&amp;sbi-&gt;s_fc_q[FC_Q_MAIN]);</div><div class='ctx'> </div><div class='del'>-	ext4_clear_mount_flag(sb, EXT4_MF_FC_COMMITTING);</div><div class='del'>-	ext4_clear_mount_flag(sb, EXT4_MF_FC_INELIGIBLE);</div><div class='add'>+	if (tid_geq(tid, sbi-&gt;s_fc_ineligible_tid)) {</div><div class='add'>+		sbi-&gt;s_fc_ineligible_tid = 0;</div><div class='add'>+		ext4_clear_mount_flag(sb, EXT4_MF_FC_INELIGIBLE);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (full)</div><div class='ctx'> 		sbi-&gt;s_fc_bytes = 0;</div><div class='del'>-	spin_unlock(&amp;sbi-&gt;s_fc_lock);</div><div class='add'>+	mutex_unlock(&amp;sbi-&gt;s_fc_lock);</div><div class='ctx'> 	trace_ext4_fc_stats(sb);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1286,8 +1368,14 @@ struct dentry_info_args {</div><div class='ctx'> 	char *dname;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+/* Same as struct ext4_fc_tl, but uses native endianness fields */</div><div class='add'>+struct ext4_fc_tl_mem {</div><div class='add'>+	u16 fc_tag;</div><div class='add'>+	u16 fc_len;</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> static inline void tl_to_darg(struct dentry_info_args *darg,</div><div class='del'>-			      struct  ext4_fc_tl *tl, u8 *val)</div><div class='add'>+			      struct ext4_fc_tl_mem *tl, u8 *val)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_fc_dentry_info fcd;</div><div class='ctx'> </div><div class='hunk'>@@ -1296,13 +1384,21 @@ static inline void tl_to_darg(struct dentry_info_args *darg,</div><div class='ctx'> 	darg-&gt;parent_ino = le32_to_cpu(fcd.fc_parent_ino);</div><div class='ctx'> 	darg-&gt;ino = le32_to_cpu(fcd.fc_ino);</div><div class='ctx'> 	darg-&gt;dname = val + offsetof(struct ext4_fc_dentry_info, fc_dname);</div><div class='del'>-	darg-&gt;dname_len = le16_to_cpu(tl-&gt;fc_len) -</div><div class='del'>-		sizeof(struct ext4_fc_dentry_info);</div><div class='add'>+	darg-&gt;dname_len = tl-&gt;fc_len - sizeof(struct ext4_fc_dentry_info);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void ext4_fc_get_tl(struct ext4_fc_tl_mem *tl, u8 *val)</div><div class='add'>+{</div><div class='add'>+	struct ext4_fc_tl tl_disk;</div><div class='add'>+</div><div class='add'>+	memcpy(&amp;tl_disk, val, EXT4_FC_TAG_BASE_LEN);</div><div class='add'>+	tl-&gt;fc_len = le16_to_cpu(tl_disk.fc_len);</div><div class='add'>+	tl-&gt;fc_tag = le16_to_cpu(tl_disk.fc_tag);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Unlink replay function */</div><div class='del'>-static int ext4_fc_replay_unlink(struct super_block *sb, struct ext4_fc_tl *tl,</div><div class='del'>-				 u8 *val)</div><div class='add'>+static int ext4_fc_replay_unlink(struct super_block *sb,</div><div class='add'>+				 struct ext4_fc_tl_mem *tl, u8 *val)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode, *old_parent;</div><div class='ctx'> 	struct qstr entry;</div><div class='hunk'>@@ -1319,19 +1415,19 @@ static int ext4_fc_replay_unlink(struct super_block *sb, struct ext4_fc_tl *tl,</div><div class='ctx'> 	inode = ext4_iget(sb, darg.ino, EXT4_IGET_NORMAL);</div><div class='ctx'> </div><div class='ctx'> 	if (IS_ERR(inode)) {</div><div class='del'>-		jbd_debug(1, "Inode %d not found", darg.ino);</div><div class='add'>+		ext4_debug("Inode %d not found", darg.ino);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	old_parent = ext4_iget(sb, darg.parent_ino,</div><div class='ctx'> 				EXT4_IGET_NORMAL);</div><div class='ctx'> 	if (IS_ERR(old_parent)) {</div><div class='del'>-		jbd_debug(1, "Dir with inode  %d not found", darg.parent_ino);</div><div class='add'>+		ext4_debug("Dir with inode %d not found", darg.parent_ino);</div><div class='ctx'> 		iput(inode);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = __ext4_unlink(NULL, old_parent, &amp;entry, inode);</div><div class='add'>+	ret = __ext4_unlink(old_parent, &amp;entry, inode, NULL);</div><div class='ctx'> 	/* -ENOENT ok coz it might not exist anymore. */</div><div class='ctx'> 	if (ret == -ENOENT)</div><div class='ctx'> 		ret = 0;</div><div class='hunk'>@@ -1351,21 +1447,21 @@ static int ext4_fc_replay_link_internal(struct super_block *sb,</div><div class='ctx'> </div><div class='ctx'> 	dir = ext4_iget(sb, darg-&gt;parent_ino, EXT4_IGET_NORMAL);</div><div class='ctx'> 	if (IS_ERR(dir)) {</div><div class='del'>-		jbd_debug(1, "Dir with inode %d not found.", darg-&gt;parent_ino);</div><div class='add'>+		ext4_debug("Dir with inode %d not found.", darg-&gt;parent_ino);</div><div class='ctx'> 		dir = NULL;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	dentry_dir = d_obtain_alias(dir);</div><div class='ctx'> 	if (IS_ERR(dentry_dir)) {</div><div class='del'>-		jbd_debug(1, "Failed to obtain dentry");</div><div class='add'>+		ext4_debug("Failed to obtain dentry");</div><div class='ctx'> 		dentry_dir = NULL;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	dentry_inode = d_alloc(dentry_dir, &amp;qstr_dname);</div><div class='ctx'> 	if (!dentry_inode) {</div><div class='del'>-		jbd_debug(1, "Inode dentry not created.");</div><div class='add'>+		ext4_debug("Inode dentry not created.");</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1378,7 +1474,7 @@ static int ext4_fc_replay_link_internal(struct super_block *sb,</div><div class='ctx'> 	 * could complete.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (ret &amp;&amp; ret != -EEXIST) {</div><div class='del'>-		jbd_debug(1, "Failed to link\n");</div><div class='add'>+		ext4_debug("Failed to link\n");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1399,8 +1495,8 @@ out:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Link replay function */</div><div class='del'>-static int ext4_fc_replay_link(struct super_block *sb, struct ext4_fc_tl *tl,</div><div class='del'>-			       u8 *val)</div><div class='add'>+static int ext4_fc_replay_link(struct super_block *sb,</div><div class='add'>+			       struct ext4_fc_tl_mem *tl, u8 *val)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct dentry_info_args darg;</div><div class='hunk'>@@ -1412,7 +1508,7 @@ static int ext4_fc_replay_link(struct super_block *sb, struct ext4_fc_tl *tl,</div><div class='ctx'> </div><div class='ctx'> 	inode = ext4_iget(sb, darg.ino, EXT4_IGET_NORMAL);</div><div class='ctx'> 	if (IS_ERR(inode)) {</div><div class='del'>-		jbd_debug(1, "Inode not found.");</div><div class='add'>+		ext4_debug("Inode not found.");</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1435,14 +1531,17 @@ static int ext4_fc_record_modified_inode(struct super_block *sb, int ino)</div><div class='ctx'> 		if (state-&gt;fc_modified_inodes[i] == ino)</div><div class='ctx'> 			return 0;</div><div class='ctx'> 	if (state-&gt;fc_modified_inodes_used == state-&gt;fc_modified_inodes_size) {</div><div class='add'>+		int *fc_modified_inodes;</div><div class='add'>+</div><div class='add'>+		fc_modified_inodes = krealloc(state-&gt;fc_modified_inodes,</div><div class='add'>+				sizeof(int) * (state-&gt;fc_modified_inodes_size +</div><div class='add'>+				EXT4_FC_REPLAY_REALLOC_INCREMENT),</div><div class='add'>+				GFP_KERNEL);</div><div class='add'>+		if (!fc_modified_inodes)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+		state-&gt;fc_modified_inodes = fc_modified_inodes;</div><div class='ctx'> 		state-&gt;fc_modified_inodes_size +=</div><div class='ctx'> 			EXT4_FC_REPLAY_REALLOC_INCREMENT;</div><div class='del'>-		state-&gt;fc_modified_inodes = krealloc(</div><div class='del'>-					state-&gt;fc_modified_inodes, sizeof(int) *</div><div class='del'>-					state-&gt;fc_modified_inodes_size,</div><div class='del'>-					GFP_KERNEL);</div><div class='del'>-		if (!state-&gt;fc_modified_inodes)</div><div class='del'>-			return -ENOMEM;</div><div class='ctx'> 	}</div><div class='ctx'> 	state-&gt;fc_modified_inodes[state-&gt;fc_modified_inodes_used++] = ino;</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -1451,16 +1550,17 @@ static int ext4_fc_record_modified_inode(struct super_block *sb, int ino)</div><div class='ctx'> /*</div><div class='ctx'>  * Inode replay function</div><div class='ctx'>  */</div><div class='del'>-static int ext4_fc_replay_inode(struct super_block *sb, struct ext4_fc_tl *tl,</div><div class='del'>-				u8 *val)</div><div class='add'>+static int ext4_fc_replay_inode(struct super_block *sb,</div><div class='add'>+				struct ext4_fc_tl_mem *tl, u8 *val)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_fc_inode fc_inode;</div><div class='ctx'> 	struct ext4_inode *raw_inode;</div><div class='ctx'> 	struct ext4_inode *raw_fc_inode;</div><div class='ctx'> 	struct inode *inode = NULL;</div><div class='ctx'> 	struct ext4_iloc iloc;</div><div class='del'>-	int inode_len, ino, ret, tag = le16_to_cpu(tl-&gt;fc_tag);</div><div class='add'>+	int inode_len, ino, ret, tag = tl-&gt;fc_tag;</div><div class='ctx'> 	struct ext4_extent_header *eh;</div><div class='add'>+	size_t off_gen = offsetof(struct ext4_inode, i_generation);</div><div class='ctx'> </div><div class='ctx'> 	memcpy(&amp;fc_inode, val, sizeof(fc_inode));</div><div class='ctx'> </div><div class='hunk'>@@ -1474,7 +1574,9 @@ static int ext4_fc_replay_inode(struct super_block *sb, struct ext4_fc_tl *tl,</div><div class='ctx'> 	}</div><div class='ctx'> 	inode = NULL;</div><div class='ctx'> </div><div class='del'>-	ext4_fc_record_modified_inode(sb, ino);</div><div class='add'>+	ret = ext4_fc_record_modified_inode(sb, ino);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='ctx'> 	raw_fc_inode = (struct ext4_inode *)</div><div class='ctx'> 		(val + offsetof(struct ext4_fc_inode, fc_raw_inode));</div><div class='hunk'>@@ -1482,12 +1584,12 @@ static int ext4_fc_replay_inode(struct super_block *sb, struct ext4_fc_tl *tl,</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	inode_len = le16_to_cpu(tl-&gt;fc_len) - sizeof(struct ext4_fc_inode);</div><div class='add'>+	inode_len = tl-&gt;fc_len - sizeof(struct ext4_fc_inode);</div><div class='ctx'> 	raw_inode = ext4_raw_inode(&amp;iloc);</div><div class='ctx'> </div><div class='ctx'> 	memcpy(raw_inode, raw_fc_inode, offsetof(struct ext4_inode, i_block));</div><div class='del'>-	memcpy(&amp;raw_inode-&gt;i_generation, &amp;raw_fc_inode-&gt;i_generation,</div><div class='del'>-		inode_len - offsetof(struct ext4_inode, i_generation));</div><div class='add'>+	memcpy((u8 *)raw_inode + off_gen, (u8 *)raw_fc_inode + off_gen,</div><div class='add'>+	       inode_len - off_gen);</div><div class='ctx'> 	if (le32_to_cpu(raw_inode-&gt;i_flags) &amp; EXT4_EXTENTS_FL) {</div><div class='ctx'> 		eh = (struct ext4_extent_header *)(&amp;raw_inode-&gt;i_block[0]);</div><div class='ctx'> 		if (eh-&gt;eh_magic != EXT4_EXT_MAGIC) {</div><div class='hunk'>@@ -1517,7 +1619,7 @@ static int ext4_fc_replay_inode(struct super_block *sb, struct ext4_fc_tl *tl,</div><div class='ctx'> 	/* Given that we just wrote the inode on disk, this SHOULD succeed. */</div><div class='ctx'> 	inode = ext4_iget(sb, ino, EXT4_IGET_NORMAL);</div><div class='ctx'> 	if (IS_ERR(inode)) {</div><div class='del'>-		jbd_debug(1, "Inode not found.");</div><div class='add'>+		ext4_debug("Inode not found.");</div><div class='ctx'> 		return -EFSCORRUPTED;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1551,8 +1653,8 @@ out:</div><div class='ctx'>  * inode for which we are trying to create a dentry here, should already have</div><div class='ctx'>  * been replayed before we start here.</div><div class='ctx'>  */</div><div class='del'>-static int ext4_fc_replay_create(struct super_block *sb, struct ext4_fc_tl *tl,</div><div class='del'>-				 u8 *val)</div><div class='add'>+static int ext4_fc_replay_create(struct super_block *sb,</div><div class='add'>+				 struct ext4_fc_tl_mem *tl, u8 *val)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	struct inode *inode = NULL;</div><div class='hunk'>@@ -1571,7 +1673,7 @@ static int ext4_fc_replay_create(struct super_block *sb, struct ext4_fc_tl *tl,</div><div class='ctx'> </div><div class='ctx'> 	inode = ext4_iget(sb, darg.ino, EXT4_IGET_NORMAL);</div><div class='ctx'> 	if (IS_ERR(inode)) {</div><div class='del'>-		jbd_debug(1, "inode %d not found.", darg.ino);</div><div class='add'>+		ext4_debug("inode %d not found.", darg.ino);</div><div class='ctx'> 		inode = NULL;</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -1584,7 +1686,7 @@ static int ext4_fc_replay_create(struct super_block *sb, struct ext4_fc_tl *tl,</div><div class='ctx'> 		 */</div><div class='ctx'> 		dir = ext4_iget(sb, darg.parent_ino, EXT4_IGET_NORMAL);</div><div class='ctx'> 		if (IS_ERR(dir)) {</div><div class='del'>-			jbd_debug(1, "Dir %d not found.", darg.ino);</div><div class='add'>+			ext4_debug("Dir %d not found.", darg.ino);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 		ret = ext4_init_new_dir(NULL, dir, inode);</div><div class='hunk'>@@ -1600,32 +1702,41 @@ static int ext4_fc_replay_create(struct super_block *sb, struct ext4_fc_tl *tl,</div><div class='ctx'> 	set_nlink(inode, 1);</div><div class='ctx'> 	ext4_mark_inode_dirty(NULL, inode);</div><div class='ctx'> out:</div><div class='del'>-	if (inode)</div><div class='del'>-		iput(inode);</div><div class='add'>+	iput(inode);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Record physical disk regions which are in use as per fast commit area. Our</div><div class='del'>- * simple replay phase allocator excludes these regions from allocation.</div><div class='add'>+ * Record physical disk regions which are in use as per fast commit area,</div><div class='add'>+ * and used by inodes during replay phase. Our simple replay phase</div><div class='add'>+ * allocator excludes these regions from allocation.</div><div class='ctx'>  */</div><div class='del'>-static int ext4_fc_record_regions(struct super_block *sb, int ino,</div><div class='del'>-		ext4_lblk_t lblk, ext4_fsblk_t pblk, int len)</div><div class='add'>+int ext4_fc_record_regions(struct super_block *sb, int ino,</div><div class='add'>+		ext4_lblk_t lblk, ext4_fsblk_t pblk, int len, int replay)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_fc_replay_state *state;</div><div class='ctx'> 	struct ext4_fc_alloc_region *region;</div><div class='ctx'> </div><div class='ctx'> 	state = &amp;EXT4_SB(sb)-&gt;s_fc_replay_state;</div><div class='add'>+	/*</div><div class='add'>+	 * during replay phase, the fc_regions_valid may not same as</div><div class='add'>+	 * fc_regions_used, update it when do new additions.</div><div class='add'>+	 */</div><div class='add'>+	if (replay &amp;&amp; state-&gt;fc_regions_used != state-&gt;fc_regions_valid)</div><div class='add'>+		state-&gt;fc_regions_used = state-&gt;fc_regions_valid;</div><div class='ctx'> 	if (state-&gt;fc_regions_used == state-&gt;fc_regions_size) {</div><div class='add'>+		struct ext4_fc_alloc_region *fc_regions;</div><div class='add'>+</div><div class='add'>+		fc_regions = krealloc(state-&gt;fc_regions,</div><div class='add'>+				      sizeof(struct ext4_fc_alloc_region) *</div><div class='add'>+				      (state-&gt;fc_regions_size +</div><div class='add'>+				       EXT4_FC_REPLAY_REALLOC_INCREMENT),</div><div class='add'>+				      GFP_KERNEL);</div><div class='add'>+		if (!fc_regions)</div><div class='add'>+			return -ENOMEM;</div><div class='ctx'> 		state-&gt;fc_regions_size +=</div><div class='ctx'> 			EXT4_FC_REPLAY_REALLOC_INCREMENT;</div><div class='del'>-		state-&gt;fc_regions = krealloc(</div><div class='del'>-					state-&gt;fc_regions,</div><div class='del'>-					state-&gt;fc_regions_size *</div><div class='del'>-					sizeof(struct ext4_fc_alloc_region),</div><div class='del'>-					GFP_KERNEL);</div><div class='del'>-		if (!state-&gt;fc_regions)</div><div class='del'>-			return -ENOMEM;</div><div class='add'>+		state-&gt;fc_regions = fc_regions;</div><div class='ctx'> 	}</div><div class='ctx'> 	region = &amp;state-&gt;fc_regions[state-&gt;fc_regions_used++];</div><div class='ctx'> 	region-&gt;ino = ino;</div><div class='hunk'>@@ -1633,12 +1744,15 @@ static int ext4_fc_record_regions(struct super_block *sb, int ino,</div><div class='ctx'> 	region-&gt;pblk = pblk;</div><div class='ctx'> 	region-&gt;len = len;</div><div class='ctx'> </div><div class='add'>+	if (replay)</div><div class='add'>+		state-&gt;fc_regions_valid++;</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Replay add range tag */</div><div class='ctx'> static int ext4_fc_replay_add_range(struct super_block *sb,</div><div class='del'>-				    struct ext4_fc_tl *tl, u8 *val)</div><div class='add'>+				    struct ext4_fc_tl_mem *tl, u8 *val)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_fc_add_range fc_add_ex;</div><div class='ctx'> 	struct ext4_extent newex, *ex;</div><div class='hunk'>@@ -1659,11 +1773,13 @@ static int ext4_fc_replay_add_range(struct super_block *sb,</div><div class='ctx'> </div><div class='ctx'> 	inode = ext4_iget(sb, le32_to_cpu(fc_add_ex.fc_ino), EXT4_IGET_NORMAL);</div><div class='ctx'> 	if (IS_ERR(inode)) {</div><div class='del'>-		jbd_debug(1, "Inode not found.");</div><div class='add'>+		ext4_debug("Inode not found.");</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = ext4_fc_record_modified_inode(sb, inode-&gt;i_ino);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='ctx'> 	start = le32_to_cpu(ex-&gt;ee_block);</div><div class='ctx'> 	start_pblk = ext4_ext_pblock(ex);</div><div class='hunk'>@@ -1671,7 +1787,7 @@ static int ext4_fc_replay_add_range(struct super_block *sb,</div><div class='ctx'> </div><div class='ctx'> 	cur = start;</div><div class='ctx'> 	remaining = len;</div><div class='del'>-	jbd_debug(1, "ADD_RANGE, lblk %d, pblk %lld, len %d, unwritten %d, inode %ld\n",</div><div class='add'>+	ext4_debug("ADD_RANGE, lblk %d, pblk %lld, len %d, unwritten %d, inode %ld\n",</div><div class='ctx'> 		  start, start_pblk, len, ext4_ext_is_unwritten(ex),</div><div class='ctx'> 		  inode-&gt;i_ino);</div><div class='ctx'> </div><div class='hunk'>@@ -1681,18 +1797,14 @@ static int ext4_fc_replay_add_range(struct super_block *sb,</div><div class='ctx'> 		map.m_pblk = 0;</div><div class='ctx'> 		ret = ext4_map_blocks(NULL, inode, &amp;map, 0);</div><div class='ctx'> </div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			iput(inode);</div><div class='del'>-			return 0;</div><div class='del'>-		}</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out;</div><div class='ctx'> </div><div class='ctx'> 		if (ret == 0) {</div><div class='ctx'> 			/* Range is not mapped */</div><div class='del'>-			path = ext4_find_extent(inode, cur, NULL, 0);</div><div class='del'>-			if (IS_ERR(path)) {</div><div class='del'>-				iput(inode);</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='add'>+			path = ext4_find_extent(inode, cur, path, 0);</div><div class='add'>+			if (IS_ERR(path))</div><div class='add'>+				goto out;</div><div class='ctx'> 			memset(&amp;newex, 0, sizeof(newex));</div><div class='ctx'> 			newex.ee_block = cpu_to_le32(cur);</div><div class='ctx'> 			ext4_ext_store_pblock(</div><div class='hunk'>@@ -1701,15 +1813,11 @@ static int ext4_fc_replay_add_range(struct super_block *sb,</div><div class='ctx'> 			if (ext4_ext_is_unwritten(ex))</div><div class='ctx'> 				ext4_ext_mark_unwritten(&amp;newex);</div><div class='ctx'> 			down_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='del'>-			ret = ext4_ext_insert_extent(</div><div class='del'>-				NULL, inode, &amp;path, &amp;newex, 0);</div><div class='add'>+			path = ext4_ext_insert_extent(NULL, inode,</div><div class='add'>+						      path, &amp;newex, 0);</div><div class='ctx'> 			up_write((&amp;EXT4_I(inode)-&gt;i_data_sem));</div><div class='del'>-			ext4_ext_drop_refs(path);</div><div class='del'>-			kfree(path);</div><div class='del'>-			if (ret) {</div><div class='del'>-				iput(inode);</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='add'>+			if (IS_ERR(path))</div><div class='add'>+				goto out;</div><div class='ctx'> 			goto next;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -1722,10 +1830,8 @@ static int ext4_fc_replay_add_range(struct super_block *sb,</div><div class='ctx'> 			ret = ext4_ext_replay_update_ex(inode, cur, map.m_len,</div><div class='ctx'> 					ext4_ext_is_unwritten(ex),</div><div class='ctx'> 					start_pblk + cur - start);</div><div class='del'>-			if (ret) {</div><div class='del'>-				iput(inode);</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='add'>+			if (ret)</div><div class='add'>+				goto out;</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Mark the old blocks as free since they aren't used</div><div class='ctx'> 			 * anymore. We maintain an array of all the modified</div><div class='hunk'>@@ -1735,20 +1841,18 @@ static int ext4_fc_replay_add_range(struct super_block *sb,</div><div class='ctx'> 			 * at the end of the FC replay using our array of</div><div class='ctx'> 			 * modified inodes.</div><div class='ctx'> 			 */</div><div class='del'>-			ext4_mb_mark_bb(inode-&gt;i_sb, map.m_pblk, map.m_len, 0);</div><div class='add'>+			ext4_mb_mark_bb(inode-&gt;i_sb, map.m_pblk, map.m_len, false);</div><div class='ctx'> 			goto next;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* Range is mapped and needs a state change */</div><div class='del'>-		jbd_debug(1, "Converting from %ld to %d %lld",</div><div class='add'>+		ext4_debug("Converting from %ld to %d %lld",</div><div class='ctx'> 				map.m_flags &amp; EXT4_MAP_UNWRITTEN,</div><div class='ctx'> 			ext4_ext_is_unwritten(ex), map.m_pblk);</div><div class='ctx'> 		ret = ext4_ext_replay_update_ex(inode, cur, map.m_len,</div><div class='ctx'> 					ext4_ext_is_unwritten(ex), map.m_pblk);</div><div class='del'>-		if (ret) {</div><div class='del'>-			iput(inode);</div><div class='del'>-			return 0;</div><div class='del'>-		}</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out;</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We may have split the extent tree while toggling the state.</div><div class='ctx'> 		 * Try to shrink the extent tree now.</div><div class='hunk'>@@ -1760,14 +1864,16 @@ next:</div><div class='ctx'> 	}</div><div class='ctx'> 	ext4_ext_replay_shrink_inode(inode, i_size_read(inode) &gt;&gt;</div><div class='ctx'> 					sb-&gt;s_blocksize_bits);</div><div class='add'>+out:</div><div class='add'>+	ext4_free_ext_path(path);</div><div class='ctx'> 	iput(inode);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Replay DEL_RANGE tag */</div><div class='ctx'> static int</div><div class='del'>-ext4_fc_replay_del_range(struct super_block *sb, struct ext4_fc_tl *tl,</div><div class='del'>-			 u8 *val)</div><div class='add'>+ext4_fc_replay_del_range(struct super_block *sb,</div><div class='add'>+			 struct ext4_fc_tl_mem *tl, u8 *val)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct ext4_fc_del_range lrange;</div><div class='hunk'>@@ -1784,13 +1890,15 @@ ext4_fc_replay_del_range(struct super_block *sb, struct ext4_fc_tl *tl,</div><div class='ctx'> </div><div class='ctx'> 	inode = ext4_iget(sb, le32_to_cpu(lrange.fc_ino), EXT4_IGET_NORMAL);</div><div class='ctx'> 	if (IS_ERR(inode)) {</div><div class='del'>-		jbd_debug(1, "Inode %d not found", le32_to_cpu(lrange.fc_ino));</div><div class='add'>+		ext4_debug("Inode %d not found", le32_to_cpu(lrange.fc_ino));</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = ext4_fc_record_modified_inode(sb, inode-&gt;i_ino);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='del'>-	jbd_debug(1, "DEL_RANGE, inode %ld, lblk %d, len %d\n",</div><div class='add'>+	ext4_debug("DEL_RANGE, inode %ld, lblk %d, len %d\n",</div><div class='ctx'> 			inode-&gt;i_ino, le32_to_cpu(lrange.fc_lblk),</div><div class='ctx'> 			le32_to_cpu(lrange.fc_len));</div><div class='ctx'> 	while (remaining &gt; 0) {</div><div class='hunk'>@@ -1798,30 +1906,30 @@ ext4_fc_replay_del_range(struct super_block *sb, struct ext4_fc_tl *tl,</div><div class='ctx'> 		map.m_len = remaining;</div><div class='ctx'> </div><div class='ctx'> 		ret = ext4_map_blocks(NULL, inode, &amp;map, 0);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			iput(inode);</div><div class='del'>-			return 0;</div><div class='del'>-		}</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out;</div><div class='ctx'> 		if (ret &gt; 0) {</div><div class='ctx'> 			remaining -= ret;</div><div class='ctx'> 			cur += ret;</div><div class='del'>-			ext4_mb_mark_bb(inode-&gt;i_sb, map.m_pblk, map.m_len, 0);</div><div class='add'>+			ext4_mb_mark_bb(inode-&gt;i_sb, map.m_pblk, map.m_len, false);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			remaining -= map.m_len;</div><div class='ctx'> 			cur += map.m_len;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = ext4_punch_hole(inode,</div><div class='del'>-		le32_to_cpu(lrange.fc_lblk) &lt;&lt; sb-&gt;s_blocksize_bits,</div><div class='del'>-		le32_to_cpu(lrange.fc_len) &lt;&lt;  sb-&gt;s_blocksize_bits);</div><div class='add'>+	down_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='add'>+	ret = ext4_ext_remove_space(inode, le32_to_cpu(lrange.fc_lblk),</div><div class='add'>+				le32_to_cpu(lrange.fc_lblk) +</div><div class='add'>+				le32_to_cpu(lrange.fc_len) - 1);</div><div class='add'>+	up_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		jbd_debug(1, "ext4_punch_hole returned %d", ret);</div><div class='add'>+		goto out;</div><div class='ctx'> 	ext4_ext_replay_shrink_inode(inode,</div><div class='ctx'> 		i_size_read(inode) &gt;&gt; sb-&gt;s_blocksize_bits);</div><div class='ctx'> 	ext4_mark_inode_dirty(NULL, inode);</div><div class='add'>+out:</div><div class='ctx'> 	iput(inode);</div><div class='del'>-</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1839,7 +1947,7 @@ static void ext4_fc_set_bitmaps_and_counters(struct super_block *sb)</div><div class='ctx'> 		inode = ext4_iget(sb, state-&gt;fc_modified_inodes[i],</div><div class='ctx'> 			EXT4_IGET_NORMAL);</div><div class='ctx'> 		if (IS_ERR(inode)) {</div><div class='del'>-			jbd_debug(1, "Inode %d not found.",</div><div class='add'>+			ext4_debug("Inode %d not found.",</div><div class='ctx'> 				state-&gt;fc_modified_inodes[i]);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1858,23 +1966,25 @@ static void ext4_fc_set_bitmaps_and_counters(struct super_block *sb)</div><div class='ctx'> 				break;</div><div class='ctx'> </div><div class='ctx'> 			if (ret &gt; 0) {</div><div class='del'>-				path = ext4_find_extent(inode, map.m_lblk, NULL, 0);</div><div class='add'>+				path = ext4_find_extent(inode, map.m_lblk, path, 0);</div><div class='ctx'> 				if (!IS_ERR(path)) {</div><div class='ctx'> 					for (j = 0; j &lt; path-&gt;p_depth; j++)</div><div class='ctx'> 						ext4_mb_mark_bb(inode-&gt;i_sb,</div><div class='del'>-							path[j].p_block, 1, 1);</div><div class='del'>-					ext4_ext_drop_refs(path);</div><div class='del'>-					kfree(path);</div><div class='add'>+							path[j].p_block, 1, true);</div><div class='add'>+				} else {</div><div class='add'>+					path = NULL;</div><div class='ctx'> 				}</div><div class='ctx'> 				cur += ret;</div><div class='ctx'> 				ext4_mb_mark_bb(inode-&gt;i_sb, map.m_pblk,</div><div class='del'>-							map.m_len, 1);</div><div class='add'>+							map.m_len, true);</div><div class='ctx'> 			} else {</div><div class='ctx'> 				cur = cur + (map.m_len ? map.m_len : 1);</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 		iput(inode);</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	ext4_free_ext_path(path);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1892,8 +2002,8 @@ bool ext4_fc_replay_check_excluded(struct super_block *sb, ext4_fsblk_t blk)</div><div class='ctx'> 		if (state-&gt;fc_regions[i].ino == 0 ||</div><div class='ctx'> 			state-&gt;fc_regions[i].len == 0)</div><div class='ctx'> 			continue;</div><div class='del'>-		if (blk &gt;= state-&gt;fc_regions[i].pblk &amp;&amp;</div><div class='del'>-		    blk &lt; state-&gt;fc_regions[i].pblk + state-&gt;fc_regions[i].len)</div><div class='add'>+		if (in_range(blk, state-&gt;fc_regions[i].pblk,</div><div class='add'>+					state-&gt;fc_regions[i].len))</div><div class='ctx'> 			return true;</div><div class='ctx'> 	}</div><div class='ctx'> 	return false;</div><div class='hunk'>@@ -1909,6 +2019,33 @@ void ext4_fc_replay_cleanup(struct super_block *sb)</div><div class='ctx'> 	kfree(sbi-&gt;s_fc_replay_state.fc_modified_inodes);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool ext4_fc_value_len_isvalid(struct ext4_sb_info *sbi,</div><div class='add'>+				      int tag, int len)</div><div class='add'>+{</div><div class='add'>+	switch (tag) {</div><div class='add'>+	case EXT4_FC_TAG_ADD_RANGE:</div><div class='add'>+		return len == sizeof(struct ext4_fc_add_range);</div><div class='add'>+	case EXT4_FC_TAG_DEL_RANGE:</div><div class='add'>+		return len == sizeof(struct ext4_fc_del_range);</div><div class='add'>+	case EXT4_FC_TAG_CREAT:</div><div class='add'>+	case EXT4_FC_TAG_LINK:</div><div class='add'>+	case EXT4_FC_TAG_UNLINK:</div><div class='add'>+		len -= sizeof(struct ext4_fc_dentry_info);</div><div class='add'>+		return len &gt;= 1 &amp;&amp; len &lt;= EXT4_NAME_LEN;</div><div class='add'>+	case EXT4_FC_TAG_INODE:</div><div class='add'>+		len -= sizeof(struct ext4_fc_inode);</div><div class='add'>+		return len &gt;= EXT4_GOOD_OLD_INODE_SIZE &amp;&amp;</div><div class='add'>+			len &lt;= sbi-&gt;s_inode_size;</div><div class='add'>+	case EXT4_FC_TAG_PAD:</div><div class='add'>+		return true; /* padding can have any length */</div><div class='add'>+	case EXT4_FC_TAG_TAIL:</div><div class='add'>+		return len &gt;= sizeof(struct ext4_fc_tail);</div><div class='add'>+	case EXT4_FC_TAG_HEAD:</div><div class='add'>+		return len == sizeof(struct ext4_fc_head);</div><div class='add'>+	}</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Recovery Scan phase handler</div><div class='ctx'>  *</div><div class='hunk'>@@ -1935,7 +2072,7 @@ static int ext4_fc_replay_scan(journal_t *journal,</div><div class='ctx'> 	struct ext4_fc_replay_state *state;</div><div class='ctx'> 	int ret = JBD2_FC_REPLAY_CONTINUE;</div><div class='ctx'> 	struct ext4_fc_add_range ext;</div><div class='del'>-	struct ext4_fc_tl tl;</div><div class='add'>+	struct ext4_fc_tl_mem tl;</div><div class='ctx'> 	struct ext4_fc_tail tail;</div><div class='ctx'> 	__u8 *start, *end, *cur, *val;</div><div class='ctx'> 	struct ext4_fc_head head;</div><div class='hunk'>@@ -1944,7 +2081,7 @@ static int ext4_fc_replay_scan(journal_t *journal,</div><div class='ctx'> 	state = &amp;sbi-&gt;s_fc_replay_state;</div><div class='ctx'> </div><div class='ctx'> 	start = (u8 *)bh-&gt;b_data;</div><div class='del'>-	end = (__u8 *)bh-&gt;b_data + journal-&gt;j_blocksize - 1;</div><div class='add'>+	end = start + journal-&gt;j_blocksize;</div><div class='ctx'> </div><div class='ctx'> 	if (state-&gt;fc_replay_expected_off == 0) {</div><div class='ctx'> 		state-&gt;fc_cur_tag = 0;</div><div class='hunk'>@@ -1965,19 +2102,26 @@ static int ext4_fc_replay_scan(journal_t *journal,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	state-&gt;fc_replay_expected_off++;</div><div class='del'>-	for (cur = start; cur &lt; end; cur = cur + sizeof(tl) + le16_to_cpu(tl.fc_len)) {</div><div class='del'>-		memcpy(&amp;tl, cur, sizeof(tl));</div><div class='del'>-		val = cur + sizeof(tl);</div><div class='del'>-		jbd_debug(3, "Scan phase, tag:%s, blk %lld\n",</div><div class='del'>-			  tag2str(le16_to_cpu(tl.fc_tag)), bh-&gt;b_blocknr);</div><div class='del'>-		switch (le16_to_cpu(tl.fc_tag)) {</div><div class='add'>+	for (cur = start; cur &lt;= end - EXT4_FC_TAG_BASE_LEN;</div><div class='add'>+	     cur = cur + EXT4_FC_TAG_BASE_LEN + tl.fc_len) {</div><div class='add'>+		ext4_fc_get_tl(&amp;tl, cur);</div><div class='add'>+		val = cur + EXT4_FC_TAG_BASE_LEN;</div><div class='add'>+		if (tl.fc_len &gt; end - val ||</div><div class='add'>+		    !ext4_fc_value_len_isvalid(sbi, tl.fc_tag, tl.fc_len)) {</div><div class='add'>+			ret = state-&gt;fc_replay_num_tags ?</div><div class='add'>+				JBD2_FC_REPLAY_STOP : -ECANCELED;</div><div class='add'>+			goto out_err;</div><div class='add'>+		}</div><div class='add'>+		ext4_debug("Scan phase, tag:%s, blk %lld\n",</div><div class='add'>+			   tag2str(tl.fc_tag), bh-&gt;b_blocknr);</div><div class='add'>+		switch (tl.fc_tag) {</div><div class='ctx'> 		case EXT4_FC_TAG_ADD_RANGE:</div><div class='ctx'> 			memcpy(&amp;ext, val, sizeof(ext));</div><div class='ctx'> 			ex = (struct ext4_extent *)&amp;ext.fc_ex;</div><div class='ctx'> 			ret = ext4_fc_record_regions(sb,</div><div class='ctx'> 				le32_to_cpu(ext.fc_ino),</div><div class='ctx'> 				le32_to_cpu(ex-&gt;ee_block), ext4_ext_pblock(ex),</div><div class='del'>-				ext4_ext_get_actual_len(ex));</div><div class='add'>+				ext4_ext_get_actual_len(ex), 0);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='ctx'> 				break;</div><div class='ctx'> 			ret = JBD2_FC_REPLAY_CONTINUE;</div><div class='hunk'>@@ -1989,14 +2133,14 @@ static int ext4_fc_replay_scan(journal_t *journal,</div><div class='ctx'> 		case EXT4_FC_TAG_INODE:</div><div class='ctx'> 		case EXT4_FC_TAG_PAD:</div><div class='ctx'> 			state-&gt;fc_cur_tag++;</div><div class='del'>-			state-&gt;fc_crc = ext4_chksum(sbi, state-&gt;fc_crc, cur,</div><div class='del'>-					sizeof(tl) + le16_to_cpu(tl.fc_len));</div><div class='add'>+			state-&gt;fc_crc = ext4_chksum(state-&gt;fc_crc, cur,</div><div class='add'>+				EXT4_FC_TAG_BASE_LEN + tl.fc_len);</div><div class='ctx'> 			break;</div><div class='ctx'> 		case EXT4_FC_TAG_TAIL:</div><div class='ctx'> 			state-&gt;fc_cur_tag++;</div><div class='ctx'> 			memcpy(&amp;tail, val, sizeof(tail));</div><div class='del'>-			state-&gt;fc_crc = ext4_chksum(sbi, state-&gt;fc_crc, cur,</div><div class='del'>-						sizeof(tl) +</div><div class='add'>+			state-&gt;fc_crc = ext4_chksum(state-&gt;fc_crc, cur,</div><div class='add'>+						EXT4_FC_TAG_BASE_LEN +</div><div class='ctx'> 						offsetof(struct ext4_fc_tail,</div><div class='ctx'> 						fc_crc));</div><div class='ctx'> 			if (le32_to_cpu(tail.fc_tid) == expected_tid &amp;&amp;</div><div class='hunk'>@@ -2022,8 +2166,8 @@ static int ext4_fc_replay_scan(journal_t *journal,</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> 			state-&gt;fc_cur_tag++;</div><div class='del'>-			state-&gt;fc_crc = ext4_chksum(sbi, state-&gt;fc_crc, cur,</div><div class='del'>-					    sizeof(tl) + le16_to_cpu(tl.fc_len));</div><div class='add'>+			state-&gt;fc_crc = ext4_chksum(state-&gt;fc_crc, cur,</div><div class='add'>+				EXT4_FC_TAG_BASE_LEN + tl.fc_len);</div><div class='ctx'> 			break;</div><div class='ctx'> 		default:</div><div class='ctx'> 			ret = state-&gt;fc_replay_num_tags ?</div><div class='hunk'>@@ -2047,7 +2191,7 @@ static int ext4_fc_replay(journal_t *journal, struct buffer_head *bh,</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = journal-&gt;j_private;</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='del'>-	struct ext4_fc_tl tl;</div><div class='add'>+	struct ext4_fc_tl_mem tl;</div><div class='ctx'> 	__u8 *start, *end, *cur, *val;</div><div class='ctx'> 	int ret = JBD2_FC_REPLAY_CONTINUE;</div><div class='ctx'> 	struct ext4_fc_replay_state *state = &amp;sbi-&gt;s_fc_replay_state;</div><div class='hunk'>@@ -2063,7 +2207,7 @@ static int ext4_fc_replay(journal_t *journal, struct buffer_head *bh,</div><div class='ctx'> 		sbi-&gt;s_mount_state |= EXT4_FC_REPLAY;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!sbi-&gt;s_fc_replay_state.fc_replay_num_tags) {</div><div class='del'>-		jbd_debug(1, "Replay stops\n");</div><div class='add'>+		ext4_debug("Replay stops\n");</div><div class='ctx'> 		ext4_fc_set_bitmaps_and_counters(sb);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2076,21 +2220,22 @@ static int ext4_fc_replay(journal_t *journal, struct buffer_head *bh,</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> 	start = (u8 *)bh-&gt;b_data;</div><div class='del'>-	end = (__u8 *)bh-&gt;b_data + journal-&gt;j_blocksize - 1;</div><div class='add'>+	end = start + journal-&gt;j_blocksize;</div><div class='ctx'> </div><div class='del'>-	for (cur = start; cur &lt; end; cur = cur + sizeof(tl) + le16_to_cpu(tl.fc_len)) {</div><div class='del'>-		memcpy(&amp;tl, cur, sizeof(tl));</div><div class='del'>-		val = cur + sizeof(tl);</div><div class='add'>+	for (cur = start; cur &lt;= end - EXT4_FC_TAG_BASE_LEN;</div><div class='add'>+	     cur = cur + EXT4_FC_TAG_BASE_LEN + tl.fc_len) {</div><div class='add'>+		ext4_fc_get_tl(&amp;tl, cur);</div><div class='add'>+		val = cur + EXT4_FC_TAG_BASE_LEN;</div><div class='ctx'> </div><div class='ctx'> 		if (state-&gt;fc_replay_num_tags == 0) {</div><div class='ctx'> 			ret = JBD2_FC_REPLAY_STOP;</div><div class='ctx'> 			ext4_fc_set_bitmaps_and_counters(sb);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-		jbd_debug(3, "Replay phase, tag:%s\n",</div><div class='del'>-				tag2str(le16_to_cpu(tl.fc_tag)));</div><div class='add'>+</div><div class='add'>+		ext4_debug("Replay phase, tag:%s\n", tag2str(tl.fc_tag));</div><div class='ctx'> 		state-&gt;fc_replay_num_tags--;</div><div class='del'>-		switch (le16_to_cpu(tl.fc_tag)) {</div><div class='add'>+		switch (tl.fc_tag) {</div><div class='ctx'> 		case EXT4_FC_TAG_LINK:</div><div class='ctx'> 			ret = ext4_fc_replay_link(sb, &amp;tl, val);</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -2111,19 +2256,18 @@ static int ext4_fc_replay(journal_t *journal, struct buffer_head *bh,</div><div class='ctx'> 			break;</div><div class='ctx'> 		case EXT4_FC_TAG_PAD:</div><div class='ctx'> 			trace_ext4_fc_replay(sb, EXT4_FC_TAG_PAD, 0,</div><div class='del'>-					     le16_to_cpu(tl.fc_len), 0);</div><div class='add'>+					     tl.fc_len, 0);</div><div class='ctx'> 			break;</div><div class='ctx'> 		case EXT4_FC_TAG_TAIL:</div><div class='del'>-			trace_ext4_fc_replay(sb, EXT4_FC_TAG_TAIL, 0,</div><div class='del'>-					     le16_to_cpu(tl.fc_len), 0);</div><div class='add'>+			trace_ext4_fc_replay(sb, EXT4_FC_TAG_TAIL,</div><div class='add'>+					     0, tl.fc_len, 0);</div><div class='ctx'> 			memcpy(&amp;tail, val, sizeof(tail));</div><div class='ctx'> 			WARN_ON(le32_to_cpu(tail.fc_tid) != expected_tid);</div><div class='ctx'> 			break;</div><div class='ctx'> 		case EXT4_FC_TAG_HEAD:</div><div class='ctx'> 			break;</div><div class='ctx'> 		default:</div><div class='del'>-			trace_ext4_fc_replay(sb, le16_to_cpu(tl.fc_tag), 0,</div><div class='del'>-					     le16_to_cpu(tl.fc_len), 0);</div><div class='add'>+			trace_ext4_fc_replay(sb, tl.fc_tag, 0, tl.fc_len, 0);</div><div class='ctx'> 			ret = -ECANCELED;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2147,17 +2291,17 @@ void ext4_fc_init(struct super_block *sb, journal_t *journal)</div><div class='ctx'> 	journal-&gt;j_fc_cleanup_callback = ext4_fc_cleanup;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static const char *fc_ineligible_reasons[] = {</div><div class='del'>-	"Extended attributes changed",</div><div class='del'>-	"Cross rename",</div><div class='del'>-	"Journal flag changed",</div><div class='del'>-	"Insufficient memory",</div><div class='del'>-	"Swap boot",</div><div class='del'>-	"Resize",</div><div class='del'>-	"Dir renamed",</div><div class='del'>-	"Falloc range op",</div><div class='del'>-	"Data journalling",</div><div class='del'>-	"FC Commit Failed"</div><div class='add'>+static const char * const fc_ineligible_reasons[] = {</div><div class='add'>+	[EXT4_FC_REASON_XATTR] = "Extended attributes changed",</div><div class='add'>+	[EXT4_FC_REASON_CROSS_RENAME] = "Cross rename",</div><div class='add'>+	[EXT4_FC_REASON_JOURNAL_FLAG_CHANGE] = "Journal flag changed",</div><div class='add'>+	[EXT4_FC_REASON_NOMEM] = "Insufficient memory",</div><div class='add'>+	[EXT4_FC_REASON_SWAP_BOOT] = "Swap boot",</div><div class='add'>+	[EXT4_FC_REASON_RESIZE] = "Resize",</div><div class='add'>+	[EXT4_FC_REASON_RENAME_DIR] = "Dir renamed",</div><div class='add'>+	[EXT4_FC_REASON_FALLOC_RANGE] = "Falloc range op",</div><div class='add'>+	[EXT4_FC_REASON_INODE_JOURNAL_DATA] = "Data journalling",</div><div class='add'>+	[EXT4_FC_REASON_ENCRYPTED_FILENAME] = "Encrypted filename",</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> int ext4_fc_info_show(struct seq_file *seq, void *v)</div><div class='hunk'>@@ -2173,7 +2317,7 @@ int ext4_fc_info_show(struct seq_file *seq, void *v)</div><div class='ctx'> 		"fc stats:\n%ld commits\n%ld ineligible\n%ld numblks\n%lluus avg_commit_time\n",</div><div class='ctx'> 		   stats-&gt;fc_num_commits, stats-&gt;fc_ineligible_commits,</div><div class='ctx'> 		   stats-&gt;fc_numblks,</div><div class='del'>-		   div_u64(sbi-&gt;s_fc_avg_commit_time, 1000));</div><div class='add'>+		   div_u64(stats-&gt;s_fc_avg_commit_time, 1000));</div><div class='ctx'> 	seq_puts(seq, "Ineligible reasons:\n");</div><div class='ctx'> 	for (i = 0; i &lt; EXT4_FC_REASON_MAX; i++)</div><div class='ctx'> 		seq_printf(seq, "\"%s\":\t%d\n", fc_ineligible_reasons[i],</div><div class='hunk'>@@ -2192,3 +2336,8 @@ int __init ext4_fc_init_dentry_cache(void)</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+void ext4_fc_destroy_dentry_cache(void)</div><div class='add'>+{</div><div class='add'>+	kmem_cache_destroy(ext4_fc_dentry_cachep);</div><div class='add'>+}</div><div class='head'>diff --git a/fs/ext4/fast_commit.h b/fs/ext4/fast_commit.h<br/>index 937c381b4c85..3bd534e4dbbf 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/fast_commit.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/fast_commit.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/fast_commit.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/fast_commit.h</a></div><div class='hunk'>@@ -55,13 +55,13 @@ struct ext4_fc_del_range {</div><div class='ctx'> struct ext4_fc_dentry_info {</div><div class='ctx'> 	__le32 fc_parent_ino;</div><div class='ctx'> 	__le32 fc_ino;</div><div class='del'>-	__u8 fc_dname[0];</div><div class='add'>+	__u8 fc_dname[];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/* Value structure for EXT4_FC_TAG_INODE and EXT4_FC_TAG_INODE_PARTIAL. */</div><div class='add'>+/* Value structure for EXT4_FC_TAG_INODE. */</div><div class='ctx'> struct ext4_fc_inode {</div><div class='ctx'> 	__le32 fc_ino;</div><div class='del'>-	__u8 fc_raw_inode[0];</div><div class='add'>+	__u8 fc_raw_inode[];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /* Value structure for tag EXT4_FC_TAG_TAIL. */</div><div class='hunk'>@@ -70,22 +70,23 @@ struct ext4_fc_tail {</div><div class='ctx'> 	__le32 fc_crc;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+/* Tag base length */</div><div class='add'>+#define EXT4_FC_TAG_BASE_LEN (sizeof(struct ext4_fc_tl))</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Fast commit status codes</div><div class='add'>+ */</div><div class='add'>+enum {</div><div class='add'>+	EXT4_FC_STATUS_OK = 0,</div><div class='add'>+	EXT4_FC_STATUS_INELIGIBLE,</div><div class='add'>+	EXT4_FC_STATUS_SKIPPED,</div><div class='add'>+	EXT4_FC_STATUS_FAILED,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> /*</div><div class='del'>- * Fast commit reason codes</div><div class='add'>+ * Fast commit ineligiblity reasons:</div><div class='ctx'>  */</div><div class='ctx'> enum {</div><div class='del'>-	/*</div><div class='del'>-	 * Commit status codes:</div><div class='del'>-	 */</div><div class='del'>-	EXT4_FC_REASON_OK = 0,</div><div class='del'>-	EXT4_FC_REASON_INELIGIBLE,</div><div class='del'>-	EXT4_FC_REASON_ALREADY_COMMITTED,</div><div class='del'>-	EXT4_FC_REASON_FC_START_FAILED,</div><div class='del'>-	EXT4_FC_REASON_FC_FAILED,</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Fast commit ineligiblity reasons:</div><div class='del'>-	 */</div><div class='ctx'> 	EXT4_FC_REASON_XATTR = 0,</div><div class='ctx'> 	EXT4_FC_REASON_CROSS_RENAME,</div><div class='ctx'> 	EXT4_FC_REASON_JOURNAL_FLAG_CHANGE,</div><div class='hunk'>@@ -95,7 +96,7 @@ enum {</div><div class='ctx'> 	EXT4_FC_REASON_RENAME_DIR,</div><div class='ctx'> 	EXT4_FC_REASON_FALLOC_RANGE,</div><div class='ctx'> 	EXT4_FC_REASON_INODE_JOURNAL_DATA,</div><div class='del'>-	EXT4_FC_COMMIT_FAILED,</div><div class='add'>+	EXT4_FC_REASON_ENCRYPTED_FILENAME,</div><div class='ctx'> 	EXT4_FC_REASON_MAX</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -108,16 +109,19 @@ struct ext4_fc_dentry_update {</div><div class='ctx'> 	int fcd_op;		/* Type of update create / unlink / link */</div><div class='ctx'> 	int fcd_parent;		/* Parent inode number */</div><div class='ctx'> 	int fcd_ino;		/* Inode number */</div><div class='del'>-	struct qstr fcd_name;	/* Dirent name */</div><div class='del'>-	unsigned char fcd_iname[DNAME_INLINE_LEN];	/* Dirent name string */</div><div class='add'>+	struct name_snapshot fcd_name;	/* Dirent name */</div><div class='ctx'> 	struct list_head fcd_list;</div><div class='add'>+	struct list_head fcd_dilist;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct ext4_fc_stats {</div><div class='ctx'> 	unsigned int fc_ineligible_reason_count[EXT4_FC_REASON_MAX];</div><div class='ctx'> 	unsigned long fc_num_commits;</div><div class='ctx'> 	unsigned long fc_ineligible_commits;</div><div class='add'>+	unsigned long fc_failed_commits;</div><div class='add'>+	unsigned long fc_skipped_commits;</div><div class='ctx'> 	unsigned long fc_numblks;</div><div class='add'>+	u64 s_fc_avg_commit_time;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> #define EXT4_FC_REPLAY_REALLOC_INCREMENT	4</div><div class='head'>diff --git a/fs/ext4/file.c b/fs/ext4/file.c<br/>index 4c5f41052351..7a8b30932189 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/file.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/file.c</a></div><div class='hunk'>@@ -36,17 +36,34 @@</div><div class='ctx'> #include "acl.h"</div><div class='ctx'> #include "truncate.h"</div><div class='ctx'> </div><div class='del'>-static bool ext4_dio_supported(struct inode *inode)</div><div class='add'>+/*</div><div class='add'>+ * Returns %true if the given DIO request should be attempted with DIO, or</div><div class='add'>+ * %false if it should fall back to buffered I/O.</div><div class='add'>+ *</div><div class='add'>+ * DIO isn't well specified; when it's unsupported (either due to the request</div><div class='add'>+ * being misaligned, or due to the file not supporting DIO at all), filesystems</div><div class='add'>+ * either fall back to buffered I/O or return EINVAL.  For files that don't use</div><div class='add'>+ * any special features like encryption or verity, ext4 has traditionally</div><div class='add'>+ * returned EINVAL for misaligned DIO.  iomap_dio_rw() uses this convention too.</div><div class='add'>+ * In this case, we should attempt the DIO, *not* fall back to buffered I/O.</div><div class='add'>+ *</div><div class='add'>+ * In contrast, in cases where DIO is unsupported due to ext4 features, ext4</div><div class='add'>+ * traditionally falls back to buffered I/O.</div><div class='add'>+ *</div><div class='add'>+ * This function implements the traditional ext4 behavior in all these cases.</div><div class='add'>+ */</div><div class='add'>+static bool ext4_should_use_dio(struct kiocb *iocb, struct iov_iter *iter)</div><div class='ctx'> {</div><div class='del'>-	if (IS_ENABLED(CONFIG_FS_ENCRYPTION) &amp;&amp; IS_ENCRYPTED(inode))</div><div class='del'>-		return false;</div><div class='del'>-	if (fsverity_active(inode))</div><div class='del'>-		return false;</div><div class='del'>-	if (ext4_should_journal_data(inode))</div><div class='del'>-		return false;</div><div class='del'>-	if (ext4_has_inline_data(inode))</div><div class='add'>+	struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='add'>+	u32 dio_align = ext4_dio_alignment(inode);</div><div class='add'>+</div><div class='add'>+	if (dio_align == 0)</div><div class='ctx'> 		return false;</div><div class='del'>-	return true;</div><div class='add'>+</div><div class='add'>+	if (dio_align == 1)</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	return IS_ALIGNED(iocb-&gt;ki_pos | iov_iter_alignment(iter), dio_align);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t ext4_dio_read_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='hunk'>@@ -61,7 +78,7 @@ static ssize_t ext4_dio_read_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='ctx'> 		inode_lock_shared(inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!ext4_dio_supported(inode)) {</div><div class='add'>+	if (!ext4_should_use_dio(iocb, to)) {</div><div class='ctx'> 		inode_unlock_shared(inode);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Fallback to buffered I/O if the operation being performed on</div><div class='hunk'>@@ -74,7 +91,7 @@ static ssize_t ext4_dio_read_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='ctx'> 		return generic_file_read_iter(iocb, to);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = iomap_dio_rw(iocb, to, &amp;ext4_iomap_ops, NULL, 0, 0);</div><div class='add'>+	ret = iomap_dio_rw(iocb, to, &amp;ext4_iomap_ops, NULL, 0, NULL, 0);</div><div class='ctx'> 	inode_unlock_shared(inode);</div><div class='ctx'> </div><div class='ctx'> 	file_accessed(iocb-&gt;ki_filp);</div><div class='hunk'>@@ -114,7 +131,7 @@ static ssize_t ext4_file_read_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ext4_forced_shutdown(EXT4_SB(inode-&gt;i_sb))))</div><div class='add'>+	if (unlikely(ext4_forced_shutdown(inode-&gt;i_sb)))</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> </div><div class='ctx'> 	if (!iov_iter_count(to))</div><div class='hunk'>@@ -130,6 +147,17 @@ static ssize_t ext4_file_read_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='ctx'> 	return generic_file_read_iter(iocb, to);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static ssize_t ext4_file_splice_read(struct file *in, loff_t *ppos,</div><div class='add'>+				     struct pipe_inode_info *pipe,</div><div class='add'>+				     size_t len, unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file_inode(in);</div><div class='add'>+</div><div class='add'>+	if (unlikely(ext4_forced_shutdown(inode-&gt;i_sb)))</div><div class='add'>+		return -EIO;</div><div class='add'>+	return filemap_splice_read(in, ppos, pipe, len, flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Called when an inode is released. Note that this is different</div><div class='ctx'>  * from ext4_file_open: open gets called at every open, but release</div><div class='hunk'>@@ -146,7 +174,7 @@ static int ext4_release_file(struct inode *inode, struct file *filp)</div><div class='ctx'> 			(atomic_read(&amp;inode-&gt;i_writecount) == 1) &amp;&amp;</div><div class='ctx'> 			!EXT4_I(inode)-&gt;i_reserved_data_blocks) {</div><div class='ctx'> 		down_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='del'>-		ext4_discard_preallocations(inode, 0);</div><div class='add'>+		ext4_discard_preallocations(inode);</div><div class='ctx'> 		up_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (is_dx(inode) &amp;&amp; filp-&gt;private_data)</div><div class='hunk'>@@ -185,8 +213,9 @@ ext4_extending_io(struct inode *inode, loff_t offset, size_t len)</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Is IO overwriting allocated and initialized blocks? */</div><div class='del'>-static bool ext4_overwrite_io(struct inode *inode, loff_t pos, loff_t len)</div><div class='add'>+/* Is IO overwriting allocated or initialized blocks? */</div><div class='add'>+static bool ext4_overwrite_io(struct inode *inode,</div><div class='add'>+			      loff_t pos, loff_t len, bool *unwritten)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_map_blocks map;</div><div class='ctx'> 	unsigned int blkbits = inode-&gt;i_blkbits;</div><div class='hunk'>@@ -200,12 +229,15 @@ static bool ext4_overwrite_io(struct inode *inode, loff_t pos, loff_t len)</div><div class='ctx'> 	blklen = map.m_len;</div><div class='ctx'> </div><div class='ctx'> 	err = ext4_map_blocks(NULL, inode, &amp;map, 0);</div><div class='add'>+	if (err != blklen)</div><div class='add'>+		return false;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * 'err==len' means that all of the blocks have been preallocated,</div><div class='del'>-	 * regardless of whether they have been initialized or not. To exclude</div><div class='del'>-	 * unwritten extents, we need to check m_flags.</div><div class='add'>+	 * regardless of whether they have been initialized or not. We need to</div><div class='add'>+	 * check m_flags to distinguish the unwritten extents.</div><div class='ctx'> 	 */</div><div class='del'>-	return err == blklen &amp;&amp; (map.m_flags &amp; EXT4_MAP_MAPPED);</div><div class='add'>+	*unwritten = !(map.m_flags &amp; EXT4_MAP_MAPPED);</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t ext4_generic_write_checks(struct kiocb *iocb,</div><div class='hunk'>@@ -259,102 +291,53 @@ static ssize_t ext4_buffered_write_iter(struct kiocb *iocb,</div><div class='ctx'> 	if (iocb-&gt;ki_flags &amp; IOCB_NOWAIT)</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='del'>-	ext4_fc_start_update(inode);</div><div class='ctx'> 	inode_lock(inode);</div><div class='ctx'> 	ret = ext4_write_checks(iocb, from);</div><div class='ctx'> 	if (ret &lt;= 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	current-&gt;backing_dev_info = inode_to_bdi(inode);</div><div class='del'>-	ret = generic_perform_write(iocb-&gt;ki_filp, from, iocb-&gt;ki_pos);</div><div class='del'>-	current-&gt;backing_dev_info = NULL;</div><div class='add'>+	ret = generic_perform_write(iocb, from);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	inode_unlock(inode);</div><div class='del'>-	ext4_fc_stop_update(inode);</div><div class='del'>-	if (likely(ret &gt; 0)) {</div><div class='del'>-		iocb-&gt;ki_pos += ret;</div><div class='del'>-		ret = generic_write_sync(iocb, ret);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='add'>+	if (unlikely(ret &lt;= 0))</div><div class='add'>+		return ret;</div><div class='add'>+	return generic_write_sync(iocb, ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t ext4_handle_inode_extension(struct inode *inode, loff_t offset,</div><div class='del'>-					   ssize_t written, size_t count)</div><div class='add'>+					   ssize_t written, ssize_t count)</div><div class='ctx'> {</div><div class='ctx'> 	handle_t *handle;</div><div class='del'>-	bool truncate = false;</div><div class='del'>-	u8 blkbits = inode-&gt;i_blkbits;</div><div class='del'>-	ext4_lblk_t written_blk, end_blk;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Note that EXT4_I(inode)-&gt;i_disksize can get extended up to</div><div class='del'>-	 * inode-&gt;i_size while the I/O was running due to writeback of delalloc</div><div class='del'>-	 * blocks. But, the code in ext4_iomap_alloc() is careful to use</div><div class='del'>-	 * zeroed/unwritten extents if this is possible; thus we won't leave</div><div class='del'>-	 * uninitialized blocks in a file even if we didn't succeed in writing</div><div class='del'>-	 * as much as we intended.</div><div class='del'>-	 */</div><div class='del'>-	WARN_ON_ONCE(i_size_read(inode) &lt; EXT4_I(inode)-&gt;i_disksize);</div><div class='del'>-	if (offset + count &lt;= EXT4_I(inode)-&gt;i_disksize) {</div><div class='del'>-		/*</div><div class='del'>-		 * We need to ensure that the inode is removed from the orphan</div><div class='del'>-		 * list if it has been added prematurely, due to writeback of</div><div class='del'>-		 * delalloc blocks.</div><div class='del'>-		 */</div><div class='del'>-		if (!list_empty(&amp;EXT4_I(inode)-&gt;i_orphan) &amp;&amp; inode-&gt;i_nlink) {</div><div class='del'>-			handle = ext4_journal_start(inode, EXT4_HT_INODE, 2);</div><div class='del'>-</div><div class='del'>-			if (IS_ERR(handle)) {</div><div class='del'>-				ext4_orphan_del(NULL, inode);</div><div class='del'>-				return PTR_ERR(handle);</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			ext4_orphan_del(handle, inode);</div><div class='del'>-			ext4_journal_stop(handle);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		return written;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (written &lt; 0)</div><div class='del'>-		goto truncate;</div><div class='ctx'> </div><div class='add'>+	lockdep_assert_held_write(&amp;inode-&gt;i_rwsem);</div><div class='ctx'> 	handle = ext4_journal_start(inode, EXT4_HT_INODE, 2);</div><div class='del'>-	if (IS_ERR(handle)) {</div><div class='del'>-		written = PTR_ERR(handle);</div><div class='del'>-		goto truncate;</div><div class='del'>-	}</div><div class='add'>+	if (IS_ERR(handle))</div><div class='add'>+		return PTR_ERR(handle);</div><div class='ctx'> </div><div class='ctx'> 	if (ext4_update_inode_size(inode, offset + written)) {</div><div class='del'>-		ret = ext4_mark_inode_dirty(handle, inode);</div><div class='add'>+		int ret = ext4_mark_inode_dirty(handle, inode);</div><div class='ctx'> 		if (unlikely(ret)) {</div><div class='del'>-			written = ret;</div><div class='ctx'> 			ext4_journal_stop(handle);</div><div class='del'>-			goto truncate;</div><div class='add'>+			return ret;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * We may need to truncate allocated but not written blocks beyond EOF.</div><div class='del'>-	 */</div><div class='del'>-	written_blk = ALIGN(offset + written, 1 &lt;&lt; blkbits);</div><div class='del'>-	end_blk = ALIGN(offset + count, 1 &lt;&lt; blkbits);</div><div class='del'>-	if (written_blk &lt; end_blk &amp;&amp; ext4_can_truncate(inode))</div><div class='del'>-		truncate = true;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Remove the inode from the orphan list if it has been extended and</div><div class='del'>-	 * everything went OK.</div><div class='del'>-	 */</div><div class='del'>-	if (!truncate &amp;&amp; inode-&gt;i_nlink)</div><div class='add'>+	if ((written == count) &amp;&amp; inode-&gt;i_nlink)</div><div class='ctx'> 		ext4_orphan_del(handle, inode);</div><div class='ctx'> 	ext4_journal_stop(handle);</div><div class='ctx'> </div><div class='del'>-	if (truncate) {</div><div class='del'>-truncate:</div><div class='add'>+	return written;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Clean up the inode after DIO or DAX extending write has completed and the</div><div class='add'>+ * inode size has been updated using ext4_handle_inode_extension().</div><div class='add'>+ */</div><div class='add'>+static void ext4_inode_extension_cleanup(struct inode *inode, bool need_trunc)</div><div class='add'>+{</div><div class='add'>+	lockdep_assert_held_write(&amp;inode-&gt;i_rwsem);</div><div class='add'>+	if (need_trunc) {</div><div class='ctx'> 		ext4_truncate_failed_write(inode);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * If the truncate operation failed early, then the inode may</div><div class='hunk'>@@ -363,9 +346,29 @@ truncate:</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (inode-&gt;i_nlink)</div><div class='ctx'> 			ext4_orphan_del(NULL, inode);</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='add'>+	/*</div><div class='add'>+	 * If i_disksize got extended either due to writeback of delalloc</div><div class='add'>+	 * blocks or extending truncate while the DIO was running we could fail</div><div class='add'>+	 * to cleanup the orphan list in ext4_handle_inode_extension(). Do it</div><div class='add'>+	 * now.</div><div class='add'>+	 */</div><div class='add'>+	if (ext4_inode_orphan_tracked(inode) &amp;&amp; inode-&gt;i_nlink) {</div><div class='add'>+		handle_t *handle = ext4_journal_start(inode, EXT4_HT_INODE, 2);</div><div class='ctx'> </div><div class='del'>-	return written;</div><div class='add'>+		if (IS_ERR(handle)) {</div><div class='add'>+			/*</div><div class='add'>+			 * The write has successfully completed. Not much to</div><div class='add'>+			 * do with the error here so just cleanup the orphan</div><div class='add'>+			 * list and hope for the best.</div><div class='add'>+			 */</div><div class='add'>+			ext4_orphan_del(NULL, inode);</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+		ext4_orphan_del(handle, inode);</div><div class='add'>+		ext4_journal_stop(handle);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ext4_dio_write_end_io(struct kiocb *iocb, ssize_t size,</div><div class='hunk'>@@ -374,31 +377,29 @@ static int ext4_dio_write_end_io(struct kiocb *iocb, ssize_t size,</div><div class='ctx'> 	loff_t pos = iocb-&gt;ki_pos;</div><div class='ctx'> 	struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='ctx'> </div><div class='del'>-	if (error)</div><div class='del'>-		return error;</div><div class='ctx'> </div><div class='del'>-	if (size &amp;&amp; flags &amp; IOMAP_DIO_UNWRITTEN) {</div><div class='add'>+	if (!error &amp;&amp; size &amp;&amp; (flags &amp; IOMAP_DIO_UNWRITTEN) &amp;&amp;</div><div class='add'>+			(iocb-&gt;ki_flags &amp; IOCB_ATOMIC))</div><div class='add'>+		error = ext4_convert_unwritten_extents_atomic(NULL, inode, pos,</div><div class='add'>+							      size);</div><div class='add'>+	else if (!error &amp;&amp; size &amp;&amp; flags &amp; IOMAP_DIO_UNWRITTEN)</div><div class='ctx'> 		error = ext4_convert_unwritten_extents(NULL, inode, pos, size);</div><div class='del'>-		if (error &lt; 0)</div><div class='del'>-			return error;</div><div class='del'>-	}</div><div class='add'>+	if (error)</div><div class='add'>+		return error;</div><div class='ctx'> 	/*</div><div class='del'>-	 * If we are extending the file, we have to update i_size here before</div><div class='del'>-	 * page cache gets invalidated in iomap_dio_rw(). Otherwise racing</div><div class='del'>-	 * buffered reads could zero out too much from page cache pages. Update</div><div class='del'>-	 * of on-disk size will happen later in ext4_dio_write_iter() where</div><div class='del'>-	 * we have enough information to also perform orphan list handling etc.</div><div class='del'>-	 * Note that we perform all extending writes synchronously under</div><div class='del'>-	 * i_rwsem held exclusively so i_size update is safe here in that case.</div><div class='del'>-	 * If the write was not extending, we cannot see pos &gt; i_size here</div><div class='del'>-	 * because operations reducing i_size like truncate wait for all</div><div class='del'>-	 * outstanding DIO before updating i_size.</div><div class='add'>+	 * Note that EXT4_I(inode)-&gt;i_disksize can get extended up to</div><div class='add'>+	 * inode-&gt;i_size while the I/O was running due to writeback of delalloc</div><div class='add'>+	 * blocks. But the code in ext4_iomap_alloc() is careful to use</div><div class='add'>+	 * zeroed/unwritten extents if this is possible; thus we won't leave</div><div class='add'>+	 * uninitialized blocks in a file even if we didn't succeed in writing</div><div class='add'>+	 * as much as we intended. Also we can race with truncate or write</div><div class='add'>+	 * expanding the file so we have to be a bit careful here.</div><div class='ctx'> 	 */</div><div class='del'>-	pos += size;</div><div class='del'>-	if (pos &gt; i_size_read(inode))</div><div class='del'>-		i_size_write(inode, pos);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='add'>+	if (pos + size &lt;= READ_ONCE(EXT4_I(inode)-&gt;i_disksize) &amp;&amp;</div><div class='add'>+	    pos + size &lt;= i_size_read(inode))</div><div class='add'>+		return 0;</div><div class='add'>+	error = ext4_handle_inode_extension(inode, pos, size, size);</div><div class='add'>+	return error &lt; 0 ? error : 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct iomap_dio_ops ext4_dio_write_ops = {</div><div class='hunk'>@@ -416,17 +417,23 @@ static const struct iomap_dio_ops ext4_dio_write_ops = {</div><div class='ctx'>  * - For extending writes case we don't take the shared lock, since it requires</div><div class='ctx'>  *   updating inode i_disksize and/or orphan handling with exclusive lock.</div><div class='ctx'>  *</div><div class='del'>- * - shared locking will only be true mostly with overwrites. Otherwise we will</div><div class='del'>- *   switch to exclusive i_rwsem lock.</div><div class='add'>+ * - shared locking will only be true mostly with overwrites, including</div><div class='add'>+ *   initialized blocks and unwritten blocks. For overwrite unwritten blocks</div><div class='add'>+ *   we protect splitting extents by i_data_sem in ext4_inode_info, so we can</div><div class='add'>+ *   also release exclusive i_rwsem lock.</div><div class='add'>+ *</div><div class='add'>+ * - Otherwise we will switch to exclusive i_rwsem lock.</div><div class='ctx'>  */</div><div class='ctx'> static ssize_t ext4_dio_write_checks(struct kiocb *iocb, struct iov_iter *from,</div><div class='del'>-				     bool *ilock_shared, bool *extend)</div><div class='add'>+				     bool *ilock_shared, bool *extend,</div><div class='add'>+				     bool *unwritten, int *dio_flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct file *file = iocb-&gt;ki_filp;</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='ctx'> 	loff_t offset;</div><div class='ctx'> 	size_t count;</div><div class='ctx'> 	ssize_t ret;</div><div class='add'>+	bool overwrite, unaligned_io;</div><div class='ctx'> </div><div class='ctx'> restart:</div><div class='ctx'> 	ret = ext4_generic_write_checks(iocb, from);</div><div class='hunk'>@@ -435,16 +442,25 @@ restart:</div><div class='ctx'> </div><div class='ctx'> 	offset = iocb-&gt;ki_pos;</div><div class='ctx'> 	count = ret;</div><div class='del'>-	if (ext4_extending_io(inode, offset, count))</div><div class='del'>-		*extend = true;</div><div class='add'>+</div><div class='add'>+	unaligned_io = ext4_unaligned_io(inode, from, offset);</div><div class='add'>+	*extend = ext4_extending_io(inode, offset, count);</div><div class='add'>+	overwrite = ext4_overwrite_io(inode, offset, count, unwritten);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='del'>-	 * Determine whether the IO operation will overwrite allocated</div><div class='del'>-	 * and initialized blocks.</div><div class='del'>-	 * We need exclusive i_rwsem for changing security info</div><div class='del'>-	 * in file_modified().</div><div class='add'>+	 * Determine whether we need to upgrade to an exclusive lock. This is</div><div class='add'>+	 * required to change security info in file_modified(), for extending</div><div class='add'>+	 * I/O, any form of non-overwrite I/O, and unaligned I/O to unwritten</div><div class='add'>+	 * extents (as partial block zeroing may be required).</div><div class='add'>+	 *</div><div class='add'>+	 * Note that unaligned writes are allowed under shared lock so long as</div><div class='add'>+	 * they are pure overwrites. Otherwise, concurrent unaligned writes risk</div><div class='add'>+	 * data corruption due to partial block zeroing in the dio layer, and so</div><div class='add'>+	 * the I/O must occur exclusively.</div><div class='ctx'> 	 */</div><div class='del'>-	if (*ilock_shared &amp;&amp; (!IS_NOSEC(inode) || *extend ||</div><div class='del'>-	     !ext4_overwrite_io(inode, offset, count))) {</div><div class='add'>+	if (*ilock_shared &amp;&amp;</div><div class='add'>+	    ((!IS_NOSEC(inode) || *extend || !overwrite ||</div><div class='add'>+	     (unaligned_io &amp;&amp; *unwritten)))) {</div><div class='ctx'> 		if (iocb-&gt;ki_flags &amp; IOCB_NOWAIT) {</div><div class='ctx'> 			ret = -EAGAIN;</div><div class='ctx'> 			goto out;</div><div class='hunk'>@@ -455,6 +471,23 @@ restart:</div><div class='ctx'> 		goto restart;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Now that locking is settled, determine dio flags and exclusivity</div><div class='add'>+	 * requirements. We don't use DIO_OVERWRITE_ONLY because we enforce</div><div class='add'>+	 * behavior already. The inode lock is already held exclusive if the</div><div class='add'>+	 * write is non-overwrite or extending, so drain all outstanding dio and</div><div class='add'>+	 * set the force wait dio flag.</div><div class='add'>+	 */</div><div class='add'>+	if (!*ilock_shared &amp;&amp; (unaligned_io || *extend)) {</div><div class='add'>+		if (iocb-&gt;ki_flags &amp; IOCB_NOWAIT) {</div><div class='add'>+			ret = -EAGAIN;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		if (unaligned_io &amp;&amp; (!overwrite || *unwritten))</div><div class='add'>+			inode_dio_wait(inode);</div><div class='add'>+		*dio_flags = IOMAP_DIO_FORCE_WAIT;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	ret = file_modified(file);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -476,18 +509,11 @@ static ssize_t ext4_dio_write_iter(struct kiocb *iocb, struct iov_iter *from)</div><div class='ctx'> 	loff_t offset = iocb-&gt;ki_pos;</div><div class='ctx'> 	size_t count = iov_iter_count(from);</div><div class='ctx'> 	const struct iomap_ops *iomap_ops = &amp;ext4_iomap_ops;</div><div class='del'>-	bool extend = false, unaligned_io = false;</div><div class='add'>+	bool extend = false, unwritten = false;</div><div class='ctx'> 	bool ilock_shared = true;</div><div class='add'>+	int dio_flags = 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * We initially start with shared inode lock unless it is</div><div class='del'>-	 * unaligned IO which needs exclusive lock anyways.</div><div class='del'>-	 */</div><div class='del'>-	if (ext4_unaligned_io(inode, from, offset)) {</div><div class='del'>-		unaligned_io = true;</div><div class='del'>-		ilock_shared = false;</div><div class='del'>-	}</div><div class='del'>-	/*</div><div class='ctx'> 	 * Quick check here without any i_rwsem lock to see if it is extending</div><div class='ctx'> 	 * IO. A more reliable check is done in ext4_dio_write_checks() with</div><div class='ctx'> 	 * proper locking in place.</div><div class='hunk'>@@ -511,7 +537,7 @@ static ssize_t ext4_dio_write_iter(struct kiocb *iocb, struct iov_iter *from)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Fallback to buffered I/O if the inode does not support direct I/O. */</div><div class='del'>-	if (!ext4_dio_supported(inode)) {</div><div class='add'>+	if (!ext4_should_use_dio(iocb, from)) {</div><div class='ctx'> 		if (ilock_shared)</div><div class='ctx'> 			inode_unlock_shared(inode);</div><div class='ctx'> 		else</div><div class='hunk'>@@ -519,32 +545,23 @@ static ssize_t ext4_dio_write_iter(struct kiocb *iocb, struct iov_iter *from)</div><div class='ctx'> 		return ext4_buffered_write_iter(iocb, from);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = ext4_dio_write_checks(iocb, from, &amp;ilock_shared, &amp;extend);</div><div class='add'>+	/*</div><div class='add'>+	 * Prevent inline data from being created since we are going to allocate</div><div class='add'>+	 * blocks for DIO. We know the inode does not currently have inline data</div><div class='add'>+	 * because ext4_should_use_dio() checked for it, but we have to clear</div><div class='add'>+	 * the state flag before the write checks because a lock cycle could</div><div class='add'>+	 * introduce races with other writers.</div><div class='add'>+	 */</div><div class='add'>+	ext4_clear_inode_state(inode, EXT4_STATE_MAY_INLINE_DATA);</div><div class='add'>+</div><div class='add'>+	ret = ext4_dio_write_checks(iocb, from, &amp;ilock_shared, &amp;extend,</div><div class='add'>+				    &amp;unwritten, &amp;dio_flags);</div><div class='ctx'> 	if (ret &lt;= 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	/* if we're going to block and IOCB_NOWAIT is set, return -EAGAIN */</div><div class='del'>-	if ((iocb-&gt;ki_flags &amp; IOCB_NOWAIT) &amp;&amp; (unaligned_io || extend)) {</div><div class='del'>-		ret = -EAGAIN;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	offset = iocb-&gt;ki_pos;</div><div class='ctx'> 	count = ret;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Unaligned direct IO must be serialized among each other as zeroing</div><div class='del'>-	 * of partial blocks of two competing unaligned IOs can result in data</div><div class='del'>-	 * corruption.</div><div class='del'>-	 *</div><div class='del'>-	 * So we make sure we don't allow any unaligned IO in flight.</div><div class='del'>-	 * For IOs where we need not wait (like unaligned non-AIO DIO),</div><div class='del'>-	 * below inode_dio_wait() may anyway become a no-op, since we start</div><div class='del'>-	 * with exclusive lock.</div><div class='del'>-	 */</div><div class='del'>-	if (unaligned_io)</div><div class='del'>-		inode_dio_wait(inode);</div><div class='del'>-</div><div class='ctx'> 	if (extend) {</div><div class='ctx'> 		handle = ext4_journal_start(inode, EXT4_HT_INODE, 2);</div><div class='ctx'> 		if (IS_ERR(handle)) {</div><div class='hunk'>@@ -552,27 +569,28 @@ static ssize_t ext4_dio_write_iter(struct kiocb *iocb, struct iov_iter *from)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		ext4_fc_start_update(inode);</div><div class='ctx'> 		ret = ext4_orphan_add(handle, inode);</div><div class='del'>-		ext4_fc_stop_update(inode);</div><div class='del'>-		if (ret) {</div><div class='del'>-			ext4_journal_stop(handle);</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-</div><div class='ctx'> 		ext4_journal_stop(handle);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (ilock_shared)</div><div class='add'>+	if (ilock_shared &amp;&amp; !unwritten)</div><div class='ctx'> 		iomap_ops = &amp;ext4_iomap_overwrite_ops;</div><div class='ctx'> 	ret = iomap_dio_rw(iocb, from, iomap_ops, &amp;ext4_dio_write_ops,</div><div class='del'>-			   (unaligned_io || extend) ? IOMAP_DIO_FORCE_WAIT : 0,</div><div class='del'>-			   0);</div><div class='add'>+			   dio_flags, NULL, 0);</div><div class='ctx'> 	if (ret == -ENOTBLK)</div><div class='ctx'> 		ret = 0;</div><div class='del'>-</div><div class='del'>-	if (extend)</div><div class='del'>-		ret = ext4_handle_inode_extension(inode, offset, ret, count);</div><div class='add'>+	if (extend) {</div><div class='add'>+		/*</div><div class='add'>+		 * We always perform extending DIO write synchronously so by</div><div class='add'>+		 * now the IO is completed and ext4_handle_inode_extension()</div><div class='add'>+		 * was called. Cleanup the inode in case of error or race with</div><div class='add'>+		 * writeback of delalloc blocks.</div><div class='add'>+		 */</div><div class='add'>+		WARN_ON_ONCE(ret == -EIOCBQUEUED);</div><div class='add'>+		ext4_inode_extension_cleanup(inode, ret &lt; 0);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	if (ilock_shared)</div><div class='hunk'>@@ -584,6 +602,13 @@ out:</div><div class='ctx'> 		ssize_t err;</div><div class='ctx'> 		loff_t endbyte;</div><div class='ctx'> </div><div class='add'>+		/*</div><div class='add'>+		 * There is no support for atomic writes on buffered-io yet,</div><div class='add'>+		 * we should never fallback to buffered-io for DIO atomic</div><div class='add'>+		 * writes.</div><div class='add'>+		 */</div><div class='add'>+		WARN_ON_ONCE(iocb-&gt;ki_flags &amp; IOCB_ATOMIC);</div><div class='add'>+</div><div class='ctx'> 		offset = iocb-&gt;ki_pos;</div><div class='ctx'> 		err = ext4_buffered_write_iter(iocb, from);</div><div class='ctx'> 		if (err &lt; 0)</div><div class='hunk'>@@ -653,8 +678,10 @@ ext4_dax_write_iter(struct kiocb *iocb, struct iov_iter *from)</div><div class='ctx'> </div><div class='ctx'> 	ret = dax_iomap_rw(iocb, from, &amp;ext4_iomap_ops);</div><div class='ctx'> </div><div class='del'>-	if (extend)</div><div class='add'>+	if (extend) {</div><div class='ctx'> 		ret = ext4_handle_inode_extension(inode, offset, ret, count);</div><div class='add'>+		ext4_inode_extension_cleanup(inode, ret &lt; (ssize_t)count);</div><div class='add'>+	}</div><div class='ctx'> out:</div><div class='ctx'> 	inode_unlock(inode);</div><div class='ctx'> 	if (ret &gt; 0)</div><div class='hunk'>@@ -666,15 +693,30 @@ out:</div><div class='ctx'> static ssize_t</div><div class='ctx'> ext4_file_write_iter(struct kiocb *iocb, struct iov_iter *from)</div><div class='ctx'> {</div><div class='add'>+	int ret;</div><div class='ctx'> 	struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ext4_forced_shutdown(EXT4_SB(inode-&gt;i_sb))))</div><div class='del'>-		return -EIO;</div><div class='add'>+	ret = ext4_emergency_state(inode-&gt;i_sb);</div><div class='add'>+	if (unlikely(ret))</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_FS_DAX</div><div class='ctx'> 	if (IS_DAX(inode))</div><div class='ctx'> 		return ext4_dax_write_iter(iocb, from);</div><div class='ctx'> #endif</div><div class='add'>+</div><div class='add'>+	if (iocb-&gt;ki_flags &amp; IOCB_ATOMIC) {</div><div class='add'>+		size_t len = iov_iter_count(from);</div><div class='add'>+</div><div class='add'>+		if (len &lt; EXT4_SB(inode-&gt;i_sb)-&gt;s_awu_min ||</div><div class='add'>+		    len &gt; EXT4_SB(inode-&gt;i_sb)-&gt;s_awu_max)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+</div><div class='add'>+		ret = generic_atomic_write_valid(iocb, from);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (iocb-&gt;ki_flags &amp; IOCB_DIRECT)</div><div class='ctx'> 		return ext4_dio_write_iter(iocb, from);</div><div class='ctx'> 	else</div><div class='hunk'>@@ -682,8 +724,7 @@ ext4_file_write_iter(struct kiocb *iocb, struct iov_iter *from)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_FS_DAX</div><div class='del'>-static vm_fault_t ext4_dax_huge_fault(struct vm_fault *vmf,</div><div class='del'>-		enum page_entry_size pe_size)</div><div class='add'>+static vm_fault_t ext4_dax_huge_fault(struct vm_fault *vmf, unsigned int order)</div><div class='ctx'> {</div><div class='ctx'> 	int error = 0;</div><div class='ctx'> 	vm_fault_t result;</div><div class='hunk'>@@ -699,14 +740,14 @@ static vm_fault_t ext4_dax_huge_fault(struct vm_fault *vmf,</div><div class='ctx'> 	 * read-only.</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * We check for VM_SHARED rather than vmf-&gt;cow_page since the latter is</div><div class='del'>-	 * unset for pe_size != PE_SIZE_PTE (i.e. only in do_cow_fault); for</div><div class='add'>+	 * unset for order != 0 (i.e. only in do_cow_fault); for</div><div class='ctx'> 	 * other sizes, dax_iomap_fault will handle splitting / fallback so that</div><div class='ctx'> 	 * we eventually come back with a COW page.</div><div class='ctx'> 	 */</div><div class='ctx'> 	bool write = (vmf-&gt;flags &amp; FAULT_FLAG_WRITE) &amp;&amp;</div><div class='ctx'> 		(vmf-&gt;vma-&gt;vm_flags &amp; VM_SHARED);</div><div class='ctx'> 	struct address_space *mapping = vmf-&gt;vma-&gt;vm_file-&gt;f_mapping;</div><div class='del'>-	pfn_t pfn;</div><div class='add'>+	unsigned long pfn;</div><div class='ctx'> </div><div class='ctx'> 	if (write) {</div><div class='ctx'> 		sb_start_pagefault(sb);</div><div class='hunk'>@@ -723,7 +764,7 @@ retry:</div><div class='ctx'> 	} else {</div><div class='ctx'> 		filemap_invalidate_lock_shared(mapping);</div><div class='ctx'> 	}</div><div class='del'>-	result = dax_iomap_fault(vmf, pe_size, &amp;pfn, &amp;error, &amp;ext4_iomap_ops);</div><div class='add'>+	result = dax_iomap_fault(vmf, order, &amp;pfn, &amp;error, &amp;ext4_iomap_ops);</div><div class='ctx'> 	if (write) {</div><div class='ctx'> 		ext4_journal_stop(handle);</div><div class='ctx'> </div><div class='hunk'>@@ -732,7 +773,7 @@ retry:</div><div class='ctx'> 			goto retry;</div><div class='ctx'> 		/* Handling synchronous page fault? */</div><div class='ctx'> 		if (result &amp; VM_FAULT_NEEDDSYNC)</div><div class='del'>-			result = dax_finish_sync_fault(vmf, pe_size, pfn);</div><div class='add'>+			result = dax_finish_sync_fault(vmf, order, pfn);</div><div class='ctx'> 		filemap_invalidate_unlock_shared(mapping);</div><div class='ctx'> 		sb_end_pagefault(sb);</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -744,7 +785,7 @@ retry:</div><div class='ctx'> </div><div class='ctx'> static vm_fault_t ext4_dax_fault(struct vm_fault *vmf)</div><div class='ctx'> {</div><div class='del'>-	return ext4_dax_huge_fault(vmf, PE_SIZE_PTE);</div><div class='add'>+	return ext4_dax_huge_fault(vmf, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct vm_operations_struct ext4_dax_vm_ops = {</div><div class='hunk'>@@ -763,28 +804,33 @@ static const struct vm_operations_struct ext4_file_vm_ops = {</div><div class='ctx'> 	.page_mkwrite   = ext4_page_mkwrite,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int ext4_file_mmap(struct file *file, struct vm_area_struct *vma)</div><div class='add'>+static int ext4_file_mmap_prepare(struct vm_area_desc *desc)</div><div class='ctx'> {</div><div class='add'>+	int ret;</div><div class='add'>+	struct file *file = desc-&gt;file;</div><div class='ctx'> 	struct inode *inode = file-&gt;f_mapping-&gt;host;</div><div class='del'>-	struct ext4_sb_info *sbi = EXT4_SB(inode-&gt;i_sb);</div><div class='del'>-	struct dax_device *dax_dev = sbi-&gt;s_daxdev;</div><div class='add'>+	struct dax_device *dax_dev = EXT4_SB(inode-&gt;i_sb)-&gt;s_daxdev;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ext4_forced_shutdown(sbi)))</div><div class='del'>-		return -EIO;</div><div class='add'>+	if (file-&gt;f_mode &amp; FMODE_WRITE)</div><div class='add'>+		ret = ext4_emergency_state(inode-&gt;i_sb);</div><div class='add'>+	else</div><div class='add'>+		ret = ext4_forced_shutdown(inode-&gt;i_sb) ? -EIO : 0;</div><div class='add'>+	if (unlikely(ret))</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We don't support synchronous mappings for non-DAX files and</div><div class='ctx'> 	 * for DAX files if underneath dax_device is not synchronous.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!daxdev_mapping_supported(vma, dax_dev))</div><div class='add'>+	if (!daxdev_mapping_supported(desc-&gt;vm_flags, file_inode(file), dax_dev))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='ctx'> 	file_accessed(file);</div><div class='ctx'> 	if (IS_DAX(file_inode(file))) {</div><div class='del'>-		vma-&gt;vm_ops = &amp;ext4_dax_vm_ops;</div><div class='del'>-		vma-&gt;vm_flags |= VM_HUGEPAGE;</div><div class='add'>+		desc-&gt;vm_ops = &amp;ext4_dax_vm_ops;</div><div class='add'>+		desc-&gt;vm_flags |= VM_HUGEPAGE;</div><div class='ctx'> 	} else {</div><div class='del'>-		vma-&gt;vm_ops = &amp;ext4_file_vm_ops;</div><div class='add'>+		desc-&gt;vm_ops = &amp;ext4_file_vm_ops;</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -801,7 +847,8 @@ static int ext4_sample_last_mounted(struct super_block *sb,</div><div class='ctx'> 	if (likely(ext4_test_mount_flag(sb, EXT4_MF_MNTDIR_SAMPLED)))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	if (sb_rdonly(sb) || !sb_start_intwrite_trylock(sb))</div><div class='add'>+	if (ext4_emergency_state(sb) || sb_rdonly(sb) ||</div><div class='add'>+	    !sb_start_intwrite_trylock(sb))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	ext4_set_mount_flag(sb, EXT4_MF_MNTDIR_SAMPLED);</div><div class='hunk'>@@ -829,8 +876,7 @@ static int ext4_sample_last_mounted(struct super_block *sb,</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out_journal;</div><div class='ctx'> 	lock_buffer(sbi-&gt;s_sbh);</div><div class='del'>-	strncpy(sbi-&gt;s_es-&gt;s_last_mounted, cp,</div><div class='del'>-		sizeof(sbi-&gt;s_es-&gt;s_last_mounted));</div><div class='add'>+	strtomem_pad(sbi-&gt;s_es-&gt;s_last_mounted, cp, 0);</div><div class='ctx'> 	ext4_superblock_csum_set(sb);</div><div class='ctx'> 	unlock_buffer(sbi-&gt;s_sbh);</div><div class='ctx'> 	ext4_handle_dirty_metadata(handle, NULL, sbi-&gt;s_sbh);</div><div class='hunk'>@@ -845,8 +891,12 @@ static int ext4_file_open(struct inode *inode, struct file *filp)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ext4_forced_shutdown(EXT4_SB(inode-&gt;i_sb))))</div><div class='del'>-		return -EIO;</div><div class='add'>+	if (filp-&gt;f_mode &amp; FMODE_WRITE)</div><div class='add'>+		ret = ext4_emergency_state(inode-&gt;i_sb);</div><div class='add'>+	else</div><div class='add'>+		ret = ext4_forced_shutdown(inode-&gt;i_sb) ? -EIO : 0;</div><div class='add'>+	if (unlikely(ret))</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	ret = ext4_sample_last_mounted(inode-&gt;i_sb, filp-&gt;f_path.mnt);</div><div class='ctx'> 	if (ret)</div><div class='hunk'>@@ -870,7 +920,10 @@ static int ext4_file_open(struct inode *inode, struct file *filp)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	filp-&gt;f_mode |= FMODE_NOWAIT | FMODE_BUF_RASYNC;</div><div class='add'>+	if (ext4_inode_can_atomic_write(inode))</div><div class='add'>+		filp-&gt;f_mode |= FMODE_CAN_ATOMIC_WRITE;</div><div class='add'>+</div><div class='add'>+	filp-&gt;f_mode |= FMODE_NOWAIT | FMODE_CAN_ODIRECT;</div><div class='ctx'> 	return dquot_file_open(inode, filp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -882,12 +935,7 @@ static int ext4_file_open(struct inode *inode, struct file *filp)</div><div class='ctx'> loff_t ext4_llseek(struct file *file, loff_t offset, int whence)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file-&gt;f_mapping-&gt;host;</div><div class='del'>-	loff_t maxbytes;</div><div class='del'>-</div><div class='del'>-	if (!(ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS)))</div><div class='del'>-		maxbytes = EXT4_SB(inode-&gt;i_sb)-&gt;s_bitmap_maxbytes;</div><div class='del'>-	else</div><div class='del'>-		maxbytes = inode-&gt;i_sb-&gt;s_maxbytes;</div><div class='add'>+	loff_t maxbytes = ext4_get_maxbytes(inode);</div><div class='ctx'> </div><div class='ctx'> 	switch (whence) {</div><div class='ctx'> 	default:</div><div class='hunk'>@@ -921,22 +969,24 @@ const struct file_operations ext4_file_operations = {</div><div class='ctx'> #ifdef CONFIG_COMPAT</div><div class='ctx'> 	.compat_ioctl	= ext4_compat_ioctl,</div><div class='ctx'> #endif</div><div class='del'>-	.mmap		= ext4_file_mmap,</div><div class='del'>-	.mmap_supported_flags = MAP_SYNC,</div><div class='add'>+	.mmap_prepare	= ext4_file_mmap_prepare,</div><div class='ctx'> 	.open		= ext4_file_open,</div><div class='ctx'> 	.release	= ext4_release_file,</div><div class='ctx'> 	.fsync		= ext4_sync_file,</div><div class='ctx'> 	.get_unmapped_area = thp_get_unmapped_area,</div><div class='del'>-	.splice_read	= generic_file_splice_read,</div><div class='add'>+	.splice_read	= ext4_file_splice_read,</div><div class='ctx'> 	.splice_write	= iter_file_splice_write,</div><div class='ctx'> 	.fallocate	= ext4_fallocate,</div><div class='add'>+	.fop_flags	= FOP_MMAP_SYNC | FOP_BUFFER_RASYNC |</div><div class='add'>+			  FOP_DIO_PARALLEL_WRITE |</div><div class='add'>+			  FOP_DONTCACHE,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct inode_operations ext4_file_inode_operations = {</div><div class='ctx'> 	.setattr	= ext4_setattr,</div><div class='ctx'> 	.getattr	= ext4_file_getattr,</div><div class='ctx'> 	.listxattr	= ext4_listxattr,</div><div class='del'>-	.get_acl	= ext4_get_acl,</div><div class='add'>+	.get_inode_acl	= ext4_get_acl,</div><div class='ctx'> 	.set_acl	= ext4_set_acl,</div><div class='ctx'> 	.fiemap		= ext4_fiemap,</div><div class='ctx'> 	.fileattr_get	= ext4_fileattr_get,</div><div class='head'>diff --git a/fs/ext4/fsmap.c b/fs/ext4/fsmap.c<br/>index 4493ef0c715e..22fc333244ef 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/fsmap.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/fsmap.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/fsmap.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/fsmap.c</a></div><div class='hunk'>@@ -74,7 +74,8 @@ static int ext4_getfsmap_dev_compare(const void *p1, const void *p2)</div><div class='ctx'> static bool ext4_getfsmap_rec_before_low_key(struct ext4_getfsmap_info *info,</div><div class='ctx'> 					     struct ext4_fsmap *rec)</div><div class='ctx'> {</div><div class='del'>-	return rec-&gt;fmr_physical &lt; info-&gt;gfi_low.fmr_physical;</div><div class='add'>+	return rec-&gt;fmr_physical + rec-&gt;fmr_length &lt;=</div><div class='add'>+	       info-&gt;gfi_low.fmr_physical;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -185,6 +186,59 @@ static inline ext4_fsblk_t ext4_fsmap_next_pblk(struct ext4_fsmap *fmr)</div><div class='ctx'> 	return fmr-&gt;fmr_physical + fmr-&gt;fmr_length;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int ext4_getfsmap_meta_helper(struct super_block *sb,</div><div class='add'>+				     ext4_group_t agno, ext4_grpblk_t start,</div><div class='add'>+				     ext4_grpblk_t len, void *priv)</div><div class='add'>+{</div><div class='add'>+	struct ext4_getfsmap_info *info = priv;</div><div class='add'>+	struct ext4_fsmap *p;</div><div class='add'>+	struct ext4_fsmap *tmp;</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	ext4_fsblk_t fsb, fs_start, fs_end;</div><div class='add'>+	int error;</div><div class='add'>+</div><div class='add'>+	fs_start = fsb = (EXT4_C2B(sbi, start) +</div><div class='add'>+			  ext4_group_first_block_no(sb, agno));</div><div class='add'>+	fs_end = fs_start + EXT4_C2B(sbi, len);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Return relevant extents from the meta_list. We emit all extents that</div><div class='add'>+	 * partially/fully overlap with the query range</div><div class='add'>+	 */</div><div class='add'>+	list_for_each_entry_safe(p, tmp, &amp;info-&gt;gfi_meta_list, fmr_list) {</div><div class='add'>+		if (p-&gt;fmr_physical + p-&gt;fmr_length &lt;= info-&gt;gfi_next_fsblk) {</div><div class='add'>+			list_del(&amp;p-&gt;fmr_list);</div><div class='add'>+			kfree(p);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+		if (p-&gt;fmr_physical &lt;= fs_end &amp;&amp;</div><div class='add'>+		    p-&gt;fmr_physical + p-&gt;fmr_length &gt; fs_start) {</div><div class='add'>+			/* Emit the retained free extent record if present */</div><div class='add'>+			if (info-&gt;gfi_lastfree.fmr_owner) {</div><div class='add'>+				error = ext4_getfsmap_helper(sb, info,</div><div class='add'>+							&amp;info-&gt;gfi_lastfree);</div><div class='add'>+				if (error)</div><div class='add'>+					return error;</div><div class='add'>+				info-&gt;gfi_lastfree.fmr_owner = 0;</div><div class='add'>+			}</div><div class='add'>+			error = ext4_getfsmap_helper(sb, info, p);</div><div class='add'>+			if (error)</div><div class='add'>+				return error;</div><div class='add'>+			fsb = p-&gt;fmr_physical + p-&gt;fmr_length;</div><div class='add'>+			if (info-&gt;gfi_next_fsblk &lt; fsb)</div><div class='add'>+				info-&gt;gfi_next_fsblk = fsb;</div><div class='add'>+			list_del(&amp;p-&gt;fmr_list);</div><div class='add'>+			kfree(p);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	if (info-&gt;gfi_next_fsblk &lt; fsb)</div><div class='add'>+		info-&gt;gfi_next_fsblk = fsb;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+</div><div class='ctx'> /* Transform a blockgroup's free record into a fsmap */</div><div class='ctx'> static int ext4_getfsmap_datadev_helper(struct super_block *sb,</div><div class='ctx'> 					ext4_group_t agno, ext4_grpblk_t start,</div><div class='hunk'>@@ -343,6 +397,14 @@ static unsigned int ext4_getfsmap_find_sb(struct super_block *sb,</div><div class='ctx'> 	/* Reserved GDT blocks */</div><div class='ctx'> 	if (!ext4_has_feature_meta_bg(sb) || metagroup &lt; first_meta_bg) {</div><div class='ctx'> 		len = le16_to_cpu(sbi-&gt;s_es-&gt;s_reserved_gdt_blocks);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * mkfs.ext4 can set s_reserved_gdt_blocks as 0 in some cases,</div><div class='add'>+		 * check for that.</div><div class='add'>+		 */</div><div class='add'>+		if (!len)</div><div class='add'>+			return 0;</div><div class='add'>+</div><div class='ctx'> 		error = ext4_getfsmap_fill(meta_list, fsb, len,</div><div class='ctx'> 					   EXT4_FMR_OWN_RESV_GDT);</div><div class='ctx'> 		if (error)</div><div class='hunk'>@@ -476,6 +538,7 @@ static int ext4_getfsmap_datadev(struct super_block *sb,</div><div class='ctx'> 	ext4_group_t end_ag;</div><div class='ctx'> 	ext4_grpblk_t first_cluster;</div><div class='ctx'> 	ext4_grpblk_t last_cluster;</div><div class='add'>+	struct ext4_fsmap irec;</div><div class='ctx'> 	int error = 0;</div><div class='ctx'> </div><div class='ctx'> 	bofs = le32_to_cpu(sbi-&gt;s_es-&gt;s_first_data_block);</div><div class='hunk'>@@ -486,6 +549,8 @@ static int ext4_getfsmap_datadev(struct super_block *sb,</div><div class='ctx'> 		keys[0].fmr_physical = bofs;</div><div class='ctx'> 	if (keys[1].fmr_physical &gt;= eofs)</div><div class='ctx'> 		keys[1].fmr_physical = eofs - 1;</div><div class='add'>+	if (keys[1].fmr_physical &lt; keys[0].fmr_physical)</div><div class='add'>+		return 0;</div><div class='ctx'> 	start_fsb = keys[0].fmr_physical;</div><div class='ctx'> 	end_fsb = keys[1].fmr_physical;</div><div class='ctx'> </div><div class='hunk'>@@ -537,6 +602,7 @@ static int ext4_getfsmap_datadev(struct super_block *sb,</div><div class='ctx'> 		error = ext4_mballoc_query_range(sb, info-&gt;gfi_agno,</div><div class='ctx'> 				EXT4_B2C(sbi, info-&gt;gfi_low.fmr_physical),</div><div class='ctx'> 				EXT4_B2C(sbi, info-&gt;gfi_high.fmr_physical),</div><div class='add'>+				ext4_getfsmap_meta_helper,</div><div class='ctx'> 				ext4_getfsmap_datadev_helper, info);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			goto err;</div><div class='hunk'>@@ -556,9 +622,18 @@ static int ext4_getfsmap_datadev(struct super_block *sb,</div><div class='ctx'> 			goto err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Report any gaps at the end of the bg */</div><div class='add'>+	/*</div><div class='add'>+	 * The dummy record below will cause ext4_getfsmap_helper() to report</div><div class='add'>+	 * any allocated blocks at the end of the range.</div><div class='add'>+	 */</div><div class='add'>+	irec.fmr_device = 0;</div><div class='add'>+	irec.fmr_physical = end_fsb + 1;</div><div class='add'>+	irec.fmr_length = 0;</div><div class='add'>+	irec.fmr_owner = EXT4_FMR_OWN_FREE;</div><div class='add'>+	irec.fmr_flags = 0;</div><div class='add'>+</div><div class='ctx'> 	info-&gt;gfi_last = true;</div><div class='del'>-	error = ext4_getfsmap_datadev_helper(sb, end_ag, last_cluster, 0, info);</div><div class='add'>+	error = ext4_getfsmap_helper(sb, info, &amp;irec);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto err;</div><div class='ctx'> </div><div class='hunk'>@@ -574,8 +649,9 @@ static bool ext4_getfsmap_is_valid_device(struct super_block *sb,</div><div class='ctx'> 	if (fm-&gt;fmr_device == 0 || fm-&gt;fmr_device == UINT_MAX ||</div><div class='ctx'> 	    fm-&gt;fmr_device == new_encode_dev(sb-&gt;s_bdev-&gt;bd_dev))</div><div class='ctx'> 		return true;</div><div class='del'>-	if (EXT4_SB(sb)-&gt;s_journal_bdev &amp;&amp;</div><div class='del'>-	    fm-&gt;fmr_device == new_encode_dev(EXT4_SB(sb)-&gt;s_journal_bdev-&gt;bd_dev))</div><div class='add'>+	if (EXT4_SB(sb)-&gt;s_journal_bdev_file &amp;&amp;</div><div class='add'>+	    fm-&gt;fmr_device ==</div><div class='add'>+	    new_encode_dev(file_bdev(EXT4_SB(sb)-&gt;s_journal_bdev_file)-&gt;bd_dev))</div><div class='ctx'> 		return true;</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='hunk'>@@ -645,9 +721,9 @@ int ext4_getfsmap(struct super_block *sb, struct ext4_fsmap_head *head,</div><div class='ctx'> 	memset(handlers, 0, sizeof(handlers));</div><div class='ctx'> 	handlers[0].gfd_dev = new_encode_dev(sb-&gt;s_bdev-&gt;bd_dev);</div><div class='ctx'> 	handlers[0].gfd_fn = ext4_getfsmap_datadev;</div><div class='del'>-	if (EXT4_SB(sb)-&gt;s_journal_bdev) {</div><div class='add'>+	if (EXT4_SB(sb)-&gt;s_journal_bdev_file) {</div><div class='ctx'> 		handlers[1].gfd_dev = new_encode_dev(</div><div class='del'>-				EXT4_SB(sb)-&gt;s_journal_bdev-&gt;bd_dev);</div><div class='add'>+			file_bdev(EXT4_SB(sb)-&gt;s_journal_bdev_file)-&gt;bd_dev);</div><div class='ctx'> 		handlers[1].gfd_fn = ext4_getfsmap_logdev;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='head'>diff --git a/fs/ext4/fsync.c b/fs/ext4/fsync.c<br/>index 027a7d7037a0..e476c6de3074 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/fsync.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/fsync.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/fsync.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/fsync.c</a></div><div class='hunk'>@@ -28,6 +28,7 @@</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='ctx'> #include &lt;linux/writeback.h&gt;</div><div class='ctx'> #include &lt;linux/blkdev.h&gt;</div><div class='add'>+#include &lt;linux/buffer_head.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "ext4.h"</div><div class='ctx'> #include "ext4_jbd2.h"</div><div class='hunk'>@@ -78,21 +79,13 @@ static int ext4_sync_parent(struct inode *inode)</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext4_fsync_nojournal(struct inode *inode, bool datasync,</div><div class='del'>-				bool *needs_barrier)</div><div class='add'>+static int ext4_fsync_nojournal(struct file *file, loff_t start, loff_t end,</div><div class='add'>+				int datasync, bool *needs_barrier)</div><div class='ctx'> {</div><div class='del'>-	int ret, err;</div><div class='del'>-</div><div class='del'>-	ret = sync_mapping_buffers(inode-&gt;i_mapping);</div><div class='del'>-	if (!(inode-&gt;i_state &amp; I_DIRTY_ALL))</div><div class='del'>-		return ret;</div><div class='del'>-	if (datasync &amp;&amp; !(inode-&gt;i_state &amp; I_DIRTY_DATASYNC))</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	err = sync_inode_metadata(inode, 1);</div><div class='del'>-	if (!ret)</div><div class='del'>-		ret = err;</div><div class='add'>+	struct inode *inode = file-&gt;f_inode;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='add'>+	ret = generic_buffers_fsync_noflush(file, start, end, datasync);</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		ret = ext4_sync_parent(inode);</div><div class='ctx'> 	if (test_opt(inode-&gt;i_sb, BARRIER))</div><div class='hunk'>@@ -108,6 +101,13 @@ static int ext4_fsync_journal(struct inode *inode, bool datasync,</div><div class='ctx'> 	journal_t *journal = EXT4_SB(inode-&gt;i_sb)-&gt;s_journal;</div><div class='ctx'> 	tid_t commit_tid = datasync ? ei-&gt;i_datasync_tid : ei-&gt;i_sync_tid;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Fastcommit does not really support fsync on directories or other</div><div class='add'>+	 * special files. Force a full commit.</div><div class='add'>+	 */</div><div class='add'>+	if (!S_ISREG(inode-&gt;i_mode))</div><div class='add'>+		return ext4_force_commit(inode-&gt;i_sb);</div><div class='add'>+</div><div class='ctx'> 	if (journal-&gt;j_flags &amp; JBD2_BARRIER &amp;&amp;</div><div class='ctx'> 	    !jbd2_trans_will_send_data_barrier(journal, commit_tid))</div><div class='ctx'> 		*needs_barrier = true;</div><div class='hunk'>@@ -131,20 +131,23 @@ int ext4_sync_file(struct file *file, loff_t start, loff_t end, int datasync)</div><div class='ctx'> 	int ret = 0, err;</div><div class='ctx'> 	bool needs_barrier = false;</div><div class='ctx'> 	struct inode *inode = file-&gt;f_mapping-&gt;host;</div><div class='del'>-	struct ext4_sb_info *sbi = EXT4_SB(inode-&gt;i_sb);</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ext4_forced_shutdown(sbi)))</div><div class='del'>-		return -EIO;</div><div class='add'>+	ret = ext4_emergency_state(inode-&gt;i_sb);</div><div class='add'>+	if (unlikely(ret))</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	ASSERT(ext4_journal_current_handle() == NULL);</div><div class='ctx'> </div><div class='ctx'> 	trace_ext4_sync_file_enter(file, datasync);</div><div class='ctx'> </div><div class='del'>-	if (sb_rdonly(inode-&gt;i_sb)) {</div><div class='del'>-		/* Make sure that we read updated s_mount_flags value */</div><div class='del'>-		smp_rmb();</div><div class='del'>-		if (ext4_test_mount_flag(inode-&gt;i_sb, EXT4_MF_FS_ABORTED))</div><div class='del'>-			ret = -EROFS;</div><div class='add'>+	if (sb_rdonly(inode-&gt;i_sb))</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	if (!EXT4_SB(inode-&gt;i_sb)-&gt;s_journal) {</div><div class='add'>+		ret = ext4_fsync_nojournal(file, start, end, datasync,</div><div class='add'>+					   &amp;needs_barrier);</div><div class='add'>+		if (needs_barrier)</div><div class='add'>+			goto issue_flush;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -153,26 +156,13 @@ int ext4_sync_file(struct file *file, loff_t start, loff_t end, int datasync)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * data=writeback,ordered:</div><div class='ctx'> 	 *  The caller's filemap_fdatawrite()/wait will sync the data.</div><div class='ctx'> 	 *  Metadata is in the journal, we wait for proper transaction to</div><div class='ctx'> 	 *  commit here.</div><div class='del'>-	 *</div><div class='del'>-	 * data=journal:</div><div class='del'>-	 *  filemap_fdatawrite won't do anything (the buffers are clean).</div><div class='del'>-	 *  ext4_force_commit will write the file data into the journal and</div><div class='del'>-	 *  will wait on that.</div><div class='del'>-	 *  filemap_fdatawait() will encounter a ton of newly-dirtied pages</div><div class='del'>-	 *  (they were dirtied by commit).  But that's OK - the blocks are</div><div class='del'>-	 *  safe in-journal, which is all fsync() needs to ensure.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!sbi-&gt;s_journal)</div><div class='del'>-		ret = ext4_fsync_nojournal(inode, datasync, &amp;needs_barrier);</div><div class='del'>-	else if (ext4_should_journal_data(inode))</div><div class='del'>-		ret = ext4_force_commit(inode-&gt;i_sb);</div><div class='del'>-	else</div><div class='del'>-		ret = ext4_fsync_journal(inode, datasync, &amp;needs_barrier);</div><div class='add'>+	ret = ext4_fsync_journal(inode, datasync, &amp;needs_barrier);</div><div class='ctx'> </div><div class='add'>+issue_flush:</div><div class='ctx'> 	if (needs_barrier) {</div><div class='ctx'> 		err = blkdev_issue_flush(inode-&gt;i_sb-&gt;s_bdev);</div><div class='ctx'> 		if (!ret)</div><div class='head'>diff --git a/fs/ext4/hash.c b/fs/ext4/hash.c<br/>index f34f4176c1e7..48483cd015d3 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/hash.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/hash.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/hash.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/hash.c</a></div><div class='hunk'>@@ -268,7 +268,7 @@ static int __ext4fs_dirhash(const struct inode *dir, const char *name, int len,</div><div class='ctx'> 			combined_hash = fscrypt_fname_siphash(dir, &amp;qname);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			ext4_warning_inode(dir, "Siphash requires key");</div><div class='del'>-			return -1;</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		hash = (__u32)(combined_hash &gt;&gt; 32);</div><div class='hunk'>@@ -277,7 +277,11 @@ static int __ext4fs_dirhash(const struct inode *dir, const char *name, int len,</div><div class='ctx'> 	}</div><div class='ctx'> 	default:</div><div class='ctx'> 		hinfo-&gt;hash = 0;</div><div class='del'>-		return -1;</div><div class='add'>+		hinfo-&gt;minor_hash = 0;</div><div class='add'>+		ext4_warning(dir-&gt;i_sb,</div><div class='add'>+			     "invalid/unsupported hash tree version %u",</div><div class='add'>+			     hinfo-&gt;hash_version);</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> 	hash = hash &amp; ~1;</div><div class='ctx'> 	if (hash == (EXT4_HTREE_EOF_32BIT &lt;&lt; 1))</div><div class='hunk'>@@ -290,15 +294,15 @@ static int __ext4fs_dirhash(const struct inode *dir, const char *name, int len,</div><div class='ctx'> int ext4fs_dirhash(const struct inode *dir, const char *name, int len,</div><div class='ctx'> 		   struct dx_hash_info *hinfo)</div><div class='ctx'> {</div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='ctx'> 	const struct unicode_map *um = dir-&gt;i_sb-&gt;s_encoding;</div><div class='ctx'> 	int r, dlen;</div><div class='ctx'> 	unsigned char *buff;</div><div class='ctx'> 	struct qstr qstr = {.name = name, .len = len };</div><div class='ctx'> </div><div class='del'>-	if (len &amp;&amp; IS_CASEFOLDED(dir) &amp;&amp; um &amp;&amp;</div><div class='add'>+	if (len &amp;&amp; IS_CASEFOLDED(dir) &amp;&amp;</div><div class='ctx'> 	   (!IS_ENCRYPTED(dir) || fscrypt_has_encryption_key(dir))) {</div><div class='del'>-		buff = kzalloc(sizeof(char) * PATH_MAX, GFP_KERNEL);</div><div class='add'>+		buff = kzalloc(PATH_MAX, GFP_KERNEL);</div><div class='ctx'> 		if (!buff)</div><div class='ctx'> 			return -ENOMEM;</div><div class='ctx'> </div><div class='head'>diff --git a/fs/ext4/ialloc.c b/fs/ext4/ialloc.c<br/>index f73e5eb43eae..b20a1bf866ab 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/ialloc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/ialloc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/ialloc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/ialloc.c</a></div><div class='hunk'>@@ -87,19 +87,18 @@ static int ext4_validate_inode_bitmap(struct super_block *sb,</div><div class='ctx'> 	if (EXT4_SB(sb)-&gt;s_mount_state &amp; EXT4_FC_REPLAY)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	grp = ext4_get_group_info(sb, block_group);</div><div class='del'>-</div><div class='ctx'> 	if (buffer_verified(bh))</div><div class='ctx'> 		return 0;</div><div class='del'>-	if (EXT4_MB_GRP_IBITMAP_CORRUPT(grp))</div><div class='add'>+</div><div class='add'>+	grp = ext4_get_group_info(sb, block_group);</div><div class='add'>+	if (!grp || EXT4_MB_GRP_IBITMAP_CORRUPT(grp))</div><div class='ctx'> 		return -EFSCORRUPTED;</div><div class='ctx'> </div><div class='ctx'> 	ext4_lock_group(sb, block_group);</div><div class='ctx'> 	if (buffer_verified(bh))</div><div class='ctx'> 		goto verified;</div><div class='ctx'> 	blk = ext4_inode_bitmap(sb, desc);</div><div class='del'>-	if (!ext4_inode_bitmap_csum_verify(sb, block_group, desc, bh,</div><div class='del'>-					   EXT4_INODES_PER_GROUP(sb) / 8) ||</div><div class='add'>+	if (!ext4_inode_bitmap_csum_verify(sb, desc, bh) ||</div><div class='ctx'> 	    ext4_simulate_fail(sb, EXT4_SIM_IBITMAP_CRC)) {</div><div class='ctx'> 		ext4_unlock_group(sb, block_group);</div><div class='ctx'> 		ext4_error(sb, "Corrupt inode bitmap - block_group = %u, "</div><div class='hunk'>@@ -194,8 +193,9 @@ ext4_read_inode_bitmap(struct super_block *sb, ext4_group_t block_group)</div><div class='ctx'> 	 * submit the buffer_head for reading</div><div class='ctx'> 	 */</div><div class='ctx'> 	trace_ext4_load_inode_bitmap(sb, block_group);</div><div class='del'>-	ext4_read_bh(bh, REQ_META | REQ_PRIO, ext4_end_bitmap_read);</div><div class='del'>-	ext4_simulate_fail_bh(sb, bh, EXT4_SIM_IBITMAP_EIO);</div><div class='add'>+	ext4_read_bh(bh, REQ_META | REQ_PRIO,</div><div class='add'>+		     ext4_end_bitmap_read,</div><div class='add'>+		     ext4_simulate_fail(sb, EXT4_SIM_IBITMAP_EIO));</div><div class='ctx'> 	if (!buffer_uptodate(bh)) {</div><div class='ctx'> 		put_bh(bh);</div><div class='ctx'> 		ext4_error_err(sb, EIO, "Cannot read inode bitmap - "</div><div class='hunk'>@@ -252,10 +252,10 @@ void ext4_free_inode(handle_t *handle, struct inode *inode)</div><div class='ctx'> 		       "nonexistent device\n", __func__, __LINE__);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='del'>-	if (atomic_read(&amp;inode-&gt;i_count) &gt; 1) {</div><div class='add'>+	if (icount_read(inode) &gt; 1) {</div><div class='ctx'> 		ext4_msg(sb, KERN_ERR, "%s:%d: inode #%lu: count=%d",</div><div class='ctx'> 			 __func__, __LINE__, inode-&gt;i_ino,</div><div class='del'>-			 atomic_read(&amp;inode-&gt;i_count));</div><div class='add'>+			 icount_read(inode));</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (inode-&gt;i_nlink) {</div><div class='hunk'>@@ -293,7 +293,7 @@ void ext4_free_inode(handle_t *handle, struct inode *inode)</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!(sbi-&gt;s_mount_state &amp; EXT4_FC_REPLAY)) {</div><div class='ctx'> 		grp = ext4_get_group_info(sb, block_group);</div><div class='del'>-		if (unlikely(EXT4_MB_GRP_IBITMAP_CORRUPT(grp))) {</div><div class='add'>+		if (!grp || unlikely(EXT4_MB_GRP_IBITMAP_CORRUPT(grp))) {</div><div class='ctx'> 			fatal = -EFSCORRUPTED;</div><div class='ctx'> 			goto error_return;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -327,8 +327,7 @@ void ext4_free_inode(handle_t *handle, struct inode *inode)</div><div class='ctx'> 		if (percpu_counter_initialized(&amp;sbi-&gt;s_dirs_counter))</div><div class='ctx'> 			percpu_counter_dec(&amp;sbi-&gt;s_dirs_counter);</div><div class='ctx'> 	}</div><div class='del'>-	ext4_inode_bitmap_csum_set(sb, block_group, gdp, bitmap_bh,</div><div class='del'>-				   EXT4_INODES_PER_GROUP(sb) / 8);</div><div class='add'>+	ext4_inode_bitmap_csum_set(sb, gdp, bitmap_bh);</div><div class='ctx'> 	ext4_group_desc_csum_set(sb, block_group, gdp);</div><div class='ctx'> 	ext4_unlock_group(sb, block_group);</div><div class='ctx'> </div><div class='hunk'>@@ -463,10 +462,9 @@ static int find_group_orlov(struct super_block *sb, struct inode *parent,</div><div class='ctx'> 			hinfo.hash_version = DX_HASH_HALF_MD4;</div><div class='ctx'> 			hinfo.seed = sbi-&gt;s_hash_seed;</div><div class='ctx'> 			ext4fs_dirhash(parent, qstr-&gt;name, qstr-&gt;len, &amp;hinfo);</div><div class='del'>-			grp = hinfo.hash;</div><div class='add'>+			parent_group = hinfo.hash % ngroups;</div><div class='ctx'> 		} else</div><div class='del'>-			grp = prandom_u32();</div><div class='del'>-		parent_group = (unsigned)grp % ngroups;</div><div class='add'>+			parent_group = get_random_u32_below(ngroups);</div><div class='ctx'> 		for (i = 0; i &lt; ngroups; i++) {</div><div class='ctx'> 			g = (parent_group + i) % ngroups;</div><div class='ctx'> 			get_orlov_stats(sb, g, flex_size, &amp;stats);</div><div class='hunk'>@@ -510,11 +508,13 @@ static int find_group_orlov(struct super_block *sb, struct inode *parent,</div><div class='ctx'> 		goto fallback;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	max_dirs = ndirs / ngroups + inodes_per_group / 16;</div><div class='add'>+	max_dirs = ndirs / ngroups + inodes_per_group*flex_size / 16;</div><div class='ctx'> 	min_inodes = avefreei - inodes_per_group*flex_size / 4;</div><div class='ctx'> 	if (min_inodes &lt; 1)</div><div class='ctx'> 		min_inodes = 1;</div><div class='ctx'> 	min_clusters = avefreec - EXT4_CLUSTERS_PER_GROUP(sb)*flex_size / 4;</div><div class='add'>+	if (min_clusters &lt; 0)</div><div class='add'>+		min_clusters = 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Start looking in the flex group where we last allocated an</div><div class='hunk'>@@ -691,7 +691,8 @@ static int recently_deleted(struct super_block *sb, ext4_group_t group, int ino)</div><div class='ctx'> 	if (!bh || !buffer_uptodate(bh))</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * If the block is not in the buffer cache, then it</div><div class='del'>-		 * must have been written out.</div><div class='add'>+		 * must have been written out, or, most unlikely, is</div><div class='add'>+		 * being migrated - false failure should be OK here.</div><div class='ctx'> 		 */</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -756,10 +757,10 @@ int ext4_mark_inode_used(struct super_block *sb, int ino)</div><div class='ctx'> 	struct ext4_group_desc *gdp;</div><div class='ctx'> 	ext4_group_t group;</div><div class='ctx'> 	int bit;</div><div class='del'>-	int err = -EFSCORRUPTED;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (ino &lt; EXT4_FIRST_INO(sb) || ino &gt; max_ino)</div><div class='del'>-		goto out;</div><div class='add'>+		return -EFSCORRUPTED;</div><div class='ctx'> </div><div class='ctx'> 	group = (ino - 1) / EXT4_INODES_PER_GROUP(sb);</div><div class='ctx'> 	bit = (ino - 1) % EXT4_INODES_PER_GROUP(sb);</div><div class='hunk'>@@ -773,7 +774,7 @@ int ext4_mark_inode_used(struct super_block *sb, int ino)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	gdp = ext4_get_group_desc(sb, group, &amp;group_desc_bh);</div><div class='del'>-	if (!gdp || !group_desc_bh) {</div><div class='add'>+	if (!gdp) {</div><div class='ctx'> 		err = -EINVAL;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -814,8 +815,7 @@ int ext4_mark_inode_used(struct super_block *sb, int ino)</div><div class='ctx'> 			gdp-&gt;bg_flags &amp;= cpu_to_le16(~EXT4_BG_BLOCK_UNINIT);</div><div class='ctx'> 			ext4_free_group_clusters_set(sb, gdp,</div><div class='ctx'> 				ext4_free_clusters_after_init(sb, group, gdp));</div><div class='del'>-			ext4_block_bitmap_csum_set(sb, group, gdp,</div><div class='del'>-						   block_bitmap_bh);</div><div class='add'>+			ext4_block_bitmap_csum_set(sb, gdp, block_bitmap_bh);</div><div class='ctx'> 			ext4_group_desc_csum_set(sb, group, gdp);</div><div class='ctx'> 		}</div><div class='ctx'> 		ext4_unlock_group(sb, group);</div><div class='hunk'>@@ -853,8 +853,7 @@ int ext4_mark_inode_used(struct super_block *sb, int ino)</div><div class='ctx'> </div><div class='ctx'> 	ext4_free_inodes_set(sb, gdp, ext4_free_inodes_count(sb, gdp) - 1);</div><div class='ctx'> 	if (ext4_has_group_desc_csum(sb)) {</div><div class='del'>-		ext4_inode_bitmap_csum_set(sb, group, gdp, inode_bitmap_bh,</div><div class='del'>-					   EXT4_INODES_PER_GROUP(sb) / 8);</div><div class='add'>+		ext4_inode_bitmap_csum_set(sb, gdp, inode_bitmap_bh);</div><div class='ctx'> 		ext4_group_desc_csum_set(sb, group, gdp);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -862,6 +861,7 @@ int ext4_mark_inode_used(struct super_block *sb, int ino)</div><div class='ctx'> 	err = ext4_handle_dirty_metadata(NULL, NULL, group_desc_bh);</div><div class='ctx'> 	sync_dirty_buffer(group_desc_bh);</div><div class='ctx'> out:</div><div class='add'>+	brelse(inode_bitmap_bh);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -871,7 +871,7 @@ static int ext4_xattr_credits_for_new_inode(struct inode *dir, mode_t mode,</div><div class='ctx'> 	struct super_block *sb = dir-&gt;i_sb;</div><div class='ctx'> 	int nblocks = 0;</div><div class='ctx'> #ifdef CONFIG_EXT4_FS_POSIX_ACL</div><div class='del'>-	struct posix_acl *p = get_acl(dir, ACL_TYPE_DEFAULT);</div><div class='add'>+	struct posix_acl *p = get_inode_acl(dir, ACL_TYPE_DEFAULT);</div><div class='ctx'> </div><div class='ctx'> 	if (IS_ERR(p))</div><div class='ctx'> 		return PTR_ERR(p);</div><div class='hunk'>@@ -922,7 +922,7 @@ static int ext4_xattr_credits_for_new_inode(struct inode *dir, mode_t mode,</div><div class='ctx'>  * For other inodes, search forward from the parent directory's block</div><div class='ctx'>  * group to find a free inode.</div><div class='ctx'>  */</div><div class='del'>-struct inode *__ext4_new_inode(struct user_namespace *mnt_userns,</div><div class='add'>+struct inode *__ext4_new_inode(struct mnt_idmap *idmap,</div><div class='ctx'> 			       handle_t *handle, struct inode *dir,</div><div class='ctx'> 			       umode_t mode, const struct qstr *qstr,</div><div class='ctx'> 			       __u32 goal, uid_t *owner, __u32 i_flags,</div><div class='hunk'>@@ -952,8 +952,9 @@ struct inode *__ext4_new_inode(struct user_namespace *mnt_userns,</div><div class='ctx'> 	sb = dir-&gt;i_sb;</div><div class='ctx'> 	sbi = EXT4_SB(sb);</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ext4_forced_shutdown(sbi)))</div><div class='del'>-		return ERR_PTR(-EIO);</div><div class='add'>+	ret2 = ext4_emergency_state(sb);</div><div class='add'>+	if (unlikely(ret2))</div><div class='add'>+		return ERR_PTR(ret2);</div><div class='ctx'> </div><div class='ctx'> 	ngroups = ext4_get_groups_count(sb);</div><div class='ctx'> 	trace_ext4_request_inode(dir, mode);</div><div class='hunk'>@@ -973,10 +974,10 @@ struct inode *__ext4_new_inode(struct user_namespace *mnt_userns,</div><div class='ctx'> 		i_gid_write(inode, owner[1]);</div><div class='ctx'> 	} else if (test_opt(sb, GRPID)) {</div><div class='ctx'> 		inode-&gt;i_mode = mode;</div><div class='del'>-		inode_fsuid_set(inode, mnt_userns);</div><div class='add'>+		inode_fsuid_set(inode, idmap);</div><div class='ctx'> 		inode-&gt;i_gid = dir-&gt;i_gid;</div><div class='ctx'> 	} else</div><div class='del'>-		inode_init_owner(mnt_userns, inode, dir, mode);</div><div class='add'>+		inode_init_owner(idmap, inode, dir, mode);</div><div class='ctx'> </div><div class='ctx'> 	if (ext4_has_feature_project(sb) &amp;&amp;</div><div class='ctx'> 	    ext4_test_inode_flag(dir, EXT4_INODE_PROJINHERIT))</div><div class='hunk'>@@ -1048,21 +1049,21 @@ got_group:</div><div class='ctx'> 			 * Skip groups with already-known suspicious inode</div><div class='ctx'> 			 * tables</div><div class='ctx'> 			 */</div><div class='del'>-			if (EXT4_MB_GRP_IBITMAP_CORRUPT(grp))</div><div class='add'>+			if (!grp || EXT4_MB_GRP_IBITMAP_CORRUPT(grp))</div><div class='ctx'> 				goto next_group;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		brelse(inode_bitmap_bh);</div><div class='ctx'> 		inode_bitmap_bh = ext4_read_inode_bitmap(sb, group);</div><div class='ctx'> 		/* Skip groups with suspicious inode tables */</div><div class='del'>-		if (((!(sbi-&gt;s_mount_state &amp; EXT4_FC_REPLAY))</div><div class='del'>-		     &amp;&amp; EXT4_MB_GRP_IBITMAP_CORRUPT(grp)) ||</div><div class='del'>-		    IS_ERR(inode_bitmap_bh)) {</div><div class='add'>+		if (IS_ERR(inode_bitmap_bh)) {</div><div class='ctx'> 			inode_bitmap_bh = NULL;</div><div class='ctx'> 			goto next_group;</div><div class='ctx'> 		}</div><div class='add'>+		if (!(sbi-&gt;s_mount_state &amp; EXT4_FC_REPLAY) &amp;&amp;</div><div class='add'>+		    EXT4_MB_GRP_IBITMAP_CORRUPT(grp))</div><div class='add'>+			goto next_group;</div><div class='ctx'> </div><div class='del'>-repeat_in_this_group:</div><div class='ctx'> 		ret2 = find_inode_bit(sb, group, inode_bitmap_bh, &amp;ino);</div><div class='ctx'> 		if (!ret2)</div><div class='ctx'> 			goto next_group;</div><div class='hunk'>@@ -1077,8 +1078,8 @@ repeat_in_this_group:</div><div class='ctx'> </div><div class='ctx'> 		if ((!(sbi-&gt;s_mount_state &amp; EXT4_FC_REPLAY)) &amp;&amp; !handle) {</div><div class='ctx'> 			BUG_ON(nblocks &lt;= 0);</div><div class='del'>-			handle = __ext4_journal_start_sb(dir-&gt;i_sb, line_no,</div><div class='del'>-				 handle_type, nblocks, 0,</div><div class='add'>+			handle = __ext4_journal_start_sb(NULL, dir-&gt;i_sb,</div><div class='add'>+				 line_no, handle_type, nblocks, 0,</div><div class='ctx'> 				 ext4_trans_default_revoke_credits(sb));</div><div class='ctx'> 			if (IS_ERR(handle)) {</div><div class='ctx'> 				err = PTR_ERR(handle);</div><div class='hunk'>@@ -1112,8 +1113,6 @@ repeat_in_this_group:</div><div class='ctx'> 		if (!ret2)</div><div class='ctx'> 			goto got; /* we grabbed the inode! */</div><div class='ctx'> </div><div class='del'>-		if (ino &lt; EXT4_INODES_PER_GROUP(sb))</div><div class='del'>-			goto repeat_in_this_group;</div><div class='ctx'> next_group:</div><div class='ctx'> 		if (++group == ngroups)</div><div class='ctx'> 			group = 0;</div><div class='hunk'>@@ -1166,8 +1165,7 @@ got:</div><div class='ctx'> 			gdp-&gt;bg_flags &amp;= cpu_to_le16(~EXT4_BG_BLOCK_UNINIT);</div><div class='ctx'> 			ext4_free_group_clusters_set(sb, gdp,</div><div class='ctx'> 				ext4_free_clusters_after_init(sb, group, gdp));</div><div class='del'>-			ext4_block_bitmap_csum_set(sb, group, gdp,</div><div class='del'>-						   block_bitmap_bh);</div><div class='add'>+			ext4_block_bitmap_csum_set(sb, gdp, block_bitmap_bh);</div><div class='ctx'> 			ext4_group_desc_csum_set(sb, group, gdp);</div><div class='ctx'> 		}</div><div class='ctx'> 		ext4_unlock_group(sb, group);</div><div class='hunk'>@@ -1186,6 +1184,10 @@ got:</div><div class='ctx'> </div><div class='ctx'> 		if (!(sbi-&gt;s_mount_state &amp; EXT4_FC_REPLAY)) {</div><div class='ctx'> 			grp = ext4_get_group_info(sb, group);</div><div class='add'>+			if (!grp) {</div><div class='add'>+				err = -EFSCORRUPTED;</div><div class='add'>+				goto out;</div><div class='add'>+			}</div><div class='ctx'> 			down_read(&amp;grp-&gt;alloc_sem); /*</div><div class='ctx'> 						     * protect vs itable</div><div class='ctx'> 						     * lazyinit</div><div class='hunk'>@@ -1223,8 +1225,7 @@ got:</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	if (ext4_has_group_desc_csum(sb)) {</div><div class='del'>-		ext4_inode_bitmap_csum_set(sb, group, gdp, inode_bitmap_bh,</div><div class='del'>-					   EXT4_INODES_PER_GROUP(sb) / 8);</div><div class='add'>+		ext4_inode_bitmap_csum_set(sb, gdp, inode_bitmap_bh);</div><div class='ctx'> 		ext4_group_desc_csum_set(sb, group, gdp);</div><div class='ctx'> 	}</div><div class='ctx'> 	ext4_unlock_group(sb, group);</div><div class='hunk'>@@ -1249,8 +1250,8 @@ got:</div><div class='ctx'> 	inode-&gt;i_ino = ino + group * EXT4_INODES_PER_GROUP(sb);</div><div class='ctx'> 	/* This is the optimal IO size (for stat), not the fs block size */</div><div class='ctx'> 	inode-&gt;i_blocks = 0;</div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_atime = inode-&gt;i_ctime = current_time(inode);</div><div class='del'>-	ei-&gt;i_crtime = inode-&gt;i_mtime;</div><div class='add'>+	simple_inode_init_ts(inode);</div><div class='add'>+	ei-&gt;i_crtime = inode_get_mtime(inode);</div><div class='ctx'> </div><div class='ctx'> 	memset(ei-&gt;i_data, 0, sizeof(ei-&gt;i_data));</div><div class='ctx'> 	ei-&gt;i_dir_start_lookup = 0;</div><div class='hunk'>@@ -1280,26 +1281,24 @@ got:</div><div class='ctx'> 					EXT4_GROUP_INFO_IBITMAP_CORRUPT);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	inode-&gt;i_generation = prandom_u32();</div><div class='add'>+	inode-&gt;i_generation = get_random_u32();</div><div class='ctx'> </div><div class='ctx'> 	/* Precompute checksum seed for inode metadata */</div><div class='del'>-	if (ext4_has_metadata_csum(sb)) {</div><div class='add'>+	if (ext4_has_feature_metadata_csum(sb)) {</div><div class='ctx'> 		__u32 csum;</div><div class='ctx'> 		__le32 inum = cpu_to_le32(inode-&gt;i_ino);</div><div class='ctx'> 		__le32 gen = cpu_to_le32(inode-&gt;i_generation);</div><div class='del'>-		csum = ext4_chksum(sbi, sbi-&gt;s_csum_seed, (__u8 *)&amp;inum,</div><div class='add'>+		csum = ext4_chksum(sbi-&gt;s_csum_seed, (__u8 *)&amp;inum,</div><div class='ctx'> 				   sizeof(inum));</div><div class='del'>-		ei-&gt;i_csum_seed = ext4_chksum(sbi, csum, (__u8 *)&amp;gen,</div><div class='del'>-					      sizeof(gen));</div><div class='add'>+		ei-&gt;i_csum_seed = ext4_chksum(csum, (__u8 *)&amp;gen, sizeof(gen));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ext4_clear_state_flags(ei); /* Only relevant on 32-bit archs */</div><div class='ctx'> 	ext4_set_inode_state(inode, EXT4_STATE_NEW);</div><div class='ctx'> </div><div class='ctx'> 	ei-&gt;i_extra_isize = sbi-&gt;s_want_extra_isize;</div><div class='ctx'> 	ei-&gt;i_inline_off = 0;</div><div class='ctx'> 	if (ext4_has_feature_inline_data(sb) &amp;&amp;</div><div class='del'>-	    (!(ei-&gt;i_flags &amp; EXT4_DAX_FL) || S_ISDIR(mode)))</div><div class='add'>+	    (!(ei-&gt;i_flags &amp; (EXT4_DAX_FL|EXT4_EA_INODE_FL)) || S_ISDIR(mode)))</div><div class='ctx'> 		ext4_set_inode_state(inode, EXT4_STATE_MAY_INLINE_DATA);</div><div class='ctx'> 	ret = inode;</div><div class='ctx'> 	err = dquot_alloc_inode(inode);</div><div class='hunk'>@@ -1335,10 +1334,9 @@ got:</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (ext4_handle_valid(handle)) {</div><div class='del'>-		ei-&gt;i_sync_tid = handle-&gt;h_transaction-&gt;t_tid;</div><div class='del'>-		ei-&gt;i_datasync_tid = handle-&gt;h_transaction-&gt;t_tid;</div><div class='del'>-	}</div><div class='add'>+	ext4_set_inode_mapping_order(inode);</div><div class='add'>+</div><div class='add'>+	ext4_update_inode_fsync_trans(handle, inode, 1);</div><div class='ctx'> </div><div class='ctx'> 	err = ext4_mark_inode_dirty(handle, inode);</div><div class='ctx'> 	if (err) {</div><div class='hunk'>@@ -1522,14 +1520,8 @@ int ext4_init_inode_table(struct super_block *sb, ext4_group_t group,</div><div class='ctx'> 	int num, ret = 0, used_blks = 0;</div><div class='ctx'> 	unsigned long used_inos = 0;</div><div class='ctx'> </div><div class='del'>-	/* This should not happen, but just to be sure check this */</div><div class='del'>-	if (sb_rdonly(sb)) {</div><div class='del'>-		ret = 1;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	gdp = ext4_get_group_desc(sb, group, &amp;group_desc_bh);</div><div class='del'>-	if (!gdp)</div><div class='add'>+	if (!gdp || !grp)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='head'>diff --git a/fs/ext4/indirect.c b/fs/ext4/indirect.c<br/>index 89efa78ed4b2..da76353b3a57 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/indirect.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/indirect.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/indirect.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/indirect.c</a></div><div class='hunk'>@@ -148,6 +148,7 @@ static Indirect *ext4_get_branch(struct inode *inode, int depth,</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	Indirect *p = chain;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='add'>+	unsigned int key;</div><div class='ctx'> 	int ret = -EIO;</div><div class='ctx'> </div><div class='ctx'> 	*err = 0;</div><div class='hunk'>@@ -156,14 +157,20 @@ static Indirect *ext4_get_branch(struct inode *inode, int depth,</div><div class='ctx'> 	if (!p-&gt;key)</div><div class='ctx'> 		goto no_block;</div><div class='ctx'> 	while (--depth) {</div><div class='del'>-		bh = sb_getblk(sb, le32_to_cpu(p-&gt;key));</div><div class='add'>+		key = le32_to_cpu(p-&gt;key);</div><div class='add'>+		if (key &gt; ext4_blocks_count(EXT4_SB(sb)-&gt;s_es)) {</div><div class='add'>+			/* the block was out of range */</div><div class='add'>+			ret = -EFSCORRUPTED;</div><div class='add'>+			goto failure;</div><div class='add'>+		}</div><div class='add'>+		bh = sb_getblk(sb, key);</div><div class='ctx'> 		if (unlikely(!bh)) {</div><div class='ctx'> 			ret = -ENOMEM;</div><div class='ctx'> 			goto failure;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (!bh_uptodate_or_lock(bh)) {</div><div class='del'>-			if (ext4_read_bh(bh, 0, NULL) &lt; 0) {</div><div class='add'>+			if (ext4_read_bh(bh, 0, NULL, false) &lt; 0) {</div><div class='ctx'> 				put_bh(bh);</div><div class='ctx'> 				goto failure;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -460,7 +467,7 @@ static int ext4_splice_branch(handle_t *handle,</div><div class='ctx'> 		 * the new i_size.  But that is not done here - it is done in</div><div class='ctx'> 		 * generic_commit_write-&gt;__mark_inode_dirty-&gt;ext4_dirty_inode.</div><div class='ctx'> 		 */</div><div class='del'>-		jbd_debug(5, "splicing indirect only\n");</div><div class='add'>+		ext4_debug("splicing indirect only\n");</div><div class='ctx'> 		BUFFER_TRACE(where-&gt;bh, "call ext4_handle_dirty_metadata");</div><div class='ctx'> 		err = ext4_handle_dirty_metadata(handle, ar-&gt;inode, where-&gt;bh);</div><div class='ctx'> 		if (err)</div><div class='hunk'>@@ -472,7 +479,7 @@ static int ext4_splice_branch(handle_t *handle,</div><div class='ctx'> 		err = ext4_mark_inode_dirty(handle, ar-&gt;inode);</div><div class='ctx'> 		if (unlikely(err))</div><div class='ctx'> 			goto err_out;</div><div class='del'>-		jbd_debug(5, "splicing direct\n");</div><div class='add'>+		ext4_debug("splicing direct\n");</div><div class='ctx'> 	}</div><div class='ctx'> 	return err;</div><div class='ctx'> </div><div class='hunk'>@@ -532,7 +539,7 @@ int ext4_ind_map_blocks(handle_t *handle, struct inode *inode,</div><div class='ctx'> 	int indirect_blks;</div><div class='ctx'> 	int blocks_to_boundary = 0;</div><div class='ctx'> 	int depth;</div><div class='del'>-	int count = 0;</div><div class='add'>+	u64 count = 0;</div><div class='ctx'> 	ext4_fsblk_t first_block = 0;</div><div class='ctx'> </div><div class='ctx'> 	trace_ext4_ind_map_blocks_enter(inode, map-&gt;m_lblk, map-&gt;m_len, flags);</div><div class='hunk'>@@ -581,7 +588,7 @@ int ext4_ind_map_blocks(handle_t *handle, struct inode *inode,</div><div class='ctx'> 		count++;</div><div class='ctx'> 		/* Fill in size of a hole we found */</div><div class='ctx'> 		map-&gt;m_pblk = 0;</div><div class='del'>-		map-&gt;m_len = min_t(unsigned int, map-&gt;m_len, count);</div><div class='add'>+		map-&gt;m_len = umin(map-&gt;m_len, count);</div><div class='ctx'> 		goto cleanup;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -644,6 +651,7 @@ int ext4_ind_map_blocks(handle_t *handle, struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 	ext4_update_inode_fsync_trans(handle, inode, 1);</div><div class='ctx'> 	count = ar.len;</div><div class='add'>+</div><div class='ctx'> got_it:</div><div class='ctx'> 	map-&gt;m_flags |= EXT4_MAP_MAPPED;</div><div class='ctx'> 	map-&gt;m_pblk = le32_to_cpu(chain[depth-1].key);</div><div class='hunk'>@@ -696,10 +704,10 @@ static int ext4_ind_trunc_restart_fn(handle_t *handle, struct inode *inode,</div><div class='ctx'> 	 * Drop i_data_sem to avoid deadlock with ext4_map_blocks.  At this</div><div class='ctx'> 	 * moment, get_block can be called only for blocks inside i_size since</div><div class='ctx'> 	 * page cache has been already dropped and writes are blocked by</div><div class='del'>-	 * i_mutex. So we can safely drop the i_data_sem here.</div><div class='add'>+	 * i_rwsem. So we can safely drop the i_data_sem here.</div><div class='ctx'> 	 */</div><div class='ctx'> 	BUG_ON(EXT4_JOURNAL(inode) == NULL);</div><div class='del'>-	ext4_discard_preallocations(inode, 0);</div><div class='add'>+	ext4_discard_preallocations(inode);</div><div class='ctx'> 	up_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='ctx'> 	*dropped = 1;</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -1017,7 +1025,7 @@ static void ext4_free_branches(handle_t *handle, struct inode *inode,</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			/* Go read the buffer for the next level down */</div><div class='del'>-			bh = ext4_sb_bread(inode-&gt;i_sb, nr, 0);</div><div class='add'>+			bh = ext4_sb_bread_nofail(inode-&gt;i_sb, nr);</div><div class='ctx'> </div><div class='ctx'> 			/*</div><div class='ctx'> 			 * A read failure? Report error and clear slot</div><div class='head'>diff --git a/fs/ext4/inline.c b/fs/ext4/inline.c<br/>index 39a1ab129fdc..1f6bc05593df 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/inline.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/inline.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/inline.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/inline.c</a></div><div class='hunk'>@@ -6,8 +6,9 @@</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/iomap.h&gt;</div><div class='ctx'> #include &lt;linux/fiemap.h&gt;</div><div class='add'>+#include &lt;linux/namei.h&gt;</div><div class='ctx'> #include &lt;linux/iversion.h&gt;</div><div class='del'>-#include &lt;linux/backing-dev.h&gt;</div><div class='add'>+#include &lt;linux/sched/mm.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "ext4_jbd2.h"</div><div class='ctx'> #include "ext4.h"</div><div class='hunk'>@@ -19,6 +20,11 @@</div><div class='ctx'> #define EXT4_INLINE_DOTDOT_OFFSET	2</div><div class='ctx'> #define EXT4_INLINE_DOTDOT_SIZE		4</div><div class='ctx'> </div><div class='add'>+</div><div class='add'>+static int ext4_da_convert_inline_data_to_extent(struct address_space *mapping,</div><div class='add'>+						 struct inode *inode,</div><div class='add'>+						 void **fsdata);</div><div class='add'>+</div><div class='ctx'> static int ext4_get_inline_size(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	if (EXT4_I(inode)-&gt;i_inline_off)</div><div class='hunk'>@@ -33,8 +39,12 @@ static int get_max_inline_xattr_value_size(struct inode *inode,</div><div class='ctx'> 	struct ext4_xattr_ibody_header *header;</div><div class='ctx'> 	struct ext4_xattr_entry *entry;</div><div class='ctx'> 	struct ext4_inode *raw_inode;</div><div class='add'>+	void *end;</div><div class='ctx'> 	int free, min_offs;</div><div class='ctx'> </div><div class='add'>+	if (!EXT4_INODE_HAS_XATTR_SPACE(inode))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='ctx'> 	min_offs = EXT4_SB(inode-&gt;i_sb)-&gt;s_inode_size -</div><div class='ctx'> 			EXT4_GOOD_OLD_INODE_SIZE -</div><div class='ctx'> 			EXT4_I(inode)-&gt;i_extra_isize -</div><div class='hunk'>@@ -53,14 +63,23 @@ static int get_max_inline_xattr_value_size(struct inode *inode,</div><div class='ctx'> 	raw_inode = ext4_raw_inode(iloc);</div><div class='ctx'> 	header = IHDR(inode, raw_inode);</div><div class='ctx'> 	entry = IFIRST(header);</div><div class='add'>+	end = (void *)raw_inode + EXT4_SB(inode-&gt;i_sb)-&gt;s_inode_size;</div><div class='ctx'> </div><div class='ctx'> 	/* Compute min_offs. */</div><div class='del'>-	for (; !IS_LAST_ENTRY(entry); entry = EXT4_XATTR_NEXT(entry)) {</div><div class='add'>+	while (!IS_LAST_ENTRY(entry)) {</div><div class='add'>+		void *next = EXT4_XATTR_NEXT(entry);</div><div class='add'>+</div><div class='add'>+		if (next &gt;= end) {</div><div class='add'>+			EXT4_ERROR_INODE(inode,</div><div class='add'>+					 "corrupt xattr in inline inode");</div><div class='add'>+			return 0;</div><div class='add'>+		}</div><div class='ctx'> 		if (!entry-&gt;e_value_inum &amp;&amp; entry-&gt;e_value_size) {</div><div class='ctx'> 			size_t offs = le16_to_cpu(entry-&gt;e_value_offs);</div><div class='ctx'> 			if (offs &lt; min_offs)</div><div class='ctx'> 				min_offs = offs;</div><div class='ctx'> 		}</div><div class='add'>+		entry = next;</div><div class='ctx'> 	}</div><div class='ctx'> 	free = min_offs -</div><div class='ctx'> 		((void *)entry - (void *)IFIRST(header)) - sizeof(__u32);</div><div class='hunk'>@@ -155,7 +174,6 @@ int ext4_find_inline_data_nolock(struct inode *inode)</div><div class='ctx'> 					(void *)ext4_raw_inode(&amp;is.iloc));</div><div class='ctx'> 		EXT4_I(inode)-&gt;i_inline_size = EXT4_MIN_INLINE_DATA_SIZE +</div><div class='ctx'> 				le32_to_cpu(is.s.here-&gt;e_value_size);</div><div class='del'>-		ext4_set_inode_state(inode, EXT4_STATE_MAY_INLINE_DATA);</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='ctx'> 	brelse(is.iloc.bh);</div><div class='hunk'>@@ -176,8 +194,7 @@ static int ext4_read_inline_data(struct inode *inode, void *buffer,</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(len &gt; EXT4_I(inode)-&gt;i_inline_size);</div><div class='ctx'> </div><div class='del'>-	cp_len = len &lt; EXT4_MIN_INLINE_DATA_SIZE ?</div><div class='del'>-			len : EXT4_MIN_INLINE_DATA_SIZE;</div><div class='add'>+	cp_len = min_t(unsigned int, len, EXT4_MIN_INLINE_DATA_SIZE);</div><div class='ctx'> </div><div class='ctx'> 	raw_inode = ext4_raw_inode(iloc);</div><div class='ctx'> 	memcpy(buffer, (void *)(raw_inode-&gt;i_block), cp_len);</div><div class='hunk'>@@ -216,7 +233,7 @@ static void ext4_write_inline_data(struct inode *inode, struct ext4_iloc *iloc,</div><div class='ctx'> 	struct ext4_inode *raw_inode;</div><div class='ctx'> 	int cp_len = 0;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ext4_forced_shutdown(EXT4_SB(inode-&gt;i_sb))))</div><div class='add'>+	if (unlikely(ext4_emergency_state(inode-&gt;i_sb)))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(!EXT4_I(inode)-&gt;i_inline_off);</div><div class='hunk'>@@ -286,7 +303,11 @@ static int ext4_create_inline_data(handle_t *handle,</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(!is.s.not_found);</div><div class='add'>+	if (!is.s.not_found) {</div><div class='add'>+		EXT4_ERROR_INODE(inode, "unexpected inline data xattr");</div><div class='add'>+		error = -EFSCORRUPTED;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	error = ext4_xattr_ibody_set(handle, inode, &amp;i, &amp;is);</div><div class='ctx'> 	if (error) {</div><div class='hunk'>@@ -337,7 +358,11 @@ static int ext4_update_inline_data(handle_t *handle, struct inode *inode,</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(is.s.not_found);</div><div class='add'>+	if (is.s.not_found) {</div><div class='add'>+		EXT4_ERROR_INODE(inode, "missing inline data xattr");</div><div class='add'>+		error = -EFSCORRUPTED;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	len -= EXT4_MIN_INLINE_DATA_SIZE;</div><div class='ctx'> 	value = kzalloc(len, GFP_NOFS);</div><div class='hunk'>@@ -348,7 +373,7 @@ static int ext4_update_inline_data(handle_t *handle, struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 	error = ext4_xattr_ibody_get(inode, i.name_index, i.name,</div><div class='ctx'> 				     value, len);</div><div class='del'>-	if (error == -ENODATA)</div><div class='add'>+	if (error &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	BUFFER_TRACE(is.iloc.bh, "get_write_access");</div><div class='hunk'>@@ -380,7 +405,7 @@ out:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ext4_prepare_inline_data(handle_t *handle, struct inode *inode,</div><div class='del'>-				    unsigned int len)</div><div class='add'>+				    loff_t len)</div><div class='ctx'> {</div><div class='ctx'> 	int ret, size, no_expand;</div><div class='ctx'> 	struct ext4_inode_info *ei = EXT4_I(inode);</div><div class='hunk'>@@ -393,7 +418,12 @@ static int ext4_prepare_inline_data(handle_t *handle, struct inode *inode,</div><div class='ctx'> 		return -ENOSPC;</div><div class='ctx'> </div><div class='ctx'> 	ext4_write_lock_xattr(inode, &amp;no_expand);</div><div class='del'>-</div><div class='add'>+	/*</div><div class='add'>+	 * ei-&gt;i_inline_size may have changed since the initial check</div><div class='add'>+	 * if other xattrs were added. Recalculate to ensure</div><div class='add'>+	 * ext4_update_inline_data() validates against current capacity.</div><div class='add'>+	 */</div><div class='add'>+	(void) ext4_find_inline_data_nolock(inode);</div><div class='ctx'> 	if (ei-&gt;i_inline_off)</div><div class='ctx'> 		ret = ext4_update_inline_data(handle, inode, len);</div><div class='ctx'> 	else</div><div class='hunk'>@@ -421,9 +451,13 @@ static int ext4_destroy_inline_data_nolock(handle_t *handle,</div><div class='ctx'> 	if (!ei-&gt;i_inline_off)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='add'>+	down_write(&amp;ei-&gt;i_data_sem);</div><div class='add'>+</div><div class='ctx'> 	error = ext4_get_inode_loc(inode, &amp;is.iloc);</div><div class='del'>-	if (error)</div><div class='add'>+	if (error) {</div><div class='add'>+		up_write(&amp;ei-&gt;i_data_sem);</div><div class='ctx'> 		return error;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	error = ext4_xattr_ibody_find(inode, &amp;i, &amp;is);</div><div class='ctx'> 	if (error)</div><div class='hunk'>@@ -462,19 +496,20 @@ out:</div><div class='ctx'> 	brelse(is.iloc.bh);</div><div class='ctx'> 	if (error == -ENODATA)</div><div class='ctx'> 		error = 0;</div><div class='add'>+	up_write(&amp;ei-&gt;i_data_sem);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext4_read_inline_page(struct inode *inode, struct page *page)</div><div class='add'>+static int ext4_read_inline_folio(struct inode *inode, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	void *kaddr;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	size_t len;</div><div class='ctx'> 	struct ext4_iloc iloc;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(!PageLocked(page));</div><div class='add'>+	BUG_ON(!folio_test_locked(folio));</div><div class='ctx'> 	BUG_ON(!ext4_has_inline_data(inode));</div><div class='del'>-	BUG_ON(page-&gt;index);</div><div class='add'>+	BUG_ON(folio-&gt;index);</div><div class='ctx'> </div><div class='ctx'> 	if (!EXT4_I(inode)-&gt;i_inline_off) {</div><div class='ctx'> 		ext4_warning(inode-&gt;i_sb, "inode %lu doesn't have inline data.",</div><div class='hunk'>@@ -487,19 +522,19 @@ static int ext4_read_inline_page(struct inode *inode, struct page *page)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	len = min_t(size_t, ext4_get_inline_size(inode), i_size_read(inode));</div><div class='del'>-	kaddr = kmap_atomic(page);</div><div class='add'>+	BUG_ON(len &gt; PAGE_SIZE);</div><div class='add'>+	kaddr = kmap_local_folio(folio, 0);</div><div class='ctx'> 	ret = ext4_read_inline_data(inode, kaddr, len, &amp;iloc);</div><div class='del'>-	flush_dcache_page(page);</div><div class='del'>-	kunmap_atomic(kaddr);</div><div class='del'>-	zero_user_segment(page, len, PAGE_SIZE);</div><div class='del'>-	SetPageUptodate(page);</div><div class='add'>+	kaddr = folio_zero_tail(folio, len, kaddr + len);</div><div class='add'>+	kunmap_local(kaddr);</div><div class='add'>+	folio_mark_uptodate(folio);</div><div class='ctx'> 	brelse(iloc.bh);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int ext4_readpage_inline(struct inode *inode, struct page *page)</div><div class='add'>+int ext4_readpage_inline(struct inode *inode, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -513,27 +548,26 @@ int ext4_readpage_inline(struct inode *inode, struct page *page)</div><div class='ctx'> 	 * Current inline data can only exist in the 1st page,</div><div class='ctx'> 	 * So for all the other pages, just set them uptodate.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!page-&gt;index)</div><div class='del'>-		ret = ext4_read_inline_page(inode, page);</div><div class='del'>-	else if (!PageUptodate(page)) {</div><div class='del'>-		zero_user_segment(page, 0, PAGE_SIZE);</div><div class='del'>-		SetPageUptodate(page);</div><div class='add'>+	if (!folio-&gt;index)</div><div class='add'>+		ret = ext4_read_inline_folio(inode, folio);</div><div class='add'>+	else if (!folio_test_uptodate(folio)) {</div><div class='add'>+		folio_zero_segment(folio, 0, folio_size(folio));</div><div class='add'>+		folio_mark_uptodate(folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	up_read(&amp;EXT4_I(inode)-&gt;xattr_sem);</div><div class='ctx'> </div><div class='del'>-	unlock_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> 	return ret &gt;= 0 ? 0 : ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ext4_convert_inline_data_to_extent(struct address_space *mapping,</div><div class='del'>-					      struct inode *inode,</div><div class='del'>-					      unsigned flags)</div><div class='add'>+					      struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	int ret, needed_blocks, no_expand;</div><div class='ctx'> 	handle_t *handle = NULL;</div><div class='ctx'> 	int retries = 0, sem_held = 0;</div><div class='del'>-	struct page *page = NULL;</div><div class='add'>+	struct folio *folio = NULL;</div><div class='ctx'> 	unsigned from, to;</div><div class='ctx'> 	struct ext4_iloc iloc;</div><div class='ctx'> </div><div class='hunk'>@@ -546,7 +580,7 @@ static int ext4_convert_inline_data_to_extent(struct address_space *mapping,</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	needed_blocks = ext4_writepage_trans_blocks(inode);</div><div class='add'>+	needed_blocks = ext4_chunk_trans_extent(inode, 1);</div><div class='ctx'> </div><div class='ctx'> 	ret = ext4_get_inode_loc(inode, &amp;iloc);</div><div class='ctx'> 	if (ret)</div><div class='hunk'>@@ -562,12 +596,11 @@ retry:</div><div class='ctx'> </div><div class='ctx'> 	/* We cannot recurse into the filesystem as the transaction is already</div><div class='ctx'> 	 * started */</div><div class='del'>-	flags |= AOP_FLAG_NOFS;</div><div class='del'>-</div><div class='del'>-	page = grab_cache_page_write_begin(mapping, 0, flags);</div><div class='del'>-	if (!page) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='add'>+	folio = __filemap_get_folio(mapping, 0, FGP_WRITEBEGIN | FGP_NOFS,</div><div class='add'>+			mapping_gfp_mask(mapping));</div><div class='add'>+	if (IS_ERR(folio)) {</div><div class='add'>+		ret = PTR_ERR(folio);</div><div class='add'>+		goto out_nofolio;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ext4_write_lock_xattr(inode, &amp;no_expand);</div><div class='hunk'>@@ -580,32 +613,35 @@ retry:</div><div class='ctx'> </div><div class='ctx'> 	from = 0;</div><div class='ctx'> 	to = ext4_get_inline_size(inode);</div><div class='del'>-	if (!PageUptodate(page)) {</div><div class='del'>-		ret = ext4_read_inline_page(inode, page);</div><div class='add'>+	if (!folio_test_uptodate(folio)) {</div><div class='add'>+		ret = ext4_read_inline_folio(inode, folio);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	ext4_fc_track_inode(handle, inode);</div><div class='ctx'> 	ret = ext4_destroy_inline_data_nolock(handle, inode);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	if (ext4_should_dioread_nolock(inode)) {</div><div class='del'>-		ret = __block_write_begin(page, from, to,</div><div class='del'>-					  ext4_get_block_unwritten);</div><div class='add'>+		ret = ext4_block_write_begin(handle, folio, from, to,</div><div class='add'>+					     ext4_get_block_unwritten);</div><div class='ctx'> 	} else</div><div class='del'>-		ret = __block_write_begin(page, from, to, ext4_get_block);</div><div class='add'>+		ret = ext4_block_write_begin(handle, folio, from, to,</div><div class='add'>+					     ext4_get_block);</div><div class='add'>+	clear_buffer_new(folio_buffers(folio));</div><div class='ctx'> </div><div class='ctx'> 	if (!ret &amp;&amp; ext4_should_journal_data(inode)) {</div><div class='del'>-		ret = ext4_walk_page_buffers(handle, inode, page_buffers(page),</div><div class='del'>-					     from, to, NULL,</div><div class='del'>-					     do_journal_get_write_access);</div><div class='add'>+		ret = ext4_walk_page_buffers(handle, inode,</div><div class='add'>+					     folio_buffers(folio), from, to,</div><div class='add'>+					     NULL, do_journal_get_write_access);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (ret) {</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		put_page(page);</div><div class='del'>-		page = NULL;</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='add'>+		folio = NULL;</div><div class='ctx'> 		ext4_orphan_add(handle, inode);</div><div class='ctx'> 		ext4_write_unlock_xattr(inode, &amp;no_expand);</div><div class='ctx'> 		sem_held = 0;</div><div class='hunk'>@@ -625,13 +661,14 @@ retry:</div><div class='ctx'> 	if (ret == -ENOSPC &amp;&amp; ext4_should_retry_alloc(inode-&gt;i_sb, &amp;retries))</div><div class='ctx'> 		goto retry;</div><div class='ctx'> </div><div class='del'>-	if (page)</div><div class='del'>-		block_commit_write(page, from, to);</div><div class='add'>+	if (folio)</div><div class='add'>+		block_commit_write(folio, from, to);</div><div class='ctx'> out:</div><div class='del'>-	if (page) {</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		put_page(page);</div><div class='add'>+	if (folio) {</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 	}</div><div class='add'>+out_nofolio:</div><div class='ctx'> 	if (sem_held)</div><div class='ctx'> 		ext4_write_unlock_xattr(inode, &amp;no_expand);</div><div class='ctx'> 	if (handle)</div><div class='hunk'>@@ -641,98 +678,113 @@ out:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Try to write data in the inode.</div><div class='del'>- * If the inode has inline data, check whether the new write can be</div><div class='del'>- * in the inode also. If not, create the page the handle, move the data</div><div class='del'>- * to the page make it update and let the later codes create extent for it.</div><div class='add'>+ * Prepare the write for the inline data.</div><div class='add'>+ * If the data can be written into the inode, we just read</div><div class='add'>+ * the page and make it uptodate, and start the journal.</div><div class='add'>+ * Otherwise read the page, makes it dirty so that it can be</div><div class='add'>+ * handle in writepages(the i_disksize update is left to the</div><div class='add'>+ * normal ext4_da_write_end).</div><div class='ctx'>  */</div><div class='del'>-int ext4_try_to_write_inline_data(struct address_space *mapping,</div><div class='del'>-				  struct inode *inode,</div><div class='del'>-				  loff_t pos, unsigned len,</div><div class='del'>-				  unsigned flags,</div><div class='del'>-				  struct page **pagep)</div><div class='add'>+int ext4_generic_write_inline_data(struct address_space *mapping,</div><div class='add'>+					  struct inode *inode,</div><div class='add'>+					  loff_t pos, unsigned len,</div><div class='add'>+					  struct folio **foliop,</div><div class='add'>+					  void **fsdata, bool da)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	handle_t *handle;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	struct ext4_iloc iloc;</div><div class='del'>-</div><div class='del'>-	if (pos + len &gt; ext4_get_max_inline_size(inode))</div><div class='del'>-		goto convert;</div><div class='add'>+	int retries = 0;</div><div class='ctx'> </div><div class='ctx'> 	ret = ext4_get_inode_loc(inode, &amp;iloc);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * The possible write could happen in the inode,</div><div class='del'>-	 * so try to reserve the space in inode first.</div><div class='del'>-	 */</div><div class='add'>+retry_journal:</div><div class='ctx'> 	handle = ext4_journal_start(inode, EXT4_HT_INODE, 1);</div><div class='ctx'> 	if (IS_ERR(handle)) {</div><div class='ctx'> 		ret = PTR_ERR(handle);</div><div class='del'>-		handle = NULL;</div><div class='del'>-		goto out;</div><div class='add'>+		goto out_release_bh;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = ext4_prepare_inline_data(handle, inode, pos + len);</div><div class='ctx'> 	if (ret &amp;&amp; ret != -ENOSPC)</div><div class='del'>-		goto out;</div><div class='add'>+		goto out_stop_journal;</div><div class='ctx'> </div><div class='del'>-	/* We don't have space in inline inode, so convert it to extent. */</div><div class='ctx'> 	if (ret == -ENOSPC) {</div><div class='ctx'> 		ext4_journal_stop(handle);</div><div class='del'>-		brelse(iloc.bh);</div><div class='del'>-		goto convert;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = ext4_journal_get_write_access(handle, inode-&gt;i_sb, iloc.bh,</div><div class='del'>-					    EXT4_JTR_NONE);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+		if (!da) {</div><div class='add'>+			brelse(iloc.bh);</div><div class='add'>+			/* Retry inside */</div><div class='add'>+			return ext4_convert_inline_data_to_extent(mapping, inode);</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	flags |= AOP_FLAG_NOFS;</div><div class='add'>+		ret = ext4_da_convert_inline_data_to_extent(mapping, inode, fsdata);</div><div class='add'>+		if (ret == -ENOSPC &amp;&amp;</div><div class='add'>+		    ext4_should_retry_alloc(inode-&gt;i_sb, &amp;retries))</div><div class='add'>+			goto retry_journal;</div><div class='add'>+		goto out_release_bh;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	page = grab_cache_page_write_begin(mapping, 0, flags);</div><div class='del'>-	if (!page) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='add'>+	folio = __filemap_get_folio(mapping, 0, FGP_WRITEBEGIN | FGP_NOFS,</div><div class='add'>+					mapping_gfp_mask(mapping));</div><div class='add'>+	if (IS_ERR(folio)) {</div><div class='add'>+		ret = PTR_ERR(folio);</div><div class='add'>+		goto out_stop_journal;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	*pagep = page;</div><div class='ctx'> 	down_read(&amp;EXT4_I(inode)-&gt;xattr_sem);</div><div class='add'>+	/* Someone else had converted it to extent */</div><div class='ctx'> 	if (!ext4_has_inline_data(inode)) {</div><div class='ctx'> 		ret = 0;</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		put_page(page);</div><div class='del'>-		goto out_up_read;</div><div class='add'>+		goto out_release_folio;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!PageUptodate(page)) {</div><div class='del'>-		ret = ext4_read_inline_page(inode, page);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			put_page(page);</div><div class='del'>-			goto out_up_read;</div><div class='del'>-		}</div><div class='add'>+	if (!folio_test_uptodate(folio)) {</div><div class='add'>+		ret = ext4_read_inline_folio(inode, folio);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out_release_folio;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = 1;</div><div class='del'>-	handle = NULL;</div><div class='del'>-out_up_read:</div><div class='add'>+	ret = ext4_journal_get_write_access(handle, inode-&gt;i_sb, iloc.bh, EXT4_JTR_NONE);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_release_folio;</div><div class='add'>+	*foliop = folio;</div><div class='ctx'> 	up_read(&amp;EXT4_I(inode)-&gt;xattr_sem);</div><div class='del'>-out:</div><div class='del'>-	if (handle &amp;&amp; (ret != 1))</div><div class='del'>-		ext4_journal_stop(handle);</div><div class='add'>+	brelse(iloc.bh);</div><div class='add'>+	return 1;</div><div class='add'>+</div><div class='add'>+out_release_folio:</div><div class='add'>+	up_read(&amp;EXT4_I(inode)-&gt;xattr_sem);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='add'>+out_stop_journal:</div><div class='add'>+	ext4_journal_stop(handle);</div><div class='add'>+out_release_bh:</div><div class='ctx'> 	brelse(iloc.bh);</div><div class='ctx'> 	return ret;</div><div class='del'>-convert:</div><div class='del'>-	return ext4_convert_inline_data_to_extent(mapping,</div><div class='del'>-						  inode, flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Try to write data in the inode.</div><div class='add'>+ * If the inode has inline data, check whether the new write can be</div><div class='add'>+ * in the inode also. If not, create the page the handle, move the data</div><div class='add'>+ * to the page make it update and let the later codes create extent for it.</div><div class='add'>+ */</div><div class='add'>+int ext4_try_to_write_inline_data(struct address_space *mapping,</div><div class='add'>+				  struct inode *inode,</div><div class='add'>+				  loff_t pos, unsigned len,</div><div class='add'>+				  struct folio **foliop)</div><div class='add'>+{</div><div class='add'>+	if (pos + len &gt; ext4_get_max_inline_size(inode))</div><div class='add'>+		return ext4_convert_inline_data_to_extent(mapping, inode);</div><div class='add'>+	return ext4_generic_write_inline_data(mapping, inode, pos, len,</div><div class='add'>+					      foliop, NULL, false);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int ext4_write_inline_data_end(struct inode *inode, loff_t pos, unsigned len,</div><div class='del'>-			       unsigned copied, struct page *page)</div><div class='add'>+			       unsigned copied, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	handle_t *handle = ext4_journal_current_handle();</div><div class='ctx'> 	int no_expand;</div><div class='hunk'>@@ -740,14 +792,14 @@ int ext4_write_inline_data_end(struct inode *inode, loff_t pos, unsigned len,</div><div class='ctx'> 	struct ext4_iloc iloc;</div><div class='ctx'> 	int ret = 0, ret2;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(copied &lt; len) &amp;&amp; !PageUptodate(page))</div><div class='add'>+	if (unlikely(copied &lt; len) &amp;&amp; !folio_test_uptodate(folio))</div><div class='ctx'> 		copied = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (likely(copied)) {</div><div class='ctx'> 		ret = ext4_get_inode_loc(inode, &amp;iloc);</div><div class='ctx'> 		if (ret) {</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			put_page(page);</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+			folio_put(folio);</div><div class='ctx'> 			ext4_std_error(inode-&gt;i_sb, ret);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -761,30 +813,30 @@ int ext4_write_inline_data_end(struct inode *inode, loff_t pos, unsigned len,</div><div class='ctx'> 		 */</div><div class='ctx'> 		(void) ext4_find_inline_data_nolock(inode);</div><div class='ctx'> </div><div class='del'>-		kaddr = kmap_atomic(page);</div><div class='add'>+		kaddr = kmap_local_folio(folio, 0);</div><div class='ctx'> 		ext4_write_inline_data(inode, &amp;iloc, kaddr, pos, copied);</div><div class='del'>-		kunmap_atomic(kaddr);</div><div class='del'>-		SetPageUptodate(page);</div><div class='del'>-		/* clear page dirty so that writepages wouldn't work for us. */</div><div class='del'>-		ClearPageDirty(page);</div><div class='add'>+		kunmap_local(kaddr);</div><div class='add'>+		folio_mark_uptodate(folio);</div><div class='add'>+		/* clear dirty flag so that writepages wouldn't work for us. */</div><div class='add'>+		folio_clear_dirty(folio);</div><div class='ctx'> </div><div class='ctx'> 		ext4_write_unlock_xattr(inode, &amp;no_expand);</div><div class='ctx'> 		brelse(iloc.bh);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * It's important to update i_size while still holding page</div><div class='add'>+		 * It's important to update i_size while still holding folio</div><div class='ctx'> 		 * lock: page writeout could otherwise come in and zero</div><div class='ctx'> 		 * beyond i_size.</div><div class='ctx'> 		 */</div><div class='ctx'> 		ext4_update_inode_size(inode, pos + copied);</div><div class='ctx'> 	}</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Don't mark the inode dirty under page lock. First, it unnecessarily</div><div class='del'>-	 * makes the holding time of page lock longer. Second, it forces lock</div><div class='del'>-	 * ordering of page lock and transaction start for journaling</div><div class='add'>+	 * Don't mark the inode dirty under folio lock. First, it unnecessarily</div><div class='add'>+	 * makes the holding time of folio lock longer. Second, it forces lock</div><div class='add'>+	 * ordering of folio lock and transaction start for journaling</div><div class='ctx'> 	 * filesystems.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (likely(copied))</div><div class='hunk'>@@ -813,30 +865,6 @@ out:</div><div class='ctx'> 	return ret ? ret : copied;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct buffer_head *</div><div class='del'>-ext4_journalled_write_inline_data(struct inode *inode,</div><div class='del'>-				  unsigned len,</div><div class='del'>-				  struct page *page)</div><div class='del'>-{</div><div class='del'>-	int ret, no_expand;</div><div class='del'>-	void *kaddr;</div><div class='del'>-	struct ext4_iloc iloc;</div><div class='del'>-</div><div class='del'>-	ret = ext4_get_inode_loc(inode, &amp;iloc);</div><div class='del'>-	if (ret) {</div><div class='del'>-		ext4_std_error(inode-&gt;i_sb, ret);</div><div class='del'>-		return NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ext4_write_lock_xattr(inode, &amp;no_expand);</div><div class='del'>-	kaddr = kmap_atomic(page);</div><div class='del'>-	ext4_write_inline_data(inode, &amp;iloc, kaddr, 0, len);</div><div class='del'>-	kunmap_atomic(kaddr);</div><div class='del'>-	ext4_write_unlock_xattr(inode, &amp;no_expand);</div><div class='del'>-</div><div class='del'>-	return iloc.bh;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Try to make the page cache and handle ready for the inline data case.</div><div class='ctx'>  * We can call this function in 2 cases:</div><div class='hunk'>@@ -848,15 +876,15 @@ ext4_journalled_write_inline_data(struct inode *inode,</div><div class='ctx'>  */</div><div class='ctx'> static int ext4_da_convert_inline_data_to_extent(struct address_space *mapping,</div><div class='ctx'> 						 struct inode *inode,</div><div class='del'>-						 unsigned flags,</div><div class='ctx'> 						 void **fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0, inline_size;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> </div><div class='del'>-	page = grab_cache_page_write_begin(mapping, 0, flags);</div><div class='del'>-	if (!page)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	folio = __filemap_get_folio(mapping, 0, FGP_WRITEBEGIN,</div><div class='add'>+					mapping_gfp_mask(mapping));</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio);</div><div class='ctx'> </div><div class='ctx'> 	down_read(&amp;EXT4_I(inode)-&gt;xattr_sem);</div><div class='ctx'> 	if (!ext4_has_inline_data(inode)) {</div><div class='hunk'>@@ -866,132 +894,37 @@ static int ext4_da_convert_inline_data_to_extent(struct address_space *mapping,</div><div class='ctx'> </div><div class='ctx'> 	inline_size = ext4_get_inline_size(inode);</div><div class='ctx'> </div><div class='del'>-	if (!PageUptodate(page)) {</div><div class='del'>-		ret = ext4_read_inline_page(inode, page);</div><div class='add'>+	if (!folio_test_uptodate(folio)) {</div><div class='add'>+		ret = ext4_read_inline_folio(inode, folio);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = __block_write_begin(page, 0, inline_size,</div><div class='del'>-				  ext4_da_get_block_prep);</div><div class='add'>+	ret = ext4_block_write_begin(NULL, folio, 0, inline_size,</div><div class='add'>+				     ext4_da_get_block_prep);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		up_read(&amp;EXT4_I(inode)-&gt;xattr_sem);</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		put_page(page);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 		ext4_truncate_failed_write(inode);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	SetPageDirty(page);</div><div class='del'>-	SetPageUptodate(page);</div><div class='add'>+	clear_buffer_new(folio_buffers(folio));</div><div class='add'>+	folio_mark_dirty(folio);</div><div class='add'>+	folio_mark_uptodate(folio);</div><div class='ctx'> 	ext4_clear_inode_state(inode, EXT4_STATE_MAY_INLINE_DATA);</div><div class='ctx'> 	*fsdata = (void *)CONVERT_INLINE_DATA;</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	up_read(&amp;EXT4_I(inode)-&gt;xattr_sem);</div><div class='del'>-	if (page) {</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		put_page(page);</div><div class='add'>+	if (folio) {</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Prepare the write for the inline data.</div><div class='del'>- * If the data can be written into the inode, we just read</div><div class='del'>- * the page and make it uptodate, and start the journal.</div><div class='del'>- * Otherwise read the page, makes it dirty so that it can be</div><div class='del'>- * handle in writepages(the i_disksize update is left to the</div><div class='del'>- * normal ext4_da_write_end).</div><div class='del'>- */</div><div class='del'>-int ext4_da_write_inline_data_begin(struct address_space *mapping,</div><div class='del'>-				    struct inode *inode,</div><div class='del'>-				    loff_t pos, unsigned len,</div><div class='del'>-				    unsigned flags,</div><div class='del'>-				    struct page **pagep,</div><div class='del'>-				    void **fsdata)</div><div class='del'>-{</div><div class='del'>-	int ret, inline_size;</div><div class='del'>-	handle_t *handle;</div><div class='del'>-	struct page *page;</div><div class='del'>-	struct ext4_iloc iloc;</div><div class='del'>-	int retries = 0;</div><div class='del'>-</div><div class='del'>-	ret = ext4_get_inode_loc(inode, &amp;iloc);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-retry_journal:</div><div class='del'>-	handle = ext4_journal_start(inode, EXT4_HT_INODE, 1);</div><div class='del'>-	if (IS_ERR(handle)) {</div><div class='del'>-		ret = PTR_ERR(handle);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	inline_size = ext4_get_max_inline_size(inode);</div><div class='del'>-</div><div class='del'>-	ret = -ENOSPC;</div><div class='del'>-	if (inline_size &gt;= pos + len) {</div><div class='del'>-		ret = ext4_prepare_inline_data(handle, inode, pos + len);</div><div class='del'>-		if (ret &amp;&amp; ret != -ENOSPC)</div><div class='del'>-			goto out_journal;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * We cannot recurse into the filesystem as the transaction</div><div class='del'>-	 * is already started.</div><div class='del'>-	 */</div><div class='del'>-	flags |= AOP_FLAG_NOFS;</div><div class='del'>-</div><div class='del'>-	if (ret == -ENOSPC) {</div><div class='del'>-		ext4_journal_stop(handle);</div><div class='del'>-		ret = ext4_da_convert_inline_data_to_extent(mapping,</div><div class='del'>-							    inode,</div><div class='del'>-							    flags,</div><div class='del'>-							    fsdata);</div><div class='del'>-		if (ret == -ENOSPC &amp;&amp;</div><div class='del'>-		    ext4_should_retry_alloc(inode-&gt;i_sb, &amp;retries))</div><div class='del'>-			goto retry_journal;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	page = grab_cache_page_write_begin(mapping, 0, flags);</div><div class='del'>-	if (!page) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out_journal;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	down_read(&amp;EXT4_I(inode)-&gt;xattr_sem);</div><div class='del'>-	if (!ext4_has_inline_data(inode)) {</div><div class='del'>-		ret = 0;</div><div class='del'>-		goto out_release_page;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!PageUptodate(page)) {</div><div class='del'>-		ret = ext4_read_inline_page(inode, page);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			goto out_release_page;</div><div class='del'>-	}</div><div class='del'>-	ret = ext4_journal_get_write_access(handle, inode-&gt;i_sb, iloc.bh,</div><div class='del'>-					    EXT4_JTR_NONE);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto out_release_page;</div><div class='del'>-</div><div class='del'>-	up_read(&amp;EXT4_I(inode)-&gt;xattr_sem);</div><div class='del'>-	*pagep = page;</div><div class='del'>-	brelse(iloc.bh);</div><div class='del'>-	return 1;</div><div class='del'>-out_release_page:</div><div class='del'>-	up_read(&amp;EXT4_I(inode)-&gt;xattr_sem);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='del'>-out_journal:</div><div class='del'>-	ext4_journal_stop(handle);</div><div class='del'>-out:</div><div class='del'>-	brelse(iloc.bh);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> #ifdef INLINE_DIR_DEBUG</div><div class='ctx'> void ext4_show_inline_dir(struct inode *dir, struct buffer_head *bh,</div><div class='ctx'> 			  void *inline_start, int inline_size)</div><div class='hunk'>@@ -1035,7 +968,7 @@ static int ext4_add_dirent_to_inline(handle_t *handle,</div><div class='ctx'> 	int		err;</div><div class='ctx'> 	struct ext4_dir_entry_2 *de;</div><div class='ctx'> </div><div class='del'>-	err = ext4_find_dest_de(dir, inode, iloc-&gt;bh, inline_start,</div><div class='add'>+	err = ext4_find_dest_de(dir, iloc-&gt;bh, inline_start,</div><div class='ctx'> 				inline_size, fname, &amp;de);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='hunk'>@@ -1060,7 +993,7 @@ static int ext4_add_dirent_to_inline(handle_t *handle,</div><div class='ctx'> 	 * happen is that the times are slightly out of date</div><div class='ctx'> 	 * and/or different from the directory change time.</div><div class='ctx'> 	 */</div><div class='del'>-	dir-&gt;i_mtime = dir-&gt;i_ctime = current_time(dir);</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='ctx'> 	ext4_update_dx_flag(dir);</div><div class='ctx'> 	inode_inc_iversion(dir);</div><div class='ctx'> 	return 1;</div><div class='hunk'>@@ -1082,20 +1015,20 @@ static void *ext4_get_inline_xattr_pos(struct inode *inode,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Set the final de to cover the whole block. */</div><div class='del'>-static void ext4_update_final_de(void *de_buf, int old_size, int new_size)</div><div class='add'>+void ext4_update_final_de(void *de_buf, int old_size, int new_size)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_dir_entry_2 *de, *prev_de;</div><div class='ctx'> 	void *limit;</div><div class='ctx'> 	int de_len;</div><div class='ctx'> </div><div class='del'>-	de = (struct ext4_dir_entry_2 *)de_buf;</div><div class='add'>+	de = de_buf;</div><div class='ctx'> 	if (old_size) {</div><div class='ctx'> 		limit = de_buf + old_size;</div><div class='ctx'> 		do {</div><div class='ctx'> 			prev_de = de;</div><div class='ctx'> 			de_len = ext4_rec_len_from_disk(de-&gt;rec_len, old_size);</div><div class='ctx'> 			de_buf += de_len;</div><div class='del'>-			de = (struct ext4_dir_entry_2 *)de_buf;</div><div class='add'>+			de = de_buf;</div><div class='ctx'> 		} while (de_buf &lt; limit);</div><div class='ctx'> </div><div class='ctx'> 		prev_de-&gt;rec_len = ext4_rec_len_to_disk(de_len + new_size -</div><div class='hunk'>@@ -1133,55 +1066,19 @@ static void ext4_restore_inline_data(handle_t *handle, struct inode *inode,</div><div class='ctx'> 				     struct ext4_iloc *iloc,</div><div class='ctx'> 				     void *buf, int inline_size)</div><div class='ctx'> {</div><div class='del'>-	ext4_create_inline_data(handle, inode, inline_size);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = ext4_create_inline_data(handle, inode, inline_size);</div><div class='add'>+	if (ret) {</div><div class='add'>+		ext4_msg(inode-&gt;i_sb, KERN_EMERG,</div><div class='add'>+			"error restoring inline_data for inode -- potential data loss! (inode %lu, error %d)",</div><div class='add'>+			inode-&gt;i_ino, ret);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='ctx'> 	ext4_write_inline_data(inode, iloc, buf, 0, inline_size);</div><div class='ctx'> 	ext4_set_inode_state(inode, EXT4_STATE_MAY_INLINE_DATA);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext4_finish_convert_inline_dir(handle_t *handle,</div><div class='del'>-					  struct inode *inode,</div><div class='del'>-					  struct buffer_head *dir_block,</div><div class='del'>-					  void *buf,</div><div class='del'>-					  int inline_size)</div><div class='del'>-{</div><div class='del'>-	int err, csum_size = 0, header_size = 0;</div><div class='del'>-	struct ext4_dir_entry_2 *de;</div><div class='del'>-	void *target = dir_block-&gt;b_data;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * First create "." and ".." and then copy the dir information</div><div class='del'>-	 * back to the block.</div><div class='del'>-	 */</div><div class='del'>-	de = (struct ext4_dir_entry_2 *)target;</div><div class='del'>-	de = ext4_init_dot_dotdot(inode, de,</div><div class='del'>-		inode-&gt;i_sb-&gt;s_blocksize, csum_size,</div><div class='del'>-		le32_to_cpu(((struct ext4_dir_entry_2 *)buf)-&gt;inode), 1);</div><div class='del'>-	header_size = (void *)de - target;</div><div class='del'>-</div><div class='del'>-	memcpy((void *)de, buf + EXT4_INLINE_DOTDOT_SIZE,</div><div class='del'>-		inline_size - EXT4_INLINE_DOTDOT_SIZE);</div><div class='del'>-</div><div class='del'>-	if (ext4_has_metadata_csum(inode-&gt;i_sb))</div><div class='del'>-		csum_size = sizeof(struct ext4_dir_entry_tail);</div><div class='del'>-</div><div class='del'>-	inode-&gt;i_size = inode-&gt;i_sb-&gt;s_blocksize;</div><div class='del'>-	i_size_write(inode, inode-&gt;i_sb-&gt;s_blocksize);</div><div class='del'>-	EXT4_I(inode)-&gt;i_disksize = inode-&gt;i_sb-&gt;s_blocksize;</div><div class='del'>-	ext4_update_final_de(dir_block-&gt;b_data,</div><div class='del'>-			inline_size - EXT4_INLINE_DOTDOT_SIZE + header_size,</div><div class='del'>-			inode-&gt;i_sb-&gt;s_blocksize - csum_size);</div><div class='del'>-</div><div class='del'>-	if (csum_size)</div><div class='del'>-		ext4_initialize_dirent_tail(dir_block,</div><div class='del'>-					    inode-&gt;i_sb-&gt;s_blocksize);</div><div class='del'>-	set_buffer_uptodate(dir_block);</div><div class='del'>-	err = ext4_handle_dirty_dirblock(handle, inode, dir_block);</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='del'>-	set_buffer_verified(dir_block);</div><div class='del'>-	return ext4_mark_inode_dirty(handle, inode);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int ext4_convert_inline_data_nolock(handle_t *handle,</div><div class='ctx'> 					   struct inode *inode,</div><div class='ctx'> 					   struct ext4_iloc *iloc)</div><div class='hunk'>@@ -1249,14 +1146,23 @@ static int ext4_convert_inline_data_nolock(handle_t *handle,</div><div class='ctx'> 	if (!S_ISDIR(inode-&gt;i_mode)) {</div><div class='ctx'> 		memcpy(data_bh-&gt;b_data, buf, inline_size);</div><div class='ctx'> 		set_buffer_uptodate(data_bh);</div><div class='add'>+		unlock_buffer(data_bh);</div><div class='ctx'> 		error = ext4_handle_dirty_metadata(handle,</div><div class='ctx'> 						   inode, data_bh);</div><div class='ctx'> 	} else {</div><div class='del'>-		error = ext4_finish_convert_inline_dir(handle, inode, data_bh,</div><div class='del'>-						       buf, inline_size);</div><div class='add'>+		unlock_buffer(data_bh);</div><div class='add'>+		inode-&gt;i_size = inode-&gt;i_sb-&gt;s_blocksize;</div><div class='add'>+		i_size_write(inode, inode-&gt;i_sb-&gt;s_blocksize);</div><div class='add'>+		EXT4_I(inode)-&gt;i_disksize = inode-&gt;i_sb-&gt;s_blocksize;</div><div class='add'>+</div><div class='add'>+		error = ext4_init_dirblock(handle, inode, data_bh,</div><div class='add'>+			  le32_to_cpu(((struct ext4_dir_entry_2 *)buf)-&gt;inode),</div><div class='add'>+			  buf + EXT4_INLINE_DOTDOT_SIZE,</div><div class='add'>+			  inline_size - EXT4_INLINE_DOTDOT_SIZE);</div><div class='add'>+		if (!error)</div><div class='add'>+			error = ext4_mark_inode_dirty(handle, inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	unlock_buffer(data_bh);</div><div class='ctx'> out_restore:</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		ext4_restore_inline_data(handle, inode, iloc, buf, inline_size);</div><div class='hunk'>@@ -1393,7 +1299,7 @@ int ext4_inlinedir_to_tree(struct file *dir_file,</div><div class='ctx'> 		if (pos == 0) {</div><div class='ctx'> 			fake.inode = cpu_to_le32(inode-&gt;i_ino);</div><div class='ctx'> 			fake.name_len = 1;</div><div class='del'>-			strcpy(fake.name, ".");</div><div class='add'>+			memcpy(fake.name, ".", 2);</div><div class='ctx'> 			fake.rec_len = ext4_rec_len_to_disk(</div><div class='ctx'> 					  ext4_dir_rec_len(fake.name_len, NULL),</div><div class='ctx'> 					  inline_size);</div><div class='hunk'>@@ -1403,7 +1309,7 @@ int ext4_inlinedir_to_tree(struct file *dir_file,</div><div class='ctx'> 		} else if (pos == EXT4_INLINE_DOTDOT_OFFSET) {</div><div class='ctx'> 			fake.inode = cpu_to_le32(parent_ino);</div><div class='ctx'> 			fake.name_len = 2;</div><div class='del'>-			strcpy(fake.name, "..");</div><div class='add'>+			memcpy(fake.name, "..", 3);</div><div class='ctx'> 			fake.rec_len = ext4_rec_len_to_disk(</div><div class='ctx'> 					  ext4_dir_rec_len(fake.name_len, NULL),</div><div class='ctx'> 					  inline_size);</div><div class='hunk'>@@ -1425,7 +1331,11 @@ int ext4_inlinedir_to_tree(struct file *dir_file,</div><div class='ctx'> 			hinfo-&gt;hash = EXT4_DIRENT_HASH(de);</div><div class='ctx'> 			hinfo-&gt;minor_hash = EXT4_DIRENT_MINOR_HASH(de);</div><div class='ctx'> 		} else {</div><div class='del'>-			ext4fs_dirhash(dir, de-&gt;name, de-&gt;name_len, hinfo);</div><div class='add'>+			err = ext4fs_dirhash(dir, de-&gt;name, de-&gt;name_len, hinfo);</div><div class='add'>+			if (err) {</div><div class='add'>+				ret = err;</div><div class='add'>+				goto out;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> 		if ((hinfo-&gt;hash &lt; start_hash) ||</div><div class='ctx'> 		    ((hinfo-&gt;hash == start_hash) &amp;&amp;</div><div class='hunk'>@@ -1471,6 +1381,7 @@ int ext4_read_inline_dir(struct file *file,</div><div class='ctx'> 	struct ext4_iloc iloc;</div><div class='ctx'> 	void *dir_buf = NULL;</div><div class='ctx'> 	int dotdot_offset, dotdot_size, extra_offset, extra_size;</div><div class='add'>+	struct dir_private_info *info = file-&gt;private_data;</div><div class='ctx'> </div><div class='ctx'> 	ret = ext4_get_inode_loc(inode, &amp;iloc);</div><div class='ctx'> 	if (ret)</div><div class='hunk'>@@ -1514,12 +1425,12 @@ int ext4_read_inline_dir(struct file *file,</div><div class='ctx'> 	extra_size = extra_offset + inline_size;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * If the version has changed since the last call to</div><div class='add'>+	 * If the cookie has changed since the last call to</div><div class='ctx'> 	 * readdir(2), then we might be pointing to an invalid</div><div class='ctx'> 	 * dirent right now.  Scan from the start of the inline</div><div class='ctx'> 	 * dir to make sure.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!inode_eq_iversion(inode, file-&gt;f_version)) {</div><div class='add'>+	if (!inode_eq_iversion(inode, info-&gt;cookie)) {</div><div class='ctx'> 		for (i = 0; i &lt; extra_size &amp;&amp; i &lt; offset;) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * "." is with offset 0 and</div><div class='hunk'>@@ -1551,7 +1462,7 @@ int ext4_read_inline_dir(struct file *file,</div><div class='ctx'> 		}</div><div class='ctx'> 		offset = i;</div><div class='ctx'> 		ctx-&gt;pos = offset;</div><div class='del'>-		file-&gt;f_version = inode_query_iversion(inode);</div><div class='add'>+		info-&gt;cookie = inode_query_iversion(inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	while (ctx-&gt;pos &lt; extra_size) {</div><div class='hunk'>@@ -1588,6 +1499,35 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void *ext4_read_inline_link(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct ext4_iloc iloc;</div><div class='add'>+	int ret, inline_size;</div><div class='add'>+	void *link;</div><div class='add'>+</div><div class='add'>+	ret = ext4_get_inode_loc(inode, &amp;iloc);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ERR_PTR(ret);</div><div class='add'>+</div><div class='add'>+	ret = -ENOMEM;</div><div class='add'>+	inline_size = ext4_get_inline_size(inode);</div><div class='add'>+	link = kmalloc(inline_size + 1, GFP_NOFS);</div><div class='add'>+	if (!link)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	ret = ext4_read_inline_data(inode, link, inline_size, &amp;iloc);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		kfree(link);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	nd_terminate_link(link, inode-&gt;i_size, ret);</div><div class='add'>+out:</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		link = ERR_PTR(ret);</div><div class='add'>+	brelse(iloc.bh);</div><div class='add'>+	return link;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> struct buffer_head *ext4_get_first_inline_block(struct inode *inode,</div><div class='ctx'> 					struct ext4_dir_entry_2 **parent_de,</div><div class='ctx'> 					int *retval)</div><div class='hunk'>@@ -1646,24 +1586,36 @@ struct buffer_head *ext4_find_inline_entry(struct inode *dir,</div><div class='ctx'> 					struct ext4_dir_entry_2 **res_dir,</div><div class='ctx'> 					int *has_inline_data)</div><div class='ctx'> {</div><div class='add'>+	struct ext4_xattr_ibody_find is = {</div><div class='add'>+		.s = { .not_found = -ENODATA, },</div><div class='add'>+	};</div><div class='add'>+	struct ext4_xattr_info i = {</div><div class='add'>+		.name_index = EXT4_XATTR_INDEX_SYSTEM,</div><div class='add'>+		.name = EXT4_XATTR_SYSTEM_DATA,</div><div class='add'>+	};</div><div class='ctx'> 	int ret;</div><div class='del'>-	struct ext4_iloc iloc;</div><div class='ctx'> 	void *inline_start;</div><div class='ctx'> 	int inline_size;</div><div class='ctx'> </div><div class='del'>-	if (ext4_get_inode_loc(dir, &amp;iloc))</div><div class='del'>-		return NULL;</div><div class='add'>+	ret = ext4_get_inode_loc(dir, &amp;is.iloc);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ERR_PTR(ret);</div><div class='ctx'> </div><div class='ctx'> 	down_read(&amp;EXT4_I(dir)-&gt;xattr_sem);</div><div class='add'>+</div><div class='add'>+	ret = ext4_xattr_ibody_find(dir, &amp;i, &amp;is);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='ctx'> 	if (!ext4_has_inline_data(dir)) {</div><div class='ctx'> 		*has_inline_data = 0;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	inline_start = (void *)ext4_raw_inode(&amp;iloc)-&gt;i_block +</div><div class='add'>+	inline_start = (void *)ext4_raw_inode(&amp;is.iloc)-&gt;i_block +</div><div class='ctx'> 						EXT4_INLINE_DOTDOT_SIZE;</div><div class='ctx'> 	inline_size = EXT4_MIN_INLINE_DATA_SIZE - EXT4_INLINE_DOTDOT_SIZE;</div><div class='del'>-	ret = ext4_search_dir(iloc.bh, inline_start, inline_size,</div><div class='add'>+	ret = ext4_search_dir(is.iloc.bh, inline_start, inline_size,</div><div class='ctx'> 			      dir, fname, 0, res_dir);</div><div class='ctx'> 	if (ret == 1)</div><div class='ctx'> 		goto out_find;</div><div class='hunk'>@@ -1673,20 +1625,23 @@ struct buffer_head *ext4_find_inline_entry(struct inode *dir,</div><div class='ctx'> 	if (ext4_get_inline_size(dir) == EXT4_MIN_INLINE_DATA_SIZE)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	inline_start = ext4_get_inline_xattr_pos(dir, &amp;iloc);</div><div class='add'>+	inline_start = ext4_get_inline_xattr_pos(dir, &amp;is.iloc);</div><div class='ctx'> 	inline_size = ext4_get_inline_size(dir) - EXT4_MIN_INLINE_DATA_SIZE;</div><div class='ctx'> </div><div class='del'>-	ret = ext4_search_dir(iloc.bh, inline_start, inline_size,</div><div class='add'>+	ret = ext4_search_dir(is.iloc.bh, inline_start, inline_size,</div><div class='ctx'> 			      dir, fname, 0, res_dir);</div><div class='ctx'> 	if (ret == 1)</div><div class='ctx'> 		goto out_find;</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	brelse(iloc.bh);</div><div class='del'>-	iloc.bh = NULL;</div><div class='add'>+	brelse(is.iloc.bh);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		is.iloc.bh = ERR_PTR(ret);</div><div class='add'>+	else</div><div class='add'>+		is.iloc.bh = NULL;</div><div class='ctx'> out_find:</div><div class='ctx'> 	up_read(&amp;EXT4_I(dir)-&gt;xattr_sem);</div><div class='del'>-	return iloc.bh;</div><div class='add'>+	return is.iloc.bh;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int ext4_delete_inline_entry(handle_t *handle,</div><div class='hunk'>@@ -1780,19 +1735,20 @@ bool empty_inline_dir(struct inode *dir, int *has_inline_data)</div><div class='ctx'> 	void *inline_pos;</div><div class='ctx'> 	unsigned int offset;</div><div class='ctx'> 	struct ext4_dir_entry_2 *de;</div><div class='del'>-	bool ret = true;</div><div class='add'>+	bool ret = false;</div><div class='ctx'> </div><div class='ctx'> 	err = ext4_get_inode_loc(dir, &amp;iloc);</div><div class='ctx'> 	if (err) {</div><div class='ctx'> 		EXT4_ERROR_INODE_ERR(dir, -err,</div><div class='ctx'> 				     "error %d getting inode %lu block",</div><div class='ctx'> 				     err, dir-&gt;i_ino);</div><div class='del'>-		return true;</div><div class='add'>+		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	down_read(&amp;EXT4_I(dir)-&gt;xattr_sem);</div><div class='ctx'> 	if (!ext4_has_inline_data(dir)) {</div><div class='ctx'> 		*has_inline_data = 0;</div><div class='add'>+		ret = true;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1801,7 +1757,6 @@ bool empty_inline_dir(struct inode *dir, int *has_inline_data)</div><div class='ctx'> 		ext4_warning(dir-&gt;i_sb,</div><div class='ctx'> 			     "bad inline directory (dir #%lu) - no `..'",</div><div class='ctx'> 			     dir-&gt;i_ino);</div><div class='del'>-		ret = true;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1820,16 +1775,15 @@ bool empty_inline_dir(struct inode *dir, int *has_inline_data)</div><div class='ctx'> 				     dir-&gt;i_ino, le32_to_cpu(de-&gt;inode),</div><div class='ctx'> 				     le16_to_cpu(de-&gt;rec_len), de-&gt;name_len,</div><div class='ctx'> 				     inline_size);</div><div class='del'>-			ret = true;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (le32_to_cpu(de-&gt;inode)) {</div><div class='del'>-			ret = false;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 		offset += ext4_rec_len_from_disk(de-&gt;rec_len, inline_size);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	ret = true;</div><div class='ctx'> out:</div><div class='ctx'> 	up_read(&amp;EXT4_I(dir)-&gt;xattr_sem);</div><div class='ctx'> 	brelse(iloc.bh);</div><div class='hunk'>@@ -1894,7 +1848,7 @@ int ext4_inline_data_truncate(struct inode *inode, int *has_inline)</div><div class='ctx'> 	};</div><div class='ctx'> </div><div class='ctx'> </div><div class='del'>-	needed_blocks = ext4_writepage_trans_blocks(inode);</div><div class='add'>+	needed_blocks = ext4_chunk_trans_extent(inode, 1);</div><div class='ctx'> 	handle = ext4_journal_start(inode, EXT4_HT_INODE, needed_blocks);</div><div class='ctx'> 	if (IS_ERR(handle))</div><div class='ctx'> 		return PTR_ERR(handle);</div><div class='hunk'>@@ -1925,24 +1879,20 @@ int ext4_inline_data_truncate(struct inode *inode, int *has_inline)</div><div class='ctx'> 		 * the extent status cache must be cleared to avoid leaving</div><div class='ctx'> 		 * behind stale delayed allocated extent entries</div><div class='ctx'> 		 */</div><div class='del'>-		if (!ext4_test_inode_state(inode, EXT4_STATE_MAY_INLINE_DATA)) {</div><div class='del'>-retry:</div><div class='del'>-			err = ext4_es_remove_extent(inode, 0, EXT_MAX_BLOCKS);</div><div class='del'>-			if (err == -ENOMEM) {</div><div class='del'>-				cond_resched();</div><div class='del'>-				congestion_wait(BLK_RW_ASYNC, HZ/50);</div><div class='del'>-				goto retry;</div><div class='del'>-			}</div><div class='del'>-			if (err)</div><div class='del'>-				goto out_error;</div><div class='del'>-		}</div><div class='add'>+		if (!ext4_test_inode_state(inode, EXT4_STATE_MAY_INLINE_DATA))</div><div class='add'>+			ext4_es_remove_extent(inode, 0, EXT_MAX_BLOCKS);</div><div class='ctx'> </div><div class='ctx'> 		/* Clear the content in the xattr space. */</div><div class='ctx'> 		if (inline_size &gt; EXT4_MIN_INLINE_DATA_SIZE) {</div><div class='ctx'> 			if ((err = ext4_xattr_ibody_find(inode, &amp;i, &amp;is)) != 0)</div><div class='ctx'> 				goto out_error;</div><div class='ctx'> </div><div class='del'>-			BUG_ON(is.s.not_found);</div><div class='add'>+			if (is.s.not_found) {</div><div class='add'>+				EXT4_ERROR_INODE(inode,</div><div class='add'>+						 "missing inline data xattr");</div><div class='add'>+				err = -EFSCORRUPTED;</div><div class='add'>+				goto out_error;</div><div class='add'>+			}</div><div class='ctx'> </div><div class='ctx'> 			value_len = le32_to_cpu(is.s.here-&gt;e_value_size);</div><div class='ctx'> 			value = kmalloc(value_len, GFP_NOFS);</div><div class='hunk'>@@ -1986,7 +1936,7 @@ out:</div><div class='ctx'> 		ext4_orphan_del(handle, inode);</div><div class='ctx'> </div><div class='ctx'> 	if (err == 0) {</div><div class='del'>-		inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+		inode_set_mtime_to_ts(inode, inode_set_ctime_current(inode));</div><div class='ctx'> 		err = ext4_mark_inode_dirty(handle, inode);</div><div class='ctx'> 		if (IS_SYNC(inode))</div><div class='ctx'> 			ext4_handle_sync(handle);</div><div class='hunk'>@@ -2004,9 +1954,21 @@ int ext4_convert_inline_data(struct inode *inode)</div><div class='ctx'> 	if (!ext4_has_inline_data(inode)) {</div><div class='ctx'> 		ext4_clear_inode_state(inode, EXT4_STATE_MAY_INLINE_DATA);</div><div class='ctx'> 		return 0;</div><div class='add'>+	} else if (!ext4_test_inode_state(inode, EXT4_STATE_MAY_INLINE_DATA)) {</div><div class='add'>+		/*</div><div class='add'>+		 * Inode has inline data but EXT4_STATE_MAY_INLINE_DATA is</div><div class='add'>+		 * cleared. This means we are in the middle of moving of</div><div class='add'>+		 * inline data to delay allocated block. Just force writeout</div><div class='add'>+		 * here to finish conversion.</div><div class='add'>+		 */</div><div class='add'>+		error = filemap_flush(inode-&gt;i_mapping);</div><div class='add'>+		if (error)</div><div class='add'>+			return error;</div><div class='add'>+		if (!ext4_has_inline_data(inode))</div><div class='add'>+			return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	needed_blocks = ext4_writepage_trans_blocks(inode);</div><div class='add'>+	needed_blocks = ext4_chunk_trans_extent(inode, 1);</div><div class='ctx'> </div><div class='ctx'> 	iloc.bh = NULL;</div><div class='ctx'> 	error = ext4_get_inode_loc(inode, &amp;iloc);</div><div class='head'>diff --git a/fs/ext4/inode-test.c b/fs/ext4/inode-test.c<br/>index 7935ea6cf92c..749af7ad4e09 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/inode-test.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/inode-test.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/inode-test.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/inode-test.c</a></div><div class='hunk'>@@ -245,9 +245,9 @@ static void inode_test_xtimestamp_decoding(struct kunit *test)</div><div class='ctx'> 	struct timestamp_expectation *test_param =</div><div class='ctx'> 			(struct timestamp_expectation *)(test-&gt;param_value);</div><div class='ctx'> </div><div class='del'>-	timestamp.tv_sec = get_32bit_time(test_param);</div><div class='del'>-	ext4_decode_extra_time(&amp;timestamp,</div><div class='del'>-			       cpu_to_le32(test_param-&gt;extra_bits));</div><div class='add'>+	timestamp = ext4_decode_extra_time(</div><div class='add'>+				cpu_to_le32(get_32bit_time(test_param)),</div><div class='add'>+				cpu_to_le32(test_param-&gt;extra_bits));</div><div class='ctx'> </div><div class='ctx'> 	KUNIT_EXPECT_EQ_MSG(test,</div><div class='ctx'> 			    test_param-&gt;expected.tv_sec,</div><div class='hunk'>@@ -279,4 +279,5 @@ static struct kunit_suite ext4_inode_test_suite = {</div><div class='ctx'> </div><div class='ctx'> kunit_test_suites(&amp;ext4_inode_test_suite);</div><div class='ctx'> </div><div class='add'>+MODULE_DESCRIPTION("KUnit test of ext4 inode timestamp decoding");</div><div class='ctx'> MODULE_LICENSE("GPL v2");</div><div class='head'>diff --git a/fs/ext4/inode.c b/fs/ext4/inode.c<br/>index bfd3545f1e5d..0c466ccbed69 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/inode.c</a></div><div class='hunk'>@@ -31,6 +31,7 @@</div><div class='ctx'> #include &lt;linux/writeback.h&gt;</div><div class='ctx'> #include &lt;linux/pagevec.h&gt;</div><div class='ctx'> #include &lt;linux/mpage.h&gt;</div><div class='add'>+#include &lt;linux/rmap.h&gt;</div><div class='ctx'> #include &lt;linux/namei.h&gt;</div><div class='ctx'> #include &lt;linux/uio.h&gt;</div><div class='ctx'> #include &lt;linux/bio.h&gt;</div><div class='hunk'>@@ -49,32 +50,35 @@</div><div class='ctx'> </div><div class='ctx'> #include &lt;trace/events/ext4.h&gt;</div><div class='ctx'> </div><div class='add'>+static void ext4_journalled_zero_new_buffers(handle_t *handle,</div><div class='add'>+					    struct inode *inode,</div><div class='add'>+					    struct folio *folio,</div><div class='add'>+					    unsigned from, unsigned to);</div><div class='add'>+</div><div class='ctx'> static __u32 ext4_inode_csum(struct inode *inode, struct ext4_inode *raw,</div><div class='ctx'> 			      struct ext4_inode_info *ei)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_sb_info *sbi = EXT4_SB(inode-&gt;i_sb);</div><div class='ctx'> 	__u32 csum;</div><div class='ctx'> 	__u16 dummy_csum = 0;</div><div class='ctx'> 	int offset = offsetof(struct ext4_inode, i_checksum_lo);</div><div class='ctx'> 	unsigned int csum_size = sizeof(dummy_csum);</div><div class='ctx'> </div><div class='del'>-	csum = ext4_chksum(sbi, ei-&gt;i_csum_seed, (__u8 *)raw, offset);</div><div class='del'>-	csum = ext4_chksum(sbi, csum, (__u8 *)&amp;dummy_csum, csum_size);</div><div class='add'>+	csum = ext4_chksum(ei-&gt;i_csum_seed, (__u8 *)raw, offset);</div><div class='add'>+	csum = ext4_chksum(csum, (__u8 *)&amp;dummy_csum, csum_size);</div><div class='ctx'> 	offset += csum_size;</div><div class='del'>-	csum = ext4_chksum(sbi, csum, (__u8 *)raw + offset,</div><div class='add'>+	csum = ext4_chksum(csum, (__u8 *)raw + offset,</div><div class='ctx'> 			   EXT4_GOOD_OLD_INODE_SIZE - offset);</div><div class='ctx'> </div><div class='ctx'> 	if (EXT4_INODE_SIZE(inode-&gt;i_sb) &gt; EXT4_GOOD_OLD_INODE_SIZE) {</div><div class='ctx'> 		offset = offsetof(struct ext4_inode, i_checksum_hi);</div><div class='del'>-		csum = ext4_chksum(sbi, csum, (__u8 *)raw +</div><div class='del'>-				   EXT4_GOOD_OLD_INODE_SIZE,</div><div class='add'>+		csum = ext4_chksum(csum, (__u8 *)raw + EXT4_GOOD_OLD_INODE_SIZE,</div><div class='ctx'> 				   offset - EXT4_GOOD_OLD_INODE_SIZE);</div><div class='ctx'> 		if (EXT4_FITS_IN_INODE(raw, ei, i_checksum_hi)) {</div><div class='del'>-			csum = ext4_chksum(sbi, csum, (__u8 *)&amp;dummy_csum,</div><div class='add'>+			csum = ext4_chksum(csum, (__u8 *)&amp;dummy_csum,</div><div class='ctx'> 					   csum_size);</div><div class='ctx'> 			offset += csum_size;</div><div class='ctx'> 		}</div><div class='del'>-		csum = ext4_chksum(sbi, csum, (__u8 *)raw + offset,</div><div class='add'>+		csum = ext4_chksum(csum, (__u8 *)raw + offset,</div><div class='ctx'> 				   EXT4_INODE_SIZE(inode-&gt;i_sb) - offset);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -88,7 +92,7 @@ static int ext4_inode_csum_verify(struct inode *inode, struct ext4_inode *raw,</div><div class='ctx'> </div><div class='ctx'> 	if (EXT4_SB(inode-&gt;i_sb)-&gt;s_es-&gt;s_creator_os !=</div><div class='ctx'> 	    cpu_to_le32(EXT4_OS_LINUX) ||</div><div class='del'>-	    !ext4_has_metadata_csum(inode-&gt;i_sb))</div><div class='add'>+	    !ext4_has_feature_metadata_csum(inode-&gt;i_sb))</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='ctx'> 	provided = le16_to_cpu(raw-&gt;i_checksum_lo);</div><div class='hunk'>@@ -109,7 +113,7 @@ void ext4_inode_csum_set(struct inode *inode, struct ext4_inode *raw,</div><div class='ctx'> </div><div class='ctx'> 	if (EXT4_SB(inode-&gt;i_sb)-&gt;s_es-&gt;s_creator_os !=</div><div class='ctx'> 	    cpu_to_le32(EXT4_OS_LINUX) ||</div><div class='del'>-	    !ext4_has_metadata_csum(inode-&gt;i_sb))</div><div class='add'>+	    !ext4_has_feature_metadata_csum(inode-&gt;i_sb))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	csum = ext4_inode_csum(inode, raw, ei);</div><div class='hunk'>@@ -136,19 +140,13 @@ static inline int ext4_begin_ordered_truncate(struct inode *inode,</div><div class='ctx'> 						   new_size);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void ext4_invalidatepage(struct page *page, unsigned int offset,</div><div class='del'>-				unsigned int length);</div><div class='del'>-static int __ext4_journalled_writepage(struct page *page, unsigned int len);</div><div class='del'>-static int ext4_meta_trans_blocks(struct inode *inode, int lblocks,</div><div class='del'>-				  int pextents);</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Test whether an inode is a fast symlink.</div><div class='ctx'>  * A fast symlink has its symlink data stored in ext4_inode_info-&gt;i_data.</div><div class='ctx'>  */</div><div class='ctx'> int ext4_inode_is_fast_symlink(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	if (!(EXT4_I(inode)-&gt;i_flags &amp; EXT4_EA_INODE_FL)) {</div><div class='add'>+	if (!ext4_has_feature_ea_inode(inode-&gt;i_sb)) {</div><div class='ctx'> 		int ea_blocks = EXT4_I(inode)-&gt;i_file_acl ?</div><div class='ctx'> 				EXT4_CLUSTER_SIZE(inode-&gt;i_sb) &gt;&gt; 9 : 0;</div><div class='ctx'> </div><div class='hunk'>@@ -179,35 +177,11 @@ void ext4_evict_inode(struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> 	trace_ext4_evict_inode(inode);</div><div class='ctx'> </div><div class='add'>+	dax_break_layout_final(inode);</div><div class='add'>+</div><div class='add'>+	if (EXT4_I(inode)-&gt;i_flags &amp; EXT4_EA_INODE_FL)</div><div class='add'>+		ext4_evict_ea_inode(inode);</div><div class='ctx'> 	if (inode-&gt;i_nlink) {</div><div class='del'>-		/*</div><div class='del'>-		 * When journalling data dirty buffers are tracked only in the</div><div class='del'>-		 * journal. So although mm thinks everything is clean and</div><div class='del'>-		 * ready for reaping the inode might still have some pages to</div><div class='del'>-		 * write in the running transaction or waiting to be</div><div class='del'>-		 * checkpointed. Thus calling jbd2_journal_invalidatepage()</div><div class='del'>-		 * (via truncate_inode_pages()) to discard these buffers can</div><div class='del'>-		 * cause data loss. Also even if we did not discard these</div><div class='del'>-		 * buffers, we would have no way to find them after the inode</div><div class='del'>-		 * is reaped and thus user could see stale data if he tries to</div><div class='del'>-		 * read them before the transaction is checkpointed. So be</div><div class='del'>-		 * careful and force everything to disk here... We use</div><div class='del'>-		 * ei-&gt;i_datasync_tid to store the newest transaction</div><div class='del'>-		 * containing inode's data.</div><div class='del'>-		 *</div><div class='del'>-		 * Note that directories do not have this problem because they</div><div class='del'>-		 * don't use page cache.</div><div class='del'>-		 */</div><div class='del'>-		if (inode-&gt;i_ino != EXT4_JOURNAL_INO &amp;&amp;</div><div class='del'>-		    ext4_should_journal_data(inode) &amp;&amp;</div><div class='del'>-		    (S_ISLNK(inode-&gt;i_mode) || S_ISREG(inode-&gt;i_mode)) &amp;&amp;</div><div class='del'>-		    inode-&gt;i_data.nrpages) {</div><div class='del'>-			journal_t *journal = EXT4_SB(inode-&gt;i_sb)-&gt;s_journal;</div><div class='del'>-			tid_t commit_tid = EXT4_I(inode)-&gt;i_datasync_tid;</div><div class='del'>-</div><div class='del'>-			jbd2_complete_transaction(journal, commit_tid);</div><div class='del'>-			filemap_write_and_wait(&amp;inode-&gt;i_data);</div><div class='del'>-		}</div><div class='ctx'> 		truncate_inode_pages_final(&amp;inode-&gt;i_data);</div><div class='ctx'> </div><div class='ctx'> 		goto no_delete;</div><div class='hunk'>@@ -223,13 +197,12 @@ void ext4_evict_inode(struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * For inodes with journalled data, transaction commit could have</div><div class='del'>-	 * dirtied the inode. Flush worker is ignoring it because of I_FREEING</div><div class='del'>-	 * flag but we still need to remove the inode from the writeback lists.</div><div class='add'>+	 * dirtied the inode. And for inodes with dioread_nolock, unwritten</div><div class='add'>+	 * extents converting worker could merge extents and also have dirtied</div><div class='add'>+	 * the inode. Flush worker is ignoring it because of I_FREEING flag but</div><div class='add'>+	 * we still need to remove the inode from the writeback lists.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!list_empty_careful(&amp;inode-&gt;i_io_list)) {</div><div class='del'>-		WARN_ON_ONCE(!ext4_should_journal_data(inode));</div><div class='del'>-		inode_io_list_del(inode);</div><div class='del'>-	}</div><div class='add'>+	inode_io_list_del(inode);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Protect us against freezing - iput() caller didn't have to have any</div><div class='hunk'>@@ -336,8 +309,14 @@ stop_handle:</div><div class='ctx'> 	ext4_xattr_inode_array_free(ea_inode_array);</div><div class='ctx'> 	return;</div><div class='ctx'> no_delete:</div><div class='add'>+	/*</div><div class='add'>+	 * Check out some where else accidentally dirty the evicting inode,</div><div class='add'>+	 * which may probably cause inode use-after-free issues later.</div><div class='add'>+	 */</div><div class='add'>+	WARN_ON_ONCE(!list_empty_careful(&amp;inode-&gt;i_io_list));</div><div class='add'>+</div><div class='ctx'> 	if (!list_empty(&amp;EXT4_I(inode)-&gt;i_fc_list))</div><div class='del'>-		ext4_fc_mark_ineligible(inode-&gt;i_sb, EXT4_FC_REASON_NOMEM);</div><div class='add'>+		ext4_fc_mark_ineligible(inode-&gt;i_sb, EXT4_FC_REASON_NOMEM, NULL);</div><div class='ctx'> 	ext4_clear_inode(inode);	/* We must guarantee clearing of inode... */</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -394,17 +373,18 @@ void ext4_da_update_reserve_space(struct inode *inode,</div><div class='ctx'> 	 */</div><div class='ctx'> 	if ((ei-&gt;i_reserved_data_blocks == 0) &amp;&amp;</div><div class='ctx'> 	    !inode_is_open_for_write(inode))</div><div class='del'>-		ext4_discard_preallocations(inode, 0);</div><div class='add'>+		ext4_discard_preallocations(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int __check_block_validity(struct inode *inode, const char *func,</div><div class='ctx'> 				unsigned int line,</div><div class='ctx'> 				struct ext4_map_blocks *map)</div><div class='ctx'> {</div><div class='del'>-	if (ext4_has_feature_journal(inode-&gt;i_sb) &amp;&amp;</div><div class='del'>-	    (inode-&gt;i_ino ==</div><div class='del'>-	     le32_to_cpu(EXT4_SB(inode-&gt;i_sb)-&gt;s_es-&gt;s_journal_inum)))</div><div class='add'>+	journal_t *journal = EXT4_SB(inode-&gt;i_sb)-&gt;s_journal;</div><div class='add'>+</div><div class='add'>+	if (journal &amp;&amp; inode == journal-&gt;j_inode)</div><div class='ctx'> 		return 0;</div><div class='add'>+</div><div class='ctx'> 	if (!ext4_inode_block_valid(inode, map-&gt;m_pblk, map-&gt;m_len)) {</div><div class='ctx'> 		ext4_error_inode(inode, func, line, map-&gt;m_pblk,</div><div class='ctx'> 				 "lblock %lu mapped to illegal pblock %llu "</div><div class='hunk'>@@ -430,6 +410,32 @@ int ext4_issue_zeroout(struct inode *inode, ext4_lblk_t lblk, ext4_fsblk_t pblk,</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * For generic regular files, when updating the extent tree, Ext4 should</div><div class='add'>+ * hold the i_rwsem and invalidate_lock exclusively. This ensures</div><div class='add'>+ * exclusion against concurrent page faults, as well as reads and writes.</div><div class='add'>+ */</div><div class='add'>+#ifdef CONFIG_EXT4_DEBUG</div><div class='add'>+void ext4_check_map_extents_env(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	if (EXT4_SB(inode-&gt;i_sb)-&gt;s_mount_state &amp; EXT4_FC_REPLAY)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (!S_ISREG(inode-&gt;i_mode) ||</div><div class='add'>+	    IS_NOQUOTA(inode) || IS_VERITY(inode) ||</div><div class='add'>+	    is_special_ino(inode-&gt;i_sb, inode-&gt;i_ino) ||</div><div class='add'>+	    (inode_state_read_once(inode) &amp; (I_FREEING | I_WILL_FREE | I_NEW)) ||</div><div class='add'>+	    ext4_test_inode_flag(inode, EXT4_INODE_EA_INODE) ||</div><div class='add'>+	    ext4_verity_in_progress(inode))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	WARN_ON_ONCE(!inode_is_locked(inode) &amp;&amp;</div><div class='add'>+		     !rwsem_is_locked(&amp;inode-&gt;i_mapping-&gt;invalidate_lock));</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+void ext4_check_map_extents_env(struct inode *inode) {}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> #define check_block_validity(inode, map)	\</div><div class='ctx'> 	__check_block_validity((inode), __func__, __LINE__, (map))</div><div class='ctx'> </div><div class='hunk'>@@ -476,6 +482,191 @@ static void ext4_map_blocks_es_recheck(handle_t *handle,</div><div class='ctx'> }</div><div class='ctx'> #endif /* ES_AGGRESSIVE_TEST */</div><div class='ctx'> </div><div class='add'>+static int ext4_map_query_blocks_next_in_leaf(handle_t *handle,</div><div class='add'>+			struct inode *inode, struct ext4_map_blocks *map,</div><div class='add'>+			unsigned int orig_mlen)</div><div class='add'>+{</div><div class='add'>+	struct ext4_map_blocks map2;</div><div class='add'>+	unsigned int status, status2;</div><div class='add'>+	int retval;</div><div class='add'>+</div><div class='add'>+	status = map-&gt;m_flags &amp; EXT4_MAP_UNWRITTEN ?</div><div class='add'>+		EXTENT_STATUS_UNWRITTEN : EXTENT_STATUS_WRITTEN;</div><div class='add'>+</div><div class='add'>+	WARN_ON_ONCE(!(map-&gt;m_flags &amp; EXT4_MAP_QUERY_LAST_IN_LEAF));</div><div class='add'>+	WARN_ON_ONCE(orig_mlen &lt;= map-&gt;m_len);</div><div class='add'>+</div><div class='add'>+	/* Prepare map2 for lookup in next leaf block */</div><div class='add'>+	map2.m_lblk = map-&gt;m_lblk + map-&gt;m_len;</div><div class='add'>+	map2.m_len = orig_mlen - map-&gt;m_len;</div><div class='add'>+	map2.m_flags = 0;</div><div class='add'>+	retval = ext4_ext_map_blocks(handle, inode, &amp;map2, 0);</div><div class='add'>+</div><div class='add'>+	if (retval &lt;= 0) {</div><div class='add'>+		ext4_es_insert_extent(inode, map-&gt;m_lblk, map-&gt;m_len,</div><div class='add'>+				      map-&gt;m_pblk, status, false);</div><div class='add'>+		return map-&gt;m_len;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (unlikely(retval != map2.m_len)) {</div><div class='add'>+		ext4_warning(inode-&gt;i_sb,</div><div class='add'>+			     "ES len assertion failed for inode "</div><div class='add'>+			     "%lu: retval %d != map-&gt;m_len %d",</div><div class='add'>+			     inode-&gt;i_ino, retval, map2.m_len);</div><div class='add'>+		WARN_ON(1);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	status2 = map2.m_flags &amp; EXT4_MAP_UNWRITTEN ?</div><div class='add'>+		EXTENT_STATUS_UNWRITTEN : EXTENT_STATUS_WRITTEN;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If map2 is contiguous with map, then let's insert it as a single</div><div class='add'>+	 * extent in es cache and return the combined length of both the maps.</div><div class='add'>+	 */</div><div class='add'>+	if (map-&gt;m_pblk + map-&gt;m_len == map2.m_pblk &amp;&amp;</div><div class='add'>+			status == status2) {</div><div class='add'>+		ext4_es_insert_extent(inode, map-&gt;m_lblk,</div><div class='add'>+				      map-&gt;m_len + map2.m_len, map-&gt;m_pblk,</div><div class='add'>+				      status, false);</div><div class='add'>+		map-&gt;m_len += map2.m_len;</div><div class='add'>+	} else {</div><div class='add'>+		ext4_es_insert_extent(inode, map-&gt;m_lblk, map-&gt;m_len,</div><div class='add'>+				      map-&gt;m_pblk, status, false);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return map-&gt;m_len;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ext4_map_query_blocks(handle_t *handle, struct inode *inode,</div><div class='add'>+				 struct ext4_map_blocks *map, int flags)</div><div class='add'>+{</div><div class='add'>+	unsigned int status;</div><div class='add'>+	int retval;</div><div class='add'>+	unsigned int orig_mlen = map-&gt;m_len;</div><div class='add'>+</div><div class='add'>+	flags &amp;= EXT4_EX_QUERY_FILTER;</div><div class='add'>+	if (ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS))</div><div class='add'>+		retval = ext4_ext_map_blocks(handle, inode, map, flags);</div><div class='add'>+	else</div><div class='add'>+		retval = ext4_ind_map_blocks(handle, inode, map, flags);</div><div class='add'>+	if (retval &lt; 0)</div><div class='add'>+		return retval;</div><div class='add'>+</div><div class='add'>+	/* A hole? */</div><div class='add'>+	if (retval == 0)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	if (unlikely(retval != map-&gt;m_len)) {</div><div class='add'>+		ext4_warning(inode-&gt;i_sb,</div><div class='add'>+			     "ES len assertion failed for inode "</div><div class='add'>+			     "%lu: retval %d != map-&gt;m_len %d",</div><div class='add'>+			     inode-&gt;i_ino, retval, map-&gt;m_len);</div><div class='add'>+		WARN_ON(1);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * No need to query next in leaf:</div><div class='add'>+	 * - if returned extent is not last in leaf or</div><div class='add'>+	 * - if the last in leaf is the full requested range</div><div class='add'>+	 */</div><div class='add'>+	if (!(map-&gt;m_flags &amp; EXT4_MAP_QUERY_LAST_IN_LEAF) ||</div><div class='add'>+			map-&gt;m_len == orig_mlen) {</div><div class='add'>+		status = map-&gt;m_flags &amp; EXT4_MAP_UNWRITTEN ?</div><div class='add'>+				EXTENT_STATUS_UNWRITTEN : EXTENT_STATUS_WRITTEN;</div><div class='add'>+		ext4_es_insert_extent(inode, map-&gt;m_lblk, map-&gt;m_len,</div><div class='add'>+				      map-&gt;m_pblk, status, false);</div><div class='add'>+	} else {</div><div class='add'>+		retval = ext4_map_query_blocks_next_in_leaf(handle, inode, map,</div><div class='add'>+							    orig_mlen);</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='add'>+	map-&gt;m_seq = READ_ONCE(EXT4_I(inode)-&gt;i_es_seq);</div><div class='add'>+	return retval;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ext4_map_create_blocks(handle_t *handle, struct inode *inode,</div><div class='add'>+				  struct ext4_map_blocks *map, int flags)</div><div class='add'>+{</div><div class='add'>+	struct extent_status es;</div><div class='add'>+	unsigned int status;</div><div class='add'>+	int err, retval = 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We pass in the magic EXT4_GET_BLOCKS_DELALLOC_RESERVE</div><div class='add'>+	 * indicates that the blocks and quotas has already been</div><div class='add'>+	 * checked when the data was copied into the page cache.</div><div class='add'>+	 */</div><div class='add'>+	if (map-&gt;m_flags &amp; EXT4_MAP_DELAYED)</div><div class='add'>+		flags |= EXT4_GET_BLOCKS_DELALLOC_RESERVE;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Here we clear m_flags because after allocating an new extent,</div><div class='add'>+	 * it will be set again.</div><div class='add'>+	 */</div><div class='add'>+	map-&gt;m_flags &amp;= ~EXT4_MAP_FLAGS;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We need to check for EXT4 here because migrate could have</div><div class='add'>+	 * changed the inode type in between.</div><div class='add'>+	 */</div><div class='add'>+	if (ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS)) {</div><div class='add'>+		retval = ext4_ext_map_blocks(handle, inode, map, flags);</div><div class='add'>+	} else {</div><div class='add'>+		retval = ext4_ind_map_blocks(handle, inode, map, flags);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * We allocated new blocks which will result in i_data's</div><div class='add'>+		 * format changing. Force the migrate to fail by clearing</div><div class='add'>+		 * migrate flags.</div><div class='add'>+		 */</div><div class='add'>+		if (retval &gt; 0 &amp;&amp; map-&gt;m_flags &amp; EXT4_MAP_NEW)</div><div class='add'>+			ext4_clear_inode_state(inode, EXT4_STATE_EXT_MIGRATE);</div><div class='add'>+	}</div><div class='add'>+	if (retval &lt;= 0)</div><div class='add'>+		return retval;</div><div class='add'>+</div><div class='add'>+	if (unlikely(retval != map-&gt;m_len)) {</div><div class='add'>+		ext4_warning(inode-&gt;i_sb,</div><div class='add'>+			     "ES len assertion failed for inode %lu: "</div><div class='add'>+			     "retval %d != map-&gt;m_len %d",</div><div class='add'>+			     inode-&gt;i_ino, retval, map-&gt;m_len);</div><div class='add'>+		WARN_ON(1);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We have to zeroout blocks before inserting them into extent</div><div class='add'>+	 * status tree. Otherwise someone could look them up there and</div><div class='add'>+	 * use them before they are really zeroed. We also have to</div><div class='add'>+	 * unmap metadata before zeroing as otherwise writeback can</div><div class='add'>+	 * overwrite zeros with stale data from block device.</div><div class='add'>+	 */</div><div class='add'>+	if (flags &amp; EXT4_GET_BLOCKS_ZERO &amp;&amp;</div><div class='add'>+	    map-&gt;m_flags &amp; EXT4_MAP_MAPPED &amp;&amp; map-&gt;m_flags &amp; EXT4_MAP_NEW) {</div><div class='add'>+		err = ext4_issue_zeroout(inode, map-&gt;m_lblk, map-&gt;m_pblk,</div><div class='add'>+					 map-&gt;m_len);</div><div class='add'>+		if (err)</div><div class='add'>+			return err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If the extent has been zeroed out, we don't need to update</div><div class='add'>+	 * extent status tree.</div><div class='add'>+	 */</div><div class='add'>+	if (flags &amp; EXT4_GET_BLOCKS_SPLIT_NOMERGE &amp;&amp;</div><div class='add'>+	    ext4_es_lookup_extent(inode, map-&gt;m_lblk, NULL, &amp;es, &amp;map-&gt;m_seq)) {</div><div class='add'>+		if (ext4_es_is_written(&amp;es))</div><div class='add'>+			return retval;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	status = map-&gt;m_flags &amp; EXT4_MAP_UNWRITTEN ?</div><div class='add'>+			EXTENT_STATUS_UNWRITTEN : EXTENT_STATUS_WRITTEN;</div><div class='add'>+	ext4_es_insert_extent(inode, map-&gt;m_lblk, map-&gt;m_len, map-&gt;m_pblk,</div><div class='add'>+			      status, flags &amp; EXT4_GET_BLOCKS_DELALLOC_RESERVE);</div><div class='add'>+	map-&gt;m_seq = READ_ONCE(EXT4_I(inode)-&gt;i_es_seq);</div><div class='add'>+</div><div class='add'>+	return retval;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * The ext4_map_blocks() function tries to look up the requested blocks,</div><div class='ctx'>  * and returns if the blocks are already mapped.</div><div class='hunk'>@@ -488,9 +679,10 @@ static void ext4_map_blocks_es_recheck(handle_t *handle,</div><div class='ctx'>  * Otherwise, call with ext4_ind_map_blocks() to handle indirect mapping</div><div class='ctx'>  * based files</div><div class='ctx'>  *</div><div class='del'>- * On success, it returns the number of blocks being mapped or allocated.  if</div><div class='del'>- * create==0 and the blocks are pre-allocated and unwritten, the resulting @map</div><div class='del'>- * is marked as unwritten. If the create == 1, it will mark @map as mapped.</div><div class='add'>+ * On success, it returns the number of blocks being mapped or allocated.</div><div class='add'>+ * If flags doesn't contain EXT4_GET_BLOCKS_CREATE the blocks are</div><div class='add'>+ * pre-allocated and unwritten, the resulting @map is marked as unwritten.</div><div class='add'>+ * If the flags contain EXT4_GET_BLOCKS_CREATE, it will mark @map as mapped.</div><div class='ctx'>  *</div><div class='ctx'>  * It returns 0 if plain look up failed (blocks have not been allocated), in</div><div class='ctx'>  * that case, @map is returned as unmapped but we still do fill map-&gt;m_len to</div><div class='hunk'>@@ -504,6 +696,7 @@ int ext4_map_blocks(handle_t *handle, struct inode *inode,</div><div class='ctx'> 	struct extent_status es;</div><div class='ctx'> 	int retval;</div><div class='ctx'> 	int ret = 0;</div><div class='add'>+	unsigned int orig_mlen = map-&gt;m_len;</div><div class='ctx'> #ifdef ES_AGGRESSIVE_TEST</div><div class='ctx'> 	struct ext4_map_blocks orig_map;</div><div class='ctx'> </div><div class='hunk'>@@ -524,9 +717,18 @@ int ext4_map_blocks(handle_t *handle, struct inode *inode,</div><div class='ctx'> 	if (unlikely(map-&gt;m_lblk &gt;= EXT_MAX_BLOCKS))</div><div class='ctx'> 		return -EFSCORRUPTED;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Callers from the context of data submission are the only exceptions</div><div class='add'>+	 * for regular files that do not hold the i_rwsem or invalidate_lock.</div><div class='add'>+	 * However, caching unrelated ranges is not permitted.</div><div class='add'>+	 */</div><div class='add'>+	if (flags &amp; EXT4_GET_BLOCKS_IO_SUBMIT)</div><div class='add'>+		WARN_ON_ONCE(!(flags &amp; EXT4_EX_NOCACHE));</div><div class='add'>+	else</div><div class='add'>+		ext4_check_map_extents_env(inode);</div><div class='add'>+</div><div class='ctx'> 	/* Lookup extent status tree firstly */</div><div class='del'>-	if (!(EXT4_SB(inode-&gt;i_sb)-&gt;s_mount_state &amp; EXT4_FC_REPLAY) &amp;&amp;</div><div class='del'>-	    ext4_es_lookup_extent(inode, map-&gt;m_lblk, NULL, &amp;es)) {</div><div class='add'>+	if (ext4_es_lookup_extent(inode, map-&gt;m_lblk, NULL, &amp;es, &amp;map-&gt;m_seq)) {</div><div class='ctx'> 		if (ext4_es_is_written(&amp;es) || ext4_es_is_unwritten(&amp;es)) {</div><div class='ctx'> 			map-&gt;m_pblk = ext4_es_pblock(&amp;es) +</div><div class='ctx'> 					map-&gt;m_lblk - es.es_lblk;</div><div class='hunk'>@@ -538,6 +740,8 @@ int ext4_map_blocks(handle_t *handle, struct inode *inode,</div><div class='ctx'> 			map-&gt;m_len = retval;</div><div class='ctx'> 		} else if (ext4_es_is_delayed(&amp;es) || ext4_es_is_hole(&amp;es)) {</div><div class='ctx'> 			map-&gt;m_pblk = 0;</div><div class='add'>+			map-&gt;m_flags |= ext4_es_is_delayed(&amp;es) ?</div><div class='add'>+					EXT4_MAP_DELAYED : 0;</div><div class='ctx'> 			retval = es.es_len - (map-&gt;m_lblk - es.es_lblk);</div><div class='ctx'> 			if (retval &gt; map-&gt;m_len)</div><div class='ctx'> 				retval = map-&gt;m_len;</div><div class='hunk'>@@ -546,46 +750,32 @@ int ext4_map_blocks(handle_t *handle, struct inode *inode,</div><div class='ctx'> 		} else {</div><div class='ctx'> 			BUG();</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='add'>+		if (flags &amp; EXT4_GET_BLOCKS_CACHED_NOWAIT)</div><div class='add'>+			return retval;</div><div class='ctx'> #ifdef ES_AGGRESSIVE_TEST</div><div class='ctx'> 		ext4_map_blocks_es_recheck(handle, inode, map,</div><div class='ctx'> 					   &amp;orig_map, flags);</div><div class='ctx'> #endif</div><div class='del'>-		goto found;</div><div class='add'>+		if (!(flags &amp; EXT4_GET_BLOCKS_QUERY_LAST_IN_LEAF) ||</div><div class='add'>+				orig_mlen == map-&gt;m_len)</div><div class='add'>+			goto found;</div><div class='add'>+</div><div class='add'>+		map-&gt;m_len = orig_mlen;</div><div class='ctx'> 	}</div><div class='add'>+	/*</div><div class='add'>+	 * In the query cache no-wait mode, nothing we can do more if we</div><div class='add'>+	 * cannot find extent in the cache.</div><div class='add'>+	 */</div><div class='add'>+	if (flags &amp; EXT4_GET_BLOCKS_CACHED_NOWAIT)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Try to see if we can get the block without requesting a new</div><div class='ctx'> 	 * file system block.</div><div class='ctx'> 	 */</div><div class='ctx'> 	down_read(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='del'>-	if (ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS)) {</div><div class='del'>-		retval = ext4_ext_map_blocks(handle, inode, map, 0);</div><div class='del'>-	} else {</div><div class='del'>-		retval = ext4_ind_map_blocks(handle, inode, map, 0);</div><div class='del'>-	}</div><div class='del'>-	if (retval &gt; 0) {</div><div class='del'>-		unsigned int status;</div><div class='del'>-</div><div class='del'>-		if (unlikely(retval != map-&gt;m_len)) {</div><div class='del'>-			ext4_warning(inode-&gt;i_sb,</div><div class='del'>-				     "ES len assertion failed for inode "</div><div class='del'>-				     "%lu: retval %d != map-&gt;m_len %d",</div><div class='del'>-				     inode-&gt;i_ino, retval, map-&gt;m_len);</div><div class='del'>-			WARN_ON(1);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		status = map-&gt;m_flags &amp; EXT4_MAP_UNWRITTEN ?</div><div class='del'>-				EXTENT_STATUS_UNWRITTEN : EXTENT_STATUS_WRITTEN;</div><div class='del'>-		if (!(flags &amp; EXT4_GET_BLOCKS_DELALLOC_RESERVE) &amp;&amp;</div><div class='del'>-		    !(status &amp; EXTENT_STATUS_WRITTEN) &amp;&amp;</div><div class='del'>-		    ext4_es_scan_range(inode, &amp;ext4_es_is_delayed, map-&gt;m_lblk,</div><div class='del'>-				       map-&gt;m_lblk + map-&gt;m_len - 1))</div><div class='del'>-			status |= EXTENT_STATUS_DELAYED;</div><div class='del'>-		ret = ext4_es_insert_extent(inode, map-&gt;m_lblk,</div><div class='del'>-					    map-&gt;m_len, map-&gt;m_pblk, status);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			retval = ret;</div><div class='del'>-	}</div><div class='add'>+	retval = ext4_map_query_blocks(handle, inode, map, flags);</div><div class='ctx'> 	up_read((&amp;EXT4_I(inode)-&gt;i_data_sem));</div><div class='ctx'> </div><div class='ctx'> found:</div><div class='hunk'>@@ -603,8 +793,7 @@ found:</div><div class='ctx'> 	 * Returns if the blocks have already allocated</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * Note that if blocks have been preallocated</div><div class='del'>-	 * ext4_ext_get_block() returns the create = 0</div><div class='del'>-	 * with buffer head unmapped.</div><div class='add'>+	 * ext4_ext_map_blocks() returns with buffer head unmapped</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (retval &gt; 0 &amp;&amp; map-&gt;m_flags &amp; EXT4_MAP_MAPPED)</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -615,12 +804,8 @@ found:</div><div class='ctx'> 		if (!(flags &amp; EXT4_GET_BLOCKS_CONVERT_UNWRITTEN))</div><div class='ctx'> 			return retval;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Here we clear m_flags because after allocating an new extent,</div><div class='del'>-	 * it will be set again.</div><div class='del'>-	 */</div><div class='del'>-	map-&gt;m_flags &amp;= ~EXT4_MAP_FLAGS;</div><div class='ctx'> </div><div class='add'>+	ext4_fc_track_inode(handle, inode);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * New blocks allocate and/or writing to unwritten extent</div><div class='ctx'> 	 * will possibly result in updating i_data, so we take</div><div class='hunk'>@@ -628,92 +813,15 @@ found:</div><div class='ctx'> 	 * with create == 1 flag.</div><div class='ctx'> 	 */</div><div class='ctx'> 	down_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='add'>+	retval = ext4_map_create_blocks(handle, inode, map, flags);</div><div class='add'>+	up_write((&amp;EXT4_I(inode)-&gt;i_data_sem));</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * We need to check for EXT4 here because migrate</div><div class='del'>-	 * could have changed the inode type in between</div><div class='del'>-	 */</div><div class='del'>-	if (ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS)) {</div><div class='del'>-		retval = ext4_ext_map_blocks(handle, inode, map, flags);</div><div class='del'>-	} else {</div><div class='del'>-		retval = ext4_ind_map_blocks(handle, inode, map, flags);</div><div class='del'>-</div><div class='del'>-		if (retval &gt; 0 &amp;&amp; map-&gt;m_flags &amp; EXT4_MAP_NEW) {</div><div class='del'>-			/*</div><div class='del'>-			 * We allocated new blocks which will result in</div><div class='del'>-			 * i_data's format changing.  Force the migrate</div><div class='del'>-			 * to fail by clearing migrate flags</div><div class='del'>-			 */</div><div class='del'>-			ext4_clear_inode_state(inode, EXT4_STATE_EXT_MIGRATE);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Update reserved blocks/metadata blocks after successful</div><div class='del'>-		 * block allocation which had been deferred till now. We don't</div><div class='del'>-		 * support fallocate for non extent files. So we can update</div><div class='del'>-		 * reserve space here.</div><div class='del'>-		 */</div><div class='del'>-		if ((retval &gt; 0) &amp;&amp;</div><div class='del'>-			(flags &amp; EXT4_GET_BLOCKS_DELALLOC_RESERVE))</div><div class='del'>-			ext4_da_update_reserve_space(inode, retval, 1);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (retval &gt; 0) {</div><div class='del'>-		unsigned int status;</div><div class='del'>-</div><div class='del'>-		if (unlikely(retval != map-&gt;m_len)) {</div><div class='del'>-			ext4_warning(inode-&gt;i_sb,</div><div class='del'>-				     "ES len assertion failed for inode "</div><div class='del'>-				     "%lu: retval %d != map-&gt;m_len %d",</div><div class='del'>-				     inode-&gt;i_ino, retval, map-&gt;m_len);</div><div class='del'>-			WARN_ON(1);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * We have to zeroout blocks before inserting them into extent</div><div class='del'>-		 * status tree. Otherwise someone could look them up there and</div><div class='del'>-		 * use them before they are really zeroed. We also have to</div><div class='del'>-		 * unmap metadata before zeroing as otherwise writeback can</div><div class='del'>-		 * overwrite zeros with stale data from block device.</div><div class='del'>-		 */</div><div class='del'>-		if (flags &amp; EXT4_GET_BLOCKS_ZERO &amp;&amp;</div><div class='del'>-		    map-&gt;m_flags &amp; EXT4_MAP_MAPPED &amp;&amp;</div><div class='del'>-		    map-&gt;m_flags &amp; EXT4_MAP_NEW) {</div><div class='del'>-			ret = ext4_issue_zeroout(inode, map-&gt;m_lblk,</div><div class='del'>-						 map-&gt;m_pblk, map-&gt;m_len);</div><div class='del'>-			if (ret) {</div><div class='del'>-				retval = ret;</div><div class='del'>-				goto out_sem;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * If the extent has been zeroed out, we don't need to update</div><div class='del'>-		 * extent status tree.</div><div class='del'>-		 */</div><div class='del'>-		if ((flags &amp; EXT4_GET_BLOCKS_PRE_IO) &amp;&amp;</div><div class='del'>-		    ext4_es_lookup_extent(inode, map-&gt;m_lblk, NULL, &amp;es)) {</div><div class='del'>-			if (ext4_es_is_written(&amp;es))</div><div class='del'>-				goto out_sem;</div><div class='del'>-		}</div><div class='del'>-		status = map-&gt;m_flags &amp; EXT4_MAP_UNWRITTEN ?</div><div class='del'>-				EXTENT_STATUS_UNWRITTEN : EXTENT_STATUS_WRITTEN;</div><div class='del'>-		if (!(flags &amp; EXT4_GET_BLOCKS_DELALLOC_RESERVE) &amp;&amp;</div><div class='del'>-		    !(status &amp; EXTENT_STATUS_WRITTEN) &amp;&amp;</div><div class='del'>-		    ext4_es_scan_range(inode, &amp;ext4_es_is_delayed, map-&gt;m_lblk,</div><div class='del'>-				       map-&gt;m_lblk + map-&gt;m_len - 1))</div><div class='del'>-			status |= EXTENT_STATUS_DELAYED;</div><div class='del'>-		ret = ext4_es_insert_extent(inode, map-&gt;m_lblk, map-&gt;m_len,</div><div class='del'>-					    map-&gt;m_pblk, status);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			retval = ret;</div><div class='del'>-			goto out_sem;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	if (retval &lt; 0)</div><div class='add'>+		ext_debug(inode, "failed with err %d\n", retval);</div><div class='add'>+	if (retval &lt;= 0)</div><div class='add'>+		return retval;</div><div class='ctx'> </div><div class='del'>-out_sem:</div><div class='del'>-	up_write((&amp;EXT4_I(inode)-&gt;i_data_sem));</div><div class='del'>-	if (retval &gt; 0 &amp;&amp; map-&gt;m_flags &amp; EXT4_MAP_MAPPED) {</div><div class='add'>+	if (map-&gt;m_flags &amp; EXT4_MAP_MAPPED) {</div><div class='ctx'> 		ret = check_block_validity(inode, map);</div><div class='ctx'> 		if (ret != 0)</div><div class='ctx'> 			return ret;</div><div class='hunk'>@@ -728,9 +836,8 @@ out_sem:</div><div class='ctx'> 		    !(flags &amp; EXT4_GET_BLOCKS_ZERO) &amp;&amp;</div><div class='ctx'> 		    !ext4_is_quota_file(inode) &amp;&amp;</div><div class='ctx'> 		    ext4_should_order_data(inode)) {</div><div class='del'>-			loff_t start_byte =</div><div class='del'>-				(loff_t)map-&gt;m_lblk &lt;&lt; inode-&gt;i_blkbits;</div><div class='del'>-			loff_t length = (loff_t)map-&gt;m_len &lt;&lt; inode-&gt;i_blkbits;</div><div class='add'>+			loff_t start_byte = EXT4_LBLK_TO_B(inode, map-&gt;m_lblk);</div><div class='add'>+			loff_t length = EXT4_LBLK_TO_B(inode, map-&gt;m_len);</div><div class='ctx'> </div><div class='ctx'> 			if (flags &amp; EXT4_GET_BLOCKS_IO_SUBMIT)</div><div class='ctx'> 				ret = ext4_jbd2_inode_add_wait(handle, inode,</div><div class='hunk'>@@ -741,12 +848,9 @@ out_sem:</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				return ret;</div><div class='ctx'> 		}</div><div class='del'>-		ext4_fc_track_range(handle, inode, map-&gt;m_lblk,</div><div class='del'>-			    map-&gt;m_lblk + map-&gt;m_len - 1);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	if (retval &lt; 0)</div><div class='del'>-		ext_debug(inode, "failed with err %d\n", retval);</div><div class='add'>+	ext4_fc_track_range(handle, inode, map-&gt;m_lblk, map-&gt;m_lblk +</div><div class='add'>+			    map-&gt;m_len - 1);</div><div class='ctx'> 	return retval;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -762,7 +866,7 @@ static void ext4_update_bh_state(struct buffer_head *bh, unsigned long flags)</div><div class='ctx'> 	flags &amp;= EXT4_MAP_FLAGS;</div><div class='ctx'> </div><div class='ctx'> 	/* Dummy buffer_head? Set non-atomically. */</div><div class='del'>-	if (!bh-&gt;b_page) {</div><div class='add'>+	if (!bh-&gt;b_folio) {</div><div class='ctx'> 		bh-&gt;b_state = (bh-&gt;b_state &amp; ~EXT4_MAP_FLAGS) | flags;</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -771,11 +875,30 @@ static void ext4_update_bh_state(struct buffer_head *bh, unsigned long flags)</div><div class='ctx'> 	 * once we get rid of using bh as a container for mapping information</div><div class='ctx'> 	 * to pass to / from get_block functions, this can go away.</div><div class='ctx'> 	 */</div><div class='add'>+	old_state = READ_ONCE(bh-&gt;b_state);</div><div class='ctx'> 	do {</div><div class='del'>-		old_state = READ_ONCE(bh-&gt;b_state);</div><div class='ctx'> 		new_state = (old_state &amp; ~EXT4_MAP_FLAGS) | flags;</div><div class='del'>-	} while (unlikely(</div><div class='del'>-		 cmpxchg(&amp;bh-&gt;b_state, old_state, new_state) != old_state));</div><div class='add'>+	} while (unlikely(!try_cmpxchg(&amp;bh-&gt;b_state, &amp;old_state, new_state)));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Make sure that the current journal transaction has enough credits to map</div><div class='add'>+ * one extent. Return -EAGAIN if it cannot extend the current running</div><div class='add'>+ * transaction.</div><div class='add'>+ */</div><div class='add'>+static inline int ext4_journal_ensure_extent_credits(handle_t *handle,</div><div class='add'>+						     struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	int credits;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	/* Called from ext4_da_write_begin() which has no handle started? */</div><div class='add'>+	if (!handle)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	credits = ext4_chunk_trans_blocks(inode, 1);</div><div class='add'>+	ret = __ext4_journal_ensure_credits(handle, credits, credits, 0);</div><div class='add'>+	return ret &lt;= 0 ? ret : -EAGAIN;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int _ext4_get_block(struct inode *inode, sector_t iblock,</div><div class='hunk'>@@ -819,10 +942,22 @@ int ext4_get_block(struct inode *inode, sector_t iblock,</div><div class='ctx'> int ext4_get_block_unwritten(struct inode *inode, sector_t iblock,</div><div class='ctx'> 			     struct buffer_head *bh_result, int create)</div><div class='ctx'> {</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='ctx'> 	ext4_debug("ext4_get_block_unwritten: inode %lu, create flag %d\n",</div><div class='ctx'> 		   inode-&gt;i_ino, create);</div><div class='del'>-	return _ext4_get_block(inode, iblock, bh_result,</div><div class='del'>-			       EXT4_GET_BLOCKS_IO_CREATE_EXT);</div><div class='add'>+	ret = _ext4_get_block(inode, iblock, bh_result,</div><div class='add'>+			       EXT4_GET_BLOCKS_CREATE_UNWRIT_EXT);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If the buffer is marked unwritten, mark it as new to make sure it is</div><div class='add'>+	 * zeroed out correctly in case of partial writes. Otherwise, there is</div><div class='add'>+	 * a chance of stale data getting exposed.</div><div class='add'>+	 */</div><div class='add'>+	if (ret == 0 &amp;&amp; buffer_unwritten(bh_result))</div><div class='add'>+		set_buffer_new(bh_result);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Maximum number of blocks we map for direct IO at once. */</div><div class='hunk'>@@ -837,10 +972,12 @@ struct buffer_head *ext4_getblk(handle_t *handle, struct inode *inode,</div><div class='ctx'> 	struct ext4_map_blocks map;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> 	int create = map_flags &amp; EXT4_GET_BLOCKS_CREATE;</div><div class='add'>+	bool nowait = map_flags &amp; EXT4_GET_BLOCKS_CACHED_NOWAIT;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	ASSERT((EXT4_SB(inode-&gt;i_sb)-&gt;s_mount_state &amp; EXT4_FC_REPLAY)</div><div class='ctx'> 		    || handle != NULL || create == 0);</div><div class='add'>+	ASSERT(create == 0 || !nowait);</div><div class='ctx'> </div><div class='ctx'> 	map.m_lblk = block;</div><div class='ctx'> 	map.m_len = 1;</div><div class='hunk'>@@ -851,7 +988,17 @@ struct buffer_head *ext4_getblk(handle_t *handle, struct inode *inode,</div><div class='ctx'> 	if (err &lt; 0)</div><div class='ctx'> 		return ERR_PTR(err);</div><div class='ctx'> </div><div class='del'>-	bh = sb_getblk(inode-&gt;i_sb, map.m_pblk);</div><div class='add'>+	if (nowait)</div><div class='add'>+		return sb_find_get_block(inode-&gt;i_sb, map.m_pblk);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Since bh could introduce extra ref count such as referred by</div><div class='add'>+	 * journal_head etc. Try to avoid using __GFP_MOVABLE here</div><div class='add'>+	 * as it may fail the migration when journal_head remains.</div><div class='add'>+	 */</div><div class='add'>+	bh = getblk_unmovable(inode-&gt;i_sb-&gt;s_bdev, map.m_pblk,</div><div class='add'>+				inode-&gt;i_sb-&gt;s_blocksize);</div><div class='add'>+</div><div class='ctx'> 	if (unlikely(!bh))</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> 	if (map.m_flags &amp; EXT4_MAP_NEW) {</div><div class='hunk'>@@ -986,112 +1133,103 @@ int ext4_walk_page_buffers(handle_t *handle, struct inode *inode,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * To preserve ordering, it is essential that the hole instantiation and</div><div class='del'>- * the data write be encapsulated in a single transaction.  We cannot</div><div class='del'>- * close off a transaction and start a new one between the ext4_get_block()</div><div class='del'>- * and the commit_write().  So doing the jbd2_journal_start at the start of</div><div class='del'>- * prepare_write() is the right place.</div><div class='del'>- *</div><div class='del'>- * Also, this function can nest inside ext4_writepage().  In that case, we</div><div class='del'>- * *know* that ext4_writepage() has generated enough buffer credits to do the</div><div class='del'>- * whole page.  So we won't block on the journal in that case, which is good,</div><div class='del'>- * because the caller may be PF_MEMALLOC.</div><div class='del'>- *</div><div class='del'>- * By accident, ext4 can be reentered when a transaction is open via</div><div class='del'>- * quota file writes.  If we were to commit the transaction while thus</div><div class='del'>- * reentered, there can be a deadlock - we would be holding a quota</div><div class='del'>- * lock, and the commit would never complete if another thread had a</div><div class='del'>- * transaction open and was blocking on the quota lock - a ranking</div><div class='del'>- * violation.</div><div class='del'>- *</div><div class='del'>- * So what we do is to rely on the fact that jbd2_journal_stop/journal_start</div><div class='del'>- * will _not_ run commit under these circumstances because handle-&gt;h_ref</div><div class='del'>- * is elevated.  We'll still have enough credits for the tiny quotafile</div><div class='del'>- * write.</div><div class='add'>+ * Helper for handling dirtying of journalled data. We also mark the folio as</div><div class='add'>+ * dirty so that writeback code knows about this page (and inode) contains</div><div class='add'>+ * dirty data. ext4_writepages() then commits appropriate transaction to</div><div class='add'>+ * make data stable.</div><div class='ctx'>  */</div><div class='add'>+static int ext4_dirty_journalled_data(handle_t *handle, struct buffer_head *bh)</div><div class='add'>+{</div><div class='add'>+	struct folio *folio = bh-&gt;b_folio;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+</div><div class='add'>+	/* only regular files have a_ops */</div><div class='add'>+	if (S_ISREG(inode-&gt;i_mode))</div><div class='add'>+		folio_mark_dirty(folio);</div><div class='add'>+	return ext4_handle_dirty_metadata(handle, NULL, bh);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> int do_journal_get_write_access(handle_t *handle, struct inode *inode,</div><div class='ctx'> 				struct buffer_head *bh)</div><div class='ctx'> {</div><div class='del'>-	int dirty = buffer_dirty(bh);</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='ctx'> 	if (!buffer_mapped(bh) || buffer_freed(bh))</div><div class='ctx'> 		return 0;</div><div class='del'>-	/*</div><div class='del'>-	 * __block_write_begin() could have dirtied some buffers. Clean</div><div class='del'>-	 * the dirty bit as jbd2_journal_get_write_access() could complain</div><div class='del'>-	 * otherwise about fs integrity issues. Setting of the dirty bit</div><div class='del'>-	 * by __block_write_begin() isn't a real problem here as we clear</div><div class='del'>-	 * the bit before releasing a page lock and thus writeback cannot</div><div class='del'>-	 * ever write the buffer.</div><div class='del'>-	 */</div><div class='del'>-	if (dirty)</div><div class='del'>-		clear_buffer_dirty(bh);</div><div class='ctx'> 	BUFFER_TRACE(bh, "get write access");</div><div class='del'>-	ret = ext4_journal_get_write_access(handle, inode-&gt;i_sb, bh,</div><div class='add'>+	return ext4_journal_get_write_access(handle, inode-&gt;i_sb, bh,</div><div class='ctx'> 					    EXT4_JTR_NONE);</div><div class='del'>-	if (!ret &amp;&amp; dirty)</div><div class='del'>-		ret = ext4_handle_dirty_metadata(handle, NULL, bh);</div><div class='del'>-	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_FS_ENCRYPTION</div><div class='del'>-static int ext4_block_write_begin(struct page *page, loff_t pos, unsigned len,</div><div class='del'>-				  get_block_t *get_block)</div><div class='add'>+int ext4_block_write_begin(handle_t *handle, struct folio *folio,</div><div class='add'>+			   loff_t pos, unsigned len,</div><div class='add'>+			   get_block_t *get_block)</div><div class='ctx'> {</div><div class='del'>-	unsigned from = pos &amp; (PAGE_SIZE - 1);</div><div class='add'>+	unsigned int from = offset_in_folio(folio, pos);</div><div class='ctx'> 	unsigned to = from + len;</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	unsigned block_start, block_end;</div><div class='ctx'> 	sector_t block;</div><div class='ctx'> 	int err = 0;</div><div class='del'>-	unsigned blocksize = inode-&gt;i_sb-&gt;s_blocksize;</div><div class='del'>-	unsigned bbits;</div><div class='add'>+	unsigned int blocksize = i_blocksize(inode);</div><div class='ctx'> 	struct buffer_head *bh, *head, *wait[2];</div><div class='ctx'> 	int nr_wait = 0;</div><div class='ctx'> 	int i;</div><div class='add'>+	bool should_journal_data = ext4_should_journal_data(inode);</div><div class='ctx'> </div><div class='del'>-	BUG_ON(!PageLocked(page));</div><div class='del'>-	BUG_ON(from &gt; PAGE_SIZE);</div><div class='del'>-	BUG_ON(to &gt; PAGE_SIZE);</div><div class='add'>+	BUG_ON(!folio_test_locked(folio));</div><div class='add'>+	BUG_ON(to &gt; folio_size(folio));</div><div class='ctx'> 	BUG_ON(from &gt; to);</div><div class='add'>+	WARN_ON_ONCE(blocksize &gt; folio_size(folio));</div><div class='ctx'> </div><div class='del'>-	if (!page_has_buffers(page))</div><div class='del'>-		create_empty_buffers(page, blocksize, 0);</div><div class='del'>-	head = page_buffers(page);</div><div class='del'>-	bbits = ilog2(blocksize);</div><div class='del'>-	block = (sector_t)page-&gt;index &lt;&lt; (PAGE_SHIFT - bbits);</div><div class='add'>+	head = folio_buffers(folio);</div><div class='add'>+	if (!head)</div><div class='add'>+		head = create_empty_buffers(folio, blocksize, 0);</div><div class='add'>+	block = EXT4_PG_TO_LBLK(inode, folio-&gt;index);</div><div class='ctx'> </div><div class='ctx'> 	for (bh = head, block_start = 0; bh != head || !block_start;</div><div class='ctx'> 	    block++, block_start = block_end, bh = bh-&gt;b_this_page) {</div><div class='ctx'> 		block_end = block_start + blocksize;</div><div class='ctx'> 		if (block_end &lt;= from || block_start &gt;= to) {</div><div class='del'>-			if (PageUptodate(page)) {</div><div class='add'>+			if (folio_test_uptodate(folio)) {</div><div class='ctx'> 				set_buffer_uptodate(bh);</div><div class='ctx'> 			}</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='del'>-		if (buffer_new(bh))</div><div class='add'>+		if (WARN_ON_ONCE(buffer_new(bh)))</div><div class='ctx'> 			clear_buffer_new(bh);</div><div class='ctx'> 		if (!buffer_mapped(bh)) {</div><div class='ctx'> 			WARN_ON(bh-&gt;b_size != blocksize);</div><div class='del'>-			err = get_block(inode, block, bh, 1);</div><div class='add'>+			err = ext4_journal_ensure_extent_credits(handle, inode);</div><div class='add'>+			if (!err)</div><div class='add'>+				err = get_block(inode, block, bh, 1);</div><div class='ctx'> 			if (err)</div><div class='ctx'> 				break;</div><div class='ctx'> 			if (buffer_new(bh)) {</div><div class='del'>-				if (PageUptodate(page)) {</div><div class='del'>-					clear_buffer_new(bh);</div><div class='add'>+				/*</div><div class='add'>+				 * We may be zeroing partial buffers or all new</div><div class='add'>+				 * buffers in case of failure. Prepare JBD2 for</div><div class='add'>+				 * that.</div><div class='add'>+				 */</div><div class='add'>+				if (should_journal_data)</div><div class='add'>+					do_journal_get_write_access(handle,</div><div class='add'>+								    inode, bh);</div><div class='add'>+				if (folio_test_uptodate(folio)) {</div><div class='add'>+					/*</div><div class='add'>+					 * Unlike __block_write_begin() we leave</div><div class='add'>+					 * dirtying of new uptodate buffers to</div><div class='add'>+					 * -&gt;write_end() time or</div><div class='add'>+					 * folio_zero_new_buffers().</div><div class='add'>+					 */</div><div class='ctx'> 					set_buffer_uptodate(bh);</div><div class='del'>-					mark_buffer_dirty(bh);</div><div class='ctx'> 					continue;</div><div class='ctx'> 				}</div><div class='ctx'> 				if (block_end &gt; to || block_start &lt; from)</div><div class='del'>-					zero_user_segments(page, to, block_end,</div><div class='del'>-							   block_start, from);</div><div class='add'>+					folio_zero_segments(folio, to,</div><div class='add'>+							    block_end,</div><div class='add'>+							    block_start, from);</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		if (PageUptodate(page)) {</div><div class='add'>+		if (folio_test_uptodate(folio)) {</div><div class='ctx'> 			set_buffer_uptodate(bh);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1111,13 +1249,17 @@ static int ext4_block_write_begin(struct page *page, loff_t pos, unsigned len,</div><div class='ctx'> 			err = -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (unlikely(err)) {</div><div class='del'>-		page_zero_new_buffers(page, from, to);</div><div class='add'>+		if (should_journal_data)</div><div class='add'>+			ext4_journalled_zero_new_buffers(handle, inode, folio,</div><div class='add'>+							 from, to);</div><div class='add'>+		else</div><div class='add'>+			folio_zero_new_buffers(folio, from, to);</div><div class='ctx'> 	} else if (fscrypt_inode_uses_fs_layer_crypto(inode)) {</div><div class='ctx'> 		for (i = 0; i &lt; nr_wait; i++) {</div><div class='ctx'> 			int err2;</div><div class='ctx'> </div><div class='del'>-			err2 = fscrypt_decrypt_pagecache_blocks(page, blocksize,</div><div class='del'>-								bh_offset(wait[i]));</div><div class='add'>+			err2 = fscrypt_decrypt_pagecache_blocks(folio,</div><div class='add'>+						blocksize, bh_offset(wait[i]));</div><div class='ctx'> 			if (err2) {</div><div class='ctx'> 				clear_buffer_uptodate(wait[i]);</div><div class='ctx'> 				err = err2;</div><div class='hunk'>@@ -1127,36 +1269,43 @@ static int ext4_block_write_begin(struct page *page, loff_t pos, unsigned len,</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='del'>-#endif</div><div class='ctx'> </div><div class='del'>-static int ext4_write_begin(struct file *file, struct address_space *mapping,</div><div class='del'>-			    loff_t pos, unsigned len, unsigned flags,</div><div class='del'>-			    struct page **pagep, void **fsdata)</div><div class='add'>+/*</div><div class='add'>+ * To preserve ordering, it is essential that the hole instantiation and</div><div class='add'>+ * the data write be encapsulated in a single transaction.  We cannot</div><div class='add'>+ * close off a transaction and start a new one between the ext4_get_block()</div><div class='add'>+ * and the ext4_write_end().  So doing the jbd2_journal_start at the start of</div><div class='add'>+ * ext4_write_begin() is the right place.</div><div class='add'>+ */</div><div class='add'>+static int ext4_write_begin(const struct kiocb *iocb,</div><div class='add'>+			    struct address_space *mapping,</div><div class='add'>+			    loff_t pos, unsigned len,</div><div class='add'>+			    struct folio **foliop, void **fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='ctx'> 	int ret, needed_blocks;</div><div class='ctx'> 	handle_t *handle;</div><div class='ctx'> 	int retries = 0;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	pgoff_t index;</div><div class='ctx'> 	unsigned from, to;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ext4_forced_shutdown(EXT4_SB(inode-&gt;i_sb))))</div><div class='del'>-		return -EIO;</div><div class='add'>+	ret = ext4_emergency_state(inode-&gt;i_sb);</div><div class='add'>+	if (unlikely(ret))</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	trace_ext4_write_begin(inode, pos, len, flags);</div><div class='add'>+	trace_ext4_write_begin(inode, pos, len);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Reserve one block more for addition to orphan list in case</div><div class='ctx'> 	 * we allocate blocks but write fails for some reason</div><div class='ctx'> 	 */</div><div class='del'>-	needed_blocks = ext4_writepage_trans_blocks(inode) + 1;</div><div class='add'>+	needed_blocks = ext4_chunk_trans_extent(inode,</div><div class='add'>+			ext4_journal_blocks_per_folio(inode)) + 1;</div><div class='ctx'> 	index = pos &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	from = pos &amp; (PAGE_SIZE - 1);</div><div class='del'>-	to = from + len;</div><div class='ctx'> </div><div class='ctx'> 	if (ext4_test_inode_state(inode, EXT4_STATE_MAY_INLINE_DATA)) {</div><div class='ctx'> 		ret = ext4_try_to_write_inline_data(mapping, inode, pos, len,</div><div class='del'>-						    flags, pagep);</div><div class='add'>+						    foliop);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 		if (ret == 1)</div><div class='hunk'>@@ -1164,65 +1313,71 @@ static int ext4_write_begin(struct file *file, struct address_space *mapping,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * grab_cache_page_write_begin() can take a long time if the</div><div class='del'>-	 * system is thrashing due to memory pressure, or if the page</div><div class='add'>+	 * write_begin_get_folio() can take a long time if the</div><div class='add'>+	 * system is thrashing due to memory pressure, or if the folio</div><div class='ctx'> 	 * is being written back.  So grab it first before we start</div><div class='ctx'> 	 * the transaction handle.  This also allows us to allocate</div><div class='del'>-	 * the page (if needed) without using GFP_NOFS.</div><div class='add'>+	 * the folio (if needed) without using GFP_NOFS.</div><div class='ctx'> 	 */</div><div class='ctx'> retry_grab:</div><div class='del'>-	page = grab_cache_page_write_begin(mapping, index, flags);</div><div class='del'>-	if (!page)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	folio = write_begin_get_folio(iocb, mapping, index, len);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio);</div><div class='add'>+</div><div class='add'>+	if (len &gt; folio_next_pos(folio) - pos)</div><div class='add'>+		len = folio_next_pos(folio) - pos;</div><div class='add'>+</div><div class='add'>+	from = offset_in_folio(folio, pos);</div><div class='add'>+	to = from + len;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The same as page allocation, we prealloc buffer heads before</div><div class='add'>+	 * starting the handle.</div><div class='add'>+	 */</div><div class='add'>+	if (!folio_buffers(folio))</div><div class='add'>+		create_empty_buffers(folio, inode-&gt;i_sb-&gt;s_blocksize, 0);</div><div class='add'>+</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> </div><div class='ctx'> retry_journal:</div><div class='ctx'> 	handle = ext4_journal_start(inode, EXT4_HT_WRITE_PAGE, needed_blocks);</div><div class='ctx'> 	if (IS_ERR(handle)) {</div><div class='del'>-		put_page(page);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 		return PTR_ERR(handle);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	lock_page(page);</div><div class='del'>-	if (page-&gt;mapping != mapping) {</div><div class='del'>-		/* The page got truncated from under us */</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		put_page(page);</div><div class='add'>+	folio_lock(folio);</div><div class='add'>+	if (folio-&gt;mapping != mapping) {</div><div class='add'>+		/* The folio got truncated from under us */</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 		ext4_journal_stop(handle);</div><div class='ctx'> 		goto retry_grab;</div><div class='ctx'> 	}</div><div class='del'>-	/* In case writeback began while the page was unlocked */</div><div class='del'>-	wait_for_stable_page(page);</div><div class='add'>+	/* In case writeback began while the folio was unlocked */</div><div class='add'>+	folio_wait_stable(folio);</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_FS_ENCRYPTION</div><div class='ctx'> 	if (ext4_should_dioread_nolock(inode))</div><div class='del'>-		ret = ext4_block_write_begin(page, pos, len,</div><div class='add'>+		ret = ext4_block_write_begin(handle, folio, pos, len,</div><div class='ctx'> 					     ext4_get_block_unwritten);</div><div class='ctx'> 	else</div><div class='del'>-		ret = ext4_block_write_begin(page, pos, len,</div><div class='add'>+		ret = ext4_block_write_begin(handle, folio, pos, len,</div><div class='ctx'> 					     ext4_get_block);</div><div class='del'>-#else</div><div class='del'>-	if (ext4_should_dioread_nolock(inode))</div><div class='del'>-		ret = __block_write_begin(page, pos, len,</div><div class='del'>-					  ext4_get_block_unwritten);</div><div class='del'>-	else</div><div class='del'>-		ret = __block_write_begin(page, pos, len, ext4_get_block);</div><div class='del'>-#endif</div><div class='ctx'> 	if (!ret &amp;&amp; ext4_should_journal_data(inode)) {</div><div class='ctx'> 		ret = ext4_walk_page_buffers(handle, inode,</div><div class='del'>-					     page_buffers(page), from, to, NULL,</div><div class='del'>-					     do_journal_get_write_access);</div><div class='add'>+					     folio_buffers(folio), from, to,</div><div class='add'>+					     NULL, do_journal_get_write_access);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		bool extended = (pos + len &gt; inode-&gt;i_size) &amp;&amp;</div><div class='ctx'> 				!ext4_verity_in_progress(inode);</div><div class='ctx'> </div><div class='del'>-		unlock_page(page);</div><div class='add'>+		folio_unlock(folio);</div><div class='ctx'> 		/*</div><div class='del'>-		 * __block_write_begin may have instantiated a few blocks</div><div class='add'>+		 * ext4_block_write_begin may have instantiated a few blocks</div><div class='ctx'> 		 * outside i_size.  Trim these off again. Don't need</div><div class='del'>-		 * i_size_read because we hold i_mutex.</div><div class='add'>+		 * i_size_read because we hold i_rwsem.</div><div class='ctx'> 		 *</div><div class='ctx'> 		 * Add inode to orphan list in case we crash before</div><div class='ctx'> 		 * truncate finishes</div><div class='hunk'>@@ -1243,13 +1398,14 @@ retry_journal:</div><div class='ctx'> 				ext4_orphan_del(NULL, inode);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (ret == -ENOSPC &amp;&amp;</div><div class='del'>-		    ext4_should_retry_alloc(inode-&gt;i_sb, &amp;retries))</div><div class='add'>+		if (ret == -EAGAIN ||</div><div class='add'>+		    (ret == -ENOSPC &amp;&amp;</div><div class='add'>+		     ext4_should_retry_alloc(inode-&gt;i_sb, &amp;retries)))</div><div class='ctx'> 			goto retry_journal;</div><div class='del'>-		put_page(page);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='del'>-	*pagep = page;</div><div class='add'>+	*foliop = folio;</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1261,23 +1417,24 @@ static int write_end_fn(handle_t *handle, struct inode *inode,</div><div class='ctx'> 	if (!buffer_mapped(bh) || buffer_freed(bh))</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	set_buffer_uptodate(bh);</div><div class='del'>-	ret = ext4_handle_dirty_metadata(handle, NULL, bh);</div><div class='add'>+	ret = ext4_dirty_journalled_data(handle, bh);</div><div class='ctx'> 	clear_buffer_meta(bh);</div><div class='ctx'> 	clear_buffer_prio(bh);</div><div class='add'>+	clear_buffer_new(bh);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * We need to pick up the new inode size which generic_commit_write gave us</div><div class='del'>- * `file' can be NULL - eg, when called from page_symlink().</div><div class='add'>+ * `iocb` can be NULL - eg, when called from page_symlink().</div><div class='ctx'>  *</div><div class='del'>- * ext4 never places buffers on inode-&gt;i_mapping-&gt;private_list.  metadata</div><div class='add'>+ * ext4 never places buffers on inode-&gt;i_mapping-&gt;i_private_list.  metadata</div><div class='ctx'>  * buffers are managed internally.</div><div class='ctx'>  */</div><div class='del'>-static int ext4_write_end(struct file *file,</div><div class='add'>+static int ext4_write_end(const struct kiocb *iocb,</div><div class='ctx'> 			  struct address_space *mapping,</div><div class='ctx'> 			  loff_t pos, unsigned len, unsigned copied,</div><div class='del'>-			  struct page *page, void *fsdata)</div><div class='add'>+			  struct folio *folio, void *fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	handle_t *handle = ext4_journal_current_handle();</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='hunk'>@@ -1288,12 +1445,14 @@ static int ext4_write_end(struct file *file,</div><div class='ctx'> </div><div class='ctx'> 	trace_ext4_write_end(inode, pos, len, copied);</div><div class='ctx'> </div><div class='del'>-	if (ext4_has_inline_data(inode))</div><div class='del'>-		return ext4_write_inline_data_end(inode, pos, len, copied, page);</div><div class='add'>+	if (ext4_has_inline_data(inode) &amp;&amp;</div><div class='add'>+	    ext4_test_inode_state(inode, EXT4_STATE_MAY_INLINE_DATA))</div><div class='add'>+		return ext4_write_inline_data_end(inode, pos, len, copied,</div><div class='add'>+						  folio);</div><div class='ctx'> </div><div class='del'>-	copied = block_write_end(file, mapping, pos, len, copied, page, fsdata);</div><div class='add'>+	copied = block_write_end(pos, len, copied, folio);</div><div class='ctx'> 	/*</div><div class='del'>-	 * it's important to update i_size while still holding page lock:</div><div class='add'>+	 * it's important to update i_size while still holding folio lock:</div><div class='ctx'> 	 * page writeout could otherwise come in and zero beyond i_size.</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * If FS_IOC_ENABLE_VERITY is running on this inode, then Merkle tree</div><div class='hunk'>@@ -1301,15 +1460,17 @@ static int ext4_write_end(struct file *file,</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (!verity)</div><div class='ctx'> 		i_size_changed = ext4_update_inode_size(inode, pos + copied);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> </div><div class='del'>-	if (old_size &lt; pos &amp;&amp; !verity)</div><div class='add'>+	if (old_size &lt; pos &amp;&amp; !verity) {</div><div class='ctx'> 		pagecache_isize_extended(inode, old_size, pos);</div><div class='add'>+		ext4_zero_partial_blocks(handle, inode, old_size, pos - old_size);</div><div class='add'>+	}</div><div class='ctx'> 	/*</div><div class='del'>-	 * Don't mark the inode dirty under page lock. First, it unnecessarily</div><div class='del'>-	 * makes the holding time of page lock longer. Second, it forces lock</div><div class='del'>-	 * ordering of page lock and transaction start for journaling</div><div class='add'>+	 * Don't mark the inode dirty under folio lock. First, it unnecessarily</div><div class='add'>+	 * makes the holding time of folio lock longer. Second, it forces lock</div><div class='add'>+	 * ordering of folio lock and transaction start for journaling</div><div class='ctx'> 	 * filesystems.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (i_size_changed)</div><div class='hunk'>@@ -1341,33 +1502,33 @@ static int ext4_write_end(struct file *file,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * This is a private version of page_zero_new_buffers() which doesn't</div><div class='add'>+ * This is a private version of folio_zero_new_buffers() which doesn't</div><div class='ctx'>  * set the buffer to be dirty, since in data=journalled mode we need</div><div class='del'>- * to call ext4_handle_dirty_metadata() instead.</div><div class='add'>+ * to call ext4_dirty_journalled_data() instead.</div><div class='ctx'>  */</div><div class='ctx'> static void ext4_journalled_zero_new_buffers(handle_t *handle,</div><div class='ctx'> 					    struct inode *inode,</div><div class='del'>-					    struct page *page,</div><div class='add'>+					    struct folio *folio,</div><div class='ctx'> 					    unsigned from, unsigned to)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int block_start = 0, block_end;</div><div class='ctx'> 	struct buffer_head *head, *bh;</div><div class='ctx'> </div><div class='del'>-	bh = head = page_buffers(page);</div><div class='add'>+	bh = head = folio_buffers(folio);</div><div class='ctx'> 	do {</div><div class='ctx'> 		block_end = block_start + bh-&gt;b_size;</div><div class='ctx'> 		if (buffer_new(bh)) {</div><div class='ctx'> 			if (block_end &gt; from &amp;&amp; block_start &lt; to) {</div><div class='del'>-				if (!PageUptodate(page)) {</div><div class='add'>+				if (!folio_test_uptodate(folio)) {</div><div class='ctx'> 					unsigned start, size;</div><div class='ctx'> </div><div class='ctx'> 					start = max(from, block_start);</div><div class='ctx'> 					size = min(to, block_end) - start;</div><div class='ctx'> </div><div class='del'>-					zero_user(page, start, size);</div><div class='del'>-					write_end_fn(handle, inode, bh);</div><div class='add'>+					folio_zero_range(folio, start, size);</div><div class='ctx'> 				}</div><div class='ctx'> 				clear_buffer_new(bh);</div><div class='add'>+				write_end_fn(handle, inode, bh);</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 		block_start = block_end;</div><div class='hunk'>@@ -1375,10 +1536,10 @@ static void ext4_journalled_zero_new_buffers(handle_t *handle,</div><div class='ctx'> 	} while (bh != head);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext4_journalled_write_end(struct file *file,</div><div class='add'>+static int ext4_journalled_write_end(const struct kiocb *iocb,</div><div class='ctx'> 				     struct address_space *mapping,</div><div class='ctx'> 				     loff_t pos, unsigned len, unsigned copied,</div><div class='del'>-				     struct page *page, void *fsdata)</div><div class='add'>+				     struct folio *folio, void *fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	handle_t *handle = ext4_journal_current_handle();</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='hunk'>@@ -1396,30 +1557,34 @@ static int ext4_journalled_write_end(struct file *file,</div><div class='ctx'> 	BUG_ON(!ext4_handle_valid(handle));</div><div class='ctx'> </div><div class='ctx'> 	if (ext4_has_inline_data(inode))</div><div class='del'>-		return ext4_write_inline_data_end(inode, pos, len, copied, page);</div><div class='add'>+		return ext4_write_inline_data_end(inode, pos, len, copied,</div><div class='add'>+						  folio);</div><div class='ctx'> </div><div class='del'>-	if (unlikely(copied &lt; len) &amp;&amp; !PageUptodate(page)) {</div><div class='add'>+	if (unlikely(copied &lt; len) &amp;&amp; !folio_test_uptodate(folio)) {</div><div class='ctx'> 		copied = 0;</div><div class='del'>-		ext4_journalled_zero_new_buffers(handle, inode, page, from, to);</div><div class='add'>+		ext4_journalled_zero_new_buffers(handle, inode, folio,</div><div class='add'>+						 from, to);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		if (unlikely(copied &lt; len))</div><div class='del'>-			ext4_journalled_zero_new_buffers(handle, inode, page,</div><div class='add'>+			ext4_journalled_zero_new_buffers(handle, inode, folio,</div><div class='ctx'> 							 from + copied, to);</div><div class='del'>-		ret = ext4_walk_page_buffers(handle, inode, page_buffers(page),</div><div class='add'>+		ret = ext4_walk_page_buffers(handle, inode,</div><div class='add'>+					     folio_buffers(folio),</div><div class='ctx'> 					     from, from + copied, &amp;partial,</div><div class='ctx'> 					     write_end_fn);</div><div class='ctx'> 		if (!partial)</div><div class='del'>-			SetPageUptodate(page);</div><div class='add'>+			folio_mark_uptodate(folio);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!verity)</div><div class='ctx'> 		size_changed = ext4_update_inode_size(inode, pos + copied);</div><div class='del'>-	ext4_set_inode_state(inode, EXT4_STATE_JDATA);</div><div class='ctx'> 	EXT4_I(inode)-&gt;i_datasync_tid = handle-&gt;h_transaction-&gt;t_tid;</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> </div><div class='del'>-	if (old_size &lt; pos &amp;&amp; !verity)</div><div class='add'>+	if (old_size &lt; pos &amp;&amp; !verity) {</div><div class='ctx'> 		pagecache_isize_extended(inode, old_size, pos);</div><div class='add'>+		ext4_zero_partial_blocks(handle, inode, old_size, pos - old_size);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (size_changed) {</div><div class='ctx'> 		ret2 = ext4_mark_inode_dirty(handle, inode);</div><div class='hunk'>@@ -1452,9 +1617,9 @@ static int ext4_journalled_write_end(struct file *file,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Reserve space for a single cluster</div><div class='add'>+ * Reserve space for 'nr_resv' clusters</div><div class='ctx'>  */</div><div class='del'>-static int ext4_da_reserve_space(struct inode *inode)</div><div class='add'>+static int ext4_da_reserve_space(struct inode *inode, int nr_resv)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(inode-&gt;i_sb);</div><div class='ctx'> 	struct ext4_inode_info *ei = EXT4_I(inode);</div><div class='hunk'>@@ -1465,18 +1630,18 @@ static int ext4_da_reserve_space(struct inode *inode)</div><div class='ctx'> 	 * us from metadata over-estimation, though we may go over by</div><div class='ctx'> 	 * a small amount in the end.  Here we just reserve for data.</div><div class='ctx'> 	 */</div><div class='del'>-	ret = dquot_reserve_block(inode, EXT4_C2B(sbi, 1));</div><div class='add'>+	ret = dquot_reserve_block(inode, EXT4_C2B(sbi, nr_resv));</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;ei-&gt;i_block_reservation_lock);</div><div class='del'>-	if (ext4_claim_free_clusters(sbi, 1, 0)) {</div><div class='add'>+	if (ext4_claim_free_clusters(sbi, nr_resv, 0)) {</div><div class='ctx'> 		spin_unlock(&amp;ei-&gt;i_block_reservation_lock);</div><div class='del'>-		dquot_release_reservation_block(inode, EXT4_C2B(sbi, 1));</div><div class='add'>+		dquot_release_reservation_block(inode, EXT4_C2B(sbi, nr_resv));</div><div class='ctx'> 		return -ENOSPC;</div><div class='ctx'> 	}</div><div class='del'>-	ei-&gt;i_reserved_data_blocks++;</div><div class='del'>-	trace_ext4_da_reserve_space(inode);</div><div class='add'>+	ei-&gt;i_reserved_data_blocks += nr_resv;</div><div class='add'>+	trace_ext4_da_reserve_space(inode, nr_resv);</div><div class='ctx'> 	spin_unlock(&amp;ei-&gt;i_block_reservation_lock);</div><div class='ctx'> </div><div class='ctx'> 	return 0;       /* success */</div><div class='hunk'>@@ -1522,14 +1687,18 @@ void ext4_da_release_space(struct inode *inode, int to_free)</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> struct mpage_da_data {</div><div class='add'>+	/* These are input fields for ext4_do_writepages() */</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct writeback_control *wbc;</div><div class='add'>+	unsigned int can_map:1;	/* Can writepages call map blocks? */</div><div class='add'>+</div><div class='add'>+	/* These are internal state of ext4_do_writepages() */</div><div class='add'>+	loff_t start_pos;	/* The start pos to write */</div><div class='add'>+	loff_t next_pos;	/* Current pos to examine */</div><div class='add'>+	loff_t end_pos;		/* Last pos to examine */</div><div class='ctx'> </div><div class='del'>-	pgoff_t first_page;	/* The first page to write */</div><div class='del'>-	pgoff_t next_page;	/* Current page to examine */</div><div class='del'>-	pgoff_t last_page;	/* Last page to examine */</div><div class='ctx'> 	/*</div><div class='del'>-	 * Extent to map - this can be after first_page because that can be</div><div class='add'>+	 * Extent to map - this can be after start_pos because that can be</div><div class='ctx'> 	 * fully mapped. We somewhat abuse m_flags to store whether the extent</div><div class='ctx'> 	 * is delalloc or unwritten.</div><div class='ctx'> 	 */</div><div class='hunk'>@@ -1537,50 +1706,63 @@ struct mpage_da_data {</div><div class='ctx'> 	struct ext4_io_submit io_submit;	/* IO submission data */</div><div class='ctx'> 	unsigned int do_map:1;</div><div class='ctx'> 	unsigned int scanned_until_end:1;</div><div class='add'>+	unsigned int journalled_more_data:1;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static void mpage_release_unused_pages(struct mpage_da_data *mpd,</div><div class='ctx'> 				       bool invalidate)</div><div class='ctx'> {</div><div class='del'>-	int nr_pages, i;</div><div class='add'>+	unsigned nr, i;</div><div class='ctx'> 	pgoff_t index, end;</div><div class='del'>-	struct pagevec pvec;</div><div class='add'>+	struct folio_batch fbatch;</div><div class='ctx'> 	struct inode *inode = mpd-&gt;inode;</div><div class='ctx'> 	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='ctx'> </div><div class='del'>-	/* This is necessary when next_page == 0. */</div><div class='del'>-	if (mpd-&gt;first_page &gt;= mpd-&gt;next_page)</div><div class='add'>+	/* This is necessary when next_pos == 0. */</div><div class='add'>+	if (mpd-&gt;start_pos &gt;= mpd-&gt;next_pos)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	mpd-&gt;scanned_until_end = 0;</div><div class='del'>-	index = mpd-&gt;first_page;</div><div class='del'>-	end   = mpd-&gt;next_page - 1;</div><div class='ctx'> 	if (invalidate) {</div><div class='ctx'> 		ext4_lblk_t start, last;</div><div class='del'>-		start = index &lt;&lt; (PAGE_SHIFT - inode-&gt;i_blkbits);</div><div class='del'>-		last = end &lt;&lt; (PAGE_SHIFT - inode-&gt;i_blkbits);</div><div class='del'>-		ext4_es_remove_extent(inode, start, last - start + 1);</div><div class='add'>+		start = EXT4_B_TO_LBLK(inode, mpd-&gt;start_pos);</div><div class='add'>+		last = mpd-&gt;next_pos &gt;&gt; inode-&gt;i_blkbits;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * avoid racing with extent status tree scans made by</div><div class='add'>+		 * ext4_insert_delayed_block()</div><div class='add'>+		 */</div><div class='add'>+		down_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='add'>+		ext4_es_remove_extent(inode, start, last - start);</div><div class='add'>+		up_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	pagevec_init(&amp;pvec);</div><div class='del'>-	while (index &lt;= end) {</div><div class='del'>-		nr_pages = pagevec_lookup_range(&amp;pvec, mapping, &amp;index, end);</div><div class='del'>-		if (nr_pages == 0)</div><div class='add'>+	folio_batch_init(&amp;fbatch);</div><div class='add'>+	index = mpd-&gt;start_pos &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	end = mpd-&gt;next_pos &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	while (index &lt; end) {</div><div class='add'>+		nr = filemap_get_folios(mapping, &amp;index, end - 1, &amp;fbatch);</div><div class='add'>+		if (nr == 0)</div><div class='ctx'> 			break;</div><div class='del'>-		for (i = 0; i &lt; nr_pages; i++) {</div><div class='del'>-			struct page *page = pvec.pages[i];</div><div class='add'>+		for (i = 0; i &lt; nr; i++) {</div><div class='add'>+			struct folio *folio = fbatch.folios[i];</div><div class='ctx'> </div><div class='del'>-			BUG_ON(!PageLocked(page));</div><div class='del'>-			BUG_ON(PageWriteback(page));</div><div class='add'>+			if (folio_pos(folio) &lt; mpd-&gt;start_pos)</div><div class='add'>+				continue;</div><div class='add'>+			if (folio_next_index(folio) &gt; end)</div><div class='add'>+				continue;</div><div class='add'>+			BUG_ON(!folio_test_locked(folio));</div><div class='add'>+			BUG_ON(folio_test_writeback(folio));</div><div class='ctx'> 			if (invalidate) {</div><div class='del'>-				if (page_mapped(page))</div><div class='del'>-					clear_page_dirty_for_io(page);</div><div class='del'>-				block_invalidatepage(page, 0, PAGE_SIZE);</div><div class='del'>-				ClearPageUptodate(page);</div><div class='add'>+				if (folio_mapped(folio))</div><div class='add'>+					folio_clear_dirty_for_io(folio);</div><div class='add'>+				block_invalidate_folio(folio, 0,</div><div class='add'>+						folio_size(folio));</div><div class='add'>+				folio_clear_uptodate(folio);</div><div class='ctx'> 			}</div><div class='del'>-			unlock_page(page);</div><div class='add'>+			folio_unlock(folio);</div><div class='ctx'> 		}</div><div class='del'>-		pagevec_release(&amp;pvec);</div><div class='add'>+		folio_batch_release(&amp;fbatch);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1606,32 +1788,59 @@ static void ext4_print_free_blocks(struct inode *inode)</div><div class='ctx'> 	return;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext4_bh_delay_or_unwritten(handle_t *handle, struct inode *inode,</div><div class='del'>-				      struct buffer_head *bh)</div><div class='add'>+/*</div><div class='add'>+ * Check whether the cluster containing lblk has been allocated or has</div><div class='add'>+ * delalloc reservation.</div><div class='add'>+ *</div><div class='add'>+ * Returns 0 if the cluster doesn't have either, 1 if it has delalloc</div><div class='add'>+ * reservation, 2 if it's already been allocated, negative error code on</div><div class='add'>+ * failure.</div><div class='add'>+ */</div><div class='add'>+static int ext4_clu_alloc_state(struct inode *inode, ext4_lblk_t lblk)</div><div class='ctx'> {</div><div class='del'>-	return (buffer_delay(bh) || buffer_unwritten(bh)) &amp;&amp; buffer_dirty(bh);</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(inode-&gt;i_sb);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	/* Has delalloc reservation? */</div><div class='add'>+	if (ext4_es_scan_clu(inode, &amp;ext4_es_is_delayed, lblk))</div><div class='add'>+		return 1;</div><div class='add'>+</div><div class='add'>+	/* Already been allocated? */</div><div class='add'>+	if (ext4_es_scan_clu(inode, &amp;ext4_es_is_mapped, lblk))</div><div class='add'>+		return 2;</div><div class='add'>+	ret = ext4_clu_mapped(inode, EXT4_B2C(sbi, lblk));</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		return 2;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * ext4_insert_delayed_block - adds a delayed block to the extents status</div><div class='del'>- *                             tree, incrementing the reserved cluster/block</div><div class='del'>- *                             count or making a pending reservation</div><div class='del'>- *                             where needed</div><div class='add'>+ * ext4_insert_delayed_blocks - adds a multiple delayed blocks to the extents</div><div class='add'>+ *                              status tree, incrementing the reserved</div><div class='add'>+ *                              cluster/block count or making pending</div><div class='add'>+ *                              reservations where needed</div><div class='ctx'>  *</div><div class='ctx'>  * @inode - file containing the newly added block</div><div class='del'>- * @lblk - logical block to be added</div><div class='add'>+ * @lblk - start logical block to be added</div><div class='add'>+ * @len - length of blocks to be added</div><div class='ctx'>  *</div><div class='ctx'>  * Returns 0 on success, negative error code on failure.</div><div class='ctx'>  */</div><div class='del'>-static int ext4_insert_delayed_block(struct inode *inode, ext4_lblk_t lblk)</div><div class='add'>+static int ext4_insert_delayed_blocks(struct inode *inode, ext4_lblk_t lblk,</div><div class='add'>+				      ext4_lblk_t len)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(inode-&gt;i_sb);</div><div class='ctx'> 	int ret;</div><div class='del'>-	bool allocated = false;</div><div class='del'>-	bool reserved = false;</div><div class='add'>+	bool lclu_allocated = false;</div><div class='add'>+	bool end_allocated = false;</div><div class='add'>+	ext4_lblk_t resv_clu;</div><div class='add'>+	ext4_lblk_t end = lblk + len - 1;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * If the cluster containing lblk is shared with a delayed,</div><div class='add'>+	 * If the cluster containing lblk or end is shared with a delayed,</div><div class='ctx'> 	 * written, or unwritten extent in a bigalloc file system, it's</div><div class='ctx'> 	 * already been accounted for and does not need to be reserved.</div><div class='ctx'> 	 * A pending reservation must be made for the cluster if it's</div><div class='hunk'>@@ -1642,90 +1851,86 @@ static int ext4_insert_delayed_block(struct inode *inode, ext4_lblk_t lblk)</div><div class='ctx'> 	 * extents status tree doesn't get a match.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (sbi-&gt;s_cluster_ratio == 1) {</div><div class='del'>-		ret = ext4_da_reserve_space(inode);</div><div class='add'>+		ret = ext4_da_reserve_space(inode, len);</div><div class='ctx'> 		if (ret != 0)   /* ENOSPC */</div><div class='del'>-			goto errout;</div><div class='del'>-		reserved = true;</div><div class='add'>+			return ret;</div><div class='ctx'> 	} else {   /* bigalloc */</div><div class='del'>-		if (!ext4_es_scan_clu(inode, &amp;ext4_es_is_delonly, lblk)) {</div><div class='del'>-			if (!ext4_es_scan_clu(inode,</div><div class='del'>-					      &amp;ext4_es_is_mapped, lblk)) {</div><div class='del'>-				ret = ext4_clu_mapped(inode,</div><div class='del'>-						      EXT4_B2C(sbi, lblk));</div><div class='del'>-				if (ret &lt; 0)</div><div class='del'>-					goto errout;</div><div class='del'>-				if (ret == 0) {</div><div class='del'>-					ret = ext4_da_reserve_space(inode);</div><div class='del'>-					if (ret != 0)   /* ENOSPC */</div><div class='del'>-						goto errout;</div><div class='del'>-					reserved = true;</div><div class='del'>-				} else {</div><div class='del'>-					allocated = true;</div><div class='del'>-				}</div><div class='del'>-			} else {</div><div class='del'>-				allocated = true;</div><div class='add'>+		resv_clu = EXT4_B2C(sbi, end) - EXT4_B2C(sbi, lblk) + 1;</div><div class='add'>+</div><div class='add'>+		ret = ext4_clu_alloc_state(inode, lblk);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='add'>+		if (ret &gt; 0) {</div><div class='add'>+			resv_clu--;</div><div class='add'>+			lclu_allocated = (ret == 2);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (EXT4_B2C(sbi, lblk) != EXT4_B2C(sbi, end)) {</div><div class='add'>+			ret = ext4_clu_alloc_state(inode, end);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				return ret;</div><div class='add'>+			if (ret &gt; 0) {</div><div class='add'>+				resv_clu--;</div><div class='add'>+				end_allocated = (ret == 2);</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	ret = ext4_es_insert_delayed_block(inode, lblk, allocated);</div><div class='del'>-	if (ret &amp;&amp; reserved)</div><div class='del'>-		ext4_da_release_space(inode, 1);</div><div class='add'>+		if (resv_clu) {</div><div class='add'>+			ret = ext4_da_reserve_space(inode, resv_clu);</div><div class='add'>+			if (ret != 0)   /* ENOSPC */</div><div class='add'>+				return ret;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-errout:</div><div class='del'>-	return ret;</div><div class='add'>+	ext4_es_insert_delayed_extent(inode, lblk, len, lclu_allocated,</div><div class='add'>+				      end_allocated);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * This function is grabs code from the very beginning of</div><div class='del'>- * ext4_map_blocks, but assumes that the caller is from delayed write</div><div class='del'>- * time. This function looks up the requested blocks and sets the</div><div class='del'>- * buffer delay bit under the protection of i_data_sem.</div><div class='add'>+ * Looks up the requested blocks and sets the delalloc extent map.</div><div class='add'>+ * First try to look up for the extent entry that contains the requested</div><div class='add'>+ * blocks in the extent status tree without i_data_sem, then try to look</div><div class='add'>+ * up for the ondisk extent mapping with i_data_sem in read mode,</div><div class='add'>+ * finally hold i_data_sem in write mode, looks up again and add a</div><div class='add'>+ * delalloc extent entry if it still couldn't find any extent. Pass out</div><div class='add'>+ * the mapped extent through @map and return 0 on success.</div><div class='ctx'>  */</div><div class='del'>-static int ext4_da_map_blocks(struct inode *inode, sector_t iblock,</div><div class='del'>-			      struct ext4_map_blocks *map,</div><div class='del'>-			      struct buffer_head *bh)</div><div class='add'>+static int ext4_da_map_blocks(struct inode *inode, struct ext4_map_blocks *map)</div><div class='ctx'> {</div><div class='ctx'> 	struct extent_status es;</div><div class='ctx'> 	int retval;</div><div class='del'>-	sector_t invalid_block = ~((sector_t) 0xffff);</div><div class='ctx'> #ifdef ES_AGGRESSIVE_TEST</div><div class='ctx'> 	struct ext4_map_blocks orig_map;</div><div class='ctx'> </div><div class='ctx'> 	memcpy(&amp;orig_map, map, sizeof(*map));</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-	if (invalid_block &lt; ext4_blocks_count(EXT4_SB(inode-&gt;i_sb)-&gt;s_es))</div><div class='del'>-		invalid_block = ~0;</div><div class='del'>-</div><div class='ctx'> 	map-&gt;m_flags = 0;</div><div class='ctx'> 	ext_debug(inode, "max_blocks %u, logical block %lu\n", map-&gt;m_len,</div><div class='ctx'> 		  (unsigned long) map-&gt;m_lblk);</div><div class='ctx'> </div><div class='add'>+	ext4_check_map_extents_env(inode);</div><div class='add'>+</div><div class='ctx'> 	/* Lookup extent status tree firstly */</div><div class='del'>-	if (ext4_es_lookup_extent(inode, iblock, NULL, &amp;es)) {</div><div class='del'>-		if (ext4_es_is_hole(&amp;es)) {</div><div class='del'>-			retval = 0;</div><div class='del'>-			down_read(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='add'>+	if (ext4_es_lookup_extent(inode, map-&gt;m_lblk, NULL, &amp;es, NULL)) {</div><div class='add'>+		map-&gt;m_len = min_t(unsigned int, map-&gt;m_len,</div><div class='add'>+				   es.es_len - (map-&gt;m_lblk - es.es_lblk));</div><div class='add'>+</div><div class='add'>+		if (ext4_es_is_hole(&amp;es))</div><div class='ctx'> 			goto add_delayed;</div><div class='del'>-		}</div><div class='ctx'> </div><div class='add'>+found:</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Delayed extent could be allocated by fallocate.</div><div class='ctx'> 		 * So we need to check it.</div><div class='ctx'> 		 */</div><div class='del'>-		if (ext4_es_is_delayed(&amp;es) &amp;&amp; !ext4_es_is_unwritten(&amp;es)) {</div><div class='del'>-			map_bh(bh, inode-&gt;i_sb, invalid_block);</div><div class='del'>-			set_buffer_new(bh);</div><div class='del'>-			set_buffer_delay(bh);</div><div class='add'>+		if (ext4_es_is_delayed(&amp;es)) {</div><div class='add'>+			map-&gt;m_flags |= EXT4_MAP_DELAYED;</div><div class='ctx'> 			return 0;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		map-&gt;m_pblk = ext4_es_pblock(&amp;es) + iblock - es.es_lblk;</div><div class='del'>-		retval = es.es_len - (iblock - es.es_lblk);</div><div class='del'>-		if (retval &gt; map-&gt;m_len)</div><div class='del'>-			retval = map-&gt;m_len;</div><div class='del'>-		map-&gt;m_len = retval;</div><div class='add'>+		map-&gt;m_pblk = ext4_es_pblock(&amp;es) + map-&gt;m_lblk - es.es_lblk;</div><div class='ctx'> 		if (ext4_es_is_written(&amp;es))</div><div class='ctx'> 			map-&gt;m_flags |= EXT4_MAP_MAPPED;</div><div class='ctx'> 		else if (ext4_es_is_unwritten(&amp;es))</div><div class='hunk'>@@ -1736,7 +1941,7 @@ static int ext4_da_map_blocks(struct inode *inode, sector_t iblock,</div><div class='ctx'> #ifdef ES_AGGRESSIVE_TEST</div><div class='ctx'> 		ext4_map_blocks_es_recheck(NULL, inode, map, &amp;orig_map, 0);</div><div class='ctx'> #endif</div><div class='del'>-		return retval;</div><div class='add'>+		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1746,51 +1951,42 @@ static int ext4_da_map_blocks(struct inode *inode, sector_t iblock,</div><div class='ctx'> 	down_read(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='ctx'> 	if (ext4_has_inline_data(inode))</div><div class='ctx'> 		retval = 0;</div><div class='del'>-	else if (ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS))</div><div class='del'>-		retval = ext4_ext_map_blocks(NULL, inode, map, 0);</div><div class='ctx'> 	else</div><div class='del'>-		retval = ext4_ind_map_blocks(NULL, inode, map, 0);</div><div class='add'>+		retval = ext4_map_query_blocks(NULL, inode, map, 0);</div><div class='add'>+	up_read(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='add'>+	if (retval)</div><div class='add'>+		return retval &lt; 0 ? retval : 0;</div><div class='ctx'> </div><div class='ctx'> add_delayed:</div><div class='del'>-	if (retval == 0) {</div><div class='del'>-		int ret;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * XXX: __block_prepare_write() unmaps passed block,</div><div class='del'>-		 * is it OK?</div><div class='del'>-		 */</div><div class='add'>+	down_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='add'>+	/*</div><div class='add'>+	 * Page fault path (ext4_page_mkwrite does not take i_rwsem)</div><div class='add'>+	 * and fallocate path (no folio lock) can race. Make sure we</div><div class='add'>+	 * lookup the extent status tree here again while i_data_sem</div><div class='add'>+	 * is held in write mode, before inserting a new da entry in</div><div class='add'>+	 * the extent status tree.</div><div class='add'>+	 */</div><div class='add'>+	if (ext4_es_lookup_extent(inode, map-&gt;m_lblk, NULL, &amp;es, NULL)) {</div><div class='add'>+		map-&gt;m_len = min_t(unsigned int, map-&gt;m_len,</div><div class='add'>+				   es.es_len - (map-&gt;m_lblk - es.es_lblk));</div><div class='ctx'> </div><div class='del'>-		ret = ext4_insert_delayed_block(inode, map-&gt;m_lblk);</div><div class='del'>-		if (ret != 0) {</div><div class='del'>-			retval = ret;</div><div class='del'>-			goto out_unlock;</div><div class='add'>+		if (!ext4_es_is_hole(&amp;es)) {</div><div class='add'>+			up_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='add'>+			goto found;</div><div class='ctx'> 		}</div><div class='del'>-</div><div class='del'>-		map_bh(bh, inode-&gt;i_sb, invalid_block);</div><div class='del'>-		set_buffer_new(bh);</div><div class='del'>-		set_buffer_delay(bh);</div><div class='del'>-	} else if (retval &gt; 0) {</div><div class='del'>-		int ret;</div><div class='del'>-		unsigned int status;</div><div class='del'>-</div><div class='del'>-		if (unlikely(retval != map-&gt;m_len)) {</div><div class='del'>-			ext4_warning(inode-&gt;i_sb,</div><div class='del'>-				     "ES len assertion failed for inode "</div><div class='del'>-				     "%lu: retval %d != map-&gt;m_len %d",</div><div class='del'>-				     inode-&gt;i_ino, retval, map-&gt;m_len);</div><div class='del'>-			WARN_ON(1);</div><div class='add'>+	} else if (!ext4_has_inline_data(inode)) {</div><div class='add'>+		retval = ext4_map_query_blocks(NULL, inode, map, 0);</div><div class='add'>+		if (retval) {</div><div class='add'>+			up_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='add'>+			return retval &lt; 0 ? retval : 0;</div><div class='ctx'> 		}</div><div class='del'>-</div><div class='del'>-		status = map-&gt;m_flags &amp; EXT4_MAP_UNWRITTEN ?</div><div class='del'>-				EXTENT_STATUS_UNWRITTEN : EXTENT_STATUS_WRITTEN;</div><div class='del'>-		ret = ext4_es_insert_extent(inode, map-&gt;m_lblk, map-&gt;m_len,</div><div class='del'>-					    map-&gt;m_pblk, status);</div><div class='del'>-		if (ret != 0)</div><div class='del'>-			retval = ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-out_unlock:</div><div class='del'>-	up_read((&amp;EXT4_I(inode)-&gt;i_data_sem));</div><div class='add'>+	map-&gt;m_flags |= EXT4_MAP_DELAYED;</div><div class='add'>+	retval = ext4_insert_delayed_blocks(inode, map-&gt;m_lblk, map-&gt;m_len);</div><div class='add'>+	if (!retval)</div><div class='add'>+		map-&gt;m_seq = READ_ONCE(EXT4_I(inode)-&gt;i_es_seq);</div><div class='add'>+	up_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='ctx'> </div><div class='ctx'> 	return retval;</div><div class='ctx'> }</div><div class='hunk'>@@ -1811,11 +2007,15 @@ int ext4_da_get_block_prep(struct inode *inode, sector_t iblock,</div><div class='ctx'> 			   struct buffer_head *bh, int create)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_map_blocks map;</div><div class='add'>+	sector_t invalid_block = ~((sector_t) 0xffff);</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(create == 0);</div><div class='ctx'> 	BUG_ON(bh-&gt;b_size != inode-&gt;i_sb-&gt;s_blocksize);</div><div class='ctx'> </div><div class='add'>+	if (invalid_block &lt; ext4_blocks_count(EXT4_SB(inode-&gt;i_sb)-&gt;s_es))</div><div class='add'>+		invalid_block = ~0;</div><div class='add'>+</div><div class='ctx'> 	map.m_lblk = iblock;</div><div class='ctx'> 	map.m_len = 1;</div><div class='ctx'> </div><div class='hunk'>@@ -1824,10 +2024,17 @@ int ext4_da_get_block_prep(struct inode *inode, sector_t iblock,</div><div class='ctx'> 	 * preallocated blocks are unmapped but should treated</div><div class='ctx'> 	 * the same as allocated blocks.</div><div class='ctx'> 	 */</div><div class='del'>-	ret = ext4_da_map_blocks(inode, iblock, &amp;map, bh);</div><div class='del'>-	if (ret &lt;= 0)</div><div class='add'>+	ret = ext4_da_map_blocks(inode, &amp;map);</div><div class='add'>+	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='add'>+	if (map.m_flags &amp; EXT4_MAP_DELAYED) {</div><div class='add'>+		map_bh(bh, inode-&gt;i_sb, invalid_block);</div><div class='add'>+		set_buffer_new(bh);</div><div class='add'>+		set_buffer_delay(bh);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	map_bh(bh, inode-&gt;i_sb, map.m_pblk);</div><div class='ctx'> 	ext4_update_bh_state(bh, map.m_flags);</div><div class='ctx'> </div><div class='hunk'>@@ -1844,258 +2051,40 @@ int ext4_da_get_block_prep(struct inode *inode, sector_t iblock,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int bget_one(handle_t *handle, struct inode *inode,</div><div class='del'>-		    struct buffer_head *bh)</div><div class='add'>+static void mpage_folio_done(struct mpage_da_data *mpd, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	get_bh(bh);</div><div class='del'>-	return 0;</div><div class='add'>+	mpd-&gt;start_pos += folio_size(folio);</div><div class='add'>+	mpd-&gt;wbc-&gt;nr_to_write -= folio_nr_pages(folio);</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int bput_one(handle_t *handle, struct inode *inode,</div><div class='del'>-		    struct buffer_head *bh)</div><div class='add'>+static int mpage_submit_folio(struct mpage_da_data *mpd, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	put_bh(bh);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int __ext4_journalled_writepage(struct page *page,</div><div class='del'>-				       unsigned int len)</div><div class='del'>-{</div><div class='del'>-	struct address_space *mapping = page-&gt;mapping;</div><div class='del'>-	struct inode *inode = mapping-&gt;host;</div><div class='del'>-	struct buffer_head *page_bufs = NULL;</div><div class='del'>-	handle_t *handle = NULL;</div><div class='del'>-	int ret = 0, err = 0;</div><div class='del'>-	int inline_data = ext4_has_inline_data(inode);</div><div class='del'>-	struct buffer_head *inode_bh = NULL;</div><div class='del'>-</div><div class='del'>-	ClearPageChecked(page);</div><div class='del'>-</div><div class='del'>-	if (inline_data) {</div><div class='del'>-		BUG_ON(page-&gt;index != 0);</div><div class='del'>-		BUG_ON(len &gt; ext4_get_max_inline_size(inode));</div><div class='del'>-		inode_bh = ext4_journalled_write_inline_data(inode, len, page);</div><div class='del'>-		if (inode_bh == NULL)</div><div class='del'>-			goto out;</div><div class='del'>-	} else {</div><div class='del'>-		page_bufs = page_buffers(page);</div><div class='del'>-		if (!page_bufs) {</div><div class='del'>-			BUG();</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		ext4_walk_page_buffers(handle, inode, page_bufs, 0, len,</div><div class='del'>-				       NULL, bget_one);</div><div class='del'>-	}</div><div class='del'>-	/*</div><div class='del'>-	 * We need to release the page lock before we start the</div><div class='del'>-	 * journal, so grab a reference so the page won't disappear</div><div class='del'>-	 * out from under us.</div><div class='del'>-	 */</div><div class='del'>-	get_page(page);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-</div><div class='del'>-	handle = ext4_journal_start(inode, EXT4_HT_WRITE_PAGE,</div><div class='del'>-				    ext4_writepage_trans_blocks(inode));</div><div class='del'>-	if (IS_ERR(handle)) {</div><div class='del'>-		ret = PTR_ERR(handle);</div><div class='del'>-		put_page(page);</div><div class='del'>-		goto out_no_pagelock;</div><div class='del'>-	}</div><div class='del'>-	BUG_ON(!ext4_handle_valid(handle));</div><div class='del'>-</div><div class='del'>-	lock_page(page);</div><div class='del'>-	put_page(page);</div><div class='del'>-	if (page-&gt;mapping != mapping) {</div><div class='del'>-		/* The page got truncated from under us */</div><div class='del'>-		ext4_journal_stop(handle);</div><div class='del'>-		ret = 0;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (inline_data) {</div><div class='del'>-		ret = ext4_mark_inode_dirty(handle, inode);</div><div class='del'>-	} else {</div><div class='del'>-		ret = ext4_walk_page_buffers(handle, inode, page_bufs, 0, len,</div><div class='del'>-					     NULL, do_journal_get_write_access);</div><div class='del'>-</div><div class='del'>-		err = ext4_walk_page_buffers(handle, inode, page_bufs, 0, len,</div><div class='del'>-					     NULL, write_end_fn);</div><div class='del'>-	}</div><div class='del'>-	if (ret == 0)</div><div class='del'>-		ret = err;</div><div class='del'>-	err = ext4_jbd2_inode_add_write(handle, inode, page_offset(page), len);</div><div class='del'>-	if (ret == 0)</div><div class='del'>-		ret = err;</div><div class='del'>-	EXT4_I(inode)-&gt;i_datasync_tid = handle-&gt;h_transaction-&gt;t_tid;</div><div class='del'>-	err = ext4_journal_stop(handle);</div><div class='del'>-	if (!ret)</div><div class='del'>-		ret = err;</div><div class='del'>-</div><div class='del'>-	ext4_set_inode_state(inode, EXT4_STATE_JDATA);</div><div class='del'>-out:</div><div class='del'>-	unlock_page(page);</div><div class='del'>-out_no_pagelock:</div><div class='del'>-	if (!inline_data &amp;&amp; page_bufs)</div><div class='del'>-		ext4_walk_page_buffers(NULL, inode, page_bufs, 0, len,</div><div class='del'>-				       NULL, bput_one);</div><div class='del'>-	brelse(inode_bh);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Note that we don't need to start a transaction unless we're journaling data</div><div class='del'>- * because we should have holes filled from ext4_page_mkwrite(). We even don't</div><div class='del'>- * need to file the inode to the transaction's list in ordered mode because if</div><div class='del'>- * we are writing back data added by write(), the inode is already there and if</div><div class='del'>- * we are writing back data modified via mmap(), no one guarantees in which</div><div class='del'>- * transaction the data will hit the disk. In case we are journaling data, we</div><div class='del'>- * cannot start transaction directly because transaction start ranks above page</div><div class='del'>- * lock so we have to do some magic.</div><div class='del'>- *</div><div class='del'>- * This function can get called via...</div><div class='del'>- *   - ext4_writepages after taking page lock (have journal handle)</div><div class='del'>- *   - journal_submit_inode_data_buffers (no journal handle)</div><div class='del'>- *   - shrink_page_list via the kswapd/direct reclaim (no journal handle)</div><div class='del'>- *   - grab_page_cache when doing write_begin (have journal handle)</div><div class='del'>- *</div><div class='del'>- * We don't do any block allocation in this function. If we have page with</div><div class='del'>- * multiple blocks we need to write those buffer_heads that are mapped. This</div><div class='del'>- * is important for mmaped based write. So if we do with blocksize 1K</div><div class='del'>- * truncate(f, 1024);</div><div class='del'>- * a = mmap(f, 0, 4096);</div><div class='del'>- * a[0] = 'a';</div><div class='del'>- * truncate(f, 4096);</div><div class='del'>- * we have in the page first buffer_head mapped via page_mkwrite call back</div><div class='del'>- * but other buffer_heads would be unmapped but dirty (dirty done via the</div><div class='del'>- * do_wp_page). So writepage should write the first block. If we modify</div><div class='del'>- * the mmap area beyond 1024 we will again get a page_fault and the</div><div class='del'>- * page_mkwrite callback will do the block allocation and mark the</div><div class='del'>- * buffer_heads mapped.</div><div class='del'>- *</div><div class='del'>- * We redirty the page if we have any buffer_heads that is either delay or</div><div class='del'>- * unwritten in the page.</div><div class='del'>- *</div><div class='del'>- * We can get recursively called as show below.</div><div class='del'>- *</div><div class='del'>- *	ext4_writepage() -&gt; kmalloc() -&gt; __alloc_pages() -&gt; page_launder() -&gt;</div><div class='del'>- *		ext4_writepage()</div><div class='del'>- *</div><div class='del'>- * But since we don't do any block allocation we should not deadlock.</div><div class='del'>- * Page also have the dirty flag cleared so we don't get recurive page_lock.</div><div class='del'>- */</div><div class='del'>-static int ext4_writepage(struct page *page,</div><div class='del'>-			  struct writeback_control *wbc)</div><div class='del'>-{</div><div class='del'>-	int ret = 0;</div><div class='del'>-	loff_t size;</div><div class='del'>-	unsigned int len;</div><div class='del'>-	struct buffer_head *page_bufs = NULL;</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-	struct ext4_io_submit io_submit;</div><div class='del'>-	bool keep_towrite = false;</div><div class='del'>-</div><div class='del'>-	if (unlikely(ext4_forced_shutdown(EXT4_SB(inode-&gt;i_sb)))) {</div><div class='del'>-		inode-&gt;i_mapping-&gt;a_ops-&gt;invalidatepage(page, 0, PAGE_SIZE);</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		return -EIO;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	trace_ext4_writepage(page);</div><div class='del'>-	size = i_size_read(inode);</div><div class='del'>-	if (page-&gt;index == size &gt;&gt; PAGE_SHIFT &amp;&amp;</div><div class='del'>-	    !ext4_verity_in_progress(inode))</div><div class='del'>-		len = size &amp; ~PAGE_MASK;</div><div class='del'>-	else</div><div class='del'>-		len = PAGE_SIZE;</div><div class='del'>-</div><div class='del'>-	page_bufs = page_buffers(page);</div><div class='del'>-	/*</div><div class='del'>-	 * We cannot do block allocation or other extent handling in this</div><div class='del'>-	 * function. If there are buffers needing that, we have to redirty</div><div class='del'>-	 * the page. But we may reach here when we do a journal commit via</div><div class='del'>-	 * journal_submit_inode_data_buffers() and in that case we must write</div><div class='del'>-	 * allocated buffers to achieve data=ordered mode guarantees.</div><div class='del'>-	 *</div><div class='del'>-	 * Also, if there is only one buffer per page (the fs block</div><div class='del'>-	 * size == the page size), if one buffer needs block</div><div class='del'>-	 * allocation or needs to modify the extent tree to clear the</div><div class='del'>-	 * unwritten flag, we know that the page can't be written at</div><div class='del'>-	 * all, so we might as well refuse the write immediately.</div><div class='del'>-	 * Unfortunately if the block size != page size, we can't as</div><div class='del'>-	 * easily detect this case using ext4_walk_page_buffers(), but</div><div class='del'>-	 * for the extremely common case, this is an optimization that</div><div class='del'>-	 * skips a useless round trip through ext4_bio_write_page().</div><div class='del'>-	 */</div><div class='del'>-	if (ext4_walk_page_buffers(NULL, inode, page_bufs, 0, len, NULL,</div><div class='del'>-				   ext4_bh_delay_or_unwritten)) {</div><div class='del'>-		redirty_page_for_writepage(wbc, page);</div><div class='del'>-		if ((current-&gt;flags &amp; PF_MEMALLOC) ||</div><div class='del'>-		    (inode-&gt;i_sb-&gt;s_blocksize == PAGE_SIZE)) {</div><div class='del'>-			/*</div><div class='del'>-			 * For memory cleaning there's no point in writing only</div><div class='del'>-			 * some buffers. So just bail out. Warn if we came here</div><div class='del'>-			 * from direct reclaim.</div><div class='del'>-			 */</div><div class='del'>-			WARN_ON_ONCE((current-&gt;flags &amp; (PF_MEMALLOC|PF_KSWAPD))</div><div class='del'>-							== PF_MEMALLOC);</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			return 0;</div><div class='del'>-		}</div><div class='del'>-		keep_towrite = true;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (PageChecked(page) &amp;&amp; ext4_should_journal_data(inode))</div><div class='del'>-		/*</div><div class='del'>-		 * It's mmapped pagecache.  Add buffers and journal it.  There</div><div class='del'>-		 * doesn't seem much point in redirtying the page here.</div><div class='del'>-		 */</div><div class='del'>-		return __ext4_journalled_writepage(page, len);</div><div class='del'>-</div><div class='del'>-	ext4_io_submit_init(&amp;io_submit, wbc);</div><div class='del'>-	io_submit.io_end = ext4_init_io_end(inode, GFP_NOFS);</div><div class='del'>-	if (!io_submit.io_end) {</div><div class='del'>-		redirty_page_for_writepage(wbc, page);</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	}</div><div class='del'>-	ret = ext4_bio_write_page(&amp;io_submit, page, len, keep_towrite);</div><div class='del'>-	ext4_io_submit(&amp;io_submit);</div><div class='del'>-	/* Drop io_end reference we got from init */</div><div class='del'>-	ext4_put_io_end_defer(io_submit.io_end);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int mpage_submit_page(struct mpage_da_data *mpd, struct page *page)</div><div class='del'>-{</div><div class='del'>-	int len;</div><div class='add'>+	size_t len;</div><div class='ctx'> 	loff_t size;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(page-&gt;index != mpd-&gt;first_page);</div><div class='del'>-	clear_page_dirty_for_io(page);</div><div class='add'>+	WARN_ON_ONCE(folio_pos(folio) != mpd-&gt;start_pos);</div><div class='add'>+	folio_clear_dirty_for_io(folio);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We have to be very careful here!  Nothing protects writeback path</div><div class='ctx'> 	 * against i_size changes and the page can be writeably mapped into</div><div class='ctx'> 	 * page tables. So an application can be growing i_size and writing</div><div class='del'>-	 * data through mmap while writeback runs. clear_page_dirty_for_io()</div><div class='add'>+	 * data through mmap while writeback runs. folio_clear_dirty_for_io()</div><div class='ctx'> 	 * write-protects our page in page tables and the page cannot get</div><div class='del'>-	 * written to again until we release page lock. So only after</div><div class='del'>-	 * clear_page_dirty_for_io() we are safe to sample i_size for</div><div class='del'>-	 * ext4_bio_write_page() to zero-out tail of the written page. We rely</div><div class='del'>-	 * on the barrier provided by TestClearPageDirty in</div><div class='del'>-	 * clear_page_dirty_for_io() to make sure i_size is really sampled only</div><div class='add'>+	 * written to again until we release folio lock. So only after</div><div class='add'>+	 * folio_clear_dirty_for_io() we are safe to sample i_size for</div><div class='add'>+	 * ext4_bio_write_folio() to zero-out tail of the written page. We rely</div><div class='add'>+	 * on the barrier provided by folio_test_clear_dirty() in</div><div class='add'>+	 * folio_clear_dirty_for_io() to make sure i_size is really sampled only</div><div class='ctx'> 	 * after page tables are updated.</div><div class='ctx'> 	 */</div><div class='ctx'> 	size = i_size_read(mpd-&gt;inode);</div><div class='del'>-	if (page-&gt;index == size &gt;&gt; PAGE_SHIFT &amp;&amp;</div><div class='add'>+	len = folio_size(folio);</div><div class='add'>+	if (folio_pos(folio) + len &gt; size &amp;&amp;</div><div class='ctx'> 	    !ext4_verity_in_progress(mpd-&gt;inode))</div><div class='del'>-		len = size &amp; ~PAGE_MASK;</div><div class='del'>-	else</div><div class='del'>-		len = PAGE_SIZE;</div><div class='del'>-	err = ext4_bio_write_page(&amp;mpd-&gt;io_submit, page, len, false);</div><div class='del'>-	if (!err)</div><div class='del'>-		mpd-&gt;wbc-&gt;nr_to_write--;</div><div class='del'>-	mpd-&gt;first_page++;</div><div class='add'>+		len = size &amp; (len - 1);</div><div class='add'>+	err = ext4_bio_write_folio(&amp;mpd-&gt;io_submit, folio, len);</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='hunk'>@@ -2206,9 +2195,10 @@ static int mpage_process_page_bufs(struct mpage_da_data *mpd,</div><div class='ctx'> 	} while (lblk++, (bh = bh-&gt;b_this_page) != head);</div><div class='ctx'> 	/* So far everything mapped? Submit the page for IO. */</div><div class='ctx'> 	if (mpd-&gt;map.m_len == 0) {</div><div class='del'>-		err = mpage_submit_page(mpd, head-&gt;b_page);</div><div class='add'>+		err = mpage_submit_folio(mpd, head-&gt;b_folio);</div><div class='ctx'> 		if (err &lt; 0)</div><div class='ctx'> 			return err;</div><div class='add'>+		mpage_folio_done(mpd, head-&gt;b_folio);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (lblk &gt;= blocks) {</div><div class='ctx'> 		mpd-&gt;scanned_until_end = 1;</div><div class='hunk'>@@ -2218,21 +2208,22 @@ static int mpage_process_page_bufs(struct mpage_da_data *mpd,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * mpage_process_page - update page buffers corresponding to changed extent and</div><div class='del'>- *		       may submit fully mapped page for IO</div><div class='del'>- *</div><div class='del'>- * @mpd		- description of extent to map, on return next extent to map</div><div class='del'>- * @m_lblk	- logical block mapping.</div><div class='del'>- * @m_pblk	- corresponding physical mapping.</div><div class='del'>- * @map_bh	- determines on return whether this page requires any further</div><div class='add'>+ * mpage_process_folio - update folio buffers corresponding to changed extent</div><div class='add'>+ *			 and may submit fully mapped page for IO</div><div class='add'>+ * @mpd: description of extent to map, on return next extent to map</div><div class='add'>+ * @folio: Contains these buffers.</div><div class='add'>+ * @m_lblk: logical block mapping.</div><div class='add'>+ * @m_pblk: corresponding physical mapping.</div><div class='add'>+ * @map_bh: determines on return whether this page requires any further</div><div class='ctx'>  *		  mapping or not.</div><div class='del'>- * Scan given page buffers corresponding to changed extent and update buffer</div><div class='add'>+ *</div><div class='add'>+ * Scan given folio buffers corresponding to changed extent and update buffer</div><div class='ctx'>  * state according to new extent state.</div><div class='ctx'>  * We map delalloc buffers to their physical location, clear unwritten bits.</div><div class='del'>- * If the given page is not fully mapped, we update @map to the next extent in</div><div class='del'>- * the given page that needs mapping &amp; return @map_bh as true.</div><div class='add'>+ * If the given folio is not fully mapped, we update @mpd to the next extent in</div><div class='add'>+ * the given folio that needs mapping &amp; return @map_bh as true.</div><div class='ctx'>  */</div><div class='del'>-static int mpage_process_page(struct mpage_da_data *mpd, struct page *page,</div><div class='add'>+static int mpage_process_folio(struct mpage_da_data *mpd, struct folio *folio,</div><div class='ctx'> 			      ext4_lblk_t *m_lblk, ext4_fsblk_t *m_pblk,</div><div class='ctx'> 			      bool *map_bh)</div><div class='ctx'> {</div><div class='hunk'>@@ -2241,23 +2232,21 @@ static int mpage_process_page(struct mpage_da_data *mpd, struct page *page,</div><div class='ctx'> 	ext4_lblk_t lblk = *m_lblk;</div><div class='ctx'> 	ext4_fsblk_t pblock = *m_pblk;</div><div class='ctx'> 	int err = 0;</div><div class='del'>-	int blkbits = mpd-&gt;inode-&gt;i_blkbits;</div><div class='ctx'> 	ssize_t io_end_size = 0;</div><div class='ctx'> 	struct ext4_io_end_vec *io_end_vec = ext4_last_io_end_vec(io_end);</div><div class='ctx'> </div><div class='del'>-	bh = head = page_buffers(page);</div><div class='add'>+	bh = head = folio_buffers(folio);</div><div class='ctx'> 	do {</div><div class='ctx'> 		if (lblk &lt; mpd-&gt;map.m_lblk)</div><div class='ctx'> 			continue;</div><div class='ctx'> 		if (lblk &gt;= mpd-&gt;map.m_lblk + mpd-&gt;map.m_len) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Buffer after end of mapped extent.</div><div class='del'>-			 * Find next buffer in the page to map.</div><div class='add'>+			 * Find next buffer in the folio to map.</div><div class='ctx'> 			 */</div><div class='ctx'> 			mpd-&gt;map.m_len = 0;</div><div class='ctx'> 			mpd-&gt;map.m_flags = 0;</div><div class='ctx'> 			io_end_vec-&gt;size += io_end_size;</div><div class='del'>-			io_end_size = 0;</div><div class='ctx'> </div><div class='ctx'> 			err = mpage_process_page_bufs(mpd, head, bh, lblk);</div><div class='ctx'> 			if (err &gt; 0)</div><div class='hunk'>@@ -2268,7 +2257,8 @@ static int mpage_process_page(struct mpage_da_data *mpd, struct page *page,</div><div class='ctx'> 					err = PTR_ERR(io_end_vec);</div><div class='ctx'> 					goto out;</div><div class='ctx'> 				}</div><div class='del'>-				io_end_vec-&gt;offset = (loff_t)mpd-&gt;map.m_lblk &lt;&lt; blkbits;</div><div class='add'>+				io_end_vec-&gt;offset = EXT4_LBLK_TO_B(mpd-&gt;inode,</div><div class='add'>+								mpd-&gt;map.m_lblk);</div><div class='ctx'> 			}</div><div class='ctx'> 			*map_bh = true;</div><div class='ctx'> 			goto out;</div><div class='hunk'>@@ -2278,11 +2268,10 @@ static int mpage_process_page(struct mpage_da_data *mpd, struct page *page,</div><div class='ctx'> 			bh-&gt;b_blocknr = pblock++;</div><div class='ctx'> 		}</div><div class='ctx'> 		clear_buffer_unwritten(bh);</div><div class='del'>-		io_end_size += (1 &lt;&lt; blkbits);</div><div class='add'>+		io_end_size += i_blocksize(mpd-&gt;inode);</div><div class='ctx'> 	} while (lblk++, (bh = bh-&gt;b_this_page) != head);</div><div class='ctx'> </div><div class='ctx'> 	io_end_vec-&gt;size += io_end_size;</div><div class='del'>-	io_end_size = 0;</div><div class='ctx'> 	*map_bh = false;</div><div class='ctx'> out:</div><div class='ctx'> 	*m_lblk = lblk;</div><div class='hunk'>@@ -2306,31 +2295,29 @@ out:</div><div class='ctx'>  */</div><div class='ctx'> static int mpage_map_and_submit_buffers(struct mpage_da_data *mpd)</div><div class='ctx'> {</div><div class='del'>-	struct pagevec pvec;</div><div class='del'>-	int nr_pages, i;</div><div class='add'>+	struct folio_batch fbatch;</div><div class='add'>+	unsigned nr, i;</div><div class='ctx'> 	struct inode *inode = mpd-&gt;inode;</div><div class='del'>-	int bpp_bits = PAGE_SHIFT - inode-&gt;i_blkbits;</div><div class='ctx'> 	pgoff_t start, end;</div><div class='ctx'> 	ext4_lblk_t lblk;</div><div class='ctx'> 	ext4_fsblk_t pblock;</div><div class='ctx'> 	int err;</div><div class='ctx'> 	bool map_bh = false;</div><div class='ctx'> </div><div class='del'>-	start = mpd-&gt;map.m_lblk &gt;&gt; bpp_bits;</div><div class='del'>-	end = (mpd-&gt;map.m_lblk + mpd-&gt;map.m_len - 1) &gt;&gt; bpp_bits;</div><div class='del'>-	lblk = start &lt;&lt; bpp_bits;</div><div class='add'>+	start = EXT4_LBLK_TO_PG(inode, mpd-&gt;map.m_lblk);</div><div class='add'>+	end = EXT4_LBLK_TO_PG(inode, mpd-&gt;map.m_lblk + mpd-&gt;map.m_len - 1);</div><div class='ctx'> 	pblock = mpd-&gt;map.m_pblk;</div><div class='ctx'> </div><div class='del'>-	pagevec_init(&amp;pvec);</div><div class='add'>+	folio_batch_init(&amp;fbatch);</div><div class='ctx'> 	while (start &lt;= end) {</div><div class='del'>-		nr_pages = pagevec_lookup_range(&amp;pvec, inode-&gt;i_mapping,</div><div class='del'>-						&amp;start, end);</div><div class='del'>-		if (nr_pages == 0)</div><div class='add'>+		nr = filemap_get_folios(inode-&gt;i_mapping, &amp;start, end, &amp;fbatch);</div><div class='add'>+		if (nr == 0)</div><div class='ctx'> 			break;</div><div class='del'>-		for (i = 0; i &lt; nr_pages; i++) {</div><div class='del'>-			struct page *page = pvec.pages[i];</div><div class='add'>+		for (i = 0; i &lt; nr; i++) {</div><div class='add'>+			struct folio *folio = fbatch.folios[i];</div><div class='ctx'> </div><div class='del'>-			err = mpage_process_page(mpd, page, &amp;lblk, &amp;pblock,</div><div class='add'>+			lblk = EXT4_PG_TO_LBLK(inode, folio-&gt;index);</div><div class='add'>+			err = mpage_process_folio(mpd, folio, &amp;lblk, &amp;pblock,</div><div class='ctx'> 						 &amp;map_bh);</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * If map_bh is true, means page may require further bh</div><div class='hunk'>@@ -2340,18 +2327,19 @@ static int mpage_map_and_submit_buffers(struct mpage_da_data *mpd)</div><div class='ctx'> 			if (err &lt; 0 || map_bh)</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			/* Page fully mapped - let IO run! */</div><div class='del'>-			err = mpage_submit_page(mpd, page);</div><div class='add'>+			err = mpage_submit_folio(mpd, folio);</div><div class='ctx'> 			if (err &lt; 0)</div><div class='ctx'> 				goto out;</div><div class='add'>+			mpage_folio_done(mpd, folio);</div><div class='ctx'> 		}</div><div class='del'>-		pagevec_release(&amp;pvec);</div><div class='add'>+		folio_batch_release(&amp;fbatch);</div><div class='ctx'> 	}</div><div class='ctx'> 	/* Extent fully mapped and matches with page boundary. We are done. */</div><div class='ctx'> 	mpd-&gt;map.m_len = 0;</div><div class='ctx'> 	mpd-&gt;map.m_flags = 0;</div><div class='ctx'> 	return 0;</div><div class='ctx'> out:</div><div class='del'>-	pagevec_release(&amp;pvec);</div><div class='add'>+	folio_batch_release(&amp;fbatch);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2362,6 +2350,11 @@ static int mpage_map_one_extent(handle_t *handle, struct mpage_da_data *mpd)</div><div class='ctx'> 	int get_blocks_flags;</div><div class='ctx'> 	int err, dioread_nolock;</div><div class='ctx'> </div><div class='add'>+	/* Make sure transaction has enough credits for this extent */</div><div class='add'>+	err = ext4_journal_ensure_extent_credits(handle, inode);</div><div class='add'>+	if (err &lt; 0)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='ctx'> 	trace_ext4_da_write_pages_extent(inode, map);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Call ext4_map_blocks() to allocate any delayed allocation blocks, or</div><div class='hunk'>@@ -2371,21 +2364,18 @@ static int mpage_map_one_extent(handle_t *handle, struct mpage_da_data *mpd)</div><div class='ctx'> 	 * previously reserved. However we must not fail because we're in</div><div class='ctx'> 	 * writeback and there is nothing we can do about it so it might result</div><div class='ctx'> 	 * in data loss.  So use reserved blocks to allocate metadata if</div><div class='del'>-	 * possible.</div><div class='del'>-	 *</div><div class='del'>-	 * We pass in the magic EXT4_GET_BLOCKS_DELALLOC_RESERVE if</div><div class='del'>-	 * the blocks in question are delalloc blocks.  This indicates</div><div class='del'>-	 * that the blocks and quotas has already been checked when</div><div class='del'>-	 * the data was copied into the page cache.</div><div class='add'>+	 * possible. In addition, do not cache any unrelated extents, as it</div><div class='add'>+	 * only holds the folio lock but does not hold the i_rwsem or</div><div class='add'>+	 * invalidate_lock, which could corrupt the extent status tree.</div><div class='ctx'> 	 */</div><div class='ctx'> 	get_blocks_flags = EXT4_GET_BLOCKS_CREATE |</div><div class='ctx'> 			   EXT4_GET_BLOCKS_METADATA_NOFAIL |</div><div class='del'>-			   EXT4_GET_BLOCKS_IO_SUBMIT;</div><div class='add'>+			   EXT4_GET_BLOCKS_IO_SUBMIT |</div><div class='add'>+			   EXT4_EX_NOCACHE;</div><div class='add'>+</div><div class='ctx'> 	dioread_nolock = ext4_should_dioread_nolock(inode);</div><div class='ctx'> 	if (dioread_nolock)</div><div class='ctx'> 		get_blocks_flags |= EXT4_GET_BLOCKS_IO_CREATE_EXT;</div><div class='del'>-	if (map-&gt;m_flags &amp; BIT(BH_Delay))</div><div class='del'>-		get_blocks_flags |= EXT4_GET_BLOCKS_DELALLOC_RESERVE;</div><div class='ctx'> </div><div class='ctx'> 	err = ext4_map_blocks(handle, inode, map, get_blocks_flags);</div><div class='ctx'> 	if (err &lt; 0)</div><div class='hunk'>@@ -2396,7 +2386,7 @@ static int mpage_map_one_extent(handle_t *handle, struct mpage_da_data *mpd)</div><div class='ctx'> 			mpd-&gt;io_submit.io_end-&gt;handle = handle-&gt;h_rsv_handle;</div><div class='ctx'> 			handle-&gt;h_rsv_handle = NULL;</div><div class='ctx'> 		}</div><div class='del'>-		ext4_set_io_unwritten_flag(inode, mpd-&gt;io_submit.io_end);</div><div class='add'>+		ext4_set_io_unwritten_flag(mpd-&gt;io_submit.io_end);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(map-&gt;m_len == 0);</div><div class='hunk'>@@ -2404,6 +2394,47 @@ static int mpage_map_one_extent(handle_t *handle, struct mpage_da_data *mpd)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * This is used to submit mapped buffers in a single folio that is not fully</div><div class='add'>+ * mapped for various reasons, such as insufficient space or journal credits.</div><div class='add'>+ */</div><div class='add'>+static int mpage_submit_partial_folio(struct mpage_da_data *mpd)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = mpd-&gt;inode;</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	loff_t pos;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	folio = filemap_get_folio(inode-&gt;i_mapping,</div><div class='add'>+				  mpd-&gt;start_pos &gt;&gt; PAGE_SHIFT);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio);</div><div class='add'>+	/*</div><div class='add'>+	 * The mapped position should be within the current processing folio</div><div class='add'>+	 * but must not be the folio start position.</div><div class='add'>+	 */</div><div class='add'>+	pos = ((loff_t)mpd-&gt;map.m_lblk) &lt;&lt; inode-&gt;i_blkbits;</div><div class='add'>+	if (WARN_ON_ONCE((folio_pos(folio) == pos) ||</div><div class='add'>+			 !folio_contains(folio, pos &gt;&gt; PAGE_SHIFT)))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	ret = mpage_submit_folio(mpd, folio);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+	/*</div><div class='add'>+	 * Update start_pos to prevent this folio from being released in</div><div class='add'>+	 * mpage_release_unused_pages(), it will be reset to the aligned folio</div><div class='add'>+	 * pos when this folio is written again in the next round. Additionally,</div><div class='add'>+	 * do not update wbc-&gt;nr_to_write here, as it will be updated once the</div><div class='add'>+	 * entire folio has finished processing.</div><div class='add'>+	 */</div><div class='add'>+	mpd-&gt;start_pos = pos;</div><div class='add'>+out:</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * mpage_map_and_submit_extent - map extent starting at mpd-&gt;lblk of length</div><div class='ctx'>  *				 mpd-&gt;len and submit pages underlying it for IO</div><div class='ctx'>  *</div><div class='hunk'>@@ -2438,24 +2469,31 @@ static int mpage_map_and_submit_extent(handle_t *handle,</div><div class='ctx'> 	io_end_vec = ext4_alloc_io_end_vec(io_end);</div><div class='ctx'> 	if (IS_ERR(io_end_vec))</div><div class='ctx'> 		return PTR_ERR(io_end_vec);</div><div class='del'>-	io_end_vec-&gt;offset = ((loff_t)map-&gt;m_lblk) &lt;&lt; inode-&gt;i_blkbits;</div><div class='add'>+	io_end_vec-&gt;offset = EXT4_LBLK_TO_B(inode, map-&gt;m_lblk);</div><div class='ctx'> 	do {</div><div class='ctx'> 		err = mpage_map_one_extent(handle, mpd);</div><div class='ctx'> 		if (err &lt; 0) {</div><div class='ctx'> 			struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> </div><div class='del'>-			if (ext4_forced_shutdown(EXT4_SB(sb)) ||</div><div class='del'>-			    ext4_test_mount_flag(sb, EXT4_MF_FS_ABORTED))</div><div class='add'>+			if (ext4_emergency_state(sb))</div><div class='ctx'> 				goto invalidate_dirty_pages;</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Let the uper layers retry transient errors.</div><div class='ctx'> 			 * In the case of ENOSPC, if ext4_count_free_blocks()</div><div class='ctx'> 			 * is non-zero, a commit should free up blocks.</div><div class='ctx'> 			 */</div><div class='del'>-			if ((err == -ENOMEM) ||</div><div class='add'>+			if ((err == -ENOMEM) || (err == -EAGAIN) ||</div><div class='ctx'> 			    (err == -ENOSPC &amp;&amp; ext4_count_free_clusters(sb))) {</div><div class='del'>-				if (progress)</div><div class='add'>+				/*</div><div class='add'>+				 * We may have already allocated extents for</div><div class='add'>+				 * some bhs inside the folio, issue the</div><div class='add'>+				 * corresponding data to prevent stale data.</div><div class='add'>+				 */</div><div class='add'>+				if (progress) {</div><div class='add'>+					if (mpage_submit_partial_folio(mpd))</div><div class='add'>+						goto invalidate_dirty_pages;</div><div class='ctx'> 					goto update_disksize;</div><div class='add'>+				}</div><div class='ctx'> 				return err;</div><div class='ctx'> 			}</div><div class='ctx'> 			ext4_msg(sb, KERN_CRIT,</div><div class='hunk'>@@ -2489,7 +2527,7 @@ update_disksize:</div><div class='ctx'> 	 * Update on-disk size after IO is submitted.  Races with</div><div class='ctx'> 	 * truncate are avoided by checking i_size under i_data_sem.</div><div class='ctx'> 	 */</div><div class='del'>-	disksize = ((loff_t)mpd-&gt;first_page) &lt;&lt; PAGE_SHIFT;</div><div class='add'>+	disksize = mpd-&gt;start_pos;</div><div class='ctx'> 	if (disksize &gt; READ_ONCE(EXT4_I(inode)-&gt;i_disksize)) {</div><div class='ctx'> 		int err2;</div><div class='ctx'> 		loff_t i_size;</div><div class='hunk'>@@ -2513,33 +2551,59 @@ update_disksize:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Calculate the total number of credits to reserve for one writepages</div><div class='del'>- * iteration. This is called from ext4_writepages(). We map an extent of</div><div class='del'>- * up to MAX_WRITEPAGES_EXTENT_LEN blocks and then we go on and finish mapping</div><div class='del'>- * the last partial page. So in total we can map MAX_WRITEPAGES_EXTENT_LEN +</div><div class='del'>- * bpp - 1 blocks in bpp different extents.</div><div class='del'>- */</div><div class='del'>-static int ext4_da_writepages_trans_blocks(struct inode *inode)</div><div class='add'>+static int ext4_journal_folio_buffers(handle_t *handle, struct folio *folio,</div><div class='add'>+				     size_t len)</div><div class='ctx'> {</div><div class='del'>-	int bpp = ext4_journal_blocks_per_page(inode);</div><div class='add'>+	struct buffer_head *page_bufs = folio_buffers(folio);</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+	int ret, err;</div><div class='add'>+</div><div class='add'>+	ret = ext4_walk_page_buffers(handle, inode, page_bufs, 0, len,</div><div class='add'>+				     NULL, do_journal_get_write_access);</div><div class='add'>+	err = ext4_walk_page_buffers(handle, inode, page_bufs, 0, len,</div><div class='add'>+				     NULL, write_end_fn);</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		ret = err;</div><div class='add'>+	err = ext4_jbd2_inode_add_write(handle, inode, folio_pos(folio), len);</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		ret = err;</div><div class='add'>+	EXT4_I(inode)-&gt;i_datasync_tid = handle-&gt;h_transaction-&gt;t_tid;</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int mpage_journal_page_buffers(handle_t *handle,</div><div class='add'>+				      struct mpage_da_data *mpd,</div><div class='add'>+				      struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = mpd-&gt;inode;</div><div class='add'>+	loff_t size = i_size_read(inode);</div><div class='add'>+	size_t len = folio_size(folio);</div><div class='ctx'> </div><div class='del'>-	return ext4_meta_trans_blocks(inode,</div><div class='del'>-				MAX_WRITEPAGES_EXTENT_LEN + bpp - 1, bpp);</div><div class='add'>+	folio_clear_checked(folio);</div><div class='add'>+	mpd-&gt;wbc-&gt;nr_to_write -= folio_nr_pages(folio);</div><div class='add'>+</div><div class='add'>+	if (folio_pos(folio) + len &gt; size &amp;&amp;</div><div class='add'>+	    !ext4_verity_in_progress(inode))</div><div class='add'>+		len = size &amp; (len - 1);</div><div class='add'>+</div><div class='add'>+	return ext4_journal_folio_buffers(handle, folio, len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * mpage_prepare_extent_to_map - find &amp; lock contiguous range of dirty pages</div><div class='del'>- * 				 and underlying extent to map</div><div class='add'>+ * 				 needing mapping, submit mapped pages</div><div class='ctx'>  *</div><div class='ctx'>  * @mpd - where to look for pages</div><div class='ctx'>  *</div><div class='ctx'>  * Walk dirty pages in the mapping. If they are fully mapped, submit them for</div><div class='del'>- * IO immediately. When we find a page which isn't mapped we start accumulating</div><div class='del'>- * extent of buffers underlying these pages that needs mapping (formed by</div><div class='del'>- * either delayed or unwritten buffers). We also lock the pages containing</div><div class='del'>- * these buffers. The extent found is returned in @mpd structure (starting at</div><div class='del'>- * mpd-&gt;lblk with length mpd-&gt;len blocks).</div><div class='add'>+ * IO immediately. If we cannot map blocks, we submit just already mapped</div><div class='add'>+ * buffers in the page for IO and keep page dirty. When we can map blocks and</div><div class='add'>+ * we find a page which isn't mapped we start accumulating extent of buffers</div><div class='add'>+ * underlying these pages that needs mapping (formed by either delayed or</div><div class='add'>+ * unwritten buffers). We also lock the pages containing these buffers. The</div><div class='add'>+ * extent found is returned in @mpd structure (starting at mpd-&gt;lblk with</div><div class='add'>+ * length mpd-&gt;len blocks).</div><div class='ctx'>  *</div><div class='ctx'>  * Note that this function can attach bios to one io_end structure which are</div><div class='ctx'>  * neither logically nor physically contiguous. Although it may seem as an</div><div class='hunk'>@@ -2549,33 +2613,36 @@ static int ext4_da_writepages_trans_blocks(struct inode *inode)</div><div class='ctx'> static int mpage_prepare_extent_to_map(struct mpage_da_data *mpd)</div><div class='ctx'> {</div><div class='ctx'> 	struct address_space *mapping = mpd-&gt;inode-&gt;i_mapping;</div><div class='del'>-	struct pagevec pvec;</div><div class='del'>-	unsigned int nr_pages;</div><div class='del'>-	long left = mpd-&gt;wbc-&gt;nr_to_write;</div><div class='del'>-	pgoff_t index = mpd-&gt;first_page;</div><div class='del'>-	pgoff_t end = mpd-&gt;last_page;</div><div class='add'>+	struct folio_batch fbatch;</div><div class='add'>+	unsigned int nr_folios;</div><div class='add'>+	pgoff_t index = mpd-&gt;start_pos &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	pgoff_t end = mpd-&gt;end_pos &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> 	xa_mark_t tag;</div><div class='ctx'> 	int i, err = 0;</div><div class='del'>-	int blkbits = mpd-&gt;inode-&gt;i_blkbits;</div><div class='ctx'> 	ext4_lblk_t lblk;</div><div class='ctx'> 	struct buffer_head *head;</div><div class='add'>+	handle_t *handle = NULL;</div><div class='add'>+	int bpp = ext4_journal_blocks_per_folio(mpd-&gt;inode);</div><div class='ctx'> </div><div class='del'>-	if (mpd-&gt;wbc-&gt;sync_mode == WB_SYNC_ALL || mpd-&gt;wbc-&gt;tagged_writepages)</div><div class='del'>-		tag = PAGECACHE_TAG_TOWRITE;</div><div class='del'>-	else</div><div class='del'>-		tag = PAGECACHE_TAG_DIRTY;</div><div class='add'>+	tag = wbc_to_tag(mpd-&gt;wbc);</div><div class='ctx'> </div><div class='del'>-	pagevec_init(&amp;pvec);</div><div class='ctx'> 	mpd-&gt;map.m_len = 0;</div><div class='del'>-	mpd-&gt;next_page = index;</div><div class='add'>+	mpd-&gt;next_pos = mpd-&gt;start_pos;</div><div class='add'>+	if (ext4_should_journal_data(mpd-&gt;inode)) {</div><div class='add'>+		handle = ext4_journal_start(mpd-&gt;inode, EXT4_HT_WRITE_PAGE,</div><div class='add'>+					    bpp);</div><div class='add'>+		if (IS_ERR(handle))</div><div class='add'>+			return PTR_ERR(handle);</div><div class='add'>+	}</div><div class='add'>+	folio_batch_init(&amp;fbatch);</div><div class='ctx'> 	while (index &lt;= end) {</div><div class='del'>-		nr_pages = pagevec_lookup_range_tag(&amp;pvec, mapping, &amp;index, end,</div><div class='del'>-				tag);</div><div class='del'>-		if (nr_pages == 0)</div><div class='add'>+		nr_folios = filemap_get_folios_tag(mapping, &amp;index, end,</div><div class='add'>+				tag, &amp;fbatch);</div><div class='add'>+		if (nr_folios == 0)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		for (i = 0; i &lt; nr_pages; i++) {</div><div class='del'>-			struct page *page = pvec.pages[i];</div><div class='add'>+		for (i = 0; i &lt; nr_folios; i++) {</div><div class='add'>+			struct folio *folio = fbatch.folios[i];</div><div class='ctx'> </div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Accumulated enough dirty pages? This doesn't apply</div><div class='hunk'>@@ -2585,14 +2652,24 @@ static int mpage_prepare_extent_to_map(struct mpage_da_data *mpd)</div><div class='ctx'> 			 * newly appeared dirty pages, but have not synced all</div><div class='ctx'> 			 * of the old dirty pages.</div><div class='ctx'> 			 */</div><div class='del'>-			if (mpd-&gt;wbc-&gt;sync_mode == WB_SYNC_NONE &amp;&amp; left &lt;= 0)</div><div class='add'>+			if (mpd-&gt;wbc-&gt;sync_mode == WB_SYNC_NONE &amp;&amp;</div><div class='add'>+			    mpd-&gt;wbc-&gt;nr_to_write &lt;=</div><div class='add'>+			    EXT4_LBLK_TO_PG(mpd-&gt;inode, mpd-&gt;map.m_len))</div><div class='ctx'> 				goto out;</div><div class='ctx'> </div><div class='ctx'> 			/* If we can't merge this page, we are done. */</div><div class='del'>-			if (mpd-&gt;map.m_len &gt; 0 &amp;&amp; mpd-&gt;next_page != page-&gt;index)</div><div class='add'>+			if (mpd-&gt;map.m_len &gt; 0 &amp;&amp;</div><div class='add'>+			    mpd-&gt;next_pos != folio_pos(folio))</div><div class='ctx'> 				goto out;</div><div class='ctx'> </div><div class='del'>-			lock_page(page);</div><div class='add'>+			if (handle) {</div><div class='add'>+				err = ext4_journal_ensure_credits(handle, bpp,</div><div class='add'>+								  0);</div><div class='add'>+				if (err &lt; 0)</div><div class='add'>+					goto out;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			folio_lock(folio);</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * If the page is no longer dirty, or its mapping no</div><div class='ctx'> 			 * longer corresponds to inode we are writing (which</div><div class='hunk'>@@ -2600,59 +2677,99 @@ static int mpage_prepare_extent_to_map(struct mpage_da_data *mpd)</div><div class='ctx'> 			 * page is already under writeback and we are not doing</div><div class='ctx'> 			 * a data integrity writeback, skip the page</div><div class='ctx'> 			 */</div><div class='del'>-			if (!PageDirty(page) ||</div><div class='del'>-			    (PageWriteback(page) &amp;&amp;</div><div class='add'>+			if (!folio_test_dirty(folio) ||</div><div class='add'>+			    (folio_test_writeback(folio) &amp;&amp;</div><div class='ctx'> 			     (mpd-&gt;wbc-&gt;sync_mode == WB_SYNC_NONE)) ||</div><div class='del'>-			    unlikely(page-&gt;mapping != mapping)) {</div><div class='del'>-				unlock_page(page);</div><div class='add'>+			    unlikely(folio-&gt;mapping != mapping)) {</div><div class='add'>+				folio_unlock(folio);</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			wait_on_page_writeback(page);</div><div class='del'>-			BUG_ON(PageWriteback(page));</div><div class='add'>+			folio_wait_writeback(folio);</div><div class='add'>+			BUG_ON(folio_test_writeback(folio));</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * Should never happen but for buggy code in</div><div class='add'>+			 * other subsystems that call</div><div class='add'>+			 * set_page_dirty() without properly warning</div><div class='add'>+			 * the file system first.  See [1] for more</div><div class='add'>+			 * information.</div><div class='add'>+			 *</div><div class='add'>+			 * [1] https://lore.kernel.org/linux-mm/20180103100430.GE4911@quack2.suse.cz</div><div class='add'>+			 */</div><div class='add'>+			if (!folio_buffers(folio)) {</div><div class='add'>+				ext4_warning_inode(mpd-&gt;inode, "page %lu does not have buffers attached", folio-&gt;index);</div><div class='add'>+				folio_clear_dirty(folio);</div><div class='add'>+				folio_unlock(folio);</div><div class='add'>+				continue;</div><div class='add'>+			}</div><div class='ctx'> </div><div class='ctx'> 			if (mpd-&gt;map.m_len == 0)</div><div class='del'>-				mpd-&gt;first_page = page-&gt;index;</div><div class='del'>-			mpd-&gt;next_page = page-&gt;index + 1;</div><div class='del'>-			/* Add all dirty buffers to mpd */</div><div class='del'>-			lblk = ((ext4_lblk_t)page-&gt;index) &lt;&lt;</div><div class='del'>-				(PAGE_SHIFT - blkbits);</div><div class='del'>-			head = page_buffers(page);</div><div class='del'>-			err = mpage_process_page_bufs(mpd, head, head, lblk);</div><div class='del'>-			if (err &lt;= 0)</div><div class='del'>-				goto out;</div><div class='del'>-			err = 0;</div><div class='del'>-			left--;</div><div class='add'>+				mpd-&gt;start_pos = folio_pos(folio);</div><div class='add'>+			mpd-&gt;next_pos = folio_next_pos(folio);</div><div class='add'>+			/*</div><div class='add'>+			 * Writeout when we cannot modify metadata is simple.</div><div class='add'>+			 * Just submit the page. For data=journal mode we</div><div class='add'>+			 * first handle writeout of the page for checkpoint and</div><div class='add'>+			 * only after that handle delayed page dirtying. This</div><div class='add'>+			 * makes sure current data is checkpointed to the final</div><div class='add'>+			 * location before possibly journalling it again which</div><div class='add'>+			 * is desirable when the page is frequently dirtied</div><div class='add'>+			 * through a pin.</div><div class='add'>+			 */</div><div class='add'>+			if (!mpd-&gt;can_map) {</div><div class='add'>+				err = mpage_submit_folio(mpd, folio);</div><div class='add'>+				if (err &lt; 0)</div><div class='add'>+					goto out;</div><div class='add'>+				/* Pending dirtying of journalled data? */</div><div class='add'>+				if (folio_test_checked(folio)) {</div><div class='add'>+					err = mpage_journal_page_buffers(handle,</div><div class='add'>+						mpd, folio);</div><div class='add'>+					if (err &lt; 0)</div><div class='add'>+						goto out;</div><div class='add'>+					mpd-&gt;journalled_more_data = 1;</div><div class='add'>+				}</div><div class='add'>+				mpage_folio_done(mpd, folio);</div><div class='add'>+			} else {</div><div class='add'>+				/* Add all dirty buffers to mpd */</div><div class='add'>+				lblk = EXT4_PG_TO_LBLK(mpd-&gt;inode, folio-&gt;index);</div><div class='add'>+				head = folio_buffers(folio);</div><div class='add'>+				err = mpage_process_page_bufs(mpd, head, head,</div><div class='add'>+						lblk);</div><div class='add'>+				if (err &lt;= 0)</div><div class='add'>+					goto out;</div><div class='add'>+				err = 0;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='del'>-		pagevec_release(&amp;pvec);</div><div class='add'>+		folio_batch_release(&amp;fbatch);</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 	}</div><div class='ctx'> 	mpd-&gt;scanned_until_end = 1;</div><div class='add'>+	if (handle)</div><div class='add'>+		ext4_journal_stop(handle);</div><div class='ctx'> 	return 0;</div><div class='ctx'> out:</div><div class='del'>-	pagevec_release(&amp;pvec);</div><div class='add'>+	folio_batch_release(&amp;fbatch);</div><div class='add'>+	if (handle)</div><div class='add'>+		ext4_journal_stop(handle);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext4_writepages(struct address_space *mapping,</div><div class='del'>-			   struct writeback_control *wbc)</div><div class='add'>+static int ext4_do_writepages(struct mpage_da_data *mpd)</div><div class='ctx'> {</div><div class='add'>+	struct writeback_control *wbc = mpd-&gt;wbc;</div><div class='ctx'> 	pgoff_t	writeback_index = 0;</div><div class='ctx'> 	long nr_to_write = wbc-&gt;nr_to_write;</div><div class='ctx'> 	int range_whole = 0;</div><div class='ctx'> 	int cycled = 1;</div><div class='ctx'> 	handle_t *handle = NULL;</div><div class='del'>-	struct mpage_da_data mpd;</div><div class='del'>-	struct inode *inode = mapping-&gt;host;</div><div class='add'>+	struct inode *inode = mpd-&gt;inode;</div><div class='add'>+	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='ctx'> 	int needed_blocks, rsv_blocks = 0, ret = 0;</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(mapping-&gt;host-&gt;i_sb);</div><div class='ctx'> 	struct blk_plug plug;</div><div class='ctx'> 	bool give_up_on_write = false;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ext4_forced_shutdown(EXT4_SB(inode-&gt;i_sb))))</div><div class='del'>-		return -EIO;</div><div class='del'>-</div><div class='del'>-	percpu_down_read(&amp;sbi-&gt;s_writepages_rwsem);</div><div class='ctx'> 	trace_ext4_writepages(inode, wbc);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -2663,26 +2780,19 @@ static int ext4_writepages(struct address_space *mapping,</div><div class='ctx'> 	if (!mapping-&gt;nrpages || !mapping_tagged(mapping, PAGECACHE_TAG_DIRTY))</div><div class='ctx'> 		goto out_writepages;</div><div class='ctx'> </div><div class='del'>-	if (ext4_should_journal_data(inode)) {</div><div class='del'>-		ret = generic_writepages(mapping, wbc);</div><div class='del'>-		goto out_writepages;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If the filesystem has aborted, it is read-only, so return</div><div class='ctx'> 	 * right away instead of dumping stack traces later on that</div><div class='ctx'> 	 * will obscure the real source of the problem.  We test</div><div class='del'>-	 * EXT4_MF_FS_ABORTED instead of sb-&gt;s_flag's SB_RDONLY because</div><div class='add'>+	 * fs shutdown state instead of sb-&gt;s_flag's SB_RDONLY because</div><div class='ctx'> 	 * the latter could be true if the filesystem is mounted</div><div class='ctx'> 	 * read-only, and in that case, ext4_writepages should</div><div class='ctx'> 	 * *never* be called, so if that ever happens, we would want</div><div class='ctx'> 	 * the stack trace.</div><div class='ctx'> 	 */</div><div class='del'>-	if (unlikely(ext4_forced_shutdown(EXT4_SB(mapping-&gt;host-&gt;i_sb)) ||</div><div class='del'>-		     ext4_test_mount_flag(inode-&gt;i_sb, EXT4_MF_FS_ABORTED))) {</div><div class='del'>-		ret = -EROFS;</div><div class='add'>+	ret = ext4_emergency_state(mapping-&gt;host-&gt;i_sb);</div><div class='add'>+	if (unlikely(ret))</div><div class='ctx'> 		goto out_writepages;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If we have inline data and arrive here, it means that</div><div class='hunk'>@@ -2702,13 +2812,33 @@ static int ext4_writepages(struct address_space *mapping,</div><div class='ctx'> 		ext4_journal_stop(handle);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * data=journal mode does not do delalloc so we just need to writeout /</div><div class='add'>+	 * journal already mapped buffers. On the other hand we need to commit</div><div class='add'>+	 * transaction to make data stable. We expect all the data to be</div><div class='add'>+	 * already in the journal (the only exception are DMA pinned pages</div><div class='add'>+	 * dirtied behind our back) so we commit transaction here and run the</div><div class='add'>+	 * writeback loop to checkpoint them. The checkpointing is not actually</div><div class='add'>+	 * necessary to make data persistent *but* quite a few places (extent</div><div class='add'>+	 * shifting operations, fsverity, ...) depend on being able to drop</div><div class='add'>+	 * pagecache pages after calling filemap_write_and_wait() and for that</div><div class='add'>+	 * checkpointing needs to happen.</div><div class='add'>+	 */</div><div class='add'>+	if (ext4_should_journal_data(inode)) {</div><div class='add'>+		mpd-&gt;can_map = 0;</div><div class='add'>+		if (wbc-&gt;sync_mode == WB_SYNC_ALL)</div><div class='add'>+			ext4_fc_commit(sbi-&gt;s_journal,</div><div class='add'>+				       EXT4_I(inode)-&gt;i_datasync_tid);</div><div class='add'>+	}</div><div class='add'>+	mpd-&gt;journalled_more_data = 0;</div><div class='add'>+</div><div class='ctx'> 	if (ext4_should_dioread_nolock(inode)) {</div><div class='add'>+		int bpf = ext4_journal_blocks_per_folio(inode);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We may need to convert up to one extent per block in</div><div class='del'>-		 * the page and we may dirty the inode.</div><div class='add'>+		 * the folio and we may dirty the inode.</div><div class='ctx'> 		 */</div><div class='del'>-		rsv_blocks = 1 + ext4_chunk_trans_blocks(inode,</div><div class='del'>-						PAGE_SIZE &gt;&gt; inode-&gt;i_blkbits);</div><div class='add'>+		rsv_blocks = 1 + ext4_ext_index_trans_blocks(inode, bpf);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (wbc-&gt;range_start == 0 &amp;&amp; wbc-&gt;range_end == LLONG_MAX)</div><div class='hunk'>@@ -2718,19 +2848,18 @@ static int ext4_writepages(struct address_space *mapping,</div><div class='ctx'> 		writeback_index = mapping-&gt;writeback_index;</div><div class='ctx'> 		if (writeback_index)</div><div class='ctx'> 			cycled = 0;</div><div class='del'>-		mpd.first_page = writeback_index;</div><div class='del'>-		mpd.last_page = -1;</div><div class='add'>+		mpd-&gt;start_pos = writeback_index &lt;&lt; PAGE_SHIFT;</div><div class='add'>+		mpd-&gt;end_pos = LLONG_MAX;</div><div class='ctx'> 	} else {</div><div class='del'>-		mpd.first_page = wbc-&gt;range_start &gt;&gt; PAGE_SHIFT;</div><div class='del'>-		mpd.last_page = wbc-&gt;range_end &gt;&gt; PAGE_SHIFT;</div><div class='add'>+		mpd-&gt;start_pos = wbc-&gt;range_start;</div><div class='add'>+		mpd-&gt;end_pos = wbc-&gt;range_end;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	mpd.inode = inode;</div><div class='del'>-	mpd.wbc = wbc;</div><div class='del'>-	ext4_io_submit_init(&amp;mpd.io_submit, wbc);</div><div class='add'>+	ext4_io_submit_init(&amp;mpd-&gt;io_submit, wbc);</div><div class='ctx'> retry:</div><div class='ctx'> 	if (wbc-&gt;sync_mode == WB_SYNC_ALL || wbc-&gt;tagged_writepages)</div><div class='del'>-		tag_pages_for_writeback(mapping, mpd.first_page, mpd.last_page);</div><div class='add'>+		tag_pages_for_writeback(mapping, mpd-&gt;start_pos &gt;&gt; PAGE_SHIFT,</div><div class='add'>+					mpd-&gt;end_pos &gt;&gt; PAGE_SHIFT);</div><div class='ctx'> 	blk_start_plug(&amp;plug);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -2739,31 +2868,32 @@ retry:</div><div class='ctx'> 	 * in the block layer on device congestion while having transaction</div><div class='ctx'> 	 * started.</div><div class='ctx'> 	 */</div><div class='del'>-	mpd.do_map = 0;</div><div class='del'>-	mpd.scanned_until_end = 0;</div><div class='del'>-	mpd.io_submit.io_end = ext4_init_io_end(inode, GFP_KERNEL);</div><div class='del'>-	if (!mpd.io_submit.io_end) {</div><div class='add'>+	mpd-&gt;do_map = 0;</div><div class='add'>+	mpd-&gt;scanned_until_end = 0;</div><div class='add'>+	mpd-&gt;io_submit.io_end = ext4_init_io_end(inode, GFP_KERNEL);</div><div class='add'>+	if (!mpd-&gt;io_submit.io_end) {</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='ctx'> 		goto unplug;</div><div class='ctx'> 	}</div><div class='del'>-	ret = mpage_prepare_extent_to_map(&amp;mpd);</div><div class='add'>+	ret = mpage_prepare_extent_to_map(mpd);</div><div class='ctx'> 	/* Unlock pages we didn't use */</div><div class='del'>-	mpage_release_unused_pages(&amp;mpd, false);</div><div class='add'>+	mpage_release_unused_pages(mpd, false);</div><div class='ctx'> 	/* Submit prepared bio */</div><div class='del'>-	ext4_io_submit(&amp;mpd.io_submit);</div><div class='del'>-	ext4_put_io_end_defer(mpd.io_submit.io_end);</div><div class='del'>-	mpd.io_submit.io_end = NULL;</div><div class='add'>+	ext4_io_submit(&amp;mpd-&gt;io_submit);</div><div class='add'>+	ext4_put_io_end_defer(mpd-&gt;io_submit.io_end);</div><div class='add'>+	mpd-&gt;io_submit.io_end = NULL;</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto unplug;</div><div class='ctx'> </div><div class='del'>-	while (!mpd.scanned_until_end &amp;&amp; wbc-&gt;nr_to_write &gt; 0) {</div><div class='add'>+	while (!mpd-&gt;scanned_until_end &amp;&amp; wbc-&gt;nr_to_write &gt; 0) {</div><div class='ctx'> 		/* For each extent of pages we use new io_end */</div><div class='del'>-		mpd.io_submit.io_end = ext4_init_io_end(inode, GFP_KERNEL);</div><div class='del'>-		if (!mpd.io_submit.io_end) {</div><div class='add'>+		mpd-&gt;io_submit.io_end = ext4_init_io_end(inode, GFP_KERNEL);</div><div class='add'>+		if (!mpd-&gt;io_submit.io_end) {</div><div class='ctx'> 			ret = -ENOMEM;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		WARN_ON_ONCE(!mpd-&gt;can_map);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We have two constraints: We find one extent to map and we</div><div class='ctx'> 		 * must always write out whole page (makes a difference when</div><div class='hunk'>@@ -2772,8 +2902,14 @@ retry:</div><div class='ctx'> 		 * not supported by delalloc.</div><div class='ctx'> 		 */</div><div class='ctx'> 		BUG_ON(ext4_should_journal_data(inode));</div><div class='del'>-		needed_blocks = ext4_da_writepages_trans_blocks(inode);</div><div class='del'>-</div><div class='add'>+		/*</div><div class='add'>+		 * Calculate the number of credits needed to reserve for one</div><div class='add'>+		 * extent of up to MAX_WRITEPAGES_EXTENT_LEN blocks. It will</div><div class='add'>+		 * attempt to extend the transaction or start a new iteration</div><div class='add'>+		 * if the reserved credits are insufficient.</div><div class='add'>+		 */</div><div class='add'>+		needed_blocks = ext4_chunk_trans_blocks(inode,</div><div class='add'>+						MAX_WRITEPAGES_EXTENT_LEN);</div><div class='ctx'> 		/* start a new transaction */</div><div class='ctx'> 		handle = ext4_journal_start_with_reserve(inode,</div><div class='ctx'> 				EXT4_HT_WRITE_PAGE, needed_blocks, rsv_blocks);</div><div class='hunk'>@@ -2783,16 +2919,17 @@ retry:</div><div class='ctx'> 			       "%ld pages, ino %lu; err %d", __func__,</div><div class='ctx'> 				wbc-&gt;nr_to_write, inode-&gt;i_ino, ret);</div><div class='ctx'> 			/* Release allocated io_end */</div><div class='del'>-			ext4_put_io_end(mpd.io_submit.io_end);</div><div class='del'>-			mpd.io_submit.io_end = NULL;</div><div class='add'>+			ext4_put_io_end(mpd-&gt;io_submit.io_end);</div><div class='add'>+			mpd-&gt;io_submit.io_end = NULL;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-		mpd.do_map = 1;</div><div class='add'>+		mpd-&gt;do_map = 1;</div><div class='ctx'> </div><div class='del'>-		trace_ext4_da_write_pages(inode, mpd.first_page, mpd.wbc);</div><div class='del'>-		ret = mpage_prepare_extent_to_map(&amp;mpd);</div><div class='del'>-		if (!ret &amp;&amp; mpd.map.m_len)</div><div class='del'>-			ret = mpage_map_and_submit_extent(handle, &amp;mpd,</div><div class='add'>+		trace_ext4_da_write_folios_start(inode, mpd-&gt;start_pos,</div><div class='add'>+				mpd-&gt;next_pos, wbc);</div><div class='add'>+		ret = mpage_prepare_extent_to_map(mpd);</div><div class='add'>+		if (!ret &amp;&amp; mpd-&gt;map.m_len)</div><div class='add'>+			ret = mpage_map_and_submit_extent(handle, mpd,</div><div class='ctx'> 					&amp;give_up_on_write);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Caution: If the handle is synchronous,</div><div class='hunk'>@@ -2807,12 +2944,12 @@ retry:</div><div class='ctx'> 		if (!ext4_handle_valid(handle) || handle-&gt;h_sync == 0) {</div><div class='ctx'> 			ext4_journal_stop(handle);</div><div class='ctx'> 			handle = NULL;</div><div class='del'>-			mpd.do_map = 0;</div><div class='add'>+			mpd-&gt;do_map = 0;</div><div class='ctx'> 		}</div><div class='ctx'> 		/* Unlock pages we didn't use */</div><div class='del'>-		mpage_release_unused_pages(&amp;mpd, give_up_on_write);</div><div class='add'>+		mpage_release_unused_pages(mpd, give_up_on_write);</div><div class='ctx'> 		/* Submit prepared bio */</div><div class='del'>-		ext4_io_submit(&amp;mpd.io_submit);</div><div class='add'>+		ext4_io_submit(&amp;mpd-&gt;io_submit);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Drop our io_end reference we got from init. We have</div><div class='hunk'>@@ -2822,11 +2959,13 @@ retry:</div><div class='ctx'> 		 * up doing unwritten extent conversion.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (handle) {</div><div class='del'>-			ext4_put_io_end_defer(mpd.io_submit.io_end);</div><div class='add'>+			ext4_put_io_end_defer(mpd-&gt;io_submit.io_end);</div><div class='ctx'> 			ext4_journal_stop(handle);</div><div class='ctx'> 		} else</div><div class='del'>-			ext4_put_io_end(mpd.io_submit.io_end);</div><div class='del'>-		mpd.io_submit.io_end = NULL;</div><div class='add'>+			ext4_put_io_end(mpd-&gt;io_submit.io_end);</div><div class='add'>+		mpd-&gt;io_submit.io_end = NULL;</div><div class='add'>+		trace_ext4_da_write_folios_end(inode, mpd-&gt;start_pos,</div><div class='add'>+				mpd-&gt;next_pos, wbc, ret);</div><div class='ctx'> </div><div class='ctx'> 		if (ret == -ENOSPC &amp;&amp; sbi-&gt;s_journal) {</div><div class='ctx'> 			/*</div><div class='hunk'>@@ -2838,6 +2977,8 @@ retry:</div><div class='ctx'> 			ret = 0;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='add'>+		if (ret == -EAGAIN)</div><div class='add'>+			ret = 0;</div><div class='ctx'> 		/* Fatal error - ENOMEM, EIO... */</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -2846,8 +2987,8 @@ unplug:</div><div class='ctx'> 	blk_finish_plug(&amp;plug);</div><div class='ctx'> 	if (!ret &amp;&amp; !cycled &amp;&amp; wbc-&gt;nr_to_write &gt; 0) {</div><div class='ctx'> 		cycled = 1;</div><div class='del'>-		mpd.last_page = writeback_index - 1;</div><div class='del'>-		mpd.first_page = 0;</div><div class='add'>+		mpd-&gt;end_pos = (writeback_index &lt;&lt; PAGE_SHIFT) - 1;</div><div class='add'>+		mpd-&gt;start_pos = 0;</div><div class='ctx'> 		goto retry;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -2857,33 +2998,80 @@ unplug:</div><div class='ctx'> 		 * Set the writeback_index so that range_cyclic</div><div class='ctx'> 		 * mode will write it back later</div><div class='ctx'> 		 */</div><div class='del'>-		mapping-&gt;writeback_index = mpd.first_page;</div><div class='add'>+		mapping-&gt;writeback_index = mpd-&gt;start_pos &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> </div><div class='ctx'> out_writepages:</div><div class='ctx'> 	trace_ext4_writepages_result(inode, wbc, ret,</div><div class='ctx'> 				     nr_to_write - wbc-&gt;nr_to_write);</div><div class='del'>-	percpu_up_read(&amp;sbi-&gt;s_writepages_rwsem);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int ext4_writepages(struct address_space *mapping,</div><div class='add'>+			   struct writeback_control *wbc)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = mapping-&gt;host-&gt;i_sb;</div><div class='add'>+	struct mpage_da_data mpd = {</div><div class='add'>+		.inode = mapping-&gt;host,</div><div class='add'>+		.wbc = wbc,</div><div class='add'>+		.can_map = 1,</div><div class='add'>+	};</div><div class='add'>+	int ret;</div><div class='add'>+	int alloc_ctx;</div><div class='add'>+</div><div class='add'>+	ret = ext4_emergency_state(sb);</div><div class='add'>+	if (unlikely(ret))</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	alloc_ctx = ext4_writepages_down_read(sb);</div><div class='add'>+	ret = ext4_do_writepages(&amp;mpd);</div><div class='add'>+	/*</div><div class='add'>+	 * For data=journal writeback we could have come across pages marked</div><div class='add'>+	 * for delayed dirtying (PageChecked) which were just added to the</div><div class='add'>+	 * running transaction. Try once more to get them to stable storage.</div><div class='add'>+	 */</div><div class='add'>+	if (!ret &amp;&amp; mpd.journalled_more_data)</div><div class='add'>+		ret = ext4_do_writepages(&amp;mpd);</div><div class='add'>+	ext4_writepages_up_read(sb, alloc_ctx);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int ext4_normal_submit_inode_data_buffers(struct jbd2_inode *jinode)</div><div class='add'>+{</div><div class='add'>+	struct writeback_control wbc = {</div><div class='add'>+		.sync_mode = WB_SYNC_ALL,</div><div class='add'>+		.nr_to_write = LONG_MAX,</div><div class='add'>+		.range_start = jinode-&gt;i_dirty_start,</div><div class='add'>+		.range_end = jinode-&gt;i_dirty_end,</div><div class='add'>+	};</div><div class='add'>+	struct mpage_da_data mpd = {</div><div class='add'>+		.inode = jinode-&gt;i_vfs_inode,</div><div class='add'>+		.wbc = &amp;wbc,</div><div class='add'>+		.can_map = 0,</div><div class='add'>+	};</div><div class='add'>+	return ext4_do_writepages(&amp;mpd);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int ext4_dax_writepages(struct address_space *mapping,</div><div class='ctx'> 			       struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	long nr_to_write = wbc-&gt;nr_to_write;</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='del'>-	struct ext4_sb_info *sbi = EXT4_SB(mapping-&gt;host-&gt;i_sb);</div><div class='add'>+	int alloc_ctx;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ext4_forced_shutdown(EXT4_SB(inode-&gt;i_sb))))</div><div class='del'>-		return -EIO;</div><div class='add'>+	ret = ext4_emergency_state(inode-&gt;i_sb);</div><div class='add'>+	if (unlikely(ret))</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='del'>-	percpu_down_read(&amp;sbi-&gt;s_writepages_rwsem);</div><div class='add'>+	alloc_ctx = ext4_writepages_down_read(inode-&gt;i_sb);</div><div class='ctx'> 	trace_ext4_writepages(inode, wbc);</div><div class='ctx'> </div><div class='del'>-	ret = dax_writeback_mapping_range(mapping, sbi-&gt;s_daxdev, wbc);</div><div class='add'>+	ret = dax_writeback_mapping_range(mapping,</div><div class='add'>+					  EXT4_SB(inode-&gt;i_sb)-&gt;s_daxdev, wbc);</div><div class='ctx'> 	trace_ext4_writepages_result(inode, wbc, ret,</div><div class='ctx'> 				     nr_to_write - wbc-&gt;nr_to_write);</div><div class='del'>-	percpu_up_read(&amp;sbi-&gt;s_writepages_rwsem);</div><div class='add'>+	ext4_writepages_up_read(inode-&gt;i_sb, alloc_ctx);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2921,33 +3109,33 @@ static int ext4_nonda_switch(struct super_block *sb)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext4_da_write_begin(struct file *file, struct address_space *mapping,</div><div class='del'>-			       loff_t pos, unsigned len, unsigned flags,</div><div class='del'>-			       struct page **pagep, void **fsdata)</div><div class='add'>+static int ext4_da_write_begin(const struct kiocb *iocb,</div><div class='add'>+			       struct address_space *mapping,</div><div class='add'>+			       loff_t pos, unsigned len,</div><div class='add'>+			       struct folio **foliop, void **fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	int ret, retries = 0;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	pgoff_t index;</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ext4_forced_shutdown(EXT4_SB(inode-&gt;i_sb))))</div><div class='del'>-		return -EIO;</div><div class='add'>+	ret = ext4_emergency_state(inode-&gt;i_sb);</div><div class='add'>+	if (unlikely(ret))</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	index = pos &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> </div><div class='del'>-	if (ext4_nonda_switch(inode-&gt;i_sb) || S_ISLNK(inode-&gt;i_mode) ||</div><div class='del'>-	    ext4_verity_in_progress(inode)) {</div><div class='add'>+	if (ext4_nonda_switch(inode-&gt;i_sb) || ext4_verity_in_progress(inode)) {</div><div class='ctx'> 		*fsdata = (void *)FALL_BACK_TO_NONDELALLOC;</div><div class='del'>-		return ext4_write_begin(file, mapping, pos,</div><div class='del'>-					len, flags, pagep, fsdata);</div><div class='add'>+		return ext4_write_begin(iocb, mapping, pos,</div><div class='add'>+					len, foliop, fsdata);</div><div class='ctx'> 	}</div><div class='ctx'> 	*fsdata = (void *)0;</div><div class='del'>-	trace_ext4_da_write_begin(inode, pos, len, flags);</div><div class='add'>+	trace_ext4_da_write_begin(inode, pos, len);</div><div class='ctx'> </div><div class='ctx'> 	if (ext4_test_inode_state(inode, EXT4_STATE_MAY_INLINE_DATA)) {</div><div class='del'>-		ret = ext4_da_write_inline_data_begin(mapping, inode,</div><div class='del'>-						      pos, len, flags,</div><div class='del'>-						      pagep, fsdata);</div><div class='add'>+		ret = ext4_generic_write_inline_data(mapping, inode, pos, len,</div><div class='add'>+						     foliop, fsdata, true);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 		if (ret == 1)</div><div class='hunk'>@@ -2955,24 +3143,20 @@ static int ext4_da_write_begin(struct file *file, struct address_space *mapping,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> retry:</div><div class='del'>-	page = grab_cache_page_write_begin(mapping, index, flags);</div><div class='del'>-	if (!page)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	folio = write_begin_get_folio(iocb, mapping, index, len);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio);</div><div class='ctx'> </div><div class='del'>-	/* In case writeback began while the page was unlocked */</div><div class='del'>-	wait_for_stable_page(page);</div><div class='add'>+	if (len &gt; folio_next_pos(folio) - pos)</div><div class='add'>+		len = folio_next_pos(folio) - pos;</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_FS_ENCRYPTION</div><div class='del'>-	ret = ext4_block_write_begin(page, pos, len,</div><div class='add'>+	ret = ext4_block_write_begin(NULL, folio, pos, len,</div><div class='ctx'> 				     ext4_da_get_block_prep);</div><div class='del'>-#else</div><div class='del'>-	ret = __block_write_begin(page, pos, len, ext4_da_get_block_prep);</div><div class='del'>-#endif</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		put_page(page);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 		/*</div><div class='del'>-		 * block_write_begin may have instantiated a few blocks</div><div class='add'>+		 * ext4_block_write_begin may have instantiated a few blocks</div><div class='ctx'> 		 * outside i_size.  Trim these off again. Don't need</div><div class='ctx'> 		 * i_size_read because we hold inode lock.</div><div class='ctx'> 		 */</div><div class='hunk'>@@ -2985,7 +3169,7 @@ retry:</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	*pagep = page;</div><div class='add'>+	*foliop = folio;</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2993,15 +3177,15 @@ retry:</div><div class='ctx'>  * Check if we should update i_disksize</div><div class='ctx'>  * when write to the end of file but not require block allocation</div><div class='ctx'>  */</div><div class='del'>-static int ext4_da_should_update_i_disksize(struct page *page,</div><div class='add'>+static int ext4_da_should_update_i_disksize(struct folio *folio,</div><div class='ctx'> 					    unsigned long offset)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	unsigned int idx;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	bh = page_buffers(page);</div><div class='add'>+	bh = folio_buffers(folio);</div><div class='ctx'> 	idx = offset &gt;&gt; inode-&gt;i_blkbits;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; idx; i++)</div><div class='hunk'>@@ -3012,51 +3196,100 @@ static int ext4_da_should_update_i_disksize(struct page *page,</div><div class='ctx'> 	return 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext4_da_write_end(struct file *file,</div><div class='add'>+static int ext4_da_do_write_end(struct address_space *mapping,</div><div class='add'>+			loff_t pos, unsigned len, unsigned copied,</div><div class='add'>+			struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = mapping-&gt;host;</div><div class='add'>+	loff_t old_size = inode-&gt;i_size;</div><div class='add'>+	bool disksize_changed = false;</div><div class='add'>+	loff_t new_i_size, zero_len = 0;</div><div class='add'>+	handle_t *handle;</div><div class='add'>+</div><div class='add'>+	if (unlikely(!folio_buffers(folio))) {</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+	/*</div><div class='add'>+	 * block_write_end() will mark the inode as dirty with I_DIRTY_PAGES</div><div class='add'>+	 * flag, which all that's needed to trigger page writeback.</div><div class='add'>+	 */</div><div class='add'>+	copied = block_write_end(pos, len, copied, folio);</div><div class='add'>+	new_i_size = pos + copied;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * It's important to update i_size while still holding folio lock,</div><div class='add'>+	 * because folio writeout could otherwise come in and zero beyond</div><div class='add'>+	 * i_size.</div><div class='add'>+	 *</div><div class='add'>+	 * Since we are holding inode lock, we are sure i_disksize &lt;=</div><div class='add'>+	 * i_size. We also know that if i_disksize &lt; i_size, there are</div><div class='add'>+	 * delalloc writes pending in the range up to i_size. If the end of</div><div class='add'>+	 * the current write is &lt;= i_size, there's no need to touch</div><div class='add'>+	 * i_disksize since writeback will push i_disksize up to i_size</div><div class='add'>+	 * eventually. If the end of the current write is &gt; i_size and</div><div class='add'>+	 * inside an allocated block which ext4_da_should_update_i_disksize()</div><div class='add'>+	 * checked, we need to update i_disksize here as certain</div><div class='add'>+	 * ext4_writepages() paths not allocating blocks and update i_disksize.</div><div class='add'>+	 */</div><div class='add'>+	if (new_i_size &gt; inode-&gt;i_size) {</div><div class='add'>+		unsigned long end;</div><div class='add'>+</div><div class='add'>+		i_size_write(inode, new_i_size);</div><div class='add'>+		end = offset_in_folio(folio, new_i_size - 1);</div><div class='add'>+		if (copied &amp;&amp; ext4_da_should_update_i_disksize(folio, end)) {</div><div class='add'>+			ext4_update_i_disksize(inode, new_i_size);</div><div class='add'>+			disksize_changed = true;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='add'>+</div><div class='add'>+	if (pos &gt; old_size) {</div><div class='add'>+		pagecache_isize_extended(inode, old_size, pos);</div><div class='add'>+		zero_len = pos - old_size;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!disksize_changed &amp;&amp; !zero_len)</div><div class='add'>+		return copied;</div><div class='add'>+</div><div class='add'>+	handle = ext4_journal_start(inode, EXT4_HT_INODE, 2);</div><div class='add'>+	if (IS_ERR(handle))</div><div class='add'>+		return PTR_ERR(handle);</div><div class='add'>+	if (zero_len)</div><div class='add'>+		ext4_zero_partial_blocks(handle, inode, old_size, zero_len);</div><div class='add'>+	ext4_mark_inode_dirty(handle, inode);</div><div class='add'>+	ext4_journal_stop(handle);</div><div class='add'>+</div><div class='add'>+	return copied;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ext4_da_write_end(const struct kiocb *iocb,</div><div class='ctx'> 			     struct address_space *mapping,</div><div class='ctx'> 			     loff_t pos, unsigned len, unsigned copied,</div><div class='del'>-			     struct page *page, void *fsdata)</div><div class='add'>+			     struct folio *folio, void *fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='del'>-	loff_t new_i_size;</div><div class='del'>-	unsigned long start, end;</div><div class='ctx'> 	int write_mode = (int)(unsigned long)fsdata;</div><div class='ctx'> </div><div class='ctx'> 	if (write_mode == FALL_BACK_TO_NONDELALLOC)</div><div class='del'>-		return ext4_write_end(file, mapping, pos,</div><div class='del'>-				      len, copied, page, fsdata);</div><div class='add'>+		return ext4_write_end(iocb, mapping, pos,</div><div class='add'>+				      len, copied, folio, fsdata);</div><div class='ctx'> </div><div class='ctx'> 	trace_ext4_da_write_end(inode, pos, len, copied);</div><div class='ctx'> </div><div class='ctx'> 	if (write_mode != CONVERT_INLINE_DATA &amp;&amp;</div><div class='ctx'> 	    ext4_test_inode_state(inode, EXT4_STATE_MAY_INLINE_DATA) &amp;&amp;</div><div class='ctx'> 	    ext4_has_inline_data(inode))</div><div class='del'>-		return ext4_write_inline_data_end(inode, pos, len, copied, page);</div><div class='del'>-</div><div class='del'>-	start = pos &amp; (PAGE_SIZE - 1);</div><div class='del'>-	end = start + copied - 1;</div><div class='add'>+		return ext4_write_inline_data_end(inode, pos, len, copied,</div><div class='add'>+						  folio);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Since we are holding inode lock, we are sure i_disksize &lt;=</div><div class='del'>-	 * i_size. We also know that if i_disksize &lt; i_size, there are</div><div class='del'>-	 * delalloc writes pending in the range upto i_size. If the end of</div><div class='del'>-	 * the current write is &lt;= i_size, there's no need to touch</div><div class='del'>-	 * i_disksize since writeback will push i_disksize upto i_size</div><div class='del'>-	 * eventually. If the end of the current write is &gt; i_size and</div><div class='del'>-	 * inside an allocated block (ext4_da_should_update_i_disksize()</div><div class='del'>-	 * check), we need to update i_disksize here as neither</div><div class='del'>-	 * ext4_writepage() nor certain ext4_writepages() paths not</div><div class='del'>-	 * allocating blocks update i_disksize.</div><div class='del'>-	 *</div><div class='del'>-	 * Note that we defer inode dirtying to generic_write_end() /</div><div class='del'>-	 * ext4_da_write_inline_data_end().</div><div class='del'>-	 */</div><div class='del'>-	new_i_size = pos + copied;</div><div class='del'>-	if (copied &amp;&amp; new_i_size &gt; inode-&gt;i_size &amp;&amp;</div><div class='del'>-	    ext4_da_should_update_i_disksize(page, end))</div><div class='del'>-		ext4_update_i_disksize(inode, new_i_size);</div><div class='add'>+	if (unlikely(copied &lt; len) &amp;&amp; !folio_test_uptodate(folio))</div><div class='add'>+		copied = 0;</div><div class='ctx'> </div><div class='del'>-	return generic_write_end(file, mapping, pos, len, copied, page, fsdata);</div><div class='add'>+	return ext4_da_do_write_end(mapping, pos, len, copied, folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -3120,70 +3353,45 @@ int ext4_alloc_da_blocks(struct inode *inode)</div><div class='ctx'> static sector_t ext4_bmap(struct address_space *mapping, sector_t block)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='del'>-	journal_t *journal;</div><div class='del'>-	int err;</div><div class='add'>+	sector_t ret = 0;</div><div class='ctx'> </div><div class='add'>+	inode_lock_shared(inode);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We can get here for an inline file via the FIBMAP ioctl</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (ext4_has_inline_data(inode))</div><div class='del'>-		return 0;</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='ctx'> 	if (mapping_tagged(mapping, PAGECACHE_TAG_DIRTY) &amp;&amp;</div><div class='del'>-			test_opt(inode-&gt;i_sb, DELALLOC)) {</div><div class='add'>+	    (test_opt(inode-&gt;i_sb, DELALLOC) ||</div><div class='add'>+	     ext4_should_journal_data(inode))) {</div><div class='ctx'> 		/*</div><div class='del'>-		 * With delalloc we want to sync the file</div><div class='del'>-		 * so that we can make sure we allocate</div><div class='del'>-		 * blocks for file</div><div class='add'>+		 * With delalloc or journalled data we want to sync the file so</div><div class='add'>+		 * that we can make sure we allocate blocks for file and data</div><div class='add'>+		 * is in place for the user to see it</div><div class='ctx'> 		 */</div><div class='ctx'> 		filemap_write_and_wait(mapping);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (EXT4_JOURNAL(inode) &amp;&amp;</div><div class='del'>-	    ext4_test_inode_state(inode, EXT4_STATE_JDATA)) {</div><div class='del'>-		/*</div><div class='del'>-		 * This is a REALLY heavyweight approach, but the use of</div><div class='del'>-		 * bmap on dirty files is expected to be extremely rare:</div><div class='del'>-		 * only if we run lilo or swapon on a freshly made file</div><div class='del'>-		 * do we expect this to happen.</div><div class='del'>-		 *</div><div class='del'>-		 * (bmap requires CAP_SYS_RAWIO so this does not</div><div class='del'>-		 * represent an unprivileged user DOS attack --- we'd be</div><div class='del'>-		 * in trouble if mortal users could trigger this path at</div><div class='del'>-		 * will.)</div><div class='del'>-		 *</div><div class='del'>-		 * NB. EXT4_STATE_JDATA is not set on files other than</div><div class='del'>-		 * regular files.  If somebody wants to bmap a directory</div><div class='del'>-		 * or symlink and gets confused because the buffer</div><div class='del'>-		 * hasn't yet been flushed to disk, they deserve</div><div class='del'>-		 * everything they get.</div><div class='del'>-		 */</div><div class='add'>+	ret = iomap_bmap(mapping, block, &amp;ext4_iomap_ops);</div><div class='ctx'> </div><div class='del'>-		ext4_clear_inode_state(inode, EXT4_STATE_JDATA);</div><div class='del'>-		journal = EXT4_JOURNAL(inode);</div><div class='del'>-		jbd2_journal_lock_updates(journal);</div><div class='del'>-		err = jbd2_journal_flush(journal, 0);</div><div class='del'>-		jbd2_journal_unlock_updates(journal);</div><div class='del'>-</div><div class='del'>-		if (err)</div><div class='del'>-			return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return iomap_bmap(mapping, block, &amp;ext4_iomap_ops);</div><div class='add'>+out:</div><div class='add'>+	inode_unlock_shared(inode);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext4_readpage(struct file *file, struct page *page)</div><div class='add'>+static int ext4_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = -EAGAIN;</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> </div><div class='del'>-	trace_ext4_readpage(page);</div><div class='add'>+	trace_ext4_read_folio(inode, folio);</div><div class='ctx'> </div><div class='ctx'> 	if (ext4_has_inline_data(inode))</div><div class='del'>-		ret = ext4_readpage_inline(inode, page);</div><div class='add'>+		ret = ext4_readpage_inline(inode, folio);</div><div class='ctx'> </div><div class='ctx'> 	if (ret == -EAGAIN)</div><div class='del'>-		return ext4_mpage_readpages(inode, NULL, page);</div><div class='add'>+		return ext4_mpage_readpages(inode, NULL, folio);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -3199,55 +3407,55 @@ static void ext4_readahead(struct readahead_control *rac)</div><div class='ctx'> 	ext4_mpage_readpages(inode, rac, NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void ext4_invalidatepage(struct page *page, unsigned int offset,</div><div class='del'>-				unsigned int length)</div><div class='add'>+static void ext4_invalidate_folio(struct folio *folio, size_t offset,</div><div class='add'>+				size_t length)</div><div class='ctx'> {</div><div class='del'>-	trace_ext4_invalidatepage(page, offset, length);</div><div class='add'>+	trace_ext4_invalidate_folio(folio, offset, length);</div><div class='ctx'> </div><div class='ctx'> 	/* No journalling happens on data buffers when this function is used */</div><div class='del'>-	WARN_ON(page_has_buffers(page) &amp;&amp; buffer_jbd(page_buffers(page)));</div><div class='add'>+	WARN_ON(folio_buffers(folio) &amp;&amp; buffer_jbd(folio_buffers(folio)));</div><div class='ctx'> </div><div class='del'>-	block_invalidatepage(page, offset, length);</div><div class='add'>+	block_invalidate_folio(folio, offset, length);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __ext4_journalled_invalidatepage(struct page *page,</div><div class='del'>-					    unsigned int offset,</div><div class='del'>-					    unsigned int length)</div><div class='add'>+static int __ext4_journalled_invalidate_folio(struct folio *folio,</div><div class='add'>+					    size_t offset, size_t length)</div><div class='ctx'> {</div><div class='del'>-	journal_t *journal = EXT4_JOURNAL(page-&gt;mapping-&gt;host);</div><div class='add'>+	journal_t *journal = EXT4_JOURNAL(folio-&gt;mapping-&gt;host);</div><div class='ctx'> </div><div class='del'>-	trace_ext4_journalled_invalidatepage(page, offset, length);</div><div class='add'>+	trace_ext4_journalled_invalidate_folio(folio, offset, length);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If it's a full truncate we just forget about the pending dirtying</div><div class='ctx'> 	 */</div><div class='del'>-	if (offset == 0 &amp;&amp; length == PAGE_SIZE)</div><div class='del'>-		ClearPageChecked(page);</div><div class='add'>+	if (offset == 0 &amp;&amp; length == folio_size(folio))</div><div class='add'>+		folio_clear_checked(folio);</div><div class='ctx'> </div><div class='del'>-	return jbd2_journal_invalidatepage(journal, page, offset, length);</div><div class='add'>+	return jbd2_journal_invalidate_folio(journal, folio, offset, length);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Wrapper for aops... */</div><div class='del'>-static void ext4_journalled_invalidatepage(struct page *page,</div><div class='del'>-					   unsigned int offset,</div><div class='del'>-					   unsigned int length)</div><div class='add'>+static void ext4_journalled_invalidate_folio(struct folio *folio,</div><div class='add'>+					   size_t offset,</div><div class='add'>+					   size_t length)</div><div class='ctx'> {</div><div class='del'>-	WARN_ON(__ext4_journalled_invalidatepage(page, offset, length) &lt; 0);</div><div class='add'>+	WARN_ON(__ext4_journalled_invalidate_folio(folio, offset, length) &lt; 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext4_releasepage(struct page *page, gfp_t wait)</div><div class='add'>+static bool ext4_release_folio(struct folio *folio, gfp_t wait)</div><div class='ctx'> {</div><div class='del'>-	journal_t *journal = EXT4_JOURNAL(page-&gt;mapping-&gt;host);</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+	journal_t *journal = EXT4_JOURNAL(inode);</div><div class='ctx'> </div><div class='del'>-	trace_ext4_releasepage(page);</div><div class='add'>+	trace_ext4_release_folio(inode, folio);</div><div class='ctx'> </div><div class='ctx'> 	/* Page has dirty journalled data -&gt; cannot release */</div><div class='del'>-	if (PageChecked(page))</div><div class='del'>-		return 0;</div><div class='add'>+	if (folio_test_checked(folio))</div><div class='add'>+		return false;</div><div class='ctx'> 	if (journal)</div><div class='del'>-		return jbd2_journal_try_to_free_buffers(journal, page);</div><div class='add'>+		return jbd2_journal_try_to_free_buffers(journal, folio);</div><div class='ctx'> 	else</div><div class='del'>-		return try_to_free_buffers(page);</div><div class='add'>+		return try_to_free_buffers(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool ext4_inode_datasync_dirty(struct inode *inode)</div><div class='hunk'>@@ -3264,14 +3472,14 @@ static bool ext4_inode_datasync_dirty(struct inode *inode)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Any metadata buffers to write? */</div><div class='del'>-	if (!list_empty(&amp;inode-&gt;i_mapping-&gt;private_list))</div><div class='add'>+	if (!list_empty(&amp;inode-&gt;i_mapping-&gt;i_private_list))</div><div class='ctx'> 		return true;</div><div class='del'>-	return inode-&gt;i_state &amp; I_DIRTY_DATASYNC;</div><div class='add'>+	return inode_state_read_once(inode) &amp; I_DIRTY_DATASYNC;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void ext4_set_iomap(struct inode *inode, struct iomap *iomap,</div><div class='ctx'> 			   struct ext4_map_blocks *map, loff_t offset,</div><div class='del'>-			   loff_t length)</div><div class='add'>+			   loff_t length, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	u8 blkbits = inode-&gt;i_blkbits;</div><div class='ctx'> </div><div class='hunk'>@@ -3288,10 +3496,16 @@ static void ext4_set_iomap(struct inode *inode, struct iomap *iomap,</div><div class='ctx'> 	if (map-&gt;m_flags &amp; EXT4_MAP_NEW)</div><div class='ctx'> 		iomap-&gt;flags |= IOMAP_F_NEW;</div><div class='ctx'> </div><div class='del'>-	iomap-&gt;bdev = inode-&gt;i_sb-&gt;s_bdev;</div><div class='del'>-	iomap-&gt;dax_dev = EXT4_SB(inode-&gt;i_sb)-&gt;s_daxdev;</div><div class='del'>-	iomap-&gt;offset = (u64) map-&gt;m_lblk &lt;&lt; blkbits;</div><div class='del'>-	iomap-&gt;length = (u64) map-&gt;m_len &lt;&lt; blkbits;</div><div class='add'>+	/* HW-offload atomics are always used */</div><div class='add'>+	if (flags &amp; IOMAP_ATOMIC)</div><div class='add'>+		iomap-&gt;flags |= IOMAP_F_ATOMIC_BIO;</div><div class='add'>+</div><div class='add'>+	if (flags &amp; IOMAP_DAX)</div><div class='add'>+		iomap-&gt;dax_dev = EXT4_SB(inode-&gt;i_sb)-&gt;s_daxdev;</div><div class='add'>+	else</div><div class='add'>+		iomap-&gt;bdev = inode-&gt;i_sb-&gt;s_bdev;</div><div class='add'>+	iomap-&gt;offset = EXT4_LBLK_TO_B(inode, map-&gt;m_lblk);</div><div class='add'>+	iomap-&gt;length = EXT4_LBLK_TO_B(inode, map-&gt;m_len);</div><div class='ctx'> </div><div class='ctx'> 	if ((map-&gt;m_flags &amp; EXT4_MAP_MAPPED) &amp;&amp;</div><div class='ctx'> 	    !ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS))</div><div class='hunk'>@@ -3309,21 +3523,164 @@ static void ext4_set_iomap(struct inode *inode, struct iomap *iomap,</div><div class='ctx'> 	if (map-&gt;m_flags &amp; EXT4_MAP_UNWRITTEN) {</div><div class='ctx'> 		iomap-&gt;type = IOMAP_UNWRITTEN;</div><div class='ctx'> 		iomap-&gt;addr = (u64) map-&gt;m_pblk &lt;&lt; blkbits;</div><div class='add'>+		if (flags &amp; IOMAP_DAX)</div><div class='add'>+			iomap-&gt;addr += EXT4_SB(inode-&gt;i_sb)-&gt;s_dax_part_off;</div><div class='ctx'> 	} else if (map-&gt;m_flags &amp; EXT4_MAP_MAPPED) {</div><div class='ctx'> 		iomap-&gt;type = IOMAP_MAPPED;</div><div class='ctx'> 		iomap-&gt;addr = (u64) map-&gt;m_pblk &lt;&lt; blkbits;</div><div class='add'>+		if (flags &amp; IOMAP_DAX)</div><div class='add'>+			iomap-&gt;addr += EXT4_SB(inode-&gt;i_sb)-&gt;s_dax_part_off;</div><div class='add'>+	} else if (map-&gt;m_flags &amp; EXT4_MAP_DELAYED) {</div><div class='add'>+		iomap-&gt;type = IOMAP_DELALLOC;</div><div class='add'>+		iomap-&gt;addr = IOMAP_NULL_ADDR;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		iomap-&gt;type = IOMAP_HOLE;</div><div class='ctx'> 		iomap-&gt;addr = IOMAP_NULL_ADDR;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int ext4_map_blocks_atomic_write_slow(handle_t *handle,</div><div class='add'>+			struct inode *inode, struct ext4_map_blocks *map)</div><div class='add'>+{</div><div class='add'>+	ext4_lblk_t m_lblk = map-&gt;m_lblk;</div><div class='add'>+	unsigned int m_len = map-&gt;m_len;</div><div class='add'>+	unsigned int mapped_len = 0, m_flags = 0;</div><div class='add'>+	ext4_fsblk_t next_pblk = 0;</div><div class='add'>+	bool check_next_pblk = false;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	WARN_ON_ONCE(!ext4_has_feature_bigalloc(inode-&gt;i_sb));</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This is a slow path in case of mixed mapping. We use</div><div class='add'>+	 * EXT4_GET_BLOCKS_CREATE_ZERO flag here to make sure we get a single</div><div class='add'>+	 * contiguous mapped mapping. This will ensure any unwritten or hole</div><div class='add'>+	 * regions within the requested range is zeroed out and we return</div><div class='add'>+	 * a single contiguous mapped extent.</div><div class='add'>+	 */</div><div class='add'>+	m_flags = EXT4_GET_BLOCKS_CREATE_ZERO;</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		ret = ext4_map_blocks(handle, inode, map, m_flags);</div><div class='add'>+		if (ret &lt; 0 &amp;&amp; ret != -ENOSPC)</div><div class='add'>+			goto out_err;</div><div class='add'>+		/*</div><div class='add'>+		 * This should never happen, but let's return an error code to</div><div class='add'>+		 * avoid an infinite loop in here.</div><div class='add'>+		 */</div><div class='add'>+		if (ret == 0) {</div><div class='add'>+			ret = -EFSCORRUPTED;</div><div class='add'>+			ext4_warning_inode(inode,</div><div class='add'>+				"ext4_map_blocks() couldn't allocate blocks m_flags: 0x%x, ret:%d",</div><div class='add'>+				m_flags, ret);</div><div class='add'>+			goto out_err;</div><div class='add'>+		}</div><div class='add'>+		/*</div><div class='add'>+		 * With bigalloc we should never get ENOSPC nor discontiguous</div><div class='add'>+		 * physical extents.</div><div class='add'>+		 */</div><div class='add'>+		if ((check_next_pblk &amp;&amp; next_pblk != map-&gt;m_pblk) ||</div><div class='add'>+				ret == -ENOSPC) {</div><div class='add'>+			ext4_warning_inode(inode,</div><div class='add'>+				"Non-contiguous allocation detected: expected %llu, got %llu, "</div><div class='add'>+				"or ext4_map_blocks() returned out of space ret: %d",</div><div class='add'>+				next_pblk, map-&gt;m_pblk, ret);</div><div class='add'>+			ret = -EFSCORRUPTED;</div><div class='add'>+			goto out_err;</div><div class='add'>+		}</div><div class='add'>+		next_pblk = map-&gt;m_pblk + map-&gt;m_len;</div><div class='add'>+		check_next_pblk = true;</div><div class='add'>+</div><div class='add'>+		mapped_len += map-&gt;m_len;</div><div class='add'>+		map-&gt;m_lblk += map-&gt;m_len;</div><div class='add'>+		map-&gt;m_len = m_len - mapped_len;</div><div class='add'>+	} while (mapped_len &lt; m_len);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We might have done some work in above loop, so we need to query the</div><div class='add'>+	 * start of the physical extent, based on the origin m_lblk and m_len.</div><div class='add'>+	 * Let's also ensure we were able to allocate the required range for</div><div class='add'>+	 * mixed mapping case.</div><div class='add'>+	 */</div><div class='add'>+	map-&gt;m_lblk = m_lblk;</div><div class='add'>+	map-&gt;m_len = m_len;</div><div class='add'>+	map-&gt;m_flags = 0;</div><div class='add'>+</div><div class='add'>+	ret = ext4_map_blocks(handle, inode, map,</div><div class='add'>+			      EXT4_GET_BLOCKS_QUERY_LAST_IN_LEAF);</div><div class='add'>+	if (ret != m_len) {</div><div class='add'>+		ext4_warning_inode(inode,</div><div class='add'>+			"allocation failed for atomic write request m_lblk:%u, m_len:%u, ret:%d\n",</div><div class='add'>+			m_lblk, m_len, ret);</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='add'>+</div><div class='add'>+out_err:</div><div class='add'>+	/* reset map before returning an error */</div><div class='add'>+	map-&gt;m_lblk = m_lblk;</div><div class='add'>+	map-&gt;m_len = m_len;</div><div class='add'>+	map-&gt;m_flags = 0;</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * ext4_map_blocks_atomic: Helper routine to ensure the entire requested</div><div class='add'>+ * range in @map [lblk, lblk + len) is one single contiguous extent with no</div><div class='add'>+ * mixed mappings.</div><div class='add'>+ *</div><div class='add'>+ * We first use m_flags passed to us by our caller (ext4_iomap_alloc()).</div><div class='add'>+ * We only call EXT4_GET_BLOCKS_ZERO in the slow path, when the underlying</div><div class='add'>+ * physical extent for the requested range does not have a single contiguous</div><div class='add'>+ * mapping type i.e. (Hole, Mapped, or Unwritten) throughout.</div><div class='add'>+ * In that case we will loop over the requested range to allocate and zero out</div><div class='add'>+ * the unwritten / holes in between, to get a single mapped extent from</div><div class='add'>+ * [m_lblk, m_lblk +  m_len). Note that this is only possible because we know</div><div class='add'>+ * this can be called only with bigalloc enabled filesystem where the underlying</div><div class='add'>+ * cluster is already allocated. This avoids allocating discontiguous extents</div><div class='add'>+ * in the slow path due to multiple calls to ext4_map_blocks().</div><div class='add'>+ * The slow path is mostly non-performance critical path, so it should be ok to</div><div class='add'>+ * loop using ext4_map_blocks() with appropriate flags to allocate &amp; zero the</div><div class='add'>+ * underlying short holes/unwritten extents within the requested range.</div><div class='add'>+ */</div><div class='add'>+static int ext4_map_blocks_atomic_write(handle_t *handle, struct inode *inode,</div><div class='add'>+				struct ext4_map_blocks *map, int m_flags,</div><div class='add'>+				bool *force_commit)</div><div class='add'>+{</div><div class='add'>+	ext4_lblk_t m_lblk = map-&gt;m_lblk;</div><div class='add'>+	unsigned int m_len = map-&gt;m_len;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	WARN_ON_ONCE(m_len &gt; 1 &amp;&amp; !ext4_has_feature_bigalloc(inode-&gt;i_sb));</div><div class='add'>+</div><div class='add'>+	ret = ext4_map_blocks(handle, inode, map, m_flags);</div><div class='add'>+	if (ret &lt; 0 || ret == m_len)</div><div class='add'>+		goto out;</div><div class='add'>+	/*</div><div class='add'>+	 * This is a mixed mapping case where we were not able to allocate</div><div class='add'>+	 * a single contiguous extent. In that case let's reset requested</div><div class='add'>+	 * mapping and call the slow path.</div><div class='add'>+	 */</div><div class='add'>+	map-&gt;m_lblk = m_lblk;</div><div class='add'>+	map-&gt;m_len = m_len;</div><div class='add'>+	map-&gt;m_flags = 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * slow path means we have mixed mapping, that means we will need</div><div class='add'>+	 * to force txn commit.</div><div class='add'>+	 */</div><div class='add'>+	*force_commit = true;</div><div class='add'>+	return ext4_map_blocks_atomic_write_slow(handle, inode, map);</div><div class='add'>+out:</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int ext4_iomap_alloc(struct inode *inode, struct ext4_map_blocks *map,</div><div class='ctx'> 			    unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	handle_t *handle;</div><div class='del'>-	u8 blkbits = inode-&gt;i_blkbits;</div><div class='ctx'> 	int ret, dio_credits, m_flags = 0, retries = 0;</div><div class='add'>+	bool force_commit = false;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Trim the mapping request to the maximum value that we can map at</div><div class='hunk'>@@ -3331,7 +3688,30 @@ static int ext4_iomap_alloc(struct inode *inode, struct ext4_map_blocks *map,</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (map-&gt;m_len &gt; DIO_MAX_BLOCKS)</div><div class='ctx'> 		map-&gt;m_len = DIO_MAX_BLOCKS;</div><div class='del'>-	dio_credits = ext4_chunk_trans_blocks(inode, map-&gt;m_len);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * journal credits estimation for atomic writes. We call</div><div class='add'>+	 * ext4_map_blocks(), to find if there could be a mixed mapping. If yes,</div><div class='add'>+	 * then let's assume the no. of pextents required can be m_len i.e.</div><div class='add'>+	 * every alternate block can be unwritten and hole.</div><div class='add'>+	 */</div><div class='add'>+	if (flags &amp; IOMAP_ATOMIC) {</div><div class='add'>+		unsigned int orig_mlen = map-&gt;m_len;</div><div class='add'>+</div><div class='add'>+		ret = ext4_map_blocks(NULL, inode, map, 0);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='add'>+		if (map-&gt;m_len &lt; orig_mlen) {</div><div class='add'>+			map-&gt;m_len = orig_mlen;</div><div class='add'>+			dio_credits = ext4_meta_trans_blocks(inode, orig_mlen,</div><div class='add'>+							     map-&gt;m_len);</div><div class='add'>+		} else {</div><div class='add'>+			dio_credits = ext4_chunk_trans_blocks(inode,</div><div class='add'>+							      map-&gt;m_len);</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		dio_credits = ext4_chunk_trans_blocks(inode, map-&gt;m_len);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> retry:</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -3348,8 +3728,8 @@ retry:</div><div class='ctx'> 	 * DAX and direct I/O are the only two operations that are currently</div><div class='ctx'> 	 * supported with IOMAP_WRITE.</div><div class='ctx'> 	 */</div><div class='del'>-	WARN_ON(!IS_DAX(inode) &amp;&amp; !(flags &amp; IOMAP_DIRECT));</div><div class='del'>-	if (IS_DAX(inode))</div><div class='add'>+	WARN_ON(!(flags &amp; (IOMAP_DAX | IOMAP_DIRECT)));</div><div class='add'>+	if (flags &amp; IOMAP_DAX)</div><div class='ctx'> 		m_flags = EXT4_GET_BLOCKS_CREATE_ZERO;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We use i_size instead of i_disksize here because delalloc writeback</div><div class='hunk'>@@ -3357,12 +3737,16 @@ retry:</div><div class='ctx'> 	 * i_disksize out to i_size. This could be beyond where direct I/O is</div><div class='ctx'> 	 * happening and thus expose allocated blocks to direct I/O reads.</div><div class='ctx'> 	 */</div><div class='del'>-	else if (((loff_t)map-&gt;m_lblk &lt;&lt; blkbits) &gt;= i_size_read(inode))</div><div class='add'>+	else if (EXT4_LBLK_TO_B(inode, map-&gt;m_lblk) &gt;= i_size_read(inode))</div><div class='ctx'> 		m_flags = EXT4_GET_BLOCKS_CREATE;</div><div class='ctx'> 	else if (ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS))</div><div class='ctx'> 		m_flags = EXT4_GET_BLOCKS_IO_CREATE_EXT;</div><div class='ctx'> </div><div class='del'>-	ret = ext4_map_blocks(handle, inode, map, m_flags);</div><div class='add'>+	if (flags &amp; IOMAP_ATOMIC)</div><div class='add'>+		ret = ext4_map_blocks_atomic_write(handle, inode, map, m_flags,</div><div class='add'>+						   &amp;force_commit);</div><div class='add'>+	else</div><div class='add'>+		ret = ext4_map_blocks(handle, inode, map, m_flags);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We cannot fill holes in indirect tree based inodes as that could</div><div class='hunk'>@@ -3376,6 +3760,22 @@ retry:</div><div class='ctx'> 	if (ret == -ENOSPC &amp;&amp; ext4_should_retry_alloc(inode-&gt;i_sb, &amp;retries))</div><div class='ctx'> 		goto retry;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Force commit the current transaction if the allocation spans a mixed</div><div class='add'>+	 * mapping range. This ensures any pending metadata updates (like</div><div class='add'>+	 * unwritten to written extents conversion) in this range are in</div><div class='add'>+	 * consistent state with the file data blocks, before performing the</div><div class='add'>+	 * actual write I/O. If the commit fails, the whole I/O must be aborted</div><div class='add'>+	 * to prevent any possible torn writes.</div><div class='add'>+	 */</div><div class='add'>+	if (ret &gt; 0 &amp;&amp; force_commit) {</div><div class='add'>+		int ret2;</div><div class='add'>+</div><div class='add'>+		ret2 = ext4_force_commit(inode-&gt;i_sb);</div><div class='add'>+		if (ret2)</div><div class='add'>+			return ret2;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3386,6 +3786,7 @@ static int ext4_iomap_begin(struct inode *inode, loff_t offset, loff_t length,</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct ext4_map_blocks map;</div><div class='ctx'> 	u8 blkbits = inode-&gt;i_blkbits;</div><div class='add'>+	unsigned int orig_mlen;</div><div class='ctx'> </div><div class='ctx'> 	if ((offset &gt;&gt; blkbits) &gt; EXT4_MAX_LOGICAL_BLOCK)</div><div class='ctx'> 		return -EINVAL;</div><div class='hunk'>@@ -3399,6 +3800,7 @@ static int ext4_iomap_begin(struct inode *inode, loff_t offset, loff_t length,</div><div class='ctx'> 	map.m_lblk = offset &gt;&gt; blkbits;</div><div class='ctx'> 	map.m_len = min_t(loff_t, (offset + length - 1) &gt;&gt; blkbits,</div><div class='ctx'> 			  EXT4_MAX_LOGICAL_BLOCK) - map.m_lblk + 1;</div><div class='add'>+	orig_mlen = map.m_len;</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; IOMAP_WRITE) {</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -3409,18 +3811,47 @@ static int ext4_iomap_begin(struct inode *inode, loff_t offset, loff_t length,</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (offset + length &lt;= i_size_read(inode)) {</div><div class='ctx'> 			ret = ext4_map_blocks(NULL, inode, &amp;map, 0);</div><div class='del'>-			if (ret &gt; 0 &amp;&amp; (map.m_flags &amp; EXT4_MAP_MAPPED))</div><div class='del'>-				goto out;</div><div class='add'>+			/*</div><div class='add'>+			 * For atomic writes the entire requested length should</div><div class='add'>+			 * be mapped.</div><div class='add'>+			 */</div><div class='add'>+			if (map.m_flags &amp; EXT4_MAP_MAPPED) {</div><div class='add'>+				if ((!(flags &amp; IOMAP_ATOMIC) &amp;&amp; ret &gt; 0) ||</div><div class='add'>+				   (flags &amp; IOMAP_ATOMIC &amp;&amp; ret &gt;= orig_mlen))</div><div class='add'>+					goto out;</div><div class='add'>+			}</div><div class='add'>+			map.m_len = orig_mlen;</div><div class='ctx'> 		}</div><div class='ctx'> 		ret = ext4_iomap_alloc(inode, &amp;map, flags);</div><div class='ctx'> 	} else {</div><div class='add'>+		/*</div><div class='add'>+		 * This can be called for overwrites path from</div><div class='add'>+		 * ext4_iomap_overwrite_begin().</div><div class='add'>+		 */</div><div class='ctx'> 		ret = ext4_map_blocks(NULL, inode, &amp;map, 0);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> out:</div><div class='del'>-	ext4_set_iomap(inode, iomap, &amp;map, offset, length);</div><div class='add'>+	/*</div><div class='add'>+	 * When inline encryption is enabled, sometimes I/O to an encrypted file</div><div class='add'>+	 * has to be broken up to guarantee DUN contiguity.  Handle this by</div><div class='add'>+	 * limiting the length of the mapping returned.</div><div class='add'>+	 */</div><div class='add'>+	map.m_len = fscrypt_limit_io_blocks(inode, map.m_lblk, map.m_len);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Before returning to iomap, let's ensure the allocated mapping</div><div class='add'>+	 * covers the entire requested length for atomic writes.</div><div class='add'>+	 */</div><div class='add'>+	if (flags &amp; IOMAP_ATOMIC) {</div><div class='add'>+		if (map.m_len &lt; (length &gt;&gt; blkbits)) {</div><div class='add'>+			WARN_ON_ONCE(1);</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	ext4_set_iomap(inode, iomap, &amp;map, offset, length, flags);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -3437,65 +3868,23 @@ static int ext4_iomap_overwrite_begin(struct inode *inode, loff_t offset,</div><div class='ctx'> 	 */</div><div class='ctx'> 	flags &amp;= ~IOMAP_WRITE;</div><div class='ctx'> 	ret = ext4_iomap_begin(inode, offset, length, flags, iomap, srcmap);</div><div class='del'>-	WARN_ON_ONCE(iomap-&gt;type != IOMAP_MAPPED);</div><div class='add'>+	WARN_ON_ONCE(!ret &amp;&amp; iomap-&gt;type != IOMAP_MAPPED);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext4_iomap_end(struct inode *inode, loff_t offset, loff_t length,</div><div class='del'>-			  ssize_t written, unsigned flags, struct iomap *iomap)</div><div class='del'>-{</div><div class='del'>-	/*</div><div class='del'>-	 * Check to see whether an error occurred while writing out the data to</div><div class='del'>-	 * the allocated blocks. If so, return the magic error code so that we</div><div class='del'>-	 * fallback to buffered I/O and attempt to complete the remainder of</div><div class='del'>-	 * the I/O. Any blocks that may have been allocated in preparation for</div><div class='del'>-	 * the direct I/O will be reused during buffered I/O.</div><div class='del'>-	 */</div><div class='del'>-	if (flags &amp; (IOMAP_WRITE | IOMAP_DIRECT) &amp;&amp; written == 0)</div><div class='del'>-		return -ENOTBLK;</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> const struct iomap_ops ext4_iomap_ops = {</div><div class='ctx'> 	.iomap_begin		= ext4_iomap_begin,</div><div class='del'>-	.iomap_end		= ext4_iomap_end,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct iomap_ops ext4_iomap_overwrite_ops = {</div><div class='ctx'> 	.iomap_begin		= ext4_iomap_overwrite_begin,</div><div class='del'>-	.iomap_end		= ext4_iomap_end,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static bool ext4_iomap_is_delalloc(struct inode *inode,</div><div class='del'>-				   struct ext4_map_blocks *map)</div><div class='del'>-{</div><div class='del'>-	struct extent_status es;</div><div class='del'>-	ext4_lblk_t offset = 0, end = map-&gt;m_lblk + map-&gt;m_len - 1;</div><div class='del'>-</div><div class='del'>-	ext4_es_find_extent_range(inode, &amp;ext4_es_is_delayed,</div><div class='del'>-				  map-&gt;m_lblk, end, &amp;es);</div><div class='del'>-</div><div class='del'>-	if (!es.es_len || es.es_lblk &gt; end)</div><div class='del'>-		return false;</div><div class='del'>-</div><div class='del'>-	if (es.es_lblk &gt; map-&gt;m_lblk) {</div><div class='del'>-		map-&gt;m_len = es.es_lblk - map-&gt;m_lblk;</div><div class='del'>-		return false;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	offset = map-&gt;m_lblk - es.es_lblk;</div><div class='del'>-	map-&gt;m_len = es.es_len - offset;</div><div class='del'>-</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int ext4_iomap_begin_report(struct inode *inode, loff_t offset,</div><div class='ctx'> 				   loff_t length, unsigned int flags,</div><div class='ctx'> 				   struct iomap *iomap, struct iomap *srcmap)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='del'>-	bool delalloc = false;</div><div class='ctx'> 	struct ext4_map_blocks map;</div><div class='ctx'> 	u8 blkbits = inode-&gt;i_blkbits;</div><div class='ctx'> </div><div class='hunk'>@@ -3536,13 +3925,8 @@ static int ext4_iomap_begin_report(struct inode *inode, loff_t offset,</div><div class='ctx'> 	ret = ext4_map_blocks(NULL, inode, &amp;map, 0);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='del'>-	if (ret == 0)</div><div class='del'>-		delalloc = ext4_iomap_is_delalloc(inode, &amp;map);</div><div class='del'>-</div><div class='ctx'> set_iomap:</div><div class='del'>-	ext4_set_iomap(inode, iomap, &amp;map, offset, length);</div><div class='del'>-	if (delalloc &amp;&amp; iomap-&gt;type == IOMAP_HOLE)</div><div class='del'>-		iomap-&gt;type = IOMAP_DELALLOC;</div><div class='add'>+	ext4_set_iomap(inode, iomap, &amp;map, offset, length, flags);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -3552,29 +3936,34 @@ const struct iomap_ops ext4_iomap_report_ops = {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Pages can be marked dirty completely asynchronously from ext4's journalling</div><div class='del'>- * activity.  By filemap_sync_pte(), try_to_unmap_one(), etc.  We cannot do</div><div class='del'>- * much here because -&gt;set_page_dirty is called under VFS locks.  The page is</div><div class='del'>- * not necessarily locked.</div><div class='del'>- *</div><div class='del'>- * We cannot just dirty the page and leave attached buffers clean, because the</div><div class='del'>- * buffers' dirty state is "definitive".  We cannot just set the buffers dirty</div><div class='del'>- * or jbddirty because all the journalling code will explode.</div><div class='del'>- *</div><div class='del'>- * So what we do is to mark the page "pending dirty" and next time writepage</div><div class='del'>- * is called, propagate that into the buffers appropriately.</div><div class='add'>+ * For data=journal mode, folio should be marked dirty only when it was</div><div class='add'>+ * writeably mapped. When that happens, it was already attached to the</div><div class='add'>+ * transaction and marked as jbddirty (we take care of this in</div><div class='add'>+ * ext4_page_mkwrite()). On transaction commit, we writeprotect page mappings</div><div class='add'>+ * so we should have nothing to do here, except for the case when someone</div><div class='add'>+ * had the page pinned and dirtied the page through this pin (e.g. by doing</div><div class='add'>+ * direct IO to it). In that case we'd need to attach buffers here to the</div><div class='add'>+ * transaction but we cannot due to lock ordering.  We cannot just dirty the</div><div class='add'>+ * folio and leave attached buffers clean, because the buffers' dirty state is</div><div class='add'>+ * "definitive".  We cannot just set the buffers dirty or jbddirty because all</div><div class='add'>+ * the journalling code will explode.  So what we do is to mark the folio</div><div class='add'>+ * "pending dirty" and next time ext4_writepages() is called, attach buffers</div><div class='add'>+ * to the transaction appropriately.</div><div class='ctx'>  */</div><div class='del'>-static int ext4_journalled_set_page_dirty(struct page *page)</div><div class='add'>+static bool ext4_journalled_dirty_folio(struct address_space *mapping,</div><div class='add'>+		struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	SetPageChecked(page);</div><div class='del'>-	return __set_page_dirty_nobuffers(page);</div><div class='add'>+	WARN_ON_ONCE(!folio_buffers(folio));</div><div class='add'>+	if (folio_maybe_dma_pinned(folio))</div><div class='add'>+		folio_set_checked(folio);</div><div class='add'>+	return filemap_dirty_folio(mapping, folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext4_set_page_dirty(struct page *page)</div><div class='add'>+static bool ext4_dirty_folio(struct address_space *mapping, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	WARN_ON_ONCE(!PageLocked(page) &amp;&amp; !PageDirty(page));</div><div class='del'>-	WARN_ON_ONCE(!page_has_buffers(page));</div><div class='del'>-	return __set_page_dirty_buffers(page);</div><div class='add'>+	WARN_ON_ONCE(!folio_test_locked(folio) &amp;&amp; !folio_test_dirty(folio));</div><div class='add'>+	WARN_ON_ONCE(!folio_buffers(folio));</div><div class='add'>+	return block_dirty_folio(mapping, folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ext4_iomap_swap_activate(struct swap_info_struct *sis,</div><div class='hunk'>@@ -3585,64 +3974,57 @@ static int ext4_iomap_swap_activate(struct swap_info_struct *sis,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct address_space_operations ext4_aops = {</div><div class='del'>-	.readpage		= ext4_readpage,</div><div class='add'>+	.read_folio		= ext4_read_folio,</div><div class='ctx'> 	.readahead		= ext4_readahead,</div><div class='del'>-	.writepage		= ext4_writepage,</div><div class='ctx'> 	.writepages		= ext4_writepages,</div><div class='ctx'> 	.write_begin		= ext4_write_begin,</div><div class='ctx'> 	.write_end		= ext4_write_end,</div><div class='del'>-	.set_page_dirty		= ext4_set_page_dirty,</div><div class='add'>+	.dirty_folio		= ext4_dirty_folio,</div><div class='ctx'> 	.bmap			= ext4_bmap,</div><div class='del'>-	.invalidatepage		= ext4_invalidatepage,</div><div class='del'>-	.releasepage		= ext4_releasepage,</div><div class='del'>-	.direct_IO		= noop_direct_IO,</div><div class='del'>-	.migratepage		= buffer_migrate_page,</div><div class='add'>+	.invalidate_folio	= ext4_invalidate_folio,</div><div class='add'>+	.release_folio		= ext4_release_folio,</div><div class='add'>+	.migrate_folio		= buffer_migrate_folio,</div><div class='ctx'> 	.is_partially_uptodate  = block_is_partially_uptodate,</div><div class='del'>-	.error_remove_page	= generic_error_remove_page,</div><div class='add'>+	.error_remove_folio	= generic_error_remove_folio,</div><div class='ctx'> 	.swap_activate		= ext4_iomap_swap_activate,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct address_space_operations ext4_journalled_aops = {</div><div class='del'>-	.readpage		= ext4_readpage,</div><div class='add'>+	.read_folio		= ext4_read_folio,</div><div class='ctx'> 	.readahead		= ext4_readahead,</div><div class='del'>-	.writepage		= ext4_writepage,</div><div class='ctx'> 	.writepages		= ext4_writepages,</div><div class='ctx'> 	.write_begin		= ext4_write_begin,</div><div class='ctx'> 	.write_end		= ext4_journalled_write_end,</div><div class='del'>-	.set_page_dirty		= ext4_journalled_set_page_dirty,</div><div class='add'>+	.dirty_folio		= ext4_journalled_dirty_folio,</div><div class='ctx'> 	.bmap			= ext4_bmap,</div><div class='del'>-	.invalidatepage		= ext4_journalled_invalidatepage,</div><div class='del'>-	.releasepage		= ext4_releasepage,</div><div class='del'>-	.direct_IO		= noop_direct_IO,</div><div class='add'>+	.invalidate_folio	= ext4_journalled_invalidate_folio,</div><div class='add'>+	.release_folio		= ext4_release_folio,</div><div class='add'>+	.migrate_folio		= buffer_migrate_folio_norefs,</div><div class='ctx'> 	.is_partially_uptodate  = block_is_partially_uptodate,</div><div class='del'>-	.error_remove_page	= generic_error_remove_page,</div><div class='add'>+	.error_remove_folio	= generic_error_remove_folio,</div><div class='ctx'> 	.swap_activate		= ext4_iomap_swap_activate,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct address_space_operations ext4_da_aops = {</div><div class='del'>-	.readpage		= ext4_readpage,</div><div class='add'>+	.read_folio		= ext4_read_folio,</div><div class='ctx'> 	.readahead		= ext4_readahead,</div><div class='del'>-	.writepage		= ext4_writepage,</div><div class='ctx'> 	.writepages		= ext4_writepages,</div><div class='ctx'> 	.write_begin		= ext4_da_write_begin,</div><div class='ctx'> 	.write_end		= ext4_da_write_end,</div><div class='del'>-	.set_page_dirty		= ext4_set_page_dirty,</div><div class='add'>+	.dirty_folio		= ext4_dirty_folio,</div><div class='ctx'> 	.bmap			= ext4_bmap,</div><div class='del'>-	.invalidatepage		= ext4_invalidatepage,</div><div class='del'>-	.releasepage		= ext4_releasepage,</div><div class='del'>-	.direct_IO		= noop_direct_IO,</div><div class='del'>-	.migratepage		= buffer_migrate_page,</div><div class='add'>+	.invalidate_folio	= ext4_invalidate_folio,</div><div class='add'>+	.release_folio		= ext4_release_folio,</div><div class='add'>+	.migrate_folio		= buffer_migrate_folio,</div><div class='ctx'> 	.is_partially_uptodate  = block_is_partially_uptodate,</div><div class='del'>-	.error_remove_page	= generic_error_remove_page,</div><div class='add'>+	.error_remove_folio	= generic_error_remove_folio,</div><div class='ctx'> 	.swap_activate		= ext4_iomap_swap_activate,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct address_space_operations ext4_dax_aops = {</div><div class='ctx'> 	.writepages		= ext4_dax_writepages,</div><div class='del'>-	.direct_IO		= noop_direct_IO,</div><div class='del'>-	.set_page_dirty		= __set_page_dirty_no_writeback,</div><div class='add'>+	.dirty_folio		= noop_dirty_folio,</div><div class='ctx'> 	.bmap			= ext4_bmap,</div><div class='del'>-	.invalidatepage		= noop_invalidatepage,</div><div class='ctx'> 	.swap_activate		= ext4_iomap_swap_activate,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -3666,32 +4048,38 @@ void ext4_set_aops(struct inode *inode)</div><div class='ctx'> 		inode-&gt;i_mapping-&gt;a_ops = &amp;ext4_aops;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Here we can't skip an unwritten buffer even though it usually reads zero</div><div class='add'>+ * because it might have data in pagecache (eg, if called from ext4_zero_range,</div><div class='add'>+ * ext4_punch_hole, etc) which needs to be properly zeroed out. Otherwise a</div><div class='add'>+ * racing writeback can come later and flush the stale pagecache to disk.</div><div class='add'>+ */</div><div class='ctx'> static int __ext4_block_zero_page_range(handle_t *handle,</div><div class='ctx'> 		struct address_space *mapping, loff_t from, loff_t length)</div><div class='ctx'> {</div><div class='del'>-	ext4_fsblk_t index = from &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	unsigned offset = from &amp; (PAGE_SIZE-1);</div><div class='del'>-	unsigned blocksize, pos;</div><div class='add'>+	unsigned int offset, blocksize, pos;</div><div class='ctx'> 	ext4_lblk_t iblock;</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='del'>-	page = find_or_create_page(mapping, from &gt;&gt; PAGE_SHIFT,</div><div class='del'>-				   mapping_gfp_constraint(mapping, ~__GFP_FS));</div><div class='del'>-	if (!page)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	folio = __filemap_get_folio(mapping, from &gt;&gt; PAGE_SHIFT,</div><div class='add'>+				    FGP_LOCK | FGP_ACCESSED | FGP_CREAT,</div><div class='add'>+				    mapping_gfp_constraint(mapping, ~__GFP_FS));</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio);</div><div class='ctx'> </div><div class='ctx'> 	blocksize = inode-&gt;i_sb-&gt;s_blocksize;</div><div class='ctx'> </div><div class='del'>-	iblock = index &lt;&lt; (PAGE_SHIFT - inode-&gt;i_sb-&gt;s_blocksize_bits);</div><div class='add'>+	iblock = EXT4_PG_TO_LBLK(inode, folio-&gt;index);</div><div class='ctx'> </div><div class='del'>-	if (!page_has_buffers(page))</div><div class='del'>-		create_empty_buffers(page, blocksize, 0);</div><div class='add'>+	bh = folio_buffers(folio);</div><div class='add'>+	if (!bh)</div><div class='add'>+		bh = create_empty_buffers(folio, blocksize, 0);</div><div class='ctx'> </div><div class='ctx'> 	/* Find the buffer that contains "offset" */</div><div class='del'>-	bh = page_buffers(page);</div><div class='add'>+	offset = offset_in_folio(folio, from);</div><div class='ctx'> 	pos = blocksize;</div><div class='ctx'> 	while (offset &gt;= pos) {</div><div class='ctx'> 		bh = bh-&gt;b_this_page;</div><div class='hunk'>@@ -3713,7 +4101,7 @@ static int __ext4_block_zero_page_range(handle_t *handle,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Ok, it's mapped. Make sure it's up-to-date */</div><div class='del'>-	if (PageUptodate(page))</div><div class='add'>+	if (folio_test_uptodate(folio))</div><div class='ctx'> 		set_buffer_uptodate(bh);</div><div class='ctx'> </div><div class='ctx'> 	if (!buffer_uptodate(bh)) {</div><div class='hunk'>@@ -3723,7 +4111,8 @@ static int __ext4_block_zero_page_range(handle_t *handle,</div><div class='ctx'> 		if (fscrypt_inode_uses_fs_layer_crypto(inode)) {</div><div class='ctx'> 			/* We expect the key to be set. */</div><div class='ctx'> 			BUG_ON(!fscrypt_has_encryption_key(inode));</div><div class='del'>-			err = fscrypt_decrypt_pagecache_blocks(page, blocksize,</div><div class='add'>+			err = fscrypt_decrypt_pagecache_blocks(folio,</div><div class='add'>+							       blocksize,</div><div class='ctx'> 							       bh_offset(bh));</div><div class='ctx'> 			if (err) {</div><div class='ctx'> 				clear_buffer_uptodate(bh);</div><div class='hunk'>@@ -3738,11 +4127,11 @@ static int __ext4_block_zero_page_range(handle_t *handle,</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto unlock;</div><div class='ctx'> 	}</div><div class='del'>-	zero_user(page, offset, length);</div><div class='add'>+	folio_zero_range(folio, offset, length);</div><div class='ctx'> 	BUFFER_TRACE(bh, "zeroed end of block");</div><div class='ctx'> </div><div class='ctx'> 	if (ext4_should_journal_data(inode)) {</div><div class='del'>-		err = ext4_handle_dirty_metadata(handle, inode, bh);</div><div class='add'>+		err = ext4_dirty_journalled_data(handle, bh);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		err = 0;</div><div class='ctx'> 		mark_buffer_dirty(bh);</div><div class='hunk'>@@ -3752,8 +4141,8 @@ static int __ext4_block_zero_page_range(handle_t *handle,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> unlock:</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3768,9 +4157,8 @@ static int ext4_block_zero_page_range(handle_t *handle,</div><div class='ctx'> 		struct address_space *mapping, loff_t from, loff_t length)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='del'>-	unsigned offset = from &amp; (PAGE_SIZE-1);</div><div class='ctx'> 	unsigned blocksize = inode-&gt;i_sb-&gt;s_blocksize;</div><div class='del'>-	unsigned max = blocksize - (offset &amp; (blocksize - 1));</div><div class='add'>+	unsigned int max = blocksize - (from &amp; (blocksize - 1));</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * correct length if it does not fall between</div><div class='hunk'>@@ -3780,8 +4168,8 @@ static int ext4_block_zero_page_range(handle_t *handle,</div><div class='ctx'> 		length = max;</div><div class='ctx'> </div><div class='ctx'> 	if (IS_DAX(inode)) {</div><div class='del'>-		return iomap_zero_range(inode, from, length, NULL,</div><div class='del'>-					&amp;ext4_iomap_ops);</div><div class='add'>+		return dax_zero_range(inode, from, length, NULL,</div><div class='add'>+				      &amp;ext4_iomap_ops);</div><div class='ctx'> 	}</div><div class='ctx'> 	return __ext4_block_zero_page_range(handle, mapping, from, length);</div><div class='ctx'> }</div><div class='hunk'>@@ -3795,7 +4183,6 @@ static int ext4_block_zero_page_range(handle_t *handle,</div><div class='ctx'> static int ext4_block_truncate_page(handle_t *handle,</div><div class='ctx'> 		struct address_space *mapping, loff_t from)</div><div class='ctx'> {</div><div class='del'>-	unsigned offset = from &amp; (PAGE_SIZE-1);</div><div class='ctx'> 	unsigned length;</div><div class='ctx'> 	unsigned blocksize;</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='hunk'>@@ -3804,8 +4191,8 @@ static int ext4_block_truncate_page(handle_t *handle,</div><div class='ctx'> 	if (IS_ENCRYPTED(inode) &amp;&amp; !fscrypt_has_encryption_key(inode))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	blocksize = inode-&gt;i_sb-&gt;s_blocksize;</div><div class='del'>-	length = blocksize - (offset &amp; (blocksize - 1));</div><div class='add'>+	blocksize = i_blocksize(inode);</div><div class='add'>+	length = blocksize - (from &amp; (blocksize - 1));</div><div class='ctx'> </div><div class='ctx'> 	return ext4_block_zero_page_range(handle, mapping, from, length);</div><div class='ctx'> }</div><div class='hunk'>@@ -3863,7 +4250,11 @@ int ext4_can_truncate(struct inode *inode)</div><div class='ctx'>  * We have to make sure i_disksize gets properly updated before we truncate</div><div class='ctx'>  * page cache due to hole punching or zero range. Otherwise i_disksize update</div><div class='ctx'>  * can get lost as it may have been postponed to submission of writeback but</div><div class='del'>- * that will never happen after we truncate page cache.</div><div class='add'>+ * that will never happen if we remove the folio containing i_size from the</div><div class='add'>+ * page cache. Also if we punch hole within i_size but above i_disksize,</div><div class='add'>+ * following ext4_page_mkwrite() may mistakenly allocate written blocks over</div><div class='add'>+ * the hole and thus introduce allocated blocks beyond i_disksize which is</div><div class='add'>+ * not allowed (e2fsck would complain in case of crash).</div><div class='ctx'>  */</div><div class='ctx'> int ext4_update_disksize_before_punch(struct inode *inode, loff_t offset,</div><div class='ctx'> 				      loff_t len)</div><div class='hunk'>@@ -3874,9 +4265,11 @@ int ext4_update_disksize_before_punch(struct inode *inode, loff_t offset,</div><div class='ctx'> 	loff_t size = i_size_read(inode);</div><div class='ctx'> </div><div class='ctx'> 	WARN_ON(!inode_is_locked(inode));</div><div class='del'>-	if (offset &gt; size || offset + len &lt; size)</div><div class='add'>+	if (offset &gt; size)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='add'>+	if (offset + len &lt; size)</div><div class='add'>+		size = offset + len;</div><div class='ctx'> 	if (EXT4_I(inode)-&gt;i_disksize &gt;= size)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='hunk'>@@ -3890,6 +4283,68 @@ int ext4_update_disksize_before_punch(struct inode *inode, loff_t offset,</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline void ext4_truncate_folio(struct inode *inode,</div><div class='add'>+				       loff_t start, loff_t end)</div><div class='add'>+{</div><div class='add'>+	unsigned long blocksize = i_blocksize(inode);</div><div class='add'>+	struct folio *folio;</div><div class='add'>+</div><div class='add'>+	/* Nothing to be done if no complete block needs to be truncated. */</div><div class='add'>+	if (round_up(start, blocksize) &gt;= round_down(end, blocksize))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	folio = filemap_lock_folio(inode-&gt;i_mapping, start &gt;&gt; PAGE_SHIFT);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (folio_mkclean(folio))</div><div class='add'>+		folio_mark_dirty(folio);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int ext4_truncate_page_cache_block_range(struct inode *inode,</div><div class='add'>+					 loff_t start, loff_t end)</div><div class='add'>+{</div><div class='add'>+	unsigned long blocksize = i_blocksize(inode);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * For journalled data we need to write (and checkpoint) pages</div><div class='add'>+	 * before discarding page cache to avoid inconsitent data on disk</div><div class='add'>+	 * in case of crash before freeing or unwritten converting trans</div><div class='add'>+	 * is committed.</div><div class='add'>+	 */</div><div class='add'>+	if (ext4_should_journal_data(inode)) {</div><div class='add'>+		ret = filemap_write_and_wait_range(inode-&gt;i_mapping, start,</div><div class='add'>+						   end - 1);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		goto truncate_pagecache;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If the block size is less than the page size, the file's mapped</div><div class='add'>+	 * blocks within one page could be freed or converted to unwritten.</div><div class='add'>+	 * So it's necessary to remove writable userspace mappings, and then</div><div class='add'>+	 * ext4_page_mkwrite() can be called during subsequent write access</div><div class='add'>+	 * to these partial folios.</div><div class='add'>+	 */</div><div class='add'>+	if (!IS_ALIGNED(start | end, PAGE_SIZE) &amp;&amp;</div><div class='add'>+	    blocksize &lt; PAGE_SIZE &amp;&amp; start &lt; inode-&gt;i_size) {</div><div class='add'>+		loff_t page_boundary = round_up(start, PAGE_SIZE);</div><div class='add'>+</div><div class='add'>+		ext4_truncate_folio(inode, start, min(page_boundary, end));</div><div class='add'>+		if (end &gt; page_boundary)</div><div class='add'>+			ext4_truncate_folio(inode,</div><div class='add'>+					    round_down(end, PAGE_SIZE), end);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+truncate_pagecache:</div><div class='add'>+	truncate_pagecache_range(inode, start, end - 1);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void ext4_wait_dax_page(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	filemap_invalidate_unlock(inode-&gt;i_mapping);</div><div class='hunk'>@@ -3899,24 +4354,10 @@ static void ext4_wait_dax_page(struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> int ext4_break_layouts(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='del'>-	int error;</div><div class='del'>-</div><div class='ctx'> 	if (WARN_ON_ONCE(!rwsem_is_locked(&amp;inode-&gt;i_mapping-&gt;invalidate_lock)))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	do {</div><div class='del'>-		page = dax_layout_busy_page(inode-&gt;i_mapping);</div><div class='del'>-		if (!page)</div><div class='del'>-			return 0;</div><div class='del'>-</div><div class='del'>-		error = ___wait_var_event(&amp;page-&gt;_refcount,</div><div class='del'>-				atomic_read(&amp;page-&gt;_refcount) == 1,</div><div class='del'>-				TASK_INTERRUPTIBLE, 0, 0,</div><div class='del'>-				ext4_wait_dax_page(inode));</div><div class='del'>-	} while (error == 0);</div><div class='del'>-</div><div class='del'>-	return error;</div><div class='add'>+	return dax_break_layout_inode(inode, ext4_wait_dax_page);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -3930,149 +4371,116 @@ int ext4_break_layouts(struct inode *inode)</div><div class='ctx'>  * Returns: 0 on success or negative on failure</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-int ext4_punch_hole(struct inode *inode, loff_t offset, loff_t length)</div><div class='add'>+int ext4_punch_hole(struct file *file, loff_t offset, loff_t length)</div><div class='ctx'> {</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='del'>-	ext4_lblk_t first_block, stop_block;</div><div class='del'>-	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='del'>-	loff_t first_block_offset, last_block_offset;</div><div class='add'>+	ext4_lblk_t start_lblk, end_lblk;</div><div class='add'>+	loff_t max_end = sb-&gt;s_maxbytes;</div><div class='add'>+	loff_t end = offset + length;</div><div class='ctx'> 	handle_t *handle;</div><div class='ctx'> 	unsigned int credits;</div><div class='del'>-	int ret = 0, ret2 = 0;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	trace_ext4_punch_hole(inode, offset, length, 0);</div><div class='del'>-</div><div class='del'>-	ext4_clear_inode_state(inode, EXT4_STATE_MAY_INLINE_DATA);</div><div class='del'>-	if (ext4_has_inline_data(inode)) {</div><div class='del'>-		filemap_invalidate_lock(mapping);</div><div class='del'>-		ret = ext4_convert_inline_data(inode);</div><div class='del'>-		filemap_invalidate_unlock(mapping);</div><div class='del'>-		if (ret)</div><div class='del'>-			return ret;</div><div class='del'>-	}</div><div class='add'>+	WARN_ON_ONCE(!inode_is_locked(inode));</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Write out all dirty pages to avoid race conditions</div><div class='del'>-	 * Then release them.</div><div class='add'>+	 * For indirect-block based inodes, make sure that the hole within</div><div class='add'>+	 * one block before last range.</div><div class='ctx'> 	 */</div><div class='del'>-	if (mapping_tagged(mapping, PAGECACHE_TAG_DIRTY)) {</div><div class='del'>-		ret = filemap_write_and_wait_range(mapping, offset,</div><div class='del'>-						   offset + length - 1);</div><div class='del'>-		if (ret)</div><div class='del'>-			return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	inode_lock(inode);</div><div class='add'>+	if (!ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS))</div><div class='add'>+		max_end = EXT4_SB(sb)-&gt;s_bitmap_maxbytes - sb-&gt;s_blocksize;</div><div class='ctx'> </div><div class='ctx'> 	/* No need to punch hole beyond i_size */</div><div class='del'>-	if (offset &gt;= inode-&gt;i_size)</div><div class='del'>-		goto out_mutex;</div><div class='add'>+	if (offset &gt;= inode-&gt;i_size || offset &gt;= max_end)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * If the hole extends beyond i_size, set the hole</div><div class='del'>-	 * to end after the page that contains i_size</div><div class='add'>+	 * If the hole extends beyond i_size, set the hole to end after</div><div class='add'>+	 * the block that contains i_size to save pointless tail block zeroing.</div><div class='ctx'> 	 */</div><div class='del'>-	if (offset + length &gt; inode-&gt;i_size) {</div><div class='del'>-		length = inode-&gt;i_size +</div><div class='del'>-		   PAGE_SIZE - (inode-&gt;i_size &amp; (PAGE_SIZE - 1)) -</div><div class='del'>-		   offset;</div><div class='del'>-	}</div><div class='add'>+	if (end &gt;= inode-&gt;i_size)</div><div class='add'>+		end = round_up(inode-&gt;i_size, sb-&gt;s_blocksize);</div><div class='add'>+	if (end &gt; max_end)</div><div class='add'>+		end = max_end;</div><div class='add'>+	length = end - offset;</div><div class='ctx'> </div><div class='del'>-	if (offset &amp; (sb-&gt;s_blocksize - 1) ||</div><div class='del'>-	    (offset + length) &amp; (sb-&gt;s_blocksize - 1)) {</div><div class='del'>-		/*</div><div class='del'>-		 * Attach jinode to inode for jbd2 if we do any zeroing of</div><div class='del'>-		 * partial block</div><div class='del'>-		 */</div><div class='add'>+	/*</div><div class='add'>+	 * Attach jinode to inode for jbd2 if we do any zeroing of partial</div><div class='add'>+	 * block.</div><div class='add'>+	 */</div><div class='add'>+	if (!IS_ALIGNED(offset | end, sb-&gt;s_blocksize)) {</div><div class='ctx'> 		ret = ext4_inode_attach_jinode(inode);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='del'>-			goto out_mutex;</div><div class='del'>-</div><div class='add'>+			return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Wait all existing dio workers, newcomers will block on i_mutex */</div><div class='del'>-	inode_dio_wait(inode);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Prevent page faults from reinstantiating pages we have released from</div><div class='del'>-	 * page cache.</div><div class='del'>-	 */</div><div class='del'>-	filemap_invalidate_lock(mapping);</div><div class='del'>-</div><div class='del'>-	ret = ext4_break_layouts(inode);</div><div class='add'>+	ret = ext4_update_disksize_before_punch(inode, offset, length);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out_dio;</div><div class='del'>-</div><div class='del'>-	first_block_offset = round_up(offset, sb-&gt;s_blocksize);</div><div class='del'>-	last_block_offset = round_down((offset + length), sb-&gt;s_blocksize) - 1;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	/* Now release the pages and zero block aligned part of pages*/</div><div class='del'>-	if (last_block_offset &gt; first_block_offset) {</div><div class='del'>-		ret = ext4_update_disksize_before_punch(inode, offset, length);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto out_dio;</div><div class='del'>-		truncate_pagecache_range(inode, first_block_offset,</div><div class='del'>-					 last_block_offset);</div><div class='del'>-	}</div><div class='add'>+	ret = ext4_truncate_page_cache_block_range(inode, offset, end);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	if (ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS))</div><div class='del'>-		credits = ext4_writepage_trans_blocks(inode);</div><div class='add'>+		credits = ext4_chunk_trans_extent(inode, 2);</div><div class='ctx'> 	else</div><div class='ctx'> 		credits = ext4_blocks_for_truncate(inode);</div><div class='ctx'> 	handle = ext4_journal_start(inode, EXT4_HT_TRUNCATE, credits);</div><div class='ctx'> 	if (IS_ERR(handle)) {</div><div class='ctx'> 		ret = PTR_ERR(handle);</div><div class='ctx'> 		ext4_std_error(sb, ret);</div><div class='del'>-		goto out_dio;</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = ext4_zero_partial_blocks(handle, inode, offset,</div><div class='del'>-				       length);</div><div class='add'>+	ret = ext4_zero_partial_blocks(handle, inode, offset, length);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out_stop;</div><div class='del'>-</div><div class='del'>-	first_block = (offset + sb-&gt;s_blocksize - 1) &gt;&gt;</div><div class='del'>-		EXT4_BLOCK_SIZE_BITS(sb);</div><div class='del'>-	stop_block = (offset + length) &gt;&gt; EXT4_BLOCK_SIZE_BITS(sb);</div><div class='add'>+		goto out_handle;</div><div class='ctx'> </div><div class='ctx'> 	/* If there are blocks to remove, do it */</div><div class='del'>-	if (stop_block &gt; first_block) {</div><div class='add'>+	start_lblk = EXT4_B_TO_LBLK(inode, offset);</div><div class='add'>+	end_lblk = end &gt;&gt; inode-&gt;i_blkbits;</div><div class='ctx'> </div><div class='add'>+	if (end_lblk &gt; start_lblk) {</div><div class='add'>+		ext4_lblk_t hole_len = end_lblk - start_lblk;</div><div class='add'>+</div><div class='add'>+		ext4_fc_track_inode(handle, inode);</div><div class='add'>+		ext4_check_map_extents_env(inode);</div><div class='ctx'> 		down_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='del'>-		ext4_discard_preallocations(inode, 0);</div><div class='add'>+		ext4_discard_preallocations(inode);</div><div class='ctx'> </div><div class='del'>-		ret = ext4_es_remove_extent(inode, first_block,</div><div class='del'>-					    stop_block - first_block);</div><div class='del'>-		if (ret) {</div><div class='del'>-			up_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='del'>-			goto out_stop;</div><div class='del'>-		}</div><div class='add'>+		ext4_es_remove_extent(inode, start_lblk, hole_len);</div><div class='ctx'> </div><div class='ctx'> 		if (ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS))</div><div class='del'>-			ret = ext4_ext_remove_space(inode, first_block,</div><div class='del'>-						    stop_block - 1);</div><div class='add'>+			ret = ext4_ext_remove_space(inode, start_lblk,</div><div class='add'>+						    end_lblk - 1);</div><div class='ctx'> 		else</div><div class='del'>-			ret = ext4_ind_remove_space(handle, inode, first_block,</div><div class='del'>-						    stop_block);</div><div class='add'>+			ret = ext4_ind_remove_space(handle, inode, start_lblk,</div><div class='add'>+						    end_lblk);</div><div class='add'>+		if (ret) {</div><div class='add'>+			up_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='add'>+			goto out_handle;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='add'>+		ext4_es_insert_extent(inode, start_lblk, hole_len, ~0,</div><div class='add'>+				      EXTENT_STATUS_HOLE, 0);</div><div class='ctx'> 		up_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='ctx'> 	}</div><div class='del'>-	ext4_fc_track_range(handle, inode, first_block, stop_block);</div><div class='add'>+	ext4_fc_track_range(handle, inode, start_lblk, end_lblk);</div><div class='add'>+</div><div class='add'>+	ret = ext4_mark_inode_dirty(handle, inode);</div><div class='add'>+	if (unlikely(ret))</div><div class='add'>+		goto out_handle;</div><div class='add'>+</div><div class='add'>+	ext4_update_inode_fsync_trans(handle, inode, 1);</div><div class='ctx'> 	if (IS_SYNC(inode))</div><div class='ctx'> 		ext4_handle_sync(handle);</div><div class='del'>-</div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='del'>-	ret2 = ext4_mark_inode_dirty(handle, inode);</div><div class='del'>-	if (unlikely(ret2))</div><div class='del'>-		ret = ret2;</div><div class='del'>-	if (ret &gt;= 0)</div><div class='del'>-		ext4_update_inode_fsync_trans(handle, inode, 1);</div><div class='del'>-out_stop:</div><div class='add'>+out_handle:</div><div class='ctx'> 	ext4_journal_stop(handle);</div><div class='del'>-out_dio:</div><div class='del'>-	filemap_invalidate_unlock(mapping);</div><div class='del'>-out_mutex:</div><div class='del'>-	inode_unlock(inode);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -4140,9 +4548,9 @@ int ext4_truncate(struct inode *inode)</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * There is a possibility that we're either freeing the inode</div><div class='ctx'> 	 * or it's a completely new inode. In those cases we might not</div><div class='del'>-	 * have i_mutex locked because it's not necessary.</div><div class='add'>+	 * have i_rwsem locked because it's not necessary.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!(inode-&gt;i_state &amp; (I_NEW|I_FREEING)))</div><div class='add'>+	if (!(inode_state_read_once(inode) &amp; (I_NEW | I_FREEING)))</div><div class='ctx'> 		WARN_ON(!inode_is_locked(inode));</div><div class='ctx'> 	trace_ext4_truncate_enter(inode);</div><div class='ctx'> </div><div class='hunk'>@@ -4162,12 +4570,13 @@ int ext4_truncate(struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> 	/* If we zero-out tail of the page, we have to create jinode for jbd2 */</div><div class='ctx'> 	if (inode-&gt;i_size &amp; (inode-&gt;i_sb-&gt;s_blocksize - 1)) {</div><div class='del'>-		if (ext4_inode_attach_jinode(inode) &lt; 0)</div><div class='add'>+		err = ext4_inode_attach_jinode(inode);</div><div class='add'>+		if (err)</div><div class='ctx'> 			goto out_trace;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS))</div><div class='del'>-		credits = ext4_writepage_trans_blocks(inode);</div><div class='add'>+		credits = ext4_chunk_trans_extent(inode, 1);</div><div class='ctx'> 	else</div><div class='ctx'> 		credits = ext4_blocks_for_truncate(inode);</div><div class='ctx'> </div><div class='hunk'>@@ -4193,9 +4602,11 @@ int ext4_truncate(struct inode *inode)</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out_stop;</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='add'>+	ext4_fc_track_inode(handle, inode);</div><div class='add'>+	ext4_check_map_extents_env(inode);</div><div class='ctx'> </div><div class='del'>-	ext4_discard_preallocations(inode, 0);</div><div class='add'>+	down_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='add'>+	ext4_discard_preallocations(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS))</div><div class='ctx'> 		err = ext4_ext_truncate(handle, inode);</div><div class='hunk'>@@ -4220,7 +4631,7 @@ out_stop:</div><div class='ctx'> 	if (inode-&gt;i_nlink)</div><div class='ctx'> 		ext4_orphan_del(handle, inode);</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_mtime_to_ts(inode, inode_set_ctime_current(inode));</div><div class='ctx'> 	err2 = ext4_mark_inode_dirty(handle, inode);</div><div class='ctx'> 	if (unlikely(err2 &amp;&amp; !err))</div><div class='ctx'> 		err = err2;</div><div class='hunk'>@@ -4306,7 +4717,7 @@ static int ext4_fill_raw_inode(struct inode *inode, struct ext4_inode *raw_inode</div><div class='ctx'> 		 * old inodes get re-used with the upper 16 bits of the</div><div class='ctx'> 		 * uid/gid intact.</div><div class='ctx'> 		 */</div><div class='del'>-		if (ei-&gt;i_dtime &amp;&amp; list_empty(&amp;ei-&gt;i_orphan)) {</div><div class='add'>+		if (ei-&gt;i_dtime &amp;&amp; !ext4_inode_orphan_tracked(inode)) {</div><div class='ctx'> 			raw_inode-&gt;i_uid_high = 0;</div><div class='ctx'> 			raw_inode-&gt;i_gid_high = 0;</div><div class='ctx'> 		} else {</div><div class='hunk'>@@ -4323,9 +4734,9 @@ static int ext4_fill_raw_inode(struct inode *inode, struct ext4_inode *raw_inode</div><div class='ctx'> 	}</div><div class='ctx'> 	raw_inode-&gt;i_links_count = cpu_to_le16(inode-&gt;i_nlink);</div><div class='ctx'> </div><div class='del'>-	EXT4_INODE_SET_XTIME(i_ctime, inode, raw_inode);</div><div class='del'>-	EXT4_INODE_SET_XTIME(i_mtime, inode, raw_inode);</div><div class='del'>-	EXT4_INODE_SET_XTIME(i_atime, inode, raw_inode);</div><div class='add'>+	EXT4_INODE_SET_CTIME(inode, raw_inode);</div><div class='add'>+	EXT4_INODE_SET_MTIME(inode, raw_inode);</div><div class='add'>+	EXT4_INODE_SET_ATIME(inode, raw_inode);</div><div class='ctx'> 	EXT4_EINODE_SET_XTIME(i_crtime, ei, raw_inode);</div><div class='ctx'> </div><div class='ctx'> 	raw_inode-&gt;i_dtime = cpu_to_le32(ei-&gt;i_dtime);</div><div class='hunk'>@@ -4410,9 +4821,17 @@ static int __ext4_get_inode_loc(struct super_block *sb, unsigned long ino,</div><div class='ctx'> 	inodes_per_block = EXT4_SB(sb)-&gt;s_inodes_per_block;</div><div class='ctx'> 	inode_offset = ((ino - 1) %</div><div class='ctx'> 			EXT4_INODES_PER_GROUP(sb));</div><div class='del'>-	block = ext4_inode_table(sb, gdp) + (inode_offset / inodes_per_block);</div><div class='ctx'> 	iloc-&gt;offset = (inode_offset % inodes_per_block) * EXT4_INODE_SIZE(sb);</div><div class='ctx'> </div><div class='add'>+	block = ext4_inode_table(sb, gdp);</div><div class='add'>+	if ((block &lt;= le32_to_cpu(EXT4_SB(sb)-&gt;s_es-&gt;s_first_data_block)) ||</div><div class='add'>+	    (block &gt;= ext4_blocks_count(EXT4_SB(sb)-&gt;s_es))) {</div><div class='add'>+		ext4_error(sb, "Invalid inode table block %llu in "</div><div class='add'>+			   "block_group %u", block, iloc-&gt;block_group);</div><div class='add'>+		return -EFSCORRUPTED;</div><div class='add'>+	}</div><div class='add'>+	block += (inode_offset / inodes_per_block);</div><div class='add'>+</div><div class='ctx'> 	bh = sb_getblk(sb, block);</div><div class='ctx'> 	if (unlikely(!bh))</div><div class='ctx'> 		return -ENOMEM;</div><div class='hunk'>@@ -4505,10 +4924,10 @@ make_io:</div><div class='ctx'> 	 * Read the block from disk.</div><div class='ctx'> 	 */</div><div class='ctx'> 	trace_ext4_load_inode(sb, ino);</div><div class='del'>-	ext4_read_bh_nowait(bh, REQ_META | REQ_PRIO, NULL);</div><div class='add'>+	ext4_read_bh_nowait(bh, REQ_META | REQ_PRIO, NULL,</div><div class='add'>+			    ext4_simulate_fail(sb, EXT4_SIM_INODE_EIO));</div><div class='ctx'> 	blk_finish_plug(&amp;plug);</div><div class='ctx'> 	wait_on_buffer(bh);</div><div class='del'>-	ext4_simulate_fail_bh(sb, bh, EXT4_SIM_INODE_EIO);</div><div class='ctx'> 	if (!buffer_uptodate(bh)) {</div><div class='ctx'> 		if (ret_block)</div><div class='ctx'> 			*ret_block = block;</div><div class='hunk'>@@ -4523,7 +4942,7 @@ has_buffer:</div><div class='ctx'> static int __ext4_get_inode_loc_noinmem(struct inode *inode,</div><div class='ctx'> 					struct ext4_iloc *iloc)</div><div class='ctx'> {</div><div class='del'>-	ext4_fsblk_t err_blk;</div><div class='add'>+	ext4_fsblk_t err_blk = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	ret = __ext4_get_inode_loc(inode-&gt;i_sb, inode-&gt;i_ino, NULL, iloc,</div><div class='hunk'>@@ -4538,7 +4957,7 @@ static int __ext4_get_inode_loc_noinmem(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> int ext4_get_inode_loc(struct inode *inode, struct ext4_iloc *iloc)</div><div class='ctx'> {</div><div class='del'>-	ext4_fsblk_t err_blk;</div><div class='add'>+	ext4_fsblk_t err_blk = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	ret = __ext4_get_inode_loc(inode-&gt;i_sb, inode-&gt;i_ino, inode, iloc,</div><div class='hunk'>@@ -4646,11 +5065,20 @@ static inline int ext4_iget_extra_inode(struct inode *inode,</div><div class='ctx'> 	__le32 *magic = (void *)raw_inode +</div><div class='ctx'> 			EXT4_GOOD_OLD_INODE_SIZE + ei-&gt;i_extra_isize;</div><div class='ctx'> </div><div class='del'>-	if (EXT4_GOOD_OLD_INODE_SIZE + ei-&gt;i_extra_isize + sizeof(__le32) &lt;=</div><div class='del'>-	    EXT4_INODE_SIZE(inode-&gt;i_sb) &amp;&amp;</div><div class='add'>+	if (EXT4_INODE_HAS_XATTR_SPACE(inode)  &amp;&amp;</div><div class='ctx'> 	    *magic == cpu_to_le32(EXT4_XATTR_MAGIC)) {</div><div class='add'>+		int err;</div><div class='add'>+</div><div class='add'>+		err = xattr_check_inode(inode, IHDR(inode, raw_inode),</div><div class='add'>+					ITAIL(inode, raw_inode));</div><div class='add'>+		if (err)</div><div class='add'>+			return err;</div><div class='add'>+</div><div class='ctx'> 		ext4_set_inode_state(inode, EXT4_STATE_XATTR);</div><div class='del'>-		return ext4_find_inline_data_nolock(inode);</div><div class='add'>+		err = ext4_find_inline_data_nolock(inode);</div><div class='add'>+		if (!err &amp;&amp; ext4_has_inline_data(inode))</div><div class='add'>+			ext4_set_inode_state(inode, EXT4_STATE_MAY_INLINE_DATA);</div><div class='add'>+		return err;</div><div class='ctx'> 	} else</div><div class='ctx'> 		EXT4_I(inode)-&gt;i_inline_off = 0;</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -4677,6 +5105,64 @@ static inline void ext4_inode_set_iversion_queried(struct inode *inode, u64 val)</div><div class='ctx'> 		inode_set_iversion_queried(inode, val);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int check_igot_inode(struct inode *inode, ext4_iget_flags flags,</div><div class='add'>+			    const char *function, unsigned int line)</div><div class='add'>+{</div><div class='add'>+	const char *err_str;</div><div class='add'>+</div><div class='add'>+	if (flags &amp; EXT4_IGET_EA_INODE) {</div><div class='add'>+		if (!(EXT4_I(inode)-&gt;i_flags &amp; EXT4_EA_INODE_FL)) {</div><div class='add'>+			err_str = "missing EA_INODE flag";</div><div class='add'>+			goto error;</div><div class='add'>+		}</div><div class='add'>+		if (ext4_test_inode_state(inode, EXT4_STATE_XATTR) ||</div><div class='add'>+		    EXT4_I(inode)-&gt;i_file_acl) {</div><div class='add'>+			err_str = "ea_inode with extended attributes";</div><div class='add'>+			goto error;</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		if ((EXT4_I(inode)-&gt;i_flags &amp; EXT4_EA_INODE_FL)) {</div><div class='add'>+			/*</div><div class='add'>+			 * open_by_handle_at() could provide an old inode number</div><div class='add'>+			 * that has since been reused for an ea_inode; this does</div><div class='add'>+			 * not indicate filesystem corruption</div><div class='add'>+			 */</div><div class='add'>+			if (flags &amp; EXT4_IGET_HANDLE)</div><div class='add'>+				return -ESTALE;</div><div class='add'>+			err_str = "unexpected EA_INODE flag";</div><div class='add'>+			goto error;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	if (is_bad_inode(inode) &amp;&amp; !(flags &amp; EXT4_IGET_BAD)) {</div><div class='add'>+		err_str = "unexpected bad inode w/o EXT4_IGET_BAD";</div><div class='add'>+		goto error;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+error:</div><div class='add'>+	ext4_error_inode(inode, function, line, 0, "%s", err_str);</div><div class='add'>+	return -EFSCORRUPTED;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void ext4_set_inode_mapping_order(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = inode-&gt;i_sb;</div><div class='add'>+	u16 min_order, max_order;</div><div class='add'>+</div><div class='add'>+	max_order = EXT4_SB(sb)-&gt;s_max_folio_order;</div><div class='add'>+	if (!max_order)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	min_order = EXT4_SB(sb)-&gt;s_min_folio_order;</div><div class='add'>+	if (!min_order &amp;&amp; !S_ISREG(inode-&gt;i_mode))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (ext4_test_inode_flag(inode, EXT4_INODE_JOURNAL_DATA))</div><div class='add'>+		max_order = min_order;</div><div class='add'>+</div><div class='add'>+	mapping_set_folio_order_range(inode-&gt;i_mapping, min_order, max_order);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> struct inode *__ext4_iget(struct super_block *sb, unsigned long ino,</div><div class='ctx'> 			  ext4_iget_flags flags, const char *function,</div><div class='ctx'> 			  unsigned int line)</div><div class='hunk'>@@ -4694,12 +5180,7 @@ struct inode *__ext4_iget(struct super_block *sb, unsigned long ino,</div><div class='ctx'> 	gid_t i_gid;</div><div class='ctx'> 	projid_t i_projid;</div><div class='ctx'> </div><div class='del'>-	if ((!(flags &amp; EXT4_IGET_SPECIAL) &amp;&amp;</div><div class='del'>-	     ((ino &lt; EXT4_FIRST_INO(sb) &amp;&amp; ino != EXT4_ROOT_INO) ||</div><div class='del'>-	      ino == le32_to_cpu(es-&gt;s_usr_quota_inum) ||</div><div class='del'>-	      ino == le32_to_cpu(es-&gt;s_grp_quota_inum) ||</div><div class='del'>-	      ino == le32_to_cpu(es-&gt;s_prj_quota_inum) ||</div><div class='del'>-	      ino == le32_to_cpu(es-&gt;s_orphan_file_inum))) ||</div><div class='add'>+	if ((!(flags &amp; EXT4_IGET_SPECIAL) &amp;&amp; is_special_ino(sb, ino)) ||</div><div class='ctx'> 	    (ino &lt; EXT4_ROOT_INO) ||</div><div class='ctx'> 	    (ino &gt; le32_to_cpu(es-&gt;s_inodes_count))) {</div><div class='ctx'> 		if (flags &amp; EXT4_IGET_HANDLE)</div><div class='hunk'>@@ -4713,8 +5194,14 @@ struct inode *__ext4_iget(struct super_block *sb, unsigned long ino,</div><div class='ctx'> 	inode = iget_locked(sb, ino);</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='del'>-	if (!(inode-&gt;i_state &amp; I_NEW))</div><div class='add'>+	if (!(inode_state_read_once(inode) &amp; I_NEW)) {</div><div class='add'>+		ret = check_igot_inode(inode, flags, function, line);</div><div class='add'>+		if (ret) {</div><div class='add'>+			iput(inode);</div><div class='add'>+			return ERR_PTR(ret);</div><div class='add'>+		}</div><div class='ctx'> 		return inode;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	ei = EXT4_I(inode);</div><div class='ctx'> 	iloc.bh = NULL;</div><div class='hunk'>@@ -4724,13 +5211,6 @@ struct inode *__ext4_iget(struct super_block *sb, unsigned long ino,</div><div class='ctx'> 		goto bad_inode;</div><div class='ctx'> 	raw_inode = ext4_raw_inode(&amp;iloc);</div><div class='ctx'> </div><div class='del'>-	if ((ino == EXT4_ROOT_INO) &amp;&amp; (raw_inode-&gt;i_links_count == 0)) {</div><div class='del'>-		ext4_error_inode(inode, function, line, 0,</div><div class='del'>-				 "iget: root inode unallocated");</div><div class='del'>-		ret = -EFSCORRUPTED;</div><div class='del'>-		goto bad_inode;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	if ((flags &amp; EXT4_IGET_HANDLE) &amp;&amp;</div><div class='ctx'> 	    (raw_inode-&gt;i_links_count == 0) &amp;&amp; (raw_inode-&gt;i_mode == 0)) {</div><div class='ctx'> 		ret = -ESTALE;</div><div class='hunk'>@@ -4754,15 +5234,14 @@ struct inode *__ext4_iget(struct super_block *sb, unsigned long ino,</div><div class='ctx'> 		ei-&gt;i_extra_isize = 0;</div><div class='ctx'> </div><div class='ctx'> 	/* Precompute checksum seed for inode metadata */</div><div class='del'>-	if (ext4_has_metadata_csum(sb)) {</div><div class='add'>+	if (ext4_has_feature_metadata_csum(sb)) {</div><div class='ctx'> 		struct ext4_sb_info *sbi = EXT4_SB(inode-&gt;i_sb);</div><div class='ctx'> 		__u32 csum;</div><div class='ctx'> 		__le32 inum = cpu_to_le32(inode-&gt;i_ino);</div><div class='ctx'> 		__le32 gen = raw_inode-&gt;i_generation;</div><div class='del'>-		csum = ext4_chksum(sbi, sbi-&gt;s_csum_seed, (__u8 *)&amp;inum,</div><div class='add'>+		csum = ext4_chksum(sbi-&gt;s_csum_seed, (__u8 *)&amp;inum,</div><div class='ctx'> 				   sizeof(inum));</div><div class='del'>-		ei-&gt;i_csum_seed = ext4_chksum(sbi, csum, (__u8 *)&amp;gen,</div><div class='del'>-					      sizeof(gen));</div><div class='add'>+		ei-&gt;i_csum_seed = ext4_chksum(csum, (__u8 *)&amp;gen, sizeof(gen));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if ((!ext4_inode_csum_verify(inode, raw_inode, ei) ||</div><div class='hunk'>@@ -4793,7 +5272,6 @@ struct inode *__ext4_iget(struct super_block *sb, unsigned long ino,</div><div class='ctx'> 	ei-&gt;i_projid = make_kprojid(&amp;init_user_ns, i_projid);</div><div class='ctx'> 	set_nlink(inode, le16_to_cpu(raw_inode-&gt;i_links_count));</div><div class='ctx'> </div><div class='del'>-	ext4_clear_state_flags(ei);	/* Only relevant on 32-bit archs */</div><div class='ctx'> 	ei-&gt;i_inline_off = 0;</div><div class='ctx'> 	ei-&gt;i_dir_start_lookup = 0;</div><div class='ctx'> 	ei-&gt;i_dtime = le32_to_cpu(raw_inode-&gt;i_dtime);</div><div class='hunk'>@@ -4803,11 +5281,16 @@ struct inode *__ext4_iget(struct super_block *sb, unsigned long ino,</div><div class='ctx'> 	 * NeilBrown 1999oct15</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (inode-&gt;i_nlink == 0) {</div><div class='del'>-		if ((inode-&gt;i_mode == 0 ||</div><div class='add'>+		if ((inode-&gt;i_mode == 0 || flags &amp; EXT4_IGET_SPECIAL ||</div><div class='ctx'> 		     !(EXT4_SB(inode-&gt;i_sb)-&gt;s_mount_state &amp; EXT4_ORPHAN_FS)) &amp;&amp;</div><div class='ctx'> 		    ino != EXT4_BOOT_LOADER_INO) {</div><div class='del'>-			/* this inode is deleted */</div><div class='del'>-			ret = -ESTALE;</div><div class='add'>+			/* this inode is deleted or unallocated */</div><div class='add'>+			if (flags &amp; EXT4_IGET_SPECIAL) {</div><div class='add'>+				ext4_error_inode(inode, function, line, 0,</div><div class='add'>+						 "iget: special inode unallocated");</div><div class='add'>+				ret = -EFSCORRUPTED;</div><div class='add'>+			} else</div><div class='add'>+				ret = -ESTALE;</div><div class='ctx'> 			goto bad_inode;</div><div class='ctx'> 		}</div><div class='ctx'> 		/* The only unlinked inodes we let through here have</div><div class='hunk'>@@ -4819,13 +5302,22 @@ struct inode *__ext4_iget(struct super_block *sb, unsigned long ino,</div><div class='ctx'> 	}</div><div class='ctx'> 	ei-&gt;i_flags = le32_to_cpu(raw_inode-&gt;i_flags);</div><div class='ctx'> 	ext4_set_inode_flags(inode, true);</div><div class='add'>+	/* Detect invalid flag combination - can't have both inline data and extents */</div><div class='add'>+	if (ext4_test_inode_flag(inode, EXT4_INODE_INLINE_DATA) &amp;&amp;</div><div class='add'>+	    ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS)) {</div><div class='add'>+		ext4_error_inode(inode, function, line, 0,</div><div class='add'>+			"inode has both inline data and extents flags");</div><div class='add'>+		ret = -EFSCORRUPTED;</div><div class='add'>+		goto bad_inode;</div><div class='add'>+	}</div><div class='ctx'> 	inode-&gt;i_blocks = ext4_inode_blocks(raw_inode, ei);</div><div class='ctx'> 	ei-&gt;i_file_acl = le32_to_cpu(raw_inode-&gt;i_file_acl_lo);</div><div class='ctx'> 	if (ext4_has_feature_64bit(sb))</div><div class='ctx'> 		ei-&gt;i_file_acl |=</div><div class='ctx'> 			((__u64)le16_to_cpu(raw_inode-&gt;i_file_acl_high)) &lt;&lt; 32;</div><div class='ctx'> 	inode-&gt;i_size = ext4_isize(sb, raw_inode);</div><div class='del'>-	if ((size = i_size_read(inode)) &lt; 0) {</div><div class='add'>+	size = i_size_read(inode);</div><div class='add'>+	if (size &lt; 0 || size &gt; ext4_get_maxbytes(inode)) {</div><div class='ctx'> 		ext4_error_inode(inode, function, line, 0,</div><div class='ctx'> 				 "iget: bad i_size value: %lld", size);</div><div class='ctx'> 		ret = -EFSCORRUPTED;</div><div class='hunk'>@@ -4836,7 +5328,8 @@ struct inode *__ext4_iget(struct super_block *sb, unsigned long ino,</div><div class='ctx'> 	 * we'd normally treat htree data as empty space. But with metadata</div><div class='ctx'> 	 * checksumming that corrupts checksums so forbid that.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!ext4_has_feature_dir_index(sb) &amp;&amp; ext4_has_metadata_csum(sb) &amp;&amp;</div><div class='add'>+	if (!ext4_has_feature_dir_index(sb) &amp;&amp;</div><div class='add'>+	    ext4_has_feature_metadata_csum(sb) &amp;&amp;</div><div class='ctx'> 	    ext4_test_inode_flag(inode, EXT4_INODE_INDEX)) {</div><div class='ctx'> 		ext4_error_inode(inode, function, line, 0,</div><div class='ctx'> 			 "iget: Dir with htree data on filesystem without dir_index feature.");</div><div class='hunk'>@@ -4897,9 +5390,9 @@ struct inode *__ext4_iget(struct super_block *sb, unsigned long ino,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	EXT4_INODE_GET_XTIME(i_ctime, inode, raw_inode);</div><div class='del'>-	EXT4_INODE_GET_XTIME(i_mtime, inode, raw_inode);</div><div class='del'>-	EXT4_INODE_GET_XTIME(i_atime, inode, raw_inode);</div><div class='add'>+	EXT4_INODE_GET_CTIME(inode, raw_inode);</div><div class='add'>+	EXT4_INODE_GET_ATIME(inode, raw_inode);</div><div class='add'>+	EXT4_INODE_GET_MTIME(inode, raw_inode);</div><div class='ctx'> 	EXT4_EINODE_GET_XTIME(i_crtime, ei, raw_inode);</div><div class='ctx'> </div><div class='ctx'> 	if (likely(!test_opt2(inode-&gt;i_sb, HURD_COMPAT))) {</div><div class='hunk'>@@ -4954,17 +5447,23 @@ struct inode *__ext4_iget(struct super_block *sb, unsigned long ino,</div><div class='ctx'> 		}</div><div class='ctx'> 		if (IS_ENCRYPTED(inode)) {</div><div class='ctx'> 			inode-&gt;i_op = &amp;ext4_encrypted_symlink_inode_operations;</div><div class='del'>-			ext4_set_aops(inode);</div><div class='ctx'> 		} else if (ext4_inode_is_fast_symlink(inode)) {</div><div class='del'>-			inode-&gt;i_link = (char *)ei-&gt;i_data;</div><div class='ctx'> 			inode-&gt;i_op = &amp;ext4_fast_symlink_inode_operations;</div><div class='del'>-			nd_terminate_link(ei-&gt;i_data, inode-&gt;i_size,</div><div class='del'>-				sizeof(ei-&gt;i_data) - 1);</div><div class='add'>+			if (inode-&gt;i_size == 0 ||</div><div class='add'>+			    inode-&gt;i_size &gt;= sizeof(ei-&gt;i_data) ||</div><div class='add'>+			    strnlen((char *)ei-&gt;i_data, inode-&gt;i_size + 1) !=</div><div class='add'>+								inode-&gt;i_size) {</div><div class='add'>+				ext4_error_inode(inode, function, line, 0,</div><div class='add'>+					"invalid fast symlink length %llu",</div><div class='add'>+					 (unsigned long long)inode-&gt;i_size);</div><div class='add'>+				ret = -EFSCORRUPTED;</div><div class='add'>+				goto bad_inode;</div><div class='add'>+			}</div><div class='add'>+			inode_set_cached_link(inode, (char *)ei-&gt;i_data,</div><div class='add'>+					      inode-&gt;i_size);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			inode-&gt;i_op = &amp;ext4_symlink_inode_operations;</div><div class='del'>-			ext4_set_aops(inode);</div><div class='ctx'> 		}</div><div class='del'>-		inode_nohighmem(inode);</div><div class='ctx'> 	} else if (S_ISCHR(inode-&gt;i_mode) || S_ISBLK(inode-&gt;i_mode) ||</div><div class='ctx'> 	      S_ISFIFO(inode-&gt;i_mode) || S_ISSOCK(inode-&gt;i_mode)) {</div><div class='ctx'> 		inode-&gt;i_op = &amp;ext4_special_inode_operations;</div><div class='hunk'>@@ -4982,11 +5481,32 @@ struct inode *__ext4_iget(struct super_block *sb, unsigned long ino,</div><div class='ctx'> 				 "iget: bogus i_mode (%o)", inode-&gt;i_mode);</div><div class='ctx'> 		goto bad_inode;</div><div class='ctx'> 	}</div><div class='del'>-	if (IS_CASEFOLDED(inode) &amp;&amp; !ext4_has_feature_casefold(inode-&gt;i_sb))</div><div class='add'>+	if (IS_CASEFOLDED(inode) &amp;&amp; !ext4_has_feature_casefold(inode-&gt;i_sb)) {</div><div class='ctx'> 		ext4_error_inode(inode, function, line, 0,</div><div class='ctx'> 				 "casefold flag without casefold feature");</div><div class='del'>-	brelse(iloc.bh);</div><div class='add'>+		ret = -EFSCORRUPTED;</div><div class='add'>+		goto bad_inode;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='add'>+	ext4_set_inode_mapping_order(inode);</div><div class='add'>+</div><div class='add'>+	ret = check_igot_inode(inode, flags, function, line);</div><div class='add'>+	/*</div><div class='add'>+	 * -ESTALE here means there is nothing inherently wrong with the inode,</div><div class='add'>+	 * it's just not an inode we can return for an fhandle lookup.</div><div class='add'>+	 */</div><div class='add'>+	if (ret == -ESTALE) {</div><div class='add'>+		brelse(iloc.bh);</div><div class='add'>+		unlock_new_inode(inode);</div><div class='add'>+		iput(inode);</div><div class='add'>+		return ERR_PTR(-ESTALE);</div><div class='add'>+	}</div><div class='add'>+	if (ret)</div><div class='add'>+		goto bad_inode;</div><div class='add'>+	brelse(iloc.bh);</div><div class='add'>+	/* Initialize the "no ACL's" state for the simple cases */</div><div class='add'>+	if (!ext4_test_inode_state(inode, EXT4_STATE_XATTR) &amp;&amp; !ei-&gt;i_file_acl)</div><div class='add'>+		cache_no_acl(inode);</div><div class='ctx'> 	unlock_new_inode(inode);</div><div class='ctx'> 	return inode;</div><div class='ctx'> </div><div class='hunk'>@@ -5014,13 +5534,13 @@ static void __ext4_update_other_inode_time(struct super_block *sb,</div><div class='ctx'> 	if (inode_is_dirtytime_only(inode)) {</div><div class='ctx'> 		struct ext4_inode_info	*ei = EXT4_I(inode);</div><div class='ctx'> </div><div class='del'>-		inode-&gt;i_state &amp;= ~I_DIRTY_TIME;</div><div class='add'>+		inode_state_clear(inode, I_DIRTY_TIME);</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> </div><div class='ctx'> 		spin_lock(&amp;ei-&gt;i_raw_lock);</div><div class='del'>-		EXT4_INODE_SET_XTIME(i_ctime, inode, raw_inode);</div><div class='del'>-		EXT4_INODE_SET_XTIME(i_mtime, inode, raw_inode);</div><div class='del'>-		EXT4_INODE_SET_XTIME(i_atime, inode, raw_inode);</div><div class='add'>+		EXT4_INODE_SET_CTIME(inode, raw_inode);</div><div class='add'>+		EXT4_INODE_SET_MTIME(inode, raw_inode);</div><div class='add'>+		EXT4_INODE_SET_ATIME(inode, raw_inode);</div><div class='ctx'> 		ext4_inode_csum_set(inode, raw_inode, ei);</div><div class='ctx'> 		spin_unlock(&amp;ei-&gt;i_raw_lock);</div><div class='ctx'> 		trace_ext4_other_inode_update_time(inode, orig_ino);</div><div class='hunk'>@@ -5168,16 +5688,16 @@ int ext4_write_inode(struct inode *inode, struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	if (WARN_ON_ONCE(current-&gt;flags &amp; PF_MEMALLOC) ||</div><div class='del'>-	    sb_rdonly(inode-&gt;i_sb))</div><div class='add'>+	if (WARN_ON_ONCE(current-&gt;flags &amp; PF_MEMALLOC))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ext4_forced_shutdown(EXT4_SB(inode-&gt;i_sb))))</div><div class='del'>-		return -EIO;</div><div class='add'>+	err = ext4_emergency_state(inode-&gt;i_sb);</div><div class='add'>+	if (unlikely(err))</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='ctx'> 	if (EXT4_SB(inode-&gt;i_sb)-&gt;s_journal) {</div><div class='ctx'> 		if (ext4_journal_current_handle()) {</div><div class='del'>-			jbd_debug(1, "called recursively, non-PF_MEMALLOC!\n");</div><div class='add'>+			ext4_debug("called recursively, non-PF_MEMALLOC!\n");</div><div class='ctx'> 			dump_stack();</div><div class='ctx'> 			return -EIO;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -5215,47 +5735,49 @@ int ext4_write_inode(struct inode *inode, struct writeback_control *wbc)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * In data=journal mode ext4_journalled_invalidatepage() may fail to invalidate</div><div class='del'>- * buffers that are attached to a page stradding i_size and are undergoing</div><div class='add'>+ * In data=journal mode ext4_journalled_invalidate_folio() may fail to invalidate</div><div class='add'>+ * buffers that are attached to a folio straddling i_size and are undergoing</div><div class='ctx'>  * commit. In that case we have to wait for commit to finish and try again.</div><div class='ctx'>  */</div><div class='ctx'> static void ext4_wait_for_tail_page_commit(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='ctx'> 	unsigned offset;</div><div class='ctx'> 	journal_t *journal = EXT4_SB(inode-&gt;i_sb)-&gt;s_journal;</div><div class='del'>-	tid_t commit_tid = 0;</div><div class='add'>+	tid_t commit_tid;</div><div class='ctx'> 	int ret;</div><div class='add'>+	bool has_transaction;</div><div class='ctx'> </div><div class='ctx'> 	offset = inode-&gt;i_size &amp; (PAGE_SIZE - 1);</div><div class='ctx'> 	/*</div><div class='del'>-	 * If the page is fully truncated, we don't need to wait for any commit</div><div class='del'>-	 * (and we even should not as __ext4_journalled_invalidatepage() may</div><div class='del'>-	 * strip all buffers from the page but keep the page dirty which can then</div><div class='del'>-	 * confuse e.g. concurrent ext4_writepage() seeing dirty page without</div><div class='add'>+	 * If the folio is fully truncated, we don't need to wait for any commit</div><div class='add'>+	 * (and we even should not as __ext4_journalled_invalidate_folio() may</div><div class='add'>+	 * strip all buffers from the folio but keep the folio dirty which can then</div><div class='add'>+	 * confuse e.g. concurrent ext4_writepages() seeing dirty folio without</div><div class='ctx'> 	 * buffers). Also we don't need to wait for any commit if all buffers in</div><div class='del'>-	 * the page remain valid. This is most beneficial for the common case of</div><div class='add'>+	 * the folio remain valid. This is most beneficial for the common case of</div><div class='ctx'> 	 * blocksize == PAGESIZE.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (!offset || offset &gt; (PAGE_SIZE - i_blocksize(inode)))</div><div class='ctx'> 		return;</div><div class='ctx'> 	while (1) {</div><div class='del'>-		page = find_lock_page(inode-&gt;i_mapping,</div><div class='add'>+		struct folio *folio = filemap_lock_folio(inode-&gt;i_mapping,</div><div class='ctx'> 				      inode-&gt;i_size &gt;&gt; PAGE_SHIFT);</div><div class='del'>-		if (!page)</div><div class='add'>+		if (IS_ERR(folio))</div><div class='ctx'> 			return;</div><div class='del'>-		ret = __ext4_journalled_invalidatepage(page, offset,</div><div class='del'>-						PAGE_SIZE - offset);</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		put_page(page);</div><div class='add'>+		ret = __ext4_journalled_invalidate_folio(folio, offset,</div><div class='add'>+						folio_size(folio) - offset);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 		if (ret != -EBUSY)</div><div class='ctx'> 			return;</div><div class='del'>-		commit_tid = 0;</div><div class='add'>+		has_transaction = false;</div><div class='ctx'> 		read_lock(&amp;journal-&gt;j_state_lock);</div><div class='del'>-		if (journal-&gt;j_committing_transaction)</div><div class='add'>+		if (journal-&gt;j_committing_transaction) {</div><div class='ctx'> 			commit_tid = journal-&gt;j_committing_transaction-&gt;t_tid;</div><div class='add'>+			has_transaction = true;</div><div class='add'>+		}</div><div class='ctx'> 		read_unlock(&amp;journal-&gt;j_state_lock);</div><div class='del'>-		if (commit_tid)</div><div class='add'>+		if (has_transaction)</div><div class='ctx'> 			jbd2_log_wait_commit(journal, commit_tid);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -5282,18 +5804,20 @@ static void ext4_wait_for_tail_page_commit(struct inode *inode)</div><div class='ctx'>  * transaction are already on disk (truncate waits for pages under</div><div class='ctx'>  * writeback).</div><div class='ctx'>  *</div><div class='del'>- * Called with inode-&gt;i_mutex down.</div><div class='add'>+ * Called with inode-&gt;i_rwsem down.</div><div class='ctx'>  */</div><div class='del'>-int ext4_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='add'>+int ext4_setattr(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		 struct iattr *attr)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	int error, rc = 0;</div><div class='ctx'> 	int orphan = 0;</div><div class='ctx'> 	const unsigned int ia_valid = attr-&gt;ia_valid;</div><div class='add'>+	bool inc_ivers = true;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ext4_forced_shutdown(EXT4_SB(inode-&gt;i_sb))))</div><div class='del'>-		return -EIO;</div><div class='add'>+	error = ext4_emergency_state(inode-&gt;i_sb);</div><div class='add'>+	if (unlikely(error))</div><div class='add'>+		return error;</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(IS_IMMUTABLE(inode)))</div><div class='ctx'> 		return -EPERM;</div><div class='hunk'>@@ -5303,7 +5827,7 @@ int ext4_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 				  ATTR_GID | ATTR_TIMES_SET))))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='del'>-	error = setattr_prepare(mnt_userns, dentry, attr);</div><div class='add'>+	error = setattr_prepare(idmap, dentry, attr);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='hunk'>@@ -5315,14 +5839,14 @@ int ext4_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='del'>-	if (is_quota_modification(inode, attr)) {</div><div class='add'>+	if (is_quota_modification(idmap, inode, attr)) {</div><div class='ctx'> 		error = dquot_initialize(inode);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			return error;</div><div class='ctx'> 	}</div><div class='del'>-	ext4_fc_start_update(inode);</div><div class='del'>-	if ((ia_valid &amp; ATTR_UID &amp;&amp; !uid_eq(attr-&gt;ia_uid, inode-&gt;i_uid)) ||</div><div class='del'>-	    (ia_valid &amp; ATTR_GID &amp;&amp; !gid_eq(attr-&gt;ia_gid, inode-&gt;i_gid))) {</div><div class='add'>+</div><div class='add'>+	if (i_uid_needs_update(idmap, attr, inode) ||</div><div class='add'>+	    i_gid_needs_update(idmap, attr, inode)) {</div><div class='ctx'> 		handle_t *handle;</div><div class='ctx'> </div><div class='ctx'> 		/* (user+group)*(old+new) structure, inode write (sb,</div><div class='hunk'>@@ -5339,24 +5863,20 @@ int ext4_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 		 * counts xattr inode references.</div><div class='ctx'> 		 */</div><div class='ctx'> 		down_read(&amp;EXT4_I(inode)-&gt;xattr_sem);</div><div class='del'>-		error = dquot_transfer(inode, attr);</div><div class='add'>+		error = dquot_transfer(idmap, inode, attr);</div><div class='ctx'> 		up_read(&amp;EXT4_I(inode)-&gt;xattr_sem);</div><div class='ctx'> </div><div class='ctx'> 		if (error) {</div><div class='ctx'> 			ext4_journal_stop(handle);</div><div class='del'>-			ext4_fc_stop_update(inode);</div><div class='ctx'> 			return error;</div><div class='ctx'> 		}</div><div class='ctx'> 		/* Update corresponding info in inode so that everything is in</div><div class='ctx'> 		 * one transaction */</div><div class='del'>-		if (attr-&gt;ia_valid &amp; ATTR_UID)</div><div class='del'>-			inode-&gt;i_uid = attr-&gt;ia_uid;</div><div class='del'>-		if (attr-&gt;ia_valid &amp; ATTR_GID)</div><div class='del'>-			inode-&gt;i_gid = attr-&gt;ia_gid;</div><div class='add'>+		i_uid_update(idmap, attr, inode);</div><div class='add'>+		i_gid_update(idmap, attr, inode);</div><div class='ctx'> 		error = ext4_mark_inode_dirty(handle, inode);</div><div class='ctx'> 		ext4_journal_stop(handle);</div><div class='ctx'> 		if (unlikely(error)) {</div><div class='del'>-			ext4_fc_stop_update(inode);</div><div class='ctx'> 			return error;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -5364,23 +5884,22 @@ int ext4_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 	if (attr-&gt;ia_valid &amp; ATTR_SIZE) {</div><div class='ctx'> 		handle_t *handle;</div><div class='ctx'> 		loff_t oldsize = inode-&gt;i_size;</div><div class='add'>+		loff_t old_disksize;</div><div class='ctx'> 		int shrink = (attr-&gt;ia_size &lt; inode-&gt;i_size);</div><div class='ctx'> </div><div class='ctx'> 		if (!(ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS))) {</div><div class='ctx'> 			struct ext4_sb_info *sbi = EXT4_SB(inode-&gt;i_sb);</div><div class='ctx'> </div><div class='ctx'> 			if (attr-&gt;ia_size &gt; sbi-&gt;s_bitmap_maxbytes) {</div><div class='del'>-				ext4_fc_stop_update(inode);</div><div class='ctx'> 				return -EFBIG;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 		if (!S_ISREG(inode-&gt;i_mode)) {</div><div class='del'>-			ext4_fc_stop_update(inode);</div><div class='ctx'> 			return -EINVAL;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (IS_I_VERSION(inode) &amp;&amp; attr-&gt;ia_size != inode-&gt;i_size)</div><div class='del'>-			inode_inc_iversion(inode);</div><div class='add'>+		if (attr-&gt;ia_size == inode-&gt;i_size)</div><div class='add'>+			inc_ivers = false;</div><div class='ctx'> </div><div class='ctx'> 		if (shrink) {</div><div class='ctx'> 			if (ext4_should_order_data(inode)) {</div><div class='hunk'>@@ -5405,6 +5924,14 @@ int ext4_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (attr-&gt;ia_size != inode-&gt;i_size) {</div><div class='add'>+			/* attach jbd2 jinode for EOF folio tail zeroing */</div><div class='add'>+			if (attr-&gt;ia_size &amp; (inode-&gt;i_sb-&gt;s_blocksize - 1) ||</div><div class='add'>+			    oldsize &amp; (inode-&gt;i_sb-&gt;s_blocksize - 1)) {</div><div class='add'>+				error = ext4_inode_attach_jinode(inode);</div><div class='add'>+				if (error)</div><div class='add'>+					goto out_mmap_sem;</div><div class='add'>+			}</div><div class='add'>+</div><div class='ctx'> 			handle = ext4_journal_start(inode, EXT4_HT_INODE, 3);</div><div class='ctx'> 			if (IS_ERR(handle)) {</div><div class='ctx'> 				error = PTR_ERR(handle);</div><div class='hunk'>@@ -5415,20 +5942,23 @@ int ext4_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 				orphan = 1;</div><div class='ctx'> 			}</div><div class='ctx'> 			/*</div><div class='del'>-			 * Update c/mtime on truncate up, ext4_truncate() will</div><div class='del'>-			 * update c/mtime in shrink case below</div><div class='add'>+			 * Update c/mtime and tail zero the EOF folio on</div><div class='add'>+			 * truncate up. ext4_truncate() handles the shrink case</div><div class='add'>+			 * below.</div><div class='ctx'> 			 */</div><div class='ctx'> 			if (!shrink) {</div><div class='del'>-				inode-&gt;i_mtime = current_time(inode);</div><div class='del'>-				inode-&gt;i_ctime = inode-&gt;i_mtime;</div><div class='add'>+				inode_set_mtime_to_ts(inode,</div><div class='add'>+						      inode_set_ctime_current(inode));</div><div class='add'>+				if (oldsize &amp; (inode-&gt;i_sb-&gt;s_blocksize - 1))</div><div class='add'>+					ext4_block_truncate_page(handle,</div><div class='add'>+							inode-&gt;i_mapping, oldsize);</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			if (shrink)</div><div class='ctx'> 				ext4_fc_track_range(handle, inode,</div><div class='ctx'> 					(attr-&gt;ia_size &gt; 0 ? attr-&gt;ia_size - 1 : 0) &gt;&gt;</div><div class='ctx'> 					inode-&gt;i_sb-&gt;s_blocksize_bits,</div><div class='del'>-					(oldsize &gt; 0 ? oldsize - 1 : 0) &gt;&gt;</div><div class='del'>-					inode-&gt;i_sb-&gt;s_blocksize_bits);</div><div class='add'>+					EXT_MAX_BLOCKS - 1);</div><div class='ctx'> 			else</div><div class='ctx'> 				ext4_fc_track_range(</div><div class='ctx'> 					handle, inode,</div><div class='hunk'>@@ -5438,10 +5968,9 @@ int ext4_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 					inode-&gt;i_sb-&gt;s_blocksize_bits);</div><div class='ctx'> </div><div class='ctx'> 			down_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='add'>+			old_disksize = EXT4_I(inode)-&gt;i_disksize;</div><div class='ctx'> 			EXT4_I(inode)-&gt;i_disksize = attr-&gt;ia_size;</div><div class='del'>-			rc = ext4_mark_inode_dirty(handle, inode);</div><div class='del'>-			if (!error)</div><div class='del'>-				error = rc;</div><div class='add'>+</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * We have to update i_size under i_data_sem together</div><div class='ctx'> 			 * with i_disksize to avoid races with writeback code</div><div class='hunk'>@@ -5449,7 +5978,12 @@ int ext4_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 			 */</div><div class='ctx'> 			if (!error)</div><div class='ctx'> 				i_size_write(inode, attr-&gt;ia_size);</div><div class='add'>+			else</div><div class='add'>+				EXT4_I(inode)-&gt;i_disksize = old_disksize;</div><div class='ctx'> 			up_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='add'>+			rc = ext4_mark_inode_dirty(handle, inode);</div><div class='add'>+			if (!error)</div><div class='add'>+				error = rc;</div><div class='ctx'> 			ext4_journal_stop(handle);</div><div class='ctx'> 			if (error)</div><div class='ctx'> 				goto out_mmap_sem;</div><div class='hunk'>@@ -5480,7 +6014,9 @@ out_mmap_sem:</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!error) {</div><div class='del'>-		setattr_copy(mnt_userns, inode, attr);</div><div class='add'>+		if (inc_ivers)</div><div class='add'>+			inode_inc_iversion(inode);</div><div class='add'>+		setattr_copy(idmap, inode, attr);</div><div class='ctx'> 		mark_inode_dirty(inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -5492,18 +6028,33 @@ out_mmap_sem:</div><div class='ctx'> 		ext4_orphan_del(NULL, inode);</div><div class='ctx'> </div><div class='ctx'> 	if (!error &amp;&amp; (ia_valid &amp; ATTR_MODE))</div><div class='del'>-		rc = posix_acl_chmod(mnt_userns, inode, inode-&gt;i_mode);</div><div class='add'>+		rc = posix_acl_chmod(idmap, dentry, inode-&gt;i_mode);</div><div class='ctx'> </div><div class='ctx'> err_out:</div><div class='ctx'> 	if  (error)</div><div class='ctx'> 		ext4_std_error(inode-&gt;i_sb, error);</div><div class='ctx'> 	if (!error)</div><div class='ctx'> 		error = rc;</div><div class='del'>-	ext4_fc_stop_update(inode);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int ext4_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='add'>+u32 ext4_dio_alignment(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	if (fsverity_active(inode))</div><div class='add'>+		return 0;</div><div class='add'>+	if (ext4_should_journal_data(inode))</div><div class='add'>+		return 0;</div><div class='add'>+	if (ext4_has_inline_data(inode))</div><div class='add'>+		return 0;</div><div class='add'>+	if (IS_ENCRYPTED(inode)) {</div><div class='add'>+		if (!fscrypt_dio_supported(inode))</div><div class='add'>+			return 0;</div><div class='add'>+		return i_blocksize(inode);</div><div class='add'>+	}</div><div class='add'>+	return 1; /* use the iomap defaults */</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int ext4_getattr(struct mnt_idmap *idmap, const struct path *path,</div><div class='ctx'> 		 struct kstat *stat, u32 request_mask, unsigned int query_flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(path-&gt;dentry);</div><div class='hunk'>@@ -5518,6 +6069,39 @@ int ext4_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='ctx'> 		stat-&gt;btime.tv_nsec = ei-&gt;i_crtime.tv_nsec;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Return the DIO alignment restrictions if requested.  We only return</div><div class='add'>+	 * this information when requested, since on encrypted files it might</div><div class='add'>+	 * take a fair bit of work to get if the file wasn't opened recently.</div><div class='add'>+	 */</div><div class='add'>+	if ((request_mask &amp; STATX_DIOALIGN) &amp;&amp; S_ISREG(inode-&gt;i_mode)) {</div><div class='add'>+		u32 dio_align = ext4_dio_alignment(inode);</div><div class='add'>+</div><div class='add'>+		stat-&gt;result_mask |= STATX_DIOALIGN;</div><div class='add'>+		if (dio_align == 1) {</div><div class='add'>+			struct block_device *bdev = inode-&gt;i_sb-&gt;s_bdev;</div><div class='add'>+</div><div class='add'>+			/* iomap defaults */</div><div class='add'>+			stat-&gt;dio_mem_align = bdev_dma_alignment(bdev) + 1;</div><div class='add'>+			stat-&gt;dio_offset_align = bdev_logical_block_size(bdev);</div><div class='add'>+		} else {</div><div class='add'>+			stat-&gt;dio_mem_align = dio_align;</div><div class='add'>+			stat-&gt;dio_offset_align = dio_align;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if ((request_mask &amp; STATX_WRITE_ATOMIC) &amp;&amp; S_ISREG(inode-&gt;i_mode)) {</div><div class='add'>+		struct ext4_sb_info *sbi = EXT4_SB(inode-&gt;i_sb);</div><div class='add'>+		unsigned int awu_min = 0, awu_max = 0;</div><div class='add'>+</div><div class='add'>+		if (ext4_inode_can_atomic_write(inode)) {</div><div class='add'>+			awu_min = sbi-&gt;s_awu_min;</div><div class='add'>+			awu_max = sbi-&gt;s_awu_max;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		generic_fill_statx_atomic_writes(stat, awu_min, awu_max, 0);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	flags = ei-&gt;i_flags &amp; EXT4_FL_USER_VISIBLE;</div><div class='ctx'> 	if (flags &amp; EXT4_APPEND_FL)</div><div class='ctx'> 		stat-&gt;attributes |= STATX_ATTR_APPEND;</div><div class='hunk'>@@ -5539,18 +6123,18 @@ int ext4_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='ctx'> 				  STATX_ATTR_NODUMP |</div><div class='ctx'> 				  STATX_ATTR_VERITY);</div><div class='ctx'> </div><div class='del'>-	generic_fillattr(mnt_userns, inode, stat);</div><div class='add'>+	generic_fillattr(idmap, request_mask, inode, stat);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int ext4_file_getattr(struct user_namespace *mnt_userns,</div><div class='add'>+int ext4_file_getattr(struct mnt_idmap *idmap,</div><div class='ctx'> 		      const struct path *path, struct kstat *stat,</div><div class='ctx'> 		      u32 request_mask, unsigned int query_flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(path-&gt;dentry);</div><div class='ctx'> 	u64 delalloc_blocks;</div><div class='ctx'> </div><div class='del'>-	ext4_getattr(mnt_userns, path, stat, request_mask, query_flags);</div><div class='add'>+	ext4_getattr(idmap, path, stat, request_mask, query_flags);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If there is inline data in the inode, the inode will normally not</div><div class='hunk'>@@ -5596,22 +6180,19 @@ static int ext4_index_trans_blocks(struct inode *inode, int lblocks,</div><div class='ctx'>  *</div><div class='ctx'>  * Also account for superblock, inode, quota and xattr blocks</div><div class='ctx'>  */</div><div class='del'>-static int ext4_meta_trans_blocks(struct inode *inode, int lblocks,</div><div class='del'>-				  int pextents)</div><div class='add'>+int ext4_meta_trans_blocks(struct inode *inode, int lblocks, int pextents)</div><div class='ctx'> {</div><div class='ctx'> 	ext4_group_t groups, ngroups = ext4_get_groups_count(inode-&gt;i_sb);</div><div class='ctx'> 	int gdpblocks;</div><div class='ctx'> 	int idxblocks;</div><div class='del'>-	int ret = 0;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * How many index blocks need to touch to map @lblocks logical blocks</div><div class='del'>-	 * to @pextents physical extents?</div><div class='add'>+	 * How many index and leaf blocks need to touch to map @lblocks</div><div class='add'>+	 * logical blocks to @pextents physical extents?</div><div class='ctx'> 	 */</div><div class='ctx'> 	idxblocks = ext4_index_trans_blocks(inode, lblocks, pextents);</div><div class='ctx'> </div><div class='del'>-	ret = idxblocks;</div><div class='del'>-</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Now let's see how many group bitmaps and group descriptors need</div><div class='ctx'> 	 * to account</div><div class='hunk'>@@ -5624,7 +6205,7 @@ static int ext4_meta_trans_blocks(struct inode *inode, int lblocks,</div><div class='ctx'> 		gdpblocks = EXT4_SB(inode-&gt;i_sb)-&gt;s_gdb_count;</div><div class='ctx'> </div><div class='ctx'> 	/* bitmaps and block group descriptor blocks */</div><div class='del'>-	ret += groups + gdpblocks;</div><div class='add'>+	ret = idxblocks + groups + gdpblocks;</div><div class='ctx'> </div><div class='ctx'> 	/* Blocks for super block, inode, quota and xattr blocks */</div><div class='ctx'> 	ret += EXT4_META_TRANS_BLOCKS(inode-&gt;i_sb);</div><div class='hunk'>@@ -5633,25 +6214,19 @@ static int ext4_meta_trans_blocks(struct inode *inode, int lblocks,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Calculate the total number of credits to reserve to fit</div><div class='del'>- * the modification of a single pages into a single transaction,</div><div class='del'>- * which may include multiple chunks of block allocations.</div><div class='del'>- *</div><div class='del'>- * This could be called via ext4_write_begin()</div><div class='del'>- *</div><div class='del'>- * We need to consider the worse case, when</div><div class='del'>- * one new block per extent.</div><div class='add'>+ * Calculate the journal credits for modifying the number of blocks</div><div class='add'>+ * in a single extent within one transaction. 'nrblocks' is used only</div><div class='add'>+ * for non-extent inodes. For extent type inodes, 'nrblocks' can be</div><div class='add'>+ * zero if the exact number of blocks is unknown.</div><div class='ctx'>  */</div><div class='del'>-int ext4_writepage_trans_blocks(struct inode *inode)</div><div class='add'>+int ext4_chunk_trans_extent(struct inode *inode, int nrblocks)</div><div class='ctx'> {</div><div class='del'>-	int bpp = ext4_journal_blocks_per_page(inode);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = ext4_meta_trans_blocks(inode, bpp, bpp);</div><div class='del'>-</div><div class='add'>+	ret = ext4_meta_trans_blocks(inode, nrblocks, 1);</div><div class='ctx'> 	/* Account for data blocks for journalled mode */</div><div class='ctx'> 	if (ext4_should_journal_data(inode))</div><div class='del'>-		ret += bpp;</div><div class='add'>+		ret += nrblocks;</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5678,15 +6253,13 @@ int ext4_mark_iloc_dirty(handle_t *handle,</div><div class='ctx'> {</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ext4_forced_shutdown(EXT4_SB(inode-&gt;i_sb)))) {</div><div class='add'>+	err = ext4_emergency_state(inode-&gt;i_sb);</div><div class='add'>+	if (unlikely(err)) {</div><div class='ctx'> 		put_bh(iloc-&gt;bh);</div><div class='del'>-		return -EIO;</div><div class='add'>+		return err;</div><div class='ctx'> 	}</div><div class='ctx'> 	ext4_fc_track_inode(handle, inode);</div><div class='ctx'> </div><div class='del'>-	if (IS_I_VERSION(inode))</div><div class='del'>-		inode_inc_iversion(inode);</div><div class='del'>-</div><div class='ctx'> 	/* the do_update_inode consumes one bh-&gt;b_count */</div><div class='ctx'> 	get_bh(iloc-&gt;bh);</div><div class='ctx'> </div><div class='hunk'>@@ -5707,8 +6280,9 @@ ext4_reserve_inode_write(handle_t *handle, struct inode *inode,</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ext4_forced_shutdown(EXT4_SB(inode-&gt;i_sb))))</div><div class='del'>-		return -EIO;</div><div class='add'>+	err = ext4_emergency_state(inode-&gt;i_sb);</div><div class='add'>+	if (unlikely(err))</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='ctx'> 	err = ext4_get_inode_loc(inode, iloc);</div><div class='ctx'> 	if (!err) {</div><div class='hunk'>@@ -5719,6 +6293,7 @@ ext4_reserve_inode_write(handle_t *handle, struct inode *inode,</div><div class='ctx'> 			brelse(iloc-&gt;bh);</div><div class='ctx'> 			iloc-&gt;bh = NULL;</div><div class='ctx'> 		}</div><div class='add'>+		ext4_fc_track_inode(handle, inode);</div><div class='ctx'> 	}</div><div class='ctx'> 	ext4_std_error(inode-&gt;i_sb, err);</div><div class='ctx'> 	return err;</div><div class='hunk'>@@ -5762,6 +6337,14 @@ static int __ext4_expand_extra_isize(struct inode *inode,</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * We may need to allocate external xattr block so we need quotas</div><div class='add'>+	 * initialized. Here we can be called with various locks held so we</div><div class='add'>+	 * cannot affort to initialize quotas ourselves. So just bail.</div><div class='add'>+	 */</div><div class='add'>+	if (dquot_initialize_needed(inode))</div><div class='add'>+		return -EAGAIN;</div><div class='add'>+</div><div class='ctx'> 	/* try to expand with EAs present */</div><div class='ctx'> 	error = ext4_expand_extra_isize_ea(inode, new_extra_isize,</div><div class='ctx'> 					   raw_inode, handle);</div><div class='hunk'>@@ -5925,7 +6508,7 @@ int ext4_change_inode_journal_flag(struct inode *inode, int val)</div><div class='ctx'> 	journal_t *journal;</div><div class='ctx'> 	handle_t *handle;</div><div class='ctx'> 	int err;</div><div class='del'>-	struct ext4_sb_info *sbi = EXT4_SB(inode-&gt;i_sb);</div><div class='add'>+	int alloc_ctx;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We have to be very careful here: changing a data block's</div><div class='hunk'>@@ -5954,16 +6537,16 @@ int ext4_change_inode_journal_flag(struct inode *inode, int val)</div><div class='ctx'> 	 * dirty data which can be converted only after flushing the dirty</div><div class='ctx'> 	 * data (and journalled aops don't know how to handle these cases).</div><div class='ctx'> 	 */</div><div class='del'>-	if (val) {</div><div class='del'>-		filemap_invalidate_lock(inode-&gt;i_mapping);</div><div class='del'>-		err = filemap_write_and_wait(inode-&gt;i_mapping);</div><div class='del'>-		if (err &lt; 0) {</div><div class='del'>-			filemap_invalidate_unlock(inode-&gt;i_mapping);</div><div class='del'>-			return err;</div><div class='del'>-		}</div><div class='add'>+	filemap_invalidate_lock(inode-&gt;i_mapping);</div><div class='add'>+	err = filemap_write_and_wait(inode-&gt;i_mapping);</div><div class='add'>+	if (err &lt; 0) {</div><div class='add'>+		filemap_invalidate_unlock(inode-&gt;i_mapping);</div><div class='add'>+		return err;</div><div class='ctx'> 	}</div><div class='add'>+	/* Before switch the inode journalling mode evict all the page cache. */</div><div class='add'>+	truncate_pagecache(inode, 0);</div><div class='ctx'> </div><div class='del'>-	percpu_down_write(&amp;sbi-&gt;s_writepages_rwsem);</div><div class='add'>+	alloc_ctx = ext4_writepages_down_write(inode-&gt;i_sb);</div><div class='ctx'> 	jbd2_journal_lock_updates(journal);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -5980,18 +6563,18 @@ int ext4_change_inode_journal_flag(struct inode *inode, int val)</div><div class='ctx'> 		err = jbd2_journal_flush(journal, 0);</div><div class='ctx'> 		if (err &lt; 0) {</div><div class='ctx'> 			jbd2_journal_unlock_updates(journal);</div><div class='del'>-			percpu_up_write(&amp;sbi-&gt;s_writepages_rwsem);</div><div class='add'>+			ext4_writepages_up_write(inode-&gt;i_sb, alloc_ctx);</div><div class='add'>+			filemap_invalidate_unlock(inode-&gt;i_mapping);</div><div class='ctx'> 			return err;</div><div class='ctx'> 		}</div><div class='ctx'> 		ext4_clear_inode_flag(inode, EXT4_INODE_JOURNAL_DATA);</div><div class='ctx'> 	}</div><div class='ctx'> 	ext4_set_aops(inode);</div><div class='add'>+	ext4_set_inode_mapping_order(inode);</div><div class='ctx'> </div><div class='ctx'> 	jbd2_journal_unlock_updates(journal);</div><div class='del'>-	percpu_up_write(&amp;sbi-&gt;s_writepages_rwsem);</div><div class='del'>-</div><div class='del'>-	if (val)</div><div class='del'>-		filemap_invalidate_unlock(inode-&gt;i_mapping);</div><div class='add'>+	ext4_writepages_up_write(inode-&gt;i_sb, alloc_ctx);</div><div class='add'>+	filemap_invalidate_unlock(inode-&gt;i_mapping);</div><div class='ctx'> </div><div class='ctx'> 	/* Finally we can mark the inode as dirty. */</div><div class='ctx'> </div><div class='hunk'>@@ -6000,7 +6583,7 @@ int ext4_change_inode_journal_flag(struct inode *inode, int val)</div><div class='ctx'> 		return PTR_ERR(handle);</div><div class='ctx'> </div><div class='ctx'> 	ext4_fc_mark_ineligible(inode-&gt;i_sb,</div><div class='del'>-		EXT4_FC_REASON_JOURNAL_FLAG_CHANGE);</div><div class='add'>+		EXT4_FC_REASON_JOURNAL_FLAG_CHANGE, handle);</div><div class='ctx'> 	err = ext4_mark_inode_dirty(handle, inode);</div><div class='ctx'> 	ext4_handle_sync(handle);</div><div class='ctx'> 	ext4_journal_stop(handle);</div><div class='hunk'>@@ -6015,10 +6598,59 @@ static int ext4_bh_unmapped(handle_t *handle, struct inode *inode,</div><div class='ctx'> 	return !buffer_mapped(bh);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int ext4_block_page_mkwrite(struct inode *inode, struct folio *folio,</div><div class='add'>+				   get_block_t get_block)</div><div class='add'>+{</div><div class='add'>+	handle_t *handle;</div><div class='add'>+	loff_t size;</div><div class='add'>+	unsigned long len;</div><div class='add'>+	int credits;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	credits = ext4_chunk_trans_extent(inode,</div><div class='add'>+			ext4_journal_blocks_per_folio(inode));</div><div class='add'>+	handle = ext4_journal_start(inode, EXT4_HT_WRITE_PAGE, credits);</div><div class='add'>+	if (IS_ERR(handle))</div><div class='add'>+		return PTR_ERR(handle);</div><div class='add'>+</div><div class='add'>+	folio_lock(folio);</div><div class='add'>+	size = i_size_read(inode);</div><div class='add'>+	/* Page got truncated from under us? */</div><div class='add'>+	if (folio-&gt;mapping != inode-&gt;i_mapping || folio_pos(folio) &gt; size) {</div><div class='add'>+		ret = -EFAULT;</div><div class='add'>+		goto out_error;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	len = folio_size(folio);</div><div class='add'>+	if (folio_pos(folio) + len &gt; size)</div><div class='add'>+		len = size - folio_pos(folio);</div><div class='add'>+</div><div class='add'>+	ret = ext4_block_write_begin(handle, folio, 0, len, get_block);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_error;</div><div class='add'>+</div><div class='add'>+	if (!ext4_should_journal_data(inode)) {</div><div class='add'>+		block_commit_write(folio, 0, len);</div><div class='add'>+		folio_mark_dirty(folio);</div><div class='add'>+	} else {</div><div class='add'>+		ret = ext4_journal_folio_buffers(handle, folio, len);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out_error;</div><div class='add'>+	}</div><div class='add'>+	ext4_journal_stop(handle);</div><div class='add'>+	folio_wait_stable(folio);</div><div class='add'>+	return ret;</div><div class='add'>+</div><div class='add'>+out_error:</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	ext4_journal_stop(handle);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> vm_fault_t ext4_page_mkwrite(struct vm_fault *vmf)</div><div class='ctx'> {</div><div class='ctx'> 	struct vm_area_struct *vma = vmf-&gt;vma;</div><div class='del'>-	struct page *page = vmf-&gt;page;</div><div class='add'>+	struct folio *folio = page_folio(vmf-&gt;page);</div><div class='ctx'> 	loff_t size;</div><div class='ctx'> 	unsigned long len;</div><div class='ctx'> 	int err;</div><div class='hunk'>@@ -6026,8 +6658,7 @@ vm_fault_t ext4_page_mkwrite(struct vm_fault *vmf)</div><div class='ctx'> 	struct file *file = vma-&gt;vm_file;</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='ctx'> 	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='del'>-	handle_t *handle;</div><div class='del'>-	get_block_t *get_block;</div><div class='add'>+	get_block_t *get_block = ext4_get_block;</div><div class='ctx'> 	int retries = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(IS_IMMUTABLE(inode)))</div><div class='hunk'>@@ -6062,19 +6693,18 @@ vm_fault_t ext4_page_mkwrite(struct vm_fault *vmf)</div><div class='ctx'> 		goto out_ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	lock_page(page);</div><div class='add'>+	folio_lock(folio);</div><div class='ctx'> 	size = i_size_read(inode);</div><div class='ctx'> 	/* Page got truncated from under us? */</div><div class='del'>-	if (page-&gt;mapping != mapping || page_offset(page) &gt; size) {</div><div class='del'>-		unlock_page(page);</div><div class='add'>+	if (folio-&gt;mapping != mapping || folio_pos(folio) &gt; size) {</div><div class='add'>+		folio_unlock(folio);</div><div class='ctx'> 		ret = VM_FAULT_NOPAGE;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (page-&gt;index == size &gt;&gt; PAGE_SHIFT)</div><div class='del'>-		len = size &amp; ~PAGE_MASK;</div><div class='del'>-	else</div><div class='del'>-		len = PAGE_SIZE;</div><div class='add'>+	len = folio_size(folio);</div><div class='add'>+	if (folio_pos(folio) + len &gt; size)</div><div class='add'>+		len = size - folio_pos(folio);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Return if we have all the buffers mapped. This avoids the need to do</div><div class='ctx'> 	 * journal_start/journal_stop which can block and take a long time</div><div class='hunk'>@@ -6082,80 +6712,30 @@ vm_fault_t ext4_page_mkwrite(struct vm_fault *vmf)</div><div class='ctx'> 	 * This cannot be done for data journalling, as we have to add the</div><div class='ctx'> 	 * inode to the transaction's list to writeprotect pages on commit.</div><div class='ctx'> 	 */</div><div class='del'>-	if (page_has_buffers(page)) {</div><div class='del'>-		if (!ext4_walk_page_buffers(NULL, inode, page_buffers(page),</div><div class='add'>+	if (folio_buffers(folio)) {</div><div class='add'>+		if (!ext4_walk_page_buffers(NULL, inode, folio_buffers(folio),</div><div class='ctx'> 					    0, len, NULL,</div><div class='ctx'> 					    ext4_bh_unmapped)) {</div><div class='ctx'> 			/* Wait so that we don't change page under IO */</div><div class='del'>-			wait_for_stable_page(page);</div><div class='add'>+			folio_wait_stable(folio);</div><div class='ctx'> 			ret = VM_FAULT_LOCKED;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> 	/* OK, we need to fill the hole... */</div><div class='ctx'> 	if (ext4_should_dioread_nolock(inode))</div><div class='ctx'> 		get_block = ext4_get_block_unwritten;</div><div class='del'>-	else</div><div class='del'>-		get_block = ext4_get_block;</div><div class='ctx'> retry_alloc:</div><div class='del'>-	handle = ext4_journal_start(inode, EXT4_HT_WRITE_PAGE,</div><div class='del'>-				    ext4_writepage_trans_blocks(inode));</div><div class='del'>-	if (IS_ERR(handle)) {</div><div class='del'>-		ret = VM_FAULT_SIGBUS;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	/*</div><div class='del'>-	 * Data journalling can't use block_page_mkwrite() because it</div><div class='del'>-	 * will set_buffer_dirty() before do_journal_get_write_access()</div><div class='del'>-	 * thus might hit warning messages for dirty metadata buffers.</div><div class='del'>-	 */</div><div class='del'>-	if (!ext4_should_journal_data(inode)) {</div><div class='del'>-		err = block_page_mkwrite(vma, vmf, get_block);</div><div class='del'>-	} else {</div><div class='del'>-		lock_page(page);</div><div class='del'>-		size = i_size_read(inode);</div><div class='del'>-		/* Page got truncated from under us? */</div><div class='del'>-		if (page-&gt;mapping != mapping || page_offset(page) &gt; size) {</div><div class='del'>-			ret = VM_FAULT_NOPAGE;</div><div class='del'>-			goto out_error;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (page-&gt;index == size &gt;&gt; PAGE_SHIFT)</div><div class='del'>-			len = size &amp; ~PAGE_MASK;</div><div class='del'>-		else</div><div class='del'>-			len = PAGE_SIZE;</div><div class='del'>-</div><div class='del'>-		err = __block_write_begin(page, 0, len, ext4_get_block);</div><div class='del'>-		if (!err) {</div><div class='del'>-			ret = VM_FAULT_SIGBUS;</div><div class='del'>-			if (ext4_walk_page_buffers(handle, inode,</div><div class='del'>-					page_buffers(page), 0, len, NULL,</div><div class='del'>-					do_journal_get_write_access))</div><div class='del'>-				goto out_error;</div><div class='del'>-			if (ext4_walk_page_buffers(handle, inode,</div><div class='del'>-					page_buffers(page), 0, len, NULL,</div><div class='del'>-					write_end_fn))</div><div class='del'>-				goto out_error;</div><div class='del'>-			if (ext4_jbd2_inode_add_write(handle, inode,</div><div class='del'>-						      page_offset(page), len))</div><div class='del'>-				goto out_error;</div><div class='del'>-			ext4_set_inode_state(inode, EXT4_STATE_JDATA);</div><div class='del'>-		} else {</div><div class='del'>-			unlock_page(page);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	ext4_journal_stop(handle);</div><div class='del'>-	if (err == -ENOSPC &amp;&amp; ext4_should_retry_alloc(inode-&gt;i_sb, &amp;retries))</div><div class='add'>+	/* Start journal and allocate blocks */</div><div class='add'>+	err = ext4_block_page_mkwrite(inode, folio, get_block);</div><div class='add'>+	if (err == -EAGAIN ||</div><div class='add'>+	    (err == -ENOSPC &amp;&amp; ext4_should_retry_alloc(inode-&gt;i_sb, &amp;retries)))</div><div class='ctx'> 		goto retry_alloc;</div><div class='ctx'> out_ret:</div><div class='del'>-	ret = block_page_mkwrite_return(err);</div><div class='add'>+	ret = vmf_fs_error(err);</div><div class='ctx'> out:</div><div class='ctx'> 	filemap_invalidate_unlock_shared(mapping);</div><div class='ctx'> 	sb_end_pagefault(inode-&gt;i_sb);</div><div class='ctx'> 	return ret;</div><div class='del'>-out_error:</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	ext4_journal_stop(handle);</div><div class='del'>-	goto out;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/ext4/ioctl.c b/fs/ext4/ioctl.c<br/>index 606dee9e08a3..7ce0fc40aec2 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/ioctl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/ioctl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/ioctl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/ioctl.c</a></div><div class='hunk'>@@ -16,18 +16,268 @@</div><div class='ctx'> #include &lt;linux/file.h&gt;</div><div class='ctx'> #include &lt;linux/quotaops.h&gt;</div><div class='ctx'> #include &lt;linux/random.h&gt;</div><div class='del'>-#include &lt;linux/uuid.h&gt;</div><div class='ctx'> #include &lt;linux/uaccess.h&gt;</div><div class='ctx'> #include &lt;linux/delay.h&gt;</div><div class='ctx'> #include &lt;linux/iversion.h&gt;</div><div class='ctx'> #include &lt;linux/fileattr.h&gt;</div><div class='add'>+#include &lt;linux/uuid.h&gt;</div><div class='ctx'> #include "ext4_jbd2.h"</div><div class='ctx'> #include "ext4.h"</div><div class='ctx'> #include &lt;linux/fsmap.h&gt;</div><div class='ctx'> #include "fsmap.h"</div><div class='ctx'> #include &lt;trace/events/ext4.h&gt;</div><div class='ctx'> </div><div class='del'>-/**</div><div class='add'>+typedef void ext4_update_sb_callback(struct ext4_sb_info *sbi,</div><div class='add'>+				     struct ext4_super_block *es,</div><div class='add'>+				     const void *arg);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Superblock modification callback function for changing file system</div><div class='add'>+ * label</div><div class='add'>+ */</div><div class='add'>+static void ext4_sb_setlabel(struct ext4_sb_info *sbi,</div><div class='add'>+			     struct ext4_super_block *es, const void *arg)</div><div class='add'>+{</div><div class='add'>+	/* Sanity check, this should never happen */</div><div class='add'>+	BUILD_BUG_ON(sizeof(es-&gt;s_volume_name) &lt; EXT4_LABEL_MAX);</div><div class='add'>+</div><div class='add'>+	memcpy(es-&gt;s_volume_name, (char *)arg, EXT4_LABEL_MAX);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Superblock modification callback function for changing file system</div><div class='add'>+ * UUID.</div><div class='add'>+ */</div><div class='add'>+static void ext4_sb_setuuid(struct ext4_sb_info *sbi,</div><div class='add'>+			    struct ext4_super_block *es, const void *arg)</div><div class='add'>+{</div><div class='add'>+	memcpy(es-&gt;s_uuid, (__u8 *)arg, UUID_SIZE);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static</div><div class='add'>+int ext4_update_primary_sb(struct super_block *sb, handle_t *handle,</div><div class='add'>+			   ext4_update_sb_callback func,</div><div class='add'>+			   const void *arg)</div><div class='add'>+{</div><div class='add'>+	int err = 0;</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	struct buffer_head *bh = sbi-&gt;s_sbh;</div><div class='add'>+	struct ext4_super_block *es = sbi-&gt;s_es;</div><div class='add'>+</div><div class='add'>+	trace_ext4_update_sb(sb, bh-&gt;b_blocknr, 1);</div><div class='add'>+</div><div class='add'>+	BUFFER_TRACE(bh, "get_write_access");</div><div class='add'>+	err = ext4_journal_get_write_access(handle, sb,</div><div class='add'>+					    bh,</div><div class='add'>+					    EXT4_JTR_NONE);</div><div class='add'>+	if (err)</div><div class='add'>+		goto out_err;</div><div class='add'>+</div><div class='add'>+	lock_buffer(bh);</div><div class='add'>+	func(sbi, es, arg);</div><div class='add'>+	ext4_superblock_csum_set(sb);</div><div class='add'>+	unlock_buffer(bh);</div><div class='add'>+</div><div class='add'>+	if (buffer_write_io_error(bh) || !buffer_uptodate(bh)) {</div><div class='add'>+		ext4_msg(sbi-&gt;s_sb, KERN_ERR, "previous I/O error to "</div><div class='add'>+			 "superblock detected");</div><div class='add'>+		clear_buffer_write_io_error(bh);</div><div class='add'>+		set_buffer_uptodate(bh);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	err = ext4_handle_dirty_metadata(handle, NULL, bh);</div><div class='add'>+	if (err)</div><div class='add'>+		goto out_err;</div><div class='add'>+	err = sync_dirty_buffer(bh);</div><div class='add'>+out_err:</div><div class='add'>+	ext4_std_error(sb, err);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Update one backup superblock in the group 'grp' using the callback</div><div class='add'>+ * function 'func' and argument 'arg'. If the handle is NULL the</div><div class='add'>+ * modification is not journalled.</div><div class='add'>+ *</div><div class='add'>+ * Returns: 0 when no modification was done (no superblock in the group)</div><div class='add'>+ *	    1 when the modification was successful</div><div class='add'>+ *	   &lt;0 on error</div><div class='add'>+ */</div><div class='add'>+static int ext4_update_backup_sb(struct super_block *sb,</div><div class='add'>+				 handle_t *handle, ext4_group_t grp,</div><div class='add'>+				 ext4_update_sb_callback func, const void *arg)</div><div class='add'>+{</div><div class='add'>+	int err = 0;</div><div class='add'>+	ext4_fsblk_t sb_block;</div><div class='add'>+	struct buffer_head *bh;</div><div class='add'>+	unsigned long offset = 0;</div><div class='add'>+	struct ext4_super_block *es;</div><div class='add'>+</div><div class='add'>+	if (!ext4_bg_has_super(sb, grp))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * For the group 0 there is always 1k padding, so we have</div><div class='add'>+	 * either adjust offset, or sb_block depending on blocksize</div><div class='add'>+	 */</div><div class='add'>+	if (grp == 0) {</div><div class='add'>+		sb_block = 1 * EXT4_MIN_BLOCK_SIZE;</div><div class='add'>+		offset = do_div(sb_block, sb-&gt;s_blocksize);</div><div class='add'>+	} else {</div><div class='add'>+		sb_block = ext4_group_first_block_no(sb, grp);</div><div class='add'>+		offset = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	trace_ext4_update_sb(sb, sb_block, handle ? 1 : 0);</div><div class='add'>+</div><div class='add'>+	bh = ext4_sb_bread(sb, sb_block, 0);</div><div class='add'>+	if (IS_ERR(bh))</div><div class='add'>+		return PTR_ERR(bh);</div><div class='add'>+</div><div class='add'>+	if (handle) {</div><div class='add'>+		BUFFER_TRACE(bh, "get_write_access");</div><div class='add'>+		err = ext4_journal_get_write_access(handle, sb,</div><div class='add'>+						    bh,</div><div class='add'>+						    EXT4_JTR_NONE);</div><div class='add'>+		if (err)</div><div class='add'>+			goto out_bh;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	es = (struct ext4_super_block *) (bh-&gt;b_data + offset);</div><div class='add'>+	lock_buffer(bh);</div><div class='add'>+	if (ext4_has_feature_metadata_csum(sb) &amp;&amp;</div><div class='add'>+	    es-&gt;s_checksum != ext4_superblock_csum(es)) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR, "Invalid checksum for backup "</div><div class='add'>+		"superblock %llu", sb_block);</div><div class='add'>+		unlock_buffer(bh);</div><div class='add'>+		goto out_bh;</div><div class='add'>+	}</div><div class='add'>+	func(EXT4_SB(sb), es, arg);</div><div class='add'>+	if (ext4_has_feature_metadata_csum(sb))</div><div class='add'>+		es-&gt;s_checksum = ext4_superblock_csum(es);</div><div class='add'>+	set_buffer_uptodate(bh);</div><div class='add'>+	unlock_buffer(bh);</div><div class='add'>+</div><div class='add'>+	if (handle) {</div><div class='add'>+		err = ext4_handle_dirty_metadata(handle, NULL, bh);</div><div class='add'>+		if (err)</div><div class='add'>+			goto out_bh;</div><div class='add'>+	} else {</div><div class='add'>+		BUFFER_TRACE(bh, "marking dirty");</div><div class='add'>+		mark_buffer_dirty(bh);</div><div class='add'>+	}</div><div class='add'>+	err = sync_dirty_buffer(bh);</div><div class='add'>+</div><div class='add'>+out_bh:</div><div class='add'>+	brelse(bh);</div><div class='add'>+	ext4_std_error(sb, err);</div><div class='add'>+	return (err) ? err : 1;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Update primary and backup superblocks using the provided function</div><div class='add'>+ * func and argument arg.</div><div class='add'>+ *</div><div class='add'>+ * Only the primary superblock and at most two backup superblock</div><div class='add'>+ * modifications are journalled; the rest is modified without journal.</div><div class='add'>+ * This is safe because e2fsck will re-write them if there is a problem,</div><div class='add'>+ * and we're very unlikely to ever need more than two backups.</div><div class='add'>+ */</div><div class='add'>+static</div><div class='add'>+int ext4_update_superblocks_fn(struct super_block *sb,</div><div class='add'>+			       ext4_update_sb_callback func,</div><div class='add'>+			       const void *arg)</div><div class='add'>+{</div><div class='add'>+	handle_t *handle;</div><div class='add'>+	ext4_group_t ngroups;</div><div class='add'>+	unsigned int three = 1;</div><div class='add'>+	unsigned int five = 5;</div><div class='add'>+	unsigned int seven = 7;</div><div class='add'>+	int err = 0, ret, i;</div><div class='add'>+	ext4_group_t grp, primary_grp;</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We can't update superblocks while the online resize is running</div><div class='add'>+	 */</div><div class='add'>+	if (test_and_set_bit_lock(EXT4_FLAGS_RESIZING,</div><div class='add'>+				  &amp;sbi-&gt;s_ext4_flags)) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR, "Can't modify superblock while"</div><div class='add'>+			 "performing online resize");</div><div class='add'>+		return -EBUSY;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We're only going to update primary superblock and two</div><div class='add'>+	 * backup superblocks in this transaction.</div><div class='add'>+	 */</div><div class='add'>+	handle = ext4_journal_start_sb(sb, EXT4_HT_MISC, 3);</div><div class='add'>+	if (IS_ERR(handle)) {</div><div class='add'>+		err = PTR_ERR(handle);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Update primary superblock */</div><div class='add'>+	err = ext4_update_primary_sb(sb, handle, func, arg);</div><div class='add'>+	if (err) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR, "Failed to update primary "</div><div class='add'>+			 "superblock");</div><div class='add'>+		goto out_journal;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	primary_grp = ext4_get_group_number(sb, sbi-&gt;s_sbh-&gt;b_blocknr);</div><div class='add'>+	ngroups = ext4_get_groups_count(sb);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Update backup superblocks. We have to start from group 0</div><div class='add'>+	 * because it might not be where the primary superblock is</div><div class='add'>+	 * if the fs is mounted with -o sb=&lt;backup_sb_block&gt;</div><div class='add'>+	 */</div><div class='add'>+	i = 0;</div><div class='add'>+	grp = 0;</div><div class='add'>+	while (grp &lt; ngroups) {</div><div class='add'>+		/* Skip primary superblock */</div><div class='add'>+		if (grp == primary_grp)</div><div class='add'>+			goto next_grp;</div><div class='add'>+</div><div class='add'>+		ret = ext4_update_backup_sb(sb, handle, grp, func, arg);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			/* Ignore bad checksum; try to update next sb */</div><div class='add'>+			if (ret == -EFSBADCRC)</div><div class='add'>+				goto next_grp;</div><div class='add'>+			err = ret;</div><div class='add'>+			goto out_journal;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		i += ret;</div><div class='add'>+		if (handle &amp;&amp; i &gt; 1) {</div><div class='add'>+			/*</div><div class='add'>+			 * We're only journalling primary superblock and</div><div class='add'>+			 * two backup superblocks; the rest is not</div><div class='add'>+			 * journalled.</div><div class='add'>+			 */</div><div class='add'>+			err = ext4_journal_stop(handle);</div><div class='add'>+			if (err)</div><div class='add'>+				goto out;</div><div class='add'>+			handle = NULL;</div><div class='add'>+		}</div><div class='add'>+next_grp:</div><div class='add'>+		grp = ext4_list_backups(sb, &amp;three, &amp;five, &amp;seven);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+out_journal:</div><div class='add'>+	if (handle) {</div><div class='add'>+		ret = ext4_journal_stop(handle);</div><div class='add'>+		if (ret &amp;&amp; !err)</div><div class='add'>+			err = ret;</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='add'>+	clear_bit_unlock(EXT4_FLAGS_RESIZING, &amp;sbi-&gt;s_ext4_flags);</div><div class='add'>+	smp_mb__after_atomic();</div><div class='add'>+	return err ? err : 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * Swap memory between @a and @b for @len bytes.</div><div class='ctx'>  *</div><div class='ctx'>  * @a:          pointer to first memory area</div><div class='hunk'>@@ -48,7 +298,7 @@ static void memswap(void *a, void *b, size_t len)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='add'>+/*</div><div class='ctx'>  * Swap i_data and associated attributes between @inode1 and @inode2.</div><div class='ctx'>  * This function is used for the primary swap between inode1 and inode2</div><div class='ctx'>  * and also to revert this primary swap in case of errors.</div><div class='hunk'>@@ -65,13 +315,22 @@ static void swap_inode_data(struct inode *inode1, struct inode *inode2)</div><div class='ctx'> 	struct ext4_inode_info *ei1;</div><div class='ctx'> 	struct ext4_inode_info *ei2;</div><div class='ctx'> 	unsigned long tmp;</div><div class='add'>+	struct timespec64 ts1, ts2;</div><div class='ctx'> </div><div class='ctx'> 	ei1 = EXT4_I(inode1);</div><div class='ctx'> 	ei2 = EXT4_I(inode2);</div><div class='ctx'> </div><div class='ctx'> 	swap(inode1-&gt;i_version, inode2-&gt;i_version);</div><div class='del'>-	swap(inode1-&gt;i_atime, inode2-&gt;i_atime);</div><div class='del'>-	swap(inode1-&gt;i_mtime, inode2-&gt;i_mtime);</div><div class='add'>+</div><div class='add'>+	ts1 = inode_get_atime(inode1);</div><div class='add'>+	ts2 = inode_get_atime(inode2);</div><div class='add'>+	inode_set_atime_to_ts(inode1, ts2);</div><div class='add'>+	inode_set_atime_to_ts(inode2, ts1);</div><div class='add'>+</div><div class='add'>+	ts1 = inode_get_mtime(inode1);</div><div class='add'>+	ts2 = inode_get_mtime(inode2);</div><div class='add'>+	inode_set_mtime_to_ts(inode1, ts2);</div><div class='add'>+	inode_set_mtime_to_ts(inode2, ts1);</div><div class='ctx'> </div><div class='ctx'> 	memswap(ei1-&gt;i_data, ei2-&gt;i_data, sizeof(ei1-&gt;i_data));</div><div class='ctx'> 	tmp = ei1-&gt;i_flags &amp; EXT4_FL_SHOULD_SWAP;</div><div class='hunk'>@@ -95,25 +354,25 @@ void ext4_reset_inode_seed(struct inode *inode)</div><div class='ctx'> 	__le32 gen = cpu_to_le32(inode-&gt;i_generation);</div><div class='ctx'> 	__u32 csum;</div><div class='ctx'> </div><div class='del'>-	if (!ext4_has_metadata_csum(inode-&gt;i_sb))</div><div class='add'>+	if (!ext4_has_feature_metadata_csum(inode-&gt;i_sb))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	csum = ext4_chksum(sbi, sbi-&gt;s_csum_seed, (__u8 *)&amp;inum, sizeof(inum));</div><div class='del'>-	ei-&gt;i_csum_seed = ext4_chksum(sbi, csum, (__u8 *)&amp;gen, sizeof(gen));</div><div class='add'>+	csum = ext4_chksum(sbi-&gt;s_csum_seed, (__u8 *)&amp;inum, sizeof(inum));</div><div class='add'>+	ei-&gt;i_csum_seed = ext4_chksum(csum, (__u8 *)&amp;gen, sizeof(gen));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='add'>+/*</div><div class='ctx'>  * Swap the information from the given @inode and the inode</div><div class='ctx'>  * EXT4_BOOT_LOADER_INO. It will basically swap i_data and all other</div><div class='ctx'>  * important fields of the inodes.</div><div class='ctx'>  *</div><div class='ctx'>  * @sb:         the super block of the filesystem</div><div class='del'>- * @mnt_userns:	user namespace of the mount the inode was found from</div><div class='add'>+ * @idmap:	idmap of the mount the inode was found from</div><div class='ctx'>  * @inode:      the inode to swap with EXT4_BOOT_LOADER_INO</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='ctx'> static long swap_inode_boot_loader(struct super_block *sb,</div><div class='del'>-				struct user_namespace *mnt_userns,</div><div class='add'>+				struct mnt_idmap *idmap,</div><div class='ctx'> 				struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	handle_t *handle;</div><div class='hunk'>@@ -124,7 +383,8 @@ static long swap_inode_boot_loader(struct super_block *sb,</div><div class='ctx'> 	blkcnt_t blocks;</div><div class='ctx'> 	unsigned short bytes;</div><div class='ctx'> </div><div class='del'>-	inode_bl = ext4_iget(sb, EXT4_BOOT_LOADER_INO, EXT4_IGET_SPECIAL);</div><div class='add'>+	inode_bl = ext4_iget(sb, EXT4_BOOT_LOADER_INO,</div><div class='add'>+			EXT4_IGET_SPECIAL | EXT4_IGET_BAD);</div><div class='ctx'> 	if (IS_ERR(inode_bl))</div><div class='ctx'> 		return PTR_ERR(inode_bl);</div><div class='ctx'> 	ei_bl = EXT4_I(inode_bl);</div><div class='hunk'>@@ -142,7 +402,7 @@ static long swap_inode_boot_loader(struct super_block *sb,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (IS_RDONLY(inode) || IS_APPEND(inode) || IS_IMMUTABLE(inode) ||</div><div class='del'>-	    !inode_owner_or_capable(mnt_userns, inode) ||</div><div class='add'>+	    !inode_owner_or_capable(idmap, inode) ||</div><div class='ctx'> 	    !capable(CAP_SYS_ADMIN)) {</div><div class='ctx'> 		err = -EPERM;</div><div class='ctx'> 		goto journal_err_out;</div><div class='hunk'>@@ -169,12 +429,12 @@ static long swap_inode_boot_loader(struct super_block *sb,</div><div class='ctx'> 		err = -EINVAL;</div><div class='ctx'> 		goto err_out;</div><div class='ctx'> 	}</div><div class='del'>-	ext4_fc_start_ineligible(sb, EXT4_FC_REASON_SWAP_BOOT);</div><div class='add'>+	ext4_fc_mark_ineligible(sb, EXT4_FC_REASON_SWAP_BOOT, handle);</div><div class='ctx'> </div><div class='ctx'> 	/* Protect extent tree against block allocations via delalloc */</div><div class='ctx'> 	ext4_double_down_write_data_sem(inode, inode_bl);</div><div class='ctx'> </div><div class='del'>-	if (inode_bl-&gt;i_nlink == 0) {</div><div class='add'>+	if (is_bad_inode(inode_bl) || !S_ISREG(inode_bl-&gt;i_mode)) {</div><div class='ctx'> 		/* this inode has never been used as a BOOT_LOADER */</div><div class='ctx'> 		set_nlink(inode_bl, 1);</div><div class='ctx'> 		i_uid_write(inode_bl, 0);</div><div class='hunk'>@@ -183,6 +443,7 @@ static long swap_inode_boot_loader(struct super_block *sb,</div><div class='ctx'> 		ei_bl-&gt;i_flags = 0;</div><div class='ctx'> 		inode_set_iversion(inode_bl, 1);</div><div class='ctx'> 		i_size_write(inode_bl, 0);</div><div class='add'>+		EXT4_I(inode_bl)-&gt;i_disksize = inode_bl-&gt;i_size;</div><div class='ctx'> 		inode_bl-&gt;i_mode = S_IFREG;</div><div class='ctx'> 		if (ext4_has_feature_extents(sb)) {</div><div class='ctx'> 			ext4_set_inode_flag(inode_bl, EXT4_INODE_EXTENTS);</div><div class='hunk'>@@ -200,14 +461,16 @@ static long swap_inode_boot_loader(struct super_block *sb,</div><div class='ctx'> 	diff = size - size_bl;</div><div class='ctx'> 	swap_inode_data(inode, inode_bl);</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_ctime = inode_bl-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='add'>+	inode_set_ctime_current(inode_bl);</div><div class='add'>+	inode_inc_iversion(inode);</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_generation = prandom_u32();</div><div class='del'>-	inode_bl-&gt;i_generation = prandom_u32();</div><div class='add'>+	inode-&gt;i_generation = get_random_u32();</div><div class='add'>+	inode_bl-&gt;i_generation = get_random_u32();</div><div class='ctx'> 	ext4_reset_inode_seed(inode);</div><div class='ctx'> 	ext4_reset_inode_seed(inode_bl);</div><div class='ctx'> </div><div class='del'>-	ext4_discard_preallocations(inode, 0);</div><div class='add'>+	ext4_discard_preallocations(inode);</div><div class='ctx'> </div><div class='ctx'> 	err = ext4_mark_inode_dirty(handle, inode);</div><div class='ctx'> 	if (err &lt; 0) {</div><div class='hunk'>@@ -252,7 +515,6 @@ revert:</div><div class='ctx'> </div><div class='ctx'> err_out1:</div><div class='ctx'> 	ext4_journal_stop(handle);</div><div class='del'>-	ext4_fc_stop_ineligible(sb);</div><div class='ctx'> 	ext4_double_up_write_data_sem(inode, inode_bl);</div><div class='ctx'> </div><div class='ctx'> err_out:</div><div class='hunk'>@@ -263,18 +525,6 @@ journal_err_out:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_FS_ENCRYPTION</div><div class='del'>-static int uuid_is_zero(__u8 u[16])</div><div class='del'>-{</div><div class='del'>-	int	i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; 16; i++)</div><div class='del'>-		if (u[i])</div><div class='del'>-			return 0;</div><div class='del'>-	return 1;</div><div class='del'>-}</div><div class='del'>-#endif</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * If immutable is set and we are not clearing it, we're not allowed to change</div><div class='ctx'>  * anything else in the inode.  Don't error out if we're only trying to set</div><div class='hunk'>@@ -426,7 +676,8 @@ static int ext4_ioctl_setflags(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 	ext4_set_inode_flags(inode, false);</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='add'>+	inode_inc_iversion(inode);</div><div class='ctx'> </div><div class='ctx'> 	err = ext4_mark_iloc_dirty(handle, inode, &amp;iloc);</div><div class='ctx'> flags_err:</div><div class='hunk'>@@ -492,6 +743,10 @@ static int ext4_ioctl_setproject(struct inode *inode, __u32 projid)</div><div class='ctx'> 	if (ext4_is_quota_file(inode))</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='add'>+	err = dquot_initialize(inode);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='ctx'> 	err = ext4_get_inode_loc(inode, &amp;iloc);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='hunk'>@@ -507,10 +762,6 @@ static int ext4_ioctl_setproject(struct inode *inode, __u32 projid)</div><div class='ctx'> 		brelse(iloc.bh);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = dquot_initialize(inode);</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='del'>-</div><div class='ctx'> 	handle = ext4_journal_start(inode, EXT4_HT_QUOTA,</div><div class='ctx'> 		EXT4_QUOTA_INIT_BLOCKS(sb) +</div><div class='ctx'> 		EXT4_QUOTA_DEL_BLOCKS(sb) + 3);</div><div class='hunk'>@@ -536,7 +787,8 @@ static int ext4_ioctl_setproject(struct inode *inode, __u32 projid)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	EXT4_I(inode)-&gt;i_projid = kprojid;</div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='add'>+	inode_inc_iversion(inode);</div><div class='ctx'> out_dirty:</div><div class='ctx'> 	rc = ext4_mark_iloc_dirty(handle, inode, &amp;iloc);</div><div class='ctx'> 	if (!err)</div><div class='hunk'>@@ -554,21 +806,15 @@ static int ext4_ioctl_setproject(struct inode *inode, __u32 projid)</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-static int ext4_shutdown(struct super_block *sb, unsigned long arg)</div><div class='add'>+int ext4_force_shutdown(struct super_block *sb, u32 flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='del'>-	__u32 flags;</div><div class='del'>-</div><div class='del'>-	if (!capable(CAP_SYS_ADMIN))</div><div class='del'>-		return -EPERM;</div><div class='del'>-</div><div class='del'>-	if (get_user(flags, (__u32 __user *)arg))</div><div class='del'>-		return -EFAULT;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (flags &gt; EXT4_GOING_FLAGS_NOLOGFLUSH)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	if (ext4_forced_shutdown(sbi))</div><div class='add'>+	if (ext4_forced_shutdown(sb))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	ext4_msg(sb, KERN_ALERT, "shut down requested (%d)", flags);</div><div class='hunk'>@@ -576,9 +822,11 @@ static int ext4_shutdown(struct super_block *sb, unsigned long arg)</div><div class='ctx'> </div><div class='ctx'> 	switch (flags) {</div><div class='ctx'> 	case EXT4_GOING_FLAGS_DEFAULT:</div><div class='del'>-		freeze_bdev(sb-&gt;s_bdev);</div><div class='add'>+		ret = bdev_freeze(sb-&gt;s_bdev);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='ctx'> 		set_bit(EXT4_FLAGS_SHUTDOWN, &amp;sbi-&gt;s_ext4_flags);</div><div class='del'>-		thaw_bdev(sb-&gt;s_bdev);</div><div class='add'>+		bdev_thaw(sb-&gt;s_bdev);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case EXT4_GOING_FLAGS_LOGFLUSH:</div><div class='ctx'> 		set_bit(EXT4_FLAGS_SHUTDOWN, &amp;sbi-&gt;s_ext4_flags);</div><div class='hunk'>@@ -599,6 +847,19 @@ static int ext4_shutdown(struct super_block *sb, unsigned long arg)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int ext4_ioctl_shutdown(struct super_block *sb, unsigned long arg)</div><div class='add'>+{</div><div class='add'>+	u32 flags;</div><div class='add'>+</div><div class='add'>+	if (!capable(CAP_SYS_ADMIN))</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	if (get_user(flags, (__u32 __user *)arg))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+</div><div class='add'>+	return ext4_force_shutdown(sb, flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> struct getfsmap_info {</div><div class='ctx'> 	struct super_block	*gi_sb;</div><div class='ctx'> 	struct fsmap_head __user *gi_data;</div><div class='hunk'>@@ -716,11 +977,13 @@ static long ext4_ioctl_group_add(struct file *file,</div><div class='ctx'> 	    test_opt(sb, INIT_INODE_TABLE))</div><div class='ctx'> 		err = ext4_register_li_request(sb, input-&gt;group);</div><div class='ctx'> group_add_out:</div><div class='del'>-	ext4_resize_end(sb);</div><div class='add'>+	err2 = ext4_resize_end(sb, false);</div><div class='add'>+	if (err == 0)</div><div class='add'>+		err = err2;</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int ext4_fileattr_get(struct dentry *dentry, struct fileattr *fa)</div><div class='add'>+int ext4_fileattr_get(struct dentry *dentry, struct file_kattr *fa)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	struct ext4_inode_info *ei = EXT4_I(inode);</div><div class='hunk'>@@ -736,14 +999,13 @@ int ext4_fileattr_get(struct dentry *dentry, struct fileattr *fa)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int ext4_fileattr_set(struct user_namespace *mnt_userns,</div><div class='del'>-		      struct dentry *dentry, struct fileattr *fa)</div><div class='add'>+int ext4_fileattr_set(struct mnt_idmap *idmap,</div><div class='add'>+		      struct dentry *dentry, struct file_kattr *fa)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	u32 flags = fa-&gt;flags;</div><div class='ctx'> 	int err = -EOPNOTSUPP;</div><div class='ctx'> </div><div class='del'>-	ext4_fc_start_update(inode);</div><div class='ctx'> 	if (flags &amp; ~EXT4_FL_USER_VISIBLE)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -764,7 +1026,6 @@ int ext4_fileattr_set(struct user_namespace *mnt_userns,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	err = ext4_ioctl_setproject(inode, fa-&gt;fsx_projid);</div><div class='ctx'> out:</div><div class='del'>-	ext4_fc_stop_update(inode);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -805,7 +1066,6 @@ static int ext4_ioctl_checkpoint(struct file *filp, unsigned long arg)</div><div class='ctx'> 	__u32 flags = 0;</div><div class='ctx'> 	unsigned int flush_flags = 0;</div><div class='ctx'> 	struct super_block *sb = file_inode(filp)-&gt;i_sb;</div><div class='del'>-	struct request_queue *q;</div><div class='ctx'> </div><div class='ctx'> 	if (copy_from_user(&amp;flags, (__u32 __user *)arg,</div><div class='ctx'> 				sizeof(__u32)))</div><div class='hunk'>@@ -823,13 +1083,8 @@ static int ext4_ioctl_checkpoint(struct file *filp, unsigned long arg)</div><div class='ctx'> 	if (!EXT4_SB(sb)-&gt;s_journal)</div><div class='ctx'> 		return -ENODEV;</div><div class='ctx'> </div><div class='del'>-	if (flags &amp; ~EXT4_IOC_CHECKPOINT_FLAG_VALID)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	q = bdev_get_queue(EXT4_SB(sb)-&gt;s_journal-&gt;j_dev);</div><div class='del'>-	if (!q)</div><div class='del'>-		return -ENXIO;</div><div class='del'>-	if ((flags &amp; JBD2_JOURNAL_FLUSH_DISCARD) &amp;&amp; !blk_queue_discard(q))</div><div class='add'>+	if ((flags &amp; JBD2_JOURNAL_FLUSH_DISCARD) &amp;&amp;</div><div class='add'>+	    !bdev_max_discard_sectors(EXT4_SB(sb)-&gt;s_journal-&gt;j_dev))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; EXT4_IOC_CHECKPOINT_FLAG_DRY_RUN)</div><div class='hunk'>@@ -850,11 +1105,432 @@ static int ext4_ioctl_checkpoint(struct file *filp, unsigned long arg)</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int ext4_ioctl_setlabel(struct file *filp, const char __user *user_label)</div><div class='add'>+{</div><div class='add'>+	size_t len;</div><div class='add'>+	int ret = 0;</div><div class='add'>+	char new_label[EXT4_LABEL_MAX + 1];</div><div class='add'>+	struct super_block *sb = file_inode(filp)-&gt;i_sb;</div><div class='add'>+</div><div class='add'>+	if (!capable(CAP_SYS_ADMIN))</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Copy the maximum length allowed for ext4 label with one more to</div><div class='add'>+	 * find the required terminating null byte in order to test the</div><div class='add'>+	 * label length. The on disk label doesn't need to be null terminated.</div><div class='add'>+	 */</div><div class='add'>+	if (copy_from_user(new_label, user_label, EXT4_LABEL_MAX + 1))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+</div><div class='add'>+	len = strnlen(new_label, EXT4_LABEL_MAX + 1);</div><div class='add'>+	if (len &gt; EXT4_LABEL_MAX)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Clear the buffer after the new label</div><div class='add'>+	 */</div><div class='add'>+	memset(new_label + len, 0, EXT4_LABEL_MAX - len);</div><div class='add'>+</div><div class='add'>+	ret = mnt_want_write_file(filp);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	ret = ext4_update_superblocks_fn(sb, ext4_sb_setlabel, new_label);</div><div class='add'>+</div><div class='add'>+	mnt_drop_write_file(filp);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ext4_ioctl_getlabel(struct ext4_sb_info *sbi, char __user *user_label)</div><div class='add'>+{</div><div class='add'>+	char label[EXT4_LABEL_MAX + 1];</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * EXT4_LABEL_MAX must always be smaller than FSLABEL_MAX because</div><div class='add'>+	 * FSLABEL_MAX must include terminating null byte, while s_volume_name</div><div class='add'>+	 * does not have to.</div><div class='add'>+	 */</div><div class='add'>+	BUILD_BUG_ON(EXT4_LABEL_MAX &gt;= FSLABEL_MAX);</div><div class='add'>+</div><div class='add'>+	lock_buffer(sbi-&gt;s_sbh);</div><div class='add'>+	memtostr_pad(label, sbi-&gt;s_es-&gt;s_volume_name);</div><div class='add'>+	unlock_buffer(sbi-&gt;s_sbh);</div><div class='add'>+</div><div class='add'>+	if (copy_to_user(user_label, label, sizeof(label)))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ext4_ioctl_getuuid(struct ext4_sb_info *sbi,</div><div class='add'>+			struct fsuuid __user *ufsuuid)</div><div class='add'>+{</div><div class='add'>+	struct fsuuid fsuuid;</div><div class='add'>+	__u8 uuid[UUID_SIZE];</div><div class='add'>+</div><div class='add'>+	if (copy_from_user(&amp;fsuuid, ufsuuid, sizeof(fsuuid)))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+</div><div class='add'>+	if (fsuuid.fsu_len == 0) {</div><div class='add'>+		fsuuid.fsu_len = UUID_SIZE;</div><div class='add'>+		if (copy_to_user(&amp;ufsuuid-&gt;fsu_len, &amp;fsuuid.fsu_len,</div><div class='add'>+					sizeof(fsuuid.fsu_len)))</div><div class='add'>+			return -EFAULT;</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (fsuuid.fsu_len &lt; UUID_SIZE || fsuuid.fsu_flags != 0)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	lock_buffer(sbi-&gt;s_sbh);</div><div class='add'>+	memcpy(uuid, sbi-&gt;s_es-&gt;s_uuid, UUID_SIZE);</div><div class='add'>+	unlock_buffer(sbi-&gt;s_sbh);</div><div class='add'>+</div><div class='add'>+	fsuuid.fsu_len = UUID_SIZE;</div><div class='add'>+	if (copy_to_user(ufsuuid, &amp;fsuuid, sizeof(fsuuid)) ||</div><div class='add'>+	    copy_to_user(&amp;ufsuuid-&gt;fsu_uuid[0], uuid, UUID_SIZE))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ext4_ioctl_setuuid(struct file *filp,</div><div class='add'>+			const struct fsuuid __user *ufsuuid)</div><div class='add'>+{</div><div class='add'>+	int ret = 0;</div><div class='add'>+	struct super_block *sb = file_inode(filp)-&gt;i_sb;</div><div class='add'>+	struct fsuuid fsuuid;</div><div class='add'>+	__u8 uuid[UUID_SIZE];</div><div class='add'>+</div><div class='add'>+	if (!capable(CAP_SYS_ADMIN))</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If any checksums (group descriptors or metadata) are being used</div><div class='add'>+	 * then the checksum seed feature is required to change the UUID.</div><div class='add'>+	 */</div><div class='add'>+	if (((ext4_has_feature_gdt_csum(sb) ||</div><div class='add'>+	      ext4_has_feature_metadata_csum(sb))</div><div class='add'>+			&amp;&amp; !ext4_has_feature_csum_seed(sb))</div><div class='add'>+		|| ext4_has_feature_stable_inodes(sb))</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+</div><div class='add'>+	if (copy_from_user(&amp;fsuuid, ufsuuid, sizeof(fsuuid)))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+</div><div class='add'>+	if (fsuuid.fsu_len != UUID_SIZE || fsuuid.fsu_flags != 0)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	if (copy_from_user(uuid, &amp;ufsuuid-&gt;fsu_uuid[0], UUID_SIZE))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+</div><div class='add'>+	ret = mnt_want_write_file(filp);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	ret = ext4_update_superblocks_fn(sb, ext4_sb_setuuid, &amp;uuid);</div><div class='add'>+	mnt_drop_write_file(filp);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+</div><div class='add'>+#define TUNE_OPS_SUPPORTED (EXT4_TUNE_FL_ERRORS_BEHAVIOR |    \</div><div class='add'>+	EXT4_TUNE_FL_MNT_COUNT | EXT4_TUNE_FL_MAX_MNT_COUNT | \</div><div class='add'>+	EXT4_TUNE_FL_CHECKINTRVAL | EXT4_TUNE_FL_LAST_CHECK_TIME | \</div><div class='add'>+	EXT4_TUNE_FL_RESERVED_BLOCKS | EXT4_TUNE_FL_RESERVED_UID | \</div><div class='add'>+	EXT4_TUNE_FL_RESERVED_GID | EXT4_TUNE_FL_DEFAULT_MNT_OPTS | \</div><div class='add'>+	EXT4_TUNE_FL_DEF_HASH_ALG | EXT4_TUNE_FL_RAID_STRIDE | \</div><div class='add'>+	EXT4_TUNE_FL_RAID_STRIPE_WIDTH | EXT4_TUNE_FL_MOUNT_OPTS | \</div><div class='add'>+	EXT4_TUNE_FL_FEATURES | EXT4_TUNE_FL_EDIT_FEATURES | \</div><div class='add'>+	EXT4_TUNE_FL_FORCE_FSCK | EXT4_TUNE_FL_ENCODING | \</div><div class='add'>+	EXT4_TUNE_FL_ENCODING_FLAGS)</div><div class='add'>+</div><div class='add'>+#define EXT4_TUNE_SET_COMPAT_SUPP \</div><div class='add'>+		(EXT4_FEATURE_COMPAT_DIR_INDEX |	\</div><div class='add'>+		 EXT4_FEATURE_COMPAT_STABLE_INODES)</div><div class='add'>+#define EXT4_TUNE_SET_INCOMPAT_SUPP \</div><div class='add'>+		(EXT4_FEATURE_INCOMPAT_EXTENTS |	\</div><div class='add'>+		 EXT4_FEATURE_INCOMPAT_EA_INODE |	\</div><div class='add'>+		 EXT4_FEATURE_INCOMPAT_ENCRYPT |	\</div><div class='add'>+		 EXT4_FEATURE_INCOMPAT_CSUM_SEED |	\</div><div class='add'>+		 EXT4_FEATURE_INCOMPAT_LARGEDIR |	\</div><div class='add'>+		 EXT4_FEATURE_INCOMPAT_CASEFOLD)</div><div class='add'>+#define EXT4_TUNE_SET_RO_COMPAT_SUPP \</div><div class='add'>+		(EXT4_FEATURE_RO_COMPAT_LARGE_FILE |	\</div><div class='add'>+		 EXT4_FEATURE_RO_COMPAT_DIR_NLINK |	\</div><div class='add'>+		 EXT4_FEATURE_RO_COMPAT_EXTRA_ISIZE |	\</div><div class='add'>+		 EXT4_FEATURE_RO_COMPAT_PROJECT |	\</div><div class='add'>+		 EXT4_FEATURE_RO_COMPAT_VERITY)</div><div class='add'>+</div><div class='add'>+#define EXT4_TUNE_CLEAR_COMPAT_SUPP (0)</div><div class='add'>+#define EXT4_TUNE_CLEAR_INCOMPAT_SUPP (0)</div><div class='add'>+#define EXT4_TUNE_CLEAR_RO_COMPAT_SUPP (0)</div><div class='add'>+</div><div class='add'>+#define SB_ENC_SUPP_MASK (SB_ENC_STRICT_MODE_FL |	\</div><div class='add'>+			  SB_ENC_NO_COMPAT_FALLBACK_FL)</div><div class='add'>+</div><div class='add'>+static int ext4_ioctl_get_tune_sb(struct ext4_sb_info *sbi,</div><div class='add'>+				  struct ext4_tune_sb_params __user *params)</div><div class='add'>+{</div><div class='add'>+	struct ext4_tune_sb_params ret;</div><div class='add'>+	struct ext4_super_block *es = sbi-&gt;s_es;</div><div class='add'>+</div><div class='add'>+	memset(&amp;ret, 0, sizeof(ret));</div><div class='add'>+	ret.set_flags = TUNE_OPS_SUPPORTED;</div><div class='add'>+	ret.errors_behavior = le16_to_cpu(es-&gt;s_errors);</div><div class='add'>+	ret.mnt_count = le16_to_cpu(es-&gt;s_mnt_count);</div><div class='add'>+	ret.max_mnt_count = le16_to_cpu(es-&gt;s_max_mnt_count);</div><div class='add'>+	ret.checkinterval = le32_to_cpu(es-&gt;s_checkinterval);</div><div class='add'>+	ret.last_check_time = le32_to_cpu(es-&gt;s_lastcheck);</div><div class='add'>+	ret.reserved_blocks = ext4_r_blocks_count(es);</div><div class='add'>+	ret.blocks_count = ext4_blocks_count(es);</div><div class='add'>+	ret.reserved_uid = ext4_get_resuid(es);</div><div class='add'>+	ret.reserved_gid = ext4_get_resgid(es);</div><div class='add'>+	ret.default_mnt_opts = le32_to_cpu(es-&gt;s_default_mount_opts);</div><div class='add'>+	ret.def_hash_alg = es-&gt;s_def_hash_version;</div><div class='add'>+	ret.raid_stride = le16_to_cpu(es-&gt;s_raid_stride);</div><div class='add'>+	ret.raid_stripe_width = le32_to_cpu(es-&gt;s_raid_stripe_width);</div><div class='add'>+	ret.encoding = le16_to_cpu(es-&gt;s_encoding);</div><div class='add'>+	ret.encoding_flags = le16_to_cpu(es-&gt;s_encoding_flags);</div><div class='add'>+	strscpy_pad(ret.mount_opts, es-&gt;s_mount_opts);</div><div class='add'>+	ret.feature_compat = le32_to_cpu(es-&gt;s_feature_compat);</div><div class='add'>+	ret.feature_incompat = le32_to_cpu(es-&gt;s_feature_incompat);</div><div class='add'>+	ret.feature_ro_compat = le32_to_cpu(es-&gt;s_feature_ro_compat);</div><div class='add'>+	ret.set_feature_compat_mask = EXT4_TUNE_SET_COMPAT_SUPP;</div><div class='add'>+	ret.set_feature_incompat_mask = EXT4_TUNE_SET_INCOMPAT_SUPP;</div><div class='add'>+	ret.set_feature_ro_compat_mask = EXT4_TUNE_SET_RO_COMPAT_SUPP;</div><div class='add'>+	ret.clear_feature_compat_mask = EXT4_TUNE_CLEAR_COMPAT_SUPP;</div><div class='add'>+	ret.clear_feature_incompat_mask = EXT4_TUNE_CLEAR_INCOMPAT_SUPP;</div><div class='add'>+	ret.clear_feature_ro_compat_mask = EXT4_TUNE_CLEAR_RO_COMPAT_SUPP;</div><div class='add'>+	if (copy_to_user(params, &amp;ret, sizeof(ret)))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void ext4_sb_setparams(struct ext4_sb_info *sbi,</div><div class='add'>+			      struct ext4_super_block *es, const void *arg)</div><div class='add'>+{</div><div class='add'>+	const struct ext4_tune_sb_params *params = arg;</div><div class='add'>+</div><div class='add'>+	if (params-&gt;set_flags &amp; EXT4_TUNE_FL_ERRORS_BEHAVIOR)</div><div class='add'>+		es-&gt;s_errors = cpu_to_le16(params-&gt;errors_behavior);</div><div class='add'>+	if (params-&gt;set_flags &amp; EXT4_TUNE_FL_MNT_COUNT)</div><div class='add'>+		es-&gt;s_mnt_count = cpu_to_le16(params-&gt;mnt_count);</div><div class='add'>+	if (params-&gt;set_flags &amp; EXT4_TUNE_FL_MAX_MNT_COUNT)</div><div class='add'>+		es-&gt;s_max_mnt_count = cpu_to_le16(params-&gt;max_mnt_count);</div><div class='add'>+	if (params-&gt;set_flags &amp; EXT4_TUNE_FL_CHECKINTRVAL)</div><div class='add'>+		es-&gt;s_checkinterval = cpu_to_le32(params-&gt;checkinterval);</div><div class='add'>+	if (params-&gt;set_flags &amp; EXT4_TUNE_FL_LAST_CHECK_TIME)</div><div class='add'>+		es-&gt;s_lastcheck = cpu_to_le32(params-&gt;last_check_time);</div><div class='add'>+	if (params-&gt;set_flags &amp; EXT4_TUNE_FL_RESERVED_BLOCKS) {</div><div class='add'>+		ext4_fsblk_t blk = params-&gt;reserved_blocks;</div><div class='add'>+</div><div class='add'>+		es-&gt;s_r_blocks_count_lo = cpu_to_le32((u32)blk);</div><div class='add'>+		es-&gt;s_r_blocks_count_hi = cpu_to_le32(blk &gt;&gt; 32);</div><div class='add'>+	}</div><div class='add'>+	if (params-&gt;set_flags &amp; EXT4_TUNE_FL_RESERVED_UID) {</div><div class='add'>+		int uid = params-&gt;reserved_uid;</div><div class='add'>+</div><div class='add'>+		es-&gt;s_def_resuid = cpu_to_le16(uid &amp; 0xFFFF);</div><div class='add'>+		es-&gt;s_def_resuid_hi = cpu_to_le16(uid &gt;&gt; 16);</div><div class='add'>+	}</div><div class='add'>+	if (params-&gt;set_flags &amp; EXT4_TUNE_FL_RESERVED_GID) {</div><div class='add'>+		int gid = params-&gt;reserved_gid;</div><div class='add'>+</div><div class='add'>+		es-&gt;s_def_resgid = cpu_to_le16(gid &amp; 0xFFFF);</div><div class='add'>+		es-&gt;s_def_resgid_hi = cpu_to_le16(gid &gt;&gt; 16);</div><div class='add'>+	}</div><div class='add'>+	if (params-&gt;set_flags &amp; EXT4_TUNE_FL_DEFAULT_MNT_OPTS)</div><div class='add'>+		es-&gt;s_default_mount_opts = cpu_to_le32(params-&gt;default_mnt_opts);</div><div class='add'>+	if (params-&gt;set_flags &amp; EXT4_TUNE_FL_DEF_HASH_ALG)</div><div class='add'>+		es-&gt;s_def_hash_version = params-&gt;def_hash_alg;</div><div class='add'>+	if (params-&gt;set_flags &amp; EXT4_TUNE_FL_RAID_STRIDE)</div><div class='add'>+		es-&gt;s_raid_stride = cpu_to_le16(params-&gt;raid_stride);</div><div class='add'>+	if (params-&gt;set_flags &amp; EXT4_TUNE_FL_RAID_STRIPE_WIDTH)</div><div class='add'>+		es-&gt;s_raid_stripe_width =</div><div class='add'>+			cpu_to_le32(params-&gt;raid_stripe_width);</div><div class='add'>+	if (params-&gt;set_flags &amp; EXT4_TUNE_FL_ENCODING)</div><div class='add'>+		es-&gt;s_encoding = cpu_to_le16(params-&gt;encoding);</div><div class='add'>+	if (params-&gt;set_flags &amp; EXT4_TUNE_FL_ENCODING_FLAGS)</div><div class='add'>+		es-&gt;s_encoding_flags = cpu_to_le16(params-&gt;encoding_flags);</div><div class='add'>+	strscpy_pad(es-&gt;s_mount_opts, params-&gt;mount_opts);</div><div class='add'>+	if (params-&gt;set_flags &amp; EXT4_TUNE_FL_EDIT_FEATURES) {</div><div class='add'>+		es-&gt;s_feature_compat |=</div><div class='add'>+			cpu_to_le32(params-&gt;set_feature_compat_mask);</div><div class='add'>+		es-&gt;s_feature_incompat |=</div><div class='add'>+			cpu_to_le32(params-&gt;set_feature_incompat_mask);</div><div class='add'>+		es-&gt;s_feature_ro_compat |=</div><div class='add'>+			cpu_to_le32(params-&gt;set_feature_ro_compat_mask);</div><div class='add'>+		es-&gt;s_feature_compat &amp;=</div><div class='add'>+			~cpu_to_le32(params-&gt;clear_feature_compat_mask);</div><div class='add'>+		es-&gt;s_feature_incompat &amp;=</div><div class='add'>+			~cpu_to_le32(params-&gt;clear_feature_incompat_mask);</div><div class='add'>+		es-&gt;s_feature_ro_compat &amp;=</div><div class='add'>+			~cpu_to_le32(params-&gt;clear_feature_ro_compat_mask);</div><div class='add'>+		if (params-&gt;set_feature_compat_mask &amp;</div><div class='add'>+		    EXT4_FEATURE_COMPAT_DIR_INDEX)</div><div class='add'>+			es-&gt;s_def_hash_version = sbi-&gt;s_def_hash_version;</div><div class='add'>+		if (params-&gt;set_feature_incompat_mask &amp;</div><div class='add'>+		    EXT4_FEATURE_INCOMPAT_CSUM_SEED)</div><div class='add'>+			es-&gt;s_checksum_seed = cpu_to_le32(sbi-&gt;s_csum_seed);</div><div class='add'>+	}</div><div class='add'>+	if (params-&gt;set_flags &amp; EXT4_TUNE_FL_FORCE_FSCK)</div><div class='add'>+		es-&gt;s_state |= cpu_to_le16(EXT4_ERROR_FS);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ext4_ioctl_set_tune_sb(struct file *filp,</div><div class='add'>+				  struct ext4_tune_sb_params __user *in)</div><div class='add'>+{</div><div class='add'>+	struct ext4_tune_sb_params params;</div><div class='add'>+	struct super_block *sb = file_inode(filp)-&gt;i_sb;</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	struct ext4_super_block *es = sbi-&gt;s_es;</div><div class='add'>+	int enabling_casefold = 0;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (!capable(CAP_SYS_ADMIN))</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	if (copy_from_user(&amp;params, in, sizeof(params)))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+</div><div class='add'>+	if (strnlen(params.mount_opts, sizeof(params.mount_opts)) ==</div><div class='add'>+	    sizeof(params.mount_opts))</div><div class='add'>+		return -E2BIG;</div><div class='add'>+</div><div class='add'>+	if ((params.set_flags &amp; ~TUNE_OPS_SUPPORTED) != 0)</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+</div><div class='add'>+	if ((params.set_flags &amp; EXT4_TUNE_FL_ERRORS_BEHAVIOR) &amp;&amp;</div><div class='add'>+	    (params.errors_behavior &gt; EXT4_ERRORS_PANIC))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	if ((params.set_flags &amp; EXT4_TUNE_FL_RESERVED_BLOCKS) &amp;&amp;</div><div class='add'>+	    (params.reserved_blocks &gt; ext4_blocks_count(sbi-&gt;s_es) / 2))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	if ((params.set_flags &amp; EXT4_TUNE_FL_DEF_HASH_ALG) &amp;&amp;</div><div class='add'>+	    ((params.def_hash_alg &gt; DX_HASH_LAST) ||</div><div class='add'>+	     (params.def_hash_alg == DX_HASH_SIPHASH)))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	if ((params.set_flags &amp; EXT4_TUNE_FL_FEATURES) &amp;&amp;</div><div class='add'>+	    (params.set_flags &amp; EXT4_TUNE_FL_EDIT_FEATURES))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	if (params.set_flags &amp; EXT4_TUNE_FL_FEATURES) {</div><div class='add'>+		params.set_feature_compat_mask =</div><div class='add'>+			params.feature_compat &amp;</div><div class='add'>+			~le32_to_cpu(es-&gt;s_feature_compat);</div><div class='add'>+		params.set_feature_incompat_mask =</div><div class='add'>+			params.feature_incompat &amp;</div><div class='add'>+			~le32_to_cpu(es-&gt;s_feature_incompat);</div><div class='add'>+		params.set_feature_ro_compat_mask =</div><div class='add'>+			params.feature_ro_compat &amp;</div><div class='add'>+			~le32_to_cpu(es-&gt;s_feature_ro_compat);</div><div class='add'>+		params.clear_feature_compat_mask =</div><div class='add'>+			~params.feature_compat &amp;</div><div class='add'>+			le32_to_cpu(es-&gt;s_feature_compat);</div><div class='add'>+		params.clear_feature_incompat_mask =</div><div class='add'>+			~params.feature_incompat &amp;</div><div class='add'>+			le32_to_cpu(es-&gt;s_feature_incompat);</div><div class='add'>+		params.clear_feature_ro_compat_mask =</div><div class='add'>+			~params.feature_ro_compat &amp;</div><div class='add'>+			le32_to_cpu(es-&gt;s_feature_ro_compat);</div><div class='add'>+		params.set_flags |= EXT4_TUNE_FL_EDIT_FEATURES;</div><div class='add'>+	}</div><div class='add'>+	if (params.set_flags &amp; EXT4_TUNE_FL_EDIT_FEATURES) {</div><div class='add'>+		if ((params.set_feature_compat_mask &amp;</div><div class='add'>+		     ~EXT4_TUNE_SET_COMPAT_SUPP) ||</div><div class='add'>+		    (params.set_feature_incompat_mask &amp;</div><div class='add'>+		     ~EXT4_TUNE_SET_INCOMPAT_SUPP) ||</div><div class='add'>+		    (params.set_feature_ro_compat_mask &amp;</div><div class='add'>+		     ~EXT4_TUNE_SET_RO_COMPAT_SUPP) ||</div><div class='add'>+		    (params.clear_feature_compat_mask &amp;</div><div class='add'>+		     ~EXT4_TUNE_CLEAR_COMPAT_SUPP) ||</div><div class='add'>+		    (params.clear_feature_incompat_mask &amp;</div><div class='add'>+		     ~EXT4_TUNE_CLEAR_INCOMPAT_SUPP) ||</div><div class='add'>+		    (params.clear_feature_ro_compat_mask &amp;</div><div class='add'>+		     ~EXT4_TUNE_CLEAR_RO_COMPAT_SUPP))</div><div class='add'>+			return -EOPNOTSUPP;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Filter out the features that are already set from</div><div class='add'>+		 * the set_mask.</div><div class='add'>+		 */</div><div class='add'>+		params.set_feature_compat_mask &amp;=</div><div class='add'>+			~le32_to_cpu(es-&gt;s_feature_compat);</div><div class='add'>+		params.set_feature_incompat_mask &amp;=</div><div class='add'>+			~le32_to_cpu(es-&gt;s_feature_incompat);</div><div class='add'>+		params.set_feature_ro_compat_mask &amp;=</div><div class='add'>+			~le32_to_cpu(es-&gt;s_feature_ro_compat);</div><div class='add'>+		if ((params.set_feature_incompat_mask &amp;</div><div class='add'>+		     EXT4_FEATURE_INCOMPAT_CASEFOLD)) {</div><div class='add'>+			enabling_casefold = 1;</div><div class='add'>+			if (!(params.set_flags &amp; EXT4_TUNE_FL_ENCODING)) {</div><div class='add'>+				params.encoding = EXT4_ENC_UTF8_12_1;</div><div class='add'>+				params.set_flags |= EXT4_TUNE_FL_ENCODING;</div><div class='add'>+			}</div><div class='add'>+			if (!(params.set_flags &amp; EXT4_TUNE_FL_ENCODING_FLAGS)) {</div><div class='add'>+				params.encoding_flags = 0;</div><div class='add'>+				params.set_flags |= EXT4_TUNE_FL_ENCODING_FLAGS;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+		if ((params.set_feature_compat_mask &amp;</div><div class='add'>+		     EXT4_FEATURE_COMPAT_DIR_INDEX)) {</div><div class='add'>+			uuid_t	uu;</div><div class='add'>+</div><div class='add'>+			memcpy(&amp;uu, sbi-&gt;s_hash_seed, UUID_SIZE);</div><div class='add'>+			if (uuid_is_null(&amp;uu))</div><div class='add'>+				generate_random_uuid((char *)</div><div class='add'>+						     &amp;sbi-&gt;s_hash_seed);</div><div class='add'>+			if (params.set_flags &amp; EXT4_TUNE_FL_DEF_HASH_ALG)</div><div class='add'>+				sbi-&gt;s_def_hash_version = params.def_hash_alg;</div><div class='add'>+			else if (sbi-&gt;s_def_hash_version == 0)</div><div class='add'>+				sbi-&gt;s_def_hash_version = DX_HASH_HALF_MD4;</div><div class='add'>+			if (!(es-&gt;s_flags &amp;</div><div class='add'>+			      cpu_to_le32(EXT2_FLAGS_UNSIGNED_HASH)) &amp;&amp;</div><div class='add'>+			    !(es-&gt;s_flags &amp;</div><div class='add'>+			      cpu_to_le32(EXT2_FLAGS_SIGNED_HASH))) {</div><div class='add'>+#ifdef __CHAR_UNSIGNED__</div><div class='add'>+				sbi-&gt;s_hash_unsigned = 3;</div><div class='add'>+#else</div><div class='add'>+				sbi-&gt;s_hash_unsigned = 0;</div><div class='add'>+#endif</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	if (params.set_flags &amp; EXT4_TUNE_FL_ENCODING) {</div><div class='add'>+		if (!enabling_casefold)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		if (params.encoding == 0)</div><div class='add'>+			params.encoding = EXT4_ENC_UTF8_12_1;</div><div class='add'>+		else if (params.encoding != EXT4_ENC_UTF8_12_1)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+	if (params.set_flags &amp; EXT4_TUNE_FL_ENCODING_FLAGS) {</div><div class='add'>+		if (!enabling_casefold)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		if (params.encoding_flags &amp; ~SB_ENC_SUPP_MASK)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = mnt_want_write_file(filp);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	ret = ext4_update_superblocks_fn(sb, ext4_sb_setparams, &amp;params);</div><div class='add'>+	mnt_drop_write_file(filp);</div><div class='add'>+</div><div class='add'>+	if (params.set_flags &amp; EXT4_TUNE_FL_DEF_HASH_ALG)</div><div class='add'>+		sbi-&gt;s_def_hash_version = params.def_hash_alg;</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static long __ext4_ioctl(struct file *filp, unsigned int cmd, unsigned long arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(filp);</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='del'>-	struct user_namespace *mnt_userns = file_mnt_user_ns(filp);</div><div class='add'>+	struct mnt_idmap *idmap = file_mnt_idmap(filp);</div><div class='ctx'> </div><div class='ctx'> 	ext4_debug("cmd = %u, arg = %lu\n", cmd, arg);</div><div class='ctx'> </div><div class='hunk'>@@ -871,10 +1547,10 @@ static long __ext4_ioctl(struct file *filp, unsigned int cmd, unsigned long arg)</div><div class='ctx'> 		__u32 generation;</div><div class='ctx'> 		int err;</div><div class='ctx'> </div><div class='del'>-		if (!inode_owner_or_capable(mnt_userns, inode))</div><div class='add'>+		if (!inode_owner_or_capable(idmap, inode))</div><div class='ctx'> 			return -EPERM;</div><div class='ctx'> </div><div class='del'>-		if (ext4_has_metadata_csum(inode-&gt;i_sb)) {</div><div class='add'>+		if (ext4_has_feature_metadata_csum(inode-&gt;i_sb)) {</div><div class='ctx'> 			ext4_warning(sb, "Setting inode version is not "</div><div class='ctx'> 				     "supported with metadata_csum enabled.");</div><div class='ctx'> 			return -ENOTTY;</div><div class='hunk'>@@ -896,7 +1572,8 @@ static long __ext4_ioctl(struct file *filp, unsigned int cmd, unsigned long arg)</div><div class='ctx'> 		}</div><div class='ctx'> 		err = ext4_reserve_inode_write(handle, inode, &amp;iloc);</div><div class='ctx'> 		if (err == 0) {</div><div class='del'>-			inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+			inode_set_ctime_current(inode);</div><div class='add'>+			inode_inc_iversion(inode);</div><div class='ctx'> 			inode-&gt;i_generation = generation;</div><div class='ctx'> 			err = ext4_mark_iloc_dirty(handle, inode, &amp;iloc);</div><div class='ctx'> 		}</div><div class='hunk'>@@ -942,13 +1619,14 @@ setversion_out:</div><div class='ctx'> 			err = err2;</div><div class='ctx'> 		mnt_drop_write_file(filp);</div><div class='ctx'> group_extend_out:</div><div class='del'>-		ext4_resize_end(sb);</div><div class='add'>+		err2 = ext4_resize_end(sb, false);</div><div class='add'>+		if (err == 0)</div><div class='add'>+			err = err2;</div><div class='ctx'> 		return err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	case EXT4_IOC_MOVE_EXT: {</div><div class='ctx'> 		struct move_extent me;</div><div class='del'>-		struct fd donor;</div><div class='ctx'> 		int err;</div><div class='ctx'> </div><div class='ctx'> 		if (!(filp-&gt;f_mode &amp; FMODE_READ) ||</div><div class='hunk'>@@ -960,40 +1638,24 @@ group_extend_out:</div><div class='ctx'> 			return -EFAULT;</div><div class='ctx'> 		me.moved_len = 0;</div><div class='ctx'> </div><div class='del'>-		donor = fdget(me.donor_fd);</div><div class='del'>-		if (!donor.file)</div><div class='add'>+		CLASS(fd, donor)(me.donor_fd);</div><div class='add'>+		if (fd_empty(donor))</div><div class='ctx'> 			return -EBADF;</div><div class='ctx'> </div><div class='del'>-		if (!(donor.file-&gt;f_mode &amp; FMODE_WRITE)) {</div><div class='del'>-			err = -EBADF;</div><div class='del'>-			goto mext_out;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (ext4_has_feature_bigalloc(sb)) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR,</div><div class='del'>-				 "Online defrag not supported with bigalloc");</div><div class='del'>-			err = -EOPNOTSUPP;</div><div class='del'>-			goto mext_out;</div><div class='del'>-		} else if (IS_DAX(inode)) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR,</div><div class='del'>-				 "Online defrag not supported with DAX");</div><div class='del'>-			err = -EOPNOTSUPP;</div><div class='del'>-			goto mext_out;</div><div class='del'>-		}</div><div class='add'>+		if (!(fd_file(donor)-&gt;f_mode &amp; FMODE_WRITE))</div><div class='add'>+			return -EBADF;</div><div class='ctx'> </div><div class='ctx'> 		err = mnt_want_write_file(filp);</div><div class='ctx'> 		if (err)</div><div class='del'>-			goto mext_out;</div><div class='add'>+			return err;</div><div class='ctx'> </div><div class='del'>-		err = ext4_move_extents(filp, donor.file, me.orig_start,</div><div class='add'>+		err = ext4_move_extents(filp, fd_file(donor), me.orig_start,</div><div class='ctx'> 					me.donor_start, me.len, &amp;me.moved_len);</div><div class='ctx'> 		mnt_drop_write_file(filp);</div><div class='ctx'> </div><div class='ctx'> 		if (copy_to_user((struct move_extent __user *)arg,</div><div class='ctx'> 				 &amp;me, sizeof(me)))</div><div class='ctx'> 			err = -EFAULT;</div><div class='del'>-mext_out:</div><div class='del'>-		fdput(donor);</div><div class='ctx'> 		return err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1010,7 +1672,7 @@ mext_out:</div><div class='ctx'> 	case EXT4_IOC_MIGRATE:</div><div class='ctx'> 	{</div><div class='ctx'> 		int err;</div><div class='del'>-		if (!inode_owner_or_capable(mnt_userns, inode))</div><div class='add'>+		if (!inode_owner_or_capable(idmap, inode))</div><div class='ctx'> 			return -EACCES;</div><div class='ctx'> </div><div class='ctx'> 		err = mnt_want_write_file(filp);</div><div class='hunk'>@@ -1032,7 +1694,7 @@ mext_out:</div><div class='ctx'> 	case EXT4_IOC_ALLOC_DA_BLKS:</div><div class='ctx'> 	{</div><div class='ctx'> 		int err;</div><div class='del'>-		if (!inode_owner_or_capable(mnt_userns, inode))</div><div class='add'>+		if (!inode_owner_or_capable(idmap, inode))</div><div class='ctx'> 			return -EACCES;</div><div class='ctx'> </div><div class='ctx'> 		err = mnt_want_write_file(filp);</div><div class='hunk'>@@ -1051,7 +1713,7 @@ mext_out:</div><div class='ctx'> 		err = mnt_want_write_file(filp);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			return err;</div><div class='del'>-		err = swap_inode_boot_loader(sb, mnt_userns, inode);</div><div class='add'>+		err = swap_inode_boot_loader(sb, idmap, inode);</div><div class='ctx'> 		mnt_drop_write_file(filp);</div><div class='ctx'> 		return err;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1076,7 +1738,7 @@ mext_out:</div><div class='ctx'> </div><div class='ctx'> 		err = ext4_resize_fs(sb, n_blocks_count);</div><div class='ctx'> 		if (EXT4_SB(sb)-&gt;s_journal) {</div><div class='del'>-			ext4_fc_mark_ineligible(sb, EXT4_FC_REASON_RESIZE);</div><div class='add'>+			ext4_fc_mark_ineligible(sb, EXT4_FC_REASON_RESIZE, NULL);</div><div class='ctx'> 			jbd2_journal_lock_updates(EXT4_SB(sb)-&gt;s_journal);</div><div class='ctx'> 			err2 = jbd2_journal_flush(EXT4_SB(sb)-&gt;s_journal, 0);</div><div class='ctx'> 			jbd2_journal_unlock_updates(EXT4_SB(sb)-&gt;s_journal);</div><div class='hunk'>@@ -1090,20 +1752,21 @@ mext_out:</div><div class='ctx'> 			err = ext4_register_li_request(sb, o_group);</div><div class='ctx'> </div><div class='ctx'> resizefs_out:</div><div class='del'>-		ext4_resize_end(sb);</div><div class='add'>+		err2 = ext4_resize_end(sb, true);</div><div class='add'>+		if (err == 0)</div><div class='add'>+			err = err2;</div><div class='ctx'> 		return err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	case FITRIM:</div><div class='ctx'> 	{</div><div class='del'>-		struct request_queue *q = bdev_get_queue(sb-&gt;s_bdev);</div><div class='ctx'> 		struct fstrim_range range;</div><div class='ctx'> 		int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 		if (!capable(CAP_SYS_ADMIN))</div><div class='ctx'> 			return -EPERM;</div><div class='ctx'> </div><div class='del'>-		if (!blk_queue_discard(q))</div><div class='add'>+		if (!bdev_max_discard_sectors(sb-&gt;s_bdev))</div><div class='ctx'> 			return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='hunk'>@@ -1117,8 +1780,6 @@ resizefs_out:</div><div class='ctx'> 		    sizeof(range)))</div><div class='ctx'> 			return -EFAULT;</div><div class='ctx'> </div><div class='del'>-		range.minlen = max((unsigned int)range.minlen,</div><div class='del'>-				   q-&gt;limits.discard_granularity);</div><div class='ctx'> 		ret = ext4_trim_fs(sb, &amp;range);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			return ret;</div><div class='hunk'>@@ -1130,58 +1791,22 @@ resizefs_out:</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> 	case EXT4_IOC_PRECACHE_EXTENTS:</div><div class='del'>-		return ext4_ext_precache(inode);</div><div class='add'>+	{</div><div class='add'>+		int ret;</div><div class='ctx'> </div><div class='add'>+		inode_lock_shared(inode);</div><div class='add'>+		ret = ext4_ext_precache(inode);</div><div class='add'>+		inode_unlock_shared(inode);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='ctx'> 	case FS_IOC_SET_ENCRYPTION_POLICY:</div><div class='ctx'> 		if (!ext4_has_feature_encrypt(sb))</div><div class='ctx'> 			return -EOPNOTSUPP;</div><div class='ctx'> 		return fscrypt_ioctl_set_policy(filp, (const void __user *)arg);</div><div class='ctx'> </div><div class='del'>-	case FS_IOC_GET_ENCRYPTION_PWSALT: {</div><div class='del'>-#ifdef CONFIG_FS_ENCRYPTION</div><div class='del'>-		int err, err2;</div><div class='del'>-		struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='del'>-		handle_t *handle;</div><div class='add'>+	case FS_IOC_GET_ENCRYPTION_PWSALT:</div><div class='add'>+		return ext4_ioctl_get_encryption_pwsalt(filp, (void __user *)arg);</div><div class='ctx'> </div><div class='del'>-		if (!ext4_has_feature_encrypt(sb))</div><div class='del'>-			return -EOPNOTSUPP;</div><div class='del'>-		if (uuid_is_zero(sbi-&gt;s_es-&gt;s_encrypt_pw_salt)) {</div><div class='del'>-			err = mnt_want_write_file(filp);</div><div class='del'>-			if (err)</div><div class='del'>-				return err;</div><div class='del'>-			handle = ext4_journal_start_sb(sb, EXT4_HT_MISC, 1);</div><div class='del'>-			if (IS_ERR(handle)) {</div><div class='del'>-				err = PTR_ERR(handle);</div><div class='del'>-				goto pwsalt_err_exit;</div><div class='del'>-			}</div><div class='del'>-			err = ext4_journal_get_write_access(handle, sb,</div><div class='del'>-							    sbi-&gt;s_sbh,</div><div class='del'>-							    EXT4_JTR_NONE);</div><div class='del'>-			if (err)</div><div class='del'>-				goto pwsalt_err_journal;</div><div class='del'>-			lock_buffer(sbi-&gt;s_sbh);</div><div class='del'>-			generate_random_uuid(sbi-&gt;s_es-&gt;s_encrypt_pw_salt);</div><div class='del'>-			ext4_superblock_csum_set(sb);</div><div class='del'>-			unlock_buffer(sbi-&gt;s_sbh);</div><div class='del'>-			err = ext4_handle_dirty_metadata(handle, NULL,</div><div class='del'>-							 sbi-&gt;s_sbh);</div><div class='del'>-		pwsalt_err_journal:</div><div class='del'>-			err2 = ext4_journal_stop(handle);</div><div class='del'>-			if (err2 &amp;&amp; !err)</div><div class='del'>-				err = err2;</div><div class='del'>-		pwsalt_err_exit:</div><div class='del'>-			mnt_drop_write_file(filp);</div><div class='del'>-			if (err)</div><div class='del'>-				return err;</div><div class='del'>-		}</div><div class='del'>-		if (copy_to_user((void __user *) arg,</div><div class='del'>-				 sbi-&gt;s_es-&gt;s_encrypt_pw_salt, 16))</div><div class='del'>-			return -EFAULT;</div><div class='del'>-		return 0;</div><div class='del'>-#else</div><div class='del'>-		return -EOPNOTSUPP;</div><div class='del'>-#endif</div><div class='del'>-	}</div><div class='ctx'> 	case FS_IOC_GET_ENCRYPTION_POLICY:</div><div class='ctx'> 		if (!ext4_has_feature_encrypt(sb))</div><div class='ctx'> 			return -EOPNOTSUPP;</div><div class='hunk'>@@ -1219,7 +1844,7 @@ resizefs_out:</div><div class='ctx'> </div><div class='ctx'> 	case EXT4_IOC_CLEAR_ES_CACHE:</div><div class='ctx'> 	{</div><div class='del'>-		if (!inode_owner_or_capable(mnt_userns, inode))</div><div class='add'>+		if (!inode_owner_or_capable(idmap, inode))</div><div class='ctx'> 			return -EACCES;</div><div class='ctx'> 		ext4_clear_inode_es(inode);</div><div class='ctx'> 		return 0;</div><div class='hunk'>@@ -1245,7 +1870,7 @@ resizefs_out:</div><div class='ctx'> 		return ext4_ioctl_get_es_cache(filp, arg);</div><div class='ctx'> </div><div class='ctx'> 	case EXT4_IOC_SHUTDOWN:</div><div class='del'>-		return ext4_shutdown(sb, arg);</div><div class='add'>+		return ext4_ioctl_shutdown(sb, arg);</div><div class='ctx'> </div><div class='ctx'> 	case FS_IOC_ENABLE_VERITY:</div><div class='ctx'> 		if (!ext4_has_feature_verity(sb))</div><div class='hunk'>@@ -1266,6 +1891,22 @@ resizefs_out:</div><div class='ctx'> 	case EXT4_IOC_CHECKPOINT:</div><div class='ctx'> 		return ext4_ioctl_checkpoint(filp, arg);</div><div class='ctx'> </div><div class='add'>+	case FS_IOC_GETFSLABEL:</div><div class='add'>+		return ext4_ioctl_getlabel(EXT4_SB(sb), (void __user *)arg);</div><div class='add'>+</div><div class='add'>+	case FS_IOC_SETFSLABEL:</div><div class='add'>+		return ext4_ioctl_setlabel(filp,</div><div class='add'>+					   (const void __user *)arg);</div><div class='add'>+</div><div class='add'>+	case EXT4_IOC_GETFSUUID:</div><div class='add'>+		return ext4_ioctl_getuuid(EXT4_SB(sb), (void __user *)arg);</div><div class='add'>+	case EXT4_IOC_SETFSUUID:</div><div class='add'>+		return ext4_ioctl_setuuid(filp, (const void __user *)arg);</div><div class='add'>+	case EXT4_IOC_GET_TUNE_SB_PARAM:</div><div class='add'>+		return ext4_ioctl_get_tune_sb(EXT4_SB(sb),</div><div class='add'>+					      (void __user *)arg);</div><div class='add'>+	case EXT4_IOC_SET_TUNE_SB_PARAM:</div><div class='add'>+		return ext4_ioctl_set_tune_sb(filp, (void __user *)arg);</div><div class='ctx'> 	default:</div><div class='ctx'> 		return -ENOTTY;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1273,13 +1914,7 @@ resizefs_out:</div><div class='ctx'> </div><div class='ctx'> long ext4_ioctl(struct file *filp, unsigned int cmd, unsigned long arg)</div><div class='ctx'> {</div><div class='del'>-	long ret;</div><div class='del'>-</div><div class='del'>-	ext4_fc_start_update(file_inode(filp));</div><div class='del'>-	ret = __ext4_ioctl(filp, cmd, arg);</div><div class='del'>-	ext4_fc_stop_update(file_inode(filp));</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='add'>+	return __ext4_ioctl(filp, cmd, arg);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_COMPAT</div><div class='hunk'>@@ -1347,6 +1982,10 @@ long ext4_compat_ioctl(struct file *file, unsigned int cmd, unsigned long arg)</div><div class='ctx'> 	case EXT4_IOC_GETSTATE:</div><div class='ctx'> 	case EXT4_IOC_GET_ES_CACHE:</div><div class='ctx'> 	case EXT4_IOC_CHECKPOINT:</div><div class='add'>+	case FS_IOC_GETFSLABEL:</div><div class='add'>+	case FS_IOC_SETFSLABEL:</div><div class='add'>+	case EXT4_IOC_GETFSUUID:</div><div class='add'>+	case EXT4_IOC_SETFSUUID:</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		return -ENOIOCTLCMD;</div><div class='hunk'>@@ -1354,3 +1993,22 @@ long ext4_compat_ioctl(struct file *file, unsigned int cmd, unsigned long arg)</div><div class='ctx'> 	return ext4_ioctl(file, cmd, (unsigned long) compat_ptr(arg));</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='add'>+</div><div class='add'>+static void set_overhead(struct ext4_sb_info *sbi,</div><div class='add'>+			 struct ext4_super_block *es, const void *arg)</div><div class='add'>+{</div><div class='add'>+	es-&gt;s_overhead_clusters = cpu_to_le32(*((unsigned long *) arg));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int ext4_update_overhead(struct super_block *sb, bool force)</div><div class='add'>+{</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+</div><div class='add'>+	if (ext4_emergency_state(sb) || sb_rdonly(sb))</div><div class='add'>+		return 0;</div><div class='add'>+	if (!force &amp;&amp;</div><div class='add'>+	    (sbi-&gt;s_overhead == 0 ||</div><div class='add'>+	     sbi-&gt;s_overhead == le32_to_cpu(sbi-&gt;s_es-&gt;s_overhead_clusters)))</div><div class='add'>+		return 0;</div><div class='add'>+	return ext4_update_superblocks_fn(sb, set_overhead, &amp;sbi-&gt;s_overhead);</div><div class='add'>+}</div><div class='head'>diff --git a/fs/ext4/mballoc-test.c b/fs/ext4/mballoc-test.c<br/>new file mode 100644<br/>index 000000000000..a9416b20ff64<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/mballoc-test.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/mballoc-test.c</a></div><div class='hunk'>@@ -0,0 +1,999 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+/*</div><div class='add'>+ * KUnit test of ext4 multiblocks allocation.</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;kunit/test.h&gt;</div><div class='add'>+#include &lt;kunit/static_stub.h&gt;</div><div class='add'>+#include &lt;linux/random.h&gt;</div><div class='add'>+</div><div class='add'>+#include "ext4.h"</div><div class='add'>+</div><div class='add'>+struct mbt_grp_ctx {</div><div class='add'>+	struct buffer_head bitmap_bh;</div><div class='add'>+	/* desc and gd_bh are just the place holders for now */</div><div class='add'>+	struct ext4_group_desc desc;</div><div class='add'>+	struct buffer_head gd_bh;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct mbt_ctx {</div><div class='add'>+	struct mbt_grp_ctx *grp_ctx;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct mbt_ext4_super_block {</div><div class='add'>+	struct ext4_super_block es;</div><div class='add'>+	struct ext4_sb_info sbi;</div><div class='add'>+	struct mbt_ctx mbt_ctx;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+#define MBT_SB(_sb) (container_of((_sb)-&gt;s_fs_info, struct mbt_ext4_super_block, sbi))</div><div class='add'>+#define MBT_CTX(_sb) (&amp;MBT_SB(_sb)-&gt;mbt_ctx)</div><div class='add'>+#define MBT_GRP_CTX(_sb, _group) (&amp;MBT_CTX(_sb)-&gt;grp_ctx[_group])</div><div class='add'>+</div><div class='add'>+static struct inode *mbt_alloc_inode(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct ext4_inode_info *ei;</div><div class='add'>+</div><div class='add'>+	ei = kmalloc(sizeof(struct ext4_inode_info), GFP_KERNEL);</div><div class='add'>+	if (!ei)</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	INIT_LIST_HEAD(&amp;ei-&gt;i_orphan);</div><div class='add'>+	init_rwsem(&amp;ei-&gt;xattr_sem);</div><div class='add'>+	init_rwsem(&amp;ei-&gt;i_data_sem);</div><div class='add'>+	inode_init_once(&amp;ei-&gt;vfs_inode);</div><div class='add'>+	ext4_fc_init_inode(&amp;ei-&gt;vfs_inode);</div><div class='add'>+</div><div class='add'>+	return &amp;ei-&gt;vfs_inode;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void mbt_free_inode(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	kfree(EXT4_I(inode));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct super_operations mbt_sops = {</div><div class='add'>+	.alloc_inode	= mbt_alloc_inode,</div><div class='add'>+	.free_inode	= mbt_free_inode,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static void mbt_kill_sb(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	generic_shutdown_super(sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct file_system_type mbt_fs_type = {</div><div class='add'>+	.name			= "mballoc test",</div><div class='add'>+	.kill_sb		= mbt_kill_sb,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int mbt_mb_init(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	ext4_fsblk_t block;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	/* needed by ext4_mb_init-&gt;bdev_nonrot(sb-&gt;s_bdev) */</div><div class='add'>+	sb-&gt;s_bdev = kzalloc(sizeof(*sb-&gt;s_bdev), GFP_KERNEL);</div><div class='add'>+	if (sb-&gt;s_bdev == NULL)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	sb-&gt;s_bdev-&gt;bd_queue = kzalloc(sizeof(struct request_queue), GFP_KERNEL);</div><div class='add'>+	if (sb-&gt;s_bdev-&gt;bd_queue == NULL) {</div><div class='add'>+		kfree(sb-&gt;s_bdev);</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * needed by ext4_mb_init-&gt;ext4_mb_init_backend-&gt; sbi-&gt;s_buddy_cache =</div><div class='add'>+	 * new_inode(sb);</div><div class='add'>+	 */</div><div class='add'>+	INIT_LIST_HEAD(&amp;sb-&gt;s_inodes);</div><div class='add'>+	sb-&gt;s_op = &amp;mbt_sops;</div><div class='add'>+</div><div class='add'>+	ret = ext4_mb_init(sb);</div><div class='add'>+	if (ret != 0)</div><div class='add'>+		goto err_out;</div><div class='add'>+</div><div class='add'>+	block = ext4_count_free_clusters(sb);</div><div class='add'>+	ret = percpu_counter_init(&amp;EXT4_SB(sb)-&gt;s_freeclusters_counter, block,</div><div class='add'>+				  GFP_KERNEL);</div><div class='add'>+	if (ret != 0)</div><div class='add'>+		goto err_mb_release;</div><div class='add'>+</div><div class='add'>+	ret = percpu_counter_init(&amp;EXT4_SB(sb)-&gt;s_dirtyclusters_counter, 0,</div><div class='add'>+				  GFP_KERNEL);</div><div class='add'>+	if (ret != 0)</div><div class='add'>+		goto err_freeclusters;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+err_freeclusters:</div><div class='add'>+	percpu_counter_destroy(&amp;EXT4_SB(sb)-&gt;s_freeclusters_counter);</div><div class='add'>+err_mb_release:</div><div class='add'>+	ext4_mb_release(sb);</div><div class='add'>+err_out:</div><div class='add'>+	kfree(sb-&gt;s_bdev-&gt;bd_queue);</div><div class='add'>+	kfree(sb-&gt;s_bdev);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void mbt_mb_release(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	percpu_counter_destroy(&amp;EXT4_SB(sb)-&gt;s_dirtyclusters_counter);</div><div class='add'>+	percpu_counter_destroy(&amp;EXT4_SB(sb)-&gt;s_freeclusters_counter);</div><div class='add'>+	ext4_mb_release(sb);</div><div class='add'>+	kfree(sb-&gt;s_bdev-&gt;bd_queue);</div><div class='add'>+	kfree(sb-&gt;s_bdev);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int mbt_set(struct super_block *sb, void *data)</div><div class='add'>+{</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct super_block *mbt_ext4_alloc_super_block(void)</div><div class='add'>+{</div><div class='add'>+	struct mbt_ext4_super_block *fsb;</div><div class='add'>+	struct super_block *sb;</div><div class='add'>+	struct ext4_sb_info *sbi;</div><div class='add'>+</div><div class='add'>+	fsb = kzalloc(sizeof(*fsb), GFP_KERNEL);</div><div class='add'>+	if (fsb == NULL)</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	sb = sget(&amp;mbt_fs_type, NULL, mbt_set, 0, NULL);</div><div class='add'>+	if (IS_ERR(sb))</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	sbi = &amp;fsb-&gt;sbi;</div><div class='add'>+</div><div class='add'>+	sbi-&gt;s_blockgroup_lock =</div><div class='add'>+		kzalloc(sizeof(struct blockgroup_lock), GFP_KERNEL);</div><div class='add'>+	if (!sbi-&gt;s_blockgroup_lock)</div><div class='add'>+		goto out_deactivate;</div><div class='add'>+</div><div class='add'>+	bgl_lock_init(sbi-&gt;s_blockgroup_lock);</div><div class='add'>+</div><div class='add'>+	sbi-&gt;s_es = &amp;fsb-&gt;es;</div><div class='add'>+	sbi-&gt;s_sb = sb;</div><div class='add'>+	sb-&gt;s_fs_info = sbi;</div><div class='add'>+</div><div class='add'>+	up_write(&amp;sb-&gt;s_umount);</div><div class='add'>+	return sb;</div><div class='add'>+</div><div class='add'>+out_deactivate:</div><div class='add'>+	deactivate_locked_super(sb);</div><div class='add'>+out:</div><div class='add'>+	kfree(fsb);</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void mbt_ext4_free_super_block(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct mbt_ext4_super_block *fsb = MBT_SB(sb);</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+</div><div class='add'>+	kfree(sbi-&gt;s_blockgroup_lock);</div><div class='add'>+	deactivate_super(sb);</div><div class='add'>+	kfree(fsb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct mbt_ext4_block_layout {</div><div class='add'>+	unsigned char blocksize_bits;</div><div class='add'>+	unsigned int cluster_bits;</div><div class='add'>+	uint32_t blocks_per_group;</div><div class='add'>+	ext4_group_t group_count;</div><div class='add'>+	uint16_t desc_size;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static void mbt_init_sb_layout(struct super_block *sb,</div><div class='add'>+			       struct mbt_ext4_block_layout *layout)</div><div class='add'>+{</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	struct ext4_super_block *es = sbi-&gt;s_es;</div><div class='add'>+</div><div class='add'>+	sb-&gt;s_blocksize = 1UL &lt;&lt; layout-&gt;blocksize_bits;</div><div class='add'>+	sb-&gt;s_blocksize_bits = layout-&gt;blocksize_bits;</div><div class='add'>+</div><div class='add'>+	sbi-&gt;s_groups_count = layout-&gt;group_count;</div><div class='add'>+	sbi-&gt;s_blocks_per_group = layout-&gt;blocks_per_group;</div><div class='add'>+	sbi-&gt;s_cluster_bits = layout-&gt;cluster_bits;</div><div class='add'>+	sbi-&gt;s_cluster_ratio = 1U &lt;&lt; layout-&gt;cluster_bits;</div><div class='add'>+	sbi-&gt;s_clusters_per_group = layout-&gt;blocks_per_group &gt;&gt;</div><div class='add'>+				    layout-&gt;cluster_bits;</div><div class='add'>+	sbi-&gt;s_desc_size = layout-&gt;desc_size;</div><div class='add'>+	sbi-&gt;s_desc_per_block_bits =</div><div class='add'>+		sb-&gt;s_blocksize_bits - (fls(layout-&gt;desc_size) - 1);</div><div class='add'>+	sbi-&gt;s_desc_per_block = 1 &lt;&lt; sbi-&gt;s_desc_per_block_bits;</div><div class='add'>+</div><div class='add'>+	es-&gt;s_first_data_block = cpu_to_le32(0);</div><div class='add'>+	es-&gt;s_blocks_count_lo = cpu_to_le32(layout-&gt;blocks_per_group *</div><div class='add'>+					    layout-&gt;group_count);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int mbt_grp_ctx_init(struct super_block *sb,</div><div class='add'>+			    struct mbt_grp_ctx *grp_ctx)</div><div class='add'>+{</div><div class='add'>+	ext4_grpblk_t max = EXT4_CLUSTERS_PER_GROUP(sb);</div><div class='add'>+</div><div class='add'>+	grp_ctx-&gt;bitmap_bh.b_data = kzalloc(EXT4_BLOCK_SIZE(sb), GFP_KERNEL);</div><div class='add'>+	if (grp_ctx-&gt;bitmap_bh.b_data == NULL)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	mb_set_bits(grp_ctx-&gt;bitmap_bh.b_data, max, sb-&gt;s_blocksize * 8 - max);</div><div class='add'>+	ext4_free_group_clusters_set(sb, &amp;grp_ctx-&gt;desc, max);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void mbt_grp_ctx_release(struct mbt_grp_ctx *grp_ctx)</div><div class='add'>+{</div><div class='add'>+	kfree(grp_ctx-&gt;bitmap_bh.b_data);</div><div class='add'>+	grp_ctx-&gt;bitmap_bh.b_data = NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void mbt_ctx_mark_used(struct super_block *sb, ext4_group_t group,</div><div class='add'>+			      unsigned int start, unsigned int len)</div><div class='add'>+{</div><div class='add'>+	struct mbt_grp_ctx *grp_ctx = MBT_GRP_CTX(sb, group);</div><div class='add'>+</div><div class='add'>+	mb_set_bits(grp_ctx-&gt;bitmap_bh.b_data, start, len);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void *mbt_ctx_bitmap(struct super_block *sb, ext4_group_t group)</div><div class='add'>+{</div><div class='add'>+	struct mbt_grp_ctx *grp_ctx = MBT_GRP_CTX(sb, group);</div><div class='add'>+</div><div class='add'>+	return grp_ctx-&gt;bitmap_bh.b_data;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* called after mbt_init_sb_layout */</div><div class='add'>+static int mbt_ctx_init(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct mbt_ctx *ctx = MBT_CTX(sb);</div><div class='add'>+	ext4_group_t i, ngroups = ext4_get_groups_count(sb);</div><div class='add'>+</div><div class='add'>+	ctx-&gt;grp_ctx = kcalloc(ngroups, sizeof(struct mbt_grp_ctx),</div><div class='add'>+			       GFP_KERNEL);</div><div class='add'>+	if (ctx-&gt;grp_ctx == NULL)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; ngroups; i++)</div><div class='add'>+		if (mbt_grp_ctx_init(sb, &amp;ctx-&gt;grp_ctx[i]))</div><div class='add'>+			goto out;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * first data block(first cluster in first group) is used by</div><div class='add'>+	 * metadata, mark it used to avoid to alloc data block at first</div><div class='add'>+	 * block which will fail ext4_sb_block_valid check.</div><div class='add'>+	 */</div><div class='add'>+	mb_set_bits(ctx-&gt;grp_ctx[0].bitmap_bh.b_data, 0, 1);</div><div class='add'>+	ext4_free_group_clusters_set(sb, &amp;ctx-&gt;grp_ctx[0].desc,</div><div class='add'>+				     EXT4_CLUSTERS_PER_GROUP(sb) - 1);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+out:</div><div class='add'>+	while (i-- &gt; 0)</div><div class='add'>+		mbt_grp_ctx_release(&amp;ctx-&gt;grp_ctx[i]);</div><div class='add'>+	kfree(ctx-&gt;grp_ctx);</div><div class='add'>+	return -ENOMEM;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void mbt_ctx_release(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct mbt_ctx *ctx = MBT_CTX(sb);</div><div class='add'>+	ext4_group_t i, ngroups = ext4_get_groups_count(sb);</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; ngroups; i++)</div><div class='add'>+		mbt_grp_ctx_release(&amp;ctx-&gt;grp_ctx[i]);</div><div class='add'>+	kfree(ctx-&gt;grp_ctx);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct buffer_head *</div><div class='add'>+ext4_read_block_bitmap_nowait_stub(struct super_block *sb, ext4_group_t block_group,</div><div class='add'>+				   bool ignore_locked)</div><div class='add'>+{</div><div class='add'>+	struct mbt_grp_ctx *grp_ctx = MBT_GRP_CTX(sb, block_group);</div><div class='add'>+</div><div class='add'>+	/* paired with brelse from caller of ext4_read_block_bitmap_nowait */</div><div class='add'>+	get_bh(&amp;grp_ctx-&gt;bitmap_bh);</div><div class='add'>+	return &amp;grp_ctx-&gt;bitmap_bh;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ext4_wait_block_bitmap_stub(struct super_block *sb,</div><div class='add'>+				       ext4_group_t block_group,</div><div class='add'>+				       struct buffer_head *bh)</div><div class='add'>+{</div><div class='add'>+	/*</div><div class='add'>+	 * real ext4_wait_block_bitmap will set these flags and</div><div class='add'>+	 * functions like ext4_mb_init_cache will verify the flags.</div><div class='add'>+	 */</div><div class='add'>+	set_buffer_uptodate(bh);</div><div class='add'>+	set_bitmap_uptodate(bh);</div><div class='add'>+	set_buffer_verified(bh);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct ext4_group_desc *</div><div class='add'>+ext4_get_group_desc_stub(struct super_block *sb, ext4_group_t block_group,</div><div class='add'>+			 struct buffer_head **bh)</div><div class='add'>+{</div><div class='add'>+	struct mbt_grp_ctx *grp_ctx = MBT_GRP_CTX(sb, block_group);</div><div class='add'>+</div><div class='add'>+	if (bh != NULL)</div><div class='add'>+		*bh = &amp;grp_ctx-&gt;gd_bh;</div><div class='add'>+</div><div class='add'>+	return &amp;grp_ctx-&gt;desc;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int</div><div class='add'>+ext4_mb_mark_context_stub(handle_t *handle, struct super_block *sb, bool state,</div><div class='add'>+			  ext4_group_t group, ext4_grpblk_t blkoff,</div><div class='add'>+			  ext4_grpblk_t len, int flags,</div><div class='add'>+			  ext4_grpblk_t *ret_changed)</div><div class='add'>+{</div><div class='add'>+	struct mbt_grp_ctx *grp_ctx = MBT_GRP_CTX(sb, group);</div><div class='add'>+	struct buffer_head *bitmap_bh = &amp;grp_ctx-&gt;bitmap_bh;</div><div class='add'>+</div><div class='add'>+	if (state)</div><div class='add'>+		mb_set_bits(bitmap_bh-&gt;b_data, blkoff, len);</div><div class='add'>+	else</div><div class='add'>+		mb_clear_bits(bitmap_bh-&gt;b_data, blkoff, len);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define TEST_GOAL_GROUP 1</div><div class='add'>+static int mbt_kunit_init(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct mbt_ext4_block_layout *layout =</div><div class='add'>+		(struct mbt_ext4_block_layout *)(test-&gt;param_value);</div><div class='add'>+	struct super_block *sb;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	sb = mbt_ext4_alloc_super_block();</div><div class='add'>+	if (sb == NULL)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	mbt_init_sb_layout(sb, layout);</div><div class='add'>+</div><div class='add'>+	ret = mbt_ctx_init(sb);</div><div class='add'>+	if (ret != 0) {</div><div class='add'>+		mbt_ext4_free_super_block(sb);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	test-&gt;priv = sb;</div><div class='add'>+	kunit_activate_static_stub(test,</div><div class='add'>+				   ext4_read_block_bitmap_nowait,</div><div class='add'>+				   ext4_read_block_bitmap_nowait_stub);</div><div class='add'>+	kunit_activate_static_stub(test,</div><div class='add'>+				   ext4_wait_block_bitmap,</div><div class='add'>+				   ext4_wait_block_bitmap_stub);</div><div class='add'>+	kunit_activate_static_stub(test,</div><div class='add'>+				   ext4_get_group_desc,</div><div class='add'>+				   ext4_get_group_desc_stub);</div><div class='add'>+	kunit_activate_static_stub(test,</div><div class='add'>+				   ext4_mb_mark_context,</div><div class='add'>+				   ext4_mb_mark_context_stub);</div><div class='add'>+</div><div class='add'>+	/* stub function will be called in mbt_mb_init-&gt;ext4_mb_init */</div><div class='add'>+	if (mbt_mb_init(sb) != 0) {</div><div class='add'>+		mbt_ctx_release(sb);</div><div class='add'>+		mbt_ext4_free_super_block(sb);</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void mbt_kunit_exit(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = (struct super_block *)test-&gt;priv;</div><div class='add'>+</div><div class='add'>+	mbt_mb_release(sb);</div><div class='add'>+	mbt_ctx_release(sb);</div><div class='add'>+	mbt_ext4_free_super_block(sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void test_new_blocks_simple(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = (struct super_block *)test-&gt;priv;</div><div class='add'>+	struct inode *inode;</div><div class='add'>+	struct ext4_allocation_request ar;</div><div class='add'>+	ext4_group_t i, goal_group = TEST_GOAL_GROUP;</div><div class='add'>+	int err = 0;</div><div class='add'>+	ext4_fsblk_t found;</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+</div><div class='add'>+	inode = kunit_kzalloc(test, sizeof(*inode), GFP_KERNEL);</div><div class='add'>+	if (!inode)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	inode-&gt;i_sb = sb;</div><div class='add'>+	ar.inode = inode;</div><div class='add'>+</div><div class='add'>+	/* get block at goal */</div><div class='add'>+	ar.goal = ext4_group_first_block_no(sb, goal_group);</div><div class='add'>+	found = ext4_mb_new_blocks_simple(&amp;ar, &amp;err);</div><div class='add'>+	KUNIT_ASSERT_EQ_MSG(test, ar.goal, found,</div><div class='add'>+		"failed to alloc block at goal, expected %llu found %llu",</div><div class='add'>+		ar.goal, found);</div><div class='add'>+</div><div class='add'>+	/* get block after goal in goal group */</div><div class='add'>+	ar.goal = ext4_group_first_block_no(sb, goal_group);</div><div class='add'>+	found = ext4_mb_new_blocks_simple(&amp;ar, &amp;err);</div><div class='add'>+	KUNIT_ASSERT_EQ_MSG(test, ar.goal + EXT4_C2B(sbi, 1), found,</div><div class='add'>+		"failed to alloc block after goal in goal group, expected %llu found %llu",</div><div class='add'>+		ar.goal + 1, found);</div><div class='add'>+</div><div class='add'>+	/* get block after goal group */</div><div class='add'>+	mbt_ctx_mark_used(sb, goal_group, 0, EXT4_CLUSTERS_PER_GROUP(sb));</div><div class='add'>+	ar.goal = ext4_group_first_block_no(sb, goal_group);</div><div class='add'>+	found = ext4_mb_new_blocks_simple(&amp;ar, &amp;err);</div><div class='add'>+	KUNIT_ASSERT_EQ_MSG(test,</div><div class='add'>+		ext4_group_first_block_no(sb, goal_group + 1), found,</div><div class='add'>+		"failed to alloc block after goal group, expected %llu found %llu",</div><div class='add'>+		ext4_group_first_block_no(sb, goal_group + 1), found);</div><div class='add'>+</div><div class='add'>+	/* get block before goal group */</div><div class='add'>+	for (i = goal_group; i &lt; ext4_get_groups_count(sb); i++)</div><div class='add'>+		mbt_ctx_mark_used(sb, i, 0, EXT4_CLUSTERS_PER_GROUP(sb));</div><div class='add'>+	ar.goal = ext4_group_first_block_no(sb, goal_group);</div><div class='add'>+	found = ext4_mb_new_blocks_simple(&amp;ar, &amp;err);</div><div class='add'>+	KUNIT_ASSERT_EQ_MSG(test,</div><div class='add'>+		ext4_group_first_block_no(sb, 0) + EXT4_C2B(sbi, 1), found,</div><div class='add'>+		"failed to alloc block before goal group, expected %llu found %llu",</div><div class='add'>+		ext4_group_first_block_no(sb, 0 + EXT4_C2B(sbi, 1)), found);</div><div class='add'>+</div><div class='add'>+	/* no block available, fail to allocate block */</div><div class='add'>+	for (i = 0; i &lt; ext4_get_groups_count(sb); i++)</div><div class='add'>+		mbt_ctx_mark_used(sb, i, 0, EXT4_CLUSTERS_PER_GROUP(sb));</div><div class='add'>+	ar.goal = ext4_group_first_block_no(sb, goal_group);</div><div class='add'>+	found = ext4_mb_new_blocks_simple(&amp;ar, &amp;err);</div><div class='add'>+	KUNIT_ASSERT_NE_MSG(test, err, 0,</div><div class='add'>+		"unexpectedly get block when no block is available");</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define TEST_RANGE_COUNT 8</div><div class='add'>+</div><div class='add'>+struct test_range {</div><div class='add'>+	ext4_grpblk_t start;</div><div class='add'>+	ext4_grpblk_t len;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+mbt_generate_test_ranges(struct super_block *sb, struct test_range *ranges,</div><div class='add'>+			 int count)</div><div class='add'>+{</div><div class='add'>+	ext4_grpblk_t start, len, max;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	max = EXT4_CLUSTERS_PER_GROUP(sb) / count;</div><div class='add'>+	for (i = 0; i &lt; count; i++) {</div><div class='add'>+		start = get_random_u32() % max;</div><div class='add'>+		len = get_random_u32() % max;</div><div class='add'>+		len = min(len, max - start);</div><div class='add'>+</div><div class='add'>+		ranges[i].start = start + i * max;</div><div class='add'>+		ranges[i].len = len;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+validate_free_blocks_simple(struct kunit *test, struct super_block *sb,</div><div class='add'>+			    ext4_group_t goal_group, ext4_grpblk_t start,</div><div class='add'>+			    ext4_grpblk_t len)</div><div class='add'>+{</div><div class='add'>+	void *bitmap;</div><div class='add'>+	ext4_grpblk_t bit, max = EXT4_CLUSTERS_PER_GROUP(sb);</div><div class='add'>+	ext4_group_t i;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; ext4_get_groups_count(sb); i++) {</div><div class='add'>+		if (i == goal_group)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		bitmap = mbt_ctx_bitmap(sb, i);</div><div class='add'>+		bit = mb_find_next_zero_bit(bitmap, max, 0);</div><div class='add'>+		KUNIT_ASSERT_EQ_MSG(test, bit, max,</div><div class='add'>+				    "free block on unexpected group %d", i);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	bitmap = mbt_ctx_bitmap(sb, goal_group);</div><div class='add'>+	bit = mb_find_next_zero_bit(bitmap, max, 0);</div><div class='add'>+	KUNIT_ASSERT_EQ(test, bit, start);</div><div class='add'>+</div><div class='add'>+	bit = mb_find_next_bit(bitmap, max, bit + 1);</div><div class='add'>+	KUNIT_ASSERT_EQ(test, bit, start + len);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+test_free_blocks_simple_range(struct kunit *test, ext4_group_t goal_group,</div><div class='add'>+			      ext4_grpblk_t start, ext4_grpblk_t len)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = (struct super_block *)test-&gt;priv;</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	struct inode *inode;</div><div class='add'>+	ext4_fsblk_t block;</div><div class='add'>+</div><div class='add'>+	inode = kunit_kzalloc(test, sizeof(*inode), GFP_KERNEL);</div><div class='add'>+	if (!inode)</div><div class='add'>+		return;</div><div class='add'>+	inode-&gt;i_sb = sb;</div><div class='add'>+</div><div class='add'>+	if (len == 0)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	block = ext4_group_first_block_no(sb, goal_group) +</div><div class='add'>+		EXT4_C2B(sbi, start);</div><div class='add'>+	ext4_free_blocks_simple(inode, block, len);</div><div class='add'>+	validate_free_blocks_simple(test, sb, goal_group, start, len);</div><div class='add'>+	mbt_ctx_mark_used(sb, goal_group, 0, EXT4_CLUSTERS_PER_GROUP(sb));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void test_free_blocks_simple(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = (struct super_block *)test-&gt;priv;</div><div class='add'>+	ext4_grpblk_t max = EXT4_CLUSTERS_PER_GROUP(sb);</div><div class='add'>+	ext4_group_t i;</div><div class='add'>+	struct test_range ranges[TEST_RANGE_COUNT];</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; ext4_get_groups_count(sb); i++)</div><div class='add'>+		mbt_ctx_mark_used(sb, i, 0, max);</div><div class='add'>+</div><div class='add'>+	mbt_generate_test_ranges(sb, ranges, TEST_RANGE_COUNT);</div><div class='add'>+	for (i = 0; i &lt; TEST_RANGE_COUNT; i++)</div><div class='add'>+		test_free_blocks_simple_range(test, TEST_GOAL_GROUP,</div><div class='add'>+			ranges[i].start, ranges[i].len);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+test_mark_diskspace_used_range(struct kunit *test,</div><div class='add'>+			       struct ext4_allocation_context *ac,</div><div class='add'>+			       ext4_grpblk_t start,</div><div class='add'>+			       ext4_grpblk_t len)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = (struct super_block *)test-&gt;priv;</div><div class='add'>+	int ret;</div><div class='add'>+	void *bitmap;</div><div class='add'>+	ext4_grpblk_t i, max;</div><div class='add'>+</div><div class='add'>+	/* ext4_mb_mark_diskspace_used will BUG if len is 0 */</div><div class='add'>+	if (len == 0)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	ac-&gt;ac_b_ex.fe_group = TEST_GOAL_GROUP;</div><div class='add'>+	ac-&gt;ac_b_ex.fe_start = start;</div><div class='add'>+	ac-&gt;ac_b_ex.fe_len = len;</div><div class='add'>+</div><div class='add'>+	bitmap = mbt_ctx_bitmap(sb, TEST_GOAL_GROUP);</div><div class='add'>+	memset(bitmap, 0, sb-&gt;s_blocksize);</div><div class='add'>+	ret = ext4_mb_mark_diskspace_used(ac, NULL, 0);</div><div class='add'>+	KUNIT_ASSERT_EQ(test, ret, 0);</div><div class='add'>+</div><div class='add'>+	max = EXT4_CLUSTERS_PER_GROUP(sb);</div><div class='add'>+	i = mb_find_next_bit(bitmap, max, 0);</div><div class='add'>+	KUNIT_ASSERT_EQ(test, i, start);</div><div class='add'>+	i = mb_find_next_zero_bit(bitmap, max, i + 1);</div><div class='add'>+	KUNIT_ASSERT_EQ(test, i, start + len);</div><div class='add'>+	i = mb_find_next_bit(bitmap, max, i + 1);</div><div class='add'>+	KUNIT_ASSERT_EQ(test, max, i);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void test_mark_diskspace_used(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = (struct super_block *)test-&gt;priv;</div><div class='add'>+	struct inode *inode;</div><div class='add'>+	struct ext4_allocation_context ac;</div><div class='add'>+	struct test_range ranges[TEST_RANGE_COUNT];</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	mbt_generate_test_ranges(sb, ranges, TEST_RANGE_COUNT);</div><div class='add'>+</div><div class='add'>+	inode = kunit_kzalloc(test, sizeof(*inode), GFP_KERNEL);</div><div class='add'>+	if (!inode)</div><div class='add'>+		return;</div><div class='add'>+	inode-&gt;i_sb = sb;</div><div class='add'>+</div><div class='add'>+	ac.ac_status = AC_STATUS_FOUND;</div><div class='add'>+	ac.ac_sb = sb;</div><div class='add'>+	ac.ac_inode = inode;</div><div class='add'>+	for (i = 0; i &lt; TEST_RANGE_COUNT; i++)</div><div class='add'>+		test_mark_diskspace_used_range(test, &amp;ac, ranges[i].start,</div><div class='add'>+					       ranges[i].len);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void mbt_generate_buddy(struct super_block *sb, void *buddy,</div><div class='add'>+			       void *bitmap, struct ext4_group_info *grp)</div><div class='add'>+{</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	uint32_t order, off;</div><div class='add'>+	void *bb, *bb_h;</div><div class='add'>+	int max;</div><div class='add'>+</div><div class='add'>+	memset(buddy, 0xff, sb-&gt;s_blocksize);</div><div class='add'>+	memset(grp, 0, offsetof(struct ext4_group_info,</div><div class='add'>+				 bb_counters[MB_NUM_ORDERS(sb)]));</div><div class='add'>+</div><div class='add'>+	bb = bitmap;</div><div class='add'>+	max = EXT4_CLUSTERS_PER_GROUP(sb);</div><div class='add'>+	bb_h = buddy + sbi-&gt;s_mb_offsets[1];</div><div class='add'>+</div><div class='add'>+	off = mb_find_next_zero_bit(bb, max, 0);</div><div class='add'>+	grp-&gt;bb_first_free = off;</div><div class='add'>+	while (off &lt; max) {</div><div class='add'>+		grp-&gt;bb_counters[0]++;</div><div class='add'>+		grp-&gt;bb_free++;</div><div class='add'>+</div><div class='add'>+		if (!(off &amp; 1) &amp;&amp; !mb_test_bit(off + 1, bb)) {</div><div class='add'>+			grp-&gt;bb_free++;</div><div class='add'>+			grp-&gt;bb_counters[0]--;</div><div class='add'>+			mb_clear_bit(off &gt;&gt; 1, bb_h);</div><div class='add'>+			grp-&gt;bb_counters[1]++;</div><div class='add'>+			grp-&gt;bb_largest_free_order = 1;</div><div class='add'>+			off++;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		off = mb_find_next_zero_bit(bb, max, off + 1);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for (order = 1; order &lt; MB_NUM_ORDERS(sb) - 1; order++) {</div><div class='add'>+		bb = buddy + sbi-&gt;s_mb_offsets[order];</div><div class='add'>+		bb_h = buddy + sbi-&gt;s_mb_offsets[order + 1];</div><div class='add'>+		max = max &gt;&gt; 1;</div><div class='add'>+		off = mb_find_next_zero_bit(bb, max, 0);</div><div class='add'>+</div><div class='add'>+		while (off &lt; max) {</div><div class='add'>+			if (!(off &amp; 1) &amp;&amp; !mb_test_bit(off + 1, bb)) {</div><div class='add'>+				mb_set_bits(bb, off, 2);</div><div class='add'>+				grp-&gt;bb_counters[order] -= 2;</div><div class='add'>+				mb_clear_bit(off &gt;&gt; 1, bb_h);</div><div class='add'>+				grp-&gt;bb_counters[order + 1]++;</div><div class='add'>+				grp-&gt;bb_largest_free_order = order + 1;</div><div class='add'>+				off++;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			off = mb_find_next_zero_bit(bb, max, off + 1);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	max = EXT4_CLUSTERS_PER_GROUP(sb);</div><div class='add'>+	off = mb_find_next_zero_bit(bitmap, max, 0);</div><div class='add'>+	while (off &lt; max) {</div><div class='add'>+		grp-&gt;bb_fragments++;</div><div class='add'>+</div><div class='add'>+		off = mb_find_next_bit(bitmap, max, off + 1);</div><div class='add'>+		if (off + 1 &gt;= max)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		off = mb_find_next_zero_bit(bitmap, max, off + 1);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+mbt_validate_group_info(struct kunit *test, struct ext4_group_info *grp1,</div><div class='add'>+			struct ext4_group_info *grp2)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = (struct super_block *)test-&gt;priv;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	KUNIT_ASSERT_EQ(test, grp1-&gt;bb_first_free,</div><div class='add'>+			grp2-&gt;bb_first_free);</div><div class='add'>+	KUNIT_ASSERT_EQ(test, grp1-&gt;bb_fragments,</div><div class='add'>+			grp2-&gt;bb_fragments);</div><div class='add'>+	KUNIT_ASSERT_EQ(test, grp1-&gt;bb_free, grp2-&gt;bb_free);</div><div class='add'>+	KUNIT_ASSERT_EQ(test, grp1-&gt;bb_largest_free_order,</div><div class='add'>+			grp2-&gt;bb_largest_free_order);</div><div class='add'>+</div><div class='add'>+	for (i = 1; i &lt; MB_NUM_ORDERS(sb); i++) {</div><div class='add'>+		KUNIT_ASSERT_EQ_MSG(test, grp1-&gt;bb_counters[i],</div><div class='add'>+				    grp2-&gt;bb_counters[i],</div><div class='add'>+				    "bb_counters[%d] diffs, expected %d, generated %d",</div><div class='add'>+				    i, grp1-&gt;bb_counters[i],</div><div class='add'>+				    grp2-&gt;bb_counters[i]);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+do_test_generate_buddy(struct kunit *test, struct super_block *sb, void *bitmap,</div><div class='add'>+			   void *mbt_buddy, struct ext4_group_info *mbt_grp,</div><div class='add'>+			   void *ext4_buddy, struct ext4_group_info *ext4_grp)</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	mbt_generate_buddy(sb, mbt_buddy, bitmap, mbt_grp);</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; MB_NUM_ORDERS(sb); i++)</div><div class='add'>+		ext4_grp-&gt;bb_counters[i] = 0;</div><div class='add'>+	/* needed by validation in ext4_mb_generate_buddy */</div><div class='add'>+	ext4_grp-&gt;bb_free = mbt_grp-&gt;bb_free;</div><div class='add'>+	memset(ext4_buddy, 0xff, sb-&gt;s_blocksize);</div><div class='add'>+	ext4_mb_generate_buddy(sb, ext4_buddy, bitmap, TEST_GOAL_GROUP,</div><div class='add'>+			       ext4_grp);</div><div class='add'>+</div><div class='add'>+	KUNIT_ASSERT_EQ(test, memcmp(mbt_buddy, ext4_buddy, sb-&gt;s_blocksize),</div><div class='add'>+			0);</div><div class='add'>+	mbt_validate_group_info(test, mbt_grp, ext4_grp);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void test_mb_generate_buddy(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = (struct super_block *)test-&gt;priv;</div><div class='add'>+	void *bitmap, *expected_bb, *generate_bb;</div><div class='add'>+	struct ext4_group_info *expected_grp, *generate_grp;</div><div class='add'>+	struct test_range ranges[TEST_RANGE_COUNT];</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	bitmap = kunit_kzalloc(test, sb-&gt;s_blocksize, GFP_KERNEL);</div><div class='add'>+	KUNIT_ASSERT_NOT_ERR_OR_NULL(test, bitmap);</div><div class='add'>+	expected_bb = kunit_kzalloc(test, sb-&gt;s_blocksize, GFP_KERNEL);</div><div class='add'>+	KUNIT_ASSERT_NOT_ERR_OR_NULL(test, expected_bb);</div><div class='add'>+	generate_bb = kunit_kzalloc(test, sb-&gt;s_blocksize, GFP_KERNEL);</div><div class='add'>+	KUNIT_ASSERT_NOT_ERR_OR_NULL(test, generate_bb);</div><div class='add'>+	expected_grp = kunit_kzalloc(test, offsetof(struct ext4_group_info,</div><div class='add'>+				bb_counters[MB_NUM_ORDERS(sb)]), GFP_KERNEL);</div><div class='add'>+	KUNIT_ASSERT_NOT_ERR_OR_NULL(test, expected_grp);</div><div class='add'>+	generate_grp = ext4_get_group_info(sb, TEST_GOAL_GROUP);</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, generate_grp);</div><div class='add'>+</div><div class='add'>+	mbt_generate_test_ranges(sb, ranges, TEST_RANGE_COUNT);</div><div class='add'>+	for (i = 0; i &lt; TEST_RANGE_COUNT; i++) {</div><div class='add'>+		mb_set_bits(bitmap, ranges[i].start, ranges[i].len);</div><div class='add'>+		do_test_generate_buddy(test, sb, bitmap, expected_bb,</div><div class='add'>+				       expected_grp, generate_bb, generate_grp);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+test_mb_mark_used_range(struct kunit *test, struct ext4_buddy *e4b,</div><div class='add'>+			ext4_grpblk_t start, ext4_grpblk_t len, void *bitmap,</div><div class='add'>+			void *buddy, struct ext4_group_info *grp)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = (struct super_block *)test-&gt;priv;</div><div class='add'>+	struct ext4_free_extent ex;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	/* mb_mark_used only accepts non-zero len */</div><div class='add'>+	if (len == 0)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	ex.fe_start = start;</div><div class='add'>+	ex.fe_len = len;</div><div class='add'>+	ex.fe_group = TEST_GOAL_GROUP;</div><div class='add'>+</div><div class='add'>+	ext4_lock_group(sb, TEST_GOAL_GROUP);</div><div class='add'>+	mb_mark_used(e4b, &amp;ex);</div><div class='add'>+	ext4_unlock_group(sb, TEST_GOAL_GROUP);</div><div class='add'>+</div><div class='add'>+	mb_set_bits(bitmap, start, len);</div><div class='add'>+	/* bypass bb_free validatoin in ext4_mb_generate_buddy */</div><div class='add'>+	grp-&gt;bb_free -= len;</div><div class='add'>+	memset(buddy, 0xff, sb-&gt;s_blocksize);</div><div class='add'>+	for (i = 0; i &lt; MB_NUM_ORDERS(sb); i++)</div><div class='add'>+		grp-&gt;bb_counters[i] = 0;</div><div class='add'>+	ext4_mb_generate_buddy(sb, buddy, bitmap, 0, grp);</div><div class='add'>+</div><div class='add'>+	KUNIT_ASSERT_EQ(test, memcmp(buddy, e4b-&gt;bd_buddy, sb-&gt;s_blocksize),</div><div class='add'>+			0);</div><div class='add'>+	mbt_validate_group_info(test, grp, e4b-&gt;bd_info);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void test_mb_mark_used(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct ext4_buddy e4b;</div><div class='add'>+	struct super_block *sb = (struct super_block *)test-&gt;priv;</div><div class='add'>+	void *bitmap, *buddy;</div><div class='add'>+	struct ext4_group_info *grp;</div><div class='add'>+	int ret;</div><div class='add'>+	struct test_range ranges[TEST_RANGE_COUNT];</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	/* buddy cache assumes that each page contains at least one block */</div><div class='add'>+	if (sb-&gt;s_blocksize &gt; PAGE_SIZE)</div><div class='add'>+		kunit_skip(test, "blocksize exceeds pagesize");</div><div class='add'>+</div><div class='add'>+	bitmap = kunit_kzalloc(test, sb-&gt;s_blocksize, GFP_KERNEL);</div><div class='add'>+	KUNIT_ASSERT_NOT_ERR_OR_NULL(test, bitmap);</div><div class='add'>+	buddy = kunit_kzalloc(test, sb-&gt;s_blocksize, GFP_KERNEL);</div><div class='add'>+	KUNIT_ASSERT_NOT_ERR_OR_NULL(test, buddy);</div><div class='add'>+	grp = kunit_kzalloc(test, offsetof(struct ext4_group_info,</div><div class='add'>+				bb_counters[MB_NUM_ORDERS(sb)]), GFP_KERNEL);</div><div class='add'>+	KUNIT_ASSERT_NOT_ERR_OR_NULL(test, grp);</div><div class='add'>+</div><div class='add'>+	ret = ext4_mb_load_buddy(sb, TEST_GOAL_GROUP, &amp;e4b);</div><div class='add'>+	KUNIT_ASSERT_EQ(test, ret, 0);</div><div class='add'>+</div><div class='add'>+	grp-&gt;bb_free = EXT4_CLUSTERS_PER_GROUP(sb);</div><div class='add'>+	grp-&gt;bb_largest_free_order = -1;</div><div class='add'>+	grp-&gt;bb_avg_fragment_size_order = -1;</div><div class='add'>+	mbt_generate_test_ranges(sb, ranges, TEST_RANGE_COUNT);</div><div class='add'>+	for (i = 0; i &lt; TEST_RANGE_COUNT; i++)</div><div class='add'>+		test_mb_mark_used_range(test, &amp;e4b, ranges[i].start,</div><div class='add'>+					ranges[i].len, bitmap, buddy, grp);</div><div class='add'>+</div><div class='add'>+	ext4_mb_unload_buddy(&amp;e4b);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+test_mb_free_blocks_range(struct kunit *test, struct ext4_buddy *e4b,</div><div class='add'>+			  ext4_grpblk_t start, ext4_grpblk_t len, void *bitmap,</div><div class='add'>+			  void *buddy, struct ext4_group_info *grp)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = (struct super_block *)test-&gt;priv;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	/* mb_free_blocks will WARN if len is 0 */</div><div class='add'>+	if (len == 0)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	ext4_lock_group(sb, e4b-&gt;bd_group);</div><div class='add'>+	mb_free_blocks(NULL, e4b, start, len);</div><div class='add'>+	ext4_unlock_group(sb, e4b-&gt;bd_group);</div><div class='add'>+</div><div class='add'>+	mb_clear_bits(bitmap, start, len);</div><div class='add'>+	/* bypass bb_free validatoin in ext4_mb_generate_buddy */</div><div class='add'>+	grp-&gt;bb_free += len;</div><div class='add'>+	memset(buddy, 0xff, sb-&gt;s_blocksize);</div><div class='add'>+	for (i = 0; i &lt; MB_NUM_ORDERS(sb); i++)</div><div class='add'>+		grp-&gt;bb_counters[i] = 0;</div><div class='add'>+	ext4_mb_generate_buddy(sb, buddy, bitmap, 0, grp);</div><div class='add'>+</div><div class='add'>+	KUNIT_ASSERT_EQ(test, memcmp(buddy, e4b-&gt;bd_buddy, sb-&gt;s_blocksize),</div><div class='add'>+			0);</div><div class='add'>+	mbt_validate_group_info(test, grp, e4b-&gt;bd_info);</div><div class='add'>+</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void test_mb_free_blocks(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct ext4_buddy e4b;</div><div class='add'>+	struct super_block *sb = (struct super_block *)test-&gt;priv;</div><div class='add'>+	void *bitmap, *buddy;</div><div class='add'>+	struct ext4_group_info *grp;</div><div class='add'>+	struct ext4_free_extent ex;</div><div class='add'>+	int ret;</div><div class='add'>+	int i;</div><div class='add'>+	struct test_range ranges[TEST_RANGE_COUNT];</div><div class='add'>+</div><div class='add'>+	/* buddy cache assumes that each page contains at least one block */</div><div class='add'>+	if (sb-&gt;s_blocksize &gt; PAGE_SIZE)</div><div class='add'>+		kunit_skip(test, "blocksize exceeds pagesize");</div><div class='add'>+</div><div class='add'>+	bitmap = kunit_kzalloc(test, sb-&gt;s_blocksize, GFP_KERNEL);</div><div class='add'>+	KUNIT_ASSERT_NOT_ERR_OR_NULL(test, bitmap);</div><div class='add'>+	buddy = kunit_kzalloc(test, sb-&gt;s_blocksize, GFP_KERNEL);</div><div class='add'>+	KUNIT_ASSERT_NOT_ERR_OR_NULL(test, buddy);</div><div class='add'>+	grp = kunit_kzalloc(test, offsetof(struct ext4_group_info,</div><div class='add'>+				bb_counters[MB_NUM_ORDERS(sb)]), GFP_KERNEL);</div><div class='add'>+	KUNIT_ASSERT_NOT_ERR_OR_NULL(test, grp);</div><div class='add'>+</div><div class='add'>+	ret = ext4_mb_load_buddy(sb, TEST_GOAL_GROUP, &amp;e4b);</div><div class='add'>+	KUNIT_ASSERT_EQ(test, ret, 0);</div><div class='add'>+</div><div class='add'>+	ex.fe_start = 0;</div><div class='add'>+	ex.fe_len = EXT4_CLUSTERS_PER_GROUP(sb);</div><div class='add'>+	ex.fe_group = TEST_GOAL_GROUP;</div><div class='add'>+</div><div class='add'>+	ext4_lock_group(sb, TEST_GOAL_GROUP);</div><div class='add'>+	mb_mark_used(&amp;e4b, &amp;ex);</div><div class='add'>+	ext4_unlock_group(sb, TEST_GOAL_GROUP);</div><div class='add'>+</div><div class='add'>+	grp-&gt;bb_free = 0;</div><div class='add'>+	grp-&gt;bb_largest_free_order = -1;</div><div class='add'>+	grp-&gt;bb_avg_fragment_size_order = -1;</div><div class='add'>+	memset(bitmap, 0xff, sb-&gt;s_blocksize);</div><div class='add'>+</div><div class='add'>+	mbt_generate_test_ranges(sb, ranges, TEST_RANGE_COUNT);</div><div class='add'>+	for (i = 0; i &lt; TEST_RANGE_COUNT; i++)</div><div class='add'>+		test_mb_free_blocks_range(test, &amp;e4b, ranges[i].start,</div><div class='add'>+					  ranges[i].len, bitmap, buddy, grp);</div><div class='add'>+</div><div class='add'>+	ext4_mb_unload_buddy(&amp;e4b);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define COUNT_FOR_ESTIMATE 100000</div><div class='add'>+static void test_mb_mark_used_cost(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct ext4_buddy e4b;</div><div class='add'>+	struct super_block *sb = (struct super_block *)test-&gt;priv;</div><div class='add'>+	struct ext4_free_extent ex;</div><div class='add'>+	int ret;</div><div class='add'>+	struct test_range ranges[TEST_RANGE_COUNT];</div><div class='add'>+	int i, j;</div><div class='add'>+	unsigned long start, end, all = 0;</div><div class='add'>+</div><div class='add'>+	/* buddy cache assumes that each page contains at least one block */</div><div class='add'>+	if (sb-&gt;s_blocksize &gt; PAGE_SIZE)</div><div class='add'>+		kunit_skip(test, "blocksize exceeds pagesize");</div><div class='add'>+</div><div class='add'>+	ret = ext4_mb_load_buddy(sb, TEST_GOAL_GROUP, &amp;e4b);</div><div class='add'>+	KUNIT_ASSERT_EQ(test, ret, 0);</div><div class='add'>+</div><div class='add'>+	ex.fe_group = TEST_GOAL_GROUP;</div><div class='add'>+	for (j = 0; j &lt; COUNT_FOR_ESTIMATE; j++) {</div><div class='add'>+		mbt_generate_test_ranges(sb, ranges, TEST_RANGE_COUNT);</div><div class='add'>+		start = jiffies;</div><div class='add'>+		for (i = 0; i &lt; TEST_RANGE_COUNT; i++) {</div><div class='add'>+			if (ranges[i].len == 0)</div><div class='add'>+				continue;</div><div class='add'>+</div><div class='add'>+			ex.fe_start = ranges[i].start;</div><div class='add'>+			ex.fe_len = ranges[i].len;</div><div class='add'>+			ext4_lock_group(sb, TEST_GOAL_GROUP);</div><div class='add'>+			mb_mark_used(&amp;e4b, &amp;ex);</div><div class='add'>+			ext4_unlock_group(sb, TEST_GOAL_GROUP);</div><div class='add'>+		}</div><div class='add'>+		end = jiffies;</div><div class='add'>+		all += (end - start);</div><div class='add'>+</div><div class='add'>+		for (i = 0; i &lt; TEST_RANGE_COUNT; i++) {</div><div class='add'>+			if (ranges[i].len == 0)</div><div class='add'>+				continue;</div><div class='add'>+</div><div class='add'>+			ext4_lock_group(sb, TEST_GOAL_GROUP);</div><div class='add'>+			mb_free_blocks(NULL, &amp;e4b, ranges[i].start,</div><div class='add'>+				       ranges[i].len);</div><div class='add'>+			ext4_unlock_group(sb, TEST_GOAL_GROUP);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	kunit_info(test, "costed jiffies %lu\n", all);</div><div class='add'>+	ext4_mb_unload_buddy(&amp;e4b);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct mbt_ext4_block_layout mbt_test_layouts[] = {</div><div class='add'>+	{</div><div class='add'>+		.blocksize_bits = 10,</div><div class='add'>+		.cluster_bits = 3,</div><div class='add'>+		.blocks_per_group = 8192,</div><div class='add'>+		.group_count = 4,</div><div class='add'>+		.desc_size = 64,</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+		.blocksize_bits = 12,</div><div class='add'>+		.cluster_bits = 3,</div><div class='add'>+		.blocks_per_group = 8192,</div><div class='add'>+		.group_count = 4,</div><div class='add'>+		.desc_size = 64,</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+		.blocksize_bits = 16,</div><div class='add'>+		.cluster_bits = 3,</div><div class='add'>+		.blocks_per_group = 8192,</div><div class='add'>+		.group_count = 4,</div><div class='add'>+		.desc_size = 64,</div><div class='add'>+	},</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static void mbt_show_layout(const struct mbt_ext4_block_layout *layout,</div><div class='add'>+			    char *desc)</div><div class='add'>+{</div><div class='add'>+	snprintf(desc, KUNIT_PARAM_DESC_SIZE, "block_bits=%d cluster_bits=%d "</div><div class='add'>+		 "blocks_per_group=%d group_count=%d desc_size=%d\n",</div><div class='add'>+		 layout-&gt;blocksize_bits, layout-&gt;cluster_bits,</div><div class='add'>+		 layout-&gt;blocks_per_group, layout-&gt;group_count,</div><div class='add'>+		 layout-&gt;desc_size);</div><div class='add'>+}</div><div class='add'>+KUNIT_ARRAY_PARAM(mbt_layouts, mbt_test_layouts, mbt_show_layout);</div><div class='add'>+</div><div class='add'>+static struct kunit_case mbt_test_cases[] = {</div><div class='add'>+	KUNIT_CASE_PARAM(test_new_blocks_simple, mbt_layouts_gen_params),</div><div class='add'>+	KUNIT_CASE_PARAM(test_free_blocks_simple, mbt_layouts_gen_params),</div><div class='add'>+	KUNIT_CASE_PARAM(test_mb_generate_buddy, mbt_layouts_gen_params),</div><div class='add'>+	KUNIT_CASE_PARAM(test_mb_mark_used, mbt_layouts_gen_params),</div><div class='add'>+	KUNIT_CASE_PARAM(test_mb_free_blocks, mbt_layouts_gen_params),</div><div class='add'>+	KUNIT_CASE_PARAM(test_mark_diskspace_used, mbt_layouts_gen_params),</div><div class='add'>+	KUNIT_CASE_PARAM_ATTR(test_mb_mark_used_cost, mbt_layouts_gen_params,</div><div class='add'>+			      { .speed = KUNIT_SPEED_SLOW }),</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static struct kunit_suite mbt_test_suite = {</div><div class='add'>+	.name = "ext4_mballoc_test",</div><div class='add'>+	.init = mbt_kunit_init,</div><div class='add'>+	.exit = mbt_kunit_exit,</div><div class='add'>+	.test_cases = mbt_test_cases,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+kunit_test_suites(&amp;mbt_test_suite);</div><div class='add'>+</div><div class='add'>+MODULE_LICENSE("GPL");</div><div class='head'>diff --git a/fs/ext4/mballoc.c b/fs/ext4/mballoc.c<br/>index 215b7068f548..56d50fd3310b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/mballoc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/mballoc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/mballoc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/mballoc.c</a></div><div class='hunk'>@@ -16,7 +16,9 @@</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/nospec.h&gt;</div><div class='ctx'> #include &lt;linux/backing-dev.h&gt;</div><div class='add'>+#include &lt;linux/freezer.h&gt;</div><div class='ctx'> #include &lt;trace/events/ext4.h&gt;</div><div class='add'>+#include &lt;kunit/static_stub.h&gt;</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * MUSTDO:</div><div class='hunk'>@@ -96,14 +98,14 @@</div><div class='ctx'>  * block bitmap and buddy information. The information are stored in the</div><div class='ctx'>  * inode as:</div><div class='ctx'>  *</div><div class='del'>- *  {                        page                        }</div><div class='add'>+ *  {                        folio                        }</div><div class='ctx'>  *  [ group 0 bitmap][ group 0 buddy] [group 1][ group 1]...</div><div class='ctx'>  *</div><div class='ctx'>  *</div><div class='ctx'>  * one block each for bitmap and buddy information.  So for each group we</div><div class='del'>- * take up 2 blocks. A page can contain blocks_per_page (PAGE_SIZE /</div><div class='del'>- * blocksize) blocks.  So it can have information regarding groups_per_page</div><div class='del'>- * which is blocks_per_page/2</div><div class='add'>+ * take up 2 blocks. A folio can contain blocks_per_folio (folio_size /</div><div class='add'>+ * blocksize) blocks.  So it can have information regarding groups_per_folio</div><div class='add'>+ * which is blocks_per_folio/2</div><div class='ctx'>  *</div><div class='ctx'>  * The buddy cache inode is not stored on disk. The inode is thrown</div><div class='ctx'>  * away when the filesystem is unmounted.</div><div class='hunk'>@@ -130,47 +132,67 @@</div><div class='ctx'>  * If "mb_optimize_scan" mount option is set, we maintain in memory group info</div><div class='ctx'>  * structures in two data structures:</div><div class='ctx'>  *</div><div class='del'>- * 1) Array of largest free order lists (sbi-&gt;s_mb_largest_free_orders)</div><div class='add'>+ * 1) Array of largest free order xarrays (sbi-&gt;s_mb_largest_free_orders)</div><div class='ctx'>  *</div><div class='del'>- *    Locking: sbi-&gt;s_mb_largest_free_orders_locks(array of rw locks)</div><div class='add'>+ *    Locking: Writers use xa_lock, readers use rcu_read_lock.</div><div class='ctx'>  *</div><div class='del'>- *    This is an array of lists where the index in the array represents the</div><div class='add'>+ *    This is an array of xarrays where the index in the array represents the</div><div class='ctx'>  *    largest free order in the buddy bitmap of the participating group infos of</div><div class='del'>- *    that list. So, there are exactly MB_NUM_ORDERS(sb) (which means total</div><div class='del'>- *    number of buddy bitmap orders possible) number of lists. Group-infos are</div><div class='del'>- *    placed in appropriate lists.</div><div class='add'>+ *    that xarray. So, there are exactly MB_NUM_ORDERS(sb) (which means total</div><div class='add'>+ *    number of buddy bitmap orders possible) number of xarrays. Group-infos are</div><div class='add'>+ *    placed in appropriate xarrays.</div><div class='ctx'>  *</div><div class='del'>- * 2) Average fragment size rb tree (sbi-&gt;s_mb_avg_fragment_size_root)</div><div class='add'>+ * 2) Average fragment size xarrays (sbi-&gt;s_mb_avg_fragment_size)</div><div class='ctx'>  *</div><div class='del'>- *    Locking: sbi-&gt;s_mb_rb_lock (rwlock)</div><div class='add'>+ *    Locking: Writers use xa_lock, readers use rcu_read_lock.</div><div class='ctx'>  *</div><div class='del'>- *    This is a red black tree consisting of group infos and the tree is sorted</div><div class='del'>- *    by average fragment sizes (which is calculated as ext4_group_info-&gt;bb_free</div><div class='del'>- *    / ext4_group_info-&gt;bb_fragments).</div><div class='add'>+ *    This is an array of xarrays where in the i-th xarray there are groups with</div><div class='add'>+ *    average fragment size &gt;= 2^i and &lt; 2^(i+1). The average fragment size</div><div class='add'>+ *    is computed as ext4_group_info-&gt;bb_free / ext4_group_info-&gt;bb_fragments.</div><div class='add'>+ *    Note that we don't bother with a special xarray for completely empty</div><div class='add'>+ *    groups so we only have MB_NUM_ORDERS(sb) xarrays. Group-infos are placed</div><div class='add'>+ *    in appropriate xarrays.</div><div class='add'>+ *</div><div class='add'>+ * In xarray, the index is the block group number, the value is the block group</div><div class='add'>+ * information, and a non-empty value indicates the block group is present in</div><div class='add'>+ * the current xarray.</div><div class='ctx'>  *</div><div class='ctx'>  * When "mb_optimize_scan" mount option is set, mballoc consults the above data</div><div class='ctx'>  * structures to decide the order in which groups are to be traversed for</div><div class='ctx'>  * fulfilling an allocation request.</div><div class='ctx'>  *</div><div class='del'>- * At CR = 0, we look for groups which have the largest_free_order &gt;= the order</div><div class='del'>- * of the request. We directly look at the largest free order list in the data</div><div class='del'>- * structure (1) above where largest_free_order = order of the request. If that</div><div class='del'>- * list is empty, we look at remaining list in the increasing order of</div><div class='del'>- * largest_free_order. This allows us to perform CR = 0 lookup in O(1) time.</div><div class='add'>+ * At CR_POWER2_ALIGNED , we look for groups which have the largest_free_order</div><div class='add'>+ * &gt;= the order of the request. We directly look at the largest free order list</div><div class='add'>+ * in the data structure (1) above where largest_free_order = order of the</div><div class='add'>+ * request. If that list is empty, we look at remaining list in the increasing</div><div class='add'>+ * order of largest_free_order. This allows us to perform CR_POWER2_ALIGNED</div><div class='add'>+ * lookup in O(1) time.</div><div class='add'>+ *</div><div class='add'>+ * At CR_GOAL_LEN_FAST, we only consider groups where</div><div class='add'>+ * average fragment size &gt; request size. So, we lookup a group which has average</div><div class='add'>+ * fragment size just above or equal to request size using our average fragment</div><div class='add'>+ * size group lists (data structure 2) in O(1) time.</div><div class='ctx'>  *</div><div class='del'>- * At CR = 1, we only consider groups where average fragment size &gt; request</div><div class='del'>- * size. So, we lookup a group which has average fragment size just above or</div><div class='del'>- * equal to request size using our rb tree (data structure 2) in O(log N) time.</div><div class='add'>+ * At CR_BEST_AVAIL_LEN, we aim to optimize allocations which can't be satisfied</div><div class='add'>+ * in CR_GOAL_LEN_FAST. The fact that we couldn't find a group in</div><div class='add'>+ * CR_GOAL_LEN_FAST suggests that there is no BG that has avg</div><div class='add'>+ * fragment size &gt; goal length. So before falling to the slower</div><div class='add'>+ * CR_GOAL_LEN_SLOW, in CR_BEST_AVAIL_LEN we proactively trim goal length and</div><div class='add'>+ * then use the same fragment lists as CR_GOAL_LEN_FAST to find a BG with a big</div><div class='add'>+ * enough average fragment size. This increases the chances of finding a</div><div class='add'>+ * suitable block group in O(1) time and results in faster allocation at the</div><div class='add'>+ * cost of reduced size of allocation.</div><div class='ctx'>  *</div><div class='ctx'>  * If "mb_optimize_scan" mount option is not set, mballoc traverses groups in</div><div class='del'>- * linear order which requires O(N) search time for each CR 0 and CR 1 phase.</div><div class='add'>+ * linear order which requires O(N) search time for each CR_POWER2_ALIGNED and</div><div class='add'>+ * CR_GOAL_LEN_FAST phase.</div><div class='ctx'>  *</div><div class='ctx'>  * The regular allocator (using the buddy cache) supports a few tunables.</div><div class='ctx'>  *</div><div class='ctx'>  * /sys/fs/ext4/&lt;partition&gt;/mb_min_to_scan</div><div class='ctx'>  * /sys/fs/ext4/&lt;partition&gt;/mb_max_to_scan</div><div class='ctx'>  * /sys/fs/ext4/&lt;partition&gt;/mb_order2_req</div><div class='del'>- * /sys/fs/ext4/&lt;partition&gt;/mb_linear_limit</div><div class='add'>+ * /sys/fs/ext4/&lt;partition&gt;/mb_max_linear_groups</div><div class='ctx'>  *</div><div class='ctx'>  * The regular allocator uses buddy scan only if the request len is power of</div><div class='ctx'>  * 2 blocks and the order of allocation is &gt;= sbi-&gt;s_mb_order2_reqs. The</div><div class='hunk'>@@ -192,7 +214,7 @@</div><div class='ctx'>  * get traversed linearly. That may result in subsequent allocations being not</div><div class='ctx'>  * close to each other. And so, the underlying device may get filled up in a</div><div class='ctx'>  * non-linear fashion. While that may not matter on non-rotational devices, for</div><div class='del'>- * rotational devices that may result in higher seek times. "mb_linear_limit"</div><div class='add'>+ * rotational devices that may result in higher seek times. "mb_max_linear_groups"</div><div class='ctx'>  * tells mballoc how many groups mballoc should search linearly before</div><div class='ctx'>  * performing consulting above data structures for more efficient lookups. For</div><div class='ctx'>  * non rotational devices, this value defaults to 0 and for rotational devices</div><div class='hunk'>@@ -348,8 +370,8 @@</div><div class='ctx'>  *  - bitlock on a group	(group)</div><div class='ctx'>  *  - object (inode/locality)	(object)</div><div class='ctx'>  *  - per-pa lock		(pa)</div><div class='del'>- *  - cr0 lists lock		(cr0)</div><div class='del'>- *  - cr1 tree lock		(cr1)</div><div class='add'>+ *  - cr_power2_aligned lists lock	(cr_power2_aligned)</div><div class='add'>+ *  - cr_goal_len_fast lists lock	(cr_goal_len_fast)</div><div class='ctx'>  *</div><div class='ctx'>  * Paths:</div><div class='ctx'>  *  - new pa</div><div class='hunk'>@@ -381,7 +403,7 @@</div><div class='ctx'>  *</div><div class='ctx'>  *  - allocation path (ext4_mb_regular_allocator)</div><div class='ctx'>  *    group</div><div class='del'>- *    cr0/cr1</div><div class='add'>+ *    cr_power2_aligned/cr_goal_len_fast</div><div class='ctx'>  */</div><div class='ctx'> static struct kmem_cache *ext4_pspace_cachep;</div><div class='ctx'> static struct kmem_cache *ext4_ac_cachep;</div><div class='hunk'>@@ -401,12 +423,10 @@ static const char * const ext4_groupinfo_slab_names[NR_GRPINFO_CACHES] = {</div><div class='ctx'> </div><div class='ctx'> static void ext4_mb_generate_from_pa(struct super_block *sb, void *bitmap,</div><div class='ctx'> 					ext4_group_t group);</div><div class='del'>-static void ext4_mb_generate_from_freelist(struct super_block *sb, void *bitmap,</div><div class='del'>-						ext4_group_t group);</div><div class='ctx'> static void ext4_mb_new_preallocation(struct ext4_allocation_context *ac);</div><div class='ctx'> </div><div class='del'>-static bool ext4_mb_good_group(struct ext4_allocation_context *ac,</div><div class='del'>-			       ext4_group_t group, int cr);</div><div class='add'>+static int ext4_mb_scan_group(struct ext4_allocation_context *ac,</div><div class='add'>+			      ext4_group_t group);</div><div class='ctx'> </div><div class='ctx'> static int ext4_try_to_trim_range(struct super_block *sb,</div><div class='ctx'> 		struct ext4_buddy *e4b, ext4_grpblk_t start,</div><div class='hunk'>@@ -549,14 +569,14 @@ static void mb_free_blocks_double(struct inode *inode, struct ext4_buddy *e4b,</div><div class='ctx'> </div><div class='ctx'> 			blocknr = ext4_group_first_block_no(sb, e4b-&gt;bd_group);</div><div class='ctx'> 			blocknr += EXT4_C2B(EXT4_SB(sb), first + i);</div><div class='add'>+			ext4_mark_group_bitmap_corrupted(sb, e4b-&gt;bd_group,</div><div class='add'>+					EXT4_GROUP_INFO_BBITMAP_CORRUPT);</div><div class='ctx'> 			ext4_grp_locked_error(sb, e4b-&gt;bd_group,</div><div class='ctx'> 					      inode ? inode-&gt;i_ino : 0,</div><div class='ctx'> 					      blocknr,</div><div class='ctx'> 					      "freeing block already freed "</div><div class='ctx'> 					      "(bit %u)",</div><div class='ctx'> 					      first + i);</div><div class='del'>-			ext4_mark_group_bitmap_corrupted(sb, e4b-&gt;bd_group,</div><div class='del'>-					EXT4_GROUP_INFO_BBITMAP_CORRUPT);</div><div class='ctx'> 		}</div><div class='ctx'> 		mb_clear_bit(first + i, e4b-&gt;bd_info-&gt;bb_bitmap);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -662,7 +682,25 @@ do {									\</div><div class='ctx'> 	}								\</div><div class='ctx'> } while (0)</div><div class='ctx'> </div><div class='del'>-static int __mb_check_buddy(struct ext4_buddy *e4b, char *file,</div><div class='add'>+/*</div><div class='add'>+ * Perform buddy integrity check with the following steps:</div><div class='add'>+ *</div><div class='add'>+ * 1. Top-down validation (from highest order down to order 1, excluding order-0 bitmap):</div><div class='add'>+ *    For each pair of adjacent orders, if a higher-order bit is set (indicating a free block),</div><div class='add'>+ *    at most one of the two corresponding lower-order bits may be clear (free).</div><div class='add'>+ *</div><div class='add'>+ * 2. Order-0 (bitmap) validation, performed on bit pairs:</div><div class='add'>+ *    - If either bit in a pair is set (1, allocated), then all corresponding higher-order bits</div><div class='add'>+ *      must not be free (0).</div><div class='add'>+ *    - If both bits in a pair are clear (0, free), then exactly one of the corresponding</div><div class='add'>+ *      higher-order bits must be free (0).</div><div class='add'>+ *</div><div class='add'>+ * 3. Preallocation (pa) list validation:</div><div class='add'>+ *    For each preallocated block (pa) in the group:</div><div class='add'>+ *    - Verify that pa_pstart falls within the bounds of this block group.</div><div class='add'>+ *    - Ensure the corresponding bit(s) in the order-0 bitmap are marked as allocated (1).</div><div class='add'>+ */</div><div class='add'>+static void __mb_check_buddy(struct ext4_buddy *e4b, char *file,</div><div class='ctx'> 				const char *function, int line)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = e4b-&gt;bd_sb;</div><div class='hunk'>@@ -681,7 +719,7 @@ static int __mb_check_buddy(struct ext4_buddy *e4b, char *file,</div><div class='ctx'> 	void *buddy2;</div><div class='ctx'> </div><div class='ctx'> 	if (e4b-&gt;bd_info-&gt;bb_check_counter++ % 10)</div><div class='del'>-		return 0;</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='ctx'> 	while (order &gt; 1) {</div><div class='ctx'> 		buddy = mb_find_buddy(e4b, order, &amp;max);</div><div class='hunk'>@@ -695,26 +733,14 @@ static int __mb_check_buddy(struct ext4_buddy *e4b, char *file,</div><div class='ctx'> 		for (i = 0; i &lt; max; i++) {</div><div class='ctx'> </div><div class='ctx'> 			if (mb_test_bit(i, buddy)) {</div><div class='del'>-				/* only single bit in buddy2 may be 1 */</div><div class='add'>+				/* only single bit in buddy2 may be 0 */</div><div class='ctx'> 				if (!mb_test_bit(i &lt;&lt; 1, buddy2)) {</div><div class='ctx'> 					MB_CHECK_ASSERT(</div><div class='ctx'> 						mb_test_bit((i&lt;&lt;1)+1, buddy2));</div><div class='del'>-				} else if (!mb_test_bit((i &lt;&lt; 1) + 1, buddy2)) {</div><div class='del'>-					MB_CHECK_ASSERT(</div><div class='del'>-						mb_test_bit(i &lt;&lt; 1, buddy2));</div><div class='ctx'> 				}</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			/* both bits in buddy2 must be 1 */</div><div class='del'>-			MB_CHECK_ASSERT(mb_test_bit(i &lt;&lt; 1, buddy2));</div><div class='del'>-			MB_CHECK_ASSERT(mb_test_bit((i &lt;&lt; 1) + 1, buddy2));</div><div class='del'>-</div><div class='del'>-			for (j = 0; j &lt; (1 &lt;&lt; order); j++) {</div><div class='del'>-				k = (i * (1 &lt;&lt; order)) + j;</div><div class='del'>-				MB_CHECK_ASSERT(</div><div class='del'>-					!mb_test_bit(k, e4b-&gt;bd_bitmap));</div><div class='del'>-			}</div><div class='ctx'> 			count++;</div><div class='ctx'> 		}</div><div class='ctx'> 		MB_CHECK_ASSERT(e4b-&gt;bd_info-&gt;bb_counters[order] == count);</div><div class='hunk'>@@ -730,31 +756,40 @@ static int __mb_check_buddy(struct ext4_buddy *e4b, char *file,</div><div class='ctx'> 				fragments++;</div><div class='ctx'> 				fstart = i;</div><div class='ctx'> 			}</div><div class='del'>-			continue;</div><div class='add'>+		} else {</div><div class='add'>+			fstart = -1;</div><div class='ctx'> 		}</div><div class='del'>-		fstart = -1;</div><div class='del'>-		/* check used bits only */</div><div class='del'>-		for (j = 0; j &lt; e4b-&gt;bd_blkbits + 1; j++) {</div><div class='del'>-			buddy2 = mb_find_buddy(e4b, j, &amp;max2);</div><div class='del'>-			k = i &gt;&gt; j;</div><div class='del'>-			MB_CHECK_ASSERT(k &lt; max2);</div><div class='del'>-			MB_CHECK_ASSERT(mb_test_bit(k, buddy2));</div><div class='add'>+		if (!(i &amp; 1)) {</div><div class='add'>+			int in_use, zero_bit_count = 0;</div><div class='add'>+</div><div class='add'>+			in_use = mb_test_bit(i, buddy) || mb_test_bit(i + 1, buddy);</div><div class='add'>+			for (j = 1; j &lt; e4b-&gt;bd_blkbits + 2; j++) {</div><div class='add'>+				buddy2 = mb_find_buddy(e4b, j, &amp;max2);</div><div class='add'>+				k = i &gt;&gt; j;</div><div class='add'>+				MB_CHECK_ASSERT(k &lt; max2);</div><div class='add'>+				if (!mb_test_bit(k, buddy2))</div><div class='add'>+					zero_bit_count++;</div><div class='add'>+			}</div><div class='add'>+			MB_CHECK_ASSERT(zero_bit_count == !in_use);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	MB_CHECK_ASSERT(!EXT4_MB_GRP_NEED_INIT(e4b-&gt;bd_info));</div><div class='ctx'> 	MB_CHECK_ASSERT(e4b-&gt;bd_info-&gt;bb_fragments == fragments);</div><div class='ctx'> </div><div class='ctx'> 	grp = ext4_get_group_info(sb, e4b-&gt;bd_group);</div><div class='add'>+	if (!grp)</div><div class='add'>+		return;</div><div class='ctx'> 	list_for_each(cur, &amp;grp-&gt;bb_prealloc_list) {</div><div class='ctx'> 		ext4_group_t groupnr;</div><div class='ctx'> 		struct ext4_prealloc_space *pa;</div><div class='ctx'> 		pa = list_entry(cur, struct ext4_prealloc_space, pa_group_list);</div><div class='add'>+		if (!pa-&gt;pa_len)</div><div class='add'>+			continue;</div><div class='ctx'> 		ext4_get_group_no_and_offset(sb, pa-&gt;pa_pstart, &amp;groupnr, &amp;k);</div><div class='ctx'> 		MB_CHECK_ASSERT(groupnr == e4b-&gt;bd_group);</div><div class='ctx'> 		for (i = 0; i &lt; pa-&gt;pa_len; i++)</div><div class='ctx'> 			MB_CHECK_ASSERT(mb_test_bit(k + i, buddy));</div><div class='ctx'> 	}</div><div class='del'>-	return 0;</div><div class='ctx'> }</div><div class='ctx'> #undef MB_CHECK_ASSERT</div><div class='ctx'> #define mb_check_buddy(e4b) __mb_check_buddy(e4b,	\</div><div class='hunk'>@@ -805,267 +840,390 @@ static void ext4_mb_mark_free_simple(struct super_block *sb,</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void ext4_mb_rb_insert(struct rb_root *root, struct rb_node *new,</div><div class='del'>-			int (*cmp)(struct rb_node *, struct rb_node *))</div><div class='add'>+static int mb_avg_fragment_size_order(struct super_block *sb, ext4_grpblk_t len)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node **iter = &amp;root-&gt;rb_node, *parent = NULL;</div><div class='add'>+	int order;</div><div class='ctx'> </div><div class='del'>-	while (*iter) {</div><div class='del'>-		parent = *iter;</div><div class='del'>-		if (cmp(new, *iter) &gt; 0)</div><div class='del'>-			iter = &amp;((*iter)-&gt;rb_left);</div><div class='del'>-		else</div><div class='del'>-			iter = &amp;((*iter)-&gt;rb_right);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rb_link_node(new, parent, iter);</div><div class='del'>-	rb_insert_color(new, root);</div><div class='add'>+	/*</div><div class='add'>+	 * We don't bother with a special lists groups with only 1 block free</div><div class='add'>+	 * extents and for completely empty groups.</div><div class='add'>+	 */</div><div class='add'>+	order = fls(len) - 2;</div><div class='add'>+	if (order &lt; 0)</div><div class='add'>+		return 0;</div><div class='add'>+	if (order == MB_NUM_ORDERS(sb))</div><div class='add'>+		order--;</div><div class='add'>+	if (WARN_ON_ONCE(order &gt; MB_NUM_ORDERS(sb)))</div><div class='add'>+		order = MB_NUM_ORDERS(sb) - 1;</div><div class='add'>+	return order;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int</div><div class='del'>-ext4_mb_avg_fragment_size_cmp(struct rb_node *rb1, struct rb_node *rb2)</div><div class='add'>+/* Move group to appropriate avg_fragment_size list */</div><div class='add'>+static void</div><div class='add'>+mb_update_avg_fragment_size(struct super_block *sb, struct ext4_group_info *grp)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_group_info *grp1 = rb_entry(rb1,</div><div class='del'>-						struct ext4_group_info,</div><div class='del'>-						bb_avg_fragment_size_rb);</div><div class='del'>-	struct ext4_group_info *grp2 = rb_entry(rb2,</div><div class='del'>-						struct ext4_group_info,</div><div class='del'>-						bb_avg_fragment_size_rb);</div><div class='del'>-	int num_frags_1, num_frags_2;</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	int new, old;</div><div class='add'>+</div><div class='add'>+	if (!test_opt2(sb, MB_OPTIMIZE_SCAN))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	old = grp-&gt;bb_avg_fragment_size_order;</div><div class='add'>+	new = grp-&gt;bb_fragments == 0 ? -1 :</div><div class='add'>+	      mb_avg_fragment_size_order(sb, grp-&gt;bb_free / grp-&gt;bb_fragments);</div><div class='add'>+	if (new == old)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	num_frags_1 = grp1-&gt;bb_fragments ?</div><div class='del'>-		grp1-&gt;bb_free / grp1-&gt;bb_fragments : 0;</div><div class='del'>-	num_frags_2 = grp2-&gt;bb_fragments ?</div><div class='del'>-		grp2-&gt;bb_free / grp2-&gt;bb_fragments : 0;</div><div class='add'>+	if (old &gt;= 0)</div><div class='add'>+		xa_erase(&amp;sbi-&gt;s_mb_avg_fragment_size[old], grp-&gt;bb_group);</div><div class='ctx'> </div><div class='del'>-	return (num_frags_2 - num_frags_1);</div><div class='add'>+	grp-&gt;bb_avg_fragment_size_order = new;</div><div class='add'>+	if (new &gt;= 0) {</div><div class='add'>+		/*</div><div class='add'>+		 * Cannot use __GFP_NOFAIL because we hold the group lock.</div><div class='add'>+		 * Although allocation for insertion may fails, it's not fatal</div><div class='add'>+		 * as we have linear traversal to fall back on.</div><div class='add'>+		 */</div><div class='add'>+		int err = xa_insert(&amp;sbi-&gt;s_mb_avg_fragment_size[new],</div><div class='add'>+				    grp-&gt;bb_group, grp, GFP_ATOMIC);</div><div class='add'>+		if (err)</div><div class='add'>+			mb_debug(sb, "insert group: %u to s_mb_avg_fragment_size[%d] failed, err %d",</div><div class='add'>+				 grp-&gt;bb_group, new, err);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Reinsert grpinfo into the avg_fragment_size tree with new average</div><div class='del'>- * fragment size.</div><div class='del'>- */</div><div class='del'>-static void</div><div class='del'>-mb_update_avg_fragment_size(struct super_block *sb, struct ext4_group_info *grp)</div><div class='add'>+static int ext4_mb_scan_groups_xa_range(struct ext4_allocation_context *ac,</div><div class='add'>+					struct xarray *xa,</div><div class='add'>+					ext4_group_t start, ext4_group_t end)</div><div class='ctx'> {</div><div class='add'>+	struct super_block *sb = ac-&gt;ac_sb;</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	enum criteria cr = ac-&gt;ac_criteria;</div><div class='add'>+	ext4_group_t ngroups = ext4_get_groups_count(sb);</div><div class='add'>+	unsigned long group = start;</div><div class='add'>+	struct ext4_group_info *grp;</div><div class='ctx'> </div><div class='del'>-	if (!test_opt2(sb, MB_OPTIMIZE_SCAN) || grp-&gt;bb_free == 0)</div><div class='del'>-		return;</div><div class='add'>+	if (WARN_ON_ONCE(end &gt; ngroups || start &gt;= end))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	xa_for_each_range(xa, group, grp, start, end - 1) {</div><div class='add'>+		int err;</div><div class='add'>+</div><div class='add'>+		if (sbi-&gt;s_mb_stats)</div><div class='add'>+			atomic64_inc(&amp;sbi-&gt;s_bal_cX_groups_considered[cr]);</div><div class='ctx'> </div><div class='del'>-	write_lock(&amp;sbi-&gt;s_mb_rb_lock);</div><div class='del'>-	if (!RB_EMPTY_NODE(&amp;grp-&gt;bb_avg_fragment_size_rb)) {</div><div class='del'>-		rb_erase(&amp;grp-&gt;bb_avg_fragment_size_rb,</div><div class='del'>-				&amp;sbi-&gt;s_mb_avg_fragment_size_root);</div><div class='del'>-		RB_CLEAR_NODE(&amp;grp-&gt;bb_avg_fragment_size_rb);</div><div class='add'>+		err = ext4_mb_scan_group(ac, grp-&gt;bb_group);</div><div class='add'>+		if (err || ac-&gt;ac_status != AC_STATUS_CONTINUE)</div><div class='add'>+			return err;</div><div class='add'>+</div><div class='add'>+		cond_resched();</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ext4_mb_rb_insert(&amp;sbi-&gt;s_mb_avg_fragment_size_root,</div><div class='del'>-		&amp;grp-&gt;bb_avg_fragment_size_rb,</div><div class='del'>-		ext4_mb_avg_fragment_size_cmp);</div><div class='del'>-	write_unlock(&amp;sbi-&gt;s_mb_rb_lock);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Find a suitable group of given order from the largest free orders xarray.</div><div class='add'>+ */</div><div class='add'>+static inline int</div><div class='add'>+ext4_mb_scan_groups_largest_free_order_range(struct ext4_allocation_context *ac,</div><div class='add'>+					     int order, ext4_group_t start,</div><div class='add'>+					     ext4_group_t end)</div><div class='add'>+{</div><div class='add'>+	struct xarray *xa = &amp;EXT4_SB(ac-&gt;ac_sb)-&gt;s_mb_largest_free_orders[order];</div><div class='add'>+</div><div class='add'>+	if (xa_empty(xa))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	return ext4_mb_scan_groups_xa_range(ac, xa, start, end);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Choose next group by traversing largest_free_order lists. Updates *new_cr if</div><div class='ctx'>  * cr level needs an update.</div><div class='ctx'>  */</div><div class='del'>-static void ext4_mb_choose_next_group_cr0(struct ext4_allocation_context *ac,</div><div class='del'>-			int *new_cr, ext4_group_t *group, ext4_group_t ngroups)</div><div class='add'>+static int ext4_mb_scan_groups_p2_aligned(struct ext4_allocation_context *ac,</div><div class='add'>+					  ext4_group_t group)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(ac-&gt;ac_sb);</div><div class='del'>-	struct ext4_group_info *iter, *grp;</div><div class='ctx'> 	int i;</div><div class='add'>+	int ret = 0;</div><div class='add'>+	ext4_group_t start, end;</div><div class='ctx'> </div><div class='del'>-	if (ac-&gt;ac_status == AC_STATUS_FOUND)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	if (unlikely(sbi-&gt;s_mb_stats &amp;&amp; ac-&gt;ac_flags &amp; EXT4_MB_CR0_OPTIMIZED))</div><div class='del'>-		atomic_inc(&amp;sbi-&gt;s_bal_cr0_bad_suggestions);</div><div class='del'>-</div><div class='del'>-	grp = NULL;</div><div class='add'>+	start = group;</div><div class='add'>+	end = ext4_get_groups_count(ac-&gt;ac_sb);</div><div class='add'>+wrap_around:</div><div class='ctx'> 	for (i = ac-&gt;ac_2order; i &lt; MB_NUM_ORDERS(ac-&gt;ac_sb); i++) {</div><div class='del'>-		if (list_empty(&amp;sbi-&gt;s_mb_largest_free_orders[i]))</div><div class='del'>-			continue;</div><div class='del'>-		read_lock(&amp;sbi-&gt;s_mb_largest_free_orders_locks[i]);</div><div class='del'>-		if (list_empty(&amp;sbi-&gt;s_mb_largest_free_orders[i])) {</div><div class='del'>-			read_unlock(&amp;sbi-&gt;s_mb_largest_free_orders_locks[i]);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-		grp = NULL;</div><div class='del'>-		list_for_each_entry(iter, &amp;sbi-&gt;s_mb_largest_free_orders[i],</div><div class='del'>-				    bb_largest_free_order_node) {</div><div class='del'>-			if (sbi-&gt;s_mb_stats)</div><div class='del'>-				atomic64_inc(&amp;sbi-&gt;s_bal_cX_groups_considered[0]);</div><div class='del'>-			if (likely(ext4_mb_good_group(ac, iter-&gt;bb_group, 0))) {</div><div class='del'>-				grp = iter;</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-		read_unlock(&amp;sbi-&gt;s_mb_largest_free_orders_locks[i]);</div><div class='del'>-		if (grp)</div><div class='del'>-			break;</div><div class='add'>+		ret = ext4_mb_scan_groups_largest_free_order_range(ac, i,</div><div class='add'>+								   start, end);</div><div class='add'>+		if (ret || ac-&gt;ac_status != AC_STATUS_CONTINUE)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+	if (start) {</div><div class='add'>+		end = start;</div><div class='add'>+		start = 0;</div><div class='add'>+		goto wrap_around;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!grp) {</div><div class='del'>-		/* Increment cr and search again */</div><div class='del'>-		*new_cr = 1;</div><div class='del'>-	} else {</div><div class='del'>-		*group = grp-&gt;bb_group;</div><div class='del'>-		ac-&gt;ac_last_optimal_group = *group;</div><div class='del'>-		ac-&gt;ac_flags |= EXT4_MB_CR0_OPTIMIZED;</div><div class='add'>+	if (sbi-&gt;s_mb_stats)</div><div class='add'>+		atomic64_inc(&amp;sbi-&gt;s_bal_cX_failed[ac-&gt;ac_criteria]);</div><div class='add'>+</div><div class='add'>+	/* Increment cr and search again if no group is found */</div><div class='add'>+	ac-&gt;ac_criteria = CR_GOAL_LEN_FAST;</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Find a suitable group of given order from the average fragments xarray.</div><div class='add'>+ */</div><div class='add'>+static int</div><div class='add'>+ext4_mb_scan_groups_avg_frag_order_range(struct ext4_allocation_context *ac,</div><div class='add'>+					 int order, ext4_group_t start,</div><div class='add'>+					 ext4_group_t end)</div><div class='add'>+{</div><div class='add'>+	struct xarray *xa = &amp;EXT4_SB(ac-&gt;ac_sb)-&gt;s_mb_avg_fragment_size[order];</div><div class='add'>+</div><div class='add'>+	if (xa_empty(xa))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	return ext4_mb_scan_groups_xa_range(ac, xa, start, end);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Choose next group by traversing average fragment size list of suitable</div><div class='add'>+ * order. Updates *new_cr if cr level needs an update.</div><div class='add'>+ */</div><div class='add'>+static int ext4_mb_scan_groups_goal_fast(struct ext4_allocation_context *ac,</div><div class='add'>+					 ext4_group_t group)</div><div class='add'>+{</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(ac-&gt;ac_sb);</div><div class='add'>+	int i, ret = 0;</div><div class='add'>+	ext4_group_t start, end;</div><div class='add'>+</div><div class='add'>+	start = group;</div><div class='add'>+	end = ext4_get_groups_count(ac-&gt;ac_sb);</div><div class='add'>+wrap_around:</div><div class='add'>+	i = mb_avg_fragment_size_order(ac-&gt;ac_sb, ac-&gt;ac_g_ex.fe_len);</div><div class='add'>+	for (; i &lt; MB_NUM_ORDERS(ac-&gt;ac_sb); i++) {</div><div class='add'>+		ret = ext4_mb_scan_groups_avg_frag_order_range(ac, i,</div><div class='add'>+							       start, end);</div><div class='add'>+		if (ret || ac-&gt;ac_status != AC_STATUS_CONTINUE)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+	if (start) {</div><div class='add'>+		end = start;</div><div class='add'>+		start = 0;</div><div class='add'>+		goto wrap_around;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	if (sbi-&gt;s_mb_stats)</div><div class='add'>+		atomic64_inc(&amp;sbi-&gt;s_bal_cX_failed[ac-&gt;ac_criteria]);</div><div class='add'>+	/*</div><div class='add'>+	 * CR_BEST_AVAIL_LEN works based on the concept that we have</div><div class='add'>+	 * a larger normalized goal len request which can be trimmed to</div><div class='add'>+	 * a smaller goal len such that it can still satisfy original</div><div class='add'>+	 * request len. However, allocation request for non-regular</div><div class='add'>+	 * files never gets normalized.</div><div class='add'>+	 * See function ext4_mb_normalize_request() (EXT4_MB_HINT_DATA).</div><div class='add'>+	 */</div><div class='add'>+	if (ac-&gt;ac_flags &amp; EXT4_MB_HINT_DATA)</div><div class='add'>+		ac-&gt;ac_criteria = CR_BEST_AVAIL_LEN;</div><div class='add'>+	else</div><div class='add'>+		ac-&gt;ac_criteria = CR_GOAL_LEN_SLOW;</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Choose next group by traversing average fragment size tree. Updates *new_cr</div><div class='del'>- * if cr lvel needs an update. Sets EXT4_MB_SEARCH_NEXT_LINEAR to indicate that</div><div class='del'>- * the linear search should continue for one iteration since there's lock</div><div class='del'>- * contention on the rb tree lock.</div><div class='add'>+ * We couldn't find a group in CR_GOAL_LEN_FAST so try to find the highest free fragment</div><div class='add'>+ * order we have and proactively trim the goal request length to that order to</div><div class='add'>+ * find a suitable group faster.</div><div class='add'>+ *</div><div class='add'>+ * This optimizes allocation speed at the cost of slightly reduced</div><div class='add'>+ * preallocations. However, we make sure that we don't trim the request too</div><div class='add'>+ * much and fall to CR_GOAL_LEN_SLOW in that case.</div><div class='ctx'>  */</div><div class='del'>-static void ext4_mb_choose_next_group_cr1(struct ext4_allocation_context *ac,</div><div class='del'>-		int *new_cr, ext4_group_t *group, ext4_group_t ngroups)</div><div class='add'>+static int ext4_mb_scan_groups_best_avail(struct ext4_allocation_context *ac,</div><div class='add'>+					  ext4_group_t group)</div><div class='ctx'> {</div><div class='add'>+	int ret = 0;</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(ac-&gt;ac_sb);</div><div class='del'>-	int avg_fragment_size, best_so_far;</div><div class='del'>-	struct rb_node *node, *found;</div><div class='del'>-	struct ext4_group_info *grp;</div><div class='add'>+	int i, order, min_order;</div><div class='add'>+	unsigned long num_stripe_clusters = 0;</div><div class='add'>+	ext4_group_t start, end;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * If there is contention on the lock, instead of waiting for the lock</div><div class='del'>-	 * to become available, just continue searching lineraly. We'll resume</div><div class='del'>-	 * our rb tree search later starting at ac-&gt;ac_last_optimal_group.</div><div class='add'>+	 * mb_avg_fragment_size_order() returns order in a way that makes</div><div class='add'>+	 * retrieving back the length using (1 &lt;&lt; order) inaccurate. Hence, use</div><div class='add'>+	 * fls() instead since we need to know the actual length while modifying</div><div class='add'>+	 * goal length.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!read_trylock(&amp;sbi-&gt;s_mb_rb_lock)) {</div><div class='del'>-		ac-&gt;ac_flags |= EXT4_MB_SEARCH_NEXT_LINEAR;</div><div class='del'>-		return;</div><div class='add'>+	order = fls(ac-&gt;ac_g_ex.fe_len) - 1;</div><div class='add'>+	if (WARN_ON_ONCE(order - 1 &gt; MB_NUM_ORDERS(ac-&gt;ac_sb)))</div><div class='add'>+		order = MB_NUM_ORDERS(ac-&gt;ac_sb);</div><div class='add'>+	min_order = order - sbi-&gt;s_mb_best_avail_max_trim_order;</div><div class='add'>+	if (min_order &lt; 0)</div><div class='add'>+		min_order = 0;</div><div class='add'>+</div><div class='add'>+	if (sbi-&gt;s_stripe &gt; 0) {</div><div class='add'>+		/*</div><div class='add'>+		 * We are assuming that stripe size is always a multiple of</div><div class='add'>+		 * cluster ratio otherwise __ext4_fill_super exists early.</div><div class='add'>+		 */</div><div class='add'>+		num_stripe_clusters = EXT4_NUM_B2C(sbi, sbi-&gt;s_stripe);</div><div class='add'>+		if (1 &lt;&lt; min_order &lt; num_stripe_clusters)</div><div class='add'>+			/*</div><div class='add'>+			 * We consider 1 order less because later we round</div><div class='add'>+			 * up the goal len to num_stripe_clusters</div><div class='add'>+			 */</div><div class='add'>+			min_order = fls(num_stripe_clusters) - 1;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ac-&gt;ac_flags &amp; EXT4_MB_CR1_OPTIMIZED)) {</div><div class='del'>-		if (sbi-&gt;s_mb_stats)</div><div class='del'>-			atomic_inc(&amp;sbi-&gt;s_bal_cr1_bad_suggestions);</div><div class='del'>-		/* We have found something at CR 1 in the past */</div><div class='del'>-		grp = ext4_get_group_info(ac-&gt;ac_sb, ac-&gt;ac_last_optimal_group);</div><div class='del'>-		for (found = rb_next(&amp;grp-&gt;bb_avg_fragment_size_rb); found != NULL;</div><div class='del'>-		     found = rb_next(found)) {</div><div class='del'>-			grp = rb_entry(found, struct ext4_group_info,</div><div class='del'>-				       bb_avg_fragment_size_rb);</div><div class='del'>-			if (sbi-&gt;s_mb_stats)</div><div class='del'>-				atomic64_inc(&amp;sbi-&gt;s_bal_cX_groups_considered[1]);</div><div class='del'>-			if (likely(ext4_mb_good_group(ac, grp-&gt;bb_group, 1)))</div><div class='del'>-				break;</div><div class='del'>-		}</div><div class='del'>-		goto done;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	node = sbi-&gt;s_mb_avg_fragment_size_root.rb_node;</div><div class='del'>-	best_so_far = 0;</div><div class='del'>-	found = NULL;</div><div class='del'>-</div><div class='del'>-	while (node) {</div><div class='del'>-		grp = rb_entry(node, struct ext4_group_info,</div><div class='del'>-			       bb_avg_fragment_size_rb);</div><div class='del'>-		avg_fragment_size = 0;</div><div class='del'>-		if (ext4_mb_good_group(ac, grp-&gt;bb_group, 1)) {</div><div class='del'>-			avg_fragment_size = grp-&gt;bb_fragments ?</div><div class='del'>-				grp-&gt;bb_free / grp-&gt;bb_fragments : 0;</div><div class='del'>-			if (!best_so_far || avg_fragment_size &lt; best_so_far) {</div><div class='del'>-				best_so_far = avg_fragment_size;</div><div class='del'>-				found = node;</div><div class='del'>-			}</div><div class='add'>+	if (1 &lt;&lt; min_order &lt; ac-&gt;ac_o_ex.fe_len)</div><div class='add'>+		min_order = fls(ac-&gt;ac_o_ex.fe_len);</div><div class='add'>+</div><div class='add'>+	start = group;</div><div class='add'>+	end = ext4_get_groups_count(ac-&gt;ac_sb);</div><div class='add'>+wrap_around:</div><div class='add'>+	for (i = order; i &gt;= min_order; i--) {</div><div class='add'>+		int frag_order;</div><div class='add'>+		/*</div><div class='add'>+		 * Scale down goal len to make sure we find something</div><div class='add'>+		 * in the free fragments list. Basically, reduce</div><div class='add'>+		 * preallocations.</div><div class='add'>+		 */</div><div class='add'>+		ac-&gt;ac_g_ex.fe_len = 1 &lt;&lt; i;</div><div class='add'>+</div><div class='add'>+		if (num_stripe_clusters &gt; 0) {</div><div class='add'>+			/*</div><div class='add'>+			 * Try to round up the adjusted goal length to</div><div class='add'>+			 * stripe size (in cluster units) multiple for</div><div class='add'>+			 * efficiency.</div><div class='add'>+			 */</div><div class='add'>+			ac-&gt;ac_g_ex.fe_len = roundup(ac-&gt;ac_g_ex.fe_len,</div><div class='add'>+						     num_stripe_clusters);</div><div class='ctx'> 		}</div><div class='del'>-		if (avg_fragment_size &gt; ac-&gt;ac_g_ex.fe_len)</div><div class='del'>-			node = node-&gt;rb_right;</div><div class='del'>-		else</div><div class='del'>-			node = node-&gt;rb_left;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-done:</div><div class='del'>-	if (found) {</div><div class='del'>-		grp = rb_entry(found, struct ext4_group_info,</div><div class='del'>-			       bb_avg_fragment_size_rb);</div><div class='del'>-		*group = grp-&gt;bb_group;</div><div class='del'>-		ac-&gt;ac_flags |= EXT4_MB_CR1_OPTIMIZED;</div><div class='del'>-	} else {</div><div class='del'>-		*new_cr = 2;</div><div class='add'>+		frag_order = mb_avg_fragment_size_order(ac-&gt;ac_sb,</div><div class='add'>+							ac-&gt;ac_g_ex.fe_len);</div><div class='add'>+</div><div class='add'>+		ret = ext4_mb_scan_groups_avg_frag_order_range(ac, frag_order,</div><div class='add'>+							       start, end);</div><div class='add'>+		if (ret || ac-&gt;ac_status != AC_STATUS_CONTINUE)</div><div class='add'>+			return ret;</div><div class='ctx'> 	}</div><div class='add'>+	if (start) {</div><div class='add'>+		end = start;</div><div class='add'>+		start = 0;</div><div class='add'>+		goto wrap_around;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Reset goal length to original goal length before falling into CR_GOAL_LEN_SLOW */</div><div class='add'>+	ac-&gt;ac_g_ex.fe_len = ac-&gt;ac_orig_goal_len;</div><div class='add'>+	if (sbi-&gt;s_mb_stats)</div><div class='add'>+		atomic64_inc(&amp;sbi-&gt;s_bal_cX_failed[ac-&gt;ac_criteria]);</div><div class='add'>+	ac-&gt;ac_criteria = CR_GOAL_LEN_SLOW;</div><div class='ctx'> </div><div class='del'>-	read_unlock(&amp;sbi-&gt;s_mb_rb_lock);</div><div class='del'>-	ac-&gt;ac_last_optimal_group = *group;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int should_optimize_scan(struct ext4_allocation_context *ac)</div><div class='ctx'> {</div><div class='ctx'> 	if (unlikely(!test_opt2(ac-&gt;ac_sb, MB_OPTIMIZE_SCAN)))</div><div class='ctx'> 		return 0;</div><div class='del'>-	if (ac-&gt;ac_criteria &gt;= 2)</div><div class='add'>+	if (ac-&gt;ac_criteria &gt;= CR_GOAL_LEN_SLOW)</div><div class='ctx'> 		return 0;</div><div class='del'>-	if (ext4_test_inode_flag(ac-&gt;ac_inode, EXT4_INODE_EXTENTS))</div><div class='add'>+	if (!ext4_test_inode_flag(ac-&gt;ac_inode, EXT4_INODE_EXTENTS))</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	return 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Return next linear group for allocation. If linear traversal should not be</div><div class='del'>- * performed, this function just returns the same group</div><div class='add'>+ * next linear group for allocation.</div><div class='ctx'>  */</div><div class='del'>-static int</div><div class='del'>-next_linear_group(struct ext4_allocation_context *ac, int group, int ngroups)</div><div class='add'>+static void next_linear_group(ext4_group_t *group, ext4_group_t ngroups)</div><div class='ctx'> {</div><div class='del'>-	if (!should_optimize_scan(ac))</div><div class='del'>-		goto inc_and_return;</div><div class='del'>-</div><div class='del'>-	if (ac-&gt;ac_groups_linear_remaining) {</div><div class='del'>-		ac-&gt;ac_groups_linear_remaining--;</div><div class='del'>-		goto inc_and_return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (ac-&gt;ac_flags &amp; EXT4_MB_SEARCH_NEXT_LINEAR) {</div><div class='del'>-		ac-&gt;ac_flags &amp;= ~EXT4_MB_SEARCH_NEXT_LINEAR;</div><div class='del'>-		goto inc_and_return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return group;</div><div class='del'>-inc_and_return:</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Artificially restricted ngroups for non-extent</div><div class='ctx'> 	 * files makes group &gt; ngroups possible on first loop.</div><div class='ctx'> 	 */</div><div class='del'>-	return group + 1 &gt;= ngroups ? 0 : group + 1;</div><div class='add'>+	*group =  *group + 1 &gt;= ngroups ? 0 : *group + 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * ext4_mb_choose_next_group: choose next group for allocation.</div><div class='del'>- *</div><div class='del'>- * @ac        Allocation Context</div><div class='del'>- * @new_cr    This is an output parameter. If the there is no good group</div><div class='del'>- *            available at current CR level, this field is updated to indicate</div><div class='del'>- *            the new cr level that should be used.</div><div class='del'>- * @group     This is an input / output parameter. As an input it indicates the</div><div class='del'>- *            next group that the allocator intends to use for allocation. As</div><div class='del'>- *            output, this field indicates the next group that should be used as</div><div class='del'>- *            determined by the optimization functions.</div><div class='del'>- * @ngroups   Total number of groups</div><div class='del'>- */</div><div class='del'>-static void ext4_mb_choose_next_group(struct ext4_allocation_context *ac,</div><div class='del'>-		int *new_cr, ext4_group_t *group, ext4_group_t ngroups)</div><div class='add'>+static int ext4_mb_scan_groups_linear(struct ext4_allocation_context *ac,</div><div class='add'>+		ext4_group_t ngroups, ext4_group_t *start, ext4_group_t count)</div><div class='ctx'> {</div><div class='del'>-	*new_cr = ac-&gt;ac_criteria;</div><div class='add'>+	int ret, i;</div><div class='add'>+	enum criteria cr = ac-&gt;ac_criteria;</div><div class='add'>+	struct super_block *sb = ac-&gt;ac_sb;</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	ext4_group_t group = *start;</div><div class='ctx'> </div><div class='del'>-	if (!should_optimize_scan(ac) || ac-&gt;ac_groups_linear_remaining)</div><div class='del'>-		return;</div><div class='add'>+	for (i = 0; i &lt; count; i++, next_linear_group(&amp;group, ngroups)) {</div><div class='add'>+		ret = ext4_mb_scan_group(ac, group);</div><div class='add'>+		if (ret || ac-&gt;ac_status != AC_STATUS_CONTINUE)</div><div class='add'>+			return ret;</div><div class='add'>+		cond_resched();</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (*new_cr == 0) {</div><div class='del'>-		ext4_mb_choose_next_group_cr0(ac, new_cr, group, ngroups);</div><div class='del'>-	} else if (*new_cr == 1) {</div><div class='del'>-		ext4_mb_choose_next_group_cr1(ac, new_cr, group, ngroups);</div><div class='del'>-	} else {</div><div class='add'>+	*start = group;</div><div class='add'>+	if (count == ngroups)</div><div class='add'>+		ac-&gt;ac_criteria++;</div><div class='add'>+</div><div class='add'>+	/* Processed all groups and haven't found blocks */</div><div class='add'>+	if (sbi-&gt;s_mb_stats &amp;&amp; i == ngroups)</div><div class='add'>+		atomic64_inc(&amp;sbi-&gt;s_bal_cX_failed[cr]);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ext4_mb_scan_groups(struct ext4_allocation_context *ac)</div><div class='add'>+{</div><div class='add'>+	int ret = 0;</div><div class='add'>+	ext4_group_t start;</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(ac-&gt;ac_sb);</div><div class='add'>+	ext4_group_t ngroups = ext4_get_groups_count(ac-&gt;ac_sb);</div><div class='add'>+</div><div class='add'>+	/* non-extent files are limited to low blocks/groups */</div><div class='add'>+	if (!(ext4_test_inode_flag(ac-&gt;ac_inode, EXT4_INODE_EXTENTS)))</div><div class='add'>+		ngroups = sbi-&gt;s_blockfile_groups;</div><div class='add'>+</div><div class='add'>+	/* searching for the right group start from the goal value specified */</div><div class='add'>+	start = ac-&gt;ac_g_ex.fe_group;</div><div class='add'>+	ac-&gt;ac_prefetch_grp = start;</div><div class='add'>+	ac-&gt;ac_prefetch_nr = 0;</div><div class='add'>+</div><div class='add'>+	if (!should_optimize_scan(ac))</div><div class='add'>+		return ext4_mb_scan_groups_linear(ac, ngroups, &amp;start, ngroups);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Optimized scanning can return non adjacent groups which can cause</div><div class='add'>+	 * seek overhead for rotational disks. So try few linear groups before</div><div class='add'>+	 * trying optimized scan.</div><div class='add'>+	 */</div><div class='add'>+	if (sbi-&gt;s_mb_max_linear_groups)</div><div class='add'>+		ret = ext4_mb_scan_groups_linear(ac, ngroups, &amp;start,</div><div class='add'>+						 sbi-&gt;s_mb_max_linear_groups);</div><div class='add'>+	if (ret || ac-&gt;ac_status != AC_STATUS_CONTINUE)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	switch (ac-&gt;ac_criteria) {</div><div class='add'>+	case CR_POWER2_ALIGNED:</div><div class='add'>+		return ext4_mb_scan_groups_p2_aligned(ac, start);</div><div class='add'>+	case CR_GOAL_LEN_FAST:</div><div class='add'>+		return ext4_mb_scan_groups_goal_fast(ac, start);</div><div class='add'>+	case CR_BEST_AVAIL_LEN:</div><div class='add'>+		return ext4_mb_scan_groups_best_avail(ac, start);</div><div class='add'>+	default:</div><div class='ctx'> 		/*</div><div class='del'>-		 * TODO: For CR=2, we can arrange groups in an rb tree sorted by</div><div class='del'>-		 * bb_free. But until that happens, we should never come here.</div><div class='add'>+		 * TODO: For CR_GOAL_LEN_SLOW, we can arrange groups in an</div><div class='add'>+		 * rb tree sorted by bb_free. But until that happens, we should</div><div class='add'>+		 * never come here.</div><div class='ctx'> 		 */</div><div class='ctx'> 		WARN_ON(1);</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1076,39 +1234,43 @@ static void</div><div class='ctx'> mb_set_largest_free_order(struct super_block *sb, struct ext4_group_info *grp)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	if (test_opt2(sb, MB_OPTIMIZE_SCAN) &amp;&amp; grp-&gt;bb_largest_free_order &gt;= 0) {</div><div class='del'>-		write_lock(&amp;sbi-&gt;s_mb_largest_free_orders_locks[</div><div class='del'>-					      grp-&gt;bb_largest_free_order]);</div><div class='del'>-		list_del_init(&amp;grp-&gt;bb_largest_free_order_node);</div><div class='del'>-		write_unlock(&amp;sbi-&gt;s_mb_largest_free_orders_locks[</div><div class='del'>-					      grp-&gt;bb_largest_free_order]);</div><div class='del'>-	}</div><div class='del'>-	grp-&gt;bb_largest_free_order = -1; /* uninit */</div><div class='add'>+	int new, old = grp-&gt;bb_largest_free_order;</div><div class='ctx'> </div><div class='del'>-	for (i = MB_NUM_ORDERS(sb) - 1; i &gt;= 0; i--) {</div><div class='del'>-		if (grp-&gt;bb_counters[i] &gt; 0) {</div><div class='del'>-			grp-&gt;bb_largest_free_order = i;</div><div class='add'>+	for (new = MB_NUM_ORDERS(sb) - 1; new &gt;= 0; new--)</div><div class='add'>+		if (grp-&gt;bb_counters[new] &gt; 0)</div><div class='ctx'> 			break;</div><div class='del'>-		}</div><div class='add'>+</div><div class='add'>+	/* No need to move between order lists? */</div><div class='add'>+	if (new == old)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (old &gt;= 0) {</div><div class='add'>+		struct xarray *xa = &amp;sbi-&gt;s_mb_largest_free_orders[old];</div><div class='add'>+</div><div class='add'>+		if (!xa_empty(xa) &amp;&amp; xa_load(xa, grp-&gt;bb_group))</div><div class='add'>+			xa_erase(xa, grp-&gt;bb_group);</div><div class='ctx'> 	}</div><div class='del'>-	if (test_opt2(sb, MB_OPTIMIZE_SCAN) &amp;&amp;</div><div class='del'>-	    grp-&gt;bb_largest_free_order &gt;= 0 &amp;&amp; grp-&gt;bb_free) {</div><div class='del'>-		write_lock(&amp;sbi-&gt;s_mb_largest_free_orders_locks[</div><div class='del'>-					      grp-&gt;bb_largest_free_order]);</div><div class='del'>-		list_add_tail(&amp;grp-&gt;bb_largest_free_order_node,</div><div class='del'>-		      &amp;sbi-&gt;s_mb_largest_free_orders[grp-&gt;bb_largest_free_order]);</div><div class='del'>-		write_unlock(&amp;sbi-&gt;s_mb_largest_free_orders_locks[</div><div class='del'>-					      grp-&gt;bb_largest_free_order]);</div><div class='add'>+</div><div class='add'>+	grp-&gt;bb_largest_free_order = new;</div><div class='add'>+	if (test_opt2(sb, MB_OPTIMIZE_SCAN) &amp;&amp; new &gt;= 0 &amp;&amp; grp-&gt;bb_free) {</div><div class='add'>+		/*</div><div class='add'>+		 * Cannot use __GFP_NOFAIL because we hold the group lock.</div><div class='add'>+		 * Although allocation for insertion may fails, it's not fatal</div><div class='add'>+		 * as we have linear traversal to fall back on.</div><div class='add'>+		 */</div><div class='add'>+		int err = xa_insert(&amp;sbi-&gt;s_mb_largest_free_orders[new],</div><div class='add'>+				    grp-&gt;bb_group, grp, GFP_ATOMIC);</div><div class='add'>+		if (err)</div><div class='add'>+			mb_debug(sb, "insert group: %u to s_mb_largest_free_orders[%d] failed, err %d",</div><div class='add'>+				 grp-&gt;bb_group, new, err);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static noinline_for_stack</div><div class='ctx'> void ext4_mb_generate_buddy(struct super_block *sb,</div><div class='del'>-				void *buddy, void *bitmap, ext4_group_t group)</div><div class='add'>+			    void *buddy, void *bitmap, ext4_group_t group,</div><div class='add'>+			    struct ext4_group_info *grp)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_group_info *grp = ext4_get_group_info(sb, group);</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> 	ext4_grpblk_t max = EXT4_CLUSTERS_PER_GROUP(sb);</div><div class='ctx'> 	ext4_grpblk_t i = 0;</div><div class='hunk'>@@ -1151,13 +1313,31 @@ void ext4_mb_generate_buddy(struct super_block *sb,</div><div class='ctx'> 					EXT4_GROUP_INFO_BBITMAP_CORRUPT);</div><div class='ctx'> 	}</div><div class='ctx'> 	mb_set_largest_free_order(sb, grp);</div><div class='add'>+	mb_update_avg_fragment_size(sb, grp);</div><div class='ctx'> </div><div class='ctx'> 	clear_bit(EXT4_GROUP_INFO_NEED_INIT_BIT, &amp;(grp-&gt;bb_state));</div><div class='ctx'> </div><div class='ctx'> 	period = get_cycles() - period;</div><div class='ctx'> 	atomic_inc(&amp;sbi-&gt;s_mb_buddies_generated);</div><div class='ctx'> 	atomic64_add(period, &amp;sbi-&gt;s_mb_generation_time);</div><div class='del'>-	mb_update_avg_fragment_size(sb, grp);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void mb_regenerate_buddy(struct ext4_buddy *e4b)</div><div class='add'>+{</div><div class='add'>+	int count;</div><div class='add'>+	int order = 1;</div><div class='add'>+	void *buddy;</div><div class='add'>+</div><div class='add'>+	while ((buddy = mb_find_buddy(e4b, order++, &amp;count)))</div><div class='add'>+		mb_set_bits(buddy, 0, count);</div><div class='add'>+</div><div class='add'>+	e4b-&gt;bd_info-&gt;bb_fragments = 0;</div><div class='add'>+	memset(e4b-&gt;bd_info-&gt;bb_counters, 0,</div><div class='add'>+		sizeof(*e4b-&gt;bd_info-&gt;bb_counters) *</div><div class='add'>+		(e4b-&gt;bd_sb-&gt;s_blocksize_bits + 2));</div><div class='add'>+</div><div class='add'>+	ext4_mb_generate_buddy(e4b-&gt;bd_sb, e4b-&gt;bd_buddy,</div><div class='add'>+		e4b-&gt;bd_bitmap, e4b-&gt;bd_group, e4b-&gt;bd_info);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* The buddy information is attached the buddy cache inode</div><div class='hunk'>@@ -1166,26 +1346,25 @@ void ext4_mb_generate_buddy(struct super_block *sb,</div><div class='ctx'>  * block bitmap and buddy information. The information are</div><div class='ctx'>  * stored in the inode as</div><div class='ctx'>  *</div><div class='del'>- * {                        page                        }</div><div class='add'>+ * {                        folio                        }</div><div class='ctx'>  * [ group 0 bitmap][ group 0 buddy] [group 1][ group 1]...</div><div class='ctx'>  *</div><div class='ctx'>  *</div><div class='ctx'>  * one block each for bitmap and buddy information.</div><div class='del'>- * So for each group we take up 2 blocks. A page can</div><div class='del'>- * contain blocks_per_page (PAGE_SIZE / blocksize)  blocks.</div><div class='del'>- * So it can have information regarding groups_per_page which</div><div class='del'>- * is blocks_per_page/2</div><div class='add'>+ * So for each group we take up 2 blocks. A folio can</div><div class='add'>+ * contain blocks_per_folio (folio_size / blocksize)  blocks.</div><div class='add'>+ * So it can have information regarding groups_per_folio which</div><div class='add'>+ * is blocks_per_folio/2</div><div class='ctx'>  *</div><div class='ctx'>  * Locking note:  This routine takes the block group lock of all groups</div><div class='del'>- * for this page; do not hold this lock when calling this routine!</div><div class='add'>+ * for this folio; do not hold this lock when calling this routine!</div><div class='ctx'>  */</div><div class='del'>-</div><div class='del'>-static int ext4_mb_init_cache(struct page *page, char *incore, gfp_t gfp)</div><div class='add'>+static int ext4_mb_init_cache(struct folio *folio, char *incore, gfp_t gfp)</div><div class='ctx'> {</div><div class='ctx'> 	ext4_group_t ngroups;</div><div class='del'>-	int blocksize;</div><div class='del'>-	int blocks_per_page;</div><div class='del'>-	int groups_per_page;</div><div class='add'>+	unsigned int blocksize;</div><div class='add'>+	int blocks_per_folio;</div><div class='add'>+	int groups_per_folio;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> 	int i;</div><div class='ctx'> 	ext4_group_t first_group, group;</div><div class='hunk'>@@ -1198,44 +1377,42 @@ static int ext4_mb_init_cache(struct page *page, char *incore, gfp_t gfp)</div><div class='ctx'> 	char *bitmap;</div><div class='ctx'> 	struct ext4_group_info *grinfo;</div><div class='ctx'> </div><div class='del'>-	inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	sb = inode-&gt;i_sb;</div><div class='ctx'> 	ngroups = ext4_get_groups_count(sb);</div><div class='ctx'> 	blocksize = i_blocksize(inode);</div><div class='del'>-	blocks_per_page = PAGE_SIZE / blocksize;</div><div class='del'>-</div><div class='del'>-	mb_debug(sb, "init page %lu\n", page-&gt;index);</div><div class='add'>+	blocks_per_folio = folio_size(folio) / blocksize;</div><div class='add'>+	WARN_ON_ONCE(!blocks_per_folio);</div><div class='add'>+	groups_per_folio = DIV_ROUND_UP(blocks_per_folio, 2);</div><div class='ctx'> </div><div class='del'>-	groups_per_page = blocks_per_page &gt;&gt; 1;</div><div class='del'>-	if (groups_per_page == 0)</div><div class='del'>-		groups_per_page = 1;</div><div class='add'>+	mb_debug(sb, "init folio %lu\n", folio-&gt;index);</div><div class='ctx'> </div><div class='ctx'> 	/* allocate buffer_heads to read bitmaps */</div><div class='del'>-	if (groups_per_page &gt; 1) {</div><div class='del'>-		i = sizeof(struct buffer_head *) * groups_per_page;</div><div class='add'>+	if (groups_per_folio &gt; 1) {</div><div class='add'>+		i = sizeof(struct buffer_head *) * groups_per_folio;</div><div class='ctx'> 		bh = kzalloc(i, gfp);</div><div class='del'>-		if (bh == NULL) {</div><div class='del'>-			err = -ENOMEM;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+		if (bh == NULL)</div><div class='add'>+			return -ENOMEM;</div><div class='ctx'> 	} else</div><div class='ctx'> 		bh = &amp;bhs;</div><div class='ctx'> </div><div class='del'>-	first_group = page-&gt;index * blocks_per_page / 2;</div><div class='del'>-</div><div class='del'>-	/* read all groups the page covers into the cache */</div><div class='del'>-	for (i = 0, group = first_group; i &lt; groups_per_page; i++, group++) {</div><div class='add'>+	/* read all groups the folio covers into the cache */</div><div class='add'>+	first_group = EXT4_PG_TO_LBLK(inode, folio-&gt;index) / 2;</div><div class='add'>+	for (i = 0, group = first_group; i &lt; groups_per_folio; i++, group++) {</div><div class='ctx'> 		if (group &gt;= ngroups)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='ctx'> 		grinfo = ext4_get_group_info(sb, group);</div><div class='add'>+		if (!grinfo)</div><div class='add'>+			continue;</div><div class='ctx'> 		/*</div><div class='del'>-		 * If page is uptodate then we came here after online resize</div><div class='add'>+		 * If folio is uptodate then we came here after online resize</div><div class='ctx'> 		 * which added some new uninitialized group info structs, so</div><div class='del'>-		 * we must skip all initialized uptodate buddies on the page,</div><div class='add'>+		 * we must skip all initialized uptodate buddies on the folio,</div><div class='ctx'> 		 * which may be currently in use by an allocating task.</div><div class='ctx'> 		 */</div><div class='del'>-		if (PageUptodate(page) &amp;&amp; !EXT4_MB_GRP_NEED_INIT(grinfo)) {</div><div class='add'>+		if (folio_test_uptodate(folio) &amp;&amp;</div><div class='add'>+				!EXT4_MB_GRP_NEED_INIT(grinfo)) {</div><div class='ctx'> 			bh[i] = NULL;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1249,7 +1426,7 @@ static int ext4_mb_init_cache(struct page *page, char *incore, gfp_t gfp)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* wait for I/O completion */</div><div class='del'>-	for (i = 0, group = first_group; i &lt; groups_per_page; i++, group++) {</div><div class='add'>+	for (i = 0, group = first_group; i &lt; groups_per_folio; i++, group++) {</div><div class='ctx'> 		int err2;</div><div class='ctx'> </div><div class='ctx'> 		if (!bh[i])</div><div class='hunk'>@@ -1259,8 +1436,8 @@ static int ext4_mb_init_cache(struct page *page, char *incore, gfp_t gfp)</div><div class='ctx'> 			err = err2;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	first_block = page-&gt;index * blocks_per_page;</div><div class='del'>-	for (i = 0; i &lt; blocks_per_page; i++) {</div><div class='add'>+	first_block = EXT4_PG_TO_LBLK(inode, folio-&gt;index);</div><div class='add'>+	for (i = 0; i &lt; blocks_per_folio; i++) {</div><div class='ctx'> 		group = (first_block + i) &gt;&gt; 1;</div><div class='ctx'> 		if (group &gt;= ngroups)</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -1280,20 +1457,24 @@ static int ext4_mb_init_cache(struct page *page, char *incore, gfp_t gfp)</div><div class='ctx'> 		 * above</div><div class='ctx'> 		 *</div><div class='ctx'> 		 */</div><div class='del'>-		data = page_address(page) + (i * blocksize);</div><div class='add'>+		data = folio_address(folio) + (i * blocksize);</div><div class='ctx'> 		bitmap = bh[group - first_group]-&gt;b_data;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We place the buddy block and bitmap block</div><div class='ctx'> 		 * close together</div><div class='ctx'> 		 */</div><div class='add'>+		grinfo = ext4_get_group_info(sb, group);</div><div class='add'>+		if (!grinfo) {</div><div class='add'>+			err = -EFSCORRUPTED;</div><div class='add'>+		        goto out;</div><div class='add'>+		}</div><div class='ctx'> 		if ((first_block + i) &amp; 1) {</div><div class='ctx'> 			/* this is block of buddy */</div><div class='ctx'> 			BUG_ON(incore == NULL);</div><div class='del'>-			mb_debug(sb, "put buddy for group %u in page %lu/%x\n",</div><div class='del'>-				group, page-&gt;index, i * blocksize);</div><div class='add'>+			mb_debug(sb, "put buddy for group %u in folio %lu/%x\n",</div><div class='add'>+				group, folio-&gt;index, i * blocksize);</div><div class='ctx'> 			trace_ext4_mb_buddy_bitmap_load(sb, group);</div><div class='del'>-			grinfo = ext4_get_group_info(sb, group);</div><div class='ctx'> 			grinfo-&gt;bb_fragments = 0;</div><div class='ctx'> 			memset(grinfo-&gt;bb_counters, 0,</div><div class='ctx'> 			       sizeof(*grinfo-&gt;bb_counters) *</div><div class='hunk'>@@ -1304,14 +1485,14 @@ static int ext4_mb_init_cache(struct page *page, char *incore, gfp_t gfp)</div><div class='ctx'> 			ext4_lock_group(sb, group);</div><div class='ctx'> 			/* init the buddy */</div><div class='ctx'> 			memset(data, 0xff, blocksize);</div><div class='del'>-			ext4_mb_generate_buddy(sb, data, incore, group);</div><div class='add'>+			ext4_mb_generate_buddy(sb, data, incore, group, grinfo);</div><div class='ctx'> 			ext4_unlock_group(sb, group);</div><div class='ctx'> 			incore = NULL;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			/* this is block of bitmap */</div><div class='ctx'> 			BUG_ON(incore != NULL);</div><div class='del'>-			mb_debug(sb, "put bitmap for group %u in page %lu/%x\n",</div><div class='del'>-				group, page-&gt;index, i * blocksize);</div><div class='add'>+			mb_debug(sb, "put bitmap for group %u in folio %lu/%x\n",</div><div class='add'>+				group, folio-&gt;index, i * blocksize);</div><div class='ctx'> 			trace_ext4_mb_bitmap_load(sb, group);</div><div class='ctx'> </div><div class='ctx'> 			/* see comments in ext4_mb_put_pa() */</div><div class='hunk'>@@ -1320,7 +1501,7 @@ static int ext4_mb_init_cache(struct page *page, char *incore, gfp_t gfp)</div><div class='ctx'> </div><div class='ctx'> 			/* mark all preallocated blks used in in-core bitmap */</div><div class='ctx'> 			ext4_mb_generate_from_pa(sb, data, group);</div><div class='del'>-			ext4_mb_generate_from_freelist(sb, data, group);</div><div class='add'>+			WARN_ON_ONCE(!RB_EMPTY_ROOT(&amp;grinfo-&gt;bb_free_root));</div><div class='ctx'> 			ext4_unlock_group(sb, group);</div><div class='ctx'> </div><div class='ctx'> 			/* set incore so that the buddy information can be</div><div class='hunk'>@@ -1329,11 +1510,11 @@ static int ext4_mb_init_cache(struct page *page, char *incore, gfp_t gfp)</div><div class='ctx'> 			incore = data;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	SetPageUptodate(page);</div><div class='add'>+	folio_mark_uptodate(folio);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	if (bh) {</div><div class='del'>-		for (i = 0; i &lt; groups_per_page; i++)</div><div class='add'>+		for (i = 0; i &lt; groups_per_folio; i++)</div><div class='ctx'> 			brelse(bh[i]);</div><div class='ctx'> 		if (bh != &amp;bhs)</div><div class='ctx'> 			kfree(bh);</div><div class='hunk'>@@ -1342,68 +1523,71 @@ out:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Lock the buddy and bitmap pages. This make sure other parallel init_group</div><div class='del'>- * on the same buddy page doesn't happen whild holding the buddy page lock.</div><div class='del'>- * Return locked buddy and bitmap pages on e4b struct. If buddy and bitmap</div><div class='del'>- * are on the same page e4b-&gt;bd_buddy_page is NULL and return value is 0.</div><div class='add'>+ * Lock the buddy and bitmap folios. This makes sure other parallel init_group</div><div class='add'>+ * on the same buddy folio doesn't happen while holding the buddy folio lock.</div><div class='add'>+ * Return locked buddy and bitmap folios on e4b struct. If buddy and bitmap</div><div class='add'>+ * are on the same folio e4b-&gt;bd_buddy_folio is NULL and return value is 0.</div><div class='ctx'>  */</div><div class='del'>-static int ext4_mb_get_buddy_page_lock(struct super_block *sb,</div><div class='add'>+static int ext4_mb_get_buddy_folio_lock(struct super_block *sb,</div><div class='ctx'> 		ext4_group_t group, struct ext4_buddy *e4b, gfp_t gfp)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = EXT4_SB(sb)-&gt;s_buddy_cache;</div><div class='del'>-	int block, pnum, poff;</div><div class='del'>-	int blocks_per_page;</div><div class='del'>-	struct page *page;</div><div class='add'>+	int block, pnum;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> </div><div class='del'>-	e4b-&gt;bd_buddy_page = NULL;</div><div class='del'>-	e4b-&gt;bd_bitmap_page = NULL;</div><div class='add'>+	e4b-&gt;bd_buddy_folio = NULL;</div><div class='add'>+	e4b-&gt;bd_bitmap_folio = NULL;</div><div class='ctx'> </div><div class='del'>-	blocks_per_page = PAGE_SIZE / sb-&gt;s_blocksize;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * the buddy cache inode stores the block bitmap</div><div class='ctx'> 	 * and buddy information in consecutive blocks.</div><div class='ctx'> 	 * So for each group we need two blocks.</div><div class='ctx'> 	 */</div><div class='ctx'> 	block = group * 2;</div><div class='del'>-	pnum = block / blocks_per_page;</div><div class='del'>-	poff = block % blocks_per_page;</div><div class='del'>-	page = find_or_create_page(inode-&gt;i_mapping, pnum, gfp);</div><div class='del'>-	if (!page)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	BUG_ON(page-&gt;mapping != inode-&gt;i_mapping);</div><div class='del'>-	e4b-&gt;bd_bitmap_page = page;</div><div class='del'>-	e4b-&gt;bd_bitmap = page_address(page) + (poff * sb-&gt;s_blocksize);</div><div class='add'>+	pnum = EXT4_LBLK_TO_PG(inode, block);</div><div class='add'>+	folio = __filemap_get_folio(inode-&gt;i_mapping, pnum,</div><div class='add'>+			FGP_LOCK | FGP_ACCESSED | FGP_CREAT, gfp);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio);</div><div class='add'>+	BUG_ON(folio-&gt;mapping != inode-&gt;i_mapping);</div><div class='add'>+	WARN_ON_ONCE(folio_size(folio) &lt; sb-&gt;s_blocksize);</div><div class='add'>+	e4b-&gt;bd_bitmap_folio = folio;</div><div class='add'>+	e4b-&gt;bd_bitmap = folio_address(folio) +</div><div class='add'>+			 offset_in_folio(folio, EXT4_LBLK_TO_B(inode, block));</div><div class='ctx'> </div><div class='del'>-	if (blocks_per_page &gt;= 2) {</div><div class='del'>-		/* buddy and bitmap are on the same page */</div><div class='add'>+	block++;</div><div class='add'>+	pnum = EXT4_LBLK_TO_PG(inode, block);</div><div class='add'>+	if (folio_contains(folio, pnum)) {</div><div class='add'>+		/* buddy and bitmap are on the same folio */</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	block++;</div><div class='del'>-	pnum = block / blocks_per_page;</div><div class='del'>-	page = find_or_create_page(inode-&gt;i_mapping, pnum, gfp);</div><div class='del'>-	if (!page)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	BUG_ON(page-&gt;mapping != inode-&gt;i_mapping);</div><div class='del'>-	e4b-&gt;bd_buddy_page = page;</div><div class='add'>+	/* we need another folio for the buddy */</div><div class='add'>+	folio = __filemap_get_folio(inode-&gt;i_mapping, pnum,</div><div class='add'>+			FGP_LOCK | FGP_ACCESSED | FGP_CREAT, gfp);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio);</div><div class='add'>+	BUG_ON(folio-&gt;mapping != inode-&gt;i_mapping);</div><div class='add'>+	WARN_ON_ONCE(folio_size(folio) &lt; sb-&gt;s_blocksize);</div><div class='add'>+	e4b-&gt;bd_buddy_folio = folio;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void ext4_mb_put_buddy_page_lock(struct ext4_buddy *e4b)</div><div class='add'>+static void ext4_mb_put_buddy_folio_lock(struct ext4_buddy *e4b)</div><div class='ctx'> {</div><div class='del'>-	if (e4b-&gt;bd_bitmap_page) {</div><div class='del'>-		unlock_page(e4b-&gt;bd_bitmap_page);</div><div class='del'>-		put_page(e4b-&gt;bd_bitmap_page);</div><div class='add'>+	if (e4b-&gt;bd_bitmap_folio) {</div><div class='add'>+		folio_unlock(e4b-&gt;bd_bitmap_folio);</div><div class='add'>+		folio_put(e4b-&gt;bd_bitmap_folio);</div><div class='ctx'> 	}</div><div class='del'>-	if (e4b-&gt;bd_buddy_page) {</div><div class='del'>-		unlock_page(e4b-&gt;bd_buddy_page);</div><div class='del'>-		put_page(e4b-&gt;bd_buddy_page);</div><div class='add'>+	if (e4b-&gt;bd_buddy_folio) {</div><div class='add'>+		folio_unlock(e4b-&gt;bd_buddy_folio);</div><div class='add'>+		folio_put(e4b-&gt;bd_buddy_folio);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Locking note:  This routine calls ext4_mb_init_cache(), which takes the</div><div class='del'>- * block group lock of all groups for this page; do not hold the BG lock when</div><div class='add'>+ * block group lock of all groups for this folio; do not hold the BG lock when</div><div class='ctx'>  * calling this routine!</div><div class='ctx'>  */</div><div class='ctx'> static noinline_for_stack</div><div class='hunk'>@@ -1412,22 +1596,25 @@ int ext4_mb_init_group(struct super_block *sb, ext4_group_t group, gfp_t gfp)</div><div class='ctx'> </div><div class='ctx'> 	struct ext4_group_info *this_grp;</div><div class='ctx'> 	struct ext4_buddy e4b;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	might_sleep();</div><div class='ctx'> 	mb_debug(sb, "init group %u\n", group);</div><div class='ctx'> 	this_grp = ext4_get_group_info(sb, group);</div><div class='add'>+	if (!this_grp)</div><div class='add'>+		return -EFSCORRUPTED;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * This ensures that we don't reinit the buddy cache</div><div class='del'>-	 * page which map to the group from which we are already</div><div class='add'>+	 * folio which map to the group from which we are already</div><div class='ctx'> 	 * allocating. If we are looking at the buddy cache we would</div><div class='ctx'> 	 * have taken a reference using ext4_mb_load_buddy and that</div><div class='del'>-	 * would have pinned buddy page to page cache.</div><div class='del'>-	 * The call to ext4_mb_get_buddy_page_lock will mark the</div><div class='del'>-	 * page accessed.</div><div class='add'>+	 * would have pinned buddy folio to page cache.</div><div class='add'>+	 * The call to ext4_mb_get_buddy_folio_lock will mark the</div><div class='add'>+	 * folio accessed.</div><div class='ctx'> 	 */</div><div class='del'>-	ret = ext4_mb_get_buddy_page_lock(sb, group, &amp;e4b, gfp);</div><div class='add'>+	ret = ext4_mb_get_buddy_folio_lock(sb, group, &amp;e4b, gfp);</div><div class='ctx'> 	if (ret || !EXT4_MB_GRP_NEED_INIT(this_grp)) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * somebody initialized the group</div><div class='hunk'>@@ -1436,52 +1623,50 @@ int ext4_mb_init_group(struct super_block *sb, ext4_group_t group, gfp_t gfp)</div><div class='ctx'> 		goto err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	page = e4b.bd_bitmap_page;</div><div class='del'>-	ret = ext4_mb_init_cache(page, NULL, gfp);</div><div class='add'>+	folio = e4b.bd_bitmap_folio;</div><div class='add'>+	ret = ext4_mb_init_cache(folio, NULL, gfp);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto err;</div><div class='del'>-	if (!PageUptodate(page)) {</div><div class='add'>+	if (!folio_test_uptodate(folio)) {</div><div class='ctx'> 		ret = -EIO;</div><div class='ctx'> 		goto err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (e4b.bd_buddy_page == NULL) {</div><div class='add'>+	if (e4b.bd_buddy_folio == NULL) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * If both the bitmap and buddy are in</div><div class='del'>-		 * the same page we don't need to force</div><div class='add'>+		 * the same folio we don't need to force</div><div class='ctx'> 		 * init the buddy</div><div class='ctx'> 		 */</div><div class='ctx'> 		ret = 0;</div><div class='ctx'> 		goto err;</div><div class='ctx'> 	}</div><div class='ctx'> 	/* init buddy cache */</div><div class='del'>-	page = e4b.bd_buddy_page;</div><div class='del'>-	ret = ext4_mb_init_cache(page, e4b.bd_bitmap, gfp);</div><div class='add'>+	folio = e4b.bd_buddy_folio;</div><div class='add'>+	ret = ext4_mb_init_cache(folio, e4b.bd_bitmap, gfp);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto err;</div><div class='del'>-	if (!PageUptodate(page)) {</div><div class='add'>+	if (!folio_test_uptodate(folio)) {</div><div class='ctx'> 		ret = -EIO;</div><div class='ctx'> 		goto err;</div><div class='ctx'> 	}</div><div class='ctx'> err:</div><div class='del'>-	ext4_mb_put_buddy_page_lock(&amp;e4b);</div><div class='add'>+	ext4_mb_put_buddy_folio_lock(&amp;e4b);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Locking note:  This routine calls ext4_mb_init_cache(), which takes the</div><div class='del'>- * block group lock of all groups for this page; do not hold the BG lock when</div><div class='add'>+ * block group lock of all groups for this folio; do not hold the BG lock when</div><div class='ctx'>  * calling this routine!</div><div class='ctx'>  */</div><div class='ctx'> static noinline_for_stack int</div><div class='ctx'> ext4_mb_load_buddy_gfp(struct super_block *sb, ext4_group_t group,</div><div class='ctx'> 		       struct ext4_buddy *e4b, gfp_t gfp)</div><div class='ctx'> {</div><div class='del'>-	int blocks_per_page;</div><div class='ctx'> 	int block;</div><div class='ctx'> 	int pnum;</div><div class='del'>-	int poff;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct ext4_group_info *grp;</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='hunk'>@@ -1490,15 +1675,16 @@ ext4_mb_load_buddy_gfp(struct super_block *sb, ext4_group_t group,</div><div class='ctx'> 	might_sleep();</div><div class='ctx'> 	mb_debug(sb, "load group %u\n", group);</div><div class='ctx'> </div><div class='del'>-	blocks_per_page = PAGE_SIZE / sb-&gt;s_blocksize;</div><div class='ctx'> 	grp = ext4_get_group_info(sb, group);</div><div class='add'>+	if (!grp)</div><div class='add'>+		return -EFSCORRUPTED;</div><div class='ctx'> </div><div class='ctx'> 	e4b-&gt;bd_blkbits = sb-&gt;s_blocksize_bits;</div><div class='ctx'> 	e4b-&gt;bd_info = grp;</div><div class='ctx'> 	e4b-&gt;bd_sb = sb;</div><div class='ctx'> 	e4b-&gt;bd_group = group;</div><div class='del'>-	e4b-&gt;bd_buddy_page = NULL;</div><div class='del'>-	e4b-&gt;bd_bitmap_page = NULL;</div><div class='add'>+	e4b-&gt;bd_buddy_folio = NULL;</div><div class='add'>+	e4b-&gt;bd_bitmap_folio = NULL;</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(EXT4_MB_GRP_NEED_INIT(grp))) {</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -1516,95 +1702,115 @@ ext4_mb_load_buddy_gfp(struct super_block *sb, ext4_group_t group,</div><div class='ctx'> 	 * So for each group we need two blocks.</div><div class='ctx'> 	 */</div><div class='ctx'> 	block = group * 2;</div><div class='del'>-	pnum = block / blocks_per_page;</div><div class='del'>-	poff = block % blocks_per_page;</div><div class='del'>-</div><div class='del'>-	/* we could use find_or_create_page(), but it locks page</div><div class='del'>-	 * what we'd like to avoid in fast path ... */</div><div class='del'>-	page = find_get_page_flags(inode-&gt;i_mapping, pnum, FGP_ACCESSED);</div><div class='del'>-	if (page == NULL || !PageUptodate(page)) {</div><div class='del'>-		if (page)</div><div class='add'>+	pnum = EXT4_LBLK_TO_PG(inode, block);</div><div class='add'>+</div><div class='add'>+	/* Avoid locking the folio in the fast path ... */</div><div class='add'>+	folio = __filemap_get_folio(inode-&gt;i_mapping, pnum, FGP_ACCESSED, 0);</div><div class='add'>+	if (IS_ERR(folio) || !folio_test_uptodate(folio)) {</div><div class='add'>+		if (!IS_ERR(folio))</div><div class='ctx'> 			/*</div><div class='del'>-			 * drop the page reference and try</div><div class='del'>-			 * to get the page with lock. If we</div><div class='add'>+			 * drop the folio reference and try</div><div class='add'>+			 * to get the folio with lock. If we</div><div class='ctx'> 			 * are not uptodate that implies</div><div class='del'>-			 * somebody just created the page but</div><div class='del'>-			 * is yet to initialize the same. So</div><div class='add'>+			 * somebody just created the folio but</div><div class='add'>+			 * is yet to initialize it. So</div><div class='ctx'> 			 * wait for it to initialize.</div><div class='ctx'> 			 */</div><div class='del'>-			put_page(page);</div><div class='del'>-		page = find_or_create_page(inode-&gt;i_mapping, pnum, gfp);</div><div class='del'>-		if (page) {</div><div class='del'>-			BUG_ON(page-&gt;mapping != inode-&gt;i_mapping);</div><div class='del'>-			if (!PageUptodate(page)) {</div><div class='del'>-				ret = ext4_mb_init_cache(page, NULL, gfp);</div><div class='add'>+			folio_put(folio);</div><div class='add'>+		folio = __filemap_get_folio(inode-&gt;i_mapping, pnum,</div><div class='add'>+				FGP_LOCK | FGP_ACCESSED | FGP_CREAT, gfp);</div><div class='add'>+		if (!IS_ERR(folio)) {</div><div class='add'>+			if (WARN_RATELIMIT(folio-&gt;mapping != inode-&gt;i_mapping,</div><div class='add'>+	"ext4: bitmap's mapping != inode-&gt;i_mapping\n")) {</div><div class='add'>+				/* should never happen */</div><div class='add'>+				folio_unlock(folio);</div><div class='add'>+				ret = -EINVAL;</div><div class='add'>+				goto err;</div><div class='add'>+			}</div><div class='add'>+			if (!folio_test_uptodate(folio)) {</div><div class='add'>+				ret = ext4_mb_init_cache(folio, NULL, gfp);</div><div class='ctx'> 				if (ret) {</div><div class='del'>-					unlock_page(page);</div><div class='add'>+					folio_unlock(folio);</div><div class='ctx'> 					goto err;</div><div class='ctx'> 				}</div><div class='del'>-				mb_cmp_bitmaps(e4b, page_address(page) +</div><div class='del'>-					       (poff * sb-&gt;s_blocksize));</div><div class='add'>+				mb_cmp_bitmaps(e4b, folio_address(folio) +</div><div class='add'>+					offset_in_folio(folio,</div><div class='add'>+						EXT4_LBLK_TO_B(inode, block)));</div><div class='ctx'> 			}</div><div class='del'>-			unlock_page(page);</div><div class='add'>+			folio_unlock(folio);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	if (page == NULL) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='add'>+	if (IS_ERR(folio)) {</div><div class='add'>+		ret = PTR_ERR(folio);</div><div class='ctx'> 		goto err;</div><div class='ctx'> 	}</div><div class='del'>-	if (!PageUptodate(page)) {</div><div class='add'>+	if (!folio_test_uptodate(folio)) {</div><div class='ctx'> 		ret = -EIO;</div><div class='ctx'> 		goto err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Pages marked accessed already */</div><div class='del'>-	e4b-&gt;bd_bitmap_page = page;</div><div class='del'>-	e4b-&gt;bd_bitmap = page_address(page) + (poff * sb-&gt;s_blocksize);</div><div class='add'>+	/* Folios marked accessed already */</div><div class='add'>+	e4b-&gt;bd_bitmap_folio = folio;</div><div class='add'>+	e4b-&gt;bd_bitmap = folio_address(folio) +</div><div class='add'>+			 offset_in_folio(folio, EXT4_LBLK_TO_B(inode, block));</div><div class='ctx'> </div><div class='ctx'> 	block++;</div><div class='del'>-	pnum = block / blocks_per_page;</div><div class='del'>-	poff = block % blocks_per_page;</div><div class='del'>-</div><div class='del'>-	page = find_get_page_flags(inode-&gt;i_mapping, pnum, FGP_ACCESSED);</div><div class='del'>-	if (page == NULL || !PageUptodate(page)) {</div><div class='del'>-		if (page)</div><div class='del'>-			put_page(page);</div><div class='del'>-		page = find_or_create_page(inode-&gt;i_mapping, pnum, gfp);</div><div class='del'>-		if (page) {</div><div class='del'>-			BUG_ON(page-&gt;mapping != inode-&gt;i_mapping);</div><div class='del'>-			if (!PageUptodate(page)) {</div><div class='del'>-				ret = ext4_mb_init_cache(page, e4b-&gt;bd_bitmap,</div><div class='add'>+	pnum = EXT4_LBLK_TO_PG(inode, block);</div><div class='add'>+	/* buddy and bitmap are on the same folio? */</div><div class='add'>+	if (folio_contains(folio, pnum)) {</div><div class='add'>+		folio_get(folio);</div><div class='add'>+		goto update_buddy;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* we need another folio for the buddy */</div><div class='add'>+	folio = __filemap_get_folio(inode-&gt;i_mapping, pnum, FGP_ACCESSED, 0);</div><div class='add'>+	if (IS_ERR(folio) || !folio_test_uptodate(folio)) {</div><div class='add'>+		if (!IS_ERR(folio))</div><div class='add'>+			folio_put(folio);</div><div class='add'>+		folio = __filemap_get_folio(inode-&gt;i_mapping, pnum,</div><div class='add'>+				FGP_LOCK | FGP_ACCESSED | FGP_CREAT, gfp);</div><div class='add'>+		if (!IS_ERR(folio)) {</div><div class='add'>+			if (WARN_RATELIMIT(folio-&gt;mapping != inode-&gt;i_mapping,</div><div class='add'>+	"ext4: buddy bitmap's mapping != inode-&gt;i_mapping\n")) {</div><div class='add'>+				/* should never happen */</div><div class='add'>+				folio_unlock(folio);</div><div class='add'>+				ret = -EINVAL;</div><div class='add'>+				goto err;</div><div class='add'>+			}</div><div class='add'>+			if (!folio_test_uptodate(folio)) {</div><div class='add'>+				ret = ext4_mb_init_cache(folio, e4b-&gt;bd_bitmap,</div><div class='ctx'> 							 gfp);</div><div class='ctx'> 				if (ret) {</div><div class='del'>-					unlock_page(page);</div><div class='add'>+					folio_unlock(folio);</div><div class='ctx'> 					goto err;</div><div class='ctx'> 				}</div><div class='ctx'> 			}</div><div class='del'>-			unlock_page(page);</div><div class='add'>+			folio_unlock(folio);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	if (page == NULL) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='add'>+	if (IS_ERR(folio)) {</div><div class='add'>+		ret = PTR_ERR(folio);</div><div class='ctx'> 		goto err;</div><div class='ctx'> 	}</div><div class='del'>-	if (!PageUptodate(page)) {</div><div class='add'>+	if (!folio_test_uptodate(folio)) {</div><div class='ctx'> 		ret = -EIO;</div><div class='ctx'> 		goto err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Pages marked accessed already */</div><div class='del'>-	e4b-&gt;bd_buddy_page = page;</div><div class='del'>-	e4b-&gt;bd_buddy = page_address(page) + (poff * sb-&gt;s_blocksize);</div><div class='add'>+update_buddy:</div><div class='add'>+	/* Folios marked accessed already */</div><div class='add'>+	e4b-&gt;bd_buddy_folio = folio;</div><div class='add'>+	e4b-&gt;bd_buddy = folio_address(folio) +</div><div class='add'>+			offset_in_folio(folio, EXT4_LBLK_TO_B(inode, block));</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> err:</div><div class='del'>-	if (page)</div><div class='del'>-		put_page(page);</div><div class='del'>-	if (e4b-&gt;bd_bitmap_page)</div><div class='del'>-		put_page(e4b-&gt;bd_bitmap_page);</div><div class='del'>-	if (e4b-&gt;bd_buddy_page)</div><div class='del'>-		put_page(e4b-&gt;bd_buddy_page);</div><div class='add'>+	if (!IS_ERR_OR_NULL(folio))</div><div class='add'>+		folio_put(folio);</div><div class='add'>+	if (e4b-&gt;bd_bitmap_folio)</div><div class='add'>+		folio_put(e4b-&gt;bd_bitmap_folio);</div><div class='add'>+</div><div class='ctx'> 	e4b-&gt;bd_buddy = NULL;</div><div class='ctx'> 	e4b-&gt;bd_bitmap = NULL;</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -1618,10 +1824,10 @@ static int ext4_mb_load_buddy(struct super_block *sb, ext4_group_t group,</div><div class='ctx'> </div><div class='ctx'> static void ext4_mb_unload_buddy(struct ext4_buddy *e4b)</div><div class='ctx'> {</div><div class='del'>-	if (e4b-&gt;bd_bitmap_page)</div><div class='del'>-		put_page(e4b-&gt;bd_bitmap_page);</div><div class='del'>-	if (e4b-&gt;bd_buddy_page)</div><div class='del'>-		put_page(e4b-&gt;bd_buddy_page);</div><div class='add'>+	if (e4b-&gt;bd_bitmap_folio)</div><div class='add'>+		folio_put(e4b-&gt;bd_bitmap_folio);</div><div class='add'>+	if (e4b-&gt;bd_buddy_folio)</div><div class='add'>+		folio_put(e4b-&gt;bd_buddy_folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> </div><div class='hunk'>@@ -1689,7 +1895,7 @@ static int mb_test_and_clear_bits(void *bm, int cur, int len)</div><div class='ctx'> 	return zero_bit;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void ext4_set_bits(void *bm, int cur, int len)</div><div class='add'>+void mb_set_bits(void *bm, int cur, int len)</div><div class='ctx'> {</div><div class='ctx'> 	__u32 *addr;</div><div class='ctx'> </div><div class='hunk'>@@ -1767,7 +1973,8 @@ static void mb_buddy_mark_free(struct ext4_buddy *e4b, int first, int last)</div><div class='ctx'> 			break;</div><div class='ctx'> 		order++;</div><div class='ctx'> </div><div class='del'>-		if (first == last || !(buddy2 = mb_find_buddy(e4b, order, &amp;max))) {</div><div class='add'>+		buddy2 = mb_find_buddy(e4b, order, &amp;max);</div><div class='add'>+		if (!buddy2) {</div><div class='ctx'> 			mb_clear_bits(buddy, first, last - first + 1);</div><div class='ctx'> 			e4b-&gt;bd_info-&gt;bb_counters[order - 1] += last - first + 1;</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -1798,11 +2005,6 @@ static void mb_free_blocks(struct inode *inode, struct ext4_buddy *e4b,</div><div class='ctx'> 	mb_check_buddy(e4b);</div><div class='ctx'> 	mb_free_blocks_double(inode, e4b, first, count);</div><div class='ctx'> </div><div class='del'>-	this_cpu_inc(discard_pa_seq);</div><div class='del'>-	e4b-&gt;bd_info-&gt;bb_free += count;</div><div class='del'>-	if (first &lt; e4b-&gt;bd_info-&gt;bb_first_free)</div><div class='del'>-		e4b-&gt;bd_info-&gt;bb_first_free = first;</div><div class='del'>-</div><div class='ctx'> 	/* access memory sequentially: check left neighbour,</div><div class='ctx'> 	 * clear range and then check right neighbour</div><div class='ctx'> 	 */</div><div class='hunk'>@@ -1816,21 +2018,31 @@ static void mb_free_blocks(struct inode *inode, struct ext4_buddy *e4b,</div><div class='ctx'> 		struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> 		ext4_fsblk_t blocknr;</div><div class='ctx'> </div><div class='add'>+		/*</div><div class='add'>+		 * Fastcommit replay can free already freed blocks which</div><div class='add'>+		 * corrupts allocation info. Regenerate it.</div><div class='add'>+		 */</div><div class='add'>+		if (sbi-&gt;s_mount_state &amp; EXT4_FC_REPLAY) {</div><div class='add'>+			mb_regenerate_buddy(e4b);</div><div class='add'>+			goto check;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		blocknr = ext4_group_first_block_no(sb, e4b-&gt;bd_group);</div><div class='ctx'> 		blocknr += EXT4_C2B(sbi, block);</div><div class='del'>-		if (!(sbi-&gt;s_mount_state &amp; EXT4_FC_REPLAY)) {</div><div class='del'>-			ext4_grp_locked_error(sb, e4b-&gt;bd_group,</div><div class='del'>-					      inode ? inode-&gt;i_ino : 0,</div><div class='del'>-					      blocknr,</div><div class='del'>-					      "freeing already freed block (bit %u); block bitmap corrupt.",</div><div class='del'>-					      block);</div><div class='del'>-			ext4_mark_group_bitmap_corrupted(</div><div class='del'>-				sb, e4b-&gt;bd_group,</div><div class='add'>+		ext4_mark_group_bitmap_corrupted(sb, e4b-&gt;bd_group,</div><div class='ctx'> 				EXT4_GROUP_INFO_BBITMAP_CORRUPT);</div><div class='del'>-		}</div><div class='del'>-		goto done;</div><div class='add'>+		ext4_grp_locked_error(sb, e4b-&gt;bd_group,</div><div class='add'>+				      inode ? inode-&gt;i_ino : 0, blocknr,</div><div class='add'>+				      "freeing already freed block (bit %u); block bitmap corrupt.",</div><div class='add'>+				      block);</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	this_cpu_inc(discard_pa_seq);</div><div class='add'>+	e4b-&gt;bd_info-&gt;bb_free += count;</div><div class='add'>+	if (first &lt; e4b-&gt;bd_info-&gt;bb_first_free)</div><div class='add'>+		e4b-&gt;bd_info-&gt;bb_first_free = first;</div><div class='add'>+</div><div class='ctx'> 	/* let's maintain fragments counter */</div><div class='ctx'> 	if (left_is_free &amp;&amp; right_is_free)</div><div class='ctx'> 		e4b-&gt;bd_info-&gt;bb_fragments--;</div><div class='hunk'>@@ -1855,17 +2067,16 @@ static void mb_free_blocks(struct inode *inode, struct ext4_buddy *e4b,</div><div class='ctx'> 	if (first &lt;= last)</div><div class='ctx'> 		mb_buddy_mark_free(e4b, first &gt;&gt; 1, last &gt;&gt; 1);</div><div class='ctx'> </div><div class='del'>-done:</div><div class='ctx'> 	mb_set_largest_free_order(sb, e4b-&gt;bd_info);</div><div class='ctx'> 	mb_update_avg_fragment_size(sb, e4b-&gt;bd_info);</div><div class='add'>+check:</div><div class='ctx'> 	mb_check_buddy(e4b);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int mb_find_extent(struct ext4_buddy *e4b, int block,</div><div class='ctx'> 				int needed, struct ext4_free_extent *ex)</div><div class='ctx'> {</div><div class='del'>-	int next = block;</div><div class='del'>-	int max, order;</div><div class='add'>+	int max, order, next;</div><div class='ctx'> 	void *buddy;</div><div class='ctx'> </div><div class='ctx'> 	assert_spin_locked(ext4_group_lock_ptr(e4b-&gt;bd_sb, e4b-&gt;bd_group));</div><div class='hunk'>@@ -1883,16 +2094,12 @@ static int mb_find_extent(struct ext4_buddy *e4b, int block,</div><div class='ctx'> </div><div class='ctx'> 	/* find actual order */</div><div class='ctx'> 	order = mb_find_order_for_block(e4b, block);</div><div class='del'>-	block = block &gt;&gt; order;</div><div class='ctx'> </div><div class='del'>-	ex-&gt;fe_len = 1 &lt;&lt; order;</div><div class='del'>-	ex-&gt;fe_start = block &lt;&lt; order;</div><div class='add'>+	ex-&gt;fe_len = (1 &lt;&lt; order) - (block &amp; ((1 &lt;&lt; order) - 1));</div><div class='add'>+	ex-&gt;fe_start = block;</div><div class='ctx'> 	ex-&gt;fe_group = e4b-&gt;bd_group;</div><div class='ctx'> </div><div class='del'>-	/* calc difference from given start */</div><div class='del'>-	next = next - ex-&gt;fe_start;</div><div class='del'>-	ex-&gt;fe_len -= next;</div><div class='del'>-	ex-&gt;fe_start += next;</div><div class='add'>+	block = block &gt;&gt; order;</div><div class='ctx'> </div><div class='ctx'> 	while (needed &gt; ex-&gt;fe_len &amp;&amp;</div><div class='ctx'> 	       mb_find_buddy(e4b, order, &amp;max)) {</div><div class='hunk'>@@ -1930,12 +2137,12 @@ static int mb_mark_used(struct ext4_buddy *e4b, struct ext4_free_extent *ex)</div><div class='ctx'> 	int ord;</div><div class='ctx'> 	int mlen = 0;</div><div class='ctx'> 	int max = 0;</div><div class='del'>-	int cur;</div><div class='ctx'> 	int start = ex-&gt;fe_start;</div><div class='ctx'> 	int len = ex-&gt;fe_len;</div><div class='ctx'> 	unsigned ret = 0;</div><div class='ctx'> 	int len0 = len;</div><div class='ctx'> 	void *buddy;</div><div class='add'>+	int ord_start, ord_end;</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(start + len &gt; (e4b-&gt;bd_sb-&gt;s_blocksize &lt;&lt; 3));</div><div class='ctx'> 	BUG_ON(e4b-&gt;bd_group != ex-&gt;fe_group);</div><div class='hunk'>@@ -1979,24 +2186,34 @@ static int mb_mark_used(struct ext4_buddy *e4b, struct ext4_free_extent *ex)</div><div class='ctx'> 		if (ret == 0)</div><div class='ctx'> 			ret = len | (ord &lt;&lt; 16);</div><div class='ctx'> </div><div class='del'>-		/* we have to split large buddy */</div><div class='ctx'> 		BUG_ON(ord &lt;= 0);</div><div class='ctx'> 		buddy = mb_find_buddy(e4b, ord, &amp;max);</div><div class='ctx'> 		mb_set_bit(start &gt;&gt; ord, buddy);</div><div class='ctx'> 		e4b-&gt;bd_info-&gt;bb_counters[ord]--;</div><div class='ctx'> </div><div class='del'>-		ord--;</div><div class='del'>-		cur = (start &gt;&gt; ord) &amp; ~1U;</div><div class='del'>-		buddy = mb_find_buddy(e4b, ord, &amp;max);</div><div class='del'>-		mb_clear_bit(cur, buddy);</div><div class='del'>-		mb_clear_bit(cur + 1, buddy);</div><div class='del'>-		e4b-&gt;bd_info-&gt;bb_counters[ord]++;</div><div class='del'>-		e4b-&gt;bd_info-&gt;bb_counters[ord]++;</div><div class='add'>+		ord_start = (start &gt;&gt; ord) &lt;&lt; ord;</div><div class='add'>+		ord_end = ord_start + (1 &lt;&lt; ord);</div><div class='add'>+		/* first chunk */</div><div class='add'>+		if (start &gt; ord_start)</div><div class='add'>+			ext4_mb_mark_free_simple(e4b-&gt;bd_sb, e4b-&gt;bd_buddy,</div><div class='add'>+						 ord_start, start - ord_start,</div><div class='add'>+						 e4b-&gt;bd_info);</div><div class='add'>+</div><div class='add'>+		/* last chunk */</div><div class='add'>+		if (start + len &lt; ord_end) {</div><div class='add'>+			ext4_mb_mark_free_simple(e4b-&gt;bd_sb, e4b-&gt;bd_buddy,</div><div class='add'>+						 start + len,</div><div class='add'>+						 ord_end - (start + len),</div><div class='add'>+						 e4b-&gt;bd_info);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		len = start + len - ord_end;</div><div class='add'>+		start = ord_end;</div><div class='ctx'> 	}</div><div class='ctx'> 	mb_set_largest_free_order(e4b-&gt;bd_sb, e4b-&gt;bd_info);</div><div class='ctx'> </div><div class='ctx'> 	mb_update_avg_fragment_size(e4b-&gt;bd_sb, e4b-&gt;bd_info);</div><div class='del'>-	ext4_set_bits(e4b-&gt;bd_bitmap, ex-&gt;fe_start, len0);</div><div class='add'>+	mb_set_bits(e4b-&gt;bd_bitmap, ex-&gt;fe_start, len0);</div><div class='ctx'> 	mb_check_buddy(e4b);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -2027,23 +2244,23 @@ static void ext4_mb_use_best_found(struct ext4_allocation_context *ac,</div><div class='ctx'> 	ac-&gt;ac_buddy = ret &gt;&gt; 16;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * take the page reference. We want the page to be pinned</div><div class='add'>+	 * take the folio reference. We want the folio to be pinned</div><div class='ctx'> 	 * so that we don't get a ext4_mb_init_cache_call for this</div><div class='ctx'> 	 * group until we update the bitmap. That would mean we</div><div class='ctx'> 	 * double allocate blocks. The reference is dropped</div><div class='ctx'> 	 * in ext4_mb_release_context</div><div class='ctx'> 	 */</div><div class='del'>-	ac-&gt;ac_bitmap_page = e4b-&gt;bd_bitmap_page;</div><div class='del'>-	get_page(ac-&gt;ac_bitmap_page);</div><div class='del'>-	ac-&gt;ac_buddy_page = e4b-&gt;bd_buddy_page;</div><div class='del'>-	get_page(ac-&gt;ac_buddy_page);</div><div class='add'>+	ac-&gt;ac_bitmap_folio = e4b-&gt;bd_bitmap_folio;</div><div class='add'>+	folio_get(ac-&gt;ac_bitmap_folio);</div><div class='add'>+	ac-&gt;ac_buddy_folio = e4b-&gt;bd_buddy_folio;</div><div class='add'>+	folio_get(ac-&gt;ac_buddy_folio);</div><div class='ctx'> 	/* store last allocated for subsequent stream allocation */</div><div class='ctx'> 	if (ac-&gt;ac_flags &amp; EXT4_MB_STREAM_ALLOC) {</div><div class='del'>-		spin_lock(&amp;sbi-&gt;s_md_lock);</div><div class='del'>-		sbi-&gt;s_mb_last_group = ac-&gt;ac_f_ex.fe_group;</div><div class='del'>-		sbi-&gt;s_mb_last_start = ac-&gt;ac_f_ex.fe_start;</div><div class='del'>-		spin_unlock(&amp;sbi-&gt;s_md_lock);</div><div class='add'>+		int hash = ac-&gt;ac_inode-&gt;i_ino % sbi-&gt;s_mb_nr_global_goals;</div><div class='add'>+</div><div class='add'>+		WRITE_ONCE(sbi-&gt;s_mb_last_groups[hash], ac-&gt;ac_f_ex.fe_group);</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * As we've just preallocated more space than</div><div class='ctx'> 	 * user requested originally, we store allocated</div><div class='hunk'>@@ -2061,8 +2278,6 @@ static void ext4_mb_check_limits(struct ext4_allocation_context *ac,</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(ac-&gt;ac_sb);</div><div class='ctx'> 	struct ext4_free_extent *bex = &amp;ac-&gt;ac_b_ex;</div><div class='ctx'> 	struct ext4_free_extent *gex = &amp;ac-&gt;ac_g_ex;</div><div class='del'>-	struct ext4_free_extent ex;</div><div class='del'>-	int max;</div><div class='ctx'> </div><div class='ctx'> 	if (ac-&gt;ac_status == AC_STATUS_FOUND)</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -2081,17 +2296,8 @@ static void ext4_mb_check_limits(struct ext4_allocation_context *ac,</div><div class='ctx'> 	if (bex-&gt;fe_len &lt; gex-&gt;fe_len)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	if ((finish_group || ac-&gt;ac_found &gt; sbi-&gt;s_mb_min_to_scan)</div><div class='del'>-			&amp;&amp; bex-&gt;fe_group == e4b-&gt;bd_group) {</div><div class='del'>-		/* recheck chunk's availability - we don't know</div><div class='del'>-		 * when it was found (within this lock-unlock</div><div class='del'>-		 * period or not) */</div><div class='del'>-		max = mb_find_extent(e4b, bex-&gt;fe_start, gex-&gt;fe_len, &amp;ex);</div><div class='del'>-		if (max &gt;= gex-&gt;fe_len) {</div><div class='del'>-			ext4_mb_use_best_found(ac, e4b);</div><div class='del'>-			return;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	if (finish_group || ac-&gt;ac_found &gt; sbi-&gt;s_mb_min_to_scan)</div><div class='add'>+		ext4_mb_use_best_found(ac, e4b);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2102,6 +2308,20 @@ static void ext4_mb_check_limits(struct ext4_allocation_context *ac,</div><div class='ctx'>  * in the context. Later, the best found extent will be used, if</div><div class='ctx'>  * mballoc can't find good enough extent.</div><div class='ctx'>  *</div><div class='add'>+ * The algorithm used is roughly as follows:</div><div class='add'>+ *</div><div class='add'>+ * * If free extent found is exactly as big as goal, then</div><div class='add'>+ *   stop the scan and use it immediately</div><div class='add'>+ *</div><div class='add'>+ * * If free extent found is smaller than goal, then keep retrying</div><div class='add'>+ *   upto a max of sbi-&gt;s_mb_max_to_scan times (default 200). After</div><div class='add'>+ *   that stop scanning and use whatever we have.</div><div class='add'>+ *</div><div class='add'>+ * * If free extent found is bigger than goal, then keep retrying</div><div class='add'>+ *   upto a max of sbi-&gt;s_mb_min_to_scan times (default 10) before</div><div class='add'>+ *   stopping the scan and using the extent.</div><div class='add'>+ *</div><div class='add'>+ *</div><div class='ctx'>  * FIXME: real allocation policy is to be designed yet!</div><div class='ctx'>  */</div><div class='ctx'> static void ext4_mb_measure_extent(struct ext4_allocation_context *ac,</div><div class='hunk'>@@ -2117,6 +2337,7 @@ static void ext4_mb_measure_extent(struct ext4_allocation_context *ac,</div><div class='ctx'> 	BUG_ON(ac-&gt;ac_status != AC_STATUS_CONTINUE);</div><div class='ctx'> </div><div class='ctx'> 	ac-&gt;ac_found++;</div><div class='add'>+	ac-&gt;ac_cX_found[ac-&gt;ac_criteria]++;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The special case - take what you catch first</div><div class='hunk'>@@ -2164,7 +2385,7 @@ static void ext4_mb_measure_extent(struct ext4_allocation_context *ac,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static noinline_for_stack</div><div class='del'>-int ext4_mb_try_best_found(struct ext4_allocation_context *ac,</div><div class='add'>+void ext4_mb_try_best_found(struct ext4_allocation_context *ac,</div><div class='ctx'> 					struct ext4_buddy *e4b)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_free_extent ex = ac-&gt;ac_b_ex;</div><div class='hunk'>@@ -2175,9 +2396,12 @@ int ext4_mb_try_best_found(struct ext4_allocation_context *ac,</div><div class='ctx'> 	BUG_ON(ex.fe_len &lt;= 0);</div><div class='ctx'> 	err = ext4_mb_load_buddy(ac-&gt;ac_sb, group, e4b);</div><div class='ctx'> 	if (err)</div><div class='del'>-		return err;</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='ctx'> 	ext4_lock_group(ac-&gt;ac_sb, group);</div><div class='add'>+	if (unlikely(EXT4_MB_GRP_BBITMAP_CORRUPT(e4b-&gt;bd_info)))</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='ctx'> 	max = mb_find_extent(e4b, ex.fe_start, ex.fe_len, &amp;ex);</div><div class='ctx'> </div><div class='ctx'> 	if (max &gt; 0) {</div><div class='hunk'>@@ -2185,10 +2409,9 @@ int ext4_mb_try_best_found(struct ext4_allocation_context *ac,</div><div class='ctx'> 		ext4_mb_use_best_found(ac, e4b);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+out:</div><div class='ctx'> 	ext4_unlock_group(ac-&gt;ac_sb, group);</div><div class='ctx'> 	ext4_mb_unload_buddy(e4b);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static noinline_for_stack</div><div class='hunk'>@@ -2202,7 +2425,9 @@ int ext4_mb_find_by_goal(struct ext4_allocation_context *ac,</div><div class='ctx'> 	struct ext4_group_info *grp = ext4_get_group_info(ac-&gt;ac_sb, group);</div><div class='ctx'> 	struct ext4_free_extent ex;</div><div class='ctx'> </div><div class='del'>-	if (!(ac-&gt;ac_flags &amp; EXT4_MB_HINT_TRY_GOAL))</div><div class='add'>+	if (!grp)</div><div class='add'>+		return -EFSCORRUPTED;</div><div class='add'>+	if (!(ac-&gt;ac_flags &amp; (EXT4_MB_HINT_TRY_GOAL | EXT4_MB_HINT_GOAL_ONLY)))</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	if (grp-&gt;bb_free == 0)</div><div class='ctx'> 		return 0;</div><div class='hunk'>@@ -2211,21 +2436,19 @@ int ext4_mb_find_by_goal(struct ext4_allocation_context *ac,</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(EXT4_MB_GRP_BBITMAP_CORRUPT(e4b-&gt;bd_info))) {</div><div class='del'>-		ext4_mb_unload_buddy(e4b);</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	ext4_lock_group(ac-&gt;ac_sb, group);</div><div class='add'>+	if (unlikely(EXT4_MB_GRP_BBITMAP_CORRUPT(e4b-&gt;bd_info)))</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='ctx'> 	max = mb_find_extent(e4b, ac-&gt;ac_g_ex.fe_start,</div><div class='ctx'> 			     ac-&gt;ac_g_ex.fe_len, &amp;ex);</div><div class='ctx'> 	ex.fe_logical = 0xDEADFA11; /* debug value */</div><div class='ctx'> </div><div class='del'>-	if (max &gt;= ac-&gt;ac_g_ex.fe_len &amp;&amp; ac-&gt;ac_g_ex.fe_len == sbi-&gt;s_stripe) {</div><div class='add'>+	if (max &gt;= ac-&gt;ac_g_ex.fe_len &amp;&amp;</div><div class='add'>+	    ac-&gt;ac_g_ex.fe_len == EXT4_NUM_B2C(sbi, sbi-&gt;s_stripe)) {</div><div class='ctx'> 		ext4_fsblk_t start;</div><div class='ctx'> </div><div class='del'>-		start = ext4_group_first_block_no(ac-&gt;ac_sb, e4b-&gt;bd_group) +</div><div class='del'>-			ex.fe_start;</div><div class='add'>+		start = ext4_grp_offs_to_block(ac-&gt;ac_sb, &amp;ex);</div><div class='ctx'> 		/* use do_div to get remainder (would be 64-bit modulo) */</div><div class='ctx'> 		if (do_div(start, sbi-&gt;s_stripe) == 0) {</div><div class='ctx'> 			ac-&gt;ac_found++;</div><div class='hunk'>@@ -2249,6 +2472,7 @@ int ext4_mb_find_by_goal(struct ext4_allocation_context *ac,</div><div class='ctx'> 		ac-&gt;ac_b_ex = ex;</div><div class='ctx'> 		ext4_mb_use_best_found(ac, e4b);</div><div class='ctx'> 	}</div><div class='add'>+out:</div><div class='ctx'> 	ext4_unlock_group(ac-&gt;ac_sb, group);</div><div class='ctx'> 	ext4_mb_unload_buddy(e4b);</div><div class='ctx'> </div><div class='hunk'>@@ -2276,19 +2500,22 @@ void ext4_mb_simple_scan_group(struct ext4_allocation_context *ac,</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		buddy = mb_find_buddy(e4b, i, &amp;max);</div><div class='del'>-		BUG_ON(buddy == NULL);</div><div class='add'>+		if (WARN_RATELIMIT(buddy == NULL,</div><div class='add'>+			 "ext4: mb_simple_scan_group: mb_find_buddy failed, (%d)\n", i))</div><div class='add'>+			continue;</div><div class='ctx'> </div><div class='ctx'> 		k = mb_find_next_zero_bit(buddy, max, 0);</div><div class='ctx'> 		if (k &gt;= max) {</div><div class='add'>+			ext4_mark_group_bitmap_corrupted(ac-&gt;ac_sb,</div><div class='add'>+					e4b-&gt;bd_group,</div><div class='add'>+					EXT4_GROUP_INFO_BBITMAP_CORRUPT);</div><div class='ctx'> 			ext4_grp_locked_error(ac-&gt;ac_sb, e4b-&gt;bd_group, 0, 0,</div><div class='ctx'> 				"%d free clusters of order %d. But found 0",</div><div class='ctx'> 				grp-&gt;bb_counters[i], i);</div><div class='del'>-			ext4_mark_group_bitmap_corrupted(ac-&gt;ac_sb,</div><div class='del'>-					 e4b-&gt;bd_group,</div><div class='del'>-					EXT4_GROUP_INFO_BBITMAP_CORRUPT);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 		ac-&gt;ac_found++;</div><div class='add'>+		ac-&gt;ac_cX_found[ac-&gt;ac_criteria]++;</div><div class='ctx'> </div><div class='ctx'> 		ac-&gt;ac_b_ex.fe_len = 1 &lt;&lt; i;</div><div class='ctx'> 		ac-&gt;ac_b_ex.fe_start = k &lt;&lt; i;</div><div class='hunk'>@@ -2317,7 +2544,7 @@ void ext4_mb_complex_scan_group(struct ext4_allocation_context *ac,</div><div class='ctx'> 	struct super_block *sb = ac-&gt;ac_sb;</div><div class='ctx'> 	void *bitmap = e4b-&gt;bd_bitmap;</div><div class='ctx'> 	struct ext4_free_extent ex;</div><div class='del'>-	int i;</div><div class='add'>+	int i, j, freelen;</div><div class='ctx'> 	int free;</div><div class='ctx'> </div><div class='ctx'> 	free = e4b-&gt;bd_info-&gt;bb_free;</div><div class='hunk'>@@ -2335,25 +2562,43 @@ void ext4_mb_complex_scan_group(struct ext4_allocation_context *ac,</div><div class='ctx'> 			 * free blocks even though group info says we</div><div class='ctx'> 			 * have free blocks</div><div class='ctx'> 			 */</div><div class='add'>+			ext4_mark_group_bitmap_corrupted(sb, e4b-&gt;bd_group,</div><div class='add'>+					EXT4_GROUP_INFO_BBITMAP_CORRUPT);</div><div class='ctx'> 			ext4_grp_locked_error(sb, e4b-&gt;bd_group, 0, 0,</div><div class='ctx'> 					"%d free clusters as per "</div><div class='ctx'> 					"group info. But bitmap says 0",</div><div class='ctx'> 					free);</div><div class='del'>-			ext4_mark_group_bitmap_corrupted(sb, e4b-&gt;bd_group,</div><div class='del'>-					EXT4_GROUP_INFO_BBITMAP_CORRUPT);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		if (!ext4_mb_cr_expensive(ac-&gt;ac_criteria)) {</div><div class='add'>+			/*</div><div class='add'>+			 * In CR_GOAL_LEN_FAST and CR_BEST_AVAIL_LEN, we are</div><div class='add'>+			 * sure that this group will have a large enough</div><div class='add'>+			 * continuous free extent, so skip over the smaller free</div><div class='add'>+			 * extents</div><div class='add'>+			 */</div><div class='add'>+			j = mb_find_next_bit(bitmap,</div><div class='add'>+						EXT4_CLUSTERS_PER_GROUP(sb), i);</div><div class='add'>+			freelen = j - i;</div><div class='add'>+</div><div class='add'>+			if (freelen &lt; ac-&gt;ac_g_ex.fe_len) {</div><div class='add'>+				i = j;</div><div class='add'>+				free -= freelen;</div><div class='add'>+				continue;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		mb_find_extent(e4b, i, ac-&gt;ac_g_ex.fe_len, &amp;ex);</div><div class='ctx'> 		if (WARN_ON(ex.fe_len &lt;= 0))</div><div class='ctx'> 			break;</div><div class='ctx'> 		if (free &lt; ex.fe_len) {</div><div class='add'>+			ext4_mark_group_bitmap_corrupted(sb, e4b-&gt;bd_group,</div><div class='add'>+					EXT4_GROUP_INFO_BBITMAP_CORRUPT);</div><div class='ctx'> 			ext4_grp_locked_error(sb, e4b-&gt;bd_group, 0, 0,</div><div class='ctx'> 					"%d free clusters as per "</div><div class='ctx'> 					"group info. But got %d blocks",</div><div class='ctx'> 					free, ex.fe_len);</div><div class='del'>-			ext4_mark_group_bitmap_corrupted(sb, e4b-&gt;bd_group,</div><div class='del'>-					EXT4_GROUP_INFO_BBITMAP_CORRUPT);</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * The number of free blocks differs. This mostly</div><div class='ctx'> 			 * indicate that the bitmap is corrupt. So exit</div><div class='hunk'>@@ -2385,7 +2630,7 @@ void ext4_mb_scan_aligned(struct ext4_allocation_context *ac,</div><div class='ctx'> 	struct ext4_free_extent ex;</div><div class='ctx'> 	ext4_fsblk_t first_group_block;</div><div class='ctx'> 	ext4_fsblk_t a;</div><div class='del'>-	ext4_grpblk_t i;</div><div class='add'>+	ext4_grpblk_t i, stripe;</div><div class='ctx'> 	int max;</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(sbi-&gt;s_stripe == 0);</div><div class='hunk'>@@ -2397,36 +2642,63 @@ void ext4_mb_scan_aligned(struct ext4_allocation_context *ac,</div><div class='ctx'> 	do_div(a, sbi-&gt;s_stripe);</div><div class='ctx'> 	i = (a * sbi-&gt;s_stripe) - first_group_block;</div><div class='ctx'> </div><div class='add'>+	stripe = EXT4_NUM_B2C(sbi, sbi-&gt;s_stripe);</div><div class='add'>+	i = EXT4_B2C(sbi, i);</div><div class='ctx'> 	while (i &lt; EXT4_CLUSTERS_PER_GROUP(sb)) {</div><div class='ctx'> 		if (!mb_test_bit(i, bitmap)) {</div><div class='del'>-			max = mb_find_extent(e4b, i, sbi-&gt;s_stripe, &amp;ex);</div><div class='del'>-			if (max &gt;= sbi-&gt;s_stripe) {</div><div class='add'>+			max = mb_find_extent(e4b, i, stripe, &amp;ex);</div><div class='add'>+			if (max &gt;= stripe) {</div><div class='ctx'> 				ac-&gt;ac_found++;</div><div class='add'>+				ac-&gt;ac_cX_found[ac-&gt;ac_criteria]++;</div><div class='ctx'> 				ex.fe_logical = 0xDEADF00D; /* debug value */</div><div class='ctx'> 				ac-&gt;ac_b_ex = ex;</div><div class='ctx'> 				ext4_mb_use_best_found(ac, e4b);</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		i += sbi-&gt;s_stripe;</div><div class='add'>+		i += stripe;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void __ext4_mb_scan_group(struct ext4_allocation_context *ac)</div><div class='add'>+{</div><div class='add'>+	bool is_stripe_aligned;</div><div class='add'>+	struct ext4_sb_info *sbi;</div><div class='add'>+	enum criteria cr = ac-&gt;ac_criteria;</div><div class='add'>+</div><div class='add'>+	ac-&gt;ac_groups_scanned++;</div><div class='add'>+	if (cr == CR_POWER2_ALIGNED)</div><div class='add'>+		return ext4_mb_simple_scan_group(ac, ac-&gt;ac_e4b);</div><div class='add'>+</div><div class='add'>+	sbi = EXT4_SB(ac-&gt;ac_sb);</div><div class='add'>+	is_stripe_aligned = false;</div><div class='add'>+	if ((sbi-&gt;s_stripe &gt;= sbi-&gt;s_cluster_ratio) &amp;&amp;</div><div class='add'>+	    !(ac-&gt;ac_g_ex.fe_len % EXT4_NUM_B2C(sbi, sbi-&gt;s_stripe)))</div><div class='add'>+		is_stripe_aligned = true;</div><div class='add'>+</div><div class='add'>+	if ((cr == CR_GOAL_LEN_FAST || cr == CR_BEST_AVAIL_LEN) &amp;&amp;</div><div class='add'>+	    is_stripe_aligned)</div><div class='add'>+		ext4_mb_scan_aligned(ac, ac-&gt;ac_e4b);</div><div class='add'>+</div><div class='add'>+	if (ac-&gt;ac_status == AC_STATUS_CONTINUE)</div><div class='add'>+		ext4_mb_complex_scan_group(ac, ac-&gt;ac_e4b);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * This is also called BEFORE we load the buddy bitmap.</div><div class='ctx'>  * Returns either 1 or 0 indicating that the group is either suitable</div><div class='ctx'>  * for the allocation or not.</div><div class='ctx'>  */</div><div class='ctx'> static bool ext4_mb_good_group(struct ext4_allocation_context *ac,</div><div class='del'>-				ext4_group_t group, int cr)</div><div class='add'>+				ext4_group_t group, enum criteria cr)</div><div class='ctx'> {</div><div class='ctx'> 	ext4_grpblk_t free, fragments;</div><div class='ctx'> 	int flex_size = ext4_flex_bg_size(EXT4_SB(ac-&gt;ac_sb));</div><div class='ctx'> 	struct ext4_group_info *grp = ext4_get_group_info(ac-&gt;ac_sb, group);</div><div class='ctx'> </div><div class='del'>-	BUG_ON(cr &lt; 0 || cr &gt;= 4);</div><div class='add'>+	BUG_ON(cr &lt; CR_POWER2_ALIGNED || cr &gt;= EXT4_MB_NUM_CRS);</div><div class='ctx'> </div><div class='del'>-	if (unlikely(EXT4_MB_GRP_BBITMAP_CORRUPT(grp)))</div><div class='add'>+	if (unlikely(!grp || EXT4_MB_GRP_BBITMAP_CORRUPT(grp)))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='ctx'> 	free = grp-&gt;bb_free;</div><div class='hunk'>@@ -2438,7 +2710,7 @@ static bool ext4_mb_good_group(struct ext4_allocation_context *ac,</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='ctx'> 	switch (cr) {</div><div class='del'>-	case 0:</div><div class='add'>+	case CR_POWER2_ALIGNED:</div><div class='ctx'> 		BUG_ON(ac-&gt;ac_2order == 0);</div><div class='ctx'> </div><div class='ctx'> 		/* Avoid using the first bg of a flexgroup for data files */</div><div class='hunk'>@@ -2457,15 +2729,16 @@ static bool ext4_mb_good_group(struct ext4_allocation_context *ac,</div><div class='ctx'> 			return false;</div><div class='ctx'> </div><div class='ctx'> 		return true;</div><div class='del'>-	case 1:</div><div class='add'>+	case CR_GOAL_LEN_FAST:</div><div class='add'>+	case CR_BEST_AVAIL_LEN:</div><div class='ctx'> 		if ((free / fragments) &gt;= ac-&gt;ac_g_ex.fe_len)</div><div class='ctx'> 			return true;</div><div class='ctx'> 		break;</div><div class='del'>-	case 2:</div><div class='add'>+	case CR_GOAL_LEN_SLOW:</div><div class='ctx'> 		if (free &gt;= ac-&gt;ac_g_ex.fe_len)</div><div class='ctx'> 			return true;</div><div class='ctx'> 		break;</div><div class='del'>-	case 3:</div><div class='add'>+	case CR_ANY_FREE:</div><div class='ctx'> 		return true;</div><div class='ctx'> 	default:</div><div class='ctx'> 		BUG();</div><div class='hunk'>@@ -2486,7 +2759,7 @@ static bool ext4_mb_good_group(struct ext4_allocation_context *ac,</div><div class='ctx'>  * out"!</div><div class='ctx'>  */</div><div class='ctx'> static int ext4_mb_good_group_nolock(struct ext4_allocation_context *ac,</div><div class='del'>-				     ext4_group_t group, int cr)</div><div class='add'>+				     ext4_group_t group, enum criteria cr)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_group_info *grp = ext4_get_group_info(ac-&gt;ac_sb, group);</div><div class='ctx'> 	struct super_block *sb = ac-&gt;ac_sb;</div><div class='hunk'>@@ -2495,6 +2768,8 @@ static int ext4_mb_good_group_nolock(struct ext4_allocation_context *ac,</div><div class='ctx'> 	ext4_grpblk_t free;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='add'>+	if (!grp)</div><div class='add'>+		return -EFSCORRUPTED;</div><div class='ctx'> 	if (sbi-&gt;s_mb_stats)</div><div class='ctx'> 		atomic64_inc(&amp;sbi-&gt;s_bal_cX_groups_considered[ac-&gt;ac_criteria]);</div><div class='ctx'> 	if (should_lock) {</div><div class='hunk'>@@ -2504,7 +2779,12 @@ static int ext4_mb_good_group_nolock(struct ext4_allocation_context *ac,</div><div class='ctx'> 	free = grp-&gt;bb_free;</div><div class='ctx'> 	if (free == 0)</div><div class='ctx'> 		goto out;</div><div class='del'>-	if (cr &lt;= 2 &amp;&amp; free &lt; ac-&gt;ac_g_ex.fe_len)</div><div class='add'>+	/*</div><div class='add'>+	 * In all criterias except CR_ANY_FREE we try to avoid groups that</div><div class='add'>+	 * can't possibly satisfy the full goal request due to insufficient</div><div class='add'>+	 * free blocks.</div><div class='add'>+	 */</div><div class='add'>+	if (cr &lt; CR_ANY_FREE &amp;&amp; free &lt; ac-&gt;ac_g_ex.fe_len)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	if (unlikely(EXT4_MB_GRP_BBITMAP_CORRUPT(grp)))</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -2519,15 +2799,16 @@ static int ext4_mb_good_group_nolock(struct ext4_allocation_context *ac,</div><div class='ctx'> 			ext4_get_group_desc(sb, group, NULL);</div><div class='ctx'> 		int ret;</div><div class='ctx'> </div><div class='del'>-		/* cr=0/1 is a very optimistic search to find large</div><div class='del'>-		 * good chunks almost for free.  If buddy data is not</div><div class='del'>-		 * ready, then this optimization makes no sense.  But</div><div class='del'>-		 * we never skip the first block group in a flex_bg,</div><div class='del'>-		 * since this gets used for metadata block allocation,</div><div class='del'>-		 * and we want to make sure we locate metadata blocks</div><div class='del'>-		 * in the first block group in the flex_bg if possible.</div><div class='add'>+		/*</div><div class='add'>+		 * CR_POWER2_ALIGNED/CR_GOAL_LEN_FAST is a very optimistic</div><div class='add'>+		 * search to find large good chunks almost for free. If buddy</div><div class='add'>+		 * data is not ready, then this optimization makes no sense. But</div><div class='add'>+		 * we never skip the first block group in a flex_bg, since this</div><div class='add'>+		 * gets used for metadata block allocation, and we want to make</div><div class='add'>+		 * sure we locate metadata blocks in the first block group in</div><div class='add'>+		 * the flex_bg if possible.</div><div class='ctx'> 		 */</div><div class='del'>-		if (cr &lt; 2 &amp;&amp;</div><div class='add'>+		if (!ext4_mb_cr_expensive(cr) &amp;&amp;</div><div class='ctx'> 		    (!sbi-&gt;s_log_groups_per_flex ||</div><div class='ctx'> 		     ((group &amp; ((1 &lt;&lt; sbi-&gt;s_log_groups_per_flex) - 1)) != 0)) &amp;&amp;</div><div class='ctx'> 		    !(ext4_has_group_desc_csum(sb) &amp;&amp;</div><div class='hunk'>@@ -2575,11 +2856,9 @@ ext4_group_t ext4_mb_prefetch(struct super_block *sb, ext4_group_t group,</div><div class='ctx'> 		 * prefetch once, so we avoid getblk() call, which can</div><div class='ctx'> 		 * be expensive.</div><div class='ctx'> 		 */</div><div class='del'>-		if (!EXT4_MB_GRP_TEST_AND_SET_READ(grp) &amp;&amp;</div><div class='add'>+		if (gdp &amp;&amp; grp &amp;&amp; !EXT4_MB_GRP_TEST_AND_SET_READ(grp) &amp;&amp;</div><div class='ctx'> 		    EXT4_MB_GRP_NEED_INIT(grp) &amp;&amp;</div><div class='del'>-		    ext4_free_group_clusters(sb, gdp) &gt; 0 &amp;&amp;</div><div class='del'>-		    !(ext4_has_group_desc_csum(sb) &amp;&amp;</div><div class='del'>-		      (gdp-&gt;bg_flags &amp; cpu_to_le16(EXT4_BG_BLOCK_UNINIT)))) {</div><div class='add'>+		    ext4_free_group_clusters(sb, gdp) &gt; 0 ) {</div><div class='ctx'> 			bh = ext4_read_block_bitmap_nowait(sb, group, true);</div><div class='ctx'> 			if (bh &amp;&amp; !IS_ERR(bh)) {</div><div class='ctx'> 				if (!buffer_uptodate(bh) &amp;&amp; cnt)</div><div class='hunk'>@@ -2595,6 +2874,37 @@ ext4_group_t ext4_mb_prefetch(struct super_block *sb, ext4_group_t group,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * Batch reads of the block allocation bitmaps to get</div><div class='add'>+ * multiple READs in flight; limit prefetching at inexpensive</div><div class='add'>+ * CR, otherwise mballoc can spend a lot of time loading</div><div class='add'>+ * imperfect groups</div><div class='add'>+ */</div><div class='add'>+static void ext4_mb_might_prefetch(struct ext4_allocation_context *ac,</div><div class='add'>+				   ext4_group_t group)</div><div class='add'>+{</div><div class='add'>+	struct ext4_sb_info *sbi;</div><div class='add'>+</div><div class='add'>+	if (ac-&gt;ac_prefetch_grp != group)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	sbi = EXT4_SB(ac-&gt;ac_sb);</div><div class='add'>+	if (ext4_mb_cr_expensive(ac-&gt;ac_criteria) ||</div><div class='add'>+	    ac-&gt;ac_prefetch_ios &lt; sbi-&gt;s_mb_prefetch_limit) {</div><div class='add'>+		unsigned int nr = sbi-&gt;s_mb_prefetch;</div><div class='add'>+</div><div class='add'>+		if (ext4_has_feature_flex_bg(ac-&gt;ac_sb)) {</div><div class='add'>+			nr = 1 &lt;&lt; sbi-&gt;s_log_groups_per_flex;</div><div class='add'>+			nr -= group &amp; (nr - 1);</div><div class='add'>+			nr = umin(nr, sbi-&gt;s_mb_prefetch);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		ac-&gt;ac_prefetch_nr = nr;</div><div class='add'>+		ac-&gt;ac_prefetch_grp = ext4_mb_prefetch(ac-&gt;ac_sb, group, nr,</div><div class='add'>+						       &amp;ac-&gt;ac_prefetch_ios);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * Prefetching reads the block bitmap into the buffer cache; but we</div><div class='ctx'>  * need to make sure that the buddy bitmap in the page cache has been</div><div class='ctx'>  * initialized.  Note that ext4_mb_init_group() will block if the I/O</div><div class='hunk'>@@ -2609,44 +2919,76 @@ ext4_group_t ext4_mb_prefetch(struct super_block *sb, ext4_group_t group,</div><div class='ctx'> void ext4_mb_prefetch_fini(struct super_block *sb, ext4_group_t group,</div><div class='ctx'> 			   unsigned int nr)</div><div class='ctx'> {</div><div class='del'>-	while (nr-- &gt; 0) {</div><div class='del'>-		struct ext4_group_desc *gdp = ext4_get_group_desc(sb, group,</div><div class='del'>-								  NULL);</div><div class='del'>-		struct ext4_group_info *grp = ext4_get_group_info(sb, group);</div><div class='add'>+	struct ext4_group_desc *gdp;</div><div class='add'>+	struct ext4_group_info *grp;</div><div class='ctx'> </div><div class='add'>+	while (nr-- &gt; 0) {</div><div class='ctx'> 		if (!group)</div><div class='ctx'> 			group = ext4_get_groups_count(sb);</div><div class='ctx'> 		group--;</div><div class='add'>+		gdp = ext4_get_group_desc(sb, group, NULL);</div><div class='ctx'> 		grp = ext4_get_group_info(sb, group);</div><div class='ctx'> </div><div class='del'>-		if (EXT4_MB_GRP_NEED_INIT(grp) &amp;&amp;</div><div class='del'>-		    ext4_free_group_clusters(sb, gdp) &gt; 0 &amp;&amp;</div><div class='del'>-		    !(ext4_has_group_desc_csum(sb) &amp;&amp;</div><div class='del'>-		      (gdp-&gt;bg_flags &amp; cpu_to_le16(EXT4_BG_BLOCK_UNINIT)))) {</div><div class='add'>+		if (grp &amp;&amp; gdp &amp;&amp; EXT4_MB_GRP_NEED_INIT(grp) &amp;&amp;</div><div class='add'>+		    ext4_free_group_clusters(sb, gdp) &gt; 0) {</div><div class='ctx'> 			if (ext4_mb_init_group(sb, group, GFP_NOFS))</div><div class='ctx'> 				break;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int ext4_mb_scan_group(struct ext4_allocation_context *ac,</div><div class='add'>+			      ext4_group_t group)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+	struct super_block *sb = ac-&gt;ac_sb;</div><div class='add'>+	enum criteria cr = ac-&gt;ac_criteria;</div><div class='add'>+</div><div class='add'>+	ext4_mb_might_prefetch(ac, group);</div><div class='add'>+</div><div class='add'>+	/* prevent unnecessary buddy loading. */</div><div class='add'>+	if (cr &lt; CR_ANY_FREE &amp;&amp; spin_is_locked(ext4_group_lock_ptr(sb, group)))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/* This now checks without needing the buddy folio */</div><div class='add'>+	ret = ext4_mb_good_group_nolock(ac, group, cr);</div><div class='add'>+	if (ret &lt;= 0) {</div><div class='add'>+		if (!ac-&gt;ac_first_err)</div><div class='add'>+			ac-&gt;ac_first_err = ret;</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = ext4_mb_load_buddy(sb, group, ac-&gt;ac_e4b);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	/* skip busy group */</div><div class='add'>+	if (cr &gt;= CR_ANY_FREE)</div><div class='add'>+		ext4_lock_group(sb, group);</div><div class='add'>+	else if (!ext4_try_lock_group(sb, group))</div><div class='add'>+		goto out_unload;</div><div class='add'>+</div><div class='add'>+	/* We need to check again after locking the block group. */</div><div class='add'>+	if (unlikely(!ext4_mb_good_group(ac, group, cr)))</div><div class='add'>+		goto out_unlock;</div><div class='add'>+</div><div class='add'>+	__ext4_mb_scan_group(ac);</div><div class='add'>+</div><div class='add'>+out_unlock:</div><div class='add'>+	ext4_unlock_group(sb, group);</div><div class='add'>+out_unload:</div><div class='add'>+	ext4_mb_unload_buddy(ac-&gt;ac_e4b);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static noinline_for_stack int</div><div class='ctx'> ext4_mb_regular_allocator(struct ext4_allocation_context *ac)</div><div class='ctx'> {</div><div class='del'>-	ext4_group_t prefetch_grp = 0, ngroups, group, i;</div><div class='del'>-	int cr = -1;</div><div class='del'>-	int err = 0, first_err = 0;</div><div class='del'>-	unsigned int nr = 0, prefetch_ios = 0;</div><div class='del'>-	struct ext4_sb_info *sbi;</div><div class='del'>-	struct super_block *sb;</div><div class='add'>+	ext4_group_t i;</div><div class='add'>+	int err = 0;</div><div class='add'>+	struct super_block *sb = ac-&gt;ac_sb;</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> 	struct ext4_buddy e4b;</div><div class='del'>-	int lost;</div><div class='del'>-</div><div class='del'>-	sb = ac-&gt;ac_sb;</div><div class='del'>-	sbi = EXT4_SB(sb);</div><div class='del'>-	ngroups = ext4_get_groups_count(sb);</div><div class='del'>-	/* non-extent files are limited to low blocks/groups */</div><div class='del'>-	if (!(ext4_test_inode_flag(ac-&gt;ac_inode, EXT4_INODE_EXTENTS)))</div><div class='del'>-		ngroups = sbi-&gt;s_blockfile_groups;</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(ac-&gt;ac_status == AC_STATUS_FOUND);</div><div class='ctx'> </div><div class='hunk'>@@ -2660,8 +3002,8 @@ ext4_mb_regular_allocator(struct ext4_allocation_context *ac)</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * ac-&gt;ac_2order is set only if the fe_len is a power of 2</div><div class='del'>-	 * if ac-&gt;ac_2order is set we also set criteria to 0 so that we</div><div class='del'>-	 * try exact allocation using buddy.</div><div class='add'>+	 * if ac-&gt;ac_2order is set we also set criteria to CR_POWER2_ALIGNED</div><div class='add'>+	 * so that we try exact allocation using buddy.</div><div class='ctx'> 	 */</div><div class='ctx'> 	i = fls(ac-&gt;ac_g_ex.fe_len);</div><div class='ctx'> 	ac-&gt;ac_2order = 0;</div><div class='hunk'>@@ -2673,119 +3015,40 @@ ext4_mb_regular_allocator(struct ext4_allocation_context *ac)</div><div class='ctx'> 	 * requests upto maximum buddy size we have constructed.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (i &gt;= sbi-&gt;s_mb_order2_reqs &amp;&amp; i &lt;= MB_NUM_ORDERS(sb)) {</div><div class='del'>-		/*</div><div class='del'>-		 * This should tell if fe_len is exactly power of 2</div><div class='del'>-		 */</div><div class='del'>-		if ((ac-&gt;ac_g_ex.fe_len &amp; (~(1 &lt;&lt; (i - 1)))) == 0)</div><div class='add'>+		if (is_power_of_2(ac-&gt;ac_g_ex.fe_len))</div><div class='ctx'> 			ac-&gt;ac_2order = array_index_nospec(i - 1,</div><div class='ctx'> 							   MB_NUM_ORDERS(sb));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* if stream allocation is enabled, use global goal */</div><div class='ctx'> 	if (ac-&gt;ac_flags &amp; EXT4_MB_STREAM_ALLOC) {</div><div class='del'>-		/* TBD: may be hot point */</div><div class='del'>-		spin_lock(&amp;sbi-&gt;s_md_lock);</div><div class='del'>-		ac-&gt;ac_g_ex.fe_group = sbi-&gt;s_mb_last_group;</div><div class='del'>-		ac-&gt;ac_g_ex.fe_start = sbi-&gt;s_mb_last_start;</div><div class='del'>-		spin_unlock(&amp;sbi-&gt;s_md_lock);</div><div class='add'>+		int hash = ac-&gt;ac_inode-&gt;i_ino % sbi-&gt;s_mb_nr_global_goals;</div><div class='add'>+</div><div class='add'>+		ac-&gt;ac_g_ex.fe_group = READ_ONCE(sbi-&gt;s_mb_last_groups[hash]);</div><div class='add'>+		ac-&gt;ac_g_ex.fe_start = -1;</div><div class='add'>+		ac-&gt;ac_flags &amp;= ~EXT4_MB_HINT_TRY_GOAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Let's just scan groups to find more-less suitable blocks */</div><div class='del'>-	cr = ac-&gt;ac_2order ? 0 : 1;</div><div class='ctx'> 	/*</div><div class='del'>-	 * cr == 0 try to get exact allocation,</div><div class='del'>-	 * cr == 3  try to get anything</div><div class='add'>+	 * Let's just scan groups to find more-less suitable blocks We</div><div class='add'>+	 * start with CR_GOAL_LEN_FAST, unless it is power of 2</div><div class='add'>+	 * aligned, in which case let's do that faster approach first.</div><div class='ctx'> 	 */</div><div class='del'>-repeat:</div><div class='del'>-	for (; cr &lt; 4 &amp;&amp; ac-&gt;ac_status == AC_STATUS_CONTINUE; cr++) {</div><div class='del'>-		ac-&gt;ac_criteria = cr;</div><div class='del'>-		/*</div><div class='del'>-		 * searching for the right group start</div><div class='del'>-		 * from the goal value specified</div><div class='del'>-		 */</div><div class='del'>-		group = ac-&gt;ac_g_ex.fe_group;</div><div class='del'>-		ac-&gt;ac_last_optimal_group = group;</div><div class='del'>-		ac-&gt;ac_groups_linear_remaining = sbi-&gt;s_mb_max_linear_groups;</div><div class='del'>-		prefetch_grp = group;</div><div class='del'>-</div><div class='del'>-		for (i = 0; i &lt; ngroups; group = next_linear_group(ac, group, ngroups),</div><div class='del'>-			     i++) {</div><div class='del'>-			int ret = 0, new_cr;</div><div class='del'>-</div><div class='del'>-			cond_resched();</div><div class='del'>-</div><div class='del'>-			ext4_mb_choose_next_group(ac, &amp;new_cr, &amp;group, ngroups);</div><div class='del'>-			if (new_cr != cr) {</div><div class='del'>-				cr = new_cr;</div><div class='del'>-				goto repeat;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			/*</div><div class='del'>-			 * Batch reads of the block allocation bitmaps</div><div class='del'>-			 * to get multiple READs in flight; limit</div><div class='del'>-			 * prefetching at cr=0/1, otherwise mballoc can</div><div class='del'>-			 * spend a lot of time loading imperfect groups</div><div class='del'>-			 */</div><div class='del'>-			if ((prefetch_grp == group) &amp;&amp;</div><div class='del'>-			    (cr &gt; 1 ||</div><div class='del'>-			     prefetch_ios &lt; sbi-&gt;s_mb_prefetch_limit)) {</div><div class='del'>-				unsigned int curr_ios = prefetch_ios;</div><div class='del'>-</div><div class='del'>-				nr = sbi-&gt;s_mb_prefetch;</div><div class='del'>-				if (ext4_has_feature_flex_bg(sb)) {</div><div class='del'>-					nr = 1 &lt;&lt; sbi-&gt;s_log_groups_per_flex;</div><div class='del'>-					nr -= group &amp; (nr - 1);</div><div class='del'>-					nr = min(nr, sbi-&gt;s_mb_prefetch);</div><div class='del'>-				}</div><div class='del'>-				prefetch_grp = ext4_mb_prefetch(sb, group,</div><div class='del'>-							nr, &amp;prefetch_ios);</div><div class='del'>-				if (prefetch_ios == curr_ios)</div><div class='del'>-					nr = 0;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			/* This now checks without needing the buddy page */</div><div class='del'>-			ret = ext4_mb_good_group_nolock(ac, group, cr);</div><div class='del'>-			if (ret &lt;= 0) {</div><div class='del'>-				if (!first_err)</div><div class='del'>-					first_err = ret;</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			err = ext4_mb_load_buddy(sb, group, &amp;e4b);</div><div class='del'>-			if (err)</div><div class='del'>-				goto out;</div><div class='del'>-</div><div class='del'>-			ext4_lock_group(sb, group);</div><div class='add'>+	ac-&gt;ac_criteria = CR_GOAL_LEN_FAST;</div><div class='add'>+	if (ac-&gt;ac_2order)</div><div class='add'>+		ac-&gt;ac_criteria = CR_POWER2_ALIGNED;</div><div class='ctx'> </div><div class='del'>-			/*</div><div class='del'>-			 * We need to check again after locking the</div><div class='del'>-			 * block group</div><div class='del'>-			 */</div><div class='del'>-			ret = ext4_mb_good_group(ac, group, cr);</div><div class='del'>-			if (ret == 0) {</div><div class='del'>-				ext4_unlock_group(sb, group);</div><div class='del'>-				ext4_mb_unload_buddy(&amp;e4b);</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			ac-&gt;ac_groups_scanned++;</div><div class='del'>-			if (cr == 0)</div><div class='del'>-				ext4_mb_simple_scan_group(ac, &amp;e4b);</div><div class='del'>-			else if (cr == 1 &amp;&amp; sbi-&gt;s_stripe &amp;&amp;</div><div class='del'>-					!(ac-&gt;ac_g_ex.fe_len % sbi-&gt;s_stripe))</div><div class='del'>-				ext4_mb_scan_aligned(ac, &amp;e4b);</div><div class='del'>-			else</div><div class='del'>-				ext4_mb_complex_scan_group(ac, &amp;e4b);</div><div class='del'>-</div><div class='del'>-			ext4_unlock_group(sb, group);</div><div class='del'>-			ext4_mb_unload_buddy(&amp;e4b);</div><div class='add'>+	ac-&gt;ac_e4b = &amp;e4b;</div><div class='add'>+	ac-&gt;ac_prefetch_ios = 0;</div><div class='add'>+	ac-&gt;ac_first_err = 0;</div><div class='add'>+repeat:</div><div class='add'>+	while (ac-&gt;ac_criteria &lt; EXT4_MB_NUM_CRS) {</div><div class='add'>+		err = ext4_mb_scan_groups(ac);</div><div class='add'>+		if (err)</div><div class='add'>+			goto out;</div><div class='ctx'> </div><div class='del'>-			if (ac-&gt;ac_status != AC_STATUS_CONTINUE)</div><div class='del'>-				break;</div><div class='del'>-		}</div><div class='del'>-		/* Processed all groups and haven't found blocks */</div><div class='del'>-		if (sbi-&gt;s_mb_stats &amp;&amp; i == ngroups)</div><div class='del'>-			atomic64_inc(&amp;sbi-&gt;s_bal_cX_failed[cr]);</div><div class='add'>+		if (ac-&gt;ac_status != AC_STATUS_CONTINUE)</div><div class='add'>+			break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (ac-&gt;ac_b_ex.fe_len &gt; 0 &amp;&amp; ac-&gt;ac_status != AC_STATUS_FOUND &amp;&amp;</div><div class='hunk'>@@ -2796,6 +3059,8 @@ repeat:</div><div class='ctx'> 		 */</div><div class='ctx'> 		ext4_mb_try_best_found(ac, &amp;e4b);</div><div class='ctx'> 		if (ac-&gt;ac_status != AC_STATUS_FOUND) {</div><div class='add'>+			int lost;</div><div class='add'>+</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Someone more lucky has already allocated it.</div><div class='ctx'> 			 * The only thing we can do is just take first</div><div class='hunk'>@@ -2811,30 +3076,34 @@ repeat:</div><div class='ctx'> 			ac-&gt;ac_b_ex.fe_len = 0;</div><div class='ctx'> 			ac-&gt;ac_status = AC_STATUS_CONTINUE;</div><div class='ctx'> 			ac-&gt;ac_flags |= EXT4_MB_HINT_FIRST;</div><div class='del'>-			cr = 3;</div><div class='add'>+			ac-&gt;ac_criteria = CR_ANY_FREE;</div><div class='ctx'> 			goto repeat;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (sbi-&gt;s_mb_stats &amp;&amp; ac-&gt;ac_status == AC_STATUS_FOUND)</div><div class='add'>+	if (sbi-&gt;s_mb_stats &amp;&amp; ac-&gt;ac_status == AC_STATUS_FOUND) {</div><div class='ctx'> 		atomic64_inc(&amp;sbi-&gt;s_bal_cX_hits[ac-&gt;ac_criteria]);</div><div class='add'>+		if (ac-&gt;ac_flags &amp; EXT4_MB_STREAM_ALLOC &amp;&amp;</div><div class='add'>+		    ac-&gt;ac_b_ex.fe_group == ac-&gt;ac_g_ex.fe_group)</div><div class='add'>+			atomic_inc(&amp;sbi-&gt;s_bal_stream_goals);</div><div class='add'>+	}</div><div class='ctx'> out:</div><div class='del'>-	if (!err &amp;&amp; ac-&gt;ac_status != AC_STATUS_FOUND &amp;&amp; first_err)</div><div class='del'>-		err = first_err;</div><div class='add'>+	if (!err &amp;&amp; ac-&gt;ac_status != AC_STATUS_FOUND &amp;&amp; ac-&gt;ac_first_err)</div><div class='add'>+		err = ac-&gt;ac_first_err;</div><div class='ctx'> </div><div class='ctx'> 	mb_debug(sb, "Best len %d, origin len %d, ac_status %u, ac_flags 0x%x, cr %d ret %d\n",</div><div class='ctx'> 		 ac-&gt;ac_b_ex.fe_len, ac-&gt;ac_o_ex.fe_len, ac-&gt;ac_status,</div><div class='del'>-		 ac-&gt;ac_flags, cr, err);</div><div class='add'>+		 ac-&gt;ac_flags, ac-&gt;ac_criteria, err);</div><div class='ctx'> </div><div class='del'>-	if (nr)</div><div class='del'>-		ext4_mb_prefetch_fini(sb, prefetch_grp, nr);</div><div class='add'>+	if (ac-&gt;ac_prefetch_nr)</div><div class='add'>+		ext4_mb_prefetch_fini(sb, ac-&gt;ac_prefetch_grp, ac-&gt;ac_prefetch_nr);</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void *ext4_mb_seq_groups_start(struct seq_file *seq, loff_t *pos)</div><div class='ctx'> {</div><div class='del'>-	struct super_block *sb = PDE_DATA(file_inode(seq-&gt;file));</div><div class='add'>+	struct super_block *sb = pde_data(file_inode(seq-&gt;file));</div><div class='ctx'> 	ext4_group_t group;</div><div class='ctx'> </div><div class='ctx'> 	if (*pos &lt; 0 || *pos &gt;= ext4_get_groups_count(sb))</div><div class='hunk'>@@ -2845,7 +3114,7 @@ static void *ext4_mb_seq_groups_start(struct seq_file *seq, loff_t *pos)</div><div class='ctx'> </div><div class='ctx'> static void *ext4_mb_seq_groups_next(struct seq_file *seq, void *v, loff_t *pos)</div><div class='ctx'> {</div><div class='del'>-	struct super_block *sb = PDE_DATA(file_inode(seq-&gt;file));</div><div class='add'>+	struct super_block *sb = pde_data(file_inode(seq-&gt;file));</div><div class='ctx'> 	ext4_group_t group;</div><div class='ctx'> </div><div class='ctx'> 	++*pos;</div><div class='hunk'>@@ -2857,19 +3126,17 @@ static void *ext4_mb_seq_groups_next(struct seq_file *seq, void *v, loff_t *pos)</div><div class='ctx'> </div><div class='ctx'> static int ext4_mb_seq_groups_show(struct seq_file *seq, void *v)</div><div class='ctx'> {</div><div class='del'>-	struct super_block *sb = PDE_DATA(file_inode(seq-&gt;file));</div><div class='add'>+	struct super_block *sb = pde_data(file_inode(seq-&gt;file));</div><div class='ctx'> 	ext4_group_t group = (ext4_group_t) ((unsigned long) v);</div><div class='del'>-	int i;</div><div class='del'>-	int err, buddy_loaded = 0;</div><div class='add'>+	int i, err;</div><div class='add'>+	char nbuf[16];</div><div class='ctx'> 	struct ext4_buddy e4b;</div><div class='ctx'> 	struct ext4_group_info *grinfo;</div><div class='ctx'> 	unsigned char blocksize_bits = min_t(unsigned char,</div><div class='ctx'> 					     sb-&gt;s_blocksize_bits,</div><div class='ctx'> 					     EXT4_MAX_BLOCK_LOG_SIZE);</div><div class='del'>-	struct sg {</div><div class='del'>-		struct ext4_group_info info;</div><div class='del'>-		ext4_grpblk_t counters[EXT4_MAX_BLOCK_LOG_SIZE + 2];</div><div class='del'>-	} sg;</div><div class='add'>+	DEFINE_RAW_FLEX(struct ext4_group_info, sg, bb_counters,</div><div class='add'>+			EXT4_MAX_BLOCK_LOG_SIZE + 2);</div><div class='ctx'> </div><div class='ctx'> 	group--;</div><div class='ctx'> 	if (group == 0)</div><div class='hunk'>@@ -2877,32 +3144,36 @@ static int ext4_mb_seq_groups_show(struct seq_file *seq, void *v)</div><div class='ctx'> 			      " 2^0   2^1   2^2   2^3   2^4   2^5   2^6  "</div><div class='ctx'> 			      " 2^7   2^8   2^9   2^10  2^11  2^12  2^13  ]\n");</div><div class='ctx'> </div><div class='del'>-	i = (blocksize_bits + 2) * sizeof(sg.info.bb_counters[0]) +</div><div class='add'>+	i = (blocksize_bits + 2) * sizeof(sg-&gt;bb_counters[0]) +</div><div class='ctx'> 		sizeof(struct ext4_group_info);</div><div class='ctx'> </div><div class='ctx'> 	grinfo = ext4_get_group_info(sb, group);</div><div class='add'>+	if (!grinfo)</div><div class='add'>+		return 0;</div><div class='ctx'> 	/* Load the group info in memory only if not already loaded. */</div><div class='ctx'> 	if (unlikely(EXT4_MB_GRP_NEED_INIT(grinfo))) {</div><div class='ctx'> 		err = ext4_mb_load_buddy(sb, group, &amp;e4b);</div><div class='ctx'> 		if (err) {</div><div class='del'>-			seq_printf(seq, "#%-5u: I/O error\n", group);</div><div class='add'>+			seq_printf(seq, "#%-5u: %s\n", group, ext4_decode_error(NULL, err, nbuf));</div><div class='ctx'> 			return 0;</div><div class='ctx'> 		}</div><div class='del'>-		buddy_loaded = 1;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	memcpy(&amp;sg, ext4_get_group_info(sb, group), i);</div><div class='del'>-</div><div class='del'>-	if (buddy_loaded)</div><div class='ctx'> 		ext4_mb_unload_buddy(&amp;e4b);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	seq_printf(seq, "#%-5u: %-5u %-5u %-5u [", group, sg.info.bb_free,</div><div class='del'>-			sg.info.bb_fragments, sg.info.bb_first_free);</div><div class='add'>+	/*</div><div class='add'>+	 * We care only about free space counters in the group info and</div><div class='add'>+	 * these are safe to access even after the buddy has been unloaded</div><div class='add'>+	 */</div><div class='add'>+	memcpy(sg, grinfo, i);</div><div class='add'>+	seq_printf(seq, "#%-5u: %-5u %-5u %-5u [", group, sg-&gt;bb_free,</div><div class='add'>+			sg-&gt;bb_fragments, sg-&gt;bb_first_free);</div><div class='ctx'> 	for (i = 0; i &lt;= 13; i++)</div><div class='ctx'> 		seq_printf(seq, " %-5u", i &lt;= blocksize_bits + 1 ?</div><div class='del'>-				sg.info.bb_counters[i] : 0);</div><div class='del'>-	seq_puts(seq, " ]\n");</div><div class='del'>-</div><div class='add'>+				sg-&gt;bb_counters[i] : 0);</div><div class='add'>+	seq_puts(seq, " ]");</div><div class='add'>+	if (EXT4_MB_GRP_BBITMAP_CORRUPT(sg))</div><div class='add'>+		seq_puts(seq, " Block bitmap corrupted!");</div><div class='add'>+	seq_putc(seq, '\n');</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2919,57 +3190,96 @@ const struct seq_operations ext4_mb_seq_groups_ops = {</div><div class='ctx'> </div><div class='ctx'> int ext4_seq_mb_stats_show(struct seq_file *seq, void *offset)</div><div class='ctx'> {</div><div class='del'>-	struct super_block *sb = (struct super_block *)seq-&gt;private;</div><div class='add'>+	struct super_block *sb = seq-&gt;private;</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> </div><div class='ctx'> 	seq_puts(seq, "mballoc:\n");</div><div class='ctx'> 	if (!sbi-&gt;s_mb_stats) {</div><div class='ctx'> 		seq_puts(seq, "\tmb stats collection turned off.\n");</div><div class='del'>-		seq_puts(seq, "\tTo enable, please write \"1\" to sysfs file mb_stats.\n");</div><div class='add'>+		seq_puts(</div><div class='add'>+			seq,</div><div class='add'>+			"\tTo enable, please write \"1\" to sysfs file mb_stats.\n");</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> 	seq_printf(seq, "\treqs: %u\n", atomic_read(&amp;sbi-&gt;s_bal_reqs));</div><div class='ctx'> 	seq_printf(seq, "\tsuccess: %u\n", atomic_read(&amp;sbi-&gt;s_bal_success));</div><div class='ctx'> </div><div class='del'>-	seq_printf(seq, "\tgroups_scanned: %u\n",  atomic_read(&amp;sbi-&gt;s_bal_groups_scanned));</div><div class='del'>-</div><div class='del'>-	seq_puts(seq, "\tcr0_stats:\n");</div><div class='del'>-	seq_printf(seq, "\t\thits: %llu\n", atomic64_read(&amp;sbi-&gt;s_bal_cX_hits[0]));</div><div class='del'>-	seq_printf(seq, "\t\tgroups_considered: %llu\n",</div><div class='del'>-		   atomic64_read(&amp;sbi-&gt;s_bal_cX_groups_considered[0]));</div><div class='add'>+	seq_printf(seq, "\tgroups_scanned: %u\n",</div><div class='add'>+		   atomic_read(&amp;sbi-&gt;s_bal_groups_scanned));</div><div class='add'>+</div><div class='add'>+	/* CR_POWER2_ALIGNED stats */</div><div class='add'>+	seq_puts(seq, "\tcr_p2_aligned_stats:\n");</div><div class='add'>+	seq_printf(seq, "\t\thits: %llu\n",</div><div class='add'>+		   atomic64_read(&amp;sbi-&gt;s_bal_cX_hits[CR_POWER2_ALIGNED]));</div><div class='add'>+	seq_printf(</div><div class='add'>+		seq, "\t\tgroups_considered: %llu\n",</div><div class='add'>+		atomic64_read(</div><div class='add'>+			&amp;sbi-&gt;s_bal_cX_groups_considered[CR_POWER2_ALIGNED]));</div><div class='add'>+	seq_printf(seq, "\t\textents_scanned: %u\n",</div><div class='add'>+		   atomic_read(&amp;sbi-&gt;s_bal_cX_ex_scanned[CR_POWER2_ALIGNED]));</div><div class='ctx'> 	seq_printf(seq, "\t\tuseless_loops: %llu\n",</div><div class='del'>-		   atomic64_read(&amp;sbi-&gt;s_bal_cX_failed[0]));</div><div class='del'>-	seq_printf(seq, "\t\tbad_suggestions: %u\n",</div><div class='del'>-		   atomic_read(&amp;sbi-&gt;s_bal_cr0_bad_suggestions));</div><div class='add'>+		   atomic64_read(&amp;sbi-&gt;s_bal_cX_failed[CR_POWER2_ALIGNED]));</div><div class='ctx'> </div><div class='del'>-	seq_puts(seq, "\tcr1_stats:\n");</div><div class='del'>-	seq_printf(seq, "\t\thits: %llu\n", atomic64_read(&amp;sbi-&gt;s_bal_cX_hits[1]));</div><div class='add'>+	/* CR_GOAL_LEN_FAST stats */</div><div class='add'>+	seq_puts(seq, "\tcr_goal_fast_stats:\n");</div><div class='add'>+	seq_printf(seq, "\t\thits: %llu\n",</div><div class='add'>+		   atomic64_read(&amp;sbi-&gt;s_bal_cX_hits[CR_GOAL_LEN_FAST]));</div><div class='ctx'> 	seq_printf(seq, "\t\tgroups_considered: %llu\n",</div><div class='del'>-		   atomic64_read(&amp;sbi-&gt;s_bal_cX_groups_considered[1]));</div><div class='add'>+		   atomic64_read(</div><div class='add'>+			   &amp;sbi-&gt;s_bal_cX_groups_considered[CR_GOAL_LEN_FAST]));</div><div class='add'>+	seq_printf(seq, "\t\textents_scanned: %u\n",</div><div class='add'>+		   atomic_read(&amp;sbi-&gt;s_bal_cX_ex_scanned[CR_GOAL_LEN_FAST]));</div><div class='ctx'> 	seq_printf(seq, "\t\tuseless_loops: %llu\n",</div><div class='del'>-		   atomic64_read(&amp;sbi-&gt;s_bal_cX_failed[1]));</div><div class='del'>-	seq_printf(seq, "\t\tbad_suggestions: %u\n",</div><div class='del'>-		   atomic_read(&amp;sbi-&gt;s_bal_cr1_bad_suggestions));</div><div class='del'>-</div><div class='del'>-	seq_puts(seq, "\tcr2_stats:\n");</div><div class='del'>-	seq_printf(seq, "\t\thits: %llu\n", atomic64_read(&amp;sbi-&gt;s_bal_cX_hits[2]));</div><div class='del'>-	seq_printf(seq, "\t\tgroups_considered: %llu\n",</div><div class='del'>-		   atomic64_read(&amp;sbi-&gt;s_bal_cX_groups_considered[2]));</div><div class='add'>+		   atomic64_read(&amp;sbi-&gt;s_bal_cX_failed[CR_GOAL_LEN_FAST]));</div><div class='add'>+</div><div class='add'>+	/* CR_BEST_AVAIL_LEN stats */</div><div class='add'>+	seq_puts(seq, "\tcr_best_avail_stats:\n");</div><div class='add'>+	seq_printf(seq, "\t\thits: %llu\n",</div><div class='add'>+		   atomic64_read(&amp;sbi-&gt;s_bal_cX_hits[CR_BEST_AVAIL_LEN]));</div><div class='add'>+	seq_printf(</div><div class='add'>+		seq, "\t\tgroups_considered: %llu\n",</div><div class='add'>+		atomic64_read(</div><div class='add'>+			&amp;sbi-&gt;s_bal_cX_groups_considered[CR_BEST_AVAIL_LEN]));</div><div class='add'>+	seq_printf(seq, "\t\textents_scanned: %u\n",</div><div class='add'>+		   atomic_read(&amp;sbi-&gt;s_bal_cX_ex_scanned[CR_BEST_AVAIL_LEN]));</div><div class='ctx'> 	seq_printf(seq, "\t\tuseless_loops: %llu\n",</div><div class='del'>-		   atomic64_read(&amp;sbi-&gt;s_bal_cX_failed[2]));</div><div class='add'>+		   atomic64_read(&amp;sbi-&gt;s_bal_cX_failed[CR_BEST_AVAIL_LEN]));</div><div class='ctx'> </div><div class='del'>-	seq_puts(seq, "\tcr3_stats:\n");</div><div class='del'>-	seq_printf(seq, "\t\thits: %llu\n", atomic64_read(&amp;sbi-&gt;s_bal_cX_hits[3]));</div><div class='add'>+	/* CR_GOAL_LEN_SLOW stats */</div><div class='add'>+	seq_puts(seq, "\tcr_goal_slow_stats:\n");</div><div class='add'>+	seq_printf(seq, "\t\thits: %llu\n",</div><div class='add'>+		   atomic64_read(&amp;sbi-&gt;s_bal_cX_hits[CR_GOAL_LEN_SLOW]));</div><div class='ctx'> 	seq_printf(seq, "\t\tgroups_considered: %llu\n",</div><div class='del'>-		   atomic64_read(&amp;sbi-&gt;s_bal_cX_groups_considered[3]));</div><div class='add'>+		   atomic64_read(</div><div class='add'>+			   &amp;sbi-&gt;s_bal_cX_groups_considered[CR_GOAL_LEN_SLOW]));</div><div class='add'>+	seq_printf(seq, "\t\textents_scanned: %u\n",</div><div class='add'>+		   atomic_read(&amp;sbi-&gt;s_bal_cX_ex_scanned[CR_GOAL_LEN_SLOW]));</div><div class='add'>+	seq_printf(seq, "\t\tuseless_loops: %llu\n",</div><div class='add'>+		   atomic64_read(&amp;sbi-&gt;s_bal_cX_failed[CR_GOAL_LEN_SLOW]));</div><div class='add'>+</div><div class='add'>+	/* CR_ANY_FREE stats */</div><div class='add'>+	seq_puts(seq, "\tcr_any_free_stats:\n");</div><div class='add'>+	seq_printf(seq, "\t\thits: %llu\n",</div><div class='add'>+		   atomic64_read(&amp;sbi-&gt;s_bal_cX_hits[CR_ANY_FREE]));</div><div class='add'>+	seq_printf(</div><div class='add'>+		seq, "\t\tgroups_considered: %llu\n",</div><div class='add'>+		atomic64_read(&amp;sbi-&gt;s_bal_cX_groups_considered[CR_ANY_FREE]));</div><div class='add'>+	seq_printf(seq, "\t\textents_scanned: %u\n",</div><div class='add'>+		   atomic_read(&amp;sbi-&gt;s_bal_cX_ex_scanned[CR_ANY_FREE]));</div><div class='ctx'> 	seq_printf(seq, "\t\tuseless_loops: %llu\n",</div><div class='del'>-		   atomic64_read(&amp;sbi-&gt;s_bal_cX_failed[3]));</div><div class='del'>-	seq_printf(seq, "\textents_scanned: %u\n", atomic_read(&amp;sbi-&gt;s_bal_ex_scanned));</div><div class='add'>+		   atomic64_read(&amp;sbi-&gt;s_bal_cX_failed[CR_ANY_FREE]));</div><div class='add'>+</div><div class='add'>+	/* Aggregates */</div><div class='add'>+	seq_printf(seq, "\textents_scanned: %u\n",</div><div class='add'>+		   atomic_read(&amp;sbi-&gt;s_bal_ex_scanned));</div><div class='ctx'> 	seq_printf(seq, "\t\tgoal_hits: %u\n", atomic_read(&amp;sbi-&gt;s_bal_goals));</div><div class='add'>+	seq_printf(seq, "\t\tstream_goal_hits: %u\n",</div><div class='add'>+		   atomic_read(&amp;sbi-&gt;s_bal_stream_goals));</div><div class='add'>+	seq_printf(seq, "\t\tlen_goal_hits: %u\n",</div><div class='add'>+		   atomic_read(&amp;sbi-&gt;s_bal_len_goals));</div><div class='ctx'> 	seq_printf(seq, "\t\t2^n_hits: %u\n", atomic_read(&amp;sbi-&gt;s_bal_2orders));</div><div class='ctx'> 	seq_printf(seq, "\t\tbreaks: %u\n", atomic_read(&amp;sbi-&gt;s_bal_breaks));</div><div class='ctx'> 	seq_printf(seq, "\t\tlost: %u\n", atomic_read(&amp;sbi-&gt;s_mb_lost_chunks));</div><div class='del'>-</div><div class='ctx'> 	seq_printf(seq, "\tbuddies_generated: %u/%u\n",</div><div class='ctx'> 		   atomic_read(&amp;sbi-&gt;s_mb_buddies_generated),</div><div class='ctx'> 		   ext4_get_groups_count(sb));</div><div class='hunk'>@@ -2977,20 +3287,16 @@ int ext4_seq_mb_stats_show(struct seq_file *seq, void *offset)</div><div class='ctx'> 		   atomic64_read(&amp;sbi-&gt;s_mb_generation_time));</div><div class='ctx'> 	seq_printf(seq, "\tpreallocated: %u\n",</div><div class='ctx'> 		   atomic_read(&amp;sbi-&gt;s_mb_preallocated));</div><div class='del'>-	seq_printf(seq, "\tdiscarded: %u\n",</div><div class='del'>-		   atomic_read(&amp;sbi-&gt;s_mb_discarded));</div><div class='add'>+	seq_printf(seq, "\tdiscarded: %u\n", atomic_read(&amp;sbi-&gt;s_mb_discarded));</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void *ext4_mb_seq_structs_summary_start(struct seq_file *seq, loff_t *pos)</div><div class='del'>-__acquires(&amp;EXT4_SB(sb)-&gt;s_mb_rb_lock)</div><div class='ctx'> {</div><div class='del'>-	struct super_block *sb = PDE_DATA(file_inode(seq-&gt;file));</div><div class='add'>+	struct super_block *sb = pde_data(file_inode(seq-&gt;file));</div><div class='ctx'> 	unsigned long position;</div><div class='ctx'> </div><div class='del'>-	read_lock(&amp;EXT4_SB(sb)-&gt;s_mb_rb_lock);</div><div class='del'>-</div><div class='del'>-	if (*pos &lt; 0 || *pos &gt;= MB_NUM_ORDERS(sb) + 1)</div><div class='add'>+	if (*pos &lt; 0 || *pos &gt;= 2*MB_NUM_ORDERS(sb))</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	position = *pos + 1;</div><div class='ctx'> 	return (void *) ((unsigned long) position);</div><div class='hunk'>@@ -2998,11 +3304,11 @@ __acquires(&amp;EXT4_SB(sb)-&gt;s_mb_rb_lock)</div><div class='ctx'> </div><div class='ctx'> static void *ext4_mb_seq_structs_summary_next(struct seq_file *seq, void *v, loff_t *pos)</div><div class='ctx'> {</div><div class='del'>-	struct super_block *sb = PDE_DATA(file_inode(seq-&gt;file));</div><div class='add'>+	struct super_block *sb = pde_data(file_inode(seq-&gt;file));</div><div class='ctx'> 	unsigned long position;</div><div class='ctx'> </div><div class='ctx'> 	++*pos;</div><div class='del'>-	if (*pos &lt; 0 || *pos &gt;= MB_NUM_ORDERS(sb) + 1)</div><div class='add'>+	if (*pos &lt; 0 || *pos &gt;= 2*MB_NUM_ORDERS(sb))</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	position = *pos + 1;</div><div class='ctx'> 	return (void *) ((unsigned long) position);</div><div class='hunk'>@@ -3010,33 +3316,24 @@ static void *ext4_mb_seq_structs_summary_next(struct seq_file *seq, void *v, lof</div><div class='ctx'> </div><div class='ctx'> static int ext4_mb_seq_structs_summary_show(struct seq_file *seq, void *v)</div><div class='ctx'> {</div><div class='del'>-	struct super_block *sb = PDE_DATA(file_inode(seq-&gt;file));</div><div class='add'>+	struct super_block *sb = pde_data(file_inode(seq-&gt;file));</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> 	unsigned long position = ((unsigned long) v);</div><div class='ctx'> 	struct ext4_group_info *grp;</div><div class='del'>-	struct rb_node *n;</div><div class='del'>-	unsigned int count, min, max;</div><div class='add'>+	unsigned int count;</div><div class='add'>+	unsigned long idx;</div><div class='ctx'> </div><div class='ctx'> 	position--;</div><div class='ctx'> 	if (position &gt;= MB_NUM_ORDERS(sb)) {</div><div class='del'>-		seq_puts(seq, "fragment_size_tree:\n");</div><div class='del'>-		n = rb_first(&amp;sbi-&gt;s_mb_avg_fragment_size_root);</div><div class='del'>-		if (!n) {</div><div class='del'>-			seq_puts(seq, "\ttree_min: 0\n\ttree_max: 0\n\ttree_nodes: 0\n");</div><div class='del'>-			return 0;</div><div class='del'>-		}</div><div class='del'>-		grp = rb_entry(n, struct ext4_group_info, bb_avg_fragment_size_rb);</div><div class='del'>-		min = grp-&gt;bb_fragments ? grp-&gt;bb_free / grp-&gt;bb_fragments : 0;</div><div class='del'>-		count = 1;</div><div class='del'>-		while (rb_next(n)) {</div><div class='del'>-			count++;</div><div class='del'>-			n = rb_next(n);</div><div class='del'>-		}</div><div class='del'>-		grp = rb_entry(n, struct ext4_group_info, bb_avg_fragment_size_rb);</div><div class='del'>-		max = grp-&gt;bb_fragments ? grp-&gt;bb_free / grp-&gt;bb_fragments : 0;</div><div class='add'>+		position -= MB_NUM_ORDERS(sb);</div><div class='add'>+		if (position == 0)</div><div class='add'>+			seq_puts(seq, "avg_fragment_size_lists:\n");</div><div class='ctx'> </div><div class='del'>-		seq_printf(seq, "\ttree_min: %u\n\ttree_max: %u\n\ttree_nodes: %u\n",</div><div class='del'>-			   min, max, count);</div><div class='add'>+		count = 0;</div><div class='add'>+		xa_for_each(&amp;sbi-&gt;s_mb_avg_fragment_size[position], idx, grp)</div><div class='add'>+			count++;</div><div class='add'>+		seq_printf(seq, "\tlist_order_%u_groups: %u\n",</div><div class='add'>+					(unsigned int)position, count);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -3046,8 +3343,7 @@ static int ext4_mb_seq_structs_summary_show(struct seq_file *seq, void *v)</div><div class='ctx'> 		seq_puts(seq, "max_free_order_lists:\n");</div><div class='ctx'> 	}</div><div class='ctx'> 	count = 0;</div><div class='del'>-	list_for_each_entry(grp, &amp;sbi-&gt;s_mb_largest_free_orders[position],</div><div class='del'>-			    bb_largest_free_order_node)</div><div class='add'>+	xa_for_each(&amp;sbi-&gt;s_mb_largest_free_orders[position], idx, grp)</div><div class='ctx'> 		count++;</div><div class='ctx'> 	seq_printf(seq, "\tlist_order_%u_groups: %u\n",</div><div class='ctx'> 		   (unsigned int)position, count);</div><div class='hunk'>@@ -3056,11 +3352,7 @@ static int ext4_mb_seq_structs_summary_show(struct seq_file *seq, void *v)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void ext4_mb_seq_structs_summary_stop(struct seq_file *seq, void *v)</div><div class='del'>-__releases(&amp;EXT4_SB(sb)-&gt;s_mb_rb_lock)</div><div class='ctx'> {</div><div class='del'>-	struct super_block *sb = PDE_DATA(file_inode(seq-&gt;file));</div><div class='del'>-</div><div class='del'>-	read_unlock(&amp;EXT4_SB(sb)-&gt;s_mb_rb_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct seq_operations ext4_mb_seq_structs_summary_ops = {</div><div class='hunk'>@@ -3138,7 +3430,7 @@ int ext4_mb_add_groupinfo(struct super_block *sb, ext4_group_t group,</div><div class='ctx'> 		if (meta_group_info == NULL) {</div><div class='ctx'> 			ext4_msg(sb, KERN_ERR, "can't allocate mem "</div><div class='ctx'> 				 "for a buddy group");</div><div class='del'>-			goto exit_meta_group_info;</div><div class='add'>+			return -ENOMEM;</div><div class='ctx'> 		}</div><div class='ctx'> 		rcu_read_lock();</div><div class='ctx'> 		rcu_dereference(sbi-&gt;s_group_info)[idx] = meta_group_info;</div><div class='hunk'>@@ -3172,9 +3464,8 @@ int ext4_mb_add_groupinfo(struct super_block *sb, ext4_group_t group,</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;meta_group_info[i]-&gt;bb_prealloc_list);</div><div class='ctx'> 	init_rwsem(&amp;meta_group_info[i]-&gt;alloc_sem);</div><div class='ctx'> 	meta_group_info[i]-&gt;bb_free_root = RB_ROOT;</div><div class='del'>-	INIT_LIST_HEAD(&amp;meta_group_info[i]-&gt;bb_largest_free_order_node);</div><div class='del'>-	RB_CLEAR_NODE(&amp;meta_group_info[i]-&gt;bb_avg_fragment_size_rb);</div><div class='ctx'> 	meta_group_info[i]-&gt;bb_largest_free_order = -1;  /* uninit */</div><div class='add'>+	meta_group_info[i]-&gt;bb_avg_fragment_size_order = -1;  /* uninit */</div><div class='ctx'> 	meta_group_info[i]-&gt;bb_group = group;</div><div class='ctx'> </div><div class='ctx'> 	mb_group_bb_bitmap_alloc(sb, meta_group_info[i], group);</div><div class='hunk'>@@ -3191,7 +3482,6 @@ exit_group_info:</div><div class='ctx'> 		group_info[idx] = NULL;</div><div class='ctx'> 		rcu_read_unlock();</div><div class='ctx'> 	}</div><div class='del'>-exit_meta_group_info:</div><div class='ctx'> 	return -ENOMEM;</div><div class='ctx'> } /* ext4_mb_add_groupinfo */</div><div class='ctx'> </div><div class='hunk'>@@ -3220,6 +3510,8 @@ static int ext4_mb_init_backend(struct super_block *sb)</div><div class='ctx'> 	 * this will avoid confusion if it ever shows up during debugging. */</div><div class='ctx'> 	sbi-&gt;s_buddy_cache-&gt;i_ino = EXT4_BAD_INO;</div><div class='ctx'> 	EXT4_I(sbi-&gt;s_buddy_cache)-&gt;i_disksize = 0;</div><div class='add'>+	ext4_set_inode_mapping_order(sbi-&gt;s_buddy_cache);</div><div class='add'>+</div><div class='ctx'> 	for (i = 0; i &lt; ngroups; i++) {</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 		desc = ext4_get_group_desc(sb, i, NULL);</div><div class='hunk'>@@ -3248,10 +3540,11 @@ static int ext4_mb_init_backend(struct super_block *sb)</div><div class='ctx'> 	}</div><div class='ctx'> 	if (sbi-&gt;s_mb_prefetch &gt; ext4_get_groups_count(sb))</div><div class='ctx'> 		sbi-&gt;s_mb_prefetch = ext4_get_groups_count(sb);</div><div class='del'>-	/* now many real IOs to prefetch within a single allocation at cr=0</div><div class='del'>-	 * given cr=0 is an CPU-related optimization we shouldn't try to</div><div class='del'>-	 * load too many groups, at some point we should start to use what</div><div class='del'>-	 * we've got in memory.</div><div class='add'>+	/*</div><div class='add'>+	 * now many real IOs to prefetch within a single allocation at</div><div class='add'>+	 * CR_POWER2_ALIGNED. Given CR_POWER2_ALIGNED is an CPU-related</div><div class='add'>+	 * optimization we shouldn't try to load too many groups, at some point</div><div class='add'>+	 * we should start to use what we've got in memory.</div><div class='ctx'> 	 * with an average random access time 5ms, it'd take a second to get</div><div class='ctx'> 	 * 200 groups (* N with flex_bg), so let's make this limit 4</div><div class='ctx'> 	 */</div><div class='hunk'>@@ -3263,8 +3556,12 @@ static int ext4_mb_init_backend(struct super_block *sb)</div><div class='ctx'> </div><div class='ctx'> err_freebuddy:</div><div class='ctx'> 	cachep = get_groupinfo_cache(sb-&gt;s_blocksize_bits);</div><div class='del'>-	while (i-- &gt; 0)</div><div class='del'>-		kmem_cache_free(cachep, ext4_get_group_info(sb, i));</div><div class='add'>+	while (i-- &gt; 0) {</div><div class='add'>+		struct ext4_group_info *grp = ext4_get_group_info(sb, i);</div><div class='add'>+</div><div class='add'>+		if (grp)</div><div class='add'>+			kmem_cache_free(cachep, grp);</div><div class='add'>+	}</div><div class='ctx'> 	i = sbi-&gt;s_group_info_size;</div><div class='ctx'> 	rcu_read_lock();</div><div class='ctx'> 	group_info = rcu_dereference(sbi-&gt;s_group_info);</div><div class='hunk'>@@ -3335,11 +3632,10 @@ static void ext4_discard_work(struct work_struct *work)</div><div class='ctx'> 	struct super_block *sb = sbi-&gt;s_sb;</div><div class='ctx'> 	struct ext4_free_data *fd, *nfd;</div><div class='ctx'> 	struct ext4_buddy e4b;</div><div class='del'>-	struct list_head discard_list;</div><div class='add'>+	LIST_HEAD(discard_list);</div><div class='ctx'> 	ext4_group_t grp, load_grp;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='del'>-	INIT_LIST_HEAD(&amp;discard_list);</div><div class='ctx'> 	spin_lock(&amp;sbi-&gt;s_md_lock);</div><div class='ctx'> 	list_splice_init(&amp;sbi-&gt;s_discard_list, &amp;discard_list);</div><div class='ctx'> 	spin_unlock(&amp;sbi-&gt;s_md_lock);</div><div class='hunk'>@@ -3379,6 +3675,30 @@ static void ext4_discard_work(struct work_struct *work)</div><div class='ctx'> 		ext4_mb_unload_buddy(&amp;e4b);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline void ext4_mb_avg_fragment_size_destroy(struct ext4_sb_info *sbi)</div><div class='add'>+{</div><div class='add'>+	if (!sbi-&gt;s_mb_avg_fragment_size)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	for (int i = 0; i &lt; MB_NUM_ORDERS(sbi-&gt;s_sb); i++)</div><div class='add'>+		xa_destroy(&amp;sbi-&gt;s_mb_avg_fragment_size[i]);</div><div class='add'>+</div><div class='add'>+	kfree(sbi-&gt;s_mb_avg_fragment_size);</div><div class='add'>+	sbi-&gt;s_mb_avg_fragment_size = NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void ext4_mb_largest_free_orders_destroy(struct ext4_sb_info *sbi)</div><div class='add'>+{</div><div class='add'>+	if (!sbi-&gt;s_mb_largest_free_orders)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	for (int i = 0; i &lt; MB_NUM_ORDERS(sbi-&gt;s_sb); i++)</div><div class='add'>+		xa_destroy(&amp;sbi-&gt;s_mb_largest_free_orders[i]);</div><div class='add'>+</div><div class='add'>+	kfree(sbi-&gt;s_mb_largest_free_orders);</div><div class='add'>+	sbi-&gt;s_mb_largest_free_orders = NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> int ext4_mb_init(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='hunk'>@@ -3423,30 +3743,30 @@ int ext4_mb_init(struct super_block *sb)</div><div class='ctx'> 		i++;</div><div class='ctx'> 	} while (i &lt; MB_NUM_ORDERS(sb));</div><div class='ctx'> </div><div class='del'>-	sbi-&gt;s_mb_avg_fragment_size_root = RB_ROOT;</div><div class='del'>-	sbi-&gt;s_mb_largest_free_orders =</div><div class='del'>-		kmalloc_array(MB_NUM_ORDERS(sb), sizeof(struct list_head),</div><div class='add'>+	sbi-&gt;s_mb_avg_fragment_size =</div><div class='add'>+		kmalloc_array(MB_NUM_ORDERS(sb), sizeof(struct xarray),</div><div class='ctx'> 			GFP_KERNEL);</div><div class='del'>-	if (!sbi-&gt;s_mb_largest_free_orders) {</div><div class='add'>+	if (!sbi-&gt;s_mb_avg_fragment_size) {</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	sbi-&gt;s_mb_largest_free_orders_locks =</div><div class='del'>-		kmalloc_array(MB_NUM_ORDERS(sb), sizeof(rwlock_t),</div><div class='add'>+	for (i = 0; i &lt; MB_NUM_ORDERS(sb); i++)</div><div class='add'>+		xa_init(&amp;sbi-&gt;s_mb_avg_fragment_size[i]);</div><div class='add'>+</div><div class='add'>+	sbi-&gt;s_mb_largest_free_orders =</div><div class='add'>+		kmalloc_array(MB_NUM_ORDERS(sb), sizeof(struct xarray),</div><div class='ctx'> 			GFP_KERNEL);</div><div class='del'>-	if (!sbi-&gt;s_mb_largest_free_orders_locks) {</div><div class='add'>+	if (!sbi-&gt;s_mb_largest_free_orders) {</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	for (i = 0; i &lt; MB_NUM_ORDERS(sb); i++) {</div><div class='del'>-		INIT_LIST_HEAD(&amp;sbi-&gt;s_mb_largest_free_orders[i]);</div><div class='del'>-		rwlock_init(&amp;sbi-&gt;s_mb_largest_free_orders_locks[i]);</div><div class='del'>-	}</div><div class='del'>-	rwlock_init(&amp;sbi-&gt;s_mb_rb_lock);</div><div class='add'>+	for (i = 0; i &lt; MB_NUM_ORDERS(sb); i++)</div><div class='add'>+		xa_init(&amp;sbi-&gt;s_mb_largest_free_orders[i]);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock_init(&amp;sbi-&gt;s_md_lock);</div><div class='del'>-	sbi-&gt;s_mb_free_pending = 0;</div><div class='del'>-	INIT_LIST_HEAD(&amp;sbi-&gt;s_freed_data_list);</div><div class='add'>+	atomic_set(&amp;sbi-&gt;s_mb_free_pending, 0);</div><div class='add'>+	INIT_LIST_HEAD(&amp;sbi-&gt;s_freed_data_list[0]);</div><div class='add'>+	INIT_LIST_HEAD(&amp;sbi-&gt;s_freed_data_list[1]);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;sbi-&gt;s_discard_list);</div><div class='ctx'> 	INIT_WORK(&amp;sbi-&gt;s_discard_work, ext4_discard_work);</div><div class='ctx'> 	atomic_set(&amp;sbi-&gt;s_retry_alloc_pending, 0);</div><div class='hunk'>@@ -3456,7 +3776,8 @@ int ext4_mb_init(struct super_block *sb)</div><div class='ctx'> 	sbi-&gt;s_mb_stats = MB_DEFAULT_STATS;</div><div class='ctx'> 	sbi-&gt;s_mb_stream_request = MB_DEFAULT_STREAM_THRESHOLD;</div><div class='ctx'> 	sbi-&gt;s_mb_order2_reqs = MB_DEFAULT_ORDER2_REQS;</div><div class='del'>-	sbi-&gt;s_mb_max_inode_prealloc = MB_DEFAULT_MAX_INODE_PREALLOC;</div><div class='add'>+	sbi-&gt;s_mb_best_avail_max_trim_order = MB_DEFAULT_BEST_AVAIL_TRIM_ORDER;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The default group preallocation is 512, which for 4k block</div><div class='ctx'> 	 * sizes translates to 2 megabytes.  However for bigalloc file</div><div class='hunk'>@@ -3481,13 +3802,22 @@ int ext4_mb_init(struct super_block *sb)</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (sbi-&gt;s_stripe &gt; 1) {</div><div class='ctx'> 		sbi-&gt;s_mb_group_prealloc = roundup(</div><div class='del'>-			sbi-&gt;s_mb_group_prealloc, sbi-&gt;s_stripe);</div><div class='add'>+			sbi-&gt;s_mb_group_prealloc, EXT4_NUM_B2C(sbi, sbi-&gt;s_stripe));</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	sbi-&gt;s_mb_nr_global_goals = umin(num_possible_cpus(),</div><div class='add'>+					 DIV_ROUND_UP(sbi-&gt;s_groups_count, 4));</div><div class='add'>+	sbi-&gt;s_mb_last_groups = kcalloc(sbi-&gt;s_mb_nr_global_goals,</div><div class='add'>+					sizeof(ext4_group_t), GFP_KERNEL);</div><div class='add'>+	if (sbi-&gt;s_mb_last_groups == NULL) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	sbi-&gt;s_locality_groups = alloc_percpu(struct ext4_locality_group);</div><div class='ctx'> 	if (sbi-&gt;s_locality_groups == NULL) {</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='add'>+		goto out_free_last_groups;</div><div class='ctx'> 	}</div><div class='ctx'> 	for_each_possible_cpu(i) {</div><div class='ctx'> 		struct ext4_locality_group *lg;</div><div class='hunk'>@@ -3498,7 +3828,7 @@ int ext4_mb_init(struct super_block *sb)</div><div class='ctx'> 		spin_lock_init(&amp;lg-&gt;lg_prealloc_lock);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (blk_queue_nonrot(bdev_get_queue(sb-&gt;s_bdev)))</div><div class='add'>+	if (bdev_nonrot(sb-&gt;s_bdev))</div><div class='ctx'> 		sbi-&gt;s_mb_max_linear_groups = 0;</div><div class='ctx'> 	else</div><div class='ctx'> 		sbi-&gt;s_mb_max_linear_groups = MB_DEFAULT_LINEAR_LIMIT;</div><div class='hunk'>@@ -3512,9 +3842,12 @@ int ext4_mb_init(struct super_block *sb)</div><div class='ctx'> out_free_locality_groups:</div><div class='ctx'> 	free_percpu(sbi-&gt;s_locality_groups);</div><div class='ctx'> 	sbi-&gt;s_locality_groups = NULL;</div><div class='add'>+out_free_last_groups:</div><div class='add'>+	kfree(sbi-&gt;s_mb_last_groups);</div><div class='add'>+	sbi-&gt;s_mb_last_groups = NULL;</div><div class='ctx'> out:</div><div class='del'>-	kfree(sbi-&gt;s_mb_largest_free_orders);</div><div class='del'>-	kfree(sbi-&gt;s_mb_largest_free_orders_locks);</div><div class='add'>+	ext4_mb_avg_fragment_size_destroy(sbi);</div><div class='add'>+	ext4_mb_largest_free_orders_destroy(sbi);</div><div class='ctx'> 	kfree(sbi-&gt;s_mb_offsets);</div><div class='ctx'> 	sbi-&gt;s_mb_offsets = NULL;</div><div class='ctx'> 	kfree(sbi-&gt;s_mb_maxs);</div><div class='hunk'>@@ -3538,7 +3871,7 @@ static int ext4_mb_cleanup_pa(struct ext4_group_info *grp)</div><div class='ctx'> 	return count;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int ext4_mb_release(struct super_block *sb)</div><div class='add'>+void ext4_mb_release(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	ext4_group_t ngroups = ext4_get_groups_count(sb);</div><div class='ctx'> 	ext4_group_t i;</div><div class='hunk'>@@ -3560,6 +3893,8 @@ int ext4_mb_release(struct super_block *sb)</div><div class='ctx'> 		for (i = 0; i &lt; ngroups; i++) {</div><div class='ctx'> 			cond_resched();</div><div class='ctx'> 			grinfo = ext4_get_group_info(sb, i);</div><div class='add'>+			if (!grinfo)</div><div class='add'>+				continue;</div><div class='ctx'> 			mb_group_bb_bitmap_free(grinfo);</div><div class='ctx'> 			ext4_lock_group(sb, i);</div><div class='ctx'> 			count = ext4_mb_cleanup_pa(grinfo);</div><div class='hunk'>@@ -3579,8 +3914,8 @@ int ext4_mb_release(struct super_block *sb)</div><div class='ctx'> 		kvfree(group_info);</div><div class='ctx'> 		rcu_read_unlock();</div><div class='ctx'> 	}</div><div class='del'>-	kfree(sbi-&gt;s_mb_largest_free_orders);</div><div class='del'>-	kfree(sbi-&gt;s_mb_largest_free_orders_locks);</div><div class='add'>+	ext4_mb_avg_fragment_size_destroy(sbi);</div><div class='add'>+	ext4_mb_largest_free_orders_destroy(sbi);</div><div class='ctx'> 	kfree(sbi-&gt;s_mb_offsets);</div><div class='ctx'> 	kfree(sbi-&gt;s_mb_maxs);</div><div class='ctx'> 	iput(sbi-&gt;s_buddy_cache);</div><div class='hunk'>@@ -3610,13 +3945,11 @@ int ext4_mb_release(struct super_block *sb)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	free_percpu(sbi-&gt;s_locality_groups);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='add'>+	kfree(sbi-&gt;s_mb_last_groups);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int ext4_issue_discard(struct super_block *sb,</div><div class='del'>-		ext4_group_t block_group, ext4_grpblk_t cluster, int count,</div><div class='del'>-		struct bio **biop)</div><div class='add'>+		ext4_group_t block_group, ext4_grpblk_t cluster, int count)</div><div class='ctx'> {</div><div class='ctx'> 	ext4_fsblk_t discard_block;</div><div class='ctx'> </div><div class='hunk'>@@ -3625,13 +3958,8 @@ static inline int ext4_issue_discard(struct super_block *sb,</div><div class='ctx'> 	count = EXT4_C2B(EXT4_SB(sb), count);</div><div class='ctx'> 	trace_ext4_discard_blocks(sb,</div><div class='ctx'> 			(unsigned long long) discard_block, count);</div><div class='del'>-	if (biop) {</div><div class='del'>-		return __blkdev_issue_discard(sb-&gt;s_bdev,</div><div class='del'>-			(sector_t)discard_block &lt;&lt; (sb-&gt;s_blocksize_bits - 9),</div><div class='del'>-			(sector_t)count &lt;&lt; (sb-&gt;s_blocksize_bits - 9),</div><div class='del'>-			GFP_NOFS, 0, biop);</div><div class='del'>-	} else</div><div class='del'>-		return sb_issue_discard(sb, discard_block, count, GFP_NOFS, 0);</div><div class='add'>+</div><div class='add'>+	return sb_issue_discard(sb, discard_block, count, GFP_NOFS, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void ext4_free_data_in_buddy(struct super_block *sb,</div><div class='hunk'>@@ -3639,7 +3967,7 @@ static void ext4_free_data_in_buddy(struct super_block *sb,</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_buddy e4b;</div><div class='ctx'> 	struct ext4_group_info *db;</div><div class='del'>-	int err, count = 0, count2 = 0;</div><div class='add'>+	int err, count = 0;</div><div class='ctx'> </div><div class='ctx'> 	mb_debug(sb, "gonna free %u blocks in group %u (0x%p):",</div><div class='ctx'> 		 entry-&gt;efd_count, entry-&gt;efd_group, entry);</div><div class='hunk'>@@ -3648,14 +3976,10 @@ static void ext4_free_data_in_buddy(struct super_block *sb,</div><div class='ctx'> 	/* we expect to find existing buddy because it's pinned */</div><div class='ctx'> 	BUG_ON(err != 0);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;EXT4_SB(sb)-&gt;s_md_lock);</div><div class='del'>-	EXT4_SB(sb)-&gt;s_mb_free_pending -= entry-&gt;efd_count;</div><div class='del'>-	spin_unlock(&amp;EXT4_SB(sb)-&gt;s_md_lock);</div><div class='del'>-</div><div class='add'>+	atomic_sub(entry-&gt;efd_count, &amp;EXT4_SB(sb)-&gt;s_mb_free_pending);</div><div class='ctx'> 	db = e4b.bd_info;</div><div class='ctx'> 	/* there are blocks to put in buddy to make them really free */</div><div class='ctx'> 	count += entry-&gt;efd_count;</div><div class='del'>-	count2++;</div><div class='ctx'> 	ext4_lock_group(sb, entry-&gt;efd_group);</div><div class='ctx'> 	/* Take it out of per group rb tree */</div><div class='ctx'> 	rb_erase(&amp;entry-&gt;efd_node, &amp;(db-&gt;bb_free_root));</div><div class='hunk'>@@ -3664,24 +3988,20 @@ static void ext4_free_data_in_buddy(struct super_block *sb,</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Clear the trimmed flag for the group so that the next</div><div class='ctx'> 	 * ext4_trim_fs can trim it.</div><div class='del'>-	 * If the volume is mounted with -o discard, online discard</div><div class='del'>-	 * is supported and the free blocks will be trimmed online.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!test_opt(sb, DISCARD))</div><div class='del'>-		EXT4_MB_GRP_CLEAR_TRIMMED(db);</div><div class='add'>+	EXT4_MB_GRP_CLEAR_TRIMMED(db);</div><div class='ctx'> </div><div class='ctx'> 	if (!db-&gt;bb_free_root.rb_node) {</div><div class='ctx'> 		/* No more items in the per group rb tree</div><div class='ctx'> 		 * balance refcounts from ext4_mb_free_metadata()</div><div class='ctx'> 		 */</div><div class='del'>-		put_page(e4b.bd_buddy_page);</div><div class='del'>-		put_page(e4b.bd_bitmap_page);</div><div class='add'>+		folio_put(e4b.bd_buddy_folio);</div><div class='add'>+		folio_put(e4b.bd_bitmap_folio);</div><div class='ctx'> 	}</div><div class='ctx'> 	ext4_unlock_group(sb, entry-&gt;efd_group);</div><div class='ctx'> 	ext4_mb_unload_buddy(&amp;e4b);</div><div class='ctx'> </div><div class='del'>-	mb_debug(sb, "freed %d blocks in %d structures\n", count,</div><div class='del'>-		 count2);</div><div class='add'>+	mb_debug(sb, "freed %d blocks in 1 structures\n", count);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -3692,22 +4012,11 @@ void ext4_process_freed_data(struct super_block *sb, tid_t commit_tid)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> 	struct ext4_free_data *entry, *tmp;</div><div class='del'>-	struct list_head freed_data_list;</div><div class='del'>-	struct list_head *cut_pos = NULL;</div><div class='add'>+	LIST_HEAD(freed_data_list);</div><div class='add'>+	struct list_head *s_freed_head = &amp;sbi-&gt;s_freed_data_list[commit_tid &amp; 1];</div><div class='ctx'> 	bool wake;</div><div class='ctx'> </div><div class='del'>-	INIT_LIST_HEAD(&amp;freed_data_list);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;sbi-&gt;s_md_lock);</div><div class='del'>-	list_for_each_entry(entry, &amp;sbi-&gt;s_freed_data_list, efd_list) {</div><div class='del'>-		if (entry-&gt;efd_tid != commit_tid)</div><div class='del'>-			break;</div><div class='del'>-		cut_pos = &amp;entry-&gt;efd_list;</div><div class='del'>-	}</div><div class='del'>-	if (cut_pos)</div><div class='del'>-		list_cut_position(&amp;freed_data_list, &amp;sbi-&gt;s_freed_data_list,</div><div class='del'>-				  cut_pos);</div><div class='del'>-	spin_unlock(&amp;sbi-&gt;s_md_lock);</div><div class='add'>+	list_replace_init(s_freed_head, &amp;freed_data_list);</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(entry, &amp;freed_data_list, efd_list)</div><div class='ctx'> 		ext4_free_data_in_buddy(sb, entry);</div><div class='hunk'>@@ -3718,7 +4027,7 @@ void ext4_process_freed_data(struct super_block *sb, tid_t commit_tid)</div><div class='ctx'> 		list_splice_tail(&amp;freed_data_list, &amp;sbi-&gt;s_discard_list);</div><div class='ctx'> 		spin_unlock(&amp;sbi-&gt;s_md_lock);</div><div class='ctx'> 		if (wake)</div><div class='del'>-			queue_work(system_unbound_wq, &amp;sbi-&gt;s_discard_work);</div><div class='add'>+			queue_work(system_dfl_wq, &amp;sbi-&gt;s_discard_work);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		list_for_each_entry_safe(entry, tmp, &amp;freed_data_list, efd_list)</div><div class='ctx'> 			kmem_cache_free(ext4_free_data_cachep, entry);</div><div class='hunk'>@@ -3765,6 +4074,111 @@ void ext4_exit_mballoc(void)</div><div class='ctx'> 	ext4_groupinfo_destroy_slabs();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#define EXT4_MB_BITMAP_MARKED_CHECK 0x0001</div><div class='add'>+#define EXT4_MB_SYNC_UPDATE 0x0002</div><div class='add'>+static int</div><div class='add'>+ext4_mb_mark_context(handle_t *handle, struct super_block *sb, bool state,</div><div class='add'>+		     ext4_group_t group, ext4_grpblk_t blkoff,</div><div class='add'>+		     ext4_grpblk_t len, int flags, ext4_grpblk_t *ret_changed)</div><div class='add'>+{</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	struct buffer_head *bitmap_bh = NULL;</div><div class='add'>+	struct ext4_group_desc *gdp;</div><div class='add'>+	struct buffer_head *gdp_bh;</div><div class='add'>+	int err;</div><div class='add'>+	unsigned int i, already, changed = len;</div><div class='add'>+</div><div class='add'>+	KUNIT_STATIC_STUB_REDIRECT(ext4_mb_mark_context,</div><div class='add'>+				   handle, sb, state, group, blkoff, len,</div><div class='add'>+				   flags, ret_changed);</div><div class='add'>+</div><div class='add'>+	if (ret_changed)</div><div class='add'>+		*ret_changed = 0;</div><div class='add'>+	bitmap_bh = ext4_read_block_bitmap(sb, group);</div><div class='add'>+	if (IS_ERR(bitmap_bh))</div><div class='add'>+		return PTR_ERR(bitmap_bh);</div><div class='add'>+</div><div class='add'>+	if (handle) {</div><div class='add'>+		BUFFER_TRACE(bitmap_bh, "getting write access");</div><div class='add'>+		err = ext4_journal_get_write_access(handle, sb, bitmap_bh,</div><div class='add'>+						    EXT4_JTR_NONE);</div><div class='add'>+		if (err)</div><div class='add'>+			goto out_err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	err = -EIO;</div><div class='add'>+	gdp = ext4_get_group_desc(sb, group, &amp;gdp_bh);</div><div class='add'>+	if (!gdp)</div><div class='add'>+		goto out_err;</div><div class='add'>+</div><div class='add'>+	if (handle) {</div><div class='add'>+		BUFFER_TRACE(gdp_bh, "get_write_access");</div><div class='add'>+		err = ext4_journal_get_write_access(handle, sb, gdp_bh,</div><div class='add'>+						    EXT4_JTR_NONE);</div><div class='add'>+		if (err)</div><div class='add'>+			goto out_err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ext4_lock_group(sb, group);</div><div class='add'>+	if (ext4_has_group_desc_csum(sb) &amp;&amp;</div><div class='add'>+	    (gdp-&gt;bg_flags &amp; cpu_to_le16(EXT4_BG_BLOCK_UNINIT))) {</div><div class='add'>+		gdp-&gt;bg_flags &amp;= cpu_to_le16(~EXT4_BG_BLOCK_UNINIT);</div><div class='add'>+		ext4_free_group_clusters_set(sb, gdp,</div><div class='add'>+			ext4_free_clusters_after_init(sb, group, gdp));</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (flags &amp; EXT4_MB_BITMAP_MARKED_CHECK) {</div><div class='add'>+		already = 0;</div><div class='add'>+		for (i = 0; i &lt; len; i++)</div><div class='add'>+			if (mb_test_bit(blkoff + i, bitmap_bh-&gt;b_data) ==</div><div class='add'>+					state)</div><div class='add'>+				already++;</div><div class='add'>+		changed = len - already;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (state) {</div><div class='add'>+		mb_set_bits(bitmap_bh-&gt;b_data, blkoff, len);</div><div class='add'>+		ext4_free_group_clusters_set(sb, gdp,</div><div class='add'>+			ext4_free_group_clusters(sb, gdp) - changed);</div><div class='add'>+	} else {</div><div class='add'>+		mb_clear_bits(bitmap_bh-&gt;b_data, blkoff, len);</div><div class='add'>+		ext4_free_group_clusters_set(sb, gdp,</div><div class='add'>+			ext4_free_group_clusters(sb, gdp) + changed);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ext4_block_bitmap_csum_set(sb, gdp, bitmap_bh);</div><div class='add'>+	ext4_group_desc_csum_set(sb, group, gdp);</div><div class='add'>+	ext4_unlock_group(sb, group);</div><div class='add'>+	if (ret_changed)</div><div class='add'>+		*ret_changed = changed;</div><div class='add'>+</div><div class='add'>+	if (sbi-&gt;s_log_groups_per_flex) {</div><div class='add'>+		ext4_group_t flex_group = ext4_flex_group(sbi, group);</div><div class='add'>+		struct flex_groups *fg = sbi_array_rcu_deref(sbi,</div><div class='add'>+					   s_flex_groups, flex_group);</div><div class='add'>+</div><div class='add'>+		if (state)</div><div class='add'>+			atomic64_sub(changed, &amp;fg-&gt;free_clusters);</div><div class='add'>+		else</div><div class='add'>+			atomic64_add(changed, &amp;fg-&gt;free_clusters);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	err = ext4_handle_dirty_metadata(handle, NULL, bitmap_bh);</div><div class='add'>+	if (err)</div><div class='add'>+		goto out_err;</div><div class='add'>+	err = ext4_handle_dirty_metadata(handle, NULL, gdp_bh);</div><div class='add'>+	if (err)</div><div class='add'>+		goto out_err;</div><div class='add'>+</div><div class='add'>+	if (flags &amp; EXT4_MB_SYNC_UPDATE) {</div><div class='add'>+		sync_dirty_buffer(bitmap_bh);</div><div class='add'>+		sync_dirty_buffer(gdp_bh);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+out_err:</div><div class='add'>+	brelse(bitmap_bh);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Check quota and mark chosen space (ac-&gt;ac_b_ex) non-free in bitmaps</div><div class='hunk'>@@ -3774,13 +4188,13 @@ static noinline_for_stack int</div><div class='ctx'> ext4_mb_mark_diskspace_used(struct ext4_allocation_context *ac,</div><div class='ctx'> 				handle_t *handle, unsigned int reserv_clstrs)</div><div class='ctx'> {</div><div class='del'>-	struct buffer_head *bitmap_bh = NULL;</div><div class='ctx'> 	struct ext4_group_desc *gdp;</div><div class='del'>-	struct buffer_head *gdp_bh;</div><div class='ctx'> 	struct ext4_sb_info *sbi;</div><div class='ctx'> 	struct super_block *sb;</div><div class='ctx'> 	ext4_fsblk_t block;</div><div class='ctx'> 	int err, len;</div><div class='add'>+	int flags = 0;</div><div class='add'>+	ext4_grpblk_t changed;</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(ac-&gt;ac_status != AC_STATUS_FOUND);</div><div class='ctx'> 	BUG_ON(ac-&gt;ac_b_ex.fe_len &lt;= 0);</div><div class='hunk'>@@ -3788,34 +4202,13 @@ ext4_mb_mark_diskspace_used(struct ext4_allocation_context *ac,</div><div class='ctx'> 	sb = ac-&gt;ac_sb;</div><div class='ctx'> 	sbi = EXT4_SB(sb);</div><div class='ctx'> </div><div class='del'>-	bitmap_bh = ext4_read_block_bitmap(sb, ac-&gt;ac_b_ex.fe_group);</div><div class='del'>-	if (IS_ERR(bitmap_bh)) {</div><div class='del'>-		err = PTR_ERR(bitmap_bh);</div><div class='del'>-		bitmap_bh = NULL;</div><div class='del'>-		goto out_err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	BUFFER_TRACE(bitmap_bh, "getting write access");</div><div class='del'>-	err = ext4_journal_get_write_access(handle, sb, bitmap_bh,</div><div class='del'>-					    EXT4_JTR_NONE);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out_err;</div><div class='del'>-</div><div class='del'>-	err = -EIO;</div><div class='del'>-	gdp = ext4_get_group_desc(sb, ac-&gt;ac_b_ex.fe_group, &amp;gdp_bh);</div><div class='add'>+	gdp = ext4_get_group_desc(sb, ac-&gt;ac_b_ex.fe_group, NULL);</div><div class='ctx'> 	if (!gdp)</div><div class='del'>-		goto out_err;</div><div class='del'>-</div><div class='add'>+		return -EIO;</div><div class='ctx'> 	ext4_debug("using block group %u(%d)\n", ac-&gt;ac_b_ex.fe_group,</div><div class='ctx'> 			ext4_free_group_clusters(sb, gdp));</div><div class='ctx'> </div><div class='del'>-	BUFFER_TRACE(gdp_bh, "get_write_access");</div><div class='del'>-	err = ext4_journal_get_write_access(handle, sb, gdp_bh, EXT4_JTR_NONE);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out_err;</div><div class='del'>-</div><div class='ctx'> 	block = ext4_grp_offs_to_block(sb, &amp;ac-&gt;ac_b_ex);</div><div class='del'>-</div><div class='ctx'> 	len = EXT4_C2B(sbi, ac-&gt;ac_b_ex.fe_len);</div><div class='ctx'> 	if (!ext4_inode_block_valid(ac-&gt;ac_inode, block, len)) {</div><div class='ctx'> 		ext4_error(sb, "Allocating blocks %llu-%llu which overlap "</div><div class='hunk'>@@ -3824,41 +4217,29 @@ ext4_mb_mark_diskspace_used(struct ext4_allocation_context *ac,</div><div class='ctx'> 		 * Fix the bitmap and return EFSCORRUPTED</div><div class='ctx'> 		 * We leak some of the blocks here.</div><div class='ctx'> 		 */</div><div class='del'>-		ext4_lock_group(sb, ac-&gt;ac_b_ex.fe_group);</div><div class='del'>-		ext4_set_bits(bitmap_bh-&gt;b_data, ac-&gt;ac_b_ex.fe_start,</div><div class='del'>-			      ac-&gt;ac_b_ex.fe_len);</div><div class='del'>-		ext4_unlock_group(sb, ac-&gt;ac_b_ex.fe_group);</div><div class='del'>-		err = ext4_handle_dirty_metadata(handle, NULL, bitmap_bh);</div><div class='add'>+		err = ext4_mb_mark_context(handle, sb, true,</div><div class='add'>+					   ac-&gt;ac_b_ex.fe_group,</div><div class='add'>+					   ac-&gt;ac_b_ex.fe_start,</div><div class='add'>+					   ac-&gt;ac_b_ex.fe_len,</div><div class='add'>+					   0, NULL);</div><div class='ctx'> 		if (!err)</div><div class='ctx'> 			err = -EFSCORRUPTED;</div><div class='del'>-		goto out_err;</div><div class='add'>+		return err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ext4_lock_group(sb, ac-&gt;ac_b_ex.fe_group);</div><div class='ctx'> #ifdef AGGRESSIVE_CHECK</div><div class='del'>-	{</div><div class='del'>-		int i;</div><div class='del'>-		for (i = 0; i &lt; ac-&gt;ac_b_ex.fe_len; i++) {</div><div class='del'>-			BUG_ON(mb_test_bit(ac-&gt;ac_b_ex.fe_start + i,</div><div class='del'>-						bitmap_bh-&gt;b_data));</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	flags |= EXT4_MB_BITMAP_MARKED_CHECK;</div><div class='ctx'> #endif</div><div class='del'>-	ext4_set_bits(bitmap_bh-&gt;b_data, ac-&gt;ac_b_ex.fe_start,</div><div class='del'>-		      ac-&gt;ac_b_ex.fe_len);</div><div class='del'>-	if (ext4_has_group_desc_csum(sb) &amp;&amp;</div><div class='del'>-	    (gdp-&gt;bg_flags &amp; cpu_to_le16(EXT4_BG_BLOCK_UNINIT))) {</div><div class='del'>-		gdp-&gt;bg_flags &amp;= cpu_to_le16(~EXT4_BG_BLOCK_UNINIT);</div><div class='del'>-		ext4_free_group_clusters_set(sb, gdp,</div><div class='del'>-					     ext4_free_clusters_after_init(sb,</div><div class='del'>-						ac-&gt;ac_b_ex.fe_group, gdp));</div><div class='del'>-	}</div><div class='del'>-	len = ext4_free_group_clusters(sb, gdp) - ac-&gt;ac_b_ex.fe_len;</div><div class='del'>-	ext4_free_group_clusters_set(sb, gdp, len);</div><div class='del'>-	ext4_block_bitmap_csum_set(sb, ac-&gt;ac_b_ex.fe_group, gdp, bitmap_bh);</div><div class='del'>-	ext4_group_desc_csum_set(sb, ac-&gt;ac_b_ex.fe_group, gdp);</div><div class='add'>+	err = ext4_mb_mark_context(handle, sb, true, ac-&gt;ac_b_ex.fe_group,</div><div class='add'>+				   ac-&gt;ac_b_ex.fe_start, ac-&gt;ac_b_ex.fe_len,</div><div class='add'>+				   flags, &amp;changed);</div><div class='add'>+</div><div class='add'>+	if (err &amp;&amp; changed == 0)</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='del'>-	ext4_unlock_group(sb, ac-&gt;ac_b_ex.fe_group);</div><div class='add'>+#ifdef AGGRESSIVE_CHECK</div><div class='add'>+	BUG_ON(changed != ac-&gt;ac_b_ex.fe_len);</div><div class='add'>+#endif</div><div class='ctx'> 	percpu_counter_sub(&amp;sbi-&gt;s_freeclusters_counter, ac-&gt;ac_b_ex.fe_len);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Now reduce the dirty block count also. Should not go negative</div><div class='hunk'>@@ -3868,21 +4249,6 @@ ext4_mb_mark_diskspace_used(struct ext4_allocation_context *ac,</div><div class='ctx'> 		percpu_counter_sub(&amp;sbi-&gt;s_dirtyclusters_counter,</div><div class='ctx'> 				   reserv_clstrs);</div><div class='ctx'> </div><div class='del'>-	if (sbi-&gt;s_log_groups_per_flex) {</div><div class='del'>-		ext4_group_t flex_group = ext4_flex_group(sbi,</div><div class='del'>-							  ac-&gt;ac_b_ex.fe_group);</div><div class='del'>-		atomic64_sub(ac-&gt;ac_b_ex.fe_len,</div><div class='del'>-			     &amp;sbi_array_rcu_deref(sbi, s_flex_groups,</div><div class='del'>-						  flex_group)-&gt;free_clusters);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	err = ext4_handle_dirty_metadata(handle, NULL, bitmap_bh);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out_err;</div><div class='del'>-	err = ext4_handle_dirty_metadata(handle, NULL, gdp_bh);</div><div class='del'>-</div><div class='del'>-out_err:</div><div class='del'>-	brelse(bitmap_bh);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3891,77 +4257,48 @@ out_err:</div><div class='ctx'>  * blocks in bitmaps and update counters.</div><div class='ctx'>  */</div><div class='ctx'> void ext4_mb_mark_bb(struct super_block *sb, ext4_fsblk_t block,</div><div class='del'>-			int len, int state)</div><div class='add'>+		     int len, bool state)</div><div class='ctx'> {</div><div class='del'>-	struct buffer_head *bitmap_bh = NULL;</div><div class='del'>-	struct ext4_group_desc *gdp;</div><div class='del'>-	struct buffer_head *gdp_bh;</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> 	ext4_group_t group;</div><div class='ctx'> 	ext4_grpblk_t blkoff;</div><div class='del'>-	int i, clen, err;</div><div class='del'>-	int already;</div><div class='del'>-</div><div class='del'>-	clen = EXT4_B2C(sbi, len);</div><div class='del'>-</div><div class='del'>-	ext4_get_group_no_and_offset(sb, block, &amp;group, &amp;blkoff);</div><div class='del'>-	bitmap_bh = ext4_read_block_bitmap(sb, group);</div><div class='del'>-	if (IS_ERR(bitmap_bh)) {</div><div class='del'>-		err = PTR_ERR(bitmap_bh);</div><div class='del'>-		bitmap_bh = NULL;</div><div class='del'>-		goto out_err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	err = -EIO;</div><div class='del'>-	gdp = ext4_get_group_desc(sb, group, &amp;gdp_bh);</div><div class='del'>-	if (!gdp)</div><div class='del'>-		goto out_err;</div><div class='del'>-</div><div class='del'>-	ext4_lock_group(sb, group);</div><div class='del'>-	already = 0;</div><div class='del'>-	for (i = 0; i &lt; clen; i++)</div><div class='del'>-		if (!mb_test_bit(blkoff + i, bitmap_bh-&gt;b_data) == !state)</div><div class='del'>-			already++;</div><div class='del'>-</div><div class='del'>-	if (state)</div><div class='del'>-		ext4_set_bits(bitmap_bh-&gt;b_data, blkoff, clen);</div><div class='del'>-	else</div><div class='del'>-		mb_test_and_clear_bits(bitmap_bh-&gt;b_data, blkoff, clen);</div><div class='del'>-	if (ext4_has_group_desc_csum(sb) &amp;&amp;</div><div class='del'>-	    (gdp-&gt;bg_flags &amp; cpu_to_le16(EXT4_BG_BLOCK_UNINIT))) {</div><div class='del'>-		gdp-&gt;bg_flags &amp;= cpu_to_le16(~EXT4_BG_BLOCK_UNINIT);</div><div class='del'>-		ext4_free_group_clusters_set(sb, gdp,</div><div class='del'>-					     ext4_free_clusters_after_init(sb,</div><div class='del'>-						group, gdp));</div><div class='del'>-	}</div><div class='del'>-	if (state)</div><div class='del'>-		clen = ext4_free_group_clusters(sb, gdp) - clen + already;</div><div class='del'>-	else</div><div class='del'>-		clen = ext4_free_group_clusters(sb, gdp) + clen - already;</div><div class='add'>+	int err = 0;</div><div class='add'>+	unsigned int clen, thisgrp_len;</div><div class='ctx'> </div><div class='del'>-	ext4_free_group_clusters_set(sb, gdp, clen);</div><div class='del'>-	ext4_block_bitmap_csum_set(sb, group, gdp, bitmap_bh);</div><div class='del'>-	ext4_group_desc_csum_set(sb, group, gdp);</div><div class='add'>+	while (len &gt; 0) {</div><div class='add'>+		ext4_get_group_no_and_offset(sb, block, &amp;group, &amp;blkoff);</div><div class='ctx'> </div><div class='del'>-	ext4_unlock_group(sb, group);</div><div class='add'>+		/*</div><div class='add'>+		 * Check to see if we are freeing blocks across a group</div><div class='add'>+		 * boundary.</div><div class='add'>+		 * In case of flex_bg, this can happen that (block, len) may</div><div class='add'>+		 * span across more than one group. In that case we need to</div><div class='add'>+		 * get the corresponding group metadata to work with.</div><div class='add'>+		 * For this we have goto again loop.</div><div class='add'>+		 */</div><div class='add'>+		thisgrp_len = min_t(unsigned int, (unsigned int)len,</div><div class='add'>+			EXT4_BLOCKS_PER_GROUP(sb) - EXT4_C2B(sbi, blkoff));</div><div class='add'>+		clen = EXT4_NUM_B2C(sbi, thisgrp_len);</div><div class='add'>+</div><div class='add'>+		if (!ext4_sb_block_valid(sb, NULL, block, thisgrp_len)) {</div><div class='add'>+			ext4_error(sb, "Marking blocks in system zone - "</div><div class='add'>+				   "Block = %llu, len = %u",</div><div class='add'>+				   block, thisgrp_len);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	if (sbi-&gt;s_log_groups_per_flex) {</div><div class='del'>-		ext4_group_t flex_group = ext4_flex_group(sbi, group);</div><div class='add'>+		err = ext4_mb_mark_context(NULL, sb, state,</div><div class='add'>+					   group, blkoff, clen,</div><div class='add'>+					   EXT4_MB_BITMAP_MARKED_CHECK |</div><div class='add'>+					   EXT4_MB_SYNC_UPDATE,</div><div class='add'>+					   NULL);</div><div class='add'>+		if (err)</div><div class='add'>+			break;</div><div class='ctx'> </div><div class='del'>-		atomic64_sub(len,</div><div class='del'>-			     &amp;sbi_array_rcu_deref(sbi, s_flex_groups,</div><div class='del'>-						  flex_group)-&gt;free_clusters);</div><div class='add'>+		block += thisgrp_len;</div><div class='add'>+		len -= thisgrp_len;</div><div class='add'>+		BUG_ON(len &lt; 0);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	err = ext4_handle_dirty_metadata(NULL, NULL, bitmap_bh);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out_err;</div><div class='del'>-	sync_dirty_buffer(bitmap_bh);</div><div class='del'>-	err = ext4_handle_dirty_metadata(NULL, NULL, gdp_bh);</div><div class='del'>-	sync_dirty_buffer(gdp_bh);</div><div class='del'>-</div><div class='del'>-out_err:</div><div class='del'>-	brelse(bitmap_bh);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -3984,6 +4321,197 @@ static void ext4_mb_normalize_group_request(struct ext4_allocation_context *ac)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * This function returns the next element to look at during inode</div><div class='add'>+ * PA rbtree walk. We assume that we have held the inode PA rbtree lock</div><div class='add'>+ * (ei-&gt;i_prealloc_lock)</div><div class='add'>+ *</div><div class='add'>+ * new_start	The start of the range we want to compare</div><div class='add'>+ * cur_start	The existing start that we are comparing against</div><div class='add'>+ * node	The node of the rb_tree</div><div class='add'>+ */</div><div class='add'>+static inline struct rb_node*</div><div class='add'>+ext4_mb_pa_rb_next_iter(ext4_lblk_t new_start, ext4_lblk_t cur_start, struct rb_node *node)</div><div class='add'>+{</div><div class='add'>+	if (new_start &lt; cur_start)</div><div class='add'>+		return node-&gt;rb_left;</div><div class='add'>+	else</div><div class='add'>+		return node-&gt;rb_right;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void</div><div class='add'>+ext4_mb_pa_assert_overlap(struct ext4_allocation_context *ac,</div><div class='add'>+			  ext4_lblk_t start, loff_t end)</div><div class='add'>+{</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(ac-&gt;ac_sb);</div><div class='add'>+	struct ext4_inode_info *ei = EXT4_I(ac-&gt;ac_inode);</div><div class='add'>+	struct ext4_prealloc_space *tmp_pa;</div><div class='add'>+	ext4_lblk_t tmp_pa_start;</div><div class='add'>+	loff_t tmp_pa_end;</div><div class='add'>+	struct rb_node *iter;</div><div class='add'>+</div><div class='add'>+	read_lock(&amp;ei-&gt;i_prealloc_lock);</div><div class='add'>+	for (iter = ei-&gt;i_prealloc_node.rb_node; iter;</div><div class='add'>+	     iter = ext4_mb_pa_rb_next_iter(start, tmp_pa_start, iter)) {</div><div class='add'>+		tmp_pa = rb_entry(iter, struct ext4_prealloc_space,</div><div class='add'>+				  pa_node.inode_node);</div><div class='add'>+		tmp_pa_start = tmp_pa-&gt;pa_lstart;</div><div class='add'>+		tmp_pa_end = pa_logical_end(sbi, tmp_pa);</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;tmp_pa-&gt;pa_lock);</div><div class='add'>+		if (tmp_pa-&gt;pa_deleted == 0)</div><div class='add'>+			BUG_ON(!(start &gt;= tmp_pa_end || end &lt;= tmp_pa_start));</div><div class='add'>+		spin_unlock(&amp;tmp_pa-&gt;pa_lock);</div><div class='add'>+	}</div><div class='add'>+	read_unlock(&amp;ei-&gt;i_prealloc_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Given an allocation context "ac" and a range "start", "end", check</div><div class='add'>+ * and adjust boundaries if the range overlaps with any of the existing</div><div class='add'>+ * preallocatoins stored in the corresponding inode of the allocation context.</div><div class='add'>+ *</div><div class='add'>+ * Parameters:</div><div class='add'>+ *	ac			allocation context</div><div class='add'>+ *	start			start of the new range</div><div class='add'>+ *	end			end of the new range</div><div class='add'>+ */</div><div class='add'>+static inline void</div><div class='add'>+ext4_mb_pa_adjust_overlap(struct ext4_allocation_context *ac,</div><div class='add'>+			  ext4_lblk_t *start, loff_t *end)</div><div class='add'>+{</div><div class='add'>+	struct ext4_inode_info *ei = EXT4_I(ac-&gt;ac_inode);</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(ac-&gt;ac_sb);</div><div class='add'>+	struct ext4_prealloc_space *tmp_pa = NULL, *left_pa = NULL, *right_pa = NULL;</div><div class='add'>+	struct rb_node *iter;</div><div class='add'>+	ext4_lblk_t new_start, tmp_pa_start, right_pa_start = -1;</div><div class='add'>+	loff_t new_end, tmp_pa_end, left_pa_end = -1;</div><div class='add'>+</div><div class='add'>+	new_start = *start;</div><div class='add'>+	new_end = *end;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Adjust the normalized range so that it doesn't overlap with any</div><div class='add'>+	 * existing preallocated blocks(PAs). Make sure to hold the rbtree lock</div><div class='add'>+	 * so it doesn't change underneath us.</div><div class='add'>+	 */</div><div class='add'>+	read_lock(&amp;ei-&gt;i_prealloc_lock);</div><div class='add'>+</div><div class='add'>+	/* Step 1: find any one immediate neighboring PA of the normalized range */</div><div class='add'>+	for (iter = ei-&gt;i_prealloc_node.rb_node; iter;</div><div class='add'>+	     iter = ext4_mb_pa_rb_next_iter(ac-&gt;ac_o_ex.fe_logical,</div><div class='add'>+					    tmp_pa_start, iter)) {</div><div class='add'>+		tmp_pa = rb_entry(iter, struct ext4_prealloc_space,</div><div class='add'>+				  pa_node.inode_node);</div><div class='add'>+		tmp_pa_start = tmp_pa-&gt;pa_lstart;</div><div class='add'>+		tmp_pa_end = pa_logical_end(sbi, tmp_pa);</div><div class='add'>+</div><div class='add'>+		/* PA must not overlap original request */</div><div class='add'>+		spin_lock(&amp;tmp_pa-&gt;pa_lock);</div><div class='add'>+		if (tmp_pa-&gt;pa_deleted == 0)</div><div class='add'>+			BUG_ON(!(ac-&gt;ac_o_ex.fe_logical &gt;= tmp_pa_end ||</div><div class='add'>+				 ac-&gt;ac_o_ex.fe_logical &lt; tmp_pa_start));</div><div class='add'>+		spin_unlock(&amp;tmp_pa-&gt;pa_lock);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Step 2: check if the found PA is left or right neighbor and</div><div class='add'>+	 * get the other neighbor</div><div class='add'>+	 */</div><div class='add'>+	if (tmp_pa) {</div><div class='add'>+		if (tmp_pa-&gt;pa_lstart &lt; ac-&gt;ac_o_ex.fe_logical) {</div><div class='add'>+			struct rb_node *tmp;</div><div class='add'>+</div><div class='add'>+			left_pa = tmp_pa;</div><div class='add'>+			tmp = rb_next(&amp;left_pa-&gt;pa_node.inode_node);</div><div class='add'>+			if (tmp) {</div><div class='add'>+				right_pa = rb_entry(tmp,</div><div class='add'>+						    struct ext4_prealloc_space,</div><div class='add'>+						    pa_node.inode_node);</div><div class='add'>+			}</div><div class='add'>+		} else {</div><div class='add'>+			struct rb_node *tmp;</div><div class='add'>+</div><div class='add'>+			right_pa = tmp_pa;</div><div class='add'>+			tmp = rb_prev(&amp;right_pa-&gt;pa_node.inode_node);</div><div class='add'>+			if (tmp) {</div><div class='add'>+				left_pa = rb_entry(tmp,</div><div class='add'>+						   struct ext4_prealloc_space,</div><div class='add'>+						   pa_node.inode_node);</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Step 3: get the non deleted neighbors */</div><div class='add'>+	if (left_pa) {</div><div class='add'>+		for (iter = &amp;left_pa-&gt;pa_node.inode_node;;</div><div class='add'>+		     iter = rb_prev(iter)) {</div><div class='add'>+			if (!iter) {</div><div class='add'>+				left_pa = NULL;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			tmp_pa = rb_entry(iter, struct ext4_prealloc_space,</div><div class='add'>+					  pa_node.inode_node);</div><div class='add'>+			left_pa = tmp_pa;</div><div class='add'>+			spin_lock(&amp;tmp_pa-&gt;pa_lock);</div><div class='add'>+			if (tmp_pa-&gt;pa_deleted == 0) {</div><div class='add'>+				spin_unlock(&amp;tmp_pa-&gt;pa_lock);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+			spin_unlock(&amp;tmp_pa-&gt;pa_lock);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (right_pa) {</div><div class='add'>+		for (iter = &amp;right_pa-&gt;pa_node.inode_node;;</div><div class='add'>+		     iter = rb_next(iter)) {</div><div class='add'>+			if (!iter) {</div><div class='add'>+				right_pa = NULL;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			tmp_pa = rb_entry(iter, struct ext4_prealloc_space,</div><div class='add'>+					  pa_node.inode_node);</div><div class='add'>+			right_pa = tmp_pa;</div><div class='add'>+			spin_lock(&amp;tmp_pa-&gt;pa_lock);</div><div class='add'>+			if (tmp_pa-&gt;pa_deleted == 0) {</div><div class='add'>+				spin_unlock(&amp;tmp_pa-&gt;pa_lock);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+			spin_unlock(&amp;tmp_pa-&gt;pa_lock);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (left_pa) {</div><div class='add'>+		left_pa_end = pa_logical_end(sbi, left_pa);</div><div class='add'>+		BUG_ON(left_pa_end &gt; ac-&gt;ac_o_ex.fe_logical);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (right_pa) {</div><div class='add'>+		right_pa_start = right_pa-&gt;pa_lstart;</div><div class='add'>+		BUG_ON(right_pa_start &lt;= ac-&gt;ac_o_ex.fe_logical);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Step 4: trim our normalized range to not overlap with the neighbors */</div><div class='add'>+	if (left_pa) {</div><div class='add'>+		if (left_pa_end &gt; new_start)</div><div class='add'>+			new_start = left_pa_end;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (right_pa) {</div><div class='add'>+		if (right_pa_start &lt; new_end)</div><div class='add'>+			new_end = right_pa_start;</div><div class='add'>+	}</div><div class='add'>+	read_unlock(&amp;ei-&gt;i_prealloc_lock);</div><div class='add'>+</div><div class='add'>+	/* XXX: extra loop to check we really don't overlap preallocations */</div><div class='add'>+	ext4_mb_pa_assert_overlap(ac, new_start, new_end);</div><div class='add'>+</div><div class='add'>+	*start = new_start;</div><div class='add'>+	*end = new_end;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * Normalization means making request better in terms of</div><div class='ctx'>  * size and alignment</div><div class='ctx'>  */</div><div class='hunk'>@@ -3992,13 +4520,11 @@ ext4_mb_normalize_request(struct ext4_allocation_context *ac,</div><div class='ctx'> 				struct ext4_allocation_request *ar)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(ac-&gt;ac_sb);</div><div class='add'>+	struct ext4_super_block *es = sbi-&gt;s_es;</div><div class='ctx'> 	int bsbits, max;</div><div class='del'>-	ext4_lblk_t end;</div><div class='del'>-	loff_t size, start_off;</div><div class='add'>+	loff_t size, start_off, end;</div><div class='ctx'> 	loff_t orig_size __maybe_unused;</div><div class='ctx'> 	ext4_lblk_t start;</div><div class='del'>-	struct ext4_inode_info *ei = EXT4_I(ac-&gt;ac_inode);</div><div class='del'>-	struct ext4_prealloc_space *pa;</div><div class='ctx'> </div><div class='ctx'> 	/* do normalize only data requests, metadata requests</div><div class='ctx'> 	   do not need preallocation */</div><div class='hunk'>@@ -4023,7 +4549,7 @@ ext4_mb_normalize_request(struct ext4_allocation_context *ac,</div><div class='ctx'> </div><div class='ctx'> 	/* first, let's learn actual file size</div><div class='ctx'> 	 * given current request is allocated */</div><div class='del'>-	size = ac-&gt;ac_o_ex.fe_logical + EXT4_C2B(sbi, ac-&gt;ac_o_ex.fe_len);</div><div class='add'>+	size = extent_logical_end(sbi, &amp;ac-&gt;ac_o_ex);</div><div class='ctx'> 	size = size &lt;&lt; bsbits;</div><div class='ctx'> 	if (size &lt; i_size_read(ac-&gt;ac_inode))</div><div class='ctx'> 		size = i_size_read(ac-&gt;ac_inode);</div><div class='hunk'>@@ -4060,19 +4586,32 @@ ext4_mb_normalize_request(struct ext4_allocation_context *ac,</div><div class='ctx'> 		start_off = ((loff_t)ac-&gt;ac_o_ex.fe_logical &gt;&gt;</div><div class='ctx'> 							(22 - bsbits)) &lt;&lt; 22;</div><div class='ctx'> 		size = 4 * 1024 * 1024;</div><div class='del'>-	} else if (NRL_CHECK_SIZE(ac-&gt;ac_o_ex.fe_len,</div><div class='add'>+	} else if (NRL_CHECK_SIZE(EXT4_C2B(sbi, ac-&gt;ac_o_ex.fe_len),</div><div class='ctx'> 					(8&lt;&lt;20)&gt;&gt;bsbits, max, 8 * 1024)) {</div><div class='ctx'> 		start_off = ((loff_t)ac-&gt;ac_o_ex.fe_logical &gt;&gt;</div><div class='ctx'> 							(23 - bsbits)) &lt;&lt; 23;</div><div class='ctx'> 		size = 8 * 1024 * 1024;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		start_off = (loff_t) ac-&gt;ac_o_ex.fe_logical &lt;&lt; bsbits;</div><div class='del'>-		size	  = (loff_t) EXT4_C2B(EXT4_SB(ac-&gt;ac_sb),</div><div class='add'>+		size	  = (loff_t) EXT4_C2B(sbi,</div><div class='ctx'> 					      ac-&gt;ac_o_ex.fe_len) &lt;&lt; bsbits;</div><div class='ctx'> 	}</div><div class='ctx'> 	size = size &gt;&gt; bsbits;</div><div class='ctx'> 	start = start_off &gt;&gt; bsbits;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * For tiny groups (smaller than 8MB) the chosen allocation</div><div class='add'>+	 * alignment may be larger than group size. Make sure the</div><div class='add'>+	 * alignment does not move allocation to a different group which</div><div class='add'>+	 * makes mballoc fail assertions later.</div><div class='add'>+	 */</div><div class='add'>+	start = max(start, rounddown(ac-&gt;ac_o_ex.fe_logical,</div><div class='add'>+			(ext4_lblk_t)EXT4_BLOCKS_PER_GROUP(ac-&gt;ac_sb)));</div><div class='add'>+</div><div class='add'>+	/* avoid unnecessary preallocation that may trigger assertions */</div><div class='add'>+	if (start + size &gt; EXT_MAX_BLOCKS)</div><div class='add'>+		size = EXT_MAX_BLOCKS - start;</div><div class='add'>+</div><div class='ctx'> 	/* don't cover already allocated blocks in selected range */</div><div class='ctx'> 	if (ar-&gt;pleft &amp;&amp; start &lt;= ar-&gt;lleft) {</div><div class='ctx'> 		size -= ar-&gt;lleft + 1 - start;</div><div class='hunk'>@@ -4090,62 +4629,26 @@ ext4_mb_normalize_request(struct ext4_allocation_context *ac,</div><div class='ctx'> </div><div class='ctx'> 	end = start + size;</div><div class='ctx'> </div><div class='del'>-	/* check we don't cross already preallocated blocks */</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	list_for_each_entry_rcu(pa, &amp;ei-&gt;i_prealloc_list, pa_inode_list) {</div><div class='del'>-		ext4_lblk_t pa_end;</div><div class='del'>-</div><div class='del'>-		if (pa-&gt;pa_deleted)</div><div class='del'>-			continue;</div><div class='del'>-		spin_lock(&amp;pa-&gt;pa_lock);</div><div class='del'>-		if (pa-&gt;pa_deleted) {</div><div class='del'>-			spin_unlock(&amp;pa-&gt;pa_lock);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		pa_end = pa-&gt;pa_lstart + EXT4_C2B(EXT4_SB(ac-&gt;ac_sb),</div><div class='del'>-						  pa-&gt;pa_len);</div><div class='del'>-</div><div class='del'>-		/* PA must not overlap original request */</div><div class='del'>-		BUG_ON(!(ac-&gt;ac_o_ex.fe_logical &gt;= pa_end ||</div><div class='del'>-			ac-&gt;ac_o_ex.fe_logical &lt; pa-&gt;pa_lstart));</div><div class='add'>+	ext4_mb_pa_adjust_overlap(ac, &amp;start, &amp;end);</div><div class='ctx'> </div><div class='del'>-		/* skip PAs this normalized request doesn't overlap with */</div><div class='del'>-		if (pa-&gt;pa_lstart &gt;= end || pa_end &lt;= start) {</div><div class='del'>-			spin_unlock(&amp;pa-&gt;pa_lock);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-		BUG_ON(pa-&gt;pa_lstart &lt;= start &amp;&amp; pa_end &gt;= end);</div><div class='del'>-</div><div class='del'>-		/* adjust start or end to be adjacent to this pa */</div><div class='del'>-		if (pa_end &lt;= ac-&gt;ac_o_ex.fe_logical) {</div><div class='del'>-			BUG_ON(pa_end &lt; start);</div><div class='del'>-			start = pa_end;</div><div class='del'>-		} else if (pa-&gt;pa_lstart &gt; ac-&gt;ac_o_ex.fe_logical) {</div><div class='del'>-			BUG_ON(pa-&gt;pa_lstart &gt; end);</div><div class='del'>-			end = pa-&gt;pa_lstart;</div><div class='del'>-		}</div><div class='del'>-		spin_unlock(&amp;pa-&gt;pa_lock);</div><div class='del'>-	}</div><div class='del'>-	rcu_read_unlock();</div><div class='ctx'> 	size = end - start;</div><div class='ctx'> </div><div class='del'>-	/* XXX: extra loop to check we really don't overlap preallocations */</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	list_for_each_entry_rcu(pa, &amp;ei-&gt;i_prealloc_list, pa_inode_list) {</div><div class='del'>-		ext4_lblk_t pa_end;</div><div class='del'>-</div><div class='del'>-		spin_lock(&amp;pa-&gt;pa_lock);</div><div class='del'>-		if (pa-&gt;pa_deleted == 0) {</div><div class='del'>-			pa_end = pa-&gt;pa_lstart + EXT4_C2B(EXT4_SB(ac-&gt;ac_sb),</div><div class='del'>-							  pa-&gt;pa_len);</div><div class='del'>-			BUG_ON(!(start &gt;= pa_end || end &lt;= pa-&gt;pa_lstart));</div><div class='del'>-		}</div><div class='del'>-		spin_unlock(&amp;pa-&gt;pa_lock);</div><div class='del'>-	}</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-</div><div class='del'>-	if (start + size &lt;= ac-&gt;ac_o_ex.fe_logical &amp;&amp;</div><div class='add'>+	/*</div><div class='add'>+	 * In this function "start" and "size" are normalized for better</div><div class='add'>+	 * alignment and length such that we could preallocate more blocks.</div><div class='add'>+	 * This normalization is done such that original request of</div><div class='add'>+	 * ac-&gt;ac_o_ex.fe_logical &amp; fe_len should always lie within "start" and</div><div class='add'>+	 * "size" boundaries.</div><div class='add'>+	 * (Note fe_len can be relaxed since FS block allocation API does not</div><div class='add'>+	 * provide gurantee on number of contiguous blocks allocation since that</div><div class='add'>+	 * depends upon free space left, etc).</div><div class='add'>+	 * In case of inode pa, later we use the allocated blocks</div><div class='add'>+	 * [pa_pstart + fe_logical - pa_lstart, fe_len/size] from the preallocated</div><div class='add'>+	 * range of goal/best blocks [start, size] to put it at the</div><div class='add'>+	 * ac_o_ex.fe_logical extent of this inode.</div><div class='add'>+	 * (See ext4_mb_use_inode_pa() for more details)</div><div class='add'>+	 */</div><div class='add'>+	if (start + size &lt;= ac-&gt;ac_o_ex.fe_logical ||</div><div class='ctx'> 			start &gt; ac-&gt;ac_o_ex.fe_logical) {</div><div class='ctx'> 		ext4_msg(ac-&gt;ac_sb, KERN_ERR,</div><div class='ctx'> 			 "start %lu, size %lu, fe_logical %lu",</div><div class='hunk'>@@ -4161,20 +4664,24 @@ ext4_mb_normalize_request(struct ext4_allocation_context *ac,</div><div class='ctx'> 	 * placement or satisfy big request as is */</div><div class='ctx'> 	ac-&gt;ac_g_ex.fe_logical = start;</div><div class='ctx'> 	ac-&gt;ac_g_ex.fe_len = EXT4_NUM_B2C(sbi, size);</div><div class='add'>+	ac-&gt;ac_orig_goal_len = ac-&gt;ac_g_ex.fe_len;</div><div class='ctx'> </div><div class='ctx'> 	/* define goal start in order to merge */</div><div class='del'>-	if (ar-&gt;pright &amp;&amp; (ar-&gt;lright == (start + size))) {</div><div class='add'>+	if (ar-&gt;pright &amp;&amp; (ar-&gt;lright == (start + size)) &amp;&amp;</div><div class='add'>+	    ar-&gt;pright &gt;= size &amp;&amp;</div><div class='add'>+	    ar-&gt;pright - size &gt;= le32_to_cpu(es-&gt;s_first_data_block)) {</div><div class='ctx'> 		/* merge to the right */</div><div class='ctx'> 		ext4_get_group_no_and_offset(ac-&gt;ac_sb, ar-&gt;pright - size,</div><div class='del'>-						&amp;ac-&gt;ac_f_ex.fe_group,</div><div class='del'>-						&amp;ac-&gt;ac_f_ex.fe_start);</div><div class='add'>+						&amp;ac-&gt;ac_g_ex.fe_group,</div><div class='add'>+						&amp;ac-&gt;ac_g_ex.fe_start);</div><div class='ctx'> 		ac-&gt;ac_flags |= EXT4_MB_HINT_TRY_GOAL;</div><div class='ctx'> 	}</div><div class='del'>-	if (ar-&gt;pleft &amp;&amp; (ar-&gt;lleft + 1 == start)) {</div><div class='add'>+	if (ar-&gt;pleft &amp;&amp; (ar-&gt;lleft + 1 == start) &amp;&amp;</div><div class='add'>+	    ar-&gt;pleft + 1 &lt; ext4_blocks_count(es)) {</div><div class='ctx'> 		/* merge to the left */</div><div class='ctx'> 		ext4_get_group_no_and_offset(ac-&gt;ac_sb, ar-&gt;pleft + 1,</div><div class='del'>-						&amp;ac-&gt;ac_f_ex.fe_group,</div><div class='del'>-						&amp;ac-&gt;ac_f_ex.fe_start);</div><div class='add'>+						&amp;ac-&gt;ac_g_ex.fe_group,</div><div class='add'>+						&amp;ac-&gt;ac_g_ex.fe_start);</div><div class='ctx'> 		ac-&gt;ac_flags |= EXT4_MB_HINT_TRY_GOAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -4191,11 +4698,20 @@ static void ext4_mb_collect_stats(struct ext4_allocation_context *ac)</div><div class='ctx'> 		atomic_add(ac-&gt;ac_b_ex.fe_len, &amp;sbi-&gt;s_bal_allocated);</div><div class='ctx'> 		if (ac-&gt;ac_b_ex.fe_len &gt;= ac-&gt;ac_o_ex.fe_len)</div><div class='ctx'> 			atomic_inc(&amp;sbi-&gt;s_bal_success);</div><div class='add'>+</div><div class='ctx'> 		atomic_add(ac-&gt;ac_found, &amp;sbi-&gt;s_bal_ex_scanned);</div><div class='add'>+		for (int i=0; i&lt;EXT4_MB_NUM_CRS; i++) {</div><div class='add'>+			atomic_add(ac-&gt;ac_cX_found[i], &amp;sbi-&gt;s_bal_cX_ex_scanned[i]);</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		atomic_add(ac-&gt;ac_groups_scanned, &amp;sbi-&gt;s_bal_groups_scanned);</div><div class='ctx'> 		if (ac-&gt;ac_g_ex.fe_start == ac-&gt;ac_b_ex.fe_start &amp;&amp;</div><div class='ctx'> 				ac-&gt;ac_g_ex.fe_group == ac-&gt;ac_b_ex.fe_group)</div><div class='ctx'> 			atomic_inc(&amp;sbi-&gt;s_bal_goals);</div><div class='add'>+		/* did we allocate as much as normalizer originally wanted? */</div><div class='add'>+		if (ac-&gt;ac_f_ex.fe_len == ac-&gt;ac_orig_goal_len)</div><div class='add'>+			atomic_inc(&amp;sbi-&gt;s_bal_len_goals);</div><div class='add'>+</div><div class='ctx'> 		if (ac-&gt;ac_found &gt; sbi-&gt;s_mb_max_to_scan)</div><div class='ctx'> 			atomic_inc(&amp;sbi-&gt;s_bal_breaks);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -4222,15 +4738,14 @@ static void ext4_discard_allocated_blocks(struct ext4_allocation_context *ac)</div><div class='ctx'> 		if (ac-&gt;ac_f_ex.fe_len == 0)</div><div class='ctx'> 			return;</div><div class='ctx'> 		err = ext4_mb_load_buddy(ac-&gt;ac_sb, ac-&gt;ac_f_ex.fe_group, &amp;e4b);</div><div class='del'>-		if (err) {</div><div class='add'>+		if (WARN_RATELIMIT(err,</div><div class='add'>+				   "ext4: mb_load_buddy failed (%d)", err))</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * This should never happen since we pin the</div><div class='del'>-			 * pages in the ext4_allocation_context so</div><div class='add'>+			 * folios in the ext4_allocation_context so</div><div class='ctx'> 			 * ext4_mb_load_buddy() should never fail.</div><div class='ctx'> 			 */</div><div class='del'>-			WARN(1, "mb_load_buddy failed (%d)", err);</div><div class='ctx'> 			return;</div><div class='del'>-		}</div><div class='ctx'> 		ext4_lock_group(ac-&gt;ac_sb, ac-&gt;ac_f_ex.fe_group);</div><div class='ctx'> 		mb_free_blocks(ac-&gt;ac_inode, &amp;e4b, ac-&gt;ac_f_ex.fe_start,</div><div class='ctx'> 			       ac-&gt;ac_f_ex.fe_len);</div><div class='hunk'>@@ -4238,8 +4753,11 @@ static void ext4_discard_allocated_blocks(struct ext4_allocation_context *ac)</div><div class='ctx'> 		ext4_mb_unload_buddy(&amp;e4b);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='del'>-	if (pa-&gt;pa_type == MB_INODE_PA)</div><div class='add'>+	if (pa-&gt;pa_type == MB_INODE_PA) {</div><div class='add'>+		spin_lock(&amp;pa-&gt;pa_lock);</div><div class='ctx'> 		pa-&gt;pa_free += ac-&gt;ac_b_ex.fe_len;</div><div class='add'>+		spin_unlock(&amp;pa-&gt;pa_lock);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -4267,6 +4785,7 @@ static void ext4_mb_use_inode_pa(struct ext4_allocation_context *ac,</div><div class='ctx'> 	BUG_ON(start &lt; pa-&gt;pa_pstart);</div><div class='ctx'> 	BUG_ON(end &gt; pa-&gt;pa_pstart + EXT4_C2B(sbi, pa-&gt;pa_len));</div><div class='ctx'> 	BUG_ON(pa-&gt;pa_free &lt; len);</div><div class='add'>+	BUG_ON(ac-&gt;ac_b_ex.fe_len &lt;= 0);</div><div class='ctx'> 	pa-&gt;pa_free -= len;</div><div class='ctx'> </div><div class='ctx'> 	mb_debug(ac-&gt;ac_sb, "use %llu/%d from inode pa %p\n", start, len, pa);</div><div class='hunk'>@@ -4287,14 +4806,14 @@ static void ext4_mb_use_group_pa(struct ext4_allocation_context *ac,</div><div class='ctx'> 	ac-&gt;ac_status = AC_STATUS_FOUND;</div><div class='ctx'> 	ac-&gt;ac_pa = pa;</div><div class='ctx'> </div><div class='del'>-	/* we don't correct pa_pstart or pa_plen here to avoid</div><div class='add'>+	/* we don't correct pa_pstart or pa_len here to avoid</div><div class='ctx'> 	 * possible race when the group is being loaded concurrently</div><div class='ctx'> 	 * instead we correct pa later, after blocks are marked</div><div class='ctx'> 	 * in on-disk bitmap -- see ext4_mb_release_context()</div><div class='ctx'> 	 * Other CPUs are prevented from allocating from this pa by lg_mutex</div><div class='ctx'> 	 */</div><div class='ctx'> 	mb_debug(ac-&gt;ac_sb, "use %u/%u from group pa %p\n",</div><div class='del'>-		 pa-&gt;pa_lstart-len, len, pa);</div><div class='add'>+		 pa-&gt;pa_lstart, len, pa);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -4327,6 +4846,37 @@ ext4_mb_check_group_pa(ext4_fsblk_t goal_block,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * check if found pa meets EXT4_MB_HINT_GOAL_ONLY</div><div class='add'>+ */</div><div class='add'>+static bool</div><div class='add'>+ext4_mb_pa_goal_check(struct ext4_allocation_context *ac,</div><div class='add'>+		      struct ext4_prealloc_space *pa)</div><div class='add'>+{</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(ac-&gt;ac_sb);</div><div class='add'>+	ext4_fsblk_t start;</div><div class='add'>+</div><div class='add'>+	if (likely(!(ac-&gt;ac_flags &amp; EXT4_MB_HINT_GOAL_ONLY)))</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If EXT4_MB_HINT_GOAL_ONLY is set, ac_g_ex will not be adjusted</div><div class='add'>+	 * in ext4_mb_normalize_request and will keep same with ac_o_ex</div><div class='add'>+	 * from ext4_mb_initialize_context. Choose ac_g_ex here to keep</div><div class='add'>+	 * consistent with ext4_mb_find_by_goal.</div><div class='add'>+	 */</div><div class='add'>+	start = pa-&gt;pa_pstart +</div><div class='add'>+		(ac-&gt;ac_g_ex.fe_logical - pa-&gt;pa_lstart);</div><div class='add'>+	if (ext4_grp_offs_to_block(ac-&gt;ac_sb, &amp;ac-&gt;ac_g_ex) != start)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	if (ac-&gt;ac_g_ex.fe_len &gt; pa-&gt;pa_len -</div><div class='add'>+	    EXT4_B2C(sbi, ac-&gt;ac_g_ex.fe_logical - pa-&gt;pa_lstart))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * search goal blocks in preallocated space</div><div class='ctx'>  */</div><div class='ctx'> static noinline_for_stack bool</div><div class='hunk'>@@ -4336,43 +4886,158 @@ ext4_mb_use_preallocated(struct ext4_allocation_context *ac)</div><div class='ctx'> 	int order, i;</div><div class='ctx'> 	struct ext4_inode_info *ei = EXT4_I(ac-&gt;ac_inode);</div><div class='ctx'> 	struct ext4_locality_group *lg;</div><div class='del'>-	struct ext4_prealloc_space *pa, *cpa = NULL;</div><div class='add'>+	struct ext4_prealloc_space *tmp_pa = NULL, *cpa = NULL;</div><div class='add'>+	struct rb_node *iter;</div><div class='ctx'> 	ext4_fsblk_t goal_block;</div><div class='ctx'> </div><div class='ctx'> 	/* only data can be preallocated */</div><div class='ctx'> 	if (!(ac-&gt;ac_flags &amp; EXT4_MB_HINT_DATA))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	/* first, try per-file preallocation */</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	list_for_each_entry_rcu(pa, &amp;ei-&gt;i_prealloc_list, pa_inode_list) {</div><div class='add'>+	/*</div><div class='add'>+	 * first, try per-file preallocation by searching the inode pa rbtree.</div><div class='add'>+	 *</div><div class='add'>+	 * Here, we can't do a direct traversal of the tree because</div><div class='add'>+	 * ext4_mb_discard_group_preallocation() can paralelly mark the pa</div><div class='add'>+	 * deleted and that can cause direct traversal to skip some entries.</div><div class='add'>+	 */</div><div class='add'>+	read_lock(&amp;ei-&gt;i_prealloc_lock);</div><div class='ctx'> </div><div class='del'>-		/* all fields in this condition don't change,</div><div class='del'>-		 * so we can skip locking for them */</div><div class='del'>-		if (ac-&gt;ac_o_ex.fe_logical &lt; pa-&gt;pa_lstart ||</div><div class='del'>-		    ac-&gt;ac_o_ex.fe_logical &gt;= (pa-&gt;pa_lstart +</div><div class='del'>-					       EXT4_C2B(sbi, pa-&gt;pa_len)))</div><div class='del'>-			continue;</div><div class='add'>+	if (RB_EMPTY_ROOT(&amp;ei-&gt;i_prealloc_node)) {</div><div class='add'>+		goto try_group_pa;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		/* non-extent files can't have physical blocks past 2^32 */</div><div class='del'>-		if (!(ext4_test_inode_flag(ac-&gt;ac_inode, EXT4_INODE_EXTENTS)) &amp;&amp;</div><div class='del'>-		    (pa-&gt;pa_pstart + EXT4_C2B(sbi, pa-&gt;pa_len) &gt;</div><div class='del'>-		     EXT4_MAX_BLOCK_FILE_PHYS))</div><div class='del'>-			continue;</div><div class='add'>+	/*</div><div class='add'>+	 * Step 1: Find a pa with logical start immediately adjacent to the</div><div class='add'>+	 * original logical start. This could be on the left or right.</div><div class='add'>+	 *</div><div class='add'>+	 * (tmp_pa-&gt;pa_lstart never changes so we can skip locking for it).</div><div class='add'>+	 */</div><div class='add'>+	for (iter = ei-&gt;i_prealloc_node.rb_node; iter;</div><div class='add'>+	     iter = ext4_mb_pa_rb_next_iter(ac-&gt;ac_o_ex.fe_logical,</div><div class='add'>+					    tmp_pa-&gt;pa_lstart, iter)) {</div><div class='add'>+		tmp_pa = rb_entry(iter, struct ext4_prealloc_space,</div><div class='add'>+				  pa_node.inode_node);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		/* found preallocated blocks, use them */</div><div class='del'>-		spin_lock(&amp;pa-&gt;pa_lock);</div><div class='del'>-		if (pa-&gt;pa_deleted == 0 &amp;&amp; pa-&gt;pa_free) {</div><div class='del'>-			atomic_inc(&amp;pa-&gt;pa_count);</div><div class='del'>-			ext4_mb_use_inode_pa(ac, pa);</div><div class='del'>-			spin_unlock(&amp;pa-&gt;pa_lock);</div><div class='del'>-			ac-&gt;ac_criteria = 10;</div><div class='del'>-			rcu_read_unlock();</div><div class='del'>-			return true;</div><div class='add'>+	/*</div><div class='add'>+	 * Step 2: The adjacent pa might be to the right of logical start, find</div><div class='add'>+	 * the left adjacent pa. After this step we'd have a valid tmp_pa whose</div><div class='add'>+	 * logical start is towards the left of original request's logical start</div><div class='add'>+	 */</div><div class='add'>+	if (tmp_pa-&gt;pa_lstart &gt; ac-&gt;ac_o_ex.fe_logical) {</div><div class='add'>+		struct rb_node *tmp;</div><div class='add'>+		tmp = rb_prev(&amp;tmp_pa-&gt;pa_node.inode_node);</div><div class='add'>+</div><div class='add'>+		if (tmp) {</div><div class='add'>+			tmp_pa = rb_entry(tmp, struct ext4_prealloc_space,</div><div class='add'>+					    pa_node.inode_node);</div><div class='add'>+		} else {</div><div class='add'>+			/*</div><div class='add'>+			 * If there is no adjacent pa to the left then finding</div><div class='add'>+			 * an overlapping pa is not possible hence stop searching</div><div class='add'>+			 * inode pa tree</div><div class='add'>+			 */</div><div class='add'>+			goto try_group_pa;</div><div class='ctx'> 		}</div><div class='del'>-		spin_unlock(&amp;pa-&gt;pa_lock);</div><div class='ctx'> 	}</div><div class='del'>-	rcu_read_unlock();</div><div class='add'>+</div><div class='add'>+	BUG_ON(!(tmp_pa &amp;&amp; tmp_pa-&gt;pa_lstart &lt;= ac-&gt;ac_o_ex.fe_logical));</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Step 3: If the left adjacent pa is deleted, keep moving left to find</div><div class='add'>+	 * the first non deleted adjacent pa. After this step we should have a</div><div class='add'>+	 * valid tmp_pa which is guaranteed to be non deleted.</div><div class='add'>+	 */</div><div class='add'>+	for (iter = &amp;tmp_pa-&gt;pa_node.inode_node;; iter = rb_prev(iter)) {</div><div class='add'>+		if (!iter) {</div><div class='add'>+			/*</div><div class='add'>+			 * no non deleted left adjacent pa, so stop searching</div><div class='add'>+			 * inode pa tree</div><div class='add'>+			 */</div><div class='add'>+			goto try_group_pa;</div><div class='add'>+		}</div><div class='add'>+		tmp_pa = rb_entry(iter, struct ext4_prealloc_space,</div><div class='add'>+				  pa_node.inode_node);</div><div class='add'>+		spin_lock(&amp;tmp_pa-&gt;pa_lock);</div><div class='add'>+		if (tmp_pa-&gt;pa_deleted == 0) {</div><div class='add'>+			/*</div><div class='add'>+			 * We will keep holding the pa_lock from</div><div class='add'>+			 * this point on because we don't want group discard</div><div class='add'>+			 * to delete this pa underneath us. Since group</div><div class='add'>+			 * discard is anyways an ENOSPC operation it</div><div class='add'>+			 * should be okay for it to wait a few more cycles.</div><div class='add'>+			 */</div><div class='add'>+			break;</div><div class='add'>+		} else {</div><div class='add'>+			spin_unlock(&amp;tmp_pa-&gt;pa_lock);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	BUG_ON(!(tmp_pa &amp;&amp; tmp_pa-&gt;pa_lstart &lt;= ac-&gt;ac_o_ex.fe_logical));</div><div class='add'>+	BUG_ON(tmp_pa-&gt;pa_deleted == 1);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Step 4: We now have the non deleted left adjacent pa. Only this</div><div class='add'>+	 * pa can possibly satisfy the request hence check if it overlaps</div><div class='add'>+	 * original logical start and stop searching if it doesn't.</div><div class='add'>+	 */</div><div class='add'>+	if (ac-&gt;ac_o_ex.fe_logical &gt;= pa_logical_end(sbi, tmp_pa)) {</div><div class='add'>+		spin_unlock(&amp;tmp_pa-&gt;pa_lock);</div><div class='add'>+		goto try_group_pa;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* non-extent files can't have physical blocks past 2^32 */</div><div class='add'>+	if (!(ext4_test_inode_flag(ac-&gt;ac_inode, EXT4_INODE_EXTENTS)) &amp;&amp;</div><div class='add'>+	    (tmp_pa-&gt;pa_pstart + EXT4_C2B(sbi, tmp_pa-&gt;pa_len) &gt;</div><div class='add'>+	     EXT4_MAX_BLOCK_FILE_PHYS)) {</div><div class='add'>+		/*</div><div class='add'>+		 * Since PAs don't overlap, we won't find any other PA to</div><div class='add'>+		 * satisfy this.</div><div class='add'>+		 */</div><div class='add'>+		spin_unlock(&amp;tmp_pa-&gt;pa_lock);</div><div class='add'>+		goto try_group_pa;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (tmp_pa-&gt;pa_free &amp;&amp; likely(ext4_mb_pa_goal_check(ac, tmp_pa))) {</div><div class='add'>+		atomic_inc(&amp;tmp_pa-&gt;pa_count);</div><div class='add'>+		ext4_mb_use_inode_pa(ac, tmp_pa);</div><div class='add'>+		spin_unlock(&amp;tmp_pa-&gt;pa_lock);</div><div class='add'>+		read_unlock(&amp;ei-&gt;i_prealloc_lock);</div><div class='add'>+		return true;</div><div class='add'>+	} else {</div><div class='add'>+		/*</div><div class='add'>+		 * We found a valid overlapping pa but couldn't use it because</div><div class='add'>+		 * it had no free blocks. This should ideally never happen</div><div class='add'>+		 * because:</div><div class='add'>+		 *</div><div class='add'>+		 * 1. When a new inode pa is added to rbtree it must have</div><div class='add'>+		 *    pa_free &gt; 0 since otherwise we won't actually need</div><div class='add'>+		 *    preallocation.</div><div class='add'>+		 *</div><div class='add'>+		 * 2. An inode pa that is in the rbtree can only have it's</div><div class='add'>+		 *    pa_free become zero when another thread calls:</div><div class='add'>+		 *      ext4_mb_new_blocks</div><div class='add'>+		 *       ext4_mb_use_preallocated</div><div class='add'>+		 *        ext4_mb_use_inode_pa</div><div class='add'>+		 *</div><div class='add'>+		 * 3. Further, after the above calls make pa_free == 0, we will</div><div class='add'>+		 *    immediately remove it from the rbtree in:</div><div class='add'>+		 *      ext4_mb_new_blocks</div><div class='add'>+		 *       ext4_mb_release_context</div><div class='add'>+		 *        ext4_mb_put_pa</div><div class='add'>+		 *</div><div class='add'>+		 * 4. Since the pa_free becoming 0 and pa_free getting removed</div><div class='add'>+		 * from tree both happen in ext4_mb_new_blocks, which is always</div><div class='add'>+		 * called with i_data_sem held for data allocations, we can be</div><div class='add'>+		 * sure that another process will never see a pa in rbtree with</div><div class='add'>+		 * pa_free == 0.</div><div class='add'>+		 */</div><div class='add'>+		WARN_ON_ONCE(tmp_pa-&gt;pa_free == 0);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;tmp_pa-&gt;pa_lock);</div><div class='add'>+try_group_pa:</div><div class='add'>+	read_unlock(&amp;ei-&gt;i_prealloc_lock);</div><div class='ctx'> </div><div class='ctx'> 	/* can we use group allocation? */</div><div class='ctx'> 	if (!(ac-&gt;ac_flags &amp; EXT4_MB_HINT_GROUP_ALLOC))</div><div class='hunk'>@@ -4394,52 +5059,27 @@ ext4_mb_use_preallocated(struct ext4_allocation_context *ac)</div><div class='ctx'> 	 */</div><div class='ctx'> 	for (i = order; i &lt; PREALLOC_TB_SIZE; i++) {</div><div class='ctx'> 		rcu_read_lock();</div><div class='del'>-		list_for_each_entry_rcu(pa, &amp;lg-&gt;lg_prealloc_list[i],</div><div class='del'>-					pa_inode_list) {</div><div class='del'>-			spin_lock(&amp;pa-&gt;pa_lock);</div><div class='del'>-			if (pa-&gt;pa_deleted == 0 &amp;&amp;</div><div class='del'>-					pa-&gt;pa_free &gt;= ac-&gt;ac_o_ex.fe_len) {</div><div class='add'>+		list_for_each_entry_rcu(tmp_pa, &amp;lg-&gt;lg_prealloc_list[i],</div><div class='add'>+					pa_node.lg_list) {</div><div class='add'>+			spin_lock(&amp;tmp_pa-&gt;pa_lock);</div><div class='add'>+			if (tmp_pa-&gt;pa_deleted == 0 &amp;&amp;</div><div class='add'>+					tmp_pa-&gt;pa_free &gt;= ac-&gt;ac_o_ex.fe_len) {</div><div class='ctx'> </div><div class='ctx'> 				cpa = ext4_mb_check_group_pa(goal_block,</div><div class='del'>-								pa, cpa);</div><div class='add'>+								tmp_pa, cpa);</div><div class='ctx'> 			}</div><div class='del'>-			spin_unlock(&amp;pa-&gt;pa_lock);</div><div class='add'>+			spin_unlock(&amp;tmp_pa-&gt;pa_lock);</div><div class='ctx'> 		}</div><div class='ctx'> 		rcu_read_unlock();</div><div class='ctx'> 	}</div><div class='ctx'> 	if (cpa) {</div><div class='ctx'> 		ext4_mb_use_group_pa(ac, cpa);</div><div class='del'>-		ac-&gt;ac_criteria = 20;</div><div class='ctx'> 		return true;</div><div class='ctx'> 	}</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * the function goes through all block freed in the group</div><div class='del'>- * but not yet committed and marks them used in in-core bitmap.</div><div class='del'>- * buddy must be generated from this bitmap</div><div class='del'>- * Need to be called with the ext4 group lock held</div><div class='del'>- */</div><div class='del'>-static void ext4_mb_generate_from_freelist(struct super_block *sb, void *bitmap,</div><div class='del'>-						ext4_group_t group)</div><div class='del'>-{</div><div class='del'>-	struct rb_node *n;</div><div class='del'>-	struct ext4_group_info *grp;</div><div class='del'>-	struct ext4_free_data *entry;</div><div class='del'>-</div><div class='del'>-	grp = ext4_get_group_info(sb, group);</div><div class='del'>-	n = rb_first(&amp;(grp-&gt;bb_free_root));</div><div class='del'>-</div><div class='del'>-	while (n) {</div><div class='del'>-		entry = rb_entry(n, struct ext4_free_data, efd_node);</div><div class='del'>-		ext4_set_bits(bitmap, entry-&gt;efd_start_cluster, entry-&gt;efd_count);</div><div class='del'>-		n = rb_next(n);</div><div class='del'>-	}</div><div class='del'>-	return;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * the function goes through all preallocation in this group and marks them</div><div class='ctx'>  * used in in-core bitmap. buddy must be generated from this bitmap</div><div class='ctx'>  * Need to be called with ext4 group lock held</div><div class='hunk'>@@ -4456,6 +5096,9 @@ void ext4_mb_generate_from_pa(struct super_block *sb, void *bitmap,</div><div class='ctx'> 	int preallocated = 0;</div><div class='ctx'> 	int len;</div><div class='ctx'> </div><div class='add'>+	if (!grp)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='ctx'> 	/* all form of preallocation discards first load group,</div><div class='ctx'> 	 * so the only competing code is preallocation use.</div><div class='ctx'> 	 * we don't need any locking here</div><div class='hunk'>@@ -4474,7 +5117,7 @@ void ext4_mb_generate_from_pa(struct super_block *sb, void *bitmap,</div><div class='ctx'> 		if (unlikely(len == 0))</div><div class='ctx'> 			continue;</div><div class='ctx'> 		BUG_ON(groupnr != group);</div><div class='del'>-		ext4_set_bits(bitmap, start, len);</div><div class='add'>+		mb_set_bits(bitmap, start, len);</div><div class='ctx'> 		preallocated += len;</div><div class='ctx'> 	}</div><div class='ctx'> 	mb_debug(sb, "preallocated %d for group %u\n", preallocated, group);</div><div class='hunk'>@@ -4500,16 +5143,22 @@ static void ext4_mb_mark_pa_deleted(struct super_block *sb,</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void ext4_mb_pa_callback(struct rcu_head *head)</div><div class='add'>+static inline void ext4_mb_pa_free(struct ext4_prealloc_space *pa)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_prealloc_space *pa;</div><div class='del'>-	pa = container_of(head, struct ext4_prealloc_space, u.pa_rcu);</div><div class='del'>-</div><div class='add'>+	BUG_ON(!pa);</div><div class='ctx'> 	BUG_ON(atomic_read(&amp;pa-&gt;pa_count));</div><div class='ctx'> 	BUG_ON(pa-&gt;pa_deleted == 0);</div><div class='ctx'> 	kmem_cache_free(ext4_pspace_cachep, pa);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void ext4_mb_pa_callback(struct rcu_head *head)</div><div class='add'>+{</div><div class='add'>+	struct ext4_prealloc_space *pa;</div><div class='add'>+</div><div class='add'>+	pa = container_of(head, struct ext4_prealloc_space, u.pa_rcu);</div><div class='add'>+	ext4_mb_pa_free(pa);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * drops a reference to preallocated space descriptor</div><div class='ctx'>  * if this was the last reference and the space is consumed</div><div class='hunk'>@@ -4519,6 +5168,7 @@ static void ext4_mb_put_pa(struct ext4_allocation_context *ac,</div><div class='ctx'> {</div><div class='ctx'> 	ext4_group_t grp;</div><div class='ctx'> 	ext4_fsblk_t grp_blk;</div><div class='add'>+	struct ext4_inode_info *ei = EXT4_I(ac-&gt;ac_inode);</div><div class='ctx'> </div><div class='ctx'> 	/* in this short window concurrent discard can set pa_deleted */</div><div class='ctx'> 	spin_lock(&amp;pa-&gt;pa_lock);</div><div class='hunk'>@@ -4563,11 +5213,42 @@ static void ext4_mb_put_pa(struct ext4_allocation_context *ac,</div><div class='ctx'> 	list_del(&amp;pa-&gt;pa_group_list);</div><div class='ctx'> 	ext4_unlock_group(sb, grp);</div><div class='ctx'> </div><div class='del'>-	spin_lock(pa-&gt;pa_obj_lock);</div><div class='del'>-	list_del_rcu(&amp;pa-&gt;pa_inode_list);</div><div class='del'>-	spin_unlock(pa-&gt;pa_obj_lock);</div><div class='add'>+	if (pa-&gt;pa_type == MB_INODE_PA) {</div><div class='add'>+		write_lock(pa-&gt;pa_node_lock.inode_lock);</div><div class='add'>+		rb_erase(&amp;pa-&gt;pa_node.inode_node, &amp;ei-&gt;i_prealloc_node);</div><div class='add'>+		write_unlock(pa-&gt;pa_node_lock.inode_lock);</div><div class='add'>+		ext4_mb_pa_free(pa);</div><div class='add'>+	} else {</div><div class='add'>+		spin_lock(pa-&gt;pa_node_lock.lg_lock);</div><div class='add'>+		list_del_rcu(&amp;pa-&gt;pa_node.lg_list);</div><div class='add'>+		spin_unlock(pa-&gt;pa_node_lock.lg_lock);</div><div class='add'>+		call_rcu(&amp;(pa)-&gt;u.pa_rcu, ext4_mb_pa_callback);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void ext4_mb_pa_rb_insert(struct rb_root *root, struct rb_node *new)</div><div class='add'>+{</div><div class='add'>+	struct rb_node **iter = &amp;root-&gt;rb_node, *parent = NULL;</div><div class='add'>+	struct ext4_prealloc_space *iter_pa, *new_pa;</div><div class='add'>+	ext4_lblk_t iter_start, new_start;</div><div class='ctx'> </div><div class='del'>-	call_rcu(&amp;(pa)-&gt;u.pa_rcu, ext4_mb_pa_callback);</div><div class='add'>+	while (*iter) {</div><div class='add'>+		iter_pa = rb_entry(*iter, struct ext4_prealloc_space,</div><div class='add'>+				   pa_node.inode_node);</div><div class='add'>+		new_pa = rb_entry(new, struct ext4_prealloc_space,</div><div class='add'>+				   pa_node.inode_node);</div><div class='add'>+		iter_start = iter_pa-&gt;pa_lstart;</div><div class='add'>+		new_start = new_pa-&gt;pa_lstart;</div><div class='add'>+</div><div class='add'>+		parent = *iter;</div><div class='add'>+		if (new_start &lt; iter_start)</div><div class='add'>+			iter = &amp;((*iter)-&gt;rb_left);</div><div class='add'>+		else</div><div class='add'>+			iter = &amp;((*iter)-&gt;rb_right);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	rb_link_node(new, parent, iter);</div><div class='add'>+	rb_insert_color(new, root);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -4590,50 +5271,59 @@ ext4_mb_new_inode_pa(struct ext4_allocation_context *ac)</div><div class='ctx'> </div><div class='ctx'> 	pa = ac-&gt;ac_pa;</div><div class='ctx'> </div><div class='del'>-	if (ac-&gt;ac_b_ex.fe_len &lt; ac-&gt;ac_g_ex.fe_len) {</div><div class='del'>-		int winl;</div><div class='del'>-		int wins;</div><div class='del'>-		int win;</div><div class='del'>-		int offs;</div><div class='add'>+	if (ac-&gt;ac_b_ex.fe_len &lt; ac-&gt;ac_orig_goal_len) {</div><div class='add'>+		struct ext4_free_extent ex = {</div><div class='add'>+			.fe_logical = ac-&gt;ac_g_ex.fe_logical,</div><div class='add'>+			.fe_len = ac-&gt;ac_orig_goal_len,</div><div class='add'>+		};</div><div class='add'>+		loff_t orig_goal_end = extent_logical_end(sbi, &amp;ex);</div><div class='add'>+		loff_t o_ex_end = extent_logical_end(sbi, &amp;ac-&gt;ac_o_ex);</div><div class='ctx'> </div><div class='del'>-		/* we can't allocate as much as normalizer wants.</div><div class='del'>-		 * so, found space must get proper lstart</div><div class='del'>-		 * to cover original request */</div><div class='add'>+		/*</div><div class='add'>+		 * We can't allocate as much as normalizer wants, so we try</div><div class='add'>+		 * to get proper lstart to cover the original request, except</div><div class='add'>+		 * when the goal doesn't cover the original request as below:</div><div class='add'>+		 *</div><div class='add'>+		 * orig_ex:2045/2055(10), isize:8417280 -&gt; normalized:0/2048</div><div class='add'>+		 * best_ex:0/200(200) -&gt; adjusted: 1848/2048(200)</div><div class='add'>+		 */</div><div class='ctx'> 		BUG_ON(ac-&gt;ac_g_ex.fe_logical &gt; ac-&gt;ac_o_ex.fe_logical);</div><div class='ctx'> 		BUG_ON(ac-&gt;ac_g_ex.fe_len &lt; ac-&gt;ac_o_ex.fe_len);</div><div class='ctx'> </div><div class='del'>-		/* we're limited by original request in that</div><div class='del'>-		 * logical block must be covered any way</div><div class='del'>-		 * winl is window we can move our chunk within */</div><div class='del'>-		winl = ac-&gt;ac_o_ex.fe_logical - ac-&gt;ac_g_ex.fe_logical;</div><div class='add'>+		/*</div><div class='add'>+		 * Use the below logic for adjusting best extent as it keeps</div><div class='add'>+		 * fragmentation in check while ensuring logical range of best</div><div class='add'>+		 * extent doesn't overflow out of goal extent:</div><div class='add'>+		 *</div><div class='add'>+		 * 1. Check if best ex can be kept at end of goal (before</div><div class='add'>+		 *    cr_best_avail trimmed it) and still cover original start</div><div class='add'>+		 * 2. Else, check if best ex can be kept at start of goal and</div><div class='add'>+		 *    still cover original end</div><div class='add'>+		 * 3. Else, keep the best ex at start of original request.</div><div class='add'>+		 */</div><div class='add'>+		ex.fe_len = ac-&gt;ac_b_ex.fe_len;</div><div class='ctx'> </div><div class='del'>-		/* also, we should cover whole original request */</div><div class='del'>-		wins = EXT4_C2B(sbi, ac-&gt;ac_b_ex.fe_len - ac-&gt;ac_o_ex.fe_len);</div><div class='add'>+		ex.fe_logical = orig_goal_end - EXT4_C2B(sbi, ex.fe_len);</div><div class='add'>+		if (ac-&gt;ac_o_ex.fe_logical &gt;= ex.fe_logical)</div><div class='add'>+			goto adjust_bex;</div><div class='ctx'> </div><div class='del'>-		/* the smallest one defines real window */</div><div class='del'>-		win = min(winl, wins);</div><div class='add'>+		ex.fe_logical = ac-&gt;ac_g_ex.fe_logical;</div><div class='add'>+		if (o_ex_end &lt;= extent_logical_end(sbi, &amp;ex))</div><div class='add'>+			goto adjust_bex;</div><div class='ctx'> </div><div class='del'>-		offs = ac-&gt;ac_o_ex.fe_logical %</div><div class='del'>-			EXT4_C2B(sbi, ac-&gt;ac_b_ex.fe_len);</div><div class='del'>-		if (offs &amp;&amp; offs &lt; win)</div><div class='del'>-			win = offs;</div><div class='add'>+		ex.fe_logical = ac-&gt;ac_o_ex.fe_logical;</div><div class='add'>+adjust_bex:</div><div class='add'>+		ac-&gt;ac_b_ex.fe_logical = ex.fe_logical;</div><div class='ctx'> </div><div class='del'>-		ac-&gt;ac_b_ex.fe_logical = ac-&gt;ac_o_ex.fe_logical -</div><div class='del'>-			EXT4_NUM_B2C(sbi, win);</div><div class='ctx'> 		BUG_ON(ac-&gt;ac_o_ex.fe_logical &lt; ac-&gt;ac_b_ex.fe_logical);</div><div class='del'>-		BUG_ON(ac-&gt;ac_o_ex.fe_len &gt; ac-&gt;ac_b_ex.fe_len);</div><div class='add'>+		BUG_ON(extent_logical_end(sbi, &amp;ex) &gt; orig_goal_end);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* preallocation can change ac_b_ex, thus we store actually</div><div class='del'>-	 * allocated blocks for history */</div><div class='del'>-	ac-&gt;ac_f_ex = ac-&gt;ac_b_ex;</div><div class='del'>-</div><div class='ctx'> 	pa-&gt;pa_lstart = ac-&gt;ac_b_ex.fe_logical;</div><div class='ctx'> 	pa-&gt;pa_pstart = ext4_grp_offs_to_block(sb, &amp;ac-&gt;ac_b_ex);</div><div class='ctx'> 	pa-&gt;pa_len = ac-&gt;ac_b_ex.fe_len;</div><div class='ctx'> 	pa-&gt;pa_free = pa-&gt;pa_len;</div><div class='ctx'> 	spin_lock_init(&amp;pa-&gt;pa_lock);</div><div class='del'>-	INIT_LIST_HEAD(&amp;pa-&gt;pa_inode_list);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;pa-&gt;pa_group_list);</div><div class='ctx'> 	pa-&gt;pa_deleted = 0;</div><div class='ctx'> 	pa-&gt;pa_type = MB_INODE_PA;</div><div class='hunk'>@@ -4642,20 +5332,22 @@ ext4_mb_new_inode_pa(struct ext4_allocation_context *ac)</div><div class='ctx'> 		 pa-&gt;pa_len, pa-&gt;pa_lstart);</div><div class='ctx'> 	trace_ext4_mb_new_inode_pa(ac, pa);</div><div class='ctx'> </div><div class='del'>-	ext4_mb_use_inode_pa(ac, pa);</div><div class='ctx'> 	atomic_add(pa-&gt;pa_free, &amp;sbi-&gt;s_mb_preallocated);</div><div class='add'>+	ext4_mb_use_inode_pa(ac, pa);</div><div class='ctx'> </div><div class='ctx'> 	ei = EXT4_I(ac-&gt;ac_inode);</div><div class='ctx'> 	grp = ext4_get_group_info(sb, ac-&gt;ac_b_ex.fe_group);</div><div class='add'>+	if (!grp)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	pa-&gt;pa_obj_lock = &amp;ei-&gt;i_prealloc_lock;</div><div class='add'>+	pa-&gt;pa_node_lock.inode_lock = &amp;ei-&gt;i_prealloc_lock;</div><div class='ctx'> 	pa-&gt;pa_inode = ac-&gt;ac_inode;</div><div class='ctx'> </div><div class='ctx'> 	list_add(&amp;pa-&gt;pa_group_list, &amp;grp-&gt;bb_prealloc_list);</div><div class='ctx'> </div><div class='del'>-	spin_lock(pa-&gt;pa_obj_lock);</div><div class='del'>-	list_add_rcu(&amp;pa-&gt;pa_inode_list, &amp;ei-&gt;i_prealloc_list);</div><div class='del'>-	spin_unlock(pa-&gt;pa_obj_lock);</div><div class='add'>+	write_lock(pa-&gt;pa_node_lock.inode_lock);</div><div class='add'>+	ext4_mb_pa_rb_insert(&amp;ei-&gt;i_prealloc_node, &amp;pa-&gt;pa_node.inode_node);</div><div class='add'>+	write_unlock(pa-&gt;pa_node_lock.inode_lock);</div><div class='ctx'> 	atomic_inc(&amp;ei-&gt;i_prealloc_active);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -4678,16 +5370,12 @@ ext4_mb_new_group_pa(struct ext4_allocation_context *ac)</div><div class='ctx'> </div><div class='ctx'> 	pa = ac-&gt;ac_pa;</div><div class='ctx'> </div><div class='del'>-	/* preallocation can change ac_b_ex, thus we store actually</div><div class='del'>-	 * allocated blocks for history */</div><div class='del'>-	ac-&gt;ac_f_ex = ac-&gt;ac_b_ex;</div><div class='del'>-</div><div class='ctx'> 	pa-&gt;pa_pstart = ext4_grp_offs_to_block(sb, &amp;ac-&gt;ac_b_ex);</div><div class='ctx'> 	pa-&gt;pa_lstart = pa-&gt;pa_pstart;</div><div class='ctx'> 	pa-&gt;pa_len = ac-&gt;ac_b_ex.fe_len;</div><div class='ctx'> 	pa-&gt;pa_free = pa-&gt;pa_len;</div><div class='ctx'> 	spin_lock_init(&amp;pa-&gt;pa_lock);</div><div class='del'>-	INIT_LIST_HEAD(&amp;pa-&gt;pa_inode_list);</div><div class='add'>+	INIT_LIST_HEAD(&amp;pa-&gt;pa_node.lg_list);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;pa-&gt;pa_group_list);</div><div class='ctx'> 	pa-&gt;pa_deleted = 0;</div><div class='ctx'> 	pa-&gt;pa_type = MB_GROUP_PA;</div><div class='hunk'>@@ -4700,10 +5388,12 @@ ext4_mb_new_group_pa(struct ext4_allocation_context *ac)</div><div class='ctx'> 	atomic_add(pa-&gt;pa_free, &amp;EXT4_SB(sb)-&gt;s_mb_preallocated);</div><div class='ctx'> </div><div class='ctx'> 	grp = ext4_get_group_info(sb, ac-&gt;ac_b_ex.fe_group);</div><div class='add'>+	if (!grp)</div><div class='add'>+		return;</div><div class='ctx'> 	lg = ac-&gt;ac_lg;</div><div class='ctx'> 	BUG_ON(lg == NULL);</div><div class='ctx'> </div><div class='del'>-	pa-&gt;pa_obj_lock = &amp;lg-&gt;lg_prealloc_lock;</div><div class='add'>+	pa-&gt;pa_node_lock.lg_lock = &amp;lg-&gt;lg_prealloc_lock;</div><div class='ctx'> 	pa-&gt;pa_inode = NULL;</div><div class='ctx'> </div><div class='ctx'> 	list_add(&amp;pa-&gt;pa_group_list, &amp;grp-&gt;bb_prealloc_list);</div><div class='hunk'>@@ -4730,7 +5420,7 @@ static void ext4_mb_new_preallocation(struct ext4_allocation_context *ac)</div><div class='ctx'>  * the caller MUST hold group/inode locks.</div><div class='ctx'>  * TODO: optimize the case when there are no in-core structures yet</div><div class='ctx'>  */</div><div class='del'>-static noinline_for_stack int</div><div class='add'>+static noinline_for_stack void</div><div class='ctx'> ext4_mb_release_inode_pa(struct ext4_buddy *e4b, struct buffer_head *bitmap_bh,</div><div class='ctx'> 			struct ext4_prealloc_space *pa)</div><div class='ctx'> {</div><div class='hunk'>@@ -4780,11 +5470,9 @@ ext4_mb_release_inode_pa(struct ext4_buddy *e4b, struct buffer_head *bitmap_bh,</div><div class='ctx'> 		 */</div><div class='ctx'> 	}</div><div class='ctx'> 	atomic_add(free, &amp;sbi-&gt;s_mb_discarded);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline_for_stack int</div><div class='add'>+static noinline_for_stack void</div><div class='ctx'> ext4_mb_release_group_pa(struct ext4_buddy *e4b,</div><div class='ctx'> 				struct ext4_prealloc_space *pa)</div><div class='ctx'> {</div><div class='hunk'>@@ -4795,12 +5483,14 @@ ext4_mb_release_group_pa(struct ext4_buddy *e4b,</div><div class='ctx'> 	trace_ext4_mb_release_group_pa(sb, pa);</div><div class='ctx'> 	BUG_ON(pa-&gt;pa_deleted == 0);</div><div class='ctx'> 	ext4_get_group_no_and_offset(sb, pa-&gt;pa_pstart, &amp;group, &amp;bit);</div><div class='del'>-	BUG_ON(group != e4b-&gt;bd_group &amp;&amp; pa-&gt;pa_len != 0);</div><div class='add'>+	if (unlikely(group != e4b-&gt;bd_group &amp;&amp; pa-&gt;pa_len != 0)) {</div><div class='add'>+		ext4_warning(sb, "bad group: expected %u, group %u, pa_start %llu",</div><div class='add'>+			     e4b-&gt;bd_group, group, pa-&gt;pa_pstart);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='ctx'> 	mb_free_blocks(pa-&gt;pa_inode, e4b, bit, pa-&gt;pa_len);</div><div class='ctx'> 	atomic_add(pa-&gt;pa_len, &amp;EXT4_SB(sb)-&gt;s_mb_discarded);</div><div class='ctx'> 	trace_ext4_mballoc_discard(sb, NULL, group, bit, pa-&gt;pa_len);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -4814,17 +5504,19 @@ ext4_mb_release_group_pa(struct ext4_buddy *e4b,</div><div class='ctx'>  */</div><div class='ctx'> static noinline_for_stack int</div><div class='ctx'> ext4_mb_discard_group_preallocations(struct super_block *sb,</div><div class='del'>-					ext4_group_t group, int needed)</div><div class='add'>+				     ext4_group_t group, int *busy)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_group_info *grp = ext4_get_group_info(sb, group);</div><div class='ctx'> 	struct buffer_head *bitmap_bh = NULL;</div><div class='ctx'> 	struct ext4_prealloc_space *pa, *tmp;</div><div class='del'>-	struct list_head list;</div><div class='add'>+	LIST_HEAD(list);</div><div class='ctx'> 	struct ext4_buddy e4b;</div><div class='add'>+	struct ext4_inode_info *ei;</div><div class='ctx'> 	int err;</div><div class='del'>-	int busy = 0;</div><div class='del'>-	int free, free_total = 0;</div><div class='add'>+	int free = 0;</div><div class='ctx'> </div><div class='add'>+	if (!grp)</div><div class='add'>+		return 0;</div><div class='ctx'> 	mb_debug(sb, "discard preallocation for group %u\n", group);</div><div class='ctx'> 	if (list_empty(&amp;grp-&gt;bb_prealloc_list))</div><div class='ctx'> 		goto out_dbg;</div><div class='hunk'>@@ -4846,19 +5538,13 @@ ext4_mb_discard_group_preallocations(struct super_block *sb,</div><div class='ctx'> 		goto out_dbg;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (needed == 0)</div><div class='del'>-		needed = EXT4_CLUSTERS_PER_GROUP(sb) + 1;</div><div class='del'>-</div><div class='del'>-	INIT_LIST_HEAD(&amp;list);</div><div class='del'>-repeat:</div><div class='del'>-	free = 0;</div><div class='ctx'> 	ext4_lock_group(sb, group);</div><div class='ctx'> 	list_for_each_entry_safe(pa, tmp,</div><div class='ctx'> 				&amp;grp-&gt;bb_prealloc_list, pa_group_list) {</div><div class='ctx'> 		spin_lock(&amp;pa-&gt;pa_lock);</div><div class='ctx'> 		if (atomic_read(&amp;pa-&gt;pa_count)) {</div><div class='ctx'> 			spin_unlock(&amp;pa-&gt;pa_lock);</div><div class='del'>-			busy = 1;</div><div class='add'>+			*busy = 1;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (pa-&gt;pa_deleted) {</div><div class='hunk'>@@ -4885,35 +5571,35 @@ repeat:</div><div class='ctx'> 	list_for_each_entry_safe(pa, tmp, &amp;list, u.pa_tmp_list) {</div><div class='ctx'> </div><div class='ctx'> 		/* remove from object (inode or locality group) */</div><div class='del'>-		spin_lock(pa-&gt;pa_obj_lock);</div><div class='del'>-		list_del_rcu(&amp;pa-&gt;pa_inode_list);</div><div class='del'>-		spin_unlock(pa-&gt;pa_obj_lock);</div><div class='add'>+		if (pa-&gt;pa_type == MB_GROUP_PA) {</div><div class='add'>+			spin_lock(pa-&gt;pa_node_lock.lg_lock);</div><div class='add'>+			list_del_rcu(&amp;pa-&gt;pa_node.lg_list);</div><div class='add'>+			spin_unlock(pa-&gt;pa_node_lock.lg_lock);</div><div class='add'>+		} else {</div><div class='add'>+			write_lock(pa-&gt;pa_node_lock.inode_lock);</div><div class='add'>+			ei = EXT4_I(pa-&gt;pa_inode);</div><div class='add'>+			rb_erase(&amp;pa-&gt;pa_node.inode_node, &amp;ei-&gt;i_prealloc_node);</div><div class='add'>+			write_unlock(pa-&gt;pa_node_lock.inode_lock);</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-		if (pa-&gt;pa_type == MB_GROUP_PA)</div><div class='add'>+		list_del(&amp;pa-&gt;u.pa_tmp_list);</div><div class='add'>+</div><div class='add'>+		if (pa-&gt;pa_type == MB_GROUP_PA) {</div><div class='ctx'> 			ext4_mb_release_group_pa(&amp;e4b, pa);</div><div class='del'>-		else</div><div class='add'>+			call_rcu(&amp;(pa)-&gt;u.pa_rcu, ext4_mb_pa_callback);</div><div class='add'>+		} else {</div><div class='ctx'> 			ext4_mb_release_inode_pa(&amp;e4b, bitmap_bh, pa);</div><div class='del'>-</div><div class='del'>-		list_del(&amp;pa-&gt;u.pa_tmp_list);</div><div class='del'>-		call_rcu(&amp;(pa)-&gt;u.pa_rcu, ext4_mb_pa_callback);</div><div class='add'>+			ext4_mb_pa_free(pa);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	free_total += free;</div><div class='del'>-</div><div class='del'>-	/* if we still need more blocks and some PAs were used, try again */</div><div class='del'>-	if (free_total &lt; needed &amp;&amp; busy) {</div><div class='del'>-		ext4_unlock_group(sb, group);</div><div class='del'>-		cond_resched();</div><div class='del'>-		busy = 0;</div><div class='del'>-		goto repeat;</div><div class='del'>-	}</div><div class='ctx'> 	ext4_unlock_group(sb, group);</div><div class='ctx'> 	ext4_mb_unload_buddy(&amp;e4b);</div><div class='ctx'> 	put_bh(bitmap_bh);</div><div class='ctx'> out_dbg:</div><div class='ctx'> 	mb_debug(sb, "discarded (%d) blocks preallocated for group %u bb_free (%d)\n",</div><div class='del'>-		 free_total, group, grp-&gt;bb_free);</div><div class='del'>-	return free_total;</div><div class='add'>+		 free, group, grp-&gt;bb_free);</div><div class='add'>+	return free;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -4925,21 +5611,20 @@ out_dbg:</div><div class='ctx'>  *</div><div class='ctx'>  * FIXME!! Make sure it is valid at all the call sites</div><div class='ctx'>  */</div><div class='del'>-void ext4_discard_preallocations(struct inode *inode, unsigned int needed)</div><div class='add'>+void ext4_discard_preallocations(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_inode_info *ei = EXT4_I(inode);</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	struct buffer_head *bitmap_bh = NULL;</div><div class='ctx'> 	struct ext4_prealloc_space *pa, *tmp;</div><div class='ctx'> 	ext4_group_t group = 0;</div><div class='del'>-	struct list_head list;</div><div class='add'>+	LIST_HEAD(list);</div><div class='ctx'> 	struct ext4_buddy e4b;</div><div class='add'>+	struct rb_node *iter;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	if (!S_ISREG(inode-&gt;i_mode)) {</div><div class='del'>-		/*BUG_ON(!list_empty(&amp;ei-&gt;i_prealloc_list));*/</div><div class='add'>+	if (!S_ISREG(inode-&gt;i_mode))</div><div class='ctx'> 		return;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	if (EXT4_SB(sb)-&gt;s_mount_state &amp; EXT4_FC_REPLAY)</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -4947,26 +5632,23 @@ void ext4_discard_preallocations(struct inode *inode, unsigned int needed)</div><div class='ctx'> 	mb_debug(sb, "discard preallocation for inode %lu\n",</div><div class='ctx'> 		 inode-&gt;i_ino);</div><div class='ctx'> 	trace_ext4_discard_preallocations(inode,</div><div class='del'>-			atomic_read(&amp;ei-&gt;i_prealloc_active), needed);</div><div class='del'>-</div><div class='del'>-	INIT_LIST_HEAD(&amp;list);</div><div class='del'>-</div><div class='del'>-	if (needed == 0)</div><div class='del'>-		needed = UINT_MAX;</div><div class='add'>+			atomic_read(&amp;ei-&gt;i_prealloc_active));</div><div class='ctx'> </div><div class='ctx'> repeat:</div><div class='ctx'> 	/* first, collect all pa's in the inode */</div><div class='del'>-	spin_lock(&amp;ei-&gt;i_prealloc_lock);</div><div class='del'>-	while (!list_empty(&amp;ei-&gt;i_prealloc_list) &amp;&amp; needed) {</div><div class='del'>-		pa = list_entry(ei-&gt;i_prealloc_list.prev,</div><div class='del'>-				struct ext4_prealloc_space, pa_inode_list);</div><div class='del'>-		BUG_ON(pa-&gt;pa_obj_lock != &amp;ei-&gt;i_prealloc_lock);</div><div class='add'>+	write_lock(&amp;ei-&gt;i_prealloc_lock);</div><div class='add'>+	for (iter = rb_first(&amp;ei-&gt;i_prealloc_node); iter;</div><div class='add'>+	     iter = rb_next(iter)) {</div><div class='add'>+		pa = rb_entry(iter, struct ext4_prealloc_space,</div><div class='add'>+			      pa_node.inode_node);</div><div class='add'>+		BUG_ON(pa-&gt;pa_node_lock.inode_lock != &amp;ei-&gt;i_prealloc_lock);</div><div class='add'>+</div><div class='ctx'> 		spin_lock(&amp;pa-&gt;pa_lock);</div><div class='ctx'> 		if (atomic_read(&amp;pa-&gt;pa_count)) {</div><div class='ctx'> 			/* this shouldn't happen often - nobody should</div><div class='ctx'> 			 * use preallocation while we're discarding it */</div><div class='ctx'> 			spin_unlock(&amp;pa-&gt;pa_lock);</div><div class='del'>-			spin_unlock(&amp;ei-&gt;i_prealloc_lock);</div><div class='add'>+			write_unlock(&amp;ei-&gt;i_prealloc_lock);</div><div class='ctx'> 			ext4_msg(sb, KERN_ERR,</div><div class='ctx'> 				 "uh-oh! used pa while discarding");</div><div class='ctx'> 			WARN_ON(1);</div><div class='hunk'>@@ -4977,15 +5659,14 @@ repeat:</div><div class='ctx'> 		if (pa-&gt;pa_deleted == 0) {</div><div class='ctx'> 			ext4_mb_mark_pa_deleted(sb, pa);</div><div class='ctx'> 			spin_unlock(&amp;pa-&gt;pa_lock);</div><div class='del'>-			list_del_rcu(&amp;pa-&gt;pa_inode_list);</div><div class='add'>+			rb_erase(&amp;pa-&gt;pa_node.inode_node, &amp;ei-&gt;i_prealloc_node);</div><div class='ctx'> 			list_add(&amp;pa-&gt;u.pa_tmp_list, &amp;list);</div><div class='del'>-			needed--;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* someone is deleting pa right now */</div><div class='ctx'> 		spin_unlock(&amp;pa-&gt;pa_lock);</div><div class='del'>-		spin_unlock(&amp;ei-&gt;i_prealloc_lock);</div><div class='add'>+		write_unlock(&amp;ei-&gt;i_prealloc_lock);</div><div class='ctx'> </div><div class='ctx'> 		/* we have to wait here because pa_deleted</div><div class='ctx'> 		 * doesn't mean pa is already unlinked from</div><div class='hunk'>@@ -5002,7 +5683,7 @@ repeat:</div><div class='ctx'> 		schedule_timeout_uninterruptible(HZ);</div><div class='ctx'> 		goto repeat;</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;ei-&gt;i_prealloc_lock);</div><div class='add'>+	write_unlock(&amp;ei-&gt;i_prealloc_lock);</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry_safe(pa, tmp, &amp;list, u.pa_tmp_list) {</div><div class='ctx'> 		BUG_ON(pa-&gt;pa_type != MB_INODE_PA);</div><div class='hunk'>@@ -5034,7 +5715,7 @@ repeat:</div><div class='ctx'> 		put_bh(bitmap_bh);</div><div class='ctx'> </div><div class='ctx'> 		list_del(&amp;pa-&gt;u.pa_tmp_list);</div><div class='del'>-		call_rcu(&amp;(pa)-&gt;u.pa_rcu, ext4_mb_pa_callback);</div><div class='add'>+		ext4_mb_pa_free(pa);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5051,14 +5732,20 @@ static int ext4_mb_pa_alloc(struct ext4_allocation_context *ac)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void ext4_mb_pa_free(struct ext4_allocation_context *ac)</div><div class='add'>+static void ext4_mb_pa_put_free(struct ext4_allocation_context *ac)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_prealloc_space *pa = ac-&gt;ac_pa;</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(!pa);</div><div class='ctx'> 	ac-&gt;ac_pa = NULL;</div><div class='ctx'> 	WARN_ON(!atomic_dec_and_test(&amp;pa-&gt;pa_count));</div><div class='del'>-	kmem_cache_free(ext4_pspace_cachep, pa);</div><div class='add'>+	/*</div><div class='add'>+	 * current function is only called due to an error or due to</div><div class='add'>+	 * len of found blocks &lt; len of requested blocks hence the PA has not</div><div class='add'>+	 * been added to grp-&gt;bb_prealloc_list. So we don't need to lock it</div><div class='add'>+	 */</div><div class='add'>+	pa-&gt;pa_deleted = 1;</div><div class='add'>+	ext4_mb_pa_free(pa);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_EXT4_DEBUG</div><div class='hunk'>@@ -5066,7 +5753,7 @@ static inline void ext4_mb_show_pa(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	ext4_group_t i, ngroups;</div><div class='ctx'> </div><div class='del'>-	if (ext4_test_mount_flag(sb, EXT4_MF_FS_ABORTED))</div><div class='add'>+	if (ext4_emergency_state(sb))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	ngroups = ext4_get_groups_count(sb);</div><div class='hunk'>@@ -5076,6 +5763,9 @@ static inline void ext4_mb_show_pa(struct super_block *sb)</div><div class='ctx'> 		struct ext4_prealloc_space *pa;</div><div class='ctx'> 		ext4_grpblk_t start;</div><div class='ctx'> 		struct list_head *cur;</div><div class='add'>+</div><div class='add'>+		if (!grp)</div><div class='add'>+			continue;</div><div class='ctx'> 		ext4_lock_group(sb, i);</div><div class='ctx'> 		list_for_each(cur, &amp;grp-&gt;bb_prealloc_list) {</div><div class='ctx'> 			pa = list_entry(cur, struct ext4_prealloc_space,</div><div class='hunk'>@@ -5097,7 +5787,7 @@ static void ext4_mb_show_ac(struct ext4_allocation_context *ac)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = ac-&gt;ac_sb;</div><div class='ctx'> </div><div class='del'>-	if (ext4_test_mount_flag(sb, EXT4_MF_FS_ABORTED))</div><div class='add'>+	if (ext4_emergency_state(sb))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	mb_debug(sb, "Can't allocate:"</div><div class='hunk'>@@ -5121,17 +5811,19 @@ static void ext4_mb_show_ac(struct ext4_allocation_context *ac)</div><div class='ctx'> 			(unsigned long)ac-&gt;ac_b_ex.fe_logical,</div><div class='ctx'> 			(int)ac-&gt;ac_criteria);</div><div class='ctx'> 	mb_debug(sb, "%u found", ac-&gt;ac_found);</div><div class='add'>+	mb_debug(sb, "used pa: %s, ", str_yes_no(ac-&gt;ac_pa));</div><div class='add'>+	if (ac-&gt;ac_pa)</div><div class='add'>+		mb_debug(sb, "pa_type %s\n", ac-&gt;ac_pa-&gt;pa_type == MB_GROUP_PA ?</div><div class='add'>+			 "group pa" : "inode pa");</div><div class='ctx'> 	ext4_mb_show_pa(sb);</div><div class='ctx'> }</div><div class='ctx'> #else</div><div class='ctx'> static inline void ext4_mb_show_pa(struct super_block *sb)</div><div class='ctx'> {</div><div class='del'>-	return;</div><div class='ctx'> }</div><div class='ctx'> static inline void ext4_mb_show_ac(struct ext4_allocation_context *ac)</div><div class='ctx'> {</div><div class='ctx'> 	ext4_mb_show_pa(ac-&gt;ac_sb);</div><div class='del'>-	return;</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='hunk'>@@ -5147,6 +5839,7 @@ static void ext4_mb_group_or_file(struct ext4_allocation_context *ac)</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(ac-&gt;ac_sb);</div><div class='ctx'> 	int bsbits = ac-&gt;ac_sb-&gt;s_blocksize_bits;</div><div class='ctx'> 	loff_t size, isize;</div><div class='add'>+	bool inode_pa_eligible, group_pa_eligible;</div><div class='ctx'> </div><div class='ctx'> 	if (!(ac-&gt;ac_flags &amp; EXT4_MB_HINT_DATA))</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -5154,25 +5847,27 @@ static void ext4_mb_group_or_file(struct ext4_allocation_context *ac)</div><div class='ctx'> 	if (unlikely(ac-&gt;ac_flags &amp; EXT4_MB_HINT_GOAL_ONLY))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	size = ac-&gt;ac_o_ex.fe_logical + EXT4_C2B(sbi, ac-&gt;ac_o_ex.fe_len);</div><div class='add'>+	group_pa_eligible = sbi-&gt;s_mb_group_prealloc &gt; 0;</div><div class='add'>+	inode_pa_eligible = true;</div><div class='add'>+	size = extent_logical_end(sbi, &amp;ac-&gt;ac_o_ex);</div><div class='ctx'> 	isize = (i_size_read(ac-&gt;ac_inode) + ac-&gt;ac_sb-&gt;s_blocksize - 1)</div><div class='ctx'> 		&gt;&gt; bsbits;</div><div class='ctx'> </div><div class='add'>+	/* No point in using inode preallocation for closed files */</div><div class='ctx'> 	if ((size == isize) &amp;&amp; !ext4_fs_is_busy(sbi) &amp;&amp;</div><div class='del'>-	    !inode_is_open_for_write(ac-&gt;ac_inode)) {</div><div class='del'>-		ac-&gt;ac_flags |= EXT4_MB_HINT_NOPREALLOC;</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='add'>+	    !inode_is_open_for_write(ac-&gt;ac_inode))</div><div class='add'>+		inode_pa_eligible = false;</div><div class='ctx'> </div><div class='del'>-	if (sbi-&gt;s_mb_group_prealloc &lt;= 0) {</div><div class='del'>-		ac-&gt;ac_flags |= EXT4_MB_STREAM_ALLOC;</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* don't use group allocation for large files */</div><div class='ctx'> 	size = max(size, isize);</div><div class='del'>-	if (size &gt; sbi-&gt;s_mb_stream_request) {</div><div class='del'>-		ac-&gt;ac_flags |= EXT4_MB_STREAM_ALLOC;</div><div class='add'>+	/* Don't use group allocation for large files */</div><div class='add'>+	if (size &gt; sbi-&gt;s_mb_stream_request)</div><div class='add'>+		group_pa_eligible = false;</div><div class='add'>+</div><div class='add'>+	if (!group_pa_eligible) {</div><div class='add'>+		if (inode_pa_eligible)</div><div class='add'>+			ac-&gt;ac_flags |= EXT4_MB_STREAM_ALLOC;</div><div class='add'>+		else</div><div class='add'>+			ac-&gt;ac_flags |= EXT4_MB_HINT_NOPREALLOC;</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -5191,7 +5886,7 @@ static void ext4_mb_group_or_file(struct ext4_allocation_context *ac)</div><div class='ctx'> 	mutex_lock(&amp;ac-&gt;ac_lg-&gt;lg_mutex);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline_for_stack int</div><div class='add'>+static noinline_for_stack void</div><div class='ctx'> ext4_mb_initialize_context(struct ext4_allocation_context *ac,</div><div class='ctx'> 				struct ext4_allocation_request *ar)</div><div class='ctx'> {</div><div class='hunk'>@@ -5227,6 +5922,7 @@ ext4_mb_initialize_context(struct ext4_allocation_context *ac,</div><div class='ctx'> 	ac-&gt;ac_o_ex.fe_start = block;</div><div class='ctx'> 	ac-&gt;ac_o_ex.fe_len = len;</div><div class='ctx'> 	ac-&gt;ac_g_ex = ac-&gt;ac_o_ex;</div><div class='add'>+	ac-&gt;ac_orig_goal_len = ac-&gt;ac_g_ex.fe_len;</div><div class='ctx'> 	ac-&gt;ac_flags = ar-&gt;flags;</div><div class='ctx'> </div><div class='ctx'> 	/* we have to define context: we'll work with a file or</div><div class='hunk'>@@ -5240,8 +5936,6 @@ ext4_mb_initialize_context(struct ext4_allocation_context *ac,</div><div class='ctx'> 			(unsigned) ar-&gt;lleft, (unsigned) ar-&gt;pleft,</div><div class='ctx'> 			(unsigned) ar-&gt;lright, (unsigned) ar-&gt;pright,</div><div class='ctx'> 			inode_is_open_for_write(ar-&gt;inode) ? "" : "non-");</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static noinline_for_stack void</div><div class='hunk'>@@ -5251,16 +5945,14 @@ ext4_mb_discard_lg_preallocations(struct super_block *sb,</div><div class='ctx'> {</div><div class='ctx'> 	ext4_group_t group = 0;</div><div class='ctx'> 	struct ext4_buddy e4b;</div><div class='del'>-	struct list_head discard_list;</div><div class='add'>+	LIST_HEAD(discard_list);</div><div class='ctx'> 	struct ext4_prealloc_space *pa, *tmp;</div><div class='ctx'> </div><div class='ctx'> 	mb_debug(sb, "discard locality group preallocation\n");</div><div class='ctx'> </div><div class='del'>-	INIT_LIST_HEAD(&amp;discard_list);</div><div class='del'>-</div><div class='ctx'> 	spin_lock(&amp;lg-&gt;lg_prealloc_lock);</div><div class='ctx'> 	list_for_each_entry_rcu(pa, &amp;lg-&gt;lg_prealloc_list[order],</div><div class='del'>-				pa_inode_list,</div><div class='add'>+				pa_node.lg_list,</div><div class='ctx'> 				lockdep_is_held(&amp;lg-&gt;lg_prealloc_lock)) {</div><div class='ctx'> 		spin_lock(&amp;pa-&gt;pa_lock);</div><div class='ctx'> 		if (atomic_read(&amp;pa-&gt;pa_count)) {</div><div class='hunk'>@@ -5283,7 +5975,7 @@ ext4_mb_discard_lg_preallocations(struct super_block *sb,</div><div class='ctx'> 		ext4_mb_mark_pa_deleted(sb, pa);</div><div class='ctx'> 		spin_unlock(&amp;pa-&gt;pa_lock);</div><div class='ctx'> </div><div class='del'>-		list_del_rcu(&amp;pa-&gt;pa_inode_list);</div><div class='add'>+		list_del_rcu(&amp;pa-&gt;pa_node.lg_list);</div><div class='ctx'> 		list_add(&amp;pa-&gt;u.pa_tmp_list, &amp;discard_list);</div><div class='ctx'> </div><div class='ctx'> 		total_entries--;</div><div class='hunk'>@@ -5344,7 +6036,7 @@ static void ext4_mb_add_n_trim(struct ext4_allocation_context *ac)</div><div class='ctx'> 	/* Add the prealloc space to lg */</div><div class='ctx'> 	spin_lock(&amp;lg-&gt;lg_prealloc_lock);</div><div class='ctx'> 	list_for_each_entry_rcu(tmp_pa, &amp;lg-&gt;lg_prealloc_list[order],</div><div class='del'>-				pa_inode_list,</div><div class='add'>+				pa_node.lg_list,</div><div class='ctx'> 				lockdep_is_held(&amp;lg-&gt;lg_prealloc_lock)) {</div><div class='ctx'> 		spin_lock(&amp;tmp_pa-&gt;pa_lock);</div><div class='ctx'> 		if (tmp_pa-&gt;pa_deleted) {</div><div class='hunk'>@@ -5353,8 +6045,8 @@ static void ext4_mb_add_n_trim(struct ext4_allocation_context *ac)</div><div class='ctx'> 		}</div><div class='ctx'> 		if (!added &amp;&amp; pa-&gt;pa_free &lt; tmp_pa-&gt;pa_free) {</div><div class='ctx'> 			/* Add to the tail of the previous entry */</div><div class='del'>-			list_add_tail_rcu(&amp;pa-&gt;pa_inode_list,</div><div class='del'>-						&amp;tmp_pa-&gt;pa_inode_list);</div><div class='add'>+			list_add_tail_rcu(&amp;pa-&gt;pa_node.lg_list,</div><div class='add'>+						&amp;tmp_pa-&gt;pa_node.lg_list);</div><div class='ctx'> 			added = 1;</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * we want to count the total</div><div class='hunk'>@@ -5365,43 +6057,21 @@ static void ext4_mb_add_n_trim(struct ext4_allocation_context *ac)</div><div class='ctx'> 		lg_prealloc_count++;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!added)</div><div class='del'>-		list_add_tail_rcu(&amp;pa-&gt;pa_inode_list,</div><div class='add'>+		list_add_tail_rcu(&amp;pa-&gt;pa_node.lg_list,</div><div class='ctx'> 					&amp;lg-&gt;lg_prealloc_list[order]);</div><div class='ctx'> 	spin_unlock(&amp;lg-&gt;lg_prealloc_lock);</div><div class='ctx'> </div><div class='ctx'> 	/* Now trim the list to be not more than 8 elements */</div><div class='del'>-	if (lg_prealloc_count &gt; 8) {</div><div class='add'>+	if (lg_prealloc_count &gt; 8)</div><div class='ctx'> 		ext4_mb_discard_lg_preallocations(sb, lg,</div><div class='ctx'> 						  order, lg_prealloc_count);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-	return ;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * if per-inode prealloc list is too long, trim some PA</div><div class='del'>- */</div><div class='del'>-static void ext4_mb_trim_inode_pa(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	struct ext4_inode_info *ei = EXT4_I(inode);</div><div class='del'>-	struct ext4_sb_info *sbi = EXT4_SB(inode-&gt;i_sb);</div><div class='del'>-	int count, delta;</div><div class='del'>-</div><div class='del'>-	count = atomic_read(&amp;ei-&gt;i_prealloc_active);</div><div class='del'>-	delta = (sbi-&gt;s_mb_max_inode_prealloc &gt;&gt; 2) + 1;</div><div class='del'>-	if (count &gt; sbi-&gt;s_mb_max_inode_prealloc + delta) {</div><div class='del'>-		count -= sbi-&gt;s_mb_max_inode_prealloc;</div><div class='del'>-		ext4_discard_preallocations(inode, count);</div><div class='del'>-	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * release all resource we used in allocation</div><div class='ctx'>  */</div><div class='del'>-static int ext4_mb_release_context(struct ext4_allocation_context *ac)</div><div class='add'>+static void ext4_mb_release_context(struct ext4_allocation_context *ac)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = ac-&gt;ac_inode;</div><div class='del'>-	struct ext4_inode_info *ei = EXT4_I(inode);</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(ac-&gt;ac_sb);</div><div class='ctx'> 	struct ext4_prealloc_space *pa = ac-&gt;ac_pa;</div><div class='ctx'> 	if (pa) {</div><div class='hunk'>@@ -5421,47 +6091,46 @@ static int ext4_mb_release_context(struct ext4_allocation_context *ac)</div><div class='ctx'> 			 * doesn't grow big.</div><div class='ctx'> 			 */</div><div class='ctx'> 			if (likely(pa-&gt;pa_free)) {</div><div class='del'>-				spin_lock(pa-&gt;pa_obj_lock);</div><div class='del'>-				list_del_rcu(&amp;pa-&gt;pa_inode_list);</div><div class='del'>-				spin_unlock(pa-&gt;pa_obj_lock);</div><div class='add'>+				spin_lock(pa-&gt;pa_node_lock.lg_lock);</div><div class='add'>+				list_del_rcu(&amp;pa-&gt;pa_node.lg_list);</div><div class='add'>+				spin_unlock(pa-&gt;pa_node_lock.lg_lock);</div><div class='ctx'> 				ext4_mb_add_n_trim(ac);</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (pa-&gt;pa_type == MB_INODE_PA) {</div><div class='del'>-			/*</div><div class='del'>-			 * treat per-inode prealloc list as a lru list, then try</div><div class='del'>-			 * to trim the least recently used PA.</div><div class='del'>-			 */</div><div class='del'>-			spin_lock(pa-&gt;pa_obj_lock);</div><div class='del'>-			list_move(&amp;pa-&gt;pa_inode_list, &amp;ei-&gt;i_prealloc_list);</div><div class='del'>-			spin_unlock(pa-&gt;pa_obj_lock);</div><div class='del'>-		}</div><div class='del'>-</div><div class='ctx'> 		ext4_mb_put_pa(ac, ac-&gt;ac_sb, pa);</div><div class='ctx'> 	}</div><div class='del'>-	if (ac-&gt;ac_bitmap_page)</div><div class='del'>-		put_page(ac-&gt;ac_bitmap_page);</div><div class='del'>-	if (ac-&gt;ac_buddy_page)</div><div class='del'>-		put_page(ac-&gt;ac_buddy_page);</div><div class='add'>+	if (ac-&gt;ac_bitmap_folio)</div><div class='add'>+		folio_put(ac-&gt;ac_bitmap_folio);</div><div class='add'>+	if (ac-&gt;ac_buddy_folio)</div><div class='add'>+		folio_put(ac-&gt;ac_buddy_folio);</div><div class='ctx'> 	if (ac-&gt;ac_flags &amp; EXT4_MB_HINT_GROUP_ALLOC)</div><div class='ctx'> 		mutex_unlock(&amp;ac-&gt;ac_lg-&gt;lg_mutex);</div><div class='ctx'> 	ext4_mb_collect_stats(ac);</div><div class='del'>-	ext4_mb_trim_inode_pa(inode);</div><div class='del'>-	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ext4_mb_discard_preallocations(struct super_block *sb, int needed)</div><div class='ctx'> {</div><div class='ctx'> 	ext4_group_t i, ngroups = ext4_get_groups_count(sb);</div><div class='ctx'> 	int ret;</div><div class='del'>-	int freed = 0;</div><div class='add'>+	int freed = 0, busy = 0;</div><div class='add'>+	int retry = 0;</div><div class='ctx'> </div><div class='ctx'> 	trace_ext4_mb_discard_preallocations(sb, needed);</div><div class='add'>+</div><div class='add'>+	if (needed == 0)</div><div class='add'>+		needed = EXT4_CLUSTERS_PER_GROUP(sb) + 1;</div><div class='add'>+ repeat:</div><div class='ctx'> 	for (i = 0; i &lt; ngroups &amp;&amp; needed &gt; 0; i++) {</div><div class='del'>-		ret = ext4_mb_discard_group_preallocations(sb, i, needed);</div><div class='add'>+		ret = ext4_mb_discard_group_preallocations(sb, i, &amp;busy);</div><div class='ctx'> 		freed += ret;</div><div class='ctx'> 		needed -= ret;</div><div class='add'>+		cond_resched();</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (needed &gt; 0 &amp;&amp; busy &amp;&amp; ++retry &lt; 3) {</div><div class='add'>+		busy = 0;</div><div class='add'>+		goto repeat;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return freed;</div><div class='hunk'>@@ -5487,12 +6156,77 @@ static bool ext4_mb_discard_preallocations_should_retry(struct super_block *sb,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> out_dbg:</div><div class='del'>-	mb_debug(sb, "freed %d, retry ? %s\n", freed, ret ? "yes" : "no");</div><div class='add'>+	mb_debug(sb, "freed %d, retry ? %s\n", freed, str_yes_no(ret));</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static ext4_fsblk_t ext4_mb_new_blocks_simple(handle_t *handle,</div><div class='del'>-				struct ext4_allocation_request *ar, int *errp);</div><div class='add'>+/*</div><div class='add'>+ * Simple allocator for Ext4 fast commit replay path. It searches for blocks</div><div class='add'>+ * linearly starting at the goal block and also excludes the blocks which</div><div class='add'>+ * are going to be in use after fast commit replay.</div><div class='add'>+ */</div><div class='add'>+static ext4_fsblk_t</div><div class='add'>+ext4_mb_new_blocks_simple(struct ext4_allocation_request *ar, int *errp)</div><div class='add'>+{</div><div class='add'>+	struct buffer_head *bitmap_bh;</div><div class='add'>+	struct super_block *sb = ar-&gt;inode-&gt;i_sb;</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	ext4_group_t group, nr;</div><div class='add'>+	ext4_grpblk_t blkoff;</div><div class='add'>+	ext4_grpblk_t max = EXT4_CLUSTERS_PER_GROUP(sb);</div><div class='add'>+	ext4_grpblk_t i = 0;</div><div class='add'>+	ext4_fsblk_t goal, block;</div><div class='add'>+	struct ext4_super_block *es = sbi-&gt;s_es;</div><div class='add'>+</div><div class='add'>+	goal = ar-&gt;goal;</div><div class='add'>+	if (goal &lt; le32_to_cpu(es-&gt;s_first_data_block) ||</div><div class='add'>+			goal &gt;= ext4_blocks_count(es))</div><div class='add'>+		goal = le32_to_cpu(es-&gt;s_first_data_block);</div><div class='add'>+</div><div class='add'>+	ar-&gt;len = 0;</div><div class='add'>+	ext4_get_group_no_and_offset(sb, goal, &amp;group, &amp;blkoff);</div><div class='add'>+	for (nr = ext4_get_groups_count(sb); nr &gt; 0; nr--) {</div><div class='add'>+		bitmap_bh = ext4_read_block_bitmap(sb, group);</div><div class='add'>+		if (IS_ERR(bitmap_bh)) {</div><div class='add'>+			*errp = PTR_ERR(bitmap_bh);</div><div class='add'>+			pr_warn("Failed to read block bitmap\n");</div><div class='add'>+			return 0;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		while (1) {</div><div class='add'>+			i = mb_find_next_zero_bit(bitmap_bh-&gt;b_data, max,</div><div class='add'>+						blkoff);</div><div class='add'>+			if (i &gt;= max)</div><div class='add'>+				break;</div><div class='add'>+			if (ext4_fc_replay_check_excluded(sb,</div><div class='add'>+				ext4_group_first_block_no(sb, group) +</div><div class='add'>+				EXT4_C2B(sbi, i))) {</div><div class='add'>+				blkoff = i + 1;</div><div class='add'>+			} else</div><div class='add'>+				break;</div><div class='add'>+		}</div><div class='add'>+		brelse(bitmap_bh);</div><div class='add'>+		if (i &lt; max)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		if (++group &gt;= ext4_get_groups_count(sb))</div><div class='add'>+			group = 0;</div><div class='add'>+</div><div class='add'>+		blkoff = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (i &gt;= max) {</div><div class='add'>+		*errp = -ENOSPC;</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	block = ext4_group_first_block_no(sb, group) + EXT4_C2B(sbi, i);</div><div class='add'>+	ext4_mb_mark_bb(sb, block, 1, true);</div><div class='add'>+	ar-&gt;len = 1;</div><div class='add'>+</div><div class='add'>+	*errp = 0;</div><div class='add'>+	return block;</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Main entry point into mballoc to allocate blocks</div><div class='hunk'>@@ -5508,6 +6242,7 @@ ext4_fsblk_t ext4_mb_new_blocks(handle_t *handle,</div><div class='ctx'> 	ext4_fsblk_t block = 0;</div><div class='ctx'> 	unsigned int inquota = 0;</div><div class='ctx'> 	unsigned int reserv_clstrs = 0;</div><div class='add'>+	int retries = 0;</div><div class='ctx'> 	u64 seq;</div><div class='ctx'> </div><div class='ctx'> 	might_sleep();</div><div class='hunk'>@@ -5516,7 +6251,7 @@ ext4_fsblk_t ext4_mb_new_blocks(handle_t *handle,</div><div class='ctx'> </div><div class='ctx'> 	trace_ext4_request_blocks(ar);</div><div class='ctx'> 	if (sbi-&gt;s_mount_state &amp; EXT4_FC_REPLAY)</div><div class='del'>-		return ext4_mb_new_blocks_simple(handle, ar, errp);</div><div class='add'>+		return ext4_mb_new_blocks_simple(ar, errp);</div><div class='ctx'> </div><div class='ctx'> 	/* Allow to use superuser reservation for quota file */</div><div class='ctx'> 	if (ext4_is_quota_file(ar-&gt;inode))</div><div class='hunk'>@@ -5566,11 +6301,7 @@ ext4_fsblk_t ext4_mb_new_blocks(handle_t *handle,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	*errp = ext4_mb_initialize_context(ac, ar);</div><div class='del'>-	if (*errp) {</div><div class='del'>-		ar-&gt;len = 0;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	ext4_mb_initialize_context(ac, ar);</div><div class='ctx'> </div><div class='ctx'> 	ac-&gt;ac_op = EXT4_MB_HISTORY_PREALLOC;</div><div class='ctx'> 	seq = this_cpu_read(discard_pa_seq);</div><div class='hunk'>@@ -5592,13 +6323,13 @@ repeat:</div><div class='ctx'> 		 * So we have to free this pa here itself.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (*errp) {</div><div class='del'>-			ext4_mb_pa_free(ac);</div><div class='add'>+			ext4_mb_pa_put_free(ac);</div><div class='ctx'> 			ext4_discard_allocated_blocks(ac);</div><div class='ctx'> 			goto errout;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (ac-&gt;ac_status == AC_STATUS_FOUND &amp;&amp;</div><div class='ctx'> 			ac-&gt;ac_o_ex.fe_len &gt;= ac-&gt;ac_f_ex.fe_len)</div><div class='del'>-			ext4_mb_pa_free(ac);</div><div class='add'>+			ext4_mb_pa_put_free(ac);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (likely(ac-&gt;ac_status == AC_STATUS_FOUND)) {</div><div class='ctx'> 		*errp = ext4_mb_mark_diskspace_used(ac, handle, reserv_clstrs);</div><div class='hunk'>@@ -5610,26 +6341,26 @@ repeat:</div><div class='ctx'> 			ar-&gt;len = ac-&gt;ac_b_ex.fe_len;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='del'>-		if (ext4_mb_discard_preallocations_should_retry(sb, ac, &amp;seq))</div><div class='add'>+		if (++retries &lt; 3 &amp;&amp;</div><div class='add'>+		    ext4_mb_discard_preallocations_should_retry(sb, ac, &amp;seq))</div><div class='ctx'> 			goto repeat;</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * If block allocation fails then the pa allocated above</div><div class='ctx'> 		 * needs to be freed here itself.</div><div class='ctx'> 		 */</div><div class='del'>-		ext4_mb_pa_free(ac);</div><div class='add'>+		ext4_mb_pa_put_free(ac);</div><div class='ctx'> 		*errp = -ENOSPC;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-errout:</div><div class='ctx'> 	if (*errp) {</div><div class='add'>+errout:</div><div class='ctx'> 		ac-&gt;ac_b_ex.fe_len = 0;</div><div class='ctx'> 		ar-&gt;len = 0;</div><div class='ctx'> 		ext4_mb_show_ac(ac);</div><div class='ctx'> 	}</div><div class='ctx'> 	ext4_mb_release_context(ac);</div><div class='add'>+	kmem_cache_free(ext4_ac_cachep, ac);</div><div class='ctx'> out:</div><div class='del'>-	if (ac)</div><div class='del'>-		kmem_cache_free(ext4_ac_cachep, ac);</div><div class='ctx'> 	if (inquota &amp;&amp; ar-&gt;len &lt; inquota)</div><div class='ctx'> 		dquot_free_block(ar-&gt;inode, EXT4_C2B(sbi, inquota - ar-&gt;len));</div><div class='ctx'> 	if (!ar-&gt;len) {</div><div class='hunk'>@@ -5649,47 +6380,83 @@ out:</div><div class='ctx'>  * are contiguous, AND the extents were freed by the same transaction,</div><div class='ctx'>  * AND the blocks are associated with the same group.</div><div class='ctx'>  */</div><div class='del'>-static void ext4_try_merge_freed_extent(struct ext4_sb_info *sbi,</div><div class='del'>-					struct ext4_free_data *entry,</div><div class='del'>-					struct ext4_free_data *new_entry,</div><div class='del'>-					struct rb_root *entry_rb_root)</div><div class='add'>+static inline bool</div><div class='add'>+ext4_freed_extents_can_be_merged(struct ext4_free_data *entry1,</div><div class='add'>+				 struct ext4_free_data *entry2)</div><div class='ctx'> {</div><div class='del'>-	if ((entry-&gt;efd_tid != new_entry-&gt;efd_tid) ||</div><div class='del'>-	    (entry-&gt;efd_group != new_entry-&gt;efd_group))</div><div class='del'>-		return;</div><div class='del'>-	if (entry-&gt;efd_start_cluster + entry-&gt;efd_count ==</div><div class='del'>-	    new_entry-&gt;efd_start_cluster) {</div><div class='del'>-		new_entry-&gt;efd_start_cluster = entry-&gt;efd_start_cluster;</div><div class='del'>-		new_entry-&gt;efd_count += entry-&gt;efd_count;</div><div class='del'>-	} else if (new_entry-&gt;efd_start_cluster + new_entry-&gt;efd_count ==</div><div class='del'>-		   entry-&gt;efd_start_cluster) {</div><div class='del'>-		new_entry-&gt;efd_count += entry-&gt;efd_count;</div><div class='del'>-	} else</div><div class='del'>-		return;</div><div class='add'>+	if (entry1-&gt;efd_tid != entry2-&gt;efd_tid)</div><div class='add'>+		return false;</div><div class='add'>+	if (entry1-&gt;efd_start_cluster + entry1-&gt;efd_count !=</div><div class='add'>+	    entry2-&gt;efd_start_cluster)</div><div class='add'>+		return false;</div><div class='add'>+	if (WARN_ON_ONCE(entry1-&gt;efd_group != entry2-&gt;efd_group))</div><div class='add'>+		return false;</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void</div><div class='add'>+ext4_merge_freed_extents(struct ext4_sb_info *sbi, struct rb_root *root,</div><div class='add'>+			 struct ext4_free_data *entry1,</div><div class='add'>+			 struct ext4_free_data *entry2)</div><div class='add'>+{</div><div class='add'>+	entry1-&gt;efd_count += entry2-&gt;efd_count;</div><div class='ctx'> 	spin_lock(&amp;sbi-&gt;s_md_lock);</div><div class='del'>-	list_del(&amp;entry-&gt;efd_list);</div><div class='add'>+	list_del(&amp;entry2-&gt;efd_list);</div><div class='ctx'> 	spin_unlock(&amp;sbi-&gt;s_md_lock);</div><div class='del'>-	rb_erase(&amp;entry-&gt;efd_node, entry_rb_root);</div><div class='del'>-	kmem_cache_free(ext4_free_data_cachep, entry);</div><div class='add'>+	rb_erase(&amp;entry2-&gt;efd_node, root);</div><div class='add'>+	kmem_cache_free(ext4_free_data_cachep, entry2);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static noinline_for_stack int</div><div class='add'>+static inline void</div><div class='add'>+ext4_try_merge_freed_extent_prev(struct ext4_sb_info *sbi, struct rb_root *root,</div><div class='add'>+				 struct ext4_free_data *entry)</div><div class='add'>+{</div><div class='add'>+	struct ext4_free_data *prev;</div><div class='add'>+	struct rb_node *node;</div><div class='add'>+</div><div class='add'>+	node = rb_prev(&amp;entry-&gt;efd_node);</div><div class='add'>+	if (!node)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	prev = rb_entry(node, struct ext4_free_data, efd_node);</div><div class='add'>+	if (ext4_freed_extents_can_be_merged(prev, entry))</div><div class='add'>+		ext4_merge_freed_extents(sbi, root, prev, entry);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void</div><div class='add'>+ext4_try_merge_freed_extent_next(struct ext4_sb_info *sbi, struct rb_root *root,</div><div class='add'>+				 struct ext4_free_data *entry)</div><div class='add'>+{</div><div class='add'>+	struct ext4_free_data *next;</div><div class='add'>+	struct rb_node *node;</div><div class='add'>+</div><div class='add'>+	node = rb_next(&amp;entry-&gt;efd_node);</div><div class='add'>+	if (!node)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	next = rb_entry(node, struct ext4_free_data, efd_node);</div><div class='add'>+	if (ext4_freed_extents_can_be_merged(entry, next))</div><div class='add'>+		ext4_merge_freed_extents(sbi, root, entry, next);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static noinline_for_stack void</div><div class='ctx'> ext4_mb_free_metadata(handle_t *handle, struct ext4_buddy *e4b,</div><div class='ctx'> 		      struct ext4_free_data *new_entry)</div><div class='ctx'> {</div><div class='ctx'> 	ext4_group_t group = e4b-&gt;bd_group;</div><div class='ctx'> 	ext4_grpblk_t cluster;</div><div class='ctx'> 	ext4_grpblk_t clusters = new_entry-&gt;efd_count;</div><div class='del'>-	struct ext4_free_data *entry;</div><div class='add'>+	struct ext4_free_data *entry = NULL;</div><div class='ctx'> 	struct ext4_group_info *db = e4b-&gt;bd_info;</div><div class='ctx'> 	struct super_block *sb = e4b-&gt;bd_sb;</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='del'>-	struct rb_node **n = &amp;db-&gt;bb_free_root.rb_node, *node;</div><div class='add'>+	struct rb_root *root = &amp;db-&gt;bb_free_root;</div><div class='add'>+	struct rb_node **n = &amp;root-&gt;rb_node;</div><div class='ctx'> 	struct rb_node *parent = NULL, *new_node;</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(!ext4_handle_valid(handle));</div><div class='del'>-	BUG_ON(e4b-&gt;bd_bitmap_page == NULL);</div><div class='del'>-	BUG_ON(e4b-&gt;bd_buddy_page == NULL);</div><div class='add'>+	BUG_ON(e4b-&gt;bd_bitmap_folio == NULL);</div><div class='add'>+	BUG_ON(e4b-&gt;bd_buddy_folio == NULL);</div><div class='ctx'> </div><div class='ctx'> 	new_node = &amp;new_entry-&gt;efd_node;</div><div class='ctx'> 	cluster = new_entry-&gt;efd_start_cluster;</div><div class='hunk'>@@ -5700,8 +6467,8 @@ ext4_mb_free_metadata(handle_t *handle, struct ext4_buddy *e4b,</div><div class='ctx'> 		 * otherwise we'll refresh it from</div><div class='ctx'> 		 * on-disk bitmap and lose not-yet-available</div><div class='ctx'> 		 * blocks */</div><div class='del'>-		get_page(e4b-&gt;bd_buddy_page);</div><div class='del'>-		get_page(e4b-&gt;bd_bitmap_page);</div><div class='add'>+		folio_get(e4b-&gt;bd_buddy_folio);</div><div class='add'>+		folio_get(e4b-&gt;bd_bitmap_folio);</div><div class='ctx'> 	}</div><div class='ctx'> 	while (*n) {</div><div class='ctx'> 		parent = *n;</div><div class='hunk'>@@ -5716,239 +6483,93 @@ ext4_mb_free_metadata(handle_t *handle, struct ext4_buddy *e4b,</div><div class='ctx'> 				EXT4_C2B(sbi, cluster),</div><div class='ctx'> 				"Block already on to-be-freed list");</div><div class='ctx'> 			kmem_cache_free(ext4_free_data_cachep, new_entry);</div><div class='del'>-			return 0;</div><div class='add'>+			return;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	rb_link_node(new_node, parent, n);</div><div class='del'>-	rb_insert_color(new_node, &amp;db-&gt;bb_free_root);</div><div class='add'>+	atomic_add(clusters, &amp;sbi-&gt;s_mb_free_pending);</div><div class='add'>+	if (!entry)</div><div class='add'>+		goto insert;</div><div class='ctx'> </div><div class='del'>-	/* Now try to see the extent can be merged to left and right */</div><div class='del'>-	node = rb_prev(new_node);</div><div class='del'>-	if (node) {</div><div class='del'>-		entry = rb_entry(node, struct ext4_free_data, efd_node);</div><div class='del'>-		ext4_try_merge_freed_extent(sbi, entry, new_entry,</div><div class='del'>-					    &amp;(db-&gt;bb_free_root));</div><div class='add'>+	/* Now try to see the extent can be merged to prev and next */</div><div class='add'>+	if (ext4_freed_extents_can_be_merged(new_entry, entry)) {</div><div class='add'>+		entry-&gt;efd_start_cluster = cluster;</div><div class='add'>+		entry-&gt;efd_count += new_entry-&gt;efd_count;</div><div class='add'>+		kmem_cache_free(ext4_free_data_cachep, new_entry);</div><div class='add'>+		ext4_try_merge_freed_extent_prev(sbi, root, entry);</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	node = rb_next(new_node);</div><div class='del'>-	if (node) {</div><div class='del'>-		entry = rb_entry(node, struct ext4_free_data, efd_node);</div><div class='del'>-		ext4_try_merge_freed_extent(sbi, entry, new_entry,</div><div class='del'>-					    &amp;(db-&gt;bb_free_root));</div><div class='add'>+	if (ext4_freed_extents_can_be_merged(entry, new_entry)) {</div><div class='add'>+		entry-&gt;efd_count += new_entry-&gt;efd_count;</div><div class='add'>+		kmem_cache_free(ext4_free_data_cachep, new_entry);</div><div class='add'>+		ext4_try_merge_freed_extent_next(sbi, root, entry);</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='add'>+insert:</div><div class='add'>+	rb_link_node(new_node, parent, n);</div><div class='add'>+	rb_insert_color(new_node, root);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;sbi-&gt;s_md_lock);</div><div class='del'>-	list_add_tail(&amp;new_entry-&gt;efd_list, &amp;sbi-&gt;s_freed_data_list);</div><div class='del'>-	sbi-&gt;s_mb_free_pending += clusters;</div><div class='add'>+	list_add_tail(&amp;new_entry-&gt;efd_list, &amp;sbi-&gt;s_freed_data_list[new_entry-&gt;efd_tid &amp; 1]);</div><div class='ctx'> 	spin_unlock(&amp;sbi-&gt;s_md_lock);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Simple allocator for Ext4 fast commit replay path. It searches for blocks</div><div class='del'>- * linearly starting at the goal block and also excludes the blocks which</div><div class='del'>- * are going to be in use after fast commit replay.</div><div class='del'>- */</div><div class='del'>-static ext4_fsblk_t ext4_mb_new_blocks_simple(handle_t *handle,</div><div class='del'>-				struct ext4_allocation_request *ar, int *errp)</div><div class='del'>-{</div><div class='del'>-	struct buffer_head *bitmap_bh;</div><div class='del'>-	struct super_block *sb = ar-&gt;inode-&gt;i_sb;</div><div class='del'>-	ext4_group_t group;</div><div class='del'>-	ext4_grpblk_t blkoff;</div><div class='del'>-	int i = sb-&gt;s_blocksize;</div><div class='del'>-	ext4_fsblk_t goal, block;</div><div class='del'>-	struct ext4_super_block *es = EXT4_SB(sb)-&gt;s_es;</div><div class='del'>-</div><div class='del'>-	goal = ar-&gt;goal;</div><div class='del'>-	if (goal &lt; le32_to_cpu(es-&gt;s_first_data_block) ||</div><div class='del'>-			goal &gt;= ext4_blocks_count(es))</div><div class='del'>-		goal = le32_to_cpu(es-&gt;s_first_data_block);</div><div class='del'>-</div><div class='del'>-	ar-&gt;len = 0;</div><div class='del'>-	ext4_get_group_no_and_offset(sb, goal, &amp;group, &amp;blkoff);</div><div class='del'>-	for (; group &lt; ext4_get_groups_count(sb); group++) {</div><div class='del'>-		bitmap_bh = ext4_read_block_bitmap(sb, group);</div><div class='del'>-		if (IS_ERR(bitmap_bh)) {</div><div class='del'>-			*errp = PTR_ERR(bitmap_bh);</div><div class='del'>-			pr_warn("Failed to read block bitmap\n");</div><div class='del'>-			return 0;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		ext4_get_group_no_and_offset(sb,</div><div class='del'>-			max(ext4_group_first_block_no(sb, group), goal),</div><div class='del'>-			NULL, &amp;blkoff);</div><div class='del'>-		i = mb_find_next_zero_bit(bitmap_bh-&gt;b_data, sb-&gt;s_blocksize,</div><div class='del'>-						blkoff);</div><div class='del'>-		brelse(bitmap_bh);</div><div class='del'>-		if (i &gt;= sb-&gt;s_blocksize)</div><div class='del'>-			continue;</div><div class='del'>-		if (ext4_fc_replay_check_excluded(sb,</div><div class='del'>-			ext4_group_first_block_no(sb, group) + i))</div><div class='del'>-			continue;</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (group &gt;= ext4_get_groups_count(sb) &amp;&amp; i &gt;= sb-&gt;s_blocksize)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	block = ext4_group_first_block_no(sb, group) + i;</div><div class='del'>-	ext4_mb_mark_bb(sb, block, 1, 1);</div><div class='del'>-	ar-&gt;len = 1;</div><div class='del'>-</div><div class='del'>-	return block;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void ext4_free_blocks_simple(struct inode *inode, ext4_fsblk_t block,</div><div class='ctx'> 					unsigned long count)</div><div class='ctx'> {</div><div class='del'>-	struct buffer_head *bitmap_bh;</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='del'>-	struct ext4_group_desc *gdp;</div><div class='del'>-	struct buffer_head *gdp_bh;</div><div class='ctx'> 	ext4_group_t group;</div><div class='ctx'> 	ext4_grpblk_t blkoff;</div><div class='del'>-	int already_freed = 0, err, i;</div><div class='ctx'> </div><div class='ctx'> 	ext4_get_group_no_and_offset(sb, block, &amp;group, &amp;blkoff);</div><div class='del'>-	bitmap_bh = ext4_read_block_bitmap(sb, group);</div><div class='del'>-	if (IS_ERR(bitmap_bh)) {</div><div class='del'>-		err = PTR_ERR(bitmap_bh);</div><div class='del'>-		pr_warn("Failed to read block bitmap\n");</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-	gdp = ext4_get_group_desc(sb, group, &amp;gdp_bh);</div><div class='del'>-	if (!gdp)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; count; i++) {</div><div class='del'>-		if (!mb_test_bit(blkoff + i, bitmap_bh-&gt;b_data))</div><div class='del'>-			already_freed++;</div><div class='del'>-	}</div><div class='del'>-	mb_clear_bits(bitmap_bh-&gt;b_data, blkoff, count);</div><div class='del'>-	err = ext4_handle_dirty_metadata(NULL, NULL, bitmap_bh);</div><div class='del'>-	if (err)</div><div class='del'>-		return;</div><div class='del'>-	ext4_free_group_clusters_set(</div><div class='del'>-		sb, gdp, ext4_free_group_clusters(sb, gdp) +</div><div class='del'>-		count - already_freed);</div><div class='del'>-	ext4_block_bitmap_csum_set(sb, group, gdp, bitmap_bh);</div><div class='del'>-	ext4_group_desc_csum_set(sb, group, gdp);</div><div class='del'>-	ext4_handle_dirty_metadata(NULL, NULL, gdp_bh);</div><div class='del'>-	sync_dirty_buffer(bitmap_bh);</div><div class='del'>-	sync_dirty_buffer(gdp_bh);</div><div class='del'>-	brelse(bitmap_bh);</div><div class='add'>+	ext4_mb_mark_context(NULL, sb, false, group, blkoff, count,</div><div class='add'>+			     EXT4_MB_BITMAP_MARKED_CHECK |</div><div class='add'>+			     EXT4_MB_SYNC_UPDATE,</div><div class='add'>+			     NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * ext4_free_blocks() -- Free given blocks and update quota</div><div class='add'>+ * ext4_mb_clear_bb() -- helper function for freeing blocks.</div><div class='add'>+ *			Used by ext4_free_blocks()</div><div class='ctx'>  * @handle:		handle for this transaction</div><div class='ctx'>  * @inode:		inode</div><div class='del'>- * @bh:			optional buffer of the block to be freed</div><div class='ctx'>  * @block:		starting physical block to be freed</div><div class='ctx'>  * @count:		number of blocks to be freed</div><div class='ctx'>  * @flags:		flags used by ext4_free_blocks</div><div class='ctx'>  */</div><div class='del'>-void ext4_free_blocks(handle_t *handle, struct inode *inode,</div><div class='del'>-		      struct buffer_head *bh, ext4_fsblk_t block,</div><div class='del'>-		      unsigned long count, int flags)</div><div class='add'>+static void ext4_mb_clear_bb(handle_t *handle, struct inode *inode,</div><div class='add'>+			       ext4_fsblk_t block, unsigned long count,</div><div class='add'>+			       int flags)</div><div class='ctx'> {</div><div class='del'>-	struct buffer_head *bitmap_bh = NULL;</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='del'>-	struct ext4_group_desc *gdp;</div><div class='add'>+	struct ext4_group_info *grp;</div><div class='ctx'> 	unsigned int overflow;</div><div class='ctx'> 	ext4_grpblk_t bit;</div><div class='del'>-	struct buffer_head *gd_bh;</div><div class='ctx'> 	ext4_group_t block_group;</div><div class='ctx'> 	struct ext4_sb_info *sbi;</div><div class='ctx'> 	struct ext4_buddy e4b;</div><div class='ctx'> 	unsigned int count_clusters;</div><div class='ctx'> 	int err = 0;</div><div class='del'>-	int ret;</div><div class='add'>+	int mark_flags = 0;</div><div class='add'>+	ext4_grpblk_t changed;</div><div class='ctx'> </div><div class='ctx'> 	sbi = EXT4_SB(sb);</div><div class='ctx'> </div><div class='del'>-	if (sbi-&gt;s_mount_state &amp; EXT4_FC_REPLAY) {</div><div class='del'>-		ext4_free_blocks_simple(inode, block, count);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	might_sleep();</div><div class='del'>-	if (bh) {</div><div class='del'>-		if (block)</div><div class='del'>-			BUG_ON(block != bh-&gt;b_blocknr);</div><div class='del'>-		else</div><div class='del'>-			block = bh-&gt;b_blocknr;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	if (!(flags &amp; EXT4_FREE_BLOCKS_VALIDATED) &amp;&amp;</div><div class='ctx'> 	    !ext4_inode_block_valid(inode, block, count)) {</div><div class='del'>-		ext4_error(sb, "Freeing blocks not in datazone - "</div><div class='del'>-			   "block = %llu, count = %lu", block, count);</div><div class='del'>-		goto error_return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ext4_debug("freeing block %llu\n", block);</div><div class='del'>-	trace_ext4_free_blocks(inode, block, count, flags);</div><div class='del'>-</div><div class='del'>-	if (bh &amp;&amp; (flags &amp; EXT4_FREE_BLOCKS_FORGET)) {</div><div class='del'>-		BUG_ON(count &gt; 1);</div><div class='del'>-</div><div class='del'>-		ext4_forget(handle, flags &amp; EXT4_FREE_BLOCKS_METADATA,</div><div class='del'>-			    inode, bh, block);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If the extent to be freed does not begin on a cluster</div><div class='del'>-	 * boundary, we need to deal with partial clusters at the</div><div class='del'>-	 * beginning and end of the extent.  Normally we will free</div><div class='del'>-	 * blocks at the beginning or the end unless we are explicitly</div><div class='del'>-	 * requested to avoid doing so.</div><div class='del'>-	 */</div><div class='del'>-	overflow = EXT4_PBLK_COFF(sbi, block);</div><div class='del'>-	if (overflow) {</div><div class='del'>-		if (flags &amp; EXT4_FREE_BLOCKS_NOFREE_FIRST_CLUSTER) {</div><div class='del'>-			overflow = sbi-&gt;s_cluster_ratio - overflow;</div><div class='del'>-			block += overflow;</div><div class='del'>-			if (count &gt; overflow)</div><div class='del'>-				count -= overflow;</div><div class='del'>-			else</div><div class='del'>-				return;</div><div class='del'>-		} else {</div><div class='del'>-			block -= overflow;</div><div class='del'>-			count += overflow;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	overflow = EXT4_LBLK_COFF(sbi, count);</div><div class='del'>-	if (overflow) {</div><div class='del'>-		if (flags &amp; EXT4_FREE_BLOCKS_NOFREE_LAST_CLUSTER) {</div><div class='del'>-			if (count &gt; overflow)</div><div class='del'>-				count -= overflow;</div><div class='del'>-			else</div><div class='del'>-				return;</div><div class='del'>-		} else</div><div class='del'>-			count += sbi-&gt;s_cluster_ratio - overflow;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!bh &amp;&amp; (flags &amp; EXT4_FREE_BLOCKS_FORGET)) {</div><div class='del'>-		int i;</div><div class='del'>-		int is_metadata = flags &amp; EXT4_FREE_BLOCKS_METADATA;</div><div class='del'>-</div><div class='del'>-		for (i = 0; i &lt; count; i++) {</div><div class='del'>-			cond_resched();</div><div class='del'>-			if (is_metadata)</div><div class='del'>-				bh = sb_find_get_block(inode-&gt;i_sb, block + i);</div><div class='del'>-			ext4_forget(handle, is_metadata, inode, bh, block + i);</div><div class='del'>-		}</div><div class='add'>+		ext4_error(sb, "Freeing blocks in system zone - "</div><div class='add'>+			   "Block = %llu, count = %lu", block, count);</div><div class='add'>+		/* err = 0. ext4_std_error should be a no op */</div><div class='add'>+		goto error_out;</div><div class='ctx'> 	}</div><div class='add'>+	flags |= EXT4_FREE_BLOCKS_VALIDATED;</div><div class='ctx'> </div><div class='ctx'> do_more:</div><div class='ctx'> 	overflow = 0;</div><div class='ctx'> 	ext4_get_group_no_and_offset(sb, block, &amp;block_group, &amp;bit);</div><div class='ctx'> </div><div class='del'>-	if (unlikely(EXT4_MB_GRP_BBITMAP_CORRUPT(</div><div class='del'>-			ext4_get_group_info(sb, block_group))))</div><div class='add'>+	grp = ext4_get_group_info(sb, block_group);</div><div class='add'>+	if (unlikely(!grp || EXT4_MB_GRP_BBITMAP_CORRUPT(grp)))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -5959,62 +6580,39 @@ do_more:</div><div class='ctx'> 		overflow = EXT4_C2B(sbi, bit) + count -</div><div class='ctx'> 			EXT4_BLOCKS_PER_GROUP(sb);</div><div class='ctx'> 		count -= overflow;</div><div class='add'>+		/* The range changed so it's no longer validated */</div><div class='add'>+		flags &amp;= ~EXT4_FREE_BLOCKS_VALIDATED;</div><div class='ctx'> 	}</div><div class='ctx'> 	count_clusters = EXT4_NUM_B2C(sbi, count);</div><div class='del'>-	bitmap_bh = ext4_read_block_bitmap(sb, block_group);</div><div class='del'>-	if (IS_ERR(bitmap_bh)) {</div><div class='del'>-		err = PTR_ERR(bitmap_bh);</div><div class='del'>-		bitmap_bh = NULL;</div><div class='del'>-		goto error_return;</div><div class='del'>-	}</div><div class='del'>-	gdp = ext4_get_group_desc(sb, block_group, &amp;gd_bh);</div><div class='del'>-	if (!gdp) {</div><div class='del'>-		err = -EIO;</div><div class='del'>-		goto error_return;</div><div class='del'>-	}</div><div class='add'>+	trace_ext4_mballoc_free(sb, inode, block_group, bit, count_clusters);</div><div class='ctx'> </div><div class='del'>-	if (in_range(ext4_block_bitmap(sb, gdp), block, count) ||</div><div class='del'>-	    in_range(ext4_inode_bitmap(sb, gdp), block, count) ||</div><div class='del'>-	    in_range(block, ext4_inode_table(sb, gdp),</div><div class='del'>-		     sbi-&gt;s_itb_per_group) ||</div><div class='del'>-	    in_range(block + count - 1, ext4_inode_table(sb, gdp),</div><div class='del'>-		     sbi-&gt;s_itb_per_group)) {</div><div class='add'>+	/* __GFP_NOFAIL: retry infinitely, ignore TIF_MEMDIE and memcg limit. */</div><div class='add'>+	err = ext4_mb_load_buddy_gfp(sb, block_group, &amp;e4b,</div><div class='add'>+				     GFP_NOFS|__GFP_NOFAIL);</div><div class='add'>+	if (err)</div><div class='add'>+		goto error_out;</div><div class='ctx'> </div><div class='add'>+	if (!(flags &amp; EXT4_FREE_BLOCKS_VALIDATED) &amp;&amp;</div><div class='add'>+	    !ext4_inode_block_valid(inode, block, count)) {</div><div class='ctx'> 		ext4_error(sb, "Freeing blocks in system zone - "</div><div class='ctx'> 			   "Block = %llu, count = %lu", block, count);</div><div class='ctx'> 		/* err = 0. ext4_std_error should be a no op */</div><div class='del'>-		goto error_return;</div><div class='add'>+		goto error_clean;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	BUFFER_TRACE(bitmap_bh, "getting write access");</div><div class='del'>-	err = ext4_journal_get_write_access(handle, sb, bitmap_bh,</div><div class='del'>-					    EXT4_JTR_NONE);</div><div class='del'>-	if (err)</div><div class='del'>-		goto error_return;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * We are about to modify some metadata.  Call the journal APIs</div><div class='del'>-	 * to unshare -&gt;b_data if a currently-committing transaction is</div><div class='del'>-	 * using it</div><div class='del'>-	 */</div><div class='del'>-	BUFFER_TRACE(gd_bh, "get_write_access");</div><div class='del'>-	err = ext4_journal_get_write_access(handle, sb, gd_bh, EXT4_JTR_NONE);</div><div class='del'>-	if (err)</div><div class='del'>-		goto error_return;</div><div class='ctx'> #ifdef AGGRESSIVE_CHECK</div><div class='del'>-	{</div><div class='del'>-		int i;</div><div class='del'>-		for (i = 0; i &lt; count_clusters; i++)</div><div class='del'>-			BUG_ON(!mb_test_bit(bit + i, bitmap_bh-&gt;b_data));</div><div class='del'>-	}</div><div class='add'>+	mark_flags |= EXT4_MB_BITMAP_MARKED_CHECK;</div><div class='ctx'> #endif</div><div class='del'>-	trace_ext4_mballoc_free(sb, inode, block_group, bit, count_clusters);</div><div class='add'>+	err = ext4_mb_mark_context(handle, sb, false, block_group, bit,</div><div class='add'>+				   count_clusters, mark_flags, &amp;changed);</div><div class='ctx'> </div><div class='del'>-	/* __GFP_NOFAIL: retry infinitely, ignore TIF_MEMDIE and memcg limit. */</div><div class='del'>-	err = ext4_mb_load_buddy_gfp(sb, block_group, &amp;e4b,</div><div class='del'>-				     GFP_NOFS|__GFP_NOFAIL);</div><div class='del'>-	if (err)</div><div class='del'>-		goto error_return;</div><div class='add'>+</div><div class='add'>+	if (err &amp;&amp; changed == 0)</div><div class='add'>+		goto error_clean;</div><div class='add'>+</div><div class='add'>+#ifdef AGGRESSIVE_CHECK</div><div class='add'>+	BUG_ON(changed != count_clusters);</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We need to make sure we don't reuse the freed block until after the</div><div class='hunk'>@@ -6038,42 +6636,32 @@ do_more:</div><div class='ctx'> 		new_entry-&gt;efd_tid = handle-&gt;h_transaction-&gt;t_tid;</div><div class='ctx'> </div><div class='ctx'> 		ext4_lock_group(sb, block_group);</div><div class='del'>-		mb_clear_bits(bitmap_bh-&gt;b_data, bit, count_clusters);</div><div class='ctx'> 		ext4_mb_free_metadata(handle, &amp;e4b, new_entry);</div><div class='ctx'> 	} else {</div><div class='del'>-		/* need to update group_info-&gt;bb_free and bitmap</div><div class='del'>-		 * with group lock held. generate_buddy look at</div><div class='del'>-		 * them with group lock_held</div><div class='del'>-		 */</div><div class='ctx'> 		if (test_opt(sb, DISCARD)) {</div><div class='del'>-			err = ext4_issue_discard(sb, block_group, bit, count,</div><div class='del'>-						 NULL);</div><div class='del'>-			if (err &amp;&amp; err != -EOPNOTSUPP)</div><div class='add'>+			err = ext4_issue_discard(sb, block_group, bit,</div><div class='add'>+						 count_clusters);</div><div class='add'>+			/*</div><div class='add'>+			 * Ignore EOPNOTSUPP error. This is consistent with</div><div class='add'>+			 * what happens when using journal.</div><div class='add'>+			 */</div><div class='add'>+			if (err == -EOPNOTSUPP)</div><div class='add'>+				err = 0;</div><div class='add'>+			if (err)</div><div class='ctx'> 				ext4_msg(sb, KERN_WARNING, "discard request in"</div><div class='del'>-					 " group:%d block:%d count:%lu failed"</div><div class='add'>+					 " group:%u block:%d count:%lu failed"</div><div class='ctx'> 					 " with %d", block_group, bit, count,</div><div class='ctx'> 					 err);</div><div class='del'>-		} else</div><div class='del'>-			EXT4_MB_GRP_CLEAR_TRIMMED(e4b.bd_info);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		EXT4_MB_GRP_CLEAR_TRIMMED(e4b.bd_info);</div><div class='ctx'> </div><div class='ctx'> 		ext4_lock_group(sb, block_group);</div><div class='del'>-		mb_clear_bits(bitmap_bh-&gt;b_data, bit, count_clusters);</div><div class='ctx'> 		mb_free_blocks(inode, &amp;e4b, bit, count_clusters);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = ext4_free_group_clusters(sb, gdp) + count_clusters;</div><div class='del'>-	ext4_free_group_clusters_set(sb, gdp, ret);</div><div class='del'>-	ext4_block_bitmap_csum_set(sb, block_group, gdp, bitmap_bh);</div><div class='del'>-	ext4_group_desc_csum_set(sb, block_group, gdp);</div><div class='ctx'> 	ext4_unlock_group(sb, block_group);</div><div class='ctx'> </div><div class='del'>-	if (sbi-&gt;s_log_groups_per_flex) {</div><div class='del'>-		ext4_group_t flex_group = ext4_flex_group(sbi, block_group);</div><div class='del'>-		atomic64_add(count_clusters,</div><div class='del'>-			     &amp;sbi_array_rcu_deref(sbi, s_flex_groups,</div><div class='del'>-						  flex_group)-&gt;free_clusters);</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * on a bigalloc file system, defer the s_freeclusters_counter</div><div class='ctx'> 	 * update to the caller (ext4_remove_space and friends) so they</div><div class='hunk'>@@ -6086,28 +6674,122 @@ do_more:</div><div class='ctx'> 				   count_clusters);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ext4_mb_unload_buddy(&amp;e4b);</div><div class='del'>-</div><div class='del'>-	/* We dirtied the bitmap block */</div><div class='del'>-	BUFFER_TRACE(bitmap_bh, "dirtied bitmap block");</div><div class='del'>-	err = ext4_handle_dirty_metadata(handle, NULL, bitmap_bh);</div><div class='del'>-</div><div class='del'>-	/* And the group descriptor block */</div><div class='del'>-	BUFFER_TRACE(gd_bh, "dirtied group descriptor block");</div><div class='del'>-	ret = ext4_handle_dirty_metadata(handle, NULL, gd_bh);</div><div class='del'>-	if (!err)</div><div class='del'>-		err = ret;</div><div class='del'>-</div><div class='ctx'> 	if (overflow &amp;&amp; !err) {</div><div class='ctx'> 		block += count;</div><div class='ctx'> 		count = overflow;</div><div class='del'>-		put_bh(bitmap_bh);</div><div class='add'>+		ext4_mb_unload_buddy(&amp;e4b);</div><div class='add'>+		/* The range changed so it's no longer validated */</div><div class='add'>+		flags &amp;= ~EXT4_FREE_BLOCKS_VALIDATED;</div><div class='ctx'> 		goto do_more;</div><div class='ctx'> 	}</div><div class='del'>-error_return:</div><div class='del'>-	brelse(bitmap_bh);</div><div class='add'>+</div><div class='add'>+error_clean:</div><div class='add'>+	ext4_mb_unload_buddy(&amp;e4b);</div><div class='add'>+error_out:</div><div class='ctx'> 	ext4_std_error(sb, err);</div><div class='del'>-	return;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * ext4_free_blocks() -- Free given blocks and update quota</div><div class='add'>+ * @handle:		handle for this transaction</div><div class='add'>+ * @inode:		inode</div><div class='add'>+ * @bh:			optional buffer of the block to be freed</div><div class='add'>+ * @block:		starting physical block to be freed</div><div class='add'>+ * @count:		number of blocks to be freed</div><div class='add'>+ * @flags:		flags used by ext4_free_blocks</div><div class='add'>+ */</div><div class='add'>+void ext4_free_blocks(handle_t *handle, struct inode *inode,</div><div class='add'>+		      struct buffer_head *bh, ext4_fsblk_t block,</div><div class='add'>+		      unsigned long count, int flags)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = inode-&gt;i_sb;</div><div class='add'>+	unsigned int overflow;</div><div class='add'>+	struct ext4_sb_info *sbi;</div><div class='add'>+</div><div class='add'>+	sbi = EXT4_SB(sb);</div><div class='add'>+</div><div class='add'>+	if (bh) {</div><div class='add'>+		if (block)</div><div class='add'>+			BUG_ON(block != bh-&gt;b_blocknr);</div><div class='add'>+		else</div><div class='add'>+			block = bh-&gt;b_blocknr;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (sbi-&gt;s_mount_state &amp; EXT4_FC_REPLAY) {</div><div class='add'>+		ext4_free_blocks_simple(inode, block, EXT4_NUM_B2C(sbi, count));</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	might_sleep();</div><div class='add'>+</div><div class='add'>+	if (!(flags &amp; EXT4_FREE_BLOCKS_VALIDATED) &amp;&amp;</div><div class='add'>+	    !ext4_inode_block_valid(inode, block, count)) {</div><div class='add'>+		ext4_error(sb, "Freeing blocks not in datazone - "</div><div class='add'>+			   "block = %llu, count = %lu", block, count);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+	flags |= EXT4_FREE_BLOCKS_VALIDATED;</div><div class='add'>+</div><div class='add'>+	ext4_debug("freeing block %llu\n", block);</div><div class='add'>+	trace_ext4_free_blocks(inode, block, count, flags);</div><div class='add'>+</div><div class='add'>+	if (bh &amp;&amp; (flags &amp; EXT4_FREE_BLOCKS_FORGET)) {</div><div class='add'>+		BUG_ON(count &gt; 1);</div><div class='add'>+</div><div class='add'>+		ext4_forget(handle, flags &amp; EXT4_FREE_BLOCKS_METADATA,</div><div class='add'>+			    inode, bh, block);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If the extent to be freed does not begin on a cluster</div><div class='add'>+	 * boundary, we need to deal with partial clusters at the</div><div class='add'>+	 * beginning and end of the extent.  Normally we will free</div><div class='add'>+	 * blocks at the beginning or the end unless we are explicitly</div><div class='add'>+	 * requested to avoid doing so.</div><div class='add'>+	 */</div><div class='add'>+	overflow = EXT4_PBLK_COFF(sbi, block);</div><div class='add'>+	if (overflow) {</div><div class='add'>+		if (flags &amp; EXT4_FREE_BLOCKS_NOFREE_FIRST_CLUSTER) {</div><div class='add'>+			overflow = sbi-&gt;s_cluster_ratio - overflow;</div><div class='add'>+			block += overflow;</div><div class='add'>+			if (count &gt; overflow)</div><div class='add'>+				count -= overflow;</div><div class='add'>+			else</div><div class='add'>+				return;</div><div class='add'>+		} else {</div><div class='add'>+			block -= overflow;</div><div class='add'>+			count += overflow;</div><div class='add'>+		}</div><div class='add'>+		/* The range changed so it's no longer validated */</div><div class='add'>+		flags &amp;= ~EXT4_FREE_BLOCKS_VALIDATED;</div><div class='add'>+	}</div><div class='add'>+	overflow = EXT4_LBLK_COFF(sbi, count);</div><div class='add'>+	if (overflow) {</div><div class='add'>+		if (flags &amp; EXT4_FREE_BLOCKS_NOFREE_LAST_CLUSTER) {</div><div class='add'>+			if (count &gt; overflow)</div><div class='add'>+				count -= overflow;</div><div class='add'>+			else</div><div class='add'>+				return;</div><div class='add'>+		} else</div><div class='add'>+			count += sbi-&gt;s_cluster_ratio - overflow;</div><div class='add'>+		/* The range changed so it's no longer validated */</div><div class='add'>+		flags &amp;= ~EXT4_FREE_BLOCKS_VALIDATED;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!bh &amp;&amp; (flags &amp; EXT4_FREE_BLOCKS_FORGET)) {</div><div class='add'>+		int i;</div><div class='add'>+		int is_metadata = flags &amp; EXT4_FREE_BLOCKS_METADATA;</div><div class='add'>+</div><div class='add'>+		for (i = 0; i &lt; count; i++) {</div><div class='add'>+			cond_resched();</div><div class='add'>+			if (is_metadata)</div><div class='add'>+				bh = sb_find_get_block_nonatomic(inode-&gt;i_sb,</div><div class='add'>+								 block + i);</div><div class='add'>+			ext4_forget(handle, is_metadata, inode, bh, block + i);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ext4_mb_clear_bb(handle, inode, block, count, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -6122,23 +6804,19 @@ error_return:</div><div class='ctx'> int ext4_group_add_blocks(handle_t *handle, struct super_block *sb,</div><div class='ctx'> 			 ext4_fsblk_t block, unsigned long count)</div><div class='ctx'> {</div><div class='del'>-	struct buffer_head *bitmap_bh = NULL;</div><div class='del'>-	struct buffer_head *gd_bh;</div><div class='ctx'> 	ext4_group_t block_group;</div><div class='ctx'> 	ext4_grpblk_t bit;</div><div class='del'>-	unsigned int i;</div><div class='del'>-	struct ext4_group_desc *desc;</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> 	struct ext4_buddy e4b;</div><div class='del'>-	int err = 0, ret, free_clusters_count;</div><div class='del'>-	ext4_grpblk_t clusters_freed;</div><div class='add'>+	int err = 0;</div><div class='ctx'> 	ext4_fsblk_t first_cluster = EXT4_B2C(sbi, block);</div><div class='ctx'> 	ext4_fsblk_t last_cluster = EXT4_B2C(sbi, block + count - 1);</div><div class='ctx'> 	unsigned long cluster_count = last_cluster - first_cluster + 1;</div><div class='add'>+	ext4_grpblk_t changed;</div><div class='ctx'> </div><div class='ctx'> 	ext4_debug("Adding block(s) %llu-%llu\n", block, block + count - 1);</div><div class='ctx'> </div><div class='del'>-	if (count == 0)</div><div class='add'>+	if (cluster_count == 0)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	ext4_get_group_no_and_offset(sb, block, &amp;block_group, &amp;bit);</div><div class='hunk'>@@ -6150,103 +6828,39 @@ int ext4_group_add_blocks(handle_t *handle, struct super_block *sb,</div><div class='ctx'> 		ext4_warning(sb, "too many blocks added to group %u",</div><div class='ctx'> 			     block_group);</div><div class='ctx'> 		err = -EINVAL;</div><div class='del'>-		goto error_return;</div><div class='add'>+		goto error_out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	bitmap_bh = ext4_read_block_bitmap(sb, block_group);</div><div class='del'>-	if (IS_ERR(bitmap_bh)) {</div><div class='del'>-		err = PTR_ERR(bitmap_bh);</div><div class='del'>-		bitmap_bh = NULL;</div><div class='del'>-		goto error_return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	desc = ext4_get_group_desc(sb, block_group, &amp;gd_bh);</div><div class='del'>-	if (!desc) {</div><div class='del'>-		err = -EIO;</div><div class='del'>-		goto error_return;</div><div class='del'>-	}</div><div class='add'>+	err = ext4_mb_load_buddy(sb, block_group, &amp;e4b);</div><div class='add'>+	if (err)</div><div class='add'>+		goto error_out;</div><div class='ctx'> </div><div class='del'>-	if (in_range(ext4_block_bitmap(sb, desc), block, count) ||</div><div class='del'>-	    in_range(ext4_inode_bitmap(sb, desc), block, count) ||</div><div class='del'>-	    in_range(block, ext4_inode_table(sb, desc), sbi-&gt;s_itb_per_group) ||</div><div class='del'>-	    in_range(block + count - 1, ext4_inode_table(sb, desc),</div><div class='del'>-		     sbi-&gt;s_itb_per_group)) {</div><div class='add'>+	if (!ext4_sb_block_valid(sb, NULL, block, count)) {</div><div class='ctx'> 		ext4_error(sb, "Adding blocks in system zones - "</div><div class='ctx'> 			   "Block = %llu, count = %lu",</div><div class='ctx'> 			   block, count);</div><div class='ctx'> 		err = -EINVAL;</div><div class='del'>-		goto error_return;</div><div class='add'>+		goto error_clean;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	BUFFER_TRACE(bitmap_bh, "getting write access");</div><div class='del'>-	err = ext4_journal_get_write_access(handle, sb, bitmap_bh,</div><div class='del'>-					    EXT4_JTR_NONE);</div><div class='del'>-	if (err)</div><div class='del'>-		goto error_return;</div><div class='add'>+	err = ext4_mb_mark_context(handle, sb, false, block_group, bit,</div><div class='add'>+				   cluster_count, EXT4_MB_BITMAP_MARKED_CHECK,</div><div class='add'>+				   &amp;changed);</div><div class='add'>+	if (err &amp;&amp; changed == 0)</div><div class='add'>+		goto error_clean;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * We are about to modify some metadata.  Call the journal APIs</div><div class='del'>-	 * to unshare -&gt;b_data if a currently-committing transaction is</div><div class='del'>-	 * using it</div><div class='del'>-	 */</div><div class='del'>-	BUFFER_TRACE(gd_bh, "get_write_access");</div><div class='del'>-	err = ext4_journal_get_write_access(handle, sb, gd_bh, EXT4_JTR_NONE);</div><div class='del'>-	if (err)</div><div class='del'>-		goto error_return;</div><div class='del'>-</div><div class='del'>-	for (i = 0, clusters_freed = 0; i &lt; cluster_count; i++) {</div><div class='del'>-		BUFFER_TRACE(bitmap_bh, "clear bit");</div><div class='del'>-		if (!mb_test_bit(bit + i, bitmap_bh-&gt;b_data)) {</div><div class='del'>-			ext4_error(sb, "bit already cleared for block %llu",</div><div class='del'>-				   (ext4_fsblk_t)(block + i));</div><div class='del'>-			BUFFER_TRACE(bitmap_bh, "bit already cleared");</div><div class='del'>-		} else {</div><div class='del'>-			clusters_freed++;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	if (changed != cluster_count)</div><div class='add'>+		ext4_error(sb, "bit already cleared in group %u", block_group);</div><div class='ctx'> </div><div class='del'>-	err = ext4_mb_load_buddy(sb, block_group, &amp;e4b);</div><div class='del'>-	if (err)</div><div class='del'>-		goto error_return;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * need to update group_info-&gt;bb_free and bitmap</div><div class='del'>-	 * with group lock held. generate_buddy look at</div><div class='del'>-	 * them with group lock_held</div><div class='del'>-	 */</div><div class='ctx'> 	ext4_lock_group(sb, block_group);</div><div class='del'>-	mb_clear_bits(bitmap_bh-&gt;b_data, bit, cluster_count);</div><div class='ctx'> 	mb_free_blocks(NULL, &amp;e4b, bit, cluster_count);</div><div class='del'>-	free_clusters_count = clusters_freed +</div><div class='del'>-		ext4_free_group_clusters(sb, desc);</div><div class='del'>-	ext4_free_group_clusters_set(sb, desc, free_clusters_count);</div><div class='del'>-	ext4_block_bitmap_csum_set(sb, block_group, desc, bitmap_bh);</div><div class='del'>-	ext4_group_desc_csum_set(sb, block_group, desc);</div><div class='ctx'> 	ext4_unlock_group(sb, block_group);</div><div class='ctx'> 	percpu_counter_add(&amp;sbi-&gt;s_freeclusters_counter,</div><div class='del'>-			   clusters_freed);</div><div class='del'>-</div><div class='del'>-	if (sbi-&gt;s_log_groups_per_flex) {</div><div class='del'>-		ext4_group_t flex_group = ext4_flex_group(sbi, block_group);</div><div class='del'>-		atomic64_add(clusters_freed,</div><div class='del'>-			     &amp;sbi_array_rcu_deref(sbi, s_flex_groups,</div><div class='del'>-						  flex_group)-&gt;free_clusters);</div><div class='del'>-	}</div><div class='add'>+			   changed);</div><div class='ctx'> </div><div class='add'>+error_clean:</div><div class='ctx'> 	ext4_mb_unload_buddy(&amp;e4b);</div><div class='del'>-</div><div class='del'>-	/* We dirtied the bitmap block */</div><div class='del'>-	BUFFER_TRACE(bitmap_bh, "dirtied bitmap block");</div><div class='del'>-	err = ext4_handle_dirty_metadata(handle, NULL, bitmap_bh);</div><div class='del'>-</div><div class='del'>-	/* And the group descriptor block */</div><div class='del'>-	BUFFER_TRACE(gd_bh, "dirtied group descriptor block");</div><div class='del'>-	ret = ext4_handle_dirty_metadata(handle, NULL, gd_bh);</div><div class='del'>-	if (!err)</div><div class='del'>-		err = ret;</div><div class='del'>-</div><div class='del'>-error_return:</div><div class='del'>-	brelse(bitmap_bh);</div><div class='add'>+error_out:</div><div class='ctx'> 	ext4_std_error(sb, err);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='hunk'>@@ -6285,24 +6899,51 @@ __acquires(bitlock)</div><div class='ctx'> 	 */</div><div class='ctx'> 	mb_mark_used(e4b, &amp;ex);</div><div class='ctx'> 	ext4_unlock_group(sb, group);</div><div class='del'>-	ret = ext4_issue_discard(sb, group, start, count, NULL);</div><div class='add'>+	ret = ext4_issue_discard(sb, group, start, count);</div><div class='ctx'> 	ext4_lock_group(sb, group);</div><div class='ctx'> 	mb_free_blocks(NULL, e4b, start, ex.fe_len);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static ext4_grpblk_t ext4_last_grp_cluster(struct super_block *sb,</div><div class='add'>+					   ext4_group_t grp)</div><div class='add'>+{</div><div class='add'>+	unsigned long nr_clusters_in_group;</div><div class='add'>+</div><div class='add'>+	if (grp &lt; (ext4_get_groups_count(sb) - 1))</div><div class='add'>+		nr_clusters_in_group = EXT4_CLUSTERS_PER_GROUP(sb);</div><div class='add'>+	else</div><div class='add'>+		nr_clusters_in_group = (ext4_blocks_count(EXT4_SB(sb)-&gt;s_es) -</div><div class='add'>+					ext4_group_first_block_no(sb, grp))</div><div class='add'>+				       &gt;&gt; EXT4_CLUSTER_BITS(sb);</div><div class='add'>+</div><div class='add'>+	return nr_clusters_in_group - 1;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool ext4_trim_interrupted(void)</div><div class='add'>+{</div><div class='add'>+	return fatal_signal_pending(current) || freezing(current);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int ext4_try_to_trim_range(struct super_block *sb,</div><div class='ctx'> 		struct ext4_buddy *e4b, ext4_grpblk_t start,</div><div class='ctx'> 		ext4_grpblk_t max, ext4_grpblk_t minblocks)</div><div class='ctx'> __acquires(ext4_group_lock_ptr(sb, e4b-&gt;bd_group))</div><div class='ctx'> __releases(ext4_group_lock_ptr(sb, e4b-&gt;bd_group))</div><div class='ctx'> {</div><div class='del'>-	ext4_grpblk_t next, count, free_count;</div><div class='add'>+	ext4_grpblk_t next, count, free_count, last, origin_start;</div><div class='add'>+	bool set_trimmed = false;</div><div class='ctx'> 	void *bitmap;</div><div class='ctx'> </div><div class='add'>+	if (unlikely(EXT4_MB_GRP_BBITMAP_CORRUPT(e4b-&gt;bd_info)))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	last = ext4_last_grp_cluster(sb, e4b-&gt;bd_group);</div><div class='ctx'> 	bitmap = e4b-&gt;bd_bitmap;</div><div class='del'>-	start = (e4b-&gt;bd_info-&gt;bb_first_free &gt; start) ?</div><div class='del'>-		e4b-&gt;bd_info-&gt;bb_first_free : start;</div><div class='add'>+	if (start == 0 &amp;&amp; max &gt;= last)</div><div class='add'>+		set_trimmed = true;</div><div class='add'>+	origin_start = start;</div><div class='add'>+	start = max(e4b-&gt;bd_info-&gt;bb_first_free, start);</div><div class='ctx'> 	count = 0;</div><div class='ctx'> 	free_count = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -6310,22 +6951,23 @@ __releases(ext4_group_lock_ptr(sb, e4b-&gt;bd_group))</div><div class='ctx'> 		start = mb_find_next_zero_bit(bitmap, max + 1, start);</div><div class='ctx'> 		if (start &gt; max)</div><div class='ctx'> 			break;</div><div class='del'>-		next = mb_find_next_bit(bitmap, max + 1, start);</div><div class='add'>+</div><div class='add'>+		next = mb_find_next_bit(bitmap, last + 1, start);</div><div class='add'>+		if (origin_start == 0 &amp;&amp; next &gt;= last)</div><div class='add'>+			set_trimmed = true;</div><div class='ctx'> </div><div class='ctx'> 		if ((next - start) &gt;= minblocks) {</div><div class='ctx'> 			int ret = ext4_trim_extent(sb, start, next - start, e4b);</div><div class='ctx'> </div><div class='ctx'> 			if (ret &amp;&amp; ret != -EOPNOTSUPP)</div><div class='del'>-				break;</div><div class='add'>+				return count;</div><div class='ctx'> 			count += next - start;</div><div class='ctx'> 		}</div><div class='ctx'> 		free_count += next - start;</div><div class='ctx'> 		start = next + 1;</div><div class='ctx'> </div><div class='del'>-		if (fatal_signal_pending(current)) {</div><div class='del'>-			count = -ERESTARTSYS;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='add'>+		if (ext4_trim_interrupted())</div><div class='add'>+			return count;</div><div class='ctx'> </div><div class='ctx'> 		if (need_resched()) {</div><div class='ctx'> 			ext4_unlock_group(sb, e4b-&gt;bd_group);</div><div class='hunk'>@@ -6337,6 +6979,9 @@ __releases(ext4_group_lock_ptr(sb, e4b-&gt;bd_group))</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (set_trimmed)</div><div class='add'>+		EXT4_MB_GRP_SET_TRIMMED(e4b-&gt;bd_info);</div><div class='add'>+</div><div class='ctx'> 	return count;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -6373,13 +7018,10 @@ ext4_trim_all_free(struct super_block *sb, ext4_group_t group,</div><div class='ctx'> 	ext4_lock_group(sb, group);</div><div class='ctx'> </div><div class='ctx'> 	if (!EXT4_MB_GRP_WAS_TRIMMED(e4b.bd_info) ||</div><div class='del'>-	    minblocks &lt; atomic_read(&amp;EXT4_SB(sb)-&gt;s_last_trim_minblks)) {</div><div class='add'>+	    minblocks &lt; EXT4_SB(sb)-&gt;s_last_trim_minblks)</div><div class='ctx'> 		ret = ext4_try_to_trim_range(sb, &amp;e4b, start, max, minblocks);</div><div class='del'>-		if (ret &gt;= 0)</div><div class='del'>-			EXT4_MB_GRP_SET_TRIMMED(e4b.bd_info);</div><div class='del'>-	} else {</div><div class='add'>+	else</div><div class='ctx'> 		ret = 0;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	ext4_unlock_group(sb, group);</div><div class='ctx'> 	ext4_mb_unload_buddy(&amp;e4b);</div><div class='hunk'>@@ -6404,6 +7046,7 @@ ext4_trim_all_free(struct super_block *sb, ext4_group_t group,</div><div class='ctx'>  */</div><div class='ctx'> int ext4_trim_fs(struct super_block *sb, struct fstrim_range *range)</div><div class='ctx'> {</div><div class='add'>+	unsigned int discard_granularity = bdev_discard_granularity(sb-&gt;s_bdev);</div><div class='ctx'> 	struct ext4_group_info *grp;</div><div class='ctx'> 	ext4_group_t group, first_group, last_group;</div><div class='ctx'> 	ext4_grpblk_t cnt = 0, first_cluster, last_cluster;</div><div class='hunk'>@@ -6422,7 +7065,14 @@ int ext4_trim_fs(struct super_block *sb, struct fstrim_range *range)</div><div class='ctx'> 	    start &gt;= max_blks ||</div><div class='ctx'> 	    range-&gt;len &lt; sb-&gt;s_blocksize)</div><div class='ctx'> 		return -EINVAL;</div><div class='del'>-	if (end &gt;= max_blks)</div><div class='add'>+	/* No point to try to trim less than discard granularity */</div><div class='add'>+	if (range-&gt;minlen &lt; discard_granularity) {</div><div class='add'>+		minlen = EXT4_NUM_B2C(EXT4_SB(sb),</div><div class='add'>+				discard_granularity &gt;&gt; sb-&gt;s_blocksize_bits);</div><div class='add'>+		if (minlen &gt; EXT4_CLUSTERS_PER_GROUP(sb))</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='add'>+	if (end &gt;= max_blks - 1)</div><div class='ctx'> 		end = max_blks - 1;</div><div class='ctx'> 	if (end &lt;= first_data_blk)</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -6439,7 +7089,11 @@ int ext4_trim_fs(struct super_block *sb, struct fstrim_range *range)</div><div class='ctx'> 	end = EXT4_CLUSTERS_PER_GROUP(sb) - 1;</div><div class='ctx'> </div><div class='ctx'> 	for (group = first_group; group &lt;= last_group; group++) {</div><div class='add'>+		if (ext4_trim_interrupted())</div><div class='add'>+			break;</div><div class='ctx'> 		grp = ext4_get_group_info(sb, group);</div><div class='add'>+		if (!grp)</div><div class='add'>+			continue;</div><div class='ctx'> 		/* We only do this if the grp has never been initialized */</div><div class='ctx'> 		if (unlikely(EXT4_MB_GRP_NEED_INIT(grp))) {</div><div class='ctx'> 			ret = ext4_mb_init_group(sb, group, GFP_NOFS);</div><div class='hunk'>@@ -6455,10 +7109,9 @@ int ext4_trim_fs(struct super_block *sb, struct fstrim_range *range)</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (group == last_group)</div><div class='ctx'> 			end = last_cluster;</div><div class='del'>-</div><div class='ctx'> 		if (grp-&gt;bb_free &gt;= minlen) {</div><div class='ctx'> 			cnt = ext4_trim_all_free(sb, group, first_cluster,</div><div class='del'>-						end, minlen);</div><div class='add'>+						 end, minlen);</div><div class='ctx'> 			if (cnt &lt; 0) {</div><div class='ctx'> 				ret = cnt;</div><div class='ctx'> 				break;</div><div class='hunk'>@@ -6474,7 +7127,7 @@ int ext4_trim_fs(struct super_block *sb, struct fstrim_range *range)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!ret)</div><div class='del'>-		atomic_set(&amp;EXT4_SB(sb)-&gt;s_last_trim_minblks, minlen);</div><div class='add'>+		EXT4_SB(sb)-&gt;s_last_trim_minblks = minlen;</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	range-&gt;len = EXT4_C2B(EXT4_SB(sb), trimmed) &lt;&lt; sb-&gt;s_blocksize_bits;</div><div class='hunk'>@@ -6486,13 +7139,14 @@ int</div><div class='ctx'> ext4_mballoc_query_range(</div><div class='ctx'> 	struct super_block		*sb,</div><div class='ctx'> 	ext4_group_t			group,</div><div class='del'>-	ext4_grpblk_t			start,</div><div class='add'>+	ext4_grpblk_t			first,</div><div class='ctx'> 	ext4_grpblk_t			end,</div><div class='add'>+	ext4_mballoc_query_range_fn	meta_formatter,</div><div class='ctx'> 	ext4_mballoc_query_range_fn	formatter,</div><div class='ctx'> 	void				*priv)</div><div class='ctx'> {</div><div class='ctx'> 	void				*bitmap;</div><div class='del'>-	ext4_grpblk_t			next;</div><div class='add'>+	ext4_grpblk_t			start, next;</div><div class='ctx'> 	struct ext4_buddy		e4b;</div><div class='ctx'> 	int				error;</div><div class='ctx'> </div><div class='hunk'>@@ -6503,11 +7157,19 @@ ext4_mballoc_query_range(</div><div class='ctx'> </div><div class='ctx'> 	ext4_lock_group(sb, group);</div><div class='ctx'> </div><div class='del'>-	start = (e4b.bd_info-&gt;bb_first_free &gt; start) ?</div><div class='del'>-		e4b.bd_info-&gt;bb_first_free : start;</div><div class='add'>+	start = max(e4b.bd_info-&gt;bb_first_free, first);</div><div class='ctx'> 	if (end &gt;= EXT4_CLUSTERS_PER_GROUP(sb))</div><div class='ctx'> 		end = EXT4_CLUSTERS_PER_GROUP(sb) - 1;</div><div class='del'>-</div><div class='add'>+	if (meta_formatter &amp;&amp; start != first) {</div><div class='add'>+		if (start &gt; end)</div><div class='add'>+			start = end;</div><div class='add'>+		ext4_unlock_group(sb, group);</div><div class='add'>+		error = meta_formatter(sb, group, first, start - first,</div><div class='add'>+				       priv);</div><div class='add'>+		if (error)</div><div class='add'>+			goto out_unload;</div><div class='add'>+		ext4_lock_group(sb, group);</div><div class='add'>+	}</div><div class='ctx'> 	while (start &lt;= end) {</div><div class='ctx'> 		start = mb_find_next_zero_bit(bitmap, end + 1, start);</div><div class='ctx'> 		if (start &gt; end)</div><div class='hunk'>@@ -6529,3 +7191,7 @@ out_unload:</div><div class='ctx'> </div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_EXT4_KUNIT_TESTS</div><div class='add'>+#include "mballoc-test.c"</div><div class='add'>+#endif</div><div class='head'>diff --git a/fs/ext4/mballoc.h b/fs/ext4/mballoc.h<br/>index 39da92ceabf8..15a049f05d04 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/mballoc.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/mballoc.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/mballoc.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/mballoc.h</a></div><div class='hunk'>@@ -49,7 +49,7 @@</div><div class='ctx'> #define MB_DEFAULT_MIN_TO_SCAN		10</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * with 'ext4_mb_stats' allocator will collect stats that will be</div><div class='add'>+ * with 's_mb_stats' allocator will collect stats that will be</div><div class='ctx'>  * shown at umount. The collecting costs though!</div><div class='ctx'>  */</div><div class='ctx'> #define MB_DEFAULT_STATS		0</div><div class='hunk'>@@ -74,11 +74,6 @@</div><div class='ctx'> #define MB_DEFAULT_GROUP_PREALLOC	512</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * maximum length of inode prealloc list</div><div class='del'>- */</div><div class='del'>-#define MB_DEFAULT_MAX_INODE_PREALLOC	512</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * Number of groups to search linearly before performing group scanning</div><div class='ctx'>  * optimization.</div><div class='ctx'>  */</div><div class='hunk'>@@ -91,6 +86,13 @@</div><div class='ctx'> #define MB_DEFAULT_LINEAR_SCAN_THRESHOLD	16</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * The maximum order upto which CR_BEST_AVAIL_LEN can trim a particular</div><div class='add'>+ * allocation request. Example, if we have an order 7 request and max trim order</div><div class='add'>+ * of 3, we can trim this request upto order 4.</div><div class='add'>+ */</div><div class='add'>+#define MB_DEFAULT_BEST_AVAIL_TRIM_ORDER	3</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * Number of valid buddy orders</div><div class='ctx'>  */</div><div class='ctx'> #define MB_NUM_ORDERS(sb)		((sb)-&gt;s_blocksize_bits + 2)</div><div class='hunk'>@@ -114,7 +116,10 @@ struct ext4_free_data {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct ext4_prealloc_space {</div><div class='del'>-	struct list_head	pa_inode_list;</div><div class='add'>+	union {</div><div class='add'>+		struct rb_node	inode_node;		/* for inode PA rbtree */</div><div class='add'>+		struct list_head	lg_list;	/* for lg PAs */</div><div class='add'>+	} pa_node;</div><div class='ctx'> 	struct list_head	pa_group_list;</div><div class='ctx'> 	union {</div><div class='ctx'> 		struct list_head pa_tmp_list;</div><div class='hunk'>@@ -128,8 +133,11 @@ struct ext4_prealloc_space {</div><div class='ctx'> 	ext4_grpblk_t		pa_len;		/* len of preallocated chunk */</div><div class='ctx'> 	ext4_grpblk_t		pa_free;	/* how many blocks are free */</div><div class='ctx'> 	unsigned short		pa_type;	/* pa type. inode or group */</div><div class='del'>-	spinlock_t		*pa_obj_lock;</div><div class='del'>-	struct inode		*pa_inode;	/* hack, for history only */</div><div class='add'>+	union {</div><div class='add'>+		rwlock_t		*inode_lock;	/* locks the rbtree holding this PA */</div><div class='add'>+		spinlock_t		*lg_lock;	/* locks the lg list holding this PA */</div><div class='add'>+	} pa_node_lock;</div><div class='add'>+	struct inode		*pa_inode;	/* used to get the inode during group discard */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> enum {</div><div class='hunk'>@@ -178,12 +186,22 @@ struct ext4_allocation_context {</div><div class='ctx'> 	/* copy of the best found extent taken before preallocation efforts */</div><div class='ctx'> 	struct ext4_free_extent ac_f_ex;</div><div class='ctx'> </div><div class='del'>-	ext4_group_t ac_last_optimal_group;</div><div class='del'>-	__u32 ac_groups_considered;</div><div class='add'>+	/*</div><div class='add'>+	 * goal len can change in CR_BEST_AVAIL_LEN, so save the original len.</div><div class='add'>+	 * This is used while adjusting the PA window and for accounting.</div><div class='add'>+	 */</div><div class='add'>+	ext4_grpblk_t	ac_orig_goal_len;</div><div class='add'>+</div><div class='add'>+	ext4_group_t ac_prefetch_grp;</div><div class='add'>+	unsigned int ac_prefetch_ios;</div><div class='add'>+	unsigned int ac_prefetch_nr;</div><div class='add'>+</div><div class='add'>+	int ac_first_err;</div><div class='add'>+</div><div class='ctx'> 	__u32 ac_flags;		/* allocation hints */</div><div class='ctx'> 	__u16 ac_groups_scanned;</div><div class='del'>-	__u16 ac_groups_linear_remaining;</div><div class='ctx'> 	__u16 ac_found;</div><div class='add'>+	__u16 ac_cX_found[EXT4_MB_NUM_CRS];</div><div class='ctx'> 	__u16 ac_tail;</div><div class='ctx'> 	__u16 ac_buddy;</div><div class='ctx'> 	__u8 ac_status;</div><div class='hunk'>@@ -191,8 +209,10 @@ struct ext4_allocation_context {</div><div class='ctx'> 	__u8 ac_2order;		/* if request is to allocate 2^N blocks and</div><div class='ctx'> 				 * N &gt; 0, the field stores N, otherwise 0 */</div><div class='ctx'> 	__u8 ac_op;		/* operation, for history only */</div><div class='del'>-	struct page *ac_bitmap_page;</div><div class='del'>-	struct page *ac_buddy_page;</div><div class='add'>+</div><div class='add'>+	struct ext4_buddy *ac_e4b;</div><div class='add'>+	struct folio *ac_bitmap_folio;</div><div class='add'>+	struct folio *ac_buddy_folio;</div><div class='ctx'> 	struct ext4_prealloc_space *ac_pa;</div><div class='ctx'> 	struct ext4_locality_group *ac_lg;</div><div class='ctx'> };</div><div class='hunk'>@@ -202,9 +222,9 @@ struct ext4_allocation_context {</div><div class='ctx'> #define AC_STATUS_BREAK		3</div><div class='ctx'> </div><div class='ctx'> struct ext4_buddy {</div><div class='del'>-	struct page *bd_buddy_page;</div><div class='add'>+	struct folio *bd_buddy_folio;</div><div class='ctx'> 	void *bd_buddy;</div><div class='del'>-	struct page *bd_bitmap_page;</div><div class='add'>+	struct folio *bd_bitmap_folio;</div><div class='ctx'> 	void *bd_bitmap;</div><div class='ctx'> 	struct ext4_group_info *bd_info;</div><div class='ctx'> 	struct super_block *bd_sb;</div><div class='hunk'>@@ -219,6 +239,20 @@ static inline ext4_fsblk_t ext4_grp_offs_to_block(struct super_block *sb,</div><div class='ctx'> 		(fex-&gt;fe_start &lt;&lt; EXT4_SB(sb)-&gt;s_cluster_bits);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline loff_t extent_logical_end(struct ext4_sb_info *sbi,</div><div class='add'>+					struct ext4_free_extent *fex)</div><div class='add'>+{</div><div class='add'>+	/* Use loff_t to avoid end exceeding ext4_lblk_t max. */</div><div class='add'>+	return (loff_t)fex-&gt;fe_logical + EXT4_C2B(sbi, fex-&gt;fe_len);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline loff_t pa_logical_end(struct ext4_sb_info *sbi,</div><div class='add'>+				    struct ext4_prealloc_space *pa)</div><div class='add'>+{</div><div class='add'>+	/* Use loff_t to avoid end exceeding ext4_lblk_t max. */</div><div class='add'>+	return (loff_t)pa-&gt;pa_lstart + EXT4_C2B(sbi, pa-&gt;pa_len);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> typedef int (*ext4_mballoc_query_range_fn)(</div><div class='ctx'> 	struct super_block		*sb,</div><div class='ctx'> 	ext4_group_t			agno,</div><div class='hunk'>@@ -232,6 +266,7 @@ ext4_mballoc_query_range(</div><div class='ctx'> 	ext4_group_t			agno,</div><div class='ctx'> 	ext4_grpblk_t			start,</div><div class='ctx'> 	ext4_grpblk_t			end,</div><div class='add'>+	ext4_mballoc_query_range_fn	meta_formatter,</div><div class='ctx'> 	ext4_mballoc_query_range_fn	formatter,</div><div class='ctx'> 	void				*priv);</div><div class='ctx'> </div><div class='head'>diff --git a/fs/ext4/migrate.c b/fs/ext4/migrate.c<br/>index 7e0b4f81c6c0..1b0dfd963d3f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/migrate.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/migrate.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/migrate.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/migrate.c</a></div><div class='hunk'>@@ -37,7 +37,6 @@ static int finish_range(handle_t *handle, struct inode *inode,</div><div class='ctx'> 	path = ext4_find_extent(inode, lb-&gt;first_block, NULL, 0);</div><div class='ctx'> 	if (IS_ERR(path)) {</div><div class='ctx'> 		retval = PTR_ERR(path);</div><div class='del'>-		path = NULL;</div><div class='ctx'> 		goto err_out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -53,11 +52,12 @@ static int finish_range(handle_t *handle, struct inode *inode,</div><div class='ctx'> 	retval = ext4_datasem_ensure_credits(handle, inode, needed, needed, 0);</div><div class='ctx'> 	if (retval &lt; 0)</div><div class='ctx'> 		goto err_out;</div><div class='del'>-	retval = ext4_ext_insert_extent(handle, inode, &amp;path, &amp;newext, 0);</div><div class='add'>+	path = ext4_ext_insert_extent(handle, inode, path, &amp;newext, 0);</div><div class='add'>+	if (IS_ERR(path))</div><div class='add'>+		retval = PTR_ERR(path);</div><div class='ctx'> err_out:</div><div class='ctx'> 	up_write((&amp;EXT4_I(inode)-&gt;i_data_sem));</div><div class='del'>-	ext4_ext_drop_refs(path);</div><div class='del'>-	kfree(path);</div><div class='add'>+	ext4_free_ext_path(path);</div><div class='ctx'> 	lb-&gt;first_pblock = 0;</div><div class='ctx'> 	return retval;</div><div class='ctx'> }</div><div class='hunk'>@@ -409,7 +409,6 @@ static int free_ext_block(handle_t *handle, struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> int ext4_ext_migrate(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_sb_info *sbi = EXT4_SB(inode-&gt;i_sb);</div><div class='ctx'> 	handle_t *handle;</div><div class='ctx'> 	int retval = 0, i;</div><div class='ctx'> 	__le32 *i_data;</div><div class='hunk'>@@ -417,15 +416,17 @@ int ext4_ext_migrate(struct inode *inode)</div><div class='ctx'> 	struct inode *tmp_inode = NULL;</div><div class='ctx'> 	struct migrate_struct lb;</div><div class='ctx'> 	unsigned long max_entries;</div><div class='del'>-	__u32 goal;</div><div class='add'>+	__u32 goal, tmp_csum_seed;</div><div class='ctx'> 	uid_t owner[2];</div><div class='add'>+	int alloc_ctx;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If the filesystem does not support extents, or the inode</div><div class='ctx'> 	 * already is extent-based, error out.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (!ext4_has_feature_extents(inode-&gt;i_sb) ||</div><div class='del'>-	    (ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS)))</div><div class='add'>+	    ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS) ||</div><div class='add'>+	    ext4_has_inline_data(inode))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	if (S_ISLNK(inode-&gt;i_mode) &amp;&amp; inode-&gt;i_blocks == 0)</div><div class='hunk'>@@ -434,15 +435,15 @@ int ext4_ext_migrate(struct inode *inode)</div><div class='ctx'> 		 */</div><div class='ctx'> 		return retval;</div><div class='ctx'> </div><div class='del'>-	percpu_down_write(&amp;sbi-&gt;s_writepages_rwsem);</div><div class='add'>+	alloc_ctx = ext4_writepages_down_write(inode-&gt;i_sb);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Worst case we can touch the allocation bitmaps, a bgd</div><div class='del'>-	 * block, and a block to link in the orphan list.  We do need</div><div class='del'>-	 * need to worry about credits for modifying the quota inode.</div><div class='add'>+	 * Worst case we can touch the allocation bitmaps and a block</div><div class='add'>+	 * group descriptor block.  We do need to worry about</div><div class='add'>+	 * credits for modifying the quota inode.</div><div class='ctx'> 	 */</div><div class='ctx'> 	handle = ext4_journal_start(inode, EXT4_HT_MIGRATE,</div><div class='del'>-		4 + EXT4_MAXQUOTAS_TRANS_BLOCKS(inode-&gt;i_sb));</div><div class='add'>+		3 + EXT4_MAXQUOTAS_TRANS_BLOCKS(inode-&gt;i_sb));</div><div class='ctx'> </div><div class='ctx'> 	if (IS_ERR(handle)) {</div><div class='ctx'> 		retval = PTR_ERR(handle);</div><div class='hunk'>@@ -459,6 +460,14 @@ int ext4_ext_migrate(struct inode *inode)</div><div class='ctx'> 		ext4_journal_stop(handle);</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	}</div><div class='add'>+	/*</div><div class='add'>+	 * Use the correct seed for checksum (i.e. the seed from 'inode').  This</div><div class='add'>+	 * is so that the metadata blocks will have the correct checksum after</div><div class='add'>+	 * the migration.</div><div class='add'>+	 */</div><div class='add'>+	ei = EXT4_I(inode);</div><div class='add'>+	tmp_csum_seed = EXT4_I(tmp_inode)-&gt;i_csum_seed;</div><div class='add'>+	EXT4_I(tmp_inode)-&gt;i_csum_seed = ei-&gt;i_csum_seed;</div><div class='ctx'> 	i_size_write(tmp_inode, i_size_read(inode));</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Set the i_nlink to zero so it will be deleted later</div><div class='hunk'>@@ -467,7 +476,6 @@ int ext4_ext_migrate(struct inode *inode)</div><div class='ctx'> 	clear_nlink(tmp_inode);</div><div class='ctx'> </div><div class='ctx'> 	ext4_ext_tree_init(handle, tmp_inode);</div><div class='del'>-	ext4_orphan_add(handle, tmp_inode);</div><div class='ctx'> 	ext4_journal_stop(handle);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -479,7 +487,7 @@ int ext4_ext_migrate(struct inode *inode)</div><div class='ctx'> 	 * when we add extents we extent the journal</div><div class='ctx'> 	 */</div><div class='ctx'> 	/*</div><div class='del'>-	 * Even though we take i_mutex we can still cause block</div><div class='add'>+	 * Even though we take i_rwsem we can still cause block</div><div class='ctx'> 	 * allocation via mmap write to holes. If we have allocated</div><div class='ctx'> 	 * new blocks we fail migrate.  New block allocation will</div><div class='ctx'> 	 * clear EXT4_STATE_EXT_MIGRATE flag.  The flag is updated</div><div class='hunk'>@@ -492,17 +500,10 @@ int ext4_ext_migrate(struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> 	handle = ext4_journal_start(inode, EXT4_HT_MIGRATE, 1);</div><div class='ctx'> 	if (IS_ERR(handle)) {</div><div class='del'>-		/*</div><div class='del'>-		 * It is impossible to update on-disk structures without</div><div class='del'>-		 * a handle, so just rollback in-core changes and live other</div><div class='del'>-		 * work to orphan_list_cleanup()</div><div class='del'>-		 */</div><div class='del'>-		ext4_orphan_del(NULL, tmp_inode);</div><div class='ctx'> 		retval = PTR_ERR(handle);</div><div class='ctx'> 		goto out_tmp_inode;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ei = EXT4_I(inode);</div><div class='ctx'> 	i_data = ei-&gt;i_data;</div><div class='ctx'> 	memset(&amp;lb, 0, sizeof(lb));</div><div class='ctx'> </div><div class='hunk'>@@ -576,6 +577,7 @@ err_out:</div><div class='ctx'> 	 * the inode is not visible to user space.</div><div class='ctx'> 	 */</div><div class='ctx'> 	tmp_inode-&gt;i_blocks = 0;</div><div class='add'>+	EXT4_I(tmp_inode)-&gt;i_csum_seed = tmp_csum_seed;</div><div class='ctx'> </div><div class='ctx'> 	/* Reset the extent details */</div><div class='ctx'> 	ext4_ext_tree_init(handle, tmp_inode);</div><div class='hunk'>@@ -585,7 +587,7 @@ out_tmp_inode:</div><div class='ctx'> 	unlock_new_inode(tmp_inode);</div><div class='ctx'> 	iput(tmp_inode);</div><div class='ctx'> out_unlock:</div><div class='del'>-	percpu_up_write(&amp;sbi-&gt;s_writepages_rwsem);</div><div class='add'>+	ext4_writepages_up_write(inode-&gt;i_sb, alloc_ctx);</div><div class='ctx'> 	return retval;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -604,6 +606,7 @@ int ext4_ind_migrate(struct inode *inode)</div><div class='ctx'> 	ext4_fsblk_t			blk;</div><div class='ctx'> 	handle_t			*handle;</div><div class='ctx'> 	int				ret, ret2 = 0;</div><div class='add'>+	int				alloc_ctx;</div><div class='ctx'> </div><div class='ctx'> 	if (!ext4_has_feature_extents(inode-&gt;i_sb) ||</div><div class='ctx'> 	    (!ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS)))</div><div class='hunk'>@@ -620,7 +623,7 @@ int ext4_ind_migrate(struct inode *inode)</div><div class='ctx'> 	if (test_opt(inode-&gt;i_sb, DELALLOC))</div><div class='ctx'> 		ext4_alloc_da_blocks(inode);</div><div class='ctx'> </div><div class='del'>-	percpu_down_write(&amp;sbi-&gt;s_writepages_rwsem);</div><div class='add'>+	alloc_ctx = ext4_writepages_down_write(inode-&gt;i_sb);</div><div class='ctx'> </div><div class='ctx'> 	handle = ext4_journal_start(inode, EXT4_HT_MIGRATE, 1);</div><div class='ctx'> 	if (IS_ERR(handle)) {</div><div class='hunk'>@@ -661,9 +664,9 @@ int ext4_ind_migrate(struct inode *inode)</div><div class='ctx'> 	if (unlikely(ret2 &amp;&amp; !ret))</div><div class='ctx'> 		ret = ret2;</div><div class='ctx'> errout:</div><div class='del'>-	ext4_journal_stop(handle);</div><div class='ctx'> 	up_write(&amp;EXT4_I(inode)-&gt;i_data_sem);</div><div class='add'>+	ext4_journal_stop(handle);</div><div class='ctx'> out_unlock:</div><div class='del'>-	percpu_up_write(&amp;sbi-&gt;s_writepages_rwsem);</div><div class='add'>+	ext4_writepages_up_write(inode-&gt;i_sb, alloc_ctx);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/ext4/mmp.c b/fs/ext4/mmp.c<br/>index cebea4270817..6f57c181ff77 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/mmp.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/mmp.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/mmp.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/mmp.c</a></div><div class='hunk'>@@ -14,14 +14,14 @@ static __le32 ext4_mmp_csum(struct super_block *sb, struct mmp_struct *mmp)</div><div class='ctx'> 	int offset = offsetof(struct mmp_struct, mmp_checksum);</div><div class='ctx'> 	__u32 csum;</div><div class='ctx'> </div><div class='del'>-	csum = ext4_chksum(sbi, sbi-&gt;s_csum_seed, (char *)mmp, offset);</div><div class='add'>+	csum = ext4_chksum(sbi-&gt;s_csum_seed, (char *)mmp, offset);</div><div class='ctx'> </div><div class='ctx'> 	return cpu_to_le32(csum);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ext4_mmp_csum_verify(struct super_block *sb, struct mmp_struct *mmp)</div><div class='ctx'> {</div><div class='del'>-	if (!ext4_has_metadata_csum(sb))</div><div class='add'>+	if (!ext4_has_feature_metadata_csum(sb))</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='ctx'> 	return mmp-&gt;mmp_checksum == ext4_mmp_csum(sb, mmp);</div><div class='hunk'>@@ -29,7 +29,7 @@ static int ext4_mmp_csum_verify(struct super_block *sb, struct mmp_struct *mmp)</div><div class='ctx'> </div><div class='ctx'> static void ext4_mmp_csum_set(struct super_block *sb, struct mmp_struct *mmp)</div><div class='ctx'> {</div><div class='del'>-	if (!ext4_has_metadata_csum(sb))</div><div class='add'>+	if (!ext4_has_feature_metadata_csum(sb))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	mmp-&gt;mmp_checksum = ext4_mmp_csum(sb, mmp);</div><div class='hunk'>@@ -39,28 +39,32 @@ static void ext4_mmp_csum_set(struct super_block *sb, struct mmp_struct *mmp)</div><div class='ctx'>  * Write the MMP block using REQ_SYNC to try to get the block on-disk</div><div class='ctx'>  * faster.</div><div class='ctx'>  */</div><div class='del'>-static int write_mmp_block(struct super_block *sb, struct buffer_head *bh)</div><div class='add'>+static int write_mmp_block_thawed(struct super_block *sb,</div><div class='add'>+				  struct buffer_head *bh)</div><div class='ctx'> {</div><div class='ctx'> 	struct mmp_struct *mmp = (struct mmp_struct *)(bh-&gt;b_data);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * We protect against freezing so that we don't create dirty buffers</div><div class='del'>-	 * on frozen filesystem.</div><div class='del'>-	 */</div><div class='del'>-	sb_start_write(sb);</div><div class='ctx'> 	ext4_mmp_csum_set(sb, mmp);</div><div class='ctx'> 	lock_buffer(bh);</div><div class='ctx'> 	bh-&gt;b_end_io = end_buffer_write_sync;</div><div class='ctx'> 	get_bh(bh);</div><div class='del'>-	submit_bh(REQ_OP_WRITE, REQ_SYNC | REQ_META | REQ_PRIO, bh);</div><div class='add'>+	submit_bh(REQ_OP_WRITE | REQ_SYNC | REQ_META | REQ_PRIO, bh);</div><div class='ctx'> 	wait_on_buffer(bh);</div><div class='del'>-	sb_end_write(sb);</div><div class='ctx'> 	if (unlikely(!buffer_uptodate(bh)))</div><div class='ctx'> 		return -EIO;</div><div class='del'>-</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int write_mmp_block(struct super_block *sb, struct buffer_head *bh)</div><div class='add'>+{</div><div class='add'>+	/*</div><div class='add'>+	 * We protect against freezing so that we don't create dirty buffers</div><div class='add'>+	 * on frozen filesystem.</div><div class='add'>+	 */</div><div class='add'>+	scoped_guard(super_write, sb)</div><div class='add'>+		return write_mmp_block_thawed(sb, bh);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Read the MMP block. It _must_ be read from disk and hence we clear the</div><div class='ctx'>  * uptodate flag on the buffer.</div><div class='hunk'>@@ -86,7 +90,7 @@ static int read_mmp_block(struct super_block *sb, struct buffer_head **bh,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	lock_buffer(*bh);</div><div class='del'>-	ret = ext4_read_bh(*bh, REQ_META | REQ_PRIO, NULL);</div><div class='add'>+	ret = ext4_read_bh(*bh, REQ_META | REQ_PRIO, NULL, false);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto warn_exit;</div><div class='ctx'> </div><div class='hunk'>@@ -127,7 +131,7 @@ void __dump_mmp_msg(struct super_block *sb, struct mmp_struct *mmp,</div><div class='ctx'>  */</div><div class='ctx'> static int kmmpd(void *data)</div><div class='ctx'> {</div><div class='del'>-	struct super_block *sb = (struct super_block *) data;</div><div class='add'>+	struct super_block *sb = data;</div><div class='ctx'> 	struct ext4_super_block *es = EXT4_SB(sb)-&gt;s_es;</div><div class='ctx'> 	struct buffer_head *bh = EXT4_SB(sb)-&gt;s_mmp_bh;</div><div class='ctx'> 	struct mmp_struct *mmp;</div><div class='hunk'>@@ -150,13 +154,11 @@ static int kmmpd(void *data)</div><div class='ctx'> 	mmp_check_interval = max(EXT4_MMP_CHECK_MULT * mmp_update_interval,</div><div class='ctx'> 				 EXT4_MMP_MIN_CHECK_INTERVAL);</div><div class='ctx'> 	mmp-&gt;mmp_check_interval = cpu_to_le16(mmp_check_interval);</div><div class='del'>-	BUILD_BUG_ON(sizeof(mmp-&gt;mmp_bdevname) &lt; BDEVNAME_SIZE);</div><div class='del'>-	bdevname(bh-&gt;b_bdev, mmp-&gt;mmp_bdevname);</div><div class='ctx'> </div><div class='ctx'> 	memcpy(mmp-&gt;mmp_nodename, init_utsname()-&gt;nodename,</div><div class='ctx'> 	       sizeof(mmp-&gt;mmp_nodename));</div><div class='ctx'> </div><div class='del'>-	while (!kthread_should_stop() &amp;&amp; !sb_rdonly(sb)) {</div><div class='add'>+	while (!kthread_should_stop() &amp;&amp; !ext4_emergency_state(sb)) {</div><div class='ctx'> 		if (!ext4_has_feature_mmp(sb)) {</div><div class='ctx'> 			ext4_warning(sb, "kmmpd being stopped since MMP feature"</div><div class='ctx'> 				     " has been disabled.");</div><div class='hunk'>@@ -225,9 +227,9 @@ static int kmmpd(void *data)</div><div class='ctx'> 		 * Adjust the mmp_check_interval depending on how much time</div><div class='ctx'> 		 * it took for the MMP block to be written.</div><div class='ctx'> 		 */</div><div class='del'>-		mmp_check_interval = max(min(EXT4_MMP_CHECK_MULT * diff / HZ,</div><div class='del'>-					     EXT4_MMP_MAX_CHECK_INTERVAL),</div><div class='del'>-					 EXT4_MMP_MIN_CHECK_INTERVAL);</div><div class='add'>+		mmp_check_interval = clamp(EXT4_MMP_CHECK_MULT * diff / HZ,</div><div class='add'>+					   EXT4_MMP_MIN_CHECK_INTERVAL,</div><div class='add'>+					   EXT4_MMP_MAX_CHECK_INTERVAL);</div><div class='ctx'> 		mmp-&gt;mmp_check_interval = cpu_to_le16(mmp_check_interval);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -264,13 +266,7 @@ void ext4_stop_mmpd(struct ext4_sb_info *sbi)</div><div class='ctx'>  */</div><div class='ctx'> static unsigned int mmp_new_seq(void)</div><div class='ctx'> {</div><div class='del'>-	u32 new_seq;</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		new_seq = prandom_u32();</div><div class='del'>-	} while (new_seq &gt; EXT4_MMP_SEQ_MAX);</div><div class='del'>-</div><div class='del'>-	return new_seq;</div><div class='add'>+	return get_random_u32_below(EXT4_MMP_SEQ_MAX + 1);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -290,6 +286,7 @@ int ext4_multi_mount_protect(struct super_block *sb,</div><div class='ctx'> 	if (mmp_block &lt; le32_to_cpu(es-&gt;s_first_data_block) ||</div><div class='ctx'> 	    mmp_block &gt;= ext4_blocks_count(es)) {</div><div class='ctx'> 		ext4_warning(sb, "Invalid MMP block in superblock");</div><div class='add'>+		retval = -EINVAL;</div><div class='ctx'> 		goto failed;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -315,6 +312,7 @@ int ext4_multi_mount_protect(struct super_block *sb,</div><div class='ctx'> </div><div class='ctx'> 	if (seq == EXT4_MMP_SEQ_FSCK) {</div><div class='ctx'> 		dump_mmp_msg(sb, mmp, "fsck is running on the filesystem");</div><div class='add'>+		retval = -EBUSY;</div><div class='ctx'> 		goto failed;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -328,6 +326,7 @@ int ext4_multi_mount_protect(struct super_block *sb,</div><div class='ctx'> </div><div class='ctx'> 	if (schedule_timeout_interruptible(HZ * wait_time) != 0) {</div><div class='ctx'> 		ext4_warning(sb, "MMP startup interrupted, failing mount\n");</div><div class='add'>+		retval = -ETIMEDOUT;</div><div class='ctx'> 		goto failed;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -338,6 +337,7 @@ int ext4_multi_mount_protect(struct super_block *sb,</div><div class='ctx'> 	if (seq != le32_to_cpu(mmp-&gt;mmp_seq)) {</div><div class='ctx'> 		dump_mmp_msg(sb, mmp,</div><div class='ctx'> 			     "Device is already active on another node.");</div><div class='add'>+		retval = -EBUSY;</div><div class='ctx'> 		goto failed;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -348,7 +348,11 @@ skip:</div><div class='ctx'> 	seq = mmp_new_seq();</div><div class='ctx'> 	mmp-&gt;mmp_seq = cpu_to_le32(seq);</div><div class='ctx'> </div><div class='del'>-	retval = write_mmp_block(sb, bh);</div><div class='add'>+	/*</div><div class='add'>+	 * On mount / remount we are protected against fs freezing (by s_umount</div><div class='add'>+	 * semaphore) and grabbing freeze protection upsets lockdep</div><div class='add'>+	 */</div><div class='add'>+	retval = write_mmp_block_thawed(sb, bh);</div><div class='ctx'> 	if (retval)</div><div class='ctx'> 		goto failed;</div><div class='ctx'> </div><div class='hunk'>@@ -357,6 +361,7 @@ skip:</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (schedule_timeout_interruptible(HZ * wait_time) != 0) {</div><div class='ctx'> 		ext4_warning(sb, "MMP startup interrupted, failing mount");</div><div class='add'>+		retval = -ETIMEDOUT;</div><div class='ctx'> 		goto failed;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -367,22 +372,27 @@ skip:</div><div class='ctx'> 	if (seq != le32_to_cpu(mmp-&gt;mmp_seq)) {</div><div class='ctx'> 		dump_mmp_msg(sb, mmp,</div><div class='ctx'> 			     "Device is already active on another node.");</div><div class='add'>+		retval = -EBUSY;</div><div class='ctx'> 		goto failed;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	EXT4_SB(sb)-&gt;s_mmp_bh = bh;</div><div class='ctx'> </div><div class='add'>+	BUILD_BUG_ON(sizeof(mmp-&gt;mmp_bdevname) &lt; BDEVNAME_SIZE);</div><div class='add'>+	snprintf(mmp-&gt;mmp_bdevname, sizeof(mmp-&gt;mmp_bdevname),</div><div class='add'>+		 "%pg", bh-&gt;b_bdev);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Start a kernel thread to update the MMP block periodically.</div><div class='ctx'> 	 */</div><div class='ctx'> 	EXT4_SB(sb)-&gt;s_mmp_tsk = kthread_run(kmmpd, sb, "kmmpd-%.*s",</div><div class='ctx'> 					     (int)sizeof(mmp-&gt;mmp_bdevname),</div><div class='del'>-					     bdevname(bh-&gt;b_bdev,</div><div class='del'>-						      mmp-&gt;mmp_bdevname));</div><div class='add'>+					     mmp-&gt;mmp_bdevname);</div><div class='ctx'> 	if (IS_ERR(EXT4_SB(sb)-&gt;s_mmp_tsk)) {</div><div class='ctx'> 		EXT4_SB(sb)-&gt;s_mmp_tsk = NULL;</div><div class='ctx'> 		ext4_warning(sb, "Unable to create kmmpd thread for %s.",</div><div class='ctx'> 			     sb-&gt;s_id);</div><div class='add'>+		retval = -ENOMEM;</div><div class='ctx'> 		goto failed;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -390,5 +400,5 @@ skip:</div><div class='ctx'> </div><div class='ctx'> failed:</div><div class='ctx'> 	brelse(bh);</div><div class='del'>-	return 1;</div><div class='add'>+	return retval;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/ext4/move_extent.c b/fs/ext4/move_extent.c<br/>index 64a579734f93..0550fd30fd10 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/move_extent.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/move_extent.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/move_extent.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/move_extent.c</a></div><div class='hunk'>@@ -8,37 +8,19 @@</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/quotaops.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='add'>+#include &lt;linux/sched/mm.h&gt;</div><div class='ctx'> #include "ext4_jbd2.h"</div><div class='ctx'> #include "ext4.h"</div><div class='ctx'> #include "ext4_extents.h"</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * get_ext_path() - Find an extent path for designated logical block number.</div><div class='del'>- * @inode:	inode to be searched</div><div class='del'>- * @lblock:	logical block number to find an extent path</div><div class='del'>- * @ppath:	pointer to an extent path pointer (for output)</div><div class='del'>- *</div><div class='del'>- * ext4_find_extent wrapper. Return 0 on success, or a negative error value</div><div class='del'>- * on failure.</div><div class='del'>- */</div><div class='del'>-static inline int</div><div class='del'>-get_ext_path(struct inode *inode, ext4_lblk_t lblock,</div><div class='del'>-		struct ext4_ext_path **ppath)</div><div class='del'>-{</div><div class='del'>-	struct ext4_ext_path *path;</div><div class='del'>-</div><div class='del'>-	path = ext4_find_extent(inode, lblock, ppath, EXT4_EX_NOCACHE);</div><div class='del'>-	if (IS_ERR(path))</div><div class='del'>-		return PTR_ERR(path);</div><div class='del'>-	if (path[ext_depth(inode)].p_ext == NULL) {</div><div class='del'>-		ext4_ext_drop_refs(path);</div><div class='del'>-		kfree(path);</div><div class='del'>-		*ppath = NULL;</div><div class='del'>-		return -ENODATA;</div><div class='del'>-	}</div><div class='del'>-	*ppath = path;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='add'>+#include &lt;trace/events/ext4.h&gt;</div><div class='add'>+</div><div class='add'>+struct mext_data {</div><div class='add'>+	struct inode *orig_inode;	/* Origin file inode */</div><div class='add'>+	struct inode *donor_inode;	/* Donor file inode */</div><div class='add'>+	struct ext4_map_blocks orig_map;/* Origin file's move mapping */</div><div class='add'>+	ext4_lblk_t donor_lblk;		/* Start block of the donor file */</div><div class='add'>+};</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * ext4_double_down_write_data_sem() - write lock two inodes's i_data_sem</div><div class='hunk'>@@ -56,7 +38,6 @@ ext4_double_down_write_data_sem(struct inode *first, struct inode *second)</div><div class='ctx'> 	} else {</div><div class='ctx'> 		down_write(&amp;EXT4_I(second)-&gt;i_data_sem);</div><div class='ctx'> 		down_write_nested(&amp;EXT4_I(first)-&gt;i_data_sem, I_DATA_SEM_OTHER);</div><div class='del'>-</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -75,59 +56,14 @@ ext4_double_up_write_data_sem(struct inode *orig_inode,</div><div class='ctx'> 	up_write(&amp;EXT4_I(donor_inode)-&gt;i_data_sem);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * mext_check_coverage - Check that all extents in range has the same type</div><div class='del'>- *</div><div class='del'>- * @inode:		inode in question</div><div class='del'>- * @from:		block offset of inode</div><div class='del'>- * @count:		block count to be checked</div><div class='del'>- * @unwritten:		extents expected to be unwritten</div><div class='del'>- * @err:		pointer to save error value</div><div class='del'>- *</div><div class='del'>- * Return 1 if all extents in range has expected type, and zero otherwise.</div><div class='del'>- */</div><div class='del'>-static int</div><div class='del'>-mext_check_coverage(struct inode *inode, ext4_lblk_t from, ext4_lblk_t count,</div><div class='del'>-		    int unwritten, int *err)</div><div class='del'>-{</div><div class='del'>-	struct ext4_ext_path *path = NULL;</div><div class='del'>-	struct ext4_extent *ext;</div><div class='del'>-	int ret = 0;</div><div class='del'>-	ext4_lblk_t last = from + count;</div><div class='del'>-	while (from &lt; last) {</div><div class='del'>-		*err = get_ext_path(inode, from, &amp;path);</div><div class='del'>-		if (*err)</div><div class='del'>-			goto out;</div><div class='del'>-		ext = path[ext_depth(inode)].p_ext;</div><div class='del'>-		if (unwritten != ext4_ext_is_unwritten(ext))</div><div class='del'>-			goto out;</div><div class='del'>-		from += ext4_ext_get_actual_len(ext);</div><div class='del'>-		ext4_ext_drop_refs(path);</div><div class='del'>-	}</div><div class='del'>-	ret = 1;</div><div class='del'>-out:</div><div class='del'>-	ext4_ext_drop_refs(path);</div><div class='del'>-	kfree(path);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * mext_page_double_lock - Grab and lock pages on both @inode1 and @inode2</div><div class='del'>- *</div><div class='del'>- * @inode1:	the inode structure</div><div class='del'>- * @inode2:	the inode structure</div><div class='del'>- * @index1:	page index</div><div class='del'>- * @index2:	page index</div><div class='del'>- * @page:	result page vector</div><div class='del'>- *</div><div class='del'>- * Grab two locked pages for inode's by inode order</div><div class='del'>- */</div><div class='del'>-static int</div><div class='del'>-mext_page_double_lock(struct inode *inode1, struct inode *inode2,</div><div class='del'>-		      pgoff_t index1, pgoff_t index2, struct page *page[2])</div><div class='add'>+/* Grab and lock folio on both @inode1 and @inode2 by inode order. */</div><div class='add'>+static int mext_folio_double_lock(struct inode *inode1, struct inode *inode2,</div><div class='add'>+				  pgoff_t index1, pgoff_t index2, size_t len,</div><div class='add'>+				  struct folio *folio[2])</div><div class='ctx'> {</div><div class='ctx'> 	struct address_space *mapping[2];</div><div class='del'>-	unsigned fl = AOP_FLAG_NOFS;</div><div class='add'>+	unsigned int flags;</div><div class='add'>+	fgf_t fgp_flags = FGP_WRITEBEGIN;</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(!inode1 || !inode2);</div><div class='ctx'> 	if (inode1 &lt; inode2) {</div><div class='hunk'>@@ -139,357 +75,425 @@ mext_page_double_lock(struct inode *inode1, struct inode *inode2,</div><div class='ctx'> 		mapping[1] = inode1-&gt;i_mapping;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	page[0] = grab_cache_page_write_begin(mapping[0], index1, fl);</div><div class='del'>-	if (!page[0])</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	flags = memalloc_nofs_save();</div><div class='add'>+	fgp_flags |= fgf_set_order(len);</div><div class='add'>+	folio[0] = __filemap_get_folio(mapping[0], index1, fgp_flags,</div><div class='add'>+			mapping_gfp_mask(mapping[0]));</div><div class='add'>+	if (IS_ERR(folio[0])) {</div><div class='add'>+		memalloc_nofs_restore(flags);</div><div class='add'>+		return PTR_ERR(folio[0]);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	page[1] = grab_cache_page_write_begin(mapping[1], index2, fl);</div><div class='del'>-	if (!page[1]) {</div><div class='del'>-		unlock_page(page[0]);</div><div class='del'>-		put_page(page[0]);</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	folio[1] = __filemap_get_folio(mapping[1], index2, fgp_flags,</div><div class='add'>+			mapping_gfp_mask(mapping[1]));</div><div class='add'>+	memalloc_nofs_restore(flags);</div><div class='add'>+	if (IS_ERR(folio[1])) {</div><div class='add'>+		folio_unlock(folio[0]);</div><div class='add'>+		folio_put(folio[0]);</div><div class='add'>+		return PTR_ERR(folio[1]);</div><div class='ctx'> 	}</div><div class='ctx'> 	/*</div><div class='del'>-	 * grab_cache_page_write_begin() may not wait on page's writeback if</div><div class='add'>+	 * __filemap_get_folio() may not wait on folio's writeback if</div><div class='ctx'> 	 * BDI not demand that. But it is reasonable to be very conservative</div><div class='del'>-	 * here and explicitly wait on page's writeback</div><div class='add'>+	 * here and explicitly wait on folio's writeback</div><div class='ctx'> 	 */</div><div class='del'>-	wait_on_page_writeback(page[0]);</div><div class='del'>-	wait_on_page_writeback(page[1]);</div><div class='add'>+	folio_wait_writeback(folio[0]);</div><div class='add'>+	folio_wait_writeback(folio[1]);</div><div class='ctx'> 	if (inode1 &gt; inode2)</div><div class='del'>-		swap(page[0], page[1]);</div><div class='add'>+		swap(folio[0], folio[1]);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Force page buffers uptodate w/o dropping page's lock */</div><div class='del'>-static int</div><div class='del'>-mext_page_mkuptodate(struct page *page, unsigned from, unsigned to)</div><div class='add'>+static void mext_folio_double_unlock(struct folio *folio[2])</div><div class='add'>+{</div><div class='add'>+	folio_unlock(folio[0]);</div><div class='add'>+	folio_put(folio[0]);</div><div class='add'>+	folio_unlock(folio[1]);</div><div class='add'>+	folio_put(folio[1]);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Force folio buffers uptodate w/o dropping folio's lock */</div><div class='add'>+static int mext_folio_mkuptodate(struct folio *folio, size_t from, size_t to)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	sector_t block;</div><div class='del'>-	struct buffer_head *bh, *head, *arr[MAX_BUF_PER_PAGE];</div><div class='add'>+	struct buffer_head *bh, *head;</div><div class='ctx'> 	unsigned int blocksize, block_start, block_end;</div><div class='del'>-	int i, err,  nr = 0, partial = 0;</div><div class='del'>-	BUG_ON(!PageLocked(page));</div><div class='del'>-	BUG_ON(PageWriteback(page));</div><div class='add'>+	int nr = 0;</div><div class='add'>+	bool partial = false;</div><div class='ctx'> </div><div class='del'>-	if (PageUptodate(page))</div><div class='add'>+	BUG_ON(!folio_test_locked(folio));</div><div class='add'>+	BUG_ON(folio_test_writeback(folio));</div><div class='add'>+</div><div class='add'>+	if (folio_test_uptodate(folio))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	blocksize = i_blocksize(inode);</div><div class='del'>-	if (!page_has_buffers(page))</div><div class='del'>-		create_empty_buffers(page, blocksize, 0);</div><div class='del'>-</div><div class='del'>-	head = page_buffers(page);</div><div class='del'>-	block = (sector_t)page-&gt;index &lt;&lt; (PAGE_SHIFT - inode-&gt;i_blkbits);</div><div class='del'>-	for (bh = head, block_start = 0; bh != head || !block_start;</div><div class='del'>-	     block++, block_start = block_end, bh = bh-&gt;b_this_page) {</div><div class='add'>+	head = folio_buffers(folio);</div><div class='add'>+	if (!head)</div><div class='add'>+		head = create_empty_buffers(folio, blocksize, 0);</div><div class='add'>+</div><div class='add'>+	block = folio_pos(folio) &gt;&gt; inode-&gt;i_blkbits;</div><div class='add'>+	block_end = 0;</div><div class='add'>+	bh = head;</div><div class='add'>+	do {</div><div class='add'>+		block_start = block_end;</div><div class='ctx'> 		block_end = block_start + blocksize;</div><div class='ctx'> 		if (block_end &lt;= from || block_start &gt;= to) {</div><div class='ctx'> 			if (!buffer_uptodate(bh))</div><div class='del'>-				partial = 1;</div><div class='add'>+				partial = true;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (buffer_uptodate(bh))</div><div class='ctx'> 			continue;</div><div class='ctx'> 		if (!buffer_mapped(bh)) {</div><div class='del'>-			err = ext4_get_block(inode, block, bh, 0);</div><div class='del'>-			if (err) {</div><div class='del'>-				SetPageError(page);</div><div class='add'>+			int err = ext4_get_block(inode, block, bh, 0);</div><div class='add'>+			if (err)</div><div class='ctx'> 				return err;</div><div class='del'>-			}</div><div class='ctx'> 			if (!buffer_mapped(bh)) {</div><div class='del'>-				zero_user(page, block_start, blocksize);</div><div class='add'>+				folio_zero_range(folio, block_start, blocksize);</div><div class='ctx'> 				set_buffer_uptodate(bh);</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		BUG_ON(nr &gt;= MAX_BUF_PER_PAGE);</div><div class='del'>-		arr[nr++] = bh;</div><div class='del'>-	}</div><div class='add'>+		lock_buffer(bh);</div><div class='add'>+		if (buffer_uptodate(bh)) {</div><div class='add'>+			unlock_buffer(bh);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+		ext4_read_bh_nowait(bh, 0, NULL, false);</div><div class='add'>+		nr++;</div><div class='add'>+	} while (block++, (bh = bh-&gt;b_this_page) != head);</div><div class='add'>+</div><div class='ctx'> 	/* No io required */</div><div class='ctx'> 	if (!nr)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; nr; i++) {</div><div class='del'>-		bh = arr[i];</div><div class='del'>-		if (!bh_uptodate_or_lock(bh)) {</div><div class='del'>-			err = ext4_read_bh(bh, 0, NULL);</div><div class='del'>-			if (err)</div><div class='del'>-				return err;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	bh = head;</div><div class='add'>+	do {</div><div class='add'>+		if (bh_offset(bh) + blocksize &lt;= from)</div><div class='add'>+			continue;</div><div class='add'>+		if (bh_offset(bh) &gt;= to)</div><div class='add'>+			break;</div><div class='add'>+		wait_on_buffer(bh);</div><div class='add'>+		if (buffer_uptodate(bh))</div><div class='add'>+			continue;</div><div class='add'>+		return -EIO;</div><div class='add'>+	} while ((bh = bh-&gt;b_this_page) != head);</div><div class='ctx'> out:</div><div class='ctx'> 	if (!partial)</div><div class='del'>-		SetPageUptodate(page);</div><div class='add'>+		folio_mark_uptodate(folio);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * move_extent_per_page - Move extent data per page</div><div class='del'>- *</div><div class='del'>- * @o_filp:			file structure of original file</div><div class='del'>- * @donor_inode:		donor inode</div><div class='del'>- * @orig_page_offset:		page index on original file</div><div class='del'>- * @donor_page_offset:		page index on donor file</div><div class='del'>- * @data_offset_in_page:	block index where data swapping starts</div><div class='del'>- * @block_len_in_page:		the number of blocks to be swapped</div><div class='del'>- * @unwritten:			orig extent is unwritten or not</div><div class='del'>- * @err:			pointer to save return value</div><div class='del'>- *</div><div class='del'>- * Save the data in original inode blocks and replace original inode extents</div><div class='del'>- * with donor inode extents by calling ext4_swap_extents().</div><div class='del'>- * Finally, write out the saved data in new original inode blocks. Return</div><div class='del'>- * replaced block count.</div><div class='add'>+enum mext_move_type {MEXT_SKIP_EXTENT, MEXT_MOVE_EXTENT, MEXT_COPY_DATA};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Start to move extent between the origin inode and the donor inode,</div><div class='add'>+ * hold one folio for each inode and check the candidate moving extent</div><div class='add'>+ * mapping status again.</div><div class='ctx'>  */</div><div class='del'>-static int</div><div class='del'>-move_extent_per_page(struct file *o_filp, struct inode *donor_inode,</div><div class='del'>-		     pgoff_t orig_page_offset, pgoff_t donor_page_offset,</div><div class='del'>-		     int data_offset_in_page,</div><div class='del'>-		     int block_len_in_page, int unwritten, int *err)</div><div class='add'>+static int mext_move_begin(struct mext_data *mext, struct folio *folio[2],</div><div class='add'>+			   enum mext_move_type *move_type)</div><div class='ctx'> {</div><div class='del'>-	struct inode *orig_inode = file_inode(o_filp);</div><div class='del'>-	struct page *pagep[2] = {NULL, NULL};</div><div class='del'>-	handle_t *handle;</div><div class='del'>-	ext4_lblk_t orig_blk_offset, donor_blk_offset;</div><div class='del'>-	unsigned long blocksize = orig_inode-&gt;i_sb-&gt;s_blocksize;</div><div class='del'>-	unsigned int tmp_data_size, data_size, replaced_size;</div><div class='del'>-	int i, err2, jblocks, retries = 0;</div><div class='del'>-	int replaced_count = 0;</div><div class='del'>-	int from = data_offset_in_page &lt;&lt; orig_inode-&gt;i_blkbits;</div><div class='del'>-	int blocks_per_page = PAGE_SIZE &gt;&gt; orig_inode-&gt;i_blkbits;</div><div class='del'>-	struct super_block *sb = orig_inode-&gt;i_sb;</div><div class='del'>-	struct buffer_head *bh = NULL;</div><div class='add'>+	struct inode *orig_inode = mext-&gt;orig_inode;</div><div class='add'>+	struct inode *donor_inode = mext-&gt;donor_inode;</div><div class='add'>+	unsigned int blkbits = orig_inode-&gt;i_blkbits;</div><div class='add'>+	struct ext4_map_blocks donor_map = {0};</div><div class='add'>+	loff_t orig_pos, donor_pos;</div><div class='add'>+	size_t move_len;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	orig_pos = ((loff_t)mext-&gt;orig_map.m_lblk) &lt;&lt; blkbits;</div><div class='add'>+	donor_pos = ((loff_t)mext-&gt;donor_lblk) &lt;&lt; blkbits;</div><div class='add'>+	ret = mext_folio_double_lock(orig_inode, donor_inode,</div><div class='add'>+			orig_pos &gt;&gt; PAGE_SHIFT, donor_pos &gt;&gt; PAGE_SHIFT,</div><div class='add'>+			((size_t)mext-&gt;orig_map.m_len) &lt;&lt; blkbits, folio);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * It needs twice the amount of ordinary journal buffers because</div><div class='del'>-	 * inode and donor_inode may change each different metadata blocks.</div><div class='add'>+	 * Check the origin inode's mapping information again under the</div><div class='add'>+	 * folio lock, as we do not hold the i_data_sem at all times, and</div><div class='add'>+	 * it may change during the concurrent write-back operation.</div><div class='ctx'> 	 */</div><div class='del'>-again:</div><div class='del'>-	*err = 0;</div><div class='del'>-	jblocks = ext4_writepage_trans_blocks(orig_inode) * 2;</div><div class='del'>-	handle = ext4_journal_start(orig_inode, EXT4_HT_MOVE_EXTENTS, jblocks);</div><div class='add'>+	if (mext-&gt;orig_map.m_seq != READ_ONCE(EXT4_I(orig_inode)-&gt;i_es_seq)) {</div><div class='add'>+		ret = -ESTALE;</div><div class='add'>+		goto error;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Adjust the moving length according to the length of shorter folio. */</div><div class='add'>+	move_len = umin(folio_pos(folio[0]) + folio_size(folio[0]) - orig_pos,</div><div class='add'>+			folio_pos(folio[1]) + folio_size(folio[1]) - donor_pos);</div><div class='add'>+	move_len &gt;&gt;= blkbits;</div><div class='add'>+	if (move_len &lt; mext-&gt;orig_map.m_len)</div><div class='add'>+		mext-&gt;orig_map.m_len = move_len;</div><div class='add'>+</div><div class='add'>+	donor_map.m_lblk = mext-&gt;donor_lblk;</div><div class='add'>+	donor_map.m_len = mext-&gt;orig_map.m_len;</div><div class='add'>+	donor_map.m_flags = 0;</div><div class='add'>+	ret = ext4_map_blocks(NULL, donor_inode, &amp;donor_map, 0);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto error;</div><div class='add'>+</div><div class='add'>+	/* Adjust the moving length according to the donor mapping length. */</div><div class='add'>+	mext-&gt;orig_map.m_len = donor_map.m_len;</div><div class='add'>+</div><div class='add'>+	/* Skip moving if the donor range is a hole or a delalloc extent. */</div><div class='add'>+	if (!(donor_map.m_flags &amp; (EXT4_MAP_MAPPED | EXT4_MAP_UNWRITTEN)))</div><div class='add'>+		*move_type = MEXT_SKIP_EXTENT;</div><div class='add'>+	/* If both mapping ranges are unwritten, no need to copy data. */</div><div class='add'>+	else if ((mext-&gt;orig_map.m_flags &amp; EXT4_MAP_UNWRITTEN) &amp;&amp;</div><div class='add'>+		 (donor_map.m_flags &amp; EXT4_MAP_UNWRITTEN))</div><div class='add'>+		*move_type = MEXT_MOVE_EXTENT;</div><div class='add'>+	else</div><div class='add'>+		*move_type = MEXT_COPY_DATA;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+error:</div><div class='add'>+	mext_folio_double_unlock(folio);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Re-create the new moved mapping buffers of the original inode and commit</div><div class='add'>+ * the entire written range.</div><div class='add'>+ */</div><div class='add'>+static int mext_folio_mkwrite(struct inode *inode, struct folio *folio,</div><div class='add'>+			      size_t from, size_t to)</div><div class='add'>+{</div><div class='add'>+	unsigned int blocksize = i_blocksize(inode);</div><div class='add'>+	struct buffer_head *bh, *head;</div><div class='add'>+	size_t block_start, block_end;</div><div class='add'>+	sector_t block;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	head = folio_buffers(folio);</div><div class='add'>+	if (!head)</div><div class='add'>+		head = create_empty_buffers(folio, blocksize, 0);</div><div class='add'>+</div><div class='add'>+	block = folio_pos(folio) &gt;&gt; inode-&gt;i_blkbits;</div><div class='add'>+	block_end = 0;</div><div class='add'>+	bh = head;</div><div class='add'>+	do {</div><div class='add'>+		block_start = block_end;</div><div class='add'>+		block_end = block_start + blocksize;</div><div class='add'>+		if (block_end &lt;= from || block_start &gt;= to)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		ret = ext4_get_block(inode, block, bh, 0);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+	} while (block++, (bh = bh-&gt;b_this_page) != head);</div><div class='add'>+</div><div class='add'>+	block_commit_write(folio, from, to);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Save the data in original inode extent blocks and replace one folio size</div><div class='add'>+ * aligned original inode extent with one or one partial donor inode extent,</div><div class='add'>+ * and then write out the saved data in new original inode blocks. Pass out</div><div class='add'>+ * the replaced block count through m_len. Return 0 on success, and an error</div><div class='add'>+ * code otherwise.</div><div class='add'>+ */</div><div class='add'>+static int mext_move_extent(struct mext_data *mext, u64 *m_len)</div><div class='add'>+{</div><div class='add'>+	struct inode *orig_inode = mext-&gt;orig_inode;</div><div class='add'>+	struct inode *donor_inode = mext-&gt;donor_inode;</div><div class='add'>+	struct ext4_map_blocks *orig_map = &amp;mext-&gt;orig_map;</div><div class='add'>+	unsigned int blkbits = orig_inode-&gt;i_blkbits;</div><div class='add'>+	struct folio *folio[2] = {NULL, NULL};</div><div class='add'>+	loff_t from, length;</div><div class='add'>+	enum mext_move_type move_type = 0;</div><div class='add'>+	handle_t *handle;</div><div class='add'>+	u64 r_len = 0;</div><div class='add'>+	unsigned int credits;</div><div class='add'>+	int ret, ret2;</div><div class='add'>+</div><div class='add'>+	*m_len = 0;</div><div class='add'>+	trace_ext4_move_extent_enter(orig_inode, orig_map, donor_inode,</div><div class='add'>+				     mext-&gt;donor_lblk);</div><div class='add'>+	credits = ext4_chunk_trans_extent(orig_inode, 0) * 2;</div><div class='add'>+	handle = ext4_journal_start(orig_inode, EXT4_HT_MOVE_EXTENTS, credits);</div><div class='ctx'> 	if (IS_ERR(handle)) {</div><div class='del'>-		*err = PTR_ERR(handle);</div><div class='del'>-		return 0;</div><div class='add'>+		ret = PTR_ERR(handle);</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	orig_blk_offset = orig_page_offset * blocks_per_page +</div><div class='del'>-		data_offset_in_page;</div><div class='del'>-</div><div class='del'>-	donor_blk_offset = donor_page_offset * blocks_per_page +</div><div class='del'>-		data_offset_in_page;</div><div class='del'>-</div><div class='del'>-	/* Calculate data_size */</div><div class='del'>-	if ((orig_blk_offset + block_len_in_page - 1) ==</div><div class='del'>-	    ((orig_inode-&gt;i_size - 1) &gt;&gt; orig_inode-&gt;i_blkbits)) {</div><div class='del'>-		/* Replace the last block */</div><div class='del'>-		tmp_data_size = orig_inode-&gt;i_size &amp; (blocksize - 1);</div><div class='del'>-		/*</div><div class='del'>-		 * If data_size equal zero, it shows data_size is multiples of</div><div class='del'>-		 * blocksize. So we set appropriate value.</div><div class='del'>-		 */</div><div class='del'>-		if (tmp_data_size == 0)</div><div class='del'>-			tmp_data_size = blocksize;</div><div class='del'>-</div><div class='del'>-		data_size = tmp_data_size +</div><div class='del'>-			((block_len_in_page - 1) &lt;&lt; orig_inode-&gt;i_blkbits);</div><div class='del'>-	} else</div><div class='del'>-		data_size = block_len_in_page &lt;&lt; orig_inode-&gt;i_blkbits;</div><div class='del'>-</div><div class='del'>-	replaced_size = data_size;</div><div class='del'>-</div><div class='del'>-	*err = mext_page_double_lock(orig_inode, donor_inode, orig_page_offset,</div><div class='del'>-				     donor_page_offset, pagep);</div><div class='del'>-	if (unlikely(*err &lt; 0))</div><div class='del'>-		goto stop_journal;</div><div class='add'>+	ret = mext_move_begin(mext, folio, &amp;move_type);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto stop_handle;</div><div class='add'>+</div><div class='add'>+	if (move_type == MEXT_SKIP_EXTENT)</div><div class='add'>+		goto unlock;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='del'>-	 * If orig extent was unwritten it can become initialized</div><div class='del'>-	 * at any time after i_data_sem was dropped, in order to</div><div class='del'>-	 * serialize with delalloc we have recheck extent while we</div><div class='del'>-	 * hold page's lock, if it is still the case data copy is not</div><div class='del'>-	 * necessary, just swap data blocks between orig and donor.</div><div class='add'>+	 * Copy the data. First, read the original inode data into the page</div><div class='add'>+	 * cache. Then, release the existing mapping relationships and swap</div><div class='add'>+	 * the extent. Finally, re-establish the new mapping relationships</div><div class='add'>+	 * and dirty the page cache.</div><div class='ctx'> 	 */</div><div class='del'>-	if (unwritten) {</div><div class='del'>-		ext4_double_down_write_data_sem(orig_inode, donor_inode);</div><div class='del'>-		/* If any of extents in range became initialized we have to</div><div class='del'>-		 * fallback to data copying */</div><div class='del'>-		unwritten = mext_check_coverage(orig_inode, orig_blk_offset,</div><div class='del'>-						block_len_in_page, 1, err);</div><div class='del'>-		if (*err)</div><div class='del'>-			goto drop_data_sem;</div><div class='del'>-</div><div class='del'>-		unwritten &amp;= mext_check_coverage(donor_inode, donor_blk_offset,</div><div class='del'>-						 block_len_in_page, 1, err);</div><div class='del'>-		if (*err)</div><div class='del'>-			goto drop_data_sem;</div><div class='del'>-</div><div class='del'>-		if (!unwritten) {</div><div class='del'>-			ext4_double_up_write_data_sem(orig_inode, donor_inode);</div><div class='del'>-			goto data_copy;</div><div class='del'>-		}</div><div class='del'>-		if ((page_has_private(pagep[0]) &amp;&amp;</div><div class='del'>-		     !try_to_release_page(pagep[0], 0)) ||</div><div class='del'>-		    (page_has_private(pagep[1]) &amp;&amp;</div><div class='del'>-		     !try_to_release_page(pagep[1], 0))) {</div><div class='del'>-			*err = -EBUSY;</div><div class='del'>-			goto drop_data_sem;</div><div class='del'>-		}</div><div class='del'>-		replaced_count = ext4_swap_extents(handle, orig_inode,</div><div class='del'>-						   donor_inode, orig_blk_offset,</div><div class='del'>-						   donor_blk_offset,</div><div class='del'>-						   block_len_in_page, 1, err);</div><div class='del'>-	drop_data_sem:</div><div class='del'>-		ext4_double_up_write_data_sem(orig_inode, donor_inode);</div><div class='del'>-		goto unlock_pages;</div><div class='add'>+	if (move_type == MEXT_COPY_DATA) {</div><div class='add'>+		from = offset_in_folio(folio[0],</div><div class='add'>+				((loff_t)orig_map-&gt;m_lblk) &lt;&lt; blkbits);</div><div class='add'>+		length = ((loff_t)orig_map-&gt;m_len) &lt;&lt; blkbits;</div><div class='add'>+</div><div class='add'>+		ret = mext_folio_mkuptodate(folio[0], from, from + length);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto unlock;</div><div class='ctx'> 	}</div><div class='del'>-data_copy:</div><div class='del'>-	*err = mext_page_mkuptodate(pagep[0], from, from + replaced_size);</div><div class='del'>-	if (*err)</div><div class='del'>-		goto unlock_pages;</div><div class='del'>-</div><div class='del'>-	/* At this point all buffers in range are uptodate, old mapping layout</div><div class='del'>-	 * is no longer required, try to drop it now. */</div><div class='del'>-	if ((page_has_private(pagep[0]) &amp;&amp; !try_to_release_page(pagep[0], 0)) ||</div><div class='del'>-	    (page_has_private(pagep[1]) &amp;&amp; !try_to_release_page(pagep[1], 0))) {</div><div class='del'>-		*err = -EBUSY;</div><div class='del'>-		goto unlock_pages;</div><div class='add'>+</div><div class='add'>+	if (!filemap_release_folio(folio[0], 0) ||</div><div class='add'>+	    !filemap_release_folio(folio[1], 0)) {</div><div class='add'>+		ret = -EBUSY;</div><div class='add'>+		goto unlock;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	/* Move extent */</div><div class='ctx'> 	ext4_double_down_write_data_sem(orig_inode, donor_inode);</div><div class='del'>-	replaced_count = ext4_swap_extents(handle, orig_inode, donor_inode,</div><div class='del'>-					       orig_blk_offset, donor_blk_offset,</div><div class='del'>-					   block_len_in_page, 1, err);</div><div class='add'>+	*m_len = ext4_swap_extents(handle, orig_inode, donor_inode,</div><div class='add'>+				   orig_map-&gt;m_lblk, mext-&gt;donor_lblk,</div><div class='add'>+				   orig_map-&gt;m_len, 1, &amp;ret);</div><div class='ctx'> 	ext4_double_up_write_data_sem(orig_inode, donor_inode);</div><div class='del'>-	if (*err) {</div><div class='del'>-		if (replaced_count) {</div><div class='del'>-			block_len_in_page = replaced_count;</div><div class='del'>-			replaced_size =</div><div class='del'>-				block_len_in_page &lt;&lt; orig_inode-&gt;i_blkbits;</div><div class='del'>-		} else</div><div class='del'>-			goto unlock_pages;</div><div class='del'>-	}</div><div class='del'>-	/* Perform all necessary steps similar write_begin()/write_end()</div><div class='del'>-	 * but keeping in mind that i_size will not change */</div><div class='del'>-	if (!page_has_buffers(pagep[0]))</div><div class='del'>-		create_empty_buffers(pagep[0], 1 &lt;&lt; orig_inode-&gt;i_blkbits, 0);</div><div class='del'>-	bh = page_buffers(pagep[0]);</div><div class='del'>-	for (i = 0; i &lt; data_offset_in_page; i++)</div><div class='del'>-		bh = bh-&gt;b_this_page;</div><div class='del'>-	for (i = 0; i &lt; block_len_in_page; i++) {</div><div class='del'>-		*err = ext4_get_block(orig_inode, orig_blk_offset + i, bh, 0);</div><div class='del'>-		if (*err &lt; 0)</div><div class='del'>-			break;</div><div class='del'>-		bh = bh-&gt;b_this_page;</div><div class='del'>-	}</div><div class='del'>-	if (!*err)</div><div class='del'>-		*err = block_commit_write(pagep[0], from, from + replaced_size);</div><div class='ctx'> </div><div class='del'>-	if (unlikely(*err &lt; 0))</div><div class='del'>-		goto repair_branches;</div><div class='add'>+	/* A short-length swap cannot occur after a successful swap extent. */</div><div class='add'>+	if (WARN_ON_ONCE(!ret &amp;&amp; (*m_len != orig_map-&gt;m_len)))</div><div class='add'>+		ret = -EIO;</div><div class='ctx'> </div><div class='del'>-	/* Even in case of data=writeback it is reasonable to pin</div><div class='del'>-	 * inode to transaction, to prevent unexpected data loss */</div><div class='del'>-	*err = ext4_jbd2_inode_add_write(handle, orig_inode,</div><div class='del'>-			(loff_t)orig_page_offset &lt;&lt; PAGE_SHIFT, replaced_size);</div><div class='del'>-</div><div class='del'>-unlock_pages:</div><div class='del'>-	unlock_page(pagep[0]);</div><div class='del'>-	put_page(pagep[0]);</div><div class='del'>-	unlock_page(pagep[1]);</div><div class='del'>-	put_page(pagep[1]);</div><div class='del'>-stop_journal:</div><div class='del'>-	ext4_journal_stop(handle);</div><div class='del'>-	if (*err == -ENOSPC &amp;&amp;</div><div class='del'>-	    ext4_should_retry_alloc(sb, &amp;retries))</div><div class='del'>-		goto again;</div><div class='del'>-	/* Buffer was busy because probably is pinned to journal transaction,</div><div class='del'>-	 * force transaction commit may help to free it. */</div><div class='del'>-	if (*err == -EBUSY &amp;&amp; retries++ &lt; 4 &amp;&amp; EXT4_SB(sb)-&gt;s_journal &amp;&amp;</div><div class='del'>-	    jbd2_journal_force_commit_nested(EXT4_SB(sb)-&gt;s_journal))</div><div class='del'>-		goto again;</div><div class='del'>-	return replaced_count;</div><div class='add'>+	if (!(*m_len) || (move_type == MEXT_MOVE_EXTENT))</div><div class='add'>+		goto unlock;</div><div class='ctx'> </div><div class='del'>-repair_branches:</div><div class='add'>+	/* Copy data */</div><div class='add'>+	length = (*m_len) &lt;&lt; blkbits;</div><div class='add'>+	ret2 = mext_folio_mkwrite(orig_inode, folio[0], from, from + length);</div><div class='add'>+	if (ret2) {</div><div class='add'>+		if (!ret)</div><div class='add'>+			ret = ret2;</div><div class='add'>+		goto repair_branches;</div><div class='add'>+	}</div><div class='ctx'> 	/*</div><div class='del'>-	 * This should never ever happen!</div><div class='del'>-	 * Extents are swapped already, but we are not able to copy data.</div><div class='del'>-	 * Try to swap extents to it's original places</div><div class='add'>+	 * Even in case of data=writeback it is reasonable to pin</div><div class='add'>+	 * inode to transaction, to prevent unexpected data loss.</div><div class='ctx'> 	 */</div><div class='del'>-	ext4_double_down_write_data_sem(orig_inode, donor_inode);</div><div class='del'>-	replaced_count = ext4_swap_extents(handle, donor_inode, orig_inode,</div><div class='del'>-					       orig_blk_offset, donor_blk_offset,</div><div class='del'>-					   block_len_in_page, 0, &amp;err2);</div><div class='del'>-	ext4_double_up_write_data_sem(orig_inode, donor_inode);</div><div class='del'>-	if (replaced_count != block_len_in_page) {</div><div class='del'>-		ext4_error_inode_block(orig_inode, (sector_t)(orig_blk_offset),</div><div class='del'>-				       EIO, "Unable to copy data block,"</div><div class='del'>-				       " data will be lost.");</div><div class='del'>-		*err = -EIO;</div><div class='add'>+	ret2 = ext4_jbd2_inode_add_write(handle, orig_inode,</div><div class='add'>+			((loff_t)orig_map-&gt;m_lblk) &lt;&lt; blkbits, length);</div><div class='add'>+	if (!ret)</div><div class='add'>+		ret = ret2;</div><div class='add'>+unlock:</div><div class='add'>+	mext_folio_double_unlock(folio);</div><div class='add'>+stop_handle:</div><div class='add'>+	ext4_journal_stop(handle);</div><div class='add'>+out:</div><div class='add'>+	trace_ext4_move_extent_exit(orig_inode, orig_map-&gt;m_lblk, donor_inode,</div><div class='add'>+				    mext-&gt;donor_lblk, orig_map-&gt;m_len, *m_len,</div><div class='add'>+				    move_type, ret);</div><div class='add'>+	return ret;</div><div class='add'>+</div><div class='add'>+repair_branches:</div><div class='add'>+	ret2 = 0;</div><div class='add'>+	r_len = ext4_swap_extents(handle, donor_inode, orig_inode,</div><div class='add'>+				  mext-&gt;donor_lblk, orig_map-&gt;m_lblk,</div><div class='add'>+				  *m_len, 0, &amp;ret2);</div><div class='add'>+	if (ret2 || r_len != *m_len) {</div><div class='add'>+		ext4_error_inode_block(orig_inode, (sector_t)(orig_map-&gt;m_lblk),</div><div class='add'>+				       EIO, "Unable to copy data block, data will be lost!");</div><div class='add'>+		ret = -EIO;</div><div class='ctx'> 	}</div><div class='del'>-	replaced_count = 0;</div><div class='del'>-	goto unlock_pages;</div><div class='add'>+	*m_len = 0;</div><div class='add'>+	goto unlock;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * mext_check_arguments - Check whether move extent can be done</div><div class='del'>- *</div><div class='del'>- * @orig_inode:		original inode</div><div class='del'>- * @donor_inode:	donor inode</div><div class='del'>- * @orig_start:		logical start offset in block for orig</div><div class='del'>- * @donor_start:	logical start offset in block for donor</div><div class='del'>- * @len:		the number of blocks to be moved</div><div class='del'>- *</div><div class='del'>- * Check the arguments of ext4_move_extents() whether the files can be</div><div class='del'>- * exchanged with each other.</div><div class='del'>- * Return 0 on success, or a negative error value on failure.</div><div class='add'>+/*</div><div class='add'>+ * Check the validity of the basic filesystem environment and the</div><div class='add'>+ * inodes' support status.</div><div class='ctx'>  */</div><div class='del'>-static int</div><div class='del'>-mext_check_arguments(struct inode *orig_inode,</div><div class='del'>-		     struct inode *donor_inode, __u64 orig_start,</div><div class='del'>-		     __u64 donor_start, __u64 *len)</div><div class='add'>+static int mext_check_validity(struct inode *orig_inode,</div><div class='add'>+			       struct inode *donor_inode)</div><div class='ctx'> {</div><div class='del'>-	__u64 orig_eof, donor_eof;</div><div class='del'>-	unsigned int blkbits = orig_inode-&gt;i_blkbits;</div><div class='del'>-	unsigned int blocksize = 1 &lt;&lt; blkbits;</div><div class='add'>+	struct super_block *sb = orig_inode-&gt;i_sb;</div><div class='ctx'> </div><div class='del'>-	orig_eof = (i_size_read(orig_inode) + blocksize - 1) &gt;&gt; blkbits;</div><div class='del'>-	donor_eof = (i_size_read(donor_inode) + blocksize - 1) &gt;&gt; blkbits;</div><div class='add'>+	/* origin and donor should be different inodes */</div><div class='add'>+	if (orig_inode == donor_inode) {</div><div class='add'>+		ext4_debug("ext4 move extent: The argument files should not be same inode [ino:orig %lu, donor %lu]\n",</div><div class='add'>+			   orig_inode-&gt;i_ino, donor_inode-&gt;i_ino);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='add'>+	/* origin and donor should belone to the same filesystem */</div><div class='add'>+	if (orig_inode-&gt;i_sb != donor_inode-&gt;i_sb) {</div><div class='add'>+		ext4_debug("ext4 move extent: The argument files should be in same FS [ino:orig %lu, donor %lu]\n",</div><div class='add'>+			   orig_inode-&gt;i_ino, donor_inode-&gt;i_ino);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (donor_inode-&gt;i_mode &amp; (S_ISUID|S_ISGID)) {</div><div class='del'>-		ext4_debug("ext4 move extent: suid or sgid is set"</div><div class='del'>-			   " to donor file [ino:orig %lu, donor %lu]\n",</div><div class='add'>+	/* Regular file check */</div><div class='add'>+	if (!S_ISREG(orig_inode-&gt;i_mode) || !S_ISREG(donor_inode-&gt;i_mode)) {</div><div class='add'>+		ext4_debug("ext4 move extent: The argument files should be regular file [ino:orig %lu, donor %lu]\n",</div><div class='ctx'> 			   orig_inode-&gt;i_ino, donor_inode-&gt;i_ino);</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (IS_IMMUTABLE(donor_inode) || IS_APPEND(donor_inode))</div><div class='del'>-		return -EPERM;</div><div class='add'>+	if (ext4_has_feature_bigalloc(sb)) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR,</div><div class='add'>+			 "Online defrag not supported with bigalloc");</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	/* Ext4 move extent does not support swapfile */</div><div class='del'>-	if (IS_SWAPFILE(orig_inode) || IS_SWAPFILE(donor_inode)) {</div><div class='del'>-		ext4_debug("ext4 move extent: The argument files should "</div><div class='del'>-			"not be swapfile [ino:orig %lu, donor %lu]\n",</div><div class='del'>-			orig_inode-&gt;i_ino, donor_inode-&gt;i_ino);</div><div class='del'>-		return -EBUSY;</div><div class='add'>+	if (IS_DAX(orig_inode)) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR,</div><div class='add'>+			 "Online defrag not supported with DAX");</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * TODO: it's not obvious how to swap blocks for inodes with full</div><div class='add'>+	 * journaling enabled.</div><div class='add'>+	 */</div><div class='add'>+	if (ext4_should_journal_data(orig_inode) ||</div><div class='add'>+	    ext4_should_journal_data(donor_inode)) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR,</div><div class='add'>+			 "Online defrag not supported with data journaling");</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (ext4_is_quota_file(orig_inode) &amp;&amp; ext4_is_quota_file(donor_inode)) {</div><div class='del'>-		ext4_debug("ext4 move extent: The argument files should "</div><div class='del'>-			"not be quota files [ino:orig %lu, donor %lu]\n",</div><div class='del'>-			orig_inode-&gt;i_ino, donor_inode-&gt;i_ino);</div><div class='del'>-		return -EBUSY;</div><div class='add'>+	if (IS_ENCRYPTED(orig_inode) || IS_ENCRYPTED(donor_inode)) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR,</div><div class='add'>+			 "Online defrag not supported for encrypted files");</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Ext4 move extent supports only extent based file */</div><div class='del'>-	if (!(ext4_test_inode_flag(orig_inode, EXT4_INODE_EXTENTS))) {</div><div class='del'>-		ext4_debug("ext4 move extent: orig file is not extents "</div><div class='del'>-			"based file [ino:orig %lu]\n", orig_inode-&gt;i_ino);</div><div class='add'>+	if (!(ext4_test_inode_flag(orig_inode, EXT4_INODE_EXTENTS)) ||</div><div class='add'>+	    !(ext4_test_inode_flag(donor_inode, EXT4_INODE_EXTENTS))) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR,</div><div class='add'>+			 "Online defrag not supported for non-extent files");</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='del'>-	} else if (!(ext4_test_inode_flag(donor_inode, EXT4_INODE_EXTENTS))) {</div><div class='del'>-		ext4_debug("ext4 move extent: donor file is not extents "</div><div class='del'>-			"based file [ino:donor %lu]\n", donor_inode-&gt;i_ino);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (donor_inode-&gt;i_mode &amp; (S_ISUID|S_ISGID)) {</div><div class='add'>+		ext4_debug("ext4 move extent: suid or sgid is set to donor file [ino:orig %lu, donor %lu]\n",</div><div class='add'>+			   orig_inode-&gt;i_ino, donor_inode-&gt;i_ino);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (IS_IMMUTABLE(donor_inode) || IS_APPEND(donor_inode)) {</div><div class='add'>+		ext4_debug("ext4 move extent: donor should not be immutable or append file [ino:orig %lu, donor %lu]\n",</div><div class='add'>+			   orig_inode-&gt;i_ino, donor_inode-&gt;i_ino);</div><div class='add'>+		return -EPERM;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Ext4 move extent does not support swap files */</div><div class='add'>+	if (IS_SWAPFILE(orig_inode) || IS_SWAPFILE(donor_inode)) {</div><div class='add'>+		ext4_debug("ext4 move extent: The argument files should not be swap files [ino:orig %lu, donor %lu]\n",</div><div class='add'>+			   orig_inode-&gt;i_ino, donor_inode-&gt;i_ino);</div><div class='add'>+		return -ETXTBSY;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (ext4_is_quota_file(orig_inode) || ext4_is_quota_file(donor_inode)) {</div><div class='add'>+		ext4_debug("ext4 move extent: The argument files should not be quota files [ino:orig %lu, donor %lu]\n",</div><div class='add'>+			   orig_inode-&gt;i_ino, donor_inode-&gt;i_ino);</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -498,12 +502,25 @@ mext_check_arguments(struct inode *orig_inode,</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Check the moving range of ext4_move_extents() whether the files can be</div><div class='add'>+ * exchanged with each other, and adjust the length to fit within the file</div><div class='add'>+ * size. Return 0 on success, or a negative error value on failure.</div><div class='add'>+ */</div><div class='add'>+static int mext_check_adjust_range(struct inode *orig_inode,</div><div class='add'>+				   struct inode *donor_inode, __u64 orig_start,</div><div class='add'>+				   __u64 donor_start, __u64 *len)</div><div class='add'>+{</div><div class='add'>+	__u64 orig_eof, donor_eof;</div><div class='add'>+</div><div class='ctx'> 	/* Start offset should be same */</div><div class='ctx'> 	if ((orig_start &amp; ~(PAGE_MASK &gt;&gt; orig_inode-&gt;i_blkbits)) !=</div><div class='ctx'> 	    (donor_start &amp; ~(PAGE_MASK &gt;&gt; orig_inode-&gt;i_blkbits))) {</div><div class='del'>-		ext4_debug("ext4 move extent: orig and donor's start "</div><div class='del'>-			"offsets are not aligned [ino:orig %lu, donor %lu]\n",</div><div class='del'>-			orig_inode-&gt;i_ino, donor_inode-&gt;i_ino);</div><div class='add'>+		ext4_debug("ext4 move extent: orig and donor's start offsets are not aligned [ino:orig %lu, donor %lu]\n",</div><div class='add'>+			   orig_inode-&gt;i_ino, donor_inode-&gt;i_ino);</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -512,11 +529,14 @@ mext_check_arguments(struct inode *orig_inode,</div><div class='ctx'> 	    (*len &gt; EXT_MAX_BLOCKS) ||</div><div class='ctx'> 	    (donor_start + *len &gt;= EXT_MAX_BLOCKS) ||</div><div class='ctx'> 	    (orig_start + *len &gt;= EXT_MAX_BLOCKS))  {</div><div class='del'>-		ext4_debug("ext4 move extent: Can't handle over [%u] blocks "</div><div class='del'>-			"[ino:orig %lu, donor %lu]\n", EXT_MAX_BLOCKS,</div><div class='del'>-			orig_inode-&gt;i_ino, donor_inode-&gt;i_ino);</div><div class='add'>+		ext4_debug("ext4 move extent: Can't handle over [%u] blocks [ino:orig %lu, donor %lu]\n",</div><div class='add'>+			   EXT_MAX_BLOCKS,</div><div class='add'>+			   orig_inode-&gt;i_ino, donor_inode-&gt;i_ino);</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	orig_eof = EXT4_B_TO_LBLK(orig_inode, i_size_read(orig_inode));</div><div class='add'>+	donor_eof = EXT4_B_TO_LBLK(donor_inode, i_size_read(donor_inode));</div><div class='ctx'> 	if (orig_eof &lt;= orig_start)</div><div class='ctx'> 		*len = 0;</div><div class='ctx'> 	else if (orig_eof &lt; orig_start + *len - 1)</div><div class='hunk'>@@ -526,9 +546,8 @@ mext_check_arguments(struct inode *orig_inode,</div><div class='ctx'> 	else if (donor_eof &lt; donor_start + *len - 1)</div><div class='ctx'> 		*len = donor_eof - donor_start;</div><div class='ctx'> 	if (!*len) {</div><div class='del'>-		ext4_debug("ext4 move extent: len should not be 0 "</div><div class='del'>-			"[ino:orig %lu, donor %lu]\n", orig_inode-&gt;i_ino,</div><div class='del'>-			donor_inode-&gt;i_ino);</div><div class='add'>+		ext4_debug("ext4 move extent: len should not be 0 [ino:orig %lu, donor %lu]\n",</div><div class='add'>+			   orig_inode-&gt;i_ino, donor_inode-&gt;i_ino);</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -547,153 +566,89 @@ mext_check_arguments(struct inode *orig_inode,</div><div class='ctx'>  *</div><div class='ctx'>  * This function returns 0 and moved block length is set in moved_len</div><div class='ctx'>  * if succeed, otherwise returns error value.</div><div class='del'>- *</div><div class='ctx'>  */</div><div class='del'>-int</div><div class='del'>-ext4_move_extents(struct file *o_filp, struct file *d_filp, __u64 orig_blk,</div><div class='del'>-		  __u64 donor_blk, __u64 len, __u64 *moved_len)</div><div class='add'>+int ext4_move_extents(struct file *o_filp, struct file *d_filp, __u64 orig_blk,</div><div class='add'>+		      __u64 donor_blk, __u64 len, __u64 *moved_len)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *orig_inode = file_inode(o_filp);</div><div class='ctx'> 	struct inode *donor_inode = file_inode(d_filp);</div><div class='del'>-	struct ext4_ext_path *path = NULL;</div><div class='del'>-	int blocks_per_page = PAGE_SIZE &gt;&gt; orig_inode-&gt;i_blkbits;</div><div class='del'>-	ext4_lblk_t o_end, o_start = orig_blk;</div><div class='del'>-	ext4_lblk_t d_start = donor_blk;</div><div class='add'>+	struct mext_data mext;</div><div class='add'>+	struct super_block *sb = orig_inode-&gt;i_sb;</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	int retries = 0;</div><div class='add'>+	u64 m_len;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (orig_inode-&gt;i_sb != donor_inode-&gt;i_sb) {</div><div class='del'>-		ext4_debug("ext4 move extent: The argument files "</div><div class='del'>-			"should be in same FS [ino:orig %lu, donor %lu]\n",</div><div class='del'>-			orig_inode-&gt;i_ino, donor_inode-&gt;i_ino);</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* orig and donor should be different inodes */</div><div class='del'>-	if (orig_inode == donor_inode) {</div><div class='del'>-		ext4_debug("ext4 move extent: The argument files should not "</div><div class='del'>-			"be same inode [ino:orig %lu, donor %lu]\n",</div><div class='del'>-			orig_inode-&gt;i_ino, donor_inode-&gt;i_ino);</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Regular file check */</div><div class='del'>-	if (!S_ISREG(orig_inode-&gt;i_mode) || !S_ISREG(donor_inode-&gt;i_mode)) {</div><div class='del'>-		ext4_debug("ext4 move extent: The argument files should be "</div><div class='del'>-			"regular file [ino:orig %lu, donor %lu]\n",</div><div class='del'>-			orig_inode-&gt;i_ino, donor_inode-&gt;i_ino);</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* TODO: it's not obvious how to swap blocks for inodes with full</div><div class='del'>-	   journaling enabled */</div><div class='del'>-	if (ext4_should_journal_data(orig_inode) ||</div><div class='del'>-	    ext4_should_journal_data(donor_inode)) {</div><div class='del'>-		ext4_msg(orig_inode-&gt;i_sb, KERN_ERR,</div><div class='del'>-			 "Online defrag not supported with data journaling");</div><div class='del'>-		return -EOPNOTSUPP;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (IS_ENCRYPTED(orig_inode) || IS_ENCRYPTED(donor_inode)) {</div><div class='del'>-		ext4_msg(orig_inode-&gt;i_sb, KERN_ERR,</div><div class='del'>-			 "Online defrag not supported for encrypted files");</div><div class='del'>-		return -EOPNOTSUPP;</div><div class='del'>-	}</div><div class='add'>+	*moved_len = 0;</div><div class='ctx'> </div><div class='ctx'> 	/* Protect orig and donor inodes against a truncate */</div><div class='ctx'> 	lock_two_nondirectories(orig_inode, donor_inode);</div><div class='ctx'> </div><div class='add'>+	ret = mext_check_validity(orig_inode, donor_inode);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='ctx'> 	/* Wait for all existing dio workers */</div><div class='ctx'> 	inode_dio_wait(orig_inode);</div><div class='ctx'> 	inode_dio_wait(donor_inode);</div><div class='ctx'> </div><div class='del'>-	/* Protect extent tree against block allocations via delalloc */</div><div class='del'>-	ext4_double_down_write_data_sem(orig_inode, donor_inode);</div><div class='del'>-	/* Check the filesystem environment whether move_extent can be done */</div><div class='del'>-	ret = mext_check_arguments(orig_inode, donor_inode, orig_blk,</div><div class='del'>-				    donor_blk, &amp;len);</div><div class='add'>+	/* Check and adjust the specified move_extent range. */</div><div class='add'>+	ret = mext_check_adjust_range(orig_inode, donor_inode, orig_blk,</div><div class='add'>+				      donor_blk, &amp;len);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='del'>-	o_end = o_start + len;</div><div class='ctx'> </div><div class='del'>-	while (o_start &lt; o_end) {</div><div class='del'>-		struct ext4_extent *ex;</div><div class='del'>-		ext4_lblk_t cur_blk, next_blk;</div><div class='del'>-		pgoff_t orig_page_index, donor_page_index;</div><div class='del'>-		int offset_in_page;</div><div class='del'>-		int unwritten, cur_len;</div><div class='add'>+	mext.orig_inode = orig_inode;</div><div class='add'>+	mext.donor_inode = donor_inode;</div><div class='add'>+	while (len) {</div><div class='add'>+		mext.orig_map.m_lblk = orig_blk;</div><div class='add'>+		mext.orig_map.m_len = len;</div><div class='add'>+		mext.orig_map.m_flags = 0;</div><div class='add'>+		mext.donor_lblk = donor_blk;</div><div class='ctx'> </div><div class='del'>-		ret = get_ext_path(orig_inode, o_start, &amp;path);</div><div class='del'>-		if (ret)</div><div class='add'>+		ret = ext4_map_blocks(NULL, orig_inode, &amp;mext.orig_map, 0);</div><div class='add'>+		if (ret &lt; 0)</div><div class='ctx'> 			goto out;</div><div class='del'>-		ex = path[path-&gt;p_depth].p_ext;</div><div class='del'>-		next_blk = ext4_ext_next_allocated_block(path);</div><div class='del'>-		cur_blk = le32_to_cpu(ex-&gt;ee_block);</div><div class='del'>-		cur_len = ext4_ext_get_actual_len(ex);</div><div class='del'>-		/* Check hole before the start pos */</div><div class='del'>-		if (cur_blk + cur_len - 1 &lt; o_start) {</div><div class='del'>-			if (next_blk == EXT_MAX_BLOCKS) {</div><div class='del'>-				o_start = o_end;</div><div class='del'>-				ret = -ENODATA;</div><div class='del'>-				goto out;</div><div class='add'>+</div><div class='add'>+		/* Skip moving if it is a hole or a delalloc extent. */</div><div class='add'>+		if (mext.orig_map.m_flags &amp;</div><div class='add'>+		    (EXT4_MAP_MAPPED | EXT4_MAP_UNWRITTEN)) {</div><div class='add'>+			ret = mext_move_extent(&amp;mext, &amp;m_len);</div><div class='add'>+			*moved_len += m_len;</div><div class='add'>+			if (!ret)</div><div class='add'>+				goto next;</div><div class='add'>+</div><div class='add'>+			/* Move failed or partially failed. */</div><div class='add'>+			if (m_len) {</div><div class='add'>+				orig_blk += m_len;</div><div class='add'>+				donor_blk += m_len;</div><div class='add'>+				len -= m_len;</div><div class='ctx'> 			}</div><div class='del'>-			d_start += next_blk - o_start;</div><div class='del'>-			o_start = next_blk;</div><div class='del'>-			continue;</div><div class='del'>-		/* Check hole after the start pos */</div><div class='del'>-		} else if (cur_blk &gt; o_start) {</div><div class='del'>-			/* Skip hole */</div><div class='del'>-			d_start += cur_blk - o_start;</div><div class='del'>-			o_start = cur_blk;</div><div class='del'>-			/* Extent inside requested range ?*/</div><div class='del'>-			if (cur_blk &gt;= o_end)</div><div class='del'>-				goto out;</div><div class='del'>-		} else { /* in_range(o_start, o_blk, o_len) */</div><div class='del'>-			cur_len += cur_blk - o_start;</div><div class='add'>+			if (ret == -ESTALE)</div><div class='add'>+				continue;</div><div class='add'>+			if (ret == -ENOSPC &amp;&amp;</div><div class='add'>+			    ext4_should_retry_alloc(sb, &amp;retries))</div><div class='add'>+				continue;</div><div class='add'>+			if (ret == -EBUSY &amp;&amp;</div><div class='add'>+			    sbi-&gt;s_journal &amp;&amp; retries++ &lt; 4 &amp;&amp;</div><div class='add'>+			    jbd2_journal_force_commit_nested(sbi-&gt;s_journal))</div><div class='add'>+				continue;</div><div class='add'>+</div><div class='add'>+			goto out;</div><div class='ctx'> 		}</div><div class='del'>-		unwritten = ext4_ext_is_unwritten(ex);</div><div class='del'>-		if (o_end - o_start &lt; cur_len)</div><div class='del'>-			cur_len = o_end - o_start;</div><div class='del'>-</div><div class='del'>-		orig_page_index = o_start &gt;&gt; (PAGE_SHIFT -</div><div class='del'>-					       orig_inode-&gt;i_blkbits);</div><div class='del'>-		donor_page_index = d_start &gt;&gt; (PAGE_SHIFT -</div><div class='del'>-					       donor_inode-&gt;i_blkbits);</div><div class='del'>-		offset_in_page = o_start % blocks_per_page;</div><div class='del'>-		if (cur_len &gt; blocks_per_page- offset_in_page)</div><div class='del'>-			cur_len = blocks_per_page - offset_in_page;</div><div class='del'>-		/*</div><div class='del'>-		 * Up semaphore to avoid following problems:</div><div class='del'>-		 * a. transaction deadlock among ext4_journal_start,</div><div class='del'>-		 *    -&gt;write_begin via pagefault, and jbd2_journal_commit</div><div class='del'>-		 * b. racing with -&gt;readpage, -&gt;write_begin, and ext4_get_block</div><div class='del'>-		 *    in move_extent_per_page</div><div class='del'>-		 */</div><div class='del'>-		ext4_double_up_write_data_sem(orig_inode, donor_inode);</div><div class='del'>-		/* Swap original branches with new branches */</div><div class='del'>-		move_extent_per_page(o_filp, donor_inode,</div><div class='del'>-				     orig_page_index, donor_page_index,</div><div class='del'>-				     offset_in_page, cur_len,</div><div class='del'>-				     unwritten, &amp;ret);</div><div class='del'>-		ext4_double_down_write_data_sem(orig_inode, donor_inode);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			break;</div><div class='del'>-		o_start += cur_len;</div><div class='del'>-		d_start += cur_len;</div><div class='add'>+next:</div><div class='add'>+		orig_blk += mext.orig_map.m_len;</div><div class='add'>+		donor_blk += mext.orig_map.m_len;</div><div class='add'>+		len -= mext.orig_map.m_len;</div><div class='add'>+		retries = 0;</div><div class='ctx'> 	}</div><div class='del'>-	*moved_len = o_start - orig_blk;</div><div class='del'>-	if (*moved_len &gt; len)</div><div class='del'>-		*moved_len = len;</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	if (*moved_len) {</div><div class='del'>-		ext4_discard_preallocations(orig_inode, 0);</div><div class='del'>-		ext4_discard_preallocations(donor_inode, 0);</div><div class='add'>+		ext4_discard_preallocations(orig_inode);</div><div class='add'>+		ext4_discard_preallocations(donor_inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ext4_ext_drop_refs(path);</div><div class='del'>-	kfree(path);</div><div class='del'>-	ext4_double_up_write_data_sem(orig_inode, donor_inode);</div><div class='ctx'> 	unlock_two_nondirectories(orig_inode, donor_inode);</div><div class='del'>-</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/ext4/namei.c b/fs/ext4/namei.c<br/>index 52c9bd154122..c4b5e252af0e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/namei.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/namei.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/namei.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/namei.c</a></div><div class='hunk'>@@ -54,6 +54,7 @@ static struct buffer_head *ext4_append(handle_t *handle,</div><div class='ctx'> 					struct inode *inode,</div><div class='ctx'> 					ext4_lblk_t *block)</div><div class='ctx'> {</div><div class='add'>+	struct ext4_map_blocks map;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='hunk'>@@ -63,21 +64,41 @@ static struct buffer_head *ext4_append(handle_t *handle,</div><div class='ctx'> 		return ERR_PTR(-ENOSPC);</div><div class='ctx'> </div><div class='ctx'> 	*block = inode-&gt;i_size &gt;&gt; inode-&gt;i_sb-&gt;s_blocksize_bits;</div><div class='add'>+	map.m_lblk = *block;</div><div class='add'>+	map.m_len = 1;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We're appending new directory block. Make sure the block is not</div><div class='add'>+	 * allocated yet, otherwise we will end up corrupting the</div><div class='add'>+	 * directory.</div><div class='add'>+	 */</div><div class='add'>+	err = ext4_map_blocks(NULL, inode, &amp;map, 0);</div><div class='add'>+	if (err &lt; 0)</div><div class='add'>+		return ERR_PTR(err);</div><div class='add'>+	if (err) {</div><div class='add'>+		EXT4_ERROR_INODE(inode, "Logical block already allocated");</div><div class='add'>+		return ERR_PTR(-EFSCORRUPTED);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	bh = ext4_bread(handle, inode, *block, EXT4_GET_BLOCKS_CREATE);</div><div class='ctx'> 	if (IS_ERR(bh))</div><div class='ctx'> 		return bh;</div><div class='ctx'> 	inode-&gt;i_size += inode-&gt;i_sb-&gt;s_blocksize;</div><div class='ctx'> 	EXT4_I(inode)-&gt;i_disksize = inode-&gt;i_size;</div><div class='add'>+	err = ext4_mark_inode_dirty(handle, inode);</div><div class='add'>+	if (err)</div><div class='add'>+		goto out;</div><div class='ctx'> 	BUFFER_TRACE(bh, "get_write_access");</div><div class='ctx'> 	err = ext4_journal_get_write_access(handle, inode-&gt;i_sb, bh,</div><div class='ctx'> 					    EXT4_JTR_NONE);</div><div class='del'>-	if (err) {</div><div class='del'>-		brelse(bh);</div><div class='del'>-		ext4_std_error(inode-&gt;i_sb, err);</div><div class='del'>-		return ERR_PTR(err);</div><div class='del'>-	}</div><div class='add'>+	if (err)</div><div class='add'>+		goto out;</div><div class='ctx'> 	return bh;</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	brelse(bh);</div><div class='add'>+	ext4_std_error(inode-&gt;i_sb, err);</div><div class='add'>+	return ERR_PTR(err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ext4_dx_csum_verify(struct inode *inode,</div><div class='hunk'>@@ -110,6 +131,13 @@ static struct buffer_head *__ext4_read_dirblock(struct inode *inode,</div><div class='ctx'> 	struct ext4_dir_entry *dirent;</div><div class='ctx'> 	int is_dx_block = 0;</div><div class='ctx'> </div><div class='add'>+	if (block &gt;= inode-&gt;i_size &gt;&gt; inode-&gt;i_blkbits) {</div><div class='add'>+		ext4_error_inode(inode, func, line, block,</div><div class='add'>+		       "Attempting to read directory block (%u) that is past i_size (%llu)",</div><div class='add'>+		       block, inode-&gt;i_size);</div><div class='add'>+		return ERR_PTR(-EFSCORRUPTED);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (ext4_simulate_fail(inode-&gt;i_sb, EXT4_SIM_DIRBLOCK_EIO))</div><div class='ctx'> 		bh = ERR_PTR(-EIO);</div><div class='ctx'> 	else</div><div class='hunk'>@@ -123,10 +151,11 @@ static struct buffer_head *__ext4_read_dirblock(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 		return bh;</div><div class='ctx'> 	}</div><div class='del'>-	if (!bh &amp;&amp; (type == INDEX || type == DIRENT_HTREE)) {</div><div class='add'>+	/* The first directory block must not be a hole. */</div><div class='add'>+	if (!bh &amp;&amp; (type == INDEX || type == DIRENT_HTREE || block == 0)) {</div><div class='ctx'> 		ext4_error_inode(inode, func, line, block,</div><div class='del'>-				 "Directory hole found for htree %s block",</div><div class='del'>-				 (type == INDEX) ? "index" : "leaf");</div><div class='add'>+				 "Directory hole found for htree %s block %u",</div><div class='add'>+				 (type == INDEX) ? "index" : "leaf", block);</div><div class='ctx'> 		return ERR_PTR(-EFSCORRUPTED);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!bh)</div><div class='hunk'>@@ -147,7 +176,7 @@ static struct buffer_head *__ext4_read_dirblock(struct inode *inode,</div><div class='ctx'> 		brelse(bh);</div><div class='ctx'> 		return ERR_PTR(-EFSCORRUPTED);</div><div class='ctx'> 	}</div><div class='del'>-	if (!ext4_has_metadata_csum(inode-&gt;i_sb) ||</div><div class='add'>+	if (!ext4_has_feature_metadata_csum(inode-&gt;i_sb) ||</div><div class='ctx'> 	    buffer_verified(bh))</div><div class='ctx'> 		return bh;</div><div class='ctx'> </div><div class='hunk'>@@ -262,36 +291,6 @@ struct dx_tail {</div><div class='ctx'> 	__le32 dt_checksum;	/* crc32c(uuid+inum+dirblock) */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static inline ext4_lblk_t dx_get_block(struct dx_entry *entry);</div><div class='del'>-static void dx_set_block(struct dx_entry *entry, ext4_lblk_t value);</div><div class='del'>-static inline unsigned dx_get_hash(struct dx_entry *entry);</div><div class='del'>-static void dx_set_hash(struct dx_entry *entry, unsigned value);</div><div class='del'>-static unsigned dx_get_count(struct dx_entry *entries);</div><div class='del'>-static unsigned dx_get_limit(struct dx_entry *entries);</div><div class='del'>-static void dx_set_count(struct dx_entry *entries, unsigned value);</div><div class='del'>-static void dx_set_limit(struct dx_entry *entries, unsigned value);</div><div class='del'>-static unsigned dx_root_limit(struct inode *dir, unsigned infosize);</div><div class='del'>-static unsigned dx_node_limit(struct inode *dir);</div><div class='del'>-static struct dx_frame *dx_probe(struct ext4_filename *fname,</div><div class='del'>-				 struct inode *dir,</div><div class='del'>-				 struct dx_hash_info *hinfo,</div><div class='del'>-				 struct dx_frame *frame);</div><div class='del'>-static void dx_release(struct dx_frame *frames);</div><div class='del'>-static int dx_make_map(struct inode *dir, struct ext4_dir_entry_2 *de,</div><div class='del'>-		       unsigned blocksize, struct dx_hash_info *hinfo,</div><div class='del'>-		       struct dx_map_entry map[]);</div><div class='del'>-static void dx_sort_map(struct dx_map_entry *map, unsigned count);</div><div class='del'>-static struct ext4_dir_entry_2 *dx_move_dirents(struct inode *dir, char *from,</div><div class='del'>-					char *to, struct dx_map_entry *offsets,</div><div class='del'>-					int count, unsigned int blocksize);</div><div class='del'>-static struct ext4_dir_entry_2 *dx_pack_dirents(struct inode *dir, char *base,</div><div class='del'>-						unsigned int blocksize);</div><div class='del'>-static void dx_insert_block(struct dx_frame *frame,</div><div class='del'>-					u32 hash, ext4_lblk_t block);</div><div class='del'>-static int ext4_htree_next_block(struct inode *dir, __u32 hash,</div><div class='del'>-				 struct dx_frame *frame,</div><div class='del'>-				 struct dx_frame *frames,</div><div class='del'>-				 __u32 *start_hash);</div><div class='ctx'> static struct buffer_head * ext4_dx_find_entry(struct inode *dir,</div><div class='ctx'> 		struct ext4_filename *fname,</div><div class='ctx'> 		struct ext4_dir_entry_2 **res_dir);</div><div class='hunk'>@@ -315,17 +314,17 @@ static struct ext4_dir_entry_tail *get_dirent_tail(struct inode *inode,</div><div class='ctx'> 						   struct buffer_head *bh)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_dir_entry_tail *t;</div><div class='add'>+	int blocksize = EXT4_BLOCK_SIZE(inode-&gt;i_sb);</div><div class='ctx'> </div><div class='ctx'> #ifdef PARANOID</div><div class='ctx'> 	struct ext4_dir_entry *d, *top;</div><div class='ctx'> </div><div class='ctx'> 	d = (struct ext4_dir_entry *)bh-&gt;b_data;</div><div class='ctx'> 	top = (struct ext4_dir_entry *)(bh-&gt;b_data +</div><div class='del'>-		(EXT4_BLOCK_SIZE(inode-&gt;i_sb) -</div><div class='del'>-		 sizeof(struct ext4_dir_entry_tail)));</div><div class='del'>-	while (d &lt; top &amp;&amp; d-&gt;rec_len)</div><div class='add'>+		(blocksize - sizeof(struct ext4_dir_entry_tail)));</div><div class='add'>+	while (d &lt; top &amp;&amp; ext4_rec_len_from_disk(d-&gt;rec_len, blocksize))</div><div class='ctx'> 		d = (struct ext4_dir_entry *)(((void *)d) +</div><div class='del'>-		    le16_to_cpu(d-&gt;rec_len));</div><div class='add'>+		    ext4_rec_len_from_disk(d-&gt;rec_len, blocksize));</div><div class='ctx'> </div><div class='ctx'> 	if (d != top)</div><div class='ctx'> 		return NULL;</div><div class='hunk'>@@ -336,7 +335,8 @@ static struct ext4_dir_entry_tail *get_dirent_tail(struct inode *inode,</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> 	if (t-&gt;det_reserved_zero1 ||</div><div class='del'>-	    le16_to_cpu(t-&gt;det_rec_len) != sizeof(struct ext4_dir_entry_tail) ||</div><div class='add'>+	    (ext4_rec_len_from_disk(t-&gt;det_rec_len, blocksize) !=</div><div class='add'>+	     sizeof(struct ext4_dir_entry_tail)) ||</div><div class='ctx'> 	    t-&gt;det_reserved_zero2 ||</div><div class='ctx'> 	    t-&gt;det_reserved_ft != EXT4_FT_DIR_CSUM)</div><div class='ctx'> 		return NULL;</div><div class='hunk'>@@ -346,11 +346,10 @@ static struct ext4_dir_entry_tail *get_dirent_tail(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> static __le32 ext4_dirblock_csum(struct inode *inode, void *dirent, int size)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_sb_info *sbi = EXT4_SB(inode-&gt;i_sb);</div><div class='ctx'> 	struct ext4_inode_info *ei = EXT4_I(inode);</div><div class='ctx'> 	__u32 csum;</div><div class='ctx'> </div><div class='del'>-	csum = ext4_chksum(sbi, ei-&gt;i_csum_seed, (__u8 *)dirent, size);</div><div class='add'>+	csum = ext4_chksum(ei-&gt;i_csum_seed, (__u8 *)dirent, size);</div><div class='ctx'> 	return cpu_to_le32(csum);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -368,7 +367,7 @@ int ext4_dirblock_csum_verify(struct inode *inode, struct buffer_head *bh)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_dir_entry_tail *t;</div><div class='ctx'> </div><div class='del'>-	if (!ext4_has_metadata_csum(inode-&gt;i_sb))</div><div class='add'>+	if (!ext4_has_feature_metadata_csum(inode-&gt;i_sb))</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='ctx'> 	t = get_dirent_tail(inode, bh);</div><div class='hunk'>@@ -389,7 +388,7 @@ static void ext4_dirblock_csum_set(struct inode *inode,</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_dir_entry_tail *t;</div><div class='ctx'> </div><div class='del'>-	if (!ext4_has_metadata_csum(inode-&gt;i_sb))</div><div class='add'>+	if (!ext4_has_feature_metadata_csum(inode-&gt;i_sb))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	t = get_dirent_tail(inode, bh);</div><div class='hunk'>@@ -417,13 +416,14 @@ static struct dx_countlimit *get_dx_countlimit(struct inode *inode,</div><div class='ctx'> 	struct ext4_dir_entry *dp;</div><div class='ctx'> 	struct dx_root_info *root;</div><div class='ctx'> 	int count_offset;</div><div class='add'>+	int blocksize = EXT4_BLOCK_SIZE(inode-&gt;i_sb);</div><div class='add'>+	unsigned int rlen = ext4_rec_len_from_disk(dirent-&gt;rec_len, blocksize);</div><div class='ctx'> </div><div class='del'>-	if (le16_to_cpu(dirent-&gt;rec_len) == EXT4_BLOCK_SIZE(inode-&gt;i_sb))</div><div class='add'>+	if (rlen == blocksize)</div><div class='ctx'> 		count_offset = 8;</div><div class='del'>-	else if (le16_to_cpu(dirent-&gt;rec_len) == 12) {</div><div class='add'>+	else if (rlen == 12) {</div><div class='ctx'> 		dp = (struct ext4_dir_entry *)(((void *)dirent) + 12);</div><div class='del'>-		if (le16_to_cpu(dp-&gt;rec_len) !=</div><div class='del'>-		    EXT4_BLOCK_SIZE(inode-&gt;i_sb) - 12)</div><div class='add'>+		if (ext4_rec_len_from_disk(dp-&gt;rec_len, blocksize) != blocksize - 12)</div><div class='ctx'> 			return NULL;</div><div class='ctx'> 		root = (struct dx_root_info *)(((void *)dp + 12));</div><div class='ctx'> 		if (root-&gt;reserved_zero ||</div><div class='hunk'>@@ -441,7 +441,6 @@ static struct dx_countlimit *get_dx_countlimit(struct inode *inode,</div><div class='ctx'> static __le32 ext4_dx_csum(struct inode *inode, struct ext4_dir_entry *dirent,</div><div class='ctx'> 			   int count_offset, int count, struct dx_tail *t)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_sb_info *sbi = EXT4_SB(inode-&gt;i_sb);</div><div class='ctx'> 	struct ext4_inode_info *ei = EXT4_I(inode);</div><div class='ctx'> 	__u32 csum;</div><div class='ctx'> 	int size;</div><div class='hunk'>@@ -449,9 +448,9 @@ static __le32 ext4_dx_csum(struct inode *inode, struct ext4_dir_entry *dirent,</div><div class='ctx'> 	int offset = offsetof(struct dx_tail, dt_checksum);</div><div class='ctx'> </div><div class='ctx'> 	size = count_offset + (count * sizeof(struct dx_entry));</div><div class='del'>-	csum = ext4_chksum(sbi, ei-&gt;i_csum_seed, (__u8 *)dirent, size);</div><div class='del'>-	csum = ext4_chksum(sbi, csum, (__u8 *)t, offset);</div><div class='del'>-	csum = ext4_chksum(sbi, csum, (__u8 *)&amp;dummy_csum, sizeof(dummy_csum));</div><div class='add'>+	csum = ext4_chksum(ei-&gt;i_csum_seed, (__u8 *)dirent, size);</div><div class='add'>+	csum = ext4_chksum(csum, (__u8 *)t, offset);</div><div class='add'>+	csum = ext4_chksum(csum, (__u8 *)&amp;dummy_csum, sizeof(dummy_csum));</div><div class='ctx'> </div><div class='ctx'> 	return cpu_to_le32(csum);</div><div class='ctx'> }</div><div class='hunk'>@@ -463,7 +462,7 @@ static int ext4_dx_csum_verify(struct inode *inode,</div><div class='ctx'> 	struct dx_tail *t;</div><div class='ctx'> 	int count_offset, limit, count;</div><div class='ctx'> </div><div class='del'>-	if (!ext4_has_metadata_csum(inode-&gt;i_sb))</div><div class='add'>+	if (!ext4_has_feature_metadata_csum(inode-&gt;i_sb))</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='ctx'> 	c = get_dx_countlimit(inode, dirent, &amp;count_offset);</div><div class='hunk'>@@ -492,7 +491,7 @@ static void ext4_dx_csum_set(struct inode *inode, struct ext4_dir_entry *dirent)</div><div class='ctx'> 	struct dx_tail *t;</div><div class='ctx'> 	int count_offset, limit, count;</div><div class='ctx'> </div><div class='del'>-	if (!ext4_has_metadata_csum(inode-&gt;i_sb))</div><div class='add'>+	if (!ext4_has_feature_metadata_csum(inode-&gt;i_sb))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	c = get_dx_countlimit(inode, dirent, &amp;count_offset);</div><div class='hunk'>@@ -581,7 +580,7 @@ static inline unsigned dx_root_limit(struct inode *dir, unsigned infosize)</div><div class='ctx'> 			ext4_dir_rec_len(1, NULL) -</div><div class='ctx'> 			ext4_dir_rec_len(2, NULL) - infosize;</div><div class='ctx'> </div><div class='del'>-	if (ext4_has_metadata_csum(dir-&gt;i_sb))</div><div class='add'>+	if (ext4_has_feature_metadata_csum(dir-&gt;i_sb))</div><div class='ctx'> 		entry_space -= sizeof(struct dx_tail);</div><div class='ctx'> 	return entry_space / sizeof(struct dx_entry);</div><div class='ctx'> }</div><div class='hunk'>@@ -591,7 +590,7 @@ static inline unsigned dx_node_limit(struct inode *dir)</div><div class='ctx'> 	unsigned int entry_space = dir-&gt;i_sb-&gt;s_blocksize -</div><div class='ctx'> 			ext4_dir_rec_len(0, dir);</div><div class='ctx'> </div><div class='del'>-	if (ext4_has_metadata_csum(dir-&gt;i_sb))</div><div class='add'>+	if (ext4_has_feature_metadata_csum(dir-&gt;i_sb))</div><div class='ctx'> 		entry_space -= sizeof(struct dx_tail);</div><div class='ctx'> 	return entry_space / sizeof(struct dx_entry);</div><div class='ctx'> }</div><div class='hunk'>@@ -646,7 +645,7 @@ static struct stats dx_show_leaf(struct inode *dir,</div><div class='ctx'> 				len = de-&gt;name_len;</div><div class='ctx'> 				if (!IS_ENCRYPTED(dir)) {</div><div class='ctx'> 					/* Directory is not encrypted */</div><div class='del'>-					ext4fs_dirhash(dir, de-&gt;name,</div><div class='add'>+					(void) ext4fs_dirhash(dir, de-&gt;name,</div><div class='ctx'> 						de-&gt;name_len, &amp;h);</div><div class='ctx'> 					printk("%*.s:(U)%x.%u ", len,</div><div class='ctx'> 					       name, h.hash,</div><div class='hunk'>@@ -681,8 +680,9 @@ static struct stats dx_show_leaf(struct inode *dir,</div><div class='ctx'> 					if (IS_CASEFOLDED(dir))</div><div class='ctx'> 						h.hash = EXT4_DIRENT_HASH(de);</div><div class='ctx'> 					else</div><div class='del'>-						ext4fs_dirhash(dir, de-&gt;name,</div><div class='del'>-						       de-&gt;name_len, &amp;h);</div><div class='add'>+						(void) ext4fs_dirhash(dir,</div><div class='add'>+							de-&gt;name,</div><div class='add'>+							de-&gt;name_len, &amp;h);</div><div class='ctx'> 					printk("%*.s:(E)%x.%u ", len, name,</div><div class='ctx'> 					       h.hash, (unsigned) ((char *) de</div><div class='ctx'> 								   - base));</div><div class='hunk'>@@ -692,7 +692,8 @@ static struct stats dx_show_leaf(struct inode *dir,</div><div class='ctx'> #else</div><div class='ctx'> 				int len = de-&gt;name_len;</div><div class='ctx'> 				char *name = de-&gt;name;</div><div class='del'>-				ext4fs_dirhash(dir, de-&gt;name, de-&gt;name_len, &amp;h);</div><div class='add'>+				(void) ext4fs_dirhash(dir, de-&gt;name,</div><div class='add'>+						      de-&gt;name_len, &amp;h);</div><div class='ctx'> 				printk("%*.s:%x.%u ", len, name, h.hash,</div><div class='ctx'> 				       (unsigned) ((char *) de - base));</div><div class='ctx'> #endif</div><div class='hunk'>@@ -777,12 +778,14 @@ static struct dx_frame *</div><div class='ctx'> dx_probe(struct ext4_filename *fname, struct inode *dir,</div><div class='ctx'> 	 struct dx_hash_info *hinfo, struct dx_frame *frame_in)</div><div class='ctx'> {</div><div class='del'>-	unsigned count, indirect;</div><div class='add'>+	unsigned count, indirect, level, i;</div><div class='ctx'> 	struct dx_entry *at, *entries, *p, *q, *m;</div><div class='ctx'> 	struct dx_root *root;</div><div class='ctx'> 	struct dx_frame *frame = frame_in;</div><div class='ctx'> 	struct dx_frame *ret_err = ERR_PTR(ERR_BAD_DX_DIR);</div><div class='ctx'> 	u32 hash;</div><div class='add'>+	ext4_lblk_t block;</div><div class='add'>+	ext4_lblk_t blocks[EXT4_HTREE_LEVEL];</div><div class='ctx'> </div><div class='ctx'> 	memset(frame_in, 0, EXT4_HTREE_LEVEL * sizeof(frame_in[0]));</div><div class='ctx'> 	frame-&gt;bh = ext4_read_dirblock(dir, 0, INDEX);</div><div class='hunk'>@@ -819,8 +822,14 @@ dx_probe(struct ext4_filename *fname, struct inode *dir,</div><div class='ctx'> 	hinfo-&gt;seed = EXT4_SB(dir-&gt;i_sb)-&gt;s_hash_seed;</div><div class='ctx'> 	/* hash is already computed for encrypted casefolded directory */</div><div class='ctx'> 	if (fname &amp;&amp; fname_name(fname) &amp;&amp;</div><div class='del'>-				!(IS_ENCRYPTED(dir) &amp;&amp; IS_CASEFOLDED(dir)))</div><div class='del'>-		ext4fs_dirhash(dir, fname_name(fname), fname_len(fname), hinfo);</div><div class='add'>+	    !(IS_ENCRYPTED(dir) &amp;&amp; IS_CASEFOLDED(dir))) {</div><div class='add'>+		int ret = ext4fs_dirhash(dir, fname_name(fname),</div><div class='add'>+					 fname_len(fname), hinfo);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			ret_err = ERR_PTR(ret);</div><div class='add'>+			goto fail;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> 	hash = hinfo-&gt;hash;</div><div class='ctx'> </div><div class='ctx'> 	if (root-&gt;info.unused_flags &amp; 1) {</div><div class='hunk'>@@ -854,6 +863,8 @@ dx_probe(struct ext4_filename *fname, struct inode *dir,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	dxtrace(printk("Look up %x", hash));</div><div class='add'>+	level = 0;</div><div class='add'>+	blocks[0] = 0;</div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		count = dx_get_count(entries);</div><div class='ctx'> 		if (!count || count &gt; dx_get_limit(entries)) {</div><div class='hunk'>@@ -882,15 +893,27 @@ dx_probe(struct ext4_filename *fname, struct inode *dir,</div><div class='ctx'> 			       dx_get_block(at)));</div><div class='ctx'> 		frame-&gt;entries = entries;</div><div class='ctx'> 		frame-&gt;at = at;</div><div class='del'>-		if (!indirect--)</div><div class='add'>+</div><div class='add'>+		block = dx_get_block(at);</div><div class='add'>+		for (i = 0; i &lt;= level; i++) {</div><div class='add'>+			if (blocks[i] == block) {</div><div class='add'>+				ext4_warning_inode(dir,</div><div class='add'>+					"dx entry: tree cycle block %u points back to block %u",</div><div class='add'>+					blocks[level], block);</div><div class='add'>+				goto fail;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+		if (++level &gt; indirect)</div><div class='ctx'> 			return frame;</div><div class='add'>+		blocks[level] = block;</div><div class='ctx'> 		frame++;</div><div class='del'>-		frame-&gt;bh = ext4_read_dirblock(dir, dx_get_block(at), INDEX);</div><div class='add'>+		frame-&gt;bh = ext4_read_dirblock(dir, block, INDEX);</div><div class='ctx'> 		if (IS_ERR(frame-&gt;bh)) {</div><div class='ctx'> 			ret_err = (struct dx_frame *) frame-&gt;bh;</div><div class='ctx'> 			frame-&gt;bh = NULL;</div><div class='ctx'> 			goto fail;</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='ctx'> 		entries = ((struct dx_node *) frame-&gt;bh-&gt;b_data)-&gt;entries;</div><div class='ctx'> </div><div class='ctx'> 		if (dx_get_limit(entries) != dx_node_limit(dir)) {</div><div class='hunk'>@@ -1021,7 +1044,7 @@ static int htree_dirblock_to_tree(struct file *dir_file,</div><div class='ctx'> 	struct ext4_dir_entry_2 *de, *top;</div><div class='ctx'> 	int err = 0, count = 0;</div><div class='ctx'> 	struct fscrypt_str fname_crypto_str = FSTR_INIT(NULL, 0), tmp_str;</div><div class='del'>-	int csum = ext4_has_metadata_csum(dir-&gt;i_sb);</div><div class='add'>+	int csum = ext4_has_feature_metadata_csum(dir-&gt;i_sb);</div><div class='ctx'> </div><div class='ctx'> 	dxtrace(printk(KERN_INFO "In htree dirblock_to_tree: block %lu\n",</div><div class='ctx'> 							(unsigned long)block));</div><div class='hunk'>@@ -1053,7 +1076,7 @@ static int htree_dirblock_to_tree(struct file *dir_file,</div><div class='ctx'> 	for (; de &lt; top; de = ext4_next_entry(de, dir-&gt;i_sb-&gt;s_blocksize)) {</div><div class='ctx'> 		if (ext4_check_dir_entry(dir, NULL, de, bh,</div><div class='ctx'> 				bh-&gt;b_data, bh-&gt;b_size,</div><div class='del'>-				(block&lt;&lt;EXT4_BLOCK_SIZE_BITS(dir-&gt;i_sb))</div><div class='add'>+				EXT4_LBLK_TO_B(dir, block)</div><div class='ctx'> 					 + ((char *)de - bh-&gt;b_data))) {</div><div class='ctx'> 			/* silently ignore the rest of the block */</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -1067,7 +1090,12 @@ static int htree_dirblock_to_tree(struct file *dir_file,</div><div class='ctx'> 				hinfo-&gt;minor_hash = 0;</div><div class='ctx'> 			}</div><div class='ctx'> 		} else {</div><div class='del'>-			ext4fs_dirhash(dir, de-&gt;name, de-&gt;name_len, hinfo);</div><div class='add'>+			err = ext4fs_dirhash(dir, de-&gt;name,</div><div class='add'>+					     de-&gt;name_len, hinfo);</div><div class='add'>+			if (err &lt; 0) {</div><div class='add'>+				count = err;</div><div class='add'>+				goto errout;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> 		if ((hinfo-&gt;hash &lt; start_hash) ||</div><div class='ctx'> 		    ((hinfo-&gt;hash == start_hash) &amp;&amp;</div><div class='hunk'>@@ -1249,28 +1277,41 @@ static inline int search_dirblock(struct buffer_head *bh,</div><div class='ctx'>  * Create map of hash values, offsets, and sizes, stored at end of block.</div><div class='ctx'>  * Returns number of entries mapped.</div><div class='ctx'>  */</div><div class='del'>-static int dx_make_map(struct inode *dir, struct ext4_dir_entry_2 *de,</div><div class='del'>-		       unsigned blocksize, struct dx_hash_info *hinfo,</div><div class='add'>+static int dx_make_map(struct inode *dir, struct buffer_head *bh,</div><div class='add'>+		       struct dx_hash_info *hinfo,</div><div class='ctx'> 		       struct dx_map_entry *map_tail)</div><div class='ctx'> {</div><div class='ctx'> 	int count = 0;</div><div class='del'>-	char *base = (char *) de;</div><div class='add'>+	struct ext4_dir_entry_2 *de = (struct ext4_dir_entry_2 *)bh-&gt;b_data;</div><div class='add'>+	unsigned int buflen = bh-&gt;b_size;</div><div class='add'>+	char *base = bh-&gt;b_data;</div><div class='ctx'> 	struct dx_hash_info h = *hinfo;</div><div class='add'>+	int blocksize = EXT4_BLOCK_SIZE(dir-&gt;i_sb);</div><div class='add'>+</div><div class='add'>+	if (ext4_has_feature_metadata_csum(dir-&gt;i_sb))</div><div class='add'>+		buflen -= sizeof(struct ext4_dir_entry_tail);</div><div class='ctx'> </div><div class='del'>-	while ((char *) de &lt; base + blocksize) {</div><div class='add'>+	while ((char *) de &lt; base + buflen) {</div><div class='add'>+		if (ext4_check_dir_entry(dir, NULL, de, bh, base, buflen,</div><div class='add'>+					 ((char *)de) - base))</div><div class='add'>+			return -EFSCORRUPTED;</div><div class='ctx'> 		if (de-&gt;name_len &amp;&amp; de-&gt;inode) {</div><div class='ctx'> 			if (ext4_hash_in_dirent(dir))</div><div class='ctx'> 				h.hash = EXT4_DIRENT_HASH(de);</div><div class='del'>-			else</div><div class='del'>-				ext4fs_dirhash(dir, de-&gt;name, de-&gt;name_len, &amp;h);</div><div class='add'>+			else {</div><div class='add'>+				int err = ext4fs_dirhash(dir, de-&gt;name,</div><div class='add'>+						     de-&gt;name_len, &amp;h);</div><div class='add'>+				if (err &lt; 0)</div><div class='add'>+					return err;</div><div class='add'>+			}</div><div class='ctx'> 			map_tail--;</div><div class='ctx'> 			map_tail-&gt;hash = h.hash;</div><div class='ctx'> 			map_tail-&gt;offs = ((char *) de - base)&gt;&gt;2;</div><div class='del'>-			map_tail-&gt;size = le16_to_cpu(de-&gt;rec_len);</div><div class='add'>+			map_tail-&gt;size = ext4_rec_len_from_disk(de-&gt;rec_len,</div><div class='add'>+								blocksize);</div><div class='ctx'> 			count++;</div><div class='ctx'> 			cond_resched();</div><div class='ctx'> 		}</div><div class='del'>-		/* XXX: do we need to check rec_len == 0 case? -Chris */</div><div class='ctx'> 		de = ext4_next_entry(de, blocksize);</div><div class='ctx'> 	}</div><div class='ctx'> 	return count;</div><div class='hunk'>@@ -1317,94 +1358,42 @@ static void dx_insert_block(struct dx_frame *frame, u32 hash, ext4_lblk_t block)</div><div class='ctx'> 	dx_set_count(entries, count + 1);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='del'>-/*</div><div class='del'>- * Test whether a case-insensitive directory entry matches the filename</div><div class='del'>- * being searched for.  If quick is set, assume the name being looked up</div><div class='del'>- * is already in the casefolded form.</div><div class='del'>- *</div><div class='del'>- * Returns: 0 if the directory entry matches, more than 0 if it</div><div class='del'>- * doesn't match or less than zero on error.</div><div class='del'>- */</div><div class='del'>-static int ext4_ci_compare(const struct inode *parent, const struct qstr *name,</div><div class='del'>-			   u8 *de_name, size_t de_name_len, bool quick)</div><div class='del'>-{</div><div class='del'>-	const struct super_block *sb = parent-&gt;i_sb;</div><div class='del'>-	const struct unicode_map *um = sb-&gt;s_encoding;</div><div class='del'>-	struct fscrypt_str decrypted_name = FSTR_INIT(NULL, de_name_len);</div><div class='del'>-	struct qstr entry = QSTR_INIT(de_name, de_name_len);</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (IS_ENCRYPTED(parent)) {</div><div class='del'>-		const struct fscrypt_str encrypted_name =</div><div class='del'>-				FSTR_INIT(de_name, de_name_len);</div><div class='del'>-</div><div class='del'>-		decrypted_name.name = kmalloc(de_name_len, GFP_KERNEL);</div><div class='del'>-		if (!decrypted_name.name)</div><div class='del'>-			return -ENOMEM;</div><div class='del'>-		ret = fscrypt_fname_disk_to_usr(parent, 0, 0, &amp;encrypted_name,</div><div class='del'>-						&amp;decrypted_name);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			goto out;</div><div class='del'>-		entry.name = decrypted_name.name;</div><div class='del'>-		entry.len = decrypted_name.len;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (quick)</div><div class='del'>-		ret = utf8_strncasecmp_folded(um, name, &amp;entry);</div><div class='del'>-	else</div><div class='del'>-		ret = utf8_strncasecmp(um, name, &amp;entry);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		/* Handle invalid character sequence as either an error</div><div class='del'>-		 * or as an opaque byte sequence.</div><div class='del'>-		 */</div><div class='del'>-		if (sb_has_strict_encoding(sb))</div><div class='del'>-			ret = -EINVAL;</div><div class='del'>-		else if (name-&gt;len != entry.len)</div><div class='del'>-			ret = 1;</div><div class='del'>-		else</div><div class='del'>-			ret = !!memcmp(name-&gt;name, entry.name, entry.len);</div><div class='del'>-	}</div><div class='del'>-out:</div><div class='del'>-	kfree(decrypted_name.name);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='ctx'> int ext4_fname_setup_ci_filename(struct inode *dir, const struct qstr *iname,</div><div class='ctx'> 				  struct ext4_filename *name)</div><div class='ctx'> {</div><div class='del'>-	struct fscrypt_str *cf_name = &amp;name-&gt;cf_name;</div><div class='add'>+	struct qstr *cf_name = &amp;name-&gt;cf_name;</div><div class='add'>+	unsigned char *buf;</div><div class='ctx'> 	struct dx_hash_info *hinfo = &amp;name-&gt;hinfo;</div><div class='ctx'> 	int len;</div><div class='ctx'> </div><div class='del'>-	if (!IS_CASEFOLDED(dir) || !dir-&gt;i_sb-&gt;s_encoding ||</div><div class='add'>+	if (!IS_CASEFOLDED(dir) ||</div><div class='ctx'> 	    (IS_ENCRYPTED(dir) &amp;&amp; !fscrypt_has_encryption_key(dir))) {</div><div class='ctx'> 		cf_name-&gt;name = NULL;</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	cf_name-&gt;name = kmalloc(EXT4_NAME_LEN, GFP_NOFS);</div><div class='del'>-	if (!cf_name-&gt;name)</div><div class='add'>+	buf = kmalloc(EXT4_NAME_LEN, GFP_NOFS);</div><div class='add'>+	if (!buf)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	len = utf8_casefold(dir-&gt;i_sb-&gt;s_encoding,</div><div class='del'>-			    iname, cf_name-&gt;name,</div><div class='del'>-			    EXT4_NAME_LEN);</div><div class='add'>+	len = utf8_casefold(dir-&gt;i_sb-&gt;s_encoding, iname, buf, EXT4_NAME_LEN);</div><div class='ctx'> 	if (len &lt;= 0) {</div><div class='del'>-		kfree(cf_name-&gt;name);</div><div class='del'>-		cf_name-&gt;name = NULL;</div><div class='add'>+		kfree(buf);</div><div class='add'>+		buf = NULL;</div><div class='ctx'> 	}</div><div class='add'>+	cf_name-&gt;name = buf;</div><div class='ctx'> 	cf_name-&gt;len = (unsigned) len;</div><div class='add'>+</div><div class='ctx'> 	if (!IS_ENCRYPTED(dir))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	hinfo-&gt;hash_version = DX_HASH_SIPHASH;</div><div class='ctx'> 	hinfo-&gt;seed = NULL;</div><div class='ctx'> 	if (cf_name-&gt;name)</div><div class='del'>-		ext4fs_dirhash(dir, cf_name-&gt;name, cf_name-&gt;len, hinfo);</div><div class='add'>+		return ext4fs_dirhash(dir, cf_name-&gt;name, cf_name-&gt;len, hinfo);</div><div class='ctx'> 	else</div><div class='del'>-		ext4fs_dirhash(dir, iname-&gt;name, iname-&gt;len, hinfo);</div><div class='del'>-	return 0;</div><div class='add'>+		return ext4fs_dirhash(dir, iname-&gt;name, iname-&gt;len, hinfo);</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='hunk'>@@ -1428,25 +1417,33 @@ static bool ext4_match(struct inode *parent,</div><div class='ctx'> 	f.crypto_buf = fname-&gt;crypto_buf;</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='del'>-	if (parent-&gt;i_sb-&gt;s_encoding &amp;&amp; IS_CASEFOLDED(parent) &amp;&amp;</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='add'>+	if (IS_CASEFOLDED(parent) &amp;&amp;</div><div class='ctx'> 	    (!IS_ENCRYPTED(parent) || fscrypt_has_encryption_key(parent))) {</div><div class='del'>-		if (fname-&gt;cf_name.name) {</div><div class='del'>-			struct qstr cf = {.name = fname-&gt;cf_name.name,</div><div class='del'>-					  .len = fname-&gt;cf_name.len};</div><div class='del'>-			if (IS_ENCRYPTED(parent)) {</div><div class='del'>-				if (fname-&gt;hinfo.hash != EXT4_DIRENT_HASH(de) ||</div><div class='del'>-					fname-&gt;hinfo.minor_hash !=</div><div class='del'>-						EXT4_DIRENT_MINOR_HASH(de)) {</div><div class='del'>-</div><div class='del'>-					return false;</div><div class='del'>-				}</div><div class='del'>-			}</div><div class='del'>-			return !ext4_ci_compare(parent, &amp;cf, de-&gt;name,</div><div class='del'>-							de-&gt;name_len, true);</div><div class='del'>-		}</div><div class='del'>-		return !ext4_ci_compare(parent, fname-&gt;usr_fname, de-&gt;name,</div><div class='del'>-						de-&gt;name_len, false);</div><div class='add'>+		/*</div><div class='add'>+		 * Just checking IS_ENCRYPTED(parent) below is not</div><div class='add'>+		 * sufficient to decide whether one can use the hash for</div><div class='add'>+		 * skipping the string comparison, because the key might</div><div class='add'>+		 * have been added right after</div><div class='add'>+		 * ext4_fname_setup_ci_filename().  In this case, a hash</div><div class='add'>+		 * mismatch will be a false negative.  Therefore, make</div><div class='add'>+		 * sure cf_name was properly initialized before</div><div class='add'>+		 * considering the calculated hash.</div><div class='add'>+		 */</div><div class='add'>+		if (sb_no_casefold_compat_fallback(parent-&gt;i_sb) &amp;&amp;</div><div class='add'>+		    IS_ENCRYPTED(parent) &amp;&amp; fname-&gt;cf_name.name &amp;&amp;</div><div class='add'>+		    (fname-&gt;hinfo.hash != EXT4_DIRENT_HASH(de) ||</div><div class='add'>+		     fname-&gt;hinfo.minor_hash != EXT4_DIRENT_MINOR_HASH(de)))</div><div class='add'>+			return false;</div><div class='add'>+		/*</div><div class='add'>+		 * Treat comparison errors as not a match.  The</div><div class='add'>+		 * only case where it happens is on a disk</div><div class='add'>+		 * corruption or ENOMEM.</div><div class='add'>+		 */</div><div class='add'>+</div><div class='add'>+		return generic_ci_match(parent, fname-&gt;usr_fname,</div><div class='add'>+					&amp;fname-&gt;cf_name, de-&gt;name,</div><div class='add'>+					de-&gt;name_len) &gt; 0;</div><div class='ctx'> 	}</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='hunk'>@@ -1454,7 +1451,7 @@ static bool ext4_match(struct inode *parent,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Returns 0 if not found, -1 on failure, and 1 on success</div><div class='add'>+ * Returns 0 if not found, -EFSCORRUPTED on failure, and 1 on success</div><div class='ctx'>  */</div><div class='ctx'> int ext4_search_dir(struct buffer_head *bh, char *search_buf, int buf_size,</div><div class='ctx'> 		    struct inode *dir, struct ext4_filename *fname,</div><div class='hunk'>@@ -1466,16 +1463,16 @@ int ext4_search_dir(struct buffer_head *bh, char *search_buf, int buf_size,</div><div class='ctx'> </div><div class='ctx'> 	de = (struct ext4_dir_entry_2 *)search_buf;</div><div class='ctx'> 	dlimit = search_buf + buf_size;</div><div class='del'>-	while ((char *) de &lt; dlimit) {</div><div class='add'>+	while ((char *) de &lt; dlimit - EXT4_BASE_DIR_LEN) {</div><div class='ctx'> 		/* this code is executed quadratically often */</div><div class='ctx'> 		/* do minimal checking `by hand' */</div><div class='del'>-		if ((char *) de + de-&gt;name_len &lt;= dlimit &amp;&amp;</div><div class='add'>+		if (de-&gt;name + de-&gt;name_len &lt;= dlimit &amp;&amp;</div><div class='ctx'> 		    ext4_match(dir, fname, de)) {</div><div class='ctx'> 			/* found a match - just to be sure, do</div><div class='ctx'> 			 * a full check */</div><div class='ctx'> 			if (ext4_check_dir_entry(dir, NULL, de, bh, search_buf,</div><div class='ctx'> 						 buf_size, offset))</div><div class='del'>-				return -1;</div><div class='add'>+				return -EFSCORRUPTED;</div><div class='ctx'> 			*res_dir = de;</div><div class='ctx'> 			return 1;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1483,7 +1480,7 @@ int ext4_search_dir(struct buffer_head *bh, char *search_buf, int buf_size,</div><div class='ctx'> 		de_len = ext4_rec_len_from_disk(de-&gt;rec_len,</div><div class='ctx'> 						dir-&gt;i_sb-&gt;s_blocksize);</div><div class='ctx'> 		if (de_len &lt;= 0)</div><div class='del'>-			return -1;</div><div class='add'>+			return -EFSCORRUPTED;</div><div class='ctx'> 		offset += de_len;</div><div class='ctx'> 		de = (struct ext4_dir_entry_2 *) ((char *) de + de_len);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1544,11 +1541,10 @@ static struct buffer_head *__ext4_find_entry(struct inode *dir,</div><div class='ctx'> 		int has_inline_data = 1;</div><div class='ctx'> 		ret = ext4_find_inline_entry(dir, fname, res_dir,</div><div class='ctx'> 					     &amp;has_inline_data);</div><div class='del'>-		if (has_inline_data) {</div><div class='del'>-			if (inlined)</div><div class='del'>-				*inlined = 1;</div><div class='add'>+		if (inlined)</div><div class='add'>+			*inlined = has_inline_data;</div><div class='add'>+		if (has_inline_data || IS_ERR(ret))</div><div class='ctx'> 			goto cleanup_and_exit;</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if ((namelen &lt;= 2) &amp;&amp; (name[0] == '.') &amp;&amp;</div><div class='hunk'>@@ -1568,10 +1564,15 @@ static struct buffer_head *__ext4_find_entry(struct inode *dir,</div><div class='ctx'> 		 * return.  Otherwise, fall back to doing a search the</div><div class='ctx'> 		 * old fashioned way.</div><div class='ctx'> 		 */</div><div class='del'>-		if (!IS_ERR(ret) || PTR_ERR(ret) != ERR_BAD_DX_DIR)</div><div class='add'>+		if (IS_ERR(ret) &amp;&amp; PTR_ERR(ret) == ERR_BAD_DX_DIR)</div><div class='add'>+			dxtrace(printk(KERN_DEBUG "ext4_find_entry: dx failed, "</div><div class='add'>+				       "falling back\n"));</div><div class='add'>+		else if (!sb_no_casefold_compat_fallback(dir-&gt;i_sb) &amp;&amp;</div><div class='add'>+			 *res_dir == NULL &amp;&amp; IS_CASEFOLDED(dir))</div><div class='add'>+			dxtrace(printk(KERN_DEBUG "ext4_find_entry: casefold "</div><div class='add'>+				       "failed, falling back\n"));</div><div class='add'>+		else</div><div class='ctx'> 			goto cleanup_and_exit;</div><div class='del'>-		dxtrace(printk(KERN_DEBUG "ext4_find_entry: dx failed, "</div><div class='del'>-			       "falling back\n"));</div><div class='ctx'> 		ret = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> 	nblocks = dir-&gt;i_size &gt;&gt; EXT4_BLOCK_SIZE_BITS(sb);</div><div class='hunk'>@@ -1629,15 +1630,17 @@ restart:</div><div class='ctx'> 		}</div><div class='ctx'> 		set_buffer_verified(bh);</div><div class='ctx'> 		i = search_dirblock(bh, dir, fname,</div><div class='del'>-			    block &lt;&lt; EXT4_BLOCK_SIZE_BITS(sb), res_dir);</div><div class='add'>+				    EXT4_LBLK_TO_B(dir, block), res_dir);</div><div class='ctx'> 		if (i == 1) {</div><div class='ctx'> 			EXT4_I(dir)-&gt;i_dir_start_lookup = block;</div><div class='ctx'> 			ret = bh;</div><div class='ctx'> 			goto cleanup_and_exit;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			brelse(bh);</div><div class='del'>-			if (i &lt; 0)</div><div class='add'>+			if (i &lt; 0) {</div><div class='add'>+				ret = ERR_PTR(i);</div><div class='ctx'> 				goto cleanup_and_exit;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> 	next:</div><div class='ctx'> 		if (++block &gt;= nblocks)</div><div class='hunk'>@@ -1692,7 +1695,6 @@ static struct buffer_head *ext4_lookup_entry(struct inode *dir,</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> </div><div class='ctx'> 	err = ext4_fname_prepare_lookup(dir, dentry, &amp;fname);</div><div class='del'>-	generic_set_encrypted_ci_d_ops(dentry);</div><div class='ctx'> 	if (err == -ENOENT)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	if (err)</div><div class='hunk'>@@ -1708,7 +1710,6 @@ static struct buffer_head * ext4_dx_find_entry(struct inode *dir,</div><div class='ctx'> 			struct ext4_filename *fname,</div><div class='ctx'> 			struct ext4_dir_entry_2 **res_dir)</div><div class='ctx'> {</div><div class='del'>-	struct super_block * sb = dir-&gt;i_sb;</div><div class='ctx'> 	struct dx_frame frames[EXT4_HTREE_LEVEL], *frame;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> 	ext4_lblk_t block;</div><div class='hunk'>@@ -1719,7 +1720,7 @@ static struct buffer_head * ext4_dx_find_entry(struct inode *dir,</div><div class='ctx'> #endif</div><div class='ctx'> 	frame = dx_probe(fname, dir, NULL, frames);</div><div class='ctx'> 	if (IS_ERR(frame))</div><div class='del'>-		return (struct buffer_head *) frame;</div><div class='add'>+		return ERR_CAST(frame);</div><div class='ctx'> 	do {</div><div class='ctx'> 		block = dx_get_block(frame-&gt;at);</div><div class='ctx'> 		bh = ext4_read_dirblock(dir, block, DIRENT_HTREE);</div><div class='hunk'>@@ -1727,12 +1728,11 @@ static struct buffer_head * ext4_dx_find_entry(struct inode *dir,</div><div class='ctx'> 			goto errout;</div><div class='ctx'> </div><div class='ctx'> 		retval = search_dirblock(bh, dir, fname,</div><div class='del'>-					 block &lt;&lt; EXT4_BLOCK_SIZE_BITS(sb),</div><div class='del'>-					 res_dir);</div><div class='add'>+					 EXT4_LBLK_TO_B(dir, block), res_dir);</div><div class='ctx'> 		if (retval == 1)</div><div class='ctx'> 			goto success;</div><div class='ctx'> 		brelse(bh);</div><div class='del'>-		if (retval == -1) {</div><div class='add'>+		if (retval &lt; 0) {</div><div class='ctx'> 			bh = ERR_PTR(ERR_BAD_DX_DIR);</div><div class='ctx'> 			goto errout;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1760,7 +1760,7 @@ success:</div><div class='ctx'> static struct dentry *ext4_lookup(struct inode *dir, struct dentry *dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='del'>-	struct ext4_dir_entry_2 *de;</div><div class='add'>+	struct ext4_dir_entry_2 *de = NULL;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> </div><div class='ctx'> 	if (dentry-&gt;d_name.len &gt; EXT4_NAME_LEN)</div><div class='hunk'>@@ -1800,8 +1800,7 @@ static struct dentry *ext4_lookup(struct inode *dir, struct dentry *dentry, unsi</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='del'>-	if (!inode &amp;&amp; IS_CASEFOLDED(dir)) {</div><div class='add'>+	if (IS_ENABLED(CONFIG_UNICODE) &amp;&amp; !inode &amp;&amp; IS_CASEFOLDED(dir)) {</div><div class='ctx'> 		/* Eventually we want to call d_add_ci(dentry, NULL)</div><div class='ctx'> 		 * for negative dentries in the encoding case as</div><div class='ctx'> 		 * well.  For now, prevent the negative dentry</div><div class='hunk'>@@ -1809,7 +1808,7 @@ static struct dentry *ext4_lookup(struct inode *dir, struct dentry *dentry, unsi</div><div class='ctx'> 		 */</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	}</div><div class='del'>-#endif</div><div class='add'>+</div><div class='ctx'> 	return d_splice_alias(inode, dentry);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1817,7 +1816,7 @@ static struct dentry *ext4_lookup(struct inode *dir, struct dentry *dentry, unsi</div><div class='ctx'> struct dentry *ext4_get_parent(struct dentry *child)</div><div class='ctx'> {</div><div class='ctx'> 	__u32 ino;</div><div class='del'>-	struct ext4_dir_entry_2 * de;</div><div class='add'>+	struct ext4_dir_entry_2 * de = NULL;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> </div><div class='ctx'> 	bh = ext4_find_entry(d_inode(child), &amp;dotdot_name, &amp;de, NULL);</div><div class='hunk'>@@ -1906,7 +1905,8 @@ static struct ext4_dir_entry_2 *do_split(handle_t *handle, struct inode *dir,</div><div class='ctx'> 			struct dx_hash_info *hinfo)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned blocksize = dir-&gt;i_sb-&gt;s_blocksize;</div><div class='del'>-	unsigned count, continued;</div><div class='add'>+	unsigned continued;</div><div class='add'>+	int count;</div><div class='ctx'> 	struct buffer_head *bh2;</div><div class='ctx'> 	ext4_lblk_t newblock;</div><div class='ctx'> 	u32 hash2;</div><div class='hunk'>@@ -1917,14 +1917,14 @@ static struct ext4_dir_entry_2 *do_split(handle_t *handle, struct inode *dir,</div><div class='ctx'> 	int	csum_size = 0;</div><div class='ctx'> 	int	err = 0, i;</div><div class='ctx'> </div><div class='del'>-	if (ext4_has_metadata_csum(dir-&gt;i_sb))</div><div class='add'>+	if (ext4_has_feature_metadata_csum(dir-&gt;i_sb))</div><div class='ctx'> 		csum_size = sizeof(struct ext4_dir_entry_tail);</div><div class='ctx'> </div><div class='ctx'> 	bh2 = ext4_append(handle, dir, &amp;newblock);</div><div class='ctx'> 	if (IS_ERR(bh2)) {</div><div class='ctx'> 		brelse(*bh);</div><div class='ctx'> 		*bh = NULL;</div><div class='del'>-		return (struct ext4_dir_entry_2 *) bh2;</div><div class='add'>+		return ERR_CAST(bh2);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	BUFFER_TRACE(*bh, "get_write_access");</div><div class='hunk'>@@ -1943,8 +1943,11 @@ static struct ext4_dir_entry_2 *do_split(handle_t *handle, struct inode *dir,</div><div class='ctx'> </div><div class='ctx'> 	/* create map in the end of data2 block */</div><div class='ctx'> 	map = (struct dx_map_entry *) (data2 + blocksize);</div><div class='del'>-	count = dx_make_map(dir, (struct ext4_dir_entry_2 *) data1,</div><div class='del'>-			     blocksize, hinfo, map);</div><div class='add'>+	count = dx_make_map(dir, *bh, hinfo, map);</div><div class='add'>+	if (count &lt; 0) {</div><div class='add'>+		err = count;</div><div class='add'>+		goto journal_error;</div><div class='add'>+	}</div><div class='ctx'> 	map -= count;</div><div class='ctx'> 	dx_sort_map(map, count);</div><div class='ctx'> 	/* Ensure that neither split block is over half full */</div><div class='hunk'>@@ -1964,11 +1967,20 @@ static struct ext4_dir_entry_2 *do_split(handle_t *handle, struct inode *dir,</div><div class='ctx'> 	 * split it in half by count; each resulting block will have at least</div><div class='ctx'> 	 * half the space free.</div><div class='ctx'> 	 */</div><div class='del'>-	if (i &gt; 0)</div><div class='add'>+	if (i &gt;= 0)</div><div class='ctx'> 		split = count - move;</div><div class='ctx'> 	else</div><div class='ctx'> 		split = count/2;</div><div class='ctx'> </div><div class='add'>+	if (WARN_ON_ONCE(split == 0)) {</div><div class='add'>+		/* Should never happen, but avoid out-of-bounds access below */</div><div class='add'>+		ext4_error_inode_block(dir, (*bh)-&gt;b_blocknr, 0,</div><div class='add'>+			"bad indexed directory? hash=%08x:%08x count=%d move=%u",</div><div class='add'>+			hinfo-&gt;hash, hinfo-&gt;minor_hash, count, move);</div><div class='add'>+		err = -EFSCORRUPTED;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	hash2 = map[split].hash;</div><div class='ctx'> 	continued = hash2 == map[split - 1].hash;</div><div class='ctx'> 	dxtrace(printk(KERN_INFO "Split block %lu at %x, %i/%i\n",</div><div class='hunk'>@@ -2012,15 +2024,15 @@ static struct ext4_dir_entry_2 *do_split(handle_t *handle, struct inode *dir,</div><div class='ctx'> 	return de;</div><div class='ctx'> </div><div class='ctx'> journal_error:</div><div class='add'>+	ext4_std_error(dir-&gt;i_sb, err);</div><div class='add'>+out:</div><div class='ctx'> 	brelse(*bh);</div><div class='ctx'> 	brelse(bh2);</div><div class='ctx'> 	*bh = NULL;</div><div class='del'>-	ext4_std_error(dir-&gt;i_sb, err);</div><div class='ctx'> 	return ERR_PTR(err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int ext4_find_dest_de(struct inode *dir, struct inode *inode,</div><div class='del'>-		      struct buffer_head *bh,</div><div class='add'>+int ext4_find_dest_de(struct inode *dir, struct buffer_head *bh,</div><div class='ctx'> 		      void *buf, int buf_size,</div><div class='ctx'> 		      struct ext4_filename *fname,</div><div class='ctx'> 		      struct ext4_dir_entry_2 **dest_de)</div><div class='hunk'>@@ -2031,7 +2043,7 @@ int ext4_find_dest_de(struct inode *dir, struct inode *inode,</div><div class='ctx'> 	unsigned int offset = 0;</div><div class='ctx'> 	char *top;</div><div class='ctx'> </div><div class='del'>-	de = (struct ext4_dir_entry_2 *)buf;</div><div class='add'>+	de = buf;</div><div class='ctx'> 	top = buf + buf_size - reclen;</div><div class='ctx'> 	while ((char *) de &lt;= top) {</div><div class='ctx'> 		if (ext4_check_dir_entry(dir, NULL, de, bh,</div><div class='hunk'>@@ -2102,11 +2114,11 @@ static int add_dirent_to_buf(handle_t *handle, struct ext4_filename *fname,</div><div class='ctx'> 	int		csum_size = 0;</div><div class='ctx'> 	int		err, err2;</div><div class='ctx'> </div><div class='del'>-	if (ext4_has_metadata_csum(inode-&gt;i_sb))</div><div class='add'>+	if (ext4_has_feature_metadata_csum(inode-&gt;i_sb))</div><div class='ctx'> 		csum_size = sizeof(struct ext4_dir_entry_tail);</div><div class='ctx'> </div><div class='ctx'> 	if (!de) {</div><div class='del'>-		err = ext4_find_dest_de(dir, inode, bh, bh-&gt;b_data,</div><div class='add'>+		err = ext4_find_dest_de(dir, bh, bh-&gt;b_data,</div><div class='ctx'> 					blocksize - csum_size, fname, &amp;de);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			return err;</div><div class='hunk'>@@ -2133,7 +2145,7 @@ static int add_dirent_to_buf(handle_t *handle, struct ext4_filename *fname,</div><div class='ctx'> 	 * happen is that the times are slightly out of date</div><div class='ctx'> 	 * and/or different from the directory change time.</div><div class='ctx'> 	 */</div><div class='del'>-	dir-&gt;i_mtime = dir-&gt;i_ctime = current_time(dir);</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='ctx'> 	ext4_update_dx_flag(dir);</div><div class='ctx'> 	inode_inc_iversion(dir);</div><div class='ctx'> 	err2 = ext4_mark_inode_dirty(handle, dir);</div><div class='hunk'>@@ -2144,6 +2156,52 @@ static int add_dirent_to_buf(handle_t *handle, struct ext4_filename *fname,</div><div class='ctx'> 	return err ? err : err2;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool ext4_check_dx_root(struct inode *dir, struct dx_root *root)</div><div class='add'>+{</div><div class='add'>+	struct fake_dirent *fde;</div><div class='add'>+	const char *error_msg;</div><div class='add'>+	unsigned int rlen;</div><div class='add'>+	unsigned int blocksize = dir-&gt;i_sb-&gt;s_blocksize;</div><div class='add'>+	char *blockend = (char *)root + dir-&gt;i_sb-&gt;s_blocksize;</div><div class='add'>+</div><div class='add'>+	fde = &amp;root-&gt;dot;</div><div class='add'>+	if (unlikely(fde-&gt;name_len != 1)) {</div><div class='add'>+		error_msg = "invalid name_len for '.'";</div><div class='add'>+		goto corrupted;</div><div class='add'>+	}</div><div class='add'>+	if (unlikely(strncmp(root-&gt;dot_name, ".", fde-&gt;name_len))) {</div><div class='add'>+		error_msg = "invalid name for '.'";</div><div class='add'>+		goto corrupted;</div><div class='add'>+	}</div><div class='add'>+	rlen = ext4_rec_len_from_disk(fde-&gt;rec_len, blocksize);</div><div class='add'>+	if (unlikely((char *)fde + rlen &gt;= blockend)) {</div><div class='add'>+		error_msg = "invalid rec_len for '.'";</div><div class='add'>+		goto corrupted;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	fde = &amp;root-&gt;dotdot;</div><div class='add'>+	if (unlikely(fde-&gt;name_len != 2)) {</div><div class='add'>+		error_msg = "invalid name_len for '..'";</div><div class='add'>+		goto corrupted;</div><div class='add'>+	}</div><div class='add'>+	if (unlikely(strncmp(root-&gt;dotdot_name, "..", fde-&gt;name_len))) {</div><div class='add'>+		error_msg = "invalid name for '..'";</div><div class='add'>+		goto corrupted;</div><div class='add'>+	}</div><div class='add'>+	rlen = ext4_rec_len_from_disk(fde-&gt;rec_len, blocksize);</div><div class='add'>+	if (unlikely((char *)fde + rlen &gt;= blockend)) {</div><div class='add'>+		error_msg = "invalid rec_len for '..'";</div><div class='add'>+		goto corrupted;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+</div><div class='add'>+corrupted:</div><div class='add'>+	EXT4_ERROR_INODE(dir, "Corrupt dir, %s, running e2fsck is recommended",</div><div class='add'>+			 error_msg);</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * This converts a one block unindexed directory to a 3 block indexed</div><div class='ctx'>  * directory, and adds the dentry to the indexed directory.</div><div class='hunk'>@@ -2165,7 +2223,7 @@ static int make_indexed_dir(handle_t *handle, struct ext4_filename *fname,</div><div class='ctx'> 	struct fake_dirent *fde;</div><div class='ctx'> 	int csum_size = 0;</div><div class='ctx'> </div><div class='del'>-	if (ext4_has_metadata_csum(inode-&gt;i_sb))</div><div class='add'>+	if (ext4_has_feature_metadata_csum(inode-&gt;i_sb))</div><div class='ctx'> 		csum_size = sizeof(struct ext4_dir_entry_tail);</div><div class='ctx'> </div><div class='ctx'> 	blocksize =  dir-&gt;i_sb-&gt;s_blocksize;</div><div class='hunk'>@@ -2178,17 +2236,17 @@ static int make_indexed_dir(handle_t *handle, struct ext4_filename *fname,</div><div class='ctx'> 		brelse(bh);</div><div class='ctx'> 		return retval;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> 	root = (struct dx_root *) bh-&gt;b_data;</div><div class='add'>+	if (!ext4_check_dx_root(dir, root)) {</div><div class='add'>+		brelse(bh);</div><div class='add'>+		return -EFSCORRUPTED;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* The 0th block becomes the root, move the dirents out */</div><div class='ctx'> 	fde = &amp;root-&gt;dotdot;</div><div class='ctx'> 	de = (struct ext4_dir_entry_2 *)((char *)fde +</div><div class='ctx'> 		ext4_rec_len_from_disk(fde-&gt;rec_len, blocksize));</div><div class='del'>-	if ((char *) de &gt;= (((char *) root) + blocksize)) {</div><div class='del'>-		EXT4_ERROR_INODE(dir, "invalid rec_len for '..'");</div><div class='del'>-		brelse(bh);</div><div class='del'>-		return -EFSCORRUPTED;</div><div class='del'>-	}</div><div class='ctx'> 	len = ((char *) root) + (blocksize - csum_size) - (char *) de;</div><div class='ctx'> </div><div class='ctx'> 	/* Allocate new block for the 0th block's dirents */</div><div class='hunk'>@@ -2204,8 +2262,15 @@ static int make_indexed_dir(handle_t *handle, struct ext4_filename *fname,</div><div class='ctx'> 	memset(de, 0, len); /* wipe old data */</div><div class='ctx'> 	de = (struct ext4_dir_entry_2 *) data2;</div><div class='ctx'> 	top = data2 + len;</div><div class='del'>-	while ((char *)(de2 = ext4_next_entry(de, blocksize)) &lt; top)</div><div class='add'>+	while ((char *)(de2 = ext4_next_entry(de, blocksize)) &lt; top) {</div><div class='add'>+		if (ext4_check_dir_entry(dir, NULL, de, bh2, data2, len,</div><div class='add'>+					(char *)de - data2)) {</div><div class='add'>+			brelse(bh2);</div><div class='add'>+			brelse(bh);</div><div class='add'>+			return -EFSCORRUPTED;</div><div class='add'>+		}</div><div class='ctx'> 		de = de2;</div><div class='add'>+	}</div><div class='ctx'> 	de-&gt;rec_len = ext4_rec_len_to_disk(data2 + (blocksize - csum_size) -</div><div class='ctx'> 					   (char *) de, blocksize);</div><div class='ctx'> </div><div class='hunk'>@@ -2236,10 +2301,15 @@ static int make_indexed_dir(handle_t *handle, struct ext4_filename *fname,</div><div class='ctx'> 	fname-&gt;hinfo.seed = EXT4_SB(dir-&gt;i_sb)-&gt;s_hash_seed;</div><div class='ctx'> </div><div class='ctx'> 	/* casefolded encrypted hashes are computed on fname setup */</div><div class='del'>-	if (!ext4_hash_in_dirent(dir))</div><div class='del'>-		ext4fs_dirhash(dir, fname_name(fname),</div><div class='del'>-				fname_len(fname), &amp;fname-&gt;hinfo);</div><div class='del'>-</div><div class='add'>+	if (!ext4_hash_in_dirent(dir)) {</div><div class='add'>+		int err = ext4fs_dirhash(dir, fname_name(fname),</div><div class='add'>+					 fname_len(fname), &amp;fname-&gt;hinfo);</div><div class='add'>+		if (err &lt; 0) {</div><div class='add'>+			brelse(bh2);</div><div class='add'>+			brelse(bh);</div><div class='add'>+			return err;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> 	memset(frames, 0, sizeof(frames));</div><div class='ctx'> 	frame = frames;</div><div class='ctx'> 	frame-&gt;entries = entries;</div><div class='hunk'>@@ -2297,22 +2367,17 @@ static int ext4_add_entry(handle_t *handle, struct dentry *dentry,</div><div class='ctx'> 	ext4_lblk_t block, blocks;</div><div class='ctx'> 	int	csum_size = 0;</div><div class='ctx'> </div><div class='del'>-	if (ext4_has_metadata_csum(inode-&gt;i_sb))</div><div class='add'>+	if (ext4_has_feature_metadata_csum(inode-&gt;i_sb))</div><div class='ctx'> 		csum_size = sizeof(struct ext4_dir_entry_tail);</div><div class='ctx'> </div><div class='ctx'> 	sb = dir-&gt;i_sb;</div><div class='ctx'> 	blocksize = sb-&gt;s_blocksize;</div><div class='del'>-	if (!dentry-&gt;d_name.len)</div><div class='del'>-		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	if (fscrypt_is_nokey_name(dentry))</div><div class='ctx'> 		return -ENOKEY;</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='del'>-	if (sb_has_strict_encoding(sb) &amp;&amp; IS_CASEFOLDED(dir) &amp;&amp;</div><div class='del'>-	    sb-&gt;s_encoding &amp;&amp; utf8_validate(sb-&gt;s_encoding, &amp;dentry-&gt;d_name))</div><div class='add'>+	if (!generic_ci_validate_strict_name(dir, &amp;dentry-&gt;d_name))</div><div class='ctx'> 		return -EINVAL;</div><div class='del'>-#endif</div><div class='ctx'> </div><div class='ctx'> 	retval = ext4_fname_setup_filename(dir, &amp;dentry-&gt;d_name, 0, &amp;fname);</div><div class='ctx'> 	if (retval)</div><div class='hunk'>@@ -2333,7 +2398,7 @@ static int ext4_add_entry(handle_t *handle, struct dentry *dentry,</div><div class='ctx'> 		if (!retval || (retval != ERR_BAD_DX_DIR))</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		/* Can we just ignore htree data? */</div><div class='del'>-		if (ext4_has_metadata_csum(sb)) {</div><div class='add'>+		if (ext4_has_feature_metadata_csum(sb)) {</div><div class='ctx'> 			EXT4_ERROR_INODE(dir,</div><div class='ctx'> 				"Directory has corrupted htree index.");</div><div class='ctx'> 			retval = -EFSCORRUPTED;</div><div class='hunk'>@@ -2483,8 +2548,10 @@ again:</div><div class='ctx'> 		BUFFER_TRACE(frame-&gt;bh, "get_write_access");</div><div class='ctx'> 		err = ext4_journal_get_write_access(handle, sb, frame-&gt;bh,</div><div class='ctx'> 						    EXT4_JTR_NONE);</div><div class='del'>-		if (err)</div><div class='add'>+		if (err) {</div><div class='add'>+			brelse(bh2);</div><div class='ctx'> 			goto journal_error;</div><div class='add'>+		}</div><div class='ctx'> 		if (!add_level) {</div><div class='ctx'> 			unsigned icount1 = icount/2, icount2 = icount - icount1;</div><div class='ctx'> 			unsigned hash2 = dx_get_hash(entries + icount1);</div><div class='hunk'>@@ -2495,8 +2562,10 @@ again:</div><div class='ctx'> 			err = ext4_journal_get_write_access(handle, sb,</div><div class='ctx'> 							    (frame - 1)-&gt;bh,</div><div class='ctx'> 							    EXT4_JTR_NONE);</div><div class='del'>-			if (err)</div><div class='add'>+			if (err) {</div><div class='add'>+				brelse(bh2);</div><div class='ctx'> 				goto journal_error;</div><div class='add'>+			}</div><div class='ctx'> </div><div class='ctx'> 			memcpy((char *) entries2, (char *) (entries + icount1),</div><div class='ctx'> 			       icount2 * sizeof(struct dx_entry));</div><div class='hunk'>@@ -2515,8 +2584,10 @@ again:</div><div class='ctx'> 			dxtrace(dx_show_index("node",</div><div class='ctx'> 			       ((struct dx_node *) bh2-&gt;b_data)-&gt;entries));</div><div class='ctx'> 			err = ext4_handle_dirty_dx_node(handle, dir, bh2);</div><div class='del'>-			if (err)</div><div class='add'>+			if (err) {</div><div class='add'>+				brelse(bh2);</div><div class='ctx'> 				goto journal_error;</div><div class='add'>+			}</div><div class='ctx'> 			brelse (bh2);</div><div class='ctx'> 			err = ext4_handle_dirty_dx_node(handle, dir,</div><div class='ctx'> 						   (frame - 1)-&gt;bh);</div><div class='hunk'>@@ -2541,8 +2612,10 @@ again:</div><div class='ctx'> 				       "Creating %d level index...\n",</div><div class='ctx'> 				       dxroot-&gt;info.indirect_levels));</div><div class='ctx'> 			err = ext4_handle_dirty_dx_node(handle, dir, frame-&gt;bh);</div><div class='del'>-			if (err)</div><div class='add'>+			if (err) {</div><div class='add'>+				brelse(bh2);</div><div class='ctx'> 				goto journal_error;</div><div class='add'>+			}</div><div class='ctx'> 			err = ext4_handle_dirty_dx_node(handle, dir, bh2);</div><div class='ctx'> 			brelse(bh2);</div><div class='ctx'> 			restart = 1;</div><div class='hunk'>@@ -2587,7 +2660,7 @@ int ext4_generic_delete_entry(struct inode *dir,</div><div class='ctx'> </div><div class='ctx'> 	i = 0;</div><div class='ctx'> 	pde = NULL;</div><div class='del'>-	de = (struct ext4_dir_entry_2 *)entry_buf;</div><div class='add'>+	de = entry_buf;</div><div class='ctx'> 	while (i &lt; buf_size - csum_size) {</div><div class='ctx'> 		if (ext4_check_dir_entry(dir, NULL, de, bh,</div><div class='ctx'> 					 entry_buf, buf_size, i))</div><div class='hunk'>@@ -2639,7 +2712,7 @@ static int ext4_delete_entry(handle_t *handle,</div><div class='ctx'> 			return err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (ext4_has_metadata_csum(dir-&gt;i_sb))</div><div class='add'>+	if (ext4_has_feature_metadata_csum(dir-&gt;i_sb))</div><div class='ctx'> 		csum_size = sizeof(struct ext4_dir_entry_tail);</div><div class='ctx'> </div><div class='ctx'> 	BUFFER_TRACE(bh, "get_write_access");</div><div class='hunk'>@@ -2716,6 +2789,7 @@ static int ext4_add_nondir(handle_t *handle,</div><div class='ctx'> 		return err;</div><div class='ctx'> 	}</div><div class='ctx'> 	drop_nlink(inode);</div><div class='add'>+	ext4_mark_inode_dirty(handle, inode);</div><div class='ctx'> 	ext4_orphan_add(handle, inode);</div><div class='ctx'> 	unlock_new_inode(inode);</div><div class='ctx'> 	return err;</div><div class='hunk'>@@ -2729,7 +2803,7 @@ static int ext4_add_nondir(handle_t *handle,</div><div class='ctx'>  * If the create succeeds, we fill in the inode information</div><div class='ctx'>  * with d_instantiate().</div><div class='ctx'>  */</div><div class='del'>-static int ext4_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int ext4_create(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		       struct dentry *dentry, umode_t mode, bool excl)</div><div class='ctx'> {</div><div class='ctx'> 	handle_t *handle;</div><div class='hunk'>@@ -2743,7 +2817,7 @@ static int ext4_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	credits = (EXT4_DATA_TRANS_BLOCKS(dir-&gt;i_sb) +</div><div class='ctx'> 		   EXT4_INDEX_EXTRA_TRANS_BLOCKS + 3);</div><div class='ctx'> retry:</div><div class='del'>-	inode = ext4_new_inode_start_handle(mnt_userns, dir, mode, &amp;dentry-&gt;d_name,</div><div class='add'>+	inode = ext4_new_inode_start_handle(idmap, dir, mode, &amp;dentry-&gt;d_name,</div><div class='ctx'> 					    0, NULL, EXT4_HT_DIR, credits);</div><div class='ctx'> 	handle = ext4_journal_current_handle();</div><div class='ctx'> 	err = PTR_ERR(inode);</div><div class='hunk'>@@ -2764,7 +2838,7 @@ retry:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext4_mknod(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int ext4_mknod(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		      struct dentry *dentry, umode_t mode, dev_t rdev)</div><div class='ctx'> {</div><div class='ctx'> 	handle_t *handle;</div><div class='hunk'>@@ -2778,7 +2852,7 @@ static int ext4_mknod(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	credits = (EXT4_DATA_TRANS_BLOCKS(dir-&gt;i_sb) +</div><div class='ctx'> 		   EXT4_INDEX_EXTRA_TRANS_BLOCKS + 3);</div><div class='ctx'> retry:</div><div class='del'>-	inode = ext4_new_inode_start_handle(mnt_userns, dir, mode, &amp;dentry-&gt;d_name,</div><div class='add'>+	inode = ext4_new_inode_start_handle(idmap, dir, mode, &amp;dentry-&gt;d_name,</div><div class='ctx'> 					    0, NULL, EXT4_HT_DIR, credits);</div><div class='ctx'> 	handle = ext4_journal_current_handle();</div><div class='ctx'> 	err = PTR_ERR(inode);</div><div class='hunk'>@@ -2798,8 +2872,8 @@ retry:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext4_tmpfile(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-			struct dentry *dentry, umode_t mode)</div><div class='add'>+static int ext4_tmpfile(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+			struct file *file, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	handle_t *handle;</div><div class='ctx'> 	struct inode *inode;</div><div class='hunk'>@@ -2810,10 +2884,10 @@ static int ext4_tmpfile(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='ctx'> retry:</div><div class='del'>-	inode = ext4_new_inode_start_handle(mnt_userns, dir, mode,</div><div class='add'>+	inode = ext4_new_inode_start_handle(idmap, dir, mode,</div><div class='ctx'> 					    NULL, 0, NULL,</div><div class='ctx'> 					    EXT4_HT_DIR,</div><div class='del'>-			EXT4_MAXQUOTAS_INIT_BLOCKS(dir-&gt;i_sb) +</div><div class='add'>+			EXT4_MAXQUOTAS_TRANS_BLOCKS(dir-&gt;i_sb) +</div><div class='ctx'> 			  4 + EXT4_XATTR_TRANS_BLOCKS);</div><div class='ctx'> 	handle = ext4_journal_current_handle();</div><div class='ctx'> 	err = PTR_ERR(inode);</div><div class='hunk'>@@ -2821,7 +2895,7 @@ retry:</div><div class='ctx'> 		inode-&gt;i_op = &amp;ext4_file_inode_operations;</div><div class='ctx'> 		inode-&gt;i_fop = &amp;ext4_file_operations;</div><div class='ctx'> 		ext4_set_aops(inode);</div><div class='del'>-		d_tmpfile(dentry, inode);</div><div class='add'>+		d_tmpfile(file, inode);</div><div class='ctx'> 		err = ext4_orphan_add(handle, inode);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto err_unlock_inode;</div><div class='hunk'>@@ -2832,55 +2906,66 @@ retry:</div><div class='ctx'> 		ext4_journal_stop(handle);</div><div class='ctx'> 	if (err == -ENOSPC &amp;&amp; ext4_should_retry_alloc(dir-&gt;i_sb, &amp;retries))</div><div class='ctx'> 		goto retry;</div><div class='del'>-	return err;</div><div class='add'>+	return finish_open_simple(file, err);</div><div class='ctx'> err_unlock_inode:</div><div class='ctx'> 	ext4_journal_stop(handle);</div><div class='ctx'> 	unlock_new_inode(inode);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct ext4_dir_entry_2 *ext4_init_dot_dotdot(struct inode *inode,</div><div class='del'>-			  struct ext4_dir_entry_2 *de,</div><div class='del'>-			  int blocksize, int csum_size,</div><div class='del'>-			  unsigned int parent_ino, int dotdot_real_len)</div><div class='add'>+int ext4_init_dirblock(handle_t *handle, struct inode *inode,</div><div class='add'>+		       struct buffer_head *bh, unsigned int parent_ino,</div><div class='add'>+		       void *inline_buf, int inline_size)</div><div class='ctx'> {</div><div class='add'>+	struct ext4_dir_entry_2 *de = (struct ext4_dir_entry_2 *) bh-&gt;b_data;</div><div class='add'>+	size_t			blocksize = bh-&gt;b_size;</div><div class='add'>+	int			csum_size = 0, header_size;</div><div class='add'>+</div><div class='add'>+	if (ext4_has_feature_metadata_csum(inode-&gt;i_sb))</div><div class='add'>+		csum_size = sizeof(struct ext4_dir_entry_tail);</div><div class='add'>+</div><div class='ctx'> 	de-&gt;inode = cpu_to_le32(inode-&gt;i_ino);</div><div class='ctx'> 	de-&gt;name_len = 1;</div><div class='ctx'> 	de-&gt;rec_len = ext4_rec_len_to_disk(ext4_dir_rec_len(de-&gt;name_len, NULL),</div><div class='ctx'> 					   blocksize);</div><div class='del'>-	strcpy(de-&gt;name, ".");</div><div class='add'>+	memcpy(de-&gt;name, ".", 2);</div><div class='ctx'> 	ext4_set_de_type(inode-&gt;i_sb, de, S_IFDIR);</div><div class='ctx'> </div><div class='ctx'> 	de = ext4_next_entry(de, blocksize);</div><div class='ctx'> 	de-&gt;inode = cpu_to_le32(parent_ino);</div><div class='ctx'> 	de-&gt;name_len = 2;</div><div class='del'>-	if (!dotdot_real_len)</div><div class='del'>-		de-&gt;rec_len = ext4_rec_len_to_disk(blocksize -</div><div class='del'>-					(csum_size + ext4_dir_rec_len(1, NULL)),</div><div class='del'>-					blocksize);</div><div class='del'>-	else</div><div class='add'>+	memcpy(de-&gt;name, "..", 3);</div><div class='add'>+	ext4_set_de_type(inode-&gt;i_sb, de, S_IFDIR);</div><div class='add'>+	if (inline_buf) {</div><div class='ctx'> 		de-&gt;rec_len = ext4_rec_len_to_disk(</div><div class='ctx'> 					ext4_dir_rec_len(de-&gt;name_len, NULL),</div><div class='ctx'> 					blocksize);</div><div class='del'>-	strcpy(de-&gt;name, "..");</div><div class='del'>-	ext4_set_de_type(inode-&gt;i_sb, de, S_IFDIR);</div><div class='add'>+		de = ext4_next_entry(de, blocksize);</div><div class='add'>+		header_size = (char *)de - bh-&gt;b_data;</div><div class='add'>+		memcpy((void *)de, inline_buf, inline_size);</div><div class='add'>+		ext4_update_final_de(bh-&gt;b_data, inline_size + header_size,</div><div class='add'>+			blocksize - csum_size);</div><div class='add'>+	} else {</div><div class='add'>+		de-&gt;rec_len = ext4_rec_len_to_disk(blocksize -</div><div class='add'>+					(csum_size + ext4_dir_rec_len(1, NULL)),</div><div class='add'>+					blocksize);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	return ext4_next_entry(de, blocksize);</div><div class='add'>+	if (csum_size)</div><div class='add'>+		ext4_initialize_dirent_tail(bh, blocksize);</div><div class='add'>+	BUFFER_TRACE(dir_block, "call ext4_handle_dirty_metadata");</div><div class='add'>+	set_buffer_uptodate(bh);</div><div class='add'>+	set_buffer_verified(bh);</div><div class='add'>+	return ext4_handle_dirty_dirblock(handle, inode, bh);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int ext4_init_new_dir(handle_t *handle, struct inode *dir,</div><div class='ctx'> 			     struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *dir_block = NULL;</div><div class='del'>-	struct ext4_dir_entry_2 *de;</div><div class='ctx'> 	ext4_lblk_t block = 0;</div><div class='del'>-	unsigned int blocksize = dir-&gt;i_sb-&gt;s_blocksize;</div><div class='del'>-	int csum_size = 0;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	if (ext4_has_metadata_csum(dir-&gt;i_sb))</div><div class='del'>-		csum_size = sizeof(struct ext4_dir_entry_tail);</div><div class='del'>-</div><div class='ctx'> 	if (ext4_test_inode_state(inode, EXT4_STATE_MAY_INLINE_DATA)) {</div><div class='ctx'> 		err = ext4_try_create_inline_dir(handle, dir, inode);</div><div class='ctx'> 		if (err &lt; 0 &amp;&amp; err != -ENOSPC)</div><div class='hunk'>@@ -2889,44 +2974,35 @@ int ext4_init_new_dir(handle_t *handle, struct inode *dir,</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	set_nlink(inode, 2);</div><div class='ctx'> 	inode-&gt;i_size = 0;</div><div class='ctx'> 	dir_block = ext4_append(handle, inode, &amp;block);</div><div class='ctx'> 	if (IS_ERR(dir_block))</div><div class='ctx'> 		return PTR_ERR(dir_block);</div><div class='del'>-	de = (struct ext4_dir_entry_2 *)dir_block-&gt;b_data;</div><div class='del'>-	ext4_init_dot_dotdot(inode, de, blocksize, csum_size, dir-&gt;i_ino, 0);</div><div class='del'>-	set_nlink(inode, 2);</div><div class='del'>-	if (csum_size)</div><div class='del'>-		ext4_initialize_dirent_tail(dir_block, blocksize);</div><div class='del'>-</div><div class='del'>-	BUFFER_TRACE(dir_block, "call ext4_handle_dirty_metadata");</div><div class='del'>-	err = ext4_handle_dirty_dirblock(handle, inode, dir_block);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out;</div><div class='del'>-	set_buffer_verified(dir_block);</div><div class='add'>+	err = ext4_init_dirblock(handle, inode, dir_block, dir-&gt;i_ino, NULL, 0);</div><div class='ctx'> out:</div><div class='ctx'> 	brelse(dir_block);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext4_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-		      struct dentry *dentry, umode_t mode)</div><div class='add'>+static struct dentry *ext4_mkdir(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+				 struct dentry *dentry, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	handle_t *handle;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	int err, err2 = 0, credits, retries = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (EXT4_DIR_LINK_MAX(dir))</div><div class='del'>-		return -EMLINK;</div><div class='add'>+		return ERR_PTR(-EMLINK);</div><div class='ctx'> </div><div class='ctx'> 	err = dquot_initialize(dir);</div><div class='ctx'> 	if (err)</div><div class='del'>-		return err;</div><div class='add'>+		return ERR_PTR(err);</div><div class='ctx'> </div><div class='ctx'> 	credits = (EXT4_DATA_TRANS_BLOCKS(dir-&gt;i_sb) +</div><div class='ctx'> 		   EXT4_INDEX_EXTRA_TRANS_BLOCKS + 3);</div><div class='ctx'> retry:</div><div class='del'>-	inode = ext4_new_inode_start_handle(mnt_userns, dir, S_IFDIR | mode,</div><div class='add'>+	inode = ext4_new_inode_start_handle(idmap, dir, S_IFDIR | mode,</div><div class='ctx'> 					    &amp;dentry-&gt;d_name,</div><div class='ctx'> 					    0, NULL, EXT4_HT_DIR, credits);</div><div class='ctx'> 	handle = ext4_journal_current_handle();</div><div class='hunk'>@@ -2971,7 +3047,7 @@ out_stop:</div><div class='ctx'> out_retry:</div><div class='ctx'> 	if (err == -ENOSPC &amp;&amp; ext4_should_retry_alloc(dir-&gt;i_sb, &amp;retries))</div><div class='ctx'> 		goto retry;</div><div class='del'>-	return err;</div><div class='add'>+	return ERR_PTR(err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2997,31 +3073,30 @@ bool ext4_empty_dir(struct inode *inode)</div><div class='ctx'> 	if (inode-&gt;i_size &lt; ext4_dir_rec_len(1, NULL) +</div><div class='ctx'> 					ext4_dir_rec_len(2, NULL)) {</div><div class='ctx'> 		EXT4_ERROR_INODE(inode, "invalid size");</div><div class='del'>-		return true;</div><div class='add'>+		return false;</div><div class='ctx'> 	}</div><div class='del'>-	/* The first directory block must not be a hole,</div><div class='del'>-	 * so treat it as DIRENT_HTREE</div><div class='del'>-	 */</div><div class='del'>-	bh = ext4_read_dirblock(inode, 0, DIRENT_HTREE);</div><div class='add'>+	bh = ext4_read_dirblock(inode, 0, EITHER);</div><div class='ctx'> 	if (IS_ERR(bh))</div><div class='del'>-		return true;</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	de = (struct ext4_dir_entry_2 *) bh-&gt;b_data;</div><div class='ctx'> 	if (ext4_check_dir_entry(inode, NULL, de, bh, bh-&gt;b_data, bh-&gt;b_size,</div><div class='ctx'> 				 0) ||</div><div class='del'>-	    le32_to_cpu(de-&gt;inode) != inode-&gt;i_ino || strcmp(".", de-&gt;name)) {</div><div class='add'>+	    le32_to_cpu(de-&gt;inode) != inode-&gt;i_ino || de-&gt;name_len != 1 ||</div><div class='add'>+	    de-&gt;name[0] != '.') {</div><div class='ctx'> 		ext4_warning_inode(inode, "directory missing '.'");</div><div class='ctx'> 		brelse(bh);</div><div class='del'>-		return true;</div><div class='add'>+		return false;</div><div class='ctx'> 	}</div><div class='ctx'> 	offset = ext4_rec_len_from_disk(de-&gt;rec_len, sb-&gt;s_blocksize);</div><div class='ctx'> 	de = ext4_next_entry(de, sb-&gt;s_blocksize);</div><div class='ctx'> 	if (ext4_check_dir_entry(inode, NULL, de, bh, bh-&gt;b_data, bh-&gt;b_size,</div><div class='ctx'> 				 offset) ||</div><div class='del'>-	    le32_to_cpu(de-&gt;inode) == 0 || strcmp("..", de-&gt;name)) {</div><div class='add'>+	    le32_to_cpu(de-&gt;inode) == 0 || de-&gt;name_len != 2 ||</div><div class='add'>+	    de-&gt;name[0] != '.' || de-&gt;name[1] != '.') {</div><div class='ctx'> 		ext4_warning_inode(inode, "directory missing '..'");</div><div class='ctx'> 		brelse(bh);</div><div class='del'>-		return true;</div><div class='add'>+		return false;</div><div class='ctx'> 	}</div><div class='ctx'> 	offset += ext4_rec_len_from_disk(de-&gt;rec_len, sb-&gt;s_blocksize);</div><div class='ctx'> 	while (offset &lt; inode-&gt;i_size) {</div><div class='hunk'>@@ -3035,16 +3110,13 @@ bool ext4_empty_dir(struct inode *inode)</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> 			if (IS_ERR(bh))</div><div class='del'>-				return true;</div><div class='add'>+				return false;</div><div class='ctx'> 		}</div><div class='ctx'> 		de = (struct ext4_dir_entry_2 *) (bh-&gt;b_data +</div><div class='ctx'> 					(offset &amp; (sb-&gt;s_blocksize - 1)));</div><div class='ctx'> 		if (ext4_check_dir_entry(inode, NULL, de, bh,</div><div class='del'>-					 bh-&gt;b_data, bh-&gt;b_size, offset)) {</div><div class='del'>-			offset = (offset | (sb-&gt;s_blocksize - 1)) + 1;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-		if (le32_to_cpu(de-&gt;inode)) {</div><div class='add'>+					 bh-&gt;b_data, bh-&gt;b_size, offset) ||</div><div class='add'>+		    le32_to_cpu(de-&gt;inode)) {</div><div class='ctx'> 			brelse(bh);</div><div class='ctx'> 			return false;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -3059,11 +3131,12 @@ static int ext4_rmdir(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	int retval;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='del'>-	struct ext4_dir_entry_2 *de;</div><div class='add'>+	struct ext4_dir_entry_2 *de = NULL;</div><div class='ctx'> 	handle_t *handle = NULL;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ext4_forced_shutdown(EXT4_SB(dir-&gt;i_sb))))</div><div class='del'>-		return -EIO;</div><div class='add'>+	retval = ext4_emergency_state(dir-&gt;i_sb);</div><div class='add'>+	if (unlikely(retval))</div><div class='add'>+		return retval;</div><div class='ctx'> </div><div class='ctx'> 	/* Initialize quotas before so that eventual writes go in</div><div class='ctx'> 	 * separate transaction */</div><div class='hunk'>@@ -3117,7 +3190,8 @@ static int ext4_rmdir(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	 * recovery. */</div><div class='ctx'> 	inode-&gt;i_size = 0;</div><div class='ctx'> 	ext4_orphan_add(handle, inode);</div><div class='del'>-	inode-&gt;i_ctime = dir-&gt;i_ctime = dir-&gt;i_mtime = current_time(inode);</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> 	retval = ext4_mark_inode_dirty(handle, inode);</div><div class='ctx'> 	if (retval)</div><div class='ctx'> 		goto end_rmdir;</div><div class='hunk'>@@ -3126,16 +3200,14 @@ static int ext4_rmdir(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	ext4_fc_track_unlink(handle, dentry);</div><div class='ctx'> 	retval = ext4_mark_inode_dirty(handle, dir);</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='ctx'> 	/* VFS negative dentries are incompatible with Encoding and</div><div class='ctx'> 	 * Case-insensitiveness. Eventually we'll want avoid</div><div class='ctx'> 	 * invalidating the dentries here, alongside with returning the</div><div class='ctx'> 	 * negative dentries at ext4_lookup(), when it is better</div><div class='ctx'> 	 * supported by the VFS for the CI case.</div><div class='ctx'> 	 */</div><div class='del'>-	if (IS_CASEFOLDED(dir))</div><div class='add'>+	if (IS_ENABLED(CONFIG_UNICODE) &amp;&amp; IS_CASEFOLDED(dir))</div><div class='ctx'> 		d_invalidate(dentry);</div><div class='del'>-#endif</div><div class='ctx'> </div><div class='ctx'> end_rmdir:</div><div class='ctx'> 	brelse(bh);</div><div class='hunk'>@@ -3144,14 +3216,20 @@ end_rmdir:</div><div class='ctx'> 	return retval;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int __ext4_unlink(handle_t *handle, struct inode *dir, const struct qstr *d_name,</div><div class='del'>-		  struct inode *inode)</div><div class='add'>+int __ext4_unlink(struct inode *dir, const struct qstr *d_name,</div><div class='add'>+		  struct inode *inode,</div><div class='add'>+		  struct dentry *dentry /* NULL during fast_commit recovery */)</div><div class='ctx'> {</div><div class='ctx'> 	int retval = -ENOENT;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='del'>-	struct ext4_dir_entry_2 *de;</div><div class='add'>+	struct ext4_dir_entry_2 *de = NULL;</div><div class='add'>+	handle_t *handle;</div><div class='ctx'> 	int skip_remove_dentry = 0;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Keep this outside the transaction; it may have to set up the</div><div class='add'>+	 * directory's encryption key, which isn't GFP_NOFS-safe.</div><div class='add'>+	 */</div><div class='ctx'> 	bh = ext4_find_entry(dir, d_name, &amp;de, NULL);</div><div class='ctx'> 	if (IS_ERR(bh))</div><div class='ctx'> 		return PTR_ERR(bh);</div><div class='hunk'>@@ -3168,7 +3246,14 @@ int __ext4_unlink(handle_t *handle, struct inode *dir, const struct qstr *d_name</div><div class='ctx'> 		if (EXT4_SB(inode-&gt;i_sb)-&gt;s_mount_state &amp; EXT4_FC_REPLAY)</div><div class='ctx'> 			skip_remove_dentry = 1;</div><div class='ctx'> 		else</div><div class='del'>-			goto out;</div><div class='add'>+			goto out_bh;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	handle = ext4_journal_start(dir, EXT4_HT_DIR,</div><div class='add'>+				    EXT4_DATA_TRANS_BLOCKS(dir-&gt;i_sb));</div><div class='add'>+	if (IS_ERR(handle)) {</div><div class='add'>+		retval = PTR_ERR(handle);</div><div class='add'>+		goto out_bh;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (IS_DIRSYNC(dir))</div><div class='hunk'>@@ -3177,12 +3262,12 @@ int __ext4_unlink(handle_t *handle, struct inode *dir, const struct qstr *d_name</div><div class='ctx'> 	if (!skip_remove_dentry) {</div><div class='ctx'> 		retval = ext4_delete_entry(handle, dir, de, bh);</div><div class='ctx'> 		if (retval)</div><div class='del'>-			goto out;</div><div class='del'>-		dir-&gt;i_ctime = dir-&gt;i_mtime = current_time(dir);</div><div class='add'>+			goto out_handle;</div><div class='add'>+		inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='ctx'> 		ext4_update_dx_flag(dir);</div><div class='ctx'> 		retval = ext4_mark_inode_dirty(handle, dir);</div><div class='ctx'> 		if (retval)</div><div class='del'>-			goto out;</div><div class='add'>+			goto out_handle;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		retval = 0;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3193,21 +3278,24 @@ int __ext4_unlink(handle_t *handle, struct inode *dir, const struct qstr *d_name</div><div class='ctx'> 		drop_nlink(inode);</div><div class='ctx'> 	if (!inode-&gt;i_nlink)</div><div class='ctx'> 		ext4_orphan_add(handle, inode);</div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> 	retval = ext4_mark_inode_dirty(handle, inode);</div><div class='del'>-</div><div class='del'>-out:</div><div class='add'>+	if (dentry &amp;&amp; !retval)</div><div class='add'>+		ext4_fc_track_unlink(handle, dentry);</div><div class='add'>+out_handle:</div><div class='add'>+	ext4_journal_stop(handle);</div><div class='add'>+out_bh:</div><div class='ctx'> 	brelse(bh);</div><div class='ctx'> 	return retval;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ext4_unlink(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	handle_t *handle;</div><div class='ctx'> 	int retval;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ext4_forced_shutdown(EXT4_SB(dir-&gt;i_sb))))</div><div class='del'>-		return -EIO;</div><div class='add'>+	retval = ext4_emergency_state(dir-&gt;i_sb);</div><div class='add'>+	if (unlikely(retval))</div><div class='add'>+		return retval;</div><div class='ctx'> </div><div class='ctx'> 	trace_ext4_unlink_enter(dir, dentry);</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -3221,35 +3309,49 @@ static int ext4_unlink(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	if (retval)</div><div class='ctx'> 		goto out_trace;</div><div class='ctx'> </div><div class='del'>-	handle = ext4_journal_start(dir, EXT4_HT_DIR,</div><div class='del'>-				    EXT4_DATA_TRANS_BLOCKS(dir-&gt;i_sb));</div><div class='del'>-	if (IS_ERR(handle)) {</div><div class='del'>-		retval = PTR_ERR(handle);</div><div class='del'>-		goto out_trace;</div><div class='del'>-	}</div><div class='add'>+	retval = __ext4_unlink(dir, &amp;dentry-&gt;d_name, d_inode(dentry), dentry);</div><div class='ctx'> </div><div class='del'>-	retval = __ext4_unlink(handle, dir, &amp;dentry-&gt;d_name, d_inode(dentry));</div><div class='del'>-	if (!retval)</div><div class='del'>-		ext4_fc_track_unlink(handle, dentry);</div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='ctx'> 	/* VFS negative dentries are incompatible with Encoding and</div><div class='ctx'> 	 * Case-insensitiveness. Eventually we'll want avoid</div><div class='ctx'> 	 * invalidating the dentries here, alongside with returning the</div><div class='ctx'> 	 * negative dentries at ext4_lookup(), when it is  better</div><div class='ctx'> 	 * supported by the VFS for the CI case.</div><div class='ctx'> 	 */</div><div class='del'>-	if (IS_CASEFOLDED(dir))</div><div class='add'>+	if (IS_ENABLED(CONFIG_UNICODE) &amp;&amp; IS_CASEFOLDED(dir))</div><div class='ctx'> 		d_invalidate(dentry);</div><div class='del'>-#endif</div><div class='del'>-	if (handle)</div><div class='del'>-		ext4_journal_stop(handle);</div><div class='ctx'> </div><div class='ctx'> out_trace:</div><div class='ctx'> 	trace_ext4_unlink_exit(dentry, retval);</div><div class='ctx'> 	return retval;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext4_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int ext4_init_symlink_block(handle_t *handle, struct inode *inode,</div><div class='add'>+				   struct fscrypt_str *disk_link)</div><div class='add'>+{</div><div class='add'>+	struct buffer_head *bh;</div><div class='add'>+	char *kaddr;</div><div class='add'>+	int err = 0;</div><div class='add'>+</div><div class='add'>+	bh = ext4_bread(handle, inode, 0, EXT4_GET_BLOCKS_CREATE);</div><div class='add'>+	if (IS_ERR(bh))</div><div class='add'>+		return PTR_ERR(bh);</div><div class='add'>+</div><div class='add'>+	BUFFER_TRACE(bh, "get_write_access");</div><div class='add'>+	err = ext4_journal_get_write_access(handle, inode-&gt;i_sb, bh, EXT4_JTR_NONE);</div><div class='add'>+	if (err)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	kaddr = (char *)bh-&gt;b_data;</div><div class='add'>+	memcpy(kaddr, disk_link-&gt;name, disk_link-&gt;len);</div><div class='add'>+	inode-&gt;i_size = disk_link-&gt;len - 1;</div><div class='add'>+	EXT4_I(inode)-&gt;i_disksize = inode-&gt;i_size;</div><div class='add'>+	err = ext4_handle_dirty_metadata(handle, inode, bh);</div><div class='add'>+out:</div><div class='add'>+	brelse(bh);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ext4_symlink(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 			struct dentry *dentry, const char *symname)</div><div class='ctx'> {</div><div class='ctx'> 	handle_t *handle;</div><div class='hunk'>@@ -3257,9 +3359,11 @@ static int ext4_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	int err, len = strlen(symname);</div><div class='ctx'> 	int credits;</div><div class='ctx'> 	struct fscrypt_str disk_link;</div><div class='add'>+	int retries = 0;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ext4_forced_shutdown(EXT4_SB(dir-&gt;i_sb))))</div><div class='del'>-		return -EIO;</div><div class='add'>+	err = ext4_emergency_state(dir-&gt;i_sb);</div><div class='add'>+	if (unlikely(err))</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='ctx'> 	err = fscrypt_prepare_symlink(dir, symname, len, dir-&gt;i_sb-&gt;s_blocksize,</div><div class='ctx'> 				      &amp;disk_link);</div><div class='hunk'>@@ -3270,34 +3374,24 @@ static int ext4_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	if ((disk_link.len &gt; EXT4_N_BLOCKS * 4)) {</div><div class='del'>-		/*</div><div class='del'>-		 * For non-fast symlinks, we just allocate inode and put it on</div><div class='del'>-		 * orphan list in the first transaction =&gt; we need bitmap,</div><div class='del'>-		 * group descriptor, sb, inode block, quota blocks, and</div><div class='del'>-		 * possibly selinux xattr blocks.</div><div class='del'>-		 */</div><div class='del'>-		credits = 4 + EXT4_MAXQUOTAS_INIT_BLOCKS(dir-&gt;i_sb) +</div><div class='del'>-			  EXT4_XATTR_TRANS_BLOCKS;</div><div class='del'>-	} else {</div><div class='del'>-		/*</div><div class='del'>-		 * Fast symlink. We have to add entry to directory</div><div class='del'>-		 * (EXT4_DATA_TRANS_BLOCKS + EXT4_INDEX_EXTRA_TRANS_BLOCKS),</div><div class='del'>-		 * allocate new inode (bitmap, group descriptor, inode block,</div><div class='del'>-		 * quota blocks, sb is already counted in previous macros).</div><div class='del'>-		 */</div><div class='del'>-		credits = EXT4_DATA_TRANS_BLOCKS(dir-&gt;i_sb) +</div><div class='del'>-			  EXT4_INDEX_EXTRA_TRANS_BLOCKS + 3;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	inode = ext4_new_inode_start_handle(mnt_userns, dir, S_IFLNK|S_IRWXUGO,</div><div class='add'>+	/*</div><div class='add'>+	 * EXT4_INDEX_EXTRA_TRANS_BLOCKS for addition of entry into the</div><div class='add'>+	 * directory. +3 for inode, inode bitmap, group descriptor allocation.</div><div class='add'>+	 * EXT4_DATA_TRANS_BLOCKS for the data block allocation and</div><div class='add'>+	 * modification.</div><div class='add'>+	 */</div><div class='add'>+	credits = EXT4_DATA_TRANS_BLOCKS(dir-&gt;i_sb) +</div><div class='add'>+		  EXT4_INDEX_EXTRA_TRANS_BLOCKS + 3;</div><div class='add'>+retry:</div><div class='add'>+	inode = ext4_new_inode_start_handle(idmap, dir, S_IFLNK|S_IRWXUGO,</div><div class='ctx'> 					    &amp;dentry-&gt;d_name, 0, NULL,</div><div class='ctx'> 					    EXT4_HT_DIR, credits);</div><div class='ctx'> 	handle = ext4_journal_current_handle();</div><div class='ctx'> 	if (IS_ERR(inode)) {</div><div class='ctx'> 		if (handle)</div><div class='ctx'> 			ext4_journal_stop(handle);</div><div class='del'>-		return PTR_ERR(inode);</div><div class='add'>+		err = PTR_ERR(inode);</div><div class='add'>+		goto out_retry;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (IS_ENCRYPTED(inode)) {</div><div class='hunk'>@@ -3305,75 +3399,47 @@ static int ext4_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto err_drop_inode;</div><div class='ctx'> 		inode-&gt;i_op = &amp;ext4_encrypted_symlink_inode_operations;</div><div class='add'>+	} else {</div><div class='add'>+		if ((disk_link.len &gt; EXT4_N_BLOCKS * 4)) {</div><div class='add'>+			inode-&gt;i_op = &amp;ext4_symlink_inode_operations;</div><div class='add'>+		} else {</div><div class='add'>+			inode-&gt;i_op = &amp;ext4_fast_symlink_inode_operations;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if ((disk_link.len &gt; EXT4_N_BLOCKS * 4)) {</div><div class='del'>-		if (!IS_ENCRYPTED(inode))</div><div class='del'>-			inode-&gt;i_op = &amp;ext4_symlink_inode_operations;</div><div class='del'>-		inode_nohighmem(inode);</div><div class='del'>-		ext4_set_aops(inode);</div><div class='del'>-		/*</div><div class='del'>-		 * We cannot call page_symlink() with transaction started</div><div class='del'>-		 * because it calls into ext4_write_begin() which can wait</div><div class='del'>-		 * for transaction commit if we are running out of space</div><div class='del'>-		 * and thus we deadlock. So we have to stop transaction now</div><div class='del'>-		 * and restart it when symlink contents is written.</div><div class='del'>-		 *</div><div class='del'>-		 * To keep fs consistent in case of crash, we have to put inode</div><div class='del'>-		 * to orphan list in the mean time.</div><div class='del'>-		 */</div><div class='del'>-		drop_nlink(inode);</div><div class='del'>-		err = ext4_orphan_add(handle, inode);</div><div class='del'>-		if (handle)</div><div class='del'>-			ext4_journal_stop(handle);</div><div class='del'>-		handle = NULL;</div><div class='del'>-		if (err)</div><div class='del'>-			goto err_drop_inode;</div><div class='del'>-		err = __page_symlink(inode, disk_link.name, disk_link.len, 1);</div><div class='del'>-		if (err)</div><div class='del'>-			goto err_drop_inode;</div><div class='del'>-		/*</div><div class='del'>-		 * Now inode is being linked into dir (EXT4_DATA_TRANS_BLOCKS</div><div class='del'>-		 * + EXT4_INDEX_EXTRA_TRANS_BLOCKS), inode is also modified</div><div class='del'>-		 */</div><div class='del'>-		handle = ext4_journal_start(dir, EXT4_HT_DIR,</div><div class='del'>-				EXT4_DATA_TRANS_BLOCKS(dir-&gt;i_sb) +</div><div class='del'>-				EXT4_INDEX_EXTRA_TRANS_BLOCKS + 1);</div><div class='del'>-		if (IS_ERR(handle)) {</div><div class='del'>-			err = PTR_ERR(handle);</div><div class='del'>-			handle = NULL;</div><div class='del'>-			goto err_drop_inode;</div><div class='del'>-		}</div><div class='del'>-		set_nlink(inode, 1);</div><div class='del'>-		err = ext4_orphan_del(handle, inode);</div><div class='add'>+		/* alloc symlink block and fill it */</div><div class='add'>+		err = ext4_init_symlink_block(handle, inode, &amp;disk_link);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto err_drop_inode;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		/* clear the extent format for fast symlink */</div><div class='ctx'> 		ext4_clear_inode_flag(inode, EXT4_INODE_EXTENTS);</div><div class='del'>-		if (!IS_ENCRYPTED(inode)) {</div><div class='del'>-			inode-&gt;i_op = &amp;ext4_fast_symlink_inode_operations;</div><div class='del'>-			inode-&gt;i_link = (char *)&amp;EXT4_I(inode)-&gt;i_data;</div><div class='del'>-		}</div><div class='ctx'> 		memcpy((char *)&amp;EXT4_I(inode)-&gt;i_data, disk_link.name,</div><div class='ctx'> 		       disk_link.len);</div><div class='ctx'> 		inode-&gt;i_size = disk_link.len - 1;</div><div class='add'>+		EXT4_I(inode)-&gt;i_disksize = inode-&gt;i_size;</div><div class='add'>+		if (!IS_ENCRYPTED(inode))</div><div class='add'>+			inode_set_cached_link(inode, (char *)&amp;EXT4_I(inode)-&gt;i_data,</div><div class='add'>+					      inode-&gt;i_size);</div><div class='ctx'> 	}</div><div class='del'>-	EXT4_I(inode)-&gt;i_disksize = inode-&gt;i_size;</div><div class='ctx'> 	err = ext4_add_nondir(handle, dentry, &amp;inode);</div><div class='ctx'> 	if (handle)</div><div class='ctx'> 		ext4_journal_stop(handle);</div><div class='del'>-	if (inode)</div><div class='del'>-		iput(inode);</div><div class='del'>-	goto out_free_encrypted_link;</div><div class='add'>+	iput(inode);</div><div class='add'>+	goto out_retry;</div><div class='ctx'> </div><div class='ctx'> err_drop_inode:</div><div class='del'>-	if (handle)</div><div class='del'>-		ext4_journal_stop(handle);</div><div class='ctx'> 	clear_nlink(inode);</div><div class='add'>+	ext4_mark_inode_dirty(handle, inode);</div><div class='add'>+	ext4_orphan_add(handle, inode);</div><div class='ctx'> 	unlock_new_inode(inode);</div><div class='add'>+	if (handle)</div><div class='add'>+		ext4_journal_stop(handle);</div><div class='ctx'> 	iput(inode);</div><div class='del'>-out_free_encrypted_link:</div><div class='add'>+out_retry:</div><div class='add'>+	if (err == -ENOSPC &amp;&amp; ext4_should_retry_alloc(dir-&gt;i_sb, &amp;retries))</div><div class='add'>+		goto retry;</div><div class='ctx'> 	if (disk_link.name != (unsigned char *)symname)</div><div class='ctx'> 		kfree(disk_link.name);</div><div class='ctx'> 	return err;</div><div class='hunk'>@@ -3393,7 +3459,7 @@ retry:</div><div class='ctx'> 	if (IS_DIRSYNC(dir))</div><div class='ctx'> 		ext4_handle_sync(handle);</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> 	ext4_inc_count(inode);</div><div class='ctx'> 	ihold(inode);</div><div class='ctx'> </div><div class='hunk'>@@ -3455,17 +3521,39 @@ static struct buffer_head *ext4_get_first_dir_block(handle_t *handle,</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> </div><div class='ctx'> 	if (!ext4_has_inline_data(inode)) {</div><div class='del'>-		/* The first directory block must not be a hole, so</div><div class='del'>-		 * treat it as DIRENT_HTREE</div><div class='del'>-		 */</div><div class='del'>-		bh = ext4_read_dirblock(inode, 0, DIRENT_HTREE);</div><div class='add'>+		struct ext4_dir_entry_2 *de;</div><div class='add'>+		unsigned int offset;</div><div class='add'>+</div><div class='add'>+		bh = ext4_read_dirblock(inode, 0, EITHER);</div><div class='ctx'> 		if (IS_ERR(bh)) {</div><div class='ctx'> 			*retval = PTR_ERR(bh);</div><div class='ctx'> 			return NULL;</div><div class='ctx'> 		}</div><div class='del'>-		*parent_de = ext4_next_entry(</div><div class='del'>-					(struct ext4_dir_entry_2 *)bh-&gt;b_data,</div><div class='del'>-					inode-&gt;i_sb-&gt;s_blocksize);</div><div class='add'>+</div><div class='add'>+		de = (struct ext4_dir_entry_2 *) bh-&gt;b_data;</div><div class='add'>+		if (ext4_check_dir_entry(inode, NULL, de, bh, bh-&gt;b_data,</div><div class='add'>+					 bh-&gt;b_size, 0) ||</div><div class='add'>+		    le32_to_cpu(de-&gt;inode) != inode-&gt;i_ino ||</div><div class='add'>+		    de-&gt;name_len != 1 || de-&gt;name[0] != '.') {</div><div class='add'>+			EXT4_ERROR_INODE(inode, "directory missing '.'");</div><div class='add'>+			brelse(bh);</div><div class='add'>+			*retval = -EFSCORRUPTED;</div><div class='add'>+			return NULL;</div><div class='add'>+		}</div><div class='add'>+		offset = ext4_rec_len_from_disk(de-&gt;rec_len,</div><div class='add'>+						inode-&gt;i_sb-&gt;s_blocksize);</div><div class='add'>+		de = ext4_next_entry(de, inode-&gt;i_sb-&gt;s_blocksize);</div><div class='add'>+		if (ext4_check_dir_entry(inode, NULL, de, bh, bh-&gt;b_data,</div><div class='add'>+					 bh-&gt;b_size, offset) ||</div><div class='add'>+		    le32_to_cpu(de-&gt;inode) == 0 || de-&gt;name_len != 2 ||</div><div class='add'>+		    de-&gt;name[0] != '.' || de-&gt;name[1] != '.') {</div><div class='add'>+			EXT4_ERROR_INODE(inode, "directory missing '..'");</div><div class='add'>+			brelse(bh);</div><div class='add'>+			*retval = -EFSCORRUPTED;</div><div class='add'>+			return NULL;</div><div class='add'>+		}</div><div class='add'>+		*parent_de = de;</div><div class='add'>+</div><div class='ctx'> 		return bh;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -3491,10 +3579,14 @@ struct ext4_renament {</div><div class='ctx'> 	int dir_inlined;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int ext4_rename_dir_prepare(handle_t *handle, struct ext4_renament *ent)</div><div class='add'>+static int ext4_rename_dir_prepare(handle_t *handle, struct ext4_renament *ent, bool is_cross)</div><div class='ctx'> {</div><div class='ctx'> 	int retval;</div><div class='ctx'> </div><div class='add'>+	ent-&gt;is_dir = true;</div><div class='add'>+	if (!is_cross)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='ctx'> 	ent-&gt;dir_bh = ext4_get_first_dir_block(handle, ent-&gt;inode,</div><div class='ctx'> 					      &amp;retval, &amp;ent-&gt;parent_de,</div><div class='ctx'> 					      &amp;ent-&gt;dir_inlined);</div><div class='hunk'>@@ -3512,6 +3604,9 @@ static int ext4_rename_dir_finish(handle_t *handle, struct ext4_renament *ent,</div><div class='ctx'> {</div><div class='ctx'> 	int retval;</div><div class='ctx'> </div><div class='add'>+	if (!ent-&gt;dir_bh)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='ctx'> 	ent-&gt;parent_de-&gt;inode = cpu_to_le32(dir_ino);</div><div class='ctx'> 	BUFFER_TRACE(ent-&gt;dir_bh, "call ext4_handle_dirty_metadata");</div><div class='ctx'> 	if (!ent-&gt;dir_inlined) {</div><div class='hunk'>@@ -3547,8 +3642,7 @@ static int ext4_setent(handle_t *handle, struct ext4_renament *ent,</div><div class='ctx'> 	if (ext4_has_feature_filetype(ent-&gt;dir-&gt;i_sb))</div><div class='ctx'> 		ent-&gt;de-&gt;file_type = file_type;</div><div class='ctx'> 	inode_inc_iversion(ent-&gt;dir);</div><div class='del'>-	ent-&gt;dir-&gt;i_ctime = ent-&gt;dir-&gt;i_mtime =</div><div class='del'>-		current_time(ent-&gt;dir);</div><div class='add'>+	inode_set_mtime_to_ts(ent-&gt;dir, inode_set_ctime_current(ent-&gt;dir));</div><div class='ctx'> 	retval = ext4_mark_inode_dirty(handle, ent-&gt;dir);</div><div class='ctx'> 	BUFFER_TRACE(ent-&gt;bh, "call ext4_handle_dirty_metadata");</div><div class='ctx'> 	if (!ent-&gt;inlined) {</div><div class='hunk'>@@ -3572,7 +3666,8 @@ static void ext4_resetent(handle_t *handle, struct ext4_renament *ent,</div><div class='ctx'> 	 * so the old-&gt;de may no longer valid and need to find it again</div><div class='ctx'> 	 * before reset old inode info.</div><div class='ctx'> 	 */</div><div class='del'>-	old.bh = ext4_find_entry(old.dir, &amp;old.dentry-&gt;d_name, &amp;old.de, NULL);</div><div class='add'>+	old.bh = ext4_find_entry(old.dir, &amp;old.dentry-&gt;d_name, &amp;old.de,</div><div class='add'>+				 &amp;old.inlined);</div><div class='ctx'> 	if (IS_ERR(old.bh))</div><div class='ctx'> 		retval = PTR_ERR(old.bh);</div><div class='ctx'> 	if (!old.bh)</div><div class='hunk'>@@ -3591,7 +3686,7 @@ static int ext4_find_delete_entry(handle_t *handle, struct inode *dir,</div><div class='ctx'> {</div><div class='ctx'> 	int retval = -ENOENT;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='del'>-	struct ext4_dir_entry_2 *de;</div><div class='add'>+	struct ext4_dir_entry_2 *de = NULL;</div><div class='ctx'> </div><div class='ctx'> 	bh = ext4_find_entry(dir, d_name, &amp;de, NULL);</div><div class='ctx'> 	if (IS_ERR(bh))</div><div class='hunk'>@@ -3646,7 +3741,7 @@ static void ext4_update_dir_count(handle_t *handle, struct ext4_renament *ent)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct inode *ext4_whiteout_for_rename(struct user_namespace *mnt_userns,</div><div class='add'>+static struct inode *ext4_whiteout_for_rename(struct mnt_idmap *idmap,</div><div class='ctx'> 					      struct ext4_renament *ent,</div><div class='ctx'> 					      int credits, handle_t **h)</div><div class='ctx'> {</div><div class='hunk'>@@ -3661,7 +3756,7 @@ static struct inode *ext4_whiteout_for_rename(struct user_namespace *mnt_userns,</div><div class='ctx'> 	credits += (EXT4_MAXQUOTAS_TRANS_BLOCKS(ent-&gt;dir-&gt;i_sb) +</div><div class='ctx'> 		    EXT4_XATTR_TRANS_BLOCKS + 4);</div><div class='ctx'> retry:</div><div class='del'>-	wh = ext4_new_inode_start_handle(mnt_userns, ent-&gt;dir,</div><div class='add'>+	wh = ext4_new_inode_start_handle(idmap, ent-&gt;dir,</div><div class='ctx'> 					 S_IFCHR | WHITEOUT_MODE,</div><div class='ctx'> 					 &amp;ent-&gt;dentry-&gt;d_name, 0, NULL,</div><div class='ctx'> 					 EXT4_HT_DIR, credits);</div><div class='hunk'>@@ -3689,7 +3784,7 @@ retry:</div><div class='ctx'>  * while new_{dentry,inode) refers to the destination dentry/inode</div><div class='ctx'>  * This comes from rename(const char *oldpath, const char *newpath)</div><div class='ctx'>  */</div><div class='del'>-static int ext4_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='add'>+static int ext4_rename(struct mnt_idmap *idmap, struct inode *old_dir,</div><div class='ctx'> 		       struct dentry *old_dentry, struct inode *new_dir,</div><div class='ctx'> 		       struct dentry *new_dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='hunk'>@@ -3724,6 +3819,9 @@ static int ext4_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> 	retval = dquot_initialize(old.dir);</div><div class='ctx'> 	if (retval)</div><div class='ctx'> 		return retval;</div><div class='add'>+	retval = dquot_initialize(old.inode);</div><div class='add'>+	if (retval)</div><div class='add'>+		return retval;</div><div class='ctx'> 	retval = dquot_initialize(new.dir);</div><div class='ctx'> 	if (retval)</div><div class='ctx'> 		return retval;</div><div class='hunk'>@@ -3736,9 +3834,11 @@ static int ext4_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> 			return retval;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	old.bh = ext4_find_entry(old.dir, &amp;old.dentry-&gt;d_name, &amp;old.de, NULL);</div><div class='add'>+	old.bh = ext4_find_entry(old.dir, &amp;old.dentry-&gt;d_name, &amp;old.de,</div><div class='add'>+				 &amp;old.inlined);</div><div class='ctx'> 	if (IS_ERR(old.bh))</div><div class='ctx'> 		return PTR_ERR(old.bh);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 *  Check for inode number is _not_ due to possible IO errors.</div><div class='ctx'> 	 *  We might rmdir the source, keep it as pwd of some process</div><div class='hunk'>@@ -3774,7 +3874,7 @@ static int ext4_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> 			goto release_bh;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='del'>-		whiteout = ext4_whiteout_for_rename(mnt_userns, &amp;old, credits, &amp;handle);</div><div class='add'>+		whiteout = ext4_whiteout_for_rename(idmap, &amp;old, credits, &amp;handle);</div><div class='ctx'> 		if (IS_ERR(whiteout)) {</div><div class='ctx'> 			retval = PTR_ERR(whiteout);</div><div class='ctx'> 			goto release_bh;</div><div class='hunk'>@@ -3795,7 +3895,7 @@ static int ext4_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> 			if (new.dir != old.dir &amp;&amp; EXT4_DIR_LINK_MAX(new.dir))</div><div class='ctx'> 				goto end_rename;</div><div class='ctx'> 		}</div><div class='del'>-		retval = ext4_rename_dir_prepare(handle, &amp;old);</div><div class='add'>+		retval = ext4_rename_dir_prepare(handle, &amp;old, new.dir != old.dir);</div><div class='ctx'> 		if (retval)</div><div class='ctx'> 			goto end_rename;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3841,7 +3941,7 @@ static int ext4_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> 	 * Like most other Unix systems, set the ctime for inodes on a</div><div class='ctx'> 	 * rename.</div><div class='ctx'> 	 */</div><div class='del'>-	old.inode-&gt;i_ctime = current_time(old.inode);</div><div class='add'>+	inode_set_ctime_current(old.inode);</div><div class='ctx'> 	retval = ext4_mark_inode_dirty(handle, old.inode);</div><div class='ctx'> 	if (unlikely(retval))</div><div class='ctx'> 		goto end_rename;</div><div class='hunk'>@@ -3855,11 +3955,11 @@ static int ext4_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> </div><div class='ctx'> 	if (new.inode) {</div><div class='ctx'> 		ext4_dec_count(new.inode);</div><div class='del'>-		new.inode-&gt;i_ctime = current_time(new.inode);</div><div class='add'>+		inode_set_ctime_current(new.inode);</div><div class='ctx'> 	}</div><div class='del'>-	old.dir-&gt;i_ctime = old.dir-&gt;i_mtime = current_time(old.dir);</div><div class='add'>+	inode_set_mtime_to_ts(old.dir, inode_set_ctime_current(old.dir));</div><div class='ctx'> 	ext4_update_dx_flag(old.dir);</div><div class='del'>-	if (old.dir_bh) {</div><div class='add'>+	if (old.is_dir) {</div><div class='ctx'> 		retval = ext4_rename_dir_finish(handle, &amp;old, new.dir-&gt;i_ino);</div><div class='ctx'> 		if (retval)</div><div class='ctx'> 			goto end_rename;</div><div class='hunk'>@@ -3882,21 +3982,28 @@ static int ext4_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> 	if (unlikely(retval))</div><div class='ctx'> 		goto end_rename;</div><div class='ctx'> </div><div class='del'>-	if (S_ISDIR(old.inode-&gt;i_mode)) {</div><div class='add'>+	if (old.is_dir) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We disable fast commits here that's because the</div><div class='ctx'> 		 * replay code is not yet capable of changing dot dot</div><div class='ctx'> 		 * dirents in directories.</div><div class='ctx'> 		 */</div><div class='ctx'> 		ext4_fc_mark_ineligible(old.inode-&gt;i_sb,</div><div class='del'>-			EXT4_FC_REASON_RENAME_DIR);</div><div class='add'>+			EXT4_FC_REASON_RENAME_DIR, handle);</div><div class='ctx'> 	} else {</div><div class='add'>+		struct super_block *sb = old.inode-&gt;i_sb;</div><div class='add'>+</div><div class='ctx'> 		if (new.inode)</div><div class='ctx'> 			ext4_fc_track_unlink(handle, new.dentry);</div><div class='del'>-		__ext4_fc_track_link(handle, old.inode, new.dentry);</div><div class='del'>-		__ext4_fc_track_unlink(handle, old.inode, old.dentry);</div><div class='del'>-		if (whiteout)</div><div class='del'>-			__ext4_fc_track_create(handle, whiteout, old.dentry);</div><div class='add'>+		if (test_opt2(sb, JOURNAL_FAST_COMMIT) &amp;&amp;</div><div class='add'>+		    !(EXT4_SB(sb)-&gt;s_mount_state &amp; EXT4_FC_REPLAY) &amp;&amp;</div><div class='add'>+		    !(ext4_test_mount_flag(sb, EXT4_MF_FC_INELIGIBLE))) {</div><div class='add'>+			__ext4_fc_track_link(handle, old.inode, new.dentry);</div><div class='add'>+			__ext4_fc_track_unlink(handle, old.inode, old.dentry);</div><div class='add'>+			if (whiteout)</div><div class='add'>+				__ext4_fc_track_create(handle, whiteout,</div><div class='add'>+						       old.dentry);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (new.inode) {</div><div class='hunk'>@@ -3914,6 +4021,7 @@ end_rename:</div><div class='ctx'> 			ext4_resetent(handle, &amp;old,</div><div class='ctx'> 				      old.inode-&gt;i_ino, old_file_type);</div><div class='ctx'> 			drop_nlink(whiteout);</div><div class='add'>+			ext4_mark_inode_dirty(handle, whiteout);</div><div class='ctx'> 			ext4_orphan_add(handle, whiteout);</div><div class='ctx'> 		}</div><div class='ctx'> 		unlock_new_inode(whiteout);</div><div class='hunk'>@@ -3926,6 +4034,7 @@ release_bh:</div><div class='ctx'> 	brelse(old.dir_bh);</div><div class='ctx'> 	brelse(old.bh);</div><div class='ctx'> 	brelse(new.bh);</div><div class='add'>+</div><div class='ctx'> 	return retval;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3945,7 +4054,6 @@ static int ext4_cross_rename(struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> 	};</div><div class='ctx'> 	u8 new_file_type;</div><div class='ctx'> 	int retval;</div><div class='del'>-	struct timespec64 ctime;</div><div class='ctx'> </div><div class='ctx'> 	if ((ext4_test_inode_flag(new_dir, EXT4_INODE_PROJINHERIT) &amp;&amp;</div><div class='ctx'> 	     !projid_eq(EXT4_I(new_dir)-&gt;i_projid,</div><div class='hunk'>@@ -4001,14 +4109,12 @@ static int ext4_cross_rename(struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> 		ext4_handle_sync(handle);</div><div class='ctx'> </div><div class='ctx'> 	if (S_ISDIR(old.inode-&gt;i_mode)) {</div><div class='del'>-		old.is_dir = true;</div><div class='del'>-		retval = ext4_rename_dir_prepare(handle, &amp;old);</div><div class='add'>+		retval = ext4_rename_dir_prepare(handle, &amp;old, new.dir != old.dir);</div><div class='ctx'> 		if (retval)</div><div class='ctx'> 			goto end_rename;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (S_ISDIR(new.inode-&gt;i_mode)) {</div><div class='del'>-		new.is_dir = true;</div><div class='del'>-		retval = ext4_rename_dir_prepare(handle, &amp;new);</div><div class='add'>+		retval = ext4_rename_dir_prepare(handle, &amp;new, new.dir != old.dir);</div><div class='ctx'> 		if (retval)</div><div class='ctx'> 			goto end_rename;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -4039,9 +4145,8 @@ static int ext4_cross_rename(struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> 	 * Like most other Unix systems, set the ctime for inodes on a</div><div class='ctx'> 	 * rename.</div><div class='ctx'> 	 */</div><div class='del'>-	ctime = current_time(old.inode);</div><div class='del'>-	old.inode-&gt;i_ctime = ctime;</div><div class='del'>-	new.inode-&gt;i_ctime = ctime;</div><div class='add'>+	inode_set_ctime_current(old.inode);</div><div class='add'>+	inode_set_ctime_current(new.inode);</div><div class='ctx'> 	retval = ext4_mark_inode_dirty(handle, old.inode);</div><div class='ctx'> 	if (unlikely(retval))</div><div class='ctx'> 		goto end_rename;</div><div class='hunk'>@@ -4049,7 +4154,7 @@ static int ext4_cross_rename(struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> 	if (unlikely(retval))</div><div class='ctx'> 		goto end_rename;</div><div class='ctx'> 	ext4_fc_mark_ineligible(new.inode-&gt;i_sb,</div><div class='del'>-				EXT4_FC_REASON_CROSS_RENAME);</div><div class='add'>+				EXT4_FC_REASON_CROSS_RENAME, handle);</div><div class='ctx'> 	if (old.dir_bh) {</div><div class='ctx'> 		retval = ext4_rename_dir_finish(handle, &amp;old, new.dir-&gt;i_ino);</div><div class='ctx'> 		if (retval)</div><div class='hunk'>@@ -4074,15 +4179,16 @@ end_rename:</div><div class='ctx'> 	return retval;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext4_rename2(struct user_namespace *mnt_userns,</div><div class='add'>+static int ext4_rename2(struct mnt_idmap *idmap,</div><div class='ctx'> 			struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> 			struct inode *new_dir, struct dentry *new_dentry,</div><div class='ctx'> 			unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ext4_forced_shutdown(EXT4_SB(old_dir-&gt;i_sb))))</div><div class='del'>-		return -EIO;</div><div class='add'>+	err = ext4_emergency_state(old_dir-&gt;i_sb);</div><div class='add'>+	if (unlikely(err))</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; ~(RENAME_NOREPLACE | RENAME_EXCHANGE | RENAME_WHITEOUT))</div><div class='ctx'> 		return -EINVAL;</div><div class='hunk'>@@ -4097,7 +4203,7 @@ static int ext4_rename2(struct user_namespace *mnt_userns,</div><div class='ctx'> 					 new_dir, new_dentry);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return ext4_rename(mnt_userns, old_dir, old_dentry, new_dir, new_dentry, flags);</div><div class='add'>+	return ext4_rename(idmap, old_dir, old_dentry, new_dir, new_dentry, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -4117,7 +4223,7 @@ const struct inode_operations ext4_dir_inode_operations = {</div><div class='ctx'> 	.setattr	= ext4_setattr,</div><div class='ctx'> 	.getattr	= ext4_getattr,</div><div class='ctx'> 	.listxattr	= ext4_listxattr,</div><div class='del'>-	.get_acl	= ext4_get_acl,</div><div class='add'>+	.get_inode_acl	= ext4_get_acl,</div><div class='ctx'> 	.set_acl	= ext4_set_acl,</div><div class='ctx'> 	.fiemap         = ext4_fiemap,</div><div class='ctx'> 	.fileattr_get	= ext4_fileattr_get,</div><div class='hunk'>@@ -4128,6 +4234,6 @@ const struct inode_operations ext4_special_inode_operations = {</div><div class='ctx'> 	.setattr	= ext4_setattr,</div><div class='ctx'> 	.getattr	= ext4_getattr,</div><div class='ctx'> 	.listxattr	= ext4_listxattr,</div><div class='del'>-	.get_acl	= ext4_get_acl,</div><div class='add'>+	.get_inode_acl	= ext4_get_acl,</div><div class='ctx'> 	.set_acl	= ext4_set_acl,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/ext4/orphan.c b/fs/ext4/orphan.c<br/>index 53adc8f570a3..c9b93b670b0f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/orphan.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/orphan.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/orphan.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/orphan.c</a></div><div class='hunk'>@@ -8,6 +8,8 @@</div><div class='ctx'> #include "ext4.h"</div><div class='ctx'> #include "ext4_jbd2.h"</div><div class='ctx'> </div><div class='add'>+#define EXT4_MAX_ORPHAN_FILE_BLOCKS 512</div><div class='add'>+</div><div class='ctx'> static int ext4_orphan_file_add(handle_t *handle, struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	int i, j, start;</div><div class='hunk'>@@ -93,7 +95,7 @@ static int ext4_orphan_file_add(handle_t *handle, struct inode *inode)</div><div class='ctx'>  * At filesystem recovery time, we walk this list deleting unlinked</div><div class='ctx'>  * inodes and truncating linked inodes in ext4_orphan_cleanup().</div><div class='ctx'>  *</div><div class='del'>- * Orphan list manipulation functions must be called under i_mutex unless</div><div class='add'>+ * Orphan list manipulation functions must be called under i_rwsem unless</div><div class='ctx'>  * we are just creating the inode or deleting it.</div><div class='ctx'>  */</div><div class='ctx'> int ext4_orphan_add(handle_t *handle, struct inode *inode)</div><div class='hunk'>@@ -107,19 +109,15 @@ int ext4_orphan_add(handle_t *handle, struct inode *inode)</div><div class='ctx'> 	if (!sbi-&gt;s_journal || is_bad_inode(inode))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	WARN_ON_ONCE(!(inode-&gt;i_state &amp; (I_NEW | I_FREEING)) &amp;&amp;</div><div class='add'>+	WARN_ON_ONCE(!(inode_state_read_once(inode) &amp; (I_NEW | I_FREEING)) &amp;&amp;</div><div class='ctx'> 		     !inode_is_locked(inode));</div><div class='del'>-	/*</div><div class='del'>-	 * Inode orphaned in orphan file or in orphan list?</div><div class='del'>-	 */</div><div class='del'>-	if (ext4_test_inode_state(inode, EXT4_STATE_ORPHAN_FILE) ||</div><div class='del'>-	    !list_empty(&amp;EXT4_I(inode)-&gt;i_orphan))</div><div class='add'>+	if (ext4_inode_orphan_tracked(inode))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Orphan handling is only valid for files with data blocks</div><div class='ctx'> 	 * being truncated, or files being unlinked. Note that we either</div><div class='del'>-	 * hold i_mutex, or the inode can not be referenced from outside,</div><div class='add'>+	 * hold i_rwsem, or the inode can not be referenced from outside,</div><div class='ctx'> 	 * so i_nlink should not be bumped due to race</div><div class='ctx'> 	 */</div><div class='ctx'> 	ASSERT((S_ISREG(inode-&gt;i_mode) || S_ISDIR(inode-&gt;i_mode) ||</div><div class='hunk'>@@ -181,8 +179,8 @@ int ext4_orphan_add(handle_t *handle, struct inode *inode)</div><div class='ctx'> 	} else</div><div class='ctx'> 		brelse(iloc.bh);</div><div class='ctx'> </div><div class='del'>-	jbd_debug(4, "superblock will point to %lu\n", inode-&gt;i_ino);</div><div class='del'>-	jbd_debug(4, "orphan inode %lu will point to %d\n",</div><div class='add'>+	ext4_debug("superblock will point to %lu\n", inode-&gt;i_ino);</div><div class='add'>+	ext4_debug("orphan inode %lu will point to %d\n",</div><div class='ctx'> 			inode-&gt;i_ino, NEXT_ORPHAN(inode));</div><div class='ctx'> out:</div><div class='ctx'> 	ext4_std_error(sb, err);</div><div class='hunk'>@@ -236,7 +234,7 @@ int ext4_orphan_del(handle_t *handle, struct inode *inode)</div><div class='ctx'> 	if (!sbi-&gt;s_journal &amp;&amp; !(sbi-&gt;s_mount_state &amp; EXT4_ORPHAN_FS))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	WARN_ON_ONCE(!(inode-&gt;i_state &amp; (I_NEW | I_FREEING)) &amp;&amp;</div><div class='add'>+	WARN_ON_ONCE(!(inode_state_read_once(inode) &amp; (I_NEW | I_FREEING)) &amp;&amp;</div><div class='ctx'> 		     !inode_is_locked(inode));</div><div class='ctx'> 	if (ext4_test_inode_state(inode, EXT4_STATE_ORPHAN_FILE))</div><div class='ctx'> 		return ext4_orphan_file_del(handle, inode);</div><div class='hunk'>@@ -251,7 +249,7 @@ int ext4_orphan_del(handle_t *handle, struct inode *inode)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;sbi-&gt;s_orphan_lock);</div><div class='del'>-	jbd_debug(4, "remove inode %lu from orphan list\n", inode-&gt;i_ino);</div><div class='add'>+	ext4_debug("remove inode %lu from orphan list\n", inode-&gt;i_ino);</div><div class='ctx'> </div><div class='ctx'> 	prev = ei-&gt;i_orphan.prev;</div><div class='ctx'> 	list_del_init(&amp;ei-&gt;i_orphan);</div><div class='hunk'>@@ -267,7 +265,7 @@ int ext4_orphan_del(handle_t *handle, struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> 	ino_next = NEXT_ORPHAN(inode);</div><div class='ctx'> 	if (prev == &amp;sbi-&gt;s_orphan) {</div><div class='del'>-		jbd_debug(4, "superblock will point to %u\n", ino_next);</div><div class='add'>+		ext4_debug("superblock will point to %u\n", ino_next);</div><div class='ctx'> 		BUFFER_TRACE(sbi-&gt;s_sbh, "get_write_access");</div><div class='ctx'> 		err = ext4_journal_get_write_access(handle, inode-&gt;i_sb,</div><div class='ctx'> 						    sbi-&gt;s_sbh, EXT4_JTR_NONE);</div><div class='hunk'>@@ -286,7 +284,7 @@ int ext4_orphan_del(handle_t *handle, struct inode *inode)</div><div class='ctx'> 		struct inode *i_prev =</div><div class='ctx'> 			&amp;list_entry(prev, struct ext4_inode_info, i_orphan)-&gt;vfs_inode;</div><div class='ctx'> </div><div class='del'>-		jbd_debug(4, "orphan inode %lu will point to %u\n",</div><div class='add'>+		ext4_debug("orphan inode %lu will point to %u\n",</div><div class='ctx'> 			  i_prev-&gt;i_ino, ino_next);</div><div class='ctx'> 		err = ext4_reserve_inode_write(handle, i_prev, &amp;iloc2);</div><div class='ctx'> 		if (err) {</div><div class='hunk'>@@ -332,8 +330,8 @@ static void ext4_process_orphan(struct inode *inode,</div><div class='ctx'> 			ext4_msg(sb, KERN_DEBUG,</div><div class='ctx'> 				"%s: truncating inode %lu to %lld bytes",</div><div class='ctx'> 				__func__, inode-&gt;i_ino, inode-&gt;i_size);</div><div class='del'>-		jbd_debug(2, "truncating inode %lu to %lld bytes\n",</div><div class='del'>-			  inode-&gt;i_ino, inode-&gt;i_size);</div><div class='add'>+		ext4_debug("truncating inode %lu to %lld bytes\n",</div><div class='add'>+			   inode-&gt;i_ino, inode-&gt;i_size);</div><div class='ctx'> 		inode_lock(inode);</div><div class='ctx'> 		truncate_inode_pages(inode-&gt;i_mapping, inode-&gt;i_size);</div><div class='ctx'> 		ret = ext4_truncate(inode);</div><div class='hunk'>@@ -353,8 +351,8 @@ static void ext4_process_orphan(struct inode *inode,</div><div class='ctx'> 			ext4_msg(sb, KERN_DEBUG,</div><div class='ctx'> 				"%s: deleting unreferenced inode %lu",</div><div class='ctx'> 				__func__, inode-&gt;i_ino);</div><div class='del'>-		jbd_debug(2, "deleting unreferenced inode %lu\n",</div><div class='del'>-			  inode-&gt;i_ino);</div><div class='add'>+		ext4_debug("deleting unreferenced inode %lu\n",</div><div class='add'>+			   inode-&gt;i_ino);</div><div class='ctx'> 		(*nr_orphans)++;</div><div class='ctx'> 	}</div><div class='ctx'> 	iput(inode);  /* The delete magic happens here! */</div><div class='hunk'>@@ -391,7 +389,7 @@ void ext4_orphan_cleanup(struct super_block *sb, struct ext4_super_block *es)</div><div class='ctx'> 	int inodes_per_ob = ext4_inodes_per_orphan_block(sb);</div><div class='ctx'> </div><div class='ctx'> 	if (!es-&gt;s_last_orphan &amp;&amp; !oi-&gt;of_blocks) {</div><div class='del'>-		jbd_debug(4, "no orphan inodes to clean up\n");</div><div class='add'>+		ext4_debug("no orphan inodes to clean up\n");</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -412,10 +410,10 @@ void ext4_orphan_cleanup(struct super_block *sb, struct ext4_super_block *es)</div><div class='ctx'> 		/* don't clear list on RO mount w/ errors */</div><div class='ctx'> 		if (es-&gt;s_last_orphan &amp;&amp; !(s_flags &amp; SB_RDONLY)) {</div><div class='ctx'> 			ext4_msg(sb, KERN_INFO, "Errors on filesystem, "</div><div class='del'>-				  "clearing orphan list.\n");</div><div class='add'>+				  "clearing orphan list.");</div><div class='ctx'> 			es-&gt;s_last_orphan = 0;</div><div class='ctx'> 		}</div><div class='del'>-		jbd_debug(1, "Skipping orphan recovery on fs with errors.\n");</div><div class='add'>+		ext4_debug("Skipping orphan recovery on fs with errors.\n");</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -459,7 +457,7 @@ void ext4_orphan_cleanup(struct super_block *sb, struct ext4_super_block *es)</div><div class='ctx'> 		 * so, skip the rest.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (EXT4_SB(sb)-&gt;s_mount_state &amp; EXT4_ERROR_FS) {</div><div class='del'>-			jbd_debug(1, "Skipping orphan recovery on fs with errors.\n");</div><div class='add'>+			ext4_debug("Skipping orphan recovery on fs with errors.\n");</div><div class='ctx'> 			es-&gt;s_last_orphan = 0;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -517,7 +515,7 @@ void ext4_release_orphan_info(struct super_block *sb)</div><div class='ctx'> 		return;</div><div class='ctx'> 	for (i = 0; i &lt; oi-&gt;of_blocks; i++)</div><div class='ctx'> 		brelse(oi-&gt;of_binfo[i].ob_bh);</div><div class='del'>-	kfree(oi-&gt;of_binfo);</div><div class='add'>+	kvfree(oi-&gt;of_binfo);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct ext4_orphan_block_tail *ext4_orphan_block_tail(</div><div class='hunk'>@@ -537,13 +535,13 @@ static int ext4_orphan_file_block_csum_verify(struct super_block *sb,</div><div class='ctx'> 	struct ext4_orphan_block_tail *ot;</div><div class='ctx'> 	__le64 dsk_block_nr = cpu_to_le64(bh-&gt;b_blocknr);</div><div class='ctx'> </div><div class='del'>-	if (!ext4_has_metadata_csum(sb))</div><div class='add'>+	if (!ext4_has_feature_metadata_csum(sb))</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='ctx'> 	ot = ext4_orphan_block_tail(sb, bh);</div><div class='del'>-	calculated = ext4_chksum(EXT4_SB(sb), oi-&gt;of_csum_seed,</div><div class='del'>-				 (__u8 *)&amp;dsk_block_nr, sizeof(dsk_block_nr));</div><div class='del'>-	calculated = ext4_chksum(EXT4_SB(sb), calculated, (__u8 *)bh-&gt;b_data,</div><div class='add'>+	calculated = ext4_chksum(oi-&gt;of_csum_seed, (__u8 *)&amp;dsk_block_nr,</div><div class='add'>+				 sizeof(dsk_block_nr));</div><div class='add'>+	calculated = ext4_chksum(calculated, (__u8 *)bh-&gt;b_data,</div><div class='ctx'> 				 inodes_per_ob * sizeof(__u32));</div><div class='ctx'> 	return le32_to_cpu(ot-&gt;ob_checksum) == calculated;</div><div class='ctx'> }</div><div class='hunk'>@@ -560,10 +558,9 @@ void ext4_orphan_file_block_trigger(struct jbd2_buffer_trigger_type *triggers,</div><div class='ctx'> 	struct ext4_orphan_block_tail *ot;</div><div class='ctx'> 	__le64 dsk_block_nr = cpu_to_le64(bh-&gt;b_blocknr);</div><div class='ctx'> </div><div class='del'>-	csum = ext4_chksum(EXT4_SB(sb), oi-&gt;of_csum_seed,</div><div class='del'>-			   (__u8 *)&amp;dsk_block_nr, sizeof(dsk_block_nr));</div><div class='del'>-	csum = ext4_chksum(EXT4_SB(sb), csum, (__u8 *)data,</div><div class='del'>-			   inodes_per_ob * sizeof(__u32));</div><div class='add'>+	csum = ext4_chksum(oi-&gt;of_csum_seed, (__u8 *)&amp;dsk_block_nr,</div><div class='add'>+			   sizeof(dsk_block_nr));</div><div class='add'>+	csum = ext4_chksum(csum, (__u8 *)data, inodes_per_ob * sizeof(__u32));</div><div class='ctx'> 	ot = ext4_orphan_block_tail(sb, bh);</div><div class='ctx'> 	ot-&gt;ob_checksum = cpu_to_le32(csum);</div><div class='ctx'> }</div><div class='hunk'>@@ -588,10 +585,22 @@ int ext4_init_orphan_info(struct super_block *sb)</div><div class='ctx'> 		ext4_msg(sb, KERN_ERR, "get orphan inode failed");</div><div class='ctx'> 		return PTR_ERR(inode);</div><div class='ctx'> 	}</div><div class='add'>+	/*</div><div class='add'>+	 * This is just an artificial limit to prevent corrupted fs from</div><div class='add'>+	 * consuming absurd amounts of memory when pinning blocks of orphan</div><div class='add'>+	 * file in memory.</div><div class='add'>+	 */</div><div class='add'>+	if (inode-&gt;i_size &gt; (EXT4_MAX_ORPHAN_FILE_BLOCKS &lt;&lt; inode-&gt;i_blkbits)) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR, "orphan file too big: %llu",</div><div class='add'>+			 (unsigned long long)inode-&gt;i_size);</div><div class='add'>+		ret = -EFSCORRUPTED;</div><div class='add'>+		goto out_put;</div><div class='add'>+	}</div><div class='ctx'> 	oi-&gt;of_blocks = inode-&gt;i_size &gt;&gt; sb-&gt;s_blocksize_bits;</div><div class='ctx'> 	oi-&gt;of_csum_seed = EXT4_I(inode)-&gt;i_csum_seed;</div><div class='del'>-	oi-&gt;of_binfo = kmalloc(oi-&gt;of_blocks*sizeof(struct ext4_orphan_block),</div><div class='del'>-			       GFP_KERNEL);</div><div class='add'>+	oi-&gt;of_binfo = kvmalloc_array(oi-&gt;of_blocks,</div><div class='add'>+				     sizeof(struct ext4_orphan_block),</div><div class='add'>+				     GFP_KERNEL);</div><div class='ctx'> 	if (!oi-&gt;of_binfo) {</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='ctx'> 		goto out_put;</div><div class='hunk'>@@ -630,7 +639,7 @@ int ext4_init_orphan_info(struct super_block *sb)</div><div class='ctx'> out_free:</div><div class='ctx'> 	for (i--; i &gt;= 0; i--)</div><div class='ctx'> 		brelse(oi-&gt;of_binfo[i].ob_bh);</div><div class='del'>-	kfree(oi-&gt;of_binfo);</div><div class='add'>+	kvfree(oi-&gt;of_binfo);</div><div class='ctx'> out_put:</div><div class='ctx'> 	iput(inode);</div><div class='ctx'> 	return ret;</div><div class='head'>diff --git a/fs/ext4/page-io.c b/fs/ext4/page-io.c<br/>index 9cb261714991..39abfeec5f36 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/page-io.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/page-io.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/page-io.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/page-io.c</a></div><div class='hunk'>@@ -24,7 +24,7 @@</div><div class='ctx'> #include &lt;linux/kernel.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/mm.h&gt;</div><div class='del'>-#include &lt;linux/backing-dev.h&gt;</div><div class='add'>+#include &lt;linux/sched/mm.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "ext4_jbd2.h"</div><div class='ctx'> #include "xattr.h"</div><div class='hunk'>@@ -99,30 +99,29 @@ static void buffer_io_error(struct buffer_head *bh)</div><div class='ctx'> </div><div class='ctx'> static void ext4_finish_bio(struct bio *bio)</div><div class='ctx'> {</div><div class='del'>-	struct bio_vec *bvec;</div><div class='del'>-	struct bvec_iter_all iter_all;</div><div class='add'>+	struct folio_iter fi;</div><div class='ctx'> </div><div class='del'>-	bio_for_each_segment_all(bvec, bio, iter_all) {</div><div class='del'>-		struct page *page = bvec-&gt;bv_page;</div><div class='del'>-		struct page *bounce_page = NULL;</div><div class='add'>+	bio_for_each_folio_all(fi, bio) {</div><div class='add'>+		struct folio *folio = fi.folio;</div><div class='add'>+		struct folio *io_folio = NULL;</div><div class='ctx'> 		struct buffer_head *bh, *head;</div><div class='del'>-		unsigned bio_start = bvec-&gt;bv_offset;</div><div class='del'>-		unsigned bio_end = bio_start + bvec-&gt;bv_len;</div><div class='add'>+		size_t bio_start = fi.offset;</div><div class='add'>+		size_t bio_end = bio_start + fi.length;</div><div class='ctx'> 		unsigned under_io = 0;</div><div class='ctx'> 		unsigned long flags;</div><div class='ctx'> </div><div class='del'>-		if (fscrypt_is_bounce_page(page)) {</div><div class='del'>-			bounce_page = page;</div><div class='del'>-			page = fscrypt_pagecache_page(bounce_page);</div><div class='add'>+		if (fscrypt_is_bounce_folio(folio)) {</div><div class='add'>+			io_folio = folio;</div><div class='add'>+			folio = fscrypt_pagecache_folio(folio);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (bio-&gt;bi_status) {</div><div class='del'>-			SetPageError(page);</div><div class='del'>-			mapping_set_error(page-&gt;mapping, -EIO);</div><div class='add'>+			int err = blk_status_to_errno(bio-&gt;bi_status);</div><div class='add'>+			mapping_set_error(folio-&gt;mapping, err);</div><div class='ctx'> 		}</div><div class='del'>-		bh = head = page_buffers(page);</div><div class='add'>+		bh = head = folio_buffers(folio);</div><div class='ctx'> 		/*</div><div class='del'>-		 * We check all buffers in the page under b_uptodate_lock</div><div class='add'>+		 * We check all buffers in the folio under b_uptodate_lock</div><div class='ctx'> 		 * to avoid races with other end io clearing async_write flags</div><div class='ctx'> 		 */</div><div class='ctx'> 		spin_lock_irqsave(&amp;head-&gt;b_uptodate_lock, flags);</div><div class='hunk'>@@ -134,13 +133,15 @@ static void ext4_finish_bio(struct bio *bio)</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> 			clear_buffer_async_write(bh);</div><div class='del'>-			if (bio-&gt;bi_status)</div><div class='add'>+			if (bio-&gt;bi_status) {</div><div class='add'>+				set_buffer_write_io_error(bh);</div><div class='ctx'> 				buffer_io_error(bh);</div><div class='add'>+			}</div><div class='ctx'> 		} while ((bh = bh-&gt;b_this_page) != head);</div><div class='ctx'> 		spin_unlock_irqrestore(&amp;head-&gt;b_uptodate_lock, flags);</div><div class='ctx'> 		if (!under_io) {</div><div class='del'>-			fscrypt_free_bounce_page(bounce_page);</div><div class='del'>-			end_page_writeback(page);</div><div class='add'>+			fscrypt_free_bounce_page(&amp;io_folio-&gt;page);</div><div class='add'>+			folio_end_writeback(folio);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -163,7 +164,8 @@ static void ext4_release_io_end(ext4_io_end_t *io_end)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Check a range of space and convert unwritten extents to written. Note that</div><div class='add'>+ * On successful IO, check a range of space and convert unwritten extents to</div><div class='add'>+ * written. On IO failure, check if journal abort is needed. Note that</div><div class='ctx'>  * we are protected from truncate touching same part of extent tree by the</div><div class='ctx'>  * fact that truncate code waits for all DIO to finish (thus exclusion from</div><div class='ctx'>  * direct IO is achieved) and also waits for PageWriteback bits. Thus we</div><div class='hunk'>@@ -174,20 +176,36 @@ static int ext4_end_io_end(ext4_io_end_t *io_end)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = io_end-&gt;inode;</div><div class='ctx'> 	handle_t *handle = io_end-&gt;handle;</div><div class='add'>+	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	ext4_debug("ext4_end_io_nolock: io_end 0x%p from inode %lu,list-&gt;next 0x%p,"</div><div class='ctx'> 		   "list-&gt;prev 0x%p\n",</div><div class='ctx'> 		   io_end, inode-&gt;i_ino, io_end-&gt;list.next, io_end-&gt;list.prev);</div><div class='ctx'> </div><div class='del'>-	io_end-&gt;handle = NULL;	/* Following call will use up the handle */</div><div class='del'>-	ret = ext4_convert_unwritten_io_end_vec(handle, io_end);</div><div class='del'>-	if (ret &lt; 0 &amp;&amp; !ext4_forced_shutdown(EXT4_SB(inode-&gt;i_sb))) {</div><div class='del'>-		ext4_msg(inode-&gt;i_sb, KERN_EMERG,</div><div class='add'>+	/*</div><div class='add'>+	 * Do not convert the unwritten extents if data writeback fails,</div><div class='add'>+	 * or stale data may be exposed.</div><div class='add'>+	 */</div><div class='add'>+	io_end-&gt;handle = NULL;  /* Following call will use up the handle */</div><div class='add'>+	if (unlikely(io_end-&gt;flag &amp; EXT4_IO_END_FAILED)) {</div><div class='add'>+		ret = -EIO;</div><div class='add'>+		if (handle)</div><div class='add'>+			jbd2_journal_free_reserved(handle);</div><div class='add'>+</div><div class='add'>+		if (test_opt(sb, DATA_ERR_ABORT))</div><div class='add'>+			jbd2_journal_abort(EXT4_SB(sb)-&gt;s_journal, ret);</div><div class='add'>+	} else {</div><div class='add'>+		ret = ext4_convert_unwritten_io_end_vec(handle, io_end);</div><div class='add'>+	}</div><div class='add'>+	if (ret &lt; 0 &amp;&amp; !ext4_emergency_state(sb) &amp;&amp;</div><div class='add'>+	    io_end-&gt;flag &amp; EXT4_IO_END_UNWRITTEN) {</div><div class='add'>+		ext4_msg(sb, KERN_EMERG,</div><div class='ctx'> 			 "failed to convert unwritten extents to written "</div><div class='ctx'> 			 "extents -- potential data loss!  "</div><div class='ctx'> 			 "(inode %lu, error %d)", inode-&gt;i_ino, ret);</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> 	ext4_clear_io_unwritten_flag(io_end);</div><div class='ctx'> 	ext4_release_io_end(io_end);</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -216,6 +234,18 @@ static void dump_completed_IO(struct inode *inode, struct list_head *head)</div><div class='ctx'> #endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool ext4_io_end_defer_completion(ext4_io_end_t *io_end)</div><div class='add'>+{</div><div class='add'>+	if (io_end-&gt;flag &amp; EXT4_IO_END_UNWRITTEN &amp;&amp;</div><div class='add'>+	    !list_empty(&amp;io_end-&gt;list_vec))</div><div class='add'>+		return true;</div><div class='add'>+	if (test_opt(io_end-&gt;inode-&gt;i_sb, DATA_ERR_ABORT) &amp;&amp;</div><div class='add'>+	    io_end-&gt;flag &amp; EXT4_IO_END_FAILED &amp;&amp;</div><div class='add'>+	    !ext4_emergency_state(io_end-&gt;inode-&gt;i_sb))</div><div class='add'>+		return true;</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /* Add the io_end to per-inode completed end_io list. */</div><div class='ctx'> static void ext4_add_complete_io(ext4_io_end_t *io_end)</div><div class='ctx'> {</div><div class='hunk'>@@ -224,9 +254,12 @@ static void ext4_add_complete_io(ext4_io_end_t *io_end)</div><div class='ctx'> 	struct workqueue_struct *wq;</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> </div><div class='del'>-	/* Only reserved conversions from writeback should enter here */</div><div class='del'>-	WARN_ON(!(io_end-&gt;flag &amp; EXT4_IO_END_UNWRITTEN));</div><div class='del'>-	WARN_ON(!io_end-&gt;handle &amp;&amp; sbi-&gt;s_journal);</div><div class='add'>+	/* Only reserved conversions or pending IO errors will enter here. */</div><div class='add'>+	WARN_ON(!(io_end-&gt;flag &amp; EXT4_IO_END_DEFER_COMPLETION));</div><div class='add'>+	WARN_ON(io_end-&gt;flag &amp; EXT4_IO_END_UNWRITTEN &amp;&amp;</div><div class='add'>+		!io_end-&gt;handle &amp;&amp; sbi-&gt;s_journal);</div><div class='add'>+	WARN_ON(!io_end-&gt;bio);</div><div class='add'>+</div><div class='ctx'> 	spin_lock_irqsave(&amp;ei-&gt;i_completed_io_lock, flags);</div><div class='ctx'> 	wq = sbi-&gt;rsv_conversion_wq;</div><div class='ctx'> 	if (list_empty(&amp;ei-&gt;i_rsv_conversion_list))</div><div class='hunk'>@@ -251,7 +284,7 @@ static int ext4_do_flush_completed_IO(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 	while (!list_empty(&amp;unwritten)) {</div><div class='ctx'> 		io_end = list_entry(unwritten.next, ext4_io_end_t, list);</div><div class='del'>-		BUG_ON(!(io_end-&gt;flag &amp; EXT4_IO_END_UNWRITTEN));</div><div class='add'>+		BUG_ON(!(io_end-&gt;flag &amp; EXT4_IO_END_DEFER_COMPLETION));</div><div class='ctx'> 		list_del_init(&amp;io_end-&gt;list);</div><div class='ctx'> </div><div class='ctx'> 		err = ext4_end_io_end(io_end);</div><div class='hunk'>@@ -262,7 +295,8 @@ static int ext4_do_flush_completed_IO(struct inode *inode,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * work on completed IO, to convert unwritten extents to extents</div><div class='add'>+ * Used to convert unwritten extents to written extents upon IO completion,</div><div class='add'>+ * or used to abort the journal upon IO errors.</div><div class='ctx'>  */</div><div class='ctx'> void ext4_end_io_rsv_work(struct work_struct *work)</div><div class='ctx'> {</div><div class='hunk'>@@ -287,29 +321,22 @@ ext4_io_end_t *ext4_init_io_end(struct inode *inode, gfp_t flags)</div><div class='ctx'> void ext4_put_io_end_defer(ext4_io_end_t *io_end)</div><div class='ctx'> {</div><div class='ctx'> 	if (refcount_dec_and_test(&amp;io_end-&gt;count)) {</div><div class='del'>-		if (!(io_end-&gt;flag &amp; EXT4_IO_END_UNWRITTEN) ||</div><div class='del'>-				list_empty(&amp;io_end-&gt;list_vec)) {</div><div class='del'>-			ext4_release_io_end(io_end);</div><div class='del'>-			return;</div><div class='del'>-		}</div><div class='del'>-		ext4_add_complete_io(io_end);</div><div class='add'>+		if (ext4_io_end_defer_completion(io_end))</div><div class='add'>+			return ext4_add_complete_io(io_end);</div><div class='add'>+</div><div class='add'>+		ext4_release_io_end(io_end);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int ext4_put_io_end(ext4_io_end_t *io_end)</div><div class='ctx'> {</div><div class='del'>-	int err = 0;</div><div class='del'>-</div><div class='ctx'> 	if (refcount_dec_and_test(&amp;io_end-&gt;count)) {</div><div class='del'>-		if (io_end-&gt;flag &amp; EXT4_IO_END_UNWRITTEN) {</div><div class='del'>-			err = ext4_convert_unwritten_io_end_vec(io_end-&gt;handle,</div><div class='del'>-								io_end);</div><div class='del'>-			io_end-&gt;handle = NULL;</div><div class='del'>-			ext4_clear_io_unwritten_flag(io_end);</div><div class='del'>-		}</div><div class='add'>+		if (ext4_io_end_defer_completion(io_end))</div><div class='add'>+			return ext4_end_io_end(io_end);</div><div class='add'>+</div><div class='ctx'> 		ext4_release_io_end(io_end);</div><div class='ctx'> 	}</div><div class='del'>-	return err;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> ext4_io_end_t *ext4_get_io_end(ext4_io_end_t *io_end)</div><div class='hunk'>@@ -323,10 +350,9 @@ static void ext4_end_bio(struct bio *bio)</div><div class='ctx'> {</div><div class='ctx'> 	ext4_io_end_t *io_end = bio-&gt;bi_private;</div><div class='ctx'> 	sector_t bi_sector = bio-&gt;bi_iter.bi_sector;</div><div class='del'>-	char b[BDEVNAME_SIZE];</div><div class='ctx'> </div><div class='del'>-	if (WARN_ONCE(!io_end, "io_end is NULL: %s: sector %Lu len %u err %d\n",</div><div class='del'>-		      bio_devname(bio, b),</div><div class='add'>+	if (WARN_ONCE(!io_end, "io_end is NULL: %pg: sector %Lu len %u err %d\n",</div><div class='add'>+		      bio-&gt;bi_bdev,</div><div class='ctx'> 		      (long long) bio-&gt;bi_iter.bi_sector,</div><div class='ctx'> 		      (unsigned) bio_sectors(bio),</div><div class='ctx'> 		      bio-&gt;bi_status)) {</div><div class='hunk'>@@ -344,11 +370,12 @@ static void ext4_end_bio(struct bio *bio)</div><div class='ctx'> 			     bio-&gt;bi_status, inode-&gt;i_ino,</div><div class='ctx'> 			     (unsigned long long)</div><div class='ctx'> 			     bi_sector &gt;&gt; (inode-&gt;i_blkbits - 9));</div><div class='add'>+		io_end-&gt;flag |= EXT4_IO_END_FAILED;</div><div class='ctx'> 		mapping_set_error(inode-&gt;i_mapping,</div><div class='ctx'> 				blk_status_to_errno(bio-&gt;bi_status));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (io_end-&gt;flag &amp; EXT4_IO_END_UNWRITTEN) {</div><div class='add'>+	if (ext4_io_end_defer_completion(io_end)) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Link bio into list hanging from io_end. We have to do it</div><div class='ctx'> 		 * atomically as bio completions can be racing against each</div><div class='hunk'>@@ -372,10 +399,8 @@ void ext4_io_submit(struct ext4_io_submit *io)</div><div class='ctx'> 	struct bio *bio = io-&gt;io_bio;</div><div class='ctx'> </div><div class='ctx'> 	if (bio) {</div><div class='del'>-		int io_op_flags = io-&gt;io_wbc-&gt;sync_mode == WB_SYNC_ALL ?</div><div class='del'>-				  REQ_SYNC : 0;</div><div class='del'>-		io-&gt;io_bio-&gt;bi_write_hint = io-&gt;io_end-&gt;inode-&gt;i_write_hint;</div><div class='del'>-		bio_set_op_attrs(io-&gt;io_bio, REQ_OP_WRITE, io_op_flags);</div><div class='add'>+		if (io-&gt;io_wbc-&gt;sync_mode == WB_SYNC_ALL)</div><div class='add'>+			io-&gt;io_bio-&gt;bi_opf |= REQ_SYNC;</div><div class='ctx'> 		submit_bio(io-&gt;io_bio);</div><div class='ctx'> 	}</div><div class='ctx'> 	io-&gt;io_bio = NULL;</div><div class='hunk'>@@ -398,10 +423,9 @@ static void io_submit_init_bio(struct ext4_io_submit *io,</div><div class='ctx'> 	 * bio_alloc will _always_ be able to allocate a bio if</div><div class='ctx'> 	 * __GFP_DIRECT_RECLAIM is set, see comments for bio_alloc_bioset().</div><div class='ctx'> 	 */</div><div class='del'>-	bio = bio_alloc(GFP_NOIO, BIO_MAX_VECS);</div><div class='add'>+	bio = bio_alloc(bh-&gt;b_bdev, BIO_MAX_VECS, REQ_OP_WRITE, GFP_NOIO);</div><div class='ctx'> 	fscrypt_set_bio_crypt_ctx_bh(bio, bh, GFP_NOIO);</div><div class='ctx'> 	bio-&gt;bi_iter.bi_sector = bh-&gt;b_blocknr * (bh-&gt;b_size &gt;&gt; 9);</div><div class='del'>-	bio_set_dev(bio, bh-&gt;b_bdev);</div><div class='ctx'> 	bio-&gt;bi_end_io = ext4_end_bio;</div><div class='ctx'> 	bio-&gt;bi_private = ext4_get_io_end(io-&gt;io_end);</div><div class='ctx'> 	io-&gt;io_bio = bio;</div><div class='hunk'>@@ -411,11 +435,10 @@ static void io_submit_init_bio(struct ext4_io_submit *io,</div><div class='ctx'> </div><div class='ctx'> static void io_submit_add_bh(struct ext4_io_submit *io,</div><div class='ctx'> 			     struct inode *inode,</div><div class='del'>-			     struct page *page,</div><div class='add'>+			     struct folio *folio,</div><div class='add'>+			     struct folio *io_folio,</div><div class='ctx'> 			     struct buffer_head *bh)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='ctx'> 	if (io-&gt;io_bio &amp;&amp; (bh-&gt;b_blocknr != io-&gt;io_next_block ||</div><div class='ctx'> 			   !fscrypt_mergeable_bio_bh(io-&gt;io_bio, bh))) {</div><div class='ctx'> submit_and_retry:</div><div class='hunk'>@@ -425,55 +448,46 @@ submit_and_retry:</div><div class='ctx'> 		io_submit_init_bio(io, bh);</div><div class='ctx'> 		io-&gt;io_bio-&gt;bi_write_hint = inode-&gt;i_write_hint;</div><div class='ctx'> 	}</div><div class='del'>-	ret = bio_add_page(io-&gt;io_bio, page, bh-&gt;b_size, bh_offset(bh));</div><div class='del'>-	if (ret != bh-&gt;b_size)</div><div class='add'>+	if (!bio_add_folio(io-&gt;io_bio, io_folio, bh-&gt;b_size, bh_offset(bh)))</div><div class='ctx'> 		goto submit_and_retry;</div><div class='del'>-	wbc_account_cgroup_owner(io-&gt;io_wbc, page, bh-&gt;b_size);</div><div class='add'>+	wbc_account_cgroup_owner(io-&gt;io_wbc, folio, bh-&gt;b_size);</div><div class='ctx'> 	io-&gt;io_next_block++;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int ext4_bio_write_page(struct ext4_io_submit *io,</div><div class='del'>-			struct page *page,</div><div class='del'>-			int len,</div><div class='del'>-			bool keep_towrite)</div><div class='add'>+int ext4_bio_write_folio(struct ext4_io_submit *io, struct folio *folio,</div><div class='add'>+		size_t len)</div><div class='ctx'> {</div><div class='del'>-	struct page *bounce_page = NULL;</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct folio *io_folio = folio;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	unsigned block_start;</div><div class='ctx'> 	struct buffer_head *bh, *head;</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	int nr_submitted = 0;</div><div class='ctx'> 	int nr_to_submit = 0;</div><div class='ctx'> 	struct writeback_control *wbc = io-&gt;io_wbc;</div><div class='add'>+	bool keep_towrite = false;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(!PageLocked(page));</div><div class='del'>-	BUG_ON(PageWriteback(page));</div><div class='del'>-</div><div class='del'>-	if (keep_towrite)</div><div class='del'>-		set_page_writeback_keepwrite(page);</div><div class='del'>-	else</div><div class='del'>-		set_page_writeback(page);</div><div class='del'>-	ClearPageError(page);</div><div class='add'>+	BUG_ON(!folio_test_locked(folio));</div><div class='add'>+	BUG_ON(folio_test_writeback(folio));</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Comments copied from block_write_full_page:</div><div class='add'>+	 * Comments copied from block_write_full_folio:</div><div class='ctx'> 	 *</div><div class='del'>-	 * The page straddles i_size.  It must be zeroed out on each and every</div><div class='add'>+	 * The folio straddles i_size.  It must be zeroed out on each and every</div><div class='ctx'> 	 * writepage invocation because it may be mmapped.  "A file is mapped</div><div class='ctx'> 	 * in multiples of the page size.  For a file that is not a multiple of</div><div class='ctx'> 	 * the page size, the remaining memory is zeroed when mapped, and</div><div class='ctx'> 	 * writes to that region are not written out to the file."</div><div class='ctx'> 	 */</div><div class='del'>-	if (len &lt; PAGE_SIZE)</div><div class='del'>-		zero_user_segment(page, len, PAGE_SIZE);</div><div class='add'>+	if (len &lt; folio_size(folio))</div><div class='add'>+		folio_zero_segment(folio, len, folio_size(folio));</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * In the first loop we prepare and mark buffers to submit. We have to</div><div class='del'>-	 * mark all buffers in the page before submitting so that</div><div class='del'>-	 * end_page_writeback() cannot be called from ext4_bio_end_io() when IO</div><div class='add'>+	 * mark all buffers in the folio before submitting so that</div><div class='add'>+	 * folio_end_writeback() cannot be called from ext4_end_bio() when IO</div><div class='ctx'> 	 * on the first buffer finishes and we are still working on submitting</div><div class='ctx'> 	 * the second buffer.</div><div class='ctx'> 	 */</div><div class='del'>-	bh = head = page_buffers(page);</div><div class='add'>+	bh = head = folio_buffers(folio);</div><div class='ctx'> 	do {</div><div class='ctx'> 		block_start = bh_offset(bh);</div><div class='ctx'> 		if (block_start &gt;= len) {</div><div class='hunk'>@@ -486,17 +500,34 @@ int ext4_bio_write_page(struct ext4_io_submit *io,</div><div class='ctx'> 			/* A hole? We can safely clear the dirty bit */</div><div class='ctx'> 			if (!buffer_mapped(bh))</div><div class='ctx'> 				clear_buffer_dirty(bh);</div><div class='del'>-			if (io-&gt;io_bio)</div><div class='del'>-				ext4_io_submit(io);</div><div class='add'>+			/*</div><div class='add'>+			 * Keeping dirty some buffer we cannot write? Make sure</div><div class='add'>+			 * to redirty the folio and keep TOWRITE tag so that</div><div class='add'>+			 * racing WB_SYNC_ALL writeback does not skip the folio.</div><div class='add'>+			 * This happens e.g. when doing writeout for</div><div class='add'>+			 * transaction commit or when journalled data is not</div><div class='add'>+			 * yet committed.</div><div class='add'>+			 */</div><div class='add'>+			if (buffer_dirty(bh) ||</div><div class='add'>+			    (buffer_jbd(bh) &amp;&amp; buffer_jbddirty(bh))) {</div><div class='add'>+				if (!folio_test_dirty(folio))</div><div class='add'>+					folio_redirty_for_writepage(wbc, folio);</div><div class='add'>+				keep_towrite = true;</div><div class='add'>+			}</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (buffer_new(bh))</div><div class='ctx'> 			clear_buffer_new(bh);</div><div class='ctx'> 		set_buffer_async_write(bh);</div><div class='add'>+		clear_buffer_dirty(bh);</div><div class='ctx'> 		nr_to_submit++;</div><div class='ctx'> 	} while ((bh = bh-&gt;b_this_page) != head);</div><div class='ctx'> </div><div class='del'>-	bh = head = page_buffers(page);</div><div class='add'>+	/* Nothing to submit? Just unlock the folio... */</div><div class='add'>+	if (!nr_to_submit)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	bh = head = folio_buffers(folio);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If any blocks are being written to an encrypted file, encrypt them</div><div class='hunk'>@@ -505,9 +536,10 @@ int ext4_bio_write_page(struct ext4_io_submit *io,</div><div class='ctx'> 	 * (e.g. holes) to be unnecessarily encrypted, but this is rare and</div><div class='ctx'> 	 * can't happen in the common case of blocksize == PAGE_SIZE.</div><div class='ctx'> 	 */</div><div class='del'>-	if (fscrypt_inode_uses_fs_layer_crypto(inode) &amp;&amp; nr_to_submit) {</div><div class='add'>+	if (fscrypt_inode_uses_fs_layer_crypto(inode)) {</div><div class='ctx'> 		gfp_t gfp_flags = GFP_NOFS;</div><div class='ctx'> 		unsigned int enc_bytes = round_up(len, i_blocksize(inode));</div><div class='add'>+		struct page *bounce_page;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Since bounce page allocation uses a mempool, we can only use</div><div class='hunk'>@@ -515,47 +547,47 @@ int ext4_bio_write_page(struct ext4_io_submit *io,</div><div class='ctx'> 		 * first page of the bio.  Otherwise it can deadlock.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (io-&gt;io_bio)</div><div class='del'>-			gfp_flags = GFP_NOWAIT | __GFP_NOWARN;</div><div class='add'>+			gfp_flags = GFP_NOWAIT;</div><div class='ctx'> 	retry_encrypt:</div><div class='del'>-		bounce_page = fscrypt_encrypt_pagecache_blocks(page, enc_bytes,</div><div class='del'>-							       0, gfp_flags);</div><div class='add'>+		bounce_page = fscrypt_encrypt_pagecache_blocks(folio,</div><div class='add'>+					enc_bytes, 0, gfp_flags);</div><div class='ctx'> 		if (IS_ERR(bounce_page)) {</div><div class='ctx'> 			ret = PTR_ERR(bounce_page);</div><div class='ctx'> 			if (ret == -ENOMEM &amp;&amp;</div><div class='ctx'> 			    (io-&gt;io_bio || wbc-&gt;sync_mode == WB_SYNC_ALL)) {</div><div class='del'>-				gfp_flags = GFP_NOFS;</div><div class='add'>+				gfp_t new_gfp_flags = GFP_NOFS;</div><div class='ctx'> 				if (io-&gt;io_bio)</div><div class='ctx'> 					ext4_io_submit(io);</div><div class='ctx'> 				else</div><div class='del'>-					gfp_flags |= __GFP_NOFAIL;</div><div class='del'>-				congestion_wait(BLK_RW_ASYNC, HZ/50);</div><div class='add'>+					new_gfp_flags |= __GFP_NOFAIL;</div><div class='add'>+				memalloc_retry_wait(gfp_flags);</div><div class='add'>+				gfp_flags = new_gfp_flags;</div><div class='ctx'> 				goto retry_encrypt;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			printk_ratelimited(KERN_ERR "%s: ret = %d\n", __func__, ret);</div><div class='del'>-			redirty_page_for_writepage(wbc, page);</div><div class='add'>+			folio_redirty_for_writepage(wbc, folio);</div><div class='ctx'> 			do {</div><div class='del'>-				clear_buffer_async_write(bh);</div><div class='add'>+				if (buffer_async_write(bh)) {</div><div class='add'>+					clear_buffer_async_write(bh);</div><div class='add'>+					set_buffer_dirty(bh);</div><div class='add'>+				}</div><div class='ctx'> 				bh = bh-&gt;b_this_page;</div><div class='ctx'> 			} while (bh != head);</div><div class='del'>-			goto unlock;</div><div class='add'>+</div><div class='add'>+			return ret;</div><div class='ctx'> 		}</div><div class='add'>+		io_folio = page_folio(bounce_page);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	__folio_start_writeback(folio, keep_towrite);</div><div class='add'>+</div><div class='ctx'> 	/* Now submit buffers to write */</div><div class='ctx'> 	do {</div><div class='ctx'> 		if (!buffer_async_write(bh))</div><div class='ctx'> 			continue;</div><div class='del'>-		io_submit_add_bh(io, inode,</div><div class='del'>-				 bounce_page ? bounce_page : page, bh);</div><div class='del'>-		nr_submitted++;</div><div class='del'>-		clear_buffer_dirty(bh);</div><div class='add'>+		io_submit_add_bh(io, inode, folio, io_folio, bh);</div><div class='ctx'> 	} while ((bh = bh-&gt;b_this_page) != head);</div><div class='ctx'> </div><div class='del'>-unlock:</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	/* Nothing submitted - we have to end page writeback */</div><div class='del'>-	if (!nr_submitted)</div><div class='del'>-		end_page_writeback(page);</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/ext4/readpage.c b/fs/ext4/readpage.c<br/>index 3db923403505..e7f2350c725b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/readpage.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/readpage.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/readpage.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/readpage.c</a></div><div class='hunk'>@@ -43,7 +43,6 @@</div><div class='ctx'> #include &lt;linux/writeback.h&gt;</div><div class='ctx'> #include &lt;linux/backing-dev.h&gt;</div><div class='ctx'> #include &lt;linux/pagevec.h&gt;</div><div class='del'>-#include &lt;linux/cleancache.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "ext4.h"</div><div class='ctx'> </div><div class='hunk'>@@ -69,23 +68,10 @@ struct bio_post_read_ctx {</div><div class='ctx'> </div><div class='ctx'> static void __read_end_io(struct bio *bio)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='del'>-	struct bio_vec *bv;</div><div class='del'>-	struct bvec_iter_all iter_all;</div><div class='del'>-</div><div class='del'>-	bio_for_each_segment_all(bv, bio, iter_all) {</div><div class='del'>-		page = bv-&gt;bv_page;</div><div class='del'>-</div><div class='del'>-		/* PG_error was set if any post_read step failed */</div><div class='del'>-		if (bio-&gt;bi_status || PageError(page)) {</div><div class='del'>-			ClearPageUptodate(page);</div><div class='del'>-			/* will re-read again later */</div><div class='del'>-			ClearPageError(page);</div><div class='del'>-		} else {</div><div class='del'>-			SetPageUptodate(page);</div><div class='del'>-		}</div><div class='del'>-		unlock_page(page);</div><div class='del'>-	}</div><div class='add'>+	struct folio_iter fi;</div><div class='add'>+</div><div class='add'>+	bio_for_each_folio_all(fi, bio)</div><div class='add'>+		folio_end_read(fi.folio, bio-&gt;bi_status == 0);</div><div class='ctx'> 	if (bio-&gt;bi_private)</div><div class='ctx'> 		mempool_free(bio-&gt;bi_private, bio_post_read_ctx_pool);</div><div class='ctx'> 	bio_put(bio);</div><div class='hunk'>@@ -97,10 +83,12 @@ static void decrypt_work(struct work_struct *work)</div><div class='ctx'> {</div><div class='ctx'> 	struct bio_post_read_ctx *ctx =</div><div class='ctx'> 		container_of(work, struct bio_post_read_ctx, work);</div><div class='add'>+	struct bio *bio = ctx-&gt;bio;</div><div class='ctx'> </div><div class='del'>-	fscrypt_decrypt_bio(ctx-&gt;bio);</div><div class='del'>-</div><div class='del'>-	bio_post_read_processing(ctx);</div><div class='add'>+	if (fscrypt_decrypt_bio(bio))</div><div class='add'>+		bio_post_read_processing(ctx);</div><div class='add'>+	else</div><div class='add'>+		__read_end_io(bio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void verity_work(struct work_struct *work)</div><div class='hunk'>@@ -110,7 +98,7 @@ static void verity_work(struct work_struct *work)</div><div class='ctx'> 	struct bio *bio = ctx-&gt;bio;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * fsverity_verify_bio() may call readpages() again, and although verity</div><div class='add'>+	 * fsverity_verify_bio() may call readahead() again, and although verity</div><div class='ctx'> 	 * will be disabled for that, decryption may still be needed, causing</div><div class='ctx'> 	 * another bio_post_read_ctx to be allocated.  So to guarantee that</div><div class='ctx'> 	 * mempool_alloc() never deadlocks we must free the current ctx first.</div><div class='hunk'>@@ -164,7 +152,7 @@ static bool bio_post_read_required(struct bio *bio)</div><div class='ctx'>  *</div><div class='ctx'>  * The mpage code never puts partial pages into a BIO (except for end-of-file).</div><div class='ctx'>  * If a page does not map to a contiguous run of blocks then it simply falls</div><div class='del'>- * back to block_read_full_page().</div><div class='add'>+ * back to block_read_full_folio().</div><div class='ctx'>  *</div><div class='ctx'>  * Why is this?  If a page's completion depends on a number of different BIOs</div><div class='ctx'>  * which can complete in any order (or at the same time) then determining the</div><div class='hunk'>@@ -214,54 +202,55 @@ static void ext4_set_bio_post_read_ctx(struct bio *bio,</div><div class='ctx'> </div><div class='ctx'> static inline loff_t ext4_readpage_limit(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	if (IS_ENABLED(CONFIG_FS_VERITY) &amp;&amp;</div><div class='del'>-	    (IS_VERITY(inode) || ext4_verity_in_progress(inode)))</div><div class='add'>+	if (IS_ENABLED(CONFIG_FS_VERITY) &amp;&amp; IS_VERITY(inode))</div><div class='ctx'> 		return inode-&gt;i_sb-&gt;s_maxbytes;</div><div class='ctx'> </div><div class='ctx'> 	return i_size_read(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int ext4_mpage_readpages(struct inode *inode,</div><div class='del'>-		struct readahead_control *rac, struct page *page)</div><div class='add'>+		struct readahead_control *rac, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct bio *bio = NULL;</div><div class='ctx'> 	sector_t last_block_in_bio = 0;</div><div class='del'>-</div><div class='ctx'> 	const unsigned blkbits = inode-&gt;i_blkbits;</div><div class='del'>-	const unsigned blocks_per_page = PAGE_SIZE &gt;&gt; blkbits;</div><div class='ctx'> 	const unsigned blocksize = 1 &lt;&lt; blkbits;</div><div class='ctx'> 	sector_t next_block;</div><div class='ctx'> 	sector_t block_in_file;</div><div class='ctx'> 	sector_t last_block;</div><div class='ctx'> 	sector_t last_block_in_file;</div><div class='del'>-	sector_t blocks[MAX_BUF_PER_PAGE];</div><div class='add'>+	sector_t first_block;</div><div class='ctx'> 	unsigned page_block;</div><div class='ctx'> 	struct block_device *bdev = inode-&gt;i_sb-&gt;s_bdev;</div><div class='ctx'> 	int length;</div><div class='ctx'> 	unsigned relative_block = 0;</div><div class='ctx'> 	struct ext4_map_blocks map;</div><div class='del'>-	unsigned int nr_pages = rac ? readahead_count(rac) : 1;</div><div class='add'>+	unsigned int nr_pages, folio_pages;</div><div class='ctx'> </div><div class='ctx'> 	map.m_pblk = 0;</div><div class='ctx'> 	map.m_lblk = 0;</div><div class='ctx'> 	map.m_len = 0;</div><div class='ctx'> 	map.m_flags = 0;</div><div class='ctx'> </div><div class='del'>-	for (; nr_pages; nr_pages--) {</div><div class='add'>+	nr_pages = rac ? readahead_count(rac) : folio_nr_pages(folio);</div><div class='add'>+	for (; nr_pages; nr_pages -= folio_pages) {</div><div class='ctx'> 		int fully_mapped = 1;</div><div class='del'>-		unsigned first_hole = blocks_per_page;</div><div class='add'>+		unsigned int first_hole;</div><div class='add'>+		unsigned int blocks_per_folio;</div><div class='ctx'> </div><div class='del'>-		if (rac) {</div><div class='del'>-			page = readahead_page(rac);</div><div class='del'>-			prefetchw(&amp;page-&gt;flags);</div><div class='del'>-		}</div><div class='add'>+		if (rac)</div><div class='add'>+			folio = readahead_folio(rac);</div><div class='add'>+</div><div class='add'>+		folio_pages = folio_nr_pages(folio);</div><div class='add'>+		prefetchw(&amp;folio-&gt;flags);</div><div class='ctx'> </div><div class='del'>-		if (page_has_buffers(page))</div><div class='add'>+		if (folio_buffers(folio))</div><div class='ctx'> 			goto confused;</div><div class='ctx'> </div><div class='del'>-		block_in_file = next_block =</div><div class='del'>-			(sector_t)page-&gt;index &lt;&lt; (PAGE_SHIFT - blkbits);</div><div class='del'>-		last_block = block_in_file + nr_pages * blocks_per_page;</div><div class='add'>+		blocks_per_folio = folio_size(folio) &gt;&gt; blkbits;</div><div class='add'>+		first_hole = blocks_per_folio;</div><div class='add'>+		block_in_file = next_block = EXT4_PG_TO_LBLK(inode, folio-&gt;index);</div><div class='add'>+		last_block = EXT4_PG_TO_LBLK(inode, folio-&gt;index + nr_pages);</div><div class='ctx'> 		last_block_in_file = (ext4_readpage_limit(inode) +</div><div class='ctx'> 				      blocksize - 1) &gt;&gt; blkbits;</div><div class='ctx'> 		if (last_block &gt; last_block_in_file)</div><div class='hunk'>@@ -277,16 +266,15 @@ int ext4_mpage_readpages(struct inode *inode,</div><div class='ctx'> 			unsigned map_offset = block_in_file - map.m_lblk;</div><div class='ctx'> 			unsigned last = map.m_len - map_offset;</div><div class='ctx'> </div><div class='add'>+			first_block = map.m_pblk + map_offset;</div><div class='ctx'> 			for (relative_block = 0; ; relative_block++) {</div><div class='ctx'> 				if (relative_block == last) {</div><div class='ctx'> 					/* needed? */</div><div class='ctx'> 					map.m_flags &amp;= ~EXT4_MAP_MAPPED;</div><div class='ctx'> 					break;</div><div class='ctx'> 				}</div><div class='del'>-				if (page_block == blocks_per_page)</div><div class='add'>+				if (page_block == blocks_per_folio)</div><div class='ctx'> 					break;</div><div class='del'>-				blocks[page_block] = map.m_pblk + map_offset +</div><div class='del'>-					relative_block;</div><div class='ctx'> 				page_block++;</div><div class='ctx'> 				block_in_file++;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -294,73 +282,67 @@ int ext4_mpage_readpages(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Then do more ext4_map_blocks() calls until we are</div><div class='del'>-		 * done with this page.</div><div class='add'>+		 * done with this folio.</div><div class='ctx'> 		 */</div><div class='del'>-		while (page_block &lt; blocks_per_page) {</div><div class='add'>+		while (page_block &lt; blocks_per_folio) {</div><div class='ctx'> 			if (block_in_file &lt; last_block) {</div><div class='ctx'> 				map.m_lblk = block_in_file;</div><div class='ctx'> 				map.m_len = last_block - block_in_file;</div><div class='ctx'> </div><div class='ctx'> 				if (ext4_map_blocks(NULL, inode, &amp;map, 0) &lt; 0) {</div><div class='ctx'> 				set_error_page:</div><div class='del'>-					SetPageError(page);</div><div class='del'>-					zero_user_segment(page, 0,</div><div class='del'>-							  PAGE_SIZE);</div><div class='del'>-					unlock_page(page);</div><div class='add'>+					folio_zero_segment(folio, 0,</div><div class='add'>+							  folio_size(folio));</div><div class='add'>+					folio_unlock(folio);</div><div class='ctx'> 					goto next_page;</div><div class='ctx'> 				}</div><div class='ctx'> 			}</div><div class='ctx'> 			if ((map.m_flags &amp; EXT4_MAP_MAPPED) == 0) {</div><div class='ctx'> 				fully_mapped = 0;</div><div class='del'>-				if (first_hole == blocks_per_page)</div><div class='add'>+				if (first_hole == blocks_per_folio)</div><div class='ctx'> 					first_hole = page_block;</div><div class='ctx'> 				page_block++;</div><div class='ctx'> 				block_in_file++;</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='del'>-			if (first_hole != blocks_per_page)</div><div class='add'>+			if (first_hole != blocks_per_folio)</div><div class='ctx'> 				goto confused;		/* hole -&gt; non-hole */</div><div class='ctx'> </div><div class='ctx'> 			/* Contiguous blocks? */</div><div class='del'>-			if (page_block &amp;&amp; blocks[page_block-1] != map.m_pblk-1)</div><div class='add'>+			if (!page_block)</div><div class='add'>+				first_block = map.m_pblk;</div><div class='add'>+			else if (first_block + page_block != map.m_pblk)</div><div class='ctx'> 				goto confused;</div><div class='ctx'> 			for (relative_block = 0; ; relative_block++) {</div><div class='ctx'> 				if (relative_block == map.m_len) {</div><div class='ctx'> 					/* needed? */</div><div class='ctx'> 					map.m_flags &amp;= ~EXT4_MAP_MAPPED;</div><div class='ctx'> 					break;</div><div class='del'>-				} else if (page_block == blocks_per_page)</div><div class='add'>+				} else if (page_block == blocks_per_folio)</div><div class='ctx'> 					break;</div><div class='del'>-				blocks[page_block] = map.m_pblk+relative_block;</div><div class='ctx'> 				page_block++;</div><div class='ctx'> 				block_in_file++;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		if (first_hole != blocks_per_page) {</div><div class='del'>-			zero_user_segment(page, first_hole &lt;&lt; blkbits,</div><div class='del'>-					  PAGE_SIZE);</div><div class='add'>+		if (first_hole != blocks_per_folio) {</div><div class='add'>+			folio_zero_segment(folio, first_hole &lt;&lt; blkbits,</div><div class='add'>+					  folio_size(folio));</div><div class='ctx'> 			if (first_hole == 0) {</div><div class='del'>-				if (ext4_need_verity(inode, page-&gt;index) &amp;&amp;</div><div class='del'>-				    !fsverity_verify_page(page))</div><div class='add'>+				if (ext4_need_verity(inode, folio-&gt;index) &amp;&amp;</div><div class='add'>+				    !fsverity_verify_folio(folio))</div><div class='ctx'> 					goto set_error_page;</div><div class='del'>-				SetPageUptodate(page);</div><div class='del'>-				unlock_page(page);</div><div class='del'>-				goto next_page;</div><div class='add'>+				folio_end_read(folio, true);</div><div class='add'>+				continue;</div><div class='ctx'> 			}</div><div class='ctx'> 		} else if (fully_mapped) {</div><div class='del'>-			SetPageMappedToDisk(page);</div><div class='del'>-		}</div><div class='del'>-		if (fully_mapped &amp;&amp; blocks_per_page == 1 &amp;&amp;</div><div class='del'>-		    !PageUptodate(page) &amp;&amp; cleancache_get_page(page) == 0) {</div><div class='del'>-			SetPageUptodate(page);</div><div class='del'>-			goto confused;</div><div class='add'>+			folio_set_mappedtodisk(folio);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * This page will go to BIO.  Do we need to send this</div><div class='add'>+		 * This folio will go to BIO.  Do we need to send this</div><div class='ctx'> 		 * BIO off first?</div><div class='ctx'> 		 */</div><div class='del'>-		if (bio &amp;&amp; (last_block_in_bio != blocks[0] - 1 ||</div><div class='add'>+		if (bio &amp;&amp; (last_block_in_bio != first_block - 1 ||</div><div class='ctx'> 			    !fscrypt_mergeable_bio(bio, inode, next_block))) {</div><div class='ctx'> 		submit_and_realloc:</div><div class='ctx'> 			submit_bio(bio);</div><div class='hunk'>@@ -371,41 +353,40 @@ int ext4_mpage_readpages(struct inode *inode,</div><div class='ctx'> 			 * bio_alloc will _always_ be able to allocate a bio if</div><div class='ctx'> 			 * __GFP_DIRECT_RECLAIM is set, see bio_alloc_bioset().</div><div class='ctx'> 			 */</div><div class='del'>-			bio = bio_alloc(GFP_KERNEL, bio_max_segs(nr_pages));</div><div class='add'>+			bio = bio_alloc(bdev, bio_max_segs(nr_pages),</div><div class='add'>+					REQ_OP_READ, GFP_KERNEL);</div><div class='ctx'> 			fscrypt_set_bio_crypt_ctx(bio, inode, next_block,</div><div class='ctx'> 						  GFP_KERNEL);</div><div class='del'>-			ext4_set_bio_post_read_ctx(bio, inode, page-&gt;index);</div><div class='del'>-			bio_set_dev(bio, bdev);</div><div class='del'>-			bio-&gt;bi_iter.bi_sector = blocks[0] &lt;&lt; (blkbits - 9);</div><div class='add'>+			ext4_set_bio_post_read_ctx(bio, inode, folio-&gt;index);</div><div class='add'>+			bio-&gt;bi_iter.bi_sector = first_block &lt;&lt; (blkbits - 9);</div><div class='ctx'> 			bio-&gt;bi_end_io = mpage_end_io;</div><div class='del'>-			bio_set_op_attrs(bio, REQ_OP_READ,</div><div class='del'>-						rac ? REQ_RAHEAD : 0);</div><div class='add'>+			if (rac)</div><div class='add'>+				bio-&gt;bi_opf |= REQ_RAHEAD;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		length = first_hole &lt;&lt; blkbits;</div><div class='del'>-		if (bio_add_page(bio, page, length, 0) &lt; length)</div><div class='add'>+		if (!bio_add_folio(bio, folio, length, 0))</div><div class='ctx'> 			goto submit_and_realloc;</div><div class='ctx'> </div><div class='ctx'> 		if (((map.m_flags &amp; EXT4_MAP_BOUNDARY) &amp;&amp;</div><div class='ctx'> 		     (relative_block == map.m_len)) ||</div><div class='del'>-		    (first_hole != blocks_per_page)) {</div><div class='add'>+		    (first_hole != blocks_per_folio)) {</div><div class='ctx'> 			submit_bio(bio);</div><div class='ctx'> 			bio = NULL;</div><div class='ctx'> 		} else</div><div class='del'>-			last_block_in_bio = blocks[blocks_per_page - 1];</div><div class='del'>-		goto next_page;</div><div class='add'>+			last_block_in_bio = first_block + blocks_per_folio - 1;</div><div class='add'>+		continue;</div><div class='ctx'> 	confused:</div><div class='ctx'> 		if (bio) {</div><div class='ctx'> 			submit_bio(bio);</div><div class='ctx'> 			bio = NULL;</div><div class='ctx'> 		}</div><div class='del'>-		if (!PageUptodate(page))</div><div class='del'>-			block_read_full_page(page, ext4_get_block);</div><div class='add'>+		if (!folio_test_uptodate(folio))</div><div class='add'>+			block_read_full_folio(folio, ext4_get_block);</div><div class='ctx'> 		else</div><div class='del'>-			unlock_page(page);</div><div class='del'>-	next_page:</div><div class='del'>-		if (rac)</div><div class='del'>-			put_page(page);</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+next_page:</div><div class='add'>+		; /* A label shall be followed by a statement until C23 */</div><div class='ctx'> 	}</div><div class='ctx'> 	if (bio)</div><div class='ctx'> 		submit_bio(bio);</div><div class='hunk'>@@ -414,9 +395,8 @@ int ext4_mpage_readpages(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> int __init ext4_init_post_read_processing(void)</div><div class='ctx'> {</div><div class='del'>-	bio_post_read_ctx_cache =</div><div class='del'>-		kmem_cache_create("ext4_bio_post_read_ctx",</div><div class='del'>-				  sizeof(struct bio_post_read_ctx), 0, 0, NULL);</div><div class='add'>+	bio_post_read_ctx_cache = KMEM_CACHE(bio_post_read_ctx, SLAB_RECLAIM_ACCOUNT);</div><div class='add'>+</div><div class='ctx'> 	if (!bio_post_read_ctx_cache)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	bio_post_read_ctx_pool =</div><div class='head'>diff --git a/fs/ext4/resize.c b/fs/ext4/resize.c<br/>index b63cb88ccdae..050f26168d97 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/resize.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/resize.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/resize.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/resize.c</a></div><div class='hunk'>@@ -10,10 +10,9 @@</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> </div><div class='del'>-#define EXT4FS_DEBUG</div><div class='del'>-</div><div class='ctx'> #include &lt;linux/errno.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='add'>+#include &lt;linux/jiffies.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "ext4_jbd2.h"</div><div class='ctx'> </div><div class='hunk'>@@ -53,14 +52,24 @@ int ext4_resize_begin(struct super_block *sb)</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='add'>+	 * If the reserved GDT blocks is non-zero, the resize_inode feature</div><div class='add'>+	 * should always be set.</div><div class='add'>+	 */</div><div class='add'>+	if (sbi-&gt;s_es-&gt;s_reserved_gdt_blocks &amp;&amp;</div><div class='add'>+	    !ext4_has_feature_resize_inode(sb)) {</div><div class='add'>+		ext4_error(sb, "resize_inode disabled but reserved GDT blocks non-zero");</div><div class='add'>+		return -EFSCORRUPTED;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='ctx'> 	 * If we are not using the primary superblock/GDT copy don't resize,</div><div class='ctx'>          * because the user tools have no way of handling this.  Probably a</div><div class='ctx'>          * bad time to do it anyways.</div><div class='ctx'>          */</div><div class='ctx'> 	if (EXT4_B2C(sbi, sbi-&gt;s_sbh-&gt;b_blocknr) !=</div><div class='del'>-	    le32_to_cpu(EXT4_SB(sb)-&gt;s_es-&gt;s_first_data_block)) {</div><div class='add'>+	    le32_to_cpu(sbi-&gt;s_es-&gt;s_first_data_block)) {</div><div class='ctx'> 		ext4_warning(sb, "won't resize using backup superblock at %llu",</div><div class='del'>-			(unsigned long long)EXT4_SB(sb)-&gt;s_sbh-&gt;b_blocknr);</div><div class='add'>+			(unsigned long long)sbi-&gt;s_sbh-&gt;b_blocknr);</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -68,7 +77,7 @@ int ext4_resize_begin(struct super_block *sb)</div><div class='ctx'> 	 * We are not allowed to do online-resizing on a filesystem mounted</div><div class='ctx'> 	 * with error, because it can destroy the filesystem easily.</div><div class='ctx'> 	 */</div><div class='del'>-	if (EXT4_SB(sb)-&gt;s_mount_state &amp; EXT4_ERROR_FS) {</div><div class='add'>+	if (sbi-&gt;s_mount_state &amp; EXT4_ERROR_FS) {</div><div class='ctx'> 		ext4_warning(sb, "There are errors in the filesystem, "</div><div class='ctx'> 			     "so online resizing is not allowed");</div><div class='ctx'> 		return -EPERM;</div><div class='hunk'>@@ -80,28 +89,19 @@ int ext4_resize_begin(struct super_block *sb)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (test_and_set_bit_lock(EXT4_FLAGS_RESIZING,</div><div class='del'>-				  &amp;EXT4_SB(sb)-&gt;s_ext4_flags))</div><div class='add'>+				  &amp;sbi-&gt;s_ext4_flags))</div><div class='ctx'> 		ret = -EBUSY;</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void ext4_resize_end(struct super_block *sb)</div><div class='add'>+int ext4_resize_end(struct super_block *sb, bool update_backups)</div><div class='ctx'> {</div><div class='ctx'> 	clear_bit_unlock(EXT4_FLAGS_RESIZING, &amp;EXT4_SB(sb)-&gt;s_ext4_flags);</div><div class='ctx'> 	smp_mb__after_atomic();</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static ext4_group_t ext4_meta_bg_first_group(struct super_block *sb,</div><div class='del'>-					     ext4_group_t group) {</div><div class='del'>-	return (group &gt;&gt; EXT4_DESC_PER_BLOCK_BITS(sb)) &lt;&lt;</div><div class='del'>-	       EXT4_DESC_PER_BLOCK_BITS(sb);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static ext4_fsblk_t ext4_meta_bg_first_block_no(struct super_block *sb,</div><div class='del'>-					     ext4_group_t group) {</div><div class='del'>-	group = ext4_meta_bg_first_group(sb, group);</div><div class='del'>-	return ext4_group_first_block_no(sb, group);</div><div class='add'>+	if (update_backups)</div><div class='add'>+		return ext4_update_overhead(sb, true);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ext4_grpblk_t ext4_group_overhead_blocks(struct super_block *sb,</div><div class='hunk'>@@ -140,8 +140,9 @@ static int verify_group_input(struct super_block *sb,</div><div class='ctx'> </div><div class='ctx'> 	overhead = ext4_group_overhead_blocks(sb, group);</div><div class='ctx'> 	metaend = start + overhead;</div><div class='del'>-	input-&gt;free_clusters_count = free_blocks_count =</div><div class='del'>-		input-&gt;blocks_count - 2 - overhead - sbi-&gt;s_itb_per_group;</div><div class='add'>+	free_blocks_count = input-&gt;blocks_count - 2 - overhead -</div><div class='add'>+			    sbi-&gt;s_itb_per_group;</div><div class='add'>+	input-&gt;free_clusters_count = EXT4_B2C(sbi, free_blocks_count);</div><div class='ctx'> </div><div class='ctx'> 	if (test_opt(sb, DEBUG))</div><div class='ctx'> 		printk(KERN_DEBUG "EXT4-fs: adding %s group %u: %u blocks "</div><div class='hunk'>@@ -217,35 +218,55 @@ struct ext4_new_flex_group_data {</div><div class='ctx'> 						   in the flex group */</div><div class='ctx'> 	__u16 *bg_flags;			/* block group flags of groups</div><div class='ctx'> 						   in @groups */</div><div class='add'>+	ext4_group_t resize_bg;			/* number of allocated</div><div class='add'>+						   new_group_data */</div><div class='ctx'> 	ext4_group_t count;			/* number of groups in @groups</div><div class='ctx'> 						 */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * alloc_flex_gd() allocates a ext4_new_flex_group_data with size of</div><div class='del'>- * @flexbg_size.</div><div class='add'>+ * Avoiding memory allocation failures due to too many groups added each time.</div><div class='add'>+ */</div><div class='add'>+#define MAX_RESIZE_BG				16384</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * alloc_flex_gd() allocates an ext4_new_flex_group_data that satisfies the</div><div class='add'>+ * resizing from @o_group to @n_group, its size is typically @flexbg_size.</div><div class='ctx'>  *</div><div class='ctx'>  * Returns NULL on failure otherwise address of the allocated structure.</div><div class='ctx'>  */</div><div class='del'>-static struct ext4_new_flex_group_data *alloc_flex_gd(unsigned long flexbg_size)</div><div class='add'>+static struct ext4_new_flex_group_data *alloc_flex_gd(unsigned int flexbg_size,</div><div class='add'>+				ext4_group_t o_group, ext4_group_t n_group)</div><div class='ctx'> {</div><div class='add'>+	ext4_group_t last_group;</div><div class='add'>+	unsigned int max_resize_bg;</div><div class='ctx'> 	struct ext4_new_flex_group_data *flex_gd;</div><div class='ctx'> </div><div class='ctx'> 	flex_gd = kmalloc(sizeof(*flex_gd), GFP_NOFS);</div><div class='ctx'> 	if (flex_gd == NULL)</div><div class='ctx'> 		goto out3;</div><div class='ctx'> </div><div class='del'>-	if (flexbg_size &gt;= UINT_MAX / sizeof(struct ext4_new_group_data))</div><div class='del'>-		goto out2;</div><div class='del'>-	flex_gd-&gt;count = flexbg_size;</div><div class='add'>+	max_resize_bg = umin(flexbg_size, MAX_RESIZE_BG);</div><div class='add'>+	flex_gd-&gt;resize_bg = max_resize_bg;</div><div class='add'>+</div><div class='add'>+	/* Avoid allocating large 'groups' array if not needed */</div><div class='add'>+	last_group = o_group | (flex_gd-&gt;resize_bg - 1);</div><div class='add'>+	if (n_group &lt;= last_group)</div><div class='add'>+		flex_gd-&gt;resize_bg = 1 &lt;&lt; fls(n_group - o_group);</div><div class='add'>+	else if (n_group - last_group &lt; flex_gd-&gt;resize_bg)</div><div class='add'>+		flex_gd-&gt;resize_bg = 1 &lt;&lt; max(fls(last_group - o_group),</div><div class='add'>+					      fls(n_group - last_group));</div><div class='ctx'> </div><div class='del'>-	flex_gd-&gt;groups = kmalloc_array(flexbg_size,</div><div class='add'>+	if (WARN_ON_ONCE(flex_gd-&gt;resize_bg &gt; max_resize_bg))</div><div class='add'>+		flex_gd-&gt;resize_bg = max_resize_bg;</div><div class='add'>+</div><div class='add'>+	flex_gd-&gt;groups = kmalloc_array(flex_gd-&gt;resize_bg,</div><div class='ctx'> 					sizeof(struct ext4_new_group_data),</div><div class='ctx'> 					GFP_NOFS);</div><div class='ctx'> 	if (flex_gd-&gt;groups == NULL)</div><div class='ctx'> 		goto out2;</div><div class='ctx'> </div><div class='del'>-	flex_gd-&gt;bg_flags = kmalloc_array(flexbg_size, sizeof(__u16),</div><div class='add'>+	flex_gd-&gt;bg_flags = kmalloc_array(flex_gd-&gt;resize_bg, sizeof(__u16),</div><div class='ctx'> 					  GFP_NOFS);</div><div class='ctx'> 	if (flex_gd-&gt;bg_flags == NULL)</div><div class='ctx'> 		goto out1;</div><div class='hunk'>@@ -282,7 +303,7 @@ static void free_flex_gd(struct ext4_new_flex_group_data *flex_gd)</div><div class='ctx'>  */</div><div class='ctx'> static int ext4_alloc_group_tables(struct super_block *sb,</div><div class='ctx'> 				struct ext4_new_flex_group_data *flex_gd,</div><div class='del'>-				int flexbg_size)</div><div class='add'>+				unsigned int flexbg_size)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_new_group_data *group_data = flex_gd-&gt;groups;</div><div class='ctx'> 	ext4_fsblk_t start_blk;</div><div class='hunk'>@@ -383,12 +404,12 @@ next_group:</div><div class='ctx'> 		group = group_data[0].group;</div><div class='ctx'> </div><div class='ctx'> 		printk(KERN_DEBUG "EXT4-fs: adding a flex group with "</div><div class='del'>-		       "%d groups, flexbg size is %d:\n", flex_gd-&gt;count,</div><div class='add'>+		       "%u groups, flexbg size is %u:\n", flex_gd-&gt;count,</div><div class='ctx'> 		       flexbg_size);</div><div class='ctx'> </div><div class='ctx'> 		for (i = 0; i &lt; flex_gd-&gt;count; i++) {</div><div class='ctx'> 			ext4_debug(</div><div class='del'>-			       "adding %s group %u: %u blocks (%d free, %d mdata blocks)\n",</div><div class='add'>+			       "adding %s group %u: %u blocks (%u free, %u mdata blocks)\n",</div><div class='ctx'> 			       ext4_bg_has_super(sb, group + i) ? "normal" :</div><div class='ctx'> 			       "no-super", group + i,</div><div class='ctx'> 			       group_data[i].blocks_count,</div><div class='hunk'>@@ -446,8 +467,7 @@ static int set_flexbg_block_bitmap(struct super_block *sb, handle_t *handle,</div><div class='ctx'> </div><div class='ctx'> 	ext4_debug("mark clusters [%llu-%llu] used\n", first_cluster,</div><div class='ctx'> 		   last_cluster);</div><div class='del'>-	for (count2 = count; count &gt; 0;</div><div class='del'>-	     count -= count2, first_cluster += count2) {</div><div class='add'>+	for (; count &gt; 0; count -= count2, first_cluster += count2) {</div><div class='ctx'> 		ext4_fsblk_t start;</div><div class='ctx'> 		struct buffer_head *bh;</div><div class='ctx'> 		ext4_group_t group;</div><div class='hunk'>@@ -483,7 +503,7 @@ static int set_flexbg_block_bitmap(struct super_block *sb, handle_t *handle,</div><div class='ctx'> 		}</div><div class='ctx'> 		ext4_debug("mark block bitmap %#04llx (+%llu/%u)\n",</div><div class='ctx'> 			   first_cluster, first_cluster - start, count2);</div><div class='del'>-		ext4_set_bits(bh-&gt;b_data, first_cluster - start, count2);</div><div class='add'>+		mb_set_bits(bh-&gt;b_data, first_cluster - start, count2);</div><div class='ctx'> </div><div class='ctx'> 		err = ext4_handle_dirty_metadata(handle, NULL, bh);</div><div class='ctx'> 		brelse(bh);</div><div class='hunk'>@@ -546,13 +566,8 @@ static int setup_new_flex_group_blocks(struct super_block *sb,</div><div class='ctx'> 		if (meta_bg == 0 &amp;&amp; !ext4_bg_has_super(sb, group))</div><div class='ctx'> 			goto handle_itb;</div><div class='ctx'> </div><div class='del'>-		if (meta_bg == 1) {</div><div class='del'>-			ext4_group_t first_group;</div><div class='del'>-			first_group = ext4_meta_bg_first_group(sb, group);</div><div class='del'>-			if (first_group != group + 1 &amp;&amp;</div><div class='del'>-			    first_group != group + EXT4_DESC_PER_BLOCK(sb) - 1)</div><div class='del'>-				goto handle_itb;</div><div class='del'>-		}</div><div class='add'>+		if (meta_bg == 1)</div><div class='add'>+			goto handle_itb;</div><div class='ctx'> </div><div class='ctx'> 		block = start + ext4_bg_has_super(sb, group);</div><div class='ctx'> 		/* Copy all of the GDT blocks into the backup in this group */</div><div class='hunk'>@@ -600,7 +615,7 @@ static int setup_new_flex_group_blocks(struct super_block *sb,</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> handle_itb:</div><div class='del'>-		/* Initialize group tables of the grop @group */</div><div class='add'>+		/* Initialize group tables of the group @group */</div><div class='ctx'> 		if (!(bg_flags[i] &amp; EXT4_BG_INODE_ZEROED))</div><div class='ctx'> 			goto handle_bb;</div><div class='ctx'> </div><div class='hunk'>@@ -632,7 +647,7 @@ handle_bb:</div><div class='ctx'> 		if (overhead != 0) {</div><div class='ctx'> 			ext4_debug("mark backup superblock %#04llx (+0)\n",</div><div class='ctx'> 				   start);</div><div class='del'>-			ext4_set_bits(bh-&gt;b_data, 0,</div><div class='add'>+			mb_set_bits(bh-&gt;b_data, 0,</div><div class='ctx'> 				      EXT4_NUM_B2C(sbi, overhead));</div><div class='ctx'> 		}</div><div class='ctx'> 		ext4_mark_bitmap_end(EXT4_B2C(sbi, group_data[i].blocks_count),</div><div class='hunk'>@@ -690,16 +705,14 @@ handle_ib:</div><div class='ctx'> 			block = start;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (count) {</div><div class='del'>-			err = set_flexbg_block_bitmap(sb, handle,</div><div class='del'>-						      flex_gd,</div><div class='del'>-						      EXT4_B2C(sbi, start),</div><div class='del'>-						      EXT4_B2C(sbi,</div><div class='del'>-							       start + count</div><div class='del'>-							       - 1));</div><div class='del'>-			if (err)</div><div class='del'>-				goto out;</div><div class='del'>-		}</div><div class='add'>+		err = set_flexbg_block_bitmap(sb, handle,</div><div class='add'>+				flex_gd,</div><div class='add'>+				EXT4_B2C(sbi, start),</div><div class='add'>+				EXT4_B2C(sbi,</div><div class='add'>+					start + count</div><div class='add'>+					- 1));</div><div class='add'>+		if (err)</div><div class='add'>+			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='hunk'>@@ -717,12 +730,23 @@ out:</div><div class='ctx'>  * sequence of powers of 3, 5, and 7: 1, 3, 5, 7, 9, 25, 27, 49, 81, ...</div><div class='ctx'>  * For a non-sparse filesystem it will be every group: 1, 2, 3, 4, ...</div><div class='ctx'>  */</div><div class='del'>-static unsigned ext4_list_backups(struct super_block *sb, unsigned *three,</div><div class='del'>-				  unsigned *five, unsigned *seven)</div><div class='add'>+unsigned int ext4_list_backups(struct super_block *sb, unsigned int *three,</div><div class='add'>+			       unsigned int *five, unsigned int *seven)</div><div class='ctx'> {</div><div class='del'>-	unsigned *min = three;</div><div class='add'>+	struct ext4_super_block *es = EXT4_SB(sb)-&gt;s_es;</div><div class='add'>+	unsigned int *min = three;</div><div class='ctx'> 	int mult = 3;</div><div class='del'>-	unsigned ret;</div><div class='add'>+	unsigned int ret;</div><div class='add'>+</div><div class='add'>+	if (ext4_has_feature_sparse_super2(sb)) {</div><div class='add'>+		do {</div><div class='add'>+			if (*min &gt; 2)</div><div class='add'>+				return UINT_MAX;</div><div class='add'>+			ret = le32_to_cpu(es-&gt;s_backup_bgs[*min - 1]);</div><div class='add'>+			*min += 1;</div><div class='add'>+		} while (!ret);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (!ext4_has_feature_sparse_super(sb)) {</div><div class='ctx'> 		ret = *min;</div><div class='hunk'>@@ -927,7 +951,13 @@ errout:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * add_new_gdb_meta_bg is the sister of add_new_gdb.</div><div class='add'>+ * If there is no available space in the existing block group descriptors for</div><div class='add'>+ * the new block group and there are no reserved block group descriptors, then</div><div class='add'>+ * the meta_bg feature will get enabled, and es-&gt;s_first_meta_bg will get set</div><div class='add'>+ * to the first block group that is managed using meta_bg and s_first_meta_bg</div><div class='add'>+ * must be a multiple of EXT4_DESC_PER_BLOCK(sb).</div><div class='add'>+ * This function will be called when first group of meta_bg is added to bring</div><div class='add'>+ * new group descriptors block of new added meta_bg.</div><div class='ctx'>  */</div><div class='ctx'> static int add_new_gdb_meta_bg(struct super_block *sb,</div><div class='ctx'> 			       handle_t *handle, ext4_group_t group) {</div><div class='hunk'>@@ -937,8 +967,8 @@ static int add_new_gdb_meta_bg(struct super_block *sb,</div><div class='ctx'> 	unsigned long gdb_num = group / EXT4_DESC_PER_BLOCK(sb);</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	gdblock = ext4_meta_bg_first_block_no(sb, group) +</div><div class='del'>-		   ext4_bg_has_super(sb, group);</div><div class='add'>+	gdblock = ext4_group_first_block_no(sb, group) +</div><div class='add'>+		  ext4_bg_has_super(sb, group);</div><div class='ctx'> 	gdb_bh = ext4_sb_bread(sb, gdblock, 0);</div><div class='ctx'> 	if (IS_ERR(gdb_bh))</div><div class='ctx'> 		return PTR_ERR(gdb_bh);</div><div class='hunk'>@@ -1062,9 +1092,6 @@ static int reserve_backup_gdb(handle_t *handle, struct inode *inode,</div><div class='ctx'> 	for (i = 0; i &lt; reserved_gdb; i++) {</div><div class='ctx'> 		int err2;</div><div class='ctx'> 		data = (__le32 *)primary[i]-&gt;b_data;</div><div class='del'>-		/* printk("reserving backup %lu[%u] = %lu\n",</div><div class='del'>-		       primary[i]-&gt;b_blocknr, gdbackups,</div><div class='del'>-		       blk + primary[i]-&gt;b_blocknr); */</div><div class='ctx'> 		data[gdbackups] = cpu_to_le32(blk + primary[i]-&gt;b_blocknr);</div><div class='ctx'> 		err2 = ext4_handle_dirty_metadata(handle, NULL, primary[i]);</div><div class='ctx'> 		if (!err)</div><div class='hunk'>@@ -1085,6 +1112,16 @@ exit_free:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline void ext4_set_block_group_nr(struct super_block *sb, char *data,</div><div class='add'>+					   ext4_group_t group)</div><div class='add'>+{</div><div class='add'>+	struct ext4_super_block *es = (struct ext4_super_block *) data;</div><div class='add'>+</div><div class='add'>+	es-&gt;s_block_group_nr = cpu_to_le16(group);</div><div class='add'>+	if (ext4_has_feature_metadata_csum(sb))</div><div class='add'>+		es-&gt;s_checksum = ext4_superblock_csum(es);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Update the backup copies of the ext4 metadata.  These don't need to be part</div><div class='ctx'>  * of the main resize transaction, because e2fsck will re-write them if there</div><div class='hunk'>@@ -1133,6 +1170,8 @@ static void update_backups(struct super_block *sb, sector_t blk_off, char *data,</div><div class='ctx'> 	while (group &lt; sbi-&gt;s_groups_count) {</div><div class='ctx'> 		struct buffer_head *bh;</div><div class='ctx'> 		ext4_fsblk_t backup_block;</div><div class='add'>+		int has_super = ext4_bg_has_super(sb, group);</div><div class='add'>+		ext4_fsblk_t first_block = ext4_group_first_block_no(sb, group);</div><div class='ctx'> </div><div class='ctx'> 		/* Out of journal space, and can't get more - abort - so sad */</div><div class='ctx'> 		err = ext4_resize_ensure_credits_batch(handle, 1);</div><div class='hunk'>@@ -1142,8 +1181,7 @@ static void update_backups(struct super_block *sb, sector_t blk_off, char *data,</div><div class='ctx'> 		if (meta_bg == 0)</div><div class='ctx'> 			backup_block = ((ext4_fsblk_t)group) * bpg + blk_off;</div><div class='ctx'> 		else</div><div class='del'>-			backup_block = (ext4_group_first_block_no(sb, group) +</div><div class='del'>-					ext4_bg_has_super(sb, group));</div><div class='add'>+			backup_block = first_block + has_super;</div><div class='ctx'> </div><div class='ctx'> 		bh = sb_getblk(sb, backup_block);</div><div class='ctx'> 		if (unlikely(!bh)) {</div><div class='hunk'>@@ -1155,12 +1193,16 @@ static void update_backups(struct super_block *sb, sector_t blk_off, char *data,</div><div class='ctx'> 			   ext4_group_first_block_no(sb, group));</div><div class='ctx'> 		BUFFER_TRACE(bh, "get_write_access");</div><div class='ctx'> 		if ((err = ext4_journal_get_write_access(handle, sb, bh,</div><div class='del'>-							 EXT4_JTR_NONE)))</div><div class='add'>+							 EXT4_JTR_NONE))) {</div><div class='add'>+			brelse(bh);</div><div class='ctx'> 			break;</div><div class='add'>+		}</div><div class='ctx'> 		lock_buffer(bh);</div><div class='ctx'> 		memcpy(bh-&gt;b_data, data, size);</div><div class='ctx'> 		if (rest)</div><div class='ctx'> 			memset(bh-&gt;b_data + size, 0, rest);</div><div class='add'>+		if (has_super &amp;&amp; (backup_block == first_block))</div><div class='add'>+			ext4_set_block_group_nr(sb, bh-&gt;b_data, group);</div><div class='ctx'> 		set_buffer_uptodate(bh);</div><div class='ctx'> 		unlock_buffer(bh);</div><div class='ctx'> 		err = ext4_handle_dirty_metadata(handle, NULL, bh);</div><div class='hunk'>@@ -1258,7 +1300,7 @@ static struct buffer_head *ext4_get_bitmap(struct super_block *sb, __u64 block)</div><div class='ctx'> 	if (unlikely(!bh))</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	if (!bh_uptodate_or_lock(bh)) {</div><div class='del'>-		if (ext4_read_bh(bh, 0, NULL) &lt; 0) {</div><div class='add'>+		if (ext4_read_bh(bh, 0, NULL, false) &lt; 0) {</div><div class='ctx'> 			brelse(bh);</div><div class='ctx'> 			return NULL;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1268,26 +1310,24 @@ static struct buffer_head *ext4_get_bitmap(struct super_block *sb, __u64 block)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ext4_set_bitmap_checksums(struct super_block *sb,</div><div class='del'>-				     ext4_group_t group,</div><div class='ctx'> 				     struct ext4_group_desc *gdp,</div><div class='ctx'> 				     struct ext4_new_group_data *group_data)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> </div><div class='del'>-	if (!ext4_has_metadata_csum(sb))</div><div class='add'>+	if (!ext4_has_feature_metadata_csum(sb))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	bh = ext4_get_bitmap(sb, group_data-&gt;inode_bitmap);</div><div class='ctx'> 	if (!bh)</div><div class='ctx'> 		return -EIO;</div><div class='del'>-	ext4_inode_bitmap_csum_set(sb, group, gdp, bh,</div><div class='del'>-				   EXT4_INODES_PER_GROUP(sb) / 8);</div><div class='add'>+	ext4_inode_bitmap_csum_set(sb, gdp, bh);</div><div class='ctx'> 	brelse(bh);</div><div class='ctx'> </div><div class='ctx'> 	bh = ext4_get_bitmap(sb, group_data-&gt;block_bitmap);</div><div class='ctx'> 	if (!bh)</div><div class='ctx'> 		return -EIO;</div><div class='del'>-	ext4_block_bitmap_csum_set(sb, group, gdp, bh);</div><div class='add'>+	ext4_block_bitmap_csum_set(sb, gdp, bh);</div><div class='ctx'> 	brelse(bh);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -1325,7 +1365,7 @@ static int ext4_setup_new_descs(handle_t *handle, struct super_block *sb,</div><div class='ctx'> 		memset(gdp, 0, EXT4_DESC_SIZE(sb));</div><div class='ctx'> 		ext4_block_bitmap_set(sb, gdp, group_data-&gt;block_bitmap);</div><div class='ctx'> 		ext4_inode_bitmap_set(sb, gdp, group_data-&gt;inode_bitmap);</div><div class='del'>-		err = ext4_set_bitmap_checksums(sb, group, gdp, group_data);</div><div class='add'>+		err = ext4_set_bitmap_checksums(sb, gdp, group_data);</div><div class='ctx'> 		if (err) {</div><div class='ctx'> 			ext4_std_error(sb, err);</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -1358,6 +1398,17 @@ static int ext4_setup_new_descs(handle_t *handle, struct super_block *sb,</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void ext4_add_overhead(struct super_block *sb,</div><div class='add'>+                              const ext4_fsblk_t overhead)</div><div class='add'>+{</div><div class='add'>+       struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+       struct ext4_super_block *es = sbi-&gt;s_es;</div><div class='add'>+</div><div class='add'>+       sbi-&gt;s_overhead += overhead;</div><div class='add'>+       es-&gt;s_overhead_clusters = cpu_to_le32(sbi-&gt;s_overhead);</div><div class='add'>+       smp_wmb();</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * ext4_update_super() updates the super block so that the newly added</div><div class='ctx'>  * groups can be seen by the filesystem.</div><div class='hunk'>@@ -1435,8 +1486,6 @@ static void ext4_update_super(struct super_block *sb,</div><div class='ctx'> 	 * active. */</div><div class='ctx'> 	ext4_r_blocks_count_set(es, ext4_r_blocks_count(es) +</div><div class='ctx'> 				reserved_blocks);</div><div class='del'>-	ext4_superblock_csum_set(sb);</div><div class='del'>-	unlock_buffer(sbi-&gt;s_sbh);</div><div class='ctx'> </div><div class='ctx'> 	/* Update the free space counts */</div><div class='ctx'> 	percpu_counter_add(&amp;sbi-&gt;s_freeclusters_counter,</div><div class='hunk'>@@ -1459,10 +1508,21 @@ static void ext4_update_super(struct super_block *sb,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Update the fs overhead information</div><div class='add'>+	 * Update the fs overhead information.</div><div class='add'>+	 *</div><div class='add'>+	 * For bigalloc, if the superblock already has a properly calculated</div><div class='add'>+	 * overhead, update it with a value based on numbers already computed</div><div class='add'>+	 * above for the newly allocated capacity.</div><div class='ctx'> 	 */</div><div class='del'>-	ext4_calculate_overhead(sb);</div><div class='add'>+	if (ext4_has_feature_bigalloc(sb) &amp;&amp; (sbi-&gt;s_overhead != 0))</div><div class='add'>+		ext4_add_overhead(sb,</div><div class='add'>+			EXT4_NUM_B2C(sbi, blocks_count - free_blocks));</div><div class='add'>+	else</div><div class='add'>+		ext4_calculate_overhead(sb);</div><div class='add'>+	es-&gt;s_overhead_clusters = cpu_to_le32(sbi-&gt;s_overhead);</div><div class='ctx'> </div><div class='add'>+	ext4_superblock_csum_set(sb);</div><div class='add'>+	unlock_buffer(sbi-&gt;s_sbh);</div><div class='ctx'> 	if (test_opt(sb, DEBUG))</div><div class='ctx'> 		printk(KERN_DEBUG "EXT4-fs: added group %u:"</div><div class='ctx'> 		       "%llu blocks(%llu free %llu reserved)\n", flex_gd-&gt;count,</div><div class='hunk'>@@ -1543,21 +1603,20 @@ exit_journal:</div><div class='ctx'> 		int gdb_num = group / EXT4_DESC_PER_BLOCK(sb);</div><div class='ctx'> 		int gdb_num_end = ((group + flex_gd-&gt;count - 1) /</div><div class='ctx'> 				   EXT4_DESC_PER_BLOCK(sb));</div><div class='del'>-		int meta_bg = ext4_has_feature_meta_bg(sb);</div><div class='del'>-		sector_t old_gdb = 0;</div><div class='add'>+		int meta_bg = ext4_has_feature_meta_bg(sb) &amp;&amp;</div><div class='add'>+			      gdb_num &gt;= le32_to_cpu(es-&gt;s_first_meta_bg);</div><div class='add'>+		sector_t padding_blocks = meta_bg ? 0 : sbi-&gt;s_sbh-&gt;b_blocknr -</div><div class='add'>+					 ext4_group_first_block_no(sb, 0);</div><div class='ctx'> </div><div class='del'>-		update_backups(sb, sbi-&gt;s_sbh-&gt;b_blocknr, (char *)es,</div><div class='del'>-			       sizeof(struct ext4_super_block), 0);</div><div class='add'>+		update_backups(sb, ext4_group_first_block_no(sb, 0),</div><div class='add'>+			       (char *)es, sizeof(struct ext4_super_block), 0);</div><div class='ctx'> 		for (; gdb_num &lt;= gdb_num_end; gdb_num++) {</div><div class='ctx'> 			struct buffer_head *gdb_bh;</div><div class='ctx'> </div><div class='ctx'> 			gdb_bh = sbi_array_rcu_deref(sbi, s_group_desc,</div><div class='ctx'> 						     gdb_num);</div><div class='del'>-			if (old_gdb == gdb_bh-&gt;b_blocknr)</div><div class='del'>-				continue;</div><div class='del'>-			update_backups(sb, gdb_bh-&gt;b_blocknr, gdb_bh-&gt;b_data,</div><div class='del'>-				       gdb_bh-&gt;b_size, meta_bg);</div><div class='del'>-			old_gdb = gdb_bh-&gt;b_blocknr;</div><div class='add'>+			update_backups(sb, gdb_bh-&gt;b_blocknr - padding_blocks,</div><div class='add'>+				       gdb_bh-&gt;b_data, gdb_bh-&gt;b_size, meta_bg);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> exit:</div><div class='hunk'>@@ -1566,8 +1625,7 @@ exit:</div><div class='ctx'> </div><div class='ctx'> static int ext4_setup_next_flex_gd(struct super_block *sb,</div><div class='ctx'> 				    struct ext4_new_flex_group_data *flex_gd,</div><div class='del'>-				    ext4_fsblk_t n_blocks_count,</div><div class='del'>-				    unsigned long flexbg_size)</div><div class='add'>+				    ext4_fsblk_t n_blocks_count)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> 	struct ext4_super_block *es = sbi-&gt;s_es;</div><div class='hunk'>@@ -1591,7 +1649,7 @@ static int ext4_setup_next_flex_gd(struct super_block *sb,</div><div class='ctx'> 	BUG_ON(last);</div><div class='ctx'> 	ext4_get_group_no_and_offset(sb, n_blocks_count - 1, &amp;n_group, &amp;last);</div><div class='ctx'> </div><div class='del'>-	last_group = group | (flexbg_size - 1);</div><div class='add'>+	last_group = group | (flex_gd-&gt;resize_bg - 1);</div><div class='ctx'> 	if (last_group &gt; n_group)</div><div class='ctx'> 		last_group = n_group;</div><div class='ctx'> </div><div class='hunk'>@@ -1758,7 +1816,7 @@ errout:</div><div class='ctx'> 		if (test_opt(sb, DEBUG))</div><div class='ctx'> 			printk(KERN_DEBUG "EXT4-fs: extended group to %llu "</div><div class='ctx'> 			       "blocks\n", ext4_blocks_count(es));</div><div class='del'>-		update_backups(sb, EXT4_SB(sb)-&gt;s_sbh-&gt;b_blocknr,</div><div class='add'>+		update_backups(sb, ext4_group_first_block_no(sb, 0),</div><div class='ctx'> 			       (char *)es, sizeof(struct ext4_super_block), 0);</div><div class='ctx'> 	}</div><div class='ctx'> 	return err;</div><div class='hunk'>@@ -1781,7 +1839,6 @@ int ext4_group_extend(struct super_block *sb, struct ext4_super_block *es,</div><div class='ctx'> 	ext4_grpblk_t last;</div><div class='ctx'> 	ext4_grpblk_t add;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='del'>-	int err;</div><div class='ctx'> 	ext4_group_t group;</div><div class='ctx'> </div><div class='ctx'> 	o_blocks_count = ext4_blocks_count(es);</div><div class='hunk'>@@ -1836,8 +1893,7 @@ int ext4_group_extend(struct super_block *sb, struct ext4_super_block *es,</div><div class='ctx'> 	}</div><div class='ctx'> 	brelse(bh);</div><div class='ctx'> </div><div class='del'>-	err = ext4_group_extend_no_check(sb, o_blocks_count, add);</div><div class='del'>-	return err;</div><div class='add'>+	return ext4_group_extend_no_check(sb, o_blocks_count, add);</div><div class='ctx'> } /* ext4_group_extend */</div><div class='ctx'> </div><div class='ctx'> </div><div class='hunk'>@@ -1925,9 +1981,7 @@ static int ext4_convert_meta_bg(struct super_block *sb, struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> errout:</div><div class='ctx'> 	ret = ext4_journal_stop(handle);</div><div class='del'>-	if (!err)</div><div class='del'>-		err = ret;</div><div class='del'>-	return ret;</div><div class='add'>+	return err ? err : ret;</div><div class='ctx'> </div><div class='ctx'> invalid_resize_inode:</div><div class='ctx'> 	ext4_error(sb, "corrupted/inconsistent resize inode");</div><div class='hunk'>@@ -1955,8 +2009,9 @@ int ext4_resize_fs(struct super_block *sb, ext4_fsblk_t n_blocks_count)</div><div class='ctx'> 	ext4_fsblk_t o_blocks_count;</div><div class='ctx'> 	ext4_fsblk_t n_blocks_count_retry = 0;</div><div class='ctx'> 	unsigned long last_update_time = 0;</div><div class='del'>-	int err = 0, flexbg_size = 1 &lt;&lt; sbi-&gt;s_log_groups_per_flex;</div><div class='add'>+	int err = 0;</div><div class='ctx'> 	int meta_bg;</div><div class='add'>+	unsigned int flexbg_size = ext4_flex_bg_size(sbi);</div><div class='ctx'> </div><div class='ctx'> 	/* See if the device is actually as big as what was requested */</div><div class='ctx'> 	bh = ext4_sb_bread(sb, n_blocks_count - 1, 0);</div><div class='hunk'>@@ -1966,6 +2021,16 @@ int ext4_resize_fs(struct super_block *sb, ext4_fsblk_t n_blocks_count)</div><div class='ctx'> 	}</div><div class='ctx'> 	brelse(bh);</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * For bigalloc, trim the requested size to the nearest cluster</div><div class='add'>+	 * boundary to avoid creating an unusable filesystem. We do this</div><div class='add'>+	 * silently, instead of returning an error, to avoid breaking</div><div class='add'>+	 * callers that blindly resize the filesystem to the full size of</div><div class='add'>+	 * the underlying block device.</div><div class='add'>+	 */</div><div class='add'>+	if (ext4_has_feature_bigalloc(sb))</div><div class='add'>+		n_blocks_count &amp;= ~((1 &lt;&lt; EXT4_CLUSTER_BITS(sb)) - 1);</div><div class='add'>+</div><div class='ctx'> retry:</div><div class='ctx'> 	o_blocks_count = ext4_blocks_count(es);</div><div class='ctx'> </div><div class='hunk'>@@ -2021,7 +2086,7 @@ retry:</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if ((!resize_inode &amp;&amp; !meta_bg) || n_blocks_count == o_blocks_count) {</div><div class='add'>+	if ((!resize_inode &amp;&amp; !meta_bg &amp;&amp; n_desc_blocks &gt; o_desc_blocks) || n_blocks_count == o_blocks_count) {</div><div class='ctx'> 		err = ext4_convert_meta_bg(sb, resize_inode);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto out;</div><div class='hunk'>@@ -2067,7 +2132,7 @@ retry:</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (ext4_blocks_count(es) == n_blocks_count)</div><div class='add'>+	if (ext4_blocks_count(es) == n_blocks_count &amp;&amp; n_blocks_count_retry == 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	err = ext4_alloc_flex_bg_array(sb, n_group + 1);</div><div class='hunk'>@@ -2078,7 +2143,7 @@ retry:</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	flex_gd = alloc_flex_gd(flexbg_size);</div><div class='add'>+	flex_gd = alloc_flex_gd(flexbg_size, o_group, n_group);</div><div class='ctx'> 	if (flex_gd == NULL) {</div><div class='ctx'> 		err = -ENOMEM;</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -2087,9 +2152,8 @@ retry:</div><div class='ctx'> 	/* Add flex groups. Note that a regular group is a</div><div class='ctx'> 	 * flex group with 1 group.</div><div class='ctx'> 	 */</div><div class='del'>-	while (ext4_setup_next_flex_gd(sb, flex_gd, n_blocks_count,</div><div class='del'>-					      flexbg_size)) {</div><div class='del'>-		if (jiffies - last_update_time &gt; HZ * 10) {</div><div class='add'>+	while (ext4_setup_next_flex_gd(sb, flex_gd, n_blocks_count)) {</div><div class='add'>+		if (time_is_before_jiffies(last_update_time + HZ * 10)) {</div><div class='ctx'> 			if (last_update_time)</div><div class='ctx'> 				ext4_msg(sb, KERN_INFO,</div><div class='ctx'> 					 "resized to %llu blocks",</div><div class='head'>diff --git a/fs/ext4/super.c b/fs/ext4/super.c<br/>index 4e33b5eca694..87205660c5d0 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/super.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/super.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/super.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/super.c</a></div><div class='hunk'>@@ -39,7 +39,6 @@</div><div class='ctx'> #include &lt;linux/log2.h&gt;</div><div class='ctx'> #include &lt;linux/crc16.h&gt;</div><div class='ctx'> #include &lt;linux/dax.h&gt;</div><div class='del'>-#include &lt;linux/cleancache.h&gt;</div><div class='ctx'> #include &lt;linux/uaccess.h&gt;</div><div class='ctx'> #include &lt;linux/iversion.h&gt;</div><div class='ctx'> #include &lt;linux/unicode.h&gt;</div><div class='hunk'>@@ -47,6 +46,8 @@</div><div class='ctx'> #include &lt;linux/kthread.h&gt;</div><div class='ctx'> #include &lt;linux/freezer.h&gt;</div><div class='ctx'> #include &lt;linux/fsnotify.h&gt;</div><div class='add'>+#include &lt;linux/fs_context.h&gt;</div><div class='add'>+#include &lt;linux/fs_parser.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "ext4.h"</div><div class='ctx'> #include "ext4_extents.h"	/* Needed for trace points definition */</div><div class='hunk'>@@ -73,19 +74,26 @@ static int ext4_mark_recovery_complete(struct super_block *sb,</div><div class='ctx'> static int ext4_clear_journal_err(struct super_block *sb,</div><div class='ctx'> 				  struct ext4_super_block *es);</div><div class='ctx'> static int ext4_sync_fs(struct super_block *sb, int wait);</div><div class='del'>-static int ext4_remount(struct super_block *sb, int *flags, char *data);</div><div class='ctx'> static int ext4_statfs(struct dentry *dentry, struct kstatfs *buf);</div><div class='ctx'> static int ext4_unfreeze(struct super_block *sb);</div><div class='ctx'> static int ext4_freeze(struct super_block *sb);</div><div class='del'>-static struct dentry *ext4_mount(struct file_system_type *fs_type, int flags,</div><div class='del'>-		       const char *dev_name, void *data);</div><div class='ctx'> static inline int ext2_feature_set_ok(struct super_block *sb);</div><div class='ctx'> static inline int ext3_feature_set_ok(struct super_block *sb);</div><div class='del'>-static void ext4_destroy_lazyinit_thread(void);</div><div class='ctx'> static void ext4_unregister_li_request(struct super_block *sb);</div><div class='ctx'> static void ext4_clear_request_list(void);</div><div class='ctx'> static struct inode *ext4_get_journal_inode(struct super_block *sb,</div><div class='ctx'> 					    unsigned int journal_inum);</div><div class='add'>+static int ext4_validate_options(struct fs_context *fc);</div><div class='add'>+static int ext4_check_opt_consistency(struct fs_context *fc,</div><div class='add'>+				      struct super_block *sb);</div><div class='add'>+static void ext4_apply_options(struct fs_context *fc, struct super_block *sb);</div><div class='add'>+static int ext4_parse_param(struct fs_context *fc, struct fs_parameter *param);</div><div class='add'>+static int ext4_get_tree(struct fs_context *fc);</div><div class='add'>+static int ext4_reconfigure(struct fs_context *fc);</div><div class='add'>+static void ext4_fc_free(struct fs_context *fc);</div><div class='add'>+static int ext4_init_fs_context(struct fs_context *fc);</div><div class='add'>+static void ext4_kill_sb(struct super_block *sb);</div><div class='add'>+static const struct fs_parameter_spec ext4_param_specs[];</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Lock ordering</div><div class='hunk'>@@ -113,37 +121,53 @@ static struct inode *ext4_get_journal_inode(struct super_block *sb,</div><div class='ctx'>  * transaction start -&gt; page lock(s) -&gt; i_data_sem (rw)</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='add'>+static const struct fs_context_operations ext4_context_ops = {</div><div class='add'>+	.parse_param	= ext4_parse_param,</div><div class='add'>+	.get_tree	= ext4_get_tree,</div><div class='add'>+	.reconfigure	= ext4_reconfigure,</div><div class='add'>+	.free		= ext4_fc_free,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+</div><div class='ctx'> #if !defined(CONFIG_EXT2_FS) &amp;&amp; !defined(CONFIG_EXT2_FS_MODULE) &amp;&amp; defined(CONFIG_EXT4_USE_FOR_EXT2)</div><div class='ctx'> static struct file_system_type ext2_fs_type = {</div><div class='del'>-	.owner		= THIS_MODULE,</div><div class='del'>-	.name		= "ext2",</div><div class='del'>-	.mount		= ext4_mount,</div><div class='del'>-	.kill_sb	= kill_block_super,</div><div class='del'>-	.fs_flags	= FS_REQUIRES_DEV,</div><div class='add'>+	.owner			= THIS_MODULE,</div><div class='add'>+	.name			= "ext2",</div><div class='add'>+	.init_fs_context	= ext4_init_fs_context,</div><div class='add'>+	.parameters		= ext4_param_specs,</div><div class='add'>+	.kill_sb		= ext4_kill_sb,</div><div class='add'>+	.fs_flags		= FS_REQUIRES_DEV,</div><div class='ctx'> };</div><div class='ctx'> MODULE_ALIAS_FS("ext2");</div><div class='ctx'> MODULE_ALIAS("ext2");</div><div class='del'>-#define IS_EXT2_SB(sb) ((sb)-&gt;s_bdev-&gt;bd_holder == &amp;ext2_fs_type)</div><div class='add'>+#define IS_EXT2_SB(sb) ((sb)-&gt;s_type == &amp;ext2_fs_type)</div><div class='ctx'> #else</div><div class='ctx'> #define IS_EXT2_SB(sb) (0)</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> static struct file_system_type ext3_fs_type = {</div><div class='del'>-	.owner		= THIS_MODULE,</div><div class='del'>-	.name		= "ext3",</div><div class='del'>-	.mount		= ext4_mount,</div><div class='del'>-	.kill_sb	= kill_block_super,</div><div class='del'>-	.fs_flags	= FS_REQUIRES_DEV,</div><div class='add'>+	.owner			= THIS_MODULE,</div><div class='add'>+	.name			= "ext3",</div><div class='add'>+	.init_fs_context	= ext4_init_fs_context,</div><div class='add'>+	.parameters		= ext4_param_specs,</div><div class='add'>+	.kill_sb		= ext4_kill_sb,</div><div class='add'>+	.fs_flags		= FS_REQUIRES_DEV,</div><div class='ctx'> };</div><div class='ctx'> MODULE_ALIAS_FS("ext3");</div><div class='ctx'> MODULE_ALIAS("ext3");</div><div class='del'>-#define IS_EXT3_SB(sb) ((sb)-&gt;s_bdev-&gt;bd_holder == &amp;ext3_fs_type)</div><div class='add'>+#define IS_EXT3_SB(sb) ((sb)-&gt;s_type == &amp;ext3_fs_type)</div><div class='ctx'> </div><div class='ctx'> </div><div class='del'>-static inline void __ext4_read_bh(struct buffer_head *bh, int op_flags,</div><div class='del'>-				  bh_end_io_t *end_io)</div><div class='add'>+static inline void __ext4_read_bh(struct buffer_head *bh, blk_opf_t op_flags,</div><div class='add'>+				  bh_end_io_t *end_io, bool simu_fail)</div><div class='ctx'> {</div><div class='add'>+	if (simu_fail) {</div><div class='add'>+		clear_buffer_uptodate(bh);</div><div class='add'>+		unlock_buffer(bh);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * buffer's verified bit is no longer valid after reading from</div><div class='ctx'> 	 * disk again due to write out error, clear it to make sure we</div><div class='hunk'>@@ -153,11 +177,11 @@ static inline void __ext4_read_bh(struct buffer_head *bh, int op_flags,</div><div class='ctx'> </div><div class='ctx'> 	bh-&gt;b_end_io = end_io ? end_io : end_buffer_read_sync;</div><div class='ctx'> 	get_bh(bh);</div><div class='del'>-	submit_bh(REQ_OP_READ, op_flags, bh);</div><div class='add'>+	submit_bh(REQ_OP_READ | op_flags, bh);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void ext4_read_bh_nowait(struct buffer_head *bh, int op_flags,</div><div class='del'>-			 bh_end_io_t *end_io)</div><div class='add'>+void ext4_read_bh_nowait(struct buffer_head *bh, blk_opf_t op_flags,</div><div class='add'>+			 bh_end_io_t *end_io, bool simu_fail)</div><div class='ctx'> {</div><div class='ctx'> 	BUG_ON(!buffer_locked(bh));</div><div class='ctx'> </div><div class='hunk'>@@ -165,10 +189,11 @@ void ext4_read_bh_nowait(struct buffer_head *bh, int op_flags,</div><div class='ctx'> 		unlock_buffer(bh);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='del'>-	__ext4_read_bh(bh, op_flags, end_io);</div><div class='add'>+	__ext4_read_bh(bh, op_flags, end_io, simu_fail);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int ext4_read_bh(struct buffer_head *bh, int op_flags, bh_end_io_t *end_io)</div><div class='add'>+int ext4_read_bh(struct buffer_head *bh, blk_opf_t op_flags,</div><div class='add'>+		 bh_end_io_t *end_io, bool simu_fail)</div><div class='ctx'> {</div><div class='ctx'> 	BUG_ON(!buffer_locked(bh));</div><div class='ctx'> </div><div class='hunk'>@@ -177,7 +202,7 @@ int ext4_read_bh(struct buffer_head *bh, int op_flags, bh_end_io_t *end_io)</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	__ext4_read_bh(bh, op_flags, end_io);</div><div class='add'>+	__ext4_read_bh(bh, op_flags, end_io, simu_fail);</div><div class='ctx'> </div><div class='ctx'> 	wait_on_buffer(bh);</div><div class='ctx'> 	if (buffer_uptodate(bh))</div><div class='hunk'>@@ -185,21 +210,14 @@ int ext4_read_bh(struct buffer_head *bh, int op_flags, bh_end_io_t *end_io)</div><div class='ctx'> 	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int ext4_read_bh_lock(struct buffer_head *bh, int op_flags, bool wait)</div><div class='add'>+int ext4_read_bh_lock(struct buffer_head *bh, blk_opf_t op_flags, bool wait)</div><div class='ctx'> {</div><div class='del'>-	if (trylock_buffer(bh)) {</div><div class='del'>-		if (wait)</div><div class='del'>-			return ext4_read_bh(bh, op_flags, NULL);</div><div class='del'>-		ext4_read_bh_nowait(bh, op_flags, NULL);</div><div class='add'>+	lock_buffer(bh);</div><div class='add'>+	if (!wait) {</div><div class='add'>+		ext4_read_bh_nowait(bh, op_flags, NULL, false);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='del'>-	if (wait) {</div><div class='del'>-		wait_on_buffer(bh);</div><div class='del'>-		if (buffer_uptodate(bh))</div><div class='del'>-			return 0;</div><div class='del'>-		return -EIO;</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='add'>+	return ext4_read_bh(bh, op_flags, NULL, false);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -209,8 +227,8 @@ int ext4_read_bh_lock(struct buffer_head *bh, int op_flags, bool wait)</div><div class='ctx'>  * return.</div><div class='ctx'>  */</div><div class='ctx'> static struct buffer_head *__ext4_sb_bread_gfp(struct super_block *sb,</div><div class='del'>-					       sector_t block, int op_flags,</div><div class='del'>-					       gfp_t gfp)</div><div class='add'>+					       sector_t block,</div><div class='add'>+					       blk_opf_t op_flags, gfp_t gfp)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -230,23 +248,40 @@ static struct buffer_head *__ext4_sb_bread_gfp(struct super_block *sb,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct buffer_head *ext4_sb_bread(struct super_block *sb, sector_t block,</div><div class='del'>-				   int op_flags)</div><div class='add'>+				   blk_opf_t op_flags)</div><div class='ctx'> {</div><div class='del'>-	return __ext4_sb_bread_gfp(sb, block, op_flags, __GFP_MOVABLE);</div><div class='add'>+	gfp_t gfp = mapping_gfp_constraint(sb-&gt;s_bdev-&gt;bd_mapping,</div><div class='add'>+			~__GFP_FS) | __GFP_MOVABLE;</div><div class='add'>+</div><div class='add'>+	return __ext4_sb_bread_gfp(sb, block, op_flags, gfp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct buffer_head *ext4_sb_bread_unmovable(struct super_block *sb,</div><div class='ctx'> 					    sector_t block)</div><div class='ctx'> {</div><div class='del'>-	return __ext4_sb_bread_gfp(sb, block, 0, 0);</div><div class='add'>+	gfp_t gfp = mapping_gfp_constraint(sb-&gt;s_bdev-&gt;bd_mapping,</div><div class='add'>+			~__GFP_FS);</div><div class='add'>+</div><div class='add'>+	return __ext4_sb_bread_gfp(sb, block, 0, gfp);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct buffer_head *ext4_sb_bread_nofail(struct super_block *sb,</div><div class='add'>+					 sector_t block)</div><div class='add'>+{</div><div class='add'>+	gfp_t gfp = mapping_gfp_constraint(sb-&gt;s_bdev-&gt;bd_mapping,</div><div class='add'>+			~__GFP_FS) | __GFP_MOVABLE | __GFP_NOFAIL;</div><div class='add'>+</div><div class='add'>+	return __ext4_sb_bread_gfp(sb, block, 0, gfp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void ext4_sb_breadahead_unmovable(struct super_block *sb, sector_t block)</div><div class='ctx'> {</div><div class='del'>-	struct buffer_head *bh = sb_getblk_gfp(sb, block, 0);</div><div class='add'>+	struct buffer_head *bh = bdev_getblk(sb-&gt;s_bdev, block,</div><div class='add'>+			sb-&gt;s_blocksize, GFP_NOWAIT);</div><div class='ctx'> </div><div class='ctx'> 	if (likely(bh)) {</div><div class='del'>-		ext4_read_bh_lock(bh, REQ_RAHEAD, false);</div><div class='add'>+		if (trylock_buffer(bh))</div><div class='add'>+			ext4_read_bh_nowait(bh, REQ_RAHEAD, NULL, false);</div><div class='ctx'> 		brelse(bh);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -260,14 +295,12 @@ static int ext4_verify_csum_type(struct super_block *sb,</div><div class='ctx'> 	return es-&gt;s_checksum_type == EXT4_CRC32C_CHKSUM;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static __le32 ext4_superblock_csum(struct super_block *sb,</div><div class='del'>-				   struct ext4_super_block *es)</div><div class='add'>+__le32 ext4_superblock_csum(struct ext4_super_block *es)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> 	int offset = offsetof(struct ext4_super_block, s_checksum);</div><div class='ctx'> 	__u32 csum;</div><div class='ctx'> </div><div class='del'>-	csum = ext4_chksum(sbi, ~0, (char *)es, offset);</div><div class='add'>+	csum = ext4_chksum(~0, (char *)es, offset);</div><div class='ctx'> </div><div class='ctx'> 	return cpu_to_le32(csum);</div><div class='ctx'> }</div><div class='hunk'>@@ -275,20 +308,20 @@ static __le32 ext4_superblock_csum(struct super_block *sb,</div><div class='ctx'> static int ext4_superblock_csum_verify(struct super_block *sb,</div><div class='ctx'> 				       struct ext4_super_block *es)</div><div class='ctx'> {</div><div class='del'>-	if (!ext4_has_metadata_csum(sb))</div><div class='add'>+	if (!ext4_has_feature_metadata_csum(sb))</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='del'>-	return es-&gt;s_checksum == ext4_superblock_csum(sb, es);</div><div class='add'>+	return es-&gt;s_checksum == ext4_superblock_csum(es);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void ext4_superblock_csum_set(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_super_block *es = EXT4_SB(sb)-&gt;s_es;</div><div class='ctx'> </div><div class='del'>-	if (!ext4_has_metadata_csum(sb))</div><div class='add'>+	if (!ext4_has_feature_metadata_csum(sb))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	es-&gt;s_checksum = ext4_superblock_csum(sb, es);</div><div class='add'>+	es-&gt;s_checksum = ext4_superblock_csum(es);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> ext4_fsblk_t ext4_block_bitmap(struct super_block *sb,</div><div class='hunk'>@@ -326,9 +359,9 @@ __u32 ext4_free_group_clusters(struct super_block *sb,</div><div class='ctx'> __u32 ext4_free_inodes_count(struct super_block *sb,</div><div class='ctx'> 			      struct ext4_group_desc *bg)</div><div class='ctx'> {</div><div class='del'>-	return le16_to_cpu(bg-&gt;bg_free_inodes_count_lo) |</div><div class='add'>+	return le16_to_cpu(READ_ONCE(bg-&gt;bg_free_inodes_count_lo)) |</div><div class='ctx'> 		(EXT4_DESC_SIZE(sb) &gt;= EXT4_MIN_DESC_SIZE_64BIT ?</div><div class='del'>-		 (__u32)le16_to_cpu(bg-&gt;bg_free_inodes_count_hi) &lt;&lt; 16 : 0);</div><div class='add'>+		 (__u32)le16_to_cpu(READ_ONCE(bg-&gt;bg_free_inodes_count_hi)) &lt;&lt; 16 : 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> __u32 ext4_used_dirs_count(struct super_block *sb,</div><div class='hunk'>@@ -382,9 +415,9 @@ void ext4_free_group_clusters_set(struct super_block *sb,</div><div class='ctx'> void ext4_free_inodes_set(struct super_block *sb,</div><div class='ctx'> 			  struct ext4_group_desc *bg, __u32 count)</div><div class='ctx'> {</div><div class='del'>-	bg-&gt;bg_free_inodes_count_lo = cpu_to_le16((__u16)count);</div><div class='add'>+	WRITE_ONCE(bg-&gt;bg_free_inodes_count_lo, cpu_to_le16((__u16)count));</div><div class='ctx'> 	if (EXT4_DESC_SIZE(sb) &gt;= EXT4_MIN_DESC_SIZE_64BIT)</div><div class='del'>-		bg-&gt;bg_free_inodes_count_hi = cpu_to_le16(count &gt;&gt; 16);</div><div class='add'>+		WRITE_ONCE(bg-&gt;bg_free_inodes_count_hi, cpu_to_le16(count &gt;&gt; 16));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void ext4_used_dirs_set(struct super_block *sb,</div><div class='hunk'>@@ -422,63 +455,73 @@ static time64_t __ext4_get_tstamp(__le32 *lo, __u8 *hi)</div><div class='ctx'> 	__ext4_get_tstamp(&amp;(es)-&gt;tstamp, &amp;(es)-&gt;tstamp ## _hi)</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * The del_gendisk() function uninitializes the disk-specific data</div><div class='del'>- * structures, including the bdi structure, without telling anyone</div><div class='del'>- * else.  Once this happens, any attempt to call mark_buffer_dirty()</div><div class='del'>- * (for example, by ext4_commit_super), will cause a kernel OOPS.</div><div class='del'>- * This is a kludge to prevent these oops until we can put in a proper</div><div class='del'>- * hook in del_gendisk() to inform the VFS and file system layers.</div><div class='add'>+ * The ext4_maybe_update_superblock() function checks and updates the</div><div class='add'>+ * superblock if needed.</div><div class='add'>+ *</div><div class='add'>+ * This function is designed to update the on-disk superblock only under</div><div class='add'>+ * certain conditions to prevent excessive disk writes and unnecessary</div><div class='add'>+ * waking of the disk from sleep. The superblock will be updated if:</div><div class='add'>+ * 1. More than sbi-&gt;s_sb_update_sec (def: 1 hour) has passed since the last</div><div class='add'>+ *    superblock update</div><div class='add'>+ * 2. More than sbi-&gt;s_sb_update_kb (def: 16MB) kbs have been written since the</div><div class='add'>+ *    last superblock update.</div><div class='add'>+ *</div><div class='add'>+ * @sb: The superblock</div><div class='ctx'>  */</div><div class='del'>-static int block_device_ejected(struct super_block *sb)</div><div class='add'>+static void ext4_maybe_update_superblock(struct super_block *sb)</div><div class='ctx'> {</div><div class='del'>-	struct inode *bd_inode = sb-&gt;s_bdev-&gt;bd_inode;</div><div class='del'>-	struct backing_dev_info *bdi = inode_to_bdi(bd_inode);</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	struct ext4_super_block *es = sbi-&gt;s_es;</div><div class='add'>+	journal_t *journal = sbi-&gt;s_journal;</div><div class='add'>+	time64_t now;</div><div class='add'>+	__u64 last_update;</div><div class='add'>+	__u64 lifetime_write_kbytes;</div><div class='add'>+	__u64 diff_size;</div><div class='add'>+</div><div class='add'>+	if (ext4_emergency_state(sb) || sb_rdonly(sb) ||</div><div class='add'>+	    !(sb-&gt;s_flags &amp; SB_ACTIVE) || !journal ||</div><div class='add'>+	    journal-&gt;j_flags &amp; JBD2_UNMOUNT)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	now = ktime_get_real_seconds();</div><div class='add'>+	last_update = ext4_get_tstamp(es, s_wtime);</div><div class='add'>+</div><div class='add'>+	if (likely(now - last_update &lt; sbi-&gt;s_sb_update_sec))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	lifetime_write_kbytes = sbi-&gt;s_kbytes_written +</div><div class='add'>+		((part_stat_read(sb-&gt;s_bdev, sectors[STAT_WRITE]) -</div><div class='add'>+		  sbi-&gt;s_sectors_written_start) &gt;&gt; 1);</div><div class='add'>+</div><div class='add'>+	/* Get the number of kilobytes not written to disk to account</div><div class='add'>+	 * for statistics and compare with a multiple of 16 MB. This</div><div class='add'>+	 * is used to determine when the next superblock commit should</div><div class='add'>+	 * occur (i.e. not more often than once per 16MB if there was</div><div class='add'>+	 * less written in an hour).</div><div class='add'>+	 */</div><div class='add'>+	diff_size = lifetime_write_kbytes - le64_to_cpu(es-&gt;s_kbytes_written);</div><div class='ctx'> </div><div class='del'>-	return bdi-&gt;dev == NULL;</div><div class='add'>+	if (diff_size &gt; sbi-&gt;s_sb_update_kb)</div><div class='add'>+		schedule_work(&amp;EXT4_SB(sb)-&gt;s_sb_upd_work);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void ext4_journal_commit_callback(journal_t *journal, transaction_t *txn)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block		*sb = journal-&gt;j_private;</div><div class='del'>-	struct ext4_sb_info		*sbi = EXT4_SB(sb);</div><div class='del'>-	int				error = is_journal_aborted(journal);</div><div class='del'>-	struct ext4_journal_cb_entry	*jce;</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(txn-&gt;t_state == T_FINISHED);</div><div class='ctx'> </div><div class='ctx'> 	ext4_process_freed_data(sb, txn-&gt;t_tid);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;sbi-&gt;s_md_lock);</div><div class='del'>-	while (!list_empty(&amp;txn-&gt;t_private_list)) {</div><div class='del'>-		jce = list_entry(txn-&gt;t_private_list.next,</div><div class='del'>-				 struct ext4_journal_cb_entry, jce_list);</div><div class='del'>-		list_del_init(&amp;jce-&gt;jce_list);</div><div class='del'>-		spin_unlock(&amp;sbi-&gt;s_md_lock);</div><div class='del'>-		jce-&gt;jce_func(sb, jce, error);</div><div class='del'>-		spin_lock(&amp;sbi-&gt;s_md_lock);</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;sbi-&gt;s_md_lock);</div><div class='add'>+	ext4_maybe_update_superblock(sb);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * This writepage callback for write_cache_pages()</div><div class='del'>- * takes care of a few cases after page cleaning.</div><div class='del'>- *</div><div class='del'>- * write_cache_pages() already checks for dirty pages</div><div class='del'>- * and calls clear_page_dirty_for_io(), which we want,</div><div class='del'>- * to write protect the pages.</div><div class='del'>- *</div><div class='del'>- * However, we may have to redirty a page (see below.)</div><div class='del'>- */</div><div class='del'>-static int ext4_journalled_writepage_callback(struct page *page,</div><div class='del'>-					      struct writeback_control *wbc,</div><div class='del'>-					      void *data)</div><div class='add'>+static bool ext4_journalled_writepage_needs_redirty(struct jbd2_inode *jinode,</div><div class='add'>+		struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	transaction_t *transaction = (transaction_t *) data;</div><div class='ctx'> 	struct buffer_head *bh, *head;</div><div class='ctx'> 	struct journal_head *jh;</div><div class='ctx'> </div><div class='del'>-	bh = head = page_buffers(page);</div><div class='add'>+	bh = head = folio_buffers(folio);</div><div class='ctx'> 	do {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We have to redirty a page in these cases:</div><div class='hunk'>@@ -495,15 +538,12 @@ static int ext4_journalled_writepage_callback(struct page *page,</div><div class='ctx'> 		 */</div><div class='ctx'> 		jh = bh2jh(bh);</div><div class='ctx'> 		if (buffer_dirty(bh) ||</div><div class='del'>-		    (jh &amp;&amp; (jh-&gt;b_transaction != transaction ||</div><div class='del'>-			    jh-&gt;b_next_transaction))) {</div><div class='del'>-			redirty_page_for_writepage(wbc, page);</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+		    (jh &amp;&amp; (jh-&gt;b_transaction != jinode-&gt;i_transaction ||</div><div class='add'>+			    jh-&gt;b_next_transaction)))</div><div class='add'>+			return true;</div><div class='ctx'> 	} while ((bh = bh-&gt;b_this_page) != head);</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	return AOP_WRITEPAGE_ACTIVATE;</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ext4_journalled_submit_inode_data_buffers(struct jbd2_inode *jinode)</div><div class='hunk'>@@ -515,10 +555,23 @@ static int ext4_journalled_submit_inode_data_buffers(struct jbd2_inode *jinode)</div><div class='ctx'> 		.range_start = jinode-&gt;i_dirty_start,</div><div class='ctx'> 		.range_end = jinode-&gt;i_dirty_end,</div><div class='ctx'>         };</div><div class='add'>+	struct folio *folio = NULL;</div><div class='add'>+	int error;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * writeback_iter() already checks for dirty pages and calls</div><div class='add'>+	 * folio_clear_dirty_for_io(), which we want to write protect the</div><div class='add'>+	 * folios.</div><div class='add'>+	 *</div><div class='add'>+	 * However, we may have to redirty a folio sometimes.</div><div class='add'>+	 */</div><div class='add'>+	while ((folio = writeback_iter(mapping, &amp;wbc, folio, &amp;error))) {</div><div class='add'>+		if (ext4_journalled_writepage_needs_redirty(jinode, folio))</div><div class='add'>+			folio_redirty_for_writepage(&amp;wbc, folio);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	return write_cache_pages(mapping, &amp;wbc,</div><div class='del'>-				 ext4_journalled_writepage_callback,</div><div class='del'>-				 jinode-&gt;i_transaction);</div><div class='add'>+	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ext4_journal_submit_inode_data_buffers(struct jbd2_inode *jinode)</div><div class='hunk'>@@ -528,8 +581,7 @@ static int ext4_journal_submit_inode_data_buffers(struct jbd2_inode *jinode)</div><div class='ctx'> 	if (ext4_should_journal_data(jinode-&gt;i_vfs_inode))</div><div class='ctx'> 		ret = ext4_journalled_submit_inode_data_buffers(jinode);</div><div class='ctx'> 	else</div><div class='del'>-		ret = jbd2_journal_submit_inode_data_buffers(jinode);</div><div class='del'>-</div><div class='add'>+		ret = ext4_normal_submit_inode_data_buffers(jinode);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -645,11 +697,8 @@ static void ext4_handle_error(struct super_block *sb, bool force_ro, int error,</div><div class='ctx'> 	if (test_opt(sb, WARN_ON_ERROR))</div><div class='ctx'> 		WARN_ON_ONCE(1);</div><div class='ctx'> </div><div class='del'>-	if (!continue_fs &amp;&amp; !sb_rdonly(sb)) {</div><div class='del'>-		ext4_set_mount_flag(sb, EXT4_MF_FS_ABORTED);</div><div class='del'>-		if (journal)</div><div class='del'>-			jbd2_journal_abort(journal, -EIO);</div><div class='del'>-	}</div><div class='add'>+	if (!continue_fs &amp;&amp; !ext4_emergency_ro(sb) &amp;&amp; journal)</div><div class='add'>+		jbd2_journal_abort(journal, -error);</div><div class='ctx'> </div><div class='ctx'> 	if (!bdev_read_only(sb-&gt;s_bdev)) {</div><div class='ctx'> 		save_error_info(sb, error, ino, block, func, line);</div><div class='hunk'>@@ -657,10 +706,14 @@ static void ext4_handle_error(struct super_block *sb, bool force_ro, int error,</div><div class='ctx'> 		 * In case the fs should keep running, we need to writeout</div><div class='ctx'> 		 * superblock through the journal. Due to lock ordering</div><div class='ctx'> 		 * constraints, it may not be safe to do it right here so we</div><div class='del'>-		 * defer superblock flushing to a workqueue.</div><div class='add'>+		 * defer superblock flushing to a workqueue. We just need to be</div><div class='add'>+		 * careful when the journal is already shutting down. If we get</div><div class='add'>+		 * here in that case, just update the sb directly as the last</div><div class='add'>+		 * transaction won't commit anyway.</div><div class='ctx'> 		 */</div><div class='del'>-		if (continue_fs &amp;&amp; journal)</div><div class='del'>-			schedule_work(&amp;EXT4_SB(sb)-&gt;s_error_work);</div><div class='add'>+		if (continue_fs &amp;&amp; journal &amp;&amp;</div><div class='add'>+		    !ext4_test_mount_flag(sb, EXT4_MF_JOURNAL_DESTROY))</div><div class='add'>+			schedule_work(&amp;EXT4_SB(sb)-&gt;s_sb_upd_work);</div><div class='ctx'> 		else</div><div class='ctx'> 			ext4_commit_super(sb);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -675,22 +728,23 @@ static void ext4_handle_error(struct super_block *sb, bool force_ro, int error,</div><div class='ctx'> 			sb-&gt;s_id);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (sb_rdonly(sb) || continue_fs)</div><div class='add'>+	if (ext4_emergency_ro(sb) || continue_fs)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	ext4_msg(sb, KERN_CRIT, "Remounting filesystem read-only");</div><div class='ctx'> 	/*</div><div class='del'>-	 * Make sure updated value of -&gt;s_mount_flags will be visible before</div><div class='del'>-	 * -&gt;s_flags update</div><div class='add'>+	 * We don't set SB_RDONLY because that requires sb-&gt;s_umount</div><div class='add'>+	 * semaphore and setting it without proper remount procedure is</div><div class='add'>+	 * confusing code such as freeze_super() leading to deadlocks</div><div class='add'>+	 * and other problems.</div><div class='ctx'> 	 */</div><div class='del'>-	smp_wmb();</div><div class='del'>-	sb-&gt;s_flags |= SB_RDONLY;</div><div class='add'>+	set_bit(EXT4_FLAGS_EMERGENCY_RO, &amp;EXT4_SB(sb)-&gt;s_ext4_flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void flush_stashed_error_work(struct work_struct *work)</div><div class='add'>+static void update_super_work(struct work_struct *work)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_sb_info *sbi = container_of(work, struct ext4_sb_info,</div><div class='del'>-						s_error_work);</div><div class='add'>+						s_sb_upd_work);</div><div class='ctx'> 	journal_t *journal = sbi-&gt;s_journal;</div><div class='ctx'> 	handle_t *handle;</div><div class='ctx'> </div><div class='hunk'>@@ -702,8 +756,11 @@ static void flush_stashed_error_work(struct work_struct *work)</div><div class='ctx'> 	 * We use directly jbd2 functions here to avoid recursing back into</div><div class='ctx'> 	 * ext4 error handling code during handling of previous errors.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!sb_rdonly(sbi-&gt;s_sb) &amp;&amp; journal) {</div><div class='add'>+	if (!ext4_emergency_state(sbi-&gt;s_sb) &amp;&amp;</div><div class='add'>+	    !sb_rdonly(sbi-&gt;s_sb) &amp;&amp; journal) {</div><div class='ctx'> 		struct buffer_head *sbh = sbi-&gt;s_sbh;</div><div class='add'>+		bool call_notify_err = false;</div><div class='add'>+</div><div class='ctx'> 		handle = jbd2_journal_start(journal, 1);</div><div class='ctx'> 		if (IS_ERR(handle))</div><div class='ctx'> 			goto write_directly;</div><div class='hunk'>@@ -711,6 +768,10 @@ static void flush_stashed_error_work(struct work_struct *work)</div><div class='ctx'> 			jbd2_journal_stop(handle);</div><div class='ctx'> 			goto write_directly;</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='add'>+		if (sbi-&gt;s_add_error_count &gt; 0)</div><div class='add'>+			call_notify_err = true;</div><div class='add'>+</div><div class='ctx'> 		ext4_update_super(sbi-&gt;s_sb);</div><div class='ctx'> 		if (buffer_write_io_error(sbh) || !buffer_uptodate(sbh)) {</div><div class='ctx'> 			ext4_msg(sbi-&gt;s_sb, KERN_ERR, "previous I/O error to "</div><div class='hunk'>@@ -724,7 +785,10 @@ static void flush_stashed_error_work(struct work_struct *work)</div><div class='ctx'> 			goto write_directly;</div><div class='ctx'> 		}</div><div class='ctx'> 		jbd2_journal_stop(handle);</div><div class='del'>-		ext4_notify_error_sysfs(sbi);</div><div class='add'>+</div><div class='add'>+		if (call_notify_err)</div><div class='add'>+			ext4_notify_error_sysfs(sbi);</div><div class='add'>+</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> write_directly:</div><div class='hunk'>@@ -747,7 +811,7 @@ void __ext4_error(struct super_block *sb, const char *function,</div><div class='ctx'> 	struct va_format vaf;</div><div class='ctx'> 	va_list args;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ext4_forced_shutdown(EXT4_SB(sb))))</div><div class='add'>+	if (unlikely(ext4_emergency_state(sb)))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	trace_ext4_error(sb, function, line);</div><div class='hunk'>@@ -772,7 +836,7 @@ void __ext4_error_inode(struct inode *inode, const char *function,</div><div class='ctx'> 	va_list args;</div><div class='ctx'> 	struct va_format vaf;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ext4_forced_shutdown(EXT4_SB(inode-&gt;i_sb))))</div><div class='add'>+	if (unlikely(ext4_emergency_state(inode-&gt;i_sb)))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	trace_ext4_error(inode-&gt;i_sb, function, line);</div><div class='hunk'>@@ -807,7 +871,7 @@ void __ext4_error_file(struct file *file, const char *function,</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='ctx'> 	char pathname[80], *path;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ext4_forced_shutdown(EXT4_SB(inode-&gt;i_sb))))</div><div class='add'>+	if (unlikely(ext4_emergency_state(inode-&gt;i_sb)))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	trace_ext4_error(inode-&gt;i_sb, function, line);</div><div class='hunk'>@@ -887,7 +951,7 @@ void __ext4_std_error(struct super_block *sb, const char *function,</div><div class='ctx'> 	char nbuf[16];</div><div class='ctx'> 	const char *errstr;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ext4_forced_shutdown(EXT4_SB(sb))))</div><div class='add'>+	if (unlikely(ext4_emergency_state(sb)))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	/* Special case: if the error is EROFS, and we're not already</div><div class='hunk'>@@ -912,14 +976,20 @@ void __ext4_msg(struct super_block *sb,</div><div class='ctx'> 	struct va_format vaf;</div><div class='ctx'> 	va_list args;</div><div class='ctx'> </div><div class='del'>-	atomic_inc(&amp;EXT4_SB(sb)-&gt;s_msg_count);</div><div class='del'>-	if (!___ratelimit(&amp;(EXT4_SB(sb)-&gt;s_msg_ratelimit_state), "EXT4-fs"))</div><div class='del'>-		return;</div><div class='add'>+	if (sb) {</div><div class='add'>+		atomic_inc(&amp;EXT4_SB(sb)-&gt;s_msg_count);</div><div class='add'>+		if (!___ratelimit(&amp;(EXT4_SB(sb)-&gt;s_msg_ratelimit_state),</div><div class='add'>+				  "EXT4-fs"))</div><div class='add'>+			return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	va_start(args, fmt);</div><div class='ctx'> 	vaf.fmt = fmt;</div><div class='ctx'> 	vaf.va = &amp;args;</div><div class='del'>-	printk("%sEXT4-fs (%s): %pV\n", prefix, sb-&gt;s_id, &amp;vaf);</div><div class='add'>+	if (sb)</div><div class='add'>+		printk("%sEXT4-fs (%s): %pV\n", prefix, sb-&gt;s_id, &amp;vaf);</div><div class='add'>+	else</div><div class='add'>+		printk("%sEXT4-fs: %pV\n", prefix, &amp;vaf);</div><div class='ctx'> 	va_end(args);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -975,7 +1045,7 @@ __acquires(bitlock)</div><div class='ctx'> 	struct va_format vaf;</div><div class='ctx'> 	va_list args;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ext4_forced_shutdown(EXT4_SB(sb))))</div><div class='add'>+	if (unlikely(ext4_emergency_state(sb)))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	trace_ext4_error(sb, function, line);</div><div class='hunk'>@@ -1001,7 +1071,7 @@ __acquires(bitlock)</div><div class='ctx'> 		if (!bdev_read_only(sb-&gt;s_bdev)) {</div><div class='ctx'> 			save_error_info(sb, EFSCORRUPTED, ino, block, function,</div><div class='ctx'> 					line);</div><div class='del'>-			schedule_work(&amp;EXT4_SB(sb)-&gt;s_error_work);</div><div class='add'>+			schedule_work(&amp;EXT4_SB(sb)-&gt;s_sb_upd_work);</div><div class='ctx'> 		}</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1031,6 +1101,8 @@ void ext4_mark_group_bitmap_corrupted(struct super_block *sb,</div><div class='ctx'> 	struct ext4_group_desc *gdp = ext4_get_group_desc(sb, group, NULL);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='add'>+	if (!grp || !gdp)</div><div class='add'>+		return;</div><div class='ctx'> 	if (flags &amp; EXT4_GROUP_INFO_BBITMAP_CORRUPT) {</div><div class='ctx'> 		ret = ext4_test_and_set_bit(EXT4_GROUP_INFO_BBITMAP_CORRUPT_BIT,</div><div class='ctx'> 					    &amp;grp-&gt;bb_state);</div><div class='hunk'>@@ -1077,43 +1149,6 @@ void ext4_update_dynamic_rev(struct super_block *sb)</div><div class='ctx'> 	 */</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Open the external journal device</div><div class='del'>- */</div><div class='del'>-static struct block_device *ext4_blkdev_get(dev_t dev, struct super_block *sb)</div><div class='del'>-{</div><div class='del'>-	struct block_device *bdev;</div><div class='del'>-</div><div class='del'>-	bdev = blkdev_get_by_dev(dev, FMODE_READ|FMODE_WRITE|FMODE_EXCL, sb);</div><div class='del'>-	if (IS_ERR(bdev))</div><div class='del'>-		goto fail;</div><div class='del'>-	return bdev;</div><div class='del'>-</div><div class='del'>-fail:</div><div class='del'>-	ext4_msg(sb, KERN_ERR,</div><div class='del'>-		 "failed to open journal device unknown-block(%u,%u) %ld",</div><div class='del'>-		 MAJOR(dev), MINOR(dev), PTR_ERR(bdev));</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Release the journal device</div><div class='del'>- */</div><div class='del'>-static void ext4_blkdev_put(struct block_device *bdev)</div><div class='del'>-{</div><div class='del'>-	blkdev_put(bdev, FMODE_READ|FMODE_WRITE|FMODE_EXCL);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void ext4_blkdev_remove(struct ext4_sb_info *sbi)</div><div class='del'>-{</div><div class='del'>-	struct block_device *bdev;</div><div class='del'>-	bdev = sbi-&gt;s_journal_bdev;</div><div class='del'>-	if (bdev) {</div><div class='del'>-		ext4_blkdev_put(bdev);</div><div class='del'>-		sbi-&gt;s_journal_bdev = NULL;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static inline struct inode *orphan_list_entry(struct list_head *l)</div><div class='ctx'> {</div><div class='ctx'> 	return &amp;list_entry(l, struct ext4_inode_info, i_orphan)-&gt;vfs_inode;</div><div class='hunk'>@@ -1140,12 +1175,12 @@ static void dump_orphan_list(struct super_block *sb, struct ext4_sb_info *sbi)</div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='ctx'> static int ext4_quota_off(struct super_block *sb, int type);</div><div class='ctx'> </div><div class='del'>-static inline void ext4_quota_off_umount(struct super_block *sb)</div><div class='add'>+static inline void ext4_quotas_off(struct super_block *sb, int type)</div><div class='ctx'> {</div><div class='del'>-	int type;</div><div class='add'>+	BUG_ON(type &gt; EXT4_MAXQUOTAS);</div><div class='ctx'> </div><div class='ctx'> 	/* Use our quota_off function to clear inode flags etc. */</div><div class='del'>-	for (type = 0; type &lt; EXT4_MAXQUOTAS; type++)</div><div class='add'>+	for (type--; type &gt;= 0; type--)</div><div class='ctx'> 		ext4_quota_off(sb, type);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1161,77 +1196,143 @@ static inline char *get_qf_name(struct super_block *sb,</div><div class='ctx'> 					 lockdep_is_held(&amp;sb-&gt;s_umount));</div><div class='ctx'> }</div><div class='ctx'> #else</div><div class='del'>-static inline void ext4_quota_off_umount(struct super_block *sb)</div><div class='add'>+static inline void ext4_quotas_off(struct super_block *sb, int type)</div><div class='ctx'> {</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-static void ext4_put_super(struct super_block *sb)</div><div class='add'>+static int ext4_percpu_param_init(struct ext4_sb_info *sbi)</div><div class='add'>+{</div><div class='add'>+	ext4_fsblk_t block;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	block = ext4_count_free_clusters(sbi-&gt;s_sb);</div><div class='add'>+	ext4_free_blocks_count_set(sbi-&gt;s_es, EXT4_C2B(sbi, block));</div><div class='add'>+	err = percpu_counter_init(&amp;sbi-&gt;s_freeclusters_counter, block,</div><div class='add'>+				  GFP_KERNEL);</div><div class='add'>+	if (!err) {</div><div class='add'>+		unsigned long freei = ext4_count_free_inodes(sbi-&gt;s_sb);</div><div class='add'>+		sbi-&gt;s_es-&gt;s_free_inodes_count = cpu_to_le32(freei);</div><div class='add'>+		err = percpu_counter_init(&amp;sbi-&gt;s_freeinodes_counter, freei,</div><div class='add'>+					  GFP_KERNEL);</div><div class='add'>+	}</div><div class='add'>+	if (!err)</div><div class='add'>+		err = percpu_counter_init(&amp;sbi-&gt;s_dirs_counter,</div><div class='add'>+					  ext4_count_dirs(sbi-&gt;s_sb), GFP_KERNEL);</div><div class='add'>+	if (!err)</div><div class='add'>+		err = percpu_counter_init(&amp;sbi-&gt;s_dirtyclusters_counter, 0,</div><div class='add'>+					  GFP_KERNEL);</div><div class='add'>+	if (!err)</div><div class='add'>+		err = percpu_counter_init(&amp;sbi-&gt;s_sra_exceeded_retry_limit, 0,</div><div class='add'>+					  GFP_KERNEL);</div><div class='add'>+	if (!err)</div><div class='add'>+		err = percpu_init_rwsem(&amp;sbi-&gt;s_writepages_rwsem);</div><div class='add'>+</div><div class='add'>+	if (err)</div><div class='add'>+		ext4_msg(sbi-&gt;s_sb, KERN_ERR, "insufficient memory");</div><div class='add'>+</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void ext4_percpu_param_destroy(struct ext4_sb_info *sbi)</div><div class='add'>+{</div><div class='add'>+	percpu_counter_destroy(&amp;sbi-&gt;s_freeclusters_counter);</div><div class='add'>+	percpu_counter_destroy(&amp;sbi-&gt;s_freeinodes_counter);</div><div class='add'>+	percpu_counter_destroy(&amp;sbi-&gt;s_dirs_counter);</div><div class='add'>+	percpu_counter_destroy(&amp;sbi-&gt;s_dirtyclusters_counter);</div><div class='add'>+	percpu_counter_destroy(&amp;sbi-&gt;s_sra_exceeded_retry_limit);</div><div class='add'>+	percpu_free_rwsem(&amp;sbi-&gt;s_writepages_rwsem);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void ext4_group_desc_free(struct ext4_sb_info *sbi)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='del'>-	struct ext4_super_block *es = sbi-&gt;s_es;</div><div class='ctx'> 	struct buffer_head **group_desc;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	group_desc = rcu_dereference(sbi-&gt;s_group_desc);</div><div class='add'>+	for (i = 0; i &lt; sbi-&gt;s_gdb_count; i++)</div><div class='add'>+		brelse(group_desc[i]);</div><div class='add'>+	kvfree(group_desc);</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void ext4_flex_groups_free(struct ext4_sb_info *sbi)</div><div class='add'>+{</div><div class='ctx'> 	struct flex_groups **flex_groups;</div><div class='del'>-	int aborted = 0;</div><div class='del'>-	int i, err;</div><div class='add'>+	int i;</div><div class='ctx'> </div><div class='del'>-	ext4_unregister_li_request(sb);</div><div class='del'>-	ext4_quota_off_umount(sb);</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	flex_groups = rcu_dereference(sbi-&gt;s_flex_groups);</div><div class='add'>+	if (flex_groups) {</div><div class='add'>+		for (i = 0; i &lt; sbi-&gt;s_flex_groups_allocated; i++)</div><div class='add'>+			kvfree(flex_groups[i]);</div><div class='add'>+		kvfree(flex_groups);</div><div class='add'>+	}</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	flush_work(&amp;sbi-&gt;s_error_work);</div><div class='del'>-	destroy_workqueue(sbi-&gt;rsv_conversion_wq);</div><div class='del'>-	ext4_release_orphan_info(sb);</div><div class='add'>+static void ext4_put_super(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	struct ext4_super_block *es = sbi-&gt;s_es;</div><div class='add'>+	int aborted = 0;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Unregister sysfs before destroying jbd2 journal.</div><div class='ctx'> 	 * Since we could still access attr_journal_task attribute via sysfs</div><div class='ctx'> 	 * path which could have sbi-&gt;s_journal-&gt;j_task as NULL</div><div class='add'>+	 * Unregister sysfs before flush sbi-&gt;s_sb_upd_work.</div><div class='add'>+	 * Since user may read /proc/fs/ext4/xx/mb_groups during umount, If</div><div class='add'>+	 * read metadata verify failed then will queue error work.</div><div class='add'>+	 * update_super_work will call start_this_handle may trigger</div><div class='add'>+	 * BUG_ON.</div><div class='ctx'> 	 */</div><div class='ctx'> 	ext4_unregister_sysfs(sb);</div><div class='ctx'> </div><div class='add'>+	if (___ratelimit(&amp;ext4_mount_msg_ratelimit, "EXT4-fs unmount"))</div><div class='add'>+		ext4_msg(sb, KERN_INFO, "unmounting filesystem %pU.",</div><div class='add'>+			 &amp;sb-&gt;s_uuid);</div><div class='add'>+</div><div class='add'>+	ext4_unregister_li_request(sb);</div><div class='add'>+	ext4_quotas_off(sb, EXT4_MAXQUOTAS);</div><div class='add'>+</div><div class='add'>+	destroy_workqueue(sbi-&gt;rsv_conversion_wq);</div><div class='add'>+	ext4_release_orphan_info(sb);</div><div class='add'>+</div><div class='ctx'> 	if (sbi-&gt;s_journal) {</div><div class='ctx'> 		aborted = is_journal_aborted(sbi-&gt;s_journal);</div><div class='del'>-		err = jbd2_journal_destroy(sbi-&gt;s_journal);</div><div class='del'>-		sbi-&gt;s_journal = NULL;</div><div class='add'>+		err = ext4_journal_destroy(sbi, sbi-&gt;s_journal);</div><div class='ctx'> 		if ((err &lt; 0) &amp;&amp; !aborted) {</div><div class='ctx'> 			ext4_abort(sb, -err, "Couldn't clean up the journal");</div><div class='ctx'> 		}</div><div class='del'>-	}</div><div class='add'>+	} else</div><div class='add'>+		flush_work(&amp;sbi-&gt;s_sb_upd_work);</div><div class='ctx'> </div><div class='ctx'> 	ext4_es_unregister_shrinker(sbi);</div><div class='del'>-	del_timer_sync(&amp;sbi-&gt;s_err_report);</div><div class='add'>+	timer_shutdown_sync(&amp;sbi-&gt;s_err_report);</div><div class='ctx'> 	ext4_release_system_zone(sb);</div><div class='ctx'> 	ext4_mb_release(sb);</div><div class='ctx'> 	ext4_ext_release(sb);</div><div class='ctx'> </div><div class='del'>-	if (!sb_rdonly(sb) &amp;&amp; !aborted) {</div><div class='del'>-		ext4_clear_feature_journal_needs_recovery(sb);</div><div class='del'>-		ext4_clear_feature_orphan_present(sb);</div><div class='del'>-		es-&gt;s_state = cpu_to_le16(sbi-&gt;s_mount_state);</div><div class='del'>-	}</div><div class='del'>-	if (!sb_rdonly(sb))</div><div class='add'>+	if (!ext4_emergency_state(sb) &amp;&amp; !sb_rdonly(sb)) {</div><div class='add'>+		if (!aborted) {</div><div class='add'>+			ext4_clear_feature_journal_needs_recovery(sb);</div><div class='add'>+			ext4_clear_feature_orphan_present(sb);</div><div class='add'>+			es-&gt;s_state = cpu_to_le16(sbi-&gt;s_mount_state);</div><div class='add'>+		}</div><div class='ctx'> 		ext4_commit_super(sb);</div><div class='del'>-</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	group_desc = rcu_dereference(sbi-&gt;s_group_desc);</div><div class='del'>-	for (i = 0; i &lt; sbi-&gt;s_gdb_count; i++)</div><div class='del'>-		brelse(group_desc[i]);</div><div class='del'>-	kvfree(group_desc);</div><div class='del'>-	flex_groups = rcu_dereference(sbi-&gt;s_flex_groups);</div><div class='del'>-	if (flex_groups) {</div><div class='del'>-		for (i = 0; i &lt; sbi-&gt;s_flex_groups_allocated; i++)</div><div class='del'>-			kvfree(flex_groups[i]);</div><div class='del'>-		kvfree(flex_groups);</div><div class='ctx'> 	}</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-	percpu_counter_destroy(&amp;sbi-&gt;s_freeclusters_counter);</div><div class='del'>-	percpu_counter_destroy(&amp;sbi-&gt;s_freeinodes_counter);</div><div class='del'>-	percpu_counter_destroy(&amp;sbi-&gt;s_dirs_counter);</div><div class='del'>-	percpu_counter_destroy(&amp;sbi-&gt;s_dirtyclusters_counter);</div><div class='del'>-	percpu_counter_destroy(&amp;sbi-&gt;s_sra_exceeded_retry_limit);</div><div class='del'>-	percpu_free_rwsem(&amp;sbi-&gt;s_writepages_rwsem);</div><div class='add'>+</div><div class='add'>+	ext4_group_desc_free(sbi);</div><div class='add'>+	ext4_flex_groups_free(sbi);</div><div class='add'>+</div><div class='add'>+	WARN_ON_ONCE(!(sbi-&gt;s_mount_state &amp; EXT4_ERROR_FS) &amp;&amp;</div><div class='add'>+		     percpu_counter_sum(&amp;sbi-&gt;s_dirtyclusters_counter));</div><div class='add'>+	ext4_percpu_param_destroy(sbi);</div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='del'>-	for (i = 0; i &lt; EXT4_MAXQUOTAS; i++)</div><div class='add'>+	for (int i = 0; i &lt; EXT4_MAXQUOTAS; i++)</div><div class='ctx'> 		kfree(get_qf_name(sb, sbi, i));</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='hunk'>@@ -1245,15 +1346,14 @@ static void ext4_put_super(struct super_block *sb)</div><div class='ctx'> </div><div class='ctx'> 	sync_blockdev(sb-&gt;s_bdev);</div><div class='ctx'> 	invalidate_bdev(sb-&gt;s_bdev);</div><div class='del'>-	if (sbi-&gt;s_journal_bdev &amp;&amp; sbi-&gt;s_journal_bdev != sb-&gt;s_bdev) {</div><div class='add'>+	if (sbi-&gt;s_journal_bdev_file) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Invalidate the journal device's buffers.  We don't want them</div><div class='ctx'> 		 * floating about in memory - the physical journal device may</div><div class='ctx'> 		 * hotswapped, and it breaks the `ro-after' testing code.</div><div class='ctx'> 		 */</div><div class='del'>-		sync_blockdev(sbi-&gt;s_journal_bdev);</div><div class='del'>-		invalidate_bdev(sbi-&gt;s_journal_bdev);</div><div class='del'>-		ext4_blkdev_remove(sbi);</div><div class='add'>+		sync_blockdev(file_bdev(sbi-&gt;s_journal_bdev_file));</div><div class='add'>+		invalidate_bdev(file_bdev(sbi-&gt;s_journal_bdev_file));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ext4_xattr_destroy_cache(sbi-&gt;s_ea_inode_cache);</div><div class='hunk'>@@ -1272,12 +1372,10 @@ static void ext4_put_super(struct super_block *sb)</div><div class='ctx'> 	 */</div><div class='ctx'> 	kobject_put(&amp;sbi-&gt;s_kobj);</div><div class='ctx'> 	wait_for_completion(&amp;sbi-&gt;s_kobj_unregister);</div><div class='del'>-	if (sbi-&gt;s_chksum_driver)</div><div class='del'>-		crypto_free_shash(sbi-&gt;s_chksum_driver);</div><div class='ctx'> 	kfree(sbi-&gt;s_blockgroup_lock);</div><div class='del'>-	fs_put_dax(sbi-&gt;s_daxdev);</div><div class='add'>+	fs_put_dax(sbi-&gt;s_daxdev, NULL);</div><div class='ctx'> 	fscrypt_free_dummy_policy(&amp;sbi-&gt;s_dummy_enc_policy);</div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='ctx'> 	utf8_unload(sb-&gt;s_encoding);</div><div class='ctx'> #endif</div><div class='ctx'> 	kfree(sbi);</div><div class='hunk'>@@ -1292,21 +1390,24 @@ static struct inode *ext4_alloc_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_inode_info *ei;</div><div class='ctx'> </div><div class='del'>-	ei = kmem_cache_alloc(ext4_inode_cachep, GFP_NOFS);</div><div class='add'>+	ei = alloc_inode_sb(sb, ext4_inode_cachep, GFP_NOFS);</div><div class='ctx'> 	if (!ei)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='ctx'> 	inode_set_iversion(&amp;ei-&gt;vfs_inode, 1);</div><div class='add'>+	ei-&gt;i_flags = 0;</div><div class='add'>+	ext4_clear_state_flags(ei);	/* Only relevant on 32-bit archs */</div><div class='ctx'> 	spin_lock_init(&amp;ei-&gt;i_raw_lock);</div><div class='del'>-	INIT_LIST_HEAD(&amp;ei-&gt;i_prealloc_list);</div><div class='add'>+	ei-&gt;i_prealloc_node = RB_ROOT;</div><div class='ctx'> 	atomic_set(&amp;ei-&gt;i_prealloc_active, 0);</div><div class='del'>-	spin_lock_init(&amp;ei-&gt;i_prealloc_lock);</div><div class='add'>+	rwlock_init(&amp;ei-&gt;i_prealloc_lock);</div><div class='ctx'> 	ext4_es_init_tree(&amp;ei-&gt;i_es_tree);</div><div class='ctx'> 	rwlock_init(&amp;ei-&gt;i_es_lock);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;ei-&gt;i_es_list);</div><div class='ctx'> 	ei-&gt;i_es_all_nr = 0;</div><div class='ctx'> 	ei-&gt;i_es_shk_nr = 0;</div><div class='ctx'> 	ei-&gt;i_es_shrink_lblk = 0;</div><div class='add'>+	ei-&gt;i_es_seq = 0;</div><div class='ctx'> 	ei-&gt;i_reserved_data_blocks = 0;</div><div class='ctx'> 	spin_lock_init(&amp;(ei-&gt;i_block_reservation_lock));</div><div class='ctx'> 	ext4_init_pending_tree(&amp;ei-&gt;i_pending_tree);</div><div class='hunk'>@@ -1319,16 +1420,15 @@ static struct inode *ext4_alloc_inode(struct super_block *sb)</div><div class='ctx'> 	spin_lock_init(&amp;ei-&gt;i_completed_io_lock);</div><div class='ctx'> 	ei-&gt;i_sync_tid = 0;</div><div class='ctx'> 	ei-&gt;i_datasync_tid = 0;</div><div class='del'>-	atomic_set(&amp;ei-&gt;i_unwritten, 0);</div><div class='ctx'> 	INIT_WORK(&amp;ei-&gt;i_rsv_conversion_work, ext4_end_io_rsv_work);</div><div class='ctx'> 	ext4_fc_init_inode(&amp;ei-&gt;vfs_inode);</div><div class='del'>-	mutex_init(&amp;ei-&gt;i_fc_lock);</div><div class='add'>+	spin_lock_init(&amp;ei-&gt;i_fc_lock);</div><div class='ctx'> 	return &amp;ei-&gt;vfs_inode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ext4_drop_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	int drop = generic_drop_inode(inode);</div><div class='add'>+	int drop = inode_generic_drop(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (!drop)</div><div class='ctx'> 		drop = fscrypt_drop_inode(inode);</div><div class='hunk'>@@ -1349,9 +1449,9 @@ static void ext4_free_in_core_inode(struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> static void ext4_destroy_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	if (!list_empty(&amp;(EXT4_I(inode)-&gt;i_orphan))) {</div><div class='add'>+	if (ext4_inode_orphan_tracked(inode)) {</div><div class='ctx'> 		ext4_msg(inode-&gt;i_sb, KERN_ERR,</div><div class='del'>-			 "Inode %lu (%p): orphan list check failed!",</div><div class='add'>+			 "Inode %lu (%p): inode tracked as orphan!",</div><div class='ctx'> 			 inode-&gt;i_ino, EXT4_I(inode));</div><div class='ctx'> 		print_hex_dump(KERN_INFO, "", DUMP_PREFIX_ADDRESS, 16, 4,</div><div class='ctx'> 				EXT4_I(inode), sizeof(struct ext4_inode_info),</div><div class='hunk'>@@ -1359,30 +1459,41 @@ static void ext4_destroy_inode(struct inode *inode)</div><div class='ctx'> 		dump_stack();</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (EXT4_I(inode)-&gt;i_reserved_data_blocks)</div><div class='add'>+	if (!(EXT4_SB(inode-&gt;i_sb)-&gt;s_mount_state &amp; EXT4_ERROR_FS) &amp;&amp;</div><div class='add'>+	    WARN_ON_ONCE(EXT4_I(inode)-&gt;i_reserved_data_blocks))</div><div class='ctx'> 		ext4_msg(inode-&gt;i_sb, KERN_ERR,</div><div class='ctx'> 			 "Inode %lu (%p): i_reserved_data_blocks (%u) not cleared!",</div><div class='ctx'> 			 inode-&gt;i_ino, EXT4_I(inode),</div><div class='ctx'> 			 EXT4_I(inode)-&gt;i_reserved_data_blocks);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void ext4_shutdown(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+       ext4_force_shutdown(sb, EXT4_GOING_FLAGS_NOLOGFLUSH);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void init_once(void *foo)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_inode_info *ei = (struct ext4_inode_info *) foo;</div><div class='add'>+	struct ext4_inode_info *ei = foo;</div><div class='ctx'> </div><div class='ctx'> 	INIT_LIST_HEAD(&amp;ei-&gt;i_orphan);</div><div class='ctx'> 	init_rwsem(&amp;ei-&gt;xattr_sem);</div><div class='ctx'> 	init_rwsem(&amp;ei-&gt;i_data_sem);</div><div class='ctx'> 	inode_init_once(&amp;ei-&gt;vfs_inode);</div><div class='ctx'> 	ext4_fc_init_inode(&amp;ei-&gt;vfs_inode);</div><div class='add'>+#ifdef CONFIG_FS_ENCRYPTION</div><div class='add'>+	ei-&gt;i_crypt_info = NULL;</div><div class='add'>+#endif</div><div class='add'>+#ifdef CONFIG_FS_VERITY</div><div class='add'>+	ei-&gt;i_verity_info = NULL;</div><div class='add'>+#endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int __init init_inodecache(void)</div><div class='ctx'> {</div><div class='ctx'> 	ext4_inode_cachep = kmem_cache_create_usercopy("ext4_inode_cache",</div><div class='ctx'> 				sizeof(struct ext4_inode_info), 0,</div><div class='del'>-				(SLAB_RECLAIM_ACCOUNT|SLAB_MEM_SPREAD|</div><div class='del'>-					SLAB_ACCOUNT),</div><div class='add'>+				SLAB_RECLAIM_ACCOUNT | SLAB_ACCOUNT,</div><div class='ctx'> 				offsetof(struct ext4_inode_info, i_data),</div><div class='ctx'> 				sizeof_field(struct ext4_inode_info, i_data),</div><div class='ctx'> 				init_once);</div><div class='hunk'>@@ -1406,7 +1517,7 @@ void ext4_clear_inode(struct inode *inode)</div><div class='ctx'> 	ext4_fc_del(inode);</div><div class='ctx'> 	invalidate_inode_buffers(inode);</div><div class='ctx'> 	clear_inode(inode);</div><div class='del'>-	ext4_discard_preallocations(inode, 0);</div><div class='add'>+	ext4_discard_preallocations(inode);</div><div class='ctx'> 	ext4_es_remove_extent(inode, 0, EXT_MAX_BLOCKS);</div><div class='ctx'> 	dquot_drop(inode);</div><div class='ctx'> 	if (EXT4_I(inode)-&gt;jinode) {</div><div class='hunk'>@@ -1463,128 +1574,6 @@ static int ext4_nfs_commit_metadata(struct inode *inode)</div><div class='ctx'> 	return ext4_write_inode(inode, &amp;wbc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_FS_ENCRYPTION</div><div class='del'>-static int ext4_get_context(struct inode *inode, void *ctx, size_t len)</div><div class='del'>-{</div><div class='del'>-	return ext4_xattr_get(inode, EXT4_XATTR_INDEX_ENCRYPTION,</div><div class='del'>-				 EXT4_XATTR_NAME_ENCRYPTION_CONTEXT, ctx, len);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int ext4_set_context(struct inode *inode, const void *ctx, size_t len,</div><div class='del'>-							void *fs_data)</div><div class='del'>-{</div><div class='del'>-	handle_t *handle = fs_data;</div><div class='del'>-	int res, res2, credits, retries = 0;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Encrypting the root directory is not allowed because e2fsck expects</div><div class='del'>-	 * lost+found to exist and be unencrypted, and encrypting the root</div><div class='del'>-	 * directory would imply encrypting the lost+found directory as well as</div><div class='del'>-	 * the filename "lost+found" itself.</div><div class='del'>-	 */</div><div class='del'>-	if (inode-&gt;i_ino == EXT4_ROOT_INO)</div><div class='del'>-		return -EPERM;</div><div class='del'>-</div><div class='del'>-	if (WARN_ON_ONCE(IS_DAX(inode) &amp;&amp; i_size_read(inode)))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	if (ext4_test_inode_flag(inode, EXT4_INODE_DAX))</div><div class='del'>-		return -EOPNOTSUPP;</div><div class='del'>-</div><div class='del'>-	res = ext4_convert_inline_data(inode);</div><div class='del'>-	if (res)</div><div class='del'>-		return res;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If a journal handle was specified, then the encryption context is</div><div class='del'>-	 * being set on a new inode via inheritance and is part of a larger</div><div class='del'>-	 * transaction to create the inode.  Otherwise the encryption context is</div><div class='del'>-	 * being set on an existing inode in its own transaction.  Only in the</div><div class='del'>-	 * latter case should the "retry on ENOSPC" logic be used.</div><div class='del'>-	 */</div><div class='del'>-</div><div class='del'>-	if (handle) {</div><div class='del'>-		res = ext4_xattr_set_handle(handle, inode,</div><div class='del'>-					    EXT4_XATTR_INDEX_ENCRYPTION,</div><div class='del'>-					    EXT4_XATTR_NAME_ENCRYPTION_CONTEXT,</div><div class='del'>-					    ctx, len, 0);</div><div class='del'>-		if (!res) {</div><div class='del'>-			ext4_set_inode_flag(inode, EXT4_INODE_ENCRYPT);</div><div class='del'>-			ext4_clear_inode_state(inode,</div><div class='del'>-					EXT4_STATE_MAY_INLINE_DATA);</div><div class='del'>-			/*</div><div class='del'>-			 * Update inode-&gt;i_flags - S_ENCRYPTED will be enabled,</div><div class='del'>-			 * S_DAX may be disabled</div><div class='del'>-			 */</div><div class='del'>-			ext4_set_inode_flags(inode, false);</div><div class='del'>-		}</div><div class='del'>-		return res;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	res = dquot_initialize(inode);</div><div class='del'>-	if (res)</div><div class='del'>-		return res;</div><div class='del'>-retry:</div><div class='del'>-	res = ext4_xattr_set_credits(inode, len, false /* is_create */,</div><div class='del'>-				     &amp;credits);</div><div class='del'>-	if (res)</div><div class='del'>-		return res;</div><div class='del'>-</div><div class='del'>-	handle = ext4_journal_start(inode, EXT4_HT_MISC, credits);</div><div class='del'>-	if (IS_ERR(handle))</div><div class='del'>-		return PTR_ERR(handle);</div><div class='del'>-</div><div class='del'>-	res = ext4_xattr_set_handle(handle, inode, EXT4_XATTR_INDEX_ENCRYPTION,</div><div class='del'>-				    EXT4_XATTR_NAME_ENCRYPTION_CONTEXT,</div><div class='del'>-				    ctx, len, 0);</div><div class='del'>-	if (!res) {</div><div class='del'>-		ext4_set_inode_flag(inode, EXT4_INODE_ENCRYPT);</div><div class='del'>-		/*</div><div class='del'>-		 * Update inode-&gt;i_flags - S_ENCRYPTED will be enabled,</div><div class='del'>-		 * S_DAX may be disabled</div><div class='del'>-		 */</div><div class='del'>-		ext4_set_inode_flags(inode, false);</div><div class='del'>-		res = ext4_mark_inode_dirty(handle, inode);</div><div class='del'>-		if (res)</div><div class='del'>-			EXT4_ERROR_INODE(inode, "Failed to mark inode dirty");</div><div class='del'>-	}</div><div class='del'>-	res2 = ext4_journal_stop(handle);</div><div class='del'>-</div><div class='del'>-	if (res == -ENOSPC &amp;&amp; ext4_should_retry_alloc(inode-&gt;i_sb, &amp;retries))</div><div class='del'>-		goto retry;</div><div class='del'>-	if (!res)</div><div class='del'>-		res = res2;</div><div class='del'>-	return res;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static const union fscrypt_policy *ext4_get_dummy_policy(struct super_block *sb)</div><div class='del'>-{</div><div class='del'>-	return EXT4_SB(sb)-&gt;s_dummy_enc_policy.policy;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool ext4_has_stable_inodes(struct super_block *sb)</div><div class='del'>-{</div><div class='del'>-	return ext4_has_feature_stable_inodes(sb);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void ext4_get_ino_and_lblk_bits(struct super_block *sb,</div><div class='del'>-				       int *ino_bits_ret, int *lblk_bits_ret)</div><div class='del'>-{</div><div class='del'>-	*ino_bits_ret = 8 * sizeof(EXT4_SB(sb)-&gt;s_es-&gt;s_inodes_count);</div><div class='del'>-	*lblk_bits_ret = 8 * sizeof(ext4_lblk_t);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static const struct fscrypt_operations ext4_cryptops = {</div><div class='del'>-	.key_prefix		= "ext4:",</div><div class='del'>-	.get_context		= ext4_get_context,</div><div class='del'>-	.set_context		= ext4_set_context,</div><div class='del'>-	.get_dummy_policy	= ext4_get_dummy_policy,</div><div class='del'>-	.empty_dir		= ext4_empty_dir,</div><div class='del'>-	.has_stable_inodes	= ext4_has_stable_inodes,</div><div class='del'>-	.get_ino_and_lblk_bits	= ext4_get_ino_and_lblk_bits,</div><div class='del'>-};</div><div class='del'>-#endif</div><div class='del'>-</div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='ctx'> static const char * const quotatypes[] = INITQFNAMES;</div><div class='ctx'> #define QTYPE2NAME(t) (quotatypes[t])</div><div class='hunk'>@@ -1603,7 +1592,7 @@ static ssize_t ext4_quota_write(struct super_block *sb, int type,</div><div class='ctx'> static int ext4_quota_enable(struct super_block *sb, int type, int format_id,</div><div class='ctx'> 			     unsigned int flags);</div><div class='ctx'> </div><div class='del'>-static struct dquot **ext4_get_dquots(struct inode *inode)</div><div class='add'>+static struct dquot __rcu **ext4_get_dquots(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	return EXT4_I(inode)-&gt;i_dquot;</div><div class='ctx'> }</div><div class='hunk'>@@ -1647,8 +1636,8 @@ static const struct super_operations ext4_sops = {</div><div class='ctx'> 	.freeze_fs	= ext4_freeze,</div><div class='ctx'> 	.unfreeze_fs	= ext4_unfreeze,</div><div class='ctx'> 	.statfs		= ext4_statfs,</div><div class='del'>-	.remount_fs	= ext4_remount,</div><div class='ctx'> 	.show_options	= ext4_show_options,</div><div class='add'>+	.shutdown	= ext4_shutdown,</div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='ctx'> 	.quota_read	= ext4_quota_read,</div><div class='ctx'> 	.quota_write	= ext4_quota_write,</div><div class='hunk'>@@ -1657,6 +1646,7 @@ static const struct super_operations ext4_sops = {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct export_operations ext4_export_ops = {</div><div class='add'>+	.encode_fh = generic_encode_ino32_fh,</div><div class='ctx'> 	.fh_to_dentry = ext4_fh_to_dentry,</div><div class='ctx'> 	.fh_to_parent = ext4_fh_to_parent,</div><div class='ctx'> 	.get_parent = ext4_get_parent,</div><div class='hunk'>@@ -1665,253 +1655,190 @@ static const struct export_operations ext4_export_ops = {</div><div class='ctx'> </div><div class='ctx'> enum {</div><div class='ctx'> 	Opt_bsd_df, Opt_minix_df, Opt_grpid, Opt_nogrpid,</div><div class='del'>-	Opt_resgid, Opt_resuid, Opt_sb, Opt_err_cont, Opt_err_panic, Opt_err_ro,</div><div class='add'>+	Opt_resgid, Opt_resuid, Opt_sb,</div><div class='ctx'> 	Opt_nouid32, Opt_debug, Opt_removed,</div><div class='del'>-	Opt_user_xattr, Opt_nouser_xattr, Opt_acl, Opt_noacl,</div><div class='add'>+	Opt_user_xattr, Opt_acl,</div><div class='ctx'> 	Opt_auto_da_alloc, Opt_noauto_da_alloc, Opt_noload,</div><div class='ctx'> 	Opt_commit, Opt_min_batch_time, Opt_max_batch_time, Opt_journal_dev,</div><div class='ctx'> 	Opt_journal_path, Opt_journal_checksum, Opt_journal_async_commit,</div><div class='ctx'> 	Opt_abort, Opt_data_journal, Opt_data_ordered, Opt_data_writeback,</div><div class='ctx'> 	Opt_data_err_abort, Opt_data_err_ignore, Opt_test_dummy_encryption,</div><div class='ctx'> 	Opt_inlinecrypt,</div><div class='del'>-	Opt_usrjquota, Opt_grpjquota, Opt_offusrjquota, Opt_offgrpjquota,</div><div class='del'>-	Opt_jqfmt_vfsold, Opt_jqfmt_vfsv0, Opt_jqfmt_vfsv1, Opt_quota,</div><div class='add'>+	Opt_usrjquota, Opt_grpjquota, Opt_quota,</div><div class='ctx'> 	Opt_noquota, Opt_barrier, Opt_nobarrier, Opt_err,</div><div class='del'>-	Opt_usrquota, Opt_grpquota, Opt_prjquota, Opt_i_version,</div><div class='add'>+	Opt_usrquota, Opt_grpquota, Opt_prjquota,</div><div class='ctx'> 	Opt_dax, Opt_dax_always, Opt_dax_inode, Opt_dax_never,</div><div class='ctx'> 	Opt_stripe, Opt_delalloc, Opt_nodelalloc, Opt_warn_on_error,</div><div class='del'>-	Opt_nowarn_on_error, Opt_mblk_io_submit,</div><div class='del'>-	Opt_lazytime, Opt_nolazytime, Opt_debug_want_extra_isize,</div><div class='add'>+	Opt_nowarn_on_error, Opt_mblk_io_submit, Opt_debug_want_extra_isize,</div><div class='ctx'> 	Opt_nomblk_io_submit, Opt_block_validity, Opt_noblock_validity,</div><div class='ctx'> 	Opt_inode_readahead_blks, Opt_journal_ioprio,</div><div class='ctx'> 	Opt_dioread_nolock, Opt_dioread_lock,</div><div class='ctx'> 	Opt_discard, Opt_nodiscard, Opt_init_itable, Opt_noinit_itable,</div><div class='ctx'> 	Opt_max_dir_size_kb, Opt_nojournal_checksum, Opt_nombcache,</div><div class='ctx'> 	Opt_no_prefetch_block_bitmaps, Opt_mb_optimize_scan,</div><div class='add'>+	Opt_errors, Opt_data, Opt_data_err, Opt_jqfmt, Opt_dax_type,</div><div class='ctx'> #ifdef CONFIG_EXT4_DEBUG</div><div class='ctx'> 	Opt_fc_debug_max_replay, Opt_fc_debug_force</div><div class='ctx'> #endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static const match_table_t tokens = {</div><div class='del'>-	{Opt_bsd_df, "bsddf"},</div><div class='del'>-	{Opt_minix_df, "minixdf"},</div><div class='del'>-	{Opt_grpid, "grpid"},</div><div class='del'>-	{Opt_grpid, "bsdgroups"},</div><div class='del'>-	{Opt_nogrpid, "nogrpid"},</div><div class='del'>-	{Opt_nogrpid, "sysvgroups"},</div><div class='del'>-	{Opt_resgid, "resgid=%u"},</div><div class='del'>-	{Opt_resuid, "resuid=%u"},</div><div class='del'>-	{Opt_sb, "sb=%u"},</div><div class='del'>-	{Opt_err_cont, "errors=continue"},</div><div class='del'>-	{Opt_err_panic, "errors=panic"},</div><div class='del'>-	{Opt_err_ro, "errors=remount-ro"},</div><div class='del'>-	{Opt_nouid32, "nouid32"},</div><div class='del'>-	{Opt_debug, "debug"},</div><div class='del'>-	{Opt_removed, "oldalloc"},</div><div class='del'>-	{Opt_removed, "orlov"},</div><div class='del'>-	{Opt_user_xattr, "user_xattr"},</div><div class='del'>-	{Opt_nouser_xattr, "nouser_xattr"},</div><div class='del'>-	{Opt_acl, "acl"},</div><div class='del'>-	{Opt_noacl, "noacl"},</div><div class='del'>-	{Opt_noload, "norecovery"},</div><div class='del'>-	{Opt_noload, "noload"},</div><div class='del'>-	{Opt_removed, "nobh"},</div><div class='del'>-	{Opt_removed, "bh"},</div><div class='del'>-	{Opt_commit, "commit=%u"},</div><div class='del'>-	{Opt_min_batch_time, "min_batch_time=%u"},</div><div class='del'>-	{Opt_max_batch_time, "max_batch_time=%u"},</div><div class='del'>-	{Opt_journal_dev, "journal_dev=%u"},</div><div class='del'>-	{Opt_journal_path, "journal_path=%s"},</div><div class='del'>-	{Opt_journal_checksum, "journal_checksum"},</div><div class='del'>-	{Opt_nojournal_checksum, "nojournal_checksum"},</div><div class='del'>-	{Opt_journal_async_commit, "journal_async_commit"},</div><div class='del'>-	{Opt_abort, "abort"},</div><div class='del'>-	{Opt_data_journal, "data=journal"},</div><div class='del'>-	{Opt_data_ordered, "data=ordered"},</div><div class='del'>-	{Opt_data_writeback, "data=writeback"},</div><div class='del'>-	{Opt_data_err_abort, "data_err=abort"},</div><div class='del'>-	{Opt_data_err_ignore, "data_err=ignore"},</div><div class='del'>-	{Opt_offusrjquota, "usrjquota="},</div><div class='del'>-	{Opt_usrjquota, "usrjquota=%s"},</div><div class='del'>-	{Opt_offgrpjquota, "grpjquota="},</div><div class='del'>-	{Opt_grpjquota, "grpjquota=%s"},</div><div class='del'>-	{Opt_jqfmt_vfsold, "jqfmt=vfsold"},</div><div class='del'>-	{Opt_jqfmt_vfsv0, "jqfmt=vfsv0"},</div><div class='del'>-	{Opt_jqfmt_vfsv1, "jqfmt=vfsv1"},</div><div class='del'>-	{Opt_grpquota, "grpquota"},</div><div class='del'>-	{Opt_noquota, "noquota"},</div><div class='del'>-	{Opt_quota, "quota"},</div><div class='del'>-	{Opt_usrquota, "usrquota"},</div><div class='del'>-	{Opt_prjquota, "prjquota"},</div><div class='del'>-	{Opt_barrier, "barrier=%u"},</div><div class='del'>-	{Opt_barrier, "barrier"},</div><div class='del'>-	{Opt_nobarrier, "nobarrier"},</div><div class='del'>-	{Opt_i_version, "i_version"},</div><div class='del'>-	{Opt_dax, "dax"},</div><div class='del'>-	{Opt_dax_always, "dax=always"},</div><div class='del'>-	{Opt_dax_inode, "dax=inode"},</div><div class='del'>-	{Opt_dax_never, "dax=never"},</div><div class='del'>-	{Opt_stripe, "stripe=%u"},</div><div class='del'>-	{Opt_delalloc, "delalloc"},</div><div class='del'>-	{Opt_warn_on_error, "warn_on_error"},</div><div class='del'>-	{Opt_nowarn_on_error, "nowarn_on_error"},</div><div class='del'>-	{Opt_lazytime, "lazytime"},</div><div class='del'>-	{Opt_nolazytime, "nolazytime"},</div><div class='del'>-	{Opt_debug_want_extra_isize, "debug_want_extra_isize=%u"},</div><div class='del'>-	{Opt_nodelalloc, "nodelalloc"},</div><div class='del'>-	{Opt_removed, "mblk_io_submit"},</div><div class='del'>-	{Opt_removed, "nomblk_io_submit"},</div><div class='del'>-	{Opt_block_validity, "block_validity"},</div><div class='del'>-	{Opt_noblock_validity, "noblock_validity"},</div><div class='del'>-	{Opt_inode_readahead_blks, "inode_readahead_blks=%u"},</div><div class='del'>-	{Opt_journal_ioprio, "journal_ioprio=%u"},</div><div class='del'>-	{Opt_auto_da_alloc, "auto_da_alloc=%u"},</div><div class='del'>-	{Opt_auto_da_alloc, "auto_da_alloc"},</div><div class='del'>-	{Opt_noauto_da_alloc, "noauto_da_alloc"},</div><div class='del'>-	{Opt_dioread_nolock, "dioread_nolock"},</div><div class='del'>-	{Opt_dioread_lock, "nodioread_nolock"},</div><div class='del'>-	{Opt_dioread_lock, "dioread_lock"},</div><div class='del'>-	{Opt_discard, "discard"},</div><div class='del'>-	{Opt_nodiscard, "nodiscard"},</div><div class='del'>-	{Opt_init_itable, "init_itable=%u"},</div><div class='del'>-	{Opt_init_itable, "init_itable"},</div><div class='del'>-	{Opt_noinit_itable, "noinit_itable"},</div><div class='del'>-#ifdef CONFIG_EXT4_DEBUG</div><div class='del'>-	{Opt_fc_debug_force, "fc_debug_force"},</div><div class='del'>-	{Opt_fc_debug_max_replay, "fc_debug_max_replay=%u"},</div><div class='del'>-#endif</div><div class='del'>-	{Opt_max_dir_size_kb, "max_dir_size_kb=%u"},</div><div class='del'>-	{Opt_test_dummy_encryption, "test_dummy_encryption=%s"},</div><div class='del'>-	{Opt_test_dummy_encryption, "test_dummy_encryption"},</div><div class='del'>-	{Opt_inlinecrypt, "inlinecrypt"},</div><div class='del'>-	{Opt_nombcache, "nombcache"},</div><div class='del'>-	{Opt_nombcache, "no_mbcache"},	/* for backward compatibility */</div><div class='del'>-	{Opt_removed, "prefetch_block_bitmaps"},</div><div class='del'>-	{Opt_no_prefetch_block_bitmaps, "no_prefetch_block_bitmaps"},</div><div class='del'>-	{Opt_mb_optimize_scan, "mb_optimize_scan=%d"},</div><div class='del'>-	{Opt_removed, "check=none"},	/* mount option from ext2/3 */</div><div class='del'>-	{Opt_removed, "nocheck"},	/* mount option from ext2/3 */</div><div class='del'>-	{Opt_removed, "reservation"},	/* mount option from ext2/3 */</div><div class='del'>-	{Opt_removed, "noreservation"}, /* mount option from ext2/3 */</div><div class='del'>-	{Opt_removed, "journal=%u"},	/* mount option from ext2/3 */</div><div class='del'>-	{Opt_err, NULL},</div><div class='add'>+static const struct constant_table ext4_param_errors[] = {</div><div class='add'>+	{"continue",	EXT4_MOUNT_ERRORS_CONT},</div><div class='add'>+	{"panic",	EXT4_MOUNT_ERRORS_PANIC},</div><div class='add'>+	{"remount-ro",	EXT4_MOUNT_ERRORS_RO},</div><div class='add'>+	{}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static ext4_fsblk_t get_sb_block(void **data)</div><div class='del'>-{</div><div class='del'>-	ext4_fsblk_t	sb_block;</div><div class='del'>-	char		*options = (char *) *data;</div><div class='del'>-</div><div class='del'>-	if (!options || strncmp(options, "sb=", 3) != 0)</div><div class='del'>-		return 1;	/* Default location */</div><div class='del'>-</div><div class='del'>-	options += 3;</div><div class='del'>-	/* TODO: use simple_strtoll with &gt;32bit ext4 */</div><div class='del'>-	sb_block = simple_strtoul(options, &amp;options, 0);</div><div class='del'>-	if (*options &amp;&amp; *options != ',') {</div><div class='del'>-		printk(KERN_ERR "EXT4-fs: Invalid sb specification: %s\n",</div><div class='del'>-		       (char *) *data);</div><div class='del'>-		return 1;</div><div class='del'>-	}</div><div class='del'>-	if (*options == ',')</div><div class='del'>-		options++;</div><div class='del'>-	*data = (void *) options;</div><div class='del'>-</div><div class='del'>-	return sb_block;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#define DEFAULT_JOURNAL_IOPRIO (IOPRIO_PRIO_VALUE(IOPRIO_CLASS_BE, 3))</div><div class='del'>-#define DEFAULT_MB_OPTIMIZE_SCAN	(-1)</div><div class='del'>-</div><div class='del'>-static const char deprecated_msg[] =</div><div class='del'>-	"Mount option \"%s\" will be removed by %s\n"</div><div class='del'>-	"Contact linux-ext4@vger.kernel.org if you think we should keep it.\n";</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_QUOTA</div><div class='del'>-static int set_qf_name(struct super_block *sb, int qtype, substring_t *args)</div><div class='del'>-{</div><div class='del'>-	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='del'>-	char *qname, *old_qname = get_qf_name(sb, sbi, qtype);</div><div class='del'>-	int ret = -1;</div><div class='add'>+static const struct constant_table ext4_param_data[] = {</div><div class='add'>+	{"journal",	EXT4_MOUNT_JOURNAL_DATA},</div><div class='add'>+	{"ordered",	EXT4_MOUNT_ORDERED_DATA},</div><div class='add'>+	{"writeback",	EXT4_MOUNT_WRITEBACK_DATA},</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-	if (sb_any_quota_loaded(sb) &amp;&amp; !old_qname) {</div><div class='del'>-		ext4_msg(sb, KERN_ERR,</div><div class='del'>-			"Cannot change journaled "</div><div class='del'>-			"quota options when quota turned on");</div><div class='del'>-		return -1;</div><div class='del'>-	}</div><div class='del'>-	if (ext4_has_feature_quota(sb)) {</div><div class='del'>-		ext4_msg(sb, KERN_INFO, "Journaled quota options "</div><div class='del'>-			 "ignored when QUOTA feature is enabled");</div><div class='del'>-		return 1;</div><div class='del'>-	}</div><div class='del'>-	qname = match_strdup(args);</div><div class='del'>-	if (!qname) {</div><div class='del'>-		ext4_msg(sb, KERN_ERR,</div><div class='del'>-			"Not enough memory for storing quotafile name");</div><div class='del'>-		return -1;</div><div class='del'>-	}</div><div class='del'>-	if (old_qname) {</div><div class='del'>-		if (strcmp(old_qname, qname) == 0)</div><div class='del'>-			ret = 1;</div><div class='del'>-		else</div><div class='del'>-			ext4_msg(sb, KERN_ERR,</div><div class='del'>-				 "%s quota file already specified",</div><div class='del'>-				 QTYPE2NAME(qtype));</div><div class='del'>-		goto errout;</div><div class='del'>-	}</div><div class='del'>-	if (strchr(qname, '/')) {</div><div class='del'>-		ext4_msg(sb, KERN_ERR,</div><div class='del'>-			"quotafile must be on filesystem root");</div><div class='del'>-		goto errout;</div><div class='del'>-	}</div><div class='del'>-	rcu_assign_pointer(sbi-&gt;s_qf_names[qtype], qname);</div><div class='del'>-	set_opt(sb, QUOTA);</div><div class='del'>-	return 1;</div><div class='del'>-errout:</div><div class='del'>-	kfree(qname);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='add'>+static const struct constant_table ext4_param_data_err[] = {</div><div class='add'>+	{"abort",	Opt_data_err_abort},</div><div class='add'>+	{"ignore",	Opt_data_err_ignore},</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-static int clear_qf_name(struct super_block *sb, int qtype)</div><div class='del'>-{</div><div class='add'>+static const struct constant_table ext4_param_jqfmt[] = {</div><div class='add'>+	{"vfsold",	QFMT_VFS_OLD},</div><div class='add'>+	{"vfsv0",	QFMT_VFS_V0},</div><div class='add'>+	{"vfsv1",	QFMT_VFS_V1},</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='del'>-	char *old_qname = get_qf_name(sb, sbi, qtype);</div><div class='add'>+static const struct constant_table ext4_param_dax[] = {</div><div class='add'>+	{"always",	Opt_dax_always},</div><div class='add'>+	{"inode",	Opt_dax_inode},</div><div class='add'>+	{"never",	Opt_dax_never},</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-	if (sb_any_quota_loaded(sb) &amp;&amp; old_qname) {</div><div class='del'>-		ext4_msg(sb, KERN_ERR, "Cannot change journaled quota options"</div><div class='del'>-			" when quota turned on");</div><div class='del'>-		return -1;</div><div class='del'>-	}</div><div class='del'>-	rcu_assign_pointer(sbi-&gt;s_qf_names[qtype], NULL);</div><div class='del'>-	synchronize_rcu();</div><div class='del'>-	kfree(old_qname);</div><div class='del'>-	return 1;</div><div class='del'>-}</div><div class='add'>+/*</div><div class='add'>+ * Mount option specification</div><div class='add'>+ * We don't use fsparam_flag_no because of the way we set the</div><div class='add'>+ * options and the way we show them in _ext4_show_options(). To</div><div class='add'>+ * keep the changes to a minimum, let's keep the negative options</div><div class='add'>+ * separate for now.</div><div class='add'>+ */</div><div class='add'>+static const struct fs_parameter_spec ext4_param_specs[] = {</div><div class='add'>+	fsparam_flag	("bsddf",		Opt_bsd_df),</div><div class='add'>+	fsparam_flag	("minixdf",		Opt_minix_df),</div><div class='add'>+	fsparam_flag	("grpid",		Opt_grpid),</div><div class='add'>+	fsparam_flag	("bsdgroups",		Opt_grpid),</div><div class='add'>+	fsparam_flag	("nogrpid",		Opt_nogrpid),</div><div class='add'>+	fsparam_flag	("sysvgroups",		Opt_nogrpid),</div><div class='add'>+	fsparam_gid	("resgid",		Opt_resgid),</div><div class='add'>+	fsparam_uid	("resuid",		Opt_resuid),</div><div class='add'>+	fsparam_u32	("sb",			Opt_sb),</div><div class='add'>+	fsparam_enum	("errors",		Opt_errors, ext4_param_errors),</div><div class='add'>+	fsparam_flag	("nouid32",		Opt_nouid32),</div><div class='add'>+	fsparam_flag	("debug",		Opt_debug),</div><div class='add'>+	fsparam_flag	("oldalloc",		Opt_removed),</div><div class='add'>+	fsparam_flag	("orlov",		Opt_removed),</div><div class='add'>+	fsparam_flag	("user_xattr",		Opt_user_xattr),</div><div class='add'>+	fsparam_flag	("acl",			Opt_acl),</div><div class='add'>+	fsparam_flag	("norecovery",		Opt_noload),</div><div class='add'>+	fsparam_flag	("noload",		Opt_noload),</div><div class='add'>+	fsparam_flag	("bh",			Opt_removed),</div><div class='add'>+	fsparam_flag	("nobh",		Opt_removed),</div><div class='add'>+	fsparam_u32	("commit",		Opt_commit),</div><div class='add'>+	fsparam_u32	("min_batch_time",	Opt_min_batch_time),</div><div class='add'>+	fsparam_u32	("max_batch_time",	Opt_max_batch_time),</div><div class='add'>+	fsparam_u32	("journal_dev",		Opt_journal_dev),</div><div class='add'>+	fsparam_bdev	("journal_path",	Opt_journal_path),</div><div class='add'>+	fsparam_flag	("journal_checksum",	Opt_journal_checksum),</div><div class='add'>+	fsparam_flag	("nojournal_checksum",	Opt_nojournal_checksum),</div><div class='add'>+	fsparam_flag	("journal_async_commit",Opt_journal_async_commit),</div><div class='add'>+	fsparam_flag	("abort",		Opt_abort),</div><div class='add'>+	fsparam_enum	("data",		Opt_data, ext4_param_data),</div><div class='add'>+	fsparam_enum	("data_err",		Opt_data_err,</div><div class='add'>+						ext4_param_data_err),</div><div class='add'>+	fsparam_string_empty</div><div class='add'>+			("usrjquota",		Opt_usrjquota),</div><div class='add'>+	fsparam_string_empty</div><div class='add'>+			("grpjquota",		Opt_grpjquota),</div><div class='add'>+	fsparam_enum	("jqfmt",		Opt_jqfmt, ext4_param_jqfmt),</div><div class='add'>+	fsparam_flag	("grpquota",		Opt_grpquota),</div><div class='add'>+	fsparam_flag	("quota",		Opt_quota),</div><div class='add'>+	fsparam_flag	("noquota",		Opt_noquota),</div><div class='add'>+	fsparam_flag	("usrquota",		Opt_usrquota),</div><div class='add'>+	fsparam_flag	("prjquota",		Opt_prjquota),</div><div class='add'>+	fsparam_flag	("barrier",		Opt_barrier),</div><div class='add'>+	fsparam_u32	("barrier",		Opt_barrier),</div><div class='add'>+	fsparam_flag	("nobarrier",		Opt_nobarrier),</div><div class='add'>+	fsparam_flag	("i_version",		Opt_removed),</div><div class='add'>+	fsparam_flag	("dax",			Opt_dax),</div><div class='add'>+	fsparam_enum	("dax",			Opt_dax_type, ext4_param_dax),</div><div class='add'>+	fsparam_u32	("stripe",		Opt_stripe),</div><div class='add'>+	fsparam_flag	("delalloc",		Opt_delalloc),</div><div class='add'>+	fsparam_flag	("nodelalloc",		Opt_nodelalloc),</div><div class='add'>+	fsparam_flag	("warn_on_error",	Opt_warn_on_error),</div><div class='add'>+	fsparam_flag	("nowarn_on_error",	Opt_nowarn_on_error),</div><div class='add'>+	fsparam_u32	("debug_want_extra_isize",</div><div class='add'>+						Opt_debug_want_extra_isize),</div><div class='add'>+	fsparam_flag	("mblk_io_submit",	Opt_removed),</div><div class='add'>+	fsparam_flag	("nomblk_io_submit",	Opt_removed),</div><div class='add'>+	fsparam_flag	("block_validity",	Opt_block_validity),</div><div class='add'>+	fsparam_flag	("noblock_validity",	Opt_noblock_validity),</div><div class='add'>+	fsparam_u32	("inode_readahead_blks",</div><div class='add'>+						Opt_inode_readahead_blks),</div><div class='add'>+	fsparam_u32	("journal_ioprio",	Opt_journal_ioprio),</div><div class='add'>+	fsparam_u32	("auto_da_alloc",	Opt_auto_da_alloc),</div><div class='add'>+	fsparam_flag	("auto_da_alloc",	Opt_auto_da_alloc),</div><div class='add'>+	fsparam_flag	("noauto_da_alloc",	Opt_noauto_da_alloc),</div><div class='add'>+	fsparam_flag	("dioread_nolock",	Opt_dioread_nolock),</div><div class='add'>+	fsparam_flag	("nodioread_nolock",	Opt_dioread_lock),</div><div class='add'>+	fsparam_flag	("dioread_lock",	Opt_dioread_lock),</div><div class='add'>+	fsparam_flag	("discard",		Opt_discard),</div><div class='add'>+	fsparam_flag	("nodiscard",		Opt_nodiscard),</div><div class='add'>+	fsparam_u32	("init_itable",		Opt_init_itable),</div><div class='add'>+	fsparam_flag	("init_itable",		Opt_init_itable),</div><div class='add'>+	fsparam_flag	("noinit_itable",	Opt_noinit_itable),</div><div class='add'>+#ifdef CONFIG_EXT4_DEBUG</div><div class='add'>+	fsparam_flag	("fc_debug_force",	Opt_fc_debug_force),</div><div class='add'>+	fsparam_u32	("fc_debug_max_replay",	Opt_fc_debug_max_replay),</div><div class='ctx'> #endif</div><div class='add'>+	fsparam_u32	("max_dir_size_kb",	Opt_max_dir_size_kb),</div><div class='add'>+	fsparam_flag	("test_dummy_encryption",</div><div class='add'>+						Opt_test_dummy_encryption),</div><div class='add'>+	fsparam_string	("test_dummy_encryption",</div><div class='add'>+						Opt_test_dummy_encryption),</div><div class='add'>+	fsparam_flag	("inlinecrypt",		Opt_inlinecrypt),</div><div class='add'>+	fsparam_flag	("nombcache",		Opt_nombcache),</div><div class='add'>+	fsparam_flag	("no_mbcache",		Opt_nombcache),	/* for backward compatibility */</div><div class='add'>+	fsparam_flag	("prefetch_block_bitmaps",</div><div class='add'>+						Opt_removed),</div><div class='add'>+	fsparam_flag	("no_prefetch_block_bitmaps",</div><div class='add'>+						Opt_no_prefetch_block_bitmaps),</div><div class='add'>+	fsparam_s32	("mb_optimize_scan",	Opt_mb_optimize_scan),</div><div class='add'>+	fsparam_string	("check",		Opt_removed),	/* mount option from ext2/3 */</div><div class='add'>+	fsparam_flag	("nocheck",		Opt_removed),	/* mount option from ext2/3 */</div><div class='add'>+	fsparam_flag	("reservation",		Opt_removed),	/* mount option from ext2/3 */</div><div class='add'>+	fsparam_flag	("noreservation",	Opt_removed),	/* mount option from ext2/3 */</div><div class='add'>+	fsparam_u32	("journal",		Opt_removed),	/* mount option from ext2/3 */</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> </div><div class='ctx'> #define MOPT_SET	0x0001</div><div class='ctx'> #define MOPT_CLEAR	0x0002</div><div class='ctx'> #define MOPT_NOSUPPORT	0x0004</div><div class='ctx'> #define MOPT_EXPLICIT	0x0008</div><div class='del'>-#define MOPT_CLEAR_ERR	0x0010</div><div class='del'>-#define MOPT_GTE0	0x0020</div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='ctx'> #define MOPT_Q		0</div><div class='del'>-#define MOPT_QFMT	0x0040</div><div class='add'>+#define MOPT_QFMT	0x0010</div><div class='ctx'> #else</div><div class='ctx'> #define MOPT_Q		MOPT_NOSUPPORT</div><div class='ctx'> #define MOPT_QFMT	MOPT_NOSUPPORT</div><div class='ctx'> #endif</div><div class='del'>-#define MOPT_DATAJ	0x0080</div><div class='del'>-#define MOPT_NO_EXT2	0x0100</div><div class='del'>-#define MOPT_NO_EXT3	0x0200</div><div class='add'>+#define MOPT_NO_EXT2	0x0020</div><div class='add'>+#define MOPT_NO_EXT3	0x0040</div><div class='ctx'> #define MOPT_EXT4_ONLY	(MOPT_NO_EXT2 | MOPT_NO_EXT3)</div><div class='del'>-#define MOPT_STRING	0x0400</div><div class='del'>-#define MOPT_SKIP	0x0800</div><div class='del'>-#define	MOPT_2		0x1000</div><div class='add'>+#define MOPT_SKIP	0x0080</div><div class='add'>+#define	MOPT_2		0x0100</div><div class='ctx'> </div><div class='ctx'> static const struct mount_opts {</div><div class='ctx'> 	int	token;</div><div class='hunk'>@@ -1936,6 +1863,7 @@ static const struct mount_opts {</div><div class='ctx'> 	 MOPT_EXT4_ONLY | MOPT_CLEAR},</div><div class='ctx'> 	{Opt_warn_on_error, EXT4_MOUNT_WARN_ON_ERROR, MOPT_SET},</div><div class='ctx'> 	{Opt_nowarn_on_error, EXT4_MOUNT_WARN_ON_ERROR, MOPT_CLEAR},</div><div class='add'>+	{Opt_commit, 0, MOPT_NO_EXT2},</div><div class='ctx'> 	{Opt_nojournal_checksum, EXT4_MOUNT_JOURNAL_CHECKSUM,</div><div class='ctx'> 	 MOPT_EXT4_ONLY | MOPT_CLEAR},</div><div class='ctx'> 	{Opt_journal_checksum, EXT4_MOUNT_JOURNAL_CHECKSUM,</div><div class='hunk'>@@ -1944,52 +1872,25 @@ static const struct mount_opts {</div><div class='ctx'> 				    EXT4_MOUNT_JOURNAL_CHECKSUM),</div><div class='ctx'> 	 MOPT_EXT4_ONLY | MOPT_SET | MOPT_EXPLICIT},</div><div class='ctx'> 	{Opt_noload, EXT4_MOUNT_NOLOAD, MOPT_NO_EXT2 | MOPT_SET},</div><div class='del'>-	{Opt_err_panic, EXT4_MOUNT_ERRORS_PANIC, MOPT_SET | MOPT_CLEAR_ERR},</div><div class='del'>-	{Opt_err_ro, EXT4_MOUNT_ERRORS_RO, MOPT_SET | MOPT_CLEAR_ERR},</div><div class='del'>-	{Opt_err_cont, EXT4_MOUNT_ERRORS_CONT, MOPT_SET | MOPT_CLEAR_ERR},</div><div class='del'>-	{Opt_data_err_abort, EXT4_MOUNT_DATA_ERR_ABORT,</div><div class='del'>-	 MOPT_NO_EXT2},</div><div class='del'>-	{Opt_data_err_ignore, EXT4_MOUNT_DATA_ERR_ABORT,</div><div class='del'>-	 MOPT_NO_EXT2},</div><div class='add'>+	{Opt_data_err, EXT4_MOUNT_DATA_ERR_ABORT, MOPT_NO_EXT2},</div><div class='ctx'> 	{Opt_barrier, EXT4_MOUNT_BARRIER, MOPT_SET},</div><div class='ctx'> 	{Opt_nobarrier, EXT4_MOUNT_BARRIER, MOPT_CLEAR},</div><div class='ctx'> 	{Opt_noauto_da_alloc, EXT4_MOUNT_NO_AUTO_DA_ALLOC, MOPT_SET},</div><div class='ctx'> 	{Opt_auto_da_alloc, EXT4_MOUNT_NO_AUTO_DA_ALLOC, MOPT_CLEAR},</div><div class='ctx'> 	{Opt_noinit_itable, EXT4_MOUNT_INIT_INODE_TABLE, MOPT_CLEAR},</div><div class='del'>-	{Opt_commit, 0, MOPT_GTE0},</div><div class='del'>-	{Opt_max_batch_time, 0, MOPT_GTE0},</div><div class='del'>-	{Opt_min_batch_time, 0, MOPT_GTE0},</div><div class='del'>-	{Opt_inode_readahead_blks, 0, MOPT_GTE0},</div><div class='del'>-	{Opt_init_itable, 0, MOPT_GTE0},</div><div class='del'>-	{Opt_dax, EXT4_MOUNT_DAX_ALWAYS, MOPT_SET | MOPT_SKIP},</div><div class='del'>-	{Opt_dax_always, EXT4_MOUNT_DAX_ALWAYS,</div><div class='del'>-		MOPT_EXT4_ONLY | MOPT_SET | MOPT_SKIP},</div><div class='del'>-	{Opt_dax_inode, EXT4_MOUNT2_DAX_INODE,</div><div class='del'>-		MOPT_EXT4_ONLY | MOPT_SET | MOPT_SKIP},</div><div class='del'>-	{Opt_dax_never, EXT4_MOUNT2_DAX_NEVER,</div><div class='del'>-		MOPT_EXT4_ONLY | MOPT_SET | MOPT_SKIP},</div><div class='del'>-	{Opt_stripe, 0, MOPT_GTE0},</div><div class='del'>-	{Opt_resuid, 0, MOPT_GTE0},</div><div class='del'>-	{Opt_resgid, 0, MOPT_GTE0},</div><div class='del'>-	{Opt_journal_dev, 0, MOPT_NO_EXT2 | MOPT_GTE0},</div><div class='del'>-	{Opt_journal_path, 0, MOPT_NO_EXT2 | MOPT_STRING},</div><div class='del'>-	{Opt_journal_ioprio, 0, MOPT_NO_EXT2 | MOPT_GTE0},</div><div class='del'>-	{Opt_data_journal, EXT4_MOUNT_JOURNAL_DATA, MOPT_NO_EXT2 | MOPT_DATAJ},</div><div class='del'>-	{Opt_data_ordered, EXT4_MOUNT_ORDERED_DATA, MOPT_NO_EXT2 | MOPT_DATAJ},</div><div class='del'>-	{Opt_data_writeback, EXT4_MOUNT_WRITEBACK_DATA,</div><div class='del'>-	 MOPT_NO_EXT2 | MOPT_DATAJ},</div><div class='add'>+	{Opt_dax_type, 0, MOPT_EXT4_ONLY},</div><div class='add'>+	{Opt_journal_dev, 0, MOPT_NO_EXT2},</div><div class='add'>+	{Opt_journal_path, 0, MOPT_NO_EXT2},</div><div class='add'>+	{Opt_journal_ioprio, 0, MOPT_NO_EXT2},</div><div class='add'>+	{Opt_data, 0, MOPT_NO_EXT2},</div><div class='ctx'> 	{Opt_user_xattr, EXT4_MOUNT_XATTR_USER, MOPT_SET},</div><div class='del'>-	{Opt_nouser_xattr, EXT4_MOUNT_XATTR_USER, MOPT_CLEAR},</div><div class='ctx'> #ifdef CONFIG_EXT4_FS_POSIX_ACL</div><div class='ctx'> 	{Opt_acl, EXT4_MOUNT_POSIX_ACL, MOPT_SET},</div><div class='del'>-	{Opt_noacl, EXT4_MOUNT_POSIX_ACL, MOPT_CLEAR},</div><div class='ctx'> #else</div><div class='ctx'> 	{Opt_acl, 0, MOPT_NOSUPPORT},</div><div class='del'>-	{Opt_noacl, 0, MOPT_NOSUPPORT},</div><div class='ctx'> #endif</div><div class='ctx'> 	{Opt_nouid32, EXT4_MOUNT_NO_UID32, MOPT_SET},</div><div class='ctx'> 	{Opt_debug, EXT4_MOUNT_DEBUG, MOPT_SET},</div><div class='del'>-	{Opt_debug_want_extra_isize, 0, MOPT_GTE0},</div><div class='ctx'> 	{Opt_quota, EXT4_MOUNT_QUOTA | EXT4_MOUNT_USRQUOTA, MOPT_SET | MOPT_Q},</div><div class='ctx'> 	{Opt_usrquota, EXT4_MOUNT_QUOTA | EXT4_MOUNT_USRQUOTA,</div><div class='ctx'> 							MOPT_SET | MOPT_Q},</div><div class='hunk'>@@ -2000,499 +1901,978 @@ static const struct mount_opts {</div><div class='ctx'> 	{Opt_noquota, (EXT4_MOUNT_QUOTA | EXT4_MOUNT_USRQUOTA |</div><div class='ctx'> 		       EXT4_MOUNT_GRPQUOTA | EXT4_MOUNT_PRJQUOTA),</div><div class='ctx'> 							MOPT_CLEAR | MOPT_Q},</div><div class='del'>-	{Opt_usrjquota, 0, MOPT_Q | MOPT_STRING},</div><div class='del'>-	{Opt_grpjquota, 0, MOPT_Q | MOPT_STRING},</div><div class='del'>-	{Opt_offusrjquota, 0, MOPT_Q},</div><div class='del'>-	{Opt_offgrpjquota, 0, MOPT_Q},</div><div class='del'>-	{Opt_jqfmt_vfsold, QFMT_VFS_OLD, MOPT_QFMT},</div><div class='del'>-	{Opt_jqfmt_vfsv0, QFMT_VFS_V0, MOPT_QFMT},</div><div class='del'>-	{Opt_jqfmt_vfsv1, QFMT_VFS_V1, MOPT_QFMT},</div><div class='del'>-	{Opt_max_dir_size_kb, 0, MOPT_GTE0},</div><div class='del'>-	{Opt_test_dummy_encryption, 0, MOPT_STRING},</div><div class='add'>+	{Opt_usrjquota, 0, MOPT_Q},</div><div class='add'>+	{Opt_grpjquota, 0, MOPT_Q},</div><div class='add'>+	{Opt_jqfmt, 0, MOPT_QFMT},</div><div class='ctx'> 	{Opt_nombcache, EXT4_MOUNT_NO_MBCACHE, MOPT_SET},</div><div class='ctx'> 	{Opt_no_prefetch_block_bitmaps, EXT4_MOUNT_NO_PREFETCH_BLOCK_BITMAPS,</div><div class='ctx'> 	 MOPT_SET},</div><div class='del'>-	{Opt_mb_optimize_scan, EXT4_MOUNT2_MB_OPTIMIZE_SCAN, MOPT_GTE0},</div><div class='ctx'> #ifdef CONFIG_EXT4_DEBUG</div><div class='ctx'> 	{Opt_fc_debug_force, EXT4_MOUNT2_JOURNAL_FAST_COMMIT,</div><div class='ctx'> 	 MOPT_SET | MOPT_2 | MOPT_EXT4_ONLY},</div><div class='del'>-	{Opt_fc_debug_max_replay, 0, MOPT_GTE0},</div><div class='ctx'> #endif</div><div class='add'>+	{Opt_abort, EXT4_MOUNT2_ABORT, MOPT_SET | MOPT_2},</div><div class='ctx'> 	{Opt_err, 0, 0}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='ctx'> static const struct ext4_sb_encodings {</div><div class='ctx'> 	__u16 magic;</div><div class='ctx'> 	char *name;</div><div class='del'>-	char *version;</div><div class='add'>+	unsigned int version;</div><div class='ctx'> } ext4_sb_encoding_map[] = {</div><div class='del'>-	{EXT4_ENC_UTF8_12_1, "utf8", "12.1.0"},</div><div class='add'>+	{EXT4_ENC_UTF8_12_1, "utf8", UNICODE_AGE(12, 1, 0)},</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int ext4_sb_read_encoding(const struct ext4_super_block *es,</div><div class='del'>-				 const struct ext4_sb_encodings **encoding,</div><div class='del'>-				 __u16 *flags)</div><div class='add'>+static const struct ext4_sb_encodings *</div><div class='add'>+ext4_sb_read_encoding(const struct ext4_super_block *es)</div><div class='ctx'> {</div><div class='ctx'> 	__u16 magic = le16_to_cpu(es-&gt;s_encoding);</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; ARRAY_SIZE(ext4_sb_encoding_map); i++)</div><div class='ctx'> 		if (magic == ext4_sb_encoding_map[i].magic)</div><div class='del'>-			break;</div><div class='add'>+			return &amp;ext4_sb_encoding_map[i];</div><div class='ctx'> </div><div class='del'>-	if (i &gt;= ARRAY_SIZE(ext4_sb_encoding_map))</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+#define EXT4_SPEC_JQUOTA			(1 &lt;&lt;  0)</div><div class='add'>+#define EXT4_SPEC_JQFMT				(1 &lt;&lt;  1)</div><div class='add'>+#define EXT4_SPEC_DATAJ				(1 &lt;&lt;  2)</div><div class='add'>+#define EXT4_SPEC_SB_BLOCK			(1 &lt;&lt;  3)</div><div class='add'>+#define EXT4_SPEC_JOURNAL_DEV			(1 &lt;&lt;  4)</div><div class='add'>+#define EXT4_SPEC_JOURNAL_IOPRIO		(1 &lt;&lt;  5)</div><div class='add'>+#define EXT4_SPEC_s_want_extra_isize		(1 &lt;&lt;  7)</div><div class='add'>+#define EXT4_SPEC_s_max_batch_time		(1 &lt;&lt;  8)</div><div class='add'>+#define EXT4_SPEC_s_min_batch_time		(1 &lt;&lt;  9)</div><div class='add'>+#define EXT4_SPEC_s_inode_readahead_blks	(1 &lt;&lt; 10)</div><div class='add'>+#define EXT4_SPEC_s_li_wait_mult		(1 &lt;&lt; 11)</div><div class='add'>+#define EXT4_SPEC_s_max_dir_size_kb		(1 &lt;&lt; 12)</div><div class='add'>+#define EXT4_SPEC_s_stripe			(1 &lt;&lt; 13)</div><div class='add'>+#define EXT4_SPEC_s_resuid			(1 &lt;&lt; 14)</div><div class='add'>+#define EXT4_SPEC_s_resgid			(1 &lt;&lt; 15)</div><div class='add'>+#define EXT4_SPEC_s_commit_interval		(1 &lt;&lt; 16)</div><div class='add'>+#define EXT4_SPEC_s_fc_debug_max_replay		(1 &lt;&lt; 17)</div><div class='add'>+#define EXT4_SPEC_s_sb_block			(1 &lt;&lt; 18)</div><div class='add'>+#define EXT4_SPEC_mb_optimize_scan		(1 &lt;&lt; 19)</div><div class='add'>+</div><div class='add'>+struct ext4_fs_context {</div><div class='add'>+	char		*s_qf_names[EXT4_MAXQUOTAS];</div><div class='add'>+	struct fscrypt_dummy_policy dummy_enc_policy;</div><div class='add'>+	int		s_jquota_fmt;	/* Format of quota to use */</div><div class='add'>+#ifdef CONFIG_EXT4_DEBUG</div><div class='add'>+	int s_fc_debug_max_replay;</div><div class='add'>+#endif</div><div class='add'>+	unsigned short	qname_spec;</div><div class='add'>+	unsigned long	vals_s_flags;	/* Bits to set in s_flags */</div><div class='add'>+	unsigned long	mask_s_flags;	/* Bits changed in s_flags */</div><div class='add'>+	unsigned long	journal_devnum;</div><div class='add'>+	unsigned long	s_commit_interval;</div><div class='add'>+	unsigned long	s_stripe;</div><div class='add'>+	unsigned int	s_inode_readahead_blks;</div><div class='add'>+	unsigned int	s_want_extra_isize;</div><div class='add'>+	unsigned int	s_li_wait_mult;</div><div class='add'>+	unsigned int	s_max_dir_size_kb;</div><div class='add'>+	unsigned int	journal_ioprio;</div><div class='add'>+	unsigned int	vals_s_mount_opt;</div><div class='add'>+	unsigned int	mask_s_mount_opt;</div><div class='add'>+	unsigned int	vals_s_mount_opt2;</div><div class='add'>+	unsigned int	mask_s_mount_opt2;</div><div class='add'>+	unsigned int	opt_flags;	/* MOPT flags */</div><div class='add'>+	unsigned int	spec;</div><div class='add'>+	u32		s_max_batch_time;</div><div class='add'>+	u32		s_min_batch_time;</div><div class='add'>+	kuid_t		s_resuid;</div><div class='add'>+	kgid_t		s_resgid;</div><div class='add'>+	ext4_fsblk_t	s_sb_block;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static void ext4_fc_free(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct ext4_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	if (!ctx)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; EXT4_MAXQUOTAS; i++)</div><div class='add'>+		kfree(ctx-&gt;s_qf_names[i]);</div><div class='add'>+</div><div class='add'>+	fscrypt_free_dummy_policy(&amp;ctx-&gt;dummy_enc_policy);</div><div class='add'>+	kfree(ctx);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int ext4_init_fs_context(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct ext4_fs_context *ctx;</div><div class='add'>+</div><div class='add'>+	ctx = kzalloc(sizeof(struct ext4_fs_context), GFP_KERNEL);</div><div class='add'>+	if (!ctx)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	fc-&gt;fs_private = ctx;</div><div class='add'>+	fc-&gt;ops = &amp;ext4_context_ops;</div><div class='add'>+</div><div class='add'>+	/* i_version is always enabled now */</div><div class='add'>+	fc-&gt;sb_flags |= SB_I_VERSION;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_QUOTA</div><div class='add'>+/*</div><div class='add'>+ * Note the name of the specified quota file.</div><div class='add'>+ */</div><div class='add'>+static int note_qf_name(struct fs_context *fc, int qtype,</div><div class='add'>+		       struct fs_parameter *param)</div><div class='add'>+{</div><div class='add'>+	struct ext4_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	char *qname;</div><div class='add'>+</div><div class='add'>+	if (param-&gt;size &lt; 1) {</div><div class='add'>+		ext4_msg(NULL, KERN_ERR, "Missing quota name");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+	if (strchr(param-&gt;string, '/')) {</div><div class='add'>+		ext4_msg(NULL, KERN_ERR,</div><div class='add'>+			 "quotafile must be on filesystem root");</div><div class='ctx'> 		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+	if (ctx-&gt;s_qf_names[qtype]) {</div><div class='add'>+		if (strcmp(ctx-&gt;s_qf_names[qtype], param-&gt;string) != 0) {</div><div class='add'>+			ext4_msg(NULL, KERN_ERR,</div><div class='add'>+				 "%s quota file already specified",</div><div class='add'>+				 QTYPE2NAME(qtype));</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	*encoding = &amp;ext4_sb_encoding_map[i];</div><div class='del'>-	*flags = le16_to_cpu(es-&gt;s_encoding_flags);</div><div class='add'>+	qname = kmemdup_nul(param-&gt;string, param-&gt;size, GFP_KERNEL);</div><div class='add'>+	if (!qname) {</div><div class='add'>+		ext4_msg(NULL, KERN_ERR,</div><div class='add'>+			 "Not enough memory for storing quotafile name");</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+	ctx-&gt;s_qf_names[qtype] = qname;</div><div class='add'>+	ctx-&gt;qname_spec |= 1 &lt;&lt; qtype;</div><div class='add'>+	ctx-&gt;spec |= EXT4_SPEC_JQUOTA;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Clear the name of the specified quota file.</div><div class='add'>+ */</div><div class='add'>+static int unnote_qf_name(struct fs_context *fc, int qtype)</div><div class='add'>+{</div><div class='add'>+	struct ext4_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+</div><div class='add'>+	kfree(ctx-&gt;s_qf_names[qtype]);</div><div class='add'>+</div><div class='add'>+	ctx-&gt;s_qf_names[qtype] = NULL;</div><div class='add'>+	ctx-&gt;qname_spec |= 1 &lt;&lt; qtype;</div><div class='add'>+	ctx-&gt;spec |= EXT4_SPEC_JQUOTA;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-static int ext4_set_test_dummy_encryption(struct super_block *sb,</div><div class='del'>-					  const char *opt,</div><div class='del'>-					  const substring_t *arg,</div><div class='del'>-					  bool is_remount)</div><div class='add'>+static int ext4_parse_test_dummy_encryption(const struct fs_parameter *param,</div><div class='add'>+					    struct ext4_fs_context *ctx)</div><div class='ctx'> {</div><div class='del'>-#ifdef CONFIG_FS_ENCRYPTION</div><div class='del'>-	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * This mount option is just for testing, and it's not worthwhile to</div><div class='del'>-	 * implement the extra complexity (e.g. RCU protection) that would be</div><div class='del'>-	 * needed to allow it to be set or changed during remount.  We do allow</div><div class='del'>-	 * it to be specified during remount, but only if there is no change.</div><div class='del'>-	 */</div><div class='del'>-	if (is_remount &amp;&amp; !sbi-&gt;s_dummy_enc_policy.policy) {</div><div class='del'>-		ext4_msg(sb, KERN_WARNING,</div><div class='del'>-			 "Can't set test_dummy_encryption on remount");</div><div class='del'>-		return -1;</div><div class='add'>+	if (!IS_ENABLED(CONFIG_FS_ENCRYPTION)) {</div><div class='add'>+		ext4_msg(NULL, KERN_WARNING,</div><div class='add'>+			 "test_dummy_encryption option not supported");</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-	err = fscrypt_set_test_dummy_encryption(sb, arg-&gt;from,</div><div class='del'>-						&amp;sbi-&gt;s_dummy_enc_policy);</div><div class='del'>-	if (err) {</div><div class='del'>-		if (err == -EEXIST)</div><div class='del'>-			ext4_msg(sb, KERN_WARNING,</div><div class='del'>-				 "Can't change test_dummy_encryption on remount");</div><div class='del'>-		else if (err == -EINVAL)</div><div class='del'>-			ext4_msg(sb, KERN_WARNING,</div><div class='del'>-				 "Value of option \"%s\" is unrecognized", opt);</div><div class='del'>-		else</div><div class='del'>-			ext4_msg(sb, KERN_WARNING,</div><div class='del'>-				 "Error processing option \"%s\" [%d]",</div><div class='del'>-				 opt, err);</div><div class='del'>-		return -1;</div><div class='add'>+	err = fscrypt_parse_test_dummy_encryption(param,</div><div class='add'>+						  &amp;ctx-&gt;dummy_enc_policy);</div><div class='add'>+	if (err == -EINVAL) {</div><div class='add'>+		ext4_msg(NULL, KERN_WARNING,</div><div class='add'>+			 "Value of option \"%s\" is unrecognized", param-&gt;key);</div><div class='add'>+	} else if (err == -EEXIST) {</div><div class='add'>+		ext4_msg(NULL, KERN_WARNING,</div><div class='add'>+			 "Conflicting test_dummy_encryption options");</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-	ext4_msg(sb, KERN_WARNING, "Test dummy encryption mode enabled");</div><div class='del'>-#else</div><div class='del'>-	ext4_msg(sb, KERN_WARNING,</div><div class='del'>-		 "Test dummy encryption mount option ignored");</div><div class='del'>-#endif</div><div class='del'>-	return 1;</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct ext4_parsed_options {</div><div class='del'>-	unsigned long journal_devnum;</div><div class='del'>-	unsigned int journal_ioprio;</div><div class='del'>-	int mb_optimize_scan;</div><div class='del'>-};</div><div class='add'>+#define EXT4_SET_CTX(name)						\</div><div class='add'>+static inline __maybe_unused						\</div><div class='add'>+void ctx_set_##name(struct ext4_fs_context *ctx, unsigned long flag)	\</div><div class='add'>+{									\</div><div class='add'>+	ctx-&gt;mask_s_##name |= flag;					\</div><div class='add'>+	ctx-&gt;vals_s_##name |= flag;					\</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define EXT4_CLEAR_CTX(name)						\</div><div class='add'>+static inline __maybe_unused						\</div><div class='add'>+void ctx_clear_##name(struct ext4_fs_context *ctx, unsigned long flag)	\</div><div class='add'>+{									\</div><div class='add'>+	ctx-&gt;mask_s_##name |= flag;					\</div><div class='add'>+	ctx-&gt;vals_s_##name &amp;= ~flag;					\</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define EXT4_TEST_CTX(name)						\</div><div class='add'>+static inline unsigned long						\</div><div class='add'>+ctx_test_##name(struct ext4_fs_context *ctx, unsigned long flag)	\</div><div class='add'>+{									\</div><div class='add'>+	return (ctx-&gt;vals_s_##name &amp; flag);				\</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-static int handle_mount_opt(struct super_block *sb, char *opt, int token,</div><div class='del'>-			    substring_t *args, struct ext4_parsed_options *parsed_opts,</div><div class='del'>-			    int is_remount)</div><div class='add'>+EXT4_SET_CTX(flags); /* set only */</div><div class='add'>+EXT4_SET_CTX(mount_opt);</div><div class='add'>+EXT4_CLEAR_CTX(mount_opt);</div><div class='add'>+EXT4_TEST_CTX(mount_opt);</div><div class='add'>+EXT4_SET_CTX(mount_opt2);</div><div class='add'>+EXT4_CLEAR_CTX(mount_opt2);</div><div class='add'>+EXT4_TEST_CTX(mount_opt2);</div><div class='add'>+</div><div class='add'>+static int ext4_parse_param(struct fs_context *fc, struct fs_parameter *param)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	struct ext4_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct fs_parse_result result;</div><div class='ctx'> 	const struct mount_opts *m;</div><div class='del'>-	kuid_t uid;</div><div class='del'>-	kgid_t gid;</div><div class='del'>-	int arg = 0;</div><div class='add'>+	int is_remount;</div><div class='add'>+	int token;</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_QUOTA</div><div class='del'>-	if (token == Opt_usrjquota)</div><div class='del'>-		return set_qf_name(sb, USRQUOTA, &amp;args[0]);</div><div class='del'>-	else if (token == Opt_grpjquota)</div><div class='del'>-		return set_qf_name(sb, GRPQUOTA, &amp;args[0]);</div><div class='del'>-	else if (token == Opt_offusrjquota)</div><div class='del'>-		return clear_qf_name(sb, USRQUOTA);</div><div class='del'>-	else if (token == Opt_offgrpjquota)</div><div class='del'>-		return clear_qf_name(sb, GRPQUOTA);</div><div class='del'>-#endif</div><div class='del'>-	switch (token) {</div><div class='del'>-	case Opt_noacl:</div><div class='del'>-	case Opt_nouser_xattr:</div><div class='del'>-		ext4_msg(sb, KERN_WARNING, deprecated_msg, opt, "3.5");</div><div class='del'>-		break;</div><div class='del'>-	case Opt_sb:</div><div class='del'>-		return 1;	/* handled by get_sb_block() */</div><div class='del'>-	case Opt_removed:</div><div class='del'>-		ext4_msg(sb, KERN_WARNING, "Ignoring removed %s option", opt);</div><div class='del'>-		return 1;</div><div class='del'>-	case Opt_abort:</div><div class='del'>-		ext4_set_mount_flag(sb, EXT4_MF_FS_ABORTED);</div><div class='del'>-		return 1;</div><div class='del'>-	case Opt_i_version:</div><div class='del'>-		sb-&gt;s_flags |= SB_I_VERSION;</div><div class='del'>-		return 1;</div><div class='del'>-	case Opt_lazytime:</div><div class='del'>-		sb-&gt;s_flags |= SB_LAZYTIME;</div><div class='del'>-		return 1;</div><div class='del'>-	case Opt_nolazytime:</div><div class='del'>-		sb-&gt;s_flags &amp;= ~SB_LAZYTIME;</div><div class='del'>-		return 1;</div><div class='del'>-	case Opt_inlinecrypt:</div><div class='del'>-#ifdef CONFIG_FS_ENCRYPTION_INLINE_CRYPT</div><div class='del'>-		sb-&gt;s_flags |= SB_INLINECRYPT;</div><div class='del'>-#else</div><div class='del'>-		ext4_msg(sb, KERN_ERR, "inline encryption not supported");</div><div class='del'>-#endif</div><div class='del'>-		return 1;</div><div class='del'>-	}</div><div class='add'>+	token = fs_parse(fc, ext4_param_specs, param, &amp;result);</div><div class='add'>+	if (token &lt; 0)</div><div class='add'>+		return token;</div><div class='add'>+	is_remount = fc-&gt;purpose == FS_CONTEXT_FOR_RECONFIGURE;</div><div class='ctx'> </div><div class='ctx'> 	for (m = ext4_mount_opts; m-&gt;token != Opt_err; m++)</div><div class='ctx'> 		if (token == m-&gt;token)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-	if (m-&gt;token == Opt_err) {</div><div class='del'>-		ext4_msg(sb, KERN_ERR, "Unrecognized mount option \"%s\" "</div><div class='del'>-			 "or missing value", opt);</div><div class='del'>-		return -1;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if ((m-&gt;flags &amp; MOPT_NO_EXT2) &amp;&amp; IS_EXT2_SB(sb)) {</div><div class='del'>-		ext4_msg(sb, KERN_ERR,</div><div class='del'>-			 "Mount option \"%s\" incompatible with ext2", opt);</div><div class='del'>-		return -1;</div><div class='del'>-	}</div><div class='del'>-	if ((m-&gt;flags &amp; MOPT_NO_EXT3) &amp;&amp; IS_EXT3_SB(sb)) {</div><div class='del'>-		ext4_msg(sb, KERN_ERR,</div><div class='del'>-			 "Mount option \"%s\" incompatible with ext3", opt);</div><div class='del'>-		return -1;</div><div class='del'>-	}</div><div class='add'>+	ctx-&gt;opt_flags |= m-&gt;flags;</div><div class='ctx'> </div><div class='del'>-	if (args-&gt;from &amp;&amp; !(m-&gt;flags &amp; MOPT_STRING) &amp;&amp; match_int(args, &amp;arg))</div><div class='del'>-		return -1;</div><div class='del'>-	if (args-&gt;from &amp;&amp; (m-&gt;flags &amp; MOPT_GTE0) &amp;&amp; (arg &lt; 0))</div><div class='del'>-		return -1;</div><div class='ctx'> 	if (m-&gt;flags &amp; MOPT_EXPLICIT) {</div><div class='ctx'> 		if (m-&gt;mount_opt &amp; EXT4_MOUNT_DELALLOC) {</div><div class='del'>-			set_opt2(sb, EXPLICIT_DELALLOC);</div><div class='add'>+			ctx_set_mount_opt2(ctx, EXT4_MOUNT2_EXPLICIT_DELALLOC);</div><div class='ctx'> 		} else if (m-&gt;mount_opt &amp; EXT4_MOUNT_JOURNAL_CHECKSUM) {</div><div class='del'>-			set_opt2(sb, EXPLICIT_JOURNAL_CHECKSUM);</div><div class='add'>+			ctx_set_mount_opt2(ctx,</div><div class='add'>+				       EXT4_MOUNT2_EXPLICIT_JOURNAL_CHECKSUM);</div><div class='ctx'> 		} else</div><div class='del'>-			return -1;</div><div class='del'>-	}</div><div class='del'>-	if (m-&gt;flags &amp; MOPT_CLEAR_ERR)</div><div class='del'>-		clear_opt(sb, ERRORS_MASK);</div><div class='del'>-	if (token == Opt_noquota &amp;&amp; sb_any_quota_loaded(sb)) {</div><div class='del'>-		ext4_msg(sb, KERN_ERR, "Cannot change quota "</div><div class='del'>-			 "options when quota turned on");</div><div class='del'>-		return -1;</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (m-&gt;flags &amp; MOPT_NOSUPPORT) {</div><div class='del'>-		ext4_msg(sb, KERN_ERR, "%s option not supported", opt);</div><div class='del'>-	} else if (token == Opt_commit) {</div><div class='del'>-		if (arg == 0)</div><div class='del'>-			arg = JBD2_DEFAULT_MAX_COMMIT_AGE;</div><div class='del'>-		else if (arg &gt; INT_MAX / HZ) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR,</div><div class='add'>+		ext4_msg(NULL, KERN_ERR, "%s option not supported",</div><div class='add'>+			 param-&gt;key);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	switch (token) {</div><div class='add'>+#ifdef CONFIG_QUOTA</div><div class='add'>+	case Opt_usrjquota:</div><div class='add'>+		if (!*param-&gt;string)</div><div class='add'>+			return unnote_qf_name(fc, USRQUOTA);</div><div class='add'>+		else</div><div class='add'>+			return note_qf_name(fc, USRQUOTA, param);</div><div class='add'>+	case Opt_grpjquota:</div><div class='add'>+		if (!*param-&gt;string)</div><div class='add'>+			return unnote_qf_name(fc, GRPQUOTA);</div><div class='add'>+		else</div><div class='add'>+			return note_qf_name(fc, GRPQUOTA, param);</div><div class='add'>+#endif</div><div class='add'>+	case Opt_sb:</div><div class='add'>+		if (fc-&gt;purpose == FS_CONTEXT_FOR_RECONFIGURE) {</div><div class='add'>+			ext4_msg(NULL, KERN_WARNING,</div><div class='add'>+				 "Ignoring %s option on remount", param-&gt;key);</div><div class='add'>+		} else {</div><div class='add'>+			ctx-&gt;s_sb_block = result.uint_32;</div><div class='add'>+			ctx-&gt;spec |= EXT4_SPEC_s_sb_block;</div><div class='add'>+		}</div><div class='add'>+		return 0;</div><div class='add'>+	case Opt_removed:</div><div class='add'>+		ext4_msg(NULL, KERN_WARNING, "Ignoring removed %s option",</div><div class='add'>+			 param-&gt;key);</div><div class='add'>+		return 0;</div><div class='add'>+	case Opt_inlinecrypt:</div><div class='add'>+#ifdef CONFIG_FS_ENCRYPTION_INLINE_CRYPT</div><div class='add'>+		ctx_set_flags(ctx, SB_INLINECRYPT);</div><div class='add'>+#else</div><div class='add'>+		ext4_msg(NULL, KERN_ERR, "inline encryption not supported");</div><div class='add'>+#endif</div><div class='add'>+		return 0;</div><div class='add'>+	case Opt_errors:</div><div class='add'>+		ctx_clear_mount_opt(ctx, EXT4_MOUNT_ERRORS_MASK);</div><div class='add'>+		ctx_set_mount_opt(ctx, result.uint_32);</div><div class='add'>+		return 0;</div><div class='add'>+#ifdef CONFIG_QUOTA</div><div class='add'>+	case Opt_jqfmt:</div><div class='add'>+		ctx-&gt;s_jquota_fmt = result.uint_32;</div><div class='add'>+		ctx-&gt;spec |= EXT4_SPEC_JQFMT;</div><div class='add'>+		return 0;</div><div class='add'>+#endif</div><div class='add'>+	case Opt_data:</div><div class='add'>+		ctx_clear_mount_opt(ctx, EXT4_MOUNT_DATA_FLAGS);</div><div class='add'>+		ctx_set_mount_opt(ctx, result.uint_32);</div><div class='add'>+		ctx-&gt;spec |= EXT4_SPEC_DATAJ;</div><div class='add'>+		return 0;</div><div class='add'>+	case Opt_commit:</div><div class='add'>+		if (result.uint_32 == 0)</div><div class='add'>+			result.uint_32 = JBD2_DEFAULT_MAX_COMMIT_AGE;</div><div class='add'>+		else if (result.uint_32 &gt; INT_MAX / HZ) {</div><div class='add'>+			ext4_msg(NULL, KERN_ERR,</div><div class='ctx'> 				 "Invalid commit interval %d, "</div><div class='ctx'> 				 "must be smaller than %d",</div><div class='del'>-				 arg, INT_MAX / HZ);</div><div class='del'>-			return -1;</div><div class='add'>+				 result.uint_32, INT_MAX / HZ);</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 		}</div><div class='del'>-		sbi-&gt;s_commit_interval = HZ * arg;</div><div class='del'>-	} else if (token == Opt_debug_want_extra_isize) {</div><div class='del'>-		if ((arg &amp; 1) ||</div><div class='del'>-		    (arg &lt; 4) ||</div><div class='del'>-		    (arg &gt; (sbi-&gt;s_inode_size - EXT4_GOOD_OLD_INODE_SIZE))) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR,</div><div class='del'>-				 "Invalid want_extra_isize %d", arg);</div><div class='del'>-			return -1;</div><div class='add'>+		ctx-&gt;s_commit_interval = HZ * result.uint_32;</div><div class='add'>+		ctx-&gt;spec |= EXT4_SPEC_s_commit_interval;</div><div class='add'>+		return 0;</div><div class='add'>+	case Opt_debug_want_extra_isize:</div><div class='add'>+		if ((result.uint_32 &amp; 1) || (result.uint_32 &lt; 4)) {</div><div class='add'>+			ext4_msg(NULL, KERN_ERR,</div><div class='add'>+				 "Invalid want_extra_isize %d", result.uint_32);</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 		}</div><div class='del'>-		sbi-&gt;s_want_extra_isize = arg;</div><div class='del'>-	} else if (token == Opt_max_batch_time) {</div><div class='del'>-		sbi-&gt;s_max_batch_time = arg;</div><div class='del'>-	} else if (token == Opt_min_batch_time) {</div><div class='del'>-		sbi-&gt;s_min_batch_time = arg;</div><div class='del'>-	} else if (token == Opt_inode_readahead_blks) {</div><div class='del'>-		if (arg &amp;&amp; (arg &gt; (1 &lt;&lt; 30) || !is_power_of_2(arg))) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR,</div><div class='add'>+		ctx-&gt;s_want_extra_isize = result.uint_32;</div><div class='add'>+		ctx-&gt;spec |= EXT4_SPEC_s_want_extra_isize;</div><div class='add'>+		return 0;</div><div class='add'>+	case Opt_max_batch_time:</div><div class='add'>+		ctx-&gt;s_max_batch_time = result.uint_32;</div><div class='add'>+		ctx-&gt;spec |= EXT4_SPEC_s_max_batch_time;</div><div class='add'>+		return 0;</div><div class='add'>+	case Opt_min_batch_time:</div><div class='add'>+		ctx-&gt;s_min_batch_time = result.uint_32;</div><div class='add'>+		ctx-&gt;spec |= EXT4_SPEC_s_min_batch_time;</div><div class='add'>+		return 0;</div><div class='add'>+	case Opt_inode_readahead_blks:</div><div class='add'>+		if (result.uint_32 &amp;&amp;</div><div class='add'>+		    (result.uint_32 &gt; (1 &lt;&lt; 30) ||</div><div class='add'>+		     !is_power_of_2(result.uint_32))) {</div><div class='add'>+			ext4_msg(NULL, KERN_ERR,</div><div class='ctx'> 				 "EXT4-fs: inode_readahead_blks must be "</div><div class='ctx'> 				 "0 or a power of 2 smaller than 2^31");</div><div class='del'>-			return -1;</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 		}</div><div class='del'>-		sbi-&gt;s_inode_readahead_blks = arg;</div><div class='del'>-	} else if (token == Opt_init_itable) {</div><div class='del'>-		set_opt(sb, INIT_INODE_TABLE);</div><div class='del'>-		if (!args-&gt;from)</div><div class='del'>-			arg = EXT4_DEF_LI_WAIT_MULT;</div><div class='del'>-		sbi-&gt;s_li_wait_mult = arg;</div><div class='del'>-	} else if (token == Opt_max_dir_size_kb) {</div><div class='del'>-		sbi-&gt;s_max_dir_size_kb = arg;</div><div class='add'>+		ctx-&gt;s_inode_readahead_blks = result.uint_32;</div><div class='add'>+		ctx-&gt;spec |= EXT4_SPEC_s_inode_readahead_blks;</div><div class='add'>+		return 0;</div><div class='add'>+	case Opt_init_itable:</div><div class='add'>+		ctx_set_mount_opt(ctx, EXT4_MOUNT_INIT_INODE_TABLE);</div><div class='add'>+		ctx-&gt;s_li_wait_mult = EXT4_DEF_LI_WAIT_MULT;</div><div class='add'>+		if (param-&gt;type == fs_value_is_string)</div><div class='add'>+			ctx-&gt;s_li_wait_mult = result.uint_32;</div><div class='add'>+		ctx-&gt;spec |= EXT4_SPEC_s_li_wait_mult;</div><div class='add'>+		return 0;</div><div class='add'>+	case Opt_max_dir_size_kb:</div><div class='add'>+		ctx-&gt;s_max_dir_size_kb = result.uint_32;</div><div class='add'>+		ctx-&gt;spec |= EXT4_SPEC_s_max_dir_size_kb;</div><div class='add'>+		return 0;</div><div class='ctx'> #ifdef CONFIG_EXT4_DEBUG</div><div class='del'>-	} else if (token == Opt_fc_debug_max_replay) {</div><div class='del'>-		sbi-&gt;s_fc_debug_max_replay = arg;</div><div class='add'>+	case Opt_fc_debug_max_replay:</div><div class='add'>+		ctx-&gt;s_fc_debug_max_replay = result.uint_32;</div><div class='add'>+		ctx-&gt;spec |= EXT4_SPEC_s_fc_debug_max_replay;</div><div class='add'>+		return 0;</div><div class='ctx'> #endif</div><div class='del'>-	} else if (token == Opt_stripe) {</div><div class='del'>-		sbi-&gt;s_stripe = arg;</div><div class='del'>-	} else if (token == Opt_resuid) {</div><div class='del'>-		uid = make_kuid(current_user_ns(), arg);</div><div class='del'>-		if (!uid_valid(uid)) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR, "Invalid uid value %d", arg);</div><div class='del'>-			return -1;</div><div class='del'>-		}</div><div class='del'>-		sbi-&gt;s_resuid = uid;</div><div class='del'>-	} else if (token == Opt_resgid) {</div><div class='del'>-		gid = make_kgid(current_user_ns(), arg);</div><div class='del'>-		if (!gid_valid(gid)) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR, "Invalid gid value %d", arg);</div><div class='del'>-			return -1;</div><div class='del'>-		}</div><div class='del'>-		sbi-&gt;s_resgid = gid;</div><div class='del'>-	} else if (token == Opt_journal_dev) {</div><div class='add'>+	case Opt_stripe:</div><div class='add'>+		ctx-&gt;s_stripe = result.uint_32;</div><div class='add'>+		ctx-&gt;spec |= EXT4_SPEC_s_stripe;</div><div class='add'>+		return 0;</div><div class='add'>+	case Opt_resuid:</div><div class='add'>+		ctx-&gt;s_resuid = result.uid;</div><div class='add'>+		ctx-&gt;spec |= EXT4_SPEC_s_resuid;</div><div class='add'>+		return 0;</div><div class='add'>+	case Opt_resgid:</div><div class='add'>+		ctx-&gt;s_resgid = result.gid;</div><div class='add'>+		ctx-&gt;spec |= EXT4_SPEC_s_resgid;</div><div class='add'>+		return 0;</div><div class='add'>+	case Opt_journal_dev:</div><div class='ctx'> 		if (is_remount) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR,</div><div class='add'>+			ext4_msg(NULL, KERN_ERR,</div><div class='ctx'> 				 "Cannot specify journal on remount");</div><div class='del'>-			return -1;</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 		}</div><div class='del'>-		parsed_opts-&gt;journal_devnum = arg;</div><div class='del'>-	} else if (token == Opt_journal_path) {</div><div class='del'>-		char *journal_path;</div><div class='add'>+		ctx-&gt;journal_devnum = result.uint_32;</div><div class='add'>+		ctx-&gt;spec |= EXT4_SPEC_JOURNAL_DEV;</div><div class='add'>+		return 0;</div><div class='add'>+	case Opt_journal_path:</div><div class='add'>+	{</div><div class='ctx'> 		struct inode *journal_inode;</div><div class='ctx'> 		struct path path;</div><div class='ctx'> 		int error;</div><div class='ctx'> </div><div class='ctx'> 		if (is_remount) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR,</div><div class='add'>+			ext4_msg(NULL, KERN_ERR,</div><div class='ctx'> 				 "Cannot specify journal on remount");</div><div class='del'>-			return -1;</div><div class='del'>-		}</div><div class='del'>-		journal_path = match_strdup(&amp;args[0]);</div><div class='del'>-		if (!journal_path) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR, "error: could not dup "</div><div class='del'>-				"journal device string");</div><div class='del'>-			return -1;</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		error = kern_path(journal_path, LOOKUP_FOLLOW, &amp;path);</div><div class='add'>+		error = fs_lookup_param(fc, param, 1, LOOKUP_FOLLOW, &amp;path);</div><div class='ctx'> 		if (error) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR, "error: could not find "</div><div class='del'>-				"journal device path: error %d", error);</div><div class='del'>-			kfree(journal_path);</div><div class='del'>-			return -1;</div><div class='add'>+			ext4_msg(NULL, KERN_ERR, "error: could not find "</div><div class='add'>+				 "journal device path");</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		journal_inode = d_inode(path.dentry);</div><div class='del'>-		if (!S_ISBLK(journal_inode-&gt;i_mode)) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR, "error: journal path %s "</div><div class='del'>-				"is not a block device", journal_path);</div><div class='del'>-			path_put(&amp;path);</div><div class='del'>-			kfree(journal_path);</div><div class='del'>-			return -1;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		parsed_opts-&gt;journal_devnum = new_encode_dev(journal_inode-&gt;i_rdev);</div><div class='add'>+		ctx-&gt;journal_devnum = new_encode_dev(journal_inode-&gt;i_rdev);</div><div class='add'>+		ctx-&gt;spec |= EXT4_SPEC_JOURNAL_DEV;</div><div class='ctx'> 		path_put(&amp;path);</div><div class='del'>-		kfree(journal_path);</div><div class='del'>-	} else if (token == Opt_journal_ioprio) {</div><div class='del'>-		if (arg &gt; 7) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR, "Invalid journal IO priority"</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+	case Opt_journal_ioprio:</div><div class='add'>+		if (result.uint_32 &gt; 7) {</div><div class='add'>+			ext4_msg(NULL, KERN_ERR, "Invalid journal IO priority"</div><div class='ctx'> 				 " (must be 0-7)");</div><div class='del'>-			return -1;</div><div class='del'>-		}</div><div class='del'>-		parsed_opts-&gt;journal_ioprio =</div><div class='del'>-			IOPRIO_PRIO_VALUE(IOPRIO_CLASS_BE, arg);</div><div class='del'>-	} else if (token == Opt_test_dummy_encryption) {</div><div class='del'>-		return ext4_set_test_dummy_encryption(sb, opt, &amp;args[0],</div><div class='del'>-						      is_remount);</div><div class='del'>-	} else if (m-&gt;flags &amp; MOPT_DATAJ) {</div><div class='del'>-		if (is_remount) {</div><div class='del'>-			if (!sbi-&gt;s_journal)</div><div class='del'>-				ext4_msg(sb, KERN_WARNING, "Remounting file system with no journal so ignoring journalled data option");</div><div class='del'>-			else if (test_opt(sb, DATA_FLAGS) != m-&gt;mount_opt) {</div><div class='del'>-				ext4_msg(sb, KERN_ERR,</div><div class='del'>-					 "Cannot change data mode on remount");</div><div class='del'>-				return -1;</div><div class='del'>-			}</div><div class='del'>-		} else {</div><div class='del'>-			clear_opt(sb, DATA_FLAGS);</div><div class='del'>-			sbi-&gt;s_mount_opt |= m-&gt;mount_opt;</div><div class='del'>-		}</div><div class='del'>-#ifdef CONFIG_QUOTA</div><div class='del'>-	} else if (m-&gt;flags &amp; MOPT_QFMT) {</div><div class='del'>-		if (sb_any_quota_loaded(sb) &amp;&amp;</div><div class='del'>-		    sbi-&gt;s_jquota_fmt != m-&gt;mount_opt) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR, "Cannot change journaled "</div><div class='del'>-				 "quota options when quota turned on");</div><div class='del'>-			return -1;</div><div class='del'>-		}</div><div class='del'>-		if (ext4_has_feature_quota(sb)) {</div><div class='del'>-			ext4_msg(sb, KERN_INFO,</div><div class='del'>-				 "Quota format mount options ignored "</div><div class='del'>-				 "when QUOTA feature is enabled");</div><div class='del'>-			return 1;</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 		}</div><div class='del'>-		sbi-&gt;s_jquota_fmt = m-&gt;mount_opt;</div><div class='del'>-#endif</div><div class='del'>-	} else if (token == Opt_dax || token == Opt_dax_always ||</div><div class='del'>-		   token == Opt_dax_inode || token == Opt_dax_never) {</div><div class='add'>+		ctx-&gt;journal_ioprio =</div><div class='add'>+			IOPRIO_PRIO_VALUE(IOPRIO_CLASS_BE, result.uint_32);</div><div class='add'>+		ctx-&gt;spec |= EXT4_SPEC_JOURNAL_IOPRIO;</div><div class='add'>+		return 0;</div><div class='add'>+	case Opt_test_dummy_encryption:</div><div class='add'>+		return ext4_parse_test_dummy_encryption(param, ctx);</div><div class='add'>+	case Opt_dax:</div><div class='add'>+	case Opt_dax_type:</div><div class='ctx'> #ifdef CONFIG_FS_DAX</div><div class='del'>-		switch (token) {</div><div class='add'>+	{</div><div class='add'>+		int type = (token == Opt_dax) ?</div><div class='add'>+			   Opt_dax : result.uint_32;</div><div class='add'>+</div><div class='add'>+		switch (type) {</div><div class='ctx'> 		case Opt_dax:</div><div class='ctx'> 		case Opt_dax_always:</div><div class='del'>-			if (is_remount &amp;&amp;</div><div class='del'>-			    (!(sbi-&gt;s_mount_opt &amp; EXT4_MOUNT_DAX_ALWAYS) ||</div><div class='del'>-			     (sbi-&gt;s_mount_opt2 &amp; EXT4_MOUNT2_DAX_NEVER))) {</div><div class='del'>-			fail_dax_change_remount:</div><div class='del'>-				ext4_msg(sb, KERN_ERR, "can't change "</div><div class='del'>-					 "dax mount option while remounting");</div><div class='del'>-				return -1;</div><div class='del'>-			}</div><div class='del'>-			if (is_remount &amp;&amp;</div><div class='del'>-			    (test_opt(sb, DATA_FLAGS) ==</div><div class='del'>-			     EXT4_MOUNT_JOURNAL_DATA)) {</div><div class='del'>-				    ext4_msg(sb, KERN_ERR, "can't mount with "</div><div class='del'>-					     "both data=journal and dax");</div><div class='del'>-				    return -1;</div><div class='del'>-			}</div><div class='del'>-			ext4_msg(sb, KERN_WARNING,</div><div class='del'>-				"DAX enabled. Warning: EXPERIMENTAL, use at your own risk");</div><div class='del'>-			sbi-&gt;s_mount_opt |= EXT4_MOUNT_DAX_ALWAYS;</div><div class='del'>-			sbi-&gt;s_mount_opt2 &amp;= ~EXT4_MOUNT2_DAX_NEVER;</div><div class='add'>+			ctx_set_mount_opt(ctx, EXT4_MOUNT_DAX_ALWAYS);</div><div class='add'>+			ctx_clear_mount_opt2(ctx, EXT4_MOUNT2_DAX_NEVER);</div><div class='ctx'> 			break;</div><div class='ctx'> 		case Opt_dax_never:</div><div class='del'>-			if (is_remount &amp;&amp;</div><div class='del'>-			    (!(sbi-&gt;s_mount_opt2 &amp; EXT4_MOUNT2_DAX_NEVER) ||</div><div class='del'>-			     (sbi-&gt;s_mount_opt &amp; EXT4_MOUNT_DAX_ALWAYS)))</div><div class='del'>-				goto fail_dax_change_remount;</div><div class='del'>-			sbi-&gt;s_mount_opt2 |= EXT4_MOUNT2_DAX_NEVER;</div><div class='del'>-			sbi-&gt;s_mount_opt &amp;= ~EXT4_MOUNT_DAX_ALWAYS;</div><div class='add'>+			ctx_set_mount_opt2(ctx, EXT4_MOUNT2_DAX_NEVER);</div><div class='add'>+			ctx_clear_mount_opt(ctx, EXT4_MOUNT_DAX_ALWAYS);</div><div class='ctx'> 			break;</div><div class='ctx'> 		case Opt_dax_inode:</div><div class='del'>-			if (is_remount &amp;&amp;</div><div class='del'>-			    ((sbi-&gt;s_mount_opt &amp; EXT4_MOUNT_DAX_ALWAYS) ||</div><div class='del'>-			     (sbi-&gt;s_mount_opt2 &amp; EXT4_MOUNT2_DAX_NEVER) ||</div><div class='del'>-			     !(sbi-&gt;s_mount_opt2 &amp; EXT4_MOUNT2_DAX_INODE)))</div><div class='del'>-				goto fail_dax_change_remount;</div><div class='del'>-			sbi-&gt;s_mount_opt &amp;= ~EXT4_MOUNT_DAX_ALWAYS;</div><div class='del'>-			sbi-&gt;s_mount_opt2 &amp;= ~EXT4_MOUNT2_DAX_NEVER;</div><div class='add'>+			ctx_clear_mount_opt(ctx, EXT4_MOUNT_DAX_ALWAYS);</div><div class='add'>+			ctx_clear_mount_opt2(ctx, EXT4_MOUNT2_DAX_NEVER);</div><div class='ctx'> 			/* Strictly for printing options */</div><div class='del'>-			sbi-&gt;s_mount_opt2 |= EXT4_MOUNT2_DAX_INODE;</div><div class='add'>+			ctx_set_mount_opt2(ctx, EXT4_MOUNT2_DAX_INODE);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='ctx'> #else</div><div class='del'>-		ext4_msg(sb, KERN_INFO, "dax option not supported");</div><div class='del'>-		sbi-&gt;s_mount_opt2 |= EXT4_MOUNT2_DAX_NEVER;</div><div class='del'>-		sbi-&gt;s_mount_opt &amp;= ~EXT4_MOUNT_DAX_ALWAYS;</div><div class='del'>-		return -1;</div><div class='add'>+		ext4_msg(NULL, KERN_INFO, "dax option not supported");</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> #endif</div><div class='del'>-	} else if (token == Opt_data_err_abort) {</div><div class='del'>-		sbi-&gt;s_mount_opt |= m-&gt;mount_opt;</div><div class='del'>-	} else if (token == Opt_data_err_ignore) {</div><div class='del'>-		sbi-&gt;s_mount_opt &amp;= ~m-&gt;mount_opt;</div><div class='del'>-	} else if (token == Opt_mb_optimize_scan) {</div><div class='del'>-		if (arg != 0 &amp;&amp; arg != 1) {</div><div class='del'>-			ext4_msg(sb, KERN_WARNING,</div><div class='add'>+	case Opt_data_err:</div><div class='add'>+		if (result.uint_32 == Opt_data_err_abort)</div><div class='add'>+			ctx_set_mount_opt(ctx, m-&gt;mount_opt);</div><div class='add'>+		else if (result.uint_32 == Opt_data_err_ignore)</div><div class='add'>+			ctx_clear_mount_opt(ctx, m-&gt;mount_opt);</div><div class='add'>+		return 0;</div><div class='add'>+	case Opt_mb_optimize_scan:</div><div class='add'>+		if (result.int_32 == 1) {</div><div class='add'>+			ctx_set_mount_opt2(ctx, EXT4_MOUNT2_MB_OPTIMIZE_SCAN);</div><div class='add'>+			ctx-&gt;spec |= EXT4_SPEC_mb_optimize_scan;</div><div class='add'>+		} else if (result.int_32 == 0) {</div><div class='add'>+			ctx_clear_mount_opt2(ctx, EXT4_MOUNT2_MB_OPTIMIZE_SCAN);</div><div class='add'>+			ctx-&gt;spec |= EXT4_SPEC_mb_optimize_scan;</div><div class='add'>+		} else {</div><div class='add'>+			ext4_msg(NULL, KERN_WARNING,</div><div class='ctx'> 				 "mb_optimize_scan should be set to 0 or 1.");</div><div class='del'>-			return -1;</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 		}</div><div class='del'>-		parsed_opts-&gt;mb_optimize_scan = arg;</div><div class='del'>-	} else {</div><div class='del'>-		if (!args-&gt;from)</div><div class='del'>-			arg = 1;</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * At this point we should only be getting options requiring MOPT_SET,</div><div class='add'>+	 * or MOPT_CLEAR. Anything else is a bug</div><div class='add'>+	 */</div><div class='add'>+	if (m-&gt;token == Opt_err) {</div><div class='add'>+		ext4_msg(NULL, KERN_WARNING, "buggy handling of option %s",</div><div class='add'>+			 param-&gt;key);</div><div class='add'>+		WARN_ON(1);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	else {</div><div class='add'>+		unsigned int set = 0;</div><div class='add'>+</div><div class='add'>+		if ((param-&gt;type == fs_value_is_flag) ||</div><div class='add'>+		    result.uint_32 &gt; 0)</div><div class='add'>+			set = 1;</div><div class='add'>+</div><div class='ctx'> 		if (m-&gt;flags &amp; MOPT_CLEAR)</div><div class='del'>-			arg = !arg;</div><div class='add'>+			set = !set;</div><div class='ctx'> 		else if (unlikely(!(m-&gt;flags &amp; MOPT_SET))) {</div><div class='del'>-			ext4_msg(sb, KERN_WARNING,</div><div class='del'>-				 "buggy handling of option %s", opt);</div><div class='add'>+			ext4_msg(NULL, KERN_WARNING,</div><div class='add'>+				 "buggy handling of option %s",</div><div class='add'>+				 param-&gt;key);</div><div class='ctx'> 			WARN_ON(1);</div><div class='del'>-			return -1;</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (m-&gt;flags &amp; MOPT_2) {</div><div class='del'>-			if (arg != 0)</div><div class='del'>-				sbi-&gt;s_mount_opt2 |= m-&gt;mount_opt;</div><div class='add'>+			if (set != 0)</div><div class='add'>+				ctx_set_mount_opt2(ctx, m-&gt;mount_opt);</div><div class='ctx'> 			else</div><div class='del'>-				sbi-&gt;s_mount_opt2 &amp;= ~m-&gt;mount_opt;</div><div class='add'>+				ctx_clear_mount_opt2(ctx, m-&gt;mount_opt);</div><div class='ctx'> 		} else {</div><div class='del'>-			if (arg != 0)</div><div class='del'>-				sbi-&gt;s_mount_opt |= m-&gt;mount_opt;</div><div class='add'>+			if (set != 0)</div><div class='add'>+				ctx_set_mount_opt(ctx, m-&gt;mount_opt);</div><div class='ctx'> 			else</div><div class='del'>-				sbi-&gt;s_mount_opt &amp;= ~m-&gt;mount_opt;</div><div class='add'>+				ctx_clear_mount_opt(ctx, m-&gt;mount_opt);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	return 1;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int parse_options(char *options, struct super_block *sb,</div><div class='del'>-			 struct ext4_parsed_options *ret_opts,</div><div class='del'>-			 int is_remount)</div><div class='add'>+static int parse_options(struct fs_context *fc, char *options)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_sb_info __maybe_unused *sbi = EXT4_SB(sb);</div><div class='del'>-	char *p, __maybe_unused *usr_qf_name, __maybe_unused *grp_qf_name;</div><div class='del'>-	substring_t args[MAX_OPT_ARGS];</div><div class='del'>-	int token;</div><div class='add'>+	struct fs_parameter param;</div><div class='add'>+	int ret;</div><div class='add'>+	char *key;</div><div class='ctx'> </div><div class='ctx'> 	if (!options)</div><div class='del'>-		return 1;</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	while ((p = strsep(&amp;options, ",")) != NULL) {</div><div class='del'>-		if (!*p)</div><div class='del'>-			continue;</div><div class='del'>-		/*</div><div class='del'>-		 * Initialize args struct so we know whether arg was</div><div class='del'>-		 * found; some options take optional arguments.</div><div class='del'>-		 */</div><div class='del'>-		args[0].to = args[0].from = NULL;</div><div class='del'>-		token = match_token(p, tokens, args);</div><div class='del'>-		if (handle_mount_opt(sb, p, token, args, ret_opts,</div><div class='del'>-				     is_remount) &lt; 0)</div><div class='del'>-			return 0;</div><div class='add'>+	while ((key = strsep(&amp;options, ",")) != NULL) {</div><div class='add'>+		if (*key) {</div><div class='add'>+			size_t v_len = 0;</div><div class='add'>+			char *value = strchr(key, '=');</div><div class='add'>+</div><div class='add'>+			param.type = fs_value_is_flag;</div><div class='add'>+			param.string = NULL;</div><div class='add'>+</div><div class='add'>+			if (value) {</div><div class='add'>+				if (value == key)</div><div class='add'>+					continue;</div><div class='add'>+</div><div class='add'>+				*value++ = 0;</div><div class='add'>+				v_len = strlen(value);</div><div class='add'>+				param.string = kmemdup_nul(value, v_len,</div><div class='add'>+							   GFP_KERNEL);</div><div class='add'>+				if (!param.string)</div><div class='add'>+					return -ENOMEM;</div><div class='add'>+				param.type = fs_value_is_string;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			param.key = key;</div><div class='add'>+			param.size = v_len;</div><div class='add'>+</div><div class='add'>+			ret = ext4_parse_param(fc, &amp;param);</div><div class='add'>+			kfree(param.string);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				return ret;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = ext4_validate_options(fc);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int parse_apply_sb_mount_options(struct super_block *sb,</div><div class='add'>+					struct ext4_fs_context *m_ctx)</div><div class='add'>+{</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	char s_mount_opts[64];</div><div class='add'>+	struct ext4_fs_context *s_ctx = NULL;</div><div class='add'>+	struct fs_context *fc = NULL;</div><div class='add'>+	int ret = -ENOMEM;</div><div class='add'>+</div><div class='add'>+	if (!sbi-&gt;s_es-&gt;s_mount_opts[0])</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if (strscpy_pad(s_mount_opts, sbi-&gt;s_es-&gt;s_mount_opts) &lt; 0)</div><div class='add'>+		return -E2BIG;</div><div class='add'>+</div><div class='add'>+	fc = kzalloc(sizeof(struct fs_context), GFP_KERNEL);</div><div class='add'>+	if (!fc)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	s_ctx = kzalloc(sizeof(struct ext4_fs_context), GFP_KERNEL);</div><div class='add'>+	if (!s_ctx)</div><div class='add'>+		goto out_free;</div><div class='add'>+</div><div class='add'>+	fc-&gt;fs_private = s_ctx;</div><div class='add'>+	fc-&gt;s_fs_info = sbi;</div><div class='add'>+</div><div class='add'>+	ret = parse_options(fc, s_mount_opts);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto parse_failed;</div><div class='add'>+</div><div class='add'>+	ret = ext4_check_opt_consistency(fc, sb);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+parse_failed:</div><div class='add'>+		ext4_msg(sb, KERN_WARNING,</div><div class='add'>+			 "failed to parse options in superblock: %s",</div><div class='add'>+			 s_mount_opts);</div><div class='add'>+		ret = 0;</div><div class='add'>+		goto out_free;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	if (s_ctx-&gt;spec &amp; EXT4_SPEC_JOURNAL_DEV)</div><div class='add'>+		m_ctx-&gt;journal_devnum = s_ctx-&gt;journal_devnum;</div><div class='add'>+	if (s_ctx-&gt;spec &amp; EXT4_SPEC_JOURNAL_IOPRIO)</div><div class='add'>+		m_ctx-&gt;journal_ioprio = s_ctx-&gt;journal_ioprio;</div><div class='add'>+</div><div class='add'>+	ext4_apply_options(fc, sb);</div><div class='add'>+	ret = 0;</div><div class='add'>+</div><div class='add'>+out_free:</div><div class='add'>+	ext4_fc_free(fc);</div><div class='add'>+	kfree(fc);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void ext4_apply_quota_options(struct fs_context *fc,</div><div class='add'>+				     struct super_block *sb)</div><div class='add'>+{</div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='add'>+	bool quota_feature = ext4_has_feature_quota(sb);</div><div class='add'>+	struct ext4_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	char *qname;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	if (quota_feature)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (ctx-&gt;spec &amp; EXT4_SPEC_JQUOTA) {</div><div class='add'>+		for (i = 0; i &lt; EXT4_MAXQUOTAS; i++) {</div><div class='add'>+			if (!(ctx-&gt;qname_spec &amp; (1 &lt;&lt; i)))</div><div class='add'>+				continue;</div><div class='add'>+</div><div class='add'>+			qname = ctx-&gt;s_qf_names[i]; /* May be NULL */</div><div class='add'>+			if (qname)</div><div class='add'>+				set_opt(sb, QUOTA);</div><div class='add'>+			ctx-&gt;s_qf_names[i] = NULL;</div><div class='add'>+			qname = rcu_replace_pointer(sbi-&gt;s_qf_names[i], qname,</div><div class='add'>+						lockdep_is_held(&amp;sb-&gt;s_umount));</div><div class='add'>+			if (qname)</div><div class='add'>+				kfree_rcu_mightsleep(qname);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (ctx-&gt;spec &amp; EXT4_SPEC_JQFMT)</div><div class='add'>+		sbi-&gt;s_jquota_fmt = ctx-&gt;s_jquota_fmt;</div><div class='add'>+#endif</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Check quota settings consistency.</div><div class='add'>+ */</div><div class='add'>+static int ext4_check_quota_consistency(struct fs_context *fc,</div><div class='add'>+					struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+#ifdef CONFIG_QUOTA</div><div class='add'>+	struct ext4_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	bool quota_feature = ext4_has_feature_quota(sb);</div><div class='add'>+	bool quota_loaded = sb_any_quota_loaded(sb);</div><div class='add'>+	bool usr_qf_name, grp_qf_name, usrquota, grpquota;</div><div class='add'>+	int quota_flags, i;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We do the test below only for project quotas. 'usrquota' and</div><div class='ctx'> 	 * 'grpquota' mount options are allowed even without quota feature</div><div class='ctx'> 	 * to support legacy quotas in quota files.</div><div class='ctx'> 	 */</div><div class='del'>-	if (test_opt(sb, PRJQUOTA) &amp;&amp; !ext4_has_feature_project(sb)) {</div><div class='del'>-		ext4_msg(sb, KERN_ERR, "Project quota feature not enabled. "</div><div class='add'>+	if (ctx_test_mount_opt(ctx, EXT4_MOUNT_PRJQUOTA) &amp;&amp;</div><div class='add'>+	    !ext4_has_feature_project(sb)) {</div><div class='add'>+		ext4_msg(NULL, KERN_ERR, "Project quota feature not enabled. "</div><div class='ctx'> 			 "Cannot enable project quota enforcement.");</div><div class='del'>-		return 0;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-	usr_qf_name = get_qf_name(sb, sbi, USRQUOTA);</div><div class='del'>-	grp_qf_name = get_qf_name(sb, sbi, GRPQUOTA);</div><div class='del'>-	if (usr_qf_name || grp_qf_name) {</div><div class='del'>-		if (test_opt(sb, USRQUOTA) &amp;&amp; usr_qf_name)</div><div class='del'>-			clear_opt(sb, USRQUOTA);</div><div class='ctx'> </div><div class='del'>-		if (test_opt(sb, GRPQUOTA) &amp;&amp; grp_qf_name)</div><div class='del'>-			clear_opt(sb, GRPQUOTA);</div><div class='add'>+	quota_flags = EXT4_MOUNT_QUOTA | EXT4_MOUNT_USRQUOTA |</div><div class='add'>+		      EXT4_MOUNT_GRPQUOTA | EXT4_MOUNT_PRJQUOTA;</div><div class='add'>+	if (quota_loaded &amp;&amp;</div><div class='add'>+	    ctx-&gt;mask_s_mount_opt &amp; quota_flags &amp;&amp;</div><div class='add'>+	    !ctx_test_mount_opt(ctx, quota_flags))</div><div class='add'>+		goto err_quota_change;</div><div class='add'>+</div><div class='add'>+	if (ctx-&gt;spec &amp; EXT4_SPEC_JQUOTA) {</div><div class='ctx'> </div><div class='del'>-		if (test_opt(sb, GRPQUOTA) || test_opt(sb, USRQUOTA)) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR, "old and new quota "</div><div class='del'>-					"format mixing");</div><div class='add'>+		for (i = 0; i &lt; EXT4_MAXQUOTAS; i++) {</div><div class='add'>+			if (!(ctx-&gt;qname_spec &amp; (1 &lt;&lt; i)))</div><div class='add'>+				continue;</div><div class='add'>+</div><div class='add'>+			if (quota_loaded &amp;&amp;</div><div class='add'>+			    !!sbi-&gt;s_qf_names[i] != !!ctx-&gt;s_qf_names[i])</div><div class='add'>+				goto err_jquota_change;</div><div class='add'>+</div><div class='add'>+			if (sbi-&gt;s_qf_names[i] &amp;&amp; ctx-&gt;s_qf_names[i] &amp;&amp;</div><div class='add'>+			    strcmp(get_qf_name(sb, sbi, i),</div><div class='add'>+				   ctx-&gt;s_qf_names[i]) != 0)</div><div class='add'>+				goto err_jquota_specified;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (quota_feature) {</div><div class='add'>+			ext4_msg(NULL, KERN_INFO,</div><div class='add'>+				 "Journaled quota options ignored when "</div><div class='add'>+				 "QUOTA feature is enabled");</div><div class='ctx'> 			return 0;</div><div class='ctx'> 		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		if (!sbi-&gt;s_jquota_fmt) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR, "journaled quota format "</div><div class='del'>-					"not specified");</div><div class='add'>+	if (ctx-&gt;spec &amp; EXT4_SPEC_JQFMT) {</div><div class='add'>+		if (sbi-&gt;s_jquota_fmt != ctx-&gt;s_jquota_fmt &amp;&amp; quota_loaded)</div><div class='add'>+			goto err_jquota_change;</div><div class='add'>+		if (quota_feature) {</div><div class='add'>+			ext4_msg(NULL, KERN_INFO, "Quota format mount options "</div><div class='add'>+				 "ignored when QUOTA feature is enabled");</div><div class='add'>+			return 0;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Make sure we don't mix old and new quota format */</div><div class='add'>+	usr_qf_name = (get_qf_name(sb, sbi, USRQUOTA) ||</div><div class='add'>+		       ctx-&gt;s_qf_names[USRQUOTA]);</div><div class='add'>+	grp_qf_name = (get_qf_name(sb, sbi, GRPQUOTA) ||</div><div class='add'>+		       ctx-&gt;s_qf_names[GRPQUOTA]);</div><div class='add'>+</div><div class='add'>+	usrquota = (ctx_test_mount_opt(ctx, EXT4_MOUNT_USRQUOTA) ||</div><div class='add'>+		    test_opt(sb, USRQUOTA));</div><div class='add'>+</div><div class='add'>+	grpquota = (ctx_test_mount_opt(ctx, EXT4_MOUNT_GRPQUOTA) ||</div><div class='add'>+		    test_opt(sb, GRPQUOTA));</div><div class='add'>+</div><div class='add'>+	if (usr_qf_name) {</div><div class='add'>+		ctx_clear_mount_opt(ctx, EXT4_MOUNT_USRQUOTA);</div><div class='add'>+		usrquota = false;</div><div class='add'>+	}</div><div class='add'>+	if (grp_qf_name) {</div><div class='add'>+		ctx_clear_mount_opt(ctx, EXT4_MOUNT_GRPQUOTA);</div><div class='add'>+		grpquota = false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (usr_qf_name || grp_qf_name) {</div><div class='add'>+		if (usrquota || grpquota) {</div><div class='add'>+			ext4_msg(NULL, KERN_ERR, "old and new quota "</div><div class='add'>+				 "format mixing");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (!(ctx-&gt;spec &amp; EXT4_SPEC_JQFMT || sbi-&gt;s_jquota_fmt)) {</div><div class='add'>+			ext4_msg(NULL, KERN_ERR, "journaled quota format "</div><div class='add'>+				 "not specified");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+err_quota_change:</div><div class='add'>+	ext4_msg(NULL, KERN_ERR,</div><div class='add'>+		 "Cannot change quota options when quota turned on");</div><div class='add'>+	return -EINVAL;</div><div class='add'>+err_jquota_change:</div><div class='add'>+	ext4_msg(NULL, KERN_ERR, "Cannot change journaled quota "</div><div class='add'>+		 "options when quota turned on");</div><div class='add'>+	return -EINVAL;</div><div class='add'>+err_jquota_specified:</div><div class='add'>+	ext4_msg(NULL, KERN_ERR, "%s quota file already specified",</div><div class='add'>+		 QTYPE2NAME(i));</div><div class='add'>+	return -EINVAL;</div><div class='add'>+#else</div><div class='add'>+	return 0;</div><div class='add'>+#endif</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ext4_check_test_dummy_encryption(const struct fs_context *fc,</div><div class='add'>+					    struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	const struct ext4_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	const struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+</div><div class='add'>+	if (!fscrypt_is_dummy_policy_set(&amp;ctx-&gt;dummy_enc_policy))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if (!ext4_has_feature_encrypt(sb)) {</div><div class='add'>+		ext4_msg(NULL, KERN_WARNING,</div><div class='add'>+			 "test_dummy_encryption requires encrypt feature");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+	/*</div><div class='add'>+	 * This mount option is just for testing, and it's not worthwhile to</div><div class='add'>+	 * implement the extra complexity (e.g. RCU protection) that would be</div><div class='add'>+	 * needed to allow it to be set or changed during remount.  We do allow</div><div class='add'>+	 * it to be specified during remount, but only if there is no change.</div><div class='add'>+	 */</div><div class='add'>+	if (fc-&gt;purpose == FS_CONTEXT_FOR_RECONFIGURE) {</div><div class='add'>+		if (fscrypt_dummy_policies_equal(&amp;sbi-&gt;s_dummy_enc_policy,</div><div class='add'>+						 &amp;ctx-&gt;dummy_enc_policy))</div><div class='add'>+			return 0;</div><div class='add'>+		ext4_msg(NULL, KERN_WARNING,</div><div class='add'>+			 "Can't set or change test_dummy_encryption on remount");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+	/* Also make sure s_mount_opts didn't contain a conflicting value. */</div><div class='add'>+	if (fscrypt_is_dummy_policy_set(&amp;sbi-&gt;s_dummy_enc_policy)) {</div><div class='add'>+		if (fscrypt_dummy_policies_equal(&amp;sbi-&gt;s_dummy_enc_policy,</div><div class='add'>+						 &amp;ctx-&gt;dummy_enc_policy))</div><div class='ctx'> 			return 0;</div><div class='add'>+		ext4_msg(NULL, KERN_WARNING,</div><div class='add'>+			 "Conflicting test_dummy_encryption options");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void ext4_apply_test_dummy_encryption(struct ext4_fs_context *ctx,</div><div class='add'>+					     struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	if (!fscrypt_is_dummy_policy_set(&amp;ctx-&gt;dummy_enc_policy) ||</div><div class='add'>+	    /* if already set, it was already verified to be the same */</div><div class='add'>+	    fscrypt_is_dummy_policy_set(&amp;EXT4_SB(sb)-&gt;s_dummy_enc_policy))</div><div class='add'>+		return;</div><div class='add'>+	EXT4_SB(sb)-&gt;s_dummy_enc_policy = ctx-&gt;dummy_enc_policy;</div><div class='add'>+	memset(&amp;ctx-&gt;dummy_enc_policy, 0, sizeof(ctx-&gt;dummy_enc_policy));</div><div class='add'>+	ext4_msg(sb, KERN_WARNING, "Test dummy encryption mode enabled");</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ext4_check_opt_consistency(struct fs_context *fc,</div><div class='add'>+				      struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct ext4_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct ext4_sb_info *sbi = fc-&gt;s_fs_info;</div><div class='add'>+	int is_remount = fc-&gt;purpose == FS_CONTEXT_FOR_RECONFIGURE;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	if ((ctx-&gt;opt_flags &amp; MOPT_NO_EXT2) &amp;&amp; IS_EXT2_SB(sb)) {</div><div class='add'>+		ext4_msg(NULL, KERN_ERR,</div><div class='add'>+			 "Mount option(s) incompatible with ext2");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+	if ((ctx-&gt;opt_flags &amp; MOPT_NO_EXT3) &amp;&amp; IS_EXT3_SB(sb)) {</div><div class='add'>+		ext4_msg(NULL, KERN_ERR,</div><div class='add'>+			 "Mount option(s) incompatible with ext3");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (ctx-&gt;s_want_extra_isize &gt;</div><div class='add'>+	    (sbi-&gt;s_inode_size - EXT4_GOOD_OLD_INODE_SIZE)) {</div><div class='add'>+		ext4_msg(NULL, KERN_ERR,</div><div class='add'>+			 "Invalid want_extra_isize %d",</div><div class='add'>+			 ctx-&gt;s_want_extra_isize);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	err = ext4_check_test_dummy_encryption(fc, sb);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	if ((ctx-&gt;spec &amp; EXT4_SPEC_DATAJ) &amp;&amp; is_remount) {</div><div class='add'>+		if (!sbi-&gt;s_journal) {</div><div class='add'>+			ext4_msg(NULL, KERN_WARNING,</div><div class='add'>+				 "Remounting file system with no journal "</div><div class='add'>+				 "so ignoring journalled data option");</div><div class='add'>+			ctx_clear_mount_opt(ctx, EXT4_MOUNT_DATA_FLAGS);</div><div class='add'>+		} else if (ctx_test_mount_opt(ctx, EXT4_MOUNT_DATA_FLAGS) !=</div><div class='add'>+			   test_opt(sb, DATA_FLAGS)) {</div><div class='add'>+			ext4_msg(NULL, KERN_ERR, "Cannot change data mode "</div><div class='add'>+				 "on remount");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (is_remount) {</div><div class='add'>+		if (!sbi-&gt;s_journal &amp;&amp;</div><div class='add'>+		    ctx_test_mount_opt(ctx, EXT4_MOUNT_DATA_ERR_ABORT)) {</div><div class='add'>+			ext4_msg(NULL, KERN_WARNING,</div><div class='add'>+				 "Remounting fs w/o journal so ignoring data_err option");</div><div class='add'>+			ctx_clear_mount_opt(ctx, EXT4_MOUNT_DATA_ERR_ABORT);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (ctx_test_mount_opt(ctx, EXT4_MOUNT_DAX_ALWAYS) &amp;&amp;</div><div class='add'>+		    (test_opt(sb, DATA_FLAGS) == EXT4_MOUNT_JOURNAL_DATA)) {</div><div class='add'>+			ext4_msg(NULL, KERN_ERR, "can't mount with "</div><div class='add'>+				 "both data=journal and dax");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (ctx_test_mount_opt(ctx, EXT4_MOUNT_DAX_ALWAYS) &amp;&amp;</div><div class='add'>+		    (!(sbi-&gt;s_mount_opt &amp; EXT4_MOUNT_DAX_ALWAYS) ||</div><div class='add'>+		     (sbi-&gt;s_mount_opt2 &amp; EXT4_MOUNT2_DAX_NEVER))) {</div><div class='add'>+fail_dax_change_remount:</div><div class='add'>+			ext4_msg(NULL, KERN_ERR, "can't change "</div><div class='add'>+				 "dax mount option while remounting");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		} else if (ctx_test_mount_opt2(ctx, EXT4_MOUNT2_DAX_NEVER) &amp;&amp;</div><div class='add'>+			 (!(sbi-&gt;s_mount_opt2 &amp; EXT4_MOUNT2_DAX_NEVER) ||</div><div class='add'>+			  (sbi-&gt;s_mount_opt &amp; EXT4_MOUNT_DAX_ALWAYS))) {</div><div class='add'>+			goto fail_dax_change_remount;</div><div class='add'>+		} else if (ctx_test_mount_opt2(ctx, EXT4_MOUNT2_DAX_INODE) &amp;&amp;</div><div class='add'>+			   ((sbi-&gt;s_mount_opt &amp; EXT4_MOUNT_DAX_ALWAYS) ||</div><div class='add'>+			    (sbi-&gt;s_mount_opt2 &amp; EXT4_MOUNT2_DAX_NEVER) ||</div><div class='add'>+			    !(sbi-&gt;s_mount_opt2 &amp; EXT4_MOUNT2_DAX_INODE))) {</div><div class='add'>+			goto fail_dax_change_remount;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	return ext4_check_quota_consistency(fc, sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void ext4_apply_options(struct fs_context *fc, struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct ext4_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct ext4_sb_info *sbi = fc-&gt;s_fs_info;</div><div class='add'>+</div><div class='add'>+	sbi-&gt;s_mount_opt &amp;= ~ctx-&gt;mask_s_mount_opt;</div><div class='add'>+	sbi-&gt;s_mount_opt |= ctx-&gt;vals_s_mount_opt;</div><div class='add'>+	sbi-&gt;s_mount_opt2 &amp;= ~ctx-&gt;mask_s_mount_opt2;</div><div class='add'>+	sbi-&gt;s_mount_opt2 |= ctx-&gt;vals_s_mount_opt2;</div><div class='add'>+	sb-&gt;s_flags &amp;= ~ctx-&gt;mask_s_flags;</div><div class='add'>+	sb-&gt;s_flags |= ctx-&gt;vals_s_flags;</div><div class='add'>+</div><div class='add'>+#define APPLY(X) ({ if (ctx-&gt;spec &amp; EXT4_SPEC_##X) sbi-&gt;X = ctx-&gt;X; })</div><div class='add'>+	APPLY(s_commit_interval);</div><div class='add'>+	APPLY(s_stripe);</div><div class='add'>+	APPLY(s_max_batch_time);</div><div class='add'>+	APPLY(s_min_batch_time);</div><div class='add'>+	APPLY(s_want_extra_isize);</div><div class='add'>+	APPLY(s_inode_readahead_blks);</div><div class='add'>+	APPLY(s_max_dir_size_kb);</div><div class='add'>+	APPLY(s_li_wait_mult);</div><div class='add'>+	APPLY(s_resgid);</div><div class='add'>+	APPLY(s_resuid);</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_EXT4_DEBUG</div><div class='add'>+	APPLY(s_fc_debug_max_replay);</div><div class='ctx'> #endif</div><div class='del'>-	if (test_opt(sb, DIOREAD_NOLOCK)) {</div><div class='del'>-		int blocksize =</div><div class='del'>-			BLOCK_SIZE &lt;&lt; le32_to_cpu(sbi-&gt;s_es-&gt;s_log_block_size);</div><div class='del'>-		if (blocksize &lt; PAGE_SIZE)</div><div class='del'>-			ext4_msg(sb, KERN_WARNING, "Warning: mounting with an "</div><div class='del'>-				 "experimental mount option 'dioread_nolock' "</div><div class='del'>-				 "for blocksize &lt; PAGE_SIZE");</div><div class='add'>+</div><div class='add'>+	ext4_apply_quota_options(fc, sb);</div><div class='add'>+	ext4_apply_test_dummy_encryption(ctx, sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+</div><div class='add'>+static int ext4_validate_options(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+#ifdef CONFIG_QUOTA</div><div class='add'>+	struct ext4_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	char *usr_qf_name, *grp_qf_name;</div><div class='add'>+</div><div class='add'>+	usr_qf_name = ctx-&gt;s_qf_names[USRQUOTA];</div><div class='add'>+	grp_qf_name = ctx-&gt;s_qf_names[GRPQUOTA];</div><div class='add'>+</div><div class='add'>+	if (usr_qf_name || grp_qf_name) {</div><div class='add'>+		if (ctx_test_mount_opt(ctx, EXT4_MOUNT_USRQUOTA) &amp;&amp; usr_qf_name)</div><div class='add'>+			ctx_clear_mount_opt(ctx, EXT4_MOUNT_USRQUOTA);</div><div class='add'>+</div><div class='add'>+		if (ctx_test_mount_opt(ctx, EXT4_MOUNT_GRPQUOTA) &amp;&amp; grp_qf_name)</div><div class='add'>+			ctx_clear_mount_opt(ctx, EXT4_MOUNT_GRPQUOTA);</div><div class='add'>+</div><div class='add'>+		if (ctx_test_mount_opt(ctx, EXT4_MOUNT_USRQUOTA) ||</div><div class='add'>+		    ctx_test_mount_opt(ctx, EXT4_MOUNT_GRPQUOTA)) {</div><div class='add'>+			ext4_msg(NULL, KERN_ERR, "old and new quota "</div><div class='add'>+				 "format mixing");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='add'>+#endif</div><div class='ctx'> 	return 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2533,12 +2913,12 @@ static inline void ext4_show_quota_options(struct seq_file *seq,</div><div class='ctx'> </div><div class='ctx'> static const char *token2str(int token)</div><div class='ctx'> {</div><div class='del'>-	const struct match_token *t;</div><div class='add'>+	const struct fs_parameter_spec *spec;</div><div class='ctx'> </div><div class='del'>-	for (t = tokens; t-&gt;token != Opt_err; t++)</div><div class='del'>-		if (t-&gt;token == token &amp;&amp; !strchr(t-&gt;pattern, '='))</div><div class='add'>+	for (spec = ext4_param_specs; spec-&gt;name != NULL; spec++)</div><div class='add'>+		if (spec-&gt;opt == token &amp;&amp; !spec-&gt;type)</div><div class='ctx'> 			break;</div><div class='del'>-	return t-&gt;pattern;</div><div class='add'>+	return spec-&gt;name;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2551,7 +2931,7 @@ static int _ext4_show_options(struct seq_file *seq, struct super_block *sb,</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> 	struct ext4_super_block *es = sbi-&gt;s_es;</div><div class='del'>-	int def_errors, def_mount_opt = sbi-&gt;s_def_mount_opt;</div><div class='add'>+	int def_errors;</div><div class='ctx'> 	const struct mount_opts *m;</div><div class='ctx'> 	char sep = nodefs ? '\n' : ',';</div><div class='ctx'> </div><div class='hunk'>@@ -2563,24 +2943,37 @@ static int _ext4_show_options(struct seq_file *seq, struct super_block *sb,</div><div class='ctx'> </div><div class='ctx'> 	for (m = ext4_mount_opts; m-&gt;token != Opt_err; m++) {</div><div class='ctx'> 		int want_set = m-&gt;flags &amp; MOPT_SET;</div><div class='add'>+		int opt_2 = m-&gt;flags &amp; MOPT_2;</div><div class='add'>+		unsigned int mount_opt, def_mount_opt;</div><div class='add'>+</div><div class='ctx'> 		if (((m-&gt;flags &amp; (MOPT_SET|MOPT_CLEAR)) == 0) ||</div><div class='del'>-		    (m-&gt;flags &amp; MOPT_CLEAR_ERR) || m-&gt;flags &amp; MOPT_SKIP)</div><div class='add'>+		    m-&gt;flags &amp; MOPT_SKIP)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		if (opt_2) {</div><div class='add'>+			mount_opt = sbi-&gt;s_mount_opt2;</div><div class='add'>+			def_mount_opt = sbi-&gt;s_def_mount_opt2;</div><div class='add'>+		} else {</div><div class='add'>+			mount_opt = sbi-&gt;s_mount_opt;</div><div class='add'>+			def_mount_opt = sbi-&gt;s_def_mount_opt;</div><div class='add'>+		}</div><div class='add'>+		/* skip if same as the default */</div><div class='add'>+		if (!nodefs &amp;&amp; !(m-&gt;mount_opt &amp; (mount_opt ^ def_mount_opt)))</div><div class='ctx'> 			continue;</div><div class='del'>-		if (!nodefs &amp;&amp; !(m-&gt;mount_opt &amp; (sbi-&gt;s_mount_opt ^ def_mount_opt)))</div><div class='del'>-			continue; /* skip if same as the default */</div><div class='add'>+		/* select Opt_noFoo vs Opt_Foo */</div><div class='ctx'> 		if ((want_set &amp;&amp;</div><div class='del'>-		     (sbi-&gt;s_mount_opt &amp; m-&gt;mount_opt) != m-&gt;mount_opt) ||</div><div class='del'>-		    (!want_set &amp;&amp; (sbi-&gt;s_mount_opt &amp; m-&gt;mount_opt)))</div><div class='del'>-			continue; /* select Opt_noFoo vs Opt_Foo */</div><div class='add'>+		     (mount_opt &amp; m-&gt;mount_opt) != m-&gt;mount_opt) ||</div><div class='add'>+		    (!want_set &amp;&amp; (mount_opt &amp; m-&gt;mount_opt)))</div><div class='add'>+			continue;</div><div class='ctx'> 		SEQ_OPTS_PRINT("%s", token2str(m-&gt;token));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (nodefs || !uid_eq(sbi-&gt;s_resuid, make_kuid(&amp;init_user_ns, EXT4_DEF_RESUID)) ||</div><div class='del'>-	    le16_to_cpu(es-&gt;s_def_resuid) != EXT4_DEF_RESUID)</div><div class='add'>+	    ext4_get_resuid(es) != EXT4_DEF_RESUID)</div><div class='ctx'> 		SEQ_OPTS_PRINT("resuid=%u",</div><div class='ctx'> 				from_kuid_munged(&amp;init_user_ns, sbi-&gt;s_resuid));</div><div class='ctx'> 	if (nodefs || !gid_eq(sbi-&gt;s_resgid, make_kgid(&amp;init_user_ns, EXT4_DEF_RESGID)) ||</div><div class='del'>-	    le16_to_cpu(es-&gt;s_def_resgid) != EXT4_DEF_RESGID)</div><div class='add'>+	    ext4_get_resgid(es) != EXT4_DEF_RESGID)</div><div class='ctx'> 		SEQ_OPTS_PRINT("resgid=%u",</div><div class='ctx'> 				from_kgid_munged(&amp;init_user_ns, sbi-&gt;s_resgid));</div><div class='ctx'> 	def_errors = nodefs ? -1 : le16_to_cpu(es-&gt;s_errors);</div><div class='hunk'>@@ -2596,12 +2989,12 @@ static int _ext4_show_options(struct seq_file *seq, struct super_block *sb,</div><div class='ctx'> 		SEQ_OPTS_PRINT("min_batch_time=%u", sbi-&gt;s_min_batch_time);</div><div class='ctx'> 	if (nodefs || sbi-&gt;s_max_batch_time != EXT4_DEF_MAX_BATCH_TIME)</div><div class='ctx'> 		SEQ_OPTS_PRINT("max_batch_time=%u", sbi-&gt;s_max_batch_time);</div><div class='del'>-	if (sb-&gt;s_flags &amp; SB_I_VERSION)</div><div class='add'>+	if (nodefs &amp;&amp; sb-&gt;s_flags &amp; SB_I_VERSION)</div><div class='ctx'> 		SEQ_OPTS_PUTS("i_version");</div><div class='ctx'> 	if (nodefs || sbi-&gt;s_stripe)</div><div class='ctx'> 		SEQ_OPTS_PRINT("stripe=%lu", sbi-&gt;s_stripe);</div><div class='ctx'> 	if (nodefs || EXT4_MOUNT_DATA_FLAGS &amp;</div><div class='del'>-			(sbi-&gt;s_mount_opt ^ def_mount_opt)) {</div><div class='add'>+			(sbi-&gt;s_mount_opt ^ sbi-&gt;s_def_mount_opt)) {</div><div class='ctx'> 		if (test_opt(sb, DATA_FLAGS) == EXT4_MOUNT_JOURNAL_DATA)</div><div class='ctx'> 			SEQ_OPTS_PUTS("data=journal");</div><div class='ctx'> 		else if (test_opt(sb, DATA_FLAGS) == EXT4_MOUNT_ORDERED_DATA)</div><div class='hunk'>@@ -2637,6 +3030,24 @@ static int _ext4_show_options(struct seq_file *seq, struct super_block *sb,</div><div class='ctx'> 	} else if (test_opt2(sb, DAX_INODE)) {</div><div class='ctx'> 		SEQ_OPTS_PUTS("dax=inode");</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	if (sbi-&gt;s_groups_count &gt;= MB_DEFAULT_LINEAR_SCAN_THRESHOLD &amp;&amp;</div><div class='add'>+			!test_opt2(sb, MB_OPTIMIZE_SCAN)) {</div><div class='add'>+		SEQ_OPTS_PUTS("mb_optimize_scan=0");</div><div class='add'>+	} else if (sbi-&gt;s_groups_count &lt; MB_DEFAULT_LINEAR_SCAN_THRESHOLD &amp;&amp;</div><div class='add'>+			test_opt2(sb, MB_OPTIMIZE_SCAN)) {</div><div class='add'>+		SEQ_OPTS_PUTS("mb_optimize_scan=1");</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (nodefs &amp;&amp; !test_opt(sb, NO_PREFETCH_BLOCK_BITMAPS))</div><div class='add'>+		SEQ_OPTS_PUTS("prefetch_block_bitmaps");</div><div class='add'>+</div><div class='add'>+	if (ext4_emergency_ro(sb))</div><div class='add'>+		SEQ_OPTS_PUTS("emergency_ro");</div><div class='add'>+</div><div class='add'>+	if (ext4_forced_shutdown(sb))</div><div class='add'>+		SEQ_OPTS_PUTS("shutdown");</div><div class='add'>+</div><div class='ctx'> 	ext4_show_quota_options(seq, sb);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -2653,7 +3064,7 @@ int ext4_seq_options_show(struct seq_file *seq, void *offset)</div><div class='ctx'> </div><div class='ctx'> 	seq_puts(seq, sb_rdonly(sb) ? "ro" : "rw");</div><div class='ctx'> 	rc = _ext4_show_options(seq, sb, 1);</div><div class='del'>-	seq_puts(seq, "\n");</div><div class='add'>+	seq_putc(seq, '\n');</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2712,8 +3123,6 @@ done:</div><div class='ctx'> 			EXT4_BLOCKS_PER_GROUP(sb),</div><div class='ctx'> 			EXT4_INODES_PER_GROUP(sb),</div><div class='ctx'> 			sbi-&gt;s_mount_opt, sbi-&gt;s_mount_opt2);</div><div class='del'>-</div><div class='del'>-	cleancache_init_fs(sb);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2806,19 +3215,19 @@ static __le16 ext4_group_desc_csum(struct super_block *sb, __u32 block_group,</div><div class='ctx'> 	__le32 le_group = cpu_to_le32(block_group);</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> </div><div class='del'>-	if (ext4_has_metadata_csum(sbi-&gt;s_sb)) {</div><div class='add'>+	if (ext4_has_feature_metadata_csum(sbi-&gt;s_sb)) {</div><div class='ctx'> 		/* Use new metadata_csum algorithm */</div><div class='ctx'> 		__u32 csum32;</div><div class='ctx'> 		__u16 dummy_csum = 0;</div><div class='ctx'> </div><div class='del'>-		csum32 = ext4_chksum(sbi, sbi-&gt;s_csum_seed, (__u8 *)&amp;le_group,</div><div class='add'>+		csum32 = ext4_chksum(sbi-&gt;s_csum_seed, (__u8 *)&amp;le_group,</div><div class='ctx'> 				     sizeof(le_group));</div><div class='del'>-		csum32 = ext4_chksum(sbi, csum32, (__u8 *)gdp, offset);</div><div class='del'>-		csum32 = ext4_chksum(sbi, csum32, (__u8 *)&amp;dummy_csum,</div><div class='add'>+		csum32 = ext4_chksum(csum32, (__u8 *)gdp, offset);</div><div class='add'>+		csum32 = ext4_chksum(csum32, (__u8 *)&amp;dummy_csum,</div><div class='ctx'> 				     sizeof(dummy_csum));</div><div class='ctx'> 		offset += sizeof(dummy_csum);</div><div class='ctx'> 		if (offset &lt; sbi-&gt;s_desc_size)</div><div class='del'>-			csum32 = ext4_chksum(sbi, csum32, (__u8 *)gdp + offset,</div><div class='add'>+			csum32 = ext4_chksum(csum32, (__u8 *)gdp + offset,</div><div class='ctx'> 					     sbi-&gt;s_desc_size - offset);</div><div class='ctx'> </div><div class='ctx'> 		crc = csum32 &amp; 0xFFFF;</div><div class='hunk'>@@ -2834,11 +3243,9 @@ static __le16 ext4_group_desc_csum(struct super_block *sb, __u32 block_group,</div><div class='ctx'> 	crc = crc16(crc, (__u8 *)gdp, offset);</div><div class='ctx'> 	offset += sizeof(gdp-&gt;bg_checksum); /* skip checksum */</div><div class='ctx'> 	/* for checksum of struct ext4_group_desc do the rest...*/</div><div class='del'>-	if (ext4_has_feature_64bit(sb) &amp;&amp;</div><div class='del'>-	    offset &lt; le16_to_cpu(sbi-&gt;s_es-&gt;s_desc_size))</div><div class='add'>+	if (ext4_has_feature_64bit(sb) &amp;&amp; offset &lt; sbi-&gt;s_desc_size)</div><div class='ctx'> 		crc = crc16(crc, (__u8 *)gdp + offset,</div><div class='del'>-			    le16_to_cpu(sbi-&gt;s_es-&gt;s_desc_size) -</div><div class='del'>-				offset);</div><div class='add'>+			    sbi-&gt;s_desc_size - offset);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	return cpu_to_le16(crc);</div><div class='hunk'>@@ -3034,8 +3441,9 @@ static loff_t ext4_max_size(int blkbits, int has_huge_files)</div><div class='ctx'>  */</div><div class='ctx'> static loff_t ext4_max_bitmap_size(int bits, int has_huge_files)</div><div class='ctx'> {</div><div class='del'>-	unsigned long long upper_limit, res = EXT4_NDIR_BLOCKS;</div><div class='add'>+	loff_t upper_limit, res = EXT4_NDIR_BLOCKS;</div><div class='ctx'> 	int meta_blocks;</div><div class='add'>+	unsigned int ppb = 1 &lt;&lt; (bits - 2);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * This is calculated to be the largest file size for a dense, block</div><div class='hunk'>@@ -3067,27 +3475,42 @@ static loff_t ext4_max_bitmap_size(int bits, int has_huge_files)</div><div class='ctx'> </div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/* Compute how many blocks we can address by block tree */</div><div class='add'>+	res += ppb;</div><div class='add'>+	res += ppb * ppb;</div><div class='add'>+	res += ((loff_t)ppb) * ppb * ppb;</div><div class='add'>+	/* Compute how many metadata blocks are needed */</div><div class='add'>+	meta_blocks = 1;</div><div class='add'>+	meta_blocks += 1 + ppb;</div><div class='add'>+	meta_blocks += 1 + ppb + ppb * ppb;</div><div class='add'>+	/* Does block tree limit file size? */</div><div class='add'>+	if (res + meta_blocks &lt;= upper_limit)</div><div class='add'>+		goto check_lfs;</div><div class='add'>+</div><div class='add'>+	res = upper_limit;</div><div class='add'>+	/* How many metadata blocks are needed for addressing upper_limit? */</div><div class='add'>+	upper_limit -= EXT4_NDIR_BLOCKS;</div><div class='ctx'> 	/* indirect blocks */</div><div class='ctx'> 	meta_blocks = 1;</div><div class='add'>+	upper_limit -= ppb;</div><div class='ctx'> 	/* double indirect blocks */</div><div class='del'>-	meta_blocks += 1 + (1LL &lt;&lt; (bits-2));</div><div class='del'>-	/* tripple indirect blocks */</div><div class='del'>-	meta_blocks += 1 + (1LL &lt;&lt; (bits-2)) + (1LL &lt;&lt; (2*(bits-2)));</div><div class='del'>-</div><div class='del'>-	upper_limit -= meta_blocks;</div><div class='del'>-	upper_limit &lt;&lt;= bits;</div><div class='del'>-</div><div class='del'>-	res += 1LL &lt;&lt; (bits-2);</div><div class='del'>-	res += 1LL &lt;&lt; (2*(bits-2));</div><div class='del'>-	res += 1LL &lt;&lt; (3*(bits-2));</div><div class='add'>+	if (upper_limit &lt; ppb * ppb) {</div><div class='add'>+		meta_blocks += 1 + DIV_ROUND_UP_ULL(upper_limit, ppb);</div><div class='add'>+		res -= meta_blocks;</div><div class='add'>+		goto check_lfs;</div><div class='add'>+	}</div><div class='add'>+	meta_blocks += 1 + ppb;</div><div class='add'>+	upper_limit -= ppb * ppb;</div><div class='add'>+	/* tripple indirect blocks for the rest */</div><div class='add'>+	meta_blocks += 1 + DIV_ROUND_UP_ULL(upper_limit, ppb) +</div><div class='add'>+		DIV_ROUND_UP_ULL(upper_limit, ppb*ppb);</div><div class='add'>+	res -= meta_blocks;</div><div class='add'>+check_lfs:</div><div class='ctx'> 	res &lt;&lt;= bits;</div><div class='del'>-	if (res &gt; upper_limit)</div><div class='del'>-		res = upper_limit;</div><div class='del'>-</div><div class='ctx'> 	if (res &gt; MAX_LFS_FILESIZE)</div><div class='ctx'> 		res = MAX_LFS_FILESIZE;</div><div class='ctx'> </div><div class='del'>-	return (loff_t)res;</div><div class='add'>+	return res;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ext4_fsblk_t descriptor_loc(struct super_block *sb,</div><div class='hunk'>@@ -3172,14 +3595,12 @@ int ext4_feature_set_ok(struct super_block *sb, int readonly)</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-#ifndef CONFIG_UNICODE</div><div class='del'>-	if (ext4_has_feature_casefold(sb)) {</div><div class='add'>+	if (!IS_ENABLED(CONFIG_UNICODE) &amp;&amp; ext4_has_feature_casefold(sb)) {</div><div class='ctx'> 		ext4_msg(sb, KERN_ERR,</div><div class='ctx'> 			 "Filesystem with casefold feature cannot be "</div><div class='ctx'> 			 "mounted without CONFIG_UNICODE");</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='del'>-#endif</div><div class='ctx'> </div><div class='ctx'> 	if (readonly)</div><div class='ctx'> 		return 1;</div><div class='hunk'>@@ -3222,7 +3643,7 @@ int ext4_feature_set_ok(struct super_block *sb, int readonly)</div><div class='ctx'>  */</div><div class='ctx'> static void print_daily_error_info(struct timer_list *t)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_sb_info *sbi = from_timer(sbi, t, s_err_report);</div><div class='add'>+	struct ext4_sb_info *sbi = timer_container_of(sbi, t, s_err_report);</div><div class='ctx'> 	struct super_block *sb = sbi-&gt;s_sb;</div><div class='ctx'> 	struct ext4_super_block *es = sbi-&gt;s_es;</div><div class='ctx'> </div><div class='hunk'>@@ -3272,20 +3693,18 @@ static int ext4_run_li_request(struct ext4_li_request *elr)</div><div class='ctx'> 	ext4_group_t group = elr-&gt;lr_next_group;</div><div class='ctx'> 	unsigned int prefetch_ios = 0;</div><div class='ctx'> 	int ret = 0;</div><div class='add'>+	int nr = EXT4_SB(sb)-&gt;s_mb_prefetch;</div><div class='ctx'> 	u64 start_time;</div><div class='ctx'> </div><div class='ctx'> 	if (elr-&gt;lr_mode == EXT4_LI_MODE_PREFETCH_BBITMAP) {</div><div class='del'>-		elr-&gt;lr_next_group = ext4_mb_prefetch(sb, group,</div><div class='del'>-				EXT4_SB(sb)-&gt;s_mb_prefetch, &amp;prefetch_ios);</div><div class='del'>-		if (prefetch_ios)</div><div class='del'>-			ext4_mb_prefetch_fini(sb, elr-&gt;lr_next_group,</div><div class='del'>-					      prefetch_ios);</div><div class='del'>-		trace_ext4_prefetch_bitmaps(sb, group, elr-&gt;lr_next_group,</div><div class='del'>-					    prefetch_ios);</div><div class='add'>+		elr-&gt;lr_next_group = ext4_mb_prefetch(sb, group, nr, &amp;prefetch_ios);</div><div class='add'>+		ext4_mb_prefetch_fini(sb, elr-&gt;lr_next_group, nr);</div><div class='add'>+		trace_ext4_prefetch_bitmaps(sb, group, elr-&gt;lr_next_group, nr);</div><div class='ctx'> 		if (group &gt;= elr-&gt;lr_next_group) {</div><div class='ctx'> 			ret = 1;</div><div class='ctx'> 			if (elr-&gt;lr_first_not_zeroed != ngroups &amp;&amp;</div><div class='del'>-			    !sb_rdonly(sb) &amp;&amp; test_opt(sb, INIT_INODE_TABLE)) {</div><div class='add'>+			    !ext4_emergency_state(sb) &amp;&amp; !sb_rdonly(sb) &amp;&amp;</div><div class='add'>+			    test_opt(sb, INIT_INODE_TABLE)) {</div><div class='ctx'> 				elr-&gt;lr_next_group = elr-&gt;lr_first_not_zeroed;</div><div class='ctx'> 				elr-&gt;lr_mode = EXT4_LI_MODE_ITABLE;</div><div class='ctx'> 				ret = 0;</div><div class='hunk'>@@ -3309,12 +3728,12 @@ static int ext4_run_li_request(struct ext4_li_request *elr)</div><div class='ctx'> 		ret = 1;</div><div class='ctx'> </div><div class='ctx'> 	if (!ret) {</div><div class='del'>-		start_time = ktime_get_real_ns();</div><div class='add'>+		start_time = ktime_get_ns();</div><div class='ctx'> 		ret = ext4_init_inode_table(sb, group,</div><div class='ctx'> 					    elr-&gt;lr_timeout ? 0 : 1);</div><div class='ctx'> 		trace_ext4_lazy_itable_init(sb, group);</div><div class='ctx'> 		if (elr-&gt;lr_timeout == 0) {</div><div class='del'>-			elr-&gt;lr_timeout = nsecs_to_jiffies((ktime_get_real_ns() - start_time) *</div><div class='add'>+			elr-&gt;lr_timeout = nsecs_to_jiffies((ktime_get_ns() - start_time) *</div><div class='ctx'> 				EXT4_SB(elr-&gt;lr_super)-&gt;s_li_wait_mult);</div><div class='ctx'> 		}</div><div class='ctx'> 		elr-&gt;lr_next_sched = jiffies + elr-&gt;lr_timeout;</div><div class='hunk'>@@ -3364,17 +3783,19 @@ static struct task_struct *ext4_lazyinit_task;</div><div class='ctx'>  */</div><div class='ctx'> static int ext4_lazyinit_thread(void *arg)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_lazy_init *eli = (struct ext4_lazy_init *)arg;</div><div class='add'>+	struct ext4_lazy_init *eli = arg;</div><div class='ctx'> 	struct list_head *pos, *n;</div><div class='ctx'> 	struct ext4_li_request *elr;</div><div class='ctx'> 	unsigned long next_wakeup, cur;</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(NULL == eli);</div><div class='add'>+	set_freezable();</div><div class='ctx'> </div><div class='ctx'> cont_thread:</div><div class='ctx'> 	while (true) {</div><div class='del'>-		next_wakeup = MAX_JIFFY_OFFSET;</div><div class='add'>+		bool next_wakeup_initialized = false;</div><div class='ctx'> </div><div class='add'>+		next_wakeup = 0;</div><div class='ctx'> 		mutex_lock(&amp;eli-&gt;li_list_mtx);</div><div class='ctx'> 		if (list_empty(&amp;eli-&gt;li_request_list)) {</div><div class='ctx'> 			mutex_unlock(&amp;eli-&gt;li_list_mtx);</div><div class='hunk'>@@ -3387,8 +3808,11 @@ cont_thread:</div><div class='ctx'> 					 lr_request);</div><div class='ctx'> </div><div class='ctx'> 			if (time_before(jiffies, elr-&gt;lr_next_sched)) {</div><div class='del'>-				if (time_before(elr-&gt;lr_next_sched, next_wakeup))</div><div class='add'>+				if (!next_wakeup_initialized ||</div><div class='add'>+				    time_before(elr-&gt;lr_next_sched, next_wakeup)) {</div><div class='ctx'> 					next_wakeup = elr-&gt;lr_next_sched;</div><div class='add'>+					next_wakeup_initialized = true;</div><div class='add'>+				}</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> 			if (down_read_trylock(&amp;elr-&gt;lr_super-&gt;s_umount)) {</div><div class='hunk'>@@ -3414,19 +3838,20 @@ cont_thread:</div><div class='ctx'> 			}</div><div class='ctx'> 			if (!progress) {</div><div class='ctx'> 				elr-&gt;lr_next_sched = jiffies +</div><div class='del'>-					(prandom_u32()</div><div class='del'>-					 % (EXT4_DEF_LI_MAX_START_DELAY * HZ));</div><div class='add'>+					get_random_u32_below(EXT4_DEF_LI_MAX_START_DELAY * HZ);</div><div class='ctx'> 			}</div><div class='del'>-			if (time_before(elr-&gt;lr_next_sched, next_wakeup))</div><div class='add'>+			if (!next_wakeup_initialized ||</div><div class='add'>+			    time_before(elr-&gt;lr_next_sched, next_wakeup)) {</div><div class='ctx'> 				next_wakeup = elr-&gt;lr_next_sched;</div><div class='add'>+				next_wakeup_initialized = true;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> 		mutex_unlock(&amp;eli-&gt;li_list_mtx);</div><div class='ctx'> </div><div class='ctx'> 		try_to_freeze();</div><div class='ctx'> </div><div class='ctx'> 		cur = jiffies;</div><div class='del'>-		if ((time_after_eq(cur, next_wakeup)) ||</div><div class='del'>-		    (MAX_JIFFY_OFFSET == next_wakeup)) {</div><div class='add'>+		if (!next_wakeup_initialized || time_after_eq(cur, next_wakeup)) {</div><div class='ctx'> 			cond_resched();</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -3562,8 +3987,7 @@ static struct ext4_li_request *ext4_li_request_new(struct super_block *sb,</div><div class='ctx'> 	 * spread the inode table initialization requests</div><div class='ctx'> 	 * better.</div><div class='ctx'> 	 */</div><div class='del'>-	elr-&gt;lr_next_sched = jiffies + (prandom_u32() %</div><div class='del'>-				(EXT4_DEF_LI_MAX_START_DELAY * HZ));</div><div class='add'>+	elr-&gt;lr_next_sched = jiffies + get_random_u32_below(EXT4_DEF_LI_MAX_START_DELAY * HZ);</div><div class='ctx'> 	return elr;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3585,9 +4009,9 @@ int ext4_register_li_request(struct super_block *sb,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (test_opt(sb, NO_PREFETCH_BLOCK_BITMAPS) &amp;&amp;</div><div class='del'>-	    (first_not_zeroed == ngroups || sb_rdonly(sb) ||</div><div class='del'>-	     !test_opt(sb, INIT_INODE_TABLE)))</div><div class='add'>+	if (ext4_emergency_state(sb) || sb_rdonly(sb) ||</div><div class='add'>+	    (test_opt(sb, NO_PREFETCH_BLOCK_BITMAPS) &amp;&amp;</div><div class='add'>+	     (first_not_zeroed == ngroups || !test_opt(sb, INIT_INODE_TABLE))))</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	elr = ext4_li_request_new(sb, first_not_zeroed);</div><div class='hunk'>@@ -3648,7 +4072,7 @@ static int set_journal_csum_feature_set(struct super_block *sb)</div><div class='ctx'> 	int compat, incompat;</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> </div><div class='del'>-	if (ext4_has_metadata_csum(sb)) {</div><div class='add'>+	if (ext4_has_feature_metadata_csum(sb)) {</div><div class='ctx'> 		/* journal checksum v3 */</div><div class='ctx'> 		compat = 0;</div><div class='ctx'> 		incompat = JBD2_FEATURE_INCOMPAT_CSUM_V3;</div><div class='hunk'>@@ -3704,9 +4128,11 @@ static int count_overhead(struct super_block *sb, ext4_group_t grp,</div><div class='ctx'> 	ext4_fsblk_t		first_block, last_block, b;</div><div class='ctx'> 	ext4_group_t		i, ngroups = ext4_get_groups_count(sb);</div><div class='ctx'> 	int			s, j, count = 0;</div><div class='add'>+	int			has_super = ext4_bg_has_super(sb, grp);</div><div class='ctx'> </div><div class='ctx'> 	if (!ext4_has_feature_bigalloc(sb))</div><div class='del'>-		return (ext4_bg_has_super(sb, grp) + ext4_bg_num_gdb(sb, grp) +</div><div class='add'>+		return (has_super + ext4_bg_num_gdb(sb, grp) +</div><div class='add'>+			(has_super ? le16_to_cpu(sbi-&gt;s_es-&gt;s_reserved_gdt_blocks) : 0) +</div><div class='ctx'> 			sbi-&gt;s_itb_per_group + 2);</div><div class='ctx'> </div><div class='ctx'> 	first_block = le32_to_cpu(sbi-&gt;s_es-&gt;s_first_data_block) +</div><div class='hunk'>@@ -3765,7 +4191,7 @@ int ext4_calculate_overhead(struct super_block *sb)</div><div class='ctx'> 	unsigned int j_blocks, j_inum = le32_to_cpu(es-&gt;s_journal_inum);</div><div class='ctx'> 	ext4_group_t i, ngroups = ext4_get_groups_count(sb);</div><div class='ctx'> 	ext4_fsblk_t overhead = 0;</div><div class='del'>-	char *buf = (char *) get_zeroed_page(GFP_NOFS);</div><div class='add'>+	char *buf = kvmalloc(sb-&gt;s_blocksize, GFP_NOFS | __GFP_ZERO);</div><div class='ctx'> </div><div class='ctx'> 	if (!buf)</div><div class='ctx'> 		return -ENOMEM;</div><div class='hunk'>@@ -3790,7 +4216,7 @@ int ext4_calculate_overhead(struct super_block *sb)</div><div class='ctx'> 		blks = count_overhead(sb, i, buf);</div><div class='ctx'> 		overhead += blks;</div><div class='ctx'> 		if (blks)</div><div class='del'>-			memset(buf, 0, PAGE_SIZE);</div><div class='add'>+			memset(buf, 0, sb-&gt;s_blocksize);</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -3798,12 +4224,12 @@ int ext4_calculate_overhead(struct super_block *sb)</div><div class='ctx'> 	 * Add the internal journal blocks whether the journal has been</div><div class='ctx'> 	 * loaded or not</div><div class='ctx'> 	 */</div><div class='del'>-	if (sbi-&gt;s_journal &amp;&amp; !sbi-&gt;s_journal_bdev)</div><div class='add'>+	if (sbi-&gt;s_journal &amp;&amp; !sbi-&gt;s_journal_bdev_file)</div><div class='ctx'> 		overhead += EXT4_NUM_B2C(sbi, sbi-&gt;s_journal-&gt;j_total_len);</div><div class='ctx'> 	else if (ext4_has_feature_journal(sb) &amp;&amp; !sbi-&gt;s_journal &amp;&amp; j_inum) {</div><div class='ctx'> 		/* j_inum for internal journal is non-zero */</div><div class='ctx'> 		j_inode = ext4_get_journal_inode(sb, j_inum);</div><div class='del'>-		if (j_inode) {</div><div class='add'>+		if (!IS_ERR(j_inode)) {</div><div class='ctx'> 			j_blocks = j_inode-&gt;i_size &gt;&gt; sb-&gt;s_blocksize_bits;</div><div class='ctx'> 			overhead += EXT4_NUM_B2C(sbi, j_blocks);</div><div class='ctx'> 			iput(j_inode);</div><div class='hunk'>@@ -3813,7 +4239,7 @@ int ext4_calculate_overhead(struct super_block *sb)</div><div class='ctx'> 	}</div><div class='ctx'> 	sbi-&gt;s_overhead = overhead;</div><div class='ctx'> 	smp_wmb();</div><div class='del'>-	free_page((unsigned long) buf);</div><div class='add'>+	kvfree(buf);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3876,131 +4302,46 @@ static void ext4_setup_csum_trigger(struct super_block *sb,</div><div class='ctx'> 	sbi-&gt;s_journal_triggers[type].tr_triggers.t_frozen = trigger;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext4_fill_super(struct super_block *sb, void *data, int silent)</div><div class='add'>+static void ext4_free_sbi(struct ext4_sb_info *sbi)</div><div class='ctx'> {</div><div class='del'>-	struct dax_device *dax_dev = fs_dax_get_by_bdev(sb-&gt;s_bdev);</div><div class='del'>-	char *orig_data = kstrdup(data, GFP_KERNEL);</div><div class='del'>-	struct buffer_head *bh, **group_desc;</div><div class='del'>-	struct ext4_super_block *es = NULL;</div><div class='del'>-	struct ext4_sb_info *sbi = kzalloc(sizeof(*sbi), GFP_KERNEL);</div><div class='del'>-	struct flex_groups **flex_groups;</div><div class='del'>-	ext4_fsblk_t block;</div><div class='del'>-	ext4_fsblk_t sb_block = get_sb_block(&amp;data);</div><div class='del'>-	ext4_fsblk_t logical_sb_block;</div><div class='del'>-	unsigned long offset = 0;</div><div class='del'>-	unsigned long def_mount_opts;</div><div class='del'>-	struct inode *root;</div><div class='del'>-	const char *descr;</div><div class='del'>-	int ret = -ENOMEM;</div><div class='del'>-	int blocksize, clustersize;</div><div class='del'>-	unsigned int db_count;</div><div class='del'>-	unsigned int i;</div><div class='del'>-	int needs_recovery, has_huge_files;</div><div class='del'>-	__u64 blocks_count;</div><div class='del'>-	int err = 0;</div><div class='del'>-	ext4_group_t first_not_zeroed;</div><div class='del'>-	struct ext4_parsed_options parsed_opts;</div><div class='add'>+	if (!sbi)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	/* Set defaults for the variables that will be set during parsing */</div><div class='del'>-	parsed_opts.journal_ioprio = DEFAULT_JOURNAL_IOPRIO;</div><div class='del'>-	parsed_opts.journal_devnum = 0;</div><div class='del'>-	parsed_opts.mb_optimize_scan = DEFAULT_MB_OPTIMIZE_SCAN;</div><div class='add'>+	kfree(sbi-&gt;s_blockgroup_lock);</div><div class='add'>+	fs_put_dax(sbi-&gt;s_daxdev, NULL);</div><div class='add'>+	kfree(sbi);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if ((data &amp;&amp; !orig_data) || !sbi)</div><div class='del'>-		goto out_free_base;</div><div class='add'>+static struct ext4_sb_info *ext4_alloc_sbi(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct ext4_sb_info *sbi;</div><div class='add'>+</div><div class='add'>+	sbi = kzalloc(sizeof(*sbi), GFP_KERNEL);</div><div class='add'>+	if (!sbi)</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	sbi-&gt;s_daxdev = fs_dax_get_by_bdev(sb-&gt;s_bdev, &amp;sbi-&gt;s_dax_part_off,</div><div class='add'>+					   NULL, NULL);</div><div class='ctx'> </div><div class='del'>-	sbi-&gt;s_daxdev = dax_dev;</div><div class='ctx'> 	sbi-&gt;s_blockgroup_lock =</div><div class='ctx'> 		kzalloc(sizeof(struct blockgroup_lock), GFP_KERNEL);</div><div class='add'>+</div><div class='ctx'> 	if (!sbi-&gt;s_blockgroup_lock)</div><div class='del'>-		goto out_free_base;</div><div class='add'>+		goto err_out;</div><div class='ctx'> </div><div class='ctx'> 	sb-&gt;s_fs_info = sbi;</div><div class='ctx'> 	sbi-&gt;s_sb = sb;</div><div class='del'>-	sbi-&gt;s_inode_readahead_blks = EXT4_DEF_INODE_READAHEAD_BLKS;</div><div class='del'>-	sbi-&gt;s_sb_block = sb_block;</div><div class='del'>-	sbi-&gt;s_sectors_written_start =</div><div class='del'>-		part_stat_read(sb-&gt;s_bdev, sectors[STAT_WRITE]);</div><div class='del'>-</div><div class='del'>-	/* Cleanup superblock name */</div><div class='del'>-	strreplace(sb-&gt;s_id, '/', '!');</div><div class='del'>-</div><div class='del'>-	/* -EINVAL is default */</div><div class='del'>-	ret = -EINVAL;</div><div class='del'>-	blocksize = sb_min_blocksize(sb, EXT4_MIN_BLOCK_SIZE);</div><div class='del'>-	if (!blocksize) {</div><div class='del'>-		ext4_msg(sb, KERN_ERR, "unable to set blocksize");</div><div class='del'>-		goto out_fail;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * The ext4 superblock will not be buffer aligned for other than 1kB</div><div class='del'>-	 * block sizes.  We need to calculate the offset from buffer start.</div><div class='del'>-	 */</div><div class='del'>-	if (blocksize != EXT4_MIN_BLOCK_SIZE) {</div><div class='del'>-		logical_sb_block = sb_block * EXT4_MIN_BLOCK_SIZE;</div><div class='del'>-		offset = do_div(logical_sb_block, blocksize);</div><div class='del'>-	} else {</div><div class='del'>-		logical_sb_block = sb_block;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	bh = ext4_sb_bread_unmovable(sb, logical_sb_block);</div><div class='del'>-	if (IS_ERR(bh)) {</div><div class='del'>-		ext4_msg(sb, KERN_ERR, "unable to read superblock");</div><div class='del'>-		ret = PTR_ERR(bh);</div><div class='del'>-		goto out_fail;</div><div class='del'>-	}</div><div class='del'>-	/*</div><div class='del'>-	 * Note: s_es must be initialized as soon as possible because</div><div class='del'>-	 *       some ext4 macro-instructions depend on its value</div><div class='del'>-	 */</div><div class='del'>-	es = (struct ext4_super_block *) (bh-&gt;b_data + offset);</div><div class='del'>-	sbi-&gt;s_es = es;</div><div class='del'>-	sb-&gt;s_magic = le16_to_cpu(es-&gt;s_magic);</div><div class='del'>-	if (sb-&gt;s_magic != EXT4_SUPER_MAGIC)</div><div class='del'>-		goto cantfind_ext4;</div><div class='del'>-	sbi-&gt;s_kbytes_written = le64_to_cpu(es-&gt;s_kbytes_written);</div><div class='del'>-</div><div class='del'>-	/* Warn if metadata_csum and gdt_csum are both set. */</div><div class='del'>-	if (ext4_has_feature_metadata_csum(sb) &amp;&amp;</div><div class='del'>-	    ext4_has_feature_gdt_csum(sb))</div><div class='del'>-		ext4_warning(sb, "metadata_csum and uninit_bg are "</div><div class='del'>-			     "redundant flags; please run fsck.");</div><div class='del'>-</div><div class='del'>-	/* Check for a known checksum algorithm */</div><div class='del'>-	if (!ext4_verify_csum_type(sb, es)) {</div><div class='del'>-		ext4_msg(sb, KERN_ERR, "VFS: Found ext4 filesystem with "</div><div class='del'>-			 "unknown checksum algorithm.");</div><div class='del'>-		silent = 1;</div><div class='del'>-		goto cantfind_ext4;</div><div class='del'>-	}</div><div class='del'>-	ext4_setup_csum_trigger(sb, EXT4_JTR_ORPHAN_FILE,</div><div class='del'>-				ext4_orphan_file_block_trigger);</div><div class='del'>-</div><div class='del'>-	/* Load the checksum driver */</div><div class='del'>-	sbi-&gt;s_chksum_driver = crypto_alloc_shash("crc32c", 0, 0);</div><div class='del'>-	if (IS_ERR(sbi-&gt;s_chksum_driver)) {</div><div class='del'>-		ext4_msg(sb, KERN_ERR, "Cannot load crc32c driver.");</div><div class='del'>-		ret = PTR_ERR(sbi-&gt;s_chksum_driver);</div><div class='del'>-		sbi-&gt;s_chksum_driver = NULL;</div><div class='del'>-		goto failed_mount;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Check superblock checksum */</div><div class='del'>-	if (!ext4_superblock_csum_verify(sb, es)) {</div><div class='del'>-		ext4_msg(sb, KERN_ERR, "VFS: Found ext4 filesystem with "</div><div class='del'>-			 "invalid superblock checksum.  Run e2fsck?");</div><div class='del'>-		silent = 1;</div><div class='del'>-		ret = -EFSBADCRC;</div><div class='del'>-		goto cantfind_ext4;</div><div class='del'>-	}</div><div class='add'>+	return sbi;</div><div class='add'>+err_out:</div><div class='add'>+	fs_put_dax(sbi-&gt;s_daxdev, NULL);</div><div class='add'>+	kfree(sbi);</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	/* Precompute checksum seed for all metadata */</div><div class='del'>-	if (ext4_has_feature_csum_seed(sb))</div><div class='del'>-		sbi-&gt;s_csum_seed = le32_to_cpu(es-&gt;s_checksum_seed);</div><div class='del'>-	else if (ext4_has_metadata_csum(sb) || ext4_has_feature_ea_inode(sb))</div><div class='del'>-		sbi-&gt;s_csum_seed = ext4_chksum(sbi, ~0, es-&gt;s_uuid,</div><div class='del'>-					       sizeof(es-&gt;s_uuid));</div><div class='add'>+static void ext4_set_def_opts(struct super_block *sb,</div><div class='add'>+			      struct ext4_super_block *es)</div><div class='add'>+{</div><div class='add'>+	unsigned long def_mount_opts;</div><div class='ctx'> </div><div class='ctx'> 	/* Set defaults before we parse the mount options */</div><div class='ctx'> 	def_mount_opts = le32_to_cpu(es-&gt;s_default_mount_opts);</div><div class='hunk'>@@ -4019,7 +4360,7 @@ static int ext4_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 	if (ext4_has_feature_fast_commit(sb))</div><div class='ctx'> 		set_opt2(sb, JOURNAL_FAST_COMMIT);</div><div class='ctx'> 	/* don't forget to enable journal_csum when metadata_csum is enabled. */</div><div class='del'>-	if (ext4_has_metadata_csum(sb))</div><div class='add'>+	if (ext4_has_feature_metadata_csum(sb))</div><div class='ctx'> 		set_opt(sb, JOURNAL_CHECKSUM);</div><div class='ctx'> </div><div class='ctx'> 	if ((def_mount_opts &amp; EXT4_DEFM_JMODE) == EXT4_DEFM_JMODE_DATA)</div><div class='hunk'>@@ -4029,9 +4370,9 @@ static int ext4_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 	else if ((def_mount_opts &amp; EXT4_DEFM_JMODE) == EXT4_DEFM_JMODE_WBACK)</div><div class='ctx'> 		set_opt(sb, WRITEBACK_DATA);</div><div class='ctx'> </div><div class='del'>-	if (le16_to_cpu(sbi-&gt;s_es-&gt;s_errors) == EXT4_ERRORS_PANIC)</div><div class='add'>+	if (le16_to_cpu(es-&gt;s_errors) == EXT4_ERRORS_PANIC)</div><div class='ctx'> 		set_opt(sb, ERRORS_PANIC);</div><div class='del'>-	else if (le16_to_cpu(sbi-&gt;s_es-&gt;s_errors) == EXT4_ERRORS_CONTINUE)</div><div class='add'>+	else if (le16_to_cpu(es-&gt;s_errors) == EXT4_ERRORS_CONTINUE)</div><div class='ctx'> 		set_opt(sb, ERRORS_CONT);</div><div class='ctx'> 	else</div><div class='ctx'> 		set_opt(sb, ERRORS_RO);</div><div class='hunk'>@@ -4040,12 +4381,6 @@ static int ext4_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 	if (def_mount_opts &amp; EXT4_DEFM_DISCARD)</div><div class='ctx'> 		set_opt(sb, DISCARD);</div><div class='ctx'> </div><div class='del'>-	sbi-&gt;s_resuid = make_kuid(&amp;init_user_ns, le16_to_cpu(es-&gt;s_def_resuid));</div><div class='del'>-	sbi-&gt;s_resgid = make_kgid(&amp;init_user_ns, le16_to_cpu(es-&gt;s_def_resgid));</div><div class='del'>-	sbi-&gt;s_commit_interval = JBD2_DEFAULT_MAX_COMMIT_AGE * HZ;</div><div class='del'>-	sbi-&gt;s_min_batch_time = EXT4_DEF_MIN_BATCH_TIME;</div><div class='del'>-	sbi-&gt;s_max_batch_time = EXT4_DEF_MAX_BATCH_TIME;</div><div class='del'>-</div><div class='ctx'> 	if ((def_mount_opts &amp; EXT4_DEFM_NOBARRIER) == 0)</div><div class='ctx'> 		set_opt(sb, BARRIER);</div><div class='ctx'> </div><div class='hunk'>@@ -4057,31 +4392,124 @@ static int ext4_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 	    ((def_mount_opts &amp; EXT4_DEFM_NODELALLOC) == 0))</div><div class='ctx'> 		set_opt(sb, DELALLOC);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * set default s_li_wait_mult for lazyinit, for the case there is</div><div class='del'>-	 * no mount option specified.</div><div class='del'>-	 */</div><div class='del'>-	sbi-&gt;s_li_wait_mult = EXT4_DEF_LI_WAIT_MULT;</div><div class='add'>+	set_opt(sb, DIOREAD_NOLOCK);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if (le32_to_cpu(es-&gt;s_log_block_size) &gt;</div><div class='del'>-	    (EXT4_MAX_BLOCK_LOG_SIZE - EXT4_MIN_BLOCK_LOG_SIZE)) {</div><div class='del'>-		ext4_msg(sb, KERN_ERR,</div><div class='del'>-			 "Invalid log block size: %u",</div><div class='del'>-			 le32_to_cpu(es-&gt;s_log_block_size));</div><div class='del'>-		goto failed_mount;</div><div class='add'>+static int ext4_handle_clustersize(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	struct ext4_super_block *es = sbi-&gt;s_es;</div><div class='add'>+	int clustersize;</div><div class='add'>+</div><div class='add'>+	/* Handle clustersize */</div><div class='add'>+	clustersize = BLOCK_SIZE &lt;&lt; le32_to_cpu(es-&gt;s_log_cluster_size);</div><div class='add'>+	if (ext4_has_feature_bigalloc(sb)) {</div><div class='add'>+		if (clustersize &lt; sb-&gt;s_blocksize) {</div><div class='add'>+			ext4_msg(sb, KERN_ERR,</div><div class='add'>+				 "cluster size (%d) smaller than "</div><div class='add'>+				 "block size (%lu)", clustersize, sb-&gt;s_blocksize);</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		sbi-&gt;s_cluster_bits = le32_to_cpu(es-&gt;s_log_cluster_size) -</div><div class='add'>+			le32_to_cpu(es-&gt;s_log_block_size);</div><div class='add'>+	} else {</div><div class='add'>+		if (clustersize != sb-&gt;s_blocksize) {</div><div class='add'>+			ext4_msg(sb, KERN_ERR,</div><div class='add'>+				 "fragment/cluster size (%d) != "</div><div class='add'>+				 "block size (%lu)", clustersize, sb-&gt;s_blocksize);</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		if (sbi-&gt;s_blocks_per_group &gt; sb-&gt;s_blocksize * 8) {</div><div class='add'>+			ext4_msg(sb, KERN_ERR,</div><div class='add'>+				 "#blocks per group too big: %lu",</div><div class='add'>+				 sbi-&gt;s_blocks_per_group);</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		sbi-&gt;s_cluster_bits = 0;</div><div class='ctx'> 	}</div><div class='del'>-	if (le32_to_cpu(es-&gt;s_log_cluster_size) &gt;</div><div class='del'>-	    (EXT4_MAX_CLUSTER_LOG_SIZE - EXT4_MIN_BLOCK_LOG_SIZE)) {</div><div class='add'>+	sbi-&gt;s_clusters_per_group = le32_to_cpu(es-&gt;s_clusters_per_group);</div><div class='add'>+	if (sbi-&gt;s_clusters_per_group &gt; sb-&gt;s_blocksize * 8) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR, "#clusters per group too big: %lu",</div><div class='add'>+			 sbi-&gt;s_clusters_per_group);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+	if (sbi-&gt;s_blocks_per_group !=</div><div class='add'>+	    (sbi-&gt;s_clusters_per_group * (clustersize / sb-&gt;s_blocksize))) {</div><div class='ctx'> 		ext4_msg(sb, KERN_ERR,</div><div class='del'>-			 "Invalid log cluster size: %u",</div><div class='del'>-			 le32_to_cpu(es-&gt;s_log_cluster_size));</div><div class='del'>-		goto failed_mount;</div><div class='add'>+			 "blocks per group (%lu) and clusters per group (%lu) inconsistent",</div><div class='add'>+			 sbi-&gt;s_blocks_per_group, sbi-&gt;s_clusters_per_group);</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='add'>+	sbi-&gt;s_cluster_ratio = clustersize / sb-&gt;s_blocksize;</div><div class='ctx'> </div><div class='del'>-	blocksize = EXT4_MIN_BLOCK_SIZE &lt;&lt; le32_to_cpu(es-&gt;s_log_block_size);</div><div class='add'>+	/* Do we have standard group size of clustersize * 8 blocks ? */</div><div class='add'>+	if (sbi-&gt;s_blocks_per_group == clustersize &lt;&lt; 3)</div><div class='add'>+		set_opt2(sb, STD_GROUP_SIZE);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * ext4_atomic_write_init: Initializes filesystem min &amp; max atomic write units.</div><div class='add'>+ * With non-bigalloc filesystem awu will be based upon filesystem blocksize</div><div class='add'>+ * &amp; bdev awu units.</div><div class='add'>+ * With bigalloc it will be based upon bigalloc cluster size &amp; bdev awu units.</div><div class='add'>+ * @sb: super block</div><div class='add'>+ */</div><div class='add'>+static void ext4_atomic_write_init(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	struct block_device *bdev = sb-&gt;s_bdev;</div><div class='add'>+	unsigned int clustersize = EXT4_CLUSTER_SIZE(sb);</div><div class='ctx'> </div><div class='del'>-	if (blocksize == PAGE_SIZE)</div><div class='del'>-		set_opt(sb, DIOREAD_NOLOCK);</div><div class='add'>+	if (!bdev_can_atomic_write(bdev))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (!ext4_has_feature_extents(sb))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	sbi-&gt;s_awu_min = max(sb-&gt;s_blocksize,</div><div class='add'>+			      bdev_atomic_write_unit_min_bytes(bdev));</div><div class='add'>+	sbi-&gt;s_awu_max = min(clustersize,</div><div class='add'>+			      bdev_atomic_write_unit_max_bytes(bdev));</div><div class='add'>+	if (sbi-&gt;s_awu_min &amp;&amp; sbi-&gt;s_awu_max &amp;&amp;</div><div class='add'>+	    sbi-&gt;s_awu_min &lt;= sbi-&gt;s_awu_max) {</div><div class='add'>+		ext4_msg(sb, KERN_NOTICE, "Supports (experimental) DIO atomic writes awu_min: %u, awu_max: %u",</div><div class='add'>+			 sbi-&gt;s_awu_min, sbi-&gt;s_awu_max);</div><div class='add'>+	} else {</div><div class='add'>+		sbi-&gt;s_awu_min = 0;</div><div class='add'>+		sbi-&gt;s_awu_max = 0;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void ext4_fast_commit_init(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+</div><div class='add'>+	/* Initialize fast commit stuff */</div><div class='add'>+	atomic_set(&amp;sbi-&gt;s_fc_subtid, 0);</div><div class='add'>+	INIT_LIST_HEAD(&amp;sbi-&gt;s_fc_q[FC_Q_MAIN]);</div><div class='add'>+	INIT_LIST_HEAD(&amp;sbi-&gt;s_fc_q[FC_Q_STAGING]);</div><div class='add'>+	INIT_LIST_HEAD(&amp;sbi-&gt;s_fc_dentry_q[FC_Q_MAIN]);</div><div class='add'>+	INIT_LIST_HEAD(&amp;sbi-&gt;s_fc_dentry_q[FC_Q_STAGING]);</div><div class='add'>+	sbi-&gt;s_fc_bytes = 0;</div><div class='add'>+	ext4_clear_mount_flag(sb, EXT4_MF_FC_INELIGIBLE);</div><div class='add'>+	sbi-&gt;s_fc_ineligible_tid = 0;</div><div class='add'>+	mutex_init(&amp;sbi-&gt;s_fc_lock);</div><div class='add'>+	memset(&amp;sbi-&gt;s_fc_stats, 0, sizeof(sbi-&gt;s_fc_stats));</div><div class='add'>+	sbi-&gt;s_fc_replay_state.fc_regions = NULL;</div><div class='add'>+	sbi-&gt;s_fc_replay_state.fc_regions_size = 0;</div><div class='add'>+	sbi-&gt;s_fc_replay_state.fc_regions_used = 0;</div><div class='add'>+	sbi-&gt;s_fc_replay_state.fc_regions_valid = 0;</div><div class='add'>+	sbi-&gt;s_fc_replay_state.fc_modified_inodes = NULL;</div><div class='add'>+	sbi-&gt;s_fc_replay_state.fc_modified_inodes_size = 0;</div><div class='add'>+	sbi-&gt;s_fc_replay_state.fc_modified_inodes_used = 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ext4_inode_info_init(struct super_block *sb,</div><div class='add'>+				struct ext4_super_block *es)</div><div class='add'>+{</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> </div><div class='ctx'> 	if (le32_to_cpu(es-&gt;s_rev_level) == EXT4_GOOD_OLD_REV) {</div><div class='ctx'> 		sbi-&gt;s_inode_size = EXT4_GOOD_OLD_INODE_SIZE;</div><div class='hunk'>@@ -4092,16 +4520,16 @@ static int ext4_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 		if (sbi-&gt;s_first_ino &lt; EXT4_GOOD_OLD_FIRST_INO) {</div><div class='ctx'> 			ext4_msg(sb, KERN_ERR, "invalid first ino: %u",</div><div class='ctx'> 				 sbi-&gt;s_first_ino);</div><div class='del'>-			goto failed_mount;</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 		}</div><div class='ctx'> 		if ((sbi-&gt;s_inode_size &lt; EXT4_GOOD_OLD_INODE_SIZE) ||</div><div class='ctx'> 		    (!is_power_of_2(sbi-&gt;s_inode_size)) ||</div><div class='del'>-		    (sbi-&gt;s_inode_size &gt; blocksize)) {</div><div class='add'>+		    (sbi-&gt;s_inode_size &gt; sb-&gt;s_blocksize)) {</div><div class='ctx'> 			ext4_msg(sb, KERN_ERR,</div><div class='ctx'> 			       "unsupported inode size: %d",</div><div class='ctx'> 			       sbi-&gt;s_inode_size);</div><div class='del'>-			ext4_msg(sb, KERN_ERR, "blocksize: %d", blocksize);</div><div class='del'>-			goto failed_mount;</div><div class='add'>+			ext4_msg(sb, KERN_ERR, "blocksize: %lu", sb-&gt;s_blocksize);</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 		}</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * i_atime_extra is the last extra field available for</div><div class='hunk'>@@ -4119,6 +4547,7 @@ static int ext4_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 		}</div><div class='ctx'> 		sb-&gt;s_time_min = EXT4_TIMESTAMP_MIN;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> 	if (sbi-&gt;s_inode_size &gt; EXT4_GOOD_OLD_INODE_SIZE) {</div><div class='ctx'> 		sbi-&gt;s_want_extra_isize = sizeof(struct ext4_inode) -</div><div class='ctx'> 			EXT4_GOOD_OLD_INODE_SIZE;</div><div class='hunk'>@@ -4130,7 +4559,7 @@ static int ext4_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 			if (v &gt; max) {</div><div class='ctx'> 				ext4_msg(sb, KERN_ERR,</div><div class='ctx'> 					 "bad s_want_extra_isize: %d", v);</div><div class='del'>-				goto failed_mount;</div><div class='add'>+				return -EINVAL;</div><div class='ctx'> 			}</div><div class='ctx'> 			if (sbi-&gt;s_want_extra_isize &lt; v)</div><div class='ctx'> 				sbi-&gt;s_want_extra_isize = v;</div><div class='hunk'>@@ -4139,89 +4568,105 @@ static int ext4_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 			if (v &gt; max) {</div><div class='ctx'> 				ext4_msg(sb, KERN_ERR,</div><div class='ctx'> 					 "bad s_min_extra_isize: %d", v);</div><div class='del'>-				goto failed_mount;</div><div class='add'>+				return -EINVAL;</div><div class='ctx'> 			}</div><div class='ctx'> 			if (sbi-&gt;s_want_extra_isize &lt; v)</div><div class='ctx'> 				sbi-&gt;s_want_extra_isize = v;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (sbi-&gt;s_es-&gt;s_mount_opts[0]) {</div><div class='del'>-		char *s_mount_opts = kstrndup(sbi-&gt;s_es-&gt;s_mount_opts,</div><div class='del'>-					      sizeof(sbi-&gt;s_es-&gt;s_mount_opts),</div><div class='del'>-					      GFP_KERNEL);</div><div class='del'>-		if (!s_mount_opts)</div><div class='del'>-			goto failed_mount;</div><div class='del'>-		if (!parse_options(s_mount_opts, sb, &amp;parsed_opts, 0)) {</div><div class='del'>-			ext4_msg(sb, KERN_WARNING,</div><div class='del'>-				 "failed to parse options in superblock: %s",</div><div class='del'>-				 s_mount_opts);</div><div class='del'>-		}</div><div class='del'>-		kfree(s_mount_opts);</div><div class='del'>-	}</div><div class='del'>-	sbi-&gt;s_def_mount_opt = sbi-&gt;s_mount_opt;</div><div class='del'>-	if (!parse_options((char *) data, sb, &amp;parsed_opts, 0))</div><div class='del'>-		goto failed_mount;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='del'>-	if (ext4_has_feature_casefold(sb) &amp;&amp; !sb-&gt;s_encoding) {</div><div class='del'>-		const struct ext4_sb_encodings *encoding_info;</div><div class='del'>-		struct unicode_map *encoding;</div><div class='del'>-		__u16 encoding_flags;</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='add'>+static int ext4_encoding_init(struct super_block *sb, struct ext4_super_block *es)</div><div class='add'>+{</div><div class='add'>+	const struct ext4_sb_encodings *encoding_info;</div><div class='add'>+	struct unicode_map *encoding;</div><div class='add'>+	__u16 encoding_flags = le16_to_cpu(es-&gt;s_encoding_flags);</div><div class='ctx'> </div><div class='del'>-		if (ext4_sb_read_encoding(es, &amp;encoding_info,</div><div class='del'>-					  &amp;encoding_flags)) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR,</div><div class='del'>-				 "Encoding requested by superblock is unknown");</div><div class='del'>-			goto failed_mount;</div><div class='del'>-		}</div><div class='add'>+	if (!ext4_has_feature_casefold(sb) || sb-&gt;s_encoding)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-		encoding = utf8_load(encoding_info-&gt;version);</div><div class='del'>-		if (IS_ERR(encoding)) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR,</div><div class='del'>-				 "can't mount with superblock charset: %s-%s "</div><div class='del'>-				 "not supported by the kernel. flags: 0x%x.",</div><div class='del'>-				 encoding_info-&gt;name, encoding_info-&gt;version,</div><div class='del'>-				 encoding_flags);</div><div class='del'>-			goto failed_mount;</div><div class='del'>-		}</div><div class='del'>-		ext4_msg(sb, KERN_INFO,"Using encoding defined by superblock: "</div><div class='del'>-			 "%s-%s with flags 0x%hx", encoding_info-&gt;name,</div><div class='del'>-			 encoding_info-&gt;version?:"\b", encoding_flags);</div><div class='add'>+	encoding_info = ext4_sb_read_encoding(es);</div><div class='add'>+	if (!encoding_info) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR,</div><div class='add'>+			"Encoding requested by superblock is unknown");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		sb-&gt;s_encoding = encoding;</div><div class='del'>-		sb-&gt;s_encoding_flags = encoding_flags;</div><div class='add'>+	encoding = utf8_load(encoding_info-&gt;version);</div><div class='add'>+	if (IS_ERR(encoding)) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR,</div><div class='add'>+			"can't mount with superblock charset: %s-%u.%u.%u "</div><div class='add'>+			"not supported by the kernel. flags: 0x%x.",</div><div class='add'>+			encoding_info-&gt;name,</div><div class='add'>+			unicode_major(encoding_info-&gt;version),</div><div class='add'>+			unicode_minor(encoding_info-&gt;version),</div><div class='add'>+			unicode_rev(encoding_info-&gt;version),</div><div class='add'>+			encoding_flags);</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='add'>+	ext4_msg(sb, KERN_INFO,"Using encoding defined by superblock: "</div><div class='add'>+		"%s-%u.%u.%u with flags 0x%hx", encoding_info-&gt;name,</div><div class='add'>+		unicode_major(encoding_info-&gt;version),</div><div class='add'>+		unicode_minor(encoding_info-&gt;version),</div><div class='add'>+		unicode_rev(encoding_info-&gt;version),</div><div class='add'>+		encoding_flags);</div><div class='add'>+</div><div class='add'>+	sb-&gt;s_encoding = encoding;</div><div class='add'>+	sb-&gt;s_encoding_flags = encoding_flags;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+static inline int ext4_encoding_init(struct super_block *sb, struct ext4_super_block *es)</div><div class='add'>+{</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-	if (test_opt(sb, DATA_FLAGS) == EXT4_MOUNT_JOURNAL_DATA) {</div><div class='del'>-		printk_once(KERN_WARNING "EXT4-fs: Warning: mounting with data=journal disables delayed allocation, dioread_nolock, O_DIRECT and fast_commit support!\n");</div><div class='del'>-		/* can't mount with both data=journal and dioread_nolock. */</div><div class='del'>-		clear_opt(sb, DIOREAD_NOLOCK);</div><div class='del'>-		clear_opt2(sb, JOURNAL_FAST_COMMIT);</div><div class='del'>-		if (test_opt2(sb, EXPLICIT_DELALLOC)) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR, "can't mount with "</div><div class='del'>-				 "both data=journal and delalloc");</div><div class='del'>-			goto failed_mount;</div><div class='del'>-		}</div><div class='del'>-		if (test_opt(sb, DAX_ALWAYS)) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR, "can't mount with "</div><div class='del'>-				 "both data=journal and dax");</div><div class='del'>-			goto failed_mount;</div><div class='del'>-		}</div><div class='del'>-		if (ext4_has_feature_encrypt(sb)) {</div><div class='del'>-			ext4_msg(sb, KERN_WARNING,</div><div class='del'>-				 "encrypted files will use data=ordered "</div><div class='del'>-				 "instead of data journaling mode");</div><div class='del'>-		}</div><div class='del'>-		if (test_opt(sb, DELALLOC))</div><div class='del'>-			clear_opt(sb, DELALLOC);</div><div class='del'>-	} else {</div><div class='del'>-		sb-&gt;s_iflags |= SB_I_CGROUPWB;</div><div class='add'>+static int ext4_init_metadata_csum(struct super_block *sb, struct ext4_super_block *es)</div><div class='add'>+{</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+</div><div class='add'>+	/* Warn if metadata_csum and gdt_csum are both set. */</div><div class='add'>+	if (ext4_has_feature_metadata_csum(sb) &amp;&amp;</div><div class='add'>+	    ext4_has_feature_gdt_csum(sb))</div><div class='add'>+		ext4_warning(sb, "metadata_csum and uninit_bg are "</div><div class='add'>+			     "redundant flags; please run fsck.");</div><div class='add'>+</div><div class='add'>+	/* Check for a known checksum algorithm */</div><div class='add'>+	if (!ext4_verify_csum_type(sb, es)) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR, "VFS: Found ext4 filesystem with "</div><div class='add'>+			 "unknown checksum algorithm.");</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='add'>+	ext4_setup_csum_trigger(sb, EXT4_JTR_ORPHAN_FILE,</div><div class='add'>+				ext4_orphan_file_block_trigger);</div><div class='ctx'> </div><div class='del'>-	sb-&gt;s_flags = (sb-&gt;s_flags &amp; ~SB_POSIXACL) |</div><div class='del'>-		(test_opt(sb, POSIX_ACL) ? SB_POSIXACL : 0);</div><div class='add'>+	/* Check superblock checksum */</div><div class='add'>+	if (!ext4_superblock_csum_verify(sb, es)) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR, "VFS: Found ext4 filesystem with "</div><div class='add'>+			 "invalid superblock checksum.  Run e2fsck?");</div><div class='add'>+		return -EFSBADCRC;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Precompute checksum seed for all metadata */</div><div class='add'>+	if (ext4_has_feature_csum_seed(sb))</div><div class='add'>+		sbi-&gt;s_csum_seed = le32_to_cpu(es-&gt;s_checksum_seed);</div><div class='add'>+	else if (ext4_has_feature_metadata_csum(sb) ||</div><div class='add'>+		 ext4_has_feature_ea_inode(sb))</div><div class='add'>+		sbi-&gt;s_csum_seed = ext4_chksum(~0, es-&gt;s_uuid,</div><div class='add'>+					       sizeof(es-&gt;s_uuid));</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ext4_check_feature_compatibility(struct super_block *sb,</div><div class='add'>+					    struct ext4_super_block *es,</div><div class='add'>+					    int silent)</div><div class='add'>+{</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> </div><div class='ctx'> 	if (le32_to_cpu(es-&gt;s_rev_level) == EXT4_GOOD_OLD_REV &amp;&amp;</div><div class='ctx'> 	    (ext4_has_compat_features(sb) ||</div><div class='hunk'>@@ -4236,7 +4681,7 @@ static int ext4_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 		if (ext4_has_feature_64bit(sb)) {</div><div class='ctx'> 			ext4_msg(sb, KERN_ERR,</div><div class='ctx'> 				 "The Hurd can't support 64-bit file systems");</div><div class='del'>-			goto failed_mount;</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='hunk'>@@ -4246,7 +4691,7 @@ static int ext4_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 		if (ext4_has_feature_ea_inode(sb)) {</div><div class='ctx'> 			ext4_msg(sb, KERN_ERR,</div><div class='ctx'> 				 "ea_inode feature is not supported for Hurd");</div><div class='del'>-			goto failed_mount;</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -4260,10 +4705,10 @@ static int ext4_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 			 * it's actually an ext[34] filesystem.</div><div class='ctx'> 			 */</div><div class='ctx'> 			if (silent &amp;&amp; ext4_feature_set_ok(sb, sb_rdonly(sb)))</div><div class='del'>-				goto failed_mount;</div><div class='add'>+				return -EINVAL;</div><div class='ctx'> 			ext4_msg(sb, KERN_ERR, "couldn't mount as ext2 due "</div><div class='ctx'> 				 "to feature incompatibilities");</div><div class='del'>-			goto failed_mount;</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -4277,10 +4722,10 @@ static int ext4_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 			 * it's actually an ext4 filesystem.</div><div class='ctx'> 			 */</div><div class='ctx'> 			if (silent &amp;&amp; ext4_feature_set_ok(sb, sb_rdonly(sb)))</div><div class='del'>-				goto failed_mount;</div><div class='add'>+				return -EINVAL;</div><div class='ctx'> 			ext4_msg(sb, KERN_ERR, "couldn't mount as ext3 due "</div><div class='ctx'> 				 "to feature incompatibilities");</div><div class='del'>-			goto failed_mount;</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -4290,180 +4735,50 @@ static int ext4_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 	 * so there is a chance incompat flags are set on a rev 0 filesystem.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (!ext4_feature_set_ok(sb, (sb_rdonly(sb))))</div><div class='del'>-		goto failed_mount;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	if (le16_to_cpu(sbi-&gt;s_es-&gt;s_reserved_gdt_blocks) &gt; (blocksize / 4)) {</div><div class='del'>-		ext4_msg(sb, KERN_ERR,</div><div class='del'>-			 "Number of reserved GDT blocks insanely large: %d",</div><div class='del'>-			 le16_to_cpu(sbi-&gt;s_es-&gt;s_reserved_gdt_blocks));</div><div class='del'>-		goto failed_mount;</div><div class='add'>+	if (sbi-&gt;s_daxdev) {</div><div class='add'>+		if (sb-&gt;s_blocksize == PAGE_SIZE)</div><div class='add'>+			set_bit(EXT4_FLAGS_BDEV_IS_DAX, &amp;sbi-&gt;s_ext4_flags);</div><div class='add'>+		else</div><div class='add'>+			ext4_msg(sb, KERN_ERR, "unsupported blocksize for DAX\n");</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (dax_supported(dax_dev, sb-&gt;s_bdev, blocksize, 0,</div><div class='del'>-			bdev_nr_sectors(sb-&gt;s_bdev)))</div><div class='del'>-		set_bit(EXT4_FLAGS_BDEV_IS_DAX, &amp;sbi-&gt;s_ext4_flags);</div><div class='del'>-</div><div class='ctx'> 	if (sbi-&gt;s_mount_opt &amp; EXT4_MOUNT_DAX_ALWAYS) {</div><div class='ctx'> 		if (ext4_has_feature_inline_data(sb)) {</div><div class='ctx'> 			ext4_msg(sb, KERN_ERR, "Cannot use DAX on a filesystem"</div><div class='ctx'> 					" that may contain inline data");</div><div class='del'>-			goto failed_mount;</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (!test_bit(EXT4_FLAGS_BDEV_IS_DAX, &amp;sbi-&gt;s_ext4_flags)) {</div><div class='ctx'> 			ext4_msg(sb, KERN_ERR,</div><div class='ctx'> 				"DAX unsupported by block device.");</div><div class='del'>-			goto failed_mount;</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (ext4_has_feature_encrypt(sb) &amp;&amp; es-&gt;s_encryption_level) {</div><div class='ctx'> 		ext4_msg(sb, KERN_ERR, "Unsupported encryption level %d",</div><div class='ctx'> 			 es-&gt;s_encryption_level);</div><div class='del'>-		goto failed_mount;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (sb-&gt;s_blocksize != blocksize) {</div><div class='del'>-		/*</div><div class='del'>-		 * bh must be released before kill_bdev(), otherwise</div><div class='del'>-		 * it won't be freed and its page also. kill_bdev()</div><div class='del'>-		 * is called by sb_set_blocksize().</div><div class='del'>-		 */</div><div class='del'>-		brelse(bh);</div><div class='del'>-		/* Validate the filesystem blocksize */</div><div class='del'>-		if (!sb_set_blocksize(sb, blocksize)) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR, "bad block size %d",</div><div class='del'>-					blocksize);</div><div class='del'>-			bh = NULL;</div><div class='del'>-			goto failed_mount;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		logical_sb_block = sb_block * EXT4_MIN_BLOCK_SIZE;</div><div class='del'>-		offset = do_div(logical_sb_block, blocksize);</div><div class='del'>-		bh = ext4_sb_bread_unmovable(sb, logical_sb_block);</div><div class='del'>-		if (IS_ERR(bh)) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR,</div><div class='del'>-			       "Can't read superblock on 2nd try");</div><div class='del'>-			ret = PTR_ERR(bh);</div><div class='del'>-			bh = NULL;</div><div class='del'>-			goto failed_mount;</div><div class='del'>-		}</div><div class='del'>-		es = (struct ext4_super_block *)(bh-&gt;b_data + offset);</div><div class='del'>-		sbi-&gt;s_es = es;</div><div class='del'>-		if (es-&gt;s_magic != cpu_to_le16(EXT4_SUPER_MAGIC)) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR,</div><div class='del'>-			       "Magic mismatch, very weird!");</div><div class='del'>-			goto failed_mount;</div><div class='del'>-		}</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	has_huge_files = ext4_has_feature_huge_file(sb);</div><div class='del'>-	sbi-&gt;s_bitmap_maxbytes = ext4_max_bitmap_size(sb-&gt;s_blocksize_bits,</div><div class='del'>-						      has_huge_files);</div><div class='del'>-	sb-&gt;s_maxbytes = ext4_max_size(sb-&gt;s_blocksize_bits, has_huge_files);</div><div class='del'>-</div><div class='del'>-	sbi-&gt;s_desc_size = le16_to_cpu(es-&gt;s_desc_size);</div><div class='del'>-	if (ext4_has_feature_64bit(sb)) {</div><div class='del'>-		if (sbi-&gt;s_desc_size &lt; EXT4_MIN_DESC_SIZE_64BIT ||</div><div class='del'>-		    sbi-&gt;s_desc_size &gt; EXT4_MAX_DESC_SIZE ||</div><div class='del'>-		    !is_power_of_2(sbi-&gt;s_desc_size)) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR,</div><div class='del'>-			       "unsupported descriptor size %lu",</div><div class='del'>-			       sbi-&gt;s_desc_size);</div><div class='del'>-			goto failed_mount;</div><div class='del'>-		}</div><div class='del'>-	} else</div><div class='del'>-		sbi-&gt;s_desc_size = EXT4_MIN_DESC_SIZE;</div><div class='del'>-</div><div class='del'>-	sbi-&gt;s_blocks_per_group = le32_to_cpu(es-&gt;s_blocks_per_group);</div><div class='del'>-	sbi-&gt;s_inodes_per_group = le32_to_cpu(es-&gt;s_inodes_per_group);</div><div class='del'>-</div><div class='del'>-	sbi-&gt;s_inodes_per_block = blocksize / EXT4_INODE_SIZE(sb);</div><div class='del'>-	if (sbi-&gt;s_inodes_per_block == 0)</div><div class='del'>-		goto cantfind_ext4;</div><div class='del'>-	if (sbi-&gt;s_inodes_per_group &lt; sbi-&gt;s_inodes_per_block ||</div><div class='del'>-	    sbi-&gt;s_inodes_per_group &gt; blocksize * 8) {</div><div class='del'>-		ext4_msg(sb, KERN_ERR, "invalid inodes per group: %lu\n",</div><div class='del'>-			 sbi-&gt;s_inodes_per_group);</div><div class='del'>-		goto failed_mount;</div><div class='del'>-	}</div><div class='del'>-	sbi-&gt;s_itb_per_group = sbi-&gt;s_inodes_per_group /</div><div class='del'>-					sbi-&gt;s_inodes_per_block;</div><div class='del'>-	sbi-&gt;s_desc_per_block = blocksize / EXT4_DESC_SIZE(sb);</div><div class='del'>-	sbi-&gt;s_sbh = bh;</div><div class='del'>-	sbi-&gt;s_mount_state = le16_to_cpu(es-&gt;s_state);</div><div class='del'>-	sbi-&gt;s_addr_per_block_bits = ilog2(EXT4_ADDR_PER_BLOCK(sb));</div><div class='del'>-	sbi-&gt;s_desc_per_block_bits = ilog2(EXT4_DESC_PER_BLOCK(sb));</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; 4; i++)</div><div class='del'>-		sbi-&gt;s_hash_seed[i] = le32_to_cpu(es-&gt;s_hash_seed[i]);</div><div class='del'>-	sbi-&gt;s_def_hash_version = es-&gt;s_def_hash_version;</div><div class='del'>-	if (ext4_has_feature_dir_index(sb)) {</div><div class='del'>-		i = le32_to_cpu(es-&gt;s_flags);</div><div class='del'>-		if (i &amp; EXT2_FLAGS_UNSIGNED_HASH)</div><div class='del'>-			sbi-&gt;s_hash_unsigned = 3;</div><div class='del'>-		else if ((i &amp; EXT2_FLAGS_SIGNED_HASH) == 0) {</div><div class='del'>-#ifdef __CHAR_UNSIGNED__</div><div class='del'>-			if (!sb_rdonly(sb))</div><div class='del'>-				es-&gt;s_flags |=</div><div class='del'>-					cpu_to_le32(EXT2_FLAGS_UNSIGNED_HASH);</div><div class='del'>-			sbi-&gt;s_hash_unsigned = 3;</div><div class='del'>-#else</div><div class='del'>-			if (!sb_rdonly(sb))</div><div class='del'>-				es-&gt;s_flags |=</div><div class='del'>-					cpu_to_le32(EXT2_FLAGS_SIGNED_HASH);</div><div class='del'>-#endif</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+static int ext4_check_geometry(struct super_block *sb,</div><div class='add'>+			       struct ext4_super_block *es)</div><div class='add'>+{</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	__u64 blocks_count;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='del'>-	/* Handle clustersize */</div><div class='del'>-	clustersize = BLOCK_SIZE &lt;&lt; le32_to_cpu(es-&gt;s_log_cluster_size);</div><div class='del'>-	if (ext4_has_feature_bigalloc(sb)) {</div><div class='del'>-		if (clustersize &lt; blocksize) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR,</div><div class='del'>-				 "cluster size (%d) smaller than "</div><div class='del'>-				 "block size (%d)", clustersize, blocksize);</div><div class='del'>-			goto failed_mount;</div><div class='del'>-		}</div><div class='del'>-		sbi-&gt;s_cluster_bits = le32_to_cpu(es-&gt;s_log_cluster_size) -</div><div class='del'>-			le32_to_cpu(es-&gt;s_log_block_size);</div><div class='del'>-		sbi-&gt;s_clusters_per_group =</div><div class='del'>-			le32_to_cpu(es-&gt;s_clusters_per_group);</div><div class='del'>-		if (sbi-&gt;s_clusters_per_group &gt; blocksize * 8) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR,</div><div class='del'>-				 "#clusters per group too big: %lu",</div><div class='del'>-				 sbi-&gt;s_clusters_per_group);</div><div class='del'>-			goto failed_mount;</div><div class='del'>-		}</div><div class='del'>-		if (sbi-&gt;s_blocks_per_group !=</div><div class='del'>-		    (sbi-&gt;s_clusters_per_group * (clustersize / blocksize))) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR, "blocks per group (%lu) and "</div><div class='del'>-				 "clusters per group (%lu) inconsistent",</div><div class='del'>-				 sbi-&gt;s_blocks_per_group,</div><div class='del'>-				 sbi-&gt;s_clusters_per_group);</div><div class='del'>-			goto failed_mount;</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-		if (clustersize != blocksize) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR,</div><div class='del'>-				 "fragment/cluster size (%d) != "</div><div class='del'>-				 "block size (%d)", clustersize, blocksize);</div><div class='del'>-			goto failed_mount;</div><div class='del'>-		}</div><div class='del'>-		if (sbi-&gt;s_blocks_per_group &gt; blocksize * 8) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR,</div><div class='del'>-				 "#blocks per group too big: %lu",</div><div class='del'>-				 sbi-&gt;s_blocks_per_group);</div><div class='del'>-			goto failed_mount;</div><div class='del'>-		}</div><div class='del'>-		sbi-&gt;s_clusters_per_group = sbi-&gt;s_blocks_per_group;</div><div class='del'>-		sbi-&gt;s_cluster_bits = 0;</div><div class='add'>+	if (le16_to_cpu(sbi-&gt;s_es-&gt;s_reserved_gdt_blocks) &gt; (sb-&gt;s_blocksize / 4)) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR,</div><div class='add'>+			 "Number of reserved GDT blocks insanely large: %d",</div><div class='add'>+			 le16_to_cpu(sbi-&gt;s_es-&gt;s_reserved_gdt_blocks));</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-	sbi-&gt;s_cluster_ratio = clustersize / blocksize;</div><div class='del'>-</div><div class='del'>-	/* Do we have standard group size of clustersize * 8 blocks ? */</div><div class='del'>-	if (sbi-&gt;s_blocks_per_group == clustersize &lt;&lt; 3)</div><div class='del'>-		set_opt2(sb, STD_GROUP_SIZE);</div><div class='del'>-</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Test whether we have more sectors than will fit in sector_t,</div><div class='ctx'> 	 * and whether the max offset is addressable by the page cache.</div><div class='hunk'>@@ -4473,19 +4788,16 @@ static int ext4_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 	if (err) {</div><div class='ctx'> 		ext4_msg(sb, KERN_ERR, "filesystem"</div><div class='ctx'> 			 " too large to mount safely on this system");</div><div class='del'>-		goto failed_mount;</div><div class='add'>+		return err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (EXT4_BLOCKS_PER_GROUP(sb) == 0)</div><div class='del'>-		goto cantfind_ext4;</div><div class='del'>-</div><div class='ctx'> 	/* check blocks count against device size */</div><div class='ctx'> 	blocks_count = sb_bdev_nr_blocks(sb);</div><div class='ctx'> 	if (blocks_count &amp;&amp; ext4_blocks_count(es) &gt; blocks_count) {</div><div class='ctx'> 		ext4_msg(sb, KERN_WARNING, "bad geometry: block count %llu "</div><div class='ctx'> 		       "exceeds size of device (%llu blocks)",</div><div class='ctx'> 		       ext4_blocks_count(es), blocks_count);</div><div class='del'>-		goto failed_mount;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -4497,13 +4809,13 @@ static int ext4_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 			 "block %u is beyond end of filesystem (%llu)",</div><div class='ctx'> 			 le32_to_cpu(es-&gt;s_first_data_block),</div><div class='ctx'> 			 ext4_blocks_count(es));</div><div class='del'>-		goto failed_mount;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> 	if ((es-&gt;s_first_data_block == 0) &amp;&amp; (es-&gt;s_log_block_size == 0) &amp;&amp;</div><div class='ctx'> 	    (sbi-&gt;s_cluster_ratio == 1)) {</div><div class='ctx'> 		ext4_msg(sb, KERN_WARNING, "bad geometry: first data "</div><div class='ctx'> 			 "block is 0 with a 1k block and cluster size");</div><div class='del'>-		goto failed_mount;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	blocks_count = (ext4_blocks_count(es) -</div><div class='hunk'>@@ -4517,7 +4829,7 @@ static int ext4_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 		       ext4_blocks_count(es),</div><div class='ctx'> 		       le32_to_cpu(es-&gt;s_first_data_block),</div><div class='ctx'> 		       EXT4_BLOCKS_PER_GROUP(sb));</div><div class='del'>-		goto failed_mount;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> 	sbi-&gt;s_groups_count = blocks_count;</div><div class='ctx'> 	sbi-&gt;s_blockfile_groups = min_t(ext4_group_t, sbi-&gt;s_groups_count,</div><div class='hunk'>@@ -4527,9 +4839,22 @@ static int ext4_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 		ext4_msg(sb, KERN_ERR, "inodes count not valid: %u vs %llu",</div><div class='ctx'> 			 le32_to_cpu(es-&gt;s_inodes_count),</div><div class='ctx'> 			 ((u64)sbi-&gt;s_groups_count * sbi-&gt;s_inodes_per_group));</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		goto failed_mount;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ext4_group_desc_init(struct super_block *sb,</div><div class='add'>+				struct ext4_super_block *es,</div><div class='add'>+				ext4_fsblk_t logical_sb_block,</div><div class='add'>+				ext4_group_t *first_not_zeroed)</div><div class='add'>+{</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	unsigned int db_count;</div><div class='add'>+	ext4_fsblk_t block;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='ctx'> 	db_count = (sbi-&gt;s_groups_count + EXT4_DESC_PER_BLOCK(sb) - 1) /</div><div class='ctx'> 		   EXT4_DESC_PER_BLOCK(sb);</div><div class='ctx'> 	if (ext4_has_feature_meta_bg(sb)) {</div><div class='hunk'>@@ -4538,7 +4863,7 @@ static int ext4_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 				 "first meta block group too large: %u "</div><div class='ctx'> 				 "(group descriptor block count %u)",</div><div class='ctx'> 				 le32_to_cpu(es-&gt;s_first_meta_bg), db_count);</div><div class='del'>-			goto failed_mount;</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	rcu_assign_pointer(sbi-&gt;s_group_desc,</div><div class='hunk'>@@ -4547,8 +4872,7 @@ static int ext4_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 					  GFP_KERNEL));</div><div class='ctx'> 	if (sbi-&gt;s_group_desc == NULL) {</div><div class='ctx'> 		ext4_msg(sb, KERN_ERR, "not enough memory");</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto failed_mount;</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	bgl_lock_init(sbi-&gt;s_blockgroup_lock);</div><div class='hunk'>@@ -4567,144 +4891,44 @@ static int ext4_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 		if (IS_ERR(bh)) {</div><div class='ctx'> 			ext4_msg(sb, KERN_ERR,</div><div class='ctx'> 			       "can't read group descriptor %d", i);</div><div class='del'>-			db_count = i;</div><div class='del'>-			ret = PTR_ERR(bh);</div><div class='del'>-			goto failed_mount2;</div><div class='add'>+			sbi-&gt;s_gdb_count = i;</div><div class='add'>+			return PTR_ERR(bh);</div><div class='ctx'> 		}</div><div class='ctx'> 		rcu_read_lock();</div><div class='ctx'> 		rcu_dereference(sbi-&gt;s_group_desc)[i] = bh;</div><div class='ctx'> 		rcu_read_unlock();</div><div class='ctx'> 	}</div><div class='ctx'> 	sbi-&gt;s_gdb_count = db_count;</div><div class='del'>-	if (!ext4_check_descriptors(sb, logical_sb_block, &amp;first_not_zeroed)) {</div><div class='add'>+	if (!ext4_check_descriptors(sb, logical_sb_block, first_not_zeroed)) {</div><div class='ctx'> 		ext4_msg(sb, KERN_ERR, "group descriptors corrupted!");</div><div class='del'>-		ret = -EFSCORRUPTED;</div><div class='del'>-		goto failed_mount2;</div><div class='add'>+		return -EFSCORRUPTED;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	timer_setup(&amp;sbi-&gt;s_err_report, print_daily_error_info, 0);</div><div class='del'>-	spin_lock_init(&amp;sbi-&gt;s_error_lock);</div><div class='del'>-	INIT_WORK(&amp;sbi-&gt;s_error_work, flush_stashed_error_work);</div><div class='del'>-</div><div class='del'>-	/* Register extent status tree shrinker */</div><div class='del'>-	if (ext4_es_register_shrinker(sbi))</div><div class='del'>-		goto failed_mount3;</div><div class='del'>-</div><div class='del'>-	sbi-&gt;s_stripe = ext4_get_stripe_size(sbi);</div><div class='del'>-	sbi-&gt;s_extent_max_zeroout_kb = 32;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * set up enough so that it can read an inode</div><div class='del'>-	 */</div><div class='del'>-	sb-&gt;s_op = &amp;ext4_sops;</div><div class='del'>-	sb-&gt;s_export_op = &amp;ext4_export_ops;</div><div class='del'>-	sb-&gt;s_xattr = ext4_xattr_handlers;</div><div class='del'>-#ifdef CONFIG_FS_ENCRYPTION</div><div class='del'>-	sb-&gt;s_cop = &amp;ext4_cryptops;</div><div class='del'>-#endif</div><div class='del'>-#ifdef CONFIG_FS_VERITY</div><div class='del'>-	sb-&gt;s_vop = &amp;ext4_verityops;</div><div class='del'>-#endif</div><div class='del'>-#ifdef CONFIG_QUOTA</div><div class='del'>-	sb-&gt;dq_op = &amp;ext4_quota_operations;</div><div class='del'>-	if (ext4_has_feature_quota(sb))</div><div class='del'>-		sb-&gt;s_qcop = &amp;dquot_quotactl_sysfile_ops;</div><div class='del'>-	else</div><div class='del'>-		sb-&gt;s_qcop = &amp;ext4_qctl_operations;</div><div class='del'>-	sb-&gt;s_quota_types = QTYPE_MASK_USR | QTYPE_MASK_GRP | QTYPE_MASK_PRJ;</div><div class='del'>-#endif</div><div class='del'>-	memcpy(&amp;sb-&gt;s_uuid, es-&gt;s_uuid, sizeof(es-&gt;s_uuid));</div><div class='del'>-</div><div class='del'>-	INIT_LIST_HEAD(&amp;sbi-&gt;s_orphan); /* unlinked but open files */</div><div class='del'>-	mutex_init(&amp;sbi-&gt;s_orphan_lock);</div><div class='del'>-</div><div class='del'>-	/* Initialize fast commit stuff */</div><div class='del'>-	atomic_set(&amp;sbi-&gt;s_fc_subtid, 0);</div><div class='del'>-	atomic_set(&amp;sbi-&gt;s_fc_ineligible_updates, 0);</div><div class='del'>-	INIT_LIST_HEAD(&amp;sbi-&gt;s_fc_q[FC_Q_MAIN]);</div><div class='del'>-	INIT_LIST_HEAD(&amp;sbi-&gt;s_fc_q[FC_Q_STAGING]);</div><div class='del'>-	INIT_LIST_HEAD(&amp;sbi-&gt;s_fc_dentry_q[FC_Q_MAIN]);</div><div class='del'>-	INIT_LIST_HEAD(&amp;sbi-&gt;s_fc_dentry_q[FC_Q_STAGING]);</div><div class='del'>-	sbi-&gt;s_fc_bytes = 0;</div><div class='del'>-	ext4_clear_mount_flag(sb, EXT4_MF_FC_INELIGIBLE);</div><div class='del'>-	ext4_clear_mount_flag(sb, EXT4_MF_FC_COMMITTING);</div><div class='del'>-	spin_lock_init(&amp;sbi-&gt;s_fc_lock);</div><div class='del'>-	memset(&amp;sbi-&gt;s_fc_stats, 0, sizeof(sbi-&gt;s_fc_stats));</div><div class='del'>-	sbi-&gt;s_fc_replay_state.fc_regions = NULL;</div><div class='del'>-	sbi-&gt;s_fc_replay_state.fc_regions_size = 0;</div><div class='del'>-	sbi-&gt;s_fc_replay_state.fc_regions_used = 0;</div><div class='del'>-	sbi-&gt;s_fc_replay_state.fc_regions_valid = 0;</div><div class='del'>-	sbi-&gt;s_fc_replay_state.fc_modified_inodes = NULL;</div><div class='del'>-	sbi-&gt;s_fc_replay_state.fc_modified_inodes_size = 0;</div><div class='del'>-	sbi-&gt;s_fc_replay_state.fc_modified_inodes_used = 0;</div><div class='del'>-</div><div class='del'>-	sb-&gt;s_root = NULL;</div><div class='del'>-</div><div class='del'>-	needs_recovery = (es-&gt;s_last_orphan != 0 ||</div><div class='del'>-			  ext4_has_feature_orphan_present(sb) ||</div><div class='del'>-			  ext4_has_feature_journal_needs_recovery(sb));</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if (ext4_has_feature_mmp(sb) &amp;&amp; !sb_rdonly(sb))</div><div class='del'>-		if (ext4_multi_mount_protect(sb, le64_to_cpu(es-&gt;s_mmp_block)))</div><div class='del'>-			goto failed_mount3a;</div><div class='add'>+static int ext4_load_and_init_journal(struct super_block *sb,</div><div class='add'>+				      struct ext4_super_block *es,</div><div class='add'>+				      struct ext4_fs_context *ctx)</div><div class='add'>+{</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * The first inode we look at is the journal inode.  Don't try</div><div class='del'>-	 * root first: it may be modified in the journal!</div><div class='del'>-	 */</div><div class='del'>-	if (!test_opt(sb, NOLOAD) &amp;&amp; ext4_has_feature_journal(sb)) {</div><div class='del'>-		err = ext4_load_journal(sb, es, parsed_opts.journal_devnum);</div><div class='del'>-		if (err)</div><div class='del'>-			goto failed_mount3a;</div><div class='del'>-	} else if (test_opt(sb, NOLOAD) &amp;&amp; !sb_rdonly(sb) &amp;&amp;</div><div class='del'>-		   ext4_has_feature_journal_needs_recovery(sb)) {</div><div class='del'>-		ext4_msg(sb, KERN_ERR, "required journal recovery "</div><div class='del'>-		       "suppressed and not mounted read-only");</div><div class='del'>-		goto failed_mount_wq;</div><div class='del'>-	} else {</div><div class='del'>-		/* Nojournal mode, all journal mount options are illegal */</div><div class='del'>-		if (test_opt2(sb, EXPLICIT_JOURNAL_CHECKSUM)) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR, "can't mount with "</div><div class='del'>-				 "journal_checksum, fs mounted w/o journal");</div><div class='del'>-			goto failed_mount_wq;</div><div class='del'>-		}</div><div class='del'>-		if (test_opt(sb, JOURNAL_ASYNC_COMMIT)) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR, "can't mount with "</div><div class='del'>-				 "journal_async_commit, fs mounted w/o journal");</div><div class='del'>-			goto failed_mount_wq;</div><div class='del'>-		}</div><div class='del'>-		if (sbi-&gt;s_commit_interval != JBD2_DEFAULT_MAX_COMMIT_AGE*HZ) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR, "can't mount with "</div><div class='del'>-				 "commit=%lu, fs mounted w/o journal",</div><div class='del'>-				 sbi-&gt;s_commit_interval / HZ);</div><div class='del'>-			goto failed_mount_wq;</div><div class='del'>-		}</div><div class='del'>-		if (EXT4_MOUNT_DATA_FLAGS &amp;</div><div class='del'>-		    (sbi-&gt;s_mount_opt ^ sbi-&gt;s_def_mount_opt)) {</div><div class='del'>-			ext4_msg(sb, KERN_ERR, "can't mount with "</div><div class='del'>-				 "data=, fs mounted w/o journal");</div><div class='del'>-			goto failed_mount_wq;</div><div class='del'>-		}</div><div class='del'>-		sbi-&gt;s_def_mount_opt &amp;= ~EXT4_MOUNT_JOURNAL_CHECKSUM;</div><div class='del'>-		clear_opt(sb, JOURNAL_CHECKSUM);</div><div class='del'>-		clear_opt(sb, DATA_FLAGS);</div><div class='del'>-		clear_opt2(sb, JOURNAL_FAST_COMMIT);</div><div class='del'>-		sbi-&gt;s_journal = NULL;</div><div class='del'>-		needs_recovery = 0;</div><div class='del'>-		goto no_journal;</div><div class='del'>-	}</div><div class='add'>+	err = ext4_load_journal(sb, es, ctx-&gt;journal_devnum);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='ctx'> 	if (ext4_has_feature_64bit(sb) &amp;&amp;</div><div class='ctx'> 	    !jbd2_journal_set_features(EXT4_SB(sb)-&gt;s_journal, 0, 0,</div><div class='ctx'> 				       JBD2_FEATURE_INCOMPAT_64BIT)) {</div><div class='ctx'> 		ext4_msg(sb, KERN_ERR, "Failed to set 64-bit journal feature");</div><div class='del'>-		goto failed_mount_wq;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!set_journal_csum_feature_set(sb)) {</div><div class='ctx'> 		ext4_msg(sb, KERN_ERR, "Failed to set journal checksum "</div><div class='ctx'> 			 "feature set");</div><div class='del'>-		goto failed_mount_wq;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (test_opt2(sb, JOURNAL_FAST_COMMIT) &amp;&amp;</div><div class='hunk'>@@ -4712,7 +4936,7 @@ static int ext4_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 					  JBD2_FEATURE_INCOMPAT_FAST_COMMIT)) {</div><div class='ctx'> 		ext4_msg(sb, KERN_ERR,</div><div class='ctx'> 			"Failed to set fast commit journal feature");</div><div class='del'>-		goto failed_mount_wq;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* We have now updated the journal if required, so we can</div><div class='hunk'>@@ -4739,7 +4963,7 @@ static int ext4_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 		    (sbi-&gt;s_journal, 0, 0, JBD2_FEATURE_INCOMPAT_REVOKE)) {</div><div class='ctx'> 			ext4_msg(sb, KERN_ERR, "Journal does not support "</div><div class='ctx'> 			       "requested data journaling mode");</div><div class='del'>-			goto failed_mount_wq;</div><div class='add'>+			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='hunk'>@@ -4750,22 +4974,530 @@ static int ext4_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 	    test_opt(sb, JOURNAL_ASYNC_COMMIT)) {</div><div class='ctx'> 		ext4_msg(sb, KERN_ERR, "can't mount with "</div><div class='ctx'> 			"journal_async_commit in data=ordered mode");</div><div class='del'>-		goto failed_mount_wq;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	set_task_ioprio(sbi-&gt;s_journal-&gt;j_task, parsed_opts.journal_ioprio);</div><div class='add'>+	set_task_ioprio(sbi-&gt;s_journal-&gt;j_task, ctx-&gt;journal_ioprio);</div><div class='ctx'> </div><div class='ctx'> 	sbi-&gt;s_journal-&gt;j_submit_inode_data_buffers =</div><div class='ctx'> 		ext4_journal_submit_inode_data_buffers;</div><div class='ctx'> 	sbi-&gt;s_journal-&gt;j_finish_inode_data_buffers =</div><div class='ctx'> 		ext4_journal_finish_inode_data_buffers;</div><div class='ctx'> </div><div class='del'>-no_journal:</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	ext4_journal_destroy(sbi, sbi-&gt;s_journal);</div><div class='add'>+	return -EINVAL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ext4_check_journal_data_mode(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	if (test_opt(sb, DATA_FLAGS) == EXT4_MOUNT_JOURNAL_DATA) {</div><div class='add'>+		printk_once(KERN_WARNING "EXT4-fs: Warning: mounting with "</div><div class='add'>+			    "data=journal disables delayed allocation, "</div><div class='add'>+			    "dioread_nolock, O_DIRECT and fast_commit support!\n");</div><div class='add'>+		/* can't mount with both data=journal and dioread_nolock. */</div><div class='add'>+		clear_opt(sb, DIOREAD_NOLOCK);</div><div class='add'>+		clear_opt2(sb, JOURNAL_FAST_COMMIT);</div><div class='add'>+		if (test_opt2(sb, EXPLICIT_DELALLOC)) {</div><div class='add'>+			ext4_msg(sb, KERN_ERR, "can't mount with "</div><div class='add'>+				 "both data=journal and delalloc");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		if (test_opt(sb, DAX_ALWAYS)) {</div><div class='add'>+			ext4_msg(sb, KERN_ERR, "can't mount with "</div><div class='add'>+				 "both data=journal and dax");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		if (ext4_has_feature_encrypt(sb)) {</div><div class='add'>+			ext4_msg(sb, KERN_WARNING,</div><div class='add'>+				 "encrypted files will use data=ordered "</div><div class='add'>+				 "instead of data journaling mode");</div><div class='add'>+		}</div><div class='add'>+		if (test_opt(sb, DELALLOC))</div><div class='add'>+			clear_opt(sb, DELALLOC);</div><div class='add'>+	} else {</div><div class='add'>+		sb-&gt;s_iflags |= SB_I_CGROUPWB;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const char *ext4_has_journal_option(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+</div><div class='add'>+	if (test_opt(sb, JOURNAL_ASYNC_COMMIT))</div><div class='add'>+		return "journal_async_commit";</div><div class='add'>+	if (test_opt2(sb, EXPLICIT_JOURNAL_CHECKSUM))</div><div class='add'>+		return "journal_checksum";</div><div class='add'>+	if (sbi-&gt;s_commit_interval != JBD2_DEFAULT_MAX_COMMIT_AGE*HZ)</div><div class='add'>+		return "commit=";</div><div class='add'>+	if (EXT4_MOUNT_DATA_FLAGS &amp;</div><div class='add'>+	    (sbi-&gt;s_mount_opt ^ sbi-&gt;s_def_mount_opt))</div><div class='add'>+		return "data=";</div><div class='add'>+	if (test_opt(sb, DATA_ERR_ABORT))</div><div class='add'>+		return "data_err=abort";</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Limit the maximum folio order to 2048 blocks to prevent overestimation</div><div class='add'>+ * of reserve handle credits during the folio writeback in environments</div><div class='add'>+ * where the PAGE_SIZE exceeds 4KB.</div><div class='add'>+ */</div><div class='add'>+#define EXT4_MAX_PAGECACHE_ORDER(sb)		\</div><div class='add'>+		umin(MAX_PAGECACHE_ORDER, (11 + (sb)-&gt;s_blocksize_bits - PAGE_SHIFT))</div><div class='add'>+static void ext4_set_max_mapping_order(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+</div><div class='add'>+	if (test_opt(sb, DATA_FLAGS) == EXT4_MOUNT_JOURNAL_DATA)</div><div class='add'>+		sbi-&gt;s_max_folio_order = sbi-&gt;s_min_folio_order;</div><div class='add'>+	else</div><div class='add'>+		sbi-&gt;s_max_folio_order = EXT4_MAX_PAGECACHE_ORDER(sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ext4_check_large_folio(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	const char *err_str = NULL;</div><div class='add'>+</div><div class='add'>+	if (ext4_has_feature_encrypt(sb))</div><div class='add'>+		err_str = "encrypt";</div><div class='add'>+</div><div class='add'>+	if (!err_str) {</div><div class='add'>+		ext4_set_max_mapping_order(sb);</div><div class='add'>+	} else if (sb-&gt;s_blocksize &gt; PAGE_SIZE) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR, "bs(%lu) &gt; ps(%lu) unsupported for %s",</div><div class='add'>+			 sb-&gt;s_blocksize, PAGE_SIZE, err_str);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ext4_load_super(struct super_block *sb, ext4_fsblk_t *lsb,</div><div class='add'>+			   int silent)</div><div class='add'>+{</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	struct ext4_super_block *es;</div><div class='add'>+	ext4_fsblk_t logical_sb_block;</div><div class='add'>+	unsigned long offset = 0;</div><div class='add'>+	struct buffer_head *bh;</div><div class='add'>+	int ret = -EINVAL;</div><div class='add'>+	int blocksize;</div><div class='add'>+</div><div class='add'>+	blocksize = sb_min_blocksize(sb, EXT4_MIN_BLOCK_SIZE);</div><div class='add'>+	if (!blocksize) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR, "unable to set blocksize");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The ext4 superblock will not be buffer aligned for other than 1kB</div><div class='add'>+	 * block sizes.  We need to calculate the offset from buffer start.</div><div class='add'>+	 */</div><div class='add'>+	if (blocksize != EXT4_MIN_BLOCK_SIZE) {</div><div class='add'>+		logical_sb_block = sbi-&gt;s_sb_block * EXT4_MIN_BLOCK_SIZE;</div><div class='add'>+		offset = do_div(logical_sb_block, blocksize);</div><div class='add'>+	} else {</div><div class='add'>+		logical_sb_block = sbi-&gt;s_sb_block;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	bh = ext4_sb_bread_unmovable(sb, logical_sb_block);</div><div class='add'>+	if (IS_ERR(bh)) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR, "unable to read superblock");</div><div class='add'>+		return PTR_ERR(bh);</div><div class='add'>+	}</div><div class='add'>+	/*</div><div class='add'>+	 * Note: s_es must be initialized as soon as possible because</div><div class='add'>+	 *       some ext4 macro-instructions depend on its value</div><div class='add'>+	 */</div><div class='add'>+	es = (struct ext4_super_block *) (bh-&gt;b_data + offset);</div><div class='add'>+	sbi-&gt;s_es = es;</div><div class='add'>+	sb-&gt;s_magic = le16_to_cpu(es-&gt;s_magic);</div><div class='add'>+	if (sb-&gt;s_magic != EXT4_SUPER_MAGIC) {</div><div class='add'>+		if (!silent)</div><div class='add'>+			ext4_msg(sb, KERN_ERR, "VFS: Can't find ext4 filesystem");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (le32_to_cpu(es-&gt;s_log_block_size) &gt;</div><div class='add'>+	    (EXT4_MAX_BLOCK_LOG_SIZE - EXT4_MIN_BLOCK_LOG_SIZE)) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR,</div><div class='add'>+			 "Invalid log block size: %u",</div><div class='add'>+			 le32_to_cpu(es-&gt;s_log_block_size));</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	if (le32_to_cpu(es-&gt;s_log_cluster_size) &gt;</div><div class='add'>+	    (EXT4_MAX_CLUSTER_LOG_SIZE - EXT4_MIN_BLOCK_LOG_SIZE)) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR,</div><div class='add'>+			 "Invalid log cluster size: %u",</div><div class='add'>+			 le32_to_cpu(es-&gt;s_log_cluster_size));</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	blocksize = EXT4_MIN_BLOCK_SIZE &lt;&lt; le32_to_cpu(es-&gt;s_log_block_size);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If the default block size is not the same as the real block size,</div><div class='add'>+	 * we need to reload it.</div><div class='add'>+	 */</div><div class='add'>+	if (sb-&gt;s_blocksize == blocksize)</div><div class='add'>+		goto success;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * bh must be released before kill_bdev(), otherwise</div><div class='add'>+	 * it won't be freed and its page also. kill_bdev()</div><div class='add'>+	 * is called by sb_set_blocksize().</div><div class='add'>+	 */</div><div class='add'>+	brelse(bh);</div><div class='add'>+	/* Validate the filesystem blocksize */</div><div class='add'>+	if (!sb_set_blocksize(sb, blocksize)) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR, "bad block size %d",</div><div class='add'>+				blocksize);</div><div class='add'>+		bh = NULL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	logical_sb_block = sbi-&gt;s_sb_block * EXT4_MIN_BLOCK_SIZE;</div><div class='add'>+	offset = do_div(logical_sb_block, blocksize);</div><div class='add'>+	bh = ext4_sb_bread_unmovable(sb, logical_sb_block);</div><div class='add'>+	if (IS_ERR(bh)) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR, "Can't read superblock on 2nd try");</div><div class='add'>+		ret = PTR_ERR(bh);</div><div class='add'>+		bh = NULL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	es = (struct ext4_super_block *)(bh-&gt;b_data + offset);</div><div class='add'>+	sbi-&gt;s_es = es;</div><div class='add'>+	if (es-&gt;s_magic != cpu_to_le16(EXT4_SUPER_MAGIC)) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR, "Magic mismatch, very weird!");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+success:</div><div class='add'>+	sbi-&gt;s_min_folio_order = get_order(blocksize);</div><div class='add'>+	*lsb = logical_sb_block;</div><div class='add'>+	sbi-&gt;s_sbh = bh;</div><div class='add'>+	return 0;</div><div class='add'>+out:</div><div class='add'>+	brelse(bh);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ext4_hash_info_init(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	struct ext4_super_block *es = sbi-&gt;s_es;</div><div class='add'>+	unsigned int i;</div><div class='add'>+</div><div class='add'>+	sbi-&gt;s_def_hash_version = es-&gt;s_def_hash_version;</div><div class='add'>+</div><div class='add'>+	if (sbi-&gt;s_def_hash_version &gt; DX_HASH_LAST) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR,</div><div class='add'>+			 "Invalid default hash set in the superblock");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	} else if (sbi-&gt;s_def_hash_version == DX_HASH_SIPHASH) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR,</div><div class='add'>+			 "SIPHASH is not a valid default hash value");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; 4; i++)</div><div class='add'>+		sbi-&gt;s_hash_seed[i] = le32_to_cpu(es-&gt;s_hash_seed[i]);</div><div class='add'>+</div><div class='add'>+	if (ext4_has_feature_dir_index(sb)) {</div><div class='add'>+		i = le32_to_cpu(es-&gt;s_flags);</div><div class='add'>+		if (i &amp; EXT2_FLAGS_UNSIGNED_HASH)</div><div class='add'>+			sbi-&gt;s_hash_unsigned = 3;</div><div class='add'>+		else if ((i &amp; EXT2_FLAGS_SIGNED_HASH) == 0) {</div><div class='add'>+#ifdef __CHAR_UNSIGNED__</div><div class='add'>+			if (!sb_rdonly(sb))</div><div class='add'>+				es-&gt;s_flags |=</div><div class='add'>+					cpu_to_le32(EXT2_FLAGS_UNSIGNED_HASH);</div><div class='add'>+			sbi-&gt;s_hash_unsigned = 3;</div><div class='add'>+#else</div><div class='add'>+			if (!sb_rdonly(sb))</div><div class='add'>+				es-&gt;s_flags |=</div><div class='add'>+					cpu_to_le32(EXT2_FLAGS_SIGNED_HASH);</div><div class='add'>+#endif</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ext4_block_group_meta_init(struct super_block *sb, int silent)</div><div class='add'>+{</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	struct ext4_super_block *es = sbi-&gt;s_es;</div><div class='add'>+	int has_huge_files;</div><div class='add'>+</div><div class='add'>+	has_huge_files = ext4_has_feature_huge_file(sb);</div><div class='add'>+	sbi-&gt;s_bitmap_maxbytes = ext4_max_bitmap_size(sb-&gt;s_blocksize_bits,</div><div class='add'>+						      has_huge_files);</div><div class='add'>+	sb-&gt;s_maxbytes = ext4_max_size(sb-&gt;s_blocksize_bits, has_huge_files);</div><div class='add'>+</div><div class='add'>+	sbi-&gt;s_desc_size = le16_to_cpu(es-&gt;s_desc_size);</div><div class='add'>+	if (ext4_has_feature_64bit(sb)) {</div><div class='add'>+		if (sbi-&gt;s_desc_size &lt; EXT4_MIN_DESC_SIZE_64BIT ||</div><div class='add'>+		    sbi-&gt;s_desc_size &gt; EXT4_MAX_DESC_SIZE ||</div><div class='add'>+		    !is_power_of_2(sbi-&gt;s_desc_size)) {</div><div class='add'>+			ext4_msg(sb, KERN_ERR,</div><div class='add'>+			       "unsupported descriptor size %lu",</div><div class='add'>+			       sbi-&gt;s_desc_size);</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+	} else</div><div class='add'>+		sbi-&gt;s_desc_size = EXT4_MIN_DESC_SIZE;</div><div class='add'>+</div><div class='add'>+	sbi-&gt;s_blocks_per_group = le32_to_cpu(es-&gt;s_blocks_per_group);</div><div class='add'>+	sbi-&gt;s_inodes_per_group = le32_to_cpu(es-&gt;s_inodes_per_group);</div><div class='add'>+</div><div class='add'>+	sbi-&gt;s_inodes_per_block = sb-&gt;s_blocksize / EXT4_INODE_SIZE(sb);</div><div class='add'>+	if (sbi-&gt;s_inodes_per_block == 0 || sbi-&gt;s_blocks_per_group == 0) {</div><div class='add'>+		if (!silent)</div><div class='add'>+			ext4_msg(sb, KERN_ERR, "VFS: Can't find ext4 filesystem");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+	if (sbi-&gt;s_inodes_per_group &lt; sbi-&gt;s_inodes_per_block ||</div><div class='add'>+	    sbi-&gt;s_inodes_per_group &gt; sb-&gt;s_blocksize * 8) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR, "invalid inodes per group: %lu\n",</div><div class='add'>+			 sbi-&gt;s_inodes_per_group);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+	sbi-&gt;s_itb_per_group = sbi-&gt;s_inodes_per_group /</div><div class='add'>+					sbi-&gt;s_inodes_per_block;</div><div class='add'>+	sbi-&gt;s_desc_per_block = sb-&gt;s_blocksize / EXT4_DESC_SIZE(sb);</div><div class='add'>+	sbi-&gt;s_mount_state = le16_to_cpu(es-&gt;s_state) &amp; ~EXT4_FC_REPLAY;</div><div class='add'>+	sbi-&gt;s_addr_per_block_bits = ilog2(EXT4_ADDR_PER_BLOCK(sb));</div><div class='add'>+	sbi-&gt;s_desc_per_block_bits = ilog2(EXT4_DESC_PER_BLOCK(sb));</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * It's hard to get stripe aligned blocks if stripe is not aligned with</div><div class='add'>+ * cluster, just disable stripe and alert user to simplify code and avoid</div><div class='add'>+ * stripe aligned allocation which will rarely succeed.</div><div class='add'>+ */</div><div class='add'>+static bool ext4_is_stripe_incompatible(struct super_block *sb, unsigned long stripe)</div><div class='add'>+{</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	return (stripe &gt; 0 &amp;&amp; sbi-&gt;s_cluster_ratio &gt; 1 &amp;&amp;</div><div class='add'>+		stripe % sbi-&gt;s_cluster_ratio != 0);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int __ext4_fill_super(struct fs_context *fc, struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct ext4_super_block *es = NULL;</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	ext4_fsblk_t logical_sb_block;</div><div class='add'>+	struct inode *root;</div><div class='add'>+	int needs_recovery;</div><div class='add'>+	int err;</div><div class='add'>+	ext4_group_t first_not_zeroed;</div><div class='add'>+	struct ext4_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	int silent = fc-&gt;sb_flags &amp; SB_SILENT;</div><div class='add'>+</div><div class='add'>+	/* Set defaults for the variables that will be set during parsing */</div><div class='add'>+	if (!(ctx-&gt;spec &amp; EXT4_SPEC_JOURNAL_IOPRIO))</div><div class='add'>+		ctx-&gt;journal_ioprio = EXT4_DEF_JOURNAL_IOPRIO;</div><div class='add'>+</div><div class='add'>+	sbi-&gt;s_inode_readahead_blks = EXT4_DEF_INODE_READAHEAD_BLKS;</div><div class='add'>+	sbi-&gt;s_sectors_written_start =</div><div class='add'>+		part_stat_read(sb-&gt;s_bdev, sectors[STAT_WRITE]);</div><div class='add'>+</div><div class='add'>+	err = ext4_load_super(sb, &amp;logical_sb_block, silent);</div><div class='add'>+	if (err)</div><div class='add'>+		goto out_fail;</div><div class='add'>+</div><div class='add'>+	es = sbi-&gt;s_es;</div><div class='add'>+	sbi-&gt;s_kbytes_written = le64_to_cpu(es-&gt;s_kbytes_written);</div><div class='add'>+</div><div class='add'>+	err = ext4_init_metadata_csum(sb, es);</div><div class='add'>+	if (err)</div><div class='add'>+		goto failed_mount;</div><div class='add'>+</div><div class='add'>+	ext4_set_def_opts(sb, es);</div><div class='add'>+</div><div class='add'>+	sbi-&gt;s_resuid = make_kuid(&amp;init_user_ns, ext4_get_resuid(es));</div><div class='add'>+	sbi-&gt;s_resgid = make_kgid(&amp;init_user_ns, ext4_get_resuid(es));</div><div class='add'>+	sbi-&gt;s_commit_interval = JBD2_DEFAULT_MAX_COMMIT_AGE * HZ;</div><div class='add'>+	sbi-&gt;s_min_batch_time = EXT4_DEF_MIN_BATCH_TIME;</div><div class='add'>+	sbi-&gt;s_max_batch_time = EXT4_DEF_MAX_BATCH_TIME;</div><div class='add'>+	sbi-&gt;s_sb_update_kb = EXT4_DEF_SB_UPDATE_INTERVAL_KB;</div><div class='add'>+	sbi-&gt;s_sb_update_sec = EXT4_DEF_SB_UPDATE_INTERVAL_SEC;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * set default s_li_wait_mult for lazyinit, for the case there is</div><div class='add'>+	 * no mount option specified.</div><div class='add'>+	 */</div><div class='add'>+	sbi-&gt;s_li_wait_mult = EXT4_DEF_LI_WAIT_MULT;</div><div class='add'>+</div><div class='add'>+	err = ext4_inode_info_init(sb, es);</div><div class='add'>+	if (err)</div><div class='add'>+		goto failed_mount;</div><div class='add'>+</div><div class='add'>+	err = parse_apply_sb_mount_options(sb, ctx);</div><div class='add'>+	if (err &lt; 0)</div><div class='add'>+		goto failed_mount;</div><div class='add'>+</div><div class='add'>+	sbi-&gt;s_def_mount_opt = sbi-&gt;s_mount_opt;</div><div class='add'>+	sbi-&gt;s_def_mount_opt2 = sbi-&gt;s_mount_opt2;</div><div class='add'>+</div><div class='add'>+	err = ext4_check_opt_consistency(fc, sb);</div><div class='add'>+	if (err &lt; 0)</div><div class='add'>+		goto failed_mount;</div><div class='add'>+</div><div class='add'>+	ext4_apply_options(fc, sb);</div><div class='add'>+</div><div class='add'>+	err = ext4_check_large_folio(sb);</div><div class='add'>+	if (err &lt; 0)</div><div class='add'>+		goto failed_mount;</div><div class='add'>+</div><div class='add'>+	err = ext4_encoding_init(sb, es);</div><div class='add'>+	if (err)</div><div class='add'>+		goto failed_mount;</div><div class='add'>+</div><div class='add'>+	err = ext4_check_journal_data_mode(sb);</div><div class='add'>+	if (err)</div><div class='add'>+		goto failed_mount;</div><div class='add'>+</div><div class='add'>+	sb-&gt;s_flags = (sb-&gt;s_flags &amp; ~SB_POSIXACL) |</div><div class='add'>+		(test_opt(sb, POSIX_ACL) ? SB_POSIXACL : 0);</div><div class='add'>+</div><div class='add'>+	/* HSM events are allowed by default. */</div><div class='add'>+	sb-&gt;s_iflags |= SB_I_ALLOW_HSM;</div><div class='add'>+</div><div class='add'>+	err = ext4_check_feature_compatibility(sb, es, silent);</div><div class='add'>+	if (err)</div><div class='add'>+		goto failed_mount;</div><div class='add'>+</div><div class='add'>+	err = ext4_block_group_meta_init(sb, silent);</div><div class='add'>+	if (err)</div><div class='add'>+		goto failed_mount;</div><div class='add'>+</div><div class='add'>+	err = ext4_hash_info_init(sb);</div><div class='add'>+	if (err)</div><div class='add'>+		goto failed_mount;</div><div class='add'>+</div><div class='add'>+	err = ext4_handle_clustersize(sb);</div><div class='add'>+	if (err)</div><div class='add'>+		goto failed_mount;</div><div class='add'>+</div><div class='add'>+	err = ext4_check_geometry(sb, es);</div><div class='add'>+	if (err)</div><div class='add'>+		goto failed_mount;</div><div class='add'>+</div><div class='add'>+	timer_setup(&amp;sbi-&gt;s_err_report, print_daily_error_info, 0);</div><div class='add'>+	spin_lock_init(&amp;sbi-&gt;s_error_lock);</div><div class='add'>+	INIT_WORK(&amp;sbi-&gt;s_sb_upd_work, update_super_work);</div><div class='add'>+</div><div class='add'>+	err = ext4_group_desc_init(sb, es, logical_sb_block, &amp;first_not_zeroed);</div><div class='add'>+	if (err)</div><div class='add'>+		goto failed_mount3;</div><div class='add'>+</div><div class='add'>+	err = ext4_es_register_shrinker(sbi);</div><div class='add'>+	if (err)</div><div class='add'>+		goto failed_mount3;</div><div class='add'>+</div><div class='add'>+	sbi-&gt;s_stripe = ext4_get_stripe_size(sbi);</div><div class='add'>+	if (ext4_is_stripe_incompatible(sb, sbi-&gt;s_stripe)) {</div><div class='add'>+		ext4_msg(sb, KERN_WARNING,</div><div class='add'>+			 "stripe (%lu) is not aligned with cluster size (%u), "</div><div class='add'>+			 "stripe is disabled",</div><div class='add'>+			 sbi-&gt;s_stripe, sbi-&gt;s_cluster_ratio);</div><div class='add'>+		sbi-&gt;s_stripe = 0;</div><div class='add'>+	}</div><div class='add'>+	sbi-&gt;s_extent_max_zeroout_kb = 32;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * set up enough so that it can read an inode</div><div class='add'>+	 */</div><div class='add'>+	sb-&gt;s_op = &amp;ext4_sops;</div><div class='add'>+	sb-&gt;s_export_op = &amp;ext4_export_ops;</div><div class='add'>+	sb-&gt;s_xattr = ext4_xattr_handlers;</div><div class='add'>+#ifdef CONFIG_FS_ENCRYPTION</div><div class='add'>+	sb-&gt;s_cop = &amp;ext4_cryptops;</div><div class='add'>+#endif</div><div class='add'>+#ifdef CONFIG_FS_VERITY</div><div class='add'>+	sb-&gt;s_vop = &amp;ext4_verityops;</div><div class='add'>+#endif</div><div class='add'>+#ifdef CONFIG_QUOTA</div><div class='add'>+	sb-&gt;dq_op = &amp;ext4_quota_operations;</div><div class='add'>+	if (ext4_has_feature_quota(sb))</div><div class='add'>+		sb-&gt;s_qcop = &amp;dquot_quotactl_sysfile_ops;</div><div class='add'>+	else</div><div class='add'>+		sb-&gt;s_qcop = &amp;ext4_qctl_operations;</div><div class='add'>+	sb-&gt;s_quota_types = QTYPE_MASK_USR | QTYPE_MASK_GRP | QTYPE_MASK_PRJ;</div><div class='add'>+#endif</div><div class='add'>+	super_set_uuid(sb, es-&gt;s_uuid, sizeof(es-&gt;s_uuid));</div><div class='add'>+	super_set_sysfs_name_bdev(sb);</div><div class='add'>+</div><div class='add'>+	INIT_LIST_HEAD(&amp;sbi-&gt;s_orphan); /* unlinked but open files */</div><div class='add'>+	mutex_init(&amp;sbi-&gt;s_orphan_lock);</div><div class='add'>+</div><div class='add'>+	spin_lock_init(&amp;sbi-&gt;s_bdev_wb_lock);</div><div class='add'>+</div><div class='add'>+	ext4_atomic_write_init(sb);</div><div class='add'>+	ext4_fast_commit_init(sb);</div><div class='add'>+</div><div class='add'>+	sb-&gt;s_root = NULL;</div><div class='add'>+</div><div class='add'>+	needs_recovery = (es-&gt;s_last_orphan != 0 ||</div><div class='add'>+			  ext4_has_feature_orphan_present(sb) ||</div><div class='add'>+			  ext4_has_feature_journal_needs_recovery(sb));</div><div class='add'>+</div><div class='add'>+	if (ext4_has_feature_mmp(sb) &amp;&amp; !sb_rdonly(sb)) {</div><div class='add'>+		err = ext4_multi_mount_protect(sb, le64_to_cpu(es-&gt;s_mmp_block));</div><div class='add'>+		if (err)</div><div class='add'>+			goto failed_mount3a;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	err = -EINVAL;</div><div class='add'>+	/*</div><div class='add'>+	 * The first inode we look at is the journal inode.  Don't try</div><div class='add'>+	 * root first: it may be modified in the journal!</div><div class='add'>+	 */</div><div class='add'>+	if (!test_opt(sb, NOLOAD) &amp;&amp; ext4_has_feature_journal(sb)) {</div><div class='add'>+		err = ext4_load_and_init_journal(sb, es, ctx);</div><div class='add'>+		if (err)</div><div class='add'>+			goto failed_mount3a;</div><div class='add'>+		if (bdev_read_only(sb-&gt;s_bdev))</div><div class='add'>+		    needs_recovery = 0;</div><div class='add'>+	} else if (test_opt(sb, NOLOAD) &amp;&amp; !sb_rdonly(sb) &amp;&amp;</div><div class='add'>+		   ext4_has_feature_journal_needs_recovery(sb)) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR, "required journal recovery "</div><div class='add'>+		       "suppressed and not mounted read-only");</div><div class='add'>+		goto failed_mount3a;</div><div class='add'>+	} else {</div><div class='add'>+		const char *journal_option;</div><div class='add'>+</div><div class='add'>+		/* Nojournal mode, all journal mount options are illegal */</div><div class='add'>+		journal_option = ext4_has_journal_option(sb);</div><div class='add'>+		if (journal_option != NULL) {</div><div class='add'>+			ext4_msg(sb, KERN_ERR,</div><div class='add'>+				 "can't mount with %s, fs mounted w/o journal",</div><div class='add'>+				 journal_option);</div><div class='add'>+			goto failed_mount3a;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		sbi-&gt;s_def_mount_opt &amp;= ~EXT4_MOUNT_JOURNAL_CHECKSUM;</div><div class='add'>+		clear_opt(sb, JOURNAL_CHECKSUM);</div><div class='add'>+		clear_opt(sb, DATA_FLAGS);</div><div class='add'>+		clear_opt2(sb, JOURNAL_FAST_COMMIT);</div><div class='add'>+		sbi-&gt;s_journal = NULL;</div><div class='add'>+		needs_recovery = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (!test_opt(sb, NO_MBCACHE)) {</div><div class='ctx'> 		sbi-&gt;s_ea_block_cache = ext4_xattr_create_cache();</div><div class='ctx'> 		if (!sbi-&gt;s_ea_block_cache) {</div><div class='ctx'> 			ext4_msg(sb, KERN_ERR,</div><div class='ctx'> 				 "Failed to create ea_block_cache");</div><div class='add'>+			err = -EINVAL;</div><div class='ctx'> 			goto failed_mount_wq;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -4774,29 +5506,28 @@ no_journal:</div><div class='ctx'> 			if (!sbi-&gt;s_ea_inode_cache) {</div><div class='ctx'> 				ext4_msg(sb, KERN_ERR,</div><div class='ctx'> 					 "Failed to create ea_inode_cache");</div><div class='add'>+				err = -EINVAL;</div><div class='ctx'> 				goto failed_mount_wq;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (ext4_has_feature_verity(sb) &amp;&amp; blocksize != PAGE_SIZE) {</div><div class='del'>-		ext4_msg(sb, KERN_ERR, "Unsupported blocksize for fs-verity");</div><div class='del'>-		goto failed_mount_wq;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (DUMMY_ENCRYPTION_ENABLED(sbi) &amp;&amp; !sb_rdonly(sb) &amp;&amp;</div><div class='del'>-	    !ext4_has_feature_encrypt(sb)) {</div><div class='del'>-		ext4_set_feature_encrypt(sb);</div><div class='del'>-		ext4_commit_super(sb);</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Get the # of file system overhead blocks from the</div><div class='ctx'> 	 * superblock if present.</div><div class='ctx'> 	 */</div><div class='del'>-	if (es-&gt;s_overhead_clusters)</div><div class='del'>-		sbi-&gt;s_overhead = le32_to_cpu(es-&gt;s_overhead_clusters);</div><div class='del'>-	else {</div><div class='add'>+	sbi-&gt;s_overhead = le32_to_cpu(es-&gt;s_overhead_clusters);</div><div class='add'>+	/* ignore the precalculated value if it is ridiculous */</div><div class='add'>+	if (sbi-&gt;s_overhead &gt; ext4_blocks_count(es))</div><div class='add'>+		sbi-&gt;s_overhead = 0;</div><div class='add'>+	/*</div><div class='add'>+	 * If the bigalloc feature is not enabled recalculating the</div><div class='add'>+	 * overhead doesn't take long, so we might as well just redo</div><div class='add'>+	 * it to make sure we are using the correct value.</div><div class='add'>+	 */</div><div class='add'>+	if (!ext4_has_feature_bigalloc(sb))</div><div class='add'>+		sbi-&gt;s_overhead = 0;</div><div class='add'>+	if (sbi-&gt;s_overhead == 0) {</div><div class='ctx'> 		err = ext4_calculate_overhead(sb);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto failed_mount_wq;</div><div class='hunk'>@@ -4810,7 +5541,7 @@ no_journal:</div><div class='ctx'> 		alloc_workqueue("ext4-rsv-conversion", WQ_MEM_RECLAIM | WQ_UNBOUND, 1);</div><div class='ctx'> 	if (!EXT4_SB(sb)-&gt;rsv_conversion_wq) {</div><div class='ctx'> 		printk(KERN_ERR "EXT4-fs: failed to create workqueue\n");</div><div class='del'>-		ret = -ENOMEM;</div><div class='add'>+		err = -ENOMEM;</div><div class='ctx'> 		goto failed_mount4;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -4822,28 +5553,29 @@ no_journal:</div><div class='ctx'> 	root = ext4_iget(sb, EXT4_ROOT_INO, EXT4_IGET_SPECIAL);</div><div class='ctx'> 	if (IS_ERR(root)) {</div><div class='ctx'> 		ext4_msg(sb, KERN_ERR, "get root inode failed");</div><div class='del'>-		ret = PTR_ERR(root);</div><div class='add'>+		err = PTR_ERR(root);</div><div class='ctx'> 		root = NULL;</div><div class='ctx'> 		goto failed_mount4;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!S_ISDIR(root-&gt;i_mode) || !root-&gt;i_blocks || !root-&gt;i_size) {</div><div class='ctx'> 		ext4_msg(sb, KERN_ERR, "corrupt root inode, run e2fsck");</div><div class='ctx'> 		iput(root);</div><div class='add'>+		err = -EFSCORRUPTED;</div><div class='ctx'> 		goto failed_mount4;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	generic_set_sb_d_ops(sb);</div><div class='ctx'> 	sb-&gt;s_root = d_make_root(root);</div><div class='ctx'> 	if (!sb-&gt;s_root) {</div><div class='ctx'> 		ext4_msg(sb, KERN_ERR, "get root dentry failed");</div><div class='del'>-		ret = -ENOMEM;</div><div class='add'>+		err = -ENOMEM;</div><div class='ctx'> 		goto failed_mount4;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = ext4_setup_super(sb, es, sb_rdonly(sb));</div><div class='del'>-	if (ret == -EROFS) {</div><div class='add'>+	err = ext4_setup_super(sb, es, sb_rdonly(sb));</div><div class='add'>+	if (err == -EROFS) {</div><div class='ctx'> 		sb-&gt;s_flags |= SB_RDONLY;</div><div class='del'>-		ret = 0;</div><div class='del'>-	} else if (ret)</div><div class='add'>+	} else if (err)</div><div class='ctx'> 		goto failed_mount4a;</div><div class='ctx'> </div><div class='ctx'> 	ext4_set_resv_clusters(sb);</div><div class='hunk'>@@ -4865,12 +5597,12 @@ no_journal:</div><div class='ctx'> 	 * turned off by passing "mb_optimize_scan=0". This can also be</div><div class='ctx'> 	 * turned on forcefully by passing "mb_optimize_scan=1".</div><div class='ctx'> 	 */</div><div class='del'>-	if (parsed_opts.mb_optimize_scan == 1)</div><div class='del'>-		set_opt2(sb, MB_OPTIMIZE_SCAN);</div><div class='del'>-	else if (parsed_opts.mb_optimize_scan == 0)</div><div class='del'>-		clear_opt2(sb, MB_OPTIMIZE_SCAN);</div><div class='del'>-	else if (sbi-&gt;s_groups_count &gt;= MB_DEFAULT_LINEAR_SCAN_THRESHOLD)</div><div class='del'>-		set_opt2(sb, MB_OPTIMIZE_SCAN);</div><div class='add'>+	if (!(ctx-&gt;spec &amp; EXT4_SPEC_mb_optimize_scan)) {</div><div class='add'>+		if (sbi-&gt;s_groups_count &gt;= MB_DEFAULT_LINEAR_SCAN_THRESHOLD)</div><div class='add'>+			set_opt2(sb, MB_OPTIMIZE_SCAN);</div><div class='add'>+		else</div><div class='add'>+			clear_opt2(sb, MB_OPTIMIZE_SCAN);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	err = ext4_mb_init(sb);</div><div class='ctx'> 	if (err) {</div><div class='hunk'>@@ -4887,48 +5619,16 @@ no_journal:</div><div class='ctx'> 		sbi-&gt;s_journal-&gt;j_commit_callback =</div><div class='ctx'> 			ext4_journal_commit_callback;</div><div class='ctx'> </div><div class='del'>-	block = ext4_count_free_clusters(sb);</div><div class='del'>-	ext4_free_blocks_count_set(sbi-&gt;s_es,</div><div class='del'>-				   EXT4_C2B(sbi, block));</div><div class='del'>-	err = percpu_counter_init(&amp;sbi-&gt;s_freeclusters_counter, block,</div><div class='del'>-				  GFP_KERNEL);</div><div class='del'>-	if (!err) {</div><div class='del'>-		unsigned long freei = ext4_count_free_inodes(sb);</div><div class='del'>-		sbi-&gt;s_es-&gt;s_free_inodes_count = cpu_to_le32(freei);</div><div class='del'>-		err = percpu_counter_init(&amp;sbi-&gt;s_freeinodes_counter, freei,</div><div class='del'>-					  GFP_KERNEL);</div><div class='del'>-	}</div><div class='del'>-	/*</div><div class='del'>-	 * Update the checksum after updating free space/inode</div><div class='del'>-	 * counters.  Otherwise the superblock can have an incorrect</div><div class='del'>-	 * checksum in the buffer cache until it is written out and</div><div class='del'>-	 * e2fsprogs programs trying to open a file system immediately</div><div class='del'>-	 * after it is mounted can fail.</div><div class='del'>-	 */</div><div class='del'>-	ext4_superblock_csum_set(sb);</div><div class='del'>-	if (!err)</div><div class='del'>-		err = percpu_counter_init(&amp;sbi-&gt;s_dirs_counter,</div><div class='del'>-					  ext4_count_dirs(sb), GFP_KERNEL);</div><div class='del'>-	if (!err)</div><div class='del'>-		err = percpu_counter_init(&amp;sbi-&gt;s_dirtyclusters_counter, 0,</div><div class='del'>-					  GFP_KERNEL);</div><div class='del'>-	if (!err)</div><div class='del'>-		err = percpu_counter_init(&amp;sbi-&gt;s_sra_exceeded_retry_limit, 0,</div><div class='del'>-					  GFP_KERNEL);</div><div class='del'>-	if (!err)</div><div class='del'>-		err = percpu_init_rwsem(&amp;sbi-&gt;s_writepages_rwsem);</div><div class='del'>-</div><div class='del'>-	if (err) {</div><div class='del'>-		ext4_msg(sb, KERN_ERR, "insufficient memory");</div><div class='add'>+	err = ext4_percpu_param_init(sbi);</div><div class='add'>+	if (err)</div><div class='ctx'> 		goto failed_mount6;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	if (ext4_has_feature_flex_bg(sb))</div><div class='ctx'> 		if (!ext4_fill_flex_info(sb)) {</div><div class='ctx'> 			ext4_msg(sb, KERN_ERR,</div><div class='ctx'> 			       "unable to initialize "</div><div class='ctx'> 			       "flex_bg meta info!");</div><div class='del'>-			ret = -ENOMEM;</div><div class='add'>+			err = -ENOMEM;</div><div class='ctx'> 			goto failed_mount6;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -4936,19 +5636,15 @@ no_journal:</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto failed_mount6;</div><div class='ctx'> </div><div class='del'>-	err = ext4_register_sysfs(sb);</div><div class='del'>-	if (err)</div><div class='del'>-		goto failed_mount7;</div><div class='del'>-</div><div class='ctx'> 	err = ext4_init_orphan_info(sb);</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto failed_mount8;</div><div class='add'>+		goto failed_mount7;</div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='ctx'> 	/* Enable quota usage during mount. */</div><div class='ctx'> 	if (ext4_has_feature_quota(sb) &amp;&amp; !sb_rdonly(sb)) {</div><div class='ctx'> 		err = ext4_enable_quotas(sb);</div><div class='ctx'> 		if (err)</div><div class='del'>-			goto failed_mount9;</div><div class='add'>+			goto failed_mount8;</div><div class='ctx'> 	}</div><div class='ctx'> #endif  /* CONFIG_QUOTA */</div><div class='ctx'> </div><div class='hunk'>@@ -4956,45 +5652,32 @@ no_journal:</div><div class='ctx'> 	 * Save the original bdev mapping's wb_err value which could be</div><div class='ctx'> 	 * used to detect the metadata async write error.</div><div class='ctx'> 	 */</div><div class='del'>-	spin_lock_init(&amp;sbi-&gt;s_bdev_wb_lock);</div><div class='del'>-	errseq_check_and_advance(&amp;sb-&gt;s_bdev-&gt;bd_inode-&gt;i_mapping-&gt;wb_err,</div><div class='add'>+	errseq_check_and_advance(&amp;sb-&gt;s_bdev-&gt;bd_mapping-&gt;wb_err,</div><div class='ctx'> 				 &amp;sbi-&gt;s_bdev_wb_err);</div><div class='del'>-	sb-&gt;s_bdev-&gt;bd_super = sb;</div><div class='ctx'> 	EXT4_SB(sb)-&gt;s_mount_state |= EXT4_ORPHAN_FS;</div><div class='ctx'> 	ext4_orphan_cleanup(sb, es);</div><div class='ctx'> 	EXT4_SB(sb)-&gt;s_mount_state &amp;= ~EXT4_ORPHAN_FS;</div><div class='add'>+	/*</div><div class='add'>+	 * Update the checksum after updating free space/inode counters and</div><div class='add'>+	 * ext4_orphan_cleanup. Otherwise the superblock can have an incorrect</div><div class='add'>+	 * checksum in the buffer cache until it is written out and</div><div class='add'>+	 * e2fsprogs programs trying to open a file system immediately</div><div class='add'>+	 * after it is mounted can fail.</div><div class='add'>+	 */</div><div class='add'>+	ext4_superblock_csum_set(sb);</div><div class='ctx'> 	if (needs_recovery) {</div><div class='ctx'> 		ext4_msg(sb, KERN_INFO, "recovery complete");</div><div class='ctx'> 		err = ext4_mark_recovery_complete(sb, es);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto failed_mount9;</div><div class='ctx'> 	}</div><div class='del'>-	if (EXT4_SB(sb)-&gt;s_journal) {</div><div class='del'>-		if (test_opt(sb, DATA_FLAGS) == EXT4_MOUNT_JOURNAL_DATA)</div><div class='del'>-			descr = " journalled data mode";</div><div class='del'>-		else if (test_opt(sb, DATA_FLAGS) == EXT4_MOUNT_ORDERED_DATA)</div><div class='del'>-			descr = " ordered data mode";</div><div class='del'>-		else</div><div class='del'>-			descr = " writeback data mode";</div><div class='del'>-	} else</div><div class='del'>-		descr = "out journal";</div><div class='ctx'> </div><div class='del'>-	if (test_opt(sb, DISCARD)) {</div><div class='del'>-		struct request_queue *q = bdev_get_queue(sb-&gt;s_bdev);</div><div class='del'>-		if (!blk_queue_discard(q))</div><div class='del'>-			ext4_msg(sb, KERN_WARNING,</div><div class='del'>-				 "mounting with \"discard\" option, but "</div><div class='del'>-				 "the device does not support discard");</div><div class='add'>+	if (test_opt(sb, DISCARD) &amp;&amp; !bdev_max_discard_sectors(sb-&gt;s_bdev)) {</div><div class='add'>+		ext4_msg(sb, KERN_WARNING,</div><div class='add'>+			 "mounting with \"discard\" option, but the device does not support discard");</div><div class='add'>+		clear_opt(sb, DISCARD);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (___ratelimit(&amp;ext4_mount_msg_ratelimit, "EXT4-fs mount"))</div><div class='del'>-		ext4_msg(sb, KERN_INFO, "mounted filesystem with%s. "</div><div class='del'>-			 "Opts: %.*s%s%s. Quota mode: %s.", descr,</div><div class='del'>-			 (int) sizeof(sbi-&gt;s_es-&gt;s_mount_opts),</div><div class='del'>-			 sbi-&gt;s_es-&gt;s_mount_opts,</div><div class='del'>-			 *sbi-&gt;s_es-&gt;s_mount_opts ? "; " : "", orig_data,</div><div class='del'>-			 ext4_quota_mode(sb));</div><div class='del'>-</div><div class='ctx'> 	if (es-&gt;s_error_count)</div><div class='ctx'> 		mod_timer(&amp;sbi-&gt;s_err_report, jiffies + 300*HZ); /* 5 minutes */</div><div class='ctx'> </div><div class='hunk'>@@ -5005,37 +5688,23 @@ no_journal:</div><div class='ctx'> 	atomic_set(&amp;sbi-&gt;s_warning_count, 0);</div><div class='ctx'> 	atomic_set(&amp;sbi-&gt;s_msg_count, 0);</div><div class='ctx'> </div><div class='del'>-	kfree(orig_data);</div><div class='del'>-	return 0;</div><div class='add'>+	/* Register sysfs after all initializations are complete. */</div><div class='add'>+	err = ext4_register_sysfs(sb);</div><div class='add'>+	if (err)</div><div class='add'>+		goto failed_mount9;</div><div class='ctx'> </div><div class='del'>-cantfind_ext4:</div><div class='del'>-	if (!silent)</div><div class='del'>-		ext4_msg(sb, KERN_ERR, "VFS: Can't find ext4 filesystem");</div><div class='del'>-	goto failed_mount;</div><div class='add'>+	return 0;</div><div class='ctx'> </div><div class='ctx'> failed_mount9:</div><div class='add'>+	ext4_quotas_off(sb, EXT4_MAXQUOTAS);</div><div class='add'>+failed_mount8: __maybe_unused</div><div class='ctx'> 	ext4_release_orphan_info(sb);</div><div class='del'>-failed_mount8:</div><div class='del'>-	ext4_unregister_sysfs(sb);</div><div class='del'>-	kobject_put(&amp;sbi-&gt;s_kobj);</div><div class='ctx'> failed_mount7:</div><div class='ctx'> 	ext4_unregister_li_request(sb);</div><div class='ctx'> failed_mount6:</div><div class='ctx'> 	ext4_mb_release(sb);</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	flex_groups = rcu_dereference(sbi-&gt;s_flex_groups);</div><div class='del'>-	if (flex_groups) {</div><div class='del'>-		for (i = 0; i &lt; sbi-&gt;s_flex_groups_allocated; i++)</div><div class='del'>-			kvfree(flex_groups[i]);</div><div class='del'>-		kvfree(flex_groups);</div><div class='del'>-	}</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-	percpu_counter_destroy(&amp;sbi-&gt;s_freeclusters_counter);</div><div class='del'>-	percpu_counter_destroy(&amp;sbi-&gt;s_freeinodes_counter);</div><div class='del'>-	percpu_counter_destroy(&amp;sbi-&gt;s_dirs_counter);</div><div class='del'>-	percpu_counter_destroy(&amp;sbi-&gt;s_dirtyclusters_counter);</div><div class='del'>-	percpu_counter_destroy(&amp;sbi-&gt;s_sra_exceeded_retry_limit);</div><div class='del'>-	percpu_free_rwsem(&amp;sbi-&gt;s_writepages_rwsem);</div><div class='add'>+	ext4_flex_groups_free(sbi);</div><div class='add'>+	ext4_percpu_param_destroy(sbi);</div><div class='ctx'> failed_mount5:</div><div class='ctx'> 	ext4_ext_release(sb);</div><div class='ctx'> 	ext4_release_system_zone(sb);</div><div class='hunk'>@@ -5054,49 +5723,90 @@ failed_mount_wq:</div><div class='ctx'> 	sbi-&gt;s_ea_block_cache = NULL;</div><div class='ctx'> </div><div class='ctx'> 	if (sbi-&gt;s_journal) {</div><div class='del'>-		/* flush s_error_work before journal destroy. */</div><div class='del'>-		flush_work(&amp;sbi-&gt;s_error_work);</div><div class='del'>-		jbd2_journal_destroy(sbi-&gt;s_journal);</div><div class='del'>-		sbi-&gt;s_journal = NULL;</div><div class='add'>+		ext4_journal_destroy(sbi, sbi-&gt;s_journal);</div><div class='ctx'> 	}</div><div class='ctx'> failed_mount3a:</div><div class='ctx'> 	ext4_es_unregister_shrinker(sbi);</div><div class='ctx'> failed_mount3:</div><div class='del'>-	/* flush s_error_work before sbi destroy */</div><div class='del'>-	flush_work(&amp;sbi-&gt;s_error_work);</div><div class='del'>-	del_timer_sync(&amp;sbi-&gt;s_err_report);</div><div class='add'>+	/* flush s_sb_upd_work before sbi destroy */</div><div class='add'>+	flush_work(&amp;sbi-&gt;s_sb_upd_work);</div><div class='ctx'> 	ext4_stop_mmpd(sbi);</div><div class='del'>-failed_mount2:</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	group_desc = rcu_dereference(sbi-&gt;s_group_desc);</div><div class='del'>-	for (i = 0; i &lt; db_count; i++)</div><div class='del'>-		brelse(group_desc[i]);</div><div class='del'>-	kvfree(group_desc);</div><div class='del'>-	rcu_read_unlock();</div><div class='add'>+	timer_delete_sync(&amp;sbi-&gt;s_err_report);</div><div class='add'>+	ext4_group_desc_free(sbi);</div><div class='ctx'> failed_mount:</div><div class='del'>-	if (sbi-&gt;s_chksum_driver)</div><div class='del'>-		crypto_free_shash(sbi-&gt;s_chksum_driver);</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='ctx'> 	utf8_unload(sb-&gt;s_encoding);</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='del'>-	for (i = 0; i &lt; EXT4_MAXQUOTAS; i++)</div><div class='add'>+	for (unsigned int i = 0; i &lt; EXT4_MAXQUOTAS; i++)</div><div class='ctx'> 		kfree(get_qf_name(sb, sbi, i));</div><div class='ctx'> #endif</div><div class='ctx'> 	fscrypt_free_dummy_policy(&amp;sbi-&gt;s_dummy_enc_policy);</div><div class='del'>-	/* ext4_blkdev_remove() calls kill_bdev(), release bh before it. */</div><div class='del'>-	brelse(bh);</div><div class='del'>-	ext4_blkdev_remove(sbi);</div><div class='add'>+	brelse(sbi-&gt;s_sbh);</div><div class='add'>+	if (sbi-&gt;s_journal_bdev_file) {</div><div class='add'>+		invalidate_bdev(file_bdev(sbi-&gt;s_journal_bdev_file));</div><div class='add'>+		bdev_fput(sbi-&gt;s_journal_bdev_file);</div><div class='add'>+	}</div><div class='ctx'> out_fail:</div><div class='add'>+	invalidate_bdev(sb-&gt;s_bdev);</div><div class='ctx'> 	sb-&gt;s_fs_info = NULL;</div><div class='del'>-	kfree(sbi-&gt;s_blockgroup_lock);</div><div class='del'>-out_free_base:</div><div class='del'>-	kfree(sbi);</div><div class='del'>-	kfree(orig_data);</div><div class='del'>-	fs_put_dax(dax_dev);</div><div class='del'>-	return err ? err : ret;</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ext4_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct ext4_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct ext4_sb_info *sbi;</div><div class='add'>+	const char *descr;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	sbi = ext4_alloc_sbi(sb);</div><div class='add'>+	if (!sbi)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	fc-&gt;s_fs_info = sbi;</div><div class='add'>+</div><div class='add'>+	/* Cleanup superblock name */</div><div class='add'>+	strreplace(sb-&gt;s_id, '/', '!');</div><div class='add'>+</div><div class='add'>+	sbi-&gt;s_sb_block = 1;	/* Default super block location */</div><div class='add'>+	if (ctx-&gt;spec &amp; EXT4_SPEC_s_sb_block)</div><div class='add'>+		sbi-&gt;s_sb_block = ctx-&gt;s_sb_block;</div><div class='add'>+</div><div class='add'>+	ret = __ext4_fill_super(fc, sb);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto free_sbi;</div><div class='add'>+</div><div class='add'>+	if (sbi-&gt;s_journal) {</div><div class='add'>+		if (test_opt(sb, DATA_FLAGS) == EXT4_MOUNT_JOURNAL_DATA)</div><div class='add'>+			descr = " journalled data mode";</div><div class='add'>+		else if (test_opt(sb, DATA_FLAGS) == EXT4_MOUNT_ORDERED_DATA)</div><div class='add'>+			descr = " ordered data mode";</div><div class='add'>+		else</div><div class='add'>+			descr = " writeback data mode";</div><div class='add'>+	} else</div><div class='add'>+		descr = "out journal";</div><div class='add'>+</div><div class='add'>+	if (___ratelimit(&amp;ext4_mount_msg_ratelimit, "EXT4-fs mount"))</div><div class='add'>+		ext4_msg(sb, KERN_INFO, "mounted filesystem %pU %s with%s. "</div><div class='add'>+			 "Quota mode: %s.", &amp;sb-&gt;s_uuid,</div><div class='add'>+			 sb_rdonly(sb) ? "ro" : "r/w", descr,</div><div class='add'>+			 ext4_quota_mode(sb));</div><div class='add'>+</div><div class='add'>+	/* Update the s_overhead_clusters if necessary */</div><div class='add'>+	ext4_update_overhead(sb, false);</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+free_sbi:</div><div class='add'>+	ext4_free_sbi(sbi);</div><div class='add'>+	fc-&gt;s_fs_info = NULL;</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int ext4_get_tree(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	return get_tree_bdev(fc, ext4_fill_super);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -5118,10 +5828,11 @@ static void ext4_init_journal_params(struct super_block *sb, journal_t *journal)</div><div class='ctx'> 		journal-&gt;j_flags |= JBD2_BARRIER;</div><div class='ctx'> 	else</div><div class='ctx'> 		journal-&gt;j_flags &amp;= ~JBD2_BARRIER;</div><div class='del'>-	if (test_opt(sb, DATA_ERR_ABORT))</div><div class='del'>-		journal-&gt;j_flags |= JBD2_ABORT_ON_SYNCDATA_ERR;</div><div class='del'>-	else</div><div class='del'>-		journal-&gt;j_flags &amp;= ~JBD2_ABORT_ON_SYNCDATA_ERR;</div><div class='add'>+	/*</div><div class='add'>+	 * Always enable journal cycle record option, letting the journal</div><div class='add'>+	 * records log transactions continuously between each mount.</div><div class='add'>+	 */</div><div class='add'>+	journal-&gt;j_flags |= JBD2_CYCLE_RECORD;</div><div class='ctx'> 	write_unlock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5138,83 +5849,110 @@ static struct inode *ext4_get_journal_inode(struct super_block *sb,</div><div class='ctx'> 	journal_inode = ext4_iget(sb, journal_inum, EXT4_IGET_SPECIAL);</div><div class='ctx'> 	if (IS_ERR(journal_inode)) {</div><div class='ctx'> 		ext4_msg(sb, KERN_ERR, "no journal found");</div><div class='del'>-		return NULL;</div><div class='add'>+		return ERR_CAST(journal_inode);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!journal_inode-&gt;i_nlink) {</div><div class='ctx'> 		make_bad_inode(journal_inode);</div><div class='ctx'> 		iput(journal_inode);</div><div class='ctx'> 		ext4_msg(sb, KERN_ERR, "journal inode is deleted");</div><div class='del'>-		return NULL;</div><div class='add'>+		return ERR_PTR(-EFSCORRUPTED);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	jbd_debug(2, "Journal inode found at %p: %lld bytes\n",</div><div class='del'>-		  journal_inode, journal_inode-&gt;i_size);</div><div class='del'>-	if (!S_ISREG(journal_inode-&gt;i_mode)) {</div><div class='add'>+	if (!S_ISREG(journal_inode-&gt;i_mode) || IS_ENCRYPTED(journal_inode)) {</div><div class='ctx'> 		ext4_msg(sb, KERN_ERR, "invalid journal inode");</div><div class='ctx'> 		iput(journal_inode);</div><div class='del'>-		return NULL;</div><div class='add'>+		return ERR_PTR(-EFSCORRUPTED);</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	ext4_debug("Journal inode found at %p: %lld bytes\n",</div><div class='add'>+		  journal_inode, journal_inode-&gt;i_size);</div><div class='ctx'> 	return journal_inode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static journal_t *ext4_get_journal(struct super_block *sb,</div><div class='del'>-				   unsigned int journal_inum)</div><div class='add'>+static int ext4_journal_bmap(journal_t *journal, sector_t *block)</div><div class='add'>+{</div><div class='add'>+	struct ext4_map_blocks map;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (journal-&gt;j_inode == NULL)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	map.m_lblk = *block;</div><div class='add'>+	map.m_len = 1;</div><div class='add'>+	ret = ext4_map_blocks(NULL, journal-&gt;j_inode, &amp;map, 0);</div><div class='add'>+	if (ret &lt;= 0) {</div><div class='add'>+		ext4_msg(journal-&gt;j_inode-&gt;i_sb, KERN_CRIT,</div><div class='add'>+			 "journal bmap failed: block %llu ret %d\n",</div><div class='add'>+			 *block, ret);</div><div class='add'>+		jbd2_journal_abort(journal, ret ? ret : -EFSCORRUPTED);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+	*block = map.m_pblk;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static journal_t *ext4_open_inode_journal(struct super_block *sb,</div><div class='add'>+					  unsigned int journal_inum)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *journal_inode;</div><div class='ctx'> 	journal_t *journal;</div><div class='ctx'> </div><div class='del'>-	if (WARN_ON_ONCE(!ext4_has_feature_journal(sb)))</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='ctx'> 	journal_inode = ext4_get_journal_inode(sb, journal_inum);</div><div class='del'>-	if (!journal_inode)</div><div class='del'>-		return NULL;</div><div class='add'>+	if (IS_ERR(journal_inode))</div><div class='add'>+		return ERR_CAST(journal_inode);</div><div class='ctx'> </div><div class='ctx'> 	journal = jbd2_journal_init_inode(journal_inode);</div><div class='del'>-	if (!journal) {</div><div class='add'>+	if (IS_ERR(journal)) {</div><div class='ctx'> 		ext4_msg(sb, KERN_ERR, "Could not load journal inode");</div><div class='ctx'> 		iput(journal_inode);</div><div class='del'>-		return NULL;</div><div class='add'>+		return ERR_CAST(journal);</div><div class='ctx'> 	}</div><div class='ctx'> 	journal-&gt;j_private = sb;</div><div class='add'>+	journal-&gt;j_bmap = ext4_journal_bmap;</div><div class='ctx'> 	ext4_init_journal_params(sb, journal);</div><div class='ctx'> 	return journal;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static journal_t *ext4_get_dev_journal(struct super_block *sb,</div><div class='del'>-				       dev_t j_dev)</div><div class='add'>+static struct file *ext4_get_journal_blkdev(struct super_block *sb,</div><div class='add'>+					dev_t j_dev, ext4_fsblk_t *j_start,</div><div class='add'>+					ext4_fsblk_t *j_len)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='del'>-	journal_t *journal;</div><div class='del'>-	ext4_fsblk_t start;</div><div class='del'>-	ext4_fsblk_t len;</div><div class='add'>+	struct block_device *bdev;</div><div class='add'>+	struct file *bdev_file;</div><div class='ctx'> 	int hblock, blocksize;</div><div class='ctx'> 	ext4_fsblk_t sb_block;</div><div class='ctx'> 	unsigned long offset;</div><div class='ctx'> 	struct ext4_super_block *es;</div><div class='del'>-	struct block_device *bdev;</div><div class='del'>-</div><div class='del'>-	if (WARN_ON_ONCE(!ext4_has_feature_journal(sb)))</div><div class='del'>-		return NULL;</div><div class='add'>+	int errno;</div><div class='ctx'> </div><div class='del'>-	bdev = ext4_blkdev_get(j_dev, sb);</div><div class='del'>-	if (bdev == NULL)</div><div class='del'>-		return NULL;</div><div class='add'>+	bdev_file = bdev_file_open_by_dev(j_dev,</div><div class='add'>+		BLK_OPEN_READ | BLK_OPEN_WRITE | BLK_OPEN_RESTRICT_WRITES,</div><div class='add'>+		sb, &amp;fs_holder_ops);</div><div class='add'>+	if (IS_ERR(bdev_file)) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR,</div><div class='add'>+			 "failed to open journal device unknown-block(%u,%u) %ld",</div><div class='add'>+			 MAJOR(j_dev), MINOR(j_dev), PTR_ERR(bdev_file));</div><div class='add'>+		return bdev_file;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='add'>+	bdev = file_bdev(bdev_file);</div><div class='ctx'> 	blocksize = sb-&gt;s_blocksize;</div><div class='ctx'> 	hblock = bdev_logical_block_size(bdev);</div><div class='ctx'> 	if (blocksize &lt; hblock) {</div><div class='ctx'> 		ext4_msg(sb, KERN_ERR,</div><div class='ctx'> 			"blocksize too small for journal device");</div><div class='add'>+		errno = -EINVAL;</div><div class='ctx'> 		goto out_bdev;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	sb_block = EXT4_MIN_BLOCK_SIZE / blocksize;</div><div class='ctx'> 	offset = EXT4_MIN_BLOCK_SIZE % blocksize;</div><div class='del'>-	set_blocksize(bdev, blocksize);</div><div class='del'>-	if (!(bh = __bread(bdev, sb_block, blocksize))) {</div><div class='add'>+	set_blocksize(bdev_file, blocksize);</div><div class='add'>+	bh = __bread(bdev, sb_block, blocksize);</div><div class='add'>+	if (!bh) {</div><div class='ctx'> 		ext4_msg(sb, KERN_ERR, "couldn't read superblock of "</div><div class='ctx'> 		       "external journal");</div><div class='add'>+		errno = -EINVAL;</div><div class='ctx'> 		goto out_bdev;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -5222,57 +5960,74 @@ static journal_t *ext4_get_dev_journal(struct super_block *sb,</div><div class='ctx'> 	if ((le16_to_cpu(es-&gt;s_magic) != EXT4_SUPER_MAGIC) ||</div><div class='ctx'> 	    !(le32_to_cpu(es-&gt;s_feature_incompat) &amp;</div><div class='ctx'> 	      EXT4_FEATURE_INCOMPAT_JOURNAL_DEV)) {</div><div class='del'>-		ext4_msg(sb, KERN_ERR, "external journal has "</div><div class='del'>-					"bad superblock");</div><div class='del'>-		brelse(bh);</div><div class='del'>-		goto out_bdev;</div><div class='add'>+		ext4_msg(sb, KERN_ERR, "external journal has bad superblock");</div><div class='add'>+		errno = -EFSCORRUPTED;</div><div class='add'>+		goto out_bh;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if ((le32_to_cpu(es-&gt;s_feature_ro_compat) &amp;</div><div class='ctx'> 	     EXT4_FEATURE_RO_COMPAT_METADATA_CSUM) &amp;&amp;</div><div class='del'>-	    es-&gt;s_checksum != ext4_superblock_csum(sb, es)) {</div><div class='del'>-		ext4_msg(sb, KERN_ERR, "external journal has "</div><div class='del'>-				       "corrupt superblock");</div><div class='del'>-		brelse(bh);</div><div class='del'>-		goto out_bdev;</div><div class='add'>+	    es-&gt;s_checksum != ext4_superblock_csum(es)) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR, "external journal has corrupt superblock");</div><div class='add'>+		errno = -EFSCORRUPTED;</div><div class='add'>+		goto out_bh;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (memcmp(EXT4_SB(sb)-&gt;s_es-&gt;s_journal_uuid, es-&gt;s_uuid, 16)) {</div><div class='ctx'> 		ext4_msg(sb, KERN_ERR, "journal UUID does not match");</div><div class='del'>-		brelse(bh);</div><div class='del'>-		goto out_bdev;</div><div class='add'>+		errno = -EFSCORRUPTED;</div><div class='add'>+		goto out_bh;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	len = ext4_blocks_count(es);</div><div class='del'>-	start = sb_block + 1;</div><div class='del'>-	brelse(bh);	/* we're done with the superblock */</div><div class='add'>+	*j_start = sb_block + 1;</div><div class='add'>+	*j_len = ext4_blocks_count(es);</div><div class='add'>+	brelse(bh);</div><div class='add'>+	return bdev_file;</div><div class='add'>+</div><div class='add'>+out_bh:</div><div class='add'>+	brelse(bh);</div><div class='add'>+out_bdev:</div><div class='add'>+	bdev_fput(bdev_file);</div><div class='add'>+	return ERR_PTR(errno);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	journal = jbd2_journal_init_dev(bdev, sb-&gt;s_bdev,</div><div class='del'>-					start, len, blocksize);</div><div class='del'>-	if (!journal) {</div><div class='add'>+static journal_t *ext4_open_dev_journal(struct super_block *sb,</div><div class='add'>+					dev_t j_dev)</div><div class='add'>+{</div><div class='add'>+	journal_t *journal;</div><div class='add'>+	ext4_fsblk_t j_start;</div><div class='add'>+	ext4_fsblk_t j_len;</div><div class='add'>+	struct file *bdev_file;</div><div class='add'>+	int errno = 0;</div><div class='add'>+</div><div class='add'>+	bdev_file = ext4_get_journal_blkdev(sb, j_dev, &amp;j_start, &amp;j_len);</div><div class='add'>+	if (IS_ERR(bdev_file))</div><div class='add'>+		return ERR_CAST(bdev_file);</div><div class='add'>+</div><div class='add'>+	journal = jbd2_journal_init_dev(file_bdev(bdev_file), sb-&gt;s_bdev, j_start,</div><div class='add'>+					j_len, sb-&gt;s_blocksize);</div><div class='add'>+	if (IS_ERR(journal)) {</div><div class='ctx'> 		ext4_msg(sb, KERN_ERR, "failed to create device journal");</div><div class='add'>+		errno = PTR_ERR(journal);</div><div class='ctx'> 		goto out_bdev;</div><div class='ctx'> 	}</div><div class='del'>-	journal-&gt;j_private = sb;</div><div class='del'>-	if (ext4_read_bh_lock(journal-&gt;j_sb_buffer, REQ_META | REQ_PRIO, true)) {</div><div class='del'>-		ext4_msg(sb, KERN_ERR, "I/O error on journal device");</div><div class='del'>-		goto out_journal;</div><div class='del'>-	}</div><div class='ctx'> 	if (be32_to_cpu(journal-&gt;j_superblock-&gt;s_nr_users) != 1) {</div><div class='ctx'> 		ext4_msg(sb, KERN_ERR, "External journal has more than one "</div><div class='ctx'> 					"user (unsupported) - %d",</div><div class='ctx'> 			be32_to_cpu(journal-&gt;j_superblock-&gt;s_nr_users));</div><div class='add'>+		errno = -EINVAL;</div><div class='ctx'> 		goto out_journal;</div><div class='ctx'> 	}</div><div class='del'>-	EXT4_SB(sb)-&gt;s_journal_bdev = bdev;</div><div class='add'>+	journal-&gt;j_private = sb;</div><div class='add'>+	EXT4_SB(sb)-&gt;s_journal_bdev_file = bdev_file;</div><div class='ctx'> 	ext4_init_journal_params(sb, journal);</div><div class='ctx'> 	return journal;</div><div class='ctx'> </div><div class='ctx'> out_journal:</div><div class='del'>-	jbd2_journal_destroy(journal);</div><div class='add'>+	ext4_journal_destroy(EXT4_SB(sb), journal);</div><div class='ctx'> out_bdev:</div><div class='del'>-	ext4_blkdev_put(bdev);</div><div class='del'>-	return NULL;</div><div class='add'>+	bdev_fput(bdev_file);</div><div class='add'>+	return ERR_PTR(errno);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ext4_load_journal(struct super_block *sb,</div><div class='hunk'>@@ -5304,13 +6059,13 @@ static int ext4_load_journal(struct super_block *sb,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (journal_inum) {</div><div class='del'>-		journal = ext4_get_journal(sb, journal_inum);</div><div class='del'>-		if (!journal)</div><div class='del'>-			return -EINVAL;</div><div class='add'>+		journal = ext4_open_inode_journal(sb, journal_inum);</div><div class='add'>+		if (IS_ERR(journal))</div><div class='add'>+			return PTR_ERR(journal);</div><div class='ctx'> 	} else {</div><div class='del'>-		journal = ext4_get_dev_journal(sb, journal_dev);</div><div class='del'>-		if (!journal)</div><div class='del'>-			return -EINVAL;</div><div class='add'>+		journal = ext4_open_dev_journal(sb, journal_dev);</div><div class='add'>+		if (IS_ERR(journal))</div><div class='add'>+			return PTR_ERR(journal);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	journal_dev_ro = bdev_read_only(journal-&gt;j_dev);</div><div class='hunk'>@@ -5351,14 +6106,31 @@ static int ext4_load_journal(struct super_block *sb,</div><div class='ctx'> 		err = jbd2_journal_wipe(journal, !really_read_only);</div><div class='ctx'> 	if (!err) {</div><div class='ctx'> 		char *save = kmalloc(EXT4_S_ERR_LEN, GFP_KERNEL);</div><div class='add'>+		__le16 orig_state;</div><div class='add'>+		bool changed = false;</div><div class='add'>+</div><div class='ctx'> 		if (save)</div><div class='ctx'> 			memcpy(save, ((char *) es) +</div><div class='ctx'> 			       EXT4_S_ERR_START, EXT4_S_ERR_LEN);</div><div class='ctx'> 		err = jbd2_journal_load(journal);</div><div class='del'>-		if (save)</div><div class='add'>+		if (save &amp;&amp; memcmp(((char *) es) + EXT4_S_ERR_START,</div><div class='add'>+				   save, EXT4_S_ERR_LEN)) {</div><div class='ctx'> 			memcpy(((char *) es) + EXT4_S_ERR_START,</div><div class='ctx'> 			       save, EXT4_S_ERR_LEN);</div><div class='add'>+			changed = true;</div><div class='add'>+		}</div><div class='ctx'> 		kfree(save);</div><div class='add'>+		orig_state = es-&gt;s_state;</div><div class='add'>+		es-&gt;s_state |= cpu_to_le16(EXT4_SB(sb)-&gt;s_mount_state &amp;</div><div class='add'>+					   EXT4_ERROR_FS);</div><div class='add'>+		if (orig_state != es-&gt;s_state)</div><div class='add'>+			changed = true;</div><div class='add'>+		/* Write out restored error information to the superblock */</div><div class='add'>+		if (changed &amp;&amp; !really_read_only) {</div><div class='add'>+			int err2;</div><div class='add'>+			err2 = ext4_commit_super(sb);</div><div class='add'>+			err = err ? : err2;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (err) {</div><div class='hunk'>@@ -5369,23 +6141,25 @@ static int ext4_load_journal(struct super_block *sb,</div><div class='ctx'> 	EXT4_SB(sb)-&gt;s_journal = journal;</div><div class='ctx'> 	err = ext4_clear_journal_err(sb, es);</div><div class='ctx'> 	if (err) {</div><div class='del'>-		EXT4_SB(sb)-&gt;s_journal = NULL;</div><div class='del'>-		jbd2_journal_destroy(journal);</div><div class='add'>+		ext4_journal_destroy(EXT4_SB(sb), journal);</div><div class='ctx'> 		return err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!really_read_only &amp;&amp; journal_devnum &amp;&amp;</div><div class='ctx'> 	    journal_devnum != le32_to_cpu(es-&gt;s_journal_dev)) {</div><div class='ctx'> 		es-&gt;s_journal_dev = cpu_to_le32(journal_devnum);</div><div class='del'>-</div><div class='del'>-		/* Make sure we flush the recovery flag to disk. */</div><div class='add'>+		ext4_commit_super(sb);</div><div class='add'>+	}</div><div class='add'>+	if (!really_read_only &amp;&amp; journal_inum &amp;&amp;</div><div class='add'>+	    journal_inum != le32_to_cpu(es-&gt;s_journal_inum)) {</div><div class='add'>+		es-&gt;s_journal_inum = cpu_to_le32(journal_inum);</div><div class='ctx'> 		ext4_commit_super(sb);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> err_out:</div><div class='del'>-	jbd2_journal_destroy(journal);</div><div class='add'>+	ext4_journal_destroy(EXT4_SB(sb), journal);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5407,7 +6181,7 @@ static void ext4_update_super(struct super_block *sb)</div><div class='ctx'> 	 * the clock is set in the future, and this will cause e2fsck</div><div class='ctx'> 	 * to complain and force a full file system check.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!(sb-&gt;s_flags &amp; SB_RDONLY))</div><div class='add'>+	if (!sb_rdonly(sb))</div><div class='ctx'> 		ext4_update_tstamp(es, s_wtime);</div><div class='ctx'> 	es-&gt;s_kbytes_written =</div><div class='ctx'> 		cpu_to_le64(sbi-&gt;s_kbytes_written +</div><div class='hunk'>@@ -5429,8 +6203,8 @@ static void ext4_update_super(struct super_block *sb)</div><div class='ctx'> 			__ext4_update_tstamp(&amp;es-&gt;s_first_error_time,</div><div class='ctx'> 					     &amp;es-&gt;s_first_error_time_hi,</div><div class='ctx'> 					     sbi-&gt;s_first_error_time);</div><div class='del'>-			strncpy(es-&gt;s_first_error_func, sbi-&gt;s_first_error_func,</div><div class='del'>-				sizeof(es-&gt;s_first_error_func));</div><div class='add'>+			strtomem_pad(es-&gt;s_first_error_func,</div><div class='add'>+				     sbi-&gt;s_first_error_func, 0);</div><div class='ctx'> 			es-&gt;s_first_error_line =</div><div class='ctx'> 				cpu_to_le32(sbi-&gt;s_first_error_line);</div><div class='ctx'> 			es-&gt;s_first_error_ino =</div><div class='hunk'>@@ -5443,8 +6217,7 @@ static void ext4_update_super(struct super_block *sb)</div><div class='ctx'> 		__ext4_update_tstamp(&amp;es-&gt;s_last_error_time,</div><div class='ctx'> 				     &amp;es-&gt;s_last_error_time_hi,</div><div class='ctx'> 				     sbi-&gt;s_last_error_time);</div><div class='del'>-		strncpy(es-&gt;s_last_error_func, sbi-&gt;s_last_error_func,</div><div class='del'>-			sizeof(es-&gt;s_last_error_func));</div><div class='add'>+		strtomem_pad(es-&gt;s_last_error_func, sbi-&gt;s_last_error_func, 0);</div><div class='ctx'> 		es-&gt;s_last_error_line = cpu_to_le32(sbi-&gt;s_last_error_line);</div><div class='ctx'> 		es-&gt;s_last_error_ino = cpu_to_le32(sbi-&gt;s_last_error_ino);</div><div class='ctx'> 		es-&gt;s_last_error_block = cpu_to_le64(sbi-&gt;s_last_error_block);</div><div class='hunk'>@@ -5468,15 +6241,19 @@ static void ext4_update_super(struct super_block *sb)</div><div class='ctx'> static int ext4_commit_super(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *sbh = EXT4_SB(sb)-&gt;s_sbh;</div><div class='del'>-	int error = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (!sbh)</div><div class='ctx'> 		return -EINVAL;</div><div class='del'>-	if (block_device_ejected(sb))</div><div class='del'>-		return -ENODEV;</div><div class='ctx'> </div><div class='ctx'> 	ext4_update_super(sb);</div><div class='ctx'> </div><div class='add'>+	lock_buffer(sbh);</div><div class='add'>+	/* Buffer got discarded which means block device got invalidated */</div><div class='add'>+	if (!buffer_mapped(sbh)) {</div><div class='add'>+		unlock_buffer(sbh);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (buffer_write_io_error(sbh) || !buffer_uptodate(sbh)) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Oh, dear.  A previous attempt to write the</div><div class='hunk'>@@ -5491,17 +6268,21 @@ static int ext4_commit_super(struct super_block *sb)</div><div class='ctx'> 		clear_buffer_write_io_error(sbh);</div><div class='ctx'> 		set_buffer_uptodate(sbh);</div><div class='ctx'> 	}</div><div class='del'>-	BUFFER_TRACE(sbh, "marking dirty");</div><div class='del'>-	mark_buffer_dirty(sbh);</div><div class='del'>-	error = __sync_dirty_buffer(sbh,</div><div class='del'>-		REQ_SYNC | (test_opt(sb, BARRIER) ? REQ_FUA : 0));</div><div class='add'>+	get_bh(sbh);</div><div class='add'>+	/* Clear potential dirty bit if it was journalled update */</div><div class='add'>+	clear_buffer_dirty(sbh);</div><div class='add'>+	sbh-&gt;b_end_io = end_buffer_write_sync;</div><div class='add'>+	submit_bh(REQ_OP_WRITE | REQ_SYNC |</div><div class='add'>+		  (test_opt(sb, BARRIER) ? REQ_FUA : 0), sbh);</div><div class='add'>+	wait_on_buffer(sbh);</div><div class='ctx'> 	if (buffer_write_io_error(sbh)) {</div><div class='ctx'> 		ext4_msg(sb, KERN_ERR, "I/O error while writing "</div><div class='ctx'> 		       "superblock");</div><div class='ctx'> 		clear_buffer_write_io_error(sbh);</div><div class='ctx'> 		set_buffer_uptodate(sbh);</div><div class='add'>+		return -EIO;</div><div class='ctx'> 	}</div><div class='del'>-	return error;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -5575,11 +6356,13 @@ static int ext4_clear_journal_err(struct super_block *sb,</div><div class='ctx'> 		errstr = ext4_decode_error(sb, j_errno, nbuf);</div><div class='ctx'> 		ext4_warning(sb, "Filesystem error recorded "</div><div class='ctx'> 			     "from previous mount: %s", errstr);</div><div class='del'>-		ext4_warning(sb, "Marking fs in need of filesystem check.");</div><div class='ctx'> </div><div class='ctx'> 		EXT4_SB(sb)-&gt;s_mount_state |= EXT4_ERROR_FS;</div><div class='ctx'> 		es-&gt;s_state |= cpu_to_le16(EXT4_ERROR_FS);</div><div class='del'>-		ext4_commit_super(sb);</div><div class='add'>+		j_errno = ext4_commit_super(sb);</div><div class='add'>+		if (j_errno)</div><div class='add'>+			return j_errno;</div><div class='add'>+		ext4_warning(sb, "Marked fs in need of filesystem check.");</div><div class='ctx'> </div><div class='ctx'> 		jbd2_journal_clear_err(journal);</div><div class='ctx'> 		jbd2_journal_update_sb_errno(journal);</div><div class='hunk'>@@ -5593,13 +6376,7 @@ static int ext4_clear_journal_err(struct super_block *sb,</div><div class='ctx'>  */</div><div class='ctx'> int ext4_force_commit(struct super_block *sb)</div><div class='ctx'> {</div><div class='del'>-	journal_t *journal;</div><div class='del'>-</div><div class='del'>-	if (sb_rdonly(sb))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	journal = EXT4_SB(sb)-&gt;s_journal;</div><div class='del'>-	return ext4_journal_force_commit(journal);</div><div class='add'>+	return ext4_journal_force_commit(EXT4_SB(sb)-&gt;s_journal);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ext4_sync_fs(struct super_block *sb, int wait)</div><div class='hunk'>@@ -5609,8 +6386,9 @@ static int ext4_sync_fs(struct super_block *sb, int wait)</div><div class='ctx'> 	bool needs_barrier = false;</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ext4_forced_shutdown(sbi)))</div><div class='del'>-		return 0;</div><div class='add'>+	ret = ext4_emergency_state(sb);</div><div class='add'>+	if (unlikely(ret))</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	trace_ext4_sync_fs(sb, wait);</div><div class='ctx'> 	flush_workqueue(sbi-&gt;rsv_conversion_wq);</div><div class='hunk'>@@ -5658,12 +6436,7 @@ static int ext4_sync_fs(struct super_block *sb, int wait)</div><div class='ctx'> static int ext4_freeze(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	int error = 0;</div><div class='del'>-	journal_t *journal;</div><div class='del'>-</div><div class='del'>-	if (sb_rdonly(sb))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	journal = EXT4_SB(sb)-&gt;s_journal;</div><div class='add'>+	journal_t *journal = EXT4_SB(sb)-&gt;s_journal;</div><div class='ctx'> </div><div class='ctx'> 	if (journal) {</div><div class='ctx'> 		/* Now we set up the journal barrier. */</div><div class='hunk'>@@ -5697,7 +6470,7 @@ out:</div><div class='ctx'>  */</div><div class='ctx'> static int ext4_unfreeze(struct super_block *sb)</div><div class='ctx'> {</div><div class='del'>-	if (sb_rdonly(sb) || ext4_forced_shutdown(EXT4_SB(sb)))</div><div class='add'>+	if (ext4_emergency_state(sb))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	if (EXT4_SB(sb)-&gt;s_journal) {</div><div class='hunk'>@@ -5727,27 +6500,22 @@ struct ext4_mount_options {</div><div class='ctx'> #endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int ext4_remount(struct super_block *sb, int *flags, char *data)</div><div class='add'>+static int __ext4_remount(struct fs_context *fc, struct super_block *sb)</div><div class='ctx'> {</div><div class='add'>+	struct ext4_fs_context *ctx = fc-&gt;fs_private;</div><div class='ctx'> 	struct ext4_super_block *es;</div><div class='ctx'> 	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='del'>-	unsigned long old_sb_flags, vfs_flags;</div><div class='add'>+	unsigned long old_sb_flags;</div><div class='ctx'> 	struct ext4_mount_options old_opts;</div><div class='ctx'> 	ext4_group_t g;</div><div class='ctx'> 	int err = 0;</div><div class='add'>+	int alloc_ctx;</div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='ctx'> 	int enable_quota = 0;</div><div class='ctx'> 	int i, j;</div><div class='ctx'> 	char *to_free[EXT4_MAXQUOTAS];</div><div class='ctx'> #endif</div><div class='del'>-	char *orig_data = kstrdup(data, GFP_KERNEL);</div><div class='del'>-	struct ext4_parsed_options parsed_opts;</div><div class='del'>-</div><div class='del'>-	parsed_opts.journal_ioprio = DEFAULT_JOURNAL_IOPRIO;</div><div class='del'>-	parsed_opts.journal_devnum = 0;</div><div class='ctx'> </div><div class='del'>-	if (data &amp;&amp; !orig_data)</div><div class='del'>-		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	/* Store the original options */</div><div class='ctx'> 	old_sb_flags = sb-&gt;s_flags;</div><div class='hunk'>@@ -5768,29 +6536,40 @@ static int ext4_remount(struct super_block *sb, int *flags, char *data)</div><div class='ctx'> 			if (!old_opts.s_qf_names[i]) {</div><div class='ctx'> 				for (j = 0; j &lt; i; j++)</div><div class='ctx'> 					kfree(old_opts.s_qf_names[j]);</div><div class='del'>-				kfree(orig_data);</div><div class='ctx'> 				return -ENOMEM;</div><div class='ctx'> 			}</div><div class='ctx'> 		} else</div><div class='ctx'> 			old_opts.s_qf_names[i] = NULL;</div><div class='ctx'> #endif</div><div class='del'>-	if (sbi-&gt;s_journal &amp;&amp; sbi-&gt;s_journal-&gt;j_task-&gt;io_context)</div><div class='del'>-		parsed_opts.journal_ioprio =</div><div class='del'>-			sbi-&gt;s_journal-&gt;j_task-&gt;io_context-&gt;ioprio;</div><div class='add'>+	if (!(ctx-&gt;spec &amp; EXT4_SPEC_JOURNAL_IOPRIO)) {</div><div class='add'>+		if (sbi-&gt;s_journal &amp;&amp; sbi-&gt;s_journal-&gt;j_task-&gt;io_context)</div><div class='add'>+			ctx-&gt;journal_ioprio =</div><div class='add'>+				sbi-&gt;s_journal-&gt;j_task-&gt;io_context-&gt;ioprio;</div><div class='add'>+		else</div><div class='add'>+			ctx-&gt;journal_ioprio = EXT4_DEF_JOURNAL_IOPRIO;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Some options can be enabled by ext4 and/or by VFS mount flag</div><div class='del'>-	 * either way we need to make sure it matches in both *flags and</div><div class='del'>-	 * s_flags. Copy those selected flags from *flags to s_flags</div><div class='del'>-	 */</div><div class='del'>-	vfs_flags = SB_LAZYTIME | SB_I_VERSION;</div><div class='del'>-	sb-&gt;s_flags = (sb-&gt;s_flags &amp; ~vfs_flags) | (*flags &amp; vfs_flags);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (!parse_options(data, sb, &amp;parsed_opts, 1)) {</div><div class='del'>-		err = -EINVAL;</div><div class='del'>-		goto restore_opts;</div><div class='add'>+	if ((ctx-&gt;spec &amp; EXT4_SPEC_s_stripe) &amp;&amp;</div><div class='add'>+	    ext4_is_stripe_incompatible(sb, ctx-&gt;s_stripe)) {</div><div class='add'>+		ext4_msg(sb, KERN_WARNING,</div><div class='add'>+			 "stripe (%lu) is not aligned with cluster size (%u), "</div><div class='add'>+			 "stripe is disabled",</div><div class='add'>+			 ctx-&gt;s_stripe, sbi-&gt;s_cluster_ratio);</div><div class='add'>+		ctx-&gt;s_stripe = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Changing the DIOREAD_NOLOCK or DELALLOC mount options may cause</div><div class='add'>+	 * two calls to ext4_should_dioread_nolock() to return inconsistent</div><div class='add'>+	 * values, triggering WARN_ON in ext4_add_complete_io(). we grab</div><div class='add'>+	 * here s_writepages_rwsem to avoid race between writepages ops and</div><div class='add'>+	 * remount.</div><div class='add'>+	 */</div><div class='add'>+	alloc_ctx = ext4_writepages_down_write(sb);</div><div class='add'>+	ext4_apply_options(fc, sb);</div><div class='add'>+	ext4_writepages_up_write(sb, alloc_ctx);</div><div class='add'>+</div><div class='ctx'> 	if ((old_opts.s_mount_opt &amp; EXT4_MOUNT_JOURNAL_CHECKSUM) ^</div><div class='ctx'> 	    test_opt(sb, JOURNAL_CHECKSUM)) {</div><div class='ctx'> 		ext4_msg(sb, KERN_ERR, "changing journal_checksum "</div><div class='hunk'>@@ -5826,8 +6605,12 @@ static int ext4_remount(struct super_block *sb, int *flags, char *data)</div><div class='ctx'> 		goto restore_opts;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (ext4_test_mount_flag(sb, EXT4_MF_FS_ABORTED))</div><div class='del'>-		ext4_abort(sb, ESHUTDOWN, "Abort forced by user");</div><div class='add'>+	if ((old_opts.s_mount_opt &amp; EXT4_MOUNT_DELALLOC) &amp;&amp;</div><div class='add'>+	    !test_opt(sb, DELALLOC)) {</div><div class='add'>+		ext4_msg(sb, KERN_ERR, "can't disable delalloc during remount");</div><div class='add'>+		err = -EINVAL;</div><div class='add'>+		goto restore_opts;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	sb-&gt;s_flags = (sb-&gt;s_flags &amp; ~SB_POSIXACL) |</div><div class='ctx'> 		(test_opt(sb, POSIX_ACL) ? SB_POSIXACL : 0);</div><div class='hunk'>@@ -5836,19 +6619,19 @@ static int ext4_remount(struct super_block *sb, int *flags, char *data)</div><div class='ctx'> </div><div class='ctx'> 	if (sbi-&gt;s_journal) {</div><div class='ctx'> 		ext4_init_journal_params(sb, sbi-&gt;s_journal);</div><div class='del'>-		set_task_ioprio(sbi-&gt;s_journal-&gt;j_task, parsed_opts.journal_ioprio);</div><div class='add'>+		set_task_ioprio(sbi-&gt;s_journal-&gt;j_task, ctx-&gt;journal_ioprio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Flush outstanding errors before changing fs state */</div><div class='del'>-	flush_work(&amp;sbi-&gt;s_error_work);</div><div class='add'>+	flush_work(&amp;sbi-&gt;s_sb_upd_work);</div><div class='ctx'> </div><div class='del'>-	if ((bool)(*flags &amp; SB_RDONLY) != sb_rdonly(sb)) {</div><div class='del'>-		if (ext4_test_mount_flag(sb, EXT4_MF_FS_ABORTED)) {</div><div class='add'>+	if ((bool)(fc-&gt;sb_flags &amp; SB_RDONLY) != sb_rdonly(sb)) {</div><div class='add'>+		if (ext4_emergency_state(sb)) {</div><div class='ctx'> 			err = -EROFS;</div><div class='ctx'> 			goto restore_opts;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (*flags &amp; SB_RDONLY) {</div><div class='add'>+		if (fc-&gt;sb_flags &amp; SB_RDONLY) {</div><div class='ctx'> 			err = sync_filesystem(sb);</div><div class='ctx'> 			if (err &lt; 0)</div><div class='ctx'> 				goto restore_opts;</div><div class='hunk'>@@ -5928,19 +6711,20 @@ static int ext4_remount(struct super_block *sb, int *flags, char *data)</div><div class='ctx'> 				if (err)</div><div class='ctx'> 					goto restore_opts;</div><div class='ctx'> 			}</div><div class='del'>-			sbi-&gt;s_mount_state = le16_to_cpu(es-&gt;s_state);</div><div class='add'>+			sbi-&gt;s_mount_state = (le16_to_cpu(es-&gt;s_state) &amp;</div><div class='add'>+					      ~EXT4_FC_REPLAY);</div><div class='ctx'> </div><div class='ctx'> 			err = ext4_setup_super(sb, es, 0);</div><div class='ctx'> 			if (err)</div><div class='ctx'> 				goto restore_opts;</div><div class='ctx'> </div><div class='ctx'> 			sb-&gt;s_flags &amp;= ~SB_RDONLY;</div><div class='del'>-			if (ext4_has_feature_mmp(sb))</div><div class='del'>-				if (ext4_multi_mount_protect(sb,</div><div class='del'>-						le64_to_cpu(es-&gt;s_mmp_block))) {</div><div class='del'>-					err = -EROFS;</div><div class='add'>+			if (ext4_has_feature_mmp(sb)) {</div><div class='add'>+				err = ext4_multi_mount_protect(sb,</div><div class='add'>+						le64_to_cpu(es-&gt;s_mmp_block));</div><div class='add'>+				if (err)</div><div class='ctx'> 					goto restore_opts;</div><div class='del'>-				}</div><div class='add'>+			}</div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='ctx'> 			enable_quota = 1;</div><div class='ctx'> #endif</div><div class='hunk'>@@ -5948,18 +6732,6 @@ static int ext4_remount(struct super_block *sb, int *flags, char *data)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Reinitialize lazy itable initialization thread based on</div><div class='del'>-	 * current settings</div><div class='del'>-	 */</div><div class='del'>-	if (sb_rdonly(sb) || !test_opt(sb, INIT_INODE_TABLE))</div><div class='del'>-		ext4_unregister_li_request(sb);</div><div class='del'>-	else {</div><div class='del'>-		ext4_group_t first_not_zeroed;</div><div class='del'>-		first_not_zeroed = ext4_has_uninit_itable(sb);</div><div class='del'>-		ext4_register_li_request(sb, first_not_zeroed);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='ctx'> 	 * Handle creation of system zone data early because it can fail.</div><div class='ctx'> 	 * Releasing of existing data is done when we are sure remount will</div><div class='ctx'> 	 * succeed.</div><div class='hunk'>@@ -5977,9 +6749,6 @@ static int ext4_remount(struct super_block *sb, int *flags, char *data)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='del'>-	/* Release old quota file names */</div><div class='del'>-	for (i = 0; i &lt; EXT4_MAXQUOTAS; i++)</div><div class='del'>-		kfree(old_opts.s_qf_names[i]);</div><div class='ctx'> 	if (enable_quota) {</div><div class='ctx'> 		if (sb_any_quota_suspended(sb))</div><div class='ctx'> 			dquot_resume(sb, -1);</div><div class='hunk'>@@ -5989,26 +6758,48 @@ static int ext4_remount(struct super_block *sb, int *flags, char *data)</div><div class='ctx'> 				goto restore_opts;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='add'>+	/* Release old quota file names */</div><div class='add'>+	for (i = 0; i &lt; EXT4_MAXQUOTAS; i++)</div><div class='add'>+		kfree(old_opts.s_qf_names[i]);</div><div class='ctx'> #endif</div><div class='ctx'> 	if (!test_opt(sb, BLOCK_VALIDITY) &amp;&amp; sbi-&gt;s_system_blks)</div><div class='ctx'> 		ext4_release_system_zone(sb);</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Reinitialize lazy itable initialization thread based on</div><div class='add'>+	 * current settings</div><div class='add'>+	 */</div><div class='add'>+	if (sb_rdonly(sb) || !test_opt(sb, INIT_INODE_TABLE))</div><div class='add'>+		ext4_unregister_li_request(sb);</div><div class='add'>+	else {</div><div class='add'>+		ext4_group_t first_not_zeroed;</div><div class='add'>+		first_not_zeroed = ext4_has_uninit_itable(sb);</div><div class='add'>+		ext4_register_li_request(sb, first_not_zeroed);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (!ext4_has_feature_mmp(sb) || sb_rdonly(sb))</div><div class='ctx'> 		ext4_stop_mmpd(sbi);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Some options can be enabled by ext4 and/or by VFS mount flag</div><div class='del'>-	 * either way we need to make sure it matches in both *flags and</div><div class='del'>-	 * s_flags. Copy those selected flags from s_flags to *flags</div><div class='add'>+	 * Handle aborting the filesystem as the last thing during remount to</div><div class='add'>+	 * avoid obsure errors during remount when some option changes fail to</div><div class='add'>+	 * apply due to shutdown filesystem.</div><div class='ctx'> 	 */</div><div class='del'>-	*flags = (*flags &amp; ~vfs_flags) | (sb-&gt;s_flags &amp; vfs_flags);</div><div class='add'>+	if (test_opt2(sb, ABORT))</div><div class='add'>+		ext4_abort(sb, ESHUTDOWN, "Abort forced by user");</div><div class='ctx'> </div><div class='del'>-	ext4_msg(sb, KERN_INFO, "re-mounted. Opts: %s. Quota mode: %s.",</div><div class='del'>-		 orig_data, ext4_quota_mode(sb));</div><div class='del'>-	kfree(orig_data);</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> restore_opts:</div><div class='add'>+	/*</div><div class='add'>+	 * If there was a failing r/w to ro transition, we may need to</div><div class='add'>+	 * re-enable quota</div><div class='add'>+	 */</div><div class='add'>+	if (sb_rdonly(sb) &amp;&amp; !(old_sb_flags &amp; SB_RDONLY) &amp;&amp;</div><div class='add'>+	    sb_any_quota_suspended(sb))</div><div class='add'>+		dquot_resume(sb, -1);</div><div class='add'>+</div><div class='add'>+	alloc_ctx = ext4_writepages_down_write(sb);</div><div class='ctx'> 	sb-&gt;s_flags = old_sb_flags;</div><div class='ctx'> 	sbi-&gt;s_mount_opt = old_opts.s_mount_opt;</div><div class='ctx'> 	sbi-&gt;s_mount_opt2 = old_opts.s_mount_opt2;</div><div class='hunk'>@@ -6017,6 +6808,8 @@ restore_opts:</div><div class='ctx'> 	sbi-&gt;s_commit_interval = old_opts.s_commit_interval;</div><div class='ctx'> 	sbi-&gt;s_min_batch_time = old_opts.s_min_batch_time;</div><div class='ctx'> 	sbi-&gt;s_max_batch_time = old_opts.s_max_batch_time;</div><div class='add'>+	ext4_writepages_up_write(sb, alloc_ctx);</div><div class='add'>+</div><div class='ctx'> 	if (!test_opt(sb, BLOCK_VALIDITY) &amp;&amp; sbi-&gt;s_system_blks)</div><div class='ctx'> 		ext4_release_system_zone(sb);</div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='hunk'>@@ -6031,10 +6824,32 @@ restore_opts:</div><div class='ctx'> #endif</div><div class='ctx'> 	if (!ext4_has_feature_mmp(sb) || sb_rdonly(sb))</div><div class='ctx'> 		ext4_stop_mmpd(sbi);</div><div class='del'>-	kfree(orig_data);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int ext4_reconfigure(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = fc-&gt;root-&gt;d_sb;</div><div class='add'>+	int ret;</div><div class='add'>+	bool old_ro = sb_rdonly(sb);</div><div class='add'>+</div><div class='add'>+	fc-&gt;s_fs_info = EXT4_SB(sb);</div><div class='add'>+</div><div class='add'>+	ret = ext4_check_opt_consistency(fc, sb);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	ret = __ext4_remount(fc, sb);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	ext4_msg(sb, KERN_INFO, "re-mounted %pU%s.",</div><div class='add'>+		 &amp;sb-&gt;s_uuid,</div><div class='add'>+		 (old_ro != sb_rdonly(sb)) ? (sb_rdonly(sb) ? " ro" : " r/w") : "");</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='ctx'> static int ext4_statfs_project(struct super_block *sb,</div><div class='ctx'> 			       kprojid_t projid, struct kstatfs *buf)</div><div class='hunk'>@@ -6054,22 +6869,29 @@ static int ext4_statfs_project(struct super_block *sb,</div><div class='ctx'> 			     dquot-&gt;dq_dqb.dqb_bhardlimit);</div><div class='ctx'> 	limit &gt;&gt;= sb-&gt;s_blocksize_bits;</div><div class='ctx'> </div><div class='del'>-	if (limit &amp;&amp; buf-&gt;f_blocks &gt; limit) {</div><div class='add'>+	if (limit) {</div><div class='add'>+		uint64_t	remaining = 0;</div><div class='add'>+</div><div class='ctx'> 		curblock = (dquot-&gt;dq_dqb.dqb_curspace +</div><div class='ctx'> 			    dquot-&gt;dq_dqb.dqb_rsvspace) &gt;&gt; sb-&gt;s_blocksize_bits;</div><div class='del'>-		buf-&gt;f_blocks = limit;</div><div class='del'>-		buf-&gt;f_bfree = buf-&gt;f_bavail =</div><div class='del'>-			(buf-&gt;f_blocks &gt; curblock) ?</div><div class='del'>-			 (buf-&gt;f_blocks - curblock) : 0;</div><div class='add'>+		if (limit &gt; curblock)</div><div class='add'>+			remaining = limit - curblock;</div><div class='add'>+</div><div class='add'>+		buf-&gt;f_blocks = min(buf-&gt;f_blocks, limit);</div><div class='add'>+		buf-&gt;f_bfree = min(buf-&gt;f_bfree, remaining);</div><div class='add'>+		buf-&gt;f_bavail = min(buf-&gt;f_bavail, remaining);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	limit = min_not_zero(dquot-&gt;dq_dqb.dqb_isoftlimit,</div><div class='ctx'> 			     dquot-&gt;dq_dqb.dqb_ihardlimit);</div><div class='del'>-	if (limit &amp;&amp; buf-&gt;f_files &gt; limit) {</div><div class='del'>-		buf-&gt;f_files = limit;</div><div class='del'>-		buf-&gt;f_ffree =</div><div class='del'>-			(buf-&gt;f_files &gt; dquot-&gt;dq_dqb.dqb_curinodes) ?</div><div class='del'>-			 (buf-&gt;f_files - dquot-&gt;dq_dqb.dqb_curinodes) : 0;</div><div class='add'>+	if (limit) {</div><div class='add'>+		uint64_t	remaining = 0;</div><div class='add'>+</div><div class='add'>+		if (limit &gt; dquot-&gt;dq_dqb.dqb_curinodes)</div><div class='add'>+			remaining = limit - dquot-&gt;dq_dqb.dqb_curinodes;</div><div class='add'>+</div><div class='add'>+		buf-&gt;f_files = min(buf-&gt;f_files, limit);</div><div class='add'>+		buf-&gt;f_ffree = min(buf-&gt;f_ffree, remaining);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	spin_unlock(&amp;dquot-&gt;dq_dqb_lock);</div><div class='hunk'>@@ -6138,6 +6960,10 @@ static int ext4_write_dquot(struct dquot *dquot)</div><div class='ctx'> 	if (IS_ERR(handle))</div><div class='ctx'> 		return PTR_ERR(handle);</div><div class='ctx'> 	ret = dquot_commit(dquot);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		ext4_error_err(dquot-&gt;dq_sb, -ret,</div><div class='add'>+			       "Failed to commit dquot type %d",</div><div class='add'>+			       dquot-&gt;dq_id.type);</div><div class='ctx'> 	err = ext4_journal_stop(handle);</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		ret = err;</div><div class='hunk'>@@ -6154,6 +6980,10 @@ static int ext4_acquire_dquot(struct dquot *dquot)</div><div class='ctx'> 	if (IS_ERR(handle))</div><div class='ctx'> 		return PTR_ERR(handle);</div><div class='ctx'> 	ret = dquot_acquire(dquot);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		ext4_error_err(dquot-&gt;dq_sb, -ret,</div><div class='add'>+			      "Failed to acquire dquot type %d",</div><div class='add'>+			      dquot-&gt;dq_id.type);</div><div class='ctx'> 	err = ext4_journal_stop(handle);</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		ret = err;</div><div class='hunk'>@@ -6164,18 +6994,39 @@ static int ext4_release_dquot(struct dquot *dquot)</div><div class='ctx'> {</div><div class='ctx'> 	int ret, err;</div><div class='ctx'> 	handle_t *handle;</div><div class='add'>+	bool freeze_protected = false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Trying to sb_start_intwrite() in a running transaction</div><div class='add'>+	 * can result in a deadlock. Further, running transactions</div><div class='add'>+	 * are already protected from freezing.</div><div class='add'>+	 */</div><div class='add'>+	if (!ext4_journal_current_handle()) {</div><div class='add'>+		sb_start_intwrite(dquot-&gt;dq_sb);</div><div class='add'>+		freeze_protected = true;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	handle = ext4_journal_start(dquot_to_inode(dquot), EXT4_HT_QUOTA,</div><div class='ctx'> 				    EXT4_QUOTA_DEL_BLOCKS(dquot-&gt;dq_sb));</div><div class='ctx'> 	if (IS_ERR(handle)) {</div><div class='ctx'> 		/* Release dquot anyway to avoid endless cycle in dqput() */</div><div class='ctx'> 		dquot_release(dquot);</div><div class='add'>+		if (freeze_protected)</div><div class='add'>+			sb_end_intwrite(dquot-&gt;dq_sb);</div><div class='ctx'> 		return PTR_ERR(handle);</div><div class='ctx'> 	}</div><div class='ctx'> 	ret = dquot_release(dquot);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		ext4_error_err(dquot-&gt;dq_sb, -ret,</div><div class='add'>+			       "Failed to release dquot type %d",</div><div class='add'>+			       dquot-&gt;dq_id.type);</div><div class='ctx'> 	err = ext4_journal_stop(handle);</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		ret = err;</div><div class='add'>+</div><div class='add'>+	if (freeze_protected)</div><div class='add'>+		sb_end_intwrite(dquot-&gt;dq_sb);</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -6197,7 +7048,7 @@ static int ext4_write_info(struct super_block *sb, int type)</div><div class='ctx'> 	handle_t *handle;</div><div class='ctx'> </div><div class='ctx'> 	/* Data block + inode block */</div><div class='del'>-	handle = ext4_journal_start(d_inode(sb-&gt;s_root), EXT4_HT_QUOTA, 2);</div><div class='add'>+	handle = ext4_journal_start_sb(sb, EXT4_HT_QUOTA, 2);</div><div class='ctx'> 	if (IS_ERR(handle))</div><div class='ctx'> 		return PTR_ERR(handle);</div><div class='ctx'> 	ret = dquot_commit_info(sb, type);</div><div class='hunk'>@@ -6256,29 +7107,9 @@ static int ext4_quota_on(struct super_block *sb, int type, int format_id,</div><div class='ctx'> 		sb_dqopt(sb)-&gt;flags &amp;= ~DQUOT_NOLIST_DIRTY;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * When we journal data on quota file, we have to flush journal to see</div><div class='del'>-	 * all updates to the file when we bypass pagecache...</div><div class='del'>-	 */</div><div class='del'>-	if (EXT4_SB(sb)-&gt;s_journal &amp;&amp;</div><div class='del'>-	    ext4_should_journal_data(d_inode(path-&gt;dentry))) {</div><div class='del'>-		/*</div><div class='del'>-		 * We don't need to lock updates but journal_flush() could</div><div class='del'>-		 * otherwise be livelocked...</div><div class='del'>-		 */</div><div class='del'>-		jbd2_journal_lock_updates(EXT4_SB(sb)-&gt;s_journal);</div><div class='del'>-		err = jbd2_journal_flush(EXT4_SB(sb)-&gt;s_journal, 0);</div><div class='del'>-		jbd2_journal_unlock_updates(EXT4_SB(sb)-&gt;s_journal);</div><div class='del'>-		if (err)</div><div class='del'>-			return err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	lockdep_set_quota_inode(path-&gt;dentry-&gt;d_inode, I_DATA_SEM_QUOTA);</div><div class='ctx'> 	err = dquot_quota_on(sb, type, format_id, path);</div><div class='del'>-	if (err) {</div><div class='del'>-		lockdep_set_quota_inode(path-&gt;dentry-&gt;d_inode,</div><div class='del'>-					     I_DATA_SEM_NORMAL);</div><div class='del'>-	} else {</div><div class='add'>+	if (!err) {</div><div class='ctx'> 		struct inode *inode = d_inode(path-&gt;dentry);</div><div class='ctx'> 		handle_t *handle;</div><div class='ctx'> </div><div class='hunk'>@@ -6298,10 +7129,29 @@ static int ext4_quota_on(struct super_block *sb, int type, int format_id,</div><div class='ctx'> 		ext4_journal_stop(handle);</div><div class='ctx'> 	unlock_inode:</div><div class='ctx'> 		inode_unlock(inode);</div><div class='add'>+		if (err)</div><div class='add'>+			dquot_quota_off(sb, type);</div><div class='ctx'> 	}</div><div class='add'>+	if (err)</div><div class='add'>+		lockdep_set_quota_inode(path-&gt;dentry-&gt;d_inode,</div><div class='add'>+					     I_DATA_SEM_NORMAL);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline bool ext4_check_quota_inum(int type, unsigned long qf_inum)</div><div class='add'>+{</div><div class='add'>+	switch (type) {</div><div class='add'>+	case USRQUOTA:</div><div class='add'>+		return qf_inum == EXT4_USR_QUOTA_INO;</div><div class='add'>+	case GRPQUOTA:</div><div class='add'>+		return qf_inum == EXT4_GRP_QUOTA_INO;</div><div class='add'>+	case PRJQUOTA:</div><div class='add'>+		return qf_inum &gt;= EXT4_GOOD_OLD_FIRST_INO;</div><div class='add'>+	default:</div><div class='add'>+		BUG();</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int ext4_quota_enable(struct super_block *sb, int type, int format_id,</div><div class='ctx'> 			     unsigned int flags)</div><div class='ctx'> {</div><div class='hunk'>@@ -6318,9 +7168,16 @@ static int ext4_quota_enable(struct super_block *sb, int type, int format_id,</div><div class='ctx'> 	if (!qf_inums[type])</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='add'>+	if (!ext4_check_quota_inum(type, qf_inums[type])) {</div><div class='add'>+		ext4_error(sb, "Bad quota inum: %lu, type: %d",</div><div class='add'>+				qf_inums[type], type);</div><div class='add'>+		return -EUCLEAN;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	qf_inode = ext4_iget(sb, qf_inums[type], EXT4_IGET_SPECIAL);</div><div class='ctx'> 	if (IS_ERR(qf_inode)) {</div><div class='del'>-		ext4_error(sb, "Bad quota inode # %lu", qf_inums[type]);</div><div class='add'>+		ext4_error(sb, "Bad quota inode: %lu, type: %d",</div><div class='add'>+				qf_inums[type], type);</div><div class='ctx'> 		return PTR_ERR(qf_inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -6359,11 +7216,11 @@ int ext4_enable_quotas(struct super_block *sb)</div><div class='ctx'> 			if (err) {</div><div class='ctx'> 				ext4_warning(sb,</div><div class='ctx'> 					"Failed to enable quota tracking "</div><div class='del'>-					"(type=%d, err=%d). Please run "</div><div class='del'>-					"e2fsck to fix.", type, err);</div><div class='del'>-				for (type--; type &gt;= 0; type--)</div><div class='del'>-					dquot_quota_off(sb, type);</div><div class='add'>+					"(type=%d, err=%d, ino=%lu). "</div><div class='add'>+					"Please run e2fsck to fix.", type,</div><div class='add'>+					err, qf_inums[type]);</div><div class='ctx'> </div><div class='add'>+				ext4_quotas_off(sb, type);</div><div class='ctx'> 				return err;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='hunk'>@@ -6388,6 +7245,13 @@ static int ext4_quota_off(struct super_block *sb, int type)</div><div class='ctx'> 	err = dquot_quota_off(sb, type);</div><div class='ctx'> 	if (err || ext4_has_feature_quota(sb))</div><div class='ctx'> 		goto out_put;</div><div class='add'>+	/*</div><div class='add'>+	 * When the filesystem was remounted read-only first, we cannot cleanup</div><div class='add'>+	 * inode flags here. Bad luck but people should be using QUOTA feature</div><div class='add'>+	 * these days anyway.</div><div class='add'>+	 */</div><div class='add'>+	if (sb_rdonly(sb))</div><div class='add'>+		goto out_put;</div><div class='ctx'> </div><div class='ctx'> 	inode_lock(inode);</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -6402,7 +7266,7 @@ static int ext4_quota_off(struct super_block *sb, int type)</div><div class='ctx'> 	}</div><div class='ctx'> 	EXT4_I(inode)-&gt;i_flags &amp;= ~(EXT4_NOATIME_FL | EXT4_IMMUTABLE_FL);</div><div class='ctx'> 	inode_set_flags(inode, 0, S_NOATIME | S_IMMUTABLE);</div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_mtime_to_ts(inode, inode_set_ctime_current(inode));</div><div class='ctx'> 	err = ext4_mark_inode_dirty(handle, inode);</div><div class='ctx'> 	ext4_journal_stop(handle);</div><div class='ctx'> out_unlock:</div><div class='hunk'>@@ -6436,8 +7300,7 @@ static ssize_t ext4_quota_read(struct super_block *sb, int type, char *data,</div><div class='ctx'> 		len = i_size-off;</div><div class='ctx'> 	toread = len;</div><div class='ctx'> 	while (toread &gt; 0) {</div><div class='del'>-		tocopy = sb-&gt;s_blocksize - offset &lt; toread ?</div><div class='del'>-				sb-&gt;s_blocksize - offset : toread;</div><div class='add'>+		tocopy = min_t(unsigned long, sb-&gt;s_blocksize - offset, toread);</div><div class='ctx'> 		bh = ext4_bread(NULL, inode, blk, 0);</div><div class='ctx'> 		if (IS_ERR(bh))</div><div class='ctx'> 			return PTR_ERR(bh);</div><div class='hunk'>@@ -6466,7 +7329,7 @@ static ssize_t ext4_quota_write(struct super_block *sb, int type,</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> 	handle_t *handle = journal_current_handle();</div><div class='ctx'> </div><div class='del'>-	if (EXT4_SB(sb)-&gt;s_journal &amp;&amp; !handle) {</div><div class='add'>+	if (!handle) {</div><div class='ctx'> 		ext4_msg(sb, KERN_WARNING, "Quota write (off=%llu, len=%llu)"</div><div class='ctx'> 			" cancelled because transaction is not started",</div><div class='ctx'> 			(unsigned long long)off, (unsigned long long)len);</div><div class='hunk'>@@ -6501,7 +7364,7 @@ static ssize_t ext4_quota_write(struct super_block *sb, int type,</div><div class='ctx'> 	}</div><div class='ctx'> 	lock_buffer(bh);</div><div class='ctx'> 	memcpy(bh-&gt;b_data+offset, data, len);</div><div class='del'>-	flush_dcache_page(bh-&gt;b_page);</div><div class='add'>+	flush_dcache_folio(bh-&gt;b_folio);</div><div class='ctx'> 	unlock_buffer(bh);</div><div class='ctx'> 	err = ext4_handle_dirty_metadata(handle, NULL, bh);</div><div class='ctx'> 	brelse(bh);</div><div class='hunk'>@@ -6517,12 +7380,6 @@ out:</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-static struct dentry *ext4_mount(struct file_system_type *fs_type, int flags,</div><div class='del'>-		       const char *dev_name, void *data)</div><div class='del'>-{</div><div class='del'>-	return mount_bdev(fs_type, flags, dev_name, data, ext4_fill_super);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> #if !defined(CONFIG_EXT2_FS) &amp;&amp; !defined(CONFIG_EXT2_FS_MODULE) &amp;&amp; defined(CONFIG_EXT4_USE_FOR_EXT2)</div><div class='ctx'> static inline void register_as_ext2(void)</div><div class='ctx'> {</div><div class='hunk'>@@ -6579,21 +7436,31 @@ static inline int ext3_feature_set_ok(struct super_block *sb)</div><div class='ctx'> 	return 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void ext4_kill_sb(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct ext4_sb_info *sbi = EXT4_SB(sb);</div><div class='add'>+	struct file *bdev_file = sbi ? sbi-&gt;s_journal_bdev_file : NULL;</div><div class='add'>+</div><div class='add'>+	kill_block_super(sb);</div><div class='add'>+</div><div class='add'>+	if (bdev_file)</div><div class='add'>+		bdev_fput(bdev_file);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static struct file_system_type ext4_fs_type = {</div><div class='del'>-	.owner		= THIS_MODULE,</div><div class='del'>-	.name		= "ext4",</div><div class='del'>-	.mount		= ext4_mount,</div><div class='del'>-	.kill_sb	= kill_block_super,</div><div class='del'>-	.fs_flags	= FS_REQUIRES_DEV | FS_ALLOW_IDMAP,</div><div class='add'>+	.owner			= THIS_MODULE,</div><div class='add'>+	.name			= "ext4",</div><div class='add'>+	.init_fs_context	= ext4_init_fs_context,</div><div class='add'>+	.parameters		= ext4_param_specs,</div><div class='add'>+	.kill_sb		= ext4_kill_sb,</div><div class='add'>+	.fs_flags		= FS_REQUIRES_DEV | FS_ALLOW_IDMAP | FS_MGTIME |</div><div class='add'>+				  FS_LBS,</div><div class='ctx'> };</div><div class='ctx'> MODULE_ALIAS_FS("ext4");</div><div class='ctx'> </div><div class='del'>-/* Shared across all ext4 file systems */</div><div class='del'>-wait_queue_head_t ext4__ioend_wq[EXT4_WQ_HASH_SZ];</div><div class='del'>-</div><div class='ctx'> static int __init ext4_init_fs(void)</div><div class='ctx'> {</div><div class='del'>-	int i, err;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='ctx'> 	ratelimit_state_init(&amp;ext4_mount_msg_ratelimit, 30 * HZ, 64);</div><div class='ctx'> 	ext4_li_info = NULL;</div><div class='hunk'>@@ -6601,9 +7468,6 @@ static int __init ext4_init_fs(void)</div><div class='ctx'> 	/* Build-time check for flags consistency */</div><div class='ctx'> 	ext4_check_flag_values();</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; EXT4_WQ_HASH_SZ; i++)</div><div class='del'>-		init_waitqueue_head(&amp;ext4__ioend_wq[i]);</div><div class='del'>-</div><div class='ctx'> 	err = ext4_init_es();</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='hunk'>@@ -6649,6 +7513,7 @@ static int __init ext4_init_fs(void)</div><div class='ctx'> out:</div><div class='ctx'> 	unregister_as_ext2();</div><div class='ctx'> 	unregister_as_ext3();</div><div class='add'>+	ext4_fc_destroy_dentry_cache();</div><div class='ctx'> out05:</div><div class='ctx'> 	destroy_inodecache();</div><div class='ctx'> out1:</div><div class='hunk'>@@ -6675,6 +7540,7 @@ static void __exit ext4_exit_fs(void)</div><div class='ctx'> 	unregister_as_ext2();</div><div class='ctx'> 	unregister_as_ext3();</div><div class='ctx'> 	unregister_filesystem(&amp;ext4_fs_type);</div><div class='add'>+	ext4_fc_destroy_dentry_cache();</div><div class='ctx'> 	destroy_inodecache();</div><div class='ctx'> 	ext4_exit_mballoc();</div><div class='ctx'> 	ext4_exit_sysfs();</div><div class='hunk'>@@ -6688,6 +7554,5 @@ static void __exit ext4_exit_fs(void)</div><div class='ctx'> MODULE_AUTHOR("Remy Card, Stephen Tweedie, Andrew Morton, Andreas Dilger, Theodore Ts'o and others");</div><div class='ctx'> MODULE_DESCRIPTION("Fourth Extended Filesystem");</div><div class='ctx'> MODULE_LICENSE("GPL");</div><div class='del'>-MODULE_SOFTDEP("pre: crc32c");</div><div class='ctx'> module_init(ext4_init_fs)</div><div class='ctx'> module_exit(ext4_exit_fs)</div><div class='head'>diff --git a/fs/ext4/symlink.c b/fs/ext4/symlink.c<br/>index 69109746e6e2..645240cc0229 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/symlink.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/symlink.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/symlink.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/symlink.c</a></div><div class='hunk'>@@ -27,7 +27,7 @@ static const char *ext4_encrypted_get_link(struct dentry *dentry,</div><div class='ctx'> 					   struct inode *inode,</div><div class='ctx'> 					   struct delayed_call *done)</div><div class='ctx'> {</div><div class='del'>-	struct page *cpage = NULL;</div><div class='add'>+	struct buffer_head *bh = NULL;</div><div class='ctx'> 	const void *caddr;</div><div class='ctx'> 	unsigned int max_size;</div><div class='ctx'> 	const char *paddr;</div><div class='hunk'>@@ -39,29 +39,81 @@ static const char *ext4_encrypted_get_link(struct dentry *dentry,</div><div class='ctx'> 		caddr = EXT4_I(inode)-&gt;i_data;</div><div class='ctx'> 		max_size = sizeof(EXT4_I(inode)-&gt;i_data);</div><div class='ctx'> 	} else {</div><div class='del'>-		cpage = read_mapping_page(inode-&gt;i_mapping, 0, NULL);</div><div class='del'>-		if (IS_ERR(cpage))</div><div class='del'>-			return ERR_CAST(cpage);</div><div class='del'>-		caddr = page_address(cpage);</div><div class='add'>+		bh = ext4_bread(NULL, inode, 0, 0);</div><div class='add'>+		if (IS_ERR(bh))</div><div class='add'>+			return ERR_CAST(bh);</div><div class='add'>+		if (!bh) {</div><div class='add'>+			EXT4_ERROR_INODE(inode, "bad symlink.");</div><div class='add'>+			return ERR_PTR(-EFSCORRUPTED);</div><div class='add'>+		}</div><div class='add'>+		caddr = bh-&gt;b_data;</div><div class='ctx'> 		max_size = inode-&gt;i_sb-&gt;s_blocksize;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	paddr = fscrypt_get_symlink(inode, caddr, max_size, done);</div><div class='del'>-	if (cpage)</div><div class='del'>-		put_page(cpage);</div><div class='add'>+	brelse(bh);</div><div class='ctx'> 	return paddr;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext4_encrypted_symlink_getattr(struct user_namespace *mnt_userns,</div><div class='add'>+static int ext4_encrypted_symlink_getattr(struct mnt_idmap *idmap,</div><div class='ctx'> 					  const struct path *path,</div><div class='ctx'> 					  struct kstat *stat, u32 request_mask,</div><div class='ctx'> 					  unsigned int query_flags)</div><div class='ctx'> {</div><div class='del'>-	ext4_getattr(mnt_userns, path, stat, request_mask, query_flags);</div><div class='add'>+	ext4_getattr(idmap, path, stat, request_mask, query_flags);</div><div class='ctx'> </div><div class='ctx'> 	return fscrypt_symlink_getattr(path, stat);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void ext4_free_link(void *bh)</div><div class='add'>+{</div><div class='add'>+	brelse(bh);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const char *ext4_get_link(struct dentry *dentry, struct inode *inode,</div><div class='add'>+				 struct delayed_call *callback)</div><div class='add'>+{</div><div class='add'>+	struct buffer_head *bh;</div><div class='add'>+	char *inline_link;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Create a new inlined symlink is not supported, just provide a</div><div class='add'>+	 * method to read the leftovers.</div><div class='add'>+	 */</div><div class='add'>+	if (ext4_has_inline_data(inode)) {</div><div class='add'>+		if (!dentry)</div><div class='add'>+			return ERR_PTR(-ECHILD);</div><div class='add'>+</div><div class='add'>+		inline_link = ext4_read_inline_link(inode);</div><div class='add'>+		if (!IS_ERR(inline_link))</div><div class='add'>+			set_delayed_call(callback, kfree_link, inline_link);</div><div class='add'>+		return inline_link;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!dentry) {</div><div class='add'>+		bh = ext4_getblk(NULL, inode, 0, EXT4_GET_BLOCKS_CACHED_NOWAIT);</div><div class='add'>+		if (IS_ERR(bh) || !bh)</div><div class='add'>+			return ERR_PTR(-ECHILD);</div><div class='add'>+		if (!ext4_buffer_uptodate(bh)) {</div><div class='add'>+			brelse(bh);</div><div class='add'>+			return ERR_PTR(-ECHILD);</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		bh = ext4_bread(NULL, inode, 0, 0);</div><div class='add'>+		if (IS_ERR(bh))</div><div class='add'>+			return ERR_CAST(bh);</div><div class='add'>+		if (!bh) {</div><div class='add'>+			EXT4_ERROR_INODE(inode, "bad symlink.");</div><div class='add'>+			return ERR_PTR(-EFSCORRUPTED);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	set_delayed_call(callback, ext4_free_link, bh);</div><div class='add'>+	nd_terminate_link(bh-&gt;b_data, inode-&gt;i_size,</div><div class='add'>+			  inode-&gt;i_sb-&gt;s_blocksize - 1);</div><div class='add'>+	return bh-&gt;b_data;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> const struct inode_operations ext4_encrypted_symlink_inode_operations = {</div><div class='ctx'> 	.get_link	= ext4_encrypted_get_link,</div><div class='ctx'> 	.setattr	= ext4_setattr,</div><div class='hunk'>@@ -70,7 +122,7 @@ const struct inode_operations ext4_encrypted_symlink_inode_operations = {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct inode_operations ext4_symlink_inode_operations = {</div><div class='del'>-	.get_link	= page_get_link,</div><div class='add'>+	.get_link	= ext4_get_link,</div><div class='ctx'> 	.setattr	= ext4_setattr,</div><div class='ctx'> 	.getattr	= ext4_getattr,</div><div class='ctx'> 	.listxattr	= ext4_listxattr,</div><div class='head'>diff --git a/fs/ext4/sysfs.c b/fs/ext4/sysfs.c<br/>index 2314f7446592..0018e09b867e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/sysfs.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/sysfs.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/sysfs.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/sysfs.c</a></div><div class='hunk'>@@ -29,7 +29,10 @@ typedef enum {</div><div class='ctx'> 	attr_trigger_test_error,</div><div class='ctx'> 	attr_first_error_time,</div><div class='ctx'> 	attr_last_error_time,</div><div class='add'>+	attr_clusters_in_group,</div><div class='add'>+	attr_mb_order,</div><div class='ctx'> 	attr_feature,</div><div class='add'>+	attr_pointer_pi,</div><div class='ctx'> 	attr_pointer_ui,</div><div class='ctx'> 	attr_pointer_ul,</div><div class='ctx'> 	attr_pointer_u64,</div><div class='hunk'>@@ -63,7 +66,7 @@ static ssize_t session_write_kbytes_show(struct ext4_sb_info *sbi, char *buf)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = sbi-&gt;s_buddy_cache-&gt;i_sb;</div><div class='ctx'> </div><div class='del'>-	return snprintf(buf, PAGE_SIZE, "%lu\n",</div><div class='add'>+	return sysfs_emit(buf, "%lu\n",</div><div class='ctx'> 			(part_stat_read(sb-&gt;s_bdev, sectors[STAT_WRITE]) -</div><div class='ctx'> 			 sbi-&gt;s_sectors_written_start) &gt;&gt; 1);</div><div class='ctx'> }</div><div class='hunk'>@@ -72,7 +75,7 @@ static ssize_t lifetime_write_kbytes_show(struct ext4_sb_info *sbi, char *buf)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = sbi-&gt;s_buddy_cache-&gt;i_sb;</div><div class='ctx'> </div><div class='del'>-	return snprintf(buf, PAGE_SIZE, "%llu\n",</div><div class='add'>+	return sysfs_emit(buf, "%llu\n",</div><div class='ctx'> 			(unsigned long long)(sbi-&gt;s_kbytes_written +</div><div class='ctx'> 			((part_stat_read(sb-&gt;s_bdev, sectors[STAT_WRITE]) -</div><div class='ctx'> 			  EXT4_SB(sb)-&gt;s_sectors_written_start) &gt;&gt; 1)));</div><div class='hunk'>@@ -104,7 +107,7 @@ static ssize_t reserved_clusters_store(struct ext4_sb_info *sbi,</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	ret = kstrtoull(skip_spaces(buf), 0, &amp;val);</div><div class='del'>-	if (ret || val &gt;= clusters)</div><div class='add'>+	if (ret || val &gt;= clusters || (s64)val &lt; 0)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	atomic64_set(&amp;sbi-&gt;s_resv_clusters, val);</div><div class='hunk'>@@ -130,8 +133,8 @@ static ssize_t trigger_test_error(struct ext4_sb_info *sbi,</div><div class='ctx'> static ssize_t journal_task_show(struct ext4_sb_info *sbi, char *buf)</div><div class='ctx'> {</div><div class='ctx'> 	if (!sbi-&gt;s_journal)</div><div class='del'>-		return snprintf(buf, PAGE_SIZE, "&lt;none&gt;\n");</div><div class='del'>-	return snprintf(buf, PAGE_SIZE, "%d\n",</div><div class='add'>+		return sysfs_emit(buf, "&lt;none&gt;\n");</div><div class='add'>+	return sysfs_emit(buf, "%d\n",</div><div class='ctx'> 			task_pid_vnr(sbi-&gt;s_journal-&gt;j_task));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -178,6 +181,9 @@ static struct ext4_attr ext4_attr_##_name = {			\</div><div class='ctx'> #define EXT4_RO_ATTR_ES_STRING(_name,_elname,_size)			\</div><div class='ctx'> 	EXT4_ATTR_STRING(_name, 0444, _size, ext4_super_block, _elname)</div><div class='ctx'> </div><div class='add'>+#define EXT4_RW_ATTR_SBI_PI(_name,_elname)      \</div><div class='add'>+	EXT4_ATTR_OFFSET(_name, 0644, pointer_pi, ext4_sb_info, _elname)</div><div class='add'>+</div><div class='ctx'> #define EXT4_RW_ATTR_SBI_UI(_name,_elname)	\</div><div class='ctx'> 	EXT4_ATTR_OFFSET(_name, 0644, pointer_ui, ext4_sb_info, _elname)</div><div class='ctx'> </div><div class='hunk'>@@ -207,23 +213,25 @@ EXT4_ATTR_FUNC(sra_exceeded_retry_limit, 0444);</div><div class='ctx'> </div><div class='ctx'> EXT4_ATTR_OFFSET(inode_readahead_blks, 0644, inode_readahead,</div><div class='ctx'> 		 ext4_sb_info, s_inode_readahead_blks);</div><div class='add'>+EXT4_ATTR_OFFSET(mb_group_prealloc, 0644, clusters_in_group,</div><div class='add'>+		 ext4_sb_info, s_mb_group_prealloc);</div><div class='add'>+EXT4_ATTR_OFFSET(mb_best_avail_max_trim_order, 0644, mb_order,</div><div class='add'>+		 ext4_sb_info, s_mb_best_avail_max_trim_order);</div><div class='ctx'> EXT4_RW_ATTR_SBI_UI(inode_goal, s_inode_goal);</div><div class='ctx'> EXT4_RW_ATTR_SBI_UI(mb_stats, s_mb_stats);</div><div class='ctx'> EXT4_RW_ATTR_SBI_UI(mb_max_to_scan, s_mb_max_to_scan);</div><div class='ctx'> EXT4_RW_ATTR_SBI_UI(mb_min_to_scan, s_mb_min_to_scan);</div><div class='ctx'> EXT4_RW_ATTR_SBI_UI(mb_order2_req, s_mb_order2_reqs);</div><div class='ctx'> EXT4_RW_ATTR_SBI_UI(mb_stream_req, s_mb_stream_request);</div><div class='del'>-EXT4_RW_ATTR_SBI_UI(mb_group_prealloc, s_mb_group_prealloc);</div><div class='del'>-EXT4_RW_ATTR_SBI_UI(mb_max_inode_prealloc, s_mb_max_inode_prealloc);</div><div class='ctx'> EXT4_RW_ATTR_SBI_UI(mb_max_linear_groups, s_mb_max_linear_groups);</div><div class='ctx'> EXT4_RW_ATTR_SBI_UI(extent_max_zeroout_kb, s_extent_max_zeroout_kb);</div><div class='ctx'> EXT4_ATTR(trigger_fs_error, 0200, trigger_test_error);</div><div class='del'>-EXT4_RW_ATTR_SBI_UI(err_ratelimit_interval_ms, s_err_ratelimit_state.interval);</div><div class='del'>-EXT4_RW_ATTR_SBI_UI(err_ratelimit_burst, s_err_ratelimit_state.burst);</div><div class='del'>-EXT4_RW_ATTR_SBI_UI(warning_ratelimit_interval_ms, s_warning_ratelimit_state.interval);</div><div class='del'>-EXT4_RW_ATTR_SBI_UI(warning_ratelimit_burst, s_warning_ratelimit_state.burst);</div><div class='del'>-EXT4_RW_ATTR_SBI_UI(msg_ratelimit_interval_ms, s_msg_ratelimit_state.interval);</div><div class='del'>-EXT4_RW_ATTR_SBI_UI(msg_ratelimit_burst, s_msg_ratelimit_state.burst);</div><div class='add'>+EXT4_RW_ATTR_SBI_PI(err_ratelimit_interval_ms, s_err_ratelimit_state.interval);</div><div class='add'>+EXT4_RW_ATTR_SBI_PI(err_ratelimit_burst, s_err_ratelimit_state.burst);</div><div class='add'>+EXT4_RW_ATTR_SBI_PI(warning_ratelimit_interval_ms, s_warning_ratelimit_state.interval);</div><div class='add'>+EXT4_RW_ATTR_SBI_PI(warning_ratelimit_burst, s_warning_ratelimit_state.burst);</div><div class='add'>+EXT4_RW_ATTR_SBI_PI(msg_ratelimit_interval_ms, s_msg_ratelimit_state.interval);</div><div class='add'>+EXT4_RW_ATTR_SBI_PI(msg_ratelimit_burst, s_msg_ratelimit_state.burst);</div><div class='ctx'> #ifdef CONFIG_EXT4_DEBUG</div><div class='ctx'> EXT4_RW_ATTR_SBI_UL(simulate_fail, s_simulate_fail);</div><div class='ctx'> #endif</div><div class='hunk'>@@ -245,6 +253,9 @@ EXT4_ATTR(last_error_time, 0444, last_error_time);</div><div class='ctx'> EXT4_ATTR(journal_task, 0444, journal_task);</div><div class='ctx'> EXT4_RW_ATTR_SBI_UI(mb_prefetch, s_mb_prefetch);</div><div class='ctx'> EXT4_RW_ATTR_SBI_UI(mb_prefetch_limit, s_mb_prefetch_limit);</div><div class='add'>+EXT4_RW_ATTR_SBI_UL(last_trim_minblks, s_last_trim_minblks);</div><div class='add'>+EXT4_RW_ATTR_SBI_UI(sb_update_sec, s_sb_update_sec);</div><div class='add'>+EXT4_RW_ATTR_SBI_UI(sb_update_kb, s_sb_update_kb);</div><div class='ctx'> </div><div class='ctx'> static unsigned int old_bump_val = 128;</div><div class='ctx'> EXT4_ATTR_PTR(max_writeback_mb_bump, 0444, pointer_ui, &amp;old_bump_val);</div><div class='hunk'>@@ -263,7 +274,6 @@ static struct attribute *ext4_attrs[] = {</div><div class='ctx'> 	ATTR_LIST(mb_order2_req),</div><div class='ctx'> 	ATTR_LIST(mb_stream_req),</div><div class='ctx'> 	ATTR_LIST(mb_group_prealloc),</div><div class='del'>-	ATTR_LIST(mb_max_inode_prealloc),</div><div class='ctx'> 	ATTR_LIST(mb_max_linear_groups),</div><div class='ctx'> 	ATTR_LIST(max_writeback_mb_bump),</div><div class='ctx'> 	ATTR_LIST(extent_max_zeroout_kb),</div><div class='hunk'>@@ -274,6 +284,7 @@ static struct attribute *ext4_attrs[] = {</div><div class='ctx'> 	ATTR_LIST(warning_ratelimit_burst),</div><div class='ctx'> 	ATTR_LIST(msg_ratelimit_interval_ms),</div><div class='ctx'> 	ATTR_LIST(msg_ratelimit_burst),</div><div class='add'>+	ATTR_LIST(mb_best_avail_max_trim_order),</div><div class='ctx'> 	ATTR_LIST(errors_count),</div><div class='ctx'> 	ATTR_LIST(warning_count),</div><div class='ctx'> 	ATTR_LIST(msg_count),</div><div class='hunk'>@@ -295,6 +306,9 @@ static struct attribute *ext4_attrs[] = {</div><div class='ctx'> #endif</div><div class='ctx'> 	ATTR_LIST(mb_prefetch),</div><div class='ctx'> 	ATTR_LIST(mb_prefetch_limit),</div><div class='add'>+	ATTR_LIST(last_trim_minblks),</div><div class='add'>+	ATTR_LIST(sb_update_sec),</div><div class='add'>+	ATTR_LIST(sb_update_kb),</div><div class='ctx'> 	NULL,</div><div class='ctx'> };</div><div class='ctx'> ATTRIBUTE_GROUPS(ext4);</div><div class='hunk'>@@ -307,7 +321,7 @@ EXT4_ATTR_FEATURE(meta_bg_resize);</div><div class='ctx'> EXT4_ATTR_FEATURE(encryption);</div><div class='ctx'> EXT4_ATTR_FEATURE(test_dummy_encryption_v2);</div><div class='ctx'> #endif</div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='ctx'> EXT4_ATTR_FEATURE(casefold);</div><div class='ctx'> #endif</div><div class='ctx'> #ifdef CONFIG_FS_VERITY</div><div class='hunk'>@@ -315,9 +329,12 @@ EXT4_ATTR_FEATURE(verity);</div><div class='ctx'> #endif</div><div class='ctx'> EXT4_ATTR_FEATURE(metadata_csum_seed);</div><div class='ctx'> EXT4_ATTR_FEATURE(fast_commit);</div><div class='del'>-#if defined(CONFIG_UNICODE) &amp;&amp; defined(CONFIG_FS_ENCRYPTION)</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE) &amp;&amp; defined(CONFIG_FS_ENCRYPTION)</div><div class='ctx'> EXT4_ATTR_FEATURE(encrypted_casefold);</div><div class='ctx'> #endif</div><div class='add'>+#ifdef CONFIG_TRANSPARENT_HUGEPAGE</div><div class='add'>+EXT4_ATTR_FEATURE(blocksize_gt_pagesize);</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='ctx'> static struct attribute *ext4_feat_attrs[] = {</div><div class='ctx'> 	ATTR_LIST(lazy_itable_init),</div><div class='hunk'>@@ -327,7 +344,7 @@ static struct attribute *ext4_feat_attrs[] = {</div><div class='ctx'> 	ATTR_LIST(encryption),</div><div class='ctx'> 	ATTR_LIST(test_dummy_encryption_v2),</div><div class='ctx'> #endif</div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='ctx'> 	ATTR_LIST(casefold),</div><div class='ctx'> #endif</div><div class='ctx'> #ifdef CONFIG_FS_VERITY</div><div class='hunk'>@@ -335,9 +352,12 @@ static struct attribute *ext4_feat_attrs[] = {</div><div class='ctx'> #endif</div><div class='ctx'> 	ATTR_LIST(metadata_csum_seed),</div><div class='ctx'> 	ATTR_LIST(fast_commit),</div><div class='del'>-#if defined(CONFIG_UNICODE) &amp;&amp; defined(CONFIG_FS_ENCRYPTION)</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE) &amp;&amp; defined(CONFIG_FS_ENCRYPTION)</div><div class='ctx'> 	ATTR_LIST(encrypted_casefold),</div><div class='ctx'> #endif</div><div class='add'>+#ifdef CONFIG_TRANSPARENT_HUGEPAGE</div><div class='add'>+	ATTR_LIST(blocksize_gt_pagesize),</div><div class='add'>+#endif</div><div class='ctx'> 	NULL,</div><div class='ctx'> };</div><div class='ctx'> ATTRIBUTE_GROUPS(ext4_feat);</div><div class='hunk'>@@ -357,24 +377,56 @@ static void *calc_ptr(struct ext4_attr *a, struct ext4_sb_info *sbi)</div><div class='ctx'> </div><div class='ctx'> static ssize_t __print_tstamp(char *buf, __le32 lo, __u8 hi)</div><div class='ctx'> {</div><div class='del'>-	return snprintf(buf, PAGE_SIZE, "%lld\n",</div><div class='add'>+	return sysfs_emit(buf, "%lld\n",</div><div class='ctx'> 			((time64_t)hi &lt;&lt; 32) + le32_to_cpu(lo));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #define print_tstamp(buf, es, tstamp) \</div><div class='ctx'> 	__print_tstamp(buf, (es)-&gt;tstamp, (es)-&gt;tstamp ## _hi)</div><div class='ctx'> </div><div class='add'>+static ssize_t ext4_generic_attr_show(struct ext4_attr *a,</div><div class='add'>+				      struct ext4_sb_info *sbi, char *buf)</div><div class='add'>+{</div><div class='add'>+	void *ptr = calc_ptr(a, sbi);</div><div class='add'>+</div><div class='add'>+	if (!ptr)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	switch (a-&gt;attr_id) {</div><div class='add'>+	case attr_inode_readahead:</div><div class='add'>+	case attr_clusters_in_group:</div><div class='add'>+	case attr_mb_order:</div><div class='add'>+	case attr_pointer_pi:</div><div class='add'>+	case attr_pointer_ui:</div><div class='add'>+		if (a-&gt;attr_ptr == ptr_ext4_super_block_offset)</div><div class='add'>+			return sysfs_emit(buf, "%u\n", le32_to_cpup(ptr));</div><div class='add'>+		return sysfs_emit(buf, "%u\n", *((unsigned int *) ptr));</div><div class='add'>+	case attr_pointer_ul:</div><div class='add'>+		return sysfs_emit(buf, "%lu\n", *((unsigned long *) ptr));</div><div class='add'>+	case attr_pointer_u8:</div><div class='add'>+		return sysfs_emit(buf, "%u\n", *((unsigned char *) ptr));</div><div class='add'>+	case attr_pointer_u64:</div><div class='add'>+		if (a-&gt;attr_ptr == ptr_ext4_super_block_offset)</div><div class='add'>+			return sysfs_emit(buf, "%llu\n", le64_to_cpup(ptr));</div><div class='add'>+		return sysfs_emit(buf, "%llu\n", *((unsigned long long *) ptr));</div><div class='add'>+	case attr_pointer_string:</div><div class='add'>+		return sysfs_emit(buf, "%.*s\n", a-&gt;attr_size, (char *) ptr);</div><div class='add'>+	case attr_pointer_atomic:</div><div class='add'>+		return sysfs_emit(buf, "%d\n", atomic_read((atomic_t *) ptr));</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static ssize_t ext4_attr_show(struct kobject *kobj,</div><div class='ctx'> 			      struct attribute *attr, char *buf)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_sb_info *sbi = container_of(kobj, struct ext4_sb_info,</div><div class='ctx'> 						s_kobj);</div><div class='ctx'> 	struct ext4_attr *a = container_of(attr, struct ext4_attr, attr);</div><div class='del'>-	void *ptr = calc_ptr(a, sbi);</div><div class='ctx'> </div><div class='ctx'> 	switch (a-&gt;attr_id) {</div><div class='ctx'> 	case attr_delayed_allocation_blocks:</div><div class='del'>-		return snprintf(buf, PAGE_SIZE, "%llu\n",</div><div class='add'>+		return sysfs_emit(buf, "%llu\n",</div><div class='ctx'> 				(s64) EXT4_C2B(sbi,</div><div class='ctx'> 		       percpu_counter_sum(&amp;sbi-&gt;s_dirtyclusters_counter)));</div><div class='ctx'> 	case attr_session_write_kbytes:</div><div class='hunk'>@@ -382,83 +434,49 @@ static ssize_t ext4_attr_show(struct kobject *kobj,</div><div class='ctx'> 	case attr_lifetime_write_kbytes:</div><div class='ctx'> 		return lifetime_write_kbytes_show(sbi, buf);</div><div class='ctx'> 	case attr_reserved_clusters:</div><div class='del'>-		return snprintf(buf, PAGE_SIZE, "%llu\n",</div><div class='add'>+		return sysfs_emit(buf, "%llu\n",</div><div class='ctx'> 				(unsigned long long)</div><div class='ctx'> 				atomic64_read(&amp;sbi-&gt;s_resv_clusters));</div><div class='ctx'> 	case attr_sra_exceeded_retry_limit:</div><div class='del'>-		return snprintf(buf, PAGE_SIZE, "%llu\n",</div><div class='add'>+		return sysfs_emit(buf, "%llu\n",</div><div class='ctx'> 				(unsigned long long)</div><div class='ctx'> 			percpu_counter_sum(&amp;sbi-&gt;s_sra_exceeded_retry_limit));</div><div class='del'>-	case attr_inode_readahead:</div><div class='del'>-	case attr_pointer_ui:</div><div class='del'>-		if (!ptr)</div><div class='del'>-			return 0;</div><div class='del'>-		if (a-&gt;attr_ptr == ptr_ext4_super_block_offset)</div><div class='del'>-			return snprintf(buf, PAGE_SIZE, "%u\n",</div><div class='del'>-					le32_to_cpup(ptr));</div><div class='del'>-		else</div><div class='del'>-			return snprintf(buf, PAGE_SIZE, "%u\n",</div><div class='del'>-					*((unsigned int *) ptr));</div><div class='del'>-	case attr_pointer_ul:</div><div class='del'>-		if (!ptr)</div><div class='del'>-			return 0;</div><div class='del'>-		return snprintf(buf, PAGE_SIZE, "%lu\n",</div><div class='del'>-				*((unsigned long *) ptr));</div><div class='del'>-	case attr_pointer_u8:</div><div class='del'>-		if (!ptr)</div><div class='del'>-			return 0;</div><div class='del'>-		return snprintf(buf, PAGE_SIZE, "%u\n",</div><div class='del'>-				*((unsigned char *) ptr));</div><div class='del'>-	case attr_pointer_u64:</div><div class='del'>-		if (!ptr)</div><div class='del'>-			return 0;</div><div class='del'>-		if (a-&gt;attr_ptr == ptr_ext4_super_block_offset)</div><div class='del'>-			return snprintf(buf, PAGE_SIZE, "%llu\n",</div><div class='del'>-					le64_to_cpup(ptr));</div><div class='del'>-		else</div><div class='del'>-			return snprintf(buf, PAGE_SIZE, "%llu\n",</div><div class='del'>-					*((unsigned long long *) ptr));</div><div class='del'>-	case attr_pointer_string:</div><div class='del'>-		if (!ptr)</div><div class='del'>-			return 0;</div><div class='del'>-		return snprintf(buf, PAGE_SIZE, "%.*s\n", a-&gt;attr_size,</div><div class='del'>-				(char *) ptr);</div><div class='del'>-	case attr_pointer_atomic:</div><div class='del'>-		if (!ptr)</div><div class='del'>-			return 0;</div><div class='del'>-		return snprintf(buf, PAGE_SIZE, "%d\n",</div><div class='del'>-				atomic_read((atomic_t *) ptr));</div><div class='ctx'> 	case attr_feature:</div><div class='del'>-		return snprintf(buf, PAGE_SIZE, "supported\n");</div><div class='add'>+		return sysfs_emit(buf, "supported\n");</div><div class='ctx'> 	case attr_first_error_time:</div><div class='ctx'> 		return print_tstamp(buf, sbi-&gt;s_es, s_first_error_time);</div><div class='ctx'> 	case attr_last_error_time:</div><div class='ctx'> 		return print_tstamp(buf, sbi-&gt;s_es, s_last_error_time);</div><div class='ctx'> 	case attr_journal_task:</div><div class='ctx'> 		return journal_task_show(sbi, buf);</div><div class='add'>+	default:</div><div class='add'>+		return ext4_generic_attr_show(a, sbi, buf);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static ssize_t ext4_attr_store(struct kobject *kobj,</div><div class='del'>-			       struct attribute *attr,</div><div class='del'>-			       const char *buf, size_t len)</div><div class='add'>+static ssize_t ext4_generic_attr_store(struct ext4_attr *a,</div><div class='add'>+				       struct ext4_sb_info *sbi,</div><div class='add'>+				       const char *buf, size_t len)</div><div class='ctx'> {</div><div class='del'>-	struct ext4_sb_info *sbi = container_of(kobj, struct ext4_sb_info,</div><div class='del'>-						s_kobj);</div><div class='del'>-	struct ext4_attr *a = container_of(attr, struct ext4_attr, attr);</div><div class='del'>-	void *ptr = calc_ptr(a, sbi);</div><div class='del'>-	unsigned long t;</div><div class='ctx'> 	int ret;</div><div class='add'>+	unsigned int t;</div><div class='add'>+	unsigned long lt;</div><div class='add'>+	void *ptr = calc_ptr(a, sbi);</div><div class='add'>+</div><div class='add'>+	if (!ptr)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> 	switch (a-&gt;attr_id) {</div><div class='del'>-	case attr_reserved_clusters:</div><div class='del'>-		return reserved_clusters_store(sbi, buf, len);</div><div class='add'>+	case attr_pointer_pi:</div><div class='add'>+		ret = kstrtouint(skip_spaces(buf), 0, &amp;t);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		if ((int)t &lt; 0)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		*((unsigned int *) ptr) = t;</div><div class='add'>+		return len;</div><div class='ctx'> 	case attr_pointer_ui:</div><div class='del'>-		if (!ptr)</div><div class='del'>-			return 0;</div><div class='del'>-		ret = kstrtoul(skip_spaces(buf), 0, &amp;t);</div><div class='add'>+		ret = kstrtouint(skip_spaces(buf), 0, &amp;t);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 		if (a-&gt;attr_ptr == ptr_ext4_super_block_offset)</div><div class='hunk'>@@ -466,20 +484,50 @@ static ssize_t ext4_attr_store(struct kobject *kobj,</div><div class='ctx'> 		else</div><div class='ctx'> 			*((unsigned int *) ptr) = t;</div><div class='ctx'> 		return len;</div><div class='add'>+	case attr_mb_order:</div><div class='add'>+		ret = kstrtouint(skip_spaces(buf), 0, &amp;t);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		if (t &gt; 64)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		*((unsigned int *) ptr) = t;</div><div class='add'>+		return len;</div><div class='add'>+	case attr_clusters_in_group:</div><div class='add'>+		ret = kstrtouint(skip_spaces(buf), 0, &amp;t);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		if (t &gt; sbi-&gt;s_clusters_per_group)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		*((unsigned int *) ptr) = t;</div><div class='add'>+		return len;</div><div class='ctx'> 	case attr_pointer_ul:</div><div class='del'>-		if (!ptr)</div><div class='del'>-			return 0;</div><div class='del'>-		ret = kstrtoul(skip_spaces(buf), 0, &amp;t);</div><div class='add'>+		ret = kstrtoul(skip_spaces(buf), 0, &amp;lt);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='del'>-		*((unsigned long *) ptr) = t;</div><div class='add'>+		*((unsigned long *) ptr) = lt;</div><div class='ctx'> 		return len;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t ext4_attr_store(struct kobject *kobj,</div><div class='add'>+			       struct attribute *attr,</div><div class='add'>+			       const char *buf, size_t len)</div><div class='add'>+{</div><div class='add'>+	struct ext4_sb_info *sbi = container_of(kobj, struct ext4_sb_info,</div><div class='add'>+						s_kobj);</div><div class='add'>+	struct ext4_attr *a = container_of(attr, struct ext4_attr, attr);</div><div class='add'>+</div><div class='add'>+	switch (a-&gt;attr_id) {</div><div class='add'>+	case attr_reserved_clusters:</div><div class='add'>+		return reserved_clusters_store(sbi, buf, len);</div><div class='ctx'> 	case attr_inode_readahead:</div><div class='ctx'> 		return inode_readahead_blks_store(sbi, buf, len);</div><div class='ctx'> 	case attr_trigger_test_error:</div><div class='ctx'> 		return trigger_test_error(sbi, buf, len);</div><div class='add'>+	default:</div><div class='add'>+		return ext4_generic_attr_store(a, sbi, buf, len);</div><div class='ctx'> 	}</div><div class='del'>-	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void ext4_sb_release(struct kobject *kobj)</div><div class='hunk'>@@ -489,21 +537,26 @@ static void ext4_sb_release(struct kobject *kobj)</div><div class='ctx'> 	complete(&amp;sbi-&gt;s_kobj_unregister);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void ext4_feat_release(struct kobject *kobj)</div><div class='add'>+{</div><div class='add'>+	kfree(kobj);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static const struct sysfs_ops ext4_attr_ops = {</div><div class='ctx'> 	.show	= ext4_attr_show,</div><div class='ctx'> 	.store	= ext4_attr_store,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static struct kobj_type ext4_sb_ktype = {</div><div class='add'>+static const struct kobj_type ext4_sb_ktype = {</div><div class='ctx'> 	.default_groups = ext4_groups,</div><div class='ctx'> 	.sysfs_ops	= &amp;ext4_attr_ops,</div><div class='ctx'> 	.release	= ext4_sb_release,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static struct kobj_type ext4_feat_ktype = {</div><div class='add'>+static const struct kobj_type ext4_feat_ktype = {</div><div class='ctx'> 	.default_groups = ext4_feat_groups,</div><div class='ctx'> 	.sysfs_ops	= &amp;ext4_attr_ops,</div><div class='del'>-	.release	= (void (*)(struct kobject *))kfree,</div><div class='add'>+	.release	= ext4_feat_release,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> void ext4_notify_error_sysfs(struct ext4_sb_info *sbi)</div><div class='head'>diff --git a/fs/ext4/verity.c b/fs/ext4/verity.c<br/>index eacbd489e3bf..415d9c4d8a32 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/verity.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/verity.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/verity.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/verity.c</a></div><div class='hunk'>@@ -42,18 +42,16 @@ static int pagecache_read(struct inode *inode, void *buf, size_t count,</div><div class='ctx'> 			  loff_t pos)</div><div class='ctx'> {</div><div class='ctx'> 	while (count) {</div><div class='del'>-		size_t n = min_t(size_t, count,</div><div class='del'>-				 PAGE_SIZE - offset_in_page(pos));</div><div class='del'>-		struct page *page;</div><div class='add'>+		struct folio *folio;</div><div class='add'>+		size_t n;</div><div class='ctx'> </div><div class='del'>-		page = read_mapping_page(inode-&gt;i_mapping, pos &gt;&gt; PAGE_SHIFT,</div><div class='add'>+		folio = read_mapping_folio(inode-&gt;i_mapping, pos &gt;&gt; PAGE_SHIFT,</div><div class='ctx'> 					 NULL);</div><div class='del'>-		if (IS_ERR(page))</div><div class='del'>-			return PTR_ERR(page);</div><div class='del'>-</div><div class='del'>-		memcpy_from_page(buf, page, offset_in_page(pos), n);</div><div class='add'>+		if (IS_ERR(folio))</div><div class='add'>+			return PTR_ERR(folio);</div><div class='ctx'> </div><div class='del'>-		put_page(page);</div><div class='add'>+		n = memcpy_from_file_folio(buf, folio, pos, count);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> </div><div class='ctx'> 		buf += n;</div><div class='ctx'> 		pos += n;</div><div class='hunk'>@@ -69,25 +67,26 @@ static int pagecache_read(struct inode *inode, void *buf, size_t count,</div><div class='ctx'> static int pagecache_write(struct inode *inode, const void *buf, size_t count,</div><div class='ctx'> 			   loff_t pos)</div><div class='ctx'> {</div><div class='add'>+	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='add'>+	const struct address_space_operations *aops = mapping-&gt;a_ops;</div><div class='add'>+</div><div class='ctx'> 	if (pos + count &gt; inode-&gt;i_sb-&gt;s_maxbytes)</div><div class='ctx'> 		return -EFBIG;</div><div class='ctx'> </div><div class='ctx'> 	while (count) {</div><div class='ctx'> 		size_t n = min_t(size_t, count,</div><div class='ctx'> 				 PAGE_SIZE - offset_in_page(pos));</div><div class='del'>-		struct page *page;</div><div class='del'>-		void *fsdata;</div><div class='add'>+		struct folio *folio;</div><div class='add'>+		void *fsdata = NULL;</div><div class='ctx'> 		int res;</div><div class='ctx'> </div><div class='del'>-		res = pagecache_write_begin(NULL, inode-&gt;i_mapping, pos, n, 0,</div><div class='del'>-					    &amp;page, &amp;fsdata);</div><div class='add'>+		res = aops-&gt;write_begin(NULL, mapping, pos, n, &amp;folio, &amp;fsdata);</div><div class='ctx'> 		if (res)</div><div class='ctx'> 			return res;</div><div class='ctx'> </div><div class='del'>-		memcpy_to_page(page, offset_in_page(pos), buf, n);</div><div class='add'>+		memcpy_to_folio(folio, offset_in_folio(folio, pos), buf, n);</div><div class='ctx'> </div><div class='del'>-		res = pagecache_write_end(NULL, inode-&gt;i_mapping, pos, n, n,</div><div class='del'>-					  page, fsdata);</div><div class='add'>+		res = aops-&gt;write_end(NULL, mapping, pos, n, n, folio, fsdata);</div><div class='ctx'> 		if (res &lt; 0)</div><div class='ctx'> 			return res;</div><div class='ctx'> 		if (res != n)</div><div class='hunk'>@@ -297,16 +296,14 @@ static int ext4_get_verity_descriptor_location(struct inode *inode,</div><div class='ctx'> 	last_extent = path[path-&gt;p_depth].p_ext;</div><div class='ctx'> 	if (!last_extent) {</div><div class='ctx'> 		EXT4_ERROR_INODE(inode, "verity file has no extents");</div><div class='del'>-		ext4_ext_drop_refs(path);</div><div class='del'>-		kfree(path);</div><div class='add'>+		ext4_free_ext_path(path);</div><div class='ctx'> 		return -EFSCORRUPTED;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	end_lblk = le32_to_cpu(last_extent-&gt;ee_block) +</div><div class='ctx'> 		   ext4_ext_get_actual_len(last_extent);</div><div class='del'>-	desc_size_pos = (u64)end_lblk &lt;&lt; inode-&gt;i_blkbits;</div><div class='del'>-	ext4_ext_drop_refs(path);</div><div class='del'>-	kfree(path);</div><div class='add'>+	desc_size_pos = EXT4_LBLK_TO_B(inode, end_lblk);</div><div class='add'>+	ext4_free_ext_path(path);</div><div class='ctx'> </div><div class='ctx'> 	if (desc_size_pos &lt; sizeof(desc_size_disk))</div><div class='ctx'> 		goto bad;</div><div class='hunk'>@@ -364,31 +361,36 @@ static struct page *ext4_read_merkle_tree_page(struct inode *inode,</div><div class='ctx'> 					       pgoff_t index,</div><div class='ctx'> 					       unsigned long num_ra_pages)</div><div class='ctx'> {</div><div class='del'>-	DEFINE_READAHEAD(ractl, NULL, NULL, inode-&gt;i_mapping, index);</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> </div><div class='ctx'> 	index += ext4_verity_metadata_pos(inode) &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> </div><div class='del'>-	page = find_get_page_flags(inode-&gt;i_mapping, index, FGP_ACCESSED);</div><div class='del'>-	if (!page || !PageUptodate(page)) {</div><div class='del'>-		if (page)</div><div class='del'>-			put_page(page);</div><div class='add'>+	folio = __filemap_get_folio(inode-&gt;i_mapping, index, FGP_ACCESSED, 0);</div><div class='add'>+	if (IS_ERR(folio) || !folio_test_uptodate(folio)) {</div><div class='add'>+		DEFINE_READAHEAD(ractl, NULL, NULL, inode-&gt;i_mapping, index);</div><div class='add'>+</div><div class='add'>+		if (!IS_ERR(folio))</div><div class='add'>+			folio_put(folio);</div><div class='ctx'> 		else if (num_ra_pages &gt; 1)</div><div class='ctx'> 			page_cache_ra_unbounded(&amp;ractl, num_ra_pages, 0);</div><div class='del'>-		page = read_mapping_page(inode-&gt;i_mapping, index, NULL);</div><div class='add'>+		folio = read_mapping_folio(inode-&gt;i_mapping, index, NULL);</div><div class='add'>+		if (IS_ERR(folio))</div><div class='add'>+			return ERR_CAST(folio);</div><div class='ctx'> 	}</div><div class='del'>-	return page;</div><div class='add'>+	return folio_file_page(folio, index);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ext4_write_merkle_tree_block(struct inode *inode, const void *buf,</div><div class='del'>-					u64 index, int log_blocksize)</div><div class='add'>+					u64 pos, unsigned int size)</div><div class='ctx'> {</div><div class='del'>-	loff_t pos = ext4_verity_metadata_pos(inode) + (index &lt;&lt; log_blocksize);</div><div class='add'>+	pos += ext4_verity_metadata_pos(inode);</div><div class='ctx'> </div><div class='del'>-	return pagecache_write(inode, buf, 1 &lt;&lt; log_blocksize, pos);</div><div class='add'>+	return pagecache_write(inode, buf, size, pos);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct fsverity_operations ext4_verityops = {</div><div class='add'>+	.inode_info_offs	= (int)offsetof(struct ext4_inode_info, i_verity_info) -</div><div class='add'>+				  (int)offsetof(struct ext4_inode_info, vfs_inode),</div><div class='ctx'> 	.begin_enable_verity	= ext4_begin_enable_verity,</div><div class='ctx'> 	.end_enable_verity	= ext4_end_enable_verity,</div><div class='ctx'> 	.get_verity_descriptor	= ext4_get_verity_descriptor,</div><div class='head'>diff --git a/fs/ext4/xattr.c b/fs/ext4/xattr.c<br/>index 1e0fc1ed845b..2e02efbddaac 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/xattr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/xattr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/xattr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/xattr.c</a></div><div class='hunk'>@@ -81,13 +81,15 @@ ext4_xattr_block_cache_find(struct inode *, struct ext4_xattr_header *,</div><div class='ctx'> 			    struct mb_cache_entry **);</div><div class='ctx'> static __le32 ext4_xattr_hash_entry(char *name, size_t name_len, __le32 *value,</div><div class='ctx'> 				    size_t value_count);</div><div class='add'>+static __le32 ext4_xattr_hash_entry_signed(char *name, size_t name_len, __le32 *value,</div><div class='add'>+				    size_t value_count);</div><div class='ctx'> static void ext4_xattr_rehash(struct ext4_xattr_header *);</div><div class='ctx'> </div><div class='ctx'> static const struct xattr_handler * const ext4_xattr_handler_map[] = {</div><div class='ctx'> 	[EXT4_XATTR_INDEX_USER]		     = &amp;ext4_xattr_user_handler,</div><div class='ctx'> #ifdef CONFIG_EXT4_FS_POSIX_ACL</div><div class='del'>-	[EXT4_XATTR_INDEX_POSIX_ACL_ACCESS]  = &amp;posix_acl_access_xattr_handler,</div><div class='del'>-	[EXT4_XATTR_INDEX_POSIX_ACL_DEFAULT] = &amp;posix_acl_default_xattr_handler,</div><div class='add'>+	[EXT4_XATTR_INDEX_POSIX_ACL_ACCESS]  = &amp;nop_posix_acl_access,</div><div class='add'>+	[EXT4_XATTR_INDEX_POSIX_ACL_DEFAULT] = &amp;nop_posix_acl_default,</div><div class='ctx'> #endif</div><div class='ctx'> 	[EXT4_XATTR_INDEX_TRUSTED]	     = &amp;ext4_xattr_trusted_handler,</div><div class='ctx'> #ifdef CONFIG_EXT4_FS_SECURITY</div><div class='hunk'>@@ -96,13 +98,9 @@ static const struct xattr_handler * const ext4_xattr_handler_map[] = {</div><div class='ctx'> 	[EXT4_XATTR_INDEX_HURD]		     = &amp;ext4_xattr_hurd_handler,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-const struct xattr_handler *ext4_xattr_handlers[] = {</div><div class='add'>+const struct xattr_handler * const ext4_xattr_handlers[] = {</div><div class='ctx'> 	&amp;ext4_xattr_user_handler,</div><div class='ctx'> 	&amp;ext4_xattr_trusted_handler,</div><div class='del'>-#ifdef CONFIG_EXT4_FS_POSIX_ACL</div><div class='del'>-	&amp;posix_acl_access_xattr_handler,</div><div class='del'>-	&amp;posix_acl_default_xattr_handler,</div><div class='del'>-#endif</div><div class='ctx'> #ifdef CONFIG_EXT4_FS_SECURITY</div><div class='ctx'> 	&amp;ext4_xattr_security_handler,</div><div class='ctx'> #endif</div><div class='hunk'>@@ -123,7 +121,11 @@ ext4_expand_inode_array(struct ext4_xattr_inode_array **ea_inode_array,</div><div class='ctx'> #ifdef CONFIG_LOCKDEP</div><div class='ctx'> void ext4_xattr_inode_set_class(struct inode *ea_inode)</div><div class='ctx'> {</div><div class='add'>+	struct ext4_inode_info *ei = EXT4_I(ea_inode);</div><div class='add'>+</div><div class='ctx'> 	lockdep_set_subclass(&amp;ea_inode-&gt;i_rwsem, 1);</div><div class='add'>+	(void) ei;	/* shut up clang warning if !CONFIG_LOCKDEP */</div><div class='add'>+	lockdep_set_subclass(&amp;ei-&gt;i_data_sem, I_DATA_SEM_EA);</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='hunk'>@@ -137,12 +139,12 @@ static __le32 ext4_xattr_block_csum(struct inode *inode,</div><div class='ctx'> 	__u32 dummy_csum = 0;</div><div class='ctx'> 	int offset = offsetof(struct ext4_xattr_header, h_checksum);</div><div class='ctx'> </div><div class='del'>-	csum = ext4_chksum(sbi, sbi-&gt;s_csum_seed, (__u8 *)&amp;dsk_block_nr,</div><div class='add'>+	csum = ext4_chksum(sbi-&gt;s_csum_seed, (__u8 *)&amp;dsk_block_nr,</div><div class='ctx'> 			   sizeof(dsk_block_nr));</div><div class='del'>-	csum = ext4_chksum(sbi, csum, (__u8 *)hdr, offset);</div><div class='del'>-	csum = ext4_chksum(sbi, csum, (__u8 *)&amp;dummy_csum, sizeof(dummy_csum));</div><div class='add'>+	csum = ext4_chksum(csum, (__u8 *)hdr, offset);</div><div class='add'>+	csum = ext4_chksum(csum, (__u8 *)&amp;dummy_csum, sizeof(dummy_csum));</div><div class='ctx'> 	offset += sizeof(dummy_csum);</div><div class='del'>-	csum = ext4_chksum(sbi, csum, (__u8 *)hdr + offset,</div><div class='add'>+	csum = ext4_chksum(csum, (__u8 *)hdr + offset,</div><div class='ctx'> 			   EXT4_BLOCK_SIZE(inode-&gt;i_sb) - offset);</div><div class='ctx'> </div><div class='ctx'> 	return cpu_to_le32(csum);</div><div class='hunk'>@@ -154,7 +156,7 @@ static int ext4_xattr_block_csum_verify(struct inode *inode,</div><div class='ctx'> 	struct ext4_xattr_header *hdr = BHDR(bh);</div><div class='ctx'> 	int ret = 1;</div><div class='ctx'> </div><div class='del'>-	if (ext4_has_metadata_csum(inode-&gt;i_sb)) {</div><div class='add'>+	if (ext4_has_feature_metadata_csum(inode-&gt;i_sb)) {</div><div class='ctx'> 		lock_buffer(bh);</div><div class='ctx'> 		ret = (hdr-&gt;h_checksum == ext4_xattr_block_csum(inode,</div><div class='ctx'> 							bh-&gt;b_blocknr, hdr));</div><div class='hunk'>@@ -166,43 +168,97 @@ static int ext4_xattr_block_csum_verify(struct inode *inode,</div><div class='ctx'> static void ext4_xattr_block_csum_set(struct inode *inode,</div><div class='ctx'> 				      struct buffer_head *bh)</div><div class='ctx'> {</div><div class='del'>-	if (ext4_has_metadata_csum(inode-&gt;i_sb))</div><div class='add'>+	if (ext4_has_feature_metadata_csum(inode-&gt;i_sb))</div><div class='ctx'> 		BHDR(bh)-&gt;h_checksum = ext4_xattr_block_csum(inode,</div><div class='ctx'> 						bh-&gt;b_blocknr, BHDR(bh));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline const struct xattr_handler *</div><div class='del'>-ext4_xattr_handler(int name_index)</div><div class='add'>+static inline const char *ext4_xattr_prefix(int name_index,</div><div class='add'>+					    struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	const struct xattr_handler *handler = NULL;</div><div class='ctx'> </div><div class='ctx'> 	if (name_index &gt; 0 &amp;&amp; name_index &lt; ARRAY_SIZE(ext4_xattr_handler_map))</div><div class='ctx'> 		handler = ext4_xattr_handler_map[name_index];</div><div class='del'>-	return handler;</div><div class='add'>+</div><div class='add'>+	if (!xattr_handler_can_list(handler, dentry))</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	return xattr_prefix(handler);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-ext4_xattr_check_entries(struct ext4_xattr_entry *entry, void *end,</div><div class='del'>-			 void *value_start)</div><div class='add'>+check_xattrs(struct inode *inode, struct buffer_head *bh,</div><div class='add'>+	     struct ext4_xattr_entry *entry, void *end, void *value_start,</div><div class='add'>+	     const char *function, unsigned int line)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_xattr_entry *e = entry;</div><div class='add'>+	int err = -EFSCORRUPTED;</div><div class='add'>+	char *err_str;</div><div class='add'>+</div><div class='add'>+	if (bh) {</div><div class='add'>+		if (BHDR(bh)-&gt;h_magic != cpu_to_le32(EXT4_XATTR_MAGIC) ||</div><div class='add'>+		    BHDR(bh)-&gt;h_blocks != cpu_to_le32(1)) {</div><div class='add'>+			err_str = "invalid header";</div><div class='add'>+			goto errout;</div><div class='add'>+		}</div><div class='add'>+		if (buffer_verified(bh))</div><div class='add'>+			return 0;</div><div class='add'>+		if (!ext4_xattr_block_csum_verify(inode, bh)) {</div><div class='add'>+			err = -EFSBADCRC;</div><div class='add'>+			err_str = "invalid checksum";</div><div class='add'>+			goto errout;</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		struct ext4_xattr_ibody_header *header = value_start;</div><div class='add'>+</div><div class='add'>+		header -= 1;</div><div class='add'>+		if (end - (void *)header &lt; sizeof(*header) + sizeof(u32)) {</div><div class='add'>+			err_str = "in-inode xattr block too small";</div><div class='add'>+			goto errout;</div><div class='add'>+		}</div><div class='add'>+		if (header-&gt;h_magic != cpu_to_le32(EXT4_XATTR_MAGIC)) {</div><div class='add'>+			err_str = "bad magic number in in-inode xattr";</div><div class='add'>+			goto errout;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* Find the end of the names list */</div><div class='ctx'> 	while (!IS_LAST_ENTRY(e)) {</div><div class='ctx'> 		struct ext4_xattr_entry *next = EXT4_XATTR_NEXT(e);</div><div class='del'>-		if ((void *)next &gt;= end)</div><div class='del'>-			return -EFSCORRUPTED;</div><div class='del'>-		if (strnlen(e-&gt;e_name, e-&gt;e_name_len) != e-&gt;e_name_len)</div><div class='del'>-			return -EFSCORRUPTED;</div><div class='add'>+		if ((void *)next &gt;= end) {</div><div class='add'>+			err_str = "e_name out of bounds";</div><div class='add'>+			goto errout;</div><div class='add'>+		}</div><div class='add'>+		if (strnlen(e-&gt;e_name, e-&gt;e_name_len) != e-&gt;e_name_len) {</div><div class='add'>+			err_str = "bad e_name length";</div><div class='add'>+			goto errout;</div><div class='add'>+		}</div><div class='ctx'> 		e = next;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Check the values */</div><div class='ctx'> 	while (!IS_LAST_ENTRY(entry)) {</div><div class='ctx'> 		u32 size = le32_to_cpu(entry-&gt;e_value_size);</div><div class='add'>+		unsigned long ea_ino = le32_to_cpu(entry-&gt;e_value_inum);</div><div class='ctx'> </div><div class='del'>-		if (size &gt; EXT4_XATTR_SIZE_MAX)</div><div class='del'>-			return -EFSCORRUPTED;</div><div class='add'>+		if (!ext4_has_feature_ea_inode(inode-&gt;i_sb) &amp;&amp; ea_ino) {</div><div class='add'>+			err_str = "ea_inode specified without ea_inode feature enabled";</div><div class='add'>+			goto errout;</div><div class='add'>+		}</div><div class='add'>+		if (ea_ino &amp;&amp; ((ea_ino == EXT4_ROOT_INO) ||</div><div class='add'>+			       !ext4_valid_inum(inode-&gt;i_sb, ea_ino))) {</div><div class='add'>+			err_str = "invalid ea_ino";</div><div class='add'>+			goto errout;</div><div class='add'>+		}</div><div class='add'>+		if (ea_ino &amp;&amp; !size) {</div><div class='add'>+			err_str = "invalid size in ea xattr";</div><div class='add'>+			goto errout;</div><div class='add'>+		}</div><div class='add'>+		if (size &gt; EXT4_XATTR_SIZE_MAX) {</div><div class='add'>+			err_str = "e_value size too large";</div><div class='add'>+			goto errout;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		if (size != 0 &amp;&amp; entry-&gt;e_value_inum == 0) {</div><div class='ctx'> 			u16 offs = le16_to_cpu(entry-&gt;e_value_offs);</div><div class='hunk'>@@ -214,71 +270,56 @@ ext4_xattr_check_entries(struct ext4_xattr_entry *entry, void *end,</div><div class='ctx'> 			 * the padded and unpadded sizes, since the size may</div><div class='ctx'> 			 * overflow to 0 when adding padding.</div><div class='ctx'> 			 */</div><div class='del'>-			if (offs &gt; end - value_start)</div><div class='del'>-				return -EFSCORRUPTED;</div><div class='add'>+			if (offs &gt; end - value_start) {</div><div class='add'>+				err_str = "e_value out of bounds";</div><div class='add'>+				goto errout;</div><div class='add'>+			}</div><div class='ctx'> 			value = value_start + offs;</div><div class='ctx'> 			if (value &lt; (void *)e + sizeof(u32) ||</div><div class='ctx'> 			    size &gt; end - value ||</div><div class='del'>-			    EXT4_XATTR_SIZE(size) &gt; end - value)</div><div class='del'>-				return -EFSCORRUPTED;</div><div class='add'>+			    EXT4_XATTR_SIZE(size) &gt; end - value) {</div><div class='add'>+				err_str = "overlapping e_value ";</div><div class='add'>+				goto errout;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> 		entry = EXT4_XATTR_NEXT(entry);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='add'>+	if (bh)</div><div class='add'>+		set_buffer_verified(bh);</div><div class='ctx'> 	return 0;</div><div class='add'>+</div><div class='add'>+errout:</div><div class='add'>+	if (bh)</div><div class='add'>+		__ext4_error_inode(inode, function, line, 0, -err,</div><div class='add'>+				   "corrupted xattr block %llu: %s",</div><div class='add'>+				   (unsigned long long) bh-&gt;b_blocknr,</div><div class='add'>+				   err_str);</div><div class='add'>+	else</div><div class='add'>+		__ext4_error_inode(inode, function, line, 0, -err,</div><div class='add'>+				   "corrupted in-inode xattr: %s", err_str);</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int</div><div class='ctx'> __ext4_xattr_check_block(struct inode *inode, struct buffer_head *bh,</div><div class='ctx'> 			 const char *function, unsigned int line)</div><div class='ctx'> {</div><div class='del'>-	int error = -EFSCORRUPTED;</div><div class='del'>-</div><div class='del'>-	if (BHDR(bh)-&gt;h_magic != cpu_to_le32(EXT4_XATTR_MAGIC) ||</div><div class='del'>-	    BHDR(bh)-&gt;h_blocks != cpu_to_le32(1))</div><div class='del'>-		goto errout;</div><div class='del'>-	if (buffer_verified(bh))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	error = -EFSBADCRC;</div><div class='del'>-	if (!ext4_xattr_block_csum_verify(inode, bh))</div><div class='del'>-		goto errout;</div><div class='del'>-	error = ext4_xattr_check_entries(BFIRST(bh), bh-&gt;b_data + bh-&gt;b_size,</div><div class='del'>-					 bh-&gt;b_data);</div><div class='del'>-errout:</div><div class='del'>-	if (error)</div><div class='del'>-		__ext4_error_inode(inode, function, line, 0, -error,</div><div class='del'>-				   "corrupted xattr block %llu",</div><div class='del'>-				   (unsigned long long) bh-&gt;b_blocknr);</div><div class='del'>-	else</div><div class='del'>-		set_buffer_verified(bh);</div><div class='del'>-	return error;</div><div class='add'>+	return check_xattrs(inode, bh, BFIRST(bh), bh-&gt;b_data + bh-&gt;b_size,</div><div class='add'>+			    bh-&gt;b_data, function, line);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #define ext4_xattr_check_block(inode, bh) \</div><div class='ctx'> 	__ext4_xattr_check_block((inode), (bh),  __func__, __LINE__)</div><div class='ctx'> </div><div class='ctx'> </div><div class='del'>-static int</div><div class='add'>+int</div><div class='ctx'> __xattr_check_inode(struct inode *inode, struct ext4_xattr_ibody_header *header,</div><div class='ctx'> 			 void *end, const char *function, unsigned int line)</div><div class='ctx'> {</div><div class='del'>-	int error = -EFSCORRUPTED;</div><div class='del'>-</div><div class='del'>-	if (end - (void *)header &lt; sizeof(*header) + sizeof(u32) ||</div><div class='del'>-	    (header-&gt;h_magic != cpu_to_le32(EXT4_XATTR_MAGIC)))</div><div class='del'>-		goto errout;</div><div class='del'>-	error = ext4_xattr_check_entries(IFIRST(header), end, IFIRST(header));</div><div class='del'>-errout:</div><div class='del'>-	if (error)</div><div class='del'>-		__ext4_error_inode(inode, function, line, 0, -error,</div><div class='del'>-				   "corrupted in-inode xattr");</div><div class='del'>-	return error;</div><div class='add'>+	return check_xattrs(inode, NULL, IFIRST(header), end, IFIRST(header),</div><div class='add'>+			    function, line);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#define xattr_check_inode(inode, header, end) \</div><div class='del'>-	__xattr_check_inode((inode), (header), (end), __func__, __LINE__)</div><div class='del'>-</div><div class='ctx'> static int</div><div class='ctx'> xattr_find_entry(struct inode *inode, struct ext4_xattr_entry **pentry,</div><div class='ctx'> 		 void *end, int name_index, const char *name, int sorted)</div><div class='hunk'>@@ -301,7 +342,7 @@ xattr_find_entry(struct inode *inode, struct ext4_xattr_entry **pentry,</div><div class='ctx'> 			cmp = name_len - entry-&gt;e_name_len;</div><div class='ctx'> 		if (!cmp)</div><div class='ctx'> 			cmp = memcmp(name, entry-&gt;e_name, name_len);</div><div class='del'>-		if (cmp &lt;= 0 &amp;&amp; (sorted || cmp == 0))</div><div class='add'>+		if (!cmp || (cmp &lt; 0 &amp;&amp; sorted))</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='ctx'> 	*pentry = entry;</div><div class='hunk'>@@ -311,29 +352,29 @@ xattr_find_entry(struct inode *inode, struct ext4_xattr_entry **pentry,</div><div class='ctx'> static u32</div><div class='ctx'> ext4_xattr_inode_hash(struct ext4_sb_info *sbi, const void *buffer, size_t size)</div><div class='ctx'> {</div><div class='del'>-	return ext4_chksum(sbi, sbi-&gt;s_csum_seed, buffer, size);</div><div class='add'>+	return ext4_chksum(sbi-&gt;s_csum_seed, buffer, size);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static u64 ext4_xattr_inode_get_ref(struct inode *ea_inode)</div><div class='ctx'> {</div><div class='del'>-	return ((u64)ea_inode-&gt;i_ctime.tv_sec &lt;&lt; 32) |</div><div class='add'>+	return ((u64) inode_get_ctime_sec(ea_inode) &lt;&lt; 32) |</div><div class='ctx'> 		(u32) inode_peek_iversion_raw(ea_inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void ext4_xattr_inode_set_ref(struct inode *ea_inode, u64 ref_count)</div><div class='ctx'> {</div><div class='del'>-	ea_inode-&gt;i_ctime.tv_sec = (u32)(ref_count &gt;&gt; 32);</div><div class='add'>+	inode_set_ctime(ea_inode, (u32)(ref_count &gt;&gt; 32), 0);</div><div class='ctx'> 	inode_set_iversion_raw(ea_inode, ref_count &amp; 0xffffffff);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static u32 ext4_xattr_inode_get_hash(struct inode *ea_inode)</div><div class='ctx'> {</div><div class='del'>-	return (u32)ea_inode-&gt;i_atime.tv_sec;</div><div class='add'>+	return (u32) inode_get_atime_sec(ea_inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void ext4_xattr_inode_set_hash(struct inode *ea_inode, u32 hash)</div><div class='ctx'> {</div><div class='del'>-	ea_inode-&gt;i_atime.tv_sec = hash;</div><div class='add'>+	inode_set_atime(ea_inode, hash, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -378,7 +419,7 @@ free_bhs:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#define EXT4_XATTR_INODE_GET_PARENT(inode) ((__u32)(inode)-&gt;i_mtime.tv_sec)</div><div class='add'>+#define EXT4_XATTR_INODE_GET_PARENT(inode) ((__u32)(inode_get_mtime_sec(inode)))</div><div class='ctx'> </div><div class='ctx'> static int ext4_xattr_inode_iget(struct inode *parent, unsigned long ea_ino,</div><div class='ctx'> 				 u32 ea_inode_hash, struct inode **ea_inode)</div><div class='hunk'>@@ -386,7 +427,18 @@ static int ext4_xattr_inode_iget(struct inode *parent, unsigned long ea_ino,</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	inode = ext4_iget(parent-&gt;i_sb, ea_ino, EXT4_IGET_NORMAL);</div><div class='add'>+	/*</div><div class='add'>+	 * We have to check for this corruption early as otherwise</div><div class='add'>+	 * iget_locked() could wait indefinitely for the state of our</div><div class='add'>+	 * parent inode.</div><div class='add'>+	 */</div><div class='add'>+	if (parent-&gt;i_ino == ea_ino) {</div><div class='add'>+		ext4_error(parent-&gt;i_sb,</div><div class='add'>+			   "Parent and EA inode have the same ino %lu", ea_ino);</div><div class='add'>+		return -EFSCORRUPTED;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	inode = ext4_iget(parent-&gt;i_sb, ea_ino, EXT4_IGET_EA_INODE);</div><div class='ctx'> 	if (IS_ERR(inode)) {</div><div class='ctx'> 		err = PTR_ERR(inode);</div><div class='ctx'> 		ext4_error(parent-&gt;i_sb,</div><div class='hunk'>@@ -394,23 +446,6 @@ static int ext4_xattr_inode_iget(struct inode *parent, unsigned long ea_ino,</div><div class='ctx'> 			   err);</div><div class='ctx'> 		return err;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	if (is_bad_inode(inode)) {</div><div class='del'>-		ext4_error(parent-&gt;i_sb,</div><div class='del'>-			   "error while reading EA inode %lu is_bad_inode",</div><div class='del'>-			   ea_ino);</div><div class='del'>-		err = -EIO;</div><div class='del'>-		goto error;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!(EXT4_I(inode)-&gt;i_flags &amp; EXT4_EA_INODE_FL)) {</div><div class='del'>-		ext4_error(parent-&gt;i_sb,</div><div class='del'>-			   "EA inode %lu does not have EXT4_EA_INODE_FL flag",</div><div class='del'>-			    ea_ino);</div><div class='del'>-		err = -EINVAL;</div><div class='del'>-		goto error;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	ext4_xattr_inode_set_class(inode);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -424,16 +459,28 @@ static int ext4_xattr_inode_iget(struct inode *parent, unsigned long ea_ino,</div><div class='ctx'> 		ext4_set_inode_state(inode, EXT4_STATE_LUSTRE_EA_INODE);</div><div class='ctx'> 		ext4_xattr_inode_set_ref(inode, 1);</div><div class='ctx'> 	} else {</div><div class='del'>-		inode_lock(inode);</div><div class='add'>+		inode_lock_nested(inode, I_MUTEX_XATTR);</div><div class='ctx'> 		inode-&gt;i_flags |= S_NOQUOTA;</div><div class='ctx'> 		inode_unlock(inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	*ea_inode = inode;</div><div class='ctx'> 	return 0;</div><div class='del'>-error:</div><div class='del'>-	iput(inode);</div><div class='del'>-	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Remove entry from mbcache when EA inode is getting evicted */</div><div class='add'>+void ext4_evict_ea_inode(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct mb_cache_entry *oe;</div><div class='add'>+</div><div class='add'>+	if (!EA_INODE_CACHE(inode))</div><div class='add'>+		return;</div><div class='add'>+	/* Wait for entry to get unused so that we can remove it */</div><div class='add'>+	while ((oe = mb_cache_entry_delete_or_get(EA_INODE_CACHE(inode),</div><div class='add'>+			ext4_xattr_inode_get_hash(inode), inode-&gt;i_ino))) {</div><div class='add'>+		mb_cache_entry_wait_unused(oe);</div><div class='add'>+		mb_cache_entry_put(EA_INODE_CACHE(inode), oe);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='hunk'>@@ -455,8 +502,22 @@ ext4_xattr_inode_verify_hashes(struct inode *ea_inode,</div><div class='ctx'> 		tmp_data = cpu_to_le32(hash);</div><div class='ctx'> 		e_hash = ext4_xattr_hash_entry(entry-&gt;e_name, entry-&gt;e_name_len,</div><div class='ctx'> 					       &amp;tmp_data, 1);</div><div class='add'>+		/* All good? */</div><div class='add'>+		if (e_hash == entry-&gt;e_hash)</div><div class='add'>+			return 0;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Not good. Maybe the entry hash was calculated</div><div class='add'>+		 * using the buggy signed char version?</div><div class='add'>+		 */</div><div class='add'>+		e_hash = ext4_xattr_hash_entry_signed(entry-&gt;e_name, entry-&gt;e_name_len,</div><div class='add'>+							&amp;tmp_data, 1);</div><div class='add'>+		/* Still no match - bad */</div><div class='ctx'> 		if (e_hash != entry-&gt;e_hash)</div><div class='ctx'> 			return -EFSCORRUPTED;</div><div class='add'>+</div><div class='add'>+		/* Let people know about old hash */</div><div class='add'>+		pr_warn_once("ext4: filesystem with signed xattr name hash");</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -589,10 +650,7 @@ ext4_xattr_ibody_get(struct inode *inode, int name_index, const char *name,</div><div class='ctx'> 		return error;</div><div class='ctx'> 	raw_inode = ext4_raw_inode(&amp;iloc);</div><div class='ctx'> 	header = IHDR(inode, raw_inode);</div><div class='del'>-	end = (void *)raw_inode + EXT4_SB(inode-&gt;i_sb)-&gt;s_inode_size;</div><div class='del'>-	error = xattr_check_inode(inode, header, end);</div><div class='del'>-	if (error)</div><div class='del'>-		goto cleanup;</div><div class='add'>+	end = ITAIL(inode, raw_inode);</div><div class='ctx'> 	entry = IFIRST(header);</div><div class='ctx'> 	error = xattr_find_entry(inode, &amp;entry, end, name_index, name, 0);</div><div class='ctx'> 	if (error)</div><div class='hunk'>@@ -641,7 +699,7 @@ ext4_xattr_get(struct inode *inode, int name_index, const char *name,</div><div class='ctx'> {</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ext4_forced_shutdown(EXT4_SB(inode-&gt;i_sb))))</div><div class='add'>+	if (unlikely(ext4_forced_shutdown(inode-&gt;i_sb)))</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> </div><div class='ctx'> 	if (strlen(name) &gt; 255)</div><div class='hunk'>@@ -664,11 +722,10 @@ ext4_xattr_list_entries(struct dentry *dentry, struct ext4_xattr_entry *entry,</div><div class='ctx'> 	size_t rest = buffer_size;</div><div class='ctx'> </div><div class='ctx'> 	for (; !IS_LAST_ENTRY(entry); entry = EXT4_XATTR_NEXT(entry)) {</div><div class='del'>-		const struct xattr_handler *handler =</div><div class='del'>-			ext4_xattr_handler(entry-&gt;e_name_index);</div><div class='add'>+		const char *prefix;</div><div class='ctx'> </div><div class='del'>-		if (handler &amp;&amp; (!handler-&gt;list || handler-&gt;list(dentry))) {</div><div class='del'>-			const char *prefix = handler-&gt;prefix ?: handler-&gt;name;</div><div class='add'>+		prefix = ext4_xattr_prefix(entry-&gt;e_name_index, dentry);</div><div class='add'>+		if (prefix) {</div><div class='ctx'> 			size_t prefix_len = strlen(prefix);</div><div class='ctx'> 			size_t size = prefix_len + entry-&gt;e_name_len + 1;</div><div class='ctx'> </div><div class='hunk'>@@ -724,7 +781,6 @@ ext4_xattr_ibody_list(struct dentry *dentry, char *buffer, size_t buffer_size)</div><div class='ctx'> 	struct ext4_xattr_ibody_header *header;</div><div class='ctx'> 	struct ext4_inode *raw_inode;</div><div class='ctx'> 	struct ext4_iloc iloc;</div><div class='del'>-	void *end;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='ctx'> 	if (!ext4_test_inode_state(inode, EXT4_STATE_XATTR))</div><div class='hunk'>@@ -734,14 +790,9 @@ ext4_xattr_ibody_list(struct dentry *dentry, char *buffer, size_t buffer_size)</div><div class='ctx'> 		return error;</div><div class='ctx'> 	raw_inode = ext4_raw_inode(&amp;iloc);</div><div class='ctx'> 	header = IHDR(inode, raw_inode);</div><div class='del'>-	end = (void *)raw_inode + EXT4_SB(inode-&gt;i_sb)-&gt;s_inode_size;</div><div class='del'>-	error = xattr_check_inode(inode, header, end);</div><div class='del'>-	if (error)</div><div class='del'>-		goto cleanup;</div><div class='ctx'> 	error = ext4_xattr_list_entries(dentry, IFIRST(header),</div><div class='ctx'> 					buffer, buffer_size);</div><div class='ctx'> </div><div class='del'>-cleanup:</div><div class='ctx'> 	brelse(iloc.bh);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='hunk'>@@ -809,7 +860,6 @@ int ext4_get_inode_usage(struct inode *inode, qsize_t *usage)</div><div class='ctx'> 	struct ext4_xattr_ibody_header *header;</div><div class='ctx'> 	struct ext4_xattr_entry *entry;</div><div class='ctx'> 	qsize_t ea_inode_refs = 0;</div><div class='del'>-	void *end;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held_read(&amp;EXT4_I(inode)-&gt;xattr_sem);</div><div class='hunk'>@@ -820,10 +870,6 @@ int ext4_get_inode_usage(struct inode *inode, qsize_t *usage)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		raw_inode = ext4_raw_inode(&amp;iloc);</div><div class='ctx'> 		header = IHDR(inode, raw_inode);</div><div class='del'>-		end = (void *)raw_inode + EXT4_SB(inode-&gt;i_sb)-&gt;s_inode_size;</div><div class='del'>-		ret = xattr_check_inode(inode, header, end);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto out;</div><div class='ctx'> </div><div class='ctx'> 		for (entry = IFIRST(header); !IS_LAST_ENTRY(entry);</div><div class='ctx'> 		     entry = EXT4_XATTR_NEXT(entry))</div><div class='hunk'>@@ -920,7 +966,7 @@ int __ext4_xattr_set_credits(struct super_block *sb, struct inode *inode,</div><div class='ctx'> 	 * so we need to reserve credits for this eventuality</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (inode &amp;&amp; ext4_has_inline_data(inode))</div><div class='del'>-		credits += ext4_writepage_trans_blocks(inode) + 1;</div><div class='add'>+		credits += ext4_chunk_trans_extent(inode, 1) + 1;</div><div class='ctx'> </div><div class='ctx'> 	/* We are done if ea_inode feature is not enabled. */</div><div class='ctx'> 	if (!ext4_has_feature_ea_inode(sb))</div><div class='hunk'>@@ -976,45 +1022,36 @@ int __ext4_xattr_set_credits(struct super_block *sb, struct inode *inode,</div><div class='ctx'> static int ext4_xattr_inode_update_ref(handle_t *handle, struct inode *ea_inode,</div><div class='ctx'> 				       int ref_change)</div><div class='ctx'> {</div><div class='del'>-	struct mb_cache *ea_inode_cache = EA_INODE_CACHE(ea_inode);</div><div class='ctx'> 	struct ext4_iloc iloc;</div><div class='del'>-	s64 ref_count;</div><div class='del'>-	u32 hash;</div><div class='add'>+	u64 ref_count;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	inode_lock(ea_inode);</div><div class='add'>+	inode_lock_nested(ea_inode, I_MUTEX_XATTR);</div><div class='ctx'> </div><div class='ctx'> 	ret = ext4_reserve_inode_write(handle, ea_inode, &amp;iloc);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	ref_count = ext4_xattr_inode_get_ref(ea_inode);</div><div class='add'>+	if ((ref_count == 0 &amp;&amp; ref_change &lt; 0) || (ref_count == U64_MAX &amp;&amp; ref_change &gt; 0)) {</div><div class='add'>+		ext4_error_inode(ea_inode, __func__, __LINE__, 0,</div><div class='add'>+			"EA inode %lu ref wraparound: ref_count=%lld ref_change=%d",</div><div class='add'>+			ea_inode-&gt;i_ino, ref_count, ref_change);</div><div class='add'>+		ret = -EFSCORRUPTED;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> 	ref_count += ref_change;</div><div class='ctx'> 	ext4_xattr_inode_set_ref(ea_inode, ref_count);</div><div class='ctx'> </div><div class='ctx'> 	if (ref_change &gt; 0) {</div><div class='del'>-		WARN_ONCE(ref_count &lt;= 0, "EA inode %lu ref_count=%lld",</div><div class='del'>-			  ea_inode-&gt;i_ino, ref_count);</div><div class='del'>-</div><div class='ctx'> 		if (ref_count == 1) {</div><div class='ctx'> 			WARN_ONCE(ea_inode-&gt;i_nlink, "EA inode %lu i_nlink=%u",</div><div class='ctx'> 				  ea_inode-&gt;i_ino, ea_inode-&gt;i_nlink);</div><div class='ctx'> </div><div class='ctx'> 			set_nlink(ea_inode, 1);</div><div class='ctx'> 			ext4_orphan_del(handle, ea_inode);</div><div class='del'>-</div><div class='del'>-			if (ea_inode_cache) {</div><div class='del'>-				hash = ext4_xattr_inode_get_hash(ea_inode);</div><div class='del'>-				mb_cache_entry_create(ea_inode_cache,</div><div class='del'>-						      GFP_NOFS, hash,</div><div class='del'>-						      ea_inode-&gt;i_ino,</div><div class='del'>-						      true /* reusable */);</div><div class='del'>-			}</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='del'>-		WARN_ONCE(ref_count &lt; 0, "EA inode %lu ref_count=%lld",</div><div class='del'>-			  ea_inode-&gt;i_ino, ref_count);</div><div class='del'>-</div><div class='ctx'> 		if (ref_count == 0) {</div><div class='ctx'> 			WARN_ONCE(ea_inode-&gt;i_nlink != 1,</div><div class='ctx'> 				  "EA inode %lu i_nlink=%u",</div><div class='hunk'>@@ -1022,12 +1059,6 @@ static int ext4_xattr_inode_update_ref(handle_t *handle, struct inode *ea_inode,</div><div class='ctx'> </div><div class='ctx'> 			clear_nlink(ea_inode);</div><div class='ctx'> 			ext4_orphan_add(handle, ea_inode);</div><div class='del'>-</div><div class='del'>-			if (ea_inode_cache) {</div><div class='del'>-				hash = ext4_xattr_inode_get_hash(ea_inode);</div><div class='del'>-				mb_cache_entry_delete(ea_inode_cache, hash,</div><div class='del'>-						      ea_inode-&gt;i_ino);</div><div class='del'>-			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1133,15 +1164,28 @@ ext4_xattr_inode_dec_ref_all(handle_t *handle, struct inode *parent,</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *ea_inode;</div><div class='ctx'> 	struct ext4_xattr_entry *entry;</div><div class='add'>+	struct ext4_iloc iloc;</div><div class='ctx'> 	bool dirty = false;</div><div class='ctx'> 	unsigned int ea_ino;</div><div class='ctx'> 	int err;</div><div class='ctx'> 	int credits;</div><div class='add'>+	void *end;</div><div class='add'>+</div><div class='add'>+	if (block_csum)</div><div class='add'>+		end = (void *)bh-&gt;b_data + bh-&gt;b_size;</div><div class='add'>+	else {</div><div class='add'>+		err = ext4_get_inode_loc(parent, &amp;iloc);</div><div class='add'>+		if (err) {</div><div class='add'>+			EXT4_ERROR_INODE(parent, "parent inode loc (error %d)", err);</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+		end = (void *)ext4_raw_inode(&amp;iloc) + EXT4_SB(parent-&gt;i_sb)-&gt;s_inode_size;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* One credit for dec ref on ea_inode, one for orphan list addition, */</div><div class='ctx'> 	credits = 2 + extra_credits;</div><div class='ctx'> </div><div class='del'>-	for (entry = first; !IS_LAST_ENTRY(entry);</div><div class='add'>+	for (entry = first; (void *)entry &lt; end &amp;&amp; !IS_LAST_ENTRY(entry);</div><div class='ctx'> 	     entry = EXT4_XATTR_NEXT(entry)) {</div><div class='ctx'> 		if (!entry-&gt;e_value_inum)</div><div class='ctx'> 			continue;</div><div class='hunk'>@@ -1237,6 +1281,7 @@ ext4_xattr_release_block(handle_t *handle, struct inode *inode,</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='add'>+retry_ref:</div><div class='ctx'> 	lock_buffer(bh);</div><div class='ctx'> 	hash = le32_to_cpu(BHDR(bh)-&gt;h_hash);</div><div class='ctx'> 	ref = le32_to_cpu(BHDR(bh)-&gt;h_refcount);</div><div class='hunk'>@@ -1246,9 +1291,18 @@ ext4_xattr_release_block(handle_t *handle, struct inode *inode,</div><div class='ctx'> 		 * This must happen under buffer lock for</div><div class='ctx'> 		 * ext4_xattr_block_set() to reliably detect freed block</div><div class='ctx'> 		 */</div><div class='del'>-		if (ea_block_cache)</div><div class='del'>-			mb_cache_entry_delete(ea_block_cache, hash,</div><div class='del'>-					      bh-&gt;b_blocknr);</div><div class='add'>+		if (ea_block_cache) {</div><div class='add'>+			struct mb_cache_entry *oe;</div><div class='add'>+</div><div class='add'>+			oe = mb_cache_entry_delete_or_get(ea_block_cache, hash,</div><div class='add'>+							  bh-&gt;b_blocknr);</div><div class='add'>+			if (oe) {</div><div class='add'>+				unlock_buffer(bh);</div><div class='add'>+				mb_cache_entry_wait_unused(oe);</div><div class='add'>+				mb_cache_entry_put(ea_block_cache, oe);</div><div class='add'>+				goto retry_ref;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='ctx'> 		get_bh(bh);</div><div class='ctx'> 		unlock_buffer(bh);</div><div class='ctx'> </div><div class='hunk'>@@ -1272,7 +1326,7 @@ ext4_xattr_release_block(handle_t *handle, struct inode *inode,</div><div class='ctx'> 				ce = mb_cache_entry_get(ea_block_cache, hash,</div><div class='ctx'> 							bh-&gt;b_blocknr);</div><div class='ctx'> 				if (ce) {</div><div class='del'>-					ce-&gt;e_reusable = 1;</div><div class='add'>+					set_bit(MBE_REUSABLE_B, &amp;ce-&gt;e_flags);</div><div class='ctx'> 					mb_cache_entry_put(ea_block_cache, ce);</div><div class='ctx'> 				}</div><div class='ctx'> 			}</div><div class='hunk'>@@ -1380,6 +1434,12 @@ retry:</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='ctx'> 		memcpy(bh-&gt;b_data, buf, csize);</div><div class='add'>+		/*</div><div class='add'>+		 * Zero out block tail to avoid writing uninitialized memory</div><div class='add'>+		 * to disk.</div><div class='add'>+		 */</div><div class='add'>+		if (csize &lt; blocksize)</div><div class='add'>+			memset(bh-&gt;b_data + csize, 0, blocksize - csize);</div><div class='ctx'> 		set_buffer_uptodate(bh);</div><div class='ctx'> 		ext4_handle_dirty_metadata(handle, ea_inode, bh);</div><div class='ctx'> </div><div class='hunk'>@@ -1413,6 +1473,13 @@ static struct inode *ext4_xattr_inode_create(handle_t *handle,</div><div class='ctx'> 	uid_t owner[2] = { i_uid_read(inode), i_gid_read(inode) };</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='add'>+	if (inode-&gt;i_sb-&gt;s_root == NULL) {</div><div class='add'>+		ext4_warning(inode-&gt;i_sb,</div><div class='add'>+			     "refuse to create EA inode when umounting");</div><div class='add'>+		WARN_ON(1);</div><div class='add'>+		return ERR_PTR(-EINVAL);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Let the next inode be the goal, so we try and allocate the EA inode</div><div class='ctx'> 	 * in the same group, or nearby one.</div><div class='hunk'>@@ -1432,6 +1499,9 @@ static struct inode *ext4_xattr_inode_create(handle_t *handle,</div><div class='ctx'> 		if (!err)</div><div class='ctx'> 			err = ext4_inode_attach_jinode(ea_inode);</div><div class='ctx'> 		if (err) {</div><div class='add'>+			if (ext4_xattr_inode_dec_ref(handle, ea_inode))</div><div class='add'>+				ext4_warning_inode(ea_inode,</div><div class='add'>+					"cleanup dec ref error %d", err);</div><div class='ctx'> 			iput(ea_inode);</div><div class='ctx'> 			return ERR_PTR(err);</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1469,7 +1539,7 @@ ext4_xattr_inode_cache_find(struct inode *inode, const void *value,</div><div class='ctx'> 	WARN_ON_ONCE(ext4_handle_valid(journal_current_handle()) &amp;&amp;</div><div class='ctx'> 		     !(current-&gt;flags &amp; PF_MEMALLOC_NOFS));</div><div class='ctx'> </div><div class='del'>-	ea_data = kvmalloc(value_len, GFP_KERNEL);</div><div class='add'>+	ea_data = kvmalloc(value_len, GFP_NOFS);</div><div class='ctx'> 	if (!ea_data) {</div><div class='ctx'> 		mb_cache_entry_put(ea_inode_cache, ce);</div><div class='ctx'> 		return NULL;</div><div class='hunk'>@@ -1477,11 +1547,11 @@ ext4_xattr_inode_cache_find(struct inode *inode, const void *value,</div><div class='ctx'> </div><div class='ctx'> 	while (ce) {</div><div class='ctx'> 		ea_inode = ext4_iget(inode-&gt;i_sb, ce-&gt;e_value,</div><div class='del'>-				     EXT4_IGET_NORMAL);</div><div class='del'>-		if (!IS_ERR(ea_inode) &amp;&amp;</div><div class='del'>-		    !is_bad_inode(ea_inode) &amp;&amp;</div><div class='del'>-		    (EXT4_I(ea_inode)-&gt;i_flags &amp; EXT4_EA_INODE_FL) &amp;&amp;</div><div class='del'>-		    i_size_read(ea_inode) == value_len &amp;&amp;</div><div class='add'>+				     EXT4_IGET_EA_INODE);</div><div class='add'>+		if (IS_ERR(ea_inode))</div><div class='add'>+			goto next_entry;</div><div class='add'>+		ext4_xattr_inode_set_class(ea_inode);</div><div class='add'>+		if (i_size_read(ea_inode) == value_len &amp;&amp;</div><div class='ctx'> 		    !ext4_xattr_inode_read(ea_inode, ea_data, value_len) &amp;&amp;</div><div class='ctx'> 		    !ext4_xattr_inode_verify_hashes(ea_inode, NULL, ea_data,</div><div class='ctx'> 						    value_len) &amp;&amp;</div><div class='hunk'>@@ -1491,9 +1561,8 @@ ext4_xattr_inode_cache_find(struct inode *inode, const void *value,</div><div class='ctx'> 			kvfree(ea_data);</div><div class='ctx'> 			return ea_inode;</div><div class='ctx'> 		}</div><div class='del'>-</div><div class='del'>-		if (!IS_ERR(ea_inode))</div><div class='del'>-			iput(ea_inode);</div><div class='add'>+		iput(ea_inode);</div><div class='add'>+	next_entry:</div><div class='ctx'> 		ce = mb_cache_entry_find_next(ea_inode_cache, ce);</div><div class='ctx'> 	}</div><div class='ctx'> 	kvfree(ea_data);</div><div class='hunk'>@@ -1503,45 +1572,49 @@ ext4_xattr_inode_cache_find(struct inode *inode, const void *value,</div><div class='ctx'> /*</div><div class='ctx'>  * Add value of the EA in an inode.</div><div class='ctx'>  */</div><div class='del'>-static int ext4_xattr_inode_lookup_create(handle_t *handle, struct inode *inode,</div><div class='del'>-					  const void *value, size_t value_len,</div><div class='del'>-					  struct inode **ret_inode)</div><div class='add'>+static struct inode *ext4_xattr_inode_lookup_create(handle_t *handle,</div><div class='add'>+		struct inode *inode, const void *value, size_t value_len)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *ea_inode;</div><div class='ctx'> 	u32 hash;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='add'>+	/* Account inode &amp; space to quota even if sharing... */</div><div class='add'>+	err = ext4_xattr_inode_alloc_quota(inode, value_len);</div><div class='add'>+	if (err)</div><div class='add'>+		return ERR_PTR(err);</div><div class='add'>+</div><div class='ctx'> 	hash = ext4_xattr_inode_hash(EXT4_SB(inode-&gt;i_sb), value, value_len);</div><div class='ctx'> 	ea_inode = ext4_xattr_inode_cache_find(inode, value, value_len, hash);</div><div class='ctx'> 	if (ea_inode) {</div><div class='ctx'> 		err = ext4_xattr_inode_inc_ref(handle, ea_inode);</div><div class='del'>-		if (err) {</div><div class='del'>-			iput(ea_inode);</div><div class='del'>-			return err;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		*ret_inode = ea_inode;</div><div class='del'>-		return 0;</div><div class='add'>+		if (err)</div><div class='add'>+			goto out_err;</div><div class='add'>+		return ea_inode;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Create an inode for the EA value */</div><div class='ctx'> 	ea_inode = ext4_xattr_inode_create(handle, inode, hash);</div><div class='del'>-	if (IS_ERR(ea_inode))</div><div class='del'>-		return PTR_ERR(ea_inode);</div><div class='add'>+	if (IS_ERR(ea_inode)) {</div><div class='add'>+		ext4_xattr_inode_free_quota(inode, NULL, value_len);</div><div class='add'>+		return ea_inode;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	err = ext4_xattr_inode_write(handle, ea_inode, value, value_len);</div><div class='ctx'> 	if (err) {</div><div class='del'>-		ext4_xattr_inode_dec_ref(handle, ea_inode);</div><div class='del'>-		iput(ea_inode);</div><div class='del'>-		return err;</div><div class='add'>+		if (ext4_xattr_inode_dec_ref(handle, ea_inode))</div><div class='add'>+			ext4_warning_inode(ea_inode, "cleanup dec ref error %d", err);</div><div class='add'>+		goto out_err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (EA_INODE_CACHE(inode))</div><div class='ctx'> 		mb_cache_entry_create(EA_INODE_CACHE(inode), GFP_NOFS, hash,</div><div class='ctx'> 				      ea_inode-&gt;i_ino, true /* reusable */);</div><div class='del'>-</div><div class='del'>-	*ret_inode = ea_inode;</div><div class='del'>-	return 0;</div><div class='add'>+	return ea_inode;</div><div class='add'>+out_err:</div><div class='add'>+	iput(ea_inode);</div><div class='add'>+	ext4_xattr_inode_free_quota(inode, NULL, value_len);</div><div class='add'>+	return ERR_PTR(err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1553,6 +1626,7 @@ static int ext4_xattr_inode_lookup_create(handle_t *handle, struct inode *inode,</div><div class='ctx'> static int ext4_xattr_set_entry(struct ext4_xattr_info *i,</div><div class='ctx'> 				struct ext4_xattr_search *s,</div><div class='ctx'> 				handle_t *handle, struct inode *inode,</div><div class='add'>+				struct inode *new_ea_inode,</div><div class='ctx'> 				bool is_block)</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_xattr_entry *last, *next;</div><div class='hunk'>@@ -1560,7 +1634,6 @@ static int ext4_xattr_set_entry(struct ext4_xattr_info *i,</div><div class='ctx'> 	size_t min_offs = s-&gt;end - s-&gt;base, name_len = strlen(i-&gt;name);</div><div class='ctx'> 	int in_inode = i-&gt;in_inode;</div><div class='ctx'> 	struct inode *old_ea_inode = NULL;</div><div class='del'>-	struct inode *new_ea_inode = NULL;</div><div class='ctx'> 	size_t old_size, new_size;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -1645,43 +1718,11 @@ static int ext4_xattr_set_entry(struct ext4_xattr_info *i,</div><div class='ctx'> 			old_ea_inode = NULL;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='del'>-	}</div><div class='del'>-	if (i-&gt;value &amp;&amp; in_inode) {</div><div class='del'>-		WARN_ON_ONCE(!i-&gt;value_len);</div><div class='del'>-</div><div class='del'>-		ret = ext4_xattr_inode_alloc_quota(inode, i-&gt;value_len);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto out;</div><div class='del'>-</div><div class='del'>-		ret = ext4_xattr_inode_lookup_create(handle, inode, i-&gt;value,</div><div class='del'>-						     i-&gt;value_len,</div><div class='del'>-						     &amp;new_ea_inode);</div><div class='del'>-		if (ret) {</div><div class='del'>-			new_ea_inode = NULL;</div><div class='del'>-			ext4_xattr_inode_free_quota(inode, NULL, i-&gt;value_len);</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	if (old_ea_inode) {</div><div class='ctx'> 		/* We are ready to release ref count on the old_ea_inode. */</div><div class='ctx'> 		ret = ext4_xattr_inode_dec_ref(handle, old_ea_inode);</div><div class='del'>-		if (ret) {</div><div class='del'>-			/* Release newly required ref count on new_ea_inode. */</div><div class='del'>-			if (new_ea_inode) {</div><div class='del'>-				int err;</div><div class='del'>-</div><div class='del'>-				err = ext4_xattr_inode_dec_ref(handle,</div><div class='del'>-							       new_ea_inode);</div><div class='del'>-				if (err)</div><div class='del'>-					ext4_warning_inode(new_ea_inode,</div><div class='del'>-						  "dec ref new_ea_inode err=%d",</div><div class='del'>-						  err);</div><div class='del'>-				ext4_xattr_inode_free_quota(inode, new_ea_inode,</div><div class='del'>-							    i-&gt;value_len);</div><div class='del'>-			}</div><div class='add'>+		if (ret)</div><div class='ctx'> 			goto out;</div><div class='del'>-		}</div><div class='ctx'> </div><div class='ctx'> 		ext4_xattr_inode_free_quota(inode, old_ea_inode,</div><div class='ctx'> 					    le32_to_cpu(here-&gt;e_value_size));</div><div class='hunk'>@@ -1719,6 +1760,20 @@ static int ext4_xattr_set_entry(struct ext4_xattr_info *i,</div><div class='ctx'> 		memmove(here, (void *)here + size,</div><div class='ctx'> 			(void *)last - (void *)here + sizeof(__u32));</div><div class='ctx'> 		memset(last, 0, size);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Update i_inline_off - moved ibody region might contain</div><div class='add'>+		 * system.data attribute.  Handling a failure here won't</div><div class='add'>+		 * cause other complications for setting an xattr.</div><div class='add'>+		 */</div><div class='add'>+		if (!is_block &amp;&amp; ext4_has_inline_data(inode)) {</div><div class='add'>+			ret = ext4_find_inline_data_nolock(inode);</div><div class='add'>+			if (ret) {</div><div class='add'>+				ext4_warning_inode(inode,</div><div class='add'>+					"unable to update i_inline_off");</div><div class='add'>+				goto out;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='ctx'> 	} else if (s-&gt;not_found) {</div><div class='ctx'> 		/* Insert new name. */</div><div class='ctx'> 		size_t size = EXT4_XATTR_LEN(name_len);</div><div class='hunk'>@@ -1791,7 +1846,6 @@ update_hash:</div><div class='ctx'> 	ret = 0;</div><div class='ctx'> out:</div><div class='ctx'> 	iput(old_ea_inode);</div><div class='del'>-	iput(new_ea_inode);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1854,15 +1908,30 @@ ext4_xattr_block_set(handle_t *handle, struct inode *inode,</div><div class='ctx'> 	size_t old_ea_inode_quota = 0;</div><div class='ctx'> 	unsigned int ea_ino;</div><div class='ctx'> </div><div class='del'>-</div><div class='ctx'> #define header(x) ((struct ext4_xattr_header *)(x))</div><div class='ctx'> </div><div class='add'>+	/* If we need EA inode, prepare it before locking the buffer */</div><div class='add'>+	if (i-&gt;value &amp;&amp; i-&gt;in_inode) {</div><div class='add'>+		WARN_ON_ONCE(!i-&gt;value_len);</div><div class='add'>+</div><div class='add'>+		ea_inode = ext4_xattr_inode_lookup_create(handle, inode,</div><div class='add'>+					i-&gt;value, i-&gt;value_len);</div><div class='add'>+		if (IS_ERR(ea_inode)) {</div><div class='add'>+			error = PTR_ERR(ea_inode);</div><div class='add'>+			ea_inode = NULL;</div><div class='add'>+			goto cleanup;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (s-&gt;base) {</div><div class='add'>+		int offset = (char *)s-&gt;here - bs-&gt;bh-&gt;b_data;</div><div class='add'>+</div><div class='ctx'> 		BUFFER_TRACE(bs-&gt;bh, "get_write_access");</div><div class='ctx'> 		error = ext4_journal_get_write_access(handle, sb, bs-&gt;bh,</div><div class='ctx'> 						      EXT4_JTR_NONE);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			goto cleanup;</div><div class='add'>+</div><div class='ctx'> 		lock_buffer(bs-&gt;bh);</div><div class='ctx'> </div><div class='ctx'> 		if (header(s-&gt;base)-&gt;h_refcount == cpu_to_le32(1)) {</div><div class='hunk'>@@ -1873,12 +1942,23 @@ ext4_xattr_block_set(handle_t *handle, struct inode *inode,</div><div class='ctx'> 			 * ext4_xattr_block_set() to reliably detect modified</div><div class='ctx'> 			 * block</div><div class='ctx'> 			 */</div><div class='del'>-			if (ea_block_cache)</div><div class='del'>-				mb_cache_entry_delete(ea_block_cache, hash,</div><div class='del'>-						      bs-&gt;bh-&gt;b_blocknr);</div><div class='add'>+			if (ea_block_cache) {</div><div class='add'>+				struct mb_cache_entry *oe;</div><div class='add'>+</div><div class='add'>+				oe = mb_cache_entry_delete_or_get(ea_block_cache,</div><div class='add'>+					hash, bs-&gt;bh-&gt;b_blocknr);</div><div class='add'>+				if (oe) {</div><div class='add'>+					/*</div><div class='add'>+					 * Xattr block is getting reused. Leave</div><div class='add'>+					 * it alone.</div><div class='add'>+					 */</div><div class='add'>+					mb_cache_entry_put(ea_block_cache, oe);</div><div class='add'>+					goto clone_block;</div><div class='add'>+				}</div><div class='add'>+			}</div><div class='ctx'> 			ea_bdebug(bs-&gt;bh, "modifying in-place");</div><div class='ctx'> 			error = ext4_xattr_set_entry(i, s, handle, inode,</div><div class='del'>-						     true /* is_block */);</div><div class='add'>+					     ea_inode, true /* is_block */);</div><div class='ctx'> 			ext4_xattr_block_csum_set(inode, bs-&gt;bh);</div><div class='ctx'> 			unlock_buffer(bs-&gt;bh);</div><div class='ctx'> 			if (error == -EFSCORRUPTED)</div><div class='hunk'>@@ -1890,50 +1970,47 @@ ext4_xattr_block_set(handle_t *handle, struct inode *inode,</div><div class='ctx'> 			if (error)</div><div class='ctx'> 				goto cleanup;</div><div class='ctx'> 			goto inserted;</div><div class='del'>-		} else {</div><div class='del'>-			int offset = (char *)s-&gt;here - bs-&gt;bh-&gt;b_data;</div><div class='add'>+		}</div><div class='add'>+clone_block:</div><div class='add'>+		unlock_buffer(bs-&gt;bh);</div><div class='add'>+		ea_bdebug(bs-&gt;bh, "cloning");</div><div class='add'>+		s-&gt;base = kmemdup(BHDR(bs-&gt;bh), bs-&gt;bh-&gt;b_size, GFP_NOFS);</div><div class='add'>+		error = -ENOMEM;</div><div class='add'>+		if (s-&gt;base == NULL)</div><div class='add'>+			goto cleanup;</div><div class='add'>+		s-&gt;first = ENTRY(header(s-&gt;base)+1);</div><div class='add'>+		header(s-&gt;base)-&gt;h_refcount = cpu_to_le32(1);</div><div class='add'>+		s-&gt;here = ENTRY(s-&gt;base + offset);</div><div class='add'>+		s-&gt;end = s-&gt;base + bs-&gt;bh-&gt;b_size;</div><div class='ctx'> </div><div class='del'>-			unlock_buffer(bs-&gt;bh);</div><div class='del'>-			ea_bdebug(bs-&gt;bh, "cloning");</div><div class='del'>-			s-&gt;base = kmalloc(bs-&gt;bh-&gt;b_size, GFP_NOFS);</div><div class='del'>-			error = -ENOMEM;</div><div class='del'>-			if (s-&gt;base == NULL)</div><div class='add'>+		/*</div><div class='add'>+		 * If existing entry points to an xattr inode, we need</div><div class='add'>+		 * to prevent ext4_xattr_set_entry() from decrementing</div><div class='add'>+		 * ref count on it because the reference belongs to the</div><div class='add'>+		 * original block. In this case, make the entry look</div><div class='add'>+		 * like it has an empty value.</div><div class='add'>+		 */</div><div class='add'>+		if (!s-&gt;not_found &amp;&amp; s-&gt;here-&gt;e_value_inum) {</div><div class='add'>+			ea_ino = le32_to_cpu(s-&gt;here-&gt;e_value_inum);</div><div class='add'>+			error = ext4_xattr_inode_iget(inode, ea_ino,</div><div class='add'>+				      le32_to_cpu(s-&gt;here-&gt;e_hash),</div><div class='add'>+				      &amp;tmp_inode);</div><div class='add'>+			if (error)</div><div class='ctx'> 				goto cleanup;</div><div class='del'>-			memcpy(s-&gt;base, BHDR(bs-&gt;bh), bs-&gt;bh-&gt;b_size);</div><div class='del'>-			s-&gt;first = ENTRY(header(s-&gt;base)+1);</div><div class='del'>-			header(s-&gt;base)-&gt;h_refcount = cpu_to_le32(1);</div><div class='del'>-			s-&gt;here = ENTRY(s-&gt;base + offset);</div><div class='del'>-			s-&gt;end = s-&gt;base + bs-&gt;bh-&gt;b_size;</div><div class='del'>-</div><div class='del'>-			/*</div><div class='del'>-			 * If existing entry points to an xattr inode, we need</div><div class='del'>-			 * to prevent ext4_xattr_set_entry() from decrementing</div><div class='del'>-			 * ref count on it because the reference belongs to the</div><div class='del'>-			 * original block. In this case, make the entry look</div><div class='del'>-			 * like it has an empty value.</div><div class='del'>-			 */</div><div class='del'>-			if (!s-&gt;not_found &amp;&amp; s-&gt;here-&gt;e_value_inum) {</div><div class='del'>-				ea_ino = le32_to_cpu(s-&gt;here-&gt;e_value_inum);</div><div class='del'>-				error = ext4_xattr_inode_iget(inode, ea_ino,</div><div class='del'>-					      le32_to_cpu(s-&gt;here-&gt;e_hash),</div><div class='del'>-					      &amp;tmp_inode);</div><div class='del'>-				if (error)</div><div class='del'>-					goto cleanup;</div><div class='ctx'> </div><div class='del'>-				if (!ext4_test_inode_state(tmp_inode,</div><div class='del'>-						EXT4_STATE_LUSTRE_EA_INODE)) {</div><div class='del'>-					/*</div><div class='del'>-					 * Defer quota free call for previous</div><div class='del'>-					 * inode until success is guaranteed.</div><div class='del'>-					 */</div><div class='del'>-					old_ea_inode_quota = le32_to_cpu(</div><div class='del'>-							s-&gt;here-&gt;e_value_size);</div><div class='del'>-				}</div><div class='del'>-				iput(tmp_inode);</div><div class='del'>-</div><div class='del'>-				s-&gt;here-&gt;e_value_inum = 0;</div><div class='del'>-				s-&gt;here-&gt;e_value_size = 0;</div><div class='add'>+			if (!ext4_test_inode_state(tmp_inode,</div><div class='add'>+					EXT4_STATE_LUSTRE_EA_INODE)) {</div><div class='add'>+				/*</div><div class='add'>+				 * Defer quota free call for previous</div><div class='add'>+				 * inode until success is guaranteed.</div><div class='add'>+				 */</div><div class='add'>+				old_ea_inode_quota = le32_to_cpu(</div><div class='add'>+						s-&gt;here-&gt;e_value_size);</div><div class='ctx'> 			}</div><div class='add'>+			iput(tmp_inode);</div><div class='add'>+</div><div class='add'>+			s-&gt;here-&gt;e_value_inum = 0;</div><div class='add'>+			s-&gt;here-&gt;e_value_size = 0;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='ctx'> 		/* Allocate a buffer where we construct the new block. */</div><div class='hunk'>@@ -1949,33 +2026,22 @@ ext4_xattr_block_set(handle_t *handle, struct inode *inode,</div><div class='ctx'> 		s-&gt;end = s-&gt;base + sb-&gt;s_blocksize;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	error = ext4_xattr_set_entry(i, s, handle, inode, true /* is_block */);</div><div class='add'>+	error = ext4_xattr_set_entry(i, s, handle, inode, ea_inode,</div><div class='add'>+				     true /* is_block */);</div><div class='ctx'> 	if (error == -EFSCORRUPTED)</div><div class='ctx'> 		goto bad_block;</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto cleanup;</div><div class='ctx'> </div><div class='del'>-	if (i-&gt;value &amp;&amp; s-&gt;here-&gt;e_value_inum) {</div><div class='del'>-		/*</div><div class='del'>-		 * A ref count on ea_inode has been taken as part of the call to</div><div class='del'>-		 * ext4_xattr_set_entry() above. We would like to drop this</div><div class='del'>-		 * extra ref but we have to wait until the xattr block is</div><div class='del'>-		 * initialized and has its own ref count on the ea_inode.</div><div class='del'>-		 */</div><div class='del'>-		ea_ino = le32_to_cpu(s-&gt;here-&gt;e_value_inum);</div><div class='del'>-		error = ext4_xattr_inode_iget(inode, ea_ino,</div><div class='del'>-					      le32_to_cpu(s-&gt;here-&gt;e_hash),</div><div class='del'>-					      &amp;ea_inode);</div><div class='del'>-		if (error) {</div><div class='del'>-			ea_inode = NULL;</div><div class='add'>+inserted:</div><div class='add'>+	if (!IS_LAST_ENTRY(s-&gt;first)) {</div><div class='add'>+		new_bh = ext4_xattr_block_cache_find(inode, header(s-&gt;base), &amp;ce);</div><div class='add'>+		if (IS_ERR(new_bh)) {</div><div class='add'>+			error = PTR_ERR(new_bh);</div><div class='add'>+			new_bh = NULL;</div><div class='ctx'> 			goto cleanup;</div><div class='ctx'> 		}</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-inserted:</div><div class='del'>-	if (!IS_LAST_ENTRY(s-&gt;first)) {</div><div class='del'>-		new_bh = ext4_xattr_block_cache_find(inode, header(s-&gt;base),</div><div class='del'>-						     &amp;ce);</div><div class='ctx'> 		if (new_bh) {</div><div class='ctx'> 			/* We found an identical block in the cache. */</div><div class='ctx'> 			if (new_bh == bs-&gt;bh)</div><div class='hunk'>@@ -1983,8 +2049,9 @@ inserted:</div><div class='ctx'> 			else {</div><div class='ctx'> 				u32 ref;</div><div class='ctx'> </div><div class='add'>+#ifdef EXT4_XATTR_DEBUG</div><div class='ctx'> 				WARN_ON_ONCE(dquot_initialize_needed(inode));</div><div class='del'>-</div><div class='add'>+#endif</div><div class='ctx'> 				/* The old block is released after updating</div><div class='ctx'> 				   the inode. */</div><div class='ctx'> 				error = dquot_alloc_block(inode,</div><div class='hunk'>@@ -2000,18 +2067,13 @@ inserted:</div><div class='ctx'> 				lock_buffer(new_bh);</div><div class='ctx'> 				/*</div><div class='ctx'> 				 * We have to be careful about races with</div><div class='del'>-				 * freeing, rehashing or adding references to</div><div class='del'>-				 * xattr block. Once we hold buffer lock xattr</div><div class='del'>-				 * block's state is stable so we can check</div><div class='del'>-				 * whether the block got freed / rehashed or</div><div class='del'>-				 * not.  Since we unhash mbcache entry under</div><div class='del'>-				 * buffer lock when freeing / rehashing xattr</div><div class='del'>-				 * block, checking whether entry is still</div><div class='del'>-				 * hashed is reliable. Same rules hold for</div><div class='del'>-				 * e_reusable handling.</div><div class='add'>+				 * adding references to xattr block. Once we</div><div class='add'>+				 * hold buffer lock xattr block's state is</div><div class='add'>+				 * stable so we can check the additional</div><div class='add'>+				 * reference fits.</div><div class='ctx'> 				 */</div><div class='del'>-				if (hlist_bl_unhashed(&amp;ce-&gt;e_hash_list) ||</div><div class='del'>-				    !ce-&gt;e_reusable) {</div><div class='add'>+				ref = le32_to_cpu(BHDR(new_bh)-&gt;h_refcount) + 1;</div><div class='add'>+				if (ref &gt; EXT4_XATTR_REFCOUNT_MAX) {</div><div class='ctx'> 					/*</div><div class='ctx'> 					 * Undo everything and check mbcache</div><div class='ctx'> 					 * again.</div><div class='hunk'>@@ -2026,10 +2088,9 @@ inserted:</div><div class='ctx'> 					new_bh = NULL;</div><div class='ctx'> 					goto inserted;</div><div class='ctx'> 				}</div><div class='del'>-				ref = le32_to_cpu(BHDR(new_bh)-&gt;h_refcount) + 1;</div><div class='ctx'> 				BHDR(new_bh)-&gt;h_refcount = cpu_to_le32(ref);</div><div class='del'>-				if (ref &gt;= EXT4_XATTR_REFCOUNT_MAX)</div><div class='del'>-					ce-&gt;e_reusable = 0;</div><div class='add'>+				if (ref == EXT4_XATTR_REFCOUNT_MAX)</div><div class='add'>+					clear_bit(MBE_REUSABLE_B, &amp;ce-&gt;e_flags);</div><div class='ctx'> 				ea_bdebug(new_bh, "reusing; refcount now=%d",</div><div class='ctx'> 					  ref);</div><div class='ctx'> 				ext4_xattr_block_csum_set(inode, new_bh);</div><div class='hunk'>@@ -2053,23 +2114,16 @@ inserted:</div><div class='ctx'> 			/* We need to allocate a new block */</div><div class='ctx'> 			ext4_fsblk_t goal, block;</div><div class='ctx'> </div><div class='add'>+#ifdef EXT4_XATTR_DEBUG</div><div class='ctx'> 			WARN_ON_ONCE(dquot_initialize_needed(inode));</div><div class='del'>-</div><div class='add'>+#endif</div><div class='ctx'> 			goal = ext4_group_first_block_no(sb,</div><div class='ctx'> 						EXT4_I(inode)-&gt;i_block_group);</div><div class='del'>-</div><div class='del'>-			/* non-extent files can't have physical blocks past 2^32 */</div><div class='del'>-			if (!(ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS)))</div><div class='del'>-				goal = goal &amp; EXT4_MAX_BLOCK_FILE_PHYS;</div><div class='del'>-</div><div class='ctx'> 			block = ext4_new_meta_blocks(handle, inode, goal, 0,</div><div class='ctx'> 						     NULL, &amp;error);</div><div class='ctx'> 			if (error)</div><div class='ctx'> 				goto cleanup;</div><div class='ctx'> </div><div class='del'>-			if (!(ext4_test_inode_flag(inode, EXT4_INODE_EXTENTS)))</div><div class='del'>-				BUG_ON(block &gt; EXT4_MAX_BLOCK_FILE_PHYS);</div><div class='del'>-</div><div class='ctx'> 			ea_idebug(inode, "creating block %llu",</div><div class='ctx'> 				  (unsigned long long)block);</div><div class='ctx'> </div><div class='hunk'>@@ -2136,17 +2190,16 @@ getblk_failed:</div><div class='ctx'> </div><div class='ctx'> cleanup:</div><div class='ctx'> 	if (ea_inode) {</div><div class='del'>-		int error2;</div><div class='del'>-</div><div class='del'>-		error2 = ext4_xattr_inode_dec_ref(handle, ea_inode);</div><div class='del'>-		if (error2)</div><div class='del'>-			ext4_warning_inode(ea_inode, "dec ref error=%d",</div><div class='del'>-					   error2);</div><div class='add'>+		if (error) {</div><div class='add'>+			int error2;</div><div class='ctx'> </div><div class='del'>-		/* If there was an error, revert the quota charge. */</div><div class='del'>-		if (error)</div><div class='add'>+			error2 = ext4_xattr_inode_dec_ref(handle, ea_inode);</div><div class='add'>+			if (error2)</div><div class='add'>+				ext4_warning_inode(ea_inode, "dec ref error=%d",</div><div class='add'>+						   error2);</div><div class='ctx'> 			ext4_xattr_inode_free_quota(inode, ea_inode,</div><div class='ctx'> 						    i_size_read(ea_inode));</div><div class='add'>+		}</div><div class='ctx'> 		iput(ea_inode);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (ce)</div><div class='hunk'>@@ -2176,17 +2229,15 @@ int ext4_xattr_ibody_find(struct inode *inode, struct ext4_xattr_info *i,</div><div class='ctx'> 	struct ext4_inode *raw_inode;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	if (EXT4_I(inode)-&gt;i_extra_isize == 0)</div><div class='add'>+	if (!EXT4_INODE_HAS_XATTR_SPACE(inode))</div><div class='ctx'> 		return 0;</div><div class='add'>+</div><div class='ctx'> 	raw_inode = ext4_raw_inode(&amp;is-&gt;iloc);</div><div class='ctx'> 	header = IHDR(inode, raw_inode);</div><div class='ctx'> 	is-&gt;s.base = is-&gt;s.first = IFIRST(header);</div><div class='ctx'> 	is-&gt;s.here = is-&gt;s.first;</div><div class='del'>-	is-&gt;s.end = (void *)raw_inode + EXT4_SB(inode-&gt;i_sb)-&gt;s_inode_size;</div><div class='add'>+	is-&gt;s.end = ITAIL(inode, raw_inode);</div><div class='ctx'> 	if (ext4_test_inode_state(inode, EXT4_STATE_XATTR)) {</div><div class='del'>-		error = xattr_check_inode(inode, header, is-&gt;s.end);</div><div class='del'>-		if (error)</div><div class='del'>-			return error;</div><div class='ctx'> 		/* Find the named attribute. */</div><div class='ctx'> 		error = xattr_find_entry(inode, &amp;is-&gt;s.here, is-&gt;s.end,</div><div class='ctx'> 					 i-&gt;name_index, i-&gt;name, 0);</div><div class='hunk'>@@ -2203,13 +2254,38 @@ int ext4_xattr_ibody_set(handle_t *handle, struct inode *inode,</div><div class='ctx'> {</div><div class='ctx'> 	struct ext4_xattr_ibody_header *header;</div><div class='ctx'> 	struct ext4_xattr_search *s = &amp;is-&gt;s;</div><div class='add'>+	struct inode *ea_inode = NULL;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	if (EXT4_I(inode)-&gt;i_extra_isize == 0)</div><div class='add'>+	if (!EXT4_INODE_HAS_XATTR_SPACE(inode))</div><div class='ctx'> 		return -ENOSPC;</div><div class='del'>-	error = ext4_xattr_set_entry(i, s, handle, inode, false /* is_block */);</div><div class='del'>-	if (error)</div><div class='add'>+</div><div class='add'>+	/* If we need EA inode, prepare it before locking the buffer */</div><div class='add'>+	if (i-&gt;value &amp;&amp; i-&gt;in_inode) {</div><div class='add'>+		WARN_ON_ONCE(!i-&gt;value_len);</div><div class='add'>+</div><div class='add'>+		ea_inode = ext4_xattr_inode_lookup_create(handle, inode,</div><div class='add'>+					i-&gt;value, i-&gt;value_len);</div><div class='add'>+		if (IS_ERR(ea_inode))</div><div class='add'>+			return PTR_ERR(ea_inode);</div><div class='add'>+	}</div><div class='add'>+	error = ext4_xattr_set_entry(i, s, handle, inode, ea_inode,</div><div class='add'>+				     false /* is_block */);</div><div class='add'>+	if (error) {</div><div class='add'>+		if (ea_inode) {</div><div class='add'>+			int error2;</div><div class='add'>+</div><div class='add'>+			error2 = ext4_xattr_inode_dec_ref(handle, ea_inode);</div><div class='add'>+			if (error2)</div><div class='add'>+				ext4_warning_inode(ea_inode, "dec ref error=%d",</div><div class='add'>+						   error2);</div><div class='add'>+</div><div class='add'>+			ext4_xattr_inode_free_quota(inode, ea_inode,</div><div class='add'>+						    i_size_read(ea_inode));</div><div class='add'>+			iput(ea_inode);</div><div class='add'>+		}</div><div class='ctx'> 		return error;</div><div class='add'>+	}</div><div class='ctx'> 	header = IHDR(inode, ext4_raw_inode(&amp;is-&gt;iloc));</div><div class='ctx'> 	if (!IS_LAST_ENTRY(s-&gt;first)) {</div><div class='ctx'> 		header-&gt;h_magic = cpu_to_le32(EXT4_XATTR_MAGIC);</div><div class='hunk'>@@ -2218,6 +2294,7 @@ int ext4_xattr_ibody_set(handle_t *handle, struct inode *inode,</div><div class='ctx'> 		header-&gt;h_magic = cpu_to_le32(0);</div><div class='ctx'> 		ext4_clear_inode_state(inode, EXT4_STATE_XATTR);</div><div class='ctx'> 	}</div><div class='add'>+	iput(ea_inode);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2396,7 +2473,8 @@ retry_inode:</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!error) {</div><div class='ctx'> 		ext4_xattr_update_super_block(handle, inode-&gt;i_sb);</div><div class='del'>-		inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+		inode_set_ctime_current(inode);</div><div class='add'>+		inode_inc_iversion(inode);</div><div class='ctx'> 		if (!value)</div><div class='ctx'> 			no_expand = 0;</div><div class='ctx'> 		error = ext4_mark_iloc_dirty(handle, inode, &amp;is.iloc);</div><div class='hunk'>@@ -2408,7 +2486,7 @@ retry_inode:</div><div class='ctx'> 		if (IS_SYNC(inode))</div><div class='ctx'> 			ext4_handle_sync(handle);</div><div class='ctx'> 	}</div><div class='del'>-	ext4_fc_mark_ineligible(inode-&gt;i_sb, EXT4_FC_REASON_XATTR);</div><div class='add'>+	ext4_fc_mark_ineligible(inode-&gt;i_sb, EXT4_FC_REASON_XATTR, handle);</div><div class='ctx'> </div><div class='ctx'> cleanup:</div><div class='ctx'> 	brelse(is.iloc.bh);</div><div class='hunk'>@@ -2479,6 +2557,8 @@ retry:</div><div class='ctx'> </div><div class='ctx'> 		error = ext4_xattr_set_handle(handle, inode, name_index, name,</div><div class='ctx'> 					      value, value_len, flags);</div><div class='add'>+		ext4_fc_mark_ineligible(inode-&gt;i_sb, EXT4_FC_REASON_XATTR,</div><div class='add'>+					handle);</div><div class='ctx'> 		error2 = ext4_journal_stop(handle);</div><div class='ctx'> 		if (error == -ENOSPC &amp;&amp;</div><div class='ctx'> 		    ext4_should_retry_alloc(sb, &amp;retries))</div><div class='hunk'>@@ -2486,7 +2566,6 @@ retry:</div><div class='ctx'> 		if (error == 0)</div><div class='ctx'> 			error = error2;</div><div class='ctx'> 	}</div><div class='del'>-	ext4_fc_mark_ineligible(inode-&gt;i_sb, EXT4_FC_REASON_XATTR);</div><div class='ctx'> </div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='hunk'>@@ -2535,13 +2614,13 @@ static int ext4_xattr_move_to_block(handle_t *handle, struct inode *inode,</div><div class='ctx'> 		.in_inode = !!entry-&gt;e_value_inum,</div><div class='ctx'> 	};</div><div class='ctx'> 	struct ext4_xattr_ibody_header *header = IHDR(inode, raw_inode);</div><div class='add'>+	int needs_kvfree = 0;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='ctx'> 	is = kzalloc(sizeof(struct ext4_xattr_ibody_find), GFP_NOFS);</div><div class='ctx'> 	bs = kzalloc(sizeof(struct ext4_xattr_block_find), GFP_NOFS);</div><div class='del'>-	buffer = kmalloc(value_size, GFP_NOFS);</div><div class='ctx'> 	b_entry_name = kmalloc(entry-&gt;e_name_len + 1, GFP_NOFS);</div><div class='del'>-	if (!is || !bs || !buffer || !b_entry_name) {</div><div class='add'>+	if (!is || !bs || !b_entry_name) {</div><div class='ctx'> 		error = -ENOMEM;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2553,12 +2632,18 @@ static int ext4_xattr_move_to_block(handle_t *handle, struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 	/* Save the entry name and the entry value */</div><div class='ctx'> 	if (entry-&gt;e_value_inum) {</div><div class='add'>+		buffer = kvmalloc(value_size, GFP_NOFS);</div><div class='add'>+		if (!buffer) {</div><div class='add'>+			error = -ENOMEM;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		needs_kvfree = 1;</div><div class='ctx'> 		error = ext4_xattr_inode_get(inode, entry, buffer, value_size);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		size_t value_offs = le16_to_cpu(entry-&gt;e_value_offs);</div><div class='del'>-		memcpy(buffer, (void *)IFIRST(header) + value_offs, value_size);</div><div class='add'>+		buffer = (void *)IFIRST(header) + value_offs;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	memcpy(b_entry_name, entry-&gt;e_name, entry-&gt;e_name_len);</div><div class='hunk'>@@ -2573,25 +2658,26 @@ static int ext4_xattr_move_to_block(handle_t *handle, struct inode *inode,</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	/* Remove the chosen entry from the inode */</div><div class='del'>-	error = ext4_xattr_ibody_set(handle, inode, &amp;i, is);</div><div class='del'>-	if (error)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='ctx'> 	i.value = buffer;</div><div class='ctx'> 	i.value_len = value_size;</div><div class='ctx'> 	error = ext4_xattr_block_find(inode, &amp;i, bs);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	/* Add entry which was removed from the inode into the block */</div><div class='add'>+	/* Move ea entry from the inode into the block */</div><div class='ctx'> 	error = ext4_xattr_block_set(handle, inode, &amp;i, bs);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='del'>-	error = 0;</div><div class='add'>+</div><div class='add'>+	/* Remove the chosen entry from the inode */</div><div class='add'>+	i.value = NULL;</div><div class='add'>+	i.value_len = 0;</div><div class='add'>+	error = ext4_xattr_ibody_set(handle, inode, &amp;i, is);</div><div class='add'>+</div><div class='ctx'> out:</div><div class='ctx'> 	kfree(b_entry_name);</div><div class='del'>-	kfree(buffer);</div><div class='add'>+	if (needs_kvfree &amp;&amp; buffer)</div><div class='add'>+		kvfree(buffer);</div><div class='ctx'> 	if (is)</div><div class='ctx'> 		brelse(is-&gt;iloc.bh);</div><div class='ctx'> 	if (bs)</div><div class='hunk'>@@ -2698,14 +2784,10 @@ retry:</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='ctx'> 	base = IFIRST(header);</div><div class='del'>-	end = (void *)raw_inode + EXT4_SB(inode-&gt;i_sb)-&gt;s_inode_size;</div><div class='add'>+	end = ITAIL(inode, raw_inode);</div><div class='ctx'> 	min_offs = end - base;</div><div class='ctx'> 	total_ino = sizeof(struct ext4_xattr_ibody_header) + sizeof(u32);</div><div class='ctx'> </div><div class='del'>-	error = xattr_check_inode(inode, header, end);</div><div class='del'>-	if (error)</div><div class='del'>-		goto cleanup;</div><div class='del'>-</div><div class='ctx'> 	ifree = ext4_xattr_free_space(base, &amp;min_offs, base, &amp;total_ino);</div><div class='ctx'> 	if (ifree &gt;= isize_diff)</div><div class='ctx'> 		goto shift;</div><div class='hunk'>@@ -2766,6 +2848,9 @@ shift:</div><div class='ctx'> 			(void *)header, total_ino);</div><div class='ctx'> 	EXT4_I(inode)-&gt;i_extra_isize = new_extra_isize;</div><div class='ctx'> </div><div class='add'>+	if (ext4_has_inline_data(inode))</div><div class='add'>+		error = ext4_find_inline_data_nolock(inode);</div><div class='add'>+</div><div class='ctx'> cleanup:</div><div class='ctx'> 	if (error &amp;&amp; (mnt_count != le16_to_cpu(sbi-&gt;s_es-&gt;s_mnt_count))) {</div><div class='ctx'> 		ext4_warning(inode-&gt;i_sb, "Unable to expand inode %lu. Delete some EAs or run e2fsck.",</div><div class='hunk'>@@ -2789,33 +2874,31 @@ ext4_expand_inode_array(struct ext4_xattr_inode_array **ea_inode_array,</div><div class='ctx'> 	if (*ea_inode_array == NULL) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Start with 15 inodes, so it fits into a power-of-two size.</div><div class='del'>-		 * If *ea_inode_array is NULL, this is essentially offsetof()</div><div class='ctx'> 		 */</div><div class='del'>-		(*ea_inode_array) =</div><div class='del'>-			kmalloc(offsetof(struct ext4_xattr_inode_array,</div><div class='del'>-					 inodes[EIA_MASK]),</div><div class='del'>-				GFP_NOFS);</div><div class='add'>+		(*ea_inode_array) = kmalloc(</div><div class='add'>+			struct_size(*ea_inode_array, inodes, EIA_MASK),</div><div class='add'>+			GFP_NOFS);</div><div class='ctx'> 		if (*ea_inode_array == NULL)</div><div class='ctx'> 			return -ENOMEM;</div><div class='ctx'> 		(*ea_inode_array)-&gt;count = 0;</div><div class='ctx'> 	} else if (((*ea_inode_array)-&gt;count &amp; EIA_MASK) == EIA_MASK) {</div><div class='ctx'> 		/* expand the array once all 15 + n * 16 slots are full */</div><div class='ctx'> 		struct ext4_xattr_inode_array *new_array = NULL;</div><div class='del'>-		int count = (*ea_inode_array)-&gt;count;</div><div class='ctx'> </div><div class='del'>-		/* if new_array is NULL, this is essentially offsetof() */</div><div class='ctx'> 		new_array = kmalloc(</div><div class='del'>-				offsetof(struct ext4_xattr_inode_array,</div><div class='del'>-					 inodes[count + EIA_INCR]),</div><div class='del'>-				GFP_NOFS);</div><div class='add'>+			struct_size(*ea_inode_array, inodes,</div><div class='add'>+				    (*ea_inode_array)-&gt;count + EIA_INCR),</div><div class='add'>+			GFP_NOFS);</div><div class='ctx'> 		if (new_array == NULL)</div><div class='ctx'> 			return -ENOMEM;</div><div class='ctx'> 		memcpy(new_array, *ea_inode_array,</div><div class='del'>-		       offsetof(struct ext4_xattr_inode_array, inodes[count]));</div><div class='add'>+		       struct_size(*ea_inode_array, inodes,</div><div class='add'>+				   (*ea_inode_array)-&gt;count));</div><div class='ctx'> 		kfree(*ea_inode_array);</div><div class='ctx'> 		*ea_inode_array = new_array;</div><div class='ctx'> 	}</div><div class='del'>-	(*ea_inode_array)-&gt;inodes[(*ea_inode_array)-&gt;count++] = inode;</div><div class='add'>+	(*ea_inode_array)-&gt;count++;</div><div class='add'>+	(*ea_inode_array)-&gt;inodes[(*ea_inode_array)-&gt;count - 1] = inode;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2920,7 +3003,7 @@ int ext4_xattr_delete_inode(handle_t *handle, struct inode *inode,</div><div class='ctx'> 					 error);</div><div class='ctx'> 			goto cleanup;</div><div class='ctx'> 		}</div><div class='del'>-		ext4_fc_mark_ineligible(inode-&gt;i_sb, EXT4_FC_REASON_XATTR);</div><div class='add'>+		ext4_fc_mark_ineligible(inode-&gt;i_sb, EXT4_FC_REASON_XATTR, handle);</div><div class='ctx'> 	}</div><div class='ctx'> 	error = 0;</div><div class='ctx'> cleanup:</div><div class='hunk'>@@ -2946,8 +3029,6 @@ void ext4_xattr_inode_array_free(struct ext4_xattr_inode_array *ea_inode_array)</div><div class='ctx'>  *</div><div class='ctx'>  * Create a new entry in the extended attribute block cache, and insert</div><div class='ctx'>  * it unless such an entry is already in the cache.</div><div class='del'>- *</div><div class='del'>- * Returns 0, or a negative error number on failure.</div><div class='ctx'>  */</div><div class='ctx'> static void</div><div class='ctx'> ext4_xattr_block_cache_insert(struct mb_cache *ea_block_cache,</div><div class='hunk'>@@ -2975,8 +3056,7 @@ ext4_xattr_block_cache_insert(struct mb_cache *ea_block_cache,</div><div class='ctx'>  *</div><div class='ctx'>  * Compare two extended attribute blocks for equality.</div><div class='ctx'>  *</div><div class='del'>- * Returns 0 if the blocks are equal, 1 if they differ, and</div><div class='del'>- * a negative error number on errors.</div><div class='add'>+ * Returns 0 if the blocks are equal, 1 if they differ.</div><div class='ctx'>  */</div><div class='ctx'> static int</div><div class='ctx'> ext4_xattr_cmp(struct ext4_xattr_header *header1,</div><div class='hunk'>@@ -3015,8 +3095,8 @@ ext4_xattr_cmp(struct ext4_xattr_header *header1,</div><div class='ctx'>  *</div><div class='ctx'>  * Find an identical extended attribute block.</div><div class='ctx'>  *</div><div class='del'>- * Returns a pointer to the block found, or NULL if such a block was</div><div class='del'>- * not found or an error occurred.</div><div class='add'>+ * Returns a pointer to the block found, or NULL if such a block was not</div><div class='add'>+ * found, or an error pointer if an error occurred while reading ea block.</div><div class='ctx'>  */</div><div class='ctx'> static struct buffer_head *</div><div class='ctx'> ext4_xattr_block_cache_find(struct inode *inode,</div><div class='hunk'>@@ -3038,11 +3118,11 @@ ext4_xattr_block_cache_find(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 		bh = ext4_sb_bread(inode-&gt;i_sb, ce-&gt;e_value, REQ_PRIO);</div><div class='ctx'> 		if (IS_ERR(bh)) {</div><div class='del'>-			if (PTR_ERR(bh) == -ENOMEM)</div><div class='del'>-				return NULL;</div><div class='del'>-			bh = NULL;</div><div class='del'>-			EXT4_ERROR_INODE(inode, "block %lu read error",</div><div class='del'>-					 (unsigned long)ce-&gt;e_value);</div><div class='add'>+			if (PTR_ERR(bh) != -ENOMEM)</div><div class='add'>+				EXT4_ERROR_INODE(inode, "block %lu read error",</div><div class='add'>+						 (unsigned long)ce-&gt;e_value);</div><div class='add'>+			mb_cache_entry_put(ea_block_cache, ce);</div><div class='add'>+			return bh;</div><div class='ctx'> 		} else if (ext4_xattr_cmp(header, BHDR(bh)) == 0) {</div><div class='ctx'> 			*pce = ce;</div><div class='ctx'> 			return bh;</div><div class='hunk'>@@ -3069,7 +3149,29 @@ static __le32 ext4_xattr_hash_entry(char *name, size_t name_len, __le32 *value,</div><div class='ctx'> 	while (name_len--) {</div><div class='ctx'> 		hash = (hash &lt;&lt; NAME_HASH_SHIFT) ^</div><div class='ctx'> 		       (hash &gt;&gt; (8*sizeof(hash) - NAME_HASH_SHIFT)) ^</div><div class='del'>-		       *name++;</div><div class='add'>+		       (unsigned char)*name++;</div><div class='add'>+	}</div><div class='add'>+	while (value_count--) {</div><div class='add'>+		hash = (hash &lt;&lt; VALUE_HASH_SHIFT) ^</div><div class='add'>+		       (hash &gt;&gt; (8*sizeof(hash) - VALUE_HASH_SHIFT)) ^</div><div class='add'>+		       le32_to_cpu(*value++);</div><div class='add'>+	}</div><div class='add'>+	return cpu_to_le32(hash);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * ext4_xattr_hash_entry_signed()</div><div class='add'>+ *</div><div class='add'>+ * Compute the hash of an extended attribute incorrectly.</div><div class='add'>+ */</div><div class='add'>+static __le32 ext4_xattr_hash_entry_signed(char *name, size_t name_len, __le32 *value, size_t value_count)</div><div class='add'>+{</div><div class='add'>+	__u32 hash = 0;</div><div class='add'>+</div><div class='add'>+	while (name_len--) {</div><div class='add'>+		hash = (hash &lt;&lt; NAME_HASH_SHIFT) ^</div><div class='add'>+		       (hash &gt;&gt; (8*sizeof(hash) - NAME_HASH_SHIFT)) ^</div><div class='add'>+		       (signed char)*name++;</div><div class='ctx'> 	}</div><div class='ctx'> 	while (value_count--) {</div><div class='ctx'> 		hash = (hash &lt;&lt; VALUE_HASH_SHIFT) ^</div><div class='head'>diff --git a/fs/ext4/xattr.h b/fs/ext4/xattr.h<br/>index 77efb9a627ad..1fedf44d4fb6 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/xattr.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/xattr.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/xattr.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/xattr.h</a></div><div class='hunk'>@@ -32,8 +32,7 @@ struct ext4_xattr_header {</div><div class='ctx'> 	__le32	h_refcount;	/* reference count */</div><div class='ctx'> 	__le32	h_blocks;	/* number of disk blocks used */</div><div class='ctx'> 	__le32	h_hash;		/* hash value of all attributes */</div><div class='del'>-	__le32	h_checksum;	/* crc32c(uuid+id+xattrblock) */</div><div class='del'>-				/* id = inum if refcount=1, blknum otherwise */</div><div class='add'>+	__le32	h_checksum;	/* crc32c(uuid+blknum+xattrblock) */</div><div class='ctx'> 	__u32	h_reserved[3];	/* zero right now */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -68,6 +67,9 @@ struct ext4_xattr_entry {</div><div class='ctx'> 		((void *)raw_inode + \</div><div class='ctx'> 		EXT4_GOOD_OLD_INODE_SIZE + \</div><div class='ctx'> 		EXT4_I(inode)-&gt;i_extra_isize))</div><div class='add'>+#define ITAIL(inode, raw_inode) \</div><div class='add'>+	((void *)(raw_inode) + \</div><div class='add'>+	 EXT4_SB((inode)-&gt;i_sb)-&gt;s_inode_size)</div><div class='ctx'> #define IFIRST(hdr) ((struct ext4_xattr_entry *)((hdr)+1))</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -84,7 +86,7 @@ struct ext4_xattr_entry {</div><div class='ctx'> /*</div><div class='ctx'>  * The minimum size of EA value when you start storing it in an external inode</div><div class='ctx'>  * size of block - size of header - size of 1 entry - 4 null bytes</div><div class='del'>-*/</div><div class='add'>+ */</div><div class='ctx'> #define EXT4_XATTR_MIN_LARGE_EA_SIZE(b)					\</div><div class='ctx'> 	((b) - EXT4_XATTR_LEN(3) - sizeof(struct ext4_xattr_header) - 4)</div><div class='ctx'> </div><div class='hunk'>@@ -95,6 +97,19 @@ struct ext4_xattr_entry {</div><div class='ctx'> </div><div class='ctx'> #define EXT4_ZERO_XATTR_VALUE ((void *)-1)</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * If we want to add an xattr to the inode, we should make sure that</div><div class='add'>+ * i_extra_isize is not 0 and that the inode size is not less than</div><div class='add'>+ * EXT4_GOOD_OLD_INODE_SIZE + extra_isize + pad.</div><div class='add'>+ *   EXT4_GOOD_OLD_INODE_SIZE   extra_isize header   entry   pad  data</div><div class='add'>+ * |--------------------------|------------|------|---------|---|-------|</div><div class='add'>+ */</div><div class='add'>+#define EXT4_INODE_HAS_XATTR_SPACE(inode)				\</div><div class='add'>+	((EXT4_I(inode)-&gt;i_extra_isize != 0) &amp;&amp;				\</div><div class='add'>+	 (EXT4_GOOD_OLD_INODE_SIZE + EXT4_I(inode)-&gt;i_extra_isize +	\</div><div class='add'>+	  sizeof(struct ext4_xattr_ibody_header) + EXT4_XATTR_PAD &lt;=	\</div><div class='add'>+	  EXT4_INODE_SIZE((inode)-&gt;i_sb)))</div><div class='add'>+</div><div class='ctx'> struct ext4_xattr_info {</div><div class='ctx'> 	const char *name;</div><div class='ctx'> 	const void *value;</div><div class='hunk'>@@ -117,8 +132,8 @@ struct ext4_xattr_ibody_find {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct ext4_xattr_inode_array {</div><div class='del'>-	unsigned int count;		/* # of used items in the array */</div><div class='del'>-	struct inode *inodes[];</div><div class='add'>+	unsigned int count;</div><div class='add'>+	struct inode *inodes[] __counted_by(count);</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> extern const struct xattr_handler ext4_xattr_user_handler;</div><div class='hunk'>@@ -178,8 +193,9 @@ extern void ext4_xattr_inode_array_free(struct ext4_xattr_inode_array *array);</div><div class='ctx'> </div><div class='ctx'> extern int ext4_expand_extra_isize_ea(struct inode *inode, int new_extra_isize,</div><div class='ctx'> 			    struct ext4_inode *raw_inode, handle_t *handle);</div><div class='add'>+extern void ext4_evict_ea_inode(struct inode *inode);</div><div class='ctx'> </div><div class='del'>-extern const struct xattr_handler *ext4_xattr_handlers[];</div><div class='add'>+extern const struct xattr_handler * const ext4_xattr_handlers[];</div><div class='ctx'> </div><div class='ctx'> extern int ext4_xattr_ibody_find(struct inode *inode, struct ext4_xattr_info *i,</div><div class='ctx'> 				 struct ext4_xattr_ibody_find *is);</div><div class='hunk'>@@ -193,6 +209,13 @@ extern int ext4_xattr_ibody_set(handle_t *handle, struct inode *inode,</div><div class='ctx'> extern struct mb_cache *ext4_xattr_create_cache(void);</div><div class='ctx'> extern void ext4_xattr_destroy_cache(struct mb_cache *);</div><div class='ctx'> </div><div class='add'>+extern int</div><div class='add'>+__xattr_check_inode(struct inode *inode, struct ext4_xattr_ibody_header *header,</div><div class='add'>+		    void *end, const char *function, unsigned int line);</div><div class='add'>+</div><div class='add'>+#define xattr_check_inode(inode, header, end) \</div><div class='add'>+	__xattr_check_inode((inode), (header), (end), __func__, __LINE__)</div><div class='add'>+</div><div class='ctx'> #ifdef CONFIG_EXT4_FS_SECURITY</div><div class='ctx'> extern int ext4_init_security(handle_t *handle, struct inode *inode,</div><div class='ctx'> 			      struct inode *dir, const struct qstr *qstr);</div><div class='head'>diff --git a/fs/ext4/xattr_hurd.c b/fs/ext4/xattr_hurd.c<br/>index c78df5790377..8a5842e4cd95 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/xattr_hurd.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/xattr_hurd.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/xattr_hurd.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/xattr_hurd.c</a></div><div class='hunk'>@@ -32,7 +32,7 @@ ext4_xattr_hurd_get(const struct xattr_handler *handler,</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='ctx'> ext4_xattr_hurd_set(const struct xattr_handler *handler,</div><div class='del'>-		    struct user_namespace *mnt_userns,</div><div class='add'>+		    struct mnt_idmap *idmap,</div><div class='ctx'> 		    struct dentry *unused, struct inode *inode,</div><div class='ctx'> 		    const char *name, const void *value,</div><div class='ctx'> 		    size_t size, int flags)</div><div class='head'>diff --git a/fs/ext4/xattr_security.c b/fs/ext4/xattr_security.c<br/>index 8213f66f7b2d..776cf11d24ca 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/xattr_security.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/xattr_security.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/xattr_security.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/xattr_security.c</a></div><div class='hunk'>@@ -23,7 +23,7 @@ ext4_xattr_security_get(const struct xattr_handler *handler,</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='ctx'> ext4_xattr_security_set(const struct xattr_handler *handler,</div><div class='del'>-			struct user_namespace *mnt_userns,</div><div class='add'>+			struct mnt_idmap *idmap,</div><div class='ctx'> 			struct dentry *unused, struct inode *inode,</div><div class='ctx'> 			const char *name, const void *value,</div><div class='ctx'> 			size_t size, int flags)</div><div class='head'>diff --git a/fs/ext4/xattr_trusted.c b/fs/ext4/xattr_trusted.c<br/>index 7c21ffb26d25..9811eb0ab276 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/xattr_trusted.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/xattr_trusted.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/xattr_trusted.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/xattr_trusted.c</a></div><div class='hunk'>@@ -30,7 +30,7 @@ ext4_xattr_trusted_get(const struct xattr_handler *handler,</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='ctx'> ext4_xattr_trusted_set(const struct xattr_handler *handler,</div><div class='del'>-		       struct user_namespace *mnt_userns,</div><div class='add'>+		       struct mnt_idmap *idmap,</div><div class='ctx'> 		       struct dentry *unused, struct inode *inode,</div><div class='ctx'> 		       const char *name, const void *value,</div><div class='ctx'> 		       size_t size, int flags)</div><div class='head'>diff --git a/fs/ext4/xattr_user.c b/fs/ext4/xattr_user.c<br/>index 2fe7ff0a479c..4b70bf4e7626 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ext4/xattr_user.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ext4/xattr_user.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ext4/xattr_user.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ext4/xattr_user.c</a></div><div class='hunk'>@@ -31,7 +31,7 @@ ext4_xattr_user_get(const struct xattr_handler *handler,</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='ctx'> ext4_xattr_user_set(const struct xattr_handler *handler,</div><div class='del'>-		    struct user_namespace *mnt_userns,</div><div class='add'>+		    struct mnt_idmap *idmap,</div><div class='ctx'> 		    struct dentry *unused, struct inode *inode,</div><div class='ctx'> 		    const char *name, const void *value,</div><div class='ctx'> 		    size_t size, int flags)</div><div class='head'>diff --git a/fs/f2fs/Kconfig b/fs/f2fs/Kconfig<br/>index 7eea3cfd894d..5916a02fb46d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/Kconfig</a></div><div class='hunk'>@@ -2,11 +2,12 @@</div><div class='ctx'> config F2FS_FS</div><div class='ctx'> 	tristate "F2FS filesystem support"</div><div class='ctx'> 	depends on BLOCK</div><div class='add'>+	select BUFFER_HEAD</div><div class='ctx'> 	select NLS</div><div class='del'>-	select CRYPTO</div><div class='del'>-	select CRYPTO_CRC32</div><div class='add'>+	select CRC32</div><div class='ctx'> 	select F2FS_FS_XATTR if FS_ENCRYPTION</div><div class='ctx'> 	select FS_ENCRYPTION_ALGS if FS_ENCRYPTION</div><div class='add'>+	select FS_IOMAP</div><div class='ctx'> 	select LZ4_COMPRESS if F2FS_FS_LZ4</div><div class='ctx'> 	select LZ4_DECOMPRESS if F2FS_FS_LZ4</div><div class='ctx'> 	select LZ4HC_COMPRESS if F2FS_FS_LZ4HC</div><div class='hunk'>@@ -142,3 +143,10 @@ config F2FS_IOSTAT</div><div class='ctx'> 	  Support getting IO statistics through sysfs and printing out periodic</div><div class='ctx'> 	  IO statistics tracepoint events. You have to turn on "iostat_enable"</div><div class='ctx'> 	  sysfs node to enable this feature.</div><div class='add'>+</div><div class='add'>+config F2FS_UNFAIR_RWSEM</div><div class='add'>+	bool "F2FS unfair rw_semaphore"</div><div class='add'>+	depends on F2FS_FS &amp;&amp; BLK_CGROUP</div><div class='add'>+	help</div><div class='add'>+	  Use unfair rw_semaphore, if system configured IO priority by block</div><div class='add'>+	  cgroup.</div><div class='head'>diff --git a/fs/f2fs/acl.c b/fs/f2fs/acl.c<br/>index 16e826e01f09..fa8d81a30fb9 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/acl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/acl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/acl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/acl.c</a></div><div class='hunk'>@@ -9,6 +9,7 @@</div><div class='ctx'>  *</div><div class='ctx'>  * Copyright (C) 2001-2003 Andreas Gruenbacher, &lt;agruen@suse.de&gt;</div><div class='ctx'>  */</div><div class='add'>+#include &lt;linux/fs_struct.h&gt;</div><div class='ctx'> #include &lt;linux/f2fs_fs.h&gt;</div><div class='ctx'> #include "f2fs.h"</div><div class='ctx'> #include "xattr.h"</div><div class='hunk'>@@ -166,7 +167,7 @@ fail:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct posix_acl *__f2fs_get_acl(struct inode *inode, int type,</div><div class='del'>-						struct page *dpage)</div><div class='add'>+						struct folio *dfolio)</div><div class='ctx'> {</div><div class='ctx'> 	int name_index = F2FS_XATTR_INDEX_POSIX_ACL_DEFAULT;</div><div class='ctx'> 	void *value = NULL;</div><div class='hunk'>@@ -176,13 +177,13 @@ static struct posix_acl *__f2fs_get_acl(struct inode *inode, int type,</div><div class='ctx'> 	if (type == ACL_TYPE_ACCESS)</div><div class='ctx'> 		name_index = F2FS_XATTR_INDEX_POSIX_ACL_ACCESS;</div><div class='ctx'> </div><div class='del'>-	retval = f2fs_getxattr(inode, name_index, "", NULL, 0, dpage);</div><div class='add'>+	retval = f2fs_getxattr(inode, name_index, "", NULL, 0, dfolio);</div><div class='ctx'> 	if (retval &gt; 0) {</div><div class='ctx'> 		value = f2fs_kmalloc(F2FS_I_SB(inode), retval, GFP_F2FS_ZERO);</div><div class='ctx'> 		if (!value)</div><div class='ctx'> 			return ERR_PTR(-ENOMEM);</div><div class='ctx'> 		retval = f2fs_getxattr(inode, name_index, "", value,</div><div class='del'>-							retval, dpage);</div><div class='add'>+							retval, dfolio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (retval &gt; 0)</div><div class='hunk'>@@ -204,8 +205,9 @@ struct posix_acl *f2fs_get_acl(struct inode *inode, int type, bool rcu)</div><div class='ctx'> 	return __f2fs_get_acl(inode, type, NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_acl_update_mode(struct inode *inode, umode_t *mode_p,</div><div class='del'>-			  struct posix_acl **acl)</div><div class='add'>+static int f2fs_acl_update_mode(struct mnt_idmap *idmap,</div><div class='add'>+				struct inode *inode, umode_t *mode_p,</div><div class='add'>+				struct posix_acl **acl)</div><div class='ctx'> {</div><div class='ctx'> 	umode_t mode = inode-&gt;i_mode;</div><div class='ctx'> 	int error;</div><div class='hunk'>@@ -218,15 +220,15 @@ static int f2fs_acl_update_mode(struct inode *inode, umode_t *mode_p,</div><div class='ctx'> 		return error;</div><div class='ctx'> 	if (error == 0)</div><div class='ctx'> 		*acl = NULL;</div><div class='del'>-	if (!in_group_p(i_gid_into_mnt(&amp;init_user_ns, inode)) &amp;&amp;</div><div class='del'>-	    !capable_wrt_inode_uidgid(&amp;init_user_ns, inode, CAP_FSETID))</div><div class='add'>+	if (!in_group_or_capable(idmap, inode, i_gid_into_vfsgid(idmap, inode)))</div><div class='ctx'> 		mode &amp;= ~S_ISGID;</div><div class='ctx'> 	*mode_p = mode;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __f2fs_set_acl(struct inode *inode, int type,</div><div class='del'>-			struct posix_acl *acl, struct page *ipage)</div><div class='add'>+static int __f2fs_set_acl(struct mnt_idmap *idmap,</div><div class='add'>+			struct inode *inode, int type,</div><div class='add'>+			struct posix_acl *acl, struct folio *ifolio)</div><div class='ctx'> {</div><div class='ctx'> 	int name_index;</div><div class='ctx'> 	void *value = NULL;</div><div class='hunk'>@@ -237,8 +239,8 @@ static int __f2fs_set_acl(struct inode *inode, int type,</div><div class='ctx'> 	switch (type) {</div><div class='ctx'> 	case ACL_TYPE_ACCESS:</div><div class='ctx'> 		name_index = F2FS_XATTR_INDEX_POSIX_ACL_ACCESS;</div><div class='del'>-		if (acl &amp;&amp; !ipage) {</div><div class='del'>-			error = f2fs_acl_update_mode(inode, &amp;mode, &amp;acl);</div><div class='add'>+		if (acl &amp;&amp; !ifolio) {</div><div class='add'>+			error = f2fs_acl_update_mode(idmap, inode, &amp;mode, &amp;acl);</div><div class='ctx'> 			if (error)</div><div class='ctx'> 				return error;</div><div class='ctx'> 			set_acl_inode(inode, mode);</div><div class='hunk'>@@ -263,7 +265,7 @@ static int __f2fs_set_acl(struct inode *inode, int type,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	error = f2fs_setxattr(inode, name_index, "", value, size, ipage, 0);</div><div class='add'>+	error = f2fs_setxattr(inode, name_index, "", value, size, ifolio, 0);</div><div class='ctx'> </div><div class='ctx'> 	kfree(value);</div><div class='ctx'> 	if (!error)</div><div class='hunk'>@@ -273,13 +275,15 @@ static int __f2fs_set_acl(struct inode *inode, int type,</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int f2fs_set_acl(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='add'>+int f2fs_set_acl(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		 struct posix_acl *acl, int type)</div><div class='ctx'> {</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='add'>+</div><div class='ctx'> 	if (unlikely(f2fs_cp_error(F2FS_I_SB(inode))))</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> </div><div class='del'>-	return __f2fs_set_acl(inode, type, acl, NULL);</div><div class='add'>+	return __f2fs_set_acl(idmap, inode, type, acl, NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -292,9 +296,8 @@ static struct posix_acl *f2fs_acl_clone(const struct posix_acl *acl,</div><div class='ctx'> 	struct posix_acl *clone = NULL;</div><div class='ctx'> </div><div class='ctx'> 	if (acl) {</div><div class='del'>-		int size = sizeof(struct posix_acl) + acl-&gt;a_count *</div><div class='del'>-				sizeof(struct posix_acl_entry);</div><div class='del'>-		clone = kmemdup(acl, size, flags);</div><div class='add'>+		clone = kmemdup(acl, struct_size(acl, a_entries, acl-&gt;a_count),</div><div class='add'>+				flags);</div><div class='ctx'> 		if (clone)</div><div class='ctx'> 			refcount_set(&amp;clone-&gt;a_refcount, 1);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -357,7 +360,7 @@ static int f2fs_acl_create_masq(struct posix_acl *acl, umode_t *mode_p)</div><div class='ctx'> </div><div class='ctx'> static int f2fs_acl_create(struct inode *dir, umode_t *mode,</div><div class='ctx'> 		struct posix_acl **default_acl, struct posix_acl **acl,</div><div class='del'>-		struct page *dpage)</div><div class='add'>+		struct folio *dfolio)</div><div class='ctx'> {</div><div class='ctx'> 	struct posix_acl *p;</div><div class='ctx'> 	struct posix_acl *clone;</div><div class='hunk'>@@ -369,7 +372,7 @@ static int f2fs_acl_create(struct inode *dir, umode_t *mode,</div><div class='ctx'> 	if (S_ISLNK(*mode) || !IS_POSIXACL(dir))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	p = __f2fs_get_acl(dir, ACL_TYPE_DEFAULT, dpage);</div><div class='add'>+	p = __f2fs_get_acl(dir, ACL_TYPE_DEFAULT, dfolio);</div><div class='ctx'> 	if (!p || p == ERR_PTR(-EOPNOTSUPP)) {</div><div class='ctx'> 		*mode &amp;= ~current_umask();</div><div class='ctx'> 		return 0;</div><div class='hunk'>@@ -406,29 +409,29 @@ release_acl:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int f2fs_init_acl(struct inode *inode, struct inode *dir, struct page *ipage,</div><div class='del'>-							struct page *dpage)</div><div class='add'>+int f2fs_init_acl(struct inode *inode, struct inode *dir, struct folio *ifolio,</div><div class='add'>+							struct folio *dfolio)</div><div class='ctx'> {</div><div class='ctx'> 	struct posix_acl *default_acl = NULL, *acl = NULL;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	error = f2fs_acl_create(dir, &amp;inode-&gt;i_mode, &amp;default_acl, &amp;acl, dpage);</div><div class='add'>+	error = f2fs_acl_create(dir, &amp;inode-&gt;i_mode, &amp;default_acl, &amp;acl, dfolio);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='ctx'> 	f2fs_mark_inode_dirty_sync(inode, true);</div><div class='ctx'> </div><div class='ctx'> 	if (default_acl) {</div><div class='del'>-		error = __f2fs_set_acl(inode, ACL_TYPE_DEFAULT, default_acl,</div><div class='del'>-				       ipage);</div><div class='add'>+		error = __f2fs_set_acl(NULL, inode, ACL_TYPE_DEFAULT,</div><div class='add'>+				default_acl, ifolio);</div><div class='ctx'> 		posix_acl_release(default_acl);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		inode-&gt;i_default_acl = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (acl) {</div><div class='ctx'> 		if (!error)</div><div class='del'>-			error = __f2fs_set_acl(inode, ACL_TYPE_ACCESS, acl,</div><div class='del'>-					       ipage);</div><div class='add'>+			error = __f2fs_set_acl(NULL, inode, ACL_TYPE_ACCESS,</div><div class='add'>+					acl, ifolio);</div><div class='ctx'> 		posix_acl_release(acl);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		inode-&gt;i_acl = NULL;</div><div class='head'>diff --git a/fs/f2fs/acl.h b/fs/f2fs/acl.h<br/>index a26e33cab4ff..20e87e63c089 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/acl.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/acl.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/acl.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/acl.h</a></div><div class='hunk'>@@ -33,17 +33,17 @@ struct f2fs_acl_header {</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_F2FS_FS_POSIX_ACL</div><div class='ctx'> </div><div class='del'>-extern struct posix_acl *f2fs_get_acl(struct inode *, int, bool);</div><div class='del'>-extern int f2fs_set_acl(struct user_namespace *, struct inode *,</div><div class='add'>+struct posix_acl *f2fs_get_acl(struct inode *, int, bool);</div><div class='add'>+int f2fs_set_acl(struct mnt_idmap *, struct dentry *,</div><div class='ctx'> 			struct posix_acl *, int);</div><div class='del'>-extern int f2fs_init_acl(struct inode *, struct inode *, struct page *,</div><div class='del'>-							struct page *);</div><div class='add'>+int f2fs_init_acl(struct inode *, struct inode *, struct folio *ifolio,</div><div class='add'>+		struct folio *dfolio);</div><div class='ctx'> #else</div><div class='ctx'> #define f2fs_get_acl	NULL</div><div class='ctx'> #define f2fs_set_acl	NULL</div><div class='ctx'> </div><div class='ctx'> static inline int f2fs_init_acl(struct inode *inode, struct inode *dir,</div><div class='del'>-				struct page *ipage, struct page *dpage)</div><div class='add'>+				struct folio *ifolio, struct folio *dfolio)</div><div class='ctx'> {</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/f2fs/checkpoint.c b/fs/f2fs/checkpoint.c<br/>index f1693d45bb78..300664269eb6 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/checkpoint.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/checkpoint.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/checkpoint.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/checkpoint.c</a></div><div class='hunk'>@@ -21,43 +21,44 @@</div><div class='ctx'> #include "iostat.h"</div><div class='ctx'> #include &lt;trace/events/f2fs.h&gt;</div><div class='ctx'> </div><div class='del'>-#define DEFAULT_CHECKPOINT_IOPRIO (IOPRIO_PRIO_VALUE(IOPRIO_CLASS_BE, 3))</div><div class='add'>+#define DEFAULT_CHECKPOINT_IOPRIO (IOPRIO_PRIO_VALUE(IOPRIO_CLASS_RT, 3))</div><div class='ctx'> </div><div class='ctx'> static struct kmem_cache *ino_entry_slab;</div><div class='ctx'> struct kmem_cache *f2fs_inode_entry_slab;</div><div class='ctx'> </div><div class='del'>-void f2fs_stop_checkpoint(struct f2fs_sb_info *sbi, bool end_io)</div><div class='add'>+void f2fs_stop_checkpoint(struct f2fs_sb_info *sbi, bool end_io,</div><div class='add'>+						unsigned char reason)</div><div class='ctx'> {</div><div class='del'>-	f2fs_build_fault_attr(sbi, 0, 0);</div><div class='del'>-	set_ckpt_flags(sbi, CP_ERROR_FLAG);</div><div class='add'>+	f2fs_build_fault_attr(sbi, 0, 0, FAULT_ALL);</div><div class='ctx'> 	if (!end_io)</div><div class='ctx'> 		f2fs_flush_merged_writes(sbi);</div><div class='add'>+	f2fs_handle_critical_error(sbi, reason);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * We guarantee no failure on the returned page.</div><div class='ctx'>  */</div><div class='del'>-struct page *f2fs_grab_meta_page(struct f2fs_sb_info *sbi, pgoff_t index)</div><div class='add'>+struct folio *f2fs_grab_meta_folio(struct f2fs_sb_info *sbi, pgoff_t index)</div><div class='ctx'> {</div><div class='ctx'> 	struct address_space *mapping = META_MAPPING(sbi);</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> repeat:</div><div class='del'>-	page = f2fs_grab_cache_page(mapping, index, false);</div><div class='del'>-	if (!page) {</div><div class='add'>+	folio = f2fs_grab_cache_folio(mapping, index, false);</div><div class='add'>+	if (IS_ERR(folio)) {</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 		goto repeat;</div><div class='ctx'> 	}</div><div class='del'>-	f2fs_wait_on_page_writeback(page, META, true, true);</div><div class='del'>-	if (!PageUptodate(page))</div><div class='del'>-		SetPageUptodate(page);</div><div class='del'>-	return page;</div><div class='add'>+	f2fs_folio_wait_writeback(folio, META, true, true);</div><div class='add'>+	if (!folio_test_uptodate(folio))</div><div class='add'>+		folio_mark_uptodate(folio);</div><div class='add'>+	return folio;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct page *__get_meta_page(struct f2fs_sb_info *sbi, pgoff_t index,</div><div class='add'>+static struct folio *__get_meta_folio(struct f2fs_sb_info *sbi, pgoff_t index,</div><div class='ctx'> 							bool is_meta)</div><div class='ctx'> {</div><div class='ctx'> 	struct address_space *mapping = META_MAPPING(sbi);</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	struct f2fs_io_info fio = {</div><div class='ctx'> 		.sbi = sbi,</div><div class='ctx'> 		.type = META,</div><div class='hunk'>@@ -66,70 +67,71 @@ static struct page *__get_meta_page(struct f2fs_sb_info *sbi, pgoff_t index,</div><div class='ctx'> 		.old_blkaddr = index,</div><div class='ctx'> 		.new_blkaddr = index,</div><div class='ctx'> 		.encrypted_page = NULL,</div><div class='del'>-		.is_por = !is_meta,</div><div class='add'>+		.is_por = !is_meta ? 1 : 0,</div><div class='ctx'> 	};</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(!is_meta))</div><div class='ctx'> 		fio.op_flags &amp;= ~REQ_META;</div><div class='ctx'> repeat:</div><div class='del'>-	page = f2fs_grab_cache_page(mapping, index, false);</div><div class='del'>-	if (!page) {</div><div class='add'>+	folio = f2fs_grab_cache_folio(mapping, index, false);</div><div class='add'>+	if (IS_ERR(folio)) {</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 		goto repeat;</div><div class='ctx'> 	}</div><div class='del'>-	if (PageUptodate(page))</div><div class='add'>+	if (folio_test_uptodate(folio))</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	fio.page = page;</div><div class='add'>+	fio.folio = folio;</div><div class='ctx'> </div><div class='ctx'> 	err = f2fs_submit_page_bio(&amp;fio);</div><div class='ctx'> 	if (err) {</div><div class='del'>-		f2fs_put_page(page, 1);</div><div class='add'>+		f2fs_folio_put(folio, true);</div><div class='ctx'> 		return ERR_PTR(err);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	f2fs_update_iostat(sbi, FS_META_READ_IO, F2FS_BLKSIZE);</div><div class='add'>+	f2fs_update_iostat(sbi, NULL, FS_META_READ_IO, F2FS_BLKSIZE);</div><div class='ctx'> </div><div class='del'>-	lock_page(page);</div><div class='del'>-	if (unlikely(page-&gt;mapping != mapping)) {</div><div class='del'>-		f2fs_put_page(page, 1);</div><div class='add'>+	folio_lock(folio);</div><div class='add'>+	if (unlikely(!is_meta_folio(folio))) {</div><div class='add'>+		f2fs_folio_put(folio, true);</div><div class='ctx'> 		goto repeat;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (unlikely(!PageUptodate(page))) {</div><div class='del'>-		f2fs_put_page(page, 1);</div><div class='add'>+	if (unlikely(!folio_test_uptodate(folio))) {</div><div class='add'>+		f2fs_handle_page_eio(sbi, folio, META);</div><div class='add'>+		f2fs_folio_put(folio, true);</div><div class='ctx'> 		return ERR_PTR(-EIO);</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='del'>-	return page;</div><div class='add'>+	return folio;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct page *f2fs_get_meta_page(struct f2fs_sb_info *sbi, pgoff_t index)</div><div class='add'>+struct folio *f2fs_get_meta_folio(struct f2fs_sb_info *sbi, pgoff_t index)</div><div class='ctx'> {</div><div class='del'>-	return __get_meta_page(sbi, index, true);</div><div class='add'>+	return __get_meta_folio(sbi, index, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct page *f2fs_get_meta_page_retry(struct f2fs_sb_info *sbi, pgoff_t index)</div><div class='add'>+struct folio *f2fs_get_meta_folio_retry(struct f2fs_sb_info *sbi, pgoff_t index)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	int count = 0;</div><div class='ctx'> </div><div class='ctx'> retry:</div><div class='del'>-	page = __get_meta_page(sbi, index, true);</div><div class='del'>-	if (IS_ERR(page)) {</div><div class='del'>-		if (PTR_ERR(page) == -EIO &amp;&amp;</div><div class='add'>+	folio = __get_meta_folio(sbi, index, true);</div><div class='add'>+	if (IS_ERR(folio)) {</div><div class='add'>+		if (PTR_ERR(folio) == -EIO &amp;&amp;</div><div class='ctx'> 				++count &lt;= DEFAULT_RETRY_IO_COUNT)</div><div class='ctx'> 			goto retry;</div><div class='del'>-		f2fs_stop_checkpoint(sbi, false);</div><div class='add'>+		f2fs_stop_checkpoint(sbi, false, STOP_CP_REASON_META_PAGE);</div><div class='ctx'> 	}</div><div class='del'>-	return page;</div><div class='add'>+	return folio;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* for POR only */</div><div class='del'>-struct page *f2fs_get_tmp_page(struct f2fs_sb_info *sbi, pgoff_t index)</div><div class='add'>+struct folio *f2fs_get_tmp_folio(struct f2fs_sb_info *sbi, pgoff_t index)</div><div class='ctx'> {</div><div class='del'>-	return __get_meta_page(sbi, index, false);</div><div class='add'>+	return __get_meta_folio(sbi, index, false);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool __is_bitmap_valid(struct f2fs_sb_info *sbi, block_t blkaddr,</div><div class='hunk'>@@ -139,7 +141,7 @@ static bool __is_bitmap_valid(struct f2fs_sb_info *sbi, block_t blkaddr,</div><div class='ctx'> 	unsigned int segno, offset;</div><div class='ctx'> 	bool exist;</div><div class='ctx'> </div><div class='del'>-	if (type != DATA_GENERIC_ENHANCE &amp;&amp; type != DATA_GENERIC_ENHANCE_READ)</div><div class='add'>+	if (type == DATA_GENERIC)</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='ctx'> 	segno = GET_SEGNO(sbi, blkaddr);</div><div class='hunk'>@@ -147,16 +149,29 @@ static bool __is_bitmap_valid(struct f2fs_sb_info *sbi, block_t blkaddr,</div><div class='ctx'> 	se = get_seg_entry(sbi, segno);</div><div class='ctx'> </div><div class='ctx'> 	exist = f2fs_test_bit(offset, se-&gt;cur_valid_map);</div><div class='del'>-	if (!exist &amp;&amp; type == DATA_GENERIC_ENHANCE) {</div><div class='del'>-		f2fs_err(sbi, "Inconsistent error blkaddr:%u, sit bitmap:%d",</div><div class='del'>-			 blkaddr, exist);</div><div class='del'>-		set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='del'>-		WARN_ON(1);</div><div class='del'>-	}</div><div class='add'>+</div><div class='add'>+	/* skip data, if we already have an error in checkpoint. */</div><div class='add'>+	if (unlikely(f2fs_cp_error(sbi)))</div><div class='add'>+		return exist;</div><div class='add'>+</div><div class='add'>+	if ((exist &amp;&amp; type == DATA_GENERIC_ENHANCE_UPDATE) ||</div><div class='add'>+		(!exist &amp;&amp; type == DATA_GENERIC_ENHANCE))</div><div class='add'>+		goto out_err;</div><div class='add'>+	if (!exist &amp;&amp; type != DATA_GENERIC_ENHANCE_UPDATE)</div><div class='add'>+		goto out_handle;</div><div class='add'>+	return exist;</div><div class='add'>+</div><div class='add'>+out_err:</div><div class='add'>+	f2fs_err(sbi, "Inconsistent error blkaddr:%u, sit bitmap:%d",</div><div class='add'>+		 blkaddr, exist);</div><div class='add'>+	set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='add'>+	dump_stack();</div><div class='add'>+out_handle:</div><div class='add'>+	f2fs_handle_error(sbi, ERROR_INVALID_BLKADDR);</div><div class='ctx'> 	return exist;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-bool f2fs_is_valid_blkaddr(struct f2fs_sb_info *sbi,</div><div class='add'>+static bool __f2fs_is_valid_blkaddr(struct f2fs_sb_info *sbi,</div><div class='ctx'> 					block_t blkaddr, int type)</div><div class='ctx'> {</div><div class='ctx'> 	switch (type) {</div><div class='hunk'>@@ -164,33 +179,39 @@ bool f2fs_is_valid_blkaddr(struct f2fs_sb_info *sbi,</div><div class='ctx'> 		break;</div><div class='ctx'> 	case META_SIT:</div><div class='ctx'> 		if (unlikely(blkaddr &gt;= SIT_BLK_CNT(sbi)))</div><div class='del'>-			return false;</div><div class='add'>+			goto check_only;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case META_SSA:</div><div class='ctx'> 		if (unlikely(blkaddr &gt;= MAIN_BLKADDR(sbi) ||</div><div class='ctx'> 			blkaddr &lt; SM_I(sbi)-&gt;ssa_blkaddr))</div><div class='del'>-			return false;</div><div class='add'>+			goto check_only;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case META_CP:</div><div class='ctx'> 		if (unlikely(blkaddr &gt;= SIT_I(sbi)-&gt;sit_base_addr ||</div><div class='ctx'> 			blkaddr &lt; __start_cp_addr(sbi)))</div><div class='del'>-			return false;</div><div class='add'>+			goto check_only;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case META_POR:</div><div class='ctx'> 		if (unlikely(blkaddr &gt;= MAX_BLKADDR(sbi) ||</div><div class='ctx'> 			blkaddr &lt; MAIN_BLKADDR(sbi)))</div><div class='del'>-			return false;</div><div class='add'>+			goto check_only;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case DATA_GENERIC:</div><div class='ctx'> 	case DATA_GENERIC_ENHANCE:</div><div class='ctx'> 	case DATA_GENERIC_ENHANCE_READ:</div><div class='add'>+	case DATA_GENERIC_ENHANCE_UPDATE:</div><div class='ctx'> 		if (unlikely(blkaddr &gt;= MAX_BLKADDR(sbi) ||</div><div class='ctx'> 				blkaddr &lt; MAIN_BLKADDR(sbi))) {</div><div class='add'>+</div><div class='add'>+			/* Skip to emit an error message. */</div><div class='add'>+			if (unlikely(f2fs_cp_error(sbi)))</div><div class='add'>+				return false;</div><div class='add'>+</div><div class='ctx'> 			f2fs_warn(sbi, "access invalid blkaddr:%u",</div><div class='ctx'> 				  blkaddr);</div><div class='ctx'> 			set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='del'>-			WARN_ON(1);</div><div class='del'>-			return false;</div><div class='add'>+			dump_stack();</div><div class='add'>+			goto err;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			return __is_bitmap_valid(sbi, blkaddr, type);</div><div class='ctx'> 		}</div><div class='hunk'>@@ -198,13 +219,31 @@ bool f2fs_is_valid_blkaddr(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	case META_GENERIC:</div><div class='ctx'> 		if (unlikely(blkaddr &lt; SEG0_BLKADDR(sbi) ||</div><div class='ctx'> 			blkaddr &gt;= MAIN_BLKADDR(sbi)))</div><div class='del'>-			return false;</div><div class='add'>+			goto err;</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		BUG();</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return true;</div><div class='add'>+err:</div><div class='add'>+	f2fs_handle_error(sbi, ERROR_INVALID_BLKADDR);</div><div class='add'>+check_only:</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool f2fs_is_valid_blkaddr(struct f2fs_sb_info *sbi,</div><div class='add'>+					block_t blkaddr, int type)</div><div class='add'>+{</div><div class='add'>+	if (time_to_inject(sbi, FAULT_BLKADDR_VALIDITY))</div><div class='add'>+		return false;</div><div class='add'>+	return __f2fs_is_valid_blkaddr(sbi, blkaddr, type);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool f2fs_is_valid_blkaddr_raw(struct f2fs_sb_info *sbi,</div><div class='add'>+					block_t blkaddr, int type)</div><div class='add'>+{</div><div class='add'>+	return __f2fs_is_valid_blkaddr(sbi, blkaddr, type);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -213,7 +252,6 @@ bool f2fs_is_valid_blkaddr(struct f2fs_sb_info *sbi,</div><div class='ctx'> int f2fs_ra_meta_pages(struct f2fs_sb_info *sbi, block_t start, int nrpages,</div><div class='ctx'> 							int type, bool sync)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='ctx'> 	block_t blkno = start;</div><div class='ctx'> 	struct f2fs_io_info fio = {</div><div class='ctx'> 		.sbi = sbi,</div><div class='hunk'>@@ -221,8 +259,8 @@ int f2fs_ra_meta_pages(struct f2fs_sb_info *sbi, block_t start, int nrpages,</div><div class='ctx'> 		.op = REQ_OP_READ,</div><div class='ctx'> 		.op_flags = sync ? (REQ_META | REQ_PRIO) : REQ_RAHEAD,</div><div class='ctx'> 		.encrypted_page = NULL,</div><div class='del'>-		.in_list = false,</div><div class='del'>-		.is_por = (type == META_POR),</div><div class='add'>+		.in_list = 0,</div><div class='add'>+		.is_por = (type == META_POR) ? 1 : 0,</div><div class='ctx'> 	};</div><div class='ctx'> 	struct blk_plug plug;</div><div class='ctx'> 	int err;</div><div class='hunk'>@@ -232,6 +270,7 @@ int f2fs_ra_meta_pages(struct f2fs_sb_info *sbi, block_t start, int nrpages,</div><div class='ctx'> </div><div class='ctx'> 	blk_start_plug(&amp;plug);</div><div class='ctx'> 	for (; nrpages-- &gt; 0; blkno++) {</div><div class='add'>+		struct folio *folio;</div><div class='ctx'> </div><div class='ctx'> 		if (!f2fs_is_valid_blkaddr(sbi, blkno, type))</div><div class='ctx'> 			goto out;</div><div class='hunk'>@@ -261,78 +300,79 @@ int f2fs_ra_meta_pages(struct f2fs_sb_info *sbi, block_t start, int nrpages,</div><div class='ctx'> 			BUG();</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		page = f2fs_grab_cache_page(META_MAPPING(sbi),</div><div class='add'>+		folio = f2fs_grab_cache_folio(META_MAPPING(sbi),</div><div class='ctx'> 						fio.new_blkaddr, false);</div><div class='del'>-		if (!page)</div><div class='add'>+		if (IS_ERR(folio))</div><div class='ctx'> 			continue;</div><div class='del'>-		if (PageUptodate(page)) {</div><div class='del'>-			f2fs_put_page(page, 1);</div><div class='add'>+		if (folio_test_uptodate(folio)) {</div><div class='add'>+			f2fs_folio_put(folio, true);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		fio.page = page;</div><div class='add'>+		fio.folio = folio;</div><div class='ctx'> 		err = f2fs_submit_page_bio(&amp;fio);</div><div class='del'>-		f2fs_put_page(page, err ? 1 : 0);</div><div class='add'>+		f2fs_folio_put(folio, err ? true : false);</div><div class='ctx'> </div><div class='ctx'> 		if (!err)</div><div class='del'>-			f2fs_update_iostat(sbi, FS_META_READ_IO, F2FS_BLKSIZE);</div><div class='add'>+			f2fs_update_iostat(sbi, NULL, FS_META_READ_IO,</div><div class='add'>+							F2FS_BLKSIZE);</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='ctx'> 	blk_finish_plug(&amp;plug);</div><div class='ctx'> 	return blkno - start;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_ra_meta_pages_cond(struct f2fs_sb_info *sbi, pgoff_t index)</div><div class='add'>+void f2fs_ra_meta_pages_cond(struct f2fs_sb_info *sbi, pgoff_t index,</div><div class='add'>+							unsigned int ra_blocks)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	bool readahead = false;</div><div class='ctx'> </div><div class='del'>-	page = find_get_page(META_MAPPING(sbi), index);</div><div class='del'>-	if (!page || !PageUptodate(page))</div><div class='add'>+	if (ra_blocks == RECOVERY_MIN_RA_BLOCKS)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	folio = filemap_get_folio(META_MAPPING(sbi), index);</div><div class='add'>+	if (IS_ERR(folio) || !folio_test_uptodate(folio))</div><div class='ctx'> 		readahead = true;</div><div class='del'>-	f2fs_put_page(page, 0);</div><div class='add'>+	f2fs_folio_put(folio, false);</div><div class='ctx'> </div><div class='ctx'> 	if (readahead)</div><div class='del'>-		f2fs_ra_meta_pages(sbi, index, BIO_MAX_VECS, META_POR, true);</div><div class='add'>+		f2fs_ra_meta_pages(sbi, index, ra_blocks, META_POR, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __f2fs_write_meta_page(struct page *page,</div><div class='add'>+static bool __f2fs_write_meta_folio(struct folio *folio,</div><div class='ctx'> 				struct writeback_control *wbc,</div><div class='ctx'> 				enum iostat_type io_type)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_sb_info *sbi = F2FS_P_SB(page);</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_F_SB(folio);</div><div class='ctx'> </div><div class='del'>-	trace_f2fs_writepage(page, META);</div><div class='add'>+	trace_f2fs_writepage(folio, META);</div><div class='ctx'> </div><div class='del'>-	if (unlikely(f2fs_cp_error(sbi)))</div><div class='add'>+	if (unlikely(f2fs_cp_error(sbi))) {</div><div class='add'>+		if (is_sbi_flag_set(sbi, SBI_IS_CLOSE)) {</div><div class='add'>+			folio_clear_uptodate(folio);</div><div class='add'>+			dec_page_count(sbi, F2FS_DIRTY_META);</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+			return true;</div><div class='add'>+		}</div><div class='ctx'> 		goto redirty_out;</div><div class='add'>+	}</div><div class='ctx'> 	if (unlikely(is_sbi_flag_set(sbi, SBI_POR_DOING)))</div><div class='ctx'> 		goto redirty_out;</div><div class='del'>-	if (wbc-&gt;for_reclaim &amp;&amp; page-&gt;index &lt; GET_SUM_BLOCK(sbi, 0))</div><div class='del'>-		goto redirty_out;</div><div class='ctx'> </div><div class='del'>-	f2fs_do_write_meta_page(sbi, page, io_type);</div><div class='add'>+	f2fs_do_write_meta_page(sbi, folio, io_type);</div><div class='ctx'> 	dec_page_count(sbi, F2FS_DIRTY_META);</div><div class='ctx'> </div><div class='del'>-	if (wbc-&gt;for_reclaim)</div><div class='del'>-		f2fs_submit_merged_write_cond(sbi, NULL, page, 0, META);</div><div class='del'>-</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(f2fs_cp_error(sbi)))</div><div class='ctx'> 		f2fs_submit_merged_write(sbi, META);</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+	return true;</div><div class='ctx'> </div><div class='ctx'> redirty_out:</div><div class='del'>-	redirty_page_for_writepage(wbc, page);</div><div class='del'>-	return AOP_WRITEPAGE_ACTIVATE;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int f2fs_write_meta_page(struct page *page,</div><div class='del'>-				struct writeback_control *wbc)</div><div class='del'>-{</div><div class='del'>-	return __f2fs_write_meta_page(page, wbc, FS_META_IO);</div><div class='add'>+	folio_redirty_for_writepage(wbc, folio);</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int f2fs_write_meta_pages(struct address_space *mapping,</div><div class='hunk'>@@ -351,13 +391,13 @@ static int f2fs_write_meta_pages(struct address_space *mapping,</div><div class='ctx'> 		goto skip_write;</div><div class='ctx'> </div><div class='ctx'> 	/* if locked failed, cp will flush dirty pages instead */</div><div class='del'>-	if (!down_write_trylock(&amp;sbi-&gt;cp_global_sem))</div><div class='add'>+	if (!f2fs_down_write_trylock(&amp;sbi-&gt;cp_global_sem))</div><div class='ctx'> 		goto skip_write;</div><div class='ctx'> </div><div class='ctx'> 	trace_f2fs_writepages(mapping-&gt;host, wbc, META);</div><div class='ctx'> 	diff = nr_pages_to_write(sbi, META, wbc);</div><div class='ctx'> 	written = f2fs_sync_meta_pages(sbi, META, wbc-&gt;nr_to_write, FS_META_IO);</div><div class='del'>-	up_write(&amp;sbi-&gt;cp_global_sem);</div><div class='add'>+	f2fs_up_write(&amp;sbi-&gt;cp_global_sem);</div><div class='ctx'> 	wbc-&gt;nr_to_write = max((long)0, wbc-&gt;nr_to_write - written - diff);</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='hunk'>@@ -372,59 +412,59 @@ long f2fs_sync_meta_pages(struct f2fs_sb_info *sbi, enum page_type type,</div><div class='ctx'> {</div><div class='ctx'> 	struct address_space *mapping = META_MAPPING(sbi);</div><div class='ctx'> 	pgoff_t index = 0, prev = ULONG_MAX;</div><div class='del'>-	struct pagevec pvec;</div><div class='add'>+	struct folio_batch fbatch;</div><div class='ctx'> 	long nwritten = 0;</div><div class='del'>-	int nr_pages;</div><div class='del'>-	struct writeback_control wbc = {</div><div class='del'>-		.for_reclaim = 0,</div><div class='del'>-	};</div><div class='add'>+	int nr_folios;</div><div class='add'>+	struct writeback_control wbc = {};</div><div class='ctx'> 	struct blk_plug plug;</div><div class='ctx'> </div><div class='del'>-	pagevec_init(&amp;pvec);</div><div class='add'>+	folio_batch_init(&amp;fbatch);</div><div class='ctx'> </div><div class='ctx'> 	blk_start_plug(&amp;plug);</div><div class='ctx'> </div><div class='del'>-	while ((nr_pages = pagevec_lookup_tag(&amp;pvec, mapping, &amp;index,</div><div class='del'>-				PAGECACHE_TAG_DIRTY))) {</div><div class='add'>+	while ((nr_folios = filemap_get_folios_tag(mapping, &amp;index,</div><div class='add'>+					(pgoff_t)-1,</div><div class='add'>+					PAGECACHE_TAG_DIRTY, &amp;fbatch))) {</div><div class='ctx'> 		int i;</div><div class='ctx'> </div><div class='del'>-		for (i = 0; i &lt; nr_pages; i++) {</div><div class='del'>-			struct page *page = pvec.pages[i];</div><div class='add'>+		for (i = 0; i &lt; nr_folios; i++) {</div><div class='add'>+			struct folio *folio = fbatch.folios[i];</div><div class='ctx'> </div><div class='del'>-			if (prev == ULONG_MAX)</div><div class='del'>-				prev = page-&gt;index - 1;</div><div class='del'>-			if (nr_to_write != LONG_MAX &amp;&amp; page-&gt;index != prev + 1) {</div><div class='del'>-				pagevec_release(&amp;pvec);</div><div class='add'>+			if (nr_to_write != LONG_MAX &amp;&amp; i != 0 &amp;&amp;</div><div class='add'>+					folio-&gt;index != prev +</div><div class='add'>+					folio_nr_pages(fbatch.folios[i-1])) {</div><div class='add'>+				folio_batch_release(&amp;fbatch);</div><div class='ctx'> 				goto stop;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			lock_page(page);</div><div class='add'>+			folio_lock(folio);</div><div class='ctx'> </div><div class='del'>-			if (unlikely(page-&gt;mapping != mapping)) {</div><div class='add'>+			if (unlikely(!is_meta_folio(folio))) {</div><div class='ctx'> continue_unlock:</div><div class='del'>-				unlock_page(page);</div><div class='add'>+				folio_unlock(folio);</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='del'>-			if (!PageDirty(page)) {</div><div class='add'>+			if (!folio_test_dirty(folio)) {</div><div class='ctx'> 				/* someone wrote it for us */</div><div class='ctx'> 				goto continue_unlock;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			f2fs_wait_on_page_writeback(page, META, true, true);</div><div class='add'>+			f2fs_folio_wait_writeback(folio, META, true, true);</div><div class='ctx'> </div><div class='del'>-			if (!clear_page_dirty_for_io(page))</div><div class='add'>+			if (!folio_clear_dirty_for_io(folio))</div><div class='ctx'> 				goto continue_unlock;</div><div class='ctx'> </div><div class='del'>-			if (__f2fs_write_meta_page(page, &amp;wbc, io_type)) {</div><div class='del'>-				unlock_page(page);</div><div class='add'>+			if (!__f2fs_write_meta_folio(folio, &amp;wbc,</div><div class='add'>+						io_type)) {</div><div class='add'>+				folio_unlock(folio);</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='del'>-			nwritten++;</div><div class='del'>-			prev = page-&gt;index;</div><div class='add'>+			nwritten += folio_nr_pages(folio);</div><div class='add'>+			prev = folio-&gt;index;</div><div class='ctx'> 			if (unlikely(nwritten &gt;= nr_to_write))</div><div class='ctx'> 				break;</div><div class='ctx'> 		}</div><div class='del'>-		pagevec_release(&amp;pvec);</div><div class='add'>+		folio_batch_release(&amp;fbatch);</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 	}</div><div class='ctx'> stop:</div><div class='hunk'>@@ -436,30 +476,27 @@ stop:</div><div class='ctx'> 	return nwritten;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_set_meta_page_dirty(struct page *page)</div><div class='add'>+static bool f2fs_dirty_meta_folio(struct address_space *mapping,</div><div class='add'>+		struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	trace_f2fs_set_page_dirty(page, META);</div><div class='add'>+	trace_f2fs_set_page_dirty(folio, META);</div><div class='ctx'> </div><div class='del'>-	if (!PageUptodate(page))</div><div class='del'>-		SetPageUptodate(page);</div><div class='del'>-	if (!PageDirty(page)) {</div><div class='del'>-		__set_page_dirty_nobuffers(page);</div><div class='del'>-		inc_page_count(F2FS_P_SB(page), F2FS_DIRTY_META);</div><div class='del'>-		set_page_private_reference(page);</div><div class='del'>-		return 1;</div><div class='add'>+	if (!folio_test_uptodate(folio))</div><div class='add'>+		folio_mark_uptodate(folio);</div><div class='add'>+	if (filemap_dirty_folio(mapping, folio)) {</div><div class='add'>+		inc_page_count(F2FS_M_SB(mapping), F2FS_DIRTY_META);</div><div class='add'>+		folio_set_f2fs_reference(folio);</div><div class='add'>+		return true;</div><div class='ctx'> 	}</div><div class='del'>-	return 0;</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations f2fs_meta_aops = {</div><div class='del'>-	.writepage	= f2fs_write_meta_page,</div><div class='ctx'> 	.writepages	= f2fs_write_meta_pages,</div><div class='del'>-	.set_page_dirty	= f2fs_set_meta_page_dirty,</div><div class='del'>-	.invalidatepage = f2fs_invalidate_page,</div><div class='del'>-	.releasepage	= f2fs_release_page,</div><div class='del'>-#ifdef CONFIG_MIGRATION</div><div class='del'>-	.migratepage    = f2fs_migrate_page,</div><div class='del'>-#endif</div><div class='add'>+	.dirty_folio	= f2fs_dirty_meta_folio,</div><div class='add'>+	.invalidate_folio = f2fs_invalidate_folio,</div><div class='add'>+	.release_folio	= f2fs_release_folio,</div><div class='add'>+	.migrate_folio	= filemap_migrate_folio,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static void __add_ino_entry(struct f2fs_sb_info *sbi, nid_t ino,</div><div class='hunk'>@@ -467,6 +504,7 @@ static void __add_ino_entry(struct f2fs_sb_info *sbi, nid_t ino,</div><div class='ctx'> {</div><div class='ctx'> 	struct inode_management *im = &amp;sbi-&gt;im[type];</div><div class='ctx'> 	struct ino_entry *e = NULL, *new = NULL;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (type == FLUSH_INO) {</div><div class='ctx'> 		rcu_read_lock();</div><div class='hunk'>@@ -479,13 +517,15 @@ retry:</div><div class='ctx'> 		new = f2fs_kmem_cache_alloc(ino_entry_slab,</div><div class='ctx'> 						GFP_NOFS, true, NULL);</div><div class='ctx'> </div><div class='del'>-	radix_tree_preload(GFP_NOFS | __GFP_NOFAIL);</div><div class='add'>+	ret = radix_tree_preload(GFP_NOFS | __GFP_NOFAIL);</div><div class='add'>+	f2fs_bug_on(sbi, ret);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;im-&gt;ino_lock);</div><div class='ctx'> 	e = radix_tree_lookup(&amp;im-&gt;ino_root, ino);</div><div class='ctx'> 	if (!e) {</div><div class='ctx'> 		if (!new) {</div><div class='ctx'> 			spin_unlock(&amp;im-&gt;ino_lock);</div><div class='add'>+			radix_tree_preload_end();</div><div class='ctx'> 			goto retry;</div><div class='ctx'> 		}</div><div class='ctx'> 		e = new;</div><div class='hunk'>@@ -601,7 +641,6 @@ int f2fs_acquire_orphan_inode(struct f2fs_sb_info *sbi)</div><div class='ctx'> </div><div class='ctx'> 	if (time_to_inject(sbi, FAULT_ORPHAN)) {</div><div class='ctx'> 		spin_unlock(&amp;im-&gt;ino_lock);</div><div class='del'>-		f2fs_show_injection_info(sbi, FAULT_ORPHAN);</div><div class='ctx'> 		return -ENOSPC;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -664,7 +703,7 @@ static int recover_orphan_inode(struct f2fs_sb_info *sbi, nid_t ino)</div><div class='ctx'> 	/* truncate all the data during iput */</div><div class='ctx'> 	iput(inode);</div><div class='ctx'> </div><div class='del'>-	err = f2fs_get_node_info(sbi, ino, &amp;ni);</div><div class='add'>+	err = f2fs_get_node_info(sbi, ino, &amp;ni, false);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto err_out;</div><div class='ctx'> </div><div class='hunk'>@@ -685,32 +724,18 @@ err_out:</div><div class='ctx'> int f2fs_recover_orphan_inodes(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	block_t start_blk, orphan_blocks, i, j;</div><div class='del'>-	unsigned int s_flags = sbi-&gt;sb-&gt;s_flags;</div><div class='ctx'> 	int err = 0;</div><div class='del'>-#ifdef CONFIG_QUOTA</div><div class='del'>-	int quota_enabled;</div><div class='del'>-#endif</div><div class='ctx'> </div><div class='ctx'> 	if (!is_set_ckpt_flags(sbi, CP_ORPHAN_PRESENT_FLAG))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	if (bdev_read_only(sbi-&gt;sb-&gt;s_bdev)) {</div><div class='add'>+	if (f2fs_hw_is_readonly(sbi)) {</div><div class='ctx'> 		f2fs_info(sbi, "write access unavailable, skipping orphan cleanup");</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (s_flags &amp; SB_RDONLY) {</div><div class='add'>+	if (is_sbi_flag_set(sbi, SBI_IS_WRITABLE))</div><div class='ctx'> 		f2fs_info(sbi, "orphan cleanup on readonly fs");</div><div class='del'>-		sbi-&gt;sb-&gt;s_flags &amp;= ~SB_RDONLY;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_QUOTA</div><div class='del'>-	/*</div><div class='del'>-	 * Turn on quotas which were not enabled for read-only mounts if</div><div class='del'>-	 * filesystem has quota feature, so that they are updated correctly.</div><div class='del'>-	 */</div><div class='del'>-	quota_enabled = f2fs_enable_quota_files(sbi, s_flags &amp; SB_RDONLY);</div><div class='del'>-#endif</div><div class='ctx'> </div><div class='ctx'> 	start_blk = __start_cp_addr(sbi) + 1 + __cp_payload(sbi);</div><div class='ctx'> 	orphan_blocks = __start_sum_addr(sbi) - 1 - __cp_payload(sbi);</div><div class='hunk'>@@ -718,39 +743,32 @@ int f2fs_recover_orphan_inodes(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	f2fs_ra_meta_pages(sbi, start_blk, orphan_blocks, META_CP, true);</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; orphan_blocks; i++) {</div><div class='del'>-		struct page *page;</div><div class='add'>+		struct folio *folio;</div><div class='ctx'> 		struct f2fs_orphan_block *orphan_blk;</div><div class='ctx'> </div><div class='del'>-		page = f2fs_get_meta_page(sbi, start_blk + i);</div><div class='del'>-		if (IS_ERR(page)) {</div><div class='del'>-			err = PTR_ERR(page);</div><div class='add'>+		folio = f2fs_get_meta_folio(sbi, start_blk + i);</div><div class='add'>+		if (IS_ERR(folio)) {</div><div class='add'>+			err = PTR_ERR(folio);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		orphan_blk = (struct f2fs_orphan_block *)page_address(page);</div><div class='add'>+		orphan_blk = folio_address(folio);</div><div class='ctx'> 		for (j = 0; j &lt; le32_to_cpu(orphan_blk-&gt;entry_count); j++) {</div><div class='ctx'> 			nid_t ino = le32_to_cpu(orphan_blk-&gt;ino[j]);</div><div class='ctx'> </div><div class='ctx'> 			err = recover_orphan_inode(sbi, ino);</div><div class='ctx'> 			if (err) {</div><div class='del'>-				f2fs_put_page(page, 1);</div><div class='add'>+				f2fs_folio_put(folio, true);</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		f2fs_put_page(page, 1);</div><div class='add'>+		f2fs_folio_put(folio, true);</div><div class='ctx'> 	}</div><div class='ctx'> 	/* clear Orphan Flag */</div><div class='ctx'> 	clear_ckpt_flags(sbi, CP_ORPHAN_PRESENT_FLAG);</div><div class='ctx'> out:</div><div class='ctx'> 	set_sbi_flag(sbi, SBI_IS_RECOVERED);</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_QUOTA</div><div class='del'>-	/* Turn quotas off */</div><div class='del'>-	if (quota_enabled)</div><div class='del'>-		f2fs_quota_off_umount(sbi-&gt;sb);</div><div class='del'>-#endif</div><div class='del'>-	sbi-&gt;sb-&gt;s_flags = s_flags; /* Restore SB_RDONLY status */</div><div class='del'>-</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -761,7 +779,7 @@ static void write_orphan_inodes(struct f2fs_sb_info *sbi, block_t start_blk)</div><div class='ctx'> 	unsigned int nentries = 0;</div><div class='ctx'> 	unsigned short index = 1;</div><div class='ctx'> 	unsigned short orphan_blocks;</div><div class='del'>-	struct page *page = NULL;</div><div class='add'>+	struct folio *folio = NULL;</div><div class='ctx'> 	struct ino_entry *orphan = NULL;</div><div class='ctx'> 	struct inode_management *im = &amp;sbi-&gt;im[ORPHAN_INO];</div><div class='ctx'> </div><div class='hunk'>@@ -774,12 +792,11 @@ static void write_orphan_inodes(struct f2fs_sb_info *sbi, block_t start_blk)</div><div class='ctx'> 	 */</div><div class='ctx'> 	head = &amp;im-&gt;ino_list;</div><div class='ctx'> </div><div class='del'>-	/* loop for each orphan inode entry and write them in Jornal block */</div><div class='add'>+	/* loop for each orphan inode entry and write them in journal block */</div><div class='ctx'> 	list_for_each_entry(orphan, head, list) {</div><div class='del'>-		if (!page) {</div><div class='del'>-			page = f2fs_grab_meta_page(sbi, start_blk++);</div><div class='del'>-			orphan_blk =</div><div class='del'>-				(struct f2fs_orphan_block *)page_address(page);</div><div class='add'>+		if (!folio) {</div><div class='add'>+			folio = f2fs_grab_meta_folio(sbi, start_blk++);</div><div class='add'>+			orphan_blk = folio_address(folio);</div><div class='ctx'> 			memset(orphan_blk, 0, sizeof(*orphan_blk));</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -794,62 +811,61 @@ static void write_orphan_inodes(struct f2fs_sb_info *sbi, block_t start_blk)</div><div class='ctx'> 			orphan_blk-&gt;blk_addr = cpu_to_le16(index);</div><div class='ctx'> 			orphan_blk-&gt;blk_count = cpu_to_le16(orphan_blocks);</div><div class='ctx'> 			orphan_blk-&gt;entry_count = cpu_to_le32(nentries);</div><div class='del'>-			set_page_dirty(page);</div><div class='del'>-			f2fs_put_page(page, 1);</div><div class='add'>+			folio_mark_dirty(folio);</div><div class='add'>+			f2fs_folio_put(folio, true);</div><div class='ctx'> 			index++;</div><div class='ctx'> 			nentries = 0;</div><div class='del'>-			page = NULL;</div><div class='add'>+			folio = NULL;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (page) {</div><div class='add'>+	if (folio) {</div><div class='ctx'> 		orphan_blk-&gt;blk_addr = cpu_to_le16(index);</div><div class='ctx'> 		orphan_blk-&gt;blk_count = cpu_to_le16(orphan_blocks);</div><div class='ctx'> 		orphan_blk-&gt;entry_count = cpu_to_le32(nentries);</div><div class='del'>-		set_page_dirty(page);</div><div class='del'>-		f2fs_put_page(page, 1);</div><div class='add'>+		folio_mark_dirty(folio);</div><div class='add'>+		f2fs_folio_put(folio, true);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static __u32 f2fs_checkpoint_chksum(struct f2fs_sb_info *sbi,</div><div class='del'>-						struct f2fs_checkpoint *ckpt)</div><div class='add'>+static __u32 f2fs_checkpoint_chksum(struct f2fs_checkpoint *ckpt)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int chksum_ofs = le32_to_cpu(ckpt-&gt;checksum_offset);</div><div class='ctx'> 	__u32 chksum;</div><div class='ctx'> </div><div class='del'>-	chksum = f2fs_crc32(sbi, ckpt, chksum_ofs);</div><div class='add'>+	chksum = f2fs_crc32(ckpt, chksum_ofs);</div><div class='ctx'> 	if (chksum_ofs &lt; CP_CHKSUM_OFFSET) {</div><div class='ctx'> 		chksum_ofs += sizeof(chksum);</div><div class='del'>-		chksum = f2fs_chksum(sbi, chksum, (__u8 *)ckpt + chksum_ofs,</div><div class='del'>-						F2FS_BLKSIZE - chksum_ofs);</div><div class='add'>+		chksum = f2fs_chksum(chksum, (__u8 *)ckpt + chksum_ofs,</div><div class='add'>+				     F2FS_BLKSIZE - chksum_ofs);</div><div class='ctx'> 	}</div><div class='ctx'> 	return chksum;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int get_checkpoint_version(struct f2fs_sb_info *sbi, block_t cp_addr,</div><div class='del'>-		struct f2fs_checkpoint **cp_block, struct page **cp_page,</div><div class='add'>+		struct f2fs_checkpoint **cp_block, struct folio **cp_folio,</div><div class='ctx'> 		unsigned long long *version)</div><div class='ctx'> {</div><div class='ctx'> 	size_t crc_offset = 0;</div><div class='ctx'> 	__u32 crc;</div><div class='ctx'> </div><div class='del'>-	*cp_page = f2fs_get_meta_page(sbi, cp_addr);</div><div class='del'>-	if (IS_ERR(*cp_page))</div><div class='del'>-		return PTR_ERR(*cp_page);</div><div class='add'>+	*cp_folio = f2fs_get_meta_folio(sbi, cp_addr);</div><div class='add'>+	if (IS_ERR(*cp_folio))</div><div class='add'>+		return PTR_ERR(*cp_folio);</div><div class='ctx'> </div><div class='del'>-	*cp_block = (struct f2fs_checkpoint *)page_address(*cp_page);</div><div class='add'>+	*cp_block = folio_address(*cp_folio);</div><div class='ctx'> </div><div class='ctx'> 	crc_offset = le32_to_cpu((*cp_block)-&gt;checksum_offset);</div><div class='ctx'> 	if (crc_offset &lt; CP_MIN_CHKSUM_OFFSET ||</div><div class='ctx'> 			crc_offset &gt; CP_CHKSUM_OFFSET) {</div><div class='del'>-		f2fs_put_page(*cp_page, 1);</div><div class='add'>+		f2fs_folio_put(*cp_folio, true);</div><div class='ctx'> 		f2fs_warn(sbi, "invalid crc_offset: %zu", crc_offset);</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	crc = f2fs_checkpoint_chksum(sbi, *cp_block);</div><div class='add'>+	crc = f2fs_checkpoint_chksum(*cp_block);</div><div class='ctx'> 	if (crc != cur_cp_crc(*cp_block)) {</div><div class='del'>-		f2fs_put_page(*cp_page, 1);</div><div class='add'>+		f2fs_folio_put(*cp_folio, true);</div><div class='ctx'> 		f2fs_warn(sbi, "invalid crc value");</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -858,42 +874,44 @@ static int get_checkpoint_version(struct f2fs_sb_info *sbi, block_t cp_addr,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct page *validate_checkpoint(struct f2fs_sb_info *sbi,</div><div class='add'>+static struct folio *validate_checkpoint(struct f2fs_sb_info *sbi,</div><div class='ctx'> 				block_t cp_addr, unsigned long long *version)</div><div class='ctx'> {</div><div class='del'>-	struct page *cp_page_1 = NULL, *cp_page_2 = NULL;</div><div class='add'>+	struct folio *cp_folio_1 = NULL, *cp_folio_2 = NULL;</div><div class='ctx'> 	struct f2fs_checkpoint *cp_block = NULL;</div><div class='ctx'> 	unsigned long long cur_version = 0, pre_version = 0;</div><div class='add'>+	unsigned int cp_blocks;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	err = get_checkpoint_version(sbi, cp_addr, &amp;cp_block,</div><div class='del'>-					&amp;cp_page_1, version);</div><div class='add'>+					&amp;cp_folio_1, version);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='del'>-	if (le32_to_cpu(cp_block-&gt;cp_pack_total_block_count) &gt;</div><div class='del'>-					sbi-&gt;blocks_per_seg) {</div><div class='add'>+	cp_blocks = le32_to_cpu(cp_block-&gt;cp_pack_total_block_count);</div><div class='add'>+</div><div class='add'>+	if (cp_blocks &gt; BLKS_PER_SEG(sbi) || cp_blocks &lt;= F2FS_CP_PACKS) {</div><div class='ctx'> 		f2fs_warn(sbi, "invalid cp_pack_total_block_count:%u",</div><div class='ctx'> 			  le32_to_cpu(cp_block-&gt;cp_pack_total_block_count));</div><div class='ctx'> 		goto invalid_cp;</div><div class='ctx'> 	}</div><div class='ctx'> 	pre_version = *version;</div><div class='ctx'> </div><div class='del'>-	cp_addr += le32_to_cpu(cp_block-&gt;cp_pack_total_block_count) - 1;</div><div class='add'>+	cp_addr += cp_blocks - 1;</div><div class='ctx'> 	err = get_checkpoint_version(sbi, cp_addr, &amp;cp_block,</div><div class='del'>-					&amp;cp_page_2, version);</div><div class='add'>+					&amp;cp_folio_2, version);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto invalid_cp;</div><div class='ctx'> 	cur_version = *version;</div><div class='ctx'> </div><div class='ctx'> 	if (cur_version == pre_version) {</div><div class='ctx'> 		*version = cur_version;</div><div class='del'>-		f2fs_put_page(cp_page_2, 1);</div><div class='del'>-		return cp_page_1;</div><div class='add'>+		f2fs_folio_put(cp_folio_2, true);</div><div class='add'>+		return cp_folio_1;</div><div class='ctx'> 	}</div><div class='del'>-	f2fs_put_page(cp_page_2, 1);</div><div class='add'>+	f2fs_folio_put(cp_folio_2, true);</div><div class='ctx'> invalid_cp:</div><div class='del'>-	f2fs_put_page(cp_page_1, 1);</div><div class='add'>+	f2fs_folio_put(cp_folio_1, true);</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -901,7 +919,7 @@ int f2fs_get_valid_checkpoint(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_checkpoint *cp_block;</div><div class='ctx'> 	struct f2fs_super_block *fsb = sbi-&gt;raw_super;</div><div class='del'>-	struct page *cp1, *cp2, *cur_page;</div><div class='add'>+	struct folio *cp1, *cp2, *cur_folio;</div><div class='ctx'> 	unsigned long blk_size = sbi-&gt;blocksize;</div><div class='ctx'> 	unsigned long long cp1_version = 0, cp2_version = 0;</div><div class='ctx'> 	unsigned long long cp_start_blk_no;</div><div class='hunk'>@@ -928,22 +946,22 @@ int f2fs_get_valid_checkpoint(struct f2fs_sb_info *sbi)</div><div class='ctx'> </div><div class='ctx'> 	if (cp1 &amp;&amp; cp2) {</div><div class='ctx'> 		if (ver_after(cp2_version, cp1_version))</div><div class='del'>-			cur_page = cp2;</div><div class='add'>+			cur_folio = cp2;</div><div class='ctx'> 		else</div><div class='del'>-			cur_page = cp1;</div><div class='add'>+			cur_folio = cp1;</div><div class='ctx'> 	} else if (cp1) {</div><div class='del'>-		cur_page = cp1;</div><div class='add'>+		cur_folio = cp1;</div><div class='ctx'> 	} else if (cp2) {</div><div class='del'>-		cur_page = cp2;</div><div class='add'>+		cur_folio = cp2;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		err = -EFSCORRUPTED;</div><div class='ctx'> 		goto fail_no_cp;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	cp_block = (struct f2fs_checkpoint *)page_address(cur_page);</div><div class='add'>+	cp_block = folio_address(cur_folio);</div><div class='ctx'> 	memcpy(sbi-&gt;ckpt, cp_block, blk_size);</div><div class='ctx'> </div><div class='del'>-	if (cur_page == cp1)</div><div class='add'>+	if (cur_folio == cp1)</div><div class='ctx'> 		sbi-&gt;cur_cp_pack = 1;</div><div class='ctx'> 	else</div><div class='ctx'> 		sbi-&gt;cur_cp_pack = 2;</div><div class='hunk'>@@ -958,30 +976,30 @@ int f2fs_get_valid_checkpoint(struct f2fs_sb_info *sbi)</div><div class='ctx'> 		goto done;</div><div class='ctx'> </div><div class='ctx'> 	cp_blk_no = le32_to_cpu(fsb-&gt;cp_blkaddr);</div><div class='del'>-	if (cur_page == cp2)</div><div class='del'>-		cp_blk_no += 1 &lt;&lt; le32_to_cpu(fsb-&gt;log_blocks_per_seg);</div><div class='add'>+	if (cur_folio == cp2)</div><div class='add'>+		cp_blk_no += BIT(le32_to_cpu(fsb-&gt;log_blocks_per_seg));</div><div class='ctx'> </div><div class='ctx'> 	for (i = 1; i &lt; cp_blks; i++) {</div><div class='ctx'> 		void *sit_bitmap_ptr;</div><div class='ctx'> 		unsigned char *ckpt = (unsigned char *)sbi-&gt;ckpt;</div><div class='ctx'> </div><div class='del'>-		cur_page = f2fs_get_meta_page(sbi, cp_blk_no + i);</div><div class='del'>-		if (IS_ERR(cur_page)) {</div><div class='del'>-			err = PTR_ERR(cur_page);</div><div class='add'>+		cur_folio = f2fs_get_meta_folio(sbi, cp_blk_no + i);</div><div class='add'>+		if (IS_ERR(cur_folio)) {</div><div class='add'>+			err = PTR_ERR(cur_folio);</div><div class='ctx'> 			goto free_fail_no_cp;</div><div class='ctx'> 		}</div><div class='del'>-		sit_bitmap_ptr = page_address(cur_page);</div><div class='add'>+		sit_bitmap_ptr = folio_address(cur_folio);</div><div class='ctx'> 		memcpy(ckpt + i * blk_size, sit_bitmap_ptr, blk_size);</div><div class='del'>-		f2fs_put_page(cur_page, 1);</div><div class='add'>+		f2fs_folio_put(cur_folio, true);</div><div class='ctx'> 	}</div><div class='ctx'> done:</div><div class='del'>-	f2fs_put_page(cp1, 1);</div><div class='del'>-	f2fs_put_page(cp2, 1);</div><div class='add'>+	f2fs_folio_put(cp1, true);</div><div class='add'>+	f2fs_folio_put(cp2, true);</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> free_fail_no_cp:</div><div class='del'>-	f2fs_put_page(cp1, 1);</div><div class='del'>-	f2fs_put_page(cp2, 1);</div><div class='add'>+	f2fs_folio_put(cp1, true);</div><div class='add'>+	f2fs_folio_put(cp2, true);</div><div class='ctx'> fail_no_cp:</div><div class='ctx'> 	kvfree(sbi-&gt;ckpt);</div><div class='ctx'> 	return err;</div><div class='hunk'>@@ -996,9 +1014,7 @@ static void __add_dirty_inode(struct inode *inode, enum inode_type type)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	set_inode_flag(inode, flag);</div><div class='del'>-	if (!f2fs_is_volatile_file(inode))</div><div class='del'>-		list_add_tail(&amp;F2FS_I(inode)-&gt;dirty_list,</div><div class='del'>-						&amp;sbi-&gt;inode_list[type]);</div><div class='add'>+	list_add_tail(&amp;F2FS_I(inode)-&gt;dirty_list, &amp;sbi-&gt;inode_list[type]);</div><div class='ctx'> 	stat_inc_dirty_inode(sbi, type);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1014,7 +1030,7 @@ static void __remove_dirty_inode(struct inode *inode, enum inode_type type)</div><div class='ctx'> 	stat_dec_dirty_inode(F2FS_I_SB(inode), type);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_update_dirty_page(struct inode *inode, struct page *page)</div><div class='add'>+void f2fs_update_dirty_folio(struct inode *inode, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	enum inode_type type = S_ISDIR(inode-&gt;i_mode) ? DIR_INODE : FILE_INODE;</div><div class='hunk'>@@ -1029,7 +1045,7 @@ void f2fs_update_dirty_page(struct inode *inode, struct page *page)</div><div class='ctx'> 	inode_inc_dirty_pages(inode);</div><div class='ctx'> 	spin_unlock(&amp;sbi-&gt;inode_lock[type]);</div><div class='ctx'> </div><div class='del'>-	set_page_private_reference(page);</div><div class='add'>+	folio_set_f2fs_reference(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_remove_dirty_inode(struct inode *inode)</div><div class='hunk'>@@ -1049,7 +1065,8 @@ void f2fs_remove_dirty_inode(struct inode *inode)</div><div class='ctx'> 	spin_unlock(&amp;sbi-&gt;inode_lock[type]);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int f2fs_sync_dirty_inodes(struct f2fs_sb_info *sbi, enum inode_type type)</div><div class='add'>+int f2fs_sync_dirty_inodes(struct f2fs_sb_info *sbi, enum inode_type type,</div><div class='add'>+						bool from_cp)</div><div class='ctx'> {</div><div class='ctx'> 	struct list_head *head;</div><div class='ctx'> 	struct inode *inode;</div><div class='hunk'>@@ -1084,11 +1101,15 @@ retry:</div><div class='ctx'> 	if (inode) {</div><div class='ctx'> 		unsigned long cur_ino = inode-&gt;i_ino;</div><div class='ctx'> </div><div class='del'>-		F2FS_I(inode)-&gt;cp_task = current;</div><div class='add'>+		if (from_cp)</div><div class='add'>+			F2FS_I(inode)-&gt;cp_task = current;</div><div class='add'>+		F2FS_I(inode)-&gt;wb_task = current;</div><div class='ctx'> </div><div class='ctx'> 		filemap_fdatawrite(inode-&gt;i_mapping);</div><div class='ctx'> </div><div class='del'>-		F2FS_I(inode)-&gt;cp_task = NULL;</div><div class='add'>+		F2FS_I(inode)-&gt;wb_task = NULL;</div><div class='add'>+		if (from_cp)</div><div class='add'>+			F2FS_I(inode)-&gt;cp_task = NULL;</div><div class='ctx'> </div><div class='ctx'> 		iput(inode);</div><div class='ctx'> 		/* We need to give cpu to another writers. */</div><div class='hunk'>@@ -1099,7 +1120,7 @@ retry:</div><div class='ctx'> 	} else {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We should submit bio, since it exists several</div><div class='del'>-		 * wribacking dentry pages in the freeing inode.</div><div class='add'>+		 * writebacking dentry pages in the freeing inode.</div><div class='ctx'> 		 */</div><div class='ctx'> 		f2fs_submit_merged_write(sbi, DATA);</div><div class='ctx'> 		cond_resched();</div><div class='hunk'>@@ -1107,7 +1128,7 @@ retry:</div><div class='ctx'> 	goto retry;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int f2fs_sync_inode_meta(struct f2fs_sb_info *sbi)</div><div class='add'>+static int f2fs_sync_inode_meta(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	struct list_head *head = &amp;sbi-&gt;inode_list[DIRTY_META];</div><div class='ctx'> 	struct inode *inode;</div><div class='hunk'>@@ -1150,6 +1171,11 @@ static void __prepare_cp_block(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	ckpt-&gt;valid_node_count = cpu_to_le32(valid_node_count(sbi));</div><div class='ctx'> 	ckpt-&gt;valid_inode_count = cpu_to_le32(valid_inode_count(sbi));</div><div class='ctx'> 	ckpt-&gt;next_free_nid = cpu_to_le32(last_nid);</div><div class='add'>+</div><div class='add'>+	/* update user_block_counts */</div><div class='add'>+	sbi-&gt;last_valid_block_count = sbi-&gt;total_valid_block_count;</div><div class='add'>+	percpu_counter_set(&amp;sbi-&gt;alloc_valid_block_count, 0);</div><div class='add'>+	percpu_counter_set(&amp;sbi-&gt;rf_node_block_count, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool __need_flush_quota(struct f2fs_sb_info *sbi)</div><div class='hunk'>@@ -1159,7 +1185,7 @@ static bool __need_flush_quota(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	if (!is_journalled_quota(sbi))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	if (!down_write_trylock(&amp;sbi-&gt;quota_sem))</div><div class='add'>+	if (!f2fs_down_write_trylock(&amp;sbi-&gt;quota_sem))</div><div class='ctx'> 		return true;</div><div class='ctx'> 	if (is_sbi_flag_set(sbi, SBI_QUOTA_SKIP_FLUSH)) {</div><div class='ctx'> 		ret = false;</div><div class='hunk'>@@ -1171,7 +1197,7 @@ static bool __need_flush_quota(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	} else if (get_pages(sbi, F2FS_DIRTY_QDATA)) {</div><div class='ctx'> 		ret = true;</div><div class='ctx'> 	}</div><div class='del'>-	up_write(&amp;sbi-&gt;quota_sem);</div><div class='add'>+	f2fs_up_write(&amp;sbi-&gt;quota_sem);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1183,7 +1209,6 @@ static int block_operations(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	struct writeback_control wbc = {</div><div class='ctx'> 		.sync_mode = WB_SYNC_ALL,</div><div class='ctx'> 		.nr_to_write = LONG_MAX,</div><div class='del'>-		.for_reclaim = 0,</div><div class='ctx'> 	};</div><div class='ctx'> 	int err = 0, cnt = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -1195,7 +1220,7 @@ static int block_operations(struct f2fs_sb_info *sbi)</div><div class='ctx'> retry_flush_quotas:</div><div class='ctx'> 	f2fs_lock_all(sbi);</div><div class='ctx'> 	if (__need_flush_quota(sbi)) {</div><div class='del'>-		int locked;</div><div class='add'>+		bool need_lock = sbi-&gt;umount_lock_holder != current;</div><div class='ctx'> </div><div class='ctx'> 		if (++cnt &gt; DEFAULT_RETRY_QUOTA_FLUSH_COUNT) {</div><div class='ctx'> 			set_sbi_flag(sbi, SBI_QUOTA_SKIP_FLUSH);</div><div class='hunk'>@@ -1204,11 +1229,13 @@ retry_flush_quotas:</div><div class='ctx'> 		}</div><div class='ctx'> 		f2fs_unlock_all(sbi);</div><div class='ctx'> </div><div class='del'>-		/* only failed during mount/umount/freeze/quotactl */</div><div class='del'>-		locked = down_read_trylock(&amp;sbi-&gt;sb-&gt;s_umount);</div><div class='del'>-		f2fs_quota_sync(sbi-&gt;sb, -1);</div><div class='del'>-		if (locked)</div><div class='add'>+		/* don't grab s_umount lock during mount/umount/remount/freeze/quotactl */</div><div class='add'>+		if (!need_lock) {</div><div class='add'>+			f2fs_do_quota_sync(sbi-&gt;sb, -1);</div><div class='add'>+		} else if (down_read_trylock(&amp;sbi-&gt;sb-&gt;s_umount)) {</div><div class='add'>+			f2fs_do_quota_sync(sbi-&gt;sb, -1);</div><div class='ctx'> 			up_read(&amp;sbi-&gt;sb-&gt;s_umount);</div><div class='add'>+		}</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 		goto retry_flush_quotas;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1217,7 +1244,7 @@ retry_flush_dents:</div><div class='ctx'> 	/* write all the dirty dentry pages */</div><div class='ctx'> 	if (get_pages(sbi, F2FS_DIRTY_DENTS)) {</div><div class='ctx'> 		f2fs_unlock_all(sbi);</div><div class='del'>-		err = f2fs_sync_dirty_inodes(sbi, DIR_INODE);</div><div class='add'>+		err = f2fs_sync_dirty_inodes(sbi, DIR_INODE, true);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			return err;</div><div class='ctx'> 		cond_resched();</div><div class='hunk'>@@ -1228,10 +1255,10 @@ retry_flush_dents:</div><div class='ctx'> 	 * POR: we should ensure that there are no dirty node pages</div><div class='ctx'> 	 * until finishing nat/sit flush. inode-&gt;i_blocks can be updated.</div><div class='ctx'> 	 */</div><div class='del'>-	down_write(&amp;sbi-&gt;node_change);</div><div class='add'>+	f2fs_down_write(&amp;sbi-&gt;node_change);</div><div class='ctx'> </div><div class='ctx'> 	if (get_pages(sbi, F2FS_DIRTY_IMETA)) {</div><div class='del'>-		up_write(&amp;sbi-&gt;node_change);</div><div class='add'>+		f2fs_up_write(&amp;sbi-&gt;node_change);</div><div class='ctx'> 		f2fs_unlock_all(sbi);</div><div class='ctx'> 		err = f2fs_sync_inode_meta(sbi);</div><div class='ctx'> 		if (err)</div><div class='hunk'>@@ -1241,15 +1268,15 @@ retry_flush_dents:</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> retry_flush_nodes:</div><div class='del'>-	down_write(&amp;sbi-&gt;node_write);</div><div class='add'>+	f2fs_down_write(&amp;sbi-&gt;node_write);</div><div class='ctx'> </div><div class='ctx'> 	if (get_pages(sbi, F2FS_DIRTY_NODES)) {</div><div class='del'>-		up_write(&amp;sbi-&gt;node_write);</div><div class='add'>+		f2fs_up_write(&amp;sbi-&gt;node_write);</div><div class='ctx'> 		atomic_inc(&amp;sbi-&gt;wb_sync_req[NODE]);</div><div class='ctx'> 		err = f2fs_sync_node_pages(sbi, &amp;wbc, false, FS_CP_NODE_IO);</div><div class='ctx'> 		atomic_dec(&amp;sbi-&gt;wb_sync_req[NODE]);</div><div class='ctx'> 		if (err) {</div><div class='del'>-			up_write(&amp;sbi-&gt;node_change);</div><div class='add'>+			f2fs_up_write(&amp;sbi-&gt;node_change);</div><div class='ctx'> 			f2fs_unlock_all(sbi);</div><div class='ctx'> 			return err;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1262,13 +1289,13 @@ retry_flush_nodes:</div><div class='ctx'> 	 * dirty node blocks and some checkpoint values by block allocation.</div><div class='ctx'> 	 */</div><div class='ctx'> 	__prepare_cp_block(sbi);</div><div class='del'>-	up_write(&amp;sbi-&gt;node_change);</div><div class='add'>+	f2fs_up_write(&amp;sbi-&gt;node_change);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void unblock_operations(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='del'>-	up_write(&amp;sbi-&gt;node_write);</div><div class='add'>+	f2fs_up_write(&amp;sbi-&gt;node_write);</div><div class='ctx'> 	f2fs_unlock_all(sbi);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1280,7 +1307,8 @@ void f2fs_wait_on_all_pages(struct f2fs_sb_info *sbi, int type)</div><div class='ctx'> 		if (!get_pages(sbi, type))</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		if (unlikely(f2fs_cp_error(sbi)))</div><div class='add'>+		if (unlikely(f2fs_cp_error(sbi) &amp;&amp;</div><div class='add'>+			!is_sbi_flag_set(sbi, SBI_IS_CLOSE)))</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='ctx'> 		if (type == F2FS_DIRTY_META)</div><div class='hunk'>@@ -1290,7 +1318,7 @@ void f2fs_wait_on_all_pages(struct f2fs_sb_info *sbi, int type)</div><div class='ctx'> 			f2fs_submit_merged_write(sbi, DATA);</div><div class='ctx'> </div><div class='ctx'> 		prepare_to_wait(&amp;sbi-&gt;cp_wait, &amp;wait, TASK_UNINTERRUPTIBLE);</div><div class='del'>-		io_schedule_timeout(DEFAULT_IO_TIMEOUT);</div><div class='add'>+		io_schedule_timeout(DEFAULT_SCHEDULE_TIMEOUT);</div><div class='ctx'> 	}</div><div class='ctx'> 	finish_wait(&amp;sbi-&gt;cp_wait, &amp;wait);</div><div class='ctx'> }</div><div class='hunk'>@@ -1301,21 +1329,13 @@ static void update_ckpt_flags(struct f2fs_sb_info *sbi, struct cp_control *cpc)</div><div class='ctx'> 	struct f2fs_checkpoint *ckpt = F2FS_CKPT(sbi);</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> </div><div class='del'>-	if (cpc-&gt;reason &amp; CP_UMOUNT) {</div><div class='del'>-		if (le32_to_cpu(ckpt-&gt;cp_pack_total_block_count) &gt;</div><div class='del'>-			sbi-&gt;blocks_per_seg - NM_I(sbi)-&gt;nat_bits_blocks) {</div><div class='del'>-			clear_ckpt_flags(sbi, CP_NAT_BITS_FLAG);</div><div class='del'>-			f2fs_notice(sbi, "Disable nat_bits due to no space");</div><div class='del'>-		} else if (!is_set_ckpt_flags(sbi, CP_NAT_BITS_FLAG) &amp;&amp;</div><div class='del'>-						f2fs_nat_bitmap_enabled(sbi)) {</div><div class='del'>-			f2fs_enable_nat_bits(sbi);</div><div class='del'>-			set_ckpt_flags(sbi, CP_NAT_BITS_FLAG);</div><div class='del'>-			f2fs_notice(sbi, "Rebuild and enable nat_bits");</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	spin_lock_irqsave(&amp;sbi-&gt;cp_lock, flags);</div><div class='ctx'> </div><div class='add'>+	if ((cpc-&gt;reason &amp; CP_UMOUNT) &amp;&amp;</div><div class='add'>+			le32_to_cpu(ckpt-&gt;cp_pack_total_block_count) &gt;</div><div class='add'>+			sbi-&gt;blocks_per_seg - NM_I(sbi)-&gt;nat_bits_blocks)</div><div class='add'>+		disable_nat_bits(sbi, false);</div><div class='add'>+</div><div class='ctx'> 	if (cpc-&gt;reason &amp; CP_TRIMMED)</div><div class='ctx'> 		__set_ckpt_flags(ckpt, CP_TRIMMED_FLAG);</div><div class='ctx'> 	else</div><div class='hunk'>@@ -1372,35 +1392,31 @@ static void update_ckpt_flags(struct f2fs_sb_info *sbi, struct cp_control *cpc)</div><div class='ctx'> static void commit_checkpoint(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	void *src, block_t blk_addr)</div><div class='ctx'> {</div><div class='del'>-	struct writeback_control wbc = {</div><div class='del'>-		.for_reclaim = 0,</div><div class='del'>-	};</div><div class='add'>+	struct writeback_control wbc = {};</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * pagevec_lookup_tag and lock_page again will take</div><div class='add'>+	 * filemap_get_folios_tag and folio_lock again will take</div><div class='ctx'> 	 * some extra time. Therefore, f2fs_update_meta_pages and</div><div class='ctx'> 	 * f2fs_sync_meta_pages are combined in this function.</div><div class='ctx'> 	 */</div><div class='del'>-	struct page *page = f2fs_grab_meta_page(sbi, blk_addr);</div><div class='del'>-	int err;</div><div class='del'>-</div><div class='del'>-	f2fs_wait_on_page_writeback(page, META, true, true);</div><div class='add'>+	struct folio *folio = f2fs_grab_meta_folio(sbi, blk_addr);</div><div class='ctx'> </div><div class='del'>-	memcpy(page_address(page), src, PAGE_SIZE);</div><div class='add'>+	memcpy(folio_address(folio), src, PAGE_SIZE);</div><div class='ctx'> </div><div class='del'>-	set_page_dirty(page);</div><div class='del'>-	if (unlikely(!clear_page_dirty_for_io(page)))</div><div class='add'>+	folio_mark_dirty(folio);</div><div class='add'>+	if (unlikely(!folio_clear_dirty_for_io(folio)))</div><div class='ctx'> 		f2fs_bug_on(sbi, 1);</div><div class='ctx'> </div><div class='ctx'> 	/* writeout cp pack 2 page */</div><div class='del'>-	err = __f2fs_write_meta_page(page, &amp;wbc, FS_CP_META_IO);</div><div class='del'>-	if (unlikely(err &amp;&amp; f2fs_cp_error(sbi))) {</div><div class='del'>-		f2fs_put_page(page, 1);</div><div class='del'>-		return;</div><div class='add'>+	if (unlikely(!__f2fs_write_meta_folio(folio, &amp;wbc, FS_CP_META_IO))) {</div><div class='add'>+		if (f2fs_cp_error(sbi)) {</div><div class='add'>+			f2fs_folio_put(folio, true);</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+		f2fs_bug_on(sbi, true);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	f2fs_bug_on(sbi, err);</div><div class='del'>-	f2fs_put_page(page, 0);</div><div class='add'>+	f2fs_folio_put(folio, false);</div><div class='ctx'> </div><div class='ctx'> 	/* submit checkpoint (with barrier if NOBARRIER is not set) */</div><div class='ctx'> 	f2fs_submit_merged_write(sbi, META_FLUSH);</div><div class='hunk'>@@ -1426,6 +1442,34 @@ u64 f2fs_get_sectors_written(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	return get_sectors_written(sbi-&gt;sb-&gt;s_bdev);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline void stat_cp_time(struct cp_control *cpc, enum cp_time type)</div><div class='add'>+{</div><div class='add'>+	cpc-&gt;stats.times[type] = ktime_get();</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void check_cp_time(struct f2fs_sb_info *sbi, struct cp_control *cpc)</div><div class='add'>+{</div><div class='add'>+	unsigned long long sb_diff, cur_diff;</div><div class='add'>+	enum cp_time ct;</div><div class='add'>+</div><div class='add'>+	sb_diff = (u64)ktime_ms_delta(sbi-&gt;cp_stats.times[CP_TIME_END],</div><div class='add'>+					sbi-&gt;cp_stats.times[CP_TIME_START]);</div><div class='add'>+	cur_diff = (u64)ktime_ms_delta(cpc-&gt;stats.times[CP_TIME_END],</div><div class='add'>+					cpc-&gt;stats.times[CP_TIME_START]);</div><div class='add'>+</div><div class='add'>+	if (cur_diff &gt; sb_diff) {</div><div class='add'>+		sbi-&gt;cp_stats = cpc-&gt;stats;</div><div class='add'>+		if (cur_diff &lt; CP_LONG_LATENCY_THRESHOLD)</div><div class='add'>+			return;</div><div class='add'>+</div><div class='add'>+		f2fs_warn(sbi, "checkpoint was blocked for %llu ms", cur_diff);</div><div class='add'>+		for (ct = CP_TIME_START; ct &lt; CP_TIME_MAX - 1; ct++)</div><div class='add'>+			f2fs_warn(sbi, "Step#%d: %llu ms", ct,</div><div class='add'>+				(u64)ktime_ms_delta(cpc-&gt;stats.times[ct + 1],</div><div class='add'>+						cpc-&gt;stats.times[ct]));</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int do_checkpoint(struct f2fs_sb_info *sbi, struct cp_control *cpc)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_checkpoint *ckpt = F2FS_CKPT(sbi);</div><div class='hunk'>@@ -1443,24 +1487,24 @@ static int do_checkpoint(struct f2fs_sb_info *sbi, struct cp_control *cpc)</div><div class='ctx'> 	/* Flush all the NAT/SIT pages */</div><div class='ctx'> 	f2fs_sync_meta_pages(sbi, META, LONG_MAX, FS_CP_META_IO);</div><div class='ctx'> </div><div class='add'>+	stat_cp_time(cpc, CP_TIME_SYNC_META);</div><div class='add'>+</div><div class='ctx'> 	/* start to update checkpoint, cp ver is already updated previously */</div><div class='ctx'> 	ckpt-&gt;elapsed_time = cpu_to_le64(get_mtime(sbi, true));</div><div class='ctx'> 	ckpt-&gt;free_segment_count = cpu_to_le32(free_segments(sbi));</div><div class='ctx'> 	for (i = 0; i &lt; NR_CURSEG_NODE_TYPE; i++) {</div><div class='del'>-		ckpt-&gt;cur_node_segno[i] =</div><div class='del'>-			cpu_to_le32(curseg_segno(sbi, i + CURSEG_HOT_NODE));</div><div class='del'>-		ckpt-&gt;cur_node_blkoff[i] =</div><div class='del'>-			cpu_to_le16(curseg_blkoff(sbi, i + CURSEG_HOT_NODE));</div><div class='del'>-		ckpt-&gt;alloc_type[i + CURSEG_HOT_NODE] =</div><div class='del'>-				curseg_alloc_type(sbi, i + CURSEG_HOT_NODE);</div><div class='add'>+		struct curseg_info *curseg = CURSEG_I(sbi, i + CURSEG_HOT_NODE);</div><div class='add'>+</div><div class='add'>+		ckpt-&gt;cur_node_segno[i] = cpu_to_le32(curseg-&gt;segno);</div><div class='add'>+		ckpt-&gt;cur_node_blkoff[i] = cpu_to_le16(curseg-&gt;next_blkoff);</div><div class='add'>+		ckpt-&gt;alloc_type[i + CURSEG_HOT_NODE] = curseg-&gt;alloc_type;</div><div class='ctx'> 	}</div><div class='ctx'> 	for (i = 0; i &lt; NR_CURSEG_DATA_TYPE; i++) {</div><div class='del'>-		ckpt-&gt;cur_data_segno[i] =</div><div class='del'>-			cpu_to_le32(curseg_segno(sbi, i + CURSEG_HOT_DATA));</div><div class='del'>-		ckpt-&gt;cur_data_blkoff[i] =</div><div class='del'>-			cpu_to_le16(curseg_blkoff(sbi, i + CURSEG_HOT_DATA));</div><div class='del'>-		ckpt-&gt;alloc_type[i + CURSEG_HOT_DATA] =</div><div class='del'>-				curseg_alloc_type(sbi, i + CURSEG_HOT_DATA);</div><div class='add'>+		struct curseg_info *curseg = CURSEG_I(sbi, i + CURSEG_HOT_DATA);</div><div class='add'>+</div><div class='add'>+		ckpt-&gt;cur_data_segno[i] = cpu_to_le32(curseg-&gt;segno);</div><div class='add'>+		ckpt-&gt;cur_data_blkoff[i] = cpu_to_le16(curseg-&gt;next_blkoff);</div><div class='add'>+		ckpt-&gt;alloc_type[i + CURSEG_HOT_DATA] = curseg-&gt;alloc_type;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* 2 cp + n data seg summary + orphan inode blocks */</div><div class='hunk'>@@ -1492,7 +1536,7 @@ static int do_checkpoint(struct f2fs_sb_info *sbi, struct cp_control *cpc)</div><div class='ctx'> 	get_sit_bitmap(sbi, __bitmap_ptr(sbi, SIT_BITMAP));</div><div class='ctx'> 	get_nat_bitmap(sbi, __bitmap_ptr(sbi, NAT_BITMAP));</div><div class='ctx'> </div><div class='del'>-	crc32 = f2fs_checkpoint_chksum(sbi, ckpt);</div><div class='add'>+	crc32 = f2fs_checkpoint_chksum(ckpt);</div><div class='ctx'> 	*((__le32 *)((unsigned char *)ckpt +</div><div class='ctx'> 				le32_to_cpu(ckpt-&gt;checksum_offset)))</div><div class='ctx'> 				= cpu_to_le32(crc32);</div><div class='hunk'>@@ -1500,18 +1544,17 @@ static int do_checkpoint(struct f2fs_sb_info *sbi, struct cp_control *cpc)</div><div class='ctx'> 	start_blk = __start_cp_next_addr(sbi);</div><div class='ctx'> </div><div class='ctx'> 	/* write nat bits */</div><div class='del'>-	if ((cpc-&gt;reason &amp; CP_UMOUNT) &amp;&amp;</div><div class='del'>-			is_set_ckpt_flags(sbi, CP_NAT_BITS_FLAG)) {</div><div class='add'>+	if (enabled_nat_bits(sbi, cpc)) {</div><div class='ctx'> 		__u64 cp_ver = cur_cp_version(ckpt);</div><div class='ctx'> 		block_t blk;</div><div class='ctx'> </div><div class='ctx'> 		cp_ver |= ((__u64)crc32 &lt;&lt; 32);</div><div class='ctx'> 		*(__le64 *)nm_i-&gt;nat_bits = cpu_to_le64(cp_ver);</div><div class='ctx'> </div><div class='del'>-		blk = start_blk + sbi-&gt;blocks_per_seg - nm_i-&gt;nat_bits_blocks;</div><div class='add'>+		blk = start_blk + BLKS_PER_SEG(sbi) - nm_i-&gt;nat_bits_blocks;</div><div class='ctx'> 		for (i = 0; i &lt; nm_i-&gt;nat_bits_blocks; i++)</div><div class='ctx'> 			f2fs_update_meta_page(sbi, nm_i-&gt;nat_bits +</div><div class='del'>-					(i &lt;&lt; F2FS_BLKSIZE_BITS), blk + i);</div><div class='add'>+					F2FS_BLK_TO_BYTES(i), blk + i);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* write out checkpoint buffer at block 0 */</div><div class='hunk'>@@ -1540,26 +1583,28 @@ static int do_checkpoint(struct f2fs_sb_info *sbi, struct cp_control *cpc)</div><div class='ctx'> 		start_blk += NR_CURSEG_NODE_TYPE;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* update user_block_counts */</div><div class='del'>-	sbi-&gt;last_valid_block_count = sbi-&gt;total_valid_block_count;</div><div class='del'>-	percpu_counter_set(&amp;sbi-&gt;alloc_valid_block_count, 0);</div><div class='del'>-</div><div class='ctx'> 	/* Here, we have one bio having CP pack except cp pack 2 page */</div><div class='ctx'> 	f2fs_sync_meta_pages(sbi, META, LONG_MAX, FS_CP_META_IO);</div><div class='add'>+	stat_cp_time(cpc, CP_TIME_SYNC_CP_META);</div><div class='add'>+</div><div class='ctx'> 	/* Wait for all dirty meta pages to be submitted for IO */</div><div class='ctx'> 	f2fs_wait_on_all_pages(sbi, F2FS_DIRTY_META);</div><div class='add'>+	stat_cp_time(cpc, CP_TIME_WAIT_DIRTY_META);</div><div class='ctx'> </div><div class='ctx'> 	/* wait for previous submitted meta pages writeback */</div><div class='ctx'> 	f2fs_wait_on_all_pages(sbi, F2FS_WB_CP_DATA);</div><div class='add'>+	stat_cp_time(cpc, CP_TIME_WAIT_CP_DATA);</div><div class='ctx'> </div><div class='ctx'> 	/* flush all device cache */</div><div class='ctx'> 	err = f2fs_flush_device_cache(sbi);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='add'>+	stat_cp_time(cpc, CP_TIME_FLUSH_DEVICE);</div><div class='ctx'> </div><div class='ctx'> 	/* barrier and flush checkpoint cp pack 2 page if it can */</div><div class='ctx'> 	commit_checkpoint(sbi, ckpt, start_blk);</div><div class='ctx'> 	f2fs_wait_on_all_pages(sbi, F2FS_WB_CP_DATA);</div><div class='add'>+	stat_cp_time(cpc, CP_TIME_WAIT_LAST_CP);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * invalidate intermediate page cache borrowed from meta inode which are</div><div class='hunk'>@@ -1567,8 +1612,9 @@ static int do_checkpoint(struct f2fs_sb_info *sbi, struct cp_control *cpc)</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (f2fs_sb_has_encrypt(sbi) || f2fs_sb_has_verity(sbi) ||</div><div class='ctx'> 		f2fs_sb_has_compression(sbi))</div><div class='del'>-		invalidate_mapping_pages(META_MAPPING(sbi),</div><div class='del'>-				MAIN_BLKADDR(sbi), MAX_BLKADDR(sbi) - 1);</div><div class='add'>+		f2fs_bug_on(sbi,</div><div class='add'>+			invalidate_inode_pages2_range(META_MAPPING(sbi),</div><div class='add'>+				MAIN_BLKADDR(sbi), MAX_BLKADDR(sbi) - 1));</div><div class='ctx'> </div><div class='ctx'> 	f2fs_release_ino_entry(sbi, false);</div><div class='ctx'> </div><div class='hunk'>@@ -1603,6 +1649,8 @@ int f2fs_write_checkpoint(struct f2fs_sb_info *sbi, struct cp_control *cpc)</div><div class='ctx'> 	unsigned long long ckpt_ver;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='add'>+	stat_cp_time(cpc, CP_TIME_START);</div><div class='add'>+</div><div class='ctx'> 	if (f2fs_readonly(sbi-&gt;sb) || f2fs_hw_is_readonly(sbi))</div><div class='ctx'> 		return -EROFS;</div><div class='ctx'> </div><div class='hunk'>@@ -1612,7 +1660,9 @@ int f2fs_write_checkpoint(struct f2fs_sb_info *sbi, struct cp_control *cpc)</div><div class='ctx'> 		f2fs_warn(sbi, "Start checkpoint disabled!");</div><div class='ctx'> 	}</div><div class='ctx'> 	if (cpc-&gt;reason != CP_RESIZE)</div><div class='del'>-		down_write(&amp;sbi-&gt;cp_global_sem);</div><div class='add'>+		f2fs_down_write(&amp;sbi-&gt;cp_global_sem);</div><div class='add'>+</div><div class='add'>+	stat_cp_time(cpc, CP_TIME_LOCK);</div><div class='ctx'> </div><div class='ctx'> 	if (!is_sbi_flag_set(sbi, SBI_IS_DIRTY) &amp;&amp;</div><div class='ctx'> 		((cpc-&gt;reason &amp; CP_FASTBOOT) || (cpc-&gt;reason &amp; CP_SYNC) ||</div><div class='hunk'>@@ -1623,13 +1673,15 @@ int f2fs_write_checkpoint(struct f2fs_sb_info *sbi, struct cp_control *cpc)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	trace_f2fs_write_checkpoint(sbi-&gt;sb, cpc-&gt;reason, "start block_ops");</div><div class='add'>+	trace_f2fs_write_checkpoint(sbi-&gt;sb, cpc-&gt;reason, CP_PHASE_START_BLOCK_OPS);</div><div class='ctx'> </div><div class='ctx'> 	err = block_operations(sbi);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	trace_f2fs_write_checkpoint(sbi-&gt;sb, cpc-&gt;reason, "finish block_ops");</div><div class='add'>+	stat_cp_time(cpc, CP_TIME_OP_LOCK);</div><div class='add'>+</div><div class='add'>+	trace_f2fs_write_checkpoint(sbi-&gt;sb, cpc-&gt;reason, CP_PHASE_FINISH_BLOCK_OPS);</div><div class='ctx'> </div><div class='ctx'> 	f2fs_flush_merged_writes(sbi);</div><div class='ctx'> </div><div class='hunk'>@@ -1668,6 +1720,8 @@ int f2fs_write_checkpoint(struct f2fs_sb_info *sbi, struct cp_control *cpc)</div><div class='ctx'> </div><div class='ctx'> 	f2fs_flush_sit_entries(sbi, cpc);</div><div class='ctx'> </div><div class='add'>+	stat_cp_time(cpc, CP_TIME_FLUSH_META);</div><div class='add'>+</div><div class='ctx'> 	/* save inmem log status */</div><div class='ctx'> 	f2fs_save_inmem_curseg(sbi);</div><div class='ctx'> </div><div class='hunk'>@@ -1681,19 +1735,22 @@ int f2fs_write_checkpoint(struct f2fs_sb_info *sbi, struct cp_control *cpc)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	f2fs_restore_inmem_curseg(sbi);</div><div class='add'>+	f2fs_reinit_atgc_curseg(sbi);</div><div class='add'>+	stat_inc_cp_count(sbi);</div><div class='ctx'> stop:</div><div class='ctx'> 	unblock_operations(sbi);</div><div class='del'>-	stat_inc_cp_count(sbi-&gt;stat_info);</div><div class='add'>+	stat_cp_time(cpc, CP_TIME_END);</div><div class='add'>+	check_cp_time(sbi, cpc);</div><div class='ctx'> </div><div class='ctx'> 	if (cpc-&gt;reason &amp; CP_RECOVERY)</div><div class='ctx'> 		f2fs_notice(sbi, "checkpoint: version = %llx", ckpt_ver);</div><div class='ctx'> </div><div class='ctx'> 	/* update CP_TIME to trigger checkpoint periodically */</div><div class='ctx'> 	f2fs_update_time(sbi, CP_TIME);</div><div class='del'>-	trace_f2fs_write_checkpoint(sbi-&gt;sb, cpc-&gt;reason, "finish checkpoint");</div><div class='add'>+	trace_f2fs_write_checkpoint(sbi-&gt;sb, cpc-&gt;reason, CP_PHASE_FINISH_CHECKPOINT);</div><div class='ctx'> out:</div><div class='ctx'> 	if (cpc-&gt;reason != CP_RESIZE)</div><div class='del'>-		up_write(&amp;sbi-&gt;cp_global_sem);</div><div class='add'>+		f2fs_up_write(&amp;sbi-&gt;cp_global_sem);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1710,9 +1767,9 @@ void f2fs_init_ino_entry_info(struct f2fs_sb_info *sbi)</div><div class='ctx'> 		im-&gt;ino_num = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	sbi-&gt;max_orphans = (sbi-&gt;blocks_per_seg - F2FS_CP_PACKS -</div><div class='add'>+	sbi-&gt;max_orphans = (BLKS_PER_SEG(sbi) - F2FS_CP_PACKS -</div><div class='ctx'> 			NR_CURSEG_PERSIST_TYPE - __cp_payload(sbi)) *</div><div class='del'>-				F2FS_ORPHANS_PER_BLOCK;</div><div class='add'>+			F2FS_ORPHANS_PER_BLOCK;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int __init f2fs_create_checkpoint_caches(void)</div><div class='hunk'>@@ -1741,9 +1798,9 @@ static int __write_checkpoint_sync(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	struct cp_control cpc = { .reason = CP_SYNC, };</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;sbi-&gt;gc_lock);</div><div class='add'>+	f2fs_down_write(&amp;sbi-&gt;gc_lock);</div><div class='ctx'> 	err = f2fs_write_checkpoint(sbi, &amp;cpc);</div><div class='del'>-	up_write(&amp;sbi-&gt;gc_lock);</div><div class='add'>+	f2fs_up_write(&amp;sbi-&gt;gc_lock);</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='hunk'>@@ -1767,6 +1824,7 @@ static void __checkpoint_and_complete_reqs(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	llist_for_each_entry_safe(req, next, dispatch_list, llnode) {</div><div class='ctx'> 		diff = (u64)ktime_ms_delta(ktime_get(), req-&gt;queue_time);</div><div class='ctx'> 		req-&gt;ret = ret;</div><div class='add'>+		req-&gt;delta_time = diff;</div><div class='ctx'> 		complete(&amp;req-&gt;wait);</div><div class='ctx'> </div><div class='ctx'> 		sum_diff += diff;</div><div class='hunk'>@@ -1828,12 +1886,13 @@ int f2fs_issue_checkpoint(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	struct cp_control cpc;</div><div class='ctx'> </div><div class='ctx'> 	cpc.reason = __get_cp_reason(sbi);</div><div class='del'>-	if (!test_opt(sbi, MERGE_CHECKPOINT) || cpc.reason != CP_SYNC) {</div><div class='add'>+	if (!test_opt(sbi, MERGE_CHECKPOINT) || cpc.reason != CP_SYNC ||</div><div class='add'>+		sbi-&gt;umount_lock_holder == current) {</div><div class='ctx'> 		int ret;</div><div class='ctx'> </div><div class='del'>-		down_write(&amp;sbi-&gt;gc_lock);</div><div class='add'>+		f2fs_down_write(&amp;sbi-&gt;gc_lock);</div><div class='ctx'> 		ret = f2fs_write_checkpoint(sbi, &amp;cpc);</div><div class='del'>-		up_write(&amp;sbi-&gt;gc_lock);</div><div class='add'>+		f2fs_up_write(&amp;sbi-&gt;gc_lock);</div><div class='ctx'> </div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1861,6 +1920,12 @@ int f2fs_issue_checkpoint(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	else</div><div class='ctx'> 		flush_remained_ckpt_reqs(sbi, &amp;req);</div><div class='ctx'> </div><div class='add'>+	if (unlikely(req.delta_time &gt;= CP_LONG_LATENCY_THRESHOLD)) {</div><div class='add'>+		f2fs_warn_ratelimited(sbi,</div><div class='add'>+			"blocked on checkpoint for %u ms", cprc-&gt;peak_time);</div><div class='add'>+		dump_stack();</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	return req.ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1875,8 +1940,10 @@ int f2fs_start_ckpt_thread(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	cprc-&gt;f2fs_issue_ckpt = kthread_run(issue_checkpoint_thread, sbi,</div><div class='ctx'> 			"f2fs_ckpt-%u:%u", MAJOR(dev), MINOR(dev));</div><div class='ctx'> 	if (IS_ERR(cprc-&gt;f2fs_issue_ckpt)) {</div><div class='add'>+		int err = PTR_ERR(cprc-&gt;f2fs_issue_ckpt);</div><div class='add'>+</div><div class='ctx'> 		cprc-&gt;f2fs_issue_ckpt = NULL;</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+		return err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	set_task_ioprio(cprc-&gt;f2fs_issue_ckpt, cprc-&gt;ckpt_thread_ioprio);</div><div class='hunk'>@@ -1887,15 +1954,27 @@ int f2fs_start_ckpt_thread(struct f2fs_sb_info *sbi)</div><div class='ctx'> void f2fs_stop_ckpt_thread(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	struct ckpt_req_control *cprc = &amp;sbi-&gt;cprc_info;</div><div class='add'>+	struct task_struct *ckpt_task;</div><div class='ctx'> </div><div class='del'>-	if (cprc-&gt;f2fs_issue_ckpt) {</div><div class='del'>-		struct task_struct *ckpt_task = cprc-&gt;f2fs_issue_ckpt;</div><div class='add'>+	if (!cprc-&gt;f2fs_issue_ckpt)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-		cprc-&gt;f2fs_issue_ckpt = NULL;</div><div class='del'>-		kthread_stop(ckpt_task);</div><div class='add'>+	ckpt_task = cprc-&gt;f2fs_issue_ckpt;</div><div class='add'>+	cprc-&gt;f2fs_issue_ckpt = NULL;</div><div class='add'>+	kthread_stop(ckpt_task);</div><div class='ctx'> </div><div class='del'>-		flush_remained_ckpt_reqs(sbi, NULL);</div><div class='del'>-	}</div><div class='add'>+	f2fs_flush_ckpt_thread(sbi);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void f2fs_flush_ckpt_thread(struct f2fs_sb_info *sbi)</div><div class='add'>+{</div><div class='add'>+	struct ckpt_req_control *cprc = &amp;sbi-&gt;cprc_info;</div><div class='add'>+</div><div class='add'>+	flush_remained_ckpt_reqs(sbi, NULL);</div><div class='add'>+</div><div class='add'>+	/* Let's wait for the previous dispatched checkpoint. */</div><div class='add'>+	while (atomic_read(&amp;cprc-&gt;queued_ckpt))</div><div class='add'>+		io_schedule_timeout(DEFAULT_SCHEDULE_TIMEOUT);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_init_ckpt_req_control(struct f2fs_sb_info *sbi)</div><div class='head'>diff --git a/fs/f2fs/compress.c b/fs/f2fs/compress.c<br/>index a0d5cfab75e4..7b68bf22989d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/compress.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/compress.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/compress.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/compress.c</a></div><div class='hunk'>@@ -23,20 +23,18 @@</div><div class='ctx'> static struct kmem_cache *cic_entry_slab;</div><div class='ctx'> static struct kmem_cache *dic_entry_slab;</div><div class='ctx'> </div><div class='del'>-static void *page_array_alloc(struct inode *inode, int nr)</div><div class='add'>+static void *page_array_alloc(struct f2fs_sb_info *sbi, int nr)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	unsigned int size = sizeof(struct page *) * nr;</div><div class='ctx'> </div><div class='ctx'> 	if (likely(size &lt;= sbi-&gt;page_array_slab_size))</div><div class='ctx'> 		return f2fs_kmem_cache_alloc(sbi-&gt;page_array_slab,</div><div class='del'>-					GFP_F2FS_ZERO, false, F2FS_I_SB(inode));</div><div class='add'>+					GFP_F2FS_ZERO, false, sbi);</div><div class='ctx'> 	return f2fs_kzalloc(sbi, size, GFP_NOFS);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void page_array_free(struct inode *inode, void *pages, int nr)</div><div class='add'>+static void page_array_free(struct f2fs_sb_info *sbi, void *pages, int nr)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	unsigned int size = sizeof(struct page *) * nr;</div><div class='ctx'> </div><div class='ctx'> 	if (!pages)</div><div class='hunk'>@@ -55,6 +53,7 @@ struct f2fs_compress_ops {</div><div class='ctx'> 	int (*init_decompress_ctx)(struct decompress_io_ctx *dic);</div><div class='ctx'> 	void (*destroy_decompress_ctx)(struct decompress_io_ctx *dic);</div><div class='ctx'> 	int (*decompress_pages)(struct decompress_io_ctx *dic);</div><div class='add'>+	bool (*is_level_valid)(int level);</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static unsigned int offset_in_cluster(struct compress_ctx *cc, pgoff_t index)</div><div class='hunk'>@@ -72,28 +71,28 @@ static pgoff_t start_idx_of_cluster(struct compress_ctx *cc)</div><div class='ctx'> 	return cc-&gt;cluster_idx &lt;&lt; cc-&gt;log_cluster_size;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-bool f2fs_is_compressed_page(struct page *page)</div><div class='add'>+bool f2fs_is_compressed_page(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	if (!PagePrivate(page))</div><div class='del'>-		return false;</div><div class='del'>-	if (!page_private(page))</div><div class='add'>+	if (!folio-&gt;private)</div><div class='ctx'> 		return false;</div><div class='del'>-	if (page_private_nonpointer(page))</div><div class='add'>+	if (folio_test_f2fs_nonpointer(folio))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	f2fs_bug_on(F2FS_M_SB(page-&gt;mapping),</div><div class='del'>-		*((u32 *)page_private(page)) != F2FS_COMPRESSED_PAGE_MAGIC);</div><div class='add'>+	f2fs_bug_on(F2FS_F_SB(folio),</div><div class='add'>+		*((u32 *)folio-&gt;private) != F2FS_COMPRESSED_PAGE_MAGIC);</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void f2fs_set_compressed_page(struct page *page,</div><div class='ctx'> 		struct inode *inode, pgoff_t index, void *data)</div><div class='ctx'> {</div><div class='del'>-	attach_page_private(page, (void *)data);</div><div class='add'>+	struct folio *folio = page_folio(page);</div><div class='add'>+</div><div class='add'>+	folio_attach_private(folio, (void *)data);</div><div class='ctx'> </div><div class='ctx'> 	/* i_crypto_info and iv index */</div><div class='del'>-	page-&gt;index = index;</div><div class='del'>-	page-&gt;mapping = inode-&gt;i_mapping;</div><div class='add'>+	folio-&gt;index = index;</div><div class='add'>+	folio-&gt;mapping = inode-&gt;i_mapping;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void f2fs_drop_rpages(struct compress_ctx *cc, int len, bool unlock)</div><div class='hunk'>@@ -121,7 +120,7 @@ static void f2fs_unlock_rpages(struct compress_ctx *cc, int len)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void f2fs_put_rpages_wbc(struct compress_ctx *cc,</div><div class='del'>-		struct writeback_control *wbc, bool redirty, int unlock)</div><div class='add'>+		struct writeback_control *wbc, bool redirty, bool unlock)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int i;</div><div class='ctx'> </div><div class='hunk'>@@ -134,9 +133,11 @@ static void f2fs_put_rpages_wbc(struct compress_ctx *cc,</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct page *f2fs_compress_control_page(struct page *page)</div><div class='add'>+struct folio *f2fs_compress_control_folio(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	return ((struct compress_io_ctx *)page_private(page))-&gt;rpages[0];</div><div class='add'>+	struct compress_io_ctx *ctx = folio-&gt;private;</div><div class='add'>+</div><div class='add'>+	return page_folio(ctx-&gt;rpages[0]);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int f2fs_init_compress_ctx(struct compress_ctx *cc)</div><div class='hunk'>@@ -144,38 +145,39 @@ int f2fs_init_compress_ctx(struct compress_ctx *cc)</div><div class='ctx'> 	if (cc-&gt;rpages)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	cc-&gt;rpages = page_array_alloc(cc-&gt;inode, cc-&gt;cluster_size);</div><div class='add'>+	cc-&gt;rpages = page_array_alloc(F2FS_I_SB(cc-&gt;inode), cc-&gt;cluster_size);</div><div class='ctx'> 	return cc-&gt;rpages ? 0 : -ENOMEM;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_destroy_compress_ctx(struct compress_ctx *cc, bool reuse)</div><div class='ctx'> {</div><div class='del'>-	page_array_free(cc-&gt;inode, cc-&gt;rpages, cc-&gt;cluster_size);</div><div class='add'>+	page_array_free(F2FS_I_SB(cc-&gt;inode), cc-&gt;rpages, cc-&gt;cluster_size);</div><div class='ctx'> 	cc-&gt;rpages = NULL;</div><div class='ctx'> 	cc-&gt;nr_rpages = 0;</div><div class='ctx'> 	cc-&gt;nr_cpages = 0;</div><div class='add'>+	cc-&gt;valid_nr_cpages = 0;</div><div class='ctx'> 	if (!reuse)</div><div class='ctx'> 		cc-&gt;cluster_idx = NULL_CLUSTER;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_compress_ctx_add_page(struct compress_ctx *cc, struct page *page)</div><div class='add'>+void f2fs_compress_ctx_add_page(struct compress_ctx *cc, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int cluster_ofs;</div><div class='ctx'> </div><div class='del'>-	if (!f2fs_cluster_can_merge_page(cc, page-&gt;index))</div><div class='add'>+	if (!f2fs_cluster_can_merge_page(cc, folio-&gt;index))</div><div class='ctx'> 		f2fs_bug_on(F2FS_I_SB(cc-&gt;inode), 1);</div><div class='ctx'> </div><div class='del'>-	cluster_ofs = offset_in_cluster(cc, page-&gt;index);</div><div class='del'>-	cc-&gt;rpages[cluster_ofs] = page;</div><div class='add'>+	cluster_ofs = offset_in_cluster(cc, folio-&gt;index);</div><div class='add'>+	cc-&gt;rpages[cluster_ofs] = folio_page(folio, 0);</div><div class='ctx'> 	cc-&gt;nr_rpages++;</div><div class='del'>-	cc-&gt;cluster_idx = cluster_idx(cc, page-&gt;index);</div><div class='add'>+	cc-&gt;cluster_idx = cluster_idx(cc, folio-&gt;index);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_F2FS_FS_LZO</div><div class='ctx'> static int lzo_init_compress_ctx(struct compress_ctx *cc)</div><div class='ctx'> {</div><div class='del'>-	cc-&gt;private = f2fs_kvmalloc(F2FS_I_SB(cc-&gt;inode),</div><div class='del'>-				LZO1X_MEM_COMPRESS, GFP_NOFS);</div><div class='add'>+	cc-&gt;private = f2fs_vmalloc(F2FS_I_SB(cc-&gt;inode),</div><div class='add'>+					LZO1X_MEM_COMPRESS);</div><div class='ctx'> 	if (!cc-&gt;private)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='hunk'>@@ -185,7 +187,7 @@ static int lzo_init_compress_ctx(struct compress_ctx *cc)</div><div class='ctx'> </div><div class='ctx'> static void lzo_destroy_compress_ctx(struct compress_ctx *cc)</div><div class='ctx'> {</div><div class='del'>-	kvfree(cc-&gt;private);</div><div class='add'>+	vfree(cc-&gt;private);</div><div class='ctx'> 	cc-&gt;private = NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -196,8 +198,8 @@ static int lzo_compress_pages(struct compress_ctx *cc)</div><div class='ctx'> 	ret = lzo1x_1_compress(cc-&gt;rbuf, cc-&gt;rlen, cc-&gt;cbuf-&gt;cdata,</div><div class='ctx'> 					&amp;cc-&gt;clen, cc-&gt;private);</div><div class='ctx'> 	if (ret != LZO_E_OK) {</div><div class='del'>-		printk_ratelimited("%sF2FS-fs (%s): lzo compress failed, ret:%d\n",</div><div class='del'>-				KERN_ERR, F2FS_I_SB(cc-&gt;inode)-&gt;sb-&gt;s_id, ret);</div><div class='add'>+		f2fs_err_ratelimited(F2FS_I_SB(cc-&gt;inode),</div><div class='add'>+				"lzo compress failed, ret:%d", ret);</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -210,17 +212,15 @@ static int lzo_decompress_pages(struct decompress_io_ctx *dic)</div><div class='ctx'> 	ret = lzo1x_decompress_safe(dic-&gt;cbuf-&gt;cdata, dic-&gt;clen,</div><div class='ctx'> 						dic-&gt;rbuf, &amp;dic-&gt;rlen);</div><div class='ctx'> 	if (ret != LZO_E_OK) {</div><div class='del'>-		printk_ratelimited("%sF2FS-fs (%s): lzo decompress failed, ret:%d\n",</div><div class='del'>-				KERN_ERR, F2FS_I_SB(dic-&gt;inode)-&gt;sb-&gt;s_id, ret);</div><div class='add'>+		f2fs_err_ratelimited(dic-&gt;sbi,</div><div class='add'>+				"lzo decompress failed, ret:%d", ret);</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (dic-&gt;rlen != PAGE_SIZE &lt;&lt; dic-&gt;log_cluster_size) {</div><div class='del'>-		printk_ratelimited("%sF2FS-fs (%s): lzo invalid rlen:%zu, "</div><div class='del'>-					"expected:%lu\n", KERN_ERR,</div><div class='del'>-					F2FS_I_SB(dic-&gt;inode)-&gt;sb-&gt;s_id,</div><div class='del'>-					dic-&gt;rlen,</div><div class='del'>-					PAGE_SIZE &lt;&lt; dic-&gt;log_cluster_size);</div><div class='add'>+		f2fs_err_ratelimited(dic-&gt;sbi,</div><div class='add'>+				"lzo invalid rlen:%zu, expected:%lu",</div><div class='add'>+				dic-&gt;rlen, PAGE_SIZE &lt;&lt; dic-&gt;log_cluster_size);</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -240,11 +240,11 @@ static int lz4_init_compress_ctx(struct compress_ctx *cc)</div><div class='ctx'> 	unsigned int size = LZ4_MEM_COMPRESS;</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_F2FS_FS_LZ4HC</div><div class='del'>-	if (F2FS_I(cc-&gt;inode)-&gt;i_compress_flag &gt;&gt; COMPRESS_LEVEL_OFFSET)</div><div class='add'>+	if (F2FS_I(cc-&gt;inode)-&gt;i_compress_level)</div><div class='ctx'> 		size = LZ4HC_MEM_COMPRESS;</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-	cc-&gt;private = f2fs_kvmalloc(F2FS_I_SB(cc-&gt;inode), size, GFP_NOFS);</div><div class='add'>+	cc-&gt;private = f2fs_vmalloc(F2FS_I_SB(cc-&gt;inode), size);</div><div class='ctx'> 	if (!cc-&gt;private)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='hunk'>@@ -259,40 +259,25 @@ static int lz4_init_compress_ctx(struct compress_ctx *cc)</div><div class='ctx'> </div><div class='ctx'> static void lz4_destroy_compress_ctx(struct compress_ctx *cc)</div><div class='ctx'> {</div><div class='del'>-	kvfree(cc-&gt;private);</div><div class='add'>+	vfree(cc-&gt;private);</div><div class='ctx'> 	cc-&gt;private = NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_F2FS_FS_LZ4HC</div><div class='del'>-static int lz4hc_compress_pages(struct compress_ctx *cc)</div><div class='add'>+static int lz4_compress_pages(struct compress_ctx *cc)</div><div class='ctx'> {</div><div class='del'>-	unsigned char level = F2FS_I(cc-&gt;inode)-&gt;i_compress_flag &gt;&gt;</div><div class='del'>-						COMPRESS_LEVEL_OFFSET;</div><div class='del'>-	int len;</div><div class='add'>+	int len = -EINVAL;</div><div class='add'>+	unsigned char level = F2FS_I(cc-&gt;inode)-&gt;i_compress_level;</div><div class='ctx'> </div><div class='del'>-	if (level)</div><div class='del'>-		len = LZ4_compress_HC(cc-&gt;rbuf, cc-&gt;cbuf-&gt;cdata, cc-&gt;rlen,</div><div class='del'>-					cc-&gt;clen, level, cc-&gt;private);</div><div class='del'>-	else</div><div class='add'>+	if (!level)</div><div class='ctx'> 		len = LZ4_compress_default(cc-&gt;rbuf, cc-&gt;cbuf-&gt;cdata, cc-&gt;rlen,</div><div class='ctx'> 						cc-&gt;clen, cc-&gt;private);</div><div class='del'>-	if (!len)</div><div class='del'>-		return -EAGAIN;</div><div class='del'>-</div><div class='del'>-	cc-&gt;clen = len;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-static int lz4_compress_pages(struct compress_ctx *cc)</div><div class='del'>-{</div><div class='del'>-	int len;</div><div class='del'>-</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_LZ4HC</div><div class='del'>-	return lz4hc_compress_pages(cc);</div><div class='add'>+	else</div><div class='add'>+		len = LZ4_compress_HC(cc-&gt;rbuf, cc-&gt;cbuf-&gt;cdata, cc-&gt;rlen,</div><div class='add'>+					cc-&gt;clen, level, cc-&gt;private);</div><div class='ctx'> #endif</div><div class='del'>-	len = LZ4_compress_default(cc-&gt;rbuf, cc-&gt;cbuf-&gt;cdata, cc-&gt;rlen,</div><div class='del'>-						cc-&gt;clen, cc-&gt;private);</div><div class='add'>+	if (len &lt; 0)</div><div class='add'>+		return len;</div><div class='ctx'> 	if (!len)</div><div class='ctx'> 		return -EAGAIN;</div><div class='ctx'> </div><div class='hunk'>@@ -307,59 +292,63 @@ static int lz4_decompress_pages(struct decompress_io_ctx *dic)</div><div class='ctx'> 	ret = LZ4_decompress_safe(dic-&gt;cbuf-&gt;cdata, dic-&gt;rbuf,</div><div class='ctx'> 						dic-&gt;clen, dic-&gt;rlen);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='del'>-		printk_ratelimited("%sF2FS-fs (%s): lz4 decompress failed, ret:%d\n",</div><div class='del'>-				KERN_ERR, F2FS_I_SB(dic-&gt;inode)-&gt;sb-&gt;s_id, ret);</div><div class='add'>+		f2fs_err_ratelimited(dic-&gt;sbi,</div><div class='add'>+				"lz4 decompress failed, ret:%d", ret);</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (ret != PAGE_SIZE &lt;&lt; dic-&gt;log_cluster_size) {</div><div class='del'>-		printk_ratelimited("%sF2FS-fs (%s): lz4 invalid rlen:%zu, "</div><div class='del'>-					"expected:%lu\n", KERN_ERR,</div><div class='del'>-					F2FS_I_SB(dic-&gt;inode)-&gt;sb-&gt;s_id,</div><div class='del'>-					dic-&gt;rlen,</div><div class='del'>-					PAGE_SIZE &lt;&lt; dic-&gt;log_cluster_size);</div><div class='add'>+		f2fs_err_ratelimited(dic-&gt;sbi,</div><div class='add'>+				"lz4 invalid ret:%d, expected:%lu",</div><div class='add'>+				ret, PAGE_SIZE &lt;&lt; dic-&gt;log_cluster_size);</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool lz4_is_level_valid(int lvl)</div><div class='add'>+{</div><div class='add'>+#ifdef CONFIG_F2FS_FS_LZ4HC</div><div class='add'>+	return !lvl || (lvl &gt;= LZ4HC_MIN_CLEVEL &amp;&amp; lvl &lt;= LZ4HC_MAX_CLEVEL);</div><div class='add'>+#else</div><div class='add'>+	return lvl == 0;</div><div class='add'>+#endif</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static const struct f2fs_compress_ops f2fs_lz4_ops = {</div><div class='ctx'> 	.init_compress_ctx	= lz4_init_compress_ctx,</div><div class='ctx'> 	.destroy_compress_ctx	= lz4_destroy_compress_ctx,</div><div class='ctx'> 	.compress_pages		= lz4_compress_pages,</div><div class='ctx'> 	.decompress_pages	= lz4_decompress_pages,</div><div class='add'>+	.is_level_valid		= lz4_is_level_valid,</div><div class='ctx'> };</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_F2FS_FS_ZSTD</div><div class='del'>-#define F2FS_ZSTD_DEFAULT_CLEVEL	1</div><div class='del'>-</div><div class='ctx'> static int zstd_init_compress_ctx(struct compress_ctx *cc)</div><div class='ctx'> {</div><div class='del'>-	ZSTD_parameters params;</div><div class='del'>-	ZSTD_CStream *stream;</div><div class='add'>+	zstd_parameters params;</div><div class='add'>+	zstd_cstream *stream;</div><div class='ctx'> 	void *workspace;</div><div class='ctx'> 	unsigned int workspace_size;</div><div class='del'>-	unsigned char level = F2FS_I(cc-&gt;inode)-&gt;i_compress_flag &gt;&gt;</div><div class='del'>-						COMPRESS_LEVEL_OFFSET;</div><div class='add'>+	unsigned char level = F2FS_I(cc-&gt;inode)-&gt;i_compress_level;</div><div class='ctx'> </div><div class='add'>+	/* Need to remain this for backward compatibility */</div><div class='ctx'> 	if (!level)</div><div class='ctx'> 		level = F2FS_ZSTD_DEFAULT_CLEVEL;</div><div class='ctx'> </div><div class='del'>-	params = ZSTD_getParams(level, cc-&gt;rlen, 0);</div><div class='del'>-	workspace_size = ZSTD_CStreamWorkspaceBound(params.cParams);</div><div class='add'>+	params = zstd_get_params(level, cc-&gt;rlen);</div><div class='add'>+	workspace_size = zstd_cstream_workspace_bound(&amp;params.cParams);</div><div class='ctx'> </div><div class='del'>-	workspace = f2fs_kvmalloc(F2FS_I_SB(cc-&gt;inode),</div><div class='del'>-					workspace_size, GFP_NOFS);</div><div class='add'>+	workspace = f2fs_vmalloc(F2FS_I_SB(cc-&gt;inode), workspace_size);</div><div class='ctx'> 	if (!workspace)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	stream = ZSTD_initCStream(params, 0, workspace, workspace_size);</div><div class='add'>+	stream = zstd_init_cstream(&amp;params, 0, workspace, workspace_size);</div><div class='ctx'> 	if (!stream) {</div><div class='del'>-		printk_ratelimited("%sF2FS-fs (%s): %s ZSTD_initCStream failed\n",</div><div class='del'>-				KERN_ERR, F2FS_I_SB(cc-&gt;inode)-&gt;sb-&gt;s_id,</div><div class='del'>-				__func__);</div><div class='del'>-		kvfree(workspace);</div><div class='add'>+		f2fs_err_ratelimited(F2FS_I_SB(cc-&gt;inode),</div><div class='add'>+				"%s zstd_init_cstream failed", __func__);</div><div class='add'>+		vfree(workspace);</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -372,16 +361,16 @@ static int zstd_init_compress_ctx(struct compress_ctx *cc)</div><div class='ctx'> </div><div class='ctx'> static void zstd_destroy_compress_ctx(struct compress_ctx *cc)</div><div class='ctx'> {</div><div class='del'>-	kvfree(cc-&gt;private);</div><div class='add'>+	vfree(cc-&gt;private);</div><div class='ctx'> 	cc-&gt;private = NULL;</div><div class='ctx'> 	cc-&gt;private2 = NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int zstd_compress_pages(struct compress_ctx *cc)</div><div class='ctx'> {</div><div class='del'>-	ZSTD_CStream *stream = cc-&gt;private2;</div><div class='del'>-	ZSTD_inBuffer inbuf;</div><div class='del'>-	ZSTD_outBuffer outbuf;</div><div class='add'>+	zstd_cstream *stream = cc-&gt;private2;</div><div class='add'>+	zstd_in_buffer inbuf;</div><div class='add'>+	zstd_out_buffer outbuf;</div><div class='ctx'> 	int src_size = cc-&gt;rlen;</div><div class='ctx'> 	int dst_size = src_size - PAGE_SIZE - COMPRESS_HEADER_SIZE;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -394,19 +383,19 @@ static int zstd_compress_pages(struct compress_ctx *cc)</div><div class='ctx'> 	outbuf.dst = cc-&gt;cbuf-&gt;cdata;</div><div class='ctx'> 	outbuf.size = dst_size;</div><div class='ctx'> </div><div class='del'>-	ret = ZSTD_compressStream(stream, &amp;outbuf, &amp;inbuf);</div><div class='del'>-	if (ZSTD_isError(ret)) {</div><div class='del'>-		printk_ratelimited("%sF2FS-fs (%s): %s ZSTD_compressStream failed, ret: %d\n",</div><div class='del'>-				KERN_ERR, F2FS_I_SB(cc-&gt;inode)-&gt;sb-&gt;s_id,</div><div class='del'>-				__func__, ZSTD_getErrorCode(ret));</div><div class='add'>+	ret = zstd_compress_stream(stream, &amp;outbuf, &amp;inbuf);</div><div class='add'>+	if (zstd_is_error(ret)) {</div><div class='add'>+		f2fs_err_ratelimited(F2FS_I_SB(cc-&gt;inode),</div><div class='add'>+				"%s zstd_compress_stream failed, ret: %d",</div><div class='add'>+				__func__, zstd_get_error_code(ret));</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = ZSTD_endStream(stream, &amp;outbuf);</div><div class='del'>-	if (ZSTD_isError(ret)) {</div><div class='del'>-		printk_ratelimited("%sF2FS-fs (%s): %s ZSTD_endStream returned %d\n",</div><div class='del'>-				KERN_ERR, F2FS_I_SB(cc-&gt;inode)-&gt;sb-&gt;s_id,</div><div class='del'>-				__func__, ZSTD_getErrorCode(ret));</div><div class='add'>+	ret = zstd_end_stream(stream, &amp;outbuf);</div><div class='add'>+	if (zstd_is_error(ret)) {</div><div class='add'>+		f2fs_err_ratelimited(F2FS_I_SB(cc-&gt;inode),</div><div class='add'>+				"%s zstd_end_stream returned %d",</div><div class='add'>+				__func__, zstd_get_error_code(ret));</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -423,25 +412,23 @@ static int zstd_compress_pages(struct compress_ctx *cc)</div><div class='ctx'> </div><div class='ctx'> static int zstd_init_decompress_ctx(struct decompress_io_ctx *dic)</div><div class='ctx'> {</div><div class='del'>-	ZSTD_DStream *stream;</div><div class='add'>+	zstd_dstream *stream;</div><div class='ctx'> 	void *workspace;</div><div class='ctx'> 	unsigned int workspace_size;</div><div class='ctx'> 	unsigned int max_window_size =</div><div class='ctx'> 			MAX_COMPRESS_WINDOW_SIZE(dic-&gt;log_cluster_size);</div><div class='ctx'> </div><div class='del'>-	workspace_size = ZSTD_DStreamWorkspaceBound(max_window_size);</div><div class='add'>+	workspace_size = zstd_dstream_workspace_bound(max_window_size);</div><div class='ctx'> </div><div class='del'>-	workspace = f2fs_kvmalloc(F2FS_I_SB(dic-&gt;inode),</div><div class='del'>-					workspace_size, GFP_NOFS);</div><div class='add'>+	workspace = f2fs_vmalloc(dic-&gt;sbi, workspace_size);</div><div class='ctx'> 	if (!workspace)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	stream = ZSTD_initDStream(max_window_size, workspace, workspace_size);</div><div class='add'>+	stream = zstd_init_dstream(max_window_size, workspace, workspace_size);</div><div class='ctx'> 	if (!stream) {</div><div class='del'>-		printk_ratelimited("%sF2FS-fs (%s): %s ZSTD_initDStream failed\n",</div><div class='del'>-				KERN_ERR, F2FS_I_SB(dic-&gt;inode)-&gt;sb-&gt;s_id,</div><div class='del'>-				__func__);</div><div class='del'>-		kvfree(workspace);</div><div class='add'>+		f2fs_err_ratelimited(dic-&gt;sbi,</div><div class='add'>+				"%s zstd_init_dstream failed", __func__);</div><div class='add'>+		vfree(workspace);</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -453,16 +440,16 @@ static int zstd_init_decompress_ctx(struct decompress_io_ctx *dic)</div><div class='ctx'> </div><div class='ctx'> static void zstd_destroy_decompress_ctx(struct decompress_io_ctx *dic)</div><div class='ctx'> {</div><div class='del'>-	kvfree(dic-&gt;private);</div><div class='add'>+	vfree(dic-&gt;private);</div><div class='ctx'> 	dic-&gt;private = NULL;</div><div class='ctx'> 	dic-&gt;private2 = NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int zstd_decompress_pages(struct decompress_io_ctx *dic)</div><div class='ctx'> {</div><div class='del'>-	ZSTD_DStream *stream = dic-&gt;private2;</div><div class='del'>-	ZSTD_inBuffer inbuf;</div><div class='del'>-	ZSTD_outBuffer outbuf;</div><div class='add'>+	zstd_dstream *stream = dic-&gt;private2;</div><div class='add'>+	zstd_in_buffer inbuf;</div><div class='add'>+	zstd_out_buffer outbuf;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	inbuf.pos = 0;</div><div class='hunk'>@@ -473,18 +460,17 @@ static int zstd_decompress_pages(struct decompress_io_ctx *dic)</div><div class='ctx'> 	outbuf.dst = dic-&gt;rbuf;</div><div class='ctx'> 	outbuf.size = dic-&gt;rlen;</div><div class='ctx'> </div><div class='del'>-	ret = ZSTD_decompressStream(stream, &amp;outbuf, &amp;inbuf);</div><div class='del'>-	if (ZSTD_isError(ret)) {</div><div class='del'>-		printk_ratelimited("%sF2FS-fs (%s): %s ZSTD_compressStream failed, ret: %d\n",</div><div class='del'>-				KERN_ERR, F2FS_I_SB(dic-&gt;inode)-&gt;sb-&gt;s_id,</div><div class='del'>-				__func__, ZSTD_getErrorCode(ret));</div><div class='add'>+	ret = zstd_decompress_stream(stream, &amp;outbuf, &amp;inbuf);</div><div class='add'>+	if (zstd_is_error(ret)) {</div><div class='add'>+		f2fs_err_ratelimited(dic-&gt;sbi,</div><div class='add'>+				"%s zstd_decompress_stream failed, ret: %d",</div><div class='add'>+				__func__, zstd_get_error_code(ret));</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (dic-&gt;rlen != outbuf.pos) {</div><div class='del'>-		printk_ratelimited("%sF2FS-fs (%s): %s ZSTD invalid rlen:%zu, "</div><div class='del'>-				"expected:%lu\n", KERN_ERR,</div><div class='del'>-				F2FS_I_SB(dic-&gt;inode)-&gt;sb-&gt;s_id,</div><div class='add'>+		f2fs_err_ratelimited(dic-&gt;sbi,</div><div class='add'>+				"%s ZSTD invalid rlen:%zu, expected:%lu",</div><div class='ctx'> 				__func__, dic-&gt;rlen,</div><div class='ctx'> 				PAGE_SIZE &lt;&lt; dic-&gt;log_cluster_size);</div><div class='ctx'> 		return -EIO;</div><div class='hunk'>@@ -493,6 +479,11 @@ static int zstd_decompress_pages(struct decompress_io_ctx *dic)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool zstd_is_level_valid(int lvl)</div><div class='add'>+{</div><div class='add'>+	return lvl &gt;= zstd_min_clevel() &amp;&amp; lvl &lt;= zstd_max_clevel();</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static const struct f2fs_compress_ops f2fs_zstd_ops = {</div><div class='ctx'> 	.init_compress_ctx	= zstd_init_compress_ctx,</div><div class='ctx'> 	.destroy_compress_ctx	= zstd_destroy_compress_ctx,</div><div class='hunk'>@@ -500,6 +491,7 @@ static const struct f2fs_compress_ops f2fs_zstd_ops = {</div><div class='ctx'> 	.init_decompress_ctx	= zstd_init_decompress_ctx,</div><div class='ctx'> 	.destroy_decompress_ctx	= zstd_destroy_decompress_ctx,</div><div class='ctx'> 	.decompress_pages	= zstd_decompress_pages,</div><div class='add'>+	.is_level_valid		= zstd_is_level_valid,</div><div class='ctx'> };</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='hunk'>@@ -512,8 +504,8 @@ static int lzorle_compress_pages(struct compress_ctx *cc)</div><div class='ctx'> 	ret = lzorle1x_1_compress(cc-&gt;rbuf, cc-&gt;rlen, cc-&gt;cbuf-&gt;cdata,</div><div class='ctx'> 					&amp;cc-&gt;clen, cc-&gt;private);</div><div class='ctx'> 	if (ret != LZO_E_OK) {</div><div class='del'>-		printk_ratelimited("%sF2FS-fs (%s): lzo-rle compress failed, ret:%d\n",</div><div class='del'>-				KERN_ERR, F2FS_I_SB(cc-&gt;inode)-&gt;sb-&gt;s_id, ret);</div><div class='add'>+		f2fs_err_ratelimited(F2FS_I_SB(cc-&gt;inode),</div><div class='add'>+				"lzo-rle compress failed, ret:%d", ret);</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -558,19 +550,26 @@ bool f2fs_is_compress_backend_ready(struct inode *inode)</div><div class='ctx'> 	return f2fs_cops[F2FS_I(inode)-&gt;i_compress_algorithm];</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+bool f2fs_is_compress_level_valid(int alg, int lvl)</div><div class='add'>+{</div><div class='add'>+	const struct f2fs_compress_ops *cops = f2fs_cops[alg];</div><div class='add'>+</div><div class='add'>+	if (cops-&gt;is_level_valid)</div><div class='add'>+		return cops-&gt;is_level_valid(lvl);</div><div class='add'>+</div><div class='add'>+	return lvl == 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static mempool_t *compress_page_pool;</div><div class='ctx'> static int num_compress_pages = 512;</div><div class='ctx'> module_param(num_compress_pages, uint, 0444);</div><div class='ctx'> MODULE_PARM_DESC(num_compress_pages,</div><div class='ctx'> 		"Number of intermediate compress pages to preallocate");</div><div class='ctx'> </div><div class='del'>-int f2fs_init_compress_mempool(void)</div><div class='add'>+int __init f2fs_init_compress_mempool(void)</div><div class='ctx'> {</div><div class='ctx'> 	compress_page_pool = mempool_create_page_pool(num_compress_pages, 0);</div><div class='del'>-	if (!compress_page_pool)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='add'>+	return compress_page_pool ? 0 : -ENOMEM;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_destroy_compress_mempool(void)</div><div class='hunk'>@@ -590,11 +589,14 @@ static struct page *f2fs_compress_alloc_page(void)</div><div class='ctx'> </div><div class='ctx'> static void f2fs_compress_free_page(struct page *page)</div><div class='ctx'> {</div><div class='add'>+	struct folio *folio;</div><div class='add'>+</div><div class='ctx'> 	if (!page)</div><div class='ctx'> 		return;</div><div class='del'>-	detach_page_private(page);</div><div class='del'>-	page-&gt;mapping = NULL;</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	folio = page_folio(page);</div><div class='add'>+	folio_detach_private(folio);</div><div class='add'>+	folio-&gt;mapping = NULL;</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> 	mempool_free(page, compress_page_pool);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -616,11 +618,11 @@ static void *f2fs_vmap(struct page **pages, unsigned int count)</div><div class='ctx'> </div><div class='ctx'> static int f2fs_compress_pages(struct compress_ctx *cc)</div><div class='ctx'> {</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(cc-&gt;inode);</div><div class='ctx'> 	struct f2fs_inode_info *fi = F2FS_I(cc-&gt;inode);</div><div class='ctx'> 	const struct f2fs_compress_ops *cops =</div><div class='ctx'> 				f2fs_cops[fi-&gt;i_compress_algorithm];</div><div class='ctx'> 	unsigned int max_len, new_nr_cpages;</div><div class='del'>-	struct page **new_cpages;</div><div class='ctx'> 	u32 chksum = 0;</div><div class='ctx'> 	int i, ret;</div><div class='ctx'> </div><div class='hunk'>@@ -635,20 +637,16 @@ static int f2fs_compress_pages(struct compress_ctx *cc)</div><div class='ctx'> </div><div class='ctx'> 	max_len = COMPRESS_HEADER_SIZE + cc-&gt;clen;</div><div class='ctx'> 	cc-&gt;nr_cpages = DIV_ROUND_UP(max_len, PAGE_SIZE);</div><div class='add'>+	cc-&gt;valid_nr_cpages = cc-&gt;nr_cpages;</div><div class='ctx'> </div><div class='del'>-	cc-&gt;cpages = page_array_alloc(cc-&gt;inode, cc-&gt;nr_cpages);</div><div class='add'>+	cc-&gt;cpages = page_array_alloc(sbi, cc-&gt;nr_cpages);</div><div class='ctx'> 	if (!cc-&gt;cpages) {</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='ctx'> 		goto destroy_compress_ctx;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; cc-&gt;nr_cpages; i++) {</div><div class='add'>+	for (i = 0; i &lt; cc-&gt;nr_cpages; i++)</div><div class='ctx'> 		cc-&gt;cpages[i] = f2fs_compress_alloc_page();</div><div class='del'>-		if (!cc-&gt;cpages[i]) {</div><div class='del'>-			ret = -ENOMEM;</div><div class='del'>-			goto out_free_cpages;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	cc-&gt;rbuf = f2fs_vmap(cc-&gt;rpages, cc-&gt;cluster_size);</div><div class='ctx'> 	if (!cc-&gt;rbuf) {</div><div class='hunk'>@@ -675,9 +673,8 @@ static int f2fs_compress_pages(struct compress_ctx *cc)</div><div class='ctx'> </div><div class='ctx'> 	cc-&gt;cbuf-&gt;clen = cpu_to_le32(cc-&gt;clen);</div><div class='ctx'> </div><div class='del'>-	if (fi-&gt;i_compress_flag &amp; 1 &lt;&lt; COMPRESS_CHKSUM)</div><div class='del'>-		chksum = f2fs_crc32(F2FS_I_SB(cc-&gt;inode),</div><div class='del'>-					cc-&gt;cbuf-&gt;cdata, cc-&gt;clen);</div><div class='add'>+	if (fi-&gt;i_compress_flag &amp; BIT(COMPRESS_CHKSUM))</div><div class='add'>+		chksum = f2fs_crc32(cc-&gt;cbuf-&gt;cdata, cc-&gt;clen);</div><div class='ctx'> 	cc-&gt;cbuf-&gt;chksum = cpu_to_le32(chksum);</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; COMPRESS_DATA_RESERVED_SIZE; i++)</div><div class='hunk'>@@ -685,13 +682,6 @@ static int f2fs_compress_pages(struct compress_ctx *cc)</div><div class='ctx'> </div><div class='ctx'> 	new_nr_cpages = DIV_ROUND_UP(cc-&gt;clen + COMPRESS_HEADER_SIZE, PAGE_SIZE);</div><div class='ctx'> </div><div class='del'>-	/* Now we're going to cut unnecessary tail pages */</div><div class='del'>-	new_cpages = page_array_alloc(cc-&gt;inode, new_nr_cpages);</div><div class='del'>-	if (!new_cpages) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out_vunmap_cbuf;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	/* zero out any unused part of the last page */</div><div class='ctx'> 	memset(&amp;cc-&gt;cbuf-&gt;cdata[cc-&gt;clen], 0,</div><div class='ctx'> 			(new_nr_cpages * PAGE_SIZE) -</div><div class='hunk'>@@ -700,11 +690,7 @@ static int f2fs_compress_pages(struct compress_ctx *cc)</div><div class='ctx'> 	vm_unmap_ram(cc-&gt;cbuf, cc-&gt;nr_cpages);</div><div class='ctx'> 	vm_unmap_ram(cc-&gt;rbuf, cc-&gt;cluster_size);</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; cc-&gt;nr_cpages; i++) {</div><div class='del'>-		if (i &lt; new_nr_cpages) {</div><div class='del'>-			new_cpages[i] = cc-&gt;cpages[i];</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='add'>+	for (i = new_nr_cpages; i &lt; cc-&gt;nr_cpages; i++) {</div><div class='ctx'> 		f2fs_compress_free_page(cc-&gt;cpages[i]);</div><div class='ctx'> 		cc-&gt;cpages[i] = NULL;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -712,9 +698,7 @@ static int f2fs_compress_pages(struct compress_ctx *cc)</div><div class='ctx'> 	if (cops-&gt;destroy_compress_ctx)</div><div class='ctx'> 		cops-&gt;destroy_compress_ctx(cc);</div><div class='ctx'> </div><div class='del'>-	page_array_free(cc-&gt;inode, cc-&gt;cpages, cc-&gt;nr_cpages);</div><div class='del'>-	cc-&gt;cpages = new_cpages;</div><div class='del'>-	cc-&gt;nr_cpages = new_nr_cpages;</div><div class='add'>+	cc-&gt;valid_nr_cpages = new_nr_cpages;</div><div class='ctx'> </div><div class='ctx'> 	trace_f2fs_compress_pages_end(cc-&gt;inode, cc-&gt;cluster_idx,</div><div class='ctx'> 							cc-&gt;clen, ret);</div><div class='hunk'>@@ -729,7 +713,7 @@ out_free_cpages:</div><div class='ctx'> 		if (cc-&gt;cpages[i])</div><div class='ctx'> 			f2fs_compress_free_page(cc-&gt;cpages[i]);</div><div class='ctx'> 	}</div><div class='del'>-	page_array_free(cc-&gt;inode, cc-&gt;cpages, cc-&gt;nr_cpages);</div><div class='add'>+	page_array_free(sbi, cc-&gt;cpages, cc-&gt;nr_cpages);</div><div class='ctx'> 	cc-&gt;cpages = NULL;</div><div class='ctx'> destroy_compress_ctx:</div><div class='ctx'> 	if (cops-&gt;destroy_compress_ctx)</div><div class='hunk'>@@ -740,14 +724,19 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_decompress_cluster(struct decompress_io_ctx *dic)</div><div class='add'>+static int f2fs_prepare_decomp_mem(struct decompress_io_ctx *dic,</div><div class='add'>+		bool pre_alloc);</div><div class='add'>+static void f2fs_release_decomp_mem(struct decompress_io_ctx *dic,</div><div class='add'>+		bool bypass_destroy_callback, bool pre_alloc);</div><div class='add'>+</div><div class='add'>+void f2fs_decompress_cluster(struct decompress_io_ctx *dic, bool in_task)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_sb_info *sbi = F2FS_I_SB(dic-&gt;inode);</div><div class='add'>+	struct f2fs_sb_info *sbi = dic-&gt;sbi;</div><div class='ctx'> 	struct f2fs_inode_info *fi = F2FS_I(dic-&gt;inode);</div><div class='ctx'> 	const struct f2fs_compress_ops *cops =</div><div class='ctx'> 			f2fs_cops[fi-&gt;i_compress_algorithm];</div><div class='add'>+	bool bypass_callback = false;</div><div class='ctx'> 	int ret;</div><div class='del'>-	int i;</div><div class='ctx'> </div><div class='ctx'> 	trace_f2fs_decompress_pages_start(dic-&gt;inode, dic-&gt;cluster_idx,</div><div class='ctx'> 				dic-&gt;cluster_size, fi-&gt;i_compress_algorithm);</div><div class='hunk'>@@ -757,41 +746,10 @@ void f2fs_decompress_cluster(struct decompress_io_ctx *dic)</div><div class='ctx'> 		goto out_end_io;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dic-&gt;tpages = page_array_alloc(dic-&gt;inode, dic-&gt;cluster_size);</div><div class='del'>-	if (!dic-&gt;tpages) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out_end_io;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; dic-&gt;cluster_size; i++) {</div><div class='del'>-		if (dic-&gt;rpages[i]) {</div><div class='del'>-			dic-&gt;tpages[i] = dic-&gt;rpages[i];</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		dic-&gt;tpages[i] = f2fs_compress_alloc_page();</div><div class='del'>-		if (!dic-&gt;tpages[i]) {</div><div class='del'>-			ret = -ENOMEM;</div><div class='del'>-			goto out_end_io;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (cops-&gt;init_decompress_ctx) {</div><div class='del'>-		ret = cops-&gt;init_decompress_ctx(dic);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto out_end_io;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	dic-&gt;rbuf = f2fs_vmap(dic-&gt;tpages, dic-&gt;cluster_size);</div><div class='del'>-	if (!dic-&gt;rbuf) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out_destroy_decompress_ctx;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	dic-&gt;cbuf = f2fs_vmap(dic-&gt;cpages, dic-&gt;nr_cpages);</div><div class='del'>-	if (!dic-&gt;cbuf) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out_vunmap_rbuf;</div><div class='add'>+	ret = f2fs_prepare_decomp_mem(dic, false);</div><div class='add'>+	if (ret) {</div><div class='add'>+		bypass_callback = true;</div><div class='add'>+		goto out_release;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	dic-&gt;clen = le32_to_cpu(dic-&gt;cbuf-&gt;clen);</div><div class='hunk'>@@ -799,63 +757,64 @@ void f2fs_decompress_cluster(struct decompress_io_ctx *dic)</div><div class='ctx'> </div><div class='ctx'> 	if (dic-&gt;clen &gt; PAGE_SIZE * dic-&gt;nr_cpages - COMPRESS_HEADER_SIZE) {</div><div class='ctx'> 		ret = -EFSCORRUPTED;</div><div class='del'>-		goto out_vunmap_cbuf;</div><div class='add'>+</div><div class='add'>+		/* Avoid f2fs_commit_super in irq context */</div><div class='add'>+		f2fs_handle_error(sbi, ERROR_FAIL_DECOMPRESSION);</div><div class='add'>+		goto out_release;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = cops-&gt;decompress_pages(dic);</div><div class='ctx'> </div><div class='del'>-	if (!ret &amp;&amp; (fi-&gt;i_compress_flag &amp; 1 &lt;&lt; COMPRESS_CHKSUM)) {</div><div class='add'>+	if (!ret &amp;&amp; (fi-&gt;i_compress_flag &amp; BIT(COMPRESS_CHKSUM))) {</div><div class='ctx'> 		u32 provided = le32_to_cpu(dic-&gt;cbuf-&gt;chksum);</div><div class='del'>-		u32 calculated = f2fs_crc32(sbi, dic-&gt;cbuf-&gt;cdata, dic-&gt;clen);</div><div class='add'>+		u32 calculated = f2fs_crc32(dic-&gt;cbuf-&gt;cdata, dic-&gt;clen);</div><div class='ctx'> </div><div class='ctx'> 		if (provided != calculated) {</div><div class='ctx'> 			if (!is_inode_flag_set(dic-&gt;inode, FI_COMPRESS_CORRUPT)) {</div><div class='ctx'> 				set_inode_flag(dic-&gt;inode, FI_COMPRESS_CORRUPT);</div><div class='del'>-				printk_ratelimited(</div><div class='del'>-					"%sF2FS-fs (%s): checksum invalid, nid = %lu, %x vs %x",</div><div class='del'>-					KERN_INFO, sbi-&gt;sb-&gt;s_id, dic-&gt;inode-&gt;i_ino,</div><div class='add'>+				f2fs_info_ratelimited(sbi,</div><div class='add'>+					"checksum invalid, nid = %lu, %x vs %x",</div><div class='add'>+					dic-&gt;inode-&gt;i_ino,</div><div class='ctx'> 					provided, calculated);</div><div class='ctx'> 			}</div><div class='ctx'> 			set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-out_vunmap_cbuf:</div><div class='del'>-	vm_unmap_ram(dic-&gt;cbuf, dic-&gt;nr_cpages);</div><div class='del'>-out_vunmap_rbuf:</div><div class='del'>-	vm_unmap_ram(dic-&gt;rbuf, dic-&gt;cluster_size);</div><div class='del'>-out_destroy_decompress_ctx:</div><div class='del'>-	if (cops-&gt;destroy_decompress_ctx)</div><div class='del'>-		cops-&gt;destroy_decompress_ctx(dic);</div><div class='add'>+out_release:</div><div class='add'>+	f2fs_release_decomp_mem(dic, bypass_callback, false);</div><div class='add'>+</div><div class='ctx'> out_end_io:</div><div class='ctx'> 	trace_f2fs_decompress_pages_end(dic-&gt;inode, dic-&gt;cluster_idx,</div><div class='ctx'> 							dic-&gt;clen, ret);</div><div class='del'>-	f2fs_decompress_end_io(dic, ret);</div><div class='add'>+	f2fs_decompress_end_io(dic, ret, in_task);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void f2fs_cache_compressed_page(struct f2fs_sb_info *sbi,</div><div class='add'>+		struct folio *folio, nid_t ino, block_t blkaddr);</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * This is called when a page of a compressed cluster has been read from disk</div><div class='ctx'>  * (or failed to be read from disk).  It checks whether this page was the last</div><div class='ctx'>  * page being waited on in the cluster, and if so, it decompresses the cluster</div><div class='ctx'>  * (or in the case of a failure, cleans up without actually decompressing).</div><div class='ctx'>  */</div><div class='del'>-void f2fs_end_read_compressed_page(struct page *page, bool failed,</div><div class='del'>-						block_t blkaddr)</div><div class='add'>+void f2fs_end_read_compressed_page(struct folio *folio, bool failed,</div><div class='add'>+		block_t blkaddr, bool in_task)</div><div class='ctx'> {</div><div class='del'>-	struct decompress_io_ctx *dic =</div><div class='del'>-			(struct decompress_io_ctx *)page_private(page);</div><div class='del'>-	struct f2fs_sb_info *sbi = F2FS_I_SB(dic-&gt;inode);</div><div class='add'>+	struct decompress_io_ctx *dic = folio-&gt;private;</div><div class='add'>+	struct f2fs_sb_info *sbi = dic-&gt;sbi;</div><div class='ctx'> </div><div class='ctx'> 	dec_page_count(sbi, F2FS_RD_DATA);</div><div class='ctx'> </div><div class='ctx'> 	if (failed)</div><div class='ctx'> 		WRITE_ONCE(dic-&gt;failed, true);</div><div class='del'>-	else if (blkaddr)</div><div class='del'>-		f2fs_cache_compressed_page(sbi, page,</div><div class='add'>+	else if (blkaddr &amp;&amp; in_task)</div><div class='add'>+		f2fs_cache_compressed_page(sbi, folio,</div><div class='ctx'> 					dic-&gt;inode-&gt;i_ino, blkaddr);</div><div class='ctx'> </div><div class='ctx'> 	if (atomic_dec_and_test(&amp;dic-&gt;remaining_pages))</div><div class='del'>-		f2fs_decompress_cluster(dic);</div><div class='add'>+		f2fs_decompress_cluster(dic, in_task);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool is_page_in_cluster(struct compress_ctx *cc, pgoff_t index)</div><div class='hunk'>@@ -882,19 +841,28 @@ bool f2fs_cluster_can_merge_page(struct compress_ctx *cc, pgoff_t index)</div><div class='ctx'> 	return is_page_in_cluster(cc, index);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-bool f2fs_all_cluster_page_loaded(struct compress_ctx *cc, struct pagevec *pvec,</div><div class='del'>-				int index, int nr_pages)</div><div class='add'>+bool f2fs_all_cluster_page_ready(struct compress_ctx *cc, struct page **pages,</div><div class='add'>+				int index, int nr_pages, bool uptodate)</div><div class='ctx'> {</div><div class='del'>-	unsigned long pgidx;</div><div class='del'>-	int i;</div><div class='add'>+	unsigned long pgidx = page_folio(pages[index])-&gt;index;</div><div class='add'>+	int i = uptodate ? 0 : 1;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * when uptodate set to true, try to check all pages in cluster is</div><div class='add'>+	 * uptodate or not.</div><div class='add'>+	 */</div><div class='add'>+	if (uptodate &amp;&amp; (pgidx % cc-&gt;cluster_size))</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	if (nr_pages - index &lt; cc-&gt;cluster_size)</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	pgidx = pvec-&gt;pages[index]-&gt;index;</div><div class='add'>+	for (; i &lt; cc-&gt;cluster_size; i++) {</div><div class='add'>+		struct folio *folio = page_folio(pages[index + i]);</div><div class='ctx'> </div><div class='del'>-	for (i = 1; i &lt; cc-&gt;cluster_size; i++) {</div><div class='del'>-		if (pvec-&gt;pages[index + i]-&gt;index != pgidx + i)</div><div class='add'>+		if (folio-&gt;index != pgidx + i)</div><div class='add'>+			return false;</div><div class='add'>+		if (uptodate &amp;&amp; !folio_test_uptodate(folio))</div><div class='ctx'> 			return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -913,7 +881,7 @@ static bool cluster_has_invalid_data(struct compress_ctx *cc)</div><div class='ctx'> 		f2fs_bug_on(F2FS_I_SB(cc-&gt;inode), !page);</div><div class='ctx'> </div><div class='ctx'> 		/* beyond EOF */</div><div class='del'>-		if (page-&gt;index &gt;= nr_pages)</div><div class='add'>+		if (page_folio(page)-&gt;index &gt;= nr_pages)</div><div class='ctx'> 			return true;</div><div class='ctx'> 	}</div><div class='ctx'> 	return false;</div><div class='hunk'>@@ -921,14 +889,15 @@ static bool cluster_has_invalid_data(struct compress_ctx *cc)</div><div class='ctx'> </div><div class='ctx'> bool f2fs_sanity_check_cluster(struct dnode_of_data *dn)</div><div class='ctx'> {</div><div class='add'>+#ifdef CONFIG_F2FS_CHECK_FS</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(dn-&gt;inode);</div><div class='ctx'> 	unsigned int cluster_size = F2FS_I(dn-&gt;inode)-&gt;i_cluster_size;</div><div class='del'>-	bool compressed = dn-&gt;data_blkaddr == COMPRESS_ADDR;</div><div class='ctx'> 	int cluster_end = 0;</div><div class='add'>+	unsigned int count;</div><div class='ctx'> 	int i;</div><div class='ctx'> 	char *reason = "";</div><div class='ctx'> </div><div class='del'>-	if (!compressed)</div><div class='add'>+	if (dn-&gt;data_blkaddr != COMPRESS_ADDR)</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='ctx'> 	/* [..., COMPR_ADDR, ...] */</div><div class='hunk'>@@ -937,8 +906,8 @@ bool f2fs_sanity_check_cluster(struct dnode_of_data *dn)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	for (i = 1; i &lt; cluster_size; i++) {</div><div class='del'>-		block_t blkaddr = data_blkaddr(dn-&gt;inode, dn-&gt;node_page,</div><div class='add'>+	for (i = 1, count = 1; i &lt; cluster_size; i++, count++) {</div><div class='add'>+		block_t blkaddr = data_blkaddr(dn-&gt;inode, dn-&gt;node_folio,</div><div class='ctx'> 							dn-&gt;ofs_in_node + i);</div><div class='ctx'> </div><div class='ctx'> 		/* [COMPR_ADDR, ..., COMPR_ADDR] */</div><div class='hunk'>@@ -946,32 +915,53 @@ bool f2fs_sanity_check_cluster(struct dnode_of_data *dn)</div><div class='ctx'> 			reason = "[C|*|C|*]";</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='del'>-		if (compressed) {</div><div class='del'>-			if (!__is_valid_data_blkaddr(blkaddr)) {</div><div class='del'>-				if (!cluster_end)</div><div class='del'>-					cluster_end = i;</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='del'>-			/* [COMPR_ADDR, NULL_ADDR or NEW_ADDR, valid_blkaddr] */</div><div class='del'>-			if (cluster_end) {</div><div class='del'>-				reason = "[C|N|N|V]";</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='add'>+		if (!__is_valid_data_blkaddr(blkaddr)) {</div><div class='add'>+			if (!cluster_end)</div><div class='add'>+				cluster_end = i;</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+		/* [COMPR_ADDR, NULL_ADDR or NEW_ADDR, valid_blkaddr] */</div><div class='add'>+		if (cluster_end) {</div><div class='add'>+			reason = "[C|N|N|V]";</div><div class='add'>+			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	f2fs_bug_on(F2FS_I_SB(dn-&gt;inode), count != cluster_size &amp;&amp;</div><div class='add'>+		!is_inode_flag_set(dn-&gt;inode, FI_COMPRESS_RELEASED));</div><div class='add'>+</div><div class='ctx'> 	return false;</div><div class='ctx'> out:</div><div class='ctx'> 	f2fs_warn(sbi, "access invalid cluster, ino:%lu, nid:%u, ofs_in_node:%u, reason:%s",</div><div class='ctx'> 			dn-&gt;inode-&gt;i_ino, dn-&gt;nid, dn-&gt;ofs_in_node, reason);</div><div class='ctx'> 	set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='ctx'> 	return true;</div><div class='add'>+#else</div><div class='add'>+	return false;</div><div class='add'>+#endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __f2fs_cluster_blocks(struct inode *inode,</div><div class='del'>-				unsigned int cluster_idx, bool compr)</div><div class='add'>+static int __f2fs_get_cluster_blocks(struct inode *inode,</div><div class='add'>+					struct dnode_of_data *dn)</div><div class='ctx'> {</div><div class='del'>-	struct dnode_of_data dn;</div><div class='ctx'> 	unsigned int cluster_size = F2FS_I(inode)-&gt;i_cluster_size;</div><div class='add'>+	int count, i;</div><div class='add'>+</div><div class='add'>+	for (i = 0, count = 0; i &lt; cluster_size; i++) {</div><div class='add'>+		block_t blkaddr = data_blkaddr(dn-&gt;inode, dn-&gt;node_folio,</div><div class='add'>+							dn-&gt;ofs_in_node + i);</div><div class='add'>+</div><div class='add'>+		if (__is_valid_data_blkaddr(blkaddr))</div><div class='add'>+			count++;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return count;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int __f2fs_cluster_blocks(struct inode *inode, unsigned int cluster_idx,</div><div class='add'>+				enum cluster_check_type type)</div><div class='add'>+{</div><div class='add'>+	struct dnode_of_data dn;</div><div class='ctx'> 	unsigned int start_idx = cluster_idx &lt;&lt;</div><div class='ctx'> 				F2FS_I(inode)-&gt;i_log_cluster_size;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -990,26 +980,12 @@ static int __f2fs_cluster_blocks(struct inode *inode,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (dn.data_blkaddr == COMPRESS_ADDR) {</div><div class='del'>-		int i;</div><div class='del'>-</div><div class='del'>-		ret = 1;</div><div class='del'>-		for (i = 1; i &lt; cluster_size; i++) {</div><div class='del'>-			block_t blkaddr;</div><div class='del'>-</div><div class='del'>-			blkaddr = data_blkaddr(dn.inode,</div><div class='del'>-					dn.node_page, dn.ofs_in_node + i);</div><div class='del'>-			if (compr) {</div><div class='del'>-				if (__is_valid_data_blkaddr(blkaddr))</div><div class='del'>-					ret++;</div><div class='del'>-			} else {</div><div class='del'>-				if (blkaddr != NULL_ADDR)</div><div class='del'>-					ret++;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		f2fs_bug_on(F2FS_I_SB(inode),</div><div class='del'>-			!compr &amp;&amp; ret != cluster_size &amp;&amp;</div><div class='del'>-			!is_inode_flag_set(inode, FI_COMPRESS_RELEASED));</div><div class='add'>+		if (type == CLUSTER_COMPR_BLKS)</div><div class='add'>+			ret = 1 + __f2fs_get_cluster_blocks(inode, &amp;dn);</div><div class='add'>+		else if (type == CLUSTER_IS_COMPR)</div><div class='add'>+			ret = 1;</div><div class='add'>+	} else if (type == CLUSTER_RAW_BLKS) {</div><div class='add'>+		ret = __f2fs_get_cluster_blocks(inode, &amp;dn);</div><div class='ctx'> 	}</div><div class='ctx'> fail:</div><div class='ctx'> 	f2fs_put_dnode(&amp;dn);</div><div class='hunk'>@@ -1019,15 +995,33 @@ fail:</div><div class='ctx'> /* return # of compressed blocks in compressed cluster */</div><div class='ctx'> static int f2fs_compressed_blocks(struct compress_ctx *cc)</div><div class='ctx'> {</div><div class='del'>-	return __f2fs_cluster_blocks(cc-&gt;inode, cc-&gt;cluster_idx, true);</div><div class='add'>+	return __f2fs_cluster_blocks(cc-&gt;inode, cc-&gt;cluster_idx,</div><div class='add'>+		CLUSTER_COMPR_BLKS);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* return # of valid blocks in compressed cluster */</div><div class='add'>+/* return # of raw blocks in non-compressed cluster */</div><div class='add'>+static int f2fs_decompressed_blocks(struct inode *inode,</div><div class='add'>+				unsigned int cluster_idx)</div><div class='add'>+{</div><div class='add'>+	return __f2fs_cluster_blocks(inode, cluster_idx,</div><div class='add'>+		CLUSTER_RAW_BLKS);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* return whether cluster is compressed one or not */</div><div class='ctx'> int f2fs_is_compressed_cluster(struct inode *inode, pgoff_t index)</div><div class='ctx'> {</div><div class='ctx'> 	return __f2fs_cluster_blocks(inode,</div><div class='ctx'> 		index &gt;&gt; F2FS_I(inode)-&gt;i_log_cluster_size,</div><div class='del'>-		false);</div><div class='add'>+		CLUSTER_IS_COMPR);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* return whether cluster contains non raw blocks or not */</div><div class='add'>+bool f2fs_is_sparse_cluster(struct inode *inode, pgoff_t index)</div><div class='add'>+{</div><div class='add'>+	unsigned int cluster_idx = index &gt;&gt; F2FS_I(inode)-&gt;i_log_cluster_size;</div><div class='add'>+</div><div class='add'>+	return f2fs_decompressed_blocks(inode, cluster_idx) !=</div><div class='add'>+		F2FS_I(inode)-&gt;i_cluster_size;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool cluster_may_compress(struct compress_ctx *cc)</div><div class='hunk'>@@ -1053,13 +1047,40 @@ static void set_cluster_writeback(struct compress_ctx *cc)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void cancel_cluster_writeback(struct compress_ctx *cc,</div><div class='add'>+			struct compress_io_ctx *cic, int submitted)</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	/* Wait for submitted IOs. */</div><div class='add'>+	if (submitted &gt; 1) {</div><div class='add'>+		f2fs_submit_merged_write(F2FS_I_SB(cc-&gt;inode), DATA);</div><div class='add'>+		while (atomic_read(&amp;cic-&gt;pending_pages) !=</div><div class='add'>+					(cc-&gt;valid_nr_cpages - submitted + 1))</div><div class='add'>+			f2fs_io_schedule_timeout(DEFAULT_SCHEDULE_TIMEOUT);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Cancel writeback and stay locked. */</div><div class='add'>+	for (i = 0; i &lt; cc-&gt;cluster_size; i++) {</div><div class='add'>+		if (i &lt; submitted) {</div><div class='add'>+			inode_inc_dirty_pages(cc-&gt;inode);</div><div class='add'>+			lock_page(cc-&gt;rpages[i]);</div><div class='add'>+		}</div><div class='add'>+		clear_page_private_gcing(cc-&gt;rpages[i]);</div><div class='add'>+		if (folio_test_writeback(page_folio(cc-&gt;rpages[i])))</div><div class='add'>+			end_page_writeback(cc-&gt;rpages[i]);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void set_cluster_dirty(struct compress_ctx *cc)</div><div class='ctx'> {</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; cc-&gt;cluster_size; i++)</div><div class='del'>-		if (cc-&gt;rpages[i])</div><div class='add'>+		if (cc-&gt;rpages[i]) {</div><div class='ctx'> 			set_page_dirty(cc-&gt;rpages[i]);</div><div class='add'>+			set_page_private_gcing(cc-&gt;rpages[i]);</div><div class='add'>+		}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int prepare_compress_overwrite(struct compress_ctx *cc,</div><div class='hunk'>@@ -1067,9 +1088,9 @@ static int prepare_compress_overwrite(struct compress_ctx *cc,</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(cc-&gt;inode);</div><div class='ctx'> 	struct address_space *mapping = cc-&gt;inode-&gt;i_mapping;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	sector_t last_block_in_bio;</div><div class='del'>-	unsigned fgp_flag = FGP_LOCK | FGP_WRITE | FGP_CREAT;</div><div class='add'>+	fgf_t fgp_flag = FGP_LOCK | FGP_WRITE | FGP_CREAT;</div><div class='ctx'> 	pgoff_t start_idx = start_idx_of_cluster(cc);</div><div class='ctx'> 	int i, ret;</div><div class='ctx'> </div><div class='hunk'>@@ -1082,32 +1103,32 @@ retry:</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	/* keep page reference to avoid page reclaim */</div><div class='add'>+	/* keep folio reference to avoid page reclaim */</div><div class='ctx'> 	for (i = 0; i &lt; cc-&gt;cluster_size; i++) {</div><div class='del'>-		page = f2fs_pagecache_get_page(mapping, start_idx + i,</div><div class='del'>-							fgp_flag, GFP_NOFS);</div><div class='del'>-		if (!page) {</div><div class='del'>-			ret = -ENOMEM;</div><div class='add'>+		folio = f2fs_filemap_get_folio(mapping, start_idx + i,</div><div class='add'>+				fgp_flag, GFP_NOFS);</div><div class='add'>+		if (IS_ERR(folio)) {</div><div class='add'>+			ret = PTR_ERR(folio);</div><div class='ctx'> 			goto unlock_pages;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (PageUptodate(page))</div><div class='del'>-			f2fs_put_page(page, 1);</div><div class='add'>+		if (folio_test_uptodate(folio))</div><div class='add'>+			f2fs_folio_put(folio, true);</div><div class='ctx'> 		else</div><div class='del'>-			f2fs_compress_ctx_add_page(cc, page);</div><div class='add'>+			f2fs_compress_ctx_add_page(cc, folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!f2fs_cluster_is_empty(cc)) {</div><div class='ctx'> 		struct bio *bio = NULL;</div><div class='ctx'> </div><div class='ctx'> 		ret = f2fs_read_multi_pages(cc, &amp;bio, cc-&gt;cluster_size,</div><div class='del'>-					&amp;last_block_in_bio, false, true);</div><div class='add'>+					&amp;last_block_in_bio, NULL, true);</div><div class='ctx'> 		f2fs_put_rpages(cc);</div><div class='ctx'> 		f2fs_destroy_compress_ctx(cc, true);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		if (bio)</div><div class='del'>-			f2fs_submit_bio(sbi, bio, DATA);</div><div class='add'>+			f2fs_submit_read_bio(sbi, bio, DATA);</div><div class='ctx'> </div><div class='ctx'> 		ret = f2fs_init_compress_ctx(cc);</div><div class='ctx'> 		if (ret)</div><div class='hunk'>@@ -1117,16 +1138,17 @@ retry:</div><div class='ctx'> 	for (i = 0; i &lt; cc-&gt;cluster_size; i++) {</div><div class='ctx'> 		f2fs_bug_on(sbi, cc-&gt;rpages[i]);</div><div class='ctx'> </div><div class='del'>-		page = find_lock_page(mapping, start_idx + i);</div><div class='del'>-		if (!page) {</div><div class='del'>-			/* page can be truncated */</div><div class='add'>+		folio = filemap_lock_folio(mapping, start_idx + i);</div><div class='add'>+		if (IS_ERR(folio)) {</div><div class='add'>+			/* folio could be truncated */</div><div class='ctx'> 			goto release_and_retry;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		f2fs_wait_on_page_writeback(page, DATA, true, true);</div><div class='del'>-		f2fs_compress_ctx_add_page(cc, page);</div><div class='add'>+		f2fs_folio_wait_writeback(folio, DATA, true, true);</div><div class='add'>+		f2fs_compress_ctx_add_page(cc, folio);</div><div class='ctx'> </div><div class='del'>-		if (!PageUptodate(page)) {</div><div class='add'>+		if (!folio_test_uptodate(folio)) {</div><div class='add'>+			f2fs_handle_page_eio(sbi, folio, DATA);</div><div class='ctx'> release_and_retry:</div><div class='ctx'> 			f2fs_put_rpages(cc);</div><div class='ctx'> 			f2fs_unlock_rpages(cc, i + 1);</div><div class='hunk'>@@ -1174,12 +1196,13 @@ bool f2fs_compress_write_end(struct inode *inode, void *fsdata,</div><div class='ctx'> 		.cluster_size = F2FS_I(inode)-&gt;i_cluster_size,</div><div class='ctx'> 		.rpages = fsdata,</div><div class='ctx'> 	};</div><div class='del'>-	bool first_index = (index == cc.rpages[0]-&gt;index);</div><div class='add'>+	struct folio *folio = page_folio(cc.rpages[0]);</div><div class='add'>+	bool first_index = (index == folio-&gt;index);</div><div class='ctx'> </div><div class='ctx'> 	if (copied)</div><div class='ctx'> 		set_cluster_dirty(&amp;cc);</div><div class='ctx'> </div><div class='del'>-	f2fs_put_rpages_wbc(&amp;cc, NULL, false, 1);</div><div class='add'>+	f2fs_put_rpages_wbc(&amp;cc, NULL, false, true);</div><div class='ctx'> 	f2fs_destroy_compress_ctx(&amp;cc, false);</div><div class='ctx'> </div><div class='ctx'> 	return first_index;</div><div class='hunk'>@@ -1189,9 +1212,11 @@ int f2fs_truncate_partial_cluster(struct inode *inode, u64 from, bool lock)</div><div class='ctx'> {</div><div class='ctx'> 	void *fsdata = NULL;</div><div class='ctx'> 	struct page *pagep;</div><div class='add'>+	struct page **rpages;</div><div class='ctx'> 	int log_cluster_size = F2FS_I(inode)-&gt;i_log_cluster_size;</div><div class='ctx'> 	pgoff_t start_idx = from &gt;&gt; (PAGE_SHIFT + log_cluster_size) &lt;&lt;</div><div class='ctx'> 							log_cluster_size;</div><div class='add'>+	int i;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	err = f2fs_is_compressed_cluster(inode, start_idx);</div><div class='hunk'>@@ -1212,26 +1237,30 @@ int f2fs_truncate_partial_cluster(struct inode *inode, u64 from, bool lock)</div><div class='ctx'> 	if (err &lt;= 0)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	if (err &gt; 0) {</div><div class='del'>-		struct page **rpages = fsdata;</div><div class='del'>-		int cluster_size = F2FS_I(inode)-&gt;i_cluster_size;</div><div class='del'>-		int i;</div><div class='add'>+	rpages = fsdata;</div><div class='ctx'> </div><div class='del'>-		for (i = cluster_size - 1; i &gt;= 0; i--) {</div><div class='del'>-			loff_t start = rpages[i]-&gt;index &lt;&lt; PAGE_SHIFT;</div><div class='add'>+	for (i = (1 &lt;&lt; log_cluster_size) - 1; i &gt;= 0; i--) {</div><div class='add'>+		struct folio *folio = page_folio(rpages[i]);</div><div class='add'>+		loff_t start = (loff_t)folio-&gt;index &lt;&lt; PAGE_SHIFT;</div><div class='add'>+		loff_t offset = from &gt; start ? from - start : 0;</div><div class='ctx'> </div><div class='del'>-			if (from &lt;= start) {</div><div class='del'>-				zero_user_segment(rpages[i], 0, PAGE_SIZE);</div><div class='del'>-			} else {</div><div class='del'>-				zero_user_segment(rpages[i], from - start,</div><div class='del'>-								PAGE_SIZE);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='add'>+		folio_zero_segment(folio, offset, folio_size(folio));</div><div class='ctx'> </div><div class='del'>-		f2fs_compress_write_end(inode, fsdata, start_idx, true);</div><div class='add'>+		if (from &gt;= start)</div><div class='add'>+			break;</div><div class='ctx'> 	}</div><div class='del'>-	return 0;</div><div class='add'>+</div><div class='add'>+	f2fs_compress_write_end(inode, fsdata, start_idx, true);</div><div class='add'>+</div><div class='add'>+	err = filemap_write_and_wait_range(inode-&gt;i_mapping,</div><div class='add'>+			round_down(from, 1 &lt;&lt; log_cluster_size &lt;&lt; PAGE_SHIFT),</div><div class='add'>+			LLONG_MAX);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	truncate_pagecache(inode, from);</div><div class='add'>+</div><div class='add'>+	return f2fs_do_truncate_blocks(inode, round_up(from, PAGE_SIZE), lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int f2fs_write_compressed_pages(struct compress_ctx *cc,</div><div class='hunk'>@@ -1252,11 +1281,12 @@ static int f2fs_write_compressed_pages(struct compress_ctx *cc,</div><div class='ctx'> 		.page = NULL,</div><div class='ctx'> 		.encrypted_page = NULL,</div><div class='ctx'> 		.compressed_page = NULL,</div><div class='del'>-		.submitted = false,</div><div class='ctx'> 		.io_type = io_type,</div><div class='ctx'> 		.io_wbc = wbc,</div><div class='del'>-		.encrypted = fscrypt_inode_uses_fs_layer_crypto(cc-&gt;inode),</div><div class='add'>+		.encrypted = fscrypt_inode_uses_fs_layer_crypto(cc-&gt;inode) ?</div><div class='add'>+									1 : 0,</div><div class='ctx'> 	};</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	struct dnode_of_data dn;</div><div class='ctx'> 	struct node_info ni;</div><div class='ctx'> 	struct compress_io_ctx *cic;</div><div class='hunk'>@@ -1264,20 +1294,21 @@ static int f2fs_write_compressed_pages(struct compress_ctx *cc,</div><div class='ctx'> 	unsigned int last_index = cc-&gt;cluster_size - 1;</div><div class='ctx'> 	loff_t psize;</div><div class='ctx'> 	int i, err;</div><div class='add'>+	bool quota_inode = IS_NOQUOTA(inode);</div><div class='ctx'> </div><div class='del'>-	/* we should bypass data pages to proceed the kworkder jobs */</div><div class='add'>+	/* we should bypass data pages to proceed the kworker jobs */</div><div class='ctx'> 	if (unlikely(f2fs_cp_error(sbi))) {</div><div class='del'>-		mapping_set_error(cc-&gt;rpages[0]-&gt;mapping, -EIO);</div><div class='add'>+		mapping_set_error(inode-&gt;i_mapping, -EIO);</div><div class='ctx'> 		goto out_free;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (IS_NOQUOTA(inode)) {</div><div class='add'>+	if (quota_inode) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We need to wait for node_write to avoid block allocation during</div><div class='ctx'> 		 * checkpoint. This can only happen to quota writes which can cause</div><div class='ctx'> 		 * the below discard race condition.</div><div class='ctx'> 		 */</div><div class='del'>-		down_read(&amp;sbi-&gt;node_write);</div><div class='add'>+		f2fs_down_read(&amp;sbi-&gt;node_write);</div><div class='ctx'> 	} else if (!f2fs_trylock_op(sbi)) {</div><div class='ctx'> 		goto out_free;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1289,14 +1320,15 @@ static int f2fs_write_compressed_pages(struct compress_ctx *cc,</div><div class='ctx'> 		goto out_unlock_op;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; cc-&gt;cluster_size; i++) {</div><div class='del'>-		if (data_blkaddr(dn.inode, dn.node_page,</div><div class='add'>+		if (data_blkaddr(dn.inode, dn.node_folio,</div><div class='ctx'> 					dn.ofs_in_node + i) == NULL_ADDR)</div><div class='ctx'> 			goto out_put_dnode;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	psize = (loff_t)(cc-&gt;rpages[last_index]-&gt;index + 1) &lt;&lt; PAGE_SHIFT;</div><div class='add'>+	folio = page_folio(cc-&gt;rpages[last_index]);</div><div class='add'>+	psize = folio_next_pos(folio);</div><div class='ctx'> </div><div class='del'>-	err = f2fs_get_node_info(fio.sbi, dn.nid, &amp;ni);</div><div class='add'>+	err = f2fs_get_node_info(fio.sbi, dn.nid, &amp;ni, false);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out_put_dnode;</div><div class='ctx'> </div><div class='hunk'>@@ -1308,19 +1340,19 @@ static int f2fs_write_compressed_pages(struct compress_ctx *cc,</div><div class='ctx'> </div><div class='ctx'> 	cic-&gt;magic = F2FS_COMPRESSED_PAGE_MAGIC;</div><div class='ctx'> 	cic-&gt;inode = inode;</div><div class='del'>-	atomic_set(&amp;cic-&gt;pending_pages, cc-&gt;nr_cpages);</div><div class='del'>-	cic-&gt;rpages = page_array_alloc(cc-&gt;inode, cc-&gt;cluster_size);</div><div class='add'>+	atomic_set(&amp;cic-&gt;pending_pages, cc-&gt;valid_nr_cpages);</div><div class='add'>+	cic-&gt;rpages = page_array_alloc(sbi, cc-&gt;cluster_size);</div><div class='ctx'> 	if (!cic-&gt;rpages)</div><div class='ctx'> 		goto out_put_cic;</div><div class='ctx'> </div><div class='ctx'> 	cic-&gt;nr_rpages = cc-&gt;cluster_size;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; cc-&gt;nr_cpages; i++) {</div><div class='add'>+	for (i = 0; i &lt; cc-&gt;valid_nr_cpages; i++) {</div><div class='ctx'> 		f2fs_set_compressed_page(cc-&gt;cpages[i], inode,</div><div class='del'>-					cc-&gt;rpages[i + 1]-&gt;index, cic);</div><div class='add'>+				page_folio(cc-&gt;rpages[i + 1])-&gt;index, cic);</div><div class='ctx'> 		fio.compressed_page = cc-&gt;cpages[i];</div><div class='ctx'> </div><div class='del'>-		fio.old_blkaddr = data_blkaddr(dn.inode, dn.node_page,</div><div class='add'>+		fio.old_blkaddr = data_blkaddr(dn.inode, dn.node_folio,</div><div class='ctx'> 						dn.ofs_in_node + i + 1);</div><div class='ctx'> </div><div class='ctx'> 		/* wait for GCed page writeback via META_MAPPING */</div><div class='hunk'>@@ -1352,7 +1384,7 @@ static int f2fs_write_compressed_pages(struct compress_ctx *cc,</div><div class='ctx'> 			if (blkaddr == COMPRESS_ADDR)</div><div class='ctx'> 				fio.compr_blocks++;</div><div class='ctx'> 			if (__is_valid_data_blkaddr(blkaddr))</div><div class='del'>-				f2fs_invalidate_blocks(sbi, blkaddr);</div><div class='add'>+				f2fs_invalidate_blocks(sbi, blkaddr, 1);</div><div class='ctx'> 			f2fs_update_data_blkaddr(&amp;dn, COMPRESS_ADDR);</div><div class='ctx'> 			goto unlock_continue;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1360,9 +1392,9 @@ static int f2fs_write_compressed_pages(struct compress_ctx *cc,</div><div class='ctx'> 		if (fio.compr_blocks &amp;&amp; __is_valid_data_blkaddr(blkaddr))</div><div class='ctx'> 			fio.compr_blocks++;</div><div class='ctx'> </div><div class='del'>-		if (i &gt; cc-&gt;nr_cpages) {</div><div class='add'>+		if (i &gt; cc-&gt;valid_nr_cpages) {</div><div class='ctx'> 			if (__is_valid_data_blkaddr(blkaddr)) {</div><div class='del'>-				f2fs_invalidate_blocks(sbi, blkaddr);</div><div class='add'>+				f2fs_invalidate_blocks(sbi, blkaddr, 1);</div><div class='ctx'> 				f2fs_update_data_blkaddr(&amp;dn, NEW_ADDR);</div><div class='ctx'> 			}</div><div class='ctx'> 			goto unlock_continue;</div><div class='hunk'>@@ -1376,25 +1408,32 @@ static int f2fs_write_compressed_pages(struct compress_ctx *cc,</div><div class='ctx'> 			fio.compressed_page = cc-&gt;cpages[i - 1];</div><div class='ctx'> </div><div class='ctx'> 		cc-&gt;cpages[i - 1] = NULL;</div><div class='add'>+		fio.submitted = 0;</div><div class='ctx'> 		f2fs_outplace_write_data(&amp;dn, &amp;fio);</div><div class='add'>+		if (unlikely(!fio.submitted)) {</div><div class='add'>+			cancel_cluster_writeback(cc, cic, i);</div><div class='add'>+</div><div class='add'>+			/* To call fscrypt_finalize_bounce_page */</div><div class='add'>+			i = cc-&gt;valid_nr_cpages;</div><div class='add'>+			*submitted = 0;</div><div class='add'>+			goto out_destroy_crypt;</div><div class='add'>+		}</div><div class='ctx'> 		(*submitted)++;</div><div class='ctx'> unlock_continue:</div><div class='ctx'> 		inode_dec_dirty_pages(cc-&gt;inode);</div><div class='del'>-		unlock_page(fio.page);</div><div class='add'>+		folio_unlock(fio.folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (fio.compr_blocks)</div><div class='ctx'> 		f2fs_i_compr_blocks_update(inode, fio.compr_blocks - 1, false);</div><div class='del'>-	f2fs_i_compr_blocks_update(inode, cc-&gt;nr_cpages, true);</div><div class='del'>-	add_compr_block_stat(inode, cc-&gt;nr_cpages);</div><div class='add'>+	f2fs_i_compr_blocks_update(inode, cc-&gt;valid_nr_cpages, true);</div><div class='add'>+	add_compr_block_stat(inode, cc-&gt;valid_nr_cpages);</div><div class='ctx'> </div><div class='ctx'> 	set_inode_flag(cc-&gt;inode, FI_APPEND_WRITE);</div><div class='del'>-	if (cc-&gt;cluster_idx == 0)</div><div class='del'>-		set_inode_flag(inode, FI_FIRST_BLOCK_WRITTEN);</div><div class='ctx'> </div><div class='ctx'> 	f2fs_put_dnode(&amp;dn);</div><div class='del'>-	if (IS_NOQUOTA(inode))</div><div class='del'>-		up_read(&amp;sbi-&gt;node_write);</div><div class='add'>+	if (quota_inode)</div><div class='add'>+		f2fs_up_read(&amp;sbi-&gt;node_write);</div><div class='ctx'> 	else</div><div class='ctx'> 		f2fs_unlock_op(sbi);</div><div class='ctx'> </div><div class='hunk'>@@ -1404,50 +1443,53 @@ unlock_continue:</div><div class='ctx'> 	spin_unlock(&amp;fi-&gt;i_size_lock);</div><div class='ctx'> </div><div class='ctx'> 	f2fs_put_rpages(cc);</div><div class='del'>-	page_array_free(cc-&gt;inode, cc-&gt;cpages, cc-&gt;nr_cpages);</div><div class='add'>+	page_array_free(sbi, cc-&gt;cpages, cc-&gt;nr_cpages);</div><div class='ctx'> 	cc-&gt;cpages = NULL;</div><div class='ctx'> 	f2fs_destroy_compress_ctx(cc, false);</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> out_destroy_crypt:</div><div class='del'>-	page_array_free(cc-&gt;inode, cic-&gt;rpages, cc-&gt;cluster_size);</div><div class='add'>+	page_array_free(sbi, cic-&gt;rpages, cc-&gt;cluster_size);</div><div class='ctx'> </div><div class='del'>-	for (--i; i &gt;= 0; i--)</div><div class='add'>+	for (--i; i &gt;= 0; i--) {</div><div class='add'>+		if (!cc-&gt;cpages[i])</div><div class='add'>+			continue;</div><div class='ctx'> 		fscrypt_finalize_bounce_page(&amp;cc-&gt;cpages[i]);</div><div class='add'>+	}</div><div class='ctx'> out_put_cic:</div><div class='ctx'> 	kmem_cache_free(cic_entry_slab, cic);</div><div class='ctx'> out_put_dnode:</div><div class='ctx'> 	f2fs_put_dnode(&amp;dn);</div><div class='ctx'> out_unlock_op:</div><div class='del'>-	if (IS_NOQUOTA(inode))</div><div class='del'>-		up_read(&amp;sbi-&gt;node_write);</div><div class='add'>+	if (quota_inode)</div><div class='add'>+		f2fs_up_read(&amp;sbi-&gt;node_write);</div><div class='ctx'> 	else</div><div class='ctx'> 		f2fs_unlock_op(sbi);</div><div class='ctx'> out_free:</div><div class='del'>-	for (i = 0; i &lt; cc-&gt;nr_cpages; i++) {</div><div class='del'>-		if (!cc-&gt;cpages[i])</div><div class='del'>-			continue;</div><div class='add'>+	for (i = 0; i &lt; cc-&gt;valid_nr_cpages; i++) {</div><div class='ctx'> 		f2fs_compress_free_page(cc-&gt;cpages[i]);</div><div class='ctx'> 		cc-&gt;cpages[i] = NULL;</div><div class='ctx'> 	}</div><div class='del'>-	page_array_free(cc-&gt;inode, cc-&gt;cpages, cc-&gt;nr_cpages);</div><div class='add'>+	page_array_free(sbi, cc-&gt;cpages, cc-&gt;nr_cpages);</div><div class='ctx'> 	cc-&gt;cpages = NULL;</div><div class='ctx'> 	return -EAGAIN;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_compress_write_end_io(struct bio *bio, struct page *page)</div><div class='add'>+void f2fs_compress_write_end_io(struct bio *bio, struct folio *folio)</div><div class='ctx'> {</div><div class='add'>+	struct page *page = &amp;folio-&gt;page;</div><div class='ctx'> 	struct f2fs_sb_info *sbi = bio-&gt;bi_private;</div><div class='del'>-	struct compress_io_ctx *cic =</div><div class='del'>-			(struct compress_io_ctx *)page_private(page);</div><div class='add'>+	struct compress_io_ctx *cic = folio-&gt;private;</div><div class='add'>+	enum count_type type = WB_DATA_TYPE(folio,</div><div class='add'>+				f2fs_is_compressed_page(folio));</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(bio-&gt;bi_status))</div><div class='add'>+	if (unlikely(bio-&gt;bi_status != BLK_STS_OK))</div><div class='ctx'> 		mapping_set_error(cic-&gt;inode-&gt;i_mapping, -EIO);</div><div class='ctx'> </div><div class='ctx'> 	f2fs_compress_free_page(page);</div><div class='ctx'> </div><div class='del'>-	dec_page_count(sbi, F2FS_WB_DATA);</div><div class='add'>+	dec_page_count(sbi, type);</div><div class='ctx'> </div><div class='ctx'> 	if (atomic_dec_return(&amp;cic-&gt;pending_pages))</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -1458,85 +1500,95 @@ void f2fs_compress_write_end_io(struct bio *bio, struct page *page)</div><div class='ctx'> 		end_page_writeback(cic-&gt;rpages[i]);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	page_array_free(cic-&gt;inode, cic-&gt;rpages, cic-&gt;nr_rpages);</div><div class='add'>+	page_array_free(sbi, cic-&gt;rpages, cic-&gt;nr_rpages);</div><div class='ctx'> 	kmem_cache_free(cic_entry_slab, cic);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int f2fs_write_raw_pages(struct compress_ctx *cc,</div><div class='del'>-					int *submitted,</div><div class='add'>+					int *submitted_p,</div><div class='ctx'> 					struct writeback_control *wbc,</div><div class='ctx'> 					enum iostat_type io_type)</div><div class='ctx'> {</div><div class='ctx'> 	struct address_space *mapping = cc-&gt;inode-&gt;i_mapping;</div><div class='del'>-	int _submitted, compr_blocks, ret;</div><div class='del'>-	int i = -1, err = 0;</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_M_SB(mapping);</div><div class='add'>+	int submitted, compr_blocks, i;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	compr_blocks = f2fs_compressed_blocks(cc);</div><div class='del'>-	if (compr_blocks &lt; 0) {</div><div class='del'>-		err = compr_blocks;</div><div class='del'>-		goto out_err;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; cc-&gt;cluster_size; i++) {</div><div class='add'>+		if (!cc-&gt;rpages[i])</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		redirty_page_for_writepage(wbc, cc-&gt;rpages[i]);</div><div class='add'>+		unlock_page(cc-&gt;rpages[i]);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (compr_blocks &lt; 0)</div><div class='add'>+		return compr_blocks;</div><div class='add'>+</div><div class='add'>+	/* overwrite compressed cluster w/ normal cluster */</div><div class='add'>+	if (compr_blocks &gt; 0)</div><div class='add'>+		f2fs_lock_op(sbi);</div><div class='add'>+</div><div class='ctx'> 	for (i = 0; i &lt; cc-&gt;cluster_size; i++) {</div><div class='add'>+		struct folio *folio;</div><div class='add'>+</div><div class='ctx'> 		if (!cc-&gt;rpages[i])</div><div class='ctx'> 			continue;</div><div class='add'>+		folio = page_folio(cc-&gt;rpages[i]);</div><div class='ctx'> retry_write:</div><div class='del'>-		if (cc-&gt;rpages[i]-&gt;mapping != mapping) {</div><div class='del'>-			unlock_page(cc-&gt;rpages[i]);</div><div class='add'>+		folio_lock(folio);</div><div class='add'>+</div><div class='add'>+		if (folio-&gt;mapping != mapping) {</div><div class='add'>+continue_unlock:</div><div class='add'>+			folio_unlock(folio);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		BUG_ON(!PageLocked(cc-&gt;rpages[i]));</div><div class='add'>+		if (!folio_test_dirty(folio))</div><div class='add'>+			goto continue_unlock;</div><div class='add'>+</div><div class='add'>+		if (folio_test_writeback(folio)) {</div><div class='add'>+			if (wbc-&gt;sync_mode == WB_SYNC_NONE)</div><div class='add'>+				goto continue_unlock;</div><div class='add'>+			f2fs_folio_wait_writeback(folio, DATA, true, true);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (!folio_clear_dirty_for_io(folio))</div><div class='add'>+			goto continue_unlock;</div><div class='ctx'> </div><div class='del'>-		ret = f2fs_write_single_data_page(cc-&gt;rpages[i], &amp;_submitted,</div><div class='add'>+		submitted = 0;</div><div class='add'>+		ret = f2fs_write_single_data_page(folio, &amp;submitted,</div><div class='ctx'> 						NULL, NULL, wbc, io_type,</div><div class='ctx'> 						compr_blocks, false);</div><div class='ctx'> 		if (ret) {</div><div class='del'>-			if (ret == AOP_WRITEPAGE_ACTIVATE) {</div><div class='del'>-				unlock_page(cc-&gt;rpages[i]);</div><div class='add'>+			if (ret == 1) {</div><div class='ctx'> 				ret = 0;</div><div class='ctx'> 			} else if (ret == -EAGAIN) {</div><div class='add'>+				ret = 0;</div><div class='ctx'> 				/*</div><div class='ctx'> 				 * for quota file, just redirty left pages to</div><div class='ctx'> 				 * avoid deadlock caused by cluster update race</div><div class='ctx'> 				 * from foreground operation.</div><div class='ctx'> 				 */</div><div class='del'>-				if (IS_NOQUOTA(cc-&gt;inode)) {</div><div class='del'>-					err = 0;</div><div class='del'>-					goto out_err;</div><div class='del'>-				}</div><div class='del'>-				ret = 0;</div><div class='del'>-				cond_resched();</div><div class='del'>-				congestion_wait(BLK_RW_ASYNC,</div><div class='del'>-						DEFAULT_IO_TIMEOUT);</div><div class='del'>-				lock_page(cc-&gt;rpages[i]);</div><div class='del'>-</div><div class='del'>-				if (!PageDirty(cc-&gt;rpages[i])) {</div><div class='del'>-					unlock_page(cc-&gt;rpages[i]);</div><div class='del'>-					continue;</div><div class='del'>-				}</div><div class='del'>-</div><div class='del'>-				clear_page_dirty_for_io(cc-&gt;rpages[i]);</div><div class='add'>+				if (IS_NOQUOTA(cc-&gt;inode))</div><div class='add'>+					goto out;</div><div class='add'>+				f2fs_schedule_timeout(DEFAULT_SCHEDULE_TIMEOUT);</div><div class='ctx'> 				goto retry_write;</div><div class='ctx'> 			}</div><div class='del'>-			err = ret;</div><div class='del'>-			goto out_err;</div><div class='add'>+			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		*submitted += _submitted;</div><div class='add'>+		*submitted_p += submitted;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	f2fs_balance_fs(F2FS_M_SB(mapping), true);</div><div class='add'>+out:</div><div class='add'>+	if (compr_blocks &gt; 0)</div><div class='add'>+		f2fs_unlock_op(sbi);</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='del'>-out_err:</div><div class='del'>-	for (++i; i &lt; cc-&gt;cluster_size; i++) {</div><div class='del'>-		if (!cc-&gt;rpages[i])</div><div class='del'>-			continue;</div><div class='del'>-		redirty_page_for_writepage(wbc, cc-&gt;rpages[i]);</div><div class='del'>-		unlock_page(cc-&gt;rpages[i]);</div><div class='del'>-	}</div><div class='del'>-	return err;</div><div class='add'>+	f2fs_balance_fs(sbi, true);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int f2fs_write_multi_pages(struct compress_ctx *cc,</div><div class='hunk'>@@ -1553,7 +1605,7 @@ int f2fs_write_multi_pages(struct compress_ctx *cc,</div><div class='ctx'> 			add_compr_block_stat(cc-&gt;inode, cc-&gt;cluster_size);</div><div class='ctx'> 			goto write;</div><div class='ctx'> 		} else if (err) {</div><div class='del'>-			f2fs_put_rpages_wbc(cc, wbc, true, 1);</div><div class='add'>+			f2fs_put_rpages_wbc(cc, wbc, true, true);</div><div class='ctx'> 			goto destroy_out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -1567,26 +1619,87 @@ write:</div><div class='ctx'> 	f2fs_bug_on(F2FS_I_SB(cc-&gt;inode), *submitted);</div><div class='ctx'> </div><div class='ctx'> 	err = f2fs_write_raw_pages(cc, submitted, wbc, io_type);</div><div class='del'>-	f2fs_put_rpages_wbc(cc, wbc, false, 0);</div><div class='add'>+	f2fs_put_rpages_wbc(cc, wbc, false, false);</div><div class='ctx'> destroy_out:</div><div class='ctx'> 	f2fs_destroy_compress_ctx(cc, false);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void f2fs_free_dic(struct decompress_io_ctx *dic);</div><div class='add'>+static inline bool allow_memalloc_for_decomp(struct f2fs_sb_info *sbi,</div><div class='add'>+		bool pre_alloc)</div><div class='add'>+{</div><div class='add'>+	return pre_alloc ^ f2fs_low_mem_mode(sbi);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int f2fs_prepare_decomp_mem(struct decompress_io_ctx *dic,</div><div class='add'>+		bool pre_alloc)</div><div class='add'>+{</div><div class='add'>+	const struct f2fs_compress_ops *cops = f2fs_cops[dic-&gt;compress_algorithm];</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	if (!allow_memalloc_for_decomp(dic-&gt;sbi, pre_alloc))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	dic-&gt;tpages = page_array_alloc(dic-&gt;sbi, dic-&gt;cluster_size);</div><div class='add'>+	if (!dic-&gt;tpages)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; dic-&gt;cluster_size; i++) {</div><div class='add'>+		if (dic-&gt;rpages[i]) {</div><div class='add'>+			dic-&gt;tpages[i] = dic-&gt;rpages[i];</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		dic-&gt;tpages[i] = f2fs_compress_alloc_page();</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	dic-&gt;rbuf = f2fs_vmap(dic-&gt;tpages, dic-&gt;cluster_size);</div><div class='add'>+	if (!dic-&gt;rbuf)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	dic-&gt;cbuf = f2fs_vmap(dic-&gt;cpages, dic-&gt;nr_cpages);</div><div class='add'>+	if (!dic-&gt;cbuf)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	if (cops-&gt;init_decompress_ctx)</div><div class='add'>+		return cops-&gt;init_decompress_ctx(dic);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void f2fs_release_decomp_mem(struct decompress_io_ctx *dic,</div><div class='add'>+		bool bypass_destroy_callback, bool pre_alloc)</div><div class='add'>+{</div><div class='add'>+	const struct f2fs_compress_ops *cops = f2fs_cops[dic-&gt;compress_algorithm];</div><div class='add'>+</div><div class='add'>+	if (!allow_memalloc_for_decomp(dic-&gt;sbi, pre_alloc))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (!bypass_destroy_callback &amp;&amp; cops-&gt;destroy_decompress_ctx)</div><div class='add'>+		cops-&gt;destroy_decompress_ctx(dic);</div><div class='add'>+</div><div class='add'>+	if (dic-&gt;cbuf)</div><div class='add'>+		vm_unmap_ram(dic-&gt;cbuf, dic-&gt;nr_cpages);</div><div class='add'>+</div><div class='add'>+	if (dic-&gt;rbuf)</div><div class='add'>+		vm_unmap_ram(dic-&gt;rbuf, dic-&gt;cluster_size);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void f2fs_free_dic(struct decompress_io_ctx *dic,</div><div class='add'>+		bool bypass_destroy_callback);</div><div class='ctx'> </div><div class='ctx'> struct decompress_io_ctx *f2fs_alloc_dic(struct compress_ctx *cc)</div><div class='ctx'> {</div><div class='ctx'> 	struct decompress_io_ctx *dic;</div><div class='ctx'> 	pgoff_t start_idx = start_idx_of_cluster(cc);</div><div class='del'>-	int i;</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(cc-&gt;inode);</div><div class='add'>+	int i, ret;</div><div class='ctx'> </div><div class='del'>-	dic = f2fs_kmem_cache_alloc(dic_entry_slab, GFP_F2FS_ZERO,</div><div class='del'>-					false, F2FS_I_SB(cc-&gt;inode));</div><div class='add'>+	dic = f2fs_kmem_cache_alloc(dic_entry_slab, GFP_F2FS_ZERO, false, sbi);</div><div class='ctx'> 	if (!dic)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='del'>-	dic-&gt;rpages = page_array_alloc(cc-&gt;inode, cc-&gt;cluster_size);</div><div class='add'>+	dic-&gt;rpages = page_array_alloc(sbi, cc-&gt;cluster_size);</div><div class='ctx'> 	if (!dic-&gt;rpages) {</div><div class='ctx'> 		kmem_cache_free(dic_entry_slab, dic);</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='hunk'>@@ -1594,6 +1707,8 @@ struct decompress_io_ctx *f2fs_alloc_dic(struct compress_ctx *cc)</div><div class='ctx'> </div><div class='ctx'> 	dic-&gt;magic = F2FS_COMPRESSED_PAGE_MAGIC;</div><div class='ctx'> 	dic-&gt;inode = cc-&gt;inode;</div><div class='add'>+	dic-&gt;sbi = sbi;</div><div class='add'>+	dic-&gt;compress_algorithm = F2FS_I(cc-&gt;inode)-&gt;i_compress_algorithm;</div><div class='ctx'> 	atomic_set(&amp;dic-&gt;remaining_pages, cc-&gt;nr_cpages);</div><div class='ctx'> 	dic-&gt;cluster_idx = cc-&gt;cluster_idx;</div><div class='ctx'> 	dic-&gt;cluster_size = cc-&gt;cluster_size;</div><div class='hunk'>@@ -1607,32 +1722,40 @@ struct decompress_io_ctx *f2fs_alloc_dic(struct compress_ctx *cc)</div><div class='ctx'> 		dic-&gt;rpages[i] = cc-&gt;rpages[i];</div><div class='ctx'> 	dic-&gt;nr_rpages = cc-&gt;cluster_size;</div><div class='ctx'> </div><div class='del'>-	dic-&gt;cpages = page_array_alloc(dic-&gt;inode, dic-&gt;nr_cpages);</div><div class='del'>-	if (!dic-&gt;cpages)</div><div class='add'>+	dic-&gt;cpages = page_array_alloc(sbi, dic-&gt;nr_cpages);</div><div class='add'>+	if (!dic-&gt;cpages) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='ctx'> 		goto out_free;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; dic-&gt;nr_cpages; i++) {</div><div class='ctx'> 		struct page *page;</div><div class='ctx'> </div><div class='ctx'> 		page = f2fs_compress_alloc_page();</div><div class='del'>-		if (!page)</div><div class='del'>-			goto out_free;</div><div class='del'>-</div><div class='ctx'> 		f2fs_set_compressed_page(page, cc-&gt;inode,</div><div class='ctx'> 					start_idx + i + 1, dic);</div><div class='ctx'> 		dic-&gt;cpages[i] = page;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	ret = f2fs_prepare_decomp_mem(dic, true);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_free;</div><div class='add'>+</div><div class='ctx'> 	return dic;</div><div class='ctx'> </div><div class='ctx'> out_free:</div><div class='del'>-	f2fs_free_dic(dic);</div><div class='del'>-	return ERR_PTR(-ENOMEM);</div><div class='add'>+	f2fs_free_dic(dic, true);</div><div class='add'>+	return ERR_PTR(ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void f2fs_free_dic(struct decompress_io_ctx *dic)</div><div class='add'>+static void f2fs_free_dic(struct decompress_io_ctx *dic,</div><div class='add'>+		bool bypass_destroy_callback)</div><div class='ctx'> {</div><div class='ctx'> 	int i;</div><div class='add'>+	/* use sbi in dic to avoid UFA of dic-&gt;inode*/</div><div class='add'>+	struct f2fs_sb_info *sbi = dic-&gt;sbi;</div><div class='add'>+</div><div class='add'>+	f2fs_release_decomp_mem(dic, bypass_destroy_callback, true);</div><div class='ctx'> </div><div class='ctx'> 	if (dic-&gt;tpages) {</div><div class='ctx'> 		for (i = 0; i &lt; dic-&gt;cluster_size; i++) {</div><div class='hunk'>@@ -1642,7 +1765,7 @@ static void f2fs_free_dic(struct decompress_io_ctx *dic)</div><div class='ctx'> 				continue;</div><div class='ctx'> 			f2fs_compress_free_page(dic-&gt;tpages[i]);</div><div class='ctx'> 		}</div><div class='del'>-		page_array_free(dic-&gt;inode, dic-&gt;tpages, dic-&gt;cluster_size);</div><div class='add'>+		page_array_free(sbi, dic-&gt;tpages, dic-&gt;cluster_size);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (dic-&gt;cpages) {</div><div class='hunk'>@@ -1651,45 +1774,31 @@ static void f2fs_free_dic(struct decompress_io_ctx *dic)</div><div class='ctx'> 				continue;</div><div class='ctx'> 			f2fs_compress_free_page(dic-&gt;cpages[i]);</div><div class='ctx'> 		}</div><div class='del'>-		page_array_free(dic-&gt;inode, dic-&gt;cpages, dic-&gt;nr_cpages);</div><div class='add'>+		page_array_free(sbi, dic-&gt;cpages, dic-&gt;nr_cpages);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	page_array_free(dic-&gt;inode, dic-&gt;rpages, dic-&gt;nr_rpages);</div><div class='add'>+	page_array_free(sbi, dic-&gt;rpages, dic-&gt;nr_rpages);</div><div class='ctx'> 	kmem_cache_free(dic_entry_slab, dic);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void f2fs_put_dic(struct decompress_io_ctx *dic)</div><div class='add'>+static void f2fs_late_free_dic(struct work_struct *work)</div><div class='ctx'> {</div><div class='del'>-	if (refcount_dec_and_test(&amp;dic-&gt;refcnt))</div><div class='del'>-		f2fs_free_dic(dic);</div><div class='add'>+	struct decompress_io_ctx *dic =</div><div class='add'>+		container_of(work, struct decompress_io_ctx, free_work);</div><div class='add'>+</div><div class='add'>+	f2fs_free_dic(dic, false);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Update and unlock the cluster's pagecache pages, and release the reference to</div><div class='del'>- * the decompress_io_ctx that was being held for I/O completion.</div><div class='del'>- */</div><div class='del'>-static void __f2fs_decompress_end_io(struct decompress_io_ctx *dic, bool failed)</div><div class='add'>+static void f2fs_put_dic(struct decompress_io_ctx *dic, bool in_task)</div><div class='ctx'> {</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; dic-&gt;cluster_size; i++) {</div><div class='del'>-		struct page *rpage = dic-&gt;rpages[i];</div><div class='del'>-</div><div class='del'>-		if (!rpage)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		/* PG_error was set if verity failed. */</div><div class='del'>-		if (failed || PageError(rpage)) {</div><div class='del'>-			ClearPageUptodate(rpage);</div><div class='del'>-			/* will re-read again later */</div><div class='del'>-			ClearPageError(rpage);</div><div class='add'>+	if (refcount_dec_and_test(&amp;dic-&gt;refcnt)) {</div><div class='add'>+		if (in_task) {</div><div class='add'>+			f2fs_free_dic(dic, false);</div><div class='ctx'> 		} else {</div><div class='del'>-			SetPageUptodate(rpage);</div><div class='add'>+			INIT_WORK(&amp;dic-&gt;free_work, f2fs_late_free_dic);</div><div class='add'>+			queue_work(dic-&gt;sbi-&gt;post_read_wq, &amp;dic-&gt;free_work);</div><div class='ctx'> 		}</div><div class='del'>-		unlock_page(rpage);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	f2fs_put_dic(dic);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void f2fs_verify_cluster(struct work_struct *work)</div><div class='hunk'>@@ -1698,23 +1807,32 @@ static void f2fs_verify_cluster(struct work_struct *work)</div><div class='ctx'> 		container_of(work, struct decompress_io_ctx, verity_work);</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	/* Verify the cluster's decompressed pages with fs-verity. */</div><div class='add'>+	/* Verify, update, and unlock the decompressed pages. */</div><div class='ctx'> 	for (i = 0; i &lt; dic-&gt;cluster_size; i++) {</div><div class='ctx'> 		struct page *rpage = dic-&gt;rpages[i];</div><div class='ctx'> </div><div class='del'>-		if (rpage &amp;&amp; !fsverity_verify_page(rpage))</div><div class='del'>-			SetPageError(rpage);</div><div class='add'>+		if (!rpage)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		if (fsverity_verify_page(rpage))</div><div class='add'>+			SetPageUptodate(rpage);</div><div class='add'>+		else</div><div class='add'>+			ClearPageUptodate(rpage);</div><div class='add'>+		unlock_page(rpage);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	__f2fs_decompress_end_io(dic, false);</div><div class='add'>+	f2fs_put_dic(dic, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * This is called when a compressed cluster has been decompressed</div><div class='ctx'>  * (or failed to be read and/or decompressed).</div><div class='ctx'>  */</div><div class='del'>-void f2fs_decompress_end_io(struct decompress_io_ctx *dic, bool failed)</div><div class='add'>+void f2fs_decompress_end_io(struct decompress_io_ctx *dic, bool failed,</div><div class='add'>+				bool in_task)</div><div class='ctx'> {</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='ctx'> 	if (!failed &amp;&amp; dic-&gt;need_verity) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Note that to avoid deadlocks, the verity work can't be done</div><div class='hunk'>@@ -1724,38 +1842,58 @@ void f2fs_decompress_end_io(struct decompress_io_ctx *dic, bool failed)</div><div class='ctx'> 		 */</div><div class='ctx'> 		INIT_WORK(&amp;dic-&gt;verity_work, f2fs_verify_cluster);</div><div class='ctx'> 		fsverity_enqueue_verify_work(&amp;dic-&gt;verity_work);</div><div class='del'>-	} else {</div><div class='del'>-		__f2fs_decompress_end_io(dic, failed);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Update and unlock the cluster's pagecache pages. */</div><div class='add'>+	for (i = 0; i &lt; dic-&gt;cluster_size; i++) {</div><div class='add'>+		struct page *rpage = dic-&gt;rpages[i];</div><div class='add'>+</div><div class='add'>+		if (!rpage)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		if (failed)</div><div class='add'>+			ClearPageUptodate(rpage);</div><div class='add'>+		else</div><div class='add'>+			SetPageUptodate(rpage);</div><div class='add'>+		unlock_page(rpage);</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Release the reference to the decompress_io_ctx that was being held</div><div class='add'>+	 * for I/O completion.</div><div class='add'>+	 */</div><div class='add'>+	f2fs_put_dic(dic, in_task);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Put a reference to a compressed page's decompress_io_ctx.</div><div class='add'>+ * Put a reference to a compressed folio's decompress_io_ctx.</div><div class='ctx'>  *</div><div class='del'>- * This is called when the page is no longer needed and can be freed.</div><div class='add'>+ * This is called when the folio is no longer needed and can be freed.</div><div class='ctx'>  */</div><div class='del'>-void f2fs_put_page_dic(struct page *page)</div><div class='add'>+void f2fs_put_folio_dic(struct folio *folio, bool in_task)</div><div class='ctx'> {</div><div class='del'>-	struct decompress_io_ctx *dic =</div><div class='del'>-			(struct decompress_io_ctx *)page_private(page);</div><div class='add'>+	struct decompress_io_ctx *dic = folio-&gt;private;</div><div class='ctx'> </div><div class='del'>-	f2fs_put_dic(dic);</div><div class='add'>+	f2fs_put_dic(dic, in_task);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * check whether cluster blocks are contiguous, and add extent cache entry</div><div class='ctx'>  * only if cluster blocks are logically and physically contiguous.</div><div class='ctx'>  */</div><div class='del'>-unsigned int f2fs_cluster_blocks_are_contiguous(struct dnode_of_data *dn)</div><div class='add'>+unsigned int f2fs_cluster_blocks_are_contiguous(struct dnode_of_data *dn,</div><div class='add'>+						unsigned int ofs_in_node)</div><div class='ctx'> {</div><div class='del'>-	bool compressed = f2fs_data_blkaddr(dn) == COMPRESS_ADDR;</div><div class='add'>+	bool compressed = data_blkaddr(dn-&gt;inode, dn-&gt;node_folio,</div><div class='add'>+					ofs_in_node) == COMPRESS_ADDR;</div><div class='ctx'> 	int i = compressed ? 1 : 0;</div><div class='del'>-	block_t first_blkaddr = data_blkaddr(dn-&gt;inode, dn-&gt;node_page,</div><div class='del'>-						dn-&gt;ofs_in_node + i);</div><div class='add'>+	block_t first_blkaddr = data_blkaddr(dn-&gt;inode, dn-&gt;node_folio,</div><div class='add'>+							ofs_in_node + i);</div><div class='ctx'> </div><div class='ctx'> 	for (i += 1; i &lt; F2FS_I(dn-&gt;inode)-&gt;i_cluster_size; i++) {</div><div class='del'>-		block_t blkaddr = data_blkaddr(dn-&gt;inode, dn-&gt;node_page,</div><div class='del'>-						dn-&gt;ofs_in_node + i);</div><div class='add'>+		block_t blkaddr = data_blkaddr(dn-&gt;inode, dn-&gt;node_folio,</div><div class='add'>+							ofs_in_node + i);</div><div class='ctx'> </div><div class='ctx'> 		if (!__is_valid_data_blkaddr(blkaddr))</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -1767,8 +1905,9 @@ unsigned int f2fs_cluster_blocks_are_contiguous(struct dnode_of_data *dn)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations f2fs_compress_aops = {</div><div class='del'>-	.releasepage = f2fs_release_page,</div><div class='del'>-	.invalidatepage = f2fs_invalidate_page,</div><div class='add'>+	.release_folio = f2fs_release_folio,</div><div class='add'>+	.invalidate_folio = f2fs_invalidate_folio,</div><div class='add'>+	.migrate_folio	= filemap_migrate_folio,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct address_space *COMPRESS_MAPPING(struct f2fs_sb_info *sbi)</div><div class='hunk'>@@ -1776,17 +1915,18 @@ struct address_space *COMPRESS_MAPPING(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	return sbi-&gt;compress_inode-&gt;i_mapping;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_invalidate_compress_page(struct f2fs_sb_info *sbi, block_t blkaddr)</div><div class='add'>+void f2fs_invalidate_compress_pages_range(struct f2fs_sb_info *sbi,</div><div class='add'>+				block_t blkaddr, unsigned int len)</div><div class='ctx'> {</div><div class='ctx'> 	if (!sbi-&gt;compress_inode)</div><div class='ctx'> 		return;</div><div class='del'>-	invalidate_mapping_pages(COMPRESS_MAPPING(sbi), blkaddr, blkaddr);</div><div class='add'>+	invalidate_mapping_pages(COMPRESS_MAPPING(sbi), blkaddr, blkaddr + len - 1);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_cache_compressed_page(struct f2fs_sb_info *sbi, struct page *page,</div><div class='del'>-						nid_t ino, block_t blkaddr)</div><div class='add'>+static void f2fs_cache_compressed_page(struct f2fs_sb_info *sbi,</div><div class='add'>+		struct folio *folio, nid_t ino, block_t blkaddr)</div><div class='ctx'> {</div><div class='del'>-	struct page *cpage;</div><div class='add'>+	struct folio *cfolio;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!test_opt(sbi, COMPRESS_CACHE))</div><div class='hunk'>@@ -1798,53 +1938,49 @@ void f2fs_cache_compressed_page(struct f2fs_sb_info *sbi, struct page *page,</div><div class='ctx'> 	if (!f2fs_available_free_memory(sbi, COMPRESS_PAGE))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	cpage = find_get_page(COMPRESS_MAPPING(sbi), blkaddr);</div><div class='del'>-	if (cpage) {</div><div class='del'>-		f2fs_put_page(cpage, 0);</div><div class='add'>+	cfolio = filemap_get_folio(COMPRESS_MAPPING(sbi), blkaddr);</div><div class='add'>+	if (!IS_ERR(cfolio)) {</div><div class='add'>+		f2fs_folio_put(cfolio, false);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	cpage = alloc_page(__GFP_NOWARN | __GFP_IO);</div><div class='del'>-	if (!cpage)</div><div class='add'>+	cfolio = filemap_alloc_folio(__GFP_NOWARN | __GFP_IO, 0, NULL);</div><div class='add'>+	if (!cfolio)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	ret = add_to_page_cache_lru(cpage, COMPRESS_MAPPING(sbi),</div><div class='add'>+	ret = filemap_add_folio(COMPRESS_MAPPING(sbi), cfolio,</div><div class='ctx'> 						blkaddr, GFP_NOFS);</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		f2fs_put_page(cpage, 0);</div><div class='add'>+		f2fs_folio_put(cfolio, false);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	set_page_private_data(cpage, ino);</div><div class='del'>-</div><div class='del'>-	if (!f2fs_is_valid_blkaddr(sbi, blkaddr, DATA_GENERIC_ENHANCE_READ))</div><div class='del'>-		goto out;</div><div class='add'>+	folio_set_f2fs_data(cfolio, ino);</div><div class='ctx'> </div><div class='del'>-	memcpy(page_address(cpage), page_address(page), PAGE_SIZE);</div><div class='del'>-	SetPageUptodate(cpage);</div><div class='del'>-out:</div><div class='del'>-	f2fs_put_page(cpage, 1);</div><div class='add'>+	memcpy(folio_address(cfolio), folio_address(folio), PAGE_SIZE);</div><div class='add'>+	folio_mark_uptodate(cfolio);</div><div class='add'>+	f2fs_folio_put(cfolio, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-bool f2fs_load_compressed_page(struct f2fs_sb_info *sbi, struct page *page,</div><div class='add'>+bool f2fs_load_compressed_folio(struct f2fs_sb_info *sbi, struct folio *folio,</div><div class='ctx'> 								block_t blkaddr)</div><div class='ctx'> {</div><div class='del'>-	struct page *cpage;</div><div class='add'>+	struct folio *cfolio;</div><div class='ctx'> 	bool hitted = false;</div><div class='ctx'> </div><div class='ctx'> 	if (!test_opt(sbi, COMPRESS_CACHE))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	cpage = f2fs_pagecache_get_page(COMPRESS_MAPPING(sbi),</div><div class='add'>+	cfolio = f2fs_filemap_get_folio(COMPRESS_MAPPING(sbi),</div><div class='ctx'> 				blkaddr, FGP_LOCK | FGP_NOWAIT, GFP_NOFS);</div><div class='del'>-	if (cpage) {</div><div class='del'>-		if (PageUptodate(cpage)) {</div><div class='add'>+	if (!IS_ERR(cfolio)) {</div><div class='add'>+		if (folio_test_uptodate(cfolio)) {</div><div class='ctx'> 			atomic_inc(&amp;sbi-&gt;compress_page_hit);</div><div class='del'>-			memcpy(page_address(page),</div><div class='del'>-				page_address(cpage), PAGE_SIZE);</div><div class='add'>+			memcpy(folio_address(folio),</div><div class='add'>+				folio_address(cfolio), folio_size(folio));</div><div class='ctx'> 			hitted = true;</div><div class='ctx'> 		}</div><div class='del'>-		f2fs_put_page(cpage, 1);</div><div class='add'>+		f2fs_folio_put(cfolio, true);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return hitted;</div><div class='hunk'>@@ -1852,46 +1988,41 @@ bool f2fs_load_compressed_page(struct f2fs_sb_info *sbi, struct page *page,</div><div class='ctx'> </div><div class='ctx'> void f2fs_invalidate_compress_pages(struct f2fs_sb_info *sbi, nid_t ino)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *mapping = sbi-&gt;compress_inode-&gt;i_mapping;</div><div class='del'>-	struct pagevec pvec;</div><div class='add'>+	struct address_space *mapping = COMPRESS_MAPPING(sbi);</div><div class='add'>+	struct folio_batch fbatch;</div><div class='ctx'> 	pgoff_t index = 0;</div><div class='ctx'> 	pgoff_t end = MAX_BLKADDR(sbi);</div><div class='ctx'> </div><div class='ctx'> 	if (!mapping-&gt;nrpages)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	pagevec_init(&amp;pvec);</div><div class='add'>+	folio_batch_init(&amp;fbatch);</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='del'>-		unsigned int nr_pages;</div><div class='del'>-		int i;</div><div class='add'>+		unsigned int nr, i;</div><div class='ctx'> </div><div class='del'>-		nr_pages = pagevec_lookup_range(&amp;pvec, mapping,</div><div class='del'>-						&amp;index, end - 1);</div><div class='del'>-		if (!nr_pages)</div><div class='add'>+		nr = filemap_get_folios(mapping, &amp;index, end - 1, &amp;fbatch);</div><div class='add'>+		if (!nr)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		for (i = 0; i &lt; nr_pages; i++) {</div><div class='del'>-			struct page *page = pvec.pages[i];</div><div class='del'>-</div><div class='del'>-			if (page-&gt;index &gt; end)</div><div class='del'>-				break;</div><div class='add'>+		for (i = 0; i &lt; nr; i++) {</div><div class='add'>+			struct folio *folio = fbatch.folios[i];</div><div class='ctx'> </div><div class='del'>-			lock_page(page);</div><div class='del'>-			if (page-&gt;mapping != mapping) {</div><div class='del'>-				unlock_page(page);</div><div class='add'>+			folio_lock(folio);</div><div class='add'>+			if (folio-&gt;mapping != mapping) {</div><div class='add'>+				folio_unlock(folio);</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			if (ino != get_page_private_data(page)) {</div><div class='del'>-				unlock_page(page);</div><div class='add'>+			if (ino != folio_get_f2fs_data(folio)) {</div><div class='add'>+				folio_unlock(folio);</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			generic_error_remove_page(mapping, page);</div><div class='del'>-			unlock_page(page);</div><div class='add'>+			generic_error_remove_folio(mapping, folio);</div><div class='add'>+			folio_unlock(folio);</div><div class='ctx'> 		}</div><div class='del'>-		pagevec_release(&amp;pvec);</div><div class='add'>+		folio_batch_release(&amp;fbatch);</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 	} while (index &lt; end);</div><div class='ctx'> }</div><div class='hunk'>@@ -1927,7 +2058,10 @@ void f2fs_destroy_compress_inode(struct f2fs_sb_info *sbi)</div><div class='ctx'> int f2fs_init_page_array_cache(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	dev_t dev = sbi-&gt;sb-&gt;s_bdev-&gt;bd_dev;</div><div class='del'>-	char slab_name[32];</div><div class='add'>+	char slab_name[35];</div><div class='add'>+</div><div class='add'>+	if (!f2fs_sb_has_compression(sbi))</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> 	sprintf(slab_name, "f2fs_page_array_entry-%u:%u", MAJOR(dev), MINOR(dev));</div><div class='ctx'> </div><div class='hunk'>@@ -1936,9 +2070,7 @@ int f2fs_init_page_array_cache(struct f2fs_sb_info *sbi)</div><div class='ctx'> </div><div class='ctx'> 	sbi-&gt;page_array_slab = f2fs_kmem_cache_create(slab_name,</div><div class='ctx'> 					sbi-&gt;page_array_slab_size);</div><div class='del'>-	if (!sbi-&gt;page_array_slab)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	return 0;</div><div class='add'>+	return sbi-&gt;page_array_slab ? 0 : -ENOMEM;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_destroy_page_array_cache(struct f2fs_sb_info *sbi)</div><div class='hunk'>@@ -1946,53 +2078,24 @@ void f2fs_destroy_page_array_cache(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	kmem_cache_destroy(sbi-&gt;page_array_slab);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __init f2fs_init_cic_cache(void)</div><div class='add'>+int __init f2fs_init_compress_cache(void)</div><div class='ctx'> {</div><div class='ctx'> 	cic_entry_slab = f2fs_kmem_cache_create("f2fs_cic_entry",</div><div class='ctx'> 					sizeof(struct compress_io_ctx));</div><div class='ctx'> 	if (!cic_entry_slab)</div><div class='ctx'> 		return -ENOMEM;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void f2fs_destroy_cic_cache(void)</div><div class='del'>-{</div><div class='del'>-	kmem_cache_destroy(cic_entry_slab);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int __init f2fs_init_dic_cache(void)</div><div class='del'>-{</div><div class='ctx'> 	dic_entry_slab = f2fs_kmem_cache_create("f2fs_dic_entry",</div><div class='ctx'> 					sizeof(struct decompress_io_ctx));</div><div class='ctx'> 	if (!dic_entry_slab)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void f2fs_destroy_dic_cache(void)</div><div class='del'>-{</div><div class='del'>-	kmem_cache_destroy(dic_entry_slab);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int __init f2fs_init_compress_cache(void)</div><div class='del'>-{</div><div class='del'>-	int err;</div><div class='del'>-</div><div class='del'>-	err = f2fs_init_cic_cache();</div><div class='del'>-	if (err)</div><div class='del'>-		goto out;</div><div class='del'>-	err = f2fs_init_dic_cache();</div><div class='del'>-	if (err)</div><div class='ctx'> 		goto free_cic;</div><div class='ctx'> 	return 0;</div><div class='ctx'> free_cic:</div><div class='del'>-	f2fs_destroy_cic_cache();</div><div class='del'>-out:</div><div class='add'>+	kmem_cache_destroy(cic_entry_slab);</div><div class='ctx'> 	return -ENOMEM;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_destroy_compress_cache(void)</div><div class='ctx'> {</div><div class='del'>-	f2fs_destroy_dic_cache();</div><div class='del'>-	f2fs_destroy_cic_cache();</div><div class='add'>+	kmem_cache_destroy(dic_entry_slab);</div><div class='add'>+	kmem_cache_destroy(cic_entry_slab);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/f2fs/data.c b/fs/f2fs/data.c<br/>index 9f754aaef558..c30e69392a62 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/data.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/data.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/data.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/data.c</a></div><div class='hunk'>@@ -7,10 +7,9 @@</div><div class='ctx'>  */</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/f2fs_fs.h&gt;</div><div class='del'>-#include &lt;linux/buffer_head.h&gt;</div><div class='add'>+#include &lt;linux/sched/mm.h&gt;</div><div class='ctx'> #include &lt;linux/mpage.h&gt;</div><div class='ctx'> #include &lt;linux/writeback.h&gt;</div><div class='del'>-#include &lt;linux/backing-dev.h&gt;</div><div class='ctx'> #include &lt;linux/pagevec.h&gt;</div><div class='ctx'> #include &lt;linux/blkdev.h&gt;</div><div class='ctx'> #include &lt;linux/bio.h&gt;</div><div class='hunk'>@@ -18,9 +17,9 @@</div><div class='ctx'> #include &lt;linux/swap.h&gt;</div><div class='ctx'> #include &lt;linux/prefetch.h&gt;</div><div class='ctx'> #include &lt;linux/uio.h&gt;</div><div class='del'>-#include &lt;linux/cleancache.h&gt;</div><div class='ctx'> #include &lt;linux/sched/signal.h&gt;</div><div class='ctx'> #include &lt;linux/fiemap.h&gt;</div><div class='add'>+#include &lt;linux/iomap.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "f2fs.h"</div><div class='ctx'> #include "node.h"</div><div class='hunk'>@@ -39,10 +38,8 @@ static struct bio_set f2fs_bioset;</div><div class='ctx'> </div><div class='ctx'> int __init f2fs_init_bioset(void)</div><div class='ctx'> {</div><div class='del'>-	if (bioset_init(&amp;f2fs_bioset, F2FS_BIO_POOL_SIZE,</div><div class='del'>-					0, BIOSET_NEED_BVECS))</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	return 0;</div><div class='add'>+	return bioset_init(&amp;f2fs_bioset, F2FS_BIO_POOL_SIZE,</div><div class='add'>+					0, BIOSET_NEED_BVECS);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_destroy_bioset(void)</div><div class='hunk'>@@ -50,14 +47,14 @@ void f2fs_destroy_bioset(void)</div><div class='ctx'> 	bioset_exit(&amp;f2fs_bioset);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool __is_cp_guaranteed(struct page *page)</div><div class='add'>+bool f2fs_is_cp_guaranteed(const struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *mapping = page-&gt;mapping;</div><div class='add'>+	struct address_space *mapping = folio-&gt;mapping;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct f2fs_sb_info *sbi;</div><div class='ctx'> </div><div class='del'>-	if (!mapping)</div><div class='del'>-		return false;</div><div class='add'>+	if (fscrypt_is_bounce_folio(folio))</div><div class='add'>+		return folio_test_f2fs_gcing(fscrypt_pagecache_folio(folio));</div><div class='ctx'> </div><div class='ctx'> 	inode = mapping-&gt;host;</div><div class='ctx'> 	sbi = F2FS_I_SB(inode);</div><div class='hunk'>@@ -67,18 +64,15 @@ static bool __is_cp_guaranteed(struct page *page)</div><div class='ctx'> 			S_ISDIR(inode-&gt;i_mode))</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='del'>-	if (f2fs_is_compressed_page(page))</div><div class='del'>-		return false;</div><div class='del'>-	if ((S_ISREG(inode-&gt;i_mode) &amp;&amp;</div><div class='del'>-			(f2fs_is_atomic_file(inode) || IS_NOQUOTA(inode))) ||</div><div class='del'>-			page_private_gcing(page))</div><div class='add'>+	if ((S_ISREG(inode-&gt;i_mode) &amp;&amp; IS_NOQUOTA(inode)) ||</div><div class='add'>+			folio_test_f2fs_gcing(folio))</div><div class='ctx'> 		return true;</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static enum count_type __read_io_type(struct page *page)</div><div class='add'>+static enum count_type __read_io_type(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *mapping = page_file_mapping(page);</div><div class='add'>+	struct address_space *mapping = folio-&gt;mapping;</div><div class='ctx'> </div><div class='ctx'> 	if (mapping) {</div><div class='ctx'> 		struct inode *inode = mapping-&gt;host;</div><div class='hunk'>@@ -96,17 +90,17 @@ static enum count_type __read_io_type(struct page *page)</div><div class='ctx'> /* postprocessing steps for read bios */</div><div class='ctx'> enum bio_post_read_step {</div><div class='ctx'> #ifdef CONFIG_FS_ENCRYPTION</div><div class='del'>-	STEP_DECRYPT	= 1 &lt;&lt; 0,</div><div class='add'>+	STEP_DECRYPT	= BIT(0),</div><div class='ctx'> #else</div><div class='ctx'> 	STEP_DECRYPT	= 0,	/* compile out the decryption-related code */</div><div class='ctx'> #endif</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='del'>-	STEP_DECOMPRESS	= 1 &lt;&lt; 1,</div><div class='add'>+	STEP_DECOMPRESS	= BIT(1),</div><div class='ctx'> #else</div><div class='ctx'> 	STEP_DECOMPRESS	= 0,	/* compile out the decompression-related code */</div><div class='ctx'> #endif</div><div class='ctx'> #ifdef CONFIG_FS_VERITY</div><div class='del'>-	STEP_VERITY	= 1 &lt;&lt; 2,</div><div class='add'>+	STEP_VERITY	= BIT(2),</div><div class='ctx'> #else</div><div class='ctx'> 	STEP_VERITY	= 0,	/* compile out the verity-related code */</div><div class='ctx'> #endif</div><div class='hunk'>@@ -117,42 +111,51 @@ struct bio_post_read_ctx {</div><div class='ctx'> 	struct f2fs_sb_info *sbi;</div><div class='ctx'> 	struct work_struct work;</div><div class='ctx'> 	unsigned int enabled_steps;</div><div class='add'>+	/*</div><div class='add'>+	 * decompression_attempted keeps track of whether</div><div class='add'>+	 * f2fs_end_read_compressed_page() has been called on the pages in the</div><div class='add'>+	 * bio that belong to a compressed cluster yet.</div><div class='add'>+	 */</div><div class='add'>+	bool decompression_attempted;</div><div class='ctx'> 	block_t fs_blkaddr;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static void f2fs_finish_read_bio(struct bio *bio)</div><div class='add'>+/*</div><div class='add'>+ * Update and unlock a bio's pages, and free the bio.</div><div class='add'>+ *</div><div class='add'>+ * This marks pages up-to-date only if there was no error in the bio (I/O error,</div><div class='add'>+ * decryption error, or verity error), as indicated by bio-&gt;bi_status.</div><div class='add'>+ *</div><div class='add'>+ * "Compressed pages" (pagecache pages backed by a compressed cluster on-disk)</div><div class='add'>+ * aren't marked up-to-date here, as decompression is done on a per-compression-</div><div class='add'>+ * cluster basis rather than a per-bio basis.  Instead, we only must do two</div><div class='add'>+ * things for each compressed page here: call f2fs_end_read_compressed_page()</div><div class='add'>+ * with failed=true if an error occurred before it would have normally gotten</div><div class='add'>+ * called (i.e., I/O error or decryption error, but *not* verity error), and</div><div class='add'>+ * release the bio's reference to the decompress_io_ctx of the page's cluster.</div><div class='add'>+ */</div><div class='add'>+static void f2fs_finish_read_bio(struct bio *bio, bool in_task)</div><div class='ctx'> {</div><div class='del'>-	struct bio_vec *bv;</div><div class='del'>-	struct bvec_iter_all iter_all;</div><div class='add'>+	struct folio_iter fi;</div><div class='add'>+	struct bio_post_read_ctx *ctx = bio-&gt;bi_private;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Update and unlock the bio's pagecache pages, and put the</div><div class='del'>-	 * decompression context for any compressed pages.</div><div class='del'>-	 */</div><div class='del'>-	bio_for_each_segment_all(bv, bio, iter_all) {</div><div class='del'>-		struct page *page = bv-&gt;bv_page;</div><div class='add'>+	bio_for_each_folio_all(fi, bio) {</div><div class='add'>+		struct folio *folio = fi.folio;</div><div class='ctx'> </div><div class='del'>-		if (f2fs_is_compressed_page(page)) {</div><div class='del'>-			if (bio-&gt;bi_status)</div><div class='del'>-				f2fs_end_read_compressed_page(page, true, 0);</div><div class='del'>-			f2fs_put_page_dic(page);</div><div class='add'>+		if (f2fs_is_compressed_page(folio)) {</div><div class='add'>+			if (ctx &amp;&amp; !ctx-&gt;decompression_attempted)</div><div class='add'>+				f2fs_end_read_compressed_page(folio, true, 0,</div><div class='add'>+							in_task);</div><div class='add'>+			f2fs_put_folio_dic(folio, in_task);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		/* PG_error was set if decryption or verity failed. */</div><div class='del'>-		if (bio-&gt;bi_status || PageError(page)) {</div><div class='del'>-			ClearPageUptodate(page);</div><div class='del'>-			/* will re-read again later */</div><div class='del'>-			ClearPageError(page);</div><div class='del'>-		} else {</div><div class='del'>-			SetPageUptodate(page);</div><div class='del'>-		}</div><div class='del'>-		dec_page_count(F2FS_P_SB(page), __read_io_type(page));</div><div class='del'>-		unlock_page(page);</div><div class='add'>+		dec_page_count(F2FS_F_SB(folio), __read_io_type(folio));</div><div class='add'>+		folio_end_read(folio, bio-&gt;bi_status == BLK_STS_OK);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (bio-&gt;bi_private)</div><div class='del'>-		mempool_free(bio-&gt;bi_private, bio_post_read_ctx_pool);</div><div class='add'>+	if (ctx)</div><div class='add'>+		mempool_free(ctx, bio_post_read_ctx_pool);</div><div class='ctx'> 	bio_put(bio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -164,7 +167,7 @@ static void f2fs_verify_bio(struct work_struct *work)</div><div class='ctx'> 	bool may_have_compressed_pages = (ctx-&gt;enabled_steps &amp; STEP_DECOMPRESS);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * fsverity_verify_bio() may call readpages() again, and while verity</div><div class='add'>+	 * fsverity_verify_bio() may call readahead() again, and while verity</div><div class='ctx'> 	 * will be disabled for this, decryption and/or decompression may still</div><div class='ctx'> 	 * be needed, resulting in another bio_post_read_ctx being allocated.</div><div class='ctx'> 	 * So to prevent deadlocks we need to release the current ctx to the</div><div class='hunk'>@@ -178,21 +181,22 @@ static void f2fs_verify_bio(struct work_struct *work)</div><div class='ctx'> 	 * as those were handled separately by f2fs_end_read_compressed_page().</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (may_have_compressed_pages) {</div><div class='del'>-		struct bio_vec *bv;</div><div class='del'>-		struct bvec_iter_all iter_all;</div><div class='add'>+		struct folio_iter fi;</div><div class='ctx'> </div><div class='del'>-		bio_for_each_segment_all(bv, bio, iter_all) {</div><div class='del'>-			struct page *page = bv-&gt;bv_page;</div><div class='add'>+		bio_for_each_folio_all(fi, bio) {</div><div class='add'>+			struct folio *folio = fi.folio;</div><div class='ctx'> </div><div class='del'>-			if (!f2fs_is_compressed_page(page) &amp;&amp;</div><div class='del'>-			    !PageError(page) &amp;&amp; !fsverity_verify_page(page))</div><div class='del'>-				SetPageError(page);</div><div class='add'>+			if (!f2fs_is_compressed_page(folio) &amp;&amp;</div><div class='add'>+			    !fsverity_verify_page(&amp;folio-&gt;page)) {</div><div class='add'>+				bio-&gt;bi_status = BLK_STS_IOERR;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='ctx'> 		fsverity_verify_bio(bio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	f2fs_finish_read_bio(bio);</div><div class='add'>+	f2fs_finish_read_bio(bio, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -204,7 +208,7 @@ static void f2fs_verify_bio(struct work_struct *work)</div><div class='ctx'>  * can involve reading verity metadata pages from the file, and these verity</div><div class='ctx'>  * metadata pages may be encrypted and/or compressed.</div><div class='ctx'>  */</div><div class='del'>-static void f2fs_verify_and_finish_bio(struct bio *bio)</div><div class='add'>+static void f2fs_verify_and_finish_bio(struct bio *bio, bool in_task)</div><div class='ctx'> {</div><div class='ctx'> 	struct bio_post_read_ctx *ctx = bio-&gt;bi_private;</div><div class='ctx'> </div><div class='hunk'>@@ -212,7 +216,7 @@ static void f2fs_verify_and_finish_bio(struct bio *bio)</div><div class='ctx'> 		INIT_WORK(&amp;ctx-&gt;work, f2fs_verify_bio);</div><div class='ctx'> 		fsverity_enqueue_verify_work(&amp;ctx-&gt;work);</div><div class='ctx'> 	} else {</div><div class='del'>-		f2fs_finish_read_bio(bio);</div><div class='add'>+		f2fs_finish_read_bio(bio, in_task);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -225,26 +229,27 @@ static void f2fs_verify_and_finish_bio(struct bio *bio)</div><div class='ctx'>  * that the bio includes at least one compressed page.  The actual decompression</div><div class='ctx'>  * is done on a per-cluster basis, not a per-bio basis.</div><div class='ctx'>  */</div><div class='del'>-static void f2fs_handle_step_decompress(struct bio_post_read_ctx *ctx)</div><div class='add'>+static void f2fs_handle_step_decompress(struct bio_post_read_ctx *ctx,</div><div class='add'>+		bool in_task)</div><div class='ctx'> {</div><div class='del'>-	struct bio_vec *bv;</div><div class='del'>-	struct bvec_iter_all iter_all;</div><div class='add'>+	struct folio_iter fi;</div><div class='ctx'> 	bool all_compressed = true;</div><div class='ctx'> 	block_t blkaddr = ctx-&gt;fs_blkaddr;</div><div class='ctx'> </div><div class='del'>-	bio_for_each_segment_all(bv, ctx-&gt;bio, iter_all) {</div><div class='del'>-		struct page *page = bv-&gt;bv_page;</div><div class='add'>+	bio_for_each_folio_all(fi, ctx-&gt;bio) {</div><div class='add'>+		struct folio *folio = fi.folio;</div><div class='ctx'> </div><div class='del'>-		/* PG_error was set if decryption failed. */</div><div class='del'>-		if (f2fs_is_compressed_page(page))</div><div class='del'>-			f2fs_end_read_compressed_page(page, PageError(page),</div><div class='del'>-						blkaddr);</div><div class='add'>+		if (f2fs_is_compressed_page(folio))</div><div class='add'>+			f2fs_end_read_compressed_page(folio, false, blkaddr,</div><div class='add'>+						      in_task);</div><div class='ctx'> 		else</div><div class='ctx'> 			all_compressed = false;</div><div class='ctx'> </div><div class='ctx'> 		blkaddr++;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	ctx-&gt;decompression_attempted = true;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Optimization: if all the bio's pages are compressed, then scheduling</div><div class='ctx'> 	 * the per-bio verity work is unnecessary, as verity will be fully</div><div class='hunk'>@@ -258,93 +263,103 @@ static void f2fs_post_read_work(struct work_struct *work)</div><div class='ctx'> {</div><div class='ctx'> 	struct bio_post_read_ctx *ctx =</div><div class='ctx'> 		container_of(work, struct bio_post_read_ctx, work);</div><div class='add'>+	struct bio *bio = ctx-&gt;bio;</div><div class='ctx'> </div><div class='del'>-	if (ctx-&gt;enabled_steps &amp; STEP_DECRYPT)</div><div class='del'>-		fscrypt_decrypt_bio(ctx-&gt;bio);</div><div class='add'>+	if ((ctx-&gt;enabled_steps &amp; STEP_DECRYPT) &amp;&amp; !fscrypt_decrypt_bio(bio)) {</div><div class='add'>+		f2fs_finish_read_bio(bio, true);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (ctx-&gt;enabled_steps &amp; STEP_DECOMPRESS)</div><div class='del'>-		f2fs_handle_step_decompress(ctx);</div><div class='add'>+		f2fs_handle_step_decompress(ctx, true);</div><div class='ctx'> </div><div class='del'>-	f2fs_verify_and_finish_bio(ctx-&gt;bio);</div><div class='add'>+	f2fs_verify_and_finish_bio(bio, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void f2fs_read_end_io(struct bio *bio)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_sb_info *sbi = F2FS_P_SB(bio_first_page_all(bio));</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_F_SB(bio_first_folio_all(bio));</div><div class='ctx'> 	struct bio_post_read_ctx *ctx;</div><div class='add'>+	bool intask = in_task() &amp;&amp; !irqs_disabled();</div><div class='ctx'> </div><div class='del'>-	iostat_update_and_unbind_ctx(bio, 0);</div><div class='add'>+	iostat_update_and_unbind_ctx(bio);</div><div class='ctx'> 	ctx = bio-&gt;bi_private;</div><div class='ctx'> </div><div class='del'>-	if (time_to_inject(sbi, FAULT_READ_IO)) {</div><div class='del'>-		f2fs_show_injection_info(sbi, FAULT_READ_IO);</div><div class='add'>+	if (time_to_inject(sbi, FAULT_READ_IO))</div><div class='ctx'> 		bio-&gt;bi_status = BLK_STS_IOERR;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	if (bio-&gt;bi_status) {</div><div class='del'>-		f2fs_finish_read_bio(bio);</div><div class='add'>+	if (bio-&gt;bi_status != BLK_STS_OK) {</div><div class='add'>+		f2fs_finish_read_bio(bio, intask);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (ctx &amp;&amp; (ctx-&gt;enabled_steps &amp; (STEP_DECRYPT | STEP_DECOMPRESS))) {</div><div class='del'>-		INIT_WORK(&amp;ctx-&gt;work, f2fs_post_read_work);</div><div class='del'>-		queue_work(ctx-&gt;sbi-&gt;post_read_wq, &amp;ctx-&gt;work);</div><div class='del'>-	} else {</div><div class='del'>-		f2fs_verify_and_finish_bio(bio);</div><div class='add'>+	if (ctx) {</div><div class='add'>+		unsigned int enabled_steps = ctx-&gt;enabled_steps &amp;</div><div class='add'>+					(STEP_DECRYPT | STEP_DECOMPRESS);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * If we have only decompression step between decompression and</div><div class='add'>+		 * decrypt, we don't need post processing for this.</div><div class='add'>+		 */</div><div class='add'>+		if (enabled_steps == STEP_DECOMPRESS &amp;&amp;</div><div class='add'>+				!f2fs_low_mem_mode(sbi)) {</div><div class='add'>+			f2fs_handle_step_decompress(ctx, intask);</div><div class='add'>+		} else if (enabled_steps) {</div><div class='add'>+			INIT_WORK(&amp;ctx-&gt;work, f2fs_post_read_work);</div><div class='add'>+			queue_work(ctx-&gt;sbi-&gt;post_read_wq, &amp;ctx-&gt;work);</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	f2fs_verify_and_finish_bio(bio, intask);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void f2fs_write_end_io(struct bio *bio)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi;</div><div class='del'>-	struct bio_vec *bvec;</div><div class='del'>-	struct bvec_iter_all iter_all;</div><div class='add'>+	struct folio_iter fi;</div><div class='ctx'> </div><div class='del'>-	iostat_update_and_unbind_ctx(bio, 1);</div><div class='add'>+	iostat_update_and_unbind_ctx(bio);</div><div class='ctx'> 	sbi = bio-&gt;bi_private;</div><div class='ctx'> </div><div class='del'>-	if (time_to_inject(sbi, FAULT_WRITE_IO)) {</div><div class='del'>-		f2fs_show_injection_info(sbi, FAULT_WRITE_IO);</div><div class='add'>+	if (time_to_inject(sbi, FAULT_WRITE_IO))</div><div class='ctx'> 		bio-&gt;bi_status = BLK_STS_IOERR;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	bio_for_each_segment_all(bvec, bio, iter_all) {</div><div class='del'>-		struct page *page = bvec-&gt;bv_page;</div><div class='del'>-		enum count_type type = WB_DATA_TYPE(page);</div><div class='add'>+	bio_for_each_folio_all(fi, bio) {</div><div class='add'>+		struct folio *folio = fi.folio;</div><div class='add'>+		enum count_type type;</div><div class='ctx'> </div><div class='del'>-		if (page_private_dummy(page)) {</div><div class='del'>-			clear_page_private_dummy(page);</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			mempool_free(page, sbi-&gt;write_io_dummy);</div><div class='add'>+		if (fscrypt_is_bounce_folio(folio)) {</div><div class='add'>+			struct folio *io_folio = folio;</div><div class='ctx'> </div><div class='del'>-			if (unlikely(bio-&gt;bi_status))</div><div class='del'>-				f2fs_stop_checkpoint(sbi, true);</div><div class='del'>-			continue;</div><div class='add'>+			folio = fscrypt_pagecache_folio(io_folio);</div><div class='add'>+			fscrypt_free_bounce_page(&amp;io_folio-&gt;page);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		fscrypt_finalize_bounce_page(&amp;page);</div><div class='del'>-</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='del'>-		if (f2fs_is_compressed_page(page)) {</div><div class='del'>-			f2fs_compress_write_end_io(bio, page);</div><div class='add'>+		if (f2fs_is_compressed_page(folio)) {</div><div class='add'>+			f2fs_compress_write_end_io(bio, folio);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-		if (unlikely(bio-&gt;bi_status)) {</div><div class='del'>-			mapping_set_error(page-&gt;mapping, -EIO);</div><div class='add'>+		type = WB_DATA_TYPE(folio, false);</div><div class='add'>+</div><div class='add'>+		if (unlikely(bio-&gt;bi_status != BLK_STS_OK)) {</div><div class='add'>+			mapping_set_error(folio-&gt;mapping, -EIO);</div><div class='ctx'> 			if (type == F2FS_WB_CP_DATA)</div><div class='del'>-				f2fs_stop_checkpoint(sbi, true);</div><div class='add'>+				f2fs_stop_checkpoint(sbi, true,</div><div class='add'>+						STOP_CP_REASON_WRITE_FAIL);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		f2fs_bug_on(sbi, page-&gt;mapping == NODE_MAPPING(sbi) &amp;&amp;</div><div class='del'>-					page-&gt;index != nid_of_node(page));</div><div class='add'>+		f2fs_bug_on(sbi, is_node_folio(folio) &amp;&amp;</div><div class='add'>+				folio-&gt;index != nid_of_node(folio));</div><div class='ctx'> </div><div class='ctx'> 		dec_page_count(sbi, type);</div><div class='del'>-		if (f2fs_in_warm_node_list(sbi, page))</div><div class='del'>-			f2fs_del_fsync_node_entry(sbi, page);</div><div class='del'>-		clear_page_private_gcing(page);</div><div class='del'>-		end_page_writeback(page);</div><div class='add'>+		if (f2fs_in_warm_node_list(sbi, folio))</div><div class='add'>+			f2fs_del_fsync_node_entry(sbi, folio);</div><div class='add'>+		folio_clear_f2fs_gcing(folio);</div><div class='add'>+		folio_end_writeback(folio);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!get_pages(sbi, F2FS_WB_CP_DATA) &amp;&amp;</div><div class='ctx'> 				wq_has_sleeper(&amp;sbi-&gt;cp_wait))</div><div class='hunk'>@@ -353,8 +368,19 @@ static void f2fs_write_end_io(struct bio *bio)</div><div class='ctx'> 	bio_put(bio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_BLK_DEV_ZONED</div><div class='add'>+static void f2fs_zone_write_end_io(struct bio *bio)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_bio_info *io = (struct f2fs_bio_info *)bio-&gt;bi_private;</div><div class='add'>+</div><div class='add'>+	bio-&gt;bi_private = io-&gt;bi_private;</div><div class='add'>+	complete(&amp;io-&gt;zone_wait);</div><div class='add'>+	f2fs_write_end_io(bio);</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> struct block_device *f2fs_target_device(struct f2fs_sb_info *sbi,</div><div class='del'>-				block_t blk_addr, struct bio *bio)</div><div class='add'>+		block_t blk_addr, sector_t *sector)</div><div class='ctx'> {</div><div class='ctx'> 	struct block_device *bdev = sbi-&gt;sb-&gt;s_bdev;</div><div class='ctx'> 	int i;</div><div class='hunk'>@@ -369,10 +395,9 @@ struct block_device *f2fs_target_device(struct f2fs_sb_info *sbi,</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	if (bio) {</div><div class='del'>-		bio_set_dev(bio, bdev);</div><div class='del'>-		bio-&gt;bi_iter.bi_sector = SECTOR_FROM_BLOCK(blk_addr);</div><div class='del'>-	}</div><div class='add'>+</div><div class='add'>+	if (sector)</div><div class='add'>+		*sector = SECTOR_FROM_BLOCK(blk_addr);</div><div class='ctx'> 	return bdev;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -389,14 +414,54 @@ int f2fs_target_device_index(struct f2fs_sb_info *sbi, block_t blkaddr)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static blk_opf_t f2fs_io_flags(struct f2fs_io_info *fio)</div><div class='add'>+{</div><div class='add'>+	unsigned int temp_mask = GENMASK(NR_TEMP_TYPE - 1, 0);</div><div class='add'>+	unsigned int fua_flag, meta_flag, io_flag;</div><div class='add'>+	blk_opf_t op_flags = 0;</div><div class='add'>+</div><div class='add'>+	if (fio-&gt;op != REQ_OP_WRITE)</div><div class='add'>+		return 0;</div><div class='add'>+	if (fio-&gt;type == DATA)</div><div class='add'>+		io_flag = fio-&gt;sbi-&gt;data_io_flag;</div><div class='add'>+	else if (fio-&gt;type == NODE)</div><div class='add'>+		io_flag = fio-&gt;sbi-&gt;node_io_flag;</div><div class='add'>+	else</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	fua_flag = io_flag &amp; temp_mask;</div><div class='add'>+	meta_flag = (io_flag &gt;&gt; NR_TEMP_TYPE) &amp; temp_mask;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * data/node io flag bits per temp:</div><div class='add'>+	 *      REQ_META     |      REQ_FUA      |</div><div class='add'>+	 *    5 |    4 |   3 |    2 |    1 |   0 |</div><div class='add'>+	 * Cold | Warm | Hot | Cold | Warm | Hot |</div><div class='add'>+	 */</div><div class='add'>+	if (BIT(fio-&gt;temp) &amp; meta_flag)</div><div class='add'>+		op_flags |= REQ_META;</div><div class='add'>+	if (BIT(fio-&gt;temp) &amp; fua_flag)</div><div class='add'>+		op_flags |= REQ_FUA;</div><div class='add'>+</div><div class='add'>+	if (fio-&gt;type == DATA &amp;&amp;</div><div class='add'>+	    F2FS_I(fio-&gt;folio-&gt;mapping-&gt;host)-&gt;ioprio_hint == F2FS_IOPRIO_WRITE)</div><div class='add'>+		op_flags |= REQ_PRIO;</div><div class='add'>+</div><div class='add'>+	return op_flags;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static struct bio *__bio_alloc(struct f2fs_io_info *fio, int npages)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = fio-&gt;sbi;</div><div class='add'>+	struct block_device *bdev;</div><div class='add'>+	sector_t sector;</div><div class='ctx'> 	struct bio *bio;</div><div class='ctx'> </div><div class='del'>-	bio = bio_alloc_bioset(GFP_NOIO, npages, &amp;f2fs_bioset);</div><div class='del'>-</div><div class='del'>-	f2fs_target_device(sbi, fio-&gt;new_blkaddr, bio);</div><div class='add'>+	bdev = f2fs_target_device(sbi, fio-&gt;new_blkaddr, &amp;sector);</div><div class='add'>+	bio = bio_alloc_bioset(bdev, npages,</div><div class='add'>+				fio-&gt;op | fio-&gt;op_flags | f2fs_io_flags(fio),</div><div class='add'>+				GFP_NOIO, &amp;f2fs_bioset);</div><div class='add'>+	bio-&gt;bi_iter.bi_sector = sector;</div><div class='ctx'> 	if (is_read_io(fio-&gt;op)) {</div><div class='ctx'> 		bio-&gt;bi_end_io = f2fs_read_end_io;</div><div class='ctx'> 		bio-&gt;bi_private = NULL;</div><div class='hunk'>@@ -441,91 +506,23 @@ static bool f2fs_crypt_mergeable_bio(struct bio *bio, const struct inode *inode,</div><div class='ctx'> 	return fscrypt_mergeable_bio(bio, inode, next_idx);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void __submit_bio(struct f2fs_sb_info *sbi,</div><div class='del'>-				struct bio *bio, enum page_type type)</div><div class='add'>+void f2fs_submit_read_bio(struct f2fs_sb_info *sbi, struct bio *bio,</div><div class='add'>+				 enum page_type type)</div><div class='ctx'> {</div><div class='del'>-	if (!is_read_io(bio_op(bio))) {</div><div class='del'>-		unsigned int start;</div><div class='del'>-</div><div class='del'>-		if (type != DATA &amp;&amp; type != NODE)</div><div class='del'>-			goto submit_io;</div><div class='del'>-</div><div class='del'>-		if (f2fs_lfs_mode(sbi) &amp;&amp; current-&gt;plug)</div><div class='del'>-			blk_finish_plug(current-&gt;plug);</div><div class='del'>-</div><div class='del'>-		if (!F2FS_IO_ALIGNED(sbi))</div><div class='del'>-			goto submit_io;</div><div class='del'>-</div><div class='del'>-		start = bio-&gt;bi_iter.bi_size &gt;&gt; F2FS_BLKSIZE_BITS;</div><div class='del'>-		start %= F2FS_IO_SIZE(sbi);</div><div class='del'>-</div><div class='del'>-		if (start == 0)</div><div class='del'>-			goto submit_io;</div><div class='del'>-</div><div class='del'>-		/* fill dummy pages */</div><div class='del'>-		for (; start &lt; F2FS_IO_SIZE(sbi); start++) {</div><div class='del'>-			struct page *page =</div><div class='del'>-				mempool_alloc(sbi-&gt;write_io_dummy,</div><div class='del'>-					      GFP_NOIO | __GFP_NOFAIL);</div><div class='del'>-			f2fs_bug_on(sbi, !page);</div><div class='del'>-</div><div class='del'>-			lock_page(page);</div><div class='del'>-</div><div class='del'>-			zero_user_segment(page, 0, PAGE_SIZE);</div><div class='del'>-			set_page_private_dummy(page);</div><div class='del'>-</div><div class='del'>-			if (bio_add_page(bio, page, PAGE_SIZE, 0) &lt; PAGE_SIZE)</div><div class='del'>-				f2fs_bug_on(sbi, 1);</div><div class='del'>-		}</div><div class='del'>-		/*</div><div class='del'>-		 * In the NODE case, we lose next block address chain. So, we</div><div class='del'>-		 * need to do checkpoint in f2fs_sync_file.</div><div class='del'>-		 */</div><div class='del'>-		if (type == NODE)</div><div class='del'>-			set_sbi_flag(sbi, SBI_NEED_CP);</div><div class='del'>-	}</div><div class='del'>-submit_io:</div><div class='del'>-	if (is_read_io(bio_op(bio)))</div><div class='del'>-		trace_f2fs_submit_read_bio(sbi-&gt;sb, type, bio);</div><div class='del'>-	else</div><div class='del'>-		trace_f2fs_submit_write_bio(sbi-&gt;sb, type, bio);</div><div class='add'>+	WARN_ON_ONCE(!is_read_io(bio_op(bio)));</div><div class='add'>+	trace_f2fs_submit_read_bio(sbi-&gt;sb, type, bio);</div><div class='ctx'> </div><div class='ctx'> 	iostat_update_submit_ctx(bio, type);</div><div class='ctx'> 	submit_bio(bio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_submit_bio(struct f2fs_sb_info *sbi,</div><div class='del'>-				struct bio *bio, enum page_type type)</div><div class='del'>-{</div><div class='del'>-	__submit_bio(sbi, bio, type);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void __attach_io_flag(struct f2fs_io_info *fio)</div><div class='add'>+static void f2fs_submit_write_bio(struct f2fs_sb_info *sbi, struct bio *bio,</div><div class='add'>+				  enum page_type type)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_sb_info *sbi = fio-&gt;sbi;</div><div class='del'>-	unsigned int temp_mask = (1 &lt;&lt; NR_TEMP_TYPE) - 1;</div><div class='del'>-	unsigned int io_flag, fua_flag, meta_flag;</div><div class='del'>-</div><div class='del'>-	if (fio-&gt;type == DATA)</div><div class='del'>-		io_flag = sbi-&gt;data_io_flag;</div><div class='del'>-	else if (fio-&gt;type == NODE)</div><div class='del'>-		io_flag = sbi-&gt;node_io_flag;</div><div class='del'>-	else</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	fua_flag = io_flag &amp; temp_mask;</div><div class='del'>-	meta_flag = (io_flag &gt;&gt; NR_TEMP_TYPE) &amp; temp_mask;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * data/node io flag bits per temp:</div><div class='del'>-	 *      REQ_META     |      REQ_FUA      |</div><div class='del'>-	 *    5 |    4 |   3 |    2 |    1 |   0 |</div><div class='del'>-	 * Cold | Warm | Hot | Cold | Warm | Hot |</div><div class='del'>-	 */</div><div class='del'>-	if ((1 &lt;&lt; fio-&gt;temp) &amp; meta_flag)</div><div class='del'>-		fio-&gt;op_flags |= REQ_META;</div><div class='del'>-	if ((1 &lt;&lt; fio-&gt;temp) &amp; fua_flag)</div><div class='del'>-		fio-&gt;op_flags |= REQ_FUA;</div><div class='add'>+	WARN_ON_ONCE(is_read_io(bio_op(bio)));</div><div class='add'>+	trace_f2fs_submit_write_bio(sbi-&gt;sb, type, bio);</div><div class='add'>+	iostat_update_submit_ctx(bio, type);</div><div class='add'>+	submit_bio(bio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void __submit_merged_bio(struct f2fs_bio_info *io)</div><div class='hunk'>@@ -535,47 +532,44 @@ static void __submit_merged_bio(struct f2fs_bio_info *io)</div><div class='ctx'> 	if (!io-&gt;bio)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	__attach_io_flag(fio);</div><div class='del'>-	bio_set_op_attrs(io-&gt;bio, fio-&gt;op, fio-&gt;op_flags);</div><div class='del'>-</div><div class='del'>-	if (is_read_io(fio-&gt;op))</div><div class='add'>+	if (is_read_io(fio-&gt;op)) {</div><div class='ctx'> 		trace_f2fs_prepare_read_bio(io-&gt;sbi-&gt;sb, fio-&gt;type, io-&gt;bio);</div><div class='del'>-	else</div><div class='add'>+		f2fs_submit_read_bio(io-&gt;sbi, io-&gt;bio, fio-&gt;type);</div><div class='add'>+	} else {</div><div class='ctx'> 		trace_f2fs_prepare_write_bio(io-&gt;sbi-&gt;sb, fio-&gt;type, io-&gt;bio);</div><div class='del'>-</div><div class='del'>-	__submit_bio(io-&gt;sbi, io-&gt;bio, fio-&gt;type);</div><div class='add'>+		f2fs_submit_write_bio(io-&gt;sbi, io-&gt;bio, fio-&gt;type);</div><div class='add'>+	}</div><div class='ctx'> 	io-&gt;bio = NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool __has_merged_page(struct bio *bio, struct inode *inode,</div><div class='del'>-						struct page *page, nid_t ino)</div><div class='add'>+						struct folio *folio, nid_t ino)</div><div class='ctx'> {</div><div class='del'>-	struct bio_vec *bvec;</div><div class='del'>-	struct bvec_iter_all iter_all;</div><div class='add'>+	struct folio_iter fi;</div><div class='ctx'> </div><div class='ctx'> 	if (!bio)</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	if (!inode &amp;&amp; !page &amp;&amp; !ino)</div><div class='add'>+	if (!inode &amp;&amp; !folio &amp;&amp; !ino)</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='del'>-	bio_for_each_segment_all(bvec, bio, iter_all) {</div><div class='del'>-		struct page *target = bvec-&gt;bv_page;</div><div class='add'>+	bio_for_each_folio_all(fi, bio) {</div><div class='add'>+		struct folio *target = fi.folio;</div><div class='ctx'> </div><div class='del'>-		if (fscrypt_is_bounce_page(target)) {</div><div class='del'>-			target = fscrypt_pagecache_page(target);</div><div class='add'>+		if (fscrypt_is_bounce_folio(target)) {</div><div class='add'>+			target = fscrypt_pagecache_folio(target);</div><div class='ctx'> 			if (IS_ERR(target))</div><div class='ctx'> 				continue;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (f2fs_is_compressed_page(target)) {</div><div class='del'>-			target = f2fs_compress_control_page(target);</div><div class='add'>+			target = f2fs_compress_control_folio(target);</div><div class='ctx'> 			if (IS_ERR(target))</div><div class='ctx'> 				continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (inode &amp;&amp; inode == target-&gt;mapping-&gt;host)</div><div class='ctx'> 			return true;</div><div class='del'>-		if (page &amp;&amp; page == target)</div><div class='add'>+		if (folio &amp;&amp; folio == target)</div><div class='ctx'> 			return true;</div><div class='ctx'> 		if (ino &amp;&amp; ino == ino_of_node(target))</div><div class='ctx'> 			return true;</div><div class='hunk'>@@ -584,28 +578,67 @@ static bool __has_merged_page(struct bio *bio, struct inode *inode,</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+int f2fs_init_write_merge_io(struct f2fs_sb_info *sbi)</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; NR_PAGE_TYPE; i++) {</div><div class='add'>+		int n = (i == META) ? 1 : NR_TEMP_TYPE;</div><div class='add'>+		int j;</div><div class='add'>+</div><div class='add'>+		sbi-&gt;write_io[i] = f2fs_kmalloc(sbi,</div><div class='add'>+				array_size(n, sizeof(struct f2fs_bio_info)),</div><div class='add'>+				GFP_KERNEL);</div><div class='add'>+		if (!sbi-&gt;write_io[i])</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+</div><div class='add'>+		for (j = HOT; j &lt; n; j++) {</div><div class='add'>+			struct f2fs_bio_info *io = &amp;sbi-&gt;write_io[i][j];</div><div class='add'>+</div><div class='add'>+			init_f2fs_rwsem(&amp;io-&gt;io_rwsem);</div><div class='add'>+			io-&gt;sbi = sbi;</div><div class='add'>+			io-&gt;bio = NULL;</div><div class='add'>+			io-&gt;last_block_in_bio = 0;</div><div class='add'>+			spin_lock_init(&amp;io-&gt;io_lock);</div><div class='add'>+			INIT_LIST_HEAD(&amp;io-&gt;io_list);</div><div class='add'>+			INIT_LIST_HEAD(&amp;io-&gt;bio_list);</div><div class='add'>+			init_f2fs_rwsem(&amp;io-&gt;bio_list_lock);</div><div class='add'>+#ifdef CONFIG_BLK_DEV_ZONED</div><div class='add'>+			init_completion(&amp;io-&gt;zone_wait);</div><div class='add'>+			io-&gt;zone_pending_bio = NULL;</div><div class='add'>+			io-&gt;bi_private = NULL;</div><div class='add'>+#endif</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void __f2fs_submit_merged_write(struct f2fs_sb_info *sbi,</div><div class='ctx'> 				enum page_type type, enum temp_type temp)</div><div class='ctx'> {</div><div class='ctx'> 	enum page_type btype = PAGE_TYPE_OF_BIO(type);</div><div class='ctx'> 	struct f2fs_bio_info *io = sbi-&gt;write_io[btype] + temp;</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;io-&gt;io_rwsem);</div><div class='add'>+	f2fs_down_write(&amp;io-&gt;io_rwsem);</div><div class='add'>+</div><div class='add'>+	if (!io-&gt;bio)</div><div class='add'>+		goto unlock_out;</div><div class='ctx'> </div><div class='ctx'> 	/* change META to META_FLUSH in the checkpoint procedure */</div><div class='ctx'> 	if (type &gt;= META_FLUSH) {</div><div class='ctx'> 		io-&gt;fio.type = META_FLUSH;</div><div class='del'>-		io-&gt;fio.op = REQ_OP_WRITE;</div><div class='del'>-		io-&gt;fio.op_flags = REQ_META | REQ_PRIO | REQ_SYNC;</div><div class='add'>+		io-&gt;bio-&gt;bi_opf |= REQ_META | REQ_PRIO | REQ_SYNC;</div><div class='ctx'> 		if (!test_opt(sbi, NOBARRIER))</div><div class='del'>-			io-&gt;fio.op_flags |= REQ_PREFLUSH | REQ_FUA;</div><div class='add'>+			io-&gt;bio-&gt;bi_opf |= REQ_PREFLUSH | REQ_FUA;</div><div class='ctx'> 	}</div><div class='ctx'> 	__submit_merged_bio(io);</div><div class='del'>-	up_write(&amp;io-&gt;io_rwsem);</div><div class='add'>+unlock_out:</div><div class='add'>+	f2fs_up_write(&amp;io-&gt;io_rwsem);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void __submit_merged_write_cond(struct f2fs_sb_info *sbi,</div><div class='del'>-				struct inode *inode, struct page *page,</div><div class='add'>+				struct inode *inode, struct folio *folio,</div><div class='ctx'> 				nid_t ino, enum page_type type, bool force)</div><div class='ctx'> {</div><div class='ctx'> 	enum temp_type temp;</div><div class='hunk'>@@ -616,9 +649,9 @@ static void __submit_merged_write_cond(struct f2fs_sb_info *sbi,</div><div class='ctx'> 			enum page_type btype = PAGE_TYPE_OF_BIO(type);</div><div class='ctx'> 			struct f2fs_bio_info *io = sbi-&gt;write_io[btype] + temp;</div><div class='ctx'> </div><div class='del'>-			down_read(&amp;io-&gt;io_rwsem);</div><div class='del'>-			ret = __has_merged_page(io-&gt;bio, inode, page, ino);</div><div class='del'>-			up_read(&amp;io-&gt;io_rwsem);</div><div class='add'>+			f2fs_down_read(&amp;io-&gt;io_rwsem);</div><div class='add'>+			ret = __has_merged_page(io-&gt;bio, inode, folio, ino);</div><div class='add'>+			f2fs_up_read(&amp;io-&gt;io_rwsem);</div><div class='ctx'> 		}</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			__f2fs_submit_merged_write(sbi, type, temp);</div><div class='hunk'>@@ -635,10 +668,10 @@ void f2fs_submit_merged_write(struct f2fs_sb_info *sbi, enum page_type type)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_submit_merged_write_cond(struct f2fs_sb_info *sbi,</div><div class='del'>-				struct inode *inode, struct page *page,</div><div class='add'>+				struct inode *inode, struct folio *folio,</div><div class='ctx'> 				nid_t ino, enum page_type type)</div><div class='ctx'> {</div><div class='del'>-	__submit_merged_write_cond(sbi, inode, page, ino, type, false);</div><div class='add'>+	__submit_merged_write_cond(sbi, inode, folio, ino, type, false);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_flush_merged_writes(struct f2fs_sb_info *sbi)</div><div class='hunk'>@@ -655,37 +688,34 @@ void f2fs_flush_merged_writes(struct f2fs_sb_info *sbi)</div><div class='ctx'> int f2fs_submit_page_bio(struct f2fs_io_info *fio)</div><div class='ctx'> {</div><div class='ctx'> 	struct bio *bio;</div><div class='del'>-	struct page *page = fio-&gt;encrypted_page ?</div><div class='del'>-			fio-&gt;encrypted_page : fio-&gt;page;</div><div class='add'>+	struct folio *fio_folio = fio-&gt;folio;</div><div class='add'>+	struct folio *data_folio = fio-&gt;encrypted_page ?</div><div class='add'>+			page_folio(fio-&gt;encrypted_page) : fio_folio;</div><div class='ctx'> </div><div class='ctx'> 	if (!f2fs_is_valid_blkaddr(fio-&gt;sbi, fio-&gt;new_blkaddr,</div><div class='ctx'> 			fio-&gt;is_por ? META_POR : (__is_meta_io(fio) ?</div><div class='ctx'> 			META_GENERIC : DATA_GENERIC_ENHANCE)))</div><div class='ctx'> 		return -EFSCORRUPTED;</div><div class='ctx'> </div><div class='del'>-	trace_f2fs_submit_page_bio(page, fio);</div><div class='add'>+	trace_f2fs_submit_folio_bio(data_folio, fio);</div><div class='ctx'> </div><div class='ctx'> 	/* Allocate a new bio */</div><div class='ctx'> 	bio = __bio_alloc(fio, 1);</div><div class='ctx'> </div><div class='del'>-	f2fs_set_bio_crypt_ctx(bio, fio-&gt;page-&gt;mapping-&gt;host,</div><div class='del'>-			       fio-&gt;page-&gt;index, fio, GFP_NOIO);</div><div class='del'>-</div><div class='del'>-	if (bio_add_page(bio, page, PAGE_SIZE, 0) &lt; PAGE_SIZE) {</div><div class='del'>-		bio_put(bio);</div><div class='del'>-		return -EFAULT;</div><div class='del'>-	}</div><div class='add'>+	f2fs_set_bio_crypt_ctx(bio, fio_folio-&gt;mapping-&gt;host,</div><div class='add'>+			fio_folio-&gt;index, fio, GFP_NOIO);</div><div class='add'>+	bio_add_folio_nofail(bio, data_folio, folio_size(data_folio), 0);</div><div class='ctx'> </div><div class='ctx'> 	if (fio-&gt;io_wbc &amp;&amp; !is_read_io(fio-&gt;op))</div><div class='del'>-		wbc_account_cgroup_owner(fio-&gt;io_wbc, page, PAGE_SIZE);</div><div class='del'>-</div><div class='del'>-	__attach_io_flag(fio);</div><div class='del'>-	bio_set_op_attrs(bio, fio-&gt;op, fio-&gt;op_flags);</div><div class='add'>+		wbc_account_cgroup_owner(fio-&gt;io_wbc, fio_folio, PAGE_SIZE);</div><div class='ctx'> </div><div class='ctx'> 	inc_page_count(fio-&gt;sbi, is_read_io(fio-&gt;op) ?</div><div class='del'>-			__read_io_type(page): WB_DATA_TYPE(fio-&gt;page));</div><div class='add'>+			__read_io_type(data_folio) : WB_DATA_TYPE(fio-&gt;folio, false));</div><div class='ctx'> </div><div class='del'>-	__submit_bio(fio-&gt;sbi, bio, fio-&gt;type);</div><div class='add'>+	if (is_read_io(bio_op(bio)))</div><div class='add'>+		f2fs_submit_read_bio(fio-&gt;sbi, bio, fio-&gt;type);</div><div class='add'>+	else</div><div class='add'>+		f2fs_submit_write_bio(fio-&gt;sbi, bio, fio-&gt;type);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -703,9 +733,11 @@ static bool page_is_mergeable(struct f2fs_sb_info *sbi, struct bio *bio,</div><div class='ctx'> static bool io_type_is_mergeable(struct f2fs_bio_info *io,</div><div class='ctx'> 						struct f2fs_io_info *fio)</div><div class='ctx'> {</div><div class='add'>+	blk_opf_t mask = ~(REQ_PREFLUSH | REQ_FUA);</div><div class='add'>+</div><div class='ctx'> 	if (io-&gt;fio.op != fio-&gt;op)</div><div class='ctx'> 		return false;</div><div class='del'>-	return io-&gt;fio.op_flags == fio-&gt;op_flags;</div><div class='add'>+	return (io-&gt;fio.op_flags &amp; mask) == (fio-&gt;op_flags &amp; mask);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool io_is_mergeable(struct f2fs_sb_info *sbi, struct bio *bio,</div><div class='hunk'>@@ -714,23 +746,13 @@ static bool io_is_mergeable(struct f2fs_sb_info *sbi, struct bio *bio,</div><div class='ctx'> 					block_t last_blkaddr,</div><div class='ctx'> 					block_t cur_blkaddr)</div><div class='ctx'> {</div><div class='del'>-	if (F2FS_IO_ALIGNED(sbi) &amp;&amp; (fio-&gt;type == DATA || fio-&gt;type == NODE)) {</div><div class='del'>-		unsigned int filled_blocks =</div><div class='del'>-				F2FS_BYTES_TO_BLK(bio-&gt;bi_iter.bi_size);</div><div class='del'>-		unsigned int io_size = F2FS_IO_SIZE(sbi);</div><div class='del'>-		unsigned int left_vecs = bio-&gt;bi_max_vecs - bio-&gt;bi_vcnt;</div><div class='del'>-</div><div class='del'>-		/* IOs in bio is aligned and left space of vectors is not enough */</div><div class='del'>-		if (!(filled_blocks % io_size) &amp;&amp; left_vecs &lt; io_size)</div><div class='del'>-			return false;</div><div class='del'>-	}</div><div class='ctx'> 	if (!page_is_mergeable(sbi, bio, last_blkaddr, cur_blkaddr))</div><div class='ctx'> 		return false;</div><div class='ctx'> 	return io_type_is_mergeable(io, fio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void add_bio_entry(struct f2fs_sb_info *sbi, struct bio *bio,</div><div class='del'>-				struct page *page, enum temp_type temp)</div><div class='add'>+				struct folio *folio, enum temp_type temp)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_bio_info *io = sbi-&gt;write_io[DATA] + temp;</div><div class='ctx'> 	struct bio_entry *be;</div><div class='hunk'>@@ -739,12 +761,11 @@ static void add_bio_entry(struct f2fs_sb_info *sbi, struct bio *bio,</div><div class='ctx'> 	be-&gt;bio = bio;</div><div class='ctx'> 	bio_get(bio);</div><div class='ctx'> </div><div class='del'>-	if (bio_add_page(bio, page, PAGE_SIZE, 0) != PAGE_SIZE)</div><div class='del'>-		f2fs_bug_on(sbi, 1);</div><div class='add'>+	bio_add_folio_nofail(bio, folio, folio_size(folio), 0);</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;io-&gt;bio_list_lock);</div><div class='add'>+	f2fs_down_write(&amp;io-&gt;bio_list_lock);</div><div class='ctx'> 	list_add_tail(&amp;be-&gt;list, &amp;io-&gt;bio_list);</div><div class='del'>-	up_write(&amp;io-&gt;bio_list_lock);</div><div class='add'>+	f2fs_up_write(&amp;io-&gt;bio_list_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void del_bio_entry(struct bio_entry *be)</div><div class='hunk'>@@ -754,8 +775,9 @@ static void del_bio_entry(struct bio_entry *be)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int add_ipu_page(struct f2fs_io_info *fio, struct bio **bio,</div><div class='del'>-							struct page *page)</div><div class='add'>+							struct folio *folio)</div><div class='ctx'> {</div><div class='add'>+	struct folio *fio_folio = fio-&gt;folio;</div><div class='ctx'> 	struct f2fs_sb_info *sbi = fio-&gt;sbi;</div><div class='ctx'> 	enum temp_type temp;</div><div class='ctx'> 	bool found = false;</div><div class='hunk'>@@ -766,7 +788,7 @@ static int add_ipu_page(struct f2fs_io_info *fio, struct bio **bio,</div><div class='ctx'> 		struct list_head *head = &amp;io-&gt;bio_list;</div><div class='ctx'> 		struct bio_entry *be;</div><div class='ctx'> </div><div class='del'>-		down_write(&amp;io-&gt;bio_list_lock);</div><div class='add'>+		f2fs_down_write(&amp;io-&gt;bio_list_lock);</div><div class='ctx'> 		list_for_each_entry(be, head, list) {</div><div class='ctx'> 			if (be-&gt;bio != *bio)</div><div class='ctx'> 				continue;</div><div class='hunk'>@@ -777,20 +799,19 @@ static int add_ipu_page(struct f2fs_io_info *fio, struct bio **bio,</div><div class='ctx'> 							    *fio-&gt;last_block,</div><div class='ctx'> 							    fio-&gt;new_blkaddr));</div><div class='ctx'> 			if (f2fs_crypt_mergeable_bio(*bio,</div><div class='del'>-					fio-&gt;page-&gt;mapping-&gt;host,</div><div class='del'>-					fio-&gt;page-&gt;index, fio) &amp;&amp;</div><div class='del'>-			    bio_add_page(*bio, page, PAGE_SIZE, 0) ==</div><div class='del'>-					PAGE_SIZE) {</div><div class='add'>+					fio_folio-&gt;mapping-&gt;host,</div><div class='add'>+					fio_folio-&gt;index, fio) &amp;&amp;</div><div class='add'>+			    bio_add_folio(*bio, folio, folio_size(folio), 0)) {</div><div class='ctx'> 				ret = 0;</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			/* page can't be merged into bio; submit the bio */</div><div class='ctx'> 			del_bio_entry(be);</div><div class='del'>-			__submit_bio(sbi, *bio, DATA);</div><div class='add'>+			f2fs_submit_write_bio(sbi, *bio, DATA);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-		up_write(&amp;io-&gt;bio_list_lock);</div><div class='add'>+		f2fs_up_write(&amp;io-&gt;bio_list_lock);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (ret) {</div><div class='hunk'>@@ -802,12 +823,14 @@ static int add_ipu_page(struct f2fs_io_info *fio, struct bio **bio,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_submit_merged_ipu_write(struct f2fs_sb_info *sbi,</div><div class='del'>-					struct bio **bio, struct page *page)</div><div class='add'>+					struct bio **bio, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	enum temp_type temp;</div><div class='ctx'> 	bool found = false;</div><div class='ctx'> 	struct bio *target = bio ? *bio : NULL;</div><div class='ctx'> </div><div class='add'>+	f2fs_bug_on(sbi, !target &amp;&amp; !folio);</div><div class='add'>+</div><div class='ctx'> 	for (temp = HOT; temp &lt; NR_TEMP_TYPE &amp;&amp; !found; temp++) {</div><div class='ctx'> 		struct f2fs_bio_info *io = sbi-&gt;write_io[DATA] + temp;</div><div class='ctx'> 		struct list_head *head = &amp;io-&gt;bio_list;</div><div class='hunk'>@@ -816,41 +839,41 @@ void f2fs_submit_merged_ipu_write(struct f2fs_sb_info *sbi,</div><div class='ctx'> 		if (list_empty(head))</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		down_read(&amp;io-&gt;bio_list_lock);</div><div class='add'>+		f2fs_down_read(&amp;io-&gt;bio_list_lock);</div><div class='ctx'> 		list_for_each_entry(be, head, list) {</div><div class='ctx'> 			if (target)</div><div class='ctx'> 				found = (target == be-&gt;bio);</div><div class='ctx'> 			else</div><div class='ctx'> 				found = __has_merged_page(be-&gt;bio, NULL,</div><div class='del'>-								page, 0);</div><div class='add'>+							folio, 0);</div><div class='ctx'> 			if (found)</div><div class='ctx'> 				break;</div><div class='ctx'> 		}</div><div class='del'>-		up_read(&amp;io-&gt;bio_list_lock);</div><div class='add'>+		f2fs_up_read(&amp;io-&gt;bio_list_lock);</div><div class='ctx'> </div><div class='ctx'> 		if (!found)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		found = false;</div><div class='ctx'> </div><div class='del'>-		down_write(&amp;io-&gt;bio_list_lock);</div><div class='add'>+		f2fs_down_write(&amp;io-&gt;bio_list_lock);</div><div class='ctx'> 		list_for_each_entry(be, head, list) {</div><div class='ctx'> 			if (target)</div><div class='ctx'> 				found = (target == be-&gt;bio);</div><div class='ctx'> 			else</div><div class='ctx'> 				found = __has_merged_page(be-&gt;bio, NULL,</div><div class='del'>-								page, 0);</div><div class='add'>+							folio, 0);</div><div class='ctx'> 			if (found) {</div><div class='ctx'> 				target = be-&gt;bio;</div><div class='ctx'> 				del_bio_entry(be);</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		up_write(&amp;io-&gt;bio_list_lock);</div><div class='add'>+		f2fs_up_write(&amp;io-&gt;bio_list_lock);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (found)</div><div class='del'>-		__submit_bio(sbi, target, DATA);</div><div class='add'>+		f2fs_submit_write_bio(sbi, target, DATA);</div><div class='ctx'> 	if (bio &amp;&amp; *bio) {</div><div class='ctx'> 		bio_put(*bio);</div><div class='ctx'> 		*bio = NULL;</div><div class='hunk'>@@ -860,14 +883,15 @@ void f2fs_submit_merged_ipu_write(struct f2fs_sb_info *sbi,</div><div class='ctx'> int f2fs_merge_page_bio(struct f2fs_io_info *fio)</div><div class='ctx'> {</div><div class='ctx'> 	struct bio *bio = *fio-&gt;bio;</div><div class='del'>-	struct page *page = fio-&gt;encrypted_page ?</div><div class='del'>-			fio-&gt;encrypted_page : fio-&gt;page;</div><div class='add'>+	struct folio *data_folio = fio-&gt;encrypted_page ?</div><div class='add'>+			page_folio(fio-&gt;encrypted_page) : fio-&gt;folio;</div><div class='add'>+	struct folio *folio = fio-&gt;folio;</div><div class='ctx'> </div><div class='ctx'> 	if (!f2fs_is_valid_blkaddr(fio-&gt;sbi, fio-&gt;new_blkaddr,</div><div class='ctx'> 			__is_meta_io(fio) ? META_GENERIC : DATA_GENERIC))</div><div class='ctx'> 		return -EFSCORRUPTED;</div><div class='ctx'> </div><div class='del'>-	trace_f2fs_submit_page_bio(page, fio);</div><div class='add'>+	trace_f2fs_submit_folio_bio(data_folio, fio);</div><div class='ctx'> </div><div class='ctx'> 	if (bio &amp;&amp; !page_is_mergeable(fio-&gt;sbi, bio, *fio-&gt;last_block,</div><div class='ctx'> 						fio-&gt;new_blkaddr))</div><div class='hunk'>@@ -875,21 +899,19 @@ int f2fs_merge_page_bio(struct f2fs_io_info *fio)</div><div class='ctx'> alloc_new:</div><div class='ctx'> 	if (!bio) {</div><div class='ctx'> 		bio = __bio_alloc(fio, BIO_MAX_VECS);</div><div class='del'>-		__attach_io_flag(fio);</div><div class='del'>-		f2fs_set_bio_crypt_ctx(bio, fio-&gt;page-&gt;mapping-&gt;host,</div><div class='del'>-				       fio-&gt;page-&gt;index, fio, GFP_NOIO);</div><div class='del'>-		bio_set_op_attrs(bio, fio-&gt;op, fio-&gt;op_flags);</div><div class='add'>+		f2fs_set_bio_crypt_ctx(bio, folio-&gt;mapping-&gt;host,</div><div class='add'>+				folio-&gt;index, fio, GFP_NOIO);</div><div class='ctx'> </div><div class='del'>-		add_bio_entry(fio-&gt;sbi, bio, page, fio-&gt;temp);</div><div class='add'>+		add_bio_entry(fio-&gt;sbi, bio, data_folio, fio-&gt;temp);</div><div class='ctx'> 	} else {</div><div class='del'>-		if (add_ipu_page(fio, &amp;bio, page))</div><div class='add'>+		if (add_ipu_page(fio, &amp;bio, data_folio))</div><div class='ctx'> 			goto alloc_new;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (fio-&gt;io_wbc)</div><div class='del'>-		wbc_account_cgroup_owner(fio-&gt;io_wbc, page, PAGE_SIZE);</div><div class='add'>+		wbc_account_cgroup_owner(fio-&gt;io_wbc, folio, folio_size(folio));</div><div class='ctx'> </div><div class='del'>-	inc_page_count(fio-&gt;sbi, WB_DATA_TYPE(page));</div><div class='add'>+	inc_page_count(fio-&gt;sbi, WB_DATA_TYPE(folio, false));</div><div class='ctx'> </div><div class='ctx'> 	*fio-&gt;last_block = fio-&gt;new_blkaddr;</div><div class='ctx'> 	*fio-&gt;bio = bio;</div><div class='hunk'>@@ -897,17 +919,49 @@ alloc_new:</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_BLK_DEV_ZONED</div><div class='add'>+static bool is_end_zone_blkaddr(struct f2fs_sb_info *sbi, block_t blkaddr)</div><div class='add'>+{</div><div class='add'>+	struct block_device *bdev = sbi-&gt;sb-&gt;s_bdev;</div><div class='add'>+	int devi = 0;</div><div class='add'>+</div><div class='add'>+	if (f2fs_is_multi_device(sbi)) {</div><div class='add'>+		devi = f2fs_target_device_index(sbi, blkaddr);</div><div class='add'>+		if (blkaddr &lt; FDEV(devi).start_blk ||</div><div class='add'>+		    blkaddr &gt; FDEV(devi).end_blk) {</div><div class='add'>+			f2fs_err(sbi, "Invalid block %x", blkaddr);</div><div class='add'>+			return false;</div><div class='add'>+		}</div><div class='add'>+		blkaddr -= FDEV(devi).start_blk;</div><div class='add'>+		bdev = FDEV(devi).bdev;</div><div class='add'>+	}</div><div class='add'>+	return bdev_is_zoned(bdev) &amp;&amp;</div><div class='add'>+		f2fs_blkz_is_seq(sbi, devi, blkaddr) &amp;&amp;</div><div class='add'>+		(blkaddr % sbi-&gt;blocks_per_blkz == sbi-&gt;blocks_per_blkz - 1);</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> void f2fs_submit_page_write(struct f2fs_io_info *fio)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = fio-&gt;sbi;</div><div class='ctx'> 	enum page_type btype = PAGE_TYPE_OF_BIO(fio-&gt;type);</div><div class='ctx'> 	struct f2fs_bio_info *io = sbi-&gt;write_io[btype] + fio-&gt;temp;</div><div class='del'>-	struct page *bio_page;</div><div class='add'>+	struct folio *bio_folio;</div><div class='add'>+	enum count_type type;</div><div class='ctx'> </div><div class='ctx'> 	f2fs_bug_on(sbi, is_read_io(fio-&gt;op));</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;io-&gt;io_rwsem);</div><div class='add'>+	f2fs_down_write(&amp;io-&gt;io_rwsem);</div><div class='ctx'> next:</div><div class='add'>+#ifdef CONFIG_BLK_DEV_ZONED</div><div class='add'>+	if (f2fs_sb_has_blkzoned(sbi) &amp;&amp; btype &lt; META &amp;&amp; io-&gt;zone_pending_bio) {</div><div class='add'>+		wait_for_completion_io(&amp;io-&gt;zone_wait);</div><div class='add'>+		bio_put(io-&gt;zone_pending_bio);</div><div class='add'>+		io-&gt;zone_pending_bio = NULL;</div><div class='add'>+		io-&gt;bi_private = NULL;</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> 	if (fio-&gt;in_list) {</div><div class='ctx'> 		spin_lock(&amp;io-&gt;io_lock);</div><div class='ctx'> 		if (list_empty(&amp;io-&gt;io_list)) {</div><div class='hunk'>@@ -923,78 +977,82 @@ next:</div><div class='ctx'> 	verify_fio_blkaddr(fio);</div><div class='ctx'> </div><div class='ctx'> 	if (fio-&gt;encrypted_page)</div><div class='del'>-		bio_page = fio-&gt;encrypted_page;</div><div class='add'>+		bio_folio = page_folio(fio-&gt;encrypted_page);</div><div class='ctx'> 	else if (fio-&gt;compressed_page)</div><div class='del'>-		bio_page = fio-&gt;compressed_page;</div><div class='add'>+		bio_folio = page_folio(fio-&gt;compressed_page);</div><div class='ctx'> 	else</div><div class='del'>-		bio_page = fio-&gt;page;</div><div class='add'>+		bio_folio = fio-&gt;folio;</div><div class='ctx'> </div><div class='ctx'> 	/* set submitted = true as a return value */</div><div class='del'>-	fio-&gt;submitted = true;</div><div class='add'>+	fio-&gt;submitted = 1;</div><div class='ctx'> </div><div class='del'>-	inc_page_count(sbi, WB_DATA_TYPE(bio_page));</div><div class='add'>+	type = WB_DATA_TYPE(bio_folio, fio-&gt;compressed_page);</div><div class='add'>+	inc_page_count(sbi, type);</div><div class='ctx'> </div><div class='ctx'> 	if (io-&gt;bio &amp;&amp;</div><div class='ctx'> 	    (!io_is_mergeable(sbi, io-&gt;bio, io, fio, io-&gt;last_block_in_bio,</div><div class='ctx'> 			      fio-&gt;new_blkaddr) ||</div><div class='del'>-	     !f2fs_crypt_mergeable_bio(io-&gt;bio, fio-&gt;page-&gt;mapping-&gt;host,</div><div class='del'>-				       bio_page-&gt;index, fio)))</div><div class='add'>+	     !f2fs_crypt_mergeable_bio(io-&gt;bio, fio_inode(fio),</div><div class='add'>+				bio_folio-&gt;index, fio)))</div><div class='ctx'> 		__submit_merged_bio(io);</div><div class='ctx'> alloc_new:</div><div class='ctx'> 	if (io-&gt;bio == NULL) {</div><div class='del'>-		if (F2FS_IO_ALIGNED(sbi) &amp;&amp;</div><div class='del'>-				(fio-&gt;type == DATA || fio-&gt;type == NODE) &amp;&amp;</div><div class='del'>-				fio-&gt;new_blkaddr &amp; F2FS_IO_SIZE_MASK(sbi)) {</div><div class='del'>-			dec_page_count(sbi, WB_DATA_TYPE(bio_page));</div><div class='del'>-			fio-&gt;retry = true;</div><div class='del'>-			goto skip;</div><div class='del'>-		}</div><div class='ctx'> 		io-&gt;bio = __bio_alloc(fio, BIO_MAX_VECS);</div><div class='del'>-		f2fs_set_bio_crypt_ctx(io-&gt;bio, fio-&gt;page-&gt;mapping-&gt;host,</div><div class='del'>-				       bio_page-&gt;index, fio, GFP_NOIO);</div><div class='add'>+		f2fs_set_bio_crypt_ctx(io-&gt;bio, fio_inode(fio),</div><div class='add'>+				bio_folio-&gt;index, fio, GFP_NOIO);</div><div class='ctx'> 		io-&gt;fio = *fio;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (bio_add_page(io-&gt;bio, bio_page, PAGE_SIZE, 0) &lt; PAGE_SIZE) {</div><div class='add'>+	if (!bio_add_folio(io-&gt;bio, bio_folio, folio_size(bio_folio), 0)) {</div><div class='ctx'> 		__submit_merged_bio(io);</div><div class='ctx'> 		goto alloc_new;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (fio-&gt;io_wbc)</div><div class='del'>-		wbc_account_cgroup_owner(fio-&gt;io_wbc, bio_page, PAGE_SIZE);</div><div class='add'>+		wbc_account_cgroup_owner(fio-&gt;io_wbc, fio-&gt;folio,</div><div class='add'>+				folio_size(fio-&gt;folio));</div><div class='ctx'> </div><div class='ctx'> 	io-&gt;last_block_in_bio = fio-&gt;new_blkaddr;</div><div class='ctx'> </div><div class='del'>-	trace_f2fs_submit_page_write(fio-&gt;page, fio);</div><div class='del'>-skip:</div><div class='add'>+	trace_f2fs_submit_folio_write(fio-&gt;folio, fio);</div><div class='add'>+#ifdef CONFIG_BLK_DEV_ZONED</div><div class='add'>+	if (f2fs_sb_has_blkzoned(sbi) &amp;&amp; btype &lt; META &amp;&amp;</div><div class='add'>+			is_end_zone_blkaddr(sbi, fio-&gt;new_blkaddr)) {</div><div class='add'>+		bio_get(io-&gt;bio);</div><div class='add'>+		reinit_completion(&amp;io-&gt;zone_wait);</div><div class='add'>+		io-&gt;bi_private = io-&gt;bio-&gt;bi_private;</div><div class='add'>+		io-&gt;bio-&gt;bi_private = io;</div><div class='add'>+		io-&gt;bio-&gt;bi_end_io = f2fs_zone_write_end_io;</div><div class='add'>+		io-&gt;zone_pending_bio = io-&gt;bio;</div><div class='add'>+		__submit_merged_bio(io);</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='ctx'> 	if (fio-&gt;in_list)</div><div class='ctx'> 		goto next;</div><div class='ctx'> out:</div><div class='ctx'> 	if (is_sbi_flag_set(sbi, SBI_IS_SHUTDOWN) ||</div><div class='ctx'> 				!f2fs_is_checkpoint_ready(sbi))</div><div class='ctx'> 		__submit_merged_bio(io);</div><div class='del'>-	up_write(&amp;io-&gt;io_rwsem);</div><div class='add'>+	f2fs_up_write(&amp;io-&gt;io_rwsem);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct bio *f2fs_grab_read_bio(struct inode *inode, block_t blkaddr,</div><div class='del'>-				      unsigned nr_pages, unsigned op_flag,</div><div class='add'>+				      unsigned nr_pages, blk_opf_t op_flag,</div><div class='ctx'> 				      pgoff_t first_idx, bool for_write)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	struct bio *bio;</div><div class='ctx'> 	struct bio_post_read_ctx *ctx = NULL;</div><div class='ctx'> 	unsigned int post_read_steps = 0;</div><div class='add'>+	sector_t sector;</div><div class='add'>+	struct block_device *bdev = f2fs_target_device(sbi, blkaddr, &amp;sector);</div><div class='ctx'> </div><div class='del'>-	bio = bio_alloc_bioset(for_write ? GFP_NOIO : GFP_KERNEL,</div><div class='del'>-			       bio_max_segs(nr_pages), &amp;f2fs_bioset);</div><div class='del'>-	if (!bio)</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='del'>-</div><div class='add'>+	bio = bio_alloc_bioset(bdev, bio_max_segs(nr_pages),</div><div class='add'>+			       REQ_OP_READ | op_flag,</div><div class='add'>+			       for_write ? GFP_NOIO : GFP_KERNEL, &amp;f2fs_bioset);</div><div class='add'>+	bio-&gt;bi_iter.bi_sector = sector;</div><div class='ctx'> 	f2fs_set_bio_crypt_ctx(bio, inode, first_idx, NULL, GFP_NOFS);</div><div class='del'>-</div><div class='del'>-	f2fs_target_device(sbi, blkaddr, bio);</div><div class='ctx'> 	bio-&gt;bi_end_io = f2fs_read_end_io;</div><div class='del'>-	bio_set_op_attrs(bio, REQ_OP_READ, op_flag);</div><div class='ctx'> </div><div class='ctx'> 	if (fscrypt_inode_uses_fs_layer_crypto(inode))</div><div class='ctx'> 		post_read_steps |= STEP_DECRYPT;</div><div class='hunk'>@@ -1016,6 +1074,7 @@ static struct bio *f2fs_grab_read_bio(struct inode *inode, block_t blkaddr,</div><div class='ctx'> 		ctx-&gt;sbi = sbi;</div><div class='ctx'> 		ctx-&gt;enabled_steps = post_read_steps;</div><div class='ctx'> 		ctx-&gt;fs_blkaddr = blkaddr;</div><div class='add'>+		ctx-&gt;decompression_attempted = false;</div><div class='ctx'> 		bio-&gt;bi_private = ctx;</div><div class='ctx'> 	}</div><div class='ctx'> 	iostat_alloc_and_bind_ctx(sbi, bio, ctx);</div><div class='hunk'>@@ -1024,64 +1083,53 @@ static struct bio *f2fs_grab_read_bio(struct inode *inode, block_t blkaddr,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* This can handle encryption stuffs */</div><div class='del'>-static int f2fs_submit_page_read(struct inode *inode, struct page *page,</div><div class='del'>-				 block_t blkaddr, int op_flags, bool for_write)</div><div class='add'>+static void f2fs_submit_page_read(struct inode *inode, struct folio *folio,</div><div class='add'>+				 block_t blkaddr, blk_opf_t op_flags,</div><div class='add'>+				 bool for_write)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	struct bio *bio;</div><div class='ctx'> </div><div class='ctx'> 	bio = f2fs_grab_read_bio(inode, blkaddr, 1, op_flags,</div><div class='del'>-					page-&gt;index, for_write);</div><div class='del'>-	if (IS_ERR(bio))</div><div class='del'>-		return PTR_ERR(bio);</div><div class='add'>+					folio-&gt;index, for_write);</div><div class='ctx'> </div><div class='ctx'> 	/* wait for GCed page writeback via META_MAPPING */</div><div class='ctx'> 	f2fs_wait_on_block_writeback(inode, blkaddr);</div><div class='ctx'> </div><div class='del'>-	if (bio_add_page(bio, page, PAGE_SIZE, 0) &lt; PAGE_SIZE) {</div><div class='del'>-		bio_put(bio);</div><div class='del'>-		return -EFAULT;</div><div class='del'>-	}</div><div class='del'>-	ClearPageError(page);</div><div class='add'>+	if (!bio_add_folio(bio, folio, PAGE_SIZE, 0))</div><div class='add'>+		f2fs_bug_on(sbi, 1);</div><div class='add'>+</div><div class='ctx'> 	inc_page_count(sbi, F2FS_RD_DATA);</div><div class='del'>-	f2fs_update_iostat(sbi, FS_DATA_READ_IO, F2FS_BLKSIZE);</div><div class='del'>-	__submit_bio(sbi, bio, DATA);</div><div class='del'>-	return 0;</div><div class='add'>+	f2fs_update_iostat(sbi, NULL, FS_DATA_READ_IO, F2FS_BLKSIZE);</div><div class='add'>+	f2fs_submit_read_bio(sbi, bio, DATA);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void __set_data_blkaddr(struct dnode_of_data *dn)</div><div class='add'>+static void __set_data_blkaddr(struct dnode_of_data *dn, block_t blkaddr)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_node *rn = F2FS_NODE(dn-&gt;node_page);</div><div class='del'>-	__le32 *addr_array;</div><div class='del'>-	int base = 0;</div><div class='add'>+	__le32 *addr = get_dnode_addr(dn-&gt;inode, dn-&gt;node_folio);</div><div class='ctx'> </div><div class='del'>-	if (IS_INODE(dn-&gt;node_page) &amp;&amp; f2fs_has_extra_attr(dn-&gt;inode))</div><div class='del'>-		base = get_extra_isize(dn-&gt;inode);</div><div class='del'>-</div><div class='del'>-	/* Get physical address of data block */</div><div class='del'>-	addr_array = blkaddr_in_node(rn);</div><div class='del'>-	addr_array[base + dn-&gt;ofs_in_node] = cpu_to_le32(dn-&gt;data_blkaddr);</div><div class='add'>+	dn-&gt;data_blkaddr = blkaddr;</div><div class='add'>+	addr[dn-&gt;ofs_in_node] = cpu_to_le32(dn-&gt;data_blkaddr);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Lock ordering for the change of data block address:</div><div class='ctx'>  * -&gt;data_page</div><div class='del'>- *  -&gt;node_page</div><div class='add'>+ *  -&gt;node_folio</div><div class='ctx'>  *    update block addresses in the node page</div><div class='ctx'>  */</div><div class='del'>-void f2fs_set_data_blkaddr(struct dnode_of_data *dn)</div><div class='add'>+void f2fs_set_data_blkaddr(struct dnode_of_data *dn, block_t blkaddr)</div><div class='ctx'> {</div><div class='del'>-	f2fs_wait_on_page_writeback(dn-&gt;node_page, NODE, true, true);</div><div class='del'>-	__set_data_blkaddr(dn);</div><div class='del'>-	if (set_page_dirty(dn-&gt;node_page))</div><div class='add'>+	f2fs_folio_wait_writeback(dn-&gt;node_folio, NODE, true, true);</div><div class='add'>+	__set_data_blkaddr(dn, blkaddr);</div><div class='add'>+	if (folio_mark_dirty(dn-&gt;node_folio))</div><div class='ctx'> 		dn-&gt;node_changed = true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_update_data_blkaddr(struct dnode_of_data *dn, block_t blkaddr)</div><div class='ctx'> {</div><div class='del'>-	dn-&gt;data_blkaddr = blkaddr;</div><div class='del'>-	f2fs_set_data_blkaddr(dn);</div><div class='del'>-	f2fs_update_extent_cache(dn);</div><div class='add'>+	f2fs_set_data_blkaddr(dn, blkaddr);</div><div class='add'>+	f2fs_update_read_extent_cache(dn);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* dn-&gt;ofs_in_node will be returned with up-to-date last block pointer */</div><div class='hunk'>@@ -1095,25 +1143,25 @@ int f2fs_reserve_new_blocks(struct dnode_of_data *dn, blkcnt_t count)</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(is_inode_flag_set(dn-&gt;inode, FI_NO_ALLOC)))</div><div class='ctx'> 		return -EPERM;</div><div class='del'>-	if (unlikely((err = inc_valid_block_count(sbi, dn-&gt;inode, &amp;count))))</div><div class='add'>+	err = inc_valid_block_count(sbi, dn-&gt;inode, &amp;count, true);</div><div class='add'>+	if (unlikely(err))</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='ctx'> 	trace_f2fs_reserve_new_blocks(dn-&gt;inode, dn-&gt;nid,</div><div class='ctx'> 						dn-&gt;ofs_in_node, count);</div><div class='ctx'> </div><div class='del'>-	f2fs_wait_on_page_writeback(dn-&gt;node_page, NODE, true, true);</div><div class='add'>+	f2fs_folio_wait_writeback(dn-&gt;node_folio, NODE, true, true);</div><div class='ctx'> </div><div class='ctx'> 	for (; count &gt; 0; dn-&gt;ofs_in_node++) {</div><div class='ctx'> 		block_t blkaddr = f2fs_data_blkaddr(dn);</div><div class='ctx'> </div><div class='ctx'> 		if (blkaddr == NULL_ADDR) {</div><div class='del'>-			dn-&gt;data_blkaddr = NEW_ADDR;</div><div class='del'>-			__set_data_blkaddr(dn);</div><div class='add'>+			__set_data_blkaddr(dn, NEW_ADDR);</div><div class='ctx'> 			count--;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (set_page_dirty(dn-&gt;node_page))</div><div class='add'>+	if (folio_mark_dirty(dn-&gt;node_folio))</div><div class='ctx'> 		dn-&gt;node_changed = true;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -1131,7 +1179,7 @@ int f2fs_reserve_new_block(struct dnode_of_data *dn)</div><div class='ctx'> </div><div class='ctx'> int f2fs_reserve_block(struct dnode_of_data *dn, pgoff_t index)</div><div class='ctx'> {</div><div class='del'>-	bool need_put = dn-&gt;inode_page ? false : true;</div><div class='add'>+	bool need_put = dn-&gt;inode_folio ? false : true;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	err = f2fs_get_dnode_of_data(dn, index, ALLOC_NODE);</div><div class='hunk'>@@ -1145,34 +1193,20 @@ int f2fs_reserve_block(struct dnode_of_data *dn, pgoff_t index)</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int f2fs_get_block(struct dnode_of_data *dn, pgoff_t index)</div><div class='del'>-{</div><div class='del'>-	struct extent_info ei = {0, };</div><div class='del'>-	struct inode *inode = dn-&gt;inode;</div><div class='del'>-</div><div class='del'>-	if (f2fs_lookup_extent_cache(inode, index, &amp;ei)) {</div><div class='del'>-		dn-&gt;data_blkaddr = ei.blk + index - ei.fofs;</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return f2fs_reserve_block(dn, index);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct page *f2fs_get_read_data_page(struct inode *inode, pgoff_t index,</div><div class='del'>-						int op_flags, bool for_write)</div><div class='add'>+struct folio *f2fs_get_read_data_folio(struct inode *inode, pgoff_t index,</div><div class='add'>+		blk_opf_t op_flags, bool for_write, pgoff_t *next_pgofs)</div><div class='ctx'> {</div><div class='ctx'> 	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='ctx'> 	struct dnode_of_data dn;</div><div class='del'>-	struct page *page;</div><div class='del'>-	struct extent_info ei = {0, };</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	page = f2fs_grab_cache_page(mapping, index, for_write);</div><div class='del'>-	if (!page)</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='add'>+	folio = f2fs_grab_cache_folio(mapping, index, for_write);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return folio;</div><div class='ctx'> </div><div class='del'>-	if (f2fs_lookup_extent_cache(inode, index, &amp;ei)) {</div><div class='del'>-		dn.data_blkaddr = ei.blk + index - ei.fofs;</div><div class='add'>+	if (f2fs_lookup_read_extent_cache_block(inode, index,</div><div class='add'>+						&amp;dn.data_blkaddr)) {</div><div class='ctx'> 		if (!f2fs_is_valid_blkaddr(F2FS_I_SB(inode), dn.data_blkaddr,</div><div class='ctx'> 						DATA_GENERIC_ENHANCE_READ)) {</div><div class='ctx'> 			err = -EFSCORRUPTED;</div><div class='hunk'>@@ -1183,12 +1217,17 @@ struct page *f2fs_get_read_data_page(struct inode *inode, pgoff_t index,</div><div class='ctx'> </div><div class='ctx'> 	set_new_dnode(&amp;dn, inode, NULL, NULL, 0);</div><div class='ctx'> 	err = f2fs_get_dnode_of_data(&amp;dn, index, LOOKUP_NODE);</div><div class='del'>-	if (err)</div><div class='add'>+	if (err) {</div><div class='add'>+		if (err == -ENOENT &amp;&amp; next_pgofs)</div><div class='add'>+			*next_pgofs = f2fs_get_next_page_offset(&amp;dn, index);</div><div class='ctx'> 		goto put_err;</div><div class='add'>+	}</div><div class='ctx'> 	f2fs_put_dnode(&amp;dn);</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(dn.data_blkaddr == NULL_ADDR)) {</div><div class='ctx'> 		err = -ENOENT;</div><div class='add'>+		if (next_pgofs)</div><div class='add'>+			*next_pgofs = index + 1;</div><div class='ctx'> 		goto put_err;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (dn.data_blkaddr != NEW_ADDR &amp;&amp;</div><div class='hunk'>@@ -1199,60 +1238,62 @@ struct page *f2fs_get_read_data_page(struct inode *inode, pgoff_t index,</div><div class='ctx'> 		goto put_err;</div><div class='ctx'> 	}</div><div class='ctx'> got_it:</div><div class='del'>-	if (PageUptodate(page)) {</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		return page;</div><div class='add'>+	if (folio_test_uptodate(folio)) {</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		return folio;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * A new dentry page is allocated but not able to be written, since its</div><div class='ctx'> 	 * new inode page couldn't be allocated due to -ENOSPC.</div><div class='ctx'> 	 * In such the case, its blkaddr can be remained as NEW_ADDR.</div><div class='del'>-	 * see, f2fs_add_link -&gt; f2fs_get_new_data_page -&gt;</div><div class='add'>+	 * see, f2fs_add_link -&gt; f2fs_get_new_data_folio -&gt;</div><div class='ctx'> 	 * f2fs_init_inode_metadata.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (dn.data_blkaddr == NEW_ADDR) {</div><div class='del'>-		zero_user_segment(page, 0, PAGE_SIZE);</div><div class='del'>-		if (!PageUptodate(page))</div><div class='del'>-			SetPageUptodate(page);</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		return page;</div><div class='add'>+		folio_zero_segment(folio, 0, folio_size(folio));</div><div class='add'>+		if (!folio_test_uptodate(folio))</div><div class='add'>+			folio_mark_uptodate(folio);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		return folio;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = f2fs_submit_page_read(inode, page, dn.data_blkaddr,</div><div class='add'>+	f2fs_submit_page_read(inode, folio, dn.data_blkaddr,</div><div class='ctx'> 						op_flags, for_write);</div><div class='del'>-	if (err)</div><div class='del'>-		goto put_err;</div><div class='del'>-	return page;</div><div class='add'>+	return folio;</div><div class='ctx'> </div><div class='ctx'> put_err:</div><div class='del'>-	f2fs_put_page(page, 1);</div><div class='add'>+	f2fs_folio_put(folio, true);</div><div class='ctx'> 	return ERR_PTR(err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct page *f2fs_find_data_page(struct inode *inode, pgoff_t index)</div><div class='add'>+struct folio *f2fs_find_data_folio(struct inode *inode, pgoff_t index,</div><div class='add'>+					pgoff_t *next_pgofs)</div><div class='ctx'> {</div><div class='ctx'> 	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='del'>-	struct page *page;</div><div class='del'>-</div><div class='del'>-	page = find_get_page(mapping, index);</div><div class='del'>-	if (page &amp;&amp; PageUptodate(page))</div><div class='del'>-		return page;</div><div class='del'>-	f2fs_put_page(page, 0);</div><div class='del'>-</div><div class='del'>-	page = f2fs_get_read_data_page(inode, index, 0, false);</div><div class='del'>-	if (IS_ERR(page))</div><div class='del'>-		return page;</div><div class='del'>-</div><div class='del'>-	if (PageUptodate(page))</div><div class='del'>-		return page;</div><div class='del'>-</div><div class='del'>-	wait_on_page_locked(page);</div><div class='del'>-	if (unlikely(!PageUptodate(page))) {</div><div class='del'>-		f2fs_put_page(page, 0);</div><div class='add'>+	struct folio *folio;</div><div class='add'>+</div><div class='add'>+	folio = f2fs_filemap_get_folio(mapping, index, FGP_ACCESSED, 0);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		goto read;</div><div class='add'>+	if (folio_test_uptodate(folio))</div><div class='add'>+		return folio;</div><div class='add'>+	f2fs_folio_put(folio, false);</div><div class='add'>+</div><div class='add'>+read:</div><div class='add'>+	folio = f2fs_get_read_data_folio(inode, index, 0, false, next_pgofs);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return folio;</div><div class='add'>+</div><div class='add'>+	if (folio_test_uptodate(folio))</div><div class='add'>+		return folio;</div><div class='add'>+</div><div class='add'>+	folio_wait_locked(folio);</div><div class='add'>+	if (unlikely(!folio_test_uptodate(folio))) {</div><div class='add'>+		f2fs_folio_put(folio, false);</div><div class='ctx'> 		return ERR_PTR(-EIO);</div><div class='ctx'> 	}</div><div class='del'>-	return page;</div><div class='add'>+	return folio;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1260,27 +1301,23 @@ struct page *f2fs_find_data_page(struct inode *inode, pgoff_t index)</div><div class='ctx'>  * Because, the callers, functions in dir.c and GC, should be able to know</div><div class='ctx'>  * whether this page exists or not.</div><div class='ctx'>  */</div><div class='del'>-struct page *f2fs_get_lock_data_page(struct inode *inode, pgoff_t index,</div><div class='add'>+struct folio *f2fs_get_lock_data_folio(struct inode *inode, pgoff_t index,</div><div class='ctx'> 							bool for_write)</div><div class='ctx'> {</div><div class='ctx'> 	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='del'>-	struct page *page;</div><div class='del'>-repeat:</div><div class='del'>-	page = f2fs_get_read_data_page(inode, index, 0, for_write);</div><div class='del'>-	if (IS_ERR(page))</div><div class='del'>-		return page;</div><div class='add'>+	struct folio *folio;</div><div class='add'>+</div><div class='add'>+	folio = f2fs_get_read_data_folio(inode, index, 0, for_write, NULL);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return folio;</div><div class='ctx'> </div><div class='ctx'> 	/* wait for read completion */</div><div class='del'>-	lock_page(page);</div><div class='del'>-	if (unlikely(page-&gt;mapping != mapping)) {</div><div class='del'>-		f2fs_put_page(page, 1);</div><div class='del'>-		goto repeat;</div><div class='del'>-	}</div><div class='del'>-	if (unlikely(!PageUptodate(page))) {</div><div class='del'>-		f2fs_put_page(page, 1);</div><div class='add'>+	folio_lock(folio);</div><div class='add'>+	if (unlikely(folio-&gt;mapping != mapping || !folio_test_uptodate(folio))) {</div><div class='add'>+		f2fs_folio_put(folio, true);</div><div class='ctx'> 		return ERR_PTR(-EIO);</div><div class='ctx'> 	}</div><div class='del'>-	return page;</div><div class='add'>+	return folio;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1289,57 +1326,57 @@ repeat:</div><div class='ctx'>  *</div><div class='ctx'>  * Also, caller should grab and release a rwsem by calling f2fs_lock_op() and</div><div class='ctx'>  * f2fs_unlock_op().</div><div class='del'>- * Note that, ipage is set only by make_empty_dir, and if any error occur,</div><div class='del'>- * ipage should be released by this function.</div><div class='add'>+ * Note that, ifolio is set only by make_empty_dir, and if any error occur,</div><div class='add'>+ * ifolio should be released by this function.</div><div class='ctx'>  */</div><div class='del'>-struct page *f2fs_get_new_data_page(struct inode *inode,</div><div class='del'>-		struct page *ipage, pgoff_t index, bool new_i_size)</div><div class='add'>+struct folio *f2fs_get_new_data_folio(struct inode *inode,</div><div class='add'>+		struct folio *ifolio, pgoff_t index, bool new_i_size)</div><div class='ctx'> {</div><div class='ctx'> 	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	struct dnode_of_data dn;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	page = f2fs_grab_cache_page(mapping, index, true);</div><div class='del'>-	if (!page) {</div><div class='add'>+	folio = f2fs_grab_cache_folio(mapping, index, true);</div><div class='add'>+	if (IS_ERR(folio)) {</div><div class='ctx'> 		/*</div><div class='del'>-		 * before exiting, we should make sure ipage will be released</div><div class='add'>+		 * before exiting, we should make sure ifolio will be released</div><div class='ctx'> 		 * if any error occur.</div><div class='ctx'> 		 */</div><div class='del'>-		f2fs_put_page(ipage, 1);</div><div class='add'>+		f2fs_folio_put(ifolio, true);</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	set_new_dnode(&amp;dn, inode, ipage, NULL, 0);</div><div class='add'>+	set_new_dnode(&amp;dn, inode, ifolio, NULL, 0);</div><div class='ctx'> 	err = f2fs_reserve_block(&amp;dn, index);</div><div class='ctx'> 	if (err) {</div><div class='del'>-		f2fs_put_page(page, 1);</div><div class='add'>+		f2fs_folio_put(folio, true);</div><div class='ctx'> 		return ERR_PTR(err);</div><div class='ctx'> 	}</div><div class='del'>-	if (!ipage)</div><div class='add'>+	if (!ifolio)</div><div class='ctx'> 		f2fs_put_dnode(&amp;dn);</div><div class='ctx'> </div><div class='del'>-	if (PageUptodate(page))</div><div class='add'>+	if (folio_test_uptodate(folio))</div><div class='ctx'> 		goto got_it;</div><div class='ctx'> </div><div class='ctx'> 	if (dn.data_blkaddr == NEW_ADDR) {</div><div class='del'>-		zero_user_segment(page, 0, PAGE_SIZE);</div><div class='del'>-		if (!PageUptodate(page))</div><div class='del'>-			SetPageUptodate(page);</div><div class='add'>+		folio_zero_segment(folio, 0, folio_size(folio));</div><div class='add'>+		if (!folio_test_uptodate(folio))</div><div class='add'>+			folio_mark_uptodate(folio);</div><div class='ctx'> 	} else {</div><div class='del'>-		f2fs_put_page(page, 1);</div><div class='add'>+		f2fs_folio_put(folio, true);</div><div class='ctx'> </div><div class='del'>-		/* if ipage exists, blkaddr should be NEW_ADDR */</div><div class='del'>-		f2fs_bug_on(F2FS_I_SB(inode), ipage);</div><div class='del'>-		page = f2fs_get_lock_data_page(inode, index, true);</div><div class='del'>-		if (IS_ERR(page))</div><div class='del'>-			return page;</div><div class='add'>+		/* if ifolio exists, blkaddr should be NEW_ADDR */</div><div class='add'>+		f2fs_bug_on(F2FS_I_SB(inode), ifolio);</div><div class='add'>+		folio = f2fs_get_lock_data_folio(inode, index, true);</div><div class='add'>+		if (IS_ERR(folio))</div><div class='add'>+			return folio;</div><div class='ctx'> 	}</div><div class='ctx'> got_it:</div><div class='ctx'> 	if (new_i_size &amp;&amp; i_size_read(inode) &lt;</div><div class='ctx'> 				((loff_t)(index + 1) &lt;&lt; PAGE_SHIFT))</div><div class='ctx'> 		f2fs_i_size_write(inode, ((loff_t)(index + 1) &lt;&lt; PAGE_SHIFT));</div><div class='del'>-	return page;</div><div class='add'>+	return folio;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int __allocate_data_block(struct dnode_of_data *dn, int seg_type)</div><div class='hunk'>@@ -1354,96 +1391,137 @@ static int __allocate_data_block(struct dnode_of_data *dn, int seg_type)</div><div class='ctx'> 	if (unlikely(is_inode_flag_set(dn-&gt;inode, FI_NO_ALLOC)))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='del'>-	err = f2fs_get_node_info(sbi, dn-&gt;nid, &amp;ni);</div><div class='add'>+	err = f2fs_get_node_info(sbi, dn-&gt;nid, &amp;ni, false);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='ctx'> 	dn-&gt;data_blkaddr = f2fs_data_blkaddr(dn);</div><div class='del'>-	if (dn-&gt;data_blkaddr != NULL_ADDR)</div><div class='del'>-		goto alloc;</div><div class='del'>-</div><div class='del'>-	if (unlikely((err = inc_valid_block_count(sbi, dn-&gt;inode, &amp;count))))</div><div class='del'>-		return err;</div><div class='add'>+	if (dn-&gt;data_blkaddr == NULL_ADDR) {</div><div class='add'>+		err = inc_valid_block_count(sbi, dn-&gt;inode, &amp;count, true);</div><div class='add'>+		if (unlikely(err))</div><div class='add'>+			return err;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-alloc:</div><div class='ctx'> 	set_summary(&amp;sum, dn-&gt;nid, dn-&gt;ofs_in_node, ni.version);</div><div class='ctx'> 	old_blkaddr = dn-&gt;data_blkaddr;</div><div class='del'>-	f2fs_allocate_data_block(sbi, NULL, old_blkaddr, &amp;dn-&gt;data_blkaddr,</div><div class='del'>-				&amp;sum, seg_type, NULL);</div><div class='del'>-	if (GET_SEGNO(sbi, old_blkaddr) != NULL_SEGNO) {</div><div class='del'>-		invalidate_mapping_pages(META_MAPPING(sbi),</div><div class='del'>-					old_blkaddr, old_blkaddr);</div><div class='del'>-		f2fs_invalidate_compress_page(sbi, old_blkaddr);</div><div class='del'>-	}</div><div class='add'>+	err = f2fs_allocate_data_block(sbi, NULL, old_blkaddr,</div><div class='add'>+				&amp;dn-&gt;data_blkaddr, &amp;sum, seg_type, NULL);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	if (GET_SEGNO(sbi, old_blkaddr) != NULL_SEGNO)</div><div class='add'>+		f2fs_invalidate_internal_cache(sbi, old_blkaddr, 1);</div><div class='add'>+</div><div class='ctx'> 	f2fs_update_data_blkaddr(dn, dn-&gt;data_blkaddr);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void f2fs_map_lock(struct f2fs_sb_info *sbi, int flag)</div><div class='add'>+{</div><div class='add'>+	f2fs_down_read(&amp;sbi-&gt;cp_enable_rwsem);</div><div class='add'>+	if (flag == F2FS_GET_BLOCK_PRE_AIO)</div><div class='add'>+		f2fs_down_read(&amp;sbi-&gt;node_change);</div><div class='add'>+	else</div><div class='add'>+		f2fs_lock_op(sbi);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void f2fs_map_unlock(struct f2fs_sb_info *sbi, int flag)</div><div class='add'>+{</div><div class='add'>+	if (flag == F2FS_GET_BLOCK_PRE_AIO)</div><div class='add'>+		f2fs_up_read(&amp;sbi-&gt;node_change);</div><div class='add'>+	else</div><div class='add'>+		f2fs_unlock_op(sbi);</div><div class='add'>+	f2fs_up_read(&amp;sbi-&gt;cp_enable_rwsem);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int f2fs_get_block_locked(struct dnode_of_data *dn, pgoff_t index)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(dn-&gt;inode);</div><div class='add'>+	int err = 0;</div><div class='add'>+</div><div class='add'>+	f2fs_map_lock(sbi, F2FS_GET_BLOCK_PRE_AIO);</div><div class='add'>+	if (!f2fs_lookup_read_extent_cache_block(dn-&gt;inode, index,</div><div class='add'>+						&amp;dn-&gt;data_blkaddr))</div><div class='add'>+		err = f2fs_reserve_block(dn, index);</div><div class='add'>+	f2fs_map_unlock(sbi, F2FS_GET_BLOCK_PRE_AIO);</div><div class='add'>+</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int f2fs_map_no_dnode(struct inode *inode,</div><div class='add'>+		struct f2fs_map_blocks *map, struct dnode_of_data *dn,</div><div class='add'>+		pgoff_t pgoff)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * i_size will be updated by direct_IO. Otherwise, we'll get stale</div><div class='del'>-	 * data from unwritten block via dio_read.</div><div class='add'>+	 * There is one exceptional case that read_node_page() may return</div><div class='add'>+	 * -ENOENT due to filesystem has been shutdown or cp_error, return</div><div class='add'>+	 * -EIO in that case.</div><div class='ctx'> 	 */</div><div class='add'>+	if (map-&gt;m_may_create &amp;&amp;</div><div class='add'>+	    (is_sbi_flag_set(sbi, SBI_IS_SHUTDOWN) || f2fs_cp_error(sbi)))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	if (map-&gt;m_next_pgofs)</div><div class='add'>+		*map-&gt;m_next_pgofs = f2fs_get_next_page_offset(dn, pgoff);</div><div class='add'>+	if (map-&gt;m_next_extent)</div><div class='add'>+		*map-&gt;m_next_extent = f2fs_get_next_page_offset(dn, pgoff);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int f2fs_preallocate_blocks(struct kiocb *iocb, struct iov_iter *from)</div><div class='add'>+static bool f2fs_map_blocks_cached(struct inode *inode,</div><div class='add'>+		struct f2fs_map_blocks *map, int flag)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='del'>-	struct f2fs_map_blocks map;</div><div class='del'>-	int flag;</div><div class='del'>-	int err = 0;</div><div class='del'>-	bool direct_io = iocb-&gt;ki_flags &amp; IOCB_DIRECT;</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='add'>+	unsigned int maxblocks = map-&gt;m_len;</div><div class='add'>+	pgoff_t pgoff = (pgoff_t)map-&gt;m_lblk;</div><div class='add'>+	struct extent_info ei = {};</div><div class='ctx'> </div><div class='del'>-	map.m_lblk = F2FS_BLK_ALIGN(iocb-&gt;ki_pos);</div><div class='del'>-	map.m_len = F2FS_BYTES_TO_BLK(iocb-&gt;ki_pos + iov_iter_count(from));</div><div class='del'>-	if (map.m_len &gt; map.m_lblk)</div><div class='del'>-		map.m_len -= map.m_lblk;</div><div class='del'>-	else</div><div class='del'>-		map.m_len = 0;</div><div class='add'>+	if (!f2fs_lookup_read_extent_cache(inode, pgoff, &amp;ei))</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-	map.m_next_pgofs = NULL;</div><div class='del'>-	map.m_next_extent = NULL;</div><div class='del'>-	map.m_seg_type = NO_CHECK_TYPE;</div><div class='del'>-	map.m_may_create = true;</div><div class='add'>+	map-&gt;m_pblk = ei.blk + pgoff - ei.fofs;</div><div class='add'>+	map-&gt;m_len = min((pgoff_t)maxblocks, ei.fofs + ei.len - pgoff);</div><div class='add'>+	map-&gt;m_flags = F2FS_MAP_MAPPED;</div><div class='add'>+	if (map-&gt;m_next_extent)</div><div class='add'>+		*map-&gt;m_next_extent = pgoff + map-&gt;m_len;</div><div class='ctx'> </div><div class='del'>-	if (direct_io) {</div><div class='del'>-		map.m_seg_type = f2fs_rw_hint_to_seg_type(iocb-&gt;ki_hint);</div><div class='del'>-		flag = f2fs_force_buffered_io(inode, iocb, from) ?</div><div class='del'>-					F2FS_GET_BLOCK_PRE_AIO :</div><div class='del'>-					F2FS_GET_BLOCK_PRE_DIO;</div><div class='del'>-		goto map_blocks;</div><div class='del'>-	}</div><div class='del'>-	if (iocb-&gt;ki_pos + iov_iter_count(from) &gt; MAX_INLINE_DATA(inode)) {</div><div class='del'>-		err = f2fs_convert_inline_inode(inode);</div><div class='del'>-		if (err)</div><div class='del'>-			return err;</div><div class='del'>-	}</div><div class='del'>-	if (f2fs_has_inline_data(inode))</div><div class='del'>-		return err;</div><div class='add'>+	/* for hardware encryption, but to avoid potential issue in future */</div><div class='add'>+	if (flag == F2FS_GET_BLOCK_DIO)</div><div class='add'>+		f2fs_wait_on_block_writeback_range(inode,</div><div class='add'>+					map-&gt;m_pblk, map-&gt;m_len);</div><div class='ctx'> </div><div class='del'>-	flag = F2FS_GET_BLOCK_PRE_AIO;</div><div class='add'>+	if (f2fs_allow_multi_device_dio(sbi, flag)) {</div><div class='add'>+		int bidx = f2fs_target_device_index(sbi, map-&gt;m_pblk);</div><div class='add'>+		struct f2fs_dev_info *dev = &amp;sbi-&gt;devs[bidx];</div><div class='ctx'> </div><div class='del'>-map_blocks:</div><div class='del'>-	err = f2fs_map_blocks(inode, &amp;map, 1, flag);</div><div class='del'>-	if (map.m_len &gt; 0 &amp;&amp; err == -ENOSPC) {</div><div class='del'>-		if (!direct_io)</div><div class='del'>-			set_inode_flag(inode, FI_NO_PREALLOC);</div><div class='del'>-		err = 0;</div><div class='add'>+		map-&gt;m_bdev = dev-&gt;bdev;</div><div class='add'>+		map-&gt;m_len = min(map-&gt;m_len, dev-&gt;end_blk + 1 - map-&gt;m_pblk);</div><div class='add'>+		map-&gt;m_pblk -= dev-&gt;start_blk;</div><div class='add'>+	} else {</div><div class='add'>+		map-&gt;m_bdev = inode-&gt;i_sb-&gt;s_bdev;</div><div class='ctx'> 	}</div><div class='del'>-	return err;</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_do_map_lock(struct f2fs_sb_info *sbi, int flag, bool lock)</div><div class='add'>+static bool map_is_mergeable(struct f2fs_sb_info *sbi,</div><div class='add'>+				struct f2fs_map_blocks *map,</div><div class='add'>+				block_t blkaddr, int flag, int bidx,</div><div class='add'>+				int ofs)</div><div class='ctx'> {</div><div class='del'>-	if (flag == F2FS_GET_BLOCK_PRE_AIO) {</div><div class='del'>-		if (lock)</div><div class='del'>-			down_read(&amp;sbi-&gt;node_change);</div><div class='del'>-		else</div><div class='del'>-			up_read(&amp;sbi-&gt;node_change);</div><div class='del'>-	} else {</div><div class='del'>-		if (lock)</div><div class='del'>-			f2fs_lock_op(sbi);</div><div class='del'>-		else</div><div class='del'>-			f2fs_unlock_op(sbi);</div><div class='del'>-	}</div><div class='add'>+	if (map-&gt;m_multidev_dio &amp;&amp; map-&gt;m_bdev != FDEV(bidx).bdev)</div><div class='add'>+		return false;</div><div class='add'>+	if (map-&gt;m_pblk != NEW_ADDR &amp;&amp; blkaddr == (map-&gt;m_pblk + ofs))</div><div class='add'>+		return true;</div><div class='add'>+	if (map-&gt;m_pblk == NEW_ADDR &amp;&amp; blkaddr == NEW_ADDR)</div><div class='add'>+		return true;</div><div class='add'>+	if (flag == F2FS_GET_BLOCK_PRE_DIO)</div><div class='add'>+		return true;</div><div class='add'>+	if (flag == F2FS_GET_BLOCK_DIO &amp;&amp;</div><div class='add'>+		map-&gt;m_pblk == NULL_ADDR &amp;&amp; blkaddr == NULL_ADDR)</div><div class='add'>+		return true;</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1451,8 +1529,7 @@ void f2fs_do_map_lock(struct f2fs_sb_info *sbi, int flag, bool lock)</div><div class='ctx'>  * maps continuous logical blocks to physical blocks, and return such</div><div class='ctx'>  * info via f2fs_map_blocks structure.</div><div class='ctx'>  */</div><div class='del'>-int f2fs_map_blocks(struct inode *inode, struct f2fs_map_blocks *map,</div><div class='del'>-						int create, int flag)</div><div class='add'>+int f2fs_map_blocks(struct inode *inode, struct f2fs_map_blocks *map, int flag)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int maxblocks = map-&gt;m_len;</div><div class='ctx'> 	struct dnode_of_data dn;</div><div class='hunk'>@@ -1462,14 +1539,21 @@ int f2fs_map_blocks(struct inode *inode, struct f2fs_map_blocks *map,</div><div class='ctx'> 	int err = 0, ofs = 1;</div><div class='ctx'> 	unsigned int ofs_in_node, last_ofs_in_node;</div><div class='ctx'> 	blkcnt_t prealloc;</div><div class='del'>-	struct extent_info ei = {0, };</div><div class='ctx'> 	block_t blkaddr;</div><div class='ctx'> 	unsigned int start_pgofs;</div><div class='ctx'> 	int bidx = 0;</div><div class='add'>+	bool is_hole;</div><div class='add'>+	bool lfs_dio_write;</div><div class='ctx'> </div><div class='ctx'> 	if (!maxblocks)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='add'>+	lfs_dio_write = (flag == F2FS_GET_BLOCK_DIO &amp;&amp; f2fs_lfs_mode(sbi) &amp;&amp;</div><div class='add'>+				map-&gt;m_may_create);</div><div class='add'>+</div><div class='add'>+	if (!map-&gt;m_may_create &amp;&amp; f2fs_map_blocks_cached(inode, map, flag))</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='ctx'> 	map-&gt;m_bdev = inode-&gt;i_sb-&gt;s_bdev;</div><div class='ctx'> 	map-&gt;m_multidev_dio =</div><div class='ctx'> 		f2fs_allow_multi_device_dio(F2FS_I_SB(inode), flag);</div><div class='hunk'>@@ -1481,42 +1565,15 @@ int f2fs_map_blocks(struct inode *inode, struct f2fs_map_blocks *map,</div><div class='ctx'> 	pgofs =	(pgoff_t)map-&gt;m_lblk;</div><div class='ctx'> 	end = pgofs + maxblocks;</div><div class='ctx'> </div><div class='del'>-	if (!create &amp;&amp; f2fs_lookup_extent_cache(inode, pgofs, &amp;ei)) {</div><div class='del'>-		if (f2fs_lfs_mode(sbi) &amp;&amp; flag == F2FS_GET_BLOCK_DIO &amp;&amp;</div><div class='del'>-							map-&gt;m_may_create)</div><div class='del'>-			goto next_dnode;</div><div class='del'>-</div><div class='del'>-		map-&gt;m_pblk = ei.blk + pgofs - ei.fofs;</div><div class='del'>-		map-&gt;m_len = min((pgoff_t)maxblocks, ei.fofs + ei.len - pgofs);</div><div class='del'>-		map-&gt;m_flags = F2FS_MAP_MAPPED;</div><div class='del'>-		if (map-&gt;m_next_extent)</div><div class='del'>-			*map-&gt;m_next_extent = pgofs + map-&gt;m_len;</div><div class='del'>-</div><div class='del'>-		/* for hardware encryption, but to avoid potential issue in future */</div><div class='del'>-		if (flag == F2FS_GET_BLOCK_DIO)</div><div class='del'>-			f2fs_wait_on_block_writeback_range(inode,</div><div class='del'>-						map-&gt;m_pblk, map-&gt;m_len);</div><div class='del'>-</div><div class='del'>-		if (map-&gt;m_multidev_dio) {</div><div class='del'>-			block_t blk_addr = map-&gt;m_pblk;</div><div class='del'>-</div><div class='del'>-			bidx = f2fs_target_device_index(sbi, map-&gt;m_pblk);</div><div class='del'>-</div><div class='del'>-			map-&gt;m_bdev = FDEV(bidx).bdev;</div><div class='del'>-			map-&gt;m_pblk -= FDEV(bidx).start_blk;</div><div class='del'>-			map-&gt;m_len = min(map-&gt;m_len,</div><div class='del'>-				FDEV(bidx).end_blk + 1 - map-&gt;m_pblk);</div><div class='del'>-</div><div class='del'>-			if (map-&gt;m_may_create)</div><div class='del'>-				f2fs_update_device_state(sbi, inode-&gt;i_ino,</div><div class='del'>-							blk_addr, map-&gt;m_len);</div><div class='del'>-		}</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (flag == F2FS_GET_BLOCK_PRECACHE)</div><div class='add'>+		mode = LOOKUP_NODE_RA;</div><div class='ctx'> </div><div class='ctx'> next_dnode:</div><div class='del'>-	if (map-&gt;m_may_create)</div><div class='del'>-		f2fs_do_map_lock(sbi, flag, true);</div><div class='add'>+	if (map-&gt;m_may_create) {</div><div class='add'>+		if (f2fs_lfs_mode(sbi))</div><div class='add'>+			f2fs_balance_fs(sbi, true);</div><div class='add'>+		f2fs_map_lock(sbi, flag);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* When reading holes, we need its node page */</div><div class='ctx'> 	set_new_dnode(&amp;dn, inode, NULL, NULL, 0);</div><div class='hunk'>@@ -1524,105 +1581,90 @@ next_dnode:</div><div class='ctx'> 	if (err) {</div><div class='ctx'> 		if (flag == F2FS_GET_BLOCK_BMAP)</div><div class='ctx'> 			map-&gt;m_pblk = 0;</div><div class='del'>-</div><div class='del'>-		if (err == -ENOENT) {</div><div class='del'>-			/*</div><div class='del'>-			 * There is one exceptional case that read_node_page()</div><div class='del'>-			 * may return -ENOENT due to filesystem has been</div><div class='del'>-			 * shutdown or cp_error, so force to convert error</div><div class='del'>-			 * number to EIO for such case.</div><div class='del'>-			 */</div><div class='del'>-			if (map-&gt;m_may_create &amp;&amp;</div><div class='del'>-				(is_sbi_flag_set(sbi, SBI_IS_SHUTDOWN) ||</div><div class='del'>-				f2fs_cp_error(sbi))) {</div><div class='del'>-				err = -EIO;</div><div class='del'>-				goto unlock_out;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			err = 0;</div><div class='del'>-			if (map-&gt;m_next_pgofs)</div><div class='del'>-				*map-&gt;m_next_pgofs =</div><div class='del'>-					f2fs_get_next_page_offset(&amp;dn, pgofs);</div><div class='del'>-			if (map-&gt;m_next_extent)</div><div class='del'>-				*map-&gt;m_next_extent =</div><div class='del'>-					f2fs_get_next_page_offset(&amp;dn, pgofs);</div><div class='del'>-		}</div><div class='add'>+		if (err == -ENOENT)</div><div class='add'>+			err = f2fs_map_no_dnode(inode, map, &amp;dn, pgofs);</div><div class='ctx'> 		goto unlock_out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	start_pgofs = pgofs;</div><div class='ctx'> 	prealloc = 0;</div><div class='ctx'> 	last_ofs_in_node = ofs_in_node = dn.ofs_in_node;</div><div class='del'>-	end_offset = ADDRS_PER_PAGE(dn.node_page, inode);</div><div class='add'>+	end_offset = ADDRS_PER_PAGE(dn.node_folio, inode);</div><div class='ctx'> </div><div class='ctx'> next_block:</div><div class='ctx'> 	blkaddr = f2fs_data_blkaddr(&amp;dn);</div><div class='del'>-</div><div class='del'>-	if (__is_valid_data_blkaddr(blkaddr) &amp;&amp;</div><div class='del'>-		!f2fs_is_valid_blkaddr(sbi, blkaddr, DATA_GENERIC_ENHANCE)) {</div><div class='add'>+	is_hole = !__is_valid_data_blkaddr(blkaddr);</div><div class='add'>+	if (!is_hole &amp;&amp;</div><div class='add'>+	    !f2fs_is_valid_blkaddr(sbi, blkaddr, DATA_GENERIC_ENHANCE)) {</div><div class='ctx'> 		err = -EFSCORRUPTED;</div><div class='ctx'> 		goto sync_out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (__is_valid_data_blkaddr(blkaddr)) {</div><div class='del'>-		/* use out-place-update for driect IO under LFS mode */</div><div class='del'>-		if (f2fs_lfs_mode(sbi) &amp;&amp; flag == F2FS_GET_BLOCK_DIO &amp;&amp;</div><div class='del'>-							map-&gt;m_may_create) {</div><div class='add'>+	/* use out-place-update for direct IO under LFS mode */</div><div class='add'>+	if (map-&gt;m_may_create &amp;&amp; (is_hole ||</div><div class='add'>+		(flag == F2FS_GET_BLOCK_DIO &amp;&amp; f2fs_lfs_mode(sbi) &amp;&amp;</div><div class='add'>+		!f2fs_is_pinned_file(inode) &amp;&amp; map-&gt;m_last_pblk != blkaddr))) {</div><div class='add'>+		if (unlikely(f2fs_cp_error(sbi))) {</div><div class='add'>+			err = -EIO;</div><div class='add'>+			goto sync_out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		switch (flag) {</div><div class='add'>+		case F2FS_GET_BLOCK_PRE_AIO:</div><div class='add'>+			if (blkaddr == NULL_ADDR) {</div><div class='add'>+				prealloc++;</div><div class='add'>+				last_ofs_in_node = dn.ofs_in_node;</div><div class='add'>+			}</div><div class='add'>+			break;</div><div class='add'>+		case F2FS_GET_BLOCK_PRE_DIO:</div><div class='add'>+		case F2FS_GET_BLOCK_DIO:</div><div class='ctx'> 			err = __allocate_data_block(&amp;dn, map-&gt;m_seg_type);</div><div class='ctx'> 			if (err)</div><div class='ctx'> 				goto sync_out;</div><div class='del'>-			blkaddr = dn.data_blkaddr;</div><div class='add'>+			if (flag == F2FS_GET_BLOCK_PRE_DIO)</div><div class='add'>+				file_need_truncate(inode);</div><div class='ctx'> 			set_inode_flag(inode, FI_APPEND_WRITE);</div><div class='add'>+			break;</div><div class='add'>+		default:</div><div class='add'>+			WARN_ON_ONCE(1);</div><div class='add'>+			err = -EIO;</div><div class='add'>+			goto sync_out;</div><div class='ctx'> 		}</div><div class='del'>-	} else {</div><div class='del'>-		if (create) {</div><div class='del'>-			if (unlikely(f2fs_cp_error(sbi))) {</div><div class='del'>-				err = -EIO;</div><div class='del'>-				goto sync_out;</div><div class='del'>-			}</div><div class='del'>-			if (flag == F2FS_GET_BLOCK_PRE_AIO) {</div><div class='del'>-				if (blkaddr == NULL_ADDR) {</div><div class='del'>-					prealloc++;</div><div class='del'>-					last_ofs_in_node = dn.ofs_in_node;</div><div class='del'>-				}</div><div class='del'>-			} else {</div><div class='del'>-				WARN_ON(flag != F2FS_GET_BLOCK_PRE_DIO &amp;&amp;</div><div class='del'>-					flag != F2FS_GET_BLOCK_DIO);</div><div class='del'>-				err = __allocate_data_block(&amp;dn,</div><div class='del'>-							map-&gt;m_seg_type);</div><div class='del'>-				if (!err)</div><div class='del'>-					set_inode_flag(inode, FI_APPEND_WRITE);</div><div class='del'>-			}</div><div class='del'>-			if (err)</div><div class='del'>-				goto sync_out;</div><div class='add'>+</div><div class='add'>+		blkaddr = dn.data_blkaddr;</div><div class='add'>+		if (is_hole)</div><div class='ctx'> 			map-&gt;m_flags |= F2FS_MAP_NEW;</div><div class='del'>-			blkaddr = dn.data_blkaddr;</div><div class='del'>-		} else {</div><div class='del'>-			if (f2fs_compressed_file(inode) &amp;&amp;</div><div class='del'>-					f2fs_sanity_check_cluster(&amp;dn) &amp;&amp;</div><div class='del'>-					(flag != F2FS_GET_BLOCK_FIEMAP ||</div><div class='del'>-					IS_ENABLED(CONFIG_F2FS_CHECK_FS))) {</div><div class='del'>-				err = -EFSCORRUPTED;</div><div class='del'>-				goto sync_out;</div><div class='del'>-			}</div><div class='del'>-			if (flag == F2FS_GET_BLOCK_BMAP) {</div><div class='del'>-				map-&gt;m_pblk = 0;</div><div class='del'>-				goto sync_out;</div><div class='del'>-			}</div><div class='del'>-			if (flag == F2FS_GET_BLOCK_PRECACHE)</div><div class='del'>-				goto sync_out;</div><div class='del'>-			if (flag == F2FS_GET_BLOCK_FIEMAP &amp;&amp;</div><div class='del'>-						blkaddr == NULL_ADDR) {</div><div class='del'>-				if (map-&gt;m_next_pgofs)</div><div class='del'>-					*map-&gt;m_next_pgofs = pgofs + 1;</div><div class='del'>-				goto sync_out;</div><div class='del'>-			}</div><div class='del'>-			if (flag != F2FS_GET_BLOCK_FIEMAP) {</div><div class='del'>-				/* for defragment case */</div><div class='add'>+	} else if (is_hole) {</div><div class='add'>+		if (f2fs_compressed_file(inode) &amp;&amp;</div><div class='add'>+		    f2fs_sanity_check_cluster(&amp;dn)) {</div><div class='add'>+			err = -EFSCORRUPTED;</div><div class='add'>+			f2fs_handle_error(sbi,</div><div class='add'>+					ERROR_CORRUPTED_CLUSTER);</div><div class='add'>+			goto sync_out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		switch (flag) {</div><div class='add'>+		case F2FS_GET_BLOCK_PRECACHE:</div><div class='add'>+			goto sync_out;</div><div class='add'>+		case F2FS_GET_BLOCK_BMAP:</div><div class='add'>+			map-&gt;m_pblk = 0;</div><div class='add'>+			goto sync_out;</div><div class='add'>+		case F2FS_GET_BLOCK_FIEMAP:</div><div class='add'>+			if (blkaddr == NULL_ADDR) {</div><div class='ctx'> 				if (map-&gt;m_next_pgofs)</div><div class='ctx'> 					*map-&gt;m_next_pgofs = pgofs + 1;</div><div class='ctx'> 				goto sync_out;</div><div class='ctx'> 			}</div><div class='add'>+			break;</div><div class='add'>+		case F2FS_GET_BLOCK_DIO:</div><div class='add'>+			if (map-&gt;m_next_pgofs)</div><div class='add'>+				*map-&gt;m_next_pgofs = pgofs + 1;</div><div class='add'>+			break;</div><div class='add'>+		default:</div><div class='add'>+			/* for defragment case */</div><div class='add'>+			if (map-&gt;m_next_pgofs)</div><div class='add'>+				*map-&gt;m_next_pgofs = pgofs + 1;</div><div class='add'>+			goto sync_out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1633,25 +1675,27 @@ next_block:</div><div class='ctx'> 		bidx = f2fs_target_device_index(sbi, blkaddr);</div><div class='ctx'> </div><div class='ctx'> 	if (map-&gt;m_len == 0) {</div><div class='del'>-		/* preallocated unwritten block should be mapped for fiemap. */</div><div class='add'>+		/* reserved delalloc block should be mapped for fiemap. */</div><div class='ctx'> 		if (blkaddr == NEW_ADDR)</div><div class='del'>-			map-&gt;m_flags |= F2FS_MAP_UNWRITTEN;</div><div class='del'>-		map-&gt;m_flags |= F2FS_MAP_MAPPED;</div><div class='add'>+			map-&gt;m_flags |= F2FS_MAP_DELALLOC;</div><div class='add'>+		/* DIO READ and hole case, should not map the blocks. */</div><div class='add'>+		if (!(flag == F2FS_GET_BLOCK_DIO &amp;&amp; is_hole &amp;&amp; !map-&gt;m_may_create))</div><div class='add'>+			map-&gt;m_flags |= F2FS_MAP_MAPPED;</div><div class='ctx'> </div><div class='ctx'> 		map-&gt;m_pblk = blkaddr;</div><div class='ctx'> 		map-&gt;m_len = 1;</div><div class='ctx'> </div><div class='ctx'> 		if (map-&gt;m_multidev_dio)</div><div class='ctx'> 			map-&gt;m_bdev = FDEV(bidx).bdev;</div><div class='del'>-	} else if ((map-&gt;m_pblk != NEW_ADDR &amp;&amp;</div><div class='del'>-			blkaddr == (map-&gt;m_pblk + ofs)) ||</div><div class='del'>-			(map-&gt;m_pblk == NEW_ADDR &amp;&amp; blkaddr == NEW_ADDR) ||</div><div class='del'>-			flag == F2FS_GET_BLOCK_PRE_DIO) {</div><div class='del'>-		if (map-&gt;m_multidev_dio &amp;&amp; map-&gt;m_bdev != FDEV(bidx).bdev)</div><div class='del'>-			goto sync_out;</div><div class='add'>+</div><div class='add'>+		if (lfs_dio_write)</div><div class='add'>+			map-&gt;m_last_pblk = NULL_ADDR;</div><div class='add'>+	} else if (map_is_mergeable(sbi, map, blkaddr, flag, bidx, ofs)) {</div><div class='ctx'> 		ofs++;</div><div class='ctx'> 		map-&gt;m_len++;</div><div class='ctx'> 	} else {</div><div class='add'>+		if (lfs_dio_write &amp;&amp; !f2fs_is_pinned_file(inode))</div><div class='add'>+			map-&gt;m_last_pblk = blkaddr;</div><div class='ctx'> 		goto sync_out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1685,7 +1729,7 @@ skip:</div><div class='ctx'> 		if (map-&gt;m_flags &amp; F2FS_MAP_MAPPED) {</div><div class='ctx'> 			unsigned int ofs = start_pgofs - map-&gt;m_lblk;</div><div class='ctx'> </div><div class='del'>-			f2fs_update_extent_cache_range(&amp;dn,</div><div class='add'>+			f2fs_update_read_extent_cache_range(&amp;dn,</div><div class='ctx'> 				start_pgofs, map-&gt;m_pblk + ofs,</div><div class='ctx'> 				map-&gt;m_len - ofs);</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1694,7 +1738,7 @@ skip:</div><div class='ctx'> 	f2fs_put_dnode(&amp;dn);</div><div class='ctx'> </div><div class='ctx'> 	if (map-&gt;m_may_create) {</div><div class='del'>-		f2fs_do_map_lock(sbi, flag, false);</div><div class='add'>+		f2fs_map_unlock(sbi, flag);</div><div class='ctx'> 		f2fs_balance_fs(sbi, dn.node_changed);</div><div class='ctx'> 	}</div><div class='ctx'> 	goto next_dnode;</div><div class='hunk'>@@ -1708,8 +1752,6 @@ sync_out:</div><div class='ctx'> 		 */</div><div class='ctx'> 		f2fs_wait_on_block_writeback_range(inode,</div><div class='ctx'> 						map-&gt;m_pblk, map-&gt;m_len);</div><div class='del'>-		invalidate_mapping_pages(META_MAPPING(sbi),</div><div class='del'>-						map-&gt;m_pblk, map-&gt;m_pblk);</div><div class='ctx'> </div><div class='ctx'> 		if (map-&gt;m_multidev_dio) {</div><div class='ctx'> 			block_t blk_addr = map-&gt;m_pblk;</div><div class='hunk'>@@ -1732,21 +1774,22 @@ sync_out:</div><div class='ctx'> 		if (map-&gt;m_flags &amp; F2FS_MAP_MAPPED) {</div><div class='ctx'> 			unsigned int ofs = start_pgofs - map-&gt;m_lblk;</div><div class='ctx'> </div><div class='del'>-			f2fs_update_extent_cache_range(&amp;dn,</div><div class='del'>-				start_pgofs, map-&gt;m_pblk + ofs,</div><div class='del'>-				map-&gt;m_len - ofs);</div><div class='add'>+			if (map-&gt;m_len &gt; ofs)</div><div class='add'>+				f2fs_update_read_extent_cache_range(&amp;dn,</div><div class='add'>+					start_pgofs, map-&gt;m_pblk + ofs,</div><div class='add'>+					map-&gt;m_len - ofs);</div><div class='ctx'> 		}</div><div class='ctx'> 		if (map-&gt;m_next_extent)</div><div class='del'>-			*map-&gt;m_next_extent = pgofs + 1;</div><div class='add'>+			*map-&gt;m_next_extent = is_hole ? pgofs + 1 : pgofs;</div><div class='ctx'> 	}</div><div class='ctx'> 	f2fs_put_dnode(&amp;dn);</div><div class='ctx'> unlock_out:</div><div class='ctx'> 	if (map-&gt;m_may_create) {</div><div class='del'>-		f2fs_do_map_lock(sbi, flag, false);</div><div class='add'>+		f2fs_map_unlock(sbi, flag);</div><div class='ctx'> 		f2fs_balance_fs(sbi, dn.node_changed);</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='del'>-	trace_f2fs_map_blocks(inode, map, create, flag, err);</div><div class='add'>+	trace_f2fs_map_blocks(inode, map, flag, err);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1768,7 +1811,7 @@ bool f2fs_overwrite_io(struct inode *inode, loff_t pos, size_t len)</div><div class='ctx'> </div><div class='ctx'> 	while (map.m_lblk &lt; last_lblk) {</div><div class='ctx'> 		map.m_len = last_lblk - map.m_lblk;</div><div class='del'>-		err = f2fs_map_blocks(inode, &amp;map, 0, F2FS_GET_BLOCK_DEFAULT);</div><div class='add'>+		err = f2fs_map_blocks(inode, &amp;map, F2FS_GET_BLOCK_DEFAULT);</div><div class='ctx'> 		if (err || map.m_len == 0)</div><div class='ctx'> 			return false;</div><div class='ctx'> 		map.m_lblk += map.m_len;</div><div class='hunk'>@@ -1776,65 +1819,10 @@ bool f2fs_overwrite_io(struct inode *inode, loff_t pos, size_t len)</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u64 bytes_to_blks(struct inode *inode, u64 bytes)</div><div class='del'>-{</div><div class='del'>-	return (bytes &gt;&gt; inode-&gt;i_blkbits);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline u64 blks_to_bytes(struct inode *inode, u64 blks)</div><div class='del'>-{</div><div class='del'>-	return (blks &lt;&lt; inode-&gt;i_blkbits);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int __get_data_block(struct inode *inode, sector_t iblock,</div><div class='del'>-			struct buffer_head *bh, int create, int flag,</div><div class='del'>-			pgoff_t *next_pgofs, int seg_type, bool may_write)</div><div class='del'>-{</div><div class='del'>-	struct f2fs_map_blocks map;</div><div class='del'>-	int err;</div><div class='del'>-</div><div class='del'>-	map.m_lblk = iblock;</div><div class='del'>-	map.m_len = bytes_to_blks(inode, bh-&gt;b_size);</div><div class='del'>-	map.m_next_pgofs = next_pgofs;</div><div class='del'>-	map.m_next_extent = NULL;</div><div class='del'>-	map.m_seg_type = seg_type;</div><div class='del'>-	map.m_may_create = may_write;</div><div class='del'>-</div><div class='del'>-	err = f2fs_map_blocks(inode, &amp;map, create, flag);</div><div class='del'>-	if (!err) {</div><div class='del'>-		map_bh(bh, inode-&gt;i_sb, map.m_pblk);</div><div class='del'>-		bh-&gt;b_state = (bh-&gt;b_state &amp; ~F2FS_MAP_FLAGS) | map.m_flags;</div><div class='del'>-		bh-&gt;b_size = blks_to_bytes(inode, map.m_len);</div><div class='del'>-</div><div class='del'>-		if (map.m_multidev_dio)</div><div class='del'>-			bh-&gt;b_bdev = map.m_bdev;</div><div class='del'>-	}</div><div class='del'>-	return err;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int get_data_block_dio_write(struct inode *inode, sector_t iblock,</div><div class='del'>-			struct buffer_head *bh_result, int create)</div><div class='del'>-{</div><div class='del'>-	return __get_data_block(inode, iblock, bh_result, create,</div><div class='del'>-				F2FS_GET_BLOCK_DIO, NULL,</div><div class='del'>-				f2fs_rw_hint_to_seg_type(inode-&gt;i_write_hint),</div><div class='del'>-				true);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int get_data_block_dio(struct inode *inode, sector_t iblock,</div><div class='del'>-			struct buffer_head *bh_result, int create)</div><div class='del'>-{</div><div class='del'>-	return __get_data_block(inode, iblock, bh_result, create,</div><div class='del'>-				F2FS_GET_BLOCK_DIO, NULL,</div><div class='del'>-				f2fs_rw_hint_to_seg_type(inode-&gt;i_write_hint),</div><div class='del'>-				false);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int f2fs_xattr_fiemap(struct inode *inode,</div><div class='ctx'> 				struct fiemap_extent_info *fieinfo)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='del'>-	struct page *page;</div><div class='ctx'> 	struct node_info ni;</div><div class='ctx'> 	__u64 phys = 0, len;</div><div class='ctx'> 	__u32 flags;</div><div class='hunk'>@@ -1843,19 +1831,19 @@ static int f2fs_xattr_fiemap(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 	if (f2fs_has_inline_xattr(inode)) {</div><div class='ctx'> 		int offset;</div><div class='add'>+		struct folio *folio = f2fs_grab_cache_folio(NODE_MAPPING(sbi),</div><div class='add'>+				inode-&gt;i_ino, false);</div><div class='ctx'> </div><div class='del'>-		page = f2fs_grab_cache_page(NODE_MAPPING(sbi),</div><div class='del'>-						inode-&gt;i_ino, false);</div><div class='del'>-		if (!page)</div><div class='del'>-			return -ENOMEM;</div><div class='add'>+		if (IS_ERR(folio))</div><div class='add'>+			return PTR_ERR(folio);</div><div class='ctx'> </div><div class='del'>-		err = f2fs_get_node_info(sbi, inode-&gt;i_ino, &amp;ni);</div><div class='add'>+		err = f2fs_get_node_info(sbi, inode-&gt;i_ino, &amp;ni, false);</div><div class='ctx'> 		if (err) {</div><div class='del'>-			f2fs_put_page(page, 1);</div><div class='add'>+			f2fs_folio_put(folio, true);</div><div class='ctx'> 			return err;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		phys = blks_to_bytes(inode, ni.blk_addr);</div><div class='add'>+		phys = F2FS_BLK_TO_BYTES(ni.blk_addr);</div><div class='ctx'> 		offset = offsetof(struct f2fs_inode, i_addr) +</div><div class='ctx'> 					sizeof(__le32) * (DEF_ADDRS_PER_INODE -</div><div class='ctx'> 					get_inline_xattr_addrs(inode));</div><div class='hunk'>@@ -1863,7 +1851,7 @@ static int f2fs_xattr_fiemap(struct inode *inode,</div><div class='ctx'> 		phys += offset;</div><div class='ctx'> 		len = inline_xattr_size(inode);</div><div class='ctx'> </div><div class='del'>-		f2fs_put_page(page, 1);</div><div class='add'>+		f2fs_folio_put(folio, true);</div><div class='ctx'> </div><div class='ctx'> 		flags = FIEMAP_EXTENT_DATA_INLINE | FIEMAP_EXTENT_NOT_ALIGNED;</div><div class='ctx'> </div><div class='hunk'>@@ -1872,25 +1860,27 @@ static int f2fs_xattr_fiemap(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 		err = fiemap_fill_next_extent(fieinfo, 0, phys, len, flags);</div><div class='ctx'> 		trace_f2fs_fiemap(inode, 0, phys, len, flags, err);</div><div class='del'>-		if (err || err == 1)</div><div class='add'>+		if (err)</div><div class='ctx'> 			return err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (xnid) {</div><div class='del'>-		page = f2fs_grab_cache_page(NODE_MAPPING(sbi), xnid, false);</div><div class='del'>-		if (!page)</div><div class='del'>-			return -ENOMEM;</div><div class='add'>+		struct folio *folio = f2fs_grab_cache_folio(NODE_MAPPING(sbi),</div><div class='add'>+				xnid, false);</div><div class='ctx'> </div><div class='del'>-		err = f2fs_get_node_info(sbi, xnid, &amp;ni);</div><div class='add'>+		if (IS_ERR(folio))</div><div class='add'>+			return PTR_ERR(folio);</div><div class='add'>+</div><div class='add'>+		err = f2fs_get_node_info(sbi, xnid, &amp;ni, false);</div><div class='ctx'> 		if (err) {</div><div class='del'>-			f2fs_put_page(page, 1);</div><div class='add'>+			f2fs_folio_put(folio, true);</div><div class='ctx'> 			return err;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		phys = blks_to_bytes(inode, ni.blk_addr);</div><div class='add'>+		phys = F2FS_BLK_TO_BYTES(ni.blk_addr);</div><div class='ctx'> 		len = inode-&gt;i_sb-&gt;s_blocksize;</div><div class='ctx'> </div><div class='del'>-		f2fs_put_page(page, 1);</div><div class='add'>+		f2fs_folio_put(folio, true);</div><div class='ctx'> </div><div class='ctx'> 		flags = FIEMAP_EXTENT_LAST;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1903,30 +1893,11 @@ static int f2fs_xattr_fiemap(struct inode *inode,</div><div class='ctx'> 	return (err &lt; 0 ? err : 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static loff_t max_inode_blocks(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	loff_t result = ADDRS_PER_INODE(inode);</div><div class='del'>-	loff_t leaf_count = ADDRS_PER_BLOCK(inode);</div><div class='del'>-</div><div class='del'>-	/* two direct node blocks */</div><div class='del'>-	result += (leaf_count * 2);</div><div class='del'>-</div><div class='del'>-	/* two indirect node blocks */</div><div class='del'>-	leaf_count *= NIDS_PER_BLOCK;</div><div class='del'>-	result += (leaf_count * 2);</div><div class='del'>-</div><div class='del'>-	/* one double indirect node block */</div><div class='del'>-	leaf_count *= NIDS_PER_BLOCK;</div><div class='del'>-	result += leaf_count;</div><div class='del'>-</div><div class='del'>-	return result;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> int f2fs_fiemap(struct inode *inode, struct fiemap_extent_info *fieinfo,</div><div class='ctx'> 		u64 start, u64 len)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_map_blocks map;</div><div class='del'>-	sector_t start_blk, last_blk;</div><div class='add'>+	sector_t start_blk, last_blk, blk_len, max_len;</div><div class='ctx'> 	pgoff_t next_pgofs;</div><div class='ctx'> 	u64 logical = 0, phys = 0, size = 0;</div><div class='ctx'> 	u32 flags = 0;</div><div class='hunk'>@@ -1946,9 +1917,9 @@ int f2fs_fiemap(struct inode *inode, struct fiemap_extent_info *fieinfo,</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	inode_lock(inode);</div><div class='add'>+	inode_lock_shared(inode);</div><div class='ctx'> </div><div class='del'>-	maxbytes = max_file_blocks(inode) &lt;&lt; F2FS_BLKSIZE_BITS;</div><div class='add'>+	maxbytes = F2FS_BLK_TO_BYTES(max_file_blocks(inode));</div><div class='ctx'> 	if (start &gt; maxbytes) {</div><div class='ctx'> 		ret = -EFBIG;</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -1968,16 +1939,15 @@ int f2fs_fiemap(struct inode *inode, struct fiemap_extent_info *fieinfo,</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (bytes_to_blks(inode, len) == 0)</div><div class='del'>-		len = blks_to_bytes(inode, 1);</div><div class='del'>-</div><div class='del'>-	start_blk = bytes_to_blks(inode, start);</div><div class='del'>-	last_blk = bytes_to_blks(inode, start + len - 1);</div><div class='add'>+	start_blk = F2FS_BYTES_TO_BLK(start);</div><div class='add'>+	last_blk = F2FS_BYTES_TO_BLK(start + len - 1);</div><div class='add'>+	blk_len = last_blk - start_blk + 1;</div><div class='add'>+	max_len = F2FS_BYTES_TO_BLK(maxbytes) - start_blk;</div><div class='ctx'> </div><div class='ctx'> next:</div><div class='ctx'> 	memset(&amp;map, 0, sizeof(map));</div><div class='ctx'> 	map.m_lblk = start_blk;</div><div class='del'>-	map.m_len = bytes_to_blks(inode, len);</div><div class='add'>+	map.m_len = blk_len;</div><div class='ctx'> 	map.m_next_pgofs = &amp;next_pgofs;</div><div class='ctx'> 	map.m_seg_type = NO_CHECK_TYPE;</div><div class='ctx'> </div><div class='hunk'>@@ -1986,7 +1956,7 @@ next:</div><div class='ctx'> 		map.m_len = cluster_size - count_in_cluster;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = f2fs_map_blocks(inode, &amp;map, 0, F2FS_GET_BLOCK_FIEMAP);</div><div class='add'>+	ret = f2fs_map_blocks(inode, &amp;map, F2FS_GET_BLOCK_FIEMAP);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -1994,16 +1964,26 @@ next:</div><div class='ctx'> 	if (!compr_cluster &amp;&amp; !(map.m_flags &amp; F2FS_MAP_FLAGS)) {</div><div class='ctx'> 		start_blk = next_pgofs;</div><div class='ctx'> </div><div class='del'>-		if (blks_to_bytes(inode, start_blk) &lt; blks_to_bytes(inode,</div><div class='del'>-						max_inode_blocks(inode)))</div><div class='add'>+		if (F2FS_BLK_TO_BYTES(start_blk) &lt; maxbytes)</div><div class='ctx'> 			goto prep_next;</div><div class='ctx'> </div><div class='ctx'> 		flags |= FIEMAP_EXTENT_LAST;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * current extent may cross boundary of inquiry, increase len to</div><div class='add'>+	 * requery.</div><div class='add'>+	 */</div><div class='add'>+	if (!compr_cluster &amp;&amp; (map.m_flags &amp; F2FS_MAP_MAPPED) &amp;&amp;</div><div class='add'>+				map.m_lblk + map.m_len - 1 == last_blk &amp;&amp;</div><div class='add'>+				blk_len != max_len) {</div><div class='add'>+		blk_len = max_len;</div><div class='add'>+		goto next;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	compr_appended = false;</div><div class='ctx'> 	/* In a case of compressed cluster, append this to the last extent */</div><div class='del'>-	if (compr_cluster &amp;&amp; ((map.m_flags &amp; F2FS_MAP_UNWRITTEN) ||</div><div class='add'>+	if (compr_cluster &amp;&amp; ((map.m_flags &amp; F2FS_MAP_DELALLOC) ||</div><div class='ctx'> 			!(map.m_flags &amp; F2FS_MAP_FLAGS))) {</div><div class='ctx'> 		compr_appended = true;</div><div class='ctx'> 		goto skip_fill;</div><div class='hunk'>@@ -2032,14 +2012,14 @@ skip_fill:</div><div class='ctx'> 	} else if (compr_appended) {</div><div class='ctx'> 		unsigned int appended_blks = cluster_size -</div><div class='ctx'> 						count_in_cluster + 1;</div><div class='del'>-		size += blks_to_bytes(inode, appended_blks);</div><div class='add'>+		size += F2FS_BLK_TO_BYTES(appended_blks);</div><div class='ctx'> 		start_blk += appended_blks;</div><div class='ctx'> 		compr_cluster = false;</div><div class='ctx'> 	} else {</div><div class='del'>-		logical = blks_to_bytes(inode, start_blk);</div><div class='add'>+		logical = F2FS_BLK_TO_BYTES(start_blk);</div><div class='ctx'> 		phys = __is_valid_data_blkaddr(map.m_pblk) ?</div><div class='del'>-			blks_to_bytes(inode, map.m_pblk) : 0;</div><div class='del'>-		size = blks_to_bytes(inode, map.m_len);</div><div class='add'>+			F2FS_BLK_TO_BYTES(map.m_pblk) : 0;</div><div class='add'>+		size = F2FS_BLK_TO_BYTES(map.m_len);</div><div class='ctx'> 		flags = 0;</div><div class='ctx'> </div><div class='ctx'> 		if (compr_cluster) {</div><div class='hunk'>@@ -2047,13 +2027,13 @@ skip_fill:</div><div class='ctx'> 			count_in_cluster += map.m_len;</div><div class='ctx'> 			if (count_in_cluster == cluster_size) {</div><div class='ctx'> 				compr_cluster = false;</div><div class='del'>-				size += blks_to_bytes(inode, 1);</div><div class='add'>+				size += F2FS_BLKSIZE;</div><div class='ctx'> 			}</div><div class='del'>-		} else if (map.m_flags &amp; F2FS_MAP_UNWRITTEN) {</div><div class='add'>+		} else if (map.m_flags &amp; F2FS_MAP_DELALLOC) {</div><div class='ctx'> 			flags = FIEMAP_EXTENT_UNWRITTEN;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		start_blk += bytes_to_blks(inode, size);</div><div class='add'>+		start_blk += F2FS_BYTES_TO_BLK(size);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> prep_next:</div><div class='hunk'>@@ -2066,38 +2046,43 @@ out:</div><div class='ctx'> 	if (ret == 1)</div><div class='ctx'> 		ret = 0;</div><div class='ctx'> </div><div class='del'>-	inode_unlock(inode);</div><div class='add'>+	inode_unlock_shared(inode);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline loff_t f2fs_readpage_limit(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	if (IS_ENABLED(CONFIG_FS_VERITY) &amp;&amp;</div><div class='del'>-	    (IS_VERITY(inode) || f2fs_verity_in_progress(inode)))</div><div class='del'>-		return inode-&gt;i_sb-&gt;s_maxbytes;</div><div class='add'>+	if (IS_ENABLED(CONFIG_FS_VERITY) &amp;&amp; IS_VERITY(inode))</div><div class='add'>+		return F2FS_BLK_TO_BYTES(max_file_blocks(inode));</div><div class='ctx'> </div><div class='ctx'> 	return i_size_read(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_read_single_page(struct inode *inode, struct page *page,</div><div class='add'>+static inline blk_opf_t f2fs_ra_op_flags(struct readahead_control *rac)</div><div class='add'>+{</div><div class='add'>+	return rac ? REQ_RAHEAD : 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int f2fs_read_single_page(struct inode *inode, struct folio *folio,</div><div class='ctx'> 					unsigned nr_pages,</div><div class='ctx'> 					struct f2fs_map_blocks *map,</div><div class='ctx'> 					struct bio **bio_ret,</div><div class='ctx'> 					sector_t *last_block_in_bio,</div><div class='del'>-					bool is_readahead)</div><div class='add'>+					struct readahead_control *rac)</div><div class='ctx'> {</div><div class='ctx'> 	struct bio *bio = *bio_ret;</div><div class='del'>-	const unsigned blocksize = blks_to_bytes(inode, 1);</div><div class='add'>+	const unsigned int blocksize = F2FS_BLKSIZE;</div><div class='ctx'> 	sector_t block_in_file;</div><div class='ctx'> 	sector_t last_block;</div><div class='ctx'> 	sector_t last_block_in_file;</div><div class='ctx'> 	sector_t block_nr;</div><div class='add'>+	pgoff_t index = folio-&gt;index;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	block_in_file = (sector_t)page_index(page);</div><div class='add'>+	block_in_file = (sector_t)index;</div><div class='ctx'> 	last_block = block_in_file + nr_pages;</div><div class='del'>-	last_block_in_file = bytes_to_blks(inode,</div><div class='del'>-			f2fs_readpage_limit(inode) + blocksize - 1);</div><div class='add'>+	last_block_in_file = F2FS_BYTES_TO_BLK(f2fs_readpage_limit(inode) +</div><div class='add'>+							blocksize - 1);</div><div class='ctx'> 	if (last_block &gt; last_block_in_file)</div><div class='ctx'> 		last_block = last_block_in_file;</div><div class='ctx'> </div><div class='hunk'>@@ -2119,19 +2104,13 @@ static int f2fs_read_single_page(struct inode *inode, struct page *page,</div><div class='ctx'> 	map-&gt;m_lblk = block_in_file;</div><div class='ctx'> 	map-&gt;m_len = last_block - block_in_file;</div><div class='ctx'> </div><div class='del'>-	ret = f2fs_map_blocks(inode, map, 0, F2FS_GET_BLOCK_DEFAULT);</div><div class='add'>+	ret = f2fs_map_blocks(inode, map, F2FS_GET_BLOCK_DEFAULT);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> got_it:</div><div class='ctx'> 	if ((map-&gt;m_flags &amp; F2FS_MAP_MAPPED)) {</div><div class='ctx'> 		block_nr = map-&gt;m_pblk + block_in_file - map-&gt;m_lblk;</div><div class='del'>-		SetPageMappedToDisk(page);</div><div class='del'>-</div><div class='del'>-		if (!PageUptodate(page) &amp;&amp; (!PageSwapCache(page) &amp;&amp;</div><div class='del'>-					!cleancache_get_page(page))) {</div><div class='del'>-			SetPageUptodate(page);</div><div class='del'>-			goto confused;</div><div class='del'>-		}</div><div class='add'>+		folio_set_mappedtodisk(folio);</div><div class='ctx'> </div><div class='ctx'> 		if (!f2fs_is_valid_blkaddr(F2FS_I_SB(inode), block_nr,</div><div class='ctx'> 						DATA_GENERIC_ENHANCE_READ)) {</div><div class='hunk'>@@ -2140,15 +2119,15 @@ got_it:</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='ctx'> zero_out:</div><div class='del'>-		zero_user_segment(page, 0, PAGE_SIZE);</div><div class='del'>-		if (f2fs_need_verity(inode, page-&gt;index) &amp;&amp;</div><div class='del'>-		    !fsverity_verify_page(page)) {</div><div class='add'>+		folio_zero_segment(folio, 0, folio_size(folio));</div><div class='add'>+		if (f2fs_need_verity(inode, index) &amp;&amp;</div><div class='add'>+		    !fsverity_verify_folio(folio)) {</div><div class='ctx'> 			ret = -EIO;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='del'>-		if (!PageUptodate(page))</div><div class='del'>-			SetPageUptodate(page);</div><div class='del'>-		unlock_page(page);</div><div class='add'>+		if (!folio_test_uptodate(folio))</div><div class='add'>+			folio_mark_uptodate(folio);</div><div class='add'>+		folio_unlock(folio);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -2158,21 +2137,15 @@ zero_out:</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (bio &amp;&amp; (!page_is_mergeable(F2FS_I_SB(inode), bio,</div><div class='ctx'> 				       *last_block_in_bio, block_nr) ||</div><div class='del'>-		    !f2fs_crypt_mergeable_bio(bio, inode, page-&gt;index, NULL))) {</div><div class='add'>+		    !f2fs_crypt_mergeable_bio(bio, inode, index, NULL))) {</div><div class='ctx'> submit_and_realloc:</div><div class='del'>-		__submit_bio(F2FS_I_SB(inode), bio, DATA);</div><div class='add'>+		f2fs_submit_read_bio(F2FS_I_SB(inode), bio, DATA);</div><div class='ctx'> 		bio = NULL;</div><div class='ctx'> 	}</div><div class='del'>-	if (bio == NULL) {</div><div class='add'>+	if (bio == NULL)</div><div class='ctx'> 		bio = f2fs_grab_read_bio(inode, block_nr, nr_pages,</div><div class='del'>-				is_readahead ? REQ_RAHEAD : 0, page-&gt;index,</div><div class='add'>+				f2fs_ra_op_flags(rac), index,</div><div class='ctx'> 				false);</div><div class='del'>-		if (IS_ERR(bio)) {</div><div class='del'>-			ret = PTR_ERR(bio);</div><div class='del'>-			bio = NULL;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If the page is under writeback, we need to wait for</div><div class='hunk'>@@ -2180,20 +2153,13 @@ submit_and_realloc:</div><div class='ctx'> 	 */</div><div class='ctx'> 	f2fs_wait_on_block_writeback(inode, block_nr);</div><div class='ctx'> </div><div class='del'>-	if (bio_add_page(bio, page, blocksize, 0) &lt; blocksize)</div><div class='add'>+	if (!bio_add_folio(bio, folio, blocksize, 0))</div><div class='ctx'> 		goto submit_and_realloc;</div><div class='ctx'> </div><div class='ctx'> 	inc_page_count(F2FS_I_SB(inode), F2FS_RD_DATA);</div><div class='del'>-	f2fs_update_iostat(F2FS_I_SB(inode), FS_DATA_READ_IO, F2FS_BLKSIZE);</div><div class='del'>-	ClearPageError(page);</div><div class='add'>+	f2fs_update_iostat(F2FS_I_SB(inode), NULL, FS_DATA_READ_IO,</div><div class='add'>+							F2FS_BLKSIZE);</div><div class='ctx'> 	*last_block_in_bio = block_nr;</div><div class='del'>-	goto out;</div><div class='del'>-confused:</div><div class='del'>-	if (bio) {</div><div class='del'>-		__submit_bio(F2FS_I_SB(inode), bio, DATA);</div><div class='del'>-		bio = NULL;</div><div class='del'>-	}</div><div class='del'>-	unlock_page(page);</div><div class='ctx'> out:</div><div class='ctx'> 	*bio_ret = bio;</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -2202,7 +2168,7 @@ out:</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='ctx'> int f2fs_read_multi_pages(struct compress_ctx *cc, struct bio **bio_ret,</div><div class='ctx'> 				unsigned nr_pages, sector_t *last_block_in_bio,</div><div class='del'>-				bool is_readahead, bool for_write)</div><div class='add'>+				struct readahead_control *rac, bool for_write)</div><div class='ctx'> {</div><div class='ctx'> 	struct dnode_of_data dn;</div><div class='ctx'> 	struct inode *inode = cc-&gt;inode;</div><div class='hunk'>@@ -2210,34 +2176,43 @@ int f2fs_read_multi_pages(struct compress_ctx *cc, struct bio **bio_ret,</div><div class='ctx'> 	struct bio *bio = *bio_ret;</div><div class='ctx'> 	unsigned int start_idx = cc-&gt;cluster_idx &lt;&lt; cc-&gt;log_cluster_size;</div><div class='ctx'> 	sector_t last_block_in_file;</div><div class='del'>-	const unsigned blocksize = blks_to_bytes(inode, 1);</div><div class='add'>+	const unsigned int blocksize = F2FS_BLKSIZE;</div><div class='ctx'> 	struct decompress_io_ctx *dic = NULL;</div><div class='del'>-	struct extent_info ei = {0, };</div><div class='add'>+	struct extent_info ei = {};</div><div class='ctx'> 	bool from_dnode = true;</div><div class='ctx'> 	int i;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='add'>+	if (unlikely(f2fs_cp_error(sbi))) {</div><div class='add'>+		ret = -EIO;</div><div class='add'>+		from_dnode = false;</div><div class='add'>+		goto out_put_dnode;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	f2fs_bug_on(sbi, f2fs_cluster_is_empty(cc));</div><div class='ctx'> </div><div class='del'>-	last_block_in_file = bytes_to_blks(inode,</div><div class='del'>-			f2fs_readpage_limit(inode) + blocksize - 1);</div><div class='add'>+	last_block_in_file = F2FS_BYTES_TO_BLK(f2fs_readpage_limit(inode) +</div><div class='add'>+							blocksize - 1);</div><div class='ctx'> </div><div class='ctx'> 	/* get rid of pages beyond EOF */</div><div class='ctx'> 	for (i = 0; i &lt; cc-&gt;cluster_size; i++) {</div><div class='ctx'> 		struct page *page = cc-&gt;rpages[i];</div><div class='add'>+		struct folio *folio;</div><div class='ctx'> </div><div class='ctx'> 		if (!page)</div><div class='ctx'> 			continue;</div><div class='del'>-		if ((sector_t)page-&gt;index &gt;= last_block_in_file) {</div><div class='del'>-			zero_user_segment(page, 0, PAGE_SIZE);</div><div class='del'>-			if (!PageUptodate(page))</div><div class='del'>-				SetPageUptodate(page);</div><div class='del'>-		} else if (!PageUptodate(page)) {</div><div class='add'>+</div><div class='add'>+		folio = page_folio(page);</div><div class='add'>+		if ((sector_t)folio-&gt;index &gt;= last_block_in_file) {</div><div class='add'>+			folio_zero_segment(folio, 0, folio_size(folio));</div><div class='add'>+			if (!folio_test_uptodate(folio))</div><div class='add'>+				folio_mark_uptodate(folio);</div><div class='add'>+		} else if (!folio_test_uptodate(folio)) {</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='del'>-		unlock_page(page);</div><div class='add'>+		folio_unlock(folio);</div><div class='ctx'> 		if (for_write)</div><div class='del'>-			put_page(page);</div><div class='add'>+			folio_put(folio);</div><div class='ctx'> 		cc-&gt;rpages[i] = NULL;</div><div class='ctx'> 		cc-&gt;nr_rpages--;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2246,7 +2221,7 @@ int f2fs_read_multi_pages(struct compress_ctx *cc, struct bio **bio_ret,</div><div class='ctx'> 	if (f2fs_cluster_is_empty(cc))</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	if (f2fs_lookup_extent_cache(inode, start_idx, &amp;ei))</div><div class='add'>+	if (f2fs_lookup_read_extent_cache(inode, start_idx, &amp;ei))</div><div class='ctx'> 		from_dnode = false;</div><div class='ctx'> </div><div class='ctx'> 	if (!from_dnode)</div><div class='hunk'>@@ -2263,7 +2238,7 @@ skip_reading_dnode:</div><div class='ctx'> 	for (i = 1; i &lt; cc-&gt;cluster_size; i++) {</div><div class='ctx'> 		block_t blkaddr;</div><div class='ctx'> </div><div class='del'>-		blkaddr = from_dnode ? data_blkaddr(dn.inode, dn.node_page,</div><div class='add'>+		blkaddr = from_dnode ? data_blkaddr(dn.inode, dn.node_folio,</div><div class='ctx'> 					dn.ofs_in_node + i) :</div><div class='ctx'> 					ei.blk + i - 1;</div><div class='ctx'> </div><div class='hunk'>@@ -2293,44 +2268,38 @@ skip_reading_dnode:</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; cc-&gt;nr_cpages; i++) {</div><div class='del'>-		struct page *page = dic-&gt;cpages[i];</div><div class='add'>+		struct folio *folio = page_folio(dic-&gt;cpages[i]);</div><div class='ctx'> 		block_t blkaddr;</div><div class='ctx'> 		struct bio_post_read_ctx *ctx;</div><div class='ctx'> </div><div class='del'>-		blkaddr = from_dnode ? data_blkaddr(dn.inode, dn.node_page,</div><div class='add'>+		blkaddr = from_dnode ? data_blkaddr(dn.inode, dn.node_folio,</div><div class='ctx'> 					dn.ofs_in_node + i + 1) :</div><div class='ctx'> 					ei.blk + i;</div><div class='ctx'> </div><div class='ctx'> 		f2fs_wait_on_block_writeback(inode, blkaddr);</div><div class='ctx'> </div><div class='del'>-		if (f2fs_load_compressed_page(sbi, page, blkaddr)) {</div><div class='del'>-			if (atomic_dec_and_test(&amp;dic-&gt;remaining_pages))</div><div class='del'>-				f2fs_decompress_cluster(dic);</div><div class='add'>+		if (f2fs_load_compressed_folio(sbi, folio, blkaddr)) {</div><div class='add'>+			if (atomic_dec_and_test(&amp;dic-&gt;remaining_pages)) {</div><div class='add'>+				f2fs_decompress_cluster(dic, true);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (bio &amp;&amp; (!page_is_mergeable(sbi, bio,</div><div class='ctx'> 					*last_block_in_bio, blkaddr) ||</div><div class='del'>-		    !f2fs_crypt_mergeable_bio(bio, inode, page-&gt;index, NULL))) {</div><div class='add'>+		    !f2fs_crypt_mergeable_bio(bio, inode, folio-&gt;index, NULL))) {</div><div class='ctx'> submit_and_realloc:</div><div class='del'>-			__submit_bio(sbi, bio, DATA);</div><div class='add'>+			f2fs_submit_read_bio(sbi, bio, DATA);</div><div class='ctx'> 			bio = NULL;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (!bio) {</div><div class='del'>-			bio = f2fs_grab_read_bio(inode, blkaddr, nr_pages,</div><div class='del'>-					is_readahead ? REQ_RAHEAD : 0,</div><div class='del'>-					page-&gt;index, for_write);</div><div class='del'>-			if (IS_ERR(bio)) {</div><div class='del'>-				ret = PTR_ERR(bio);</div><div class='del'>-				f2fs_decompress_end_io(dic, ret);</div><div class='del'>-				f2fs_put_dnode(&amp;dn);</div><div class='del'>-				*bio_ret = NULL;</div><div class='del'>-				return ret;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='add'>+		if (!bio)</div><div class='add'>+			bio = f2fs_grab_read_bio(inode, blkaddr, nr_pages - i,</div><div class='add'>+					f2fs_ra_op_flags(rac),</div><div class='add'>+					folio-&gt;index, for_write);</div><div class='ctx'> </div><div class='del'>-		if (bio_add_page(bio, page, blocksize, 0) &lt; blocksize)</div><div class='add'>+		if (!bio_add_folio(bio, folio, blocksize, 0))</div><div class='ctx'> 			goto submit_and_realloc;</div><div class='ctx'> </div><div class='ctx'> 		ctx = get_post_read_ctx(bio);</div><div class='hunk'>@@ -2338,9 +2307,7 @@ submit_and_realloc:</div><div class='ctx'> 		refcount_inc(&amp;dic-&gt;refcnt);</div><div class='ctx'> </div><div class='ctx'> 		inc_page_count(sbi, F2FS_RD_DATA);</div><div class='del'>-		f2fs_update_iostat(sbi, FS_DATA_READ_IO, F2FS_BLKSIZE);</div><div class='del'>-		f2fs_update_iostat(sbi, FS_CDATA_READ_IO, F2FS_BLKSIZE);</div><div class='del'>-		ClearPageError(page);</div><div class='add'>+		f2fs_update_iostat(sbi, inode, FS_DATA_READ_IO, F2FS_BLKSIZE);</div><div class='ctx'> 		*last_block_in_bio = blkaddr;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -2357,7 +2324,6 @@ out:</div><div class='ctx'> 	for (i = 0; i &lt; cc-&gt;cluster_size; i++) {</div><div class='ctx'> 		if (cc-&gt;rpages[i]) {</div><div class='ctx'> 			ClearPageUptodate(cc-&gt;rpages[i]);</div><div class='del'>-			ClearPageError(cc-&gt;rpages[i]);</div><div class='ctx'> 			unlock_page(cc-&gt;rpages[i]);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2371,7 +2337,7 @@ out:</div><div class='ctx'>  * Major change was from block_size == page_size in f2fs by default.</div><div class='ctx'>  */</div><div class='ctx'> static int f2fs_mpage_readpages(struct inode *inode,</div><div class='del'>-		struct readahead_control *rac, struct page *page)</div><div class='add'>+		struct readahead_control *rac, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct bio *bio = NULL;</div><div class='ctx'> 	sector_t last_block_in_bio = 0;</div><div class='hunk'>@@ -2388,11 +2354,20 @@ static int f2fs_mpage_readpages(struct inode *inode,</div><div class='ctx'> 		.nr_cpages = 0,</div><div class='ctx'> 	};</div><div class='ctx'> 	pgoff_t nc_cluster_idx = NULL_CLUSTER;</div><div class='add'>+	pgoff_t index;</div><div class='ctx'> #endif</div><div class='ctx'> 	unsigned nr_pages = rac ? readahead_count(rac) : 1;</div><div class='ctx'> 	unsigned max_nr_pages = nr_pages;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='add'>+	if (f2fs_compressed_file(inode)) {</div><div class='add'>+		index = rac ? readahead_index(rac) : folio-&gt;index;</div><div class='add'>+		max_nr_pages = round_up(index + nr_pages, cc.cluster_size) -</div><div class='add'>+				round_down(index, cc.cluster_size);</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> 	map.m_pblk = 0;</div><div class='ctx'> 	map.m_lblk = 0;</div><div class='ctx'> 	map.m_len = 0;</div><div class='hunk'>@@ -2404,65 +2379,63 @@ static int f2fs_mpage_readpages(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 	for (; nr_pages; nr_pages--) {</div><div class='ctx'> 		if (rac) {</div><div class='del'>-			page = readahead_page(rac);</div><div class='del'>-			prefetchw(&amp;page-&gt;flags);</div><div class='add'>+			folio = readahead_folio(rac);</div><div class='add'>+			prefetchw(&amp;folio-&gt;flags);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='del'>-		if (f2fs_compressed_file(inode)) {</div><div class='del'>-			/* there are remained comressed pages, submit them */</div><div class='del'>-			if (!f2fs_cluster_can_merge_page(&amp;cc, page-&gt;index)) {</div><div class='del'>-				ret = f2fs_read_multi_pages(&amp;cc, &amp;bio,</div><div class='del'>-							max_nr_pages,</div><div class='del'>-							&amp;last_block_in_bio,</div><div class='del'>-							rac != NULL, false);</div><div class='del'>-				f2fs_destroy_compress_ctx(&amp;cc, false);</div><div class='del'>-				if (ret)</div><div class='del'>-					goto set_error_page;</div><div class='del'>-			}</div><div class='del'>-			if (cc.cluster_idx == NULL_CLUSTER) {</div><div class='del'>-				if (nc_cluster_idx ==</div><div class='del'>-					page-&gt;index &gt;&gt; cc.log_cluster_size) {</div><div class='del'>-					goto read_single_page;</div><div class='del'>-				}</div><div class='del'>-</div><div class='del'>-				ret = f2fs_is_compressed_cluster(inode, page-&gt;index);</div><div class='del'>-				if (ret &lt; 0)</div><div class='del'>-					goto set_error_page;</div><div class='del'>-				else if (!ret) {</div><div class='del'>-					nc_cluster_idx =</div><div class='del'>-						page-&gt;index &gt;&gt; cc.log_cluster_size;</div><div class='del'>-					goto read_single_page;</div><div class='del'>-				}</div><div class='del'>-</div><div class='del'>-				nc_cluster_idx = NULL_CLUSTER;</div><div class='del'>-			}</div><div class='del'>-			ret = f2fs_init_compress_ctx(&amp;cc);</div><div class='add'>+		index = folio-&gt;index;</div><div class='add'>+</div><div class='add'>+		if (!f2fs_compressed_file(inode))</div><div class='add'>+			goto read_single_page;</div><div class='add'>+</div><div class='add'>+		/* there are remained compressed pages, submit them */</div><div class='add'>+		if (!f2fs_cluster_can_merge_page(&amp;cc, index)) {</div><div class='add'>+			ret = f2fs_read_multi_pages(&amp;cc, &amp;bio,</div><div class='add'>+						max_nr_pages,</div><div class='add'>+						&amp;last_block_in_bio,</div><div class='add'>+						rac, false);</div><div class='add'>+			f2fs_destroy_compress_ctx(&amp;cc, false);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				goto set_error_page;</div><div class='add'>+		}</div><div class='add'>+		if (cc.cluster_idx == NULL_CLUSTER) {</div><div class='add'>+			if (nc_cluster_idx == index &gt;&gt; cc.log_cluster_size)</div><div class='add'>+				goto read_single_page;</div><div class='ctx'> </div><div class='del'>-			f2fs_compress_ctx_add_page(&amp;cc, page);</div><div class='add'>+			ret = f2fs_is_compressed_cluster(inode, index);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				goto set_error_page;</div><div class='add'>+			else if (!ret) {</div><div class='add'>+				nc_cluster_idx =</div><div class='add'>+					index &gt;&gt; cc.log_cluster_size;</div><div class='add'>+				goto read_single_page;</div><div class='add'>+			}</div><div class='ctx'> </div><div class='del'>-			goto next_page;</div><div class='add'>+			nc_cluster_idx = NULL_CLUSTER;</div><div class='ctx'> 		}</div><div class='add'>+		ret = f2fs_init_compress_ctx(&amp;cc);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto set_error_page;</div><div class='add'>+</div><div class='add'>+		f2fs_compress_ctx_add_page(&amp;cc, folio);</div><div class='add'>+</div><div class='add'>+		goto next_page;</div><div class='ctx'> read_single_page:</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-		ret = f2fs_read_single_page(inode, page, max_nr_pages, &amp;map,</div><div class='add'>+		ret = f2fs_read_single_page(inode, folio, max_nr_pages, &amp;map,</div><div class='ctx'> 					&amp;bio, &amp;last_block_in_bio, rac);</div><div class='ctx'> 		if (ret) {</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='ctx'> set_error_page:</div><div class='ctx'> #endif</div><div class='del'>-			SetPageError(page);</div><div class='del'>-			zero_user_segment(page, 0, PAGE_SIZE);</div><div class='del'>-			unlock_page(page);</div><div class='add'>+			folio_zero_segment(folio, 0, folio_size(folio));</div><div class='add'>+			folio_unlock(folio);</div><div class='ctx'> 		}</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='ctx'> next_page:</div><div class='ctx'> #endif</div><div class='del'>-		if (rac)</div><div class='del'>-			put_page(page);</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='ctx'> 		if (f2fs_compressed_file(inode)) {</div><div class='hunk'>@@ -2471,34 +2444,34 @@ next_page:</div><div class='ctx'> 				ret = f2fs_read_multi_pages(&amp;cc, &amp;bio,</div><div class='ctx'> 							max_nr_pages,</div><div class='ctx'> 							&amp;last_block_in_bio,</div><div class='del'>-							rac != NULL, false);</div><div class='add'>+							rac, false);</div><div class='ctx'> 				f2fs_destroy_compress_ctx(&amp;cc, false);</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> #endif</div><div class='ctx'> 	}</div><div class='ctx'> 	if (bio)</div><div class='del'>-		__submit_bio(F2FS_I_SB(inode), bio, DATA);</div><div class='add'>+		f2fs_submit_read_bio(F2FS_I_SB(inode), bio, DATA);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_read_data_page(struct file *file, struct page *page)</div><div class='add'>+static int f2fs_read_data_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page_file_mapping(page)-&gt;host;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	int ret = -EAGAIN;</div><div class='ctx'> </div><div class='del'>-	trace_f2fs_readpage(page, DATA);</div><div class='add'>+	trace_f2fs_readpage(folio, DATA);</div><div class='ctx'> </div><div class='ctx'> 	if (!f2fs_is_compress_backend_ready(inode)) {</div><div class='del'>-		unlock_page(page);</div><div class='add'>+		folio_unlock(folio);</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* If the file has inline data, try to read it directly */</div><div class='ctx'> 	if (f2fs_has_inline_data(inode))</div><div class='del'>-		ret = f2fs_read_inline_data(inode, page);</div><div class='add'>+		ret = f2fs_read_inline_data(inode, folio);</div><div class='ctx'> 	if (ret == -EAGAIN)</div><div class='del'>-		ret = f2fs_mpage_readpages(inode, NULL, page);</div><div class='add'>+		ret = f2fs_mpage_readpages(inode, NULL, folio);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2511,7 +2484,7 @@ static void f2fs_readahead(struct readahead_control *rac)</div><div class='ctx'> 	if (!f2fs_is_compress_backend_ready(inode))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	/* If the file has inline data, skip readpages */</div><div class='add'>+	/* If the file has inline data, skip readahead */</div><div class='ctx'> 	if (f2fs_has_inline_data(inode))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='hunk'>@@ -2520,8 +2493,9 @@ static void f2fs_readahead(struct readahead_control *rac)</div><div class='ctx'> </div><div class='ctx'> int f2fs_encrypt_one_page(struct f2fs_io_info *fio)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = fio-&gt;page-&gt;mapping-&gt;host;</div><div class='del'>-	struct page *mpage, *page;</div><div class='add'>+	struct inode *inode = fio_inode(fio);</div><div class='add'>+	struct folio *mfolio;</div><div class='add'>+	struct page *page;</div><div class='ctx'> 	gfp_t gfp_flags = GFP_NOFS;</div><div class='ctx'> </div><div class='ctx'> 	if (!f2fs_encrypted_file(inode))</div><div class='hunk'>@@ -2529,32 +2503,29 @@ int f2fs_encrypt_one_page(struct f2fs_io_info *fio)</div><div class='ctx'> </div><div class='ctx'> 	page = fio-&gt;compressed_page ? fio-&gt;compressed_page : fio-&gt;page;</div><div class='ctx'> </div><div class='del'>-	/* wait for GCed page writeback via META_MAPPING */</div><div class='del'>-	f2fs_wait_on_block_writeback(inode, fio-&gt;old_blkaddr);</div><div class='del'>-</div><div class='ctx'> 	if (fscrypt_inode_uses_inline_crypto(inode))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> retry_encrypt:</div><div class='del'>-	fio-&gt;encrypted_page = fscrypt_encrypt_pagecache_blocks(page,</div><div class='add'>+	fio-&gt;encrypted_page = fscrypt_encrypt_pagecache_blocks(page_folio(page),</div><div class='ctx'> 					PAGE_SIZE, 0, gfp_flags);</div><div class='ctx'> 	if (IS_ERR(fio-&gt;encrypted_page)) {</div><div class='ctx'> 		/* flush pending IOs and wait for a while in the ENOMEM case */</div><div class='ctx'> 		if (PTR_ERR(fio-&gt;encrypted_page) == -ENOMEM) {</div><div class='ctx'> 			f2fs_flush_merged_writes(fio-&gt;sbi);</div><div class='del'>-			congestion_wait(BLK_RW_ASYNC, DEFAULT_IO_TIMEOUT);</div><div class='add'>+			memalloc_retry_wait(GFP_NOFS);</div><div class='ctx'> 			gfp_flags |= __GFP_NOFAIL;</div><div class='ctx'> 			goto retry_encrypt;</div><div class='ctx'> 		}</div><div class='ctx'> 		return PTR_ERR(fio-&gt;encrypted_page);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	mpage = find_lock_page(META_MAPPING(fio-&gt;sbi), fio-&gt;old_blkaddr);</div><div class='del'>-	if (mpage) {</div><div class='del'>-		if (PageUptodate(mpage))</div><div class='del'>-			memcpy(page_address(mpage),</div><div class='add'>+	mfolio = filemap_lock_folio(META_MAPPING(fio-&gt;sbi), fio-&gt;old_blkaddr);</div><div class='add'>+	if (!IS_ERR(mfolio)) {</div><div class='add'>+		if (folio_test_uptodate(mfolio))</div><div class='add'>+			memcpy(folio_address(mfolio),</div><div class='ctx'> 				page_address(fio-&gt;encrypted_page), PAGE_SIZE);</div><div class='del'>-		f2fs_put_page(mpage, 1);</div><div class='add'>+		f2fs_folio_put(mfolio, true);</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -2563,31 +2534,29 @@ static inline bool check_inplace_update_policy(struct inode *inode,</div><div class='ctx'> 				struct f2fs_io_info *fio)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='del'>-	unsigned int policy = SM_I(sbi)-&gt;ipu_policy;</div><div class='ctx'> </div><div class='del'>-	if (policy &amp; (0x1 &lt;&lt; F2FS_IPU_FORCE))</div><div class='add'>+	if (IS_F2FS_IPU_HONOR_OPU_WRITE(sbi) &amp;&amp;</div><div class='add'>+	    is_inode_flag_set(inode, FI_OPU_WRITE))</div><div class='add'>+		return false;</div><div class='add'>+	if (IS_F2FS_IPU_FORCE(sbi))</div><div class='ctx'> 		return true;</div><div class='del'>-	if (policy &amp; (0x1 &lt;&lt; F2FS_IPU_SSR) &amp;&amp; f2fs_need_SSR(sbi))</div><div class='add'>+	if (IS_F2FS_IPU_SSR(sbi) &amp;&amp; f2fs_need_SSR(sbi))</div><div class='ctx'> 		return true;</div><div class='del'>-	if (policy &amp; (0x1 &lt;&lt; F2FS_IPU_UTIL) &amp;&amp;</div><div class='del'>-			utilization(sbi) &gt; SM_I(sbi)-&gt;min_ipu_util)</div><div class='add'>+	if (IS_F2FS_IPU_UTIL(sbi) &amp;&amp; utilization(sbi) &gt; SM_I(sbi)-&gt;min_ipu_util)</div><div class='ctx'> 		return true;</div><div class='del'>-	if (policy &amp; (0x1 &lt;&lt; F2FS_IPU_SSR_UTIL) &amp;&amp; f2fs_need_SSR(sbi) &amp;&amp;</div><div class='del'>-			utilization(sbi) &gt; SM_I(sbi)-&gt;min_ipu_util)</div><div class='add'>+	if (IS_F2FS_IPU_SSR_UTIL(sbi) &amp;&amp; f2fs_need_SSR(sbi) &amp;&amp;</div><div class='add'>+	    utilization(sbi) &gt; SM_I(sbi)-&gt;min_ipu_util)</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * IPU for rewrite async pages</div><div class='ctx'> 	 */</div><div class='del'>-	if (policy &amp; (0x1 &lt;&lt; F2FS_IPU_ASYNC) &amp;&amp;</div><div class='del'>-			fio &amp;&amp; fio-&gt;op == REQ_OP_WRITE &amp;&amp;</div><div class='del'>-			!(fio-&gt;op_flags &amp; REQ_SYNC) &amp;&amp;</div><div class='del'>-			!IS_ENCRYPTED(inode))</div><div class='add'>+	if (IS_F2FS_IPU_ASYNC(sbi) &amp;&amp; fio &amp;&amp; fio-&gt;op == REQ_OP_WRITE &amp;&amp;</div><div class='add'>+	    !(fio-&gt;op_flags &amp; REQ_SYNC) &amp;&amp; !IS_ENCRYPTED(inode))</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='ctx'> 	/* this is only set during fdatasync */</div><div class='del'>-	if (policy &amp; (0x1 &lt;&lt; F2FS_IPU_FSYNC) &amp;&amp;</div><div class='del'>-			is_inode_flag_set(inode, FI_NEED_IPU))</div><div class='add'>+	if (IS_F2FS_IPU_FSYNC(sbi) &amp;&amp; is_inode_flag_set(inode, FI_NEED_IPU))</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(fio &amp;&amp; is_sbi_flag_set(sbi, SBI_CP_DISABLED) &amp;&amp;</div><div class='hunk'>@@ -2607,7 +2576,7 @@ bool f2fs_should_update_inplace(struct inode *inode, struct f2fs_io_info *fio)</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='ctx'> 	/* if this is cold file, we should overwrite to avoid fragmentation */</div><div class='del'>-	if (file_is_cold(inode))</div><div class='add'>+	if (file_is_cold(inode) &amp;&amp; !is_inode_flag_set(inode, FI_OPU_WRITE))</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='ctx'> 	return check_inplace_update_policy(inode, fio);</div><div class='hunk'>@@ -2617,26 +2586,35 @@ bool f2fs_should_update_outplace(struct inode *inode, struct f2fs_io_info *fio)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> </div><div class='add'>+	/* The below cases were checked when setting it. */</div><div class='add'>+	if (f2fs_is_pinned_file(inode))</div><div class='add'>+		return false;</div><div class='add'>+	if (fio &amp;&amp; is_sbi_flag_set(sbi, SBI_NEED_FSCK))</div><div class='add'>+		return true;</div><div class='ctx'> 	if (f2fs_lfs_mode(sbi))</div><div class='ctx'> 		return true;</div><div class='ctx'> 	if (S_ISDIR(inode-&gt;i_mode))</div><div class='ctx'> 		return true;</div><div class='ctx'> 	if (IS_NOQUOTA(inode))</div><div class='ctx'> 		return true;</div><div class='del'>-	if (f2fs_is_atomic_file(inode))</div><div class='add'>+	if (f2fs_used_in_atomic_write(inode))</div><div class='ctx'> 		return true;</div><div class='del'>-	if (is_sbi_flag_set(sbi, SBI_NEED_FSCK))</div><div class='add'>+	/* rewrite low ratio compress data w/ OPU mode to avoid fragmentation */</div><div class='add'>+	if (f2fs_compressed_file(inode) &amp;&amp;</div><div class='add'>+		F2FS_OPTION(sbi).compress_mode == COMPR_MODE_USER &amp;&amp;</div><div class='add'>+		is_inode_flag_set(inode, FI_ENABLE_COMPRESS))</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='ctx'> 	/* swap file is migrating in aligned write mode */</div><div class='ctx'> 	if (is_inode_flag_set(inode, FI_ALIGNED_WRITE))</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='add'>+	if (is_inode_flag_set(inode, FI_OPU_WRITE))</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='ctx'> 	if (fio) {</div><div class='ctx'> 		if (page_private_gcing(fio-&gt;page))</div><div class='ctx'> 			return true;</div><div class='del'>-		if (page_private_dummy(fio-&gt;page))</div><div class='del'>-			return true;</div><div class='ctx'> 		if (unlikely(is_sbi_flag_set(sbi, SBI_CP_DISABLED) &amp;&amp;</div><div class='ctx'> 			f2fs_is_checkpointed_data(sbi, fio-&gt;old_blkaddr)))</div><div class='ctx'> 			return true;</div><div class='hunk'>@@ -2646,7 +2624,7 @@ bool f2fs_should_update_outplace(struct inode *inode, struct f2fs_io_info *fio)</div><div class='ctx'> </div><div class='ctx'> static inline bool need_inplace_update(struct f2fs_io_info *fio)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = fio-&gt;page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *inode = fio_inode(fio);</div><div class='ctx'> </div><div class='ctx'> 	if (f2fs_should_update_outplace(inode, fio))</div><div class='ctx'> 		return false;</div><div class='hunk'>@@ -2656,19 +2634,25 @@ static inline bool need_inplace_update(struct f2fs_io_info *fio)</div><div class='ctx'> </div><div class='ctx'> int f2fs_do_write_data_page(struct f2fs_io_info *fio)</div><div class='ctx'> {</div><div class='del'>-	struct page *page = fio-&gt;page;</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct folio *folio = fio-&gt;folio;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	struct dnode_of_data dn;</div><div class='del'>-	struct extent_info ei = {0, };</div><div class='ctx'> 	struct node_info ni;</div><div class='ctx'> 	bool ipu_force = false;</div><div class='add'>+	bool atomic_commit;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='del'>-	set_new_dnode(&amp;dn, inode, NULL, NULL, 0);</div><div class='del'>-	if (need_inplace_update(fio) &amp;&amp;</div><div class='del'>-			f2fs_lookup_extent_cache(inode, page-&gt;index, &amp;ei)) {</div><div class='del'>-		fio-&gt;old_blkaddr = ei.blk + page-&gt;index - ei.fofs;</div><div class='add'>+	/* Use COW inode to make dnode_of_data for atomic write */</div><div class='add'>+	atomic_commit = f2fs_is_atomic_file(inode) &amp;&amp;</div><div class='add'>+				folio_test_f2fs_atomic(folio);</div><div class='add'>+	if (atomic_commit)</div><div class='add'>+		set_new_dnode(&amp;dn, F2FS_I(inode)-&gt;cow_inode, NULL, NULL, 0);</div><div class='add'>+	else</div><div class='add'>+		set_new_dnode(&amp;dn, inode, NULL, NULL, 0);</div><div class='ctx'> </div><div class='add'>+	if (need_inplace_update(fio) &amp;&amp;</div><div class='add'>+	    f2fs_lookup_read_extent_cache_block(inode, folio-&gt;index,</div><div class='add'>+						&amp;fio-&gt;old_blkaddr)) {</div><div class='ctx'> 		if (!f2fs_is_valid_blkaddr(fio-&gt;sbi, fio-&gt;old_blkaddr,</div><div class='ctx'> 						DATA_GENERIC_ENHANCE))</div><div class='ctx'> 			return -EFSCORRUPTED;</div><div class='hunk'>@@ -2682,7 +2666,7 @@ int f2fs_do_write_data_page(struct f2fs_io_info *fio)</div><div class='ctx'> 	if (fio-&gt;need_lock == LOCK_REQ &amp;&amp; !f2fs_trylock_op(fio-&gt;sbi))</div><div class='ctx'> 		return -EAGAIN;</div><div class='ctx'> </div><div class='del'>-	err = f2fs_get_dnode_of_data(&amp;dn, page-&gt;index, LOOKUP_NODE);</div><div class='add'>+	err = f2fs_get_dnode_of_data(&amp;dn, folio-&gt;index, LOOKUP_NODE);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -2690,8 +2674,8 @@ int f2fs_do_write_data_page(struct f2fs_io_info *fio)</div><div class='ctx'> </div><div class='ctx'> 	/* This page is already truncated */</div><div class='ctx'> 	if (fio-&gt;old_blkaddr == NULL_ADDR) {</div><div class='del'>-		ClearPageUptodate(page);</div><div class='del'>-		clear_page_private_gcing(page);</div><div class='add'>+		folio_clear_uptodate(folio);</div><div class='add'>+		folio_clear_f2fs_gcing(folio);</div><div class='ctx'> 		goto out_writepage;</div><div class='ctx'> 	}</div><div class='ctx'> got_it:</div><div class='hunk'>@@ -2701,6 +2685,11 @@ got_it:</div><div class='ctx'> 		err = -EFSCORRUPTED;</div><div class='ctx'> 		goto out_writepage;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	/* wait for GCed page writeback via META_MAPPING */</div><div class='add'>+	if (fio-&gt;meta_gc)</div><div class='add'>+		f2fs_wait_on_block_writeback(inode, fio-&gt;old_blkaddr);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If current allocation needs SSR,</div><div class='ctx'> 	 * it had better in-place writes for updated data.</div><div class='hunk'>@@ -2712,8 +2701,7 @@ got_it:</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto out_writepage;</div><div class='ctx'> </div><div class='del'>-		set_page_writeback(page);</div><div class='del'>-		ClearPageError(page);</div><div class='add'>+		folio_start_writeback(folio);</div><div class='ctx'> 		f2fs_put_dnode(&amp;dn);</div><div class='ctx'> 		if (fio-&gt;need_lock == LOCK_REQ)</div><div class='ctx'> 			f2fs_unlock_op(fio-&gt;sbi);</div><div class='hunk'>@@ -2721,12 +2709,11 @@ got_it:</div><div class='ctx'> 		if (err) {</div><div class='ctx'> 			if (fscrypt_inode_uses_fs_layer_crypto(inode))</div><div class='ctx'> 				fscrypt_finalize_bounce_page(&amp;fio-&gt;encrypted_page);</div><div class='del'>-			if (PageWriteback(page))</div><div class='del'>-				end_page_writeback(page);</div><div class='add'>+			folio_end_writeback(folio);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			set_inode_flag(inode, FI_UPDATE_WRITE);</div><div class='ctx'> 		}</div><div class='del'>-		trace_f2fs_do_write_data_page(fio-&gt;page, IPU);</div><div class='add'>+		trace_f2fs_do_write_data_page(folio, IPU);</div><div class='ctx'> 		return err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -2738,7 +2725,7 @@ got_it:</div><div class='ctx'> 		fio-&gt;need_lock = LOCK_REQ;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = f2fs_get_node_info(fio-&gt;sbi, dn.nid, &amp;ni);</div><div class='add'>+	err = f2fs_get_node_info(fio-&gt;sbi, dn.nid, &amp;ni, false);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out_writepage;</div><div class='ctx'> </div><div class='hunk'>@@ -2748,18 +2735,17 @@ got_it:</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out_writepage;</div><div class='ctx'> </div><div class='del'>-	set_page_writeback(page);</div><div class='del'>-	ClearPageError(page);</div><div class='add'>+	folio_start_writeback(folio);</div><div class='ctx'> </div><div class='ctx'> 	if (fio-&gt;compr_blocks &amp;&amp; fio-&gt;old_blkaddr == COMPRESS_ADDR)</div><div class='ctx'> 		f2fs_i_compr_blocks_update(inode, fio-&gt;compr_blocks - 1, false);</div><div class='ctx'> </div><div class='ctx'> 	/* LFS mode write path */</div><div class='ctx'> 	f2fs_outplace_write_data(&amp;dn, fio);</div><div class='del'>-	trace_f2fs_do_write_data_page(page, OPU);</div><div class='add'>+	trace_f2fs_do_write_data_page(folio, OPU);</div><div class='ctx'> 	set_inode_flag(inode, FI_APPEND_WRITE);</div><div class='del'>-	if (page-&gt;index == 0)</div><div class='del'>-		set_inode_flag(inode, FI_FIRST_BLOCK_WRITTEN);</div><div class='add'>+	if (atomic_commit)</div><div class='add'>+		folio_clear_f2fs_atomic(folio);</div><div class='ctx'> out_writepage:</div><div class='ctx'> 	f2fs_put_dnode(&amp;dn);</div><div class='ctx'> out:</div><div class='hunk'>@@ -2768,7 +2754,7 @@ out:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int f2fs_write_single_data_page(struct page *page, int *submitted,</div><div class='add'>+int f2fs_write_single_data_page(struct folio *folio, int *submitted,</div><div class='ctx'> 				struct bio **bio,</div><div class='ctx'> 				sector_t *last_block,</div><div class='ctx'> 				struct writeback_control *wbc,</div><div class='hunk'>@@ -2776,14 +2762,15 @@ int f2fs_write_single_data_page(struct page *page, int *submitted,</div><div class='ctx'> 				int compr_blocks,</div><div class='ctx'> 				bool allow_balance)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	loff_t i_size = i_size_read(inode);</div><div class='ctx'> 	const pgoff_t end_index = ((unsigned long long)i_size)</div><div class='ctx'> 							&gt;&gt; PAGE_SHIFT;</div><div class='del'>-	loff_t psize = (loff_t)(page-&gt;index + 1) &lt;&lt; PAGE_SHIFT;</div><div class='add'>+	loff_t psize = (loff_t)(folio-&gt;index + 1) &lt;&lt; PAGE_SHIFT;</div><div class='ctx'> 	unsigned offset = 0;</div><div class='ctx'> 	bool need_balance_fs = false;</div><div class='add'>+	bool quota_inode = IS_NOQUOTA(inode);</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> 	struct f2fs_io_info fio = {</div><div class='ctx'> 		.sbi = sbi,</div><div class='hunk'>@@ -2792,27 +2779,33 @@ int f2fs_write_single_data_page(struct page *page, int *submitted,</div><div class='ctx'> 		.op = REQ_OP_WRITE,</div><div class='ctx'> 		.op_flags = wbc_to_write_flags(wbc),</div><div class='ctx'> 		.old_blkaddr = NULL_ADDR,</div><div class='del'>-		.page = page,</div><div class='add'>+		.folio = folio,</div><div class='ctx'> 		.encrypted_page = NULL,</div><div class='del'>-		.submitted = false,</div><div class='add'>+		.submitted = 0,</div><div class='ctx'> 		.compr_blocks = compr_blocks,</div><div class='del'>-		.need_lock = LOCK_RETRY,</div><div class='add'>+		.need_lock = compr_blocks ? LOCK_DONE : LOCK_RETRY,</div><div class='add'>+		.meta_gc = f2fs_meta_inode_gc_required(inode) ? 1 : 0,</div><div class='ctx'> 		.io_type = io_type,</div><div class='ctx'> 		.io_wbc = wbc,</div><div class='ctx'> 		.bio = bio,</div><div class='ctx'> 		.last_block = last_block,</div><div class='ctx'> 	};</div><div class='ctx'> </div><div class='del'>-	trace_f2fs_writepage(page, DATA);</div><div class='add'>+	trace_f2fs_writepage(folio, DATA);</div><div class='ctx'> </div><div class='del'>-	/* we should bypass data pages to proceed the kworkder jobs */</div><div class='add'>+	/* we should bypass data pages to proceed the kworker jobs */</div><div class='ctx'> 	if (unlikely(f2fs_cp_error(sbi))) {</div><div class='del'>-		mapping_set_error(page-&gt;mapping, -EIO);</div><div class='add'>+		mapping_set_error(folio-&gt;mapping, -EIO);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * don't drop any dirty dentry pages for keeping lastest</div><div class='ctx'> 		 * directory structure.</div><div class='ctx'> 		 */</div><div class='del'>-		if (S_ISDIR(inode-&gt;i_mode))</div><div class='add'>+		if (S_ISDIR(inode-&gt;i_mode) &amp;&amp;</div><div class='add'>+				!is_sbi_flag_set(sbi, SBI_IS_CLOSE))</div><div class='add'>+			goto redirty_out;</div><div class='add'>+</div><div class='add'>+		/* keep data pages in remount-ro mode */</div><div class='add'>+		if (F2FS_OPTION(sbi).errors == MOUNT_ERRORS_READONLY)</div><div class='ctx'> 			goto redirty_out;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2820,7 +2813,7 @@ int f2fs_write_single_data_page(struct page *page, int *submitted,</div><div class='ctx'> 	if (unlikely(is_sbi_flag_set(sbi, SBI_POR_DOING)))</div><div class='ctx'> 		goto redirty_out;</div><div class='ctx'> </div><div class='del'>-	if (page-&gt;index &lt; end_index ||</div><div class='add'>+	if (folio-&gt;index &lt; end_index ||</div><div class='ctx'> 			f2fs_verity_in_progress(inode) ||</div><div class='ctx'> 			compr_blocks)</div><div class='ctx'> 		goto write;</div><div class='hunk'>@@ -2830,48 +2823,34 @@ int f2fs_write_single_data_page(struct page *page, int *submitted,</div><div class='ctx'> 	 * this page does not have to be written to disk.</div><div class='ctx'> 	 */</div><div class='ctx'> 	offset = i_size &amp; (PAGE_SIZE - 1);</div><div class='del'>-	if ((page-&gt;index &gt;= end_index + 1) || !offset)</div><div class='add'>+	if ((folio-&gt;index &gt;= end_index + 1) || !offset)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	zero_user_segment(page, offset, PAGE_SIZE);</div><div class='add'>+	folio_zero_segment(folio, offset, folio_size(folio));</div><div class='ctx'> write:</div><div class='del'>-	if (f2fs_is_drop_cache(inode))</div><div class='del'>-		goto out;</div><div class='del'>-	/* we should not write 0'th page having journal header */</div><div class='del'>-	if (f2fs_is_volatile_file(inode) &amp;&amp; (!page-&gt;index ||</div><div class='del'>-			(!wbc-&gt;for_reclaim &amp;&amp;</div><div class='del'>-			f2fs_available_free_memory(sbi, BASE_CHECK))))</div><div class='del'>-		goto redirty_out;</div><div class='del'>-</div><div class='ctx'> 	/* Dentry/quota blocks are controlled by checkpoint */</div><div class='del'>-	if (S_ISDIR(inode-&gt;i_mode) || IS_NOQUOTA(inode)) {</div><div class='add'>+	if (S_ISDIR(inode-&gt;i_mode) || quota_inode) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We need to wait for node_write to avoid block allocation during</div><div class='ctx'> 		 * checkpoint. This can only happen to quota writes which can cause</div><div class='ctx'> 		 * the below discard race condition.</div><div class='ctx'> 		 */</div><div class='del'>-		if (IS_NOQUOTA(inode))</div><div class='del'>-			down_read(&amp;sbi-&gt;node_write);</div><div class='add'>+		if (quota_inode)</div><div class='add'>+			f2fs_down_read(&amp;sbi-&gt;node_write);</div><div class='ctx'> </div><div class='ctx'> 		fio.need_lock = LOCK_DONE;</div><div class='ctx'> 		err = f2fs_do_write_data_page(&amp;fio);</div><div class='ctx'> </div><div class='del'>-		if (IS_NOQUOTA(inode))</div><div class='del'>-			up_read(&amp;sbi-&gt;node_write);</div><div class='add'>+		if (quota_inode)</div><div class='add'>+			f2fs_up_read(&amp;sbi-&gt;node_write);</div><div class='ctx'> </div><div class='ctx'> 		goto done;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!wbc-&gt;for_reclaim)</div><div class='del'>-		need_balance_fs = true;</div><div class='del'>-	else if (has_not_enough_free_secs(sbi, 0, 0))</div><div class='del'>-		goto redirty_out;</div><div class='del'>-	else</div><div class='del'>-		set_inode_flag(inode, FI_HOT_DATA);</div><div class='del'>-</div><div class='add'>+	need_balance_fs = true;</div><div class='ctx'> 	err = -EAGAIN;</div><div class='ctx'> 	if (f2fs_has_inline_data(inode)) {</div><div class='del'>-		err = f2fs_write_inline_data(inode, page);</div><div class='add'>+		err = f2fs_write_inline_data(inode, folio);</div><div class='ctx'> 		if (!err)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2879,6 +2858,7 @@ write:</div><div class='ctx'> 	if (err == -EAGAIN) {</div><div class='ctx'> 		err = f2fs_do_write_data_page(&amp;fio);</div><div class='ctx'> 		if (err == -EAGAIN) {</div><div class='add'>+			f2fs_bug_on(sbi, compr_blocks);</div><div class='ctx'> 			fio.need_lock = LOCK_REQ;</div><div class='ctx'> 			err = f2fs_do_write_data_page(&amp;fio);</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2900,70 +2880,42 @@ done:</div><div class='ctx'> out:</div><div class='ctx'> 	inode_dec_dirty_pages(inode);</div><div class='ctx'> 	if (err) {</div><div class='del'>-		ClearPageUptodate(page);</div><div class='del'>-		clear_page_private_gcing(page);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (wbc-&gt;for_reclaim) {</div><div class='del'>-		f2fs_submit_merged_write_cond(sbi, NULL, page, 0, DATA);</div><div class='del'>-		clear_inode_flag(inode, FI_HOT_DATA);</div><div class='del'>-		f2fs_remove_dirty_inode(inode);</div><div class='del'>-		submitted = NULL;</div><div class='add'>+		folio_clear_uptodate(folio);</div><div class='add'>+		folio_clear_f2fs_gcing(folio);</div><div class='ctx'> 	}</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> 	if (!S_ISDIR(inode-&gt;i_mode) &amp;&amp; !IS_NOQUOTA(inode) &amp;&amp;</div><div class='del'>-			!F2FS_I(inode)-&gt;cp_task &amp;&amp; allow_balance)</div><div class='add'>+			!F2FS_I(inode)-&gt;wb_task &amp;&amp; allow_balance)</div><div class='ctx'> 		f2fs_balance_fs(sbi, need_balance_fs);</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(f2fs_cp_error(sbi))) {</div><div class='ctx'> 		f2fs_submit_merged_write(sbi, DATA);</div><div class='del'>-		f2fs_submit_merged_ipu_write(sbi, bio, NULL);</div><div class='add'>+		if (bio &amp;&amp; *bio)</div><div class='add'>+			f2fs_submit_merged_ipu_write(sbi, bio, NULL);</div><div class='ctx'> 		submitted = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (submitted)</div><div class='del'>-		*submitted = fio.submitted ? 1 : 0;</div><div class='add'>+		*submitted = fio.submitted;</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> redirty_out:</div><div class='del'>-	redirty_page_for_writepage(wbc, page);</div><div class='add'>+	folio_redirty_for_writepage(wbc, folio);</div><div class='ctx'> 	/*</div><div class='del'>-	 * pageout() in MM traslates EAGAIN, so calls handle_write_error()</div><div class='add'>+	 * pageout() in MM translates EAGAIN, so calls handle_write_error()</div><div class='ctx'> 	 * -&gt; mapping_set_error() -&gt; set_bit(AS_EIO, ...).</div><div class='ctx'> 	 * file_write_and_wait_range() will see EIO error, which is critical</div><div class='ctx'> 	 * to return value of fsync() followed by atomic_write failure to user.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!err || wbc-&gt;for_reclaim)</div><div class='del'>-		return AOP_WRITEPAGE_ACTIVATE;</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	if (!err)</div><div class='add'>+		return 1;</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_write_data_page(struct page *page,</div><div class='del'>-					struct writeback_control *wbc)</div><div class='del'>-{</div><div class='del'>-#ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-</div><div class='del'>-	if (unlikely(f2fs_cp_error(F2FS_I_SB(inode))))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	if (f2fs_compressed_file(inode)) {</div><div class='del'>-		if (f2fs_is_compressed_cluster(inode, page-&gt;index)) {</div><div class='del'>-			redirty_page_for_writepage(wbc, page);</div><div class='del'>-			return AOP_WRITEPAGE_ACTIVATE;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-out:</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-	return f2fs_write_single_data_page(page, NULL, NULL, NULL,</div><div class='del'>-						wbc, FS_DATA_IO, 0, true);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='del'>- * This function was copied from write_cche_pages from mm/page-writeback.c.</div><div class='add'>+ * This function was copied from write_cache_pages from mm/page-writeback.c.</div><div class='ctx'>  * The major change is making write step of cold data page separately from</div><div class='ctx'>  * warm/hot data page.</div><div class='ctx'>  */</div><div class='hunk'>@@ -2973,7 +2925,9 @@ static int f2fs_write_cache_pages(struct address_space *mapping,</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int done = 0, retry = 0;</div><div class='del'>-	struct pagevec pvec;</div><div class='add'>+	struct page *pages_local[F2FS_ONSTACK_PAGES];</div><div class='add'>+	struct page **pages = pages_local;</div><div class='add'>+	struct folio_batch fbatch;</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_M_SB(mapping);</div><div class='ctx'> 	struct bio *bio = NULL;</div><div class='ctx'> 	sector_t last_block;</div><div class='hunk'>@@ -2987,13 +2941,16 @@ static int f2fs_write_cache_pages(struct address_space *mapping,</div><div class='ctx'> 		.rpages = NULL,</div><div class='ctx'> 		.nr_rpages = 0,</div><div class='ctx'> 		.cpages = NULL,</div><div class='add'>+		.valid_nr_cpages = 0,</div><div class='ctx'> 		.rbuf = NULL,</div><div class='ctx'> 		.cbuf = NULL,</div><div class='ctx'> 		.rlen = PAGE_SIZE * F2FS_I(inode)-&gt;i_cluster_size,</div><div class='ctx'> 		.private = NULL,</div><div class='ctx'> 	};</div><div class='ctx'> #endif</div><div class='add'>+	int nr_folios, p, idx;</div><div class='ctx'> 	int nr_pages;</div><div class='add'>+	unsigned int max_pages = F2FS_ONSTACK_PAGES;</div><div class='ctx'> 	pgoff_t index;</div><div class='ctx'> 	pgoff_t end;		/* Inclusive */</div><div class='ctx'> 	pgoff_t done_index;</div><div class='hunk'>@@ -3003,7 +2960,16 @@ static int f2fs_write_cache_pages(struct address_space *mapping,</div><div class='ctx'> 	int submitted = 0;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	pagevec_init(&amp;pvec);</div><div class='add'>+#ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='add'>+	if (f2fs_compressed_file(inode) &amp;&amp;</div><div class='add'>+		1 &lt;&lt; cc.log_cluster_size &gt; F2FS_ONSTACK_PAGES) {</div><div class='add'>+		pages = f2fs_kzalloc(sbi, sizeof(struct page *) &lt;&lt;</div><div class='add'>+				cc.log_cluster_size, GFP_NOFS | __GFP_NOFAIL);</div><div class='add'>+		max_pages = 1 &lt;&lt; cc.log_cluster_size;</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+	folio_batch_init(&amp;fbatch);</div><div class='ctx'> </div><div class='ctx'> 	if (get_dirty_pages(mapping-&gt;host) &lt;=</div><div class='ctx'> 				SM_I(F2FS_M_SB(mapping))-&gt;min_hot_blocks)</div><div class='hunk'>@@ -3020,23 +2986,45 @@ static int f2fs_write_cache_pages(struct address_space *mapping,</div><div class='ctx'> 		if (wbc-&gt;range_start == 0 &amp;&amp; wbc-&gt;range_end == LLONG_MAX)</div><div class='ctx'> 			range_whole = 1;</div><div class='ctx'> 	}</div><div class='del'>-	if (wbc-&gt;sync_mode == WB_SYNC_ALL || wbc-&gt;tagged_writepages)</div><div class='del'>-		tag = PAGECACHE_TAG_TOWRITE;</div><div class='del'>-	else</div><div class='del'>-		tag = PAGECACHE_TAG_DIRTY;</div><div class='add'>+	tag = wbc_to_tag(wbc);</div><div class='ctx'> retry:</div><div class='ctx'> 	retry = 0;</div><div class='ctx'> 	if (wbc-&gt;sync_mode == WB_SYNC_ALL || wbc-&gt;tagged_writepages)</div><div class='ctx'> 		tag_pages_for_writeback(mapping, index, end);</div><div class='ctx'> 	done_index = index;</div><div class='ctx'> 	while (!done &amp;&amp; !retry &amp;&amp; (index &lt;= end)) {</div><div class='del'>-		nr_pages = pagevec_lookup_range_tag(&amp;pvec, mapping, &amp;index, end,</div><div class='del'>-				tag);</div><div class='del'>-		if (nr_pages == 0)</div><div class='add'>+		nr_pages = 0;</div><div class='add'>+again:</div><div class='add'>+		nr_folios = filemap_get_folios_tag(mapping, &amp;index, end,</div><div class='add'>+				tag, &amp;fbatch);</div><div class='add'>+		if (nr_folios == 0) {</div><div class='add'>+			if (nr_pages)</div><div class='add'>+				goto write;</div><div class='ctx'> 			break;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='add'>+		for (i = 0; i &lt; nr_folios; i++) {</div><div class='add'>+			struct folio *folio = fbatch.folios[i];</div><div class='add'>+</div><div class='add'>+			idx = 0;</div><div class='add'>+			p = folio_nr_pages(folio);</div><div class='add'>+add_more:</div><div class='add'>+			pages[nr_pages] = folio_page(folio, idx);</div><div class='add'>+			folio_get(folio);</div><div class='add'>+			if (++nr_pages == max_pages) {</div><div class='add'>+				index = folio-&gt;index + idx + 1;</div><div class='add'>+				folio_batch_release(&amp;fbatch);</div><div class='add'>+				goto write;</div><div class='add'>+			}</div><div class='add'>+			if (++idx &lt; p)</div><div class='add'>+				goto add_more;</div><div class='add'>+		}</div><div class='add'>+		folio_batch_release(&amp;fbatch);</div><div class='add'>+		goto again;</div><div class='add'>+write:</div><div class='ctx'> 		for (i = 0; i &lt; nr_pages; i++) {</div><div class='del'>-			struct page *page = pvec.pages[i];</div><div class='add'>+			struct page *page = pages[i];</div><div class='add'>+			struct folio *folio = page_folio(page);</div><div class='ctx'> 			bool need_readd;</div><div class='ctx'> readd:</div><div class='ctx'> 			need_readd = false;</div><div class='hunk'>@@ -3053,7 +3041,7 @@ readd:</div><div class='ctx'> 				}</div><div class='ctx'> </div><div class='ctx'> 				if (!f2fs_cluster_can_merge_page(&amp;cc,</div><div class='del'>-								page-&gt;index)) {</div><div class='add'>+								folio-&gt;index)) {</div><div class='ctx'> 					ret = f2fs_write_multi_pages(&amp;cc,</div><div class='ctx'> 						&amp;submitted, wbc, io_type);</div><div class='ctx'> 					if (!ret)</div><div class='hunk'>@@ -3062,23 +3050,28 @@ readd:</div><div class='ctx'> 				}</div><div class='ctx'> </div><div class='ctx'> 				if (unlikely(f2fs_cp_error(sbi)))</div><div class='del'>-					goto lock_page;</div><div class='add'>+					goto lock_folio;</div><div class='ctx'> </div><div class='ctx'> 				if (!f2fs_cluster_is_empty(&amp;cc))</div><div class='del'>-					goto lock_page;</div><div class='add'>+					goto lock_folio;</div><div class='add'>+</div><div class='add'>+				if (f2fs_all_cluster_page_ready(&amp;cc,</div><div class='add'>+					pages, i, nr_pages, true))</div><div class='add'>+					goto lock_folio;</div><div class='ctx'> </div><div class='ctx'> 				ret2 = f2fs_prepare_compress_overwrite(</div><div class='ctx'> 							inode, &amp;pagep,</div><div class='del'>-							page-&gt;index, &amp;fsdata);</div><div class='add'>+							folio-&gt;index, &amp;fsdata);</div><div class='ctx'> 				if (ret2 &lt; 0) {</div><div class='ctx'> 					ret = ret2;</div><div class='ctx'> 					done = 1;</div><div class='ctx'> 					break;</div><div class='ctx'> 				} else if (ret2 &amp;&amp;</div><div class='ctx'> 					(!f2fs_compress_write_end(inode,</div><div class='del'>-						fsdata, page-&gt;index, 1) ||</div><div class='del'>-					 !f2fs_all_cluster_page_loaded(&amp;cc,</div><div class='del'>-						&amp;pvec, i, nr_pages))) {</div><div class='add'>+						fsdata, folio-&gt;index, 1) ||</div><div class='add'>+					 !f2fs_all_cluster_page_ready(&amp;cc,</div><div class='add'>+						pages, i, nr_pages,</div><div class='add'>+						false))) {</div><div class='ctx'> 					retry = 1;</div><div class='ctx'> 					break;</div><div class='ctx'> 				}</div><div class='hunk'>@@ -3091,46 +3084,43 @@ readd:</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='del'>-lock_page:</div><div class='add'>+lock_folio:</div><div class='ctx'> #endif</div><div class='del'>-			done_index = page-&gt;index;</div><div class='add'>+			done_index = folio-&gt;index;</div><div class='ctx'> retry_write:</div><div class='del'>-			lock_page(page);</div><div class='add'>+			folio_lock(folio);</div><div class='ctx'> </div><div class='del'>-			if (unlikely(page-&gt;mapping != mapping)) {</div><div class='add'>+			if (unlikely(folio-&gt;mapping != mapping)) {</div><div class='ctx'> continue_unlock:</div><div class='del'>-				unlock_page(page);</div><div class='add'>+				folio_unlock(folio);</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			if (!PageDirty(page)) {</div><div class='add'>+			if (!folio_test_dirty(folio)) {</div><div class='ctx'> 				/* someone wrote it for us */</div><div class='ctx'> 				goto continue_unlock;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			if (PageWriteback(page)) {</div><div class='del'>-				if (wbc-&gt;sync_mode != WB_SYNC_NONE)</div><div class='del'>-					f2fs_wait_on_page_writeback(page,</div><div class='del'>-							DATA, true, true);</div><div class='del'>-				else</div><div class='add'>+			if (folio_test_writeback(folio)) {</div><div class='add'>+				if (wbc-&gt;sync_mode == WB_SYNC_NONE)</div><div class='ctx'> 					goto continue_unlock;</div><div class='add'>+				f2fs_folio_wait_writeback(folio, DATA, true, true);</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			if (!clear_page_dirty_for_io(page))</div><div class='add'>+			if (!folio_clear_dirty_for_io(folio))</div><div class='ctx'> 				goto continue_unlock;</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='ctx'> 			if (f2fs_compressed_file(inode)) {</div><div class='del'>-				get_page(page);</div><div class='del'>-				f2fs_compress_ctx_add_page(&amp;cc, page);</div><div class='add'>+				folio_get(folio);</div><div class='add'>+				f2fs_compress_ctx_add_page(&amp;cc, folio);</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> #endif</div><div class='del'>-			ret = f2fs_write_single_data_page(page, &amp;submitted,</div><div class='del'>-					&amp;bio, &amp;last_block, wbc, io_type,</div><div class='del'>-					0, true);</div><div class='del'>-			if (ret == AOP_WRITEPAGE_ACTIVATE)</div><div class='del'>-				unlock_page(page);</div><div class='add'>+			submitted = 0;</div><div class='add'>+			ret = f2fs_write_single_data_page(folio,</div><div class='add'>+					&amp;submitted, &amp;bio, &amp;last_block,</div><div class='add'>+					wbc, io_type, 0, true);</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='ctx'> result:</div><div class='ctx'> #endif</div><div class='hunk'>@@ -3142,20 +3132,19 @@ result:</div><div class='ctx'> 				 * keep nr_to_write, since vfs uses this to</div><div class='ctx'> 				 * get # of written pages.</div><div class='ctx'> 				 */</div><div class='del'>-				if (ret == AOP_WRITEPAGE_ACTIVATE) {</div><div class='add'>+				if (ret == 1) {</div><div class='ctx'> 					ret = 0;</div><div class='ctx'> 					goto next;</div><div class='ctx'> 				} else if (ret == -EAGAIN) {</div><div class='ctx'> 					ret = 0;</div><div class='ctx'> 					if (wbc-&gt;sync_mode == WB_SYNC_ALL) {</div><div class='del'>-						cond_resched();</div><div class='del'>-						congestion_wait(BLK_RW_ASYNC,</div><div class='del'>-							DEFAULT_IO_TIMEOUT);</div><div class='add'>+						f2fs_schedule_timeout(</div><div class='add'>+							DEFAULT_SCHEDULE_TIMEOUT);</div><div class='ctx'> 						goto retry_write;</div><div class='ctx'> 					}</div><div class='ctx'> 					goto next;</div><div class='ctx'> 				}</div><div class='del'>-				done_index = page-&gt;index + 1;</div><div class='add'>+				done_index = folio_next_index(folio);</div><div class='ctx'> 				done = 1;</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -3169,7 +3158,7 @@ next:</div><div class='ctx'> 			if (need_readd)</div><div class='ctx'> 				goto readd;</div><div class='ctx'> 		}</div><div class='del'>-		pagevec_release(&amp;pvec);</div><div class='add'>+		release_pages(pages, nr_pages);</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 	}</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='hunk'>@@ -3203,6 +3192,11 @@ next:</div><div class='ctx'> 	if (bio)</div><div class='ctx'> 		f2fs_submit_merged_ipu_write(sbi, &amp;bio, NULL);</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='add'>+	if (pages != pages_local)</div><div class='add'>+		kfree(pages);</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3210,7 +3204,7 @@ static inline bool __should_serialize_io(struct inode *inode,</div><div class='ctx'> 					struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='ctx'> 	/* to avoid deadlock in path of data flush */</div><div class='del'>-	if (F2FS_I(inode)-&gt;cp_task)</div><div class='add'>+	if (F2FS_I(inode)-&gt;wb_task)</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='ctx'> 	if (!S_ISREG(inode-&gt;i_mode))</div><div class='hunk'>@@ -3227,6 +3221,19 @@ static inline bool __should_serialize_io(struct inode *inode,</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline void account_writeback(struct inode *inode, bool inc)</div><div class='add'>+{</div><div class='add'>+	if (!f2fs_sb_has_compression(F2FS_I_SB(inode)))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	f2fs_down_read(&amp;F2FS_I(inode)-&gt;i_sem);</div><div class='add'>+	if (inc)</div><div class='add'>+		atomic_inc(&amp;F2FS_I(inode)-&gt;writeback);</div><div class='add'>+	else</div><div class='add'>+		atomic_dec(&amp;F2FS_I(inode)-&gt;writeback);</div><div class='add'>+	f2fs_up_read(&amp;F2FS_I(inode)-&gt;i_sem);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int __f2fs_write_data_pages(struct address_space *mapping,</div><div class='ctx'> 						struct writeback_control *wbc,</div><div class='ctx'> 						enum iostat_type io_type)</div><div class='hunk'>@@ -3237,10 +3244,6 @@ static int __f2fs_write_data_pages(struct address_space *mapping,</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	bool locked = false;</div><div class='ctx'> </div><div class='del'>-	/* deal with chardevs and other special file */</div><div class='del'>-	if (!mapping-&gt;a_ops-&gt;writepage)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='ctx'> 	/* skip writing if there is no dirty page in this inode */</div><div class='ctx'> 	if (!get_dirty_pages(inode) &amp;&amp; wbc-&gt;sync_mode == WB_SYNC_NONE)</div><div class='ctx'> 		return 0;</div><div class='hunk'>@@ -3255,8 +3258,8 @@ static int __f2fs_write_data_pages(struct address_space *mapping,</div><div class='ctx'> 			f2fs_available_free_memory(sbi, DIRTY_DENTS))</div><div class='ctx'> 		goto skip_write;</div><div class='ctx'> </div><div class='del'>-	/* skip writing during file defragment */</div><div class='del'>-	if (is_inode_flag_set(inode, FI_DO_DEFRAG))</div><div class='add'>+	/* skip writing in file defragment preparing stage */</div><div class='add'>+	if (is_inode_flag_set(inode, FI_SKIP_WRITES))</div><div class='ctx'> 		goto skip_write;</div><div class='ctx'> </div><div class='ctx'> 	trace_f2fs_writepages(mapping-&gt;host, wbc, DATA);</div><div class='hunk'>@@ -3264,18 +3267,26 @@ static int __f2fs_write_data_pages(struct address_space *mapping,</div><div class='ctx'> 	/* to avoid spliting IOs due to mixed WB_SYNC_ALL and WB_SYNC_NONE */</div><div class='ctx'> 	if (wbc-&gt;sync_mode == WB_SYNC_ALL)</div><div class='ctx'> 		atomic_inc(&amp;sbi-&gt;wb_sync_req[DATA]);</div><div class='del'>-	else if (atomic_read(&amp;sbi-&gt;wb_sync_req[DATA]))</div><div class='add'>+	else if (atomic_read(&amp;sbi-&gt;wb_sync_req[DATA])) {</div><div class='add'>+		/* to avoid potential deadlock */</div><div class='add'>+		if (current-&gt;plug)</div><div class='add'>+			blk_finish_plug(current-&gt;plug);</div><div class='ctx'> 		goto skip_write;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (__should_serialize_io(inode, wbc)) {</div><div class='ctx'> 		mutex_lock(&amp;sbi-&gt;writepages);</div><div class='ctx'> 		locked = true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	account_writeback(inode, true);</div><div class='add'>+</div><div class='ctx'> 	blk_start_plug(&amp;plug);</div><div class='ctx'> 	ret = f2fs_write_cache_pages(mapping, wbc, io_type);</div><div class='ctx'> 	blk_finish_plug(&amp;plug);</div><div class='ctx'> </div><div class='add'>+	account_writeback(inode, false);</div><div class='add'>+</div><div class='ctx'> 	if (locked)</div><div class='ctx'> 		mutex_unlock(&amp;sbi-&gt;writepages);</div><div class='ctx'> </div><div class='hunk'>@@ -3305,7 +3316,7 @@ static int f2fs_write_data_pages(struct address_space *mapping,</div><div class='ctx'> 			FS_CP_DATA_IO : FS_DATA_IO);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void f2fs_write_failed(struct inode *inode, loff_t to)</div><div class='add'>+void f2fs_write_failed(struct inode *inode, loff_t to)</div><div class='ctx'> {</div><div class='ctx'> 	loff_t i_size = i_size_read(inode);</div><div class='ctx'> </div><div class='hunk'>@@ -3314,135 +3325,230 @@ static void f2fs_write_failed(struct inode *inode, loff_t to)</div><div class='ctx'> </div><div class='ctx'> 	/* In the fs-verity case, f2fs_end_enable_verity() does the truncate */</div><div class='ctx'> 	if (to &gt; i_size &amp;&amp; !f2fs_verity_in_progress(inode)) {</div><div class='del'>-		down_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+		f2fs_down_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> 		filemap_invalidate_lock(inode-&gt;i_mapping);</div><div class='ctx'> </div><div class='ctx'> 		truncate_pagecache(inode, i_size);</div><div class='ctx'> 		f2fs_truncate_blocks(inode, i_size, true);</div><div class='ctx'> </div><div class='ctx'> 		filemap_invalidate_unlock(inode-&gt;i_mapping);</div><div class='del'>-		up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+		f2fs_up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int prepare_write_begin(struct f2fs_sb_info *sbi,</div><div class='del'>-			struct page *page, loff_t pos, unsigned len,</div><div class='add'>+			struct folio *folio, loff_t pos, unsigned int len,</div><div class='ctx'> 			block_t *blk_addr, bool *node_changed)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-	pgoff_t index = page-&gt;index;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+	pgoff_t index = folio-&gt;index;</div><div class='ctx'> 	struct dnode_of_data dn;</div><div class='del'>-	struct page *ipage;</div><div class='add'>+	struct folio *ifolio;</div><div class='ctx'> 	bool locked = false;</div><div class='del'>-	struct extent_info ei = {0, };</div><div class='add'>+	int flag = F2FS_GET_BLOCK_PRE_AIO;</div><div class='ctx'> 	int err = 0;</div><div class='del'>-	int flag;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * we already allocated all the blocks, so we don't need to get</div><div class='del'>-	 * the block addresses when there is no need to fill the page.</div><div class='add'>+	 * If a whole page is being written and we already preallocated all the</div><div class='add'>+	 * blocks, then there is no need to get a block address now.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!f2fs_has_inline_data(inode) &amp;&amp; len == PAGE_SIZE &amp;&amp;</div><div class='del'>-	    !is_inode_flag_set(inode, FI_NO_PREALLOC) &amp;&amp;</div><div class='del'>-	    !f2fs_verity_in_progress(inode))</div><div class='add'>+	if (len == PAGE_SIZE &amp;&amp; is_inode_flag_set(inode, FI_PREALLOCATED_ALL))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/* f2fs_lock_op avoids race between write CP and convert_inline_page */</div><div class='del'>-	if (f2fs_has_inline_data(inode) &amp;&amp; pos + len &gt; MAX_INLINE_DATA(inode))</div><div class='del'>-		flag = F2FS_GET_BLOCK_DEFAULT;</div><div class='del'>-	else</div><div class='del'>-		flag = F2FS_GET_BLOCK_PRE_AIO;</div><div class='del'>-</div><div class='del'>-	if (f2fs_has_inline_data(inode) ||</div><div class='del'>-			(pos &amp; PAGE_MASK) &gt;= i_size_read(inode)) {</div><div class='del'>-		f2fs_do_map_lock(sbi, flag, true);</div><div class='add'>+	if (f2fs_has_inline_data(inode)) {</div><div class='add'>+		if (pos + len &gt; MAX_INLINE_DATA(inode))</div><div class='add'>+			flag = F2FS_GET_BLOCK_DEFAULT;</div><div class='add'>+		f2fs_map_lock(sbi, flag);</div><div class='add'>+		locked = true;</div><div class='add'>+	} else if ((pos &amp; PAGE_MASK) &gt;= i_size_read(inode)) {</div><div class='add'>+		f2fs_map_lock(sbi, flag);</div><div class='ctx'> 		locked = true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> restart:</div><div class='ctx'> 	/* check inline_data */</div><div class='del'>-	ipage = f2fs_get_node_page(sbi, inode-&gt;i_ino);</div><div class='del'>-	if (IS_ERR(ipage)) {</div><div class='del'>-		err = PTR_ERR(ipage);</div><div class='add'>+	ifolio = f2fs_get_inode_folio(sbi, inode-&gt;i_ino);</div><div class='add'>+	if (IS_ERR(ifolio)) {</div><div class='add'>+		err = PTR_ERR(ifolio);</div><div class='ctx'> 		goto unlock_out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	set_new_dnode(&amp;dn, inode, ipage, ipage, 0);</div><div class='add'>+	set_new_dnode(&amp;dn, inode, ifolio, ifolio, 0);</div><div class='ctx'> </div><div class='ctx'> 	if (f2fs_has_inline_data(inode)) {</div><div class='ctx'> 		if (pos + len &lt;= MAX_INLINE_DATA(inode)) {</div><div class='del'>-			f2fs_do_read_inline_data(page, ipage);</div><div class='add'>+			f2fs_do_read_inline_data(folio, ifolio);</div><div class='ctx'> 			set_inode_flag(inode, FI_DATA_EXIST);</div><div class='ctx'> 			if (inode-&gt;i_nlink)</div><div class='del'>-				set_page_private_inline(ipage);</div><div class='del'>-		} else {</div><div class='del'>-			err = f2fs_convert_inline_page(&amp;dn, page);</div><div class='del'>-			if (err)</div><div class='del'>-				goto out;</div><div class='del'>-			if (dn.data_blkaddr == NULL_ADDR)</div><div class='del'>-				err = f2fs_get_block(&amp;dn, index);</div><div class='add'>+				folio_set_f2fs_inline(ifolio);</div><div class='add'>+			goto out;</div><div class='ctx'> 		}</div><div class='del'>-	} else if (locked) {</div><div class='del'>-		err = f2fs_get_block(&amp;dn, index);</div><div class='del'>-	} else {</div><div class='del'>-		if (f2fs_lookup_extent_cache(inode, index, &amp;ei)) {</div><div class='del'>-			dn.data_blkaddr = ei.blk + index - ei.fofs;</div><div class='del'>-		} else {</div><div class='del'>-			/* hole case */</div><div class='del'>-			err = f2fs_get_dnode_of_data(&amp;dn, index, LOOKUP_NODE);</div><div class='del'>-			if (err || dn.data_blkaddr == NULL_ADDR) {</div><div class='del'>-				f2fs_put_dnode(&amp;dn);</div><div class='del'>-				f2fs_do_map_lock(sbi, F2FS_GET_BLOCK_PRE_AIO,</div><div class='del'>-								true);</div><div class='del'>-				WARN_ON(flag != F2FS_GET_BLOCK_PRE_AIO);</div><div class='del'>-				locked = true;</div><div class='del'>-				goto restart;</div><div class='del'>-			}</div><div class='add'>+		err = f2fs_convert_inline_folio(&amp;dn, folio);</div><div class='add'>+		if (err || dn.data_blkaddr != NULL_ADDR)</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!f2fs_lookup_read_extent_cache_block(inode, index,</div><div class='add'>+						 &amp;dn.data_blkaddr)) {</div><div class='add'>+		if (IS_DEVICE_ALIASING(inode)) {</div><div class='add'>+			err = -ENODATA;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (locked) {</div><div class='add'>+			err = f2fs_reserve_block(&amp;dn, index);</div><div class='add'>+			goto out;</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='add'>+		/* hole case */</div><div class='add'>+		err = f2fs_get_dnode_of_data(&amp;dn, index, LOOKUP_NODE);</div><div class='add'>+		if (!err &amp;&amp; dn.data_blkaddr != NULL_ADDR)</div><div class='add'>+			goto out;</div><div class='add'>+		f2fs_put_dnode(&amp;dn);</div><div class='add'>+		f2fs_map_lock(sbi, F2FS_GET_BLOCK_PRE_AIO);</div><div class='add'>+		WARN_ON(flag != F2FS_GET_BLOCK_PRE_AIO);</div><div class='add'>+		locked = true;</div><div class='add'>+		goto restart;</div><div class='ctx'> 	}</div><div class='add'>+out:</div><div class='add'>+	if (!err) {</div><div class='add'>+		/* convert_inline_page can make node_changed */</div><div class='add'>+		*blk_addr = dn.data_blkaddr;</div><div class='add'>+		*node_changed = dn.node_changed;</div><div class='add'>+	}</div><div class='add'>+	f2fs_put_dnode(&amp;dn);</div><div class='add'>+unlock_out:</div><div class='add'>+	if (locked)</div><div class='add'>+		f2fs_map_unlock(sbi, flag);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int __find_data_block(struct inode *inode, pgoff_t index,</div><div class='add'>+				block_t *blk_addr)</div><div class='add'>+{</div><div class='add'>+	struct dnode_of_data dn;</div><div class='add'>+	struct folio *ifolio;</div><div class='add'>+	int err = 0;</div><div class='add'>+</div><div class='add'>+	ifolio = f2fs_get_inode_folio(F2FS_I_SB(inode), inode-&gt;i_ino);</div><div class='add'>+	if (IS_ERR(ifolio))</div><div class='add'>+		return PTR_ERR(ifolio);</div><div class='add'>+</div><div class='add'>+	set_new_dnode(&amp;dn, inode, ifolio, ifolio, 0);</div><div class='add'>+</div><div class='add'>+	if (!f2fs_lookup_read_extent_cache_block(inode, index,</div><div class='add'>+						 &amp;dn.data_blkaddr)) {</div><div class='add'>+		/* hole case */</div><div class='add'>+		err = f2fs_get_dnode_of_data(&amp;dn, index, LOOKUP_NODE);</div><div class='add'>+		if (err) {</div><div class='add'>+			dn.data_blkaddr = NULL_ADDR;</div><div class='add'>+			err = 0;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	*blk_addr = dn.data_blkaddr;</div><div class='add'>+	f2fs_put_dnode(&amp;dn);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int __reserve_data_block(struct inode *inode, pgoff_t index,</div><div class='add'>+				block_t *blk_addr, bool *node_changed)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='add'>+	struct dnode_of_data dn;</div><div class='add'>+	struct folio *ifolio;</div><div class='add'>+	int err = 0;</div><div class='add'>+</div><div class='add'>+	f2fs_map_lock(sbi, F2FS_GET_BLOCK_PRE_AIO);</div><div class='add'>+</div><div class='add'>+	ifolio = f2fs_get_inode_folio(sbi, inode-&gt;i_ino);</div><div class='add'>+	if (IS_ERR(ifolio)) {</div><div class='add'>+		err = PTR_ERR(ifolio);</div><div class='add'>+		goto unlock_out;</div><div class='add'>+	}</div><div class='add'>+	set_new_dnode(&amp;dn, inode, ifolio, ifolio, 0);</div><div class='add'>+</div><div class='add'>+	if (!f2fs_lookup_read_extent_cache_block(dn.inode, index,</div><div class='add'>+						&amp;dn.data_blkaddr))</div><div class='add'>+		err = f2fs_reserve_block(&amp;dn, index);</div><div class='ctx'> </div><div class='del'>-	/* convert_inline_page can make node_changed */</div><div class='ctx'> 	*blk_addr = dn.data_blkaddr;</div><div class='ctx'> 	*node_changed = dn.node_changed;</div><div class='del'>-out:</div><div class='ctx'> 	f2fs_put_dnode(&amp;dn);</div><div class='add'>+</div><div class='ctx'> unlock_out:</div><div class='del'>-	if (locked)</div><div class='del'>-		f2fs_do_map_lock(sbi, flag, false);</div><div class='add'>+	f2fs_map_unlock(sbi, F2FS_GET_BLOCK_PRE_AIO);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_write_begin(struct file *file, struct address_space *mapping,</div><div class='del'>-		loff_t pos, unsigned len, unsigned flags,</div><div class='del'>-		struct page **pagep, void **fsdata)</div><div class='add'>+static int prepare_atomic_write_begin(struct f2fs_sb_info *sbi,</div><div class='add'>+			struct folio *folio, loff_t pos, unsigned int len,</div><div class='add'>+			block_t *blk_addr, bool *node_changed, bool *use_cow)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *cow_inode = F2FS_I(inode)-&gt;cow_inode;</div><div class='add'>+	pgoff_t index = folio-&gt;index;</div><div class='add'>+	int err = 0;</div><div class='add'>+	block_t ori_blk_addr = NULL_ADDR;</div><div class='add'>+</div><div class='add'>+	/* If pos is beyond the end of file, reserve a new block in COW inode */</div><div class='add'>+	if ((pos &amp; PAGE_MASK) &gt;= i_size_read(inode))</div><div class='add'>+		goto reserve_block;</div><div class='add'>+</div><div class='add'>+	/* Look for the block in COW inode first */</div><div class='add'>+	err = __find_data_block(cow_inode, index, blk_addr);</div><div class='add'>+	if (err) {</div><div class='add'>+		return err;</div><div class='add'>+	} else if (*blk_addr != NULL_ADDR) {</div><div class='add'>+		*use_cow = true;</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (is_inode_flag_set(inode, FI_ATOMIC_REPLACE))</div><div class='add'>+		goto reserve_block;</div><div class='add'>+</div><div class='add'>+	/* Look for the block in the original inode */</div><div class='add'>+	err = __find_data_block(inode, index, &amp;ori_blk_addr);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+reserve_block:</div><div class='add'>+	/* Finally, we should reserve a new block in COW inode for the update */</div><div class='add'>+	err = __reserve_data_block(cow_inode, index, blk_addr, node_changed);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+	inc_atomic_write_cnt(inode);</div><div class='add'>+</div><div class='add'>+	if (ori_blk_addr != NULL_ADDR)</div><div class='add'>+		*blk_addr = ori_blk_addr;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int f2fs_write_begin(const struct kiocb *iocb,</div><div class='add'>+			    struct address_space *mapping,</div><div class='add'>+			    loff_t pos, unsigned len, struct folio **foliop,</div><div class='add'>+			    void **fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='del'>-	struct page *page = NULL;</div><div class='del'>-	pgoff_t index = ((unsigned long long) pos) &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	bool need_balance = false, drop_atomic = false;</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	pgoff_t index = pos &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	bool need_balance = false;</div><div class='add'>+	bool use_cow = false;</div><div class='ctx'> 	block_t blkaddr = NULL_ADDR;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='del'>-	trace_f2fs_write_begin(inode, pos, len, flags);</div><div class='add'>+	trace_f2fs_write_begin(inode, pos, len);</div><div class='ctx'> </div><div class='ctx'> 	if (!f2fs_is_checkpoint_ready(sbi)) {</div><div class='ctx'> 		err = -ENOSPC;</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if ((f2fs_is_atomic_file(inode) &amp;&amp;</div><div class='del'>-			!f2fs_available_free_memory(sbi, INMEM_PAGES)) ||</div><div class='del'>-			is_inode_flag_set(inode, FI_ATOMIC_REVOKE_REQUEST)) {</div><div class='del'>-		err = -ENOMEM;</div><div class='del'>-		drop_atomic = true;</div><div class='del'>-		goto fail;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We should check this at this moment to avoid deadlock on inode page</div><div class='ctx'> 	 * and #0 page. The locking rule for inline_data conversion should be:</div><div class='del'>-	 * lock_page(page #0) -&gt; lock_page(inode_page)</div><div class='add'>+	 * folio_lock(folio #0) -&gt; folio_lock(inode_page)</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (index != 0) {</div><div class='ctx'> 		err = f2fs_convert_inline_inode(inode);</div><div class='hunk'>@@ -3453,18 +3559,20 @@ static int f2fs_write_begin(struct file *file, struct address_space *mapping,</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='ctx'> 	if (f2fs_compressed_file(inode)) {</div><div class='ctx'> 		int ret;</div><div class='add'>+		struct page *page;</div><div class='ctx'> </div><div class='ctx'> 		*fsdata = NULL;</div><div class='ctx'> </div><div class='del'>-		if (len == PAGE_SIZE)</div><div class='add'>+		if (len == PAGE_SIZE &amp;&amp; !(f2fs_is_atomic_file(inode)))</div><div class='ctx'> 			goto repeat;</div><div class='ctx'> </div><div class='del'>-		ret = f2fs_prepare_compress_overwrite(inode, pagep,</div><div class='add'>+		ret = f2fs_prepare_compress_overwrite(inode, &amp;page,</div><div class='ctx'> 							index, fsdata);</div><div class='ctx'> 		if (ret &lt; 0) {</div><div class='ctx'> 			err = ret;</div><div class='ctx'> 			goto fail;</div><div class='ctx'> 		} else if (ret) {</div><div class='add'>+			*foliop = page_folio(page);</div><div class='ctx'> 			return 0;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3472,87 +3580,93 @@ static int f2fs_write_begin(struct file *file, struct address_space *mapping,</div><div class='ctx'> </div><div class='ctx'> repeat:</div><div class='ctx'> 	/*</div><div class='del'>-	 * Do not use grab_cache_page_write_begin() to avoid deadlock due to</div><div class='del'>-	 * wait_for_stable_page. Will wait that below with our IO control.</div><div class='add'>+	 * Do not use FGP_STABLE to avoid deadlock.</div><div class='add'>+	 * Will wait that below with our IO control.</div><div class='ctx'> 	 */</div><div class='del'>-	page = f2fs_pagecache_get_page(mapping, index,</div><div class='del'>-				FGP_LOCK | FGP_WRITE | FGP_CREAT, GFP_NOFS);</div><div class='del'>-	if (!page) {</div><div class='del'>-		err = -ENOMEM;</div><div class='add'>+	folio = f2fs_filemap_get_folio(mapping, index,</div><div class='add'>+				FGP_LOCK | FGP_WRITE | FGP_CREAT | FGP_NOFS,</div><div class='add'>+				mapping_gfp_mask(mapping));</div><div class='add'>+	if (IS_ERR(folio)) {</div><div class='add'>+		err = PTR_ERR(folio);</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* TODO: cluster can be compressed due to race with .writepage */</div><div class='ctx'> </div><div class='del'>-	*pagep = page;</div><div class='add'>+	*foliop = folio;</div><div class='ctx'> </div><div class='del'>-	err = prepare_write_begin(sbi, page, pos, len,</div><div class='add'>+	if (f2fs_is_atomic_file(inode))</div><div class='add'>+		err = prepare_atomic_write_begin(sbi, folio, pos, len,</div><div class='add'>+					&amp;blkaddr, &amp;need_balance, &amp;use_cow);</div><div class='add'>+	else</div><div class='add'>+		err = prepare_write_begin(sbi, folio, pos, len,</div><div class='ctx'> 					&amp;blkaddr, &amp;need_balance);</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto fail;</div><div class='add'>+		goto put_folio;</div><div class='ctx'> </div><div class='ctx'> 	if (need_balance &amp;&amp; !IS_NOQUOTA(inode) &amp;&amp;</div><div class='ctx'> 			has_not_enough_free_secs(sbi, 0, 0)) {</div><div class='del'>-		unlock_page(page);</div><div class='add'>+		folio_unlock(folio);</div><div class='ctx'> 		f2fs_balance_fs(sbi, true);</div><div class='del'>-		lock_page(page);</div><div class='del'>-		if (page-&gt;mapping != mapping) {</div><div class='del'>-			/* The page got truncated from under us */</div><div class='del'>-			f2fs_put_page(page, 1);</div><div class='add'>+		folio_lock(folio);</div><div class='add'>+		if (folio-&gt;mapping != mapping) {</div><div class='add'>+			/* The folio got truncated from under us */</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+			folio_put(folio);</div><div class='ctx'> 			goto repeat;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	f2fs_wait_on_page_writeback(page, DATA, false, true);</div><div class='add'>+	f2fs_folio_wait_writeback(folio, DATA, false, true);</div><div class='ctx'> </div><div class='del'>-	if (len == PAGE_SIZE || PageUptodate(page))</div><div class='add'>+	if (len == folio_size(folio) || folio_test_uptodate(folio))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	if (!(pos &amp; (PAGE_SIZE - 1)) &amp;&amp; (pos + len) &gt;= i_size_read(inode) &amp;&amp;</div><div class='ctx'> 	    !f2fs_verity_in_progress(inode)) {</div><div class='del'>-		zero_user_segment(page, len, PAGE_SIZE);</div><div class='add'>+		folio_zero_segment(folio, len, folio_size(folio));</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (blkaddr == NEW_ADDR) {</div><div class='del'>-		zero_user_segment(page, 0, PAGE_SIZE);</div><div class='del'>-		SetPageUptodate(page);</div><div class='add'>+		folio_zero_segment(folio, 0, folio_size(folio));</div><div class='add'>+		folio_mark_uptodate(folio);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		if (!f2fs_is_valid_blkaddr(sbi, blkaddr,</div><div class='ctx'> 				DATA_GENERIC_ENHANCE_READ)) {</div><div class='ctx'> 			err = -EFSCORRUPTED;</div><div class='del'>-			goto fail;</div><div class='add'>+			goto put_folio;</div><div class='ctx'> 		}</div><div class='del'>-		err = f2fs_submit_page_read(inode, page, blkaddr, 0, true);</div><div class='del'>-		if (err)</div><div class='del'>-			goto fail;</div><div class='del'>-</div><div class='del'>-		lock_page(page);</div><div class='del'>-		if (unlikely(page-&gt;mapping != mapping)) {</div><div class='del'>-			f2fs_put_page(page, 1);</div><div class='add'>+		f2fs_submit_page_read(use_cow ?</div><div class='add'>+				F2FS_I(inode)-&gt;cow_inode : inode,</div><div class='add'>+				folio, blkaddr, 0, true);</div><div class='add'>+</div><div class='add'>+		folio_lock(folio);</div><div class='add'>+		if (unlikely(folio-&gt;mapping != mapping)) {</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+			folio_put(folio);</div><div class='ctx'> 			goto repeat;</div><div class='ctx'> 		}</div><div class='del'>-		if (unlikely(!PageUptodate(page))) {</div><div class='add'>+		if (unlikely(!folio_test_uptodate(folio))) {</div><div class='ctx'> 			err = -EIO;</div><div class='del'>-			goto fail;</div><div class='add'>+			goto put_folio;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='add'>+put_folio:</div><div class='add'>+	f2fs_folio_put(folio, true);</div><div class='ctx'> fail:</div><div class='del'>-	f2fs_put_page(page, 1);</div><div class='ctx'> 	f2fs_write_failed(inode, pos + len);</div><div class='del'>-	if (drop_atomic)</div><div class='del'>-		f2fs_drop_inmem_pages_all(sbi, false);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_write_end(struct file *file,</div><div class='add'>+static int f2fs_write_end(const struct kiocb *iocb,</div><div class='ctx'> 			struct address_space *mapping,</div><div class='ctx'> 			loff_t pos, unsigned len, unsigned copied,</div><div class='del'>-			struct page *page, void *fsdata)</div><div class='add'>+			struct folio *folio, void *fsdata)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> </div><div class='ctx'> 	trace_f2fs_write_end(inode, pos, len, copied);</div><div class='ctx'> </div><div class='hunk'>@@ -3561,17 +3675,17 @@ static int f2fs_write_end(struct file *file,</div><div class='ctx'> 	 * should be PAGE_SIZE. Otherwise, we treat it with zero copied and</div><div class='ctx'> 	 * let generic_perform_write() try to copy data again through copied=0.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!PageUptodate(page)) {</div><div class='add'>+	if (!folio_test_uptodate(folio)) {</div><div class='ctx'> 		if (unlikely(copied != len))</div><div class='ctx'> 			copied = 0;</div><div class='ctx'> 		else</div><div class='del'>-			SetPageUptodate(page);</div><div class='add'>+			folio_mark_uptodate(folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='ctx'> 	/* overwrite compressed file */</div><div class='ctx'> 	if (f2fs_compressed_file(inode) &amp;&amp; fsdata) {</div><div class='del'>-		f2fs_compress_write_end(inode, fsdata, page-&gt;index, copied);</div><div class='add'>+		f2fs_compress_write_end(inode, fsdata, folio-&gt;index, copied);</div><div class='ctx'> 		f2fs_update_time(F2FS_I_SB(inode), REQ_TIME);</div><div class='ctx'> </div><div class='ctx'> 		if (pos + copied &gt; i_size_read(inode) &amp;&amp;</div><div class='hunk'>@@ -3584,180 +3698,34 @@ static int f2fs_write_end(struct file *file,</div><div class='ctx'> 	if (!copied)</div><div class='ctx'> 		goto unlock_out;</div><div class='ctx'> </div><div class='del'>-	set_page_dirty(page);</div><div class='add'>+	folio_mark_dirty(folio);</div><div class='add'>+</div><div class='add'>+	if (f2fs_is_atomic_file(inode))</div><div class='add'>+		folio_set_f2fs_atomic(folio);</div><div class='ctx'> </div><div class='ctx'> 	if (pos + copied &gt; i_size_read(inode) &amp;&amp;</div><div class='del'>-	    !f2fs_verity_in_progress(inode))</div><div class='add'>+	    !f2fs_verity_in_progress(inode)) {</div><div class='ctx'> 		f2fs_i_size_write(inode, pos + copied);</div><div class='add'>+		if (f2fs_is_atomic_file(inode))</div><div class='add'>+			f2fs_i_size_write(F2FS_I(inode)-&gt;cow_inode,</div><div class='add'>+					pos + copied);</div><div class='add'>+	}</div><div class='ctx'> unlock_out:</div><div class='del'>-	f2fs_put_page(page, 1);</div><div class='add'>+	f2fs_folio_put(folio, true);</div><div class='ctx'> 	f2fs_update_time(F2FS_I_SB(inode), REQ_TIME);</div><div class='ctx'> 	return copied;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int check_direct_IO(struct inode *inode, struct iov_iter *iter,</div><div class='del'>-			   loff_t offset)</div><div class='del'>-{</div><div class='del'>-	unsigned i_blkbits = READ_ONCE(inode-&gt;i_blkbits);</div><div class='del'>-	unsigned blkbits = i_blkbits;</div><div class='del'>-	unsigned blocksize_mask = (1 &lt;&lt; blkbits) - 1;</div><div class='del'>-	unsigned long align = offset | iov_iter_alignment(iter);</div><div class='del'>-	struct block_device *bdev = inode-&gt;i_sb-&gt;s_bdev;</div><div class='del'>-</div><div class='del'>-	if (iov_iter_rw(iter) == READ &amp;&amp; offset &gt;= i_size_read(inode))</div><div class='del'>-		return 1;</div><div class='del'>-</div><div class='del'>-	if (align &amp; blocksize_mask) {</div><div class='del'>-		if (bdev)</div><div class='del'>-			blkbits = blksize_bits(bdev_logical_block_size(bdev));</div><div class='del'>-		blocksize_mask = (1 &lt;&lt; blkbits) - 1;</div><div class='del'>-		if (align &amp; blocksize_mask)</div><div class='del'>-			return -EINVAL;</div><div class='del'>-		return 1;</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void f2fs_dio_end_io(struct bio *bio)</div><div class='add'>+void f2fs_invalidate_folio(struct folio *folio, size_t offset, size_t length)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_private_dio *dio = bio-&gt;bi_private;</div><div class='del'>-</div><div class='del'>-	dec_page_count(F2FS_I_SB(dio-&gt;inode),</div><div class='del'>-			dio-&gt;write ? F2FS_DIO_WRITE : F2FS_DIO_READ);</div><div class='del'>-</div><div class='del'>-	bio-&gt;bi_private = dio-&gt;orig_private;</div><div class='del'>-	bio-&gt;bi_end_io = dio-&gt;orig_end_io;</div><div class='del'>-</div><div class='del'>-	kfree(dio);</div><div class='del'>-</div><div class='del'>-	bio_endio(bio);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void f2fs_dio_submit_bio(struct bio *bio, struct inode *inode,</div><div class='del'>-							loff_t file_offset)</div><div class='del'>-{</div><div class='del'>-	struct f2fs_private_dio *dio;</div><div class='del'>-	bool write = (bio_op(bio) == REQ_OP_WRITE);</div><div class='del'>-</div><div class='del'>-	dio = f2fs_kzalloc(F2FS_I_SB(inode),</div><div class='del'>-			sizeof(struct f2fs_private_dio), GFP_NOFS);</div><div class='del'>-	if (!dio)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	dio-&gt;inode = inode;</div><div class='del'>-	dio-&gt;orig_end_io = bio-&gt;bi_end_io;</div><div class='del'>-	dio-&gt;orig_private = bio-&gt;bi_private;</div><div class='del'>-	dio-&gt;write = write;</div><div class='del'>-</div><div class='del'>-	bio-&gt;bi_end_io = f2fs_dio_end_io;</div><div class='del'>-	bio-&gt;bi_private = dio;</div><div class='del'>-</div><div class='del'>-	inc_page_count(F2FS_I_SB(inode),</div><div class='del'>-			write ? F2FS_DIO_WRITE : F2FS_DIO_READ);</div><div class='del'>-</div><div class='del'>-	submit_bio(bio);</div><div class='del'>-	return;</div><div class='del'>-out:</div><div class='del'>-	bio-&gt;bi_status = BLK_STS_IOERR;</div><div class='del'>-	bio_endio(bio);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static ssize_t f2fs_direct_IO(struct kiocb *iocb, struct iov_iter *iter)</div><div class='del'>-{</div><div class='del'>-	struct address_space *mapping = iocb-&gt;ki_filp-&gt;f_mapping;</div><div class='del'>-	struct inode *inode = mapping-&gt;host;</div><div class='del'>-	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='del'>-	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='del'>-	size_t count = iov_iter_count(iter);</div><div class='del'>-	loff_t offset = iocb-&gt;ki_pos;</div><div class='del'>-	int rw = iov_iter_rw(iter);</div><div class='del'>-	int err;</div><div class='del'>-	enum rw_hint hint = iocb-&gt;ki_hint;</div><div class='del'>-	int whint_mode = F2FS_OPTION(sbi).whint_mode;</div><div class='del'>-	bool do_opu;</div><div class='del'>-</div><div class='del'>-	err = check_direct_IO(inode, iter, offset);</div><div class='del'>-	if (err)</div><div class='del'>-		return err &lt; 0 ? err : 0;</div><div class='del'>-</div><div class='del'>-	if (f2fs_force_buffered_io(inode, iocb, iter))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	do_opu = rw == WRITE &amp;&amp; f2fs_lfs_mode(sbi);</div><div class='del'>-</div><div class='del'>-	trace_f2fs_direct_IO_enter(inode, offset, count, rw);</div><div class='del'>-</div><div class='del'>-	if (rw == WRITE &amp;&amp; whint_mode == WHINT_MODE_OFF)</div><div class='del'>-		iocb-&gt;ki_hint = WRITE_LIFE_NOT_SET;</div><div class='del'>-</div><div class='del'>-	if (iocb-&gt;ki_flags &amp; IOCB_NOWAIT) {</div><div class='del'>-		if (!down_read_trylock(&amp;fi-&gt;i_gc_rwsem[rw])) {</div><div class='del'>-			iocb-&gt;ki_hint = hint;</div><div class='del'>-			err = -EAGAIN;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		if (do_opu &amp;&amp; !down_read_trylock(&amp;fi-&gt;i_gc_rwsem[READ])) {</div><div class='del'>-			up_read(&amp;fi-&gt;i_gc_rwsem[rw]);</div><div class='del'>-			iocb-&gt;ki_hint = hint;</div><div class='del'>-			err = -EAGAIN;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-		down_read(&amp;fi-&gt;i_gc_rwsem[rw]);</div><div class='del'>-		if (do_opu)</div><div class='del'>-			down_read(&amp;fi-&gt;i_gc_rwsem[READ]);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	err = __blockdev_direct_IO(iocb, inode, inode-&gt;i_sb-&gt;s_bdev,</div><div class='del'>-			iter, rw == WRITE ? get_data_block_dio_write :</div><div class='del'>-			get_data_block_dio, NULL, f2fs_dio_submit_bio,</div><div class='del'>-			rw == WRITE ? DIO_LOCKING | DIO_SKIP_HOLES :</div><div class='del'>-			DIO_SKIP_HOLES);</div><div class='del'>-</div><div class='del'>-	if (do_opu)</div><div class='del'>-		up_read(&amp;fi-&gt;i_gc_rwsem[READ]);</div><div class='del'>-</div><div class='del'>-	up_read(&amp;fi-&gt;i_gc_rwsem[rw]);</div><div class='del'>-</div><div class='del'>-	if (rw == WRITE) {</div><div class='del'>-		if (whint_mode == WHINT_MODE_OFF)</div><div class='del'>-			iocb-&gt;ki_hint = hint;</div><div class='del'>-		if (err &gt; 0) {</div><div class='del'>-			f2fs_update_iostat(F2FS_I_SB(inode), APP_DIRECT_IO,</div><div class='del'>-									err);</div><div class='del'>-			if (!do_opu)</div><div class='del'>-				set_inode_flag(inode, FI_UPDATE_WRITE);</div><div class='del'>-		} else if (err == -EIOCBQUEUED) {</div><div class='del'>-			f2fs_update_iostat(F2FS_I_SB(inode), APP_DIRECT_IO,</div><div class='del'>-						count - iov_iter_count(iter));</div><div class='del'>-		} else if (err &lt; 0) {</div><div class='del'>-			f2fs_write_failed(inode, offset + count);</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-		if (err &gt; 0)</div><div class='del'>-			f2fs_update_iostat(sbi, APP_DIRECT_READ_IO, err);</div><div class='del'>-		else if (err == -EIOCBQUEUED)</div><div class='del'>-			f2fs_update_iostat(F2FS_I_SB(inode), APP_DIRECT_READ_IO,</div><div class='del'>-						count - iov_iter_count(iter));</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	trace_f2fs_direct_IO_exit(inode, offset, count, rw, err);</div><div class='del'>-</div><div class='del'>-	return err;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void f2fs_invalidate_page(struct page *page, unsigned int offset,</div><div class='del'>-							unsigned int length)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (inode-&gt;i_ino &gt;= F2FS_ROOT_INO(sbi) &amp;&amp;</div><div class='del'>-		(offset % PAGE_SIZE || length != PAGE_SIZE))</div><div class='add'>+				(offset || length != folio_size(folio)))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	if (PageDirty(page)) {</div><div class='add'>+	if (folio_test_dirty(folio)) {</div><div class='ctx'> 		if (inode-&gt;i_ino == F2FS_META_INO(sbi)) {</div><div class='ctx'> 			dec_page_count(sbi, F2FS_DIRTY_META);</div><div class='ctx'> 		} else if (inode-&gt;i_ino == F2FS_NODE_INO(sbi)) {</div><div class='hunk'>@@ -3767,79 +3735,35 @@ void f2fs_invalidate_page(struct page *page, unsigned int offset,</div><div class='ctx'> 			f2fs_remove_dirty_inode(inode);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	clear_page_private_gcing(page);</div><div class='del'>-</div><div class='del'>-	if (test_opt(sbi, COMPRESS_CACHE)) {</div><div class='del'>-		if (f2fs_compressed_file(inode))</div><div class='del'>-			f2fs_invalidate_compress_pages(sbi, inode-&gt;i_ino);</div><div class='del'>-		if (inode-&gt;i_ino == F2FS_COMPRESS_INO(sbi))</div><div class='del'>-			clear_page_private_data(page);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (page_private_atomic(page))</div><div class='del'>-		return f2fs_drop_inmem_page(inode, page);</div><div class='del'>-</div><div class='del'>-	detach_page_private(page);</div><div class='del'>-	set_page_private(page, 0);</div><div class='add'>+	folio_detach_private(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int f2fs_release_page(struct page *page, gfp_t wait)</div><div class='add'>+bool f2fs_release_folio(struct folio *folio, gfp_t wait)</div><div class='ctx'> {</div><div class='del'>-	/* If this is dirty page, keep PagePrivate */</div><div class='del'>-	if (PageDirty(page))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	/* This is atomic written page, keep Private */</div><div class='del'>-	if (page_private_atomic(page))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	if (test_opt(F2FS_P_SB(page), COMPRESS_CACHE)) {</div><div class='del'>-		struct f2fs_sb_info *sbi = F2FS_P_SB(page);</div><div class='del'>-		struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-</div><div class='del'>-		if (f2fs_compressed_file(inode))</div><div class='del'>-			f2fs_invalidate_compress_pages(sbi, inode-&gt;i_ino);</div><div class='del'>-		if (inode-&gt;i_ino == F2FS_COMPRESS_INO(sbi))</div><div class='del'>-			clear_page_private_data(page);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	clear_page_private_gcing(page);</div><div class='add'>+	/* If this is dirty folio, keep private data */</div><div class='add'>+	if (folio_test_dirty(folio))</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-	detach_page_private(page);</div><div class='del'>-	set_page_private(page, 0);</div><div class='del'>-	return 1;</div><div class='add'>+	folio_detach_private(folio);</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_set_data_page_dirty(struct page *page)</div><div class='add'>+static bool f2fs_dirty_data_folio(struct address_space *mapping,</div><div class='add'>+		struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page_file_mapping(page)-&gt;host;</div><div class='del'>-</div><div class='del'>-	trace_f2fs_set_page_dirty(page, DATA);</div><div class='add'>+	struct inode *inode = mapping-&gt;host;</div><div class='ctx'> </div><div class='del'>-	if (!PageUptodate(page))</div><div class='del'>-		SetPageUptodate(page);</div><div class='del'>-	if (PageSwapCache(page))</div><div class='del'>-		return __set_page_dirty_nobuffers(page);</div><div class='add'>+	trace_f2fs_set_page_dirty(folio, DATA);</div><div class='ctx'> </div><div class='del'>-	if (f2fs_is_atomic_file(inode) &amp;&amp; !f2fs_is_commit_atomic_write(inode)) {</div><div class='del'>-		if (!page_private_atomic(page)) {</div><div class='del'>-			f2fs_register_inmem_page(inode, page);</div><div class='del'>-			return 1;</div><div class='del'>-		}</div><div class='del'>-		/*</div><div class='del'>-		 * Previously, this page has been registered, we just</div><div class='del'>-		 * return here.</div><div class='del'>-		 */</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='add'>+	if (!folio_test_uptodate(folio))</div><div class='add'>+		folio_mark_uptodate(folio);</div><div class='add'>+	BUG_ON(folio_test_swapcache(folio));</div><div class='ctx'> </div><div class='del'>-	if (!PageDirty(page)) {</div><div class='del'>-		__set_page_dirty_nobuffers(page);</div><div class='del'>-		f2fs_update_dirty_page(inode, page);</div><div class='del'>-		return 1;</div><div class='add'>+	if (filemap_dirty_folio(mapping, folio)) {</div><div class='add'>+		f2fs_update_dirty_folio(inode, folio);</div><div class='add'>+		return true;</div><div class='ctx'> 	}</div><div class='del'>-	return 0;</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> </div><div class='hunk'>@@ -3899,7 +3823,7 @@ static sector_t f2fs_bmap(struct address_space *mapping, sector_t block)</div><div class='ctx'> 		map.m_next_pgofs = NULL;</div><div class='ctx'> 		map.m_seg_type = NO_CHECK_TYPE;</div><div class='ctx'> </div><div class='del'>-		if (!f2fs_map_blocks(inode, &amp;map, 0, F2FS_GET_BLOCK_BMAP))</div><div class='add'>+		if (!f2fs_map_blocks(inode, &amp;map, F2FS_GET_BLOCK_BMAP))</div><div class='ctx'> 			blknr = map.m_pblk;</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='hunk'>@@ -3907,70 +3831,6 @@ out:</div><div class='ctx'> 	return blknr;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_MIGRATION</div><div class='del'>-#include &lt;linux/migrate.h&gt;</div><div class='del'>-</div><div class='del'>-int f2fs_migrate_page(struct address_space *mapping,</div><div class='del'>-		struct page *newpage, struct page *page, enum migrate_mode mode)</div><div class='del'>-{</div><div class='del'>-	int rc, extra_count;</div><div class='del'>-	struct f2fs_inode_info *fi = F2FS_I(mapping-&gt;host);</div><div class='del'>-	bool atomic_written = page_private_atomic(page);</div><div class='del'>-</div><div class='del'>-	BUG_ON(PageWriteback(page));</div><div class='del'>-</div><div class='del'>-	/* migrating an atomic written page is safe with the inmem_lock hold */</div><div class='del'>-	if (atomic_written) {</div><div class='del'>-		if (mode != MIGRATE_SYNC)</div><div class='del'>-			return -EBUSY;</div><div class='del'>-		if (!mutex_trylock(&amp;fi-&gt;inmem_lock))</div><div class='del'>-			return -EAGAIN;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* one extra reference was held for atomic_write page */</div><div class='del'>-	extra_count = atomic_written ? 1 : 0;</div><div class='del'>-	rc = migrate_page_move_mapping(mapping, newpage,</div><div class='del'>-				page, extra_count);</div><div class='del'>-	if (rc != MIGRATEPAGE_SUCCESS) {</div><div class='del'>-		if (atomic_written)</div><div class='del'>-			mutex_unlock(&amp;fi-&gt;inmem_lock);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (atomic_written) {</div><div class='del'>-		struct inmem_pages *cur;</div><div class='del'>-</div><div class='del'>-		list_for_each_entry(cur, &amp;fi-&gt;inmem_pages, list)</div><div class='del'>-			if (cur-&gt;page == page) {</div><div class='del'>-				cur-&gt;page = newpage;</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-		mutex_unlock(&amp;fi-&gt;inmem_lock);</div><div class='del'>-		put_page(page);</div><div class='del'>-		get_page(newpage);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* guarantee to start from no stale private field */</div><div class='del'>-	set_page_private(newpage, 0);</div><div class='del'>-	if (PagePrivate(page)) {</div><div class='del'>-		set_page_private(newpage, page_private(page));</div><div class='del'>-		SetPagePrivate(newpage);</div><div class='del'>-		get_page(newpage);</div><div class='del'>-</div><div class='del'>-		set_page_private(page, 0);</div><div class='del'>-		ClearPagePrivate(page);</div><div class='del'>-		put_page(page);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (mode != MIGRATE_SYNC_NO_COPY)</div><div class='del'>-		migrate_page_copy(newpage, page);</div><div class='del'>-	else</div><div class='del'>-		migrate_page_states(newpage, page);</div><div class='del'>-</div><div class='del'>-	return MIGRATEPAGE_SUCCESS;</div><div class='del'>-}</div><div class='del'>-#endif</div><div class='del'>-</div><div class='ctx'> #ifdef CONFIG_SWAP</div><div class='ctx'> static int f2fs_migrate_blocks(struct inode *inode, block_t start_blk,</div><div class='ctx'> 							unsigned int blkcnt)</div><div class='hunk'>@@ -3978,55 +3838,67 @@ static int f2fs_migrate_blocks(struct inode *inode, block_t start_blk,</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	unsigned int blkofs;</div><div class='ctx'> 	unsigned int blk_per_sec = BLKS_PER_SEC(sbi);</div><div class='add'>+	unsigned int end_blk = start_blk + blkcnt - 1;</div><div class='ctx'> 	unsigned int secidx = start_blk / blk_per_sec;</div><div class='del'>-	unsigned int end_sec = secidx + blkcnt / blk_per_sec;</div><div class='add'>+	unsigned int end_sec;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+	if (!blkcnt)</div><div class='add'>+		return 0;</div><div class='add'>+	end_sec = end_blk / blk_per_sec;</div><div class='add'>+</div><div class='add'>+	f2fs_down_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> 	filemap_invalidate_lock(inode-&gt;i_mapping);</div><div class='ctx'> </div><div class='ctx'> 	set_inode_flag(inode, FI_ALIGNED_WRITE);</div><div class='add'>+	set_inode_flag(inode, FI_OPU_WRITE);</div><div class='ctx'> </div><div class='del'>-	for (; secidx &lt; end_sec; secidx++) {</div><div class='del'>-		down_write(&amp;sbi-&gt;pin_sem);</div><div class='add'>+	for (; secidx &lt;= end_sec; secidx++) {</div><div class='add'>+		unsigned int blkofs_end = secidx == end_sec ?</div><div class='add'>+				end_blk % blk_per_sec : blk_per_sec - 1;</div><div class='ctx'> </div><div class='del'>-		f2fs_lock_op(sbi);</div><div class='del'>-		f2fs_allocate_new_section(sbi, CURSEG_COLD_DATA_PINNED, false);</div><div class='del'>-		f2fs_unlock_op(sbi);</div><div class='add'>+		f2fs_down_write(&amp;sbi-&gt;pin_sem);</div><div class='ctx'> </div><div class='del'>-		set_inode_flag(inode, FI_DO_DEFRAG);</div><div class='add'>+		ret = f2fs_allocate_pinning_section(sbi);</div><div class='add'>+		if (ret) {</div><div class='add'>+			f2fs_up_write(&amp;sbi-&gt;pin_sem);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		set_inode_flag(inode, FI_SKIP_WRITES);</div><div class='ctx'> </div><div class='del'>-		for (blkofs = 0; blkofs &lt; blk_per_sec; blkofs++) {</div><div class='del'>-			struct page *page;</div><div class='add'>+		for (blkofs = 0; blkofs &lt;= blkofs_end; blkofs++) {</div><div class='add'>+			struct folio *folio;</div><div class='ctx'> 			unsigned int blkidx = secidx * blk_per_sec + blkofs;</div><div class='ctx'> </div><div class='del'>-			page = f2fs_get_lock_data_page(inode, blkidx, true);</div><div class='del'>-			if (IS_ERR(page)) {</div><div class='del'>-				up_write(&amp;sbi-&gt;pin_sem);</div><div class='del'>-				ret = PTR_ERR(page);</div><div class='add'>+			folio = f2fs_get_lock_data_folio(inode, blkidx, true);</div><div class='add'>+			if (IS_ERR(folio)) {</div><div class='add'>+				f2fs_up_write(&amp;sbi-&gt;pin_sem);</div><div class='add'>+				ret = PTR_ERR(folio);</div><div class='ctx'> 				goto done;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			set_page_dirty(page);</div><div class='del'>-			f2fs_put_page(page, 1);</div><div class='add'>+			folio_mark_dirty(folio);</div><div class='add'>+			f2fs_folio_put(folio, true);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		clear_inode_flag(inode, FI_DO_DEFRAG);</div><div class='add'>+		clear_inode_flag(inode, FI_SKIP_WRITES);</div><div class='ctx'> </div><div class='ctx'> 		ret = filemap_fdatawrite(inode-&gt;i_mapping);</div><div class='ctx'> </div><div class='del'>-		up_write(&amp;sbi-&gt;pin_sem);</div><div class='add'>+		f2fs_up_write(&amp;sbi-&gt;pin_sem);</div><div class='ctx'> </div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> done:</div><div class='del'>-	clear_inode_flag(inode, FI_DO_DEFRAG);</div><div class='add'>+	clear_inode_flag(inode, FI_SKIP_WRITES);</div><div class='add'>+	clear_inode_flag(inode, FI_OPU_WRITE);</div><div class='ctx'> 	clear_inode_flag(inode, FI_ALIGNED_WRITE);</div><div class='ctx'> </div><div class='ctx'> 	filemap_invalidate_unlock(inode-&gt;i_mapping);</div><div class='del'>-	up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+	f2fs_up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -4037,15 +3909,14 @@ static int check_swap_activate(struct swap_info_struct *sis,</div><div class='ctx'> 	struct address_space *mapping = swap_file-&gt;f_mapping;</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='del'>-	sector_t cur_lblock;</div><div class='del'>-	sector_t last_lblock;</div><div class='del'>-	sector_t pblock;</div><div class='del'>-	sector_t lowest_pblock = -1;</div><div class='del'>-	sector_t highest_pblock = 0;</div><div class='add'>+	block_t cur_lblock;</div><div class='add'>+	block_t last_lblock;</div><div class='add'>+	block_t pblock;</div><div class='add'>+	block_t lowest_pblock = -1;</div><div class='add'>+	block_t highest_pblock = 0;</div><div class='ctx'> 	int nr_extents = 0;</div><div class='del'>-	unsigned long nr_pblocks;</div><div class='add'>+	unsigned int nr_pblocks;</div><div class='ctx'> 	unsigned int blks_per_sec = BLKS_PER_SEC(sbi);</div><div class='del'>-	unsigned int sec_blks_mask = BLKS_PER_SEC(sbi) - 1;</div><div class='ctx'> 	unsigned int not_aligned = 0;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -4054,7 +3925,7 @@ static int check_swap_activate(struct swap_info_struct *sis,</div><div class='ctx'> 	 * to be very smart.</div><div class='ctx'> 	 */</div><div class='ctx'> 	cur_lblock = 0;</div><div class='del'>-	last_lblock = bytes_to_blks(inode, i_size_read(inode));</div><div class='add'>+	last_lblock = F2FS_BYTES_TO_BLK(i_size_read(inode));</div><div class='ctx'> </div><div class='ctx'> 	while (cur_lblock &lt; last_lblock &amp;&amp; cur_lblock &lt; sis-&gt;max) {</div><div class='ctx'> 		struct f2fs_map_blocks map;</div><div class='hunk'>@@ -4069,7 +3940,7 @@ retry:</div><div class='ctx'> 		map.m_seg_type = NO_CHECK_TYPE;</div><div class='ctx'> 		map.m_may_create = false;</div><div class='ctx'> </div><div class='del'>-		ret = f2fs_map_blocks(inode, &amp;map, 0, F2FS_GET_BLOCK_FIEMAP);</div><div class='add'>+		ret = f2fs_map_blocks(inode, &amp;map, F2FS_GET_BLOCK_FIEMAP);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -4083,28 +3954,35 @@ retry:</div><div class='ctx'> 		pblock = map.m_pblk;</div><div class='ctx'> 		nr_pblocks = map.m_len;</div><div class='ctx'> </div><div class='del'>-		if ((pblock - SM_I(sbi)-&gt;main_blkaddr) &amp; sec_blks_mask ||</div><div class='del'>-				nr_pblocks &amp; sec_blks_mask) {</div><div class='add'>+		if ((pblock - SM_I(sbi)-&gt;main_blkaddr) % blks_per_sec ||</div><div class='add'>+				nr_pblocks % blks_per_sec ||</div><div class='add'>+				f2fs_is_sequential_zone_area(sbi, pblock)) {</div><div class='add'>+			bool last_extent = false;</div><div class='add'>+</div><div class='ctx'> 			not_aligned++;</div><div class='ctx'> </div><div class='ctx'> 			nr_pblocks = roundup(nr_pblocks, blks_per_sec);</div><div class='ctx'> 			if (cur_lblock + nr_pblocks &gt; sis-&gt;max)</div><div class='ctx'> 				nr_pblocks -= blks_per_sec;</div><div class='ctx'> </div><div class='add'>+			/* this extent is last one */</div><div class='ctx'> 			if (!nr_pblocks) {</div><div class='del'>-				/* this extent is last one */</div><div class='del'>-				nr_pblocks = map.m_len;</div><div class='del'>-				f2fs_warn(sbi, "Swapfile: last extent is not aligned to section");</div><div class='del'>-				goto next;</div><div class='add'>+				nr_pblocks = last_lblock - cur_lblock;</div><div class='add'>+				last_extent = true;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			ret = f2fs_migrate_blocks(inode, cur_lblock,</div><div class='ctx'> 							nr_pblocks);</div><div class='del'>-			if (ret)</div><div class='add'>+			if (ret) {</div><div class='add'>+				if (ret == -ENOENT)</div><div class='add'>+					ret = -EINVAL;</div><div class='ctx'> 				goto out;</div><div class='del'>-			goto retry;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			if (!last_extent)</div><div class='add'>+				goto retry;</div><div class='ctx'> 		}</div><div class='del'>-next:</div><div class='add'>+</div><div class='ctx'> 		if (cur_lblock + nr_pblocks &gt;= sis-&gt;max)</div><div class='ctx'> 			nr_pblocks = sis-&gt;max - cur_lblock;</div><div class='ctx'> </div><div class='hunk'>@@ -4130,10 +4008,9 @@ next:</div><div class='ctx'> 		cur_lblock = 1;	/* force Empty message */</div><div class='ctx'> 	sis-&gt;max = cur_lblock;</div><div class='ctx'> 	sis-&gt;pages = cur_lblock - 1;</div><div class='del'>-	sis-&gt;highest_bit = cur_lblock - 1;</div><div class='ctx'> out:</div><div class='ctx'> 	if (not_aligned)</div><div class='del'>-		f2fs_warn(sbi, "Swapfile (%u) is not align to section: 1) creat(), 2) ioctl(F2FS_IOC_SET_PIN_FILE), 3) fallocate(%u * N)",</div><div class='add'>+		f2fs_warn(sbi, "Swapfile (%u) is not align to section: 1) creat(), 2) ioctl(F2FS_IOC_SET_PIN_FILE), 3) fallocate(%lu * N)",</div><div class='ctx'> 			  not_aligned, blks_per_sec * F2FS_BLKSIZE);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -4142,17 +4019,17 @@ static int f2fs_swap_activate(struct swap_info_struct *sis, struct file *file,</div><div class='ctx'> 				sector_t *span)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!S_ISREG(inode-&gt;i_mode))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	if (f2fs_readonly(F2FS_I_SB(inode)-&gt;sb))</div><div class='add'>+	if (f2fs_readonly(sbi-&gt;sb))</div><div class='ctx'> 		return -EROFS;</div><div class='ctx'> </div><div class='del'>-	if (f2fs_lfs_mode(F2FS_I_SB(inode))) {</div><div class='del'>-		f2fs_err(F2FS_I_SB(inode),</div><div class='del'>-			"Swapfile not supported in LFS mode");</div><div class='add'>+	if (f2fs_lfs_mode(sbi) &amp;&amp; !f2fs_sb_has_blkzoned(sbi)) {</div><div class='add'>+		f2fs_err(sbi, "Swapfile not supported in LFS mode");</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -4163,14 +4040,19 @@ static int f2fs_swap_activate(struct swap_info_struct *sis, struct file *file,</div><div class='ctx'> 	if (!f2fs_disable_compressed_file(inode))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='add'>+	ret = filemap_fdatawrite(inode-&gt;i_mapping);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='ctx'> 	f2fs_precache_extents(inode);</div><div class='ctx'> </div><div class='ctx'> 	ret = check_swap_activate(sis, file, span);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='add'>+	stat_inc_swapfile_inode(inode);</div><div class='ctx'> 	set_inode_flag(inode, FI_PIN_FILE);</div><div class='del'>-	f2fs_update_time(F2FS_I_SB(inode), REQ_TIME);</div><div class='add'>+	f2fs_update_time(sbi, REQ_TIME);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -4178,6 +4060,7 @@ static void f2fs_swap_deactivate(struct file *file)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='ctx'> </div><div class='add'>+	stat_dec_swapfile_inode(inode);</div><div class='ctx'> 	clear_inode_flag(inode, FI_PIN_FILE);</div><div class='ctx'> }</div><div class='ctx'> #else</div><div class='hunk'>@@ -4193,31 +4076,27 @@ static void f2fs_swap_deactivate(struct file *file)</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations f2fs_dblock_aops = {</div><div class='del'>-	.readpage	= f2fs_read_data_page,</div><div class='add'>+	.read_folio	= f2fs_read_data_folio,</div><div class='ctx'> 	.readahead	= f2fs_readahead,</div><div class='del'>-	.writepage	= f2fs_write_data_page,</div><div class='ctx'> 	.writepages	= f2fs_write_data_pages,</div><div class='ctx'> 	.write_begin	= f2fs_write_begin,</div><div class='ctx'> 	.write_end	= f2fs_write_end,</div><div class='del'>-	.set_page_dirty	= f2fs_set_data_page_dirty,</div><div class='del'>-	.invalidatepage	= f2fs_invalidate_page,</div><div class='del'>-	.releasepage	= f2fs_release_page,</div><div class='del'>-	.direct_IO	= f2fs_direct_IO,</div><div class='add'>+	.dirty_folio	= f2fs_dirty_data_folio,</div><div class='add'>+	.migrate_folio	= filemap_migrate_folio,</div><div class='add'>+	.invalidate_folio = f2fs_invalidate_folio,</div><div class='add'>+	.release_folio	= f2fs_release_folio,</div><div class='ctx'> 	.bmap		= f2fs_bmap,</div><div class='ctx'> 	.swap_activate  = f2fs_swap_activate,</div><div class='ctx'> 	.swap_deactivate = f2fs_swap_deactivate,</div><div class='del'>-#ifdef CONFIG_MIGRATION</div><div class='del'>-	.migratepage    = f2fs_migrate_page,</div><div class='del'>-#endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-void f2fs_clear_page_cache_dirty_tag(struct page *page)</div><div class='add'>+void f2fs_clear_page_cache_dirty_tag(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *mapping = page_mapping(page);</div><div class='add'>+	struct address_space *mapping = folio-&gt;mapping;</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> </div><div class='ctx'> 	xa_lock_irqsave(&amp;mapping-&gt;i_pages, flags);</div><div class='del'>-	__xa_clear_mark(&amp;mapping-&gt;i_pages, page_index(page),</div><div class='add'>+	__xa_clear_mark(&amp;mapping-&gt;i_pages, folio-&gt;index,</div><div class='ctx'> 						PAGECACHE_TAG_DIRTY);</div><div class='ctx'> 	xa_unlock_irqrestore(&amp;mapping-&gt;i_pages, flags);</div><div class='ctx'> }</div><div class='hunk'>@@ -4258,9 +4137,7 @@ int f2fs_init_post_read_wq(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	sbi-&gt;post_read_wq = alloc_workqueue("f2fs_post_read_wq",</div><div class='ctx'> 						 WQ_UNBOUND | WQ_HIGHPRI,</div><div class='ctx'> 						 num_online_cpus());</div><div class='del'>-	if (!sbi-&gt;post_read_wq)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	return 0;</div><div class='add'>+	return sbi-&gt;post_read_wq ? 0 : -ENOMEM;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_destroy_post_read_wq(struct f2fs_sb_info *sbi)</div><div class='hunk'>@@ -4273,12 +4150,98 @@ int __init f2fs_init_bio_entry_cache(void)</div><div class='ctx'> {</div><div class='ctx'> 	bio_entry_slab = f2fs_kmem_cache_create("f2fs_bio_entry_slab",</div><div class='ctx'> 			sizeof(struct bio_entry));</div><div class='del'>-	if (!bio_entry_slab)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	return 0;</div><div class='add'>+	return bio_entry_slab ? 0 : -ENOMEM;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_destroy_bio_entry_cache(void)</div><div class='ctx'> {</div><div class='ctx'> 	kmem_cache_destroy(bio_entry_slab);</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+static int f2fs_iomap_begin(struct inode *inode, loff_t offset, loff_t length,</div><div class='add'>+			    unsigned int flags, struct iomap *iomap,</div><div class='add'>+			    struct iomap *srcmap)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_map_blocks map = { NULL, };</div><div class='add'>+	pgoff_t next_pgofs = 0;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	map.m_lblk = F2FS_BYTES_TO_BLK(offset);</div><div class='add'>+	map.m_len = F2FS_BYTES_TO_BLK(offset + length - 1) - map.m_lblk + 1;</div><div class='add'>+	map.m_next_pgofs = &amp;next_pgofs;</div><div class='add'>+	map.m_seg_type = f2fs_rw_hint_to_seg_type(F2FS_I_SB(inode),</div><div class='add'>+						inode-&gt;i_write_hint);</div><div class='add'>+	if (flags &amp; IOMAP_WRITE &amp;&amp; iomap-&gt;private) {</div><div class='add'>+		map.m_last_pblk = (unsigned long)iomap-&gt;private;</div><div class='add'>+		iomap-&gt;private = NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If the blocks being overwritten are already allocated,</div><div class='add'>+	 * f2fs_map_lock and f2fs_balance_fs are not necessary.</div><div class='add'>+	 */</div><div class='add'>+	if ((flags &amp; IOMAP_WRITE) &amp;&amp;</div><div class='add'>+		!f2fs_overwrite_io(inode, offset, length))</div><div class='add'>+		map.m_may_create = true;</div><div class='add'>+</div><div class='add'>+	err = f2fs_map_blocks(inode, &amp;map, F2FS_GET_BLOCK_DIO);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	iomap-&gt;offset = F2FS_BLK_TO_BYTES(map.m_lblk);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * When inline encryption is enabled, sometimes I/O to an encrypted file</div><div class='add'>+	 * has to be broken up to guarantee DUN contiguity.  Handle this by</div><div class='add'>+	 * limiting the length of the mapping returned.</div><div class='add'>+	 */</div><div class='add'>+	map.m_len = fscrypt_limit_io_blocks(inode, map.m_lblk, map.m_len);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We should never see delalloc or compressed extents here based on</div><div class='add'>+	 * prior flushing and checks.</div><div class='add'>+	 */</div><div class='add'>+	if (WARN_ON_ONCE(map.m_pblk == COMPRESS_ADDR))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	if (map.m_flags &amp; F2FS_MAP_MAPPED) {</div><div class='add'>+		if (WARN_ON_ONCE(map.m_pblk == NEW_ADDR))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+</div><div class='add'>+		iomap-&gt;length = F2FS_BLK_TO_BYTES(map.m_len);</div><div class='add'>+		iomap-&gt;type = IOMAP_MAPPED;</div><div class='add'>+		iomap-&gt;flags |= IOMAP_F_MERGED;</div><div class='add'>+		iomap-&gt;bdev = map.m_bdev;</div><div class='add'>+		iomap-&gt;addr = F2FS_BLK_TO_BYTES(map.m_pblk);</div><div class='add'>+</div><div class='add'>+		if (flags &amp; IOMAP_WRITE &amp;&amp; map.m_last_pblk)</div><div class='add'>+			iomap-&gt;private = (void *)map.m_last_pblk;</div><div class='add'>+	} else {</div><div class='add'>+		if (flags &amp; IOMAP_WRITE)</div><div class='add'>+			return -ENOTBLK;</div><div class='add'>+</div><div class='add'>+		if (map.m_pblk == NULL_ADDR) {</div><div class='add'>+			iomap-&gt;length = F2FS_BLK_TO_BYTES(next_pgofs) -</div><div class='add'>+							iomap-&gt;offset;</div><div class='add'>+			iomap-&gt;type = IOMAP_HOLE;</div><div class='add'>+		} else if (map.m_pblk == NEW_ADDR) {</div><div class='add'>+			iomap-&gt;length = F2FS_BLK_TO_BYTES(map.m_len);</div><div class='add'>+			iomap-&gt;type = IOMAP_UNWRITTEN;</div><div class='add'>+		} else {</div><div class='add'>+			f2fs_bug_on(F2FS_I_SB(inode), 1);</div><div class='add'>+		}</div><div class='add'>+		iomap-&gt;addr = IOMAP_NULL_ADDR;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (map.m_flags &amp; F2FS_MAP_NEW)</div><div class='add'>+		iomap-&gt;flags |= IOMAP_F_NEW;</div><div class='add'>+	if ((inode_state_read_once(inode) &amp; I_DIRTY_DATASYNC) ||</div><div class='add'>+	    offset + length &gt; i_size_read(inode))</div><div class='add'>+		iomap-&gt;flags |= IOMAP_F_DIRTY;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+const struct iomap_ops f2fs_iomap_ops = {</div><div class='add'>+	.iomap_begin	= f2fs_iomap_begin,</div><div class='add'>+};</div><div class='head'>diff --git a/fs/f2fs/debug.c b/fs/f2fs/debug.c<br/>index 8c50518475a9..032683835569 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/debug.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/debug.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/debug.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/debug.c</a></div><div class='hunk'>@@ -21,7 +21,7 @@</div><div class='ctx'> #include "gc.h"</div><div class='ctx'> </div><div class='ctx'> static LIST_HEAD(f2fs_stat_list);</div><div class='del'>-static DEFINE_MUTEX(f2fs_stat_mutex);</div><div class='add'>+static DEFINE_SPINLOCK(f2fs_stat_lock);</div><div class='ctx'> #ifdef CONFIG_DEBUG_FS</div><div class='ctx'> static struct dentry *f2fs_debugfs_root;</div><div class='ctx'> #endif</div><div class='hunk'>@@ -39,9 +39,9 @@ void f2fs_update_sit_info(struct f2fs_sb_info *sbi)</div><div class='ctx'> </div><div class='ctx'> 	bimodal = 0;</div><div class='ctx'> 	total_vblocks = 0;</div><div class='del'>-	blks_per_sec = BLKS_PER_SEC(sbi);</div><div class='add'>+	blks_per_sec = CAP_BLKS_PER_SEC(sbi);</div><div class='ctx'> 	hblks_per_sec = blks_per_sec / 2;</div><div class='del'>-	for (segno = 0; segno &lt; MAIN_SEGS(sbi); segno += sbi-&gt;segs_per_sec) {</div><div class='add'>+	for (segno = 0; segno &lt; MAIN_SEGS(sbi); segno += SEGS_PER_SEC(sbi)) {</div><div class='ctx'> 		vblocks = get_valid_blocks(sbi, segno, true);</div><div class='ctx'> 		dist = abs(vblocks - hblks_per_sec);</div><div class='ctx'> 		bimodal += dist * dist;</div><div class='hunk'>@@ -60,6 +60,70 @@ void f2fs_update_sit_info(struct f2fs_sb_info *sbi)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_DEBUG_FS</div><div class='add'>+static void update_multidevice_stats(struct f2fs_sb_info *sbi)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_stat_info *si = F2FS_STAT(sbi);</div><div class='add'>+	struct f2fs_dev_stats *dev_stats = si-&gt;dev_stats;</div><div class='add'>+	int i, j;</div><div class='add'>+</div><div class='add'>+	if (!f2fs_is_multi_device(sbi))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	memset(dev_stats, 0, sizeof(struct f2fs_dev_stats) * sbi-&gt;s_ndevs);</div><div class='add'>+	for (i = 0; i &lt; sbi-&gt;s_ndevs; i++) {</div><div class='add'>+		unsigned int start_segno, end_segno;</div><div class='add'>+		block_t start_blk, end_blk;</div><div class='add'>+</div><div class='add'>+		if (i == 0) {</div><div class='add'>+			start_blk = MAIN_BLKADDR(sbi);</div><div class='add'>+			end_blk = FDEV(i).end_blk + 1 - SEG0_BLKADDR(sbi);</div><div class='add'>+		} else {</div><div class='add'>+			start_blk = FDEV(i).start_blk;</div><div class='add'>+			end_blk = FDEV(i).end_blk + 1;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		start_segno = GET_SEGNO(sbi, start_blk);</div><div class='add'>+		end_segno = GET_SEGNO(sbi, end_blk);</div><div class='add'>+</div><div class='add'>+		for (j = start_segno; j &lt; end_segno; j++) {</div><div class='add'>+			unsigned int seg_blks, sec_blks;</div><div class='add'>+</div><div class='add'>+			seg_blks = get_seg_entry(sbi, j)-&gt;valid_blocks;</div><div class='add'>+</div><div class='add'>+			/* update segment stats */</div><div class='add'>+			if (is_curseg(sbi, j))</div><div class='add'>+				dev_stats[i].devstats[0][DEVSTAT_INUSE]++;</div><div class='add'>+			else if (seg_blks == BLKS_PER_SEG(sbi))</div><div class='add'>+				dev_stats[i].devstats[0][DEVSTAT_FULL]++;</div><div class='add'>+			else if (seg_blks != 0)</div><div class='add'>+				dev_stats[i].devstats[0][DEVSTAT_DIRTY]++;</div><div class='add'>+			else if (!test_bit(j, FREE_I(sbi)-&gt;free_segmap))</div><div class='add'>+				dev_stats[i].devstats[0][DEVSTAT_FREE]++;</div><div class='add'>+			else</div><div class='add'>+				dev_stats[i].devstats[0][DEVSTAT_PREFREE]++;</div><div class='add'>+</div><div class='add'>+			if (!__is_large_section(sbi) ||</div><div class='add'>+				(j % SEGS_PER_SEC(sbi)) != 0)</div><div class='add'>+				continue;</div><div class='add'>+</div><div class='add'>+			sec_blks = get_sec_entry(sbi, j)-&gt;valid_blocks;</div><div class='add'>+</div><div class='add'>+			/* update section stats */</div><div class='add'>+			if (is_cursec(sbi, GET_SEC_FROM_SEG(sbi, j)))</div><div class='add'>+				dev_stats[i].devstats[1][DEVSTAT_INUSE]++;</div><div class='add'>+			else if (sec_blks == BLKS_PER_SEC(sbi))</div><div class='add'>+				dev_stats[i].devstats[1][DEVSTAT_FULL]++;</div><div class='add'>+			else if (sec_blks != 0)</div><div class='add'>+				dev_stats[i].devstats[1][DEVSTAT_DIRTY]++;</div><div class='add'>+			else if (!test_bit(GET_SEC_FROM_SEG(sbi, j),</div><div class='add'>+					FREE_I(sbi)-&gt;free_secmap))</div><div class='add'>+				dev_stats[i].devstats[1][DEVSTAT_FREE]++;</div><div class='add'>+			else</div><div class='add'>+				dev_stats[i].devstats[1][DEVSTAT_PREFREE]++;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void update_general_status(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_stat_info *si = F2FS_STAT(sbi);</div><div class='hunk'>@@ -72,15 +136,26 @@ static void update_general_status(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	si-&gt;main_area_zones = si-&gt;main_area_sections /</div><div class='ctx'> 				le32_to_cpu(raw_super-&gt;secs_per_zone);</div><div class='ctx'> </div><div class='del'>-	/* validation check of the segment numbers */</div><div class='add'>+	/* general extent cache stats */</div><div class='add'>+	for (i = 0; i &lt; NR_EXTENT_CACHES; i++) {</div><div class='add'>+		struct extent_tree_info *eti = &amp;sbi-&gt;extent_tree[i];</div><div class='add'>+</div><div class='add'>+		si-&gt;hit_cached[i] = atomic64_read(&amp;sbi-&gt;read_hit_cached[i]);</div><div class='add'>+		si-&gt;hit_rbtree[i] = atomic64_read(&amp;sbi-&gt;read_hit_rbtree[i]);</div><div class='add'>+		si-&gt;total_ext[i] = atomic64_read(&amp;sbi-&gt;total_hit_ext[i]);</div><div class='add'>+		si-&gt;hit_total[i] = si-&gt;hit_cached[i] + si-&gt;hit_rbtree[i];</div><div class='add'>+		si-&gt;ext_tree[i] = atomic_read(&amp;eti-&gt;total_ext_tree);</div><div class='add'>+		si-&gt;zombie_tree[i] = atomic_read(&amp;eti-&gt;total_zombie_tree);</div><div class='add'>+		si-&gt;ext_node[i] = atomic_read(&amp;eti-&gt;total_ext_node);</div><div class='add'>+	}</div><div class='add'>+	/* read extent_cache only */</div><div class='ctx'> 	si-&gt;hit_largest = atomic64_read(&amp;sbi-&gt;read_hit_largest);</div><div class='del'>-	si-&gt;hit_cached = atomic64_read(&amp;sbi-&gt;read_hit_cached);</div><div class='del'>-	si-&gt;hit_rbtree = atomic64_read(&amp;sbi-&gt;read_hit_rbtree);</div><div class='del'>-	si-&gt;hit_total = si-&gt;hit_largest + si-&gt;hit_cached + si-&gt;hit_rbtree;</div><div class='del'>-	si-&gt;total_ext = atomic64_read(&amp;sbi-&gt;total_hit_ext);</div><div class='del'>-	si-&gt;ext_tree = atomic_read(&amp;sbi-&gt;total_ext_tree);</div><div class='del'>-	si-&gt;zombie_tree = atomic_read(&amp;sbi-&gt;total_zombie_tree);</div><div class='del'>-	si-&gt;ext_node = atomic_read(&amp;sbi-&gt;total_ext_node);</div><div class='add'>+	si-&gt;hit_total[EX_READ] += si-&gt;hit_largest;</div><div class='add'>+</div><div class='add'>+	/* block age extent_cache only */</div><div class='add'>+	si-&gt;allocated_data_blocks = atomic64_read(&amp;sbi-&gt;allocated_data_blocks);</div><div class='add'>+</div><div class='add'>+	/* validation check of the segment numbers */</div><div class='ctx'> 	si-&gt;ndirty_node = get_pages(sbi, F2FS_DIRTY_NODES);</div><div class='ctx'> 	si-&gt;ndirty_dent = get_pages(sbi, F2FS_DIRTY_DENTS);</div><div class='ctx'> 	si-&gt;ndirty_meta = get_pages(sbi, F2FS_DIRTY_META);</div><div class='hunk'>@@ -89,13 +164,11 @@ static void update_general_status(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	si-&gt;ndirty_imeta = get_pages(sbi, F2FS_DIRTY_IMETA);</div><div class='ctx'> 	si-&gt;ndirty_dirs = sbi-&gt;ndirty_inode[DIR_INODE];</div><div class='ctx'> 	si-&gt;ndirty_files = sbi-&gt;ndirty_inode[FILE_INODE];</div><div class='add'>+	si-&gt;ndonate_files = sbi-&gt;donate_files;</div><div class='ctx'> 	si-&gt;nquota_files = sbi-&gt;nquota_files;</div><div class='ctx'> 	si-&gt;ndirty_all = sbi-&gt;ndirty_inode[DIRTY_META];</div><div class='del'>-	si-&gt;inmem_pages = get_pages(sbi, F2FS_INMEM_PAGES);</div><div class='del'>-	si-&gt;aw_cnt = sbi-&gt;atomic_files;</div><div class='del'>-	si-&gt;vw_cnt = atomic_read(&amp;sbi-&gt;vw_cnt);</div><div class='add'>+	si-&gt;aw_cnt = atomic_read(&amp;sbi-&gt;atomic_files);</div><div class='ctx'> 	si-&gt;max_aw_cnt = atomic_read(&amp;sbi-&gt;max_aw_cnt);</div><div class='del'>-	si-&gt;max_vw_cnt = atomic_read(&amp;sbi-&gt;max_vw_cnt);</div><div class='ctx'> 	si-&gt;nr_dio_read = get_pages(sbi, F2FS_DIO_READ);</div><div class='ctx'> 	si-&gt;nr_dio_write = get_pages(sbi, F2FS_DIO_WRITE);</div><div class='ctx'> 	si-&gt;nr_wb_cp_data = get_pages(sbi, F2FS_WB_CP_DATA);</div><div class='hunk'>@@ -127,7 +200,7 @@ static void update_general_status(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	si-&gt;cur_ckpt_time = sbi-&gt;cprc_info.cur_time;</div><div class='ctx'> 	si-&gt;peak_ckpt_time = sbi-&gt;cprc_info.peak_time;</div><div class='ctx'> 	spin_unlock(&amp;sbi-&gt;cprc_info.stat_lock);</div><div class='del'>-	si-&gt;total_count = (int)sbi-&gt;user_block_count / sbi-&gt;blocks_per_seg;</div><div class='add'>+	si-&gt;total_count = BLKS_TO_SEGS(sbi, (int)sbi-&gt;user_block_count);</div><div class='ctx'> 	si-&gt;rsvd_segs = reserved_segments(sbi);</div><div class='ctx'> 	si-&gt;overp_segs = overprovision_segments(sbi);</div><div class='ctx'> 	si-&gt;valid_count = valid_user_blocks(sbi);</div><div class='hunk'>@@ -138,6 +211,7 @@ static void update_general_status(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	si-&gt;inline_inode = atomic_read(&amp;sbi-&gt;inline_inode);</div><div class='ctx'> 	si-&gt;inline_dir = atomic_read(&amp;sbi-&gt;inline_dir);</div><div class='ctx'> 	si-&gt;compr_inode = atomic_read(&amp;sbi-&gt;compr_inode);</div><div class='add'>+	si-&gt;swapfile_inode = atomic_read(&amp;sbi-&gt;swapfile_inode);</div><div class='ctx'> 	si-&gt;compr_blocks = atomic64_read(&amp;sbi-&gt;compr_blocks);</div><div class='ctx'> 	si-&gt;append = sbi-&gt;im[APPEND_INO].ino_num;</div><div class='ctx'> 	si-&gt;update = sbi-&gt;im[UPDATE_INO].ino_num;</div><div class='hunk'>@@ -167,19 +241,17 @@ static void update_general_status(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	si-&gt;alloc_nids = NM_I(sbi)-&gt;nid_cnt[PREALLOC_NID];</div><div class='ctx'> 	si-&gt;io_skip_bggc = sbi-&gt;io_skip_bggc;</div><div class='ctx'> 	si-&gt;other_skip_bggc = sbi-&gt;other_skip_bggc;</div><div class='del'>-	si-&gt;skipped_atomic_files[BG_GC] = sbi-&gt;skipped_atomic_files[BG_GC];</div><div class='del'>-	si-&gt;skipped_atomic_files[FG_GC] = sbi-&gt;skipped_atomic_files[FG_GC];</div><div class='del'>-	si-&gt;util_free = (int)(free_user_blocks(sbi) &gt;&gt; sbi-&gt;log_blocks_per_seg)</div><div class='add'>+	si-&gt;util_free = (int)(BLKS_TO_SEGS(sbi, free_user_blocks(sbi)))</div><div class='ctx'> 		* 100 / (int)(sbi-&gt;user_block_count &gt;&gt; sbi-&gt;log_blocks_per_seg)</div><div class='ctx'> 		/ 2;</div><div class='del'>-	si-&gt;util_valid = (int)(written_block_count(sbi) &gt;&gt;</div><div class='del'>-						sbi-&gt;log_blocks_per_seg)</div><div class='add'>+	si-&gt;util_valid = (int)(BLKS_TO_SEGS(sbi, written_block_count(sbi)))</div><div class='ctx'> 		* 100 / (int)(sbi-&gt;user_block_count &gt;&gt; sbi-&gt;log_blocks_per_seg)</div><div class='ctx'> 		/ 2;</div><div class='ctx'> 	si-&gt;util_invalid = 50 - si-&gt;util_free - si-&gt;util_valid;</div><div class='ctx'> 	for (i = CURSEG_HOT_DATA; i &lt; NO_CHECK_TYPE; i++) {</div><div class='ctx'> 		struct curseg_info *curseg = CURSEG_I(sbi, i);</div><div class='ctx'> </div><div class='add'>+		si-&gt;blkoff[i] = curseg-&gt;next_blkoff;</div><div class='ctx'> 		si-&gt;curseg[i] = curseg-&gt;segno;</div><div class='ctx'> 		si-&gt;cursec[i] = GET_SEC_FROM_SEG(sbi, curseg-&gt;segno);</div><div class='ctx'> 		si-&gt;curzone[i] = GET_ZONE_FROM_SEC(sbi, si-&gt;cursec[i]);</div><div class='hunk'>@@ -201,13 +273,18 @@ static void update_general_status(struct f2fs_sb_info *sbi)</div><div class='ctx'> 		if (!blks)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		if (blks == sbi-&gt;blocks_per_seg)</div><div class='add'>+		if (blks == BLKS_PER_SEG(sbi))</div><div class='ctx'> 			si-&gt;full_seg[type]++;</div><div class='ctx'> 		else</div><div class='ctx'> 			si-&gt;dirty_seg[type]++;</div><div class='ctx'> 		si-&gt;valid_blks[type] += blks;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	update_multidevice_stats(sbi);</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; MAX_CALL_TYPE; i++)</div><div class='add'>+		si-&gt;cp_call_count[i] = atomic_read(&amp;sbi-&gt;cp_call_count[i]);</div><div class='add'>+</div><div class='ctx'> 	for (i = 0; i &lt; 2; i++) {</div><div class='ctx'> 		si-&gt;segment_count[i] = sbi-&gt;segment_count[i];</div><div class='ctx'> 		si-&gt;block_count[i] = sbi-&gt;block_count[i];</div><div class='hunk'>@@ -266,7 +343,7 @@ static void update_mem_info(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	/* build nm */</div><div class='ctx'> 	si-&gt;base_mem += sizeof(struct f2fs_nm_info);</div><div class='ctx'> 	si-&gt;base_mem += __bitmap_size(sbi, NAT_BITMAP);</div><div class='del'>-	si-&gt;base_mem += (NM_I(sbi)-&gt;nat_bits_blocks &lt;&lt; F2FS_BLKSIZE_BITS);</div><div class='add'>+	si-&gt;base_mem += F2FS_BLK_TO_BYTES(NM_I(sbi)-&gt;nat_bits_blocks);</div><div class='ctx'> 	si-&gt;base_mem += NM_I(sbi)-&gt;nat_blocks *</div><div class='ctx'> 				f2fs_bitmap_size(NAT_ENTRY_PER_BLOCK);</div><div class='ctx'> 	si-&gt;base_mem += NM_I(sbi)-&gt;nat_blocks / 8;</div><div class='hunk'>@@ -296,48 +373,67 @@ get_cache:</div><div class='ctx'> 				sizeof(struct nat_entry);</div><div class='ctx'> 	si-&gt;cache_mem += NM_I(sbi)-&gt;nat_cnt[DIRTY_NAT] *</div><div class='ctx'> 				sizeof(struct nat_entry_set);</div><div class='del'>-	si-&gt;cache_mem += si-&gt;inmem_pages * sizeof(struct inmem_pages);</div><div class='ctx'> 	for (i = 0; i &lt; MAX_INO_ENTRY; i++)</div><div class='ctx'> 		si-&gt;cache_mem += sbi-&gt;im[i].ino_num * sizeof(struct ino_entry);</div><div class='del'>-	si-&gt;cache_mem += atomic_read(&amp;sbi-&gt;total_ext_tree) *</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; NR_EXTENT_CACHES; i++) {</div><div class='add'>+		struct extent_tree_info *eti = &amp;sbi-&gt;extent_tree[i];</div><div class='add'>+</div><div class='add'>+		si-&gt;ext_mem[i] = atomic_read(&amp;eti-&gt;total_ext_tree) *</div><div class='ctx'> 						sizeof(struct extent_tree);</div><div class='del'>-	si-&gt;cache_mem += atomic_read(&amp;sbi-&gt;total_ext_node) *</div><div class='add'>+		si-&gt;ext_mem[i] += atomic_read(&amp;eti-&gt;total_ext_node) *</div><div class='ctx'> 						sizeof(struct extent_node);</div><div class='add'>+		si-&gt;cache_mem += si-&gt;ext_mem[i];</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	si-&gt;page_mem = 0;</div><div class='ctx'> 	if (sbi-&gt;node_inode) {</div><div class='del'>-		unsigned npages = NODE_MAPPING(sbi)-&gt;nrpages;</div><div class='add'>+		unsigned long npages = NODE_MAPPING(sbi)-&gt;nrpages;</div><div class='ctx'> </div><div class='ctx'> 		si-&gt;page_mem += (unsigned long long)npages &lt;&lt; PAGE_SHIFT;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (sbi-&gt;meta_inode) {</div><div class='del'>-		unsigned npages = META_MAPPING(sbi)-&gt;nrpages;</div><div class='add'>+		unsigned long npages = META_MAPPING(sbi)-&gt;nrpages;</div><div class='ctx'> </div><div class='ctx'> 		si-&gt;page_mem += (unsigned long long)npages &lt;&lt; PAGE_SHIFT;</div><div class='ctx'> 	}</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='ctx'> 	if (sbi-&gt;compress_inode) {</div><div class='del'>-		unsigned npages = COMPRESS_MAPPING(sbi)-&gt;nrpages;</div><div class='add'>+		unsigned long npages = COMPRESS_MAPPING(sbi)-&gt;nrpages;</div><div class='add'>+</div><div class='ctx'> 		si-&gt;page_mem += (unsigned long long)npages &lt;&lt; PAGE_SHIFT;</div><div class='ctx'> 	}</div><div class='ctx'> #endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static char *s_flag[] = {</div><div class='del'>-	[SBI_IS_DIRTY]		= " fs_dirty",</div><div class='del'>-	[SBI_IS_CLOSE]		= " closing",</div><div class='del'>-	[SBI_NEED_FSCK]		= " need_fsck",</div><div class='del'>-	[SBI_POR_DOING]		= " recovering",</div><div class='del'>-	[SBI_NEED_SB_WRITE]	= " sb_dirty",</div><div class='del'>-	[SBI_NEED_CP]		= " need_cp",</div><div class='del'>-	[SBI_IS_SHUTDOWN]	= " shutdown",</div><div class='del'>-	[SBI_IS_RECOVERED]	= " recovered",</div><div class='del'>-	[SBI_CP_DISABLED]	= " cp_disabled",</div><div class='del'>-	[SBI_CP_DISABLED_QUICK]	= " cp_disabled_quick",</div><div class='del'>-	[SBI_QUOTA_NEED_FLUSH]	= " quota_need_flush",</div><div class='del'>-	[SBI_QUOTA_SKIP_FLUSH]	= " quota_skip_flush",</div><div class='del'>-	[SBI_QUOTA_NEED_REPAIR]	= " quota_need_repair",</div><div class='del'>-	[SBI_IS_RESIZEFS]	= " resizefs",</div><div class='add'>+static const char *s_flag[MAX_SBI_FLAG] = {</div><div class='add'>+	[SBI_IS_DIRTY]		= "fs_dirty",</div><div class='add'>+	[SBI_IS_CLOSE]		= "closing",</div><div class='add'>+	[SBI_NEED_FSCK]		= "need_fsck",</div><div class='add'>+	[SBI_POR_DOING]		= "recovering",</div><div class='add'>+	[SBI_NEED_SB_WRITE]	= "sb_dirty",</div><div class='add'>+	[SBI_NEED_CP]		= "need_cp",</div><div class='add'>+	[SBI_IS_SHUTDOWN]	= "shutdown",</div><div class='add'>+	[SBI_IS_RECOVERED]	= "recovered",</div><div class='add'>+	[SBI_CP_DISABLED]	= "cp_disabled",</div><div class='add'>+	[SBI_CP_DISABLED_QUICK]	= "cp_disabled_quick",</div><div class='add'>+	[SBI_QUOTA_NEED_FLUSH]	= "quota_need_flush",</div><div class='add'>+	[SBI_QUOTA_SKIP_FLUSH]	= "quota_skip_flush",</div><div class='add'>+	[SBI_QUOTA_NEED_REPAIR]	= "quota_need_repair",</div><div class='add'>+	[SBI_IS_RESIZEFS]	= "resizefs",</div><div class='add'>+	[SBI_IS_FREEZING]	= "freezefs",</div><div class='add'>+	[SBI_IS_WRITABLE]	= "writable",</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const char *ipu_mode_names[F2FS_IPU_MAX] = {</div><div class='add'>+	[F2FS_IPU_FORCE]	= "FORCE",</div><div class='add'>+	[F2FS_IPU_SSR]		= "SSR",</div><div class='add'>+	[F2FS_IPU_UTIL]		= "UTIL",</div><div class='add'>+	[F2FS_IPU_SSR_UTIL]	= "SSR_UTIL",</div><div class='add'>+	[F2FS_IPU_FSYNC]	= "FSYNC",</div><div class='add'>+	[F2FS_IPU_ASYNC]	= "ASYNC",</div><div class='add'>+	[F2FS_IPU_NOCACHE]	= "NOCACHE",</div><div class='add'>+	[F2FS_IPU_HONOR_OPU_WRITE]	= "HONOR_OPU_WRITE",</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static int stat_show(struct seq_file *s, void *v)</div><div class='hunk'>@@ -345,19 +441,21 @@ static int stat_show(struct seq_file *s, void *v)</div><div class='ctx'> 	struct f2fs_stat_info *si;</div><div class='ctx'> 	int i = 0, j = 0;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;f2fs_stat_mutex);</div><div class='add'>+	spin_lock(&amp;f2fs_stat_lock);</div><div class='ctx'> 	list_for_each_entry(si, &amp;f2fs_stat_list, stat_list) {</div><div class='del'>-		update_general_status(si-&gt;sbi);</div><div class='add'>+		struct f2fs_sb_info *sbi = si-&gt;sbi;</div><div class='add'>+</div><div class='add'>+		update_general_status(sbi);</div><div class='ctx'> </div><div class='ctx'> 		seq_printf(s, "\n=====[ partition info(%pg). #%d, %s, CP: %s]=====\n",</div><div class='del'>-			si-&gt;sbi-&gt;sb-&gt;s_bdev, i++,</div><div class='del'>-			f2fs_readonly(si-&gt;sbi-&gt;sb) ? "RO": "RW",</div><div class='del'>-			is_set_ckpt_flags(si-&gt;sbi, CP_DISABLED_FLAG) ?</div><div class='del'>-			"Disabled" : (f2fs_cp_error(si-&gt;sbi) ? "Error" : "Good"));</div><div class='del'>-		if (si-&gt;sbi-&gt;s_flag) {</div><div class='add'>+			sbi-&gt;sb-&gt;s_bdev, i++,</div><div class='add'>+			f2fs_readonly(sbi-&gt;sb) ? "RO" : "RW",</div><div class='add'>+			is_set_ckpt_flags(sbi, CP_DISABLED_FLAG) ?</div><div class='add'>+			"Disabled" : (f2fs_cp_error(sbi) ? "Error" : "Good"));</div><div class='add'>+		if (sbi-&gt;s_flag) {</div><div class='ctx'> 			seq_puts(s, "[SBI:");</div><div class='del'>-			for_each_set_bit(j, &amp;si-&gt;sbi-&gt;s_flag, 32)</div><div class='del'>-				seq_puts(s, s_flag[j]);</div><div class='add'>+			for_each_set_bit(j, &amp;sbi-&gt;s_flag, MAX_SBI_FLAG)</div><div class='add'>+				seq_printf(s, " %s", s_flag[j]);</div><div class='ctx'> 			seq_puts(s, "]\n");</div><div class='ctx'> 		}</div><div class='ctx'> 		seq_printf(s, "[SB: 1] [CP: 2] [SIT: %d] [NAT: %d] ",</div><div class='hunk'>@@ -368,8 +466,21 @@ static int stat_show(struct seq_file *s, void *v)</div><div class='ctx'> 			   si-&gt;overp_segs, si-&gt;rsvd_segs);</div><div class='ctx'> 		seq_printf(s, "Current Time Sec: %llu / Mounted Time Sec: %llu\n\n",</div><div class='ctx'> 					ktime_get_boottime_seconds(),</div><div class='del'>-					SIT_I(si-&gt;sbi)-&gt;mounted_time);</div><div class='del'>-		if (test_opt(si-&gt;sbi, DISCARD))</div><div class='add'>+					SIT_I(sbi)-&gt;mounted_time);</div><div class='add'>+</div><div class='add'>+		seq_puts(s, "Policy:\n");</div><div class='add'>+		seq_puts(s, "  - IPU: [");</div><div class='add'>+		if (IS_F2FS_IPU_DISABLE(sbi)) {</div><div class='add'>+			seq_puts(s, " DISABLE");</div><div class='add'>+		} else {</div><div class='add'>+			unsigned long policy = SM_I(sbi)-&gt;ipu_policy;</div><div class='add'>+</div><div class='add'>+			for_each_set_bit(j, &amp;policy, F2FS_IPU_MAX)</div><div class='add'>+				seq_printf(s, " %s", ipu_mode_names[j]);</div><div class='add'>+		}</div><div class='add'>+		seq_puts(s, " ]\n\n");</div><div class='add'>+</div><div class='add'>+		if (test_opt(sbi, DISCARD))</div><div class='ctx'> 			seq_printf(s, "Utilization: %u%% (%u valid blocks, %u discard blocks)\n",</div><div class='ctx'> 				si-&gt;utilization, si-&gt;valid_count, si-&gt;discard_blks);</div><div class='ctx'> 		else</div><div class='hunk'>@@ -389,60 +500,72 @@ static int stat_show(struct seq_file *s, void *v)</div><div class='ctx'> 			   si-&gt;inline_dir);</div><div class='ctx'> 		seq_printf(s, "  - Compressed Inode: %u, Blocks: %llu\n",</div><div class='ctx'> 			   si-&gt;compr_inode, si-&gt;compr_blocks);</div><div class='add'>+		seq_printf(s, "  - Swapfile Inode: %u\n",</div><div class='add'>+			   si-&gt;swapfile_inode);</div><div class='add'>+		seq_printf(s, "  - Donate Inode: %u\n",</div><div class='add'>+			   si-&gt;ndonate_files);</div><div class='ctx'> 		seq_printf(s, "  - Orphan/Append/Update Inode: %u, %u, %u\n",</div><div class='ctx'> 			   si-&gt;orphans, si-&gt;append, si-&gt;update);</div><div class='ctx'> 		seq_printf(s, "\nMain area: %d segs, %d secs %d zones\n",</div><div class='ctx'> 			   si-&gt;main_area_segs, si-&gt;main_area_sections,</div><div class='ctx'> 			   si-&gt;main_area_zones);</div><div class='del'>-		seq_printf(s, "    TYPE         %8s %8s %8s %10s %10s %10s\n",</div><div class='del'>-			   "segno", "secno", "zoneno", "dirty_seg", "full_seg", "valid_blk");</div><div class='del'>-		seq_printf(s, "  - COLD   data: %8d %8d %8d %10u %10u %10u\n",</div><div class='add'>+		seq_printf(s, "    TYPE         %8s %8s %8s %8s %10s %10s %10s\n",</div><div class='add'>+			   "blkoff", "segno", "secno", "zoneno", "dirty_seg", "full_seg", "valid_blk");</div><div class='add'>+		seq_printf(s, "  - COLD   data: %8d %8d %8d %8d %10u %10u %10u\n",</div><div class='add'>+			   si-&gt;blkoff[CURSEG_COLD_DATA],</div><div class='ctx'> 			   si-&gt;curseg[CURSEG_COLD_DATA],</div><div class='ctx'> 			   si-&gt;cursec[CURSEG_COLD_DATA],</div><div class='ctx'> 			   si-&gt;curzone[CURSEG_COLD_DATA],</div><div class='ctx'> 			   si-&gt;dirty_seg[CURSEG_COLD_DATA],</div><div class='ctx'> 			   si-&gt;full_seg[CURSEG_COLD_DATA],</div><div class='ctx'> 			   si-&gt;valid_blks[CURSEG_COLD_DATA]);</div><div class='del'>-		seq_printf(s, "  - WARM   data: %8d %8d %8d %10u %10u %10u\n",</div><div class='add'>+		seq_printf(s, "  - WARM   data: %8d %8d %8d %8d %10u %10u %10u\n",</div><div class='add'>+			   si-&gt;blkoff[CURSEG_WARM_DATA],</div><div class='ctx'> 			   si-&gt;curseg[CURSEG_WARM_DATA],</div><div class='ctx'> 			   si-&gt;cursec[CURSEG_WARM_DATA],</div><div class='ctx'> 			   si-&gt;curzone[CURSEG_WARM_DATA],</div><div class='ctx'> 			   si-&gt;dirty_seg[CURSEG_WARM_DATA],</div><div class='ctx'> 			   si-&gt;full_seg[CURSEG_WARM_DATA],</div><div class='ctx'> 			   si-&gt;valid_blks[CURSEG_WARM_DATA]);</div><div class='del'>-		seq_printf(s, "  - HOT    data: %8d %8d %8d %10u %10u %10u\n",</div><div class='add'>+		seq_printf(s, "  - HOT    data: %8d %8d %8d %8d %10u %10u %10u\n",</div><div class='add'>+			   si-&gt;blkoff[CURSEG_HOT_DATA],</div><div class='ctx'> 			   si-&gt;curseg[CURSEG_HOT_DATA],</div><div class='ctx'> 			   si-&gt;cursec[CURSEG_HOT_DATA],</div><div class='ctx'> 			   si-&gt;curzone[CURSEG_HOT_DATA],</div><div class='ctx'> 			   si-&gt;dirty_seg[CURSEG_HOT_DATA],</div><div class='ctx'> 			   si-&gt;full_seg[CURSEG_HOT_DATA],</div><div class='ctx'> 			   si-&gt;valid_blks[CURSEG_HOT_DATA]);</div><div class='del'>-		seq_printf(s, "  - Dir   dnode: %8d %8d %8d %10u %10u %10u\n",</div><div class='add'>+		seq_printf(s, "  - Dir   dnode: %8d %8d %8d %8d %10u %10u %10u\n",</div><div class='add'>+			   si-&gt;blkoff[CURSEG_HOT_NODE],</div><div class='ctx'> 			   si-&gt;curseg[CURSEG_HOT_NODE],</div><div class='ctx'> 			   si-&gt;cursec[CURSEG_HOT_NODE],</div><div class='ctx'> 			   si-&gt;curzone[CURSEG_HOT_NODE],</div><div class='ctx'> 			   si-&gt;dirty_seg[CURSEG_HOT_NODE],</div><div class='ctx'> 			   si-&gt;full_seg[CURSEG_HOT_NODE],</div><div class='ctx'> 			   si-&gt;valid_blks[CURSEG_HOT_NODE]);</div><div class='del'>-		seq_printf(s, "  - File  dnode: %8d %8d %8d %10u %10u %10u\n",</div><div class='add'>+		seq_printf(s, "  - File  dnode: %8d %8d %8d %8d %10u %10u %10u\n",</div><div class='add'>+			   si-&gt;blkoff[CURSEG_WARM_NODE],</div><div class='ctx'> 			   si-&gt;curseg[CURSEG_WARM_NODE],</div><div class='ctx'> 			   si-&gt;cursec[CURSEG_WARM_NODE],</div><div class='ctx'> 			   si-&gt;curzone[CURSEG_WARM_NODE],</div><div class='ctx'> 			   si-&gt;dirty_seg[CURSEG_WARM_NODE],</div><div class='ctx'> 			   si-&gt;full_seg[CURSEG_WARM_NODE],</div><div class='ctx'> 			   si-&gt;valid_blks[CURSEG_WARM_NODE]);</div><div class='del'>-		seq_printf(s, "  - Indir nodes: %8d %8d %8d %10u %10u %10u\n",</div><div class='add'>+		seq_printf(s, "  - Indir nodes: %8d %8d %8d %8d %10u %10u %10u\n",</div><div class='add'>+			   si-&gt;blkoff[CURSEG_COLD_NODE],</div><div class='ctx'> 			   si-&gt;curseg[CURSEG_COLD_NODE],</div><div class='ctx'> 			   si-&gt;cursec[CURSEG_COLD_NODE],</div><div class='ctx'> 			   si-&gt;curzone[CURSEG_COLD_NODE],</div><div class='ctx'> 			   si-&gt;dirty_seg[CURSEG_COLD_NODE],</div><div class='ctx'> 			   si-&gt;full_seg[CURSEG_COLD_NODE],</div><div class='ctx'> 			   si-&gt;valid_blks[CURSEG_COLD_NODE]);</div><div class='del'>-		seq_printf(s, "  - Pinned file: %8d %8d %8d\n",</div><div class='add'>+		seq_printf(s, "  - Pinned file: %8d %8d %8d %8d\n",</div><div class='add'>+			   si-&gt;blkoff[CURSEG_COLD_DATA_PINNED],</div><div class='ctx'> 			   si-&gt;curseg[CURSEG_COLD_DATA_PINNED],</div><div class='ctx'> 			   si-&gt;cursec[CURSEG_COLD_DATA_PINNED],</div><div class='ctx'> 			   si-&gt;curzone[CURSEG_COLD_DATA_PINNED]);</div><div class='del'>-		seq_printf(s, "  - ATGC   data: %8d %8d %8d\n",</div><div class='add'>+		seq_printf(s, "  - ATGC   data: %8d %8d %8d %8d\n",</div><div class='add'>+			   si-&gt;blkoff[CURSEG_ALL_DATA_ATGC],</div><div class='ctx'> 			   si-&gt;curseg[CURSEG_ALL_DATA_ATGC],</div><div class='ctx'> 			   si-&gt;cursec[CURSEG_ALL_DATA_ATGC],</div><div class='ctx'> 			   si-&gt;curzone[CURSEG_ALL_DATA_ATGC]);</div><div class='hunk'>@@ -452,8 +575,40 @@ static int stat_show(struct seq_file *s, void *v)</div><div class='ctx'> 			   si-&gt;dirty_count);</div><div class='ctx'> 		seq_printf(s, "  - Prefree: %d\n  - Free: %d (%d)\n\n",</div><div class='ctx'> 			   si-&gt;prefree_count, si-&gt;free_segs, si-&gt;free_secs);</div><div class='add'>+		if (f2fs_is_multi_device(sbi)) {</div><div class='add'>+			seq_puts(s, "Multidevice stats:\n");</div><div class='add'>+			seq_printf(s, "  [seg:   %8s %8s %8s %8s %8s]",</div><div class='add'>+					"inuse", "dirty", "full", "free", "prefree");</div><div class='add'>+			if (__is_large_section(sbi))</div><div class='add'>+				seq_printf(s, " [sec:   %8s %8s %8s %8s %8s]\n",</div><div class='add'>+					"inuse", "dirty", "full", "free", "prefree");</div><div class='add'>+			else</div><div class='add'>+				seq_puts(s, "\n");</div><div class='add'>+</div><div class='add'>+			for (i = 0; i &lt; sbi-&gt;s_ndevs; i++) {</div><div class='add'>+				seq_printf(s, "  #%-2d     %8u %8u %8u %8u %8u", i,</div><div class='add'>+					si-&gt;dev_stats[i].devstats[0][DEVSTAT_INUSE],</div><div class='add'>+					si-&gt;dev_stats[i].devstats[0][DEVSTAT_DIRTY],</div><div class='add'>+					si-&gt;dev_stats[i].devstats[0][DEVSTAT_FULL],</div><div class='add'>+					si-&gt;dev_stats[i].devstats[0][DEVSTAT_FREE],</div><div class='add'>+					si-&gt;dev_stats[i].devstats[0][DEVSTAT_PREFREE]);</div><div class='add'>+				if (!__is_large_section(sbi)) {</div><div class='add'>+					seq_puts(s, "\n");</div><div class='add'>+					continue;</div><div class='add'>+				}</div><div class='add'>+				seq_printf(s, "          %8u %8u %8u %8u %8u\n",</div><div class='add'>+					si-&gt;dev_stats[i].devstats[1][DEVSTAT_INUSE],</div><div class='add'>+					si-&gt;dev_stats[i].devstats[1][DEVSTAT_DIRTY],</div><div class='add'>+					si-&gt;dev_stats[i].devstats[1][DEVSTAT_FULL],</div><div class='add'>+					si-&gt;dev_stats[i].devstats[1][DEVSTAT_FREE],</div><div class='add'>+					si-&gt;dev_stats[i].devstats[1][DEVSTAT_PREFREE]);</div><div class='add'>+			}</div><div class='add'>+			seq_puts(s, "\n");</div><div class='add'>+		}</div><div class='ctx'> 		seq_printf(s, "CP calls: %d (BG: %d)\n",</div><div class='del'>-				si-&gt;cp_count, si-&gt;bg_cp_count);</div><div class='add'>+			   si-&gt;cp_call_count[TOTAL_CALL],</div><div class='add'>+			   si-&gt;cp_call_count[BACKGROUND]);</div><div class='add'>+		seq_printf(s, "CP count: %d\n", si-&gt;cp_count);</div><div class='ctx'> 		seq_printf(s, "  - cp blocks : %u\n", si-&gt;meta_count[META_CP]);</div><div class='ctx'> 		seq_printf(s, "  - sit blocks : %u\n",</div><div class='ctx'> 				si-&gt;meta_count[META_SIT]);</div><div class='hunk'>@@ -461,77 +616,106 @@ static int stat_show(struct seq_file *s, void *v)</div><div class='ctx'> 				si-&gt;meta_count[META_NAT]);</div><div class='ctx'> 		seq_printf(s, "  - ssa blocks : %u\n",</div><div class='ctx'> 				si-&gt;meta_count[META_SSA]);</div><div class='del'>-		seq_printf(s, "CP merge (Queued: %4d, Issued: %4d, Total: %4d, "</div><div class='del'>-				"Cur time: %4d(ms), Peak time: %4d(ms))\n",</div><div class='del'>-				si-&gt;nr_queued_ckpt, si-&gt;nr_issued_ckpt,</div><div class='del'>-				si-&gt;nr_total_ckpt, si-&gt;cur_ckpt_time,</div><div class='del'>-				si-&gt;peak_ckpt_time);</div><div class='del'>-		seq_printf(s, "GC calls: %d (BG: %d)\n",</div><div class='del'>-			   si-&gt;call_count, si-&gt;bg_gc);</div><div class='del'>-		seq_printf(s, "  - data segments : %d (%d)\n",</div><div class='del'>-				si-&gt;data_segs, si-&gt;bg_data_segs);</div><div class='del'>-		seq_printf(s, "  - node segments : %d (%d)\n",</div><div class='del'>-				si-&gt;node_segs, si-&gt;bg_node_segs);</div><div class='del'>-		seq_printf(s, "  - Reclaimed segs : Normal (%d), Idle CB (%d), "</div><div class='del'>-				"Idle Greedy (%d), Idle AT (%d), "</div><div class='del'>-				"Urgent High (%d), Urgent Low (%d)\n",</div><div class='del'>-				si-&gt;sbi-&gt;gc_reclaimed_segs[GC_NORMAL],</div><div class='del'>-				si-&gt;sbi-&gt;gc_reclaimed_segs[GC_IDLE_CB],</div><div class='del'>-				si-&gt;sbi-&gt;gc_reclaimed_segs[GC_IDLE_GREEDY],</div><div class='del'>-				si-&gt;sbi-&gt;gc_reclaimed_segs[GC_IDLE_AT],</div><div class='del'>-				si-&gt;sbi-&gt;gc_reclaimed_segs[GC_URGENT_HIGH],</div><div class='del'>-				si-&gt;sbi-&gt;gc_reclaimed_segs[GC_URGENT_LOW]);</div><div class='add'>+		seq_puts(s, "CP merge:\n");</div><div class='add'>+		seq_printf(s, "  - Queued : %4d\n", si-&gt;nr_queued_ckpt);</div><div class='add'>+		seq_printf(s, "  - Issued : %4d\n", si-&gt;nr_issued_ckpt);</div><div class='add'>+		seq_printf(s, "  - Total : %4d\n", si-&gt;nr_total_ckpt);</div><div class='add'>+		seq_printf(s, "  - Cur time : %4d(ms)\n", si-&gt;cur_ckpt_time);</div><div class='add'>+		seq_printf(s, "  - Peak time : %4d(ms)\n", si-&gt;peak_ckpt_time);</div><div class='add'>+		seq_printf(s, "GC calls: %d (gc_thread: %d)\n",</div><div class='add'>+			   si-&gt;gc_call_count[BACKGROUND] +</div><div class='add'>+			   si-&gt;gc_call_count[FOREGROUND],</div><div class='add'>+			   si-&gt;gc_call_count[BACKGROUND]);</div><div class='add'>+		if (__is_large_section(sbi)) {</div><div class='add'>+			seq_printf(s, "  - data sections : %d (BG: %d)\n",</div><div class='add'>+					si-&gt;gc_secs[DATA][BG_GC] + si-&gt;gc_secs[DATA][FG_GC],</div><div class='add'>+					si-&gt;gc_secs[DATA][BG_GC]);</div><div class='add'>+			seq_printf(s, "  - node sections : %d (BG: %d)\n",</div><div class='add'>+					si-&gt;gc_secs[NODE][BG_GC] + si-&gt;gc_secs[NODE][FG_GC],</div><div class='add'>+					si-&gt;gc_secs[NODE][BG_GC]);</div><div class='add'>+		}</div><div class='add'>+		seq_printf(s, "  - data segments : %d (BG: %d)\n",</div><div class='add'>+				si-&gt;gc_segs[DATA][BG_GC] + si-&gt;gc_segs[DATA][FG_GC],</div><div class='add'>+				si-&gt;gc_segs[DATA][BG_GC]);</div><div class='add'>+		seq_printf(s, "  - node segments : %d (BG: %d)\n",</div><div class='add'>+				si-&gt;gc_segs[NODE][BG_GC] + si-&gt;gc_segs[NODE][FG_GC],</div><div class='add'>+				si-&gt;gc_segs[NODE][BG_GC]);</div><div class='add'>+		seq_puts(s, "  - Reclaimed segs :\n");</div><div class='add'>+		seq_printf(s, "    - Normal : %d\n", sbi-&gt;gc_reclaimed_segs[GC_NORMAL]);</div><div class='add'>+		seq_printf(s, "    - Idle CB : %d\n", sbi-&gt;gc_reclaimed_segs[GC_IDLE_CB]);</div><div class='add'>+		seq_printf(s, "    - Idle Greedy : %d\n",</div><div class='add'>+				sbi-&gt;gc_reclaimed_segs[GC_IDLE_GREEDY]);</div><div class='add'>+		seq_printf(s, "    - Idle AT : %d\n", sbi-&gt;gc_reclaimed_segs[GC_IDLE_AT]);</div><div class='add'>+		seq_printf(s, "    - Urgent High : %d\n",</div><div class='add'>+				sbi-&gt;gc_reclaimed_segs[GC_URGENT_HIGH]);</div><div class='add'>+		seq_printf(s, "    - Urgent Mid : %d\n", sbi-&gt;gc_reclaimed_segs[GC_URGENT_MID]);</div><div class='add'>+		seq_printf(s, "    - Urgent Low : %d\n", sbi-&gt;gc_reclaimed_segs[GC_URGENT_LOW]);</div><div class='ctx'> 		seq_printf(s, "Try to move %d blocks (BG: %d)\n", si-&gt;tot_blks,</div><div class='ctx'> 				si-&gt;bg_data_blks + si-&gt;bg_node_blks);</div><div class='ctx'> 		seq_printf(s, "  - data blocks : %d (%d)\n", si-&gt;data_blks,</div><div class='ctx'> 				si-&gt;bg_data_blks);</div><div class='ctx'> 		seq_printf(s, "  - node blocks : %d (%d)\n", si-&gt;node_blks,</div><div class='ctx'> 				si-&gt;bg_node_blks);</div><div class='del'>-		seq_printf(s, "Skipped : atomic write %llu (%llu)\n",</div><div class='del'>-				si-&gt;skipped_atomic_files[BG_GC] +</div><div class='del'>-				si-&gt;skipped_atomic_files[FG_GC],</div><div class='del'>-				si-&gt;skipped_atomic_files[BG_GC]);</div><div class='ctx'> 		seq_printf(s, "BG skip : IO: %u, Other: %u\n",</div><div class='ctx'> 				si-&gt;io_skip_bggc, si-&gt;other_skip_bggc);</div><div class='del'>-		seq_puts(s, "\nExtent Cache:\n");</div><div class='add'>+		seq_puts(s, "\nExtent Cache (Read):\n");</div><div class='ctx'> 		seq_printf(s, "  - Hit Count: L1-1:%llu L1-2:%llu L2:%llu\n",</div><div class='del'>-				si-&gt;hit_largest, si-&gt;hit_cached,</div><div class='del'>-				si-&gt;hit_rbtree);</div><div class='add'>+				si-&gt;hit_largest, si-&gt;hit_cached[EX_READ],</div><div class='add'>+				si-&gt;hit_rbtree[EX_READ]);</div><div class='add'>+		seq_printf(s, "  - Hit Ratio: %llu%% (%llu / %llu)\n",</div><div class='add'>+				!si-&gt;total_ext[EX_READ] ? 0 :</div><div class='add'>+				div64_u64(si-&gt;hit_total[EX_READ] * 100,</div><div class='add'>+				si-&gt;total_ext[EX_READ]),</div><div class='add'>+				si-&gt;hit_total[EX_READ], si-&gt;total_ext[EX_READ]);</div><div class='add'>+		seq_printf(s, "  - Inner Struct Count: tree: %d(%d), node: %d\n",</div><div class='add'>+				si-&gt;ext_tree[EX_READ], si-&gt;zombie_tree[EX_READ],</div><div class='add'>+				si-&gt;ext_node[EX_READ]);</div><div class='add'>+		seq_puts(s, "\nExtent Cache (Block Age):\n");</div><div class='add'>+		seq_printf(s, "  - Allocated Data Blocks: %llu\n",</div><div class='add'>+				si-&gt;allocated_data_blocks);</div><div class='add'>+		seq_printf(s, "  - Hit Count: L1:%llu L2:%llu\n",</div><div class='add'>+				si-&gt;hit_cached[EX_BLOCK_AGE],</div><div class='add'>+				si-&gt;hit_rbtree[EX_BLOCK_AGE]);</div><div class='ctx'> 		seq_printf(s, "  - Hit Ratio: %llu%% (%llu / %llu)\n",</div><div class='del'>-				!si-&gt;total_ext ? 0 :</div><div class='del'>-				div64_u64(si-&gt;hit_total * 100, si-&gt;total_ext),</div><div class='del'>-				si-&gt;hit_total, si-&gt;total_ext);</div><div class='add'>+				!si-&gt;total_ext[EX_BLOCK_AGE] ? 0 :</div><div class='add'>+				div64_u64(si-&gt;hit_total[EX_BLOCK_AGE] * 100,</div><div class='add'>+				si-&gt;total_ext[EX_BLOCK_AGE]),</div><div class='add'>+				si-&gt;hit_total[EX_BLOCK_AGE],</div><div class='add'>+				si-&gt;total_ext[EX_BLOCK_AGE]);</div><div class='ctx'> 		seq_printf(s, "  - Inner Struct Count: tree: %d(%d), node: %d\n",</div><div class='del'>-				si-&gt;ext_tree, si-&gt;zombie_tree, si-&gt;ext_node);</div><div class='add'>+				si-&gt;ext_tree[EX_BLOCK_AGE],</div><div class='add'>+				si-&gt;zombie_tree[EX_BLOCK_AGE],</div><div class='add'>+				si-&gt;ext_node[EX_BLOCK_AGE]);</div><div class='ctx'> 		seq_puts(s, "\nBalancing F2FS Async:\n");</div><div class='ctx'> 		seq_printf(s, "  - DIO (R: %4d, W: %4d)\n",</div><div class='ctx'> 			   si-&gt;nr_dio_read, si-&gt;nr_dio_write);</div><div class='ctx'> 		seq_printf(s, "  - IO_R (Data: %4d, Node: %4d, Meta: %4d\n",</div><div class='ctx'> 			   si-&gt;nr_rd_data, si-&gt;nr_rd_node, si-&gt;nr_rd_meta);</div><div class='del'>-		seq_printf(s, "  - IO_W (CP: %4d, Data: %4d, Flush: (%4d %4d %4d), "</div><div class='del'>-			"Discard: (%4d %4d)) cmd: %4d undiscard:%4u\n",</div><div class='add'>+		seq_printf(s, "  - IO_W (CP: %4d, Data: %4d, Flush: (%4d %4d %4d), ",</div><div class='ctx'> 			   si-&gt;nr_wb_cp_data, si-&gt;nr_wb_data,</div><div class='ctx'> 			   si-&gt;nr_flushing, si-&gt;nr_flushed,</div><div class='del'>-			   si-&gt;flush_list_empty,</div><div class='add'>+			   si-&gt;flush_list_empty);</div><div class='add'>+		seq_printf(s, "Discard: (%4d %4d)) cmd: %4d undiscard:%4u\n",</div><div class='ctx'> 			   si-&gt;nr_discarding, si-&gt;nr_discarded,</div><div class='ctx'> 			   si-&gt;nr_discard_cmd, si-&gt;undiscard_blks);</div><div class='del'>-		seq_printf(s, "  - inmem: %4d, atomic IO: %4d (Max. %4d), "</div><div class='del'>-			"volatile IO: %4d (Max. %4d)\n",</div><div class='del'>-			   si-&gt;inmem_pages, si-&gt;aw_cnt, si-&gt;max_aw_cnt,</div><div class='del'>-			   si-&gt;vw_cnt, si-&gt;max_vw_cnt);</div><div class='add'>+		seq_printf(s, "  - atomic IO: %4d (Max. %4d)\n",</div><div class='add'>+			   si-&gt;aw_cnt, si-&gt;max_aw_cnt);</div><div class='ctx'> 		seq_printf(s, "  - compress: %4d, hit:%8d\n", si-&gt;compress_pages, si-&gt;compress_page_hit);</div><div class='ctx'> 		seq_printf(s, "  - nodes: %4d in %4d\n",</div><div class='ctx'> 			   si-&gt;ndirty_node, si-&gt;node_pages);</div><div class='ctx'> 		seq_printf(s, "  - dents: %4d in dirs:%4d (%4d)\n",</div><div class='ctx'> 			   si-&gt;ndirty_dent, si-&gt;ndirty_dirs, si-&gt;ndirty_all);</div><div class='del'>-		seq_printf(s, "  - datas: %4d in files:%4d\n",</div><div class='add'>+		seq_printf(s, "  - data: %4d in files:%4d\n",</div><div class='ctx'> 			   si-&gt;ndirty_data, si-&gt;ndirty_files);</div><div class='del'>-		seq_printf(s, "  - quota datas: %4d in quota files:%4d\n",</div><div class='add'>+		seq_printf(s, "  - quota data: %4d in quota files:%4d\n",</div><div class='ctx'> 			   si-&gt;ndirty_qdata, si-&gt;nquota_files);</div><div class='ctx'> 		seq_printf(s, "  - meta: %4d in %4d\n",</div><div class='ctx'> 			   si-&gt;ndirty_meta, si-&gt;meta_pages);</div><div class='ctx'> 		seq_printf(s, "  - imeta: %4d\n",</div><div class='ctx'> 			   si-&gt;ndirty_imeta);</div><div class='add'>+		seq_printf(s, "  - fsync mark: %4lld\n",</div><div class='add'>+			   percpu_counter_sum_positive(</div><div class='add'>+					&amp;sbi-&gt;rf_node_block_count));</div><div class='ctx'> 		seq_printf(s, "  - NATs: %9d/%9d\n  - SITs: %9d/%9d\n",</div><div class='ctx'> 			   si-&gt;dirty_nats, si-&gt;nats, si-&gt;dirty_sits, si-&gt;sits);</div><div class='ctx'> 		seq_printf(s, "  - free_nids: %9d/%9d\n  - alloc_nids: %9d\n",</div><div class='hunk'>@@ -558,22 +742,26 @@ static int stat_show(struct seq_file *s, void *v)</div><div class='ctx'> 			   si-&gt;block_count[LFS], si-&gt;segment_count[LFS]);</div><div class='ctx'> </div><div class='ctx'> 		/* segment usage info */</div><div class='del'>-		f2fs_update_sit_info(si-&gt;sbi);</div><div class='add'>+		f2fs_update_sit_info(sbi);</div><div class='ctx'> 		seq_printf(s, "\nBDF: %u, avg. vblocks: %u\n",</div><div class='ctx'> 			   si-&gt;bimodal, si-&gt;avg_vblocks);</div><div class='ctx'> </div><div class='ctx'> 		/* memory footprint */</div><div class='del'>-		update_mem_info(si-&gt;sbi);</div><div class='add'>+		update_mem_info(sbi);</div><div class='ctx'> 		seq_printf(s, "\nMemory: %llu KB\n",</div><div class='ctx'> 			(si-&gt;base_mem + si-&gt;cache_mem + si-&gt;page_mem) &gt;&gt; 10);</div><div class='ctx'> 		seq_printf(s, "  - static: %llu KB\n",</div><div class='ctx'> 				si-&gt;base_mem &gt;&gt; 10);</div><div class='del'>-		seq_printf(s, "  - cached: %llu KB\n",</div><div class='add'>+		seq_printf(s, "  - cached all: %llu KB\n",</div><div class='ctx'> 				si-&gt;cache_mem &gt;&gt; 10);</div><div class='add'>+		seq_printf(s, "  - read extent cache: %llu KB\n",</div><div class='add'>+				si-&gt;ext_mem[EX_READ] &gt;&gt; 10);</div><div class='add'>+		seq_printf(s, "  - block age extent cache: %llu KB\n",</div><div class='add'>+				si-&gt;ext_mem[EX_BLOCK_AGE] &gt;&gt; 10);</div><div class='ctx'> 		seq_printf(s, "  - paged : %llu KB\n",</div><div class='ctx'> 				si-&gt;page_mem &gt;&gt; 10);</div><div class='ctx'> 	}</div><div class='del'>-	mutex_unlock(&amp;f2fs_stat_mutex);</div><div class='add'>+	spin_unlock(&amp;f2fs_stat_lock);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -584,12 +772,22 @@ int f2fs_build_stats(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_super_block *raw_super = F2FS_RAW_SUPER(sbi);</div><div class='ctx'> 	struct f2fs_stat_info *si;</div><div class='add'>+	struct f2fs_dev_stats *dev_stats;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='ctx'> 	si = f2fs_kzalloc(sbi, sizeof(struct f2fs_stat_info), GFP_KERNEL);</div><div class='ctx'> 	if (!si)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='add'>+	dev_stats = f2fs_kzalloc(sbi, sizeof(struct f2fs_dev_stats) *</div><div class='add'>+						sbi-&gt;s_ndevs, GFP_KERNEL);</div><div class='add'>+	if (!dev_stats) {</div><div class='add'>+		kfree(si);</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	si-&gt;dev_stats = dev_stats;</div><div class='add'>+</div><div class='ctx'> 	si-&gt;all_area_segs = le32_to_cpu(raw_super-&gt;segment_count);</div><div class='ctx'> 	si-&gt;sit_area_segs = le32_to_cpu(raw_super-&gt;segment_count_sit);</div><div class='ctx'> 	si-&gt;nat_area_segs = le32_to_cpu(raw_super-&gt;segment_count_nat);</div><div class='hunk'>@@ -601,27 +799,34 @@ int f2fs_build_stats(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	si-&gt;sbi = sbi;</div><div class='ctx'> 	sbi-&gt;stat_info = si;</div><div class='ctx'> </div><div class='del'>-	atomic64_set(&amp;sbi-&gt;total_hit_ext, 0);</div><div class='del'>-	atomic64_set(&amp;sbi-&gt;read_hit_rbtree, 0);</div><div class='add'>+	/* general extent cache stats */</div><div class='add'>+	for (i = 0; i &lt; NR_EXTENT_CACHES; i++) {</div><div class='add'>+		atomic64_set(&amp;sbi-&gt;total_hit_ext[i], 0);</div><div class='add'>+		atomic64_set(&amp;sbi-&gt;read_hit_rbtree[i], 0);</div><div class='add'>+		atomic64_set(&amp;sbi-&gt;read_hit_cached[i], 0);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* read extent_cache only */</div><div class='ctx'> 	atomic64_set(&amp;sbi-&gt;read_hit_largest, 0);</div><div class='del'>-	atomic64_set(&amp;sbi-&gt;read_hit_cached, 0);</div><div class='ctx'> </div><div class='ctx'> 	atomic_set(&amp;sbi-&gt;inline_xattr, 0);</div><div class='ctx'> 	atomic_set(&amp;sbi-&gt;inline_inode, 0);</div><div class='ctx'> 	atomic_set(&amp;sbi-&gt;inline_dir, 0);</div><div class='ctx'> 	atomic_set(&amp;sbi-&gt;compr_inode, 0);</div><div class='ctx'> 	atomic64_set(&amp;sbi-&gt;compr_blocks, 0);</div><div class='add'>+	atomic_set(&amp;sbi-&gt;swapfile_inode, 0);</div><div class='add'>+	atomic_set(&amp;sbi-&gt;atomic_files, 0);</div><div class='ctx'> 	atomic_set(&amp;sbi-&gt;inplace_count, 0);</div><div class='ctx'> 	for (i = META_CP; i &lt; META_MAX; i++)</div><div class='ctx'> 		atomic_set(&amp;sbi-&gt;meta_count[i], 0);</div><div class='add'>+	for (i = 0; i &lt; MAX_CALL_TYPE; i++)</div><div class='add'>+		atomic_set(&amp;sbi-&gt;cp_call_count[i], 0);</div><div class='ctx'> </div><div class='del'>-	atomic_set(&amp;sbi-&gt;vw_cnt, 0);</div><div class='ctx'> 	atomic_set(&amp;sbi-&gt;max_aw_cnt, 0);</div><div class='del'>-	atomic_set(&amp;sbi-&gt;max_vw_cnt, 0);</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;f2fs_stat_mutex);</div><div class='add'>+	spin_lock(&amp;f2fs_stat_lock);</div><div class='ctx'> 	list_add_tail(&amp;si-&gt;stat_list, &amp;f2fs_stat_list);</div><div class='del'>-	mutex_unlock(&amp;f2fs_stat_mutex);</div><div class='add'>+	spin_unlock(&amp;f2fs_stat_lock);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -630,10 +835,11 @@ void f2fs_destroy_stats(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_stat_info *si = F2FS_STAT(sbi);</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;f2fs_stat_mutex);</div><div class='add'>+	spin_lock(&amp;f2fs_stat_lock);</div><div class='ctx'> 	list_del(&amp;si-&gt;stat_list);</div><div class='del'>-	mutex_unlock(&amp;f2fs_stat_mutex);</div><div class='add'>+	spin_unlock(&amp;f2fs_stat_lock);</div><div class='ctx'> </div><div class='add'>+	kfree(si-&gt;dev_stats);</div><div class='ctx'> 	kfree(si);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/f2fs/dir.c b/fs/f2fs/dir.c<br/>index 1820e9c106f7..48f4f98afb01 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/dir.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/dir.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/dir.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/dir.c</a></div><div class='hunk'>@@ -5,7 +5,7 @@</div><div class='ctx'>  * Copyright (c) 2012 Samsung Electronics Co., Ltd.</div><div class='ctx'>  *             http://www.samsung.com/</div><div class='ctx'>  */</div><div class='del'>-#include &lt;asm/unaligned.h&gt;</div><div class='add'>+#include &lt;linux/unaligned.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/f2fs_fs.h&gt;</div><div class='ctx'> #include &lt;linux/sched/signal.h&gt;</div><div class='hunk'>@@ -16,7 +16,22 @@</div><div class='ctx'> #include "xattr.h"</div><div class='ctx'> #include &lt;trace/events/f2fs.h&gt;</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='add'>+static inline bool f2fs_should_fallback_to_linear(struct inode *dir)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(dir);</div><div class='add'>+</div><div class='add'>+	switch (F2FS_OPTION(sbi).lookup_mode) {</div><div class='add'>+	case LOOKUP_PERF:</div><div class='add'>+		return false;</div><div class='add'>+	case LOOKUP_COMPAT:</div><div class='add'>+		return true;</div><div class='add'>+	case LOOKUP_AUTO:</div><div class='add'>+		return !sb_no_casefold_compat_fallback(sbi-&gt;sb);</div><div class='add'>+	}</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='ctx'> extern struct kmem_cache *f2fs_cf_name_slab;</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='hunk'>@@ -29,7 +44,7 @@ static unsigned long dir_blocks(struct inode *inode)</div><div class='ctx'> static unsigned int dir_buckets(unsigned int level, int dir_level)</div><div class='ctx'> {</div><div class='ctx'> 	if (level + dir_level &lt; MAX_DIR_HASH_DEPTH / 2)</div><div class='del'>-		return 1 &lt;&lt; (level + dir_level);</div><div class='add'>+		return BIT(level + dir_level);</div><div class='ctx'> 	else</div><div class='ctx'> 		return MAX_DIR_BUCKETS;</div><div class='ctx'> }</div><div class='hunk'>@@ -42,67 +57,49 @@ static unsigned int bucket_blocks(unsigned int level)</div><div class='ctx'> 		return 4;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static unsigned char f2fs_filetype_table[F2FS_FT_MAX] = {</div><div class='del'>-	[F2FS_FT_UNKNOWN]	= DT_UNKNOWN,</div><div class='del'>-	[F2FS_FT_REG_FILE]	= DT_REG,</div><div class='del'>-	[F2FS_FT_DIR]		= DT_DIR,</div><div class='del'>-	[F2FS_FT_CHRDEV]	= DT_CHR,</div><div class='del'>-	[F2FS_FT_BLKDEV]	= DT_BLK,</div><div class='del'>-	[F2FS_FT_FIFO]		= DT_FIFO,</div><div class='del'>-	[F2FS_FT_SOCK]		= DT_SOCK,</div><div class='del'>-	[F2FS_FT_SYMLINK]	= DT_LNK,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static unsigned char f2fs_type_by_mode[S_IFMT &gt;&gt; S_SHIFT] = {</div><div class='del'>-	[S_IFREG &gt;&gt; S_SHIFT]	= F2FS_FT_REG_FILE,</div><div class='del'>-	[S_IFDIR &gt;&gt; S_SHIFT]	= F2FS_FT_DIR,</div><div class='del'>-	[S_IFCHR &gt;&gt; S_SHIFT]	= F2FS_FT_CHRDEV,</div><div class='del'>-	[S_IFBLK &gt;&gt; S_SHIFT]	= F2FS_FT_BLKDEV,</div><div class='del'>-	[S_IFIFO &gt;&gt; S_SHIFT]	= F2FS_FT_FIFO,</div><div class='del'>-	[S_IFSOCK &gt;&gt; S_SHIFT]	= F2FS_FT_SOCK,</div><div class='del'>-	[S_IFLNK &gt;&gt; S_SHIFT]	= F2FS_FT_SYMLINK,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static void set_de_type(struct f2fs_dir_entry *de, umode_t mode)</div><div class='del'>-{</div><div class='del'>-	de-&gt;file_type = f2fs_type_by_mode[(mode &amp; S_IFMT) &gt;&gt; S_SHIFT];</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-unsigned char f2fs_get_de_type(struct f2fs_dir_entry *de)</div><div class='del'>-{</div><div class='del'>-	if (de-&gt;file_type &lt; F2FS_FT_MAX)</div><div class='del'>-		return f2fs_filetype_table[de-&gt;file_type];</div><div class='del'>-	return DT_UNKNOWN;</div><div class='del'>-}</div><div class='del'>-</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='ctx'> /* If @dir is casefolded, initialize @fname-&gt;cf_name from @fname-&gt;usr_fname. */</div><div class='ctx'> int f2fs_init_casefolded_name(const struct inode *dir,</div><div class='ctx'> 			      struct f2fs_filename *fname)</div><div class='ctx'> {</div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='ctx'> 	struct super_block *sb = dir-&gt;i_sb;</div><div class='del'>-</div><div class='del'>-	if (IS_CASEFOLDED(dir)) {</div><div class='del'>-		fname-&gt;cf_name.name = f2fs_kmem_cache_alloc(f2fs_cf_name_slab,</div><div class='del'>-					GFP_NOFS, false, F2FS_SB(sb));</div><div class='del'>-		if (!fname-&gt;cf_name.name)</div><div class='add'>+	unsigned char *buf;</div><div class='add'>+	int len;</div><div class='add'>+</div><div class='add'>+	if (IS_CASEFOLDED(dir) &amp;&amp;</div><div class='add'>+	    !is_dot_dotdot(fname-&gt;usr_fname-&gt;name, fname-&gt;usr_fname-&gt;len)) {</div><div class='add'>+		buf = f2fs_kmem_cache_alloc(f2fs_cf_name_slab,</div><div class='add'>+					    GFP_NOFS, false, F2FS_SB(sb));</div><div class='add'>+		if (!buf)</div><div class='ctx'> 			return -ENOMEM;</div><div class='del'>-		fname-&gt;cf_name.len = utf8_casefold(sb-&gt;s_encoding,</div><div class='del'>-						   fname-&gt;usr_fname,</div><div class='del'>-						   fname-&gt;cf_name.name,</div><div class='del'>-						   F2FS_NAME_LEN);</div><div class='del'>-		if ((int)fname-&gt;cf_name.len &lt;= 0) {</div><div class='del'>-			kmem_cache_free(f2fs_cf_name_slab, fname-&gt;cf_name.name);</div><div class='del'>-			fname-&gt;cf_name.name = NULL;</div><div class='add'>+</div><div class='add'>+		len = utf8_casefold(sb-&gt;s_encoding, fname-&gt;usr_fname,</div><div class='add'>+				    buf, F2FS_NAME_LEN);</div><div class='add'>+		if (len &lt;= 0) {</div><div class='add'>+			kmem_cache_free(f2fs_cf_name_slab, buf);</div><div class='ctx'> 			if (sb_has_strict_encoding(sb))</div><div class='ctx'> 				return -EINVAL;</div><div class='ctx'> 			/* fall back to treating name as opaque byte sequence */</div><div class='add'>+			return 0;</div><div class='ctx'> 		}</div><div class='add'>+		fname-&gt;cf_name.name = buf;</div><div class='add'>+		fname-&gt;cf_name.len = len;</div><div class='ctx'> 	}</div><div class='del'>-#endif</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void f2fs_free_casefolded_name(struct f2fs_filename *fname)</div><div class='add'>+{</div><div class='add'>+	unsigned char *buf = (unsigned char *)fname-&gt;cf_name.name;</div><div class='add'>+</div><div class='add'>+	if (buf) {</div><div class='add'>+		kmem_cache_free(f2fs_cf_name_slab, buf);</div><div class='add'>+		fname-&gt;cf_name.name = NULL;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+#endif /* CONFIG_UNICODE */</div><div class='add'>+</div><div class='ctx'> static int __f2fs_setup_filename(const struct inode *dir,</div><div class='ctx'> 				 const struct fscrypt_name *crypt_name,</div><div class='ctx'> 				 struct f2fs_filename *fname)</div><div class='hunk'>@@ -174,12 +171,7 @@ void f2fs_free_filename(struct f2fs_filename *fname)</div><div class='ctx'> 	kfree(fname-&gt;crypto_buf.name);</div><div class='ctx'> 	fname-&gt;crypto_buf.name = NULL;</div><div class='ctx'> #endif</div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='del'>-	if (fname-&gt;cf_name.name) {</div><div class='del'>-		kmem_cache_free(f2fs_cf_name_slab, fname-&gt;cf_name.name);</div><div class='del'>-		fname-&gt;cf_name.name = NULL;</div><div class='del'>-	}</div><div class='del'>-#endif</div><div class='add'>+	f2fs_free_casefolded_name(fname);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static unsigned long dir_block_index(unsigned int level,</div><div class='hunk'>@@ -189,76 +181,26 @@ static unsigned long dir_block_index(unsigned int level,</div><div class='ctx'> 	unsigned long bidx = 0;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; level; i++)</div><div class='del'>-		bidx += dir_buckets(i, dir_level) * bucket_blocks(i);</div><div class='add'>+		bidx += mul_u32_u32(dir_buckets(i, dir_level),</div><div class='add'>+				    bucket_blocks(i));</div><div class='ctx'> 	bidx += idx * bucket_blocks(level);</div><div class='ctx'> 	return bidx;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct f2fs_dir_entry *find_in_block(struct inode *dir,</div><div class='del'>-				struct page *dentry_page,</div><div class='add'>+				struct folio *dentry_folio,</div><div class='ctx'> 				const struct f2fs_filename *fname,</div><div class='del'>-				int *max_slots)</div><div class='add'>+				int *max_slots,</div><div class='add'>+				bool use_hash)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_dentry_block *dentry_blk;</div><div class='ctx'> 	struct f2fs_dentry_ptr d;</div><div class='ctx'> </div><div class='del'>-	dentry_blk = (struct f2fs_dentry_block *)page_address(dentry_page);</div><div class='add'>+	dentry_blk = folio_address(dentry_folio);</div><div class='ctx'> </div><div class='ctx'> 	make_dentry_ptr_block(dir, &amp;d, dentry_blk);</div><div class='del'>-	return f2fs_find_target_dentry(&amp;d, fname, max_slots);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='del'>-/*</div><div class='del'>- * Test whether a case-insensitive directory entry matches the filename</div><div class='del'>- * being searched for.</div><div class='del'>- *</div><div class='del'>- * Returns 1 for a match, 0 for no match, and -errno on an error.</div><div class='del'>- */</div><div class='del'>-static int f2fs_match_ci_name(const struct inode *dir, const struct qstr *name,</div><div class='del'>-			       const u8 *de_name, u32 de_name_len)</div><div class='del'>-{</div><div class='del'>-	const struct super_block *sb = dir-&gt;i_sb;</div><div class='del'>-	const struct unicode_map *um = sb-&gt;s_encoding;</div><div class='del'>-	struct fscrypt_str decrypted_name = FSTR_INIT(NULL, de_name_len);</div><div class='del'>-	struct qstr entry = QSTR_INIT(de_name, de_name_len);</div><div class='del'>-	int res;</div><div class='del'>-</div><div class='del'>-	if (IS_ENCRYPTED(dir)) {</div><div class='del'>-		const struct fscrypt_str encrypted_name =</div><div class='del'>-			FSTR_INIT((u8 *)de_name, de_name_len);</div><div class='del'>-</div><div class='del'>-		if (WARN_ON_ONCE(!fscrypt_has_encryption_key(dir)))</div><div class='del'>-			return -EINVAL;</div><div class='del'>-</div><div class='del'>-		decrypted_name.name = kmalloc(de_name_len, GFP_KERNEL);</div><div class='del'>-		if (!decrypted_name.name)</div><div class='del'>-			return -ENOMEM;</div><div class='del'>-		res = fscrypt_fname_disk_to_usr(dir, 0, 0, &amp;encrypted_name,</div><div class='del'>-						&amp;decrypted_name);</div><div class='del'>-		if (res &lt; 0)</div><div class='del'>-			goto out;</div><div class='del'>-		entry.name = decrypted_name.name;</div><div class='del'>-		entry.len = decrypted_name.len;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	res = utf8_strncasecmp_folded(um, name, &amp;entry);</div><div class='del'>-	/*</div><div class='del'>-	 * In strict mode, ignore invalid names.  In non-strict mode,</div><div class='del'>-	 * fall back to treating them as opaque byte sequences.</div><div class='del'>-	 */</div><div class='del'>-	if (res &lt; 0 &amp;&amp; !sb_has_strict_encoding(sb)) {</div><div class='del'>-		res = name-&gt;len == entry.len &amp;&amp;</div><div class='del'>-				memcmp(name-&gt;name, entry.name, name-&gt;len) == 0;</div><div class='del'>-	} else {</div><div class='del'>-		/* utf8_strncasecmp_folded returns 0 on match */</div><div class='del'>-		res = (res == 0);</div><div class='del'>-	}</div><div class='del'>-out:</div><div class='del'>-	kfree(decrypted_name.name);</div><div class='del'>-	return res;</div><div class='add'>+	return f2fs_find_target_dentry(&amp;d, fname, max_slots, use_hash);</div><div class='ctx'> }</div><div class='del'>-#endif /* CONFIG_UNICODE */</div><div class='ctx'> </div><div class='ctx'> static inline int f2fs_match_name(const struct inode *dir,</div><div class='ctx'> 				   const struct f2fs_filename *fname,</div><div class='hunk'>@@ -266,12 +208,12 @@ static inline int f2fs_match_name(const struct inode *dir,</div><div class='ctx'> {</div><div class='ctx'> 	struct fscrypt_name f;</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='del'>-	if (fname-&gt;cf_name.name) {</div><div class='del'>-		struct qstr cf = FSTR_TO_QSTR(&amp;fname-&gt;cf_name);</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='add'>+	if (fname-&gt;cf_name.name)</div><div class='add'>+		return generic_ci_match(dir, fname-&gt;usr_fname,</div><div class='add'>+					&amp;fname-&gt;cf_name,</div><div class='add'>+					de_name, de_name_len);</div><div class='ctx'> </div><div class='del'>-		return f2fs_match_ci_name(dir, &amp;cf, de_name, de_name_len);</div><div class='del'>-	}</div><div class='ctx'> #endif</div><div class='ctx'> 	f.usr_fname = fname-&gt;usr_fname;</div><div class='ctx'> 	f.disk_name = fname-&gt;disk_name;</div><div class='hunk'>@@ -282,7 +224,8 @@ static inline int f2fs_match_name(const struct inode *dir,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct f2fs_dir_entry *f2fs_find_target_dentry(const struct f2fs_dentry_ptr *d,</div><div class='del'>-			const struct f2fs_filename *fname, int *max_slots)</div><div class='add'>+			const struct f2fs_filename *fname, int *max_slots,</div><div class='add'>+			bool use_hash)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_dir_entry *de;</div><div class='ctx'> 	unsigned long bit_pos = 0;</div><div class='hunk'>@@ -305,7 +248,7 @@ struct f2fs_dir_entry *f2fs_find_target_dentry(const struct f2fs_dentry_ptr *d,</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (de-&gt;hash_code == fname-&gt;hash) {</div><div class='add'>+		if (!use_hash || de-&gt;hash_code == fname-&gt;hash) {</div><div class='ctx'> 			res = f2fs_match_name(d-&gt;inode, fname,</div><div class='ctx'> 					      d-&gt;filename[bit_pos],</div><div class='ctx'> 					      le16_to_cpu(de-&gt;name_len));</div><div class='hunk'>@@ -332,72 +275,90 @@ found:</div><div class='ctx'> static struct f2fs_dir_entry *find_in_level(struct inode *dir,</div><div class='ctx'> 					unsigned int level,</div><div class='ctx'> 					const struct f2fs_filename *fname,</div><div class='del'>-					struct page **res_page)</div><div class='add'>+					struct folio **res_folio,</div><div class='add'>+					bool use_hash)</div><div class='ctx'> {</div><div class='ctx'> 	int s = GET_DENTRY_SLOTS(fname-&gt;disk_name.len);</div><div class='ctx'> 	unsigned int nbucket, nblock;</div><div class='del'>-	unsigned int bidx, end_block;</div><div class='del'>-	struct page *dentry_page;</div><div class='add'>+	unsigned int bidx, end_block, bucket_no;</div><div class='ctx'> 	struct f2fs_dir_entry *de = NULL;</div><div class='add'>+	pgoff_t next_pgofs;</div><div class='ctx'> 	bool room = false;</div><div class='ctx'> 	int max_slots;</div><div class='ctx'> </div><div class='ctx'> 	nbucket = dir_buckets(level, F2FS_I(dir)-&gt;i_dir_level);</div><div class='ctx'> 	nblock = bucket_blocks(level);</div><div class='ctx'> </div><div class='add'>+	bucket_no = use_hash ? le32_to_cpu(fname-&gt;hash) % nbucket : 0;</div><div class='add'>+</div><div class='add'>+start_find_bucket:</div><div class='ctx'> 	bidx = dir_block_index(level, F2FS_I(dir)-&gt;i_dir_level,</div><div class='del'>-			       le32_to_cpu(fname-&gt;hash) % nbucket);</div><div class='add'>+			       bucket_no);</div><div class='ctx'> 	end_block = bidx + nblock;</div><div class='ctx'> </div><div class='del'>-	for (; bidx &lt; end_block; bidx++) {</div><div class='add'>+	while (bidx &lt; end_block) {</div><div class='ctx'> 		/* no need to allocate new dentry pages to all the indices */</div><div class='del'>-		dentry_page = f2fs_find_data_page(dir, bidx);</div><div class='del'>-		if (IS_ERR(dentry_page)) {</div><div class='del'>-			if (PTR_ERR(dentry_page) == -ENOENT) {</div><div class='add'>+		struct folio *dentry_folio;</div><div class='add'>+		dentry_folio = f2fs_find_data_folio(dir, bidx, &amp;next_pgofs);</div><div class='add'>+		if (IS_ERR(dentry_folio)) {</div><div class='add'>+			if (PTR_ERR(dentry_folio) == -ENOENT) {</div><div class='ctx'> 				room = true;</div><div class='add'>+				bidx = next_pgofs;</div><div class='ctx'> 				continue;</div><div class='ctx'> 			} else {</div><div class='del'>-				*res_page = dentry_page;</div><div class='add'>+				*res_folio = dentry_folio;</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		de = find_in_block(dir, dentry_page, fname, &amp;max_slots);</div><div class='add'>+		de = find_in_block(dir, dentry_folio, fname, &amp;max_slots, use_hash);</div><div class='ctx'> 		if (IS_ERR(de)) {</div><div class='del'>-			*res_page = ERR_CAST(de);</div><div class='add'>+			*res_folio = ERR_CAST(de);</div><div class='ctx'> 			de = NULL;</div><div class='ctx'> 			break;</div><div class='ctx'> 		} else if (de) {</div><div class='del'>-			*res_page = dentry_page;</div><div class='add'>+			*res_folio = dentry_folio;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (max_slots &gt;= s)</div><div class='ctx'> 			room = true;</div><div class='del'>-		f2fs_put_page(dentry_page, 0);</div><div class='del'>-	}</div><div class='add'>+		f2fs_folio_put(dentry_folio, false);</div><div class='ctx'> </div><div class='del'>-	if (!de &amp;&amp; room &amp;&amp; F2FS_I(dir)-&gt;chash != fname-&gt;hash) {</div><div class='del'>-		F2FS_I(dir)-&gt;chash = fname-&gt;hash;</div><div class='del'>-		F2FS_I(dir)-&gt;clevel = level;</div><div class='add'>+		bidx++;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return de;</div><div class='add'>+	if (de)</div><div class='add'>+		return de;</div><div class='add'>+</div><div class='add'>+	if (likely(use_hash)) {</div><div class='add'>+		if (room &amp;&amp; F2FS_I(dir)-&gt;chash != fname-&gt;hash) {</div><div class='add'>+			F2FS_I(dir)-&gt;chash = fname-&gt;hash;</div><div class='add'>+			F2FS_I(dir)-&gt;clevel = level;</div><div class='add'>+		}</div><div class='add'>+	} else if (++bucket_no &lt; nbucket) {</div><div class='add'>+		goto start_find_bucket;</div><div class='add'>+	}</div><div class='add'>+	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct f2fs_dir_entry *__f2fs_find_entry(struct inode *dir,</div><div class='ctx'> 					 const struct f2fs_filename *fname,</div><div class='del'>-					 struct page **res_page)</div><div class='add'>+					 struct folio **res_folio)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned long npages = dir_blocks(dir);</div><div class='ctx'> 	struct f2fs_dir_entry *de = NULL;</div><div class='ctx'> 	unsigned int max_depth;</div><div class='ctx'> 	unsigned int level;</div><div class='add'>+	bool use_hash = true;</div><div class='ctx'> </div><div class='del'>-	*res_page = NULL;</div><div class='add'>+	*res_folio = NULL;</div><div class='ctx'> </div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='add'>+start_find_entry:</div><div class='add'>+#endif</div><div class='ctx'> 	if (f2fs_has_inline_dentry(dir)) {</div><div class='del'>-		de = f2fs_find_in_inline_dir(dir, fname, res_page);</div><div class='add'>+		de = f2fs_find_in_inline_dir(dir, fname, res_folio, use_hash);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -413,11 +374,19 @@ struct f2fs_dir_entry *__f2fs_find_entry(struct inode *dir,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	for (level = 0; level &lt; max_depth; level++) {</div><div class='del'>-		de = find_in_level(dir, level, fname, res_page);</div><div class='del'>-		if (de || IS_ERR(*res_page))</div><div class='add'>+		de = find_in_level(dir, level, fname, res_folio, use_hash);</div><div class='add'>+		if (de || IS_ERR(*res_folio))</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> out:</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='add'>+	if (f2fs_should_fallback_to_linear(dir) &amp;&amp;</div><div class='add'>+		IS_CASEFOLDED(dir) &amp;&amp; !de &amp;&amp; use_hash) {</div><div class='add'>+		use_hash = false;</div><div class='add'>+		goto start_find_entry;</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='ctx'> 	/* This is to increase the speed of f2fs_create */</div><div class='ctx'> 	if (!de)</div><div class='ctx'> 		F2FS_I(dir)-&gt;task = current;</div><div class='hunk'>@@ -431,7 +400,7 @@ out:</div><div class='ctx'>  * Entry is guaranteed to be valid.</div><div class='ctx'>  */</div><div class='ctx'> struct f2fs_dir_entry *f2fs_find_entry(struct inode *dir,</div><div class='del'>-			const struct qstr *child, struct page **res_page)</div><div class='add'>+			const struct qstr *child, struct folio **res_folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_dir_entry *de = NULL;</div><div class='ctx'> 	struct f2fs_filename fname;</div><div class='hunk'>@@ -440,67 +409,67 @@ struct f2fs_dir_entry *f2fs_find_entry(struct inode *dir,</div><div class='ctx'> 	err = f2fs_setup_filename(dir, child, 1, &amp;fname);</div><div class='ctx'> 	if (err) {</div><div class='ctx'> 		if (err == -ENOENT)</div><div class='del'>-			*res_page = NULL;</div><div class='add'>+			*res_folio = NULL;</div><div class='ctx'> 		else</div><div class='del'>-			*res_page = ERR_PTR(err);</div><div class='add'>+			*res_folio = ERR_PTR(err);</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	de = __f2fs_find_entry(dir, &amp;fname, res_page);</div><div class='add'>+	de = __f2fs_find_entry(dir, &amp;fname, res_folio);</div><div class='ctx'> </div><div class='ctx'> 	f2fs_free_filename(&amp;fname);</div><div class='ctx'> 	return de;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct f2fs_dir_entry *f2fs_parent_dir(struct inode *dir, struct page **p)</div><div class='add'>+struct f2fs_dir_entry *f2fs_parent_dir(struct inode *dir, struct folio **f)</div><div class='ctx'> {</div><div class='del'>-	return f2fs_find_entry(dir, &amp;dotdot_name, p);</div><div class='add'>+	return f2fs_find_entry(dir, &amp;dotdot_name, f);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> ino_t f2fs_inode_by_name(struct inode *dir, const struct qstr *qstr,</div><div class='del'>-							struct page **page)</div><div class='add'>+							struct folio **folio)</div><div class='ctx'> {</div><div class='ctx'> 	ino_t res = 0;</div><div class='ctx'> 	struct f2fs_dir_entry *de;</div><div class='ctx'> </div><div class='del'>-	de = f2fs_find_entry(dir, qstr, page);</div><div class='add'>+	de = f2fs_find_entry(dir, qstr, folio);</div><div class='ctx'> 	if (de) {</div><div class='ctx'> 		res = le32_to_cpu(de-&gt;ino);</div><div class='del'>-		f2fs_put_page(*page, 0);</div><div class='add'>+		f2fs_folio_put(*folio, false);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_set_link(struct inode *dir, struct f2fs_dir_entry *de,</div><div class='del'>-		struct page *page, struct inode *inode)</div><div class='add'>+		struct folio *folio, struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	enum page_type type = f2fs_has_inline_dentry(dir) ? NODE : DATA;</div><div class='ctx'> </div><div class='del'>-	lock_page(page);</div><div class='del'>-	f2fs_wait_on_page_writeback(page, type, true, true);</div><div class='add'>+	folio_lock(folio);</div><div class='add'>+	f2fs_folio_wait_writeback(folio, type, true, true);</div><div class='ctx'> 	de-&gt;ino = cpu_to_le32(inode-&gt;i_ino);</div><div class='del'>-	set_de_type(de, inode-&gt;i_mode);</div><div class='del'>-	set_page_dirty(page);</div><div class='add'>+	de-&gt;file_type = fs_umode_to_ftype(inode-&gt;i_mode);</div><div class='add'>+	folio_mark_dirty(folio);</div><div class='ctx'> </div><div class='del'>-	dir-&gt;i_mtime = dir-&gt;i_ctime = current_time(dir);</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='ctx'> 	f2fs_mark_inode_dirty_sync(dir, false);</div><div class='del'>-	f2fs_put_page(page, 1);</div><div class='add'>+	f2fs_folio_put(folio, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void init_dent_inode(struct inode *dir, struct inode *inode,</div><div class='ctx'> 			    const struct f2fs_filename *fname,</div><div class='del'>-			    struct page *ipage)</div><div class='add'>+			    struct folio *ifolio)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_inode *ri;</div><div class='ctx'> </div><div class='ctx'> 	if (!fname) /* tmpfile case? */</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	f2fs_wait_on_page_writeback(ipage, NODE, true, true);</div><div class='add'>+	f2fs_folio_wait_writeback(ifolio, NODE, true, true);</div><div class='ctx'> </div><div class='del'>-	/* copy name info. to this inode page */</div><div class='del'>-	ri = F2FS_INODE(ipage);</div><div class='add'>+	/* copy name info. to this inode folio */</div><div class='add'>+	ri = F2FS_INODE(ifolio);</div><div class='ctx'> 	ri-&gt;i_namelen = cpu_to_le32(fname-&gt;disk_name.len);</div><div class='ctx'> 	memcpy(ri-&gt;i_name, fname-&gt;disk_name.name, fname-&gt;disk_name.len);</div><div class='ctx'> 	if (IS_ENCRYPTED(dir)) {</div><div class='hunk'>@@ -521,7 +490,7 @@ static void init_dent_inode(struct inode *dir, struct inode *inode,</div><div class='ctx'> 				file_lost_pino(inode);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	set_page_dirty(ipage);</div><div class='add'>+	folio_mark_dirty(ifolio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_do_make_empty_dir(struct inode *inode, struct inode *parent,</div><div class='hunk'>@@ -538,72 +507,73 @@ void f2fs_do_make_empty_dir(struct inode *inode, struct inode *parent,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int make_empty_dir(struct inode *inode,</div><div class='del'>-		struct inode *parent, struct page *page)</div><div class='add'>+		struct inode *parent, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct page *dentry_page;</div><div class='add'>+	struct folio *dentry_folio;</div><div class='ctx'> 	struct f2fs_dentry_block *dentry_blk;</div><div class='ctx'> 	struct f2fs_dentry_ptr d;</div><div class='ctx'> </div><div class='ctx'> 	if (f2fs_has_inline_dentry(inode))</div><div class='del'>-		return f2fs_make_empty_inline_dir(inode, parent, page);</div><div class='add'>+		return f2fs_make_empty_inline_dir(inode, parent, folio);</div><div class='ctx'> </div><div class='del'>-	dentry_page = f2fs_get_new_data_page(inode, page, 0, true);</div><div class='del'>-	if (IS_ERR(dentry_page))</div><div class='del'>-		return PTR_ERR(dentry_page);</div><div class='add'>+	dentry_folio = f2fs_get_new_data_folio(inode, folio, 0, true);</div><div class='add'>+	if (IS_ERR(dentry_folio))</div><div class='add'>+		return PTR_ERR(dentry_folio);</div><div class='ctx'> </div><div class='del'>-	dentry_blk = page_address(dentry_page);</div><div class='add'>+	dentry_blk = folio_address(dentry_folio);</div><div class='ctx'> </div><div class='ctx'> 	make_dentry_ptr_block(NULL, &amp;d, dentry_blk);</div><div class='ctx'> 	f2fs_do_make_empty_dir(inode, parent, &amp;d);</div><div class='ctx'> </div><div class='del'>-	set_page_dirty(dentry_page);</div><div class='del'>-	f2fs_put_page(dentry_page, 1);</div><div class='add'>+	folio_mark_dirty(dentry_folio);</div><div class='add'>+	f2fs_folio_put(dentry_folio, true);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct page *f2fs_init_inode_metadata(struct inode *inode, struct inode *dir,</div><div class='del'>-			const struct f2fs_filename *fname, struct page *dpage)</div><div class='add'>+struct folio *f2fs_init_inode_metadata(struct inode *inode, struct inode *dir,</div><div class='add'>+		const struct f2fs_filename *fname, struct folio *dfolio)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (is_inode_flag_set(inode, FI_NEW_INODE)) {</div><div class='del'>-		page = f2fs_new_inode_page(inode);</div><div class='del'>-		if (IS_ERR(page))</div><div class='del'>-			return page;</div><div class='add'>+		folio = f2fs_new_inode_folio(inode);</div><div class='add'>+		if (IS_ERR(folio))</div><div class='add'>+			return folio;</div><div class='ctx'> </div><div class='ctx'> 		if (S_ISDIR(inode-&gt;i_mode)) {</div><div class='ctx'> 			/* in order to handle error case */</div><div class='del'>-			get_page(page);</div><div class='del'>-			err = make_empty_dir(inode, dir, page);</div><div class='add'>+			folio_get(folio);</div><div class='add'>+			err = make_empty_dir(inode, dir, folio);</div><div class='ctx'> 			if (err) {</div><div class='del'>-				lock_page(page);</div><div class='add'>+				folio_lock(folio);</div><div class='ctx'> 				goto put_error;</div><div class='ctx'> 			}</div><div class='del'>-			put_page(page);</div><div class='add'>+			folio_put(folio);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		err = f2fs_init_acl(inode, dir, page, dpage);</div><div class='add'>+		err = f2fs_init_acl(inode, dir, folio, dfolio);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto put_error;</div><div class='ctx'> </div><div class='ctx'> 		err = f2fs_init_security(inode, dir,</div><div class='del'>-					 fname ? fname-&gt;usr_fname : NULL, page);</div><div class='add'>+					 fname ? fname-&gt;usr_fname : NULL,</div><div class='add'>+					 folio);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto put_error;</div><div class='ctx'> </div><div class='ctx'> 		if (IS_ENCRYPTED(inode)) {</div><div class='del'>-			err = fscrypt_set_context(inode, page);</div><div class='add'>+			err = fscrypt_set_context(inode, folio);</div><div class='ctx'> 			if (err)</div><div class='ctx'> 				goto put_error;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='del'>-		page = f2fs_get_node_page(F2FS_I_SB(dir), inode-&gt;i_ino);</div><div class='del'>-		if (IS_ERR(page))</div><div class='del'>-			return page;</div><div class='add'>+		folio = f2fs_get_inode_folio(F2FS_I_SB(dir), inode-&gt;i_ino);</div><div class='add'>+		if (IS_ERR(folio))</div><div class='add'>+			return folio;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	init_dent_inode(dir, inode, fname, page);</div><div class='add'>+	init_dent_inode(dir, inode, fname, folio);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * This file should be checkpointed during fsync.</div><div class='hunk'>@@ -620,12 +590,12 @@ struct page *f2fs_init_inode_metadata(struct inode *inode, struct inode *dir,</div><div class='ctx'> 			f2fs_remove_orphan_inode(F2FS_I_SB(dir), inode-&gt;i_ino);</div><div class='ctx'> 		f2fs_i_links_write(inode, true);</div><div class='ctx'> 	}</div><div class='del'>-	return page;</div><div class='add'>+	return folio;</div><div class='ctx'> </div><div class='ctx'> put_error:</div><div class='ctx'> 	clear_nlink(inode);</div><div class='del'>-	f2fs_update_inode(inode, page);</div><div class='del'>-	f2fs_put_page(page, 1);</div><div class='add'>+	f2fs_update_inode(inode, folio);</div><div class='add'>+	f2fs_folio_put(folio, true);</div><div class='ctx'> 	return ERR_PTR(err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -637,7 +607,7 @@ void f2fs_update_parent_metadata(struct inode *dir, struct inode *inode,</div><div class='ctx'> 			f2fs_i_links_write(dir, true);</div><div class='ctx'> 		clear_inode_flag(inode, FI_NEW_INODE);</div><div class='ctx'> 	}</div><div class='del'>-	dir-&gt;i_mtime = dir-&gt;i_ctime = current_time(dir);</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='ctx'> 	f2fs_mark_inode_dirty_sync(dir, false);</div><div class='ctx'> </div><div class='ctx'> 	if (F2FS_I(dir)-&gt;i_current_depth != current_depth)</div><div class='hunk'>@@ -667,14 +637,14 @@ next:</div><div class='ctx'> 	goto next;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-bool f2fs_has_enough_room(struct inode *dir, struct page *ipage,</div><div class='add'>+bool f2fs_has_enough_room(struct inode *dir, struct folio *ifolio,</div><div class='ctx'> 			  const struct f2fs_filename *fname)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_dentry_ptr d;</div><div class='ctx'> 	unsigned int bit_pos;</div><div class='ctx'> 	int slots = GET_DENTRY_SLOTS(fname-&gt;disk_name.len);</div><div class='ctx'> </div><div class='del'>-	make_dentry_ptr_inline(dir, &amp;d, inline_data_addr(dir, ipage));</div><div class='add'>+	make_dentry_ptr_inline(dir, &amp;d, inline_data_addr(dir, ifolio));</div><div class='ctx'> </div><div class='ctx'> 	bit_pos = f2fs_room_for_filename(d.bitmap, slots, d.max);</div><div class='ctx'> </div><div class='hunk'>@@ -694,7 +664,7 @@ void f2fs_update_dentry(nid_t ino, umode_t mode, struct f2fs_dentry_ptr *d,</div><div class='ctx'> 	de-&gt;name_len = cpu_to_le16(name-&gt;len);</div><div class='ctx'> 	memcpy(d-&gt;filename[bit_pos], name-&gt;name, name-&gt;len);</div><div class='ctx'> 	de-&gt;ino = cpu_to_le32(ino);</div><div class='del'>-	set_de_type(de, mode);</div><div class='add'>+	de-&gt;file_type = fs_umode_to_ftype(mode);</div><div class='ctx'> 	for (i = 0; i &lt; slots; i++) {</div><div class='ctx'> 		__set_bit_le(bit_pos + i, (void *)d-&gt;bitmap);</div><div class='ctx'> 		/* avoid wrong garbage data for readdir */</div><div class='hunk'>@@ -711,10 +681,10 @@ int f2fs_add_regular_entry(struct inode *dir, const struct f2fs_filename *fname,</div><div class='ctx'> 	unsigned int current_depth;</div><div class='ctx'> 	unsigned long bidx, block;</div><div class='ctx'> 	unsigned int nbucket, nblock;</div><div class='del'>-	struct page *dentry_page = NULL;</div><div class='add'>+	struct folio *dentry_folio = NULL;</div><div class='ctx'> 	struct f2fs_dentry_block *dentry_blk = NULL;</div><div class='ctx'> 	struct f2fs_dentry_ptr d;</div><div class='del'>-	struct page *page = NULL;</div><div class='add'>+	struct folio *folio = NULL;</div><div class='ctx'> 	int slots, err = 0;</div><div class='ctx'> </div><div class='ctx'> 	level = 0;</div><div class='hunk'>@@ -727,10 +697,8 @@ int f2fs_add_regular_entry(struct inode *dir, const struct f2fs_filename *fname,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> start:</div><div class='del'>-	if (time_to_inject(F2FS_I_SB(dir), FAULT_DIR_DEPTH)) {</div><div class='del'>-		f2fs_show_injection_info(F2FS_I_SB(dir), FAULT_DIR_DEPTH);</div><div class='add'>+	if (time_to_inject(F2FS_I_SB(dir), FAULT_DIR_DEPTH))</div><div class='ctx'> 		return -ENOSPC;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(current_depth == MAX_DIR_HASH_DEPTH))</div><div class='ctx'> 		return -ENOSPC;</div><div class='hunk'>@@ -746,30 +714,30 @@ start:</div><div class='ctx'> 				(le32_to_cpu(fname-&gt;hash) % nbucket));</div><div class='ctx'> </div><div class='ctx'> 	for (block = bidx; block &lt;= (bidx + nblock - 1); block++) {</div><div class='del'>-		dentry_page = f2fs_get_new_data_page(dir, NULL, block, true);</div><div class='del'>-		if (IS_ERR(dentry_page))</div><div class='del'>-			return PTR_ERR(dentry_page);</div><div class='add'>+		dentry_folio = f2fs_get_new_data_folio(dir, NULL, block, true);</div><div class='add'>+		if (IS_ERR(dentry_folio))</div><div class='add'>+			return PTR_ERR(dentry_folio);</div><div class='ctx'> </div><div class='del'>-		dentry_blk = page_address(dentry_page);</div><div class='add'>+		dentry_blk = folio_address(dentry_folio);</div><div class='ctx'> 		bit_pos = f2fs_room_for_filename(&amp;dentry_blk-&gt;dentry_bitmap,</div><div class='ctx'> 						slots, NR_DENTRY_IN_BLOCK);</div><div class='ctx'> 		if (bit_pos &lt; NR_DENTRY_IN_BLOCK)</div><div class='ctx'> 			goto add_dentry;</div><div class='ctx'> </div><div class='del'>-		f2fs_put_page(dentry_page, 1);</div><div class='add'>+		f2fs_folio_put(dentry_folio, true);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Move to next level to find the empty slot for new dentry */</div><div class='ctx'> 	++level;</div><div class='ctx'> 	goto start;</div><div class='ctx'> add_dentry:</div><div class='del'>-	f2fs_wait_on_page_writeback(dentry_page, DATA, true, true);</div><div class='add'>+	f2fs_folio_wait_writeback(dentry_folio, DATA, true, true);</div><div class='ctx'> </div><div class='ctx'> 	if (inode) {</div><div class='del'>-		down_write(&amp;F2FS_I(inode)-&gt;i_sem);</div><div class='del'>-		page = f2fs_init_inode_metadata(inode, dir, fname, NULL);</div><div class='del'>-		if (IS_ERR(page)) {</div><div class='del'>-			err = PTR_ERR(page);</div><div class='add'>+		f2fs_down_write(&amp;F2FS_I(inode)-&gt;i_sem);</div><div class='add'>+		folio = f2fs_init_inode_metadata(inode, dir, fname, NULL);</div><div class='add'>+		if (IS_ERR(folio)) {</div><div class='add'>+			err = PTR_ERR(folio);</div><div class='ctx'> 			goto fail;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -778,24 +746,24 @@ add_dentry:</div><div class='ctx'> 	f2fs_update_dentry(ino, mode, &amp;d, &amp;fname-&gt;disk_name, fname-&gt;hash,</div><div class='ctx'> 			   bit_pos);</div><div class='ctx'> </div><div class='del'>-	set_page_dirty(dentry_page);</div><div class='add'>+	folio_mark_dirty(dentry_folio);</div><div class='ctx'> </div><div class='ctx'> 	if (inode) {</div><div class='ctx'> 		f2fs_i_pino_write(inode, dir-&gt;i_ino);</div><div class='ctx'> </div><div class='ctx'> 		/* synchronize inode page's data from inode cache */</div><div class='ctx'> 		if (is_inode_flag_set(inode, FI_NEW_INODE))</div><div class='del'>-			f2fs_update_inode(inode, page);</div><div class='add'>+			f2fs_update_inode(inode, folio);</div><div class='ctx'> </div><div class='del'>-		f2fs_put_page(page, 1);</div><div class='add'>+		f2fs_folio_put(folio, true);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	f2fs_update_parent_metadata(dir, inode, current_depth);</div><div class='ctx'> fail:</div><div class='ctx'> 	if (inode)</div><div class='del'>-		up_write(&amp;F2FS_I(inode)-&gt;i_sem);</div><div class='add'>+		f2fs_up_write(&amp;F2FS_I(inode)-&gt;i_sem);</div><div class='ctx'> </div><div class='del'>-	f2fs_put_page(dentry_page, 1);</div><div class='add'>+	f2fs_folio_put(dentry_folio, true);</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='hunk'>@@ -805,8 +773,15 @@ int f2fs_add_dentry(struct inode *dir, const struct f2fs_filename *fname,</div><div class='ctx'> {</div><div class='ctx'> 	int err = -EAGAIN;</div><div class='ctx'> </div><div class='del'>-	if (f2fs_has_inline_dentry(dir))</div><div class='add'>+	if (f2fs_has_inline_dentry(dir)) {</div><div class='add'>+		/*</div><div class='add'>+		 * Should get i_xattr_sem to keep the lock order:</div><div class='add'>+		 * i_xattr_sem -&gt; inode_page lock used by f2fs_setxattr.</div><div class='add'>+		 */</div><div class='add'>+		f2fs_down_read(&amp;F2FS_I(dir)-&gt;i_xattr_sem);</div><div class='ctx'> 		err = f2fs_add_inline_entry(dir, fname, inode, ino, mode);</div><div class='add'>+		f2fs_up_read(&amp;F2FS_I(dir)-&gt;i_xattr_sem);</div><div class='add'>+	}</div><div class='ctx'> 	if (err == -EAGAIN)</div><div class='ctx'> 		err = f2fs_add_regular_entry(dir, fname, inode, ino, mode);</div><div class='ctx'> </div><div class='hunk'>@@ -822,7 +797,7 @@ int f2fs_do_add_link(struct inode *dir, const struct qstr *name,</div><div class='ctx'> 				struct inode *inode, nid_t ino, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_filename fname;</div><div class='del'>-	struct page *page = NULL;</div><div class='add'>+	struct folio *folio = NULL;</div><div class='ctx'> 	struct f2fs_dir_entry *de = NULL;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='hunk'>@@ -838,14 +813,14 @@ int f2fs_do_add_link(struct inode *dir, const struct qstr *name,</div><div class='ctx'> 	 * consistency more.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (current != F2FS_I(dir)-&gt;task) {</div><div class='del'>-		de = __f2fs_find_entry(dir, &amp;fname, &amp;page);</div><div class='add'>+		de = __f2fs_find_entry(dir, &amp;fname, &amp;folio);</div><div class='ctx'> 		F2FS_I(dir)-&gt;task = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (de) {</div><div class='del'>-		f2fs_put_page(page, 0);</div><div class='add'>+		f2fs_folio_put(folio, false);</div><div class='ctx'> 		err = -EEXIST;</div><div class='del'>-	} else if (IS_ERR(page)) {</div><div class='del'>-		err = PTR_ERR(page);</div><div class='add'>+	} else if (IS_ERR(folio)) {</div><div class='add'>+		err = PTR_ERR(folio);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		err = f2fs_add_dentry(dir, &amp;fname, inode, ino, mode);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -853,23 +828,24 @@ int f2fs_do_add_link(struct inode *dir, const struct qstr *name,</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int f2fs_do_tmpfile(struct inode *inode, struct inode *dir)</div><div class='add'>+int f2fs_do_tmpfile(struct inode *inode, struct inode *dir,</div><div class='add'>+					struct f2fs_filename *fname)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;F2FS_I(inode)-&gt;i_sem);</div><div class='del'>-	page = f2fs_init_inode_metadata(inode, dir, NULL, NULL);</div><div class='del'>-	if (IS_ERR(page)) {</div><div class='del'>-		err = PTR_ERR(page);</div><div class='add'>+	f2fs_down_write(&amp;F2FS_I(inode)-&gt;i_sem);</div><div class='add'>+	folio = f2fs_init_inode_metadata(inode, dir, fname, NULL);</div><div class='add'>+	if (IS_ERR(folio)) {</div><div class='add'>+		err = PTR_ERR(folio);</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='del'>-	f2fs_put_page(page, 1);</div><div class='add'>+	f2fs_folio_put(folio, true);</div><div class='ctx'> </div><div class='ctx'> 	clear_inode_flag(inode, FI_NEW_INODE);</div><div class='ctx'> 	f2fs_update_time(F2FS_I_SB(inode), REQ_TIME);</div><div class='ctx'> fail:</div><div class='del'>-	up_write(&amp;F2FS_I(inode)-&gt;i_sem);</div><div class='add'>+	f2fs_up_write(&amp;F2FS_I(inode)-&gt;i_sem);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -877,18 +853,18 @@ void f2fs_drop_nlink(struct inode *dir, struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(dir);</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;F2FS_I(inode)-&gt;i_sem);</div><div class='add'>+	f2fs_down_write(&amp;F2FS_I(inode)-&gt;i_sem);</div><div class='ctx'> </div><div class='ctx'> 	if (S_ISDIR(inode-&gt;i_mode))</div><div class='ctx'> 		f2fs_i_links_write(dir, false);</div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> </div><div class='ctx'> 	f2fs_i_links_write(inode, false);</div><div class='ctx'> 	if (S_ISDIR(inode-&gt;i_mode)) {</div><div class='ctx'> 		f2fs_i_links_write(inode, false);</div><div class='ctx'> 		f2fs_i_size_write(inode, 0);</div><div class='ctx'> 	}</div><div class='del'>-	up_write(&amp;F2FS_I(inode)-&gt;i_sem);</div><div class='add'>+	f2fs_up_write(&amp;F2FS_I(inode)-&gt;i_sem);</div><div class='ctx'> </div><div class='ctx'> 	if (inode-&gt;i_nlink == 0)</div><div class='ctx'> 		f2fs_add_orphan_inode(inode);</div><div class='hunk'>@@ -900,12 +876,13 @@ void f2fs_drop_nlink(struct inode *dir, struct inode *inode)</div><div class='ctx'>  * It only removes the dentry from the dentry page, corresponding name</div><div class='ctx'>  * entry in name page does not need to be touched during deletion.</div><div class='ctx'>  */</div><div class='del'>-void f2fs_delete_entry(struct f2fs_dir_entry *dentry, struct page *page,</div><div class='add'>+void f2fs_delete_entry(struct f2fs_dir_entry *dentry, struct folio *folio,</div><div class='ctx'> 					struct inode *dir, struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct	f2fs_dentry_block *dentry_blk;</div><div class='add'>+	struct f2fs_dentry_block *dentry_blk;</div><div class='ctx'> 	unsigned int bit_pos;</div><div class='ctx'> 	int slots = GET_DENTRY_SLOTS(le16_to_cpu(dentry-&gt;name_len));</div><div class='add'>+	pgoff_t index = folio-&gt;index;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='ctx'> 	f2fs_update_time(F2FS_I_SB(dir), REQ_TIME);</div><div class='hunk'>@@ -914,12 +891,12 @@ void f2fs_delete_entry(struct f2fs_dir_entry *dentry, struct page *page,</div><div class='ctx'> 		f2fs_add_ino_entry(F2FS_I_SB(dir), dir-&gt;i_ino, TRANS_DIR_INO);</div><div class='ctx'> </div><div class='ctx'> 	if (f2fs_has_inline_dentry(dir))</div><div class='del'>-		return f2fs_delete_inline_entry(dentry, page, dir, inode);</div><div class='add'>+		return f2fs_delete_inline_entry(dentry, folio, dir, inode);</div><div class='ctx'> </div><div class='del'>-	lock_page(page);</div><div class='del'>-	f2fs_wait_on_page_writeback(page, DATA, true, true);</div><div class='add'>+	folio_lock(folio);</div><div class='add'>+	f2fs_folio_wait_writeback(folio, DATA, true, true);</div><div class='ctx'> </div><div class='del'>-	dentry_blk = page_address(page);</div><div class='add'>+	dentry_blk = folio_address(folio);</div><div class='ctx'> 	bit_pos = dentry - dentry_blk-&gt;dentry;</div><div class='ctx'> 	for (i = 0; i &lt; slots; i++)</div><div class='ctx'> 		__clear_bit_le(bit_pos + i, &amp;dentry_blk-&gt;dentry_bitmap);</div><div class='hunk'>@@ -928,25 +905,21 @@ void f2fs_delete_entry(struct f2fs_dir_entry *dentry, struct page *page,</div><div class='ctx'> 	bit_pos = find_next_bit_le(&amp;dentry_blk-&gt;dentry_bitmap,</div><div class='ctx'> 			NR_DENTRY_IN_BLOCK,</div><div class='ctx'> 			0);</div><div class='del'>-	set_page_dirty(page);</div><div class='add'>+	folio_mark_dirty(folio);</div><div class='ctx'> </div><div class='ctx'> 	if (bit_pos == NR_DENTRY_IN_BLOCK &amp;&amp;</div><div class='del'>-		!f2fs_truncate_hole(dir, page-&gt;index, page-&gt;index + 1)) {</div><div class='del'>-		f2fs_clear_page_cache_dirty_tag(page);</div><div class='del'>-		clear_page_dirty_for_io(page);</div><div class='del'>-		ClearPageUptodate(page);</div><div class='del'>-</div><div class='del'>-		clear_page_private_gcing(page);</div><div class='add'>+		!f2fs_truncate_hole(dir, index, index + 1)) {</div><div class='add'>+		f2fs_clear_page_cache_dirty_tag(folio);</div><div class='add'>+		folio_clear_dirty_for_io(folio);</div><div class='add'>+		folio_clear_uptodate(folio);</div><div class='add'>+		folio_detach_private(folio);</div><div class='ctx'> </div><div class='ctx'> 		inode_dec_dirty_pages(dir);</div><div class='ctx'> 		f2fs_remove_dirty_inode(dir);</div><div class='del'>-</div><div class='del'>-		detach_page_private(page);</div><div class='del'>-		set_page_private(page, 0);</div><div class='ctx'> 	}</div><div class='del'>-	f2fs_put_page(page, 1);</div><div class='add'>+	f2fs_folio_put(folio, true);</div><div class='ctx'> </div><div class='del'>-	dir-&gt;i_ctime = dir-&gt;i_mtime = current_time(dir);</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='ctx'> 	f2fs_mark_inode_dirty_sync(dir, false);</div><div class='ctx'> </div><div class='ctx'> 	if (inode)</div><div class='hunk'>@@ -955,8 +928,7 @@ void f2fs_delete_entry(struct f2fs_dir_entry *dentry, struct page *page,</div><div class='ctx'> </div><div class='ctx'> bool f2fs_empty_dir(struct inode *dir)</div><div class='ctx'> {</div><div class='del'>-	unsigned long bidx;</div><div class='del'>-	struct page *dentry_page;</div><div class='add'>+	unsigned long bidx = 0;</div><div class='ctx'> 	unsigned int bit_pos;</div><div class='ctx'> 	struct f2fs_dentry_block *dentry_blk;</div><div class='ctx'> 	unsigned long nblock = dir_blocks(dir);</div><div class='hunk'>@@ -964,16 +936,21 @@ bool f2fs_empty_dir(struct inode *dir)</div><div class='ctx'> 	if (f2fs_has_inline_dentry(dir))</div><div class='ctx'> 		return f2fs_empty_inline_dir(dir);</div><div class='ctx'> </div><div class='del'>-	for (bidx = 0; bidx &lt; nblock; bidx++) {</div><div class='del'>-		dentry_page = f2fs_get_lock_data_page(dir, bidx, false);</div><div class='del'>-		if (IS_ERR(dentry_page)) {</div><div class='del'>-			if (PTR_ERR(dentry_page) == -ENOENT)</div><div class='add'>+	while (bidx &lt; nblock) {</div><div class='add'>+		pgoff_t next_pgofs;</div><div class='add'>+		struct folio *dentry_folio;</div><div class='add'>+</div><div class='add'>+		dentry_folio = f2fs_find_data_folio(dir, bidx, &amp;next_pgofs);</div><div class='add'>+		if (IS_ERR(dentry_folio)) {</div><div class='add'>+			if (PTR_ERR(dentry_folio) == -ENOENT) {</div><div class='add'>+				bidx = next_pgofs;</div><div class='ctx'> 				continue;</div><div class='del'>-			else</div><div class='add'>+			} else {</div><div class='ctx'> 				return false;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		dentry_blk = page_address(dentry_page);</div><div class='add'>+		dentry_blk = folio_address(dentry_folio);</div><div class='ctx'> 		if (bidx == 0)</div><div class='ctx'> 			bit_pos = 2;</div><div class='ctx'> 		else</div><div class='hunk'>@@ -982,10 +959,12 @@ bool f2fs_empty_dir(struct inode *dir)</div><div class='ctx'> 						NR_DENTRY_IN_BLOCK,</div><div class='ctx'> 						bit_pos);</div><div class='ctx'> </div><div class='del'>-		f2fs_put_page(dentry_page, 1);</div><div class='add'>+		f2fs_folio_put(dentry_folio, false);</div><div class='ctx'> </div><div class='ctx'> 		if (bit_pos &lt; NR_DENTRY_IN_BLOCK)</div><div class='ctx'> 			return false;</div><div class='add'>+</div><div class='add'>+		bidx++;</div><div class='ctx'> 	}</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='hunk'>@@ -999,7 +978,7 @@ int f2fs_fill_dentries(struct dir_context *ctx, struct f2fs_dentry_ptr *d,</div><div class='ctx'> 	struct fscrypt_str de_name = FSTR_INIT(NULL, 0);</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(d-&gt;inode);</div><div class='ctx'> 	struct blk_plug plug;</div><div class='del'>-	bool readdir_ra = sbi-&gt;readdir_ra == 1;</div><div class='add'>+	bool readdir_ra = sbi-&gt;readdir_ra;</div><div class='ctx'> 	bool found_valid_dirent = false;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -1016,9 +995,8 @@ int f2fs_fill_dentries(struct dir_context *ctx, struct f2fs_dentry_ptr *d,</div><div class='ctx'> 		de = &amp;d-&gt;dentry[bit_pos];</div><div class='ctx'> 		if (de-&gt;name_len == 0) {</div><div class='ctx'> 			if (found_valid_dirent || !bit_pos) {</div><div class='del'>-				printk_ratelimited(</div><div class='del'>-					"%sF2FS-fs (%s): invalid namelen(0), ino:%u, run fsck to fix.",</div><div class='del'>-					KERN_WARNING, sbi-&gt;sb-&gt;s_id,</div><div class='add'>+				f2fs_warn_ratelimited(sbi,</div><div class='add'>+					"invalid namelen(0), ino:%u, run fsck to fix.",</div><div class='ctx'> 					le32_to_cpu(de-&gt;ino));</div><div class='ctx'> 				set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='ctx'> 			}</div><div class='hunk'>@@ -1027,7 +1005,7 @@ int f2fs_fill_dentries(struct dir_context *ctx, struct f2fs_dentry_ptr *d,</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		d_type = f2fs_get_de_type(de);</div><div class='add'>+		d_type = fs_ftype_to_dtype(de-&gt;file_type);</div><div class='ctx'> </div><div class='ctx'> 		de_name.name = d-&gt;filename[bit_pos];</div><div class='ctx'> 		de_name.len = le16_to_cpu(de-&gt;name_len);</div><div class='hunk'>@@ -1040,6 +1018,7 @@ int f2fs_fill_dentries(struct dir_context *ctx, struct f2fs_dentry_ptr *d,</div><div class='ctx'> 				  __func__, le16_to_cpu(de-&gt;name_len));</div><div class='ctx'> 			set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='ctx'> 			err = -EFSCORRUPTED;</div><div class='add'>+			f2fs_handle_error(sbi, ERROR_CORRUPTED_DIRENT);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -1079,7 +1058,6 @@ static int f2fs_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='ctx'> 	unsigned long npages = dir_blocks(inode);</div><div class='ctx'> 	struct f2fs_dentry_block *dentry_blk = NULL;</div><div class='del'>-	struct page *dentry_page = NULL;</div><div class='ctx'> 	struct file_ra_state *ra = &amp;file-&gt;f_ra;</div><div class='ctx'> 	loff_t start_pos = ctx-&gt;pos;</div><div class='ctx'> 	unsigned int n = ((unsigned long)ctx-&gt;pos / NR_DENTRY_IN_BLOCK);</div><div class='hunk'>@@ -1102,7 +1080,9 @@ static int f2fs_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 		goto out_free;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	for (; n &lt; npages; n++, ctx-&gt;pos = n * NR_DENTRY_IN_BLOCK) {</div><div class='add'>+	for (; n &lt; npages; ctx-&gt;pos = n * NR_DENTRY_IN_BLOCK) {</div><div class='add'>+		struct folio *dentry_folio;</div><div class='add'>+		pgoff_t next_pgofs;</div><div class='ctx'> </div><div class='ctx'> 		/* allow readdir() to be interrupted */</div><div class='ctx'> 		if (fatal_signal_pending(current)) {</div><div class='hunk'>@@ -1116,29 +1096,29 @@ static int f2fs_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 			page_cache_sync_readahead(inode-&gt;i_mapping, ra, file, n,</div><div class='ctx'> 				min(npages - n, (pgoff_t)MAX_DIR_RA_PAGES));</div><div class='ctx'> </div><div class='del'>-		dentry_page = f2fs_find_data_page(inode, n);</div><div class='del'>-		if (IS_ERR(dentry_page)) {</div><div class='del'>-			err = PTR_ERR(dentry_page);</div><div class='add'>+		dentry_folio = f2fs_find_data_folio(inode, n, &amp;next_pgofs);</div><div class='add'>+		if (IS_ERR(dentry_folio)) {</div><div class='add'>+			err = PTR_ERR(dentry_folio);</div><div class='ctx'> 			if (err == -ENOENT) {</div><div class='ctx'> 				err = 0;</div><div class='add'>+				n = next_pgofs;</div><div class='ctx'> 				continue;</div><div class='ctx'> 			} else {</div><div class='ctx'> 				goto out_free;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		dentry_blk = page_address(dentry_page);</div><div class='add'>+		dentry_blk = folio_address(dentry_folio);</div><div class='ctx'> </div><div class='ctx'> 		make_dentry_ptr_block(inode, &amp;d, dentry_blk);</div><div class='ctx'> </div><div class='ctx'> 		err = f2fs_fill_dentries(ctx, &amp;d,</div><div class='ctx'> 				n * NR_DENTRY_IN_BLOCK, &amp;fstr);</div><div class='del'>-		if (err) {</div><div class='del'>-			f2fs_put_page(dentry_page, 0);</div><div class='add'>+		f2fs_folio_put(dentry_folio, false);</div><div class='add'>+		if (err)</div><div class='ctx'> 			break;</div><div class='del'>-		}</div><div class='ctx'> </div><div class='del'>-		f2fs_put_page(dentry_page, 0);</div><div class='add'>+		n++;</div><div class='ctx'> 	}</div><div class='ctx'> out_free:</div><div class='ctx'> 	fscrypt_fname_free_buffer(&amp;fstr);</div><div class='head'>diff --git a/fs/f2fs/extent_cache.c b/fs/f2fs/extent_cache.c<br/>index 866e72b29bd5..0ed84cc065a7 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/extent_cache.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/extent_cache.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/extent_cache.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/extent_cache.c</a></div><div class='hunk'>@@ -6,6 +6,10 @@</div><div class='ctx'>  * Copyright (c) 2015 Samsung Electronics</div><div class='ctx'>  * Authors: Jaegeuk Kim &lt;jaegeuk@kernel.org&gt;</div><div class='ctx'>  *          Chao Yu &lt;chao2.yu@samsung.com&gt;</div><div class='add'>+ *</div><div class='add'>+ * block_age-based extent cache added by:</div><div class='add'>+ * Copyright (c) 2022 xiaomi Co., Ltd.</div><div class='add'>+ *             http://www.xiaomi.com/</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='hunk'>@@ -15,118 +19,212 @@</div><div class='ctx'> #include "node.h"</div><div class='ctx'> #include &lt;trace/events/f2fs.h&gt;</div><div class='ctx'> </div><div class='del'>-static struct rb_entry *__lookup_rb_tree_fast(struct rb_entry *cached_re,</div><div class='del'>-							unsigned int ofs)</div><div class='add'>+bool sanity_check_extent_cache(struct inode *inode, struct folio *ifolio)</div><div class='ctx'> {</div><div class='del'>-	if (cached_re) {</div><div class='del'>-		if (cached_re-&gt;ofs &lt;= ofs &amp;&amp;</div><div class='del'>-				cached_re-&gt;ofs + cached_re-&gt;len &gt; ofs) {</div><div class='del'>-			return cached_re;</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='add'>+	struct f2fs_extent *i_ext = &amp;F2FS_INODE(ifolio)-&gt;i_ext;</div><div class='add'>+	struct extent_info ei;</div><div class='add'>+	int devi;</div><div class='add'>+</div><div class='add'>+	get_read_extent_info(&amp;ei, i_ext);</div><div class='add'>+</div><div class='add'>+	if (!ei.len)</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	if (!f2fs_is_valid_blkaddr(sbi, ei.blk, DATA_GENERIC_ENHANCE) ||</div><div class='add'>+	    !f2fs_is_valid_blkaddr(sbi, ei.blk + ei.len - 1,</div><div class='add'>+					DATA_GENERIC_ENHANCE)) {</div><div class='add'>+		f2fs_warn(sbi, "%s: inode (ino=%lx) extent info [%u, %u, %u] is incorrect, run fsck to fix",</div><div class='add'>+			  __func__, inode-&gt;i_ino,</div><div class='add'>+			  ei.blk, ei.fofs, ei.len);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!IS_DEVICE_ALIASING(inode))</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	for (devi = 0; devi &lt; sbi-&gt;s_ndevs; devi++) {</div><div class='add'>+		if (FDEV(devi).start_blk != ei.blk ||</div><div class='add'>+				FDEV(devi).end_blk != ei.blk + ei.len - 1)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		if (devi == 0) {</div><div class='add'>+			f2fs_warn(sbi,</div><div class='add'>+			    "%s: inode (ino=%lx) is an alias of meta device",</div><div class='add'>+			    __func__, inode-&gt;i_ino);</div><div class='add'>+			return false;</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='add'>+		if (bdev_is_zoned(FDEV(devi).bdev)) {</div><div class='add'>+			f2fs_warn(sbi,</div><div class='add'>+			    "%s: device alias inode (ino=%lx)'s extent info "</div><div class='add'>+			    "[%u, %u, %u] maps to zoned block device",</div><div class='add'>+			    __func__, inode-&gt;i_ino, ei.blk, ei.fofs, ei.len);</div><div class='add'>+			return false;</div><div class='add'>+		}</div><div class='add'>+		return true;</div><div class='ctx'> 	}</div><div class='del'>-	return NULL;</div><div class='add'>+</div><div class='add'>+	f2fs_warn(sbi, "%s: device alias inode (ino=%lx)'s extent info "</div><div class='add'>+			"[%u, %u, %u] is inconsistent w/ any devices",</div><div class='add'>+			__func__, inode-&gt;i_ino, ei.blk, ei.fofs, ei.len);</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct rb_entry *__lookup_rb_tree_slow(struct rb_root_cached *root,</div><div class='del'>-							unsigned int ofs)</div><div class='add'>+static void __set_extent_info(struct extent_info *ei,</div><div class='add'>+				unsigned int fofs, unsigned int len,</div><div class='add'>+				block_t blk, bool keep_clen,</div><div class='add'>+				unsigned long age, unsigned long last_blocks,</div><div class='add'>+				enum extent_type type)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node *node = root-&gt;rb_root.rb_node;</div><div class='del'>-	struct rb_entry *re;</div><div class='add'>+	ei-&gt;fofs = fofs;</div><div class='add'>+	ei-&gt;len = len;</div><div class='ctx'> </div><div class='del'>-	while (node) {</div><div class='del'>-		re = rb_entry(node, struct rb_entry, rb_node);</div><div class='del'>-</div><div class='del'>-		if (ofs &lt; re-&gt;ofs)</div><div class='del'>-			node = node-&gt;rb_left;</div><div class='del'>-		else if (ofs &gt;= re-&gt;ofs + re-&gt;len)</div><div class='del'>-			node = node-&gt;rb_right;</div><div class='del'>-		else</div><div class='del'>-			return re;</div><div class='add'>+	if (type == EX_READ) {</div><div class='add'>+		ei-&gt;blk = blk;</div><div class='add'>+		if (keep_clen)</div><div class='add'>+			return;</div><div class='add'>+#ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='add'>+		ei-&gt;c_len = 0;</div><div class='add'>+#endif</div><div class='add'>+	} else if (type == EX_BLOCK_AGE) {</div><div class='add'>+		ei-&gt;age = age;</div><div class='add'>+		ei-&gt;last_blocks = last_blocks;</div><div class='ctx'> 	}</div><div class='del'>-	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct rb_entry *f2fs_lookup_rb_tree(struct rb_root_cached *root,</div><div class='del'>-				struct rb_entry *cached_re, unsigned int ofs)</div><div class='add'>+static bool __init_may_extent_tree(struct inode *inode, enum extent_type type)</div><div class='ctx'> {</div><div class='del'>-	struct rb_entry *re;</div><div class='add'>+	if (type == EX_READ)</div><div class='add'>+		return test_opt(F2FS_I_SB(inode), READ_EXTENT_CACHE) &amp;&amp;</div><div class='add'>+			S_ISREG(inode-&gt;i_mode);</div><div class='add'>+	if (type == EX_BLOCK_AGE)</div><div class='add'>+		return test_opt(F2FS_I_SB(inode), AGE_EXTENT_CACHE) &amp;&amp;</div><div class='add'>+			(S_ISREG(inode-&gt;i_mode) || S_ISDIR(inode-&gt;i_mode));</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool __may_extent_tree(struct inode *inode, enum extent_type type)</div><div class='add'>+{</div><div class='add'>+	if (IS_DEVICE_ALIASING(inode) &amp;&amp; type == EX_READ)</div><div class='add'>+		return true;</div><div class='ctx'> </div><div class='del'>-	re = __lookup_rb_tree_fast(cached_re, ofs);</div><div class='del'>-	if (!re)</div><div class='del'>-		return __lookup_rb_tree_slow(root, ofs);</div><div class='add'>+	/*</div><div class='add'>+	 * for recovered files during mount do not create extents</div><div class='add'>+	 * if shrinker is not registered.</div><div class='add'>+	 */</div><div class='add'>+	if (list_empty(&amp;F2FS_I_SB(inode)-&gt;s_list))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	if (!__init_may_extent_tree(inode, type))</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-	return re;</div><div class='add'>+	if (type == EX_READ) {</div><div class='add'>+		if (is_inode_flag_set(inode, FI_NO_EXTENT))</div><div class='add'>+			return false;</div><div class='add'>+		if (is_inode_flag_set(inode, FI_COMPRESSED_FILE) &amp;&amp;</div><div class='add'>+				 !f2fs_sb_has_readonly(F2FS_I_SB(inode)))</div><div class='add'>+			return false;</div><div class='add'>+	} else if (type == EX_BLOCK_AGE) {</div><div class='add'>+		if (is_inode_flag_set(inode, FI_COMPRESSED_FILE))</div><div class='add'>+			return false;</div><div class='add'>+		if (file_is_cold(inode))</div><div class='add'>+			return false;</div><div class='add'>+	}</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct rb_node **f2fs_lookup_rb_tree_ext(struct f2fs_sb_info *sbi,</div><div class='del'>-					struct rb_root_cached *root,</div><div class='del'>-					struct rb_node **parent,</div><div class='del'>-					unsigned long long key, bool *leftmost)</div><div class='add'>+static void __try_update_largest_extent(struct extent_tree *et,</div><div class='add'>+						struct extent_node *en)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node **p = &amp;root-&gt;rb_root.rb_node;</div><div class='del'>-	struct rb_entry *re;</div><div class='add'>+	if (et-&gt;type != EX_READ)</div><div class='add'>+		return;</div><div class='add'>+	if (en-&gt;ei.len &lt;= et-&gt;largest.len)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	while (*p) {</div><div class='del'>-		*parent = *p;</div><div class='del'>-		re = rb_entry(*parent, struct rb_entry, rb_node);</div><div class='add'>+	et-&gt;largest = en-&gt;ei;</div><div class='add'>+	et-&gt;largest_updated = true;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		if (key &lt; re-&gt;key) {</div><div class='del'>-			p = &amp;(*p)-&gt;rb_left;</div><div class='del'>-		} else {</div><div class='del'>-			p = &amp;(*p)-&gt;rb_right;</div><div class='del'>-			*leftmost = false;</div><div class='del'>-		}</div><div class='add'>+static bool __is_extent_mergeable(struct extent_info *back,</div><div class='add'>+		struct extent_info *front, enum extent_type type)</div><div class='add'>+{</div><div class='add'>+	if (type == EX_READ) {</div><div class='add'>+#ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='add'>+		if (back-&gt;c_len &amp;&amp; back-&gt;len != back-&gt;c_len)</div><div class='add'>+			return false;</div><div class='add'>+		if (front-&gt;c_len &amp;&amp; front-&gt;len != front-&gt;c_len)</div><div class='add'>+			return false;</div><div class='add'>+#endif</div><div class='add'>+		return (back-&gt;fofs + back-&gt;len == front-&gt;fofs &amp;&amp;</div><div class='add'>+				back-&gt;blk + back-&gt;len == front-&gt;blk);</div><div class='add'>+	} else if (type == EX_BLOCK_AGE) {</div><div class='add'>+		return (back-&gt;fofs + back-&gt;len == front-&gt;fofs &amp;&amp;</div><div class='add'>+			abs(back-&gt;age - front-&gt;age) &lt;= SAME_AGE_REGION &amp;&amp;</div><div class='add'>+			abs(back-&gt;last_blocks - front-&gt;last_blocks) &lt;=</div><div class='add'>+							SAME_AGE_REGION);</div><div class='ctx'> 	}</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	return p;</div><div class='add'>+static bool __is_back_mergeable(struct extent_info *cur,</div><div class='add'>+		struct extent_info *back, enum extent_type type)</div><div class='add'>+{</div><div class='add'>+	return __is_extent_mergeable(back, cur, type);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct rb_node **f2fs_lookup_rb_tree_for_insert(struct f2fs_sb_info *sbi,</div><div class='del'>-				struct rb_root_cached *root,</div><div class='del'>-				struct rb_node **parent,</div><div class='del'>-				unsigned int ofs, bool *leftmost)</div><div class='add'>+static bool __is_front_mergeable(struct extent_info *cur,</div><div class='add'>+		struct extent_info *front, enum extent_type type)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node **p = &amp;root-&gt;rb_root.rb_node;</div><div class='del'>-	struct rb_entry *re;</div><div class='add'>+	return __is_extent_mergeable(cur, front, type);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	while (*p) {</div><div class='del'>-		*parent = *p;</div><div class='del'>-		re = rb_entry(*parent, struct rb_entry, rb_node);</div><div class='add'>+static struct extent_node *__lookup_extent_node(struct rb_root_cached *root,</div><div class='add'>+			struct extent_node *cached_en, unsigned int fofs)</div><div class='add'>+{</div><div class='add'>+	struct rb_node *node = root-&gt;rb_root.rb_node;</div><div class='add'>+	struct extent_node *en;</div><div class='ctx'> </div><div class='del'>-		if (ofs &lt; re-&gt;ofs) {</div><div class='del'>-			p = &amp;(*p)-&gt;rb_left;</div><div class='del'>-		} else if (ofs &gt;= re-&gt;ofs + re-&gt;len) {</div><div class='del'>-			p = &amp;(*p)-&gt;rb_right;</div><div class='del'>-			*leftmost = false;</div><div class='del'>-		} else {</div><div class='del'>-			f2fs_bug_on(sbi, 1);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	/* check a cached entry */</div><div class='add'>+	if (cached_en &amp;&amp; cached_en-&gt;ei.fofs &lt;= fofs &amp;&amp;</div><div class='add'>+			cached_en-&gt;ei.fofs + cached_en-&gt;ei.len &gt; fofs)</div><div class='add'>+		return cached_en;</div><div class='ctx'> </div><div class='del'>-	return p;</div><div class='add'>+	/* check rb_tree */</div><div class='add'>+	while (node) {</div><div class='add'>+		en = rb_entry(node, struct extent_node, rb_node);</div><div class='add'>+</div><div class='add'>+		if (fofs &lt; en-&gt;ei.fofs)</div><div class='add'>+			node = node-&gt;rb_left;</div><div class='add'>+		else if (fofs &gt;= en-&gt;ei.fofs + en-&gt;ei.len)</div><div class='add'>+			node = node-&gt;rb_right;</div><div class='add'>+		else</div><div class='add'>+			return en;</div><div class='add'>+	}</div><div class='add'>+	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * lookup rb entry in position of @ofs in rb-tree,</div><div class='add'>+ * lookup rb entry in position of @fofs in rb-tree,</div><div class='ctx'>  * if hit, return the entry, otherwise, return NULL</div><div class='del'>- * @prev_ex: extent before ofs</div><div class='del'>- * @next_ex: extent after ofs</div><div class='del'>- * @insert_p: insert point for new extent at ofs</div><div class='del'>- * in order to simpfy the insertion after.</div><div class='add'>+ * @prev_ex: extent before fofs</div><div class='add'>+ * @next_ex: extent after fofs</div><div class='add'>+ * @insert_p: insert point for new extent at fofs</div><div class='add'>+ * in order to simplify the insertion after.</div><div class='ctx'>  * tree must stay unchanged between lookup and insertion.</div><div class='ctx'>  */</div><div class='del'>-struct rb_entry *f2fs_lookup_rb_tree_ret(struct rb_root_cached *root,</div><div class='del'>-				struct rb_entry *cached_re,</div><div class='del'>-				unsigned int ofs,</div><div class='del'>-				struct rb_entry **prev_entry,</div><div class='del'>-				struct rb_entry **next_entry,</div><div class='add'>+static struct extent_node *__lookup_extent_node_ret(struct rb_root_cached *root,</div><div class='add'>+				struct extent_node *cached_en,</div><div class='add'>+				unsigned int fofs,</div><div class='add'>+				struct extent_node **prev_entry,</div><div class='add'>+				struct extent_node **next_entry,</div><div class='ctx'> 				struct rb_node ***insert_p,</div><div class='ctx'> 				struct rb_node **insert_parent,</div><div class='del'>-				bool force, bool *leftmost)</div><div class='add'>+				bool *leftmost)</div><div class='ctx'> {</div><div class='ctx'> 	struct rb_node **pnode = &amp;root-&gt;rb_root.rb_node;</div><div class='ctx'> 	struct rb_node *parent = NULL, *tmp_node;</div><div class='del'>-	struct rb_entry *re = cached_re;</div><div class='add'>+	struct extent_node *en = cached_en;</div><div class='ctx'> </div><div class='ctx'> 	*insert_p = NULL;</div><div class='ctx'> 	*insert_parent = NULL;</div><div class='hunk'>@@ -136,24 +234,20 @@ struct rb_entry *f2fs_lookup_rb_tree_ret(struct rb_root_cached *root,</div><div class='ctx'> 	if (RB_EMPTY_ROOT(&amp;root-&gt;rb_root))</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='del'>-	if (re) {</div><div class='del'>-		if (re-&gt;ofs &lt;= ofs &amp;&amp; re-&gt;ofs + re-&gt;len &gt; ofs)</div><div class='del'>-			goto lookup_neighbors;</div><div class='del'>-	}</div><div class='add'>+	if (en &amp;&amp; en-&gt;ei.fofs &lt;= fofs &amp;&amp; en-&gt;ei.fofs + en-&gt;ei.len &gt; fofs)</div><div class='add'>+		goto lookup_neighbors;</div><div class='ctx'> </div><div class='del'>-	if (leftmost)</div><div class='del'>-		*leftmost = true;</div><div class='add'>+	*leftmost = true;</div><div class='ctx'> </div><div class='ctx'> 	while (*pnode) {</div><div class='ctx'> 		parent = *pnode;</div><div class='del'>-		re = rb_entry(*pnode, struct rb_entry, rb_node);</div><div class='add'>+		en = rb_entry(*pnode, struct extent_node, rb_node);</div><div class='ctx'> </div><div class='del'>-		if (ofs &lt; re-&gt;ofs) {</div><div class='add'>+		if (fofs &lt; en-&gt;ei.fofs) {</div><div class='ctx'> 			pnode = &amp;(*pnode)-&gt;rb_left;</div><div class='del'>-		} else if (ofs &gt;= re-&gt;ofs + re-&gt;len) {</div><div class='add'>+		} else if (fofs &gt;= en-&gt;ei.fofs + en-&gt;ei.len) {</div><div class='ctx'> 			pnode = &amp;(*pnode)-&gt;rb_right;</div><div class='del'>-			if (leftmost)</div><div class='del'>-				*leftmost = false;</div><div class='add'>+			*leftmost = false;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			goto lookup_neighbors;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -162,71 +256,32 @@ struct rb_entry *f2fs_lookup_rb_tree_ret(struct rb_root_cached *root,</div><div class='ctx'> 	*insert_p = pnode;</div><div class='ctx'> 	*insert_parent = parent;</div><div class='ctx'> </div><div class='del'>-	re = rb_entry(parent, struct rb_entry, rb_node);</div><div class='add'>+	en = rb_entry(parent, struct extent_node, rb_node);</div><div class='ctx'> 	tmp_node = parent;</div><div class='del'>-	if (parent &amp;&amp; ofs &gt; re-&gt;ofs)</div><div class='add'>+	if (parent &amp;&amp; fofs &gt; en-&gt;ei.fofs)</div><div class='ctx'> 		tmp_node = rb_next(parent);</div><div class='del'>-	*next_entry = rb_entry_safe(tmp_node, struct rb_entry, rb_node);</div><div class='add'>+	*next_entry = rb_entry_safe(tmp_node, struct extent_node, rb_node);</div><div class='ctx'> </div><div class='ctx'> 	tmp_node = parent;</div><div class='del'>-	if (parent &amp;&amp; ofs &lt; re-&gt;ofs)</div><div class='add'>+	if (parent &amp;&amp; fofs &lt; en-&gt;ei.fofs)</div><div class='ctx'> 		tmp_node = rb_prev(parent);</div><div class='del'>-	*prev_entry = rb_entry_safe(tmp_node, struct rb_entry, rb_node);</div><div class='add'>+	*prev_entry = rb_entry_safe(tmp_node, struct extent_node, rb_node);</div><div class='ctx'> 	return NULL;</div><div class='ctx'> </div><div class='ctx'> lookup_neighbors:</div><div class='del'>-	if (ofs == re-&gt;ofs || force) {</div><div class='add'>+	if (fofs == en-&gt;ei.fofs) {</div><div class='ctx'> 		/* lookup prev node for merging backward later */</div><div class='del'>-		tmp_node = rb_prev(&amp;re-&gt;rb_node);</div><div class='del'>-		*prev_entry = rb_entry_safe(tmp_node, struct rb_entry, rb_node);</div><div class='add'>+		tmp_node = rb_prev(&amp;en-&gt;rb_node);</div><div class='add'>+		*prev_entry = rb_entry_safe(tmp_node,</div><div class='add'>+					struct extent_node, rb_node);</div><div class='ctx'> 	}</div><div class='del'>-	if (ofs == re-&gt;ofs + re-&gt;len - 1 || force) {</div><div class='add'>+	if (fofs == en-&gt;ei.fofs + en-&gt;ei.len - 1) {</div><div class='ctx'> 		/* lookup next node for merging frontward later */</div><div class='del'>-		tmp_node = rb_next(&amp;re-&gt;rb_node);</div><div class='del'>-		*next_entry = rb_entry_safe(tmp_node, struct rb_entry, rb_node);</div><div class='add'>+		tmp_node = rb_next(&amp;en-&gt;rb_node);</div><div class='add'>+		*next_entry = rb_entry_safe(tmp_node,</div><div class='add'>+					struct extent_node, rb_node);</div><div class='ctx'> 	}</div><div class='del'>-	return re;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-bool f2fs_check_rb_tree_consistence(struct f2fs_sb_info *sbi,</div><div class='del'>-				struct rb_root_cached *root, bool check_key)</div><div class='del'>-{</div><div class='del'>-#ifdef CONFIG_F2FS_CHECK_FS</div><div class='del'>-	struct rb_node *cur = rb_first_cached(root), *next;</div><div class='del'>-	struct rb_entry *cur_re, *next_re;</div><div class='del'>-</div><div class='del'>-	if (!cur)</div><div class='del'>-		return true;</div><div class='del'>-</div><div class='del'>-	while (cur) {</div><div class='del'>-		next = rb_next(cur);</div><div class='del'>-		if (!next)</div><div class='del'>-			return true;</div><div class='del'>-</div><div class='del'>-		cur_re = rb_entry(cur, struct rb_entry, rb_node);</div><div class='del'>-		next_re = rb_entry(next, struct rb_entry, rb_node);</div><div class='del'>-</div><div class='del'>-		if (check_key) {</div><div class='del'>-			if (cur_re-&gt;key &gt; next_re-&gt;key) {</div><div class='del'>-				f2fs_info(sbi, "inconsistent rbtree, "</div><div class='del'>-					"cur(%llu) next(%llu)",</div><div class='del'>-					cur_re-&gt;key, next_re-&gt;key);</div><div class='del'>-				return false;</div><div class='del'>-			}</div><div class='del'>-			goto next;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (cur_re-&gt;ofs + cur_re-&gt;len &gt; next_re-&gt;ofs) {</div><div class='del'>-			f2fs_info(sbi, "inconsistent rbtree, cur(%u, %u) next(%u, %u)",</div><div class='del'>-				  cur_re-&gt;ofs, cur_re-&gt;len,</div><div class='del'>-				  next_re-&gt;ofs, next_re-&gt;len);</div><div class='del'>-			return false;</div><div class='del'>-		}</div><div class='del'>-next:</div><div class='del'>-		cur = next;</div><div class='del'>-	}</div><div class='del'>-#endif</div><div class='del'>-	return true;</div><div class='add'>+	return en;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct kmem_cache *extent_tree_slab;</div><div class='hunk'>@@ -237,6 +292,7 @@ static struct extent_node *__attach_extent_node(struct f2fs_sb_info *sbi,</div><div class='ctx'> 				struct rb_node *parent, struct rb_node **p,</div><div class='ctx'> 				bool leftmost)</div><div class='ctx'> {</div><div class='add'>+	struct extent_tree_info *eti = &amp;sbi-&gt;extent_tree[et-&gt;type];</div><div class='ctx'> 	struct extent_node *en;</div><div class='ctx'> </div><div class='ctx'> 	en = f2fs_kmem_cache_alloc(extent_node_slab, GFP_ATOMIC, false, sbi);</div><div class='hunk'>@@ -250,16 +306,18 @@ static struct extent_node *__attach_extent_node(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	rb_link_node(&amp;en-&gt;rb_node, parent, p);</div><div class='ctx'> 	rb_insert_color_cached(&amp;en-&gt;rb_node, &amp;et-&gt;root, leftmost);</div><div class='ctx'> 	atomic_inc(&amp;et-&gt;node_cnt);</div><div class='del'>-	atomic_inc(&amp;sbi-&gt;total_ext_node);</div><div class='add'>+	atomic_inc(&amp;eti-&gt;total_ext_node);</div><div class='ctx'> 	return en;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void __detach_extent_node(struct f2fs_sb_info *sbi,</div><div class='ctx'> 				struct extent_tree *et, struct extent_node *en)</div><div class='ctx'> {</div><div class='add'>+	struct extent_tree_info *eti = &amp;sbi-&gt;extent_tree[et-&gt;type];</div><div class='add'>+</div><div class='ctx'> 	rb_erase_cached(&amp;en-&gt;rb_node, &amp;et-&gt;root);</div><div class='ctx'> 	atomic_dec(&amp;et-&gt;node_cnt);</div><div class='del'>-	atomic_dec(&amp;sbi-&gt;total_ext_node);</div><div class='add'>+	atomic_dec(&amp;eti-&gt;total_ext_node);</div><div class='ctx'> </div><div class='ctx'> 	if (et-&gt;cached_en == en)</div><div class='ctx'> 		et-&gt;cached_en = NULL;</div><div class='hunk'>@@ -275,183 +333,205 @@ static void __detach_extent_node(struct f2fs_sb_info *sbi,</div><div class='ctx'> static void __release_extent_node(struct f2fs_sb_info *sbi,</div><div class='ctx'> 			struct extent_tree *et, struct extent_node *en)</div><div class='ctx'> {</div><div class='del'>-	spin_lock(&amp;sbi-&gt;extent_lock);</div><div class='add'>+	struct extent_tree_info *eti = &amp;sbi-&gt;extent_tree[et-&gt;type];</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;eti-&gt;extent_lock);</div><div class='ctx'> 	f2fs_bug_on(sbi, list_empty(&amp;en-&gt;list));</div><div class='ctx'> 	list_del_init(&amp;en-&gt;list);</div><div class='del'>-	spin_unlock(&amp;sbi-&gt;extent_lock);</div><div class='add'>+	spin_unlock(&amp;eti-&gt;extent_lock);</div><div class='ctx'> </div><div class='ctx'> 	__detach_extent_node(sbi, et, en);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct extent_tree *__grab_extent_tree(struct inode *inode)</div><div class='add'>+static struct extent_tree *__grab_extent_tree(struct inode *inode,</div><div class='add'>+						enum extent_type type)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='add'>+	struct extent_tree_info *eti = &amp;sbi-&gt;extent_tree[type];</div><div class='ctx'> 	struct extent_tree *et;</div><div class='ctx'> 	nid_t ino = inode-&gt;i_ino;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;sbi-&gt;extent_tree_lock);</div><div class='del'>-	et = radix_tree_lookup(&amp;sbi-&gt;extent_tree_root, ino);</div><div class='add'>+	mutex_lock(&amp;eti-&gt;extent_tree_lock);</div><div class='add'>+	et = radix_tree_lookup(&amp;eti-&gt;extent_tree_root, ino);</div><div class='ctx'> 	if (!et) {</div><div class='ctx'> 		et = f2fs_kmem_cache_alloc(extent_tree_slab,</div><div class='ctx'> 					GFP_NOFS, true, NULL);</div><div class='del'>-		f2fs_radix_tree_insert(&amp;sbi-&gt;extent_tree_root, ino, et);</div><div class='add'>+		f2fs_radix_tree_insert(&amp;eti-&gt;extent_tree_root, ino, et);</div><div class='ctx'> 		memset(et, 0, sizeof(struct extent_tree));</div><div class='ctx'> 		et-&gt;ino = ino;</div><div class='add'>+		et-&gt;type = type;</div><div class='ctx'> 		et-&gt;root = RB_ROOT_CACHED;</div><div class='ctx'> 		et-&gt;cached_en = NULL;</div><div class='ctx'> 		rwlock_init(&amp;et-&gt;lock);</div><div class='ctx'> 		INIT_LIST_HEAD(&amp;et-&gt;list);</div><div class='ctx'> 		atomic_set(&amp;et-&gt;node_cnt, 0);</div><div class='del'>-		atomic_inc(&amp;sbi-&gt;total_ext_tree);</div><div class='add'>+		atomic_inc(&amp;eti-&gt;total_ext_tree);</div><div class='ctx'> 	} else {</div><div class='del'>-		atomic_dec(&amp;sbi-&gt;total_zombie_tree);</div><div class='add'>+		atomic_dec(&amp;eti-&gt;total_zombie_tree);</div><div class='ctx'> 		list_del_init(&amp;et-&gt;list);</div><div class='ctx'> 	}</div><div class='del'>-	mutex_unlock(&amp;sbi-&gt;extent_tree_lock);</div><div class='add'>+	mutex_unlock(&amp;eti-&gt;extent_tree_lock);</div><div class='ctx'> </div><div class='ctx'> 	/* never died until evict_inode */</div><div class='del'>-	F2FS_I(inode)-&gt;extent_tree = et;</div><div class='add'>+	F2FS_I(inode)-&gt;extent_tree[type] = et;</div><div class='ctx'> </div><div class='ctx'> 	return et;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct extent_node *__init_extent_tree(struct f2fs_sb_info *sbi,</div><div class='del'>-				struct extent_tree *et, struct extent_info *ei)</div><div class='del'>-{</div><div class='del'>-	struct rb_node **p = &amp;et-&gt;root.rb_root.rb_node;</div><div class='del'>-	struct extent_node *en;</div><div class='del'>-</div><div class='del'>-	en = __attach_extent_node(sbi, et, ei, NULL, p, true);</div><div class='del'>-	if (!en)</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	et-&gt;largest = en-&gt;ei;</div><div class='del'>-	et-&gt;cached_en = en;</div><div class='del'>-	return en;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static unsigned int __free_extent_tree(struct f2fs_sb_info *sbi,</div><div class='del'>-					struct extent_tree *et)</div><div class='add'>+				struct extent_tree *et, unsigned int nr_shrink)</div><div class='ctx'> {</div><div class='ctx'> 	struct rb_node *node, *next;</div><div class='ctx'> 	struct extent_node *en;</div><div class='del'>-	unsigned int count = atomic_read(&amp;et-&gt;node_cnt);</div><div class='add'>+	unsigned int count;</div><div class='ctx'> </div><div class='ctx'> 	node = rb_first_cached(&amp;et-&gt;root);</div><div class='del'>-	while (node) {</div><div class='add'>+</div><div class='add'>+	for (count = 0; node &amp;&amp; count &lt; nr_shrink; count++) {</div><div class='ctx'> 		next = rb_next(node);</div><div class='ctx'> 		en = rb_entry(node, struct extent_node, rb_node);</div><div class='ctx'> 		__release_extent_node(sbi, et, en);</div><div class='ctx'> 		node = next;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return count - atomic_read(&amp;et-&gt;node_cnt);</div><div class='add'>+	return count;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void __drop_largest_extent(struct extent_tree *et,</div><div class='ctx'> 					pgoff_t fofs, unsigned int len)</div><div class='ctx'> {</div><div class='del'>-	if (fofs &lt; et-&gt;largest.fofs + et-&gt;largest.len &amp;&amp;</div><div class='add'>+	if (fofs &lt; (pgoff_t)et-&gt;largest.fofs + et-&gt;largest.len &amp;&amp;</div><div class='ctx'> 			fofs + len &gt; et-&gt;largest.fofs) {</div><div class='ctx'> 		et-&gt;largest.len = 0;</div><div class='ctx'> 		et-&gt;largest_updated = true;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* return true, if inode page is changed */</div><div class='del'>-static void __f2fs_init_extent_tree(struct inode *inode, struct page *ipage)</div><div class='add'>+void f2fs_init_read_extent_tree(struct inode *inode, struct folio *ifolio)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='del'>-	struct f2fs_extent *i_ext = ipage ? &amp;F2FS_INODE(ipage)-&gt;i_ext : NULL;</div><div class='add'>+	struct extent_tree_info *eti = &amp;sbi-&gt;extent_tree[EX_READ];</div><div class='add'>+	struct f2fs_extent *i_ext = &amp;F2FS_INODE(ifolio)-&gt;i_ext;</div><div class='ctx'> 	struct extent_tree *et;</div><div class='ctx'> 	struct extent_node *en;</div><div class='del'>-	struct extent_info ei;</div><div class='add'>+	struct extent_info ei = {0};</div><div class='ctx'> </div><div class='del'>-	if (!f2fs_may_extent_tree(inode)) {</div><div class='del'>-		/* drop largest extent */</div><div class='del'>-		if (i_ext &amp;&amp; i_ext-&gt;len) {</div><div class='del'>-			f2fs_wait_on_page_writeback(ipage, NODE, true, true);</div><div class='add'>+	if (!__may_extent_tree(inode, EX_READ)) {</div><div class='add'>+		/* drop largest read extent */</div><div class='add'>+		if (i_ext-&gt;len) {</div><div class='add'>+			f2fs_folio_wait_writeback(ifolio, NODE, true, true);</div><div class='ctx'> 			i_ext-&gt;len = 0;</div><div class='del'>-			set_page_dirty(ipage);</div><div class='del'>-			return;</div><div class='add'>+			folio_mark_dirty(ifolio);</div><div class='ctx'> 		}</div><div class='add'>+		set_inode_flag(inode, FI_NO_EXTENT);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	et = __grab_extent_tree(inode);</div><div class='del'>-</div><div class='del'>-	if (!i_ext || !i_ext-&gt;len)</div><div class='del'>-		return;</div><div class='add'>+	et = __grab_extent_tree(inode, EX_READ);</div><div class='ctx'> </div><div class='del'>-	get_extent_info(&amp;ei, i_ext);</div><div class='add'>+	get_read_extent_info(&amp;ei, i_ext);</div><div class='ctx'> </div><div class='ctx'> 	write_lock(&amp;et-&gt;lock);</div><div class='del'>-	if (atomic_read(&amp;et-&gt;node_cnt))</div><div class='del'>-		goto out;</div><div class='add'>+	if (atomic_read(&amp;et-&gt;node_cnt) || !ei.len)</div><div class='add'>+		goto skip;</div><div class='ctx'> </div><div class='del'>-	en = __init_extent_tree(sbi, et, &amp;ei);</div><div class='add'>+	if (IS_DEVICE_ALIASING(inode)) {</div><div class='add'>+		et-&gt;largest = ei;</div><div class='add'>+		goto skip;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	en = __attach_extent_node(sbi, et, &amp;ei, NULL,</div><div class='add'>+				&amp;et-&gt;root.rb_root.rb_node, true);</div><div class='ctx'> 	if (en) {</div><div class='del'>-		spin_lock(&amp;sbi-&gt;extent_lock);</div><div class='del'>-		list_add_tail(&amp;en-&gt;list, &amp;sbi-&gt;extent_list);</div><div class='del'>-		spin_unlock(&amp;sbi-&gt;extent_lock);</div><div class='add'>+		et-&gt;largest = en-&gt;ei;</div><div class='add'>+		et-&gt;cached_en = en;</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;eti-&gt;extent_lock);</div><div class='add'>+		list_add_tail(&amp;en-&gt;list, &amp;eti-&gt;extent_list);</div><div class='add'>+		spin_unlock(&amp;eti-&gt;extent_lock);</div><div class='add'>+	}</div><div class='add'>+skip:</div><div class='add'>+	/* Let's drop, if checkpoint got corrupted. */</div><div class='add'>+	if (f2fs_cp_error(sbi)) {</div><div class='add'>+		et-&gt;largest.len = 0;</div><div class='add'>+		et-&gt;largest_updated = true;</div><div class='ctx'> 	}</div><div class='del'>-out:</div><div class='ctx'> 	write_unlock(&amp;et-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_init_extent_tree(struct inode *inode, struct page *ipage)</div><div class='add'>+void f2fs_init_age_extent_tree(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	__f2fs_init_extent_tree(inode, ipage);</div><div class='add'>+	if (!__init_may_extent_tree(inode, EX_BLOCK_AGE))</div><div class='add'>+		return;</div><div class='add'>+	__grab_extent_tree(inode, EX_BLOCK_AGE);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if (!F2FS_I(inode)-&gt;extent_tree)</div><div class='del'>-		set_inode_flag(inode, FI_NO_EXTENT);</div><div class='add'>+void f2fs_init_extent_tree(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	/* initialize read cache */</div><div class='add'>+	if (__init_may_extent_tree(inode, EX_READ))</div><div class='add'>+		__grab_extent_tree(inode, EX_READ);</div><div class='add'>+</div><div class='add'>+	/* initialize block age cache */</div><div class='add'>+	if (__init_may_extent_tree(inode, EX_BLOCK_AGE))</div><div class='add'>+		__grab_extent_tree(inode, EX_BLOCK_AGE);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool f2fs_lookup_extent_tree(struct inode *inode, pgoff_t pgofs,</div><div class='del'>-							struct extent_info *ei)</div><div class='add'>+static bool __lookup_extent_tree(struct inode *inode, pgoff_t pgofs,</div><div class='add'>+			struct extent_info *ei, enum extent_type type)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='del'>-	struct extent_tree *et = F2FS_I(inode)-&gt;extent_tree;</div><div class='add'>+	struct extent_tree_info *eti = &amp;sbi-&gt;extent_tree[type];</div><div class='add'>+	struct extent_tree *et = F2FS_I(inode)-&gt;extent_tree[type];</div><div class='ctx'> 	struct extent_node *en;</div><div class='ctx'> 	bool ret = false;</div><div class='ctx'> </div><div class='del'>-	f2fs_bug_on(sbi, !et);</div><div class='add'>+	if (!et)</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-	trace_f2fs_lookup_extent_tree_start(inode, pgofs);</div><div class='add'>+	trace_f2fs_lookup_extent_tree_start(inode, pgofs, type);</div><div class='ctx'> </div><div class='ctx'> 	read_lock(&amp;et-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	if (et-&gt;largest.fofs &lt;= pgofs &amp;&amp;</div><div class='del'>-			et-&gt;largest.fofs + et-&gt;largest.len &gt; pgofs) {</div><div class='add'>+	if (type == EX_READ &amp;&amp;</div><div class='add'>+			et-&gt;largest.fofs &lt;= pgofs &amp;&amp;</div><div class='add'>+			(pgoff_t)et-&gt;largest.fofs + et-&gt;largest.len &gt; pgofs) {</div><div class='ctx'> 		*ei = et-&gt;largest;</div><div class='ctx'> 		ret = true;</div><div class='ctx'> 		stat_inc_largest_node_hit(sbi);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	en = (struct extent_node *)f2fs_lookup_rb_tree(&amp;et-&gt;root,</div><div class='del'>-				(struct rb_entry *)et-&gt;cached_en, pgofs);</div><div class='add'>+	if (IS_DEVICE_ALIASING(inode)) {</div><div class='add'>+		ret = false;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	en = __lookup_extent_node(&amp;et-&gt;root, et-&gt;cached_en, pgofs);</div><div class='ctx'> 	if (!en)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	if (en == et-&gt;cached_en)</div><div class='del'>-		stat_inc_cached_node_hit(sbi);</div><div class='add'>+		stat_inc_cached_node_hit(sbi, type);</div><div class='ctx'> 	else</div><div class='del'>-		stat_inc_rbtree_node_hit(sbi);</div><div class='add'>+		stat_inc_rbtree_node_hit(sbi, type);</div><div class='ctx'> </div><div class='ctx'> 	*ei = en-&gt;ei;</div><div class='del'>-	spin_lock(&amp;sbi-&gt;extent_lock);</div><div class='add'>+	spin_lock(&amp;eti-&gt;extent_lock);</div><div class='ctx'> 	if (!list_empty(&amp;en-&gt;list)) {</div><div class='del'>-		list_move_tail(&amp;en-&gt;list, &amp;sbi-&gt;extent_list);</div><div class='add'>+		list_move_tail(&amp;en-&gt;list, &amp;eti-&gt;extent_list);</div><div class='ctx'> 		et-&gt;cached_en = en;</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;sbi-&gt;extent_lock);</div><div class='add'>+	spin_unlock(&amp;eti-&gt;extent_lock);</div><div class='ctx'> 	ret = true;</div><div class='ctx'> out:</div><div class='del'>-	stat_inc_total_hit(sbi);</div><div class='add'>+	stat_inc_total_hit(sbi, type);</div><div class='ctx'> 	read_unlock(&amp;et-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	trace_f2fs_lookup_extent_tree_end(inode, pgofs, ei);</div><div class='add'>+	if (type == EX_READ)</div><div class='add'>+		trace_f2fs_lookup_read_extent_tree_end(inode, pgofs, ei);</div><div class='add'>+	else if (type == EX_BLOCK_AGE)</div><div class='add'>+		trace_f2fs_lookup_age_extent_tree_end(inode, pgofs, ei);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -460,18 +540,20 @@ static struct extent_node *__try_merge_extent_node(struct f2fs_sb_info *sbi,</div><div class='ctx'> 				struct extent_node *prev_ex,</div><div class='ctx'> 				struct extent_node *next_ex)</div><div class='ctx'> {</div><div class='add'>+	struct extent_tree_info *eti = &amp;sbi-&gt;extent_tree[et-&gt;type];</div><div class='ctx'> 	struct extent_node *en = NULL;</div><div class='ctx'> </div><div class='del'>-	if (prev_ex &amp;&amp; __is_back_mergeable(ei, &amp;prev_ex-&gt;ei)) {</div><div class='add'>+	if (prev_ex &amp;&amp; __is_back_mergeable(ei, &amp;prev_ex-&gt;ei, et-&gt;type)) {</div><div class='ctx'> 		prev_ex-&gt;ei.len += ei-&gt;len;</div><div class='ctx'> 		ei = &amp;prev_ex-&gt;ei;</div><div class='ctx'> 		en = prev_ex;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (next_ex &amp;&amp; __is_front_mergeable(ei, &amp;next_ex-&gt;ei)) {</div><div class='add'>+	if (next_ex &amp;&amp; __is_front_mergeable(ei, &amp;next_ex-&gt;ei, et-&gt;type)) {</div><div class='ctx'> 		next_ex-&gt;ei.fofs = ei-&gt;fofs;</div><div class='del'>-		next_ex-&gt;ei.blk = ei-&gt;blk;</div><div class='ctx'> 		next_ex-&gt;ei.len += ei-&gt;len;</div><div class='add'>+		if (et-&gt;type == EX_READ)</div><div class='add'>+			next_ex-&gt;ei.blk = ei-&gt;blk;</div><div class='ctx'> 		if (en)</div><div class='ctx'> 			__release_extent_node(sbi, et, prev_ex);</div><div class='ctx'> </div><div class='hunk'>@@ -483,12 +565,12 @@ static struct extent_node *__try_merge_extent_node(struct f2fs_sb_info *sbi,</div><div class='ctx'> </div><div class='ctx'> 	__try_update_largest_extent(et, en);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;sbi-&gt;extent_lock);</div><div class='add'>+	spin_lock(&amp;eti-&gt;extent_lock);</div><div class='ctx'> 	if (!list_empty(&amp;en-&gt;list)) {</div><div class='del'>-		list_move_tail(&amp;en-&gt;list, &amp;sbi-&gt;extent_list);</div><div class='add'>+		list_move_tail(&amp;en-&gt;list, &amp;eti-&gt;extent_list);</div><div class='ctx'> 		et-&gt;cached_en = en;</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;sbi-&gt;extent_lock);</div><div class='add'>+	spin_unlock(&amp;eti-&gt;extent_lock);</div><div class='ctx'> 	return en;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -498,7 +580,8 @@ static struct extent_node *__insert_extent_tree(struct f2fs_sb_info *sbi,</div><div class='ctx'> 				struct rb_node *insert_parent,</div><div class='ctx'> 				bool leftmost)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node **p;</div><div class='add'>+	struct extent_tree_info *eti = &amp;sbi-&gt;extent_tree[et-&gt;type];</div><div class='add'>+	struct rb_node **p = &amp;et-&gt;root.rb_root.rb_node;</div><div class='ctx'> 	struct rb_node *parent = NULL;</div><div class='ctx'> 	struct extent_node *en = NULL;</div><div class='ctx'> </div><div class='hunk'>@@ -510,8 +593,27 @@ static struct extent_node *__insert_extent_tree(struct f2fs_sb_info *sbi,</div><div class='ctx'> </div><div class='ctx'> 	leftmost = true;</div><div class='ctx'> </div><div class='del'>-	p = f2fs_lookup_rb_tree_for_insert(sbi, &amp;et-&gt;root, &amp;parent,</div><div class='del'>-						ei-&gt;fofs, &amp;leftmost);</div><div class='add'>+	/* look up extent_node in the rb tree */</div><div class='add'>+	while (*p) {</div><div class='add'>+		parent = *p;</div><div class='add'>+		en = rb_entry(parent, struct extent_node, rb_node);</div><div class='add'>+</div><div class='add'>+		if (ei-&gt;fofs &lt; en-&gt;ei.fofs) {</div><div class='add'>+			p = &amp;(*p)-&gt;rb_left;</div><div class='add'>+		} else if (ei-&gt;fofs &gt;= en-&gt;ei.fofs + en-&gt;ei.len) {</div><div class='add'>+			p = &amp;(*p)-&gt;rb_right;</div><div class='add'>+			leftmost = false;</div><div class='add'>+		} else {</div><div class='add'>+			f2fs_err_ratelimited(sbi, "%s: corrupted extent, type: %d, "</div><div class='add'>+				"extent node in rb tree [%u, %u, %u], age [%llu, %llu], "</div><div class='add'>+				"extent node to insert [%u, %u, %u], age [%llu, %llu]",</div><div class='add'>+				__func__, et-&gt;type, en-&gt;ei.fofs, en-&gt;ei.blk, en-&gt;ei.len, en-&gt;ei.age,</div><div class='add'>+				en-&gt;ei.last_blocks, ei-&gt;fofs, ei-&gt;blk, ei-&gt;len, ei-&gt;age, ei-&gt;last_blocks);</div><div class='add'>+			f2fs_bug_on(sbi, 1);</div><div class='add'>+			return NULL;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> do_insert:</div><div class='ctx'> 	en = __attach_extent_node(sbi, et, ei, parent, p, leftmost);</div><div class='ctx'> 	if (!en)</div><div class='hunk'>@@ -520,59 +622,98 @@ do_insert:</div><div class='ctx'> 	__try_update_largest_extent(et, en);</div><div class='ctx'> </div><div class='ctx'> 	/* update in global extent list */</div><div class='del'>-	spin_lock(&amp;sbi-&gt;extent_lock);</div><div class='del'>-	list_add_tail(&amp;en-&gt;list, &amp;sbi-&gt;extent_list);</div><div class='add'>+	spin_lock(&amp;eti-&gt;extent_lock);</div><div class='add'>+	list_add_tail(&amp;en-&gt;list, &amp;eti-&gt;extent_list);</div><div class='ctx'> 	et-&gt;cached_en = en;</div><div class='del'>-	spin_unlock(&amp;sbi-&gt;extent_lock);</div><div class='add'>+	spin_unlock(&amp;eti-&gt;extent_lock);</div><div class='ctx'> 	return en;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void f2fs_update_extent_tree_range(struct inode *inode,</div><div class='del'>-				pgoff_t fofs, block_t blkaddr, unsigned int len)</div><div class='add'>+static unsigned int __destroy_extent_node(struct inode *inode,</div><div class='add'>+					enum extent_type type)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='add'>+	struct extent_tree *et = F2FS_I(inode)-&gt;extent_tree[type];</div><div class='add'>+	unsigned int nr_shrink = type == EX_READ ?</div><div class='add'>+				READ_EXTENT_CACHE_SHRINK_NUMBER :</div><div class='add'>+				AGE_EXTENT_CACHE_SHRINK_NUMBER;</div><div class='add'>+	unsigned int node_cnt = 0;</div><div class='add'>+</div><div class='add'>+	if (!et || !atomic_read(&amp;et-&gt;node_cnt))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	while (atomic_read(&amp;et-&gt;node_cnt)) {</div><div class='add'>+		write_lock(&amp;et-&gt;lock);</div><div class='add'>+		node_cnt += __free_extent_tree(sbi, et, nr_shrink);</div><div class='add'>+		write_unlock(&amp;et-&gt;lock);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	f2fs_bug_on(sbi, atomic_read(&amp;et-&gt;node_cnt));</div><div class='add'>+</div><div class='add'>+	return node_cnt;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void __update_extent_tree_range(struct inode *inode,</div><div class='add'>+			struct extent_info *tei, enum extent_type type)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='del'>-	struct extent_tree *et = F2FS_I(inode)-&gt;extent_tree;</div><div class='add'>+	struct extent_tree *et = F2FS_I(inode)-&gt;extent_tree[type];</div><div class='ctx'> 	struct extent_node *en = NULL, *en1 = NULL;</div><div class='ctx'> 	struct extent_node *prev_en = NULL, *next_en = NULL;</div><div class='ctx'> 	struct extent_info ei, dei, prev;</div><div class='ctx'> 	struct rb_node **insert_p = NULL, *insert_parent = NULL;</div><div class='add'>+	unsigned int fofs = tei-&gt;fofs, len = tei-&gt;len;</div><div class='ctx'> 	unsigned int end = fofs + len;</div><div class='del'>-	unsigned int pos = (unsigned int)fofs;</div><div class='ctx'> 	bool updated = false;</div><div class='ctx'> 	bool leftmost = false;</div><div class='ctx'> </div><div class='ctx'> 	if (!et)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	trace_f2fs_update_extent_tree_range(inode, fofs, blkaddr, len);</div><div class='add'>+	if (unlikely(len == 0)) {</div><div class='add'>+		f2fs_err_ratelimited(sbi, "%s: extent len is zero, type: %d, "</div><div class='add'>+			"extent [%u, %u, %u], age [%llu, %llu]",</div><div class='add'>+			__func__, type, tei-&gt;fofs, tei-&gt;blk, tei-&gt;len,</div><div class='add'>+			tei-&gt;age, tei-&gt;last_blocks);</div><div class='add'>+		f2fs_bug_on(sbi, 1);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (type == EX_READ)</div><div class='add'>+		trace_f2fs_update_read_extent_tree_range(inode, fofs, len,</div><div class='add'>+						tei-&gt;blk, 0);</div><div class='add'>+	else if (type == EX_BLOCK_AGE)</div><div class='add'>+		trace_f2fs_update_age_extent_tree_range(inode, fofs, len,</div><div class='add'>+						tei-&gt;age, tei-&gt;last_blocks);</div><div class='ctx'> </div><div class='ctx'> 	write_lock(&amp;et-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	if (is_inode_flag_set(inode, FI_NO_EXTENT)) {</div><div class='del'>-		write_unlock(&amp;et-&gt;lock);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='add'>+	if (type == EX_READ) {</div><div class='add'>+		if (is_inode_flag_set(inode, FI_NO_EXTENT)) {</div><div class='add'>+			write_unlock(&amp;et-&gt;lock);</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	prev = et-&gt;largest;</div><div class='del'>-	dei.len = 0;</div><div class='add'>+		prev = et-&gt;largest;</div><div class='add'>+		dei.len = 0;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * drop largest extent before lookup, in case it's already</div><div class='del'>-	 * been shrunk from extent tree</div><div class='del'>-	 */</div><div class='del'>-	__drop_largest_extent(et, fofs, len);</div><div class='add'>+		/*</div><div class='add'>+		 * drop largest extent before lookup, in case it's already</div><div class='add'>+		 * been shrunk from extent tree</div><div class='add'>+		 */</div><div class='add'>+		__drop_largest_extent(et, fofs, len);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* 1. lookup first extent node in range [fofs, fofs + len - 1] */</div><div class='del'>-	en = (struct extent_node *)f2fs_lookup_rb_tree_ret(&amp;et-&gt;root,</div><div class='del'>-					(struct rb_entry *)et-&gt;cached_en, fofs,</div><div class='del'>-					(struct rb_entry **)&amp;prev_en,</div><div class='del'>-					(struct rb_entry **)&amp;next_en,</div><div class='del'>-					&amp;insert_p, &amp;insert_parent, false,</div><div class='add'>+	en = __lookup_extent_node_ret(&amp;et-&gt;root,</div><div class='add'>+					et-&gt;cached_en, fofs,</div><div class='add'>+					&amp;prev_en, &amp;next_en,</div><div class='add'>+					&amp;insert_p, &amp;insert_parent,</div><div class='ctx'> 					&amp;leftmost);</div><div class='ctx'> 	if (!en)</div><div class='ctx'> 		en = next_en;</div><div class='ctx'> </div><div class='del'>-	/* 2. invlidate all extent nodes in range [fofs, fofs + len - 1] */</div><div class='add'>+	/* 2. invalidate all extent nodes in range [fofs, fofs + len - 1] */</div><div class='ctx'> 	while (en &amp;&amp; en-&gt;ei.fofs &lt; end) {</div><div class='ctx'> 		unsigned int org_end;</div><div class='ctx'> 		int parts = 0;	/* # of parts current extent split into */</div><div class='hunk'>@@ -581,26 +722,34 @@ static void f2fs_update_extent_tree_range(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 		dei = en-&gt;ei;</div><div class='ctx'> 		org_end = dei.fofs + dei.len;</div><div class='del'>-		f2fs_bug_on(sbi, pos &gt;= org_end);</div><div class='add'>+		f2fs_bug_on(sbi, fofs &gt;= org_end);</div><div class='ctx'> </div><div class='del'>-		if (pos &gt; dei.fofs &amp;&amp;	pos - dei.fofs &gt;= F2FS_MIN_EXTENT_LEN) {</div><div class='del'>-			en-&gt;ei.len = pos - en-&gt;ei.fofs;</div><div class='add'>+		if (fofs &gt; dei.fofs &amp;&amp; (type != EX_READ ||</div><div class='add'>+				fofs - dei.fofs &gt;= F2FS_MIN_EXTENT_LEN)) {</div><div class='add'>+			en-&gt;ei.len = fofs - en-&gt;ei.fofs;</div><div class='ctx'> 			prev_en = en;</div><div class='ctx'> 			parts = 1;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (end &lt; org_end &amp;&amp; org_end - end &gt;= F2FS_MIN_EXTENT_LEN) {</div><div class='add'>+		if (end &lt; org_end &amp;&amp; (type != EX_READ ||</div><div class='add'>+			(org_end - end &gt;= F2FS_MIN_EXTENT_LEN &amp;&amp;</div><div class='add'>+			atomic_read(&amp;et-&gt;node_cnt) &lt;</div><div class='add'>+					sbi-&gt;max_read_extent_count))) {</div><div class='ctx'> 			if (parts) {</div><div class='del'>-				set_extent_info(&amp;ei, end,</div><div class='del'>-						end - dei.fofs + dei.blk,</div><div class='del'>-						org_end - end);</div><div class='add'>+				__set_extent_info(&amp;ei,</div><div class='add'>+					end, org_end - end,</div><div class='add'>+					end - dei.fofs + dei.blk, false,</div><div class='add'>+					dei.age, dei.last_blocks,</div><div class='add'>+					type);</div><div class='ctx'> 				en1 = __insert_extent_tree(sbi, et, &amp;ei,</div><div class='ctx'> 							NULL, NULL, true);</div><div class='ctx'> 				next_en = en1;</div><div class='ctx'> 			} else {</div><div class='del'>-				en-&gt;ei.fofs = end;</div><div class='del'>-				en-&gt;ei.blk += end - dei.fofs;</div><div class='del'>-				en-&gt;ei.len -= end - dei.fofs;</div><div class='add'>+				__set_extent_info(&amp;en-&gt;ei,</div><div class='add'>+					end, en-&gt;ei.len - (end - dei.fofs),</div><div class='add'>+					en-&gt;ei.blk + (end - dei.fofs), true,</div><div class='add'>+					dei.age, dei.last_blocks,</div><div class='add'>+					type);</div><div class='ctx'> 				next_en = en;</div><div class='ctx'> 			}</div><div class='ctx'> 			parts++;</div><div class='hunk'>@@ -630,10 +779,15 @@ static void f2fs_update_extent_tree_range(struct inode *inode,</div><div class='ctx'> 		en = next_en;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* 3. update extent in extent cache */</div><div class='del'>-	if (blkaddr) {</div><div class='add'>+	if (type == EX_BLOCK_AGE)</div><div class='add'>+		goto update_age_extent_cache;</div><div class='add'>+</div><div class='add'>+	/* 3. update extent in read extent cache */</div><div class='add'>+	BUG_ON(type != EX_READ);</div><div class='ctx'> </div><div class='del'>-		set_extent_info(&amp;ei, fofs, blkaddr, len);</div><div class='add'>+	if (tei-&gt;blk) {</div><div class='add'>+		__set_extent_info(&amp;ei, fofs, len, tei-&gt;blk, false,</div><div class='add'>+				  0, 0, EX_READ);</div><div class='ctx'> 		if (!__try_merge_extent_node(sbi, et, &amp;ei, prev_en, next_en))</div><div class='ctx'> 			__insert_extent_tree(sbi, et, &amp;ei,</div><div class='ctx'> 					insert_p, insert_parent, leftmost);</div><div class='hunk'>@@ -648,34 +802,45 @@ static void f2fs_update_extent_tree_range(struct inode *inode,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (is_inode_flag_set(inode, FI_NO_EXTENT))</div><div class='del'>-		__free_extent_tree(sbi, et);</div><div class='del'>-</div><div class='ctx'> 	if (et-&gt;largest_updated) {</div><div class='ctx'> 		et-&gt;largest_updated = false;</div><div class='ctx'> 		updated = true;</div><div class='ctx'> 	}</div><div class='add'>+	goto out_read_extent_cache;</div><div class='add'>+update_age_extent_cache:</div><div class='add'>+	if (tei-&gt;last_blocks == F2FS_EXTENT_AGE_INVALID)</div><div class='add'>+		goto out_read_extent_cache;</div><div class='ctx'> </div><div class='add'>+	__set_extent_info(&amp;ei, fofs, len, 0, false,</div><div class='add'>+			tei-&gt;age, tei-&gt;last_blocks, EX_BLOCK_AGE);</div><div class='add'>+	if (!__try_merge_extent_node(sbi, et, &amp;ei, prev_en, next_en))</div><div class='add'>+		__insert_extent_tree(sbi, et, &amp;ei,</div><div class='add'>+					insert_p, insert_parent, leftmost);</div><div class='add'>+out_read_extent_cache:</div><div class='ctx'> 	write_unlock(&amp;et-&gt;lock);</div><div class='ctx'> </div><div class='add'>+	if (is_inode_flag_set(inode, FI_NO_EXTENT))</div><div class='add'>+		__destroy_extent_node(inode, EX_READ);</div><div class='add'>+</div><div class='ctx'> 	if (updated)</div><div class='ctx'> 		f2fs_mark_inode_dirty_sync(inode, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='del'>-void f2fs_update_extent_tree_range_compressed(struct inode *inode,</div><div class='add'>+void f2fs_update_read_extent_tree_range_compressed(struct inode *inode,</div><div class='ctx'> 				pgoff_t fofs, block_t blkaddr, unsigned int llen,</div><div class='ctx'> 				unsigned int c_len)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='del'>-	struct extent_tree *et = F2FS_I(inode)-&gt;extent_tree;</div><div class='add'>+	struct extent_tree *et = F2FS_I(inode)-&gt;extent_tree[EX_READ];</div><div class='ctx'> 	struct extent_node *en = NULL;</div><div class='ctx'> 	struct extent_node *prev_en = NULL, *next_en = NULL;</div><div class='ctx'> 	struct extent_info ei;</div><div class='ctx'> 	struct rb_node **insert_p = NULL, *insert_parent = NULL;</div><div class='ctx'> 	bool leftmost = false;</div><div class='ctx'> </div><div class='del'>-	trace_f2fs_update_extent_tree_range(inode, fofs, blkaddr, llen);</div><div class='add'>+	trace_f2fs_update_read_extent_tree_range(inode, fofs, llen,</div><div class='add'>+						blkaddr, c_len);</div><div class='ctx'> </div><div class='ctx'> 	/* it is safe here to check FI_NO_EXTENT w/o et-&gt;lock in ro image */</div><div class='ctx'> 	if (is_inode_flag_set(inode, FI_NO_EXTENT))</div><div class='hunk'>@@ -683,16 +848,15 @@ void f2fs_update_extent_tree_range_compressed(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 	write_lock(&amp;et-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	en = (struct extent_node *)f2fs_lookup_rb_tree_ret(&amp;et-&gt;root,</div><div class='del'>-				(struct rb_entry *)et-&gt;cached_en, fofs,</div><div class='del'>-				(struct rb_entry **)&amp;prev_en,</div><div class='del'>-				(struct rb_entry **)&amp;next_en,</div><div class='del'>-				&amp;insert_p, &amp;insert_parent, false,</div><div class='del'>-				&amp;leftmost);</div><div class='add'>+	en = __lookup_extent_node_ret(&amp;et-&gt;root,</div><div class='add'>+					et-&gt;cached_en, fofs,</div><div class='add'>+					&amp;prev_en, &amp;next_en,</div><div class='add'>+					&amp;insert_p, &amp;insert_parent,</div><div class='add'>+					&amp;leftmost);</div><div class='ctx'> 	if (en)</div><div class='ctx'> 		goto unlock_out;</div><div class='ctx'> </div><div class='del'>-	set_extent_info(&amp;ei, fofs, blkaddr, llen);</div><div class='add'>+	__set_extent_info(&amp;ei, fofs, llen, blkaddr, true, 0, 0, EX_READ);</div><div class='ctx'> 	ei.c_len = c_len;</div><div class='ctx'> </div><div class='ctx'> 	if (!__try_merge_extent_node(sbi, et, &amp;ei, prev_en, next_en))</div><div class='hunk'>@@ -703,124 +867,311 @@ unlock_out:</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-unsigned int f2fs_shrink_extent_tree(struct f2fs_sb_info *sbi, int nr_shrink)</div><div class='add'>+static unsigned long long __calculate_block_age(struct f2fs_sb_info *sbi,</div><div class='add'>+						unsigned long long new,</div><div class='add'>+						unsigned long long old)</div><div class='ctx'> {</div><div class='add'>+	unsigned int rem_old, rem_new;</div><div class='add'>+	unsigned long long res;</div><div class='add'>+	unsigned int weight = sbi-&gt;last_age_weight;</div><div class='add'>+</div><div class='add'>+	res = div_u64_rem(new, 100, &amp;rem_new) * (100 - weight)</div><div class='add'>+		+ div_u64_rem(old, 100, &amp;rem_old) * weight;</div><div class='add'>+</div><div class='add'>+	if (rem_new)</div><div class='add'>+		res += rem_new * (100 - weight) / 100;</div><div class='add'>+	if (rem_old)</div><div class='add'>+		res += rem_old * weight / 100;</div><div class='add'>+</div><div class='add'>+	return res;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* This returns a new age and allocated blocks in ei */</div><div class='add'>+static int __get_new_block_age(struct inode *inode, struct extent_info *ei,</div><div class='add'>+						block_t blkaddr)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='add'>+	loff_t f_size = i_size_read(inode);</div><div class='add'>+	unsigned long long cur_blocks =</div><div class='add'>+				atomic64_read(&amp;sbi-&gt;allocated_data_blocks);</div><div class='add'>+	struct extent_info tei = *ei;	/* only fofs and len are valid */</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * When I/O is not aligned to a PAGE_SIZE, update will happen to the last</div><div class='add'>+	 * file block even in seq write. So don't record age for newly last file</div><div class='add'>+	 * block here.</div><div class='add'>+	 */</div><div class='add'>+	if ((f_size &gt;&gt; PAGE_SHIFT) == ei-&gt;fofs &amp;&amp; f_size &amp; (PAGE_SIZE - 1) &amp;&amp;</div><div class='add'>+			blkaddr == NEW_ADDR)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	if (__lookup_extent_tree(inode, ei-&gt;fofs, &amp;tei, EX_BLOCK_AGE)) {</div><div class='add'>+		unsigned long long cur_age;</div><div class='add'>+</div><div class='add'>+		if (cur_blocks &gt;= tei.last_blocks)</div><div class='add'>+			cur_age = cur_blocks - tei.last_blocks;</div><div class='add'>+		else</div><div class='add'>+			/* allocated_data_blocks overflow */</div><div class='add'>+			cur_age = (ULLONG_MAX - 1) - tei.last_blocks + cur_blocks;</div><div class='add'>+</div><div class='add'>+		if (tei.age)</div><div class='add'>+			ei-&gt;age = __calculate_block_age(sbi, cur_age, tei.age);</div><div class='add'>+		else</div><div class='add'>+			ei-&gt;age = cur_age;</div><div class='add'>+		ei-&gt;last_blocks = cur_blocks;</div><div class='add'>+		WARN_ON(ei-&gt;age &gt; cur_blocks);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	f2fs_bug_on(sbi, blkaddr == NULL_ADDR);</div><div class='add'>+</div><div class='add'>+	/* the data block was allocated for the first time */</div><div class='add'>+	if (blkaddr == NEW_ADDR)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	if (__is_valid_data_blkaddr(blkaddr) &amp;&amp;</div><div class='add'>+	    !f2fs_is_valid_blkaddr(sbi, blkaddr, DATA_GENERIC_ENHANCE))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+out:</div><div class='add'>+	/*</div><div class='add'>+	 * init block age with zero, this can happen when the block age extent</div><div class='add'>+	 * was reclaimed due to memory constraint or system reboot</div><div class='add'>+	 */</div><div class='add'>+	ei-&gt;age = 0;</div><div class='add'>+	ei-&gt;last_blocks = cur_blocks;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void __update_extent_cache(struct dnode_of_data *dn, enum extent_type type)</div><div class='add'>+{</div><div class='add'>+	struct extent_info ei = {};</div><div class='add'>+</div><div class='add'>+	if (!__may_extent_tree(dn-&gt;inode, type))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	ei.fofs = f2fs_start_bidx_of_node(ofs_of_node(dn-&gt;node_folio), dn-&gt;inode) +</div><div class='add'>+								dn-&gt;ofs_in_node;</div><div class='add'>+	ei.len = 1;</div><div class='add'>+</div><div class='add'>+	if (type == EX_READ) {</div><div class='add'>+		if (dn-&gt;data_blkaddr == NEW_ADDR)</div><div class='add'>+			ei.blk = NULL_ADDR;</div><div class='add'>+		else</div><div class='add'>+			ei.blk = dn-&gt;data_blkaddr;</div><div class='add'>+	} else if (type == EX_BLOCK_AGE) {</div><div class='add'>+		if (__get_new_block_age(dn-&gt;inode, &amp;ei, dn-&gt;data_blkaddr))</div><div class='add'>+			return;</div><div class='add'>+	}</div><div class='add'>+	__update_extent_tree_range(dn-&gt;inode, &amp;ei, type);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static unsigned int __shrink_extent_tree(struct f2fs_sb_info *sbi, int nr_shrink,</div><div class='add'>+					enum extent_type type)</div><div class='add'>+{</div><div class='add'>+	struct extent_tree_info *eti = &amp;sbi-&gt;extent_tree[type];</div><div class='ctx'> 	struct extent_tree *et, *next;</div><div class='ctx'> 	struct extent_node *en;</div><div class='ctx'> 	unsigned int node_cnt = 0, tree_cnt = 0;</div><div class='ctx'> 	int remained;</div><div class='ctx'> </div><div class='del'>-	if (!test_opt(sbi, EXTENT_CACHE))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	if (!atomic_read(&amp;sbi-&gt;total_zombie_tree))</div><div class='add'>+	if (!atomic_read(&amp;eti-&gt;total_zombie_tree))</div><div class='ctx'> 		goto free_node;</div><div class='ctx'> </div><div class='del'>-	if (!mutex_trylock(&amp;sbi-&gt;extent_tree_lock))</div><div class='add'>+	if (!mutex_trylock(&amp;eti-&gt;extent_tree_lock))</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	/* 1. remove unreferenced extent tree */</div><div class='del'>-	list_for_each_entry_safe(et, next, &amp;sbi-&gt;zombie_list, list) {</div><div class='add'>+	list_for_each_entry_safe(et, next, &amp;eti-&gt;zombie_list, list) {</div><div class='ctx'> 		if (atomic_read(&amp;et-&gt;node_cnt)) {</div><div class='ctx'> 			write_lock(&amp;et-&gt;lock);</div><div class='del'>-			node_cnt += __free_extent_tree(sbi, et);</div><div class='add'>+			node_cnt += __free_extent_tree(sbi, et,</div><div class='add'>+					nr_shrink - node_cnt - tree_cnt);</div><div class='ctx'> 			write_unlock(&amp;et-&gt;lock);</div><div class='ctx'> 		}</div><div class='del'>-		f2fs_bug_on(sbi, atomic_read(&amp;et-&gt;node_cnt));</div><div class='add'>+</div><div class='add'>+		if (atomic_read(&amp;et-&gt;node_cnt))</div><div class='add'>+			goto unlock_out;</div><div class='add'>+</div><div class='ctx'> 		list_del_init(&amp;et-&gt;list);</div><div class='del'>-		radix_tree_delete(&amp;sbi-&gt;extent_tree_root, et-&gt;ino);</div><div class='add'>+		radix_tree_delete(&amp;eti-&gt;extent_tree_root, et-&gt;ino);</div><div class='ctx'> 		kmem_cache_free(extent_tree_slab, et);</div><div class='del'>-		atomic_dec(&amp;sbi-&gt;total_ext_tree);</div><div class='del'>-		atomic_dec(&amp;sbi-&gt;total_zombie_tree);</div><div class='add'>+		atomic_dec(&amp;eti-&gt;total_ext_tree);</div><div class='add'>+		atomic_dec(&amp;eti-&gt;total_zombie_tree);</div><div class='ctx'> 		tree_cnt++;</div><div class='ctx'> </div><div class='ctx'> 		if (node_cnt + tree_cnt &gt;= nr_shrink)</div><div class='ctx'> 			goto unlock_out;</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 	}</div><div class='del'>-	mutex_unlock(&amp;sbi-&gt;extent_tree_lock);</div><div class='add'>+	mutex_unlock(&amp;eti-&gt;extent_tree_lock);</div><div class='ctx'> </div><div class='ctx'> free_node:</div><div class='ctx'> 	/* 2. remove LRU extent entries */</div><div class='del'>-	if (!mutex_trylock(&amp;sbi-&gt;extent_tree_lock))</div><div class='add'>+	if (!mutex_trylock(&amp;eti-&gt;extent_tree_lock))</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	remained = nr_shrink - (node_cnt + tree_cnt);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;sbi-&gt;extent_lock);</div><div class='add'>+	spin_lock(&amp;eti-&gt;extent_lock);</div><div class='ctx'> 	for (; remained &gt; 0; remained--) {</div><div class='del'>-		if (list_empty(&amp;sbi-&gt;extent_list))</div><div class='add'>+		if (list_empty(&amp;eti-&gt;extent_list))</div><div class='ctx'> 			break;</div><div class='del'>-		en = list_first_entry(&amp;sbi-&gt;extent_list,</div><div class='add'>+		en = list_first_entry(&amp;eti-&gt;extent_list,</div><div class='ctx'> 					struct extent_node, list);</div><div class='ctx'> 		et = en-&gt;et;</div><div class='ctx'> 		if (!write_trylock(&amp;et-&gt;lock)) {</div><div class='ctx'> 			/* refresh this extent node's position in extent list */</div><div class='del'>-			list_move_tail(&amp;en-&gt;list, &amp;sbi-&gt;extent_list);</div><div class='add'>+			list_move_tail(&amp;en-&gt;list, &amp;eti-&gt;extent_list);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		list_del_init(&amp;en-&gt;list);</div><div class='del'>-		spin_unlock(&amp;sbi-&gt;extent_lock);</div><div class='add'>+		spin_unlock(&amp;eti-&gt;extent_lock);</div><div class='ctx'> </div><div class='ctx'> 		__detach_extent_node(sbi, et, en);</div><div class='ctx'> </div><div class='ctx'> 		write_unlock(&amp;et-&gt;lock);</div><div class='ctx'> 		node_cnt++;</div><div class='del'>-		spin_lock(&amp;sbi-&gt;extent_lock);</div><div class='add'>+		spin_lock(&amp;eti-&gt;extent_lock);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;sbi-&gt;extent_lock);</div><div class='add'>+	spin_unlock(&amp;eti-&gt;extent_lock);</div><div class='ctx'> </div><div class='ctx'> unlock_out:</div><div class='del'>-	mutex_unlock(&amp;sbi-&gt;extent_tree_lock);</div><div class='add'>+	mutex_unlock(&amp;eti-&gt;extent_tree_lock);</div><div class='ctx'> out:</div><div class='del'>-	trace_f2fs_shrink_extent_tree(sbi, node_cnt, tree_cnt);</div><div class='add'>+	trace_f2fs_shrink_extent_tree(sbi, node_cnt, tree_cnt, type);</div><div class='ctx'> </div><div class='ctx'> 	return node_cnt + tree_cnt;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-unsigned int f2fs_destroy_extent_node(struct inode *inode)</div><div class='add'>+/* read extent cache operations */</div><div class='add'>+bool f2fs_lookup_read_extent_cache(struct inode *inode, pgoff_t pgofs,</div><div class='add'>+				struct extent_info *ei)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='del'>-	struct extent_tree *et = F2FS_I(inode)-&gt;extent_tree;</div><div class='del'>-	unsigned int node_cnt = 0;</div><div class='add'>+	if (!__may_extent_tree(inode, EX_READ))</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-	if (!et || !atomic_read(&amp;et-&gt;node_cnt))</div><div class='add'>+	return __lookup_extent_tree(inode, pgofs, ei, EX_READ);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool f2fs_lookup_read_extent_cache_block(struct inode *inode, pgoff_t index,</div><div class='add'>+				block_t *blkaddr)</div><div class='add'>+{</div><div class='add'>+	struct extent_info ei = {};</div><div class='add'>+</div><div class='add'>+	if (!f2fs_lookup_read_extent_cache(inode, index, &amp;ei))</div><div class='add'>+		return false;</div><div class='add'>+	*blkaddr = ei.blk + index - ei.fofs;</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void f2fs_update_read_extent_cache(struct dnode_of_data *dn)</div><div class='add'>+{</div><div class='add'>+	return __update_extent_cache(dn, EX_READ);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void f2fs_update_read_extent_cache_range(struct dnode_of_data *dn,</div><div class='add'>+				pgoff_t fofs, block_t blkaddr, unsigned int len)</div><div class='add'>+{</div><div class='add'>+	struct extent_info ei = {</div><div class='add'>+		.fofs = fofs,</div><div class='add'>+		.len = len,</div><div class='add'>+		.blk = blkaddr,</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+	if (!__may_extent_tree(dn-&gt;inode, EX_READ))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	__update_extent_tree_range(dn-&gt;inode, &amp;ei, EX_READ);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+unsigned int f2fs_shrink_read_extent_tree(struct f2fs_sb_info *sbi, int nr_shrink)</div><div class='add'>+{</div><div class='add'>+	if (!test_opt(sbi, READ_EXTENT_CACHE))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	write_lock(&amp;et-&gt;lock);</div><div class='del'>-	node_cnt = __free_extent_tree(sbi, et);</div><div class='del'>-	write_unlock(&amp;et-&gt;lock);</div><div class='add'>+	return __shrink_extent_tree(sbi, nr_shrink, EX_READ);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	return node_cnt;</div><div class='add'>+/* block age extent cache operations */</div><div class='add'>+bool f2fs_lookup_age_extent_cache(struct inode *inode, pgoff_t pgofs,</div><div class='add'>+				struct extent_info *ei)</div><div class='add'>+{</div><div class='add'>+	if (!__may_extent_tree(inode, EX_BLOCK_AGE))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	return __lookup_extent_tree(inode, pgofs, ei, EX_BLOCK_AGE);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_drop_extent_tree(struct inode *inode)</div><div class='add'>+void f2fs_update_age_extent_cache(struct dnode_of_data *dn)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='del'>-	struct extent_tree *et = F2FS_I(inode)-&gt;extent_tree;</div><div class='del'>-	bool updated = false;</div><div class='add'>+	return __update_extent_cache(dn, EX_BLOCK_AGE);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if (!f2fs_may_extent_tree(inode))</div><div class='add'>+void f2fs_update_age_extent_cache_range(struct dnode_of_data *dn,</div><div class='add'>+				pgoff_t fofs, unsigned int len)</div><div class='add'>+{</div><div class='add'>+	struct extent_info ei = {</div><div class='add'>+		.fofs = fofs,</div><div class='add'>+		.len = len,</div><div class='add'>+		.last_blocks = F2FS_EXTENT_AGE_INVALID,</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+	if (!__may_extent_tree(dn-&gt;inode, EX_BLOCK_AGE))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	set_inode_flag(inode, FI_NO_EXTENT);</div><div class='add'>+	__update_extent_tree_range(dn-&gt;inode, &amp;ei, EX_BLOCK_AGE);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+unsigned int f2fs_shrink_age_extent_tree(struct f2fs_sb_info *sbi, int nr_shrink)</div><div class='add'>+{</div><div class='add'>+	if (!test_opt(sbi, AGE_EXTENT_CACHE))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	return __shrink_extent_tree(sbi, nr_shrink, EX_BLOCK_AGE);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void f2fs_destroy_extent_node(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	__destroy_extent_node(inode, EX_READ);</div><div class='add'>+	__destroy_extent_node(inode, EX_BLOCK_AGE);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void __drop_extent_tree(struct inode *inode, enum extent_type type)</div><div class='add'>+{</div><div class='add'>+	struct extent_tree *et = F2FS_I(inode)-&gt;extent_tree[type];</div><div class='add'>+	bool updated = false;</div><div class='add'>+</div><div class='add'>+	if (!__may_extent_tree(inode, type))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='ctx'> 	write_lock(&amp;et-&gt;lock);</div><div class='del'>-	__free_extent_tree(sbi, et);</div><div class='del'>-	if (et-&gt;largest.len) {</div><div class='del'>-		et-&gt;largest.len = 0;</div><div class='del'>-		updated = true;</div><div class='add'>+	if (type == EX_READ) {</div><div class='add'>+		set_inode_flag(inode, FI_NO_EXTENT);</div><div class='add'>+		if (et-&gt;largest.len) {</div><div class='add'>+			et-&gt;largest.len = 0;</div><div class='add'>+			updated = true;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> 	write_unlock(&amp;et-&gt;lock);</div><div class='add'>+</div><div class='add'>+	__destroy_extent_node(inode, type);</div><div class='add'>+</div><div class='ctx'> 	if (updated)</div><div class='ctx'> 		f2fs_mark_inode_dirty_sync(inode, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_destroy_extent_tree(struct inode *inode)</div><div class='add'>+void f2fs_drop_extent_tree(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	__drop_extent_tree(inode, EX_READ);</div><div class='add'>+	__drop_extent_tree(inode, EX_BLOCK_AGE);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void __destroy_extent_tree(struct inode *inode, enum extent_type type)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='del'>-	struct extent_tree *et = F2FS_I(inode)-&gt;extent_tree;</div><div class='add'>+	struct extent_tree_info *eti = &amp;sbi-&gt;extent_tree[type];</div><div class='add'>+	struct extent_tree *et = F2FS_I(inode)-&gt;extent_tree[type];</div><div class='ctx'> 	unsigned int node_cnt = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (!et)</div><div class='hunk'>@@ -828,76 +1179,58 @@ void f2fs_destroy_extent_tree(struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> 	if (inode-&gt;i_nlink &amp;&amp; !is_bad_inode(inode) &amp;&amp;</div><div class='ctx'> 					atomic_read(&amp;et-&gt;node_cnt)) {</div><div class='del'>-		mutex_lock(&amp;sbi-&gt;extent_tree_lock);</div><div class='del'>-		list_add_tail(&amp;et-&gt;list, &amp;sbi-&gt;zombie_list);</div><div class='del'>-		atomic_inc(&amp;sbi-&gt;total_zombie_tree);</div><div class='del'>-		mutex_unlock(&amp;sbi-&gt;extent_tree_lock);</div><div class='add'>+		mutex_lock(&amp;eti-&gt;extent_tree_lock);</div><div class='add'>+		list_add_tail(&amp;et-&gt;list, &amp;eti-&gt;zombie_list);</div><div class='add'>+		atomic_inc(&amp;eti-&gt;total_zombie_tree);</div><div class='add'>+		mutex_unlock(&amp;eti-&gt;extent_tree_lock);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* free all extent info belong to this extent tree */</div><div class='del'>-	node_cnt = f2fs_destroy_extent_node(inode);</div><div class='add'>+	node_cnt = __destroy_extent_node(inode, type);</div><div class='ctx'> </div><div class='ctx'> 	/* delete extent tree entry in radix tree */</div><div class='del'>-	mutex_lock(&amp;sbi-&gt;extent_tree_lock);</div><div class='add'>+	mutex_lock(&amp;eti-&gt;extent_tree_lock);</div><div class='ctx'> 	f2fs_bug_on(sbi, atomic_read(&amp;et-&gt;node_cnt));</div><div class='del'>-	radix_tree_delete(&amp;sbi-&gt;extent_tree_root, inode-&gt;i_ino);</div><div class='add'>+	radix_tree_delete(&amp;eti-&gt;extent_tree_root, inode-&gt;i_ino);</div><div class='ctx'> 	kmem_cache_free(extent_tree_slab, et);</div><div class='del'>-	atomic_dec(&amp;sbi-&gt;total_ext_tree);</div><div class='del'>-	mutex_unlock(&amp;sbi-&gt;extent_tree_lock);</div><div class='add'>+	atomic_dec(&amp;eti-&gt;total_ext_tree);</div><div class='add'>+	mutex_unlock(&amp;eti-&gt;extent_tree_lock);</div><div class='ctx'> </div><div class='del'>-	F2FS_I(inode)-&gt;extent_tree = NULL;</div><div class='add'>+	F2FS_I(inode)-&gt;extent_tree[type] = NULL;</div><div class='ctx'> </div><div class='del'>-	trace_f2fs_destroy_extent_tree(inode, node_cnt);</div><div class='add'>+	trace_f2fs_destroy_extent_tree(inode, node_cnt, type);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-bool f2fs_lookup_extent_cache(struct inode *inode, pgoff_t pgofs,</div><div class='del'>-					struct extent_info *ei)</div><div class='add'>+void f2fs_destroy_extent_tree(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	if (!f2fs_may_extent_tree(inode))</div><div class='del'>-		return false;</div><div class='del'>-</div><div class='del'>-	return f2fs_lookup_extent_tree(inode, pgofs, ei);</div><div class='add'>+	__destroy_extent_tree(inode, EX_READ);</div><div class='add'>+	__destroy_extent_tree(inode, EX_BLOCK_AGE);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_update_extent_cache(struct dnode_of_data *dn)</div><div class='add'>+static void __init_extent_tree_info(struct extent_tree_info *eti)</div><div class='ctx'> {</div><div class='del'>-	pgoff_t fofs;</div><div class='del'>-	block_t blkaddr;</div><div class='del'>-</div><div class='del'>-	if (!f2fs_may_extent_tree(dn-&gt;inode))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	if (dn-&gt;data_blkaddr == NEW_ADDR)</div><div class='del'>-		blkaddr = NULL_ADDR;</div><div class='del'>-	else</div><div class='del'>-		blkaddr = dn-&gt;data_blkaddr;</div><div class='del'>-</div><div class='del'>-	fofs = f2fs_start_bidx_of_node(ofs_of_node(dn-&gt;node_page), dn-&gt;inode) +</div><div class='del'>-								dn-&gt;ofs_in_node;</div><div class='del'>-	f2fs_update_extent_tree_range(dn-&gt;inode, fofs, blkaddr, 1);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void f2fs_update_extent_cache_range(struct dnode_of_data *dn,</div><div class='del'>-				pgoff_t fofs, block_t blkaddr, unsigned int len)</div><div class='del'>-</div><div class='del'>-{</div><div class='del'>-	if (!f2fs_may_extent_tree(dn-&gt;inode))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	f2fs_update_extent_tree_range(dn-&gt;inode, fofs, blkaddr, len);</div><div class='add'>+	INIT_RADIX_TREE(&amp;eti-&gt;extent_tree_root, GFP_NOIO);</div><div class='add'>+	mutex_init(&amp;eti-&gt;extent_tree_lock);</div><div class='add'>+	INIT_LIST_HEAD(&amp;eti-&gt;extent_list);</div><div class='add'>+	spin_lock_init(&amp;eti-&gt;extent_lock);</div><div class='add'>+	atomic_set(&amp;eti-&gt;total_ext_tree, 0);</div><div class='add'>+	INIT_LIST_HEAD(&amp;eti-&gt;zombie_list);</div><div class='add'>+	atomic_set(&amp;eti-&gt;total_zombie_tree, 0);</div><div class='add'>+	atomic_set(&amp;eti-&gt;total_ext_node, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_init_extent_cache_info(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='del'>-	INIT_RADIX_TREE(&amp;sbi-&gt;extent_tree_root, GFP_NOIO);</div><div class='del'>-	mutex_init(&amp;sbi-&gt;extent_tree_lock);</div><div class='del'>-	INIT_LIST_HEAD(&amp;sbi-&gt;extent_list);</div><div class='del'>-	spin_lock_init(&amp;sbi-&gt;extent_lock);</div><div class='del'>-	atomic_set(&amp;sbi-&gt;total_ext_tree, 0);</div><div class='del'>-	INIT_LIST_HEAD(&amp;sbi-&gt;zombie_list);</div><div class='del'>-	atomic_set(&amp;sbi-&gt;total_zombie_tree, 0);</div><div class='del'>-	atomic_set(&amp;sbi-&gt;total_ext_node, 0);</div><div class='add'>+	__init_extent_tree_info(&amp;sbi-&gt;extent_tree[EX_READ]);</div><div class='add'>+	__init_extent_tree_info(&amp;sbi-&gt;extent_tree[EX_BLOCK_AGE]);</div><div class='add'>+</div><div class='add'>+	/* initialize for block age extents */</div><div class='add'>+	atomic64_set(&amp;sbi-&gt;allocated_data_blocks, 0);</div><div class='add'>+	sbi-&gt;hot_data_age_threshold = DEF_HOT_DATA_AGE_THRESHOLD;</div><div class='add'>+	sbi-&gt;warm_data_age_threshold = DEF_WARM_DATA_AGE_THRESHOLD;</div><div class='add'>+	sbi-&gt;last_age_weight = LAST_AGE_WEIGHT;</div><div class='add'>+	sbi-&gt;max_read_extent_count = DEF_MAX_READ_EXTENT_COUNT;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int __init f2fs_create_extent_cache(void)</div><div class='head'>diff --git a/fs/f2fs/f2fs.h b/fs/f2fs/f2fs.h<br/>index ce9fc9f13000..20edbb99b814 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/f2fs.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/f2fs.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/f2fs.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/f2fs.h</a></div><div class='hunk'>@@ -11,23 +11,25 @@</div><div class='ctx'> #include &lt;linux/uio.h&gt;</div><div class='ctx'> #include &lt;linux/types.h&gt;</div><div class='ctx'> #include &lt;linux/page-flags.h&gt;</div><div class='del'>-#include &lt;linux/buffer_head.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/crc32.h&gt;</div><div class='ctx'> #include &lt;linux/magic.h&gt;</div><div class='ctx'> #include &lt;linux/kobject.h&gt;</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='ctx'> #include &lt;linux/cred.h&gt;</div><div class='add'>+#include &lt;linux/sched/mm.h&gt;</div><div class='ctx'> #include &lt;linux/vmalloc.h&gt;</div><div class='ctx'> #include &lt;linux/bio.h&gt;</div><div class='ctx'> #include &lt;linux/blkdev.h&gt;</div><div class='ctx'> #include &lt;linux/quotaops.h&gt;</div><div class='ctx'> #include &lt;linux/part_stat.h&gt;</div><div class='del'>-#include &lt;crypto/hash.h&gt;</div><div class='add'>+#include &lt;linux/rw_hint.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/fscrypt.h&gt;</div><div class='ctx'> #include &lt;linux/fsverity.h&gt;</div><div class='ctx'> </div><div class='add'>+struct pagevec;</div><div class='add'>+</div><div class='ctx'> #ifdef CONFIG_F2FS_CHECK_FS</div><div class='ctx'> #define f2fs_bug_on(sbi, condition)	BUG_ON(condition)</div><div class='ctx'> #else</div><div class='hunk'>@@ -56,57 +58,90 @@ enum {</div><div class='ctx'> 	FAULT_WRITE_IO,</div><div class='ctx'> 	FAULT_SLAB_ALLOC,</div><div class='ctx'> 	FAULT_DQUOT_INIT,</div><div class='add'>+	FAULT_LOCK_OP,</div><div class='add'>+	FAULT_BLKADDR_VALIDITY,</div><div class='add'>+	FAULT_BLKADDR_CONSISTENCE,</div><div class='add'>+	FAULT_NO_SEGMENT,</div><div class='add'>+	FAULT_INCONSISTENT_FOOTER,</div><div class='add'>+	FAULT_TIMEOUT,</div><div class='add'>+	FAULT_VMALLOC,</div><div class='ctx'> 	FAULT_MAX,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_F2FS_FAULT_INJECTION</div><div class='del'>-#define F2FS_ALL_FAULT_TYPE		((1 &lt;&lt; FAULT_MAX) - 1)</div><div class='add'>+/* indicate which option to update */</div><div class='add'>+enum fault_option {</div><div class='add'>+	FAULT_RATE	= 1,	/* only update fault rate */</div><div class='add'>+	FAULT_TYPE	= 2,	/* only update fault type */</div><div class='add'>+	FAULT_ALL	= 4,	/* reset all fault injection options/stats */</div><div class='add'>+};</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_F2FS_FAULT_INJECTION</div><div class='ctx'> struct f2fs_fault_info {</div><div class='ctx'> 	atomic_t inject_ops;</div><div class='del'>-	unsigned int inject_rate;</div><div class='add'>+	int inject_rate;</div><div class='ctx'> 	unsigned int inject_type;</div><div class='add'>+	/* Used to account total count of injection for each type */</div><div class='add'>+	unsigned int inject_count[FAULT_MAX];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> extern const char *f2fs_fault_name[FAULT_MAX];</div><div class='del'>-#define IS_FAULT_SET(fi, type) ((fi)-&gt;inject_type &amp; (1 &lt;&lt; (type)))</div><div class='add'>+#define IS_FAULT_SET(fi, type) ((fi)-&gt;inject_type &amp; BIT(type))</div><div class='add'>+</div><div class='add'>+/* maximum retry count for injected failure */</div><div class='add'>+#define DEFAULT_FAILURE_RETRY_COUNT		8</div><div class='add'>+#else</div><div class='add'>+#define DEFAULT_FAILURE_RETRY_COUNT		1</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * For mount options</div><div class='ctx'>  */</div><div class='del'>-#define F2FS_MOUNT_DISABLE_ROLL_FORWARD	0x00000002</div><div class='del'>-#define F2FS_MOUNT_DISCARD		0x00000004</div><div class='del'>-#define F2FS_MOUNT_NOHEAP		0x00000008</div><div class='del'>-#define F2FS_MOUNT_XATTR_USER		0x00000010</div><div class='del'>-#define F2FS_MOUNT_POSIX_ACL		0x00000020</div><div class='del'>-#define F2FS_MOUNT_DISABLE_EXT_IDENTIFY	0x00000040</div><div class='del'>-#define F2FS_MOUNT_INLINE_XATTR		0x00000080</div><div class='del'>-#define F2FS_MOUNT_INLINE_DATA		0x00000100</div><div class='del'>-#define F2FS_MOUNT_INLINE_DENTRY	0x00000200</div><div class='del'>-#define F2FS_MOUNT_FLUSH_MERGE		0x00000400</div><div class='del'>-#define F2FS_MOUNT_NOBARRIER		0x00000800</div><div class='del'>-#define F2FS_MOUNT_FASTBOOT		0x00001000</div><div class='del'>-#define F2FS_MOUNT_EXTENT_CACHE		0x00002000</div><div class='del'>-#define F2FS_MOUNT_DATA_FLUSH		0x00008000</div><div class='del'>-#define F2FS_MOUNT_FAULT_INJECTION	0x00010000</div><div class='del'>-#define F2FS_MOUNT_USRQUOTA		0x00080000</div><div class='del'>-#define F2FS_MOUNT_GRPQUOTA		0x00100000</div><div class='del'>-#define F2FS_MOUNT_PRJQUOTA		0x00200000</div><div class='del'>-#define F2FS_MOUNT_QUOTA		0x00400000</div><div class='del'>-#define F2FS_MOUNT_INLINE_XATTR_SIZE	0x00800000</div><div class='del'>-#define F2FS_MOUNT_RESERVE_ROOT		0x01000000</div><div class='del'>-#define F2FS_MOUNT_DISABLE_CHECKPOINT	0x02000000</div><div class='del'>-#define F2FS_MOUNT_NORECOVERY		0x04000000</div><div class='del'>-#define F2FS_MOUNT_ATGC			0x08000000</div><div class='del'>-#define F2FS_MOUNT_MERGE_CHECKPOINT	0x10000000</div><div class='del'>-#define	F2FS_MOUNT_GC_MERGE		0x20000000</div><div class='del'>-#define F2FS_MOUNT_COMPRESS_CACHE	0x40000000</div><div class='add'>+enum f2fs_mount_opt {</div><div class='add'>+	F2FS_MOUNT_DISABLE_ROLL_FORWARD,</div><div class='add'>+	F2FS_MOUNT_DISCARD,</div><div class='add'>+	F2FS_MOUNT_NOHEAP,</div><div class='add'>+	F2FS_MOUNT_XATTR_USER,</div><div class='add'>+	F2FS_MOUNT_POSIX_ACL,</div><div class='add'>+	F2FS_MOUNT_DISABLE_EXT_IDENTIFY,</div><div class='add'>+	F2FS_MOUNT_INLINE_XATTR,</div><div class='add'>+	F2FS_MOUNT_INLINE_DATA,</div><div class='add'>+	F2FS_MOUNT_INLINE_DENTRY,</div><div class='add'>+	F2FS_MOUNT_FLUSH_MERGE,</div><div class='add'>+	F2FS_MOUNT_NOBARRIER,</div><div class='add'>+	F2FS_MOUNT_FASTBOOT,</div><div class='add'>+	F2FS_MOUNT_READ_EXTENT_CACHE,</div><div class='add'>+	F2FS_MOUNT_DATA_FLUSH,</div><div class='add'>+	F2FS_MOUNT_FAULT_INJECTION,</div><div class='add'>+	F2FS_MOUNT_USRQUOTA,</div><div class='add'>+	F2FS_MOUNT_GRPQUOTA,</div><div class='add'>+	F2FS_MOUNT_PRJQUOTA,</div><div class='add'>+	F2FS_MOUNT_QUOTA,</div><div class='add'>+	F2FS_MOUNT_INLINE_XATTR_SIZE,</div><div class='add'>+	F2FS_MOUNT_RESERVE_ROOT,</div><div class='add'>+	F2FS_MOUNT_DISABLE_CHECKPOINT,</div><div class='add'>+	F2FS_MOUNT_NORECOVERY,</div><div class='add'>+	F2FS_MOUNT_ATGC,</div><div class='add'>+	F2FS_MOUNT_MERGE_CHECKPOINT,</div><div class='add'>+	F2FS_MOUNT_GC_MERGE,</div><div class='add'>+	F2FS_MOUNT_COMPRESS_CACHE,</div><div class='add'>+	F2FS_MOUNT_AGE_EXTENT_CACHE,</div><div class='add'>+	F2FS_MOUNT_NAT_BITS,</div><div class='add'>+	F2FS_MOUNT_INLINECRYPT,</div><div class='add'>+	/*</div><div class='add'>+	 * Some f2fs environments expect to be able to pass the "lazytime" option</div><div class='add'>+	 * string rather than using the MS_LAZYTIME flag, so this must remain.</div><div class='add'>+	 */</div><div class='add'>+	F2FS_MOUNT_LAZYTIME,</div><div class='add'>+	F2FS_MOUNT_RESERVE_NODE,</div><div class='add'>+};</div><div class='ctx'> </div><div class='ctx'> #define F2FS_OPTION(sbi)	((sbi)-&gt;mount_opt)</div><div class='del'>-#define clear_opt(sbi, option)	(F2FS_OPTION(sbi).opt &amp;= ~F2FS_MOUNT_##option)</div><div class='del'>-#define set_opt(sbi, option)	(F2FS_OPTION(sbi).opt |= F2FS_MOUNT_##option)</div><div class='del'>-#define test_opt(sbi, option)	(F2FS_OPTION(sbi).opt &amp; F2FS_MOUNT_##option)</div><div class='add'>+#define clear_opt(sbi, option)		\</div><div class='add'>+	(F2FS_OPTION(sbi).opt &amp;= ~BIT(F2FS_MOUNT_##option))</div><div class='add'>+#define set_opt(sbi, option)		\</div><div class='add'>+	(F2FS_OPTION(sbi).opt |= BIT(F2FS_MOUNT_##option))</div><div class='add'>+#define test_opt(sbi, option)		\</div><div class='add'>+	(F2FS_OPTION(sbi).opt &amp; BIT(F2FS_MOUNT_##option))</div><div class='ctx'> </div><div class='ctx'> #define ver_after(a, b)	(typecheck(unsigned long long, a) &amp;&amp;		\</div><div class='ctx'> 		typecheck(unsigned long long, b) &amp;&amp;			\</div><div class='hunk'>@@ -120,10 +155,42 @@ typedef u32 nid_t;</div><div class='ctx'> </div><div class='ctx'> #define COMPRESS_EXT_NUM		16</div><div class='ctx'> </div><div class='add'>+enum blkzone_allocation_policy {</div><div class='add'>+	BLKZONE_ALLOC_PRIOR_SEQ,	/* Prioritize writing to sequential zones */</div><div class='add'>+	BLKZONE_ALLOC_ONLY_SEQ,		/* Only allow writing to sequential zones */</div><div class='add'>+	BLKZONE_ALLOC_PRIOR_CONV,	/* Prioritize writing to conventional zones */</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+enum bggc_io_aware_policy {</div><div class='add'>+	AWARE_ALL_IO,		/* skip background GC if there is any kind of pending IO */</div><div class='add'>+	AWARE_READ_IO,		/* skip background GC if there is pending read IO */</div><div class='add'>+	AWARE_NONE,			/* don't aware IO for background GC */</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+enum device_allocation_policy {</div><div class='add'>+	ALLOCATE_FORWARD_NOHINT,</div><div class='add'>+	ALLOCATE_FORWARD_WITHIN_HINT,</div><div class='add'>+	ALLOCATE_FORWARD_FROM_HINT,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * An implementation of an rwsem that is explicitly unfair to readers. This</div><div class='add'>+ * prevents priority inversion when a low-priority reader acquires the read lock</div><div class='add'>+ * while sleeping on the write lock but the write lock is needed by</div><div class='add'>+ * higher-priority clients.</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+struct f2fs_rwsem {</div><div class='add'>+        struct rw_semaphore internal_rwsem;</div><div class='add'>+#ifdef CONFIG_F2FS_UNFAIR_RWSEM</div><div class='add'>+        wait_queue_head_t read_waiters;</div><div class='add'>+#endif</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> struct f2fs_mount_info {</div><div class='del'>-	unsigned int opt;</div><div class='del'>-	int write_io_size_bits;		/* Write IO size bits */</div><div class='add'>+	unsigned long long opt;</div><div class='ctx'> 	block_t root_reserved_blocks;	/* root reserved blocks */</div><div class='add'>+	block_t root_reserved_nodes;	/* root reserved nodes */</div><div class='ctx'> 	kuid_t s_resuid;		/* reserved blocks for uid */</div><div class='ctx'> 	kgid_t s_resgid;		/* reserved blocks for gid */</div><div class='ctx'> 	int active_logs;		/* # of active logs */</div><div class='hunk'>@@ -137,11 +204,12 @@ struct f2fs_mount_info {</div><div class='ctx'> 	int s_jquota_fmt;			/* Format of quota to use */</div><div class='ctx'> #endif</div><div class='ctx'> 	/* For which write hints are passed down to block layer */</div><div class='del'>-	int whint_mode;</div><div class='ctx'> 	int alloc_mode;			/* segment allocation policy */</div><div class='ctx'> 	int fsync_mode;			/* fsync policy */</div><div class='ctx'> 	int fs_mode;			/* fs mode: LFS or ADAPTIVE */</div><div class='ctx'> 	int bggc_mode;			/* bggc mode: off, on or sync */</div><div class='add'>+	int memory_mode;		/* memory mode */</div><div class='add'>+	int errors;			/* errors parameter */</div><div class='ctx'> 	int discard_unit;		/*</div><div class='ctx'> 					 * discard command's offset/size should</div><div class='ctx'> 					 * be aligned to this unit: block,</div><div class='hunk'>@@ -163,31 +231,30 @@ struct f2fs_mount_info {</div><div class='ctx'> 	int compress_mode;			/* compression mode */</div><div class='ctx'> 	unsigned char extensions[COMPRESS_EXT_NUM][F2FS_EXTENSION_LEN];	/* extensions */</div><div class='ctx'> 	unsigned char noextensions[COMPRESS_EXT_NUM][F2FS_EXTENSION_LEN]; /* extensions */</div><div class='add'>+	unsigned int lookup_mode;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-#define F2FS_FEATURE_ENCRYPT		0x0001</div><div class='del'>-#define F2FS_FEATURE_BLKZONED		0x0002</div><div class='del'>-#define F2FS_FEATURE_ATOMIC_WRITE	0x0004</div><div class='del'>-#define F2FS_FEATURE_EXTRA_ATTR		0x0008</div><div class='del'>-#define F2FS_FEATURE_PRJQUOTA		0x0010</div><div class='del'>-#define F2FS_FEATURE_INODE_CHKSUM	0x0020</div><div class='del'>-#define F2FS_FEATURE_FLEXIBLE_INLINE_XATTR	0x0040</div><div class='del'>-#define F2FS_FEATURE_QUOTA_INO		0x0080</div><div class='del'>-#define F2FS_FEATURE_INODE_CRTIME	0x0100</div><div class='del'>-#define F2FS_FEATURE_LOST_FOUND		0x0200</div><div class='del'>-#define F2FS_FEATURE_VERITY		0x0400</div><div class='del'>-#define F2FS_FEATURE_SB_CHKSUM		0x0800</div><div class='del'>-#define F2FS_FEATURE_CASEFOLD		0x1000</div><div class='del'>-#define F2FS_FEATURE_COMPRESSION	0x2000</div><div class='del'>-#define F2FS_FEATURE_RO			0x4000</div><div class='add'>+#define F2FS_FEATURE_ENCRYPT			0x00000001</div><div class='add'>+#define F2FS_FEATURE_BLKZONED			0x00000002</div><div class='add'>+#define F2FS_FEATURE_ATOMIC_WRITE		0x00000004</div><div class='add'>+#define F2FS_FEATURE_EXTRA_ATTR			0x00000008</div><div class='add'>+#define F2FS_FEATURE_PRJQUOTA			0x00000010</div><div class='add'>+#define F2FS_FEATURE_INODE_CHKSUM		0x00000020</div><div class='add'>+#define F2FS_FEATURE_FLEXIBLE_INLINE_XATTR	0x00000040</div><div class='add'>+#define F2FS_FEATURE_QUOTA_INO			0x00000080</div><div class='add'>+#define F2FS_FEATURE_INODE_CRTIME		0x00000100</div><div class='add'>+#define F2FS_FEATURE_LOST_FOUND			0x00000200</div><div class='add'>+#define F2FS_FEATURE_VERITY			0x00000400</div><div class='add'>+#define F2FS_FEATURE_SB_CHKSUM			0x00000800</div><div class='add'>+#define F2FS_FEATURE_CASEFOLD			0x00001000</div><div class='add'>+#define F2FS_FEATURE_COMPRESSION		0x00002000</div><div class='add'>+#define F2FS_FEATURE_RO				0x00004000</div><div class='add'>+#define F2FS_FEATURE_DEVICE_ALIAS		0x00008000</div><div class='add'>+#define F2FS_FEATURE_PACKED_SSA			0x00010000</div><div class='ctx'> </div><div class='ctx'> #define __F2FS_HAS_FEATURE(raw_super, mask)				\</div><div class='ctx'> 	((raw_super-&gt;feature &amp; cpu_to_le32(mask)) != 0)</div><div class='ctx'> #define F2FS_HAS_FEATURE(sbi, mask)	__F2FS_HAS_FEATURE(sbi-&gt;raw_super, mask)</div><div class='del'>-#define F2FS_SET_FEATURE(sbi, mask)					\</div><div class='del'>-	(sbi-&gt;raw_super-&gt;feature |= cpu_to_le32(mask))</div><div class='del'>-#define F2FS_CLEAR_FEATURE(sbi, mask)					\</div><div class='del'>-	(sbi-&gt;raw_super-&gt;feature &amp;= ~cpu_to_le32(mask))</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Default values for user and/or group using reserved blocks</div><div class='hunk'>@@ -212,7 +279,6 @@ enum {</div><div class='ctx'> #define CP_PAUSE	0x00000040</div><div class='ctx'> #define CP_RESIZE 	0x00000080</div><div class='ctx'> </div><div class='del'>-#define MAX_DISCARD_BLOCKS(sbi)		BLKS_PER_SEC(sbi)</div><div class='ctx'> #define DEF_MAX_DISCARD_REQUEST		8	/* issue 8 discards per round */</div><div class='ctx'> #define DEF_MIN_DISCARD_ISSUE_TIME	50	/* 50 ms, if exists */</div><div class='ctx'> #define DEF_MID_DISCARD_ISSUE_TIME	500	/* 500 ms, if device busy */</div><div class='hunk'>@@ -221,14 +287,42 @@ enum {</div><div class='ctx'> #define DEF_CP_INTERVAL			60	/* 60 secs */</div><div class='ctx'> #define DEF_IDLE_INTERVAL		5	/* 5 secs */</div><div class='ctx'> #define DEF_DISABLE_INTERVAL		5	/* 5 secs */</div><div class='add'>+#define DEF_ENABLE_INTERVAL		5	/* 5 secs */</div><div class='ctx'> #define DEF_DISABLE_QUICK_INTERVAL	1	/* 1 secs */</div><div class='ctx'> #define DEF_UMOUNT_DISCARD_TIMEOUT	5	/* 5 secs */</div><div class='ctx'> </div><div class='add'>+enum cp_time {</div><div class='add'>+	CP_TIME_START,		/* begin */</div><div class='add'>+	CP_TIME_LOCK,		/* after cp_global_sem */</div><div class='add'>+	CP_TIME_OP_LOCK,	/* after block_operation */</div><div class='add'>+	CP_TIME_FLUSH_META,	/* after flush sit/nat */</div><div class='add'>+	CP_TIME_SYNC_META,	/* after sync_meta_pages */</div><div class='add'>+	CP_TIME_SYNC_CP_META,	/* after sync cp meta pages */</div><div class='add'>+	CP_TIME_WAIT_DIRTY_META,/* after wait on dirty meta */</div><div class='add'>+	CP_TIME_WAIT_CP_DATA,	/* after wait on cp data */</div><div class='add'>+	CP_TIME_FLUSH_DEVICE,	/* after flush device cache */</div><div class='add'>+	CP_TIME_WAIT_LAST_CP,	/* after wait on last cp pack */</div><div class='add'>+	CP_TIME_END,		/* after unblock_operation */</div><div class='add'>+	CP_TIME_MAX,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/* time cost stats of checkpoint */</div><div class='add'>+struct cp_stats {</div><div class='add'>+	ktime_t times[CP_TIME_MAX];</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> struct cp_control {</div><div class='ctx'> 	int reason;</div><div class='ctx'> 	__u64 trim_start;</div><div class='ctx'> 	__u64 trim_end;</div><div class='ctx'> 	__u64 trim_minlen;</div><div class='add'>+	struct cp_stats stats;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+enum f2fs_cp_phase {</div><div class='add'>+	CP_PHASE_START_BLOCK_OPS,</div><div class='add'>+	CP_PHASE_FINISH_BLOCK_OPS,</div><div class='add'>+	CP_PHASE_FINISH_CHECKPOINT,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -249,6 +343,10 @@ enum {</div><div class='ctx'> 					 * condition of read on truncated area</div><div class='ctx'> 					 * by extent_cache</div><div class='ctx'> 					 */</div><div class='add'>+	DATA_GENERIC_ENHANCE_UPDATE,	/*</div><div class='add'>+					 * strong check on range and segment</div><div class='add'>+					 * bitmap for update case</div><div class='add'>+					 */</div><div class='ctx'> 	META_GENERIC,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -257,7 +355,8 @@ enum {</div><div class='ctx'> 	ORPHAN_INO,		/* for orphan ino list */</div><div class='ctx'> 	APPEND_INO,		/* for append ino list */</div><div class='ctx'> 	UPDATE_INO,		/* for update ino list */</div><div class='del'>-	TRANS_DIR_INO,		/* for trasactions dir ino list */</div><div class='add'>+	TRANS_DIR_INO,		/* for transactions dir ino list */</div><div class='add'>+	XATTR_DIR_INO,		/* for xattr updated dir ino list */</div><div class='ctx'> 	FLUSH_INO,		/* for multiple device flushing */</div><div class='ctx'> 	MAX_INO_ENTRY,		/* max. list */</div><div class='ctx'> };</div><div class='hunk'>@@ -276,7 +375,7 @@ struct inode_entry {</div><div class='ctx'> </div><div class='ctx'> struct fsync_node_entry {</div><div class='ctx'> 	struct list_head list;	/* list head */</div><div class='del'>-	struct page *page;	/* warm node page pointer */</div><div class='add'>+	struct folio *folio;	/* warm node folio pointer */</div><div class='ctx'> 	unsigned int seq_id;	/* sequence id */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -284,7 +383,10 @@ struct ckpt_req {</div><div class='ctx'> 	struct completion wait;		/* completion for checkpoint done */</div><div class='ctx'> 	struct llist_node llnode;	/* llist_node to be linked in wait queue */</div><div class='ctx'> 	int ret;			/* return code of checkpoint */</div><div class='del'>-	ktime_t queue_time;		/* request queued time */</div><div class='add'>+	union {</div><div class='add'>+		ktime_t queue_time;	/* request queued time */</div><div class='add'>+		ktime_t delta_time;	/* time in queue */</div><div class='add'>+	};</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct ckpt_req_control {</div><div class='hunk'>@@ -300,6 +402,9 @@ struct ckpt_req_control {</div><div class='ctx'> 	unsigned int peak_time;		/* peak wait time in msec until now */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+/* a time threshold that checkpoint was blocked for, unit: ms */</div><div class='add'>+#define CP_LONG_LATENCY_THRESHOLD	5000</div><div class='add'>+</div><div class='ctx'> /* for the bitmap indicate blocks to be discarded */</div><div class='ctx'> struct discard_entry {</div><div class='ctx'> 	struct list_head list;	/* list head */</div><div class='hunk'>@@ -307,8 +412,14 @@ struct discard_entry {</div><div class='ctx'> 	unsigned char discard_map[SIT_VBLOCK_MAP_SIZE];	/* segment discard bitmap */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+/* minimum discard granularity, unit: block count */</div><div class='add'>+#define MIN_DISCARD_GRANULARITY		1</div><div class='ctx'> /* default discard granularity of inner discard thread, unit: block count */</div><div class='ctx'> #define DEFAULT_DISCARD_GRANULARITY		16</div><div class='add'>+/* default maximum discard granularity of ordered discard, unit: block count */</div><div class='add'>+#define DEFAULT_MAX_ORDERED_DISCARD_GRANULARITY	16</div><div class='add'>+/* default interval of periodical discard submission */</div><div class='add'>+#define DEFAULT_DISCARD_INTERVAL	(msecs_to_jiffies(20))</div><div class='ctx'> </div><div class='ctx'> /* max discard pend list number */</div><div class='ctx'> #define MAX_PLIST_NUM		512</div><div class='hunk'>@@ -330,17 +441,9 @@ struct discard_info {</div><div class='ctx'> </div><div class='ctx'> struct discard_cmd {</div><div class='ctx'> 	struct rb_node rb_node;		/* rb node located in rb-tree */</div><div class='del'>-	union {</div><div class='del'>-		struct {</div><div class='del'>-			block_t lstart;	/* logical start address */</div><div class='del'>-			block_t len;	/* length */</div><div class='del'>-			block_t start;	/* actual start address in dev */</div><div class='del'>-		};</div><div class='del'>-		struct discard_info di;	/* discard info */</div><div class='del'>-</div><div class='del'>-	};</div><div class='add'>+	struct discard_info di;		/* discard info */</div><div class='ctx'> 	struct list_head list;		/* command list */</div><div class='del'>-	struct completion wait;		/* compleation */</div><div class='add'>+	struct completion wait;		/* completion */</div><div class='ctx'> 	struct block_device *bdev;	/* bdev */</div><div class='ctx'> 	unsigned short ref;		/* reference count */</div><div class='ctx'> 	unsigned char state;		/* state */</div><div class='hunk'>@@ -358,6 +461,12 @@ enum {</div><div class='ctx'> 	MAX_DPOLICY,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+enum {</div><div class='add'>+	DPOLICY_IO_AWARE_DISABLE,	/* force to not be aware of IO */</div><div class='add'>+	DPOLICY_IO_AWARE_ENABLE,	/* force to be aware of IO */</div><div class='add'>+	DPOLICY_IO_AWARE_MAX,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> struct discard_policy {</div><div class='ctx'> 	int type;			/* type of discard */</div><div class='ctx'> 	unsigned int min_interval;	/* used for candidates exist */</div><div class='hunk'>@@ -379,11 +488,18 @@ struct discard_cmd_control {</div><div class='ctx'> 	struct list_head wait_list;		/* store on-flushing entries */</div><div class='ctx'> 	struct list_head fstrim_list;		/* in-flight discard from fstrim */</div><div class='ctx'> 	wait_queue_head_t discard_wait_queue;	/* waiting queue for wake-up */</div><div class='del'>-	unsigned int discard_wake;		/* to wake up discard thread */</div><div class='ctx'> 	struct mutex cmd_lock;</div><div class='ctx'> 	unsigned int nr_discards;		/* # of discards in the list */</div><div class='ctx'> 	unsigned int max_discards;		/* max. discards to be issued */</div><div class='add'>+	unsigned int max_discard_request;	/* max. discard request per round */</div><div class='add'>+	unsigned int min_discard_issue_time;	/* min. interval between discard issue */</div><div class='add'>+	unsigned int mid_discard_issue_time;	/* mid. interval between discard issue */</div><div class='add'>+	unsigned int max_discard_issue_time;	/* max. interval between discard issue */</div><div class='add'>+	unsigned int discard_io_aware_gran; /* minimum discard granularity not be aware of I/O */</div><div class='add'>+	unsigned int discard_urgent_util;	/* utilization which issue discard proactively */</div><div class='ctx'> 	unsigned int discard_granularity;	/* discard granularity */</div><div class='add'>+	unsigned int max_ordered_discard;	/* maximum discard granularity issued by lba order */</div><div class='add'>+	unsigned int discard_io_aware;		/* io_aware policy */</div><div class='ctx'> 	unsigned int undiscard_blks;		/* # of undiscard blocks */</div><div class='ctx'> 	unsigned int next_pos;			/* next discard position */</div><div class='ctx'> 	atomic_t issued_discard;		/* # of issued discard */</div><div class='hunk'>@@ -391,6 +507,7 @@ struct discard_cmd_control {</div><div class='ctx'> 	atomic_t discard_cmd_cnt;		/* # of cached cmd count */</div><div class='ctx'> 	struct rb_root_cached root;		/* root of discard rb-tree */</div><div class='ctx'> 	bool rbtree_check;			/* config for consistence check */</div><div class='add'>+	bool discard_wake;			/* to wake up discard thread */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /* for the list of fsync inodes, used only during recovery */</div><div class='hunk'>@@ -485,16 +602,16 @@ struct f2fs_filename {</div><div class='ctx'> 	 */</div><div class='ctx'> 	struct fscrypt_str crypto_buf;</div><div class='ctx'> #endif</div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * For casefolded directories: the casefolded name, but it's left NULL</div><div class='del'>-	 * if the original name is not valid Unicode, if the directory is both</div><div class='del'>-	 * casefolded and encrypted and its encryption key is unavailable, or if</div><div class='del'>-	 * the filesystem is doing an internal operation where usr_fname is also</div><div class='del'>-	 * NULL.  In all these cases we fall back to treating the name as an</div><div class='del'>-	 * opaque byte sequence.</div><div class='add'>+	 * if the original name is not valid Unicode, if the original name is</div><div class='add'>+	 * "." or "..", if the directory is both casefolded and encrypted and</div><div class='add'>+	 * its encryption key is unavailable, or if the filesystem is doing an</div><div class='add'>+	 * internal operation where usr_fname is also NULL.  In all these cases</div><div class='add'>+	 * we fall back to treating the name as an opaque byte sequence.</div><div class='ctx'> 	 */</div><div class='del'>-	struct fscrypt_str cf_name;</div><div class='add'>+	struct qstr cf_name;</div><div class='ctx'> #endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -552,12 +669,18 @@ enum {</div><div class='ctx'> </div><div class='ctx'> #define DEFAULT_RETRY_IO_COUNT	8	/* maximum retry read IO or flush count */</div><div class='ctx'> </div><div class='del'>-/* congestion wait timeout value, default: 20ms */</div><div class='del'>-#define	DEFAULT_IO_TIMEOUT	(msecs_to_jiffies(20))</div><div class='add'>+/* IO/non-IO congestion wait timeout value, default: 1ms */</div><div class='add'>+#define	DEFAULT_SCHEDULE_TIMEOUT	(msecs_to_jiffies(1))</div><div class='add'>+</div><div class='add'>+/* timeout value injected, default: 1000ms */</div><div class='add'>+#define DEFAULT_FAULT_TIMEOUT	(msecs_to_jiffies(1000))</div><div class='ctx'> </div><div class='ctx'> /* maximum retry quota flush count */</div><div class='ctx'> #define DEFAULT_RETRY_QUOTA_FLUSH_COUNT		8</div><div class='ctx'> </div><div class='add'>+/* maximum retry of EIO'ed page */</div><div class='add'>+#define MAX_RETRY_PAGE_EIO			100</div><div class='add'>+</div><div class='ctx'> #define F2FS_LINK_MAX	0xffffffff	/* maximum link count per file */</div><div class='ctx'> </div><div class='ctx'> #define MAX_DIR_RA_PAGES	4	/* maximum ra pages of dir */</div><div class='hunk'>@@ -565,30 +688,66 @@ enum {</div><div class='ctx'> /* dirty segments threshold for triggering CP */</div><div class='ctx'> #define DEFAULT_DIRTY_THRESHOLD		4</div><div class='ctx'> </div><div class='add'>+#define RECOVERY_MAX_RA_BLOCKS		BIO_MAX_VECS</div><div class='add'>+#define RECOVERY_MIN_RA_BLOCKS		1</div><div class='add'>+</div><div class='add'>+#define F2FS_ONSTACK_PAGES	16	/* nr of onstack pages */</div><div class='add'>+</div><div class='ctx'> /* for in-memory extent cache entry */</div><div class='ctx'> #define F2FS_MIN_EXTENT_LEN	64	/* minimum extent length */</div><div class='ctx'> </div><div class='ctx'> /* number of extent info in extent cache we try to shrink */</div><div class='del'>-#define EXTENT_CACHE_SHRINK_NUMBER	128</div><div class='add'>+#define READ_EXTENT_CACHE_SHRINK_NUMBER	128</div><div class='ctx'> </div><div class='del'>-struct rb_entry {</div><div class='del'>-	struct rb_node rb_node;		/* rb node located in rb-tree */</div><div class='del'>-	union {</div><div class='del'>-		struct {</div><div class='del'>-			unsigned int ofs;	/* start offset of the entry */</div><div class='del'>-			unsigned int len;	/* length of the entry */</div><div class='del'>-		};</div><div class='del'>-		unsigned long long key;		/* 64-bits key */</div><div class='del'>-	} __packed;</div><div class='add'>+/* number of age extent info in extent cache we try to shrink */</div><div class='add'>+#define AGE_EXTENT_CACHE_SHRINK_NUMBER	128</div><div class='add'>+#define LAST_AGE_WEIGHT			30</div><div class='add'>+#define SAME_AGE_REGION			1024</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Define data block with age less than 1GB as hot data</div><div class='add'>+ * define data block with age less than 10GB but more than 1GB as warm data</div><div class='add'>+ */</div><div class='add'>+#define DEF_HOT_DATA_AGE_THRESHOLD	262144</div><div class='add'>+#define DEF_WARM_DATA_AGE_THRESHOLD	2621440</div><div class='add'>+</div><div class='add'>+/* default max read extent count per inode */</div><div class='add'>+#define DEF_MAX_READ_EXTENT_COUNT	10240</div><div class='add'>+</div><div class='add'>+/* extent cache type */</div><div class='add'>+enum extent_type {</div><div class='add'>+	EX_READ,</div><div class='add'>+	EX_BLOCK_AGE,</div><div class='add'>+	NR_EXTENT_CACHES,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Reserved value to mark invalid age extents, hence valid block range</div><div class='add'>+ * from 0 to ULLONG_MAX-1</div><div class='add'>+ */</div><div class='add'>+#define F2FS_EXTENT_AGE_INVALID	ULLONG_MAX</div><div class='add'>+</div><div class='ctx'> struct extent_info {</div><div class='ctx'> 	unsigned int fofs;		/* start offset in a file */</div><div class='ctx'> 	unsigned int len;		/* length of the extent */</div><div class='del'>-	u32 blk;			/* start block address of the extent */</div><div class='add'>+	union {</div><div class='add'>+		/* read extent_cache */</div><div class='add'>+		struct {</div><div class='add'>+			/* start block address of the extent */</div><div class='add'>+			block_t blk;</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='del'>-	unsigned int c_len;		/* physical extent length of compressed blocks */</div><div class='add'>+			/* physical extent length of compressed blocks */</div><div class='add'>+			unsigned int c_len;</div><div class='ctx'> #endif</div><div class='add'>+		};</div><div class='add'>+		/* block age extent_cache */</div><div class='add'>+		struct {</div><div class='add'>+			/* block age of the extent */</div><div class='add'>+			unsigned long long age;</div><div class='add'>+			/* last total blocks allocated */</div><div class='add'>+			unsigned long long last_blocks;</div><div class='add'>+		};</div><div class='add'>+	};</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct extent_node {</div><div class='hunk'>@@ -600,25 +759,35 @@ struct extent_node {</div><div class='ctx'> </div><div class='ctx'> struct extent_tree {</div><div class='ctx'> 	nid_t ino;			/* inode number */</div><div class='add'>+	enum extent_type type;		/* keep the extent tree type */</div><div class='ctx'> 	struct rb_root_cached root;	/* root of extent info rb-tree */</div><div class='ctx'> 	struct extent_node *cached_en;	/* recently accessed extent node */</div><div class='del'>-	struct extent_info largest;	/* largested extent info */</div><div class='ctx'> 	struct list_head list;		/* to be used by sbi-&gt;zombie_list */</div><div class='ctx'> 	rwlock_t lock;			/* protect extent info rb-tree */</div><div class='ctx'> 	atomic_t node_cnt;		/* # of extent node in rb-tree*/</div><div class='ctx'> 	bool largest_updated;		/* largest extent updated */</div><div class='add'>+	struct extent_info largest;	/* largest cached extent for EX_READ */</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct extent_tree_info {</div><div class='add'>+	struct radix_tree_root extent_tree_root;/* cache extent cache entries */</div><div class='add'>+	struct mutex extent_tree_lock;	/* locking extent radix tree */</div><div class='add'>+	struct list_head extent_list;		/* lru list for shrinker */</div><div class='add'>+	spinlock_t extent_lock;			/* locking extent lru list */</div><div class='add'>+	atomic_t total_ext_tree;		/* extent tree count */</div><div class='add'>+	struct list_head zombie_list;		/* extent zombie tree list */</div><div class='add'>+	atomic_t total_zombie_tree;		/* extent zombie tree count */</div><div class='add'>+	atomic_t total_ext_node;		/* extent info count */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * This structure is taken from ext4_map_blocks.</div><div class='del'>- *</div><div class='del'>- * Note that, however, f2fs uses NEW and MAPPED flags for f2fs_map_blocks().</div><div class='add'>+ * State of block returned by f2fs_map_blocks.</div><div class='ctx'>  */</div><div class='del'>-#define F2FS_MAP_NEW		(1 &lt;&lt; BH_New)</div><div class='del'>-#define F2FS_MAP_MAPPED		(1 &lt;&lt; BH_Mapped)</div><div class='del'>-#define F2FS_MAP_UNWRITTEN	(1 &lt;&lt; BH_Unwritten)</div><div class='add'>+#define F2FS_MAP_NEW		(1U &lt;&lt; 0)</div><div class='add'>+#define F2FS_MAP_MAPPED		(1U &lt;&lt; 1)</div><div class='add'>+#define F2FS_MAP_DELALLOC	(1U &lt;&lt; 2)</div><div class='ctx'> #define F2FS_MAP_FLAGS		(F2FS_MAP_NEW | F2FS_MAP_MAPPED |\</div><div class='del'>-				F2FS_MAP_UNWRITTEN)</div><div class='add'>+				F2FS_MAP_DELALLOC)</div><div class='ctx'> </div><div class='ctx'> struct f2fs_map_blocks {</div><div class='ctx'> 	struct block_device *m_bdev;	/* for multi-device dio */</div><div class='hunk'>@@ -626,6 +795,7 @@ struct f2fs_map_blocks {</div><div class='ctx'> 	block_t m_lblk;</div><div class='ctx'> 	unsigned int m_len;</div><div class='ctx'> 	unsigned int m_flags;</div><div class='add'>+	unsigned long m_last_pblk;	/* last allocated block, only used for DIO in LFS mode */</div><div class='ctx'> 	pgoff_t *m_next_pgofs;		/* point next possible non-hole pgofs */</div><div class='ctx'> 	pgoff_t *m_next_extent;		/* point to next possible extent */</div><div class='ctx'> 	int m_seg_type;</div><div class='hunk'>@@ -654,6 +824,7 @@ enum {</div><div class='ctx'> #define FADVISE_KEEP_SIZE_BIT	0x10</div><div class='ctx'> #define FADVISE_HOT_BIT		0x20</div><div class='ctx'> #define FADVISE_VERITY_BIT	0x40</div><div class='add'>+#define FADVISE_TRUNC_BIT	0x80</div><div class='ctx'> </div><div class='ctx'> #define FADVISE_MODIFIABLE_BITS	(FADVISE_COLD_BIT | FADVISE_HOT_BIT)</div><div class='ctx'> </div><div class='hunk'>@@ -681,13 +852,11 @@ enum {</div><div class='ctx'> #define file_is_verity(inode)	is_file(inode, FADVISE_VERITY_BIT)</div><div class='ctx'> #define file_set_verity(inode)	set_file(inode, FADVISE_VERITY_BIT)</div><div class='ctx'> </div><div class='del'>-#define DEF_DIR_LEVEL		0</div><div class='add'>+#define file_should_truncate(inode)	is_file(inode, FADVISE_TRUNC_BIT)</div><div class='add'>+#define file_need_truncate(inode)	set_file(inode, FADVISE_TRUNC_BIT)</div><div class='add'>+#define file_dont_truncate(inode)	clear_file(inode, FADVISE_TRUNC_BIT)</div><div class='ctx'> </div><div class='del'>-enum {</div><div class='del'>-	GC_FAILURE_PIN,</div><div class='del'>-	GC_FAILURE_ATOMIC,</div><div class='del'>-	MAX_GC_FAILURE</div><div class='del'>-};</div><div class='add'>+#define DEF_DIR_LEVEL		0</div><div class='ctx'> </div><div class='ctx'> /* used for f2fs_inode_info-&gt;flags */</div><div class='ctx'> enum {</div><div class='hunk'>@@ -707,20 +876,15 @@ enum {</div><div class='ctx'> 	FI_UPDATE_WRITE,	/* inode has in-place-update data */</div><div class='ctx'> 	FI_NEED_IPU,		/* used for ipu per file */</div><div class='ctx'> 	FI_ATOMIC_FILE,		/* indicate atomic file */</div><div class='del'>-	FI_ATOMIC_COMMIT,	/* indicate the state of atomical committing */</div><div class='del'>-	FI_VOLATILE_FILE,	/* indicate volatile file */</div><div class='del'>-	FI_FIRST_BLOCK_WRITTEN,	/* indicate #0 data block was written */</div><div class='del'>-	FI_DROP_CACHE,		/* drop dirty page cache */</div><div class='ctx'> 	FI_DATA_EXIST,		/* indicate data exists */</div><div class='del'>-	FI_INLINE_DOTS,		/* indicate inline dot dentries */</div><div class='del'>-	FI_DO_DEFRAG,		/* indicate defragment is running */</div><div class='add'>+	FI_SKIP_WRITES,		/* should skip data page writeback */</div><div class='add'>+	FI_OPU_WRITE,		/* used for opu per file */</div><div class='ctx'> 	FI_DIRTY_FILE,		/* indicate regular/symlink has dirty pages */</div><div class='del'>-	FI_NO_PREALLOC,		/* indicate skipped preallocated blocks */</div><div class='add'>+	FI_PREALLOCATED_ALL,	/* all blocks for write were preallocated */</div><div class='ctx'> 	FI_HOT_DATA,		/* indicate file is hot */</div><div class='ctx'> 	FI_EXTRA_ATTR,		/* indicate file has extra attribute */</div><div class='ctx'> 	FI_PROJ_INHERIT,	/* indicate file inherits projectid */</div><div class='ctx'> 	FI_PIN_FILE,		/* indicate file should not be gced */</div><div class='del'>-	FI_ATOMIC_REVOKE_REQUEST, /* request to drop atomic data */</div><div class='ctx'> 	FI_VERITY_IN_PROGRESS,	/* building fs-verity Merkle tree */</div><div class='ctx'> 	FI_COMPRESSED_FILE,	/* indicate file's data can be compressed */</div><div class='ctx'> 	FI_COMPRESS_CORRUPT,	/* indicate compressed cluster is corrupted */</div><div class='hunk'>@@ -728,6 +892,12 @@ enum {</div><div class='ctx'> 	FI_ENABLE_COMPRESS,	/* enable compression in "user" compression mode */</div><div class='ctx'> 	FI_COMPRESS_RELEASED,	/* compressed blocks were released */</div><div class='ctx'> 	FI_ALIGNED_WRITE,	/* enable aligned write */</div><div class='add'>+	FI_COW_FILE,		/* indicate COW file */</div><div class='add'>+	FI_ATOMIC_COMMITTED,	/* indicate atomic commit completed except disk sync */</div><div class='add'>+	FI_ATOMIC_DIRTIED,	/* indicate atomic file is dirtied */</div><div class='add'>+	FI_ATOMIC_REPLACE,	/* indicate atomic replace */</div><div class='add'>+	FI_OPENED_FILE,		/* indicate file has been opened */</div><div class='add'>+	FI_DONATE_FINISHED,	/* indicate page donation of file has been finished */</div><div class='ctx'> 	FI_MAX,			/* max flag, never be used */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -736,58 +906,80 @@ struct f2fs_inode_info {</div><div class='ctx'> 	unsigned long i_flags;		/* keep an inode flags for ioctl */</div><div class='ctx'> 	unsigned char i_advise;		/* use to give file attribute hints */</div><div class='ctx'> 	unsigned char i_dir_level;	/* use for dentry level for large dir */</div><div class='del'>-	unsigned int i_current_depth;	/* only for directory depth */</div><div class='del'>-	/* for gc failure statistic */</div><div class='del'>-	unsigned int i_gc_failures[MAX_GC_FAILURE];</div><div class='add'>+	union {</div><div class='add'>+		unsigned int i_current_depth;	/* only for directory depth */</div><div class='add'>+		unsigned short i_gc_failures;	/* for gc failure statistic */</div><div class='add'>+	};</div><div class='ctx'> 	unsigned int i_pino;		/* parent inode number */</div><div class='ctx'> 	umode_t i_acl_mode;		/* keep file acl mode temporarily */</div><div class='ctx'> </div><div class='ctx'> 	/* Use below internally in f2fs*/</div><div class='ctx'> 	unsigned long flags[BITS_TO_LONGS(FI_MAX)];	/* use to pass per-file flags */</div><div class='del'>-	struct rw_semaphore i_sem;	/* protect fi info */</div><div class='add'>+	unsigned int ioprio_hint;	/* hint for IO priority */</div><div class='add'>+	struct f2fs_rwsem i_sem;	/* protect fi info */</div><div class='ctx'> 	atomic_t dirty_pages;		/* # of dirty pages */</div><div class='ctx'> 	f2fs_hash_t chash;		/* hash value of given file name */</div><div class='ctx'> 	unsigned int clevel;		/* maximum level of given file name */</div><div class='ctx'> 	struct task_struct *task;	/* lookup and create consistency */</div><div class='ctx'> 	struct task_struct *cp_task;	/* separate cp/wb IO stats*/</div><div class='add'>+	struct task_struct *wb_task;	/* indicate inode is in context of writeback */</div><div class='ctx'> 	nid_t i_xattr_nid;		/* node id that contains xattrs */</div><div class='ctx'> 	loff_t	last_disk_size;		/* lastly written file size */</div><div class='ctx'> 	spinlock_t i_size_lock;		/* protect last_disk_size */</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='del'>-	struct dquot *i_dquot[MAXQUOTAS];</div><div class='add'>+	struct dquot __rcu *i_dquot[MAXQUOTAS];</div><div class='ctx'> </div><div class='ctx'> 	/* quota space reservation, managed internally by quota code */</div><div class='ctx'> 	qsize_t i_reserved_quota;</div><div class='ctx'> #endif</div><div class='ctx'> 	struct list_head dirty_list;	/* dirty list for dirs and files */</div><div class='ctx'> 	struct list_head gdirty_list;	/* linked in global dirty list */</div><div class='del'>-	struct list_head inmem_ilist;	/* list for inmem inodes */</div><div class='del'>-	struct list_head inmem_pages;	/* inmemory pages managed by f2fs */</div><div class='del'>-	struct task_struct *inmem_task;	/* store inmemory task */</div><div class='del'>-	struct mutex inmem_lock;	/* lock for inmemory pages */</div><div class='del'>-	struct extent_tree *extent_tree;	/* cached extent_tree entry */</div><div class='add'>+</div><div class='add'>+	/* linked in global inode list for cache donation */</div><div class='add'>+	struct list_head gdonate_list;</div><div class='add'>+	pgoff_t donate_start, donate_end; /* inclusive */</div><div class='add'>+	atomic_t open_count;		/* # of open files */</div><div class='add'>+</div><div class='add'>+	struct task_struct *atomic_write_task;	/* store atomic write task */</div><div class='add'>+	struct extent_tree *extent_tree[NR_EXTENT_CACHES];</div><div class='add'>+					/* cached extent_tree entry */</div><div class='add'>+	union {</div><div class='add'>+		struct inode *cow_inode;	/* copy-on-write inode for atomic write */</div><div class='add'>+		struct inode *atomic_inode;</div><div class='add'>+					/* point to atomic_inode, available only for cow_inode */</div><div class='add'>+	};</div><div class='ctx'> </div><div class='ctx'> 	/* avoid racing between foreground op and gc */</div><div class='del'>-	struct rw_semaphore i_gc_rwsem[2];</div><div class='del'>-	struct rw_semaphore i_xattr_sem; /* avoid racing between reading and changing EAs */</div><div class='add'>+	struct f2fs_rwsem i_gc_rwsem[2];</div><div class='add'>+	struct f2fs_rwsem i_xattr_sem; /* avoid racing between reading and changing EAs */</div><div class='ctx'> </div><div class='ctx'> 	int i_extra_isize;		/* size of extra space located in i_addr */</div><div class='ctx'> 	kprojid_t i_projid;		/* id for project quota */</div><div class='ctx'> 	int i_inline_xattr_size;	/* inline xattr size */</div><div class='ctx'> 	struct timespec64 i_crtime;	/* inode creation time */</div><div class='del'>-	struct timespec64 i_disk_time[4];/* inode disk times */</div><div class='add'>+	struct timespec64 i_disk_time[3];/* inode disk times */</div><div class='ctx'> </div><div class='ctx'> 	/* for file compress */</div><div class='ctx'> 	atomic_t i_compr_blocks;		/* # of compressed blocks */</div><div class='ctx'> 	unsigned char i_compress_algorithm;	/* algorithm type */</div><div class='ctx'> 	unsigned char i_log_cluster_size;	/* log of cluster size */</div><div class='ctx'> 	unsigned char i_compress_level;		/* compress level (lz4hc,zstd) */</div><div class='del'>-	unsigned short i_compress_flag;		/* compress flag */</div><div class='add'>+	unsigned char i_compress_flag;		/* compress flag */</div><div class='ctx'> 	unsigned int i_cluster_size;		/* cluster size */</div><div class='add'>+	atomic_t writeback;			/* count # of writeback thread */</div><div class='add'>+</div><div class='add'>+	unsigned int atomic_write_cnt;</div><div class='add'>+	loff_t original_i_size;		/* original i_size before atomic write */</div><div class='add'>+#ifdef CONFIG_FS_ENCRYPTION</div><div class='add'>+	struct fscrypt_inode_info *i_crypt_info; /* filesystem encryption info */</div><div class='add'>+#endif</div><div class='add'>+#ifdef CONFIG_FS_VERITY</div><div class='add'>+	struct fsverity_info *i_verity_info; /* filesystem verity info */</div><div class='add'>+#endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static inline void get_extent_info(struct extent_info *ext,</div><div class='add'>+static inline void get_read_extent_info(struct extent_info *ext,</div><div class='ctx'> 					struct f2fs_extent *i_ext)</div><div class='ctx'> {</div><div class='ctx'> 	ext-&gt;fofs = le32_to_cpu(i_ext-&gt;fofs);</div><div class='hunk'>@@ -795,7 +987,7 @@ static inline void get_extent_info(struct extent_info *ext,</div><div class='ctx'> 	ext-&gt;len = le32_to_cpu(i_ext-&gt;len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void set_raw_extent(struct extent_info *ext,</div><div class='add'>+static inline void set_raw_read_extent(struct extent_info *ext,</div><div class='ctx'> 					struct f2fs_extent *i_ext)</div><div class='ctx'> {</div><div class='ctx'> 	i_ext-&gt;fofs = cpu_to_le32(ext-&gt;fofs);</div><div class='hunk'>@@ -803,17 +995,6 @@ static inline void set_raw_extent(struct extent_info *ext,</div><div class='ctx'> 	i_ext-&gt;len = cpu_to_le32(ext-&gt;len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void set_extent_info(struct extent_info *ei, unsigned int fofs,</div><div class='del'>-						u32 blk, unsigned int len)</div><div class='del'>-{</div><div class='del'>-	ei-&gt;fofs = fofs;</div><div class='del'>-	ei-&gt;blk = blk;</div><div class='del'>-	ei-&gt;len = len;</div><div class='del'>-#ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='del'>-	ei-&gt;c_len = 0;</div><div class='del'>-#endif</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static inline bool __is_discard_mergeable(struct discard_info *back,</div><div class='ctx'> 			struct discard_info *front, unsigned int max_len)</div><div class='ctx'> {</div><div class='hunk'>@@ -833,41 +1014,6 @@ static inline bool __is_discard_front_mergeable(struct discard_info *cur,</div><div class='ctx'> 	return __is_discard_mergeable(cur, front, max_len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline bool __is_extent_mergeable(struct extent_info *back,</div><div class='del'>-						struct extent_info *front)</div><div class='del'>-{</div><div class='del'>-#ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='del'>-	if (back-&gt;c_len &amp;&amp; back-&gt;len != back-&gt;c_len)</div><div class='del'>-		return false;</div><div class='del'>-	if (front-&gt;c_len &amp;&amp; front-&gt;len != front-&gt;c_len)</div><div class='del'>-		return false;</div><div class='del'>-#endif</div><div class='del'>-	return (back-&gt;fofs + back-&gt;len == front-&gt;fofs &amp;&amp;</div><div class='del'>-			back-&gt;blk + back-&gt;len == front-&gt;blk);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline bool __is_back_mergeable(struct extent_info *cur,</div><div class='del'>-						struct extent_info *back)</div><div class='del'>-{</div><div class='del'>-	return __is_extent_mergeable(back, cur);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline bool __is_front_mergeable(struct extent_info *cur,</div><div class='del'>-						struct extent_info *front)</div><div class='del'>-{</div><div class='del'>-	return __is_extent_mergeable(cur, front);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-extern void f2fs_mark_inode_dirty_sync(struct inode *inode, bool sync);</div><div class='del'>-static inline void __try_update_largest_extent(struct extent_tree *et,</div><div class='del'>-						struct extent_node *en)</div><div class='del'>-{</div><div class='del'>-	if (en-&gt;ei.len &gt; et-&gt;largest.len) {</div><div class='del'>-		et-&gt;largest = en-&gt;ei;</div><div class='del'>-		et-&gt;largest_updated = true;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * For free nid management</div><div class='ctx'>  */</div><div class='hunk'>@@ -889,6 +1035,7 @@ struct f2fs_nm_info {</div><div class='ctx'> 	nid_t max_nid;			/* maximum possible node ids */</div><div class='ctx'> 	nid_t available_nids;		/* # of available node ids */</div><div class='ctx'> 	nid_t next_scan_nid;		/* the next nid to be scanned */</div><div class='add'>+	nid_t max_rf_node_blocks;	/* max # of nodes for recovery */</div><div class='ctx'> 	unsigned int ram_thresh;	/* control the memory footprint */</div><div class='ctx'> 	unsigned int ra_nid_pages;	/* # of nid pages to be readaheaded */</div><div class='ctx'> 	unsigned int dirty_nats_ratio;	/* control dirty nats ratio threshold */</div><div class='hunk'>@@ -896,7 +1043,7 @@ struct f2fs_nm_info {</div><div class='ctx'> 	/* NAT cache management */</div><div class='ctx'> 	struct radix_tree_root nat_root;/* root of the nat entry cache */</div><div class='ctx'> 	struct radix_tree_root nat_set_root;/* root of the nat set cache */</div><div class='del'>-	struct rw_semaphore nat_tree_lock;	/* protect nat entry tree */</div><div class='add'>+	struct f2fs_rwsem nat_tree_lock;	/* protect nat entry tree */</div><div class='ctx'> 	struct list_head nat_entries;	/* cached nat entry list (clean) */</div><div class='ctx'> 	spinlock_t nat_list_lock;	/* protect clean nat entry list */</div><div class='ctx'> 	unsigned int nat_cnt[MAX_NAT_STATE]; /* the # of cached nat entries */</div><div class='hunk'>@@ -932,11 +1079,11 @@ struct f2fs_nm_info {</div><div class='ctx'>  */</div><div class='ctx'> struct dnode_of_data {</div><div class='ctx'> 	struct inode *inode;		/* vfs inode pointer */</div><div class='del'>-	struct page *inode_page;	/* its inode page, NULL is possible */</div><div class='del'>-	struct page *node_page;		/* cached direct node page */</div><div class='add'>+	struct folio *inode_folio;	/* its inode folio, NULL is possible */</div><div class='add'>+	struct folio *node_folio;	/* cached direct node folio */</div><div class='ctx'> 	nid_t nid;			/* node id of the direct node block */</div><div class='ctx'> 	unsigned int ofs_in_node;	/* data offset in the node page */</div><div class='del'>-	bool inode_page_locked;		/* inode page is locked or not */</div><div class='add'>+	bool inode_folio_locked;	/* inode folio is locked or not */</div><div class='ctx'> 	bool node_changed;		/* is node block changed */</div><div class='ctx'> 	char cur_level;			/* level of hole node page */</div><div class='ctx'> 	char max_level;			/* level of current page located */</div><div class='hunk'>@@ -944,12 +1091,12 @@ struct dnode_of_data {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static inline void set_new_dnode(struct dnode_of_data *dn, struct inode *inode,</div><div class='del'>-		struct page *ipage, struct page *npage, nid_t nid)</div><div class='add'>+		struct folio *ifolio, struct folio *nfolio, nid_t nid)</div><div class='ctx'> {</div><div class='ctx'> 	memset(dn, 0, sizeof(*dn));</div><div class='ctx'> 	dn-&gt;inode = inode;</div><div class='del'>-	dn-&gt;inode_page = ipage;</div><div class='del'>-	dn-&gt;node_page = npage;</div><div class='add'>+	dn-&gt;inode_folio = ifolio;</div><div class='add'>+	dn-&gt;node_folio = nfolio;</div><div class='ctx'> 	dn-&gt;nid = nid;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -973,7 +1120,7 @@ static inline void set_new_dnode(struct dnode_of_data *dn, struct inode *inode,</div><div class='ctx'> #define NR_CURSEG_PERSIST_TYPE	(NR_CURSEG_DATA_TYPE + NR_CURSEG_NODE_TYPE)</div><div class='ctx'> #define NR_CURSEG_TYPE		(NR_CURSEG_INMEM_TYPE + NR_CURSEG_PERSIST_TYPE)</div><div class='ctx'> </div><div class='del'>-enum {</div><div class='add'>+enum log_type {</div><div class='ctx'> 	CURSEG_HOT_DATA	= 0,	/* directory entry blocks */</div><div class='ctx'> 	CURSEG_WARM_DATA,	/* data blocks */</div><div class='ctx'> 	CURSEG_COLD_DATA,	/* multimedia or GCed data blocks */</div><div class='hunk'>@@ -1009,7 +1156,7 @@ struct f2fs_sm_info {</div><div class='ctx'> 	struct dirty_seglist_info *dirty_info;	/* dirty segment information */</div><div class='ctx'> 	struct curseg_info *curseg_array;	/* active segment information */</div><div class='ctx'> </div><div class='del'>-	struct rw_semaphore curseg_lock;	/* for preventing curseg change */</div><div class='add'>+	struct f2fs_rwsem curseg_lock;	/* for preventing curseg change */</div><div class='ctx'> </div><div class='ctx'> 	block_t seg0_blkaddr;		/* block address of 0'th segment */</div><div class='ctx'> 	block_t main_blkaddr;		/* start block address of main area */</div><div class='hunk'>@@ -1023,9 +1170,6 @@ struct f2fs_sm_info {</div><div class='ctx'> 	/* a threshold to reclaim prefree segments */</div><div class='ctx'> 	unsigned int rec_prefree_segments;</div><div class='ctx'> </div><div class='del'>-	/* for batched trimming */</div><div class='del'>-	unsigned int trim_sections;		/* # of sections to trim */</div><div class='del'>-</div><div class='ctx'> 	struct list_head sit_entry_set;	/* sit entry set list */</div><div class='ctx'> </div><div class='ctx'> 	unsigned int ipu_policy;	/* in-place-update policy */</div><div class='hunk'>@@ -1051,14 +1195,14 @@ struct f2fs_sm_info {</div><div class='ctx'>  * f2fs monitors the number of several block types such as on-writeback,</div><div class='ctx'>  * dirty dentry blocks, dirty node blocks, and dirty meta blocks.</div><div class='ctx'>  */</div><div class='del'>-#define WB_DATA_TYPE(p)	(__is_cp_guaranteed(p) ? F2FS_WB_CP_DATA : F2FS_WB_DATA)</div><div class='add'>+#define WB_DATA_TYPE(folio, f)			\</div><div class='add'>+	(f || f2fs_is_cp_guaranteed(folio) ? F2FS_WB_CP_DATA : F2FS_WB_DATA)</div><div class='ctx'> enum count_type {</div><div class='ctx'> 	F2FS_DIRTY_DENTS,</div><div class='ctx'> 	F2FS_DIRTY_DATA,</div><div class='ctx'> 	F2FS_DIRTY_QDATA,</div><div class='ctx'> 	F2FS_DIRTY_NODES,</div><div class='ctx'> 	F2FS_DIRTY_META,</div><div class='del'>-	F2FS_INMEM_PAGES,</div><div class='ctx'> 	F2FS_DIRTY_IMETA,</div><div class='ctx'> 	F2FS_WB_CP_DATA,</div><div class='ctx'> 	F2FS_WB_DATA,</div><div class='hunk'>@@ -1082,17 +1226,14 @@ enum count_type {</div><div class='ctx'>  * ...			Only can be used with META.</div><div class='ctx'>  */</div><div class='ctx'> #define PAGE_TYPE_OF_BIO(type)	((type) &gt; META ? META : (type))</div><div class='add'>+#define PAGE_TYPE_ON_MAIN(type)	((type) == DATA || (type) == NODE)</div><div class='ctx'> enum page_type {</div><div class='del'>-	DATA,</div><div class='del'>-	NODE,</div><div class='add'>+	DATA = 0,</div><div class='add'>+	NODE = 1,	/* should not change this */</div><div class='ctx'> 	META,</div><div class='ctx'> 	NR_PAGE_TYPE,</div><div class='ctx'> 	META_FLUSH,</div><div class='del'>-	INMEM,		/* the below types are used by tracepoints only. */</div><div class='del'>-	INMEM_DROP,</div><div class='del'>-	INMEM_INVALIDATE,</div><div class='del'>-	INMEM_REVOKE,</div><div class='del'>-	IPU,</div><div class='add'>+	IPU,		/* the below types are used by tracepoints only. */</div><div class='ctx'> 	OPU,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -1121,6 +1262,7 @@ enum cp_reason_type {</div><div class='ctx'> 	CP_FASTBOOT_MODE,</div><div class='ctx'> 	CP_SPEC_LOG_NUM,</div><div class='ctx'> 	CP_RECOVER_DIR,</div><div class='add'>+	CP_XATTR_DIR,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> enum iostat_type {</div><div class='hunk'>@@ -1129,7 +1271,10 @@ enum iostat_type {</div><div class='ctx'> 	APP_BUFFERED_IO,		/* app buffered write IOs */</div><div class='ctx'> 	APP_WRITE_IO,			/* app write IOs */</div><div class='ctx'> 	APP_MAPPED_IO,			/* app mapped IOs */</div><div class='add'>+	APP_BUFFERED_CDATA_IO,		/* app buffered write IOs on compressed file */</div><div class='add'>+	APP_MAPPED_CDATA_IO,		/* app mapped write IOs on compressed file */</div><div class='ctx'> 	FS_DATA_IO,			/* data IOs from kworker/fsync/reclaimer */</div><div class='add'>+	FS_CDATA_IO,			/* data IOs from kworker/fsync/reclaimer on compressed file */</div><div class='ctx'> 	FS_NODE_IO,			/* node IOs from kworker/fsync/reclaimer */</div><div class='ctx'> 	FS_META_IO,			/* meta IOs from kworker/reclaimer */</div><div class='ctx'> 	FS_GC_DATA_IO,			/* data IOs from forground gc */</div><div class='hunk'>@@ -1143,6 +1288,8 @@ enum iostat_type {</div><div class='ctx'> 	APP_BUFFERED_READ_IO,		/* app buffered read IOs */</div><div class='ctx'> 	APP_READ_IO,			/* app read IOs */</div><div class='ctx'> 	APP_MAPPED_READ_IO,		/* app mapped read IOs */</div><div class='add'>+	APP_BUFFERED_CDATA_READ_IO,	/* app buffered read IOs on compressed file  */</div><div class='add'>+	APP_MAPPED_CDATA_READ_IO,	/* app mapped read IOs on compressed file  */</div><div class='ctx'> 	FS_DATA_READ_IO,		/* data read IOs */</div><div class='ctx'> 	FS_GDATA_READ_IO,		/* data read IOs from background gc */</div><div class='ctx'> 	FS_CDATA_READ_IO,		/* compressed data read IOs */</div><div class='hunk'>@@ -1150,7 +1297,9 @@ enum iostat_type {</div><div class='ctx'> 	FS_META_READ_IO,		/* meta read IOs */</div><div class='ctx'> </div><div class='ctx'> 	/* other */</div><div class='del'>-	FS_DISCARD,			/* discard */</div><div class='add'>+	FS_DISCARD_IO,			/* discard */</div><div class='add'>+	FS_FLUSH_IO,			/* flush */</div><div class='add'>+	FS_ZONE_RESET_IO,		/* zone reset */</div><div class='ctx'> 	NR_IO_TYPE,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -1159,26 +1308,29 @@ struct f2fs_io_info {</div><div class='ctx'> 	nid_t ino;		/* inode number */</div><div class='ctx'> 	enum page_type type;	/* contains DATA/NODE/META/META_FLUSH */</div><div class='ctx'> 	enum temp_type temp;	/* contains HOT/WARM/COLD */</div><div class='del'>-	int op;			/* contains REQ_OP_ */</div><div class='del'>-	int op_flags;		/* req_flag_bits */</div><div class='add'>+	enum req_op op;		/* contains REQ_OP_ */</div><div class='add'>+	blk_opf_t op_flags;	/* req_flag_bits */</div><div class='ctx'> 	block_t new_blkaddr;	/* new block address to be written */</div><div class='ctx'> 	block_t old_blkaddr;	/* old block address before Cow */</div><div class='del'>-	struct page *page;	/* page to be written */</div><div class='add'>+	union {</div><div class='add'>+		struct page *page;	/* page to be written */</div><div class='add'>+		struct folio *folio;</div><div class='add'>+	};</div><div class='ctx'> 	struct page *encrypted_page;	/* encrypted page */</div><div class='ctx'> 	struct page *compressed_page;	/* compressed page */</div><div class='ctx'> 	struct list_head list;		/* serialize IOs */</div><div class='del'>-	bool submitted;		/* indicate IO submission */</div><div class='del'>-	int need_lock;		/* indicate we need to lock cp_rwsem */</div><div class='del'>-	bool in_list;		/* indicate fio is in io_list */</div><div class='del'>-	bool is_por;		/* indicate IO is from recovery or not */</div><div class='del'>-	bool retry;		/* need to reallocate block address */</div><div class='del'>-	int compr_blocks;	/* # of compressed block addresses */</div><div class='del'>-	bool encrypted;		/* indicate file is encrypted */</div><div class='add'>+	unsigned int compr_blocks;	/* # of compressed block addresses */</div><div class='add'>+	unsigned int need_lock:8;	/* indicate we need to lock cp_rwsem */</div><div class='add'>+	unsigned int version:8;		/* version of the node */</div><div class='add'>+	unsigned int submitted:1;	/* indicate IO submission */</div><div class='add'>+	unsigned int in_list:1;		/* indicate fio is in io_list */</div><div class='add'>+	unsigned int is_por:1;		/* indicate IO is from recovery or not */</div><div class='add'>+	unsigned int encrypted:1;	/* indicate file is encrypted */</div><div class='add'>+	unsigned int meta_gc:1;		/* require meta inode GC */</div><div class='ctx'> 	enum iostat_type io_type;	/* io type */</div><div class='ctx'> 	struct writeback_control *io_wbc; /* writeback control */</div><div class='ctx'> 	struct bio **bio;		/* bio for ipu */</div><div class='ctx'> 	sector_t *last_block;		/* last block number in bio */</div><div class='del'>-	unsigned char version;		/* version of the node */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct bio_entry {</div><div class='hunk'>@@ -1192,25 +1344,30 @@ struct f2fs_bio_info {</div><div class='ctx'> 	struct bio *bio;		/* bios to merge */</div><div class='ctx'> 	sector_t last_block_in_bio;	/* last block number */</div><div class='ctx'> 	struct f2fs_io_info fio;	/* store buffered io info. */</div><div class='del'>-	struct rw_semaphore io_rwsem;	/* blocking op for bio */</div><div class='add'>+#ifdef CONFIG_BLK_DEV_ZONED</div><div class='add'>+	struct completion zone_wait;	/* condition value for the previous open zone to close */</div><div class='add'>+	struct bio *zone_pending_bio;	/* pending bio for the previous zone */</div><div class='add'>+	void *bi_private;		/* previous bi_private for pending bio */</div><div class='add'>+#endif</div><div class='add'>+	struct f2fs_rwsem io_rwsem;	/* blocking op for bio */</div><div class='ctx'> 	spinlock_t io_lock;		/* serialize DATA/NODE IOs */</div><div class='ctx'> 	struct list_head io_list;	/* track fios */</div><div class='ctx'> 	struct list_head bio_list;	/* bio entry list head */</div><div class='del'>-	struct rw_semaphore bio_list_lock;	/* lock to protect bio entry list */</div><div class='add'>+	struct f2fs_rwsem bio_list_lock;	/* lock to protect bio entry list */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> #define FDEV(i)				(sbi-&gt;devs[i])</div><div class='ctx'> #define RDEV(i)				(raw_super-&gt;devs[i])</div><div class='ctx'> struct f2fs_dev_info {</div><div class='add'>+	struct file *bdev_file;</div><div class='ctx'> 	struct block_device *bdev;</div><div class='del'>-	char path[MAX_PATH_LEN];</div><div class='add'>+	char path[MAX_PATH_LEN + 1];</div><div class='ctx'> 	unsigned int total_segments;</div><div class='ctx'> 	block_t start_blk;</div><div class='ctx'> 	block_t end_blk;</div><div class='ctx'> #ifdef CONFIG_BLK_DEV_ZONED</div><div class='ctx'> 	unsigned int nr_blkz;		/* Total number of zones */</div><div class='ctx'> 	unsigned long *blkz_seq;	/* Bitmap indicating sequential zones */</div><div class='del'>-	block_t *zone_capacity_blocks;  /* Array of zone capacity in blks */</div><div class='ctx'> #endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -1218,7 +1375,7 @@ enum inode_type {</div><div class='ctx'> 	DIR_INODE,			/* for dirty dir inode */</div><div class='ctx'> 	FILE_INODE,			/* for dirty regular/symlink inode */</div><div class='ctx'> 	DIRTY_META,			/* for all dirtied inode metadata */</div><div class='del'>-	ATOMIC_FILE,			/* for all atomic files */</div><div class='add'>+	DONATE_INODE,			/* for all inode to donate pages */</div><div class='ctx'> 	NR_INODE_TYPE,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -1242,7 +1399,20 @@ struct atgc_management {</div><div class='ctx'> 	unsigned long long age_threshold;	/* age threshold */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/* For s_flag in struct f2fs_sb_info */</div><div class='add'>+struct f2fs_gc_control {</div><div class='add'>+	unsigned int victim_segno;	/* target victim segment number */</div><div class='add'>+	int init_gc_type;		/* FG_GC or BG_GC */</div><div class='add'>+	bool no_bg_gc;			/* check the space and stop bg_gc */</div><div class='add'>+	bool should_migrate_blocks;	/* should migrate blocks */</div><div class='add'>+	bool err_gc_skipped;		/* return EAGAIN if GC skipped */</div><div class='add'>+	bool one_time;			/* require one time GC in one migration unit */</div><div class='add'>+	unsigned int nr_free_secs;	/* # of free sections to do GC */</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * For s_flag in struct f2fs_sb_info</div><div class='add'>+ * Modification on enum should be synchronized with s_flag array</div><div class='add'>+ */</div><div class='ctx'> enum {</div><div class='ctx'> 	SBI_IS_DIRTY,				/* dirty flag for checkpoint */</div><div class='ctx'> 	SBI_IS_CLOSE,				/* specify unmounting */</div><div class='hunk'>@@ -1258,6 +1428,9 @@ enum {</div><div class='ctx'> 	SBI_QUOTA_SKIP_FLUSH,			/* skip flushing quota in current CP */</div><div class='ctx'> 	SBI_QUOTA_NEED_REPAIR,			/* quota file may be corrupted */</div><div class='ctx'> 	SBI_IS_RESIZEFS,			/* resizefs is in process */</div><div class='add'>+	SBI_IS_FREEZING,			/* freezefs is in process */</div><div class='add'>+	SBI_IS_WRITABLE,			/* remove ro mountoption transiently */</div><div class='add'>+	MAX_SBI_FLAG,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> enum {</div><div class='hunk'>@@ -1266,10 +1439,12 @@ enum {</div><div class='ctx'> 	DISCARD_TIME,</div><div class='ctx'> 	GC_TIME,</div><div class='ctx'> 	DISABLE_TIME,</div><div class='add'>+	ENABLE_TIME,</div><div class='ctx'> 	UMOUNT_DISCARD_TIMEOUT,</div><div class='ctx'> 	MAX_TIME,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+/* Note that you need to keep synchronization with this gc_mode_names array */</div><div class='ctx'> enum {</div><div class='ctx'> 	GC_NORMAL,</div><div class='ctx'> 	GC_IDLE_CB,</div><div class='hunk'>@@ -1277,6 +1452,7 @@ enum {</div><div class='ctx'> 	GC_IDLE_AT,</div><div class='ctx'> 	GC_URGENT_HIGH,</div><div class='ctx'> 	GC_URGENT_LOW,</div><div class='add'>+	GC_URGENT_MID,</div><div class='ctx'> 	MAX_GC_MODE,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -1297,12 +1473,6 @@ enum {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> enum {</div><div class='del'>-	WHINT_MODE_OFF,		/* not pass down write hints */</div><div class='del'>-	WHINT_MODE_USER,	/* try to pass down hints given by users */</div><div class='del'>-	WHINT_MODE_FS,		/* pass down hints with F2FS policy */</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-enum {</div><div class='ctx'> 	ALLOC_MODE_DEFAULT,	/* stay default */</div><div class='ctx'> 	ALLOC_MODE_REUSE,	/* reuse segments as much as possible */</div><div class='ctx'> };</div><div class='hunk'>@@ -1331,6 +1501,30 @@ enum {</div><div class='ctx'> 	DISCARD_UNIT_SECTION,	/* basic discard unit is section */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+enum {</div><div class='add'>+	MEMORY_MODE_NORMAL,	/* memory mode for normal devices */</div><div class='add'>+	MEMORY_MODE_LOW,	/* memory mode for low memory devices */</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+enum errors_option {</div><div class='add'>+	MOUNT_ERRORS_READONLY,	/* remount fs ro on errors */</div><div class='add'>+	MOUNT_ERRORS_CONTINUE,	/* continue on errors */</div><div class='add'>+	MOUNT_ERRORS_PANIC,	/* panic on errors */</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+enum {</div><div class='add'>+	BACKGROUND,</div><div class='add'>+	FOREGROUND,</div><div class='add'>+	MAX_CALL_TYPE,</div><div class='add'>+	TOTAL_CALL = FOREGROUND,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+enum f2fs_lookup_mode {</div><div class='add'>+	LOOKUP_PERF,</div><div class='add'>+	LOOKUP_COMPAT,</div><div class='add'>+	LOOKUP_AUTO,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> static inline int f2fs_test_bit(unsigned int nr, char *addr);</div><div class='ctx'> static inline void f2fs_set_bit(unsigned int nr, char *addr);</div><div class='ctx'> static inline void f2fs_clear_bit(unsigned int nr, char *addr);</div><div class='hunk'>@@ -1341,110 +1535,24 @@ static inline void f2fs_clear_bit(unsigned int nr, char *addr);</div><div class='ctx'>  * Layout A: lowest bit should be 1</div><div class='ctx'>  * | bit0 = 1 | bit1 | bit2 | ... | bit MAX | private data .... |</div><div class='ctx'>  * bit 0	PAGE_PRIVATE_NOT_POINTER</div><div class='del'>- * bit 1	PAGE_PRIVATE_ATOMIC_WRITE</div><div class='del'>- * bit 2	PAGE_PRIVATE_DUMMY_WRITE</div><div class='del'>- * bit 3	PAGE_PRIVATE_ONGOING_MIGRATION</div><div class='del'>- * bit 4	PAGE_PRIVATE_INLINE_INODE</div><div class='del'>- * bit 5	PAGE_PRIVATE_REF_RESOURCE</div><div class='del'>- * bit 6-	f2fs private data</div><div class='add'>+ * bit 1	PAGE_PRIVATE_ONGOING_MIGRATION</div><div class='add'>+ * bit 2	PAGE_PRIVATE_INLINE_INODE</div><div class='add'>+ * bit 3	PAGE_PRIVATE_REF_RESOURCE</div><div class='add'>+ * bit 4	PAGE_PRIVATE_ATOMIC_WRITE</div><div class='add'>+ * bit 5-	f2fs private data</div><div class='ctx'>  *</div><div class='ctx'>  * Layout B: lowest bit should be 0</div><div class='ctx'>  * page.private is a wrapped pointer.</div><div class='ctx'>  */</div><div class='ctx'> enum {</div><div class='ctx'> 	PAGE_PRIVATE_NOT_POINTER,		/* private contains non-pointer data */</div><div class='del'>-	PAGE_PRIVATE_ATOMIC_WRITE,		/* data page from atomic write path */</div><div class='del'>-	PAGE_PRIVATE_DUMMY_WRITE,		/* data page for padding aligned IO */</div><div class='ctx'> 	PAGE_PRIVATE_ONGOING_MIGRATION,		/* data page which is on-going migrating */</div><div class='ctx'> 	PAGE_PRIVATE_INLINE_INODE,		/* inode page contains inline data */</div><div class='ctx'> 	PAGE_PRIVATE_REF_RESOURCE,		/* dirty page has referenced resources */</div><div class='add'>+	PAGE_PRIVATE_ATOMIC_WRITE,		/* data page from atomic write path */</div><div class='ctx'> 	PAGE_PRIVATE_MAX</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-#define PAGE_PRIVATE_GET_FUNC(name, flagname) \</div><div class='del'>-static inline bool page_private_##name(struct page *page) \</div><div class='del'>-{ \</div><div class='del'>-	return PagePrivate(page) &amp;&amp; \</div><div class='del'>-		test_bit(PAGE_PRIVATE_NOT_POINTER, &amp;page_private(page)) &amp;&amp; \</div><div class='del'>-		test_bit(PAGE_PRIVATE_##flagname, &amp;page_private(page)); \</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#define PAGE_PRIVATE_SET_FUNC(name, flagname) \</div><div class='del'>-static inline void set_page_private_##name(struct page *page) \</div><div class='del'>-{ \</div><div class='del'>-	if (!PagePrivate(page)) { \</div><div class='del'>-		get_page(page); \</div><div class='del'>-		SetPagePrivate(page); \</div><div class='del'>-		set_page_private(page, 0); \</div><div class='del'>-	} \</div><div class='del'>-	set_bit(PAGE_PRIVATE_NOT_POINTER, &amp;page_private(page)); \</div><div class='del'>-	set_bit(PAGE_PRIVATE_##flagname, &amp;page_private(page)); \</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#define PAGE_PRIVATE_CLEAR_FUNC(name, flagname) \</div><div class='del'>-static inline void clear_page_private_##name(struct page *page) \</div><div class='del'>-{ \</div><div class='del'>-	clear_bit(PAGE_PRIVATE_##flagname, &amp;page_private(page)); \</div><div class='del'>-	if (page_private(page) == 1 &lt;&lt; PAGE_PRIVATE_NOT_POINTER) { \</div><div class='del'>-		set_page_private(page, 0); \</div><div class='del'>-		if (PagePrivate(page)) { \</div><div class='del'>-			ClearPagePrivate(page); \</div><div class='del'>-			put_page(page); \</div><div class='del'>-		}\</div><div class='del'>-	} \</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-PAGE_PRIVATE_GET_FUNC(nonpointer, NOT_POINTER);</div><div class='del'>-PAGE_PRIVATE_GET_FUNC(reference, REF_RESOURCE);</div><div class='del'>-PAGE_PRIVATE_GET_FUNC(inline, INLINE_INODE);</div><div class='del'>-PAGE_PRIVATE_GET_FUNC(gcing, ONGOING_MIGRATION);</div><div class='del'>-PAGE_PRIVATE_GET_FUNC(atomic, ATOMIC_WRITE);</div><div class='del'>-PAGE_PRIVATE_GET_FUNC(dummy, DUMMY_WRITE);</div><div class='del'>-</div><div class='del'>-PAGE_PRIVATE_SET_FUNC(reference, REF_RESOURCE);</div><div class='del'>-PAGE_PRIVATE_SET_FUNC(inline, INLINE_INODE);</div><div class='del'>-PAGE_PRIVATE_SET_FUNC(gcing, ONGOING_MIGRATION);</div><div class='del'>-PAGE_PRIVATE_SET_FUNC(atomic, ATOMIC_WRITE);</div><div class='del'>-PAGE_PRIVATE_SET_FUNC(dummy, DUMMY_WRITE);</div><div class='del'>-</div><div class='del'>-PAGE_PRIVATE_CLEAR_FUNC(reference, REF_RESOURCE);</div><div class='del'>-PAGE_PRIVATE_CLEAR_FUNC(inline, INLINE_INODE);</div><div class='del'>-PAGE_PRIVATE_CLEAR_FUNC(gcing, ONGOING_MIGRATION);</div><div class='del'>-PAGE_PRIVATE_CLEAR_FUNC(atomic, ATOMIC_WRITE);</div><div class='del'>-PAGE_PRIVATE_CLEAR_FUNC(dummy, DUMMY_WRITE);</div><div class='del'>-</div><div class='del'>-static inline unsigned long get_page_private_data(struct page *page)</div><div class='del'>-{</div><div class='del'>-	unsigned long data = page_private(page);</div><div class='del'>-</div><div class='del'>-	if (!test_bit(PAGE_PRIVATE_NOT_POINTER, &amp;data))</div><div class='del'>-		return 0;</div><div class='del'>-	return data &gt;&gt; PAGE_PRIVATE_MAX;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void set_page_private_data(struct page *page, unsigned long data)</div><div class='del'>-{</div><div class='del'>-	if (!PagePrivate(page)) {</div><div class='del'>-		get_page(page);</div><div class='del'>-		SetPagePrivate(page);</div><div class='del'>-		set_page_private(page, 0);</div><div class='del'>-	}</div><div class='del'>-	set_bit(PAGE_PRIVATE_NOT_POINTER, &amp;page_private(page));</div><div class='del'>-	page_private(page) |= data &lt;&lt; PAGE_PRIVATE_MAX;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void clear_page_private_data(struct page *page)</div><div class='del'>-{</div><div class='del'>-	page_private(page) &amp;= (1 &lt;&lt; PAGE_PRIVATE_MAX) - 1;</div><div class='del'>-	if (page_private(page) == 1 &lt;&lt; PAGE_PRIVATE_NOT_POINTER) {</div><div class='del'>-		set_page_private(page, 0);</div><div class='del'>-		if (PagePrivate(page)) {</div><div class='del'>-			ClearPagePrivate(page);</div><div class='del'>-			put_page(page);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /* For compression */</div><div class='ctx'> enum compress_algorithm_type {</div><div class='ctx'> 	COMPRESS_LZO,</div><div class='hunk'>@@ -1465,7 +1573,7 @@ enum compress_flag {</div><div class='ctx'> #define COMPRESS_DATA_RESERVED_SIZE		4</div><div class='ctx'> struct compress_data {</div><div class='ctx'> 	__le32 clen;			/* compressed data size */</div><div class='del'>-	__le32 chksum;			/* compressed data chksum */</div><div class='add'>+	__le32 chksum;			/* compressed data checksum */</div><div class='ctx'> 	__le32 reserved[COMPRESS_DATA_RESERVED_SIZE];	/* reserved */</div><div class='ctx'> 	u8 cdata[];			/* compressed data */</div><div class='ctx'> };</div><div class='hunk'>@@ -1474,6 +1582,8 @@ struct compress_data {</div><div class='ctx'> </div><div class='ctx'> #define F2FS_COMPRESSED_PAGE_MAGIC	0xF5F2C000</div><div class='ctx'> </div><div class='add'>+#define F2FS_ZSTD_DEFAULT_CLEVEL	1</div><div class='add'>+</div><div class='ctx'> #define	COMPRESS_LEVEL_OFFSET	8</div><div class='ctx'> </div><div class='ctx'> /* compress context */</div><div class='hunk'>@@ -1486,6 +1596,7 @@ struct compress_ctx {</div><div class='ctx'> 	unsigned int nr_rpages;		/* total page number in rpages */</div><div class='ctx'> 	struct page **cpages;		/* pages store compressed data in cluster */</div><div class='ctx'> 	unsigned int nr_cpages;		/* total page number in cpages */</div><div class='add'>+	unsigned int valid_nr_cpages;	/* valid page number in cpages */</div><div class='ctx'> 	void *rbuf;			/* virtual mapped address on rpages */</div><div class='ctx'> 	struct compress_data *cbuf;	/* virtual mapped address on cpages */</div><div class='ctx'> 	size_t rlen;			/* valid data length in rbuf */</div><div class='hunk'>@@ -1507,6 +1618,7 @@ struct compress_io_ctx {</div><div class='ctx'> struct decompress_io_ctx {</div><div class='ctx'> 	u32 magic;			/* magic number to indicate page is compressed */</div><div class='ctx'> 	struct inode *inode;		/* inode the context belong to */</div><div class='add'>+	struct f2fs_sb_info *sbi;	/* f2fs_sb_info pointer */</div><div class='ctx'> 	pgoff_t cluster_idx;		/* cluster index number */</div><div class='ctx'> 	unsigned int cluster_size;	/* page count in cluster */</div><div class='ctx'> 	unsigned int log_cluster_size;	/* log of cluster size */</div><div class='hunk'>@@ -1547,9 +1659,11 @@ struct decompress_io_ctx {</div><div class='ctx'> </div><div class='ctx'> 	bool failed;			/* IO error occurred before decompression? */</div><div class='ctx'> 	bool need_verity;		/* need fs-verity verification after decompression? */</div><div class='add'>+	unsigned char compress_algorithm;	/* backup algorithm type */</div><div class='ctx'> 	void *private;			/* payload buffer for specified decompression algorithm */</div><div class='ctx'> 	void *private2;			/* extra payload buffer */</div><div class='ctx'> 	struct work_struct verity_work;	/* work to verify the decompressed pages */</div><div class='add'>+	struct work_struct free_work;	/* work for late free this structure itself */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> #define NULL_CLUSTER			((unsigned int)(~0))</div><div class='hunk'>@@ -1561,14 +1675,17 @@ struct f2fs_sb_info {</div><div class='ctx'> 	struct super_block *sb;			/* pointer to VFS super block */</div><div class='ctx'> 	struct proc_dir_entry *s_proc;		/* proc entry */</div><div class='ctx'> 	struct f2fs_super_block *raw_super;	/* raw super block pointer */</div><div class='del'>-	struct rw_semaphore sb_lock;		/* lock for raw super block */</div><div class='add'>+	struct f2fs_rwsem sb_lock;		/* lock for raw super block */</div><div class='ctx'> 	int valid_super_block;			/* valid super block no */</div><div class='ctx'> 	unsigned long s_flag;				/* flags for sbi */</div><div class='ctx'> 	struct mutex writepages;		/* mutex for writepages() */</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_BLK_DEV_ZONED</div><div class='ctx'> 	unsigned int blocks_per_blkz;		/* F2FS blocks per zone */</div><div class='del'>-	unsigned int log_blocks_per_blkz;	/* log2 F2FS blocks per zone */</div><div class='add'>+	unsigned int unusable_blocks_per_sec;   /* unusable blocks per section */</div><div class='add'>+	unsigned int max_open_zones;		/* max open zone resources of the zoned device */</div><div class='add'>+	/* For adjust the priority writing position of data in zone UFS */</div><div class='add'>+	unsigned int blkzone_alloc_policy;</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> 	/* for node-related operations */</div><div class='hunk'>@@ -1581,22 +1698,25 @@ struct f2fs_sb_info {</div><div class='ctx'> 	/* for bio operations */</div><div class='ctx'> 	struct f2fs_bio_info *write_io[NR_PAGE_TYPE];	/* for write bios */</div><div class='ctx'> 	/* keep migration IO order for LFS mode */</div><div class='del'>-	struct rw_semaphore io_order_lock;</div><div class='del'>-	mempool_t *write_io_dummy;		/* Dummy pages */</div><div class='add'>+	struct f2fs_rwsem io_order_lock;</div><div class='add'>+	pgoff_t page_eio_ofs[NR_PAGE_TYPE];	/* EIO page offset */</div><div class='add'>+	int page_eio_cnt[NR_PAGE_TYPE];		/* EIO count */</div><div class='ctx'> </div><div class='ctx'> 	/* for checkpoint */</div><div class='ctx'> 	struct f2fs_checkpoint *ckpt;		/* raw checkpoint pointer */</div><div class='ctx'> 	int cur_cp_pack;			/* remain current cp pack */</div><div class='ctx'> 	spinlock_t cp_lock;			/* for flag in ckpt */</div><div class='ctx'> 	struct inode *meta_inode;		/* cache meta blocks */</div><div class='del'>-	struct rw_semaphore cp_global_sem;	/* checkpoint procedure lock */</div><div class='del'>-	struct rw_semaphore cp_rwsem;		/* blocking FS operations */</div><div class='del'>-	struct rw_semaphore node_write;		/* locking node writes */</div><div class='del'>-	struct rw_semaphore node_change;	/* locking node change */</div><div class='add'>+	struct f2fs_rwsem cp_global_sem;	/* checkpoint procedure lock */</div><div class='add'>+	struct f2fs_rwsem cp_rwsem;		/* blocking FS operations */</div><div class='add'>+	struct f2fs_rwsem node_write;		/* locking node writes */</div><div class='add'>+	struct f2fs_rwsem node_change;	/* locking node change */</div><div class='ctx'> 	wait_queue_head_t cp_wait;</div><div class='ctx'> 	unsigned long last_time[MAX_TIME];	/* to store time in jiffies */</div><div class='ctx'> 	long interval_time[MAX_TIME];		/* to store thresholds */</div><div class='ctx'> 	struct ckpt_req_control cprc_info;	/* for checkpoint request control */</div><div class='add'>+	struct cp_stats cp_stats;		/* for time stat of checkpoint */</div><div class='add'>+	struct f2fs_rwsem cp_enable_rwsem;	/* block cache/dio write */</div><div class='ctx'> </div><div class='ctx'> 	struct inode_management im[MAX_INO_ENTRY];	/* manage inode cache */</div><div class='ctx'> </div><div class='hunk'>@@ -1614,14 +1734,17 @@ struct f2fs_sb_info {</div><div class='ctx'> 	struct mutex flush_lock;		/* for flush exclusion */</div><div class='ctx'> </div><div class='ctx'> 	/* for extent tree cache */</div><div class='del'>-	struct radix_tree_root extent_tree_root;/* cache extent cache entries */</div><div class='del'>-	struct mutex extent_tree_lock;	/* locking extent radix tree */</div><div class='del'>-	struct list_head extent_list;		/* lru list for shrinker */</div><div class='del'>-	spinlock_t extent_lock;			/* locking extent lru list */</div><div class='del'>-	atomic_t total_ext_tree;		/* extent tree count */</div><div class='del'>-	struct list_head zombie_list;		/* extent zombie tree list */</div><div class='del'>-	atomic_t total_zombie_tree;		/* extent zombie tree count */</div><div class='del'>-	atomic_t total_ext_node;		/* extent info count */</div><div class='add'>+	struct extent_tree_info extent_tree[NR_EXTENT_CACHES];</div><div class='add'>+	atomic64_t allocated_data_blocks;	/* for block age extent_cache */</div><div class='add'>+	unsigned int max_read_extent_count;	/* max read extent count per inode */</div><div class='add'>+</div><div class='add'>+	/* The threshold used for hot and warm data seperation*/</div><div class='add'>+	unsigned int hot_data_age_threshold;</div><div class='add'>+	unsigned int warm_data_age_threshold;</div><div class='add'>+	unsigned int last_age_weight;</div><div class='add'>+</div><div class='add'>+	/* control donate caches */</div><div class='add'>+	unsigned int donate_files;</div><div class='ctx'> </div><div class='ctx'> 	/* basic filesystem units */</div><div class='ctx'> 	unsigned int log_sectors_per_block;	/* log2 sectors per block */</div><div class='hunk'>@@ -1638,7 +1761,7 @@ struct f2fs_sb_info {</div><div class='ctx'> 	unsigned int total_node_count;		/* total node block count */</div><div class='ctx'> 	unsigned int total_valid_node_count;	/* valid node block count */</div><div class='ctx'> 	int dir_level;				/* directory level */</div><div class='del'>-	int readdir_ra;				/* readahead inode in readdir */</div><div class='add'>+	bool readdir_ra;			/* readahead inode in readdir */</div><div class='ctx'> 	u64 max_io_bytes;			/* max io bytes to merge IOs */</div><div class='ctx'> </div><div class='ctx'> 	block_t user_block_count;		/* # of user blocks */</div><div class='hunk'>@@ -1652,12 +1775,15 @@ struct f2fs_sb_info {</div><div class='ctx'> 	block_t unusable_block_count;		/* # of blocks saved by last cp */</div><div class='ctx'> </div><div class='ctx'> 	unsigned int nquota_files;		/* # of quota sysfile */</div><div class='del'>-	struct rw_semaphore quota_sem;		/* blocking cp for flags */</div><div class='add'>+	struct f2fs_rwsem quota_sem;		/* blocking cp for flags */</div><div class='add'>+	struct task_struct *umount_lock_holder;	/* s_umount lock holder */</div><div class='ctx'> </div><div class='ctx'> 	/* # of pages, see count_type */</div><div class='ctx'> 	atomic_t nr_pages[NR_COUNT_TYPE];</div><div class='ctx'> 	/* # of allocated blocks */</div><div class='ctx'> 	struct percpu_counter alloc_valid_block_count;</div><div class='add'>+	/* # of node block writes as roll forward recovery */</div><div class='add'>+	struct percpu_counter rf_node_block_count;</div><div class='ctx'> </div><div class='ctx'> 	/* writeback control */</div><div class='ctx'> 	atomic_t wb_sync_req[META];	/* count # of WB_SYNC threads */</div><div class='hunk'>@@ -1668,7 +1794,7 @@ struct f2fs_sb_info {</div><div class='ctx'> 	struct f2fs_mount_info mount_opt;	/* mount options */</div><div class='ctx'> </div><div class='ctx'> 	/* for cleaning operations */</div><div class='del'>-	struct rw_semaphore gc_lock;		/*</div><div class='add'>+	struct f2fs_rwsem gc_lock;		/*</div><div class='ctx'> 						 * semaphore for GC, avoid</div><div class='ctx'> 						 * race between GC and GC or CP</div><div class='ctx'> 						 */</div><div class='hunk'>@@ -1677,20 +1803,26 @@ struct f2fs_sb_info {</div><div class='ctx'> 	unsigned int cur_victim_sec;		/* current victim section num */</div><div class='ctx'> 	unsigned int gc_mode;			/* current GC state */</div><div class='ctx'> 	unsigned int next_victim_seg[2];	/* next segment in victim section */</div><div class='add'>+	spinlock_t gc_remaining_trials_lock;</div><div class='add'>+	/* remaining trial count for GC_URGENT_* and GC_IDLE_* */</div><div class='add'>+	unsigned int gc_remaining_trials;</div><div class='ctx'> </div><div class='ctx'> 	/* for skip statistic */</div><div class='del'>-	unsigned int atomic_files;		/* # of opened atomic file */</div><div class='del'>-	unsigned long long skipped_atomic_files[2];	/* FG_GC and BG_GC */</div><div class='ctx'> 	unsigned long long skipped_gc_rwsem;		/* FG_GC only */</div><div class='ctx'> </div><div class='add'>+	/* free sections reserved for pinned file */</div><div class='add'>+	unsigned int reserved_pin_section;</div><div class='add'>+</div><div class='ctx'> 	/* threshold for gc trials on pinned files */</div><div class='del'>-	u64 gc_pin_file_threshold;</div><div class='del'>-	struct rw_semaphore pin_sem;</div><div class='add'>+	unsigned short gc_pin_file_threshold;</div><div class='add'>+	struct f2fs_rwsem pin_sem;</div><div class='ctx'> </div><div class='ctx'> 	/* maximum # of trials to find a victim segment for SSR and GC */</div><div class='ctx'> 	unsigned int max_victim_search;</div><div class='ctx'> 	/* migration granularity of garbage collection, unit: segment */</div><div class='ctx'> 	unsigned int migration_granularity;</div><div class='add'>+	/* migration window granularity of garbage collection, unit: segment */</div><div class='add'>+	unsigned int migration_window_granularity;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * for stat information.</div><div class='hunk'>@@ -1702,21 +1834,26 @@ struct f2fs_sb_info {</div><div class='ctx'> 	unsigned int segment_count[2];		/* # of allocated segments */</div><div class='ctx'> 	unsigned int block_count[2];		/* # of allocated blocks */</div><div class='ctx'> 	atomic_t inplace_count;		/* # of inplace update */</div><div class='del'>-	atomic64_t total_hit_ext;		/* # of lookup extent cache */</div><div class='del'>-	atomic64_t read_hit_rbtree;		/* # of hit rbtree extent node */</div><div class='del'>-	atomic64_t read_hit_largest;		/* # of hit largest extent node */</div><div class='del'>-	atomic64_t read_hit_cached;		/* # of hit cached extent node */</div><div class='add'>+	/* # of lookup extent cache */</div><div class='add'>+	atomic64_t total_hit_ext[NR_EXTENT_CACHES];</div><div class='add'>+	/* # of hit rbtree extent node */</div><div class='add'>+	atomic64_t read_hit_rbtree[NR_EXTENT_CACHES];</div><div class='add'>+	/* # of hit cached extent node */</div><div class='add'>+	atomic64_t read_hit_cached[NR_EXTENT_CACHES];</div><div class='add'>+	/* # of hit largest extent node in read extent cache */</div><div class='add'>+	atomic64_t read_hit_largest;</div><div class='ctx'> 	atomic_t inline_xattr;			/* # of inline_xattr inodes */</div><div class='ctx'> 	atomic_t inline_inode;			/* # of inline_data inodes */</div><div class='ctx'> 	atomic_t inline_dir;			/* # of inline_dentry inodes */</div><div class='ctx'> 	atomic_t compr_inode;			/* # of compressed inodes */</div><div class='ctx'> 	atomic64_t compr_blocks;		/* # of compressed blocks */</div><div class='del'>-	atomic_t vw_cnt;			/* # of volatile writes */</div><div class='add'>+	atomic_t swapfile_inode;		/* # of swapfile inodes */</div><div class='add'>+	atomic_t atomic_files;			/* # of opened atomic file */</div><div class='ctx'> 	atomic_t max_aw_cnt;			/* max # of atomic writes */</div><div class='del'>-	atomic_t max_vw_cnt;			/* max # of volatile writes */</div><div class='ctx'> 	unsigned int io_skip_bggc;		/* skip background gc for in-flight IO */</div><div class='ctx'> 	unsigned int other_skip_bggc;		/* skip background gc for other reasons */</div><div class='ctx'> 	unsigned int ndirty_inode[NR_INODE_TYPE];	/* # of dirty inodes */</div><div class='add'>+	atomic_t cp_call_count[MAX_CALL_TYPE];	/* # of cp call */</div><div class='ctx'> #endif</div><div class='ctx'> 	spinlock_t stat_lock;			/* lock for stat operations */</div><div class='ctx'> </div><div class='hunk'>@@ -1724,7 +1861,7 @@ struct f2fs_sb_info {</div><div class='ctx'> 	unsigned int data_io_flag;</div><div class='ctx'> 	unsigned int node_io_flag;</div><div class='ctx'> </div><div class='del'>-	/* For sysfs suppport */</div><div class='add'>+	/* For sysfs support */</div><div class='ctx'> 	struct kobject s_kobj;			/* /sys/fs/f2fs/&lt;devname&gt; */</div><div class='ctx'> 	struct completion s_kobj_unregister;</div><div class='ctx'> </div><div class='hunk'>@@ -1745,21 +1882,29 @@ struct f2fs_sb_info {</div><div class='ctx'> 	unsigned int dirty_device;		/* for checkpoint data flush */</div><div class='ctx'> 	spinlock_t dev_lock;			/* protect dirty_device */</div><div class='ctx'> 	bool aligned_blksize;			/* all devices has the same logical blksize */</div><div class='add'>+	unsigned int first_seq_zone_segno;	/* first segno in sequential zone */</div><div class='add'>+	unsigned int bggc_io_aware;		/* For adjust the BG_GC priority when pending IO */</div><div class='add'>+	unsigned int allocate_section_hint;	/* the boundary position between devices */</div><div class='add'>+	unsigned int allocate_section_policy;	/* determine the section writing priority */</div><div class='ctx'> </div><div class='ctx'> 	/* For write statistics */</div><div class='ctx'> 	u64 sectors_written_start;</div><div class='ctx'> 	u64 kbytes_written;</div><div class='ctx'> </div><div class='del'>-	/* Reference to checksum algorithm driver via cryptoapi */</div><div class='del'>-	struct crypto_shash *s_chksum_driver;</div><div class='del'>-</div><div class='ctx'> 	/* Precomputed FS UUID checksum for seeding other checksums */</div><div class='ctx'> 	__u32 s_chksum_seed;</div><div class='ctx'> </div><div class='ctx'> 	struct workqueue_struct *post_read_wq;	/* post read workqueue */</div><div class='ctx'> </div><div class='del'>-	struct kmem_cache *inline_xattr_slab;	/* inline xattr entry */</div><div class='del'>-	unsigned int inline_xattr_slab_size;	/* default inline xattr slab size */</div><div class='add'>+	/*</div><div class='add'>+	 * If we are in irq context, let's update error information into</div><div class='add'>+	 * on-disk superblock in the work.</div><div class='add'>+	 */</div><div class='add'>+	struct work_struct s_error_work;</div><div class='add'>+	unsigned char errors[MAX_F2FS_ERRORS];		/* error flags */</div><div class='add'>+	unsigned char stop_reason[MAX_STOP_REASON];	/* stop reason */</div><div class='add'>+	spinlock_t error_lock;			/* protect errors/stop_reason array */</div><div class='add'>+	bool error_dirty;			/* errors of sb is dirty */</div><div class='ctx'> </div><div class='ctx'> 	/* For reclaimed segs statistics per each GC mode */</div><div class='ctx'> 	unsigned int gc_segment_mode;		/* GC state for reclaimed segments */</div><div class='hunk'>@@ -1770,6 +1915,15 @@ struct f2fs_sb_info {</div><div class='ctx'> 	int max_fragment_chunk;			/* max chunk size for block fragmentation mode */</div><div class='ctx'> 	int max_fragment_hole;			/* max hole size for block fragmentation mode */</div><div class='ctx'> </div><div class='add'>+	/* For atomic write statistics */</div><div class='add'>+	atomic64_t current_atomic_write;</div><div class='add'>+	s64 peak_atomic_write;</div><div class='add'>+	u64 committed_atomic_block;</div><div class='add'>+	u64 revoked_atomic_block;</div><div class='add'>+</div><div class='add'>+	/* carve out reserved_blocks from total blocks */</div><div class='add'>+	bool carve_out;</div><div class='add'>+</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='ctx'> 	struct kmem_cache *page_array_slab;	/* page array entry */</div><div class='ctx'> 	unsigned int page_array_slab_size;	/* default page array slab size */</div><div class='hunk'>@@ -1789,8 +1943,9 @@ struct f2fs_sb_info {</div><div class='ctx'> #ifdef CONFIG_F2FS_IOSTAT</div><div class='ctx'> 	/* For app/fs IO statistics */</div><div class='ctx'> 	spinlock_t iostat_lock;</div><div class='del'>-	unsigned long long rw_iostat[NR_IO_TYPE];</div><div class='del'>-	unsigned long long prev_rw_iostat[NR_IO_TYPE];</div><div class='add'>+	unsigned long long iostat_count[NR_IO_TYPE];</div><div class='add'>+	unsigned long long iostat_bytes[NR_IO_TYPE];</div><div class='add'>+	unsigned long long prev_iostat_bytes[NR_IO_TYPE];</div><div class='ctx'> 	bool iostat_enable;</div><div class='ctx'> 	unsigned long iostat_next_period;</div><div class='ctx'> 	unsigned int iostat_period_ms;</div><div class='hunk'>@@ -1801,20 +1956,42 @@ struct f2fs_sb_info {</div><div class='ctx'> #endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-struct f2fs_private_dio {</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	void *orig_private;</div><div class='del'>-	bio_end_io_t *orig_end_io;</div><div class='del'>-	bool write;</div><div class='del'>-};</div><div class='add'>+/* Definitions to access f2fs_sb_info */</div><div class='add'>+#define SEGS_TO_BLKS(sbi, segs)					\</div><div class='add'>+		((segs) &lt;&lt; (sbi)-&gt;log_blocks_per_seg)</div><div class='add'>+#define BLKS_TO_SEGS(sbi, blks)					\</div><div class='add'>+		((blks) &gt;&gt; (sbi)-&gt;log_blocks_per_seg)</div><div class='add'>+</div><div class='add'>+#define BLKS_PER_SEG(sbi)	((sbi)-&gt;blocks_per_seg)</div><div class='add'>+#define BLKS_PER_SEC(sbi)	(SEGS_TO_BLKS(sbi, (sbi)-&gt;segs_per_sec))</div><div class='add'>+#define SEGS_PER_SEC(sbi)	((sbi)-&gt;segs_per_sec)</div><div class='add'>+</div><div class='add'>+__printf(3, 4)</div><div class='add'>+void f2fs_printk(struct f2fs_sb_info *sbi, bool limit_rate, const char *fmt, ...);</div><div class='add'>+</div><div class='add'>+#define f2fs_err(sbi, fmt, ...)						\</div><div class='add'>+	f2fs_printk(sbi, false, KERN_ERR fmt, ##__VA_ARGS__)</div><div class='add'>+#define f2fs_warn(sbi, fmt, ...)					\</div><div class='add'>+	f2fs_printk(sbi, false, KERN_WARNING fmt, ##__VA_ARGS__)</div><div class='add'>+#define f2fs_notice(sbi, fmt, ...)					\</div><div class='add'>+	f2fs_printk(sbi, false, KERN_NOTICE fmt, ##__VA_ARGS__)</div><div class='add'>+#define f2fs_info(sbi, fmt, ...)					\</div><div class='add'>+	f2fs_printk(sbi, false, KERN_INFO fmt, ##__VA_ARGS__)</div><div class='add'>+#define f2fs_debug(sbi, fmt, ...)					\</div><div class='add'>+	f2fs_printk(sbi, false, KERN_DEBUG fmt, ##__VA_ARGS__)</div><div class='add'>+</div><div class='add'>+#define f2fs_err_ratelimited(sbi, fmt, ...)				\</div><div class='add'>+	f2fs_printk(sbi, true, KERN_ERR fmt, ##__VA_ARGS__)</div><div class='add'>+#define f2fs_warn_ratelimited(sbi, fmt, ...)				\</div><div class='add'>+	f2fs_printk(sbi, true, KERN_WARNING fmt, ##__VA_ARGS__)</div><div class='add'>+#define f2fs_info_ratelimited(sbi, fmt, ...)				\</div><div class='add'>+	f2fs_printk(sbi, true, KERN_INFO fmt, ##__VA_ARGS__)</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_F2FS_FAULT_INJECTION</div><div class='del'>-#define f2fs_show_injection_info(sbi, type)					\</div><div class='del'>-	printk_ratelimited("%sF2FS-fs (%s) : inject %s in %s of %pS\n",	\</div><div class='del'>-		KERN_INFO, sbi-&gt;sb-&gt;s_id,				\</div><div class='del'>-		f2fs_fault_name[type],					\</div><div class='del'>-		__func__, __builtin_return_address(0))</div><div class='del'>-static inline bool time_to_inject(struct f2fs_sb_info *sbi, int type)</div><div class='add'>+#define time_to_inject(sbi, type) __time_to_inject(sbi, type, __func__,	\</div><div class='add'>+									__builtin_return_address(0))</div><div class='add'>+static inline bool __time_to_inject(struct f2fs_sb_info *sbi, int type,</div><div class='add'>+				const char *func, const char *parent_func)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_fault_info *ffi = &amp;F2FS_OPTION(sbi).fault_info;</div><div class='ctx'> </div><div class='hunk'>@@ -1827,12 +2004,14 @@ static inline bool time_to_inject(struct f2fs_sb_info *sbi, int type)</div><div class='ctx'> 	atomic_inc(&amp;ffi-&gt;inject_ops);</div><div class='ctx'> 	if (atomic_read(&amp;ffi-&gt;inject_ops) &gt;= ffi-&gt;inject_rate) {</div><div class='ctx'> 		atomic_set(&amp;ffi-&gt;inject_ops, 0);</div><div class='add'>+		ffi-&gt;inject_count[type]++;</div><div class='add'>+		f2fs_info_ratelimited(sbi, "inject %s in %s of %pS",</div><div class='add'>+				f2fs_fault_name[type], func, parent_func);</div><div class='ctx'> 		return true;</div><div class='ctx'> 	}</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> #else</div><div class='del'>-#define f2fs_show_injection_info(sbi, type) do { } while (0)</div><div class='ctx'> static inline bool time_to_inject(struct f2fs_sb_info *sbi, int type)</div><div class='ctx'> {</div><div class='ctx'> 	return false;</div><div class='hunk'>@@ -1887,42 +2066,20 @@ static inline unsigned int f2fs_time_to_wait(struct f2fs_sb_info *sbi,</div><div class='ctx'> /*</div><div class='ctx'>  * Inline functions</div><div class='ctx'>  */</div><div class='del'>-static inline u32 __f2fs_crc32(struct f2fs_sb_info *sbi, u32 crc,</div><div class='del'>-			      const void *address, unsigned int length)</div><div class='add'>+static inline u32 __f2fs_crc32(u32 crc, const void *address,</div><div class='add'>+			       unsigned int length)</div><div class='ctx'> {</div><div class='del'>-	struct {</div><div class='del'>-		struct shash_desc shash;</div><div class='del'>-		char ctx[4];</div><div class='del'>-	} desc;</div><div class='del'>-	int err;</div><div class='del'>-</div><div class='del'>-	BUG_ON(crypto_shash_descsize(sbi-&gt;s_chksum_driver) != sizeof(desc.ctx));</div><div class='del'>-</div><div class='del'>-	desc.shash.tfm = sbi-&gt;s_chksum_driver;</div><div class='del'>-	*(u32 *)desc.ctx = crc;</div><div class='del'>-</div><div class='del'>-	err = crypto_shash_update(&amp;desc.shash, address, length);</div><div class='del'>-	BUG_ON(err);</div><div class='del'>-</div><div class='del'>-	return *(u32 *)desc.ctx;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline u32 f2fs_crc32(struct f2fs_sb_info *sbi, const void *address,</div><div class='del'>-			   unsigned int length)</div><div class='del'>-{</div><div class='del'>-	return __f2fs_crc32(sbi, F2FS_SUPER_MAGIC, address, length);</div><div class='add'>+	return crc32(crc, address, length);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline bool f2fs_crc_valid(struct f2fs_sb_info *sbi, __u32 blk_crc,</div><div class='del'>-				  void *buf, size_t buf_size)</div><div class='add'>+static inline u32 f2fs_crc32(const void *address, unsigned int length)</div><div class='ctx'> {</div><div class='del'>-	return f2fs_crc32(sbi, buf, buf_size) == blk_crc;</div><div class='add'>+	return __f2fs_crc32(F2FS_SUPER_MAGIC, address, length);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 f2fs_chksum(struct f2fs_sb_info *sbi, u32 crc,</div><div class='del'>-			      const void *address, unsigned int length)</div><div class='add'>+static inline u32 f2fs_chksum(u32 crc, const void *address, unsigned int length)</div><div class='ctx'> {</div><div class='del'>-	return __f2fs_crc32(sbi, crc, address, length);</div><div class='add'>+	return __f2fs_crc32(crc, address, length);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline struct f2fs_inode_info *F2FS_I(struct inode *inode)</div><div class='hunk'>@@ -1945,9 +2102,9 @@ static inline struct f2fs_sb_info *F2FS_M_SB(struct address_space *mapping)</div><div class='ctx'> 	return F2FS_I_SB(mapping-&gt;host);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline struct f2fs_sb_info *F2FS_P_SB(struct page *page)</div><div class='add'>+static inline struct f2fs_sb_info *F2FS_F_SB(const struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	return F2FS_M_SB(page_file_mapping(page));</div><div class='add'>+	return F2FS_M_SB(folio-&gt;mapping);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline struct f2fs_super_block *F2FS_RAW_SUPER(struct f2fs_sb_info *sbi)</div><div class='hunk'>@@ -1955,19 +2112,29 @@ static inline struct f2fs_super_block *F2FS_RAW_SUPER(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	return (struct f2fs_super_block *)(sbi-&gt;raw_super);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline struct f2fs_super_block *F2FS_SUPER_BLOCK(struct folio *folio,</div><div class='add'>+								pgoff_t index)</div><div class='add'>+{</div><div class='add'>+	pgoff_t idx_in_folio = index % folio_nr_pages(folio);</div><div class='add'>+</div><div class='add'>+	return (struct f2fs_super_block *)</div><div class='add'>+		(page_address(folio_page(folio, idx_in_folio)) +</div><div class='add'>+						F2FS_SUPER_OFFSET);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline struct f2fs_checkpoint *F2FS_CKPT(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	return (struct f2fs_checkpoint *)(sbi-&gt;ckpt);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline struct f2fs_node *F2FS_NODE(struct page *page)</div><div class='add'>+static inline struct f2fs_node *F2FS_NODE(const struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	return (struct f2fs_node *)page_address(page);</div><div class='add'>+	return (struct f2fs_node *)folio_address(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline struct f2fs_inode *F2FS_INODE(struct page *page)</div><div class='add'>+static inline struct f2fs_inode *F2FS_INODE(const struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	return &amp;((struct f2fs_node *)page_address(page))-&gt;i;</div><div class='add'>+	return &amp;((struct f2fs_node *)folio_address(folio))-&gt;i;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline struct f2fs_nm_info *NM_I(struct f2fs_sb_info *sbi)</div><div class='hunk'>@@ -2005,6 +2172,16 @@ static inline struct address_space *NODE_MAPPING(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	return sbi-&gt;node_inode-&gt;i_mapping;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline bool is_meta_folio(struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	return folio-&gt;mapping == META_MAPPING(F2FS_F_SB(folio));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool is_node_folio(struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	return folio-&gt;mapping == NODE_MAPPING(F2FS_F_SB(folio));</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline bool is_sbi_flag_set(struct f2fs_sb_info *sbi, unsigned int type)</div><div class='ctx'> {</div><div class='ctx'> 	return test_bit(type, &amp;sbi-&gt;s_flag);</div><div class='hunk'>@@ -2086,29 +2263,139 @@ static inline void clear_ckpt_flags(struct f2fs_sb_info *sbi, unsigned int f)</div><div class='ctx'> 	spin_unlock_irqrestore(&amp;sbi-&gt;cp_lock, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#define init_f2fs_rwsem(sem)					\</div><div class='add'>+do {								\</div><div class='add'>+	static struct lock_class_key __key;			\</div><div class='add'>+								\</div><div class='add'>+	__init_f2fs_rwsem((sem), #sem, &amp;__key);			\</div><div class='add'>+} while (0)</div><div class='add'>+</div><div class='add'>+static inline void __init_f2fs_rwsem(struct f2fs_rwsem *sem,</div><div class='add'>+		const char *sem_name, struct lock_class_key *key)</div><div class='add'>+{</div><div class='add'>+	__init_rwsem(&amp;sem-&gt;internal_rwsem, sem_name, key);</div><div class='add'>+#ifdef CONFIG_F2FS_UNFAIR_RWSEM</div><div class='add'>+	init_waitqueue_head(&amp;sem-&gt;read_waiters);</div><div class='add'>+#endif</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int f2fs_rwsem_is_locked(struct f2fs_rwsem *sem)</div><div class='add'>+{</div><div class='add'>+	return rwsem_is_locked(&amp;sem-&gt;internal_rwsem);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int f2fs_rwsem_is_contended(struct f2fs_rwsem *sem)</div><div class='add'>+{</div><div class='add'>+	return rwsem_is_contended(&amp;sem-&gt;internal_rwsem);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void f2fs_down_read(struct f2fs_rwsem *sem)</div><div class='add'>+{</div><div class='add'>+#ifdef CONFIG_F2FS_UNFAIR_RWSEM</div><div class='add'>+	wait_event(sem-&gt;read_waiters, down_read_trylock(&amp;sem-&gt;internal_rwsem));</div><div class='add'>+#else</div><div class='add'>+	down_read(&amp;sem-&gt;internal_rwsem);</div><div class='add'>+#endif</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int f2fs_down_read_trylock(struct f2fs_rwsem *sem)</div><div class='add'>+{</div><div class='add'>+	return down_read_trylock(&amp;sem-&gt;internal_rwsem);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void f2fs_up_read(struct f2fs_rwsem *sem)</div><div class='add'>+{</div><div class='add'>+	up_read(&amp;sem-&gt;internal_rwsem);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void f2fs_down_write(struct f2fs_rwsem *sem)</div><div class='add'>+{</div><div class='add'>+	down_write(&amp;sem-&gt;internal_rwsem);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_DEBUG_LOCK_ALLOC</div><div class='add'>+static inline void f2fs_down_read_nested(struct f2fs_rwsem *sem, int subclass)</div><div class='add'>+{</div><div class='add'>+	down_read_nested(&amp;sem-&gt;internal_rwsem, subclass);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void f2fs_down_write_nested(struct f2fs_rwsem *sem, int subclass)</div><div class='add'>+{</div><div class='add'>+	down_write_nested(&amp;sem-&gt;internal_rwsem, subclass);</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+#define f2fs_down_read_nested(sem, subclass) f2fs_down_read(sem)</div><div class='add'>+#define f2fs_down_write_nested(sem, subclass) f2fs_down_write(sem)</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+static inline int f2fs_down_write_trylock(struct f2fs_rwsem *sem)</div><div class='add'>+{</div><div class='add'>+	return down_write_trylock(&amp;sem-&gt;internal_rwsem);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void f2fs_up_write(struct f2fs_rwsem *sem)</div><div class='add'>+{</div><div class='add'>+	up_write(&amp;sem-&gt;internal_rwsem);</div><div class='add'>+#ifdef CONFIG_F2FS_UNFAIR_RWSEM</div><div class='add'>+	wake_up_all(&amp;sem-&gt;read_waiters);</div><div class='add'>+#endif</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void disable_nat_bits(struct f2fs_sb_info *sbi, bool lock)</div><div class='add'>+{</div><div class='add'>+	unsigned long flags;</div><div class='add'>+	unsigned char *nat_bits;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * In order to re-enable nat_bits we need to call fsck.f2fs by</div><div class='add'>+	 * set_sbi_flag(sbi, SBI_NEED_FSCK). But it may give huge cost,</div><div class='add'>+	 * so let's rely on regular fsck or unclean shutdown.</div><div class='add'>+	 */</div><div class='add'>+</div><div class='add'>+	if (lock)</div><div class='add'>+		spin_lock_irqsave(&amp;sbi-&gt;cp_lock, flags);</div><div class='add'>+	__clear_ckpt_flags(F2FS_CKPT(sbi), CP_NAT_BITS_FLAG);</div><div class='add'>+	nat_bits = NM_I(sbi)-&gt;nat_bits;</div><div class='add'>+	NM_I(sbi)-&gt;nat_bits = NULL;</div><div class='add'>+	if (lock)</div><div class='add'>+		spin_unlock_irqrestore(&amp;sbi-&gt;cp_lock, flags);</div><div class='add'>+</div><div class='add'>+	kvfree(nat_bits);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool enabled_nat_bits(struct f2fs_sb_info *sbi,</div><div class='add'>+					struct cp_control *cpc)</div><div class='add'>+{</div><div class='add'>+	bool set = is_set_ckpt_flags(sbi, CP_NAT_BITS_FLAG);</div><div class='add'>+</div><div class='add'>+	return (cpc) ? (cpc-&gt;reason &amp; CP_UMOUNT) &amp;&amp; set : set;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline void f2fs_lock_op(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='del'>-	down_read(&amp;sbi-&gt;cp_rwsem);</div><div class='add'>+	f2fs_down_read(&amp;sbi-&gt;cp_rwsem);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int f2fs_trylock_op(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='del'>-	return down_read_trylock(&amp;sbi-&gt;cp_rwsem);</div><div class='add'>+	if (time_to_inject(sbi, FAULT_LOCK_OP))</div><div class='add'>+		return 0;</div><div class='add'>+	return f2fs_down_read_trylock(&amp;sbi-&gt;cp_rwsem);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void f2fs_unlock_op(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='del'>-	up_read(&amp;sbi-&gt;cp_rwsem);</div><div class='add'>+	f2fs_up_read(&amp;sbi-&gt;cp_rwsem);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void f2fs_lock_all(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='del'>-	down_write(&amp;sbi-&gt;cp_rwsem);</div><div class='add'>+	f2fs_down_write(&amp;sbi-&gt;cp_rwsem);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void f2fs_unlock_all(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='del'>-	up_write(&amp;sbi-&gt;cp_rwsem);</div><div class='add'>+	f2fs_up_write(&amp;sbi-&gt;cp_rwsem);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int __get_cp_reason(struct f2fs_sb_info *sbi)</div><div class='hunk'>@@ -2148,13 +2435,11 @@ static inline bool f2fs_has_xattr_block(unsigned int ofs)</div><div class='ctx'> 	return ofs == XATTR_NODE_OFFSET;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline bool __allow_reserved_blocks(struct f2fs_sb_info *sbi,</div><div class='add'>+static inline bool __allow_reserved_root(struct f2fs_sb_info *sbi,</div><div class='ctx'> 					struct inode *inode, bool cap)</div><div class='ctx'> {</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		return true;</div><div class='del'>-	if (!test_opt(sbi, RESERVE_ROOT))</div><div class='del'>-		return false;</div><div class='ctx'> 	if (IS_NOQUOTA(inode))</div><div class='ctx'> 		return true;</div><div class='ctx'> 	if (uid_eq(F2FS_OPTION(sbi).s_resuid, current_fsuid()))</div><div class='hunk'>@@ -2167,11 +2452,32 @@ static inline bool __allow_reserved_blocks(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline unsigned int get_available_block_count(struct f2fs_sb_info *sbi,</div><div class='add'>+						struct inode *inode, bool cap)</div><div class='add'>+{</div><div class='add'>+	block_t avail_user_block_count;</div><div class='add'>+</div><div class='add'>+	avail_user_block_count = sbi-&gt;user_block_count -</div><div class='add'>+					sbi-&gt;current_reserved_blocks;</div><div class='add'>+</div><div class='add'>+	if (test_opt(sbi, RESERVE_ROOT) &amp;&amp; !__allow_reserved_root(sbi, inode, cap))</div><div class='add'>+		avail_user_block_count -= F2FS_OPTION(sbi).root_reserved_blocks;</div><div class='add'>+</div><div class='add'>+	if (unlikely(is_sbi_flag_set(sbi, SBI_CP_DISABLED))) {</div><div class='add'>+		if (avail_user_block_count &gt; sbi-&gt;unusable_block_count)</div><div class='add'>+			avail_user_block_count -= sbi-&gt;unusable_block_count;</div><div class='add'>+		else</div><div class='add'>+			avail_user_block_count = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return avail_user_block_count;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline void f2fs_i_blocks_write(struct inode *, block_t, bool, bool);</div><div class='ctx'> static inline int inc_valid_block_count(struct f2fs_sb_info *sbi,</div><div class='del'>-				 struct inode *inode, blkcnt_t *count)</div><div class='add'>+				 struct inode *inode, blkcnt_t *count, bool partial)</div><div class='ctx'> {</div><div class='del'>-	blkcnt_t diff = 0, release = 0;</div><div class='add'>+	long long diff = 0, release = 0;</div><div class='ctx'> 	block_t avail_user_block_count;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -2180,7 +2486,6 @@ static inline int inc_valid_block_count(struct f2fs_sb_info *sbi,</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='ctx'> 	if (time_to_inject(sbi, FAULT_BLOCK)) {</div><div class='del'>-		f2fs_show_injection_info(sbi, FAULT_BLOCK);</div><div class='ctx'> 		release = *count;</div><div class='ctx'> 		goto release_quota;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2192,30 +2497,27 @@ static inline int inc_valid_block_count(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	percpu_counter_add(&amp;sbi-&gt;alloc_valid_block_count, (*count));</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;sbi-&gt;stat_lock);</div><div class='del'>-	sbi-&gt;total_valid_block_count += (block_t)(*count);</div><div class='del'>-	avail_user_block_count = sbi-&gt;user_block_count -</div><div class='del'>-					sbi-&gt;current_reserved_blocks;</div><div class='ctx'> </div><div class='del'>-	if (!__allow_reserved_blocks(sbi, inode, true))</div><div class='del'>-		avail_user_block_count -= F2FS_OPTION(sbi).root_reserved_blocks;</div><div class='del'>-	if (unlikely(is_sbi_flag_set(sbi, SBI_CP_DISABLED))) {</div><div class='del'>-		if (avail_user_block_count &gt; sbi-&gt;unusable_block_count)</div><div class='del'>-			avail_user_block_count -= sbi-&gt;unusable_block_count;</div><div class='del'>-		else</div><div class='del'>-			avail_user_block_count = 0;</div><div class='del'>-	}</div><div class='del'>-	if (unlikely(sbi-&gt;total_valid_block_count &gt; avail_user_block_count)) {</div><div class='del'>-		diff = sbi-&gt;total_valid_block_count - avail_user_block_count;</div><div class='add'>+	avail_user_block_count = get_available_block_count(sbi, inode, true);</div><div class='add'>+	diff = (long long)sbi-&gt;total_valid_block_count + *count -</div><div class='add'>+						avail_user_block_count;</div><div class='add'>+	if (unlikely(diff &gt; 0)) {</div><div class='add'>+		if (!partial) {</div><div class='add'>+			spin_unlock(&amp;sbi-&gt;stat_lock);</div><div class='add'>+			release = *count;</div><div class='add'>+			goto enospc;</div><div class='add'>+		}</div><div class='ctx'> 		if (diff &gt; *count)</div><div class='ctx'> 			diff = *count;</div><div class='ctx'> 		*count -= diff;</div><div class='ctx'> 		release = diff;</div><div class='del'>-		sbi-&gt;total_valid_block_count -= diff;</div><div class='ctx'> 		if (!*count) {</div><div class='ctx'> 			spin_unlock(&amp;sbi-&gt;stat_lock);</div><div class='ctx'> 			goto enospc;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='add'>+	sbi-&gt;total_valid_block_count += (block_t)(*count);</div><div class='add'>+</div><div class='ctx'> 	spin_unlock(&amp;sbi-&gt;stat_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(release)) {</div><div class='hunk'>@@ -2232,19 +2534,92 @@ release_quota:</div><div class='ctx'> 	return -ENOSPC;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-__printf(2, 3)</div><div class='del'>-void f2fs_printk(struct f2fs_sb_info *sbi, const char *fmt, ...);</div><div class='add'>+#define PAGE_PRIVATE_GET_FUNC(name, flagname) \</div><div class='add'>+static inline bool folio_test_f2fs_##name(const struct folio *folio)	\</div><div class='add'>+{									\</div><div class='add'>+	unsigned long priv = (unsigned long)folio-&gt;private;		\</div><div class='add'>+	unsigned long v = (1UL &lt;&lt; PAGE_PRIVATE_NOT_POINTER) |		\</div><div class='add'>+			     (1UL &lt;&lt; PAGE_PRIVATE_##flagname);		\</div><div class='add'>+	return (priv &amp; v) == v;						\</div><div class='add'>+}									\</div><div class='add'>+static inline bool page_private_##name(struct page *page) \</div><div class='add'>+{ \</div><div class='add'>+	return PagePrivate(page) &amp;&amp; \</div><div class='add'>+		test_bit(PAGE_PRIVATE_NOT_POINTER, &amp;page_private(page)) &amp;&amp; \</div><div class='add'>+		test_bit(PAGE_PRIVATE_##flagname, &amp;page_private(page)); \</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-#define f2fs_err(sbi, fmt, ...)						\</div><div class='del'>-	f2fs_printk(sbi, KERN_ERR fmt, ##__VA_ARGS__)</div><div class='del'>-#define f2fs_warn(sbi, fmt, ...)					\</div><div class='del'>-	f2fs_printk(sbi, KERN_WARNING fmt, ##__VA_ARGS__)</div><div class='del'>-#define f2fs_notice(sbi, fmt, ...)					\</div><div class='del'>-	f2fs_printk(sbi, KERN_NOTICE fmt, ##__VA_ARGS__)</div><div class='del'>-#define f2fs_info(sbi, fmt, ...)					\</div><div class='del'>-	f2fs_printk(sbi, KERN_INFO fmt, ##__VA_ARGS__)</div><div class='del'>-#define f2fs_debug(sbi, fmt, ...)					\</div><div class='del'>-	f2fs_printk(sbi, KERN_DEBUG fmt, ##__VA_ARGS__)</div><div class='add'>+#define PAGE_PRIVATE_SET_FUNC(name, flagname) \</div><div class='add'>+static inline void folio_set_f2fs_##name(struct folio *folio)		\</div><div class='add'>+{									\</div><div class='add'>+	unsigned long v = (1UL &lt;&lt; PAGE_PRIVATE_NOT_POINTER) |		\</div><div class='add'>+			     (1UL &lt;&lt; PAGE_PRIVATE_##flagname);		\</div><div class='add'>+	if (!folio-&gt;private)						\</div><div class='add'>+		folio_attach_private(folio, (void *)v);			\</div><div class='add'>+	else {								\</div><div class='add'>+		v |= (unsigned long)folio-&gt;private;			\</div><div class='add'>+		folio-&gt;private = (void *)v;				\</div><div class='add'>+	}								\</div><div class='add'>+}									\</div><div class='add'>+static inline void set_page_private_##name(struct page *page) \</div><div class='add'>+{ \</div><div class='add'>+	if (!PagePrivate(page)) \</div><div class='add'>+		attach_page_private(page, (void *)0); \</div><div class='add'>+	set_bit(PAGE_PRIVATE_NOT_POINTER, &amp;page_private(page)); \</div><div class='add'>+	set_bit(PAGE_PRIVATE_##flagname, &amp;page_private(page)); \</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define PAGE_PRIVATE_CLEAR_FUNC(name, flagname) \</div><div class='add'>+static inline void folio_clear_f2fs_##name(struct folio *folio)		\</div><div class='add'>+{									\</div><div class='add'>+	unsigned long v = (unsigned long)folio-&gt;private;		\</div><div class='add'>+									\</div><div class='add'>+	v &amp;= ~(1UL &lt;&lt; PAGE_PRIVATE_##flagname);				\</div><div class='add'>+	if (v == (1UL &lt;&lt; PAGE_PRIVATE_NOT_POINTER))			\</div><div class='add'>+		folio_detach_private(folio);				\</div><div class='add'>+	else								\</div><div class='add'>+		folio-&gt;private = (void *)v;				\</div><div class='add'>+}									\</div><div class='add'>+static inline void clear_page_private_##name(struct page *page) \</div><div class='add'>+{ \</div><div class='add'>+	clear_bit(PAGE_PRIVATE_##flagname, &amp;page_private(page)); \</div><div class='add'>+	if (page_private(page) == BIT(PAGE_PRIVATE_NOT_POINTER)) \</div><div class='add'>+		detach_page_private(page); \</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+PAGE_PRIVATE_GET_FUNC(nonpointer, NOT_POINTER);</div><div class='add'>+PAGE_PRIVATE_GET_FUNC(inline, INLINE_INODE);</div><div class='add'>+PAGE_PRIVATE_GET_FUNC(gcing, ONGOING_MIGRATION);</div><div class='add'>+PAGE_PRIVATE_GET_FUNC(atomic, ATOMIC_WRITE);</div><div class='add'>+</div><div class='add'>+PAGE_PRIVATE_SET_FUNC(reference, REF_RESOURCE);</div><div class='add'>+PAGE_PRIVATE_SET_FUNC(inline, INLINE_INODE);</div><div class='add'>+PAGE_PRIVATE_SET_FUNC(gcing, ONGOING_MIGRATION);</div><div class='add'>+PAGE_PRIVATE_SET_FUNC(atomic, ATOMIC_WRITE);</div><div class='add'>+</div><div class='add'>+PAGE_PRIVATE_CLEAR_FUNC(reference, REF_RESOURCE);</div><div class='add'>+PAGE_PRIVATE_CLEAR_FUNC(inline, INLINE_INODE);</div><div class='add'>+PAGE_PRIVATE_CLEAR_FUNC(gcing, ONGOING_MIGRATION);</div><div class='add'>+PAGE_PRIVATE_CLEAR_FUNC(atomic, ATOMIC_WRITE);</div><div class='add'>+</div><div class='add'>+static inline unsigned long folio_get_f2fs_data(struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	unsigned long data = (unsigned long)folio-&gt;private;</div><div class='add'>+</div><div class='add'>+	if (!test_bit(PAGE_PRIVATE_NOT_POINTER, &amp;data))</div><div class='add'>+		return 0;</div><div class='add'>+	return data &gt;&gt; PAGE_PRIVATE_MAX;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void folio_set_f2fs_data(struct folio *folio, unsigned long data)</div><div class='add'>+{</div><div class='add'>+	data = (1UL &lt;&lt; PAGE_PRIVATE_NOT_POINTER) | (data &lt;&lt; PAGE_PRIVATE_MAX);</div><div class='add'>+</div><div class='add'>+	if (!folio_test_private(folio))</div><div class='add'>+		folio_attach_private(folio, (void *)data);</div><div class='add'>+	else</div><div class='add'>+		folio-&gt;private = (void *)((unsigned long)folio-&gt;private | data);</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> static inline void dec_valid_block_count(struct f2fs_sb_info *sbi,</div><div class='ctx'> 						struct inode *inode,</div><div class='hunk'>@@ -2253,8 +2628,14 @@ static inline void dec_valid_block_count(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	blkcnt_t sectors = count &lt;&lt; F2FS_LOG_SECTORS_PER_BLOCK;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;sbi-&gt;stat_lock);</div><div class='del'>-	f2fs_bug_on(sbi, sbi-&gt;total_valid_block_count &lt; (block_t) count);</div><div class='del'>-	sbi-&gt;total_valid_block_count -= (block_t)count;</div><div class='add'>+	if (unlikely(sbi-&gt;total_valid_block_count &lt; count)) {</div><div class='add'>+		f2fs_warn(sbi, "Inconsistent total_valid_block_count:%u, ino:%lu, count:%u",</div><div class='add'>+			  sbi-&gt;total_valid_block_count, inode-&gt;i_ino, count);</div><div class='add'>+		sbi-&gt;total_valid_block_count = 0;</div><div class='add'>+		set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='add'>+	} else {</div><div class='add'>+		sbi-&gt;total_valid_block_count -= count;</div><div class='add'>+	}</div><div class='ctx'> 	if (sbi-&gt;reserved_blocks &amp;&amp;</div><div class='ctx'> 		sbi-&gt;current_reserved_blocks &lt; sbi-&gt;reserved_blocks)</div><div class='ctx'> 		sbi-&gt;current_reserved_blocks = min(sbi-&gt;reserved_blocks,</div><div class='hunk'>@@ -2310,6 +2691,28 @@ static inline void inode_dec_dirty_pages(struct inode *inode)</div><div class='ctx'> 		dec_page_count(F2FS_I_SB(inode), F2FS_DIRTY_QDATA);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline void inc_atomic_write_cnt(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='add'>+	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='add'>+	u64 current_write;</div><div class='add'>+</div><div class='add'>+	fi-&gt;atomic_write_cnt++;</div><div class='add'>+	atomic64_inc(&amp;sbi-&gt;current_atomic_write);</div><div class='add'>+	current_write = atomic64_read(&amp;sbi-&gt;current_atomic_write);</div><div class='add'>+	if (current_write &gt; sbi-&gt;peak_atomic_write)</div><div class='add'>+		sbi-&gt;peak_atomic_write = current_write;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void release_atomic_write_cnt(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='add'>+	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='add'>+</div><div class='add'>+	atomic64_sub(fi-&gt;atomic_write_cnt, &amp;sbi-&gt;current_atomic_write);</div><div class='add'>+	fi-&gt;atomic_write_cnt = 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline s64 get_pages(struct f2fs_sb_info *sbi, int count_type)</div><div class='ctx'> {</div><div class='ctx'> 	return atomic_read(&amp;sbi-&gt;nr_pages[count_type]);</div><div class='hunk'>@@ -2322,11 +2725,8 @@ static inline int get_dirty_pages(struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> static inline int get_blocktype_secs(struct f2fs_sb_info *sbi, int block_type)</div><div class='ctx'> {</div><div class='del'>-	unsigned int pages_per_sec = sbi-&gt;segs_per_sec * sbi-&gt;blocks_per_seg;</div><div class='del'>-	unsigned int segs = (get_pages(sbi, block_type) + pages_per_sec - 1) &gt;&gt;</div><div class='del'>-						sbi-&gt;log_blocks_per_seg;</div><div class='del'>-</div><div class='del'>-	return segs / sbi-&gt;segs_per_sec;</div><div class='add'>+	return div_u64(get_pages(sbi, block_type) + BLKS_PER_SEC(sbi) - 1,</div><div class='add'>+							BLKS_PER_SEC(sbi));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline block_t valid_user_blocks(struct f2fs_sb_info *sbi)</div><div class='hunk'>@@ -2375,7 +2775,7 @@ static inline void *__bitmap_ptr(struct f2fs_sb_info *sbi, int flag)</div><div class='ctx'> </div><div class='ctx'> 	if (__cp_payload(sbi) &gt; 0) {</div><div class='ctx'> 		if (flag == NAT_BITMAP)</div><div class='del'>-			return &amp;ckpt-&gt;sit_nat_version_bitmap;</div><div class='add'>+			return tmp_ptr;</div><div class='ctx'> 		else</div><div class='ctx'> 			return (unsigned char *)ckpt + F2FS_BLKSIZE;</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -2390,7 +2790,7 @@ static inline block_t __start_cp_addr(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	block_t start_addr = le32_to_cpu(F2FS_RAW_SUPER(sbi)-&gt;cp_blkaddr);</div><div class='ctx'> </div><div class='ctx'> 	if (sbi-&gt;cur_cp_pack == 2)</div><div class='del'>-		start_addr += sbi-&gt;blocks_per_seg;</div><div class='add'>+		start_addr += BLKS_PER_SEG(sbi);</div><div class='ctx'> 	return start_addr;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2399,7 +2799,7 @@ static inline block_t __start_cp_next_addr(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	block_t start_addr = le32_to_cpu(F2FS_RAW_SUPER(sbi)-&gt;cp_blkaddr);</div><div class='ctx'> </div><div class='ctx'> 	if (sbi-&gt;cur_cp_pack == 1)</div><div class='del'>-		start_addr += sbi-&gt;blocks_per_seg;</div><div class='add'>+		start_addr += BLKS_PER_SEG(sbi);</div><div class='ctx'> 	return start_addr;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2413,11 +2813,13 @@ static inline block_t __start_sum_addr(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	return le32_to_cpu(F2FS_CKPT(sbi)-&gt;cp_pack_start_sum);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+extern void f2fs_mark_inode_dirty_sync(struct inode *inode, bool sync);</div><div class='ctx'> static inline int inc_valid_node_count(struct f2fs_sb_info *sbi,</div><div class='ctx'> 					struct inode *inode, bool is_inode)</div><div class='ctx'> {</div><div class='ctx'> 	block_t	valid_block_count;</div><div class='del'>-	unsigned int valid_node_count, user_block_count;</div><div class='add'>+	unsigned int valid_node_count, avail_user_node_count;</div><div class='add'>+	unsigned int avail_user_block_count;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (is_inode) {</div><div class='hunk'>@@ -2432,29 +2834,26 @@ static inline int inc_valid_node_count(struct f2fs_sb_info *sbi,</div><div class='ctx'> 			return err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (time_to_inject(sbi, FAULT_BLOCK)) {</div><div class='del'>-		f2fs_show_injection_info(sbi, FAULT_BLOCK);</div><div class='add'>+	if (time_to_inject(sbi, FAULT_BLOCK))</div><div class='ctx'> 		goto enospc;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;sbi-&gt;stat_lock);</div><div class='ctx'> </div><div class='del'>-	valid_block_count = sbi-&gt;total_valid_block_count +</div><div class='del'>-					sbi-&gt;current_reserved_blocks + 1;</div><div class='add'>+	valid_block_count = sbi-&gt;total_valid_block_count + 1;</div><div class='add'>+	avail_user_block_count = get_available_block_count(sbi, inode,</div><div class='add'>+			test_opt(sbi, RESERVE_NODE));</div><div class='ctx'> </div><div class='del'>-	if (!__allow_reserved_blocks(sbi, inode, false))</div><div class='del'>-		valid_block_count += F2FS_OPTION(sbi).root_reserved_blocks;</div><div class='del'>-	user_block_count = sbi-&gt;user_block_count;</div><div class='del'>-	if (unlikely(is_sbi_flag_set(sbi, SBI_CP_DISABLED)))</div><div class='del'>-		user_block_count -= sbi-&gt;unusable_block_count;</div><div class='del'>-</div><div class='del'>-	if (unlikely(valid_block_count &gt; user_block_count)) {</div><div class='add'>+	if (unlikely(valid_block_count &gt; avail_user_block_count)) {</div><div class='ctx'> 		spin_unlock(&amp;sbi-&gt;stat_lock);</div><div class='ctx'> 		goto enospc;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	avail_user_node_count = sbi-&gt;total_node_count - F2FS_RESERVED_NODE_NUM;</div><div class='add'>+	if (test_opt(sbi, RESERVE_NODE) &amp;&amp;</div><div class='add'>+			!__allow_reserved_root(sbi, inode, true))</div><div class='add'>+		avail_user_node_count -= F2FS_OPTION(sbi).root_reserved_nodes;</div><div class='ctx'> 	valid_node_count = sbi-&gt;total_valid_node_count + 1;</div><div class='del'>-	if (unlikely(valid_node_count &gt; sbi-&gt;total_node_count)) {</div><div class='add'>+	if (unlikely(valid_node_count &gt; avail_user_node_count)) {</div><div class='ctx'> 		spin_unlock(&amp;sbi-&gt;stat_lock);</div><div class='ctx'> 		goto enospc;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2488,11 +2887,17 @@ static inline void dec_valid_node_count(struct f2fs_sb_info *sbi,</div><div class='ctx'> {</div><div class='ctx'> 	spin_lock(&amp;sbi-&gt;stat_lock);</div><div class='ctx'> </div><div class='del'>-	f2fs_bug_on(sbi, !sbi-&gt;total_valid_block_count);</div><div class='del'>-	f2fs_bug_on(sbi, !sbi-&gt;total_valid_node_count);</div><div class='add'>+	if (unlikely(!sbi-&gt;total_valid_block_count ||</div><div class='add'>+			!sbi-&gt;total_valid_node_count)) {</div><div class='add'>+		f2fs_warn(sbi, "dec_valid_node_count: inconsistent block counts, total_valid_block:%u, total_valid_node:%u",</div><div class='add'>+			  sbi-&gt;total_valid_block_count,</div><div class='add'>+			  sbi-&gt;total_valid_node_count);</div><div class='add'>+		set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='add'>+	} else {</div><div class='add'>+		sbi-&gt;total_valid_block_count--;</div><div class='add'>+		sbi-&gt;total_valid_node_count--;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	sbi-&gt;total_valid_node_count--;</div><div class='del'>-	sbi-&gt;total_valid_block_count--;</div><div class='ctx'> 	if (sbi-&gt;reserved_blocks &amp;&amp;</div><div class='ctx'> 		sbi-&gt;current_reserved_blocks &lt; sbi-&gt;reserved_blocks)</div><div class='ctx'> 		sbi-&gt;current_reserved_blocks++;</div><div class='hunk'>@@ -2533,74 +2938,75 @@ static inline s64 valid_inode_count(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	return percpu_counter_sum_positive(&amp;sbi-&gt;total_valid_inode_count);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline struct page *f2fs_grab_cache_page(struct address_space *mapping,</div><div class='del'>-						pgoff_t index, bool for_write)</div><div class='add'>+static inline struct folio *f2fs_grab_cache_folio(struct address_space *mapping,</div><div class='add'>+		pgoff_t index, bool for_write)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	unsigned int flags;</div><div class='ctx'> </div><div class='ctx'> 	if (IS_ENABLED(CONFIG_F2FS_FAULT_INJECTION)) {</div><div class='add'>+		fgf_t fgf_flags;</div><div class='add'>+</div><div class='ctx'> 		if (!for_write)</div><div class='del'>-			page = find_get_page_flags(mapping, index,</div><div class='del'>-							FGP_LOCK | FGP_ACCESSED);</div><div class='add'>+			fgf_flags = FGP_LOCK | FGP_ACCESSED;</div><div class='ctx'> 		else</div><div class='del'>-			page = find_lock_page(mapping, index);</div><div class='del'>-		if (page)</div><div class='del'>-			return page;</div><div class='del'>-</div><div class='del'>-		if (time_to_inject(F2FS_M_SB(mapping), FAULT_PAGE_ALLOC)) {</div><div class='del'>-			f2fs_show_injection_info(F2FS_M_SB(mapping),</div><div class='del'>-							FAULT_PAGE_ALLOC);</div><div class='del'>-			return NULL;</div><div class='del'>-		}</div><div class='add'>+			fgf_flags = FGP_LOCK;</div><div class='add'>+		folio = __filemap_get_folio(mapping, index, fgf_flags, 0);</div><div class='add'>+		if (!IS_ERR(folio))</div><div class='add'>+			return folio;</div><div class='add'>+</div><div class='add'>+		if (time_to_inject(F2FS_M_SB(mapping), FAULT_PAGE_ALLOC))</div><div class='add'>+			return ERR_PTR(-ENOMEM);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!for_write)</div><div class='del'>-		return grab_cache_page(mapping, index);</div><div class='del'>-	return grab_cache_page_write_begin(mapping, index, AOP_FLAG_NOFS);</div><div class='add'>+		return filemap_grab_folio(mapping, index);</div><div class='add'>+</div><div class='add'>+	flags = memalloc_nofs_save();</div><div class='add'>+	folio = __filemap_get_folio(mapping, index, FGP_WRITEBEGIN,</div><div class='add'>+			mapping_gfp_mask(mapping));</div><div class='add'>+	memalloc_nofs_restore(flags);</div><div class='add'>+</div><div class='add'>+	return folio;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline struct page *f2fs_pagecache_get_page(</div><div class='add'>+static inline struct folio *f2fs_filemap_get_folio(</div><div class='ctx'> 				struct address_space *mapping, pgoff_t index,</div><div class='del'>-				int fgp_flags, gfp_t gfp_mask)</div><div class='add'>+				fgf_t fgp_flags, gfp_t gfp_mask)</div><div class='ctx'> {</div><div class='del'>-	if (time_to_inject(F2FS_M_SB(mapping), FAULT_PAGE_GET)) {</div><div class='del'>-		f2fs_show_injection_info(F2FS_M_SB(mapping), FAULT_PAGE_GET);</div><div class='del'>-		return NULL;</div><div class='del'>-	}</div><div class='add'>+	if (time_to_inject(F2FS_M_SB(mapping), FAULT_PAGE_GET))</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='del'>-	return pagecache_get_page(mapping, index, fgp_flags, gfp_mask);</div><div class='add'>+	return __filemap_get_folio(mapping, index, fgp_flags, gfp_mask);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void f2fs_copy_page(struct page *src, struct page *dst)</div><div class='add'>+static inline void f2fs_folio_put(struct folio *folio, bool unlock)</div><div class='ctx'> {</div><div class='del'>-	char *src_kaddr = kmap(src);</div><div class='del'>-	char *dst_kaddr = kmap(dst);</div><div class='add'>+	if (IS_ERR_OR_NULL(folio))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	memcpy(dst_kaddr, src_kaddr, PAGE_SIZE);</div><div class='del'>-	kunmap(dst);</div><div class='del'>-	kunmap(src);</div><div class='add'>+	if (unlock) {</div><div class='add'>+		f2fs_bug_on(F2FS_F_SB(folio), !folio_test_locked(folio));</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+	}</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void f2fs_put_page(struct page *page, int unlock)</div><div class='add'>+static inline void f2fs_put_page(struct page *page, bool unlock)</div><div class='ctx'> {</div><div class='ctx'> 	if (!page)</div><div class='ctx'> 		return;</div><div class='del'>-</div><div class='del'>-	if (unlock) {</div><div class='del'>-		f2fs_bug_on(F2FS_P_SB(page), !PageLocked(page));</div><div class='del'>-		unlock_page(page);</div><div class='del'>-	}</div><div class='del'>-	put_page(page);</div><div class='add'>+	f2fs_folio_put(page_folio(page), unlock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void f2fs_put_dnode(struct dnode_of_data *dn)</div><div class='ctx'> {</div><div class='del'>-	if (dn-&gt;node_page)</div><div class='del'>-		f2fs_put_page(dn-&gt;node_page, 1);</div><div class='del'>-	if (dn-&gt;inode_page &amp;&amp; dn-&gt;node_page != dn-&gt;inode_page)</div><div class='del'>-		f2fs_put_page(dn-&gt;inode_page, 0);</div><div class='del'>-	dn-&gt;node_page = NULL;</div><div class='del'>-	dn-&gt;inode_page = NULL;</div><div class='add'>+	if (dn-&gt;node_folio)</div><div class='add'>+		f2fs_folio_put(dn-&gt;node_folio, true);</div><div class='add'>+	if (dn-&gt;inode_folio &amp;&amp; dn-&gt;node_folio != dn-&gt;inode_folio)</div><div class='add'>+		f2fs_folio_put(dn-&gt;inode_folio, false);</div><div class='add'>+	dn-&gt;node_folio = NULL;</div><div class='add'>+	dn-&gt;inode_folio = NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline struct kmem_cache *f2fs_kmem_cache_create(const char *name,</div><div class='hunk'>@@ -2626,10 +3032,8 @@ static inline void *f2fs_kmem_cache_alloc(struct kmem_cache *cachep,</div><div class='ctx'> 	if (nofail)</div><div class='ctx'> 		return f2fs_kmem_cache_alloc_nofail(cachep, flags);</div><div class='ctx'> </div><div class='del'>-	if (time_to_inject(sbi, FAULT_SLAB_ALLOC)) {</div><div class='del'>-		f2fs_show_injection_info(sbi, FAULT_SLAB_ALLOC);</div><div class='add'>+	if (time_to_inject(sbi, FAULT_SLAB_ALLOC))</div><div class='ctx'> 		return NULL;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	return kmem_cache_alloc(cachep, flags);</div><div class='ctx'> }</div><div class='hunk'>@@ -2653,18 +3057,34 @@ static inline bool is_inflight_io(struct f2fs_sb_info *sbi, int type)</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline bool is_inflight_read_io(struct f2fs_sb_info *sbi)</div><div class='add'>+{</div><div class='add'>+	return get_pages(sbi, F2FS_RD_DATA) || get_pages(sbi, F2FS_DIO_READ);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline bool is_idle(struct f2fs_sb_info *sbi, int type)</div><div class='ctx'> {</div><div class='add'>+	bool zoned_gc = (type == GC_TIME &amp;&amp;</div><div class='add'>+			F2FS_HAS_FEATURE(sbi, F2FS_FEATURE_BLKZONED));</div><div class='add'>+</div><div class='ctx'> 	if (sbi-&gt;gc_mode == GC_URGENT_HIGH)</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='del'>-	if (is_inflight_io(sbi, type))</div><div class='add'>+	if (sbi-&gt;bggc_io_aware == AWARE_READ_IO &amp;&amp; is_inflight_read_io(sbi))</div><div class='ctx'> 		return false;</div><div class='add'>+	if (sbi-&gt;bggc_io_aware == AWARE_ALL_IO &amp;&amp; is_inflight_io(sbi, type))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	if (sbi-&gt;gc_mode == GC_URGENT_MID)</div><div class='add'>+		return true;</div><div class='ctx'> </div><div class='ctx'> 	if (sbi-&gt;gc_mode == GC_URGENT_LOW &amp;&amp;</div><div class='ctx'> 			(type == DISCARD_TIME || type == GC_TIME))</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='add'>+	if (zoned_gc)</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='ctx'> 	return f2fs_time_over(sbi, type);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2677,9 +3097,9 @@ static inline void f2fs_radix_tree_insert(struct radix_tree_root *root,</div><div class='ctx'> </div><div class='ctx'> #define RAW_IS_INODE(p)	((p)-&gt;footer.nid == (p)-&gt;footer.ino)</div><div class='ctx'> </div><div class='del'>-static inline bool IS_INODE(struct page *page)</div><div class='add'>+static inline bool IS_INODE(const struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_node *p = F2FS_NODE(page);</div><div class='add'>+	struct f2fs_node *p = F2FS_NODE(folio);</div><div class='ctx'> </div><div class='ctx'> 	return RAW_IS_INODE(p);</div><div class='ctx'> }</div><div class='hunk'>@@ -2696,31 +3116,32 @@ static inline __le32 *blkaddr_in_node(struct f2fs_node *node)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int f2fs_has_extra_attr(struct inode *inode);</div><div class='del'>-static inline block_t data_blkaddr(struct inode *inode,</div><div class='del'>-			struct page *node_page, unsigned int offset)</div><div class='add'>+static inline unsigned int get_dnode_base(struct inode *inode,</div><div class='add'>+					struct folio *node_folio)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_node *raw_node;</div><div class='del'>-	__le32 *addr_array;</div><div class='del'>-	int base = 0;</div><div class='del'>-	bool is_inode = IS_INODE(node_page);</div><div class='add'>+	if (!IS_INODE(node_folio))</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	raw_node = F2FS_NODE(node_page);</div><div class='add'>+	return inode ? get_extra_isize(inode) :</div><div class='add'>+			offset_in_addr(&amp;F2FS_NODE(node_folio)-&gt;i);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if (is_inode) {</div><div class='del'>-		if (!inode)</div><div class='del'>-			/* from GC path only */</div><div class='del'>-			base = offset_in_addr(&amp;raw_node-&gt;i);</div><div class='del'>-		else if (f2fs_has_extra_attr(inode))</div><div class='del'>-			base = get_extra_isize(inode);</div><div class='del'>-	}</div><div class='add'>+static inline __le32 *get_dnode_addr(struct inode *inode,</div><div class='add'>+					struct folio *node_folio)</div><div class='add'>+{</div><div class='add'>+	return blkaddr_in_node(F2FS_NODE(node_folio)) +</div><div class='add'>+			get_dnode_base(inode, node_folio);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	addr_array = blkaddr_in_node(raw_node);</div><div class='del'>-	return le32_to_cpu(addr_array[base + offset]);</div><div class='add'>+static inline block_t data_blkaddr(struct inode *inode,</div><div class='add'>+			struct folio *node_folio, unsigned int offset)</div><div class='add'>+{</div><div class='add'>+	return le32_to_cpu(*(get_dnode_addr(inode, node_folio) + offset));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline block_t f2fs_data_blkaddr(struct dnode_of_data *dn)</div><div class='ctx'> {</div><div class='del'>-	return data_blkaddr(dn-&gt;inode, dn-&gt;node_page, dn-&gt;ofs_in_node);</div><div class='add'>+	return data_blkaddr(dn-&gt;inode, dn-&gt;node_folio, dn-&gt;ofs_in_node);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int f2fs_test_bit(unsigned int nr, char *addr)</div><div class='hunk'>@@ -2728,7 +3149,7 @@ static inline int f2fs_test_bit(unsigned int nr, char *addr)</div><div class='ctx'> 	int mask;</div><div class='ctx'> </div><div class='ctx'> 	addr += (nr &gt;&gt; 3);</div><div class='del'>-	mask = 1 &lt;&lt; (7 - (nr &amp; 0x07));</div><div class='add'>+	mask = BIT(7 - (nr &amp; 0x07));</div><div class='ctx'> 	return mask &amp; *addr;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2737,7 +3158,7 @@ static inline void f2fs_set_bit(unsigned int nr, char *addr)</div><div class='ctx'> 	int mask;</div><div class='ctx'> </div><div class='ctx'> 	addr += (nr &gt;&gt; 3);</div><div class='del'>-	mask = 1 &lt;&lt; (7 - (nr &amp; 0x07));</div><div class='add'>+	mask = BIT(7 - (nr &amp; 0x07));</div><div class='ctx'> 	*addr |= mask;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2746,7 +3167,7 @@ static inline void f2fs_clear_bit(unsigned int nr, char *addr)</div><div class='ctx'> 	int mask;</div><div class='ctx'> </div><div class='ctx'> 	addr += (nr &gt;&gt; 3);</div><div class='del'>-	mask = 1 &lt;&lt; (7 - (nr &amp; 0x07));</div><div class='add'>+	mask = BIT(7 - (nr &amp; 0x07));</div><div class='ctx'> 	*addr &amp;= ~mask;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2756,7 +3177,7 @@ static inline int f2fs_test_and_set_bit(unsigned int nr, char *addr)</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	addr += (nr &gt;&gt; 3);</div><div class='del'>-	mask = 1 &lt;&lt; (7 - (nr &amp; 0x07));</div><div class='add'>+	mask = BIT(7 - (nr &amp; 0x07));</div><div class='ctx'> 	ret = mask &amp; *addr;</div><div class='ctx'> 	*addr |= mask;</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -2768,7 +3189,7 @@ static inline int f2fs_test_and_clear_bit(unsigned int nr, char *addr)</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	addr += (nr &gt;&gt; 3);</div><div class='del'>-	mask = 1 &lt;&lt; (7 - (nr &amp; 0x07));</div><div class='add'>+	mask = BIT(7 - (nr &amp; 0x07));</div><div class='ctx'> 	ret = mask &amp; *addr;</div><div class='ctx'> 	*addr &amp;= ~mask;</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -2779,7 +3200,7 @@ static inline void f2fs_change_bit(unsigned int nr, char *addr)</div><div class='ctx'> 	int mask;</div><div class='ctx'> </div><div class='ctx'> 	addr += (nr &gt;&gt; 3);</div><div class='del'>-	mask = 1 &lt;&lt; (7 - (nr &amp; 0x07));</div><div class='add'>+	mask = BIT(7 - (nr &amp; 0x07));</div><div class='ctx'> 	*addr ^= mask;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2797,11 +3218,14 @@ static inline void f2fs_change_bit(unsigned int nr, char *addr)</div><div class='ctx'> #define F2FS_DIRSYNC_FL			0x00010000 /* dirsync behaviour (directories only) */</div><div class='ctx'> #define F2FS_PROJINHERIT_FL		0x20000000 /* Create with parents projid */</div><div class='ctx'> #define F2FS_CASEFOLD_FL		0x40000000 /* Casefolded file */</div><div class='add'>+#define F2FS_DEVICE_ALIAS_FL		0x80000000 /* File for aliasing a device */</div><div class='add'>+</div><div class='add'>+#define F2FS_QUOTA_DEFAULT_FL		(F2FS_NOATIME_FL | F2FS_IMMUTABLE_FL)</div><div class='ctx'> </div><div class='ctx'> /* Flags that should be inherited by new inodes from their parent. */</div><div class='ctx'> #define F2FS_FL_INHERITED (F2FS_SYNC_FL | F2FS_NODUMP_FL | F2FS_NOATIME_FL | \</div><div class='ctx'> 			   F2FS_DIRSYNC_FL | F2FS_PROJINHERIT_FL | \</div><div class='del'>-			   F2FS_CASEFOLD_FL | F2FS_COMPR_FL | F2FS_NOCOMP_FL)</div><div class='add'>+			   F2FS_CASEFOLD_FL)</div><div class='ctx'> </div><div class='ctx'> /* Flags that are appropriate for regular files (all but dir-specific ones). */</div><div class='ctx'> #define F2FS_REG_FLMASK		(~(F2FS_DIRSYNC_FL | F2FS_PROJINHERIT_FL | \</div><div class='hunk'>@@ -2810,6 +3234,8 @@ static inline void f2fs_change_bit(unsigned int nr, char *addr)</div><div class='ctx'> /* Flags that are appropriate for non-directories/regular files. */</div><div class='ctx'> #define F2FS_OTHER_FLMASK	(F2FS_NODUMP_FL | F2FS_NOATIME_FL)</div><div class='ctx'> </div><div class='add'>+#define IS_DEVICE_ALIASING(inode)	(F2FS_I(inode)-&gt;i_flags &amp; F2FS_DEVICE_ALIAS_FL)</div><div class='add'>+</div><div class='ctx'> static inline __u32 f2fs_mask_flags(umode_t mode, __u32 flags)</div><div class='ctx'> {</div><div class='ctx'> 	if (S_ISDIR(mode))</div><div class='hunk'>@@ -2832,7 +3258,6 @@ static inline void __mark_inode_dirty_flag(struct inode *inode,</div><div class='ctx'> 			return;</div><div class='ctx'> 		fallthrough;</div><div class='ctx'> 	case FI_DATA_EXIST:</div><div class='del'>-	case FI_INLINE_DOTS:</div><div class='ctx'> 	case FI_PIN_FILE:</div><div class='ctx'> 	case FI_COMPRESS_RELEASED:</div><div class='ctx'> 		f2fs_mark_inode_dirty_sync(inode, true);</div><div class='hunk'>@@ -2899,6 +3324,8 @@ static inline void f2fs_i_blocks_write(struct inode *inode,</div><div class='ctx'> 		set_inode_flag(inode, FI_AUTO_RECOVER);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline bool f2fs_is_atomic_file(struct inode *inode);</div><div class='add'>+</div><div class='ctx'> static inline void f2fs_i_size_write(struct inode *inode, loff_t i_size)</div><div class='ctx'> {</div><div class='ctx'> 	bool clean = !is_inode_flag_set(inode, FI_DIRTY_INODE);</div><div class='hunk'>@@ -2908,6 +3335,10 @@ static inline void f2fs_i_size_write(struct inode *inode, loff_t i_size)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	i_size_write(inode, i_size);</div><div class='add'>+</div><div class='add'>+	if (f2fs_is_atomic_file(inode))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='ctx'> 	f2fs_mark_inode_dirty_sync(inode, true);</div><div class='ctx'> 	if (clean || recover)</div><div class='ctx'> 		set_inode_flag(inode, FI_AUTO_RECOVER);</div><div class='hunk'>@@ -2922,7 +3353,7 @@ static inline void f2fs_i_depth_write(struct inode *inode, unsigned int depth)</div><div class='ctx'> static inline void f2fs_i_gc_failures_write(struct inode *inode,</div><div class='ctx'> 					unsigned int count)</div><div class='ctx'> {</div><div class='del'>-	F2FS_I(inode)-&gt;i_gc_failures[GC_FAILURE_PIN] = count;</div><div class='add'>+	F2FS_I(inode)-&gt;i_gc_failures = count;</div><div class='ctx'> 	f2fs_mark_inode_dirty_sync(inode, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2950,8 +3381,6 @@ static inline void get_inline_info(struct inode *inode, struct f2fs_inode *ri)</div><div class='ctx'> 		set_bit(FI_INLINE_DENTRY, fi-&gt;flags);</div><div class='ctx'> 	if (ri-&gt;i_inline &amp; F2FS_DATA_EXIST)</div><div class='ctx'> 		set_bit(FI_DATA_EXIST, fi-&gt;flags);</div><div class='del'>-	if (ri-&gt;i_inline &amp; F2FS_INLINE_DOTS)</div><div class='del'>-		set_bit(FI_INLINE_DOTS, fi-&gt;flags);</div><div class='ctx'> 	if (ri-&gt;i_inline &amp; F2FS_EXTRA_ATTR)</div><div class='ctx'> 		set_bit(FI_EXTRA_ATTR, fi-&gt;flags);</div><div class='ctx'> 	if (ri-&gt;i_inline &amp; F2FS_PIN_FILE)</div><div class='hunk'>@@ -2972,8 +3401,6 @@ static inline void set_raw_inline(struct inode *inode, struct f2fs_inode *ri)</div><div class='ctx'> 		ri-&gt;i_inline |= F2FS_INLINE_DENTRY;</div><div class='ctx'> 	if (is_inode_flag_set(inode, FI_DATA_EXIST))</div><div class='ctx'> 		ri-&gt;i_inline |= F2FS_DATA_EXIST;</div><div class='del'>-	if (is_inode_flag_set(inode, FI_INLINE_DOTS))</div><div class='del'>-		ri-&gt;i_inline |= F2FS_INLINE_DOTS;</div><div class='ctx'> 	if (is_inode_flag_set(inode, FI_EXTRA_ATTR))</div><div class='ctx'> 		ri-&gt;i_inline |= F2FS_EXTRA_ATTR;</div><div class='ctx'> 	if (is_inode_flag_set(inode, FI_PIN_FILE))</div><div class='hunk'>@@ -3014,26 +3441,21 @@ static inline bool f2fs_need_compress_data(struct inode *inode)</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline unsigned int addrs_per_inode(struct inode *inode)</div><div class='add'>+static inline unsigned int addrs_per_page(struct inode *inode,</div><div class='add'>+							bool is_inode)</div><div class='ctx'> {</div><div class='del'>-	unsigned int addrs = CUR_ADDRS_PER_INODE(inode) -</div><div class='del'>-				get_inline_xattr_addrs(inode);</div><div class='add'>+	unsigned int addrs = is_inode ? (CUR_ADDRS_PER_INODE(inode) -</div><div class='add'>+			get_inline_xattr_addrs(inode)) : DEF_ADDRS_PER_BLOCK;</div><div class='ctx'> </div><div class='del'>-	if (!f2fs_compressed_file(inode))</div><div class='del'>-		return addrs;</div><div class='del'>-	return ALIGN_DOWN(addrs, F2FS_I(inode)-&gt;i_cluster_size);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline unsigned int addrs_per_block(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	if (!f2fs_compressed_file(inode))</div><div class='del'>-		return DEF_ADDRS_PER_BLOCK;</div><div class='del'>-	return ALIGN_DOWN(DEF_ADDRS_PER_BLOCK, F2FS_I(inode)-&gt;i_cluster_size);</div><div class='add'>+	if (f2fs_compressed_file(inode))</div><div class='add'>+		return ALIGN_DOWN(addrs, F2FS_I(inode)-&gt;i_cluster_size);</div><div class='add'>+	return addrs;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void *inline_xattr_addr(struct inode *inode, struct page *page)</div><div class='add'>+static inline</div><div class='add'>+void *inline_xattr_addr(struct inode *inode, const struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_inode *ri = F2FS_INODE(page);</div><div class='add'>+	struct f2fs_inode *ri = F2FS_INODE(folio);</div><div class='ctx'> </div><div class='ctx'> 	return (void *)&amp;(ri-&gt;i_addr[DEF_ADDRS_PER_INODE -</div><div class='ctx'> 					get_inline_xattr_addrs(inode)]);</div><div class='hunk'>@@ -3046,6 +3468,10 @@ static inline int inline_xattr_size(struct inode *inode)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Notice: check inline_data flag without inode page lock is unsafe.</div><div class='add'>+ * It could change at any time by f2fs_convert_inline_folio().</div><div class='add'>+ */</div><div class='ctx'> static inline int f2fs_has_inline_data(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	return is_inode_flag_set(inode, FI_INLINE_DATA);</div><div class='hunk'>@@ -3056,11 +3482,6 @@ static inline int f2fs_exist_data(struct inode *inode)</div><div class='ctx'> 	return is_inode_flag_set(inode, FI_DATA_EXIST);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int f2fs_has_inline_dots(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	return is_inode_flag_set(inode, FI_INLINE_DOTS);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static inline int f2fs_is_mmap_file(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	return is_inode_flag_set(inode, FI_MMAP_FILE);</div><div class='hunk'>@@ -3076,32 +3497,16 @@ static inline bool f2fs_is_atomic_file(struct inode *inode)</div><div class='ctx'> 	return is_inode_flag_set(inode, FI_ATOMIC_FILE);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline bool f2fs_is_commit_atomic_write(struct inode *inode)</div><div class='add'>+static inline bool f2fs_is_cow_file(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	return is_inode_flag_set(inode, FI_ATOMIC_COMMIT);</div><div class='add'>+	return is_inode_flag_set(inode, FI_COW_FILE);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline bool f2fs_is_volatile_file(struct inode *inode)</div><div class='add'>+static inline void *inline_data_addr(struct inode *inode, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	return is_inode_flag_set(inode, FI_VOLATILE_FILE);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline bool f2fs_is_first_block_written(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	return is_inode_flag_set(inode, FI_FIRST_BLOCK_WRITTEN);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline bool f2fs_is_drop_cache(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	return is_inode_flag_set(inode, FI_DROP_CACHE);</div><div class='del'>-}</div><div class='add'>+	__le32 *addr = get_dnode_addr(inode, folio);</div><div class='ctx'> </div><div class='del'>-static inline void *inline_data_addr(struct inode *inode, struct page *page)</div><div class='del'>-{</div><div class='del'>-	struct f2fs_inode *ri = F2FS_INODE(page);</div><div class='del'>-	int extra_size = get_extra_isize(inode);</div><div class='del'>-</div><div class='del'>-	return (void *)&amp;(ri-&gt;i_addr[extra_size + DEF_INLINE_RESERVED_SIZE]);</div><div class='add'>+	return (void *)(addr + DEF_INLINE_RESERVED_SIZE);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int f2fs_has_inline_dentry(struct inode *inode)</div><div class='hunk'>@@ -3116,26 +3521,31 @@ static inline int is_file(struct inode *inode, int type)</div><div class='ctx'> </div><div class='ctx'> static inline void set_file(struct inode *inode, int type)</div><div class='ctx'> {</div><div class='add'>+	if (is_file(inode, type))</div><div class='add'>+		return;</div><div class='ctx'> 	F2FS_I(inode)-&gt;i_advise |= type;</div><div class='ctx'> 	f2fs_mark_inode_dirty_sync(inode, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void clear_file(struct inode *inode, int type)</div><div class='ctx'> {</div><div class='add'>+	if (!is_file(inode, type))</div><div class='add'>+		return;</div><div class='ctx'> 	F2FS_I(inode)-&gt;i_advise &amp;= ~type;</div><div class='ctx'> 	f2fs_mark_inode_dirty_sync(inode, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline bool f2fs_is_time_consistent(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	if (!timespec64_equal(F2FS_I(inode)-&gt;i_disk_time, &amp;inode-&gt;i_atime))</div><div class='del'>-		return false;</div><div class='del'>-	if (!timespec64_equal(F2FS_I(inode)-&gt;i_disk_time + 1, &amp;inode-&gt;i_ctime))</div><div class='add'>+	struct timespec64 ts = inode_get_atime(inode);</div><div class='add'>+</div><div class='add'>+	if (!timespec64_equal(F2FS_I(inode)-&gt;i_disk_time, &amp;ts))</div><div class='ctx'> 		return false;</div><div class='del'>-	if (!timespec64_equal(F2FS_I(inode)-&gt;i_disk_time + 2, &amp;inode-&gt;i_mtime))</div><div class='add'>+	ts = inode_get_ctime(inode);</div><div class='add'>+	if (!timespec64_equal(F2FS_I(inode)-&gt;i_disk_time + 1, &amp;ts))</div><div class='ctx'> 		return false;</div><div class='del'>-	if (!timespec64_equal(F2FS_I(inode)-&gt;i_disk_time + 3,</div><div class='del'>-						&amp;F2FS_I(inode)-&gt;i_crtime))</div><div class='add'>+	ts = inode_get_mtime(inode);</div><div class='add'>+	if (!timespec64_equal(F2FS_I(inode)-&gt;i_disk_time + 2, &amp;ts))</div><div class='ctx'> 		return false;</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='hunk'>@@ -3177,26 +3587,26 @@ static inline bool f2fs_cp_error(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	return is_set_ckpt_flags(sbi, CP_ERROR_FLAG);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline bool is_dot_dotdot(const u8 *name, size_t len)</div><div class='add'>+static inline void *f2fs_kmalloc(struct f2fs_sb_info *sbi,</div><div class='add'>+					size_t size, gfp_t flags)</div><div class='ctx'> {</div><div class='del'>-	if (len == 1 &amp;&amp; name[0] == '.')</div><div class='del'>-		return true;</div><div class='del'>-</div><div class='del'>-	if (len == 2 &amp;&amp; name[0] == '.' &amp;&amp; name[1] == '.')</div><div class='del'>-		return true;</div><div class='add'>+	if (time_to_inject(sbi, FAULT_KMALLOC))</div><div class='add'>+		return NULL;</div><div class='ctx'> </div><div class='del'>-	return false;</div><div class='add'>+	return kmalloc(size, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void *f2fs_kmalloc(struct f2fs_sb_info *sbi,</div><div class='del'>-					size_t size, gfp_t flags)</div><div class='add'>+static inline void *f2fs_getname(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='del'>-	if (time_to_inject(sbi, FAULT_KMALLOC)) {</div><div class='del'>-		f2fs_show_injection_info(sbi, FAULT_KMALLOC);</div><div class='add'>+	if (time_to_inject(sbi, FAULT_KMALLOC))</div><div class='ctx'> 		return NULL;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	return kmalloc(size, flags);</div><div class='add'>+	return __getname();</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void f2fs_putname(char *buf)</div><div class='add'>+{</div><div class='add'>+	__putname(buf);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void *f2fs_kzalloc(struct f2fs_sb_info *sbi,</div><div class='hunk'>@@ -3208,10 +3618,8 @@ static inline void *f2fs_kzalloc(struct f2fs_sb_info *sbi,</div><div class='ctx'> static inline void *f2fs_kvmalloc(struct f2fs_sb_info *sbi,</div><div class='ctx'> 					size_t size, gfp_t flags)</div><div class='ctx'> {</div><div class='del'>-	if (time_to_inject(sbi, FAULT_KVMALLOC)) {</div><div class='del'>-		f2fs_show_injection_info(sbi, FAULT_KVMALLOC);</div><div class='add'>+	if (time_to_inject(sbi, FAULT_KVMALLOC))</div><div class='ctx'> 		return NULL;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	return kvmalloc(size, flags);</div><div class='ctx'> }</div><div class='hunk'>@@ -3222,6 +3630,14 @@ static inline void *f2fs_kvzalloc(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	return f2fs_kvmalloc(sbi, size, flags | __GFP_ZERO);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline void *f2fs_vmalloc(struct f2fs_sb_info *sbi, size_t size)</div><div class='add'>+{</div><div class='add'>+	if (time_to_inject(sbi, FAULT_VMALLOC))</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	return vmalloc(size);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline int get_extra_isize(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	return F2FS_I(inode)-&gt;i_extra_isize / sizeof(__le32);</div><div class='hunk'>@@ -3236,6 +3652,8 @@ static inline int get_inline_xattr_addrs(struct inode *inode)</div><div class='ctx'> 	((is_inode_flag_set(i, FI_ACL_MODE)) ? \</div><div class='ctx'> 	 (F2FS_I(i)-&gt;i_acl_mode) : ((i)-&gt;i_mode))</div><div class='ctx'> </div><div class='add'>+#define F2FS_MIN_EXTRA_ATTR_SIZE		(sizeof(__le32))</div><div class='add'>+</div><div class='ctx'> #define F2FS_TOTAL_EXTRA_ATTR_SIZE			\</div><div class='ctx'> 	(offsetof(struct f2fs_inode, i_extra_end) -	\</div><div class='ctx'> 	offsetof(struct f2fs_inode, i_extra_isize))	\</div><div class='hunk'>@@ -3246,7 +3664,7 @@ static inline int get_inline_xattr_addrs(struct inode *inode)</div><div class='ctx'> 		sizeof((f2fs_inode)-&gt;field))			\</div><div class='ctx'> 		&lt;= (F2FS_OLD_ATTRIBUTE_SIZE + (extra_isize)))	\</div><div class='ctx'> </div><div class='del'>-#define __is_large_section(sbi)		((sbi)-&gt;segs_per_sec &gt; 1)</div><div class='add'>+#define __is_large_section(sbi)		(SEGS_PER_SEC(sbi) &gt; 1)</div><div class='ctx'> </div><div class='ctx'> #define __is_meta_io(fio) (PAGE_TYPE_OF_BIO((fio)-&gt;type) == META)</div><div class='ctx'> </div><div class='hunk'>@@ -3255,11 +3673,9 @@ bool f2fs_is_valid_blkaddr(struct f2fs_sb_info *sbi,</div><div class='ctx'> static inline void verify_blkaddr(struct f2fs_sb_info *sbi,</div><div class='ctx'> 					block_t blkaddr, int type)</div><div class='ctx'> {</div><div class='del'>-	if (!f2fs_is_valid_blkaddr(sbi, blkaddr, type)) {</div><div class='add'>+	if (!f2fs_is_valid_blkaddr(sbi, blkaddr, type))</div><div class='ctx'> 		f2fs_err(sbi, "invalid blkaddr: %u, type: %d, run fsck to fix.",</div><div class='ctx'> 			 blkaddr, type);</div><div class='del'>-		f2fs_bug_on(sbi, 1);</div><div class='del'>-	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline bool __is_valid_data_blkaddr(block_t blkaddr)</div><div class='hunk'>@@ -3274,20 +3690,21 @@ static inline bool __is_valid_data_blkaddr(block_t blkaddr)</div><div class='ctx'>  * file.c</div><div class='ctx'>  */</div><div class='ctx'> int f2fs_sync_file(struct file *file, loff_t start, loff_t end, int datasync);</div><div class='del'>-void f2fs_truncate_data_blocks(struct dnode_of_data *dn);</div><div class='ctx'> int f2fs_do_truncate_blocks(struct inode *inode, u64 from, bool lock);</div><div class='ctx'> int f2fs_truncate_blocks(struct inode *inode, u64 from, bool lock);</div><div class='ctx'> int f2fs_truncate(struct inode *inode);</div><div class='del'>-int f2fs_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='add'>+int f2fs_getattr(struct mnt_idmap *idmap, const struct path *path,</div><div class='ctx'> 		 struct kstat *stat, u32 request_mask, unsigned int flags);</div><div class='del'>-int f2fs_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='add'>+int f2fs_setattr(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		 struct iattr *attr);</div><div class='ctx'> int f2fs_truncate_hole(struct inode *inode, pgoff_t pg_start, pgoff_t pg_end);</div><div class='ctx'> void f2fs_truncate_data_blocks_range(struct dnode_of_data *dn, int count);</div><div class='add'>+int f2fs_do_shutdown(struct f2fs_sb_info *sbi, unsigned int flag,</div><div class='add'>+						bool readonly, bool need_lock);</div><div class='ctx'> int f2fs_precache_extents(struct inode *inode);</div><div class='del'>-int f2fs_fileattr_get(struct dentry *dentry, struct fileattr *fa);</div><div class='del'>-int f2fs_fileattr_set(struct user_namespace *mnt_userns,</div><div class='del'>-		      struct dentry *dentry, struct fileattr *fa);</div><div class='add'>+int f2fs_fileattr_get(struct dentry *dentry, struct file_kattr *fa);</div><div class='add'>+int f2fs_fileattr_set(struct mnt_idmap *idmap,</div><div class='add'>+		      struct dentry *dentry, struct file_kattr *fa);</div><div class='ctx'> long f2fs_ioctl(struct file *filp, unsigned int cmd, unsigned long arg);</div><div class='ctx'> long f2fs_compat_ioctl(struct file *file, unsigned int cmd, unsigned long arg);</div><div class='ctx'> int f2fs_transfer_project_quota(struct inode *inode, kprojid_t kprojid);</div><div class='hunk'>@@ -3297,14 +3714,15 @@ int f2fs_pin_file_control(struct inode *inode, bool inc);</div><div class='ctx'>  * inode.c</div><div class='ctx'>  */</div><div class='ctx'> void f2fs_set_inode_flags(struct inode *inode);</div><div class='del'>-bool f2fs_inode_chksum_verify(struct f2fs_sb_info *sbi, struct page *page);</div><div class='del'>-void f2fs_inode_chksum_set(struct f2fs_sb_info *sbi, struct page *page);</div><div class='add'>+bool f2fs_inode_chksum_verify(struct f2fs_sb_info *sbi, struct folio *folio);</div><div class='add'>+void f2fs_inode_chksum_set(struct f2fs_sb_info *sbi, struct folio *folio);</div><div class='ctx'> struct inode *f2fs_iget(struct super_block *sb, unsigned long ino);</div><div class='ctx'> struct inode *f2fs_iget_retry(struct super_block *sb, unsigned long ino);</div><div class='ctx'> int f2fs_try_to_free_nats(struct f2fs_sb_info *sbi, int nr_shrink);</div><div class='del'>-void f2fs_update_inode(struct inode *inode, struct page *node_page);</div><div class='add'>+void f2fs_update_inode(struct inode *inode, struct folio *node_folio);</div><div class='ctx'> void f2fs_update_inode_page(struct inode *inode);</div><div class='ctx'> int f2fs_write_inode(struct inode *inode, struct writeback_control *wbc);</div><div class='add'>+void f2fs_remove_donate_inode(struct inode *inode);</div><div class='ctx'> void f2fs_evict_inode(struct inode *inode);</div><div class='ctx'> void f2fs_handle_failed_inode(struct inode *inode);</div><div class='ctx'> </div><div class='hunk'>@@ -3314,41 +3732,56 @@ void f2fs_handle_failed_inode(struct inode *inode);</div><div class='ctx'> int f2fs_update_extension_list(struct f2fs_sb_info *sbi, const char *name,</div><div class='ctx'> 							bool hot, bool set);</div><div class='ctx'> struct dentry *f2fs_get_parent(struct dentry *child);</div><div class='add'>+int f2fs_get_tmpfile(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+		     struct inode **new_inode);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * dir.c</div><div class='ctx'>  */</div><div class='del'>-unsigned char f2fs_get_de_type(struct f2fs_dir_entry *de);</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='ctx'> int f2fs_init_casefolded_name(const struct inode *dir,</div><div class='ctx'> 			      struct f2fs_filename *fname);</div><div class='add'>+void f2fs_free_casefolded_name(struct f2fs_filename *fname);</div><div class='add'>+#else</div><div class='add'>+static inline int f2fs_init_casefolded_name(const struct inode *dir,</div><div class='add'>+					    struct f2fs_filename *fname)</div><div class='add'>+{</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void f2fs_free_casefolded_name(struct f2fs_filename *fname)</div><div class='add'>+{</div><div class='add'>+}</div><div class='add'>+#endif /* CONFIG_UNICODE */</div><div class='add'>+</div><div class='ctx'> int f2fs_setup_filename(struct inode *dir, const struct qstr *iname,</div><div class='ctx'> 			int lookup, struct f2fs_filename *fname);</div><div class='ctx'> int f2fs_prepare_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 			struct f2fs_filename *fname);</div><div class='ctx'> void f2fs_free_filename(struct f2fs_filename *fname);</div><div class='ctx'> struct f2fs_dir_entry *f2fs_find_target_dentry(const struct f2fs_dentry_ptr *d,</div><div class='del'>-			const struct f2fs_filename *fname, int *max_slots);</div><div class='add'>+			const struct f2fs_filename *fname, int *max_slots,</div><div class='add'>+			bool use_hash);</div><div class='ctx'> int f2fs_fill_dentries(struct dir_context *ctx, struct f2fs_dentry_ptr *d,</div><div class='ctx'> 			unsigned int start_pos, struct fscrypt_str *fstr);</div><div class='ctx'> void f2fs_do_make_empty_dir(struct inode *inode, struct inode *parent,</div><div class='ctx'> 			struct f2fs_dentry_ptr *d);</div><div class='del'>-struct page *f2fs_init_inode_metadata(struct inode *inode, struct inode *dir,</div><div class='del'>-			const struct f2fs_filename *fname, struct page *dpage);</div><div class='add'>+struct folio *f2fs_init_inode_metadata(struct inode *inode, struct inode *dir,</div><div class='add'>+		const struct f2fs_filename *fname, struct folio *dfolio);</div><div class='ctx'> void f2fs_update_parent_metadata(struct inode *dir, struct inode *inode,</div><div class='ctx'> 			unsigned int current_depth);</div><div class='ctx'> int f2fs_room_for_filename(const void *bitmap, int slots, int max_slots);</div><div class='ctx'> void f2fs_drop_nlink(struct inode *dir, struct inode *inode);</div><div class='ctx'> struct f2fs_dir_entry *__f2fs_find_entry(struct inode *dir,</div><div class='del'>-					 const struct f2fs_filename *fname,</div><div class='del'>-					 struct page **res_page);</div><div class='add'>+		const struct f2fs_filename *fname, struct folio **res_folio);</div><div class='ctx'> struct f2fs_dir_entry *f2fs_find_entry(struct inode *dir,</div><div class='del'>-			const struct qstr *child, struct page **res_page);</div><div class='del'>-struct f2fs_dir_entry *f2fs_parent_dir(struct inode *dir, struct page **p);</div><div class='add'>+			const struct qstr *child, struct folio **res_folio);</div><div class='add'>+struct f2fs_dir_entry *f2fs_parent_dir(struct inode *dir, struct folio **f);</div><div class='ctx'> ino_t f2fs_inode_by_name(struct inode *dir, const struct qstr *qstr,</div><div class='del'>-			struct page **page);</div><div class='add'>+			struct folio **folio);</div><div class='ctx'> void f2fs_set_link(struct inode *dir, struct f2fs_dir_entry *de,</div><div class='del'>-			struct page *page, struct inode *inode);</div><div class='del'>-bool f2fs_has_enough_room(struct inode *dir, struct page *ipage,</div><div class='add'>+			struct folio *folio, struct inode *inode);</div><div class='add'>+bool f2fs_has_enough_room(struct inode *dir, struct folio *ifolio,</div><div class='ctx'> 			  const struct f2fs_filename *fname);</div><div class='ctx'> void f2fs_update_dentry(nid_t ino, umode_t mode, struct f2fs_dentry_ptr *d,</div><div class='ctx'> 			const struct fscrypt_str *name, f2fs_hash_t name_hash,</div><div class='hunk'>@@ -3359,9 +3792,10 @@ int f2fs_add_dentry(struct inode *dir, const struct f2fs_filename *fname,</div><div class='ctx'> 			struct inode *inode, nid_t ino, umode_t mode);</div><div class='ctx'> int f2fs_do_add_link(struct inode *dir, const struct qstr *name,</div><div class='ctx'> 			struct inode *inode, nid_t ino, umode_t mode);</div><div class='del'>-void f2fs_delete_entry(struct f2fs_dir_entry *dentry, struct page *page,</div><div class='add'>+void f2fs_delete_entry(struct f2fs_dir_entry *dentry, struct folio *folio,</div><div class='ctx'> 			struct inode *dir, struct inode *inode);</div><div class='del'>-int f2fs_do_tmpfile(struct inode *inode, struct inode *dir);</div><div class='add'>+int f2fs_do_tmpfile(struct inode *inode, struct inode *dir,</div><div class='add'>+					struct f2fs_filename *fname);</div><div class='ctx'> bool f2fs_empty_dir(struct inode *dir);</div><div class='ctx'> </div><div class='ctx'> static inline int f2fs_add_link(struct dentry *dentry, struct inode *inode)</div><div class='hunk'>@@ -3379,9 +3813,12 @@ int f2fs_inode_dirtied(struct inode *inode, bool sync);</div><div class='ctx'> void f2fs_inode_synced(struct inode *inode);</div><div class='ctx'> int f2fs_dquot_initialize(struct inode *inode);</div><div class='ctx'> int f2fs_enable_quota_files(struct f2fs_sb_info *sbi, bool rdonly);</div><div class='del'>-int f2fs_quota_sync(struct super_block *sb, int type);</div><div class='add'>+int f2fs_do_quota_sync(struct super_block *sb, int type);</div><div class='ctx'> loff_t max_file_blocks(struct inode *inode);</div><div class='ctx'> void f2fs_quota_off_umount(struct super_block *sb);</div><div class='add'>+void f2fs_save_errors(struct f2fs_sb_info *sbi, unsigned char flag);</div><div class='add'>+void f2fs_handle_critical_error(struct f2fs_sb_info *sbi, unsigned char reason);</div><div class='add'>+void f2fs_handle_error(struct f2fs_sb_info *sbi, unsigned char error);</div><div class='ctx'> int f2fs_commit_super(struct f2fs_sb_info *sbi, bool recover);</div><div class='ctx'> int f2fs_sync_fs(struct super_block *sb, int sync);</div><div class='ctx'> int f2fs_sanity_check_ckpt(struct f2fs_sb_info *sbi);</div><div class='hunk'>@@ -3395,32 +3832,34 @@ void f2fs_hash_filename(const struct inode *dir, struct f2fs_filename *fname);</div><div class='ctx'>  * node.c</div><div class='ctx'>  */</div><div class='ctx'> struct node_info;</div><div class='add'>+enum node_type;</div><div class='ctx'> </div><div class='ctx'> int f2fs_check_nid_range(struct f2fs_sb_info *sbi, nid_t nid);</div><div class='ctx'> bool f2fs_available_free_memory(struct f2fs_sb_info *sbi, int type);</div><div class='del'>-bool f2fs_in_warm_node_list(struct f2fs_sb_info *sbi, struct page *page);</div><div class='add'>+bool f2fs_in_warm_node_list(struct f2fs_sb_info *sbi, struct folio *folio);</div><div class='ctx'> void f2fs_init_fsync_node_info(struct f2fs_sb_info *sbi);</div><div class='del'>-void f2fs_del_fsync_node_entry(struct f2fs_sb_info *sbi, struct page *page);</div><div class='add'>+void f2fs_del_fsync_node_entry(struct f2fs_sb_info *sbi, struct folio *folio);</div><div class='ctx'> void f2fs_reset_fsync_node_info(struct f2fs_sb_info *sbi);</div><div class='ctx'> int f2fs_need_dentry_mark(struct f2fs_sb_info *sbi, nid_t nid);</div><div class='ctx'> bool f2fs_is_checkpointed_node(struct f2fs_sb_info *sbi, nid_t nid);</div><div class='ctx'> bool f2fs_need_inode_block_update(struct f2fs_sb_info *sbi, nid_t ino);</div><div class='ctx'> int f2fs_get_node_info(struct f2fs_sb_info *sbi, nid_t nid,</div><div class='del'>-						struct node_info *ni);</div><div class='add'>+				struct node_info *ni, bool checkpoint_context);</div><div class='ctx'> pgoff_t f2fs_get_next_page_offset(struct dnode_of_data *dn, pgoff_t pgofs);</div><div class='ctx'> int f2fs_get_dnode_of_data(struct dnode_of_data *dn, pgoff_t index, int mode);</div><div class='ctx'> int f2fs_truncate_inode_blocks(struct inode *inode, pgoff_t from);</div><div class='ctx'> int f2fs_truncate_xattr_node(struct inode *inode);</div><div class='ctx'> int f2fs_wait_on_node_pages_writeback(struct f2fs_sb_info *sbi,</div><div class='ctx'> 					unsigned int seq_id);</div><div class='del'>-bool f2fs_nat_bitmap_enabled(struct f2fs_sb_info *sbi);</div><div class='ctx'> int f2fs_remove_inode_page(struct inode *inode);</div><div class='del'>-struct page *f2fs_new_inode_page(struct inode *inode);</div><div class='del'>-struct page *f2fs_new_node_page(struct dnode_of_data *dn, unsigned int ofs);</div><div class='add'>+struct folio *f2fs_new_inode_folio(struct inode *inode);</div><div class='add'>+struct folio *f2fs_new_node_folio(struct dnode_of_data *dn, unsigned int ofs);</div><div class='ctx'> void f2fs_ra_node_page(struct f2fs_sb_info *sbi, nid_t nid);</div><div class='del'>-struct page *f2fs_get_node_page(struct f2fs_sb_info *sbi, pgoff_t nid);</div><div class='del'>-struct page *f2fs_get_node_page_ra(struct page *parent, int start);</div><div class='del'>-int f2fs_move_node_page(struct page *node_page, int gc_type);</div><div class='add'>+struct folio *f2fs_get_node_folio(struct f2fs_sb_info *sbi, pgoff_t nid,</div><div class='add'>+						enum node_type node_type);</div><div class='add'>+struct folio *f2fs_get_inode_folio(struct f2fs_sb_info *sbi, pgoff_t ino);</div><div class='add'>+struct folio *f2fs_get_xnode_folio(struct f2fs_sb_info *sbi, pgoff_t xnid);</div><div class='add'>+int f2fs_move_node_folio(struct folio *node_folio, int gc_type);</div><div class='ctx'> void f2fs_flush_inline_data(struct f2fs_sb_info *sbi);</div><div class='ctx'> int f2fs_fsync_node_pages(struct f2fs_sb_info *sbi, struct inode *inode,</div><div class='ctx'> 			struct writeback_control *wbc, bool atomic,</div><div class='hunk'>@@ -3433,12 +3872,11 @@ bool f2fs_alloc_nid(struct f2fs_sb_info *sbi, nid_t *nid);</div><div class='ctx'> void f2fs_alloc_nid_done(struct f2fs_sb_info *sbi, nid_t nid);</div><div class='ctx'> void f2fs_alloc_nid_failed(struct f2fs_sb_info *sbi, nid_t nid);</div><div class='ctx'> int f2fs_try_to_free_nids(struct f2fs_sb_info *sbi, int nr_shrink);</div><div class='del'>-int f2fs_recover_inline_xattr(struct inode *inode, struct page *page);</div><div class='del'>-int f2fs_recover_xattr_data(struct inode *inode, struct page *page);</div><div class='del'>-int f2fs_recover_inode_page(struct f2fs_sb_info *sbi, struct page *page);</div><div class='add'>+int f2fs_recover_inline_xattr(struct inode *inode, struct folio *folio);</div><div class='add'>+int f2fs_recover_xattr_data(struct inode *inode, struct folio *folio);</div><div class='add'>+int f2fs_recover_inode_page(struct f2fs_sb_info *sbi, struct folio *folio);</div><div class='ctx'> int f2fs_restore_node_summary(struct f2fs_sb_info *sbi,</div><div class='ctx'> 			unsigned int segno, struct f2fs_summary_block *sum);</div><div class='del'>-void f2fs_enable_nat_bits(struct f2fs_sb_info *sbi);</div><div class='ctx'> int f2fs_flush_nat_entries(struct f2fs_sb_info *sbi, struct cp_control *cpc);</div><div class='ctx'> int f2fs_build_node_manager(struct f2fs_sb_info *sbi);</div><div class='ctx'> void f2fs_destroy_node_manager(struct f2fs_sb_info *sbi);</div><div class='hunk'>@@ -3449,18 +3887,16 @@ void f2fs_destroy_node_manager_caches(void);</div><div class='ctx'>  * segment.c</div><div class='ctx'>  */</div><div class='ctx'> bool f2fs_need_SSR(struct f2fs_sb_info *sbi);</div><div class='del'>-void f2fs_register_inmem_page(struct inode *inode, struct page *page);</div><div class='del'>-void f2fs_drop_inmem_pages_all(struct f2fs_sb_info *sbi, bool gc_failure);</div><div class='del'>-void f2fs_drop_inmem_pages(struct inode *inode);</div><div class='del'>-void f2fs_drop_inmem_page(struct inode *inode, struct page *page);</div><div class='del'>-int f2fs_commit_inmem_pages(struct inode *inode);</div><div class='add'>+int f2fs_commit_atomic_write(struct inode *inode);</div><div class='add'>+void f2fs_abort_atomic_write(struct inode *inode, bool clean);</div><div class='ctx'> void f2fs_balance_fs(struct f2fs_sb_info *sbi, bool need);</div><div class='ctx'> void f2fs_balance_fs_bg(struct f2fs_sb_info *sbi, bool from_bg);</div><div class='ctx'> int f2fs_issue_flush(struct f2fs_sb_info *sbi, nid_t ino);</div><div class='ctx'> int f2fs_create_flush_cmd_control(struct f2fs_sb_info *sbi);</div><div class='ctx'> int f2fs_flush_device_cache(struct f2fs_sb_info *sbi);</div><div class='ctx'> void f2fs_destroy_flush_cmd_control(struct f2fs_sb_info *sbi, bool free);</div><div class='del'>-void f2fs_invalidate_blocks(struct f2fs_sb_info *sbi, block_t addr);</div><div class='add'>+void f2fs_invalidate_blocks(struct f2fs_sb_info *sbi, block_t addr,</div><div class='add'>+						unsigned int len);</div><div class='ctx'> bool f2fs_is_checkpointed_data(struct f2fs_sb_info *sbi, block_t blkaddr);</div><div class='ctx'> int f2fs_start_discard_thread(struct f2fs_sb_info *sbi);</div><div class='ctx'> void f2fs_drop_discard_cmd(struct f2fs_sb_info *sbi);</div><div class='hunk'>@@ -3474,22 +3910,22 @@ int f2fs_disable_cp_again(struct f2fs_sb_info *sbi, block_t unusable);</div><div class='ctx'> void f2fs_release_discard_addrs(struct f2fs_sb_info *sbi);</div><div class='ctx'> int f2fs_npages_for_summary_flush(struct f2fs_sb_info *sbi, bool for_ra);</div><div class='ctx'> bool f2fs_segment_has_free_slot(struct f2fs_sb_info *sbi, int segno);</div><div class='del'>-void f2fs_init_inmem_curseg(struct f2fs_sb_info *sbi);</div><div class='add'>+int f2fs_init_inmem_curseg(struct f2fs_sb_info *sbi);</div><div class='add'>+int f2fs_reinit_atgc_curseg(struct f2fs_sb_info *sbi);</div><div class='ctx'> void f2fs_save_inmem_curseg(struct f2fs_sb_info *sbi);</div><div class='ctx'> void f2fs_restore_inmem_curseg(struct f2fs_sb_info *sbi);</div><div class='del'>-void f2fs_get_new_segment(struct f2fs_sb_info *sbi,</div><div class='del'>-			unsigned int *newseg, bool new_sec, int dir);</div><div class='del'>-void f2fs_allocate_segment_for_resize(struct f2fs_sb_info *sbi, int type,</div><div class='add'>+int f2fs_allocate_segment_for_resize(struct f2fs_sb_info *sbi, int type,</div><div class='ctx'> 					unsigned int start, unsigned int end);</div><div class='del'>-void f2fs_allocate_new_section(struct f2fs_sb_info *sbi, int type, bool force);</div><div class='del'>-void f2fs_allocate_new_segments(struct f2fs_sb_info *sbi);</div><div class='add'>+int f2fs_allocate_new_section(struct f2fs_sb_info *sbi, int type, bool force);</div><div class='add'>+int f2fs_allocate_pinning_section(struct f2fs_sb_info *sbi);</div><div class='add'>+int f2fs_allocate_new_segments(struct f2fs_sb_info *sbi);</div><div class='ctx'> int f2fs_trim_fs(struct f2fs_sb_info *sbi, struct fstrim_range *range);</div><div class='ctx'> bool f2fs_exist_trim_candidates(struct f2fs_sb_info *sbi,</div><div class='ctx'> 					struct cp_control *cpc);</div><div class='del'>-struct page *f2fs_get_sum_page(struct f2fs_sb_info *sbi, unsigned int segno);</div><div class='add'>+struct folio *f2fs_get_sum_folio(struct f2fs_sb_info *sbi, unsigned int segno);</div><div class='ctx'> void f2fs_update_meta_page(struct f2fs_sb_info *sbi, void *src,</div><div class='ctx'> 					block_t blk_addr);</div><div class='del'>-void f2fs_do_write_meta_page(struct f2fs_sb_info *sbi, struct page *page,</div><div class='add'>+void f2fs_do_write_meta_page(struct f2fs_sb_info *sbi, struct folio *folio,</div><div class='ctx'> 						enum iostat_type io_type);</div><div class='ctx'> void f2fs_do_write_node_page(unsigned int nid, struct f2fs_io_info *fio);</div><div class='ctx'> void f2fs_outplace_write_data(struct dnode_of_data *dn,</div><div class='hunk'>@@ -3503,14 +3939,18 @@ void f2fs_replace_block(struct f2fs_sb_info *sbi, struct dnode_of_data *dn,</div><div class='ctx'> 			block_t old_addr, block_t new_addr,</div><div class='ctx'> 			unsigned char version, bool recover_curseg,</div><div class='ctx'> 			bool recover_newaddr);</div><div class='del'>-void f2fs_allocate_data_block(struct f2fs_sb_info *sbi, struct page *page,</div><div class='add'>+enum temp_type f2fs_get_segment_temp(struct f2fs_sb_info *sbi,</div><div class='add'>+						enum log_type seg_type);</div><div class='add'>+int f2fs_allocate_data_block(struct f2fs_sb_info *sbi, struct folio *folio,</div><div class='ctx'> 			block_t old_blkaddr, block_t *new_blkaddr,</div><div class='ctx'> 			struct f2fs_summary *sum, int type,</div><div class='ctx'> 			struct f2fs_io_info *fio);</div><div class='ctx'> void f2fs_update_device_state(struct f2fs_sb_info *sbi, nid_t ino,</div><div class='ctx'> 					block_t blkaddr, unsigned int blkcnt);</div><div class='del'>-void f2fs_wait_on_page_writeback(struct page *page,</div><div class='del'>-			enum page_type type, bool ordered, bool locked);</div><div class='add'>+void f2fs_folio_wait_writeback(struct folio *folio, enum page_type type,</div><div class='add'>+		bool ordered, bool locked);</div><div class='add'>+#define f2fs_wait_on_page_writeback(page, type, ordered, locked)	\</div><div class='add'>+		f2fs_folio_wait_writeback(page_folio(page), type, ordered, locked)</div><div class='ctx'> void f2fs_wait_on_block_writeback(struct inode *inode, block_t blkaddr);</div><div class='ctx'> void f2fs_wait_on_block_writeback_range(struct inode *inode, block_t blkaddr,</div><div class='ctx'> 								block_t len);</div><div class='hunk'>@@ -3519,19 +3959,24 @@ void f2fs_write_node_summaries(struct f2fs_sb_info *sbi, block_t start_blk);</div><div class='ctx'> int f2fs_lookup_journal_in_cursum(struct f2fs_journal *journal, int type,</div><div class='ctx'> 			unsigned int val, int alloc);</div><div class='ctx'> void f2fs_flush_sit_entries(struct f2fs_sb_info *sbi, struct cp_control *cpc);</div><div class='del'>-int f2fs_fix_curseg_write_pointer(struct f2fs_sb_info *sbi);</div><div class='del'>-int f2fs_check_write_pointer(struct f2fs_sb_info *sbi);</div><div class='add'>+int f2fs_check_and_fix_write_pointer(struct f2fs_sb_info *sbi);</div><div class='ctx'> int f2fs_build_segment_manager(struct f2fs_sb_info *sbi);</div><div class='ctx'> void f2fs_destroy_segment_manager(struct f2fs_sb_info *sbi);</div><div class='ctx'> int __init f2fs_create_segment_manager_caches(void);</div><div class='ctx'> void f2fs_destroy_segment_manager_caches(void);</div><div class='del'>-int f2fs_rw_hint_to_seg_type(enum rw_hint hint);</div><div class='add'>+int f2fs_rw_hint_to_seg_type(struct f2fs_sb_info *sbi, enum rw_hint hint);</div><div class='ctx'> enum rw_hint f2fs_io_type_to_rw_hint(struct f2fs_sb_info *sbi,</div><div class='ctx'> 			enum page_type type, enum temp_type temp);</div><div class='del'>-unsigned int f2fs_usable_segs_in_sec(struct f2fs_sb_info *sbi,</div><div class='del'>-			unsigned int segno);</div><div class='add'>+unsigned int f2fs_usable_segs_in_sec(struct f2fs_sb_info *sbi);</div><div class='ctx'> unsigned int f2fs_usable_blks_in_seg(struct f2fs_sb_info *sbi,</div><div class='ctx'> 			unsigned int segno);</div><div class='add'>+unsigned long long f2fs_get_section_mtime(struct f2fs_sb_info *sbi,</div><div class='add'>+			unsigned int segno);</div><div class='add'>+</div><div class='add'>+static inline struct inode *fio_inode(struct f2fs_io_info *fio)</div><div class='add'>+{</div><div class='add'>+	return fio-&gt;folio-&gt;mapping-&gt;host;</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> #define DEF_FRAGMENT_SIZE	4</div><div class='ctx'> #define MIN_FRAGMENT_SIZE	1</div><div class='hunk'>@@ -3546,16 +3991,21 @@ static inline bool f2fs_need_rand_seg(struct f2fs_sb_info *sbi)</div><div class='ctx'> /*</div><div class='ctx'>  * checkpoint.c</div><div class='ctx'>  */</div><div class='del'>-void f2fs_stop_checkpoint(struct f2fs_sb_info *sbi, bool end_io);</div><div class='del'>-struct page *f2fs_grab_meta_page(struct f2fs_sb_info *sbi, pgoff_t index);</div><div class='del'>-struct page *f2fs_get_meta_page(struct f2fs_sb_info *sbi, pgoff_t index);</div><div class='del'>-struct page *f2fs_get_meta_page_retry(struct f2fs_sb_info *sbi, pgoff_t index);</div><div class='del'>-struct page *f2fs_get_tmp_page(struct f2fs_sb_info *sbi, pgoff_t index);</div><div class='add'>+void f2fs_stop_checkpoint(struct f2fs_sb_info *sbi, bool end_io,</div><div class='add'>+							unsigned char reason);</div><div class='add'>+void f2fs_flush_ckpt_thread(struct f2fs_sb_info *sbi);</div><div class='add'>+struct folio *f2fs_grab_meta_folio(struct f2fs_sb_info *sbi, pgoff_t index);</div><div class='add'>+struct folio *f2fs_get_meta_folio(struct f2fs_sb_info *sbi, pgoff_t index);</div><div class='add'>+struct folio *f2fs_get_meta_folio_retry(struct f2fs_sb_info *sbi, pgoff_t index);</div><div class='add'>+struct folio *f2fs_get_tmp_folio(struct f2fs_sb_info *sbi, pgoff_t index);</div><div class='ctx'> bool f2fs_is_valid_blkaddr(struct f2fs_sb_info *sbi,</div><div class='ctx'> 					block_t blkaddr, int type);</div><div class='add'>+bool f2fs_is_valid_blkaddr_raw(struct f2fs_sb_info *sbi,</div><div class='add'>+					block_t blkaddr, int type);</div><div class='ctx'> int f2fs_ra_meta_pages(struct f2fs_sb_info *sbi, block_t start, int nrpages,</div><div class='ctx'> 			int type, bool sync);</div><div class='del'>-void f2fs_ra_meta_pages_cond(struct f2fs_sb_info *sbi, pgoff_t index);</div><div class='add'>+void f2fs_ra_meta_pages_cond(struct f2fs_sb_info *sbi, pgoff_t index,</div><div class='add'>+							unsigned int ra_blocks);</div><div class='ctx'> long f2fs_sync_meta_pages(struct f2fs_sb_info *sbi, enum page_type type,</div><div class='ctx'> 			long nr_to_write, enum iostat_type io_type);</div><div class='ctx'> void f2fs_add_ino_entry(struct f2fs_sb_info *sbi, nid_t ino, int type);</div><div class='hunk'>@@ -3566,16 +4016,16 @@ void f2fs_set_dirty_device(struct f2fs_sb_info *sbi, nid_t ino,</div><div class='ctx'> 					unsigned int devidx, int type);</div><div class='ctx'> bool f2fs_is_dirty_device(struct f2fs_sb_info *sbi, nid_t ino,</div><div class='ctx'> 					unsigned int devidx, int type);</div><div class='del'>-int f2fs_sync_inode_meta(struct f2fs_sb_info *sbi);</div><div class='ctx'> int f2fs_acquire_orphan_inode(struct f2fs_sb_info *sbi);</div><div class='ctx'> void f2fs_release_orphan_inode(struct f2fs_sb_info *sbi);</div><div class='ctx'> void f2fs_add_orphan_inode(struct inode *inode);</div><div class='ctx'> void f2fs_remove_orphan_inode(struct f2fs_sb_info *sbi, nid_t ino);</div><div class='ctx'> int f2fs_recover_orphan_inodes(struct f2fs_sb_info *sbi);</div><div class='ctx'> int f2fs_get_valid_checkpoint(struct f2fs_sb_info *sbi);</div><div class='del'>-void f2fs_update_dirty_page(struct inode *inode, struct page *page);</div><div class='add'>+void f2fs_update_dirty_folio(struct inode *inode, struct folio *folio);</div><div class='ctx'> void f2fs_remove_dirty_inode(struct inode *inode);</div><div class='del'>-int f2fs_sync_dirty_inodes(struct f2fs_sb_info *sbi, enum inode_type type);</div><div class='add'>+int f2fs_sync_dirty_inodes(struct f2fs_sb_info *sbi, enum inode_type type,</div><div class='add'>+								bool from_cp);</div><div class='ctx'> void f2fs_wait_on_all_pages(struct f2fs_sb_info *sbi, int type);</div><div class='ctx'> u64 f2fs_get_sectors_written(struct f2fs_sb_info *sbi);</div><div class='ctx'> int f2fs_write_checkpoint(struct f2fs_sb_info *sbi, struct cp_control *cpc);</div><div class='hunk'>@@ -3592,64 +4042,61 @@ void f2fs_init_ckpt_req_control(struct f2fs_sb_info *sbi);</div><div class='ctx'>  */</div><div class='ctx'> int __init f2fs_init_bioset(void);</div><div class='ctx'> void f2fs_destroy_bioset(void);</div><div class='add'>+bool f2fs_is_cp_guaranteed(const struct folio *folio);</div><div class='ctx'> int f2fs_init_bio_entry_cache(void);</div><div class='ctx'> void f2fs_destroy_bio_entry_cache(void);</div><div class='del'>-void f2fs_submit_bio(struct f2fs_sb_info *sbi,</div><div class='del'>-				struct bio *bio, enum page_type type);</div><div class='add'>+void f2fs_submit_read_bio(struct f2fs_sb_info *sbi, struct bio *bio,</div><div class='add'>+			  enum page_type type);</div><div class='add'>+int f2fs_init_write_merge_io(struct f2fs_sb_info *sbi);</div><div class='ctx'> void f2fs_submit_merged_write(struct f2fs_sb_info *sbi, enum page_type type);</div><div class='ctx'> void f2fs_submit_merged_write_cond(struct f2fs_sb_info *sbi,</div><div class='del'>-				struct inode *inode, struct page *page,</div><div class='add'>+				struct inode *inode, struct folio *folio,</div><div class='ctx'> 				nid_t ino, enum page_type type);</div><div class='ctx'> void f2fs_submit_merged_ipu_write(struct f2fs_sb_info *sbi,</div><div class='del'>-					struct bio **bio, struct page *page);</div><div class='add'>+					struct bio **bio, struct folio *folio);</div><div class='ctx'> void f2fs_flush_merged_writes(struct f2fs_sb_info *sbi);</div><div class='ctx'> int f2fs_submit_page_bio(struct f2fs_io_info *fio);</div><div class='ctx'> int f2fs_merge_page_bio(struct f2fs_io_info *fio);</div><div class='ctx'> void f2fs_submit_page_write(struct f2fs_io_info *fio);</div><div class='ctx'> struct block_device *f2fs_target_device(struct f2fs_sb_info *sbi,</div><div class='del'>-			block_t blk_addr, struct bio *bio);</div><div class='add'>+		block_t blk_addr, sector_t *sector);</div><div class='ctx'> int f2fs_target_device_index(struct f2fs_sb_info *sbi, block_t blkaddr);</div><div class='del'>-void f2fs_set_data_blkaddr(struct dnode_of_data *dn);</div><div class='add'>+void f2fs_set_data_blkaddr(struct dnode_of_data *dn, block_t blkaddr);</div><div class='ctx'> void f2fs_update_data_blkaddr(struct dnode_of_data *dn, block_t blkaddr);</div><div class='ctx'> int f2fs_reserve_new_blocks(struct dnode_of_data *dn, blkcnt_t count);</div><div class='ctx'> int f2fs_reserve_new_block(struct dnode_of_data *dn);</div><div class='del'>-int f2fs_get_block(struct dnode_of_data *dn, pgoff_t index);</div><div class='del'>-int f2fs_preallocate_blocks(struct kiocb *iocb, struct iov_iter *from);</div><div class='add'>+int f2fs_get_block_locked(struct dnode_of_data *dn, pgoff_t index);</div><div class='ctx'> int f2fs_reserve_block(struct dnode_of_data *dn, pgoff_t index);</div><div class='del'>-struct page *f2fs_get_read_data_page(struct inode *inode, pgoff_t index,</div><div class='del'>-			int op_flags, bool for_write);</div><div class='del'>-struct page *f2fs_find_data_page(struct inode *inode, pgoff_t index);</div><div class='del'>-struct page *f2fs_get_lock_data_page(struct inode *inode, pgoff_t index,</div><div class='add'>+struct folio *f2fs_get_read_data_folio(struct inode *inode, pgoff_t index,</div><div class='add'>+		blk_opf_t op_flags, bool for_write, pgoff_t *next_pgofs);</div><div class='add'>+struct folio *f2fs_find_data_folio(struct inode *inode, pgoff_t index,</div><div class='add'>+		pgoff_t *next_pgofs);</div><div class='add'>+struct folio *f2fs_get_lock_data_folio(struct inode *inode, pgoff_t index,</div><div class='ctx'> 			bool for_write);</div><div class='del'>-struct page *f2fs_get_new_data_page(struct inode *inode,</div><div class='del'>-			struct page *ipage, pgoff_t index, bool new_i_size);</div><div class='add'>+struct folio *f2fs_get_new_data_folio(struct inode *inode,</div><div class='add'>+			struct folio *ifolio, pgoff_t index, bool new_i_size);</div><div class='ctx'> int f2fs_do_write_data_page(struct f2fs_io_info *fio);</div><div class='del'>-void f2fs_do_map_lock(struct f2fs_sb_info *sbi, int flag, bool lock);</div><div class='del'>-int f2fs_map_blocks(struct inode *inode, struct f2fs_map_blocks *map,</div><div class='del'>-			int create, int flag);</div><div class='add'>+int f2fs_map_blocks(struct inode *inode, struct f2fs_map_blocks *map, int flag);</div><div class='ctx'> int f2fs_fiemap(struct inode *inode, struct fiemap_extent_info *fieinfo,</div><div class='ctx'> 			u64 start, u64 len);</div><div class='ctx'> int f2fs_encrypt_one_page(struct f2fs_io_info *fio);</div><div class='ctx'> bool f2fs_should_update_inplace(struct inode *inode, struct f2fs_io_info *fio);</div><div class='ctx'> bool f2fs_should_update_outplace(struct inode *inode, struct f2fs_io_info *fio);</div><div class='del'>-int f2fs_write_single_data_page(struct page *page, int *submitted,</div><div class='add'>+int f2fs_write_single_data_page(struct folio *folio, int *submitted,</div><div class='ctx'> 				struct bio **bio, sector_t *last_block,</div><div class='ctx'> 				struct writeback_control *wbc,</div><div class='ctx'> 				enum iostat_type io_type,</div><div class='ctx'> 				int compr_blocks, bool allow_balance);</div><div class='del'>-void f2fs_invalidate_page(struct page *page, unsigned int offset,</div><div class='del'>-			unsigned int length);</div><div class='del'>-int f2fs_release_page(struct page *page, gfp_t wait);</div><div class='del'>-#ifdef CONFIG_MIGRATION</div><div class='del'>-int f2fs_migrate_page(struct address_space *mapping, struct page *newpage,</div><div class='del'>-			struct page *page, enum migrate_mode mode);</div><div class='del'>-#endif</div><div class='add'>+void f2fs_write_failed(struct inode *inode, loff_t to);</div><div class='add'>+void f2fs_invalidate_folio(struct folio *folio, size_t offset, size_t length);</div><div class='add'>+bool f2fs_release_folio(struct folio *folio, gfp_t wait);</div><div class='ctx'> bool f2fs_overwrite_io(struct inode *inode, loff_t pos, size_t len);</div><div class='del'>-void f2fs_clear_page_cache_dirty_tag(struct page *page);</div><div class='add'>+void f2fs_clear_page_cache_dirty_tag(struct folio *folio);</div><div class='ctx'> int f2fs_init_post_read_processing(void);</div><div class='ctx'> void f2fs_destroy_post_read_processing(void);</div><div class='ctx'> int f2fs_init_post_read_wq(struct f2fs_sb_info *sbi);</div><div class='ctx'> void f2fs_destroy_post_read_wq(struct f2fs_sb_info *sbi);</div><div class='add'>+extern const struct iomap_ops f2fs_iomap_ops;</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * gc.c</div><div class='hunk'>@@ -3657,12 +4104,18 @@ void f2fs_destroy_post_read_wq(struct f2fs_sb_info *sbi);</div><div class='ctx'> int f2fs_start_gc_thread(struct f2fs_sb_info *sbi);</div><div class='ctx'> void f2fs_stop_gc_thread(struct f2fs_sb_info *sbi);</div><div class='ctx'> block_t f2fs_start_bidx_of_node(unsigned int node_ofs, struct inode *inode);</div><div class='del'>-int f2fs_gc(struct f2fs_sb_info *sbi, bool sync, bool background, bool force,</div><div class='del'>-			unsigned int segno);</div><div class='add'>+int f2fs_gc(struct f2fs_sb_info *sbi, struct f2fs_gc_control *gc_control);</div><div class='ctx'> void f2fs_build_gc_manager(struct f2fs_sb_info *sbi);</div><div class='del'>-int f2fs_resize_fs(struct f2fs_sb_info *sbi, __u64 block_count);</div><div class='add'>+int f2fs_gc_range(struct f2fs_sb_info *sbi,</div><div class='add'>+		unsigned int start_seg, unsigned int end_seg,</div><div class='add'>+		bool dry_run, unsigned int dry_run_sections);</div><div class='add'>+int f2fs_resize_fs(struct file *filp, __u64 block_count);</div><div class='ctx'> int __init f2fs_create_garbage_collection_cache(void);</div><div class='ctx'> void f2fs_destroy_garbage_collection_cache(void);</div><div class='add'>+/* victim selection function for cleaning and SSR */</div><div class='add'>+int f2fs_get_victim(struct f2fs_sb_info *sbi, unsigned int *result,</div><div class='add'>+			int gc_type, int type, char alloc_mode,</div><div class='add'>+			unsigned long long age, bool one_time);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * recovery.c</div><div class='hunk'>@@ -3676,22 +4129,45 @@ void f2fs_destroy_recovery_cache(void);</div><div class='ctx'>  * debug.c</div><div class='ctx'>  */</div><div class='ctx'> #ifdef CONFIG_F2FS_STAT_FS</div><div class='add'>+enum {</div><div class='add'>+	DEVSTAT_INUSE,</div><div class='add'>+	DEVSTAT_DIRTY,</div><div class='add'>+	DEVSTAT_FULL,</div><div class='add'>+	DEVSTAT_FREE,</div><div class='add'>+	DEVSTAT_PREFREE,</div><div class='add'>+	DEVSTAT_MAX,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct f2fs_dev_stats {</div><div class='add'>+	unsigned int devstats[2][DEVSTAT_MAX];		/* 0: segs, 1: secs */</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> struct f2fs_stat_info {</div><div class='ctx'> 	struct list_head stat_list;</div><div class='ctx'> 	struct f2fs_sb_info *sbi;</div><div class='ctx'> 	int all_area_segs, sit_area_segs, nat_area_segs, ssa_area_segs;</div><div class='ctx'> 	int main_area_segs, main_area_sections, main_area_zones;</div><div class='del'>-	unsigned long long hit_largest, hit_cached, hit_rbtree;</div><div class='del'>-	unsigned long long hit_total, total_ext;</div><div class='del'>-	int ext_tree, zombie_tree, ext_node;</div><div class='add'>+	unsigned long long hit_cached[NR_EXTENT_CACHES];</div><div class='add'>+	unsigned long long hit_rbtree[NR_EXTENT_CACHES];</div><div class='add'>+	unsigned long long total_ext[NR_EXTENT_CACHES];</div><div class='add'>+	unsigned long long hit_total[NR_EXTENT_CACHES];</div><div class='add'>+	int ext_tree[NR_EXTENT_CACHES];</div><div class='add'>+	int zombie_tree[NR_EXTENT_CACHES];</div><div class='add'>+	int ext_node[NR_EXTENT_CACHES];</div><div class='add'>+	/* to count memory footprint */</div><div class='add'>+	unsigned long long ext_mem[NR_EXTENT_CACHES];</div><div class='add'>+	/* for read extent cache */</div><div class='add'>+	unsigned long long hit_largest;</div><div class='add'>+	/* for block age extent cache */</div><div class='add'>+	unsigned long long allocated_data_blocks;</div><div class='ctx'> 	int ndirty_node, ndirty_dent, ndirty_meta, ndirty_imeta;</div><div class='ctx'> 	int ndirty_data, ndirty_qdata;</div><div class='del'>-	int inmem_pages;</div><div class='del'>-	unsigned int ndirty_dirs, ndirty_files, nquota_files, ndirty_all;</div><div class='add'>+	unsigned int ndirty_dirs, ndirty_files, ndirty_all;</div><div class='add'>+	unsigned int nquota_files, ndonate_files;</div><div class='ctx'> 	int nats, dirty_nats, sits, dirty_sits;</div><div class='ctx'> 	int free_nids, avail_nids, alloc_nids;</div><div class='ctx'> 	int total_count, utilization;</div><div class='del'>-	int bg_gc, nr_wb_cp_data, nr_wb_data;</div><div class='add'>+	int nr_wb_cp_data, nr_wb_data;</div><div class='ctx'> 	int nr_rd_data, nr_rd_node, nr_rd_meta;</div><div class='ctx'> 	int nr_dio_read, nr_dio_write;</div><div class='ctx'> 	unsigned int io_skip_bggc, other_skip_bggc;</div><div class='hunk'>@@ -3702,21 +4178,23 @@ struct f2fs_stat_info {</div><div class='ctx'> 	int nr_issued_ckpt, nr_total_ckpt, nr_queued_ckpt;</div><div class='ctx'> 	unsigned int cur_ckpt_time, peak_ckpt_time;</div><div class='ctx'> 	int inline_xattr, inline_inode, inline_dir, append, update, orphans;</div><div class='del'>-	int compr_inode;</div><div class='add'>+	int compr_inode, swapfile_inode;</div><div class='ctx'> 	unsigned long long compr_blocks;</div><div class='del'>-	int aw_cnt, max_aw_cnt, vw_cnt, max_vw_cnt;</div><div class='add'>+	int aw_cnt, max_aw_cnt;</div><div class='ctx'> 	unsigned int valid_count, valid_node_count, valid_inode_count, discard_blks;</div><div class='ctx'> 	unsigned int bimodal, avg_vblocks;</div><div class='ctx'> 	int util_free, util_valid, util_invalid;</div><div class='ctx'> 	int rsvd_segs, overp_segs;</div><div class='ctx'> 	int dirty_count, node_pages, meta_pages, compress_pages;</div><div class='ctx'> 	int compress_page_hit;</div><div class='del'>-	int prefree_count, call_count, cp_count, bg_cp_count;</div><div class='del'>-	int tot_segs, node_segs, data_segs, free_segs, free_secs;</div><div class='del'>-	int bg_node_segs, bg_data_segs;</div><div class='add'>+	int prefree_count, free_segs, free_secs;</div><div class='add'>+	int cp_call_count[MAX_CALL_TYPE], cp_count;</div><div class='add'>+	int gc_call_count[MAX_CALL_TYPE];</div><div class='add'>+	int gc_segs[2][2];</div><div class='add'>+	int gc_secs[2][2];</div><div class='ctx'> 	int tot_blks, data_blks, node_blks;</div><div class='ctx'> 	int bg_data_blks, bg_node_blks;</div><div class='del'>-	unsigned long long skipped_atomic_files[2];</div><div class='add'>+	int blkoff[NR_CURSEG_TYPE];</div><div class='ctx'> 	int curseg[NR_CURSEG_TYPE];</div><div class='ctx'> 	int cursec[NR_CURSEG_TYPE];</div><div class='ctx'> 	int curzone[NR_CURSEG_TYPE];</div><div class='hunk'>@@ -3729,6 +4207,7 @@ struct f2fs_stat_info {</div><div class='ctx'> 	unsigned int block_count[2];</div><div class='ctx'> 	unsigned int inplace_count;</div><div class='ctx'> 	unsigned long long base_mem, cache_mem, page_mem;</div><div class='add'>+	struct f2fs_dev_stats *dev_stats;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static inline struct f2fs_stat_info *F2FS_STAT(struct f2fs_sb_info *sbi)</div><div class='hunk'>@@ -3736,18 +4215,17 @@ static inline struct f2fs_stat_info *F2FS_STAT(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	return (struct f2fs_stat_info *)sbi-&gt;stat_info;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#define stat_inc_cp_count(si)		((si)-&gt;cp_count++)</div><div class='del'>-#define stat_inc_bg_cp_count(si)	((si)-&gt;bg_cp_count++)</div><div class='del'>-#define stat_inc_call_count(si)		((si)-&gt;call_count++)</div><div class='del'>-#define stat_inc_bggc_count(si)		((si)-&gt;bg_gc++)</div><div class='add'>+#define stat_inc_cp_call_count(sbi, foreground)				\</div><div class='add'>+		atomic_inc(&amp;sbi-&gt;cp_call_count[(foreground)])</div><div class='add'>+#define stat_inc_cp_count(sbi)		(F2FS_STAT(sbi)-&gt;cp_count++)</div><div class='ctx'> #define stat_io_skip_bggc_count(sbi)	((sbi)-&gt;io_skip_bggc++)</div><div class='ctx'> #define stat_other_skip_bggc_count(sbi)	((sbi)-&gt;other_skip_bggc++)</div><div class='ctx'> #define stat_inc_dirty_inode(sbi, type)	((sbi)-&gt;ndirty_inode[type]++)</div><div class='ctx'> #define stat_dec_dirty_inode(sbi, type)	((sbi)-&gt;ndirty_inode[type]--)</div><div class='del'>-#define stat_inc_total_hit(sbi)		(atomic64_inc(&amp;(sbi)-&gt;total_hit_ext))</div><div class='del'>-#define stat_inc_rbtree_node_hit(sbi)	(atomic64_inc(&amp;(sbi)-&gt;read_hit_rbtree))</div><div class='add'>+#define stat_inc_total_hit(sbi, type)		(atomic64_inc(&amp;(sbi)-&gt;total_hit_ext[type]))</div><div class='add'>+#define stat_inc_rbtree_node_hit(sbi, type)	(atomic64_inc(&amp;(sbi)-&gt;read_hit_rbtree[type]))</div><div class='ctx'> #define stat_inc_largest_node_hit(sbi)	(atomic64_inc(&amp;(sbi)-&gt;read_hit_largest))</div><div class='del'>-#define stat_inc_cached_node_hit(sbi)	(atomic64_inc(&amp;(sbi)-&gt;read_hit_cached))</div><div class='add'>+#define stat_inc_cached_node_hit(sbi, type)	(atomic64_inc(&amp;(sbi)-&gt;read_hit_cached[type]))</div><div class='ctx'> #define stat_inc_inline_xattr(inode)					\</div><div class='ctx'> 	do {								\</div><div class='ctx'> 		if (f2fs_has_inline_xattr(inode))			\</div><div class='hunk'>@@ -3792,6 +4270,14 @@ static inline struct f2fs_stat_info *F2FS_STAT(struct f2fs_sb_info *sbi)</div><div class='ctx'> 		(atomic64_add(blocks, &amp;F2FS_I_SB(inode)-&gt;compr_blocks))</div><div class='ctx'> #define stat_sub_compr_blocks(inode, blocks)				\</div><div class='ctx'> 		(atomic64_sub(blocks, &amp;F2FS_I_SB(inode)-&gt;compr_blocks))</div><div class='add'>+#define stat_inc_swapfile_inode(inode)					\</div><div class='add'>+		(atomic_inc(&amp;F2FS_I_SB(inode)-&gt;swapfile_inode))</div><div class='add'>+#define stat_dec_swapfile_inode(inode)					\</div><div class='add'>+		(atomic_dec(&amp;F2FS_I_SB(inode)-&gt;swapfile_inode))</div><div class='add'>+#define stat_inc_atomic_inode(inode)					\</div><div class='add'>+			(atomic_inc(&amp;F2FS_I_SB(inode)-&gt;atomic_files))</div><div class='add'>+#define stat_dec_atomic_inode(inode)					\</div><div class='add'>+			(atomic_dec(&amp;F2FS_I_SB(inode)-&gt;atomic_files))</div><div class='ctx'> #define stat_inc_meta_count(sbi, blkaddr)				\</div><div class='ctx'> 	do {								\</div><div class='ctx'> 		if (blkaddr &lt; SIT_I(sbi)-&gt;sit_base_addr)		\</div><div class='hunk'>@@ -3811,34 +4297,17 @@ static inline struct f2fs_stat_info *F2FS_STAT(struct f2fs_sb_info *sbi)</div><div class='ctx'> 		(atomic_inc(&amp;(sbi)-&gt;inplace_count))</div><div class='ctx'> #define stat_update_max_atomic_write(inode)				\</div><div class='ctx'> 	do {								\</div><div class='del'>-		int cur = F2FS_I_SB(inode)-&gt;atomic_files;	\</div><div class='add'>+		int cur = atomic_read(&amp;F2FS_I_SB(inode)-&gt;atomic_files);	\</div><div class='ctx'> 		int max = atomic_read(&amp;F2FS_I_SB(inode)-&gt;max_aw_cnt);	\</div><div class='ctx'> 		if (cur &gt; max)						\</div><div class='ctx'> 			atomic_set(&amp;F2FS_I_SB(inode)-&gt;max_aw_cnt, cur);	\</div><div class='ctx'> 	} while (0)</div><div class='del'>-#define stat_inc_volatile_write(inode)					\</div><div class='del'>-		(atomic_inc(&amp;F2FS_I_SB(inode)-&gt;vw_cnt))</div><div class='del'>-#define stat_dec_volatile_write(inode)					\</div><div class='del'>-		(atomic_dec(&amp;F2FS_I_SB(inode)-&gt;vw_cnt))</div><div class='del'>-#define stat_update_max_volatile_write(inode)				\</div><div class='del'>-	do {								\</div><div class='del'>-		int cur = atomic_read(&amp;F2FS_I_SB(inode)-&gt;vw_cnt);	\</div><div class='del'>-		int max = atomic_read(&amp;F2FS_I_SB(inode)-&gt;max_vw_cnt);	\</div><div class='del'>-		if (cur &gt; max)						\</div><div class='del'>-			atomic_set(&amp;F2FS_I_SB(inode)-&gt;max_vw_cnt, cur);	\</div><div class='del'>-	} while (0)</div><div class='del'>-#define stat_inc_seg_count(sbi, type, gc_type)				\</div><div class='del'>-	do {								\</div><div class='del'>-		struct f2fs_stat_info *si = F2FS_STAT(sbi);		\</div><div class='del'>-		si-&gt;tot_segs++;						\</div><div class='del'>-		if ((type) == SUM_TYPE_DATA) {				\</div><div class='del'>-			si-&gt;data_segs++;				\</div><div class='del'>-			si-&gt;bg_data_segs += (gc_type == BG_GC) ? 1 : 0;	\</div><div class='del'>-		} else {						\</div><div class='del'>-			si-&gt;node_segs++;				\</div><div class='del'>-			si-&gt;bg_node_segs += (gc_type == BG_GC) ? 1 : 0;	\</div><div class='del'>-		}							\</div><div class='del'>-	} while (0)</div><div class='add'>+#define stat_inc_gc_call_count(sbi, foreground)				\</div><div class='add'>+		(F2FS_STAT(sbi)-&gt;gc_call_count[(foreground)]++)</div><div class='add'>+#define stat_inc_gc_sec_count(sbi, type, gc_type)			\</div><div class='add'>+		(F2FS_STAT(sbi)-&gt;gc_secs[(type)][(gc_type)]++)</div><div class='add'>+#define stat_inc_gc_seg_count(sbi, type, gc_type)			\</div><div class='add'>+		(F2FS_STAT(sbi)-&gt;gc_segs[(type)][(gc_type)]++)</div><div class='ctx'> </div><div class='ctx'> #define stat_inc_tot_blk_count(si, blks)				\</div><div class='ctx'> 	((si)-&gt;tot_blks += (blks))</div><div class='hunk'>@@ -3865,18 +4334,16 @@ void __init f2fs_create_root_stats(void);</div><div class='ctx'> void f2fs_destroy_root_stats(void);</div><div class='ctx'> void f2fs_update_sit_info(struct f2fs_sb_info *sbi);</div><div class='ctx'> #else</div><div class='del'>-#define stat_inc_cp_count(si)				do { } while (0)</div><div class='del'>-#define stat_inc_bg_cp_count(si)			do { } while (0)</div><div class='del'>-#define stat_inc_call_count(si)				do { } while (0)</div><div class='del'>-#define stat_inc_bggc_count(si)				do { } while (0)</div><div class='add'>+#define stat_inc_cp_call_count(sbi, foreground)		do { } while (0)</div><div class='add'>+#define stat_inc_cp_count(sbi)				do { } while (0)</div><div class='ctx'> #define stat_io_skip_bggc_count(sbi)			do { } while (0)</div><div class='ctx'> #define stat_other_skip_bggc_count(sbi)			do { } while (0)</div><div class='ctx'> #define stat_inc_dirty_inode(sbi, type)			do { } while (0)</div><div class='ctx'> #define stat_dec_dirty_inode(sbi, type)			do { } while (0)</div><div class='del'>-#define stat_inc_total_hit(sbi)				do { } while (0)</div><div class='del'>-#define stat_inc_rbtree_node_hit(sbi)			do { } while (0)</div><div class='add'>+#define stat_inc_total_hit(sbi, type)			do { } while (0)</div><div class='add'>+#define stat_inc_rbtree_node_hit(sbi, type)		do { } while (0)</div><div class='ctx'> #define stat_inc_largest_node_hit(sbi)			do { } while (0)</div><div class='del'>-#define stat_inc_cached_node_hit(sbi)			do { } while (0)</div><div class='add'>+#define stat_inc_cached_node_hit(sbi, type)		do { } while (0)</div><div class='ctx'> #define stat_inc_inline_xattr(inode)			do { } while (0)</div><div class='ctx'> #define stat_dec_inline_xattr(inode)			do { } while (0)</div><div class='ctx'> #define stat_inc_inline_inode(inode)			do { } while (0)</div><div class='hunk'>@@ -3887,15 +4354,18 @@ void f2fs_update_sit_info(struct f2fs_sb_info *sbi);</div><div class='ctx'> #define stat_dec_compr_inode(inode)			do { } while (0)</div><div class='ctx'> #define stat_add_compr_blocks(inode, blocks)		do { } while (0)</div><div class='ctx'> #define stat_sub_compr_blocks(inode, blocks)		do { } while (0)</div><div class='add'>+#define stat_inc_swapfile_inode(inode)			do { } while (0)</div><div class='add'>+#define stat_dec_swapfile_inode(inode)			do { } while (0)</div><div class='add'>+#define stat_inc_atomic_inode(inode)			do { } while (0)</div><div class='add'>+#define stat_dec_atomic_inode(inode)			do { } while (0)</div><div class='ctx'> #define stat_update_max_atomic_write(inode)		do { } while (0)</div><div class='del'>-#define stat_inc_volatile_write(inode)			do { } while (0)</div><div class='del'>-#define stat_dec_volatile_write(inode)			do { } while (0)</div><div class='del'>-#define stat_update_max_volatile_write(inode)		do { } while (0)</div><div class='ctx'> #define stat_inc_meta_count(sbi, blkaddr)		do { } while (0)</div><div class='ctx'> #define stat_inc_seg_type(sbi, curseg)			do { } while (0)</div><div class='ctx'> #define stat_inc_block_count(sbi, curseg)		do { } while (0)</div><div class='ctx'> #define stat_inc_inplace_blocks(sbi)			do { } while (0)</div><div class='del'>-#define stat_inc_seg_count(sbi, type, gc_type)		do { } while (0)</div><div class='add'>+#define stat_inc_gc_call_count(sbi, foreground)		do { } while (0)</div><div class='add'>+#define stat_inc_gc_sec_count(sbi, type, gc_type)	do { } while (0)</div><div class='add'>+#define stat_inc_gc_seg_count(sbi, type, gc_type)	do { } while (0)</div><div class='ctx'> #define stat_inc_tot_blk_count(si, blks)		do { } while (0)</div><div class='ctx'> #define stat_inc_data_blk_count(sbi, blks, gc_type)	do { } while (0)</div><div class='ctx'> #define stat_inc_node_blk_count(sbi, blks, gc_type)	do { } while (0)</div><div class='hunk'>@@ -3923,26 +4393,26 @@ extern struct kmem_cache *f2fs_inode_entry_slab;</div><div class='ctx'>  * inline.c</div><div class='ctx'>  */</div><div class='ctx'> bool f2fs_may_inline_data(struct inode *inode);</div><div class='add'>+bool f2fs_sanity_check_inline_data(struct inode *inode, struct folio *ifolio);</div><div class='ctx'> bool f2fs_may_inline_dentry(struct inode *inode);</div><div class='del'>-void f2fs_do_read_inline_data(struct page *page, struct page *ipage);</div><div class='del'>-void f2fs_truncate_inline_inode(struct inode *inode,</div><div class='del'>-						struct page *ipage, u64 from);</div><div class='del'>-int f2fs_read_inline_data(struct inode *inode, struct page *page);</div><div class='del'>-int f2fs_convert_inline_page(struct dnode_of_data *dn, struct page *page);</div><div class='add'>+void f2fs_do_read_inline_data(struct folio *folio, struct folio *ifolio);</div><div class='add'>+void f2fs_truncate_inline_inode(struct inode *inode, struct folio *ifolio,</div><div class='add'>+		u64 from);</div><div class='add'>+int f2fs_read_inline_data(struct inode *inode, struct folio *folio);</div><div class='add'>+int f2fs_convert_inline_folio(struct dnode_of_data *dn, struct folio *folio);</div><div class='ctx'> int f2fs_convert_inline_inode(struct inode *inode);</div><div class='ctx'> int f2fs_try_convert_inline_dir(struct inode *dir, struct dentry *dentry);</div><div class='del'>-int f2fs_write_inline_data(struct inode *inode, struct page *page);</div><div class='del'>-int f2fs_recover_inline_data(struct inode *inode, struct page *npage);</div><div class='add'>+int f2fs_write_inline_data(struct inode *inode, struct folio *folio);</div><div class='add'>+int f2fs_recover_inline_data(struct inode *inode, struct folio *nfolio);</div><div class='ctx'> struct f2fs_dir_entry *f2fs_find_in_inline_dir(struct inode *dir,</div><div class='del'>-					const struct f2fs_filename *fname,</div><div class='del'>-					struct page **res_page);</div><div class='add'>+		const struct f2fs_filename *fname, struct folio **res_folio,</div><div class='add'>+		bool use_hash);</div><div class='ctx'> int f2fs_make_empty_inline_dir(struct inode *inode, struct inode *parent,</div><div class='del'>-			struct page *ipage);</div><div class='add'>+			struct folio *ifolio);</div><div class='ctx'> int f2fs_add_inline_entry(struct inode *dir, const struct f2fs_filename *fname,</div><div class='ctx'> 			struct inode *inode, nid_t ino, umode_t mode);</div><div class='ctx'> void f2fs_delete_inline_entry(struct f2fs_dir_entry *dentry,</div><div class='del'>-				struct page *page, struct inode *dir,</div><div class='del'>-				struct inode *inode);</div><div class='add'>+		struct folio *folio, struct inode *dir, struct inode *inode);</div><div class='ctx'> bool f2fs_empty_inline_dir(struct inode *dir);</div><div class='ctx'> int f2fs_read_inline_dir(struct file *file, struct dir_context *ctx,</div><div class='ctx'> 			struct fscrypt_str *fstr);</div><div class='hunk'>@@ -3957,43 +4427,45 @@ unsigned long f2fs_shrink_count(struct shrinker *shrink,</div><div class='ctx'> 			struct shrink_control *sc);</div><div class='ctx'> unsigned long f2fs_shrink_scan(struct shrinker *shrink,</div><div class='ctx'> 			struct shrink_control *sc);</div><div class='add'>+unsigned int f2fs_donate_files(void);</div><div class='add'>+void f2fs_reclaim_caches(unsigned int reclaim_caches_kb);</div><div class='ctx'> void f2fs_join_shrinker(struct f2fs_sb_info *sbi);</div><div class='ctx'> void f2fs_leave_shrinker(struct f2fs_sb_info *sbi);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * extent_cache.c</div><div class='ctx'>  */</div><div class='del'>-struct rb_entry *f2fs_lookup_rb_tree(struct rb_root_cached *root,</div><div class='del'>-				struct rb_entry *cached_re, unsigned int ofs);</div><div class='del'>-struct rb_node **f2fs_lookup_rb_tree_ext(struct f2fs_sb_info *sbi,</div><div class='del'>-				struct rb_root_cached *root,</div><div class='del'>-				struct rb_node **parent,</div><div class='del'>-				unsigned long long key, bool *left_most);</div><div class='del'>-struct rb_node **f2fs_lookup_rb_tree_for_insert(struct f2fs_sb_info *sbi,</div><div class='del'>-				struct rb_root_cached *root,</div><div class='del'>-				struct rb_node **parent,</div><div class='del'>-				unsigned int ofs, bool *leftmost);</div><div class='del'>-struct rb_entry *f2fs_lookup_rb_tree_ret(struct rb_root_cached *root,</div><div class='del'>-		struct rb_entry *cached_re, unsigned int ofs,</div><div class='del'>-		struct rb_entry **prev_entry, struct rb_entry **next_entry,</div><div class='del'>-		struct rb_node ***insert_p, struct rb_node **insert_parent,</div><div class='del'>-		bool force, bool *leftmost);</div><div class='del'>-bool f2fs_check_rb_tree_consistence(struct f2fs_sb_info *sbi,</div><div class='del'>-				struct rb_root_cached *root, bool check_key);</div><div class='del'>-unsigned int f2fs_shrink_extent_tree(struct f2fs_sb_info *sbi, int nr_shrink);</div><div class='del'>-void f2fs_init_extent_tree(struct inode *inode, struct page *ipage);</div><div class='add'>+bool sanity_check_extent_cache(struct inode *inode, struct folio *ifolio);</div><div class='add'>+void f2fs_init_extent_tree(struct inode *inode);</div><div class='ctx'> void f2fs_drop_extent_tree(struct inode *inode);</div><div class='del'>-unsigned int f2fs_destroy_extent_node(struct inode *inode);</div><div class='add'>+void f2fs_destroy_extent_node(struct inode *inode);</div><div class='ctx'> void f2fs_destroy_extent_tree(struct inode *inode);</div><div class='del'>-bool f2fs_lookup_extent_cache(struct inode *inode, pgoff_t pgofs,</div><div class='del'>-			struct extent_info *ei);</div><div class='del'>-void f2fs_update_extent_cache(struct dnode_of_data *dn);</div><div class='del'>-void f2fs_update_extent_cache_range(struct dnode_of_data *dn,</div><div class='del'>-			pgoff_t fofs, block_t blkaddr, unsigned int len);</div><div class='ctx'> void f2fs_init_extent_cache_info(struct f2fs_sb_info *sbi);</div><div class='ctx'> int __init f2fs_create_extent_cache(void);</div><div class='ctx'> void f2fs_destroy_extent_cache(void);</div><div class='ctx'> </div><div class='add'>+/* read extent cache ops */</div><div class='add'>+void f2fs_init_read_extent_tree(struct inode *inode, struct folio *ifolio);</div><div class='add'>+bool f2fs_lookup_read_extent_cache(struct inode *inode, pgoff_t pgofs,</div><div class='add'>+			struct extent_info *ei);</div><div class='add'>+bool f2fs_lookup_read_extent_cache_block(struct inode *inode, pgoff_t index,</div><div class='add'>+			block_t *blkaddr);</div><div class='add'>+void f2fs_update_read_extent_cache(struct dnode_of_data *dn);</div><div class='add'>+void f2fs_update_read_extent_cache_range(struct dnode_of_data *dn,</div><div class='add'>+			pgoff_t fofs, block_t blkaddr, unsigned int len);</div><div class='add'>+unsigned int f2fs_shrink_read_extent_tree(struct f2fs_sb_info *sbi,</div><div class='add'>+			int nr_shrink);</div><div class='add'>+</div><div class='add'>+/* block age extent cache ops */</div><div class='add'>+void f2fs_init_age_extent_tree(struct inode *inode);</div><div class='add'>+bool f2fs_lookup_age_extent_cache(struct inode *inode, pgoff_t pgofs,</div><div class='add'>+			struct extent_info *ei);</div><div class='add'>+void f2fs_update_age_extent_cache(struct dnode_of_data *dn);</div><div class='add'>+void f2fs_update_age_extent_cache_range(struct dnode_of_data *dn,</div><div class='add'>+			pgoff_t fofs, unsigned int len);</div><div class='add'>+unsigned int f2fs_shrink_age_extent_tree(struct f2fs_sb_info *sbi,</div><div class='add'>+			int nr_shrink);</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * sysfs.c</div><div class='ctx'>  */</div><div class='hunk'>@@ -4034,45 +4506,64 @@ static inline bool f2fs_post_read_required(struct inode *inode)</div><div class='ctx'> 		f2fs_compressed_file(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline bool f2fs_used_in_atomic_write(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	return f2fs_is_atomic_file(inode) || f2fs_is_cow_file(inode);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool f2fs_meta_inode_gc_required(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	return f2fs_post_read_required(inode) || f2fs_used_in_atomic_write(inode);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * compress.c</div><div class='ctx'>  */</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='del'>-bool f2fs_is_compressed_page(struct page *page);</div><div class='del'>-struct page *f2fs_compress_control_page(struct page *page);</div><div class='add'>+enum cluster_check_type {</div><div class='add'>+	CLUSTER_IS_COMPR,   /* check only if compressed cluster */</div><div class='add'>+	CLUSTER_COMPR_BLKS, /* return # of compressed blocks in a cluster */</div><div class='add'>+	CLUSTER_RAW_BLKS    /* return # of raw blocks in a cluster */</div><div class='add'>+};</div><div class='add'>+bool f2fs_is_compressed_page(struct folio *folio);</div><div class='add'>+struct folio *f2fs_compress_control_folio(struct folio *folio);</div><div class='ctx'> int f2fs_prepare_compress_overwrite(struct inode *inode,</div><div class='ctx'> 			struct page **pagep, pgoff_t index, void **fsdata);</div><div class='ctx'> bool f2fs_compress_write_end(struct inode *inode, void *fsdata,</div><div class='ctx'> 					pgoff_t index, unsigned copied);</div><div class='ctx'> int f2fs_truncate_partial_cluster(struct inode *inode, u64 from, bool lock);</div><div class='del'>-void f2fs_compress_write_end_io(struct bio *bio, struct page *page);</div><div class='add'>+void f2fs_compress_write_end_io(struct bio *bio, struct folio *folio);</div><div class='ctx'> bool f2fs_is_compress_backend_ready(struct inode *inode);</div><div class='del'>-int f2fs_init_compress_mempool(void);</div><div class='add'>+bool f2fs_is_compress_level_valid(int alg, int lvl);</div><div class='add'>+int __init f2fs_init_compress_mempool(void);</div><div class='ctx'> void f2fs_destroy_compress_mempool(void);</div><div class='del'>-void f2fs_decompress_cluster(struct decompress_io_ctx *dic);</div><div class='del'>-void f2fs_end_read_compressed_page(struct page *page, bool failed,</div><div class='del'>-							block_t blkaddr);</div><div class='add'>+void f2fs_decompress_cluster(struct decompress_io_ctx *dic, bool in_task);</div><div class='add'>+void f2fs_end_read_compressed_page(struct folio *folio, bool failed,</div><div class='add'>+				block_t blkaddr, bool in_task);</div><div class='ctx'> bool f2fs_cluster_is_empty(struct compress_ctx *cc);</div><div class='ctx'> bool f2fs_cluster_can_merge_page(struct compress_ctx *cc, pgoff_t index);</div><div class='del'>-bool f2fs_all_cluster_page_loaded(struct compress_ctx *cc, struct pagevec *pvec,</div><div class='del'>-				int index, int nr_pages);</div><div class='add'>+bool f2fs_all_cluster_page_ready(struct compress_ctx *cc, struct page **pages,</div><div class='add'>+				int index, int nr_pages, bool uptodate);</div><div class='ctx'> bool f2fs_sanity_check_cluster(struct dnode_of_data *dn);</div><div class='del'>-void f2fs_compress_ctx_add_page(struct compress_ctx *cc, struct page *page);</div><div class='add'>+void f2fs_compress_ctx_add_page(struct compress_ctx *cc, struct folio *folio);</div><div class='ctx'> int f2fs_write_multi_pages(struct compress_ctx *cc,</div><div class='ctx'> 						int *submitted,</div><div class='ctx'> 						struct writeback_control *wbc,</div><div class='ctx'> 						enum iostat_type io_type);</div><div class='ctx'> int f2fs_is_compressed_cluster(struct inode *inode, pgoff_t index);</div><div class='del'>-void f2fs_update_extent_tree_range_compressed(struct inode *inode,</div><div class='del'>-				pgoff_t fofs, block_t blkaddr, unsigned int llen,</div><div class='del'>-				unsigned int c_len);</div><div class='add'>+bool f2fs_is_sparse_cluster(struct inode *inode, pgoff_t index);</div><div class='add'>+void f2fs_update_read_extent_tree_range_compressed(struct inode *inode,</div><div class='add'>+				pgoff_t fofs, block_t blkaddr,</div><div class='add'>+				unsigned int llen, unsigned int c_len);</div><div class='ctx'> int f2fs_read_multi_pages(struct compress_ctx *cc, struct bio **bio_ret,</div><div class='ctx'> 				unsigned nr_pages, sector_t *last_block_in_bio,</div><div class='del'>-				bool is_readahead, bool for_write);</div><div class='add'>+				struct readahead_control *rac, bool for_write);</div><div class='ctx'> struct decompress_io_ctx *f2fs_alloc_dic(struct compress_ctx *cc);</div><div class='del'>-void f2fs_decompress_end_io(struct decompress_io_ctx *dic, bool failed);</div><div class='del'>-void f2fs_put_page_dic(struct page *page);</div><div class='del'>-unsigned int f2fs_cluster_blocks_are_contiguous(struct dnode_of_data *dn);</div><div class='add'>+void f2fs_decompress_end_io(struct decompress_io_ctx *dic, bool failed,</div><div class='add'>+				bool in_task);</div><div class='add'>+void f2fs_put_folio_dic(struct folio *folio, bool in_task);</div><div class='add'>+unsigned int f2fs_cluster_blocks_are_contiguous(struct dnode_of_data *dn,</div><div class='add'>+						unsigned int ofs_in_node);</div><div class='ctx'> int f2fs_init_compress_ctx(struct compress_ctx *cc);</div><div class='ctx'> void f2fs_destroy_compress_ctx(struct compress_ctx *cc, bool reuse);</div><div class='ctx'> void f2fs_init_compress_info(struct f2fs_sb_info *sbi);</div><div class='hunk'>@@ -4083,10 +4574,9 @@ void f2fs_destroy_page_array_cache(struct f2fs_sb_info *sbi);</div><div class='ctx'> int __init f2fs_init_compress_cache(void);</div><div class='ctx'> void f2fs_destroy_compress_cache(void);</div><div class='ctx'> struct address_space *COMPRESS_MAPPING(struct f2fs_sb_info *sbi);</div><div class='del'>-void f2fs_invalidate_compress_page(struct f2fs_sb_info *sbi, block_t blkaddr);</div><div class='del'>-void f2fs_cache_compressed_page(struct f2fs_sb_info *sbi, struct page *page,</div><div class='del'>-						nid_t ino, block_t blkaddr);</div><div class='del'>-bool f2fs_load_compressed_page(struct f2fs_sb_info *sbi, struct page *page,</div><div class='add'>+void f2fs_invalidate_compress_pages_range(struct f2fs_sb_info *sbi,</div><div class='add'>+					block_t blkaddr, unsigned int len);</div><div class='add'>+bool f2fs_load_compressed_folio(struct f2fs_sb_info *sbi, struct folio *folio,</div><div class='ctx'> 								block_t blkaddr);</div><div class='ctx'> void f2fs_invalidate_compress_pages(struct f2fs_sb_info *sbi, nid_t ino);</div><div class='ctx'> #define inc_compr_inode_stat(inode)					\</div><div class='hunk'>@@ -4102,7 +4592,7 @@ void f2fs_invalidate_compress_pages(struct f2fs_sb_info *sbi, nid_t ino);</div><div class='ctx'> 		sbi-&gt;compr_saved_block += diff;				\</div><div class='ctx'> 	} while (0)</div><div class='ctx'> #else</div><div class='del'>-static inline bool f2fs_is_compressed_page(struct page *page) { return false; }</div><div class='add'>+static inline bool f2fs_is_compressed_page(struct folio *folio) { return false; }</div><div class='ctx'> static inline bool f2fs_is_compress_backend_ready(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	if (!f2fs_compressed_file(inode))</div><div class='hunk'>@@ -4110,24 +4600,27 @@ static inline bool f2fs_is_compress_backend_ready(struct inode *inode)</div><div class='ctx'> 	/* not support compression */</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='del'>-static inline struct page *f2fs_compress_control_page(struct page *page)</div><div class='add'>+static inline bool f2fs_is_compress_level_valid(int alg, int lvl) { return false; }</div><div class='add'>+static inline struct folio *f2fs_compress_control_folio(struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	WARN_ON_ONCE(1);</div><div class='ctx'> 	return ERR_PTR(-EINVAL);</div><div class='ctx'> }</div><div class='del'>-static inline int f2fs_init_compress_mempool(void) { return 0; }</div><div class='add'>+static inline int __init f2fs_init_compress_mempool(void) { return 0; }</div><div class='ctx'> static inline void f2fs_destroy_compress_mempool(void) { }</div><div class='del'>-static inline void f2fs_decompress_cluster(struct decompress_io_ctx *dic) { }</div><div class='del'>-static inline void f2fs_end_read_compressed_page(struct page *page,</div><div class='del'>-						bool failed, block_t blkaddr)</div><div class='add'>+static inline void f2fs_decompress_cluster(struct decompress_io_ctx *dic,</div><div class='add'>+				bool in_task) { }</div><div class='add'>+static inline void f2fs_end_read_compressed_page(struct folio *folio,</div><div class='add'>+				bool failed, block_t blkaddr, bool in_task)</div><div class='ctx'> {</div><div class='ctx'> 	WARN_ON_ONCE(1);</div><div class='ctx'> }</div><div class='del'>-static inline void f2fs_put_page_dic(struct page *page)</div><div class='add'>+static inline void f2fs_put_folio_dic(struct folio *folio, bool in_task)</div><div class='ctx'> {</div><div class='ctx'> 	WARN_ON_ONCE(1);</div><div class='ctx'> }</div><div class='del'>-static inline unsigned int f2fs_cluster_blocks_are_contiguous(struct dnode_of_data *dn) { return 0; }</div><div class='add'>+static inline unsigned int f2fs_cluster_blocks_are_contiguous(</div><div class='add'>+			struct dnode_of_data *dn, unsigned int ofs_in_node) { return 0; }</div><div class='ctx'> static inline bool f2fs_sanity_check_cluster(struct dnode_of_data *dn) { return false; }</div><div class='ctx'> static inline int f2fs_init_compress_inode(struct f2fs_sb_info *sbi) { return 0; }</div><div class='ctx'> static inline void f2fs_destroy_compress_inode(struct f2fs_sb_info *sbi) { }</div><div class='hunk'>@@ -4135,64 +4628,78 @@ static inline int f2fs_init_page_array_cache(struct f2fs_sb_info *sbi) { return</div><div class='ctx'> static inline void f2fs_destroy_page_array_cache(struct f2fs_sb_info *sbi) { }</div><div class='ctx'> static inline int __init f2fs_init_compress_cache(void) { return 0; }</div><div class='ctx'> static inline void f2fs_destroy_compress_cache(void) { }</div><div class='del'>-static inline void f2fs_invalidate_compress_page(struct f2fs_sb_info *sbi,</div><div class='del'>-				block_t blkaddr) { }</div><div class='del'>-static inline void f2fs_cache_compressed_page(struct f2fs_sb_info *sbi,</div><div class='del'>-				struct page *page, nid_t ino, block_t blkaddr) { }</div><div class='del'>-static inline bool f2fs_load_compressed_page(struct f2fs_sb_info *sbi,</div><div class='del'>-				struct page *page, block_t blkaddr) { return false; }</div><div class='add'>+static inline void f2fs_invalidate_compress_pages_range(struct f2fs_sb_info *sbi,</div><div class='add'>+				block_t blkaddr, unsigned int len) { }</div><div class='add'>+static inline bool f2fs_load_compressed_folio(struct f2fs_sb_info *sbi,</div><div class='add'>+		struct folio *folio, block_t blkaddr) { return false; }</div><div class='ctx'> static inline void f2fs_invalidate_compress_pages(struct f2fs_sb_info *sbi,</div><div class='ctx'> 							nid_t ino) { }</div><div class='ctx'> #define inc_compr_inode_stat(inode)		do { } while (0)</div><div class='del'>-static inline void f2fs_update_extent_tree_range_compressed(struct inode *inode,</div><div class='del'>-				pgoff_t fofs, block_t blkaddr, unsigned int llen,</div><div class='del'>-				unsigned int c_len) { }</div><div class='add'>+static inline int f2fs_is_compressed_cluster(</div><div class='add'>+				struct inode *inode,</div><div class='add'>+				pgoff_t index) { return 0; }</div><div class='add'>+static inline bool f2fs_is_sparse_cluster(</div><div class='add'>+				struct inode *inode,</div><div class='add'>+				pgoff_t index) { return true; }</div><div class='add'>+static inline void f2fs_update_read_extent_tree_range_compressed(</div><div class='add'>+				struct inode *inode,</div><div class='add'>+				pgoff_t fofs, block_t blkaddr,</div><div class='add'>+				unsigned int llen, unsigned int c_len) { }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-static inline void set_compress_context(struct inode *inode)</div><div class='add'>+static inline int set_compress_context(struct inode *inode)</div><div class='ctx'> {</div><div class='add'>+#ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='add'>+	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='ctx'> </div><div class='del'>-	F2FS_I(inode)-&gt;i_compress_algorithm =</div><div class='del'>-			F2FS_OPTION(sbi).compress_algorithm;</div><div class='del'>-	F2FS_I(inode)-&gt;i_log_cluster_size =</div><div class='del'>-			F2FS_OPTION(sbi).compress_log_size;</div><div class='del'>-	F2FS_I(inode)-&gt;i_compress_flag =</div><div class='del'>-			F2FS_OPTION(sbi).compress_chksum ?</div><div class='del'>-				1 &lt;&lt; COMPRESS_CHKSUM : 0;</div><div class='del'>-	F2FS_I(inode)-&gt;i_cluster_size =</div><div class='del'>-			1 &lt;&lt; F2FS_I(inode)-&gt;i_log_cluster_size;</div><div class='del'>-	if ((F2FS_I(inode)-&gt;i_compress_algorithm == COMPRESS_LZ4 ||</div><div class='del'>-		F2FS_I(inode)-&gt;i_compress_algorithm == COMPRESS_ZSTD) &amp;&amp;</div><div class='add'>+	fi-&gt;i_compress_algorithm = F2FS_OPTION(sbi).compress_algorithm;</div><div class='add'>+	fi-&gt;i_log_cluster_size = F2FS_OPTION(sbi).compress_log_size;</div><div class='add'>+	fi-&gt;i_compress_flag = F2FS_OPTION(sbi).compress_chksum ?</div><div class='add'>+					BIT(COMPRESS_CHKSUM) : 0;</div><div class='add'>+	fi-&gt;i_cluster_size = BIT(fi-&gt;i_log_cluster_size);</div><div class='add'>+	if ((fi-&gt;i_compress_algorithm == COMPRESS_LZ4 ||</div><div class='add'>+		fi-&gt;i_compress_algorithm == COMPRESS_ZSTD) &amp;&amp;</div><div class='ctx'> 			F2FS_OPTION(sbi).compress_level)</div><div class='del'>-		F2FS_I(inode)-&gt;i_compress_flag |=</div><div class='del'>-				F2FS_OPTION(sbi).compress_level &lt;&lt;</div><div class='del'>-				COMPRESS_LEVEL_OFFSET;</div><div class='del'>-	F2FS_I(inode)-&gt;i_flags |= F2FS_COMPR_FL;</div><div class='add'>+		fi-&gt;i_compress_level = F2FS_OPTION(sbi).compress_level;</div><div class='add'>+	fi-&gt;i_flags |= F2FS_COMPR_FL;</div><div class='ctx'> 	set_inode_flag(inode, FI_COMPRESSED_FILE);</div><div class='ctx'> 	stat_inc_compr_inode(inode);</div><div class='ctx'> 	inc_compr_inode_stat(inode);</div><div class='ctx'> 	f2fs_mark_inode_dirty_sync(inode, true);</div><div class='add'>+	return 0;</div><div class='add'>+#else</div><div class='add'>+	return -EOPNOTSUPP;</div><div class='add'>+#endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline bool f2fs_disable_compressed_file(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='ctx'> </div><div class='del'>-	if (!f2fs_compressed_file(inode))</div><div class='add'>+	f2fs_down_write(&amp;fi-&gt;i_sem);</div><div class='add'>+</div><div class='add'>+	if (!f2fs_compressed_file(inode)) {</div><div class='add'>+		f2fs_up_write(&amp;fi-&gt;i_sem);</div><div class='ctx'> 		return true;</div><div class='del'>-	if (S_ISREG(inode-&gt;i_mode) &amp;&amp; F2FS_HAS_BLOCKS(inode))</div><div class='add'>+	}</div><div class='add'>+	if (f2fs_is_mmap_file(inode) || atomic_read(&amp;fi-&gt;writeback) ||</div><div class='add'>+		(S_ISREG(inode-&gt;i_mode) &amp;&amp; F2FS_HAS_BLOCKS(inode))) {</div><div class='add'>+		f2fs_up_write(&amp;fi-&gt;i_sem);</div><div class='ctx'> 		return false;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	fi-&gt;i_flags &amp;= ~F2FS_COMPR_FL;</div><div class='ctx'> 	stat_dec_compr_inode(inode);</div><div class='ctx'> 	clear_inode_flag(inode, FI_COMPRESSED_FILE);</div><div class='ctx'> 	f2fs_mark_inode_dirty_sync(inode, true);</div><div class='add'>+</div><div class='add'>+	f2fs_up_write(&amp;fi-&gt;i_sem);</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #define F2FS_FEATURE_FUNCS(name, flagname) \</div><div class='del'>-static inline int f2fs_sb_has_##name(struct f2fs_sb_info *sbi) \</div><div class='add'>+static inline bool f2fs_sb_has_##name(struct f2fs_sb_info *sbi) \</div><div class='ctx'> { \</div><div class='ctx'> 	return F2FS_HAS_FEATURE(sbi, F2FS_FEATURE_##flagname); \</div><div class='ctx'> }</div><div class='hunk'>@@ -4211,37 +4718,39 @@ F2FS_FEATURE_FUNCS(sb_chksum, SB_CHKSUM);</div><div class='ctx'> F2FS_FEATURE_FUNCS(casefold, CASEFOLD);</div><div class='ctx'> F2FS_FEATURE_FUNCS(compression, COMPRESSION);</div><div class='ctx'> F2FS_FEATURE_FUNCS(readonly, RO);</div><div class='add'>+F2FS_FEATURE_FUNCS(device_alias, DEVICE_ALIAS);</div><div class='add'>+F2FS_FEATURE_FUNCS(packed_ssa, PACKED_SSA);</div><div class='ctx'> </div><div class='del'>-static inline bool f2fs_may_extent_tree(struct inode *inode)</div><div class='add'>+#ifdef CONFIG_BLK_DEV_ZONED</div><div class='add'>+static inline bool f2fs_zone_is_seq(struct f2fs_sb_info *sbi, int devi,</div><div class='add'>+							unsigned int zone)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='del'>-</div><div class='del'>-	if (!test_opt(sbi, EXTENT_CACHE) ||</div><div class='del'>-			is_inode_flag_set(inode, FI_NO_EXTENT) ||</div><div class='del'>-			(is_inode_flag_set(inode, FI_COMPRESSED_FILE) &amp;&amp;</div><div class='del'>-			 !f2fs_sb_has_readonly(sbi)))</div><div class='del'>-		return false;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * for recovered files during mount do not create extents</div><div class='del'>-	 * if shrinker is not registered.</div><div class='del'>-	 */</div><div class='del'>-	if (list_empty(&amp;sbi-&gt;s_list))</div><div class='del'>-		return false;</div><div class='del'>-</div><div class='del'>-	return S_ISREG(inode-&gt;i_mode);</div><div class='add'>+	return test_bit(zone, FDEV(devi).blkz_seq);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_BLK_DEV_ZONED</div><div class='ctx'> static inline bool f2fs_blkz_is_seq(struct f2fs_sb_info *sbi, int devi,</div><div class='del'>-				    block_t blkaddr)</div><div class='add'>+								block_t blkaddr)</div><div class='ctx'> {</div><div class='del'>-	unsigned int zno = blkaddr &gt;&gt; sbi-&gt;log_blocks_per_blkz;</div><div class='del'>-</div><div class='del'>-	return test_bit(zno, FDEV(devi).blkz_seq);</div><div class='add'>+	return f2fs_zone_is_seq(sbi, devi, blkaddr / sbi-&gt;blocks_per_blkz);</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='add'>+static inline int f2fs_bdev_index(struct f2fs_sb_info *sbi,</div><div class='add'>+				  struct block_device *bdev)</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	if (!f2fs_is_multi_device(sbi))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; sbi-&gt;s_ndevs; i++)</div><div class='add'>+		if (FDEV(i).bdev == bdev)</div><div class='add'>+			return i;</div><div class='add'>+</div><div class='add'>+	WARN_ON(1);</div><div class='add'>+	return -1;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline bool f2fs_hw_should_discard(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	return f2fs_sb_has_blkzoned(sbi);</div><div class='hunk'>@@ -4249,8 +4758,7 @@ static inline bool f2fs_hw_should_discard(struct f2fs_sb_info *sbi)</div><div class='ctx'> </div><div class='ctx'> static inline bool f2fs_bdev_support_discard(struct block_device *bdev)</div><div class='ctx'> {</div><div class='del'>-	return blk_queue_discard(bdev_get_queue(bdev)) ||</div><div class='del'>-	       bdev_is_zoned(bdev);</div><div class='add'>+	return bdev_max_discard_sectors(bdev) || bdev_is_zoned(bdev);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline bool f2fs_hw_support_discard(struct f2fs_sb_info *sbi)</div><div class='hunk'>@@ -4266,6 +4774,18 @@ static inline bool f2fs_hw_support_discard(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline unsigned int f2fs_hw_discard_granularity(struct f2fs_sb_info *sbi)</div><div class='add'>+{</div><div class='add'>+	int i = 1;</div><div class='add'>+	unsigned int discard_granularity = bdev_discard_granularity(sbi-&gt;sb-&gt;s_bdev);</div><div class='add'>+</div><div class='add'>+	if (f2fs_is_multi_device(sbi))</div><div class='add'>+		for (; i &lt; sbi-&gt;s_ndevs &amp;&amp; !bdev_is_zoned(FDEV(i).bdev); i++)</div><div class='add'>+			discard_granularity = max_t(unsigned int, discard_granularity,</div><div class='add'>+						bdev_discard_granularity(FDEV(i).bdev));</div><div class='add'>+	return discard_granularity;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline bool f2fs_realtime_discard_enable(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	return (test_opt(sbi, DISCARD) &amp;&amp; f2fs_hw_support_discard(sbi)) ||</div><div class='hunk'>@@ -4285,16 +4805,53 @@ static inline bool f2fs_hw_is_readonly(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline bool f2fs_dev_is_readonly(struct f2fs_sb_info *sbi)</div><div class='add'>+{</div><div class='add'>+	return f2fs_sb_has_readonly(sbi) || f2fs_hw_is_readonly(sbi);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline bool f2fs_lfs_mode(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	return F2FS_OPTION(sbi).fs_mode == FS_MODE_LFS;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline bool f2fs_is_sequential_zone_area(struct f2fs_sb_info *sbi,</div><div class='add'>+					  block_t blkaddr)</div><div class='add'>+{</div><div class='add'>+	if (f2fs_sb_has_blkzoned(sbi)) {</div><div class='add'>+#ifdef CONFIG_BLK_DEV_ZONED</div><div class='add'>+		int devi = f2fs_target_device_index(sbi, blkaddr);</div><div class='add'>+</div><div class='add'>+		if (!bdev_is_zoned(FDEV(devi).bdev))</div><div class='add'>+			return false;</div><div class='add'>+</div><div class='add'>+		if (f2fs_is_multi_device(sbi)) {</div><div class='add'>+			if (blkaddr &lt; FDEV(devi).start_blk ||</div><div class='add'>+				blkaddr &gt; FDEV(devi).end_blk) {</div><div class='add'>+				f2fs_err(sbi, "Invalid block %x", blkaddr);</div><div class='add'>+				return false;</div><div class='add'>+			}</div><div class='add'>+			blkaddr -= FDEV(devi).start_blk;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		return f2fs_blkz_is_seq(sbi, devi, blkaddr);</div><div class='add'>+#else</div><div class='add'>+		return false;</div><div class='add'>+#endif</div><div class='add'>+	}</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool f2fs_low_mem_mode(struct f2fs_sb_info *sbi)</div><div class='add'>+{</div><div class='add'>+	return F2FS_OPTION(sbi).memory_mode == MEMORY_MODE_LOW;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline bool f2fs_may_compress(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	if (IS_SWAPFILE(inode) || f2fs_is_pinned_file(inode) ||</div><div class='del'>-				f2fs_is_atomic_file(inode) ||</div><div class='del'>-				f2fs_is_volatile_file(inode))</div><div class='add'>+		f2fs_is_atomic_file(inode) || f2fs_has_inline_data(inode) ||</div><div class='add'>+		f2fs_is_mmap_file(inode))</div><div class='ctx'> 		return false;</div><div class='ctx'> 	return S_ISREG(inode-&gt;i_mode) || S_ISDIR(inode-&gt;i_mode);</div><div class='ctx'> }</div><div class='hunk'>@@ -4302,8 +4859,8 @@ static inline bool f2fs_may_compress(struct inode *inode)</div><div class='ctx'> static inline void f2fs_i_compr_blocks_update(struct inode *inode,</div><div class='ctx'> 						u64 blocks, bool add)</div><div class='ctx'> {</div><div class='del'>-	int diff = F2FS_I(inode)-&gt;i_cluster_size - blocks;</div><div class='ctx'> 	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='add'>+	int diff = fi-&gt;i_cluster_size - blocks;</div><div class='ctx'> </div><div class='ctx'> 	/* don't update i_compr_blocks if saved blocks were released */</div><div class='ctx'> 	if (!add &amp;&amp; !atomic_read(&amp;fi-&gt;i_compr_blocks))</div><div class='hunk'>@@ -4319,17 +4876,6 @@ static inline void f2fs_i_compr_blocks_update(struct inode *inode,</div><div class='ctx'> 	f2fs_mark_inode_dirty_sync(inode, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int block_unaligned_IO(struct inode *inode,</div><div class='del'>-				struct kiocb *iocb, struct iov_iter *iter)</div><div class='del'>-{</div><div class='del'>-	unsigned int i_blkbits = READ_ONCE(inode-&gt;i_blkbits);</div><div class='del'>-	unsigned int blocksize_mask = (1 &lt;&lt; i_blkbits) - 1;</div><div class='del'>-	loff_t offset = iocb-&gt;ki_pos;</div><div class='del'>-	unsigned long align = offset | iov_iter_alignment(iter);</div><div class='del'>-</div><div class='del'>-	return align &amp; blocksize_mask;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static inline bool f2fs_allow_multi_device_dio(struct f2fs_sb_info *sbi,</div><div class='ctx'> 								int flag)</div><div class='ctx'> {</div><div class='hunk'>@@ -4340,36 +4886,6 @@ static inline bool f2fs_allow_multi_device_dio(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	return sbi-&gt;aligned_blksize;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline bool f2fs_force_buffered_io(struct inode *inode,</div><div class='del'>-				struct kiocb *iocb, struct iov_iter *iter)</div><div class='del'>-{</div><div class='del'>-	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='del'>-	int rw = iov_iter_rw(iter);</div><div class='del'>-</div><div class='del'>-	if (f2fs_post_read_required(inode))</div><div class='del'>-		return true;</div><div class='del'>-</div><div class='del'>-	/* disallow direct IO if any of devices has unaligned blksize */</div><div class='del'>-	if (f2fs_is_multi_device(sbi) &amp;&amp; !sbi-&gt;aligned_blksize)</div><div class='del'>-		return true;</div><div class='del'>-	/*</div><div class='del'>-	 * for blkzoned device, fallback direct IO to buffered IO, so</div><div class='del'>-	 * all IOs can be serialized by log-structured write.</div><div class='del'>-	 */</div><div class='del'>-	if (f2fs_sb_has_blkzoned(sbi))</div><div class='del'>-		return true;</div><div class='del'>-	if (f2fs_lfs_mode(sbi) &amp;&amp; (rw == WRITE)) {</div><div class='del'>-		if (block_unaligned_IO(inode, iocb, iter))</div><div class='del'>-			return true;</div><div class='del'>-		if (F2FS_IO_ALIGNED(sbi))</div><div class='del'>-			return true;</div><div class='del'>-	}</div><div class='del'>-	if (is_sbi_flag_set(F2FS_I_SB(inode), SBI_CP_DISABLED))</div><div class='del'>-		return true;</div><div class='del'>-</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static inline bool f2fs_need_verity(const struct inode *inode, pgoff_t idx)</div><div class='ctx'> {</div><div class='ctx'> 	return fsverity_active(inode) &amp;&amp;</div><div class='hunk'>@@ -4377,10 +4893,15 @@ static inline bool f2fs_need_verity(const struct inode *inode, pgoff_t idx)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_F2FS_FAULT_INJECTION</div><div class='del'>-extern void f2fs_build_fault_attr(struct f2fs_sb_info *sbi, unsigned int rate,</div><div class='del'>-							unsigned int type);</div><div class='add'>+extern int f2fs_build_fault_attr(struct f2fs_sb_info *sbi, unsigned long rate,</div><div class='add'>+					unsigned long type, enum fault_option fo);</div><div class='ctx'> #else</div><div class='del'>-#define f2fs_build_fault_attr(sbi, rate, type)		do { } while (0)</div><div class='add'>+static inline int f2fs_build_fault_attr(struct f2fs_sb_info *sbi,</div><div class='add'>+					unsigned long rate, unsigned long type,</div><div class='add'>+					enum fault_option fo)</div><div class='add'>+{</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> static inline bool is_journalled_quota(struct f2fs_sb_info *sbi)</div><div class='hunk'>@@ -4401,6 +4922,88 @@ static inline bool f2fs_block_unit_discard(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	return F2FS_OPTION(sbi).discard_unit == DISCARD_UNIT_BLOCK;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline void __f2fs_schedule_timeout(long timeout, bool io)</div><div class='add'>+{</div><div class='add'>+	set_current_state(TASK_UNINTERRUPTIBLE);</div><div class='add'>+	if (io)</div><div class='add'>+		io_schedule_timeout(timeout);</div><div class='add'>+	else</div><div class='add'>+		schedule_timeout(timeout);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define f2fs_io_schedule_timeout(timeout)		\</div><div class='add'>+			__f2fs_schedule_timeout(timeout, true)</div><div class='add'>+#define f2fs_schedule_timeout(timeout)			\</div><div class='add'>+			__f2fs_schedule_timeout(timeout, false)</div><div class='add'>+</div><div class='add'>+static inline void f2fs_io_schedule_timeout_killable(long timeout)</div><div class='add'>+{</div><div class='add'>+	while (timeout) {</div><div class='add'>+		if (fatal_signal_pending(current))</div><div class='add'>+			return;</div><div class='add'>+		set_current_state(TASK_UNINTERRUPTIBLE);</div><div class='add'>+		io_schedule_timeout(DEFAULT_SCHEDULE_TIMEOUT);</div><div class='add'>+		if (timeout &lt;= DEFAULT_SCHEDULE_TIMEOUT)</div><div class='add'>+			return;</div><div class='add'>+		timeout -= DEFAULT_SCHEDULE_TIMEOUT;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void f2fs_handle_page_eio(struct f2fs_sb_info *sbi,</div><div class='add'>+				struct folio *folio, enum page_type type)</div><div class='add'>+{</div><div class='add'>+	pgoff_t ofs = folio-&gt;index;</div><div class='add'>+</div><div class='add'>+	if (unlikely(f2fs_cp_error(sbi)))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (ofs == sbi-&gt;page_eio_ofs[type]) {</div><div class='add'>+		if (sbi-&gt;page_eio_cnt[type]++ == MAX_RETRY_PAGE_EIO)</div><div class='add'>+			set_ckpt_flags(sbi, CP_ERROR_FLAG);</div><div class='add'>+	} else {</div><div class='add'>+		sbi-&gt;page_eio_ofs[type] = ofs;</div><div class='add'>+		sbi-&gt;page_eio_cnt[type] = 0;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool f2fs_is_readonly(struct f2fs_sb_info *sbi)</div><div class='add'>+{</div><div class='add'>+	return f2fs_sb_has_readonly(sbi) || f2fs_readonly(sbi-&gt;sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void f2fs_truncate_meta_inode_pages(struct f2fs_sb_info *sbi,</div><div class='add'>+					block_t blkaddr, unsigned int cnt)</div><div class='add'>+{</div><div class='add'>+	bool need_submit = false;</div><div class='add'>+	int i = 0;</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		struct folio *folio;</div><div class='add'>+</div><div class='add'>+		folio = filemap_get_folio(META_MAPPING(sbi), blkaddr + i);</div><div class='add'>+		if (!IS_ERR(folio)) {</div><div class='add'>+			if (folio_test_writeback(folio))</div><div class='add'>+				need_submit = true;</div><div class='add'>+			f2fs_folio_put(folio, false);</div><div class='add'>+		}</div><div class='add'>+	} while (++i &lt; cnt &amp;&amp; !need_submit);</div><div class='add'>+</div><div class='add'>+	if (need_submit)</div><div class='add'>+		f2fs_submit_merged_write_cond(sbi, sbi-&gt;meta_inode,</div><div class='add'>+							NULL, 0, DATA);</div><div class='add'>+</div><div class='add'>+	truncate_inode_pages_range(META_MAPPING(sbi),</div><div class='add'>+			F2FS_BLK_TO_BYTES((loff_t)blkaddr),</div><div class='add'>+			F2FS_BLK_END_BYTES((loff_t)(blkaddr + cnt - 1)));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void f2fs_invalidate_internal_cache(struct f2fs_sb_info *sbi,</div><div class='add'>+						block_t blkaddr, unsigned int len)</div><div class='add'>+{</div><div class='add'>+	f2fs_truncate_meta_inode_pages(sbi, blkaddr, len);</div><div class='add'>+	f2fs_invalidate_compress_pages_range(sbi, blkaddr, len);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> #define EFSBADCRC	EBADMSG		/* Bad CRC detected */</div><div class='ctx'> #define EFSCORRUPTED	EUCLEAN		/* Filesystem is corrupted */</div><div class='ctx'> </div><div class='head'>diff --git a/fs/f2fs/file.c b/fs/f2fs/file.c<br/>index 92ec2699bc85..d7047ca6b98d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/file.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/file.c</a></div><div class='hunk'>@@ -8,7 +8,6 @@</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/f2fs_fs.h&gt;</div><div class='ctx'> #include &lt;linux/stat.h&gt;</div><div class='del'>-#include &lt;linux/buffer_head.h&gt;</div><div class='ctx'> #include &lt;linux/writeback.h&gt;</div><div class='ctx'> #include &lt;linux/blkdev.h&gt;</div><div class='ctx'> #include &lt;linux/falloc.h&gt;</div><div class='hunk'>@@ -24,6 +23,7 @@</div><div class='ctx'> #include &lt;linux/sched/signal.h&gt;</div><div class='ctx'> #include &lt;linux/fileattr.h&gt;</div><div class='ctx'> #include &lt;linux/fadvise.h&gt;</div><div class='add'>+#include &lt;linux/iomap.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "f2fs.h"</div><div class='ctx'> #include "node.h"</div><div class='hunk'>@@ -35,57 +35,80 @@</div><div class='ctx'> #include &lt;trace/events/f2fs.h&gt;</div><div class='ctx'> #include &lt;uapi/linux/f2fs.h&gt;</div><div class='ctx'> </div><div class='add'>+static void f2fs_zero_post_eof_page(struct inode *inode,</div><div class='add'>+					loff_t new_size, bool lock)</div><div class='add'>+{</div><div class='add'>+	loff_t old_size = i_size_read(inode);</div><div class='add'>+</div><div class='add'>+	if (old_size &gt;= new_size)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (mapping_empty(inode-&gt;i_mapping))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (lock)</div><div class='add'>+		filemap_invalidate_lock(inode-&gt;i_mapping);</div><div class='add'>+	/* zero or drop pages only in range of [old_size, new_size] */</div><div class='add'>+	truncate_inode_pages_range(inode-&gt;i_mapping, old_size, new_size);</div><div class='add'>+	if (lock)</div><div class='add'>+		filemap_invalidate_unlock(inode-&gt;i_mapping);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static vm_fault_t f2fs_filemap_fault(struct vm_fault *vmf)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(vmf-&gt;vma-&gt;vm_file);</div><div class='add'>+	vm_flags_t flags = vmf-&gt;vma-&gt;vm_flags;</div><div class='ctx'> 	vm_fault_t ret;</div><div class='ctx'> </div><div class='ctx'> 	ret = filemap_fault(vmf);</div><div class='del'>-	if (!ret)</div><div class='del'>-		f2fs_update_iostat(F2FS_I_SB(inode), APP_MAPPED_READ_IO,</div><div class='del'>-							F2FS_BLKSIZE);</div><div class='add'>+	if (ret &amp; VM_FAULT_LOCKED)</div><div class='add'>+		f2fs_update_iostat(F2FS_I_SB(inode), inode,</div><div class='add'>+					APP_MAPPED_READ_IO, F2FS_BLKSIZE);</div><div class='ctx'> </div><div class='del'>-	trace_f2fs_filemap_fault(inode, vmf-&gt;pgoff, (unsigned long)ret);</div><div class='add'>+	trace_f2fs_filemap_fault(inode, vmf-&gt;pgoff, flags, ret);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static vm_fault_t f2fs_vm_page_mkwrite(struct vm_fault *vmf)</div><div class='ctx'> {</div><div class='del'>-	struct page *page = vmf-&gt;page;</div><div class='add'>+	struct folio *folio = page_folio(vmf-&gt;page);</div><div class='ctx'> 	struct inode *inode = file_inode(vmf-&gt;vma-&gt;vm_file);</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	struct dnode_of_data dn;</div><div class='del'>-	bool need_alloc = true;</div><div class='add'>+	bool need_alloc = !f2fs_is_pinned_file(inode);</div><div class='ctx'> 	int err = 0;</div><div class='add'>+	vm_fault_t ret;</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(IS_IMMUTABLE(inode)))</div><div class='ctx'> 		return VM_FAULT_SIGBUS;</div><div class='ctx'> </div><div class='del'>-	if (is_inode_flag_set(inode, FI_COMPRESS_RELEASED))</div><div class='del'>-		return VM_FAULT_SIGBUS;</div><div class='add'>+	if (is_inode_flag_set(inode, FI_COMPRESS_RELEASED)) {</div><div class='add'>+		err = -EIO;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(f2fs_cp_error(sbi))) {</div><div class='ctx'> 		err = -EIO;</div><div class='del'>-		goto err;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!f2fs_is_checkpoint_ready(sbi)) {</div><div class='ctx'> 		err = -ENOSPC;</div><div class='del'>-		goto err;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	err = f2fs_convert_inline_inode(inode);</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto err;</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='ctx'> 	if (f2fs_compressed_file(inode)) {</div><div class='del'>-		int ret = f2fs_is_compressed_cluster(inode, page-&gt;index);</div><div class='add'>+		int ret = f2fs_is_compressed_cluster(inode, folio-&gt;index);</div><div class='ctx'> </div><div class='ctx'> 		if (ret &lt; 0) {</div><div class='ctx'> 			err = ret;</div><div class='del'>-			goto err;</div><div class='add'>+			goto out;</div><div class='ctx'> 		} else if (ret) {</div><div class='ctx'> 			need_alloc = false;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -99,38 +122,38 @@ static vm_fault_t f2fs_vm_page_mkwrite(struct vm_fault *vmf)</div><div class='ctx'> </div><div class='ctx'> 	f2fs_bug_on(sbi, f2fs_has_inline_data(inode));</div><div class='ctx'> </div><div class='add'>+	f2fs_zero_post_eof_page(inode, (folio-&gt;index + 1) &lt;&lt; PAGE_SHIFT, true);</div><div class='add'>+</div><div class='ctx'> 	file_update_time(vmf-&gt;vma-&gt;vm_file);</div><div class='ctx'> 	filemap_invalidate_lock_shared(inode-&gt;i_mapping);</div><div class='del'>-	lock_page(page);</div><div class='del'>-	if (unlikely(page-&gt;mapping != inode-&gt;i_mapping ||</div><div class='del'>-			page_offset(page) &gt; i_size_read(inode) ||</div><div class='del'>-			!PageUptodate(page))) {</div><div class='del'>-		unlock_page(page);</div><div class='add'>+</div><div class='add'>+	folio_lock(folio);</div><div class='add'>+	if (unlikely(folio-&gt;mapping != inode-&gt;i_mapping ||</div><div class='add'>+			folio_pos(folio) &gt; i_size_read(inode) ||</div><div class='add'>+			!folio_test_uptodate(folio))) {</div><div class='add'>+		folio_unlock(folio);</div><div class='ctx'> 		err = -EFAULT;</div><div class='ctx'> 		goto out_sem;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	set_new_dnode(&amp;dn, inode, NULL, NULL, 0);</div><div class='ctx'> 	if (need_alloc) {</div><div class='ctx'> 		/* block allocation */</div><div class='del'>-		f2fs_do_map_lock(sbi, F2FS_GET_BLOCK_PRE_AIO, true);</div><div class='del'>-		set_new_dnode(&amp;dn, inode, NULL, NULL, 0);</div><div class='del'>-		err = f2fs_get_block(&amp;dn, page-&gt;index);</div><div class='del'>-		f2fs_do_map_lock(sbi, F2FS_GET_BLOCK_PRE_AIO, false);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='del'>-	if (!need_alloc) {</div><div class='del'>-		set_new_dnode(&amp;dn, inode, NULL, NULL, 0);</div><div class='del'>-		err = f2fs_get_dnode_of_data(&amp;dn, page-&gt;index, LOOKUP_NODE);</div><div class='add'>+		err = f2fs_get_block_locked(&amp;dn, folio-&gt;index);</div><div class='add'>+	} else {</div><div class='add'>+		err = f2fs_get_dnode_of_data(&amp;dn, folio-&gt;index, LOOKUP_NODE);</div><div class='ctx'> 		f2fs_put_dnode(&amp;dn);</div><div class='add'>+		if (f2fs_is_pinned_file(inode) &amp;&amp;</div><div class='add'>+		    !__is_valid_data_blkaddr(dn.data_blkaddr))</div><div class='add'>+			err = -EIO;</div><div class='ctx'> 	}</div><div class='del'>-#endif</div><div class='add'>+</div><div class='ctx'> 	if (err) {</div><div class='del'>-		unlock_page(page);</div><div class='add'>+		folio_unlock(folio);</div><div class='ctx'> 		goto out_sem;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	f2fs_wait_on_page_writeback(page, DATA, false, true);</div><div class='add'>+	f2fs_folio_wait_writeback(folio, DATA, false, true);</div><div class='ctx'> </div><div class='ctx'> 	/* wait for GCed page writeback via META_MAPPING */</div><div class='ctx'> 	f2fs_wait_on_block_writeback(inode, dn.data_blkaddr);</div><div class='hunk'>@@ -138,31 +161,31 @@ static vm_fault_t f2fs_vm_page_mkwrite(struct vm_fault *vmf)</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * check to see if the page is mapped already (no holes)</div><div class='ctx'> 	 */</div><div class='del'>-	if (PageMappedToDisk(page))</div><div class='add'>+	if (folio_test_mappedtodisk(folio))</div><div class='ctx'> 		goto out_sem;</div><div class='ctx'> </div><div class='ctx'> 	/* page is wholly or partially inside EOF */</div><div class='del'>-	if (((loff_t)(page-&gt;index + 1) &lt;&lt; PAGE_SHIFT) &gt;</div><div class='add'>+	if (((loff_t)(folio-&gt;index + 1) &lt;&lt; PAGE_SHIFT) &gt;</div><div class='ctx'> 						i_size_read(inode)) {</div><div class='ctx'> 		loff_t offset;</div><div class='ctx'> </div><div class='ctx'> 		offset = i_size_read(inode) &amp; ~PAGE_MASK;</div><div class='del'>-		zero_user_segment(page, offset, PAGE_SIZE);</div><div class='add'>+		folio_zero_segment(folio, offset, folio_size(folio));</div><div class='ctx'> 	}</div><div class='del'>-	set_page_dirty(page);</div><div class='del'>-	if (!PageUptodate(page))</div><div class='del'>-		SetPageUptodate(page);</div><div class='add'>+	folio_mark_dirty(folio);</div><div class='ctx'> </div><div class='del'>-	f2fs_update_iostat(sbi, APP_MAPPED_IO, F2FS_BLKSIZE);</div><div class='add'>+	f2fs_update_iostat(sbi, inode, APP_MAPPED_IO, F2FS_BLKSIZE);</div><div class='ctx'> 	f2fs_update_time(sbi, REQ_TIME);</div><div class='ctx'> </div><div class='del'>-	trace_f2fs_vm_page_mkwrite(page, DATA);</div><div class='ctx'> out_sem:</div><div class='ctx'> 	filemap_invalidate_unlock_shared(inode-&gt;i_mapping);</div><div class='ctx'> </div><div class='ctx'> 	sb_end_pagefault(inode-&gt;i_sb);</div><div class='del'>-err:</div><div class='del'>-	return block_page_mkwrite_return(err);</div><div class='add'>+out:</div><div class='add'>+	ret = vmf_fs_error(err);</div><div class='add'>+</div><div class='add'>+	trace_f2fs_vm_page_mkwrite(inode, folio-&gt;index, vmf-&gt;vma-&gt;vm_flags, ret);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct vm_operations_struct f2fs_file_vm_ops = {</div><div class='hunk'>@@ -183,7 +206,7 @@ static int get_parent_ino(struct inode *inode, nid_t *pino)</div><div class='ctx'> 	if (!dentry)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	*pino = parent_ino(dentry);</div><div class='add'>+	*pino = d_parent_ino(dentry);</div><div class='ctx'> 	dput(dentry);</div><div class='ctx'> 	return 1;</div><div class='ctx'> }</div><div class='hunk'>@@ -216,18 +239,22 @@ static inline enum cp_reason_type need_do_checkpoint(struct inode *inode)</div><div class='ctx'> 		f2fs_exist_written_data(sbi, F2FS_I(inode)-&gt;i_pino,</div><div class='ctx'> 							TRANS_DIR_INO))</div><div class='ctx'> 		cp_reason = CP_RECOVER_DIR;</div><div class='add'>+	else if (f2fs_exist_written_data(sbi, F2FS_I(inode)-&gt;i_pino,</div><div class='add'>+							XATTR_DIR_INO))</div><div class='add'>+		cp_reason = CP_XATTR_DIR;</div><div class='ctx'> </div><div class='ctx'> 	return cp_reason;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool need_inode_page_update(struct f2fs_sb_info *sbi, nid_t ino)</div><div class='ctx'> {</div><div class='del'>-	struct page *i = find_get_page(NODE_MAPPING(sbi), ino);</div><div class='add'>+	struct folio *i = filemap_get_folio(NODE_MAPPING(sbi), ino);</div><div class='ctx'> 	bool ret = false;</div><div class='ctx'> 	/* But we need to avoid that there are some inode updates */</div><div class='del'>-	if ((i &amp;&amp; PageDirty(i)) || f2fs_need_inode_block_update(sbi, ino))</div><div class='add'>+	if ((!IS_ERR(i) &amp;&amp; folio_test_dirty(i)) ||</div><div class='add'>+	    f2fs_need_inode_block_update(sbi, ino))</div><div class='ctx'> 		ret = true;</div><div class='del'>-	f2fs_put_page(i, 0);</div><div class='add'>+	f2fs_folio_put(i, false);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -236,13 +263,13 @@ static void try_to_fix_pino(struct inode *inode)</div><div class='ctx'> 	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='ctx'> 	nid_t pino;</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;fi-&gt;i_sem);</div><div class='add'>+	f2fs_down_write(&amp;fi-&gt;i_sem);</div><div class='ctx'> 	if (file_wrong_pino(inode) &amp;&amp; inode-&gt;i_nlink == 1 &amp;&amp;</div><div class='ctx'> 			get_parent_ino(inode, &amp;pino)) {</div><div class='ctx'> 		f2fs_i_pino_write(inode, pino);</div><div class='ctx'> 		file_got_pino(inode);</div><div class='ctx'> 	}</div><div class='del'>-	up_write(&amp;fi-&gt;i_sem);</div><div class='add'>+	f2fs_up_write(&amp;fi-&gt;i_sem);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int f2fs_do_sync_file(struct file *file, loff_t start, loff_t end,</div><div class='hunk'>@@ -256,7 +283,6 @@ static int f2fs_do_sync_file(struct file *file, loff_t start, loff_t end,</div><div class='ctx'> 	struct writeback_control wbc = {</div><div class='ctx'> 		.sync_mode = WB_SYNC_ALL,</div><div class='ctx'> 		.nr_to_write = LONG_MAX,</div><div class='del'>-		.for_reclaim = 0,</div><div class='ctx'> 	};</div><div class='ctx'> 	unsigned int seq_id = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -304,7 +330,7 @@ static int f2fs_do_sync_file(struct file *file, loff_t start, loff_t end,</div><div class='ctx'> 		 * for OPU case, during fsync(), node can be persisted before</div><div class='ctx'> 		 * data when lower device doesn't support write barrier, result</div><div class='ctx'> 		 * in data corruption after SPO.</div><div class='del'>-		 * So for strict fsync mode, force to use atomic write sematics</div><div class='add'>+		 * So for strict fsync mode, force to use atomic write semantics</div><div class='ctx'> 		 * to keep write order in between data/node and last node to</div><div class='ctx'> 		 * avoid potential data corruption.</div><div class='ctx'> 		 */</div><div class='hunk'>@@ -317,9 +343,9 @@ go_write:</div><div class='ctx'> 	 * Both of fdatasync() and fsync() are able to be recovered from</div><div class='ctx'> 	 * sudden-power-off.</div><div class='ctx'> 	 */</div><div class='del'>-	down_read(&amp;F2FS_I(inode)-&gt;i_sem);</div><div class='add'>+	f2fs_down_read(&amp;F2FS_I(inode)-&gt;i_sem);</div><div class='ctx'> 	cp_reason = need_do_checkpoint(inode);</div><div class='del'>-	up_read(&amp;F2FS_I(inode)-&gt;i_sem);</div><div class='add'>+	f2fs_up_read(&amp;F2FS_I(inode)-&gt;i_sem);</div><div class='ctx'> </div><div class='ctx'> 	if (cp_reason) {</div><div class='ctx'> 		/* all the dirty node pages should be flushed for POR */</div><div class='hunk'>@@ -391,9 +417,20 @@ int f2fs_sync_file(struct file *file, loff_t start, loff_t end, int datasync)</div><div class='ctx'> 	return f2fs_do_sync_file(file, start, end, datasync, false);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool __found_offset(struct address_space *mapping, block_t blkaddr,</div><div class='del'>-				pgoff_t index, int whence)</div><div class='add'>+static bool __found_offset(struct address_space *mapping,</div><div class='add'>+		struct dnode_of_data *dn, pgoff_t index, int whence)</div><div class='ctx'> {</div><div class='add'>+	block_t blkaddr = f2fs_data_blkaddr(dn);</div><div class='add'>+	struct inode *inode = mapping-&gt;host;</div><div class='add'>+	bool compressed_cluster = false;</div><div class='add'>+</div><div class='add'>+	if (f2fs_compressed_file(inode)) {</div><div class='add'>+		block_t first_blkaddr = data_blkaddr(dn-&gt;inode, dn-&gt;node_folio,</div><div class='add'>+		    ALIGN_DOWN(dn-&gt;ofs_in_node, F2FS_I(inode)-&gt;i_cluster_size));</div><div class='add'>+</div><div class='add'>+		compressed_cluster = first_blkaddr == COMPRESS_ADDR;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	switch (whence) {</div><div class='ctx'> 	case SEEK_DATA:</div><div class='ctx'> 		if (__is_valid_data_blkaddr(blkaddr))</div><div class='hunk'>@@ -401,8 +438,12 @@ static bool __found_offset(struct address_space *mapping, block_t blkaddr,</div><div class='ctx'> 		if (blkaddr == NEW_ADDR &amp;&amp;</div><div class='ctx'> 		    xa_get_mark(&amp;mapping-&gt;i_pages, index, PAGECACHE_TAG_DIRTY))</div><div class='ctx'> 			return true;</div><div class='add'>+		if (compressed_cluster)</div><div class='add'>+			return true;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case SEEK_HOLE:</div><div class='add'>+		if (compressed_cluster)</div><div class='add'>+			return false;</div><div class='ctx'> 		if (blkaddr == NULL_ADDR)</div><div class='ctx'> 			return true;</div><div class='ctx'> 		break;</div><div class='hunk'>@@ -413,14 +454,14 @@ static bool __found_offset(struct address_space *mapping, block_t blkaddr,</div><div class='ctx'> static loff_t f2fs_seek_block(struct file *file, loff_t offset, int whence)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file-&gt;f_mapping-&gt;host;</div><div class='del'>-	loff_t maxbytes = inode-&gt;i_sb-&gt;s_maxbytes;</div><div class='add'>+	loff_t maxbytes = F2FS_BLK_TO_BYTES(max_file_blocks(inode));</div><div class='ctx'> 	struct dnode_of_data dn;</div><div class='ctx'> 	pgoff_t pgofs, end_offset;</div><div class='ctx'> 	loff_t data_ofs = offset;</div><div class='ctx'> 	loff_t isize;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='del'>-	inode_lock(inode);</div><div class='add'>+	inode_lock_shared(inode);</div><div class='ctx'> </div><div class='ctx'> 	isize = i_size_read(inode);</div><div class='ctx'> 	if (offset &gt;= isize)</div><div class='hunk'>@@ -454,7 +495,7 @@ static loff_t f2fs_seek_block(struct file *file, loff_t offset, int whence)</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		end_offset = ADDRS_PER_PAGE(dn.node_page, inode);</div><div class='add'>+		end_offset = ADDRS_PER_PAGE(dn.node_folio, inode);</div><div class='ctx'> </div><div class='ctx'> 		/* find data/hole in dnode block */</div><div class='ctx'> 		for (; dn.ofs_in_node &lt; end_offset;</div><div class='hunk'>@@ -471,7 +512,7 @@ static loff_t f2fs_seek_block(struct file *file, loff_t offset, int whence)</div><div class='ctx'> 				goto fail;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			if (__found_offset(file-&gt;f_mapping, blkaddr,</div><div class='add'>+			if (__found_offset(file-&gt;f_mapping, &amp;dn,</div><div class='ctx'> 							pgofs, whence)) {</div><div class='ctx'> 				f2fs_put_dnode(&amp;dn);</div><div class='ctx'> 				goto found;</div><div class='hunk'>@@ -485,20 +526,17 @@ static loff_t f2fs_seek_block(struct file *file, loff_t offset, int whence)</div><div class='ctx'> found:</div><div class='ctx'> 	if (whence == SEEK_HOLE &amp;&amp; data_ofs &gt; isize)</div><div class='ctx'> 		data_ofs = isize;</div><div class='del'>-	inode_unlock(inode);</div><div class='add'>+	inode_unlock_shared(inode);</div><div class='ctx'> 	return vfs_setpos(file, data_ofs, maxbytes);</div><div class='ctx'> fail:</div><div class='del'>-	inode_unlock(inode);</div><div class='add'>+	inode_unlock_shared(inode);</div><div class='ctx'> 	return -ENXIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static loff_t f2fs_llseek(struct file *file, loff_t offset, int whence)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file-&gt;f_mapping-&gt;host;</div><div class='del'>-	loff_t maxbytes = inode-&gt;i_sb-&gt;s_maxbytes;</div><div class='del'>-</div><div class='del'>-	if (f2fs_compressed_file(inode))</div><div class='del'>-		maxbytes = max_file_blocks(inode) &lt;&lt; F2FS_BLKSIZE_BITS;</div><div class='add'>+	loff_t maxbytes = F2FS_BLK_TO_BYTES(max_file_blocks(inode));</div><div class='ctx'> </div><div class='ctx'> 	switch (whence) {</div><div class='ctx'> 	case SEEK_SET:</div><div class='hunk'>@@ -516,8 +554,9 @@ static loff_t f2fs_llseek(struct file *file, loff_t offset, int whence)</div><div class='ctx'> 	return -EINVAL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_file_mmap(struct file *file, struct vm_area_struct *vma)</div><div class='add'>+static int f2fs_file_mmap_prepare(struct vm_area_desc *desc)</div><div class='ctx'> {</div><div class='add'>+	struct file *file = desc-&gt;file;</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(f2fs_cp_error(F2FS_I_SB(inode))))</div><div class='hunk'>@@ -527,11 +566,54 @@ static int f2fs_file_mmap(struct file *file, struct vm_area_struct *vma)</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='ctx'> 	file_accessed(file);</div><div class='del'>-	vma-&gt;vm_ops = &amp;f2fs_file_vm_ops;</div><div class='add'>+	desc-&gt;vm_ops = &amp;f2fs_file_vm_ops;</div><div class='add'>+</div><div class='add'>+	f2fs_down_read(&amp;F2FS_I(inode)-&gt;i_sem);</div><div class='ctx'> 	set_inode_flag(inode, FI_MMAP_FILE);</div><div class='add'>+	f2fs_up_read(&amp;F2FS_I(inode)-&gt;i_sem);</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int finish_preallocate_blocks(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	int ret = 0;</div><div class='add'>+	bool opened;</div><div class='add'>+</div><div class='add'>+	f2fs_down_read(&amp;F2FS_I(inode)-&gt;i_sem);</div><div class='add'>+	opened = is_inode_flag_set(inode, FI_OPENED_FILE);</div><div class='add'>+	f2fs_up_read(&amp;F2FS_I(inode)-&gt;i_sem);</div><div class='add'>+	if (opened)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	inode_lock(inode);</div><div class='add'>+	if (is_inode_flag_set(inode, FI_OPENED_FILE))</div><div class='add'>+		goto out_unlock;</div><div class='add'>+</div><div class='add'>+	if (!file_should_truncate(inode))</div><div class='add'>+		goto out_update;</div><div class='add'>+</div><div class='add'>+	f2fs_down_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+	filemap_invalidate_lock(inode-&gt;i_mapping);</div><div class='add'>+</div><div class='add'>+	truncate_setsize(inode, i_size_read(inode));</div><div class='add'>+	ret = f2fs_truncate(inode);</div><div class='add'>+</div><div class='add'>+	filemap_invalidate_unlock(inode-&gt;i_mapping);</div><div class='add'>+	f2fs_up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_unlock;</div><div class='add'>+</div><div class='add'>+	file_dont_truncate(inode);</div><div class='add'>+out_update:</div><div class='add'>+	f2fs_down_write(&amp;F2FS_I(inode)-&gt;i_sem);</div><div class='add'>+	set_inode_flag(inode, FI_OPENED_FILE);</div><div class='add'>+	f2fs_up_write(&amp;F2FS_I(inode)-&gt;i_sem);</div><div class='add'>+out_unlock:</div><div class='add'>+	inode_unlock(inode);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int f2fs_file_open(struct inode *inode, struct file *filp)</div><div class='ctx'> {</div><div class='ctx'> 	int err = fscrypt_file_open(inode, filp);</div><div class='hunk'>@@ -547,29 +629,34 @@ static int f2fs_file_open(struct inode *inode, struct file *filp)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='ctx'> 	filp-&gt;f_mode |= FMODE_NOWAIT;</div><div class='add'>+	filp-&gt;f_mode |= FMODE_CAN_ODIRECT;</div><div class='add'>+</div><div class='add'>+	err = dquot_file_open(inode, filp);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='del'>-	return dquot_file_open(inode, filp);</div><div class='add'>+	err = finish_preallocate_blocks(inode);</div><div class='add'>+	if (!err)</div><div class='add'>+		atomic_inc(&amp;F2FS_I(inode)-&gt;open_count);</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_truncate_data_blocks_range(struct dnode_of_data *dn, int count)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(dn-&gt;inode);</div><div class='del'>-	struct f2fs_node *raw_node;</div><div class='ctx'> 	int nr_free = 0, ofs = dn-&gt;ofs_in_node, len = count;</div><div class='ctx'> 	__le32 *addr;</div><div class='del'>-	int base = 0;</div><div class='ctx'> 	bool compressed_cluster = false;</div><div class='ctx'> 	int cluster_index = 0, valid_blocks = 0;</div><div class='ctx'> 	int cluster_size = F2FS_I(dn-&gt;inode)-&gt;i_cluster_size;</div><div class='ctx'> 	bool released = !atomic_read(&amp;F2FS_I(dn-&gt;inode)-&gt;i_compr_blocks);</div><div class='add'>+	block_t blkstart;</div><div class='add'>+	int blklen = 0;</div><div class='ctx'> </div><div class='del'>-	if (IS_INODE(dn-&gt;node_page) &amp;&amp; f2fs_has_extra_attr(dn-&gt;inode))</div><div class='del'>-		base = get_extra_isize(dn-&gt;inode);</div><div class='del'>-</div><div class='del'>-	raw_node = F2FS_NODE(dn-&gt;node_page);</div><div class='del'>-	addr = blkaddr_in_node(raw_node) + base + ofs;</div><div class='add'>+	addr = get_dnode_addr(dn-&gt;inode, dn-&gt;node_folio) + ofs;</div><div class='add'>+	blkstart = le32_to_cpu(*addr);</div><div class='ctx'> </div><div class='del'>-	/* Assumption: truncateion starts with cluster */</div><div class='add'>+	/* Assumption: truncation starts with cluster */</div><div class='ctx'> 	for (; count &gt; 0; count--, addr++, dn-&gt;ofs_in_node++, cluster_index++) {</div><div class='ctx'> 		block_t blkaddr = le32_to_cpu(*addr);</div><div class='ctx'> </div><div class='hunk'>@@ -583,28 +670,44 @@ void f2fs_truncate_data_blocks_range(struct dnode_of_data *dn, int count)</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (blkaddr == NULL_ADDR)</div><div class='del'>-			continue;</div><div class='add'>+			goto next;</div><div class='ctx'> </div><div class='del'>-		dn-&gt;data_blkaddr = NULL_ADDR;</div><div class='del'>-		f2fs_set_data_blkaddr(dn);</div><div class='add'>+		f2fs_set_data_blkaddr(dn, NULL_ADDR);</div><div class='ctx'> </div><div class='ctx'> 		if (__is_valid_data_blkaddr(blkaddr)) {</div><div class='del'>-			if (!f2fs_is_valid_blkaddr(sbi, blkaddr,</div><div class='del'>-					DATA_GENERIC_ENHANCE))</div><div class='del'>-				continue;</div><div class='add'>+			if (time_to_inject(sbi, FAULT_BLKADDR_CONSISTENCE))</div><div class='add'>+				goto next;</div><div class='add'>+			if (!f2fs_is_valid_blkaddr_raw(sbi, blkaddr,</div><div class='add'>+						DATA_GENERIC_ENHANCE))</div><div class='add'>+				goto next;</div><div class='ctx'> 			if (compressed_cluster)</div><div class='ctx'> 				valid_blocks++;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (dn-&gt;ofs_in_node == 0 &amp;&amp; IS_INODE(dn-&gt;node_page))</div><div class='del'>-			clear_inode_flag(dn-&gt;inode, FI_FIRST_BLOCK_WRITTEN);</div><div class='del'>-</div><div class='del'>-		f2fs_invalidate_blocks(sbi, blkaddr);</div><div class='add'>+		if (blkstart + blklen == blkaddr) {</div><div class='add'>+			blklen++;</div><div class='add'>+		} else {</div><div class='add'>+			f2fs_invalidate_blocks(sbi, blkstart, blklen);</div><div class='add'>+			blkstart = blkaddr;</div><div class='add'>+			blklen = 1;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		if (!released || blkaddr != COMPRESS_ADDR)</div><div class='ctx'> 			nr_free++;</div><div class='add'>+</div><div class='add'>+		continue;</div><div class='add'>+</div><div class='add'>+next:</div><div class='add'>+		if (blklen)</div><div class='add'>+			f2fs_invalidate_blocks(sbi, blkstart, blklen);</div><div class='add'>+</div><div class='add'>+		blkstart = le32_to_cpu(*(addr + 1));</div><div class='add'>+		blklen = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (blklen)</div><div class='add'>+		f2fs_invalidate_blocks(sbi, blkstart, blklen);</div><div class='add'>+</div><div class='ctx'> 	if (compressed_cluster)</div><div class='ctx'> 		f2fs_i_compr_blocks_update(dn-&gt;inode, valid_blocks, false);</div><div class='ctx'> </div><div class='hunk'>@@ -614,9 +717,10 @@ void f2fs_truncate_data_blocks_range(struct dnode_of_data *dn, int count)</div><div class='ctx'> 		 * once we invalidate valid blkaddr in range [ofs, ofs + count],</div><div class='ctx'> 		 * we will invalidate all blkaddr in the whole range.</div><div class='ctx'> 		 */</div><div class='del'>-		fofs = f2fs_start_bidx_of_node(ofs_of_node(dn-&gt;node_page),</div><div class='add'>+		fofs = f2fs_start_bidx_of_node(ofs_of_node(dn-&gt;node_folio),</div><div class='ctx'> 							dn-&gt;inode) + ofs;</div><div class='del'>-		f2fs_update_extent_cache_range(dn, fofs, 0, len);</div><div class='add'>+		f2fs_update_read_extent_cache_range(dn, fofs, 0, len);</div><div class='add'>+		f2fs_update_age_extent_cache_range(dn, fofs, len);</div><div class='ctx'> 		dec_valid_block_count(sbi, dn-&gt;inode, nr_free);</div><div class='ctx'> 	}</div><div class='ctx'> 	dn-&gt;ofs_in_node = ofs;</div><div class='hunk'>@@ -626,42 +730,39 @@ void f2fs_truncate_data_blocks_range(struct dnode_of_data *dn, int count)</div><div class='ctx'> 					 dn-&gt;ofs_in_node, nr_free);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_truncate_data_blocks(struct dnode_of_data *dn)</div><div class='del'>-{</div><div class='del'>-	f2fs_truncate_data_blocks_range(dn, ADDRS_PER_BLOCK(dn-&gt;inode));</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int truncate_partial_data_page(struct inode *inode, u64 from,</div><div class='ctx'> 								bool cache_only)</div><div class='ctx'> {</div><div class='ctx'> 	loff_t offset = from &amp; (PAGE_SIZE - 1);</div><div class='ctx'> 	pgoff_t index = from &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> 	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> </div><div class='ctx'> 	if (!offset &amp;&amp; !cache_only)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	if (cache_only) {</div><div class='del'>-		page = find_lock_page(mapping, index);</div><div class='del'>-		if (page &amp;&amp; PageUptodate(page))</div><div class='add'>+		folio = filemap_lock_folio(mapping, index);</div><div class='add'>+		if (IS_ERR(folio))</div><div class='add'>+		       return 0;</div><div class='add'>+		if (folio_test_uptodate(folio))</div><div class='ctx'> 			goto truncate_out;</div><div class='del'>-		f2fs_put_page(page, 1);</div><div class='add'>+		f2fs_folio_put(folio, true);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	page = f2fs_get_lock_data_page(inode, index, true);</div><div class='del'>-	if (IS_ERR(page))</div><div class='del'>-		return PTR_ERR(page) == -ENOENT ? 0 : PTR_ERR(page);</div><div class='add'>+	folio = f2fs_get_lock_data_folio(inode, index, true);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio) == -ENOENT ? 0 : PTR_ERR(folio);</div><div class='ctx'> truncate_out:</div><div class='del'>-	f2fs_wait_on_page_writeback(page, DATA, true, true);</div><div class='del'>-	zero_user(page, offset, PAGE_SIZE - offset);</div><div class='add'>+	f2fs_folio_wait_writeback(folio, DATA, true, true);</div><div class='add'>+	folio_zero_segment(folio, offset, folio_size(folio));</div><div class='ctx'> </div><div class='ctx'> 	/* An encrypted inode should have a key and truncate the last page. */</div><div class='ctx'> 	f2fs_bug_on(F2FS_I_SB(inode), cache_only &amp;&amp; IS_ENCRYPTED(inode));</div><div class='ctx'> 	if (!cache_only)</div><div class='del'>-		set_page_dirty(page);</div><div class='del'>-	f2fs_put_page(page, 1);</div><div class='add'>+		folio_mark_dirty(folio);</div><div class='add'>+	f2fs_folio_put(folio, true);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -671,11 +772,16 @@ int f2fs_do_truncate_blocks(struct inode *inode, u64 from, bool lock)</div><div class='ctx'> 	struct dnode_of_data dn;</div><div class='ctx'> 	pgoff_t free_from;</div><div class='ctx'> 	int count = 0, err = 0;</div><div class='del'>-	struct page *ipage;</div><div class='add'>+	struct folio *ifolio;</div><div class='ctx'> 	bool truncate_page = false;</div><div class='ctx'> </div><div class='ctx'> 	trace_f2fs_truncate_blocks_enter(inode, from);</div><div class='ctx'> </div><div class='add'>+	if (IS_DEVICE_ALIASING(inode) &amp;&amp; from) {</div><div class='add'>+		err = -EINVAL;</div><div class='add'>+		goto out_err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	free_from = (pgoff_t)F2FS_BLK_ALIGN(from);</div><div class='ctx'> </div><div class='ctx'> 	if (free_from &gt;= max_file_blocks(inode))</div><div class='hunk'>@@ -684,20 +790,33 @@ int f2fs_do_truncate_blocks(struct inode *inode, u64 from, bool lock)</div><div class='ctx'> 	if (lock)</div><div class='ctx'> 		f2fs_lock_op(sbi);</div><div class='ctx'> </div><div class='del'>-	ipage = f2fs_get_node_page(sbi, inode-&gt;i_ino);</div><div class='del'>-	if (IS_ERR(ipage)) {</div><div class='del'>-		err = PTR_ERR(ipage);</div><div class='add'>+	ifolio = f2fs_get_inode_folio(sbi, inode-&gt;i_ino);</div><div class='add'>+	if (IS_ERR(ifolio)) {</div><div class='add'>+		err = PTR_ERR(ifolio);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (IS_DEVICE_ALIASING(inode)) {</div><div class='add'>+		struct extent_tree *et = F2FS_I(inode)-&gt;extent_tree[EX_READ];</div><div class='add'>+		struct extent_info ei = et-&gt;largest;</div><div class='add'>+</div><div class='add'>+		f2fs_invalidate_blocks(sbi, ei.blk, ei.len);</div><div class='add'>+</div><div class='add'>+		dec_valid_block_count(sbi, inode, ei.len);</div><div class='add'>+		f2fs_update_time(sbi, REQ_TIME);</div><div class='add'>+</div><div class='add'>+		f2fs_folio_put(ifolio, true);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (f2fs_has_inline_data(inode)) {</div><div class='del'>-		f2fs_truncate_inline_inode(inode, ipage, from);</div><div class='del'>-		f2fs_put_page(ipage, 1);</div><div class='add'>+		f2fs_truncate_inline_inode(inode, ifolio, from);</div><div class='add'>+		f2fs_folio_put(ifolio, true);</div><div class='ctx'> 		truncate_page = true;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	set_new_dnode(&amp;dn, inode, ipage, NULL, 0);</div><div class='add'>+	set_new_dnode(&amp;dn, inode, ifolio, NULL, 0);</div><div class='ctx'> 	err = f2fs_get_dnode_of_data(&amp;dn, free_from, LOOKUP_NODE_RA);</div><div class='ctx'> 	if (err) {</div><div class='ctx'> 		if (err == -ENOENT)</div><div class='hunk'>@@ -705,12 +824,12 @@ int f2fs_do_truncate_blocks(struct inode *inode, u64 from, bool lock)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	count = ADDRS_PER_PAGE(dn.node_page, inode);</div><div class='add'>+	count = ADDRS_PER_PAGE(dn.node_folio, inode);</div><div class='ctx'> </div><div class='ctx'> 	count -= dn.ofs_in_node;</div><div class='ctx'> 	f2fs_bug_on(sbi, count &lt; 0);</div><div class='ctx'> </div><div class='del'>-	if (dn.ofs_in_node || IS_INODE(dn.node_page)) {</div><div class='add'>+	if (dn.ofs_in_node || IS_INODE(dn.node_folio)) {</div><div class='ctx'> 		f2fs_truncate_data_blocks_range(&amp;dn, count);</div><div class='ctx'> 		free_from += count;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -725,7 +844,7 @@ free_partial:</div><div class='ctx'> 	/* lastly zero out the first data page */</div><div class='ctx'> 	if (!err)</div><div class='ctx'> 		err = truncate_partial_data_page(inode, from, truncate_page);</div><div class='del'>-</div><div class='add'>+out_err:</div><div class='ctx'> 	trace_f2fs_truncate_blocks_exit(inode, err);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='hunk'>@@ -781,10 +900,8 @@ int f2fs_truncate(struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> 	trace_f2fs_truncate(inode);</div><div class='ctx'> </div><div class='del'>-	if (time_to_inject(F2FS_I_SB(inode), FAULT_TRUNCATE)) {</div><div class='del'>-		f2fs_show_injection_info(F2FS_I_SB(inode), FAULT_TRUNCATE);</div><div class='add'>+	if (time_to_inject(F2FS_I_SB(inode), FAULT_TRUNCATE))</div><div class='ctx'> 		return -EIO;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	err = f2fs_dquot_initialize(inode);</div><div class='ctx'> 	if (err)</div><div class='hunk'>@@ -793,25 +910,66 @@ int f2fs_truncate(struct inode *inode)</div><div class='ctx'> 	/* we should check inline_data size */</div><div class='ctx'> 	if (!f2fs_may_inline_data(inode)) {</div><div class='ctx'> 		err = f2fs_convert_inline_inode(inode);</div><div class='del'>-		if (err)</div><div class='add'>+		if (err) {</div><div class='add'>+			/*</div><div class='add'>+			 * Always truncate page #0 to avoid page cache</div><div class='add'>+			 * leak in evict() path.</div><div class='add'>+			 */</div><div class='add'>+			truncate_inode_pages_range(inode-&gt;i_mapping,</div><div class='add'>+					F2FS_BLK_TO_BYTES(0),</div><div class='add'>+					F2FS_BLK_END_BYTES(0));</div><div class='ctx'> 			return err;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	err = f2fs_truncate_blocks(inode, i_size_read(inode), true);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_mtime_to_ts(inode, inode_set_ctime_current(inode));</div><div class='ctx'> 	f2fs_mark_inode_dirty_sync(inode, false);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int f2fs_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='add'>+static bool f2fs_force_buffered_io(struct inode *inode, int rw)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='add'>+</div><div class='add'>+	if (!fscrypt_dio_supported(inode))</div><div class='add'>+		return true;</div><div class='add'>+	if (fsverity_active(inode))</div><div class='add'>+		return true;</div><div class='add'>+	if (f2fs_compressed_file(inode))</div><div class='add'>+		return true;</div><div class='add'>+	/*</div><div class='add'>+	 * only force direct read to use buffered IO, for direct write,</div><div class='add'>+	 * it expects inline data conversion before committing IO.</div><div class='add'>+	 */</div><div class='add'>+	if (f2fs_has_inline_data(inode) &amp;&amp; rw == READ)</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	/* disallow direct IO if any of devices has unaligned blksize */</div><div class='add'>+	if (f2fs_is_multi_device(sbi) &amp;&amp; !sbi-&gt;aligned_blksize)</div><div class='add'>+		return true;</div><div class='add'>+	/*</div><div class='add'>+	 * for blkzoned device, fallback direct IO to buffered IO, so</div><div class='add'>+	 * all IOs can be serialized by log-structured write.</div><div class='add'>+	 */</div><div class='add'>+	if (f2fs_sb_has_blkzoned(sbi) &amp;&amp; (rw == WRITE) &amp;&amp;</div><div class='add'>+	    !f2fs_is_pinned_file(inode))</div><div class='add'>+		return true;</div><div class='add'>+	if (is_sbi_flag_set(sbi, SBI_CP_DISABLED))</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int f2fs_getattr(struct mnt_idmap *idmap, const struct path *path,</div><div class='ctx'> 		 struct kstat *stat, u32 request_mask, unsigned int query_flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(path-&gt;dentry);</div><div class='ctx'> 	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='del'>-	struct f2fs_inode *ri;</div><div class='add'>+	struct f2fs_inode *ri = NULL;</div><div class='ctx'> 	unsigned int flags;</div><div class='ctx'> </div><div class='ctx'> 	if (f2fs_has_extra_attr(inode) &amp;&amp;</div><div class='hunk'>@@ -822,6 +980,24 @@ int f2fs_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='ctx'> 		stat-&gt;btime.tv_nsec = fi-&gt;i_crtime.tv_nsec;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Return the DIO alignment restrictions if requested.  We only return</div><div class='add'>+	 * this information when requested, since on encrypted files it might</div><div class='add'>+	 * take a fair bit of work to get if the file wasn't opened recently.</div><div class='add'>+	 *</div><div class='add'>+	 * f2fs sometimes supports DIO reads but not DIO writes.  STATX_DIOALIGN</div><div class='add'>+	 * cannot represent that, so in that case we report no DIO support.</div><div class='add'>+	 */</div><div class='add'>+	if ((request_mask &amp; STATX_DIOALIGN) &amp;&amp; S_ISREG(inode-&gt;i_mode)) {</div><div class='add'>+		unsigned int bsize = i_blocksize(inode);</div><div class='add'>+</div><div class='add'>+		stat-&gt;result_mask |= STATX_DIOALIGN;</div><div class='add'>+		if (!f2fs_force_buffered_io(inode, WRITE)) {</div><div class='add'>+			stat-&gt;dio_mem_align = bsize;</div><div class='add'>+			stat-&gt;dio_offset_align = bsize;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	flags = fi-&gt;i_flags;</div><div class='ctx'> 	if (flags &amp; F2FS_COMPR_FL)</div><div class='ctx'> 		stat-&gt;attributes |= STATX_ATTR_COMPRESSED;</div><div class='hunk'>@@ -843,7 +1019,7 @@ int f2fs_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='ctx'> 				  STATX_ATTR_NODUMP |</div><div class='ctx'> 				  STATX_ATTR_VERITY);</div><div class='ctx'> </div><div class='del'>-	generic_fillattr(&amp;init_user_ns, inode, stat);</div><div class='add'>+	generic_fillattr(idmap, request_mask, inode, stat);</div><div class='ctx'> </div><div class='ctx'> 	/* we need to show initial sectors used for inline_data/dentries */</div><div class='ctx'> 	if ((S_ISREG(inode-&gt;i_mode) &amp;&amp; f2fs_has_inline_data(inode)) ||</div><div class='hunk'>@@ -854,26 +1030,23 @@ int f2fs_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_F2FS_FS_POSIX_ACL</div><div class='del'>-static void __setattr_copy(struct user_namespace *mnt_userns,</div><div class='add'>+static void __setattr_copy(struct mnt_idmap *idmap,</div><div class='ctx'> 			   struct inode *inode, const struct iattr *attr)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int ia_valid = attr-&gt;ia_valid;</div><div class='ctx'> </div><div class='del'>-	if (ia_valid &amp; ATTR_UID)</div><div class='del'>-		inode-&gt;i_uid = attr-&gt;ia_uid;</div><div class='del'>-	if (ia_valid &amp; ATTR_GID)</div><div class='del'>-		inode-&gt;i_gid = attr-&gt;ia_gid;</div><div class='add'>+	i_uid_update(idmap, attr, inode);</div><div class='add'>+	i_gid_update(idmap, attr, inode);</div><div class='ctx'> 	if (ia_valid &amp; ATTR_ATIME)</div><div class='del'>-		inode-&gt;i_atime = attr-&gt;ia_atime;</div><div class='add'>+		inode_set_atime_to_ts(inode, attr-&gt;ia_atime);</div><div class='ctx'> 	if (ia_valid &amp; ATTR_MTIME)</div><div class='del'>-		inode-&gt;i_mtime = attr-&gt;ia_mtime;</div><div class='add'>+		inode_set_mtime_to_ts(inode, attr-&gt;ia_mtime);</div><div class='ctx'> 	if (ia_valid &amp; ATTR_CTIME)</div><div class='del'>-		inode-&gt;i_ctime = attr-&gt;ia_ctime;</div><div class='add'>+		inode_set_ctime_to_ts(inode, attr-&gt;ia_ctime);</div><div class='ctx'> 	if (ia_valid &amp; ATTR_MODE) {</div><div class='ctx'> 		umode_t mode = attr-&gt;ia_mode;</div><div class='del'>-		kgid_t kgid = i_gid_into_mnt(mnt_userns, inode);</div><div class='ctx'> </div><div class='del'>-		if (!in_group_p(kgid) &amp;&amp; !capable_wrt_inode_uidgid(mnt_userns, inode, CAP_FSETID))</div><div class='add'>+		if (!in_group_or_capable(idmap, inode, i_gid_into_vfsgid(idmap, inode)))</div><div class='ctx'> 			mode &amp;= ~S_ISGID;</div><div class='ctx'> 		set_acl_inode(inode, mode);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -882,28 +1055,18 @@ static void __setattr_copy(struct user_namespace *mnt_userns,</div><div class='ctx'> #define __setattr_copy setattr_copy</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-int f2fs_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='add'>+int f2fs_setattr(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		 struct iattr *attr)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='add'>+	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(f2fs_cp_error(F2FS_I_SB(inode))))</div><div class='add'>+	if (unlikely(f2fs_cp_error(sbi)))</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(IS_IMMUTABLE(inode)))</div><div class='del'>-		return -EPERM;</div><div class='del'>-</div><div class='del'>-	if (unlikely(IS_APPEND(inode) &amp;&amp;</div><div class='del'>-			(attr-&gt;ia_valid &amp; (ATTR_MODE | ATTR_UID |</div><div class='del'>-				  ATTR_GID | ATTR_TIMES_SET))))</div><div class='del'>-		return -EPERM;</div><div class='del'>-</div><div class='del'>-	if ((attr-&gt;ia_valid &amp; ATTR_SIZE) &amp;&amp;</div><div class='del'>-		!f2fs_is_compress_backend_ready(inode))</div><div class='del'>-		return -EOPNOTSUPP;</div><div class='del'>-</div><div class='del'>-	err = setattr_prepare(&amp;init_user_ns, dentry, attr);</div><div class='add'>+	err = setattr_prepare(idmap, dentry, attr);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='hunk'>@@ -915,33 +1078,57 @@ int f2fs_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	if (is_quota_modification(inode, attr)) {</div><div class='add'>+	if (unlikely(IS_IMMUTABLE(inode)))</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	if (unlikely(IS_APPEND(inode) &amp;&amp;</div><div class='add'>+			(attr-&gt;ia_valid &amp; (ATTR_MODE | ATTR_UID |</div><div class='add'>+				  ATTR_GID | ATTR_TIMES_SET))))</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	if ((attr-&gt;ia_valid &amp; ATTR_SIZE)) {</div><div class='add'>+		if (!f2fs_is_compress_backend_ready(inode) ||</div><div class='add'>+				IS_DEVICE_ALIASING(inode))</div><div class='add'>+			return -EOPNOTSUPP;</div><div class='add'>+		if (is_inode_flag_set(inode, FI_COMPRESS_RELEASED) &amp;&amp;</div><div class='add'>+			!IS_ALIGNED(attr-&gt;ia_size,</div><div class='add'>+			F2FS_BLK_TO_BYTES(fi-&gt;i_cluster_size)))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		/*</div><div class='add'>+		 * To prevent scattered pin block generation, we don't allow</div><div class='add'>+		 * smaller/equal size unaligned truncation for pinned file.</div><div class='add'>+		 * We only support overwrite IO to pinned file, so don't</div><div class='add'>+		 * care about larger size truncation.</div><div class='add'>+		 */</div><div class='add'>+		if (f2fs_is_pinned_file(inode) &amp;&amp;</div><div class='add'>+			attr-&gt;ia_size &lt;= i_size_read(inode) &amp;&amp;</div><div class='add'>+			!IS_ALIGNED(attr-&gt;ia_size,</div><div class='add'>+			F2FS_BLK_TO_BYTES(CAP_BLKS_PER_SEC(sbi))))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (is_quota_modification(idmap, inode, attr)) {</div><div class='ctx'> 		err = f2fs_dquot_initialize(inode);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			return err;</div><div class='ctx'> 	}</div><div class='del'>-	if ((attr-&gt;ia_valid &amp; ATTR_UID &amp;&amp;</div><div class='del'>-		!uid_eq(attr-&gt;ia_uid, inode-&gt;i_uid)) ||</div><div class='del'>-		(attr-&gt;ia_valid &amp; ATTR_GID &amp;&amp;</div><div class='del'>-		!gid_eq(attr-&gt;ia_gid, inode-&gt;i_gid))) {</div><div class='del'>-		f2fs_lock_op(F2FS_I_SB(inode));</div><div class='del'>-		err = dquot_transfer(inode, attr);</div><div class='add'>+	if (i_uid_needs_update(idmap, attr, inode) ||</div><div class='add'>+	    i_gid_needs_update(idmap, attr, inode)) {</div><div class='add'>+		f2fs_lock_op(sbi);</div><div class='add'>+		err = dquot_transfer(idmap, inode, attr);</div><div class='ctx'> 		if (err) {</div><div class='del'>-			set_sbi_flag(F2FS_I_SB(inode),</div><div class='del'>-					SBI_QUOTA_NEED_REPAIR);</div><div class='del'>-			f2fs_unlock_op(F2FS_I_SB(inode));</div><div class='add'>+			set_sbi_flag(sbi, SBI_QUOTA_NEED_REPAIR);</div><div class='add'>+			f2fs_unlock_op(sbi);</div><div class='ctx'> 			return err;</div><div class='ctx'> 		}</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * update uid/gid under lock_op(), so that dquot and inode can</div><div class='ctx'> 		 * be updated atomically.</div><div class='ctx'> 		 */</div><div class='del'>-		if (attr-&gt;ia_valid &amp; ATTR_UID)</div><div class='del'>-			inode-&gt;i_uid = attr-&gt;ia_uid;</div><div class='del'>-		if (attr-&gt;ia_valid &amp; ATTR_GID)</div><div class='del'>-			inode-&gt;i_gid = attr-&gt;ia_gid;</div><div class='add'>+		i_uid_update(idmap, attr, inode);</div><div class='add'>+		i_gid_update(idmap, attr, inode);</div><div class='ctx'> 		f2fs_mark_inode_dirty_sync(inode, true);</div><div class='del'>-		f2fs_unlock_op(F2FS_I_SB(inode));</div><div class='add'>+		f2fs_unlock_op(sbi);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (attr-&gt;ia_valid &amp; ATTR_SIZE) {</div><div class='hunk'>@@ -957,9 +1144,18 @@ int f2fs_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 				return err;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		down_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+		/*</div><div class='add'>+		 * wait for inflight dio, blocks should be removed after</div><div class='add'>+		 * IO completion.</div><div class='add'>+		 */</div><div class='add'>+		if (attr-&gt;ia_size &lt; old_size)</div><div class='add'>+			inode_dio_wait(inode);</div><div class='add'>+</div><div class='add'>+		f2fs_down_write(&amp;fi-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> 		filemap_invalidate_lock(inode-&gt;i_mapping);</div><div class='ctx'> </div><div class='add'>+		if (attr-&gt;ia_size &gt; old_size)</div><div class='add'>+			f2fs_zero_post_eof_page(inode, attr-&gt;ia_size, false);</div><div class='ctx'> 		truncate_setsize(inode, attr-&gt;ia_size);</div><div class='ctx'> </div><div class='ctx'> 		if (attr-&gt;ia_size &lt;= old_size)</div><div class='hunk'>@@ -969,24 +1165,24 @@ int f2fs_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 		 * larger than i_size.</div><div class='ctx'> 		 */</div><div class='ctx'> 		filemap_invalidate_unlock(inode-&gt;i_mapping);</div><div class='del'>-		up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+		f2fs_up_write(&amp;fi-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			return err;</div><div class='ctx'> </div><div class='del'>-		spin_lock(&amp;F2FS_I(inode)-&gt;i_size_lock);</div><div class='del'>-		inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='del'>-		F2FS_I(inode)-&gt;last_disk_size = i_size_read(inode);</div><div class='del'>-		spin_unlock(&amp;F2FS_I(inode)-&gt;i_size_lock);</div><div class='add'>+		spin_lock(&amp;fi-&gt;i_size_lock);</div><div class='add'>+		inode_set_mtime_to_ts(inode, inode_set_ctime_current(inode));</div><div class='add'>+		fi-&gt;last_disk_size = i_size_read(inode);</div><div class='add'>+		spin_unlock(&amp;fi-&gt;i_size_lock);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	__setattr_copy(&amp;init_user_ns, inode, attr);</div><div class='add'>+	__setattr_copy(idmap, inode, attr);</div><div class='ctx'> </div><div class='ctx'> 	if (attr-&gt;ia_valid &amp; ATTR_MODE) {</div><div class='del'>-		err = posix_acl_chmod(&amp;init_user_ns, inode, f2fs_get_inode_mode(inode));</div><div class='add'>+		err = posix_acl_chmod(idmap, dentry, f2fs_get_inode_mode(inode));</div><div class='ctx'> </div><div class='ctx'> 		if (is_inode_flag_set(inode, FI_ACL_MODE)) {</div><div class='ctx'> 			if (!err)</div><div class='del'>-				inode-&gt;i_mode = F2FS_I(inode)-&gt;i_acl_mode;</div><div class='add'>+				inode-&gt;i_mode = fi-&gt;i_acl_mode;</div><div class='ctx'> 			clear_inode_flag(inode, FI_ACL_MODE);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -995,7 +1191,7 @@ int f2fs_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 	f2fs_mark_inode_dirty_sync(inode, true);</div><div class='ctx'> </div><div class='ctx'> 	/* inode change will produce dirty node pages flushed by checkpoint */</div><div class='del'>-	f2fs_balance_fs(F2FS_I_SB(inode), true);</div><div class='add'>+	f2fs_balance_fs(sbi, true);</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='hunk'>@@ -1003,7 +1199,7 @@ int f2fs_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> const struct inode_operations f2fs_file_inode_operations = {</div><div class='ctx'> 	.getattr	= f2fs_getattr,</div><div class='ctx'> 	.setattr	= f2fs_setattr,</div><div class='del'>-	.get_acl	= f2fs_get_acl,</div><div class='add'>+	.get_inode_acl	= f2fs_get_acl,</div><div class='ctx'> 	.set_acl	= f2fs_set_acl,</div><div class='ctx'> 	.listxattr	= f2fs_listxattr,</div><div class='ctx'> 	.fiemap		= f2fs_fiemap,</div><div class='hunk'>@@ -1015,7 +1211,7 @@ static int fill_zero(struct inode *inode, pgoff_t index,</div><div class='ctx'> 					loff_t start, loff_t len)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> </div><div class='ctx'> 	if (!len)</div><div class='ctx'> 		return 0;</div><div class='hunk'>@@ -1023,16 +1219,16 @@ static int fill_zero(struct inode *inode, pgoff_t index,</div><div class='ctx'> 	f2fs_balance_fs(sbi, true);</div><div class='ctx'> </div><div class='ctx'> 	f2fs_lock_op(sbi);</div><div class='del'>-	page = f2fs_get_new_data_page(inode, NULL, index, false);</div><div class='add'>+	folio = f2fs_get_new_data_folio(inode, NULL, index, false);</div><div class='ctx'> 	f2fs_unlock_op(sbi);</div><div class='ctx'> </div><div class='del'>-	if (IS_ERR(page))</div><div class='del'>-		return PTR_ERR(page);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio);</div><div class='ctx'> </div><div class='del'>-	f2fs_wait_on_page_writeback(page, DATA, true, true);</div><div class='del'>-	zero_user(page, start, len);</div><div class='del'>-	set_page_dirty(page);</div><div class='del'>-	f2fs_put_page(page, 1);</div><div class='add'>+	f2fs_folio_wait_writeback(folio, DATA, true, true);</div><div class='add'>+	folio_zero_range(folio, start, len);</div><div class='add'>+	folio_mark_dirty(folio);</div><div class='add'>+	f2fs_folio_put(folio, true);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1055,7 +1251,7 @@ int f2fs_truncate_hole(struct inode *inode, pgoff_t pg_start, pgoff_t pg_end)</div><div class='ctx'> 			return err;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		end_offset = ADDRS_PER_PAGE(dn.node_page, inode);</div><div class='add'>+		end_offset = ADDRS_PER_PAGE(dn.node_folio, inode);</div><div class='ctx'> 		count = min(end_offset - dn.ofs_in_node, pg_end - pg_start);</div><div class='ctx'> </div><div class='ctx'> 		f2fs_bug_on(F2FS_I_SB(inode), count == 0 || count &gt; end_offset);</div><div class='hunk'>@@ -1068,7 +1264,7 @@ int f2fs_truncate_hole(struct inode *inode, pgoff_t pg_start, pgoff_t pg_end)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int punch_hole(struct inode *inode, loff_t offset, loff_t len)</div><div class='add'>+static int f2fs_punch_hole(struct inode *inode, loff_t offset, loff_t len)</div><div class='ctx'> {</div><div class='ctx'> 	pgoff_t pg_start, pg_end;</div><div class='ctx'> 	loff_t off_start, off_end;</div><div class='hunk'>@@ -1078,6 +1274,8 @@ static int punch_hole(struct inode *inode, loff_t offset, loff_t len)</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='add'>+	f2fs_zero_post_eof_page(inode, offset + len, true);</div><div class='add'>+</div><div class='ctx'> 	pg_start = ((unsigned long long) offset) &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> 	pg_end = ((unsigned long long) offset + len) &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> </div><div class='hunk'>@@ -1111,7 +1309,7 @@ static int punch_hole(struct inode *inode, loff_t offset, loff_t len)</div><div class='ctx'> 			blk_start = (loff_t)pg_start &lt;&lt; PAGE_SHIFT;</div><div class='ctx'> 			blk_end = (loff_t)pg_end &lt;&lt; PAGE_SHIFT;</div><div class='ctx'> </div><div class='del'>-			down_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+			f2fs_down_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> 			filemap_invalidate_lock(inode-&gt;i_mapping);</div><div class='ctx'> </div><div class='ctx'> 			truncate_pagecache_range(inode, blk_start, blk_end - 1);</div><div class='hunk'>@@ -1121,7 +1319,7 @@ static int punch_hole(struct inode *inode, loff_t offset, loff_t len)</div><div class='ctx'> 			f2fs_unlock_op(sbi);</div><div class='ctx'> </div><div class='ctx'> 			filemap_invalidate_unlock(inode-&gt;i_mapping);</div><div class='del'>-			up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+			f2fs_up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1150,7 +1348,7 @@ next_dnode:</div><div class='ctx'> 		goto next;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	done = min((pgoff_t)ADDRS_PER_PAGE(dn.node_page, inode) -</div><div class='add'>+	done = min((pgoff_t)ADDRS_PER_PAGE(dn.node_folio, inode) -</div><div class='ctx'> 							dn.ofs_in_node, len);</div><div class='ctx'> 	for (i = 0; i &lt; done; i++, blkaddr++, do_replace++, dn.ofs_in_node++) {</div><div class='ctx'> 		*blkaddr = f2fs_data_blkaddr(&amp;dn);</div><div class='hunk'>@@ -1198,7 +1396,7 @@ static int __roll_back_blkaddrs(struct inode *inode, block_t *blkaddr,</div><div class='ctx'> 		ret = f2fs_get_dnode_of_data(&amp;dn, off + i, LOOKUP_NODE_RA);</div><div class='ctx'> 		if (ret) {</div><div class='ctx'> 			dec_valid_block_count(sbi, inode, 1);</div><div class='del'>-			f2fs_invalidate_blocks(sbi, *blkaddr);</div><div class='add'>+			f2fs_invalidate_blocks(sbi, *blkaddr, 1);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			f2fs_update_data_blkaddr(&amp;dn, *blkaddr);</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1232,14 +1430,14 @@ static int __clone_blkaddrs(struct inode *src_inode, struct inode *dst_inode,</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				return ret;</div><div class='ctx'> </div><div class='del'>-			ret = f2fs_get_node_info(sbi, dn.nid, &amp;ni);</div><div class='add'>+			ret = f2fs_get_node_info(sbi, dn.nid, &amp;ni, false);</div><div class='ctx'> 			if (ret) {</div><div class='ctx'> 				f2fs_put_dnode(&amp;dn);</div><div class='ctx'> 				return ret;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			ilen = min((pgoff_t)</div><div class='del'>-				ADDRS_PER_PAGE(dn.node_page, dst_inode) -</div><div class='add'>+				ADDRS_PER_PAGE(dn.node_folio, dst_inode) -</div><div class='ctx'> 						dn.ofs_in_node, len - i);</div><div class='ctx'> 			do {</div><div class='ctx'> 				dn.data_blkaddr = f2fs_data_blkaddr(&amp;dn);</div><div class='hunk'>@@ -1264,22 +1462,26 @@ static int __clone_blkaddrs(struct inode *src_inode, struct inode *dst_inode,</div><div class='ctx'> </div><div class='ctx'> 			f2fs_put_dnode(&amp;dn);</div><div class='ctx'> 		} else {</div><div class='del'>-			struct page *psrc, *pdst;</div><div class='add'>+			struct folio *fsrc, *fdst;</div><div class='ctx'> </div><div class='del'>-			psrc = f2fs_get_lock_data_page(src_inode,</div><div class='add'>+			fsrc = f2fs_get_lock_data_folio(src_inode,</div><div class='ctx'> 							src + i, true);</div><div class='del'>-			if (IS_ERR(psrc))</div><div class='del'>-				return PTR_ERR(psrc);</div><div class='del'>-			pdst = f2fs_get_new_data_page(dst_inode, NULL, dst + i,</div><div class='add'>+			if (IS_ERR(fsrc))</div><div class='add'>+				return PTR_ERR(fsrc);</div><div class='add'>+			fdst = f2fs_get_new_data_folio(dst_inode, NULL, dst + i,</div><div class='ctx'> 								true);</div><div class='del'>-			if (IS_ERR(pdst)) {</div><div class='del'>-				f2fs_put_page(psrc, 1);</div><div class='del'>-				return PTR_ERR(pdst);</div><div class='add'>+			if (IS_ERR(fdst)) {</div><div class='add'>+				f2fs_folio_put(fsrc, true);</div><div class='add'>+				return PTR_ERR(fdst);</div><div class='ctx'> 			}</div><div class='del'>-			f2fs_copy_page(psrc, pdst);</div><div class='del'>-			set_page_dirty(pdst);</div><div class='del'>-			f2fs_put_page(pdst, 1);</div><div class='del'>-			f2fs_put_page(psrc, 1);</div><div class='add'>+</div><div class='add'>+			f2fs_folio_wait_writeback(fdst, DATA, true, true);</div><div class='add'>+</div><div class='add'>+			memcpy_folio(fdst, 0, fsrc, 0, PAGE_SIZE);</div><div class='add'>+			folio_mark_dirty(fdst);</div><div class='add'>+			folio_set_f2fs_gcing(fdst);</div><div class='add'>+			f2fs_folio_put(fdst, true);</div><div class='add'>+			f2fs_folio_put(fsrc, true);</div><div class='ctx'> </div><div class='ctx'> 			ret = f2fs_truncate_hole(src_inode,</div><div class='ctx'> 						src + i, src + i + 1);</div><div class='hunk'>@@ -1354,9 +1556,11 @@ static int f2fs_do_collapse(struct inode *inode, loff_t offset, loff_t len)</div><div class='ctx'> 	f2fs_balance_fs(sbi, true);</div><div class='ctx'> </div><div class='ctx'> 	/* avoid gc operation during block exchange */</div><div class='del'>-	down_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+	f2fs_down_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> 	filemap_invalidate_lock(inode-&gt;i_mapping);</div><div class='ctx'> </div><div class='add'>+	f2fs_zero_post_eof_page(inode, offset + len, false);</div><div class='add'>+</div><div class='ctx'> 	f2fs_lock_op(sbi);</div><div class='ctx'> 	f2fs_drop_extent_tree(inode);</div><div class='ctx'> 	truncate_pagecache(inode, offset);</div><div class='hunk'>@@ -1364,7 +1568,7 @@ static int f2fs_do_collapse(struct inode *inode, loff_t offset, loff_t len)</div><div class='ctx'> 	f2fs_unlock_op(sbi);</div><div class='ctx'> </div><div class='ctx'> 	filemap_invalidate_unlock(inode-&gt;i_mapping);</div><div class='del'>-	up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+	f2fs_up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1436,14 +1640,25 @@ static int f2fs_do_zero_range(struct dnode_of_data *dn, pgoff_t start,</div><div class='ctx'> 			ret = -ENOSPC;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-		if (dn-&gt;data_blkaddr != NEW_ADDR) {</div><div class='del'>-			f2fs_invalidate_blocks(sbi, dn-&gt;data_blkaddr);</div><div class='del'>-			dn-&gt;data_blkaddr = NEW_ADDR;</div><div class='del'>-			f2fs_set_data_blkaddr(dn);</div><div class='add'>+</div><div class='add'>+		if (dn-&gt;data_blkaddr == NEW_ADDR)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		if (!f2fs_is_valid_blkaddr(sbi, dn-&gt;data_blkaddr,</div><div class='add'>+					DATA_GENERIC_ENHANCE)) {</div><div class='add'>+			ret = -EFSCORRUPTED;</div><div class='add'>+			break;</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='add'>+		f2fs_invalidate_blocks(sbi, dn-&gt;data_blkaddr, 1);</div><div class='add'>+		f2fs_set_data_blkaddr(dn, NEW_ADDR);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	f2fs_update_extent_cache_range(dn, start, 0, index - start);</div><div class='add'>+	if (index &gt; start) {</div><div class='add'>+		f2fs_update_read_extent_cache_range(dn, start, 0,</div><div class='add'>+							index - start);</div><div class='add'>+		f2fs_update_age_extent_cache_range(dn, start, index - start);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -1470,6 +1685,8 @@ static int f2fs_zero_range(struct inode *inode, loff_t offset, loff_t len,</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='add'>+	f2fs_zero_post_eof_page(inode, offset + len, true);</div><div class='add'>+</div><div class='ctx'> 	pg_start = ((unsigned long long) offset) &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> 	pg_end = ((unsigned long long) offset + len) &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> </div><div class='hunk'>@@ -1499,7 +1716,7 @@ static int f2fs_zero_range(struct inode *inode, loff_t offset, loff_t len,</div><div class='ctx'> 			unsigned int end_offset;</div><div class='ctx'> 			pgoff_t end;</div><div class='ctx'> </div><div class='del'>-			down_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+			f2fs_down_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> 			filemap_invalidate_lock(mapping);</div><div class='ctx'> </div><div class='ctx'> 			truncate_pagecache_range(inode,</div><div class='hunk'>@@ -1513,11 +1730,11 @@ static int f2fs_zero_range(struct inode *inode, loff_t offset, loff_t len,</div><div class='ctx'> 			if (ret) {</div><div class='ctx'> 				f2fs_unlock_op(sbi);</div><div class='ctx'> 				filemap_invalidate_unlock(mapping);</div><div class='del'>-				up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+				f2fs_up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			end_offset = ADDRS_PER_PAGE(dn.node_page, inode);</div><div class='add'>+			end_offset = ADDRS_PER_PAGE(dn.node_folio, inode);</div><div class='ctx'> 			end = min(pg_end, end_offset - dn.ofs_in_node + index);</div><div class='ctx'> </div><div class='ctx'> 			ret = f2fs_do_zero_range(&amp;dn, index, end);</div><div class='hunk'>@@ -1525,7 +1742,7 @@ static int f2fs_zero_range(struct inode *inode, loff_t offset, loff_t len,</div><div class='ctx'> </div><div class='ctx'> 			f2fs_unlock_op(sbi);</div><div class='ctx'> 			filemap_invalidate_unlock(mapping);</div><div class='del'>-			up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+			f2fs_up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> </div><div class='ctx'> 			f2fs_balance_fs(sbi, dn.node_changed);</div><div class='ctx'> </div><div class='hunk'>@@ -1599,8 +1816,10 @@ static int f2fs_insert_range(struct inode *inode, loff_t offset, loff_t len)</div><div class='ctx'> 	idx = DIV_ROUND_UP(i_size_read(inode), PAGE_SIZE);</div><div class='ctx'> </div><div class='ctx'> 	/* avoid gc operation during block exchange */</div><div class='del'>-	down_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+	f2fs_down_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> 	filemap_invalidate_lock(mapping);</div><div class='add'>+</div><div class='add'>+	f2fs_zero_post_eof_page(inode, offset + len, false);</div><div class='ctx'> 	truncate_pagecache(inode, offset);</div><div class='ctx'> </div><div class='ctx'> 	while (!ret &amp;&amp; idx &gt; pg_start) {</div><div class='hunk'>@@ -1617,11 +1836,13 @@ static int f2fs_insert_range(struct inode *inode, loff_t offset, loff_t len)</div><div class='ctx'> 		f2fs_unlock_op(sbi);</div><div class='ctx'> 	}</div><div class='ctx'> 	filemap_invalidate_unlock(mapping);</div><div class='del'>-	up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+	f2fs_up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	/* write out all moved pages, if possible */</div><div class='ctx'> 	filemap_invalidate_lock(mapping);</div><div class='del'>-	filemap_write_and_wait_range(mapping, offset, LLONG_MAX);</div><div class='add'>+	ret = filemap_write_and_wait_range(mapping, offset, LLONG_MAX);</div><div class='ctx'> 	truncate_pagecache(inode, offset);</div><div class='ctx'> 	filemap_invalidate_unlock(mapping);</div><div class='ctx'> </div><div class='hunk'>@@ -1630,15 +1851,20 @@ static int f2fs_insert_range(struct inode *inode, loff_t offset, loff_t len)</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int expand_inode_data(struct inode *inode, loff_t offset,</div><div class='add'>+static int f2fs_expand_inode_data(struct inode *inode, loff_t offset,</div><div class='ctx'> 					loff_t len, int mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	struct f2fs_map_blocks map = { .m_next_pgofs = NULL,</div><div class='ctx'> 			.m_next_extent = NULL, .m_seg_type = NO_CHECK_TYPE,</div><div class='ctx'> 			.m_may_create = true };</div><div class='add'>+	struct f2fs_gc_control gc_control = { .victim_segno = NULL_SEGNO,</div><div class='add'>+			.init_gc_type = FG_GC,</div><div class='add'>+			.should_migrate_blocks = false,</div><div class='add'>+			.err_gc_skipped = true,</div><div class='add'>+			.nr_free_secs = 0 };</div><div class='ctx'> 	pgoff_t pg_start, pg_end;</div><div class='del'>-	loff_t new_size = i_size_read(inode);</div><div class='add'>+	loff_t new_size;</div><div class='ctx'> 	loff_t off_end;</div><div class='ctx'> 	block_t expanded = 0;</div><div class='ctx'> 	int err;</div><div class='hunk'>@@ -1651,6 +1877,8 @@ static int expand_inode_data(struct inode *inode, loff_t offset,</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='add'>+	f2fs_zero_post_eof_page(inode, offset + len, true);</div><div class='add'>+</div><div class='ctx'> 	f2fs_balance_fs(sbi, true);</div><div class='ctx'> </div><div class='ctx'> 	pg_start = ((unsigned long long)offset) &gt;&gt; PAGE_SHIFT;</div><div class='hunk'>@@ -1666,29 +1894,47 @@ static int expand_inode_data(struct inode *inode, loff_t offset,</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	if (f2fs_is_pinned_file(inode)) {</div><div class='del'>-		block_t sec_blks = BLKS_PER_SEC(sbi);</div><div class='add'>+		block_t sec_blks = CAP_BLKS_PER_SEC(sbi);</div><div class='ctx'> 		block_t sec_len = roundup(map.m_len, sec_blks);</div><div class='ctx'> </div><div class='ctx'> 		map.m_len = sec_blks;</div><div class='ctx'> next_alloc:</div><div class='del'>-		if (has_not_enough_free_secs(sbi, 0,</div><div class='del'>-			GET_SEC_FROM_SEG(sbi, overprovision_segments(sbi)))) {</div><div class='del'>-			down_write(&amp;sbi-&gt;gc_lock);</div><div class='del'>-			err = f2fs_gc(sbi, true, false, false, NULL_SEGNO);</div><div class='del'>-			if (err &amp;&amp; err != -ENODATA &amp;&amp; err != -EAGAIN)</div><div class='add'>+		f2fs_down_write(&amp;sbi-&gt;pin_sem);</div><div class='add'>+</div><div class='add'>+		if (unlikely(is_sbi_flag_set(sbi, SBI_CP_DISABLED))) {</div><div class='add'>+			if (has_not_enough_free_secs(sbi, 0, 0)) {</div><div class='add'>+				f2fs_up_write(&amp;sbi-&gt;pin_sem);</div><div class='add'>+				err = -ENOSPC;</div><div class='add'>+				f2fs_warn_ratelimited(sbi,</div><div class='add'>+					"ino:%lu, start:%lu, end:%lu, need to trigger GC to "</div><div class='add'>+					"reclaim enough free segment when checkpoint is enabled",</div><div class='add'>+					inode-&gt;i_ino, pg_start, pg_end);</div><div class='ctx'> 				goto out_err;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		down_write(&amp;sbi-&gt;pin_sem);</div><div class='add'>+		if (has_not_enough_free_secs(sbi, 0,</div><div class='add'>+				sbi-&gt;reserved_pin_section)) {</div><div class='add'>+			f2fs_down_write(&amp;sbi-&gt;gc_lock);</div><div class='add'>+			stat_inc_gc_call_count(sbi, FOREGROUND);</div><div class='add'>+			err = f2fs_gc(sbi, &amp;gc_control);</div><div class='add'>+			if (err &amp;&amp; err != -ENODATA) {</div><div class='add'>+				f2fs_up_write(&amp;sbi-&gt;pin_sem);</div><div class='add'>+				goto out_err;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-		f2fs_lock_op(sbi);</div><div class='del'>-		f2fs_allocate_new_section(sbi, CURSEG_COLD_DATA_PINNED, false);</div><div class='del'>-		f2fs_unlock_op(sbi);</div><div class='add'>+		err = f2fs_allocate_pinning_section(sbi);</div><div class='add'>+		if (err) {</div><div class='add'>+			f2fs_up_write(&amp;sbi-&gt;pin_sem);</div><div class='add'>+			goto out_err;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		map.m_seg_type = CURSEG_COLD_DATA_PINNED;</div><div class='del'>-		err = f2fs_map_blocks(inode, &amp;map, 1, F2FS_GET_BLOCK_PRE_DIO);</div><div class='add'>+		err = f2fs_map_blocks(inode, &amp;map, F2FS_GET_BLOCK_PRE_DIO);</div><div class='add'>+		file_dont_truncate(inode);</div><div class='ctx'> </div><div class='del'>-		up_write(&amp;sbi-&gt;pin_sem);</div><div class='add'>+		f2fs_up_write(&amp;sbi-&gt;pin_sem);</div><div class='ctx'> </div><div class='ctx'> 		expanded += map.m_len;</div><div class='ctx'> 		sec_len -= map.m_len;</div><div class='hunk'>@@ -1698,7 +1944,7 @@ next_alloc:</div><div class='ctx'> </div><div class='ctx'> 		map.m_len = expanded;</div><div class='ctx'> 	} else {</div><div class='del'>-		err = f2fs_map_blocks(inode, &amp;map, 1, F2FS_GET_BLOCK_PRE_AIO);</div><div class='add'>+		err = f2fs_map_blocks(inode, &amp;map, F2FS_GET_BLOCK_PRE_AIO);</div><div class='ctx'> 		expanded = map.m_len;</div><div class='ctx'> 	}</div><div class='ctx'> out_err:</div><div class='hunk'>@@ -1737,7 +1983,7 @@ static long f2fs_fallocate(struct file *file, int mode,</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	if (!f2fs_is_checkpoint_ready(F2FS_I_SB(inode)))</div><div class='ctx'> 		return -ENOSPC;</div><div class='del'>-	if (!f2fs_is_compress_backend_ready(inode))</div><div class='add'>+	if (!f2fs_is_compress_backend_ready(inode) || IS_DEVICE_ALIASING(inode))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='ctx'> 	/* f2fs only support -&gt;fallocate for regular file */</div><div class='hunk'>@@ -1748,11 +1994,6 @@ static long f2fs_fallocate(struct file *file, int mode,</div><div class='ctx'> 		(mode &amp; (FALLOC_FL_COLLAPSE_RANGE | FALLOC_FL_INSERT_RANGE)))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='del'>-	if (f2fs_compressed_file(inode) &amp;&amp;</div><div class='del'>-		(mode &amp; (FALLOC_FL_PUNCH_HOLE | FALLOC_FL_COLLAPSE_RANGE |</div><div class='del'>-			FALLOC_FL_ZERO_RANGE | FALLOC_FL_INSERT_RANGE)))</div><div class='del'>-		return -EOPNOTSUPP;</div><div class='del'>-</div><div class='ctx'> 	if (mode &amp; ~(FALLOC_FL_KEEP_SIZE | FALLOC_FL_PUNCH_HOLE |</div><div class='ctx'> 			FALLOC_FL_COLLAPSE_RANGE | FALLOC_FL_ZERO_RANGE |</div><div class='ctx'> 			FALLOC_FL_INSERT_RANGE))</div><div class='hunk'>@@ -1760,11 +2001,32 @@ static long f2fs_fallocate(struct file *file, int mode,</div><div class='ctx'> </div><div class='ctx'> 	inode_lock(inode);</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Pinned file should not support partial truncation since the block</div><div class='add'>+	 * can be used by applications.</div><div class='add'>+	 */</div><div class='add'>+	if ((f2fs_compressed_file(inode) || f2fs_is_pinned_file(inode)) &amp;&amp;</div><div class='add'>+		(mode &amp; (FALLOC_FL_PUNCH_HOLE | FALLOC_FL_COLLAPSE_RANGE |</div><div class='add'>+			FALLOC_FL_ZERO_RANGE | FALLOC_FL_INSERT_RANGE))) {</div><div class='add'>+		ret = -EOPNOTSUPP;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = file_modified(file);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * wait for inflight dio, blocks should be removed after IO</div><div class='add'>+	 * completion.</div><div class='add'>+	 */</div><div class='add'>+	inode_dio_wait(inode);</div><div class='add'>+</div><div class='ctx'> 	if (mode &amp; FALLOC_FL_PUNCH_HOLE) {</div><div class='ctx'> 		if (offset &gt;= inode-&gt;i_size)</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='del'>-		ret = punch_hole(inode, offset, len);</div><div class='add'>+		ret = f2fs_punch_hole(inode, offset, len);</div><div class='ctx'> 	} else if (mode &amp; FALLOC_FL_COLLAPSE_RANGE) {</div><div class='ctx'> 		ret = f2fs_collapse_range(inode, offset, len);</div><div class='ctx'> 	} else if (mode &amp; FALLOC_FL_ZERO_RANGE) {</div><div class='hunk'>@@ -1772,11 +2034,11 @@ static long f2fs_fallocate(struct file *file, int mode,</div><div class='ctx'> 	} else if (mode &amp; FALLOC_FL_INSERT_RANGE) {</div><div class='ctx'> 		ret = f2fs_insert_range(inode, offset, len);</div><div class='ctx'> 	} else {</div><div class='del'>-		ret = expand_inode_data(inode, offset, len, mode);</div><div class='add'>+		ret = f2fs_expand_inode_data(inode, offset, len, mode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!ret) {</div><div class='del'>-		inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+		inode_set_mtime_to_ts(inode, inode_set_ctime_current(inode));</div><div class='ctx'> 		f2fs_mark_inode_dirty_sync(inode, false);</div><div class='ctx'> 		f2fs_update_time(F2FS_I_SB(inode), REQ_TIME);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1790,24 +2052,21 @@ out:</div><div class='ctx'> </div><div class='ctx'> static int f2fs_release_file(struct inode *inode, struct file *filp)</div><div class='ctx'> {</div><div class='add'>+	if (atomic_dec_and_test(&amp;F2FS_I(inode)-&gt;open_count))</div><div class='add'>+		f2fs_remove_donate_inode(inode);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='del'>-	 * f2fs_relase_file is called at every close calls. So we should</div><div class='add'>+	 * f2fs_release_file is called at every close calls. So we should</div><div class='ctx'> 	 * not drop any inmemory pages by close called by other process.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (!(filp-&gt;f_mode &amp; FMODE_WRITE) ||</div><div class='ctx'> 			atomic_read(&amp;inode-&gt;i_writecount) != 1)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	/* some remained atomic pages should discarded */</div><div class='del'>-	if (f2fs_is_atomic_file(inode))</div><div class='del'>-		f2fs_drop_inmem_pages(inode);</div><div class='del'>-	if (f2fs_is_volatile_file(inode)) {</div><div class='del'>-		set_inode_flag(inode, FI_DROP_CACHE);</div><div class='del'>-		filemap_fdatawrite(inode-&gt;i_mapping);</div><div class='del'>-		clear_inode_flag(inode, FI_DROP_CACHE);</div><div class='del'>-		clear_inode_flag(inode, FI_VOLATILE_FILE);</div><div class='del'>-		stat_dec_volatile_write(inode);</div><div class='del'>-	}</div><div class='add'>+	inode_lock(inode);</div><div class='add'>+	f2fs_abort_atomic_write(inode, true);</div><div class='add'>+	inode_unlock(inode);</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1821,9 +2080,13 @@ static int f2fs_file_flush(struct file *file, fl_owner_t id)</div><div class='ctx'> 	 * until all the writers close its file. Since this should be done</div><div class='ctx'> 	 * before dropping file lock, it needs to do in -&gt;flush.</div><div class='ctx'> 	 */</div><div class='del'>-	if (f2fs_is_atomic_file(inode) &amp;&amp;</div><div class='del'>-			F2FS_I(inode)-&gt;inmem_task == current)</div><div class='del'>-		f2fs_drop_inmem_pages(inode);</div><div class='add'>+	if (F2FS_I(inode)-&gt;atomic_write_task == current &amp;&amp;</div><div class='add'>+				(current-&gt;flags &amp; PF_EXITING)) {</div><div class='add'>+		inode_lock(inode);</div><div class='add'>+		f2fs_abort_atomic_write(inode, true);</div><div class='add'>+		inode_unlock(inode);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1857,22 +2120,27 @@ static int f2fs_setflags_common(struct inode *inode, u32 iflags, u32 mask)</div><div class='ctx'> 		if (masked_flags &amp; F2FS_COMPR_FL) {</div><div class='ctx'> 			if (!f2fs_disable_compressed_file(inode))</div><div class='ctx'> 				return -EINVAL;</div><div class='del'>-		}</div><div class='del'>-		if (iflags &amp; F2FS_NOCOMP_FL)</div><div class='del'>-			return -EINVAL;</div><div class='del'>-		if (iflags &amp; F2FS_COMPR_FL) {</div><div class='del'>-			if (!f2fs_may_compress(inode))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			if (S_ISREG(inode-&gt;i_mode) &amp;&amp; inode-&gt;i_size)</div><div class='add'>+		} else {</div><div class='add'>+			/* try to convert inline_data to support compression */</div><div class='add'>+			int err = f2fs_convert_inline_inode(inode);</div><div class='add'>+			if (err)</div><div class='add'>+				return err;</div><div class='add'>+</div><div class='add'>+			f2fs_down_write(&amp;fi-&gt;i_sem);</div><div class='add'>+			if (!f2fs_may_compress(inode) ||</div><div class='add'>+				atomic_read(&amp;fi-&gt;writeback) ||</div><div class='add'>+				(S_ISREG(inode-&gt;i_mode) &amp;&amp;</div><div class='add'>+				F2FS_HAS_BLOCKS(inode))) {</div><div class='add'>+				f2fs_up_write(&amp;fi-&gt;i_sem);</div><div class='ctx'> 				return -EINVAL;</div><div class='add'>+			}</div><div class='add'>+			err = set_compress_context(inode);</div><div class='add'>+			f2fs_up_write(&amp;fi-&gt;i_sem);</div><div class='ctx'> </div><div class='del'>-			set_compress_context(inode);</div><div class='add'>+			if (err)</div><div class='add'>+				return err;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	if ((iflags ^ masked_flags) &amp; F2FS_NOCOMP_FL) {</div><div class='del'>-		if (masked_flags &amp; F2FS_COMPR_FL)</div><div class='del'>-			return -EINVAL;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	fi-&gt;i_flags = iflags | (fi-&gt;i_flags &amp; ~mask);</div><div class='ctx'> 	f2fs_bug_on(F2FS_I_SB(inode), (fi-&gt;i_flags &amp; F2FS_COMPR_FL) &amp;&amp;</div><div class='hunk'>@@ -1883,7 +2151,7 @@ static int f2fs_setflags_common(struct inode *inode, u32 iflags, u32 mask)</div><div class='ctx'> 	else</div><div class='ctx'> 		clear_inode_flag(inode, FI_PROJ_INHERIT);</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> 	f2fs_set_inode_flags(inode);</div><div class='ctx'> 	f2fs_mark_inode_dirty_sync(inode, true);</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -1980,14 +2248,19 @@ static int f2fs_ioc_getversion(struct file *filp, unsigned long arg)</div><div class='ctx'> 	return put_user(inode-&gt;i_generation, (int __user *)arg);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_ioc_start_atomic_write(struct file *filp)</div><div class='add'>+static int f2fs_ioc_start_atomic_write(struct file *filp, bool truncate)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(filp);</div><div class='add'>+	struct mnt_idmap *idmap = file_mnt_idmap(filp);</div><div class='ctx'> 	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='add'>+	loff_t isize;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (!inode_owner_or_capable(&amp;init_user_ns, inode))</div><div class='add'>+	if (!(filp-&gt;f_mode &amp; FMODE_WRITE))</div><div class='add'>+		return -EBADF;</div><div class='add'>+</div><div class='add'>+	if (!inode_owner_or_capable(idmap, inode))</div><div class='ctx'> 		return -EACCES;</div><div class='ctx'> </div><div class='ctx'> 	if (!S_ISREG(inode-&gt;i_mode))</div><div class='hunk'>@@ -2002,165 +2275,136 @@ static int f2fs_ioc_start_atomic_write(struct file *filp)</div><div class='ctx'> </div><div class='ctx'> 	inode_lock(inode);</div><div class='ctx'> </div><div class='del'>-	f2fs_disable_compressed_file(inode);</div><div class='del'>-</div><div class='del'>-	if (f2fs_is_atomic_file(inode)) {</div><div class='del'>-		if (is_inode_flag_set(inode, FI_ATOMIC_REVOKE_REQUEST))</div><div class='del'>-			ret = -EINVAL;</div><div class='add'>+	if (!f2fs_disable_compressed_file(inode) ||</div><div class='add'>+			f2fs_is_pinned_file(inode)) {</div><div class='add'>+		ret = -EINVAL;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (f2fs_is_atomic_file(inode))</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='ctx'> 	ret = f2fs_convert_inline_inode(inode);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+	f2fs_down_write(&amp;fi-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+	f2fs_down_write(&amp;fi-&gt;i_gc_rwsem[READ]);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Should wait end_io to count F2FS_WB_CP_DATA correctly by</div><div class='ctx'> 	 * f2fs_is_atomic_file.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (get_dirty_pages(inode))</div><div class='del'>-		f2fs_warn(F2FS_I_SB(inode), "Unexpected flush for atomic writes: ino=%lu, npages=%u",</div><div class='add'>+		f2fs_warn(sbi, "Unexpected flush for atomic writes: ino=%lu, npages=%u",</div><div class='ctx'> 			  inode-&gt;i_ino, get_dirty_pages(inode));</div><div class='ctx'> 	ret = filemap_write_and_wait_range(inode-&gt;i_mapping, 0, LLONG_MAX);</div><div class='del'>-	if (ret) {</div><div class='del'>-		up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;sbi-&gt;inode_lock[ATOMIC_FILE]);</div><div class='del'>-	if (list_empty(&amp;fi-&gt;inmem_ilist))</div><div class='del'>-		list_add_tail(&amp;fi-&gt;inmem_ilist, &amp;sbi-&gt;inode_list[ATOMIC_FILE]);</div><div class='del'>-	sbi-&gt;atomic_files++;</div><div class='del'>-	spin_unlock(&amp;sbi-&gt;inode_lock[ATOMIC_FILE]);</div><div class='del'>-</div><div class='del'>-	/* add inode in inmem_list first and set atomic_file */</div><div class='del'>-	set_inode_flag(inode, FI_ATOMIC_FILE);</div><div class='del'>-	clear_inode_flag(inode, FI_ATOMIC_REVOKE_REQUEST);</div><div class='del'>-	up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='del'>-</div><div class='del'>-	f2fs_update_time(F2FS_I_SB(inode), REQ_TIME);</div><div class='del'>-	F2FS_I(inode)-&gt;inmem_task = current;</div><div class='del'>-	stat_update_max_atomic_write(inode);</div><div class='del'>-out:</div><div class='del'>-	inode_unlock(inode);</div><div class='del'>-	mnt_drop_write_file(filp);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int f2fs_ioc_commit_atomic_write(struct file *filp)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = file_inode(filp);</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (!inode_owner_or_capable(&amp;init_user_ns, inode))</div><div class='del'>-		return -EACCES;</div><div class='del'>-</div><div class='del'>-	ret = mnt_want_write_file(filp);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	f2fs_balance_fs(F2FS_I_SB(inode), true);</div><div class='del'>-</div><div class='del'>-	inode_lock(inode);</div><div class='add'>+		goto out_unlock;</div><div class='ctx'> </div><div class='del'>-	if (f2fs_is_volatile_file(inode)) {</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		goto err_out;</div><div class='del'>-	}</div><div class='add'>+	/* Check if the inode already has a COW inode */</div><div class='add'>+	if (fi-&gt;cow_inode == NULL) {</div><div class='add'>+		/* Create a COW inode for atomic write */</div><div class='add'>+		struct dentry *dentry = file_dentry(filp);</div><div class='add'>+		struct inode *dir = d_inode(dentry-&gt;d_parent);</div><div class='ctx'> </div><div class='del'>-	if (f2fs_is_atomic_file(inode)) {</div><div class='del'>-		ret = f2fs_commit_inmem_pages(inode);</div><div class='add'>+		ret = f2fs_get_tmpfile(idmap, dir, &amp;fi-&gt;cow_inode);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			goto err_out;</div><div class='add'>+			goto out_unlock;</div><div class='ctx'> </div><div class='del'>-		ret = f2fs_do_sync_file(filp, 0, LLONG_MAX, 0, true);</div><div class='del'>-		if (!ret)</div><div class='del'>-			f2fs_drop_inmem_pages(inode);</div><div class='add'>+		set_inode_flag(fi-&gt;cow_inode, FI_COW_FILE);</div><div class='add'>+		clear_inode_flag(fi-&gt;cow_inode, FI_INLINE_DATA);</div><div class='add'>+</div><div class='add'>+		/* Set the COW inode's atomic_inode to the atomic inode */</div><div class='add'>+		F2FS_I(fi-&gt;cow_inode)-&gt;atomic_inode = inode;</div><div class='ctx'> 	} else {</div><div class='del'>-		ret = f2fs_do_sync_file(filp, 0, LLONG_MAX, 1, false);</div><div class='del'>-	}</div><div class='del'>-err_out:</div><div class='del'>-	if (is_inode_flag_set(inode, FI_ATOMIC_REVOKE_REQUEST)) {</div><div class='del'>-		clear_inode_flag(inode, FI_ATOMIC_REVOKE_REQUEST);</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-	}</div><div class='del'>-	inode_unlock(inode);</div><div class='del'>-	mnt_drop_write_file(filp);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='add'>+		/* Reuse the already created COW inode */</div><div class='add'>+		f2fs_bug_on(sbi, get_dirty_pages(fi-&gt;cow_inode));</div><div class='ctx'> </div><div class='del'>-static int f2fs_ioc_start_volatile_write(struct file *filp)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = file_inode(filp);</div><div class='del'>-	int ret;</div><div class='add'>+		invalidate_mapping_pages(fi-&gt;cow_inode-&gt;i_mapping, 0, -1);</div><div class='ctx'> </div><div class='del'>-	if (!inode_owner_or_capable(&amp;init_user_ns, inode))</div><div class='del'>-		return -EACCES;</div><div class='add'>+		ret = f2fs_do_truncate_blocks(fi-&gt;cow_inode, 0, true);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out_unlock;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (!S_ISREG(inode-&gt;i_mode))</div><div class='del'>-		return -EINVAL;</div><div class='add'>+	f2fs_write_inode(inode, NULL);</div><div class='ctx'> </div><div class='del'>-	ret = mnt_want_write_file(filp);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='add'>+	stat_inc_atomic_inode(inode);</div><div class='ctx'> </div><div class='del'>-	inode_lock(inode);</div><div class='add'>+	set_inode_flag(inode, FI_ATOMIC_FILE);</div><div class='ctx'> </div><div class='del'>-	if (f2fs_is_volatile_file(inode))</div><div class='del'>-		goto out;</div><div class='add'>+	isize = i_size_read(inode);</div><div class='add'>+	fi-&gt;original_i_size = isize;</div><div class='add'>+	if (truncate) {</div><div class='add'>+		set_inode_flag(inode, FI_ATOMIC_REPLACE);</div><div class='add'>+		truncate_inode_pages_final(inode-&gt;i_mapping);</div><div class='add'>+		f2fs_i_size_write(inode, 0);</div><div class='add'>+		isize = 0;</div><div class='add'>+	}</div><div class='add'>+	f2fs_i_size_write(fi-&gt;cow_inode, isize);</div><div class='ctx'> </div><div class='del'>-	ret = f2fs_convert_inline_inode(inode);</div><div class='add'>+out_unlock:</div><div class='add'>+	f2fs_up_write(&amp;fi-&gt;i_gc_rwsem[READ]);</div><div class='add'>+	f2fs_up_write(&amp;fi-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	stat_inc_volatile_write(inode);</div><div class='del'>-	stat_update_max_volatile_write(inode);</div><div class='del'>-</div><div class='del'>-	set_inode_flag(inode, FI_VOLATILE_FILE);</div><div class='del'>-	f2fs_update_time(F2FS_I_SB(inode), REQ_TIME);</div><div class='add'>+	f2fs_update_time(sbi, REQ_TIME);</div><div class='add'>+	fi-&gt;atomic_write_task = current;</div><div class='add'>+	stat_update_max_atomic_write(inode);</div><div class='add'>+	fi-&gt;atomic_write_cnt = 0;</div><div class='ctx'> out:</div><div class='ctx'> 	inode_unlock(inode);</div><div class='ctx'> 	mnt_drop_write_file(filp);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_ioc_release_volatile_write(struct file *filp)</div><div class='add'>+static int f2fs_ioc_commit_atomic_write(struct file *filp)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(filp);</div><div class='add'>+	struct mnt_idmap *idmap = file_mnt_idmap(filp);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (!inode_owner_or_capable(&amp;init_user_ns, inode))</div><div class='add'>+	if (!(filp-&gt;f_mode &amp; FMODE_WRITE))</div><div class='add'>+		return -EBADF;</div><div class='add'>+</div><div class='add'>+	if (!inode_owner_or_capable(idmap, inode))</div><div class='ctx'> 		return -EACCES;</div><div class='ctx'> </div><div class='ctx'> 	ret = mnt_want_write_file(filp);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='add'>+	f2fs_balance_fs(F2FS_I_SB(inode), true);</div><div class='add'>+</div><div class='ctx'> 	inode_lock(inode);</div><div class='ctx'> </div><div class='del'>-	if (!f2fs_is_volatile_file(inode))</div><div class='del'>-		goto out;</div><div class='add'>+	if (f2fs_is_atomic_file(inode)) {</div><div class='add'>+		ret = f2fs_commit_atomic_write(inode);</div><div class='add'>+		if (!ret)</div><div class='add'>+			ret = f2fs_do_sync_file(filp, 0, LLONG_MAX, 0, true);</div><div class='ctx'> </div><div class='del'>-	if (!f2fs_is_first_block_written(inode)) {</div><div class='del'>-		ret = truncate_partial_data_page(inode, 0, true);</div><div class='del'>-		goto out;</div><div class='add'>+		f2fs_abort_atomic_write(inode, ret);</div><div class='add'>+	} else {</div><div class='add'>+		ret = f2fs_do_sync_file(filp, 0, LLONG_MAX, 1, false);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = punch_hole(inode, 0, F2FS_BLKSIZE);</div><div class='del'>-out:</div><div class='ctx'> 	inode_unlock(inode);</div><div class='ctx'> 	mnt_drop_write_file(filp);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_ioc_abort_volatile_write(struct file *filp)</div><div class='add'>+static int f2fs_ioc_abort_atomic_write(struct file *filp)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(filp);</div><div class='add'>+	struct mnt_idmap *idmap = file_mnt_idmap(filp);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (!inode_owner_or_capable(&amp;init_user_ns, inode))</div><div class='add'>+	if (!(filp-&gt;f_mode &amp; FMODE_WRITE))</div><div class='add'>+		return -EBADF;</div><div class='add'>+</div><div class='add'>+	if (!inode_owner_or_capable(idmap, inode))</div><div class='ctx'> 		return -EACCES;</div><div class='ctx'> </div><div class='ctx'> 	ret = mnt_want_write_file(filp);</div><div class='hunk'>@@ -2169,15 +2413,7 @@ static int f2fs_ioc_abort_volatile_write(struct file *filp)</div><div class='ctx'> </div><div class='ctx'> 	inode_lock(inode);</div><div class='ctx'> </div><div class='del'>-	if (f2fs_is_atomic_file(inode))</div><div class='del'>-		f2fs_drop_inmem_pages(inode);</div><div class='del'>-	if (f2fs_is_volatile_file(inode)) {</div><div class='del'>-		clear_inode_flag(inode, FI_VOLATILE_FILE);</div><div class='del'>-		stat_dec_volatile_write(inode);</div><div class='del'>-		ret = f2fs_do_sync_file(filp, 0, LLONG_MAX, 0, true);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	clear_inode_flag(inode, FI_ATOMIC_REVOKE_REQUEST);</div><div class='add'>+	f2fs_abort_atomic_write(inode, true);</div><div class='ctx'> </div><div class='ctx'> 	inode_unlock(inode);</div><div class='ctx'> </div><div class='hunk'>@@ -2186,58 +2422,36 @@ static int f2fs_ioc_abort_volatile_write(struct file *filp)</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_ioc_shutdown(struct file *filp, unsigned long arg)</div><div class='add'>+int f2fs_do_shutdown(struct f2fs_sb_info *sbi, unsigned int flag,</div><div class='add'>+						bool readonly, bool need_lock)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = file_inode(filp);</div><div class='del'>-	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	struct super_block *sb = sbi-&gt;sb;</div><div class='del'>-	__u32 in;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	if (!capable(CAP_SYS_ADMIN))</div><div class='del'>-		return -EPERM;</div><div class='del'>-</div><div class='del'>-	if (get_user(in, (__u32 __user *)arg))</div><div class='del'>-		return -EFAULT;</div><div class='del'>-</div><div class='del'>-	if (in != F2FS_GOING_DOWN_FULLSYNC) {</div><div class='del'>-		ret = mnt_want_write_file(filp);</div><div class='del'>-		if (ret) {</div><div class='del'>-			if (ret == -EROFS) {</div><div class='del'>-				ret = 0;</div><div class='del'>-				f2fs_stop_checkpoint(sbi, false);</div><div class='del'>-				set_sbi_flag(sbi, SBI_IS_SHUTDOWN);</div><div class='del'>-				trace_f2fs_shutdown(sbi, in, ret);</div><div class='del'>-			}</div><div class='del'>-			return ret;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	switch (in) {</div><div class='add'>+	switch (flag) {</div><div class='ctx'> 	case F2FS_GOING_DOWN_FULLSYNC:</div><div class='del'>-		ret = freeze_bdev(sb-&gt;s_bdev);</div><div class='add'>+		ret = bdev_freeze(sb-&gt;s_bdev);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto out;</div><div class='del'>-		f2fs_stop_checkpoint(sbi, false);</div><div class='del'>-		set_sbi_flag(sbi, SBI_IS_SHUTDOWN);</div><div class='del'>-		thaw_bdev(sb-&gt;s_bdev);</div><div class='add'>+		f2fs_stop_checkpoint(sbi, false, STOP_CP_REASON_SHUTDOWN);</div><div class='add'>+		bdev_thaw(sb-&gt;s_bdev);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case F2FS_GOING_DOWN_METASYNC:</div><div class='ctx'> 		/* do checkpoint only */</div><div class='ctx'> 		ret = f2fs_sync_fs(sb, 1);</div><div class='del'>-		if (ret)</div><div class='add'>+		if (ret) {</div><div class='add'>+			if (ret == -EIO)</div><div class='add'>+				ret = 0;</div><div class='ctx'> 			goto out;</div><div class='del'>-		f2fs_stop_checkpoint(sbi, false);</div><div class='del'>-		set_sbi_flag(sbi, SBI_IS_SHUTDOWN);</div><div class='add'>+		}</div><div class='add'>+		f2fs_stop_checkpoint(sbi, false, STOP_CP_REASON_SHUTDOWN);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case F2FS_GOING_DOWN_NOSYNC:</div><div class='del'>-		f2fs_stop_checkpoint(sbi, false);</div><div class='del'>-		set_sbi_flag(sbi, SBI_IS_SHUTDOWN);</div><div class='add'>+		f2fs_stop_checkpoint(sbi, false, STOP_CP_REASON_SHUTDOWN);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case F2FS_GOING_DOWN_METAFLUSH:</div><div class='ctx'> 		f2fs_sync_meta_pages(sbi, META, LONG_MAX, FS_META_IO);</div><div class='del'>-		f2fs_stop_checkpoint(sbi, false);</div><div class='del'>-		set_sbi_flag(sbi, SBI_IS_SHUTDOWN);</div><div class='add'>+		f2fs_stop_checkpoint(sbi, false, STOP_CP_REASON_SHUTDOWN);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case F2FS_GOING_DOWN_NEED_FSCK:</div><div class='ctx'> 		set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='hunk'>@@ -2245,24 +2459,128 @@ static int f2fs_ioc_shutdown(struct file *filp, unsigned long arg)</div><div class='ctx'> 		set_sbi_flag(sbi, SBI_IS_DIRTY);</div><div class='ctx'> 		/* do checkpoint only */</div><div class='ctx'> 		ret = f2fs_sync_fs(sb, 1);</div><div class='add'>+		if (ret == -EIO)</div><div class='add'>+			ret = 0;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	default:</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (readonly)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * grab sb-&gt;s_umount to avoid racing w/ remount() and other shutdown</div><div class='add'>+	 * paths.</div><div class='add'>+	 */</div><div class='add'>+	if (need_lock)</div><div class='add'>+		down_write(&amp;sbi-&gt;sb-&gt;s_umount);</div><div class='add'>+</div><div class='ctx'> 	f2fs_stop_gc_thread(sbi);</div><div class='ctx'> 	f2fs_stop_discard_thread(sbi);</div><div class='ctx'> </div><div class='ctx'> 	f2fs_drop_discard_cmd(sbi);</div><div class='ctx'> 	clear_opt(sbi, DISCARD);</div><div class='ctx'> </div><div class='add'>+	if (need_lock)</div><div class='add'>+		up_write(&amp;sbi-&gt;sb-&gt;s_umount);</div><div class='add'>+</div><div class='ctx'> 	f2fs_update_time(sbi, REQ_TIME);</div><div class='ctx'> out:</div><div class='del'>-	if (in != F2FS_GOING_DOWN_FULLSYNC)</div><div class='add'>+</div><div class='add'>+	trace_f2fs_shutdown(sbi, flag, ret);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int f2fs_ioc_shutdown(struct file *filp, unsigned long arg)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file_inode(filp);</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='add'>+	__u32 in;</div><div class='add'>+	int ret;</div><div class='add'>+	bool need_drop = false, readonly = false;</div><div class='add'>+</div><div class='add'>+	if (!capable(CAP_SYS_ADMIN))</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	if (get_user(in, (__u32 __user *)arg))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+</div><div class='add'>+	if (in != F2FS_GOING_DOWN_FULLSYNC) {</div><div class='add'>+		ret = mnt_want_write_file(filp);</div><div class='add'>+		if (ret) {</div><div class='add'>+			if (ret != -EROFS)</div><div class='add'>+				return ret;</div><div class='add'>+</div><div class='add'>+			/* fallback to nosync shutdown for readonly fs */</div><div class='add'>+			in = F2FS_GOING_DOWN_NOSYNC;</div><div class='add'>+			readonly = true;</div><div class='add'>+		} else {</div><div class='add'>+			need_drop = true;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = f2fs_do_shutdown(sbi, in, readonly, true);</div><div class='add'>+</div><div class='add'>+	if (need_drop)</div><div class='ctx'> 		mnt_drop_write_file(filp);</div><div class='ctx'> </div><div class='del'>-	trace_f2fs_shutdown(sbi, in, ret);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int f2fs_keep_noreuse_range(struct inode *inode,</div><div class='add'>+				loff_t offset, loff_t len)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='add'>+	u64 max_bytes = F2FS_BLK_TO_BYTES(max_file_blocks(inode));</div><div class='add'>+	u64 start, end;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	if (!S_ISREG(inode-&gt;i_mode))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if (offset &gt;= max_bytes || len &gt; max_bytes ||</div><div class='add'>+	    (offset + len) &gt; max_bytes)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	start = offset &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	end = DIV_ROUND_UP(offset + len, PAGE_SIZE);</div><div class='add'>+</div><div class='add'>+	inode_lock(inode);</div><div class='add'>+	if (f2fs_is_atomic_file(inode)) {</div><div class='add'>+		inode_unlock(inode);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;sbi-&gt;inode_lock[DONATE_INODE]);</div><div class='add'>+	/* let's remove the range, if len = 0 */</div><div class='add'>+	if (!len) {</div><div class='add'>+		if (!list_empty(&amp;F2FS_I(inode)-&gt;gdonate_list)) {</div><div class='add'>+			list_del_init(&amp;F2FS_I(inode)-&gt;gdonate_list);</div><div class='add'>+			sbi-&gt;donate_files--;</div><div class='add'>+			if (is_inode_flag_set(inode, FI_DONATE_FINISHED))</div><div class='add'>+				ret = -EALREADY;</div><div class='add'>+			else</div><div class='add'>+				set_inode_flag(inode, FI_DONATE_FINISHED);</div><div class='add'>+		} else</div><div class='add'>+			ret = -ENOENT;</div><div class='add'>+	} else {</div><div class='add'>+		if (list_empty(&amp;F2FS_I(inode)-&gt;gdonate_list)) {</div><div class='add'>+			list_add_tail(&amp;F2FS_I(inode)-&gt;gdonate_list,</div><div class='add'>+					&amp;sbi-&gt;inode_list[DONATE_INODE]);</div><div class='add'>+			sbi-&gt;donate_files++;</div><div class='add'>+		} else {</div><div class='add'>+			list_move_tail(&amp;F2FS_I(inode)-&gt;gdonate_list,</div><div class='add'>+					&amp;sbi-&gt;inode_list[DONATE_INODE]);</div><div class='add'>+		}</div><div class='add'>+		F2FS_I(inode)-&gt;donate_start = start;</div><div class='add'>+		F2FS_I(inode)-&gt;donate_end = end - 1;</div><div class='add'>+		clear_inode_flag(inode, FI_DONATE_FINISHED);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;sbi-&gt;inode_lock[DONATE_INODE]);</div><div class='add'>+	inode_unlock(inode);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -2270,15 +2588,14 @@ out:</div><div class='ctx'> static int f2fs_ioc_fitrim(struct file *filp, unsigned long arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(filp);</div><div class='del'>-	struct super_block *sb = inode-&gt;i_sb;</div><div class='del'>-	struct request_queue *q = bdev_get_queue(sb-&gt;s_bdev);</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	struct fstrim_range range;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!capable(CAP_SYS_ADMIN))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='del'>-	if (!f2fs_hw_support_discard(F2FS_SB(sb)))</div><div class='add'>+	if (!f2fs_hw_support_discard(sbi))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='ctx'> 	if (copy_from_user(&amp;range, (struct fstrim_range __user *)arg,</div><div class='hunk'>@@ -2289,9 +2606,9 @@ static int f2fs_ioc_fitrim(struct file *filp, unsigned long arg)</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	range.minlen = max((unsigned int)range.minlen,</div><div class='del'>-				q-&gt;limits.discard_granularity);</div><div class='del'>-	ret = f2fs_trim_fs(F2FS_SB(sb), &amp;range);</div><div class='add'>+	range.minlen = max_t(unsigned int, range.minlen,</div><div class='add'>+			f2fs_hw_discard_granularity(sbi));</div><div class='add'>+	ret = f2fs_trim_fs(sbi, &amp;range);</div><div class='ctx'> 	mnt_drop_write_file(filp);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -2299,7 +2616,7 @@ static int f2fs_ioc_fitrim(struct file *filp, unsigned long arg)</div><div class='ctx'> 	if (copy_to_user((struct fstrim_range __user *)arg, &amp;range,</div><div class='ctx'> 				sizeof(range)))</div><div class='ctx'> 		return -EFAULT;</div><div class='del'>-	f2fs_update_time(F2FS_I_SB(inode), REQ_TIME);</div><div class='add'>+	f2fs_update_time(sbi, REQ_TIME);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2316,13 +2633,14 @@ static bool uuid_is_nonzero(__u8 u[16])</div><div class='ctx'> static int f2fs_ioc_set_encryption_policy(struct file *filp, unsigned long arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(filp);</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!f2fs_sb_has_encrypt(F2FS_I_SB(inode)))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='add'>+	ret = fscrypt_ioctl_set_policy(filp, (const void __user *)arg);</div><div class='ctx'> 	f2fs_update_time(F2FS_I_SB(inode), REQ_TIME);</div><div class='del'>-</div><div class='del'>-	return fscrypt_ioctl_set_policy(filp, (const void __user *)arg);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int f2fs_ioc_get_encryption_policy(struct file *filp, unsigned long arg)</div><div class='hunk'>@@ -2336,6 +2654,7 @@ static int f2fs_ioc_get_encryption_pwsalt(struct file *filp, unsigned long arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(filp);</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='add'>+	u8 encrypt_pw_salt[16];</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (!f2fs_sb_has_encrypt(sbi))</div><div class='hunk'>@@ -2345,7 +2664,7 @@ static int f2fs_ioc_get_encryption_pwsalt(struct file *filp, unsigned long arg)</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;sbi-&gt;sb_lock);</div><div class='add'>+	f2fs_down_write(&amp;sbi-&gt;sb_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (uuid_is_nonzero(sbi-&gt;raw_super-&gt;encrypt_pw_salt))</div><div class='ctx'> 		goto got_it;</div><div class='hunk'>@@ -2360,12 +2679,14 @@ static int f2fs_ioc_get_encryption_pwsalt(struct file *filp, unsigned long arg)</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> 	}</div><div class='ctx'> got_it:</div><div class='del'>-	if (copy_to_user((__u8 __user *)arg, sbi-&gt;raw_super-&gt;encrypt_pw_salt,</div><div class='del'>-									16))</div><div class='del'>-		err = -EFAULT;</div><div class='add'>+	memcpy(encrypt_pw_salt, sbi-&gt;raw_super-&gt;encrypt_pw_salt, 16);</div><div class='ctx'> out_err:</div><div class='del'>-	up_write(&amp;sbi-&gt;sb_lock);</div><div class='add'>+	f2fs_up_write(&amp;sbi-&gt;sb_lock);</div><div class='ctx'> 	mnt_drop_write_file(filp);</div><div class='add'>+</div><div class='add'>+	if (!err &amp;&amp; copy_to_user((__u8 __user *)arg, encrypt_pw_salt, 16))</div><div class='add'>+		err = -EFAULT;</div><div class='add'>+</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2424,6 +2745,10 @@ static int f2fs_ioc_gc(struct file *filp, unsigned long arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(filp);</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='add'>+	struct f2fs_gc_control gc_control = { .victim_segno = NULL_SEGNO,</div><div class='add'>+			.no_bg_gc = false,</div><div class='add'>+			.should_migrate_blocks = false,</div><div class='add'>+			.nr_free_secs = 0 };</div><div class='ctx'> 	__u32 sync;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -2441,15 +2766,18 @@ static int f2fs_ioc_gc(struct file *filp, unsigned long arg)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!sync) {</div><div class='del'>-		if (!down_write_trylock(&amp;sbi-&gt;gc_lock)) {</div><div class='add'>+		if (!f2fs_down_write_trylock(&amp;sbi-&gt;gc_lock)) {</div><div class='ctx'> 			ret = -EBUSY;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='del'>-		down_write(&amp;sbi-&gt;gc_lock);</div><div class='add'>+		f2fs_down_write(&amp;sbi-&gt;gc_lock);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = f2fs_gc(sbi, sync, true, false, NULL_SEGNO);</div><div class='add'>+	gc_control.init_gc_type = sync ? FG_GC : BG_GC;</div><div class='add'>+	gc_control.err_gc_skipped = sync;</div><div class='add'>+	stat_inc_gc_call_count(sbi, FOREGROUND);</div><div class='add'>+	ret = f2fs_gc(sbi, &amp;gc_control);</div><div class='ctx'> out:</div><div class='ctx'> 	mnt_drop_write_file(filp);</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -2458,6 +2786,12 @@ out:</div><div class='ctx'> static int __f2fs_ioc_gc_range(struct file *filp, struct f2fs_gc_range *range)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(file_inode(filp));</div><div class='add'>+	struct f2fs_gc_control gc_control = {</div><div class='add'>+			.init_gc_type = range-&gt;sync ? FG_GC : BG_GC,</div><div class='add'>+			.no_bg_gc = false,</div><div class='add'>+			.should_migrate_blocks = false,</div><div class='add'>+			.err_gc_skipped = range-&gt;sync,</div><div class='add'>+			.nr_free_secs = 0 };</div><div class='ctx'> 	u64 end;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -2477,22 +2811,23 @@ static int __f2fs_ioc_gc_range(struct file *filp, struct f2fs_gc_range *range)</div><div class='ctx'> </div><div class='ctx'> do_more:</div><div class='ctx'> 	if (!range-&gt;sync) {</div><div class='del'>-		if (!down_write_trylock(&amp;sbi-&gt;gc_lock)) {</div><div class='add'>+		if (!f2fs_down_write_trylock(&amp;sbi-&gt;gc_lock)) {</div><div class='ctx'> 			ret = -EBUSY;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='del'>-		down_write(&amp;sbi-&gt;gc_lock);</div><div class='add'>+		f2fs_down_write(&amp;sbi-&gt;gc_lock);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = f2fs_gc(sbi, range-&gt;sync, true, false,</div><div class='del'>-				GET_SEGNO(sbi, range-&gt;start));</div><div class='add'>+	gc_control.victim_segno = GET_SEGNO(sbi, range-&gt;start);</div><div class='add'>+	stat_inc_gc_call_count(sbi, FOREGROUND);</div><div class='add'>+	ret = f2fs_gc(sbi, &amp;gc_control);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		if (ret == -EBUSY)</div><div class='ctx'> 			ret = -EAGAIN;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	range-&gt;start += BLKS_PER_SEC(sbi);</div><div class='add'>+	range-&gt;start += CAP_BLKS_PER_SEC(sbi);</div><div class='ctx'> 	if (range-&gt;start &lt;= end)</div><div class='ctx'> 		goto do_more;</div><div class='ctx'> out:</div><div class='hunk'>@@ -2510,7 +2845,7 @@ static int f2fs_ioc_gc_range(struct file *filp, unsigned long arg)</div><div class='ctx'> 	return __f2fs_ioc_gc_range(filp, &amp;range);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_ioc_write_checkpoint(struct file *filp, unsigned long arg)</div><div class='add'>+static int f2fs_ioc_write_checkpoint(struct file *filp)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(filp);</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='hunk'>@@ -2545,28 +2880,38 @@ static int f2fs_defragment_range(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	struct f2fs_map_blocks map = { .m_next_extent = NULL,</div><div class='ctx'> 					.m_seg_type = NO_CHECK_TYPE,</div><div class='ctx'> 					.m_may_create = false };</div><div class='del'>-	struct extent_info ei = {0, 0, 0};</div><div class='add'>+	struct extent_info ei = {};</div><div class='ctx'> 	pgoff_t pg_start, pg_end, next_pgofs;</div><div class='del'>-	unsigned int blk_per_seg = sbi-&gt;blocks_per_seg;</div><div class='ctx'> 	unsigned int total = 0, sec_num;</div><div class='ctx'> 	block_t blk_end = 0;</div><div class='ctx'> 	bool fragmented = false;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	/* if in-place-update policy is enabled, don't waste time here */</div><div class='del'>-	if (f2fs_should_update_inplace(inode, NULL))</div><div class='del'>-		return -EINVAL;</div><div class='add'>+	f2fs_balance_fs(sbi, true);</div><div class='ctx'> </div><div class='add'>+	inode_lock(inode);</div><div class='ctx'> 	pg_start = range-&gt;start &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	pg_end = (range-&gt;start + range-&gt;len) &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	pg_end = min_t(pgoff_t,</div><div class='add'>+				(range-&gt;start + range-&gt;len) &gt;&gt; PAGE_SHIFT,</div><div class='add'>+				DIV_ROUND_UP(i_size_read(inode), PAGE_SIZE));</div><div class='ctx'> </div><div class='del'>-	f2fs_balance_fs(sbi, true);</div><div class='add'>+	if (is_inode_flag_set(inode, FI_COMPRESS_RELEASED) ||</div><div class='add'>+		f2fs_is_atomic_file(inode)) {</div><div class='add'>+		err = -EINVAL;</div><div class='add'>+		goto unlock_out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	inode_lock(inode);</div><div class='add'>+	/* if in-place-update policy is enabled, don't waste time here */</div><div class='add'>+	set_inode_flag(inode, FI_OPU_WRITE);</div><div class='add'>+	if (f2fs_should_update_inplace(inode, NULL)) {</div><div class='add'>+		err = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* writeback all dirty pages in the range */</div><div class='del'>-	err = filemap_write_and_wait_range(inode-&gt;i_mapping, range-&gt;start,</div><div class='del'>-						range-&gt;start + range-&gt;len - 1);</div><div class='add'>+	err = filemap_write_and_wait_range(inode-&gt;i_mapping,</div><div class='add'>+						pg_start &lt;&lt; PAGE_SHIFT,</div><div class='add'>+						(pg_end &lt;&lt; PAGE_SHIFT) - 1);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -2574,8 +2919,8 @@ static int f2fs_defragment_range(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	 * lookup mapping info in extent cache, skip defragmenting if physical</div><div class='ctx'> 	 * block addresses are continuous.</div><div class='ctx'> 	 */</div><div class='del'>-	if (f2fs_lookup_extent_cache(inode, pg_start, &amp;ei)) {</div><div class='del'>-		if (ei.fofs + ei.len &gt;= pg_end)</div><div class='add'>+	if (f2fs_lookup_read_extent_cache(inode, pg_start, &amp;ei)) {</div><div class='add'>+		if ((pgoff_t)ei.fofs + ei.len &gt;= pg_end)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -2589,7 +2934,7 @@ static int f2fs_defragment_range(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	 */</div><div class='ctx'> 	while (map.m_lblk &lt; pg_end) {</div><div class='ctx'> 		map.m_len = pg_end - map.m_lblk;</div><div class='del'>-		err = f2fs_map_blocks(inode, &amp;map, 0, F2FS_GET_BLOCK_DEFAULT);</div><div class='add'>+		err = f2fs_map_blocks(inode, &amp;map, F2FS_GET_BLOCK_DEFAULT);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -2614,7 +2959,7 @@ static int f2fs_defragment_range(struct f2fs_sb_info *sbi,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	sec_num = DIV_ROUND_UP(total, BLKS_PER_SEC(sbi));</div><div class='add'>+	sec_num = DIV_ROUND_UP(total, CAP_BLKS_PER_SEC(sbi));</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * make sure there are enough free section for LFS allocation, this can</div><div class='hunk'>@@ -2636,7 +2981,7 @@ static int f2fs_defragment_range(struct f2fs_sb_info *sbi,</div><div class='ctx'> </div><div class='ctx'> do_map:</div><div class='ctx'> 		map.m_len = pg_end - map.m_lblk;</div><div class='del'>-		err = f2fs_map_blocks(inode, &amp;map, 0, F2FS_GET_BLOCK_DEFAULT);</div><div class='add'>+		err = f2fs_map_blocks(inode, &amp;map, F2FS_GET_BLOCK_DEFAULT);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto clear_out;</div><div class='ctx'> </div><div class='hunk'>@@ -2645,20 +2990,24 @@ do_map:</div><div class='ctx'> 			goto check;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		set_inode_flag(inode, FI_DO_DEFRAG);</div><div class='add'>+		set_inode_flag(inode, FI_SKIP_WRITES);</div><div class='ctx'> </div><div class='ctx'> 		idx = map.m_lblk;</div><div class='del'>-		while (idx &lt; map.m_lblk + map.m_len &amp;&amp; cnt &lt; blk_per_seg) {</div><div class='del'>-			struct page *page;</div><div class='add'>+		while (idx &lt; map.m_lblk + map.m_len &amp;&amp;</div><div class='add'>+						cnt &lt; BLKS_PER_SEG(sbi)) {</div><div class='add'>+			struct folio *folio;</div><div class='ctx'> </div><div class='del'>-			page = f2fs_get_lock_data_page(inode, idx, true);</div><div class='del'>-			if (IS_ERR(page)) {</div><div class='del'>-				err = PTR_ERR(page);</div><div class='add'>+			folio = f2fs_get_lock_data_folio(inode, idx, true);</div><div class='add'>+			if (IS_ERR(folio)) {</div><div class='add'>+				err = PTR_ERR(folio);</div><div class='ctx'> 				goto clear_out;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			set_page_dirty(page);</div><div class='del'>-			f2fs_put_page(page, 1);</div><div class='add'>+			f2fs_folio_wait_writeback(folio, DATA, true, true);</div><div class='add'>+</div><div class='add'>+			folio_mark_dirty(folio);</div><div class='add'>+			folio_set_f2fs_gcing(folio);</div><div class='add'>+			f2fs_folio_put(folio, true);</div><div class='ctx'> </div><div class='ctx'> 			idx++;</div><div class='ctx'> 			cnt++;</div><div class='hunk'>@@ -2667,18 +3016,20 @@ do_map:</div><div class='ctx'> </div><div class='ctx'> 		map.m_lblk = idx;</div><div class='ctx'> check:</div><div class='del'>-		if (map.m_lblk &lt; pg_end &amp;&amp; cnt &lt; blk_per_seg)</div><div class='add'>+		if (map.m_lblk &lt; pg_end &amp;&amp; cnt &lt; BLKS_PER_SEG(sbi))</div><div class='ctx'> 			goto do_map;</div><div class='ctx'> </div><div class='del'>-		clear_inode_flag(inode, FI_DO_DEFRAG);</div><div class='add'>+		clear_inode_flag(inode, FI_SKIP_WRITES);</div><div class='ctx'> </div><div class='ctx'> 		err = filemap_fdatawrite(inode-&gt;i_mapping);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> clear_out:</div><div class='del'>-	clear_inode_flag(inode, FI_DO_DEFRAG);</div><div class='add'>+	clear_inode_flag(inode, FI_SKIP_WRITES);</div><div class='ctx'> out:</div><div class='add'>+	clear_inode_flag(inode, FI_OPU_WRITE);</div><div class='add'>+unlock_out:</div><div class='ctx'> 	inode_unlock(inode);</div><div class='ctx'> 	if (!err)</div><div class='ctx'> 		range-&gt;len = (u64)total &lt;&lt; PAGE_SHIFT;</div><div class='hunk'>@@ -2695,7 +3046,7 @@ static int f2fs_ioc_defragment(struct file *filp, unsigned long arg)</div><div class='ctx'> 	if (!capable(CAP_SYS_ADMIN))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='del'>-	if (!S_ISREG(inode-&gt;i_mode) || f2fs_is_atomic_file(inode))</div><div class='add'>+	if (!S_ISREG(inode-&gt;i_mode))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	if (f2fs_readonly(sbi-&gt;sb))</div><div class='hunk'>@@ -2720,7 +3071,8 @@ static int f2fs_ioc_defragment(struct file *filp, unsigned long arg)</div><div class='ctx'> 	err = f2fs_defragment_range(sbi, filp, &amp;range);</div><div class='ctx'> 	mnt_drop_write_file(filp);</div><div class='ctx'> </div><div class='del'>-	f2fs_update_time(sbi, REQ_TIME);</div><div class='add'>+	if (range.len)</div><div class='add'>+		f2fs_update_time(sbi, REQ_TIME);</div><div class='ctx'> 	if (err &lt; 0)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='hunk'>@@ -2771,6 +3123,17 @@ static int f2fs_move_file_range(struct file *file_in, loff_t pos_in,</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (f2fs_compressed_file(src) || f2fs_compressed_file(dst) ||</div><div class='add'>+		f2fs_is_pinned_file(src) || f2fs_is_pinned_file(dst)) {</div><div class='add'>+		ret = -EOPNOTSUPP;</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (f2fs_is_atomic_file(src) || f2fs_is_atomic_file(dst)) {</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	ret = -EINVAL;</div><div class='ctx'> 	if (pos_in + len &gt; src-&gt;i_size || pos_in + len &lt; pos_in)</div><div class='ctx'> 		goto out_unlock;</div><div class='hunk'>@@ -2814,17 +3177,17 @@ static int f2fs_move_file_range(struct file *file_in, loff_t pos_in,</div><div class='ctx'> </div><div class='ctx'> 	f2fs_balance_fs(sbi, true);</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;F2FS_I(src)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+	f2fs_down_write(&amp;F2FS_I(src)-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> 	if (src != dst) {</div><div class='ctx'> 		ret = -EBUSY;</div><div class='del'>-		if (!down_write_trylock(&amp;F2FS_I(dst)-&gt;i_gc_rwsem[WRITE]))</div><div class='add'>+		if (!f2fs_down_write_trylock(&amp;F2FS_I(dst)-&gt;i_gc_rwsem[WRITE]))</div><div class='ctx'> 			goto out_src;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	f2fs_lock_op(sbi);</div><div class='del'>-	ret = __exchange_data_block(src, dst, pos_in &gt;&gt; F2FS_BLKSIZE_BITS,</div><div class='del'>-				pos_out &gt;&gt; F2FS_BLKSIZE_BITS,</div><div class='del'>-				len &gt;&gt; F2FS_BLKSIZE_BITS, false);</div><div class='add'>+	ret = __exchange_data_block(src, dst, F2FS_BYTES_TO_BLK(pos_in),</div><div class='add'>+				F2FS_BYTES_TO_BLK(pos_out),</div><div class='add'>+				F2FS_BYTES_TO_BLK(len), false);</div><div class='ctx'> </div><div class='ctx'> 	if (!ret) {</div><div class='ctx'> 		if (dst_max_i_size)</div><div class='hunk'>@@ -2835,9 +3198,20 @@ static int f2fs_move_file_range(struct file *file_in, loff_t pos_in,</div><div class='ctx'> 	f2fs_unlock_op(sbi);</div><div class='ctx'> </div><div class='ctx'> 	if (src != dst)</div><div class='del'>-		up_write(&amp;F2FS_I(dst)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+		f2fs_up_write(&amp;F2FS_I(dst)-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> out_src:</div><div class='del'>-	up_write(&amp;F2FS_I(src)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+	f2fs_up_write(&amp;F2FS_I(src)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_unlock;</div><div class='add'>+</div><div class='add'>+	inode_set_mtime_to_ts(src, inode_set_ctime_current(src));</div><div class='add'>+	f2fs_mark_inode_dirty_sync(src, false);</div><div class='add'>+	if (src != dst) {</div><div class='add'>+		inode_set_mtime_to_ts(dst, inode_set_ctime_current(dst));</div><div class='add'>+		f2fs_mark_inode_dirty_sync(dst, false);</div><div class='add'>+	}</div><div class='add'>+	f2fs_update_time(sbi, REQ_TIME);</div><div class='add'>+</div><div class='ctx'> out_unlock:</div><div class='ctx'> 	if (src != dst)</div><div class='ctx'> 		inode_unlock(dst);</div><div class='hunk'>@@ -2849,32 +3223,27 @@ out:</div><div class='ctx'> static int __f2fs_ioc_move_range(struct file *filp,</div><div class='ctx'> 				struct f2fs_move_range *range)</div><div class='ctx'> {</div><div class='del'>-	struct fd dst;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (!(filp-&gt;f_mode &amp; FMODE_READ) ||</div><div class='ctx'> 			!(filp-&gt;f_mode &amp; FMODE_WRITE))</div><div class='ctx'> 		return -EBADF;</div><div class='ctx'> </div><div class='del'>-	dst = fdget(range-&gt;dst_fd);</div><div class='del'>-	if (!dst.file)</div><div class='add'>+	CLASS(fd, dst)(range-&gt;dst_fd);</div><div class='add'>+	if (fd_empty(dst))</div><div class='ctx'> 		return -EBADF;</div><div class='ctx'> </div><div class='del'>-	if (!(dst.file-&gt;f_mode &amp; FMODE_WRITE)) {</div><div class='del'>-		err = -EBADF;</div><div class='del'>-		goto err_out;</div><div class='del'>-	}</div><div class='add'>+	if (!(fd_file(dst)-&gt;f_mode &amp; FMODE_WRITE))</div><div class='add'>+		return -EBADF;</div><div class='ctx'> </div><div class='ctx'> 	err = mnt_want_write_file(filp);</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto err_out;</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='del'>-	err = f2fs_move_file_range(filp, range-&gt;pos_in, dst.file,</div><div class='add'>+	err = f2fs_move_file_range(filp, range-&gt;pos_in, fd_file(dst),</div><div class='ctx'> 					range-&gt;pos_out, range-&gt;len);</div><div class='ctx'> </div><div class='ctx'> 	mnt_drop_write_file(filp);</div><div class='del'>-err_out:</div><div class='del'>-	fdput(dst);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2896,6 +3265,11 @@ static int f2fs_ioc_flush_device(struct file *filp, unsigned long arg)</div><div class='ctx'> 	unsigned int start_segno = 0, end_segno = 0;</div><div class='ctx'> 	unsigned int dev_start_segno = 0, dev_end_segno = 0;</div><div class='ctx'> 	struct f2fs_flush_device range;</div><div class='add'>+	struct f2fs_gc_control gc_control = {</div><div class='add'>+			.init_gc_type = FG_GC,</div><div class='add'>+			.should_migrate_blocks = true,</div><div class='add'>+			.err_gc_skipped = true,</div><div class='add'>+			.nr_free_secs = 0 };</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!capable(CAP_SYS_ADMIN))</div><div class='hunk'>@@ -2913,8 +3287,8 @@ static int f2fs_ioc_flush_device(struct file *filp, unsigned long arg)</div><div class='ctx'> </div><div class='ctx'> 	if (!f2fs_is_multi_device(sbi) || sbi-&gt;s_ndevs - 1 &lt;= range.dev_num ||</div><div class='ctx'> 			__is_large_section(sbi)) {</div><div class='del'>-		f2fs_warn(sbi, "Can't flush %u in %d for segs_per_sec %u != 1",</div><div class='del'>-			  range.dev_num, sbi-&gt;s_ndevs, sbi-&gt;segs_per_sec);</div><div class='add'>+		f2fs_warn(sbi, "Can't flush %u in %d for SEGS_PER_SEC %u != 1",</div><div class='add'>+			  range.dev_num, sbi-&gt;s_ndevs, SEGS_PER_SEC(sbi));</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -2932,14 +3306,17 @@ static int f2fs_ioc_flush_device(struct file *filp, unsigned long arg)</div><div class='ctx'> 	end_segno = min(start_segno + range.segments, dev_end_segno);</div><div class='ctx'> </div><div class='ctx'> 	while (start_segno &lt; end_segno) {</div><div class='del'>-		if (!down_write_trylock(&amp;sbi-&gt;gc_lock)) {</div><div class='add'>+		if (!f2fs_down_write_trylock(&amp;sbi-&gt;gc_lock)) {</div><div class='ctx'> 			ret = -EBUSY;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 		sm-&gt;last_victim[GC_CB] = end_segno + 1;</div><div class='ctx'> 		sm-&gt;last_victim[GC_GREEDY] = end_segno + 1;</div><div class='ctx'> 		sm-&gt;last_victim[ALLOC_NEXT] = end_segno + 1;</div><div class='del'>-		ret = f2fs_gc(sbi, true, true, true, start_segno);</div><div class='add'>+</div><div class='add'>+		gc_control.victim_segno = start_segno;</div><div class='add'>+		stat_inc_gc_call_count(sbi, FOREGROUND);</div><div class='add'>+		ret = f2fs_gc(sbi, &amp;gc_control);</div><div class='ctx'> 		if (ret == -EAGAIN)</div><div class='ctx'> 			ret = 0;</div><div class='ctx'> 		else if (ret &lt; 0)</div><div class='hunk'>@@ -2968,15 +3345,16 @@ int f2fs_transfer_project_quota(struct inode *inode, kprojid_t kprojid)</div><div class='ctx'> 	struct dquot *transfer_to[MAXQUOTAS] = {};</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	struct super_block *sb = sbi-&gt;sb;</div><div class='del'>-	int err = 0;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='ctx'> 	transfer_to[PRJQUOTA] = dqget(sb, make_kqid_projid(kprojid));</div><div class='del'>-	if (!IS_ERR(transfer_to[PRJQUOTA])) {</div><div class='del'>-		err = __dquot_transfer(inode, transfer_to);</div><div class='del'>-		if (err)</div><div class='del'>-			set_sbi_flag(sbi, SBI_QUOTA_NEED_REPAIR);</div><div class='del'>-		dqput(transfer_to[PRJQUOTA]);</div><div class='del'>-	}</div><div class='add'>+	if (IS_ERR(transfer_to[PRJQUOTA]))</div><div class='add'>+		return PTR_ERR(transfer_to[PRJQUOTA]);</div><div class='add'>+</div><div class='add'>+	err = __dquot_transfer(inode, transfer_to);</div><div class='add'>+	if (err)</div><div class='add'>+		set_sbi_flag(sbi, SBI_QUOTA_NEED_REPAIR);</div><div class='add'>+	dqput(transfer_to[PRJQUOTA]);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2984,7 +3362,7 @@ static int f2fs_ioc_setproject(struct inode *inode, __u32 projid)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='del'>-	struct page *ipage;</div><div class='add'>+	struct f2fs_inode *ri = NULL;</div><div class='ctx'> 	kprojid_t kprojid;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='hunk'>@@ -3000,7 +3378,7 @@ static int f2fs_ioc_setproject(struct inode *inode, __u32 projid)</div><div class='ctx'> </div><div class='ctx'> 	kprojid = make_kprojid(&amp;init_user_ns, (projid_t)projid);</div><div class='ctx'> </div><div class='del'>-	if (projid_eq(kprojid, F2FS_I(inode)-&gt;i_projid))</div><div class='add'>+	if (projid_eq(kprojid, fi-&gt;i_projid))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	err = -EPERM;</div><div class='hunk'>@@ -3008,17 +3386,8 @@ static int f2fs_ioc_setproject(struct inode *inode, __u32 projid)</div><div class='ctx'> 	if (IS_NOQUOTA(inode))</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	ipage = f2fs_get_node_page(sbi, inode-&gt;i_ino);</div><div class='del'>-	if (IS_ERR(ipage))</div><div class='del'>-		return PTR_ERR(ipage);</div><div class='del'>-</div><div class='del'>-	if (!F2FS_FITS_IN_INODE(F2FS_INODE(ipage), fi-&gt;i_extra_isize,</div><div class='del'>-								i_projid)) {</div><div class='del'>-		err = -EOVERFLOW;</div><div class='del'>-		f2fs_put_page(ipage, 1);</div><div class='del'>-		return err;</div><div class='del'>-	}</div><div class='del'>-	f2fs_put_page(ipage, 1);</div><div class='add'>+	if (!F2FS_FITS_IN_INODE(ri, fi-&gt;i_extra_isize, i_projid))</div><div class='add'>+		return -EOVERFLOW;</div><div class='ctx'> </div><div class='ctx'> 	err = f2fs_dquot_initialize(inode);</div><div class='ctx'> 	if (err)</div><div class='hunk'>@@ -3029,8 +3398,8 @@ static int f2fs_ioc_setproject(struct inode *inode, __u32 projid)</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='del'>-	F2FS_I(inode)-&gt;i_projid = kprojid;</div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	fi-&gt;i_projid = kprojid;</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> 	f2fs_mark_inode_dirty_sync(inode, true);</div><div class='ctx'> out_unlock:</div><div class='ctx'> 	f2fs_unlock_op(sbi);</div><div class='hunk'>@@ -3050,7 +3419,7 @@ static int f2fs_ioc_setproject(struct inode *inode, __u32 projid)</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-int f2fs_fileattr_get(struct dentry *dentry, struct fileattr *fa)</div><div class='add'>+int f2fs_fileattr_get(struct dentry *dentry, struct file_kattr *fa)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='hunk'>@@ -3073,8 +3442,8 @@ int f2fs_fileattr_get(struct dentry *dentry, struct fileattr *fa)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int f2fs_fileattr_set(struct user_namespace *mnt_userns,</div><div class='del'>-		      struct dentry *dentry, struct fileattr *fa)</div><div class='add'>+int f2fs_fileattr_set(struct mnt_idmap *idmap,</div><div class='add'>+		      struct dentry *dentry, struct file_kattr *fa)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	u32 fsflags = fa-&gt;flags, mask = F2FS_SETTABLE_FS_FL;</div><div class='hunk'>@@ -3107,24 +3476,27 @@ int f2fs_pin_file_control(struct inode *inode, bool inc)</div><div class='ctx'> 	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> </div><div class='del'>-	/* Use i_gc_failures for normal file as a risk signal. */</div><div class='del'>-	if (inc)</div><div class='del'>-		f2fs_i_gc_failures_write(inode,</div><div class='del'>-				fi-&gt;i_gc_failures[GC_FAILURE_PIN] + 1);</div><div class='add'>+	if (IS_DEVICE_ALIASING(inode))</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	if (fi-&gt;i_gc_failures[GC_FAILURE_PIN] &gt; sbi-&gt;gc_pin_file_threshold) {</div><div class='add'>+	if (fi-&gt;i_gc_failures &gt;= sbi-&gt;gc_pin_file_threshold) {</div><div class='ctx'> 		f2fs_warn(sbi, "%s: Enable GC = ino %lx after %x GC trials",</div><div class='del'>-			  __func__, inode-&gt;i_ino,</div><div class='del'>-			  fi-&gt;i_gc_failures[GC_FAILURE_PIN]);</div><div class='add'>+			  __func__, inode-&gt;i_ino, fi-&gt;i_gc_failures);</div><div class='ctx'> 		clear_inode_flag(inode, FI_PIN_FILE);</div><div class='ctx'> 		return -EAGAIN;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	/* Use i_gc_failures for normal file as a risk signal. */</div><div class='add'>+	if (inc)</div><div class='add'>+		f2fs_i_gc_failures_write(inode, fi-&gt;i_gc_failures + 1);</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int f2fs_ioc_set_pin_file(struct file *filp, unsigned long arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(filp);</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	__u32 pin;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -3134,16 +3506,19 @@ static int f2fs_ioc_set_pin_file(struct file *filp, unsigned long arg)</div><div class='ctx'> 	if (!S_ISREG(inode-&gt;i_mode))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	if (f2fs_readonly(F2FS_I_SB(inode)-&gt;sb))</div><div class='add'>+	if (f2fs_readonly(sbi-&gt;sb))</div><div class='ctx'> 		return -EROFS;</div><div class='ctx'> </div><div class='add'>+	if (!pin &amp;&amp; IS_DEVICE_ALIASING(inode))</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+</div><div class='ctx'> 	ret = mnt_want_write_file(filp);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='ctx'> 	inode_lock(inode);</div><div class='ctx'> </div><div class='del'>-	if (f2fs_should_update_outplace(inode, NULL)) {</div><div class='add'>+	if (f2fs_is_atomic_file(inode)) {</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3152,6 +3527,20 @@ static int f2fs_ioc_set_pin_file(struct file *filp, unsigned long arg)</div><div class='ctx'> 		clear_inode_flag(inode, FI_PIN_FILE);</div><div class='ctx'> 		f2fs_i_gc_failures_write(inode, 0);</div><div class='ctx'> 		goto done;</div><div class='add'>+	} else if (f2fs_is_pinned_file(inode)) {</div><div class='add'>+		goto done;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (F2FS_HAS_BLOCKS(inode)) {</div><div class='add'>+		ret = -EFBIG;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Let's allow file pinning on zoned device. */</div><div class='add'>+	if (!f2fs_sb_has_blkzoned(sbi) &amp;&amp;</div><div class='add'>+	    f2fs_should_update_outplace(inode, NULL)) {</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (f2fs_pin_file_control(inode, false)) {</div><div class='hunk'>@@ -3169,9 +3558,9 @@ static int f2fs_ioc_set_pin_file(struct file *filp, unsigned long arg)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	set_inode_flag(inode, FI_PIN_FILE);</div><div class='del'>-	ret = F2FS_I(inode)-&gt;i_gc_failures[GC_FAILURE_PIN];</div><div class='add'>+	ret = F2FS_I(inode)-&gt;i_gc_failures;</div><div class='ctx'> done:</div><div class='del'>-	f2fs_update_time(F2FS_I_SB(inode), REQ_TIME);</div><div class='add'>+	f2fs_update_time(sbi, REQ_TIME);</div><div class='ctx'> out:</div><div class='ctx'> 	inode_unlock(inode);</div><div class='ctx'> 	mnt_drop_write_file(filp);</div><div class='hunk'>@@ -3184,10 +3573,33 @@ static int f2fs_ioc_get_pin_file(struct file *filp, unsigned long arg)</div><div class='ctx'> 	__u32 pin = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (is_inode_flag_set(inode, FI_PIN_FILE))</div><div class='del'>-		pin = F2FS_I(inode)-&gt;i_gc_failures[GC_FAILURE_PIN];</div><div class='add'>+		pin = F2FS_I(inode)-&gt;i_gc_failures;</div><div class='ctx'> 	return put_user(pin, (u32 __user *)arg);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int f2fs_ioc_get_dev_alias_file(struct file *filp, unsigned long arg)</div><div class='add'>+{</div><div class='add'>+	return put_user(IS_DEVICE_ALIASING(file_inode(filp)) ? 1 : 0,</div><div class='add'>+			(u32 __user *)arg);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int f2fs_ioc_io_prio(struct file *filp, unsigned long arg)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file_inode(filp);</div><div class='add'>+	__u32 level;</div><div class='add'>+</div><div class='add'>+	if (get_user(level, (__u32 __user *)arg))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+</div><div class='add'>+	if (!S_ISREG(inode-&gt;i_mode) || level &gt;= F2FS_IOPRIO_MAX)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	inode_lock(inode);</div><div class='add'>+	F2FS_I(inode)-&gt;ioprio_hint = level;</div><div class='add'>+	inode_unlock(inode);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> int f2fs_precache_extents(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='hunk'>@@ -3200,19 +3612,20 @@ int f2fs_precache_extents(struct inode *inode)</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='ctx'> 	map.m_lblk = 0;</div><div class='add'>+	map.m_pblk = 0;</div><div class='ctx'> 	map.m_next_pgofs = NULL;</div><div class='ctx'> 	map.m_next_extent = &amp;m_next_extent;</div><div class='ctx'> 	map.m_seg_type = NO_CHECK_TYPE;</div><div class='ctx'> 	map.m_may_create = false;</div><div class='del'>-	end = max_file_blocks(inode);</div><div class='add'>+	end = F2FS_BLK_ALIGN(i_size_read(inode));</div><div class='ctx'> </div><div class='ctx'> 	while (map.m_lblk &lt; end) {</div><div class='ctx'> 		map.m_len = end - map.m_lblk;</div><div class='ctx'> </div><div class='del'>-		down_write(&amp;fi-&gt;i_gc_rwsem[WRITE]);</div><div class='del'>-		err = f2fs_map_blocks(inode, &amp;map, 0, F2FS_GET_BLOCK_PRECACHE);</div><div class='del'>-		up_write(&amp;fi-&gt;i_gc_rwsem[WRITE]);</div><div class='del'>-		if (err)</div><div class='add'>+		f2fs_down_write(&amp;fi-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+		err = f2fs_map_blocks(inode, &amp;map, F2FS_GET_BLOCK_PRECACHE);</div><div class='add'>+		f2fs_up_write(&amp;fi-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+		if (err || !map.m_len)</div><div class='ctx'> 			return err;</div><div class='ctx'> </div><div class='ctx'> 		map.m_lblk = m_next_extent;</div><div class='hunk'>@@ -3221,7 +3634,7 @@ int f2fs_precache_extents(struct inode *inode)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_ioc_precache_extents(struct file *filp, unsigned long arg)</div><div class='add'>+static int f2fs_ioc_precache_extents(struct file *filp)</div><div class='ctx'> {</div><div class='ctx'> 	return f2fs_precache_extents(file_inode(filp));</div><div class='ctx'> }</div><div class='hunk'>@@ -3241,7 +3654,7 @@ static int f2fs_ioc_resize_fs(struct file *filp, unsigned long arg)</div><div class='ctx'> 			   sizeof(block_count)))</div><div class='ctx'> 		return -EFAULT;</div><div class='ctx'> </div><div class='del'>-	return f2fs_resize_fs(sbi, block_count);</div><div class='add'>+	return f2fs_resize_fs(filp, block_count);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int f2fs_ioc_enable_verity(struct file *filp, unsigned long arg)</div><div class='hunk'>@@ -3288,11 +3701,11 @@ static int f2fs_ioc_getfslabel(struct file *filp, unsigned long arg)</div><div class='ctx'> 	if (!vbuf)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;sbi-&gt;sb_lock);</div><div class='add'>+	f2fs_down_read(&amp;sbi-&gt;sb_lock);</div><div class='ctx'> 	count = utf16s_to_utf8s(sbi-&gt;raw_super-&gt;volume_name,</div><div class='ctx'> 			ARRAY_SIZE(sbi-&gt;raw_super-&gt;volume_name),</div><div class='ctx'> 			UTF16_LITTLE_ENDIAN, vbuf, MAX_VOLUME_NAME);</div><div class='del'>-	up_read(&amp;sbi-&gt;sb_lock);</div><div class='add'>+	f2fs_up_read(&amp;sbi-&gt;sb_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (copy_to_user((char __user *)arg, vbuf,</div><div class='ctx'> 				min(FSLABEL_MAX, count)))</div><div class='hunk'>@@ -3320,7 +3733,7 @@ static int f2fs_ioc_setfslabel(struct file *filp, unsigned long arg)</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;sbi-&gt;sb_lock);</div><div class='add'>+	f2fs_down_write(&amp;sbi-&gt;sb_lock);</div><div class='ctx'> </div><div class='ctx'> 	memset(sbi-&gt;raw_super-&gt;volume_name, 0,</div><div class='ctx'> 			sizeof(sbi-&gt;raw_super-&gt;volume_name));</div><div class='hunk'>@@ -3330,7 +3743,7 @@ static int f2fs_ioc_setfslabel(struct file *filp, unsigned long arg)</div><div class='ctx'> </div><div class='ctx'> 	err = f2fs_commit_super(sbi, false);</div><div class='ctx'> </div><div class='del'>-	up_write(&amp;sbi-&gt;sb_lock);</div><div class='add'>+	f2fs_up_write(&amp;sbi-&gt;sb_lock);</div><div class='ctx'> </div><div class='ctx'> 	mnt_drop_write_file(filp);</div><div class='ctx'> out:</div><div class='hunk'>@@ -3338,18 +3751,29 @@ out:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_get_compress_blocks(struct file *filp, unsigned long arg)</div><div class='add'>+static int f2fs_get_compress_blocks(struct inode *inode, __u64 *blocks)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = file_inode(filp);</div><div class='del'>-	__u64 blocks;</div><div class='del'>-</div><div class='ctx'> 	if (!f2fs_sb_has_compression(F2FS_I_SB(inode)))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='ctx'> 	if (!f2fs_compressed_file(inode))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	blocks = atomic_read(&amp;F2FS_I(inode)-&gt;i_compr_blocks);</div><div class='add'>+	*blocks = atomic_read(&amp;F2FS_I(inode)-&gt;i_compr_blocks);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int f2fs_ioc_get_compress_blocks(struct file *filp, unsigned long arg)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file_inode(filp);</div><div class='add'>+	__u64 blocks;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = f2fs_get_compress_blocks(inode, &amp;blocks);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='ctx'> 	return put_user(blocks, (u64 __user *)arg);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3362,7 +3786,7 @@ static int release_compress_blocks(struct dnode_of_data *dn, pgoff_t count)</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; count; i++) {</div><div class='del'>-		blkaddr = data_blkaddr(dn-&gt;inode, dn-&gt;node_page,</div><div class='add'>+		blkaddr = data_blkaddr(dn-&gt;inode, dn-&gt;node_folio,</div><div class='ctx'> 						dn-&gt;ofs_in_node + i);</div><div class='ctx'> </div><div class='ctx'> 		if (!__is_valid_data_blkaddr(blkaddr))</div><div class='hunk'>@@ -3391,8 +3815,7 @@ static int release_compress_blocks(struct dnode_of_data *dn, pgoff_t count)</div><div class='ctx'> 			if (blkaddr != NEW_ADDR)</div><div class='ctx'> 				continue;</div><div class='ctx'> </div><div class='del'>-			dn-&gt;data_blkaddr = NULL_ADDR;</div><div class='del'>-			f2fs_set_data_blkaddr(dn);</div><div class='add'>+			f2fs_set_data_blkaddr(dn, NULL_ADDR);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		f2fs_i_compr_blocks_update(dn-&gt;inode, compr_blocks, false);</div><div class='hunk'>@@ -3410,18 +3833,16 @@ next:</div><div class='ctx'> static int f2fs_release_compress_blocks(struct file *filp, unsigned long arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(filp);</div><div class='add'>+	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	pgoff_t page_idx = 0, last_idx;</div><div class='ctx'> 	unsigned int released_blocks = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int writecount;</div><div class='ctx'> </div><div class='del'>-	if (!f2fs_sb_has_compression(F2FS_I_SB(inode)))</div><div class='add'>+	if (!f2fs_sb_has_compression(sbi))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='del'>-	if (!f2fs_compressed_file(inode))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='ctx'> 	if (f2fs_readonly(sbi-&gt;sb))</div><div class='ctx'> 		return -EROFS;</div><div class='ctx'> </div><div class='hunk'>@@ -3429,7 +3850,7 @@ static int f2fs_release_compress_blocks(struct file *filp, unsigned long arg)</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	f2fs_balance_fs(F2FS_I_SB(inode), true);</div><div class='add'>+	f2fs_balance_fs(sbi, true);</div><div class='ctx'> </div><div class='ctx'> 	inode_lock(inode);</div><div class='ctx'> </div><div class='hunk'>@@ -3440,7 +3861,8 @@ static int f2fs_release_compress_blocks(struct file *filp, unsigned long arg)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (is_inode_flag_set(inode, FI_COMPRESS_RELEASED)) {</div><div class='add'>+	if (!f2fs_compressed_file(inode) ||</div><div class='add'>+		is_inode_flag_set(inode, FI_COMPRESS_RELEASED)) {</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3449,14 +3871,16 @@ static int f2fs_release_compress_blocks(struct file *filp, unsigned long arg)</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='add'>+	if (!atomic_read(&amp;fi-&gt;i_compr_blocks)) {</div><div class='add'>+		ret = -EPERM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	set_inode_flag(inode, FI_COMPRESS_RELEASED);</div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> 	f2fs_mark_inode_dirty_sync(inode, true);</div><div class='ctx'> </div><div class='del'>-	if (!atomic_read(&amp;F2FS_I(inode)-&gt;i_compr_blocks))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	down_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+	f2fs_down_write(&amp;fi-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> 	filemap_invalidate_lock(inode-&gt;i_mapping);</div><div class='ctx'> </div><div class='ctx'> 	last_idx = DIV_ROUND_UP(i_size_read(inode), PAGE_SIZE);</div><div class='hunk'>@@ -3465,9 +3889,12 @@ static int f2fs_release_compress_blocks(struct file *filp, unsigned long arg)</div><div class='ctx'> 		struct dnode_of_data dn;</div><div class='ctx'> 		pgoff_t end_offset, count;</div><div class='ctx'> </div><div class='add'>+		f2fs_lock_op(sbi);</div><div class='add'>+</div><div class='ctx'> 		set_new_dnode(&amp;dn, inode, NULL, NULL, 0);</div><div class='ctx'> 		ret = f2fs_get_dnode_of_data(&amp;dn, page_idx, LOOKUP_NODE);</div><div class='ctx'> 		if (ret) {</div><div class='add'>+			f2fs_unlock_op(sbi);</div><div class='ctx'> 			if (ret == -ENOENT) {</div><div class='ctx'> 				page_idx = f2fs_get_next_page_offset(&amp;dn,</div><div class='ctx'> 								page_idx);</div><div class='hunk'>@@ -3477,14 +3904,16 @@ static int f2fs_release_compress_blocks(struct file *filp, unsigned long arg)</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		end_offset = ADDRS_PER_PAGE(dn.node_page, inode);</div><div class='add'>+		end_offset = ADDRS_PER_PAGE(dn.node_folio, inode);</div><div class='ctx'> 		count = min(end_offset - dn.ofs_in_node, last_idx - page_idx);</div><div class='del'>-		count = round_up(count, F2FS_I(inode)-&gt;i_cluster_size);</div><div class='add'>+		count = round_up(count, fi-&gt;i_cluster_size);</div><div class='ctx'> </div><div class='ctx'> 		ret = release_compress_blocks(&amp;dn, count);</div><div class='ctx'> </div><div class='ctx'> 		f2fs_put_dnode(&amp;dn);</div><div class='ctx'> </div><div class='add'>+		f2fs_unlock_op(sbi);</div><div class='add'>+</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='hunk'>@@ -3493,8 +3922,10 @@ static int f2fs_release_compress_blocks(struct file *filp, unsigned long arg)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	filemap_invalidate_unlock(inode-&gt;i_mapping);</div><div class='del'>-	up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+	f2fs_up_write(&amp;fi-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> out:</div><div class='add'>+	if (released_blocks)</div><div class='add'>+		f2fs_update_time(sbi, REQ_TIME);</div><div class='ctx'> 	inode_unlock(inode);</div><div class='ctx'> </div><div class='ctx'> 	mnt_drop_write_file(filp);</div><div class='hunk'>@@ -3502,29 +3933,29 @@ out:</div><div class='ctx'> 	if (ret &gt;= 0) {</div><div class='ctx'> 		ret = put_user(released_blocks, (u64 __user *)arg);</div><div class='ctx'> 	} else if (released_blocks &amp;&amp;</div><div class='del'>-			atomic_read(&amp;F2FS_I(inode)-&gt;i_compr_blocks)) {</div><div class='add'>+			atomic_read(&amp;fi-&gt;i_compr_blocks)) {</div><div class='ctx'> 		set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='ctx'> 		f2fs_warn(sbi, "%s: partial blocks were released i_ino=%lx "</div><div class='ctx'> 			"iblocks=%llu, released=%u, compr_blocks=%u, "</div><div class='ctx'> 			"run fsck to fix.",</div><div class='ctx'> 			__func__, inode-&gt;i_ino, inode-&gt;i_blocks,</div><div class='ctx'> 			released_blocks,</div><div class='del'>-			atomic_read(&amp;F2FS_I(inode)-&gt;i_compr_blocks));</div><div class='add'>+			atomic_read(&amp;fi-&gt;i_compr_blocks));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int reserve_compress_blocks(struct dnode_of_data *dn, pgoff_t count)</div><div class='add'>+static int reserve_compress_blocks(struct dnode_of_data *dn, pgoff_t count,</div><div class='add'>+		unsigned int *reserved_blocks)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(dn-&gt;inode);</div><div class='del'>-	unsigned int reserved_blocks = 0;</div><div class='ctx'> 	int cluster_size = F2FS_I(dn-&gt;inode)-&gt;i_cluster_size;</div><div class='ctx'> 	block_t blkaddr;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; count; i++) {</div><div class='del'>-		blkaddr = data_blkaddr(dn-&gt;inode, dn-&gt;node_page,</div><div class='add'>+		blkaddr = data_blkaddr(dn-&gt;inode, dn-&gt;node_folio,</div><div class='ctx'> 						dn-&gt;ofs_in_node + i);</div><div class='ctx'> </div><div class='ctx'> 		if (!__is_valid_data_blkaddr(blkaddr))</div><div class='hunk'>@@ -3536,60 +3967,77 @@ static int reserve_compress_blocks(struct dnode_of_data *dn, pgoff_t count)</div><div class='ctx'> </div><div class='ctx'> 	while (count) {</div><div class='ctx'> 		int compr_blocks = 0;</div><div class='del'>-		blkcnt_t reserved;</div><div class='add'>+		blkcnt_t reserved = 0;</div><div class='add'>+		blkcnt_t to_reserved;</div><div class='ctx'> 		int ret;</div><div class='ctx'> </div><div class='del'>-		for (i = 0; i &lt; cluster_size; i++, dn-&gt;ofs_in_node++) {</div><div class='del'>-			blkaddr = f2fs_data_blkaddr(dn);</div><div class='add'>+		for (i = 0; i &lt; cluster_size; i++) {</div><div class='add'>+			blkaddr = data_blkaddr(dn-&gt;inode, dn-&gt;node_folio,</div><div class='add'>+						dn-&gt;ofs_in_node + i);</div><div class='ctx'> </div><div class='ctx'> 			if (i == 0) {</div><div class='del'>-				if (blkaddr == COMPRESS_ADDR)</div><div class='del'>-					continue;</div><div class='del'>-				dn-&gt;ofs_in_node += cluster_size;</div><div class='del'>-				goto next;</div><div class='add'>+				if (blkaddr != COMPRESS_ADDR) {</div><div class='add'>+					dn-&gt;ofs_in_node += cluster_size;</div><div class='add'>+					goto next;</div><div class='add'>+				}</div><div class='add'>+				continue;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='add'>+			/*</div><div class='add'>+			 * compressed cluster was not released due to it</div><div class='add'>+			 * fails in release_compress_blocks(), so NEW_ADDR</div><div class='add'>+			 * is a possible case.</div><div class='add'>+			 */</div><div class='add'>+			if (blkaddr == NEW_ADDR) {</div><div class='add'>+				reserved++;</div><div class='add'>+				continue;</div><div class='add'>+			}</div><div class='ctx'> 			if (__is_valid_data_blkaddr(blkaddr)) {</div><div class='ctx'> 				compr_blocks++;</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		to_reserved = cluster_size - compr_blocks - reserved;</div><div class='ctx'> </div><div class='del'>-			dn-&gt;data_blkaddr = NEW_ADDR;</div><div class='del'>-			f2fs_set_data_blkaddr(dn);</div><div class='add'>+		/* for the case all blocks in cluster were reserved */</div><div class='add'>+		if (reserved &amp;&amp; to_reserved == 1) {</div><div class='add'>+			dn-&gt;ofs_in_node += cluster_size;</div><div class='add'>+			goto next;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		reserved = cluster_size - compr_blocks;</div><div class='del'>-		ret = inc_valid_block_count(sbi, dn-&gt;inode, &amp;reserved);</div><div class='del'>-		if (ret)</div><div class='add'>+		ret = inc_valid_block_count(sbi, dn-&gt;inode,</div><div class='add'>+						&amp;to_reserved, false);</div><div class='add'>+		if (unlikely(ret))</div><div class='ctx'> 			return ret;</div><div class='ctx'> </div><div class='del'>-		if (reserved != cluster_size - compr_blocks)</div><div class='del'>-			return -ENOSPC;</div><div class='add'>+		for (i = 0; i &lt; cluster_size; i++, dn-&gt;ofs_in_node++) {</div><div class='add'>+			if (f2fs_data_blkaddr(dn) == NULL_ADDR)</div><div class='add'>+				f2fs_set_data_blkaddr(dn, NEW_ADDR);</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		f2fs_i_compr_blocks_update(dn-&gt;inode, compr_blocks, true);</div><div class='ctx'> </div><div class='del'>-		reserved_blocks += reserved;</div><div class='add'>+		*reserved_blocks += to_reserved;</div><div class='ctx'> next:</div><div class='ctx'> 		count -= cluster_size;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return reserved_blocks;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int f2fs_reserve_compress_blocks(struct file *filp, unsigned long arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(filp);</div><div class='add'>+	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	pgoff_t page_idx = 0, last_idx;</div><div class='ctx'> 	unsigned int reserved_blocks = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (!f2fs_sb_has_compression(F2FS_I_SB(inode)))</div><div class='add'>+	if (!f2fs_sb_has_compression(sbi))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='del'>-	if (!f2fs_compressed_file(inode))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='ctx'> 	if (f2fs_readonly(sbi-&gt;sb))</div><div class='ctx'> 		return -EROFS;</div><div class='ctx'> </div><div class='hunk'>@@ -3597,19 +4045,20 @@ static int f2fs_reserve_compress_blocks(struct file *filp, unsigned long arg)</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	if (atomic_read(&amp;F2FS_I(inode)-&gt;i_compr_blocks))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	f2fs_balance_fs(F2FS_I_SB(inode), true);</div><div class='add'>+	f2fs_balance_fs(sbi, true);</div><div class='ctx'> </div><div class='ctx'> 	inode_lock(inode);</div><div class='ctx'> </div><div class='del'>-	if (!is_inode_flag_set(inode, FI_COMPRESS_RELEASED)) {</div><div class='add'>+	if (!f2fs_compressed_file(inode) ||</div><div class='add'>+		!is_inode_flag_set(inode, FI_COMPRESS_RELEASED)) {</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 		goto unlock_inode;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+	if (atomic_read(&amp;fi-&gt;i_compr_blocks))</div><div class='add'>+		goto unlock_inode;</div><div class='add'>+</div><div class='add'>+	f2fs_down_write(&amp;fi-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> 	filemap_invalidate_lock(inode-&gt;i_mapping);</div><div class='ctx'> </div><div class='ctx'> 	last_idx = DIV_ROUND_UP(i_size_read(inode), PAGE_SIZE);</div><div class='hunk'>@@ -3618,9 +4067,12 @@ static int f2fs_reserve_compress_blocks(struct file *filp, unsigned long arg)</div><div class='ctx'> 		struct dnode_of_data dn;</div><div class='ctx'> 		pgoff_t end_offset, count;</div><div class='ctx'> </div><div class='add'>+		f2fs_lock_op(sbi);</div><div class='add'>+</div><div class='ctx'> 		set_new_dnode(&amp;dn, inode, NULL, NULL, 0);</div><div class='ctx'> 		ret = f2fs_get_dnode_of_data(&amp;dn, page_idx, LOOKUP_NODE);</div><div class='ctx'> 		if (ret) {</div><div class='add'>+			f2fs_unlock_op(sbi);</div><div class='ctx'> 			if (ret == -ENOENT) {</div><div class='ctx'> 				page_idx = f2fs_get_next_page_offset(&amp;dn,</div><div class='ctx'> 								page_idx);</div><div class='hunk'>@@ -3630,45 +4082,47 @@ static int f2fs_reserve_compress_blocks(struct file *filp, unsigned long arg)</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		end_offset = ADDRS_PER_PAGE(dn.node_page, inode);</div><div class='add'>+		end_offset = ADDRS_PER_PAGE(dn.node_folio, inode);</div><div class='ctx'> 		count = min(end_offset - dn.ofs_in_node, last_idx - page_idx);</div><div class='del'>-		count = round_up(count, F2FS_I(inode)-&gt;i_cluster_size);</div><div class='add'>+		count = round_up(count, fi-&gt;i_cluster_size);</div><div class='ctx'> </div><div class='del'>-		ret = reserve_compress_blocks(&amp;dn, count);</div><div class='add'>+		ret = reserve_compress_blocks(&amp;dn, count, &amp;reserved_blocks);</div><div class='ctx'> </div><div class='ctx'> 		f2fs_put_dnode(&amp;dn);</div><div class='ctx'> </div><div class='add'>+		f2fs_unlock_op(sbi);</div><div class='add'>+</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='ctx'> 		page_idx += count;</div><div class='del'>-		reserved_blocks += ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	filemap_invalidate_unlock(inode-&gt;i_mapping);</div><div class='del'>-	up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+	f2fs_up_write(&amp;fi-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> </div><div class='del'>-	if (ret &gt;= 0) {</div><div class='add'>+	if (!ret) {</div><div class='ctx'> 		clear_inode_flag(inode, FI_COMPRESS_RELEASED);</div><div class='del'>-		inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+		inode_set_ctime_current(inode);</div><div class='ctx'> 		f2fs_mark_inode_dirty_sync(inode, true);</div><div class='ctx'> 	}</div><div class='ctx'> unlock_inode:</div><div class='add'>+	if (reserved_blocks)</div><div class='add'>+		f2fs_update_time(sbi, REQ_TIME);</div><div class='ctx'> 	inode_unlock(inode);</div><div class='del'>-out:</div><div class='ctx'> 	mnt_drop_write_file(filp);</div><div class='ctx'> </div><div class='del'>-	if (ret &gt;= 0) {</div><div class='add'>+	if (!ret) {</div><div class='ctx'> 		ret = put_user(reserved_blocks, (u64 __user *)arg);</div><div class='ctx'> 	} else if (reserved_blocks &amp;&amp;</div><div class='del'>-			atomic_read(&amp;F2FS_I(inode)-&gt;i_compr_blocks)) {</div><div class='add'>+			atomic_read(&amp;fi-&gt;i_compr_blocks)) {</div><div class='ctx'> 		set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='del'>-		f2fs_warn(sbi, "%s: partial blocks were released i_ino=%lx "</div><div class='add'>+		f2fs_warn(sbi, "%s: partial blocks were reserved i_ino=%lx "</div><div class='ctx'> 			"iblocks=%llu, reserved=%u, compr_blocks=%u, "</div><div class='ctx'> 			"run fsck to fix.",</div><div class='ctx'> 			__func__, inode-&gt;i_ino, inode-&gt;i_blocks,</div><div class='ctx'> 			reserved_blocks,</div><div class='del'>-			atomic_read(&amp;F2FS_I(inode)-&gt;i_compr_blocks));</div><div class='add'>+			atomic_read(&amp;fi-&gt;i_compr_blocks));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -3677,18 +4131,18 @@ out:</div><div class='ctx'> static int f2fs_secure_erase(struct block_device *bdev, struct inode *inode,</div><div class='ctx'> 		pgoff_t off, block_t block, block_t len, u32 flags)</div><div class='ctx'> {</div><div class='del'>-	struct request_queue *q = bdev_get_queue(bdev);</div><div class='ctx'> 	sector_t sector = SECTOR_FROM_BLOCK(block);</div><div class='ctx'> 	sector_t nr_sects = SECTOR_FROM_BLOCK(len);</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	if (!q)</div><div class='del'>-		return -ENXIO;</div><div class='del'>-</div><div class='del'>-	if (flags &amp; F2FS_TRIM_FILE_DISCARD)</div><div class='del'>-		ret = blkdev_issue_discard(bdev, sector, nr_sects, GFP_NOFS,</div><div class='del'>-						blk_queue_secure_erase(q) ?</div><div class='del'>-						BLKDEV_DISCARD_SECURE : 0);</div><div class='add'>+	if (flags &amp; F2FS_TRIM_FILE_DISCARD) {</div><div class='add'>+		if (bdev_max_secure_erase_sectors(bdev))</div><div class='add'>+			ret = blkdev_issue_secure_erase(bdev, sector, nr_sects,</div><div class='add'>+					GFP_NOFS);</div><div class='add'>+		else</div><div class='add'>+			ret = blkdev_issue_discard(bdev, sector, nr_sects,</div><div class='add'>+					GFP_NOFS);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (!ret &amp;&amp; (flags &amp; F2FS_TRIM_FILE_ZEROOUT)) {</div><div class='ctx'> 		if (IS_ENCRYPTED(inode))</div><div class='hunk'>@@ -3731,7 +4185,9 @@ static int f2fs_sec_trim_file(struct file *filp, unsigned long arg)</div><div class='ctx'> 			 IS_ENCRYPTED(inode) &amp;&amp; f2fs_is_multi_device(sbi)))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='del'>-	file_start_write(filp);</div><div class='add'>+	ret = mnt_want_write_file(filp);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='ctx'> 	inode_lock(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (f2fs_is_atomic_file(inode) || f2fs_compressed_file(inode) ||</div><div class='hunk'>@@ -3764,7 +4220,7 @@ static int f2fs_sec_trim_file(struct file *filp, unsigned long arg)</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto err;</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+	f2fs_down_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> 	filemap_invalidate_lock(mapping);</div><div class='ctx'> </div><div class='ctx'> 	ret = filemap_write_and_wait_range(mapping, range.start,</div><div class='hunk'>@@ -3790,7 +4246,7 @@ static int f2fs_sec_trim_file(struct file *filp, unsigned long arg)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		end_offset = ADDRS_PER_PAGE(dn.node_page, inode);</div><div class='add'>+		end_offset = ADDRS_PER_PAGE(dn.node_folio, inode);</div><div class='ctx'> 		count = min(end_offset - dn.ofs_in_node, pg_end - index);</div><div class='ctx'> 		for (i = 0; i &lt; count; i++, index++, dn.ofs_in_node++) {</div><div class='ctx'> 			struct block_device *cur_bdev;</div><div class='hunk'>@@ -3851,12 +4307,13 @@ static int f2fs_sec_trim_file(struct file *filp, unsigned long arg)</div><div class='ctx'> 	if (len)</div><div class='ctx'> 		ret = f2fs_secure_erase(prev_bdev, inode, prev_index,</div><div class='ctx'> 				prev_block, len, range.flags);</div><div class='add'>+	f2fs_update_time(sbi, REQ_TIME);</div><div class='ctx'> out:</div><div class='ctx'> 	filemap_invalidate_unlock(mapping);</div><div class='del'>-	up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+	f2fs_up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> err:</div><div class='ctx'> 	inode_unlock(inode);</div><div class='del'>-	file_end_write(filp);</div><div class='add'>+	mnt_drop_write_file(filp);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -3891,6 +4348,7 @@ static int f2fs_ioc_get_compress_option(struct file *filp, unsigned long arg)</div><div class='ctx'> static int f2fs_ioc_set_compress_option(struct file *filp, unsigned long arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(filp);</div><div class='add'>+	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	struct f2fs_comp_option option;</div><div class='ctx'> 	int ret = 0;</div><div class='hunk'>@@ -3905,36 +4363,53 @@ static int f2fs_ioc_set_compress_option(struct file *filp, unsigned long arg)</div><div class='ctx'> 				sizeof(option)))</div><div class='ctx'> 		return -EFAULT;</div><div class='ctx'> </div><div class='del'>-	if (!f2fs_compressed_file(inode) ||</div><div class='del'>-			option.log_cluster_size &lt; MIN_COMPRESS_LOG_SIZE ||</div><div class='del'>-			option.log_cluster_size &gt; MAX_COMPRESS_LOG_SIZE ||</div><div class='del'>-			option.algorithm &gt;= COMPRESS_MAX)</div><div class='add'>+	if (option.log_cluster_size &lt; MIN_COMPRESS_LOG_SIZE ||</div><div class='add'>+		option.log_cluster_size &gt; MAX_COMPRESS_LOG_SIZE ||</div><div class='add'>+		option.algorithm &gt;= COMPRESS_MAX)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	file_start_write(filp);</div><div class='add'>+	ret = mnt_want_write_file(filp);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='ctx'> 	inode_lock(inode);</div><div class='ctx'> </div><div class='add'>+	f2fs_down_write(&amp;F2FS_I(inode)-&gt;i_sem);</div><div class='add'>+	if (!f2fs_compressed_file(inode)) {</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (f2fs_is_mmap_file(inode) || get_dirty_pages(inode)) {</div><div class='ctx'> 		ret = -EBUSY;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (inode-&gt;i_size != 0) {</div><div class='add'>+	if (F2FS_HAS_BLOCKS(inode)) {</div><div class='ctx'> 		ret = -EFBIG;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	F2FS_I(inode)-&gt;i_compress_algorithm = option.algorithm;</div><div class='del'>-	F2FS_I(inode)-&gt;i_log_cluster_size = option.log_cluster_size;</div><div class='del'>-	F2FS_I(inode)-&gt;i_cluster_size = 1 &lt;&lt; option.log_cluster_size;</div><div class='add'>+	fi-&gt;i_compress_algorithm = option.algorithm;</div><div class='add'>+	fi-&gt;i_log_cluster_size = option.log_cluster_size;</div><div class='add'>+	fi-&gt;i_cluster_size = BIT(option.log_cluster_size);</div><div class='add'>+	/* Set default level */</div><div class='add'>+	if (fi-&gt;i_compress_algorithm == COMPRESS_ZSTD)</div><div class='add'>+		fi-&gt;i_compress_level = F2FS_ZSTD_DEFAULT_CLEVEL;</div><div class='add'>+	else</div><div class='add'>+		fi-&gt;i_compress_level = 0;</div><div class='add'>+	/* Adjust mount option level */</div><div class='add'>+	if (option.algorithm == F2FS_OPTION(sbi).compress_algorithm &amp;&amp;</div><div class='add'>+	    F2FS_OPTION(sbi).compress_level)</div><div class='add'>+		fi-&gt;i_compress_level = F2FS_OPTION(sbi).compress_level;</div><div class='ctx'> 	f2fs_mark_inode_dirty_sync(inode, true);</div><div class='ctx'> </div><div class='ctx'> 	if (!f2fs_is_compress_backend_ready(inode))</div><div class='ctx'> 		f2fs_warn(sbi, "compression algorithm is successfully set, "</div><div class='ctx'> 			"but current kernel doesn't support this algorithm.");</div><div class='ctx'> out:</div><div class='add'>+	f2fs_up_write(&amp;fi-&gt;i_sem);</div><div class='ctx'> 	inode_unlock(inode);</div><div class='del'>-	file_end_write(filp);</div><div class='add'>+	mnt_drop_write_file(filp);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -3943,44 +4418,47 @@ static int redirty_blocks(struct inode *inode, pgoff_t page_idx, int len)</div><div class='ctx'> {</div><div class='ctx'> 	DEFINE_READAHEAD(ractl, NULL, NULL, inode-&gt;i_mapping, page_idx);</div><div class='ctx'> 	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	pgoff_t redirty_idx = page_idx;</div><div class='del'>-	int i, page_len = 0, ret = 0;</div><div class='add'>+	int page_len = 0, ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	page_cache_ra_unbounded(&amp;ractl, len, 0);</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; len; i++, page_idx++) {</div><div class='del'>-		page = read_cache_page(mapping, page_idx, NULL, NULL);</div><div class='del'>-		if (IS_ERR(page)) {</div><div class='del'>-			ret = PTR_ERR(page);</div><div class='add'>+	do {</div><div class='add'>+		folio = read_cache_folio(mapping, page_idx, NULL, NULL);</div><div class='add'>+		if (IS_ERR(folio)) {</div><div class='add'>+			ret = PTR_ERR(folio);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-		page_len++;</div><div class='del'>-	}</div><div class='add'>+		page_len += folio_nr_pages(folio) - (page_idx - folio-&gt;index);</div><div class='add'>+		page_idx = folio_next_index(folio);</div><div class='add'>+	} while (page_len &lt; len);</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; page_len; i++, redirty_idx++) {</div><div class='del'>-		page = find_lock_page(mapping, redirty_idx);</div><div class='del'>-		if (!page) {</div><div class='del'>-			ret = -ENOMEM;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		set_page_dirty(page);</div><div class='del'>-		f2fs_put_page(page, 1);</div><div class='del'>-		f2fs_put_page(page, 0);</div><div class='del'>-	}</div><div class='add'>+	do {</div><div class='add'>+		folio = filemap_lock_folio(mapping, redirty_idx);</div><div class='add'>+</div><div class='add'>+		/* It will never fail, when folio has pinned above */</div><div class='add'>+		f2fs_bug_on(F2FS_I_SB(inode), IS_ERR(folio));</div><div class='add'>+</div><div class='add'>+		f2fs_folio_wait_writeback(folio, DATA, true, true);</div><div class='add'>+</div><div class='add'>+		folio_mark_dirty(folio);</div><div class='add'>+		folio_set_f2fs_gcing(folio);</div><div class='add'>+		redirty_idx = folio_next_index(folio);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put_refs(folio, 2);</div><div class='add'>+	} while (redirty_idx &lt; page_idx);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_ioc_decompress_file(struct file *filp, unsigned long arg)</div><div class='add'>+static int f2fs_ioc_decompress_file(struct file *filp)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(filp);</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='del'>-	pgoff_t page_idx = 0, last_idx;</div><div class='del'>-	unsigned int blk_per_seg = sbi-&gt;blocks_per_seg;</div><div class='del'>-	int cluster_size = F2FS_I(inode)-&gt;i_cluster_size;</div><div class='del'>-	int count, ret;</div><div class='add'>+	pgoff_t page_idx = 0, last_idx, cluster_idx;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!f2fs_sb_has_compression(sbi) ||</div><div class='ctx'> 			F2FS_OPTION(sbi).compress_mode != COMPR_MODE_USER)</div><div class='hunk'>@@ -3989,12 +4467,11 @@ static int f2fs_ioc_decompress_file(struct file *filp, unsigned long arg)</div><div class='ctx'> 	if (!(filp-&gt;f_mode &amp; FMODE_WRITE))</div><div class='ctx'> 		return -EBADF;</div><div class='ctx'> </div><div class='del'>-	if (!f2fs_compressed_file(inode))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	f2fs_balance_fs(F2FS_I_SB(inode), true);</div><div class='add'>+	f2fs_balance_fs(sbi, true);</div><div class='ctx'> </div><div class='del'>-	file_start_write(filp);</div><div class='add'>+	ret = mnt_want_write_file(filp);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='ctx'> 	inode_lock(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (!f2fs_is_compress_backend_ready(inode)) {</div><div class='hunk'>@@ -4002,8 +4479,9 @@ static int f2fs_ioc_decompress_file(struct file *filp, unsigned long arg)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (f2fs_is_mmap_file(inode)) {</div><div class='del'>-		ret = -EBUSY;</div><div class='add'>+	if (!f2fs_compressed_file(inode) ||</div><div class='add'>+		is_inode_flag_set(inode, FI_COMPRESS_RELEASED)) {</div><div class='add'>+		ret = -EINVAL;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -4015,20 +4493,29 @@ static int f2fs_ioc_decompress_file(struct file *filp, unsigned long arg)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	last_idx = DIV_ROUND_UP(i_size_read(inode), PAGE_SIZE);</div><div class='add'>+	last_idx &gt;&gt;= fi-&gt;i_log_cluster_size;</div><div class='ctx'> </div><div class='del'>-	count = last_idx - page_idx;</div><div class='del'>-	while (count) {</div><div class='del'>-		int len = min(cluster_size, count);</div><div class='add'>+	for (cluster_idx = 0; cluster_idx &lt; last_idx; cluster_idx++) {</div><div class='add'>+		page_idx = cluster_idx &lt;&lt; fi-&gt;i_log_cluster_size;</div><div class='ctx'> </div><div class='del'>-		ret = redirty_blocks(inode, page_idx, len);</div><div class='add'>+		if (!f2fs_is_compressed_cluster(inode, page_idx))</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		ret = redirty_blocks(inode, page_idx, fi-&gt;i_cluster_size);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		if (get_dirty_pages(inode) &gt;= blk_per_seg)</div><div class='del'>-			filemap_fdatawrite(inode-&gt;i_mapping);</div><div class='add'>+		if (get_dirty_pages(inode) &gt;= BLKS_PER_SEG(sbi)) {</div><div class='add'>+			ret = filemap_fdatawrite(inode-&gt;i_mapping);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				break;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-		count -= len;</div><div class='del'>-		page_idx += len;</div><div class='add'>+		cond_resched();</div><div class='add'>+		if (fatal_signal_pending(current)) {</div><div class='add'>+			ret = -EINTR;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!ret)</div><div class='hunk'>@@ -4038,21 +4525,21 @@ static int f2fs_ioc_decompress_file(struct file *filp, unsigned long arg)</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		f2fs_warn(sbi, "%s: The file might be partially decompressed (errno=%d). Please delete the file.",</div><div class='ctx'> 			  __func__, ret);</div><div class='add'>+	f2fs_update_time(sbi, REQ_TIME);</div><div class='ctx'> out:</div><div class='ctx'> 	inode_unlock(inode);</div><div class='del'>-	file_end_write(filp);</div><div class='add'>+	mnt_drop_write_file(filp);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_ioc_compress_file(struct file *filp, unsigned long arg)</div><div class='add'>+static int f2fs_ioc_compress_file(struct file *filp)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(filp);</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='del'>-	pgoff_t page_idx = 0, last_idx;</div><div class='del'>-	unsigned int blk_per_seg = sbi-&gt;blocks_per_seg;</div><div class='del'>-	int cluster_size = F2FS_I(inode)-&gt;i_cluster_size;</div><div class='del'>-	int count, ret;</div><div class='add'>+	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='add'>+	pgoff_t page_idx = 0, last_idx, cluster_idx;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!f2fs_sb_has_compression(sbi) ||</div><div class='ctx'> 			F2FS_OPTION(sbi).compress_mode != COMPR_MODE_USER)</div><div class='hunk'>@@ -4061,12 +4548,11 @@ static int f2fs_ioc_compress_file(struct file *filp, unsigned long arg)</div><div class='ctx'> 	if (!(filp-&gt;f_mode &amp; FMODE_WRITE))</div><div class='ctx'> 		return -EBADF;</div><div class='ctx'> </div><div class='del'>-	if (!f2fs_compressed_file(inode))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	f2fs_balance_fs(F2FS_I_SB(inode), true);</div><div class='add'>+	f2fs_balance_fs(sbi, true);</div><div class='ctx'> </div><div class='del'>-	file_start_write(filp);</div><div class='add'>+	ret = mnt_want_write_file(filp);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='ctx'> 	inode_lock(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (!f2fs_is_compress_backend_ready(inode)) {</div><div class='hunk'>@@ -4074,8 +4560,9 @@ static int f2fs_ioc_compress_file(struct file *filp, unsigned long arg)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (f2fs_is_mmap_file(inode)) {</div><div class='del'>-		ret = -EBUSY;</div><div class='add'>+	if (!f2fs_compressed_file(inode) ||</div><div class='add'>+		is_inode_flag_set(inode, FI_COMPRESS_RELEASED)) {</div><div class='add'>+		ret = -EINVAL;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -4086,20 +4573,29 @@ static int f2fs_ioc_compress_file(struct file *filp, unsigned long arg)</div><div class='ctx'> 	set_inode_flag(inode, FI_ENABLE_COMPRESS);</div><div class='ctx'> </div><div class='ctx'> 	last_idx = DIV_ROUND_UP(i_size_read(inode), PAGE_SIZE);</div><div class='add'>+	last_idx &gt;&gt;= fi-&gt;i_log_cluster_size;</div><div class='ctx'> </div><div class='del'>-	count = last_idx - page_idx;</div><div class='del'>-	while (count) {</div><div class='del'>-		int len = min(cluster_size, count);</div><div class='add'>+	for (cluster_idx = 0; cluster_idx &lt; last_idx; cluster_idx++) {</div><div class='add'>+		page_idx = cluster_idx &lt;&lt; fi-&gt;i_log_cluster_size;</div><div class='ctx'> </div><div class='del'>-		ret = redirty_blocks(inode, page_idx, len);</div><div class='add'>+		if (f2fs_is_sparse_cluster(inode, page_idx))</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		ret = redirty_blocks(inode, page_idx, fi-&gt;i_cluster_size);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		if (get_dirty_pages(inode) &gt;= blk_per_seg)</div><div class='del'>-			filemap_fdatawrite(inode-&gt;i_mapping);</div><div class='add'>+		if (get_dirty_pages(inode) &gt;= BLKS_PER_SEG(sbi)) {</div><div class='add'>+			ret = filemap_fdatawrite(inode-&gt;i_mapping);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				break;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-		count -= len;</div><div class='del'>-		page_idx += len;</div><div class='add'>+		cond_resched();</div><div class='add'>+		if (fatal_signal_pending(current)) {</div><div class='add'>+			ret = -EINTR;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!ret)</div><div class='hunk'>@@ -4111,9 +4607,10 @@ static int f2fs_ioc_compress_file(struct file *filp, unsigned long arg)</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		f2fs_warn(sbi, "%s: The file might be partially compressed (errno=%d). Please delete the file.",</div><div class='ctx'> 			  __func__, ret);</div><div class='add'>+	f2fs_update_time(sbi, REQ_TIME);</div><div class='ctx'> out:</div><div class='ctx'> 	inode_unlock(inode);</div><div class='del'>-	file_end_write(filp);</div><div class='add'>+	mnt_drop_write_file(filp);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -4124,15 +4621,16 @@ static long __f2fs_ioctl(struct file *filp, unsigned int cmd, unsigned long arg)</div><div class='ctx'> 	case FS_IOC_GETVERSION:</div><div class='ctx'> 		return f2fs_ioc_getversion(filp, arg);</div><div class='ctx'> 	case F2FS_IOC_START_ATOMIC_WRITE:</div><div class='del'>-		return f2fs_ioc_start_atomic_write(filp);</div><div class='add'>+		return f2fs_ioc_start_atomic_write(filp, false);</div><div class='add'>+	case F2FS_IOC_START_ATOMIC_REPLACE:</div><div class='add'>+		return f2fs_ioc_start_atomic_write(filp, true);</div><div class='ctx'> 	case F2FS_IOC_COMMIT_ATOMIC_WRITE:</div><div class='ctx'> 		return f2fs_ioc_commit_atomic_write(filp);</div><div class='add'>+	case F2FS_IOC_ABORT_ATOMIC_WRITE:</div><div class='add'>+		return f2fs_ioc_abort_atomic_write(filp);</div><div class='ctx'> 	case F2FS_IOC_START_VOLATILE_WRITE:</div><div class='del'>-		return f2fs_ioc_start_volatile_write(filp);</div><div class='ctx'> 	case F2FS_IOC_RELEASE_VOLATILE_WRITE:</div><div class='del'>-		return f2fs_ioc_release_volatile_write(filp);</div><div class='del'>-	case F2FS_IOC_ABORT_VOLATILE_WRITE:</div><div class='del'>-		return f2fs_ioc_abort_volatile_write(filp);</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='ctx'> 	case F2FS_IOC_SHUTDOWN:</div><div class='ctx'> 		return f2fs_ioc_shutdown(filp, arg);</div><div class='ctx'> 	case FITRIM:</div><div class='hunk'>@@ -4160,7 +4658,7 @@ static long __f2fs_ioctl(struct file *filp, unsigned int cmd, unsigned long arg)</div><div class='ctx'> 	case F2FS_IOC_GARBAGE_COLLECT_RANGE:</div><div class='ctx'> 		return f2fs_ioc_gc_range(filp, arg);</div><div class='ctx'> 	case F2FS_IOC_WRITE_CHECKPOINT:</div><div class='del'>-		return f2fs_ioc_write_checkpoint(filp, arg);</div><div class='add'>+		return f2fs_ioc_write_checkpoint(filp);</div><div class='ctx'> 	case F2FS_IOC_DEFRAGMENT:</div><div class='ctx'> 		return f2fs_ioc_defragment(filp, arg);</div><div class='ctx'> 	case F2FS_IOC_MOVE_RANGE:</div><div class='hunk'>@@ -4174,7 +4672,7 @@ static long __f2fs_ioctl(struct file *filp, unsigned int cmd, unsigned long arg)</div><div class='ctx'> 	case F2FS_IOC_SET_PIN_FILE:</div><div class='ctx'> 		return f2fs_ioc_set_pin_file(filp, arg);</div><div class='ctx'> 	case F2FS_IOC_PRECACHE_EXTENTS:</div><div class='del'>-		return f2fs_ioc_precache_extents(filp, arg);</div><div class='add'>+		return f2fs_ioc_precache_extents(filp);</div><div class='ctx'> 	case F2FS_IOC_RESIZE_FS:</div><div class='ctx'> 		return f2fs_ioc_resize_fs(filp, arg);</div><div class='ctx'> 	case FS_IOC_ENABLE_VERITY:</div><div class='hunk'>@@ -4188,7 +4686,7 @@ static long __f2fs_ioctl(struct file *filp, unsigned int cmd, unsigned long arg)</div><div class='ctx'> 	case FS_IOC_SETFSLABEL:</div><div class='ctx'> 		return f2fs_ioc_setfslabel(filp, arg);</div><div class='ctx'> 	case F2FS_IOC_GET_COMPRESS_BLOCKS:</div><div class='del'>-		return f2fs_get_compress_blocks(filp, arg);</div><div class='add'>+		return f2fs_ioc_get_compress_blocks(filp, arg);</div><div class='ctx'> 	case F2FS_IOC_RELEASE_COMPRESS_BLOCKS:</div><div class='ctx'> 		return f2fs_release_compress_blocks(filp, arg);</div><div class='ctx'> 	case F2FS_IOC_RESERVE_COMPRESS_BLOCKS:</div><div class='hunk'>@@ -4200,9 +4698,13 @@ static long __f2fs_ioctl(struct file *filp, unsigned int cmd, unsigned long arg)</div><div class='ctx'> 	case F2FS_IOC_SET_COMPRESS_OPTION:</div><div class='ctx'> 		return f2fs_ioc_set_compress_option(filp, arg);</div><div class='ctx'> 	case F2FS_IOC_DECOMPRESS_FILE:</div><div class='del'>-		return f2fs_ioc_decompress_file(filp, arg);</div><div class='add'>+		return f2fs_ioc_decompress_file(filp);</div><div class='ctx'> 	case F2FS_IOC_COMPRESS_FILE:</div><div class='del'>-		return f2fs_ioc_compress_file(filp, arg);</div><div class='add'>+		return f2fs_ioc_compress_file(filp);</div><div class='add'>+	case F2FS_IOC_GET_DEV_ALIAS_FILE:</div><div class='add'>+		return f2fs_ioc_get_dev_alias_file(filp, arg);</div><div class='add'>+	case F2FS_IOC_IO_PRIO:</div><div class='add'>+		return f2fs_ioc_io_prio(filp, arg);</div><div class='ctx'> 	default:</div><div class='ctx'> 		return -ENOTTY;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -4218,27 +4720,476 @@ long f2fs_ioctl(struct file *filp, unsigned int cmd, unsigned long arg)</div><div class='ctx'> 	return __f2fs_ioctl(filp, cmd, arg);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static ssize_t f2fs_file_read_iter(struct kiocb *iocb, struct iov_iter *iter)</div><div class='add'>+/*</div><div class='add'>+ * Return %true if the given read or write request should use direct I/O, or</div><div class='add'>+ * %false if it should use buffered I/O.</div><div class='add'>+ */</div><div class='add'>+static bool f2fs_should_use_dio(struct inode *inode, struct kiocb *iocb,</div><div class='add'>+				struct iov_iter *iter)</div><div class='add'>+{</div><div class='add'>+	unsigned int align;</div><div class='add'>+</div><div class='add'>+	if (!(iocb-&gt;ki_flags &amp; IOCB_DIRECT))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	if (f2fs_force_buffered_io(inode, iov_iter_rw(iter)))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Direct I/O not aligned to the disk's logical_block_size will be</div><div class='add'>+	 * attempted, but will fail with -EINVAL.</div><div class='add'>+	 *</div><div class='add'>+	 * f2fs additionally requires that direct I/O be aligned to the</div><div class='add'>+	 * filesystem block size, which is often a stricter requirement.</div><div class='add'>+	 * However, f2fs traditionally falls back to buffered I/O on requests</div><div class='add'>+	 * that are logical_block_size-aligned but not fs-block aligned.</div><div class='add'>+	 *</div><div class='add'>+	 * The below logic implements this behavior.</div><div class='add'>+	 */</div><div class='add'>+	align = iocb-&gt;ki_pos | iov_iter_alignment(iter);</div><div class='add'>+	if (!IS_ALIGNED(align, i_blocksize(inode)) &amp;&amp;</div><div class='add'>+	    IS_ALIGNED(align, bdev_logical_block_size(inode-&gt;i_sb-&gt;s_bdev)))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int f2fs_dio_read_end_io(struct kiocb *iocb, ssize_t size, int error,</div><div class='add'>+				unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(file_inode(iocb-&gt;ki_filp));</div><div class='add'>+</div><div class='add'>+	dec_page_count(sbi, F2FS_DIO_READ);</div><div class='add'>+	if (error)</div><div class='add'>+		return error;</div><div class='add'>+	f2fs_update_iostat(sbi, NULL, APP_DIRECT_READ_IO, size);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct iomap_dio_ops f2fs_iomap_dio_read_ops = {</div><div class='add'>+	.end_io = f2fs_dio_read_end_io,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static ssize_t f2fs_dio_read_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='ctx'> {</div><div class='ctx'> 	struct file *file = iocb-&gt;ki_filp;</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='del'>-	int ret;</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='add'>+	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='add'>+	const loff_t pos = iocb-&gt;ki_pos;</div><div class='add'>+	const size_t count = iov_iter_count(to);</div><div class='add'>+	struct iomap_dio *dio;</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	if (count == 0)</div><div class='add'>+		return 0; /* skip atime update */</div><div class='add'>+</div><div class='add'>+	trace_f2fs_direct_IO_enter(inode, iocb, count, READ);</div><div class='add'>+</div><div class='add'>+	if (iocb-&gt;ki_flags &amp; IOCB_NOWAIT) {</div><div class='add'>+		if (!f2fs_down_read_trylock(&amp;fi-&gt;i_gc_rwsem[READ])) {</div><div class='add'>+			ret = -EAGAIN;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		f2fs_down_read(&amp;fi-&gt;i_gc_rwsem[READ]);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* dio is not compatible w/ atomic file */</div><div class='add'>+	if (f2fs_is_atomic_file(inode)) {</div><div class='add'>+		f2fs_up_read(&amp;fi-&gt;i_gc_rwsem[READ]);</div><div class='add'>+		ret = -EOPNOTSUPP;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We have to use __iomap_dio_rw() and iomap_dio_complete() instead of</div><div class='add'>+	 * the higher-level function iomap_dio_rw() in order to ensure that the</div><div class='add'>+	 * F2FS_DIO_READ counter will be decremented correctly in all cases.</div><div class='add'>+	 */</div><div class='add'>+	inc_page_count(sbi, F2FS_DIO_READ);</div><div class='add'>+	dio = __iomap_dio_rw(iocb, to, &amp;f2fs_iomap_ops,</div><div class='add'>+			     &amp;f2fs_iomap_dio_read_ops, 0, NULL, 0);</div><div class='add'>+	if (IS_ERR_OR_NULL(dio)) {</div><div class='add'>+		ret = PTR_ERR_OR_ZERO(dio);</div><div class='add'>+		if (ret != -EIOCBQUEUED)</div><div class='add'>+			dec_page_count(sbi, F2FS_DIO_READ);</div><div class='add'>+	} else {</div><div class='add'>+		ret = iomap_dio_complete(dio);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	f2fs_up_read(&amp;fi-&gt;i_gc_rwsem[READ]);</div><div class='add'>+</div><div class='add'>+	file_accessed(file);</div><div class='add'>+out:</div><div class='add'>+	trace_f2fs_direct_IO_exit(inode, pos, count, READ, ret);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void f2fs_trace_rw_file_path(struct file *file, loff_t pos, size_t count,</div><div class='add'>+				    int rw)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='add'>+	char *buf, *path;</div><div class='add'>+</div><div class='add'>+	buf = f2fs_getname(F2FS_I_SB(inode));</div><div class='add'>+	if (!buf)</div><div class='add'>+		return;</div><div class='add'>+	path = dentry_path_raw(file_dentry(file), buf, PATH_MAX);</div><div class='add'>+	if (IS_ERR(path))</div><div class='add'>+		goto free_buf;</div><div class='add'>+	if (rw == WRITE)</div><div class='add'>+		trace_f2fs_datawrite_start(inode, pos, count,</div><div class='add'>+				current-&gt;pid, path, current-&gt;comm);</div><div class='add'>+	else</div><div class='add'>+		trace_f2fs_dataread_start(inode, pos, count,</div><div class='add'>+				current-&gt;pid, path, current-&gt;comm);</div><div class='add'>+free_buf:</div><div class='add'>+	f2fs_putname(buf);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t f2fs_file_read_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='add'>+	const loff_t pos = iocb-&gt;ki_pos;</div><div class='add'>+	ssize_t ret;</div><div class='add'>+	bool dio;</div><div class='add'>+</div><div class='add'>+	if (!f2fs_is_compress_backend_ready(inode))</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+</div><div class='add'>+	if (trace_f2fs_dataread_start_enabled())</div><div class='add'>+		f2fs_trace_rw_file_path(iocb-&gt;ki_filp, iocb-&gt;ki_pos,</div><div class='add'>+					iov_iter_count(to), READ);</div><div class='add'>+</div><div class='add'>+	dio = f2fs_should_use_dio(inode, iocb, to);</div><div class='add'>+</div><div class='add'>+	/* In LFS mode, if there is inflight dio, wait for its completion */</div><div class='add'>+	if (f2fs_lfs_mode(F2FS_I_SB(inode)) &amp;&amp;</div><div class='add'>+	    get_pages(F2FS_I_SB(inode), F2FS_DIO_WRITE) &amp;&amp;</div><div class='add'>+		(!f2fs_is_pinned_file(inode) || !dio))</div><div class='add'>+		inode_dio_wait(inode);</div><div class='add'>+</div><div class='add'>+	if (dio) {</div><div class='add'>+		ret = f2fs_dio_read_iter(iocb, to);</div><div class='add'>+	} else {</div><div class='add'>+		ret = filemap_read(iocb, to, 0);</div><div class='add'>+		if (ret &gt; 0)</div><div class='add'>+			f2fs_update_iostat(F2FS_I_SB(inode), inode,</div><div class='add'>+						APP_BUFFERED_READ_IO, ret);</div><div class='add'>+	}</div><div class='add'>+	trace_f2fs_dataread_end(inode, pos, ret);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t f2fs_file_splice_read(struct file *in, loff_t *ppos,</div><div class='add'>+				     struct pipe_inode_info *pipe,</div><div class='add'>+				     size_t len, unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file_inode(in);</div><div class='add'>+	const loff_t pos = *ppos;</div><div class='add'>+	ssize_t ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!f2fs_is_compress_backend_ready(inode))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='del'>-	ret = generic_file_read_iter(iocb, iter);</div><div class='add'>+	if (trace_f2fs_dataread_start_enabled())</div><div class='add'>+		f2fs_trace_rw_file_path(in, pos, len, READ);</div><div class='ctx'> </div><div class='add'>+	ret = filemap_splice_read(in, ppos, pipe, len, flags);</div><div class='ctx'> 	if (ret &gt; 0)</div><div class='del'>-		f2fs_update_iostat(F2FS_I_SB(inode), APP_READ_IO, ret);</div><div class='add'>+		f2fs_update_iostat(F2FS_I_SB(inode), inode,</div><div class='add'>+				   APP_BUFFERED_READ_IO, ret);</div><div class='ctx'> </div><div class='add'>+	trace_f2fs_dataread_end(inode, pos, ret);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static ssize_t f2fs_file_write_iter(struct kiocb *iocb, struct iov_iter *from)</div><div class='add'>+static ssize_t f2fs_write_checks(struct kiocb *iocb, struct iov_iter *from)</div><div class='add'>+{</div><div class='add'>+	struct file *file = iocb-&gt;ki_filp;</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='add'>+	ssize_t count;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	if (IS_IMMUTABLE(inode))</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	if (is_inode_flag_set(inode, FI_COMPRESS_RELEASED))</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	count = generic_write_checks(iocb, from);</div><div class='add'>+	if (count &lt;= 0)</div><div class='add'>+		return count;</div><div class='add'>+</div><div class='add'>+	err = file_modified(file);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	f2fs_zero_post_eof_page(inode,</div><div class='add'>+		iocb-&gt;ki_pos + iov_iter_count(from), true);</div><div class='add'>+	return count;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Preallocate blocks for a write request, if it is possible and helpful to do</div><div class='add'>+ * so.  Returns a positive number if blocks may have been preallocated, 0 if no</div><div class='add'>+ * blocks were preallocated, or a negative errno value if something went</div><div class='add'>+ * seriously wrong.  Also sets FI_PREALLOCATED_ALL on the inode if *all* the</div><div class='add'>+ * requested blocks (not just some of them) have been allocated.</div><div class='add'>+ */</div><div class='add'>+static int f2fs_preallocate_blocks(struct kiocb *iocb, struct iov_iter *iter,</div><div class='add'>+				   bool dio)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='add'>+	const loff_t pos = iocb-&gt;ki_pos;</div><div class='add'>+	const size_t count = iov_iter_count(iter);</div><div class='add'>+	struct f2fs_map_blocks map = {};</div><div class='add'>+	int flag;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	/* If it will be an out-of-place direct write, don't bother. */</div><div class='add'>+	if (dio &amp;&amp; f2fs_lfs_mode(sbi))</div><div class='add'>+		return 0;</div><div class='add'>+	/*</div><div class='add'>+	 * Don't preallocate holes aligned to DIO_SKIP_HOLES which turns into</div><div class='add'>+	 * buffered IO, if DIO meets any holes.</div><div class='add'>+	 */</div><div class='add'>+	if (dio &amp;&amp; i_size_read(inode) &amp;&amp;</div><div class='add'>+		(F2FS_BYTES_TO_BLK(pos) &lt; F2FS_BLK_ALIGN(i_size_read(inode))))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/* No-wait I/O can't allocate blocks. */</div><div class='add'>+	if (iocb-&gt;ki_flags &amp; IOCB_NOWAIT)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/* If it will be a short write, don't bother. */</div><div class='add'>+	if (fault_in_iov_iter_readable(iter, count))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if (f2fs_has_inline_data(inode)) {</div><div class='add'>+		/* If the data will fit inline, don't bother. */</div><div class='add'>+		if (pos + count &lt;= MAX_INLINE_DATA(inode))</div><div class='add'>+			return 0;</div><div class='add'>+		ret = f2fs_convert_inline_inode(inode);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Do not preallocate blocks that will be written partially in 4KB. */</div><div class='add'>+	map.m_lblk = F2FS_BLK_ALIGN(pos);</div><div class='add'>+	map.m_len = F2FS_BYTES_TO_BLK(pos + count);</div><div class='add'>+	if (map.m_len &gt; map.m_lblk)</div><div class='add'>+		map.m_len -= map.m_lblk;</div><div class='add'>+	else</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if (!IS_DEVICE_ALIASING(inode))</div><div class='add'>+		map.m_may_create = true;</div><div class='add'>+	if (dio) {</div><div class='add'>+		map.m_seg_type = f2fs_rw_hint_to_seg_type(sbi,</div><div class='add'>+						inode-&gt;i_write_hint);</div><div class='add'>+		flag = F2FS_GET_BLOCK_PRE_DIO;</div><div class='add'>+	} else {</div><div class='add'>+		map.m_seg_type = NO_CHECK_TYPE;</div><div class='add'>+		flag = F2FS_GET_BLOCK_PRE_AIO;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = f2fs_map_blocks(inode, &amp;map, flag);</div><div class='add'>+	/* -ENOSPC|-EDQUOT are fine to report the number of allocated blocks. */</div><div class='add'>+	if (ret &lt; 0 &amp;&amp; !((ret == -ENOSPC || ret == -EDQUOT) &amp;&amp; map.m_len &gt; 0))</div><div class='add'>+		return ret;</div><div class='add'>+	if (ret == 0)</div><div class='add'>+		set_inode_flag(inode, FI_PREALLOCATED_ALL);</div><div class='add'>+	return map.m_len;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t f2fs_buffered_write_iter(struct kiocb *iocb,</div><div class='add'>+					struct iov_iter *from)</div><div class='add'>+{</div><div class='add'>+	struct file *file = iocb-&gt;ki_filp;</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	if (iocb-&gt;ki_flags &amp; IOCB_NOWAIT)</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+</div><div class='add'>+	ret = generic_perform_write(iocb, from);</div><div class='add'>+</div><div class='add'>+	if (ret &gt; 0) {</div><div class='add'>+		f2fs_update_iostat(F2FS_I_SB(inode), inode,</div><div class='add'>+						APP_BUFFERED_IO, ret);</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int f2fs_dio_write_end_io(struct kiocb *iocb, ssize_t size, int error,</div><div class='add'>+				 unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(file_inode(iocb-&gt;ki_filp));</div><div class='add'>+</div><div class='add'>+	dec_page_count(sbi, F2FS_DIO_WRITE);</div><div class='add'>+	if (error)</div><div class='add'>+		return error;</div><div class='add'>+	f2fs_update_time(sbi, REQ_TIME);</div><div class='add'>+	f2fs_update_iostat(sbi, NULL, APP_DIRECT_IO, size);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void f2fs_dio_write_submit_io(const struct iomap_iter *iter,</div><div class='add'>+					struct bio *bio, loff_t file_offset)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = iter-&gt;inode;</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='add'>+	enum log_type type = f2fs_rw_hint_to_seg_type(sbi, inode-&gt;i_write_hint);</div><div class='add'>+	enum temp_type temp = f2fs_get_segment_temp(sbi, type);</div><div class='add'>+</div><div class='add'>+	bio-&gt;bi_write_hint = f2fs_io_type_to_rw_hint(sbi, DATA, temp);</div><div class='add'>+	submit_bio(bio);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct iomap_dio_ops f2fs_iomap_dio_write_ops = {</div><div class='add'>+	.end_io		= f2fs_dio_write_end_io,</div><div class='add'>+	.submit_io	= f2fs_dio_write_submit_io,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static void f2fs_flush_buffered_write(struct address_space *mapping,</div><div class='add'>+				      loff_t start_pos, loff_t end_pos)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = filemap_write_and_wait_range(mapping, start_pos, end_pos);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return;</div><div class='add'>+	invalidate_mapping_pages(mapping,</div><div class='add'>+				 start_pos &gt;&gt; PAGE_SHIFT,</div><div class='add'>+				 end_pos &gt;&gt; PAGE_SHIFT);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t f2fs_dio_write_iter(struct kiocb *iocb, struct iov_iter *from,</div><div class='add'>+				   bool *may_need_sync)</div><div class='ctx'> {</div><div class='ctx'> 	struct file *file = iocb-&gt;ki_filp;</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='add'>+	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='add'>+	const bool do_opu = f2fs_lfs_mode(sbi);</div><div class='add'>+	const loff_t pos = iocb-&gt;ki_pos;</div><div class='add'>+	const ssize_t count = iov_iter_count(from);</div><div class='add'>+	unsigned int dio_flags;</div><div class='add'>+	struct iomap_dio *dio;</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	trace_f2fs_direct_IO_enter(inode, iocb, count, WRITE);</div><div class='add'>+</div><div class='add'>+	if (iocb-&gt;ki_flags &amp; IOCB_NOWAIT) {</div><div class='add'>+		/* f2fs_convert_inline_inode() and block allocation can block */</div><div class='add'>+		if (f2fs_has_inline_data(inode) ||</div><div class='add'>+		    !f2fs_overwrite_io(inode, pos, count)) {</div><div class='add'>+			ret = -EAGAIN;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (!f2fs_down_read_trylock(&amp;fi-&gt;i_gc_rwsem[WRITE])) {</div><div class='add'>+			ret = -EAGAIN;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		if (do_opu &amp;&amp; !f2fs_down_read_trylock(&amp;fi-&gt;i_gc_rwsem[READ])) {</div><div class='add'>+			f2fs_up_read(&amp;fi-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+			ret = -EAGAIN;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		ret = f2fs_convert_inline_inode(inode);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out;</div><div class='add'>+</div><div class='add'>+		f2fs_down_read(&amp;fi-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+		if (do_opu)</div><div class='add'>+			f2fs_down_read(&amp;fi-&gt;i_gc_rwsem[READ]);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We have to use __iomap_dio_rw() and iomap_dio_complete() instead of</div><div class='add'>+	 * the higher-level function iomap_dio_rw() in order to ensure that the</div><div class='add'>+	 * F2FS_DIO_WRITE counter will be decremented correctly in all cases.</div><div class='add'>+	 */</div><div class='add'>+	inc_page_count(sbi, F2FS_DIO_WRITE);</div><div class='add'>+	dio_flags = 0;</div><div class='add'>+	if (pos + count &gt; inode-&gt;i_size)</div><div class='add'>+		dio_flags |= IOMAP_DIO_FORCE_WAIT;</div><div class='add'>+	dio = __iomap_dio_rw(iocb, from, &amp;f2fs_iomap_ops,</div><div class='add'>+			     &amp;f2fs_iomap_dio_write_ops, dio_flags, NULL, 0);</div><div class='add'>+	if (IS_ERR_OR_NULL(dio)) {</div><div class='add'>+		ret = PTR_ERR_OR_ZERO(dio);</div><div class='add'>+		if (ret == -ENOTBLK)</div><div class='add'>+			ret = 0;</div><div class='add'>+		if (ret != -EIOCBQUEUED)</div><div class='add'>+			dec_page_count(sbi, F2FS_DIO_WRITE);</div><div class='add'>+	} else {</div><div class='add'>+		ret = iomap_dio_complete(dio);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (do_opu)</div><div class='add'>+		f2fs_up_read(&amp;fi-&gt;i_gc_rwsem[READ]);</div><div class='add'>+	f2fs_up_read(&amp;fi-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+	if (pos + ret &gt; inode-&gt;i_size)</div><div class='add'>+		f2fs_i_size_write(inode, pos + ret);</div><div class='add'>+	if (!do_opu)</div><div class='add'>+		set_inode_flag(inode, FI_UPDATE_WRITE);</div><div class='add'>+</div><div class='add'>+	if (iov_iter_count(from)) {</div><div class='add'>+		ssize_t ret2;</div><div class='add'>+		loff_t bufio_start_pos = iocb-&gt;ki_pos;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * The direct write was partial, so we need to fall back to a</div><div class='add'>+		 * buffered write for the remainder.</div><div class='add'>+		 */</div><div class='add'>+</div><div class='add'>+		ret2 = f2fs_buffered_write_iter(iocb, from);</div><div class='add'>+		if (iov_iter_count(from))</div><div class='add'>+			f2fs_write_failed(inode, iocb-&gt;ki_pos);</div><div class='add'>+		if (ret2 &lt; 0)</div><div class='add'>+			goto out;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Ensure that the pagecache pages are written to disk and</div><div class='add'>+		 * invalidated to preserve the expected O_DIRECT semantics.</div><div class='add'>+		 */</div><div class='add'>+		if (ret2 &gt; 0) {</div><div class='add'>+			loff_t bufio_end_pos = bufio_start_pos + ret2 - 1;</div><div class='add'>+</div><div class='add'>+			ret += ret2;</div><div class='add'>+</div><div class='add'>+			f2fs_flush_buffered_write(file-&gt;f_mapping,</div><div class='add'>+						  bufio_start_pos,</div><div class='add'>+						  bufio_end_pos);</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		/* iomap_dio_rw() already handled the generic_write_sync(). */</div><div class='add'>+		*may_need_sync = false;</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='add'>+	trace_f2fs_direct_IO_exit(inode, pos, count, WRITE, ret);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t f2fs_file_write_iter(struct kiocb *iocb, struct iov_iter *from)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='add'>+	const loff_t orig_pos = iocb-&gt;ki_pos;</div><div class='add'>+	const size_t orig_count = iov_iter_count(from);</div><div class='add'>+	loff_t target_size;</div><div class='add'>+	bool dio;</div><div class='add'>+	bool may_need_sync = true;</div><div class='add'>+	int preallocated;</div><div class='add'>+	const loff_t pos = iocb-&gt;ki_pos;</div><div class='add'>+	const ssize_t count = iov_iter_count(from);</div><div class='ctx'> 	ssize_t ret;</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(f2fs_cp_error(F2FS_I_SB(inode)))) {</div><div class='hunk'>@@ -4260,104 +5211,86 @@ static ssize_t f2fs_file_write_iter(struct kiocb *iocb, struct iov_iter *from)</div><div class='ctx'> 		inode_lock(inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (unlikely(IS_IMMUTABLE(inode))) {</div><div class='del'>-		ret = -EPERM;</div><div class='del'>-		goto unlock;</div><div class='add'>+	if (f2fs_is_pinned_file(inode) &amp;&amp;</div><div class='add'>+	    !f2fs_overwrite_io(inode, pos, count)) {</div><div class='add'>+		ret = -EIO;</div><div class='add'>+		goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (is_inode_flag_set(inode, FI_COMPRESS_RELEASED)) {</div><div class='del'>-		ret = -EPERM;</div><div class='del'>-		goto unlock;</div><div class='del'>-	}</div><div class='add'>+	ret = f2fs_write_checks(iocb, from);</div><div class='add'>+	if (ret &lt;= 0)</div><div class='add'>+		goto out_unlock;</div><div class='ctx'> </div><div class='del'>-	ret = generic_write_checks(iocb, from);</div><div class='del'>-	if (ret &gt; 0) {</div><div class='del'>-		bool preallocated = false;</div><div class='del'>-		size_t target_size = 0;</div><div class='del'>-		int err;</div><div class='del'>-</div><div class='del'>-		if (fault_in_iov_iter_readable(from, iov_iter_count(from)))</div><div class='del'>-			set_inode_flag(inode, FI_NO_PREALLOC);</div><div class='del'>-</div><div class='del'>-		if ((iocb-&gt;ki_flags &amp; IOCB_NOWAIT)) {</div><div class='del'>-			if (!f2fs_overwrite_io(inode, iocb-&gt;ki_pos,</div><div class='del'>-						iov_iter_count(from)) ||</div><div class='del'>-				f2fs_has_inline_data(inode) ||</div><div class='del'>-				f2fs_force_buffered_io(inode, iocb, from)) {</div><div class='del'>-				clear_inode_flag(inode, FI_NO_PREALLOC);</div><div class='del'>-				inode_unlock(inode);</div><div class='del'>-				ret = -EAGAIN;</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-			goto write;</div><div class='del'>-		}</div><div class='add'>+	/* Determine whether we will do a direct write or a buffered write. */</div><div class='add'>+	dio = f2fs_should_use_dio(inode, iocb, from);</div><div class='ctx'> </div><div class='del'>-		if (is_inode_flag_set(inode, FI_NO_PREALLOC))</div><div class='del'>-			goto write;</div><div class='add'>+	/* dio is not compatible w/ atomic write */</div><div class='add'>+	if (dio &amp;&amp; f2fs_is_atomic_file(inode)) {</div><div class='add'>+		ret = -EOPNOTSUPP;</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		if (iocb-&gt;ki_flags &amp; IOCB_DIRECT) {</div><div class='del'>-			/*</div><div class='del'>-			 * Convert inline data for Direct I/O before entering</div><div class='del'>-			 * f2fs_direct_IO().</div><div class='del'>-			 */</div><div class='del'>-			err = f2fs_convert_inline_inode(inode);</div><div class='del'>-			if (err)</div><div class='del'>-				goto out_err;</div><div class='del'>-			/*</div><div class='del'>-			 * If force_buffere_io() is true, we have to allocate</div><div class='del'>-			 * blocks all the time, since f2fs_direct_IO will fall</div><div class='del'>-			 * back to buffered IO.</div><div class='del'>-			 */</div><div class='del'>-			if (!f2fs_force_buffered_io(inode, iocb, from) &amp;&amp;</div><div class='del'>-					f2fs_lfs_mode(F2FS_I_SB(inode)))</div><div class='del'>-				goto write;</div><div class='del'>-		}</div><div class='del'>-		preallocated = true;</div><div class='del'>-		target_size = iocb-&gt;ki_pos + iov_iter_count(from);</div><div class='add'>+	/* Possibly preallocate the blocks for the write. */</div><div class='add'>+	target_size = iocb-&gt;ki_pos + iov_iter_count(from);</div><div class='add'>+	preallocated = f2fs_preallocate_blocks(iocb, from, dio);</div><div class='add'>+	if (preallocated &lt; 0) {</div><div class='add'>+		ret = preallocated;</div><div class='add'>+	} else {</div><div class='add'>+		if (trace_f2fs_datawrite_start_enabled())</div><div class='add'>+			f2fs_trace_rw_file_path(iocb-&gt;ki_filp, iocb-&gt;ki_pos,</div><div class='add'>+						orig_count, WRITE);</div><div class='ctx'> </div><div class='del'>-		err = f2fs_preallocate_blocks(iocb, from);</div><div class='del'>-		if (err) {</div><div class='del'>-out_err:</div><div class='del'>-			clear_inode_flag(inode, FI_NO_PREALLOC);</div><div class='del'>-			inode_unlock(inode);</div><div class='del'>-			ret = err;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-write:</div><div class='del'>-		ret = __generic_file_write_iter(iocb, from);</div><div class='del'>-		clear_inode_flag(inode, FI_NO_PREALLOC);</div><div class='add'>+		/* Do the actual write. */</div><div class='add'>+		ret = dio ?</div><div class='add'>+			f2fs_dio_write_iter(iocb, from, &amp;may_need_sync) :</div><div class='add'>+			f2fs_buffered_write_iter(iocb, from);</div><div class='ctx'> </div><div class='del'>-		/* if we couldn't write data, we should deallocate blocks. */</div><div class='del'>-		if (preallocated &amp;&amp; i_size_read(inode) &lt; target_size) {</div><div class='del'>-			down_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='del'>-			filemap_invalidate_lock(inode-&gt;i_mapping);</div><div class='del'>-			f2fs_truncate(inode);</div><div class='del'>-			filemap_invalidate_unlock(inode-&gt;i_mapping);</div><div class='del'>-			up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='del'>-		}</div><div class='add'>+		trace_f2fs_datawrite_end(inode, orig_pos, ret);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		if (ret &gt; 0)</div><div class='del'>-			f2fs_update_iostat(F2FS_I_SB(inode), APP_WRITE_IO, ret);</div><div class='add'>+	/* Don't leave any preallocated blocks around past i_size. */</div><div class='add'>+	if (preallocated &amp;&amp; i_size_read(inode) &lt; target_size) {</div><div class='add'>+		f2fs_down_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+		filemap_invalidate_lock(inode-&gt;i_mapping);</div><div class='add'>+		if (!f2fs_truncate(inode))</div><div class='add'>+			file_dont_truncate(inode);</div><div class='add'>+		filemap_invalidate_unlock(inode-&gt;i_mapping);</div><div class='add'>+		f2fs_up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+	} else {</div><div class='add'>+		file_dont_truncate(inode);</div><div class='ctx'> 	}</div><div class='del'>-unlock:</div><div class='add'>+</div><div class='add'>+	clear_inode_flag(inode, FI_PREALLOCATED_ALL);</div><div class='add'>+out_unlock:</div><div class='ctx'> 	inode_unlock(inode);</div><div class='ctx'> out:</div><div class='del'>-	trace_f2fs_file_write_iter(inode, iocb-&gt;ki_pos,</div><div class='del'>-					iov_iter_count(from), ret);</div><div class='del'>-	if (ret &gt; 0)</div><div class='add'>+	trace_f2fs_file_write_iter(inode, orig_pos, orig_count, ret);</div><div class='add'>+</div><div class='add'>+	if (ret &gt; 0 &amp;&amp; may_need_sync)</div><div class='ctx'> 		ret = generic_write_sync(iocb, ret);</div><div class='add'>+</div><div class='add'>+	/* If buffered IO was forced, flush and drop the data from</div><div class='add'>+	 * the page cache to preserve O_DIRECT semantics</div><div class='add'>+	 */</div><div class='add'>+	if (ret &gt; 0 &amp;&amp; !dio &amp;&amp; (iocb-&gt;ki_flags &amp; IOCB_DIRECT))</div><div class='add'>+		f2fs_flush_buffered_write(iocb-&gt;ki_filp-&gt;f_mapping,</div><div class='add'>+					  orig_pos,</div><div class='add'>+					  orig_pos + ret - 1);</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int f2fs_file_fadvise(struct file *filp, loff_t offset, loff_t len,</div><div class='ctx'> 		int advice)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode;</div><div class='ctx'> 	struct address_space *mapping;</div><div class='ctx'> 	struct backing_dev_info *bdi;</div><div class='add'>+	struct inode *inode = file_inode(filp);</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	trace_f2fs_fadvise(inode, offset, len, advice);</div><div class='ctx'> </div><div class='ctx'> 	if (advice == POSIX_FADV_SEQUENTIAL) {</div><div class='del'>-		inode = file_inode(filp);</div><div class='ctx'> 		if (S_ISFIFO(inode-&gt;i_mode))</div><div class='ctx'> 			return -ESPIPE;</div><div class='ctx'> </div><div class='hunk'>@@ -4372,9 +5305,22 @@ static int f2fs_file_fadvise(struct file *filp, loff_t offset, loff_t len,</div><div class='ctx'> 		filp-&gt;f_mode &amp;= ~FMODE_RANDOM;</div><div class='ctx'> 		spin_unlock(&amp;filp-&gt;f_lock);</div><div class='ctx'> 		return 0;</div><div class='add'>+	} else if (advice == POSIX_FADV_WILLNEED &amp;&amp; offset == 0) {</div><div class='add'>+		/* Load extent cache at the first readahead. */</div><div class='add'>+		f2fs_precache_extents(inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return generic_fadvise(filp, offset, len, advice);</div><div class='add'>+	err = generic_fadvise(filp, offset, len, advice);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	if (advice == POSIX_FADV_DONTNEED &amp;&amp;</div><div class='add'>+	    (test_opt(F2FS_I_SB(inode), COMPRESS_CACHE) &amp;&amp;</div><div class='add'>+	     f2fs_compressed_file(inode)))</div><div class='add'>+		f2fs_invalidate_compress_pages(F2FS_I_SB(inode), inode-&gt;i_ino);</div><div class='add'>+	else if (advice == POSIX_FADV_NOREUSE)</div><div class='add'>+		err = f2fs_keep_noreuse_range(inode, offset, len);</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_COMPAT</div><div class='hunk'>@@ -4444,10 +5390,11 @@ long f2fs_compat_ioctl(struct file *file, unsigned int cmd, unsigned long arg)</div><div class='ctx'> 	case F2FS_IOC32_MOVE_RANGE:</div><div class='ctx'> 		return f2fs_compat_ioc_move_range(file, arg);</div><div class='ctx'> 	case F2FS_IOC_START_ATOMIC_WRITE:</div><div class='add'>+	case F2FS_IOC_START_ATOMIC_REPLACE:</div><div class='ctx'> 	case F2FS_IOC_COMMIT_ATOMIC_WRITE:</div><div class='ctx'> 	case F2FS_IOC_START_VOLATILE_WRITE:</div><div class='ctx'> 	case F2FS_IOC_RELEASE_VOLATILE_WRITE:</div><div class='del'>-	case F2FS_IOC_ABORT_VOLATILE_WRITE:</div><div class='add'>+	case F2FS_IOC_ABORT_ATOMIC_WRITE:</div><div class='ctx'> 	case F2FS_IOC_SHUTDOWN:</div><div class='ctx'> 	case FITRIM:</div><div class='ctx'> 	case FS_IOC_SET_ENCRYPTION_POLICY:</div><div class='hunk'>@@ -4481,6 +5428,8 @@ long f2fs_compat_ioctl(struct file *file, unsigned int cmd, unsigned long arg)</div><div class='ctx'> 	case F2FS_IOC_SET_COMPRESS_OPTION:</div><div class='ctx'> 	case F2FS_IOC_DECOMPRESS_FILE:</div><div class='ctx'> 	case F2FS_IOC_COMPRESS_FILE:</div><div class='add'>+	case F2FS_IOC_GET_DEV_ALIAS_FILE:</div><div class='add'>+	case F2FS_IOC_IO_PRIO:</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		return -ENOIOCTLCMD;</div><div class='hunk'>@@ -4493,9 +5442,10 @@ const struct file_operations f2fs_file_operations = {</div><div class='ctx'> 	.llseek		= f2fs_llseek,</div><div class='ctx'> 	.read_iter	= f2fs_file_read_iter,</div><div class='ctx'> 	.write_iter	= f2fs_file_write_iter,</div><div class='add'>+	.iopoll		= iocb_bio_iopoll,</div><div class='ctx'> 	.open		= f2fs_file_open,</div><div class='ctx'> 	.release	= f2fs_release_file,</div><div class='del'>-	.mmap		= f2fs_file_mmap,</div><div class='add'>+	.mmap_prepare	= f2fs_file_mmap_prepare,</div><div class='ctx'> 	.flush		= f2fs_file_flush,</div><div class='ctx'> 	.fsync		= f2fs_sync_file,</div><div class='ctx'> 	.fallocate	= f2fs_fallocate,</div><div class='hunk'>@@ -4503,7 +5453,8 @@ const struct file_operations f2fs_file_operations = {</div><div class='ctx'> #ifdef CONFIG_COMPAT</div><div class='ctx'> 	.compat_ioctl	= f2fs_compat_ioctl,</div><div class='ctx'> #endif</div><div class='del'>-	.splice_read	= generic_file_splice_read,</div><div class='add'>+	.splice_read	= f2fs_file_splice_read,</div><div class='ctx'> 	.splice_write	= iter_file_splice_write,</div><div class='ctx'> 	.fadvise	= f2fs_file_fadvise,</div><div class='add'>+	.fop_flags	= FOP_BUFFER_RASYNC,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/f2fs/gc.c b/fs/f2fs/gc.c<br/>index a946ce0ead34..384fa7e2085b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/gc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/gc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/gc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/gc.c</a></div><div class='hunk'>@@ -7,7 +7,6 @@</div><div class='ctx'>  */</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/module.h&gt;</div><div class='del'>-#include &lt;linux/backing-dev.h&gt;</div><div class='ctx'> #include &lt;linux/init.h&gt;</div><div class='ctx'> #include &lt;linux/f2fs_fs.h&gt;</div><div class='ctx'> #include &lt;linux/kthread.h&gt;</div><div class='hunk'>@@ -15,6 +14,7 @@</div><div class='ctx'> #include &lt;linux/freezer.h&gt;</div><div class='ctx'> #include &lt;linux/sched/signal.h&gt;</div><div class='ctx'> #include &lt;linux/random.h&gt;</div><div class='add'>+#include &lt;linux/sched/mm.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "f2fs.h"</div><div class='ctx'> #include "node.h"</div><div class='hunk'>@@ -35,27 +35,36 @@ static int gc_thread_func(void *data)</div><div class='ctx'> 	wait_queue_head_t *wq = &amp;sbi-&gt;gc_thread-&gt;gc_wait_queue_head;</div><div class='ctx'> 	wait_queue_head_t *fggc_wq = &amp;sbi-&gt;gc_thread-&gt;fggc_wq;</div><div class='ctx'> 	unsigned int wait_ms;</div><div class='add'>+	struct f2fs_gc_control gc_control = {</div><div class='add'>+		.victim_segno = NULL_SEGNO,</div><div class='add'>+		.should_migrate_blocks = false,</div><div class='add'>+		.err_gc_skipped = false,</div><div class='add'>+		.one_time = false };</div><div class='ctx'> </div><div class='ctx'> 	wait_ms = gc_th-&gt;min_sleep_time;</div><div class='ctx'> </div><div class='ctx'> 	set_freezable();</div><div class='ctx'> 	do {</div><div class='del'>-		bool sync_mode, foreground = false;</div><div class='add'>+		bool sync_mode, foreground = false, gc_boost = false;</div><div class='ctx'> </div><div class='del'>-		wait_event_interruptible_timeout(*wq,</div><div class='del'>-				kthread_should_stop() || freezing(current) ||</div><div class='add'>+		wait_event_freezable_timeout(*wq,</div><div class='add'>+				kthread_should_stop() ||</div><div class='ctx'> 				waitqueue_active(fggc_wq) ||</div><div class='ctx'> 				gc_th-&gt;gc_wake,</div><div class='ctx'> 				msecs_to_jiffies(wait_ms));</div><div class='ctx'> </div><div class='del'>-		if (test_opt(sbi, GC_MERGE) &amp;&amp; waitqueue_active(fggc_wq))</div><div class='add'>+		if (test_opt(sbi, GC_MERGE) &amp;&amp; waitqueue_active(fggc_wq)) {</div><div class='ctx'> 			foreground = true;</div><div class='add'>+			gc_control.one_time = false;</div><div class='add'>+		} else if (f2fs_sb_has_blkzoned(sbi)) {</div><div class='add'>+			gc_control.one_time = true;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		/* give it a try one time */</div><div class='ctx'> 		if (gc_th-&gt;gc_wake)</div><div class='del'>-			gc_th-&gt;gc_wake = 0;</div><div class='add'>+			gc_th-&gt;gc_wake = false;</div><div class='ctx'> </div><div class='del'>-		if (try_to_freeze()) {</div><div class='add'>+		if (f2fs_readonly(sbi-&gt;sb)) {</div><div class='ctx'> 			stat_other_skip_bggc_count(sbi);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -68,10 +77,9 @@ static int gc_thread_func(void *data)</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (time_to_inject(sbi, FAULT_CHECKPOINT)) {</div><div class='del'>-			f2fs_show_injection_info(sbi, FAULT_CHECKPOINT);</div><div class='del'>-			f2fs_stop_checkpoint(sbi, false);</div><div class='del'>-		}</div><div class='add'>+		if (time_to_inject(sbi, FAULT_CHECKPOINT))</div><div class='add'>+			f2fs_stop_checkpoint(sbi, false,</div><div class='add'>+					STOP_CP_REASON_FAULT_INJECT);</div><div class='ctx'> </div><div class='ctx'> 		if (!sb_start_write_trylock(sbi-&gt;sb)) {</div><div class='ctx'> 			stat_other_skip_bggc_count(sbi);</div><div class='hunk'>@@ -91,44 +99,71 @@ static int gc_thread_func(void *data)</div><div class='ctx'> 		 * invalidated soon after by user update or deletion.</div><div class='ctx'> 		 * So, I'd like to wait some time to collect dirty segments.</div><div class='ctx'> 		 */</div><div class='del'>-		if (sbi-&gt;gc_mode == GC_URGENT_HIGH) {</div><div class='add'>+		if (sbi-&gt;gc_mode == GC_URGENT_HIGH ||</div><div class='add'>+				sbi-&gt;gc_mode == GC_URGENT_MID) {</div><div class='ctx'> 			wait_ms = gc_th-&gt;urgent_sleep_time;</div><div class='del'>-			down_write(&amp;sbi-&gt;gc_lock);</div><div class='add'>+			f2fs_down_write(&amp;sbi-&gt;gc_lock);</div><div class='ctx'> 			goto do_gc;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (foreground) {</div><div class='del'>-			down_write(&amp;sbi-&gt;gc_lock);</div><div class='add'>+			f2fs_down_write(&amp;sbi-&gt;gc_lock);</div><div class='ctx'> 			goto do_gc;</div><div class='del'>-		} else if (!down_write_trylock(&amp;sbi-&gt;gc_lock)) {</div><div class='add'>+		} else if (!f2fs_down_write_trylock(&amp;sbi-&gt;gc_lock)) {</div><div class='ctx'> 			stat_other_skip_bggc_count(sbi);</div><div class='ctx'> 			goto next;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (!is_idle(sbi, GC_TIME)) {</div><div class='ctx'> 			increase_sleep_time(gc_th, &amp;wait_ms);</div><div class='del'>-			up_write(&amp;sbi-&gt;gc_lock);</div><div class='add'>+			f2fs_up_write(&amp;sbi-&gt;gc_lock);</div><div class='ctx'> 			stat_io_skip_bggc_count(sbi);</div><div class='ctx'> 			goto next;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (has_enough_invalid_blocks(sbi))</div><div class='add'>+		if (f2fs_sb_has_blkzoned(sbi)) {</div><div class='add'>+			if (has_enough_free_blocks(sbi,</div><div class='add'>+				gc_th-&gt;no_zoned_gc_percent)) {</div><div class='add'>+				wait_ms = gc_th-&gt;no_gc_sleep_time;</div><div class='add'>+				f2fs_up_write(&amp;sbi-&gt;gc_lock);</div><div class='add'>+				goto next;</div><div class='add'>+			}</div><div class='add'>+			if (wait_ms == gc_th-&gt;no_gc_sleep_time)</div><div class='add'>+				wait_ms = gc_th-&gt;max_sleep_time;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (need_to_boost_gc(sbi)) {</div><div class='ctx'> 			decrease_sleep_time(gc_th, &amp;wait_ms);</div><div class='del'>-		else</div><div class='add'>+			if (f2fs_sb_has_blkzoned(sbi))</div><div class='add'>+				gc_boost = true;</div><div class='add'>+		} else {</div><div class='ctx'> 			increase_sleep_time(gc_th, &amp;wait_ms);</div><div class='add'>+		}</div><div class='ctx'> do_gc:</div><div class='del'>-		if (!foreground)</div><div class='del'>-			stat_inc_bggc_count(sbi-&gt;stat_info);</div><div class='add'>+		stat_inc_gc_call_count(sbi, foreground ?</div><div class='add'>+					FOREGROUND : BACKGROUND);</div><div class='ctx'> </div><div class='del'>-		sync_mode = F2FS_OPTION(sbi).bggc_mode == BGGC_MODE_SYNC;</div><div class='add'>+		sync_mode = (F2FS_OPTION(sbi).bggc_mode == BGGC_MODE_SYNC) ||</div><div class='add'>+			(gc_boost &amp;&amp; gc_th-&gt;boost_gc_greedy);</div><div class='ctx'> </div><div class='ctx'> 		/* foreground GC was been triggered via f2fs_balance_fs() */</div><div class='del'>-		if (foreground)</div><div class='add'>+		if (foreground &amp;&amp; !f2fs_sb_has_blkzoned(sbi))</div><div class='ctx'> 			sync_mode = false;</div><div class='ctx'> </div><div class='add'>+		gc_control.init_gc_type = sync_mode ? FG_GC : BG_GC;</div><div class='add'>+		gc_control.no_bg_gc = foreground;</div><div class='add'>+		gc_control.nr_free_secs = foreground ? 1 : 0;</div><div class='add'>+</div><div class='ctx'> 		/* if return value is not zero, no victim was selected */</div><div class='del'>-		if (f2fs_gc(sbi, sync_mode, !foreground, false, NULL_SEGNO))</div><div class='del'>-			wait_ms = gc_th-&gt;no_gc_sleep_time;</div><div class='add'>+		if (f2fs_gc(sbi, &amp;gc_control)) {</div><div class='add'>+			/* don't bother wait_ms by foreground gc */</div><div class='add'>+			if (!foreground)</div><div class='add'>+				wait_ms = gc_th-&gt;no_gc_sleep_time;</div><div class='add'>+		} else {</div><div class='add'>+			/* reset wait_ms to default sleep time */</div><div class='add'>+			if (wait_ms == gc_th-&gt;no_gc_sleep_time)</div><div class='add'>+				wait_ms = gc_th-&gt;min_sleep_time;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		if (foreground)</div><div class='ctx'> 			wake_up_all(&amp;gc_th-&gt;fggc_wq);</div><div class='hunk'>@@ -139,6 +174,15 @@ do_gc:</div><div class='ctx'> 		/* balancing f2fs's metadata periodically */</div><div class='ctx'> 		f2fs_balance_fs_bg(sbi, true);</div><div class='ctx'> next:</div><div class='add'>+		if (sbi-&gt;gc_mode != GC_NORMAL) {</div><div class='add'>+			spin_lock(&amp;sbi-&gt;gc_remaining_trials_lock);</div><div class='add'>+			if (sbi-&gt;gc_remaining_trials) {</div><div class='add'>+				sbi-&gt;gc_remaining_trials--;</div><div class='add'>+				if (!sbi-&gt;gc_remaining_trials)</div><div class='add'>+					sbi-&gt;gc_mode = GC_NORMAL;</div><div class='add'>+			}</div><div class='add'>+			spin_unlock(&amp;sbi-&gt;gc_remaining_trials_lock);</div><div class='add'>+		}</div><div class='ctx'> 		sb_end_write(sbi-&gt;sb);</div><div class='ctx'> </div><div class='ctx'> 	} while (!kthread_should_stop());</div><div class='hunk'>@@ -149,20 +193,31 @@ int f2fs_start_gc_thread(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_gc_kthread *gc_th;</div><div class='ctx'> 	dev_t dev = sbi-&gt;sb-&gt;s_bdev-&gt;bd_dev;</div><div class='del'>-	int err = 0;</div><div class='ctx'> </div><div class='ctx'> 	gc_th = f2fs_kmalloc(sbi, sizeof(struct f2fs_gc_kthread), GFP_KERNEL);</div><div class='del'>-	if (!gc_th) {</div><div class='del'>-		err = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (!gc_th)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	gc_th-&gt;urgent_sleep_time = DEF_GC_THREAD_URGENT_SLEEP_TIME;</div><div class='del'>-	gc_th-&gt;min_sleep_time = DEF_GC_THREAD_MIN_SLEEP_TIME;</div><div class='del'>-	gc_th-&gt;max_sleep_time = DEF_GC_THREAD_MAX_SLEEP_TIME;</div><div class='del'>-	gc_th-&gt;no_gc_sleep_time = DEF_GC_THREAD_NOGC_SLEEP_TIME;</div><div class='add'>+	gc_th-&gt;valid_thresh_ratio = DEF_GC_THREAD_VALID_THRESH_RATIO;</div><div class='add'>+	gc_th-&gt;boost_gc_multiple = BOOST_GC_MULTIPLE;</div><div class='add'>+	gc_th-&gt;boost_gc_greedy = GC_GREEDY;</div><div class='add'>+</div><div class='add'>+	if (f2fs_sb_has_blkzoned(sbi)) {</div><div class='add'>+		gc_th-&gt;min_sleep_time = DEF_GC_THREAD_MIN_SLEEP_TIME_ZONED;</div><div class='add'>+		gc_th-&gt;max_sleep_time = DEF_GC_THREAD_MAX_SLEEP_TIME_ZONED;</div><div class='add'>+		gc_th-&gt;no_gc_sleep_time = DEF_GC_THREAD_NOGC_SLEEP_TIME_ZONED;</div><div class='add'>+		gc_th-&gt;no_zoned_gc_percent = LIMIT_NO_ZONED_GC;</div><div class='add'>+		gc_th-&gt;boost_zoned_gc_percent = LIMIT_BOOST_ZONED_GC;</div><div class='add'>+	} else {</div><div class='add'>+		gc_th-&gt;min_sleep_time = DEF_GC_THREAD_MIN_SLEEP_TIME;</div><div class='add'>+		gc_th-&gt;max_sleep_time = DEF_GC_THREAD_MAX_SLEEP_TIME;</div><div class='add'>+		gc_th-&gt;no_gc_sleep_time = DEF_GC_THREAD_NOGC_SLEEP_TIME;</div><div class='add'>+		gc_th-&gt;no_zoned_gc_percent = 0;</div><div class='add'>+		gc_th-&gt;boost_zoned_gc_percent = 0;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	gc_th-&gt;gc_wake = 0;</div><div class='add'>+	gc_th-&gt;gc_wake = false;</div><div class='ctx'> </div><div class='ctx'> 	sbi-&gt;gc_thread = gc_th;</div><div class='ctx'> 	init_waitqueue_head(&amp;sbi-&gt;gc_thread-&gt;gc_wait_queue_head);</div><div class='hunk'>@@ -170,12 +225,14 @@ int f2fs_start_gc_thread(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	sbi-&gt;gc_thread-&gt;f2fs_gc_task = kthread_run(gc_thread_func, sbi,</div><div class='ctx'> 			"f2fs_gc-%u:%u", MAJOR(dev), MINOR(dev));</div><div class='ctx'> 	if (IS_ERR(gc_th-&gt;f2fs_gc_task)) {</div><div class='del'>-		err = PTR_ERR(gc_th-&gt;f2fs_gc_task);</div><div class='add'>+		int err = PTR_ERR(gc_th-&gt;f2fs_gc_task);</div><div class='add'>+</div><div class='ctx'> 		kfree(gc_th);</div><div class='ctx'> 		sbi-&gt;gc_thread = NULL;</div><div class='add'>+		return err;</div><div class='ctx'> 	}</div><div class='del'>-out:</div><div class='del'>-	return err;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_stop_gc_thread(struct f2fs_sb_info *sbi)</div><div class='hunk'>@@ -205,6 +262,8 @@ static int select_gc_type(struct f2fs_sb_info *sbi, int gc_type)</div><div class='ctx'> </div><div class='ctx'> 	switch (sbi-&gt;gc_mode) {</div><div class='ctx'> 	case GC_IDLE_CB:</div><div class='add'>+	case GC_URGENT_LOW:</div><div class='add'>+	case GC_URGENT_MID:</div><div class='ctx'> 		gc_mode = GC_CB;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case GC_IDLE_GREEDY:</div><div class='hunk'>@@ -224,19 +283,14 @@ static void select_policy(struct f2fs_sb_info *sbi, int gc_type,</div><div class='ctx'> {</div><div class='ctx'> 	struct dirty_seglist_info *dirty_i = DIRTY_I(sbi);</div><div class='ctx'> </div><div class='del'>-	if (p-&gt;alloc_mode == SSR) {</div><div class='del'>-		p-&gt;gc_mode = GC_GREEDY;</div><div class='del'>-		p-&gt;dirty_bitmap = dirty_i-&gt;dirty_segmap[type];</div><div class='del'>-		p-&gt;max_search = dirty_i-&gt;nr_dirty[type];</div><div class='del'>-		p-&gt;ofs_unit = 1;</div><div class='del'>-	} else if (p-&gt;alloc_mode == AT_SSR) {</div><div class='add'>+	if (p-&gt;alloc_mode == SSR || p-&gt;alloc_mode == AT_SSR) {</div><div class='ctx'> 		p-&gt;gc_mode = GC_GREEDY;</div><div class='ctx'> 		p-&gt;dirty_bitmap = dirty_i-&gt;dirty_segmap[type];</div><div class='ctx'> 		p-&gt;max_search = dirty_i-&gt;nr_dirty[type];</div><div class='ctx'> 		p-&gt;ofs_unit = 1;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		p-&gt;gc_mode = select_gc_type(sbi, gc_type);</div><div class='del'>-		p-&gt;ofs_unit = sbi-&gt;segs_per_sec;</div><div class='add'>+		p-&gt;ofs_unit = SEGS_PER_SEC(sbi);</div><div class='ctx'> 		if (__is_large_section(sbi)) {</div><div class='ctx'> 			p-&gt;dirty_bitmap = dirty_i-&gt;dirty_secmap;</div><div class='ctx'> 			p-&gt;max_search = count_bits(p-&gt;dirty_bitmap,</div><div class='hunk'>@@ -257,11 +311,11 @@ static void select_policy(struct f2fs_sb_info *sbi, int gc_type,</div><div class='ctx'> 			p-&gt;max_search &gt; sbi-&gt;max_victim_search)</div><div class='ctx'> 		p-&gt;max_search = sbi-&gt;max_victim_search;</div><div class='ctx'> </div><div class='del'>-	/* let's select beginning hot/small space first in no_heap mode*/</div><div class='add'>+	/* let's select beginning hot/small space first. */</div><div class='ctx'> 	if (f2fs_need_rand_seg(sbi))</div><div class='del'>-		p-&gt;offset = prandom_u32() % (MAIN_SECS(sbi) * sbi-&gt;segs_per_sec);</div><div class='del'>-	else if (test_opt(sbi, NOHEAP) &amp;&amp;</div><div class='del'>-		(type == CURSEG_HOT_DATA || IS_NODESEG(type)))</div><div class='add'>+		p-&gt;offset = get_random_u32_below(MAIN_SECS(sbi) *</div><div class='add'>+						SEGS_PER_SEC(sbi));</div><div class='add'>+	else if (type == CURSEG_HOT_DATA || IS_NODESEG(type))</div><div class='ctx'> 		p-&gt;offset = 0;</div><div class='ctx'> 	else</div><div class='ctx'> 		p-&gt;offset = SIT_I(sbi)-&gt;last_victim[p-&gt;gc_mode];</div><div class='hunk'>@@ -272,13 +326,13 @@ static unsigned int get_max_cost(struct f2fs_sb_info *sbi,</div><div class='ctx'> {</div><div class='ctx'> 	/* SSR allocates in a segment unit */</div><div class='ctx'> 	if (p-&gt;alloc_mode == SSR)</div><div class='del'>-		return sbi-&gt;blocks_per_seg;</div><div class='add'>+		return BLKS_PER_SEG(sbi);</div><div class='ctx'> 	else if (p-&gt;alloc_mode == AT_SSR)</div><div class='ctx'> 		return UINT_MAX;</div><div class='ctx'> </div><div class='ctx'> 	/* LFS */</div><div class='ctx'> 	if (p-&gt;gc_mode == GC_GREEDY)</div><div class='del'>-		return 2 * sbi-&gt;blocks_per_seg * p-&gt;ofs_unit;</div><div class='add'>+		return SEGS_TO_BLKS(sbi, 2 * p-&gt;ofs_unit);</div><div class='ctx'> 	else if (p-&gt;gc_mode == GC_CB)</div><div class='ctx'> 		return UINT_MAX;</div><div class='ctx'> 	else if (p-&gt;gc_mode == GC_AT)</div><div class='hunk'>@@ -309,23 +363,18 @@ static unsigned int check_bg_victims(struct f2fs_sb_info *sbi)</div><div class='ctx'> static unsigned int get_cb_cost(struct f2fs_sb_info *sbi, unsigned int segno)</div><div class='ctx'> {</div><div class='ctx'> 	struct sit_info *sit_i = SIT_I(sbi);</div><div class='del'>-	unsigned int secno = GET_SEC_FROM_SEG(sbi, segno);</div><div class='del'>-	unsigned int start = GET_SEG_FROM_SEC(sbi, secno);</div><div class='ctx'> 	unsigned long long mtime = 0;</div><div class='ctx'> 	unsigned int vblocks;</div><div class='ctx'> 	unsigned char age = 0;</div><div class='ctx'> 	unsigned char u;</div><div class='del'>-	unsigned int i;</div><div class='del'>-	unsigned int usable_segs_per_sec = f2fs_usable_segs_in_sec(sbi, segno);</div><div class='add'>+	unsigned int usable_segs_per_sec = f2fs_usable_segs_in_sec(sbi);</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; usable_segs_per_sec; i++)</div><div class='del'>-		mtime += get_seg_entry(sbi, start + i)-&gt;mtime;</div><div class='add'>+	mtime = f2fs_get_section_mtime(sbi, segno);</div><div class='add'>+	f2fs_bug_on(sbi, mtime == INVALID_MTIME);</div><div class='ctx'> 	vblocks = get_valid_blocks(sbi, segno, true);</div><div class='del'>-</div><div class='del'>-	mtime = div_u64(mtime, usable_segs_per_sec);</div><div class='ctx'> 	vblocks = div_u64(vblocks, usable_segs_per_sec);</div><div class='ctx'> </div><div class='del'>-	u = (vblocks * 100) &gt;&gt; sbi-&gt;log_blocks_per_seg;</div><div class='add'>+	u = BLKS_TO_SEGS(sbi, vblocks * 100);</div><div class='ctx'> </div><div class='ctx'> 	/* Handle if the system time has changed by the user */</div><div class='ctx'> 	if (mtime &lt; sit_i-&gt;min_mtime)</div><div class='hunk'>@@ -340,11 +389,17 @@ static unsigned int get_cb_cost(struct f2fs_sb_info *sbi, unsigned int segno)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline unsigned int get_gc_cost(struct f2fs_sb_info *sbi,</div><div class='del'>-			unsigned int segno, struct victim_sel_policy *p)</div><div class='add'>+			unsigned int segno, struct victim_sel_policy *p,</div><div class='add'>+			unsigned int valid_thresh_ratio)</div><div class='ctx'> {</div><div class='ctx'> 	if (p-&gt;alloc_mode == SSR)</div><div class='ctx'> 		return get_seg_entry(sbi, segno)-&gt;ckpt_valid_blocks;</div><div class='ctx'> </div><div class='add'>+	if (p-&gt;one_time_gc &amp;&amp; (valid_thresh_ratio &lt; 100) &amp;&amp;</div><div class='add'>+			(get_valid_blocks(sbi, segno, true) &gt;=</div><div class='add'>+			CAP_BLKS_PER_SEC(sbi) * valid_thresh_ratio / 100))</div><div class='add'>+		return UINT_MAX;</div><div class='add'>+</div><div class='ctx'> 	/* alloc_mode == LFS */</div><div class='ctx'> 	if (p-&gt;gc_mode == GC_GREEDY)</div><div class='ctx'> 		return get_valid_blocks(sbi, segno, true);</div><div class='hunk'>@@ -367,50 +422,102 @@ static unsigned int count_bits(const unsigned long *addr,</div><div class='ctx'> 	return sum;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct victim_entry *attach_victim_entry(struct f2fs_sb_info *sbi,</div><div class='del'>-				unsigned long long mtime, unsigned int segno,</div><div class='del'>-				struct rb_node *parent, struct rb_node **p,</div><div class='del'>-				bool left_most)</div><div class='add'>+static bool f2fs_check_victim_tree(struct f2fs_sb_info *sbi,</div><div class='add'>+				struct rb_root_cached *root)</div><div class='add'>+{</div><div class='add'>+#ifdef CONFIG_F2FS_CHECK_FS</div><div class='add'>+	struct rb_node *cur = rb_first_cached(root), *next;</div><div class='add'>+	struct victim_entry *cur_ve, *next_ve;</div><div class='add'>+</div><div class='add'>+	while (cur) {</div><div class='add'>+		next = rb_next(cur);</div><div class='add'>+		if (!next)</div><div class='add'>+			return true;</div><div class='add'>+</div><div class='add'>+		cur_ve = rb_entry(cur, struct victim_entry, rb_node);</div><div class='add'>+		next_ve = rb_entry(next, struct victim_entry, rb_node);</div><div class='add'>+</div><div class='add'>+		if (cur_ve-&gt;mtime &gt; next_ve-&gt;mtime) {</div><div class='add'>+			f2fs_info(sbi, "broken victim_rbtree, "</div><div class='add'>+				"cur_mtime(%llu) next_mtime(%llu)",</div><div class='add'>+				cur_ve-&gt;mtime, next_ve-&gt;mtime);</div><div class='add'>+			return false;</div><div class='add'>+		}</div><div class='add'>+		cur = next;</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct victim_entry *__lookup_victim_entry(struct f2fs_sb_info *sbi,</div><div class='add'>+					unsigned long long mtime)</div><div class='add'>+{</div><div class='add'>+	struct atgc_management *am = &amp;sbi-&gt;am;</div><div class='add'>+	struct rb_node *node = am-&gt;root.rb_root.rb_node;</div><div class='add'>+	struct victim_entry *ve = NULL;</div><div class='add'>+</div><div class='add'>+	while (node) {</div><div class='add'>+		ve = rb_entry(node, struct victim_entry, rb_node);</div><div class='add'>+</div><div class='add'>+		if (mtime &lt; ve-&gt;mtime)</div><div class='add'>+			node = node-&gt;rb_left;</div><div class='add'>+		else</div><div class='add'>+			node = node-&gt;rb_right;</div><div class='add'>+	}</div><div class='add'>+	return ve;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct victim_entry *__create_victim_entry(struct f2fs_sb_info *sbi,</div><div class='add'>+		unsigned long long mtime, unsigned int segno)</div><div class='ctx'> {</div><div class='ctx'> 	struct atgc_management *am = &amp;sbi-&gt;am;</div><div class='ctx'> 	struct victim_entry *ve;</div><div class='ctx'> </div><div class='del'>-	ve =  f2fs_kmem_cache_alloc(victim_entry_slab,</div><div class='del'>-				GFP_NOFS, true, NULL);</div><div class='add'>+	ve =  f2fs_kmem_cache_alloc(victim_entry_slab, GFP_NOFS, true, NULL);</div><div class='ctx'> </div><div class='ctx'> 	ve-&gt;mtime = mtime;</div><div class='ctx'> 	ve-&gt;segno = segno;</div><div class='ctx'> </div><div class='del'>-	rb_link_node(&amp;ve-&gt;rb_node, parent, p);</div><div class='del'>-	rb_insert_color_cached(&amp;ve-&gt;rb_node, &amp;am-&gt;root, left_most);</div><div class='del'>-</div><div class='ctx'> 	list_add_tail(&amp;ve-&gt;list, &amp;am-&gt;victim_list);</div><div class='del'>-</div><div class='ctx'> 	am-&gt;victim_count++;</div><div class='ctx'> </div><div class='ctx'> 	return ve;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void insert_victim_entry(struct f2fs_sb_info *sbi,</div><div class='add'>+static void __insert_victim_entry(struct f2fs_sb_info *sbi,</div><div class='ctx'> 				unsigned long long mtime, unsigned int segno)</div><div class='ctx'> {</div><div class='ctx'> 	struct atgc_management *am = &amp;sbi-&gt;am;</div><div class='del'>-	struct rb_node **p;</div><div class='add'>+	struct rb_root_cached *root = &amp;am-&gt;root;</div><div class='add'>+	struct rb_node **p = &amp;root-&gt;rb_root.rb_node;</div><div class='ctx'> 	struct rb_node *parent = NULL;</div><div class='add'>+	struct victim_entry *ve;</div><div class='ctx'> 	bool left_most = true;</div><div class='ctx'> </div><div class='del'>-	p = f2fs_lookup_rb_tree_ext(sbi, &amp;am-&gt;root, &amp;parent, mtime, &amp;left_most);</div><div class='del'>-	attach_victim_entry(sbi, mtime, segno, parent, p, left_most);</div><div class='add'>+	/* look up rb tree to find parent node */</div><div class='add'>+	while (*p) {</div><div class='add'>+		parent = *p;</div><div class='add'>+		ve = rb_entry(parent, struct victim_entry, rb_node);</div><div class='add'>+</div><div class='add'>+		if (mtime &lt; ve-&gt;mtime) {</div><div class='add'>+			p = &amp;(*p)-&gt;rb_left;</div><div class='add'>+		} else {</div><div class='add'>+			p = &amp;(*p)-&gt;rb_right;</div><div class='add'>+			left_most = false;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ve = __create_victim_entry(sbi, mtime, segno);</div><div class='add'>+</div><div class='add'>+	rb_link_node(&amp;ve-&gt;rb_node, parent, p);</div><div class='add'>+	rb_insert_color_cached(&amp;ve-&gt;rb_node, root, left_most);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void add_victim_entry(struct f2fs_sb_info *sbi,</div><div class='ctx'> 				struct victim_sel_policy *p, unsigned int segno)</div><div class='ctx'> {</div><div class='ctx'> 	struct sit_info *sit_i = SIT_I(sbi);</div><div class='del'>-	unsigned int secno = GET_SEC_FROM_SEG(sbi, segno);</div><div class='del'>-	unsigned int start = GET_SEG_FROM_SEC(sbi, secno);</div><div class='ctx'> 	unsigned long long mtime = 0;</div><div class='del'>-	unsigned int i;</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(is_sbi_flag_set(sbi, SBI_CP_DISABLED))) {</div><div class='ctx'> 		if (p-&gt;gc_mode == GC_AT &amp;&amp;</div><div class='hunk'>@@ -418,9 +525,8 @@ static void add_victim_entry(struct f2fs_sb_info *sbi,</div><div class='ctx'> 			return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; sbi-&gt;segs_per_sec; i++)</div><div class='del'>-		mtime += get_seg_entry(sbi, start + i)-&gt;mtime;</div><div class='del'>-	mtime = div_u64(mtime, sbi-&gt;segs_per_sec);</div><div class='add'>+	mtime = f2fs_get_section_mtime(sbi, segno);</div><div class='add'>+	f2fs_bug_on(sbi, mtime == INVALID_MTIME);</div><div class='ctx'> </div><div class='ctx'> 	/* Handle if the system time has changed by the user */</div><div class='ctx'> 	if (mtime &lt; sit_i-&gt;min_mtime)</div><div class='hunk'>@@ -436,19 +542,7 @@ static void add_victim_entry(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	if (sit_i-&gt;dirty_max_mtime - mtime &lt; p-&gt;age_threshold)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	insert_victim_entry(sbi, mtime, segno);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct rb_node *lookup_central_victim(struct f2fs_sb_info *sbi,</div><div class='del'>-						struct victim_sel_policy *p)</div><div class='del'>-{</div><div class='del'>-	struct atgc_management *am = &amp;sbi-&gt;am;</div><div class='del'>-	struct rb_node *parent = NULL;</div><div class='del'>-	bool left_most;</div><div class='del'>-</div><div class='del'>-	f2fs_lookup_rb_tree_ext(sbi, &amp;am-&gt;root, &amp;parent, p-&gt;age, &amp;left_most);</div><div class='del'>-</div><div class='del'>-	return parent;</div><div class='add'>+	__insert_victim_entry(sbi, mtime, segno);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void atgc_lookup_victim(struct f2fs_sb_info *sbi,</div><div class='hunk'>@@ -458,13 +552,12 @@ static void atgc_lookup_victim(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	struct atgc_management *am = &amp;sbi-&gt;am;</div><div class='ctx'> 	struct rb_root_cached *root = &amp;am-&gt;root;</div><div class='ctx'> 	struct rb_node *node;</div><div class='del'>-	struct rb_entry *re;</div><div class='ctx'> 	struct victim_entry *ve;</div><div class='ctx'> 	unsigned long long total_time;</div><div class='ctx'> 	unsigned long long age, u, accu;</div><div class='ctx'> 	unsigned long long max_mtime = sit_i-&gt;dirty_max_mtime;</div><div class='ctx'> 	unsigned long long min_mtime = sit_i-&gt;dirty_min_mtime;</div><div class='del'>-	unsigned int sec_blocks = BLKS_PER_SEC(sbi);</div><div class='add'>+	unsigned int sec_blocks = CAP_BLKS_PER_SEC(sbi);</div><div class='ctx'> 	unsigned int vblocks;</div><div class='ctx'> 	unsigned int dirty_threshold = max(am-&gt;max_candidate_count,</div><div class='ctx'> 					am-&gt;candidate_ratio *</div><div class='hunk'>@@ -485,12 +578,10 @@ static void atgc_lookup_victim(struct f2fs_sb_info *sbi,</div><div class='ctx'> </div><div class='ctx'> 	node = rb_first_cached(root);</div><div class='ctx'> next:</div><div class='del'>-	re = rb_entry_safe(node, struct rb_entry, rb_node);</div><div class='del'>-	if (!re)</div><div class='add'>+	ve = rb_entry_safe(node, struct victim_entry, rb_node);</div><div class='add'>+	if (!ve)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	ve = (struct victim_entry *)re;</div><div class='del'>-</div><div class='ctx'> 	if (ve-&gt;mtime &gt;= max_mtime || ve-&gt;mtime &lt; min_mtime)</div><div class='ctx'> 		goto skip;</div><div class='ctx'> </div><div class='hunk'>@@ -532,36 +623,30 @@ static void atssr_lookup_victim(struct f2fs_sb_info *sbi,</div><div class='ctx'> {</div><div class='ctx'> 	struct sit_info *sit_i = SIT_I(sbi);</div><div class='ctx'> 	struct atgc_management *am = &amp;sbi-&gt;am;</div><div class='del'>-	struct rb_node *node;</div><div class='del'>-	struct rb_entry *re;</div><div class='ctx'> 	struct victim_entry *ve;</div><div class='ctx'> 	unsigned long long age;</div><div class='ctx'> 	unsigned long long max_mtime = sit_i-&gt;dirty_max_mtime;</div><div class='ctx'> 	unsigned long long min_mtime = sit_i-&gt;dirty_min_mtime;</div><div class='del'>-	unsigned int seg_blocks = sbi-&gt;blocks_per_seg;</div><div class='ctx'> 	unsigned int vblocks;</div><div class='ctx'> 	unsigned int dirty_threshold = max(am-&gt;max_candidate_count,</div><div class='ctx'> 					am-&gt;candidate_ratio *</div><div class='ctx'> 					am-&gt;victim_count / 100);</div><div class='del'>-	unsigned int cost;</div><div class='del'>-	unsigned int iter = 0;</div><div class='add'>+	unsigned int cost, iter;</div><div class='ctx'> 	int stage = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (max_mtime &lt; min_mtime)</div><div class='ctx'> 		return;</div><div class='ctx'> 	max_mtime += 1;</div><div class='ctx'> next_stage:</div><div class='del'>-	node = lookup_central_victim(sbi, p);</div><div class='add'>+	iter = 0;</div><div class='add'>+	ve = __lookup_victim_entry(sbi, p-&gt;age);</div><div class='ctx'> next_node:</div><div class='del'>-	re = rb_entry_safe(node, struct rb_entry, rb_node);</div><div class='del'>-	if (!re) {</div><div class='del'>-		if (stage == 0)</div><div class='del'>-			goto skip_stage;</div><div class='add'>+	if (!ve) {</div><div class='add'>+		if (stage++ == 0)</div><div class='add'>+			goto next_stage;</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ve = (struct victim_entry *)re;</div><div class='del'>-</div><div class='ctx'> 	if (ve-&gt;mtime &gt;= max_mtime || ve-&gt;mtime &lt; min_mtime)</div><div class='ctx'> 		goto skip_node;</div><div class='ctx'> </div><div class='hunk'>@@ -571,7 +656,7 @@ next_node:</div><div class='ctx'> 	f2fs_bug_on(sbi, !vblocks);</div><div class='ctx'> </div><div class='ctx'> 	/* rare case */</div><div class='del'>-	if (vblocks == seg_blocks)</div><div class='add'>+	if (vblocks == BLKS_PER_SEG(sbi))</div><div class='ctx'> 		goto skip_node;</div><div class='ctx'> </div><div class='ctx'> 	iter++;</div><div class='hunk'>@@ -587,24 +672,20 @@ next_node:</div><div class='ctx'> 	}</div><div class='ctx'> skip_node:</div><div class='ctx'> 	if (iter &lt; dirty_threshold) {</div><div class='del'>-		if (stage == 0)</div><div class='del'>-			node = rb_prev(node);</div><div class='del'>-		else if (stage == 1)</div><div class='del'>-			node = rb_next(node);</div><div class='add'>+		ve = rb_entry(stage == 0 ? rb_prev(&amp;ve-&gt;rb_node) :</div><div class='add'>+					rb_next(&amp;ve-&gt;rb_node),</div><div class='add'>+					struct victim_entry, rb_node);</div><div class='ctx'> 		goto next_node;</div><div class='ctx'> 	}</div><div class='del'>-skip_stage:</div><div class='del'>-	if (stage &lt; 1) {</div><div class='del'>-		stage++;</div><div class='del'>-		iter = 0;</div><div class='add'>+</div><div class='add'>+	if (stage++ == 0)</div><div class='ctx'> 		goto next_stage;</div><div class='del'>-	}</div><div class='ctx'> }</div><div class='add'>+</div><div class='ctx'> static void lookup_victim_by_age(struct f2fs_sb_info *sbi,</div><div class='ctx'> 						struct victim_sel_policy *p)</div><div class='ctx'> {</div><div class='del'>-	f2fs_bug_on(sbi, !f2fs_check_rb_tree_consistence(sbi,</div><div class='del'>-						&amp;sbi-&gt;am.root, true));</div><div class='add'>+	f2fs_bug_on(sbi, !f2fs_check_victim_tree(sbi, &amp;sbi-&gt;am.root));</div><div class='ctx'> </div><div class='ctx'> 	if (p-&gt;gc_mode == GC_AT)</div><div class='ctx'> 		atgc_lookup_victim(sbi, p);</div><div class='hunk'>@@ -631,6 +712,54 @@ static void release_victim_entry(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	f2fs_bug_on(sbi, !list_empty(&amp;am-&gt;victim_list));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool f2fs_pin_section(struct f2fs_sb_info *sbi, unsigned int segno)</div><div class='add'>+{</div><div class='add'>+	struct dirty_seglist_info *dirty_i = DIRTY_I(sbi);</div><div class='add'>+	unsigned int secno = GET_SEC_FROM_SEG(sbi, segno);</div><div class='add'>+</div><div class='add'>+	if (!dirty_i-&gt;enable_pin_section)</div><div class='add'>+		return false;</div><div class='add'>+	if (!test_and_set_bit(secno, dirty_i-&gt;pinned_secmap))</div><div class='add'>+		dirty_i-&gt;pinned_secmap_cnt++;</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool f2fs_pinned_section_exists(struct dirty_seglist_info *dirty_i)</div><div class='add'>+{</div><div class='add'>+	return dirty_i-&gt;pinned_secmap_cnt;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool f2fs_section_is_pinned(struct dirty_seglist_info *dirty_i,</div><div class='add'>+						unsigned int secno)</div><div class='add'>+{</div><div class='add'>+	return dirty_i-&gt;enable_pin_section &amp;&amp;</div><div class='add'>+		f2fs_pinned_section_exists(dirty_i) &amp;&amp;</div><div class='add'>+		test_bit(secno, dirty_i-&gt;pinned_secmap);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void f2fs_unpin_all_sections(struct f2fs_sb_info *sbi, bool enable)</div><div class='add'>+{</div><div class='add'>+	unsigned int bitmap_size = f2fs_bitmap_size(MAIN_SECS(sbi));</div><div class='add'>+</div><div class='add'>+	if (f2fs_pinned_section_exists(DIRTY_I(sbi))) {</div><div class='add'>+		memset(DIRTY_I(sbi)-&gt;pinned_secmap, 0, bitmap_size);</div><div class='add'>+		DIRTY_I(sbi)-&gt;pinned_secmap_cnt = 0;</div><div class='add'>+	}</div><div class='add'>+	DIRTY_I(sbi)-&gt;enable_pin_section = enable;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int f2fs_gc_pinned_control(struct inode *inode, int gc_type,</div><div class='add'>+							unsigned int segno)</div><div class='add'>+{</div><div class='add'>+	if (!f2fs_is_pinned_file(inode))</div><div class='add'>+		return 0;</div><div class='add'>+	if (gc_type != FG_GC)</div><div class='add'>+		return -EBUSY;</div><div class='add'>+	if (!f2fs_pin_section(F2FS_I_SB(inode), segno))</div><div class='add'>+		f2fs_pin_file_control(inode, true);</div><div class='add'>+	return -EAGAIN;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * This function is called from two paths.</div><div class='ctx'>  * One is garbage collection and the other is SSR segment selection.</div><div class='hunk'>@@ -639,25 +768,31 @@ static void release_victim_entry(struct f2fs_sb_info *sbi)</div><div class='ctx'>  * When it is called from SSR segment selection, it finds a segment</div><div class='ctx'>  * which has minimum valid blocks and removes it from dirty seglist.</div><div class='ctx'>  */</div><div class='del'>-static int get_victim_by_default(struct f2fs_sb_info *sbi,</div><div class='del'>-			unsigned int *result, int gc_type, int type,</div><div class='del'>-			char alloc_mode, unsigned long long age)</div><div class='add'>+int f2fs_get_victim(struct f2fs_sb_info *sbi, unsigned int *result,</div><div class='add'>+			int gc_type, int type, char alloc_mode,</div><div class='add'>+			unsigned long long age, bool one_time)</div><div class='ctx'> {</div><div class='ctx'> 	struct dirty_seglist_info *dirty_i = DIRTY_I(sbi);</div><div class='ctx'> 	struct sit_info *sm = SIT_I(sbi);</div><div class='del'>-	struct victim_sel_policy p;</div><div class='add'>+	struct victim_sel_policy p = {0};</div><div class='ctx'> 	unsigned int secno, last_victim;</div><div class='ctx'> 	unsigned int last_segment;</div><div class='ctx'> 	unsigned int nsearched;</div><div class='add'>+	unsigned int valid_thresh_ratio = 100;</div><div class='ctx'> 	bool is_atgc;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;dirty_i-&gt;seglist_lock);</div><div class='del'>-	last_segment = MAIN_SECS(sbi) * sbi-&gt;segs_per_sec;</div><div class='add'>+	last_segment = MAIN_SECS(sbi) * SEGS_PER_SEC(sbi);</div><div class='ctx'> </div><div class='ctx'> 	p.alloc_mode = alloc_mode;</div><div class='ctx'> 	p.age = age;</div><div class='ctx'> 	p.age_threshold = sbi-&gt;am.age_threshold;</div><div class='add'>+	if (one_time) {</div><div class='add'>+		p.one_time_gc = one_time;</div><div class='add'>+		if (has_enough_free_secs(sbi, 0, NR_PERSISTENT_LOG))</div><div class='add'>+			valid_thresh_ratio = sbi-&gt;gc_thread-&gt;valid_thresh_ratio;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> retry:</div><div class='ctx'> 	select_policy(sbi, gc_type, type, &amp;p);</div><div class='hunk'>@@ -677,11 +812,14 @@ retry:</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (sec_usage_check(sbi, GET_SEC_FROM_SEG(sbi, *result)))</div><div class='add'>+		if (sec_usage_check(sbi, GET_SEC_FROM_SEG(sbi, *result))) {</div><div class='ctx'> 			ret = -EBUSY;</div><div class='del'>-		else</div><div class='del'>-			p.min_segno = *result;</div><div class='del'>-		goto out;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		if (gc_type == FG_GC)</div><div class='add'>+			clear_bit(GET_SEC_FROM_SEG(sbi, *result), dirty_i-&gt;victim_secmap);</div><div class='add'>+		p.min_segno = *result;</div><div class='add'>+		goto got_result;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = -ENODATA;</div><div class='hunk'>@@ -772,12 +910,15 @@ retry:</div><div class='ctx'> 		if (gc_type == BG_GC &amp;&amp; test_bit(secno, dirty_i-&gt;victim_secmap))</div><div class='ctx'> 			goto next;</div><div class='ctx'> </div><div class='add'>+		if (gc_type == FG_GC &amp;&amp; f2fs_section_is_pinned(dirty_i, secno))</div><div class='add'>+			goto next;</div><div class='add'>+</div><div class='ctx'> 		if (is_atgc) {</div><div class='ctx'> 			add_victim_entry(sbi, &amp;p, segno);</div><div class='ctx'> 			goto next;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		cost = get_gc_cost(sbi, segno, &amp;p);</div><div class='add'>+		cost = get_gc_cost(sbi, segno, &amp;p, valid_thresh_ratio);</div><div class='ctx'> </div><div class='ctx'> 		if (p.min_cost &gt; cost) {</div><div class='ctx'> 			p.min_segno = segno;</div><div class='hunk'>@@ -791,7 +932,7 @@ next:</div><div class='ctx'> 			else</div><div class='ctx'> 				sm-&gt;last_victim[p.gc_mode] = segno + p.ofs_unit;</div><div class='ctx'> 			sm-&gt;last_victim[p.gc_mode] %=</div><div class='del'>-				(MAIN_SECS(sbi) * sbi-&gt;segs_per_sec);</div><div class='add'>+				(MAIN_SECS(sbi) * SEGS_PER_SEC(sbi));</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -832,10 +973,6 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static const struct victim_selection default_v_ops = {</div><div class='del'>-	.get_victim = get_victim_by_default,</div><div class='del'>-};</div><div class='del'>-</div><div class='ctx'> static struct inode *find_gc_inode(struct gc_inode_list *gc_list, nid_t ino)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode_entry *ie;</div><div class='hunk'>@@ -914,7 +1051,7 @@ next_step:</div><div class='ctx'> </div><div class='ctx'> 	for (off = 0; off &lt; usable_blks_in_seg; off++, entry++) {</div><div class='ctx'> 		nid_t nid = le32_to_cpu(entry-&gt;nid);</div><div class='del'>-		struct page *node_page;</div><div class='add'>+		struct folio *node_folio;</div><div class='ctx'> 		struct node_info ni;</div><div class='ctx'> 		int err;</div><div class='ctx'> </div><div class='hunk'>@@ -937,27 +1074,27 @@ next_step:</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* phase == 2 */</div><div class='del'>-		node_page = f2fs_get_node_page(sbi, nid);</div><div class='del'>-		if (IS_ERR(node_page))</div><div class='add'>+		node_folio = f2fs_get_node_folio(sbi, nid, NODE_TYPE_REGULAR);</div><div class='add'>+		if (IS_ERR(node_folio))</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		/* block may become invalid during f2fs_get_node_page */</div><div class='add'>+		/* block may become invalid during f2fs_get_node_folio */</div><div class='ctx'> 		if (check_valid_map(sbi, segno, off) == 0) {</div><div class='del'>-			f2fs_put_page(node_page, 1);</div><div class='add'>+			f2fs_folio_put(node_folio, true);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (f2fs_get_node_info(sbi, nid, &amp;ni)) {</div><div class='del'>-			f2fs_put_page(node_page, 1);</div><div class='add'>+		if (f2fs_get_node_info(sbi, nid, &amp;ni, false)) {</div><div class='add'>+			f2fs_folio_put(node_folio, true);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (ni.blk_addr != start_addr + off) {</div><div class='del'>-			f2fs_put_page(node_page, 1);</div><div class='add'>+			f2fs_folio_put(node_folio, true);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		err = f2fs_move_node_page(node_page, gc_type);</div><div class='add'>+		err = f2fs_move_node_folio(node_folio, gc_type);</div><div class='ctx'> 		if (!err &amp;&amp; gc_type == FG_GC)</div><div class='ctx'> 			submitted++;</div><div class='ctx'> 		stat_inc_node_blk_count(sbi, 1, gc_type);</div><div class='hunk'>@@ -1003,20 +1140,20 @@ block_t f2fs_start_bidx_of_node(unsigned int node_ofs, struct inode *inode)</div><div class='ctx'> static bool is_alive(struct f2fs_sb_info *sbi, struct f2fs_summary *sum,</div><div class='ctx'> 		struct node_info *dni, block_t blkaddr, unsigned int *nofs)</div><div class='ctx'> {</div><div class='del'>-	struct page *node_page;</div><div class='add'>+	struct folio *node_folio;</div><div class='ctx'> 	nid_t nid;</div><div class='del'>-	unsigned int ofs_in_node;</div><div class='add'>+	unsigned int ofs_in_node, max_addrs, base;</div><div class='ctx'> 	block_t source_blkaddr;</div><div class='ctx'> </div><div class='ctx'> 	nid = le32_to_cpu(sum-&gt;nid);</div><div class='ctx'> 	ofs_in_node = le16_to_cpu(sum-&gt;ofs_in_node);</div><div class='ctx'> </div><div class='del'>-	node_page = f2fs_get_node_page(sbi, nid);</div><div class='del'>-	if (IS_ERR(node_page))</div><div class='add'>+	node_folio = f2fs_get_node_folio(sbi, nid, NODE_TYPE_REGULAR);</div><div class='add'>+	if (IS_ERR(node_folio))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	if (f2fs_get_node_info(sbi, nid, dni)) {</div><div class='del'>-		f2fs_put_page(node_page, 1);</div><div class='add'>+	if (f2fs_get_node_info(sbi, nid, dni, false)) {</div><div class='add'>+		f2fs_folio_put(node_folio, true);</div><div class='ctx'> 		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1026,9 +1163,29 @@ static bool is_alive(struct f2fs_sb_info *sbi, struct f2fs_summary *sum,</div><div class='ctx'> 		set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	*nofs = ofs_of_node(node_page);</div><div class='del'>-	source_blkaddr = data_blkaddr(NULL, node_page, ofs_in_node);</div><div class='del'>-	f2fs_put_page(node_page, 1);</div><div class='add'>+	if (f2fs_check_nid_range(sbi, dni-&gt;ino)) {</div><div class='add'>+		f2fs_folio_put(node_folio, true);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (IS_INODE(node_folio)) {</div><div class='add'>+		base = offset_in_addr(F2FS_INODE(node_folio));</div><div class='add'>+		max_addrs = DEF_ADDRS_PER_INODE;</div><div class='add'>+	} else {</div><div class='add'>+		base = 0;</div><div class='add'>+		max_addrs = DEF_ADDRS_PER_BLOCK;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (base + ofs_in_node &gt;= max_addrs) {</div><div class='add'>+		f2fs_err(sbi, "Inconsistent blkaddr offset: base:%u, ofs_in_node:%u, max:%u, ino:%u, nid:%u",</div><div class='add'>+			base, ofs_in_node, max_addrs, dni-&gt;ino, dni-&gt;nid);</div><div class='add'>+		f2fs_folio_put(node_folio, true);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	*nofs = ofs_of_node(node_folio);</div><div class='add'>+	source_blkaddr = data_blkaddr(NULL, node_folio, ofs_in_node);</div><div class='add'>+	f2fs_folio_put(node_folio, true);</div><div class='ctx'> </div><div class='ctx'> 	if (source_blkaddr != blkaddr) {</div><div class='ctx'> #ifdef CONFIG_F2FS_CHECK_FS</div><div class='hunk'>@@ -1039,7 +1196,7 @@ static bool is_alive(struct f2fs_sb_info *sbi, struct f2fs_summary *sum,</div><div class='ctx'> 			if (!test_and_set_bit(segno, SIT_I(sbi)-&gt;invalid_segmap)) {</div><div class='ctx'> 				f2fs_err(sbi, "mismatched blkaddr %u (source_blkaddr %u) in seg %u",</div><div class='ctx'> 					 blkaddr, source_blkaddr, segno);</div><div class='del'>-				f2fs_bug_on(sbi, 1);</div><div class='add'>+				set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> #endif</div><div class='hunk'>@@ -1051,10 +1208,10 @@ static bool is_alive(struct f2fs_sb_info *sbi, struct f2fs_summary *sum,</div><div class='ctx'> static int ra_data_block(struct inode *inode, pgoff_t index)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='del'>-	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='add'>+	struct address_space *mapping = f2fs_is_cow_file(inode) ?</div><div class='add'>+				F2FS_I(inode)-&gt;atomic_inode-&gt;i_mapping : inode-&gt;i_mapping;</div><div class='ctx'> 	struct dnode_of_data dn;</div><div class='del'>-	struct page *page;</div><div class='del'>-	struct extent_info ei = {0, 0, 0};</div><div class='add'>+	struct folio *folio, *efolio;</div><div class='ctx'> 	struct f2fs_io_info fio = {</div><div class='ctx'> 		.sbi = sbi,</div><div class='ctx'> 		.ino = inode-&gt;i_ino,</div><div class='hunk'>@@ -1063,21 +1220,20 @@ static int ra_data_block(struct inode *inode, pgoff_t index)</div><div class='ctx'> 		.op = REQ_OP_READ,</div><div class='ctx'> 		.op_flags = 0,</div><div class='ctx'> 		.encrypted_page = NULL,</div><div class='del'>-		.in_list = false,</div><div class='del'>-		.retry = false,</div><div class='add'>+		.in_list = 0,</div><div class='ctx'> 	};</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	page = f2fs_grab_cache_page(mapping, index, true);</div><div class='del'>-	if (!page)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	folio = f2fs_grab_cache_folio(mapping, index, true);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio);</div><div class='ctx'> </div><div class='del'>-	if (f2fs_lookup_extent_cache(inode, index, &amp;ei)) {</div><div class='del'>-		dn.data_blkaddr = ei.blk + index - ei.fofs;</div><div class='add'>+	if (f2fs_lookup_read_extent_cache_block(inode, index,</div><div class='add'>+						&amp;dn.data_blkaddr)) {</div><div class='ctx'> 		if (unlikely(!f2fs_is_valid_blkaddr(sbi, dn.data_blkaddr,</div><div class='ctx'> 						DATA_GENERIC_ENHANCE_READ))) {</div><div class='ctx'> 			err = -EFSCORRUPTED;</div><div class='del'>-			goto put_page;</div><div class='add'>+			goto put_folio;</div><div class='ctx'> 		}</div><div class='ctx'> 		goto got_it;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1085,53 +1241,54 @@ static int ra_data_block(struct inode *inode, pgoff_t index)</div><div class='ctx'> 	set_new_dnode(&amp;dn, inode, NULL, NULL, 0);</div><div class='ctx'> 	err = f2fs_get_dnode_of_data(&amp;dn, index, LOOKUP_NODE);</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto put_page;</div><div class='add'>+		goto put_folio;</div><div class='ctx'> 	f2fs_put_dnode(&amp;dn);</div><div class='ctx'> </div><div class='ctx'> 	if (!__is_valid_data_blkaddr(dn.data_blkaddr)) {</div><div class='ctx'> 		err = -ENOENT;</div><div class='del'>-		goto put_page;</div><div class='add'>+		goto put_folio;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (unlikely(!f2fs_is_valid_blkaddr(sbi, dn.data_blkaddr,</div><div class='ctx'> 						DATA_GENERIC_ENHANCE))) {</div><div class='ctx'> 		err = -EFSCORRUPTED;</div><div class='del'>-		goto put_page;</div><div class='add'>+		goto put_folio;</div><div class='ctx'> 	}</div><div class='ctx'> got_it:</div><div class='del'>-	/* read page */</div><div class='del'>-	fio.page = page;</div><div class='add'>+	/* read folio */</div><div class='add'>+	fio.folio = folio;</div><div class='ctx'> 	fio.new_blkaddr = fio.old_blkaddr = dn.data_blkaddr;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * don't cache encrypted data into meta inode until previous dirty</div><div class='ctx'> 	 * data were writebacked to avoid racing between GC and flush.</div><div class='ctx'> 	 */</div><div class='del'>-	f2fs_wait_on_page_writeback(page, DATA, true, true);</div><div class='add'>+	f2fs_folio_wait_writeback(folio, DATA, true, true);</div><div class='ctx'> </div><div class='ctx'> 	f2fs_wait_on_block_writeback(inode, dn.data_blkaddr);</div><div class='ctx'> </div><div class='del'>-	fio.encrypted_page = f2fs_pagecache_get_page(META_MAPPING(sbi),</div><div class='del'>-					dn.data_blkaddr,</div><div class='add'>+	efolio = f2fs_filemap_get_folio(META_MAPPING(sbi), dn.data_blkaddr,</div><div class='ctx'> 					FGP_LOCK | FGP_CREAT, GFP_NOFS);</div><div class='del'>-	if (!fio.encrypted_page) {</div><div class='del'>-		err = -ENOMEM;</div><div class='del'>-		goto put_page;</div><div class='add'>+	if (IS_ERR(efolio)) {</div><div class='add'>+		err = PTR_ERR(efolio);</div><div class='add'>+		goto put_folio;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	fio.encrypted_page = &amp;efolio-&gt;page;</div><div class='add'>+</div><div class='ctx'> 	err = f2fs_submit_page_bio(&amp;fio);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto put_encrypted_page;</div><div class='del'>-	f2fs_put_page(fio.encrypted_page, 0);</div><div class='del'>-	f2fs_put_page(page, 1);</div><div class='add'>+	f2fs_put_page(fio.encrypted_page, false);</div><div class='add'>+	f2fs_folio_put(folio, true);</div><div class='ctx'> </div><div class='del'>-	f2fs_update_iostat(sbi, FS_DATA_READ_IO, F2FS_BLKSIZE);</div><div class='del'>-	f2fs_update_iostat(sbi, FS_GDATA_READ_IO, F2FS_BLKSIZE);</div><div class='add'>+	f2fs_update_iostat(sbi, inode, FS_DATA_READ_IO, F2FS_BLKSIZE);</div><div class='add'>+	f2fs_update_iostat(sbi, NULL, FS_GDATA_READ_IO, F2FS_BLKSIZE);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> put_encrypted_page:</div><div class='del'>-	f2fs_put_page(fio.encrypted_page, 1);</div><div class='del'>-put_page:</div><div class='del'>-	f2fs_put_page(page, 1);</div><div class='add'>+	f2fs_put_page(fio.encrypted_page, true);</div><div class='add'>+put_folio:</div><div class='add'>+	f2fs_folio_put(folio, true);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1142,6 +1299,8 @@ put_page:</div><div class='ctx'> static int move_data_block(struct inode *inode, block_t bidx,</div><div class='ctx'> 				int gc_type, unsigned int segno, int off)</div><div class='ctx'> {</div><div class='add'>+	struct address_space *mapping = f2fs_is_cow_file(inode) ?</div><div class='add'>+				F2FS_I(inode)-&gt;atomic_inode-&gt;i_mapping : inode-&gt;i_mapping;</div><div class='ctx'> 	struct f2fs_io_info fio = {</div><div class='ctx'> 		.sbi = F2FS_I_SB(inode),</div><div class='ctx'> 		.ino = inode-&gt;i_ino,</div><div class='hunk'>@@ -1150,13 +1309,12 @@ static int move_data_block(struct inode *inode, block_t bidx,</div><div class='ctx'> 		.op = REQ_OP_READ,</div><div class='ctx'> 		.op_flags = 0,</div><div class='ctx'> 		.encrypted_page = NULL,</div><div class='del'>-		.in_list = false,</div><div class='del'>-		.retry = false,</div><div class='add'>+		.in_list = 0,</div><div class='ctx'> 	};</div><div class='ctx'> 	struct dnode_of_data dn;</div><div class='ctx'> 	struct f2fs_summary sum;</div><div class='ctx'> 	struct node_info ni;</div><div class='del'>-	struct page *page, *mpage;</div><div class='add'>+	struct folio *folio, *mfolio, *efolio;</div><div class='ctx'> 	block_t newaddr;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> 	bool lfs_mode = f2fs_lfs_mode(fio.sbi);</div><div class='hunk'>@@ -1165,27 +1323,18 @@ static int move_data_block(struct inode *inode, block_t bidx,</div><div class='ctx'> 				CURSEG_ALL_DATA_ATGC : CURSEG_COLD_DATA;</div><div class='ctx'> </div><div class='ctx'> 	/* do not read out */</div><div class='del'>-	page = f2fs_grab_cache_page(inode-&gt;i_mapping, bidx, false);</div><div class='del'>-	if (!page)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	folio = f2fs_grab_cache_folio(mapping, bidx, false);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio);</div><div class='ctx'> </div><div class='ctx'> 	if (!check_valid_map(F2FS_I_SB(inode), segno, off)) {</div><div class='ctx'> 		err = -ENOENT;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (f2fs_is_atomic_file(inode)) {</div><div class='del'>-		F2FS_I(inode)-&gt;i_gc_failures[GC_FAILURE_ATOMIC]++;</div><div class='del'>-		F2FS_I_SB(inode)-&gt;skipped_atomic_files[gc_type]++;</div><div class='del'>-		err = -EAGAIN;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (f2fs_is_pinned_file(inode)) {</div><div class='del'>-		f2fs_pin_file_control(inode, true);</div><div class='del'>-		err = -EAGAIN;</div><div class='add'>+	err = f2fs_gc_pinned_control(inode, gc_type, segno);</div><div class='add'>+	if (err)</div><div class='ctx'> 		goto out;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	set_new_dnode(&amp;dn, inode, NULL, NULL, 0);</div><div class='ctx'> 	err = f2fs_get_dnode_of_data(&amp;dn, bidx, LOOKUP_NODE);</div><div class='hunk'>@@ -1193,7 +1342,7 @@ static int move_data_block(struct inode *inode, block_t bidx,</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(dn.data_blkaddr == NULL_ADDR)) {</div><div class='del'>-		ClearPageUptodate(page);</div><div class='add'>+		folio_clear_uptodate(folio);</div><div class='ctx'> 		err = -ENOENT;</div><div class='ctx'> 		goto put_out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1202,46 +1351,48 @@ static int move_data_block(struct inode *inode, block_t bidx,</div><div class='ctx'> 	 * don't cache encrypted data into meta inode until previous dirty</div><div class='ctx'> 	 * data were writebacked to avoid racing between GC and flush.</div><div class='ctx'> 	 */</div><div class='del'>-	f2fs_wait_on_page_writeback(page, DATA, true, true);</div><div class='add'>+	f2fs_folio_wait_writeback(folio, DATA, true, true);</div><div class='ctx'> </div><div class='ctx'> 	f2fs_wait_on_block_writeback(inode, dn.data_blkaddr);</div><div class='ctx'> </div><div class='del'>-	err = f2fs_get_node_info(fio.sbi, dn.nid, &amp;ni);</div><div class='add'>+	err = f2fs_get_node_info(fio.sbi, dn.nid, &amp;ni, false);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto put_out;</div><div class='ctx'> </div><div class='ctx'> 	/* read page */</div><div class='del'>-	fio.page = page;</div><div class='add'>+	fio.folio = folio;</div><div class='ctx'> 	fio.new_blkaddr = fio.old_blkaddr = dn.data_blkaddr;</div><div class='ctx'> </div><div class='ctx'> 	if (lfs_mode)</div><div class='del'>-		down_write(&amp;fio.sbi-&gt;io_order_lock);</div><div class='add'>+		f2fs_down_write(&amp;fio.sbi-&gt;io_order_lock);</div><div class='ctx'> </div><div class='del'>-	mpage = f2fs_grab_cache_page(META_MAPPING(fio.sbi),</div><div class='add'>+	mfolio = f2fs_grab_cache_folio(META_MAPPING(fio.sbi),</div><div class='ctx'> 					fio.old_blkaddr, false);</div><div class='del'>-	if (!mpage) {</div><div class='del'>-		err = -ENOMEM;</div><div class='add'>+	if (IS_ERR(mfolio)) {</div><div class='add'>+		err = PTR_ERR(mfolio);</div><div class='ctx'> 		goto up_out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	fio.encrypted_page = mpage;</div><div class='add'>+	fio.encrypted_page = folio_file_page(mfolio, fio.old_blkaddr);</div><div class='ctx'> </div><div class='del'>-	/* read source block in mpage */</div><div class='del'>-	if (!PageUptodate(mpage)) {</div><div class='add'>+	/* read source block in mfolio */</div><div class='add'>+	if (!folio_test_uptodate(mfolio)) {</div><div class='ctx'> 		err = f2fs_submit_page_bio(&amp;fio);</div><div class='ctx'> 		if (err) {</div><div class='del'>-			f2fs_put_page(mpage, 1);</div><div class='add'>+			f2fs_folio_put(mfolio, true);</div><div class='ctx'> 			goto up_out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		f2fs_update_iostat(fio.sbi, FS_DATA_READ_IO, F2FS_BLKSIZE);</div><div class='del'>-		f2fs_update_iostat(fio.sbi, FS_GDATA_READ_IO, F2FS_BLKSIZE);</div><div class='add'>+		f2fs_update_iostat(fio.sbi, inode, FS_DATA_READ_IO,</div><div class='add'>+							F2FS_BLKSIZE);</div><div class='add'>+		f2fs_update_iostat(fio.sbi, NULL, FS_GDATA_READ_IO,</div><div class='add'>+							F2FS_BLKSIZE);</div><div class='ctx'> </div><div class='del'>-		lock_page(mpage);</div><div class='del'>-		if (unlikely(mpage-&gt;mapping != META_MAPPING(fio.sbi) ||</div><div class='del'>-						!PageUptodate(mpage))) {</div><div class='add'>+		folio_lock(mfolio);</div><div class='add'>+		if (unlikely(!is_meta_folio(mfolio) ||</div><div class='add'>+			     !folio_test_uptodate(mfolio))) {</div><div class='ctx'> 			err = -EIO;</div><div class='del'>-			f2fs_put_page(mpage, 1);</div><div class='add'>+			f2fs_folio_put(mfolio, true);</div><div class='ctx'> 			goto up_out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1249,101 +1400,89 @@ static int move_data_block(struct inode *inode, block_t bidx,</div><div class='ctx'> 	set_summary(&amp;sum, dn.nid, dn.ofs_in_node, ni.version);</div><div class='ctx'> </div><div class='ctx'> 	/* allocate block address */</div><div class='del'>-	f2fs_allocate_data_block(fio.sbi, NULL, fio.old_blkaddr, &amp;newaddr,</div><div class='add'>+	err = f2fs_allocate_data_block(fio.sbi, NULL, fio.old_blkaddr, &amp;newaddr,</div><div class='ctx'> 				&amp;sum, type, NULL);</div><div class='add'>+	if (err) {</div><div class='add'>+		f2fs_folio_put(mfolio, true);</div><div class='add'>+		/* filesystem should shutdown, no need to recovery block */</div><div class='add'>+		goto up_out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	fio.encrypted_page = f2fs_pagecache_get_page(META_MAPPING(fio.sbi),</div><div class='del'>-				newaddr, FGP_LOCK | FGP_CREAT, GFP_NOFS);</div><div class='del'>-	if (!fio.encrypted_page) {</div><div class='del'>-		err = -ENOMEM;</div><div class='del'>-		f2fs_put_page(mpage, 1);</div><div class='add'>+	efolio = f2fs_filemap_get_folio(META_MAPPING(fio.sbi), newaddr,</div><div class='add'>+					FGP_LOCK | FGP_CREAT, GFP_NOFS);</div><div class='add'>+	if (IS_ERR(efolio)) {</div><div class='add'>+		err = PTR_ERR(efolio);</div><div class='add'>+		f2fs_folio_put(mfolio, true);</div><div class='ctx'> 		goto recover_block;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	fio.encrypted_page = &amp;efolio-&gt;page;</div><div class='add'>+</div><div class='ctx'> 	/* write target block */</div><div class='ctx'> 	f2fs_wait_on_page_writeback(fio.encrypted_page, DATA, true, true);</div><div class='ctx'> 	memcpy(page_address(fio.encrypted_page),</div><div class='del'>-				page_address(mpage), PAGE_SIZE);</div><div class='del'>-	f2fs_put_page(mpage, 1);</div><div class='del'>-	invalidate_mapping_pages(META_MAPPING(fio.sbi),</div><div class='del'>-				fio.old_blkaddr, fio.old_blkaddr);</div><div class='del'>-	f2fs_invalidate_compress_page(fio.sbi, fio.old_blkaddr);</div><div class='add'>+				folio_address(mfolio), PAGE_SIZE);</div><div class='add'>+	f2fs_folio_put(mfolio, true);</div><div class='add'>+</div><div class='add'>+	f2fs_invalidate_internal_cache(fio.sbi, fio.old_blkaddr, 1);</div><div class='ctx'> </div><div class='ctx'> 	set_page_dirty(fio.encrypted_page);</div><div class='ctx'> 	if (clear_page_dirty_for_io(fio.encrypted_page))</div><div class='ctx'> 		dec_page_count(fio.sbi, F2FS_DIRTY_META);</div><div class='ctx'> </div><div class='ctx'> 	set_page_writeback(fio.encrypted_page);</div><div class='del'>-	ClearPageError(page);</div><div class='ctx'> </div><div class='ctx'> 	fio.op = REQ_OP_WRITE;</div><div class='ctx'> 	fio.op_flags = REQ_SYNC;</div><div class='ctx'> 	fio.new_blkaddr = newaddr;</div><div class='ctx'> 	f2fs_submit_page_write(&amp;fio);</div><div class='del'>-	if (fio.retry) {</div><div class='del'>-		err = -EAGAIN;</div><div class='del'>-		if (PageWriteback(fio.encrypted_page))</div><div class='del'>-			end_page_writeback(fio.encrypted_page);</div><div class='del'>-		goto put_page_out;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	f2fs_update_iostat(fio.sbi, FS_GC_DATA_IO, F2FS_BLKSIZE);</div><div class='add'>+	f2fs_update_iostat(fio.sbi, NULL, FS_GC_DATA_IO, F2FS_BLKSIZE);</div><div class='ctx'> </div><div class='ctx'> 	f2fs_update_data_blkaddr(&amp;dn, newaddr);</div><div class='ctx'> 	set_inode_flag(inode, FI_APPEND_WRITE);</div><div class='del'>-	if (page-&gt;index == 0)</div><div class='del'>-		set_inode_flag(inode, FI_FIRST_BLOCK_WRITTEN);</div><div class='del'>-put_page_out:</div><div class='del'>-	f2fs_put_page(fio.encrypted_page, 1);</div><div class='add'>+</div><div class='add'>+	f2fs_put_page(fio.encrypted_page, true);</div><div class='ctx'> recover_block:</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		f2fs_do_replace_block(fio.sbi, &amp;sum, newaddr, fio.old_blkaddr,</div><div class='ctx'> 							true, true, true);</div><div class='ctx'> up_out:</div><div class='ctx'> 	if (lfs_mode)</div><div class='del'>-		up_write(&amp;fio.sbi-&gt;io_order_lock);</div><div class='add'>+		f2fs_up_write(&amp;fio.sbi-&gt;io_order_lock);</div><div class='ctx'> put_out:</div><div class='ctx'> 	f2fs_put_dnode(&amp;dn);</div><div class='ctx'> out:</div><div class='del'>-	f2fs_put_page(page, 1);</div><div class='add'>+	f2fs_folio_put(folio, true);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int move_data_page(struct inode *inode, block_t bidx, int gc_type,</div><div class='del'>-							unsigned int segno, int off)</div><div class='add'>+						unsigned int segno, int off)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='del'>-	page = f2fs_get_lock_data_page(inode, bidx, true);</div><div class='del'>-	if (IS_ERR(page))</div><div class='del'>-		return PTR_ERR(page);</div><div class='add'>+	folio = f2fs_get_lock_data_folio(inode, bidx, true);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio);</div><div class='ctx'> </div><div class='ctx'> 	if (!check_valid_map(F2FS_I_SB(inode), segno, off)) {</div><div class='ctx'> 		err = -ENOENT;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (f2fs_is_atomic_file(inode)) {</div><div class='del'>-		F2FS_I(inode)-&gt;i_gc_failures[GC_FAILURE_ATOMIC]++;</div><div class='del'>-		F2FS_I_SB(inode)-&gt;skipped_atomic_files[gc_type]++;</div><div class='del'>-		err = -EAGAIN;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	if (f2fs_is_pinned_file(inode)) {</div><div class='del'>-		if (gc_type == FG_GC)</div><div class='del'>-			f2fs_pin_file_control(inode, true);</div><div class='del'>-		err = -EAGAIN;</div><div class='add'>+	err = f2fs_gc_pinned_control(inode, gc_type, segno);</div><div class='add'>+	if (err)</div><div class='ctx'> 		goto out;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	if (gc_type == BG_GC) {</div><div class='del'>-		if (PageWriteback(page)) {</div><div class='add'>+		if (folio_test_writeback(folio)) {</div><div class='ctx'> 			err = -EAGAIN;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='del'>-		set_page_dirty(page);</div><div class='del'>-		set_page_private_gcing(page);</div><div class='add'>+		folio_mark_dirty(folio);</div><div class='add'>+		folio_set_f2fs_gcing(folio);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		struct f2fs_io_info fio = {</div><div class='ctx'> 			.sbi = F2FS_I_SB(inode),</div><div class='hunk'>@@ -1353,38 +1492,37 @@ static int move_data_page(struct inode *inode, block_t bidx, int gc_type,</div><div class='ctx'> 			.op = REQ_OP_WRITE,</div><div class='ctx'> 			.op_flags = REQ_SYNC,</div><div class='ctx'> 			.old_blkaddr = NULL_ADDR,</div><div class='del'>-			.page = page,</div><div class='add'>+			.folio = folio,</div><div class='ctx'> 			.encrypted_page = NULL,</div><div class='ctx'> 			.need_lock = LOCK_REQ,</div><div class='ctx'> 			.io_type = FS_GC_DATA_IO,</div><div class='ctx'> 		};</div><div class='del'>-		bool is_dirty = PageDirty(page);</div><div class='add'>+		bool is_dirty = folio_test_dirty(folio);</div><div class='ctx'> </div><div class='ctx'> retry:</div><div class='del'>-		f2fs_wait_on_page_writeback(page, DATA, true, true);</div><div class='add'>+		f2fs_folio_wait_writeback(folio, DATA, true, true);</div><div class='ctx'> </div><div class='del'>-		set_page_dirty(page);</div><div class='del'>-		if (clear_page_dirty_for_io(page)) {</div><div class='add'>+		folio_mark_dirty(folio);</div><div class='add'>+		if (folio_clear_dirty_for_io(folio)) {</div><div class='ctx'> 			inode_dec_dirty_pages(inode);</div><div class='ctx'> 			f2fs_remove_dirty_inode(inode);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		set_page_private_gcing(page);</div><div class='add'>+		folio_set_f2fs_gcing(folio);</div><div class='ctx'> </div><div class='ctx'> 		err = f2fs_do_write_data_page(&amp;fio);</div><div class='ctx'> 		if (err) {</div><div class='del'>-			clear_page_private_gcing(page);</div><div class='add'>+			folio_clear_f2fs_gcing(folio);</div><div class='ctx'> 			if (err == -ENOMEM) {</div><div class='del'>-				congestion_wait(BLK_RW_ASYNC,</div><div class='del'>-						DEFAULT_IO_TIMEOUT);</div><div class='add'>+				memalloc_retry_wait(GFP_NOFS);</div><div class='ctx'> 				goto retry;</div><div class='ctx'> 			}</div><div class='ctx'> 			if (is_dirty)</div><div class='del'>-				set_page_dirty(page);</div><div class='add'>+				folio_mark_dirty(folio);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='del'>-	f2fs_put_page(page, 1);</div><div class='add'>+	f2fs_folio_put(folio, true);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1413,7 +1551,6 @@ next_step:</div><div class='ctx'> 	entry = sum;</div><div class='ctx'> </div><div class='ctx'> 	for (off = 0; off &lt; usable_blks_in_seg; off++, entry++) {</div><div class='del'>-		struct page *data_page;</div><div class='ctx'> 		struct inode *inode;</div><div class='ctx'> 		struct node_info dni; /* dnode info for the data */</div><div class='ctx'> 		unsigned int ofs_in_node, nofs;</div><div class='hunk'>@@ -1427,7 +1564,7 @@ next_step:</div><div class='ctx'> 		 */</div><div class='ctx'> 		if ((gc_type == BG_GC &amp;&amp; has_not_enough_free_secs(sbi, 0, 0)) ||</div><div class='ctx'> 			(!force_migrate &amp;&amp; get_valid_blocks(sbi, segno, true) ==</div><div class='del'>-							BLKS_PER_SEC(sbi)))</div><div class='add'>+							CAP_BLKS_PER_SEC(sbi)))</div><div class='ctx'> 			return submitted;</div><div class='ctx'> </div><div class='ctx'> 		if (check_valid_map(sbi, segno, off) == 0)</div><div class='hunk'>@@ -1456,11 +1593,36 @@ next_step:</div><div class='ctx'> 		ofs_in_node = le16_to_cpu(entry-&gt;ofs_in_node);</div><div class='ctx'> </div><div class='ctx'> 		if (phase == 3) {</div><div class='add'>+			struct folio *data_folio;</div><div class='add'>+			int err;</div><div class='add'>+</div><div class='ctx'> 			inode = f2fs_iget(sb, dni.ino);</div><div class='del'>-			if (IS_ERR(inode) || is_bad_inode(inode))</div><div class='add'>+			if (IS_ERR(inode))</div><div class='ctx'> 				continue;</div><div class='ctx'> </div><div class='del'>-			if (!down_write_trylock(</div><div class='add'>+			if (is_bad_inode(inode) ||</div><div class='add'>+					special_file(inode-&gt;i_mode)) {</div><div class='add'>+				iput(inode);</div><div class='add'>+				continue;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			if (f2fs_has_inline_data(inode)) {</div><div class='add'>+				iput(inode);</div><div class='add'>+				set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='add'>+				f2fs_err_ratelimited(sbi,</div><div class='add'>+					"inode %lx has both inline_data flag and "</div><div class='add'>+					"data block, nid=%u, ofs_in_node=%u",</div><div class='add'>+					inode-&gt;i_ino, dni.nid, ofs_in_node);</div><div class='add'>+				continue;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			err = f2fs_gc_pinned_control(inode, gc_type, segno);</div><div class='add'>+			if (err == -EAGAIN) {</div><div class='add'>+				iput(inode);</div><div class='add'>+				return submitted;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			if (!f2fs_down_write_trylock(</div><div class='ctx'> 				&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE])) {</div><div class='ctx'> 				iput(inode);</div><div class='ctx'> 				sbi-&gt;skipped_gc_rwsem++;</div><div class='hunk'>@@ -1470,10 +1632,10 @@ next_step:</div><div class='ctx'> 			start_bidx = f2fs_start_bidx_of_node(nofs, inode) +</div><div class='ctx'> 								ofs_in_node;</div><div class='ctx'> </div><div class='del'>-			if (f2fs_post_read_required(inode)) {</div><div class='add'>+			if (f2fs_meta_inode_gc_required(inode)) {</div><div class='ctx'> 				int err = ra_data_block(inode, start_bidx);</div><div class='ctx'> </div><div class='del'>-				up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+				f2fs_up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> 				if (err) {</div><div class='ctx'> 					iput(inode);</div><div class='ctx'> 					continue;</div><div class='hunk'>@@ -1482,15 +1644,15 @@ next_step:</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			data_page = f2fs_get_read_data_page(inode,</div><div class='del'>-						start_bidx, REQ_RAHEAD, true);</div><div class='del'>-			up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='del'>-			if (IS_ERR(data_page)) {</div><div class='add'>+			data_folio = f2fs_get_read_data_folio(inode, start_bidx,</div><div class='add'>+							REQ_RAHEAD, true, NULL);</div><div class='add'>+			f2fs_up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+			if (IS_ERR(data_folio)) {</div><div class='ctx'> 				iput(inode);</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			f2fs_put_page(data_page, 0);</div><div class='add'>+			f2fs_folio_put(data_folio, false);</div><div class='ctx'> 			add_gc_inode(gc_list, inode);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1503,14 +1665,14 @@ next_step:</div><div class='ctx'> 			int err;</div><div class='ctx'> </div><div class='ctx'> 			if (S_ISREG(inode-&gt;i_mode)) {</div><div class='del'>-				if (!down_write_trylock(&amp;fi-&gt;i_gc_rwsem[READ])) {</div><div class='add'>+				if (!f2fs_down_write_trylock(&amp;fi-&gt;i_gc_rwsem[WRITE])) {</div><div class='ctx'> 					sbi-&gt;skipped_gc_rwsem++;</div><div class='ctx'> 					continue;</div><div class='ctx'> 				}</div><div class='del'>-				if (!down_write_trylock(</div><div class='del'>-						&amp;fi-&gt;i_gc_rwsem[WRITE])) {</div><div class='add'>+				if (!f2fs_down_write_trylock(</div><div class='add'>+						&amp;fi-&gt;i_gc_rwsem[READ])) {</div><div class='ctx'> 					sbi-&gt;skipped_gc_rwsem++;</div><div class='del'>-					up_write(&amp;fi-&gt;i_gc_rwsem[READ]);</div><div class='add'>+					f2fs_up_write(&amp;fi-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> 					continue;</div><div class='ctx'> 				}</div><div class='ctx'> 				locked = true;</div><div class='hunk'>@@ -1521,7 +1683,7 @@ next_step:</div><div class='ctx'> </div><div class='ctx'> 			start_bidx = f2fs_start_bidx_of_node(nofs, inode)</div><div class='ctx'> 								+ ofs_in_node;</div><div class='del'>-			if (f2fs_post_read_required(inode))</div><div class='add'>+			if (f2fs_meta_inode_gc_required(inode))</div><div class='ctx'> 				err = move_data_block(inode, start_bidx,</div><div class='ctx'> 							gc_type, segno, off);</div><div class='ctx'> 			else</div><div class='hunk'>@@ -1529,12 +1691,12 @@ next_step:</div><div class='ctx'> 								segno, off);</div><div class='ctx'> </div><div class='ctx'> 			if (!err &amp;&amp; (gc_type == FG_GC ||</div><div class='del'>-					f2fs_post_read_required(inode)))</div><div class='add'>+					f2fs_meta_inode_gc_required(inode)))</div><div class='ctx'> 				submitted++;</div><div class='ctx'> </div><div class='ctx'> 			if (locked) {</div><div class='del'>-				up_write(&amp;fi-&gt;i_gc_rwsem[WRITE]);</div><div class='del'>-				up_write(&amp;fi-&gt;i_gc_rwsem[READ]);</div><div class='add'>+				f2fs_up_write(&amp;fi-&gt;i_gc_rwsem[READ]);</div><div class='add'>+				f2fs_up_write(&amp;fi-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			stat_inc_data_blk_count(sbi, 1, gc_type);</div><div class='hunk'>@@ -1548,14 +1710,14 @@ next_step:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int __get_victim(struct f2fs_sb_info *sbi, unsigned int *victim,</div><div class='del'>-			int gc_type)</div><div class='add'>+			int gc_type, bool one_time)</div><div class='ctx'> {</div><div class='ctx'> 	struct sit_info *sit_i = SIT_I(sbi);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	down_write(&amp;sit_i-&gt;sentry_lock);</div><div class='del'>-	ret = DIRTY_I(sbi)-&gt;v_ops-&gt;get_victim(sbi, victim, gc_type,</div><div class='del'>-					      NO_CHECK_TYPE, LFS, 0);</div><div class='add'>+	ret = f2fs_get_victim(sbi, victim, gc_type, NO_CHECK_TYPE,</div><div class='add'>+			LFS, 0, one_time);</div><div class='ctx'> 	up_write(&amp;sit_i-&gt;sentry_lock);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -1563,139 +1725,186 @@ static int __get_victim(struct f2fs_sb_info *sbi, unsigned int *victim,</div><div class='ctx'> static int do_garbage_collect(struct f2fs_sb_info *sbi,</div><div class='ctx'> 				unsigned int start_segno,</div><div class='ctx'> 				struct gc_inode_list *gc_list, int gc_type,</div><div class='del'>-				bool force_migrate)</div><div class='add'>+				bool force_migrate, bool one_time)</div><div class='ctx'> {</div><div class='del'>-	struct page *sum_page;</div><div class='del'>-	struct f2fs_summary_block *sum;</div><div class='ctx'> 	struct blk_plug plug;</div><div class='ctx'> 	unsigned int segno = start_segno;</div><div class='del'>-	unsigned int end_segno = start_segno + sbi-&gt;segs_per_sec;</div><div class='add'>+	unsigned int end_segno = start_segno + SEGS_PER_SEC(sbi);</div><div class='add'>+	unsigned int sec_end_segno;</div><div class='ctx'> 	int seg_freed = 0, migrated = 0;</div><div class='ctx'> 	unsigned char type = IS_DATASEG(get_seg_entry(sbi, segno)-&gt;type) ?</div><div class='ctx'> 						SUM_TYPE_DATA : SUM_TYPE_NODE;</div><div class='del'>-	int submitted = 0;</div><div class='add'>+	unsigned char data_type = (type == SUM_TYPE_DATA) ? DATA : NODE;</div><div class='add'>+	int submitted = 0, sum_blk_cnt;</div><div class='ctx'> </div><div class='del'>-	if (__is_large_section(sbi))</div><div class='del'>-		end_segno = rounddown(end_segno, sbi-&gt;segs_per_sec);</div><div class='add'>+	if (__is_large_section(sbi)) {</div><div class='add'>+		sec_end_segno = rounddown(end_segno, SEGS_PER_SEC(sbi));</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * zone-capacity can be less than zone-size in zoned devices,</div><div class='del'>-	 * resulting in less than expected usable segments in the zone,</div><div class='del'>-	 * calculate the end segno in the zone which can be garbage collected</div><div class='del'>-	 */</div><div class='del'>-	if (f2fs_sb_has_blkzoned(sbi))</div><div class='del'>-		end_segno -= sbi-&gt;segs_per_sec -</div><div class='del'>-					f2fs_usable_segs_in_sec(sbi, segno);</div><div class='add'>+		/*</div><div class='add'>+		 * zone-capacity can be less than zone-size in zoned devices,</div><div class='add'>+		 * resulting in less than expected usable segments in the zone,</div><div class='add'>+		 * calculate the end segno in the zone which can be garbage</div><div class='add'>+		 * collected</div><div class='add'>+		 */</div><div class='add'>+		if (f2fs_sb_has_blkzoned(sbi))</div><div class='add'>+			sec_end_segno -= SEGS_PER_SEC(sbi) -</div><div class='add'>+					f2fs_usable_segs_in_sec(sbi);</div><div class='add'>+</div><div class='add'>+		if (gc_type == BG_GC || one_time) {</div><div class='add'>+			unsigned int window_granularity =</div><div class='add'>+				sbi-&gt;migration_window_granularity;</div><div class='add'>+</div><div class='add'>+			if (f2fs_sb_has_blkzoned(sbi) &amp;&amp;</div><div class='add'>+					!has_enough_free_blocks(sbi,</div><div class='add'>+					sbi-&gt;gc_thread-&gt;boost_zoned_gc_percent))</div><div class='add'>+				window_granularity *=</div><div class='add'>+					sbi-&gt;gc_thread-&gt;boost_gc_multiple;</div><div class='add'>+</div><div class='add'>+			end_segno = start_segno + window_granularity;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (end_segno &gt; sec_end_segno)</div><div class='add'>+			end_segno = sec_end_segno;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	sanity_check_seg_type(sbi, get_seg_entry(sbi, segno)-&gt;type);</div><div class='ctx'> </div><div class='add'>+	segno = rounddown(segno, SUMS_PER_BLOCK);</div><div class='add'>+	sum_blk_cnt = DIV_ROUND_UP(end_segno - segno, SUMS_PER_BLOCK);</div><div class='ctx'> 	/* readahead multi ssa blocks those have contiguous address */</div><div class='ctx'> 	if (__is_large_section(sbi))</div><div class='ctx'> 		f2fs_ra_meta_pages(sbi, GET_SUM_BLOCK(sbi, segno),</div><div class='del'>-					end_segno - segno, META_SSA, true);</div><div class='add'>+					sum_blk_cnt, META_SSA, true);</div><div class='ctx'> </div><div class='ctx'> 	/* reference all summary page */</div><div class='ctx'> 	while (segno &lt; end_segno) {</div><div class='del'>-		sum_page = f2fs_get_sum_page(sbi, segno++);</div><div class='del'>-		if (IS_ERR(sum_page)) {</div><div class='del'>-			int err = PTR_ERR(sum_page);</div><div class='add'>+		struct folio *sum_folio = f2fs_get_sum_folio(sbi, segno);</div><div class='ctx'> </div><div class='del'>-			end_segno = segno - 1;</div><div class='del'>-			for (segno = start_segno; segno &lt; end_segno; segno++) {</div><div class='del'>-				sum_page = find_get_page(META_MAPPING(sbi),</div><div class='add'>+		segno += SUMS_PER_BLOCK;</div><div class='add'>+		if (IS_ERR(sum_folio)) {</div><div class='add'>+			int err = PTR_ERR(sum_folio);</div><div class='add'>+</div><div class='add'>+			end_segno = segno - SUMS_PER_BLOCK;</div><div class='add'>+			segno = rounddown(start_segno, SUMS_PER_BLOCK);</div><div class='add'>+			while (segno &lt; end_segno) {</div><div class='add'>+				sum_folio = filemap_get_folio(META_MAPPING(sbi),</div><div class='ctx'> 						GET_SUM_BLOCK(sbi, segno));</div><div class='del'>-				f2fs_put_page(sum_page, 0);</div><div class='del'>-				f2fs_put_page(sum_page, 0);</div><div class='add'>+				folio_put_refs(sum_folio, 2);</div><div class='add'>+				segno += SUMS_PER_BLOCK;</div><div class='ctx'> 			}</div><div class='ctx'> 			return err;</div><div class='ctx'> 		}</div><div class='del'>-		unlock_page(sum_page);</div><div class='add'>+		folio_unlock(sum_folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	blk_start_plug(&amp;plug);</div><div class='ctx'> </div><div class='del'>-	for (segno = start_segno; segno &lt; end_segno; segno++) {</div><div class='add'>+	segno = start_segno;</div><div class='add'>+	while (segno &lt; end_segno) {</div><div class='add'>+		unsigned int cur_segno;</div><div class='ctx'> </div><div class='ctx'> 		/* find segment summary of victim */</div><div class='del'>-		sum_page = find_get_page(META_MAPPING(sbi),</div><div class='add'>+		struct folio *sum_folio = filemap_get_folio(META_MAPPING(sbi),</div><div class='ctx'> 					GET_SUM_BLOCK(sbi, segno));</div><div class='del'>-		f2fs_put_page(sum_page, 0);</div><div class='del'>-</div><div class='del'>-		if (get_valid_blocks(sbi, segno, false) == 0)</div><div class='del'>-			goto freed;</div><div class='del'>-		if (gc_type == BG_GC &amp;&amp; __is_large_section(sbi) &amp;&amp;</div><div class='del'>-				migrated &gt;= sbi-&gt;migration_granularity)</div><div class='del'>-			goto skip;</div><div class='del'>-		if (!PageUptodate(sum_page) || unlikely(f2fs_cp_error(sbi)))</div><div class='del'>-			goto skip;</div><div class='del'>-</div><div class='del'>-		sum = page_address(sum_page);</div><div class='del'>-		if (type != GET_SUM_TYPE((&amp;sum-&gt;footer))) {</div><div class='del'>-			f2fs_err(sbi, "Inconsistent segment (%u) type [%d, %d] in SSA and SIT",</div><div class='del'>-				 segno, type, GET_SUM_TYPE((&amp;sum-&gt;footer)));</div><div class='del'>-			set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='del'>-			f2fs_stop_checkpoint(sbi, false);</div><div class='del'>-			goto skip;</div><div class='add'>+		unsigned int block_end_segno = rounddown(segno, SUMS_PER_BLOCK)</div><div class='add'>+					+ SUMS_PER_BLOCK;</div><div class='add'>+</div><div class='add'>+		if (block_end_segno &gt; end_segno)</div><div class='add'>+			block_end_segno = end_segno;</div><div class='add'>+</div><div class='add'>+		if (is_cursec(sbi, GET_SEC_FROM_SEG(sbi, segno))) {</div><div class='add'>+			f2fs_err(sbi, "%s: segment %u is used by log",</div><div class='add'>+							__func__, segno);</div><div class='add'>+			f2fs_bug_on(sbi, 1);</div><div class='add'>+			goto next_block;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * this is to avoid deadlock:</div><div class='del'>-		 * - lock_page(sum_page)         - f2fs_replace_block</div><div class='del'>-		 *  - check_valid_map()            - down_write(sentry_lock)</div><div class='del'>-		 *   - down_read(sentry_lock)     - change_curseg()</div><div class='del'>-		 *                                  - lock_page(sum_page)</div><div class='del'>-		 */</div><div class='del'>-		if (type == SUM_TYPE_NODE)</div><div class='del'>-			submitted += gc_node_segment(sbi, sum-&gt;entries, segno,</div><div class='del'>-								gc_type);</div><div class='del'>-		else</div><div class='del'>-			submitted += gc_data_segment(sbi, sum-&gt;entries, gc_list,</div><div class='del'>-							segno, gc_type,</div><div class='del'>-							force_migrate);</div><div class='add'>+		if (!folio_test_uptodate(sum_folio) ||</div><div class='add'>+		    unlikely(f2fs_cp_error(sbi)))</div><div class='add'>+			goto next_block;</div><div class='ctx'> </div><div class='del'>-		stat_inc_seg_count(sbi, type, gc_type);</div><div class='del'>-		sbi-&gt;gc_reclaimed_segs[sbi-&gt;gc_mode]++;</div><div class='del'>-		migrated++;</div><div class='add'>+		for (cur_segno = segno; cur_segno &lt; block_end_segno;</div><div class='add'>+				cur_segno++) {</div><div class='add'>+			struct f2fs_summary_block *sum;</div><div class='ctx'> </div><div class='del'>-freed:</div><div class='del'>-		if (gc_type == FG_GC &amp;&amp;</div><div class='del'>-				get_valid_blocks(sbi, segno, false) == 0)</div><div class='del'>-			seg_freed++;</div><div class='add'>+			if (get_valid_blocks(sbi, cur_segno, false) == 0)</div><div class='add'>+				goto freed;</div><div class='add'>+			if (gc_type == BG_GC &amp;&amp; __is_large_section(sbi) &amp;&amp;</div><div class='add'>+					migrated &gt;= sbi-&gt;migration_granularity)</div><div class='add'>+				continue;</div><div class='ctx'> </div><div class='del'>-		if (__is_large_section(sbi) &amp;&amp; segno + 1 &lt; end_segno)</div><div class='del'>-			sbi-&gt;next_victim_seg[gc_type] = segno + 1;</div><div class='del'>-skip:</div><div class='del'>-		f2fs_put_page(sum_page, 0);</div><div class='add'>+			sum = SUM_BLK_PAGE_ADDR(sum_folio, cur_segno);</div><div class='add'>+			if (type != GET_SUM_TYPE((&amp;sum-&gt;footer))) {</div><div class='add'>+				f2fs_err(sbi, "Inconsistent segment (%u) type "</div><div class='add'>+						"[%d, %d] in SSA and SIT",</div><div class='add'>+						cur_segno, type,</div><div class='add'>+						GET_SUM_TYPE((&amp;sum-&gt;footer)));</div><div class='add'>+				f2fs_stop_checkpoint(sbi, false,</div><div class='add'>+						STOP_CP_REASON_CORRUPTED_SUMMARY);</div><div class='add'>+				continue;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * this is to avoid deadlock:</div><div class='add'>+			 *  - lock_page(sum_page)     - f2fs_replace_block</div><div class='add'>+			 *   - check_valid_map()        - down_write(sentry_lock)</div><div class='add'>+			 *    - down_read(sentry_lock) - change_curseg()</div><div class='add'>+			 *                               - lock_page(sum_page)</div><div class='add'>+			 */</div><div class='add'>+			if (type == SUM_TYPE_NODE)</div><div class='add'>+				submitted += gc_node_segment(sbi, sum-&gt;entries,</div><div class='add'>+						cur_segno, gc_type);</div><div class='add'>+			else</div><div class='add'>+				submitted += gc_data_segment(sbi, sum-&gt;entries,</div><div class='add'>+						gc_list, cur_segno,</div><div class='add'>+						gc_type, force_migrate);</div><div class='add'>+</div><div class='add'>+			stat_inc_gc_seg_count(sbi, data_type, gc_type);</div><div class='add'>+			sbi-&gt;gc_reclaimed_segs[sbi-&gt;gc_mode]++;</div><div class='add'>+			migrated++;</div><div class='add'>+</div><div class='add'>+freed:</div><div class='add'>+			if (gc_type == FG_GC &amp;&amp;</div><div class='add'>+					get_valid_blocks(sbi, cur_segno, false) == 0)</div><div class='add'>+				seg_freed++;</div><div class='add'>+</div><div class='add'>+			if (__is_large_section(sbi))</div><div class='add'>+				sbi-&gt;next_victim_seg[gc_type] =</div><div class='add'>+					(cur_segno + 1 &lt; sec_end_segno) ?</div><div class='add'>+					cur_segno + 1 : NULL_SEGNO;</div><div class='add'>+		}</div><div class='add'>+next_block:</div><div class='add'>+		folio_put_refs(sum_folio, 2);</div><div class='add'>+		segno = block_end_segno;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (submitted)</div><div class='del'>-		f2fs_submit_merged_write(sbi,</div><div class='del'>-				(type == SUM_TYPE_NODE) ? NODE : DATA);</div><div class='add'>+		f2fs_submit_merged_write(sbi, data_type);</div><div class='ctx'> </div><div class='ctx'> 	blk_finish_plug(&amp;plug);</div><div class='ctx'> </div><div class='del'>-	stat_inc_call_count(sbi-&gt;stat_info);</div><div class='add'>+	if (migrated)</div><div class='add'>+		stat_inc_gc_sec_count(sbi, data_type, gc_type);</div><div class='ctx'> </div><div class='ctx'> 	return seg_freed;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int f2fs_gc(struct f2fs_sb_info *sbi, bool sync,</div><div class='del'>-			bool background, bool force, unsigned int segno)</div><div class='add'>+int f2fs_gc(struct f2fs_sb_info *sbi, struct f2fs_gc_control *gc_control)</div><div class='ctx'> {</div><div class='del'>-	int gc_type = sync ? FG_GC : BG_GC;</div><div class='del'>-	int sec_freed = 0, seg_freed = 0, total_freed = 0;</div><div class='add'>+	int gc_type = gc_control-&gt;init_gc_type;</div><div class='add'>+	unsigned int segno = gc_control-&gt;victim_segno;</div><div class='add'>+	int sec_freed = 0, seg_freed = 0, total_freed = 0, total_sec_freed = 0;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	struct cp_control cpc;</div><div class='del'>-	unsigned int init_segno = segno;</div><div class='ctx'> 	struct gc_inode_list gc_list = {</div><div class='ctx'> 		.ilist = LIST_HEAD_INIT(gc_list.ilist),</div><div class='ctx'> 		.iroot = RADIX_TREE_INIT(gc_list.iroot, GFP_NOFS),</div><div class='ctx'> 	};</div><div class='del'>-	unsigned long long last_skipped = sbi-&gt;skipped_atomic_files[FG_GC];</div><div class='del'>-	unsigned long long first_skipped;</div><div class='ctx'> 	unsigned int skipped_round = 0, round = 0;</div><div class='add'>+	unsigned int upper_secs;</div><div class='ctx'> </div><div class='del'>-	trace_f2fs_gc_begin(sbi-&gt;sb, sync, background,</div><div class='add'>+	trace_f2fs_gc_begin(sbi-&gt;sb, gc_type, gc_control-&gt;no_bg_gc,</div><div class='add'>+				gc_control-&gt;nr_free_secs,</div><div class='ctx'> 				get_pages(sbi, F2FS_DIRTY_NODES),</div><div class='ctx'> 				get_pages(sbi, F2FS_DIRTY_DENTS),</div><div class='ctx'> 				get_pages(sbi, F2FS_DIRTY_IMETA),</div><div class='hunk'>@@ -1705,9 +1914,8 @@ int f2fs_gc(struct f2fs_sb_info *sbi, bool sync,</div><div class='ctx'> 				prefree_segments(sbi));</div><div class='ctx'> </div><div class='ctx'> 	cpc.reason = __get_cp_reason(sbi);</div><div class='del'>-	sbi-&gt;skipped_gc_rwsem = 0;</div><div class='del'>-	first_skipped = last_skipped;</div><div class='ctx'> gc_more:</div><div class='add'>+	sbi-&gt;skipped_gc_rwsem = 0;</div><div class='ctx'> 	if (unlikely(!(sbi-&gt;sb-&gt;s_flags &amp; SB_ACTIVE))) {</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 		goto stop;</div><div class='hunk'>@@ -1717,73 +1925,108 @@ gc_more:</div><div class='ctx'> 		goto stop;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (gc_type == BG_GC &amp;&amp; has_not_enough_free_secs(sbi, 0, 0)) {</div><div class='add'>+	/* Let's run FG_GC, if we don't have enough space. */</div><div class='add'>+	if (has_not_enough_free_secs(sbi, 0, 0)) {</div><div class='add'>+		gc_type = FG_GC;</div><div class='add'>+		gc_control-&gt;one_time = false;</div><div class='add'>+</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * For example, if there are many prefree_segments below given</div><div class='ctx'> 		 * threshold, we can make them free by checkpoint. Then, we</div><div class='ctx'> 		 * secure free segments which doesn't need fggc any more.</div><div class='ctx'> 		 */</div><div class='del'>-		if (prefree_segments(sbi) &amp;&amp;</div><div class='del'>-				!is_sbi_flag_set(sbi, SBI_CP_DISABLED)) {</div><div class='add'>+		if (prefree_segments(sbi)) {</div><div class='add'>+			stat_inc_cp_call_count(sbi, TOTAL_CALL);</div><div class='ctx'> 			ret = f2fs_write_checkpoint(sbi, &amp;cpc);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				goto stop;</div><div class='add'>+			/* Reset due to checkpoint */</div><div class='add'>+			sec_freed = 0;</div><div class='ctx'> 		}</div><div class='del'>-		if (has_not_enough_free_secs(sbi, 0, 0))</div><div class='del'>-			gc_type = FG_GC;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* f2fs_balance_fs doesn't need to do BG_GC in critical path. */</div><div class='del'>-	if (gc_type == BG_GC &amp;&amp; !background) {</div><div class='add'>+	if (gc_type == BG_GC &amp;&amp; gc_control-&gt;no_bg_gc) {</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 		goto stop;</div><div class='ctx'> 	}</div><div class='del'>-	ret = __get_victim(sbi, &amp;segno, gc_type);</div><div class='del'>-	if (ret)</div><div class='add'>+retry:</div><div class='add'>+	ret = __get_victim(sbi, &amp;segno, gc_type, gc_control-&gt;one_time);</div><div class='add'>+	if (ret) {</div><div class='add'>+		/* allow to search victim from sections has pinned data */</div><div class='add'>+		if (ret == -ENODATA &amp;&amp; gc_type == FG_GC &amp;&amp;</div><div class='add'>+				f2fs_pinned_section_exists(DIRTY_I(sbi))) {</div><div class='add'>+			f2fs_unpin_all_sections(sbi, false);</div><div class='add'>+			goto retry;</div><div class='add'>+		}</div><div class='add'>+		goto stop;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	seg_freed = do_garbage_collect(sbi, segno, &amp;gc_list, gc_type,</div><div class='add'>+				gc_control-&gt;should_migrate_blocks,</div><div class='add'>+				gc_control-&gt;one_time);</div><div class='add'>+	if (seg_freed &lt; 0)</div><div class='ctx'> 		goto stop;</div><div class='ctx'> </div><div class='del'>-	seg_freed = do_garbage_collect(sbi, segno, &amp;gc_list, gc_type, force);</div><div class='del'>-	if (gc_type == FG_GC &amp;&amp;</div><div class='del'>-		seg_freed == f2fs_usable_segs_in_sec(sbi, segno))</div><div class='del'>-		sec_freed++;</div><div class='ctx'> 	total_freed += seg_freed;</div><div class='ctx'> </div><div class='del'>-	if (gc_type == FG_GC) {</div><div class='del'>-		if (sbi-&gt;skipped_atomic_files[FG_GC] &gt; last_skipped ||</div><div class='del'>-						sbi-&gt;skipped_gc_rwsem)</div><div class='del'>-			skipped_round++;</div><div class='del'>-		last_skipped = sbi-&gt;skipped_atomic_files[FG_GC];</div><div class='del'>-		round++;</div><div class='add'>+	if (seg_freed == f2fs_usable_segs_in_sec(sbi)) {</div><div class='add'>+		sec_freed++;</div><div class='add'>+		total_sec_freed++;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (gc_type == FG_GC)</div><div class='del'>-		sbi-&gt;cur_victim_sec = NULL_SEGNO;</div><div class='del'>-</div><div class='del'>-	if (sync)</div><div class='add'>+	if (gc_control-&gt;one_time)</div><div class='ctx'> 		goto stop;</div><div class='ctx'> </div><div class='del'>-	if (has_not_enough_free_secs(sbi, sec_freed, 0)) {</div><div class='del'>-		if (skipped_round &lt;= MAX_SKIP_GC_COUNT ||</div><div class='del'>-					skipped_round * 2 &lt; round) {</div><div class='del'>-			segno = NULL_SEGNO;</div><div class='del'>-			goto gc_more;</div><div class='del'>-		}</div><div class='add'>+	if (gc_type == FG_GC) {</div><div class='add'>+		sbi-&gt;cur_victim_sec = NULL_SEGNO;</div><div class='ctx'> </div><div class='del'>-		if (first_skipped &lt; last_skipped &amp;&amp;</div><div class='del'>-				(last_skipped - first_skipped) &gt;</div><div class='del'>-						sbi-&gt;skipped_gc_rwsem) {</div><div class='del'>-			f2fs_drop_inmem_pages_all(sbi, true);</div><div class='del'>-			segno = NULL_SEGNO;</div><div class='del'>-			goto gc_more;</div><div class='add'>+		if (has_enough_free_secs(sbi, sec_freed, 0)) {</div><div class='add'>+			if (!gc_control-&gt;no_bg_gc &amp;&amp;</div><div class='add'>+			    total_sec_freed &lt; gc_control-&gt;nr_free_secs)</div><div class='add'>+				goto go_gc_more;</div><div class='add'>+			goto stop;</div><div class='ctx'> 		}</div><div class='del'>-		if (gc_type == FG_GC &amp;&amp; !is_sbi_flag_set(sbi, SBI_CP_DISABLED))</div><div class='add'>+		if (sbi-&gt;skipped_gc_rwsem)</div><div class='add'>+			skipped_round++;</div><div class='add'>+		round++;</div><div class='add'>+		if (skipped_round &gt; MAX_SKIP_GC_COUNT &amp;&amp;</div><div class='add'>+				skipped_round * 2 &gt;= round) {</div><div class='add'>+			stat_inc_cp_call_count(sbi, TOTAL_CALL);</div><div class='ctx'> 			ret = f2fs_write_checkpoint(sbi, &amp;cpc);</div><div class='add'>+			goto stop;</div><div class='add'>+		}</div><div class='add'>+	} else if (has_enough_free_secs(sbi, 0, 0)) {</div><div class='add'>+		goto stop;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	__get_secs_required(sbi, NULL, &amp;upper_secs, NULL);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Write checkpoint to reclaim prefree segments.</div><div class='add'>+	 * We need more three extra sections for writer's data/node/dentry.</div><div class='add'>+	 */</div><div class='add'>+	if (free_sections(sbi) &lt;= upper_secs + NR_GC_CHECKPOINT_SECS &amp;&amp;</div><div class='add'>+				prefree_segments(sbi)) {</div><div class='add'>+		stat_inc_cp_call_count(sbi, TOTAL_CALL);</div><div class='add'>+		ret = f2fs_write_checkpoint(sbi, &amp;cpc);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto stop;</div><div class='add'>+		/* Reset due to checkpoint */</div><div class='add'>+		sec_freed = 0;</div><div class='add'>+	}</div><div class='add'>+go_gc_more:</div><div class='add'>+	segno = NULL_SEGNO;</div><div class='add'>+	goto gc_more;</div><div class='add'>+</div><div class='ctx'> stop:</div><div class='ctx'> 	SIT_I(sbi)-&gt;last_victim[ALLOC_NEXT] = 0;</div><div class='del'>-	SIT_I(sbi)-&gt;last_victim[FLUSH_DEVICE] = init_segno;</div><div class='add'>+	SIT_I(sbi)-&gt;last_victim[FLUSH_DEVICE] = gc_control-&gt;victim_segno;</div><div class='add'>+</div><div class='add'>+	if (gc_type == FG_GC)</div><div class='add'>+		f2fs_unpin_all_sections(sbi, true);</div><div class='ctx'> </div><div class='del'>-	trace_f2fs_gc_end(sbi-&gt;sb, ret, total_freed, sec_freed,</div><div class='add'>+	trace_f2fs_gc_end(sbi-&gt;sb, ret, total_freed, total_sec_freed,</div><div class='ctx'> 				get_pages(sbi, F2FS_DIRTY_NODES),</div><div class='ctx'> 				get_pages(sbi, F2FS_DIRTY_DENTS),</div><div class='ctx'> 				get_pages(sbi, F2FS_DIRTY_IMETA),</div><div class='hunk'>@@ -1792,12 +2035,12 @@ stop:</div><div class='ctx'> 				reserved_segments(sbi),</div><div class='ctx'> 				prefree_segments(sbi));</div><div class='ctx'> </div><div class='del'>-	up_write(&amp;sbi-&gt;gc_lock);</div><div class='add'>+	f2fs_up_write(&amp;sbi-&gt;gc_lock);</div><div class='ctx'> </div><div class='ctx'> 	put_gc_inode(&amp;gc_list);</div><div class='ctx'> </div><div class='del'>-	if (sync &amp;&amp; !ret)</div><div class='del'>-		ret = sec_freed ? 0 : -EAGAIN;</div><div class='add'>+	if (gc_control-&gt;err_gc_skipped &amp;&amp; !ret)</div><div class='add'>+		ret = total_sec_freed ? 0 : -EAGAIN;</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1805,9 +2048,7 @@ int __init f2fs_create_garbage_collection_cache(void)</div><div class='ctx'> {</div><div class='ctx'> 	victim_entry_slab = f2fs_kmem_cache_create("f2fs_victim_entry",</div><div class='ctx'> 					sizeof(struct victim_entry));</div><div class='del'>-	if (!victim_entry_slab)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	return 0;</div><div class='add'>+	return victim_entry_slab ? 0 : -ENOMEM;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_destroy_garbage_collection_cache(void)</div><div class='hunk'>@@ -1835,8 +2076,6 @@ static void init_atgc_management(struct f2fs_sb_info *sbi)</div><div class='ctx'> </div><div class='ctx'> void f2fs_build_gc_manager(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='del'>-	DIRTY_I(sbi)-&gt;v_ops = &amp;default_v_ops;</div><div class='del'>-</div><div class='ctx'> 	sbi-&gt;gc_pin_file_threshold = DEF_GC_FAILED_PINNED_FILES;</div><div class='ctx'> </div><div class='ctx'> 	/* give warm/cold data area from slower device */</div><div class='hunk'>@@ -1847,10 +2086,52 @@ void f2fs_build_gc_manager(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	init_atgc_management(sbi);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+int f2fs_gc_range(struct f2fs_sb_info *sbi,</div><div class='add'>+		unsigned int start_seg, unsigned int end_seg,</div><div class='add'>+		bool dry_run, unsigned int dry_run_sections)</div><div class='add'>+{</div><div class='add'>+	unsigned int segno;</div><div class='add'>+	unsigned int gc_secs = dry_run_sections;</div><div class='add'>+</div><div class='add'>+	if (unlikely(f2fs_cp_error(sbi)))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	for (segno = start_seg; segno &lt;= end_seg; segno += SEGS_PER_SEC(sbi)) {</div><div class='add'>+		struct gc_inode_list gc_list = {</div><div class='add'>+			.ilist = LIST_HEAD_INIT(gc_list.ilist),</div><div class='add'>+			.iroot = RADIX_TREE_INIT(gc_list.iroot, GFP_NOFS),</div><div class='add'>+		};</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * avoid migrating empty section, as it can be allocated by</div><div class='add'>+		 * log in parallel.</div><div class='add'>+		 */</div><div class='add'>+		if (!get_valid_blocks(sbi, segno, true))</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		if (is_cursec(sbi, GET_SEC_FROM_SEG(sbi, segno)))</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		do_garbage_collect(sbi, segno, &amp;gc_list, FG_GC, true, false);</div><div class='add'>+		put_gc_inode(&amp;gc_list);</div><div class='add'>+</div><div class='add'>+		if (!dry_run &amp;&amp; get_valid_blocks(sbi, segno, true))</div><div class='add'>+			return -EAGAIN;</div><div class='add'>+		if (dry_run &amp;&amp; dry_run_sections &amp;&amp;</div><div class='add'>+		    !get_valid_blocks(sbi, segno, true) &amp;&amp; --gc_secs == 0)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		if (fatal_signal_pending(current))</div><div class='add'>+			return -ERESTARTSYS;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int free_segment_range(struct f2fs_sb_info *sbi,</div><div class='del'>-				unsigned int secs, bool gc_only)</div><div class='add'>+				unsigned int secs, bool dry_run)</div><div class='ctx'> {</div><div class='del'>-	unsigned int segno, next_inuse, start, end;</div><div class='add'>+	unsigned int next_inuse, start, end;</div><div class='ctx'> 	struct cp_control cpc = { CP_RESIZE, 0, 0, 0 };</div><div class='ctx'> 	int gc_mode, gc_type;</div><div class='ctx'> 	int err = 0;</div><div class='hunk'>@@ -1858,7 +2139,7 @@ static int free_segment_range(struct f2fs_sb_info *sbi,</div><div class='ctx'> </div><div class='ctx'> 	/* Force block allocation for GC */</div><div class='ctx'> 	MAIN_SECS(sbi) -= secs;</div><div class='del'>-	start = MAIN_SECS(sbi) * sbi-&gt;segs_per_sec;</div><div class='add'>+	start = MAIN_SECS(sbi) * SEGS_PER_SEC(sbi);</div><div class='ctx'> 	end = MAIN_SEGS(sbi) - 1;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;DIRTY_I(sbi)-&gt;seglist_lock);</div><div class='hunk'>@@ -1872,31 +2153,18 @@ static int free_segment_range(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	mutex_unlock(&amp;DIRTY_I(sbi)-&gt;seglist_lock);</div><div class='ctx'> </div><div class='ctx'> 	/* Move out cursegs from the target range */</div><div class='del'>-	for (type = CURSEG_HOT_DATA; type &lt; NR_CURSEG_PERSIST_TYPE; type++)</div><div class='del'>-		f2fs_allocate_segment_for_resize(sbi, type, start, end);</div><div class='del'>-</div><div class='del'>-	/* do GC to move out valid blocks in the range */</div><div class='del'>-	for (segno = start; segno &lt;= end; segno += sbi-&gt;segs_per_sec) {</div><div class='del'>-		struct gc_inode_list gc_list = {</div><div class='del'>-			.ilist = LIST_HEAD_INIT(gc_list.ilist),</div><div class='del'>-			.iroot = RADIX_TREE_INIT(gc_list.iroot, GFP_NOFS),</div><div class='del'>-		};</div><div class='del'>-</div><div class='del'>-		do_garbage_collect(sbi, segno, &amp;gc_list, FG_GC, true);</div><div class='del'>-		put_gc_inode(&amp;gc_list);</div><div class='del'>-</div><div class='del'>-		if (!gc_only &amp;&amp; get_valid_blocks(sbi, segno, true)) {</div><div class='del'>-			err = -EAGAIN;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		if (fatal_signal_pending(current)) {</div><div class='del'>-			err = -ERESTARTSYS;</div><div class='add'>+	for (type = CURSEG_HOT_DATA; type &lt; NR_CURSEG_PERSIST_TYPE; type++) {</div><div class='add'>+		err = f2fs_allocate_segment_for_resize(sbi, type, start, end);</div><div class='add'>+		if (err)</div><div class='ctx'> 			goto out;</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='del'>-	if (gc_only)</div><div class='add'>+</div><div class='add'>+	/* do GC to move out valid blocks in the range */</div><div class='add'>+	err = f2fs_gc_range(sbi, start, end, dry_run, 0);</div><div class='add'>+	if (err || dry_run)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='add'>+	stat_inc_cp_call_count(sbi, TOTAL_CALL);</div><div class='ctx'> 	err = f2fs_write_checkpoint(sbi, &amp;cpc);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -1919,9 +2187,9 @@ static void update_sb_metadata(struct f2fs_sb_info *sbi, int secs)</div><div class='ctx'> 	int segment_count;</div><div class='ctx'> 	int segment_count_main;</div><div class='ctx'> 	long long block_count;</div><div class='del'>-	int segs = secs * sbi-&gt;segs_per_sec;</div><div class='add'>+	int segs = secs * SEGS_PER_SEC(sbi);</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;sbi-&gt;sb_lock);</div><div class='add'>+	f2fs_down_write(&amp;sbi-&gt;sb_lock);</div><div class='ctx'> </div><div class='ctx'> 	section_count = le32_to_cpu(raw_sb-&gt;section_count);</div><div class='ctx'> 	segment_count = le32_to_cpu(raw_sb-&gt;segment_count);</div><div class='hunk'>@@ -1932,7 +2200,7 @@ static void update_sb_metadata(struct f2fs_sb_info *sbi, int secs)</div><div class='ctx'> 	raw_sb-&gt;segment_count = cpu_to_le32(segment_count + segs);</div><div class='ctx'> 	raw_sb-&gt;segment_count_main = cpu_to_le32(segment_count_main + segs);</div><div class='ctx'> 	raw_sb-&gt;block_count = cpu_to_le64(block_count +</div><div class='del'>-					(long long)segs * sbi-&gt;blocks_per_seg);</div><div class='add'>+			(long long)SEGS_TO_BLKS(sbi, segs));</div><div class='ctx'> 	if (f2fs_is_multi_device(sbi)) {</div><div class='ctx'> 		int last_dev = sbi-&gt;s_ndevs - 1;</div><div class='ctx'> 		int dev_segs =</div><div class='hunk'>@@ -1942,19 +2210,21 @@ static void update_sb_metadata(struct f2fs_sb_info *sbi, int secs)</div><div class='ctx'> 						cpu_to_le32(dev_segs + segs);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	up_write(&amp;sbi-&gt;sb_lock);</div><div class='add'>+	f2fs_up_write(&amp;sbi-&gt;sb_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void update_fs_metadata(struct f2fs_sb_info *sbi, int secs)</div><div class='ctx'> {</div><div class='del'>-	int segs = secs * sbi-&gt;segs_per_sec;</div><div class='del'>-	long long blks = (long long)segs * sbi-&gt;blocks_per_seg;</div><div class='add'>+	int segs = secs * SEGS_PER_SEC(sbi);</div><div class='add'>+	long long blks = SEGS_TO_BLKS(sbi, segs);</div><div class='ctx'> 	long long user_block_count =</div><div class='ctx'> 				le64_to_cpu(F2FS_CKPT(sbi)-&gt;user_block_count);</div><div class='ctx'> </div><div class='ctx'> 	SM_I(sbi)-&gt;segment_count = (int)SM_I(sbi)-&gt;segment_count + segs;</div><div class='ctx'> 	MAIN_SEGS(sbi) = (int)MAIN_SEGS(sbi) + segs;</div><div class='ctx'> 	MAIN_SECS(sbi) += secs;</div><div class='add'>+	if (sbi-&gt;allocate_section_hint &gt; MAIN_SECS(sbi))</div><div class='add'>+		sbi-&gt;allocate_section_hint = MAIN_SECS(sbi);</div><div class='ctx'> 	FREE_I(sbi)-&gt;free_sections = (int)FREE_I(sbi)-&gt;free_sections + secs;</div><div class='ctx'> 	FREE_I(sbi)-&gt;free_segments = (int)FREE_I(sbi)-&gt;free_segments + segs;</div><div class='ctx'> 	F2FS_CKPT(sbi)-&gt;user_block_count = cpu_to_le64(user_block_count + blks);</div><div class='hunk'>@@ -1962,19 +2232,23 @@ static void update_fs_metadata(struct f2fs_sb_info *sbi, int secs)</div><div class='ctx'> 	if (f2fs_is_multi_device(sbi)) {</div><div class='ctx'> 		int last_dev = sbi-&gt;s_ndevs - 1;</div><div class='ctx'> </div><div class='add'>+		sbi-&gt;allocate_section_hint = FDEV(0).total_segments /</div><div class='add'>+					SEGS_PER_SEC(sbi);</div><div class='add'>+</div><div class='ctx'> 		FDEV(last_dev).total_segments =</div><div class='ctx'> 				(int)FDEV(last_dev).total_segments + segs;</div><div class='ctx'> 		FDEV(last_dev).end_blk =</div><div class='ctx'> 				(long long)FDEV(last_dev).end_blk + blks;</div><div class='ctx'> #ifdef CONFIG_BLK_DEV_ZONED</div><div class='del'>-		FDEV(last_dev).nr_blkz = (int)FDEV(last_dev).nr_blkz +</div><div class='del'>-					(int)(blks &gt;&gt; sbi-&gt;log_blocks_per_blkz);</div><div class='add'>+		FDEV(last_dev).nr_blkz = FDEV(last_dev).nr_blkz +</div><div class='add'>+					div_u64(blks, sbi-&gt;blocks_per_blkz);</div><div class='ctx'> #endif</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int f2fs_resize_fs(struct f2fs_sb_info *sbi, __u64 block_count)</div><div class='add'>+int f2fs_resize_fs(struct file *filp, __u64 block_count)</div><div class='ctx'> {</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(file_inode(filp));</div><div class='ctx'> 	__u64 old_block_count, shrunk_blocks;</div><div class='ctx'> 	struct cp_control cpc = { CP_RESIZE, 0, 0, 0 };</div><div class='ctx'> 	unsigned int secs;</div><div class='hunk'>@@ -1989,7 +2263,7 @@ int f2fs_resize_fs(struct f2fs_sb_info *sbi, __u64 block_count)</div><div class='ctx'> 		int last_dev = sbi-&gt;s_ndevs - 1;</div><div class='ctx'> 		__u64 last_segs = FDEV(last_dev).total_segments;</div><div class='ctx'> </div><div class='del'>-		if (block_count + last_segs * sbi-&gt;blocks_per_seg &lt;=</div><div class='add'>+		if (block_count + SEGS_TO_BLKS(sbi, last_segs) &lt;=</div><div class='ctx'> 								old_block_count)</div><div class='ctx'> 			return -EINVAL;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2012,12 +2286,18 @@ int f2fs_resize_fs(struct f2fs_sb_info *sbi, __u64 block_count)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	err = mnt_want_write_file(filp);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='ctx'> 	shrunk_blocks = old_block_count - block_count;</div><div class='ctx'> 	secs = div_u64(shrunk_blocks, BLKS_PER_SEC(sbi));</div><div class='ctx'> </div><div class='ctx'> 	/* stop other GC */</div><div class='del'>-	if (!down_write_trylock(&amp;sbi-&gt;gc_lock))</div><div class='del'>-		return -EAGAIN;</div><div class='add'>+	if (!f2fs_down_write_trylock(&amp;sbi-&gt;gc_lock)) {</div><div class='add'>+		err = -EAGAIN;</div><div class='add'>+		goto out_drop_write;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* stop CP to protect MAIN_SEC in free_segment_range */</div><div class='ctx'> 	f2fs_lock_op(sbi);</div><div class='hunk'>@@ -2036,15 +2316,25 @@ int f2fs_resize_fs(struct f2fs_sb_info *sbi, __u64 block_count)</div><div class='ctx'> </div><div class='ctx'> out_unlock:</div><div class='ctx'> 	f2fs_unlock_op(sbi);</div><div class='del'>-	up_write(&amp;sbi-&gt;gc_lock);</div><div class='add'>+	f2fs_up_write(&amp;sbi-&gt;gc_lock);</div><div class='add'>+out_drop_write:</div><div class='add'>+	mnt_drop_write_file(filp);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	set_sbi_flag(sbi, SBI_IS_RESIZEFS);</div><div class='add'>+	err = freeze_super(sbi-&gt;sb, FREEZE_HOLDER_KERNEL, NULL);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	if (f2fs_readonly(sbi-&gt;sb)) {</div><div class='add'>+		err = thaw_super(sbi-&gt;sb, FREEZE_HOLDER_KERNEL, NULL);</div><div class='add'>+		if (err)</div><div class='add'>+			return err;</div><div class='add'>+		return -EROFS;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	freeze_super(sbi-&gt;sb);</div><div class='del'>-	down_write(&amp;sbi-&gt;gc_lock);</div><div class='del'>-	down_write(&amp;sbi-&gt;cp_global_sem);</div><div class='add'>+	f2fs_down_write(&amp;sbi-&gt;gc_lock);</div><div class='add'>+	f2fs_down_write(&amp;sbi-&gt;cp_global_sem);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;sbi-&gt;stat_lock);</div><div class='ctx'> 	if (shrunk_blocks + valid_user_blocks(sbi) +</div><div class='hunk'>@@ -2057,6 +2347,7 @@ out_unlock:</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> </div><div class='add'>+	set_sbi_flag(sbi, SBI_IS_RESIZEFS);</div><div class='ctx'> 	err = free_segment_range(sbi, secs, false);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto recover_out;</div><div class='hunk'>@@ -2073,6 +2364,7 @@ out_unlock:</div><div class='ctx'> 	clear_sbi_flag(sbi, SBI_IS_RESIZEFS);</div><div class='ctx'> 	set_sbi_flag(sbi, SBI_IS_DIRTY);</div><div class='ctx'> </div><div class='add'>+	stat_inc_cp_call_count(sbi, TOTAL_CALL);</div><div class='ctx'> 	err = f2fs_write_checkpoint(sbi, &amp;cpc);</div><div class='ctx'> 	if (err) {</div><div class='ctx'> 		update_fs_metadata(sbi, secs);</div><div class='hunk'>@@ -2080,6 +2372,7 @@ out_unlock:</div><div class='ctx'> 		f2fs_commit_super(sbi, false);</div><div class='ctx'> 	}</div><div class='ctx'> recover_out:</div><div class='add'>+	clear_sbi_flag(sbi, SBI_IS_RESIZEFS);</div><div class='ctx'> 	if (err) {</div><div class='ctx'> 		set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='ctx'> 		f2fs_err(sbi, "resize_fs failed, should run fsck to repair!");</div><div class='hunk'>@@ -2089,9 +2382,8 @@ recover_out:</div><div class='ctx'> 		spin_unlock(&amp;sbi-&gt;stat_lock);</div><div class='ctx'> 	}</div><div class='ctx'> out_err:</div><div class='del'>-	up_write(&amp;sbi-&gt;cp_global_sem);</div><div class='del'>-	up_write(&amp;sbi-&gt;gc_lock);</div><div class='del'>-	thaw_super(sbi-&gt;sb);</div><div class='del'>-	clear_sbi_flag(sbi, SBI_IS_RESIZEFS);</div><div class='add'>+	f2fs_up_write(&amp;sbi-&gt;cp_global_sem);</div><div class='add'>+	f2fs_up_write(&amp;sbi-&gt;gc_lock);</div><div class='add'>+	thaw_super(sbi-&gt;sb, FREEZE_HOLDER_KERNEL, NULL);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/f2fs/gc.h b/fs/f2fs/gc.h<br/>index 3fe145e8e594..6c4d4567571e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/gc.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/gc.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/gc.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/gc.h</a></div><div class='hunk'>@@ -15,21 +15,36 @@</div><div class='ctx'> #define DEF_GC_THREAD_MAX_SLEEP_TIME	60000</div><div class='ctx'> #define DEF_GC_THREAD_NOGC_SLEEP_TIME	300000	/* wait 5 min */</div><div class='ctx'> </div><div class='add'>+/* GC sleep parameters for zoned deivces */</div><div class='add'>+#define DEF_GC_THREAD_MIN_SLEEP_TIME_ZONED	10</div><div class='add'>+#define DEF_GC_THREAD_MAX_SLEEP_TIME_ZONED	20</div><div class='add'>+#define DEF_GC_THREAD_NOGC_SLEEP_TIME_ZONED	60000</div><div class='add'>+</div><div class='ctx'> /* choose candidates from sections which has age of more than 7 days */</div><div class='ctx'> #define DEF_GC_THREAD_AGE_THRESHOLD		(60 * 60 * 24 * 7)</div><div class='ctx'> #define DEF_GC_THREAD_CANDIDATE_RATIO		20	/* select 20% oldest sections as candidates */</div><div class='ctx'> #define DEF_GC_THREAD_MAX_CANDIDATE_COUNT	10	/* select at most 10 sections as candidates */</div><div class='ctx'> #define DEF_GC_THREAD_AGE_WEIGHT		60	/* age weight */</div><div class='add'>+#define DEF_GC_THREAD_VALID_THRESH_RATIO	80	/* do not GC over 80% valid block ratio for one time GC */</div><div class='ctx'> #define DEFAULT_ACCURACY_CLASS			10000	/* accuracy class */</div><div class='ctx'> </div><div class='ctx'> #define LIMIT_INVALID_BLOCK	40 /* percentage over total user space */</div><div class='ctx'> #define LIMIT_FREE_BLOCK	40 /* percentage over invalid + free space */</div><div class='ctx'> </div><div class='add'>+#define LIMIT_NO_ZONED_GC	60 /* percentage over total user space of no gc for zoned devices */</div><div class='add'>+#define LIMIT_BOOST_ZONED_GC	25 /* percentage over total user space of boosted gc for zoned devices */</div><div class='add'>+#define DEF_MIGRATION_WINDOW_GRANULARITY_ZONED	3</div><div class='add'>+#define BOOST_GC_MULTIPLE	5</div><div class='add'>+#define ZONED_PIN_SEC_REQUIRED_COUNT	1</div><div class='add'>+</div><div class='ctx'> #define DEF_GC_FAILED_PINNED_FILES	2048</div><div class='add'>+#define MAX_GC_FAILED_PINNED_FILES	USHRT_MAX</div><div class='ctx'> </div><div class='ctx'> /* Search max. number of dirty segments to select a victim segment */</div><div class='ctx'> #define DEF_MAX_VICTIM_SEARCH 4096 /* covers 8GB */</div><div class='ctx'> </div><div class='add'>+#define NR_GC_CHECKPOINT_SECS (3)	/* data/node/dentry sections */</div><div class='add'>+</div><div class='ctx'> struct f2fs_gc_kthread {</div><div class='ctx'> 	struct task_struct *f2fs_gc_task;</div><div class='ctx'> 	wait_queue_head_t gc_wait_queue_head;</div><div class='hunk'>@@ -41,13 +56,20 @@ struct f2fs_gc_kthread {</div><div class='ctx'> 	unsigned int no_gc_sleep_time;</div><div class='ctx'> </div><div class='ctx'> 	/* for changing gc mode */</div><div class='del'>-	unsigned int gc_wake;</div><div class='add'>+	bool gc_wake;</div><div class='ctx'> </div><div class='ctx'> 	/* for GC_MERGE mount option */</div><div class='ctx'> 	wait_queue_head_t fggc_wq;		/*</div><div class='ctx'> 						 * caller of f2fs_balance_fs()</div><div class='ctx'> 						 * will wait on this wait queue.</div><div class='ctx'> 						 */</div><div class='add'>+</div><div class='add'>+	/* for gc control for zoned devices */</div><div class='add'>+	unsigned int no_zoned_gc_percent;</div><div class='add'>+	unsigned int boost_zoned_gc_percent;</div><div class='add'>+	unsigned int valid_thresh_ratio;</div><div class='add'>+	unsigned int boost_gc_multiple;</div><div class='add'>+	unsigned int boost_gc_greedy;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct gc_inode_list {</div><div class='hunk'>@@ -55,20 +77,10 @@ struct gc_inode_list {</div><div class='ctx'> 	struct radix_tree_root iroot;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-struct victim_info {</div><div class='del'>-	unsigned long long mtime;	/* mtime of section */</div><div class='del'>-	unsigned int segno;		/* section No. */</div><div class='del'>-};</div><div class='del'>-</div><div class='ctx'> struct victim_entry {</div><div class='ctx'> 	struct rb_node rb_node;		/* rb node located in rb-tree */</div><div class='del'>-	union {</div><div class='del'>-		struct {</div><div class='del'>-			unsigned long long mtime;	/* mtime of section */</div><div class='del'>-			unsigned int segno;		/* segment No. */</div><div class='del'>-		};</div><div class='del'>-		struct victim_info vi;	/* victim info */</div><div class='del'>-	};</div><div class='add'>+	unsigned long long mtime;	/* mtime of section */</div><div class='add'>+	unsigned int segno;		/* segment No. */</div><div class='ctx'> 	struct list_head list;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -104,7 +116,7 @@ static inline block_t free_segs_blk_count(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	if (f2fs_sb_has_blkzoned(sbi))</div><div class='ctx'> 		return free_segs_blk_count_zoned(sbi);</div><div class='ctx'> </div><div class='del'>-	return free_segments(sbi) &lt;&lt; sbi-&gt;log_blocks_per_seg;</div><div class='add'>+	return SEGS_TO_BLKS(sbi, free_segments(sbi));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline block_t free_user_blocks(struct f2fs_sb_info *sbi)</div><div class='hunk'>@@ -112,7 +124,7 @@ static inline block_t free_user_blocks(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	block_t free_blks, ovp_blks;</div><div class='ctx'> </div><div class='ctx'> 	free_blks = free_segs_blk_count(sbi);</div><div class='del'>-	ovp_blks = overprovision_segments(sbi) &lt;&lt; sbi-&gt;log_blocks_per_seg;</div><div class='add'>+	ovp_blks = SEGS_TO_BLKS(sbi, overprovision_segments(sbi));</div><div class='ctx'> </div><div class='ctx'> 	if (free_blks &lt; ovp_blks)</div><div class='ctx'> 		return 0;</div><div class='hunk'>@@ -120,15 +132,13 @@ static inline block_t free_user_blocks(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	return free_blks - ovp_blks;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline block_t limit_invalid_user_blocks(struct f2fs_sb_info *sbi)</div><div class='add'>+static inline block_t limit_invalid_user_blocks(block_t user_block_count)</div><div class='ctx'> {</div><div class='del'>-	return (long)(sbi-&gt;user_block_count * LIMIT_INVALID_BLOCK) / 100;</div><div class='add'>+	return (long)(user_block_count * LIMIT_INVALID_BLOCK) / 100;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline block_t limit_free_user_blocks(struct f2fs_sb_info *sbi)</div><div class='add'>+static inline block_t limit_free_user_blocks(block_t reclaimable_user_blocks)</div><div class='ctx'> {</div><div class='del'>-	block_t reclaimable_user_blocks = sbi-&gt;user_block_count -</div><div class='del'>-		written_block_count(sbi);</div><div class='ctx'> 	return (long)(reclaimable_user_blocks * LIMIT_FREE_BLOCK) / 100;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -161,17 +171,32 @@ static inline void decrease_sleep_time(struct f2fs_gc_kthread *gc_th,</div><div class='ctx'> 		*wait -= min_time;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline bool has_enough_free_blocks(struct f2fs_sb_info *sbi,</div><div class='add'>+						unsigned int limit_perc)</div><div class='add'>+{</div><div class='add'>+	return free_sections(sbi) &gt; ((sbi-&gt;total_sections * limit_perc) / 100);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline bool has_enough_invalid_blocks(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='del'>-	block_t invalid_user_blocks = sbi-&gt;user_block_count -</div><div class='del'>-					written_block_count(sbi);</div><div class='add'>+	block_t user_block_count = sbi-&gt;user_block_count;</div><div class='add'>+	block_t invalid_user_blocks = user_block_count -</div><div class='add'>+		written_block_count(sbi);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Background GC is triggered with the following conditions.</div><div class='ctx'> 	 * 1. There are a number of invalid blocks.</div><div class='ctx'> 	 * 2. There is not enough free space.</div><div class='ctx'> 	 */</div><div class='del'>-	if (invalid_user_blocks &gt; limit_invalid_user_blocks(sbi) &amp;&amp;</div><div class='del'>-			free_user_blocks(sbi) &lt; limit_free_user_blocks(sbi))</div><div class='del'>-		return true;</div><div class='del'>-	return false;</div><div class='add'>+	return (invalid_user_blocks &gt;</div><div class='add'>+			limit_invalid_user_blocks(user_block_count) &amp;&amp;</div><div class='add'>+		free_user_blocks(sbi) &lt;</div><div class='add'>+			limit_free_user_blocks(invalid_user_blocks));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool need_to_boost_gc(struct f2fs_sb_info *sbi)</div><div class='add'>+{</div><div class='add'>+	if (f2fs_sb_has_blkzoned(sbi))</div><div class='add'>+		return !has_enough_free_blocks(sbi,</div><div class='add'>+				sbi-&gt;gc_thread-&gt;boost_zoned_gc_percent);</div><div class='add'>+	return has_enough_invalid_blocks(sbi);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/f2fs/hash.c b/fs/f2fs/hash.c<br/>index e3beac546c63..049ce50cec9b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/hash.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/hash.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/hash.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/hash.c</a></div><div class='hunk'>@@ -91,7 +91,7 @@ static u32 TEA_hash_name(const u8 *p, size_t len)</div><div class='ctx'> /*</div><div class='ctx'>  * Compute @fname-&gt;hash.  For all directories, @fname-&gt;disk_name must be set.</div><div class='ctx'>  * For casefolded directories, @fname-&gt;usr_fname must be set, and also</div><div class='del'>- * @fname-&gt;cf_name if the filename is valid Unicode.</div><div class='add'>+ * @fname-&gt;cf_name if the filename is valid Unicode and is not "." or "..".</div><div class='ctx'>  */</div><div class='ctx'> void f2fs_hash_filename(const struct inode *dir, struct f2fs_filename *fname)</div><div class='ctx'> {</div><div class='hunk'>@@ -105,15 +105,16 @@ void f2fs_hash_filename(const struct inode *dir, struct f2fs_filename *fname)</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='ctx'> 	if (IS_CASEFOLDED(dir)) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * If the casefolded name is provided, hash it instead of the</div><div class='ctx'> 		 * on-disk name.  If the casefolded name is *not* provided, that</div><div class='del'>-		 * should only be because the name wasn't valid Unicode, so fall</div><div class='del'>-		 * back to treating the name as an opaque byte sequence.  Note</div><div class='del'>-		 * that to handle encrypted directories, the fallback must use</div><div class='del'>-		 * usr_fname (plaintext) rather than disk_name (ciphertext).</div><div class='add'>+		 * should only be because the name wasn't valid Unicode or was</div><div class='add'>+		 * "." or "..", so fall back to treating the name as an opaque</div><div class='add'>+		 * byte sequence.  Note that to handle encrypted directories,</div><div class='add'>+		 * the fallback must use usr_fname (plaintext) rather than</div><div class='add'>+		 * disk_name (ciphertext).</div><div class='ctx'> 		 */</div><div class='ctx'> 		WARN_ON_ONCE(!fname-&gt;usr_fname-&gt;name);</div><div class='ctx'> 		if (fname-&gt;cf_name.name) {</div><div class='head'>diff --git a/fs/f2fs/inline.c b/fs/f2fs/inline.c<br/>index ea08f0dfa1bd..e5c6a08b7e4f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/inline.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/inline.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/inline.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/inline.c</a></div><div class='hunk'>@@ -14,21 +14,58 @@</div><div class='ctx'> #include "node.h"</div><div class='ctx'> #include &lt;trace/events/f2fs.h&gt;</div><div class='ctx'> </div><div class='del'>-bool f2fs_may_inline_data(struct inode *inode)</div><div class='add'>+static bool support_inline_data(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	if (f2fs_is_atomic_file(inode))</div><div class='add'>+	if (f2fs_used_in_atomic_write(inode))</div><div class='ctx'> 		return false;</div><div class='del'>-</div><div class='ctx'> 	if (!S_ISREG(inode-&gt;i_mode) &amp;&amp; !S_ISLNK(inode-&gt;i_mode))</div><div class='ctx'> 		return false;</div><div class='del'>-</div><div class='ctx'> 	if (i_size_read(inode) &gt; MAX_INLINE_DATA(inode))</div><div class='ctx'> 		return false;</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if (f2fs_post_read_required(inode))</div><div class='add'>+bool f2fs_may_inline_data(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	if (!support_inline_data(inode))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	return true;</div><div class='add'>+	return !f2fs_post_read_required(inode);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool inode_has_blocks(struct inode *inode, struct folio *ifolio)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_inode *ri = F2FS_INODE(ifolio);</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	if (F2FS_HAS_BLOCKS(inode))</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; DEF_NIDS_PER_INODE; i++) {</div><div class='add'>+		if (ri-&gt;i_nid[i])</div><div class='add'>+			return true;</div><div class='add'>+	}</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool f2fs_sanity_check_inline_data(struct inode *inode, struct folio *ifolio)</div><div class='add'>+{</div><div class='add'>+	if (!f2fs_has_inline_data(inode))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	if (inode_has_blocks(inode, ifolio))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	if (!support_inline_data(inode))</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * used by sanity_check_inode(), when disk layout fields has not</div><div class='add'>+	 * been synchronized to inmem fields.</div><div class='add'>+	 */</div><div class='add'>+	return (S_ISREG(inode-&gt;i_mode) &amp;&amp;</div><div class='add'>+		(file_is_encrypt(inode) || file_is_verity(inode) ||</div><div class='add'>+		(F2FS_I(inode)-&gt;i_flags &amp; F2FS_COMPR_FL)));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> bool f2fs_may_inline_dentry(struct inode *inode)</div><div class='hunk'>@@ -42,74 +79,70 @@ bool f2fs_may_inline_dentry(struct inode *inode)</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_do_read_inline_data(struct page *page, struct page *ipage)</div><div class='add'>+void f2fs_do_read_inline_data(struct folio *folio, struct folio *ifolio)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-	void *src_addr, *dst_addr;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> </div><div class='del'>-	if (PageUptodate(page))</div><div class='add'>+	if (folio_test_uptodate(folio))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	f2fs_bug_on(F2FS_P_SB(page), page-&gt;index);</div><div class='add'>+	f2fs_bug_on(F2FS_I_SB(inode), folio-&gt;index);</div><div class='ctx'> </div><div class='del'>-	zero_user_segment(page, MAX_INLINE_DATA(inode), PAGE_SIZE);</div><div class='add'>+	folio_zero_segment(folio, MAX_INLINE_DATA(inode), folio_size(folio));</div><div class='ctx'> </div><div class='ctx'> 	/* Copy the whole inline data block */</div><div class='del'>-	src_addr = inline_data_addr(inode, ipage);</div><div class='del'>-	dst_addr = kmap_atomic(page);</div><div class='del'>-	memcpy(dst_addr, src_addr, MAX_INLINE_DATA(inode));</div><div class='del'>-	flush_dcache_page(page);</div><div class='del'>-	kunmap_atomic(dst_addr);</div><div class='del'>-	if (!PageUptodate(page))</div><div class='del'>-		SetPageUptodate(page);</div><div class='add'>+	memcpy_to_folio(folio, 0, inline_data_addr(inode, ifolio),</div><div class='add'>+		       MAX_INLINE_DATA(inode));</div><div class='add'>+	if (!folio_test_uptodate(folio))</div><div class='add'>+		folio_mark_uptodate(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_truncate_inline_inode(struct inode *inode,</div><div class='del'>-					struct page *ipage, u64 from)</div><div class='add'>+void f2fs_truncate_inline_inode(struct inode *inode, struct folio *ifolio,</div><div class='add'>+		u64 from)</div><div class='ctx'> {</div><div class='ctx'> 	void *addr;</div><div class='ctx'> </div><div class='ctx'> 	if (from &gt;= MAX_INLINE_DATA(inode))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	addr = inline_data_addr(inode, ipage);</div><div class='add'>+	addr = inline_data_addr(inode, ifolio);</div><div class='ctx'> </div><div class='del'>-	f2fs_wait_on_page_writeback(ipage, NODE, true, true);</div><div class='add'>+	f2fs_folio_wait_writeback(ifolio, NODE, true, true);</div><div class='ctx'> 	memset(addr + from, 0, MAX_INLINE_DATA(inode) - from);</div><div class='del'>-	set_page_dirty(ipage);</div><div class='add'>+	folio_mark_dirty(ifolio);</div><div class='ctx'> </div><div class='ctx'> 	if (from == 0)</div><div class='ctx'> 		clear_inode_flag(inode, FI_DATA_EXIST);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int f2fs_read_inline_data(struct inode *inode, struct page *page)</div><div class='add'>+int f2fs_read_inline_data(struct inode *inode, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct page *ipage;</div><div class='add'>+	struct folio *ifolio;</div><div class='ctx'> </div><div class='del'>-	ipage = f2fs_get_node_page(F2FS_I_SB(inode), inode-&gt;i_ino);</div><div class='del'>-	if (IS_ERR(ipage)) {</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		return PTR_ERR(ipage);</div><div class='add'>+	ifolio = f2fs_get_inode_folio(F2FS_I_SB(inode), inode-&gt;i_ino);</div><div class='add'>+	if (IS_ERR(ifolio)) {</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		return PTR_ERR(ifolio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!f2fs_has_inline_data(inode)) {</div><div class='del'>-		f2fs_put_page(ipage, 1);</div><div class='add'>+		f2fs_folio_put(ifolio, true);</div><div class='ctx'> 		return -EAGAIN;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (page-&gt;index)</div><div class='del'>-		zero_user_segment(page, 0, PAGE_SIZE);</div><div class='add'>+	if (folio-&gt;index)</div><div class='add'>+		folio_zero_segment(folio, 0, folio_size(folio));</div><div class='ctx'> 	else</div><div class='del'>-		f2fs_do_read_inline_data(page, ipage);</div><div class='add'>+		f2fs_do_read_inline_data(folio, ifolio);</div><div class='ctx'> </div><div class='del'>-	if (!PageUptodate(page))</div><div class='del'>-		SetPageUptodate(page);</div><div class='del'>-	f2fs_put_page(ipage, 1);</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	if (!folio_test_uptodate(folio))</div><div class='add'>+		folio_mark_uptodate(folio);</div><div class='add'>+	f2fs_folio_put(ifolio, true);</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int f2fs_convert_inline_page(struct dnode_of_data *dn, struct page *page)</div><div class='add'>+int f2fs_convert_inline_folio(struct dnode_of_data *dn, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_io_info fio = {</div><div class='ctx'> 		.sbi = F2FS_I_SB(dn-&gt;inode),</div><div class='hunk'>@@ -117,7 +150,7 @@ int f2fs_convert_inline_page(struct dnode_of_data *dn, struct page *page)</div><div class='ctx'> 		.type = DATA,</div><div class='ctx'> 		.op = REQ_OP_WRITE,</div><div class='ctx'> 		.op_flags = REQ_SYNC | REQ_PRIO,</div><div class='del'>-		.page = page,</div><div class='add'>+		.folio = folio,</div><div class='ctx'> 		.encrypted_page = NULL,</div><div class='ctx'> 		.io_type = FS_DATA_IO,</div><div class='ctx'> 	};</div><div class='hunk'>@@ -131,7 +164,7 @@ int f2fs_convert_inline_page(struct dnode_of_data *dn, struct page *page)</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	err = f2fs_get_node_info(fio.sbi, dn-&gt;nid, &amp;ni);</div><div class='add'>+	err = f2fs_get_node_info(fio.sbi, dn-&gt;nid, &amp;ni, false);</div><div class='ctx'> 	if (err) {</div><div class='ctx'> 		f2fs_truncate_data_blocks_range(dn, 1);</div><div class='ctx'> 		f2fs_put_dnode(dn);</div><div class='hunk'>@@ -145,24 +178,24 @@ int f2fs_convert_inline_page(struct dnode_of_data *dn, struct page *page)</div><div class='ctx'> 		set_sbi_flag(fio.sbi, SBI_NEED_FSCK);</div><div class='ctx'> 		f2fs_warn(fio.sbi, "%s: corrupted inline inode ino=%lx, i_addr[0]:0x%x, run fsck to fix.",</div><div class='ctx'> 			  __func__, dn-&gt;inode-&gt;i_ino, dn-&gt;data_blkaddr);</div><div class='add'>+		f2fs_handle_error(fio.sbi, ERROR_INVALID_BLKADDR);</div><div class='ctx'> 		return -EFSCORRUPTED;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	f2fs_bug_on(F2FS_P_SB(page), PageWriteback(page));</div><div class='add'>+	f2fs_bug_on(F2FS_F_SB(folio), folio_test_writeback(folio));</div><div class='ctx'> </div><div class='del'>-	f2fs_do_read_inline_data(page, dn-&gt;inode_page);</div><div class='del'>-	set_page_dirty(page);</div><div class='add'>+	f2fs_do_read_inline_data(folio, dn-&gt;inode_folio);</div><div class='add'>+	folio_mark_dirty(folio);</div><div class='ctx'> </div><div class='ctx'> 	/* clear dirty state */</div><div class='del'>-	dirty = clear_page_dirty_for_io(page);</div><div class='add'>+	dirty = folio_clear_dirty_for_io(folio);</div><div class='ctx'> </div><div class='ctx'> 	/* write data page to try to make data consistent */</div><div class='del'>-	set_page_writeback(page);</div><div class='del'>-	ClearPageError(page);</div><div class='add'>+	folio_start_writeback(folio);</div><div class='ctx'> 	fio.old_blkaddr = dn-&gt;data_blkaddr;</div><div class='ctx'> 	set_inode_flag(dn-&gt;inode, FI_HOT_DATA);</div><div class='ctx'> 	f2fs_outplace_write_data(dn, &amp;fio);</div><div class='del'>-	f2fs_wait_on_page_writeback(page, DATA, true, true);</div><div class='add'>+	f2fs_folio_wait_writeback(folio, DATA, true, true);</div><div class='ctx'> 	if (dirty) {</div><div class='ctx'> 		inode_dec_dirty_pages(dn-&gt;inode);</div><div class='ctx'> 		f2fs_remove_dirty_inode(dn-&gt;inode);</div><div class='hunk'>@@ -172,8 +205,8 @@ int f2fs_convert_inline_page(struct dnode_of_data *dn, struct page *page)</div><div class='ctx'> 	set_inode_flag(dn-&gt;inode, FI_APPEND_WRITE);</div><div class='ctx'> </div><div class='ctx'> 	/* clear inline data and flag after data writeback */</div><div class='del'>-	f2fs_truncate_inline_inode(dn-&gt;inode, dn-&gt;inode_page, 0);</div><div class='del'>-	clear_page_private_inline(dn-&gt;inode_page);</div><div class='add'>+	f2fs_truncate_inline_inode(dn-&gt;inode, dn-&gt;inode_folio, 0);</div><div class='add'>+	folio_clear_f2fs_inline(dn-&gt;inode_folio);</div><div class='ctx'> clear_out:</div><div class='ctx'> 	stat_dec_inline_inode(dn-&gt;inode);</div><div class='ctx'> 	clear_inode_flag(dn-&gt;inode, FI_INLINE_DATA);</div><div class='hunk'>@@ -185,39 +218,41 @@ int f2fs_convert_inline_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	struct dnode_of_data dn;</div><div class='del'>-	struct page *ipage, *page;</div><div class='add'>+	struct folio *ifolio, *folio;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='del'>-	if (!f2fs_has_inline_data(inode) ||</div><div class='del'>-			f2fs_hw_is_readonly(sbi) || f2fs_readonly(sbi-&gt;sb))</div><div class='add'>+	if (f2fs_hw_is_readonly(sbi) || f2fs_readonly(sbi-&gt;sb))</div><div class='add'>+		return -EROFS;</div><div class='add'>+</div><div class='add'>+	if (!f2fs_has_inline_data(inode))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	err = f2fs_dquot_initialize(inode);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	page = f2fs_grab_cache_page(inode-&gt;i_mapping, 0, false);</div><div class='del'>-	if (!page)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	folio = f2fs_grab_cache_folio(inode-&gt;i_mapping, 0, false);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio);</div><div class='ctx'> </div><div class='ctx'> 	f2fs_lock_op(sbi);</div><div class='ctx'> </div><div class='del'>-	ipage = f2fs_get_node_page(sbi, inode-&gt;i_ino);</div><div class='del'>-	if (IS_ERR(ipage)) {</div><div class='del'>-		err = PTR_ERR(ipage);</div><div class='add'>+	ifolio = f2fs_get_inode_folio(sbi, inode-&gt;i_ino);</div><div class='add'>+	if (IS_ERR(ifolio)) {</div><div class='add'>+		err = PTR_ERR(ifolio);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	set_new_dnode(&amp;dn, inode, ipage, ipage, 0);</div><div class='add'>+	set_new_dnode(&amp;dn, inode, ifolio, ifolio, 0);</div><div class='ctx'> </div><div class='ctx'> 	if (f2fs_has_inline_data(inode))</div><div class='del'>-		err = f2fs_convert_inline_page(&amp;dn, page);</div><div class='add'>+		err = f2fs_convert_inline_folio(&amp;dn, folio);</div><div class='ctx'> </div><div class='ctx'> 	f2fs_put_dnode(&amp;dn);</div><div class='ctx'> out:</div><div class='ctx'> 	f2fs_unlock_op(sbi);</div><div class='ctx'> </div><div class='del'>-	f2fs_put_page(page, 1);</div><div class='add'>+	f2fs_folio_put(folio, true);</div><div class='ctx'> </div><div class='ctx'> 	if (!err)</div><div class='ctx'> 		f2fs_balance_fs(sbi, dn.node_changed);</div><div class='hunk'>@@ -225,47 +260,42 @@ out:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int f2fs_write_inline_data(struct inode *inode, struct page *page)</div><div class='add'>+int f2fs_write_inline_data(struct inode *inode, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	void *src_addr, *dst_addr;</div><div class='del'>-	struct dnode_of_data dn;</div><div class='del'>-	int err;</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='add'>+	struct folio *ifolio;</div><div class='ctx'> </div><div class='del'>-	set_new_dnode(&amp;dn, inode, NULL, NULL, 0);</div><div class='del'>-	err = f2fs_get_dnode_of_data(&amp;dn, 0, LOOKUP_NODE);</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='add'>+	ifolio = f2fs_get_inode_folio(sbi, inode-&gt;i_ino);</div><div class='add'>+	if (IS_ERR(ifolio))</div><div class='add'>+		return PTR_ERR(ifolio);</div><div class='ctx'> </div><div class='ctx'> 	if (!f2fs_has_inline_data(inode)) {</div><div class='del'>-		f2fs_put_dnode(&amp;dn);</div><div class='add'>+		f2fs_folio_put(ifolio, true);</div><div class='ctx'> 		return -EAGAIN;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	f2fs_bug_on(F2FS_I_SB(inode), page-&gt;index);</div><div class='add'>+	f2fs_bug_on(F2FS_I_SB(inode), folio-&gt;index);</div><div class='ctx'> </div><div class='del'>-	f2fs_wait_on_page_writeback(dn.inode_page, NODE, true, true);</div><div class='del'>-	src_addr = kmap_atomic(page);</div><div class='del'>-	dst_addr = inline_data_addr(inode, dn.inode_page);</div><div class='del'>-	memcpy(dst_addr, src_addr, MAX_INLINE_DATA(inode));</div><div class='del'>-	kunmap_atomic(src_addr);</div><div class='del'>-	set_page_dirty(dn.inode_page);</div><div class='add'>+	f2fs_folio_wait_writeback(ifolio, NODE, true, true);</div><div class='add'>+	memcpy_from_folio(inline_data_addr(inode, ifolio),</div><div class='add'>+			 folio, 0, MAX_INLINE_DATA(inode));</div><div class='add'>+	folio_mark_dirty(ifolio);</div><div class='ctx'> </div><div class='del'>-	f2fs_clear_page_cache_dirty_tag(page);</div><div class='add'>+	f2fs_clear_page_cache_dirty_tag(folio);</div><div class='ctx'> </div><div class='ctx'> 	set_inode_flag(inode, FI_APPEND_WRITE);</div><div class='ctx'> 	set_inode_flag(inode, FI_DATA_EXIST);</div><div class='ctx'> </div><div class='del'>-	clear_page_private_inline(dn.inode_page);</div><div class='del'>-	f2fs_put_dnode(&amp;dn);</div><div class='add'>+	folio_clear_f2fs_inline(ifolio);</div><div class='add'>+	f2fs_folio_put(ifolio, true);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int f2fs_recover_inline_data(struct inode *inode, struct page *npage)</div><div class='add'>+int f2fs_recover_inline_data(struct inode *inode, struct folio *nfolio)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	struct f2fs_inode *ri = NULL;</div><div class='ctx'> 	void *src_addr, *dst_addr;</div><div class='del'>-	struct page *ipage;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The inline_data recovery policy is as follows.</div><div class='hunk'>@@ -275,38 +305,39 @@ int f2fs_recover_inline_data(struct inode *inode, struct page *npage)</div><div class='ctx'> 	 *    x       o  -&gt; remove data blocks, and then recover inline_data</div><div class='ctx'> 	 *    x       x  -&gt; recover data blocks</div><div class='ctx'> 	 */</div><div class='del'>-	if (IS_INODE(npage))</div><div class='del'>-		ri = F2FS_INODE(npage);</div><div class='add'>+	if (IS_INODE(nfolio))</div><div class='add'>+		ri = F2FS_INODE(nfolio);</div><div class='ctx'> </div><div class='ctx'> 	if (f2fs_has_inline_data(inode) &amp;&amp;</div><div class='ctx'> 			ri &amp;&amp; (ri-&gt;i_inline &amp; F2FS_INLINE_DATA)) {</div><div class='add'>+		struct folio *ifolio;</div><div class='ctx'> process_inline:</div><div class='del'>-		ipage = f2fs_get_node_page(sbi, inode-&gt;i_ino);</div><div class='del'>-		if (IS_ERR(ipage))</div><div class='del'>-			return PTR_ERR(ipage);</div><div class='add'>+		ifolio = f2fs_get_inode_folio(sbi, inode-&gt;i_ino);</div><div class='add'>+		if (IS_ERR(ifolio))</div><div class='add'>+			return PTR_ERR(ifolio);</div><div class='ctx'> </div><div class='del'>-		f2fs_wait_on_page_writeback(ipage, NODE, true, true);</div><div class='add'>+		f2fs_folio_wait_writeback(ifolio, NODE, true, true);</div><div class='ctx'> </div><div class='del'>-		src_addr = inline_data_addr(inode, npage);</div><div class='del'>-		dst_addr = inline_data_addr(inode, ipage);</div><div class='add'>+		src_addr = inline_data_addr(inode, nfolio);</div><div class='add'>+		dst_addr = inline_data_addr(inode, ifolio);</div><div class='ctx'> 		memcpy(dst_addr, src_addr, MAX_INLINE_DATA(inode));</div><div class='ctx'> </div><div class='ctx'> 		set_inode_flag(inode, FI_INLINE_DATA);</div><div class='ctx'> 		set_inode_flag(inode, FI_DATA_EXIST);</div><div class='ctx'> </div><div class='del'>-		set_page_dirty(ipage);</div><div class='del'>-		f2fs_put_page(ipage, 1);</div><div class='add'>+		folio_mark_dirty(ifolio);</div><div class='add'>+		f2fs_folio_put(ifolio, true);</div><div class='ctx'> 		return 1;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (f2fs_has_inline_data(inode)) {</div><div class='del'>-		ipage = f2fs_get_node_page(sbi, inode-&gt;i_ino);</div><div class='del'>-		if (IS_ERR(ipage))</div><div class='del'>-			return PTR_ERR(ipage);</div><div class='del'>-		f2fs_truncate_inline_inode(inode, ipage, 0);</div><div class='add'>+		struct folio *ifolio = f2fs_get_inode_folio(sbi, inode-&gt;i_ino);</div><div class='add'>+		if (IS_ERR(ifolio))</div><div class='add'>+			return PTR_ERR(ifolio);</div><div class='add'>+		f2fs_truncate_inline_inode(inode, ifolio, 0);</div><div class='ctx'> 		stat_dec_inline_inode(inode);</div><div class='ctx'> 		clear_inode_flag(inode, FI_INLINE_DATA);</div><div class='del'>-		f2fs_put_page(ipage, 1);</div><div class='add'>+		f2fs_folio_put(ifolio, true);</div><div class='ctx'> 	} else if (ri &amp;&amp; (ri-&gt;i_inline &amp; F2FS_INLINE_DATA)) {</div><div class='ctx'> 		int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -321,49 +352,50 @@ process_inline:</div><div class='ctx'> </div><div class='ctx'> struct f2fs_dir_entry *f2fs_find_in_inline_dir(struct inode *dir,</div><div class='ctx'> 					const struct f2fs_filename *fname,</div><div class='del'>-					struct page **res_page)</div><div class='add'>+					struct folio **res_folio,</div><div class='add'>+					bool use_hash)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_SB(dir-&gt;i_sb);</div><div class='ctx'> 	struct f2fs_dir_entry *de;</div><div class='ctx'> 	struct f2fs_dentry_ptr d;</div><div class='del'>-	struct page *ipage;</div><div class='add'>+	struct folio *ifolio;</div><div class='ctx'> 	void *inline_dentry;</div><div class='ctx'> </div><div class='del'>-	ipage = f2fs_get_node_page(sbi, dir-&gt;i_ino);</div><div class='del'>-	if (IS_ERR(ipage)) {</div><div class='del'>-		*res_page = ipage;</div><div class='add'>+	ifolio = f2fs_get_inode_folio(sbi, dir-&gt;i_ino);</div><div class='add'>+	if (IS_ERR(ifolio)) {</div><div class='add'>+		*res_folio = ifolio;</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	inline_dentry = inline_data_addr(dir, ipage);</div><div class='add'>+	inline_dentry = inline_data_addr(dir, ifolio);</div><div class='ctx'> </div><div class='ctx'> 	make_dentry_ptr_inline(dir, &amp;d, inline_dentry);</div><div class='del'>-	de = f2fs_find_target_dentry(&amp;d, fname, NULL);</div><div class='del'>-	unlock_page(ipage);</div><div class='add'>+	de = f2fs_find_target_dentry(&amp;d, fname, NULL, use_hash);</div><div class='add'>+	folio_unlock(ifolio);</div><div class='ctx'> 	if (IS_ERR(de)) {</div><div class='del'>-		*res_page = ERR_CAST(de);</div><div class='add'>+		*res_folio = ERR_CAST(de);</div><div class='ctx'> 		de = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (de)</div><div class='del'>-		*res_page = ipage;</div><div class='add'>+		*res_folio = ifolio;</div><div class='ctx'> 	else</div><div class='del'>-		f2fs_put_page(ipage, 0);</div><div class='add'>+		f2fs_folio_put(ifolio, false);</div><div class='ctx'> </div><div class='ctx'> 	return de;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int f2fs_make_empty_inline_dir(struct inode *inode, struct inode *parent,</div><div class='del'>-							struct page *ipage)</div><div class='add'>+							struct folio *ifolio)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_dentry_ptr d;</div><div class='ctx'> 	void *inline_dentry;</div><div class='ctx'> </div><div class='del'>-	inline_dentry = inline_data_addr(inode, ipage);</div><div class='add'>+	inline_dentry = inline_data_addr(inode, ifolio);</div><div class='ctx'> </div><div class='ctx'> 	make_dentry_ptr_inline(inode, &amp;d, inline_dentry);</div><div class='ctx'> 	f2fs_do_make_empty_dir(inode, parent, &amp;d);</div><div class='ctx'> </div><div class='del'>-	set_page_dirty(ipage);</div><div class='add'>+	folio_mark_dirty(ifolio);</div><div class='ctx'> </div><div class='ctx'> 	/* update i_size to MAX_INLINE_DATA */</div><div class='ctx'> 	if (i_size_read(inode) &lt; MAX_INLINE_DATA(inode))</div><div class='hunk'>@@ -375,60 +407,60 @@ int f2fs_make_empty_inline_dir(struct inode *inode, struct inode *parent,</div><div class='ctx'>  * NOTE: ipage is grabbed by caller, but if any error occurs, we should</div><div class='ctx'>  * release ipage in this function.</div><div class='ctx'>  */</div><div class='del'>-static int f2fs_move_inline_dirents(struct inode *dir, struct page *ipage,</div><div class='add'>+static int f2fs_move_inline_dirents(struct inode *dir, struct folio *ifolio,</div><div class='ctx'> 							void *inline_dentry)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	struct dnode_of_data dn;</div><div class='ctx'> 	struct f2fs_dentry_block *dentry_blk;</div><div class='ctx'> 	struct f2fs_dentry_ptr src, dst;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	page = f2fs_grab_cache_page(dir-&gt;i_mapping, 0, true);</div><div class='del'>-	if (!page) {</div><div class='del'>-		f2fs_put_page(ipage, 1);</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	folio = f2fs_grab_cache_folio(dir-&gt;i_mapping, 0, true);</div><div class='add'>+	if (IS_ERR(folio)) {</div><div class='add'>+		f2fs_folio_put(ifolio, true);</div><div class='add'>+		return PTR_ERR(folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	set_new_dnode(&amp;dn, dir, ipage, NULL, 0);</div><div class='add'>+	set_new_dnode(&amp;dn, dir, ifolio, NULL, 0);</div><div class='ctx'> 	err = f2fs_reserve_block(&amp;dn, 0);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(dn.data_blkaddr != NEW_ADDR)) {</div><div class='ctx'> 		f2fs_put_dnode(&amp;dn);</div><div class='del'>-		set_sbi_flag(F2FS_P_SB(page), SBI_NEED_FSCK);</div><div class='del'>-		f2fs_warn(F2FS_P_SB(page), "%s: corrupted inline inode ino=%lx, i_addr[0]:0x%x, run fsck to fix.",</div><div class='add'>+		set_sbi_flag(F2FS_F_SB(folio), SBI_NEED_FSCK);</div><div class='add'>+		f2fs_warn(F2FS_F_SB(folio), "%s: corrupted inline inode ino=%lx, i_addr[0]:0x%x, run fsck to fix.",</div><div class='ctx'> 			  __func__, dir-&gt;i_ino, dn.data_blkaddr);</div><div class='add'>+		f2fs_handle_error(F2FS_F_SB(folio), ERROR_INVALID_BLKADDR);</div><div class='ctx'> 		err = -EFSCORRUPTED;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	f2fs_wait_on_page_writeback(page, DATA, true, true);</div><div class='add'>+	f2fs_folio_wait_writeback(folio, DATA, true, true);</div><div class='ctx'> </div><div class='del'>-	dentry_blk = page_address(page);</div><div class='add'>+	dentry_blk = folio_address(folio);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Start by zeroing the full block, to ensure that all unused space is</div><div class='add'>+	 * zeroed and no uninitialized memory is leaked to disk.</div><div class='add'>+	 */</div><div class='add'>+	memset(dentry_blk, 0, F2FS_BLKSIZE);</div><div class='ctx'> </div><div class='ctx'> 	make_dentry_ptr_inline(dir, &amp;src, inline_dentry);</div><div class='ctx'> 	make_dentry_ptr_block(dir, &amp;dst, dentry_blk);</div><div class='ctx'> </div><div class='ctx'> 	/* copy data from inline dentry block to new dentry block */</div><div class='ctx'> 	memcpy(dst.bitmap, src.bitmap, src.nr_bitmap);</div><div class='del'>-	memset(dst.bitmap + src.nr_bitmap, 0, dst.nr_bitmap - src.nr_bitmap);</div><div class='del'>-	/*</div><div class='del'>-	 * we do not need to zero out remainder part of dentry and filename</div><div class='del'>-	 * field, since we have used bitmap for marking the usage status of</div><div class='del'>-	 * them, besides, we can also ignore copying/zeroing reserved space</div><div class='del'>-	 * of dentry block, because them haven't been used so far.</div><div class='del'>-	 */</div><div class='ctx'> 	memcpy(dst.dentry, src.dentry, SIZE_OF_DIR_ENTRY * src.max);</div><div class='ctx'> 	memcpy(dst.filename, src.filename, src.max * F2FS_SLOT_LEN);</div><div class='ctx'> </div><div class='del'>-	if (!PageUptodate(page))</div><div class='del'>-		SetPageUptodate(page);</div><div class='del'>-	set_page_dirty(page);</div><div class='add'>+	if (!folio_test_uptodate(folio))</div><div class='add'>+		folio_mark_uptodate(folio);</div><div class='add'>+	folio_mark_dirty(folio);</div><div class='ctx'> </div><div class='ctx'> 	/* clear inline dir and flag after data writeback */</div><div class='del'>-	f2fs_truncate_inline_inode(dir, ipage, 0);</div><div class='add'>+	f2fs_truncate_inline_inode(dir, ifolio, 0);</div><div class='ctx'> </div><div class='ctx'> 	stat_dec_inline_dir(dir);</div><div class='ctx'> 	clear_inode_flag(dir, FI_INLINE_DENTRY);</div><div class='hunk'>@@ -445,7 +477,7 @@ static int f2fs_move_inline_dirents(struct inode *dir, struct page *ipage,</div><div class='ctx'> 	if (i_size_read(dir) &lt; PAGE_SIZE)</div><div class='ctx'> 		f2fs_i_size_write(dir, PAGE_SIZE);</div><div class='ctx'> out:</div><div class='del'>-	f2fs_put_page(page, 1);</div><div class='add'>+	f2fs_folio_put(folio, true);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -485,7 +517,7 @@ static int f2fs_add_inline_entries(struct inode *dir, void *inline_dentry)</div><div class='ctx'> 		fname.hash = de-&gt;hash_code;</div><div class='ctx'> </div><div class='ctx'> 		ino = le32_to_cpu(de-&gt;ino);</div><div class='del'>-		fake_mode = f2fs_get_de_type(de) &lt;&lt; S_SHIFT;</div><div class='add'>+		fake_mode = fs_ftype_to_dtype(de-&gt;file_type) &lt;&lt; S_DT_SHIFT;</div><div class='ctx'> </div><div class='ctx'> 		err = f2fs_add_regular_entry(dir, &amp;fname, NULL, ino, fake_mode);</div><div class='ctx'> 		if (err)</div><div class='hunk'>@@ -501,7 +533,7 @@ punch_dentry_pages:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_move_rehashed_dirents(struct inode *dir, struct page *ipage,</div><div class='add'>+static int f2fs_move_rehashed_dirents(struct inode *dir, struct folio *ifolio,</div><div class='ctx'> 							void *inline_dentry)</div><div class='ctx'> {</div><div class='ctx'> 	void *backup_dentry;</div><div class='hunk'>@@ -510,20 +542,20 @@ static int f2fs_move_rehashed_dirents(struct inode *dir, struct page *ipage,</div><div class='ctx'> 	backup_dentry = f2fs_kmalloc(F2FS_I_SB(dir),</div><div class='ctx'> 				MAX_INLINE_DATA(dir), GFP_F2FS_ZERO);</div><div class='ctx'> 	if (!backup_dentry) {</div><div class='del'>-		f2fs_put_page(ipage, 1);</div><div class='add'>+		f2fs_folio_put(ifolio, true);</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	memcpy(backup_dentry, inline_dentry, MAX_INLINE_DATA(dir));</div><div class='del'>-	f2fs_truncate_inline_inode(dir, ipage, 0);</div><div class='add'>+	f2fs_truncate_inline_inode(dir, ifolio, 0);</div><div class='ctx'> </div><div class='del'>-	unlock_page(ipage);</div><div class='add'>+	folio_unlock(ifolio);</div><div class='ctx'> </div><div class='ctx'> 	err = f2fs_add_inline_entries(dir, backup_dentry);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto recover;</div><div class='ctx'> </div><div class='del'>-	lock_page(ipage);</div><div class='add'>+	folio_lock(ifolio);</div><div class='ctx'> </div><div class='ctx'> 	stat_dec_inline_dir(dir);</div><div class='ctx'> 	clear_inode_flag(dir, FI_INLINE_DENTRY);</div><div class='hunk'>@@ -539,31 +571,31 @@ static int f2fs_move_rehashed_dirents(struct inode *dir, struct page *ipage,</div><div class='ctx'> 	kfree(backup_dentry);</div><div class='ctx'> 	return 0;</div><div class='ctx'> recover:</div><div class='del'>-	lock_page(ipage);</div><div class='del'>-	f2fs_wait_on_page_writeback(ipage, NODE, true, true);</div><div class='add'>+	folio_lock(ifolio);</div><div class='add'>+	f2fs_folio_wait_writeback(ifolio, NODE, true, true);</div><div class='ctx'> 	memcpy(inline_dentry, backup_dentry, MAX_INLINE_DATA(dir));</div><div class='ctx'> 	f2fs_i_depth_write(dir, 0);</div><div class='ctx'> 	f2fs_i_size_write(dir, MAX_INLINE_DATA(dir));</div><div class='del'>-	set_page_dirty(ipage);</div><div class='del'>-	f2fs_put_page(ipage, 1);</div><div class='add'>+	folio_mark_dirty(ifolio);</div><div class='add'>+	f2fs_folio_put(ifolio, true);</div><div class='ctx'> </div><div class='ctx'> 	kfree(backup_dentry);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int do_convert_inline_dir(struct inode *dir, struct page *ipage,</div><div class='add'>+static int do_convert_inline_dir(struct inode *dir, struct folio *ifolio,</div><div class='ctx'> 							void *inline_dentry)</div><div class='ctx'> {</div><div class='ctx'> 	if (!F2FS_I(dir)-&gt;i_dir_level)</div><div class='del'>-		return f2fs_move_inline_dirents(dir, ipage, inline_dentry);</div><div class='add'>+		return f2fs_move_inline_dirents(dir, ifolio, inline_dentry);</div><div class='ctx'> 	else</div><div class='del'>-		return f2fs_move_rehashed_dirents(dir, ipage, inline_dentry);</div><div class='add'>+		return f2fs_move_rehashed_dirents(dir, ifolio, inline_dentry);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int f2fs_try_convert_inline_dir(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(dir);</div><div class='del'>-	struct page *ipage;</div><div class='add'>+	struct folio *ifolio;</div><div class='ctx'> 	struct f2fs_filename fname;</div><div class='ctx'> 	void *inline_dentry = NULL;</div><div class='ctx'> 	int err = 0;</div><div class='hunk'>@@ -577,22 +609,22 @@ int f2fs_try_convert_inline_dir(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	ipage = f2fs_get_node_page(sbi, dir-&gt;i_ino);</div><div class='del'>-	if (IS_ERR(ipage)) {</div><div class='del'>-		err = PTR_ERR(ipage);</div><div class='add'>+	ifolio = f2fs_get_inode_folio(sbi, dir-&gt;i_ino);</div><div class='add'>+	if (IS_ERR(ifolio)) {</div><div class='add'>+		err = PTR_ERR(ifolio);</div><div class='ctx'> 		goto out_fname;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (f2fs_has_enough_room(dir, ipage, &amp;fname)) {</div><div class='del'>-		f2fs_put_page(ipage, 1);</div><div class='add'>+	if (f2fs_has_enough_room(dir, ifolio, &amp;fname)) {</div><div class='add'>+		f2fs_folio_put(ifolio, true);</div><div class='ctx'> 		goto out_fname;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	inline_dentry = inline_data_addr(dir, ipage);</div><div class='add'>+	inline_dentry = inline_data_addr(dir, ifolio);</div><div class='ctx'> </div><div class='del'>-	err = do_convert_inline_dir(dir, ipage, inline_dentry);</div><div class='add'>+	err = do_convert_inline_dir(dir, ifolio, inline_dentry);</div><div class='ctx'> 	if (!err)</div><div class='del'>-		f2fs_put_page(ipage, 1);</div><div class='add'>+		f2fs_folio_put(ifolio, true);</div><div class='ctx'> out_fname:</div><div class='ctx'> 	f2fs_free_filename(&amp;fname);</div><div class='ctx'> out:</div><div class='hunk'>@@ -604,24 +636,24 @@ int f2fs_add_inline_entry(struct inode *dir, const struct f2fs_filename *fname,</div><div class='ctx'> 			  struct inode *inode, nid_t ino, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(dir);</div><div class='del'>-	struct page *ipage;</div><div class='add'>+	struct folio *ifolio;</div><div class='ctx'> 	unsigned int bit_pos;</div><div class='ctx'> 	void *inline_dentry = NULL;</div><div class='ctx'> 	struct f2fs_dentry_ptr d;</div><div class='ctx'> 	int slots = GET_DENTRY_SLOTS(fname-&gt;disk_name.len);</div><div class='del'>-	struct page *page = NULL;</div><div class='add'>+	struct folio *folio = NULL;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='del'>-	ipage = f2fs_get_node_page(sbi, dir-&gt;i_ino);</div><div class='del'>-	if (IS_ERR(ipage))</div><div class='del'>-		return PTR_ERR(ipage);</div><div class='add'>+	ifolio = f2fs_get_inode_folio(sbi, dir-&gt;i_ino);</div><div class='add'>+	if (IS_ERR(ifolio))</div><div class='add'>+		return PTR_ERR(ifolio);</div><div class='ctx'> </div><div class='del'>-	inline_dentry = inline_data_addr(dir, ipage);</div><div class='add'>+	inline_dentry = inline_data_addr(dir, ifolio);</div><div class='ctx'> 	make_dentry_ptr_inline(dir, &amp;d, inline_dentry);</div><div class='ctx'> </div><div class='ctx'> 	bit_pos = f2fs_room_for_filename(d.bitmap, slots, d.max);</div><div class='ctx'> 	if (bit_pos &gt;= d.max) {</div><div class='del'>-		err = do_convert_inline_dir(dir, ipage, inline_dentry);</div><div class='add'>+		err = do_convert_inline_dir(dir, ifolio, inline_dentry);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			return err;</div><div class='ctx'> 		err = -EAGAIN;</div><div class='hunk'>@@ -629,20 +661,21 @@ int f2fs_add_inline_entry(struct inode *dir, const struct f2fs_filename *fname,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (inode) {</div><div class='del'>-		down_write(&amp;F2FS_I(inode)-&gt;i_sem);</div><div class='del'>-		page = f2fs_init_inode_metadata(inode, dir, fname, ipage);</div><div class='del'>-		if (IS_ERR(page)) {</div><div class='del'>-			err = PTR_ERR(page);</div><div class='add'>+		f2fs_down_write_nested(&amp;F2FS_I(inode)-&gt;i_sem,</div><div class='add'>+						SINGLE_DEPTH_NESTING);</div><div class='add'>+		folio = f2fs_init_inode_metadata(inode, dir, fname, ifolio);</div><div class='add'>+		if (IS_ERR(folio)) {</div><div class='add'>+			err = PTR_ERR(folio);</div><div class='ctx'> 			goto fail;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	f2fs_wait_on_page_writeback(ipage, NODE, true, true);</div><div class='add'>+	f2fs_folio_wait_writeback(ifolio, NODE, true, true);</div><div class='ctx'> </div><div class='ctx'> 	f2fs_update_dentry(ino, mode, &amp;d, &amp;fname-&gt;disk_name, fname-&gt;hash,</div><div class='ctx'> 			   bit_pos);</div><div class='ctx'> </div><div class='del'>-	set_page_dirty(ipage);</div><div class='add'>+	folio_mark_dirty(ifolio);</div><div class='ctx'> </div><div class='ctx'> 	/* we don't need to mark_inode_dirty now */</div><div class='ctx'> 	if (inode) {</div><div class='hunk'>@@ -650,22 +683,22 @@ int f2fs_add_inline_entry(struct inode *dir, const struct f2fs_filename *fname,</div><div class='ctx'> </div><div class='ctx'> 		/* synchronize inode page's data from inode cache */</div><div class='ctx'> 		if (is_inode_flag_set(inode, FI_NEW_INODE))</div><div class='del'>-			f2fs_update_inode(inode, page);</div><div class='add'>+			f2fs_update_inode(inode, folio);</div><div class='ctx'> </div><div class='del'>-		f2fs_put_page(page, 1);</div><div class='add'>+		f2fs_folio_put(folio, true);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	f2fs_update_parent_metadata(dir, inode, 0);</div><div class='ctx'> fail:</div><div class='ctx'> 	if (inode)</div><div class='del'>-		up_write(&amp;F2FS_I(inode)-&gt;i_sem);</div><div class='add'>+		f2fs_up_write(&amp;F2FS_I(inode)-&gt;i_sem);</div><div class='ctx'> out:</div><div class='del'>-	f2fs_put_page(ipage, 1);</div><div class='add'>+	f2fs_folio_put(ifolio, true);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_delete_inline_entry(struct f2fs_dir_entry *dentry, struct page *page,</div><div class='del'>-					struct inode *dir, struct inode *inode)</div><div class='add'>+void f2fs_delete_inline_entry(struct f2fs_dir_entry *dentry,</div><div class='add'>+		struct folio *folio, struct inode *dir, struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_dentry_ptr d;</div><div class='ctx'> 	void *inline_dentry;</div><div class='hunk'>@@ -673,20 +706,20 @@ void f2fs_delete_inline_entry(struct f2fs_dir_entry *dentry, struct page *page,</div><div class='ctx'> 	unsigned int bit_pos;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	lock_page(page);</div><div class='del'>-	f2fs_wait_on_page_writeback(page, NODE, true, true);</div><div class='add'>+	folio_lock(folio);</div><div class='add'>+	f2fs_folio_wait_writeback(folio, NODE, true, true);</div><div class='ctx'> </div><div class='del'>-	inline_dentry = inline_data_addr(dir, page);</div><div class='add'>+	inline_dentry = inline_data_addr(dir, folio);</div><div class='ctx'> 	make_dentry_ptr_inline(dir, &amp;d, inline_dentry);</div><div class='ctx'> </div><div class='ctx'> 	bit_pos = dentry - d.dentry;</div><div class='ctx'> 	for (i = 0; i &lt; slots; i++)</div><div class='ctx'> 		__clear_bit_le(bit_pos + i, d.bitmap);</div><div class='ctx'> </div><div class='del'>-	set_page_dirty(page);</div><div class='del'>-	f2fs_put_page(page, 1);</div><div class='add'>+	folio_mark_dirty(folio);</div><div class='add'>+	f2fs_folio_put(folio, true);</div><div class='ctx'> </div><div class='del'>-	dir-&gt;i_ctime = dir-&gt;i_mtime = current_time(dir);</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='ctx'> 	f2fs_mark_inode_dirty_sync(dir, false);</div><div class='ctx'> </div><div class='ctx'> 	if (inode)</div><div class='hunk'>@@ -696,21 +729,21 @@ void f2fs_delete_inline_entry(struct f2fs_dir_entry *dentry, struct page *page,</div><div class='ctx'> bool f2fs_empty_inline_dir(struct inode *dir)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(dir);</div><div class='del'>-	struct page *ipage;</div><div class='add'>+	struct folio *ifolio;</div><div class='ctx'> 	unsigned int bit_pos = 2;</div><div class='ctx'> 	void *inline_dentry;</div><div class='ctx'> 	struct f2fs_dentry_ptr d;</div><div class='ctx'> </div><div class='del'>-	ipage = f2fs_get_node_page(sbi, dir-&gt;i_ino);</div><div class='del'>-	if (IS_ERR(ipage))</div><div class='add'>+	ifolio = f2fs_get_inode_folio(sbi, dir-&gt;i_ino);</div><div class='add'>+	if (IS_ERR(ifolio))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	inline_dentry = inline_data_addr(dir, ipage);</div><div class='add'>+	inline_dentry = inline_data_addr(dir, ifolio);</div><div class='ctx'> 	make_dentry_ptr_inline(dir, &amp;d, inline_dentry);</div><div class='ctx'> </div><div class='ctx'> 	bit_pos = find_next_bit_le(d.bitmap, d.max, bit_pos);</div><div class='ctx'> </div><div class='del'>-	f2fs_put_page(ipage, 1);</div><div class='add'>+	f2fs_folio_put(ifolio, true);</div><div class='ctx'> </div><div class='ctx'> 	if (bit_pos &lt; d.max)</div><div class='ctx'> 		return false;</div><div class='hunk'>@@ -722,7 +755,7 @@ int f2fs_read_inline_dir(struct file *file, struct dir_context *ctx,</div><div class='ctx'> 				struct fscrypt_str *fstr)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='del'>-	struct page *ipage = NULL;</div><div class='add'>+	struct folio *ifolio = NULL;</div><div class='ctx'> 	struct f2fs_dentry_ptr d;</div><div class='ctx'> 	void *inline_dentry = NULL;</div><div class='ctx'> 	int err;</div><div class='hunk'>@@ -732,17 +765,17 @@ int f2fs_read_inline_dir(struct file *file, struct dir_context *ctx,</div><div class='ctx'> 	if (ctx-&gt;pos == d.max)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	ipage = f2fs_get_node_page(F2FS_I_SB(inode), inode-&gt;i_ino);</div><div class='del'>-	if (IS_ERR(ipage))</div><div class='del'>-		return PTR_ERR(ipage);</div><div class='add'>+	ifolio = f2fs_get_inode_folio(F2FS_I_SB(inode), inode-&gt;i_ino);</div><div class='add'>+	if (IS_ERR(ifolio))</div><div class='add'>+		return PTR_ERR(ifolio);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * f2fs_readdir was protected by inode.i_rwsem, it is safe to access</div><div class='ctx'> 	 * ipage without page's lock held.</div><div class='ctx'> 	 */</div><div class='del'>-	unlock_page(ipage);</div><div class='add'>+	folio_unlock(ifolio);</div><div class='ctx'> </div><div class='del'>-	inline_dentry = inline_data_addr(inode, ipage);</div><div class='add'>+	inline_dentry = inline_data_addr(inode, ifolio);</div><div class='ctx'> </div><div class='ctx'> 	make_dentry_ptr_inline(inode, &amp;d, inline_dentry);</div><div class='ctx'> </div><div class='hunk'>@@ -750,7 +783,7 @@ int f2fs_read_inline_dir(struct file *file, struct dir_context *ctx,</div><div class='ctx'> 	if (!err)</div><div class='ctx'> 		ctx-&gt;pos = d.max;</div><div class='ctx'> </div><div class='del'>-	f2fs_put_page(ipage, 0);</div><div class='add'>+	f2fs_folio_put(ifolio, false);</div><div class='ctx'> 	return err &lt; 0 ? err : 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -761,12 +794,12 @@ int f2fs_inline_data_fiemap(struct inode *inode,</div><div class='ctx'> 	__u32 flags = FIEMAP_EXTENT_DATA_INLINE | FIEMAP_EXTENT_NOT_ALIGNED |</div><div class='ctx'> 		FIEMAP_EXTENT_LAST;</div><div class='ctx'> 	struct node_info ni;</div><div class='del'>-	struct page *ipage;</div><div class='add'>+	struct folio *ifolio;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='del'>-	ipage = f2fs_get_node_page(F2FS_I_SB(inode), inode-&gt;i_ino);</div><div class='del'>-	if (IS_ERR(ipage))</div><div class='del'>-		return PTR_ERR(ipage);</div><div class='add'>+	ifolio = f2fs_get_inode_folio(F2FS_I_SB(inode), inode-&gt;i_ino);</div><div class='add'>+	if (IS_ERR(ifolio))</div><div class='add'>+		return PTR_ERR(ifolio);</div><div class='ctx'> </div><div class='ctx'> 	if ((S_ISREG(inode-&gt;i_mode) || S_ISLNK(inode-&gt;i_mode)) &amp;&amp;</div><div class='ctx'> 				!f2fs_has_inline_data(inode)) {</div><div class='hunk'>@@ -786,16 +819,16 @@ int f2fs_inline_data_fiemap(struct inode *inode,</div><div class='ctx'> 		ilen = start + len;</div><div class='ctx'> 	ilen -= start;</div><div class='ctx'> </div><div class='del'>-	err = f2fs_get_node_info(F2FS_I_SB(inode), inode-&gt;i_ino, &amp;ni);</div><div class='add'>+	err = f2fs_get_node_info(F2FS_I_SB(inode), inode-&gt;i_ino, &amp;ni, false);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	byteaddr = (__u64)ni.blk_addr &lt;&lt; inode-&gt;i_sb-&gt;s_blocksize_bits;</div><div class='del'>-	byteaddr += (char *)inline_data_addr(inode, ipage) -</div><div class='del'>-					(char *)F2FS_INODE(ipage);</div><div class='add'>+	byteaddr += (char *)inline_data_addr(inode, ifolio) -</div><div class='add'>+					(char *)F2FS_INODE(ifolio);</div><div class='ctx'> 	err = fiemap_fill_next_extent(fieinfo, start, byteaddr, ilen, flags);</div><div class='ctx'> 	trace_f2fs_fiemap(inode, start, byteaddr, ilen, flags, err);</div><div class='ctx'> out:</div><div class='del'>-	f2fs_put_page(ipage, 1);</div><div class='add'>+	f2fs_folio_put(ifolio, true);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/f2fs/inode.c b/fs/f2fs/inode.c<br/>index 0f8b2df3e1e0..38b8994bc1b2 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/inode.c</a></div><div class='hunk'>@@ -7,9 +7,10 @@</div><div class='ctx'>  */</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/f2fs_fs.h&gt;</div><div class='del'>-#include &lt;linux/buffer_head.h&gt;</div><div class='del'>-#include &lt;linux/backing-dev.h&gt;</div><div class='ctx'> #include &lt;linux/writeback.h&gt;</div><div class='add'>+#include &lt;linux/sched/mm.h&gt;</div><div class='add'>+#include &lt;linux/lz4.h&gt;</div><div class='add'>+#include &lt;linux/zstd.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "f2fs.h"</div><div class='ctx'> #include "node.h"</div><div class='hunk'>@@ -27,9 +28,17 @@ void f2fs_mark_inode_dirty_sync(struct inode *inode, bool sync)</div><div class='ctx'> 	if (is_inode_flag_set(inode, FI_NEW_INODE))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='add'>+	if (f2fs_readonly(F2FS_I_SB(inode)-&gt;sb))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='ctx'> 	if (f2fs_inode_dirtied(inode, sync))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='add'>+	/* only atomic file w/ FI_ATOMIC_COMMITTED can be set vfs dirty */</div><div class='add'>+	if (f2fs_is_atomic_file(inode) &amp;&amp;</div><div class='add'>+			!is_inode_flag_set(inode, FI_ATOMIC_COMMITTED))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='ctx'> 	mark_inode_dirty_sync(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -59,78 +68,63 @@ void f2fs_set_inode_flags(struct inode *inode)</div><div class='ctx'> 			S_ENCRYPTED|S_VERITY|S_CASEFOLD);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void __get_inode_rdev(struct inode *inode, struct f2fs_inode *ri)</div><div class='add'>+static void __get_inode_rdev(struct inode *inode, struct folio *node_folio)</div><div class='ctx'> {</div><div class='del'>-	int extra_size = get_extra_isize(inode);</div><div class='add'>+	__le32 *addr = get_dnode_addr(inode, node_folio);</div><div class='ctx'> </div><div class='ctx'> 	if (S_ISCHR(inode-&gt;i_mode) || S_ISBLK(inode-&gt;i_mode) ||</div><div class='ctx'> 			S_ISFIFO(inode-&gt;i_mode) || S_ISSOCK(inode-&gt;i_mode)) {</div><div class='del'>-		if (ri-&gt;i_addr[extra_size])</div><div class='del'>-			inode-&gt;i_rdev = old_decode_dev(</div><div class='del'>-				le32_to_cpu(ri-&gt;i_addr[extra_size]));</div><div class='add'>+		if (addr[0])</div><div class='add'>+			inode-&gt;i_rdev = old_decode_dev(le32_to_cpu(addr[0]));</div><div class='ctx'> 		else</div><div class='del'>-			inode-&gt;i_rdev = new_decode_dev(</div><div class='del'>-				le32_to_cpu(ri-&gt;i_addr[extra_size + 1]));</div><div class='add'>+			inode-&gt;i_rdev = new_decode_dev(le32_to_cpu(addr[1]));</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __written_first_block(struct f2fs_sb_info *sbi,</div><div class='del'>-					struct f2fs_inode *ri)</div><div class='del'>-{</div><div class='del'>-	block_t addr = le32_to_cpu(ri-&gt;i_addr[offset_in_addr(ri)]);</div><div class='del'>-</div><div class='del'>-	if (!__is_valid_data_blkaddr(addr))</div><div class='del'>-		return 1;</div><div class='del'>-	if (!f2fs_is_valid_blkaddr(sbi, addr, DATA_GENERIC_ENHANCE))</div><div class='del'>-		return -EFSCORRUPTED;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void __set_inode_rdev(struct inode *inode, struct f2fs_inode *ri)</div><div class='add'>+static void __set_inode_rdev(struct inode *inode, struct folio *node_folio)</div><div class='ctx'> {</div><div class='del'>-	int extra_size = get_extra_isize(inode);</div><div class='add'>+	__le32 *addr = get_dnode_addr(inode, node_folio);</div><div class='ctx'> </div><div class='ctx'> 	if (S_ISCHR(inode-&gt;i_mode) || S_ISBLK(inode-&gt;i_mode)) {</div><div class='ctx'> 		if (old_valid_dev(inode-&gt;i_rdev)) {</div><div class='del'>-			ri-&gt;i_addr[extra_size] =</div><div class='del'>-				cpu_to_le32(old_encode_dev(inode-&gt;i_rdev));</div><div class='del'>-			ri-&gt;i_addr[extra_size + 1] = 0;</div><div class='add'>+			addr[0] = cpu_to_le32(old_encode_dev(inode-&gt;i_rdev));</div><div class='add'>+			addr[1] = 0;</div><div class='ctx'> 		} else {</div><div class='del'>-			ri-&gt;i_addr[extra_size] = 0;</div><div class='del'>-			ri-&gt;i_addr[extra_size + 1] =</div><div class='del'>-				cpu_to_le32(new_encode_dev(inode-&gt;i_rdev));</div><div class='del'>-			ri-&gt;i_addr[extra_size + 2] = 0;</div><div class='add'>+			addr[0] = 0;</div><div class='add'>+			addr[1] = cpu_to_le32(new_encode_dev(inode-&gt;i_rdev));</div><div class='add'>+			addr[2] = 0;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void __recover_inline_status(struct inode *inode, struct page *ipage)</div><div class='add'>+static void __recover_inline_status(struct inode *inode, struct folio *ifolio)</div><div class='ctx'> {</div><div class='del'>-	void *inline_data = inline_data_addr(inode, ipage);</div><div class='add'>+	void *inline_data = inline_data_addr(inode, ifolio);</div><div class='ctx'> 	__le32 *start = inline_data;</div><div class='ctx'> 	__le32 *end = start + MAX_INLINE_DATA(inode) / sizeof(__le32);</div><div class='ctx'> </div><div class='ctx'> 	while (start &lt; end) {</div><div class='ctx'> 		if (*start++) {</div><div class='del'>-			f2fs_wait_on_page_writeback(ipage, NODE, true, true);</div><div class='add'>+			f2fs_folio_wait_writeback(ifolio, NODE, true, true);</div><div class='ctx'> </div><div class='ctx'> 			set_inode_flag(inode, FI_DATA_EXIST);</div><div class='del'>-			set_raw_inline(inode, F2FS_INODE(ipage));</div><div class='del'>-			set_page_dirty(ipage);</div><div class='add'>+			set_raw_inline(inode, F2FS_INODE(ifolio));</div><div class='add'>+			folio_mark_dirty(ifolio);</div><div class='ctx'> 			return;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	return;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool f2fs_enable_inode_chksum(struct f2fs_sb_info *sbi, struct page *page)</div><div class='add'>+static</div><div class='add'>+bool f2fs_enable_inode_chksum(struct f2fs_sb_info *sbi, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_inode *ri = &amp;F2FS_NODE(page)-&gt;i;</div><div class='add'>+	struct f2fs_inode *ri = &amp;F2FS_NODE(folio)-&gt;i;</div><div class='ctx'> </div><div class='ctx'> 	if (!f2fs_sb_has_inode_chksum(sbi))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	if (!IS_INODE(page) || !(ri-&gt;i_inline &amp; F2FS_EXTRA_ATTR))</div><div class='add'>+	if (!IS_INODE(folio) || !(ri-&gt;i_inline &amp; F2FS_EXTRA_ATTR))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='ctx'> 	if (!F2FS_FITS_IN_INODE(ri, le16_to_cpu(ri-&gt;i_extra_isize),</div><div class='hunk'>@@ -140,9 +134,9 @@ static bool f2fs_enable_inode_chksum(struct f2fs_sb_info *sbi, struct page *page</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static __u32 f2fs_inode_chksum(struct f2fs_sb_info *sbi, struct page *page)</div><div class='add'>+static __u32 f2fs_inode_chksum(struct f2fs_sb_info *sbi, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_node *node = F2FS_NODE(page);</div><div class='add'>+	struct f2fs_node *node = F2FS_NODE(folio);</div><div class='ctx'> 	struct f2fs_inode *ri = &amp;node-&gt;i;</div><div class='ctx'> 	__le32 ino = node-&gt;footer.ino;</div><div class='ctx'> 	__le32 gen = ri-&gt;i_generation;</div><div class='hunk'>@@ -151,19 +145,18 @@ static __u32 f2fs_inode_chksum(struct f2fs_sb_info *sbi, struct page *page)</div><div class='ctx'> 	unsigned int offset = offsetof(struct f2fs_inode, i_inode_checksum);</div><div class='ctx'> 	unsigned int cs_size = sizeof(dummy_cs);</div><div class='ctx'> </div><div class='del'>-	chksum = f2fs_chksum(sbi, sbi-&gt;s_chksum_seed, (__u8 *)&amp;ino,</div><div class='del'>-							sizeof(ino));</div><div class='del'>-	chksum_seed = f2fs_chksum(sbi, chksum, (__u8 *)&amp;gen, sizeof(gen));</div><div class='add'>+	chksum = f2fs_chksum(sbi-&gt;s_chksum_seed, (__u8 *)&amp;ino, sizeof(ino));</div><div class='add'>+	chksum_seed = f2fs_chksum(chksum, (__u8 *)&amp;gen, sizeof(gen));</div><div class='ctx'> </div><div class='del'>-	chksum = f2fs_chksum(sbi, chksum_seed, (__u8 *)ri, offset);</div><div class='del'>-	chksum = f2fs_chksum(sbi, chksum, (__u8 *)&amp;dummy_cs, cs_size);</div><div class='add'>+	chksum = f2fs_chksum(chksum_seed, (__u8 *)ri, offset);</div><div class='add'>+	chksum = f2fs_chksum(chksum, (__u8 *)&amp;dummy_cs, cs_size);</div><div class='ctx'> 	offset += cs_size;</div><div class='del'>-	chksum = f2fs_chksum(sbi, chksum, (__u8 *)ri + offset,</div><div class='del'>-						F2FS_BLKSIZE - offset);</div><div class='add'>+	chksum = f2fs_chksum(chksum, (__u8 *)ri + offset,</div><div class='add'>+			     F2FS_BLKSIZE - offset);</div><div class='ctx'> 	return chksum;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-bool f2fs_inode_chksum_verify(struct f2fs_sb_info *sbi, struct page *page)</div><div class='add'>+bool f2fs_inode_chksum_verify(struct f2fs_sb_info *sbi, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_inode *ri;</div><div class='ctx'> 	__u32 provided, calculated;</div><div class='hunk'>@@ -172,161 +165,235 @@ bool f2fs_inode_chksum_verify(struct f2fs_sb_info *sbi, struct page *page)</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_F2FS_CHECK_FS</div><div class='del'>-	if (!f2fs_enable_inode_chksum(sbi, page))</div><div class='add'>+	if (!f2fs_enable_inode_chksum(sbi, folio))</div><div class='ctx'> #else</div><div class='del'>-	if (!f2fs_enable_inode_chksum(sbi, page) ||</div><div class='del'>-			PageDirty(page) || PageWriteback(page))</div><div class='add'>+	if (!f2fs_enable_inode_chksum(sbi, folio) ||</div><div class='add'>+			folio_test_dirty(folio) ||</div><div class='add'>+			folio_test_writeback(folio))</div><div class='ctx'> #endif</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='del'>-	ri = &amp;F2FS_NODE(page)-&gt;i;</div><div class='add'>+	ri = &amp;F2FS_NODE(folio)-&gt;i;</div><div class='ctx'> 	provided = le32_to_cpu(ri-&gt;i_inode_checksum);</div><div class='del'>-	calculated = f2fs_inode_chksum(sbi, page);</div><div class='add'>+	calculated = f2fs_inode_chksum(sbi, folio);</div><div class='ctx'> </div><div class='ctx'> 	if (provided != calculated)</div><div class='ctx'> 		f2fs_warn(sbi, "checksum invalid, nid = %lu, ino_of_node = %x, %x vs. %x",</div><div class='del'>-			  page-&gt;index, ino_of_node(page), provided, calculated);</div><div class='add'>+			  folio-&gt;index, ino_of_node(folio),</div><div class='add'>+			  provided, calculated);</div><div class='ctx'> </div><div class='ctx'> 	return provided == calculated;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_inode_chksum_set(struct f2fs_sb_info *sbi, struct page *page)</div><div class='add'>+void f2fs_inode_chksum_set(struct f2fs_sb_info *sbi, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_inode *ri = &amp;F2FS_NODE(page)-&gt;i;</div><div class='add'>+	struct f2fs_inode *ri = &amp;F2FS_NODE(folio)-&gt;i;</div><div class='ctx'> </div><div class='del'>-	if (!f2fs_enable_inode_chksum(sbi, page))</div><div class='add'>+	if (!f2fs_enable_inode_chksum(sbi, folio))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	ri-&gt;i_inode_checksum = cpu_to_le32(f2fs_inode_chksum(sbi, page));</div><div class='add'>+	ri-&gt;i_inode_checksum = cpu_to_le32(f2fs_inode_chksum(sbi, folio));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool sanity_check_compress_inode(struct inode *inode,</div><div class='add'>+			struct f2fs_inode *ri)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='add'>+	unsigned char clevel;</div><div class='add'>+</div><div class='add'>+	if (ri-&gt;i_compress_algorithm &gt;= COMPRESS_MAX) {</div><div class='add'>+		f2fs_warn(sbi,</div><div class='add'>+			"%s: inode (ino=%lx) has unsupported compress algorithm: %u, run fsck to fix",</div><div class='add'>+			__func__, inode-&gt;i_ino, ri-&gt;i_compress_algorithm);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+	if (le64_to_cpu(ri-&gt;i_compr_blocks) &gt;</div><div class='add'>+			SECTOR_TO_BLOCK(inode-&gt;i_blocks)) {</div><div class='add'>+		f2fs_warn(sbi,</div><div class='add'>+			"%s: inode (ino=%lx) has inconsistent i_compr_blocks:%llu, i_blocks:%llu, run fsck to fix",</div><div class='add'>+			__func__, inode-&gt;i_ino, le64_to_cpu(ri-&gt;i_compr_blocks),</div><div class='add'>+			SECTOR_TO_BLOCK(inode-&gt;i_blocks));</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+	if (ri-&gt;i_log_cluster_size &lt; MIN_COMPRESS_LOG_SIZE ||</div><div class='add'>+		ri-&gt;i_log_cluster_size &gt; MAX_COMPRESS_LOG_SIZE) {</div><div class='add'>+		f2fs_warn(sbi,</div><div class='add'>+			"%s: inode (ino=%lx) has unsupported log cluster size: %u, run fsck to fix",</div><div class='add'>+			__func__, inode-&gt;i_ino, ri-&gt;i_log_cluster_size);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	clevel = le16_to_cpu(ri-&gt;i_compress_flag) &gt;&gt;</div><div class='add'>+				COMPRESS_LEVEL_OFFSET;</div><div class='add'>+	switch (ri-&gt;i_compress_algorithm) {</div><div class='add'>+	case COMPRESS_LZO:</div><div class='add'>+#ifdef CONFIG_F2FS_FS_LZO</div><div class='add'>+		if (clevel)</div><div class='add'>+			goto err_level;</div><div class='add'>+#endif</div><div class='add'>+		break;</div><div class='add'>+	case COMPRESS_LZORLE:</div><div class='add'>+#ifdef CONFIG_F2FS_FS_LZORLE</div><div class='add'>+		if (clevel)</div><div class='add'>+			goto err_level;</div><div class='add'>+#endif</div><div class='add'>+		break;</div><div class='add'>+	case COMPRESS_LZ4:</div><div class='add'>+#ifdef CONFIG_F2FS_FS_LZ4</div><div class='add'>+#ifdef CONFIG_F2FS_FS_LZ4HC</div><div class='add'>+		if (clevel &amp;&amp;</div><div class='add'>+		   (clevel &lt; LZ4HC_MIN_CLEVEL || clevel &gt; LZ4HC_MAX_CLEVEL))</div><div class='add'>+			goto err_level;</div><div class='add'>+#else</div><div class='add'>+		if (clevel)</div><div class='add'>+			goto err_level;</div><div class='add'>+#endif</div><div class='add'>+#endif</div><div class='add'>+		break;</div><div class='add'>+	case COMPRESS_ZSTD:</div><div class='add'>+#ifdef CONFIG_F2FS_FS_ZSTD</div><div class='add'>+		if (clevel &lt; zstd_min_clevel() || clevel &gt; zstd_max_clevel())</div><div class='add'>+			goto err_level;</div><div class='add'>+#endif</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		goto err_level;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+err_level:</div><div class='add'>+	f2fs_warn(sbi, "%s: inode (ino=%lx) has unsupported compress level: %u, run fsck to fix",</div><div class='add'>+		  __func__, inode-&gt;i_ino, clevel);</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool sanity_check_inode(struct inode *inode, struct page *node_page)</div><div class='add'>+static bool sanity_check_inode(struct inode *inode, struct folio *node_folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='del'>-	struct f2fs_inode *ri = F2FS_INODE(node_page);</div><div class='add'>+	struct f2fs_inode *ri = F2FS_INODE(node_folio);</div><div class='ctx'> 	unsigned long long iblocks;</div><div class='ctx'> </div><div class='del'>-	iblocks = le64_to_cpu(F2FS_INODE(node_page)-&gt;i_blocks);</div><div class='add'>+	iblocks = le64_to_cpu(F2FS_INODE(node_folio)-&gt;i_blocks);</div><div class='ctx'> 	if (!iblocks) {</div><div class='del'>-		set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='ctx'> 		f2fs_warn(sbi, "%s: corrupted inode i_blocks i_ino=%lx iblocks=%llu, run fsck to fix.",</div><div class='ctx'> 			  __func__, inode-&gt;i_ino, iblocks);</div><div class='ctx'> 		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (ino_of_node(node_page) != nid_of_node(node_page)) {</div><div class='del'>-		set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='add'>+	if (ino_of_node(node_folio) != nid_of_node(node_folio)) {</div><div class='ctx'> 		f2fs_warn(sbi, "%s: corrupted inode footer i_ino=%lx, ino,nid: [%u, %u] run fsck to fix.",</div><div class='ctx'> 			  __func__, inode-&gt;i_ino,</div><div class='del'>-			  ino_of_node(node_page), nid_of_node(node_page));</div><div class='add'>+			  ino_of_node(node_folio), nid_of_node(node_folio));</div><div class='ctx'> 		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (f2fs_sb_has_flexible_inline_xattr(sbi)</div><div class='del'>-			&amp;&amp; !f2fs_has_extra_attr(inode)) {</div><div class='del'>-		set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='del'>-		f2fs_warn(sbi, "%s: corrupted inode ino=%lx, run fsck to fix.",</div><div class='del'>-			  __func__, inode-&gt;i_ino);</div><div class='add'>+	if (ino_of_node(node_folio) == fi-&gt;i_xattr_nid) {</div><div class='add'>+		f2fs_warn(sbi, "%s: corrupted inode i_ino=%lx, xnid=%x, run fsck to fix.",</div><div class='add'>+			  __func__, inode-&gt;i_ino, fi-&gt;i_xattr_nid);</div><div class='ctx'> 		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (f2fs_has_extra_attr(inode) &amp;&amp;</div><div class='del'>-			!f2fs_sb_has_extra_attr(sbi)) {</div><div class='del'>-		set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='del'>-		f2fs_warn(sbi, "%s: inode (ino=%lx) is with extra_attr, but extra_attr feature is off",</div><div class='add'>+	if (S_ISDIR(inode-&gt;i_mode) &amp;&amp; unlikely(inode-&gt;i_nlink == 1)) {</div><div class='add'>+		f2fs_warn(sbi, "%s: directory inode (ino=%lx) has a single i_nlink",</div><div class='ctx'> 			  __func__, inode-&gt;i_ino);</div><div class='ctx'> 		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (fi-&gt;i_extra_isize &gt; F2FS_TOTAL_EXTRA_ATTR_SIZE ||</div><div class='add'>+	if (f2fs_has_extra_attr(inode)) {</div><div class='add'>+		if (!f2fs_sb_has_extra_attr(sbi)) {</div><div class='add'>+			f2fs_warn(sbi, "%s: inode (ino=%lx) is with extra_attr, but extra_attr feature is off",</div><div class='add'>+				  __func__, inode-&gt;i_ino);</div><div class='add'>+			return false;</div><div class='add'>+		}</div><div class='add'>+		if (fi-&gt;i_extra_isize &gt; F2FS_TOTAL_EXTRA_ATTR_SIZE ||</div><div class='add'>+			fi-&gt;i_extra_isize &lt; F2FS_MIN_EXTRA_ATTR_SIZE ||</div><div class='ctx'> 			fi-&gt;i_extra_isize % sizeof(__le32)) {</div><div class='del'>-		set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='del'>-		f2fs_warn(sbi, "%s: inode (ino=%lx) has corrupted i_extra_isize: %d, max: %zu",</div><div class='del'>-			  __func__, inode-&gt;i_ino, fi-&gt;i_extra_isize,</div><div class='del'>-			  F2FS_TOTAL_EXTRA_ATTR_SIZE);</div><div class='del'>-		return false;</div><div class='add'>+			f2fs_warn(sbi, "%s: inode (ino=%lx) has corrupted i_extra_isize: %d, max: %zu",</div><div class='add'>+				  __func__, inode-&gt;i_ino, fi-&gt;i_extra_isize,</div><div class='add'>+				  F2FS_TOTAL_EXTRA_ATTR_SIZE);</div><div class='add'>+			return false;</div><div class='add'>+		}</div><div class='add'>+		if (f2fs_sb_has_compression(sbi) &amp;&amp;</div><div class='add'>+			fi-&gt;i_flags &amp; F2FS_COMPR_FL &amp;&amp;</div><div class='add'>+			F2FS_FITS_IN_INODE(ri, fi-&gt;i_extra_isize,</div><div class='add'>+						i_compress_flag)) {</div><div class='add'>+			if (!sanity_check_compress_inode(inode, ri))</div><div class='add'>+				return false;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (f2fs_has_extra_attr(inode) &amp;&amp;</div><div class='del'>-		f2fs_sb_has_flexible_inline_xattr(sbi) &amp;&amp;</div><div class='add'>+	if (f2fs_sb_has_flexible_inline_xattr(sbi) &amp;&amp;</div><div class='ctx'> 		f2fs_has_inline_xattr(inode) &amp;&amp;</div><div class='del'>-		(!fi-&gt;i_inline_xattr_size ||</div><div class='add'>+		(fi-&gt;i_inline_xattr_size &lt; MIN_INLINE_XATTR_SIZE ||</div><div class='ctx'> 		fi-&gt;i_inline_xattr_size &gt; MAX_INLINE_XATTR_SIZE)) {</div><div class='del'>-		set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='del'>-		f2fs_warn(sbi, "%s: inode (ino=%lx) has corrupted i_inline_xattr_size: %d, max: %zu",</div><div class='add'>+		f2fs_warn(sbi, "%s: inode (ino=%lx) has corrupted i_inline_xattr_size: %d, min: %zu, max: %lu",</div><div class='ctx'> 			  __func__, inode-&gt;i_ino, fi-&gt;i_inline_xattr_size,</div><div class='del'>-			  MAX_INLINE_XATTR_SIZE);</div><div class='add'>+			  MIN_INLINE_XATTR_SIZE, MAX_INLINE_XATTR_SIZE);</div><div class='ctx'> 		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (F2FS_I(inode)-&gt;extent_tree) {</div><div class='del'>-		struct extent_info *ei = &amp;F2FS_I(inode)-&gt;extent_tree-&gt;largest;</div><div class='del'>-</div><div class='del'>-		if (ei-&gt;len &amp;&amp;</div><div class='del'>-			(!f2fs_is_valid_blkaddr(sbi, ei-&gt;blk,</div><div class='del'>-						DATA_GENERIC_ENHANCE) ||</div><div class='del'>-			!f2fs_is_valid_blkaddr(sbi, ei-&gt;blk + ei-&gt;len - 1,</div><div class='del'>-						DATA_GENERIC_ENHANCE))) {</div><div class='del'>-			set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='del'>-			f2fs_warn(sbi, "%s: inode (ino=%lx) extent info [%u, %u, %u] is incorrect, run fsck to fix",</div><div class='del'>-				  __func__, inode-&gt;i_ino,</div><div class='del'>-				  ei-&gt;blk, ei-&gt;fofs, ei-&gt;len);</div><div class='add'>+	if (!f2fs_sb_has_extra_attr(sbi)) {</div><div class='add'>+		if (f2fs_sb_has_project_quota(sbi)) {</div><div class='add'>+			f2fs_warn(sbi, "%s: corrupted inode ino=%lx, wrong feature flag: %u, run fsck to fix.",</div><div class='add'>+				  __func__, inode-&gt;i_ino, F2FS_FEATURE_PRJQUOTA);</div><div class='add'>+			return false;</div><div class='add'>+		}</div><div class='add'>+		if (f2fs_sb_has_inode_chksum(sbi)) {</div><div class='add'>+			f2fs_warn(sbi, "%s: corrupted inode ino=%lx, wrong feature flag: %u, run fsck to fix.",</div><div class='add'>+				  __func__, inode-&gt;i_ino, F2FS_FEATURE_INODE_CHKSUM);</div><div class='add'>+			return false;</div><div class='add'>+		}</div><div class='add'>+		if (f2fs_sb_has_flexible_inline_xattr(sbi)) {</div><div class='add'>+			f2fs_warn(sbi, "%s: corrupted inode ino=%lx, wrong feature flag: %u, run fsck to fix.",</div><div class='add'>+				  __func__, inode-&gt;i_ino, F2FS_FEATURE_FLEXIBLE_INLINE_XATTR);</div><div class='add'>+			return false;</div><div class='add'>+		}</div><div class='add'>+		if (f2fs_sb_has_inode_crtime(sbi)) {</div><div class='add'>+			f2fs_warn(sbi, "%s: corrupted inode ino=%lx, wrong feature flag: %u, run fsck to fix.",</div><div class='add'>+				  __func__, inode-&gt;i_ino, F2FS_FEATURE_INODE_CRTIME);</div><div class='add'>+			return false;</div><div class='add'>+		}</div><div class='add'>+		if (f2fs_sb_has_compression(sbi)) {</div><div class='add'>+			f2fs_warn(sbi, "%s: corrupted inode ino=%lx, wrong feature flag: %u, run fsck to fix.",</div><div class='add'>+				  __func__, inode-&gt;i_ino, F2FS_FEATURE_COMPRESSION);</div><div class='ctx'> 			return false;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (f2fs_has_inline_data(inode) &amp;&amp;</div><div class='del'>-			(!S_ISREG(inode-&gt;i_mode) &amp;&amp; !S_ISLNK(inode-&gt;i_mode))) {</div><div class='del'>-		set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='add'>+	if (f2fs_sanity_check_inline_data(inode, node_folio)) {</div><div class='ctx'> 		f2fs_warn(sbi, "%s: inode (ino=%lx, mode=%u) should not have inline_data, run fsck to fix",</div><div class='ctx'> 			  __func__, inode-&gt;i_ino, inode-&gt;i_mode);</div><div class='ctx'> 		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (f2fs_has_inline_dentry(inode) &amp;&amp; !S_ISDIR(inode-&gt;i_mode)) {</div><div class='del'>-		set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='ctx'> 		f2fs_warn(sbi, "%s: inode (ino=%lx, mode=%u) should not have inline_dentry, run fsck to fix",</div><div class='ctx'> 			  __func__, inode-&gt;i_ino, inode-&gt;i_mode);</div><div class='ctx'> 		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if ((fi-&gt;i_flags &amp; F2FS_CASEFOLD_FL) &amp;&amp; !f2fs_sb_has_casefold(sbi)) {</div><div class='del'>-		set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='ctx'> 		f2fs_warn(sbi, "%s: inode (ino=%lx) has casefold flag, but casefold feature is off",</div><div class='ctx'> 			  __func__, inode-&gt;i_ino);</div><div class='ctx'> 		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (f2fs_has_extra_attr(inode) &amp;&amp; f2fs_sb_has_compression(sbi) &amp;&amp;</div><div class='del'>-			fi-&gt;i_flags &amp; F2FS_COMPR_FL &amp;&amp;</div><div class='del'>-			F2FS_FITS_IN_INODE(ri, fi-&gt;i_extra_isize,</div><div class='del'>-						i_log_cluster_size)) {</div><div class='del'>-		if (ri-&gt;i_compress_algorithm &gt;= COMPRESS_MAX) {</div><div class='del'>-			set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='del'>-			f2fs_warn(sbi, "%s: inode (ino=%lx) has unsupported "</div><div class='del'>-				"compress algorithm: %u, run fsck to fix",</div><div class='del'>-				  __func__, inode-&gt;i_ino,</div><div class='del'>-				  ri-&gt;i_compress_algorithm);</div><div class='del'>-			return false;</div><div class='del'>-		}</div><div class='del'>-		if (le64_to_cpu(ri-&gt;i_compr_blocks) &gt;</div><div class='del'>-				SECTOR_TO_BLOCK(inode-&gt;i_blocks)) {</div><div class='del'>-			set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='del'>-			f2fs_warn(sbi, "%s: inode (ino=%lx) has inconsistent "</div><div class='del'>-				"i_compr_blocks:%llu, i_blocks:%llu, run fsck to fix",</div><div class='del'>-				  __func__, inode-&gt;i_ino,</div><div class='del'>-				  le64_to_cpu(ri-&gt;i_compr_blocks),</div><div class='del'>-				  SECTOR_TO_BLOCK(inode-&gt;i_blocks));</div><div class='add'>+	if (fi-&gt;i_xattr_nid &amp;&amp; f2fs_check_nid_range(sbi, fi-&gt;i_xattr_nid)) {</div><div class='add'>+		f2fs_warn(sbi, "%s: inode (ino=%lx) has corrupted i_xattr_nid: %u, run fsck to fix.",</div><div class='add'>+			  __func__, inode-&gt;i_ino, fi-&gt;i_xattr_nid);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (IS_DEVICE_ALIASING(inode)) {</div><div class='add'>+		if (!f2fs_sb_has_device_alias(sbi)) {</div><div class='add'>+			f2fs_warn(sbi, "%s: inode (ino=%lx) has device alias flag, but the feature is off",</div><div class='add'>+				  __func__, inode-&gt;i_ino);</div><div class='ctx'> 			return false;</div><div class='ctx'> 		}</div><div class='del'>-		if (ri-&gt;i_log_cluster_size &lt; MIN_COMPRESS_LOG_SIZE ||</div><div class='del'>-			ri-&gt;i_log_cluster_size &gt; MAX_COMPRESS_LOG_SIZE) {</div><div class='del'>-			set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='del'>-			f2fs_warn(sbi, "%s: inode (ino=%lx) has unsupported "</div><div class='del'>-				"log cluster size: %u, run fsck to fix",</div><div class='del'>-				  __func__, inode-&gt;i_ino,</div><div class='del'>-				  ri-&gt;i_log_cluster_size);</div><div class='add'>+		if (!f2fs_is_pinned_file(inode)) {</div><div class='add'>+			f2fs_warn(sbi, "%s: inode (ino=%lx) has device alias flag, but is not pinned",</div><div class='add'>+				  __func__, inode-&gt;i_ino);</div><div class='ctx'> 			return false;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -334,24 +401,32 @@ static bool sanity_check_inode(struct inode *inode, struct page *node_page)</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void init_idisk_time(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='add'>+</div><div class='add'>+	fi-&gt;i_disk_time[0] = inode_get_atime(inode);</div><div class='add'>+	fi-&gt;i_disk_time[1] = inode_get_ctime(inode);</div><div class='add'>+	fi-&gt;i_disk_time[2] = inode_get_mtime(inode);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int do_read_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='del'>-	struct page *node_page;</div><div class='add'>+	struct folio *node_folio;</div><div class='ctx'> 	struct f2fs_inode *ri;</div><div class='ctx'> 	projid_t i_projid;</div><div class='del'>-	int err;</div><div class='ctx'> </div><div class='ctx'> 	/* Check if ino is within scope */</div><div class='ctx'> 	if (f2fs_check_nid_range(sbi, inode-&gt;i_ino))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	node_page = f2fs_get_node_page(sbi, inode-&gt;i_ino);</div><div class='del'>-	if (IS_ERR(node_page))</div><div class='del'>-		return PTR_ERR(node_page);</div><div class='add'>+	node_folio = f2fs_get_inode_folio(sbi, inode-&gt;i_ino);</div><div class='add'>+	if (IS_ERR(node_folio))</div><div class='add'>+		return PTR_ERR(node_folio);</div><div class='ctx'> </div><div class='del'>-	ri = F2FS_INODE(node_page);</div><div class='add'>+	ri = F2FS_INODE(node_folio);</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_mode = le16_to_cpu(ri-&gt;i_mode);</div><div class='ctx'> 	i_uid_write(inode, le32_to_cpu(ri-&gt;i_uid));</div><div class='hunk'>@@ -360,18 +435,17 @@ static int do_read_inode(struct inode *inode)</div><div class='ctx'> 	inode-&gt;i_size = le64_to_cpu(ri-&gt;i_size);</div><div class='ctx'> 	inode-&gt;i_blocks = SECTOR_FROM_BLOCK(le64_to_cpu(ri-&gt;i_blocks) - 1);</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_atime.tv_sec = le64_to_cpu(ri-&gt;i_atime);</div><div class='del'>-	inode-&gt;i_ctime.tv_sec = le64_to_cpu(ri-&gt;i_ctime);</div><div class='del'>-	inode-&gt;i_mtime.tv_sec = le64_to_cpu(ri-&gt;i_mtime);</div><div class='del'>-	inode-&gt;i_atime.tv_nsec = le32_to_cpu(ri-&gt;i_atime_nsec);</div><div class='del'>-	inode-&gt;i_ctime.tv_nsec = le32_to_cpu(ri-&gt;i_ctime_nsec);</div><div class='del'>-	inode-&gt;i_mtime.tv_nsec = le32_to_cpu(ri-&gt;i_mtime_nsec);</div><div class='add'>+	inode_set_atime(inode, le64_to_cpu(ri-&gt;i_atime),</div><div class='add'>+			le32_to_cpu(ri-&gt;i_atime_nsec));</div><div class='add'>+	inode_set_ctime(inode, le64_to_cpu(ri-&gt;i_ctime),</div><div class='add'>+			le32_to_cpu(ri-&gt;i_ctime_nsec));</div><div class='add'>+	inode_set_mtime(inode, le64_to_cpu(ri-&gt;i_mtime),</div><div class='add'>+			le32_to_cpu(ri-&gt;i_mtime_nsec));</div><div class='ctx'> 	inode-&gt;i_generation = le32_to_cpu(ri-&gt;i_generation);</div><div class='ctx'> 	if (S_ISDIR(inode-&gt;i_mode))</div><div class='ctx'> 		fi-&gt;i_current_depth = le32_to_cpu(ri-&gt;i_current_depth);</div><div class='ctx'> 	else if (S_ISREG(inode-&gt;i_mode))</div><div class='del'>-		fi-&gt;i_gc_failures[GC_FAILURE_PIN] =</div><div class='del'>-					le16_to_cpu(ri-&gt;i_gc_failures);</div><div class='add'>+		fi-&gt;i_gc_failures = le16_to_cpu(ri-&gt;i_gc_failures);</div><div class='ctx'> 	fi-&gt;i_xattr_nid = le32_to_cpu(ri-&gt;i_xattr_nid);</div><div class='ctx'> 	fi-&gt;i_flags = le32_to_cpu(ri-&gt;i_flags);</div><div class='ctx'> 	if (S_ISREG(inode-&gt;i_mode))</div><div class='hunk'>@@ -381,8 +455,6 @@ static int do_read_inode(struct inode *inode)</div><div class='ctx'> 	fi-&gt;i_pino = le32_to_cpu(ri-&gt;i_pino);</div><div class='ctx'> 	fi-&gt;i_dir_level = ri-&gt;i_dir_level;</div><div class='ctx'> </div><div class='del'>-	f2fs_init_extent_tree(inode, node_page);</div><div class='del'>-</div><div class='ctx'> 	get_inline_info(inode, ri);</div><div class='ctx'> </div><div class='ctx'> 	fi-&gt;i_extra_isize = f2fs_has_extra_attr(inode) ?</div><div class='hunk'>@@ -404,34 +476,26 @@ static int do_read_inode(struct inode *inode)</div><div class='ctx'> 		fi-&gt;i_inline_xattr_size = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!sanity_check_inode(inode, node_page)) {</div><div class='del'>-		f2fs_put_page(node_page, 1);</div><div class='add'>+	if (!sanity_check_inode(inode, node_folio)) {</div><div class='add'>+		f2fs_folio_put(node_folio, true);</div><div class='add'>+		set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='add'>+		f2fs_handle_error(sbi, ERROR_CORRUPTED_INODE);</div><div class='ctx'> 		return -EFSCORRUPTED;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* check data exist */</div><div class='ctx'> 	if (f2fs_has_inline_data(inode) &amp;&amp; !f2fs_exist_data(inode))</div><div class='del'>-		__recover_inline_status(inode, node_page);</div><div class='add'>+		__recover_inline_status(inode, node_folio);</div><div class='ctx'> </div><div class='ctx'> 	/* try to recover cold bit for non-dir inode */</div><div class='del'>-	if (!S_ISDIR(inode-&gt;i_mode) &amp;&amp; !is_cold_node(node_page)) {</div><div class='del'>-		f2fs_wait_on_page_writeback(node_page, NODE, true, true);</div><div class='del'>-		set_cold_node(node_page, false);</div><div class='del'>-		set_page_dirty(node_page);</div><div class='add'>+	if (!S_ISDIR(inode-&gt;i_mode) &amp;&amp; !is_cold_node(node_folio)) {</div><div class='add'>+		f2fs_folio_wait_writeback(node_folio, NODE, true, true);</div><div class='add'>+		set_cold_node(node_folio, false);</div><div class='add'>+		folio_mark_dirty(node_folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* get rdev by using inline_info */</div><div class='del'>-	__get_inode_rdev(inode, ri);</div><div class='del'>-</div><div class='del'>-	if (S_ISREG(inode-&gt;i_mode)) {</div><div class='del'>-		err = __written_first_block(sbi, ri);</div><div class='del'>-		if (err &lt; 0) {</div><div class='del'>-			f2fs_put_page(node_page, 1);</div><div class='del'>-			return err;</div><div class='del'>-		}</div><div class='del'>-		if (!err)</div><div class='del'>-			set_inode_flag(inode, FI_FIRST_BLOCK_WRITTEN);</div><div class='del'>-	}</div><div class='add'>+	__get_inode_rdev(inode, node_folio);</div><div class='ctx'> </div><div class='ctx'> 	if (!f2fs_need_inode_block_update(sbi, inode-&gt;i_ino))</div><div class='ctx'> 		fi-&gt;last_disk_size = inode-&gt;i_size;</div><div class='hunk'>@@ -455,22 +519,36 @@ static int do_read_inode(struct inode *inode)</div><div class='ctx'> 	if (f2fs_has_extra_attr(inode) &amp;&amp; f2fs_sb_has_compression(sbi) &amp;&amp;</div><div class='ctx'> 					(fi-&gt;i_flags &amp; F2FS_COMPR_FL)) {</div><div class='ctx'> 		if (F2FS_FITS_IN_INODE(ri, fi-&gt;i_extra_isize,</div><div class='del'>-					i_log_cluster_size)) {</div><div class='add'>+					i_compress_flag)) {</div><div class='add'>+			unsigned short compress_flag;</div><div class='add'>+</div><div class='ctx'> 			atomic_set(&amp;fi-&gt;i_compr_blocks,</div><div class='ctx'> 					le64_to_cpu(ri-&gt;i_compr_blocks));</div><div class='ctx'> 			fi-&gt;i_compress_algorithm = ri-&gt;i_compress_algorithm;</div><div class='ctx'> 			fi-&gt;i_log_cluster_size = ri-&gt;i_log_cluster_size;</div><div class='del'>-			fi-&gt;i_compress_flag = le16_to_cpu(ri-&gt;i_compress_flag);</div><div class='del'>-			fi-&gt;i_cluster_size = 1 &lt;&lt; fi-&gt;i_log_cluster_size;</div><div class='add'>+			compress_flag = le16_to_cpu(ri-&gt;i_compress_flag);</div><div class='add'>+			fi-&gt;i_compress_level = compress_flag &gt;&gt;</div><div class='add'>+						COMPRESS_LEVEL_OFFSET;</div><div class='add'>+			fi-&gt;i_compress_flag = compress_flag &amp;</div><div class='add'>+					GENMASK(COMPRESS_LEVEL_OFFSET - 1, 0);</div><div class='add'>+			fi-&gt;i_cluster_size = BIT(fi-&gt;i_log_cluster_size);</div><div class='ctx'> 			set_inode_flag(inode, FI_COMPRESSED_FILE);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	F2FS_I(inode)-&gt;i_disk_time[0] = inode-&gt;i_atime;</div><div class='del'>-	F2FS_I(inode)-&gt;i_disk_time[1] = inode-&gt;i_ctime;</div><div class='del'>-	F2FS_I(inode)-&gt;i_disk_time[2] = inode-&gt;i_mtime;</div><div class='del'>-	F2FS_I(inode)-&gt;i_disk_time[3] = F2FS_I(inode)-&gt;i_crtime;</div><div class='del'>-	f2fs_put_page(node_page, 1);</div><div class='add'>+	init_idisk_time(inode);</div><div class='add'>+</div><div class='add'>+	if (!sanity_check_extent_cache(inode, node_folio)) {</div><div class='add'>+		f2fs_folio_put(node_folio, true);</div><div class='add'>+		f2fs_handle_error(sbi, ERROR_CORRUPTED_INODE);</div><div class='add'>+		return -EFSCORRUPTED;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Need all the flag bits */</div><div class='add'>+	f2fs_init_read_extent_tree(inode, node_folio);</div><div class='add'>+	f2fs_init_age_extent_tree(inode);</div><div class='add'>+</div><div class='add'>+	f2fs_folio_put(node_folio, true);</div><div class='ctx'> </div><div class='ctx'> 	stat_inc_inline_xattr(inode);</div><div class='ctx'> 	stat_inc_inline_inode(inode);</div><div class='hunk'>@@ -481,6 +559,12 @@ static int do_read_inode(struct inode *inode)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool is_meta_ino(struct f2fs_sb_info *sbi, unsigned int ino)</div><div class='add'>+{</div><div class='add'>+	return ino == F2FS_NODE_INO(sbi) || ino == F2FS_META_INO(sbi) ||</div><div class='add'>+		ino == F2FS_COMPRESS_INO(sbi);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> struct inode *f2fs_iget(struct super_block *sb, unsigned long ino)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_SB(sb);</div><div class='hunk'>@@ -491,17 +575,23 @@ struct inode *f2fs_iget(struct super_block *sb, unsigned long ino)</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='del'>-	if (!(inode-&gt;i_state &amp; I_NEW)) {</div><div class='add'>+	if (!(inode_state_read_once(inode) &amp; I_NEW)) {</div><div class='add'>+		if (is_meta_ino(sbi, ino)) {</div><div class='add'>+			f2fs_err(sbi, "inaccessible inode: %lu, run fsck to repair", ino);</div><div class='add'>+			set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='add'>+			ret = -EFSCORRUPTED;</div><div class='add'>+			trace_f2fs_iget_exit(inode, ret);</div><div class='add'>+			iput(inode);</div><div class='add'>+			f2fs_handle_error(sbi, ERROR_CORRUPTED_INODE);</div><div class='add'>+			return ERR_PTR(ret);</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		trace_f2fs_iget(inode);</div><div class='ctx'> 		return inode;</div><div class='ctx'> 	}</div><div class='del'>-	if (ino == F2FS_NODE_INO(sbi) || ino == F2FS_META_INO(sbi))</div><div class='del'>-		goto make_now;</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='del'>-	if (ino == F2FS_COMPRESS_INO(sbi))</div><div class='add'>+	if (is_meta_ino(sbi, ino))</div><div class='ctx'> 		goto make_now;</div><div class='del'>-#endif</div><div class='ctx'> </div><div class='ctx'> 	ret = do_read_inode(inode);</div><div class='ctx'> 	if (ret)</div><div class='hunk'>@@ -516,6 +606,11 @@ make_now:</div><div class='ctx'> 	} else if (ino == F2FS_COMPRESS_INO(sbi)) {</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='ctx'> 		inode-&gt;i_mapping-&gt;a_ops = &amp;f2fs_compress_aops;</div><div class='add'>+		/*</div><div class='add'>+		 * generic_error_remove_folio only truncates pages of regular</div><div class='add'>+		 * inode</div><div class='add'>+		 */</div><div class='add'>+		inode-&gt;i_mode |= S_IFREG;</div><div class='ctx'> #endif</div><div class='ctx'> 		mapping_set_gfp_mask(inode-&gt;i_mapping,</div><div class='ctx'> 			GFP_NOFS | __GFP_HIGHMEM | __GFP_MOVABLE);</div><div class='hunk'>@@ -544,6 +639,7 @@ make_now:</div><div class='ctx'> 		goto bad_inode;</div><div class='ctx'> 	}</div><div class='ctx'> 	f2fs_set_inode_flags(inode);</div><div class='add'>+</div><div class='ctx'> 	unlock_new_inode(inode);</div><div class='ctx'> 	trace_f2fs_iget(inode);</div><div class='ctx'> 	return inode;</div><div class='hunk'>@@ -562,136 +658,136 @@ retry:</div><div class='ctx'> 	inode = f2fs_iget(sb, ino);</div><div class='ctx'> 	if (IS_ERR(inode)) {</div><div class='ctx'> 		if (PTR_ERR(inode) == -ENOMEM) {</div><div class='del'>-			congestion_wait(BLK_RW_ASYNC, DEFAULT_IO_TIMEOUT);</div><div class='add'>+			memalloc_retry_wait(GFP_NOFS);</div><div class='ctx'> 			goto retry;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	return inode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_update_inode(struct inode *inode, struct page *node_page)</div><div class='add'>+void f2fs_update_inode(struct inode *inode, struct folio *node_folio)</div><div class='ctx'> {</div><div class='add'>+	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='ctx'> 	struct f2fs_inode *ri;</div><div class='del'>-	struct extent_tree *et = F2FS_I(inode)-&gt;extent_tree;</div><div class='add'>+	struct extent_tree *et = fi-&gt;extent_tree[EX_READ];</div><div class='ctx'> </div><div class='del'>-	f2fs_wait_on_page_writeback(node_page, NODE, true, true);</div><div class='del'>-	set_page_dirty(node_page);</div><div class='add'>+	f2fs_folio_wait_writeback(node_folio, NODE, true, true);</div><div class='add'>+	folio_mark_dirty(node_folio);</div><div class='ctx'> </div><div class='ctx'> 	f2fs_inode_synced(inode);</div><div class='ctx'> </div><div class='del'>-	ri = F2FS_INODE(node_page);</div><div class='add'>+	ri = F2FS_INODE(node_folio);</div><div class='ctx'> </div><div class='ctx'> 	ri-&gt;i_mode = cpu_to_le16(inode-&gt;i_mode);</div><div class='del'>-	ri-&gt;i_advise = F2FS_I(inode)-&gt;i_advise;</div><div class='add'>+	ri-&gt;i_advise = fi-&gt;i_advise;</div><div class='ctx'> 	ri-&gt;i_uid = cpu_to_le32(i_uid_read(inode));</div><div class='ctx'> 	ri-&gt;i_gid = cpu_to_le32(i_gid_read(inode));</div><div class='ctx'> 	ri-&gt;i_links = cpu_to_le32(inode-&gt;i_nlink);</div><div class='del'>-	ri-&gt;i_size = cpu_to_le64(i_size_read(inode));</div><div class='ctx'> 	ri-&gt;i_blocks = cpu_to_le64(SECTOR_TO_BLOCK(inode-&gt;i_blocks) + 1);</div><div class='ctx'> </div><div class='add'>+	if (!f2fs_is_atomic_file(inode) ||</div><div class='add'>+			is_inode_flag_set(inode, FI_ATOMIC_COMMITTED))</div><div class='add'>+		ri-&gt;i_size = cpu_to_le64(i_size_read(inode));</div><div class='add'>+</div><div class='ctx'> 	if (et) {</div><div class='ctx'> 		read_lock(&amp;et-&gt;lock);</div><div class='del'>-		set_raw_extent(&amp;et-&gt;largest, &amp;ri-&gt;i_ext);</div><div class='add'>+		set_raw_read_extent(&amp;et-&gt;largest, &amp;ri-&gt;i_ext);</div><div class='ctx'> 		read_unlock(&amp;et-&gt;lock);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		memset(&amp;ri-&gt;i_ext, 0, sizeof(ri-&gt;i_ext));</div><div class='ctx'> 	}</div><div class='ctx'> 	set_raw_inline(inode, ri);</div><div class='ctx'> </div><div class='del'>-	ri-&gt;i_atime = cpu_to_le64(inode-&gt;i_atime.tv_sec);</div><div class='del'>-	ri-&gt;i_ctime = cpu_to_le64(inode-&gt;i_ctime.tv_sec);</div><div class='del'>-	ri-&gt;i_mtime = cpu_to_le64(inode-&gt;i_mtime.tv_sec);</div><div class='del'>-	ri-&gt;i_atime_nsec = cpu_to_le32(inode-&gt;i_atime.tv_nsec);</div><div class='del'>-	ri-&gt;i_ctime_nsec = cpu_to_le32(inode-&gt;i_ctime.tv_nsec);</div><div class='del'>-	ri-&gt;i_mtime_nsec = cpu_to_le32(inode-&gt;i_mtime.tv_nsec);</div><div class='add'>+	ri-&gt;i_atime = cpu_to_le64(inode_get_atime_sec(inode));</div><div class='add'>+	ri-&gt;i_ctime = cpu_to_le64(inode_get_ctime_sec(inode));</div><div class='add'>+	ri-&gt;i_mtime = cpu_to_le64(inode_get_mtime_sec(inode));</div><div class='add'>+	ri-&gt;i_atime_nsec = cpu_to_le32(inode_get_atime_nsec(inode));</div><div class='add'>+	ri-&gt;i_ctime_nsec = cpu_to_le32(inode_get_ctime_nsec(inode));</div><div class='add'>+	ri-&gt;i_mtime_nsec = cpu_to_le32(inode_get_mtime_nsec(inode));</div><div class='ctx'> 	if (S_ISDIR(inode-&gt;i_mode))</div><div class='del'>-		ri-&gt;i_current_depth =</div><div class='del'>-			cpu_to_le32(F2FS_I(inode)-&gt;i_current_depth);</div><div class='add'>+		ri-&gt;i_current_depth = cpu_to_le32(fi-&gt;i_current_depth);</div><div class='ctx'> 	else if (S_ISREG(inode-&gt;i_mode))</div><div class='del'>-		ri-&gt;i_gc_failures =</div><div class='del'>-			cpu_to_le16(F2FS_I(inode)-&gt;i_gc_failures[GC_FAILURE_PIN]);</div><div class='del'>-	ri-&gt;i_xattr_nid = cpu_to_le32(F2FS_I(inode)-&gt;i_xattr_nid);</div><div class='del'>-	ri-&gt;i_flags = cpu_to_le32(F2FS_I(inode)-&gt;i_flags);</div><div class='del'>-	ri-&gt;i_pino = cpu_to_le32(F2FS_I(inode)-&gt;i_pino);</div><div class='add'>+		ri-&gt;i_gc_failures = cpu_to_le16(fi-&gt;i_gc_failures);</div><div class='add'>+	ri-&gt;i_xattr_nid = cpu_to_le32(fi-&gt;i_xattr_nid);</div><div class='add'>+	ri-&gt;i_flags = cpu_to_le32(fi-&gt;i_flags);</div><div class='add'>+	ri-&gt;i_pino = cpu_to_le32(fi-&gt;i_pino);</div><div class='ctx'> 	ri-&gt;i_generation = cpu_to_le32(inode-&gt;i_generation);</div><div class='del'>-	ri-&gt;i_dir_level = F2FS_I(inode)-&gt;i_dir_level;</div><div class='add'>+	ri-&gt;i_dir_level = fi-&gt;i_dir_level;</div><div class='ctx'> </div><div class='ctx'> 	if (f2fs_has_extra_attr(inode)) {</div><div class='del'>-		ri-&gt;i_extra_isize = cpu_to_le16(F2FS_I(inode)-&gt;i_extra_isize);</div><div class='add'>+		ri-&gt;i_extra_isize = cpu_to_le16(fi-&gt;i_extra_isize);</div><div class='ctx'> </div><div class='ctx'> 		if (f2fs_sb_has_flexible_inline_xattr(F2FS_I_SB(inode)))</div><div class='ctx'> 			ri-&gt;i_inline_xattr_size =</div><div class='del'>-				cpu_to_le16(F2FS_I(inode)-&gt;i_inline_xattr_size);</div><div class='add'>+				cpu_to_le16(fi-&gt;i_inline_xattr_size);</div><div class='ctx'> </div><div class='ctx'> 		if (f2fs_sb_has_project_quota(F2FS_I_SB(inode)) &amp;&amp;</div><div class='del'>-			F2FS_FITS_IN_INODE(ri, F2FS_I(inode)-&gt;i_extra_isize,</div><div class='del'>-								i_projid)) {</div><div class='add'>+			F2FS_FITS_IN_INODE(ri, fi-&gt;i_extra_isize, i_projid)) {</div><div class='ctx'> 			projid_t i_projid;</div><div class='ctx'> </div><div class='del'>-			i_projid = from_kprojid(&amp;init_user_ns,</div><div class='del'>-						F2FS_I(inode)-&gt;i_projid);</div><div class='add'>+			i_projid = from_kprojid(&amp;init_user_ns, fi-&gt;i_projid);</div><div class='ctx'> 			ri-&gt;i_projid = cpu_to_le32(i_projid);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (f2fs_sb_has_inode_crtime(F2FS_I_SB(inode)) &amp;&amp;</div><div class='del'>-			F2FS_FITS_IN_INODE(ri, F2FS_I(inode)-&gt;i_extra_isize,</div><div class='del'>-								i_crtime)) {</div><div class='del'>-			ri-&gt;i_crtime =</div><div class='del'>-				cpu_to_le64(F2FS_I(inode)-&gt;i_crtime.tv_sec);</div><div class='del'>-			ri-&gt;i_crtime_nsec =</div><div class='del'>-				cpu_to_le32(F2FS_I(inode)-&gt;i_crtime.tv_nsec);</div><div class='add'>+			F2FS_FITS_IN_INODE(ri, fi-&gt;i_extra_isize, i_crtime)) {</div><div class='add'>+			ri-&gt;i_crtime = cpu_to_le64(fi-&gt;i_crtime.tv_sec);</div><div class='add'>+			ri-&gt;i_crtime_nsec = cpu_to_le32(fi-&gt;i_crtime.tv_nsec);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (f2fs_sb_has_compression(F2FS_I_SB(inode)) &amp;&amp;</div><div class='del'>-			F2FS_FITS_IN_INODE(ri, F2FS_I(inode)-&gt;i_extra_isize,</div><div class='del'>-							i_log_cluster_size)) {</div><div class='del'>-			ri-&gt;i_compr_blocks =</div><div class='del'>-				cpu_to_le64(atomic_read(</div><div class='del'>-					&amp;F2FS_I(inode)-&gt;i_compr_blocks));</div><div class='del'>-			ri-&gt;i_compress_algorithm =</div><div class='del'>-				F2FS_I(inode)-&gt;i_compress_algorithm;</div><div class='del'>-			ri-&gt;i_compress_flag =</div><div class='del'>-				cpu_to_le16(F2FS_I(inode)-&gt;i_compress_flag);</div><div class='del'>-			ri-&gt;i_log_cluster_size =</div><div class='del'>-				F2FS_I(inode)-&gt;i_log_cluster_size;</div><div class='add'>+			F2FS_FITS_IN_INODE(ri, fi-&gt;i_extra_isize,</div><div class='add'>+							i_compress_flag)) {</div><div class='add'>+			unsigned short compress_flag;</div><div class='add'>+</div><div class='add'>+			ri-&gt;i_compr_blocks = cpu_to_le64(</div><div class='add'>+					atomic_read(&amp;fi-&gt;i_compr_blocks));</div><div class='add'>+			ri-&gt;i_compress_algorithm = fi-&gt;i_compress_algorithm;</div><div class='add'>+			compress_flag = fi-&gt;i_compress_flag |</div><div class='add'>+						fi-&gt;i_compress_level &lt;&lt;</div><div class='add'>+						COMPRESS_LEVEL_OFFSET;</div><div class='add'>+			ri-&gt;i_compress_flag = cpu_to_le16(compress_flag);</div><div class='add'>+			ri-&gt;i_log_cluster_size = fi-&gt;i_log_cluster_size;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	__set_inode_rdev(inode, ri);</div><div class='add'>+	__set_inode_rdev(inode, node_folio);</div><div class='ctx'> </div><div class='ctx'> 	/* deleted inode */</div><div class='ctx'> 	if (inode-&gt;i_nlink == 0)</div><div class='del'>-		clear_page_private_inline(node_page);</div><div class='del'>-</div><div class='del'>-	F2FS_I(inode)-&gt;i_disk_time[0] = inode-&gt;i_atime;</div><div class='del'>-	F2FS_I(inode)-&gt;i_disk_time[1] = inode-&gt;i_ctime;</div><div class='del'>-	F2FS_I(inode)-&gt;i_disk_time[2] = inode-&gt;i_mtime;</div><div class='del'>-	F2FS_I(inode)-&gt;i_disk_time[3] = F2FS_I(inode)-&gt;i_crtime;</div><div class='add'>+		folio_clear_f2fs_inline(node_folio);</div><div class='ctx'> </div><div class='add'>+	init_idisk_time(inode);</div><div class='ctx'> #ifdef CONFIG_F2FS_CHECK_FS</div><div class='del'>-	f2fs_inode_chksum_set(F2FS_I_SB(inode), node_page);</div><div class='add'>+	f2fs_inode_chksum_set(F2FS_I_SB(inode), node_folio);</div><div class='ctx'> #endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_update_inode_page(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='del'>-	struct page *node_page;</div><div class='add'>+	struct folio *node_folio;</div><div class='add'>+	int count = 0;</div><div class='ctx'> retry:</div><div class='del'>-	node_page = f2fs_get_node_page(sbi, inode-&gt;i_ino);</div><div class='del'>-	if (IS_ERR(node_page)) {</div><div class='del'>-		int err = PTR_ERR(node_page);</div><div class='add'>+	node_folio = f2fs_get_inode_folio(sbi, inode-&gt;i_ino);</div><div class='add'>+	if (IS_ERR(node_folio)) {</div><div class='add'>+		int err = PTR_ERR(node_folio);</div><div class='add'>+</div><div class='add'>+		/* The node block was truncated. */</div><div class='add'>+		if (err == -ENOENT)</div><div class='add'>+			return;</div><div class='add'>+</div><div class='add'>+		if (err == -EFSCORRUPTED)</div><div class='add'>+			goto stop_checkpoint;</div><div class='ctx'> </div><div class='del'>-		if (err == -ENOMEM) {</div><div class='del'>-			cond_resched();</div><div class='add'>+		if (err == -ENOMEM || ++count &lt;= DEFAULT_RETRY_IO_COUNT)</div><div class='ctx'> 			goto retry;</div><div class='del'>-		} else if (err != -ENOENT) {</div><div class='del'>-			f2fs_stop_checkpoint(sbi, false);</div><div class='del'>-		}</div><div class='add'>+stop_checkpoint:</div><div class='add'>+		f2fs_stop_checkpoint(sbi, false, STOP_CP_REASON_UPDATE_INODE);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='del'>-	f2fs_update_inode(inode, node_page);</div><div class='del'>-	f2fs_put_page(node_page, 1);</div><div class='add'>+	f2fs_update_inode(inode, node_folio);</div><div class='add'>+	f2fs_folio_put(node_folio, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int f2fs_write_inode(struct inode *inode, struct writeback_control *wbc)</div><div class='hunk'>@@ -709,8 +805,17 @@ int f2fs_write_inode(struct inode *inode, struct writeback_control *wbc)</div><div class='ctx'> 		!is_inode_flag_set(inode, FI_DIRTY_INODE))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	if (!f2fs_is_checkpoint_ready(sbi))</div><div class='add'>+	/*</div><div class='add'>+	 * no need to update inode page, ultimately f2fs_evict_inode() will</div><div class='add'>+	 * clear dirty status of inode.</div><div class='add'>+	 */</div><div class='add'>+	if (f2fs_cp_error(sbi))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	if (!f2fs_is_checkpoint_ready(sbi)) {</div><div class='add'>+		f2fs_mark_inode_dirty_sync(inode, true);</div><div class='ctx'> 		return -ENOSPC;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We need to balance fs here to prevent from producing dirty node pages</div><div class='hunk'>@@ -722,23 +827,44 @@ int f2fs_write_inode(struct inode *inode, struct writeback_control *wbc)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void f2fs_remove_donate_inode(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='add'>+</div><div class='add'>+	if (list_empty(&amp;F2FS_I(inode)-&gt;gdonate_list))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;sbi-&gt;inode_lock[DONATE_INODE]);</div><div class='add'>+	list_del_init(&amp;F2FS_I(inode)-&gt;gdonate_list);</div><div class='add'>+	sbi-&gt;donate_files--;</div><div class='add'>+	spin_unlock(&amp;sbi-&gt;inode_lock[DONATE_INODE]);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Called at the last iput() if i_nlink is zero</div><div class='ctx'>  */</div><div class='ctx'> void f2fs_evict_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='del'>-	nid_t xnid = F2FS_I(inode)-&gt;i_xattr_nid;</div><div class='add'>+	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='add'>+	nid_t xnid = fi-&gt;i_xattr_nid;</div><div class='ctx'> 	int err = 0;</div><div class='add'>+	bool freeze_protected = false;</div><div class='ctx'> </div><div class='del'>-	/* some remained atomic pages should discarded */</div><div class='del'>-	if (f2fs_is_atomic_file(inode))</div><div class='del'>-		f2fs_drop_inmem_pages(inode);</div><div class='add'>+	f2fs_abort_atomic_write(inode, true);</div><div class='add'>+</div><div class='add'>+	if (fi-&gt;cow_inode &amp;&amp; f2fs_is_cow_file(fi-&gt;cow_inode)) {</div><div class='add'>+		clear_inode_flag(fi-&gt;cow_inode, FI_COW_FILE);</div><div class='add'>+		F2FS_I(fi-&gt;cow_inode)-&gt;atomic_inode = NULL;</div><div class='add'>+		iput(fi-&gt;cow_inode);</div><div class='add'>+		fi-&gt;cow_inode = NULL;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	trace_f2fs_evict_inode(inode);</div><div class='ctx'> 	truncate_inode_pages_final(&amp;inode-&gt;i_data);</div><div class='ctx'> </div><div class='del'>-	if (test_opt(sbi, COMPRESS_CACHE) &amp;&amp; f2fs_compressed_file(inode))</div><div class='add'>+	if ((inode-&gt;i_nlink || is_bad_inode(inode)) &amp;&amp;</div><div class='add'>+		test_opt(sbi, COMPRESS_CACHE) &amp;&amp; f2fs_compressed_file(inode))</div><div class='ctx'> 		f2fs_invalidate_compress_pages(sbi, inode-&gt;i_ino);</div><div class='ctx'> </div><div class='ctx'> 	if (inode-&gt;i_ino == F2FS_NODE_INO(sbi) ||</div><div class='hunk'>@@ -748,8 +874,10 @@ void f2fs_evict_inode(struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> 	f2fs_bug_on(sbi, get_dirty_pages(inode));</div><div class='ctx'> 	f2fs_remove_dirty_inode(inode);</div><div class='add'>+	f2fs_remove_donate_inode(inode);</div><div class='ctx'> </div><div class='del'>-	f2fs_destroy_extent_tree(inode);</div><div class='add'>+	if (!IS_DEVICE_ALIASING(inode))</div><div class='add'>+		f2fs_destroy_extent_tree(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (inode-&gt;i_nlink || is_bad_inode(inode))</div><div class='ctx'> 		goto no_delete;</div><div class='hunk'>@@ -764,24 +892,39 @@ void f2fs_evict_inode(struct inode *inode)</div><div class='ctx'> 	f2fs_remove_ino_entry(sbi, inode-&gt;i_ino, UPDATE_INO);</div><div class='ctx'> 	f2fs_remove_ino_entry(sbi, inode-&gt;i_ino, FLUSH_INO);</div><div class='ctx'> </div><div class='del'>-	sb_start_intwrite(inode-&gt;i_sb);</div><div class='add'>+	if (!is_sbi_flag_set(sbi, SBI_IS_FREEZING)) {</div><div class='add'>+		sb_start_intwrite(inode-&gt;i_sb);</div><div class='add'>+		freeze_protected = true;</div><div class='add'>+	}</div><div class='ctx'> 	set_inode_flag(inode, FI_NO_ALLOC);</div><div class='ctx'> 	i_size_write(inode, 0);</div><div class='ctx'> retry:</div><div class='ctx'> 	if (F2FS_HAS_BLOCKS(inode))</div><div class='ctx'> 		err = f2fs_truncate(inode);</div><div class='ctx'> </div><div class='del'>-	if (time_to_inject(sbi, FAULT_EVICT_INODE)) {</div><div class='del'>-		f2fs_show_injection_info(sbi, FAULT_EVICT_INODE);</div><div class='add'>+	if (time_to_inject(sbi, FAULT_EVICT_INODE))</div><div class='ctx'> 		err = -EIO;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	if (!err) {</div><div class='ctx'> 		f2fs_lock_op(sbi);</div><div class='ctx'> 		err = f2fs_remove_inode_page(inode);</div><div class='ctx'> 		f2fs_unlock_op(sbi);</div><div class='del'>-		if (err == -ENOENT)</div><div class='add'>+		if (err == -ENOENT) {</div><div class='ctx'> 			err = 0;</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * in fuzzed image, another node may has the same</div><div class='add'>+			 * block address as inode's, if it was truncated</div><div class='add'>+			 * previously, truncation of inode node will fail.</div><div class='add'>+			 */</div><div class='add'>+			if (is_inode_flag_set(inode, FI_DIRTY_INODE)) {</div><div class='add'>+				f2fs_warn(F2FS_I_SB(inode),</div><div class='add'>+					"f2fs_evict_inode: inconsistent node id, ino:%lu",</div><div class='add'>+					inode-&gt;i_ino);</div><div class='add'>+				f2fs_inode_synced(inode);</div><div class='add'>+				set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* give more chances, if ENOMEM case */</div><div class='hunk'>@@ -790,12 +933,29 @@ retry:</div><div class='ctx'> 		goto retry;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (IS_DEVICE_ALIASING(inode))</div><div class='add'>+		f2fs_destroy_extent_tree(inode);</div><div class='add'>+</div><div class='ctx'> 	if (err) {</div><div class='ctx'> 		f2fs_update_inode_page(inode);</div><div class='ctx'> 		if (dquot_initialize_needed(inode))</div><div class='ctx'> 			set_sbi_flag(sbi, SBI_QUOTA_NEED_REPAIR);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * If both f2fs_truncate() and f2fs_update_inode_page() failed</div><div class='add'>+		 * due to fuzzed corrupted inode, call f2fs_inode_synced() to</div><div class='add'>+		 * avoid triggering later f2fs_bug_on().</div><div class='add'>+		 */</div><div class='add'>+		if (is_inode_flag_set(inode, FI_DIRTY_INODE)) {</div><div class='add'>+			f2fs_warn(sbi,</div><div class='add'>+				"f2fs_evict_inode: inode is dirty, ino:%lu",</div><div class='add'>+				inode-&gt;i_ino);</div><div class='add'>+			f2fs_inode_synced(inode);</div><div class='add'>+			set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='del'>-	sb_end_intwrite(inode-&gt;i_sb);</div><div class='add'>+	if (freeze_protected)</div><div class='add'>+		sb_end_intwrite(inode-&gt;i_sb);</div><div class='ctx'> no_delete:</div><div class='ctx'> 	dquot_drop(inode);</div><div class='ctx'> </div><div class='hunk'>@@ -804,13 +964,17 @@ no_delete:</div><div class='ctx'> 	stat_dec_inline_inode(inode);</div><div class='ctx'> 	stat_dec_compr_inode(inode);</div><div class='ctx'> 	stat_sub_compr_blocks(inode,</div><div class='del'>-			atomic_read(&amp;F2FS_I(inode)-&gt;i_compr_blocks));</div><div class='add'>+			atomic_read(&amp;fi-&gt;i_compr_blocks));</div><div class='ctx'> </div><div class='ctx'> 	if (likely(!f2fs_cp_error(sbi) &amp;&amp;</div><div class='ctx'> 				!is_sbi_flag_set(sbi, SBI_CP_DISABLED)))</div><div class='ctx'> 		f2fs_bug_on(sbi, is_inode_flag_set(inode, FI_DIRTY_INODE));</div><div class='del'>-	else</div><div class='del'>-		f2fs_inode_synced(inode);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * anyway, it needs to remove the inode from sbi-&gt;inode_list[DIRTY_META]</div><div class='add'>+	 * list to avoid UAF in f2fs_sync_inode_meta() during checkpoint.</div><div class='add'>+	 */</div><div class='add'>+	f2fs_inode_synced(inode);</div><div class='ctx'> </div><div class='ctx'> 	/* for the case f2fs_new_inode() was failed, .i_ino is zero, skip it */</div><div class='ctx'> 	if (inode-&gt;i_ino)</div><div class='hunk'>@@ -868,9 +1032,10 @@ void f2fs_handle_failed_inode(struct inode *inode)</div><div class='ctx'> 	 * so we can prevent losing this orphan when encoutering checkpoint</div><div class='ctx'> 	 * and following suddenly power-off.</div><div class='ctx'> 	 */</div><div class='del'>-	err = f2fs_get_node_info(sbi, inode-&gt;i_ino, &amp;ni);</div><div class='add'>+	err = f2fs_get_node_info(sbi, inode-&gt;i_ino, &amp;ni, false);</div><div class='ctx'> 	if (err) {</div><div class='ctx'> 		set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='add'>+		set_inode_flag(inode, FI_FREE_NID);</div><div class='ctx'> 		f2fs_warn(sbi, "May loss orphan inode, run fsck to fix.");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='head'>diff --git a/fs/f2fs/iostat.c b/fs/f2fs/iostat.c<br/>index cdcf54ae0db8..f8703038e1d8 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/iostat.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/iostat.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/iostat.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/iostat.c</a></div><div class='hunk'>@@ -14,99 +14,98 @@</div><div class='ctx'> #include "iostat.h"</div><div class='ctx'> #include &lt;trace/events/f2fs.h&gt;</div><div class='ctx'> </div><div class='del'>-#define NUM_PREALLOC_IOSTAT_CTXS	128</div><div class='ctx'> static struct kmem_cache *bio_iostat_ctx_cache;</div><div class='ctx'> static mempool_t *bio_iostat_ctx_pool;</div><div class='ctx'> </div><div class='add'>+static inline unsigned long long iostat_get_avg_bytes(struct f2fs_sb_info *sbi,</div><div class='add'>+	enum iostat_type type)</div><div class='add'>+{</div><div class='add'>+	return sbi-&gt;iostat_count[type] ? div64_u64(sbi-&gt;iostat_bytes[type],</div><div class='add'>+		sbi-&gt;iostat_count[type]) : 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define IOSTAT_INFO_SHOW(name, type)					\</div><div class='add'>+	seq_printf(seq, "%-23s %-16llu %-16llu %-16llu\n",		\</div><div class='add'>+			name":", sbi-&gt;iostat_bytes[type],		\</div><div class='add'>+			sbi-&gt;iostat_count[type],			\</div><div class='add'>+			iostat_get_avg_bytes(sbi, type))</div><div class='add'>+</div><div class='ctx'> int __maybe_unused iostat_info_seq_show(struct seq_file *seq, void *offset)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = seq-&gt;private;</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_SB(sb);</div><div class='del'>-	time64_t now = ktime_get_real_seconds();</div><div class='ctx'> </div><div class='ctx'> 	if (!sbi-&gt;iostat_enable)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	seq_printf(seq, "time:		%-16llu\n", now);</div><div class='add'>+	seq_printf(seq, "time:		%-16llu\n", ktime_get_real_seconds());</div><div class='add'>+	seq_printf(seq, "\t\t\t%-16s %-16s %-16s\n",</div><div class='add'>+				"io_bytes", "count", "avg_bytes");</div><div class='ctx'> </div><div class='ctx'> 	/* print app write IOs */</div><div class='ctx'> 	seq_puts(seq, "[WRITE]\n");</div><div class='del'>-	seq_printf(seq, "app buffered:	%-16llu\n",</div><div class='del'>-				sbi-&gt;rw_iostat[APP_BUFFERED_IO]);</div><div class='del'>-	seq_printf(seq, "app direct:	%-16llu\n",</div><div class='del'>-				sbi-&gt;rw_iostat[APP_DIRECT_IO]);</div><div class='del'>-	seq_printf(seq, "app mapped:	%-16llu\n",</div><div class='del'>-				sbi-&gt;rw_iostat[APP_MAPPED_IO]);</div><div class='add'>+	IOSTAT_INFO_SHOW("app buffered data", APP_BUFFERED_IO);</div><div class='add'>+	IOSTAT_INFO_SHOW("app direct data", APP_DIRECT_IO);</div><div class='add'>+	IOSTAT_INFO_SHOW("app mapped data", APP_MAPPED_IO);</div><div class='add'>+	IOSTAT_INFO_SHOW("app buffered cdata", APP_BUFFERED_CDATA_IO);</div><div class='add'>+	IOSTAT_INFO_SHOW("app mapped cdata", APP_MAPPED_CDATA_IO);</div><div class='ctx'> </div><div class='ctx'> 	/* print fs write IOs */</div><div class='del'>-	seq_printf(seq, "fs data:	%-16llu\n",</div><div class='del'>-				sbi-&gt;rw_iostat[FS_DATA_IO]);</div><div class='del'>-	seq_printf(seq, "fs node:	%-16llu\n",</div><div class='del'>-				sbi-&gt;rw_iostat[FS_NODE_IO]);</div><div class='del'>-	seq_printf(seq, "fs meta:	%-16llu\n",</div><div class='del'>-				sbi-&gt;rw_iostat[FS_META_IO]);</div><div class='del'>-	seq_printf(seq, "fs gc data:	%-16llu\n",</div><div class='del'>-				sbi-&gt;rw_iostat[FS_GC_DATA_IO]);</div><div class='del'>-	seq_printf(seq, "fs gc node:	%-16llu\n",</div><div class='del'>-				sbi-&gt;rw_iostat[FS_GC_NODE_IO]);</div><div class='del'>-	seq_printf(seq, "fs cp data:	%-16llu\n",</div><div class='del'>-				sbi-&gt;rw_iostat[FS_CP_DATA_IO]);</div><div class='del'>-	seq_printf(seq, "fs cp node:	%-16llu\n",</div><div class='del'>-				sbi-&gt;rw_iostat[FS_CP_NODE_IO]);</div><div class='del'>-	seq_printf(seq, "fs cp meta:	%-16llu\n",</div><div class='del'>-				sbi-&gt;rw_iostat[FS_CP_META_IO]);</div><div class='add'>+	IOSTAT_INFO_SHOW("fs data", FS_DATA_IO);</div><div class='add'>+	IOSTAT_INFO_SHOW("fs cdata", FS_CDATA_IO);</div><div class='add'>+	IOSTAT_INFO_SHOW("fs node", FS_NODE_IO);</div><div class='add'>+	IOSTAT_INFO_SHOW("fs meta", FS_META_IO);</div><div class='add'>+	IOSTAT_INFO_SHOW("fs gc data", FS_GC_DATA_IO);</div><div class='add'>+	IOSTAT_INFO_SHOW("fs gc node", FS_GC_NODE_IO);</div><div class='add'>+	IOSTAT_INFO_SHOW("fs cp data", FS_CP_DATA_IO);</div><div class='add'>+	IOSTAT_INFO_SHOW("fs cp node", FS_CP_NODE_IO);</div><div class='add'>+	IOSTAT_INFO_SHOW("fs cp meta", FS_CP_META_IO);</div><div class='ctx'> </div><div class='ctx'> 	/* print app read IOs */</div><div class='ctx'> 	seq_puts(seq, "[READ]\n");</div><div class='del'>-	seq_printf(seq, "app buffered:	%-16llu\n",</div><div class='del'>-				sbi-&gt;rw_iostat[APP_BUFFERED_READ_IO]);</div><div class='del'>-	seq_printf(seq, "app direct:	%-16llu\n",</div><div class='del'>-				sbi-&gt;rw_iostat[APP_DIRECT_READ_IO]);</div><div class='del'>-	seq_printf(seq, "app mapped:	%-16llu\n",</div><div class='del'>-				sbi-&gt;rw_iostat[APP_MAPPED_READ_IO]);</div><div class='add'>+	IOSTAT_INFO_SHOW("app buffered data", APP_BUFFERED_READ_IO);</div><div class='add'>+	IOSTAT_INFO_SHOW("app direct data", APP_DIRECT_READ_IO);</div><div class='add'>+	IOSTAT_INFO_SHOW("app mapped data", APP_MAPPED_READ_IO);</div><div class='add'>+	IOSTAT_INFO_SHOW("app buffered cdata", APP_BUFFERED_CDATA_READ_IO);</div><div class='add'>+	IOSTAT_INFO_SHOW("app mapped cdata", APP_MAPPED_CDATA_READ_IO);</div><div class='ctx'> </div><div class='ctx'> 	/* print fs read IOs */</div><div class='del'>-	seq_printf(seq, "fs data:	%-16llu\n",</div><div class='del'>-				sbi-&gt;rw_iostat[FS_DATA_READ_IO]);</div><div class='del'>-	seq_printf(seq, "fs gc data:	%-16llu\n",</div><div class='del'>-				sbi-&gt;rw_iostat[FS_GDATA_READ_IO]);</div><div class='del'>-	seq_printf(seq, "fs compr_data:	%-16llu\n",</div><div class='del'>-				sbi-&gt;rw_iostat[FS_CDATA_READ_IO]);</div><div class='del'>-	seq_printf(seq, "fs node:	%-16llu\n",</div><div class='del'>-				sbi-&gt;rw_iostat[FS_NODE_READ_IO]);</div><div class='del'>-	seq_printf(seq, "fs meta:	%-16llu\n",</div><div class='del'>-				sbi-&gt;rw_iostat[FS_META_READ_IO]);</div><div class='add'>+	IOSTAT_INFO_SHOW("fs data", FS_DATA_READ_IO);</div><div class='add'>+	IOSTAT_INFO_SHOW("fs gc data", FS_GDATA_READ_IO);</div><div class='add'>+	IOSTAT_INFO_SHOW("fs cdata", FS_CDATA_READ_IO);</div><div class='add'>+	IOSTAT_INFO_SHOW("fs node", FS_NODE_READ_IO);</div><div class='add'>+	IOSTAT_INFO_SHOW("fs meta", FS_META_READ_IO);</div><div class='ctx'> </div><div class='ctx'> 	/* print other IOs */</div><div class='ctx'> 	seq_puts(seq, "[OTHER]\n");</div><div class='del'>-	seq_printf(seq, "fs discard:	%-16llu\n",</div><div class='del'>-				sbi-&gt;rw_iostat[FS_DISCARD]);</div><div class='add'>+	IOSTAT_INFO_SHOW("fs discard", FS_DISCARD_IO);</div><div class='add'>+	IOSTAT_INFO_SHOW("fs flush", FS_FLUSH_IO);</div><div class='add'>+	IOSTAT_INFO_SHOW("fs zone reset", FS_ZONE_RESET_IO);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void __record_iostat_latency(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='del'>-	int io, idx = 0;</div><div class='del'>-	unsigned int cnt;</div><div class='add'>+	int io, idx;</div><div class='ctx'> 	struct f2fs_iostat_latency iostat_lat[MAX_IO_TYPE][NR_PAGE_TYPE];</div><div class='ctx'> 	struct iostat_lat_info *io_lat = sbi-&gt;iostat_io_lat;</div><div class='add'>+	unsigned long flags;</div><div class='ctx'> </div><div class='del'>-	spin_lock_irq(&amp;sbi-&gt;iostat_lat_lock);</div><div class='add'>+	spin_lock_irqsave(&amp;sbi-&gt;iostat_lat_lock, flags);</div><div class='ctx'> 	for (idx = 0; idx &lt; MAX_IO_TYPE; idx++) {</div><div class='ctx'> 		for (io = 0; io &lt; NR_PAGE_TYPE; io++) {</div><div class='del'>-			cnt = io_lat-&gt;bio_cnt[idx][io];</div><div class='ctx'> 			iostat_lat[idx][io].peak_lat =</div><div class='ctx'> 			   jiffies_to_msecs(io_lat-&gt;peak_lat[idx][io]);</div><div class='del'>-			iostat_lat[idx][io].cnt = cnt;</div><div class='del'>-			iostat_lat[idx][io].avg_lat = cnt ?</div><div class='del'>-			   jiffies_to_msecs(io_lat-&gt;sum_lat[idx][io]) / cnt : 0;</div><div class='add'>+			iostat_lat[idx][io].cnt = io_lat-&gt;bio_cnt[idx][io];</div><div class='add'>+			iostat_lat[idx][io].avg_lat = iostat_lat[idx][io].cnt ?</div><div class='add'>+			   jiffies_to_msecs(io_lat-&gt;sum_lat[idx][io]) / iostat_lat[idx][io].cnt : 0;</div><div class='ctx'> 			io_lat-&gt;sum_lat[idx][io] = 0;</div><div class='ctx'> 			io_lat-&gt;peak_lat[idx][io] = 0;</div><div class='ctx'> 			io_lat-&gt;bio_cnt[idx][io] = 0;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock_irq(&amp;sbi-&gt;iostat_lat_lock);</div><div class='add'>+	spin_unlock_irqrestore(&amp;sbi-&gt;iostat_lat_lock, flags);</div><div class='ctx'> </div><div class='ctx'> 	trace_f2fs_iostat_latency(sbi, iostat_lat);</div><div class='ctx'> }</div><div class='hunk'>@@ -115,25 +114,26 @@ static inline void f2fs_record_iostat(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned long long iostat_diff[NR_IO_TYPE];</div><div class='ctx'> 	int i;</div><div class='add'>+	unsigned long flags;</div><div class='ctx'> </div><div class='ctx'> 	if (time_is_after_jiffies(sbi-&gt;iostat_next_period))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	/* Need double check under the lock */</div><div class='del'>-	spin_lock(&amp;sbi-&gt;iostat_lock);</div><div class='add'>+	spin_lock_irqsave(&amp;sbi-&gt;iostat_lock, flags);</div><div class='ctx'> 	if (time_is_after_jiffies(sbi-&gt;iostat_next_period)) {</div><div class='del'>-		spin_unlock(&amp;sbi-&gt;iostat_lock);</div><div class='add'>+		spin_unlock_irqrestore(&amp;sbi-&gt;iostat_lock, flags);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> 	sbi-&gt;iostat_next_period = jiffies +</div><div class='ctx'> 				msecs_to_jiffies(sbi-&gt;iostat_period_ms);</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; NR_IO_TYPE; i++) {</div><div class='del'>-		iostat_diff[i] = sbi-&gt;rw_iostat[i] -</div><div class='del'>-				sbi-&gt;prev_rw_iostat[i];</div><div class='del'>-		sbi-&gt;prev_rw_iostat[i] = sbi-&gt;rw_iostat[i];</div><div class='add'>+		iostat_diff[i] = sbi-&gt;iostat_bytes[i] -</div><div class='add'>+				sbi-&gt;prev_iostat_bytes[i];</div><div class='add'>+		sbi-&gt;prev_iostat_bytes[i] = sbi-&gt;iostat_bytes[i];</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;sbi-&gt;iostat_lock);</div><div class='add'>+	spin_unlock_irqrestore(&amp;sbi-&gt;iostat_lock, flags);</div><div class='ctx'> </div><div class='ctx'> 	trace_f2fs_iostat(sbi, iostat_diff);</div><div class='ctx'> </div><div class='hunk'>@@ -145,85 +145,113 @@ void f2fs_reset_iostat(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	struct iostat_lat_info *io_lat = sbi-&gt;iostat_io_lat;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;sbi-&gt;iostat_lock);</div><div class='add'>+	spin_lock_irq(&amp;sbi-&gt;iostat_lock);</div><div class='ctx'> 	for (i = 0; i &lt; NR_IO_TYPE; i++) {</div><div class='del'>-		sbi-&gt;rw_iostat[i] = 0;</div><div class='del'>-		sbi-&gt;prev_rw_iostat[i] = 0;</div><div class='add'>+		sbi-&gt;iostat_count[i] = 0;</div><div class='add'>+		sbi-&gt;iostat_bytes[i] = 0;</div><div class='add'>+		sbi-&gt;prev_iostat_bytes[i] = 0;</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;sbi-&gt;iostat_lock);</div><div class='add'>+	spin_unlock_irq(&amp;sbi-&gt;iostat_lock);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock_irq(&amp;sbi-&gt;iostat_lat_lock);</div><div class='ctx'> 	memset(io_lat, 0, sizeof(struct iostat_lat_info));</div><div class='ctx'> 	spin_unlock_irq(&amp;sbi-&gt;iostat_lat_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_update_iostat(struct f2fs_sb_info *sbi,</div><div class='add'>+static inline void __f2fs_update_iostat(struct f2fs_sb_info *sbi,</div><div class='add'>+			enum iostat_type type, unsigned long long io_bytes)</div><div class='add'>+{</div><div class='add'>+	sbi-&gt;iostat_bytes[type] += io_bytes;</div><div class='add'>+	sbi-&gt;iostat_count[type]++;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void f2fs_update_iostat(struct f2fs_sb_info *sbi, struct inode *inode,</div><div class='ctx'> 			enum iostat_type type, unsigned long long io_bytes)</div><div class='ctx'> {</div><div class='add'>+	unsigned long flags;</div><div class='add'>+</div><div class='ctx'> 	if (!sbi-&gt;iostat_enable)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;sbi-&gt;iostat_lock);</div><div class='del'>-	sbi-&gt;rw_iostat[type] += io_bytes;</div><div class='add'>+	spin_lock_irqsave(&amp;sbi-&gt;iostat_lock, flags);</div><div class='add'>+	__f2fs_update_iostat(sbi, type, io_bytes);</div><div class='add'>+</div><div class='add'>+	if (type == APP_BUFFERED_IO || type == APP_DIRECT_IO)</div><div class='add'>+		__f2fs_update_iostat(sbi, APP_WRITE_IO, io_bytes);</div><div class='ctx'> </div><div class='del'>-	if (type == APP_WRITE_IO || type == APP_DIRECT_IO)</div><div class='del'>-		sbi-&gt;rw_iostat[APP_BUFFERED_IO] =</div><div class='del'>-			sbi-&gt;rw_iostat[APP_WRITE_IO] -</div><div class='del'>-			sbi-&gt;rw_iostat[APP_DIRECT_IO];</div><div class='add'>+	if (type == APP_BUFFERED_READ_IO || type == APP_DIRECT_READ_IO)</div><div class='add'>+		__f2fs_update_iostat(sbi, APP_READ_IO, io_bytes);</div><div class='ctx'> </div><div class='del'>-	if (type == APP_READ_IO || type == APP_DIRECT_READ_IO)</div><div class='del'>-		sbi-&gt;rw_iostat[APP_BUFFERED_READ_IO] =</div><div class='del'>-			sbi-&gt;rw_iostat[APP_READ_IO] -</div><div class='del'>-			sbi-&gt;rw_iostat[APP_DIRECT_READ_IO];</div><div class='del'>-	spin_unlock(&amp;sbi-&gt;iostat_lock);</div><div class='add'>+#ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='add'>+	if (inode &amp;&amp; f2fs_compressed_file(inode)) {</div><div class='add'>+		if (type == APP_BUFFERED_IO)</div><div class='add'>+			__f2fs_update_iostat(sbi, APP_BUFFERED_CDATA_IO, io_bytes);</div><div class='add'>+</div><div class='add'>+		if (type == APP_BUFFERED_READ_IO)</div><div class='add'>+			__f2fs_update_iostat(sbi, APP_BUFFERED_CDATA_READ_IO, io_bytes);</div><div class='add'>+</div><div class='add'>+		if (type == APP_MAPPED_READ_IO)</div><div class='add'>+			__f2fs_update_iostat(sbi, APP_MAPPED_CDATA_READ_IO, io_bytes);</div><div class='add'>+</div><div class='add'>+		if (type == APP_MAPPED_IO)</div><div class='add'>+			__f2fs_update_iostat(sbi, APP_MAPPED_CDATA_IO, io_bytes);</div><div class='add'>+</div><div class='add'>+		if (type == FS_DATA_READ_IO)</div><div class='add'>+			__f2fs_update_iostat(sbi, FS_CDATA_READ_IO, io_bytes);</div><div class='add'>+</div><div class='add'>+		if (type == FS_DATA_IO)</div><div class='add'>+			__f2fs_update_iostat(sbi, FS_CDATA_IO, io_bytes);</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+	spin_unlock_irqrestore(&amp;sbi-&gt;iostat_lock, flags);</div><div class='ctx'> </div><div class='ctx'> 	f2fs_record_iostat(sbi);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void __update_iostat_latency(struct bio_iostat_ctx *iostat_ctx,</div><div class='del'>-				int rw, bool is_sync)</div><div class='add'>+				enum iostat_lat_type lat_type)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned long ts_diff;</div><div class='del'>-	unsigned int iotype = iostat_ctx-&gt;type;</div><div class='del'>-	unsigned long flags;</div><div class='add'>+	unsigned int page_type = iostat_ctx-&gt;type;</div><div class='ctx'> 	struct f2fs_sb_info *sbi = iostat_ctx-&gt;sbi;</div><div class='ctx'> 	struct iostat_lat_info *io_lat = sbi-&gt;iostat_io_lat;</div><div class='del'>-	int idx;</div><div class='add'>+	unsigned long flags;</div><div class='ctx'> </div><div class='ctx'> 	if (!sbi-&gt;iostat_enable)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	ts_diff = jiffies - iostat_ctx-&gt;submit_ts;</div><div class='del'>-	if (iotype &gt;= META_FLUSH)</div><div class='del'>-		iotype = META;</div><div class='del'>-</div><div class='del'>-	if (rw == 0) {</div><div class='del'>-		idx = READ_IO;</div><div class='del'>-	} else {</div><div class='del'>-		if (is_sync)</div><div class='del'>-			idx = WRITE_SYNC_IO;</div><div class='del'>-		else</div><div class='del'>-			idx = WRITE_ASYNC_IO;</div><div class='add'>+	if (page_type == META_FLUSH) {</div><div class='add'>+		page_type = META;</div><div class='add'>+	} else if (page_type &gt;= NR_PAGE_TYPE) {</div><div class='add'>+		f2fs_warn(sbi, "%s: %d over NR_PAGE_TYPE", __func__, page_type);</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	spin_lock_irqsave(&amp;sbi-&gt;iostat_lat_lock, flags);</div><div class='del'>-	io_lat-&gt;sum_lat[idx][iotype] += ts_diff;</div><div class='del'>-	io_lat-&gt;bio_cnt[idx][iotype]++;</div><div class='del'>-	if (ts_diff &gt; io_lat-&gt;peak_lat[idx][iotype])</div><div class='del'>-		io_lat-&gt;peak_lat[idx][iotype] = ts_diff;</div><div class='add'>+	io_lat-&gt;sum_lat[lat_type][page_type] += ts_diff;</div><div class='add'>+	io_lat-&gt;bio_cnt[lat_type][page_type]++;</div><div class='add'>+	if (ts_diff &gt; io_lat-&gt;peak_lat[lat_type][page_type])</div><div class='add'>+		io_lat-&gt;peak_lat[lat_type][page_type] = ts_diff;</div><div class='ctx'> 	spin_unlock_irqrestore(&amp;sbi-&gt;iostat_lat_lock, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void iostat_update_and_unbind_ctx(struct bio *bio, int rw)</div><div class='add'>+void iostat_update_and_unbind_ctx(struct bio *bio)</div><div class='ctx'> {</div><div class='ctx'> 	struct bio_iostat_ctx *iostat_ctx = bio-&gt;bi_private;</div><div class='del'>-	bool is_sync = bio-&gt;bi_opf &amp; REQ_SYNC;</div><div class='add'>+	enum iostat_lat_type lat_type;</div><div class='ctx'> </div><div class='del'>-	if (rw == 0)</div><div class='del'>-		bio-&gt;bi_private = iostat_ctx-&gt;post_read_ctx;</div><div class='del'>-	else</div><div class='add'>+	if (op_is_write(bio_op(bio))) {</div><div class='add'>+		lat_type = bio-&gt;bi_opf &amp; REQ_SYNC ?</div><div class='add'>+				WRITE_SYNC_IO : WRITE_ASYNC_IO;</div><div class='ctx'> 		bio-&gt;bi_private = iostat_ctx-&gt;sbi;</div><div class='del'>-	__update_iostat_latency(iostat_ctx, rw, is_sync);</div><div class='add'>+	} else {</div><div class='add'>+		lat_type = READ_IO;</div><div class='add'>+		bio-&gt;bi_private = iostat_ctx-&gt;post_read_ctx;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	__update_iostat_latency(iostat_ctx, lat_type);</div><div class='ctx'> 	mempool_free(iostat_ctx, bio_iostat_ctx_pool);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/f2fs/iostat.h b/fs/f2fs/iostat.h<br/>index 22a2d01f57ef..eb99d05cf272 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/iostat.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/iostat.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/iostat.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/iostat.h</a></div><div class='hunk'>@@ -8,20 +8,21 @@</div><div class='ctx'> </div><div class='ctx'> struct bio_post_read_ctx;</div><div class='ctx'> </div><div class='add'>+enum iostat_lat_type {</div><div class='add'>+	READ_IO = 0,</div><div class='add'>+	WRITE_SYNC_IO,</div><div class='add'>+	WRITE_ASYNC_IO,</div><div class='add'>+	MAX_IO_TYPE,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> #ifdef CONFIG_F2FS_IOSTAT</div><div class='ctx'> </div><div class='add'>+#define NUM_PREALLOC_IOSTAT_CTXS	128</div><div class='ctx'> #define DEFAULT_IOSTAT_PERIOD_MS	3000</div><div class='ctx'> #define MIN_IOSTAT_PERIOD_MS		100</div><div class='ctx'> /* maximum period of iostat tracing is 1 day */</div><div class='ctx'> #define MAX_IOSTAT_PERIOD_MS		8640000</div><div class='ctx'> </div><div class='del'>-enum {</div><div class='del'>-	READ_IO,</div><div class='del'>-	WRITE_SYNC_IO,</div><div class='del'>-	WRITE_ASYNC_IO,</div><div class='del'>-	MAX_IO_TYPE,</div><div class='del'>-};</div><div class='del'>-</div><div class='ctx'> struct iostat_lat_info {</div><div class='ctx'> 	unsigned long sum_lat[MAX_IO_TYPE][NR_PAGE_TYPE];	/* sum of io latencies */</div><div class='ctx'> 	unsigned long peak_lat[MAX_IO_TYPE][NR_PAGE_TYPE];	/* peak io latency */</div><div class='hunk'>@@ -31,7 +32,7 @@ struct iostat_lat_info {</div><div class='ctx'> extern int __maybe_unused iostat_info_seq_show(struct seq_file *seq,</div><div class='ctx'> 			void *offset);</div><div class='ctx'> extern void f2fs_reset_iostat(struct f2fs_sb_info *sbi);</div><div class='del'>-extern void f2fs_update_iostat(struct f2fs_sb_info *sbi,</div><div class='add'>+extern void f2fs_update_iostat(struct f2fs_sb_info *sbi, struct inode *inode,</div><div class='ctx'> 			enum iostat_type type, unsigned long long io_bytes);</div><div class='ctx'> </div><div class='ctx'> struct bio_iostat_ctx {</div><div class='hunk'>@@ -57,7 +58,7 @@ static inline struct bio_post_read_ctx *get_post_read_ctx(struct bio *bio)</div><div class='ctx'> 	return iostat_ctx-&gt;post_read_ctx;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-extern void iostat_update_and_unbind_ctx(struct bio *bio, int rw);</div><div class='add'>+extern void iostat_update_and_unbind_ctx(struct bio *bio);</div><div class='ctx'> extern void iostat_alloc_and_bind_ctx(struct f2fs_sb_info *sbi,</div><div class='ctx'> 		struct bio *bio, struct bio_post_read_ctx *ctx);</div><div class='ctx'> extern int f2fs_init_iostat_processing(void);</div><div class='hunk'>@@ -65,9 +66,9 @@ extern void f2fs_destroy_iostat_processing(void);</div><div class='ctx'> extern int f2fs_init_iostat(struct f2fs_sb_info *sbi);</div><div class='ctx'> extern void f2fs_destroy_iostat(struct f2fs_sb_info *sbi);</div><div class='ctx'> #else</div><div class='del'>-static inline void f2fs_update_iostat(struct f2fs_sb_info *sbi,</div><div class='add'>+static inline void f2fs_update_iostat(struct f2fs_sb_info *sbi, struct inode *inode,</div><div class='ctx'> 		enum iostat_type type, unsigned long long io_bytes) {}</div><div class='del'>-static inline void iostat_update_and_unbind_ctx(struct bio *bio, int rw) {}</div><div class='add'>+static inline void iostat_update_and_unbind_ctx(struct bio *bio) {}</div><div class='ctx'> static inline void iostat_alloc_and_bind_ctx(struct f2fs_sb_info *sbi,</div><div class='ctx'> 		struct bio *bio, struct bio_post_read_ctx *ctx) {}</div><div class='ctx'> static inline void iostat_update_submit_ctx(struct bio *bio,</div><div class='head'>diff --git a/fs/f2fs/namei.c b/fs/f2fs/namei.c<br/>index a728a0af9ce0..043d20516a21 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/namei.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/namei.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/namei.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/namei.c</a></div><div class='hunk'>@@ -22,199 +22,52 @@</div><div class='ctx'> #include "acl.h"</div><div class='ctx'> #include &lt;trace/events/f2fs.h&gt;</div><div class='ctx'> </div><div class='del'>-static struct inode *f2fs_new_inode(struct inode *dir, umode_t mode)</div><div class='del'>-{</div><div class='del'>-	struct f2fs_sb_info *sbi = F2FS_I_SB(dir);</div><div class='del'>-	nid_t ino;</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	bool nid_free = false;</div><div class='del'>-	bool encrypt = false;</div><div class='del'>-	int xattr_size = 0;</div><div class='del'>-	int err;</div><div class='del'>-</div><div class='del'>-	inode = new_inode(dir-&gt;i_sb);</div><div class='del'>-	if (!inode)</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='del'>-</div><div class='del'>-	f2fs_lock_op(sbi);</div><div class='del'>-	if (!f2fs_alloc_nid(sbi, &amp;ino)) {</div><div class='del'>-		f2fs_unlock_op(sbi);</div><div class='del'>-		err = -ENOSPC;</div><div class='del'>-		goto fail;</div><div class='del'>-	}</div><div class='del'>-	f2fs_unlock_op(sbi);</div><div class='del'>-</div><div class='del'>-	nid_free = true;</div><div class='del'>-</div><div class='del'>-	inode_init_owner(&amp;init_user_ns, inode, dir, mode);</div><div class='del'>-</div><div class='del'>-	inode-&gt;i_ino = ino;</div><div class='del'>-	inode-&gt;i_blocks = 0;</div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_atime = inode-&gt;i_ctime = current_time(inode);</div><div class='del'>-	F2FS_I(inode)-&gt;i_crtime = inode-&gt;i_mtime;</div><div class='del'>-	inode-&gt;i_generation = prandom_u32();</div><div class='del'>-</div><div class='del'>-	if (S_ISDIR(inode-&gt;i_mode))</div><div class='del'>-		F2FS_I(inode)-&gt;i_current_depth = 1;</div><div class='del'>-</div><div class='del'>-	err = insert_inode_locked(inode);</div><div class='del'>-	if (err) {</div><div class='del'>-		err = -EINVAL;</div><div class='del'>-		goto fail;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (f2fs_sb_has_project_quota(sbi) &amp;&amp;</div><div class='del'>-		(F2FS_I(dir)-&gt;i_flags &amp; F2FS_PROJINHERIT_FL))</div><div class='del'>-		F2FS_I(inode)-&gt;i_projid = F2FS_I(dir)-&gt;i_projid;</div><div class='del'>-	else</div><div class='del'>-		F2FS_I(inode)-&gt;i_projid = make_kprojid(&amp;init_user_ns,</div><div class='del'>-							F2FS_DEF_PROJID);</div><div class='del'>-</div><div class='del'>-	err = fscrypt_prepare_new_inode(dir, inode, &amp;encrypt);</div><div class='del'>-	if (err)</div><div class='del'>-		goto fail_drop;</div><div class='del'>-</div><div class='del'>-	err = f2fs_dquot_initialize(inode);</div><div class='del'>-	if (err)</div><div class='del'>-		goto fail_drop;</div><div class='del'>-</div><div class='del'>-	set_inode_flag(inode, FI_NEW_INODE);</div><div class='del'>-</div><div class='del'>-	if (encrypt)</div><div class='del'>-		f2fs_set_encrypted_inode(inode);</div><div class='del'>-</div><div class='del'>-	if (f2fs_sb_has_extra_attr(sbi)) {</div><div class='del'>-		set_inode_flag(inode, FI_EXTRA_ATTR);</div><div class='del'>-		F2FS_I(inode)-&gt;i_extra_isize = F2FS_TOTAL_EXTRA_ATTR_SIZE;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (test_opt(sbi, INLINE_XATTR))</div><div class='del'>-		set_inode_flag(inode, FI_INLINE_XATTR);</div><div class='del'>-</div><div class='del'>-	if (test_opt(sbi, INLINE_DATA) &amp;&amp; f2fs_may_inline_data(inode))</div><div class='del'>-		set_inode_flag(inode, FI_INLINE_DATA);</div><div class='del'>-	if (f2fs_may_inline_dentry(inode))</div><div class='del'>-		set_inode_flag(inode, FI_INLINE_DENTRY);</div><div class='del'>-</div><div class='del'>-	if (f2fs_sb_has_flexible_inline_xattr(sbi)) {</div><div class='del'>-		f2fs_bug_on(sbi, !f2fs_has_extra_attr(inode));</div><div class='del'>-		if (f2fs_has_inline_xattr(inode))</div><div class='del'>-			xattr_size = F2FS_OPTION(sbi).inline_xattr_size;</div><div class='del'>-		/* Otherwise, will be 0 */</div><div class='del'>-	} else if (f2fs_has_inline_xattr(inode) ||</div><div class='del'>-				f2fs_has_inline_dentry(inode)) {</div><div class='del'>-		xattr_size = DEFAULT_INLINE_XATTR_ADDRS;</div><div class='del'>-	}</div><div class='del'>-	F2FS_I(inode)-&gt;i_inline_xattr_size = xattr_size;</div><div class='del'>-</div><div class='del'>-	f2fs_init_extent_tree(inode, NULL);</div><div class='del'>-</div><div class='del'>-	stat_inc_inline_xattr(inode);</div><div class='del'>-	stat_inc_inline_inode(inode);</div><div class='del'>-	stat_inc_inline_dir(inode);</div><div class='del'>-</div><div class='del'>-	F2FS_I(inode)-&gt;i_flags =</div><div class='del'>-		f2fs_mask_flags(mode, F2FS_I(dir)-&gt;i_flags &amp; F2FS_FL_INHERITED);</div><div class='del'>-</div><div class='del'>-	if (S_ISDIR(inode-&gt;i_mode))</div><div class='del'>-		F2FS_I(inode)-&gt;i_flags |= F2FS_INDEX_FL;</div><div class='del'>-</div><div class='del'>-	if (F2FS_I(inode)-&gt;i_flags &amp; F2FS_PROJINHERIT_FL)</div><div class='del'>-		set_inode_flag(inode, FI_PROJ_INHERIT);</div><div class='del'>-</div><div class='del'>-	if (f2fs_sb_has_compression(sbi)) {</div><div class='del'>-		/* Inherit the compression flag in directory */</div><div class='del'>-		if ((F2FS_I(dir)-&gt;i_flags &amp; F2FS_COMPR_FL) &amp;&amp;</div><div class='del'>-					f2fs_may_compress(inode))</div><div class='del'>-			set_compress_context(inode);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	f2fs_set_inode_flags(inode);</div><div class='del'>-</div><div class='del'>-	trace_f2fs_new_inode(inode, 0);</div><div class='del'>-	return inode;</div><div class='del'>-</div><div class='del'>-fail:</div><div class='del'>-	trace_f2fs_new_inode(inode, err);</div><div class='del'>-	make_bad_inode(inode);</div><div class='del'>-	if (nid_free)</div><div class='del'>-		set_inode_flag(inode, FI_FREE_NID);</div><div class='del'>-	iput(inode);</div><div class='del'>-	return ERR_PTR(err);</div><div class='del'>-fail_drop:</div><div class='del'>-	trace_f2fs_new_inode(inode, err);</div><div class='del'>-	dquot_drop(inode);</div><div class='del'>-	inode-&gt;i_flags |= S_NOQUOTA;</div><div class='del'>-	if (nid_free)</div><div class='del'>-		set_inode_flag(inode, FI_FREE_NID);</div><div class='del'>-	clear_nlink(inode);</div><div class='del'>-	unlock_new_inode(inode);</div><div class='del'>-	iput(inode);</div><div class='del'>-	return ERR_PTR(err);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline int is_extension_exist(const unsigned char *s, const char *sub,</div><div class='del'>-						bool tmp_ext)</div><div class='add'>+static inline bool is_extension_exist(const unsigned char *s, const char *sub,</div><div class='add'>+						bool tmp_ext, bool tmp_dot)</div><div class='ctx'> {</div><div class='ctx'> 	size_t slen = strlen(s);</div><div class='ctx'> 	size_t sublen = strlen(sub);</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='ctx'> 	if (sublen == 1 &amp;&amp; *sub == '*')</div><div class='del'>-		return 1;</div><div class='add'>+		return true;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * filename format of multimedia file should be defined as:</div><div class='ctx'> 	 * "filename + '.' + extension + (optional: '.' + temp extension)".</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (slen &lt; sublen + 2)</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	if (!tmp_ext) {</div><div class='ctx'> 		/* file has no temp extension */</div><div class='ctx'> 		if (s[slen - sublen - 1] != '.')</div><div class='del'>-			return 0;</div><div class='add'>+			return false;</div><div class='ctx'> 		return !strncasecmp(s + slen - sublen, sub, sublen);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	for (i = 1; i &lt; slen - sublen; i++) {</div><div class='ctx'> 		if (s[i] != '.')</div><div class='ctx'> 			continue;</div><div class='del'>-		if (!strncasecmp(s + i + 1, sub, sublen))</div><div class='del'>-			return 1;</div><div class='add'>+		if (!strncasecmp(s + i + 1, sub, sublen)) {</div><div class='add'>+			if (!tmp_dot)</div><div class='add'>+				return true;</div><div class='add'>+			if (i == slen - sublen - 1 || s[i + 1 + sublen] == '.')</div><div class='add'>+				return true;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Set file's temperature for hot/cold data separation</div><div class='del'>- */</div><div class='del'>-static inline void set_file_temperature(struct f2fs_sb_info *sbi, struct inode *inode,</div><div class='del'>-		const unsigned char *name)</div><div class='add'>+static inline bool is_temperature_extension(const unsigned char *s, const char *sub)</div><div class='ctx'> {</div><div class='del'>-	__u8 (*extlist)[F2FS_EXTENSION_LEN] = sbi-&gt;raw_super-&gt;extension_list;</div><div class='del'>-	int i, cold_count, hot_count;</div><div class='del'>-</div><div class='del'>-	down_read(&amp;sbi-&gt;sb_lock);</div><div class='del'>-</div><div class='del'>-	cold_count = le32_to_cpu(sbi-&gt;raw_super-&gt;extension_count);</div><div class='del'>-	hot_count = sbi-&gt;raw_super-&gt;hot_ext_count;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; cold_count + hot_count; i++) {</div><div class='del'>-		if (is_extension_exist(name, extlist[i], true))</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	up_read(&amp;sbi-&gt;sb_lock);</div><div class='del'>-</div><div class='del'>-	if (i == cold_count + hot_count)</div><div class='del'>-		return;</div><div class='add'>+	return is_extension_exist(s, sub, true, false);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if (i &lt; cold_count)</div><div class='del'>-		file_set_cold(inode);</div><div class='del'>-	else</div><div class='del'>-		file_set_hot(inode);</div><div class='add'>+static inline bool is_compress_extension(const unsigned char *s, const char *sub)</div><div class='add'>+{</div><div class='add'>+	return is_extension_exist(s, sub, true, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int f2fs_update_extension_list(struct f2fs_sb_info *sbi, const char *name,</div><div class='hunk'>@@ -283,56 +136,221 @@ int f2fs_update_extension_list(struct f2fs_sb_info *sbi, const char *name,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void set_compress_inode(struct f2fs_sb_info *sbi, struct inode *inode,</div><div class='del'>-						const unsigned char *name)</div><div class='add'>+static void set_compress_new_inode(struct f2fs_sb_info *sbi, struct inode *dir,</div><div class='add'>+				struct inode *inode, const unsigned char *name)</div><div class='ctx'> {</div><div class='ctx'> 	__u8 (*extlist)[F2FS_EXTENSION_LEN] = sbi-&gt;raw_super-&gt;extension_list;</div><div class='del'>-	unsigned char (*noext)[F2FS_EXTENSION_LEN] = F2FS_OPTION(sbi).noextensions;</div><div class='add'>+	unsigned char (*noext)[F2FS_EXTENSION_LEN] =</div><div class='add'>+						F2FS_OPTION(sbi).noextensions;</div><div class='ctx'> 	unsigned char (*ext)[F2FS_EXTENSION_LEN] = F2FS_OPTION(sbi).extensions;</div><div class='ctx'> 	unsigned char ext_cnt = F2FS_OPTION(sbi).compress_ext_cnt;</div><div class='ctx'> 	unsigned char noext_cnt = F2FS_OPTION(sbi).nocompress_ext_cnt;</div><div class='ctx'> 	int i, cold_count, hot_count;</div><div class='ctx'> </div><div class='del'>-	if (!f2fs_sb_has_compression(sbi) ||</div><div class='del'>-			F2FS_I(inode)-&gt;i_flags &amp; F2FS_NOCOMP_FL ||</div><div class='del'>-			!f2fs_may_compress(inode) ||</div><div class='del'>-			(!ext_cnt &amp;&amp; !noext_cnt))</div><div class='add'>+	if (!f2fs_sb_has_compression(sbi))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;sbi-&gt;sb_lock);</div><div class='add'>+	if (S_ISDIR(inode-&gt;i_mode))</div><div class='add'>+		goto inherit_comp;</div><div class='ctx'> </div><div class='add'>+	/* This name comes only from normal files. */</div><div class='add'>+	if (!name)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/* Don't compress hot files. */</div><div class='add'>+	f2fs_down_read(&amp;sbi-&gt;sb_lock);</div><div class='ctx'> 	cold_count = le32_to_cpu(sbi-&gt;raw_super-&gt;extension_count);</div><div class='ctx'> 	hot_count = sbi-&gt;raw_super-&gt;hot_ext_count;</div><div class='add'>+	for (i = cold_count; i &lt; cold_count + hot_count; i++)</div><div class='add'>+		if (is_temperature_extension(name, extlist[i]))</div><div class='add'>+			break;</div><div class='add'>+	f2fs_up_read(&amp;sbi-&gt;sb_lock);</div><div class='add'>+	if (i &lt; (cold_count + hot_count))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	for (i = cold_count; i &lt; cold_count + hot_count; i++) {</div><div class='del'>-		if (is_extension_exist(name, extlist[i], false)) {</div><div class='del'>-			up_read(&amp;sbi-&gt;sb_lock);</div><div class='add'>+	/* Don't compress unallowed extension. */</div><div class='add'>+	for (i = 0; i &lt; noext_cnt; i++)</div><div class='add'>+		if (is_compress_extension(name, noext[i]))</div><div class='ctx'> 			return;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	up_read(&amp;sbi-&gt;sb_lock);</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; noext_cnt; i++) {</div><div class='del'>-		if (is_extension_exist(name, noext[i], false)) {</div><div class='del'>-			f2fs_disable_compressed_file(inode);</div><div class='add'>+	/* Compress wanting extension. */</div><div class='add'>+	for (i = 0; i &lt; ext_cnt; i++) {</div><div class='add'>+		if (is_compress_extension(name, ext[i])) {</div><div class='add'>+			set_compress_context(inode);</div><div class='ctx'> 			return;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='add'>+inherit_comp:</div><div class='add'>+	/* Inherit the {no-}compression flag in directory */</div><div class='add'>+	if (F2FS_I(dir)-&gt;i_flags &amp; F2FS_NOCOMP_FL) {</div><div class='add'>+		F2FS_I(inode)-&gt;i_flags |= F2FS_NOCOMP_FL;</div><div class='add'>+		f2fs_mark_inode_dirty_sync(inode, true);</div><div class='add'>+	} else if (F2FS_I(dir)-&gt;i_flags &amp; F2FS_COMPR_FL) {</div><div class='add'>+		set_compress_context(inode);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if (is_inode_flag_set(inode, FI_COMPRESSED_FILE))</div><div class='del'>-		return;</div><div class='add'>+/*</div><div class='add'>+ * Set file's temperature for hot/cold data separation</div><div class='add'>+ */</div><div class='add'>+static void set_file_temperature(struct f2fs_sb_info *sbi, struct inode *inode,</div><div class='add'>+		const unsigned char *name)</div><div class='add'>+{</div><div class='add'>+	__u8 (*extlist)[F2FS_EXTENSION_LEN] = sbi-&gt;raw_super-&gt;extension_list;</div><div class='add'>+	int i, cold_count, hot_count;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; ext_cnt; i++) {</div><div class='del'>-		if (!is_extension_exist(name, ext[i], false))</div><div class='del'>-			continue;</div><div class='add'>+	f2fs_down_read(&amp;sbi-&gt;sb_lock);</div><div class='add'>+	cold_count = le32_to_cpu(sbi-&gt;raw_super-&gt;extension_count);</div><div class='add'>+	hot_count = sbi-&gt;raw_super-&gt;hot_ext_count;</div><div class='add'>+	for (i = 0; i &lt; cold_count + hot_count; i++)</div><div class='add'>+		if (is_temperature_extension(name, extlist[i]))</div><div class='add'>+			break;</div><div class='add'>+	f2fs_up_read(&amp;sbi-&gt;sb_lock);</div><div class='ctx'> </div><div class='del'>-		set_compress_context(inode);</div><div class='add'>+	if (i == cold_count + hot_count)</div><div class='ctx'> 		return;</div><div class='add'>+</div><div class='add'>+	if (i &lt; cold_count)</div><div class='add'>+		file_set_cold(inode);</div><div class='add'>+	else</div><div class='add'>+		file_set_hot(inode);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct inode *f2fs_new_inode(struct mnt_idmap *idmap,</div><div class='add'>+						struct inode *dir, umode_t mode,</div><div class='add'>+						const char *name)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(dir);</div><div class='add'>+	struct f2fs_inode_info *fi;</div><div class='add'>+	nid_t ino;</div><div class='add'>+	struct inode *inode;</div><div class='add'>+	bool nid_free = false;</div><div class='add'>+	bool encrypt = false;</div><div class='add'>+	int xattr_size = 0;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	inode = new_inode(dir-&gt;i_sb);</div><div class='add'>+	if (!inode)</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+</div><div class='add'>+	if (!f2fs_alloc_nid(sbi, &amp;ino)) {</div><div class='add'>+		err = -ENOSPC;</div><div class='add'>+		goto fail;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	nid_free = true;</div><div class='add'>+</div><div class='add'>+	inode_init_owner(idmap, inode, dir, mode);</div><div class='add'>+</div><div class='add'>+	fi = F2FS_I(inode);</div><div class='add'>+	inode-&gt;i_ino = ino;</div><div class='add'>+	inode-&gt;i_blocks = 0;</div><div class='add'>+	simple_inode_init_ts(inode);</div><div class='add'>+	fi-&gt;i_crtime = inode_get_mtime(inode);</div><div class='add'>+	inode-&gt;i_generation = get_random_u32();</div><div class='add'>+</div><div class='add'>+	if (S_ISDIR(inode-&gt;i_mode))</div><div class='add'>+		fi-&gt;i_current_depth = 1;</div><div class='add'>+</div><div class='add'>+	err = insert_inode_locked(inode);</div><div class='add'>+	if (err) {</div><div class='add'>+		err = -EINVAL;</div><div class='add'>+		goto fail;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	if (f2fs_sb_has_project_quota(sbi) &amp;&amp;</div><div class='add'>+		(F2FS_I(dir)-&gt;i_flags &amp; F2FS_PROJINHERIT_FL))</div><div class='add'>+		fi-&gt;i_projid = F2FS_I(dir)-&gt;i_projid;</div><div class='add'>+	else</div><div class='add'>+		fi-&gt;i_projid = make_kprojid(&amp;init_user_ns,</div><div class='add'>+							F2FS_DEF_PROJID);</div><div class='add'>+</div><div class='add'>+	err = fscrypt_prepare_new_inode(dir, inode, &amp;encrypt);</div><div class='add'>+	if (err)</div><div class='add'>+		goto fail_drop;</div><div class='add'>+</div><div class='add'>+	err = f2fs_dquot_initialize(inode);</div><div class='add'>+	if (err)</div><div class='add'>+		goto fail_drop;</div><div class='add'>+</div><div class='add'>+	set_inode_flag(inode, FI_NEW_INODE);</div><div class='add'>+</div><div class='add'>+	if (encrypt)</div><div class='add'>+		f2fs_set_encrypted_inode(inode);</div><div class='add'>+</div><div class='add'>+	if (f2fs_sb_has_extra_attr(sbi)) {</div><div class='add'>+		set_inode_flag(inode, FI_EXTRA_ATTR);</div><div class='add'>+		fi-&gt;i_extra_isize = F2FS_TOTAL_EXTRA_ATTR_SIZE;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (test_opt(sbi, INLINE_XATTR))</div><div class='add'>+		set_inode_flag(inode, FI_INLINE_XATTR);</div><div class='add'>+</div><div class='add'>+	if (f2fs_may_inline_dentry(inode))</div><div class='add'>+		set_inode_flag(inode, FI_INLINE_DENTRY);</div><div class='add'>+</div><div class='add'>+	if (f2fs_sb_has_flexible_inline_xattr(sbi)) {</div><div class='add'>+		f2fs_bug_on(sbi, !f2fs_has_extra_attr(inode));</div><div class='add'>+		if (f2fs_has_inline_xattr(inode))</div><div class='add'>+			xattr_size = F2FS_OPTION(sbi).inline_xattr_size;</div><div class='add'>+		/* Otherwise, will be 0 */</div><div class='add'>+	} else if (f2fs_has_inline_xattr(inode) ||</div><div class='add'>+				f2fs_has_inline_dentry(inode)) {</div><div class='add'>+		xattr_size = DEFAULT_INLINE_XATTR_ADDRS;</div><div class='add'>+	}</div><div class='add'>+	fi-&gt;i_inline_xattr_size = xattr_size;</div><div class='add'>+</div><div class='add'>+	fi-&gt;i_flags =</div><div class='add'>+		f2fs_mask_flags(mode, F2FS_I(dir)-&gt;i_flags &amp; F2FS_FL_INHERITED);</div><div class='add'>+</div><div class='add'>+	if (S_ISDIR(inode-&gt;i_mode))</div><div class='add'>+		fi-&gt;i_flags |= F2FS_INDEX_FL;</div><div class='add'>+</div><div class='add'>+	if (fi-&gt;i_flags &amp; F2FS_PROJINHERIT_FL)</div><div class='add'>+		set_inode_flag(inode, FI_PROJ_INHERIT);</div><div class='add'>+</div><div class='add'>+	/* Check compression first. */</div><div class='add'>+	set_compress_new_inode(sbi, dir, inode, name);</div><div class='add'>+</div><div class='add'>+	/* Should enable inline_data after compression set */</div><div class='add'>+	if (test_opt(sbi, INLINE_DATA) &amp;&amp; f2fs_may_inline_data(inode))</div><div class='add'>+		set_inode_flag(inode, FI_INLINE_DATA);</div><div class='add'>+</div><div class='add'>+	if (name &amp;&amp; !test_opt(sbi, DISABLE_EXT_IDENTIFY))</div><div class='add'>+		set_file_temperature(sbi, inode, name);</div><div class='add'>+</div><div class='add'>+	stat_inc_inline_xattr(inode);</div><div class='add'>+	stat_inc_inline_inode(inode);</div><div class='add'>+	stat_inc_inline_dir(inode);</div><div class='add'>+</div><div class='add'>+	f2fs_set_inode_flags(inode);</div><div class='add'>+</div><div class='add'>+	f2fs_init_extent_tree(inode);</div><div class='add'>+</div><div class='add'>+	trace_f2fs_new_inode(inode, 0);</div><div class='add'>+	return inode;</div><div class='add'>+</div><div class='add'>+fail:</div><div class='add'>+	trace_f2fs_new_inode(inode, err);</div><div class='add'>+	make_bad_inode(inode);</div><div class='add'>+	if (nid_free)</div><div class='add'>+		set_inode_flag(inode, FI_FREE_NID);</div><div class='add'>+	iput(inode);</div><div class='add'>+	return ERR_PTR(err);</div><div class='add'>+fail_drop:</div><div class='add'>+	trace_f2fs_new_inode(inode, err);</div><div class='add'>+	dquot_drop(inode);</div><div class='add'>+	inode-&gt;i_flags |= S_NOQUOTA;</div><div class='add'>+	make_bad_inode(inode);</div><div class='add'>+	if (nid_free)</div><div class='add'>+		set_inode_flag(inode, FI_FREE_NID);</div><div class='add'>+	clear_nlink(inode);</div><div class='add'>+	unlock_new_inode(inode);</div><div class='add'>+	iput(inode);</div><div class='add'>+	return ERR_PTR(err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int f2fs_create(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		       struct dentry *dentry, umode_t mode, bool excl)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(dir);</div><div class='hunk'>@@ -349,15 +367,10 @@ static int f2fs_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	inode = f2fs_new_inode(dir, mode);</div><div class='add'>+	inode = f2fs_new_inode(idmap, dir, mode, dentry-&gt;d_name.name);</div><div class='ctx'> 	if (IS_ERR(inode))</div><div class='ctx'> 		return PTR_ERR(inode);</div><div class='ctx'> </div><div class='del'>-	if (!test_opt(sbi, DISABLE_EXT_IDENTIFY))</div><div class='del'>-		set_file_temperature(sbi, inode, dentry-&gt;d_name.name);</div><div class='del'>-</div><div class='del'>-	set_compress_inode(sbi, inode, dentry-&gt;d_name.name);</div><div class='del'>-</div><div class='ctx'> 	inode-&gt;i_op = &amp;f2fs_file_inode_operations;</div><div class='ctx'> 	inode-&gt;i_fop = &amp;f2fs_file_operations;</div><div class='ctx'> 	inode-&gt;i_mapping-&gt;a_ops = &amp;f2fs_dblock_aops;</div><div class='hunk'>@@ -401,7 +414,7 @@ static int f2fs_link(struct dentry *old_dentry, struct inode *dir,</div><div class='ctx'> </div><div class='ctx'> 	if (is_inode_flag_set(dir, FI_PROJ_INHERIT) &amp;&amp;</div><div class='ctx'> 			(!projid_eq(F2FS_I(dir)-&gt;i_projid,</div><div class='del'>-			F2FS_I(old_dentry-&gt;d_inode)-&gt;i_projid)))</div><div class='add'>+			F2FS_I(inode)-&gt;i_projid)))</div><div class='ctx'> 		return -EXDEV;</div><div class='ctx'> </div><div class='ctx'> 	err = f2fs_dquot_initialize(dir);</div><div class='hunk'>@@ -410,7 +423,7 @@ static int f2fs_link(struct dentry *old_dentry, struct inode *dir,</div><div class='ctx'> </div><div class='ctx'> 	f2fs_balance_fs(sbi, true);</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> 	ihold(inode);</div><div class='ctx'> </div><div class='ctx'> 	set_inode_flag(inode, FI_INC_LINK);</div><div class='hunk'>@@ -434,77 +447,26 @@ out:</div><div class='ctx'> </div><div class='ctx'> struct dentry *f2fs_get_parent(struct dentry *child)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='del'>-	unsigned long ino = f2fs_inode_by_name(d_inode(child), &amp;dotdot_name, &amp;page);</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	unsigned long ino = f2fs_inode_by_name(d_inode(child), &amp;dotdot_name, &amp;folio);</div><div class='ctx'> </div><div class='ctx'> 	if (!ino) {</div><div class='del'>-		if (IS_ERR(page))</div><div class='del'>-			return ERR_CAST(page);</div><div class='add'>+		if (IS_ERR(folio))</div><div class='add'>+			return ERR_CAST(folio);</div><div class='ctx'> 		return ERR_PTR(-ENOENT);</div><div class='ctx'> 	}</div><div class='ctx'> 	return d_obtain_alias(f2fs_iget(child-&gt;d_sb, ino));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __recover_dot_dentries(struct inode *dir, nid_t pino)</div><div class='del'>-{</div><div class='del'>-	struct f2fs_sb_info *sbi = F2FS_I_SB(dir);</div><div class='del'>-	struct qstr dot = QSTR_INIT(".", 1);</div><div class='del'>-	struct qstr dotdot = QSTR_INIT("..", 2);</div><div class='del'>-	struct f2fs_dir_entry *de;</div><div class='del'>-	struct page *page;</div><div class='del'>-	int err = 0;</div><div class='del'>-</div><div class='del'>-	if (f2fs_readonly(sbi-&gt;sb)) {</div><div class='del'>-		f2fs_info(sbi, "skip recovering inline_dots inode (ino:%lu, pino:%u) in readonly mountpoint",</div><div class='del'>-			  dir-&gt;i_ino, pino);</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	err = f2fs_dquot_initialize(dir);</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='del'>-</div><div class='del'>-	f2fs_balance_fs(sbi, true);</div><div class='del'>-</div><div class='del'>-	f2fs_lock_op(sbi);</div><div class='del'>-</div><div class='del'>-	de = f2fs_find_entry(dir, &amp;dot, &amp;page);</div><div class='del'>-	if (de) {</div><div class='del'>-		f2fs_put_page(page, 0);</div><div class='del'>-	} else if (IS_ERR(page)) {</div><div class='del'>-		err = PTR_ERR(page);</div><div class='del'>-		goto out;</div><div class='del'>-	} else {</div><div class='del'>-		err = f2fs_do_add_link(dir, &amp;dot, NULL, dir-&gt;i_ino, S_IFDIR);</div><div class='del'>-		if (err)</div><div class='del'>-			goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	de = f2fs_find_entry(dir, &amp;dotdot, &amp;page);</div><div class='del'>-	if (de)</div><div class='del'>-		f2fs_put_page(page, 0);</div><div class='del'>-	else if (IS_ERR(page))</div><div class='del'>-		err = PTR_ERR(page);</div><div class='del'>-	else</div><div class='del'>-		err = f2fs_do_add_link(dir, &amp;dotdot, NULL, pino, S_IFDIR);</div><div class='del'>-out:</div><div class='del'>-	if (!err)</div><div class='del'>-		clear_inode_flag(dir, FI_INLINE_DOTS);</div><div class='del'>-</div><div class='del'>-	f2fs_unlock_op(sbi);</div><div class='del'>-	return err;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static struct dentry *f2fs_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 		unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = NULL;</div><div class='ctx'> 	struct f2fs_dir_entry *de;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	struct dentry *new;</div><div class='ctx'> 	nid_t ino = -1;</div><div class='ctx'> 	int err = 0;</div><div class='del'>-	unsigned int root_ino = F2FS_ROOT_INO(F2FS_I_SB(dir));</div><div class='ctx'> 	struct f2fs_filename fname;</div><div class='ctx'> </div><div class='ctx'> 	trace_f2fs_lookup_start(dir, dentry, flags);</div><div class='hunk'>@@ -515,17 +477,16 @@ static struct dentry *f2fs_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	err = f2fs_prepare_lookup(dir, dentry, &amp;fname);</div><div class='del'>-	generic_set_encrypted_ci_d_ops(dentry);</div><div class='ctx'> 	if (err == -ENOENT)</div><div class='ctx'> 		goto out_splice;</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='del'>-	de = __f2fs_find_entry(dir, &amp;fname, &amp;page);</div><div class='add'>+	de = __f2fs_find_entry(dir, &amp;fname, &amp;folio);</div><div class='ctx'> 	f2fs_free_filename(&amp;fname);</div><div class='ctx'> </div><div class='ctx'> 	if (!de) {</div><div class='del'>-		if (IS_ERR(page)) {</div><div class='del'>-			err = PTR_ERR(page);</div><div class='add'>+		if (IS_ERR(folio)) {</div><div class='add'>+			err = PTR_ERR(folio);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 		err = -ENOENT;</div><div class='hunk'>@@ -533,7 +494,7 @@ static struct dentry *f2fs_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ino = le32_to_cpu(de-&gt;ino);</div><div class='del'>-	f2fs_put_page(page, 0);</div><div class='add'>+	f2fs_folio_put(folio, false);</div><div class='ctx'> </div><div class='ctx'> 	inode = f2fs_iget(dir-&gt;i_sb, ino);</div><div class='ctx'> 	if (IS_ERR(inode)) {</div><div class='hunk'>@@ -541,17 +502,14 @@ static struct dentry *f2fs_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if ((dir-&gt;i_ino == root_ino) &amp;&amp; f2fs_has_inline_dots(dir)) {</div><div class='del'>-		err = __recover_dot_dentries(dir, root_ino);</div><div class='del'>-		if (err)</div><div class='del'>-			goto out_iput;</div><div class='add'>+	if (inode-&gt;i_nlink == 0) {</div><div class='add'>+		f2fs_warn(F2FS_I_SB(inode), "%s: inode (ino=%lx) has zero i_nlink",</div><div class='add'>+			  __func__, inode-&gt;i_ino);</div><div class='add'>+		err = -EFSCORRUPTED;</div><div class='add'>+		set_sbi_flag(F2FS_I_SB(inode), SBI_NEED_FSCK);</div><div class='add'>+		goto out_iput;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (f2fs_has_inline_dots(inode)) {</div><div class='del'>-		err = __recover_dot_dentries(inode, dir-&gt;i_ino);</div><div class='del'>-		if (err)</div><div class='del'>-			goto out_iput;</div><div class='del'>-	}</div><div class='ctx'> 	if (IS_ENCRYPTED(dir) &amp;&amp;</div><div class='ctx'> 	    (S_ISDIR(inode-&gt;i_mode) || S_ISLNK(inode-&gt;i_mode)) &amp;&amp;</div><div class='ctx'> 	    !fscrypt_has_permitted_context(dir, inode)) {</div><div class='hunk'>@@ -561,8 +519,7 @@ static struct dentry *f2fs_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 		goto out_iput;</div><div class='ctx'> 	}</div><div class='ctx'> out_splice:</div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='del'>-	if (!inode &amp;&amp; IS_CASEFOLDED(dir)) {</div><div class='add'>+	if (IS_ENABLED(CONFIG_UNICODE) &amp;&amp; !inode &amp;&amp; IS_CASEFOLDED(dir)) {</div><div class='ctx'> 		/* Eventually we want to call d_add_ci(dentry, NULL)</div><div class='ctx'> 		 * for negative dentries in the encoding case as</div><div class='ctx'> 		 * well.  For now, prevent the negative dentry</div><div class='hunk'>@@ -571,10 +528,10 @@ out_splice:</div><div class='ctx'> 		trace_f2fs_lookup_end(dir, dentry, ino, err);</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	}</div><div class='del'>-#endif</div><div class='add'>+</div><div class='ctx'> 	new = d_splice_alias(inode, dentry);</div><div class='del'>-	err = PTR_ERR_OR_ZERO(new);</div><div class='del'>-	trace_f2fs_lookup_end(dir, dentry, ino, !new ? -ENOENT : err);</div><div class='add'>+	trace_f2fs_lookup_end(dir, !IS_ERR_OR_NULL(new) ? new : dentry,</div><div class='add'>+				ino, IS_ERR(new) ? PTR_ERR(new) : err);</div><div class='ctx'> 	return new;</div><div class='ctx'> out_iput:</div><div class='ctx'> 	iput(inode);</div><div class='hunk'>@@ -588,28 +545,38 @@ static int f2fs_unlink(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(dir);</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	struct f2fs_dir_entry *de;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	trace_f2fs_unlink_enter(dir, dentry);</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(f2fs_cp_error(sbi))) {</div><div class='ctx'> 		err = -EIO;</div><div class='del'>-		goto fail;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	err = f2fs_dquot_initialize(dir);</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto fail;</div><div class='add'>+		goto out;</div><div class='ctx'> 	err = f2fs_dquot_initialize(inode);</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto fail;</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='del'>-	de = f2fs_find_entry(dir, &amp;dentry-&gt;d_name, &amp;page);</div><div class='add'>+	de = f2fs_find_entry(dir, &amp;dentry-&gt;d_name, &amp;folio);</div><div class='ctx'> 	if (!de) {</div><div class='del'>-		if (IS_ERR(page))</div><div class='del'>-			err = PTR_ERR(page);</div><div class='del'>-		goto fail;</div><div class='add'>+		if (IS_ERR(folio))</div><div class='add'>+			err = PTR_ERR(folio);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (unlikely(inode-&gt;i_nlink == 0)) {</div><div class='add'>+		f2fs_warn(sbi, "%s: inode (ino=%lx) has zero i_nlink",</div><div class='add'>+			  __func__, inode-&gt;i_ino);</div><div class='add'>+		goto corrupted;</div><div class='add'>+	} else if (S_ISDIR(inode-&gt;i_mode) &amp;&amp; unlikely(inode-&gt;i_nlink == 1)) {</div><div class='add'>+		f2fs_warn(sbi, "%s: directory inode (ino=%lx) has a single i_nlink",</div><div class='add'>+			  __func__, inode-&gt;i_ino);</div><div class='add'>+		goto corrupted;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	f2fs_balance_fs(sbi, true);</div><div class='hunk'>@@ -618,25 +585,30 @@ static int f2fs_unlink(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	err = f2fs_acquire_orphan_inode(sbi);</div><div class='ctx'> 	if (err) {</div><div class='ctx'> 		f2fs_unlock_op(sbi);</div><div class='del'>-		f2fs_put_page(page, 0);</div><div class='del'>-		goto fail;</div><div class='add'>+		f2fs_folio_put(folio, false);</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	f2fs_delete_entry(de, page, dir, inode);</div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='add'>+	f2fs_delete_entry(de, folio, dir, inode);</div><div class='add'>+	f2fs_unlock_op(sbi);</div><div class='add'>+</div><div class='ctx'> 	/* VFS negative dentries are incompatible with Encoding and</div><div class='ctx'> 	 * Case-insensitiveness. Eventually we'll want avoid</div><div class='ctx'> 	 * invalidating the dentries here, alongside with returning the</div><div class='ctx'> 	 * negative dentries at f2fs_lookup(), when it is better</div><div class='ctx'> 	 * supported by the VFS for the CI case.</div><div class='ctx'> 	 */</div><div class='del'>-	if (IS_CASEFOLDED(dir))</div><div class='add'>+	if (IS_ENABLED(CONFIG_UNICODE) &amp;&amp; IS_CASEFOLDED(dir))</div><div class='ctx'> 		d_invalidate(dentry);</div><div class='del'>-#endif</div><div class='del'>-	f2fs_unlock_op(sbi);</div><div class='ctx'> </div><div class='ctx'> 	if (IS_DIRSYNC(dir))</div><div class='ctx'> 		f2fs_sync_fs(sbi-&gt;sb, 1);</div><div class='del'>-fail:</div><div class='add'>+</div><div class='add'>+	goto out;</div><div class='add'>+corrupted:</div><div class='add'>+	err = -EFSCORRUPTED;</div><div class='add'>+	set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='add'>+	f2fs_folio_put(folio, false);</div><div class='add'>+out:</div><div class='ctx'> 	trace_f2fs_unlink_exit(inode, err);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='hunk'>@@ -656,7 +628,7 @@ static const char *f2fs_get_link(struct dentry *dentry,</div><div class='ctx'> 	return link;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int f2fs_symlink(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 			struct dentry *dentry, const char *symname)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(dir);</div><div class='hunk'>@@ -679,7 +651,7 @@ static int f2fs_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	inode = f2fs_new_inode(dir, S_IFLNK | S_IRWXUGO);</div><div class='add'>+	inode = f2fs_new_inode(idmap, dir, S_IFLNK | S_IRWXUGO, NULL);</div><div class='ctx'> 	if (IS_ERR(inode))</div><div class='ctx'> 		return PTR_ERR(inode);</div><div class='ctx'> </div><div class='hunk'>@@ -736,23 +708,23 @@ out_free_encrypted_link:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-		      struct dentry *dentry, umode_t mode)</div><div class='add'>+static struct dentry *f2fs_mkdir(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+				 struct dentry *dentry, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(dir);</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(f2fs_cp_error(sbi)))</div><div class='del'>-		return -EIO;</div><div class='add'>+		return ERR_PTR(-EIO);</div><div class='ctx'> </div><div class='ctx'> 	err = f2fs_dquot_initialize(dir);</div><div class='ctx'> 	if (err)</div><div class='del'>-		return err;</div><div class='add'>+		return ERR_PTR(err);</div><div class='ctx'> </div><div class='del'>-	inode = f2fs_new_inode(dir, S_IFDIR | mode);</div><div class='add'>+	inode = f2fs_new_inode(idmap, dir, S_IFDIR | mode, NULL);</div><div class='ctx'> 	if (IS_ERR(inode))</div><div class='del'>-		return PTR_ERR(inode);</div><div class='add'>+		return ERR_CAST(inode);</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_op = &amp;f2fs_dir_inode_operations;</div><div class='ctx'> 	inode-&gt;i_fop = &amp;f2fs_dir_operations;</div><div class='hunk'>@@ -774,12 +746,12 @@ static int f2fs_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 		f2fs_sync_fs(sbi-&gt;sb, 1);</div><div class='ctx'> </div><div class='ctx'> 	f2fs_balance_fs(sbi, true);</div><div class='del'>-	return 0;</div><div class='add'>+	return NULL;</div><div class='ctx'> </div><div class='ctx'> out_fail:</div><div class='ctx'> 	clear_inode_flag(inode, FI_INC_LINK);</div><div class='ctx'> 	f2fs_handle_failed_inode(inode);</div><div class='del'>-	return err;</div><div class='add'>+	return ERR_PTR(err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int f2fs_rmdir(struct inode *dir, struct dentry *dentry)</div><div class='hunk'>@@ -791,7 +763,7 @@ static int f2fs_rmdir(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	return -ENOTEMPTY;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_mknod(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int f2fs_mknod(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		      struct dentry *dentry, umode_t mode, dev_t rdev)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(dir);</div><div class='hunk'>@@ -807,7 +779,7 @@ static int f2fs_mknod(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	inode = f2fs_new_inode(dir, mode);</div><div class='add'>+	inode = f2fs_new_inode(idmap, dir, mode, NULL);</div><div class='ctx'> 	if (IS_ERR(inode))</div><div class='ctx'> 		return PTR_ERR(inode);</div><div class='ctx'> </div><div class='hunk'>@@ -834,8 +806,9 @@ out:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __f2fs_tmpfile(struct inode *dir, struct dentry *dentry,</div><div class='del'>-					umode_t mode, struct inode **whiteout)</div><div class='add'>+static int __f2fs_tmpfile(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+			  struct file *file, umode_t mode, bool is_whiteout,</div><div class='add'>+			  struct inode **new_inode, struct f2fs_filename *fname)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(dir);</div><div class='ctx'> 	struct inode *inode;</div><div class='hunk'>@@ -845,11 +818,11 @@ static int __f2fs_tmpfile(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	inode = f2fs_new_inode(dir, mode);</div><div class='add'>+	inode = f2fs_new_inode(idmap, dir, mode, NULL);</div><div class='ctx'> 	if (IS_ERR(inode))</div><div class='ctx'> 		return PTR_ERR(inode);</div><div class='ctx'> </div><div class='del'>-	if (whiteout) {</div><div class='add'>+	if (is_whiteout) {</div><div class='ctx'> 		init_special_inode(inode, inode-&gt;i_mode, WHITEOUT_DEV);</div><div class='ctx'> 		inode-&gt;i_op = &amp;f2fs_special_inode_operations;</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -863,7 +836,7 @@ static int __f2fs_tmpfile(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	err = f2fs_do_tmpfile(inode, dir);</div><div class='add'>+	err = f2fs_do_tmpfile(inode, dir, fname);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto release_out;</div><div class='ctx'> </div><div class='hunk'>@@ -874,21 +847,25 @@ static int __f2fs_tmpfile(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	f2fs_add_orphan_inode(inode);</div><div class='ctx'> 	f2fs_alloc_nid_done(sbi, inode-&gt;i_ino);</div><div class='ctx'> </div><div class='del'>-	if (whiteout) {</div><div class='add'>+	if (is_whiteout) {</div><div class='ctx'> 		f2fs_i_links_write(inode, false);</div><div class='ctx'> </div><div class='ctx'> 		spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-		inode-&gt;i_state |= I_LINKABLE;</div><div class='add'>+		inode_state_set(inode, I_LINKABLE);</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='del'>-</div><div class='del'>-		*whiteout = inode;</div><div class='ctx'> 	} else {</div><div class='del'>-		d_tmpfile(dentry, inode);</div><div class='add'>+		if (file)</div><div class='add'>+			d_tmpfile(file, inode);</div><div class='add'>+		else</div><div class='add'>+			f2fs_i_links_write(inode, false);</div><div class='ctx'> 	}</div><div class='ctx'> 	/* link_count was changed by d_tmpfile as well. */</div><div class='ctx'> 	f2fs_unlock_op(sbi);</div><div class='ctx'> 	unlock_new_inode(inode);</div><div class='ctx'> </div><div class='add'>+	if (new_inode)</div><div class='add'>+		*new_inode = inode;</div><div class='add'>+</div><div class='ctx'> 	f2fs_balance_fs(sbi, true);</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='hunk'>@@ -899,40 +876,51 @@ out:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_tmpfile(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-			struct dentry *dentry, umode_t mode)</div><div class='add'>+static int f2fs_tmpfile(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+			struct file *file, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(dir);</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(f2fs_cp_error(sbi)))</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	if (!f2fs_is_checkpoint_ready(sbi))</div><div class='ctx'> 		return -ENOSPC;</div><div class='ctx'> </div><div class='del'>-	return __f2fs_tmpfile(dir, dentry, mode, NULL);</div><div class='add'>+	err = __f2fs_tmpfile(idmap, dir, file, mode, false, NULL, NULL);</div><div class='add'>+</div><div class='add'>+	return finish_open_simple(file, err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_create_whiteout(struct inode *dir, struct inode **whiteout)</div><div class='add'>+static int f2fs_create_whiteout(struct mnt_idmap *idmap,</div><div class='add'>+				struct inode *dir, struct inode **whiteout,</div><div class='add'>+				struct f2fs_filename *fname)</div><div class='ctx'> {</div><div class='del'>-	if (unlikely(f2fs_cp_error(F2FS_I_SB(dir))))</div><div class='del'>-		return -EIO;</div><div class='add'>+	return __f2fs_tmpfile(idmap, dir, NULL, S_IFCHR | WHITEOUT_MODE,</div><div class='add'>+						true, whiteout, fname);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	return __f2fs_tmpfile(dir, NULL, S_IFCHR | WHITEOUT_MODE, whiteout);</div><div class='add'>+int f2fs_get_tmpfile(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+		     struct inode **new_inode)</div><div class='add'>+{</div><div class='add'>+	return __f2fs_tmpfile(idmap, dir, NULL, S_IFREG,</div><div class='add'>+				false, new_inode, NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_rename(struct inode *old_dir, struct dentry *old_dentry,</div><div class='del'>-			struct inode *new_dir, struct dentry *new_dentry,</div><div class='del'>-			unsigned int flags)</div><div class='add'>+static int f2fs_rename(struct mnt_idmap *idmap, struct inode *old_dir,</div><div class='add'>+			struct dentry *old_dentry, struct inode *new_dir,</div><div class='add'>+			struct dentry *new_dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(old_dir);</div><div class='ctx'> 	struct inode *old_inode = d_inode(old_dentry);</div><div class='ctx'> 	struct inode *new_inode = d_inode(new_dentry);</div><div class='ctx'> 	struct inode *whiteout = NULL;</div><div class='del'>-	struct page *old_dir_page = NULL;</div><div class='del'>-	struct page *old_page, *new_page = NULL;</div><div class='add'>+	struct folio *old_dir_folio = NULL;</div><div class='add'>+	struct folio *old_folio, *new_folio = NULL;</div><div class='ctx'> 	struct f2fs_dir_entry *old_dir_entry = NULL;</div><div class='ctx'> 	struct f2fs_dir_entry *old_entry;</div><div class='ctx'> 	struct f2fs_dir_entry *new_entry;</div><div class='add'>+	bool old_is_dir = S_ISDIR(old_inode-&gt;i_mode);</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(f2fs_cp_error(sbi)))</div><div class='hunk'>@@ -942,12 +930,12 @@ static int f2fs_rename(struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> </div><div class='ctx'> 	if (is_inode_flag_set(new_dir, FI_PROJ_INHERIT) &amp;&amp;</div><div class='ctx'> 			(!projid_eq(F2FS_I(new_dir)-&gt;i_projid,</div><div class='del'>-			F2FS_I(old_dentry-&gt;d_inode)-&gt;i_projid)))</div><div class='add'>+			F2FS_I(old_inode)-&gt;i_projid)))</div><div class='ctx'> 		return -EXDEV;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If new_inode is null, the below renaming flow will</div><div class='del'>-	 * add a link in old_dir which can conver inline_dir.</div><div class='add'>+	 * add a link in old_dir which can convert inline_dir.</div><div class='ctx'> 	 * After then, if we failed to get the entry due to other</div><div class='ctx'> 	 * reasons like ENOMEM, we had to remove the new entry.</div><div class='ctx'> 	 * Instead of adding such the error handling routine, let's</div><div class='hunk'>@@ -960,7 +948,14 @@ static int f2fs_rename(struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; RENAME_WHITEOUT) {</div><div class='del'>-		err = f2fs_create_whiteout(old_dir, &amp;whiteout);</div><div class='add'>+		struct f2fs_filename fname;</div><div class='add'>+</div><div class='add'>+		err = f2fs_setup_filename(old_dir, &amp;old_dentry-&gt;d_name,</div><div class='add'>+							0, &amp;fname);</div><div class='add'>+		if (err)</div><div class='add'>+			return err;</div><div class='add'>+</div><div class='add'>+		err = f2fs_create_whiteout(idmap, old_dir, &amp;whiteout, &amp;fname);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			return err;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -980,18 +975,18 @@ static int f2fs_rename(struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	err = -ENOENT;</div><div class='del'>-	old_entry = f2fs_find_entry(old_dir, &amp;old_dentry-&gt;d_name, &amp;old_page);</div><div class='add'>+	old_entry = f2fs_find_entry(old_dir, &amp;old_dentry-&gt;d_name, &amp;old_folio);</div><div class='ctx'> 	if (!old_entry) {</div><div class='del'>-		if (IS_ERR(old_page))</div><div class='del'>-			err = PTR_ERR(old_page);</div><div class='add'>+		if (IS_ERR(old_folio))</div><div class='add'>+			err = PTR_ERR(old_folio);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (S_ISDIR(old_inode-&gt;i_mode)) {</div><div class='del'>-		old_dir_entry = f2fs_parent_dir(old_inode, &amp;old_dir_page);</div><div class='add'>+	if (old_is_dir &amp;&amp; old_dir != new_dir) {</div><div class='add'>+		old_dir_entry = f2fs_parent_dir(old_inode, &amp;old_dir_folio);</div><div class='ctx'> 		if (!old_dir_entry) {</div><div class='del'>-			if (IS_ERR(old_dir_page))</div><div class='del'>-				err = PTR_ERR(old_dir_page);</div><div class='add'>+			if (IS_ERR(old_dir_folio))</div><div class='add'>+				err = PTR_ERR(old_dir_folio);</div><div class='ctx'> 			goto out_old;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -999,15 +994,15 @@ static int f2fs_rename(struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> 	if (new_inode) {</div><div class='ctx'> </div><div class='ctx'> 		err = -ENOTEMPTY;</div><div class='del'>-		if (old_dir_entry &amp;&amp; !f2fs_empty_dir(new_inode))</div><div class='add'>+		if (old_is_dir &amp;&amp; !f2fs_empty_dir(new_inode))</div><div class='ctx'> 			goto out_dir;</div><div class='ctx'> </div><div class='ctx'> 		err = -ENOENT;</div><div class='ctx'> 		new_entry = f2fs_find_entry(new_dir, &amp;new_dentry-&gt;d_name,</div><div class='del'>-						&amp;new_page);</div><div class='add'>+						&amp;new_folio);</div><div class='ctx'> 		if (!new_entry) {</div><div class='del'>-			if (IS_ERR(new_page))</div><div class='del'>-				err = PTR_ERR(new_page);</div><div class='add'>+			if (IS_ERR(new_folio))</div><div class='add'>+				err = PTR_ERR(new_folio);</div><div class='ctx'> 			goto out_dir;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -1019,15 +1014,15 @@ static int f2fs_rename(struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto put_out_dir;</div><div class='ctx'> </div><div class='del'>-		f2fs_set_link(new_dir, new_entry, new_page, old_inode);</div><div class='del'>-		new_page = NULL;</div><div class='add'>+		f2fs_set_link(new_dir, new_entry, new_folio, old_inode);</div><div class='add'>+		new_folio = NULL;</div><div class='ctx'> </div><div class='del'>-		new_inode-&gt;i_ctime = current_time(new_inode);</div><div class='del'>-		down_write(&amp;F2FS_I(new_inode)-&gt;i_sem);</div><div class='del'>-		if (old_dir_entry)</div><div class='add'>+		inode_set_ctime_current(new_inode);</div><div class='add'>+		f2fs_down_write(&amp;F2FS_I(new_inode)-&gt;i_sem);</div><div class='add'>+		if (old_is_dir)</div><div class='ctx'> 			f2fs_i_links_write(new_inode, false);</div><div class='ctx'> 		f2fs_i_links_write(new_inode, false);</div><div class='del'>-		up_write(&amp;F2FS_I(new_inode)-&gt;i_sem);</div><div class='add'>+		f2fs_up_write(&amp;F2FS_I(new_inode)-&gt;i_sem);</div><div class='ctx'> </div><div class='ctx'> 		if (!new_inode-&gt;i_nlink)</div><div class='ctx'> 			f2fs_add_orphan_inode(new_inode);</div><div class='hunk'>@@ -1044,45 +1039,44 @@ static int f2fs_rename(struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> 			goto out_dir;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (old_dir_entry)</div><div class='add'>+		if (old_is_dir)</div><div class='ctx'> 			f2fs_i_links_write(new_dir, true);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;F2FS_I(old_inode)-&gt;i_sem);</div><div class='del'>-	if (!old_dir_entry || whiteout)</div><div class='add'>+	f2fs_down_write(&amp;F2FS_I(old_inode)-&gt;i_sem);</div><div class='add'>+	if (!old_is_dir || whiteout)</div><div class='ctx'> 		file_lost_pino(old_inode);</div><div class='ctx'> 	else</div><div class='ctx'> 		/* adjust dir's i_pino to pass fsck check */</div><div class='ctx'> 		f2fs_i_pino_write(old_inode, new_dir-&gt;i_ino);</div><div class='del'>-	up_write(&amp;F2FS_I(old_inode)-&gt;i_sem);</div><div class='add'>+	f2fs_up_write(&amp;F2FS_I(old_inode)-&gt;i_sem);</div><div class='ctx'> </div><div class='del'>-	old_inode-&gt;i_ctime = current_time(old_inode);</div><div class='add'>+	inode_set_ctime_current(old_inode);</div><div class='ctx'> 	f2fs_mark_inode_dirty_sync(old_inode, false);</div><div class='ctx'> </div><div class='del'>-	f2fs_delete_entry(old_entry, old_page, old_dir, NULL);</div><div class='del'>-	old_page = NULL;</div><div class='add'>+	f2fs_delete_entry(old_entry, old_folio, old_dir, NULL);</div><div class='add'>+	old_folio = NULL;</div><div class='ctx'> </div><div class='ctx'> 	if (whiteout) {</div><div class='ctx'> 		set_inode_flag(whiteout, FI_INC_LINK);</div><div class='ctx'> 		err = f2fs_add_link(old_dentry, whiteout);</div><div class='del'>-		if (err)</div><div class='add'>+		if (err) {</div><div class='add'>+			d_invalidate(old_dentry);</div><div class='add'>+			d_invalidate(new_dentry);</div><div class='ctx'> 			goto put_out_dir;</div><div class='del'>-</div><div class='add'>+		}</div><div class='ctx'> 		spin_lock(&amp;whiteout-&gt;i_lock);</div><div class='del'>-		whiteout-&gt;i_state &amp;= ~I_LINKABLE;</div><div class='add'>+		inode_state_clear(whiteout, I_LINKABLE);</div><div class='ctx'> 		spin_unlock(&amp;whiteout-&gt;i_lock);</div><div class='ctx'> </div><div class='ctx'> 		iput(whiteout);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (old_dir_entry) {</div><div class='del'>-		if (old_dir != new_dir &amp;&amp; !whiteout)</div><div class='del'>-			f2fs_set_link(old_inode, old_dir_entry,</div><div class='del'>-						old_dir_page, new_dir);</div><div class='del'>-		else</div><div class='del'>-			f2fs_put_page(old_dir_page, 0);</div><div class='add'>+	if (old_dir_entry)</div><div class='add'>+		f2fs_set_link(old_inode, old_dir_entry, old_dir_folio, new_dir);</div><div class='add'>+	if (old_is_dir)</div><div class='ctx'> 		f2fs_i_links_write(old_dir, false);</div><div class='del'>-	}</div><div class='add'>+</div><div class='ctx'> 	if (F2FS_OPTION(sbi).fsync_mode == FSYNC_MODE_STRICT) {</div><div class='ctx'> 		f2fs_add_ino_entry(sbi, new_dir-&gt;i_ino, TRANS_DIR_INO);</div><div class='ctx'> 		if (S_ISDIR(old_inode-&gt;i_mode))</div><div class='hunk'>@@ -1100,15 +1094,14 @@ static int f2fs_rename(struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> </div><div class='ctx'> put_out_dir:</div><div class='ctx'> 	f2fs_unlock_op(sbi);</div><div class='del'>-	f2fs_put_page(new_page, 0);</div><div class='add'>+	f2fs_folio_put(new_folio, false);</div><div class='ctx'> out_dir:</div><div class='ctx'> 	if (old_dir_entry)</div><div class='del'>-		f2fs_put_page(old_dir_page, 0);</div><div class='add'>+		f2fs_folio_put(old_dir_folio, false);</div><div class='ctx'> out_old:</div><div class='del'>-	f2fs_put_page(old_page, 0);</div><div class='add'>+	f2fs_folio_put(old_folio, false);</div><div class='ctx'> out:</div><div class='del'>-	if (whiteout)</div><div class='del'>-		iput(whiteout);</div><div class='add'>+	iput(whiteout);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1118,8 +1111,8 @@ static int f2fs_cross_rename(struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(old_dir);</div><div class='ctx'> 	struct inode *old_inode = d_inode(old_dentry);</div><div class='ctx'> 	struct inode *new_inode = d_inode(new_dentry);</div><div class='del'>-	struct page *old_dir_page, *new_dir_page;</div><div class='del'>-	struct page *old_page, *new_page;</div><div class='add'>+	struct folio *old_dir_folio, *new_dir_folio;</div><div class='add'>+	struct folio *old_folio, *new_folio;</div><div class='ctx'> 	struct f2fs_dir_entry *old_dir_entry = NULL, *new_dir_entry = NULL;</div><div class='ctx'> 	struct f2fs_dir_entry *old_entry, *new_entry;</div><div class='ctx'> 	int old_nlink = 0, new_nlink = 0;</div><div class='hunk'>@@ -1132,10 +1125,10 @@ static int f2fs_cross_rename(struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> </div><div class='ctx'> 	if ((is_inode_flag_set(new_dir, FI_PROJ_INHERIT) &amp;&amp;</div><div class='ctx'> 			!projid_eq(F2FS_I(new_dir)-&gt;i_projid,</div><div class='del'>-			F2FS_I(old_dentry-&gt;d_inode)-&gt;i_projid)) ||</div><div class='del'>-	    (is_inode_flag_set(new_dir, FI_PROJ_INHERIT) &amp;&amp;</div><div class='add'>+			F2FS_I(old_inode)-&gt;i_projid)) ||</div><div class='add'>+	    (is_inode_flag_set(old_dir, FI_PROJ_INHERIT) &amp;&amp;</div><div class='ctx'> 			!projid_eq(F2FS_I(old_dir)-&gt;i_projid,</div><div class='del'>-			F2FS_I(new_dentry-&gt;d_inode)-&gt;i_projid)))</div><div class='add'>+			F2FS_I(new_inode)-&gt;i_projid)))</div><div class='ctx'> 		return -EXDEV;</div><div class='ctx'> </div><div class='ctx'> 	err = f2fs_dquot_initialize(old_dir);</div><div class='hunk'>@@ -1147,17 +1140,17 @@ static int f2fs_cross_rename(struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	err = -ENOENT;</div><div class='del'>-	old_entry = f2fs_find_entry(old_dir, &amp;old_dentry-&gt;d_name, &amp;old_page);</div><div class='add'>+	old_entry = f2fs_find_entry(old_dir, &amp;old_dentry-&gt;d_name, &amp;old_folio);</div><div class='ctx'> 	if (!old_entry) {</div><div class='del'>-		if (IS_ERR(old_page))</div><div class='del'>-			err = PTR_ERR(old_page);</div><div class='add'>+		if (IS_ERR(old_folio))</div><div class='add'>+			err = PTR_ERR(old_folio);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	new_entry = f2fs_find_entry(new_dir, &amp;new_dentry-&gt;d_name, &amp;new_page);</div><div class='add'>+	new_entry = f2fs_find_entry(new_dir, &amp;new_dentry-&gt;d_name, &amp;new_folio);</div><div class='ctx'> 	if (!new_entry) {</div><div class='del'>-		if (IS_ERR(new_page))</div><div class='del'>-			err = PTR_ERR(new_page);</div><div class='add'>+		if (IS_ERR(new_folio))</div><div class='add'>+			err = PTR_ERR(new_folio);</div><div class='ctx'> 		goto out_old;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1165,20 +1158,20 @@ static int f2fs_cross_rename(struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> 	if (old_dir != new_dir) {</div><div class='ctx'> 		if (S_ISDIR(old_inode-&gt;i_mode)) {</div><div class='ctx'> 			old_dir_entry = f2fs_parent_dir(old_inode,</div><div class='del'>-							&amp;old_dir_page);</div><div class='add'>+							&amp;old_dir_folio);</div><div class='ctx'> 			if (!old_dir_entry) {</div><div class='del'>-				if (IS_ERR(old_dir_page))</div><div class='del'>-					err = PTR_ERR(old_dir_page);</div><div class='add'>+				if (IS_ERR(old_dir_folio))</div><div class='add'>+					err = PTR_ERR(old_dir_folio);</div><div class='ctx'> 				goto out_new;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (S_ISDIR(new_inode-&gt;i_mode)) {</div><div class='ctx'> 			new_dir_entry = f2fs_parent_dir(new_inode,</div><div class='del'>-							&amp;new_dir_page);</div><div class='add'>+							&amp;new_dir_folio);</div><div class='ctx'> 			if (!new_dir_entry) {</div><div class='del'>-				if (IS_ERR(new_dir_page))</div><div class='del'>-					err = PTR_ERR(new_dir_page);</div><div class='add'>+				if (IS_ERR(new_dir_folio))</div><div class='add'>+					err = PTR_ERR(new_dir_folio);</div><div class='ctx'> 				goto out_old_dir;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1205,47 +1198,47 @@ static int f2fs_cross_rename(struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> </div><div class='ctx'> 	/* update ".." directory entry info of old dentry */</div><div class='ctx'> 	if (old_dir_entry)</div><div class='del'>-		f2fs_set_link(old_inode, old_dir_entry, old_dir_page, new_dir);</div><div class='add'>+		f2fs_set_link(old_inode, old_dir_entry, old_dir_folio, new_dir);</div><div class='ctx'> </div><div class='ctx'> 	/* update ".." directory entry info of new dentry */</div><div class='ctx'> 	if (new_dir_entry)</div><div class='del'>-		f2fs_set_link(new_inode, new_dir_entry, new_dir_page, old_dir);</div><div class='add'>+		f2fs_set_link(new_inode, new_dir_entry, new_dir_folio, old_dir);</div><div class='ctx'> </div><div class='ctx'> 	/* update directory entry info of old dir inode */</div><div class='del'>-	f2fs_set_link(old_dir, old_entry, old_page, new_inode);</div><div class='add'>+	f2fs_set_link(old_dir, old_entry, old_folio, new_inode);</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;F2FS_I(old_inode)-&gt;i_sem);</div><div class='add'>+	f2fs_down_write(&amp;F2FS_I(old_inode)-&gt;i_sem);</div><div class='ctx'> 	if (!old_dir_entry)</div><div class='ctx'> 		file_lost_pino(old_inode);</div><div class='ctx'> 	else</div><div class='ctx'> 		/* adjust dir's i_pino to pass fsck check */</div><div class='ctx'> 		f2fs_i_pino_write(old_inode, new_dir-&gt;i_ino);</div><div class='del'>-	up_write(&amp;F2FS_I(old_inode)-&gt;i_sem);</div><div class='add'>+	f2fs_up_write(&amp;F2FS_I(old_inode)-&gt;i_sem);</div><div class='ctx'> </div><div class='del'>-	old_dir-&gt;i_ctime = current_time(old_dir);</div><div class='add'>+	inode_set_ctime_current(old_dir);</div><div class='ctx'> 	if (old_nlink) {</div><div class='del'>-		down_write(&amp;F2FS_I(old_dir)-&gt;i_sem);</div><div class='add'>+		f2fs_down_write(&amp;F2FS_I(old_dir)-&gt;i_sem);</div><div class='ctx'> 		f2fs_i_links_write(old_dir, old_nlink &gt; 0);</div><div class='del'>-		up_write(&amp;F2FS_I(old_dir)-&gt;i_sem);</div><div class='add'>+		f2fs_up_write(&amp;F2FS_I(old_dir)-&gt;i_sem);</div><div class='ctx'> 	}</div><div class='ctx'> 	f2fs_mark_inode_dirty_sync(old_dir, false);</div><div class='ctx'> </div><div class='ctx'> 	/* update directory entry info of new dir inode */</div><div class='del'>-	f2fs_set_link(new_dir, new_entry, new_page, old_inode);</div><div class='add'>+	f2fs_set_link(new_dir, new_entry, new_folio, old_inode);</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;F2FS_I(new_inode)-&gt;i_sem);</div><div class='add'>+	f2fs_down_write(&amp;F2FS_I(new_inode)-&gt;i_sem);</div><div class='ctx'> 	if (!new_dir_entry)</div><div class='ctx'> 		file_lost_pino(new_inode);</div><div class='ctx'> 	else</div><div class='ctx'> 		/* adjust dir's i_pino to pass fsck check */</div><div class='ctx'> 		f2fs_i_pino_write(new_inode, old_dir-&gt;i_ino);</div><div class='del'>-	up_write(&amp;F2FS_I(new_inode)-&gt;i_sem);</div><div class='add'>+	f2fs_up_write(&amp;F2FS_I(new_inode)-&gt;i_sem);</div><div class='ctx'> </div><div class='del'>-	new_dir-&gt;i_ctime = current_time(new_dir);</div><div class='add'>+	inode_set_ctime_current(new_dir);</div><div class='ctx'> 	if (new_nlink) {</div><div class='del'>-		down_write(&amp;F2FS_I(new_dir)-&gt;i_sem);</div><div class='add'>+		f2fs_down_write(&amp;F2FS_I(new_dir)-&gt;i_sem);</div><div class='ctx'> 		f2fs_i_links_write(new_dir, new_nlink &gt; 0);</div><div class='del'>-		up_write(&amp;F2FS_I(new_dir)-&gt;i_sem);</div><div class='add'>+		f2fs_up_write(&amp;F2FS_I(new_dir)-&gt;i_sem);</div><div class='ctx'> 	}</div><div class='ctx'> 	f2fs_mark_inode_dirty_sync(new_dir, false);</div><div class='ctx'> </div><div class='hunk'>@@ -1263,21 +1256,21 @@ static int f2fs_cross_rename(struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> 	return 0;</div><div class='ctx'> out_new_dir:</div><div class='ctx'> 	if (new_dir_entry) {</div><div class='del'>-		f2fs_put_page(new_dir_page, 0);</div><div class='add'>+		f2fs_folio_put(new_dir_folio, false);</div><div class='ctx'> 	}</div><div class='ctx'> out_old_dir:</div><div class='ctx'> 	if (old_dir_entry) {</div><div class='del'>-		f2fs_put_page(old_dir_page, 0);</div><div class='add'>+		f2fs_folio_put(old_dir_folio, false);</div><div class='ctx'> 	}</div><div class='ctx'> out_new:</div><div class='del'>-	f2fs_put_page(new_page, 0);</div><div class='add'>+	f2fs_folio_put(new_folio, false);</div><div class='ctx'> out_old:</div><div class='del'>-	f2fs_put_page(old_page, 0);</div><div class='add'>+	f2fs_folio_put(old_folio, false);</div><div class='ctx'> out:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_rename2(struct user_namespace *mnt_userns,</div><div class='add'>+static int f2fs_rename2(struct mnt_idmap *idmap,</div><div class='ctx'> 			struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> 			struct inode *new_dir, struct dentry *new_dentry,</div><div class='ctx'> 			unsigned int flags)</div><div class='hunk'>@@ -1287,48 +1280,55 @@ static int f2fs_rename2(struct user_namespace *mnt_userns,</div><div class='ctx'> 	if (flags &amp; ~(RENAME_NOREPLACE | RENAME_EXCHANGE | RENAME_WHITEOUT))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='add'>+	trace_f2fs_rename_start(old_dir, old_dentry, new_dir, new_dentry,</div><div class='add'>+								flags);</div><div class='add'>+</div><div class='ctx'> 	err = fscrypt_prepare_rename(old_dir, old_dentry, new_dir, new_dentry,</div><div class='ctx'> 				     flags);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	if (flags &amp; RENAME_EXCHANGE) {</div><div class='del'>-		return f2fs_cross_rename(old_dir, old_dentry,</div><div class='del'>-					 new_dir, new_dentry);</div><div class='del'>-	}</div><div class='add'>+	if (flags &amp; RENAME_EXCHANGE)</div><div class='add'>+		err = f2fs_cross_rename(old_dir, old_dentry,</div><div class='add'>+					new_dir, new_dentry);</div><div class='add'>+	else</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * VFS has already handled the new dentry existence case,</div><div class='ctx'> 	 * here, we just deal with "RENAME_NOREPLACE" as regular rename.</div><div class='ctx'> 	 */</div><div class='del'>-	return f2fs_rename(old_dir, old_dentry, new_dir, new_dentry, flags);</div><div class='add'>+		err = f2fs_rename(idmap, old_dir, old_dentry,</div><div class='add'>+					new_dir, new_dentry, flags);</div><div class='add'>+</div><div class='add'>+	trace_f2fs_rename_end(old_dentry, new_dentry, flags, err);</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const char *f2fs_encrypted_get_link(struct dentry *dentry,</div><div class='ctx'> 					   struct inode *inode,</div><div class='ctx'> 					   struct delayed_call *done)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	const char *target;</div><div class='ctx'> </div><div class='ctx'> 	if (!dentry)</div><div class='ctx'> 		return ERR_PTR(-ECHILD);</div><div class='ctx'> </div><div class='del'>-	page = read_mapping_page(inode-&gt;i_mapping, 0, NULL);</div><div class='del'>-	if (IS_ERR(page))</div><div class='del'>-		return ERR_CAST(page);</div><div class='add'>+	folio = read_mapping_folio(inode-&gt;i_mapping, 0, NULL);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return ERR_CAST(folio);</div><div class='ctx'> </div><div class='del'>-	target = fscrypt_get_symlink(inode, page_address(page),</div><div class='add'>+	target = fscrypt_get_symlink(inode, folio_address(folio),</div><div class='ctx'> 				     inode-&gt;i_sb-&gt;s_blocksize, done);</div><div class='del'>-	put_page(page);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> 	return target;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_encrypted_symlink_getattr(struct user_namespace *mnt_userns,</div><div class='add'>+static int f2fs_encrypted_symlink_getattr(struct mnt_idmap *idmap,</div><div class='ctx'> 					  const struct path *path,</div><div class='ctx'> 					  struct kstat *stat, u32 request_mask,</div><div class='ctx'> 					  unsigned int query_flags)</div><div class='ctx'> {</div><div class='del'>-	f2fs_getattr(mnt_userns, path, stat, request_mask, query_flags);</div><div class='add'>+	f2fs_getattr(idmap, path, stat, request_mask, query_flags);</div><div class='ctx'> </div><div class='ctx'> 	return fscrypt_symlink_getattr(path, stat);</div><div class='ctx'> }</div><div class='hunk'>@@ -1353,7 +1353,7 @@ const struct inode_operations f2fs_dir_inode_operations = {</div><div class='ctx'> 	.tmpfile	= f2fs_tmpfile,</div><div class='ctx'> 	.getattr	= f2fs_getattr,</div><div class='ctx'> 	.setattr	= f2fs_setattr,</div><div class='del'>-	.get_acl	= f2fs_get_acl,</div><div class='add'>+	.get_inode_acl	= f2fs_get_acl,</div><div class='ctx'> 	.set_acl	= f2fs_set_acl,</div><div class='ctx'> 	.listxattr	= f2fs_listxattr,</div><div class='ctx'> 	.fiemap		= f2fs_fiemap,</div><div class='hunk'>@@ -1371,7 +1371,7 @@ const struct inode_operations f2fs_symlink_inode_operations = {</div><div class='ctx'> const struct inode_operations f2fs_special_inode_operations = {</div><div class='ctx'> 	.getattr	= f2fs_getattr,</div><div class='ctx'> 	.setattr	= f2fs_setattr,</div><div class='del'>-	.get_acl	= f2fs_get_acl,</div><div class='add'>+	.get_inode_acl	= f2fs_get_acl,</div><div class='ctx'> 	.set_acl	= f2fs_set_acl,</div><div class='ctx'> 	.listxattr	= f2fs_listxattr,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/f2fs/node.c b/fs/f2fs/node.c<br/>index 556fcd8457f3..482a362f2625 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/node.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/node.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/node.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/node.c</a></div><div class='hunk'>@@ -8,7 +8,7 @@</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/f2fs_fs.h&gt;</div><div class='ctx'> #include &lt;linux/mpage.h&gt;</div><div class='del'>-#include &lt;linux/backing-dev.h&gt;</div><div class='add'>+#include &lt;linux/sched/mm.h&gt;</div><div class='ctx'> #include &lt;linux/blkdev.h&gt;</div><div class='ctx'> #include &lt;linux/pagevec.h&gt;</div><div class='ctx'> #include &lt;linux/swap.h&gt;</div><div class='hunk'>@@ -20,22 +20,28 @@</div><div class='ctx'> #include "iostat.h"</div><div class='ctx'> #include &lt;trace/events/f2fs.h&gt;</div><div class='ctx'> </div><div class='del'>-#define on_f2fs_build_free_nids(nmi) mutex_is_locked(&amp;(nm_i)-&gt;build_lock)</div><div class='add'>+#define on_f2fs_build_free_nids(nm_i) mutex_is_locked(&amp;(nm_i)-&gt;build_lock)</div><div class='ctx'> </div><div class='ctx'> static struct kmem_cache *nat_entry_slab;</div><div class='ctx'> static struct kmem_cache *free_nid_slab;</div><div class='ctx'> static struct kmem_cache *nat_entry_set_slab;</div><div class='ctx'> static struct kmem_cache *fsync_node_entry_slab;</div><div class='ctx'> </div><div class='add'>+static inline bool is_invalid_nid(struct f2fs_sb_info *sbi, nid_t nid)</div><div class='add'>+{</div><div class='add'>+	return nid &lt; F2FS_ROOT_INO(sbi) || nid &gt;= NM_I(sbi)-&gt;max_nid;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Check whether the given nid is within node id range.</div><div class='ctx'>  */</div><div class='ctx'> int f2fs_check_nid_range(struct f2fs_sb_info *sbi, nid_t nid)</div><div class='ctx'> {</div><div class='del'>-	if (unlikely(nid &lt; F2FS_ROOT_INO(sbi) || nid &gt;= NM_I(sbi)-&gt;max_nid)) {</div><div class='add'>+	if (unlikely(is_invalid_nid(sbi, nid))) {</div><div class='ctx'> 		set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='ctx'> 		f2fs_warn(sbi, "%s: out-of-range nid=%x, run fsck to fix.",</div><div class='ctx'> 			  __func__, nid);</div><div class='add'>+		f2fs_handle_error(sbi, ERROR_CORRUPTED_INODE);</div><div class='ctx'> 		return -EFSCORRUPTED;</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -59,7 +65,7 @@ bool f2fs_available_free_memory(struct f2fs_sb_info *sbi, int type)</div><div class='ctx'> 	avail_ram = val.totalram - val.totalhigh;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * give 25%, 25%, 50%, 50%, 50% memory for each components respectively</div><div class='add'>+	 * give 25%, 25%, 50%, 50%, 25%, 25% memory for each components respectively</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (type == FREE_NIDS) {</div><div class='ctx'> 		mem_size = (nm_i-&gt;nid_cnt[FREE_NID] *</div><div class='hunk'>@@ -84,16 +90,16 @@ bool f2fs_available_free_memory(struct f2fs_sb_info *sbi, int type)</div><div class='ctx'> 						sizeof(struct ino_entry);</div><div class='ctx'> 		mem_size &gt;&gt;= PAGE_SHIFT;</div><div class='ctx'> 		res = mem_size &lt; ((avail_ram * nm_i-&gt;ram_thresh / 100) &gt;&gt; 1);</div><div class='del'>-	} else if (type == EXTENT_CACHE) {</div><div class='del'>-		mem_size = (atomic_read(&amp;sbi-&gt;total_ext_tree) *</div><div class='add'>+	} else if (type == READ_EXTENT_CACHE || type == AGE_EXTENT_CACHE) {</div><div class='add'>+		enum extent_type etype = type == READ_EXTENT_CACHE ?</div><div class='add'>+						EX_READ : EX_BLOCK_AGE;</div><div class='add'>+		struct extent_tree_info *eti = &amp;sbi-&gt;extent_tree[etype];</div><div class='add'>+</div><div class='add'>+		mem_size = (atomic_read(&amp;eti-&gt;total_ext_tree) *</div><div class='ctx'> 				sizeof(struct extent_tree) +</div><div class='del'>-				atomic_read(&amp;sbi-&gt;total_ext_node) *</div><div class='add'>+				atomic_read(&amp;eti-&gt;total_ext_node) *</div><div class='ctx'> 				sizeof(struct extent_node)) &gt;&gt; PAGE_SHIFT;</div><div class='del'>-		res = mem_size &lt; ((avail_ram * nm_i-&gt;ram_thresh / 100) &gt;&gt; 1);</div><div class='del'>-	} else if (type == INMEM_PAGES) {</div><div class='del'>-		/* it allows 20% / total_ram for inmemory pages */</div><div class='del'>-		mem_size = get_pages(sbi, F2FS_INMEM_PAGES);</div><div class='del'>-		res = mem_size &lt; (val.totalram / 5);</div><div class='add'>+		res = mem_size &lt; ((avail_ram * nm_i-&gt;ram_thresh / 100) &gt;&gt; 2);</div><div class='ctx'> 	} else if (type == DISCARD_CACHE) {</div><div class='ctx'> 		mem_size = (atomic_read(&amp;dcc-&gt;discard_cmd_cnt) *</div><div class='ctx'> 				sizeof(struct discard_cmd)) &gt;&gt; PAGE_SHIFT;</div><div class='hunk'>@@ -119,25 +125,25 @@ bool f2fs_available_free_memory(struct f2fs_sb_info *sbi, int type)</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void clear_node_page_dirty(struct page *page)</div><div class='add'>+static void clear_node_folio_dirty(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	if (PageDirty(page)) {</div><div class='del'>-		f2fs_clear_page_cache_dirty_tag(page);</div><div class='del'>-		clear_page_dirty_for_io(page);</div><div class='del'>-		dec_page_count(F2FS_P_SB(page), F2FS_DIRTY_NODES);</div><div class='add'>+	if (folio_test_dirty(folio)) {</div><div class='add'>+		f2fs_clear_page_cache_dirty_tag(folio);</div><div class='add'>+		folio_clear_dirty_for_io(folio);</div><div class='add'>+		dec_page_count(F2FS_F_SB(folio), F2FS_DIRTY_NODES);</div><div class='ctx'> 	}</div><div class='del'>-	ClearPageUptodate(page);</div><div class='add'>+	folio_clear_uptodate(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct page *get_current_nat_page(struct f2fs_sb_info *sbi, nid_t nid)</div><div class='add'>+static struct folio *get_current_nat_folio(struct f2fs_sb_info *sbi, nid_t nid)</div><div class='ctx'> {</div><div class='del'>-	return f2fs_get_meta_page_retry(sbi, current_nat_addr(sbi, nid));</div><div class='add'>+	return f2fs_get_meta_folio_retry(sbi, current_nat_addr(sbi, nid));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct page *get_next_nat_page(struct f2fs_sb_info *sbi, nid_t nid)</div><div class='add'>+static struct folio *get_next_nat_folio(struct f2fs_sb_info *sbi, nid_t nid)</div><div class='ctx'> {</div><div class='del'>-	struct page *src_page;</div><div class='del'>-	struct page *dst_page;</div><div class='add'>+	struct folio *src_folio;</div><div class='add'>+	struct folio *dst_folio;</div><div class='ctx'> 	pgoff_t dst_off;</div><div class='ctx'> 	void *src_addr;</div><div class='ctx'> 	void *dst_addr;</div><div class='hunk'>@@ -146,21 +152,21 @@ static struct page *get_next_nat_page(struct f2fs_sb_info *sbi, nid_t nid)</div><div class='ctx'> 	dst_off = next_nat_addr(sbi, current_nat_addr(sbi, nid));</div><div class='ctx'> </div><div class='ctx'> 	/* get current nat block page with lock */</div><div class='del'>-	src_page = get_current_nat_page(sbi, nid);</div><div class='del'>-	if (IS_ERR(src_page))</div><div class='del'>-		return src_page;</div><div class='del'>-	dst_page = f2fs_grab_meta_page(sbi, dst_off);</div><div class='del'>-	f2fs_bug_on(sbi, PageDirty(src_page));</div><div class='del'>-</div><div class='del'>-	src_addr = page_address(src_page);</div><div class='del'>-	dst_addr = page_address(dst_page);</div><div class='add'>+	src_folio = get_current_nat_folio(sbi, nid);</div><div class='add'>+	if (IS_ERR(src_folio))</div><div class='add'>+		return src_folio;</div><div class='add'>+	dst_folio = f2fs_grab_meta_folio(sbi, dst_off);</div><div class='add'>+	f2fs_bug_on(sbi, folio_test_dirty(src_folio));</div><div class='add'>+</div><div class='add'>+	src_addr = folio_address(src_folio);</div><div class='add'>+	dst_addr = folio_address(dst_folio);</div><div class='ctx'> 	memcpy(dst_addr, src_addr, PAGE_SIZE);</div><div class='del'>-	set_page_dirty(dst_page);</div><div class='del'>-	f2fs_put_page(src_page, 1);</div><div class='add'>+	folio_mark_dirty(dst_folio);</div><div class='add'>+	f2fs_folio_put(src_folio, true);</div><div class='ctx'> </div><div class='ctx'> 	set_to_next_nat(nm_i, nid);</div><div class='ctx'> </div><div class='del'>-	return dst_page;</div><div class='add'>+	return dst_folio;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct nat_entry *__alloc_nat_entry(struct f2fs_sb_info *sbi,</div><div class='hunk'>@@ -184,7 +190,7 @@ static void __free_nat_entry(struct nat_entry *e)</div><div class='ctx'> </div><div class='ctx'> /* must be locked by nat_tree_lock */</div><div class='ctx'> static struct nat_entry *__init_nat_entry(struct f2fs_nm_info *nm_i,</div><div class='del'>-	struct nat_entry *ne, struct f2fs_nat_entry *raw_ne, bool no_fail)</div><div class='add'>+	struct nat_entry *ne, struct f2fs_nat_entry *raw_ne, bool no_fail, bool init_dirty)</div><div class='ctx'> {</div><div class='ctx'> 	if (no_fail)</div><div class='ctx'> 		f2fs_radix_tree_insert(&amp;nm_i-&gt;nat_root, nat_get_nid(ne), ne);</div><div class='hunk'>@@ -194,6 +200,12 @@ static struct nat_entry *__init_nat_entry(struct f2fs_nm_info *nm_i,</div><div class='ctx'> 	if (raw_ne)</div><div class='ctx'> 		node_info_from_raw_nat(&amp;ne-&gt;ni, raw_ne);</div><div class='ctx'> </div><div class='add'>+	if (init_dirty) {</div><div class='add'>+		INIT_LIST_HEAD(&amp;ne-&gt;list);</div><div class='add'>+		nm_i-&gt;nat_cnt[TOTAL_NAT]++;</div><div class='add'>+		return ne;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	spin_lock(&amp;nm_i-&gt;nat_list_lock);</div><div class='ctx'> 	list_add_tail(&amp;ne-&gt;list, &amp;nm_i-&gt;nat_entries);</div><div class='ctx'> 	spin_unlock(&amp;nm_i-&gt;nat_list_lock);</div><div class='hunk'>@@ -203,14 +215,17 @@ static struct nat_entry *__init_nat_entry(struct f2fs_nm_info *nm_i,</div><div class='ctx'> 	return ne;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct nat_entry *__lookup_nat_cache(struct f2fs_nm_info *nm_i, nid_t n)</div><div class='add'>+static struct nat_entry *__lookup_nat_cache(struct f2fs_nm_info *nm_i, nid_t n, bool for_dirty)</div><div class='ctx'> {</div><div class='ctx'> 	struct nat_entry *ne;</div><div class='ctx'> </div><div class='ctx'> 	ne = radix_tree_lookup(&amp;nm_i-&gt;nat_root, n);</div><div class='ctx'> </div><div class='del'>-	/* for recent accessed nat entry, move it to tail of lru list */</div><div class='del'>-	if (ne &amp;&amp; !get_nat_flag(ne, IS_DIRTY)) {</div><div class='add'>+	/*</div><div class='add'>+	 * for recent accessed nat entry which will not be dirtied soon</div><div class='add'>+	 * later, move it to tail of lru list.</div><div class='add'>+	 */</div><div class='add'>+	if (ne &amp;&amp; !get_nat_flag(ne, IS_DIRTY) &amp;&amp; !for_dirty) {</div><div class='ctx'> 		spin_lock(&amp;nm_i-&gt;nat_list_lock);</div><div class='ctx'> 		if (!list_empty(&amp;ne-&gt;list))</div><div class='ctx'> 			list_move_tail(&amp;ne-&gt;list, &amp;nm_i-&gt;nat_entries);</div><div class='hunk'>@@ -255,7 +270,7 @@ static struct nat_entry_set *__grab_nat_entry_set(struct f2fs_nm_info *nm_i,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void __set_nat_cache_dirty(struct f2fs_nm_info *nm_i,</div><div class='del'>-						struct nat_entry *ne)</div><div class='add'>+		struct nat_entry *ne, bool init_dirty)</div><div class='ctx'> {</div><div class='ctx'> 	struct nat_entry_set *head;</div><div class='ctx'> 	bool new_ne = nat_get_blkaddr(ne) == NEW_ADDR;</div><div class='hunk'>@@ -278,7 +293,8 @@ static void __set_nat_cache_dirty(struct f2fs_nm_info *nm_i,</div><div class='ctx'> 		goto refresh_list;</div><div class='ctx'> </div><div class='ctx'> 	nm_i-&gt;nat_cnt[DIRTY_NAT]++;</div><div class='del'>-	nm_i-&gt;nat_cnt[RECLAIMABLE_NAT]--;</div><div class='add'>+	if (!init_dirty)</div><div class='add'>+		nm_i-&gt;nat_cnt[RECLAIMABLE_NAT]--;</div><div class='ctx'> 	set_nat_flag(ne, IS_DIRTY, true);</div><div class='ctx'> refresh_list:</div><div class='ctx'> 	spin_lock(&amp;nm_i-&gt;nat_list_lock);</div><div class='hunk'>@@ -309,10 +325,9 @@ static unsigned int __gang_lookup_nat_set(struct f2fs_nm_info *nm_i,</div><div class='ctx'> 							start, nr);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-bool f2fs_in_warm_node_list(struct f2fs_sb_info *sbi, struct page *page)</div><div class='add'>+bool f2fs_in_warm_node_list(struct f2fs_sb_info *sbi, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	return NODE_MAPPING(sbi) == page-&gt;mapping &amp;&amp;</div><div class='del'>-			IS_DNODE(page) &amp;&amp; is_cold_node(page);</div><div class='add'>+	return is_node_folio(folio) &amp;&amp; IS_DNODE(folio) &amp;&amp; is_cold_node(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_init_fsync_node_info(struct f2fs_sb_info *sbi)</div><div class='hunk'>@@ -324,7 +339,7 @@ void f2fs_init_fsync_node_info(struct f2fs_sb_info *sbi)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static unsigned int f2fs_add_fsync_node_entry(struct f2fs_sb_info *sbi,</div><div class='del'>-							struct page *page)</div><div class='add'>+		struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct fsync_node_entry *fn;</div><div class='ctx'> 	unsigned long flags;</div><div class='hunk'>@@ -333,8 +348,8 @@ static unsigned int f2fs_add_fsync_node_entry(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	fn = f2fs_kmem_cache_alloc(fsync_node_entry_slab,</div><div class='ctx'> 					GFP_NOFS, true, NULL);</div><div class='ctx'> </div><div class='del'>-	get_page(page);</div><div class='del'>-	fn-&gt;page = page;</div><div class='add'>+	folio_get(folio);</div><div class='add'>+	fn-&gt;folio = folio;</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;fn-&gt;list);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock_irqsave(&amp;sbi-&gt;fsync_node_lock, flags);</div><div class='hunk'>@@ -347,19 +362,19 @@ static unsigned int f2fs_add_fsync_node_entry(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	return seq_id;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_del_fsync_node_entry(struct f2fs_sb_info *sbi, struct page *page)</div><div class='add'>+void f2fs_del_fsync_node_entry(struct f2fs_sb_info *sbi, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct fsync_node_entry *fn;</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock_irqsave(&amp;sbi-&gt;fsync_node_lock, flags);</div><div class='ctx'> 	list_for_each_entry(fn, &amp;sbi-&gt;fsync_node_list, list) {</div><div class='del'>-		if (fn-&gt;page == page) {</div><div class='add'>+		if (fn-&gt;folio == folio) {</div><div class='ctx'> 			list_del(&amp;fn-&gt;list);</div><div class='ctx'> 			sbi-&gt;fsync_node_num--;</div><div class='ctx'> 			spin_unlock_irqrestore(&amp;sbi-&gt;fsync_node_lock, flags);</div><div class='ctx'> 			kmem_cache_free(fsync_node_entry_slab, fn);</div><div class='del'>-			put_page(page);</div><div class='add'>+			folio_put(folio);</div><div class='ctx'> 			return;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -382,14 +397,14 @@ int f2fs_need_dentry_mark(struct f2fs_sb_info *sbi, nid_t nid)</div><div class='ctx'> 	struct nat_entry *e;</div><div class='ctx'> 	bool need = false;</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='del'>-	e = __lookup_nat_cache(nm_i, nid);</div><div class='add'>+	f2fs_down_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+	e = __lookup_nat_cache(nm_i, nid, false);</div><div class='ctx'> 	if (e) {</div><div class='ctx'> 		if (!get_nat_flag(e, IS_CHECKPOINTED) &amp;&amp;</div><div class='ctx'> 				!get_nat_flag(e, HAS_FSYNCED_INODE))</div><div class='ctx'> 			need = true;</div><div class='ctx'> 	}</div><div class='del'>-	up_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+	f2fs_up_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='ctx'> 	return need;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -399,11 +414,11 @@ bool f2fs_is_checkpointed_node(struct f2fs_sb_info *sbi, nid_t nid)</div><div class='ctx'> 	struct nat_entry *e;</div><div class='ctx'> 	bool is_cp = true;</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='del'>-	e = __lookup_nat_cache(nm_i, nid);</div><div class='add'>+	f2fs_down_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+	e = __lookup_nat_cache(nm_i, nid, false);</div><div class='ctx'> 	if (e &amp;&amp; !get_nat_flag(e, IS_CHECKPOINTED))</div><div class='ctx'> 		is_cp = false;</div><div class='del'>-	up_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+	f2fs_up_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='ctx'> 	return is_cp;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -413,13 +428,13 @@ bool f2fs_need_inode_block_update(struct f2fs_sb_info *sbi, nid_t ino)</div><div class='ctx'> 	struct nat_entry *e;</div><div class='ctx'> 	bool need_update = true;</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='del'>-	e = __lookup_nat_cache(nm_i, ino);</div><div class='add'>+	f2fs_down_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+	e = __lookup_nat_cache(nm_i, ino, false);</div><div class='ctx'> 	if (e &amp;&amp; get_nat_flag(e, HAS_LAST_FSYNC) &amp;&amp;</div><div class='ctx'> 			(get_nat_flag(e, IS_CHECKPOINTED) ||</div><div class='ctx'> 			 get_nat_flag(e, HAS_FSYNCED_INODE)))</div><div class='ctx'> 		need_update = false;</div><div class='del'>-	up_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+	f2fs_up_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='ctx'> 	return need_update;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -430,20 +445,24 @@ static void cache_nat_entry(struct f2fs_sb_info *sbi, nid_t nid,</div><div class='ctx'> 	struct f2fs_nm_info *nm_i = NM_I(sbi);</div><div class='ctx'> 	struct nat_entry *new, *e;</div><div class='ctx'> </div><div class='add'>+	/* Let's mitigate lock contention of nat_tree_lock during checkpoint */</div><div class='add'>+	if (f2fs_rwsem_is_locked(&amp;sbi-&gt;cp_global_sem))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='ctx'> 	new = __alloc_nat_entry(sbi, nid, false);</div><div class='ctx'> 	if (!new)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;nm_i-&gt;nat_tree_lock);</div><div class='del'>-	e = __lookup_nat_cache(nm_i, nid);</div><div class='add'>+	f2fs_down_write(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+	e = __lookup_nat_cache(nm_i, nid, false);</div><div class='ctx'> 	if (!e)</div><div class='del'>-		e = __init_nat_entry(nm_i, new, ne, false);</div><div class='add'>+		e = __init_nat_entry(nm_i, new, ne, false, false);</div><div class='ctx'> 	else</div><div class='ctx'> 		f2fs_bug_on(sbi, nat_get_ino(e) != le32_to_cpu(ne-&gt;ino) ||</div><div class='ctx'> 				nat_get_blkaddr(e) !=</div><div class='ctx'> 					le32_to_cpu(ne-&gt;block_addr) ||</div><div class='ctx'> 				nat_get_version(e) != ne-&gt;version);</div><div class='del'>-	up_write(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+	f2fs_up_write(&amp;nm_i-&gt;nat_tree_lock);</div><div class='ctx'> 	if (e != new)</div><div class='ctx'> 		__free_nat_entry(new);</div><div class='ctx'> }</div><div class='hunk'>@@ -454,11 +473,13 @@ static void set_node_addr(struct f2fs_sb_info *sbi, struct node_info *ni,</div><div class='ctx'> 	struct f2fs_nm_info *nm_i = NM_I(sbi);</div><div class='ctx'> 	struct nat_entry *e;</div><div class='ctx'> 	struct nat_entry *new = __alloc_nat_entry(sbi, ni-&gt;nid, true);</div><div class='add'>+	bool init_dirty = false;</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;nm_i-&gt;nat_tree_lock);</div><div class='del'>-	e = __lookup_nat_cache(nm_i, ni-&gt;nid);</div><div class='add'>+	f2fs_down_write(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+	e = __lookup_nat_cache(nm_i, ni-&gt;nid, true);</div><div class='ctx'> 	if (!e) {</div><div class='del'>-		e = __init_nat_entry(nm_i, new, NULL, true);</div><div class='add'>+		init_dirty = true;</div><div class='add'>+		e = __init_nat_entry(nm_i, new, NULL, true, true);</div><div class='ctx'> 		copy_node_info(&amp;e-&gt;ni, ni);</div><div class='ctx'> 		f2fs_bug_on(sbi, ni-&gt;blk_addr == NEW_ADDR);</div><div class='ctx'> 	} else if (new_blkaddr == NEW_ADDR) {</div><div class='hunk'>@@ -494,17 +515,17 @@ static void set_node_addr(struct f2fs_sb_info *sbi, struct node_info *ni,</div><div class='ctx'> 	nat_set_blkaddr(e, new_blkaddr);</div><div class='ctx'> 	if (!__is_valid_data_blkaddr(new_blkaddr))</div><div class='ctx'> 		set_nat_flag(e, IS_CHECKPOINTED, false);</div><div class='del'>-	__set_nat_cache_dirty(nm_i, e);</div><div class='add'>+	__set_nat_cache_dirty(nm_i, e, init_dirty);</div><div class='ctx'> </div><div class='ctx'> 	/* update fsync_mark if its inode nat entry is still alive */</div><div class='ctx'> 	if (ni-&gt;nid != ni-&gt;ino)</div><div class='del'>-		e = __lookup_nat_cache(nm_i, ni-&gt;ino);</div><div class='add'>+		e = __lookup_nat_cache(nm_i, ni-&gt;ino, false);</div><div class='ctx'> 	if (e) {</div><div class='ctx'> 		if (fsync_done &amp;&amp; ni-&gt;nid == ni-&gt;ino)</div><div class='ctx'> 			set_nat_flag(e, HAS_FSYNCED_INODE, true);</div><div class='ctx'> 		set_nat_flag(e, HAS_LAST_FSYNC, fsync_done);</div><div class='ctx'> 	}</div><div class='del'>-	up_write(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+	f2fs_up_write(&amp;nm_i-&gt;nat_tree_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int f2fs_try_to_free_nats(struct f2fs_sb_info *sbi, int nr_shrink)</div><div class='hunk'>@@ -512,7 +533,7 @@ int f2fs_try_to_free_nats(struct f2fs_sb_info *sbi, int nr_shrink)</div><div class='ctx'> 	struct f2fs_nm_info *nm_i = NM_I(sbi);</div><div class='ctx'> 	int nr = nr_shrink;</div><div class='ctx'> </div><div class='del'>-	if (!down_write_trylock(&amp;nm_i-&gt;nat_tree_lock))</div><div class='add'>+	if (!f2fs_down_write_trylock(&amp;nm_i-&gt;nat_tree_lock))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;nm_i-&gt;nat_list_lock);</div><div class='hunk'>@@ -534,35 +555,40 @@ int f2fs_try_to_free_nats(struct f2fs_sb_info *sbi, int nr_shrink)</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;nm_i-&gt;nat_list_lock);</div><div class='ctx'> </div><div class='del'>-	up_write(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+	f2fs_up_write(&amp;nm_i-&gt;nat_tree_lock);</div><div class='ctx'> 	return nr - nr_shrink;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int f2fs_get_node_info(struct f2fs_sb_info *sbi, nid_t nid,</div><div class='del'>-						struct node_info *ni)</div><div class='add'>+				struct node_info *ni, bool checkpoint_context)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_nm_info *nm_i = NM_I(sbi);</div><div class='ctx'> 	struct curseg_info *curseg = CURSEG_I(sbi, CURSEG_HOT_DATA);</div><div class='ctx'> 	struct f2fs_journal *journal = curseg-&gt;journal;</div><div class='ctx'> 	nid_t start_nid = START_NID(nid);</div><div class='ctx'> 	struct f2fs_nat_block *nat_blk;</div><div class='del'>-	struct page *page = NULL;</div><div class='add'>+	struct folio *folio = NULL;</div><div class='ctx'> 	struct f2fs_nat_entry ne;</div><div class='ctx'> 	struct nat_entry *e;</div><div class='ctx'> 	pgoff_t index;</div><div class='del'>-	block_t blkaddr;</div><div class='ctx'> 	int i;</div><div class='add'>+	bool need_cache = true;</div><div class='ctx'> </div><div class='add'>+	ni-&gt;flag = 0;</div><div class='ctx'> 	ni-&gt;nid = nid;</div><div class='ctx'> retry:</div><div class='ctx'> 	/* Check nat cache */</div><div class='del'>-	down_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='del'>-	e = __lookup_nat_cache(nm_i, nid);</div><div class='add'>+	f2fs_down_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+	e = __lookup_nat_cache(nm_i, nid, false);</div><div class='ctx'> 	if (e) {</div><div class='ctx'> 		ni-&gt;ino = nat_get_ino(e);</div><div class='ctx'> 		ni-&gt;blk_addr = nat_get_blkaddr(e);</div><div class='ctx'> 		ni-&gt;version = nat_get_version(e);</div><div class='del'>-		up_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+		f2fs_up_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+		if (IS_ENABLED(CONFIG_F2FS_CHECK_FS)) {</div><div class='add'>+			need_cache = false;</div><div class='add'>+			goto sanity_check;</div><div class='add'>+		}</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -572,10 +598,11 @@ retry:</div><div class='ctx'> 	 * nat_tree_lock. Therefore, we should retry, if we failed to grab here</div><div class='ctx'> 	 * while not bothering checkpoint.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!rwsem_is_locked(&amp;sbi-&gt;cp_global_sem)) {</div><div class='add'>+	if (!f2fs_rwsem_is_locked(&amp;sbi-&gt;cp_global_sem) || checkpoint_context) {</div><div class='ctx'> 		down_read(&amp;curseg-&gt;journal_rwsem);</div><div class='del'>-	} else if (!down_read_trylock(&amp;curseg-&gt;journal_rwsem)) {</div><div class='del'>-		up_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+	} else if (f2fs_rwsem_is_contended(&amp;nm_i-&gt;nat_tree_lock) ||</div><div class='add'>+				!down_read_trylock(&amp;curseg-&gt;journal_rwsem)) {</div><div class='add'>+		f2fs_up_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='ctx'> 		goto retry;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -586,39 +613,48 @@ retry:</div><div class='ctx'> 	}</div><div class='ctx'> 	up_read(&amp;curseg-&gt;journal_rwsem);</div><div class='ctx'> 	if (i &gt;= 0) {</div><div class='del'>-		up_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='del'>-		goto cache;</div><div class='add'>+		f2fs_up_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+		goto sanity_check;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Fill node_info from nat page */</div><div class='ctx'> 	index = current_nat_addr(sbi, nid);</div><div class='del'>-	up_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+	f2fs_up_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='ctx'> </div><div class='del'>-	page = f2fs_get_meta_page(sbi, index);</div><div class='del'>-	if (IS_ERR(page))</div><div class='del'>-		return PTR_ERR(page);</div><div class='add'>+	folio = f2fs_get_meta_folio(sbi, index);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio);</div><div class='ctx'> </div><div class='del'>-	nat_blk = (struct f2fs_nat_block *)page_address(page);</div><div class='add'>+	nat_blk = folio_address(folio);</div><div class='ctx'> 	ne = nat_blk-&gt;entries[nid - start_nid];</div><div class='ctx'> 	node_info_from_raw_nat(ni, &amp;ne);</div><div class='del'>-	f2fs_put_page(page, 1);</div><div class='del'>-cache:</div><div class='del'>-	blkaddr = le32_to_cpu(ne.block_addr);</div><div class='del'>-	if (__is_valid_data_blkaddr(blkaddr) &amp;&amp;</div><div class='del'>-		!f2fs_is_valid_blkaddr(sbi, blkaddr, DATA_GENERIC_ENHANCE))</div><div class='del'>-		return -EFAULT;</div><div class='add'>+	f2fs_folio_put(folio, true);</div><div class='add'>+sanity_check:</div><div class='add'>+	if (__is_valid_data_blkaddr(ni-&gt;blk_addr) &amp;&amp;</div><div class='add'>+		!f2fs_is_valid_blkaddr(sbi, ni-&gt;blk_addr,</div><div class='add'>+					DATA_GENERIC_ENHANCE)) {</div><div class='add'>+		set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='add'>+		f2fs_err_ratelimited(sbi,</div><div class='add'>+			"f2fs_get_node_info of %pS: inconsistent nat entry, "</div><div class='add'>+			"ino:%u, nid:%u, blkaddr:%u, ver:%u, flag:%u",</div><div class='add'>+			__builtin_return_address(0),</div><div class='add'>+			ni-&gt;ino, ni-&gt;nid, ni-&gt;blk_addr, ni-&gt;version, ni-&gt;flag);</div><div class='add'>+		f2fs_handle_error(sbi, ERROR_INCONSISTENT_NAT);</div><div class='add'>+		return -EFSCORRUPTED;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* cache nat entry */</div><div class='del'>-	cache_nat_entry(sbi, nid, &amp;ne);</div><div class='add'>+	if (need_cache)</div><div class='add'>+		cache_nat_entry(sbi, nid, &amp;ne);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * readahead MAX_RA_NODE number of node pages.</div><div class='ctx'>  */</div><div class='del'>-static void f2fs_ra_node_pages(struct page *parent, int start, int n)</div><div class='add'>+static void f2fs_ra_node_pages(struct folio *parent, int start, int n)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_sb_info *sbi = F2FS_P_SB(parent);</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_F_SB(parent);</div><div class='ctx'> 	struct blk_plug plug;</div><div class='ctx'> 	int i, end;</div><div class='ctx'> 	nid_t nid;</div><div class='hunk'>@@ -627,7 +663,7 @@ static void f2fs_ra_node_pages(struct page *parent, int start, int n)</div><div class='ctx'> </div><div class='ctx'> 	/* Then, try readahead for siblings of the desired node */</div><div class='ctx'> 	end = start + n;</div><div class='del'>-	end = min(end, NIDS_PER_BLOCK);</div><div class='add'>+	end = min(end, (int)NIDS_PER_BLOCK);</div><div class='ctx'> 	for (i = start; i &lt; end; i++) {</div><div class='ctx'> 		nid = get_nid(parent, i, false);</div><div class='ctx'> 		f2fs_ra_node_page(sbi, nid);</div><div class='hunk'>@@ -747,6 +783,8 @@ got:</div><div class='ctx'> 	return level;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static struct folio *f2fs_get_node_folio_ra(struct folio *parent, int start);</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Caller should call f2fs_put_dnode(dn).</div><div class='ctx'>  * Also, it should grab and release a rwsem by calling f2fs_lock_op() and</div><div class='hunk'>@@ -755,8 +793,8 @@ got:</div><div class='ctx'> int f2fs_get_dnode_of_data(struct dnode_of_data *dn, pgoff_t index, int mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(dn-&gt;inode);</div><div class='del'>-	struct page *npage[4];</div><div class='del'>-	struct page *parent = NULL;</div><div class='add'>+	struct folio *nfolio[4];</div><div class='add'>+	struct folio *parent = NULL;</div><div class='ctx'> 	int offset[4];</div><div class='ctx'> 	unsigned int noffset[4];</div><div class='ctx'> 	nid_t nids[4];</div><div class='hunk'>@@ -768,31 +806,42 @@ int f2fs_get_dnode_of_data(struct dnode_of_data *dn, pgoff_t index, int mode)</div><div class='ctx'> 		return level;</div><div class='ctx'> </div><div class='ctx'> 	nids[0] = dn-&gt;inode-&gt;i_ino;</div><div class='del'>-	npage[0] = dn-&gt;inode_page;</div><div class='ctx'> </div><div class='del'>-	if (!npage[0]) {</div><div class='del'>-		npage[0] = f2fs_get_node_page(sbi, nids[0]);</div><div class='del'>-		if (IS_ERR(npage[0]))</div><div class='del'>-			return PTR_ERR(npage[0]);</div><div class='add'>+	if (!dn-&gt;inode_folio) {</div><div class='add'>+		nfolio[0] = f2fs_get_inode_folio(sbi, nids[0]);</div><div class='add'>+		if (IS_ERR(nfolio[0]))</div><div class='add'>+			return PTR_ERR(nfolio[0]);</div><div class='add'>+	} else {</div><div class='add'>+		nfolio[0] = dn-&gt;inode_folio;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* if inline_data is set, should not report any block indices */</div><div class='ctx'> 	if (f2fs_has_inline_data(dn-&gt;inode) &amp;&amp; index) {</div><div class='ctx'> 		err = -ENOENT;</div><div class='del'>-		f2fs_put_page(npage[0], 1);</div><div class='add'>+		f2fs_folio_put(nfolio[0], true);</div><div class='ctx'> 		goto release_out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	parent = npage[0];</div><div class='add'>+	parent = nfolio[0];</div><div class='ctx'> 	if (level != 0)</div><div class='ctx'> 		nids[1] = get_nid(parent, offset[0], true);</div><div class='del'>-	dn-&gt;inode_page = npage[0];</div><div class='del'>-	dn-&gt;inode_page_locked = true;</div><div class='add'>+	dn-&gt;inode_folio = nfolio[0];</div><div class='add'>+	dn-&gt;inode_folio_locked = true;</div><div class='ctx'> </div><div class='ctx'> 	/* get indirect or direct nodes */</div><div class='ctx'> 	for (i = 1; i &lt;= level; i++) {</div><div class='ctx'> 		bool done = false;</div><div class='ctx'> </div><div class='add'>+		if (nids[i] &amp;&amp; nids[i] == dn-&gt;inode-&gt;i_ino) {</div><div class='add'>+			err = -EFSCORRUPTED;</div><div class='add'>+			f2fs_err_ratelimited(sbi,</div><div class='add'>+				"inode mapping table is corrupted, run fsck to fix it, "</div><div class='add'>+				"ino:%lu, nid:%u, level:%d, offset:%d",</div><div class='add'>+				dn-&gt;inode-&gt;i_ino, nids[i], level, offset[level]);</div><div class='add'>+			set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='add'>+			goto release_pages;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		if (!nids[i] &amp;&amp; mode == ALLOC_NODE) {</div><div class='ctx'> 			/* alloc new node */</div><div class='ctx'> 			if (!f2fs_alloc_nid(sbi, &amp;(nids[i]))) {</div><div class='hunk'>@@ -801,10 +850,10 @@ int f2fs_get_dnode_of_data(struct dnode_of_data *dn, pgoff_t index, int mode)</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			dn-&gt;nid = nids[i];</div><div class='del'>-			npage[i] = f2fs_new_node_page(dn, noffset[i]);</div><div class='del'>-			if (IS_ERR(npage[i])) {</div><div class='add'>+			nfolio[i] = f2fs_new_node_folio(dn, noffset[i]);</div><div class='add'>+			if (IS_ERR(nfolio[i])) {</div><div class='ctx'> 				f2fs_alloc_nid_failed(sbi, nids[i]);</div><div class='del'>-				err = PTR_ERR(npage[i]);</div><div class='add'>+				err = PTR_ERR(nfolio[i]);</div><div class='ctx'> 				goto release_pages;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='hunk'>@@ -812,66 +861,75 @@ int f2fs_get_dnode_of_data(struct dnode_of_data *dn, pgoff_t index, int mode)</div><div class='ctx'> 			f2fs_alloc_nid_done(sbi, nids[i]);</div><div class='ctx'> 			done = true;</div><div class='ctx'> 		} else if (mode == LOOKUP_NODE_RA &amp;&amp; i == level &amp;&amp; level &gt; 1) {</div><div class='del'>-			npage[i] = f2fs_get_node_page_ra(parent, offset[i - 1]);</div><div class='del'>-			if (IS_ERR(npage[i])) {</div><div class='del'>-				err = PTR_ERR(npage[i]);</div><div class='add'>+			nfolio[i] = f2fs_get_node_folio_ra(parent, offset[i - 1]);</div><div class='add'>+			if (IS_ERR(nfolio[i])) {</div><div class='add'>+				err = PTR_ERR(nfolio[i]);</div><div class='ctx'> 				goto release_pages;</div><div class='ctx'> 			}</div><div class='ctx'> 			done = true;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (i == 1) {</div><div class='del'>-			dn-&gt;inode_page_locked = false;</div><div class='del'>-			unlock_page(parent);</div><div class='add'>+			dn-&gt;inode_folio_locked = false;</div><div class='add'>+			folio_unlock(parent);</div><div class='ctx'> 		} else {</div><div class='del'>-			f2fs_put_page(parent, 1);</div><div class='add'>+			f2fs_folio_put(parent, true);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (!done) {</div><div class='del'>-			npage[i] = f2fs_get_node_page(sbi, nids[i]);</div><div class='del'>-			if (IS_ERR(npage[i])) {</div><div class='del'>-				err = PTR_ERR(npage[i]);</div><div class='del'>-				f2fs_put_page(npage[0], 0);</div><div class='add'>+			nfolio[i] = f2fs_get_node_folio(sbi, nids[i],</div><div class='add'>+						NODE_TYPE_NON_INODE);</div><div class='add'>+			if (IS_ERR(nfolio[i])) {</div><div class='add'>+				err = PTR_ERR(nfolio[i]);</div><div class='add'>+				f2fs_folio_put(nfolio[0], false);</div><div class='ctx'> 				goto release_out;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 		if (i &lt; level) {</div><div class='del'>-			parent = npage[i];</div><div class='add'>+			parent = nfolio[i];</div><div class='ctx'> 			nids[i + 1] = get_nid(parent, offset[i], false);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	dn-&gt;nid = nids[level];</div><div class='ctx'> 	dn-&gt;ofs_in_node = offset[level];</div><div class='del'>-	dn-&gt;node_page = npage[level];</div><div class='add'>+	dn-&gt;node_folio = nfolio[level];</div><div class='ctx'> 	dn-&gt;data_blkaddr = f2fs_data_blkaddr(dn);</div><div class='ctx'> </div><div class='ctx'> 	if (is_inode_flag_set(dn-&gt;inode, FI_COMPRESSED_FILE) &amp;&amp;</div><div class='ctx'> 					f2fs_sb_has_readonly(sbi)) {</div><div class='del'>-		unsigned int c_len = f2fs_cluster_blocks_are_contiguous(dn);</div><div class='add'>+		unsigned int cluster_size = F2FS_I(dn-&gt;inode)-&gt;i_cluster_size;</div><div class='add'>+		unsigned int ofs_in_node = dn-&gt;ofs_in_node;</div><div class='add'>+		pgoff_t fofs = index;</div><div class='add'>+		unsigned int c_len;</div><div class='ctx'> 		block_t blkaddr;</div><div class='ctx'> </div><div class='add'>+		/* should align fofs and ofs_in_node to cluster_size */</div><div class='add'>+		if (fofs % cluster_size) {</div><div class='add'>+			fofs = round_down(fofs, cluster_size);</div><div class='add'>+			ofs_in_node = round_down(ofs_in_node, cluster_size);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		c_len = f2fs_cluster_blocks_are_contiguous(dn, ofs_in_node);</div><div class='ctx'> 		if (!c_len)</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='del'>-		blkaddr = f2fs_data_blkaddr(dn);</div><div class='add'>+		blkaddr = data_blkaddr(dn-&gt;inode, dn-&gt;node_folio, ofs_in_node);</div><div class='ctx'> 		if (blkaddr == COMPRESS_ADDR)</div><div class='del'>-			blkaddr = data_blkaddr(dn-&gt;inode, dn-&gt;node_page,</div><div class='del'>-						dn-&gt;ofs_in_node + 1);</div><div class='add'>+			blkaddr = data_blkaddr(dn-&gt;inode, dn-&gt;node_folio,</div><div class='add'>+						ofs_in_node + 1);</div><div class='ctx'> </div><div class='del'>-		f2fs_update_extent_tree_range_compressed(dn-&gt;inode,</div><div class='del'>-					index, blkaddr,</div><div class='del'>-					F2FS_I(dn-&gt;inode)-&gt;i_cluster_size,</div><div class='del'>-					c_len);</div><div class='add'>+		f2fs_update_read_extent_tree_range_compressed(dn-&gt;inode,</div><div class='add'>+					fofs, blkaddr, cluster_size, c_len);</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> release_pages:</div><div class='del'>-	f2fs_put_page(parent, 1);</div><div class='add'>+	f2fs_folio_put(parent, true);</div><div class='ctx'> 	if (i &gt; 1)</div><div class='del'>-		f2fs_put_page(npage[0], 0);</div><div class='add'>+		f2fs_folio_put(nfolio[0], false);</div><div class='ctx'> release_out:</div><div class='del'>-	dn-&gt;inode_page = NULL;</div><div class='del'>-	dn-&gt;node_page = NULL;</div><div class='add'>+	dn-&gt;inode_folio = NULL;</div><div class='add'>+	dn-&gt;node_folio = NULL;</div><div class='ctx'> 	if (err == -ENOENT) {</div><div class='ctx'> 		dn-&gt;cur_level = i;</div><div class='ctx'> 		dn-&gt;max_level = level;</div><div class='hunk'>@@ -887,12 +945,22 @@ static int truncate_node(struct dnode_of_data *dn)</div><div class='ctx'> 	int err;</div><div class='ctx'> 	pgoff_t index;</div><div class='ctx'> </div><div class='del'>-	err = f2fs_get_node_info(sbi, dn-&gt;nid, &amp;ni);</div><div class='add'>+	err = f2fs_get_node_info(sbi, dn-&gt;nid, &amp;ni, false);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='add'>+	if (ni.blk_addr != NEW_ADDR &amp;&amp;</div><div class='add'>+		!f2fs_is_valid_blkaddr(sbi, ni.blk_addr, DATA_GENERIC_ENHANCE)) {</div><div class='add'>+		f2fs_err_ratelimited(sbi,</div><div class='add'>+			"nat entry is corrupted, run fsck to fix it, ino:%u, "</div><div class='add'>+			"nid:%u, blkaddr:%u", ni.ino, ni.nid, ni.blk_addr);</div><div class='add'>+		set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='add'>+		f2fs_handle_error(sbi, ERROR_INCONSISTENT_NAT);</div><div class='add'>+		return -EFSCORRUPTED;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/* Deallocate node address */</div><div class='del'>-	f2fs_invalidate_blocks(sbi, ni.blk_addr);</div><div class='add'>+	f2fs_invalidate_blocks(sbi, ni.blk_addr, 1);</div><div class='ctx'> 	dec_valid_node_count(sbi, dn-&gt;inode, dn-&gt;nid == dn-&gt;inode-&gt;i_ino);</div><div class='ctx'> 	set_node_addr(sbi, &amp;ni, NULL_ADDR, false);</div><div class='ctx'> </div><div class='hunk'>@@ -902,16 +970,16 @@ static int truncate_node(struct dnode_of_data *dn)</div><div class='ctx'> 		f2fs_inode_synced(dn-&gt;inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	clear_node_page_dirty(dn-&gt;node_page);</div><div class='add'>+	clear_node_folio_dirty(dn-&gt;node_folio);</div><div class='ctx'> 	set_sbi_flag(sbi, SBI_IS_DIRTY);</div><div class='ctx'> </div><div class='del'>-	index = dn-&gt;node_page-&gt;index;</div><div class='del'>-	f2fs_put_page(dn-&gt;node_page, 1);</div><div class='add'>+	index = dn-&gt;node_folio-&gt;index;</div><div class='add'>+	f2fs_folio_put(dn-&gt;node_folio, true);</div><div class='ctx'> </div><div class='ctx'> 	invalidate_mapping_pages(NODE_MAPPING(sbi),</div><div class='ctx'> 			index, index);</div><div class='ctx'> </div><div class='del'>-	dn-&gt;node_page = NULL;</div><div class='add'>+	dn-&gt;node_folio = NULL;</div><div class='ctx'> 	trace_f2fs_truncate_node(dn-&gt;inode, dn-&gt;nid, ni.blk_addr);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -919,26 +987,38 @@ static int truncate_node(struct dnode_of_data *dn)</div><div class='ctx'> </div><div class='ctx'> static int truncate_dnode(struct dnode_of_data *dn)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(dn-&gt;inode);</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (dn-&gt;nid == 0)</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='ctx'> 	/* get direct node */</div><div class='del'>-	page = f2fs_get_node_page(F2FS_I_SB(dn-&gt;inode), dn-&gt;nid);</div><div class='del'>-	if (PTR_ERR(page) == -ENOENT)</div><div class='add'>+	folio = f2fs_get_node_folio(sbi, dn-&gt;nid, NODE_TYPE_NON_INODE);</div><div class='add'>+	if (PTR_ERR(folio) == -ENOENT)</div><div class='ctx'> 		return 1;</div><div class='del'>-	else if (IS_ERR(page))</div><div class='del'>-		return PTR_ERR(page);</div><div class='add'>+	else if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio);</div><div class='add'>+</div><div class='add'>+	if (IS_INODE(folio) || ino_of_node(folio) != dn-&gt;inode-&gt;i_ino) {</div><div class='add'>+		f2fs_err(sbi, "incorrect node reference, ino: %lu, nid: %u, ino_of_node: %u",</div><div class='add'>+				dn-&gt;inode-&gt;i_ino, dn-&gt;nid, ino_of_node(folio));</div><div class='add'>+		set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='add'>+		f2fs_handle_error(sbi, ERROR_INVALID_NODE_REFERENCE);</div><div class='add'>+		f2fs_folio_put(folio, true);</div><div class='add'>+		return -EFSCORRUPTED;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* Make dnode_of_data for parameter */</div><div class='del'>-	dn-&gt;node_page = page;</div><div class='add'>+	dn-&gt;node_folio = folio;</div><div class='ctx'> 	dn-&gt;ofs_in_node = 0;</div><div class='del'>-	f2fs_truncate_data_blocks(dn);</div><div class='add'>+	f2fs_truncate_data_blocks_range(dn, ADDRS_PER_BLOCK(dn-&gt;inode));</div><div class='ctx'> 	err = truncate_node(dn);</div><div class='del'>-	if (err)</div><div class='add'>+	if (err) {</div><div class='add'>+		f2fs_folio_put(folio, true);</div><div class='ctx'> 		return err;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	return 1;</div><div class='ctx'> }</div><div class='hunk'>@@ -947,7 +1027,7 @@ static int truncate_nodes(struct dnode_of_data *dn, unsigned int nofs,</div><div class='ctx'> 						int ofs, int depth)</div><div class='ctx'> {</div><div class='ctx'> 	struct dnode_of_data rdn = *dn;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	struct f2fs_node *rn;</div><div class='ctx'> 	nid_t child_nid;</div><div class='ctx'> 	unsigned int child_nofs;</div><div class='hunk'>@@ -959,15 +1039,16 @@ static int truncate_nodes(struct dnode_of_data *dn, unsigned int nofs,</div><div class='ctx'> </div><div class='ctx'> 	trace_f2fs_truncate_nodes_enter(dn-&gt;inode, dn-&gt;nid, dn-&gt;data_blkaddr);</div><div class='ctx'> </div><div class='del'>-	page = f2fs_get_node_page(F2FS_I_SB(dn-&gt;inode), dn-&gt;nid);</div><div class='del'>-	if (IS_ERR(page)) {</div><div class='del'>-		trace_f2fs_truncate_nodes_exit(dn-&gt;inode, PTR_ERR(page));</div><div class='del'>-		return PTR_ERR(page);</div><div class='add'>+	folio = f2fs_get_node_folio(F2FS_I_SB(dn-&gt;inode), dn-&gt;nid,</div><div class='add'>+						NODE_TYPE_NON_INODE);</div><div class='add'>+	if (IS_ERR(folio)) {</div><div class='add'>+		trace_f2fs_truncate_nodes_exit(dn-&gt;inode, PTR_ERR(folio));</div><div class='add'>+		return PTR_ERR(folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	f2fs_ra_node_pages(page, ofs, NIDS_PER_BLOCK);</div><div class='add'>+	f2fs_ra_node_pages(folio, ofs, NIDS_PER_BLOCK);</div><div class='ctx'> </div><div class='del'>-	rn = F2FS_NODE(page);</div><div class='add'>+	rn = F2FS_NODE(folio);</div><div class='ctx'> 	if (depth &lt; 3) {</div><div class='ctx'> 		for (i = ofs; i &lt; NIDS_PER_BLOCK; i++, freed++) {</div><div class='ctx'> 			child_nid = le32_to_cpu(rn-&gt;in.nid[i]);</div><div class='hunk'>@@ -977,7 +1058,7 @@ static int truncate_nodes(struct dnode_of_data *dn, unsigned int nofs,</div><div class='ctx'> 			ret = truncate_dnode(&amp;rdn);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='ctx'> 				goto out_err;</div><div class='del'>-			if (set_nid(page, i, 0, false))</div><div class='add'>+			if (set_nid(folio, i, 0, false))</div><div class='ctx'> 				dn-&gt;node_changed = true;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -991,7 +1072,7 @@ static int truncate_nodes(struct dnode_of_data *dn, unsigned int nofs,</div><div class='ctx'> 			rdn.nid = child_nid;</div><div class='ctx'> 			ret = truncate_nodes(&amp;rdn, child_nofs, 0, depth - 1);</div><div class='ctx'> 			if (ret == (NIDS_PER_BLOCK + 1)) {</div><div class='del'>-				if (set_nid(page, i, 0, false))</div><div class='add'>+				if (set_nid(folio, i, 0, false))</div><div class='ctx'> 					dn-&gt;node_changed = true;</div><div class='ctx'> 				child_nofs += ret;</div><div class='ctx'> 			} else if (ret &lt; 0 &amp;&amp; ret != -ENOENT) {</div><div class='hunk'>@@ -1003,19 +1084,19 @@ static int truncate_nodes(struct dnode_of_data *dn, unsigned int nofs,</div><div class='ctx'> </div><div class='ctx'> 	if (!ofs) {</div><div class='ctx'> 		/* remove current indirect node */</div><div class='del'>-		dn-&gt;node_page = page;</div><div class='add'>+		dn-&gt;node_folio = folio;</div><div class='ctx'> 		ret = truncate_node(dn);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto out_err;</div><div class='ctx'> 		freed++;</div><div class='ctx'> 	} else {</div><div class='del'>-		f2fs_put_page(page, 1);</div><div class='add'>+		f2fs_folio_put(folio, true);</div><div class='ctx'> 	}</div><div class='ctx'> 	trace_f2fs_truncate_nodes_exit(dn-&gt;inode, freed);</div><div class='ctx'> 	return freed;</div><div class='ctx'> </div><div class='ctx'> out_err:</div><div class='del'>-	f2fs_put_page(page, 1);</div><div class='add'>+	f2fs_folio_put(folio, true);</div><div class='ctx'> 	trace_f2fs_truncate_nodes_exit(dn-&gt;inode, ret);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -1023,59 +1104,60 @@ out_err:</div><div class='ctx'> static int truncate_partial_nodes(struct dnode_of_data *dn,</div><div class='ctx'> 			struct f2fs_inode *ri, int *offset, int depth)</div><div class='ctx'> {</div><div class='del'>-	struct page *pages[2];</div><div class='add'>+	struct folio *folios[2];</div><div class='ctx'> 	nid_t nid[3];</div><div class='ctx'> 	nid_t child_nid;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> 	int i;</div><div class='ctx'> 	int idx = depth - 2;</div><div class='ctx'> </div><div class='del'>-	nid[0] = le32_to_cpu(ri-&gt;i_nid[offset[0] - NODE_DIR1_BLOCK]);</div><div class='add'>+	nid[0] = get_nid(dn-&gt;inode_folio, offset[0], true);</div><div class='ctx'> 	if (!nid[0])</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/* get indirect nodes in the path */</div><div class='ctx'> 	for (i = 0; i &lt; idx + 1; i++) {</div><div class='ctx'> 		/* reference count'll be increased */</div><div class='del'>-		pages[i] = f2fs_get_node_page(F2FS_I_SB(dn-&gt;inode), nid[i]);</div><div class='del'>-		if (IS_ERR(pages[i])) {</div><div class='del'>-			err = PTR_ERR(pages[i]);</div><div class='add'>+		folios[i] = f2fs_get_node_folio(F2FS_I_SB(dn-&gt;inode), nid[i],</div><div class='add'>+							NODE_TYPE_NON_INODE);</div><div class='add'>+		if (IS_ERR(folios[i])) {</div><div class='add'>+			err = PTR_ERR(folios[i]);</div><div class='ctx'> 			idx = i - 1;</div><div class='ctx'> 			goto fail;</div><div class='ctx'> 		}</div><div class='del'>-		nid[i + 1] = get_nid(pages[i], offset[i + 1], false);</div><div class='add'>+		nid[i + 1] = get_nid(folios[i], offset[i + 1], false);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	f2fs_ra_node_pages(pages[idx], offset[idx + 1], NIDS_PER_BLOCK);</div><div class='add'>+	f2fs_ra_node_pages(folios[idx], offset[idx + 1], NIDS_PER_BLOCK);</div><div class='ctx'> </div><div class='ctx'> 	/* free direct nodes linked to a partial indirect node */</div><div class='ctx'> 	for (i = offset[idx + 1]; i &lt; NIDS_PER_BLOCK; i++) {</div><div class='del'>-		child_nid = get_nid(pages[idx], i, false);</div><div class='add'>+		child_nid = get_nid(folios[idx], i, false);</div><div class='ctx'> 		if (!child_nid)</div><div class='ctx'> 			continue;</div><div class='ctx'> 		dn-&gt;nid = child_nid;</div><div class='ctx'> 		err = truncate_dnode(dn);</div><div class='ctx'> 		if (err &lt; 0)</div><div class='ctx'> 			goto fail;</div><div class='del'>-		if (set_nid(pages[idx], i, 0, false))</div><div class='add'>+		if (set_nid(folios[idx], i, 0, false))</div><div class='ctx'> 			dn-&gt;node_changed = true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (offset[idx + 1] == 0) {</div><div class='del'>-		dn-&gt;node_page = pages[idx];</div><div class='add'>+		dn-&gt;node_folio = folios[idx];</div><div class='ctx'> 		dn-&gt;nid = nid[idx];</div><div class='ctx'> 		err = truncate_node(dn);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto fail;</div><div class='ctx'> 	} else {</div><div class='del'>-		f2fs_put_page(pages[idx], 1);</div><div class='add'>+		f2fs_folio_put(folios[idx], true);</div><div class='ctx'> 	}</div><div class='ctx'> 	offset[idx]++;</div><div class='ctx'> 	offset[idx + 1] = 0;</div><div class='ctx'> 	idx--;</div><div class='ctx'> fail:</div><div class='ctx'> 	for (i = idx; i &gt;= 0; i--)</div><div class='del'>-		f2fs_put_page(pages[i], 1);</div><div class='add'>+		f2fs_folio_put(folios[i], true);</div><div class='ctx'> </div><div class='ctx'> 	trace_f2fs_truncate_partial_nodes(dn-&gt;inode, nid, depth, err);</div><div class='ctx'> </div><div class='hunk'>@@ -1093,26 +1175,33 @@ int f2fs_truncate_inode_blocks(struct inode *inode, pgoff_t from)</div><div class='ctx'> 	unsigned int nofs = 0;</div><div class='ctx'> 	struct f2fs_inode *ri;</div><div class='ctx'> 	struct dnode_of_data dn;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> </div><div class='ctx'> 	trace_f2fs_truncate_inode_blocks_enter(inode, from);</div><div class='ctx'> </div><div class='ctx'> 	level = get_node_path(inode, from, offset, noffset);</div><div class='del'>-	if (level &lt; 0) {</div><div class='add'>+	if (level &lt;= 0) {</div><div class='add'>+		if (!level) {</div><div class='add'>+			level = -EFSCORRUPTED;</div><div class='add'>+			f2fs_err(sbi, "%s: inode ino=%lx has corrupted node block, from:%lu addrs:%u",</div><div class='add'>+					__func__, inode-&gt;i_ino,</div><div class='add'>+					from, ADDRS_PER_INODE(inode));</div><div class='add'>+			set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='add'>+		}</div><div class='ctx'> 		trace_f2fs_truncate_inode_blocks_exit(inode, level);</div><div class='ctx'> 		return level;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	page = f2fs_get_node_page(sbi, inode-&gt;i_ino);</div><div class='del'>-	if (IS_ERR(page)) {</div><div class='del'>-		trace_f2fs_truncate_inode_blocks_exit(inode, PTR_ERR(page));</div><div class='del'>-		return PTR_ERR(page);</div><div class='add'>+	folio = f2fs_get_inode_folio(sbi, inode-&gt;i_ino);</div><div class='add'>+	if (IS_ERR(folio)) {</div><div class='add'>+		trace_f2fs_truncate_inode_blocks_exit(inode, PTR_ERR(folio));</div><div class='add'>+		return PTR_ERR(folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	set_new_dnode(&amp;dn, inode, page, NULL, 0);</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	set_new_dnode(&amp;dn, inode, folio, NULL, 0);</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> </div><div class='del'>-	ri = F2FS_INODE(page);</div><div class='add'>+	ri = F2FS_INODE(folio);</div><div class='ctx'> 	switch (level) {</div><div class='ctx'> 	case 0:</div><div class='ctx'> 	case 1:</div><div class='hunk'>@@ -1141,7 +1230,7 @@ int f2fs_truncate_inode_blocks(struct inode *inode, pgoff_t from)</div><div class='ctx'> </div><div class='ctx'> skip_partial:</div><div class='ctx'> 	while (cont) {</div><div class='del'>-		dn.nid = le32_to_cpu(ri-&gt;i_nid[offset[0] - NODE_DIR1_BLOCK]);</div><div class='add'>+		dn.nid = get_nid(folio, offset[0], true);</div><div class='ctx'> 		switch (offset[0]) {</div><div class='ctx'> 		case NODE_DIR1_BLOCK:</div><div class='ctx'> 		case NODE_DIR2_BLOCK:</div><div class='hunk'>@@ -1161,23 +1250,30 @@ skip_partial:</div><div class='ctx'> 		default:</div><div class='ctx'> 			BUG();</div><div class='ctx'> 		}</div><div class='del'>-		if (err &lt; 0 &amp;&amp; err != -ENOENT)</div><div class='add'>+		if (err == -ENOENT) {</div><div class='add'>+			set_sbi_flag(F2FS_F_SB(folio), SBI_NEED_FSCK);</div><div class='add'>+			f2fs_handle_error(sbi, ERROR_INVALID_BLKADDR);</div><div class='add'>+			f2fs_err_ratelimited(sbi,</div><div class='add'>+				"truncate node fail, ino:%lu, nid:%u, "</div><div class='add'>+				"offset[0]:%d, offset[1]:%d, nofs:%d",</div><div class='add'>+				inode-&gt;i_ino, dn.nid, offset[0],</div><div class='add'>+				offset[1], nofs);</div><div class='add'>+			err = 0;</div><div class='add'>+		}</div><div class='add'>+		if (err &lt; 0)</div><div class='ctx'> 			goto fail;</div><div class='del'>-		if (offset[1] == 0 &amp;&amp;</div><div class='del'>-				ri-&gt;i_nid[offset[0] - NODE_DIR1_BLOCK]) {</div><div class='del'>-			lock_page(page);</div><div class='del'>-			BUG_ON(page-&gt;mapping != NODE_MAPPING(sbi));</div><div class='del'>-			f2fs_wait_on_page_writeback(page, NODE, true, true);</div><div class='del'>-			ri-&gt;i_nid[offset[0] - NODE_DIR1_BLOCK] = 0;</div><div class='del'>-			set_page_dirty(page);</div><div class='del'>-			unlock_page(page);</div><div class='add'>+		if (offset[1] == 0 &amp;&amp; get_nid(folio, offset[0], true)) {</div><div class='add'>+			folio_lock(folio);</div><div class='add'>+			BUG_ON(!is_node_folio(folio));</div><div class='add'>+			set_nid(folio, offset[0], 0, true);</div><div class='add'>+			folio_unlock(folio);</div><div class='ctx'> 		}</div><div class='ctx'> 		offset[1] = 0;</div><div class='ctx'> 		offset[0]++;</div><div class='ctx'> 		nofs += err;</div><div class='ctx'> 	}</div><div class='ctx'> fail:</div><div class='del'>-	f2fs_put_page(page, 0);</div><div class='add'>+	f2fs_folio_put(folio, false);</div><div class='ctx'> 	trace_f2fs_truncate_inode_blocks_exit(inode, err);</div><div class='ctx'> 	return err &gt; 0 ? 0 : err;</div><div class='ctx'> }</div><div class='hunk'>@@ -1188,20 +1284,20 @@ int f2fs_truncate_xattr_node(struct inode *inode)</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	nid_t nid = F2FS_I(inode)-&gt;i_xattr_nid;</div><div class='ctx'> 	struct dnode_of_data dn;</div><div class='del'>-	struct page *npage;</div><div class='add'>+	struct folio *nfolio;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (!nid)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	npage = f2fs_get_node_page(sbi, nid);</div><div class='del'>-	if (IS_ERR(npage))</div><div class='del'>-		return PTR_ERR(npage);</div><div class='add'>+	nfolio = f2fs_get_xnode_folio(sbi, nid);</div><div class='add'>+	if (IS_ERR(nfolio))</div><div class='add'>+		return PTR_ERR(nfolio);</div><div class='ctx'> </div><div class='del'>-	set_new_dnode(&amp;dn, inode, NULL, npage, nid);</div><div class='add'>+	set_new_dnode(&amp;dn, inode, NULL, nfolio, nid);</div><div class='ctx'> 	err = truncate_node(&amp;dn);</div><div class='ctx'> 	if (err) {</div><div class='del'>-		f2fs_put_page(npage, 1);</div><div class='add'>+		f2fs_folio_put(nfolio, true);</div><div class='ctx'> 		return err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1231,8 +1327,9 @@ int f2fs_remove_inode_page(struct inode *inode)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* remove potential inline_data blocks */</div><div class='del'>-	if (S_ISREG(inode-&gt;i_mode) || S_ISDIR(inode-&gt;i_mode) ||</div><div class='del'>-				S_ISLNK(inode-&gt;i_mode))</div><div class='add'>+	if (!IS_DEVICE_ALIASING(inode) &amp;&amp;</div><div class='add'>+	    (S_ISREG(inode-&gt;i_mode) || S_ISDIR(inode-&gt;i_mode) ||</div><div class='add'>+	     S_ISLNK(inode-&gt;i_mode)))</div><div class='ctx'> 		f2fs_truncate_data_blocks_range(&amp;dn, 1);</div><div class='ctx'> </div><div class='ctx'> 	/* 0 is possible, after f2fs_new_inode() has failed */</div><div class='hunk'>@@ -1257,41 +1354,52 @@ int f2fs_remove_inode_page(struct inode *inode)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct page *f2fs_new_inode_page(struct inode *inode)</div><div class='add'>+struct folio *f2fs_new_inode_folio(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct dnode_of_data dn;</div><div class='ctx'> </div><div class='ctx'> 	/* allocate inode page for new inode */</div><div class='ctx'> 	set_new_dnode(&amp;dn, inode, NULL, NULL, inode-&gt;i_ino);</div><div class='ctx'> </div><div class='del'>-	/* caller should f2fs_put_page(page, 1); */</div><div class='del'>-	return f2fs_new_node_page(&amp;dn, 0);</div><div class='add'>+	/* caller should f2fs_folio_put(folio, true); */</div><div class='add'>+	return f2fs_new_node_folio(&amp;dn, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct page *f2fs_new_node_page(struct dnode_of_data *dn, unsigned int ofs)</div><div class='add'>+struct folio *f2fs_new_node_folio(struct dnode_of_data *dn, unsigned int ofs)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(dn-&gt;inode);</div><div class='ctx'> 	struct node_info new_ni;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(is_inode_flag_set(dn-&gt;inode, FI_NO_ALLOC)))</div><div class='ctx'> 		return ERR_PTR(-EPERM);</div><div class='ctx'> </div><div class='del'>-	page = f2fs_grab_cache_page(NODE_MAPPING(sbi), dn-&gt;nid, false);</div><div class='del'>-	if (!page)</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='add'>+	folio = f2fs_grab_cache_folio(NODE_MAPPING(sbi), dn-&gt;nid, false);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return folio;</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely((err = inc_valid_node_count(sbi, dn-&gt;inode, !ofs))))</div><div class='ctx'> 		goto fail;</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_F2FS_CHECK_FS</div><div class='del'>-	err = f2fs_get_node_info(sbi, dn-&gt;nid, &amp;new_ni);</div><div class='add'>+	err = f2fs_get_node_info(sbi, dn-&gt;nid, &amp;new_ni, false);</div><div class='ctx'> 	if (err) {</div><div class='ctx'> 		dec_valid_node_count(sbi, dn-&gt;inode, !ofs);</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='del'>-	f2fs_bug_on(sbi, new_ni.blk_addr != NULL_ADDR);</div><div class='add'>+	if (unlikely(new_ni.blk_addr != NULL_ADDR)) {</div><div class='add'>+		err = -EFSCORRUPTED;</div><div class='add'>+		dec_valid_node_count(sbi, dn-&gt;inode, !ofs);</div><div class='add'>+		set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='add'>+		f2fs_warn_ratelimited(sbi,</div><div class='add'>+			"f2fs_new_node_folio: inconsistent nat entry, "</div><div class='add'>+			"ino:%u, nid:%u, blkaddr:%u, ver:%u, flag:%u",</div><div class='add'>+			new_ni.ino, new_ni.nid, new_ni.blk_addr,</div><div class='add'>+			new_ni.version, new_ni.flag);</div><div class='add'>+		f2fs_handle_error(sbi, ERROR_INCONSISTENT_NAT);</div><div class='add'>+		goto fail;</div><div class='add'>+	}</div><div class='ctx'> #endif</div><div class='ctx'> 	new_ni.nid = dn-&gt;nid;</div><div class='ctx'> 	new_ni.ino = dn-&gt;inode-&gt;i_ino;</div><div class='hunk'>@@ -1300,12 +1408,12 @@ struct page *f2fs_new_node_page(struct dnode_of_data *dn, unsigned int ofs)</div><div class='ctx'> 	new_ni.version = 0;</div><div class='ctx'> 	set_node_addr(sbi, &amp;new_ni, NEW_ADDR, false);</div><div class='ctx'> </div><div class='del'>-	f2fs_wait_on_page_writeback(page, NODE, true, true);</div><div class='del'>-	fill_node_footer(page, dn-&gt;nid, dn-&gt;inode-&gt;i_ino, ofs, true);</div><div class='del'>-	set_cold_node(page, S_ISDIR(dn-&gt;inode-&gt;i_mode));</div><div class='del'>-	if (!PageUptodate(page))</div><div class='del'>-		SetPageUptodate(page);</div><div class='del'>-	if (set_page_dirty(page))</div><div class='add'>+	f2fs_folio_wait_writeback(folio, NODE, true, true);</div><div class='add'>+	fill_node_footer(folio, dn-&gt;nid, dn-&gt;inode-&gt;i_ino, ofs, true);</div><div class='add'>+	set_cold_node(folio, S_ISDIR(dn-&gt;inode-&gt;i_mode));</div><div class='add'>+	if (!folio_test_uptodate(folio))</div><div class='add'>+		folio_mark_uptodate(folio);</div><div class='add'>+	if (folio_mark_dirty(folio))</div><div class='ctx'> 		dn-&gt;node_changed = true;</div><div class='ctx'> </div><div class='ctx'> 	if (f2fs_has_xattr_block(ofs))</div><div class='hunk'>@@ -1313,49 +1421,47 @@ struct page *f2fs_new_node_page(struct dnode_of_data *dn, unsigned int ofs)</div><div class='ctx'> </div><div class='ctx'> 	if (ofs == 0)</div><div class='ctx'> 		inc_valid_inode_count(sbi);</div><div class='del'>-	return page;</div><div class='del'>-</div><div class='add'>+	return folio;</div><div class='ctx'> fail:</div><div class='del'>-	clear_node_page_dirty(page);</div><div class='del'>-	f2fs_put_page(page, 1);</div><div class='add'>+	clear_node_folio_dirty(folio);</div><div class='add'>+	f2fs_folio_put(folio, true);</div><div class='ctx'> 	return ERR_PTR(err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Caller should do after getting the following values.</div><div class='del'>- * 0: f2fs_put_page(page, 0)</div><div class='del'>- * LOCKED_PAGE or error: f2fs_put_page(page, 1)</div><div class='add'>+ * 0: f2fs_folio_put(folio, false)</div><div class='add'>+ * LOCKED_PAGE or error: f2fs_folio_put(folio, true)</div><div class='ctx'>  */</div><div class='del'>-static int read_node_page(struct page *page, int op_flags)</div><div class='add'>+static int read_node_folio(struct folio *folio, blk_opf_t op_flags)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_sb_info *sbi = F2FS_P_SB(page);</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_F_SB(folio);</div><div class='ctx'> 	struct node_info ni;</div><div class='ctx'> 	struct f2fs_io_info fio = {</div><div class='ctx'> 		.sbi = sbi,</div><div class='ctx'> 		.type = NODE,</div><div class='ctx'> 		.op = REQ_OP_READ,</div><div class='ctx'> 		.op_flags = op_flags,</div><div class='del'>-		.page = page,</div><div class='add'>+		.folio = folio,</div><div class='ctx'> 		.encrypted_page = NULL,</div><div class='ctx'> 	};</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	if (PageUptodate(page)) {</div><div class='del'>-		if (!f2fs_inode_chksum_verify(sbi, page)) {</div><div class='del'>-			ClearPageUptodate(page);</div><div class='add'>+	if (folio_test_uptodate(folio)) {</div><div class='add'>+		if (!f2fs_inode_chksum_verify(sbi, folio)) {</div><div class='add'>+			folio_clear_uptodate(folio);</div><div class='ctx'> 			return -EFSBADCRC;</div><div class='ctx'> 		}</div><div class='ctx'> 		return LOCKED_PAGE;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = f2fs_get_node_info(sbi, page-&gt;index, &amp;ni);</div><div class='add'>+	err = f2fs_get_node_info(sbi, folio-&gt;index, &amp;ni, false);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='ctx'> 	/* NEW_ADDR can be seen, after cp_error drops some dirty node pages */</div><div class='del'>-	if (unlikely(ni.blk_addr == NULL_ADDR || ni.blk_addr == NEW_ADDR) ||</div><div class='del'>-			is_sbi_flag_set(sbi, SBI_IS_SHUTDOWN)) {</div><div class='del'>-		ClearPageUptodate(page);</div><div class='add'>+	if (unlikely(ni.blk_addr == NULL_ADDR || ni.blk_addr == NEW_ADDR)) {</div><div class='add'>+		folio_clear_uptodate(folio);</div><div class='ctx'> 		return -ENOENT;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1364,7 +1470,7 @@ static int read_node_page(struct page *page, int op_flags)</div><div class='ctx'> 	err = f2fs_submit_page_bio(&amp;fio);</div><div class='ctx'> </div><div class='ctx'> 	if (!err)</div><div class='del'>-		f2fs_update_iostat(sbi, FS_NODE_READ_IO, F2FS_BLKSIZE);</div><div class='add'>+		f2fs_update_iostat(sbi, NULL, FS_NODE_READ_IO, F2FS_BLKSIZE);</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='hunk'>@@ -1374,7 +1480,7 @@ static int read_node_page(struct page *page, int op_flags)</div><div class='ctx'>  */</div><div class='ctx'> void f2fs_ra_node_page(struct f2fs_sb_info *sbi, nid_t nid)</div><div class='ctx'> {</div><div class='del'>-	struct page *apage;</div><div class='add'>+	struct folio *afolio;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (!nid)</div><div class='hunk'>@@ -1382,22 +1488,59 @@ void f2fs_ra_node_page(struct f2fs_sb_info *sbi, nid_t nid)</div><div class='ctx'> 	if (f2fs_check_nid_range(sbi, nid))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	apage = xa_load(&amp;NODE_MAPPING(sbi)-&gt;i_pages, nid);</div><div class='del'>-	if (apage)</div><div class='add'>+	afolio = xa_load(&amp;NODE_MAPPING(sbi)-&gt;i_pages, nid);</div><div class='add'>+	if (afolio)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	apage = f2fs_grab_cache_page(NODE_MAPPING(sbi), nid, false);</div><div class='del'>-	if (!apage)</div><div class='add'>+	afolio = f2fs_grab_cache_folio(NODE_MAPPING(sbi), nid, false);</div><div class='add'>+	if (IS_ERR(afolio))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	err = read_node_page(apage, REQ_RAHEAD);</div><div class='del'>-	f2fs_put_page(apage, err ? 1 : 0);</div><div class='add'>+	err = read_node_folio(afolio, REQ_RAHEAD);</div><div class='add'>+	f2fs_folio_put(afolio, err ? true : false);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct page *__get_node_page(struct f2fs_sb_info *sbi, pgoff_t nid,</div><div class='del'>-					struct page *parent, int start)</div><div class='add'>+static int sanity_check_node_footer(struct f2fs_sb_info *sbi,</div><div class='add'>+					struct folio *folio, pgoff_t nid,</div><div class='add'>+					enum node_type ntype)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='add'>+	if (unlikely(nid != nid_of_node(folio)))</div><div class='add'>+		goto out_err;</div><div class='add'>+</div><div class='add'>+	switch (ntype) {</div><div class='add'>+	case NODE_TYPE_INODE:</div><div class='add'>+		if (!IS_INODE(folio))</div><div class='add'>+			goto out_err;</div><div class='add'>+		break;</div><div class='add'>+	case NODE_TYPE_XATTR:</div><div class='add'>+		if (!f2fs_has_xattr_block(ofs_of_node(folio)))</div><div class='add'>+			goto out_err;</div><div class='add'>+		break;</div><div class='add'>+	case NODE_TYPE_NON_INODE:</div><div class='add'>+		if (IS_INODE(folio))</div><div class='add'>+			goto out_err;</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+	if (time_to_inject(sbi, FAULT_INCONSISTENT_FOOTER))</div><div class='add'>+		goto out_err;</div><div class='add'>+	return 0;</div><div class='add'>+out_err:</div><div class='add'>+	f2fs_warn(sbi, "inconsistent node block, node_type:%d, nid:%lu, "</div><div class='add'>+		  "node_footer[nid:%u,ino:%u,ofs:%u,cpver:%llu,blkaddr:%u]",</div><div class='add'>+		  ntype, nid, nid_of_node(folio), ino_of_node(folio),</div><div class='add'>+		  ofs_of_node(folio), cpver_of_node(folio),</div><div class='add'>+		  next_blkaddr_of_node(folio));</div><div class='add'>+	set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='add'>+	f2fs_handle_error(sbi, ERROR_INCONSISTENT_FOOTER);</div><div class='add'>+	return -EFSCORRUPTED;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct folio *__get_node_folio(struct f2fs_sb_info *sbi, pgoff_t nid,</div><div class='add'>+		struct folio *parent, int start, enum node_type ntype)</div><div class='add'>+{</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (!nid)</div><div class='hunk'>@@ -1405,71 +1548,77 @@ static struct page *__get_node_page(struct f2fs_sb_info *sbi, pgoff_t nid,</div><div class='ctx'> 	if (f2fs_check_nid_range(sbi, nid))</div><div class='ctx'> 		return ERR_PTR(-EINVAL);</div><div class='ctx'> repeat:</div><div class='del'>-	page = f2fs_grab_cache_page(NODE_MAPPING(sbi), nid, false);</div><div class='del'>-	if (!page)</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='del'>-</div><div class='del'>-	err = read_node_page(page, 0);</div><div class='del'>-	if (err &lt; 0) {</div><div class='del'>-		f2fs_put_page(page, 1);</div><div class='del'>-		return ERR_PTR(err);</div><div class='del'>-	} else if (err == LOCKED_PAGE) {</div><div class='del'>-		err = 0;</div><div class='add'>+	folio = f2fs_grab_cache_folio(NODE_MAPPING(sbi), nid, false);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return folio;</div><div class='add'>+</div><div class='add'>+	err = read_node_folio(folio, 0);</div><div class='add'>+	if (err &lt; 0)</div><div class='add'>+		goto out_put_err;</div><div class='add'>+	if (err == LOCKED_PAGE)</div><div class='ctx'> 		goto page_hit;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	if (parent)</div><div class='ctx'> 		f2fs_ra_node_pages(parent, start + 1, MAX_RA_NODE);</div><div class='ctx'> </div><div class='del'>-	lock_page(page);</div><div class='add'>+	folio_lock(folio);</div><div class='ctx'> </div><div class='del'>-	if (unlikely(page-&gt;mapping != NODE_MAPPING(sbi))) {</div><div class='del'>-		f2fs_put_page(page, 1);</div><div class='add'>+	if (unlikely(!is_node_folio(folio))) {</div><div class='add'>+		f2fs_folio_put(folio, true);</div><div class='ctx'> 		goto repeat;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (unlikely(!PageUptodate(page))) {</div><div class='add'>+	if (unlikely(!folio_test_uptodate(folio))) {</div><div class='ctx'> 		err = -EIO;</div><div class='del'>-		goto out_err;</div><div class='add'>+		goto out_put_err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!f2fs_inode_chksum_verify(sbi, page)) {</div><div class='add'>+	if (!f2fs_inode_chksum_verify(sbi, folio)) {</div><div class='ctx'> 		err = -EFSBADCRC;</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> 	}</div><div class='ctx'> page_hit:</div><div class='del'>-	if (unlikely(nid != nid_of_node(page))) {</div><div class='del'>-		f2fs_warn(sbi, "inconsistent node block, nid:%lu, node_footer[nid:%u,ino:%u,ofs:%u,cpver:%llu,blkaddr:%u]",</div><div class='del'>-			  nid, nid_of_node(page), ino_of_node(page),</div><div class='del'>-			  ofs_of_node(page), cpver_of_node(page),</div><div class='del'>-			  next_blkaddr_of_node(page));</div><div class='del'>-		set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='del'>-		err = -EINVAL;</div><div class='add'>+	err = sanity_check_node_footer(sbi, folio, nid, ntype);</div><div class='add'>+	if (!err)</div><div class='add'>+		return folio;</div><div class='ctx'> out_err:</div><div class='del'>-		ClearPageUptodate(page);</div><div class='del'>-		f2fs_put_page(page, 1);</div><div class='del'>-		return ERR_PTR(err);</div><div class='del'>-	}</div><div class='del'>-	return page;</div><div class='add'>+	folio_clear_uptodate(folio);</div><div class='add'>+out_put_err:</div><div class='add'>+	/* ENOENT comes from read_node_folio which is not an error. */</div><div class='add'>+	if (err != -ENOENT)</div><div class='add'>+		f2fs_handle_page_eio(sbi, folio, NODE);</div><div class='add'>+	f2fs_folio_put(folio, true);</div><div class='add'>+	return ERR_PTR(err);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct folio *f2fs_get_node_folio(struct f2fs_sb_info *sbi, pgoff_t nid,</div><div class='add'>+						enum node_type node_type)</div><div class='add'>+{</div><div class='add'>+	return __get_node_folio(sbi, nid, NULL, 0, node_type);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct page *f2fs_get_node_page(struct f2fs_sb_info *sbi, pgoff_t nid)</div><div class='add'>+struct folio *f2fs_get_inode_folio(struct f2fs_sb_info *sbi, pgoff_t ino)</div><div class='ctx'> {</div><div class='del'>-	return __get_node_page(sbi, nid, NULL, 0);</div><div class='add'>+	return __get_node_folio(sbi, ino, NULL, 0, NODE_TYPE_INODE);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct page *f2fs_get_node_page_ra(struct page *parent, int start)</div><div class='add'>+struct folio *f2fs_get_xnode_folio(struct f2fs_sb_info *sbi, pgoff_t xnid)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_sb_info *sbi = F2FS_P_SB(parent);</div><div class='add'>+	return __get_node_folio(sbi, xnid, NULL, 0, NODE_TYPE_XATTR);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct folio *f2fs_get_node_folio_ra(struct folio *parent, int start)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_F_SB(parent);</div><div class='ctx'> 	nid_t nid = get_nid(parent, start, false);</div><div class='ctx'> </div><div class='del'>-	return __get_node_page(sbi, nid, parent, start);</div><div class='add'>+	return __get_node_folio(sbi, nid, parent, start, NODE_TYPE_REGULAR);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void flush_inline_data(struct f2fs_sb_info *sbi, nid_t ino)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	/* should flush inline_data before evict_inode */</div><div class='hunk'>@@ -1477,115 +1626,119 @@ static void flush_inline_data(struct f2fs_sb_info *sbi, nid_t ino)</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	page = f2fs_pagecache_get_page(inode-&gt;i_mapping, 0,</div><div class='add'>+	folio = f2fs_filemap_get_folio(inode-&gt;i_mapping, 0,</div><div class='ctx'> 					FGP_LOCK|FGP_NOWAIT, 0);</div><div class='del'>-	if (!page)</div><div class='add'>+	if (IS_ERR(folio))</div><div class='ctx'> 		goto iput_out;</div><div class='ctx'> </div><div class='del'>-	if (!PageUptodate(page))</div><div class='del'>-		goto page_out;</div><div class='add'>+	if (!folio_test_uptodate(folio))</div><div class='add'>+		goto folio_out;</div><div class='ctx'> </div><div class='del'>-	if (!PageDirty(page))</div><div class='del'>-		goto page_out;</div><div class='add'>+	if (!folio_test_dirty(folio))</div><div class='add'>+		goto folio_out;</div><div class='ctx'> </div><div class='del'>-	if (!clear_page_dirty_for_io(page))</div><div class='del'>-		goto page_out;</div><div class='add'>+	if (!folio_clear_dirty_for_io(folio))</div><div class='add'>+		goto folio_out;</div><div class='ctx'> </div><div class='del'>-	ret = f2fs_write_inline_data(inode, page);</div><div class='add'>+	ret = f2fs_write_inline_data(inode, folio);</div><div class='ctx'> 	inode_dec_dirty_pages(inode);</div><div class='ctx'> 	f2fs_remove_dirty_inode(inode);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		set_page_dirty(page);</div><div class='del'>-page_out:</div><div class='del'>-	f2fs_put_page(page, 1);</div><div class='add'>+		folio_mark_dirty(folio);</div><div class='add'>+folio_out:</div><div class='add'>+	f2fs_folio_put(folio, true);</div><div class='ctx'> iput_out:</div><div class='ctx'> 	iput(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct page *last_fsync_dnode(struct f2fs_sb_info *sbi, nid_t ino)</div><div class='add'>+static struct folio *last_fsync_dnode(struct f2fs_sb_info *sbi, nid_t ino)</div><div class='ctx'> {</div><div class='ctx'> 	pgoff_t index;</div><div class='del'>-	struct pagevec pvec;</div><div class='del'>-	struct page *last_page = NULL;</div><div class='del'>-	int nr_pages;</div><div class='add'>+	struct folio_batch fbatch;</div><div class='add'>+	struct folio *last_folio = NULL;</div><div class='add'>+	int nr_folios;</div><div class='ctx'> </div><div class='del'>-	pagevec_init(&amp;pvec);</div><div class='add'>+	folio_batch_init(&amp;fbatch);</div><div class='ctx'> 	index = 0;</div><div class='ctx'> </div><div class='del'>-	while ((nr_pages = pagevec_lookup_tag(&amp;pvec, NODE_MAPPING(sbi), &amp;index,</div><div class='del'>-				PAGECACHE_TAG_DIRTY))) {</div><div class='add'>+	while ((nr_folios = filemap_get_folios_tag(NODE_MAPPING(sbi), &amp;index,</div><div class='add'>+					(pgoff_t)-1, PAGECACHE_TAG_DIRTY,</div><div class='add'>+					&amp;fbatch))) {</div><div class='ctx'> 		int i;</div><div class='ctx'> </div><div class='del'>-		for (i = 0; i &lt; nr_pages; i++) {</div><div class='del'>-			struct page *page = pvec.pages[i];</div><div class='add'>+		for (i = 0; i &lt; nr_folios; i++) {</div><div class='add'>+			struct folio *folio = fbatch.folios[i];</div><div class='ctx'> </div><div class='ctx'> 			if (unlikely(f2fs_cp_error(sbi))) {</div><div class='del'>-				f2fs_put_page(last_page, 0);</div><div class='del'>-				pagevec_release(&amp;pvec);</div><div class='add'>+				f2fs_folio_put(last_folio, false);</div><div class='add'>+				folio_batch_release(&amp;fbatch);</div><div class='ctx'> 				return ERR_PTR(-EIO);</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			if (!IS_DNODE(page) || !is_cold_node(page))</div><div class='add'>+			if (!IS_DNODE(folio) || !is_cold_node(folio))</div><div class='ctx'> 				continue;</div><div class='del'>-			if (ino_of_node(page) != ino)</div><div class='add'>+			if (ino_of_node(folio) != ino)</div><div class='ctx'> 				continue;</div><div class='ctx'> </div><div class='del'>-			lock_page(page);</div><div class='add'>+			folio_lock(folio);</div><div class='ctx'> </div><div class='del'>-			if (unlikely(page-&gt;mapping != NODE_MAPPING(sbi))) {</div><div class='add'>+			if (unlikely(!is_node_folio(folio))) {</div><div class='ctx'> continue_unlock:</div><div class='del'>-				unlock_page(page);</div><div class='add'>+				folio_unlock(folio);</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='del'>-			if (ino_of_node(page) != ino)</div><div class='add'>+			if (ino_of_node(folio) != ino)</div><div class='ctx'> 				goto continue_unlock;</div><div class='ctx'> </div><div class='del'>-			if (!PageDirty(page)) {</div><div class='add'>+			if (!folio_test_dirty(folio)) {</div><div class='ctx'> 				/* someone wrote it for us */</div><div class='ctx'> 				goto continue_unlock;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			if (last_page)</div><div class='del'>-				f2fs_put_page(last_page, 0);</div><div class='add'>+			if (last_folio)</div><div class='add'>+				f2fs_folio_put(last_folio, false);</div><div class='ctx'> </div><div class='del'>-			get_page(page);</div><div class='del'>-			last_page = page;</div><div class='del'>-			unlock_page(page);</div><div class='add'>+			folio_get(folio);</div><div class='add'>+			last_folio = folio;</div><div class='add'>+			folio_unlock(folio);</div><div class='ctx'> 		}</div><div class='del'>-		pagevec_release(&amp;pvec);</div><div class='add'>+		folio_batch_release(&amp;fbatch);</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 	}</div><div class='del'>-	return last_page;</div><div class='add'>+	return last_folio;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __write_node_page(struct page *page, bool atomic, bool *submitted,</div><div class='add'>+static bool __write_node_folio(struct folio *folio, bool atomic, bool *submitted,</div><div class='ctx'> 				struct writeback_control *wbc, bool do_balance,</div><div class='ctx'> 				enum iostat_type io_type, unsigned int *seq_id)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_sb_info *sbi = F2FS_P_SB(page);</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_F_SB(folio);</div><div class='ctx'> 	nid_t nid;</div><div class='ctx'> 	struct node_info ni;</div><div class='ctx'> 	struct f2fs_io_info fio = {</div><div class='ctx'> 		.sbi = sbi,</div><div class='del'>-		.ino = ino_of_node(page),</div><div class='add'>+		.ino = ino_of_node(folio),</div><div class='ctx'> 		.type = NODE,</div><div class='ctx'> 		.op = REQ_OP_WRITE,</div><div class='ctx'> 		.op_flags = wbc_to_write_flags(wbc),</div><div class='del'>-		.page = page,</div><div class='add'>+		.folio = folio,</div><div class='ctx'> 		.encrypted_page = NULL,</div><div class='del'>-		.submitted = false,</div><div class='add'>+		.submitted = 0,</div><div class='ctx'> 		.io_type = io_type,</div><div class='ctx'> 		.io_wbc = wbc,</div><div class='ctx'> 	};</div><div class='ctx'> 	unsigned int seq;</div><div class='ctx'> </div><div class='del'>-	trace_f2fs_writepage(page, NODE);</div><div class='add'>+	trace_f2fs_writepage(folio, NODE);</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(f2fs_cp_error(sbi))) {</div><div class='del'>-		ClearPageUptodate(page);</div><div class='add'>+		/* keep node pages in remount-ro mode */</div><div class='add'>+		if (F2FS_OPTION(sbi).errors == MOUNT_ERRORS_READONLY)</div><div class='add'>+			goto redirty_out;</div><div class='add'>+		folio_clear_uptodate(folio);</div><div class='ctx'> 		dec_page_count(sbi, F2FS_DIRTY_NODES);</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		return 0;</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		return true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(is_sbi_flag_set(sbi, SBI_POR_DOING)))</div><div class='hunk'>@@ -1593,36 +1746,31 @@ static int __write_node_page(struct page *page, bool atomic, bool *submitted,</div><div class='ctx'> </div><div class='ctx'> 	if (!is_sbi_flag_set(sbi, SBI_CP_DISABLED) &amp;&amp;</div><div class='ctx'> 			wbc-&gt;sync_mode == WB_SYNC_NONE &amp;&amp;</div><div class='del'>-			IS_DNODE(page) &amp;&amp; is_cold_node(page))</div><div class='add'>+			IS_DNODE(folio) &amp;&amp; is_cold_node(folio))</div><div class='ctx'> 		goto redirty_out;</div><div class='ctx'> </div><div class='ctx'> 	/* get old block addr of this node page */</div><div class='del'>-	nid = nid_of_node(page);</div><div class='del'>-	f2fs_bug_on(sbi, page-&gt;index != nid);</div><div class='add'>+	nid = nid_of_node(folio);</div><div class='add'>+	f2fs_bug_on(sbi, folio-&gt;index != nid);</div><div class='ctx'> </div><div class='del'>-	if (f2fs_get_node_info(sbi, nid, &amp;ni))</div><div class='add'>+	if (f2fs_get_node_info(sbi, nid, &amp;ni, !do_balance))</div><div class='ctx'> 		goto redirty_out;</div><div class='ctx'> </div><div class='del'>-	if (wbc-&gt;for_reclaim) {</div><div class='del'>-		if (!down_read_trylock(&amp;sbi-&gt;node_write))</div><div class='del'>-			goto redirty_out;</div><div class='del'>-	} else {</div><div class='del'>-		down_read(&amp;sbi-&gt;node_write);</div><div class='del'>-	}</div><div class='add'>+	f2fs_down_read(&amp;sbi-&gt;node_write);</div><div class='ctx'> </div><div class='ctx'> 	/* This page is already truncated */</div><div class='ctx'> 	if (unlikely(ni.blk_addr == NULL_ADDR)) {</div><div class='del'>-		ClearPageUptodate(page);</div><div class='add'>+		folio_clear_uptodate(folio);</div><div class='ctx'> 		dec_page_count(sbi, F2FS_DIRTY_NODES);</div><div class='del'>-		up_read(&amp;sbi-&gt;node_write);</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		return 0;</div><div class='add'>+		f2fs_up_read(&amp;sbi-&gt;node_write);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		return true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (__is_valid_data_blkaddr(ni.blk_addr) &amp;&amp;</div><div class='ctx'> 		!f2fs_is_valid_blkaddr(sbi, ni.blk_addr,</div><div class='ctx'> 					DATA_GENERIC_ENHANCE)) {</div><div class='del'>-		up_read(&amp;sbi-&gt;node_write);</div><div class='add'>+		f2fs_up_read(&amp;sbi-&gt;node_write);</div><div class='ctx'> 		goto redirty_out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1630,27 +1778,21 @@ static int __write_node_page(struct page *page, bool atomic, bool *submitted,</div><div class='ctx'> 		fio.op_flags |= REQ_PREFLUSH | REQ_FUA;</div><div class='ctx'> </div><div class='ctx'> 	/* should add to global list before clearing PAGECACHE status */</div><div class='del'>-	if (f2fs_in_warm_node_list(sbi, page)) {</div><div class='del'>-		seq = f2fs_add_fsync_node_entry(sbi, page);</div><div class='add'>+	if (f2fs_in_warm_node_list(sbi, folio)) {</div><div class='add'>+		seq = f2fs_add_fsync_node_entry(sbi, folio);</div><div class='ctx'> 		if (seq_id)</div><div class='ctx'> 			*seq_id = seq;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	set_page_writeback(page);</div><div class='del'>-	ClearPageError(page);</div><div class='add'>+	folio_start_writeback(folio);</div><div class='ctx'> </div><div class='ctx'> 	fio.old_blkaddr = ni.blk_addr;</div><div class='ctx'> 	f2fs_do_write_node_page(nid, &amp;fio);</div><div class='del'>-	set_node_addr(sbi, &amp;ni, fio.new_blkaddr, is_fsync_dnode(page));</div><div class='add'>+	set_node_addr(sbi, &amp;ni, fio.new_blkaddr, is_fsync_dnode(folio));</div><div class='ctx'> 	dec_page_count(sbi, F2FS_DIRTY_NODES);</div><div class='del'>-	up_read(&amp;sbi-&gt;node_write);</div><div class='add'>+	f2fs_up_read(&amp;sbi-&gt;node_write);</div><div class='ctx'> </div><div class='del'>-	if (wbc-&gt;for_reclaim) {</div><div class='del'>-		f2fs_submit_merged_write_cond(sbi, NULL, page, 0, NODE);</div><div class='del'>-		submitted = NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(f2fs_cp_error(sbi))) {</div><div class='ctx'> 		f2fs_submit_merged_write(sbi, NODE);</div><div class='hunk'>@@ -1661,14 +1803,15 @@ static int __write_node_page(struct page *page, bool atomic, bool *submitted,</div><div class='ctx'> </div><div class='ctx'> 	if (do_balance)</div><div class='ctx'> 		f2fs_balance_fs(sbi, false);</div><div class='del'>-	return 0;</div><div class='add'>+	return true;</div><div class='ctx'> </div><div class='ctx'> redirty_out:</div><div class='del'>-	redirty_page_for_writepage(wbc, page);</div><div class='del'>-	return AOP_WRITEPAGE_ACTIVATE;</div><div class='add'>+	folio_redirty_for_writepage(wbc, folio);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int f2fs_move_node_page(struct page *node_page, int gc_type)</div><div class='add'>+int f2fs_move_node_folio(struct folio *node_folio, int gc_type)</div><div class='ctx'> {</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -1676,159 +1819,149 @@ int f2fs_move_node_page(struct page *node_page, int gc_type)</div><div class='ctx'> 		struct writeback_control wbc = {</div><div class='ctx'> 			.sync_mode = WB_SYNC_ALL,</div><div class='ctx'> 			.nr_to_write = 1,</div><div class='del'>-			.for_reclaim = 0,</div><div class='ctx'> 		};</div><div class='ctx'> </div><div class='del'>-		f2fs_wait_on_page_writeback(node_page, NODE, true, true);</div><div class='add'>+		f2fs_folio_wait_writeback(node_folio, NODE, true, true);</div><div class='ctx'> </div><div class='del'>-		set_page_dirty(node_page);</div><div class='add'>+		folio_mark_dirty(node_folio);</div><div class='ctx'> </div><div class='del'>-		if (!clear_page_dirty_for_io(node_page)) {</div><div class='add'>+		if (!folio_clear_dirty_for_io(node_folio)) {</div><div class='ctx'> 			err = -EAGAIN;</div><div class='ctx'> 			goto out_page;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (__write_node_page(node_page, false, NULL,</div><div class='del'>-					&amp;wbc, false, FS_GC_NODE_IO, NULL)) {</div><div class='add'>+		if (!__write_node_folio(node_folio, false, NULL,</div><div class='add'>+					&amp;wbc, false, FS_GC_NODE_IO, NULL))</div><div class='ctx'> 			err = -EAGAIN;</div><div class='del'>-			unlock_page(node_page);</div><div class='del'>-		}</div><div class='ctx'> 		goto release_page;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		/* set page dirty and write it */</div><div class='del'>-		if (!PageWriteback(node_page))</div><div class='del'>-			set_page_dirty(node_page);</div><div class='add'>+		if (!folio_test_writeback(node_folio))</div><div class='add'>+			folio_mark_dirty(node_folio);</div><div class='ctx'> 	}</div><div class='ctx'> out_page:</div><div class='del'>-	unlock_page(node_page);</div><div class='add'>+	folio_unlock(node_folio);</div><div class='ctx'> release_page:</div><div class='del'>-	f2fs_put_page(node_page, 0);</div><div class='add'>+	f2fs_folio_put(node_folio, false);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_write_node_page(struct page *page,</div><div class='del'>-				struct writeback_control *wbc)</div><div class='del'>-{</div><div class='del'>-	return __write_node_page(page, false, NULL, wbc, false,</div><div class='del'>-						FS_NODE_IO, NULL);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> int f2fs_fsync_node_pages(struct f2fs_sb_info *sbi, struct inode *inode,</div><div class='ctx'> 			struct writeback_control *wbc, bool atomic,</div><div class='ctx'> 			unsigned int *seq_id)</div><div class='ctx'> {</div><div class='ctx'> 	pgoff_t index;</div><div class='del'>-	struct pagevec pvec;</div><div class='add'>+	struct folio_batch fbatch;</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	struct page *last_page = NULL;</div><div class='add'>+	struct folio *last_folio = NULL;</div><div class='ctx'> 	bool marked = false;</div><div class='ctx'> 	nid_t ino = inode-&gt;i_ino;</div><div class='del'>-	int nr_pages;</div><div class='add'>+	int nr_folios;</div><div class='ctx'> 	int nwritten = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (atomic) {</div><div class='del'>-		last_page = last_fsync_dnode(sbi, ino);</div><div class='del'>-		if (IS_ERR_OR_NULL(last_page))</div><div class='del'>-			return PTR_ERR_OR_ZERO(last_page);</div><div class='add'>+		last_folio = last_fsync_dnode(sbi, ino);</div><div class='add'>+		if (IS_ERR_OR_NULL(last_folio))</div><div class='add'>+			return PTR_ERR_OR_ZERO(last_folio);</div><div class='ctx'> 	}</div><div class='ctx'> retry:</div><div class='del'>-	pagevec_init(&amp;pvec);</div><div class='add'>+	folio_batch_init(&amp;fbatch);</div><div class='ctx'> 	index = 0;</div><div class='ctx'> </div><div class='del'>-	while ((nr_pages = pagevec_lookup_tag(&amp;pvec, NODE_MAPPING(sbi), &amp;index,</div><div class='del'>-				PAGECACHE_TAG_DIRTY))) {</div><div class='add'>+	while ((nr_folios = filemap_get_folios_tag(NODE_MAPPING(sbi), &amp;index,</div><div class='add'>+					(pgoff_t)-1, PAGECACHE_TAG_DIRTY,</div><div class='add'>+					&amp;fbatch))) {</div><div class='ctx'> 		int i;</div><div class='ctx'> </div><div class='del'>-		for (i = 0; i &lt; nr_pages; i++) {</div><div class='del'>-			struct page *page = pvec.pages[i];</div><div class='add'>+		for (i = 0; i &lt; nr_folios; i++) {</div><div class='add'>+			struct folio *folio = fbatch.folios[i];</div><div class='ctx'> 			bool submitted = false;</div><div class='ctx'> </div><div class='ctx'> 			if (unlikely(f2fs_cp_error(sbi))) {</div><div class='del'>-				f2fs_put_page(last_page, 0);</div><div class='del'>-				pagevec_release(&amp;pvec);</div><div class='add'>+				f2fs_folio_put(last_folio, false);</div><div class='add'>+				folio_batch_release(&amp;fbatch);</div><div class='ctx'> 				ret = -EIO;</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			if (!IS_DNODE(page) || !is_cold_node(page))</div><div class='add'>+			if (!IS_DNODE(folio) || !is_cold_node(folio))</div><div class='ctx'> 				continue;</div><div class='del'>-			if (ino_of_node(page) != ino)</div><div class='add'>+			if (ino_of_node(folio) != ino)</div><div class='ctx'> 				continue;</div><div class='ctx'> </div><div class='del'>-			lock_page(page);</div><div class='add'>+			folio_lock(folio);</div><div class='ctx'> </div><div class='del'>-			if (unlikely(page-&gt;mapping != NODE_MAPPING(sbi))) {</div><div class='add'>+			if (unlikely(!is_node_folio(folio))) {</div><div class='ctx'> continue_unlock:</div><div class='del'>-				unlock_page(page);</div><div class='add'>+				folio_unlock(folio);</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='del'>-			if (ino_of_node(page) != ino)</div><div class='add'>+			if (ino_of_node(folio) != ino)</div><div class='ctx'> 				goto continue_unlock;</div><div class='ctx'> </div><div class='del'>-			if (!PageDirty(page) &amp;&amp; page != last_page) {</div><div class='add'>+			if (!folio_test_dirty(folio) &amp;&amp; folio != last_folio) {</div><div class='ctx'> 				/* someone wrote it for us */</div><div class='ctx'> 				goto continue_unlock;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			f2fs_wait_on_page_writeback(page, NODE, true, true);</div><div class='add'>+			f2fs_folio_wait_writeback(folio, NODE, true, true);</div><div class='ctx'> </div><div class='del'>-			set_fsync_mark(page, 0);</div><div class='del'>-			set_dentry_mark(page, 0);</div><div class='add'>+			set_fsync_mark(folio, 0);</div><div class='add'>+			set_dentry_mark(folio, 0);</div><div class='ctx'> </div><div class='del'>-			if (!atomic || page == last_page) {</div><div class='del'>-				set_fsync_mark(page, 1);</div><div class='del'>-				if (IS_INODE(page)) {</div><div class='add'>+			if (!atomic || folio == last_folio) {</div><div class='add'>+				set_fsync_mark(folio, 1);</div><div class='add'>+				percpu_counter_inc(&amp;sbi-&gt;rf_node_block_count);</div><div class='add'>+				if (IS_INODE(folio)) {</div><div class='ctx'> 					if (is_inode_flag_set(inode,</div><div class='ctx'> 								FI_DIRTY_INODE))</div><div class='del'>-						f2fs_update_inode(inode, page);</div><div class='del'>-					set_dentry_mark(page,</div><div class='add'>+						f2fs_update_inode(inode, folio);</div><div class='add'>+					set_dentry_mark(folio,</div><div class='ctx'> 						f2fs_need_dentry_mark(sbi, ino));</div><div class='ctx'> 				}</div><div class='ctx'> 				/* may be written by other thread */</div><div class='del'>-				if (!PageDirty(page))</div><div class='del'>-					set_page_dirty(page);</div><div class='add'>+				if (!folio_test_dirty(folio))</div><div class='add'>+					folio_mark_dirty(folio);</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			if (!clear_page_dirty_for_io(page))</div><div class='add'>+			if (!folio_clear_dirty_for_io(folio))</div><div class='ctx'> 				goto continue_unlock;</div><div class='ctx'> </div><div class='del'>-			ret = __write_node_page(page, atomic &amp;&amp;</div><div class='del'>-						page == last_page,</div><div class='add'>+			if (!__write_node_folio(folio, atomic &amp;&amp;</div><div class='add'>+						folio == last_folio,</div><div class='ctx'> 						&amp;submitted, wbc, true,</div><div class='del'>-						FS_NODE_IO, seq_id);</div><div class='del'>-			if (ret) {</div><div class='del'>-				unlock_page(page);</div><div class='del'>-				f2fs_put_page(last_page, 0);</div><div class='del'>-				break;</div><div class='del'>-			} else if (submitted) {</div><div class='del'>-				nwritten++;</div><div class='add'>+						FS_NODE_IO, seq_id)) {</div><div class='add'>+				f2fs_folio_put(last_folio, false);</div><div class='add'>+				folio_batch_release(&amp;fbatch);</div><div class='add'>+				ret = -EIO;</div><div class='add'>+				goto out;</div><div class='ctx'> 			}</div><div class='add'>+			if (submitted)</div><div class='add'>+				nwritten++;</div><div class='ctx'> </div><div class='del'>-			if (page == last_page) {</div><div class='del'>-				f2fs_put_page(page, 0);</div><div class='add'>+			if (folio == last_folio) {</div><div class='add'>+				f2fs_folio_put(folio, false);</div><div class='add'>+				folio_batch_release(&amp;fbatch);</div><div class='ctx'> 				marked = true;</div><div class='del'>-				break;</div><div class='add'>+				goto out;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		pagevec_release(&amp;pvec);</div><div class='add'>+		folio_batch_release(&amp;fbatch);</div><div class='ctx'> 		cond_resched();</div><div class='del'>-</div><div class='del'>-		if (ret || marked)</div><div class='del'>-			break;</div><div class='ctx'> 	}</div><div class='del'>-	if (!ret &amp;&amp; atomic &amp;&amp; !marked) {</div><div class='add'>+	if (atomic &amp;&amp; !marked) {</div><div class='ctx'> 		f2fs_debug(sbi, "Retry to write fsync mark: ino=%u, idx=%lx",</div><div class='del'>-			   ino, last_page-&gt;index);</div><div class='del'>-		lock_page(last_page);</div><div class='del'>-		f2fs_wait_on_page_writeback(last_page, NODE, true, true);</div><div class='del'>-		set_page_dirty(last_page);</div><div class='del'>-		unlock_page(last_page);</div><div class='add'>+			   ino, last_folio-&gt;index);</div><div class='add'>+		folio_lock(last_folio);</div><div class='add'>+		f2fs_folio_wait_writeback(last_folio, NODE, true, true);</div><div class='add'>+		folio_mark_dirty(last_folio);</div><div class='add'>+		folio_unlock(last_folio);</div><div class='ctx'> 		goto retry;</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='ctx'> 	if (nwritten)</div><div class='ctx'> 		f2fs_submit_merged_write_cond(sbi, NULL, NULL, ino, NODE);</div><div class='del'>-	return ret ? -EIO : 0;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int f2fs_match_ino(struct inode *inode, unsigned long ino, void *data)</div><div class='hunk'>@@ -1855,18 +1988,18 @@ static int f2fs_match_ino(struct inode *inode, unsigned long ino, void *data)</div><div class='ctx'> 	return 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool flush_dirty_inode(struct page *page)</div><div class='add'>+static bool flush_dirty_inode(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_sb_info *sbi = F2FS_P_SB(page);</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_F_SB(folio);</div><div class='ctx'> 	struct inode *inode;</div><div class='del'>-	nid_t ino = ino_of_node(page);</div><div class='add'>+	nid_t ino = ino_of_node(folio);</div><div class='ctx'> </div><div class='ctx'> 	inode = find_inode_nowait(sbi-&gt;sb, ino, f2fs_match_ino, NULL);</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	f2fs_update_inode(inode, page);</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	f2fs_update_inode(inode, folio);</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> </div><div class='ctx'> 	iput(inode);</div><div class='ctx'> 	return true;</div><div class='hunk'>@@ -1875,44 +2008,40 @@ static bool flush_dirty_inode(struct page *page)</div><div class='ctx'> void f2fs_flush_inline_data(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	pgoff_t index = 0;</div><div class='del'>-	struct pagevec pvec;</div><div class='del'>-	int nr_pages;</div><div class='add'>+	struct folio_batch fbatch;</div><div class='add'>+	int nr_folios;</div><div class='ctx'> </div><div class='del'>-	pagevec_init(&amp;pvec);</div><div class='add'>+	folio_batch_init(&amp;fbatch);</div><div class='ctx'> </div><div class='del'>-	while ((nr_pages = pagevec_lookup_tag(&amp;pvec,</div><div class='del'>-			NODE_MAPPING(sbi), &amp;index, PAGECACHE_TAG_DIRTY))) {</div><div class='add'>+	while ((nr_folios = filemap_get_folios_tag(NODE_MAPPING(sbi), &amp;index,</div><div class='add'>+					(pgoff_t)-1, PAGECACHE_TAG_DIRTY,</div><div class='add'>+					&amp;fbatch))) {</div><div class='ctx'> 		int i;</div><div class='ctx'> </div><div class='del'>-		for (i = 0; i &lt; nr_pages; i++) {</div><div class='del'>-			struct page *page = pvec.pages[i];</div><div class='add'>+		for (i = 0; i &lt; nr_folios; i++) {</div><div class='add'>+			struct folio *folio = fbatch.folios[i];</div><div class='ctx'> </div><div class='del'>-			if (!IS_DNODE(page))</div><div class='add'>+			if (!IS_INODE(folio))</div><div class='ctx'> 				continue;</div><div class='ctx'> </div><div class='del'>-			lock_page(page);</div><div class='del'>-</div><div class='del'>-			if (unlikely(page-&gt;mapping != NODE_MAPPING(sbi))) {</div><div class='del'>-continue_unlock:</div><div class='del'>-				unlock_page(page);</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='add'>+			folio_lock(folio);</div><div class='ctx'> </div><div class='del'>-			if (!PageDirty(page)) {</div><div class='del'>-				/* someone wrote it for us */</div><div class='del'>-				goto continue_unlock;</div><div class='del'>-			}</div><div class='add'>+			if (unlikely(!is_node_folio(folio)))</div><div class='add'>+				goto unlock;</div><div class='add'>+			if (!folio_test_dirty(folio))</div><div class='add'>+				goto unlock;</div><div class='ctx'> </div><div class='ctx'> 			/* flush inline_data, if it's async context. */</div><div class='del'>-			if (page_private_inline(page)) {</div><div class='del'>-				clear_page_private_inline(page);</div><div class='del'>-				unlock_page(page);</div><div class='del'>-				flush_inline_data(sbi, ino_of_node(page));</div><div class='add'>+			if (folio_test_f2fs_inline(folio)) {</div><div class='add'>+				folio_clear_f2fs_inline(folio);</div><div class='add'>+				folio_unlock(folio);</div><div class='add'>+				flush_inline_data(sbi, ino_of_node(folio));</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='del'>-			unlock_page(page);</div><div class='add'>+unlock:</div><div class='add'>+			folio_unlock(folio);</div><div class='ctx'> 		}</div><div class='del'>-		pagevec_release(&amp;pvec);</div><div class='add'>+		folio_batch_release(&amp;fbatch);</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -1922,25 +2051,25 @@ int f2fs_sync_node_pages(struct f2fs_sb_info *sbi,</div><div class='ctx'> 				bool do_balance, enum iostat_type io_type)</div><div class='ctx'> {</div><div class='ctx'> 	pgoff_t index;</div><div class='del'>-	struct pagevec pvec;</div><div class='add'>+	struct folio_batch fbatch;</div><div class='ctx'> 	int step = 0;</div><div class='ctx'> 	int nwritten = 0;</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	int nr_pages, done = 0;</div><div class='add'>+	int nr_folios, done = 0;</div><div class='ctx'> </div><div class='del'>-	pagevec_init(&amp;pvec);</div><div class='add'>+	folio_batch_init(&amp;fbatch);</div><div class='ctx'> </div><div class='ctx'> next_step:</div><div class='ctx'> 	index = 0;</div><div class='ctx'> </div><div class='del'>-	while (!done &amp;&amp; (nr_pages = pagevec_lookup_tag(&amp;pvec,</div><div class='del'>-			NODE_MAPPING(sbi), &amp;index, PAGECACHE_TAG_DIRTY))) {</div><div class='add'>+	while (!done &amp;&amp; (nr_folios = filemap_get_folios_tag(NODE_MAPPING(sbi),</div><div class='add'>+				&amp;index, (pgoff_t)-1, PAGECACHE_TAG_DIRTY,</div><div class='add'>+				&amp;fbatch))) {</div><div class='ctx'> 		int i;</div><div class='ctx'> </div><div class='del'>-		for (i = 0; i &lt; nr_pages; i++) {</div><div class='del'>-			struct page *page = pvec.pages[i];</div><div class='add'>+		for (i = 0; i &lt; nr_folios; i++) {</div><div class='add'>+			struct folio *folio = fbatch.folios[i];</div><div class='ctx'> 			bool submitted = false;</div><div class='del'>-			bool may_dirty = true;</div><div class='ctx'> </div><div class='ctx'> 			/* give a priority to WB_SYNC threads */</div><div class='ctx'> 			if (atomic_read(&amp;sbi-&gt;wb_sync_req[NODE]) &amp;&amp;</div><div class='hunk'>@@ -1955,27 +2084,27 @@ next_step:</div><div class='ctx'> 			 * 1. dentry dnodes</div><div class='ctx'> 			 * 2. file dnodes</div><div class='ctx'> 			 */</div><div class='del'>-			if (step == 0 &amp;&amp; IS_DNODE(page))</div><div class='add'>+			if (step == 0 &amp;&amp; IS_DNODE(folio))</div><div class='ctx'> 				continue;</div><div class='del'>-			if (step == 1 &amp;&amp; (!IS_DNODE(page) ||</div><div class='del'>-						is_cold_node(page)))</div><div class='add'>+			if (step == 1 &amp;&amp; (!IS_DNODE(folio) ||</div><div class='add'>+						is_cold_node(folio)))</div><div class='ctx'> 				continue;</div><div class='del'>-			if (step == 2 &amp;&amp; (!IS_DNODE(page) ||</div><div class='del'>-						!is_cold_node(page)))</div><div class='add'>+			if (step == 2 &amp;&amp; (!IS_DNODE(folio) ||</div><div class='add'>+						!is_cold_node(folio)))</div><div class='ctx'> 				continue;</div><div class='ctx'> lock_node:</div><div class='ctx'> 			if (wbc-&gt;sync_mode == WB_SYNC_ALL)</div><div class='del'>-				lock_page(page);</div><div class='del'>-			else if (!trylock_page(page))</div><div class='add'>+				folio_lock(folio);</div><div class='add'>+			else if (!folio_trylock(folio))</div><div class='ctx'> 				continue;</div><div class='ctx'> </div><div class='del'>-			if (unlikely(page-&gt;mapping != NODE_MAPPING(sbi))) {</div><div class='add'>+			if (unlikely(!is_node_folio(folio))) {</div><div class='ctx'> continue_unlock:</div><div class='del'>-				unlock_page(page);</div><div class='add'>+				folio_unlock(folio);</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			if (!PageDirty(page)) {</div><div class='add'>+			if (!folio_test_dirty(folio)) {</div><div class='ctx'> 				/* someone wrote it for us */</div><div class='ctx'> 				goto continue_unlock;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -1985,39 +2114,38 @@ continue_unlock:</div><div class='ctx'> 				goto write_node;</div><div class='ctx'> </div><div class='ctx'> 			/* flush inline_data */</div><div class='del'>-			if (page_private_inline(page)) {</div><div class='del'>-				clear_page_private_inline(page);</div><div class='del'>-				unlock_page(page);</div><div class='del'>-				flush_inline_data(sbi, ino_of_node(page));</div><div class='add'>+			if (folio_test_f2fs_inline(folio)) {</div><div class='add'>+				folio_clear_f2fs_inline(folio);</div><div class='add'>+				folio_unlock(folio);</div><div class='add'>+				flush_inline_data(sbi, ino_of_node(folio));</div><div class='ctx'> 				goto lock_node;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			/* flush dirty inode */</div><div class='del'>-			if (IS_INODE(page) &amp;&amp; may_dirty) {</div><div class='del'>-				may_dirty = false;</div><div class='del'>-				if (flush_dirty_inode(page))</div><div class='del'>-					goto lock_node;</div><div class='del'>-			}</div><div class='add'>+			if (IS_INODE(folio) &amp;&amp; flush_dirty_inode(folio))</div><div class='add'>+				goto lock_node;</div><div class='ctx'> write_node:</div><div class='del'>-			f2fs_wait_on_page_writeback(page, NODE, true, true);</div><div class='add'>+			f2fs_folio_wait_writeback(folio, NODE, true, true);</div><div class='ctx'> </div><div class='del'>-			if (!clear_page_dirty_for_io(page))</div><div class='add'>+			if (!folio_clear_dirty_for_io(folio))</div><div class='ctx'> 				goto continue_unlock;</div><div class='ctx'> </div><div class='del'>-			set_fsync_mark(page, 0);</div><div class='del'>-			set_dentry_mark(page, 0);</div><div class='add'>+			set_fsync_mark(folio, 0);</div><div class='add'>+			set_dentry_mark(folio, 0);</div><div class='ctx'> </div><div class='del'>-			ret = __write_node_page(page, false, &amp;submitted,</div><div class='del'>-						wbc, do_balance, io_type, NULL);</div><div class='del'>-			if (ret)</div><div class='del'>-				unlock_page(page);</div><div class='del'>-			else if (submitted)</div><div class='add'>+			if (!__write_node_folio(folio, false, &amp;submitted,</div><div class='add'>+					wbc, do_balance, io_type, NULL)) {</div><div class='add'>+				folio_batch_release(&amp;fbatch);</div><div class='add'>+				ret = -EIO;</div><div class='add'>+				goto out;</div><div class='add'>+			}</div><div class='add'>+			if (submitted)</div><div class='ctx'> 				nwritten++;</div><div class='ctx'> </div><div class='ctx'> 			if (--wbc-&gt;nr_to_write == 0)</div><div class='ctx'> 				break;</div><div class='ctx'> 		}</div><div class='del'>-		pagevec_release(&amp;pvec);</div><div class='add'>+		folio_batch_release(&amp;fbatch);</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> </div><div class='ctx'> 		if (wbc-&gt;nr_to_write == 0) {</div><div class='hunk'>@@ -2046,13 +2174,13 @@ int f2fs_wait_on_node_pages_writeback(struct f2fs_sb_info *sbi,</div><div class='ctx'> 						unsigned int seq_id)</div><div class='ctx'> {</div><div class='ctx'> 	struct fsync_node_entry *fn;</div><div class='del'>-	struct page *page;</div><div class='ctx'> 	struct list_head *head = &amp;sbi-&gt;fsync_node_list;</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> 	unsigned int cur_seq_id = 0;</div><div class='del'>-	int ret2, ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	while (seq_id &amp;&amp; cur_seq_id &lt; seq_id) {</div><div class='add'>+		struct folio *folio;</div><div class='add'>+</div><div class='ctx'> 		spin_lock_irqsave(&amp;sbi-&gt;fsync_node_lock, flags);</div><div class='ctx'> 		if (list_empty(head)) {</div><div class='ctx'> 			spin_unlock_irqrestore(&amp;sbi-&gt;fsync_node_lock, flags);</div><div class='hunk'>@@ -2064,25 +2192,16 @@ int f2fs_wait_on_node_pages_writeback(struct f2fs_sb_info *sbi,</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 		cur_seq_id = fn-&gt;seq_id;</div><div class='del'>-		page = fn-&gt;page;</div><div class='del'>-		get_page(page);</div><div class='add'>+		folio = fn-&gt;folio;</div><div class='add'>+		folio_get(folio);</div><div class='ctx'> 		spin_unlock_irqrestore(&amp;sbi-&gt;fsync_node_lock, flags);</div><div class='ctx'> </div><div class='del'>-		f2fs_wait_on_page_writeback(page, NODE, true, false);</div><div class='del'>-		if (TestClearPageError(page))</div><div class='del'>-			ret = -EIO;</div><div class='add'>+		f2fs_folio_wait_writeback(folio, NODE, true, false);</div><div class='ctx'> </div><div class='del'>-		put_page(page);</div><div class='del'>-</div><div class='del'>-		if (ret)</div><div class='del'>-			break;</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret2 = filemap_check_errors(NODE_MAPPING(sbi));</div><div class='del'>-	if (!ret)</div><div class='del'>-		ret = ret2;</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='add'>+	return filemap_check_errors(NODE_MAPPING(sbi));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int f2fs_write_node_pages(struct address_space *mapping,</div><div class='hunk'>@@ -2106,8 +2225,12 @@ static int f2fs_write_node_pages(struct address_space *mapping,</div><div class='ctx'> </div><div class='ctx'> 	if (wbc-&gt;sync_mode == WB_SYNC_ALL)</div><div class='ctx'> 		atomic_inc(&amp;sbi-&gt;wb_sync_req[NODE]);</div><div class='del'>-	else if (atomic_read(&amp;sbi-&gt;wb_sync_req[NODE]))</div><div class='add'>+	else if (atomic_read(&amp;sbi-&gt;wb_sync_req[NODE])) {</div><div class='add'>+		/* to avoid potential deadlock */</div><div class='add'>+		if (current-&gt;plug)</div><div class='add'>+			blk_finish_plug(current-&gt;plug);</div><div class='ctx'> 		goto skip_write;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	trace_f2fs_writepages(mapping-&gt;host, wbc, NODE);</div><div class='ctx'> </div><div class='hunk'>@@ -2127,37 +2250,34 @@ skip_write:</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_set_node_page_dirty(struct page *page)</div><div class='add'>+static bool f2fs_dirty_node_folio(struct address_space *mapping,</div><div class='add'>+		struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	trace_f2fs_set_page_dirty(page, NODE);</div><div class='add'>+	trace_f2fs_set_page_dirty(folio, NODE);</div><div class='ctx'> </div><div class='del'>-	if (!PageUptodate(page))</div><div class='del'>-		SetPageUptodate(page);</div><div class='add'>+	if (!folio_test_uptodate(folio))</div><div class='add'>+		folio_mark_uptodate(folio);</div><div class='ctx'> #ifdef CONFIG_F2FS_CHECK_FS</div><div class='del'>-	if (IS_INODE(page))</div><div class='del'>-		f2fs_inode_chksum_set(F2FS_P_SB(page), page);</div><div class='add'>+	if (IS_INODE(folio))</div><div class='add'>+		f2fs_inode_chksum_set(F2FS_M_SB(mapping), folio);</div><div class='ctx'> #endif</div><div class='del'>-	if (!PageDirty(page)) {</div><div class='del'>-		__set_page_dirty_nobuffers(page);</div><div class='del'>-		inc_page_count(F2FS_P_SB(page), F2FS_DIRTY_NODES);</div><div class='del'>-		set_page_private_reference(page);</div><div class='del'>-		return 1;</div><div class='add'>+	if (filemap_dirty_folio(mapping, folio)) {</div><div class='add'>+		inc_page_count(F2FS_M_SB(mapping), F2FS_DIRTY_NODES);</div><div class='add'>+		folio_set_f2fs_reference(folio);</div><div class='add'>+		return true;</div><div class='ctx'> 	}</div><div class='del'>-	return 0;</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Structure of the f2fs node operations</div><div class='ctx'>  */</div><div class='ctx'> const struct address_space_operations f2fs_node_aops = {</div><div class='del'>-	.writepage	= f2fs_write_node_page,</div><div class='ctx'> 	.writepages	= f2fs_write_node_pages,</div><div class='del'>-	.set_page_dirty	= f2fs_set_node_page_dirty,</div><div class='del'>-	.invalidatepage	= f2fs_invalidate_page,</div><div class='del'>-	.releasepage	= f2fs_release_page,</div><div class='del'>-#ifdef CONFIG_MIGRATION</div><div class='del'>-	.migratepage	= f2fs_migrate_page,</div><div class='del'>-#endif</div><div class='add'>+	.dirty_folio	= f2fs_dirty_node_folio,</div><div class='add'>+	.invalidate_folio = f2fs_invalidate_folio,</div><div class='add'>+	.release_folio	= f2fs_release_folio,</div><div class='add'>+	.migrate_folio	= filemap_migrate_folio,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static struct free_nid *__lookup_free_nid_list(struct f2fs_nm_info *nm_i,</div><div class='hunk'>@@ -2214,24 +2334,6 @@ static void __move_free_nid(struct f2fs_sb_info *sbi, struct free_nid *i,</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-bool f2fs_nat_bitmap_enabled(struct f2fs_sb_info *sbi)</div><div class='del'>-{</div><div class='del'>-	struct f2fs_nm_info *nm_i = NM_I(sbi);</div><div class='del'>-	unsigned int i;</div><div class='del'>-	bool ret = true;</div><div class='del'>-</div><div class='del'>-	down_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='del'>-	for (i = 0; i &lt; nm_i-&gt;nat_blocks; i++) {</div><div class='del'>-		if (!test_bit_le(i, nm_i-&gt;nat_block_bitmap)) {</div><div class='del'>-			ret = false;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	up_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static void update_free_nid_bitmap(struct f2fs_sb_info *sbi, nid_t nid,</div><div class='ctx'> 							bool set, bool build)</div><div class='ctx'> {</div><div class='hunk'>@@ -2263,7 +2365,7 @@ static bool add_free_nid(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	struct f2fs_nm_info *nm_i = NM_I(sbi);</div><div class='ctx'> 	struct free_nid *i, *e;</div><div class='ctx'> 	struct nat_entry *ne;</div><div class='del'>-	int err = -EINVAL;</div><div class='add'>+	int err;</div><div class='ctx'> 	bool ret = false;</div><div class='ctx'> </div><div class='ctx'> 	/* 0 nid should not be used */</div><div class='hunk'>@@ -2277,7 +2379,10 @@ static bool add_free_nid(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	i-&gt;nid = nid;</div><div class='ctx'> 	i-&gt;state = FREE_NID;</div><div class='ctx'> </div><div class='del'>-	radix_tree_preload(GFP_NOFS | __GFP_NOFAIL);</div><div class='add'>+	err = radix_tree_preload(GFP_NOFS | __GFP_NOFAIL);</div><div class='add'>+	f2fs_bug_on(sbi, err);</div><div class='add'>+</div><div class='add'>+	err = -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;nm_i-&gt;nid_list_lock);</div><div class='ctx'> </div><div class='hunk'>@@ -2296,14 +2401,14 @@ static bool add_free_nid(struct f2fs_sb_info *sbi,</div><div class='ctx'> 		 *                          - __lookup_nat_cache</div><div class='ctx'> 		 *  - f2fs_add_link</div><div class='ctx'> 		 *   - f2fs_init_inode_metadata</div><div class='del'>-		 *    - f2fs_new_inode_page</div><div class='del'>-		 *     - f2fs_new_node_page</div><div class='add'>+		 *    - f2fs_new_inode_folio</div><div class='add'>+		 *     - f2fs_new_node_folio</div><div class='ctx'> 		 *      - set_node_addr</div><div class='ctx'> 		 *  - f2fs_alloc_nid_done</div><div class='ctx'> 		 *   - __remove_nid_from_list(PREALLOC_NID)</div><div class='ctx'> 		 *                         - __insert_nid_to_list(FREE_NID)</div><div class='ctx'> 		 */</div><div class='del'>-		ne = __lookup_nat_cache(nm_i, nid);</div><div class='add'>+		ne = __lookup_nat_cache(nm_i, nid, false);</div><div class='ctx'> 		if (ne &amp;&amp; (!get_nat_flag(ne, IS_CHECKPOINTED) ||</div><div class='ctx'> 				nat_get_blkaddr(ne) != NULL_ADDR))</div><div class='ctx'> 			goto err_out;</div><div class='hunk'>@@ -2350,10 +2455,9 @@ static void remove_free_nid(struct f2fs_sb_info *sbi, nid_t nid)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int scan_nat_page(struct f2fs_sb_info *sbi,</div><div class='del'>-			struct page *nat_page, nid_t start_nid)</div><div class='add'>+			struct f2fs_nat_block *nat_blk, nid_t start_nid)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_nm_info *nm_i = NM_I(sbi);</div><div class='del'>-	struct f2fs_nat_block *nat_blk = page_address(nat_page);</div><div class='ctx'> 	block_t blk_addr;</div><div class='ctx'> 	unsigned int nat_ofs = NAT_BLOCK_OFFSET(start_nid);</div><div class='ctx'> 	int i;</div><div class='hunk'>@@ -2369,7 +2473,7 @@ static int scan_nat_page(struct f2fs_sb_info *sbi,</div><div class='ctx'> 		blk_addr = le32_to_cpu(nat_blk-&gt;entries[i].block_addr);</div><div class='ctx'> </div><div class='ctx'> 		if (blk_addr == NEW_ADDR)</div><div class='del'>-			return -EINVAL;</div><div class='add'>+			return -EFSCORRUPTED;</div><div class='ctx'> </div><div class='ctx'> 		if (blk_addr == NULL_ADDR) {</div><div class='ctx'> 			add_free_nid(sbi, start_nid, true, true);</div><div class='hunk'>@@ -2410,7 +2514,7 @@ static void scan_free_nid_bits(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	unsigned int i, idx;</div><div class='ctx'> 	nid_t nid;</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+	f2fs_down_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; nm_i-&gt;nat_blocks; i++) {</div><div class='ctx'> 		if (!test_bit_le(i, nm_i-&gt;nat_block_bitmap))</div><div class='hunk'>@@ -2433,7 +2537,7 @@ static void scan_free_nid_bits(struct f2fs_sb_info *sbi)</div><div class='ctx'> out:</div><div class='ctx'> 	scan_curseg_cache(sbi);</div><div class='ctx'> </div><div class='del'>-	up_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+	f2fs_up_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int __f2fs_build_free_nids(struct f2fs_sb_info *sbi,</div><div class='hunk'>@@ -2468,23 +2572,31 @@ static int __f2fs_build_free_nids(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	f2fs_ra_meta_pages(sbi, NAT_BLOCK_OFFSET(nid), FREE_NID_PAGES,</div><div class='ctx'> 							META_NAT, true);</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+	f2fs_down_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		if (!test_bit_le(NAT_BLOCK_OFFSET(nid),</div><div class='ctx'> 						nm_i-&gt;nat_block_bitmap)) {</div><div class='del'>-			struct page *page = get_current_nat_page(sbi, nid);</div><div class='add'>+			struct folio *folio = get_current_nat_folio(sbi, nid);</div><div class='ctx'> </div><div class='del'>-			if (IS_ERR(page)) {</div><div class='del'>-				ret = PTR_ERR(page);</div><div class='add'>+			if (IS_ERR(folio)) {</div><div class='add'>+				ret = PTR_ERR(folio);</div><div class='ctx'> 			} else {</div><div class='del'>-				ret = scan_nat_page(sbi, page, nid);</div><div class='del'>-				f2fs_put_page(page, 1);</div><div class='add'>+				ret = scan_nat_page(sbi, folio_address(folio),</div><div class='add'>+						nid);</div><div class='add'>+				f2fs_folio_put(folio, true);</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			if (ret) {</div><div class='del'>-				up_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='del'>-				f2fs_err(sbi, "NAT is corrupt, run fsck to fix it");</div><div class='add'>+				f2fs_up_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+</div><div class='add'>+				if (ret == -EFSCORRUPTED) {</div><div class='add'>+					f2fs_err(sbi, "NAT is corrupt, run fsck to fix it");</div><div class='add'>+					set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='add'>+					f2fs_handle_error(sbi,</div><div class='add'>+						ERROR_INCONSISTENT_NAT);</div><div class='add'>+				}</div><div class='add'>+</div><div class='ctx'> 				return ret;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2503,7 +2615,7 @@ static int __f2fs_build_free_nids(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	/* find free nids from current sum_pages */</div><div class='ctx'> 	scan_curseg_cache(sbi);</div><div class='ctx'> </div><div class='del'>-	up_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+	f2fs_up_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='ctx'> </div><div class='ctx'> 	f2fs_ra_meta_pages(sbi, NAT_BLOCK_OFFSET(nm_i-&gt;next_scan_nid),</div><div class='ctx'> 					nm_i-&gt;ra_nid_pages, META_NAT, false);</div><div class='hunk'>@@ -2532,10 +2644,8 @@ bool f2fs_alloc_nid(struct f2fs_sb_info *sbi, nid_t *nid)</div><div class='ctx'> 	struct f2fs_nm_info *nm_i = NM_I(sbi);</div><div class='ctx'> 	struct free_nid *i = NULL;</div><div class='ctx'> retry:</div><div class='del'>-	if (time_to_inject(sbi, FAULT_ALLOC_NID)) {</div><div class='del'>-		f2fs_show_injection_info(sbi, FAULT_ALLOC_NID);</div><div class='add'>+	if (time_to_inject(sbi, FAULT_ALLOC_NID))</div><div class='ctx'> 		return false;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;nm_i-&gt;nid_list_lock);</div><div class='ctx'> </div><div class='hunk'>@@ -2549,6 +2659,16 @@ retry:</div><div class='ctx'> 		f2fs_bug_on(sbi, list_empty(&amp;nm_i-&gt;free_nid_list));</div><div class='ctx'> 		i = list_first_entry(&amp;nm_i-&gt;free_nid_list,</div><div class='ctx'> 					struct free_nid, list);</div><div class='add'>+</div><div class='add'>+		if (unlikely(is_invalid_nid(sbi, i-&gt;nid))) {</div><div class='add'>+			spin_unlock(&amp;nm_i-&gt;nid_list_lock);</div><div class='add'>+			f2fs_err(sbi, "Corrupted nid %u in free_nid_list",</div><div class='add'>+								i-&gt;nid);</div><div class='add'>+			f2fs_stop_checkpoint(sbi, false,</div><div class='add'>+					STOP_CP_REASON_CORRUPTED_NID);</div><div class='add'>+			return false;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		*nid = i-&gt;nid;</div><div class='ctx'> </div><div class='ctx'> 		__move_free_nid(sbi, i, FREE_NID, PREALLOC_NID);</div><div class='hunk'>@@ -2650,18 +2770,18 @@ int f2fs_try_to_free_nids(struct f2fs_sb_info *sbi, int nr_shrink)</div><div class='ctx'> 	return nr - nr_shrink;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int f2fs_recover_inline_xattr(struct inode *inode, struct page *page)</div><div class='add'>+int f2fs_recover_inline_xattr(struct inode *inode, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	void *src_addr, *dst_addr;</div><div class='ctx'> 	size_t inline_size;</div><div class='del'>-	struct page *ipage;</div><div class='add'>+	struct folio *ifolio;</div><div class='ctx'> 	struct f2fs_inode *ri;</div><div class='ctx'> </div><div class='del'>-	ipage = f2fs_get_node_page(F2FS_I_SB(inode), inode-&gt;i_ino);</div><div class='del'>-	if (IS_ERR(ipage))</div><div class='del'>-		return PTR_ERR(ipage);</div><div class='add'>+	ifolio = f2fs_get_inode_folio(F2FS_I_SB(inode), inode-&gt;i_ino);</div><div class='add'>+	if (IS_ERR(ifolio))</div><div class='add'>+		return PTR_ERR(ifolio);</div><div class='ctx'> </div><div class='del'>-	ri = F2FS_INODE(page);</div><div class='add'>+	ri = F2FS_INODE(folio);</div><div class='ctx'> 	if (ri-&gt;i_inline &amp; F2FS_INLINE_XATTR) {</div><div class='ctx'> 		if (!f2fs_has_inline_xattr(inode)) {</div><div class='ctx'> 			set_inode_flag(inode, FI_INLINE_XATTR);</div><div class='hunk'>@@ -2675,37 +2795,37 @@ int f2fs_recover_inline_xattr(struct inode *inode, struct page *page)</div><div class='ctx'> 		goto update_inode;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dst_addr = inline_xattr_addr(inode, ipage);</div><div class='del'>-	src_addr = inline_xattr_addr(inode, page);</div><div class='add'>+	dst_addr = inline_xattr_addr(inode, ifolio);</div><div class='add'>+	src_addr = inline_xattr_addr(inode, folio);</div><div class='ctx'> 	inline_size = inline_xattr_size(inode);</div><div class='ctx'> </div><div class='del'>-	f2fs_wait_on_page_writeback(ipage, NODE, true, true);</div><div class='add'>+	f2fs_folio_wait_writeback(ifolio, NODE, true, true);</div><div class='ctx'> 	memcpy(dst_addr, src_addr, inline_size);</div><div class='ctx'> update_inode:</div><div class='del'>-	f2fs_update_inode(inode, ipage);</div><div class='del'>-	f2fs_put_page(ipage, 1);</div><div class='add'>+	f2fs_update_inode(inode, ifolio);</div><div class='add'>+	f2fs_folio_put(ifolio, true);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int f2fs_recover_xattr_data(struct inode *inode, struct page *page)</div><div class='add'>+int f2fs_recover_xattr_data(struct inode *inode, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	nid_t prev_xnid = F2FS_I(inode)-&gt;i_xattr_nid;</div><div class='ctx'> 	nid_t new_xnid;</div><div class='ctx'> 	struct dnode_of_data dn;</div><div class='ctx'> 	struct node_info ni;</div><div class='del'>-	struct page *xpage;</div><div class='add'>+	struct folio *xfolio;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (!prev_xnid)</div><div class='ctx'> 		goto recover_xnid;</div><div class='ctx'> </div><div class='ctx'> 	/* 1: invalidate the previous xattr nid */</div><div class='del'>-	err = f2fs_get_node_info(sbi, prev_xnid, &amp;ni);</div><div class='add'>+	err = f2fs_get_node_info(sbi, prev_xnid, &amp;ni, false);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	f2fs_invalidate_blocks(sbi, ni.blk_addr);</div><div class='add'>+	f2fs_invalidate_blocks(sbi, ni.blk_addr, 1);</div><div class='ctx'> 	dec_valid_node_count(sbi, inode, false);</div><div class='ctx'> 	set_node_addr(sbi, &amp;ni, NULL_ADDR, false);</div><div class='ctx'> </div><div class='hunk'>@@ -2715,55 +2835,57 @@ recover_xnid:</div><div class='ctx'> 		return -ENOSPC;</div><div class='ctx'> </div><div class='ctx'> 	set_new_dnode(&amp;dn, inode, NULL, NULL, new_xnid);</div><div class='del'>-	xpage = f2fs_new_node_page(&amp;dn, XATTR_NODE_OFFSET);</div><div class='del'>-	if (IS_ERR(xpage)) {</div><div class='add'>+	xfolio = f2fs_new_node_folio(&amp;dn, XATTR_NODE_OFFSET);</div><div class='add'>+	if (IS_ERR(xfolio)) {</div><div class='ctx'> 		f2fs_alloc_nid_failed(sbi, new_xnid);</div><div class='del'>-		return PTR_ERR(xpage);</div><div class='add'>+		return PTR_ERR(xfolio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	f2fs_alloc_nid_done(sbi, new_xnid);</div><div class='ctx'> 	f2fs_update_inode_page(inode);</div><div class='ctx'> </div><div class='ctx'> 	/* 3: update and set xattr node page dirty */</div><div class='del'>-	memcpy(F2FS_NODE(xpage), F2FS_NODE(page), VALID_XATTR_BLOCK_SIZE);</div><div class='del'>-</div><div class='del'>-	set_page_dirty(xpage);</div><div class='del'>-	f2fs_put_page(xpage, 1);</div><div class='add'>+	if (folio) {</div><div class='add'>+		memcpy(F2FS_NODE(xfolio), F2FS_NODE(folio),</div><div class='add'>+				VALID_XATTR_BLOCK_SIZE);</div><div class='add'>+		folio_mark_dirty(xfolio);</div><div class='add'>+	}</div><div class='add'>+	f2fs_folio_put(xfolio, true);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int f2fs_recover_inode_page(struct f2fs_sb_info *sbi, struct page *page)</div><div class='add'>+int f2fs_recover_inode_page(struct f2fs_sb_info *sbi, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_inode *src, *dst;</div><div class='del'>-	nid_t ino = ino_of_node(page);</div><div class='add'>+	nid_t ino = ino_of_node(folio);</div><div class='ctx'> 	struct node_info old_ni, new_ni;</div><div class='del'>-	struct page *ipage;</div><div class='add'>+	struct folio *ifolio;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	err = f2fs_get_node_info(sbi, ino, &amp;old_ni);</div><div class='add'>+	err = f2fs_get_node_info(sbi, ino, &amp;old_ni, false);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(old_ni.blk_addr != NULL_ADDR))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> retry:</div><div class='del'>-	ipage = f2fs_grab_cache_page(NODE_MAPPING(sbi), ino, false);</div><div class='del'>-	if (!ipage) {</div><div class='del'>-		congestion_wait(BLK_RW_ASYNC, DEFAULT_IO_TIMEOUT);</div><div class='add'>+	ifolio = f2fs_grab_cache_folio(NODE_MAPPING(sbi), ino, false);</div><div class='add'>+	if (IS_ERR(ifolio)) {</div><div class='add'>+		memalloc_retry_wait(GFP_NOFS);</div><div class='ctx'> 		goto retry;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Should not use this inode from free nid list */</div><div class='ctx'> 	remove_free_nid(sbi, ino);</div><div class='ctx'> </div><div class='del'>-	if (!PageUptodate(ipage))</div><div class='del'>-		SetPageUptodate(ipage);</div><div class='del'>-	fill_node_footer(ipage, ino, ino, 0, true);</div><div class='del'>-	set_cold_node(ipage, false);</div><div class='add'>+	if (!folio_test_uptodate(ifolio))</div><div class='add'>+		folio_mark_uptodate(ifolio);</div><div class='add'>+	fill_node_footer(ifolio, ino, ino, 0, true);</div><div class='add'>+	set_cold_node(ifolio, false);</div><div class='ctx'> </div><div class='del'>-	src = F2FS_INODE(page);</div><div class='del'>-	dst = F2FS_INODE(ipage);</div><div class='add'>+	src = F2FS_INODE(folio);</div><div class='add'>+	dst = F2FS_INODE(ifolio);</div><div class='ctx'> </div><div class='ctx'> 	memcpy(dst, src, offsetof(struct f2fs_inode, i_ext));</div><div class='ctx'> 	dst-&gt;i_size = 0;</div><div class='hunk'>@@ -2799,8 +2921,8 @@ retry:</div><div class='ctx'> 		WARN_ON(1);</div><div class='ctx'> 	set_node_addr(sbi, &amp;new_ni, NEW_ADDR, false);</div><div class='ctx'> 	inc_valid_inode_count(sbi);</div><div class='del'>-	set_page_dirty(ipage);</div><div class='del'>-	f2fs_put_page(ipage, 1);</div><div class='add'>+	folio_mark_dirty(ifolio);</div><div class='add'>+	f2fs_folio_put(ifolio, true);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2813,7 +2935,7 @@ int f2fs_restore_node_summary(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	int i, idx, last_offset, nrpages;</div><div class='ctx'> </div><div class='ctx'> 	/* scan the node segment */</div><div class='del'>-	last_offset = sbi-&gt;blocks_per_seg;</div><div class='add'>+	last_offset = BLKS_PER_SEG(sbi);</div><div class='ctx'> 	addr = START_BLOCK(sbi, segno);</div><div class='ctx'> 	sum_entry = &amp;sum-&gt;entries[0];</div><div class='ctx'> </div><div class='hunk'>@@ -2824,17 +2946,17 @@ int f2fs_restore_node_summary(struct f2fs_sb_info *sbi,</div><div class='ctx'> 		f2fs_ra_meta_pages(sbi, addr, nrpages, META_POR, true);</div><div class='ctx'> </div><div class='ctx'> 		for (idx = addr; idx &lt; addr + nrpages; idx++) {</div><div class='del'>-			struct page *page = f2fs_get_tmp_page(sbi, idx);</div><div class='add'>+			struct folio *folio = f2fs_get_tmp_folio(sbi, idx);</div><div class='ctx'> </div><div class='del'>-			if (IS_ERR(page))</div><div class='del'>-				return PTR_ERR(page);</div><div class='add'>+			if (IS_ERR(folio))</div><div class='add'>+				return PTR_ERR(folio);</div><div class='ctx'> </div><div class='del'>-			rn = F2FS_NODE(page);</div><div class='add'>+			rn = F2FS_NODE(folio);</div><div class='ctx'> 			sum_entry-&gt;nid = rn-&gt;footer.nid;</div><div class='ctx'> 			sum_entry-&gt;version = 0;</div><div class='ctx'> 			sum_entry-&gt;ofs_in_node = 0;</div><div class='ctx'> 			sum_entry++;</div><div class='del'>-			f2fs_put_page(page, 1);</div><div class='add'>+			f2fs_folio_put(folio, true);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		invalidate_mapping_pages(META_MAPPING(sbi), addr,</div><div class='hunk'>@@ -2849,6 +2971,7 @@ static void remove_nats_in_journal(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	struct curseg_info *curseg = CURSEG_I(sbi, CURSEG_HOT_DATA);</div><div class='ctx'> 	struct f2fs_journal *journal = curseg-&gt;journal;</div><div class='ctx'> 	int i;</div><div class='add'>+	bool init_dirty;</div><div class='ctx'> </div><div class='ctx'> 	down_write(&amp;curseg-&gt;journal_rwsem);</div><div class='ctx'> 	for (i = 0; i &lt; nats_in_cursum(journal); i++) {</div><div class='hunk'>@@ -2859,12 +2982,15 @@ static void remove_nats_in_journal(struct f2fs_sb_info *sbi)</div><div class='ctx'> 		if (f2fs_check_nid_range(sbi, nid))</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='add'>+		init_dirty = false;</div><div class='add'>+</div><div class='ctx'> 		raw_ne = nat_in_journal(journal, i);</div><div class='ctx'> </div><div class='del'>-		ne = __lookup_nat_cache(nm_i, nid);</div><div class='add'>+		ne = __lookup_nat_cache(nm_i, nid, true);</div><div class='ctx'> 		if (!ne) {</div><div class='add'>+			init_dirty = true;</div><div class='ctx'> 			ne = __alloc_nat_entry(sbi, nid, true);</div><div class='del'>-			__init_nat_entry(nm_i, ne, &amp;raw_ne, true);</div><div class='add'>+			__init_nat_entry(nm_i, ne, &amp;raw_ne, true, true);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='hunk'>@@ -2879,7 +3005,7 @@ static void remove_nats_in_journal(struct f2fs_sb_info *sbi)</div><div class='ctx'> 			spin_unlock(&amp;nm_i-&gt;nid_list_lock);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		__set_nat_cache_dirty(nm_i, ne);</div><div class='add'>+		__set_nat_cache_dirty(nm_i, ne, init_dirty);</div><div class='ctx'> 	}</div><div class='ctx'> 	update_nats_in_cursum(journal, -i);</div><div class='ctx'> 	up_write(&amp;curseg-&gt;journal_rwsem);</div><div class='hunk'>@@ -2903,32 +3029,15 @@ add_out:</div><div class='ctx'> 	list_add_tail(&amp;nes-&gt;set_list, head);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void __update_nat_bits(struct f2fs_nm_info *nm_i, unsigned int nat_ofs,</div><div class='del'>-							unsigned int valid)</div><div class='del'>-{</div><div class='del'>-	if (valid == 0) {</div><div class='del'>-		__set_bit_le(nat_ofs, nm_i-&gt;empty_nat_bits);</div><div class='del'>-		__clear_bit_le(nat_ofs, nm_i-&gt;full_nat_bits);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	__clear_bit_le(nat_ofs, nm_i-&gt;empty_nat_bits);</div><div class='del'>-	if (valid == NAT_ENTRY_PER_BLOCK)</div><div class='del'>-		__set_bit_le(nat_ofs, nm_i-&gt;full_nat_bits);</div><div class='del'>-	else</div><div class='del'>-		__clear_bit_le(nat_ofs, nm_i-&gt;full_nat_bits);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void update_nat_bits(struct f2fs_sb_info *sbi, nid_t start_nid,</div><div class='del'>-						struct page *page)</div><div class='add'>+static void __update_nat_bits(struct f2fs_sb_info *sbi, nid_t start_nid,</div><div class='add'>+		const struct f2fs_nat_block *nat_blk)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_nm_info *nm_i = NM_I(sbi);</div><div class='ctx'> 	unsigned int nat_index = start_nid / NAT_ENTRY_PER_BLOCK;</div><div class='del'>-	struct f2fs_nat_block *nat_blk = page_address(page);</div><div class='ctx'> 	int valid = 0;</div><div class='ctx'> 	int i = 0;</div><div class='ctx'> </div><div class='del'>-	if (!is_set_ckpt_flags(sbi, CP_NAT_BITS_FLAG))</div><div class='add'>+	if (!enabled_nat_bits(sbi, NULL))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	if (nat_index == 0) {</div><div class='hunk'>@@ -2939,36 +3048,17 @@ static void update_nat_bits(struct f2fs_sb_info *sbi, nid_t start_nid,</div><div class='ctx'> 		if (le32_to_cpu(nat_blk-&gt;entries[i].block_addr) != NULL_ADDR)</div><div class='ctx'> 			valid++;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	__update_nat_bits(nm_i, nat_index, valid);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void f2fs_enable_nat_bits(struct f2fs_sb_info *sbi)</div><div class='del'>-{</div><div class='del'>-	struct f2fs_nm_info *nm_i = NM_I(sbi);</div><div class='del'>-	unsigned int nat_ofs;</div><div class='del'>-</div><div class='del'>-	down_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='del'>-</div><div class='del'>-	for (nat_ofs = 0; nat_ofs &lt; nm_i-&gt;nat_blocks; nat_ofs++) {</div><div class='del'>-		unsigned int valid = 0, nid_ofs = 0;</div><div class='del'>-</div><div class='del'>-		/* handle nid zero due to it should never be used */</div><div class='del'>-		if (unlikely(nat_ofs == 0)) {</div><div class='del'>-			valid = 1;</div><div class='del'>-			nid_ofs = 1;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		for (; nid_ofs &lt; NAT_ENTRY_PER_BLOCK; nid_ofs++) {</div><div class='del'>-			if (!test_bit_le(nid_ofs,</div><div class='del'>-					nm_i-&gt;free_nid_bitmap[nat_ofs]))</div><div class='del'>-				valid++;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		__update_nat_bits(nm_i, nat_ofs, valid);</div><div class='add'>+	if (valid == 0) {</div><div class='add'>+		__set_bit_le(nat_index, nm_i-&gt;empty_nat_bits);</div><div class='add'>+		__clear_bit_le(nat_index, nm_i-&gt;full_nat_bits);</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	up_read(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+	__clear_bit_le(nat_index, nm_i-&gt;empty_nat_bits);</div><div class='add'>+	if (valid == NAT_ENTRY_PER_BLOCK)</div><div class='add'>+		__set_bit_le(nat_index, nm_i-&gt;full_nat_bits);</div><div class='add'>+	else</div><div class='add'>+		__clear_bit_le(nat_index, nm_i-&gt;full_nat_bits);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int __flush_nat_entry_set(struct f2fs_sb_info *sbi,</div><div class='hunk'>@@ -2980,25 +3070,25 @@ static int __flush_nat_entry_set(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	bool to_journal = true;</div><div class='ctx'> 	struct f2fs_nat_block *nat_blk;</div><div class='ctx'> 	struct nat_entry *ne, *cur;</div><div class='del'>-	struct page *page = NULL;</div><div class='add'>+	struct folio *folio = NULL;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * there are two steps to flush nat entries:</div><div class='ctx'> 	 * #1, flush nat entries to journal in current hot data summary block.</div><div class='ctx'> 	 * #2, flush nat entries to nat page.</div><div class='ctx'> 	 */</div><div class='del'>-	if ((cpc-&gt;reason &amp; CP_UMOUNT) ||</div><div class='add'>+	if (enabled_nat_bits(sbi, cpc) ||</div><div class='ctx'> 		!__has_cursum_space(journal, set-&gt;entry_cnt, NAT_JOURNAL))</div><div class='ctx'> 		to_journal = false;</div><div class='ctx'> </div><div class='ctx'> 	if (to_journal) {</div><div class='ctx'> 		down_write(&amp;curseg-&gt;journal_rwsem);</div><div class='ctx'> 	} else {</div><div class='del'>-		page = get_next_nat_page(sbi, start_nid);</div><div class='del'>-		if (IS_ERR(page))</div><div class='del'>-			return PTR_ERR(page);</div><div class='add'>+		folio = get_next_nat_folio(sbi, start_nid);</div><div class='add'>+		if (IS_ERR(folio))</div><div class='add'>+			return PTR_ERR(folio);</div><div class='ctx'> </div><div class='del'>-		nat_blk = page_address(page);</div><div class='add'>+		nat_blk = folio_address(folio);</div><div class='ctx'> 		f2fs_bug_on(sbi, !nat_blk);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -3034,8 +3124,8 @@ static int __flush_nat_entry_set(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	if (to_journal) {</div><div class='ctx'> 		up_write(&amp;curseg-&gt;journal_rwsem);</div><div class='ctx'> 	} else {</div><div class='del'>-		update_nat_bits(sbi, start_nid, page);</div><div class='del'>-		f2fs_put_page(page, 1);</div><div class='add'>+		__update_nat_bits(sbi, start_nid, nat_blk);</div><div class='add'>+		f2fs_folio_put(folio, true);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Allow dirty nats by node block allocation in write_begin */</div><div class='hunk'>@@ -3054,7 +3144,7 @@ int f2fs_flush_nat_entries(struct f2fs_sb_info *sbi, struct cp_control *cpc)</div><div class='ctx'> 	struct f2fs_nm_info *nm_i = NM_I(sbi);</div><div class='ctx'> 	struct curseg_info *curseg = CURSEG_I(sbi, CURSEG_HOT_DATA);</div><div class='ctx'> 	struct f2fs_journal *journal = curseg-&gt;journal;</div><div class='del'>-	struct nat_entry_set *setvec[SETVEC_SIZE];</div><div class='add'>+	struct nat_entry_set *setvec[NAT_VEC_SIZE];</div><div class='ctx'> 	struct nat_entry_set *set, *tmp;</div><div class='ctx'> 	unsigned int found;</div><div class='ctx'> 	nid_t set_idx = 0;</div><div class='hunk'>@@ -3065,29 +3155,29 @@ int f2fs_flush_nat_entries(struct f2fs_sb_info *sbi, struct cp_control *cpc)</div><div class='ctx'> 	 * during unmount, let's flush nat_bits before checking</div><div class='ctx'> 	 * nat_cnt[DIRTY_NAT].</div><div class='ctx'> 	 */</div><div class='del'>-	if (cpc-&gt;reason &amp; CP_UMOUNT) {</div><div class='del'>-		down_write(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+	if (enabled_nat_bits(sbi, cpc)) {</div><div class='add'>+		f2fs_down_write(&amp;nm_i-&gt;nat_tree_lock);</div><div class='ctx'> 		remove_nats_in_journal(sbi);</div><div class='del'>-		up_write(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+		f2fs_up_write(&amp;nm_i-&gt;nat_tree_lock);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!nm_i-&gt;nat_cnt[DIRTY_NAT])</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+	f2fs_down_write(&amp;nm_i-&gt;nat_tree_lock);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * if there are no enough space in journal to store dirty nat</div><div class='ctx'> 	 * entries, remove all entries from journal and merge them</div><div class='ctx'> 	 * into nat entry set.</div><div class='ctx'> 	 */</div><div class='del'>-	if (cpc-&gt;reason &amp; CP_UMOUNT ||</div><div class='add'>+	if (enabled_nat_bits(sbi, cpc) ||</div><div class='ctx'> 		!__has_cursum_space(journal,</div><div class='ctx'> 			nm_i-&gt;nat_cnt[DIRTY_NAT], NAT_JOURNAL))</div><div class='ctx'> 		remove_nats_in_journal(sbi);</div><div class='ctx'> </div><div class='ctx'> 	while ((found = __gang_lookup_nat_set(nm_i,</div><div class='del'>-					set_idx, SETVEC_SIZE, setvec))) {</div><div class='add'>+					set_idx, NAT_VEC_SIZE, setvec))) {</div><div class='ctx'> 		unsigned idx;</div><div class='ctx'> </div><div class='ctx'> 		set_idx = setvec[found - 1]-&gt;set + 1;</div><div class='hunk'>@@ -3103,7 +3193,7 @@ int f2fs_flush_nat_entries(struct f2fs_sb_info *sbi, struct cp_control *cpc)</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	up_write(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+	f2fs_up_write(&amp;nm_i-&gt;nat_tree_lock);</div><div class='ctx'> 	/* Allow dirty nats by node block allocation in write_begin */</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='hunk'>@@ -3118,40 +3208,38 @@ static int __get_nat_bitmaps(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	__u64 cp_ver = cur_cp_version(ckpt);</div><div class='ctx'> 	block_t nat_bits_addr;</div><div class='ctx'> </div><div class='add'>+	if (!enabled_nat_bits(sbi, NULL))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='ctx'> 	nm_i-&gt;nat_bits_blocks = F2FS_BLK_ALIGN((nat_bits_bytes &lt;&lt; 1) + 8);</div><div class='ctx'> 	nm_i-&gt;nat_bits = f2fs_kvzalloc(sbi,</div><div class='del'>-			nm_i-&gt;nat_bits_blocks &lt;&lt; F2FS_BLKSIZE_BITS, GFP_KERNEL);</div><div class='add'>+			F2FS_BLK_TO_BYTES(nm_i-&gt;nat_bits_blocks), GFP_KERNEL);</div><div class='ctx'> 	if (!nm_i-&gt;nat_bits)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	nm_i-&gt;full_nat_bits = nm_i-&gt;nat_bits + 8;</div><div class='del'>-	nm_i-&gt;empty_nat_bits = nm_i-&gt;full_nat_bits + nat_bits_bytes;</div><div class='del'>-</div><div class='del'>-	if (!is_set_ckpt_flags(sbi, CP_NAT_BITS_FLAG))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	nat_bits_addr = __start_cp_addr(sbi) + sbi-&gt;blocks_per_seg -</div><div class='add'>+	nat_bits_addr = __start_cp_addr(sbi) + BLKS_PER_SEG(sbi) -</div><div class='ctx'> 						nm_i-&gt;nat_bits_blocks;</div><div class='ctx'> 	for (i = 0; i &lt; nm_i-&gt;nat_bits_blocks; i++) {</div><div class='del'>-		struct page *page;</div><div class='add'>+		struct folio *folio;</div><div class='ctx'> </div><div class='del'>-		page = f2fs_get_meta_page(sbi, nat_bits_addr++);</div><div class='del'>-		if (IS_ERR(page))</div><div class='del'>-			return PTR_ERR(page);</div><div class='add'>+		folio = f2fs_get_meta_folio(sbi, nat_bits_addr++);</div><div class='add'>+		if (IS_ERR(folio))</div><div class='add'>+			return PTR_ERR(folio);</div><div class='ctx'> </div><div class='del'>-		memcpy(nm_i-&gt;nat_bits + (i &lt;&lt; F2FS_BLKSIZE_BITS),</div><div class='del'>-					page_address(page), F2FS_BLKSIZE);</div><div class='del'>-		f2fs_put_page(page, 1);</div><div class='add'>+		memcpy(nm_i-&gt;nat_bits + F2FS_BLK_TO_BYTES(i),</div><div class='add'>+					folio_address(folio), F2FS_BLKSIZE);</div><div class='add'>+		f2fs_folio_put(folio, true);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	cp_ver |= (cur_cp_crc(ckpt) &lt;&lt; 32);</div><div class='ctx'> 	if (cpu_to_le64(cp_ver) != *(__le64 *)nm_i-&gt;nat_bits) {</div><div class='del'>-		clear_ckpt_flags(sbi, CP_NAT_BITS_FLAG);</div><div class='del'>-		f2fs_notice(sbi, "Disable nat_bits due to incorrect cp_ver (%llu, %llu)",</div><div class='del'>-			cp_ver, le64_to_cpu(*(__le64 *)nm_i-&gt;nat_bits));</div><div class='add'>+		disable_nat_bits(sbi, true);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	nm_i-&gt;full_nat_bits = nm_i-&gt;nat_bits + 8;</div><div class='add'>+	nm_i-&gt;empty_nat_bits = nm_i-&gt;full_nat_bits + nat_bits_bytes;</div><div class='add'>+</div><div class='ctx'> 	f2fs_notice(sbi, "Found nat_bits in checkpoint");</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -3162,7 +3250,7 @@ static inline void load_free_nid_bitmap(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	unsigned int i = 0;</div><div class='ctx'> 	nid_t nid, last_nid;</div><div class='ctx'> </div><div class='del'>-	if (!is_set_ckpt_flags(sbi, CP_NAT_BITS_FLAG))</div><div class='add'>+	if (!enabled_nat_bits(sbi, NULL))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; nm_i-&gt;nat_blocks; i++) {</div><div class='hunk'>@@ -3213,6 +3301,7 @@ static int init_node_manager(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	nm_i-&gt;ram_thresh = DEF_RAM_THRESHOLD;</div><div class='ctx'> 	nm_i-&gt;ra_nid_pages = DEF_RA_NID_PAGES;</div><div class='ctx'> 	nm_i-&gt;dirty_nats_ratio = DEF_DIRTY_NAT_RATIO_THRESHOLD;</div><div class='add'>+	nm_i-&gt;max_rf_node_blocks = DEF_RF_NODE_BLOCKS;</div><div class='ctx'> </div><div class='ctx'> 	INIT_RADIX_TREE(&amp;nm_i-&gt;free_nid_root, GFP_ATOMIC);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;nm_i-&gt;free_nid_list);</div><div class='hunk'>@@ -3223,7 +3312,7 @@ static int init_node_manager(struct f2fs_sb_info *sbi)</div><div class='ctx'> </div><div class='ctx'> 	mutex_init(&amp;nm_i-&gt;build_lock);</div><div class='ctx'> 	spin_lock_init(&amp;nm_i-&gt;nid_list_lock);</div><div class='del'>-	init_rwsem(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+	init_f2fs_rwsem(&amp;nm_i-&gt;nat_tree_lock);</div><div class='ctx'> </div><div class='ctx'> 	nm_i-&gt;next_scan_nid = le32_to_cpu(sbi-&gt;ckpt-&gt;next_free_nid);</div><div class='ctx'> 	nm_i-&gt;bitmap_size = __bitmap_size(sbi, NAT_BITMAP);</div><div class='hunk'>@@ -3233,6 +3322,9 @@ static int init_node_manager(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	if (!nm_i-&gt;nat_bitmap)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='add'>+	if (!test_opt(sbi, NAT_BITS))</div><div class='add'>+		disable_nat_bits(sbi, true);</div><div class='add'>+</div><div class='ctx'> 	err = __get_nat_bitmaps(sbi);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='hunk'>@@ -3307,8 +3399,9 @@ void f2fs_destroy_node_manager(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_nm_info *nm_i = NM_I(sbi);</div><div class='ctx'> 	struct free_nid *i, *next_i;</div><div class='del'>-	struct nat_entry *natvec[NATVEC_SIZE];</div><div class='del'>-	struct nat_entry_set *setvec[SETVEC_SIZE];</div><div class='add'>+	void *vec[NAT_VEC_SIZE];</div><div class='add'>+	struct nat_entry **natvec = (struct nat_entry **)vec;</div><div class='add'>+	struct nat_entry_set **setvec = (struct nat_entry_set **)vec;</div><div class='ctx'> 	nid_t nid = 0;</div><div class='ctx'> 	unsigned int found;</div><div class='ctx'> </div><div class='hunk'>@@ -3329,9 +3422,9 @@ void f2fs_destroy_node_manager(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	spin_unlock(&amp;nm_i-&gt;nid_list_lock);</div><div class='ctx'> </div><div class='ctx'> 	/* destroy nat cache */</div><div class='del'>-	down_write(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+	f2fs_down_write(&amp;nm_i-&gt;nat_tree_lock);</div><div class='ctx'> 	while ((found = __gang_lookup_nat_cache(nm_i,</div><div class='del'>-					nid, NATVEC_SIZE, natvec))) {</div><div class='add'>+					nid, NAT_VEC_SIZE, natvec))) {</div><div class='ctx'> 		unsigned idx;</div><div class='ctx'> </div><div class='ctx'> 		nid = nat_get_nid(natvec[found - 1]) + 1;</div><div class='hunk'>@@ -3347,8 +3440,9 @@ void f2fs_destroy_node_manager(struct f2fs_sb_info *sbi)</div><div class='ctx'> </div><div class='ctx'> 	/* destroy nat set cache */</div><div class='ctx'> 	nid = 0;</div><div class='add'>+	memset(vec, 0, sizeof(void *) * NAT_VEC_SIZE);</div><div class='ctx'> 	while ((found = __gang_lookup_nat_set(nm_i,</div><div class='del'>-					nid, SETVEC_SIZE, setvec))) {</div><div class='add'>+					nid, NAT_VEC_SIZE, setvec))) {</div><div class='ctx'> 		unsigned idx;</div><div class='ctx'> </div><div class='ctx'> 		nid = setvec[found - 1]-&gt;set + 1;</div><div class='hunk'>@@ -3359,7 +3453,7 @@ void f2fs_destroy_node_manager(struct f2fs_sb_info *sbi)</div><div class='ctx'> 			kmem_cache_free(nat_entry_set_slab, setvec[idx]);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	up_write(&amp;nm_i-&gt;nat_tree_lock);</div><div class='add'>+	f2fs_up_write(&amp;nm_i-&gt;nat_tree_lock);</div><div class='ctx'> </div><div class='ctx'> 	kvfree(nm_i-&gt;nat_block_bitmap);</div><div class='ctx'> 	if (nm_i-&gt;free_nid_bitmap) {</div><div class='hunk'>@@ -3371,10 +3465,10 @@ void f2fs_destroy_node_manager(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	}</div><div class='ctx'> 	kvfree(nm_i-&gt;free_nid_count);</div><div class='ctx'> </div><div class='del'>-	kvfree(nm_i-&gt;nat_bitmap);</div><div class='add'>+	kfree(nm_i-&gt;nat_bitmap);</div><div class='ctx'> 	kvfree(nm_i-&gt;nat_bits);</div><div class='ctx'> #ifdef CONFIG_F2FS_CHECK_FS</div><div class='del'>-	kvfree(nm_i-&gt;nat_bitmap_mir);</div><div class='add'>+	kfree(nm_i-&gt;nat_bitmap_mir);</div><div class='ctx'> #endif</div><div class='ctx'> 	sbi-&gt;nm_info = NULL;</div><div class='ctx'> 	kfree(nm_i);</div><div class='head'>diff --git a/fs/f2fs/node.h b/fs/f2fs/node.h<br/>index 18b98cf0465b..9cb8dcf8d417 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/node.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/node.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/node.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/node.h</a></div><div class='hunk'>@@ -31,9 +31,11 @@</div><div class='ctx'> /* control total # of nats */</div><div class='ctx'> #define DEF_NAT_CACHE_THRESHOLD			100000</div><div class='ctx'> </div><div class='add'>+/* control total # of node writes used for roll-forward recovery */</div><div class='add'>+#define DEF_RF_NODE_BLOCKS			0</div><div class='add'>+</div><div class='ctx'> /* vector size for gang look-up from nat cache that consists of radix tree */</div><div class='del'>-#define NATVEC_SIZE	64</div><div class='del'>-#define SETVEC_SIZE	32</div><div class='add'>+#define NAT_VEC_SIZE	32</div><div class='ctx'> </div><div class='ctx'> /* return value for read_node_page */</div><div class='ctx'> #define LOCKED_PAGE	1</div><div class='hunk'>@@ -50,6 +52,14 @@ enum {</div><div class='ctx'> 	IS_PREALLOC,		/* nat entry is preallocated */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+/* For node type in __get_node_folio() */</div><div class='add'>+enum node_type {</div><div class='add'>+	NODE_TYPE_REGULAR,</div><div class='add'>+	NODE_TYPE_INODE,</div><div class='add'>+	NODE_TYPE_XATTR,</div><div class='add'>+	NODE_TYPE_NON_INODE,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * For node information</div><div class='ctx'>  */</div><div class='hunk'>@@ -90,17 +100,15 @@ static inline void copy_node_info(struct node_info *dst,</div><div class='ctx'> static inline void set_nat_flag(struct nat_entry *ne,</div><div class='ctx'> 				unsigned int type, bool set)</div><div class='ctx'> {</div><div class='del'>-	unsigned char mask = 0x01 &lt;&lt; type;</div><div class='ctx'> 	if (set)</div><div class='del'>-		ne-&gt;ni.flag |= mask;</div><div class='add'>+		ne-&gt;ni.flag |= BIT(type);</div><div class='ctx'> 	else</div><div class='del'>-		ne-&gt;ni.flag &amp;= ~mask;</div><div class='add'>+		ne-&gt;ni.flag &amp;= ~BIT(type);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline bool get_nat_flag(struct nat_entry *ne, unsigned int type)</div><div class='ctx'> {</div><div class='del'>-	unsigned char mask = 0x01 &lt;&lt; type;</div><div class='del'>-	return ne-&gt;ni.flag &amp; mask;</div><div class='add'>+	return ne-&gt;ni.flag &amp; BIT(type);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void nat_reset_flag(struct nat_entry *ne)</div><div class='hunk'>@@ -143,8 +151,8 @@ enum mem_type {</div><div class='ctx'> 	NAT_ENTRIES,	/* indicates the cached nat entry */</div><div class='ctx'> 	DIRTY_DENTS,	/* indicates dirty dentry pages */</div><div class='ctx'> 	INO_ENTRIES,	/* indicates inode entries */</div><div class='del'>-	EXTENT_CACHE,	/* indicates extent cache */</div><div class='del'>-	INMEM_PAGES,	/* indicates inmemory pages */</div><div class='add'>+	READ_EXTENT_CACHE,	/* indicates read extent cache */</div><div class='add'>+	AGE_EXTENT_CACHE,	/* indicates age extent cache */</div><div class='ctx'> 	DISCARD_CACHE,	/* indicates memory of cached discard cmds */</div><div class='ctx'> 	COMPRESS_PAGE,	/* indicates memory of cached compressed pages */</div><div class='ctx'> 	BASE_CHECK,	/* check kernel status */</div><div class='hunk'>@@ -208,10 +216,10 @@ static inline pgoff_t current_nat_addr(struct f2fs_sb_info *sbi, nid_t start)</div><div class='ctx'> </div><div class='ctx'> 	block_addr = (pgoff_t)(nm_i-&gt;nat_blkaddr +</div><div class='ctx'> 		(block_off &lt;&lt; 1) -</div><div class='del'>-		(block_off &amp; (sbi-&gt;blocks_per_seg - 1)));</div><div class='add'>+		(block_off &amp; (BLKS_PER_SEG(sbi) - 1)));</div><div class='ctx'> </div><div class='ctx'> 	if (f2fs_test_bit(block_off, nm_i-&gt;nat_bitmap))</div><div class='del'>-		block_addr += sbi-&gt;blocks_per_seg;</div><div class='add'>+		block_addr += BLKS_PER_SEG(sbi);</div><div class='ctx'> </div><div class='ctx'> 	return block_addr;</div><div class='ctx'> }</div><div class='hunk'>@@ -222,7 +230,7 @@ static inline pgoff_t next_nat_addr(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	struct f2fs_nm_info *nm_i = NM_I(sbi);</div><div class='ctx'> </div><div class='ctx'> 	block_addr -= nm_i-&gt;nat_blkaddr;</div><div class='del'>-	block_addr ^= 1 &lt;&lt; sbi-&gt;log_blocks_per_seg;</div><div class='add'>+	block_addr ^= BIT(sbi-&gt;log_blocks_per_seg);</div><div class='ctx'> 	return block_addr + nm_i-&gt;nat_blkaddr;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -236,41 +244,41 @@ static inline void set_to_next_nat(struct f2fs_nm_info *nm_i, nid_t start_nid)</div><div class='ctx'> #endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline nid_t ino_of_node(struct page *node_page)</div><div class='add'>+static inline nid_t ino_of_node(const struct folio *node_folio)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_node *rn = F2FS_NODE(node_page);</div><div class='add'>+	struct f2fs_node *rn = F2FS_NODE(node_folio);</div><div class='ctx'> 	return le32_to_cpu(rn-&gt;footer.ino);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline nid_t nid_of_node(struct page *node_page)</div><div class='add'>+static inline nid_t nid_of_node(const struct folio *node_folio)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_node *rn = F2FS_NODE(node_page);</div><div class='add'>+	struct f2fs_node *rn = F2FS_NODE(node_folio);</div><div class='ctx'> 	return le32_to_cpu(rn-&gt;footer.nid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline unsigned int ofs_of_node(struct page *node_page)</div><div class='add'>+static inline unsigned int ofs_of_node(const struct folio *node_folio)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_node *rn = F2FS_NODE(node_page);</div><div class='add'>+	struct f2fs_node *rn = F2FS_NODE(node_folio);</div><div class='ctx'> 	unsigned flag = le32_to_cpu(rn-&gt;footer.flag);</div><div class='ctx'> 	return flag &gt;&gt; OFFSET_BIT_SHIFT;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline __u64 cpver_of_node(struct page *node_page)</div><div class='add'>+static inline __u64 cpver_of_node(const struct folio *node_folio)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_node *rn = F2FS_NODE(node_page);</div><div class='add'>+	struct f2fs_node *rn = F2FS_NODE(node_folio);</div><div class='ctx'> 	return le64_to_cpu(rn-&gt;footer.cp_ver);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline block_t next_blkaddr_of_node(struct page *node_page)</div><div class='add'>+static inline block_t next_blkaddr_of_node(const struct folio *node_folio)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_node *rn = F2FS_NODE(node_page);</div><div class='add'>+	struct f2fs_node *rn = F2FS_NODE(node_folio);</div><div class='ctx'> 	return le32_to_cpu(rn-&gt;footer.next_blkaddr);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void fill_node_footer(struct page *page, nid_t nid,</div><div class='add'>+static inline void fill_node_footer(const struct folio *folio, nid_t nid,</div><div class='ctx'> 				nid_t ino, unsigned int ofs, bool reset)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_node *rn = F2FS_NODE(page);</div><div class='add'>+	struct f2fs_node *rn = F2FS_NODE(folio);</div><div class='ctx'> 	unsigned int old_flag = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (reset)</div><div class='hunk'>@@ -286,17 +294,18 @@ static inline void fill_node_footer(struct page *page, nid_t nid,</div><div class='ctx'> 					(old_flag &amp; OFFSET_BIT_MASK));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void copy_node_footer(struct page *dst, struct page *src)</div><div class='add'>+static inline void copy_node_footer(const struct folio *dst,</div><div class='add'>+		const struct folio *src)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_node *src_rn = F2FS_NODE(src);</div><div class='ctx'> 	struct f2fs_node *dst_rn = F2FS_NODE(dst);</div><div class='ctx'> 	memcpy(&amp;dst_rn-&gt;footer, &amp;src_rn-&gt;footer, sizeof(struct node_footer));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void fill_node_footer_blkaddr(struct page *page, block_t blkaddr)</div><div class='add'>+static inline void fill_node_footer_blkaddr(struct folio *folio, block_t blkaddr)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_checkpoint *ckpt = F2FS_CKPT(F2FS_P_SB(page));</div><div class='del'>-	struct f2fs_node *rn = F2FS_NODE(page);</div><div class='add'>+	struct f2fs_checkpoint *ckpt = F2FS_CKPT(F2FS_F_SB(folio));</div><div class='add'>+	struct f2fs_node *rn = F2FS_NODE(folio);</div><div class='ctx'> 	__u64 cp_ver = cur_cp_version(ckpt);</div><div class='ctx'> </div><div class='ctx'> 	if (__is_set_ckpt_flags(ckpt, CP_CRC_RECOVERY_FLAG))</div><div class='hunk'>@@ -306,19 +315,19 @@ static inline void fill_node_footer_blkaddr(struct page *page, block_t blkaddr)</div><div class='ctx'> 	rn-&gt;footer.next_blkaddr = cpu_to_le32(blkaddr);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline bool is_recoverable_dnode(struct page *page)</div><div class='add'>+static inline bool is_recoverable_dnode(const struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_checkpoint *ckpt = F2FS_CKPT(F2FS_P_SB(page));</div><div class='add'>+	struct f2fs_checkpoint *ckpt = F2FS_CKPT(F2FS_F_SB(folio));</div><div class='ctx'> 	__u64 cp_ver = cur_cp_version(ckpt);</div><div class='ctx'> </div><div class='ctx'> 	/* Don't care crc part, if fsck.f2fs sets it. */</div><div class='ctx'> 	if (__is_set_ckpt_flags(ckpt, CP_NOCRC_RECOVERY_FLAG))</div><div class='del'>-		return (cp_ver &lt;&lt; 32) == (cpver_of_node(page) &lt;&lt; 32);</div><div class='add'>+		return (cp_ver &lt;&lt; 32) == (cpver_of_node(folio) &lt;&lt; 32);</div><div class='ctx'> </div><div class='ctx'> 	if (__is_set_ckpt_flags(ckpt, CP_CRC_RECOVERY_FLAG))</div><div class='ctx'> 		cp_ver |= (cur_cp_crc(ckpt) &lt;&lt; 32);</div><div class='ctx'> </div><div class='del'>-	return cp_ver == cpver_of_node(page);</div><div class='add'>+	return cp_ver == cpver_of_node(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -342,9 +351,9 @@ static inline bool is_recoverable_dnode(struct page *page)</div><div class='ctx'>  *                 `- indirect node ((6 + 2N) + (N - 1)(N + 1))</div><div class='ctx'>  *                       `- direct node</div><div class='ctx'>  */</div><div class='del'>-static inline bool IS_DNODE(struct page *node_page)</div><div class='add'>+static inline bool IS_DNODE(const struct folio *node_folio)</div><div class='ctx'> {</div><div class='del'>-	unsigned int ofs = ofs_of_node(node_page);</div><div class='add'>+	unsigned int ofs = ofs_of_node(node_folio);</div><div class='ctx'> </div><div class='ctx'> 	if (f2fs_has_xattr_block(ofs))</div><div class='ctx'> 		return true;</div><div class='hunk'>@@ -360,22 +369,22 @@ static inline bool IS_DNODE(struct page *node_page)</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int set_nid(struct page *p, int off, nid_t nid, bool i)</div><div class='add'>+static inline int set_nid(struct folio *folio, int off, nid_t nid, bool i)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_node *rn = F2FS_NODE(p);</div><div class='add'>+	struct f2fs_node *rn = F2FS_NODE(folio);</div><div class='ctx'> </div><div class='del'>-	f2fs_wait_on_page_writeback(p, NODE, true, true);</div><div class='add'>+	f2fs_folio_wait_writeback(folio, NODE, true, true);</div><div class='ctx'> </div><div class='ctx'> 	if (i)</div><div class='ctx'> 		rn-&gt;i.i_nid[off - NODE_DIR1_BLOCK] = cpu_to_le32(nid);</div><div class='ctx'> 	else</div><div class='ctx'> 		rn-&gt;in.nid[off] = cpu_to_le32(nid);</div><div class='del'>-	return set_page_dirty(p);</div><div class='add'>+	return folio_mark_dirty(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline nid_t get_nid(struct page *p, int off, bool i)</div><div class='add'>+static inline nid_t get_nid(const struct folio *folio, int off, bool i)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_node *rn = F2FS_NODE(p);</div><div class='add'>+	struct f2fs_node *rn = F2FS_NODE(folio);</div><div class='ctx'> </div><div class='ctx'> 	if (i)</div><div class='ctx'> 		return le32_to_cpu(rn-&gt;i.i_nid[off - NODE_DIR1_BLOCK]);</div><div class='hunk'>@@ -389,41 +398,41 @@ static inline nid_t get_nid(struct page *p, int off, bool i)</div><div class='ctx'>  *  - Mark cold data pages in page cache</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static inline int is_node(struct page *page, int type)</div><div class='add'>+static inline int is_node(const struct folio *folio, int type)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_node *rn = F2FS_NODE(page);</div><div class='del'>-	return le32_to_cpu(rn-&gt;footer.flag) &amp; (1 &lt;&lt; type);</div><div class='add'>+	struct f2fs_node *rn = F2FS_NODE(folio);</div><div class='add'>+	return le32_to_cpu(rn-&gt;footer.flag) &amp; BIT(type);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#define is_cold_node(page)	is_node(page, COLD_BIT_SHIFT)</div><div class='del'>-#define is_fsync_dnode(page)	is_node(page, FSYNC_BIT_SHIFT)</div><div class='del'>-#define is_dent_dnode(page)	is_node(page, DENT_BIT_SHIFT)</div><div class='add'>+#define is_cold_node(folio)	is_node(folio, COLD_BIT_SHIFT)</div><div class='add'>+#define is_fsync_dnode(folio)	is_node(folio, FSYNC_BIT_SHIFT)</div><div class='add'>+#define is_dent_dnode(folio)	is_node(folio, DENT_BIT_SHIFT)</div><div class='ctx'> </div><div class='del'>-static inline void set_cold_node(struct page *page, bool is_dir)</div><div class='add'>+static inline void set_cold_node(const struct folio *folio, bool is_dir)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_node *rn = F2FS_NODE(page);</div><div class='add'>+	struct f2fs_node *rn = F2FS_NODE(folio);</div><div class='ctx'> 	unsigned int flag = le32_to_cpu(rn-&gt;footer.flag);</div><div class='ctx'> </div><div class='ctx'> 	if (is_dir)</div><div class='del'>-		flag &amp;= ~(0x1 &lt;&lt; COLD_BIT_SHIFT);</div><div class='add'>+		flag &amp;= ~BIT(COLD_BIT_SHIFT);</div><div class='ctx'> 	else</div><div class='del'>-		flag |= (0x1 &lt;&lt; COLD_BIT_SHIFT);</div><div class='add'>+		flag |= BIT(COLD_BIT_SHIFT);</div><div class='ctx'> 	rn-&gt;footer.flag = cpu_to_le32(flag);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void set_mark(struct page *page, int mark, int type)</div><div class='add'>+static inline void set_mark(struct folio *folio, int mark, int type)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_node *rn = F2FS_NODE(page);</div><div class='add'>+	struct f2fs_node *rn = F2FS_NODE(folio);</div><div class='ctx'> 	unsigned int flag = le32_to_cpu(rn-&gt;footer.flag);</div><div class='ctx'> 	if (mark)</div><div class='del'>-		flag |= (0x1 &lt;&lt; type);</div><div class='add'>+		flag |= BIT(type);</div><div class='ctx'> 	else</div><div class='del'>-		flag &amp;= ~(0x1 &lt;&lt; type);</div><div class='add'>+		flag &amp;= ~BIT(type);</div><div class='ctx'> 	rn-&gt;footer.flag = cpu_to_le32(flag);</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_F2FS_CHECK_FS</div><div class='del'>-	f2fs_inode_chksum_set(F2FS_P_SB(page), page);</div><div class='add'>+	f2fs_inode_chksum_set(F2FS_F_SB(folio), folio);</div><div class='ctx'> #endif</div><div class='ctx'> }</div><div class='del'>-#define set_dentry_mark(page, mark)	set_mark(page, mark, DENT_BIT_SHIFT)</div><div class='del'>-#define set_fsync_mark(page, mark)	set_mark(page, mark, FSYNC_BIT_SHIFT)</div><div class='add'>+#define set_dentry_mark(folio, mark)	set_mark(folio, mark, DENT_BIT_SHIFT)</div><div class='add'>+#define set_fsync_mark(folio, mark)	set_mark(folio, mark, FSYNC_BIT_SHIFT)</div><div class='head'>diff --git a/fs/f2fs/recovery.c b/fs/f2fs/recovery.c<br/>index 6a1b4668d933..c3415ebb9f50 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/recovery.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/recovery.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/recovery.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/recovery.c</a></div><div class='hunk'>@@ -5,9 +5,10 @@</div><div class='ctx'>  * Copyright (c) 2012 Samsung Electronics Co., Ltd.</div><div class='ctx'>  *             http://www.samsung.com/</div><div class='ctx'>  */</div><div class='del'>-#include &lt;asm/unaligned.h&gt;</div><div class='add'>+#include &lt;linux/unaligned.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/f2fs_fs.h&gt;</div><div class='add'>+#include &lt;linux/sched/mm.h&gt;</div><div class='ctx'> #include "f2fs.h"</div><div class='ctx'> #include "node.h"</div><div class='ctx'> #include "segment.h"</div><div class='hunk'>@@ -45,16 +46,16 @@</div><div class='ctx'> </div><div class='ctx'> static struct kmem_cache *fsync_entry_slab;</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='del'>-extern struct kmem_cache *f2fs_cf_name_slab;</div><div class='del'>-#endif</div><div class='del'>-</div><div class='ctx'> bool f2fs_space_for_roll_forward(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	s64 nalloc = percpu_counter_sum_positive(&amp;sbi-&gt;alloc_valid_block_count);</div><div class='ctx'> </div><div class='ctx'> 	if (sbi-&gt;last_valid_block_count + nalloc &gt; sbi-&gt;user_block_count)</div><div class='ctx'> 		return false;</div><div class='add'>+	if (NM_I(sbi)-&gt;max_rf_node_blocks &amp;&amp;</div><div class='add'>+		percpu_counter_sum_positive(&amp;sbi-&gt;rf_node_block_count) &gt;=</div><div class='add'>+						NM_I(sbi)-&gt;max_rf_node_blocks)</div><div class='add'>+		return false;</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -148,26 +149,23 @@ static int init_recovered_filename(const struct inode *dir,</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			return err;</div><div class='ctx'> 		f2fs_hash_filename(dir, fname);</div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='ctx'> 		/* Case-sensitive match is fine for recovery */</div><div class='del'>-		kmem_cache_free(f2fs_cf_name_slab, fname-&gt;cf_name.name);</div><div class='del'>-		fname-&gt;cf_name.name = NULL;</div><div class='del'>-#endif</div><div class='add'>+		f2fs_free_casefolded_name(fname);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		f2fs_hash_filename(dir, fname);</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int recover_dentry(struct inode *inode, struct page *ipage,</div><div class='add'>+static int recover_dentry(struct inode *inode, struct folio *ifolio,</div><div class='ctx'> 						struct list_head *dir_list)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_inode *raw_inode = F2FS_INODE(ipage);</div><div class='add'>+	struct f2fs_inode *raw_inode = F2FS_INODE(ifolio);</div><div class='ctx'> 	nid_t pino = le32_to_cpu(raw_inode-&gt;i_pino);</div><div class='ctx'> 	struct f2fs_dir_entry *de;</div><div class='ctx'> 	struct f2fs_filename fname;</div><div class='ctx'> 	struct qstr usr_fname;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	struct inode *dir, *einode;</div><div class='ctx'> 	struct fsync_inode_entry *entry;</div><div class='ctx'> 	int err = 0;</div><div class='hunk'>@@ -189,7 +187,7 @@ static int recover_dentry(struct inode *inode, struct page *ipage,</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='ctx'> retry:</div><div class='del'>-	de = __f2fs_find_entry(dir, &amp;fname, &amp;page);</div><div class='add'>+	de = __f2fs_find_entry(dir, &amp;fname, &amp;folio);</div><div class='ctx'> 	if (de &amp;&amp; inode-&gt;i_ino == le32_to_cpu(de-&gt;ino))</div><div class='ctx'> 		goto out_put;</div><div class='ctx'> </div><div class='hunk'>@@ -214,11 +212,11 @@ retry:</div><div class='ctx'> 			iput(einode);</div><div class='ctx'> 			goto out_put;</div><div class='ctx'> 		}</div><div class='del'>-		f2fs_delete_entry(de, page, dir, einode);</div><div class='add'>+		f2fs_delete_entry(de, folio, dir, einode);</div><div class='ctx'> 		iput(einode);</div><div class='ctx'> 		goto retry;</div><div class='del'>-	} else if (IS_ERR(page)) {</div><div class='del'>-		err = PTR_ERR(page);</div><div class='add'>+	} else if (IS_ERR(folio)) {</div><div class='add'>+		err = PTR_ERR(folio);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		err = f2fs_add_dentry(dir, &amp;fname, inode,</div><div class='ctx'> 					inode-&gt;i_ino, inode-&gt;i_mode);</div><div class='hunk'>@@ -228,21 +226,21 @@ retry:</div><div class='ctx'> 	goto out;</div><div class='ctx'> </div><div class='ctx'> out_put:</div><div class='del'>-	f2fs_put_page(page, 0);</div><div class='add'>+	f2fs_folio_put(folio, false);</div><div class='ctx'> out:</div><div class='ctx'> 	if (file_enc_name(inode))</div><div class='ctx'> 		name = "&lt;encrypted&gt;";</div><div class='ctx'> 	else</div><div class='ctx'> 		name = raw_inode-&gt;i_name;</div><div class='ctx'> 	f2fs_notice(F2FS_I_SB(inode), "%s: ino = %x, name = %s, dir = %lx, err = %d",</div><div class='del'>-		    __func__, ino_of_node(ipage), name,</div><div class='add'>+		    __func__, ino_of_node(ifolio), name,</div><div class='ctx'> 		    IS_ERR(dir) ? 0 : dir-&gt;i_ino, err);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int recover_quota_data(struct inode *inode, struct page *page)</div><div class='add'>+static int recover_quota_data(struct inode *inode, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_inode *raw = F2FS_INODE(page);</div><div class='add'>+	struct f2fs_inode *raw = F2FS_INODE(folio);</div><div class='ctx'> 	struct iattr attr;</div><div class='ctx'> 	uid_t i_uid = le32_to_cpu(raw-&gt;i_uid);</div><div class='ctx'> 	gid_t i_gid = le32_to_cpu(raw-&gt;i_gid);</div><div class='hunk'>@@ -250,18 +248,18 @@ static int recover_quota_data(struct inode *inode, struct page *page)</div><div class='ctx'> </div><div class='ctx'> 	memset(&amp;attr, 0, sizeof(attr));</div><div class='ctx'> </div><div class='del'>-	attr.ia_uid = make_kuid(inode-&gt;i_sb-&gt;s_user_ns, i_uid);</div><div class='del'>-	attr.ia_gid = make_kgid(inode-&gt;i_sb-&gt;s_user_ns, i_gid);</div><div class='add'>+	attr.ia_vfsuid = VFSUIDT_INIT(make_kuid(inode-&gt;i_sb-&gt;s_user_ns, i_uid));</div><div class='add'>+	attr.ia_vfsgid = VFSGIDT_INIT(make_kgid(inode-&gt;i_sb-&gt;s_user_ns, i_gid));</div><div class='ctx'> </div><div class='del'>-	if (!uid_eq(attr.ia_uid, inode-&gt;i_uid))</div><div class='add'>+	if (!vfsuid_eq(attr.ia_vfsuid, i_uid_into_vfsuid(&amp;nop_mnt_idmap, inode)))</div><div class='ctx'> 		attr.ia_valid |= ATTR_UID;</div><div class='del'>-	if (!gid_eq(attr.ia_gid, inode-&gt;i_gid))</div><div class='add'>+	if (!vfsgid_eq(attr.ia_vfsgid, i_gid_into_vfsgid(&amp;nop_mnt_idmap, inode)))</div><div class='ctx'> 		attr.ia_valid |= ATTR_GID;</div><div class='ctx'> </div><div class='ctx'> 	if (!attr.ia_valid)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	err = dquot_transfer(inode, &amp;attr);</div><div class='add'>+	err = dquot_transfer(&amp;nop_mnt_idmap, inode, &amp;attr);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		set_sbi_flag(F2FS_I_SB(inode), SBI_QUOTA_NEED_REPAIR);</div><div class='ctx'> 	return err;</div><div class='hunk'>@@ -279,15 +277,16 @@ static void recover_inline_flags(struct inode *inode, struct f2fs_inode *ri)</div><div class='ctx'> 		clear_inode_flag(inode, FI_DATA_EXIST);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int recover_inode(struct inode *inode, struct page *page)</div><div class='add'>+static int recover_inode(struct inode *inode, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_inode *raw = F2FS_INODE(page);</div><div class='add'>+	struct f2fs_inode *raw = F2FS_INODE(folio);</div><div class='add'>+	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='ctx'> 	char *name;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_mode = le16_to_cpu(raw-&gt;i_mode);</div><div class='ctx'> </div><div class='del'>-	err = recover_quota_data(inode, page);</div><div class='add'>+	err = recover_quota_data(inode, folio);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='hunk'>@@ -304,29 +303,28 @@ static int recover_inode(struct inode *inode, struct page *page)</div><div class='ctx'> 			i_projid = (projid_t)le32_to_cpu(raw-&gt;i_projid);</div><div class='ctx'> 			kprojid = make_kprojid(&amp;init_user_ns, i_projid);</div><div class='ctx'> </div><div class='del'>-			if (!projid_eq(kprojid, F2FS_I(inode)-&gt;i_projid)) {</div><div class='add'>+			if (!projid_eq(kprojid, fi-&gt;i_projid)) {</div><div class='ctx'> 				err = f2fs_transfer_project_quota(inode,</div><div class='ctx'> 								kprojid);</div><div class='ctx'> 				if (err)</div><div class='ctx'> 					return err;</div><div class='del'>-				F2FS_I(inode)-&gt;i_projid = kprojid;</div><div class='add'>+				fi-&gt;i_projid = kprojid;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	f2fs_i_size_write(inode, le64_to_cpu(raw-&gt;i_size));</div><div class='del'>-	inode-&gt;i_atime.tv_sec = le64_to_cpu(raw-&gt;i_atime);</div><div class='del'>-	inode-&gt;i_ctime.tv_sec = le64_to_cpu(raw-&gt;i_ctime);</div><div class='del'>-	inode-&gt;i_mtime.tv_sec = le64_to_cpu(raw-&gt;i_mtime);</div><div class='del'>-	inode-&gt;i_atime.tv_nsec = le32_to_cpu(raw-&gt;i_atime_nsec);</div><div class='del'>-	inode-&gt;i_ctime.tv_nsec = le32_to_cpu(raw-&gt;i_ctime_nsec);</div><div class='del'>-	inode-&gt;i_mtime.tv_nsec = le32_to_cpu(raw-&gt;i_mtime_nsec);</div><div class='del'>-</div><div class='del'>-	F2FS_I(inode)-&gt;i_advise = raw-&gt;i_advise;</div><div class='del'>-	F2FS_I(inode)-&gt;i_flags = le32_to_cpu(raw-&gt;i_flags);</div><div class='add'>+	inode_set_atime(inode, le64_to_cpu(raw-&gt;i_atime),</div><div class='add'>+			le32_to_cpu(raw-&gt;i_atime_nsec));</div><div class='add'>+	inode_set_ctime(inode, le64_to_cpu(raw-&gt;i_ctime),</div><div class='add'>+			le32_to_cpu(raw-&gt;i_ctime_nsec));</div><div class='add'>+	inode_set_mtime(inode, le64_to_cpu(raw-&gt;i_mtime),</div><div class='add'>+			le32_to_cpu(raw-&gt;i_mtime_nsec));</div><div class='add'>+</div><div class='add'>+	fi-&gt;i_advise = raw-&gt;i_advise;</div><div class='add'>+	fi-&gt;i_flags = le32_to_cpu(raw-&gt;i_flags);</div><div class='ctx'> 	f2fs_set_inode_flags(inode);</div><div class='del'>-	F2FS_I(inode)-&gt;i_gc_failures[GC_FAILURE_PIN] =</div><div class='del'>-				le16_to_cpu(raw-&gt;i_gc_failures);</div><div class='add'>+	fi-&gt;i_gc_failures = le16_to_cpu(raw-&gt;i_gc_failures);</div><div class='ctx'> </div><div class='ctx'> 	recover_inline_flags(inode, raw);</div><div class='ctx'> </div><div class='hunk'>@@ -335,99 +333,150 @@ static int recover_inode(struct inode *inode, struct page *page)</div><div class='ctx'> 	if (file_enc_name(inode))</div><div class='ctx'> 		name = "&lt;encrypted&gt;";</div><div class='ctx'> 	else</div><div class='del'>-		name = F2FS_INODE(page)-&gt;i_name;</div><div class='add'>+		name = F2FS_INODE(folio)-&gt;i_name;</div><div class='ctx'> </div><div class='ctx'> 	f2fs_notice(F2FS_I_SB(inode), "recover_inode: ino = %x, name = %s, inline = %x",</div><div class='del'>-		    ino_of_node(page), name, raw-&gt;i_inline);</div><div class='add'>+		    ino_of_node(folio), name, raw-&gt;i_inline);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static unsigned int adjust_por_ra_blocks(struct f2fs_sb_info *sbi,</div><div class='add'>+				unsigned int ra_blocks, unsigned int blkaddr,</div><div class='add'>+				unsigned int next_blkaddr)</div><div class='add'>+{</div><div class='add'>+	if (blkaddr + 1 == next_blkaddr)</div><div class='add'>+		ra_blocks = min_t(unsigned int, RECOVERY_MAX_RA_BLOCKS,</div><div class='add'>+							ra_blocks * 2);</div><div class='add'>+	else if (next_blkaddr % BLKS_PER_SEG(sbi))</div><div class='add'>+		ra_blocks = max_t(unsigned int, RECOVERY_MIN_RA_BLOCKS,</div><div class='add'>+							ra_blocks / 2);</div><div class='add'>+	return ra_blocks;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Detect looped node chain with Floyd's cycle detection algorithm. */</div><div class='add'>+static int sanity_check_node_chain(struct f2fs_sb_info *sbi, block_t blkaddr,</div><div class='add'>+		block_t *blkaddr_fast, bool *is_detecting)</div><div class='add'>+{</div><div class='add'>+	unsigned int ra_blocks = RECOVERY_MAX_RA_BLOCKS;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	if (!*is_detecting)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; 2; i++) {</div><div class='add'>+		struct folio *folio;</div><div class='add'>+</div><div class='add'>+		if (!f2fs_is_valid_blkaddr(sbi, *blkaddr_fast, META_POR)) {</div><div class='add'>+			*is_detecting = false;</div><div class='add'>+			return 0;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		folio = f2fs_get_tmp_folio(sbi, *blkaddr_fast);</div><div class='add'>+		if (IS_ERR(folio))</div><div class='add'>+			return PTR_ERR(folio);</div><div class='add'>+</div><div class='add'>+		if (!is_recoverable_dnode(folio)) {</div><div class='add'>+			f2fs_folio_put(folio, true);</div><div class='add'>+			*is_detecting = false;</div><div class='add'>+			return 0;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		ra_blocks = adjust_por_ra_blocks(sbi, ra_blocks, *blkaddr_fast,</div><div class='add'>+					next_blkaddr_of_node(folio));</div><div class='add'>+</div><div class='add'>+		*blkaddr_fast = next_blkaddr_of_node(folio);</div><div class='add'>+		f2fs_folio_put(folio, true);</div><div class='add'>+</div><div class='add'>+		f2fs_ra_meta_pages_cond(sbi, *blkaddr_fast, ra_blocks);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (*blkaddr_fast == blkaddr) {</div><div class='add'>+		f2fs_notice(sbi, "%s: Detect looped node chain on blkaddr:%u."</div><div class='add'>+				" Run fsck to fix it.", __func__, blkaddr);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int find_fsync_dnodes(struct f2fs_sb_info *sbi, struct list_head *head,</div><div class='del'>-				bool check_only)</div><div class='add'>+				bool check_only, bool *new_inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct curseg_info *curseg;</div><div class='del'>-	struct page *page = NULL;</div><div class='del'>-	block_t blkaddr;</div><div class='del'>-	unsigned int loop_cnt = 0;</div><div class='del'>-	unsigned int free_blocks = MAIN_SEGS(sbi) * sbi-&gt;blocks_per_seg -</div><div class='del'>-						valid_user_blocks(sbi);</div><div class='add'>+	block_t blkaddr, blkaddr_fast;</div><div class='add'>+	bool is_detecting = true;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='ctx'> 	/* get node pages in the current segment */</div><div class='ctx'> 	curseg = CURSEG_I(sbi, CURSEG_WARM_NODE);</div><div class='ctx'> 	blkaddr = NEXT_FREE_BLKADDR(sbi, curseg);</div><div class='add'>+	blkaddr_fast = blkaddr;</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		struct fsync_inode_entry *entry;</div><div class='add'>+		struct folio *folio;</div><div class='ctx'> </div><div class='ctx'> 		if (!f2fs_is_valid_blkaddr(sbi, blkaddr, META_POR))</div><div class='ctx'> 			return 0;</div><div class='ctx'> </div><div class='del'>-		page = f2fs_get_tmp_page(sbi, blkaddr);</div><div class='del'>-		if (IS_ERR(page)) {</div><div class='del'>-			err = PTR_ERR(page);</div><div class='add'>+		folio = f2fs_get_tmp_folio(sbi, blkaddr);</div><div class='add'>+		if (IS_ERR(folio)) {</div><div class='add'>+			err = PTR_ERR(folio);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (!is_recoverable_dnode(page)) {</div><div class='del'>-			f2fs_put_page(page, 1);</div><div class='add'>+		if (!is_recoverable_dnode(folio)) {</div><div class='add'>+			f2fs_folio_put(folio, true);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (!is_fsync_dnode(page))</div><div class='add'>+		if (!is_fsync_dnode(folio))</div><div class='ctx'> 			goto next;</div><div class='ctx'> </div><div class='del'>-		entry = get_fsync_inode(head, ino_of_node(page));</div><div class='add'>+		entry = get_fsync_inode(head, ino_of_node(folio));</div><div class='ctx'> 		if (!entry) {</div><div class='ctx'> 			bool quota_inode = false;</div><div class='ctx'> </div><div class='ctx'> 			if (!check_only &amp;&amp;</div><div class='del'>-					IS_INODE(page) &amp;&amp; is_dent_dnode(page)) {</div><div class='del'>-				err = f2fs_recover_inode_page(sbi, page);</div><div class='add'>+					IS_INODE(folio) &amp;&amp;</div><div class='add'>+					is_dent_dnode(folio)) {</div><div class='add'>+				err = f2fs_recover_inode_page(sbi, folio);</div><div class='ctx'> 				if (err) {</div><div class='del'>-					f2fs_put_page(page, 1);</div><div class='add'>+					f2fs_folio_put(folio, true);</div><div class='ctx'> 					break;</div><div class='ctx'> 				}</div><div class='ctx'> 				quota_inode = true;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			/*</div><div class='del'>-			 * CP | dnode(F) | inode(DF)</div><div class='del'>-			 * For this case, we should not give up now.</div><div class='del'>-			 */</div><div class='del'>-			entry = add_fsync_inode(sbi, head, ino_of_node(page),</div><div class='add'>+			entry = add_fsync_inode(sbi, head, ino_of_node(folio),</div><div class='ctx'> 								quota_inode);</div><div class='ctx'> 			if (IS_ERR(entry)) {</div><div class='ctx'> 				err = PTR_ERR(entry);</div><div class='add'>+				/*</div><div class='add'>+				 * CP | dnode(F) | inode(DF)</div><div class='add'>+				 * For this case, we should not give up now.</div><div class='add'>+				 */</div><div class='ctx'> 				if (err == -ENOENT) {</div><div class='del'>-					err = 0;</div><div class='add'>+					if (check_only)</div><div class='add'>+						*new_inode = true;</div><div class='ctx'> 					goto next;</div><div class='ctx'> 				}</div><div class='del'>-				f2fs_put_page(page, 1);</div><div class='add'>+				f2fs_folio_put(folio, true);</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 		entry-&gt;blkaddr = blkaddr;</div><div class='ctx'> </div><div class='del'>-		if (IS_INODE(page) &amp;&amp; is_dent_dnode(page))</div><div class='add'>+		if (IS_INODE(folio) &amp;&amp; is_dent_dnode(folio))</div><div class='ctx'> 			entry-&gt;last_dentry = blkaddr;</div><div class='ctx'> next:</div><div class='del'>-		/* sanity check in order to detect looped node chain */</div><div class='del'>-		if (++loop_cnt &gt;= free_blocks ||</div><div class='del'>-			blkaddr == next_blkaddr_of_node(page)) {</div><div class='del'>-			f2fs_notice(sbi, "%s: detect looped node chain, blkaddr:%u, next:%u",</div><div class='del'>-				    __func__, blkaddr,</div><div class='del'>-				    next_blkaddr_of_node(page));</div><div class='del'>-			f2fs_put_page(page, 1);</div><div class='del'>-			err = -EINVAL;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='ctx'> 		/* check next segment */</div><div class='del'>-		blkaddr = next_blkaddr_of_node(page);</div><div class='del'>-		f2fs_put_page(page, 1);</div><div class='add'>+		blkaddr = next_blkaddr_of_node(folio);</div><div class='add'>+		f2fs_folio_put(folio, true);</div><div class='ctx'> </div><div class='del'>-		f2fs_ra_meta_pages_cond(sbi, blkaddr);</div><div class='add'>+		err = sanity_check_node_chain(sbi, blkaddr, &amp;blkaddr_fast,</div><div class='add'>+				&amp;is_detecting);</div><div class='add'>+		if (err)</div><div class='add'>+			break;</div><div class='ctx'> 	}</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='hunk'>@@ -448,11 +497,11 @@ static int check_index_in_prev_nodes(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	unsigned short blkoff = GET_BLKOFF_FROM_SEG0(sbi, blkaddr);</div><div class='ctx'> 	struct f2fs_summary_block *sum_node;</div><div class='ctx'> 	struct f2fs_summary sum;</div><div class='del'>-	struct page *sum_page, *node_page;</div><div class='add'>+	struct folio *sum_folio, *node_folio;</div><div class='ctx'> 	struct dnode_of_data tdn = *dn;</div><div class='ctx'> 	nid_t ino, nid;</div><div class='ctx'> 	struct inode *inode;</div><div class='del'>-	unsigned int offset;</div><div class='add'>+	unsigned int offset, ofs_in_node, max_addrs;</div><div class='ctx'> 	block_t bidx;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='hunk'>@@ -470,35 +519,45 @@ static int check_index_in_prev_nodes(struct f2fs_sb_info *sbi,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	sum_page = f2fs_get_sum_page(sbi, segno);</div><div class='del'>-	if (IS_ERR(sum_page))</div><div class='del'>-		return PTR_ERR(sum_page);</div><div class='del'>-	sum_node = (struct f2fs_summary_block *)page_address(sum_page);</div><div class='add'>+	sum_folio = f2fs_get_sum_folio(sbi, segno);</div><div class='add'>+	if (IS_ERR(sum_folio))</div><div class='add'>+		return PTR_ERR(sum_folio);</div><div class='add'>+	sum_node = SUM_BLK_PAGE_ADDR(sum_folio, segno);</div><div class='ctx'> 	sum = sum_node-&gt;entries[blkoff];</div><div class='del'>-	f2fs_put_page(sum_page, 1);</div><div class='add'>+	f2fs_folio_put(sum_folio, true);</div><div class='ctx'> got_it:</div><div class='ctx'> 	/* Use the locked dnode page and inode */</div><div class='ctx'> 	nid = le32_to_cpu(sum.nid);</div><div class='add'>+	ofs_in_node = le16_to_cpu(sum.ofs_in_node);</div><div class='add'>+</div><div class='add'>+	max_addrs = ADDRS_PER_PAGE(dn-&gt;node_folio, dn-&gt;inode);</div><div class='add'>+	if (ofs_in_node &gt;= max_addrs) {</div><div class='add'>+		f2fs_err(sbi, "Inconsistent ofs_in_node:%u in summary, ino:%lu, nid:%u, max:%u",</div><div class='add'>+			ofs_in_node, dn-&gt;inode-&gt;i_ino, nid, max_addrs);</div><div class='add'>+		f2fs_handle_error(sbi, ERROR_INCONSISTENT_SUMMARY);</div><div class='add'>+		return -EFSCORRUPTED;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (dn-&gt;inode-&gt;i_ino == nid) {</div><div class='ctx'> 		tdn.nid = nid;</div><div class='del'>-		if (!dn-&gt;inode_page_locked)</div><div class='del'>-			lock_page(dn-&gt;inode_page);</div><div class='del'>-		tdn.node_page = dn-&gt;inode_page;</div><div class='del'>-		tdn.ofs_in_node = le16_to_cpu(sum.ofs_in_node);</div><div class='add'>+		if (!dn-&gt;inode_folio_locked)</div><div class='add'>+			folio_lock(dn-&gt;inode_folio);</div><div class='add'>+		tdn.node_folio = dn-&gt;inode_folio;</div><div class='add'>+		tdn.ofs_in_node = ofs_in_node;</div><div class='ctx'> 		goto truncate_out;</div><div class='ctx'> 	} else if (dn-&gt;nid == nid) {</div><div class='del'>-		tdn.ofs_in_node = le16_to_cpu(sum.ofs_in_node);</div><div class='add'>+		tdn.ofs_in_node = ofs_in_node;</div><div class='ctx'> 		goto truncate_out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Get the node page */</div><div class='del'>-	node_page = f2fs_get_node_page(sbi, nid);</div><div class='del'>-	if (IS_ERR(node_page))</div><div class='del'>-		return PTR_ERR(node_page);</div><div class='add'>+	node_folio = f2fs_get_node_folio(sbi, nid, NODE_TYPE_REGULAR);</div><div class='add'>+	if (IS_ERR(node_folio))</div><div class='add'>+		return PTR_ERR(node_folio);</div><div class='ctx'> </div><div class='del'>-	offset = ofs_of_node(node_page);</div><div class='del'>-	ino = ino_of_node(node_page);</div><div class='del'>-	f2fs_put_page(node_page, 1);</div><div class='add'>+	offset = ofs_of_node(node_folio);</div><div class='add'>+	ino = ino_of_node(node_folio);</div><div class='add'>+	f2fs_folio_put(node_folio, true);</div><div class='ctx'> </div><div class='ctx'> 	if (ino != dn-&gt;inode-&gt;i_ino) {</div><div class='ctx'> 		int ret;</div><div class='hunk'>@@ -524,8 +583,8 @@ got_it:</div><div class='ctx'> 	 * if inode page is locked, unlock temporarily, but its reference</div><div class='ctx'> 	 * count keeps alive.</div><div class='ctx'> 	 */</div><div class='del'>-	if (ino == dn-&gt;inode-&gt;i_ino &amp;&amp; dn-&gt;inode_page_locked)</div><div class='del'>-		unlock_page(dn-&gt;inode_page);</div><div class='add'>+	if (ino == dn-&gt;inode-&gt;i_ino &amp;&amp; dn-&gt;inode_folio_locked)</div><div class='add'>+		folio_unlock(dn-&gt;inode_folio);</div><div class='ctx'> </div><div class='ctx'> 	set_new_dnode(&amp;tdn, inode, NULL, NULL, 0);</div><div class='ctx'> 	if (f2fs_get_dnode_of_data(&amp;tdn, bidx, LOOKUP_NODE))</div><div class='hunk'>@@ -538,40 +597,53 @@ got_it:</div><div class='ctx'> out:</div><div class='ctx'> 	if (ino != dn-&gt;inode-&gt;i_ino)</div><div class='ctx'> 		iput(inode);</div><div class='del'>-	else if (dn-&gt;inode_page_locked)</div><div class='del'>-		lock_page(dn-&gt;inode_page);</div><div class='add'>+	else if (dn-&gt;inode_folio_locked)</div><div class='add'>+		folio_lock(dn-&gt;inode_folio);</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> truncate_out:</div><div class='ctx'> 	if (f2fs_data_blkaddr(&amp;tdn) == blkaddr)</div><div class='ctx'> 		f2fs_truncate_data_blocks_range(&amp;tdn, 1);</div><div class='del'>-	if (dn-&gt;inode-&gt;i_ino == nid &amp;&amp; !dn-&gt;inode_page_locked)</div><div class='del'>-		unlock_page(dn-&gt;inode_page);</div><div class='add'>+	if (dn-&gt;inode-&gt;i_ino == nid &amp;&amp; !dn-&gt;inode_folio_locked)</div><div class='add'>+		folio_unlock(dn-&gt;inode_folio);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int f2fs_reserve_new_block_retry(struct dnode_of_data *dn)</div><div class='add'>+{</div><div class='add'>+	int i, err = 0;</div><div class='add'>+</div><div class='add'>+	for (i = DEFAULT_FAILURE_RETRY_COUNT; i &gt; 0; i--) {</div><div class='add'>+		err = f2fs_reserve_new_block(dn);</div><div class='add'>+		if (!err)</div><div class='add'>+			break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int do_recover_data(struct f2fs_sb_info *sbi, struct inode *inode,</div><div class='del'>-					struct page *page)</div><div class='add'>+					struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct dnode_of_data dn;</div><div class='ctx'> 	struct node_info ni;</div><div class='del'>-	unsigned int start, end;</div><div class='add'>+	unsigned int start = 0, end = 0, index;</div><div class='ctx'> 	int err = 0, recovered = 0;</div><div class='ctx'> </div><div class='ctx'> 	/* step 1: recover xattr */</div><div class='del'>-	if (IS_INODE(page)) {</div><div class='del'>-		err = f2fs_recover_inline_xattr(inode, page);</div><div class='add'>+	if (IS_INODE(folio)) {</div><div class='add'>+		err = f2fs_recover_inline_xattr(inode, folio);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto out;</div><div class='del'>-	} else if (f2fs_has_xattr_block(ofs_of_node(page))) {</div><div class='del'>-		err = f2fs_recover_xattr_data(inode, page);</div><div class='add'>+	} else if (f2fs_has_xattr_block(ofs_of_node(folio))) {</div><div class='add'>+		err = f2fs_recover_xattr_data(inode, folio);</div><div class='ctx'> 		if (!err)</div><div class='ctx'> 			recovered++;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* step 2: recover inline data */</div><div class='del'>-	err = f2fs_recover_inline_data(inode, page);</div><div class='add'>+	err = f2fs_recover_inline_data(inode, folio);</div><div class='ctx'> 	if (err) {</div><div class='ctx'> 		if (err == 1)</div><div class='ctx'> 			err = 0;</div><div class='hunk'>@@ -579,41 +651,42 @@ static int do_recover_data(struct f2fs_sb_info *sbi, struct inode *inode,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* step 3: recover data indices */</div><div class='del'>-	start = f2fs_start_bidx_of_node(ofs_of_node(page), inode);</div><div class='del'>-	end = start + ADDRS_PER_PAGE(page, inode);</div><div class='add'>+	start = f2fs_start_bidx_of_node(ofs_of_node(folio), inode);</div><div class='add'>+	end = start + ADDRS_PER_PAGE(folio, inode);</div><div class='ctx'> </div><div class='ctx'> 	set_new_dnode(&amp;dn, inode, NULL, NULL, 0);</div><div class='ctx'> retry_dn:</div><div class='ctx'> 	err = f2fs_get_dnode_of_data(&amp;dn, start, ALLOC_NODE);</div><div class='ctx'> 	if (err) {</div><div class='ctx'> 		if (err == -ENOMEM) {</div><div class='del'>-			congestion_wait(BLK_RW_ASYNC, DEFAULT_IO_TIMEOUT);</div><div class='add'>+			memalloc_retry_wait(GFP_NOFS);</div><div class='ctx'> 			goto retry_dn;</div><div class='ctx'> 		}</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	f2fs_wait_on_page_writeback(dn.node_page, NODE, true, true);</div><div class='add'>+	f2fs_folio_wait_writeback(dn.node_folio, NODE, true, true);</div><div class='ctx'> </div><div class='del'>-	err = f2fs_get_node_info(sbi, dn.nid, &amp;ni);</div><div class='add'>+	err = f2fs_get_node_info(sbi, dn.nid, &amp;ni, false);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto err;</div><div class='ctx'> </div><div class='del'>-	f2fs_bug_on(sbi, ni.ino != ino_of_node(page));</div><div class='add'>+	f2fs_bug_on(sbi, ni.ino != ino_of_node(folio));</div><div class='ctx'> </div><div class='del'>-	if (ofs_of_node(dn.node_page) != ofs_of_node(page)) {</div><div class='add'>+	if (ofs_of_node(dn.node_folio) != ofs_of_node(folio)) {</div><div class='ctx'> 		f2fs_warn(sbi, "Inconsistent ofs_of_node, ino:%lu, ofs:%u, %u",</div><div class='del'>-			  inode-&gt;i_ino, ofs_of_node(dn.node_page),</div><div class='del'>-			  ofs_of_node(page));</div><div class='add'>+			  inode-&gt;i_ino, ofs_of_node(dn.node_folio),</div><div class='add'>+			  ofs_of_node(folio));</div><div class='ctx'> 		err = -EFSCORRUPTED;</div><div class='add'>+		f2fs_handle_error(sbi, ERROR_INCONSISTENT_FOOTER);</div><div class='ctx'> 		goto err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	for (; start &lt; end; start++, dn.ofs_in_node++) {</div><div class='add'>+	for (index = start; index &lt; end; index++, dn.ofs_in_node++) {</div><div class='ctx'> 		block_t src, dest;</div><div class='ctx'> </div><div class='ctx'> 		src = f2fs_data_blkaddr(&amp;dn);</div><div class='del'>-		dest = data_blkaddr(dn.inode, page, dn.ofs_in_node);</div><div class='add'>+		dest = data_blkaddr(dn.inode, folio, dn.ofs_in_node);</div><div class='ctx'> </div><div class='ctx'> 		if (__is_valid_data_blkaddr(src) &amp;&amp;</div><div class='ctx'> 			!f2fs_is_valid_blkaddr(sbi, src, META_POR)) {</div><div class='hunk'>@@ -638,9 +711,9 @@ retry_dn:</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (!file_keep_isize(inode) &amp;&amp;</div><div class='del'>-			(i_size_read(inode) &lt;= ((loff_t)start &lt;&lt; PAGE_SHIFT)))</div><div class='add'>+			(i_size_read(inode) &lt;= ((loff_t)index &lt;&lt; PAGE_SHIFT)))</div><div class='ctx'> 			f2fs_i_size_write(inode,</div><div class='del'>-				(loff_t)(start + 1) &lt;&lt; PAGE_SHIFT);</div><div class='add'>+				(loff_t)(index + 1) &lt;&lt; PAGE_SHIFT);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * dest is reserved block, invalidate src block</div><div class='hunk'>@@ -648,20 +721,17 @@ retry_dn:</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (dest == NEW_ADDR) {</div><div class='ctx'> 			f2fs_truncate_data_blocks_range(&amp;dn, 1);</div><div class='del'>-			f2fs_reserve_new_block(&amp;dn);</div><div class='add'>+</div><div class='add'>+			err = f2fs_reserve_new_block_retry(&amp;dn);</div><div class='add'>+			if (err)</div><div class='add'>+				goto err;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* dest is valid block, try to recover from src to dest */</div><div class='ctx'> 		if (f2fs_is_valid_blkaddr(sbi, dest, META_POR)) {</div><div class='del'>-</div><div class='ctx'> 			if (src == NULL_ADDR) {</div><div class='del'>-				err = f2fs_reserve_new_block(&amp;dn);</div><div class='del'>-				while (err &amp;&amp;</div><div class='del'>-				       IS_ENABLED(CONFIG_F2FS_FAULT_INJECTION))</div><div class='del'>-					err = f2fs_reserve_new_block(&amp;dn);</div><div class='del'>-				/* We should not get -ENOSPC */</div><div class='del'>-				f2fs_bug_on(sbi, err);</div><div class='add'>+				err = f2fs_reserve_new_block_retry(&amp;dn);</div><div class='ctx'> 				if (err)</div><div class='ctx'> 					goto err;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -670,13 +740,20 @@ retry_prev:</div><div class='ctx'> 			err = check_index_in_prev_nodes(sbi, dest, &amp;dn);</div><div class='ctx'> 			if (err) {</div><div class='ctx'> 				if (err == -ENOMEM) {</div><div class='del'>-					congestion_wait(BLK_RW_ASYNC,</div><div class='del'>-							DEFAULT_IO_TIMEOUT);</div><div class='add'>+					memalloc_retry_wait(GFP_NOFS);</div><div class='ctx'> 					goto retry_prev;</div><div class='ctx'> 				}</div><div class='ctx'> 				goto err;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='add'>+			if (f2fs_is_valid_blkaddr(sbi, dest,</div><div class='add'>+					DATA_GENERIC_ENHANCE_UPDATE)) {</div><div class='add'>+				f2fs_err(sbi, "Inconsistent dest blkaddr:%u, ino:%lu, ofs:%u",</div><div class='add'>+					dest, inode-&gt;i_ino, dn.ofs_in_node);</div><div class='add'>+				err = -EFSCORRUPTED;</div><div class='add'>+				goto err;</div><div class='add'>+			}</div><div class='add'>+</div><div class='ctx'> 			/* write dummy data page */</div><div class='ctx'> 			f2fs_replace_block(sbi, &amp;dn, src, dest,</div><div class='ctx'> 						ni.version, false, false);</div><div class='hunk'>@@ -684,16 +761,18 @@ retry_prev:</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	copy_node_footer(dn.node_page, page);</div><div class='del'>-	fill_node_footer(dn.node_page, dn.nid, ni.ino,</div><div class='del'>-					ofs_of_node(page), false);</div><div class='del'>-	set_page_dirty(dn.node_page);</div><div class='add'>+	copy_node_footer(dn.node_folio, folio);</div><div class='add'>+	fill_node_footer(dn.node_folio, dn.nid, ni.ino,</div><div class='add'>+					ofs_of_node(folio), false);</div><div class='add'>+	folio_mark_dirty(dn.node_folio);</div><div class='ctx'> err:</div><div class='ctx'> 	f2fs_put_dnode(&amp;dn);</div><div class='ctx'> out:</div><div class='del'>-	f2fs_notice(sbi, "recover_data: ino = %lx (i_size: %s) recovered = %d, err = %d",</div><div class='del'>-		    inode-&gt;i_ino, file_keep_isize(inode) ? "keep" : "recover",</div><div class='del'>-		    recovered, err);</div><div class='add'>+	f2fs_notice(sbi, "recover_data: ino = %lx, nid = %x (i_size: %s), "</div><div class='add'>+		    "range (%u, %u), recovered = %d, err = %d",</div><div class='add'>+		    inode-&gt;i_ino, nid_of_node(folio),</div><div class='add'>+		    file_keep_isize(inode) ? "keep" : "recover",</div><div class='add'>+		    start, end, recovered, err);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -701,9 +780,17 @@ static int recover_data(struct f2fs_sb_info *sbi, struct list_head *inode_list,</div><div class='ctx'> 		struct list_head *tmp_inode_list, struct list_head *dir_list)</div><div class='ctx'> {</div><div class='ctx'> 	struct curseg_info *curseg;</div><div class='del'>-	struct page *page = NULL;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> 	block_t blkaddr;</div><div class='add'>+	unsigned int ra_blocks = RECOVERY_MAX_RA_BLOCKS;</div><div class='add'>+	unsigned int recoverable_dnode = 0;</div><div class='add'>+	unsigned int fsynced_dnode = 0;</div><div class='add'>+	unsigned int total_dnode = 0;</div><div class='add'>+	unsigned int recovered_inode = 0;</div><div class='add'>+	unsigned int recovered_dentry = 0;</div><div class='add'>+	unsigned int recovered_dnode = 0;</div><div class='add'>+</div><div class='add'>+	f2fs_notice(sbi, "do_recover_data: start to recover dnode");</div><div class='ctx'> </div><div class='ctx'> 	/* get node pages in the current segment */</div><div class='ctx'> 	curseg = CURSEG_I(sbi, CURSEG_WARM_NODE);</div><div class='hunk'>@@ -711,96 +798,101 @@ static int recover_data(struct f2fs_sb_info *sbi, struct list_head *inode_list,</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		struct fsync_inode_entry *entry;</div><div class='add'>+		struct folio *folio;</div><div class='ctx'> </div><div class='ctx'> 		if (!f2fs_is_valid_blkaddr(sbi, blkaddr, META_POR))</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		f2fs_ra_meta_pages_cond(sbi, blkaddr);</div><div class='del'>-</div><div class='del'>-		page = f2fs_get_tmp_page(sbi, blkaddr);</div><div class='del'>-		if (IS_ERR(page)) {</div><div class='del'>-			err = PTR_ERR(page);</div><div class='add'>+		folio = f2fs_get_tmp_folio(sbi, blkaddr);</div><div class='add'>+		if (IS_ERR(folio)) {</div><div class='add'>+			err = PTR_ERR(folio);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (!is_recoverable_dnode(page)) {</div><div class='del'>-			f2fs_put_page(page, 1);</div><div class='add'>+		if (!is_recoverable_dnode(folio)) {</div><div class='add'>+			f2fs_folio_put(folio, true);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='add'>+		recoverable_dnode++;</div><div class='ctx'> </div><div class='del'>-		entry = get_fsync_inode(inode_list, ino_of_node(page));</div><div class='add'>+		entry = get_fsync_inode(inode_list, ino_of_node(folio));</div><div class='ctx'> 		if (!entry)</div><div class='ctx'> 			goto next;</div><div class='add'>+		fsynced_dnode++;</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * inode(x) | CP | inode(x) | dnode(F)</div><div class='ctx'> 		 * In this case, we can lose the latest inode(x).</div><div class='ctx'> 		 * So, call recover_inode for the inode update.</div><div class='ctx'> 		 */</div><div class='del'>-		if (IS_INODE(page)) {</div><div class='del'>-			err = recover_inode(entry-&gt;inode, page);</div><div class='add'>+		if (IS_INODE(folio)) {</div><div class='add'>+			err = recover_inode(entry-&gt;inode, folio);</div><div class='ctx'> 			if (err) {</div><div class='del'>-				f2fs_put_page(page, 1);</div><div class='add'>+				f2fs_folio_put(folio, true);</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='add'>+			recovered_inode++;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (entry-&gt;last_dentry == blkaddr) {</div><div class='del'>-			err = recover_dentry(entry-&gt;inode, page, dir_list);</div><div class='add'>+			err = recover_dentry(entry-&gt;inode, folio, dir_list);</div><div class='ctx'> 			if (err) {</div><div class='del'>-				f2fs_put_page(page, 1);</div><div class='add'>+				f2fs_folio_put(folio, true);</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='add'>+			recovered_dentry++;</div><div class='ctx'> 		}</div><div class='del'>-		err = do_recover_data(sbi, entry-&gt;inode, page);</div><div class='add'>+		err = do_recover_data(sbi, entry-&gt;inode, folio);</div><div class='ctx'> 		if (err) {</div><div class='del'>-			f2fs_put_page(page, 1);</div><div class='add'>+			f2fs_folio_put(folio, true);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='add'>+		recovered_dnode++;</div><div class='ctx'> </div><div class='ctx'> 		if (entry-&gt;blkaddr == blkaddr)</div><div class='ctx'> 			list_move_tail(&amp;entry-&gt;list, tmp_inode_list);</div><div class='ctx'> next:</div><div class='add'>+		ra_blocks = adjust_por_ra_blocks(sbi, ra_blocks, blkaddr,</div><div class='add'>+					next_blkaddr_of_node(folio));</div><div class='add'>+</div><div class='ctx'> 		/* check next segment */</div><div class='del'>-		blkaddr = next_blkaddr_of_node(page);</div><div class='del'>-		f2fs_put_page(page, 1);</div><div class='add'>+		blkaddr = next_blkaddr_of_node(folio);</div><div class='add'>+		f2fs_folio_put(folio, true);</div><div class='add'>+</div><div class='add'>+		f2fs_ra_meta_pages_cond(sbi, blkaddr, ra_blocks);</div><div class='add'>+		total_dnode++;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!err)</div><div class='del'>-		f2fs_allocate_new_segments(sbi);</div><div class='add'>+		err = f2fs_allocate_new_segments(sbi);</div><div class='add'>+</div><div class='add'>+	f2fs_notice(sbi, "do_recover_data: dnode: (recoverable: %u, fsynced: %u, "</div><div class='add'>+		"total: %u), recovered: (inode: %u, dentry: %u, dnode: %u), err: %d",</div><div class='add'>+		recoverable_dnode, fsynced_dnode, total_dnode, recovered_inode,</div><div class='add'>+		recovered_dentry, recovered_dnode, err);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int f2fs_recover_fsync_data(struct f2fs_sb_info *sbi, bool check_only)</div><div class='ctx'> {</div><div class='del'>-	struct list_head inode_list, tmp_inode_list;</div><div class='del'>-	struct list_head dir_list;</div><div class='add'>+	LIST_HEAD(inode_list);</div><div class='add'>+	LIST_HEAD(tmp_inode_list);</div><div class='add'>+	LIST_HEAD(dir_list);</div><div class='ctx'> 	int err;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	unsigned long s_flags = sbi-&gt;sb-&gt;s_flags;</div><div class='ctx'> 	bool need_writecp = false;</div><div class='del'>-	bool fix_curseg_write_pointer = false;</div><div class='del'>-#ifdef CONFIG_QUOTA</div><div class='del'>-	int quota_enabled;</div><div class='del'>-#endif</div><div class='add'>+	bool new_inode = false;</div><div class='ctx'> </div><div class='del'>-	if (s_flags &amp; SB_RDONLY) {</div><div class='del'>-		f2fs_info(sbi, "recover fsync data on readonly fs");</div><div class='del'>-		sbi-&gt;sb-&gt;s_flags &amp;= ~SB_RDONLY;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_QUOTA</div><div class='del'>-	/* Turn on quotas so that they are updated correctly */</div><div class='del'>-	quota_enabled = f2fs_enable_quota_files(sbi, s_flags &amp; SB_RDONLY);</div><div class='del'>-#endif</div><div class='add'>+	f2fs_notice(sbi, "f2fs_recover_fsync_data: recovery fsync data, "</div><div class='add'>+					"check_only: %d", check_only);</div><div class='ctx'> </div><div class='del'>-	INIT_LIST_HEAD(&amp;inode_list);</div><div class='del'>-	INIT_LIST_HEAD(&amp;tmp_inode_list);</div><div class='del'>-	INIT_LIST_HEAD(&amp;dir_list);</div><div class='add'>+	if (is_sbi_flag_set(sbi, SBI_IS_WRITABLE))</div><div class='add'>+		f2fs_info(sbi, "recover fsync data on readonly fs");</div><div class='ctx'> </div><div class='ctx'> 	/* prevent checkpoint */</div><div class='del'>-	down_write(&amp;sbi-&gt;cp_global_sem);</div><div class='add'>+	f2fs_down_write(&amp;sbi-&gt;cp_global_sem);</div><div class='ctx'> </div><div class='ctx'> 	/* step #1: find fsynced inode numbers */</div><div class='del'>-	err = find_fsync_dnodes(sbi, &amp;inode_list, check_only);</div><div class='del'>-	if (err || list_empty(&amp;inode_list))</div><div class='add'>+	err = find_fsync_dnodes(sbi, &amp;inode_list, check_only, &amp;new_inode);</div><div class='add'>+	if (err &lt; 0 || (list_empty(&amp;inode_list) &amp;&amp; (!check_only || !new_inode)))</div><div class='ctx'> 		goto skip;</div><div class='ctx'> </div><div class='ctx'> 	if (check_only) {</div><div class='hunk'>@@ -817,8 +909,6 @@ int f2fs_recover_fsync_data(struct f2fs_sb_info *sbi, bool check_only)</div><div class='ctx'> 	else</div><div class='ctx'> 		f2fs_bug_on(sbi, sbi-&gt;sb-&gt;s_flags &amp; SB_ACTIVE);</div><div class='ctx'> skip:</div><div class='del'>-	fix_curseg_write_pointer = !check_only || list_empty(&amp;inode_list);</div><div class='del'>-</div><div class='ctx'> 	destroy_fsync_dnodes(&amp;inode_list, err);</div><div class='ctx'> 	destroy_fsync_dnodes(&amp;tmp_inode_list, err);</div><div class='ctx'> </div><div class='hunk'>@@ -836,16 +926,13 @@ skip:</div><div class='ctx'> 	 * and the f2fs is not read only, check and fix zoned block devices'</div><div class='ctx'> 	 * write pointer consistency.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!err &amp;&amp; fix_curseg_write_pointer &amp;&amp; !f2fs_readonly(sbi-&gt;sb) &amp;&amp;</div><div class='del'>-			f2fs_sb_has_blkzoned(sbi)) {</div><div class='del'>-		err = f2fs_fix_curseg_write_pointer(sbi);</div><div class='del'>-		ret = err;</div><div class='del'>-	}</div><div class='add'>+	if (!err)</div><div class='add'>+		err = f2fs_check_and_fix_write_pointer(sbi);</div><div class='ctx'> </div><div class='ctx'> 	if (!err)</div><div class='ctx'> 		clear_sbi_flag(sbi, SBI_POR_DOING);</div><div class='ctx'> </div><div class='del'>-	up_write(&amp;sbi-&gt;cp_global_sem);</div><div class='add'>+	f2fs_up_write(&amp;sbi-&gt;cp_global_sem);</div><div class='ctx'> </div><div class='ctx'> 	/* let's drop all the directory inodes for clean checkpoint */</div><div class='ctx'> 	destroy_fsync_dnodes(&amp;dir_list, err);</div><div class='hunk'>@@ -857,15 +944,11 @@ skip:</div><div class='ctx'> 			struct cp_control cpc = {</div><div class='ctx'> 				.reason = CP_RECOVERY,</div><div class='ctx'> 			};</div><div class='add'>+			stat_inc_cp_call_count(sbi, TOTAL_CALL);</div><div class='ctx'> 			err = f2fs_write_checkpoint(sbi, &amp;cpc);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_QUOTA</div><div class='del'>-	/* Turn quotas off */</div><div class='del'>-	if (quota_enabled)</div><div class='del'>-		f2fs_quota_off_umount(sbi-&gt;sb);</div><div class='del'>-#endif</div><div class='ctx'> 	sbi-&gt;sb-&gt;s_flags = s_flags; /* Restore SB_RDONLY status */</div><div class='ctx'> </div><div class='ctx'> 	return ret ? ret : err;</div><div class='hunk'>@@ -875,9 +958,7 @@ int __init f2fs_create_recovery_cache(void)</div><div class='ctx'> {</div><div class='ctx'> 	fsync_entry_slab = f2fs_kmem_cache_create("f2fs_fsync_inode_entry",</div><div class='ctx'> 					sizeof(struct fsync_inode_entry));</div><div class='del'>-	if (!fsync_entry_slab)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	return 0;</div><div class='add'>+	return fsync_entry_slab ? 0 : -ENOMEM;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_destroy_recovery_cache(void)</div><div class='head'>diff --git a/fs/f2fs/segment.c b/fs/f2fs/segment.c<br/>index df9ed75f0b7a..c26424f47686 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/segment.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/segment.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/segment.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/segment.c</a></div><div class='hunk'>@@ -9,6 +9,7 @@</div><div class='ctx'> #include &lt;linux/f2fs_fs.h&gt;</div><div class='ctx'> #include &lt;linux/bio.h&gt;</div><div class='ctx'> #include &lt;linux/blkdev.h&gt;</div><div class='add'>+#include &lt;linux/sched/mm.h&gt;</div><div class='ctx'> #include &lt;linux/prefetch.h&gt;</div><div class='ctx'> #include &lt;linux/kthread.h&gt;</div><div class='ctx'> #include &lt;linux/swap.h&gt;</div><div class='hunk'>@@ -29,7 +30,7 @@</div><div class='ctx'> static struct kmem_cache *discard_entry_slab;</div><div class='ctx'> static struct kmem_cache *discard_cmd_slab;</div><div class='ctx'> static struct kmem_cache *sit_entry_set_slab;</div><div class='del'>-static struct kmem_cache *inmem_entry_slab;</div><div class='add'>+static struct kmem_cache *revoke_entry_slab;</div><div class='ctx'> </div><div class='ctx'> static unsigned long __reverse_ulong(unsigned char *str)</div><div class='ctx'> {</div><div class='hunk'>@@ -184,309 +185,234 @@ bool f2fs_need_SSR(struct f2fs_sb_info *sbi)</div><div class='ctx'> 			SM_I(sbi)-&gt;min_ssr_sections + reserved_sections(sbi));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_register_inmem_page(struct inode *inode, struct page *page)</div><div class='add'>+void f2fs_abort_atomic_write(struct inode *inode, bool clean)</div><div class='ctx'> {</div><div class='del'>-	struct inmem_pages *new;</div><div class='add'>+	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='ctx'> </div><div class='del'>-	set_page_private_atomic(page);</div><div class='add'>+	if (!f2fs_is_atomic_file(inode))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	new = f2fs_kmem_cache_alloc(inmem_entry_slab,</div><div class='del'>-					GFP_NOFS, true, NULL);</div><div class='add'>+	if (clean)</div><div class='add'>+		truncate_inode_pages_final(inode-&gt;i_mapping);</div><div class='ctx'> </div><div class='del'>-	/* add atomic page indices to the list */</div><div class='del'>-	new-&gt;page = page;</div><div class='del'>-	INIT_LIST_HEAD(&amp;new-&gt;list);</div><div class='add'>+	release_atomic_write_cnt(inode);</div><div class='add'>+	clear_inode_flag(inode, FI_ATOMIC_COMMITTED);</div><div class='add'>+	clear_inode_flag(inode, FI_ATOMIC_REPLACE);</div><div class='add'>+	clear_inode_flag(inode, FI_ATOMIC_FILE);</div><div class='add'>+	if (is_inode_flag_set(inode, FI_ATOMIC_DIRTIED)) {</div><div class='add'>+		clear_inode_flag(inode, FI_ATOMIC_DIRTIED);</div><div class='add'>+		/*</div><div class='add'>+		 * The vfs inode keeps clean during commit, but the f2fs inode</div><div class='add'>+		 * doesn't. So clear the dirty state after commit and let</div><div class='add'>+		 * f2fs_mark_inode_dirty_sync ensure a consistent dirty state.</div><div class='add'>+		 */</div><div class='add'>+		f2fs_inode_synced(inode);</div><div class='add'>+		f2fs_mark_inode_dirty_sync(inode, true);</div><div class='add'>+	}</div><div class='add'>+	stat_dec_atomic_inode(inode);</div><div class='ctx'> </div><div class='del'>-	/* increase reference count with clean state */</div><div class='del'>-	get_page(page);</div><div class='del'>-	mutex_lock(&amp;F2FS_I(inode)-&gt;inmem_lock);</div><div class='del'>-	list_add_tail(&amp;new-&gt;list, &amp;F2FS_I(inode)-&gt;inmem_pages);</div><div class='del'>-	inc_page_count(F2FS_I_SB(inode), F2FS_INMEM_PAGES);</div><div class='del'>-	mutex_unlock(&amp;F2FS_I(inode)-&gt;inmem_lock);</div><div class='add'>+	F2FS_I(inode)-&gt;atomic_write_task = NULL;</div><div class='ctx'> </div><div class='del'>-	trace_f2fs_register_inmem_page(page, INMEM);</div><div class='add'>+	if (clean) {</div><div class='add'>+		f2fs_i_size_write(inode, fi-&gt;original_i_size);</div><div class='add'>+		fi-&gt;original_i_size = 0;</div><div class='add'>+	}</div><div class='add'>+	/* avoid stale dirty inode during eviction */</div><div class='add'>+	sync_inode_metadata(inode, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __revoke_inmem_pages(struct inode *inode,</div><div class='del'>-				struct list_head *head, bool drop, bool recover,</div><div class='del'>-				bool trylock)</div><div class='add'>+static int __replace_atomic_write_block(struct inode *inode, pgoff_t index,</div><div class='add'>+			block_t new_addr, block_t *old_addr, bool recover)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='del'>-	struct inmem_pages *cur, *tmp;</div><div class='del'>-	int err = 0;</div><div class='add'>+	struct dnode_of_data dn;</div><div class='add'>+	struct node_info ni;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry_safe(cur, tmp, head, list) {</div><div class='del'>-		struct page *page = cur-&gt;page;</div><div class='add'>+retry:</div><div class='add'>+	set_new_dnode(&amp;dn, inode, NULL, NULL, 0);</div><div class='add'>+	err = f2fs_get_dnode_of_data(&amp;dn, index, ALLOC_NODE);</div><div class='add'>+	if (err) {</div><div class='add'>+		if (err == -ENOMEM) {</div><div class='add'>+			memalloc_retry_wait(GFP_NOFS);</div><div class='add'>+			goto retry;</div><div class='add'>+		}</div><div class='add'>+		return err;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		if (drop)</div><div class='del'>-			trace_f2fs_commit_inmem_page(page, INMEM_DROP);</div><div class='add'>+	err = f2fs_get_node_info(sbi, dn.nid, &amp;ni, false);</div><div class='add'>+	if (err) {</div><div class='add'>+		f2fs_put_dnode(&amp;dn);</div><div class='add'>+		return err;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		if (trylock) {</div><div class='del'>-			/*</div><div class='del'>-			 * to avoid deadlock in between page lock and</div><div class='del'>-			 * inmem_lock.</div><div class='del'>-			 */</div><div class='del'>-			if (!trylock_page(page))</div><div class='del'>-				continue;</div><div class='add'>+	if (recover) {</div><div class='add'>+		/* dn.data_blkaddr is always valid */</div><div class='add'>+		if (!__is_valid_data_blkaddr(new_addr)) {</div><div class='add'>+			if (new_addr == NULL_ADDR)</div><div class='add'>+				dec_valid_block_count(sbi, inode, 1);</div><div class='add'>+			f2fs_invalidate_blocks(sbi, dn.data_blkaddr, 1);</div><div class='add'>+			f2fs_update_data_blkaddr(&amp;dn, new_addr);</div><div class='ctx'> 		} else {</div><div class='del'>-			lock_page(page);</div><div class='add'>+			f2fs_replace_block(sbi, &amp;dn, dn.data_blkaddr,</div><div class='add'>+				new_addr, ni.version, true, true);</div><div class='ctx'> 		}</div><div class='add'>+	} else {</div><div class='add'>+		blkcnt_t count = 1;</div><div class='ctx'> </div><div class='del'>-		f2fs_wait_on_page_writeback(page, DATA, true, true);</div><div class='del'>-</div><div class='del'>-		if (recover) {</div><div class='del'>-			struct dnode_of_data dn;</div><div class='del'>-			struct node_info ni;</div><div class='del'>-</div><div class='del'>-			trace_f2fs_commit_inmem_page(page, INMEM_REVOKE);</div><div class='del'>-retry:</div><div class='del'>-			set_new_dnode(&amp;dn, inode, NULL, NULL, 0);</div><div class='del'>-			err = f2fs_get_dnode_of_data(&amp;dn, page-&gt;index,</div><div class='del'>-								LOOKUP_NODE);</div><div class='del'>-			if (err) {</div><div class='del'>-				if (err == -ENOMEM) {</div><div class='del'>-					congestion_wait(BLK_RW_ASYNC,</div><div class='del'>-							DEFAULT_IO_TIMEOUT);</div><div class='del'>-					cond_resched();</div><div class='del'>-					goto retry;</div><div class='del'>-				}</div><div class='del'>-				err = -EAGAIN;</div><div class='del'>-				goto next;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			err = f2fs_get_node_info(sbi, dn.nid, &amp;ni);</div><div class='del'>-			if (err) {</div><div class='del'>-				f2fs_put_dnode(&amp;dn);</div><div class='del'>-				return err;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			if (cur-&gt;old_addr == NEW_ADDR) {</div><div class='del'>-				f2fs_invalidate_blocks(sbi, dn.data_blkaddr);</div><div class='del'>-				f2fs_update_data_blkaddr(&amp;dn, NEW_ADDR);</div><div class='del'>-			} else</div><div class='del'>-				f2fs_replace_block(sbi, &amp;dn, dn.data_blkaddr,</div><div class='del'>-					cur-&gt;old_addr, ni.version, true, true);</div><div class='add'>+		err = inc_valid_block_count(sbi, inode, &amp;count, true);</div><div class='add'>+		if (err) {</div><div class='ctx'> 			f2fs_put_dnode(&amp;dn);</div><div class='add'>+			return err;</div><div class='ctx'> 		}</div><div class='del'>-next:</div><div class='del'>-		/* we don't need to invalidate this in the sccessful status */</div><div class='del'>-		if (drop || recover) {</div><div class='del'>-			ClearPageUptodate(page);</div><div class='del'>-			clear_page_private_gcing(page);</div><div class='del'>-		}</div><div class='del'>-		detach_page_private(page);</div><div class='del'>-		set_page_private(page, 0);</div><div class='del'>-		f2fs_put_page(page, 1);</div><div class='ctx'> </div><div class='del'>-		list_del(&amp;cur-&gt;list);</div><div class='del'>-		kmem_cache_free(inmem_entry_slab, cur);</div><div class='del'>-		dec_page_count(F2FS_I_SB(inode), F2FS_INMEM_PAGES);</div><div class='del'>-	}</div><div class='del'>-	return err;</div><div class='del'>-}</div><div class='add'>+		*old_addr = dn.data_blkaddr;</div><div class='add'>+		f2fs_truncate_data_blocks_range(&amp;dn, 1);</div><div class='add'>+		dec_valid_block_count(sbi, F2FS_I(inode)-&gt;cow_inode, count);</div><div class='ctx'> </div><div class='del'>-void f2fs_drop_inmem_pages_all(struct f2fs_sb_info *sbi, bool gc_failure)</div><div class='del'>-{</div><div class='del'>-	struct list_head *head = &amp;sbi-&gt;inode_list[ATOMIC_FILE];</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	struct f2fs_inode_info *fi;</div><div class='del'>-	unsigned int count = sbi-&gt;atomic_files;</div><div class='del'>-	unsigned int looped = 0;</div><div class='del'>-next:</div><div class='del'>-	spin_lock(&amp;sbi-&gt;inode_lock[ATOMIC_FILE]);</div><div class='del'>-	if (list_empty(head)) {</div><div class='del'>-		spin_unlock(&amp;sbi-&gt;inode_lock[ATOMIC_FILE]);</div><div class='del'>-		return;</div><div class='add'>+		f2fs_replace_block(sbi, &amp;dn, dn.data_blkaddr, new_addr,</div><div class='add'>+					ni.version, true, false);</div><div class='ctx'> 	}</div><div class='del'>-	fi = list_first_entry(head, struct f2fs_inode_info, inmem_ilist);</div><div class='del'>-	inode = igrab(&amp;fi-&gt;vfs_inode);</div><div class='del'>-	if (inode)</div><div class='del'>-		list_move_tail(&amp;fi-&gt;inmem_ilist, head);</div><div class='del'>-	spin_unlock(&amp;sbi-&gt;inode_lock[ATOMIC_FILE]);</div><div class='ctx'> </div><div class='del'>-	if (inode) {</div><div class='del'>-		if (gc_failure) {</div><div class='del'>-			if (!fi-&gt;i_gc_failures[GC_FAILURE_ATOMIC])</div><div class='del'>-				goto skip;</div><div class='del'>-		}</div><div class='del'>-		set_inode_flag(inode, FI_ATOMIC_REVOKE_REQUEST);</div><div class='del'>-		f2fs_drop_inmem_pages(inode);</div><div class='del'>-skip:</div><div class='del'>-		iput(inode);</div><div class='del'>-	}</div><div class='del'>-	congestion_wait(BLK_RW_ASYNC, DEFAULT_IO_TIMEOUT);</div><div class='del'>-	cond_resched();</div><div class='del'>-	if (gc_failure) {</div><div class='del'>-		if (++looped &gt;= count)</div><div class='del'>-			return;</div><div class='del'>-	}</div><div class='del'>-	goto next;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void f2fs_drop_inmem_pages(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='del'>-	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		mutex_lock(&amp;fi-&gt;inmem_lock);</div><div class='del'>-		if (list_empty(&amp;fi-&gt;inmem_pages)) {</div><div class='del'>-			fi-&gt;i_gc_failures[GC_FAILURE_ATOMIC] = 0;</div><div class='del'>-</div><div class='del'>-			spin_lock(&amp;sbi-&gt;inode_lock[ATOMIC_FILE]);</div><div class='del'>-			if (!list_empty(&amp;fi-&gt;inmem_ilist))</div><div class='del'>-				list_del_init(&amp;fi-&gt;inmem_ilist);</div><div class='del'>-			if (f2fs_is_atomic_file(inode)) {</div><div class='del'>-				clear_inode_flag(inode, FI_ATOMIC_FILE);</div><div class='del'>-				sbi-&gt;atomic_files--;</div><div class='del'>-			}</div><div class='del'>-			spin_unlock(&amp;sbi-&gt;inode_lock[ATOMIC_FILE]);</div><div class='add'>+	f2fs_put_dnode(&amp;dn);</div><div class='ctx'> </div><div class='del'>-			mutex_unlock(&amp;fi-&gt;inmem_lock);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		__revoke_inmem_pages(inode, &amp;fi-&gt;inmem_pages,</div><div class='del'>-						true, false, true);</div><div class='del'>-		mutex_unlock(&amp;fi-&gt;inmem_lock);</div><div class='del'>-	} while (1);</div><div class='add'>+	trace_f2fs_replace_atomic_write_block(inode, F2FS_I(inode)-&gt;cow_inode,</div><div class='add'>+			index, old_addr ? *old_addr : 0, new_addr, recover);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_drop_inmem_page(struct inode *inode, struct page *page)</div><div class='add'>+static void __complete_revoke_list(struct inode *inode, struct list_head *head,</div><div class='add'>+					bool revoke)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='del'>-	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='del'>-	struct list_head *head = &amp;fi-&gt;inmem_pages;</div><div class='del'>-	struct inmem_pages *cur = NULL;</div><div class='add'>+	struct revoke_entry *cur, *tmp;</div><div class='add'>+	pgoff_t start_index = 0;</div><div class='add'>+	bool truncate = is_inode_flag_set(inode, FI_ATOMIC_REPLACE);</div><div class='ctx'> </div><div class='del'>-	f2fs_bug_on(sbi, !page_private_atomic(page));</div><div class='add'>+	list_for_each_entry_safe(cur, tmp, head, list) {</div><div class='add'>+		if (revoke) {</div><div class='add'>+			__replace_atomic_write_block(inode, cur-&gt;index,</div><div class='add'>+						cur-&gt;old_addr, NULL, true);</div><div class='add'>+		} else if (truncate) {</div><div class='add'>+			f2fs_truncate_hole(inode, start_index, cur-&gt;index);</div><div class='add'>+			start_index = cur-&gt;index + 1;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;fi-&gt;inmem_lock);</div><div class='del'>-	list_for_each_entry(cur, head, list) {</div><div class='del'>-		if (cur-&gt;page == page)</div><div class='del'>-			break;</div><div class='add'>+		list_del(&amp;cur-&gt;list);</div><div class='add'>+		kmem_cache_free(revoke_entry_slab, cur);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	f2fs_bug_on(sbi, list_empty(head) || cur-&gt;page != page);</div><div class='del'>-	list_del(&amp;cur-&gt;list);</div><div class='del'>-	mutex_unlock(&amp;fi-&gt;inmem_lock);</div><div class='del'>-</div><div class='del'>-	dec_page_count(sbi, F2FS_INMEM_PAGES);</div><div class='del'>-	kmem_cache_free(inmem_entry_slab, cur);</div><div class='del'>-</div><div class='del'>-	ClearPageUptodate(page);</div><div class='del'>-	clear_page_private_atomic(page);</div><div class='del'>-	f2fs_put_page(page, 0);</div><div class='del'>-</div><div class='del'>-	detach_page_private(page);</div><div class='del'>-	set_page_private(page, 0);</div><div class='del'>-</div><div class='del'>-	trace_f2fs_commit_inmem_page(page, INMEM_INVALIDATE);</div><div class='add'>+	if (!revoke &amp;&amp; truncate)</div><div class='add'>+		f2fs_do_truncate_blocks(inode, start_index * PAGE_SIZE, false);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __f2fs_commit_inmem_pages(struct inode *inode)</div><div class='add'>+static int __f2fs_commit_atomic_write(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='del'>-	struct inmem_pages *cur, *tmp;</div><div class='del'>-	struct f2fs_io_info fio = {</div><div class='del'>-		.sbi = sbi,</div><div class='del'>-		.ino = inode-&gt;i_ino,</div><div class='del'>-		.type = DATA,</div><div class='del'>-		.op = REQ_OP_WRITE,</div><div class='del'>-		.op_flags = REQ_SYNC | REQ_PRIO,</div><div class='del'>-		.io_type = FS_DATA_IO,</div><div class='del'>-	};</div><div class='add'>+	struct inode *cow_inode = fi-&gt;cow_inode;</div><div class='add'>+	struct revoke_entry *new;</div><div class='ctx'> 	struct list_head revoke_list;</div><div class='del'>-	bool submit_bio = false;</div><div class='del'>-	int err = 0;</div><div class='add'>+	block_t blkaddr;</div><div class='add'>+	struct dnode_of_data dn;</div><div class='add'>+	pgoff_t len = DIV_ROUND_UP(i_size_read(inode), PAGE_SIZE);</div><div class='add'>+	pgoff_t off = 0, blen, index;</div><div class='add'>+	int ret = 0, i;</div><div class='ctx'> </div><div class='ctx'> 	INIT_LIST_HEAD(&amp;revoke_list);</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry_safe(cur, tmp, &amp;fi-&gt;inmem_pages, list) {</div><div class='del'>-		struct page *page = cur-&gt;page;</div><div class='add'>+	while (len) {</div><div class='add'>+		blen = min_t(pgoff_t, ADDRS_PER_BLOCK(cow_inode), len);</div><div class='ctx'> </div><div class='del'>-		lock_page(page);</div><div class='del'>-		if (page-&gt;mapping == inode-&gt;i_mapping) {</div><div class='del'>-			trace_f2fs_commit_inmem_page(page, INMEM);</div><div class='add'>+		set_new_dnode(&amp;dn, cow_inode, NULL, NULL, 0);</div><div class='add'>+		ret = f2fs_get_dnode_of_data(&amp;dn, off, LOOKUP_NODE_RA);</div><div class='add'>+		if (ret &amp;&amp; ret != -ENOENT) {</div><div class='add'>+			goto out;</div><div class='add'>+		} else if (ret == -ENOENT) {</div><div class='add'>+			ret = 0;</div><div class='add'>+			if (dn.max_level == 0)</div><div class='add'>+				goto out;</div><div class='add'>+			goto next;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-			f2fs_wait_on_page_writeback(page, DATA, true, true);</div><div class='add'>+		blen = min((pgoff_t)ADDRS_PER_PAGE(dn.node_folio, cow_inode),</div><div class='add'>+				len);</div><div class='add'>+		index = off;</div><div class='add'>+		for (i = 0; i &lt; blen; i++, dn.ofs_in_node++, index++) {</div><div class='add'>+			blkaddr = f2fs_data_blkaddr(&amp;dn);</div><div class='ctx'> </div><div class='del'>-			set_page_dirty(page);</div><div class='del'>-			if (clear_page_dirty_for_io(page)) {</div><div class='del'>-				inode_dec_dirty_pages(inode);</div><div class='del'>-				f2fs_remove_dirty_inode(inode);</div><div class='add'>+			if (!__is_valid_data_blkaddr(blkaddr)) {</div><div class='add'>+				continue;</div><div class='add'>+			} else if (!f2fs_is_valid_blkaddr(sbi, blkaddr,</div><div class='add'>+					DATA_GENERIC_ENHANCE)) {</div><div class='add'>+				f2fs_put_dnode(&amp;dn);</div><div class='add'>+				ret = -EFSCORRUPTED;</div><div class='add'>+				goto out;</div><div class='ctx'> 			}</div><div class='del'>-retry:</div><div class='del'>-			fio.page = page;</div><div class='del'>-			fio.old_blkaddr = NULL_ADDR;</div><div class='del'>-			fio.encrypted_page = NULL;</div><div class='del'>-			fio.need_lock = LOCK_DONE;</div><div class='del'>-			err = f2fs_do_write_data_page(&amp;fio);</div><div class='del'>-			if (err) {</div><div class='del'>-				if (err == -ENOMEM) {</div><div class='del'>-					congestion_wait(BLK_RW_ASYNC,</div><div class='del'>-							DEFAULT_IO_TIMEOUT);</div><div class='del'>-					cond_resched();</div><div class='del'>-					goto retry;</div><div class='del'>-				}</div><div class='del'>-				unlock_page(page);</div><div class='del'>-				break;</div><div class='add'>+</div><div class='add'>+			new = f2fs_kmem_cache_alloc(revoke_entry_slab, GFP_NOFS,</div><div class='add'>+							true, NULL);</div><div class='add'>+</div><div class='add'>+			ret = __replace_atomic_write_block(inode, index, blkaddr,</div><div class='add'>+							&amp;new-&gt;old_addr, false);</div><div class='add'>+			if (ret) {</div><div class='add'>+				f2fs_put_dnode(&amp;dn);</div><div class='add'>+				kmem_cache_free(revoke_entry_slab, new);</div><div class='add'>+				goto out;</div><div class='ctx'> 			}</div><div class='del'>-			/* record old blkaddr for revoking */</div><div class='del'>-			cur-&gt;old_addr = fio.old_blkaddr;</div><div class='del'>-			submit_bio = true;</div><div class='add'>+</div><div class='add'>+			f2fs_update_data_blkaddr(&amp;dn, NULL_ADDR);</div><div class='add'>+			new-&gt;index = index;</div><div class='add'>+			list_add_tail(&amp;new-&gt;list, &amp;revoke_list);</div><div class='ctx'> 		}</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		list_move_tail(&amp;cur-&gt;list, &amp;revoke_list);</div><div class='add'>+		f2fs_put_dnode(&amp;dn);</div><div class='add'>+next:</div><div class='add'>+		off += blen;</div><div class='add'>+		len -= blen;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (submit_bio)</div><div class='del'>-		f2fs_submit_merged_write_cond(sbi, inode, NULL, 0, DATA);</div><div class='add'>+out:</div><div class='add'>+	if (time_to_inject(sbi, FAULT_TIMEOUT))</div><div class='add'>+		f2fs_io_schedule_timeout_killable(DEFAULT_FAULT_TIMEOUT);</div><div class='add'>+</div><div class='add'>+	if (ret) {</div><div class='add'>+		sbi-&gt;revoked_atomic_block += fi-&gt;atomic_write_cnt;</div><div class='add'>+	} else {</div><div class='add'>+		sbi-&gt;committed_atomic_block += fi-&gt;atomic_write_cnt;</div><div class='add'>+		set_inode_flag(inode, FI_ATOMIC_COMMITTED);</div><div class='ctx'> </div><div class='del'>-	if (err) {</div><div class='ctx'> 		/*</div><div class='del'>-		 * try to revoke all committed pages, but still we could fail</div><div class='del'>-		 * due to no memory or other reason, if that happened, EAGAIN</div><div class='del'>-		 * will be returned, which means in such case, transaction is</div><div class='del'>-		 * already not integrity, caller should use journal to do the</div><div class='del'>-		 * recovery or rewrite &amp; commit last transaction. For other</div><div class='del'>-		 * error number, revoking was done by filesystem itself.</div><div class='add'>+		 * inode may has no FI_ATOMIC_DIRTIED flag due to no write</div><div class='add'>+		 * before commit.</div><div class='ctx'> 		 */</div><div class='del'>-		err = __revoke_inmem_pages(inode, &amp;revoke_list,</div><div class='del'>-						false, true, false);</div><div class='del'>-</div><div class='del'>-		/* drop all uncommitted pages */</div><div class='del'>-		__revoke_inmem_pages(inode, &amp;fi-&gt;inmem_pages,</div><div class='del'>-						true, false, false);</div><div class='del'>-	} else {</div><div class='del'>-		__revoke_inmem_pages(inode, &amp;revoke_list,</div><div class='del'>-						false, false, false);</div><div class='add'>+		if (is_inode_flag_set(inode, FI_ATOMIC_DIRTIED)) {</div><div class='add'>+			/* clear atomic dirty status and set vfs dirty status */</div><div class='add'>+			clear_inode_flag(inode, FI_ATOMIC_DIRTIED);</div><div class='add'>+			f2fs_mark_inode_dirty_sync(inode, true);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return err;</div><div class='add'>+	__complete_revoke_list(inode, &amp;revoke_list, ret ? true : false);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int f2fs_commit_inmem_pages(struct inode *inode)</div><div class='add'>+int f2fs_commit_atomic_write(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	struct f2fs_inode_info *fi = F2FS_I(inode);</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	f2fs_balance_fs(sbi, true);</div><div class='del'>-</div><div class='del'>-	down_write(&amp;fi-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+	err = filemap_write_and_wait_range(inode-&gt;i_mapping, 0, LLONG_MAX);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='add'>+	f2fs_down_write(&amp;fi-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> 	f2fs_lock_op(sbi);</div><div class='del'>-	set_inode_flag(inode, FI_ATOMIC_COMMIT);</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;fi-&gt;inmem_lock);</div><div class='del'>-	err = __f2fs_commit_inmem_pages(inode);</div><div class='del'>-	mutex_unlock(&amp;fi-&gt;inmem_lock);</div><div class='del'>-</div><div class='del'>-	clear_inode_flag(inode, FI_ATOMIC_COMMIT);</div><div class='add'>+	err = __f2fs_commit_atomic_write(inode);</div><div class='ctx'> </div><div class='ctx'> 	f2fs_unlock_op(sbi);</div><div class='del'>-	up_write(&amp;fi-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+	f2fs_up_write(&amp;fi-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='hunk'>@@ -497,49 +423,60 @@ int f2fs_commit_inmem_pages(struct inode *inode)</div><div class='ctx'>  */</div><div class='ctx'> void f2fs_balance_fs(struct f2fs_sb_info *sbi, bool need)</div><div class='ctx'> {</div><div class='del'>-	if (time_to_inject(sbi, FAULT_CHECKPOINT)) {</div><div class='del'>-		f2fs_show_injection_info(sbi, FAULT_CHECKPOINT);</div><div class='del'>-		f2fs_stop_checkpoint(sbi, false);</div><div class='del'>-	}</div><div class='add'>+	if (f2fs_cp_error(sbi))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (time_to_inject(sbi, FAULT_CHECKPOINT))</div><div class='add'>+		f2fs_stop_checkpoint(sbi, false, STOP_CP_REASON_FAULT_INJECT);</div><div class='ctx'> </div><div class='ctx'> 	/* balance_fs_bg is able to be pending */</div><div class='ctx'> 	if (need &amp;&amp; excess_cached_nats(sbi))</div><div class='ctx'> 		f2fs_balance_fs_bg(sbi, false);</div><div class='ctx'> </div><div class='del'>-	if (!f2fs_is_checkpoint_ready(sbi))</div><div class='add'>+	if (unlikely(is_sbi_flag_set(sbi, SBI_CP_DISABLED)))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We should do GC or end up with checkpoint, if there are so many dirty</div><div class='ctx'> 	 * dir/node pages without enough free segments.</div><div class='ctx'> 	 */</div><div class='del'>-	if (has_not_enough_free_secs(sbi, 0, 0)) {</div><div class='del'>-		if (test_opt(sbi, GC_MERGE) &amp;&amp; sbi-&gt;gc_thread &amp;&amp;</div><div class='del'>-					sbi-&gt;gc_thread-&gt;f2fs_gc_task) {</div><div class='del'>-			DEFINE_WAIT(wait);</div><div class='del'>-</div><div class='del'>-			prepare_to_wait(&amp;sbi-&gt;gc_thread-&gt;fggc_wq, &amp;wait,</div><div class='del'>-						TASK_UNINTERRUPTIBLE);</div><div class='del'>-			wake_up(&amp;sbi-&gt;gc_thread-&gt;gc_wait_queue_head);</div><div class='del'>-			io_schedule();</div><div class='del'>-			finish_wait(&amp;sbi-&gt;gc_thread-&gt;fggc_wq, &amp;wait);</div><div class='del'>-		} else {</div><div class='del'>-			down_write(&amp;sbi-&gt;gc_lock);</div><div class='del'>-			f2fs_gc(sbi, false, false, false, NULL_SEGNO);</div><div class='del'>-		}</div><div class='add'>+	if (has_enough_free_secs(sbi, 0, 0))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (test_opt(sbi, GC_MERGE) &amp;&amp; sbi-&gt;gc_thread &amp;&amp;</div><div class='add'>+				sbi-&gt;gc_thread-&gt;f2fs_gc_task) {</div><div class='add'>+		DEFINE_WAIT(wait);</div><div class='add'>+</div><div class='add'>+		prepare_to_wait(&amp;sbi-&gt;gc_thread-&gt;fggc_wq, &amp;wait,</div><div class='add'>+					TASK_UNINTERRUPTIBLE);</div><div class='add'>+		wake_up(&amp;sbi-&gt;gc_thread-&gt;gc_wait_queue_head);</div><div class='add'>+		io_schedule();</div><div class='add'>+		finish_wait(&amp;sbi-&gt;gc_thread-&gt;fggc_wq, &amp;wait);</div><div class='add'>+	} else {</div><div class='add'>+		struct f2fs_gc_control gc_control = {</div><div class='add'>+			.victim_segno = NULL_SEGNO,</div><div class='add'>+			.init_gc_type = f2fs_sb_has_blkzoned(sbi) ?</div><div class='add'>+				FG_GC : BG_GC,</div><div class='add'>+			.no_bg_gc = true,</div><div class='add'>+			.should_migrate_blocks = false,</div><div class='add'>+			.err_gc_skipped = false,</div><div class='add'>+			.nr_free_secs = 1 };</div><div class='add'>+		f2fs_down_write(&amp;sbi-&gt;gc_lock);</div><div class='add'>+		stat_inc_gc_call_count(sbi, FOREGROUND);</div><div class='add'>+		f2fs_gc(sbi, &amp;gc_control);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline bool excess_dirty_threshold(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='del'>-	int factor = rwsem_is_locked(&amp;sbi-&gt;cp_rwsem) ? 3 : 2;</div><div class='add'>+	int factor = f2fs_rwsem_is_locked(&amp;sbi-&gt;cp_rwsem) ? 3 : 2;</div><div class='ctx'> 	unsigned int dents = get_pages(sbi, F2FS_DIRTY_DENTS);</div><div class='ctx'> 	unsigned int qdata = get_pages(sbi, F2FS_DIRTY_QDATA);</div><div class='ctx'> 	unsigned int nodes = get_pages(sbi, F2FS_DIRTY_NODES);</div><div class='ctx'> 	unsigned int meta = get_pages(sbi, F2FS_DIRTY_META);</div><div class='ctx'> 	unsigned int imeta = get_pages(sbi, F2FS_DIRTY_IMETA);</div><div class='del'>-	unsigned int threshold = sbi-&gt;blocks_per_seg * factor *</div><div class='del'>-					DEFAULT_DIRTY_THRESHOLD;</div><div class='add'>+	unsigned int threshold =</div><div class='add'>+		SEGS_TO_BLKS(sbi, (factor * DEFAULT_DIRTY_THRESHOLD));</div><div class='ctx'> 	unsigned int global_threshold = threshold * 3 / 2;</div><div class='ctx'> </div><div class='ctx'> 	if (dents &gt;= threshold || qdata &gt;= threshold ||</div><div class='hunk'>@@ -555,8 +492,14 @@ void f2fs_balance_fs_bg(struct f2fs_sb_info *sbi, bool from_bg)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	/* try to shrink extent cache when there is no enough memory */</div><div class='del'>-	if (!f2fs_available_free_memory(sbi, EXTENT_CACHE))</div><div class='del'>-		f2fs_shrink_extent_tree(sbi, EXTENT_CACHE_SHRINK_NUMBER);</div><div class='add'>+	if (!f2fs_available_free_memory(sbi, READ_EXTENT_CACHE))</div><div class='add'>+		f2fs_shrink_read_extent_tree(sbi,</div><div class='add'>+				READ_EXTENT_CACHE_SHRINK_NUMBER);</div><div class='add'>+</div><div class='add'>+	/* try to shrink age extent cache when there is no enough memory */</div><div class='add'>+	if (!f2fs_available_free_memory(sbi, AGE_EXTENT_CACHE))</div><div class='add'>+		f2fs_shrink_age_extent_tree(sbi,</div><div class='add'>+				AGE_EXTENT_CACHE_SHRINK_NUMBER);</div><div class='ctx'> </div><div class='ctx'> 	/* check the # of cached NAT entries */</div><div class='ctx'> 	if (!f2fs_available_free_memory(sbi, NAT_ENTRIES))</div><div class='hunk'>@@ -573,7 +516,7 @@ void f2fs_balance_fs_bg(struct f2fs_sb_info *sbi, bool from_bg)</div><div class='ctx'> </div><div class='ctx'> 	/* there is background inflight IO or foreground operation recently */</div><div class='ctx'> 	if (is_inflight_io(sbi, REQ_TIME) ||</div><div class='del'>-		(!f2fs_time_over(sbi, REQ_TIME) &amp;&amp; rwsem_is_locked(&amp;sbi-&gt;cp_rwsem)))</div><div class='add'>+		(!f2fs_time_over(sbi, REQ_TIME) &amp;&amp; f2fs_rwsem_is_locked(&amp;sbi-&gt;cp_rwsem)))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	/* exceed periodical checkpoint timeout threshold */</div><div class='hunk'>@@ -592,13 +535,13 @@ do_sync:</div><div class='ctx'> 		mutex_lock(&amp;sbi-&gt;flush_lock);</div><div class='ctx'> </div><div class='ctx'> 		blk_start_plug(&amp;plug);</div><div class='del'>-		f2fs_sync_dirty_inodes(sbi, FILE_INODE);</div><div class='add'>+		f2fs_sync_dirty_inodes(sbi, FILE_INODE, false);</div><div class='ctx'> 		blk_finish_plug(&amp;plug);</div><div class='ctx'> </div><div class='ctx'> 		mutex_unlock(&amp;sbi-&gt;flush_lock);</div><div class='ctx'> 	}</div><div class='del'>-	f2fs_sync_fs(sbi-&gt;sb, true);</div><div class='del'>-	stat_inc_bg_cp_count(sbi-&gt;stat_info);</div><div class='add'>+	stat_inc_cp_call_count(sbi, BACKGROUND);</div><div class='add'>+	f2fs_sync_fs(sbi-&gt;sb, 1);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int __submit_flush_wait(struct f2fs_sb_info *sbi,</div><div class='hunk'>@@ -608,6 +551,8 @@ static int __submit_flush_wait(struct f2fs_sb_info *sbi,</div><div class='ctx'> </div><div class='ctx'> 	trace_f2fs_issue_flush(bdev, test_opt(sbi, NOBARRIER),</div><div class='ctx'> 				test_opt(sbi, FLUSH_MERGE), ret);</div><div class='add'>+	if (!ret)</div><div class='add'>+		f2fs_update_iostat(sbi, NULL, FS_FLUSH_IO, 0);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -738,12 +683,11 @@ int f2fs_create_flush_cmd_control(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	dev_t dev = sbi-&gt;sb-&gt;s_bdev-&gt;bd_dev;</div><div class='ctx'> 	struct flush_cmd_control *fcc;</div><div class='del'>-	int err = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (SM_I(sbi)-&gt;fcc_info) {</div><div class='ctx'> 		fcc = SM_I(sbi)-&gt;fcc_info;</div><div class='ctx'> 		if (fcc-&gt;f2fs_issue_flush)</div><div class='del'>-			return err;</div><div class='add'>+			return 0;</div><div class='ctx'> 		goto init_thread;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -756,19 +700,19 @@ int f2fs_create_flush_cmd_control(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	init_llist_head(&amp;fcc-&gt;issue_list);</div><div class='ctx'> 	SM_I(sbi)-&gt;fcc_info = fcc;</div><div class='ctx'> 	if (!test_opt(sbi, FLUSH_MERGE))</div><div class='del'>-		return err;</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> init_thread:</div><div class='ctx'> 	fcc-&gt;f2fs_issue_flush = kthread_run(issue_flush_thread, sbi,</div><div class='ctx'> 				"f2fs_flush-%u:%u", MAJOR(dev), MINOR(dev));</div><div class='ctx'> 	if (IS_ERR(fcc-&gt;f2fs_issue_flush)) {</div><div class='del'>-		err = PTR_ERR(fcc-&gt;f2fs_issue_flush);</div><div class='del'>-		kfree(fcc);</div><div class='del'>-		SM_I(sbi)-&gt;fcc_info = NULL;</div><div class='add'>+		int err = PTR_ERR(fcc-&gt;f2fs_issue_flush);</div><div class='add'>+</div><div class='add'>+		fcc-&gt;f2fs_issue_flush = NULL;</div><div class='ctx'> 		return err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return err;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_destroy_flush_cmd_control(struct f2fs_sb_info *sbi, bool free)</div><div class='hunk'>@@ -806,12 +750,12 @@ int f2fs_flush_device_cache(struct f2fs_sb_info *sbi)</div><div class='ctx'> 		do {</div><div class='ctx'> 			ret = __submit_flush_wait(sbi, FDEV(i).bdev);</div><div class='ctx'> 			if (ret)</div><div class='del'>-				congestion_wait(BLK_RW_ASYNC,</div><div class='del'>-						DEFAULT_IO_TIMEOUT);</div><div class='add'>+				f2fs_schedule_timeout(DEFAULT_SCHEDULE_TIMEOUT);</div><div class='ctx'> 		} while (ret &amp;&amp; --count);</div><div class='ctx'> </div><div class='ctx'> 		if (ret) {</div><div class='del'>-			f2fs_stop_checkpoint(sbi, false);</div><div class='add'>+			f2fs_stop_checkpoint(sbi, false,</div><div class='add'>+					STOP_CP_REASON_FLUSH_FAIL);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -829,7 +773,7 @@ static void __locate_dirty_segment(struct f2fs_sb_info *sbi, unsigned int segno,</div><div class='ctx'> 	struct dirty_seglist_info *dirty_i = DIRTY_I(sbi);</div><div class='ctx'> </div><div class='ctx'> 	/* need not be added */</div><div class='del'>-	if (IS_CURSEG(sbi, segno))</div><div class='add'>+	if (is_curseg(sbi, segno))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	if (!test_and_set_bit(segno, dirty_i-&gt;dirty_segmap[dirty_type]))</div><div class='hunk'>@@ -851,10 +795,12 @@ static void __locate_dirty_segment(struct f2fs_sb_info *sbi, unsigned int segno,</div><div class='ctx'> 			block_t valid_blocks =</div><div class='ctx'> 				get_valid_blocks(sbi, segno, true);</div><div class='ctx'> </div><div class='del'>-			f2fs_bug_on(sbi, unlikely(!valid_blocks ||</div><div class='del'>-					valid_blocks == BLKS_PER_SEC(sbi)));</div><div class='add'>+			f2fs_bug_on(sbi,</div><div class='add'>+				(!is_sbi_flag_set(sbi, SBI_CP_DISABLED) &amp;&amp;</div><div class='add'>+				!valid_blocks) ||</div><div class='add'>+				valid_blocks == CAP_BLKS_PER_SEC(sbi));</div><div class='ctx'> </div><div class='del'>-			if (!IS_CURSEC(sbi, secno))</div><div class='add'>+			if (!is_cursec(sbi, secno))</div><div class='ctx'> 				set_bit(secno, dirty_i-&gt;dirty_secmap);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -888,12 +834,12 @@ static void __remove_dirty_segment(struct f2fs_sb_info *sbi, unsigned int segno,</div><div class='ctx'> 			unsigned int secno = GET_SEC_FROM_SEG(sbi, segno);</div><div class='ctx'> </div><div class='ctx'> 			if (!valid_blocks ||</div><div class='del'>-					valid_blocks == BLKS_PER_SEC(sbi)) {</div><div class='add'>+					valid_blocks == CAP_BLKS_PER_SEC(sbi)) {</div><div class='ctx'> 				clear_bit(secno, dirty_i-&gt;dirty_secmap);</div><div class='ctx'> 				return;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			if (!IS_CURSEC(sbi, secno))</div><div class='add'>+			if (!is_cursec(sbi, secno))</div><div class='ctx'> 				set_bit(secno, dirty_i-&gt;dirty_secmap);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -910,7 +856,7 @@ static void locate_dirty_segment(struct f2fs_sb_info *sbi, unsigned int segno)</div><div class='ctx'> 	unsigned short valid_blocks, ckpt_valid_blocks;</div><div class='ctx'> 	unsigned int usable_blocks;</div><div class='ctx'> </div><div class='del'>-	if (segno == NULL_SEGNO || IS_CURSEG(sbi, segno))</div><div class='add'>+	if (segno == NULL_SEGNO || is_curseg(sbi, segno))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	usable_blocks = f2fs_usable_blks_in_seg(sbi, segno);</div><div class='hunk'>@@ -943,7 +889,7 @@ void f2fs_dirty_to_prefree(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	for_each_set_bit(segno, dirty_i-&gt;dirty_segmap[DIRTY], MAIN_SEGS(sbi)) {</div><div class='ctx'> 		if (get_valid_blocks(sbi, segno, false))</div><div class='ctx'> 			continue;</div><div class='del'>-		if (IS_CURSEG(sbi, segno))</div><div class='add'>+		if (is_curseg(sbi, segno))</div><div class='ctx'> 			continue;</div><div class='ctx'> 		__locate_dirty_segment(sbi, segno, PRE);</div><div class='ctx'> 		__remove_dirty_segment(sbi, segno, DIRTY);</div><div class='hunk'>@@ -955,7 +901,7 @@ block_t f2fs_get_unusable_blocks(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	int ovp_hole_segs =</div><div class='ctx'> 		(overprovision_segments(sbi) - reserved_segments(sbi));</div><div class='del'>-	block_t ovp_holes = ovp_hole_segs &lt;&lt; sbi-&gt;log_blocks_per_seg;</div><div class='add'>+	block_t ovp_holes = SEGS_TO_BLKS(sbi, ovp_hole_segs);</div><div class='ctx'> 	struct dirty_seglist_info *dirty_i = DIRTY_I(sbi);</div><div class='ctx'> 	block_t holes[2] = {0, 0};	/* DATA and NODE */</div><div class='ctx'> 	block_t unusable;</div><div class='hunk'>@@ -974,7 +920,7 @@ block_t f2fs_get_unusable_blocks(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	}</div><div class='ctx'> 	mutex_unlock(&amp;dirty_i-&gt;seglist_lock);</div><div class='ctx'> </div><div class='del'>-	unusable = holes[DATA] &gt; holes[NODE] ? holes[DATA] : holes[NODE];</div><div class='add'>+	unusable = max(holes[DATA], holes[NODE]);</div><div class='ctx'> 	if (unusable &gt; ovp_holes)</div><div class='ctx'> 		return unusable - ovp_holes;</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -984,11 +930,16 @@ int f2fs_disable_cp_again(struct f2fs_sb_info *sbi, block_t unusable)</div><div class='ctx'> {</div><div class='ctx'> 	int ovp_hole_segs =</div><div class='ctx'> 		(overprovision_segments(sbi) - reserved_segments(sbi));</div><div class='add'>+</div><div class='add'>+	if (F2FS_OPTION(sbi).unusable_cap_perc == 100)</div><div class='add'>+		return 0;</div><div class='ctx'> 	if (unusable &gt; F2FS_OPTION(sbi).unusable_cap)</div><div class='ctx'> 		return -EAGAIN;</div><div class='ctx'> 	if (is_sbi_flag_set(sbi, SBI_CP_DISABLED_QUICK) &amp;&amp;</div><div class='ctx'> 		dirty_segments(sbi) &gt; ovp_hole_segs)</div><div class='ctx'> 		return -EAGAIN;</div><div class='add'>+	if (has_not_enough_free_secs(sbi, 0, 0))</div><div class='add'>+		return -EAGAIN;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1026,9 +977,9 @@ static struct discard_cmd *__create_discard_cmd(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	dc = f2fs_kmem_cache_alloc(discard_cmd_slab, GFP_NOFS, true, NULL);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;dc-&gt;list);</div><div class='ctx'> 	dc-&gt;bdev = bdev;</div><div class='del'>-	dc-&gt;lstart = lstart;</div><div class='del'>-	dc-&gt;start = start;</div><div class='del'>-	dc-&gt;len = len;</div><div class='add'>+	dc-&gt;di.lstart = lstart;</div><div class='add'>+	dc-&gt;di.start = start;</div><div class='add'>+	dc-&gt;di.len = len;</div><div class='ctx'> 	dc-&gt;ref = 0;</div><div class='ctx'> 	dc-&gt;state = D_PREP;</div><div class='ctx'> 	dc-&gt;queued = 0;</div><div class='hunk'>@@ -1043,20 +994,108 @@ static struct discard_cmd *__create_discard_cmd(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	return dc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct discard_cmd *__attach_discard_cmd(struct f2fs_sb_info *sbi,</div><div class='del'>-				struct block_device *bdev, block_t lstart,</div><div class='del'>-				block_t start, block_t len,</div><div class='del'>-				struct rb_node *parent, struct rb_node **p,</div><div class='del'>-				bool leftmost)</div><div class='add'>+static bool f2fs_check_discard_tree(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='add'>+#ifdef CONFIG_F2FS_CHECK_FS</div><div class='ctx'> 	struct discard_cmd_control *dcc = SM_I(sbi)-&gt;dcc_info;</div><div class='add'>+	struct rb_node *cur = rb_first_cached(&amp;dcc-&gt;root), *next;</div><div class='add'>+	struct discard_cmd *cur_dc, *next_dc;</div><div class='add'>+</div><div class='add'>+	while (cur) {</div><div class='add'>+		next = rb_next(cur);</div><div class='add'>+		if (!next)</div><div class='add'>+			return true;</div><div class='add'>+</div><div class='add'>+		cur_dc = rb_entry(cur, struct discard_cmd, rb_node);</div><div class='add'>+		next_dc = rb_entry(next, struct discard_cmd, rb_node);</div><div class='add'>+</div><div class='add'>+		if (cur_dc-&gt;di.lstart + cur_dc-&gt;di.len &gt; next_dc-&gt;di.lstart) {</div><div class='add'>+			f2fs_info(sbi, "broken discard_rbtree, "</div><div class='add'>+				"cur(%u, %u) next(%u, %u)",</div><div class='add'>+				cur_dc-&gt;di.lstart, cur_dc-&gt;di.len,</div><div class='add'>+				next_dc-&gt;di.lstart, next_dc-&gt;di.len);</div><div class='add'>+			return false;</div><div class='add'>+		}</div><div class='add'>+		cur = next;</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct discard_cmd *__lookup_discard_cmd(struct f2fs_sb_info *sbi,</div><div class='add'>+						block_t blkaddr)</div><div class='add'>+{</div><div class='add'>+	struct discard_cmd_control *dcc = SM_I(sbi)-&gt;dcc_info;</div><div class='add'>+	struct rb_node *node = dcc-&gt;root.rb_root.rb_node;</div><div class='ctx'> 	struct discard_cmd *dc;</div><div class='ctx'> </div><div class='del'>-	dc = __create_discard_cmd(sbi, bdev, lstart, start, len);</div><div class='add'>+	while (node) {</div><div class='add'>+		dc = rb_entry(node, struct discard_cmd, rb_node);</div><div class='ctx'> </div><div class='del'>-	rb_link_node(&amp;dc-&gt;rb_node, parent, p);</div><div class='del'>-	rb_insert_color_cached(&amp;dc-&gt;rb_node, &amp;dcc-&gt;root, leftmost);</div><div class='add'>+		if (blkaddr &lt; dc-&gt;di.lstart)</div><div class='add'>+			node = node-&gt;rb_left;</div><div class='add'>+		else if (blkaddr &gt;= dc-&gt;di.lstart + dc-&gt;di.len)</div><div class='add'>+			node = node-&gt;rb_right;</div><div class='add'>+		else</div><div class='add'>+			return dc;</div><div class='add'>+	}</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct discard_cmd *__lookup_discard_cmd_ret(struct rb_root_cached *root,</div><div class='add'>+				block_t blkaddr,</div><div class='add'>+				struct discard_cmd **prev_entry,</div><div class='add'>+				struct discard_cmd **next_entry,</div><div class='add'>+				struct rb_node ***insert_p,</div><div class='add'>+				struct rb_node **insert_parent)</div><div class='add'>+{</div><div class='add'>+	struct rb_node **pnode = &amp;root-&gt;rb_root.rb_node;</div><div class='add'>+	struct rb_node *parent = NULL, *tmp_node;</div><div class='add'>+	struct discard_cmd *dc;</div><div class='ctx'> </div><div class='add'>+	*insert_p = NULL;</div><div class='add'>+	*insert_parent = NULL;</div><div class='add'>+	*prev_entry = NULL;</div><div class='add'>+	*next_entry = NULL;</div><div class='add'>+</div><div class='add'>+	if (RB_EMPTY_ROOT(&amp;root-&gt;rb_root))</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	while (*pnode) {</div><div class='add'>+		parent = *pnode;</div><div class='add'>+		dc = rb_entry(*pnode, struct discard_cmd, rb_node);</div><div class='add'>+</div><div class='add'>+		if (blkaddr &lt; dc-&gt;di.lstart)</div><div class='add'>+			pnode = &amp;(*pnode)-&gt;rb_left;</div><div class='add'>+		else if (blkaddr &gt;= dc-&gt;di.lstart + dc-&gt;di.len)</div><div class='add'>+			pnode = &amp;(*pnode)-&gt;rb_right;</div><div class='add'>+		else</div><div class='add'>+			goto lookup_neighbors;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	*insert_p = pnode;</div><div class='add'>+	*insert_parent = parent;</div><div class='add'>+</div><div class='add'>+	dc = rb_entry(parent, struct discard_cmd, rb_node);</div><div class='add'>+	tmp_node = parent;</div><div class='add'>+	if (parent &amp;&amp; blkaddr &gt; dc-&gt;di.lstart)</div><div class='add'>+		tmp_node = rb_next(parent);</div><div class='add'>+	*next_entry = rb_entry_safe(tmp_node, struct discard_cmd, rb_node);</div><div class='add'>+</div><div class='add'>+	tmp_node = parent;</div><div class='add'>+	if (parent &amp;&amp; blkaddr &lt; dc-&gt;di.lstart)</div><div class='add'>+		tmp_node = rb_prev(parent);</div><div class='add'>+	*prev_entry = rb_entry_safe(tmp_node, struct discard_cmd, rb_node);</div><div class='add'>+	return NULL;</div><div class='add'>+</div><div class='add'>+lookup_neighbors:</div><div class='add'>+	/* lookup prev node for merging backward later */</div><div class='add'>+	tmp_node = rb_prev(&amp;dc-&gt;rb_node);</div><div class='add'>+	*prev_entry = rb_entry_safe(tmp_node, struct discard_cmd, rb_node);</div><div class='add'>+</div><div class='add'>+	/* lookup next node for merging frontward later */</div><div class='add'>+	tmp_node = rb_next(&amp;dc-&gt;rb_node);</div><div class='add'>+	*next_entry = rb_entry_safe(tmp_node, struct discard_cmd, rb_node);</div><div class='ctx'> 	return dc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1068,7 +1107,7 @@ static void __detach_discard_cmd(struct discard_cmd_control *dcc,</div><div class='ctx'> </div><div class='ctx'> 	list_del(&amp;dc-&gt;list);</div><div class='ctx'> 	rb_erase_cached(&amp;dc-&gt;rb_node, &amp;dcc-&gt;root);</div><div class='del'>-	dcc-&gt;undiscard_blks -= dc-&gt;len;</div><div class='add'>+	dcc-&gt;undiscard_blks -= dc-&gt;di.len;</div><div class='ctx'> </div><div class='ctx'> 	kmem_cache_free(discard_cmd_slab, dc);</div><div class='ctx'> </div><div class='hunk'>@@ -1081,7 +1120,7 @@ static void __remove_discard_cmd(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	struct discard_cmd_control *dcc = SM_I(sbi)-&gt;dcc_info;</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> </div><div class='del'>-	trace_f2fs_remove_discard(dc-&gt;bdev, dc-&gt;start, dc-&gt;len);</div><div class='add'>+	trace_f2fs_remove_discard(dc-&gt;bdev, dc-&gt;di.start, dc-&gt;di.len);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock_irqsave(&amp;dc-&gt;lock, flags);</div><div class='ctx'> 	if (dc-&gt;bio_ref) {</div><div class='hunk'>@@ -1096,10 +1135,9 @@ static void __remove_discard_cmd(struct f2fs_sb_info *sbi,</div><div class='ctx'> 		dc-&gt;error = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (dc-&gt;error)</div><div class='del'>-		printk_ratelimited(</div><div class='del'>-			"%sF2FS-fs (%s): Issue discard(%u, %u, %u) failed, ret: %d",</div><div class='del'>-			KERN_INFO, sbi-&gt;sb-&gt;s_id,</div><div class='del'>-			dc-&gt;lstart, dc-&gt;start, dc-&gt;len, dc-&gt;error);</div><div class='add'>+		f2fs_info_ratelimited(sbi,</div><div class='add'>+			"Issue discard(%u, %u, %u) failed, ret: %d",</div><div class='add'>+			dc-&gt;di.lstart, dc-&gt;di.start, dc-&gt;di.len, dc-&gt;error);</div><div class='ctx'> 	__detach_discard_cmd(dcc, dc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1127,8 +1165,7 @@ static void __check_sit_bitmap(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	struct seg_entry *sentry;</div><div class='ctx'> 	unsigned int segno;</div><div class='ctx'> 	block_t blk = start;</div><div class='del'>-	unsigned long offset, size, max_blocks = sbi-&gt;blocks_per_seg;</div><div class='del'>-	unsigned long *map;</div><div class='add'>+	unsigned long offset, size, *map;</div><div class='ctx'> </div><div class='ctx'> 	while (blk &lt; end) {</div><div class='ctx'> 		segno = GET_SEGNO(sbi, blk);</div><div class='hunk'>@@ -1138,7 +1175,7 @@ static void __check_sit_bitmap(struct f2fs_sb_info *sbi,</div><div class='ctx'> 		if (end &lt; START_BLOCK(sbi, segno + 1))</div><div class='ctx'> 			size = GET_BLKOFF_FROM_SEG0(sbi, end);</div><div class='ctx'> 		else</div><div class='del'>-			size = max_blocks;</div><div class='add'>+			size = BLKS_PER_SEG(sbi);</div><div class='ctx'> 		map = (unsigned long *)(sentry-&gt;cur_valid_map);</div><div class='ctx'> 		offset = __find_rev_next_bit(map, size, offset);</div><div class='ctx'> 		f2fs_bug_on(sbi, offset != size);</div><div class='hunk'>@@ -1159,34 +1196,37 @@ static void __init_discard_policy(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	dpolicy-&gt;ordered = false;</div><div class='ctx'> 	dpolicy-&gt;granularity = granularity;</div><div class='ctx'> </div><div class='del'>-	dpolicy-&gt;max_requests = DEF_MAX_DISCARD_REQUEST;</div><div class='del'>-	dpolicy-&gt;io_aware_gran = MAX_PLIST_NUM;</div><div class='add'>+	dpolicy-&gt;max_requests = dcc-&gt;max_discard_request;</div><div class='add'>+	dpolicy-&gt;io_aware_gran = dcc-&gt;discard_io_aware_gran;</div><div class='ctx'> 	dpolicy-&gt;timeout = false;</div><div class='ctx'> </div><div class='ctx'> 	if (discard_type == DPOLICY_BG) {</div><div class='del'>-		dpolicy-&gt;min_interval = DEF_MIN_DISCARD_ISSUE_TIME;</div><div class='del'>-		dpolicy-&gt;mid_interval = DEF_MID_DISCARD_ISSUE_TIME;</div><div class='del'>-		dpolicy-&gt;max_interval = DEF_MAX_DISCARD_ISSUE_TIME;</div><div class='del'>-		dpolicy-&gt;io_aware = true;</div><div class='add'>+		dpolicy-&gt;min_interval = dcc-&gt;min_discard_issue_time;</div><div class='add'>+		dpolicy-&gt;mid_interval = dcc-&gt;mid_discard_issue_time;</div><div class='add'>+		dpolicy-&gt;max_interval = dcc-&gt;max_discard_issue_time;</div><div class='add'>+		if (dcc-&gt;discard_io_aware == DPOLICY_IO_AWARE_ENABLE)</div><div class='add'>+			dpolicy-&gt;io_aware = true;</div><div class='add'>+		else if (dcc-&gt;discard_io_aware == DPOLICY_IO_AWARE_DISABLE)</div><div class='add'>+			dpolicy-&gt;io_aware = false;</div><div class='ctx'> 		dpolicy-&gt;sync = false;</div><div class='ctx'> 		dpolicy-&gt;ordered = true;</div><div class='del'>-		if (utilization(sbi) &gt; DEF_DISCARD_URGENT_UTIL) {</div><div class='del'>-			dpolicy-&gt;granularity = 1;</div><div class='add'>+		if (utilization(sbi) &gt; dcc-&gt;discard_urgent_util) {</div><div class='add'>+			dpolicy-&gt;granularity = MIN_DISCARD_GRANULARITY;</div><div class='ctx'> 			if (atomic_read(&amp;dcc-&gt;discard_cmd_cnt))</div><div class='ctx'> 				dpolicy-&gt;max_interval =</div><div class='del'>-					DEF_MIN_DISCARD_ISSUE_TIME;</div><div class='add'>+					dcc-&gt;min_discard_issue_time;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else if (discard_type == DPOLICY_FORCE) {</div><div class='del'>-		dpolicy-&gt;min_interval = DEF_MIN_DISCARD_ISSUE_TIME;</div><div class='del'>-		dpolicy-&gt;mid_interval = DEF_MID_DISCARD_ISSUE_TIME;</div><div class='del'>-		dpolicy-&gt;max_interval = DEF_MAX_DISCARD_ISSUE_TIME;</div><div class='add'>+		dpolicy-&gt;min_interval = dcc-&gt;min_discard_issue_time;</div><div class='add'>+		dpolicy-&gt;mid_interval = dcc-&gt;mid_discard_issue_time;</div><div class='add'>+		dpolicy-&gt;max_interval = dcc-&gt;max_discard_issue_time;</div><div class='ctx'> 		dpolicy-&gt;io_aware = false;</div><div class='ctx'> 	} else if (discard_type == DPOLICY_FSTRIM) {</div><div class='ctx'> 		dpolicy-&gt;io_aware = false;</div><div class='ctx'> 	} else if (discard_type == DPOLICY_UMOUNT) {</div><div class='ctx'> 		dpolicy-&gt;io_aware = false;</div><div class='ctx'> 		/* we need to issue all to keep CP_TRIMMED_FLAG */</div><div class='del'>-		dpolicy-&gt;granularity = 1;</div><div class='add'>+		dpolicy-&gt;granularity = MIN_DISCARD_GRANULARITY;</div><div class='ctx'> 		dpolicy-&gt;timeout = true;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -1194,20 +1234,57 @@ static void __init_discard_policy(struct f2fs_sb_info *sbi,</div><div class='ctx'> static void __update_discard_tree_range(struct f2fs_sb_info *sbi,</div><div class='ctx'> 				struct block_device *bdev, block_t lstart,</div><div class='ctx'> 				block_t start, block_t len);</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BLK_DEV_ZONED</div><div class='add'>+static void __submit_zone_reset_cmd(struct f2fs_sb_info *sbi,</div><div class='add'>+				   struct discard_cmd *dc, blk_opf_t flag,</div><div class='add'>+				   struct list_head *wait_list,</div><div class='add'>+				   unsigned int *issued)</div><div class='add'>+{</div><div class='add'>+	struct discard_cmd_control *dcc = SM_I(sbi)-&gt;dcc_info;</div><div class='add'>+	struct block_device *bdev = dc-&gt;bdev;</div><div class='add'>+	struct bio *bio = bio_alloc(bdev, 0, REQ_OP_ZONE_RESET | flag, GFP_NOFS);</div><div class='add'>+	unsigned long flags;</div><div class='add'>+</div><div class='add'>+	trace_f2fs_issue_reset_zone(bdev, dc-&gt;di.start);</div><div class='add'>+</div><div class='add'>+	spin_lock_irqsave(&amp;dc-&gt;lock, flags);</div><div class='add'>+	dc-&gt;state = D_SUBMIT;</div><div class='add'>+	dc-&gt;bio_ref++;</div><div class='add'>+	spin_unlock_irqrestore(&amp;dc-&gt;lock, flags);</div><div class='add'>+</div><div class='add'>+	if (issued)</div><div class='add'>+		(*issued)++;</div><div class='add'>+</div><div class='add'>+	atomic_inc(&amp;dcc-&gt;queued_discard);</div><div class='add'>+	dc-&gt;queued++;</div><div class='add'>+	list_move_tail(&amp;dc-&gt;list, wait_list);</div><div class='add'>+</div><div class='add'>+	/* sanity check on discard range */</div><div class='add'>+	__check_sit_bitmap(sbi, dc-&gt;di.lstart, dc-&gt;di.lstart + dc-&gt;di.len);</div><div class='add'>+</div><div class='add'>+	bio-&gt;bi_iter.bi_sector = SECTOR_FROM_BLOCK(dc-&gt;di.start);</div><div class='add'>+	bio-&gt;bi_private = dc;</div><div class='add'>+	bio-&gt;bi_end_io = f2fs_submit_discard_endio;</div><div class='add'>+	submit_bio(bio);</div><div class='add'>+</div><div class='add'>+	atomic_inc(&amp;dcc-&gt;issued_discard);</div><div class='add'>+	f2fs_update_iostat(sbi, NULL, FS_ZONE_RESET_IO, dc-&gt;di.len * F2FS_BLKSIZE);</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> /* this function is copied from blkdev_issue_discard from block/blk-lib.c */</div><div class='ctx'> static int __submit_discard_cmd(struct f2fs_sb_info *sbi,</div><div class='del'>-						struct discard_policy *dpolicy,</div><div class='del'>-						struct discard_cmd *dc,</div><div class='del'>-						unsigned int *issued)</div><div class='add'>+				struct discard_policy *dpolicy,</div><div class='add'>+				struct discard_cmd *dc, int *issued)</div><div class='ctx'> {</div><div class='ctx'> 	struct block_device *bdev = dc-&gt;bdev;</div><div class='del'>-	struct request_queue *q = bdev_get_queue(bdev);</div><div class='ctx'> 	unsigned int max_discard_blocks =</div><div class='del'>-			SECTOR_TO_BLOCK(q-&gt;limits.max_discard_sectors);</div><div class='add'>+			SECTOR_TO_BLOCK(bdev_max_discard_sectors(bdev));</div><div class='ctx'> 	struct discard_cmd_control *dcc = SM_I(sbi)-&gt;dcc_info;</div><div class='ctx'> 	struct list_head *wait_list = (dpolicy-&gt;type == DPOLICY_FSTRIM) ?</div><div class='ctx'> 					&amp;(dcc-&gt;fstrim_list) : &amp;(dcc-&gt;wait_list);</div><div class='del'>-	int flag = dpolicy-&gt;sync ? REQ_SYNC : 0;</div><div class='add'>+	blk_opf_t flag = dpolicy-&gt;sync ? REQ_SYNC : 0;</div><div class='ctx'> 	block_t lstart, start, len, total_len;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -1217,14 +1294,38 @@ static int __submit_discard_cmd(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	if (is_sbi_flag_set(sbi, SBI_NEED_FSCK))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	trace_f2fs_issue_discard(bdev, dc-&gt;start, dc-&gt;len);</div><div class='add'>+#ifdef CONFIG_BLK_DEV_ZONED</div><div class='add'>+	if (f2fs_sb_has_blkzoned(sbi) &amp;&amp; bdev_is_zoned(bdev)) {</div><div class='add'>+		int devi = f2fs_bdev_index(sbi, bdev);</div><div class='add'>+</div><div class='add'>+		if (devi &lt; 0)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+</div><div class='add'>+		if (f2fs_blkz_is_seq(sbi, devi, dc-&gt;di.start)) {</div><div class='add'>+			__submit_zone_reset_cmd(sbi, dc, flag,</div><div class='add'>+						wait_list, issued);</div><div class='add'>+			return 0;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * stop issuing discard for any of below cases:</div><div class='add'>+	 * 1. device is conventional zone, but it doesn't support discard.</div><div class='add'>+	 * 2. device is regulare device, after snapshot it doesn't support</div><div class='add'>+	 * discard.</div><div class='add'>+	 */</div><div class='add'>+	if (!bdev_max_discard_sectors(bdev))</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+</div><div class='add'>+	trace_f2fs_issue_discard(bdev, dc-&gt;di.start, dc-&gt;di.len);</div><div class='ctx'> </div><div class='del'>-	lstart = dc-&gt;lstart;</div><div class='del'>-	start = dc-&gt;start;</div><div class='del'>-	len = dc-&gt;len;</div><div class='add'>+	lstart = dc-&gt;di.lstart;</div><div class='add'>+	start = dc-&gt;di.start;</div><div class='add'>+	len = dc-&gt;di.len;</div><div class='ctx'> 	total_len = len;</div><div class='ctx'> </div><div class='del'>-	dc-&gt;len = 0;</div><div class='add'>+	dc-&gt;di.len = 0;</div><div class='ctx'> </div><div class='ctx'> 	while (total_len &amp;&amp; *issued &lt; dpolicy-&gt;max_requests &amp;&amp; !err) {</div><div class='ctx'> 		struct bio *bio = NULL;</div><div class='hunk'>@@ -1240,19 +1341,11 @@ static int __submit_discard_cmd(struct f2fs_sb_info *sbi,</div><div class='ctx'> 		if (*issued == dpolicy-&gt;max_requests)</div><div class='ctx'> 			last = true;</div><div class='ctx'> </div><div class='del'>-		dc-&gt;len += len;</div><div class='add'>+		dc-&gt;di.len += len;</div><div class='ctx'> </div><div class='add'>+		err = 0;</div><div class='ctx'> 		if (time_to_inject(sbi, FAULT_DISCARD)) {</div><div class='del'>-			f2fs_show_injection_info(sbi, FAULT_DISCARD);</div><div class='ctx'> 			err = -EIO;</div><div class='del'>-			goto submit;</div><div class='del'>-		}</div><div class='del'>-		err = __blkdev_issue_discard(bdev,</div><div class='del'>-					SECTOR_FROM_BLOCK(start),</div><div class='del'>-					SECTOR_FROM_BLOCK(len),</div><div class='del'>-					GFP_NOFS, 0, &amp;bio);</div><div class='del'>-submit:</div><div class='del'>-		if (err) {</div><div class='ctx'> 			spin_lock_irqsave(&amp;dc-&gt;lock, flags);</div><div class='ctx'> 			if (dc-&gt;state == D_PARTIAL)</div><div class='ctx'> 				dc-&gt;state = D_SUBMIT;</div><div class='hunk'>@@ -1261,6 +1354,8 @@ submit:</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		__blkdev_issue_discard(bdev, SECTOR_FROM_BLOCK(start),</div><div class='add'>+				SECTOR_FROM_BLOCK(len), GFP_NOFS, &amp;bio);</div><div class='ctx'> 		f2fs_bug_on(sbi, !bio);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='hunk'>@@ -1289,7 +1384,7 @@ submit:</div><div class='ctx'> </div><div class='ctx'> 		atomic_inc(&amp;dcc-&gt;issued_discard);</div><div class='ctx'> </div><div class='del'>-		f2fs_update_iostat(sbi, FS_DISCARD, 1);</div><div class='add'>+		f2fs_update_iostat(sbi, NULL, FS_DISCARD_IO, len * F2FS_BLKSIZE);</div><div class='ctx'> </div><div class='ctx'> 		lstart += len;</div><div class='ctx'> 		start += len;</div><div class='hunk'>@@ -1304,34 +1399,42 @@ submit:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void __insert_discard_tree(struct f2fs_sb_info *sbi,</div><div class='add'>+static void __insert_discard_cmd(struct f2fs_sb_info *sbi,</div><div class='ctx'> 				struct block_device *bdev, block_t lstart,</div><div class='del'>-				block_t start, block_t len,</div><div class='del'>-				struct rb_node **insert_p,</div><div class='del'>-				struct rb_node *insert_parent)</div><div class='add'>+				block_t start, block_t len)</div><div class='ctx'> {</div><div class='ctx'> 	struct discard_cmd_control *dcc = SM_I(sbi)-&gt;dcc_info;</div><div class='del'>-	struct rb_node **p;</div><div class='add'>+	struct rb_node **p = &amp;dcc-&gt;root.rb_root.rb_node;</div><div class='ctx'> 	struct rb_node *parent = NULL;</div><div class='add'>+	struct discard_cmd *dc;</div><div class='ctx'> 	bool leftmost = true;</div><div class='ctx'> </div><div class='del'>-	if (insert_p &amp;&amp; insert_parent) {</div><div class='del'>-		parent = insert_parent;</div><div class='del'>-		p = insert_p;</div><div class='del'>-		goto do_insert;</div><div class='add'>+	/* look up rb tree to find parent node */</div><div class='add'>+	while (*p) {</div><div class='add'>+		parent = *p;</div><div class='add'>+		dc = rb_entry(parent, struct discard_cmd, rb_node);</div><div class='add'>+</div><div class='add'>+		if (lstart &lt; dc-&gt;di.lstart) {</div><div class='add'>+			p = &amp;(*p)-&gt;rb_left;</div><div class='add'>+		} else if (lstart &gt;= dc-&gt;di.lstart + dc-&gt;di.len) {</div><div class='add'>+			p = &amp;(*p)-&gt;rb_right;</div><div class='add'>+			leftmost = false;</div><div class='add'>+		} else {</div><div class='add'>+			/* Let's skip to add, if exists */</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	p = f2fs_lookup_rb_tree_for_insert(sbi, &amp;dcc-&gt;root, &amp;parent,</div><div class='del'>-							lstart, &amp;leftmost);</div><div class='del'>-do_insert:</div><div class='del'>-	__attach_discard_cmd(sbi, bdev, lstart, start, len, parent,</div><div class='del'>-								p, leftmost);</div><div class='add'>+	dc = __create_discard_cmd(sbi, bdev, lstart, start, len);</div><div class='add'>+</div><div class='add'>+	rb_link_node(&amp;dc-&gt;rb_node, parent, p);</div><div class='add'>+	rb_insert_color_cached(&amp;dc-&gt;rb_node, &amp;dcc-&gt;root, leftmost);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void __relocate_discard_cmd(struct discard_cmd_control *dcc,</div><div class='ctx'> 						struct discard_cmd *dc)</div><div class='ctx'> {</div><div class='del'>-	list_move_tail(&amp;dc-&gt;list, &amp;dcc-&gt;pend_list[plist_idx(dc-&gt;len)]);</div><div class='add'>+	list_move_tail(&amp;dc-&gt;list, &amp;dcc-&gt;pend_list[plist_idx(dc-&gt;di.len)]);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void __punch_discard_cmd(struct f2fs_sb_info *sbi,</div><div class='hunk'>@@ -1341,7 +1444,7 @@ static void __punch_discard_cmd(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	struct discard_info di = dc-&gt;di;</div><div class='ctx'> 	bool modified = false;</div><div class='ctx'> </div><div class='del'>-	if (dc-&gt;state == D_DONE || dc-&gt;len == 1) {</div><div class='add'>+	if (dc-&gt;state == D_DONE || dc-&gt;di.len == 1) {</div><div class='ctx'> 		__remove_discard_cmd(sbi, dc);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1349,23 +1452,22 @@ static void __punch_discard_cmd(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	dcc-&gt;undiscard_blks -= di.len;</div><div class='ctx'> </div><div class='ctx'> 	if (blkaddr &gt; di.lstart) {</div><div class='del'>-		dc-&gt;len = blkaddr - dc-&gt;lstart;</div><div class='del'>-		dcc-&gt;undiscard_blks += dc-&gt;len;</div><div class='add'>+		dc-&gt;di.len = blkaddr - dc-&gt;di.lstart;</div><div class='add'>+		dcc-&gt;undiscard_blks += dc-&gt;di.len;</div><div class='ctx'> 		__relocate_discard_cmd(dcc, dc);</div><div class='ctx'> 		modified = true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (blkaddr &lt; di.lstart + di.len - 1) {</div><div class='ctx'> 		if (modified) {</div><div class='del'>-			__insert_discard_tree(sbi, dc-&gt;bdev, blkaddr + 1,</div><div class='add'>+			__insert_discard_cmd(sbi, dc-&gt;bdev, blkaddr + 1,</div><div class='ctx'> 					di.start + blkaddr + 1 - di.lstart,</div><div class='del'>-					di.lstart + di.len - 1 - blkaddr,</div><div class='del'>-					NULL, NULL);</div><div class='add'>+					di.lstart + di.len - 1 - blkaddr);</div><div class='ctx'> 		} else {</div><div class='del'>-			dc-&gt;lstart++;</div><div class='del'>-			dc-&gt;len--;</div><div class='del'>-			dc-&gt;start++;</div><div class='del'>-			dcc-&gt;undiscard_blks += dc-&gt;len;</div><div class='add'>+			dc-&gt;di.lstart++;</div><div class='add'>+			dc-&gt;di.len--;</div><div class='add'>+			dc-&gt;di.start++;</div><div class='add'>+			dcc-&gt;undiscard_blks += dc-&gt;di.len;</div><div class='ctx'> 			__relocate_discard_cmd(dcc, dc);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1380,22 +1482,18 @@ static void __update_discard_tree_range(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	struct discard_cmd *dc;</div><div class='ctx'> 	struct discard_info di = {0};</div><div class='ctx'> 	struct rb_node **insert_p = NULL, *insert_parent = NULL;</div><div class='del'>-	struct request_queue *q = bdev_get_queue(bdev);</div><div class='ctx'> 	unsigned int max_discard_blocks =</div><div class='del'>-			SECTOR_TO_BLOCK(q-&gt;limits.max_discard_sectors);</div><div class='add'>+			SECTOR_TO_BLOCK(bdev_max_discard_sectors(bdev));</div><div class='ctx'> 	block_t end = lstart + len;</div><div class='ctx'> </div><div class='del'>-	dc = (struct discard_cmd *)f2fs_lookup_rb_tree_ret(&amp;dcc-&gt;root,</div><div class='del'>-					NULL, lstart,</div><div class='del'>-					(struct rb_entry **)&amp;prev_dc,</div><div class='del'>-					(struct rb_entry **)&amp;next_dc,</div><div class='del'>-					&amp;insert_p, &amp;insert_parent, true, NULL);</div><div class='add'>+	dc = __lookup_discard_cmd_ret(&amp;dcc-&gt;root, lstart,</div><div class='add'>+				&amp;prev_dc, &amp;next_dc, &amp;insert_p, &amp;insert_parent);</div><div class='ctx'> 	if (dc)</div><div class='ctx'> 		prev_dc = dc;</div><div class='ctx'> </div><div class='ctx'> 	if (!prev_dc) {</div><div class='ctx'> 		di.lstart = lstart;</div><div class='del'>-		di.len = next_dc ? next_dc-&gt;lstart - lstart : len;</div><div class='add'>+		di.len = next_dc ? next_dc-&gt;di.lstart - lstart : len;</div><div class='ctx'> 		di.len = min(di.len, len);</div><div class='ctx'> 		di.start = start;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1406,16 +1504,16 @@ static void __update_discard_tree_range(struct f2fs_sb_info *sbi,</div><div class='ctx'> 		struct discard_cmd *tdc = NULL;</div><div class='ctx'> </div><div class='ctx'> 		if (prev_dc) {</div><div class='del'>-			di.lstart = prev_dc-&gt;lstart + prev_dc-&gt;len;</div><div class='add'>+			di.lstart = prev_dc-&gt;di.lstart + prev_dc-&gt;di.len;</div><div class='ctx'> 			if (di.lstart &lt; lstart)</div><div class='ctx'> 				di.lstart = lstart;</div><div class='ctx'> 			if (di.lstart &gt;= end)</div><div class='ctx'> 				break;</div><div class='ctx'> </div><div class='del'>-			if (!next_dc || next_dc-&gt;lstart &gt; end)</div><div class='add'>+			if (!next_dc || next_dc-&gt;di.lstart &gt; end)</div><div class='ctx'> 				di.len = end - di.lstart;</div><div class='ctx'> 			else</div><div class='del'>-				di.len = next_dc-&gt;lstart - di.lstart;</div><div class='add'>+				di.len = next_dc-&gt;di.lstart - di.lstart;</div><div class='ctx'> 			di.start = start + di.lstart - lstart;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -1448,10 +1546,9 @@ static void __update_discard_tree_range(struct f2fs_sb_info *sbi,</div><div class='ctx'> 			merged = true;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (!merged) {</div><div class='del'>-			__insert_discard_tree(sbi, bdev, di.lstart, di.start,</div><div class='del'>-							di.len, NULL, NULL);</div><div class='del'>-		}</div><div class='add'>+		if (!merged)</div><div class='add'>+			__insert_discard_cmd(sbi, bdev,</div><div class='add'>+						di.lstart, di.start, di.len);</div><div class='ctx'>  next:</div><div class='ctx'> 		prev_dc = next_dc;</div><div class='ctx'> 		if (!prev_dc)</div><div class='hunk'>@@ -1462,13 +1559,26 @@ static void __update_discard_tree_range(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __queue_discard_cmd(struct f2fs_sb_info *sbi,</div><div class='add'>+#ifdef CONFIG_BLK_DEV_ZONED</div><div class='add'>+static void __queue_zone_reset_cmd(struct f2fs_sb_info *sbi,</div><div class='add'>+		struct block_device *bdev, block_t blkstart, block_t lblkstart,</div><div class='add'>+		block_t blklen)</div><div class='add'>+{</div><div class='add'>+	trace_f2fs_queue_reset_zone(bdev, blkstart);</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;SM_I(sbi)-&gt;dcc_info-&gt;cmd_lock);</div><div class='add'>+	__insert_discard_cmd(sbi, bdev, lblkstart, blkstart, blklen);</div><div class='add'>+	mutex_unlock(&amp;SM_I(sbi)-&gt;dcc_info-&gt;cmd_lock);</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+static void __queue_discard_cmd(struct f2fs_sb_info *sbi,</div><div class='ctx'> 		struct block_device *bdev, block_t blkstart, block_t blklen)</div><div class='ctx'> {</div><div class='ctx'> 	block_t lblkstart = blkstart;</div><div class='ctx'> </div><div class='ctx'> 	if (!f2fs_bdev_support_discard(bdev))</div><div class='del'>-		return 0;</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='ctx'> 	trace_f2fs_queue_discard(bdev, blkstart, blklen);</div><div class='ctx'> </div><div class='hunk'>@@ -1480,27 +1590,21 @@ static int __queue_discard_cmd(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	mutex_lock(&amp;SM_I(sbi)-&gt;dcc_info-&gt;cmd_lock);</div><div class='ctx'> 	__update_discard_tree_range(sbi, bdev, lblkstart, blkstart, blklen);</div><div class='ctx'> 	mutex_unlock(&amp;SM_I(sbi)-&gt;dcc_info-&gt;cmd_lock);</div><div class='del'>-	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static unsigned int __issue_discard_cmd_orderly(struct f2fs_sb_info *sbi,</div><div class='del'>-					struct discard_policy *dpolicy)</div><div class='add'>+static void __issue_discard_cmd_orderly(struct f2fs_sb_info *sbi,</div><div class='add'>+		struct discard_policy *dpolicy, int *issued)</div><div class='ctx'> {</div><div class='ctx'> 	struct discard_cmd_control *dcc = SM_I(sbi)-&gt;dcc_info;</div><div class='ctx'> 	struct discard_cmd *prev_dc = NULL, *next_dc = NULL;</div><div class='ctx'> 	struct rb_node **insert_p = NULL, *insert_parent = NULL;</div><div class='ctx'> 	struct discard_cmd *dc;</div><div class='ctx'> 	struct blk_plug plug;</div><div class='del'>-	unsigned int pos = dcc-&gt;next_pos;</div><div class='del'>-	unsigned int issued = 0;</div><div class='ctx'> 	bool io_interrupted = false;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;dcc-&gt;cmd_lock);</div><div class='del'>-	dc = (struct discard_cmd *)f2fs_lookup_rb_tree_ret(&amp;dcc-&gt;root,</div><div class='del'>-					NULL, pos,</div><div class='del'>-					(struct rb_entry **)&amp;prev_dc,</div><div class='del'>-					(struct rb_entry **)&amp;next_dc,</div><div class='del'>-					&amp;insert_p, &amp;insert_parent, true, NULL);</div><div class='add'>+	dc = __lookup_discard_cmd_ret(&amp;dcc-&gt;root, dcc-&gt;next_pos,</div><div class='add'>+				&amp;prev_dc, &amp;next_dc, &amp;insert_p, &amp;insert_parent);</div><div class='ctx'> 	if (!dc)</div><div class='ctx'> 		dc = next_dc;</div><div class='ctx'> </div><div class='hunk'>@@ -1518,10 +1622,10 @@ static unsigned int __issue_discard_cmd_orderly(struct f2fs_sb_info *sbi,</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		dcc-&gt;next_pos = dc-&gt;lstart + dc-&gt;len;</div><div class='del'>-		err = __submit_discard_cmd(sbi, dpolicy, dc, &amp;issued);</div><div class='add'>+		dcc-&gt;next_pos = dc-&gt;di.lstart + dc-&gt;di.len;</div><div class='add'>+		err = __submit_discard_cmd(sbi, dpolicy, dc, issued);</div><div class='ctx'> </div><div class='del'>-		if (issued &gt;= dpolicy-&gt;max_requests)</div><div class='add'>+		if (*issued &gt;= dpolicy-&gt;max_requests)</div><div class='ctx'> 			break;</div><div class='ctx'> next:</div><div class='ctx'> 		node = rb_next(&amp;dc-&gt;rb_node);</div><div class='hunk'>@@ -1537,10 +1641,8 @@ next:</div><div class='ctx'> </div><div class='ctx'> 	mutex_unlock(&amp;dcc-&gt;cmd_lock);</div><div class='ctx'> </div><div class='del'>-	if (!issued &amp;&amp; io_interrupted)</div><div class='del'>-		issued = -1;</div><div class='del'>-</div><div class='del'>-	return issued;</div><div class='add'>+	if (!(*issued) &amp;&amp; io_interrupted)</div><div class='add'>+		*issued = -1;</div><div class='ctx'> }</div><div class='ctx'> static unsigned int __wait_all_discard_cmd(struct f2fs_sb_info *sbi,</div><div class='ctx'> 					struct discard_policy *dpolicy);</div><div class='hunk'>@@ -1568,8 +1670,10 @@ retry:</div><div class='ctx'> 		if (i + 1 &lt; dpolicy-&gt;granularity)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		if (i &lt; DEFAULT_DISCARD_GRANULARITY &amp;&amp; dpolicy-&gt;ordered)</div><div class='del'>-			return __issue_discard_cmd_orderly(sbi, dpolicy);</div><div class='add'>+		if (i + 1 &lt; dcc-&gt;max_ordered_discard &amp;&amp; dpolicy-&gt;ordered) {</div><div class='add'>+			__issue_discard_cmd_orderly(sbi, dpolicy, &amp;issued);</div><div class='add'>+			return issued;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		pend_list = &amp;dcc-&gt;pend_list[i];</div><div class='ctx'> </div><div class='hunk'>@@ -1577,8 +1681,7 @@ retry:</div><div class='ctx'> 		if (list_empty(pend_list))</div><div class='ctx'> 			goto next;</div><div class='ctx'> 		if (unlikely(dcc-&gt;rbtree_check))</div><div class='del'>-			f2fs_bug_on(sbi, !f2fs_check_rb_tree_consistence(sbi,</div><div class='del'>-							&amp;dcc-&gt;root, false));</div><div class='add'>+			f2fs_bug_on(sbi, !f2fs_check_discard_tree(sbi));</div><div class='ctx'> 		blk_start_plug(&amp;plug);</div><div class='ctx'> 		list_for_each_entry_safe(dc, tmp, pend_list, list) {</div><div class='ctx'> 			f2fs_bug_on(sbi, dc-&gt;state != D_PREP);</div><div class='hunk'>@@ -1656,7 +1759,7 @@ static unsigned int __wait_one_discard_bio(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	dc-&gt;ref--;</div><div class='ctx'> 	if (!dc-&gt;ref) {</div><div class='ctx'> 		if (!dc-&gt;error)</div><div class='del'>-			len = dc-&gt;len;</div><div class='add'>+			len = dc-&gt;di.len;</div><div class='ctx'> 		__remove_discard_cmd(sbi, dc);</div><div class='ctx'> 	}</div><div class='ctx'> 	mutex_unlock(&amp;dcc-&gt;cmd_lock);</div><div class='hunk'>@@ -1671,33 +1774,33 @@ static unsigned int __wait_discard_cmd_range(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	struct discard_cmd_control *dcc = SM_I(sbi)-&gt;dcc_info;</div><div class='ctx'> 	struct list_head *wait_list = (dpolicy-&gt;type == DPOLICY_FSTRIM) ?</div><div class='ctx'> 					&amp;(dcc-&gt;fstrim_list) : &amp;(dcc-&gt;wait_list);</div><div class='del'>-	struct discard_cmd *dc, *tmp;</div><div class='del'>-	bool need_wait;</div><div class='add'>+	struct discard_cmd *dc = NULL, *iter, *tmp;</div><div class='ctx'> 	unsigned int trimmed = 0;</div><div class='ctx'> </div><div class='ctx'> next:</div><div class='del'>-	need_wait = false;</div><div class='add'>+	dc = NULL;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;dcc-&gt;cmd_lock);</div><div class='del'>-	list_for_each_entry_safe(dc, tmp, wait_list, list) {</div><div class='del'>-		if (dc-&gt;lstart + dc-&gt;len &lt;= start || end &lt;= dc-&gt;lstart)</div><div class='add'>+	list_for_each_entry_safe(iter, tmp, wait_list, list) {</div><div class='add'>+		if (iter-&gt;di.lstart + iter-&gt;di.len &lt;= start ||</div><div class='add'>+					end &lt;= iter-&gt;di.lstart)</div><div class='ctx'> 			continue;</div><div class='del'>-		if (dc-&gt;len &lt; dpolicy-&gt;granularity)</div><div class='add'>+		if (iter-&gt;di.len &lt; dpolicy-&gt;granularity)</div><div class='ctx'> 			continue;</div><div class='del'>-		if (dc-&gt;state == D_DONE &amp;&amp; !dc-&gt;ref) {</div><div class='del'>-			wait_for_completion_io(&amp;dc-&gt;wait);</div><div class='del'>-			if (!dc-&gt;error)</div><div class='del'>-				trimmed += dc-&gt;len;</div><div class='del'>-			__remove_discard_cmd(sbi, dc);</div><div class='add'>+		if (iter-&gt;state == D_DONE &amp;&amp; !iter-&gt;ref) {</div><div class='add'>+			wait_for_completion_io(&amp;iter-&gt;wait);</div><div class='add'>+			if (!iter-&gt;error)</div><div class='add'>+				trimmed += iter-&gt;di.len;</div><div class='add'>+			__remove_discard_cmd(sbi, iter);</div><div class='ctx'> 		} else {</div><div class='del'>-			dc-&gt;ref++;</div><div class='del'>-			need_wait = true;</div><div class='add'>+			iter-&gt;ref++;</div><div class='add'>+			dc = iter;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	mutex_unlock(&amp;dcc-&gt;cmd_lock);</div><div class='ctx'> </div><div class='del'>-	if (need_wait) {</div><div class='add'>+	if (dc) {</div><div class='ctx'> 		trimmed += __wait_one_discard_bio(sbi, dc);</div><div class='ctx'> 		goto next;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1715,9 +1818,9 @@ static unsigned int __wait_all_discard_cmd(struct f2fs_sb_info *sbi,</div><div class='ctx'> 		return __wait_discard_cmd_range(sbi, dpolicy, 0, UINT_MAX);</div><div class='ctx'> </div><div class='ctx'> 	/* wait all */</div><div class='del'>-	__init_discard_policy(sbi, &amp;dp, DPOLICY_FSTRIM, 1);</div><div class='add'>+	__init_discard_policy(sbi, &amp;dp, DPOLICY_FSTRIM, MIN_DISCARD_GRANULARITY);</div><div class='ctx'> 	discard_blks = __wait_discard_cmd_range(sbi, &amp;dp, 0, UINT_MAX);</div><div class='del'>-	__init_discard_policy(sbi, &amp;dp, DPOLICY_UMOUNT, 1);</div><div class='add'>+	__init_discard_policy(sbi, &amp;dp, DPOLICY_UMOUNT, MIN_DISCARD_GRANULARITY);</div><div class='ctx'> 	discard_blks += __wait_discard_cmd_range(sbi, &amp;dp, 0, UINT_MAX);</div><div class='ctx'> </div><div class='ctx'> 	return discard_blks;</div><div class='hunk'>@@ -1731,8 +1834,29 @@ static void f2fs_wait_discard_bio(struct f2fs_sb_info *sbi, block_t blkaddr)</div><div class='ctx'> 	bool need_wait = false;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;dcc-&gt;cmd_lock);</div><div class='del'>-	dc = (struct discard_cmd *)f2fs_lookup_rb_tree(&amp;dcc-&gt;root,</div><div class='del'>-							NULL, blkaddr);</div><div class='add'>+	dc = __lookup_discard_cmd(sbi, blkaddr);</div><div class='add'>+#ifdef CONFIG_BLK_DEV_ZONED</div><div class='add'>+	if (dc &amp;&amp; f2fs_sb_has_blkzoned(sbi) &amp;&amp; bdev_is_zoned(dc-&gt;bdev)) {</div><div class='add'>+		int devi = f2fs_bdev_index(sbi, dc-&gt;bdev);</div><div class='add'>+</div><div class='add'>+		if (devi &lt; 0) {</div><div class='add'>+			mutex_unlock(&amp;dcc-&gt;cmd_lock);</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (f2fs_blkz_is_seq(sbi, devi, dc-&gt;di.start)) {</div><div class='add'>+			/* force submit zone reset */</div><div class='add'>+			if (dc-&gt;state == D_PREP)</div><div class='add'>+				__submit_zone_reset_cmd(sbi, dc, REQ_SYNC,</div><div class='add'>+							&amp;dcc-&gt;wait_list, NULL);</div><div class='add'>+			dc-&gt;ref++;</div><div class='add'>+			mutex_unlock(&amp;dcc-&gt;cmd_lock);</div><div class='add'>+			/* wait zone reset */</div><div class='add'>+			__wait_one_discard_bio(sbi, dc);</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='ctx'> 	if (dc) {</div><div class='ctx'> 		if (dc-&gt;state == D_PREP) {</div><div class='ctx'> 			__punch_discard_cmd(sbi, dc, blkaddr);</div><div class='hunk'>@@ -1759,13 +1883,23 @@ void f2fs_stop_discard_thread(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* This comes from f2fs_put_super */</div><div class='add'>+/**</div><div class='add'>+ * f2fs_issue_discard_timeout() - Issue all discard cmd within UMOUNT_DISCARD_TIMEOUT</div><div class='add'>+ * @sbi: the f2fs_sb_info data for discard cmd to issue</div><div class='add'>+ *</div><div class='add'>+ * When UMOUNT_DISCARD_TIMEOUT is exceeded, all remaining discard commands will be dropped</div><div class='add'>+ *</div><div class='add'>+ * Return true if issued all discard cmd or no discard cmd need issue, otherwise return false.</div><div class='add'>+ */</div><div class='ctx'> bool f2fs_issue_discard_timeout(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	struct discard_cmd_control *dcc = SM_I(sbi)-&gt;dcc_info;</div><div class='ctx'> 	struct discard_policy dpolicy;</div><div class='ctx'> 	bool dropped;</div><div class='ctx'> </div><div class='add'>+	if (!atomic_read(&amp;dcc-&gt;discard_cmd_cnt))</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='ctx'> 	__init_discard_policy(sbi, &amp;dpolicy, DPOLICY_UMOUNT,</div><div class='ctx'> 					dcc-&gt;discard_granularity);</div><div class='ctx'> 	__issue_discard_cmd(sbi, &amp;dpolicy);</div><div class='hunk'>@@ -1775,7 +1909,7 @@ bool f2fs_issue_discard_timeout(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	__wait_all_discard_cmd(sbi, NULL);</div><div class='ctx'> </div><div class='ctx'> 	f2fs_bug_on(sbi, atomic_read(&amp;dcc-&gt;discard_cmd_cnt));</div><div class='del'>-	return dropped;</div><div class='add'>+	return !dropped;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int issue_discard_thread(void *data)</div><div class='hunk'>@@ -1784,46 +1918,40 @@ static int issue_discard_thread(void *data)</div><div class='ctx'> 	struct discard_cmd_control *dcc = SM_I(sbi)-&gt;dcc_info;</div><div class='ctx'> 	wait_queue_head_t *q = &amp;dcc-&gt;discard_wait_queue;</div><div class='ctx'> 	struct discard_policy dpolicy;</div><div class='del'>-	unsigned int wait_ms = DEF_MIN_DISCARD_ISSUE_TIME;</div><div class='add'>+	unsigned int wait_ms = dcc-&gt;min_discard_issue_time;</div><div class='ctx'> 	int issued;</div><div class='ctx'> </div><div class='ctx'> 	set_freezable();</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='add'>+		wait_event_freezable_timeout(*q,</div><div class='add'>+				kthread_should_stop() || dcc-&gt;discard_wake,</div><div class='add'>+				msecs_to_jiffies(wait_ms));</div><div class='add'>+</div><div class='ctx'> 		if (sbi-&gt;gc_mode == GC_URGENT_HIGH ||</div><div class='ctx'> 			!f2fs_available_free_memory(sbi, DISCARD_CACHE))</div><div class='del'>-			__init_discard_policy(sbi, &amp;dpolicy, DPOLICY_FORCE, 1);</div><div class='add'>+			__init_discard_policy(sbi, &amp;dpolicy, DPOLICY_FORCE,</div><div class='add'>+						MIN_DISCARD_GRANULARITY);</div><div class='ctx'> 		else</div><div class='ctx'> 			__init_discard_policy(sbi, &amp;dpolicy, DPOLICY_BG,</div><div class='ctx'> 						dcc-&gt;discard_granularity);</div><div class='ctx'> </div><div class='del'>-		if (!atomic_read(&amp;dcc-&gt;discard_cmd_cnt))</div><div class='del'>-		       wait_ms = dpolicy.max_interval;</div><div class='del'>-</div><div class='del'>-		wait_event_interruptible_timeout(*q,</div><div class='del'>-				kthread_should_stop() || freezing(current) ||</div><div class='del'>-				dcc-&gt;discard_wake,</div><div class='del'>-				msecs_to_jiffies(wait_ms));</div><div class='del'>-</div><div class='ctx'> 		if (dcc-&gt;discard_wake)</div><div class='del'>-			dcc-&gt;discard_wake = 0;</div><div class='add'>+			dcc-&gt;discard_wake = false;</div><div class='ctx'> </div><div class='ctx'> 		/* clean up pending candidates before going to sleep */</div><div class='ctx'> 		if (atomic_read(&amp;dcc-&gt;queued_discard))</div><div class='ctx'> 			__wait_all_discard_cmd(sbi, NULL);</div><div class='ctx'> </div><div class='del'>-		if (try_to_freeze())</div><div class='del'>-			continue;</div><div class='ctx'> 		if (f2fs_readonly(sbi-&gt;sb))</div><div class='ctx'> 			continue;</div><div class='ctx'> 		if (kthread_should_stop())</div><div class='ctx'> 			return 0;</div><div class='del'>-		if (is_sbi_flag_set(sbi, SBI_NEED_FSCK)) {</div><div class='add'>+		if (is_sbi_flag_set(sbi, SBI_NEED_FSCK) ||</div><div class='add'>+			!atomic_read(&amp;dcc-&gt;discard_cmd_cnt)) {</div><div class='ctx'> 			wait_ms = dpolicy.max_interval;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='del'>-		if (!atomic_read(&amp;dcc-&gt;discard_cmd_cnt))</div><div class='del'>-			continue;</div><div class='ctx'> </div><div class='ctx'> 		sb_start_intwrite(sbi-&gt;sb);</div><div class='ctx'> </div><div class='hunk'>@@ -1838,6 +1966,8 @@ static int issue_discard_thread(void *data)</div><div class='ctx'> 		} else {</div><div class='ctx'> 			wait_ms = dpolicy.max_interval;</div><div class='ctx'> 		}</div><div class='add'>+		if (!atomic_read(&amp;dcc-&gt;discard_cmd_cnt))</div><div class='add'>+			wait_ms = dpolicy.max_interval;</div><div class='ctx'> </div><div class='ctx'> 		sb_end_intwrite(sbi-&gt;sb);</div><div class='ctx'> </div><div class='hunk'>@@ -1852,6 +1982,7 @@ static int __f2fs_issue_discard_zone(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	sector_t sector, nr_sects;</div><div class='ctx'> 	block_t lblkstart = blkstart;</div><div class='ctx'> 	int devi = 0;</div><div class='add'>+	u64 remainder = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (f2fs_is_multi_device(sbi)) {</div><div class='ctx'> 		devi = f2fs_target_device_index(sbi, blkstart);</div><div class='hunk'>@@ -1867,21 +1998,34 @@ static int __f2fs_issue_discard_zone(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	if (f2fs_blkz_is_seq(sbi, devi, blkstart)) {</div><div class='ctx'> 		sector = SECTOR_FROM_BLOCK(blkstart);</div><div class='ctx'> 		nr_sects = SECTOR_FROM_BLOCK(blklen);</div><div class='add'>+		div64_u64_rem(sector, bdev_zone_sectors(bdev), &amp;remainder);</div><div class='ctx'> </div><div class='del'>-		if (sector &amp; (bdev_zone_sectors(bdev) - 1) ||</div><div class='del'>-				nr_sects != bdev_zone_sectors(bdev)) {</div><div class='add'>+		if (remainder || nr_sects != bdev_zone_sectors(bdev)) {</div><div class='ctx'> 			f2fs_err(sbi, "(%d) %s: Unaligned zone reset attempted (block %x + %x)",</div><div class='ctx'> 				 devi, sbi-&gt;s_ndevs ? FDEV(devi).path : "",</div><div class='ctx'> 				 blkstart, blklen);</div><div class='ctx'> 			return -EIO;</div><div class='ctx'> 		}</div><div class='del'>-		trace_f2fs_issue_reset_zone(bdev, blkstart);</div><div class='del'>-		return blkdev_zone_mgmt(bdev, REQ_OP_ZONE_RESET,</div><div class='del'>-					sector, nr_sects, GFP_NOFS);</div><div class='add'>+</div><div class='add'>+		if (unlikely(is_sbi_flag_set(sbi, SBI_POR_DOING))) {</div><div class='add'>+			unsigned int nofs_flags;</div><div class='add'>+			int ret;</div><div class='add'>+</div><div class='add'>+			trace_f2fs_issue_reset_zone(bdev, blkstart);</div><div class='add'>+			nofs_flags = memalloc_nofs_save();</div><div class='add'>+			ret = blkdev_zone_mgmt(bdev, REQ_OP_ZONE_RESET,</div><div class='add'>+						sector, nr_sects);</div><div class='add'>+			memalloc_nofs_restore(nofs_flags);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		__queue_zone_reset_cmd(sbi, bdev, blkstart, lblkstart, blklen);</div><div class='add'>+		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* For conventional zones, use regular discard if supported */</div><div class='del'>-	return __queue_discard_cmd(sbi, bdev, lblkstart, blklen);</div><div class='add'>+	__queue_discard_cmd(sbi, bdev, lblkstart, blklen);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='hunk'>@@ -1892,7 +2036,8 @@ static int __issue_discard_async(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	if (f2fs_sb_has_blkzoned(sbi) &amp;&amp; bdev_is_zoned(bdev))</div><div class='ctx'> 		return __f2fs_issue_discard_zone(sbi, bdev, blkstart, blklen);</div><div class='ctx'> #endif</div><div class='del'>-	return __queue_discard_cmd(sbi, bdev, blkstart, blklen);</div><div class='add'>+	__queue_discard_cmd(sbi, bdev, blkstart, blklen);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int f2fs_issue_discard(struct f2fs_sb_info *sbi,</div><div class='hunk'>@@ -1940,7 +2085,6 @@ static bool add_discard_addrs(struct f2fs_sb_info *sbi, struct cp_control *cpc,</div><div class='ctx'> 							bool check_only)</div><div class='ctx'> {</div><div class='ctx'> 	int entries = SIT_VBLOCK_MAP_SIZE / sizeof(unsigned long);</div><div class='del'>-	int max_blocks = sbi-&gt;blocks_per_seg;</div><div class='ctx'> 	struct seg_entry *se = get_seg_entry(sbi, cpc-&gt;trim_start);</div><div class='ctx'> 	unsigned long *cur_map = (unsigned long *)se-&gt;cur_valid_map;</div><div class='ctx'> 	unsigned long *ckpt_map = (unsigned long *)se-&gt;ckpt_valid_map;</div><div class='hunk'>@@ -1952,12 +2096,15 @@ static bool add_discard_addrs(struct f2fs_sb_info *sbi, struct cp_control *cpc,</div><div class='ctx'> 	struct list_head *head = &amp;SM_I(sbi)-&gt;dcc_info-&gt;entry_list;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	if (se-&gt;valid_blocks == max_blocks || !f2fs_hw_support_discard(sbi) ||</div><div class='del'>-			!f2fs_block_unit_discard(sbi))</div><div class='add'>+	if (se-&gt;valid_blocks == BLKS_PER_SEG(sbi) ||</div><div class='add'>+	    !f2fs_hw_support_discard(sbi) ||</div><div class='add'>+	    !f2fs_block_unit_discard(sbi))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='ctx'> 	if (!force) {</div><div class='del'>-		if (!f2fs_realtime_discard_enable(sbi) || !se-&gt;valid_blocks ||</div><div class='add'>+		if (!f2fs_realtime_discard_enable(sbi) ||</div><div class='add'>+			(!se-&gt;valid_blocks &amp;&amp;</div><div class='add'>+				!is_curseg(sbi, cpc-&gt;trim_start)) ||</div><div class='ctx'> 			SM_I(sbi)-&gt;dcc_info-&gt;nr_discards &gt;=</div><div class='ctx'> 				SM_I(sbi)-&gt;dcc_info-&gt;max_discards)</div><div class='ctx'> 			return false;</div><div class='hunk'>@@ -1970,13 +2117,14 @@ static bool add_discard_addrs(struct f2fs_sb_info *sbi, struct cp_control *cpc,</div><div class='ctx'> </div><div class='ctx'> 	while (force || SM_I(sbi)-&gt;dcc_info-&gt;nr_discards &lt;=</div><div class='ctx'> 				SM_I(sbi)-&gt;dcc_info-&gt;max_discards) {</div><div class='del'>-		start = __find_rev_next_bit(dmap, max_blocks, end + 1);</div><div class='del'>-		if (start &gt;= max_blocks)</div><div class='add'>+		start = __find_rev_next_bit(dmap, BLKS_PER_SEG(sbi), end + 1);</div><div class='add'>+		if (start &gt;= BLKS_PER_SEG(sbi))</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		end = __find_rev_next_zero_bit(dmap, max_blocks, start + 1);</div><div class='del'>-		if (force &amp;&amp; start &amp;&amp; end != max_blocks</div><div class='del'>-					&amp;&amp; (end - start) &lt; cpc-&gt;trim_minlen)</div><div class='add'>+		end = __find_rev_next_zero_bit(dmap,</div><div class='add'>+						BLKS_PER_SEG(sbi), start + 1);</div><div class='add'>+		if (force &amp;&amp; start &amp;&amp; end != BLKS_PER_SEG(sbi) &amp;&amp;</div><div class='add'>+		    (end - start) &lt; cpc-&gt;trim_minlen)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		if (check_only)</div><div class='hunk'>@@ -2058,8 +2206,8 @@ void f2fs_clear_prefree_segments(struct f2fs_sb_info *sbi,</div><div class='ctx'> 								start + 1);</div><div class='ctx'> </div><div class='ctx'> 		if (section_alignment) {</div><div class='del'>-			start = rounddown(start, sbi-&gt;segs_per_sec);</div><div class='del'>-			end = roundup(end, sbi-&gt;segs_per_sec);</div><div class='add'>+			start = rounddown(start, SEGS_PER_SEC(sbi));</div><div class='add'>+			end = roundup(end, SEGS_PER_SEC(sbi));</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		for (i = start; i &lt; end; i++) {</div><div class='hunk'>@@ -2072,22 +2220,24 @@ void f2fs_clear_prefree_segments(struct f2fs_sb_info *sbi,</div><div class='ctx'> </div><div class='ctx'> 		if (force &amp;&amp; start &gt;= cpc-&gt;trim_start &amp;&amp;</div><div class='ctx'> 					(end - 1) &lt;= cpc-&gt;trim_end)</div><div class='del'>-				continue;</div><div class='add'>+			continue;</div><div class='ctx'> </div><div class='del'>-		if (!f2fs_lfs_mode(sbi) || !__is_large_section(sbi)) {</div><div class='add'>+		/* Should cover 2MB zoned device for zone-based reset */</div><div class='add'>+		if (!f2fs_sb_has_blkzoned(sbi) &amp;&amp;</div><div class='add'>+		    (!f2fs_lfs_mode(sbi) || !__is_large_section(sbi))) {</div><div class='ctx'> 			f2fs_issue_discard(sbi, START_BLOCK(sbi, start),</div><div class='del'>-				(end - start) &lt;&lt; sbi-&gt;log_blocks_per_seg);</div><div class='add'>+				SEGS_TO_BLKS(sbi, end - start));</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> next:</div><div class='ctx'> 		secno = GET_SEC_FROM_SEG(sbi, start);</div><div class='ctx'> 		start_segno = GET_SEG_FROM_SEC(sbi, secno);</div><div class='del'>-		if (!IS_CURSEC(sbi, secno) &amp;&amp;</div><div class='add'>+		if (!is_cursec(sbi, secno) &amp;&amp;</div><div class='ctx'> 			!get_valid_blocks(sbi, start, true))</div><div class='ctx'> 			f2fs_issue_discard(sbi, START_BLOCK(sbi, start_segno),</div><div class='del'>-				sbi-&gt;segs_per_sec &lt;&lt; sbi-&gt;log_blocks_per_seg);</div><div class='add'>+						BLKS_PER_SEC(sbi));</div><div class='ctx'> </div><div class='del'>-		start = start_segno + sbi-&gt;segs_per_sec;</div><div class='add'>+		start = start_segno + SEGS_PER_SEC(sbi);</div><div class='ctx'> 		if (start &lt; end)</div><div class='ctx'> 			goto next;</div><div class='ctx'> 		else</div><div class='hunk'>@@ -2106,7 +2256,7 @@ next:</div><div class='ctx'> find_next:</div><div class='ctx'> 		if (is_valid) {</div><div class='ctx'> 			next_pos = find_next_zero_bit_le(entry-&gt;discard_map,</div><div class='del'>-					sbi-&gt;blocks_per_seg, cur_pos);</div><div class='add'>+						BLKS_PER_SEG(sbi), cur_pos);</div><div class='ctx'> 			len = next_pos - cur_pos;</div><div class='ctx'> </div><div class='ctx'> 			if (f2fs_sb_has_blkzoned(sbi) ||</div><div class='hunk'>@@ -2118,13 +2268,13 @@ find_next:</div><div class='ctx'> 			total_len += len;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			next_pos = find_next_bit_le(entry-&gt;discard_map,</div><div class='del'>-					sbi-&gt;blocks_per_seg, cur_pos);</div><div class='add'>+						BLKS_PER_SEG(sbi), cur_pos);</div><div class='ctx'> 		}</div><div class='ctx'> skip:</div><div class='ctx'> 		cur_pos = next_pos;</div><div class='ctx'> 		is_valid = !is_valid;</div><div class='ctx'> </div><div class='del'>-		if (cur_pos &lt; sbi-&gt;blocks_per_seg)</div><div class='add'>+		if (cur_pos &lt; BLKS_PER_SEG(sbi))</div><div class='ctx'> 			goto find_next;</div><div class='ctx'> </div><div class='ctx'> 		release_discard_addr(entry);</div><div class='hunk'>@@ -2141,13 +2291,21 @@ int f2fs_start_discard_thread(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	struct discard_cmd_control *dcc = SM_I(sbi)-&gt;dcc_info;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='add'>+	if (f2fs_sb_has_readonly(sbi)) {</div><div class='add'>+		f2fs_info(sbi,</div><div class='add'>+			"Skip to start discard thread for readonly image");</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (!f2fs_realtime_discard_enable(sbi))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	dcc-&gt;f2fs_issue_discard = kthread_run(issue_discard_thread, sbi,</div><div class='ctx'> 				"f2fs_discard-%u:%u", MAJOR(dev), MINOR(dev));</div><div class='del'>-	if (IS_ERR(dcc-&gt;f2fs_issue_discard))</div><div class='add'>+	if (IS_ERR(dcc-&gt;f2fs_issue_discard)) {</div><div class='ctx'> 		err = PTR_ERR(dcc-&gt;f2fs_issue_discard);</div><div class='add'>+		dcc-&gt;f2fs_issue_discard = NULL;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='hunk'>@@ -2166,11 +2324,13 @@ static int create_discard_cmd_control(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	if (!dcc)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='add'>+	dcc-&gt;discard_io_aware_gran = MAX_PLIST_NUM;</div><div class='ctx'> 	dcc-&gt;discard_granularity = DEFAULT_DISCARD_GRANULARITY;</div><div class='del'>-	if (F2FS_OPTION(sbi).discard_unit == DISCARD_UNIT_SEGMENT)</div><div class='del'>-		dcc-&gt;discard_granularity = sbi-&gt;blocks_per_seg;</div><div class='del'>-	else if (F2FS_OPTION(sbi).discard_unit == DISCARD_UNIT_SECTION)</div><div class='del'>-		dcc-&gt;discard_granularity = BLKS_PER_SEC(sbi);</div><div class='add'>+	dcc-&gt;max_ordered_discard = DEFAULT_MAX_ORDERED_DISCARD_GRANULARITY;</div><div class='add'>+	dcc-&gt;discard_io_aware = DPOLICY_IO_AWARE_ENABLE;</div><div class='add'>+	if (F2FS_OPTION(sbi).discard_unit == DISCARD_UNIT_SEGMENT ||</div><div class='add'>+		F2FS_OPTION(sbi).discard_unit == DISCARD_UNIT_SECTION)</div><div class='add'>+		dcc-&gt;discard_granularity = BLKS_PER_SEG(sbi);</div><div class='ctx'> </div><div class='ctx'> 	INIT_LIST_HEAD(&amp;dcc-&gt;entry_list);</div><div class='ctx'> 	for (i = 0; i &lt; MAX_PLIST_NUM; i++)</div><div class='hunk'>@@ -2182,7 +2342,12 @@ static int create_discard_cmd_control(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	atomic_set(&amp;dcc-&gt;queued_discard, 0);</div><div class='ctx'> 	atomic_set(&amp;dcc-&gt;discard_cmd_cnt, 0);</div><div class='ctx'> 	dcc-&gt;nr_discards = 0;</div><div class='del'>-	dcc-&gt;max_discards = MAIN_SEGS(sbi) &lt;&lt; sbi-&gt;log_blocks_per_seg;</div><div class='add'>+	dcc-&gt;max_discards = SEGS_TO_BLKS(sbi, MAIN_SEGS(sbi));</div><div class='add'>+	dcc-&gt;max_discard_request = DEF_MAX_DISCARD_REQUEST;</div><div class='add'>+	dcc-&gt;min_discard_issue_time = DEF_MIN_DISCARD_ISSUE_TIME;</div><div class='add'>+	dcc-&gt;mid_discard_issue_time = DEF_MID_DISCARD_ISSUE_TIME;</div><div class='add'>+	dcc-&gt;max_discard_issue_time = DEF_MAX_DISCARD_ISSUE_TIME;</div><div class='add'>+	dcc-&gt;discard_urgent_util = DEF_DISCARD_URGENT_UTIL;</div><div class='ctx'> 	dcc-&gt;undiscard_blks = 0;</div><div class='ctx'> 	dcc-&gt;next_pos = 0;</div><div class='ctx'> 	dcc-&gt;root = RB_ROOT_CACHED;</div><div class='hunk'>@@ -2213,8 +2378,7 @@ static void destroy_discard_cmd_control(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	 * Recovery can cache discard commands, so in error path of</div><div class='ctx'> 	 * fill_super(), it needs to give a chance to handle them.</div><div class='ctx'> 	 */</div><div class='del'>-	if (unlikely(atomic_read(&amp;dcc-&gt;discard_cmd_cnt)))</div><div class='del'>-		f2fs_issue_discard_timeout(sbi);</div><div class='add'>+	f2fs_issue_discard_timeout(sbi);</div><div class='ctx'> </div><div class='ctx'> 	kfree(dcc);</div><div class='ctx'> 	SM_I(sbi)-&gt;dcc_info = NULL;</div><div class='hunk'>@@ -2275,76 +2439,38 @@ static void update_segment_mtime(struct f2fs_sb_info *sbi, block_t blkaddr,</div><div class='ctx'> 		SIT_I(sbi)-&gt;max_mtime = ctime;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void update_sit_entry(struct f2fs_sb_info *sbi, block_t blkaddr, int del)</div><div class='add'>+/*</div><div class='add'>+ * NOTE: when updating multiple blocks at the same time, please ensure</div><div class='add'>+ * that the consecutive input blocks belong to the same segment.</div><div class='add'>+ */</div><div class='add'>+static int update_sit_entry_for_release(struct f2fs_sb_info *sbi, struct seg_entry *se,</div><div class='add'>+				unsigned int segno, block_t blkaddr, unsigned int offset, int del)</div><div class='ctx'> {</div><div class='del'>-	struct seg_entry *se;</div><div class='del'>-	unsigned int segno, offset;</div><div class='del'>-	long int new_vblocks;</div><div class='ctx'> 	bool exist;</div><div class='ctx'> #ifdef CONFIG_F2FS_CHECK_FS</div><div class='ctx'> 	bool mir_exist;</div><div class='ctx'> #endif</div><div class='add'>+	int i;</div><div class='add'>+	int del_count = -del;</div><div class='ctx'> </div><div class='del'>-	segno = GET_SEGNO(sbi, blkaddr);</div><div class='del'>-</div><div class='del'>-	se = get_seg_entry(sbi, segno);</div><div class='del'>-	new_vblocks = se-&gt;valid_blocks + del;</div><div class='del'>-	offset = GET_BLKOFF_FROM_SEG0(sbi, blkaddr);</div><div class='del'>-</div><div class='del'>-	f2fs_bug_on(sbi, (new_vblocks &lt; 0 ||</div><div class='del'>-			(new_vblocks &gt; f2fs_usable_blks_in_seg(sbi, segno))));</div><div class='del'>-</div><div class='del'>-	se-&gt;valid_blocks = new_vblocks;</div><div class='del'>-</div><div class='del'>-	/* Update valid block bitmap */</div><div class='del'>-	if (del &gt; 0) {</div><div class='del'>-		exist = f2fs_test_and_set_bit(offset, se-&gt;cur_valid_map);</div><div class='del'>-#ifdef CONFIG_F2FS_CHECK_FS</div><div class='del'>-		mir_exist = f2fs_test_and_set_bit(offset,</div><div class='del'>-						se-&gt;cur_valid_map_mir);</div><div class='del'>-		if (unlikely(exist != mir_exist)) {</div><div class='del'>-			f2fs_err(sbi, "Inconsistent error when setting bitmap, blk:%u, old bit:%d",</div><div class='del'>-				 blkaddr, exist);</div><div class='del'>-			f2fs_bug_on(sbi, 1);</div><div class='del'>-		}</div><div class='del'>-#endif</div><div class='del'>-		if (unlikely(exist)) {</div><div class='del'>-			f2fs_err(sbi, "Bitmap was wrongly set, blk:%u",</div><div class='del'>-				 blkaddr);</div><div class='del'>-			f2fs_bug_on(sbi, 1);</div><div class='del'>-			se-&gt;valid_blocks--;</div><div class='del'>-			del = 0;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (f2fs_block_unit_discard(sbi) &amp;&amp;</div><div class='del'>-				!f2fs_test_and_set_bit(offset, se-&gt;discard_map))</div><div class='del'>-			sbi-&gt;discard_blks--;</div><div class='add'>+	f2fs_bug_on(sbi, GET_SEGNO(sbi, blkaddr) != GET_SEGNO(sbi, blkaddr + del_count - 1));</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * SSR should never reuse block which is checkpointed</div><div class='del'>-		 * or newly invalidated.</div><div class='del'>-		 */</div><div class='del'>-		if (!is_sbi_flag_set(sbi, SBI_CP_DISABLED)) {</div><div class='del'>-			if (!f2fs_test_and_set_bit(offset, se-&gt;ckpt_valid_map))</div><div class='del'>-				se-&gt;ckpt_valid_blocks++;</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-		exist = f2fs_test_and_clear_bit(offset, se-&gt;cur_valid_map);</div><div class='add'>+	for (i = 0; i &lt; del_count; i++) {</div><div class='add'>+		exist = f2fs_test_and_clear_bit(offset + i, se-&gt;cur_valid_map);</div><div class='ctx'> #ifdef CONFIG_F2FS_CHECK_FS</div><div class='del'>-		mir_exist = f2fs_test_and_clear_bit(offset,</div><div class='add'>+		mir_exist = f2fs_test_and_clear_bit(offset + i,</div><div class='ctx'> 						se-&gt;cur_valid_map_mir);</div><div class='ctx'> 		if (unlikely(exist != mir_exist)) {</div><div class='ctx'> 			f2fs_err(sbi, "Inconsistent error when clearing bitmap, blk:%u, old bit:%d",</div><div class='del'>-				 blkaddr, exist);</div><div class='add'>+				blkaddr + i, exist);</div><div class='ctx'> 			f2fs_bug_on(sbi, 1);</div><div class='ctx'> 		}</div><div class='ctx'> #endif</div><div class='ctx'> 		if (unlikely(!exist)) {</div><div class='del'>-			f2fs_err(sbi, "Bitmap was wrongly cleared, blk:%u",</div><div class='del'>-				 blkaddr);</div><div class='add'>+			f2fs_err(sbi, "Bitmap was wrongly cleared, blk:%u", blkaddr + i);</div><div class='ctx'> 			f2fs_bug_on(sbi, 1);</div><div class='ctx'> 			se-&gt;valid_blocks++;</div><div class='del'>-			del = 0;</div><div class='add'>+			del += 1;</div><div class='ctx'> 		} else if (unlikely(is_sbi_flag_set(sbi, SBI_CP_DISABLED))) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * If checkpoints are off, we must not reuse data that</div><div class='hunk'>@@ -2352,7 +2478,7 @@ static void update_sit_entry(struct f2fs_sb_info *sbi, block_t blkaddr, int del)</div><div class='ctx'> 			 * before, we must track that to know how much space we</div><div class='ctx'> 			 * really have.</div><div class='ctx'> 			 */</div><div class='del'>-			if (f2fs_test_bit(offset, se-&gt;ckpt_valid_map)) {</div><div class='add'>+			if (f2fs_test_bit(offset + i, se-&gt;ckpt_valid_map)) {</div><div class='ctx'> 				spin_lock(&amp;sbi-&gt;stat_lock);</div><div class='ctx'> 				sbi-&gt;unusable_block_count++;</div><div class='ctx'> 				spin_unlock(&amp;sbi-&gt;stat_lock);</div><div class='hunk'>@@ -2360,11 +2486,105 @@ static void update_sit_entry(struct f2fs_sb_info *sbi, block_t blkaddr, int del)</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (f2fs_block_unit_discard(sbi) &amp;&amp;</div><div class='del'>-			f2fs_test_and_clear_bit(offset, se-&gt;discard_map))</div><div class='add'>+				f2fs_test_and_clear_bit(offset + i, se-&gt;discard_map))</div><div class='ctx'> 			sbi-&gt;discard_blks++;</div><div class='add'>+</div><div class='add'>+		if (!f2fs_test_bit(offset + i, se-&gt;ckpt_valid_map)) {</div><div class='add'>+			se-&gt;ckpt_valid_blocks -= 1;</div><div class='add'>+			if (__is_large_section(sbi))</div><div class='add'>+				get_sec_entry(sbi, segno)-&gt;ckpt_valid_blocks -= 1;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (__is_large_section(sbi))</div><div class='add'>+		sanity_check_valid_blocks(sbi, segno);</div><div class='add'>+</div><div class='add'>+	return del;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int update_sit_entry_for_alloc(struct f2fs_sb_info *sbi, struct seg_entry *se,</div><div class='add'>+				unsigned int segno, block_t blkaddr, unsigned int offset, int del)</div><div class='add'>+{</div><div class='add'>+	bool exist;</div><div class='add'>+#ifdef CONFIG_F2FS_CHECK_FS</div><div class='add'>+	bool mir_exist;</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+	exist = f2fs_test_and_set_bit(offset, se-&gt;cur_valid_map);</div><div class='add'>+#ifdef CONFIG_F2FS_CHECK_FS</div><div class='add'>+	mir_exist = f2fs_test_and_set_bit(offset,</div><div class='add'>+					se-&gt;cur_valid_map_mir);</div><div class='add'>+	if (unlikely(exist != mir_exist)) {</div><div class='add'>+		f2fs_err(sbi, "Inconsistent error when setting bitmap, blk:%u, old bit:%d",</div><div class='add'>+			blkaddr, exist);</div><div class='add'>+		f2fs_bug_on(sbi, 1);</div><div class='ctx'> 	}</div><div class='del'>-	if (!f2fs_test_bit(offset, se-&gt;ckpt_valid_map))</div><div class='add'>+#endif</div><div class='add'>+	if (unlikely(exist)) {</div><div class='add'>+		f2fs_err(sbi, "Bitmap was wrongly set, blk:%u", blkaddr);</div><div class='add'>+		f2fs_bug_on(sbi, 1);</div><div class='add'>+		se-&gt;valid_blocks--;</div><div class='add'>+		del = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (f2fs_block_unit_discard(sbi) &amp;&amp;</div><div class='add'>+			!f2fs_test_and_set_bit(offset, se-&gt;discard_map))</div><div class='add'>+		sbi-&gt;discard_blks--;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * SSR should never reuse block which is checkpointed</div><div class='add'>+	 * or newly invalidated.</div><div class='add'>+	 */</div><div class='add'>+	if (!is_sbi_flag_set(sbi, SBI_CP_DISABLED)) {</div><div class='add'>+		if (!f2fs_test_and_set_bit(offset, se-&gt;ckpt_valid_map)) {</div><div class='add'>+			se-&gt;ckpt_valid_blocks++;</div><div class='add'>+			if (__is_large_section(sbi))</div><div class='add'>+				get_sec_entry(sbi, segno)-&gt;ckpt_valid_blocks++;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!f2fs_test_bit(offset, se-&gt;ckpt_valid_map)) {</div><div class='ctx'> 		se-&gt;ckpt_valid_blocks += del;</div><div class='add'>+		if (__is_large_section(sbi))</div><div class='add'>+			get_sec_entry(sbi, segno)-&gt;ckpt_valid_blocks += del;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (__is_large_section(sbi))</div><div class='add'>+		sanity_check_valid_blocks(sbi, segno);</div><div class='add'>+</div><div class='add'>+	return del;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * If releasing blocks, this function supports updating multiple consecutive blocks</div><div class='add'>+ * at one time, but please note that these consecutive blocks need to belong to the</div><div class='add'>+ * same segment.</div><div class='add'>+ */</div><div class='add'>+static void update_sit_entry(struct f2fs_sb_info *sbi, block_t blkaddr, int del)</div><div class='add'>+{</div><div class='add'>+	struct seg_entry *se;</div><div class='add'>+	unsigned int segno, offset;</div><div class='add'>+	long int new_vblocks;</div><div class='add'>+</div><div class='add'>+	segno = GET_SEGNO(sbi, blkaddr);</div><div class='add'>+	if (segno == NULL_SEGNO)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	se = get_seg_entry(sbi, segno);</div><div class='add'>+	new_vblocks = se-&gt;valid_blocks + del;</div><div class='add'>+	offset = GET_BLKOFF_FROM_SEG0(sbi, blkaddr);</div><div class='add'>+</div><div class='add'>+	f2fs_bug_on(sbi, (new_vblocks &lt; 0 ||</div><div class='add'>+			(new_vblocks &gt; f2fs_usable_blks_in_seg(sbi, segno))));</div><div class='add'>+</div><div class='add'>+	se-&gt;valid_blocks = new_vblocks;</div><div class='add'>+</div><div class='add'>+	/* Update valid block bitmap */</div><div class='add'>+	if (del &gt; 0) {</div><div class='add'>+		del = update_sit_entry_for_alloc(sbi, se, segno, blkaddr, offset, del);</div><div class='add'>+	} else {</div><div class='add'>+		del = update_sit_entry_for_release(sbi, se, segno, blkaddr, offset, del);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	__mark_sit_entry_dirty(sbi, segno);</div><div class='ctx'> </div><div class='hunk'>@@ -2375,26 +2595,43 @@ static void update_sit_entry(struct f2fs_sb_info *sbi, block_t blkaddr, int del)</div><div class='ctx'> 		get_sec_entry(sbi, segno)-&gt;valid_blocks += del;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_invalidate_blocks(struct f2fs_sb_info *sbi, block_t addr)</div><div class='add'>+void f2fs_invalidate_blocks(struct f2fs_sb_info *sbi, block_t addr,</div><div class='add'>+				unsigned int len)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int segno = GET_SEGNO(sbi, addr);</div><div class='ctx'> 	struct sit_info *sit_i = SIT_I(sbi);</div><div class='add'>+	block_t addr_start = addr, addr_end = addr + len - 1;</div><div class='add'>+	unsigned int seg_num = GET_SEGNO(sbi, addr_end) - segno + 1;</div><div class='add'>+	unsigned int i = 1, max_blocks = sbi-&gt;blocks_per_seg, cnt;</div><div class='ctx'> </div><div class='ctx'> 	f2fs_bug_on(sbi, addr == NULL_ADDR);</div><div class='ctx'> 	if (addr == NEW_ADDR || addr == COMPRESS_ADDR)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	invalidate_mapping_pages(META_MAPPING(sbi), addr, addr);</div><div class='del'>-	f2fs_invalidate_compress_page(sbi, addr);</div><div class='add'>+	f2fs_invalidate_internal_cache(sbi, addr, len);</div><div class='ctx'> </div><div class='ctx'> 	/* add it into sit main buffer */</div><div class='ctx'> 	down_write(&amp;sit_i-&gt;sentry_lock);</div><div class='ctx'> </div><div class='del'>-	update_segment_mtime(sbi, addr, 0);</div><div class='del'>-	update_sit_entry(sbi, addr, -1);</div><div class='add'>+	if (seg_num == 1)</div><div class='add'>+		cnt = len;</div><div class='add'>+	else</div><div class='add'>+		cnt = max_blocks - GET_BLKOFF_FROM_SEG0(sbi, addr);</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		update_segment_mtime(sbi, addr_start, 0);</div><div class='add'>+		update_sit_entry(sbi, addr_start, -cnt);</div><div class='ctx'> </div><div class='del'>-	/* add it into dirty seglist */</div><div class='del'>-	locate_dirty_segment(sbi, segno);</div><div class='add'>+		/* add it into dirty seglist */</div><div class='add'>+		locate_dirty_segment(sbi, segno);</div><div class='add'>+</div><div class='add'>+		/* update @addr_start and @cnt and @segno */</div><div class='add'>+		addr_start = START_BLOCK(sbi, ++segno);</div><div class='add'>+		if (++i == seg_num)</div><div class='add'>+			cnt = GET_BLKOFF_FROM_SEG0(sbi, addr_end) + 1;</div><div class='add'>+		else</div><div class='add'>+			cnt = max_blocks;</div><div class='add'>+	} while (i &lt;= seg_num);</div><div class='ctx'> </div><div class='ctx'> 	up_write(&amp;sit_i-&gt;sentry_lock);</div><div class='ctx'> }</div><div class='hunk'>@@ -2423,17 +2660,13 @@ bool f2fs_is_checkpointed_data(struct f2fs_sb_info *sbi, block_t blkaddr)</div><div class='ctx'> 	return is_cp;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * This function should be resided under the curseg_mutex lock</div><div class='del'>- */</div><div class='del'>-static void __add_sum_entry(struct f2fs_sb_info *sbi, int type,</div><div class='del'>-					struct f2fs_summary *sum)</div><div class='add'>+static unsigned short f2fs_curseg_valid_blocks(struct f2fs_sb_info *sbi, int type)</div><div class='ctx'> {</div><div class='ctx'> 	struct curseg_info *curseg = CURSEG_I(sbi, type);</div><div class='del'>-	void *addr = curseg-&gt;sum_blk;</div><div class='ctx'> </div><div class='del'>-	addr += curseg-&gt;next_blkoff * sizeof(struct f2fs_summary);</div><div class='del'>-	memcpy(addr, sum, sizeof(struct f2fs_summary));</div><div class='add'>+	if (sbi-&gt;ckpt-&gt;alloc_type[type] == SSR)</div><div class='add'>+		return BLKS_PER_SEG(sbi);</div><div class='add'>+	return curseg-&gt;next_blkoff;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2445,15 +2678,11 @@ int f2fs_npages_for_summary_flush(struct f2fs_sb_info *sbi, bool for_ra)</div><div class='ctx'> 	int i, sum_in_page;</div><div class='ctx'> </div><div class='ctx'> 	for (i = CURSEG_HOT_DATA; i &lt;= CURSEG_COLD_DATA; i++) {</div><div class='del'>-		if (sbi-&gt;ckpt-&gt;alloc_type[i] == SSR)</div><div class='del'>-			valid_sum_count += sbi-&gt;blocks_per_seg;</div><div class='del'>-		else {</div><div class='del'>-			if (for_ra)</div><div class='del'>-				valid_sum_count += le16_to_cpu(</div><div class='del'>-					F2FS_CKPT(sbi)-&gt;cur_data_blkoff[i]);</div><div class='del'>-			else</div><div class='del'>-				valid_sum_count += curseg_blkoff(sbi, i);</div><div class='del'>-		}</div><div class='add'>+		if (sbi-&gt;ckpt-&gt;alloc_type[i] != SSR &amp;&amp; for_ra)</div><div class='add'>+			valid_sum_count +=</div><div class='add'>+				le16_to_cpu(F2FS_CKPT(sbi)-&gt;cur_data_blkoff[i]);</div><div class='add'>+		else</div><div class='add'>+			valid_sum_count += f2fs_curseg_valid_blocks(sbi, i);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	sum_in_page = (PAGE_SIZE - 2 * SUM_JOURNAL_SIZE -</div><div class='hunk'>@@ -2467,40 +2696,60 @@ int f2fs_npages_for_summary_flush(struct f2fs_sb_info *sbi, bool for_ra)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Caller should put this summary page</div><div class='add'>+ * Caller should put this summary folio</div><div class='ctx'>  */</div><div class='del'>-struct page *f2fs_get_sum_page(struct f2fs_sb_info *sbi, unsigned int segno)</div><div class='add'>+struct folio *f2fs_get_sum_folio(struct f2fs_sb_info *sbi, unsigned int segno)</div><div class='ctx'> {</div><div class='ctx'> 	if (unlikely(f2fs_cp_error(sbi)))</div><div class='ctx'> 		return ERR_PTR(-EIO);</div><div class='del'>-	return f2fs_get_meta_page_retry(sbi, GET_SUM_BLOCK(sbi, segno));</div><div class='add'>+	return f2fs_get_meta_folio_retry(sbi, GET_SUM_BLOCK(sbi, segno));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_update_meta_page(struct f2fs_sb_info *sbi,</div><div class='ctx'> 					void *src, block_t blk_addr)</div><div class='ctx'> {</div><div class='del'>-	struct page *page = f2fs_grab_meta_page(sbi, blk_addr);</div><div class='add'>+	struct folio *folio;</div><div class='add'>+</div><div class='add'>+	if (SUMS_PER_BLOCK == 1)</div><div class='add'>+		folio = f2fs_grab_meta_folio(sbi, blk_addr);</div><div class='add'>+	else</div><div class='add'>+		folio = f2fs_get_meta_folio_retry(sbi, blk_addr);</div><div class='add'>+</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	memcpy(page_address(page), src, PAGE_SIZE);</div><div class='del'>-	set_page_dirty(page);</div><div class='del'>-	f2fs_put_page(page, 1);</div><div class='add'>+	memcpy(folio_address(folio), src, PAGE_SIZE);</div><div class='add'>+	folio_mark_dirty(folio);</div><div class='add'>+	f2fs_folio_put(folio, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void write_sum_page(struct f2fs_sb_info *sbi,</div><div class='del'>-			struct f2fs_summary_block *sum_blk, block_t blk_addr)</div><div class='add'>+		struct f2fs_summary_block *sum_blk, unsigned int segno)</div><div class='ctx'> {</div><div class='del'>-	f2fs_update_meta_page(sbi, (void *)sum_blk, blk_addr);</div><div class='add'>+	struct folio *folio;</div><div class='add'>+</div><div class='add'>+	if (SUMS_PER_BLOCK == 1)</div><div class='add'>+		return f2fs_update_meta_page(sbi, (void *)sum_blk,</div><div class='add'>+				GET_SUM_BLOCK(sbi, segno));</div><div class='add'>+</div><div class='add'>+	folio = f2fs_get_sum_folio(sbi, segno);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	memcpy(SUM_BLK_PAGE_ADDR(folio, segno), sum_blk, sizeof(*sum_blk));</div><div class='add'>+	folio_mark_dirty(folio);</div><div class='add'>+	f2fs_folio_put(folio, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void write_current_sum_page(struct f2fs_sb_info *sbi,</div><div class='ctx'> 						int type, block_t blk_addr)</div><div class='ctx'> {</div><div class='ctx'> 	struct curseg_info *curseg = CURSEG_I(sbi, type);</div><div class='del'>-	struct page *page = f2fs_grab_meta_page(sbi, blk_addr);</div><div class='add'>+	struct folio *folio = f2fs_grab_meta_folio(sbi, blk_addr);</div><div class='ctx'> 	struct f2fs_summary_block *src = curseg-&gt;sum_blk;</div><div class='ctx'> 	struct f2fs_summary_block *dst;</div><div class='ctx'> </div><div class='del'>-	dst = (struct f2fs_summary_block *)page_address(page);</div><div class='add'>+	dst = folio_address(folio);</div><div class='ctx'> 	memset(dst, 0, PAGE_SIZE);</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;curseg-&gt;curseg_mutex);</div><div class='hunk'>@@ -2514,17 +2763,17 @@ static void write_current_sum_page(struct f2fs_sb_info *sbi,</div><div class='ctx'> </div><div class='ctx'> 	mutex_unlock(&amp;curseg-&gt;curseg_mutex);</div><div class='ctx'> </div><div class='del'>-	set_page_dirty(page);</div><div class='del'>-	f2fs_put_page(page, 1);</div><div class='add'>+	folio_mark_dirty(folio);</div><div class='add'>+	f2fs_folio_put(folio, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int is_next_segment_free(struct f2fs_sb_info *sbi,</div><div class='del'>-				struct curseg_info *curseg, int type)</div><div class='add'>+				struct curseg_info *curseg)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int segno = curseg-&gt;segno + 1;</div><div class='ctx'> 	struct free_segmap_info *free_i = FREE_I(sbi);</div><div class='ctx'> </div><div class='del'>-	if (segno &lt; MAIN_SEGS(sbi) &amp;&amp; segno % sbi-&gt;segs_per_sec)</div><div class='add'>+	if (segno &lt; MAIN_SEGS(sbi) &amp;&amp; segno % SEGS_PER_SEC(sbi))</div><div class='ctx'> 		return !test_bit(segno, free_i-&gt;free_segmap);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -2533,54 +2782,93 @@ static int is_next_segment_free(struct f2fs_sb_info *sbi,</div><div class='ctx'>  * Find a new segment from the free segments bitmap to right order</div><div class='ctx'>  * This function should be returned with success, otherwise BUG</div><div class='ctx'>  */</div><div class='del'>-static void get_new_segment(struct f2fs_sb_info *sbi,</div><div class='del'>-			unsigned int *newseg, bool new_sec, int dir)</div><div class='add'>+static int get_new_segment(struct f2fs_sb_info *sbi,</div><div class='add'>+			unsigned int *newseg, bool new_sec, bool pinning)</div><div class='ctx'> {</div><div class='ctx'> 	struct free_segmap_info *free_i = FREE_I(sbi);</div><div class='ctx'> 	unsigned int segno, secno, zoneno;</div><div class='ctx'> 	unsigned int total_zones = MAIN_SECS(sbi) / sbi-&gt;secs_per_zone;</div><div class='ctx'> 	unsigned int hint = GET_SEC_FROM_SEG(sbi, *newseg);</div><div class='ctx'> 	unsigned int old_zoneno = GET_ZONE_FROM_SEG(sbi, *newseg);</div><div class='del'>-	unsigned int left_start = hint;</div><div class='add'>+	unsigned int alloc_policy = sbi-&gt;allocate_section_policy;</div><div class='add'>+	unsigned int alloc_hint = sbi-&gt;allocate_section_hint;</div><div class='ctx'> 	bool init = true;</div><div class='del'>-	int go_left = 0;</div><div class='ctx'> 	int i;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;free_i-&gt;segmap_lock);</div><div class='ctx'> </div><div class='del'>-	if (!new_sec &amp;&amp; ((*newseg + 1) % sbi-&gt;segs_per_sec)) {</div><div class='add'>+	if (time_to_inject(sbi, FAULT_NO_SEGMENT)) {</div><div class='add'>+		ret = -ENOSPC;</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!new_sec &amp;&amp; ((*newseg + 1) % SEGS_PER_SEC(sbi))) {</div><div class='ctx'> 		segno = find_next_zero_bit(free_i-&gt;free_segmap,</div><div class='ctx'> 			GET_SEG_FROM_SEC(sbi, hint + 1), *newseg + 1);</div><div class='ctx'> 		if (segno &lt; GET_SEG_FROM_SEC(sbi, hint + 1))</div><div class='ctx'> 			goto got_it;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BLK_DEV_ZONED</div><div class='add'>+	/*</div><div class='add'>+	 * If we format f2fs on zoned storage, let's try to get pinned sections</div><div class='add'>+	 * from beginning of the storage, which should be a conventional one.</div><div class='add'>+	 */</div><div class='add'>+	if (f2fs_sb_has_blkzoned(sbi)) {</div><div class='add'>+		/* Prioritize writing to conventional zones */</div><div class='add'>+		if (sbi-&gt;blkzone_alloc_policy == BLKZONE_ALLOC_PRIOR_CONV || pinning)</div><div class='add'>+			segno = 0;</div><div class='add'>+		else</div><div class='add'>+			segno = max(sbi-&gt;first_seq_zone_segno, *newseg);</div><div class='add'>+		hint = GET_SEC_FROM_SEG(sbi, segno);</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Prevent allocate_section_hint from exceeding MAIN_SECS()</div><div class='add'>+	 * due to desynchronization.</div><div class='add'>+	 */</div><div class='add'>+	if (alloc_policy != ALLOCATE_FORWARD_NOHINT &amp;&amp;</div><div class='add'>+		alloc_hint &gt; MAIN_SECS(sbi))</div><div class='add'>+		alloc_hint = MAIN_SECS(sbi);</div><div class='add'>+</div><div class='add'>+	if (alloc_policy == ALLOCATE_FORWARD_FROM_HINT &amp;&amp;</div><div class='add'>+		hint &lt; alloc_hint)</div><div class='add'>+		hint = alloc_hint;</div><div class='add'>+	else if (alloc_policy == ALLOCATE_FORWARD_WITHIN_HINT &amp;&amp;</div><div class='add'>+			hint &gt;= alloc_hint)</div><div class='add'>+		hint = 0;</div><div class='add'>+</div><div class='ctx'> find_other_zone:</div><div class='ctx'> 	secno = find_next_zero_bit(free_i-&gt;free_secmap, MAIN_SECS(sbi), hint);</div><div class='del'>-	if (secno &gt;= MAIN_SECS(sbi)) {</div><div class='del'>-		if (dir == ALLOC_RIGHT) {</div><div class='del'>-			secno = find_next_zero_bit(free_i-&gt;free_secmap,</div><div class='del'>-							MAIN_SECS(sbi), 0);</div><div class='del'>-			f2fs_bug_on(sbi, secno &gt;= MAIN_SECS(sbi));</div><div class='del'>-		} else {</div><div class='del'>-			go_left = 1;</div><div class='del'>-			left_start = hint - 1;</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BLK_DEV_ZONED</div><div class='add'>+	if (secno &gt;= MAIN_SECS(sbi) &amp;&amp; f2fs_sb_has_blkzoned(sbi)) {</div><div class='add'>+		/* Write only to sequential zones */</div><div class='add'>+		if (sbi-&gt;blkzone_alloc_policy == BLKZONE_ALLOC_ONLY_SEQ) {</div><div class='add'>+			hint = GET_SEC_FROM_SEG(sbi, sbi-&gt;first_seq_zone_segno);</div><div class='add'>+			secno = find_next_zero_bit(free_i-&gt;free_secmap, MAIN_SECS(sbi), hint);</div><div class='add'>+		} else</div><div class='add'>+			secno = find_first_zero_bit(free_i-&gt;free_secmap,</div><div class='add'>+								MAIN_SECS(sbi));</div><div class='add'>+		if (secno &gt;= MAIN_SECS(sbi)) {</div><div class='add'>+			ret = -ENOSPC;</div><div class='add'>+			f2fs_bug_on(sbi, 1);</div><div class='add'>+			goto out_unlock;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	if (go_left == 0)</div><div class='del'>-		goto skip_left;</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='del'>-	while (test_bit(left_start, free_i-&gt;free_secmap)) {</div><div class='del'>-		if (left_start &gt; 0) {</div><div class='del'>-			left_start--;</div><div class='del'>-			continue;</div><div class='add'>+	if (secno &gt;= MAIN_SECS(sbi)) {</div><div class='add'>+		secno = find_first_zero_bit(free_i-&gt;free_secmap,</div><div class='add'>+							MAIN_SECS(sbi));</div><div class='add'>+		if (secno &gt;= MAIN_SECS(sbi)) {</div><div class='add'>+			ret = -ENOSPC;</div><div class='add'>+			f2fs_bug_on(sbi, !pinning);</div><div class='add'>+			goto out_unlock;</div><div class='ctx'> 		}</div><div class='del'>-		left_start = find_next_zero_bit(free_i-&gt;free_secmap,</div><div class='del'>-							MAIN_SECS(sbi), 0);</div><div class='del'>-		f2fs_bug_on(sbi, left_start &gt;= MAIN_SECS(sbi));</div><div class='del'>-		break;</div><div class='ctx'> 	}</div><div class='del'>-	secno = left_start;</div><div class='del'>-skip_left:</div><div class='ctx'> 	segno = GET_SEG_FROM_SEC(sbi, secno);</div><div class='ctx'> 	zoneno = GET_ZONE_FROM_SEC(sbi, secno);</div><div class='ctx'> </div><div class='hunk'>@@ -2591,21 +2879,13 @@ skip_left:</div><div class='ctx'> 		goto got_it;</div><div class='ctx'> 	if (zoneno == old_zoneno)</div><div class='ctx'> 		goto got_it;</div><div class='del'>-	if (dir == ALLOC_LEFT) {</div><div class='del'>-		if (!go_left &amp;&amp; zoneno + 1 &gt;= total_zones)</div><div class='del'>-			goto got_it;</div><div class='del'>-		if (go_left &amp;&amp; zoneno == 0)</div><div class='del'>-			goto got_it;</div><div class='del'>-	}</div><div class='ctx'> 	for (i = 0; i &lt; NR_CURSEG_TYPE; i++)</div><div class='ctx'> 		if (CURSEG_I(sbi, i)-&gt;zone == zoneno)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='ctx'> 	if (i &lt; NR_CURSEG_TYPE) {</div><div class='ctx'> 		/* zone is in user, try another */</div><div class='del'>-		if (go_left)</div><div class='del'>-			hint = zoneno * sbi-&gt;secs_per_zone - 1;</div><div class='del'>-		else if (zoneno + 1 &gt;= total_zones)</div><div class='add'>+		if (zoneno + 1 &gt;= total_zones)</div><div class='ctx'> 			hint = 0;</div><div class='ctx'> 		else</div><div class='ctx'> 			hint = (zoneno + 1) * sbi-&gt;secs_per_zone;</div><div class='hunk'>@@ -2614,10 +2894,26 @@ skip_left:</div><div class='ctx'> 	}</div><div class='ctx'> got_it:</div><div class='ctx'> 	/* set it as dirty segment in free segmap */</div><div class='del'>-	f2fs_bug_on(sbi, test_bit(segno, free_i-&gt;free_segmap));</div><div class='add'>+	if (test_bit(segno, free_i-&gt;free_segmap)) {</div><div class='add'>+		ret = -EFSCORRUPTED;</div><div class='add'>+		f2fs_stop_checkpoint(sbi, false, STOP_CP_REASON_CORRUPTED_FREE_BITMAP);</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* no free section in conventional device or conventional zone */</div><div class='add'>+	if (new_sec &amp;&amp; pinning &amp;&amp;</div><div class='add'>+		f2fs_is_sequential_zone_area(sbi, START_BLOCK(sbi, segno))) {</div><div class='add'>+		ret = -EAGAIN;</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	}</div><div class='ctx'> 	__set_inuse(sbi, segno);</div><div class='ctx'> 	*newseg = segno;</div><div class='add'>+out_unlock:</div><div class='ctx'> 	spin_unlock(&amp;free_i-&gt;segmap_lock);</div><div class='add'>+</div><div class='add'>+	if (ret == -ENOSPC &amp;&amp; !pinning)</div><div class='add'>+		f2fs_stop_checkpoint(sbi, false, STOP_CP_REASON_NO_SEGMENT);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void reset_curseg(struct f2fs_sb_info *sbi, int type, int modified)</div><div class='hunk'>@@ -2626,6 +2922,10 @@ static void reset_curseg(struct f2fs_sb_info *sbi, int type, int modified)</div><div class='ctx'> 	struct summary_footer *sum_footer;</div><div class='ctx'> 	unsigned short seg_type = curseg-&gt;seg_type;</div><div class='ctx'> </div><div class='add'>+	/* only happen when get_new_segment() fails */</div><div class='add'>+	if (curseg-&gt;next_segno == NULL_SEGNO)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='ctx'> 	curseg-&gt;inited = true;</div><div class='ctx'> 	curseg-&gt;segno = curseg-&gt;next_segno;</div><div class='ctx'> 	curseg-&gt;zone = GET_ZONE_FROM_SEG(sbi, curseg-&gt;segno);</div><div class='hunk'>@@ -2650,12 +2950,19 @@ static unsigned int __get_next_segno(struct f2fs_sb_info *sbi, int type)</div><div class='ctx'> 	unsigned short seg_type = curseg-&gt;seg_type;</div><div class='ctx'> </div><div class='ctx'> 	sanity_check_seg_type(sbi, seg_type);</div><div class='del'>-	if (f2fs_need_rand_seg(sbi))</div><div class='del'>-		return prandom_u32() % (MAIN_SECS(sbi) * sbi-&gt;segs_per_sec);</div><div class='add'>+	if (__is_large_section(sbi)) {</div><div class='add'>+		if (f2fs_need_rand_seg(sbi)) {</div><div class='add'>+			unsigned int hint = GET_SEC_FROM_SEG(sbi, curseg-&gt;segno);</div><div class='ctx'> </div><div class='del'>-	/* if segs_per_sec is large than 1, we need to keep original policy. */</div><div class='del'>-	if (__is_large_section(sbi))</div><div class='add'>+			if (GET_SEC_FROM_SEG(sbi, curseg-&gt;segno + 1) != hint)</div><div class='add'>+				return curseg-&gt;segno;</div><div class='add'>+			return get_random_u32_inclusive(curseg-&gt;segno + 1,</div><div class='add'>+					GET_SEG_FROM_SEC(sbi, hint + 1) - 1);</div><div class='add'>+		}</div><div class='ctx'> 		return curseg-&gt;segno;</div><div class='add'>+	} else if (f2fs_need_rand_seg(sbi)) {</div><div class='add'>+		return get_random_u32_below(MAIN_SECS(sbi) * SEGS_PER_SEC(sbi));</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* inmem log may not locate on any segment after mount */</div><div class='ctx'> 	if (!curseg-&gt;inited)</div><div class='hunk'>@@ -2664,8 +2971,7 @@ static unsigned int __get_next_segno(struct f2fs_sb_info *sbi, int type)</div><div class='ctx'> 	if (unlikely(is_sbi_flag_set(sbi, SBI_CP_DISABLED)))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	if (test_opt(sbi, NOHEAP) &amp;&amp;</div><div class='del'>-		(seg_type == CURSEG_HOT_DATA || IS_NODESEG(seg_type)))</div><div class='add'>+	if (seg_type == CURSEG_HOT_DATA || IS_NODESEG(seg_type))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	if (SIT_I(sbi)-&gt;last_victim[ALLOC_NEXT])</div><div class='hunk'>@@ -2678,34 +2984,42 @@ static unsigned int __get_next_segno(struct f2fs_sb_info *sbi, int type)</div><div class='ctx'> 	return curseg-&gt;segno;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void reset_curseg_fields(struct curseg_info *curseg)</div><div class='add'>+{</div><div class='add'>+	curseg-&gt;inited = false;</div><div class='add'>+	curseg-&gt;segno = NULL_SEGNO;</div><div class='add'>+	curseg-&gt;next_segno = 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Allocate a current working segment.</div><div class='ctx'>  * This function always allocates a free segment in LFS manner.</div><div class='ctx'>  */</div><div class='del'>-static void new_curseg(struct f2fs_sb_info *sbi, int type, bool new_sec)</div><div class='add'>+static int new_curseg(struct f2fs_sb_info *sbi, int type, bool new_sec)</div><div class='ctx'> {</div><div class='ctx'> 	struct curseg_info *curseg = CURSEG_I(sbi, type);</div><div class='del'>-	unsigned short seg_type = curseg-&gt;seg_type;</div><div class='ctx'> 	unsigned int segno = curseg-&gt;segno;</div><div class='del'>-	int dir = ALLOC_LEFT;</div><div class='add'>+	bool pinning = type == CURSEG_COLD_DATA_PINNED;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (curseg-&gt;inited)</div><div class='del'>-		write_sum_page(sbi, curseg-&gt;sum_blk,</div><div class='del'>-				GET_SUM_BLOCK(sbi, segno));</div><div class='del'>-	if (seg_type == CURSEG_WARM_DATA || seg_type == CURSEG_COLD_DATA)</div><div class='del'>-		dir = ALLOC_RIGHT;</div><div class='del'>-</div><div class='del'>-	if (test_opt(sbi, NOHEAP))</div><div class='del'>-		dir = ALLOC_RIGHT;</div><div class='add'>+		write_sum_page(sbi, curseg-&gt;sum_blk, segno);</div><div class='ctx'> </div><div class='ctx'> 	segno = __get_next_segno(sbi, type);</div><div class='del'>-	get_new_segment(sbi, &amp;segno, new_sec, dir);</div><div class='add'>+	ret = get_new_segment(sbi, &amp;segno, new_sec, pinning);</div><div class='add'>+	if (ret) {</div><div class='add'>+		if (ret == -ENOSPC)</div><div class='add'>+			reset_curseg_fields(curseg);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	curseg-&gt;next_segno = segno;</div><div class='ctx'> 	reset_curseg(sbi, type, 1);</div><div class='ctx'> 	curseg-&gt;alloc_type = LFS;</div><div class='ctx'> 	if (F2FS_OPTION(sbi).fs_mode == FS_MODE_FRAGMENT_BLK)</div><div class='ctx'> 		curseg-&gt;fragment_remained_chunk =</div><div class='del'>-				prandom_u32() % sbi-&gt;max_fragment_chunk + 1;</div><div class='add'>+				get_random_u32_inclusive(1, sbi-&gt;max_fragment_chunk);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int __next_free_blkoff(struct f2fs_sb_info *sbi,</div><div class='hunk'>@@ -2721,55 +3035,34 @@ static int __next_free_blkoff(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	for (i = 0; i &lt; entries; i++)</div><div class='ctx'> 		target_map[i] = ckpt_map[i] | cur_map[i];</div><div class='ctx'> </div><div class='del'>-	return __find_rev_next_zero_bit(target_map, sbi-&gt;blocks_per_seg, start);</div><div class='add'>+	return __find_rev_next_zero_bit(target_map, BLKS_PER_SEG(sbi), start);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * If a segment is written by LFS manner, next block offset is just obtained</div><div class='del'>- * by increasing the current block offset. However, if a segment is written by</div><div class='del'>- * SSR manner, next block offset obtained by calling __next_free_blkoff</div><div class='del'>- */</div><div class='del'>-static void __refresh_next_blkoff(struct f2fs_sb_info *sbi,</div><div class='del'>-				struct curseg_info *seg)</div><div class='add'>+static int f2fs_find_next_ssr_block(struct f2fs_sb_info *sbi,</div><div class='add'>+		struct curseg_info *seg)</div><div class='ctx'> {</div><div class='del'>-	if (seg-&gt;alloc_type == SSR) {</div><div class='del'>-		seg-&gt;next_blkoff =</div><div class='del'>-			__next_free_blkoff(sbi, seg-&gt;segno,</div><div class='del'>-						seg-&gt;next_blkoff + 1);</div><div class='del'>-	} else {</div><div class='del'>-		seg-&gt;next_blkoff++;</div><div class='del'>-		if (F2FS_OPTION(sbi).fs_mode == FS_MODE_FRAGMENT_BLK) {</div><div class='del'>-			/* To allocate block chunks in different sizes, use random number */</div><div class='del'>-			if (--seg-&gt;fragment_remained_chunk &lt;= 0) {</div><div class='del'>-				seg-&gt;fragment_remained_chunk =</div><div class='del'>-				   prandom_u32() % sbi-&gt;max_fragment_chunk + 1;</div><div class='del'>-				seg-&gt;next_blkoff +=</div><div class='del'>-				   prandom_u32() % sbi-&gt;max_fragment_hole + 1;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	return __next_free_blkoff(sbi, seg-&gt;segno, seg-&gt;next_blkoff + 1);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> bool f2fs_segment_has_free_slot(struct f2fs_sb_info *sbi, int segno)</div><div class='ctx'> {</div><div class='del'>-	return __next_free_blkoff(sbi, segno, 0) &lt; sbi-&gt;blocks_per_seg;</div><div class='add'>+	return __next_free_blkoff(sbi, segno, 0) &lt; BLKS_PER_SEG(sbi);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * This function always allocates a used segment(from dirty seglist) by SSR</div><div class='ctx'>  * manner, so it should recover the existing segment information of valid blocks</div><div class='ctx'>  */</div><div class='del'>-static void change_curseg(struct f2fs_sb_info *sbi, int type, bool flush)</div><div class='add'>+static int change_curseg(struct f2fs_sb_info *sbi, int type)</div><div class='ctx'> {</div><div class='ctx'> 	struct dirty_seglist_info *dirty_i = DIRTY_I(sbi);</div><div class='ctx'> 	struct curseg_info *curseg = CURSEG_I(sbi, type);</div><div class='ctx'> 	unsigned int new_segno = curseg-&gt;next_segno;</div><div class='ctx'> 	struct f2fs_summary_block *sum_node;</div><div class='del'>-	struct page *sum_page;</div><div class='add'>+	struct folio *sum_folio;</div><div class='ctx'> </div><div class='del'>-	if (flush)</div><div class='del'>-		write_sum_page(sbi, curseg-&gt;sum_blk,</div><div class='del'>-					GET_SUM_BLOCK(sbi, curseg-&gt;segno));</div><div class='add'>+	if (curseg-&gt;inited)</div><div class='add'>+		write_sum_page(sbi, curseg-&gt;sum_blk, curseg-&gt;segno);</div><div class='ctx'> </div><div class='ctx'> 	__set_test_and_inuse(sbi, new_segno);</div><div class='ctx'> </div><div class='hunk'>@@ -2782,25 +3075,27 @@ static void change_curseg(struct f2fs_sb_info *sbi, int type, bool flush)</div><div class='ctx'> 	curseg-&gt;alloc_type = SSR;</div><div class='ctx'> 	curseg-&gt;next_blkoff = __next_free_blkoff(sbi, curseg-&gt;segno, 0);</div><div class='ctx'> </div><div class='del'>-	sum_page = f2fs_get_sum_page(sbi, new_segno);</div><div class='del'>-	if (IS_ERR(sum_page)) {</div><div class='add'>+	sum_folio = f2fs_get_sum_folio(sbi, new_segno);</div><div class='add'>+	if (IS_ERR(sum_folio)) {</div><div class='ctx'> 		/* GC won't be able to use stale summary pages by cp_error */</div><div class='ctx'> 		memset(curseg-&gt;sum_blk, 0, SUM_ENTRY_SIZE);</div><div class='del'>-		return;</div><div class='add'>+		return PTR_ERR(sum_folio);</div><div class='ctx'> 	}</div><div class='del'>-	sum_node = (struct f2fs_summary_block *)page_address(sum_page);</div><div class='add'>+	sum_node = SUM_BLK_PAGE_ADDR(sum_folio, new_segno);</div><div class='ctx'> 	memcpy(curseg-&gt;sum_blk, sum_node, SUM_ENTRY_SIZE);</div><div class='del'>-	f2fs_put_page(sum_page, 1);</div><div class='add'>+	f2fs_folio_put(sum_folio, true);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int get_ssr_segment(struct f2fs_sb_info *sbi, int type,</div><div class='ctx'> 				int alloc_mode, unsigned long long age);</div><div class='ctx'> </div><div class='del'>-static void get_atssr_segment(struct f2fs_sb_info *sbi, int type,</div><div class='add'>+static int get_atssr_segment(struct f2fs_sb_info *sbi, int type,</div><div class='ctx'> 					int target_type, int alloc_mode,</div><div class='ctx'> 					unsigned long long age)</div><div class='ctx'> {</div><div class='ctx'> 	struct curseg_info *curseg = CURSEG_I(sbi, type);</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	curseg-&gt;seg_type = target_type;</div><div class='ctx'> </div><div class='hunk'>@@ -2808,38 +3103,62 @@ static void get_atssr_segment(struct f2fs_sb_info *sbi, int type,</div><div class='ctx'> 		struct seg_entry *se = get_seg_entry(sbi, curseg-&gt;next_segno);</div><div class='ctx'> </div><div class='ctx'> 		curseg-&gt;seg_type = se-&gt;type;</div><div class='del'>-		change_curseg(sbi, type, true);</div><div class='add'>+		ret = change_curseg(sbi, type);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		/* allocate cold segment by default */</div><div class='ctx'> 		curseg-&gt;seg_type = CURSEG_COLD_DATA;</div><div class='del'>-		new_curseg(sbi, type, true);</div><div class='add'>+		ret = new_curseg(sbi, type, true);</div><div class='ctx'> 	}</div><div class='ctx'> 	stat_inc_seg_type(sbi, curseg);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void __f2fs_init_atgc_curseg(struct f2fs_sb_info *sbi)</div><div class='add'>+static int __f2fs_init_atgc_curseg(struct f2fs_sb_info *sbi, bool force)</div><div class='ctx'> {</div><div class='ctx'> 	struct curseg_info *curseg = CURSEG_I(sbi, CURSEG_ALL_DATA_ATGC);</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	if (!sbi-&gt;am.atgc_enabled)</div><div class='del'>-		return;</div><div class='add'>+	if (!sbi-&gt;am.atgc_enabled &amp;&amp; !force)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;SM_I(sbi)-&gt;curseg_lock);</div><div class='add'>+	f2fs_down_read(&amp;SM_I(sbi)-&gt;curseg_lock);</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;curseg-&gt;curseg_mutex);</div><div class='ctx'> 	down_write(&amp;SIT_I(sbi)-&gt;sentry_lock);</div><div class='ctx'> </div><div class='del'>-	get_atssr_segment(sbi, CURSEG_ALL_DATA_ATGC, CURSEG_COLD_DATA, SSR, 0);</div><div class='add'>+	ret = get_atssr_segment(sbi, CURSEG_ALL_DATA_ATGC,</div><div class='add'>+					CURSEG_COLD_DATA, SSR, 0);</div><div class='ctx'> </div><div class='ctx'> 	up_write(&amp;SIT_I(sbi)-&gt;sentry_lock);</div><div class='ctx'> 	mutex_unlock(&amp;curseg-&gt;curseg_mutex);</div><div class='ctx'> </div><div class='del'>-	up_read(&amp;SM_I(sbi)-&gt;curseg_lock);</div><div class='add'>+	f2fs_up_read(&amp;SM_I(sbi)-&gt;curseg_lock);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='ctx'> </div><div class='add'>+int f2fs_init_inmem_curseg(struct f2fs_sb_info *sbi)</div><div class='add'>+{</div><div class='add'>+	return __f2fs_init_atgc_curseg(sbi, false);</div><div class='ctx'> }</div><div class='del'>-void f2fs_init_inmem_curseg(struct f2fs_sb_info *sbi)</div><div class='add'>+</div><div class='add'>+int f2fs_reinit_atgc_curseg(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='del'>-	__f2fs_init_atgc_curseg(sbi);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (!test_opt(sbi, ATGC))</div><div class='add'>+		return 0;</div><div class='add'>+	if (sbi-&gt;am.atgc_enabled)</div><div class='add'>+		return 0;</div><div class='add'>+	if (le64_to_cpu(F2FS_CKPT(sbi)-&gt;elapsed_time) &lt;</div><div class='add'>+			sbi-&gt;am.age_threshold)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	ret = __f2fs_init_atgc_curseg(sbi, true);</div><div class='add'>+	if (!ret) {</div><div class='add'>+		sbi-&gt;am.atgc_enabled = true;</div><div class='add'>+		f2fs_info(sbi, "reenabled age threshold GC");</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void __f2fs_save_inmem_curseg(struct f2fs_sb_info *sbi, int type)</div><div class='hunk'>@@ -2851,8 +3170,7 @@ static void __f2fs_save_inmem_curseg(struct f2fs_sb_info *sbi, int type)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	if (get_valid_blocks(sbi, curseg-&gt;segno, false)) {</div><div class='del'>-		write_sum_page(sbi, curseg-&gt;sum_blk,</div><div class='del'>-				GET_SUM_BLOCK(sbi, curseg-&gt;segno));</div><div class='add'>+		write_sum_page(sbi, curseg-&gt;sum_blk, curseg-&gt;segno);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		mutex_lock(&amp;DIRTY_I(sbi)-&gt;seglist_lock);</div><div class='ctx'> 		__set_test_and_free(sbi, curseg-&gt;segno, true);</div><div class='hunk'>@@ -2899,7 +3217,6 @@ static int get_ssr_segment(struct f2fs_sb_info *sbi, int type,</div><div class='ctx'> 				int alloc_mode, unsigned long long age)</div><div class='ctx'> {</div><div class='ctx'> 	struct curseg_info *curseg = CURSEG_I(sbi, type);</div><div class='del'>-	const struct victim_selection *v_ops = DIRTY_I(sbi)-&gt;v_ops;</div><div class='ctx'> 	unsigned segno = NULL_SEGNO;</div><div class='ctx'> 	unsigned short seg_type = curseg-&gt;seg_type;</div><div class='ctx'> 	int i, cnt;</div><div class='hunk'>@@ -2908,7 +3225,8 @@ static int get_ssr_segment(struct f2fs_sb_info *sbi, int type,</div><div class='ctx'> 	sanity_check_seg_type(sbi, seg_type);</div><div class='ctx'> </div><div class='ctx'> 	/* f2fs_need_SSR() already forces to do this */</div><div class='del'>-	if (!v_ops-&gt;get_victim(sbi, &amp;segno, BG_GC, seg_type, alloc_mode, age)) {</div><div class='add'>+	if (!f2fs_get_victim(sbi, &amp;segno, BG_GC, seg_type,</div><div class='add'>+				alloc_mode, age, false)) {</div><div class='ctx'> 		curseg-&gt;next_segno = segno;</div><div class='ctx'> 		return 1;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2935,7 +3253,8 @@ static int get_ssr_segment(struct f2fs_sb_info *sbi, int type,</div><div class='ctx'> 	for (; cnt-- &gt; 0; reversed ? i-- : i++) {</div><div class='ctx'> 		if (i == seg_type)</div><div class='ctx'> 			continue;</div><div class='del'>-		if (!v_ops-&gt;get_victim(sbi, &amp;segno, BG_GC, i, alloc_mode, age)) {</div><div class='add'>+		if (!f2fs_get_victim(sbi, &amp;segno, BG_GC, i,</div><div class='add'>+					alloc_mode, age, false)) {</div><div class='ctx'> 			curseg-&gt;next_segno = segno;</div><div class='ctx'> 			return 1;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2952,40 +3271,29 @@ static int get_ssr_segment(struct f2fs_sb_info *sbi, int type,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * flush out current segment and replace it with new segment</div><div class='del'>- * This function should be returned with success, otherwise BUG</div><div class='del'>- */</div><div class='del'>-static void allocate_segment_by_default(struct f2fs_sb_info *sbi,</div><div class='del'>-						int type, bool force)</div><div class='add'>+static bool need_new_seg(struct f2fs_sb_info *sbi, int type)</div><div class='ctx'> {</div><div class='ctx'> 	struct curseg_info *curseg = CURSEG_I(sbi, type);</div><div class='ctx'> </div><div class='del'>-	if (force)</div><div class='del'>-		new_curseg(sbi, type, true);</div><div class='del'>-	else if (!is_set_ckpt_flags(sbi, CP_CRC_RECOVERY_FLAG) &amp;&amp;</div><div class='del'>-					curseg-&gt;seg_type == CURSEG_WARM_NODE)</div><div class='del'>-		new_curseg(sbi, type, false);</div><div class='del'>-	else if (curseg-&gt;alloc_type == LFS &amp;&amp;</div><div class='del'>-			is_next_segment_free(sbi, curseg, type) &amp;&amp;</div><div class='del'>-			likely(!is_sbi_flag_set(sbi, SBI_CP_DISABLED)))</div><div class='del'>-		new_curseg(sbi, type, false);</div><div class='del'>-	else if (f2fs_need_SSR(sbi) &amp;&amp;</div><div class='del'>-			get_ssr_segment(sbi, type, SSR, 0))</div><div class='del'>-		change_curseg(sbi, type, true);</div><div class='del'>-	else</div><div class='del'>-		new_curseg(sbi, type, false);</div><div class='del'>-</div><div class='del'>-	stat_inc_seg_type(sbi, curseg);</div><div class='add'>+	if (!is_set_ckpt_flags(sbi, CP_CRC_RECOVERY_FLAG) &amp;&amp;</div><div class='add'>+	    curseg-&gt;seg_type == CURSEG_WARM_NODE)</div><div class='add'>+		return true;</div><div class='add'>+	if (curseg-&gt;alloc_type == LFS &amp;&amp; is_next_segment_free(sbi, curseg) &amp;&amp;</div><div class='add'>+	    likely(!is_sbi_flag_set(sbi, SBI_CP_DISABLED)))</div><div class='add'>+		return true;</div><div class='add'>+	if (!f2fs_need_SSR(sbi) || !get_ssr_segment(sbi, type, SSR, 0))</div><div class='add'>+		return true;</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_allocate_segment_for_resize(struct f2fs_sb_info *sbi, int type,</div><div class='add'>+int f2fs_allocate_segment_for_resize(struct f2fs_sb_info *sbi, int type,</div><div class='ctx'> 					unsigned int start, unsigned int end)</div><div class='ctx'> {</div><div class='ctx'> 	struct curseg_info *curseg = CURSEG_I(sbi, type);</div><div class='ctx'> 	unsigned int segno;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;SM_I(sbi)-&gt;curseg_lock);</div><div class='add'>+	f2fs_down_read(&amp;SM_I(sbi)-&gt;curseg_lock);</div><div class='ctx'> 	mutex_lock(&amp;curseg-&gt;curseg_mutex);</div><div class='ctx'> 	down_write(&amp;SIT_I(sbi)-&gt;sentry_lock);</div><div class='ctx'> </div><div class='hunk'>@@ -2994,9 +3302,9 @@ void f2fs_allocate_segment_for_resize(struct f2fs_sb_info *sbi, int type,</div><div class='ctx'> 		goto unlock;</div><div class='ctx'> </div><div class='ctx'> 	if (f2fs_need_SSR(sbi) &amp;&amp; get_ssr_segment(sbi, type, SSR, 0))</div><div class='del'>-		change_curseg(sbi, type, true);</div><div class='add'>+		ret = change_curseg(sbi, type);</div><div class='ctx'> 	else</div><div class='del'>-		new_curseg(sbi, type, true);</div><div class='add'>+		ret = new_curseg(sbi, type, true);</div><div class='ctx'> </div><div class='ctx'> 	stat_inc_seg_type(sbi, curseg);</div><div class='ctx'> </div><div class='hunk'>@@ -3009,60 +3317,87 @@ unlock:</div><div class='ctx'> 			    type, segno, curseg-&gt;segno);</div><div class='ctx'> </div><div class='ctx'> 	mutex_unlock(&amp;curseg-&gt;curseg_mutex);</div><div class='del'>-	up_read(&amp;SM_I(sbi)-&gt;curseg_lock);</div><div class='add'>+	f2fs_up_read(&amp;SM_I(sbi)-&gt;curseg_lock);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void __allocate_new_segment(struct f2fs_sb_info *sbi, int type,</div><div class='add'>+static int __allocate_new_segment(struct f2fs_sb_info *sbi, int type,</div><div class='ctx'> 						bool new_sec, bool force)</div><div class='ctx'> {</div><div class='ctx'> 	struct curseg_info *curseg = CURSEG_I(sbi, type);</div><div class='ctx'> 	unsigned int old_segno;</div><div class='add'>+	int err = 0;</div><div class='ctx'> </div><div class='del'>-	if (!curseg-&gt;inited)</div><div class='del'>-		goto alloc;</div><div class='add'>+	if (type == CURSEG_COLD_DATA_PINNED &amp;&amp; !curseg-&gt;inited)</div><div class='add'>+		goto allocate;</div><div class='ctx'> </div><div class='del'>-	if (force || curseg-&gt;next_blkoff ||</div><div class='del'>-		get_valid_blocks(sbi, curseg-&gt;segno, new_sec))</div><div class='del'>-		goto alloc;</div><div class='add'>+	if (!force &amp;&amp; curseg-&gt;inited &amp;&amp;</div><div class='add'>+	    !curseg-&gt;next_blkoff &amp;&amp;</div><div class='add'>+	    !get_valid_blocks(sbi, curseg-&gt;segno, new_sec) &amp;&amp;</div><div class='add'>+	    !get_ckpt_valid_blocks(sbi, curseg-&gt;segno, new_sec))</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	if (!get_ckpt_valid_blocks(sbi, curseg-&gt;segno, new_sec))</div><div class='del'>-		return;</div><div class='del'>-alloc:</div><div class='add'>+allocate:</div><div class='ctx'> 	old_segno = curseg-&gt;segno;</div><div class='del'>-	SIT_I(sbi)-&gt;s_ops-&gt;allocate_segment(sbi, type, true);</div><div class='add'>+	err = new_curseg(sbi, type, true);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+	stat_inc_seg_type(sbi, curseg);</div><div class='ctx'> 	locate_dirty_segment(sbi, old_segno);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void __allocate_new_section(struct f2fs_sb_info *sbi,</div><div class='del'>-						int type, bool force)</div><div class='add'>+int f2fs_allocate_new_section(struct f2fs_sb_info *sbi, int type, bool force)</div><div class='ctx'> {</div><div class='del'>-	__allocate_new_segment(sbi, type, true, force);</div><div class='del'>-}</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-void f2fs_allocate_new_section(struct f2fs_sb_info *sbi, int type, bool force)</div><div class='del'>-{</div><div class='del'>-	down_read(&amp;SM_I(sbi)-&gt;curseg_lock);</div><div class='add'>+	f2fs_down_read(&amp;SM_I(sbi)-&gt;curseg_lock);</div><div class='ctx'> 	down_write(&amp;SIT_I(sbi)-&gt;sentry_lock);</div><div class='del'>-	__allocate_new_section(sbi, type, force);</div><div class='add'>+	ret = __allocate_new_segment(sbi, type, true, force);</div><div class='ctx'> 	up_write(&amp;SIT_I(sbi)-&gt;sentry_lock);</div><div class='del'>-	up_read(&amp;SM_I(sbi)-&gt;curseg_lock);</div><div class='add'>+	f2fs_up_read(&amp;SM_I(sbi)-&gt;curseg_lock);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int f2fs_allocate_pinning_section(struct f2fs_sb_info *sbi)</div><div class='add'>+{</div><div class='add'>+	int err;</div><div class='add'>+	bool gc_required = true;</div><div class='add'>+</div><div class='add'>+retry:</div><div class='add'>+	f2fs_lock_op(sbi);</div><div class='add'>+	err = f2fs_allocate_new_section(sbi, CURSEG_COLD_DATA_PINNED, false);</div><div class='add'>+	f2fs_unlock_op(sbi);</div><div class='add'>+</div><div class='add'>+	if (f2fs_sb_has_blkzoned(sbi) &amp;&amp; err == -EAGAIN &amp;&amp; gc_required) {</div><div class='add'>+		f2fs_down_write(&amp;sbi-&gt;gc_lock);</div><div class='add'>+		err = f2fs_gc_range(sbi, 0, sbi-&gt;first_seq_zone_segno - 1,</div><div class='add'>+				true, ZONED_PIN_SEC_REQUIRED_COUNT);</div><div class='add'>+		f2fs_up_write(&amp;sbi-&gt;gc_lock);</div><div class='add'>+</div><div class='add'>+		gc_required = false;</div><div class='add'>+		if (!err)</div><div class='add'>+			goto retry;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_allocate_new_segments(struct f2fs_sb_info *sbi)</div><div class='add'>+int f2fs_allocate_new_segments(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	int i;</div><div class='add'>+	int err = 0;</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;SM_I(sbi)-&gt;curseg_lock);</div><div class='add'>+	f2fs_down_read(&amp;SM_I(sbi)-&gt;curseg_lock);</div><div class='ctx'> 	down_write(&amp;SIT_I(sbi)-&gt;sentry_lock);</div><div class='ctx'> 	for (i = CURSEG_HOT_DATA; i &lt;= CURSEG_COLD_DATA; i++)</div><div class='del'>-		__allocate_new_segment(sbi, i, false, false);</div><div class='add'>+		err += __allocate_new_segment(sbi, i, false, false);</div><div class='ctx'> 	up_write(&amp;SIT_I(sbi)-&gt;sentry_lock);</div><div class='del'>-	up_read(&amp;SM_I(sbi)-&gt;curseg_lock);</div><div class='del'>-}</div><div class='add'>+	f2fs_up_read(&amp;SM_I(sbi)-&gt;curseg_lock);</div><div class='ctx'> </div><div class='del'>-static const struct segment_allocation default_salloc_ops = {</div><div class='del'>-	.allocate_segment = allocate_segment_by_default,</div><div class='del'>-};</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> bool f2fs_exist_trim_candidates(struct f2fs_sb_info *sbi,</div><div class='ctx'> 						struct cp_control *cpc)</div><div class='hunk'>@@ -3100,24 +3435,20 @@ next:</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;dcc-&gt;cmd_lock);</div><div class='ctx'> 	if (unlikely(dcc-&gt;rbtree_check))</div><div class='del'>-		f2fs_bug_on(sbi, !f2fs_check_rb_tree_consistence(sbi,</div><div class='del'>-							&amp;dcc-&gt;root, false));</div><div class='del'>-</div><div class='del'>-	dc = (struct discard_cmd *)f2fs_lookup_rb_tree_ret(&amp;dcc-&gt;root,</div><div class='del'>-					NULL, start,</div><div class='del'>-					(struct rb_entry **)&amp;prev_dc,</div><div class='del'>-					(struct rb_entry **)&amp;next_dc,</div><div class='del'>-					&amp;insert_p, &amp;insert_parent, true, NULL);</div><div class='add'>+		f2fs_bug_on(sbi, !f2fs_check_discard_tree(sbi));</div><div class='add'>+</div><div class='add'>+	dc = __lookup_discard_cmd_ret(&amp;dcc-&gt;root, start,</div><div class='add'>+				&amp;prev_dc, &amp;next_dc, &amp;insert_p, &amp;insert_parent);</div><div class='ctx'> 	if (!dc)</div><div class='ctx'> 		dc = next_dc;</div><div class='ctx'> </div><div class='ctx'> 	blk_start_plug(&amp;plug);</div><div class='ctx'> </div><div class='del'>-	while (dc &amp;&amp; dc-&gt;lstart &lt;= end) {</div><div class='add'>+	while (dc &amp;&amp; dc-&gt;di.lstart &lt;= end) {</div><div class='ctx'> 		struct rb_node *node;</div><div class='ctx'> 		int err = 0;</div><div class='ctx'> </div><div class='del'>-		if (dc-&gt;len &lt; dpolicy-&gt;granularity)</div><div class='add'>+		if (dc-&gt;di.len &lt; dpolicy-&gt;granularity)</div><div class='ctx'> 			goto skip;</div><div class='ctx'> </div><div class='ctx'> 		if (dc-&gt;state != D_PREP) {</div><div class='hunk'>@@ -3128,7 +3459,7 @@ next:</div><div class='ctx'> 		err = __submit_discard_cmd(sbi, dpolicy, dc, &amp;issued);</div><div class='ctx'> </div><div class='ctx'> 		if (issued &gt;= dpolicy-&gt;max_requests) {</div><div class='del'>-			start = dc-&gt;lstart + dc-&gt;len;</div><div class='add'>+			start = dc-&gt;di.lstart + dc-&gt;di.len;</div><div class='ctx'> </div><div class='ctx'> 			if (err)</div><div class='ctx'> 				__remove_discard_cmd(sbi, dc);</div><div class='hunk'>@@ -3136,7 +3467,7 @@ next:</div><div class='ctx'> 			blk_finish_plug(&amp;plug);</div><div class='ctx'> 			mutex_unlock(&amp;dcc-&gt;cmd_lock);</div><div class='ctx'> 			trimmed += __wait_all_discard_cmd(sbi, NULL);</div><div class='del'>-			congestion_wait(BLK_RW_ASYNC, DEFAULT_IO_TIMEOUT);</div><div class='add'>+			f2fs_schedule_timeout(DEFAULT_DISCARD_INTERVAL);</div><div class='ctx'> 			goto next;</div><div class='ctx'> 		}</div><div class='ctx'> skip:</div><div class='hunk'>@@ -3183,8 +3514,8 @@ int f2fs_trim_fs(struct f2fs_sb_info *sbi, struct fstrim_range *range)</div><div class='ctx'> 	end_segno = (end &gt;= MAX_BLKADDR(sbi)) ? MAIN_SEGS(sbi) - 1 :</div><div class='ctx'> 						GET_SEGNO(sbi, end);</div><div class='ctx'> 	if (need_align) {</div><div class='del'>-		start_segno = rounddown(start_segno, sbi-&gt;segs_per_sec);</div><div class='del'>-		end_segno = roundup(end_segno + 1, sbi-&gt;segs_per_sec) - 1;</div><div class='add'>+		start_segno = rounddown(start_segno, SEGS_PER_SEC(sbi));</div><div class='add'>+		end_segno = roundup(end_segno + 1, SEGS_PER_SEC(sbi)) - 1;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	cpc.reason = CP_DISCARD;</div><div class='hunk'>@@ -3195,9 +3526,10 @@ int f2fs_trim_fs(struct f2fs_sb_info *sbi, struct fstrim_range *range)</div><div class='ctx'> 	if (sbi-&gt;discard_blks == 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;sbi-&gt;gc_lock);</div><div class='add'>+	f2fs_down_write(&amp;sbi-&gt;gc_lock);</div><div class='add'>+	stat_inc_cp_call_count(sbi, TOTAL_CALL);</div><div class='ctx'> 	err = f2fs_write_checkpoint(sbi, &amp;cpc);</div><div class='del'>-	up_write(&amp;sbi-&gt;gc_lock);</div><div class='add'>+	f2fs_up_write(&amp;sbi-&gt;gc_lock);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -3225,15 +3557,14 @@ out:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool __has_curseg_space(struct f2fs_sb_info *sbi,</div><div class='del'>-					struct curseg_info *curseg)</div><div class='add'>+int f2fs_rw_hint_to_seg_type(struct f2fs_sb_info *sbi, enum rw_hint hint)</div><div class='ctx'> {</div><div class='del'>-	return curseg-&gt;next_blkoff &lt; f2fs_usable_blks_in_seg(sbi,</div><div class='del'>-							curseg-&gt;segno);</div><div class='del'>-}</div><div class='add'>+	if (F2FS_OPTION(sbi).active_logs == 2)</div><div class='add'>+		return CURSEG_HOT_DATA;</div><div class='add'>+	else if (F2FS_OPTION(sbi).active_logs == 4)</div><div class='add'>+		return CURSEG_COLD_DATA;</div><div class='ctx'> </div><div class='del'>-int f2fs_rw_hint_to_seg_type(enum rw_hint hint)</div><div class='del'>-{</div><div class='add'>+	/* active_log == 6 */</div><div class='ctx'> 	switch (hint) {</div><div class='ctx'> 	case WRITE_LIFE_SHORT:</div><div class='ctx'> 		return CURSEG_HOT_DATA;</div><div class='hunk'>@@ -3244,57 +3575,23 @@ int f2fs_rw_hint_to_seg_type(enum rw_hint hint)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* This returns write hints for each segment type. This hints will be</div><div class='del'>- * passed down to block layer. There are mapping tables which depend on</div><div class='del'>- * the mount option 'whint_mode'.</div><div class='del'>- *</div><div class='del'>- * 1) whint_mode=off. F2FS only passes down WRITE_LIFE_NOT_SET.</div><div class='del'>- *</div><div class='del'>- * 2) whint_mode=user-based. F2FS tries to pass down hints given by users.</div><div class='del'>- *</div><div class='del'>- * User                  F2FS                     Block</div><div class='del'>- * ----                  ----                     -----</div><div class='del'>- *                       META                     WRITE_LIFE_NOT_SET</div><div class='del'>- *                       HOT_NODE                 "</div><div class='del'>- *                       WARM_NODE                "</div><div class='del'>- *                       COLD_NODE                "</div><div class='del'>- * ioctl(COLD)           COLD_DATA                WRITE_LIFE_EXTREME</div><div class='del'>- * extension list        "                        "</div><div class='del'>- *</div><div class='del'>- * -- buffered io</div><div class='del'>- * WRITE_LIFE_EXTREME    COLD_DATA                WRITE_LIFE_EXTREME</div><div class='del'>- * WRITE_LIFE_SHORT      HOT_DATA                 WRITE_LIFE_SHORT</div><div class='del'>- * WRITE_LIFE_NOT_SET    WARM_DATA                WRITE_LIFE_NOT_SET</div><div class='del'>- * WRITE_LIFE_NONE       "                        "</div><div class='del'>- * WRITE_LIFE_MEDIUM     "                        "</div><div class='del'>- * WRITE_LIFE_LONG       "                        "</div><div class='del'>- *</div><div class='del'>- * -- direct io</div><div class='del'>- * WRITE_LIFE_EXTREME    COLD_DATA                WRITE_LIFE_EXTREME</div><div class='del'>- * WRITE_LIFE_SHORT      HOT_DATA                 WRITE_LIFE_SHORT</div><div class='del'>- * WRITE_LIFE_NOT_SET    WARM_DATA                WRITE_LIFE_NOT_SET</div><div class='del'>- * WRITE_LIFE_NONE       "                        WRITE_LIFE_NONE</div><div class='del'>- * WRITE_LIFE_MEDIUM     "                        WRITE_LIFE_MEDIUM</div><div class='del'>- * WRITE_LIFE_LONG       "                        WRITE_LIFE_LONG</div><div class='del'>- *</div><div class='del'>- * 3) whint_mode=fs-based. F2FS passes down hints with its policy.</div><div class='add'>+/*</div><div class='add'>+ * This returns write hints for each segment type. This hints will be</div><div class='add'>+ * passed down to block layer as below by default.</div><div class='ctx'>  *</div><div class='ctx'>  * User                  F2FS                     Block</div><div class='ctx'>  * ----                  ----                     -----</div><div class='del'>- *                       META                     WRITE_LIFE_MEDIUM;</div><div class='del'>- *                       HOT_NODE                 WRITE_LIFE_NOT_SET</div><div class='del'>- *                       WARM_NODE                "</div><div class='del'>- *                       COLD_NODE                WRITE_LIFE_NONE</div><div class='add'>+ *                       META                     WRITE_LIFE_NONE|REQ_META</div><div class='add'>+ *                       HOT_NODE                 WRITE_LIFE_NONE</div><div class='add'>+ *                       WARM_NODE                WRITE_LIFE_MEDIUM</div><div class='add'>+ *                       COLD_NODE                WRITE_LIFE_LONG</div><div class='ctx'>  * ioctl(COLD)           COLD_DATA                WRITE_LIFE_EXTREME</div><div class='ctx'>  * extension list        "                        "</div><div class='ctx'>  *</div><div class='ctx'>  * -- buffered io</div><div class='del'>- * WRITE_LIFE_EXTREME    COLD_DATA                WRITE_LIFE_EXTREME</div><div class='del'>- * WRITE_LIFE_SHORT      HOT_DATA                 WRITE_LIFE_SHORT</div><div class='del'>- * WRITE_LIFE_NOT_SET    WARM_DATA                WRITE_LIFE_LONG</div><div class='del'>- * WRITE_LIFE_NONE       "                        "</div><div class='del'>- * WRITE_LIFE_MEDIUM     "                        "</div><div class='del'>- * WRITE_LIFE_LONG       "                        "</div><div class='add'>+ *                       COLD_DATA                WRITE_LIFE_EXTREME</div><div class='add'>+ *                       HOT_DATA                 WRITE_LIFE_SHORT</div><div class='add'>+ *                       WARM_DATA                WRITE_LIFE_NOT_SET</div><div class='ctx'>  *</div><div class='ctx'>  * -- direct io</div><div class='ctx'>  * WRITE_LIFE_EXTREME    COLD_DATA                WRITE_LIFE_EXTREME</div><div class='hunk'>@@ -3304,39 +3601,37 @@ int f2fs_rw_hint_to_seg_type(enum rw_hint hint)</div><div class='ctx'>  * WRITE_LIFE_MEDIUM     "                        WRITE_LIFE_MEDIUM</div><div class='ctx'>  * WRITE_LIFE_LONG       "                        WRITE_LIFE_LONG</div><div class='ctx'>  */</div><div class='del'>-</div><div class='ctx'> enum rw_hint f2fs_io_type_to_rw_hint(struct f2fs_sb_info *sbi,</div><div class='ctx'> 				enum page_type type, enum temp_type temp)</div><div class='ctx'> {</div><div class='del'>-	if (F2FS_OPTION(sbi).whint_mode == WHINT_MODE_USER) {</div><div class='del'>-		if (type == DATA) {</div><div class='del'>-			if (temp == WARM)</div><div class='del'>-				return WRITE_LIFE_NOT_SET;</div><div class='del'>-			else if (temp == HOT)</div><div class='del'>-				return WRITE_LIFE_SHORT;</div><div class='del'>-			else if (temp == COLD)</div><div class='del'>-				return WRITE_LIFE_EXTREME;</div><div class='del'>-		} else {</div><div class='add'>+	switch (type) {</div><div class='add'>+	case DATA:</div><div class='add'>+		switch (temp) {</div><div class='add'>+		case WARM:</div><div class='ctx'> 			return WRITE_LIFE_NOT_SET;</div><div class='add'>+		case HOT:</div><div class='add'>+			return WRITE_LIFE_SHORT;</div><div class='add'>+		case COLD:</div><div class='add'>+			return WRITE_LIFE_EXTREME;</div><div class='add'>+		default:</div><div class='add'>+			return WRITE_LIFE_NONE;</div><div class='ctx'> 		}</div><div class='del'>-	} else if (F2FS_OPTION(sbi).whint_mode == WHINT_MODE_FS) {</div><div class='del'>-		if (type == DATA) {</div><div class='del'>-			if (temp == WARM)</div><div class='del'>-				return WRITE_LIFE_LONG;</div><div class='del'>-			else if (temp == HOT)</div><div class='del'>-				return WRITE_LIFE_SHORT;</div><div class='del'>-			else if (temp == COLD)</div><div class='del'>-				return WRITE_LIFE_EXTREME;</div><div class='del'>-		} else if (type == NODE) {</div><div class='del'>-			if (temp == WARM || temp == HOT)</div><div class='del'>-				return WRITE_LIFE_NOT_SET;</div><div class='del'>-			else if (temp == COLD)</div><div class='del'>-				return WRITE_LIFE_NONE;</div><div class='del'>-		} else if (type == META) {</div><div class='add'>+	case NODE:</div><div class='add'>+		switch (temp) {</div><div class='add'>+		case WARM:</div><div class='ctx'> 			return WRITE_LIFE_MEDIUM;</div><div class='add'>+		case HOT:</div><div class='add'>+			return WRITE_LIFE_NONE;</div><div class='add'>+		case COLD:</div><div class='add'>+			return WRITE_LIFE_LONG;</div><div class='add'>+		default:</div><div class='add'>+			return WRITE_LIFE_NONE;</div><div class='ctx'> 		}</div><div class='add'>+	case META:</div><div class='add'>+		return WRITE_LIFE_NONE;</div><div class='add'>+	default:</div><div class='add'>+		return WRITE_LIFE_NONE;</div><div class='ctx'> 	}</div><div class='del'>-	return WRITE_LIFE_NOT_SET;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int __get_segment_type_2(struct f2fs_io_info *fio)</div><div class='hunk'>@@ -3350,24 +3645,42 @@ static int __get_segment_type_2(struct f2fs_io_info *fio)</div><div class='ctx'> static int __get_segment_type_4(struct f2fs_io_info *fio)</div><div class='ctx'> {</div><div class='ctx'> 	if (fio-&gt;type == DATA) {</div><div class='del'>-		struct inode *inode = fio-&gt;page-&gt;mapping-&gt;host;</div><div class='add'>+		struct inode *inode = fio_inode(fio);</div><div class='ctx'> </div><div class='ctx'> 		if (S_ISDIR(inode-&gt;i_mode))</div><div class='ctx'> 			return CURSEG_HOT_DATA;</div><div class='ctx'> 		else</div><div class='ctx'> 			return CURSEG_COLD_DATA;</div><div class='ctx'> 	} else {</div><div class='del'>-		if (IS_DNODE(fio-&gt;page) &amp;&amp; is_cold_node(fio-&gt;page))</div><div class='add'>+		if (IS_DNODE(fio-&gt;folio) &amp;&amp; is_cold_node(fio-&gt;folio))</div><div class='ctx'> 			return CURSEG_WARM_NODE;</div><div class='ctx'> 		else</div><div class='ctx'> 			return CURSEG_COLD_NODE;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int __get_age_segment_type(struct inode *inode, pgoff_t pgofs)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='add'>+	struct extent_info ei = {};</div><div class='add'>+</div><div class='add'>+	if (f2fs_lookup_age_extent_cache(inode, pgofs, &amp;ei)) {</div><div class='add'>+		if (!ei.age)</div><div class='add'>+			return NO_CHECK_TYPE;</div><div class='add'>+		if (ei.age &lt;= sbi-&gt;hot_data_age_threshold)</div><div class='add'>+			return CURSEG_HOT_DATA;</div><div class='add'>+		if (ei.age &lt;= sbi-&gt;warm_data_age_threshold)</div><div class='add'>+			return CURSEG_WARM_DATA;</div><div class='add'>+		return CURSEG_COLD_DATA;</div><div class='add'>+	}</div><div class='add'>+	return NO_CHECK_TYPE;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int __get_segment_type_6(struct f2fs_io_info *fio)</div><div class='ctx'> {</div><div class='ctx'> 	if (fio-&gt;type == DATA) {</div><div class='del'>-		struct inode *inode = fio-&gt;page-&gt;mapping-&gt;host;</div><div class='add'>+		struct inode *inode = fio_inode(fio);</div><div class='add'>+		int type;</div><div class='ctx'> </div><div class='ctx'> 		if (is_inode_flag_set(inode, FI_ALIGNED_WRITE))</div><div class='ctx'> 			return CURSEG_COLD_DATA_PINNED;</div><div class='hunk'>@@ -3375,30 +3688,64 @@ static int __get_segment_type_6(struct f2fs_io_info *fio)</div><div class='ctx'> 		if (page_private_gcing(fio-&gt;page)) {</div><div class='ctx'> 			if (fio-&gt;sbi-&gt;am.atgc_enabled &amp;&amp;</div><div class='ctx'> 				(fio-&gt;io_type == FS_DATA_IO) &amp;&amp;</div><div class='del'>-				(fio-&gt;sbi-&gt;gc_mode != GC_URGENT_HIGH))</div><div class='add'>+				(fio-&gt;sbi-&gt;gc_mode != GC_URGENT_HIGH) &amp;&amp;</div><div class='add'>+				__is_valid_data_blkaddr(fio-&gt;old_blkaddr) &amp;&amp;</div><div class='add'>+				!is_inode_flag_set(inode, FI_OPU_WRITE))</div><div class='ctx'> 				return CURSEG_ALL_DATA_ATGC;</div><div class='ctx'> 			else</div><div class='ctx'> 				return CURSEG_COLD_DATA;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (file_is_cold(inode) || f2fs_need_compress_data(inode))</div><div class='ctx'> 			return CURSEG_COLD_DATA;</div><div class='add'>+</div><div class='add'>+		type = __get_age_segment_type(inode, fio-&gt;folio-&gt;index);</div><div class='add'>+		if (type != NO_CHECK_TYPE)</div><div class='add'>+			return type;</div><div class='add'>+</div><div class='ctx'> 		if (file_is_hot(inode) ||</div><div class='ctx'> 				is_inode_flag_set(inode, FI_HOT_DATA) ||</div><div class='del'>-				f2fs_is_atomic_file(inode) ||</div><div class='del'>-				f2fs_is_volatile_file(inode))</div><div class='add'>+				f2fs_is_cow_file(inode) ||</div><div class='add'>+				is_inode_flag_set(inode, FI_NEED_IPU))</div><div class='ctx'> 			return CURSEG_HOT_DATA;</div><div class='del'>-		return f2fs_rw_hint_to_seg_type(inode-&gt;i_write_hint);</div><div class='add'>+		return f2fs_rw_hint_to_seg_type(F2FS_I_SB(inode),</div><div class='add'>+						inode-&gt;i_write_hint);</div><div class='ctx'> 	} else {</div><div class='del'>-		if (IS_DNODE(fio-&gt;page))</div><div class='del'>-			return is_cold_node(fio-&gt;page) ? CURSEG_WARM_NODE :</div><div class='add'>+		if (IS_DNODE(fio-&gt;folio))</div><div class='add'>+			return is_cold_node(fio-&gt;folio) ? CURSEG_WARM_NODE :</div><div class='ctx'> 						CURSEG_HOT_NODE;</div><div class='ctx'> 		return CURSEG_COLD_NODE;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+enum temp_type f2fs_get_segment_temp(struct f2fs_sb_info *sbi,</div><div class='add'>+						enum log_type type)</div><div class='add'>+{</div><div class='add'>+	struct curseg_info *curseg = CURSEG_I(sbi, type);</div><div class='add'>+	enum temp_type temp = COLD;</div><div class='add'>+</div><div class='add'>+	switch (curseg-&gt;seg_type) {</div><div class='add'>+	case CURSEG_HOT_NODE:</div><div class='add'>+	case CURSEG_HOT_DATA:</div><div class='add'>+		temp = HOT;</div><div class='add'>+		break;</div><div class='add'>+	case CURSEG_WARM_NODE:</div><div class='add'>+	case CURSEG_WARM_DATA:</div><div class='add'>+		temp = WARM;</div><div class='add'>+		break;</div><div class='add'>+	case CURSEG_COLD_NODE:</div><div class='add'>+	case CURSEG_COLD_DATA:</div><div class='add'>+		temp = COLD;</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		f2fs_bug_on(sbi, 1);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return temp;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int __get_segment_type(struct f2fs_io_info *fio)</div><div class='ctx'> {</div><div class='del'>-	int type = 0;</div><div class='add'>+	enum log_type type = CURSEG_HOT_DATA;</div><div class='ctx'> </div><div class='ctx'> 	switch (F2FS_OPTION(fio-&gt;sbi).active_logs) {</div><div class='ctx'> 	case 2:</div><div class='hunk'>@@ -3414,16 +3761,25 @@ static int __get_segment_type(struct f2fs_io_info *fio)</div><div class='ctx'> 		f2fs_bug_on(fio-&gt;sbi, true);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (IS_HOT(type))</div><div class='del'>-		fio-&gt;temp = HOT;</div><div class='del'>-	else if (IS_WARM(type))</div><div class='del'>-		fio-&gt;temp = WARM;</div><div class='del'>-	else</div><div class='del'>-		fio-&gt;temp = COLD;</div><div class='add'>+	fio-&gt;temp = f2fs_get_segment_temp(fio-&gt;sbi, type);</div><div class='add'>+</div><div class='ctx'> 	return type;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_allocate_data_block(struct f2fs_sb_info *sbi, struct page *page,</div><div class='add'>+static void f2fs_randomize_chunk(struct f2fs_sb_info *sbi,</div><div class='add'>+		struct curseg_info *seg)</div><div class='add'>+{</div><div class='add'>+	/* To allocate block chunks in different sizes, use random number */</div><div class='add'>+	if (--seg-&gt;fragment_remained_chunk &gt; 0)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	seg-&gt;fragment_remained_chunk =</div><div class='add'>+		get_random_u32_inclusive(1, sbi-&gt;max_fragment_chunk);</div><div class='add'>+	seg-&gt;next_blkoff +=</div><div class='add'>+		get_random_u32_inclusive(1, sbi-&gt;max_fragment_hole);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int f2fs_allocate_data_block(struct f2fs_sb_info *sbi, struct folio *folio,</div><div class='ctx'> 		block_t old_blkaddr, block_t *new_blkaddr,</div><div class='ctx'> 		struct f2fs_summary *sum, int type,</div><div class='ctx'> 		struct f2fs_io_info *fio)</div><div class='hunk'>@@ -3433,12 +3789,19 @@ void f2fs_allocate_data_block(struct f2fs_sb_info *sbi, struct page *page,</div><div class='ctx'> 	unsigned long long old_mtime;</div><div class='ctx'> 	bool from_gc = (type == CURSEG_ALL_DATA_ATGC);</div><div class='ctx'> 	struct seg_entry *se = NULL;</div><div class='add'>+	bool segment_full = false;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;SM_I(sbi)-&gt;curseg_lock);</div><div class='add'>+	f2fs_down_read(&amp;SM_I(sbi)-&gt;curseg_lock);</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;curseg-&gt;curseg_mutex);</div><div class='ctx'> 	down_write(&amp;sit_i-&gt;sentry_lock);</div><div class='ctx'> </div><div class='add'>+	if (curseg-&gt;segno == NULL_SEGNO) {</div><div class='add'>+		ret = -ENOSPC;</div><div class='add'>+		goto out_err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (from_gc) {</div><div class='ctx'> 		f2fs_bug_on(sbi, GET_SEGNO(sbi, old_blkaddr) == NULL_SEGNO);</div><div class='ctx'> 		se = get_seg_entry(sbi, GET_SEGNO(sbi, old_blkaddr));</div><div class='hunk'>@@ -3447,19 +3810,20 @@ void f2fs_allocate_data_block(struct f2fs_sb_info *sbi, struct page *page,</div><div class='ctx'> 	}</div><div class='ctx'> 	*new_blkaddr = NEXT_FREE_BLKADDR(sbi, curseg);</div><div class='ctx'> </div><div class='del'>-	f2fs_bug_on(sbi, curseg-&gt;next_blkoff &gt;= sbi-&gt;blocks_per_seg);</div><div class='add'>+	f2fs_bug_on(sbi, curseg-&gt;next_blkoff &gt;= BLKS_PER_SEG(sbi));</div><div class='ctx'> </div><div class='ctx'> 	f2fs_wait_discard_bio(sbi, *new_blkaddr);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * __add_sum_entry should be resided under the curseg_mutex</div><div class='del'>-	 * because, this function updates a summary entry in the</div><div class='del'>-	 * current summary block.</div><div class='del'>-	 */</div><div class='del'>-	__add_sum_entry(sbi, type, sum);</div><div class='del'>-</div><div class='del'>-	__refresh_next_blkoff(sbi, curseg);</div><div class='del'>-</div><div class='add'>+	curseg-&gt;sum_blk-&gt;entries[curseg-&gt;next_blkoff] = *sum;</div><div class='add'>+	if (curseg-&gt;alloc_type == SSR) {</div><div class='add'>+		curseg-&gt;next_blkoff = f2fs_find_next_ssr_block(sbi, curseg);</div><div class='add'>+	} else {</div><div class='add'>+		curseg-&gt;next_blkoff++;</div><div class='add'>+		if (F2FS_OPTION(sbi).fs_mode == FS_MODE_FRAGMENT_BLK)</div><div class='add'>+			f2fs_randomize_chunk(sbi, curseg);</div><div class='add'>+	}</div><div class='add'>+	if (curseg-&gt;next_blkoff &gt;= f2fs_usable_blks_in_seg(sbi, curseg-&gt;segno))</div><div class='add'>+		segment_full = true;</div><div class='ctx'> 	stat_inc_block_count(sbi, curseg);</div><div class='ctx'> </div><div class='ctx'> 	if (from_gc) {</div><div class='hunk'>@@ -3475,16 +3839,36 @@ void f2fs_allocate_data_block(struct f2fs_sb_info *sbi, struct page *page,</div><div class='ctx'> 	 * since SSR needs latest valid block information.</div><div class='ctx'> 	 */</div><div class='ctx'> 	update_sit_entry(sbi, *new_blkaddr, 1);</div><div class='del'>-	if (GET_SEGNO(sbi, old_blkaddr) != NULL_SEGNO)</div><div class='del'>-		update_sit_entry(sbi, old_blkaddr, -1);</div><div class='add'>+	update_sit_entry(sbi, old_blkaddr, -1);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If the current segment is full, flush it out and replace it with a</div><div class='add'>+	 * new segment.</div><div class='add'>+	 */</div><div class='add'>+	if (segment_full) {</div><div class='add'>+		if (type == CURSEG_COLD_DATA_PINNED &amp;&amp;</div><div class='add'>+		    !((curseg-&gt;segno + 1) % sbi-&gt;segs_per_sec)) {</div><div class='add'>+			write_sum_page(sbi, curseg-&gt;sum_blk, curseg-&gt;segno);</div><div class='add'>+			reset_curseg_fields(curseg);</div><div class='add'>+			goto skip_new_segment;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	if (!__has_curseg_space(sbi, curseg)) {</div><div class='del'>-		if (from_gc)</div><div class='del'>-			get_atssr_segment(sbi, type, se-&gt;type,</div><div class='add'>+		if (from_gc) {</div><div class='add'>+			ret = get_atssr_segment(sbi, type, se-&gt;type,</div><div class='ctx'> 						AT_SSR, se-&gt;mtime);</div><div class='del'>-		else</div><div class='del'>-			sit_i-&gt;s_ops-&gt;allocate_segment(sbi, type, false);</div><div class='add'>+		} else {</div><div class='add'>+			if (need_new_seg(sbi, type))</div><div class='add'>+				ret = new_curseg(sbi, type, false);</div><div class='add'>+			else</div><div class='add'>+				ret = change_curseg(sbi, type);</div><div class='add'>+			stat_inc_seg_type(sbi, curseg);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out_err;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+skip_new_segment:</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * segment dirty status should be updated after segment allocation,</div><div class='ctx'> 	 * so we just need to update status only one time after previous</div><div class='hunk'>@@ -3493,22 +3877,27 @@ void f2fs_allocate_data_block(struct f2fs_sb_info *sbi, struct page *page,</div><div class='ctx'> 	locate_dirty_segment(sbi, GET_SEGNO(sbi, old_blkaddr));</div><div class='ctx'> 	locate_dirty_segment(sbi, GET_SEGNO(sbi, *new_blkaddr));</div><div class='ctx'> </div><div class='add'>+	if (IS_DATASEG(curseg-&gt;seg_type)) {</div><div class='add'>+		unsigned long long new_val;</div><div class='add'>+</div><div class='add'>+		new_val = atomic64_inc_return(&amp;sbi-&gt;allocated_data_blocks);</div><div class='add'>+		if (unlikely(new_val == ULLONG_MAX))</div><div class='add'>+			atomic64_set(&amp;sbi-&gt;allocated_data_blocks, 0);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	up_write(&amp;sit_i-&gt;sentry_lock);</div><div class='ctx'> </div><div class='del'>-	if (page &amp;&amp; IS_NODESEG(type)) {</div><div class='del'>-		fill_node_footer_blkaddr(page, NEXT_FREE_BLKADDR(sbi, curseg));</div><div class='add'>+	if (folio &amp;&amp; IS_NODESEG(curseg-&gt;seg_type)) {</div><div class='add'>+		fill_node_footer_blkaddr(folio, NEXT_FREE_BLKADDR(sbi, curseg));</div><div class='ctx'> </div><div class='del'>-		f2fs_inode_chksum_set(sbi, page);</div><div class='add'>+		f2fs_inode_chksum_set(sbi, folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (fio) {</div><div class='ctx'> 		struct f2fs_bio_info *io;</div><div class='ctx'> </div><div class='del'>-		if (F2FS_IO_ALIGNED(sbi))</div><div class='del'>-			fio-&gt;retry = false;</div><div class='del'>-</div><div class='ctx'> 		INIT_LIST_HEAD(&amp;fio-&gt;list);</div><div class='del'>-		fio-&gt;in_list = true;</div><div class='add'>+		fio-&gt;in_list = 1;</div><div class='ctx'> 		io = sbi-&gt;write_io[fio-&gt;type] + fio-&gt;temp;</div><div class='ctx'> 		spin_lock(&amp;io-&gt;io_lock);</div><div class='ctx'> 		list_add_tail(&amp;fio-&gt;list, &amp;io-&gt;io_list);</div><div class='hunk'>@@ -3516,8 +3905,15 @@ void f2fs_allocate_data_block(struct f2fs_sb_info *sbi, struct page *page,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	mutex_unlock(&amp;curseg-&gt;curseg_mutex);</div><div class='add'>+	f2fs_up_read(&amp;SM_I(sbi)-&gt;curseg_lock);</div><div class='add'>+	return 0;</div><div class='ctx'> </div><div class='del'>-	up_read(&amp;SM_I(sbi)-&gt;curseg_lock);</div><div class='add'>+out_err:</div><div class='add'>+	*new_blkaddr = NULL_ADDR;</div><div class='add'>+	up_write(&amp;sit_i-&gt;sentry_lock);</div><div class='add'>+	mutex_unlock(&amp;curseg-&gt;curseg_mutex);</div><div class='add'>+	f2fs_up_read(&amp;SM_I(sbi)-&gt;curseg_lock);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_update_device_state(struct f2fs_sb_info *sbi, nid_t ino,</div><div class='hunk'>@@ -3547,36 +3943,74 @@ void f2fs_update_device_state(struct f2fs_sb_info *sbi, nid_t ino,</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int log_type_to_seg_type(enum log_type type)</div><div class='add'>+{</div><div class='add'>+	int seg_type = CURSEG_COLD_DATA;</div><div class='add'>+</div><div class='add'>+	switch (type) {</div><div class='add'>+	case CURSEG_HOT_DATA:</div><div class='add'>+	case CURSEG_WARM_DATA:</div><div class='add'>+	case CURSEG_COLD_DATA:</div><div class='add'>+	case CURSEG_HOT_NODE:</div><div class='add'>+	case CURSEG_WARM_NODE:</div><div class='add'>+	case CURSEG_COLD_NODE:</div><div class='add'>+		seg_type = (int)type;</div><div class='add'>+		break;</div><div class='add'>+	case CURSEG_COLD_DATA_PINNED:</div><div class='add'>+	case CURSEG_ALL_DATA_ATGC:</div><div class='add'>+		seg_type = CURSEG_COLD_DATA;</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+	return seg_type;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void do_write_page(struct f2fs_summary *sum, struct f2fs_io_info *fio)</div><div class='ctx'> {</div><div class='del'>-	int type = __get_segment_type(fio);</div><div class='del'>-	bool keep_order = (f2fs_lfs_mode(fio-&gt;sbi) &amp;&amp; type == CURSEG_COLD_DATA);</div><div class='add'>+	struct folio *folio = fio-&gt;folio;</div><div class='add'>+	enum log_type type = __get_segment_type(fio);</div><div class='add'>+	int seg_type = log_type_to_seg_type(type);</div><div class='add'>+	bool keep_order = (f2fs_lfs_mode(fio-&gt;sbi) &amp;&amp;</div><div class='add'>+				seg_type == CURSEG_COLD_DATA);</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (keep_order)</div><div class='del'>-		down_read(&amp;fio-&gt;sbi-&gt;io_order_lock);</div><div class='del'>-reallocate:</div><div class='del'>-	f2fs_allocate_data_block(fio-&gt;sbi, fio-&gt;page, fio-&gt;old_blkaddr,</div><div class='add'>+		f2fs_down_read(&amp;fio-&gt;sbi-&gt;io_order_lock);</div><div class='add'>+</div><div class='add'>+	err = f2fs_allocate_data_block(fio-&gt;sbi, folio, fio-&gt;old_blkaddr,</div><div class='ctx'> 			&amp;fio-&gt;new_blkaddr, sum, type, fio);</div><div class='del'>-	if (GET_SEGNO(fio-&gt;sbi, fio-&gt;old_blkaddr) != NULL_SEGNO) {</div><div class='del'>-		invalidate_mapping_pages(META_MAPPING(fio-&gt;sbi),</div><div class='del'>-					fio-&gt;old_blkaddr, fio-&gt;old_blkaddr);</div><div class='del'>-		f2fs_invalidate_compress_page(fio-&gt;sbi, fio-&gt;old_blkaddr);</div><div class='add'>+	if (unlikely(err)) {</div><div class='add'>+		f2fs_err_ratelimited(fio-&gt;sbi,</div><div class='add'>+			"%s Failed to allocate data block, ino:%u, index:%lu, type:%d, old_blkaddr:0x%x, new_blkaddr:0x%x, err:%d",</div><div class='add'>+			__func__, fio-&gt;ino, folio-&gt;index, type,</div><div class='add'>+			fio-&gt;old_blkaddr, fio-&gt;new_blkaddr, err);</div><div class='add'>+		if (fscrypt_inode_uses_fs_layer_crypto(folio-&gt;mapping-&gt;host))</div><div class='add'>+			fscrypt_finalize_bounce_page(&amp;fio-&gt;encrypted_page);</div><div class='add'>+		folio_end_writeback(folio);</div><div class='add'>+		if (f2fs_in_warm_node_list(fio-&gt;sbi, folio))</div><div class='add'>+			f2fs_del_fsync_node_entry(fio-&gt;sbi, folio);</div><div class='add'>+		f2fs_bug_on(fio-&gt;sbi, !is_set_ckpt_flags(fio-&gt;sbi,</div><div class='add'>+							CP_ERROR_FLAG));</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	f2fs_bug_on(fio-&gt;sbi, !f2fs_is_valid_blkaddr_raw(fio-&gt;sbi,</div><div class='add'>+				fio-&gt;new_blkaddr, DATA_GENERIC_ENHANCE));</div><div class='add'>+</div><div class='add'>+	if (GET_SEGNO(fio-&gt;sbi, fio-&gt;old_blkaddr) != NULL_SEGNO)</div><div class='add'>+		f2fs_invalidate_internal_cache(fio-&gt;sbi, fio-&gt;old_blkaddr, 1);</div><div class='add'>+</div><div class='ctx'> 	/* writeout dirty page into bdev */</div><div class='ctx'> 	f2fs_submit_page_write(fio);</div><div class='del'>-	if (fio-&gt;retry) {</div><div class='del'>-		fio-&gt;old_blkaddr = fio-&gt;new_blkaddr;</div><div class='del'>-		goto reallocate;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	f2fs_update_device_state(fio-&gt;sbi, fio-&gt;ino, fio-&gt;new_blkaddr, 1);</div><div class='del'>-</div><div class='add'>+out:</div><div class='ctx'> 	if (keep_order)</div><div class='del'>-		up_read(&amp;fio-&gt;sbi-&gt;io_order_lock);</div><div class='add'>+		f2fs_up_read(&amp;fio-&gt;sbi-&gt;io_order_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_do_write_meta_page(struct f2fs_sb_info *sbi, struct page *page,</div><div class='add'>+void f2fs_do_write_meta_page(struct f2fs_sb_info *sbi, struct folio *folio,</div><div class='ctx'> 					enum iostat_type io_type)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_io_info fio = {</div><div class='hunk'>@@ -3585,22 +4019,21 @@ void f2fs_do_write_meta_page(struct f2fs_sb_info *sbi, struct page *page,</div><div class='ctx'> 		.temp = HOT,</div><div class='ctx'> 		.op = REQ_OP_WRITE,</div><div class='ctx'> 		.op_flags = REQ_SYNC | REQ_META | REQ_PRIO,</div><div class='del'>-		.old_blkaddr = page-&gt;index,</div><div class='del'>-		.new_blkaddr = page-&gt;index,</div><div class='del'>-		.page = page,</div><div class='add'>+		.old_blkaddr = folio-&gt;index,</div><div class='add'>+		.new_blkaddr = folio-&gt;index,</div><div class='add'>+		.folio = folio,</div><div class='ctx'> 		.encrypted_page = NULL,</div><div class='del'>-		.in_list = false,</div><div class='add'>+		.in_list = 0,</div><div class='ctx'> 	};</div><div class='ctx'> </div><div class='del'>-	if (unlikely(page-&gt;index &gt;= MAIN_BLKADDR(sbi)))</div><div class='add'>+	if (unlikely(folio-&gt;index &gt;= MAIN_BLKADDR(sbi)))</div><div class='ctx'> 		fio.op_flags &amp;= ~REQ_META;</div><div class='ctx'> </div><div class='del'>-	set_page_writeback(page);</div><div class='del'>-	ClearPageError(page);</div><div class='add'>+	folio_start_writeback(folio);</div><div class='ctx'> 	f2fs_submit_page_write(&amp;fio);</div><div class='ctx'> </div><div class='del'>-	stat_inc_meta_count(sbi, page-&gt;index);</div><div class='del'>-	f2fs_update_iostat(sbi, io_type, F2FS_BLKSIZE);</div><div class='add'>+	stat_inc_meta_count(sbi, folio-&gt;index);</div><div class='add'>+	f2fs_update_iostat(sbi, NULL, io_type, F2FS_BLKSIZE);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_do_write_node_page(unsigned int nid, struct f2fs_io_info *fio)</div><div class='hunk'>@@ -3610,7 +4043,7 @@ void f2fs_do_write_node_page(unsigned int nid, struct f2fs_io_info *fio)</div><div class='ctx'> 	set_summary(&amp;sum, nid, 0, 0);</div><div class='ctx'> 	do_write_page(&amp;sum, fio);</div><div class='ctx'> </div><div class='del'>-	f2fs_update_iostat(fio-&gt;sbi, fio-&gt;io_type, F2FS_BLKSIZE);</div><div class='add'>+	f2fs_update_iostat(fio-&gt;sbi, NULL, fio-&gt;io_type, F2FS_BLKSIZE);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_outplace_write_data(struct dnode_of_data *dn,</div><div class='hunk'>@@ -3620,11 +4053,13 @@ void f2fs_outplace_write_data(struct dnode_of_data *dn,</div><div class='ctx'> 	struct f2fs_summary sum;</div><div class='ctx'> </div><div class='ctx'> 	f2fs_bug_on(sbi, dn-&gt;data_blkaddr == NULL_ADDR);</div><div class='add'>+	if (fio-&gt;io_type == FS_DATA_IO || fio-&gt;io_type == FS_CP_DATA_IO)</div><div class='add'>+		f2fs_update_age_extent_cache(dn);</div><div class='ctx'> 	set_summary(&amp;sum, dn-&gt;nid, dn-&gt;ofs_in_node, fio-&gt;version);</div><div class='ctx'> 	do_write_page(&amp;sum, fio);</div><div class='ctx'> 	f2fs_update_data_blkaddr(dn, fio-&gt;new_blkaddr);</div><div class='ctx'> </div><div class='del'>-	f2fs_update_iostat(sbi, fio-&gt;io_type, F2FS_BLKSIZE);</div><div class='add'>+	f2fs_update_iostat(sbi, dn-&gt;inode, fio-&gt;io_type, F2FS_BLKSIZE);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int f2fs_inplace_write_data(struct f2fs_io_info *fio)</div><div class='hunk'>@@ -3644,6 +4079,7 @@ int f2fs_inplace_write_data(struct f2fs_io_info *fio)</div><div class='ctx'> 		f2fs_warn(sbi, "%s: incorrect segment(%u) type, run fsck to fix.",</div><div class='ctx'> 			  __func__, segno);</div><div class='ctx'> 		err = -EFSCORRUPTED;</div><div class='add'>+		f2fs_handle_error(sbi, ERROR_INCONSISTENT_SUM_TYPE);</div><div class='ctx'> 		goto drop_bio;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -3652,19 +4088,20 @@ int f2fs_inplace_write_data(struct f2fs_io_info *fio)</div><div class='ctx'> 		goto drop_bio;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	invalidate_mapping_pages(META_MAPPING(sbi),</div><div class='del'>-				fio-&gt;new_blkaddr, fio-&gt;new_blkaddr);</div><div class='add'>+	if (fio-&gt;meta_gc)</div><div class='add'>+		f2fs_truncate_meta_inode_pages(sbi, fio-&gt;new_blkaddr, 1);</div><div class='ctx'> </div><div class='ctx'> 	stat_inc_inplace_blocks(fio-&gt;sbi);</div><div class='ctx'> </div><div class='del'>-	if (fio-&gt;bio &amp;&amp; !(SM_I(sbi)-&gt;ipu_policy &amp; (1 &lt;&lt; F2FS_IPU_NOCACHE)))</div><div class='add'>+	if (fio-&gt;bio &amp;&amp; !IS_F2FS_IPU_NOCACHE(sbi))</div><div class='ctx'> 		err = f2fs_merge_page_bio(fio);</div><div class='ctx'> 	else</div><div class='ctx'> 		err = f2fs_submit_page_bio(fio);</div><div class='ctx'> 	if (!err) {</div><div class='ctx'> 		f2fs_update_device_state(fio-&gt;sbi, fio-&gt;ino,</div><div class='ctx'> 						fio-&gt;new_blkaddr, 1);</div><div class='del'>-		f2fs_update_iostat(fio-&gt;sbi, fio-&gt;io_type, F2FS_BLKSIZE);</div><div class='add'>+		f2fs_update_iostat(fio-&gt;sbi, fio_inode(fio),</div><div class='add'>+						fio-&gt;io_type, F2FS_BLKSIZE);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='hunk'>@@ -3708,18 +4145,18 @@ void f2fs_do_replace_block(struct f2fs_sb_info *sbi, struct f2fs_summary *sum,</div><div class='ctx'> 	se = get_seg_entry(sbi, segno);</div><div class='ctx'> 	type = se-&gt;type;</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;SM_I(sbi)-&gt;curseg_lock);</div><div class='add'>+	f2fs_down_write(&amp;SM_I(sbi)-&gt;curseg_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (!recover_curseg) {</div><div class='ctx'> 		/* for recovery flow */</div><div class='del'>-		if (se-&gt;valid_blocks == 0 &amp;&amp; !IS_CURSEG(sbi, segno)) {</div><div class='add'>+		if (se-&gt;valid_blocks == 0 &amp;&amp; !is_curseg(sbi, segno)) {</div><div class='ctx'> 			if (old_blkaddr == NULL_ADDR)</div><div class='ctx'> 				type = CURSEG_COLD_DATA;</div><div class='ctx'> 			else</div><div class='ctx'> 				type = CURSEG_WARM_DATA;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='del'>-		if (IS_CURSEG(sbi, segno)) {</div><div class='add'>+		if (is_curseg(sbi, segno)) {</div><div class='ctx'> 			/* se-&gt;type is volatile as SSR allocation */</div><div class='ctx'> 			type = __f2fs_get_curseg(sbi, segno);</div><div class='ctx'> 			f2fs_bug_on(sbi, type == NO_CHECK_TYPE);</div><div class='hunk'>@@ -3728,8 +4165,8 @@ void f2fs_do_replace_block(struct f2fs_sb_info *sbi, struct f2fs_summary *sum,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	f2fs_bug_on(sbi, !IS_DATASEG(type));</div><div class='ctx'> 	curseg = CURSEG_I(sbi, type);</div><div class='add'>+	f2fs_bug_on(sbi, !IS_DATASEG(curseg-&gt;seg_type));</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;curseg-&gt;curseg_mutex);</div><div class='ctx'> 	down_write(&amp;sit_i-&gt;sentry_lock);</div><div class='hunk'>@@ -3741,11 +4178,12 @@ void f2fs_do_replace_block(struct f2fs_sb_info *sbi, struct f2fs_summary *sum,</div><div class='ctx'> 	/* change the current segment */</div><div class='ctx'> 	if (segno != curseg-&gt;segno) {</div><div class='ctx'> 		curseg-&gt;next_segno = segno;</div><div class='del'>-		change_curseg(sbi, type, true);</div><div class='add'>+		if (change_curseg(sbi, type))</div><div class='add'>+			goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	curseg-&gt;next_blkoff = GET_BLKOFF_FROM_SEG0(sbi, new_blkaddr);</div><div class='del'>-	__add_sum_entry(sbi, type, sum);</div><div class='add'>+	curseg-&gt;sum_blk-&gt;entries[curseg-&gt;next_blkoff] = *sum;</div><div class='ctx'> </div><div class='ctx'> 	if (!recover_curseg || recover_newaddr) {</div><div class='ctx'> 		if (!from_gc)</div><div class='hunk'>@@ -3753,9 +4191,7 @@ void f2fs_do_replace_block(struct f2fs_sb_info *sbi, struct f2fs_summary *sum,</div><div class='ctx'> 		update_sit_entry(sbi, new_blkaddr, 1);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (GET_SEGNO(sbi, old_blkaddr) != NULL_SEGNO) {</div><div class='del'>-		invalidate_mapping_pages(META_MAPPING(sbi),</div><div class='del'>-					old_blkaddr, old_blkaddr);</div><div class='del'>-		f2fs_invalidate_compress_page(sbi, old_blkaddr);</div><div class='add'>+		f2fs_invalidate_internal_cache(sbi, old_blkaddr, 1);</div><div class='ctx'> 		if (!from_gc)</div><div class='ctx'> 			update_segment_mtime(sbi, old_blkaddr, 0);</div><div class='ctx'> 		update_sit_entry(sbi, old_blkaddr, -1);</div><div class='hunk'>@@ -3769,15 +4205,17 @@ void f2fs_do_replace_block(struct f2fs_sb_info *sbi, struct f2fs_summary *sum,</div><div class='ctx'> 	if (recover_curseg) {</div><div class='ctx'> 		if (old_cursegno != curseg-&gt;segno) {</div><div class='ctx'> 			curseg-&gt;next_segno = old_cursegno;</div><div class='del'>-			change_curseg(sbi, type, true);</div><div class='add'>+			if (change_curseg(sbi, type))</div><div class='add'>+				goto out_unlock;</div><div class='ctx'> 		}</div><div class='ctx'> 		curseg-&gt;next_blkoff = old_blkoff;</div><div class='ctx'> 		curseg-&gt;alloc_type = old_alloc_type;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+out_unlock:</div><div class='ctx'> 	up_write(&amp;sit_i-&gt;sentry_lock);</div><div class='ctx'> 	mutex_unlock(&amp;curseg-&gt;curseg_mutex);</div><div class='del'>-	up_write(&amp;SM_I(sbi)-&gt;curseg_lock);</div><div class='add'>+	f2fs_up_write(&amp;SM_I(sbi)-&gt;curseg_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_replace_block(struct f2fs_sb_info *sbi, struct dnode_of_data *dn,</div><div class='hunk'>@@ -3795,21 +4233,21 @@ void f2fs_replace_block(struct f2fs_sb_info *sbi, struct dnode_of_data *dn,</div><div class='ctx'> 	f2fs_update_data_blkaddr(dn, new_addr);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_wait_on_page_writeback(struct page *page,</div><div class='del'>-				enum page_type type, bool ordered, bool locked)</div><div class='add'>+void f2fs_folio_wait_writeback(struct folio *folio, enum page_type type,</div><div class='add'>+		bool ordered, bool locked)</div><div class='ctx'> {</div><div class='del'>-	if (PageWriteback(page)) {</div><div class='del'>-		struct f2fs_sb_info *sbi = F2FS_P_SB(page);</div><div class='add'>+	if (folio_test_writeback(folio)) {</div><div class='add'>+		struct f2fs_sb_info *sbi = F2FS_F_SB(folio);</div><div class='ctx'> </div><div class='ctx'> 		/* submit cached LFS IO */</div><div class='del'>-		f2fs_submit_merged_write_cond(sbi, NULL, page, 0, type);</div><div class='del'>-		/* sbumit cached IPU IO */</div><div class='del'>-		f2fs_submit_merged_ipu_write(sbi, NULL, page);</div><div class='add'>+		f2fs_submit_merged_write_cond(sbi, NULL, folio, 0, type);</div><div class='add'>+		/* submit cached IPU IO */</div><div class='add'>+		f2fs_submit_merged_ipu_write(sbi, NULL, folio);</div><div class='ctx'> 		if (ordered) {</div><div class='del'>-			wait_on_page_writeback(page);</div><div class='del'>-			f2fs_bug_on(sbi, locked &amp;&amp; PageWriteback(page));</div><div class='add'>+			folio_wait_writeback(folio);</div><div class='add'>+			f2fs_bug_on(sbi, locked &amp;&amp; folio_test_writeback(folio));</div><div class='ctx'> 		} else {</div><div class='del'>-			wait_for_stable_page(page);</div><div class='add'>+			folio_wait_stable(folio);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -3817,28 +4255,34 @@ void f2fs_wait_on_page_writeback(struct page *page,</div><div class='ctx'> void f2fs_wait_on_block_writeback(struct inode *inode, block_t blkaddr)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='del'>-	struct page *cpage;</div><div class='add'>+	struct folio *cfolio;</div><div class='ctx'> </div><div class='del'>-	if (!f2fs_post_read_required(inode))</div><div class='add'>+	if (!f2fs_meta_inode_gc_required(inode))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	if (!__is_valid_data_blkaddr(blkaddr))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	cpage = find_lock_page(META_MAPPING(sbi), blkaddr);</div><div class='del'>-	if (cpage) {</div><div class='del'>-		f2fs_wait_on_page_writeback(cpage, DATA, true, true);</div><div class='del'>-		f2fs_put_page(cpage, 1);</div><div class='add'>+	cfolio = filemap_lock_folio(META_MAPPING(sbi), blkaddr);</div><div class='add'>+	if (!IS_ERR(cfolio)) {</div><div class='add'>+		f2fs_folio_wait_writeback(cfolio, DATA, true, true);</div><div class='add'>+		f2fs_folio_put(cfolio, true);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_wait_on_block_writeback_range(struct inode *inode, block_t blkaddr,</div><div class='ctx'> 								block_t len)</div><div class='ctx'> {</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	block_t i;</div><div class='ctx'> </div><div class='add'>+	if (!f2fs_meta_inode_gc_required(inode))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='ctx'> 	for (i = 0; i &lt; len; i++)</div><div class='ctx'> 		f2fs_wait_on_block_writeback(inode, blkaddr + i);</div><div class='add'>+</div><div class='add'>+	f2fs_truncate_meta_inode_pages(sbi, blkaddr, len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int read_compacted_summaries(struct f2fs_sb_info *sbi)</div><div class='hunk'>@@ -3846,16 +4290,16 @@ static int read_compacted_summaries(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	struct f2fs_checkpoint *ckpt = F2FS_CKPT(sbi);</div><div class='ctx'> 	struct curseg_info *seg_i;</div><div class='ctx'> 	unsigned char *kaddr;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	block_t start;</div><div class='ctx'> 	int i, j, offset;</div><div class='ctx'> </div><div class='ctx'> 	start = start_sum_block(sbi);</div><div class='ctx'> </div><div class='del'>-	page = f2fs_get_meta_page(sbi, start++);</div><div class='del'>-	if (IS_ERR(page))</div><div class='del'>-		return PTR_ERR(page);</div><div class='del'>-	kaddr = (unsigned char *)page_address(page);</div><div class='add'>+	folio = f2fs_get_meta_folio(sbi, start++);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio);</div><div class='add'>+	kaddr = folio_address(folio);</div><div class='ctx'> </div><div class='ctx'> 	/* Step 1: restore nat cache */</div><div class='ctx'> 	seg_i = CURSEG_I(sbi, CURSEG_HOT_DATA);</div><div class='hunk'>@@ -3880,7 +4324,7 @@ static int read_compacted_summaries(struct f2fs_sb_info *sbi)</div><div class='ctx'> 		seg_i-&gt;next_blkoff = blk_off;</div><div class='ctx'> </div><div class='ctx'> 		if (seg_i-&gt;alloc_type == SSR)</div><div class='del'>-			blk_off = sbi-&gt;blocks_per_seg;</div><div class='add'>+			blk_off = BLKS_PER_SEG(sbi);</div><div class='ctx'> </div><div class='ctx'> 		for (j = 0; j &lt; blk_off; j++) {</div><div class='ctx'> 			struct f2fs_summary *s;</div><div class='hunk'>@@ -3892,17 +4336,16 @@ static int read_compacted_summaries(struct f2fs_sb_info *sbi)</div><div class='ctx'> 						SUM_FOOTER_SIZE)</div><div class='ctx'> 				continue;</div><div class='ctx'> </div><div class='del'>-			f2fs_put_page(page, 1);</div><div class='del'>-			page = NULL;</div><div class='add'>+			f2fs_folio_put(folio, true);</div><div class='ctx'> </div><div class='del'>-			page = f2fs_get_meta_page(sbi, start++);</div><div class='del'>-			if (IS_ERR(page))</div><div class='del'>-				return PTR_ERR(page);</div><div class='del'>-			kaddr = (unsigned char *)page_address(page);</div><div class='add'>+			folio = f2fs_get_meta_folio(sbi, start++);</div><div class='add'>+			if (IS_ERR(folio))</div><div class='add'>+				return PTR_ERR(folio);</div><div class='add'>+			kaddr = folio_address(folio);</div><div class='ctx'> 			offset = 0;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	f2fs_put_page(page, 1);</div><div class='add'>+	f2fs_folio_put(folio, true);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3911,7 +4354,7 @@ static int read_normal_summaries(struct f2fs_sb_info *sbi, int type)</div><div class='ctx'> 	struct f2fs_checkpoint *ckpt = F2FS_CKPT(sbi);</div><div class='ctx'> 	struct f2fs_summary_block *sum;</div><div class='ctx'> 	struct curseg_info *curseg;</div><div class='del'>-	struct page *new;</div><div class='add'>+	struct folio *new;</div><div class='ctx'> 	unsigned short blk_off;</div><div class='ctx'> 	unsigned int segno = 0;</div><div class='ctx'> 	block_t blk_addr = 0;</div><div class='hunk'>@@ -3938,17 +4381,17 @@ static int read_normal_summaries(struct f2fs_sb_info *sbi, int type)</div><div class='ctx'> 			blk_addr = GET_SUM_BLOCK(sbi, segno);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	new = f2fs_get_meta_page(sbi, blk_addr);</div><div class='add'>+	new = f2fs_get_meta_folio(sbi, blk_addr);</div><div class='ctx'> 	if (IS_ERR(new))</div><div class='ctx'> 		return PTR_ERR(new);</div><div class='del'>-	sum = (struct f2fs_summary_block *)page_address(new);</div><div class='add'>+	sum = folio_address(new);</div><div class='ctx'> </div><div class='ctx'> 	if (IS_NODESEG(type)) {</div><div class='ctx'> 		if (__exist_node_summaries(sbi)) {</div><div class='ctx'> 			struct f2fs_summary *ns = &amp;sum-&gt;entries[0];</div><div class='ctx'> 			int i;</div><div class='ctx'> </div><div class='del'>-			for (i = 0; i &lt; sbi-&gt;blocks_per_seg; i++, ns++) {</div><div class='add'>+			for (i = 0; i &lt; BLKS_PER_SEG(sbi); i++, ns++) {</div><div class='ctx'> 				ns-&gt;version = 0;</div><div class='ctx'> 				ns-&gt;ofs_in_node = 0;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -3976,7 +4419,7 @@ static int read_normal_summaries(struct f2fs_sb_info *sbi, int type)</div><div class='ctx'> 	curseg-&gt;next_blkoff = blk_off;</div><div class='ctx'> 	mutex_unlock(&amp;curseg-&gt;curseg_mutex);</div><div class='ctx'> out:</div><div class='del'>-	f2fs_put_page(new, 1);</div><div class='add'>+	f2fs_folio_put(new, true);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -4025,15 +4468,15 @@ static int restore_curseg_summaries(struct f2fs_sb_info *sbi)</div><div class='ctx'> </div><div class='ctx'> static void write_compacted_summaries(struct f2fs_sb_info *sbi, block_t blkaddr)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	unsigned char *kaddr;</div><div class='ctx'> 	struct f2fs_summary *summary;</div><div class='ctx'> 	struct curseg_info *seg_i;</div><div class='ctx'> 	int written_size = 0;</div><div class='ctx'> 	int i, j;</div><div class='ctx'> </div><div class='del'>-	page = f2fs_grab_meta_page(sbi, blkaddr++);</div><div class='del'>-	kaddr = (unsigned char *)page_address(page);</div><div class='add'>+	folio = f2fs_grab_meta_folio(sbi, blkaddr++);</div><div class='add'>+	kaddr = folio_address(folio);</div><div class='ctx'> 	memset(kaddr, 0, PAGE_SIZE);</div><div class='ctx'> </div><div class='ctx'> 	/* Step 1: write nat cache */</div><div class='hunk'>@@ -4048,18 +4491,11 @@ static void write_compacted_summaries(struct f2fs_sb_info *sbi, block_t blkaddr)</div><div class='ctx'> </div><div class='ctx'> 	/* Step 3: write summary entries */</div><div class='ctx'> 	for (i = CURSEG_HOT_DATA; i &lt;= CURSEG_COLD_DATA; i++) {</div><div class='del'>-		unsigned short blkoff;</div><div class='del'>-</div><div class='ctx'> 		seg_i = CURSEG_I(sbi, i);</div><div class='del'>-		if (sbi-&gt;ckpt-&gt;alloc_type[i] == SSR)</div><div class='del'>-			blkoff = sbi-&gt;blocks_per_seg;</div><div class='del'>-		else</div><div class='del'>-			blkoff = curseg_blkoff(sbi, i);</div><div class='del'>-</div><div class='del'>-		for (j = 0; j &lt; blkoff; j++) {</div><div class='del'>-			if (!page) {</div><div class='del'>-				page = f2fs_grab_meta_page(sbi, blkaddr++);</div><div class='del'>-				kaddr = (unsigned char *)page_address(page);</div><div class='add'>+		for (j = 0; j &lt; f2fs_curseg_valid_blocks(sbi, i); j++) {</div><div class='add'>+			if (!folio) {</div><div class='add'>+				folio = f2fs_grab_meta_folio(sbi, blkaddr++);</div><div class='add'>+				kaddr = folio_address(folio);</div><div class='ctx'> 				memset(kaddr, 0, PAGE_SIZE);</div><div class='ctx'> 				written_size = 0;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -4071,14 +4507,14 @@ static void write_compacted_summaries(struct f2fs_sb_info *sbi, block_t blkaddr)</div><div class='ctx'> 							SUM_FOOTER_SIZE)</div><div class='ctx'> 				continue;</div><div class='ctx'> </div><div class='del'>-			set_page_dirty(page);</div><div class='del'>-			f2fs_put_page(page, 1);</div><div class='del'>-			page = NULL;</div><div class='add'>+			folio_mark_dirty(folio);</div><div class='add'>+			f2fs_folio_put(folio, true);</div><div class='add'>+			folio = NULL;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	if (page) {</div><div class='del'>-		set_page_dirty(page);</div><div class='del'>-		f2fs_put_page(page, 1);</div><div class='add'>+	if (folio) {</div><div class='add'>+		folio_mark_dirty(folio);</div><div class='add'>+		f2fs_folio_put(folio, true);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -4131,29 +4567,29 @@ int f2fs_lookup_journal_in_cursum(struct f2fs_journal *journal, int type,</div><div class='ctx'> 	return -1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct page *get_current_sit_page(struct f2fs_sb_info *sbi,</div><div class='add'>+static struct folio *get_current_sit_folio(struct f2fs_sb_info *sbi,</div><div class='ctx'> 					unsigned int segno)</div><div class='ctx'> {</div><div class='del'>-	return f2fs_get_meta_page(sbi, current_sit_addr(sbi, segno));</div><div class='add'>+	return f2fs_get_meta_folio(sbi, current_sit_addr(sbi, segno));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct page *get_next_sit_page(struct f2fs_sb_info *sbi,</div><div class='add'>+static struct folio *get_next_sit_folio(struct f2fs_sb_info *sbi,</div><div class='ctx'> 					unsigned int start)</div><div class='ctx'> {</div><div class='ctx'> 	struct sit_info *sit_i = SIT_I(sbi);</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	pgoff_t src_off, dst_off;</div><div class='ctx'> </div><div class='ctx'> 	src_off = current_sit_addr(sbi, start);</div><div class='ctx'> 	dst_off = next_sit_addr(sbi, src_off);</div><div class='ctx'> </div><div class='del'>-	page = f2fs_grab_meta_page(sbi, dst_off);</div><div class='del'>-	seg_info_to_sit_page(sbi, page, start);</div><div class='add'>+	folio = f2fs_grab_meta_folio(sbi, dst_off);</div><div class='add'>+	seg_info_to_sit_folio(sbi, folio, start);</div><div class='ctx'> </div><div class='del'>-	set_page_dirty(page);</div><div class='add'>+	folio_mark_dirty(folio);</div><div class='ctx'> 	set_to_next_sit(sit_i, start);</div><div class='ctx'> </div><div class='del'>-	return page;</div><div class='add'>+	return folio;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct sit_entry_set *grab_sit_entry_set(void)</div><div class='hunk'>@@ -4182,10 +4618,12 @@ static void adjust_sit_entry_set(struct sit_entry_set *ses,</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry_continue(next, head, set_list)</div><div class='del'>-		if (ses-&gt;entry_cnt &lt;= next-&gt;entry_cnt)</div><div class='del'>-			break;</div><div class='add'>+		if (ses-&gt;entry_cnt &lt;= next-&gt;entry_cnt) {</div><div class='add'>+			list_move_tail(&amp;ses-&gt;set_list, &amp;next-&gt;set_list);</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	list_move_tail(&amp;ses-&gt;set_list, &amp;next-&gt;set_list);</div><div class='add'>+	list_move_tail(&amp;ses-&gt;set_list, head);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void add_sit_entry(unsigned int segno, struct list_head *head)</div><div class='hunk'>@@ -4281,7 +4719,7 @@ void f2fs_flush_sit_entries(struct f2fs_sb_info *sbi, struct cp_control *cpc)</div><div class='ctx'> 	 * #2, flush sit entries to sit page.</div><div class='ctx'> 	 */</div><div class='ctx'> 	list_for_each_entry_safe(ses, tmp, head, set_list) {</div><div class='del'>-		struct page *page = NULL;</div><div class='add'>+		struct folio *folio = NULL;</div><div class='ctx'> 		struct f2fs_sit_block *raw_sit = NULL;</div><div class='ctx'> 		unsigned int start_segno = ses-&gt;start_segno;</div><div class='ctx'> 		unsigned int end = min(start_segno + SIT_ENTRY_PER_BLOCK,</div><div class='hunk'>@@ -4295,8 +4733,8 @@ void f2fs_flush_sit_entries(struct f2fs_sb_info *sbi, struct cp_control *cpc)</div><div class='ctx'> 		if (to_journal) {</div><div class='ctx'> 			down_write(&amp;curseg-&gt;journal_rwsem);</div><div class='ctx'> 		} else {</div><div class='del'>-			page = get_next_sit_page(sbi, start_segno);</div><div class='del'>-			raw_sit = page_address(page);</div><div class='add'>+			folio = get_next_sit_folio(sbi, start_segno);</div><div class='add'>+			raw_sit = folio_address(folio);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* flush dirty sit entries in region of current sit set */</div><div class='hunk'>@@ -4334,6 +4772,12 @@ void f2fs_flush_sit_entries(struct f2fs_sb_info *sbi, struct cp_control *cpc)</div><div class='ctx'> 						&amp;raw_sit-&gt;entries[sit_offset]);</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='add'>+			/* update ckpt_valid_block */</div><div class='add'>+			if (__is_large_section(sbi)) {</div><div class='add'>+				set_ckpt_valid_blocks(sbi, segno);</div><div class='add'>+				sanity_check_valid_blocks(sbi, segno);</div><div class='add'>+			}</div><div class='add'>+</div><div class='ctx'> 			__clear_bit(segno, bitmap);</div><div class='ctx'> 			sit_i-&gt;dirty_sentries--;</div><div class='ctx'> 			ses-&gt;entry_cnt--;</div><div class='hunk'>@@ -4342,7 +4786,7 @@ void f2fs_flush_sit_entries(struct f2fs_sb_info *sbi, struct cp_control *cpc)</div><div class='ctx'> 		if (to_journal)</div><div class='ctx'> 			up_write(&amp;curseg-&gt;journal_rwsem);</div><div class='ctx'> 		else</div><div class='del'>-			f2fs_put_page(page, 1);</div><div class='add'>+			f2fs_folio_put(folio, true);</div><div class='ctx'> </div><div class='ctx'> 		f2fs_bug_on(sbi, ses-&gt;entry_cnt);</div><div class='ctx'> 		release_sit_entry_set(ses);</div><div class='hunk'>@@ -4458,11 +4902,8 @@ static int build_sit_info(struct f2fs_sb_info *sbi)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-	/* init SIT information */</div><div class='del'>-	sit_i-&gt;s_ops = &amp;default_salloc_ops;</div><div class='del'>-</div><div class='ctx'> 	sit_i-&gt;sit_base_addr = le32_to_cpu(raw_super-&gt;sit_blkaddr);</div><div class='del'>-	sit_i-&gt;sit_blocks = sit_segs &lt;&lt; sbi-&gt;log_blocks_per_seg;</div><div class='add'>+	sit_i-&gt;sit_blocks = SEGS_TO_BLKS(sbi, sit_segs);</div><div class='ctx'> 	sit_i-&gt;written_valid_blocks = 0;</div><div class='ctx'> 	sit_i-&gt;bitmap_size = sit_bitmap_size;</div><div class='ctx'> 	sit_i-&gt;dirty_sentries = 0;</div><div class='hunk'>@@ -4529,15 +4970,8 @@ static int build_curseg(struct f2fs_sb_info *sbi)</div><div class='ctx'> 				sizeof(struct f2fs_journal), GFP_KERNEL);</div><div class='ctx'> 		if (!array[i].journal)</div><div class='ctx'> 			return -ENOMEM;</div><div class='del'>-		if (i &lt; NR_PERSISTENT_LOG)</div><div class='del'>-			array[i].seg_type = CURSEG_HOT_DATA + i;</div><div class='del'>-		else if (i == CURSEG_COLD_DATA_PINNED)</div><div class='del'>-			array[i].seg_type = CURSEG_COLD_DATA;</div><div class='del'>-		else if (i == CURSEG_ALL_DATA_ATGC)</div><div class='del'>-			array[i].seg_type = CURSEG_COLD_DATA;</div><div class='del'>-		array[i].segno = NULL_SEGNO;</div><div class='del'>-		array[i].next_blkoff = 0;</div><div class='del'>-		array[i].inited = false;</div><div class='add'>+		array[i].seg_type = log_type_to_seg_type(i);</div><div class='add'>+		reset_curseg_fields(&amp;array[i]);</div><div class='ctx'> 	}</div><div class='ctx'> 	return restore_curseg_summaries(sbi);</div><div class='ctx'> }</div><div class='hunk'>@@ -4553,7 +4987,7 @@ static int build_sit_entries(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	unsigned int i, start, end;</div><div class='ctx'> 	unsigned int readed, start_blk = 0;</div><div class='ctx'> 	int err = 0;</div><div class='del'>-	block_t total_node_blocks = 0;</div><div class='add'>+	block_t sit_valid_blocks[2] = {0, 0};</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='ctx'> 		readed = f2fs_ra_meta_pages(sbi, start_blk, BIO_MAX_VECS,</div><div class='hunk'>@@ -4564,38 +4998,45 @@ static int build_sit_entries(struct f2fs_sb_info *sbi)</div><div class='ctx'> </div><div class='ctx'> 		for (; start &lt; end &amp;&amp; start &lt; MAIN_SEGS(sbi); start++) {</div><div class='ctx'> 			struct f2fs_sit_block *sit_blk;</div><div class='del'>-			struct page *page;</div><div class='add'>+			struct folio *folio;</div><div class='ctx'> </div><div class='ctx'> 			se = &amp;sit_i-&gt;sentries[start];</div><div class='del'>-			page = get_current_sit_page(sbi, start);</div><div class='del'>-			if (IS_ERR(page))</div><div class='del'>-				return PTR_ERR(page);</div><div class='del'>-			sit_blk = (struct f2fs_sit_block *)page_address(page);</div><div class='add'>+			folio = get_current_sit_folio(sbi, start);</div><div class='add'>+			if (IS_ERR(folio))</div><div class='add'>+				return PTR_ERR(folio);</div><div class='add'>+			sit_blk = folio_address(folio);</div><div class='ctx'> 			sit = sit_blk-&gt;entries[SIT_ENTRY_OFFSET(sit_i, start)];</div><div class='del'>-			f2fs_put_page(page, 1);</div><div class='add'>+			f2fs_folio_put(folio, true);</div><div class='ctx'> </div><div class='ctx'> 			err = check_block_count(sbi, start, &amp;sit);</div><div class='ctx'> 			if (err)</div><div class='ctx'> 				return err;</div><div class='ctx'> 			seg_info_from_raw_sit(se, &amp;sit);</div><div class='del'>-			if (IS_NODESEG(se-&gt;type))</div><div class='del'>-				total_node_blocks += se-&gt;valid_blocks;</div><div class='ctx'> </div><div class='del'>-			if (f2fs_block_unit_discard(sbi)) {</div><div class='del'>-				/* build discard map only one time */</div><div class='del'>-				if (is_set_ckpt_flags(sbi, CP_TRIMMED_FLAG)) {</div><div class='del'>-					memset(se-&gt;discard_map, 0xff,</div><div class='add'>+			if (se-&gt;type &gt;= NR_PERSISTENT_LOG) {</div><div class='add'>+				f2fs_err(sbi, "Invalid segment type: %u, segno: %u",</div><div class='add'>+							se-&gt;type, start);</div><div class='add'>+				f2fs_handle_error(sbi,</div><div class='add'>+						ERROR_INCONSISTENT_SUM_TYPE);</div><div class='add'>+				return -EFSCORRUPTED;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			sit_valid_blocks[SE_PAGETYPE(se)] += se-&gt;valid_blocks;</div><div class='add'>+</div><div class='add'>+			if (!f2fs_block_unit_discard(sbi))</div><div class='add'>+				goto init_discard_map_done;</div><div class='add'>+</div><div class='add'>+			/* build discard map only one time */</div><div class='add'>+			if (is_set_ckpt_flags(sbi, CP_TRIMMED_FLAG)) {</div><div class='add'>+				memset(se-&gt;discard_map, 0xff,</div><div class='ctx'> 						SIT_VBLOCK_MAP_SIZE);</div><div class='del'>-				} else {</div><div class='del'>-					memcpy(se-&gt;discard_map,</div><div class='del'>-						se-&gt;cur_valid_map,</div><div class='add'>+				goto init_discard_map_done;</div><div class='add'>+			}</div><div class='add'>+			memcpy(se-&gt;discard_map, se-&gt;cur_valid_map,</div><div class='ctx'> 						SIT_VBLOCK_MAP_SIZE);</div><div class='del'>-					sbi-&gt;discard_blks +=</div><div class='del'>-						sbi-&gt;blocks_per_seg -</div><div class='add'>+			sbi-&gt;discard_blks += BLKS_PER_SEG(sbi) -</div><div class='ctx'> 						se-&gt;valid_blocks;</div><div class='del'>-				}</div><div class='del'>-			}</div><div class='del'>-</div><div class='add'>+init_discard_map_done:</div><div class='ctx'> 			if (__is_large_section(sbi))</div><div class='ctx'> 				get_sec_entry(sbi, start)-&gt;valid_blocks +=</div><div class='ctx'> 							se-&gt;valid_blocks;</div><div class='hunk'>@@ -4612,6 +5053,7 @@ static int build_sit_entries(struct f2fs_sb_info *sbi)</div><div class='ctx'> 			f2fs_err(sbi, "Wrong journal entry on segno %u",</div><div class='ctx'> 				 start);</div><div class='ctx'> 			err = -EFSCORRUPTED;</div><div class='add'>+			f2fs_handle_error(sbi, ERROR_CORRUPTED_JOURNAL);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -4619,15 +5061,23 @@ static int build_sit_entries(struct f2fs_sb_info *sbi)</div><div class='ctx'> 		sit = sit_in_journal(journal, i);</div><div class='ctx'> </div><div class='ctx'> 		old_valid_blocks = se-&gt;valid_blocks;</div><div class='del'>-		if (IS_NODESEG(se-&gt;type))</div><div class='del'>-			total_node_blocks -= old_valid_blocks;</div><div class='add'>+</div><div class='add'>+		sit_valid_blocks[SE_PAGETYPE(se)] -= old_valid_blocks;</div><div class='ctx'> </div><div class='ctx'> 		err = check_block_count(sbi, start, &amp;sit);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			break;</div><div class='ctx'> 		seg_info_from_raw_sit(se, &amp;sit);</div><div class='del'>-		if (IS_NODESEG(se-&gt;type))</div><div class='del'>-			total_node_blocks += se-&gt;valid_blocks;</div><div class='add'>+</div><div class='add'>+		if (se-&gt;type &gt;= NR_PERSISTENT_LOG) {</div><div class='add'>+			f2fs_err(sbi, "Invalid segment type: %u, segno: %u",</div><div class='add'>+							se-&gt;type, start);</div><div class='add'>+			err = -EFSCORRUPTED;</div><div class='add'>+			f2fs_handle_error(sbi, ERROR_INCONSISTENT_SUM_TYPE);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		sit_valid_blocks[SE_PAGETYPE(se)] += se-&gt;valid_blocks;</div><div class='ctx'> </div><div class='ctx'> 		if (f2fs_block_unit_discard(sbi)) {</div><div class='ctx'> 			if (is_set_ckpt_flags(sbi, CP_TRIMMED_FLAG)) {</div><div class='hunk'>@@ -4649,13 +5099,36 @@ static int build_sit_entries(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	}</div><div class='ctx'> 	up_read(&amp;curseg-&gt;journal_rwsem);</div><div class='ctx'> </div><div class='del'>-	if (!err &amp;&amp; total_node_blocks != valid_node_count(sbi)) {</div><div class='add'>+	/* update ckpt_valid_block */</div><div class='add'>+	if (__is_large_section(sbi)) {</div><div class='add'>+		unsigned int segno;</div><div class='add'>+</div><div class='add'>+		for (segno = 0; segno &lt; MAIN_SEGS(sbi); segno += SEGS_PER_SEC(sbi)) {</div><div class='add'>+			set_ckpt_valid_blocks(sbi, segno);</div><div class='add'>+			sanity_check_valid_blocks(sbi, segno);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	if (sit_valid_blocks[NODE] != valid_node_count(sbi)) {</div><div class='ctx'> 		f2fs_err(sbi, "SIT is corrupted node# %u vs %u",</div><div class='del'>-			 total_node_blocks, valid_node_count(sbi));</div><div class='del'>-		err = -EFSCORRUPTED;</div><div class='add'>+			 sit_valid_blocks[NODE], valid_node_count(sbi));</div><div class='add'>+		f2fs_handle_error(sbi, ERROR_INCONSISTENT_NODE_COUNT);</div><div class='add'>+		return -EFSCORRUPTED;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return err;</div><div class='add'>+	if (sit_valid_blocks[DATA] + sit_valid_blocks[NODE] &gt;</div><div class='add'>+				valid_user_blocks(sbi)) {</div><div class='add'>+		f2fs_err(sbi, "SIT is corrupted data# %u %u vs %u",</div><div class='add'>+			 sit_valid_blocks[DATA], sit_valid_blocks[NODE],</div><div class='add'>+			 valid_user_blocks(sbi));</div><div class='add'>+		f2fs_handle_error(sbi, ERROR_INCONSISTENT_BLOCK_COUNT);</div><div class='add'>+		return -EFSCORRUPTED;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void init_free_segmap(struct f2fs_sb_info *sbi)</div><div class='hunk'>@@ -4689,7 +5162,6 @@ static void init_dirty_segmap(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	struct free_segmap_info *free_i = FREE_I(sbi);</div><div class='ctx'> 	unsigned int segno = 0, offset = 0, secno;</div><div class='ctx'> 	block_t valid_blocks, usable_blks_in_seg;</div><div class='del'>-	block_t blks_per_sec = BLKS_PER_SEC(sbi);</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		/* find dirty segment based on free segmap */</div><div class='hunk'>@@ -4714,13 +5186,13 @@ static void init_dirty_segmap(struct f2fs_sb_info *sbi)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;dirty_i-&gt;seglist_lock);</div><div class='del'>-	for (segno = 0; segno &lt; MAIN_SEGS(sbi); segno += sbi-&gt;segs_per_sec) {</div><div class='add'>+	for (segno = 0; segno &lt; MAIN_SEGS(sbi); segno += SEGS_PER_SEC(sbi)) {</div><div class='ctx'> 		valid_blocks = get_valid_blocks(sbi, segno, true);</div><div class='ctx'> 		secno = GET_SEC_FROM_SEG(sbi, segno);</div><div class='ctx'> </div><div class='del'>-		if (!valid_blocks || valid_blocks == blks_per_sec)</div><div class='add'>+		if (!valid_blocks || valid_blocks == CAP_BLKS_PER_SEC(sbi))</div><div class='ctx'> 			continue;</div><div class='del'>-		if (IS_CURSEC(sbi, secno))</div><div class='add'>+		if (is_cursec(sbi, secno))</div><div class='ctx'> 			continue;</div><div class='ctx'> 		set_bit(secno, dirty_i-&gt;dirty_secmap);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -4735,6 +5207,13 @@ static int init_victim_secmap(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	dirty_i-&gt;victim_secmap = f2fs_kvzalloc(sbi, bitmap_size, GFP_KERNEL);</div><div class='ctx'> 	if (!dirty_i-&gt;victim_secmap)</div><div class='ctx'> 		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	dirty_i-&gt;pinned_secmap = f2fs_kvzalloc(sbi, bitmap_size, GFP_KERNEL);</div><div class='add'>+	if (!dirty_i-&gt;pinned_secmap)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	dirty_i-&gt;pinned_secmap_cnt = 0;</div><div class='add'>+	dirty_i-&gt;enable_pin_section = true;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -4792,13 +5271,21 @@ static int sanity_check_curseg(struct f2fs_sb_info *sbi)</div><div class='ctx'> </div><div class='ctx'> 		sanity_check_seg_type(sbi, curseg-&gt;seg_type);</div><div class='ctx'> </div><div class='add'>+		if (curseg-&gt;alloc_type != LFS &amp;&amp; curseg-&gt;alloc_type != SSR) {</div><div class='add'>+			f2fs_err(sbi,</div><div class='add'>+				 "Current segment has invalid alloc_type:%d",</div><div class='add'>+				 curseg-&gt;alloc_type);</div><div class='add'>+			f2fs_handle_error(sbi, ERROR_INVALID_CURSEG);</div><div class='add'>+			return -EFSCORRUPTED;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		if (f2fs_test_bit(blkofs, se-&gt;cur_valid_map))</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='ctx'> 		if (curseg-&gt;alloc_type == SSR)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		for (blkofs += 1; blkofs &lt; sbi-&gt;blocks_per_seg; blkofs++) {</div><div class='add'>+		for (blkofs += 1; blkofs &lt; BLKS_PER_SEG(sbi); blkofs++) {</div><div class='ctx'> 			if (!f2fs_test_bit(blkofs, se-&gt;cur_valid_map))</div><div class='ctx'> 				continue;</div><div class='ctx'> out:</div><div class='hunk'>@@ -4806,6 +5293,7 @@ out:</div><div class='ctx'> 				 "Current segment's next free block offset is inconsistent with bitmap, logtype:%u, segno:%u, type:%u, next_blkoff:%u, blkofs:%u",</div><div class='ctx'> 				 i, curseg-&gt;segno, curseg-&gt;alloc_type,</div><div class='ctx'> 				 curseg-&gt;next_blkoff, blkofs);</div><div class='add'>+			f2fs_handle_error(sbi, ERROR_INVALID_CURSEG);</div><div class='ctx'> 			return -EFSCORRUPTED;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -4813,89 +5301,84 @@ out:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_BLK_DEV_ZONED</div><div class='del'>-</div><div class='ctx'> static int check_zone_write_pointer(struct f2fs_sb_info *sbi,</div><div class='ctx'> 				    struct f2fs_dev_info *fdev,</div><div class='ctx'> 				    struct blk_zone *zone)</div><div class='ctx'> {</div><div class='del'>-	unsigned int wp_segno, wp_blkoff, zone_secno, zone_segno, segno;</div><div class='del'>-	block_t zone_block, wp_block, last_valid_block;</div><div class='add'>+	unsigned int zone_segno;</div><div class='add'>+	block_t zone_block, valid_block_cnt;</div><div class='ctx'> 	unsigned int log_sectors_per_block = sbi-&gt;log_blocksize - SECTOR_SHIFT;</div><div class='del'>-	int i, s, b, ret;</div><div class='del'>-	struct seg_entry *se;</div><div class='add'>+	int ret;</div><div class='add'>+	unsigned int nofs_flags;</div><div class='ctx'> </div><div class='ctx'> 	if (zone-&gt;type != BLK_ZONE_TYPE_SEQWRITE_REQ)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	wp_block = fdev-&gt;start_blk + (zone-&gt;wp &gt;&gt; log_sectors_per_block);</div><div class='del'>-	wp_segno = GET_SEGNO(sbi, wp_block);</div><div class='del'>-	wp_blkoff = wp_block - START_BLOCK(sbi, wp_segno);</div><div class='ctx'> 	zone_block = fdev-&gt;start_blk + (zone-&gt;start &gt;&gt; log_sectors_per_block);</div><div class='ctx'> 	zone_segno = GET_SEGNO(sbi, zone_block);</div><div class='del'>-	zone_secno = GET_SEC_FROM_SEG(sbi, zone_segno);</div><div class='del'>-</div><div class='del'>-	if (zone_segno &gt;= MAIN_SEGS(sbi))</div><div class='del'>-		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Skip check of zones cursegs point to, since</div><div class='ctx'> 	 * fix_curseg_write_pointer() checks them.</div><div class='ctx'> 	 */</div><div class='del'>-	for (i = 0; i &lt; NO_CHECK_TYPE; i++)</div><div class='del'>-		if (zone_secno == GET_SEC_FROM_SEG(sbi,</div><div class='del'>-						   CURSEG_I(sbi, i)-&gt;segno))</div><div class='del'>-			return 0;</div><div class='add'>+	if (zone_segno &gt;= MAIN_SEGS(sbi))</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Get last valid block of the zone.</div><div class='add'>+	 * Get # of valid block of the zone.</div><div class='ctx'> 	 */</div><div class='del'>-	last_valid_block = zone_block - 1;</div><div class='del'>-	for (s = sbi-&gt;segs_per_sec - 1; s &gt;= 0; s--) {</div><div class='del'>-		segno = zone_segno + s;</div><div class='del'>-		se = get_seg_entry(sbi, segno);</div><div class='del'>-		for (b = sbi-&gt;blocks_per_seg - 1; b &gt;= 0; b--)</div><div class='del'>-			if (f2fs_test_bit(b, se-&gt;cur_valid_map)) {</div><div class='del'>-				last_valid_block = START_BLOCK(sbi, segno) + b;</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-		if (last_valid_block &gt;= zone_block)</div><div class='del'>-			break;</div><div class='add'>+	valid_block_cnt = get_valid_blocks(sbi, zone_segno, true);</div><div class='add'>+	if (is_cursec(sbi, GET_SEC_FROM_SEG(sbi, zone_segno))) {</div><div class='add'>+		f2fs_notice(sbi, "Open zones: valid block[0x%x,0x%x] cond[%s]",</div><div class='add'>+				zone_segno, valid_block_cnt,</div><div class='add'>+				blk_zone_cond_str(zone-&gt;cond));</div><div class='add'>+		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * If last valid block is beyond the write pointer, report the</div><div class='del'>-	 * inconsistency. This inconsistency does not cause write error</div><div class='del'>-	 * because the zone will not be selected for write operation until</div><div class='del'>-	 * it get discarded. Just report it.</div><div class='del'>-	 */</div><div class='del'>-	if (last_valid_block &gt;= wp_block) {</div><div class='del'>-		f2fs_notice(sbi, "Valid block beyond write pointer: "</div><div class='del'>-			    "valid block[0x%x,0x%x] wp[0x%x,0x%x]",</div><div class='del'>-			    GET_SEGNO(sbi, last_valid_block),</div><div class='del'>-			    GET_BLKOFF_FROM_SEG0(sbi, last_valid_block),</div><div class='del'>-			    wp_segno, wp_blkoff);</div><div class='add'>+	if ((!valid_block_cnt &amp;&amp; zone-&gt;cond == BLK_ZONE_COND_EMPTY) ||</div><div class='add'>+	    (valid_block_cnt &amp;&amp; zone-&gt;cond == BLK_ZONE_COND_FULL))</div><div class='ctx'> 		return 0;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * If there is no valid block in the zone and if write pointer is</div><div class='del'>-	 * not at zone start, reset the write pointer.</div><div class='del'>-	 */</div><div class='del'>-	if (last_valid_block + 1 == zone_block &amp;&amp; zone-&gt;wp != zone-&gt;start) {</div><div class='del'>-		f2fs_notice(sbi,</div><div class='del'>-			    "Zone without valid block has non-zero write "</div><div class='del'>-			    "pointer. Reset the write pointer: wp[0x%x,0x%x]",</div><div class='del'>-			    wp_segno, wp_blkoff);</div><div class='add'>+	if (!valid_block_cnt) {</div><div class='add'>+		f2fs_notice(sbi, "Zone without valid block has non-zero write "</div><div class='add'>+			    "pointer. Reset the write pointer: cond[%s]",</div><div class='add'>+			    blk_zone_cond_str(zone-&gt;cond));</div><div class='ctx'> 		ret = __f2fs_issue_discard_zone(sbi, fdev-&gt;bdev, zone_block,</div><div class='ctx'> 					zone-&gt;len &gt;&gt; log_sectors_per_block);</div><div class='del'>-		if (ret) {</div><div class='add'>+		if (ret)</div><div class='ctx'> 			f2fs_err(sbi, "Discard zone failed: %s (errno=%d)",</div><div class='ctx'> 				 fdev-&gt;path, ret);</div><div class='del'>-			return ret;</div><div class='del'>-		}</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+	/*</div><div class='add'>+	 * If there are valid blocks and the write pointer doesn't match</div><div class='add'>+	 * with them, we need to report the inconsistency and fill</div><div class='add'>+	 * the zone till the end to close the zone. This inconsistency</div><div class='add'>+	 * does not cause write error because the zone will not be</div><div class='add'>+	 * selected for write operation until it get discarded.</div><div class='add'>+	 */</div><div class='add'>+	f2fs_notice(sbi, "Valid blocks are not aligned with write "</div><div class='add'>+		    "pointer: valid block[0x%x,0x%x] cond[%s]",</div><div class='add'>+		    zone_segno, valid_block_cnt, blk_zone_cond_str(zone-&gt;cond));</div><div class='add'>+</div><div class='add'>+	nofs_flags = memalloc_nofs_save();</div><div class='add'>+	ret = blkdev_zone_mgmt(fdev-&gt;bdev, REQ_OP_ZONE_FINISH,</div><div class='add'>+				zone-&gt;start, zone-&gt;len);</div><div class='add'>+	memalloc_nofs_restore(nofs_flags);</div><div class='add'>+	if (ret == -EOPNOTSUPP) {</div><div class='add'>+		ret = blkdev_issue_zeroout(fdev-&gt;bdev, zone-&gt;wp,</div><div class='add'>+					zone-&gt;len - (zone-&gt;wp - zone-&gt;start),</div><div class='add'>+					GFP_NOFS, 0);</div><div class='add'>+		if (ret)</div><div class='add'>+			f2fs_err(sbi, "Fill up zone failed: %s (errno=%d)",</div><div class='add'>+					fdev-&gt;path, ret);</div><div class='add'>+	} else if (ret) {</div><div class='add'>+		f2fs_err(sbi, "Finishing zone failed: %s (errno=%d)",</div><div class='add'>+				fdev-&gt;path, ret);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct f2fs_dev_info *get_target_zoned_dev(struct f2fs_sb_info *sbi,</div><div class='hunk'>@@ -4921,7 +5404,7 @@ static int report_one_zone_cb(struct blk_zone *zone, unsigned int idx,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fix_curseg_write_pointer(struct f2fs_sb_info *sbi, int type)</div><div class='add'>+static int do_fix_curseg_write_pointer(struct f2fs_sb_info *sbi, int type)</div><div class='ctx'> {</div><div class='ctx'> 	struct curseg_info *cs = CURSEG_I(sbi, type);</div><div class='ctx'> 	struct f2fs_dev_info *zbd;</div><div class='hunk'>@@ -4953,23 +5436,36 @@ static int fix_curseg_write_pointer(struct f2fs_sb_info *sbi, int type)</div><div class='ctx'> 	if (zone.type != BLK_ZONE_TYPE_SEQWRITE_REQ)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	wp_block = zbd-&gt;start_blk + (zone.wp &gt;&gt; log_sectors_per_block);</div><div class='del'>-	wp_segno = GET_SEGNO(sbi, wp_block);</div><div class='del'>-	wp_blkoff = wp_block - START_BLOCK(sbi, wp_segno);</div><div class='del'>-	wp_sector_off = zone.wp &amp; GENMASK(log_sectors_per_block - 1, 0);</div><div class='del'>-</div><div class='del'>-	if (cs-&gt;segno == wp_segno &amp;&amp; cs-&gt;next_blkoff == wp_blkoff &amp;&amp;</div><div class='del'>-		wp_sector_off == 0)</div><div class='del'>-		return 0;</div><div class='add'>+	/*</div><div class='add'>+	 * When safely unmounted in the previous mount, we could use current</div><div class='add'>+	 * segments. Otherwise, allocate new sections.</div><div class='add'>+	 */</div><div class='add'>+	if (is_set_ckpt_flags(sbi, CP_UMOUNT_FLAG)) {</div><div class='add'>+		wp_block = zbd-&gt;start_blk + (zone.wp &gt;&gt; log_sectors_per_block);</div><div class='add'>+		wp_segno = GET_SEGNO(sbi, wp_block);</div><div class='add'>+		wp_blkoff = wp_block - START_BLOCK(sbi, wp_segno);</div><div class='add'>+		wp_sector_off = zone.wp &amp; GENMASK(log_sectors_per_block - 1, 0);</div><div class='add'>+</div><div class='add'>+		if (cs-&gt;segno == wp_segno &amp;&amp; cs-&gt;next_blkoff == wp_blkoff &amp;&amp;</div><div class='add'>+				wp_sector_off == 0)</div><div class='add'>+			return 0;</div><div class='ctx'> </div><div class='del'>-	f2fs_notice(sbi, "Unaligned curseg[%d] with write pointer: "</div><div class='del'>-		    "curseg[0x%x,0x%x] wp[0x%x,0x%x]",</div><div class='del'>-		    type, cs-&gt;segno, cs-&gt;next_blkoff, wp_segno, wp_blkoff);</div><div class='add'>+		f2fs_notice(sbi, "Unaligned curseg[%d] with write pointer: "</div><div class='add'>+			    "curseg[0x%x,0x%x] wp[0x%x,0x%x]", type, cs-&gt;segno,</div><div class='add'>+			    cs-&gt;next_blkoff, wp_segno, wp_blkoff);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	f2fs_notice(sbi, "Assign new section to curseg[%d]: "</div><div class='del'>-		    "curseg[0x%x,0x%x]", type, cs-&gt;segno, cs-&gt;next_blkoff);</div><div class='add'>+	/* Allocate a new section if it's not new. */</div><div class='add'>+	if (cs-&gt;next_blkoff ||</div><div class='add'>+	    cs-&gt;segno != GET_SEG_FROM_SEC(sbi, GET_ZONE_FROM_SEC(sbi, cs_section))) {</div><div class='add'>+		unsigned int old_segno = cs-&gt;segno, old_blkoff = cs-&gt;next_blkoff;</div><div class='ctx'> </div><div class='del'>-	f2fs_allocate_new_section(sbi, type, true);</div><div class='add'>+		f2fs_allocate_new_section(sbi, type, true);</div><div class='add'>+		f2fs_notice(sbi, "Assign new section to curseg[%d]: "</div><div class='add'>+				"[0x%x,0x%x] -&gt; [0x%x,0x%x]",</div><div class='add'>+				type, old_segno, old_blkoff,</div><div class='add'>+				cs-&gt;segno, cs-&gt;next_blkoff);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* check consistency of the zone curseg pointed to */</div><div class='ctx'> 	if (check_zone_write_pointer(sbi, zbd, &amp;zone))</div><div class='hunk'>@@ -5001,9 +5497,8 @@ static int fix_curseg_write_pointer(struct f2fs_sb_info *sbi, int type)</div><div class='ctx'> 			    "New zone for curseg[%d] is not yet discarded. "</div><div class='ctx'> 			    "Reset the zone: curseg[0x%x,0x%x]",</div><div class='ctx'> 			    type, cs-&gt;segno, cs-&gt;next_blkoff);</div><div class='del'>-		err = __f2fs_issue_discard_zone(sbi, zbd-&gt;bdev,</div><div class='del'>-				zone_sector &gt;&gt; log_sectors_per_block,</div><div class='del'>-				zone.len &gt;&gt; log_sectors_per_block);</div><div class='add'>+		err = __f2fs_issue_discard_zone(sbi, zbd-&gt;bdev,	cs_zone_block,</div><div class='add'>+					zone.len &gt;&gt; log_sectors_per_block);</div><div class='ctx'> 		if (err) {</div><div class='ctx'> 			f2fs_err(sbi, "Discard zone failed: %s (errno=%d)",</div><div class='ctx'> 				 zbd-&gt;path, err);</div><div class='hunk'>@@ -5014,12 +5509,12 @@ static int fix_curseg_write_pointer(struct f2fs_sb_info *sbi, int type)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int f2fs_fix_curseg_write_pointer(struct f2fs_sb_info *sbi)</div><div class='add'>+static int fix_curseg_write_pointer(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	int i, ret;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; NR_PERSISTENT_LOG; i++) {</div><div class='del'>-		ret = fix_curseg_write_pointer(sbi, i);</div><div class='add'>+		ret = do_fix_curseg_write_pointer(sbi, i);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -5042,7 +5537,7 @@ static int check_zone_write_pointer_cb(struct blk_zone *zone, unsigned int idx,</div><div class='ctx'> 	return check_zone_write_pointer(args-&gt;sbi, args-&gt;fdev, zone);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int f2fs_check_write_pointer(struct f2fs_sb_info *sbi)</div><div class='add'>+static int check_write_pointer(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	int i, ret;</div><div class='ctx'> 	struct check_zone_write_pointer_args args;</div><div class='hunk'>@@ -5062,52 +5557,19 @@ int f2fs_check_write_pointer(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool is_conv_zone(struct f2fs_sb_info *sbi, unsigned int zone_idx,</div><div class='del'>-						unsigned int dev_idx)</div><div class='del'>-{</div><div class='del'>-	if (!bdev_is_zoned(FDEV(dev_idx).bdev))</div><div class='del'>-		return true;</div><div class='del'>-	return !test_bit(zone_idx, FDEV(dev_idx).blkz_seq);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* Return the zone index in the given device */</div><div class='del'>-static unsigned int get_zone_idx(struct f2fs_sb_info *sbi, unsigned int secno,</div><div class='del'>-					int dev_idx)</div><div class='add'>+int f2fs_check_and_fix_write_pointer(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='del'>-	block_t sec_start_blkaddr = START_BLOCK(sbi, GET_SEG_FROM_SEC(sbi, secno));</div><div class='del'>-</div><div class='del'>-	return (sec_start_blkaddr - FDEV(dev_idx).start_blk) &gt;&gt;</div><div class='del'>-						sbi-&gt;log_blocks_per_blkz;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Return the usable segments in a section based on the zone's</div><div class='del'>- * corresponding zone capacity. Zone is equal to a section.</div><div class='del'>- */</div><div class='del'>-static inline unsigned int f2fs_usable_zone_segs_in_sec(</div><div class='del'>-		struct f2fs_sb_info *sbi, unsigned int segno)</div><div class='del'>-{</div><div class='del'>-	unsigned int dev_idx, zone_idx, unusable_segs_in_sec;</div><div class='del'>-</div><div class='del'>-	dev_idx = f2fs_target_device_index(sbi, START_BLOCK(sbi, segno));</div><div class='del'>-	zone_idx = get_zone_idx(sbi, GET_SEC_FROM_SEG(sbi, segno), dev_idx);</div><div class='del'>-</div><div class='del'>-	/* Conventional zone's capacity is always equal to zone size */</div><div class='del'>-	if (is_conv_zone(sbi, zone_idx, dev_idx))</div><div class='del'>-		return sbi-&gt;segs_per_sec;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * If the zone_capacity_blocks array is NULL, then zone capacity</div><div class='del'>-	 * is equal to the zone size for all zones</div><div class='del'>-	 */</div><div class='del'>-	if (!FDEV(dev_idx).zone_capacity_blocks)</div><div class='del'>-		return sbi-&gt;segs_per_sec;</div><div class='add'>+	if (!f2fs_sb_has_blkzoned(sbi) || f2fs_readonly(sbi-&gt;sb) ||</div><div class='add'>+	    f2fs_hw_is_readonly(sbi))</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	/* Get the segment count beyond zone capacity block */</div><div class='del'>-	unusable_segs_in_sec = (sbi-&gt;blocks_per_blkz -</div><div class='del'>-				FDEV(dev_idx).zone_capacity_blocks[zone_idx]) &gt;&gt;</div><div class='del'>-				sbi-&gt;log_blocks_per_seg;</div><div class='del'>-	return sbi-&gt;segs_per_sec - unusable_segs_in_sec;</div><div class='add'>+	f2fs_notice(sbi, "Checking entire write pointers");</div><div class='add'>+	ret = fix_curseg_write_pointer(sbi);</div><div class='add'>+	if (!ret)</div><div class='add'>+		ret = check_write_pointer(sbi);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -5122,26 +5584,15 @@ static inline unsigned int f2fs_usable_zone_blks_in_seg(</div><div class='ctx'> 			struct f2fs_sb_info *sbi, unsigned int segno)</div><div class='ctx'> {</div><div class='ctx'> 	block_t seg_start, sec_start_blkaddr, sec_cap_blkaddr;</div><div class='del'>-	unsigned int zone_idx, dev_idx, secno;</div><div class='add'>+	unsigned int secno;</div><div class='add'>+</div><div class='add'>+	if (!sbi-&gt;unusable_blocks_per_sec)</div><div class='add'>+		return BLKS_PER_SEG(sbi);</div><div class='ctx'> </div><div class='ctx'> 	secno = GET_SEC_FROM_SEG(sbi, segno);</div><div class='ctx'> 	seg_start = START_BLOCK(sbi, segno);</div><div class='del'>-	dev_idx = f2fs_target_device_index(sbi, seg_start);</div><div class='del'>-	zone_idx = get_zone_idx(sbi, secno, dev_idx);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Conventional zone's capacity is always equal to zone size,</div><div class='del'>-	 * so, blocks per segment is unchanged.</div><div class='del'>-	 */</div><div class='del'>-	if (is_conv_zone(sbi, zone_idx, dev_idx))</div><div class='del'>-		return sbi-&gt;blocks_per_seg;</div><div class='del'>-</div><div class='del'>-	if (!FDEV(dev_idx).zone_capacity_blocks)</div><div class='del'>-		return sbi-&gt;blocks_per_seg;</div><div class='del'>-</div><div class='ctx'> 	sec_start_blkaddr = START_BLOCK(sbi, GET_SEG_FROM_SEC(sbi, secno));</div><div class='del'>-	sec_cap_blkaddr = sec_start_blkaddr +</div><div class='del'>-				FDEV(dev_idx).zone_capacity_blocks[zone_idx];</div><div class='add'>+	sec_cap_blkaddr = sec_start_blkaddr + CAP_BLKS_PER_SEC(sbi);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If segment starts before zone capacity and spans beyond</div><div class='hunk'>@@ -5151,18 +5602,13 @@ static inline unsigned int f2fs_usable_zone_blks_in_seg(</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (seg_start &gt;= sec_cap_blkaddr)</div><div class='ctx'> 		return 0;</div><div class='del'>-	if (seg_start + sbi-&gt;blocks_per_seg &gt; sec_cap_blkaddr)</div><div class='add'>+	if (seg_start + BLKS_PER_SEG(sbi) &gt; sec_cap_blkaddr)</div><div class='ctx'> 		return sec_cap_blkaddr - seg_start;</div><div class='ctx'> </div><div class='del'>-	return sbi-&gt;blocks_per_seg;</div><div class='add'>+	return BLKS_PER_SEG(sbi);</div><div class='ctx'> }</div><div class='ctx'> #else</div><div class='del'>-int f2fs_fix_curseg_write_pointer(struct f2fs_sb_info *sbi)</div><div class='del'>-{</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int f2fs_check_write_pointer(struct f2fs_sb_info *sbi)</div><div class='add'>+int f2fs_check_and_fix_write_pointer(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -5173,11 +5619,6 @@ static inline unsigned int f2fs_usable_zone_blks_in_seg(struct f2fs_sb_info *sbi</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline unsigned int f2fs_usable_zone_segs_in_sec(struct f2fs_sb_info *sbi,</div><div class='del'>-							unsigned int segno)</div><div class='del'>-{</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='ctx'> #endif</div><div class='ctx'> unsigned int f2fs_usable_blks_in_seg(struct f2fs_sb_info *sbi,</div><div class='ctx'> 					unsigned int segno)</div><div class='hunk'>@@ -5185,16 +5626,50 @@ unsigned int f2fs_usable_blks_in_seg(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	if (f2fs_sb_has_blkzoned(sbi))</div><div class='ctx'> 		return f2fs_usable_zone_blks_in_seg(sbi, segno);</div><div class='ctx'> </div><div class='del'>-	return sbi-&gt;blocks_per_seg;</div><div class='add'>+	return BLKS_PER_SEG(sbi);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-unsigned int f2fs_usable_segs_in_sec(struct f2fs_sb_info *sbi,</div><div class='del'>-					unsigned int segno)</div><div class='add'>+unsigned int f2fs_usable_segs_in_sec(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	if (f2fs_sb_has_blkzoned(sbi))</div><div class='del'>-		return f2fs_usable_zone_segs_in_sec(sbi, segno);</div><div class='add'>+		return CAP_SEGS_PER_SEC(sbi);</div><div class='ctx'> </div><div class='del'>-	return sbi-&gt;segs_per_sec;</div><div class='add'>+	return SEGS_PER_SEC(sbi);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+unsigned long long f2fs_get_section_mtime(struct f2fs_sb_info *sbi,</div><div class='add'>+	unsigned int segno)</div><div class='add'>+{</div><div class='add'>+	unsigned int usable_segs_per_sec = f2fs_usable_segs_in_sec(sbi);</div><div class='add'>+	unsigned int secno = 0, start = 0;</div><div class='add'>+	unsigned int total_valid_blocks = 0;</div><div class='add'>+	unsigned long long mtime = 0;</div><div class='add'>+	unsigned int i = 0;</div><div class='add'>+</div><div class='add'>+	secno = GET_SEC_FROM_SEG(sbi, segno);</div><div class='add'>+	start = GET_SEG_FROM_SEC(sbi, secno);</div><div class='add'>+</div><div class='add'>+	if (!__is_large_section(sbi)) {</div><div class='add'>+		mtime = get_seg_entry(sbi, start + i)-&gt;mtime;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; usable_segs_per_sec; i++) {</div><div class='add'>+		/* for large section, only check the mtime of valid segments */</div><div class='add'>+		struct seg_entry *se = get_seg_entry(sbi, start+i);</div><div class='add'>+</div><div class='add'>+		mtime += se-&gt;mtime * se-&gt;valid_blocks;</div><div class='add'>+		total_valid_blocks += se-&gt;valid_blocks;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (total_valid_blocks == 0)</div><div class='add'>+		return INVALID_MTIME;</div><div class='add'>+</div><div class='add'>+	mtime = div_u64(mtime, total_valid_blocks);</div><div class='add'>+out:</div><div class='add'>+	if (unlikely(mtime == INVALID_MTIME))</div><div class='add'>+		mtime -= 1;</div><div class='add'>+	return mtime;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -5209,14 +5684,10 @@ static void init_min_max_mtime(struct f2fs_sb_info *sbi)</div><div class='ctx'> </div><div class='ctx'> 	sit_i-&gt;min_mtime = ULLONG_MAX;</div><div class='ctx'> </div><div class='del'>-	for (segno = 0; segno &lt; MAIN_SEGS(sbi); segno += sbi-&gt;segs_per_sec) {</div><div class='del'>-		unsigned int i;</div><div class='add'>+	for (segno = 0; segno &lt; MAIN_SEGS(sbi); segno += SEGS_PER_SEC(sbi)) {</div><div class='ctx'> 		unsigned long long mtime = 0;</div><div class='ctx'> </div><div class='del'>-		for (i = 0; i &lt; sbi-&gt;segs_per_sec; i++)</div><div class='del'>-			mtime += get_seg_entry(sbi, segno + i)-&gt;mtime;</div><div class='del'>-</div><div class='del'>-		mtime = div_u64(mtime, sbi-&gt;segs_per_sec);</div><div class='add'>+		mtime = f2fs_get_section_mtime(sbi, segno);</div><div class='ctx'> </div><div class='ctx'> 		if (sit_i-&gt;min_mtime &gt; mtime)</div><div class='ctx'> 			sit_i-&gt;min_mtime = mtime;</div><div class='hunk'>@@ -5252,22 +5723,20 @@ int f2fs_build_segment_manager(struct f2fs_sb_info *sbi)</div><div class='ctx'> 		sm_info-&gt;rec_prefree_segments = DEF_MAX_RECLAIM_PREFREE_SEGMENTS;</div><div class='ctx'> </div><div class='ctx'> 	if (!f2fs_lfs_mode(sbi))</div><div class='del'>-		sm_info-&gt;ipu_policy = 1 &lt;&lt; F2FS_IPU_FSYNC;</div><div class='add'>+		sm_info-&gt;ipu_policy = BIT(F2FS_IPU_FSYNC);</div><div class='ctx'> 	sm_info-&gt;min_ipu_util = DEF_MIN_IPU_UTIL;</div><div class='ctx'> 	sm_info-&gt;min_fsync_blocks = DEF_MIN_FSYNC_BLOCKS;</div><div class='del'>-	sm_info-&gt;min_seq_blocks = sbi-&gt;blocks_per_seg;</div><div class='add'>+	sm_info-&gt;min_seq_blocks = BLKS_PER_SEG(sbi);</div><div class='ctx'> 	sm_info-&gt;min_hot_blocks = DEF_MIN_HOT_BLOCKS;</div><div class='ctx'> 	sm_info-&gt;min_ssr_sections = reserved_sections(sbi);</div><div class='ctx'> </div><div class='ctx'> 	INIT_LIST_HEAD(&amp;sm_info-&gt;sit_entry_set);</div><div class='ctx'> </div><div class='del'>-	init_rwsem(&amp;sm_info-&gt;curseg_lock);</div><div class='add'>+	init_f2fs_rwsem(&amp;sm_info-&gt;curseg_lock);</div><div class='ctx'> </div><div class='del'>-	if (!f2fs_readonly(sbi-&gt;sb)) {</div><div class='del'>-		err = f2fs_create_flush_cmd_control(sbi);</div><div class='del'>-		if (err)</div><div class='del'>-			return err;</div><div class='del'>-	}</div><div class='add'>+	err = f2fs_create_flush_cmd_control(sbi);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='ctx'> 	err = create_discard_cmd_control(sbi);</div><div class='ctx'> 	if (err)</div><div class='hunk'>@@ -5316,6 +5785,7 @@ static void destroy_victim_secmap(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	struct dirty_seglist_info *dirty_i = DIRTY_I(sbi);</div><div class='ctx'> </div><div class='add'>+	kvfree(dirty_i-&gt;pinned_secmap);</div><div class='ctx'> 	kvfree(dirty_i-&gt;victim_secmap);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5385,9 +5855,9 @@ static void destroy_sit_info(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	kvfree(sit_i-&gt;dirty_sentries_bitmap);</div><div class='ctx'> </div><div class='ctx'> 	SM_I(sbi)-&gt;sit_info = NULL;</div><div class='del'>-	kvfree(sit_i-&gt;sit_bitmap);</div><div class='add'>+	kfree(sit_i-&gt;sit_bitmap);</div><div class='ctx'> #ifdef CONFIG_F2FS_CHECK_FS</div><div class='del'>-	kvfree(sit_i-&gt;sit_bitmap_mir);</div><div class='add'>+	kfree(sit_i-&gt;sit_bitmap_mir);</div><div class='ctx'> 	kvfree(sit_i-&gt;invalid_segmap);</div><div class='ctx'> #endif</div><div class='ctx'> 	kfree(sit_i);</div><div class='hunk'>@@ -5426,9 +5896,9 @@ int __init f2fs_create_segment_manager_caches(void)</div><div class='ctx'> 	if (!sit_entry_set_slab)</div><div class='ctx'> 		goto destroy_discard_cmd;</div><div class='ctx'> </div><div class='del'>-	inmem_entry_slab = f2fs_kmem_cache_create("f2fs_inmem_page_entry",</div><div class='del'>-			sizeof(struct inmem_pages));</div><div class='del'>-	if (!inmem_entry_slab)</div><div class='add'>+	revoke_entry_slab = f2fs_kmem_cache_create("f2fs_revoke_entry",</div><div class='add'>+			sizeof(struct revoke_entry));</div><div class='add'>+	if (!revoke_entry_slab)</div><div class='ctx'> 		goto destroy_sit_entry_set;</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='hunk'>@@ -5447,5 +5917,5 @@ void f2fs_destroy_segment_manager_caches(void)</div><div class='ctx'> 	kmem_cache_destroy(sit_entry_set_slab);</div><div class='ctx'> 	kmem_cache_destroy(discard_cmd_slab);</div><div class='ctx'> 	kmem_cache_destroy(discard_entry_slab);</div><div class='del'>-	kmem_cache_destroy(inmem_entry_slab);</div><div class='add'>+	kmem_cache_destroy(revoke_entry_slab);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/f2fs/segment.h b/fs/f2fs/segment.h<br/>index 46fde9f3f28e..07dcbcbeb7c6 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/segment.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/segment.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/segment.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/segment.h</a></div><div class='hunk'>@@ -18,12 +18,15 @@</div><div class='ctx'> #define F2FS_MIN_SEGMENTS	9 /* SB + 2 (CP + SIT + NAT) + SSA + MAIN */</div><div class='ctx'> #define F2FS_MIN_META_SEGMENTS	8 /* SB + 2 (CP + SIT + NAT) + SSA */</div><div class='ctx'> </div><div class='add'>+#define INVALID_MTIME ULLONG_MAX /* no valid blocks in a segment/section */</div><div class='add'>+</div><div class='ctx'> /* L: Logical segment # in volume, R: Relative segment # in main area */</div><div class='ctx'> #define GET_L2R_SEGNO(free_i, segno)	((segno) - (free_i)-&gt;start_segno)</div><div class='ctx'> #define GET_R2L_SEGNO(free_i, segno)	((segno) + (free_i)-&gt;start_segno)</div><div class='ctx'> </div><div class='ctx'> #define IS_DATASEG(t)	((t) &lt;= CURSEG_COLD_DATA)</div><div class='ctx'> #define IS_NODESEG(t)	((t) &gt;= CURSEG_HOT_NODE &amp;&amp; (t) &lt;= CURSEG_COLD_NODE)</div><div class='add'>+#define SE_PAGETYPE(se)	((IS_NODESEG((se)-&gt;type) ? NODE : DATA))</div><div class='ctx'> </div><div class='ctx'> static inline void sanity_check_seg_type(struct f2fs_sb_info *sbi,</div><div class='ctx'> 						unsigned short seg_type)</div><div class='hunk'>@@ -31,38 +34,6 @@ static inline void sanity_check_seg_type(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	f2fs_bug_on(sbi, seg_type &gt;= NR_PERSISTENT_LOG);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#define IS_HOT(t)	((t) == CURSEG_HOT_NODE || (t) == CURSEG_HOT_DATA)</div><div class='del'>-#define IS_WARM(t)	((t) == CURSEG_WARM_NODE || (t) == CURSEG_WARM_DATA)</div><div class='del'>-#define IS_COLD(t)	((t) == CURSEG_COLD_NODE || (t) == CURSEG_COLD_DATA)</div><div class='del'>-</div><div class='del'>-#define IS_CURSEG(sbi, seg)						\</div><div class='del'>-	(((seg) == CURSEG_I(sbi, CURSEG_HOT_DATA)-&gt;segno) ||	\</div><div class='del'>-	 ((seg) == CURSEG_I(sbi, CURSEG_WARM_DATA)-&gt;segno) ||	\</div><div class='del'>-	 ((seg) == CURSEG_I(sbi, CURSEG_COLD_DATA)-&gt;segno) ||	\</div><div class='del'>-	 ((seg) == CURSEG_I(sbi, CURSEG_HOT_NODE)-&gt;segno) ||	\</div><div class='del'>-	 ((seg) == CURSEG_I(sbi, CURSEG_WARM_NODE)-&gt;segno) ||	\</div><div class='del'>-	 ((seg) == CURSEG_I(sbi, CURSEG_COLD_NODE)-&gt;segno) ||	\</div><div class='del'>-	 ((seg) == CURSEG_I(sbi, CURSEG_COLD_DATA_PINNED)-&gt;segno) ||	\</div><div class='del'>-	 ((seg) == CURSEG_I(sbi, CURSEG_ALL_DATA_ATGC)-&gt;segno))</div><div class='del'>-</div><div class='del'>-#define IS_CURSEC(sbi, secno)						\</div><div class='del'>-	(((secno) == CURSEG_I(sbi, CURSEG_HOT_DATA)-&gt;segno /		\</div><div class='del'>-	  (sbi)-&gt;segs_per_sec) ||	\</div><div class='del'>-	 ((secno) == CURSEG_I(sbi, CURSEG_WARM_DATA)-&gt;segno /		\</div><div class='del'>-	  (sbi)-&gt;segs_per_sec) ||	\</div><div class='del'>-	 ((secno) == CURSEG_I(sbi, CURSEG_COLD_DATA)-&gt;segno /		\</div><div class='del'>-	  (sbi)-&gt;segs_per_sec) ||	\</div><div class='del'>-	 ((secno) == CURSEG_I(sbi, CURSEG_HOT_NODE)-&gt;segno /		\</div><div class='del'>-	  (sbi)-&gt;segs_per_sec) ||	\</div><div class='del'>-	 ((secno) == CURSEG_I(sbi, CURSEG_WARM_NODE)-&gt;segno /		\</div><div class='del'>-	  (sbi)-&gt;segs_per_sec) ||	\</div><div class='del'>-	 ((secno) == CURSEG_I(sbi, CURSEG_COLD_NODE)-&gt;segno /		\</div><div class='del'>-	  (sbi)-&gt;segs_per_sec) ||	\</div><div class='del'>-	 ((secno) == CURSEG_I(sbi, CURSEG_COLD_DATA_PINNED)-&gt;segno /	\</div><div class='del'>-	  (sbi)-&gt;segs_per_sec) ||	\</div><div class='del'>-	 ((secno) == CURSEG_I(sbi, CURSEG_ALL_DATA_ATGC)-&gt;segno /	\</div><div class='del'>-	  (sbi)-&gt;segs_per_sec))</div><div class='del'>-</div><div class='ctx'> #define MAIN_BLKADDR(sbi)						\</div><div class='ctx'> 	(SM_I(sbi) ? SM_I(sbi)-&gt;main_blkaddr : 				\</div><div class='ctx'> 		le32_to_cpu(F2FS_RAW_SUPER(sbi)-&gt;main_blkaddr))</div><div class='hunk'>@@ -76,41 +47,55 @@ static inline void sanity_check_seg_type(struct f2fs_sb_info *sbi,</div><div class='ctx'> #define TOTAL_SEGS(sbi)							\</div><div class='ctx'> 	(SM_I(sbi) ? SM_I(sbi)-&gt;segment_count : 				\</div><div class='ctx'> 		le32_to_cpu(F2FS_RAW_SUPER(sbi)-&gt;segment_count))</div><div class='del'>-#define TOTAL_BLKS(sbi)	(TOTAL_SEGS(sbi) &lt;&lt; (sbi)-&gt;log_blocks_per_seg)</div><div class='add'>+#define TOTAL_BLKS(sbi)	(SEGS_TO_BLKS(sbi, TOTAL_SEGS(sbi)))</div><div class='ctx'> </div><div class='ctx'> #define MAX_BLKADDR(sbi)	(SEG0_BLKADDR(sbi) + TOTAL_BLKS(sbi))</div><div class='ctx'> #define SEGMENT_SIZE(sbi)	(1ULL &lt;&lt; ((sbi)-&gt;log_blocksize +	\</div><div class='ctx'> 					(sbi)-&gt;log_blocks_per_seg))</div><div class='ctx'> </div><div class='ctx'> #define START_BLOCK(sbi, segno)	(SEG0_BLKADDR(sbi) +			\</div><div class='del'>-	 (GET_R2L_SEGNO(FREE_I(sbi), segno) &lt;&lt; (sbi)-&gt;log_blocks_per_seg))</div><div class='add'>+	 (SEGS_TO_BLKS(sbi, GET_R2L_SEGNO(FREE_I(sbi), segno))))</div><div class='ctx'> </div><div class='ctx'> #define NEXT_FREE_BLKADDR(sbi, curseg)					\</div><div class='ctx'> 	(START_BLOCK(sbi, (curseg)-&gt;segno) + (curseg)-&gt;next_blkoff)</div><div class='ctx'> </div><div class='ctx'> #define GET_SEGOFF_FROM_SEG0(sbi, blk_addr)	((blk_addr) - SEG0_BLKADDR(sbi))</div><div class='ctx'> #define GET_SEGNO_FROM_SEG0(sbi, blk_addr)				\</div><div class='del'>-	(GET_SEGOFF_FROM_SEG0(sbi, blk_addr) &gt;&gt; (sbi)-&gt;log_blocks_per_seg)</div><div class='add'>+	(BLKS_TO_SEGS(sbi, GET_SEGOFF_FROM_SEG0(sbi, blk_addr)))</div><div class='ctx'> #define GET_BLKOFF_FROM_SEG0(sbi, blk_addr)				\</div><div class='del'>-	(GET_SEGOFF_FROM_SEG0(sbi, blk_addr) &amp; ((sbi)-&gt;blocks_per_seg - 1))</div><div class='add'>+	(GET_SEGOFF_FROM_SEG0(sbi, blk_addr) &amp; (BLKS_PER_SEG(sbi) - 1))</div><div class='ctx'> </div><div class='ctx'> #define GET_SEGNO(sbi, blk_addr)					\</div><div class='ctx'> 	((!__is_valid_data_blkaddr(blk_addr)) ?			\</div><div class='ctx'> 	NULL_SEGNO : GET_L2R_SEGNO(FREE_I(sbi),			\</div><div class='ctx'> 		GET_SEGNO_FROM_SEG0(sbi, blk_addr)))</div><div class='del'>-#define BLKS_PER_SEC(sbi)					\</div><div class='del'>-	((sbi)-&gt;segs_per_sec * (sbi)-&gt;blocks_per_seg)</div><div class='add'>+#ifdef CONFIG_BLK_DEV_ZONED</div><div class='add'>+#define CAP_BLKS_PER_SEC(sbi)					\</div><div class='add'>+	(BLKS_PER_SEC(sbi) - (sbi)-&gt;unusable_blocks_per_sec)</div><div class='add'>+#define CAP_SEGS_PER_SEC(sbi)					\</div><div class='add'>+	(SEGS_PER_SEC(sbi) -					\</div><div class='add'>+	BLKS_TO_SEGS(sbi, (sbi)-&gt;unusable_blocks_per_sec))</div><div class='add'>+#else</div><div class='add'>+#define CAP_BLKS_PER_SEC(sbi) BLKS_PER_SEC(sbi)</div><div class='add'>+#define CAP_SEGS_PER_SEC(sbi) SEGS_PER_SEC(sbi)</div><div class='add'>+#endif</div><div class='add'>+#define GET_START_SEG_FROM_SEC(sbi, segno)			\</div><div class='add'>+	(rounddown(segno, SEGS_PER_SEC(sbi)))</div><div class='ctx'> #define GET_SEC_FROM_SEG(sbi, segno)				\</div><div class='del'>-	(((segno) == -1) ? -1: (segno) / (sbi)-&gt;segs_per_sec)</div><div class='add'>+	(((segno) == -1) ? -1 : (segno) / SEGS_PER_SEC(sbi))</div><div class='ctx'> #define GET_SEG_FROM_SEC(sbi, secno)				\</div><div class='del'>-	((secno) * (sbi)-&gt;segs_per_sec)</div><div class='add'>+	((secno) * SEGS_PER_SEC(sbi))</div><div class='ctx'> #define GET_ZONE_FROM_SEC(sbi, secno)				\</div><div class='del'>-	(((secno) == -1) ? -1: (secno) / (sbi)-&gt;secs_per_zone)</div><div class='add'>+	(((secno) == -1) ? -1 : (secno) / (sbi)-&gt;secs_per_zone)</div><div class='ctx'> #define GET_ZONE_FROM_SEG(sbi, segno)				\</div><div class='ctx'> 	GET_ZONE_FROM_SEC(sbi, GET_SEC_FROM_SEG(sbi, segno))</div><div class='ctx'> </div><div class='del'>-#define GET_SUM_BLOCK(sbi, segno)				\</div><div class='del'>-	((sbi)-&gt;sm_info-&gt;ssa_blkaddr + (segno))</div><div class='add'>+#define SUMS_PER_BLOCK (F2FS_BLKSIZE / F2FS_SUM_BLKSIZE)</div><div class='add'>+#define GET_SUM_BLOCK(sbi, segno)	\</div><div class='add'>+	(SM_I(sbi)-&gt;ssa_blkaddr + (segno / SUMS_PER_BLOCK))</div><div class='add'>+#define GET_SUM_BLKOFF(segno) (segno % SUMS_PER_BLOCK)</div><div class='add'>+#define SUM_BLK_PAGE_ADDR(folio, segno)	\</div><div class='add'>+	(folio_address(folio) + GET_SUM_BLKOFF(segno) * F2FS_SUM_BLKSIZE)</div><div class='ctx'> </div><div class='ctx'> #define GET_SUM_TYPE(footer) ((footer)-&gt;entry_type)</div><div class='ctx'> #define SET_SUM_TYPE(footer, type) ((footer)-&gt;entry_type = (type))</div><div class='hunk'>@@ -132,16 +117,6 @@ static inline void sanity_check_seg_type(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	((sectors) &gt;&gt; F2FS_LOG_SECTORS_PER_BLOCK)</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * indicate a block allocation direction: RIGHT and LEFT.</div><div class='del'>- * RIGHT means allocating new sections towards the end of volume.</div><div class='del'>- * LEFT means the opposite direction.</div><div class='del'>- */</div><div class='del'>-enum {</div><div class='del'>-	ALLOC_RIGHT = 0,</div><div class='del'>-	ALLOC_LEFT</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * In the victim_sel_policy-&gt;alloc_mode, there are three block allocation modes.</div><div class='ctx'>  * LFS writes data sequentially with cleaning operations.</div><div class='ctx'>  * SSR (Slack Space Recycle) reuses obsolete space without cleaning operations.</div><div class='hunk'>@@ -194,6 +169,7 @@ struct victim_sel_policy {</div><div class='ctx'> 	unsigned int min_segno;		/* segment # having min. cost */</div><div class='ctx'> 	unsigned long long age;		/* mtime of GCed section*/</div><div class='ctx'> 	unsigned long long age_threshold;/* age threshold */</div><div class='add'>+	bool one_time_gc;		/* one time GC */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct seg_entry {</div><div class='hunk'>@@ -216,23 +192,18 @@ struct seg_entry {</div><div class='ctx'> </div><div class='ctx'> struct sec_entry {</div><div class='ctx'> 	unsigned int valid_blocks;	/* # of valid blocks in a section */</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct segment_allocation {</div><div class='del'>-	void (*allocate_segment)(struct f2fs_sb_info *, int, bool);</div><div class='add'>+	unsigned int ckpt_valid_blocks; /* # of valid blocks last cp in a section */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> #define MAX_SKIP_GC_COUNT			16</div><div class='ctx'> </div><div class='del'>-struct inmem_pages {</div><div class='add'>+struct revoke_entry {</div><div class='ctx'> 	struct list_head list;</div><div class='del'>-	struct page *page;</div><div class='ctx'> 	block_t old_addr;		/* for revoking when fail to commit */</div><div class='add'>+	pgoff_t index;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct sit_info {</div><div class='del'>-	const struct segment_allocation *s_ops;</div><div class='del'>-</div><div class='ctx'> 	block_t sit_base_addr;		/* start block address of SIT area */</div><div class='ctx'> 	block_t sit_blocks;		/* # of blocks used by SIT area */</div><div class='ctx'> 	block_t written_valid_blocks;	/* # of valid blocks in main area */</div><div class='hunk'>@@ -288,18 +259,14 @@ enum dirty_type {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct dirty_seglist_info {</div><div class='del'>-	const struct victim_selection *v_ops;	/* victim selction operation */</div><div class='ctx'> 	unsigned long *dirty_segmap[NR_DIRTY_TYPE];</div><div class='ctx'> 	unsigned long *dirty_secmap;</div><div class='ctx'> 	struct mutex seglist_lock;		/* lock for segment bitmaps */</div><div class='ctx'> 	int nr_dirty[NR_DIRTY_TYPE];		/* # of dirty segments */</div><div class='ctx'> 	unsigned long *victim_secmap;		/* background GC victims */</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/* victim selection function for cleaning and SSR */</div><div class='del'>-struct victim_selection {</div><div class='del'>-	int (*get_victim)(struct f2fs_sb_info *, unsigned int *,</div><div class='del'>-					int, int, char, unsigned long long);</div><div class='add'>+	unsigned long *pinned_secmap;		/* pinned victims from foreground GC */</div><div class='add'>+	unsigned int pinned_secmap_cnt;		/* count of victims which has pinned data */</div><div class='add'>+	bool enable_pin_section;		/* enable pinning section */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /* for active log information */</div><div class='hunk'>@@ -332,6 +299,28 @@ static inline struct curseg_info *CURSEG_I(struct f2fs_sb_info *sbi, int type)</div><div class='ctx'> 	return (struct curseg_info *)(SM_I(sbi)-&gt;curseg_array + type);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline bool is_curseg(struct f2fs_sb_info *sbi, unsigned int segno)</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	for (i = CURSEG_HOT_DATA; i &lt; NO_CHECK_TYPE; i++) {</div><div class='add'>+		if (segno == CURSEG_I(sbi, i)-&gt;segno)</div><div class='add'>+			return true;</div><div class='add'>+	}</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool is_cursec(struct f2fs_sb_info *sbi, unsigned int secno)</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	for (i = CURSEG_HOT_DATA; i &lt; NO_CHECK_TYPE; i++) {</div><div class='add'>+		if (secno == GET_SEC_FROM_SEG(sbi, CURSEG_I(sbi, i)-&gt;segno))</div><div class='add'>+			return true;</div><div class='add'>+	}</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline struct seg_entry *get_seg_entry(struct f2fs_sb_info *sbi,</div><div class='ctx'> 						unsigned int segno)</div><div class='ctx'> {</div><div class='hunk'>@@ -362,21 +351,57 @@ static inline unsigned int get_valid_blocks(struct f2fs_sb_info *sbi,</div><div class='ctx'> static inline unsigned int get_ckpt_valid_blocks(struct f2fs_sb_info *sbi,</div><div class='ctx'> 				unsigned int segno, bool use_section)</div><div class='ctx'> {</div><div class='del'>-	if (use_section &amp;&amp; __is_large_section(sbi)) {</div><div class='del'>-		unsigned int start_segno = START_SEGNO(segno);</div><div class='del'>-		unsigned int blocks = 0;</div><div class='del'>-		int i;</div><div class='add'>+	if (use_section &amp;&amp; __is_large_section(sbi))</div><div class='add'>+		return get_sec_entry(sbi, segno)-&gt;ckpt_valid_blocks;</div><div class='add'>+	else</div><div class='add'>+		return get_seg_entry(sbi, segno)-&gt;ckpt_valid_blocks;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void set_ckpt_valid_blocks(struct f2fs_sb_info *sbi,</div><div class='add'>+		unsigned int segno)</div><div class='add'>+{</div><div class='add'>+	unsigned int secno = GET_SEC_FROM_SEG(sbi, segno);</div><div class='add'>+	unsigned int start_segno = GET_SEG_FROM_SEC(sbi, secno);</div><div class='add'>+	unsigned int blocks = 0;</div><div class='add'>+	int i;</div><div class='ctx'> </div><div class='del'>-		for (i = 0; i &lt; sbi-&gt;segs_per_sec; i++, start_segno++) {</div><div class='del'>-			struct seg_entry *se = get_seg_entry(sbi, start_segno);</div><div class='add'>+	for (i = 0; i &lt; SEGS_PER_SEC(sbi); i++, start_segno++) {</div><div class='add'>+		struct seg_entry *se = get_seg_entry(sbi, start_segno);</div><div class='ctx'> </div><div class='del'>-			blocks += se-&gt;ckpt_valid_blocks;</div><div class='del'>-		}</div><div class='del'>-		return blocks;</div><div class='add'>+		blocks += se-&gt;ckpt_valid_blocks;</div><div class='ctx'> 	}</div><div class='del'>-	return get_seg_entry(sbi, segno)-&gt;ckpt_valid_blocks;</div><div class='add'>+	get_sec_entry(sbi, segno)-&gt;ckpt_valid_blocks = blocks;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_F2FS_CHECK_FS</div><div class='add'>+static inline void sanity_check_valid_blocks(struct f2fs_sb_info *sbi,</div><div class='add'>+		unsigned int segno)</div><div class='add'>+{</div><div class='add'>+	unsigned int secno = GET_SEC_FROM_SEG(sbi, segno);</div><div class='add'>+	unsigned int start_segno = GET_SEG_FROM_SEC(sbi, secno);</div><div class='add'>+	unsigned int blocks = 0;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; SEGS_PER_SEC(sbi); i++, start_segno++) {</div><div class='add'>+		struct seg_entry *se = get_seg_entry(sbi, start_segno);</div><div class='add'>+</div><div class='add'>+		blocks += se-&gt;ckpt_valid_blocks;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (blocks != get_sec_entry(sbi, segno)-&gt;ckpt_valid_blocks) {</div><div class='add'>+		f2fs_err(sbi,</div><div class='add'>+			"Inconsistent ckpt valid blocks: "</div><div class='add'>+			"seg entry(%d) vs sec entry(%d) at secno %d",</div><div class='add'>+			blocks, get_sec_entry(sbi, segno)-&gt;ckpt_valid_blocks, secno);</div><div class='add'>+		f2fs_bug_on(sbi, 1);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+static inline void sanity_check_valid_blocks(struct f2fs_sb_info *sbi,</div><div class='add'>+			unsigned int segno)</div><div class='add'>+{</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='ctx'> static inline void seg_info_from_raw_sit(struct seg_entry *se,</div><div class='ctx'> 					struct f2fs_sit_entry *rs)</div><div class='ctx'> {</div><div class='hunk'>@@ -401,8 +426,8 @@ static inline void __seg_info_to_raw_sit(struct seg_entry *se,</div><div class='ctx'> 	rs-&gt;mtime = cpu_to_le64(se-&gt;mtime);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void seg_info_to_sit_page(struct f2fs_sb_info *sbi,</div><div class='del'>-				struct page *page, unsigned int start)</div><div class='add'>+static inline void seg_info_to_sit_folio(struct f2fs_sb_info *sbi,</div><div class='add'>+				struct folio *folio, unsigned int start)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sit_block *raw_sit;</div><div class='ctx'> 	struct seg_entry *se;</div><div class='hunk'>@@ -411,7 +436,7 @@ static inline void seg_info_to_sit_page(struct f2fs_sb_info *sbi,</div><div class='ctx'> 					(unsigned long)MAIN_SEGS(sbi));</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	raw_sit = (struct f2fs_sit_block *)page_address(page);</div><div class='add'>+	raw_sit = folio_address(folio);</div><div class='ctx'> 	memset(raw_sit, 0, PAGE_SIZE);</div><div class='ctx'> 	for (i = 0; i &lt; end - start; i++) {</div><div class='ctx'> 		rs = &amp;raw_sit-&gt;entries[i];</div><div class='hunk'>@@ -445,15 +470,14 @@ static inline void __set_free(struct f2fs_sb_info *sbi, unsigned int segno)</div><div class='ctx'> 	unsigned int secno = GET_SEC_FROM_SEG(sbi, segno);</div><div class='ctx'> 	unsigned int start_segno = GET_SEG_FROM_SEC(sbi, secno);</div><div class='ctx'> 	unsigned int next;</div><div class='del'>-	unsigned int usable_segs = f2fs_usable_segs_in_sec(sbi, segno);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;free_i-&gt;segmap_lock);</div><div class='ctx'> 	clear_bit(segno, free_i-&gt;free_segmap);</div><div class='ctx'> 	free_i-&gt;free_segments++;</div><div class='ctx'> </div><div class='ctx'> 	next = find_next_bit(free_i-&gt;free_segmap,</div><div class='del'>-			start_segno + sbi-&gt;segs_per_sec, start_segno);</div><div class='del'>-	if (next &gt;= start_segno + usable_segs) {</div><div class='add'>+			start_segno + SEGS_PER_SEC(sbi), start_segno);</div><div class='add'>+	if (next &gt;= start_segno + f2fs_usable_segs_in_sec(sbi)) {</div><div class='ctx'> 		clear_bit(secno, free_i-&gt;free_secmap);</div><div class='ctx'> 		free_i-&gt;free_sections++;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -479,22 +503,36 @@ static inline void __set_test_and_free(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	unsigned int secno = GET_SEC_FROM_SEG(sbi, segno);</div><div class='ctx'> 	unsigned int start_segno = GET_SEG_FROM_SEC(sbi, secno);</div><div class='ctx'> 	unsigned int next;</div><div class='del'>-	unsigned int usable_segs = f2fs_usable_segs_in_sec(sbi, segno);</div><div class='add'>+	bool ret;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;free_i-&gt;segmap_lock);</div><div class='del'>-	if (test_and_clear_bit(segno, free_i-&gt;free_segmap)) {</div><div class='del'>-		free_i-&gt;free_segments++;</div><div class='del'>-</div><div class='del'>-		if (!inmem &amp;&amp; IS_CURSEC(sbi, secno))</div><div class='del'>-			goto skip_free;</div><div class='del'>-		next = find_next_bit(free_i-&gt;free_segmap,</div><div class='del'>-				start_segno + sbi-&gt;segs_per_sec, start_segno);</div><div class='del'>-		if (next &gt;= start_segno + usable_segs) {</div><div class='del'>-			if (test_and_clear_bit(secno, free_i-&gt;free_secmap))</div><div class='del'>-				free_i-&gt;free_sections++;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-skip_free:</div><div class='add'>+	ret = test_and_clear_bit(segno, free_i-&gt;free_segmap);</div><div class='add'>+	if (!ret)</div><div class='add'>+		goto unlock_out;</div><div class='add'>+</div><div class='add'>+	free_i-&gt;free_segments++;</div><div class='add'>+</div><div class='add'>+	if (!inmem &amp;&amp; is_cursec(sbi, secno))</div><div class='add'>+		goto unlock_out;</div><div class='add'>+</div><div class='add'>+	/* check large section */</div><div class='add'>+	next = find_next_bit(free_i-&gt;free_segmap,</div><div class='add'>+			     start_segno + SEGS_PER_SEC(sbi), start_segno);</div><div class='add'>+	if (next &lt; start_segno + f2fs_usable_segs_in_sec(sbi))</div><div class='add'>+		goto unlock_out;</div><div class='add'>+</div><div class='add'>+	ret = test_and_clear_bit(secno, free_i-&gt;free_secmap);</div><div class='add'>+	if (!ret)</div><div class='add'>+		goto unlock_out;</div><div class='add'>+</div><div class='add'>+	free_i-&gt;free_sections++;</div><div class='add'>+</div><div class='add'>+	if (GET_SEC_FROM_SEG(sbi, sbi-&gt;next_victim_seg[BG_GC]) == secno)</div><div class='add'>+		sbi-&gt;next_victim_seg[BG_GC] = NULL_SEGNO;</div><div class='add'>+	if (GET_SEC_FROM_SEG(sbi, sbi-&gt;next_victim_seg[FG_GC]) == secno)</div><div class='add'>+		sbi-&gt;next_victim_seg[FG_GC] = NULL_SEGNO;</div><div class='add'>+</div><div class='add'>+unlock_out:</div><div class='ctx'> 	spin_unlock(&amp;free_i-&gt;segmap_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -571,56 +609,140 @@ static inline int reserved_sections(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	return GET_SEC_FROM_SEG(sbi, reserved_segments(sbi));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline bool has_curseg_enough_space(struct f2fs_sb_info *sbi)</div><div class='add'>+static inline unsigned int get_left_section_blocks(struct f2fs_sb_info *sbi,</div><div class='add'>+					enum log_type type, unsigned int segno)</div><div class='ctx'> {</div><div class='del'>-	unsigned int node_blocks = get_pages(sbi, F2FS_DIRTY_NODES) +</div><div class='del'>-					get_pages(sbi, F2FS_DIRTY_DENTS);</div><div class='del'>-	unsigned int dent_blocks = get_pages(sbi, F2FS_DIRTY_DENTS);</div><div class='del'>-	unsigned int segno, left_blocks;</div><div class='add'>+	if (f2fs_lfs_mode(sbi)) {</div><div class='add'>+		unsigned int used_blocks = __is_large_section(sbi) ? SEGS_TO_BLKS(sbi,</div><div class='add'>+				(segno - GET_START_SEG_FROM_SEC(sbi, segno))) : 0;</div><div class='add'>+		return CAP_BLKS_PER_SEC(sbi) - used_blocks -</div><div class='add'>+			CURSEG_I(sbi, type)-&gt;next_blkoff;</div><div class='add'>+	}</div><div class='add'>+	return CAP_BLKS_PER_SEC(sbi) - get_ckpt_valid_blocks(sbi, segno, true);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool has_curseg_enough_space(struct f2fs_sb_info *sbi,</div><div class='add'>+			unsigned int node_blocks, unsigned int data_blocks,</div><div class='add'>+			unsigned int dent_blocks)</div><div class='add'>+{</div><div class='add'>+	unsigned int segno, left_blocks, blocks;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	/* check current node segment */</div><div class='del'>-	for (i = CURSEG_HOT_NODE; i &lt;= CURSEG_COLD_NODE; i++) {</div><div class='add'>+	/* check current data/node sections in the worst case. */</div><div class='add'>+	for (i = CURSEG_HOT_DATA; i &lt; NR_PERSISTENT_LOG; i++) {</div><div class='ctx'> 		segno = CURSEG_I(sbi, i)-&gt;segno;</div><div class='del'>-		left_blocks = f2fs_usable_blks_in_seg(sbi, segno) -</div><div class='del'>-				get_seg_entry(sbi, segno)-&gt;ckpt_valid_blocks;</div><div class='ctx'> </div><div class='del'>-		if (node_blocks &gt; left_blocks)</div><div class='add'>+		if (unlikely(segno == NULL_SEGNO))</div><div class='add'>+			return false;</div><div class='add'>+</div><div class='add'>+		left_blocks = get_left_section_blocks(sbi, i, segno);</div><div class='add'>+</div><div class='add'>+		blocks = i &lt;= CURSEG_COLD_DATA ? data_blocks : node_blocks;</div><div class='add'>+		if (blocks &gt; left_blocks)</div><div class='ctx'> 			return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* check current data segment */</div><div class='add'>+	/* check current data section for dentry blocks. */</div><div class='ctx'> 	segno = CURSEG_I(sbi, CURSEG_HOT_DATA)-&gt;segno;</div><div class='del'>-	left_blocks = f2fs_usable_blks_in_seg(sbi, segno) -</div><div class='del'>-			get_seg_entry(sbi, segno)-&gt;ckpt_valid_blocks;</div><div class='add'>+</div><div class='add'>+	if (unlikely(segno == NULL_SEGNO))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	left_blocks = get_left_section_blocks(sbi, CURSEG_HOT_DATA, segno);</div><div class='add'>+</div><div class='ctx'> 	if (dent_blocks &gt; left_blocks)</div><div class='ctx'> 		return false;</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * calculate needed sections for dirty node/dentry and call</div><div class='add'>+ * has_curseg_enough_space, please note that, it needs to account</div><div class='add'>+ * dirty data as well in lfs mode when checkpoint is disabled.</div><div class='add'>+ */</div><div class='add'>+static inline void __get_secs_required(struct f2fs_sb_info *sbi,</div><div class='add'>+		unsigned int *lower_p, unsigned int *upper_p, bool *curseg_p)</div><div class='add'>+{</div><div class='add'>+	unsigned int total_node_blocks = get_pages(sbi, F2FS_DIRTY_NODES) +</div><div class='add'>+					get_pages(sbi, F2FS_DIRTY_DENTS) +</div><div class='add'>+					get_pages(sbi, F2FS_DIRTY_IMETA);</div><div class='add'>+	unsigned int total_dent_blocks = get_pages(sbi, F2FS_DIRTY_DENTS);</div><div class='add'>+	unsigned int total_data_blocks = 0;</div><div class='add'>+	unsigned int node_secs = total_node_blocks / CAP_BLKS_PER_SEC(sbi);</div><div class='add'>+	unsigned int dent_secs = total_dent_blocks / CAP_BLKS_PER_SEC(sbi);</div><div class='add'>+	unsigned int data_secs = 0;</div><div class='add'>+	unsigned int node_blocks = total_node_blocks % CAP_BLKS_PER_SEC(sbi);</div><div class='add'>+	unsigned int dent_blocks = total_dent_blocks % CAP_BLKS_PER_SEC(sbi);</div><div class='add'>+	unsigned int data_blocks = 0;</div><div class='add'>+</div><div class='add'>+	if (f2fs_lfs_mode(sbi)) {</div><div class='add'>+		total_data_blocks = get_pages(sbi, F2FS_DIRTY_DATA);</div><div class='add'>+		data_secs = total_data_blocks / CAP_BLKS_PER_SEC(sbi);</div><div class='add'>+		data_blocks = total_data_blocks % CAP_BLKS_PER_SEC(sbi);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (lower_p)</div><div class='add'>+		*lower_p = node_secs + dent_secs + data_secs;</div><div class='add'>+	if (upper_p)</div><div class='add'>+		*upper_p = node_secs + dent_secs + data_secs +</div><div class='add'>+			(node_blocks ? 1 : 0) + (dent_blocks ? 1 : 0) +</div><div class='add'>+			(data_blocks ? 1 : 0);</div><div class='add'>+	if (curseg_p)</div><div class='add'>+		*curseg_p = has_curseg_enough_space(sbi,</div><div class='add'>+				node_blocks, data_blocks, dent_blocks);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline bool has_not_enough_free_secs(struct f2fs_sb_info *sbi,</div><div class='ctx'> 					int freed, int needed)</div><div class='ctx'> {</div><div class='del'>-	int node_secs = get_blocktype_secs(sbi, F2FS_DIRTY_NODES);</div><div class='del'>-	int dent_secs = get_blocktype_secs(sbi, F2FS_DIRTY_DENTS);</div><div class='del'>-	int imeta_secs = get_blocktype_secs(sbi, F2FS_DIRTY_IMETA);</div><div class='add'>+	unsigned int free_secs, lower_secs, upper_secs;</div><div class='add'>+	bool curseg_space;</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(is_sbi_flag_set(sbi, SBI_POR_DOING)))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	if (free_sections(sbi) + freed == reserved_sections(sbi) + needed &amp;&amp;</div><div class='del'>-			has_curseg_enough_space(sbi))</div><div class='add'>+	__get_secs_required(sbi, &amp;lower_secs, &amp;upper_secs, &amp;curseg_space);</div><div class='add'>+</div><div class='add'>+	free_secs = free_sections(sbi) + freed;</div><div class='add'>+	lower_secs += needed + reserved_sections(sbi);</div><div class='add'>+	upper_secs += needed + reserved_sections(sbi);</div><div class='add'>+</div><div class='add'>+	if (free_secs &gt; upper_secs)</div><div class='ctx'> 		return false;</div><div class='del'>-	return (free_sections(sbi) + freed) &lt;=</div><div class='del'>-		(node_secs + 2 * dent_secs + imeta_secs +</div><div class='del'>-		reserved_sections(sbi) + needed);</div><div class='add'>+	if (free_secs &lt;= lower_secs)</div><div class='add'>+		return true;</div><div class='add'>+	return !curseg_space;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool has_enough_free_secs(struct f2fs_sb_info *sbi,</div><div class='add'>+					int freed, int needed)</div><div class='add'>+{</div><div class='add'>+	return !has_not_enough_free_secs(sbi, freed, needed);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool has_enough_free_blks(struct f2fs_sb_info *sbi)</div><div class='add'>+{</div><div class='add'>+	unsigned int total_free_blocks = 0;</div><div class='add'>+	unsigned int avail_user_block_count;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;sbi-&gt;stat_lock);</div><div class='add'>+</div><div class='add'>+	avail_user_block_count = get_available_block_count(sbi, NULL, true);</div><div class='add'>+	total_free_blocks = avail_user_block_count - (unsigned int)valid_user_blocks(sbi);</div><div class='add'>+</div><div class='add'>+	spin_unlock(&amp;sbi-&gt;stat_lock);</div><div class='add'>+</div><div class='add'>+	return total_free_blocks &gt; 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline bool f2fs_is_checkpoint_ready(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	if (likely(!is_sbi_flag_set(sbi, SBI_CP_DISABLED)))</div><div class='ctx'> 		return true;</div><div class='del'>-	if (likely(!has_not_enough_free_secs(sbi, 0, 0)))</div><div class='add'>+	if (likely(has_enough_free_secs(sbi, 0, 0)))</div><div class='add'>+		return true;</div><div class='add'>+	if (!f2fs_lfs_mode(sbi) &amp;&amp;</div><div class='add'>+		likely(has_enough_free_blks(sbi)))</div><div class='ctx'> 		return true;</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='hunk'>@@ -650,7 +772,9 @@ static inline int utilization(struct f2fs_sb_info *sbi)</div><div class='ctx'>  *                     pages over min_fsync_blocks. (=default option)</div><div class='ctx'>  * F2FS_IPU_ASYNC - do IPU given by asynchronous write requests.</div><div class='ctx'>  * F2FS_IPU_NOCACHE - disable IPU bio cache.</div><div class='del'>- * F2FS_IPUT_DISABLE - disable IPU. (=default option in LFS mode)</div><div class='add'>+ * F2FS_IPU_HONOR_OPU_WRITE - use OPU write prior to IPU write if inode has</div><div class='add'>+ *                            FI_OPU_WRITE flag.</div><div class='add'>+ * F2FS_IPU_DISABLE - disable IPU. (=default option in LFS mode)</div><div class='ctx'>  */</div><div class='ctx'> #define DEF_MIN_IPU_UTIL	70</div><div class='ctx'> #define DEF_MIN_FSYNC_BLOCKS	8</div><div class='hunk'>@@ -658,6 +782,9 @@ static inline int utilization(struct f2fs_sb_info *sbi)</div><div class='ctx'> </div><div class='ctx'> #define SMALL_VOLUME_SEGMENTS	(16 * 512)	/* 16GB */</div><div class='ctx'> </div><div class='add'>+#define F2FS_IPU_DISABLE	0</div><div class='add'>+</div><div class='add'>+/* Modification on enum should be synchronized with ipu_mode_names array */</div><div class='ctx'> enum {</div><div class='ctx'> 	F2FS_IPU_FORCE,</div><div class='ctx'> 	F2FS_IPU_SSR,</div><div class='hunk'>@@ -666,8 +793,30 @@ enum {</div><div class='ctx'> 	F2FS_IPU_FSYNC,</div><div class='ctx'> 	F2FS_IPU_ASYNC,</div><div class='ctx'> 	F2FS_IPU_NOCACHE,</div><div class='add'>+	F2FS_IPU_HONOR_OPU_WRITE,</div><div class='add'>+	F2FS_IPU_MAX,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+static inline bool IS_F2FS_IPU_DISABLE(struct f2fs_sb_info *sbi)</div><div class='add'>+{</div><div class='add'>+	return SM_I(sbi)-&gt;ipu_policy == F2FS_IPU_DISABLE;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define F2FS_IPU_POLICY(name)					\</div><div class='add'>+static inline bool IS_##name(struct f2fs_sb_info *sbi)		\</div><div class='add'>+{								\</div><div class='add'>+	return SM_I(sbi)-&gt;ipu_policy &amp; BIT(name);		\</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+F2FS_IPU_POLICY(F2FS_IPU_FORCE);</div><div class='add'>+F2FS_IPU_POLICY(F2FS_IPU_SSR);</div><div class='add'>+F2FS_IPU_POLICY(F2FS_IPU_UTIL);</div><div class='add'>+F2FS_IPU_POLICY(F2FS_IPU_SSR_UTIL);</div><div class='add'>+F2FS_IPU_POLICY(F2FS_IPU_FSYNC);</div><div class='add'>+F2FS_IPU_POLICY(F2FS_IPU_ASYNC);</div><div class='add'>+F2FS_IPU_POLICY(F2FS_IPU_NOCACHE);</div><div class='add'>+F2FS_IPU_POLICY(F2FS_IPU_HONOR_OPU_WRITE);</div><div class='add'>+</div><div class='ctx'> static inline unsigned int curseg_segno(struct f2fs_sb_info *sbi,</div><div class='ctx'> 		int type)</div><div class='ctx'> {</div><div class='hunk'>@@ -682,15 +831,10 @@ static inline unsigned char curseg_alloc_type(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	return curseg-&gt;alloc_type;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline unsigned short curseg_blkoff(struct f2fs_sb_info *sbi, int type)</div><div class='del'>-{</div><div class='del'>-	struct curseg_info *curseg = CURSEG_I(sbi, type);</div><div class='del'>-	return curseg-&gt;next_blkoff;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void check_seg_range(struct f2fs_sb_info *sbi, unsigned int segno)</div><div class='add'>+static inline bool valid_main_segno(struct f2fs_sb_info *sbi,</div><div class='add'>+		unsigned int segno)</div><div class='ctx'> {</div><div class='del'>-	f2fs_bug_on(sbi, segno &gt; TOTAL_SEGS(sbi) - 1);</div><div class='add'>+	return segno &lt;= (MAIN_SEGS(sbi) - 1);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void verify_fio_blkaddr(struct f2fs_io_info *fio)</div><div class='hunk'>@@ -734,20 +878,22 @@ static inline int check_block_count(struct f2fs_sb_info *sbi,</div><div class='ctx'> 		f2fs_err(sbi, "Mismatch valid blocks %d vs. %d",</div><div class='ctx'> 			 GET_SIT_VBLOCKS(raw_sit), valid_blocks);</div><div class='ctx'> 		set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='add'>+		f2fs_handle_error(sbi, ERROR_INCONSISTENT_SIT);</div><div class='ctx'> 		return -EFSCORRUPTED;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (usable_blks_per_seg &lt; sbi-&gt;blocks_per_seg)</div><div class='add'>+	if (usable_blks_per_seg &lt; BLKS_PER_SEG(sbi))</div><div class='ctx'> 		f2fs_bug_on(sbi, find_next_bit_le(&amp;raw_sit-&gt;valid_map,</div><div class='del'>-				sbi-&gt;blocks_per_seg,</div><div class='del'>-				usable_blks_per_seg) != sbi-&gt;blocks_per_seg);</div><div class='add'>+				BLKS_PER_SEG(sbi),</div><div class='add'>+				usable_blks_per_seg) != BLKS_PER_SEG(sbi));</div><div class='ctx'> </div><div class='ctx'> 	/* check segment usage, and check boundary of a given segment number */</div><div class='ctx'> 	if (unlikely(GET_SIT_VBLOCKS(raw_sit) &gt; usable_blks_per_seg</div><div class='del'>-					|| segno &gt; TOTAL_SEGS(sbi) - 1)) {</div><div class='add'>+					|| !valid_main_segno(sbi, segno))) {</div><div class='ctx'> 		f2fs_err(sbi, "Wrong valid blocks %d or segno %u",</div><div class='ctx'> 			 GET_SIT_VBLOCKS(raw_sit), segno);</div><div class='ctx'> 		set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='add'>+		f2fs_handle_error(sbi, ERROR_INCONSISTENT_SIT);</div><div class='ctx'> 		return -EFSCORRUPTED;</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -760,7 +906,7 @@ static inline pgoff_t current_sit_addr(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	unsigned int offset = SIT_BLOCK_OFFSET(start);</div><div class='ctx'> 	block_t blk_addr = sit_i-&gt;sit_base_addr + offset;</div><div class='ctx'> </div><div class='del'>-	check_seg_range(sbi, start);</div><div class='add'>+	f2fs_bug_on(sbi, !valid_main_segno(sbi, start));</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_F2FS_CHECK_FS</div><div class='ctx'> 	if (f2fs_test_bit(offset, sit_i-&gt;sit_bitmap) !=</div><div class='hunk'>@@ -840,7 +986,7 @@ static inline block_t sum_blk_addr(struct f2fs_sb_info *sbi, int base, int type)</div><div class='ctx'> </div><div class='ctx'> static inline bool sec_usage_check(struct f2fs_sb_info *sbi, unsigned int secno)</div><div class='ctx'> {</div><div class='del'>-	if (IS_CURSEC(sbi, secno) || (sbi-&gt;cur_victim_sec == secno))</div><div class='add'>+	if (is_cursec(sbi, secno) || (sbi-&gt;cur_victim_sec == secno))</div><div class='ctx'> 		return true;</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='hunk'>@@ -858,9 +1004,9 @@ static inline int nr_pages_to_skip(struct f2fs_sb_info *sbi, int type)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	if (type == DATA)</div><div class='del'>-		return sbi-&gt;blocks_per_seg;</div><div class='add'>+		return BLKS_PER_SEG(sbi);</div><div class='ctx'> 	else if (type == NODE)</div><div class='del'>-		return 8 * sbi-&gt;blocks_per_seg;</div><div class='add'>+		return SEGS_TO_BLKS(sbi, 8);</div><div class='ctx'> 	else if (type == META)</div><div class='ctx'> 		return 8 * BIO_MAX_VECS;</div><div class='ctx'> 	else</div><div class='hunk'>@@ -909,6 +1055,6 @@ static inline void wake_up_discard_thread(struct f2fs_sb_info *sbi, bool force)</div><div class='ctx'> 	if (!wakeup || !is_idle(sbi, DISCARD_TIME))</div><div class='ctx'> 		return;</div><div class='ctx'> wake_up:</div><div class='del'>-	dcc-&gt;discard_wake = 1;</div><div class='add'>+	dcc-&gt;discard_wake = true;</div><div class='ctx'> 	wake_up_interruptible_all(&amp;dcc-&gt;discard_wait_queue);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/f2fs/shrinker.c b/fs/f2fs/shrinker.c<br/>index dd3c3c7a90ec..b88babcf6ab4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/shrinker.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/shrinker.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/shrinker.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/shrinker.c</a></div><div class='hunk'>@@ -28,10 +28,13 @@ static unsigned long __count_free_nids(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	return count &gt; 0 ? count : 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static unsigned long __count_extent_cache(struct f2fs_sb_info *sbi)</div><div class='add'>+static unsigned long __count_extent_cache(struct f2fs_sb_info *sbi,</div><div class='add'>+					enum extent_type type)</div><div class='ctx'> {</div><div class='del'>-	return atomic_read(&amp;sbi-&gt;total_zombie_tree) +</div><div class='del'>-				atomic_read(&amp;sbi-&gt;total_ext_node);</div><div class='add'>+	struct extent_tree_info *eti = &amp;sbi-&gt;extent_tree[type];</div><div class='add'>+</div><div class='add'>+	return atomic_read(&amp;eti-&gt;total_zombie_tree) +</div><div class='add'>+				atomic_read(&amp;eti-&gt;total_ext_node);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> unsigned long f2fs_shrink_count(struct shrinker *shrink,</div><div class='hunk'>@@ -53,8 +56,11 @@ unsigned long f2fs_shrink_count(struct shrinker *shrink,</div><div class='ctx'> 		}</div><div class='ctx'> 		spin_unlock(&amp;f2fs_list_lock);</div><div class='ctx'> </div><div class='del'>-		/* count extent cache entries */</div><div class='del'>-		count += __count_extent_cache(sbi);</div><div class='add'>+		/* count read extent cache entries */</div><div class='add'>+		count += __count_extent_cache(sbi, EX_READ);</div><div class='add'>+</div><div class='add'>+		/* count block age extent cache entries */</div><div class='add'>+		count += __count_extent_cache(sbi, EX_BLOCK_AGE);</div><div class='ctx'> </div><div class='ctx'> 		/* count clean nat cache entries */</div><div class='ctx'> 		count += __count_nat_entries(sbi);</div><div class='hunk'>@@ -67,7 +73,7 @@ unsigned long f2fs_shrink_count(struct shrinker *shrink,</div><div class='ctx'> 		mutex_unlock(&amp;sbi-&gt;umount_mutex);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;f2fs_list_lock);</div><div class='del'>-	return count;</div><div class='add'>+	return count ?: SHRINK_EMPTY;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> unsigned long f2fs_shrink_scan(struct shrinker *shrink,</div><div class='hunk'>@@ -100,7 +106,10 @@ unsigned long f2fs_shrink_scan(struct shrinker *shrink,</div><div class='ctx'> 		sbi-&gt;shrinker_run_no = run_no;</div><div class='ctx'> </div><div class='ctx'> 		/* shrink extent cache entries */</div><div class='del'>-		freed += f2fs_shrink_extent_tree(sbi, nr &gt;&gt; 1);</div><div class='add'>+		freed += f2fs_shrink_age_extent_tree(sbi, nr &gt;&gt; 2);</div><div class='add'>+</div><div class='add'>+		/* shrink read extent cache entries */</div><div class='add'>+		freed += f2fs_shrink_read_extent_tree(sbi, nr &gt;&gt; 2);</div><div class='ctx'> </div><div class='ctx'> 		/* shrink clean nat cache entries */</div><div class='ctx'> 		if (freed &lt; nr)</div><div class='hunk'>@@ -121,6 +130,103 @@ unsigned long f2fs_shrink_scan(struct shrinker *shrink,</div><div class='ctx'> 	return freed;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+unsigned int f2fs_donate_files(void)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_sb_info *sbi;</div><div class='add'>+	struct list_head *p;</div><div class='add'>+	unsigned int donate_files = 0;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;f2fs_list_lock);</div><div class='add'>+	p = f2fs_list.next;</div><div class='add'>+	while (p != &amp;f2fs_list) {</div><div class='add'>+		sbi = list_entry(p, struct f2fs_sb_info, s_list);</div><div class='add'>+</div><div class='add'>+		/* stop f2fs_put_super */</div><div class='add'>+		if (!mutex_trylock(&amp;sbi-&gt;umount_mutex)) {</div><div class='add'>+			p = p-&gt;next;</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;f2fs_list_lock);</div><div class='add'>+</div><div class='add'>+		donate_files += sbi-&gt;donate_files;</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;f2fs_list_lock);</div><div class='add'>+		p = p-&gt;next;</div><div class='add'>+		mutex_unlock(&amp;sbi-&gt;umount_mutex);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;f2fs_list_lock);</div><div class='add'>+</div><div class='add'>+	return donate_files;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static unsigned int do_reclaim_caches(struct f2fs_sb_info *sbi,</div><div class='add'>+				unsigned int reclaim_caches_kb)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode;</div><div class='add'>+	struct f2fs_inode_info *fi;</div><div class='add'>+	unsigned int nfiles = sbi-&gt;donate_files;</div><div class='add'>+	pgoff_t npages = reclaim_caches_kb &gt;&gt; (PAGE_SHIFT - 10);</div><div class='add'>+</div><div class='add'>+	while (npages &amp;&amp; nfiles--) {</div><div class='add'>+		pgoff_t len;</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;sbi-&gt;inode_lock[DONATE_INODE]);</div><div class='add'>+		if (list_empty(&amp;sbi-&gt;inode_list[DONATE_INODE])) {</div><div class='add'>+			spin_unlock(&amp;sbi-&gt;inode_lock[DONATE_INODE]);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		fi = list_first_entry(&amp;sbi-&gt;inode_list[DONATE_INODE],</div><div class='add'>+					struct f2fs_inode_info, gdonate_list);</div><div class='add'>+		list_move_tail(&amp;fi-&gt;gdonate_list, &amp;sbi-&gt;inode_list[DONATE_INODE]);</div><div class='add'>+		inode = igrab(&amp;fi-&gt;vfs_inode);</div><div class='add'>+		spin_unlock(&amp;sbi-&gt;inode_lock[DONATE_INODE]);</div><div class='add'>+</div><div class='add'>+		if (!inode)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		inode_lock(inode);</div><div class='add'>+		if (!is_inode_flag_set(inode, FI_DONATE_FINISHED)) {</div><div class='add'>+			len = fi-&gt;donate_end - fi-&gt;donate_start + 1;</div><div class='add'>+			npages = npages &lt; len ? 0 : npages - len;</div><div class='add'>+</div><div class='add'>+			invalidate_inode_pages2_range(inode-&gt;i_mapping,</div><div class='add'>+					fi-&gt;donate_start, fi-&gt;donate_end);</div><div class='add'>+			set_inode_flag(inode, FI_DONATE_FINISHED);</div><div class='add'>+		}</div><div class='add'>+		inode_unlock(inode);</div><div class='add'>+</div><div class='add'>+		iput(inode);</div><div class='add'>+		cond_resched();</div><div class='add'>+	}</div><div class='add'>+	return npages &lt;&lt; (PAGE_SHIFT - 10);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void f2fs_reclaim_caches(unsigned int reclaim_caches_kb)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_sb_info *sbi;</div><div class='add'>+	struct list_head *p;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;f2fs_list_lock);</div><div class='add'>+	p = f2fs_list.next;</div><div class='add'>+	while (p != &amp;f2fs_list &amp;&amp; reclaim_caches_kb) {</div><div class='add'>+		sbi = list_entry(p, struct f2fs_sb_info, s_list);</div><div class='add'>+</div><div class='add'>+		/* stop f2fs_put_super */</div><div class='add'>+		if (!mutex_trylock(&amp;sbi-&gt;umount_mutex)) {</div><div class='add'>+			p = p-&gt;next;</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;f2fs_list_lock);</div><div class='add'>+</div><div class='add'>+		reclaim_caches_kb = do_reclaim_caches(sbi, reclaim_caches_kb);</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;f2fs_list_lock);</div><div class='add'>+		p = p-&gt;next;</div><div class='add'>+		mutex_unlock(&amp;sbi-&gt;umount_mutex);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;f2fs_list_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> void f2fs_join_shrinker(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	spin_lock(&amp;f2fs_list_lock);</div><div class='hunk'>@@ -130,7 +236,9 @@ void f2fs_join_shrinker(struct f2fs_sb_info *sbi)</div><div class='ctx'> </div><div class='ctx'> void f2fs_leave_shrinker(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='del'>-	f2fs_shrink_extent_tree(sbi, __count_extent_cache(sbi));</div><div class='add'>+	f2fs_shrink_read_extent_tree(sbi, __count_extent_cache(sbi, EX_READ));</div><div class='add'>+	f2fs_shrink_age_extent_tree(sbi,</div><div class='add'>+				__count_extent_cache(sbi, EX_BLOCK_AGE));</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;f2fs_list_lock);</div><div class='ctx'> 	list_del_init(&amp;sbi-&gt;s_list);</div><div class='head'>diff --git a/fs/f2fs/super.c b/fs/f2fs/super.c<br/>index 7960ce066c1b..c4c225e09dc4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/super.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/super.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/super.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/super.c</a></div><div class='hunk'>@@ -8,9 +8,9 @@</div><div class='ctx'> #include &lt;linux/module.h&gt;</div><div class='ctx'> #include &lt;linux/init.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/fs_context.h&gt;</div><div class='add'>+#include &lt;linux/sched/mm.h&gt;</div><div class='ctx'> #include &lt;linux/statfs.h&gt;</div><div class='del'>-#include &lt;linux/buffer_head.h&gt;</div><div class='del'>-#include &lt;linux/backing-dev.h&gt;</div><div class='ctx'> #include &lt;linux/kthread.h&gt;</div><div class='ctx'> #include &lt;linux/parser.h&gt;</div><div class='ctx'> #include &lt;linux/mount.h&gt;</div><div class='hunk'>@@ -27,6 +27,8 @@</div><div class='ctx'> #include &lt;linux/part_stat.h&gt;</div><div class='ctx'> #include &lt;linux/zstd.h&gt;</div><div class='ctx'> #include &lt;linux/lz4.h&gt;</div><div class='add'>+#include &lt;linux/ctype.h&gt;</div><div class='add'>+#include &lt;linux/fs_parser.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "f2fs.h"</div><div class='ctx'> #include "node.h"</div><div class='hunk'>@@ -43,101 +45,118 @@ static struct kmem_cache *f2fs_inode_cachep;</div><div class='ctx'> #ifdef CONFIG_F2FS_FAULT_INJECTION</div><div class='ctx'> </div><div class='ctx'> const char *f2fs_fault_name[FAULT_MAX] = {</div><div class='del'>-	[FAULT_KMALLOC]		= "kmalloc",</div><div class='del'>-	[FAULT_KVMALLOC]	= "kvmalloc",</div><div class='del'>-	[FAULT_PAGE_ALLOC]	= "page alloc",</div><div class='del'>-	[FAULT_PAGE_GET]	= "page get",</div><div class='del'>-	[FAULT_ALLOC_NID]	= "alloc nid",</div><div class='del'>-	[FAULT_ORPHAN]		= "orphan",</div><div class='del'>-	[FAULT_BLOCK]		= "no more block",</div><div class='del'>-	[FAULT_DIR_DEPTH]	= "too big dir depth",</div><div class='del'>-	[FAULT_EVICT_INODE]	= "evict_inode fail",</div><div class='del'>-	[FAULT_TRUNCATE]	= "truncate fail",</div><div class='del'>-	[FAULT_READ_IO]		= "read IO error",</div><div class='del'>-	[FAULT_CHECKPOINT]	= "checkpoint error",</div><div class='del'>-	[FAULT_DISCARD]		= "discard error",</div><div class='del'>-	[FAULT_WRITE_IO]	= "write IO error",</div><div class='del'>-	[FAULT_SLAB_ALLOC]	= "slab alloc",</div><div class='del'>-	[FAULT_DQUOT_INIT]	= "dquot initialize",</div><div class='add'>+	[FAULT_KMALLOC]			= "kmalloc",</div><div class='add'>+	[FAULT_KVMALLOC]		= "kvmalloc",</div><div class='add'>+	[FAULT_PAGE_ALLOC]		= "page alloc",</div><div class='add'>+	[FAULT_PAGE_GET]		= "page get",</div><div class='add'>+	[FAULT_ALLOC_BIO]		= "alloc bio(obsolete)",</div><div class='add'>+	[FAULT_ALLOC_NID]		= "alloc nid",</div><div class='add'>+	[FAULT_ORPHAN]			= "orphan",</div><div class='add'>+	[FAULT_BLOCK]			= "no more block",</div><div class='add'>+	[FAULT_DIR_DEPTH]		= "too big dir depth",</div><div class='add'>+	[FAULT_EVICT_INODE]		= "evict_inode fail",</div><div class='add'>+	[FAULT_TRUNCATE]		= "truncate fail",</div><div class='add'>+	[FAULT_READ_IO]			= "read IO error",</div><div class='add'>+	[FAULT_CHECKPOINT]		= "checkpoint error",</div><div class='add'>+	[FAULT_DISCARD]			= "discard error",</div><div class='add'>+	[FAULT_WRITE_IO]		= "write IO error",</div><div class='add'>+	[FAULT_SLAB_ALLOC]		= "slab alloc",</div><div class='add'>+	[FAULT_DQUOT_INIT]		= "dquot initialize",</div><div class='add'>+	[FAULT_LOCK_OP]			= "lock_op",</div><div class='add'>+	[FAULT_BLKADDR_VALIDITY]	= "invalid blkaddr",</div><div class='add'>+	[FAULT_BLKADDR_CONSISTENCE]	= "inconsistent blkaddr",</div><div class='add'>+	[FAULT_NO_SEGMENT]		= "no free segment",</div><div class='add'>+	[FAULT_INCONSISTENT_FOOTER]	= "inconsistent footer",</div><div class='add'>+	[FAULT_TIMEOUT]			= "timeout",</div><div class='add'>+	[FAULT_VMALLOC]			= "vmalloc",</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-void f2fs_build_fault_attr(struct f2fs_sb_info *sbi, unsigned int rate,</div><div class='del'>-							unsigned int type)</div><div class='add'>+int f2fs_build_fault_attr(struct f2fs_sb_info *sbi, unsigned long rate,</div><div class='add'>+				unsigned long type, enum fault_option fo)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_fault_info *ffi = &amp;F2FS_OPTION(sbi).fault_info;</div><div class='ctx'> </div><div class='del'>-	if (rate) {</div><div class='add'>+	if (fo &amp; FAULT_ALL) {</div><div class='add'>+		memset(ffi, 0, sizeof(struct f2fs_fault_info));</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (fo &amp; FAULT_RATE) {</div><div class='add'>+		if (rate &gt; INT_MAX)</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 		atomic_set(&amp;ffi-&gt;inject_ops, 0);</div><div class='del'>-		ffi-&gt;inject_rate = rate;</div><div class='add'>+		ffi-&gt;inject_rate = (int)rate;</div><div class='add'>+		f2fs_info(sbi, "build fault injection rate: %lu", rate);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (type)</div><div class='del'>-		ffi-&gt;inject_type = type;</div><div class='add'>+	if (fo &amp; FAULT_TYPE) {</div><div class='add'>+		if (type &gt;= BIT(FAULT_MAX))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		ffi-&gt;inject_type = (unsigned int)type;</div><div class='add'>+		f2fs_info(sbi, "build fault injection type: 0x%lx", type);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (!rate &amp;&amp; !type)</div><div class='del'>-		memset(ffi, 0, sizeof(struct f2fs_fault_info));</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> /* f2fs-wide shrinker description */</div><div class='del'>-static struct shrinker f2fs_shrinker_info = {</div><div class='del'>-	.scan_objects = f2fs_shrink_scan,</div><div class='del'>-	.count_objects = f2fs_shrink_count,</div><div class='del'>-	.seeks = DEFAULT_SEEKS,</div><div class='del'>-};</div><div class='add'>+static struct shrinker *f2fs_shrinker_info;</div><div class='add'>+</div><div class='add'>+static int __init f2fs_init_shrinker(void)</div><div class='add'>+{</div><div class='add'>+	f2fs_shrinker_info = shrinker_alloc(0, "f2fs-shrinker");</div><div class='add'>+	if (!f2fs_shrinker_info)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	f2fs_shrinker_info-&gt;count_objects = f2fs_shrink_count;</div><div class='add'>+	f2fs_shrinker_info-&gt;scan_objects = f2fs_shrink_scan;</div><div class='add'>+</div><div class='add'>+	shrinker_register(f2fs_shrinker_info);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void f2fs_exit_shrinker(void)</div><div class='add'>+{</div><div class='add'>+	shrinker_free(f2fs_shrinker_info);</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> enum {</div><div class='ctx'> 	Opt_gc_background,</div><div class='ctx'> 	Opt_disable_roll_forward,</div><div class='ctx'> 	Opt_norecovery,</div><div class='ctx'> 	Opt_discard,</div><div class='del'>-	Opt_nodiscard,</div><div class='ctx'> 	Opt_noheap,</div><div class='ctx'> 	Opt_heap,</div><div class='ctx'> 	Opt_user_xattr,</div><div class='del'>-	Opt_nouser_xattr,</div><div class='ctx'> 	Opt_acl,</div><div class='del'>-	Opt_noacl,</div><div class='ctx'> 	Opt_active_logs,</div><div class='ctx'> 	Opt_disable_ext_identify,</div><div class='ctx'> 	Opt_inline_xattr,</div><div class='del'>-	Opt_noinline_xattr,</div><div class='ctx'> 	Opt_inline_xattr_size,</div><div class='ctx'> 	Opt_inline_data,</div><div class='ctx'> 	Opt_inline_dentry,</div><div class='del'>-	Opt_noinline_dentry,</div><div class='ctx'> 	Opt_flush_merge,</div><div class='del'>-	Opt_noflush_merge,</div><div class='del'>-	Opt_nobarrier,</div><div class='add'>+	Opt_barrier,</div><div class='ctx'> 	Opt_fastboot,</div><div class='ctx'> 	Opt_extent_cache,</div><div class='del'>-	Opt_noextent_cache,</div><div class='del'>-	Opt_noinline_data,</div><div class='ctx'> 	Opt_data_flush,</div><div class='ctx'> 	Opt_reserve_root,</div><div class='add'>+	Opt_reserve_node,</div><div class='ctx'> 	Opt_resgid,</div><div class='ctx'> 	Opt_resuid,</div><div class='ctx'> 	Opt_mode,</div><div class='del'>-	Opt_io_size_bits,</div><div class='ctx'> 	Opt_fault_injection,</div><div class='ctx'> 	Opt_fault_type,</div><div class='ctx'> 	Opt_lazytime,</div><div class='del'>-	Opt_nolazytime,</div><div class='ctx'> 	Opt_quota,</div><div class='del'>-	Opt_noquota,</div><div class='ctx'> 	Opt_usrquota,</div><div class='ctx'> 	Opt_grpquota,</div><div class='ctx'> 	Opt_prjquota,</div><div class='ctx'> 	Opt_usrjquota,</div><div class='ctx'> 	Opt_grpjquota,</div><div class='ctx'> 	Opt_prjjquota,</div><div class='del'>-	Opt_offusrjquota,</div><div class='del'>-	Opt_offgrpjquota,</div><div class='del'>-	Opt_offprjjquota,</div><div class='del'>-	Opt_jqfmt_vfsold,</div><div class='del'>-	Opt_jqfmt_vfsv0,</div><div class='del'>-	Opt_jqfmt_vfsv1,</div><div class='del'>-	Opt_whint,</div><div class='ctx'> 	Opt_alloc,</div><div class='ctx'> 	Opt_fsync,</div><div class='ctx'> 	Opt_test_dummy_encryption,</div><div class='hunk'>@@ -147,99 +166,221 @@ enum {</div><div class='ctx'> 	Opt_checkpoint_disable_cap_perc,</div><div class='ctx'> 	Opt_checkpoint_enable,</div><div class='ctx'> 	Opt_checkpoint_merge,</div><div class='del'>-	Opt_nocheckpoint_merge,</div><div class='ctx'> 	Opt_compress_algorithm,</div><div class='ctx'> 	Opt_compress_log_size,</div><div class='del'>-	Opt_compress_extension,</div><div class='ctx'> 	Opt_nocompress_extension,</div><div class='add'>+	Opt_compress_extension,</div><div class='ctx'> 	Opt_compress_chksum,</div><div class='ctx'> 	Opt_compress_mode,</div><div class='ctx'> 	Opt_compress_cache,</div><div class='ctx'> 	Opt_atgc,</div><div class='ctx'> 	Opt_gc_merge,</div><div class='del'>-	Opt_nogc_merge,</div><div class='ctx'> 	Opt_discard_unit,</div><div class='add'>+	Opt_memory_mode,</div><div class='add'>+	Opt_age_extent_cache,</div><div class='add'>+	Opt_errors,</div><div class='add'>+	Opt_nat_bits,</div><div class='add'>+	Opt_jqfmt,</div><div class='add'>+	Opt_checkpoint,</div><div class='add'>+	Opt_lookup_mode,</div><div class='ctx'> 	Opt_err,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static match_table_t f2fs_tokens = {</div><div class='del'>-	{Opt_gc_background, "background_gc=%s"},</div><div class='del'>-	{Opt_disable_roll_forward, "disable_roll_forward"},</div><div class='del'>-	{Opt_norecovery, "norecovery"},</div><div class='del'>-	{Opt_discard, "discard"},</div><div class='del'>-	{Opt_nodiscard, "nodiscard"},</div><div class='del'>-	{Opt_noheap, "no_heap"},</div><div class='del'>-	{Opt_heap, "heap"},</div><div class='del'>-	{Opt_user_xattr, "user_xattr"},</div><div class='del'>-	{Opt_nouser_xattr, "nouser_xattr"},</div><div class='del'>-	{Opt_acl, "acl"},</div><div class='del'>-	{Opt_noacl, "noacl"},</div><div class='del'>-	{Opt_active_logs, "active_logs=%u"},</div><div class='del'>-	{Opt_disable_ext_identify, "disable_ext_identify"},</div><div class='del'>-	{Opt_inline_xattr, "inline_xattr"},</div><div class='del'>-	{Opt_noinline_xattr, "noinline_xattr"},</div><div class='del'>-	{Opt_inline_xattr_size, "inline_xattr_size=%u"},</div><div class='del'>-	{Opt_inline_data, "inline_data"},</div><div class='del'>-	{Opt_inline_dentry, "inline_dentry"},</div><div class='del'>-	{Opt_noinline_dentry, "noinline_dentry"},</div><div class='del'>-	{Opt_flush_merge, "flush_merge"},</div><div class='del'>-	{Opt_noflush_merge, "noflush_merge"},</div><div class='del'>-	{Opt_nobarrier, "nobarrier"},</div><div class='del'>-	{Opt_fastboot, "fastboot"},</div><div class='del'>-	{Opt_extent_cache, "extent_cache"},</div><div class='del'>-	{Opt_noextent_cache, "noextent_cache"},</div><div class='del'>-	{Opt_noinline_data, "noinline_data"},</div><div class='del'>-	{Opt_data_flush, "data_flush"},</div><div class='del'>-	{Opt_reserve_root, "reserve_root=%u"},</div><div class='del'>-	{Opt_resgid, "resgid=%u"},</div><div class='del'>-	{Opt_resuid, "resuid=%u"},</div><div class='del'>-	{Opt_mode, "mode=%s"},</div><div class='del'>-	{Opt_io_size_bits, "io_bits=%u"},</div><div class='del'>-	{Opt_fault_injection, "fault_injection=%u"},</div><div class='del'>-	{Opt_fault_type, "fault_type=%u"},</div><div class='del'>-	{Opt_lazytime, "lazytime"},</div><div class='del'>-	{Opt_nolazytime, "nolazytime"},</div><div class='del'>-	{Opt_quota, "quota"},</div><div class='del'>-	{Opt_noquota, "noquota"},</div><div class='del'>-	{Opt_usrquota, "usrquota"},</div><div class='del'>-	{Opt_grpquota, "grpquota"},</div><div class='del'>-	{Opt_prjquota, "prjquota"},</div><div class='del'>-	{Opt_usrjquota, "usrjquota=%s"},</div><div class='del'>-	{Opt_grpjquota, "grpjquota=%s"},</div><div class='del'>-	{Opt_prjjquota, "prjjquota=%s"},</div><div class='del'>-	{Opt_offusrjquota, "usrjquota="},</div><div class='del'>-	{Opt_offgrpjquota, "grpjquota="},</div><div class='del'>-	{Opt_offprjjquota, "prjjquota="},</div><div class='del'>-	{Opt_jqfmt_vfsold, "jqfmt=vfsold"},</div><div class='del'>-	{Opt_jqfmt_vfsv0, "jqfmt=vfsv0"},</div><div class='del'>-	{Opt_jqfmt_vfsv1, "jqfmt=vfsv1"},</div><div class='del'>-	{Opt_whint, "whint_mode=%s"},</div><div class='del'>-	{Opt_alloc, "alloc_mode=%s"},</div><div class='del'>-	{Opt_fsync, "fsync_mode=%s"},</div><div class='del'>-	{Opt_test_dummy_encryption, "test_dummy_encryption=%s"},</div><div class='del'>-	{Opt_test_dummy_encryption, "test_dummy_encryption"},</div><div class='del'>-	{Opt_inlinecrypt, "inlinecrypt"},</div><div class='del'>-	{Opt_checkpoint_disable, "checkpoint=disable"},</div><div class='del'>-	{Opt_checkpoint_disable_cap, "checkpoint=disable:%u"},</div><div class='del'>-	{Opt_checkpoint_disable_cap_perc, "checkpoint=disable:%u%%"},</div><div class='del'>-	{Opt_checkpoint_enable, "checkpoint=enable"},</div><div class='del'>-	{Opt_checkpoint_merge, "checkpoint_merge"},</div><div class='del'>-	{Opt_nocheckpoint_merge, "nocheckpoint_merge"},</div><div class='del'>-	{Opt_compress_algorithm, "compress_algorithm=%s"},</div><div class='del'>-	{Opt_compress_log_size, "compress_log_size=%u"},</div><div class='del'>-	{Opt_compress_extension, "compress_extension=%s"},</div><div class='del'>-	{Opt_nocompress_extension, "nocompress_extension=%s"},</div><div class='del'>-	{Opt_compress_chksum, "compress_chksum"},</div><div class='del'>-	{Opt_compress_mode, "compress_mode=%s"},</div><div class='del'>-	{Opt_compress_cache, "compress_cache"},</div><div class='del'>-	{Opt_atgc, "atgc"},</div><div class='del'>-	{Opt_gc_merge, "gc_merge"},</div><div class='del'>-	{Opt_nogc_merge, "nogc_merge"},</div><div class='del'>-	{Opt_discard_unit, "discard_unit=%s"},</div><div class='add'>+static const struct constant_table f2fs_param_background_gc[] = {</div><div class='add'>+	{"on",		BGGC_MODE_ON},</div><div class='add'>+	{"off",		BGGC_MODE_OFF},</div><div class='add'>+	{"sync",	BGGC_MODE_SYNC},</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct constant_table f2fs_param_mode[] = {</div><div class='add'>+	{"adaptive",		FS_MODE_ADAPTIVE},</div><div class='add'>+	{"lfs",			FS_MODE_LFS},</div><div class='add'>+	{"fragment:segment",	FS_MODE_FRAGMENT_SEG},</div><div class='add'>+	{"fragment:block",	FS_MODE_FRAGMENT_BLK},</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct constant_table f2fs_param_jqfmt[] = {</div><div class='add'>+	{"vfsold",	QFMT_VFS_OLD},</div><div class='add'>+	{"vfsv0",	QFMT_VFS_V0},</div><div class='add'>+	{"vfsv1",	QFMT_VFS_V1},</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct constant_table f2fs_param_alloc_mode[] = {</div><div class='add'>+	{"default",	ALLOC_MODE_DEFAULT},</div><div class='add'>+	{"reuse",	ALLOC_MODE_REUSE},</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='add'>+static const struct constant_table f2fs_param_fsync_mode[] = {</div><div class='add'>+	{"posix",	FSYNC_MODE_POSIX},</div><div class='add'>+	{"strict",	FSYNC_MODE_STRICT},</div><div class='add'>+	{"nobarrier",	FSYNC_MODE_NOBARRIER},</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct constant_table f2fs_param_compress_mode[] = {</div><div class='add'>+	{"fs",		COMPR_MODE_FS},</div><div class='add'>+	{"user",	COMPR_MODE_USER},</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct constant_table f2fs_param_discard_unit[] = {</div><div class='add'>+	{"block",	DISCARD_UNIT_BLOCK},</div><div class='add'>+	{"segment",	DISCARD_UNIT_SEGMENT},</div><div class='add'>+	{"section",	DISCARD_UNIT_SECTION},</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct constant_table f2fs_param_memory_mode[] = {</div><div class='add'>+	{"normal",	MEMORY_MODE_NORMAL},</div><div class='add'>+	{"low",		MEMORY_MODE_LOW},</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct constant_table f2fs_param_errors[] = {</div><div class='add'>+	{"remount-ro",	MOUNT_ERRORS_READONLY},</div><div class='add'>+	{"continue",	MOUNT_ERRORS_CONTINUE},</div><div class='add'>+	{"panic",	MOUNT_ERRORS_PANIC},</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct constant_table f2fs_param_lookup_mode[] = {</div><div class='add'>+	{"perf",	LOOKUP_PERF},</div><div class='add'>+	{"compat",	LOOKUP_COMPAT},</div><div class='add'>+	{"auto",	LOOKUP_AUTO},</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct fs_parameter_spec f2fs_param_specs[] = {</div><div class='add'>+	fsparam_enum("background_gc", Opt_gc_background, f2fs_param_background_gc),</div><div class='add'>+	fsparam_flag("disable_roll_forward", Opt_disable_roll_forward),</div><div class='add'>+	fsparam_flag("norecovery", Opt_norecovery),</div><div class='add'>+	fsparam_flag_no("discard", Opt_discard),</div><div class='add'>+	fsparam_flag("no_heap", Opt_noheap),</div><div class='add'>+	fsparam_flag("heap", Opt_heap),</div><div class='add'>+	fsparam_flag_no("user_xattr", Opt_user_xattr),</div><div class='add'>+	fsparam_flag_no("acl", Opt_acl),</div><div class='add'>+	fsparam_s32("active_logs", Opt_active_logs),</div><div class='add'>+	fsparam_flag("disable_ext_identify", Opt_disable_ext_identify),</div><div class='add'>+	fsparam_flag_no("inline_xattr", Opt_inline_xattr),</div><div class='add'>+	fsparam_s32("inline_xattr_size", Opt_inline_xattr_size),</div><div class='add'>+	fsparam_flag_no("inline_data", Opt_inline_data),</div><div class='add'>+	fsparam_flag_no("inline_dentry", Opt_inline_dentry),</div><div class='add'>+	fsparam_flag_no("flush_merge", Opt_flush_merge),</div><div class='add'>+	fsparam_flag_no("barrier", Opt_barrier),</div><div class='add'>+	fsparam_flag("fastboot", Opt_fastboot),</div><div class='add'>+	fsparam_flag_no("extent_cache", Opt_extent_cache),</div><div class='add'>+	fsparam_flag("data_flush", Opt_data_flush),</div><div class='add'>+	fsparam_u32("reserve_root", Opt_reserve_root),</div><div class='add'>+	fsparam_u32("reserve_node", Opt_reserve_node),</div><div class='add'>+	fsparam_gid("resgid", Opt_resgid),</div><div class='add'>+	fsparam_uid("resuid", Opt_resuid),</div><div class='add'>+	fsparam_enum("mode", Opt_mode, f2fs_param_mode),</div><div class='add'>+	fsparam_s32("fault_injection", Opt_fault_injection),</div><div class='add'>+	fsparam_u32("fault_type", Opt_fault_type),</div><div class='add'>+	fsparam_flag_no("lazytime", Opt_lazytime),</div><div class='add'>+	fsparam_flag_no("quota", Opt_quota),</div><div class='add'>+	fsparam_flag("usrquota", Opt_usrquota),</div><div class='add'>+	fsparam_flag("grpquota", Opt_grpquota),</div><div class='add'>+	fsparam_flag("prjquota", Opt_prjquota),</div><div class='add'>+	fsparam_string_empty("usrjquota", Opt_usrjquota),</div><div class='add'>+	fsparam_string_empty("grpjquota", Opt_grpjquota),</div><div class='add'>+	fsparam_string_empty("prjjquota", Opt_prjjquota),</div><div class='add'>+	fsparam_flag("nat_bits", Opt_nat_bits),</div><div class='add'>+	fsparam_enum("jqfmt", Opt_jqfmt, f2fs_param_jqfmt),</div><div class='add'>+	fsparam_enum("alloc_mode", Opt_alloc, f2fs_param_alloc_mode),</div><div class='add'>+	fsparam_enum("fsync_mode", Opt_fsync, f2fs_param_fsync_mode),</div><div class='add'>+	fsparam_string("test_dummy_encryption", Opt_test_dummy_encryption),</div><div class='add'>+	fsparam_flag("test_dummy_encryption", Opt_test_dummy_encryption),</div><div class='add'>+	fsparam_flag("inlinecrypt", Opt_inlinecrypt),</div><div class='add'>+	fsparam_string("checkpoint", Opt_checkpoint),</div><div class='add'>+	fsparam_flag_no("checkpoint_merge", Opt_checkpoint_merge),</div><div class='add'>+	fsparam_string("compress_algorithm", Opt_compress_algorithm),</div><div class='add'>+	fsparam_u32("compress_log_size", Opt_compress_log_size),</div><div class='add'>+	fsparam_string("compress_extension", Opt_compress_extension),</div><div class='add'>+	fsparam_string("nocompress_extension", Opt_nocompress_extension),</div><div class='add'>+	fsparam_flag("compress_chksum", Opt_compress_chksum),</div><div class='add'>+	fsparam_enum("compress_mode", Opt_compress_mode, f2fs_param_compress_mode),</div><div class='add'>+	fsparam_flag("compress_cache", Opt_compress_cache),</div><div class='add'>+	fsparam_flag("atgc", Opt_atgc),</div><div class='add'>+	fsparam_flag_no("gc_merge", Opt_gc_merge),</div><div class='add'>+	fsparam_enum("discard_unit", Opt_discard_unit, f2fs_param_discard_unit),</div><div class='add'>+	fsparam_enum("memory", Opt_memory_mode, f2fs_param_memory_mode),</div><div class='add'>+	fsparam_flag("age_extent_cache", Opt_age_extent_cache),</div><div class='add'>+	fsparam_enum("errors", Opt_errors, f2fs_param_errors),</div><div class='add'>+	fsparam_enum("lookup_mode", Opt_lookup_mode, f2fs_param_lookup_mode),</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/* Resort to a match_table for this interestingly formatted option */</div><div class='add'>+static match_table_t f2fs_checkpoint_tokens = {</div><div class='add'>+	{Opt_checkpoint_disable, "disable"},</div><div class='add'>+	{Opt_checkpoint_disable_cap, "disable:%u"},</div><div class='add'>+	{Opt_checkpoint_disable_cap_perc, "disable:%u%%"},</div><div class='add'>+	{Opt_checkpoint_enable, "enable"},</div><div class='ctx'> 	{Opt_err, NULL},</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-void f2fs_printk(struct f2fs_sb_info *sbi, const char *fmt, ...)</div><div class='add'>+#define F2FS_SPEC_background_gc			(1 &lt;&lt; 0)</div><div class='add'>+#define F2FS_SPEC_inline_xattr_size		(1 &lt;&lt; 1)</div><div class='add'>+#define F2FS_SPEC_active_logs			(1 &lt;&lt; 2)</div><div class='add'>+#define F2FS_SPEC_reserve_root			(1 &lt;&lt; 3)</div><div class='add'>+#define F2FS_SPEC_resgid			(1 &lt;&lt; 4)</div><div class='add'>+#define F2FS_SPEC_resuid			(1 &lt;&lt; 5)</div><div class='add'>+#define F2FS_SPEC_mode				(1 &lt;&lt; 6)</div><div class='add'>+#define F2FS_SPEC_fault_injection		(1 &lt;&lt; 7)</div><div class='add'>+#define F2FS_SPEC_fault_type			(1 &lt;&lt; 8)</div><div class='add'>+#define F2FS_SPEC_jqfmt				(1 &lt;&lt; 9)</div><div class='add'>+#define F2FS_SPEC_alloc_mode			(1 &lt;&lt; 10)</div><div class='add'>+#define F2FS_SPEC_fsync_mode			(1 &lt;&lt; 11)</div><div class='add'>+#define F2FS_SPEC_checkpoint_disable_cap	(1 &lt;&lt; 12)</div><div class='add'>+#define F2FS_SPEC_checkpoint_disable_cap_perc	(1 &lt;&lt; 13)</div><div class='add'>+#define F2FS_SPEC_compress_level		(1 &lt;&lt; 14)</div><div class='add'>+#define F2FS_SPEC_compress_algorithm		(1 &lt;&lt; 15)</div><div class='add'>+#define F2FS_SPEC_compress_log_size		(1 &lt;&lt; 16)</div><div class='add'>+#define F2FS_SPEC_compress_extension		(1 &lt;&lt; 17)</div><div class='add'>+#define F2FS_SPEC_nocompress_extension		(1 &lt;&lt; 18)</div><div class='add'>+#define F2FS_SPEC_compress_chksum		(1 &lt;&lt; 19)</div><div class='add'>+#define F2FS_SPEC_compress_mode			(1 &lt;&lt; 20)</div><div class='add'>+#define F2FS_SPEC_discard_unit			(1 &lt;&lt; 21)</div><div class='add'>+#define F2FS_SPEC_memory_mode			(1 &lt;&lt; 22)</div><div class='add'>+#define F2FS_SPEC_errors			(1 &lt;&lt; 23)</div><div class='add'>+#define F2FS_SPEC_lookup_mode			(1 &lt;&lt; 24)</div><div class='add'>+#define F2FS_SPEC_reserve_node			(1 &lt;&lt; 25)</div><div class='add'>+</div><div class='add'>+struct f2fs_fs_context {</div><div class='add'>+	struct f2fs_mount_info info;</div><div class='add'>+	unsigned long long opt_mask;	/* Bits changed */</div><div class='add'>+	unsigned int	spec_mask;</div><div class='add'>+	unsigned short	qname_mask;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+#define F2FS_CTX_INFO(ctx)	((ctx)-&gt;info)</div><div class='add'>+</div><div class='add'>+static inline void ctx_set_opt(struct f2fs_fs_context *ctx,</div><div class='add'>+			       enum f2fs_mount_opt flag)</div><div class='add'>+{</div><div class='add'>+	ctx-&gt;info.opt |= BIT(flag);</div><div class='add'>+	ctx-&gt;opt_mask |= BIT(flag);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void ctx_clear_opt(struct f2fs_fs_context *ctx,</div><div class='add'>+				 enum f2fs_mount_opt flag)</div><div class='add'>+{</div><div class='add'>+	ctx-&gt;info.opt &amp;= ~BIT(flag);</div><div class='add'>+	ctx-&gt;opt_mask |= BIT(flag);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool ctx_test_opt(struct f2fs_fs_context *ctx,</div><div class='add'>+				enum f2fs_mount_opt flag)</div><div class='add'>+{</div><div class='add'>+	return ctx-&gt;info.opt &amp; BIT(flag);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void f2fs_printk(struct f2fs_sb_info *sbi, bool limit_rate,</div><div class='add'>+					const char *fmt, ...)</div><div class='ctx'> {</div><div class='ctx'> 	struct va_format vaf;</div><div class='ctx'> 	va_list args;</div><div class='hunk'>@@ -250,49 +391,52 @@ void f2fs_printk(struct f2fs_sb_info *sbi, const char *fmt, ...)</div><div class='ctx'> 	level = printk_get_level(fmt);</div><div class='ctx'> 	vaf.fmt = printk_skip_level(fmt);</div><div class='ctx'> 	vaf.va = &amp;args;</div><div class='del'>-	printk("%c%cF2FS-fs (%s): %pV\n",</div><div class='del'>-	       KERN_SOH_ASCII, level, sbi-&gt;sb-&gt;s_id, &amp;vaf);</div><div class='add'>+	if (limit_rate)</div><div class='add'>+		if (sbi)</div><div class='add'>+			printk_ratelimited("%c%cF2FS-fs (%s): %pV\n",</div><div class='add'>+				KERN_SOH_ASCII, level, sbi-&gt;sb-&gt;s_id, &amp;vaf);</div><div class='add'>+		else</div><div class='add'>+			printk_ratelimited("%c%cF2FS-fs: %pV\n",</div><div class='add'>+				KERN_SOH_ASCII, level, &amp;vaf);</div><div class='add'>+	else</div><div class='add'>+		if (sbi)</div><div class='add'>+			printk("%c%cF2FS-fs (%s): %pV\n",</div><div class='add'>+				KERN_SOH_ASCII, level, sbi-&gt;sb-&gt;s_id, &amp;vaf);</div><div class='add'>+		else</div><div class='add'>+			printk("%c%cF2FS-fs: %pV\n",</div><div class='add'>+				KERN_SOH_ASCII, level, &amp;vaf);</div><div class='ctx'> </div><div class='ctx'> 	va_end(args);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='ctx'> static const struct f2fs_sb_encodings {</div><div class='ctx'> 	__u16 magic;</div><div class='ctx'> 	char *name;</div><div class='del'>-	char *version;</div><div class='add'>+	unsigned int version;</div><div class='ctx'> } f2fs_sb_encoding_map[] = {</div><div class='del'>-	{F2FS_ENC_UTF8_12_1, "utf8", "12.1.0"},</div><div class='add'>+	{F2FS_ENC_UTF8_12_1, "utf8", UNICODE_AGE(12, 1, 0)},</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int f2fs_sb_read_encoding(const struct f2fs_super_block *sb,</div><div class='del'>-				 const struct f2fs_sb_encodings **encoding,</div><div class='del'>-				 __u16 *flags)</div><div class='add'>+static const struct f2fs_sb_encodings *</div><div class='add'>+f2fs_sb_read_encoding(const struct f2fs_super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	__u16 magic = le16_to_cpu(sb-&gt;s_encoding);</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; ARRAY_SIZE(f2fs_sb_encoding_map); i++)</div><div class='ctx'> 		if (magic == f2fs_sb_encoding_map[i].magic)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-	if (i &gt;= ARRAY_SIZE(f2fs_sb_encoding_map))</div><div class='del'>-		return -EINVAL;</div><div class='add'>+			return &amp;f2fs_sb_encoding_map[i];</div><div class='ctx'> </div><div class='del'>-	*encoding = &amp;f2fs_sb_encoding_map[i];</div><div class='del'>-	*flags = le16_to_cpu(sb-&gt;s_encoding_flags);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='add'>+	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct kmem_cache *f2fs_cf_name_slab;</div><div class='ctx'> static int __init f2fs_create_casefold_cache(void)</div><div class='ctx'> {</div><div class='ctx'> 	f2fs_cf_name_slab = f2fs_kmem_cache_create("f2fs_casefolded_name",</div><div class='del'>-							F2FS_NAME_LEN);</div><div class='del'>-	if (!f2fs_cf_name_slab)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	return 0;</div><div class='add'>+						   F2FS_NAME_LEN);</div><div class='add'>+	return f2fs_cf_name_slab ? 0 : -ENOMEM;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void f2fs_destroy_casefold_cache(void)</div><div class='hunk'>@@ -306,22 +450,30 @@ static void f2fs_destroy_casefold_cache(void) { }</div><div class='ctx'> </div><div class='ctx'> static inline void limit_reserve_root(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='del'>-	block_t limit = min((sbi-&gt;user_block_count &lt;&lt; 1) / 1000,</div><div class='add'>+	block_t block_limit = min((sbi-&gt;user_block_count &gt;&gt; 3),</div><div class='ctx'> 			sbi-&gt;user_block_count - sbi-&gt;reserved_blocks);</div><div class='add'>+	block_t node_limit = sbi-&gt;total_node_count &gt;&gt; 3;</div><div class='ctx'> </div><div class='del'>-	/* limit is 0.2% */</div><div class='add'>+	/* limit is 12.5% */</div><div class='ctx'> 	if (test_opt(sbi, RESERVE_ROOT) &amp;&amp;</div><div class='del'>-			F2FS_OPTION(sbi).root_reserved_blocks &gt; limit) {</div><div class='del'>-		F2FS_OPTION(sbi).root_reserved_blocks = limit;</div><div class='add'>+			F2FS_OPTION(sbi).root_reserved_blocks &gt; block_limit) {</div><div class='add'>+		F2FS_OPTION(sbi).root_reserved_blocks = block_limit;</div><div class='ctx'> 		f2fs_info(sbi, "Reduce reserved blocks for root = %u",</div><div class='ctx'> 			  F2FS_OPTION(sbi).root_reserved_blocks);</div><div class='ctx'> 	}</div><div class='del'>-	if (!test_opt(sbi, RESERVE_ROOT) &amp;&amp;</div><div class='add'>+	if (test_opt(sbi, RESERVE_NODE) &amp;&amp;</div><div class='add'>+			F2FS_OPTION(sbi).root_reserved_nodes &gt; node_limit) {</div><div class='add'>+		F2FS_OPTION(sbi).root_reserved_nodes = node_limit;</div><div class='add'>+		f2fs_info(sbi, "Reduce reserved nodes for root = %u",</div><div class='add'>+			  F2FS_OPTION(sbi).root_reserved_nodes);</div><div class='add'>+	}</div><div class='add'>+	if (!test_opt(sbi, RESERVE_ROOT) &amp;&amp; !test_opt(sbi, RESERVE_NODE) &amp;&amp;</div><div class='ctx'> 		(!uid_eq(F2FS_OPTION(sbi).s_resuid,</div><div class='ctx'> 				make_kuid(&amp;init_user_ns, F2FS_DEF_RESUID)) ||</div><div class='ctx'> 		!gid_eq(F2FS_OPTION(sbi).s_resgid,</div><div class='ctx'> 				make_kgid(&amp;init_user_ns, F2FS_DEF_RESGID))))</div><div class='del'>-		f2fs_info(sbi, "Ignore s_resuid=%u, s_resgid=%u w/o reserve_root",</div><div class='add'>+		f2fs_info(sbi, "Ignore s_resuid=%u, s_resgid=%u w/o reserve_root"</div><div class='add'>+				" and reserve_node",</div><div class='ctx'> 			  from_kuid_munged(&amp;init_user_ns,</div><div class='ctx'> 					   F2FS_OPTION(sbi).s_resuid),</div><div class='ctx'> 			  from_kgid_munged(&amp;init_user_ns,</div><div class='hunk'>@@ -349,157 +501,123 @@ static void init_once(void *foo)</div><div class='ctx'> 	struct f2fs_inode_info *fi = (struct f2fs_inode_info *) foo;</div><div class='ctx'> </div><div class='ctx'> 	inode_init_once(&amp;fi-&gt;vfs_inode);</div><div class='add'>+#ifdef CONFIG_FS_ENCRYPTION</div><div class='add'>+	fi-&gt;i_crypt_info = NULL;</div><div class='add'>+#endif</div><div class='add'>+#ifdef CONFIG_FS_VERITY</div><div class='add'>+	fi-&gt;i_verity_info = NULL;</div><div class='add'>+#endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='ctx'> static const char * const quotatypes[] = INITQFNAMES;</div><div class='ctx'> #define QTYPE2NAME(t) (quotatypes[t])</div><div class='del'>-static int f2fs_set_qf_name(struct super_block *sb, int qtype,</div><div class='del'>-							substring_t *args)</div><div class='add'>+/*</div><div class='add'>+ * Note the name of the specified quota file.</div><div class='add'>+ */</div><div class='add'>+static int f2fs_note_qf_name(struct fs_context *fc, int qtype,</div><div class='add'>+			     struct fs_parameter *param)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_sb_info *sbi = F2FS_SB(sb);</div><div class='add'>+	struct f2fs_fs_context *ctx = fc-&gt;fs_private;</div><div class='ctx'> 	char *qname;</div><div class='del'>-	int ret = -EINVAL;</div><div class='ctx'> </div><div class='del'>-	if (sb_any_quota_loaded(sb) &amp;&amp; !F2FS_OPTION(sbi).s_qf_names[qtype]) {</div><div class='del'>-		f2fs_err(sbi, "Cannot change journaled quota options when quota turned on");</div><div class='add'>+	if (param-&gt;size &lt; 1) {</div><div class='add'>+		f2fs_err(NULL, "Missing quota name");</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-	if (f2fs_sb_has_quota_ino(sbi)) {</div><div class='del'>-		f2fs_info(sbi, "QUOTA feature is enabled, so ignore qf_name");</div><div class='add'>+	if (strchr(param-&gt;string, '/')) {</div><div class='add'>+		f2fs_err(NULL, "quotafile must be on filesystem root");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+	if (ctx-&gt;info.s_qf_names[qtype]) {</div><div class='add'>+		if (strcmp(ctx-&gt;info.s_qf_names[qtype], param-&gt;string) != 0) {</div><div class='add'>+			f2fs_err(NULL, "Quota file already specified");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	qname = match_strdup(args);</div><div class='add'>+	qname = kmemdup_nul(param-&gt;string, param-&gt;size, GFP_KERNEL);</div><div class='ctx'> 	if (!qname) {</div><div class='del'>-		f2fs_err(sbi, "Not enough memory for storing quotafile name");</div><div class='add'>+		f2fs_err(NULL, "Not enough memory for storing quotafile name");</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	}</div><div class='del'>-	if (F2FS_OPTION(sbi).s_qf_names[qtype]) {</div><div class='del'>-		if (strcmp(F2FS_OPTION(sbi).s_qf_names[qtype], qname) == 0)</div><div class='del'>-			ret = 0;</div><div class='del'>-		else</div><div class='del'>-			f2fs_err(sbi, "%s quota file already specified",</div><div class='del'>-				 QTYPE2NAME(qtype));</div><div class='del'>-		goto errout;</div><div class='del'>-	}</div><div class='del'>-	if (strchr(qname, '/')) {</div><div class='del'>-		f2fs_err(sbi, "quotafile must be on filesystem root");</div><div class='del'>-		goto errout;</div><div class='del'>-	}</div><div class='del'>-	F2FS_OPTION(sbi).s_qf_names[qtype] = qname;</div><div class='del'>-	set_opt(sbi, QUOTA);</div><div class='add'>+	F2FS_CTX_INFO(ctx).s_qf_names[qtype] = qname;</div><div class='add'>+	ctx-&gt;qname_mask |= 1 &lt;&lt; qtype;</div><div class='ctx'> 	return 0;</div><div class='del'>-errout:</div><div class='del'>-	kfree(qname);</div><div class='del'>-	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_clear_qf_name(struct super_block *sb, int qtype)</div><div class='add'>+/*</div><div class='add'>+ * Clear the name of the specified quota file.</div><div class='add'>+ */</div><div class='add'>+static int f2fs_unnote_qf_name(struct fs_context *fc, int qtype)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_sb_info *sbi = F2FS_SB(sb);</div><div class='add'>+	struct f2fs_fs_context *ctx = fc-&gt;fs_private;</div><div class='ctx'> </div><div class='del'>-	if (sb_any_quota_loaded(sb) &amp;&amp; F2FS_OPTION(sbi).s_qf_names[qtype]) {</div><div class='del'>-		f2fs_err(sbi, "Cannot change journaled quota options when quota turned on");</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-	kfree(F2FS_OPTION(sbi).s_qf_names[qtype]);</div><div class='del'>-	F2FS_OPTION(sbi).s_qf_names[qtype] = NULL;</div><div class='add'>+	kfree(ctx-&gt;info.s_qf_names[qtype]);</div><div class='add'>+	ctx-&gt;info.s_qf_names[qtype] = NULL;</div><div class='add'>+	ctx-&gt;qname_mask |= 1 &lt;&lt; qtype;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_check_quota_options(struct f2fs_sb_info *sbi)</div><div class='add'>+static void f2fs_unnote_qf_name_all(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	/*</div><div class='del'>-	 * We do the test below only for project quotas. 'usrquota' and</div><div class='del'>-	 * 'grpquota' mount options are allowed even without quota feature</div><div class='del'>-	 * to support legacy quotas in quota files.</div><div class='del'>-	 */</div><div class='del'>-	if (test_opt(sbi, PRJQUOTA) &amp;&amp; !f2fs_sb_has_project_quota(sbi)) {</div><div class='del'>-		f2fs_err(sbi, "Project quota feature not enabled. Cannot enable project quota enforcement.");</div><div class='del'>-		return -1;</div><div class='del'>-	}</div><div class='del'>-	if (F2FS_OPTION(sbi).s_qf_names[USRQUOTA] ||</div><div class='del'>-			F2FS_OPTION(sbi).s_qf_names[GRPQUOTA] ||</div><div class='del'>-			F2FS_OPTION(sbi).s_qf_names[PRJQUOTA]) {</div><div class='del'>-		if (test_opt(sbi, USRQUOTA) &amp;&amp;</div><div class='del'>-				F2FS_OPTION(sbi).s_qf_names[USRQUOTA])</div><div class='del'>-			clear_opt(sbi, USRQUOTA);</div><div class='del'>-</div><div class='del'>-		if (test_opt(sbi, GRPQUOTA) &amp;&amp;</div><div class='del'>-				F2FS_OPTION(sbi).s_qf_names[GRPQUOTA])</div><div class='del'>-			clear_opt(sbi, GRPQUOTA);</div><div class='del'>-</div><div class='del'>-		if (test_opt(sbi, PRJQUOTA) &amp;&amp;</div><div class='del'>-				F2FS_OPTION(sbi).s_qf_names[PRJQUOTA])</div><div class='del'>-			clear_opt(sbi, PRJQUOTA);</div><div class='del'>-</div><div class='del'>-		if (test_opt(sbi, GRPQUOTA) || test_opt(sbi, USRQUOTA) ||</div><div class='del'>-				test_opt(sbi, PRJQUOTA)) {</div><div class='del'>-			f2fs_err(sbi, "old and new quota format mixing");</div><div class='del'>-			return -1;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (!F2FS_OPTION(sbi).s_jquota_fmt) {</div><div class='del'>-			f2fs_err(sbi, "journaled quota format not specified");</div><div class='del'>-			return -1;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	int i;</div><div class='ctx'> </div><div class='del'>-	if (f2fs_sb_has_quota_ino(sbi) &amp;&amp; F2FS_OPTION(sbi).s_jquota_fmt) {</div><div class='del'>-		f2fs_info(sbi, "QUOTA feature is enabled, so ignore jquota_fmt");</div><div class='del'>-		F2FS_OPTION(sbi).s_jquota_fmt = 0;</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='add'>+	for (i = 0; i &lt; MAXQUOTAS; i++)</div><div class='add'>+		f2fs_unnote_qf_name(fc, i);</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-static int f2fs_set_test_dummy_encryption(struct super_block *sb,</div><div class='del'>-					  const char *opt,</div><div class='del'>-					  const substring_t *arg,</div><div class='del'>-					  bool is_remount)</div><div class='add'>+static int f2fs_parse_test_dummy_encryption(const struct fs_parameter *param,</div><div class='add'>+					    struct f2fs_fs_context *ctx)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_sb_info *sbi = F2FS_SB(sb);</div><div class='del'>-#ifdef CONFIG_FS_ENCRYPTION</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	if (!f2fs_sb_has_encrypt(sbi)) {</div><div class='del'>-		f2fs_err(sbi, "Encrypt feature is off");</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * This mount option is just for testing, and it's not worthwhile to</div><div class='del'>-	 * implement the extra complexity (e.g. RCU protection) that would be</div><div class='del'>-	 * needed to allow it to be set or changed during remount.  We do allow</div><div class='del'>-	 * it to be specified during remount, but only if there is no change.</div><div class='del'>-	 */</div><div class='del'>-	if (is_remount &amp;&amp; !F2FS_OPTION(sbi).dummy_enc_policy.policy) {</div><div class='del'>-		f2fs_warn(sbi, "Can't set test_dummy_encryption on remount");</div><div class='add'>+	if (!IS_ENABLED(CONFIG_FS_ENCRYPTION)) {</div><div class='add'>+		f2fs_warn(NULL, "test_dummy_encryption option not supported");</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-	err = fscrypt_set_test_dummy_encryption(</div><div class='del'>-		sb, arg-&gt;from, &amp;F2FS_OPTION(sbi).dummy_enc_policy);</div><div class='add'>+	err = fscrypt_parse_test_dummy_encryption(param,</div><div class='add'>+					&amp;ctx-&gt;info.dummy_enc_policy);</div><div class='ctx'> 	if (err) {</div><div class='del'>-		if (err == -EEXIST)</div><div class='del'>-			f2fs_warn(sbi,</div><div class='del'>-				  "Can't change test_dummy_encryption on remount");</div><div class='del'>-		else if (err == -EINVAL)</div><div class='del'>-			f2fs_warn(sbi, "Value of option \"%s\" is unrecognized",</div><div class='del'>-				  opt);</div><div class='add'>+		if (err == -EINVAL)</div><div class='add'>+			f2fs_warn(NULL, "Value of option \"%s\" is unrecognized",</div><div class='add'>+				  param-&gt;key);</div><div class='add'>+		else if (err == -EEXIST)</div><div class='add'>+			f2fs_warn(NULL, "Conflicting test_dummy_encryption options");</div><div class='ctx'> 		else</div><div class='del'>-			f2fs_warn(sbi, "Error processing option \"%s\" [%d]",</div><div class='del'>-				  opt, err);</div><div class='add'>+			f2fs_warn(NULL, "Error processing option \"%s\" [%d]",</div><div class='add'>+				  param-&gt;key, err);</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-	f2fs_warn(sbi, "Test dummy encryption mode enabled");</div><div class='del'>-#else</div><div class='del'>-	f2fs_warn(sbi, "Test dummy encryption mount option ignored");</div><div class='del'>-#endif</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='add'>+static bool is_compress_extension_exist(struct f2fs_mount_info *info,</div><div class='add'>+					const char *new_ext, bool is_ext)</div><div class='add'>+{</div><div class='add'>+	unsigned char (*ext)[F2FS_EXTENSION_LEN];</div><div class='add'>+	int ext_cnt;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	if (is_ext) {</div><div class='add'>+		ext = info-&gt;extensions;</div><div class='add'>+		ext_cnt = info-&gt;compress_ext_cnt;</div><div class='add'>+	} else {</div><div class='add'>+		ext = info-&gt;noextensions;</div><div class='add'>+		ext_cnt = info-&gt;nocompress_ext_cnt;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; ext_cnt; i++) {</div><div class='add'>+		if (!strcasecmp(new_ext, ext[i]))</div><div class='add'>+			return true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * 1. The same extension name cannot not appear in both compress and non-compress extension</div><div class='ctx'>  * at the same time.</div><div class='hunk'>@@ -507,28 +625,28 @@ static int f2fs_set_test_dummy_encryption(struct super_block *sb,</div><div class='ctx'>  * extension will be treated as special cases and will not be compressed.</div><div class='ctx'>  * 3. Don't allow the non-compress extension specifies all files.</div><div class='ctx'>  */</div><div class='del'>-static int f2fs_test_compress_extension(struct f2fs_sb_info *sbi)</div><div class='add'>+static int f2fs_test_compress_extension(unsigned char (*noext)[F2FS_EXTENSION_LEN],</div><div class='add'>+					int noext_cnt,</div><div class='add'>+					unsigned char (*ext)[F2FS_EXTENSION_LEN],</div><div class='add'>+					int ext_cnt)</div><div class='ctx'> {</div><div class='del'>-	unsigned char (*ext)[F2FS_EXTENSION_LEN];</div><div class='del'>-	unsigned char (*noext)[F2FS_EXTENSION_LEN];</div><div class='del'>-	int ext_cnt, noext_cnt, index = 0, no_index = 0;</div><div class='del'>-</div><div class='del'>-	ext = F2FS_OPTION(sbi).extensions;</div><div class='del'>-	ext_cnt = F2FS_OPTION(sbi).compress_ext_cnt;</div><div class='del'>-	noext = F2FS_OPTION(sbi).noextensions;</div><div class='del'>-	noext_cnt = F2FS_OPTION(sbi).nocompress_ext_cnt;</div><div class='add'>+	int index = 0, no_index = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (!noext_cnt)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	for (no_index = 0; no_index &lt; noext_cnt; no_index++) {</div><div class='add'>+		if (strlen(noext[no_index]) == 0)</div><div class='add'>+			continue;</div><div class='ctx'> 		if (!strcasecmp("*", noext[no_index])) {</div><div class='del'>-			f2fs_info(sbi, "Don't allow the nocompress extension specifies all files");</div><div class='add'>+			f2fs_info(NULL, "Don't allow the nocompress extension specifies all files");</div><div class='ctx'> 			return -EINVAL;</div><div class='ctx'> 		}</div><div class='ctx'> 		for (index = 0; index &lt; ext_cnt; index++) {</div><div class='add'>+			if (strlen(ext[index]) == 0)</div><div class='add'>+				continue;</div><div class='ctx'> 			if (!strcasecmp(ext[index], noext[no_index])) {</div><div class='del'>-				f2fs_info(sbi, "Don't allow the same extension %s appear in both compress and nocompress extension",</div><div class='add'>+				f2fs_info(NULL, "Don't allow the same extension %s appear in both compress and nocompress extension",</div><div class='ctx'> 						ext[index]);</div><div class='ctx'> 				return -EINVAL;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -538,767 +656,895 @@ static int f2fs_test_compress_extension(struct f2fs_sb_info *sbi)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_F2FS_FS_LZ4</div><div class='del'>-static int f2fs_set_lz4hc_level(struct f2fs_sb_info *sbi, const char *str)</div><div class='add'>+static int f2fs_set_lz4hc_level(struct f2fs_fs_context *ctx, const char *str)</div><div class='ctx'> {</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_LZ4HC</div><div class='ctx'> 	unsigned int level;</div><div class='del'>-#endif</div><div class='ctx'> </div><div class='ctx'> 	if (strlen(str) == 3) {</div><div class='del'>-		F2FS_OPTION(sbi).compress_level = 0;</div><div class='add'>+		F2FS_CTX_INFO(ctx).compress_level = 0;</div><div class='add'>+		ctx-&gt;spec_mask |= F2FS_SPEC_compress_level;</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_F2FS_FS_LZ4HC</div><div class='ctx'> 	str += 3;</div><div class='ctx'> </div><div class='ctx'> 	if (str[0] != ':') {</div><div class='del'>-		f2fs_info(sbi, "wrong format, e.g. &lt;alg_name&gt;:&lt;compr_level&gt;");</div><div class='add'>+		f2fs_info(NULL, "wrong format, e.g. &lt;alg_name&gt;:&lt;compr_level&gt;");</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (kstrtouint(str + 1, 10, &amp;level))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	if (level &lt; LZ4HC_MIN_CLEVEL || level &gt; LZ4HC_MAX_CLEVEL) {</div><div class='del'>-		f2fs_info(sbi, "invalid lz4hc compress level: %d", level);</div><div class='add'>+	if (!f2fs_is_compress_level_valid(COMPRESS_LZ4, level)) {</div><div class='add'>+		f2fs_info(NULL, "invalid lz4hc compress level: %d", level);</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	F2FS_OPTION(sbi).compress_level = level;</div><div class='add'>+	F2FS_CTX_INFO(ctx).compress_level = level;</div><div class='add'>+	ctx-&gt;spec_mask |= F2FS_SPEC_compress_level;</div><div class='ctx'> 	return 0;</div><div class='ctx'> #else</div><div class='del'>-	f2fs_info(sbi, "kernel doesn't support lz4hc compression");</div><div class='add'>+	if (strlen(str) == 3) {</div><div class='add'>+		F2FS_CTX_INFO(ctx).compress_level = 0;</div><div class='add'>+		ctx-&gt;spec_mask |= F2FS_SPEC_compress_level;</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+	f2fs_info(NULL, "kernel doesn't support lz4hc compression");</div><div class='ctx'> 	return -EINVAL;</div><div class='ctx'> #endif</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_F2FS_FS_ZSTD</div><div class='del'>-static int f2fs_set_zstd_level(struct f2fs_sb_info *sbi, const char *str)</div><div class='add'>+static int f2fs_set_zstd_level(struct f2fs_fs_context *ctx, const char *str)</div><div class='ctx'> {</div><div class='del'>-	unsigned int level;</div><div class='add'>+	int level;</div><div class='ctx'> 	int len = 4;</div><div class='ctx'> </div><div class='ctx'> 	if (strlen(str) == len) {</div><div class='del'>-		F2FS_OPTION(sbi).compress_level = 0;</div><div class='add'>+		F2FS_CTX_INFO(ctx).compress_level = F2FS_ZSTD_DEFAULT_CLEVEL;</div><div class='add'>+		ctx-&gt;spec_mask |= F2FS_SPEC_compress_level;</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	str += len;</div><div class='ctx'> </div><div class='ctx'> 	if (str[0] != ':') {</div><div class='del'>-		f2fs_info(sbi, "wrong format, e.g. &lt;alg_name&gt;:&lt;compr_level&gt;");</div><div class='add'>+		f2fs_info(NULL, "wrong format, e.g. &lt;alg_name&gt;:&lt;compr_level&gt;");</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-	if (kstrtouint(str + 1, 10, &amp;level))</div><div class='add'>+	if (kstrtoint(str + 1, 10, &amp;level))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	if (!level || level &gt; ZSTD_maxCLevel()) {</div><div class='del'>-		f2fs_info(sbi, "invalid zstd compress level: %d", level);</div><div class='add'>+	/* f2fs does not support negative compress level now */</div><div class='add'>+	if (level &lt; 0) {</div><div class='add'>+		f2fs_info(NULL, "do not support negative compress level: %d", level);</div><div class='add'>+		return -ERANGE;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!f2fs_is_compress_level_valid(COMPRESS_ZSTD, level)) {</div><div class='add'>+		f2fs_info(NULL, "invalid zstd compress level: %d", level);</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	F2FS_OPTION(sbi).compress_level = level;</div><div class='add'>+	F2FS_CTX_INFO(ctx).compress_level = level;</div><div class='add'>+	ctx-&gt;spec_mask |= F2FS_SPEC_compress_level;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-static int parse_options(struct super_block *sb, char *options, bool is_remount)</div><div class='add'>+static int f2fs_parse_param(struct fs_context *fc, struct fs_parameter *param)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_sb_info *sbi = F2FS_SB(sb);</div><div class='del'>-	substring_t args[MAX_OPT_ARGS];</div><div class='add'>+	struct f2fs_fs_context *ctx = fc-&gt;fs_private;</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='ctx'> 	unsigned char (*ext)[F2FS_EXTENSION_LEN];</div><div class='ctx'> 	unsigned char (*noext)[F2FS_EXTENSION_LEN];</div><div class='ctx'> 	int ext_cnt, noext_cnt;</div><div class='add'>+	char *name;</div><div class='ctx'> #endif</div><div class='del'>-	char *p, *name;</div><div class='del'>-	int arg = 0;</div><div class='del'>-	kuid_t uid;</div><div class='del'>-	kgid_t gid;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (!options)</div><div class='del'>-		goto default_check;</div><div class='del'>-</div><div class='del'>-	while ((p = strsep(&amp;options, ",")) != NULL) {</div><div class='del'>-		int token;</div><div class='del'>-</div><div class='del'>-		if (!*p)</div><div class='del'>-			continue;</div><div class='del'>-		/*</div><div class='del'>-		 * Initialize args struct so we know whether arg was</div><div class='del'>-		 * found; some options take optional arguments.</div><div class='del'>-		 */</div><div class='del'>-		args[0].to = args[0].from = NULL;</div><div class='del'>-		token = match_token(p, f2fs_tokens, args);</div><div class='add'>+	substring_t args[MAX_OPT_ARGS];</div><div class='add'>+	struct fs_parse_result result;</div><div class='add'>+	int token, ret, arg;</div><div class='ctx'> </div><div class='del'>-		switch (token) {</div><div class='del'>-		case Opt_gc_background:</div><div class='del'>-			name = match_strdup(&amp;args[0]);</div><div class='add'>+	token = fs_parse(fc, f2fs_param_specs, param, &amp;result);</div><div class='add'>+	if (token &lt; 0)</div><div class='add'>+		return token;</div><div class='ctx'> </div><div class='del'>-			if (!name)</div><div class='del'>-				return -ENOMEM;</div><div class='del'>-			if (!strcmp(name, "on")) {</div><div class='del'>-				F2FS_OPTION(sbi).bggc_mode = BGGC_MODE_ON;</div><div class='del'>-			} else if (!strcmp(name, "off")) {</div><div class='del'>-				F2FS_OPTION(sbi).bggc_mode = BGGC_MODE_OFF;</div><div class='del'>-			} else if (!strcmp(name, "sync")) {</div><div class='del'>-				F2FS_OPTION(sbi).bggc_mode = BGGC_MODE_SYNC;</div><div class='del'>-			} else {</div><div class='del'>-				kfree(name);</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			}</div><div class='del'>-			kfree(name);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_disable_roll_forward:</div><div class='del'>-			set_opt(sbi, DISABLE_ROLL_FORWARD);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_norecovery:</div><div class='del'>-			/* this option mounts f2fs with ro */</div><div class='del'>-			set_opt(sbi, NORECOVERY);</div><div class='del'>-			if (!f2fs_readonly(sb))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_discard:</div><div class='del'>-			if (!f2fs_hw_support_discard(sbi)) {</div><div class='del'>-				f2fs_warn(sbi, "device does not support discard");</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			set_opt(sbi, DISCARD);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_nodiscard:</div><div class='del'>-			if (f2fs_hw_should_discard(sbi)) {</div><div class='del'>-				f2fs_warn(sbi, "discard is required for zoned block devices");</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			}</div><div class='del'>-			clear_opt(sbi, DISCARD);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_noheap:</div><div class='del'>-			set_opt(sbi, NOHEAP);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_heap:</div><div class='del'>-			clear_opt(sbi, NOHEAP);</div><div class='del'>-			break;</div><div class='add'>+	switch (token) {</div><div class='add'>+	case Opt_gc_background:</div><div class='add'>+		F2FS_CTX_INFO(ctx).bggc_mode = result.uint_32;</div><div class='add'>+		ctx-&gt;spec_mask |= F2FS_SPEC_background_gc;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_disable_roll_forward:</div><div class='add'>+		ctx_set_opt(ctx, F2FS_MOUNT_DISABLE_ROLL_FORWARD);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_norecovery:</div><div class='add'>+		/* requires ro mount, checked in f2fs_validate_options */</div><div class='add'>+		ctx_set_opt(ctx, F2FS_MOUNT_NORECOVERY);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_discard:</div><div class='add'>+		if (result.negated)</div><div class='add'>+			ctx_clear_opt(ctx, F2FS_MOUNT_DISCARD);</div><div class='add'>+		else</div><div class='add'>+			ctx_set_opt(ctx, F2FS_MOUNT_DISCARD);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_noheap:</div><div class='add'>+	case Opt_heap:</div><div class='add'>+		f2fs_warn(NULL, "heap/no_heap options were deprecated");</div><div class='add'>+		break;</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_XATTR</div><div class='del'>-		case Opt_user_xattr:</div><div class='del'>-			set_opt(sbi, XATTR_USER);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_nouser_xattr:</div><div class='del'>-			clear_opt(sbi, XATTR_USER);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_inline_xattr:</div><div class='del'>-			set_opt(sbi, INLINE_XATTR);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_noinline_xattr:</div><div class='del'>-			clear_opt(sbi, INLINE_XATTR);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_inline_xattr_size:</div><div class='del'>-			if (args-&gt;from &amp;&amp; match_int(args, &amp;arg))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			set_opt(sbi, INLINE_XATTR_SIZE);</div><div class='del'>-			F2FS_OPTION(sbi).inline_xattr_size = arg;</div><div class='del'>-			break;</div><div class='add'>+	case Opt_user_xattr:</div><div class='add'>+		if (result.negated)</div><div class='add'>+			ctx_clear_opt(ctx, F2FS_MOUNT_XATTR_USER);</div><div class='add'>+		else</div><div class='add'>+			ctx_set_opt(ctx, F2FS_MOUNT_XATTR_USER);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_inline_xattr:</div><div class='add'>+		if (result.negated)</div><div class='add'>+			ctx_clear_opt(ctx, F2FS_MOUNT_INLINE_XATTR);</div><div class='add'>+		else</div><div class='add'>+			ctx_set_opt(ctx, F2FS_MOUNT_INLINE_XATTR);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_inline_xattr_size:</div><div class='add'>+		if (result.int_32 &lt; MIN_INLINE_XATTR_SIZE ||</div><div class='add'>+			result.int_32 &gt; MAX_INLINE_XATTR_SIZE) {</div><div class='add'>+			f2fs_err(NULL, "inline xattr size is out of range: %u ~ %u",</div><div class='add'>+				 (u32)MIN_INLINE_XATTR_SIZE, (u32)MAX_INLINE_XATTR_SIZE);</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		ctx_set_opt(ctx, F2FS_MOUNT_INLINE_XATTR_SIZE);</div><div class='add'>+		F2FS_CTX_INFO(ctx).inline_xattr_size = result.int_32;</div><div class='add'>+		ctx-&gt;spec_mask |= F2FS_SPEC_inline_xattr_size;</div><div class='add'>+		break;</div><div class='ctx'> #else</div><div class='del'>-		case Opt_user_xattr:</div><div class='del'>-			f2fs_info(sbi, "user_xattr options not supported");</div><div class='del'>-			break;</div><div class='del'>-		case Opt_nouser_xattr:</div><div class='del'>-			f2fs_info(sbi, "nouser_xattr options not supported");</div><div class='del'>-			break;</div><div class='del'>-		case Opt_inline_xattr:</div><div class='del'>-			f2fs_info(sbi, "inline_xattr options not supported");</div><div class='del'>-			break;</div><div class='del'>-		case Opt_noinline_xattr:</div><div class='del'>-			f2fs_info(sbi, "noinline_xattr options not supported");</div><div class='del'>-			break;</div><div class='add'>+	case Opt_user_xattr:</div><div class='add'>+	case Opt_inline_xattr:</div><div class='add'>+	case Opt_inline_xattr_size:</div><div class='add'>+		f2fs_info(NULL, "%s options not supported", param-&gt;key);</div><div class='add'>+		break;</div><div class='ctx'> #endif</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_POSIX_ACL</div><div class='del'>-		case Opt_acl:</div><div class='del'>-			set_opt(sbi, POSIX_ACL);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_noacl:</div><div class='del'>-			clear_opt(sbi, POSIX_ACL);</div><div class='del'>-			break;</div><div class='add'>+	case Opt_acl:</div><div class='add'>+		if (result.negated)</div><div class='add'>+			ctx_clear_opt(ctx, F2FS_MOUNT_POSIX_ACL);</div><div class='add'>+		else</div><div class='add'>+			ctx_set_opt(ctx, F2FS_MOUNT_POSIX_ACL);</div><div class='add'>+		break;</div><div class='ctx'> #else</div><div class='del'>-		case Opt_acl:</div><div class='del'>-			f2fs_info(sbi, "acl options not supported");</div><div class='del'>-			break;</div><div class='del'>-		case Opt_noacl:</div><div class='del'>-			f2fs_info(sbi, "noacl options not supported");</div><div class='del'>-			break;</div><div class='add'>+	case Opt_acl:</div><div class='add'>+		f2fs_info(NULL, "%s options not supported", param-&gt;key);</div><div class='add'>+		break;</div><div class='ctx'> #endif</div><div class='del'>-		case Opt_active_logs:</div><div class='del'>-			if (args-&gt;from &amp;&amp; match_int(args, &amp;arg))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			if (arg != 2 &amp;&amp; arg != 4 &amp;&amp;</div><div class='del'>-				arg != NR_CURSEG_PERSIST_TYPE)</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			F2FS_OPTION(sbi).active_logs = arg;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_disable_ext_identify:</div><div class='del'>-			set_opt(sbi, DISABLE_EXT_IDENTIFY);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_inline_data:</div><div class='del'>-			set_opt(sbi, INLINE_DATA);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_inline_dentry:</div><div class='del'>-			set_opt(sbi, INLINE_DENTRY);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_noinline_dentry:</div><div class='del'>-			clear_opt(sbi, INLINE_DENTRY);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_flush_merge:</div><div class='del'>-			set_opt(sbi, FLUSH_MERGE);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_noflush_merge:</div><div class='del'>-			clear_opt(sbi, FLUSH_MERGE);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_nobarrier:</div><div class='del'>-			set_opt(sbi, NOBARRIER);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_fastboot:</div><div class='del'>-			set_opt(sbi, FASTBOOT);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_extent_cache:</div><div class='del'>-			set_opt(sbi, EXTENT_CACHE);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_noextent_cache:</div><div class='del'>-			clear_opt(sbi, EXTENT_CACHE);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_noinline_data:</div><div class='del'>-			clear_opt(sbi, INLINE_DATA);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_data_flush:</div><div class='del'>-			set_opt(sbi, DATA_FLUSH);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_reserve_root:</div><div class='del'>-			if (args-&gt;from &amp;&amp; match_int(args, &amp;arg))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			if (test_opt(sbi, RESERVE_ROOT)) {</div><div class='del'>-				f2fs_info(sbi, "Preserve previous reserve_root=%u",</div><div class='del'>-					  F2FS_OPTION(sbi).root_reserved_blocks);</div><div class='del'>-			} else {</div><div class='del'>-				F2FS_OPTION(sbi).root_reserved_blocks = arg;</div><div class='del'>-				set_opt(sbi, RESERVE_ROOT);</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		case Opt_resuid:</div><div class='del'>-			if (args-&gt;from &amp;&amp; match_int(args, &amp;arg))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			uid = make_kuid(current_user_ns(), arg);</div><div class='del'>-			if (!uid_valid(uid)) {</div><div class='del'>-				f2fs_err(sbi, "Invalid uid value %d", arg);</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			}</div><div class='del'>-			F2FS_OPTION(sbi).s_resuid = uid;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_resgid:</div><div class='del'>-			if (args-&gt;from &amp;&amp; match_int(args, &amp;arg))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			gid = make_kgid(current_user_ns(), arg);</div><div class='del'>-			if (!gid_valid(gid)) {</div><div class='del'>-				f2fs_err(sbi, "Invalid gid value %d", arg);</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			}</div><div class='del'>-			F2FS_OPTION(sbi).s_resgid = gid;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_mode:</div><div class='del'>-			name = match_strdup(&amp;args[0]);</div><div class='del'>-</div><div class='del'>-			if (!name)</div><div class='del'>-				return -ENOMEM;</div><div class='del'>-			if (!strcmp(name, "adaptive")) {</div><div class='del'>-				if (f2fs_sb_has_blkzoned(sbi)) {</div><div class='del'>-					f2fs_warn(sbi, "adaptive mode is not allowed with zoned block device feature");</div><div class='del'>-					kfree(name);</div><div class='del'>-					return -EINVAL;</div><div class='del'>-				}</div><div class='del'>-				F2FS_OPTION(sbi).fs_mode = FS_MODE_ADAPTIVE;</div><div class='del'>-			} else if (!strcmp(name, "lfs")) {</div><div class='del'>-				F2FS_OPTION(sbi).fs_mode = FS_MODE_LFS;</div><div class='del'>-			} else if (!strcmp(name, "fragment:segment")) {</div><div class='del'>-				F2FS_OPTION(sbi).fs_mode = FS_MODE_FRAGMENT_SEG;</div><div class='del'>-			} else if (!strcmp(name, "fragment:block")) {</div><div class='del'>-				F2FS_OPTION(sbi).fs_mode = FS_MODE_FRAGMENT_BLK;</div><div class='del'>-			} else {</div><div class='del'>-				kfree(name);</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			}</div><div class='del'>-			kfree(name);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_io_size_bits:</div><div class='del'>-			if (args-&gt;from &amp;&amp; match_int(args, &amp;arg))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			if (arg &lt;= 0 || arg &gt; __ilog2_u32(BIO_MAX_VECS)) {</div><div class='del'>-				f2fs_warn(sbi, "Not support %d, larger than %d",</div><div class='del'>-					  1 &lt;&lt; arg, BIO_MAX_VECS);</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			}</div><div class='del'>-			F2FS_OPTION(sbi).write_io_size_bits = arg;</div><div class='del'>-			break;</div><div class='add'>+	case Opt_active_logs:</div><div class='add'>+		if (result.int_32 != 2 &amp;&amp; result.int_32 != 4 &amp;&amp;</div><div class='add'>+			result.int_32 != NR_CURSEG_PERSIST_TYPE)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		ctx-&gt;spec_mask |= F2FS_SPEC_active_logs;</div><div class='add'>+		F2FS_CTX_INFO(ctx).active_logs = result.int_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_disable_ext_identify:</div><div class='add'>+		ctx_set_opt(ctx, F2FS_MOUNT_DISABLE_EXT_IDENTIFY);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_inline_data:</div><div class='add'>+		if (result.negated)</div><div class='add'>+			ctx_clear_opt(ctx, F2FS_MOUNT_INLINE_DATA);</div><div class='add'>+		else</div><div class='add'>+			ctx_set_opt(ctx, F2FS_MOUNT_INLINE_DATA);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_inline_dentry:</div><div class='add'>+		if (result.negated)</div><div class='add'>+			ctx_clear_opt(ctx, F2FS_MOUNT_INLINE_DENTRY);</div><div class='add'>+		else</div><div class='add'>+			ctx_set_opt(ctx, F2FS_MOUNT_INLINE_DENTRY);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_flush_merge:</div><div class='add'>+		if (result.negated)</div><div class='add'>+			ctx_clear_opt(ctx, F2FS_MOUNT_FLUSH_MERGE);</div><div class='add'>+		else</div><div class='add'>+			ctx_set_opt(ctx, F2FS_MOUNT_FLUSH_MERGE);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_barrier:</div><div class='add'>+		if (result.negated)</div><div class='add'>+			ctx_set_opt(ctx, F2FS_MOUNT_NOBARRIER);</div><div class='add'>+		else</div><div class='add'>+			ctx_clear_opt(ctx, F2FS_MOUNT_NOBARRIER);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_fastboot:</div><div class='add'>+		ctx_set_opt(ctx, F2FS_MOUNT_FASTBOOT);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_extent_cache:</div><div class='add'>+		if (result.negated)</div><div class='add'>+			ctx_clear_opt(ctx, F2FS_MOUNT_READ_EXTENT_CACHE);</div><div class='add'>+		else</div><div class='add'>+			ctx_set_opt(ctx, F2FS_MOUNT_READ_EXTENT_CACHE);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_data_flush:</div><div class='add'>+		ctx_set_opt(ctx, F2FS_MOUNT_DATA_FLUSH);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_reserve_root:</div><div class='add'>+		ctx_set_opt(ctx, F2FS_MOUNT_RESERVE_ROOT);</div><div class='add'>+		F2FS_CTX_INFO(ctx).root_reserved_blocks = result.uint_32;</div><div class='add'>+		ctx-&gt;spec_mask |= F2FS_SPEC_reserve_root;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_reserve_node:</div><div class='add'>+		ctx_set_opt(ctx, F2FS_MOUNT_RESERVE_NODE);</div><div class='add'>+		F2FS_CTX_INFO(ctx).root_reserved_nodes = result.uint_32;</div><div class='add'>+		ctx-&gt;spec_mask |= F2FS_SPEC_reserve_node;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_resuid:</div><div class='add'>+		F2FS_CTX_INFO(ctx).s_resuid = result.uid;</div><div class='add'>+		ctx-&gt;spec_mask |= F2FS_SPEC_resuid;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_resgid:</div><div class='add'>+		F2FS_CTX_INFO(ctx).s_resgid = result.gid;</div><div class='add'>+		ctx-&gt;spec_mask |= F2FS_SPEC_resgid;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_mode:</div><div class='add'>+		F2FS_CTX_INFO(ctx).fs_mode = result.uint_32;</div><div class='add'>+		ctx-&gt;spec_mask |= F2FS_SPEC_mode;</div><div class='add'>+		break;</div><div class='ctx'> #ifdef CONFIG_F2FS_FAULT_INJECTION</div><div class='del'>-		case Opt_fault_injection:</div><div class='del'>-			if (args-&gt;from &amp;&amp; match_int(args, &amp;arg))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			f2fs_build_fault_attr(sbi, arg, F2FS_ALL_FAULT_TYPE);</div><div class='del'>-			set_opt(sbi, FAULT_INJECTION);</div><div class='del'>-			break;</div><div class='add'>+	case Opt_fault_injection:</div><div class='add'>+		F2FS_CTX_INFO(ctx).fault_info.inject_rate = result.int_32;</div><div class='add'>+		ctx-&gt;spec_mask |= F2FS_SPEC_fault_injection;</div><div class='add'>+		ctx_set_opt(ctx, F2FS_MOUNT_FAULT_INJECTION);</div><div class='add'>+		break;</div><div class='ctx'> </div><div class='del'>-		case Opt_fault_type:</div><div class='del'>-			if (args-&gt;from &amp;&amp; match_int(args, &amp;arg))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			f2fs_build_fault_attr(sbi, 0, arg);</div><div class='del'>-			set_opt(sbi, FAULT_INJECTION);</div><div class='del'>-			break;</div><div class='add'>+	case Opt_fault_type:</div><div class='add'>+		if (result.uint_32 &gt; BIT(FAULT_MAX))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		F2FS_CTX_INFO(ctx).fault_info.inject_type = result.uint_32;</div><div class='add'>+		ctx-&gt;spec_mask |= F2FS_SPEC_fault_type;</div><div class='add'>+		ctx_set_opt(ctx, F2FS_MOUNT_FAULT_INJECTION);</div><div class='add'>+		break;</div><div class='ctx'> #else</div><div class='del'>-		case Opt_fault_injection:</div><div class='del'>-			f2fs_info(sbi, "fault_injection options not supported");</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		case Opt_fault_type:</div><div class='del'>-			f2fs_info(sbi, "fault_type options not supported");</div><div class='del'>-			break;</div><div class='add'>+	case Opt_fault_injection:</div><div class='add'>+	case Opt_fault_type:</div><div class='add'>+		f2fs_info(NULL, "%s options not supported", param-&gt;key);</div><div class='add'>+		break;</div><div class='ctx'> #endif</div><div class='del'>-		case Opt_lazytime:</div><div class='del'>-			sb-&gt;s_flags |= SB_LAZYTIME;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_nolazytime:</div><div class='del'>-			sb-&gt;s_flags &amp;= ~SB_LAZYTIME;</div><div class='del'>-			break;</div><div class='add'>+	case Opt_lazytime:</div><div class='add'>+		if (result.negated)</div><div class='add'>+			ctx_clear_opt(ctx, F2FS_MOUNT_LAZYTIME);</div><div class='add'>+		else</div><div class='add'>+			ctx_set_opt(ctx, F2FS_MOUNT_LAZYTIME);</div><div class='add'>+		break;</div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='del'>-		case Opt_quota:</div><div class='del'>-		case Opt_usrquota:</div><div class='del'>-			set_opt(sbi, USRQUOTA);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_grpquota:</div><div class='del'>-			set_opt(sbi, GRPQUOTA);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_prjquota:</div><div class='del'>-			set_opt(sbi, PRJQUOTA);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_usrjquota:</div><div class='del'>-			ret = f2fs_set_qf_name(sb, USRQUOTA, &amp;args[0]);</div><div class='del'>-			if (ret)</div><div class='del'>-				return ret;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_grpjquota:</div><div class='del'>-			ret = f2fs_set_qf_name(sb, GRPQUOTA, &amp;args[0]);</div><div class='del'>-			if (ret)</div><div class='del'>-				return ret;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_prjjquota:</div><div class='del'>-			ret = f2fs_set_qf_name(sb, PRJQUOTA, &amp;args[0]);</div><div class='del'>-			if (ret)</div><div class='del'>-				return ret;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_offusrjquota:</div><div class='del'>-			ret = f2fs_clear_qf_name(sb, USRQUOTA);</div><div class='del'>-			if (ret)</div><div class='del'>-				return ret;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_offgrpjquota:</div><div class='del'>-			ret = f2fs_clear_qf_name(sb, GRPQUOTA);</div><div class='del'>-			if (ret)</div><div class='del'>-				return ret;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_offprjjquota:</div><div class='del'>-			ret = f2fs_clear_qf_name(sb, PRJQUOTA);</div><div class='del'>-			if (ret)</div><div class='del'>-				return ret;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_jqfmt_vfsold:</div><div class='del'>-			F2FS_OPTION(sbi).s_jquota_fmt = QFMT_VFS_OLD;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_jqfmt_vfsv0:</div><div class='del'>-			F2FS_OPTION(sbi).s_jquota_fmt = QFMT_VFS_V0;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_jqfmt_vfsv1:</div><div class='del'>-			F2FS_OPTION(sbi).s_jquota_fmt = QFMT_VFS_V1;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_noquota:</div><div class='del'>-			clear_opt(sbi, QUOTA);</div><div class='del'>-			clear_opt(sbi, USRQUOTA);</div><div class='del'>-			clear_opt(sbi, GRPQUOTA);</div><div class='del'>-			clear_opt(sbi, PRJQUOTA);</div><div class='del'>-			break;</div><div class='add'>+	case Opt_quota:</div><div class='add'>+		if (result.negated) {</div><div class='add'>+			ctx_clear_opt(ctx, F2FS_MOUNT_QUOTA);</div><div class='add'>+			ctx_clear_opt(ctx, F2FS_MOUNT_USRQUOTA);</div><div class='add'>+			ctx_clear_opt(ctx, F2FS_MOUNT_GRPQUOTA);</div><div class='add'>+			ctx_clear_opt(ctx, F2FS_MOUNT_PRJQUOTA);</div><div class='add'>+		} else</div><div class='add'>+			ctx_set_opt(ctx, F2FS_MOUNT_USRQUOTA);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_usrquota:</div><div class='add'>+		ctx_set_opt(ctx, F2FS_MOUNT_USRQUOTA);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_grpquota:</div><div class='add'>+		ctx_set_opt(ctx, F2FS_MOUNT_GRPQUOTA);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_prjquota:</div><div class='add'>+		ctx_set_opt(ctx, F2FS_MOUNT_PRJQUOTA);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_usrjquota:</div><div class='add'>+		if (!*param-&gt;string)</div><div class='add'>+			ret = f2fs_unnote_qf_name(fc, USRQUOTA);</div><div class='add'>+		else</div><div class='add'>+			ret = f2fs_note_qf_name(fc, USRQUOTA, param);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_grpjquota:</div><div class='add'>+		if (!*param-&gt;string)</div><div class='add'>+			ret = f2fs_unnote_qf_name(fc, GRPQUOTA);</div><div class='add'>+		else</div><div class='add'>+			ret = f2fs_note_qf_name(fc, GRPQUOTA, param);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_prjjquota:</div><div class='add'>+		if (!*param-&gt;string)</div><div class='add'>+			ret = f2fs_unnote_qf_name(fc, PRJQUOTA);</div><div class='add'>+		else</div><div class='add'>+			ret = f2fs_note_qf_name(fc, PRJQUOTA, param);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_jqfmt:</div><div class='add'>+		F2FS_CTX_INFO(ctx).s_jquota_fmt = result.int_32;</div><div class='add'>+		ctx-&gt;spec_mask |= F2FS_SPEC_jqfmt;</div><div class='add'>+		break;</div><div class='ctx'> #else</div><div class='del'>-		case Opt_quota:</div><div class='del'>-		case Opt_usrquota:</div><div class='del'>-		case Opt_grpquota:</div><div class='del'>-		case Opt_prjquota:</div><div class='del'>-		case Opt_usrjquota:</div><div class='del'>-		case Opt_grpjquota:</div><div class='del'>-		case Opt_prjjquota:</div><div class='del'>-		case Opt_offusrjquota:</div><div class='del'>-		case Opt_offgrpjquota:</div><div class='del'>-		case Opt_offprjjquota:</div><div class='del'>-		case Opt_jqfmt_vfsold:</div><div class='del'>-		case Opt_jqfmt_vfsv0:</div><div class='del'>-		case Opt_jqfmt_vfsv1:</div><div class='del'>-		case Opt_noquota:</div><div class='del'>-			f2fs_info(sbi, "quota operations not supported");</div><div class='del'>-			break;</div><div class='add'>+	case Opt_quota:</div><div class='add'>+	case Opt_usrquota:</div><div class='add'>+	case Opt_grpquota:</div><div class='add'>+	case Opt_prjquota:</div><div class='add'>+	case Opt_usrjquota:</div><div class='add'>+	case Opt_grpjquota:</div><div class='add'>+	case Opt_prjjquota:</div><div class='add'>+		f2fs_info(NULL, "quota operations not supported");</div><div class='add'>+		break;</div><div class='ctx'> #endif</div><div class='del'>-		case Opt_whint:</div><div class='del'>-			name = match_strdup(&amp;args[0]);</div><div class='del'>-			if (!name)</div><div class='del'>-				return -ENOMEM;</div><div class='del'>-			if (!strcmp(name, "user-based")) {</div><div class='del'>-				F2FS_OPTION(sbi).whint_mode = WHINT_MODE_USER;</div><div class='del'>-			} else if (!strcmp(name, "off")) {</div><div class='del'>-				F2FS_OPTION(sbi).whint_mode = WHINT_MODE_OFF;</div><div class='del'>-			} else if (!strcmp(name, "fs-based")) {</div><div class='del'>-				F2FS_OPTION(sbi).whint_mode = WHINT_MODE_FS;</div><div class='del'>-			} else {</div><div class='del'>-				kfree(name);</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			}</div><div class='del'>-			kfree(name);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_alloc:</div><div class='del'>-			name = match_strdup(&amp;args[0]);</div><div class='del'>-			if (!name)</div><div class='del'>-				return -ENOMEM;</div><div class='del'>-</div><div class='del'>-			if (!strcmp(name, "default")) {</div><div class='del'>-				F2FS_OPTION(sbi).alloc_mode = ALLOC_MODE_DEFAULT;</div><div class='del'>-			} else if (!strcmp(name, "reuse")) {</div><div class='del'>-				F2FS_OPTION(sbi).alloc_mode = ALLOC_MODE_REUSE;</div><div class='del'>-			} else {</div><div class='del'>-				kfree(name);</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			}</div><div class='del'>-			kfree(name);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_fsync:</div><div class='del'>-			name = match_strdup(&amp;args[0]);</div><div class='del'>-			if (!name)</div><div class='del'>-				return -ENOMEM;</div><div class='del'>-			if (!strcmp(name, "posix")) {</div><div class='del'>-				F2FS_OPTION(sbi).fsync_mode = FSYNC_MODE_POSIX;</div><div class='del'>-			} else if (!strcmp(name, "strict")) {</div><div class='del'>-				F2FS_OPTION(sbi).fsync_mode = FSYNC_MODE_STRICT;</div><div class='del'>-			} else if (!strcmp(name, "nobarrier")) {</div><div class='del'>-				F2FS_OPTION(sbi).fsync_mode =</div><div class='del'>-							FSYNC_MODE_NOBARRIER;</div><div class='del'>-			} else {</div><div class='del'>-				kfree(name);</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			}</div><div class='del'>-			kfree(name);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_test_dummy_encryption:</div><div class='del'>-			ret = f2fs_set_test_dummy_encryption(sb, p, &amp;args[0],</div><div class='del'>-							     is_remount);</div><div class='del'>-			if (ret)</div><div class='del'>-				return ret;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_inlinecrypt:</div><div class='add'>+	case Opt_alloc:</div><div class='add'>+		F2FS_CTX_INFO(ctx).alloc_mode = result.uint_32;</div><div class='add'>+		ctx-&gt;spec_mask |= F2FS_SPEC_alloc_mode;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_fsync:</div><div class='add'>+		F2FS_CTX_INFO(ctx).fsync_mode = result.uint_32;</div><div class='add'>+		ctx-&gt;spec_mask |= F2FS_SPEC_fsync_mode;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_test_dummy_encryption:</div><div class='add'>+		ret = f2fs_parse_test_dummy_encryption(param, ctx);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_inlinecrypt:</div><div class='ctx'> #ifdef CONFIG_FS_ENCRYPTION_INLINE_CRYPT</div><div class='del'>-			sb-&gt;s_flags |= SB_INLINECRYPT;</div><div class='add'>+		ctx_set_opt(ctx, F2FS_MOUNT_INLINECRYPT);</div><div class='ctx'> #else</div><div class='del'>-			f2fs_info(sbi, "inline encryption not supported");</div><div class='add'>+		f2fs_info(NULL, "inline encryption not supported");</div><div class='ctx'> #endif</div><div class='del'>-			break;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_checkpoint:</div><div class='add'>+		/*</div><div class='add'>+		 * Initialize args struct so we know whether arg was</div><div class='add'>+		 * found; some options take optional arguments.</div><div class='add'>+		 */</div><div class='add'>+		args[0].from = args[0].to = NULL;</div><div class='add'>+		arg = 0;</div><div class='add'>+</div><div class='add'>+		/* revert to match_table for checkpoint= options */</div><div class='add'>+		token = match_token(param-&gt;string, f2fs_checkpoint_tokens, args);</div><div class='add'>+		switch (token) {</div><div class='ctx'> 		case Opt_checkpoint_disable_cap_perc:</div><div class='ctx'> 			if (args-&gt;from &amp;&amp; match_int(args, &amp;arg))</div><div class='ctx'> 				return -EINVAL;</div><div class='ctx'> 			if (arg &lt; 0 || arg &gt; 100)</div><div class='ctx'> 				return -EINVAL;</div><div class='del'>-			F2FS_OPTION(sbi).unusable_cap_perc = arg;</div><div class='del'>-			set_opt(sbi, DISABLE_CHECKPOINT);</div><div class='add'>+			F2FS_CTX_INFO(ctx).unusable_cap_perc = arg;</div><div class='add'>+			ctx-&gt;spec_mask |= F2FS_SPEC_checkpoint_disable_cap_perc;</div><div class='add'>+			ctx_set_opt(ctx, F2FS_MOUNT_DISABLE_CHECKPOINT);</div><div class='ctx'> 			break;</div><div class='ctx'> 		case Opt_checkpoint_disable_cap:</div><div class='ctx'> 			if (args-&gt;from &amp;&amp; match_int(args, &amp;arg))</div><div class='ctx'> 				return -EINVAL;</div><div class='del'>-			F2FS_OPTION(sbi).unusable_cap = arg;</div><div class='del'>-			set_opt(sbi, DISABLE_CHECKPOINT);</div><div class='add'>+			F2FS_CTX_INFO(ctx).unusable_cap = arg;</div><div class='add'>+			ctx-&gt;spec_mask |= F2FS_SPEC_checkpoint_disable_cap;</div><div class='add'>+			ctx_set_opt(ctx, F2FS_MOUNT_DISABLE_CHECKPOINT);</div><div class='ctx'> 			break;</div><div class='ctx'> 		case Opt_checkpoint_disable:</div><div class='del'>-			set_opt(sbi, DISABLE_CHECKPOINT);</div><div class='add'>+			ctx_set_opt(ctx, F2FS_MOUNT_DISABLE_CHECKPOINT);</div><div class='ctx'> 			break;</div><div class='ctx'> 		case Opt_checkpoint_enable:</div><div class='del'>-			clear_opt(sbi, DISABLE_CHECKPOINT);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_checkpoint_merge:</div><div class='del'>-			set_opt(sbi, MERGE_CHECKPOINT);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_nocheckpoint_merge:</div><div class='del'>-			clear_opt(sbi, MERGE_CHECKPOINT);</div><div class='add'>+			F2FS_CTX_INFO(ctx).unusable_cap_perc = 0;</div><div class='add'>+			ctx-&gt;spec_mask |= F2FS_SPEC_checkpoint_disable_cap_perc;</div><div class='add'>+			F2FS_CTX_INFO(ctx).unusable_cap = 0;</div><div class='add'>+			ctx-&gt;spec_mask |= F2FS_SPEC_checkpoint_disable_cap;</div><div class='add'>+			ctx_clear_opt(ctx, F2FS_MOUNT_DISABLE_CHECKPOINT);</div><div class='ctx'> 			break;</div><div class='add'>+		default:</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='add'>+	case Opt_checkpoint_merge:</div><div class='add'>+		if (result.negated)</div><div class='add'>+			ctx_clear_opt(ctx, F2FS_MOUNT_MERGE_CHECKPOINT);</div><div class='add'>+		else</div><div class='add'>+			ctx_set_opt(ctx, F2FS_MOUNT_MERGE_CHECKPOINT);</div><div class='add'>+		break;</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='del'>-		case Opt_compress_algorithm:</div><div class='del'>-			if (!f2fs_sb_has_compression(sbi)) {</div><div class='del'>-				f2fs_info(sbi, "Image doesn't support compression");</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			name = match_strdup(&amp;args[0]);</div><div class='del'>-			if (!name)</div><div class='del'>-				return -ENOMEM;</div><div class='del'>-			if (!strcmp(name, "lzo")) {</div><div class='add'>+	case Opt_compress_algorithm:</div><div class='add'>+		name = param-&gt;string;</div><div class='add'>+		if (!strcmp(name, "lzo")) {</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_LZO</div><div class='del'>-				F2FS_OPTION(sbi).compress_level = 0;</div><div class='del'>-				F2FS_OPTION(sbi).compress_algorithm =</div><div class='del'>-								COMPRESS_LZO;</div><div class='add'>+			F2FS_CTX_INFO(ctx).compress_level = 0;</div><div class='add'>+			F2FS_CTX_INFO(ctx).compress_algorithm = COMPRESS_LZO;</div><div class='add'>+			ctx-&gt;spec_mask |= F2FS_SPEC_compress_level;</div><div class='add'>+			ctx-&gt;spec_mask |= F2FS_SPEC_compress_algorithm;</div><div class='ctx'> #else</div><div class='del'>-				f2fs_info(sbi, "kernel doesn't support lzo compression");</div><div class='add'>+			f2fs_info(NULL, "kernel doesn't support lzo compression");</div><div class='ctx'> #endif</div><div class='del'>-			} else if (!strncmp(name, "lz4", 3)) {</div><div class='add'>+		} else if (!strncmp(name, "lz4", 3)) {</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_LZ4</div><div class='del'>-				ret = f2fs_set_lz4hc_level(sbi, name);</div><div class='del'>-				if (ret) {</div><div class='del'>-					kfree(name);</div><div class='del'>-					return -EINVAL;</div><div class='del'>-				}</div><div class='del'>-				F2FS_OPTION(sbi).compress_algorithm =</div><div class='del'>-								COMPRESS_LZ4;</div><div class='add'>+			ret = f2fs_set_lz4hc_level(ctx, name);</div><div class='add'>+			if (ret)</div><div class='add'>+				return -EINVAL;</div><div class='add'>+			F2FS_CTX_INFO(ctx).compress_algorithm = COMPRESS_LZ4;</div><div class='add'>+			ctx-&gt;spec_mask |= F2FS_SPEC_compress_algorithm;</div><div class='ctx'> #else</div><div class='del'>-				f2fs_info(sbi, "kernel doesn't support lz4 compression");</div><div class='add'>+			f2fs_info(NULL, "kernel doesn't support lz4 compression");</div><div class='ctx'> #endif</div><div class='del'>-			} else if (!strncmp(name, "zstd", 4)) {</div><div class='add'>+		} else if (!strncmp(name, "zstd", 4)) {</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_ZSTD</div><div class='del'>-				ret = f2fs_set_zstd_level(sbi, name);</div><div class='del'>-				if (ret) {</div><div class='del'>-					kfree(name);</div><div class='del'>-					return -EINVAL;</div><div class='del'>-				}</div><div class='del'>-				F2FS_OPTION(sbi).compress_algorithm =</div><div class='del'>-								COMPRESS_ZSTD;</div><div class='add'>+			ret = f2fs_set_zstd_level(ctx, name);</div><div class='add'>+			if (ret)</div><div class='add'>+				return -EINVAL;</div><div class='add'>+			F2FS_CTX_INFO(ctx).compress_algorithm = COMPRESS_ZSTD;</div><div class='add'>+			ctx-&gt;spec_mask |= F2FS_SPEC_compress_algorithm;</div><div class='ctx'> #else</div><div class='del'>-				f2fs_info(sbi, "kernel doesn't support zstd compression");</div><div class='add'>+			f2fs_info(NULL, "kernel doesn't support zstd compression");</div><div class='ctx'> #endif</div><div class='del'>-			} else if (!strcmp(name, "lzo-rle")) {</div><div class='add'>+		} else if (!strcmp(name, "lzo-rle")) {</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_LZORLE</div><div class='del'>-				F2FS_OPTION(sbi).compress_level = 0;</div><div class='del'>-				F2FS_OPTION(sbi).compress_algorithm =</div><div class='del'>-								COMPRESS_LZORLE;</div><div class='add'>+			F2FS_CTX_INFO(ctx).compress_level = 0;</div><div class='add'>+			F2FS_CTX_INFO(ctx).compress_algorithm = COMPRESS_LZORLE;</div><div class='add'>+			ctx-&gt;spec_mask |= F2FS_SPEC_compress_level;</div><div class='add'>+			ctx-&gt;spec_mask |= F2FS_SPEC_compress_algorithm;</div><div class='ctx'> #else</div><div class='del'>-				f2fs_info(sbi, "kernel doesn't support lzorle compression");</div><div class='add'>+			f2fs_info(NULL, "kernel doesn't support lzorle compression");</div><div class='ctx'> #endif</div><div class='del'>-			} else {</div><div class='del'>-				kfree(name);</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			}</div><div class='del'>-			kfree(name);</div><div class='add'>+		} else</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_compress_log_size:</div><div class='add'>+		if (result.uint_32 &lt; MIN_COMPRESS_LOG_SIZE ||</div><div class='add'>+		    result.uint_32 &gt; MAX_COMPRESS_LOG_SIZE) {</div><div class='add'>+			f2fs_err(NULL,</div><div class='add'>+				"Compress cluster log size is out of range");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		F2FS_CTX_INFO(ctx).compress_log_size = result.uint_32;</div><div class='add'>+		ctx-&gt;spec_mask |= F2FS_SPEC_compress_log_size;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_compress_extension:</div><div class='add'>+		name = param-&gt;string;</div><div class='add'>+		ext = F2FS_CTX_INFO(ctx).extensions;</div><div class='add'>+		ext_cnt = F2FS_CTX_INFO(ctx).compress_ext_cnt;</div><div class='add'>+</div><div class='add'>+		if (strlen(name) &gt;= F2FS_EXTENSION_LEN ||</div><div class='add'>+		    ext_cnt &gt;= COMPRESS_EXT_NUM) {</div><div class='add'>+			f2fs_err(NULL, "invalid extension length/number");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (is_compress_extension_exist(&amp;ctx-&gt;info, name, true))</div><div class='ctx'> 			break;</div><div class='del'>-		case Opt_compress_log_size:</div><div class='del'>-			if (!f2fs_sb_has_compression(sbi)) {</div><div class='del'>-				f2fs_info(sbi, "Image doesn't support compression");</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			if (args-&gt;from &amp;&amp; match_int(args, &amp;arg))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			if (arg &lt; MIN_COMPRESS_LOG_SIZE ||</div><div class='del'>-				arg &gt; MAX_COMPRESS_LOG_SIZE) {</div><div class='del'>-				f2fs_err(sbi,</div><div class='del'>-					"Compress cluster log size is out of range");</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			}</div><div class='del'>-			F2FS_OPTION(sbi).compress_log_size = arg;</div><div class='add'>+</div><div class='add'>+		ret = strscpy(ext[ext_cnt], name, F2FS_EXTENSION_LEN);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='add'>+		F2FS_CTX_INFO(ctx).compress_ext_cnt++;</div><div class='add'>+		ctx-&gt;spec_mask |= F2FS_SPEC_compress_extension;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_nocompress_extension:</div><div class='add'>+		name = param-&gt;string;</div><div class='add'>+		noext = F2FS_CTX_INFO(ctx).noextensions;</div><div class='add'>+		noext_cnt = F2FS_CTX_INFO(ctx).nocompress_ext_cnt;</div><div class='add'>+</div><div class='add'>+		if (strlen(name) &gt;= F2FS_EXTENSION_LEN ||</div><div class='add'>+			noext_cnt &gt;= COMPRESS_EXT_NUM) {</div><div class='add'>+			f2fs_err(NULL, "invalid extension length/number");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (is_compress_extension_exist(&amp;ctx-&gt;info, name, false))</div><div class='ctx'> 			break;</div><div class='del'>-		case Opt_compress_extension:</div><div class='del'>-			if (!f2fs_sb_has_compression(sbi)) {</div><div class='del'>-				f2fs_info(sbi, "Image doesn't support compression");</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			name = match_strdup(&amp;args[0]);</div><div class='del'>-			if (!name)</div><div class='del'>-				return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-			ext = F2FS_OPTION(sbi).extensions;</div><div class='del'>-			ext_cnt = F2FS_OPTION(sbi).compress_ext_cnt;</div><div class='add'>+		ret = strscpy(noext[noext_cnt], name, F2FS_EXTENSION_LEN);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='add'>+		F2FS_CTX_INFO(ctx).nocompress_ext_cnt++;</div><div class='add'>+		ctx-&gt;spec_mask |= F2FS_SPEC_nocompress_extension;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_compress_chksum:</div><div class='add'>+		F2FS_CTX_INFO(ctx).compress_chksum = true;</div><div class='add'>+		ctx-&gt;spec_mask |= F2FS_SPEC_compress_chksum;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_compress_mode:</div><div class='add'>+		F2FS_CTX_INFO(ctx).compress_mode = result.uint_32;</div><div class='add'>+		ctx-&gt;spec_mask |= F2FS_SPEC_compress_mode;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_compress_cache:</div><div class='add'>+		ctx_set_opt(ctx, F2FS_MOUNT_COMPRESS_CACHE);</div><div class='add'>+		break;</div><div class='add'>+#else</div><div class='add'>+	case Opt_compress_algorithm:</div><div class='add'>+	case Opt_compress_log_size:</div><div class='add'>+	case Opt_compress_extension:</div><div class='add'>+	case Opt_nocompress_extension:</div><div class='add'>+	case Opt_compress_chksum:</div><div class='add'>+	case Opt_compress_mode:</div><div class='add'>+	case Opt_compress_cache:</div><div class='add'>+		f2fs_info(NULL, "compression options not supported");</div><div class='add'>+		break;</div><div class='add'>+#endif</div><div class='add'>+	case Opt_atgc:</div><div class='add'>+		ctx_set_opt(ctx, F2FS_MOUNT_ATGC);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_gc_merge:</div><div class='add'>+		if (result.negated)</div><div class='add'>+			ctx_clear_opt(ctx, F2FS_MOUNT_GC_MERGE);</div><div class='add'>+		else</div><div class='add'>+			ctx_set_opt(ctx, F2FS_MOUNT_GC_MERGE);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_discard_unit:</div><div class='add'>+		F2FS_CTX_INFO(ctx).discard_unit = result.uint_32;</div><div class='add'>+		ctx-&gt;spec_mask |= F2FS_SPEC_discard_unit;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_memory_mode:</div><div class='add'>+		F2FS_CTX_INFO(ctx).memory_mode = result.uint_32;</div><div class='add'>+		ctx-&gt;spec_mask |= F2FS_SPEC_memory_mode;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_age_extent_cache:</div><div class='add'>+		ctx_set_opt(ctx, F2FS_MOUNT_AGE_EXTENT_CACHE);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_errors:</div><div class='add'>+		F2FS_CTX_INFO(ctx).errors = result.uint_32;</div><div class='add'>+		ctx-&gt;spec_mask |= F2FS_SPEC_errors;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_nat_bits:</div><div class='add'>+		ctx_set_opt(ctx, F2FS_MOUNT_NAT_BITS);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_lookup_mode:</div><div class='add'>+		F2FS_CTX_INFO(ctx).lookup_mode = result.uint_32;</div><div class='add'>+		ctx-&gt;spec_mask |= F2FS_SPEC_lookup_mode;</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Check quota settings consistency.</div><div class='add'>+ */</div><div class='add'>+static int f2fs_check_quota_consistency(struct fs_context *fc,</div><div class='add'>+					struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_SB(sb);</div><div class='add'>+ #ifdef CONFIG_QUOTA</div><div class='add'>+	struct f2fs_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	bool quota_feature = f2fs_sb_has_quota_ino(sbi);</div><div class='add'>+	bool quota_turnon = sb_any_quota_loaded(sb);</div><div class='add'>+	char *old_qname, *new_qname;</div><div class='add'>+	bool usr_qf_name, grp_qf_name, prj_qf_name, usrquota, grpquota, prjquota;</div><div class='add'>+	int i;</div><div class='ctx'> </div><div class='del'>-			if (strlen(name) &gt;= F2FS_EXTENSION_LEN ||</div><div class='del'>-				ext_cnt &gt;= COMPRESS_EXT_NUM) {</div><div class='del'>-				f2fs_err(sbi,</div><div class='del'>-					"invalid extension length/number");</div><div class='del'>-				kfree(name);</div><div class='del'>-				return -EINVAL;</div><div class='add'>+	/*</div><div class='add'>+	 * We do the test below only for project quotas. 'usrquota' and</div><div class='add'>+	 * 'grpquota' mount options are allowed even without quota feature</div><div class='add'>+	 * to support legacy quotas in quota files.</div><div class='add'>+	 */</div><div class='add'>+	if (ctx_test_opt(ctx, F2FS_MOUNT_PRJQUOTA) &amp;&amp;</div><div class='add'>+			!f2fs_sb_has_project_quota(sbi)) {</div><div class='add'>+		f2fs_err(sbi, "Project quota feature not enabled. Cannot enable project quota enforcement.");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (ctx-&gt;qname_mask) {</div><div class='add'>+		for (i = 0; i &lt; MAXQUOTAS; i++) {</div><div class='add'>+			if (!(ctx-&gt;qname_mask &amp; (1 &lt;&lt; i)))</div><div class='add'>+				continue;</div><div class='add'>+</div><div class='add'>+			old_qname = F2FS_OPTION(sbi).s_qf_names[i];</div><div class='add'>+			new_qname = F2FS_CTX_INFO(ctx).s_qf_names[i];</div><div class='add'>+			if (quota_turnon &amp;&amp;</div><div class='add'>+				!!old_qname != !!new_qname)</div><div class='add'>+				goto err_jquota_change;</div><div class='add'>+</div><div class='add'>+			if (old_qname) {</div><div class='add'>+				if (!new_qname) {</div><div class='add'>+					f2fs_info(sbi, "remove qf_name %s",</div><div class='add'>+								old_qname);</div><div class='add'>+					continue;</div><div class='add'>+				} else if (strcmp(old_qname, new_qname) == 0) {</div><div class='add'>+					ctx-&gt;qname_mask &amp;= ~(1 &lt;&lt; i);</div><div class='add'>+					continue;</div><div class='add'>+				}</div><div class='add'>+				goto err_jquota_specified;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			strcpy(ext[ext_cnt], name);</div><div class='del'>-			F2FS_OPTION(sbi).compress_ext_cnt++;</div><div class='del'>-			kfree(name);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_nocompress_extension:</div><div class='del'>-			if (!f2fs_sb_has_compression(sbi)) {</div><div class='del'>-				f2fs_info(sbi, "Image doesn't support compression");</div><div class='del'>-				break;</div><div class='add'>+			if (quota_feature) {</div><div class='add'>+				f2fs_info(sbi, "QUOTA feature is enabled, so ignore qf_name");</div><div class='add'>+				ctx-&gt;qname_mask &amp;= ~(1 &lt;&lt; i);</div><div class='add'>+				kfree(F2FS_CTX_INFO(ctx).s_qf_names[i]);</div><div class='add'>+				F2FS_CTX_INFO(ctx).s_qf_names[i] = NULL;</div><div class='ctx'> 			}</div><div class='del'>-			name = match_strdup(&amp;args[0]);</div><div class='del'>-			if (!name)</div><div class='del'>-				return -ENOMEM;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-			noext = F2FS_OPTION(sbi).noextensions;</div><div class='del'>-			noext_cnt = F2FS_OPTION(sbi).nocompress_ext_cnt;</div><div class='add'>+	/* Make sure we don't mix old and new quota format */</div><div class='add'>+	usr_qf_name = F2FS_OPTION(sbi).s_qf_names[USRQUOTA] ||</div><div class='add'>+			F2FS_CTX_INFO(ctx).s_qf_names[USRQUOTA];</div><div class='add'>+	grp_qf_name = F2FS_OPTION(sbi).s_qf_names[GRPQUOTA] ||</div><div class='add'>+			F2FS_CTX_INFO(ctx).s_qf_names[GRPQUOTA];</div><div class='add'>+	prj_qf_name = F2FS_OPTION(sbi).s_qf_names[PRJQUOTA] ||</div><div class='add'>+			F2FS_CTX_INFO(ctx).s_qf_names[PRJQUOTA];</div><div class='add'>+	usrquota = test_opt(sbi, USRQUOTA) ||</div><div class='add'>+			ctx_test_opt(ctx, F2FS_MOUNT_USRQUOTA);</div><div class='add'>+	grpquota = test_opt(sbi, GRPQUOTA) ||</div><div class='add'>+			ctx_test_opt(ctx, F2FS_MOUNT_GRPQUOTA);</div><div class='add'>+	prjquota = test_opt(sbi, PRJQUOTA) ||</div><div class='add'>+			ctx_test_opt(ctx, F2FS_MOUNT_PRJQUOTA);</div><div class='add'>+</div><div class='add'>+	if (usr_qf_name) {</div><div class='add'>+		ctx_clear_opt(ctx, F2FS_MOUNT_USRQUOTA);</div><div class='add'>+		usrquota = false;</div><div class='add'>+	}</div><div class='add'>+	if (grp_qf_name) {</div><div class='add'>+		ctx_clear_opt(ctx, F2FS_MOUNT_GRPQUOTA);</div><div class='add'>+		grpquota = false;</div><div class='add'>+	}</div><div class='add'>+	if (prj_qf_name) {</div><div class='add'>+		ctx_clear_opt(ctx, F2FS_MOUNT_PRJQUOTA);</div><div class='add'>+		prjquota = false;</div><div class='add'>+	}</div><div class='add'>+	if (usr_qf_name || grp_qf_name || prj_qf_name) {</div><div class='add'>+		if (grpquota || usrquota || prjquota) {</div><div class='add'>+			f2fs_err(sbi, "old and new quota format mixing");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		if (!(ctx-&gt;spec_mask &amp; F2FS_SPEC_jqfmt ||</div><div class='add'>+				F2FS_OPTION(sbi).s_jquota_fmt)) {</div><div class='add'>+			f2fs_err(sbi, "journaled quota format not specified");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='ctx'> </div><div class='del'>-			if (strlen(name) &gt;= F2FS_EXTENSION_LEN ||</div><div class='del'>-				noext_cnt &gt;= COMPRESS_EXT_NUM) {</div><div class='del'>-				f2fs_err(sbi,</div><div class='del'>-					"invalid extension length/number");</div><div class='del'>-				kfree(name);</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			}</div><div class='add'>+err_jquota_change:</div><div class='add'>+	f2fs_err(sbi, "Cannot change journaled quota options when quota turned on");</div><div class='add'>+	return -EINVAL;</div><div class='add'>+err_jquota_specified:</div><div class='add'>+	f2fs_err(sbi, "%s quota file already specified",</div><div class='add'>+		 QTYPE2NAME(i));</div><div class='add'>+	return -EINVAL;</div><div class='ctx'> </div><div class='del'>-			strcpy(noext[noext_cnt], name);</div><div class='del'>-			F2FS_OPTION(sbi).nocompress_ext_cnt++;</div><div class='del'>-			kfree(name);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_compress_chksum:</div><div class='del'>-			F2FS_OPTION(sbi).compress_chksum = true;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_compress_mode:</div><div class='del'>-			name = match_strdup(&amp;args[0]);</div><div class='del'>-			if (!name)</div><div class='del'>-				return -ENOMEM;</div><div class='del'>-			if (!strcmp(name, "fs")) {</div><div class='del'>-				F2FS_OPTION(sbi).compress_mode = COMPR_MODE_FS;</div><div class='del'>-			} else if (!strcmp(name, "user")) {</div><div class='del'>-				F2FS_OPTION(sbi).compress_mode = COMPR_MODE_USER;</div><div class='del'>-			} else {</div><div class='del'>-				kfree(name);</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			}</div><div class='del'>-			kfree(name);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_compress_cache:</div><div class='del'>-			set_opt(sbi, COMPRESS_CACHE);</div><div class='del'>-			break;</div><div class='ctx'> #else</div><div class='del'>-		case Opt_compress_algorithm:</div><div class='del'>-		case Opt_compress_log_size:</div><div class='del'>-		case Opt_compress_extension:</div><div class='del'>-		case Opt_nocompress_extension:</div><div class='del'>-		case Opt_compress_chksum:</div><div class='del'>-		case Opt_compress_mode:</div><div class='del'>-		case Opt_compress_cache:</div><div class='del'>-			f2fs_info(sbi, "compression options not supported");</div><div class='del'>-			break;</div><div class='add'>+	if (f2fs_readonly(sbi-&gt;sb))</div><div class='add'>+		return 0;</div><div class='add'>+	if (f2fs_sb_has_quota_ino(sbi)) {</div><div class='add'>+		f2fs_info(sbi, "Filesystem with quota feature cannot be mounted RDWR without CONFIG_QUOTA");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+	if (f2fs_sb_has_project_quota(sbi)) {</div><div class='add'>+		f2fs_err(sbi, "Filesystem with project quota feature cannot be mounted RDWR without CONFIG_QUOTA");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> #endif</div><div class='del'>-		case Opt_atgc:</div><div class='del'>-			set_opt(sbi, ATGC);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_gc_merge:</div><div class='del'>-			set_opt(sbi, GC_MERGE);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_nogc_merge:</div><div class='del'>-			clear_opt(sbi, GC_MERGE);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_discard_unit:</div><div class='del'>-			name = match_strdup(&amp;args[0]);</div><div class='del'>-			if (!name)</div><div class='del'>-				return -ENOMEM;</div><div class='del'>-			if (!strcmp(name, "block")) {</div><div class='del'>-				F2FS_OPTION(sbi).discard_unit =</div><div class='del'>-						DISCARD_UNIT_BLOCK;</div><div class='del'>-			} else if (!strcmp(name, "segment")) {</div><div class='del'>-				F2FS_OPTION(sbi).discard_unit =</div><div class='del'>-						DISCARD_UNIT_SEGMENT;</div><div class='del'>-			} else if (!strcmp(name, "section")) {</div><div class='del'>-				F2FS_OPTION(sbi).discard_unit =</div><div class='del'>-						DISCARD_UNIT_SECTION;</div><div class='del'>-			} else {</div><div class='del'>-				kfree(name);</div><div class='del'>-				return -EINVAL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int f2fs_check_test_dummy_encryption(struct fs_context *fc,</div><div class='add'>+					    struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_SB(sb);</div><div class='add'>+</div><div class='add'>+	if (!fscrypt_is_dummy_policy_set(&amp;F2FS_CTX_INFO(ctx).dummy_enc_policy))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if (!f2fs_sb_has_encrypt(sbi)) {</div><div class='add'>+		f2fs_err(sbi, "Encrypt feature is off");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This mount option is just for testing, and it's not worthwhile to</div><div class='add'>+	 * implement the extra complexity (e.g. RCU protection) that would be</div><div class='add'>+	 * needed to allow it to be set or changed during remount.  We do allow</div><div class='add'>+	 * it to be specified during remount, but only if there is no change.</div><div class='add'>+	 */</div><div class='add'>+	if (fc-&gt;purpose == FS_CONTEXT_FOR_RECONFIGURE) {</div><div class='add'>+		if (fscrypt_dummy_policies_equal(&amp;F2FS_OPTION(sbi).dummy_enc_policy,</div><div class='add'>+				&amp;F2FS_CTX_INFO(ctx).dummy_enc_policy))</div><div class='add'>+			return 0;</div><div class='add'>+		f2fs_warn(sbi, "Can't set or change test_dummy_encryption on remount");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool test_compression_spec(unsigned int mask)</div><div class='add'>+{</div><div class='add'>+	return mask &amp; (F2FS_SPEC_compress_algorithm</div><div class='add'>+			| F2FS_SPEC_compress_log_size</div><div class='add'>+			| F2FS_SPEC_compress_extension</div><div class='add'>+			| F2FS_SPEC_nocompress_extension</div><div class='add'>+			| F2FS_SPEC_compress_chksum</div><div class='add'>+			| F2FS_SPEC_compress_mode);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void clear_compression_spec(struct f2fs_fs_context *ctx)</div><div class='add'>+{</div><div class='add'>+	ctx-&gt;spec_mask &amp;= ~(F2FS_SPEC_compress_algorithm</div><div class='add'>+						| F2FS_SPEC_compress_log_size</div><div class='add'>+						| F2FS_SPEC_compress_extension</div><div class='add'>+						| F2FS_SPEC_nocompress_extension</div><div class='add'>+						| F2FS_SPEC_compress_chksum</div><div class='add'>+						| F2FS_SPEC_compress_mode);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int f2fs_check_compression(struct fs_context *fc,</div><div class='add'>+				  struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+#ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='add'>+	struct f2fs_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_SB(sb);</div><div class='add'>+	int i, cnt;</div><div class='add'>+</div><div class='add'>+	if (!f2fs_sb_has_compression(sbi)) {</div><div class='add'>+		if (test_compression_spec(ctx-&gt;spec_mask) ||</div><div class='add'>+			ctx_test_opt(ctx, F2FS_MOUNT_COMPRESS_CACHE))</div><div class='add'>+			f2fs_info(sbi, "Image doesn't support compression");</div><div class='add'>+		clear_compression_spec(ctx);</div><div class='add'>+		ctx-&gt;opt_mask &amp;= ~BIT(F2FS_MOUNT_COMPRESS_CACHE);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+	if (ctx-&gt;spec_mask &amp; F2FS_SPEC_compress_extension) {</div><div class='add'>+		cnt = F2FS_CTX_INFO(ctx).compress_ext_cnt;</div><div class='add'>+		for (i = 0; i &lt; F2FS_CTX_INFO(ctx).compress_ext_cnt; i++) {</div><div class='add'>+			if (is_compress_extension_exist(&amp;F2FS_OPTION(sbi),</div><div class='add'>+					F2FS_CTX_INFO(ctx).extensions[i], true)) {</div><div class='add'>+				F2FS_CTX_INFO(ctx).extensions[i][0] = '\0';</div><div class='add'>+				cnt--;</div><div class='ctx'> 			}</div><div class='del'>-			kfree(name);</div><div class='del'>-			break;</div><div class='del'>-		default:</div><div class='del'>-			f2fs_err(sbi, "Unrecognized mount option \"%s\" or missing value",</div><div class='del'>-				 p);</div><div class='add'>+		}</div><div class='add'>+		if (F2FS_OPTION(sbi).compress_ext_cnt + cnt &gt; COMPRESS_EXT_NUM) {</div><div class='add'>+			f2fs_err(sbi, "invalid extension length/number");</div><div class='ctx'> 			return -EINVAL;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-default_check:</div><div class='del'>-#ifdef CONFIG_QUOTA</div><div class='del'>-	if (f2fs_check_quota_options(sbi))</div><div class='add'>+	if (ctx-&gt;spec_mask &amp; F2FS_SPEC_nocompress_extension) {</div><div class='add'>+		cnt = F2FS_CTX_INFO(ctx).nocompress_ext_cnt;</div><div class='add'>+		for (i = 0; i &lt; F2FS_CTX_INFO(ctx).nocompress_ext_cnt; i++) {</div><div class='add'>+			if (is_compress_extension_exist(&amp;F2FS_OPTION(sbi),</div><div class='add'>+					F2FS_CTX_INFO(ctx).noextensions[i], false)) {</div><div class='add'>+				F2FS_CTX_INFO(ctx).noextensions[i][0] = '\0';</div><div class='add'>+				cnt--;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+		if (F2FS_OPTION(sbi).nocompress_ext_cnt + cnt &gt; COMPRESS_EXT_NUM) {</div><div class='add'>+			f2fs_err(sbi, "invalid noextension length/number");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (f2fs_test_compress_extension(F2FS_CTX_INFO(ctx).noextensions,</div><div class='add'>+				F2FS_CTX_INFO(ctx).nocompress_ext_cnt,</div><div class='add'>+				F2FS_CTX_INFO(ctx).extensions,</div><div class='add'>+				F2FS_CTX_INFO(ctx).compress_ext_cnt)) {</div><div class='add'>+		f2fs_err(sbi, "new noextensions conflicts with new extensions");</div><div class='ctx'> 		return -EINVAL;</div><div class='del'>-#else</div><div class='del'>-	if (f2fs_sb_has_quota_ino(sbi) &amp;&amp; !f2fs_readonly(sbi-&gt;sb)) {</div><div class='del'>-		f2fs_info(sbi, "Filesystem with quota feature cannot be mounted RDWR without CONFIG_QUOTA");</div><div class='add'>+	}</div><div class='add'>+	if (f2fs_test_compress_extension(F2FS_CTX_INFO(ctx).noextensions,</div><div class='add'>+				F2FS_CTX_INFO(ctx).nocompress_ext_cnt,</div><div class='add'>+				F2FS_OPTION(sbi).extensions,</div><div class='add'>+				F2FS_OPTION(sbi).compress_ext_cnt)) {</div><div class='add'>+		f2fs_err(sbi, "new noextensions conflicts with old extensions");</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-	if (f2fs_sb_has_project_quota(sbi) &amp;&amp; !f2fs_readonly(sbi-&gt;sb)) {</div><div class='del'>-		f2fs_err(sbi, "Filesystem with project quota feature cannot be mounted RDWR without CONFIG_QUOTA");</div><div class='add'>+	if (f2fs_test_compress_extension(F2FS_OPTION(sbi).noextensions,</div><div class='add'>+				F2FS_OPTION(sbi).nocompress_ext_cnt,</div><div class='add'>+				F2FS_CTX_INFO(ctx).extensions,</div><div class='add'>+				F2FS_CTX_INFO(ctx).compress_ext_cnt)) {</div><div class='add'>+		f2fs_err(sbi, "new extensions conflicts with old noextensions");</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> #endif</div><div class='del'>-#ifndef CONFIG_UNICODE</div><div class='del'>-	if (f2fs_sb_has_casefold(sbi)) {</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int f2fs_check_opt_consistency(struct fs_context *fc,</div><div class='add'>+				      struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_SB(sb);</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	if (ctx_test_opt(ctx, F2FS_MOUNT_NORECOVERY) &amp;&amp; !f2fs_readonly(sb))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	if (f2fs_hw_should_discard(sbi) &amp;&amp;</div><div class='add'>+			(ctx-&gt;opt_mask &amp; BIT(F2FS_MOUNT_DISCARD)) &amp;&amp;</div><div class='add'>+			!ctx_test_opt(ctx, F2FS_MOUNT_DISCARD)) {</div><div class='add'>+		f2fs_warn(sbi, "discard is required for zoned block devices");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!f2fs_hw_support_discard(sbi) &amp;&amp;</div><div class='add'>+			(ctx-&gt;opt_mask &amp; BIT(F2FS_MOUNT_DISCARD)) &amp;&amp;</div><div class='add'>+			ctx_test_opt(ctx, F2FS_MOUNT_DISCARD)) {</div><div class='add'>+		f2fs_warn(sbi, "device does not support discard");</div><div class='add'>+		ctx_clear_opt(ctx, F2FS_MOUNT_DISCARD);</div><div class='add'>+		ctx-&gt;opt_mask &amp;= ~BIT(F2FS_MOUNT_DISCARD);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (f2fs_sb_has_device_alias(sbi) &amp;&amp;</div><div class='add'>+			(ctx-&gt;opt_mask &amp; BIT(F2FS_MOUNT_READ_EXTENT_CACHE)) &amp;&amp;</div><div class='add'>+			!ctx_test_opt(ctx, F2FS_MOUNT_READ_EXTENT_CACHE)) {</div><div class='add'>+		f2fs_err(sbi, "device aliasing requires extent cache");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (test_opt(sbi, RESERVE_ROOT) &amp;&amp;</div><div class='add'>+			(ctx-&gt;opt_mask &amp; BIT(F2FS_MOUNT_RESERVE_ROOT)) &amp;&amp;</div><div class='add'>+			ctx_test_opt(ctx, F2FS_MOUNT_RESERVE_ROOT)) {</div><div class='add'>+		f2fs_info(sbi, "Preserve previous reserve_root=%u",</div><div class='add'>+			F2FS_OPTION(sbi).root_reserved_blocks);</div><div class='add'>+		ctx_clear_opt(ctx, F2FS_MOUNT_RESERVE_ROOT);</div><div class='add'>+		ctx-&gt;opt_mask &amp;= ~BIT(F2FS_MOUNT_RESERVE_ROOT);</div><div class='add'>+	}</div><div class='add'>+	if (test_opt(sbi, RESERVE_NODE) &amp;&amp;</div><div class='add'>+			(ctx-&gt;opt_mask &amp; BIT(F2FS_MOUNT_RESERVE_NODE)) &amp;&amp;</div><div class='add'>+			ctx_test_opt(ctx, F2FS_MOUNT_RESERVE_NODE)) {</div><div class='add'>+		f2fs_info(sbi, "Preserve previous reserve_node=%u",</div><div class='add'>+			F2FS_OPTION(sbi).root_reserved_nodes);</div><div class='add'>+		ctx_clear_opt(ctx, F2FS_MOUNT_RESERVE_NODE);</div><div class='add'>+		ctx-&gt;opt_mask &amp;= ~BIT(F2FS_MOUNT_RESERVE_NODE);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	err = f2fs_check_test_dummy_encryption(fc, sb);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	err = f2fs_check_compression(fc, sb);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	err = f2fs_check_quota_consistency(fc, sb);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	if (!IS_ENABLED(CONFIG_UNICODE) &amp;&amp; f2fs_sb_has_casefold(sbi)) {</div><div class='ctx'> 		f2fs_err(sbi,</div><div class='ctx'> 			"Filesystem with casefold feature cannot be mounted without CONFIG_UNICODE");</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-#endif</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The BLKZONED feature indicates that the drive was formatted with</div><div class='ctx'> 	 * zone alignment optimization. This is optional for host-aware</div><div class='ctx'> 	 * devices, but mandatory for host-managed zoned block devices.</div><div class='ctx'> 	 */</div><div class='del'>-#ifndef CONFIG_BLK_DEV_ZONED</div><div class='del'>-	if (f2fs_sb_has_blkzoned(sbi)) {</div><div class='del'>-		f2fs_err(sbi, "Zoned block device support is not enabled");</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-#endif</div><div class='ctx'> 	if (f2fs_sb_has_blkzoned(sbi)) {</div><div class='del'>-		if (F2FS_OPTION(sbi).discard_unit !=</div><div class='del'>-						DISCARD_UNIT_SECTION) {</div><div class='add'>+		if (F2FS_CTX_INFO(ctx).bggc_mode == BGGC_MODE_OFF) {</div><div class='add'>+			f2fs_warn(sbi, "zoned devices need bggc");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+#ifdef CONFIG_BLK_DEV_ZONED</div><div class='add'>+		if ((ctx-&gt;spec_mask &amp; F2FS_SPEC_discard_unit) &amp;&amp;</div><div class='add'>+		F2FS_CTX_INFO(ctx).discard_unit != DISCARD_UNIT_SECTION) {</div><div class='ctx'> 			f2fs_info(sbi, "Zoned block device doesn't need small discard, set discard_unit=section by default");</div><div class='del'>-			F2FS_OPTION(sbi).discard_unit =</div><div class='del'>-					DISCARD_UNIT_SECTION;</div><div class='add'>+			F2FS_CTX_INFO(ctx).discard_unit = DISCARD_UNIT_SECTION;</div><div class='ctx'> 		}</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='del'>-	if (f2fs_test_compress_extension(sbi)) {</div><div class='del'>-		f2fs_err(sbi, "invalid compress or nocompress extension");</div><div class='add'>+		if ((ctx-&gt;spec_mask &amp; F2FS_SPEC_mode) &amp;&amp;</div><div class='add'>+		F2FS_CTX_INFO(ctx).fs_mode != FS_MODE_LFS) {</div><div class='add'>+			f2fs_info(sbi, "Only lfs mode is allowed with zoned block device feature");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+#else</div><div class='add'>+		f2fs_err(sbi, "Zoned block device support is not enabled");</div><div class='ctx'> 		return -EINVAL;</div><div class='del'>-	}</div><div class='ctx'> #endif</div><div class='del'>-</div><div class='del'>-	if (F2FS_IO_SIZE_BITS(sbi) &amp;&amp; !f2fs_lfs_mode(sbi)) {</div><div class='del'>-		f2fs_err(sbi, "Should set mode=lfs with %uKB-sized IO",</div><div class='del'>-			 F2FS_IO_SIZE_KB(sbi));</div><div class='del'>-		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (test_opt(sbi, INLINE_XATTR_SIZE)) {</div><div class='del'>-		int min_size, max_size;</div><div class='del'>-</div><div class='add'>+	if (ctx_test_opt(ctx, F2FS_MOUNT_INLINE_XATTR_SIZE)) {</div><div class='ctx'> 		if (!f2fs_sb_has_extra_attr(sbi) ||</div><div class='ctx'> 			!f2fs_sb_has_flexible_inline_xattr(sbi)) {</div><div class='ctx'> 			f2fs_err(sbi, "extra_attr or flexible_inline_xattr feature is off");</div><div class='ctx'> 			return -EINVAL;</div><div class='ctx'> 		}</div><div class='del'>-		if (!test_opt(sbi, INLINE_XATTR)) {</div><div class='add'>+		if (!ctx_test_opt(ctx, F2FS_MOUNT_INLINE_XATTR) &amp;&amp; !test_opt(sbi, INLINE_XATTR)) {</div><div class='ctx'> 			f2fs_err(sbi, "inline_xattr_size option should be set with inline_xattr option");</div><div class='ctx'> 			return -EINVAL;</div><div class='ctx'> 		}</div><div class='del'>-</div><div class='del'>-		min_size = sizeof(struct f2fs_xattr_header) / sizeof(__le32);</div><div class='del'>-		max_size = MAX_INLINE_XATTR_SIZE;</div><div class='del'>-</div><div class='del'>-		if (F2FS_OPTION(sbi).inline_xattr_size &lt; min_size ||</div><div class='del'>-				F2FS_OPTION(sbi).inline_xattr_size &gt; max_size) {</div><div class='del'>-			f2fs_err(sbi, "inline xattr size is out of range: %d ~ %d",</div><div class='del'>-				 min_size, max_size);</div><div class='del'>-			return -EINVAL;</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (test_opt(sbi, DISABLE_CHECKPOINT) &amp;&amp; f2fs_lfs_mode(sbi)) {</div><div class='del'>-		f2fs_err(sbi, "LFS not compatible with checkpoint=disable");</div><div class='add'>+	if (ctx_test_opt(ctx, F2FS_MOUNT_ATGC) &amp;&amp;</div><div class='add'>+	    F2FS_CTX_INFO(ctx).fs_mode == FS_MODE_LFS) {</div><div class='add'>+		f2fs_err(sbi, "LFS is not compatible with ATGC");</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Not pass down write hints if the number of active logs is lesser</div><div class='del'>-	 * than NR_CURSEG_PERSIST_TYPE.</div><div class='del'>-	 */</div><div class='del'>-	if (F2FS_OPTION(sbi).active_logs != NR_CURSEG_PERSIST_TYPE)</div><div class='del'>-		F2FS_OPTION(sbi).whint_mode = WHINT_MODE_OFF;</div><div class='add'>+	if (f2fs_is_readonly(sbi) &amp;&amp; ctx_test_opt(ctx, F2FS_MOUNT_FLUSH_MERGE)) {</div><div class='add'>+		f2fs_err(sbi, "FLUSH_MERGE not compatible with readonly mode");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (f2fs_sb_has_readonly(sbi) &amp;&amp; !f2fs_readonly(sbi-&gt;sb)) {</div><div class='ctx'> 		f2fs_err(sbi, "Allow to mount readonly mode only");</div><div class='hunk'>@@ -1307,12 +1553,203 @@ default_check:</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void f2fs_apply_quota_options(struct fs_context *fc,</div><div class='add'>+				     struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+#ifdef CONFIG_QUOTA</div><div class='add'>+	struct f2fs_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_SB(sb);</div><div class='add'>+	bool quota_feature = f2fs_sb_has_quota_ino(sbi);</div><div class='add'>+	char *qname;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	if (quota_feature)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; MAXQUOTAS; i++) {</div><div class='add'>+		if (!(ctx-&gt;qname_mask &amp; (1 &lt;&lt; i)))</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		qname = F2FS_CTX_INFO(ctx).s_qf_names[i];</div><div class='add'>+		if (qname) {</div><div class='add'>+			qname = kstrdup(F2FS_CTX_INFO(ctx).s_qf_names[i],</div><div class='add'>+					GFP_KERNEL | __GFP_NOFAIL);</div><div class='add'>+			set_opt(sbi, QUOTA);</div><div class='add'>+		}</div><div class='add'>+		F2FS_OPTION(sbi).s_qf_names[i] = qname;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (ctx-&gt;spec_mask &amp; F2FS_SPEC_jqfmt)</div><div class='add'>+		F2FS_OPTION(sbi).s_jquota_fmt = F2FS_CTX_INFO(ctx).s_jquota_fmt;</div><div class='add'>+</div><div class='add'>+	if (quota_feature &amp;&amp; F2FS_OPTION(sbi).s_jquota_fmt) {</div><div class='add'>+		f2fs_info(sbi, "QUOTA feature is enabled, so ignore jquota_fmt");</div><div class='add'>+		F2FS_OPTION(sbi).s_jquota_fmt = 0;</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void f2fs_apply_test_dummy_encryption(struct fs_context *fc,</div><div class='add'>+					     struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_SB(sb);</div><div class='add'>+</div><div class='add'>+	if (!fscrypt_is_dummy_policy_set(&amp;F2FS_CTX_INFO(ctx).dummy_enc_policy) ||</div><div class='add'>+		/* if already set, it was already verified to be the same */</div><div class='add'>+		fscrypt_is_dummy_policy_set(&amp;F2FS_OPTION(sbi).dummy_enc_policy))</div><div class='add'>+		return;</div><div class='add'>+	swap(F2FS_OPTION(sbi).dummy_enc_policy, F2FS_CTX_INFO(ctx).dummy_enc_policy);</div><div class='add'>+	f2fs_warn(sbi, "Test dummy encryption mode enabled");</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void f2fs_apply_compression(struct fs_context *fc,</div><div class='add'>+				   struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+#ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='add'>+	struct f2fs_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_SB(sb);</div><div class='add'>+	unsigned char (*ctx_ext)[F2FS_EXTENSION_LEN];</div><div class='add'>+	unsigned char (*sbi_ext)[F2FS_EXTENSION_LEN];</div><div class='add'>+	int ctx_cnt, sbi_cnt, i;</div><div class='add'>+</div><div class='add'>+	if (ctx-&gt;spec_mask &amp; F2FS_SPEC_compress_level)</div><div class='add'>+		F2FS_OPTION(sbi).compress_level =</div><div class='add'>+					F2FS_CTX_INFO(ctx).compress_level;</div><div class='add'>+	if (ctx-&gt;spec_mask &amp; F2FS_SPEC_compress_algorithm)</div><div class='add'>+		F2FS_OPTION(sbi).compress_algorithm =</div><div class='add'>+					F2FS_CTX_INFO(ctx).compress_algorithm;</div><div class='add'>+	if (ctx-&gt;spec_mask &amp; F2FS_SPEC_compress_log_size)</div><div class='add'>+		F2FS_OPTION(sbi).compress_log_size =</div><div class='add'>+					F2FS_CTX_INFO(ctx).compress_log_size;</div><div class='add'>+	if (ctx-&gt;spec_mask &amp; F2FS_SPEC_compress_chksum)</div><div class='add'>+		F2FS_OPTION(sbi).compress_chksum =</div><div class='add'>+					F2FS_CTX_INFO(ctx).compress_chksum;</div><div class='add'>+	if (ctx-&gt;spec_mask &amp; F2FS_SPEC_compress_mode)</div><div class='add'>+		F2FS_OPTION(sbi).compress_mode =</div><div class='add'>+					F2FS_CTX_INFO(ctx).compress_mode;</div><div class='add'>+	if (ctx-&gt;spec_mask &amp; F2FS_SPEC_compress_extension) {</div><div class='add'>+		ctx_ext = F2FS_CTX_INFO(ctx).extensions;</div><div class='add'>+		ctx_cnt = F2FS_CTX_INFO(ctx).compress_ext_cnt;</div><div class='add'>+		sbi_ext = F2FS_OPTION(sbi).extensions;</div><div class='add'>+		sbi_cnt = F2FS_OPTION(sbi).compress_ext_cnt;</div><div class='add'>+		for (i = 0; i &lt; ctx_cnt; i++) {</div><div class='add'>+			if (strlen(ctx_ext[i]) == 0)</div><div class='add'>+				continue;</div><div class='add'>+			strscpy(sbi_ext[sbi_cnt], ctx_ext[i]);</div><div class='add'>+			sbi_cnt++;</div><div class='add'>+		}</div><div class='add'>+		F2FS_OPTION(sbi).compress_ext_cnt = sbi_cnt;</div><div class='add'>+	}</div><div class='add'>+	if (ctx-&gt;spec_mask &amp; F2FS_SPEC_nocompress_extension) {</div><div class='add'>+		ctx_ext = F2FS_CTX_INFO(ctx).noextensions;</div><div class='add'>+		ctx_cnt = F2FS_CTX_INFO(ctx).nocompress_ext_cnt;</div><div class='add'>+		sbi_ext = F2FS_OPTION(sbi).noextensions;</div><div class='add'>+		sbi_cnt = F2FS_OPTION(sbi).nocompress_ext_cnt;</div><div class='add'>+		for (i = 0; i &lt; ctx_cnt; i++) {</div><div class='add'>+			if (strlen(ctx_ext[i]) == 0)</div><div class='add'>+				continue;</div><div class='add'>+			strscpy(sbi_ext[sbi_cnt], ctx_ext[i]);</div><div class='add'>+			sbi_cnt++;</div><div class='add'>+		}</div><div class='add'>+		F2FS_OPTION(sbi).nocompress_ext_cnt = sbi_cnt;</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void f2fs_apply_options(struct fs_context *fc, struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_SB(sb);</div><div class='add'>+</div><div class='add'>+	F2FS_OPTION(sbi).opt &amp;= ~ctx-&gt;opt_mask;</div><div class='add'>+	F2FS_OPTION(sbi).opt |= F2FS_CTX_INFO(ctx).opt;</div><div class='add'>+</div><div class='add'>+	if (ctx-&gt;spec_mask &amp; F2FS_SPEC_background_gc)</div><div class='add'>+		F2FS_OPTION(sbi).bggc_mode = F2FS_CTX_INFO(ctx).bggc_mode;</div><div class='add'>+	if (ctx-&gt;spec_mask &amp; F2FS_SPEC_inline_xattr_size)</div><div class='add'>+		F2FS_OPTION(sbi).inline_xattr_size =</div><div class='add'>+					F2FS_CTX_INFO(ctx).inline_xattr_size;</div><div class='add'>+	if (ctx-&gt;spec_mask &amp; F2FS_SPEC_active_logs)</div><div class='add'>+		F2FS_OPTION(sbi).active_logs = F2FS_CTX_INFO(ctx).active_logs;</div><div class='add'>+	if (ctx-&gt;spec_mask &amp; F2FS_SPEC_reserve_root)</div><div class='add'>+		F2FS_OPTION(sbi).root_reserved_blocks =</div><div class='add'>+					F2FS_CTX_INFO(ctx).root_reserved_blocks;</div><div class='add'>+	if (ctx-&gt;spec_mask &amp; F2FS_SPEC_reserve_node)</div><div class='add'>+		F2FS_OPTION(sbi).root_reserved_nodes =</div><div class='add'>+					F2FS_CTX_INFO(ctx).root_reserved_nodes;</div><div class='add'>+	if (ctx-&gt;spec_mask &amp; F2FS_SPEC_resgid)</div><div class='add'>+		F2FS_OPTION(sbi).s_resgid = F2FS_CTX_INFO(ctx).s_resgid;</div><div class='add'>+	if (ctx-&gt;spec_mask &amp; F2FS_SPEC_resuid)</div><div class='add'>+		F2FS_OPTION(sbi).s_resuid = F2FS_CTX_INFO(ctx).s_resuid;</div><div class='add'>+	if (ctx-&gt;spec_mask &amp; F2FS_SPEC_mode)</div><div class='add'>+		F2FS_OPTION(sbi).fs_mode = F2FS_CTX_INFO(ctx).fs_mode;</div><div class='add'>+#ifdef CONFIG_F2FS_FAULT_INJECTION</div><div class='add'>+	if (ctx-&gt;spec_mask &amp; F2FS_SPEC_fault_injection)</div><div class='add'>+		(void)f2fs_build_fault_attr(sbi,</div><div class='add'>+		F2FS_CTX_INFO(ctx).fault_info.inject_rate, 0, FAULT_RATE);</div><div class='add'>+	if (ctx-&gt;spec_mask &amp; F2FS_SPEC_fault_type)</div><div class='add'>+		(void)f2fs_build_fault_attr(sbi, 0,</div><div class='add'>+			F2FS_CTX_INFO(ctx).fault_info.inject_type, FAULT_TYPE);</div><div class='add'>+#endif</div><div class='add'>+	if (ctx-&gt;spec_mask &amp; F2FS_SPEC_alloc_mode)</div><div class='add'>+		F2FS_OPTION(sbi).alloc_mode = F2FS_CTX_INFO(ctx).alloc_mode;</div><div class='add'>+	if (ctx-&gt;spec_mask &amp; F2FS_SPEC_fsync_mode)</div><div class='add'>+		F2FS_OPTION(sbi).fsync_mode = F2FS_CTX_INFO(ctx).fsync_mode;</div><div class='add'>+	if (ctx-&gt;spec_mask &amp; F2FS_SPEC_checkpoint_disable_cap)</div><div class='add'>+		F2FS_OPTION(sbi).unusable_cap = F2FS_CTX_INFO(ctx).unusable_cap;</div><div class='add'>+	if (ctx-&gt;spec_mask &amp; F2FS_SPEC_checkpoint_disable_cap_perc)</div><div class='add'>+		F2FS_OPTION(sbi).unusable_cap_perc =</div><div class='add'>+					F2FS_CTX_INFO(ctx).unusable_cap_perc;</div><div class='add'>+	if (ctx-&gt;spec_mask &amp; F2FS_SPEC_discard_unit)</div><div class='add'>+		F2FS_OPTION(sbi).discard_unit = F2FS_CTX_INFO(ctx).discard_unit;</div><div class='add'>+	if (ctx-&gt;spec_mask &amp; F2FS_SPEC_memory_mode)</div><div class='add'>+		F2FS_OPTION(sbi).memory_mode = F2FS_CTX_INFO(ctx).memory_mode;</div><div class='add'>+	if (ctx-&gt;spec_mask &amp; F2FS_SPEC_errors)</div><div class='add'>+		F2FS_OPTION(sbi).errors = F2FS_CTX_INFO(ctx).errors;</div><div class='add'>+	if (ctx-&gt;spec_mask &amp; F2FS_SPEC_lookup_mode)</div><div class='add'>+		F2FS_OPTION(sbi).lookup_mode = F2FS_CTX_INFO(ctx).lookup_mode;</div><div class='add'>+</div><div class='add'>+	f2fs_apply_compression(fc, sb);</div><div class='add'>+	f2fs_apply_test_dummy_encryption(fc, sb);</div><div class='add'>+	f2fs_apply_quota_options(fc, sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int f2fs_sanity_check_options(struct f2fs_sb_info *sbi, bool remount)</div><div class='add'>+{</div><div class='add'>+	if (f2fs_sb_has_device_alias(sbi) &amp;&amp;</div><div class='add'>+	    !test_opt(sbi, READ_EXTENT_CACHE)) {</div><div class='add'>+		f2fs_err(sbi, "device aliasing requires extent cache");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!remount)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BLK_DEV_ZONED</div><div class='add'>+	if (f2fs_sb_has_blkzoned(sbi) &amp;&amp;</div><div class='add'>+	    sbi-&gt;max_open_zones &lt; F2FS_OPTION(sbi).active_logs) {</div><div class='add'>+		f2fs_err(sbi,</div><div class='add'>+			"zoned: max open zones %u is too small, need at least %u open zones",</div><div class='add'>+				 sbi-&gt;max_open_zones, F2FS_OPTION(sbi).active_logs);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='add'>+	if (f2fs_lfs_mode(sbi) &amp;&amp; !IS_F2FS_IPU_DISABLE(sbi)) {</div><div class='add'>+		f2fs_warn(sbi, "LFS is not compatible with IPU");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static struct inode *f2fs_alloc_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_inode_info *fi;</div><div class='ctx'> </div><div class='del'>-	fi = f2fs_kmem_cache_alloc(f2fs_inode_cachep,</div><div class='del'>-				GFP_F2FS_ZERO, false, F2FS_SB(sb));</div><div class='add'>+	if (time_to_inject(F2FS_SB(sb), FAULT_SLAB_ALLOC))</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	fi = alloc_inode_sb(sb, f2fs_inode_cachep, GFP_F2FS_ZERO);</div><div class='ctx'> 	if (!fi)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='hunk'>@@ -1321,16 +1758,16 @@ static struct inode *f2fs_alloc_inode(struct super_block *sb)</div><div class='ctx'> 	/* Initialize f2fs-specific inode info */</div><div class='ctx'> 	atomic_set(&amp;fi-&gt;dirty_pages, 0);</div><div class='ctx'> 	atomic_set(&amp;fi-&gt;i_compr_blocks, 0);</div><div class='del'>-	init_rwsem(&amp;fi-&gt;i_sem);</div><div class='add'>+	atomic_set(&amp;fi-&gt;open_count, 0);</div><div class='add'>+	atomic_set(&amp;fi-&gt;writeback, 0);</div><div class='add'>+	init_f2fs_rwsem(&amp;fi-&gt;i_sem);</div><div class='ctx'> 	spin_lock_init(&amp;fi-&gt;i_size_lock);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;fi-&gt;dirty_list);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;fi-&gt;gdirty_list);</div><div class='del'>-	INIT_LIST_HEAD(&amp;fi-&gt;inmem_ilist);</div><div class='del'>-	INIT_LIST_HEAD(&amp;fi-&gt;inmem_pages);</div><div class='del'>-	mutex_init(&amp;fi-&gt;inmem_lock);</div><div class='del'>-	init_rwsem(&amp;fi-&gt;i_gc_rwsem[READ]);</div><div class='del'>-	init_rwsem(&amp;fi-&gt;i_gc_rwsem[WRITE]);</div><div class='del'>-	init_rwsem(&amp;fi-&gt;i_xattr_sem);</div><div class='add'>+	INIT_LIST_HEAD(&amp;fi-&gt;gdonate_list);</div><div class='add'>+	init_f2fs_rwsem(&amp;fi-&gt;i_gc_rwsem[READ]);</div><div class='add'>+	init_f2fs_rwsem(&amp;fi-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+	init_f2fs_rwsem(&amp;fi-&gt;i_xattr_sem);</div><div class='ctx'> </div><div class='ctx'> 	/* Will be used by directory only */</div><div class='ctx'> 	fi-&gt;i_dir_level = F2FS_SB(sb)-&gt;dir_level;</div><div class='hunk'>@@ -1362,16 +1799,12 @@ static int f2fs_drop_inode(struct inode *inode)</div><div class='ctx'> 	 *    - f2fs_gc -&gt; iput -&gt; evict</div><div class='ctx'> 	 *       - inode_wait_for_writeback(inode)</div><div class='ctx'> 	 */</div><div class='del'>-	if ((!inode_unhashed(inode) &amp;&amp; inode-&gt;i_state &amp; I_SYNC)) {</div><div class='add'>+	if ((!inode_unhashed(inode) &amp;&amp; inode_state_read(inode) &amp; I_SYNC)) {</div><div class='ctx'> 		if (!inode-&gt;i_nlink &amp;&amp; !is_bad_inode(inode)) {</div><div class='ctx'> 			/* to avoid evict_inode call simultaneously */</div><div class='del'>-			atomic_inc(&amp;inode-&gt;i_count);</div><div class='add'>+			__iget(inode);</div><div class='ctx'> 			spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> </div><div class='del'>-			/* some remained atomic pages should discarded */</div><div class='del'>-			if (f2fs_is_atomic_file(inode))</div><div class='del'>-				f2fs_drop_inmem_pages(inode);</div><div class='del'>-</div><div class='ctx'> 			/* should remain fi-&gt;extent_tree for writepage */</div><div class='ctx'> 			f2fs_destroy_extent_node(inode);</div><div class='ctx'> </div><div class='hunk'>@@ -1393,7 +1826,7 @@ static int f2fs_drop_inode(struct inode *inode)</div><div class='ctx'> 		trace_f2fs_drop_inode(inode, 0);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='del'>-	ret = generic_drop_inode(inode);</div><div class='add'>+	ret = inode_generic_drop(inode);</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		ret = fscrypt_drop_inode(inode);</div><div class='ctx'> 	trace_f2fs_drop_inode(inode, ret);</div><div class='hunk'>@@ -1418,6 +1851,12 @@ int f2fs_inode_dirtied(struct inode *inode, bool sync)</div><div class='ctx'> 		inc_page_count(sbi, F2FS_DIRTY_IMETA);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;sbi-&gt;inode_lock[DIRTY_META]);</div><div class='add'>+</div><div class='add'>+	/* if atomic write is not committed, set inode w/ atomic dirty */</div><div class='add'>+	if (!ret &amp;&amp; f2fs_is_atomic_file(inode) &amp;&amp;</div><div class='add'>+			!is_inode_flag_set(inode, FI_ATOMIC_COMMITTED))</div><div class='add'>+		set_inode_flag(inode, FI_ATOMIC_DIRTIED);</div><div class='add'>+</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1467,8 +1906,9 @@ static void f2fs_free_inode(struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> static void destroy_percpu_info(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='del'>-	percpu_counter_destroy(&amp;sbi-&gt;alloc_valid_block_count);</div><div class='ctx'> 	percpu_counter_destroy(&amp;sbi-&gt;total_valid_inode_count);</div><div class='add'>+	percpu_counter_destroy(&amp;sbi-&gt;rf_node_block_count);</div><div class='add'>+	percpu_counter_destroy(&amp;sbi-&gt;alloc_valid_block_count);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void destroy_device_list(struct f2fs_sb_info *sbi)</div><div class='hunk'>@@ -1476,10 +1916,10 @@ static void destroy_device_list(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; sbi-&gt;s_ndevs; i++) {</div><div class='del'>-		blkdev_put(FDEV(i).bdev, FMODE_EXCL);</div><div class='add'>+		if (i &gt; 0)</div><div class='add'>+			bdev_fput(FDEV(i).bdev_file);</div><div class='ctx'> #ifdef CONFIG_BLK_DEV_ZONED</div><div class='ctx'> 		kvfree(FDEV(i).blkz_seq);</div><div class='del'>-		kfree(FDEV(i).zone_capacity_blocks);</div><div class='ctx'> #endif</div><div class='ctx'> 	}</div><div class='ctx'> 	kvfree(sbi-&gt;devs);</div><div class='hunk'>@@ -1489,7 +1929,8 @@ static void f2fs_put_super(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_SB(sb);</div><div class='ctx'> 	int i;</div><div class='del'>-	bool dropped;</div><div class='add'>+	int err = 0;</div><div class='add'>+	bool done;</div><div class='ctx'> </div><div class='ctx'> 	/* unregister procfs/sysfs entries in advance to avoid race case */</div><div class='ctx'> 	f2fs_unregister_sysfs(sbi);</div><div class='hunk'>@@ -1515,18 +1956,18 @@ static void f2fs_put_super(struct super_block *sb)</div><div class='ctx'> 		struct cp_control cpc = {</div><div class='ctx'> 			.reason = CP_UMOUNT,</div><div class='ctx'> 		};</div><div class='del'>-		f2fs_write_checkpoint(sbi, &amp;cpc);</div><div class='add'>+		stat_inc_cp_call_count(sbi, TOTAL_CALL);</div><div class='add'>+		err = f2fs_write_checkpoint(sbi, &amp;cpc);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* be sure to wait for any on-going discard commands */</div><div class='del'>-	dropped = f2fs_issue_discard_timeout(sbi);</div><div class='del'>-</div><div class='del'>-	if ((f2fs_hw_support_discard(sbi) || f2fs_hw_should_discard(sbi)) &amp;&amp;</div><div class='del'>-					!sbi-&gt;discard_blks &amp;&amp; !dropped) {</div><div class='add'>+	done = f2fs_issue_discard_timeout(sbi);</div><div class='add'>+	if (f2fs_realtime_discard_enable(sbi) &amp;&amp; !sbi-&gt;discard_blks &amp;&amp; done) {</div><div class='ctx'> 		struct cp_control cpc = {</div><div class='ctx'> 			.reason = CP_UMOUNT | CP_TRIMMED,</div><div class='ctx'> 		};</div><div class='del'>-		f2fs_write_checkpoint(sbi, &amp;cpc);</div><div class='add'>+		stat_inc_cp_call_count(sbi, TOTAL_CALL);</div><div class='add'>+		err = f2fs_write_checkpoint(sbi, &amp;cpc);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1543,6 +1984,11 @@ static void f2fs_put_super(struct super_block *sb)</div><div class='ctx'> </div><div class='ctx'> 	f2fs_wait_on_all_pages(sbi, F2FS_WB_CP_DATA);</div><div class='ctx'> </div><div class='add'>+	if (err || f2fs_cp_error(sbi)) {</div><div class='add'>+		truncate_inode_pages_final(NODE_MAPPING(sbi));</div><div class='add'>+		truncate_inode_pages_final(META_MAPPING(sbi));</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	f2fs_bug_on(sbi, sbi-&gt;fsync_node_num);</div><div class='ctx'> </div><div class='ctx'> 	f2fs_destroy_compress_inode(sbi);</div><div class='hunk'>@@ -1553,6 +1999,15 @@ static void f2fs_put_super(struct super_block *sb)</div><div class='ctx'> 	iput(sbi-&gt;meta_inode);</div><div class='ctx'> 	sbi-&gt;meta_inode = NULL;</div><div class='ctx'> </div><div class='add'>+	/* Should check the page counts after dropping all node/meta pages */</div><div class='add'>+	for (i = 0; i &lt; NR_COUNT_TYPE; i++) {</div><div class='add'>+		if (!get_pages(sbi, i))</div><div class='add'>+			continue;</div><div class='add'>+		f2fs_err(sbi, "detect filesystem reference count leak during "</div><div class='add'>+			"umount, type: %d, count: %lld", i, get_pages(sbi, i));</div><div class='add'>+		f2fs_bug_on(sbi, 1);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * iput() can update stat information, if f2fs_write_checkpoint()</div><div class='ctx'> 	 * above failed with error.</div><div class='hunk'>@@ -1563,19 +2018,16 @@ static void f2fs_put_super(struct super_block *sb)</div><div class='ctx'> 	f2fs_destroy_node_manager(sbi);</div><div class='ctx'> 	f2fs_destroy_segment_manager(sbi);</div><div class='ctx'> </div><div class='add'>+	/* flush s_error_work before sbi destroy */</div><div class='add'>+	flush_work(&amp;sbi-&gt;s_error_work);</div><div class='add'>+</div><div class='ctx'> 	f2fs_destroy_post_read_wq(sbi);</div><div class='ctx'> </div><div class='ctx'> 	kvfree(sbi-&gt;ckpt);</div><div class='ctx'> </div><div class='del'>-	sb-&gt;s_fs_info = NULL;</div><div class='del'>-	if (sbi-&gt;s_chksum_driver)</div><div class='del'>-		crypto_free_shash(sbi-&gt;s_chksum_driver);</div><div class='ctx'> 	kfree(sbi-&gt;raw_super);</div><div class='ctx'> </div><div class='del'>-	destroy_device_list(sbi);</div><div class='ctx'> 	f2fs_destroy_page_array_cache(sbi);</div><div class='del'>-	f2fs_destroy_xattr_caches(sbi);</div><div class='del'>-	mempool_destroy(sbi-&gt;write_io_dummy);</div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='ctx'> 	for (i = 0; i &lt; MAXQUOTAS; i++)</div><div class='ctx'> 		kfree(F2FS_OPTION(sbi).s_qf_names[i]);</div><div class='hunk'>@@ -1584,11 +2036,10 @@ static void f2fs_put_super(struct super_block *sb)</div><div class='ctx'> 	destroy_percpu_info(sbi);</div><div class='ctx'> 	f2fs_destroy_iostat(sbi);</div><div class='ctx'> 	for (i = 0; i &lt; NR_PAGE_TYPE; i++)</div><div class='del'>-		kvfree(sbi-&gt;write_io[i]);</div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='add'>+		kfree(sbi-&gt;write_io[i]);</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='ctx'> 	utf8_unload(sb-&gt;s_encoding);</div><div class='ctx'> #endif</div><div class='del'>-	kfree(sbi);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int f2fs_sync_fs(struct super_block *sb, int sync)</div><div class='hunk'>@@ -1606,33 +2057,56 @@ int f2fs_sync_fs(struct super_block *sb, int sync)</div><div class='ctx'> 	if (unlikely(is_sbi_flag_set(sbi, SBI_POR_DOING)))</div><div class='ctx'> 		return -EAGAIN;</div><div class='ctx'> </div><div class='del'>-	if (sync)</div><div class='add'>+	if (sync) {</div><div class='add'>+		stat_inc_cp_call_count(sbi, TOTAL_CALL);</div><div class='ctx'> 		err = f2fs_issue_checkpoint(sbi);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int f2fs_freeze(struct super_block *sb)</div><div class='ctx'> {</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_SB(sb);</div><div class='add'>+</div><div class='ctx'> 	if (f2fs_readonly(sb))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/* IO error happened before */</div><div class='del'>-	if (unlikely(f2fs_cp_error(F2FS_SB(sb))))</div><div class='add'>+	if (unlikely(f2fs_cp_error(sbi)))</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> </div><div class='ctx'> 	/* must be clean, since sync_filesystem() was already called */</div><div class='del'>-	if (is_sbi_flag_set(F2FS_SB(sb), SBI_IS_DIRTY))</div><div class='add'>+	if (is_sbi_flag_set(sbi, SBI_IS_DIRTY))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	/* ensure no checkpoint required */</div><div class='del'>-	if (!llist_empty(&amp;F2FS_SB(sb)-&gt;cprc_info.issue_list))</div><div class='del'>-		return -EINVAL;</div><div class='add'>+	sbi-&gt;umount_lock_holder = current;</div><div class='add'>+</div><div class='add'>+	/* Let's flush checkpoints and stop the thread. */</div><div class='add'>+	f2fs_flush_ckpt_thread(sbi);</div><div class='add'>+</div><div class='add'>+	sbi-&gt;umount_lock_holder = NULL;</div><div class='add'>+</div><div class='add'>+	/* to avoid deadlock on f2fs_evict_inode-&gt;SB_FREEZE_FS */</div><div class='add'>+	set_sbi_flag(sbi, SBI_IS_FREEZING);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int f2fs_unfreeze(struct super_block *sb)</div><div class='ctx'> {</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_SB(sb);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * It will update discard_max_bytes of mounted lvm device to zero</div><div class='add'>+	 * after creating snapshot on this lvm device, let's drop all</div><div class='add'>+	 * remained discards.</div><div class='add'>+	 * We don't need to disable real-time discard because discard_max_bytes</div><div class='add'>+	 * will recover after removal of snapshot.</div><div class='add'>+	 */</div><div class='add'>+	if (test_opt(sbi, DISCARD) &amp;&amp; !f2fs_hw_support_discard(sbi))</div><div class='add'>+		f2fs_issue_discard_timeout(sbi);</div><div class='add'>+</div><div class='add'>+	clear_sbi_flag(F2FS_SB(sb), SBI_IS_FREEZING);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1653,26 +2127,32 @@ static int f2fs_statfs_project(struct super_block *sb,</div><div class='ctx'> </div><div class='ctx'> 	limit = min_not_zero(dquot-&gt;dq_dqb.dqb_bsoftlimit,</div><div class='ctx'> 					dquot-&gt;dq_dqb.dqb_bhardlimit);</div><div class='del'>-	if (limit)</div><div class='del'>-		limit &gt;&gt;= sb-&gt;s_blocksize_bits;</div><div class='add'>+	limit &gt;&gt;= sb-&gt;s_blocksize_bits;</div><div class='add'>+</div><div class='add'>+	if (limit) {</div><div class='add'>+		uint64_t remaining = 0;</div><div class='ctx'> </div><div class='del'>-	if (limit &amp;&amp; buf-&gt;f_blocks &gt; limit) {</div><div class='ctx'> 		curblock = (dquot-&gt;dq_dqb.dqb_curspace +</div><div class='ctx'> 			    dquot-&gt;dq_dqb.dqb_rsvspace) &gt;&gt; sb-&gt;s_blocksize_bits;</div><div class='del'>-		buf-&gt;f_blocks = limit;</div><div class='del'>-		buf-&gt;f_bfree = buf-&gt;f_bavail =</div><div class='del'>-			(buf-&gt;f_blocks &gt; curblock) ?</div><div class='del'>-			 (buf-&gt;f_blocks - curblock) : 0;</div><div class='add'>+		if (limit &gt; curblock)</div><div class='add'>+			remaining = limit - curblock;</div><div class='add'>+</div><div class='add'>+		buf-&gt;f_blocks = min(buf-&gt;f_blocks, limit);</div><div class='add'>+		buf-&gt;f_bfree = min(buf-&gt;f_bfree, remaining);</div><div class='add'>+		buf-&gt;f_bavail = min(buf-&gt;f_bavail, remaining);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	limit = min_not_zero(dquot-&gt;dq_dqb.dqb_isoftlimit,</div><div class='ctx'> 					dquot-&gt;dq_dqb.dqb_ihardlimit);</div><div class='ctx'> </div><div class='del'>-	if (limit &amp;&amp; buf-&gt;f_files &gt; limit) {</div><div class='del'>-		buf-&gt;f_files = limit;</div><div class='del'>-		buf-&gt;f_ffree =</div><div class='del'>-			(buf-&gt;f_files &gt; dquot-&gt;dq_dqb.dqb_curinodes) ?</div><div class='del'>-			 (buf-&gt;f_files - dquot-&gt;dq_dqb.dqb_curinodes) : 0;</div><div class='add'>+	if (limit) {</div><div class='add'>+		uint64_t remaining = 0;</div><div class='add'>+</div><div class='add'>+		if (limit &gt; dquot-&gt;dq_dqb.dqb_curinodes)</div><div class='add'>+			remaining = limit - dquot-&gt;dq_dqb.dqb_curinodes;</div><div class='add'>+</div><div class='add'>+		buf-&gt;f_files = min(buf-&gt;f_files, limit);</div><div class='add'>+		buf-&gt;f_ffree = min(buf-&gt;f_ffree, remaining);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	spin_unlock(&amp;dquot-&gt;dq_dqb_lock);</div><div class='hunk'>@@ -1688,18 +2168,24 @@ static int f2fs_statfs(struct dentry *dentry, struct kstatfs *buf)</div><div class='ctx'> 	u64 id = huge_encode_dev(sb-&gt;s_bdev-&gt;bd_dev);</div><div class='ctx'> 	block_t total_count, user_block_count, start_count;</div><div class='ctx'> 	u64 avail_node_count;</div><div class='add'>+	unsigned int total_valid_node_count;</div><div class='ctx'> </div><div class='ctx'> 	total_count = le64_to_cpu(sbi-&gt;raw_super-&gt;block_count);</div><div class='del'>-	user_block_count = sbi-&gt;user_block_count;</div><div class='ctx'> 	start_count = le32_to_cpu(sbi-&gt;raw_super-&gt;segment0_blkaddr);</div><div class='ctx'> 	buf-&gt;f_type = F2FS_SUPER_MAGIC;</div><div class='ctx'> 	buf-&gt;f_bsize = sbi-&gt;blocksize;</div><div class='ctx'> </div><div class='ctx'> 	buf-&gt;f_blocks = total_count - start_count;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;sbi-&gt;stat_lock);</div><div class='add'>+	if (sbi-&gt;carve_out)</div><div class='add'>+		buf-&gt;f_blocks -= sbi-&gt;current_reserved_blocks;</div><div class='add'>+	user_block_count = sbi-&gt;user_block_count;</div><div class='add'>+	total_valid_node_count = valid_node_count(sbi);</div><div class='add'>+	avail_node_count = sbi-&gt;total_node_count - F2FS_RESERVED_NODE_NUM;</div><div class='ctx'> 	buf-&gt;f_bfree = user_block_count - valid_user_blocks(sbi) -</div><div class='ctx'> 						sbi-&gt;current_reserved_blocks;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;sbi-&gt;stat_lock);</div><div class='ctx'> 	if (unlikely(buf-&gt;f_bfree &lt;= sbi-&gt;unusable_block_count))</div><div class='ctx'> 		buf-&gt;f_bfree = 0;</div><div class='ctx'> 	else</div><div class='hunk'>@@ -1712,14 +2198,12 @@ static int f2fs_statfs(struct dentry *dentry, struct kstatfs *buf)</div><div class='ctx'> 	else</div><div class='ctx'> 		buf-&gt;f_bavail = 0;</div><div class='ctx'> </div><div class='del'>-	avail_node_count = sbi-&gt;total_node_count - F2FS_RESERVED_NODE_NUM;</div><div class='del'>-</div><div class='ctx'> 	if (avail_node_count &gt; user_block_count) {</div><div class='ctx'> 		buf-&gt;f_files = user_block_count;</div><div class='ctx'> 		buf-&gt;f_ffree = buf-&gt;f_bavail;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		buf-&gt;f_files = avail_node_count;</div><div class='del'>-		buf-&gt;f_ffree = min(avail_node_count - valid_node_count(sbi),</div><div class='add'>+		buf-&gt;f_ffree = min(avail_node_count - total_valid_node_count,</div><div class='ctx'> 					buf-&gt;f_bavail);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1727,9 +2211,9 @@ static int f2fs_statfs(struct dentry *dentry, struct kstatfs *buf)</div><div class='ctx'> 	buf-&gt;f_fsid    = u64_to_fsid(id);</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='del'>-	if (is_inode_flag_set(dentry-&gt;d_inode, FI_PROJ_INHERIT) &amp;&amp;</div><div class='add'>+	if (is_inode_flag_set(d_inode(dentry), FI_PROJ_INHERIT) &amp;&amp;</div><div class='ctx'> 			sb_has_quota_limits_enabled(sb, PRJQUOTA)) {</div><div class='del'>-		f2fs_statfs_project(sb, F2FS_I(dentry-&gt;d_inode)-&gt;i_projid, buf);</div><div class='add'>+		f2fs_statfs_project(sb, F2FS_I(d_inode(dentry))-&gt;i_projid, buf);</div><div class='ctx'> 	}</div><div class='ctx'> #endif</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -1841,19 +2325,24 @@ static int f2fs_show_options(struct seq_file *seq, struct dentry *root)</div><div class='ctx'> </div><div class='ctx'> 	if (test_opt(sbi, GC_MERGE))</div><div class='ctx'> 		seq_puts(seq, ",gc_merge");</div><div class='add'>+	else</div><div class='add'>+		seq_puts(seq, ",nogc_merge");</div><div class='ctx'> </div><div class='ctx'> 	if (test_opt(sbi, DISABLE_ROLL_FORWARD))</div><div class='ctx'> 		seq_puts(seq, ",disable_roll_forward");</div><div class='ctx'> 	if (test_opt(sbi, NORECOVERY))</div><div class='ctx'> 		seq_puts(seq, ",norecovery");</div><div class='del'>-	if (test_opt(sbi, DISCARD))</div><div class='add'>+	if (test_opt(sbi, DISCARD)) {</div><div class='ctx'> 		seq_puts(seq, ",discard");</div><div class='del'>-	else</div><div class='add'>+		if (F2FS_OPTION(sbi).discard_unit == DISCARD_UNIT_BLOCK)</div><div class='add'>+			seq_printf(seq, ",discard_unit=%s", "block");</div><div class='add'>+		else if (F2FS_OPTION(sbi).discard_unit == DISCARD_UNIT_SEGMENT)</div><div class='add'>+			seq_printf(seq, ",discard_unit=%s", "segment");</div><div class='add'>+		else if (F2FS_OPTION(sbi).discard_unit == DISCARD_UNIT_SECTION)</div><div class='add'>+			seq_printf(seq, ",discard_unit=%s", "section");</div><div class='add'>+	} else {</div><div class='ctx'> 		seq_puts(seq, ",nodiscard");</div><div class='del'>-	if (test_opt(sbi, NOHEAP))</div><div class='del'>-		seq_puts(seq, ",no_heap");</div><div class='del'>-	else</div><div class='del'>-		seq_puts(seq, ",heap");</div><div class='add'>+	}</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_XATTR</div><div class='ctx'> 	if (test_opt(sbi, XATTR_USER))</div><div class='ctx'> 		seq_puts(seq, ",user_xattr");</div><div class='hunk'>@@ -1883,16 +2372,22 @@ static int f2fs_show_options(struct seq_file *seq, struct dentry *root)</div><div class='ctx'> 		seq_puts(seq, ",inline_dentry");</div><div class='ctx'> 	else</div><div class='ctx'> 		seq_puts(seq, ",noinline_dentry");</div><div class='del'>-	if (!f2fs_readonly(sbi-&gt;sb) &amp;&amp; test_opt(sbi, FLUSH_MERGE))</div><div class='add'>+	if (test_opt(sbi, FLUSH_MERGE))</div><div class='ctx'> 		seq_puts(seq, ",flush_merge");</div><div class='add'>+	else</div><div class='add'>+		seq_puts(seq, ",noflush_merge");</div><div class='ctx'> 	if (test_opt(sbi, NOBARRIER))</div><div class='ctx'> 		seq_puts(seq, ",nobarrier");</div><div class='add'>+	else</div><div class='add'>+		seq_puts(seq, ",barrier");</div><div class='ctx'> 	if (test_opt(sbi, FASTBOOT))</div><div class='ctx'> 		seq_puts(seq, ",fastboot");</div><div class='del'>-	if (test_opt(sbi, EXTENT_CACHE))</div><div class='add'>+	if (test_opt(sbi, READ_EXTENT_CACHE))</div><div class='ctx'> 		seq_puts(seq, ",extent_cache");</div><div class='ctx'> 	else</div><div class='ctx'> 		seq_puts(seq, ",noextent_cache");</div><div class='add'>+	if (test_opt(sbi, AGE_EXTENT_CACHE))</div><div class='add'>+		seq_puts(seq, ",age_extent_cache");</div><div class='ctx'> 	if (test_opt(sbi, DATA_FLUSH))</div><div class='ctx'> 		seq_puts(seq, ",data_flush");</div><div class='ctx'> </div><div class='hunk'>@@ -1906,16 +2401,15 @@ static int f2fs_show_options(struct seq_file *seq, struct dentry *root)</div><div class='ctx'> 	else if (F2FS_OPTION(sbi).fs_mode == FS_MODE_FRAGMENT_BLK)</div><div class='ctx'> 		seq_puts(seq, "fragment:block");</div><div class='ctx'> 	seq_printf(seq, ",active_logs=%u", F2FS_OPTION(sbi).active_logs);</div><div class='del'>-	if (test_opt(sbi, RESERVE_ROOT))</div><div class='del'>-		seq_printf(seq, ",reserve_root=%u,resuid=%u,resgid=%u",</div><div class='add'>+	if (test_opt(sbi, RESERVE_ROOT) || test_opt(sbi, RESERVE_NODE))</div><div class='add'>+		seq_printf(seq, ",reserve_root=%u,reserve_node=%u,resuid=%u,"</div><div class='add'>+				"resgid=%u",</div><div class='ctx'> 				F2FS_OPTION(sbi).root_reserved_blocks,</div><div class='add'>+				F2FS_OPTION(sbi).root_reserved_nodes,</div><div class='ctx'> 				from_kuid_munged(&amp;init_user_ns,</div><div class='ctx'> 					F2FS_OPTION(sbi).s_resuid),</div><div class='ctx'> 				from_kgid_munged(&amp;init_user_ns,</div><div class='ctx'> 					F2FS_OPTION(sbi).s_resgid));</div><div class='del'>-	if (F2FS_IO_SIZE_BITS(sbi))</div><div class='del'>-		seq_printf(seq, ",io_bits=%u",</div><div class='del'>-				F2FS_OPTION(sbi).write_io_size_bits);</div><div class='ctx'> #ifdef CONFIG_F2FS_FAULT_INJECTION</div><div class='ctx'> 	if (test_opt(sbi, FAULT_INJECTION)) {</div><div class='ctx'> 		seq_printf(seq, ",fault_injection=%u",</div><div class='hunk'>@@ -1935,10 +2429,6 @@ static int f2fs_show_options(struct seq_file *seq, struct dentry *root)</div><div class='ctx'> 		seq_puts(seq, ",prjquota");</div><div class='ctx'> #endif</div><div class='ctx'> 	f2fs_show_quota_options(seq, sbi-&gt;sb);</div><div class='del'>-	if (F2FS_OPTION(sbi).whint_mode == WHINT_MODE_USER)</div><div class='del'>-		seq_printf(seq, ",whint_mode=%s", "user-based");</div><div class='del'>-	else if (F2FS_OPTION(sbi).whint_mode == WHINT_MODE_FS)</div><div class='del'>-		seq_printf(seq, ",whint_mode=%s", "fs-based");</div><div class='ctx'> </div><div class='ctx'> 	fscrypt_show_test_dummy_encryption(seq, ',', sbi-&gt;sb);</div><div class='ctx'> </div><div class='hunk'>@@ -1971,57 +2461,83 @@ static int f2fs_show_options(struct seq_file *seq, struct dentry *root)</div><div class='ctx'> 	if (test_opt(sbi, ATGC))</div><div class='ctx'> 		seq_puts(seq, ",atgc");</div><div class='ctx'> </div><div class='del'>-	if (F2FS_OPTION(sbi).discard_unit == DISCARD_UNIT_BLOCK)</div><div class='del'>-		seq_printf(seq, ",discard_unit=%s", "block");</div><div class='del'>-	else if (F2FS_OPTION(sbi).discard_unit == DISCARD_UNIT_SEGMENT)</div><div class='del'>-		seq_printf(seq, ",discard_unit=%s", "segment");</div><div class='del'>-	else if (F2FS_OPTION(sbi).discard_unit == DISCARD_UNIT_SECTION)</div><div class='del'>-		seq_printf(seq, ",discard_unit=%s", "section");</div><div class='add'>+	if (F2FS_OPTION(sbi).memory_mode == MEMORY_MODE_NORMAL)</div><div class='add'>+		seq_printf(seq, ",memory=%s", "normal");</div><div class='add'>+	else if (F2FS_OPTION(sbi).memory_mode == MEMORY_MODE_LOW)</div><div class='add'>+		seq_printf(seq, ",memory=%s", "low");</div><div class='add'>+</div><div class='add'>+	if (F2FS_OPTION(sbi).errors == MOUNT_ERRORS_READONLY)</div><div class='add'>+		seq_printf(seq, ",errors=%s", "remount-ro");</div><div class='add'>+	else if (F2FS_OPTION(sbi).errors == MOUNT_ERRORS_CONTINUE)</div><div class='add'>+		seq_printf(seq, ",errors=%s", "continue");</div><div class='add'>+	else if (F2FS_OPTION(sbi).errors == MOUNT_ERRORS_PANIC)</div><div class='add'>+		seq_printf(seq, ",errors=%s", "panic");</div><div class='add'>+</div><div class='add'>+	if (test_opt(sbi, NAT_BITS))</div><div class='add'>+		seq_puts(seq, ",nat_bits");</div><div class='add'>+</div><div class='add'>+	if (F2FS_OPTION(sbi).lookup_mode == LOOKUP_PERF)</div><div class='add'>+		seq_show_option(seq, "lookup_mode", "perf");</div><div class='add'>+	else if (F2FS_OPTION(sbi).lookup_mode == LOOKUP_COMPAT)</div><div class='add'>+		seq_show_option(seq, "lookup_mode", "compat");</div><div class='add'>+	else if (F2FS_OPTION(sbi).lookup_mode == LOOKUP_AUTO)</div><div class='add'>+		seq_show_option(seq, "lookup_mode", "auto");</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void default_options(struct f2fs_sb_info *sbi)</div><div class='add'>+static void default_options(struct f2fs_sb_info *sbi, bool remount)</div><div class='ctx'> {</div><div class='ctx'> 	/* init some FS parameters */</div><div class='add'>+	if (!remount) {</div><div class='add'>+		set_opt(sbi, READ_EXTENT_CACHE);</div><div class='add'>+		clear_opt(sbi, DISABLE_CHECKPOINT);</div><div class='add'>+</div><div class='add'>+		if (f2fs_hw_support_discard(sbi) || f2fs_hw_should_discard(sbi))</div><div class='add'>+			set_opt(sbi, DISCARD);</div><div class='add'>+</div><div class='add'>+		if (f2fs_sb_has_blkzoned(sbi))</div><div class='add'>+			F2FS_OPTION(sbi).discard_unit = DISCARD_UNIT_SECTION;</div><div class='add'>+		else</div><div class='add'>+			F2FS_OPTION(sbi).discard_unit = DISCARD_UNIT_BLOCK;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (f2fs_sb_has_readonly(sbi))</div><div class='ctx'> 		F2FS_OPTION(sbi).active_logs = NR_CURSEG_RO_TYPE;</div><div class='ctx'> 	else</div><div class='ctx'> 		F2FS_OPTION(sbi).active_logs = NR_CURSEG_PERSIST_TYPE;</div><div class='ctx'> </div><div class='ctx'> 	F2FS_OPTION(sbi).inline_xattr_size = DEFAULT_INLINE_XATTR_ADDRS;</div><div class='del'>-	F2FS_OPTION(sbi).whint_mode = WHINT_MODE_OFF;</div><div class='del'>-	F2FS_OPTION(sbi).alloc_mode = ALLOC_MODE_DEFAULT;</div><div class='add'>+	if (le32_to_cpu(F2FS_RAW_SUPER(sbi)-&gt;segment_count_main) &lt;=</div><div class='add'>+							SMALL_VOLUME_SEGMENTS)</div><div class='add'>+		F2FS_OPTION(sbi).alloc_mode = ALLOC_MODE_REUSE;</div><div class='add'>+	else</div><div class='add'>+		F2FS_OPTION(sbi).alloc_mode = ALLOC_MODE_DEFAULT;</div><div class='ctx'> 	F2FS_OPTION(sbi).fsync_mode = FSYNC_MODE_POSIX;</div><div class='ctx'> 	F2FS_OPTION(sbi).s_resuid = make_kuid(&amp;init_user_ns, F2FS_DEF_RESUID);</div><div class='ctx'> 	F2FS_OPTION(sbi).s_resgid = make_kgid(&amp;init_user_ns, F2FS_DEF_RESGID);</div><div class='del'>-	F2FS_OPTION(sbi).compress_algorithm = COMPRESS_LZ4;</div><div class='del'>-	F2FS_OPTION(sbi).compress_log_size = MIN_COMPRESS_LOG_SIZE;</div><div class='del'>-	F2FS_OPTION(sbi).compress_ext_cnt = 0;</div><div class='del'>-	F2FS_OPTION(sbi).compress_mode = COMPR_MODE_FS;</div><div class='add'>+	if (f2fs_sb_has_compression(sbi)) {</div><div class='add'>+		F2FS_OPTION(sbi).compress_algorithm = COMPRESS_LZ4;</div><div class='add'>+		F2FS_OPTION(sbi).compress_log_size = MIN_COMPRESS_LOG_SIZE;</div><div class='add'>+		F2FS_OPTION(sbi).compress_ext_cnt = 0;</div><div class='add'>+		F2FS_OPTION(sbi).compress_mode = COMPR_MODE_FS;</div><div class='add'>+	}</div><div class='ctx'> 	F2FS_OPTION(sbi).bggc_mode = BGGC_MODE_ON;</div><div class='del'>-</div><div class='del'>-	sbi-&gt;sb-&gt;s_flags &amp;= ~SB_INLINECRYPT;</div><div class='add'>+	F2FS_OPTION(sbi).memory_mode = MEMORY_MODE_NORMAL;</div><div class='add'>+	F2FS_OPTION(sbi).errors = MOUNT_ERRORS_CONTINUE;</div><div class='ctx'> </div><div class='ctx'> 	set_opt(sbi, INLINE_XATTR);</div><div class='ctx'> 	set_opt(sbi, INLINE_DATA);</div><div class='ctx'> 	set_opt(sbi, INLINE_DENTRY);</div><div class='del'>-	set_opt(sbi, EXTENT_CACHE);</div><div class='del'>-	set_opt(sbi, NOHEAP);</div><div class='del'>-	clear_opt(sbi, DISABLE_CHECKPOINT);</div><div class='ctx'> 	set_opt(sbi, MERGE_CHECKPOINT);</div><div class='add'>+	set_opt(sbi, LAZYTIME);</div><div class='ctx'> 	F2FS_OPTION(sbi).unusable_cap = 0;</div><div class='del'>-	sbi-&gt;sb-&gt;s_flags |= SB_LAZYTIME;</div><div class='del'>-	set_opt(sbi, FLUSH_MERGE);</div><div class='del'>-	if (f2fs_hw_support_discard(sbi) || f2fs_hw_should_discard(sbi))</div><div class='del'>-		set_opt(sbi, DISCARD);</div><div class='del'>-	if (f2fs_sb_has_blkzoned(sbi)) {</div><div class='add'>+	if (!f2fs_is_readonly(sbi))</div><div class='add'>+		set_opt(sbi, FLUSH_MERGE);</div><div class='add'>+	if (f2fs_sb_has_blkzoned(sbi))</div><div class='ctx'> 		F2FS_OPTION(sbi).fs_mode = FS_MODE_LFS;</div><div class='del'>-		F2FS_OPTION(sbi).discard_unit = DISCARD_UNIT_SECTION;</div><div class='del'>-	} else {</div><div class='add'>+	else</div><div class='ctx'> 		F2FS_OPTION(sbi).fs_mode = FS_MODE_ADAPTIVE;</div><div class='del'>-		F2FS_OPTION(sbi).discard_unit = DISCARD_UNIT_BLOCK;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_F2FS_FS_XATTR</div><div class='ctx'> 	set_opt(sbi, XATTR_USER);</div><div class='hunk'>@@ -2030,7 +2546,9 @@ static void default_options(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	set_opt(sbi, POSIX_ACL);</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-	f2fs_build_fault_attr(sbi, 0, 0);</div><div class='add'>+	f2fs_build_fault_attr(sbi, 0, 0, FAULT_ALL);</div><div class='add'>+</div><div class='add'>+	F2FS_OPTION(sbi).lookup_mode = LOOKUP_PERF;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='hunk'>@@ -2041,6 +2559,7 @@ static int f2fs_disable_checkpoint(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int s_flags = sbi-&gt;sb-&gt;s_flags;</div><div class='ctx'> 	struct cp_control cpc;</div><div class='add'>+	unsigned int gc_mode = sbi-&gt;gc_mode;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	block_t unusable;</div><div class='hunk'>@@ -2051,11 +2570,27 @@ static int f2fs_disable_checkpoint(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	}</div><div class='ctx'> 	sbi-&gt;sb-&gt;s_flags |= SB_ACTIVE;</div><div class='ctx'> </div><div class='add'>+	/* check if we need more GC first */</div><div class='add'>+	unusable = f2fs_get_unusable_blocks(sbi);</div><div class='add'>+	if (!f2fs_disable_cp_again(sbi, unusable))</div><div class='add'>+		goto skip_gc;</div><div class='add'>+</div><div class='ctx'> 	f2fs_update_time(sbi, DISABLE_TIME);</div><div class='ctx'> </div><div class='add'>+	sbi-&gt;gc_mode = GC_URGENT_HIGH;</div><div class='add'>+</div><div class='ctx'> 	while (!f2fs_time_over(sbi, DISABLE_TIME)) {</div><div class='del'>-		down_write(&amp;sbi-&gt;gc_lock);</div><div class='del'>-		err = f2fs_gc(sbi, true, false, false, NULL_SEGNO);</div><div class='add'>+		struct f2fs_gc_control gc_control = {</div><div class='add'>+			.victim_segno = NULL_SEGNO,</div><div class='add'>+			.init_gc_type = FG_GC,</div><div class='add'>+			.should_migrate_blocks = false,</div><div class='add'>+			.err_gc_skipped = true,</div><div class='add'>+			.no_bg_gc = true,</div><div class='add'>+			.nr_free_secs = 1 };</div><div class='add'>+</div><div class='add'>+		f2fs_down_write(&amp;sbi-&gt;gc_lock);</div><div class='add'>+		stat_inc_gc_call_count(sbi, FOREGROUND);</div><div class='add'>+		err = f2fs_gc(sbi, &amp;gc_control);</div><div class='ctx'> 		if (err == -ENODATA) {</div><div class='ctx'> 			err = 0;</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -2076,9 +2611,11 @@ static int f2fs_disable_checkpoint(struct f2fs_sb_info *sbi)</div><div class='ctx'> 		goto restore_flag;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;sbi-&gt;gc_lock);</div><div class='add'>+skip_gc:</div><div class='add'>+	f2fs_down_write(&amp;sbi-&gt;gc_lock);</div><div class='ctx'> 	cpc.reason = CP_PAUSE;</div><div class='ctx'> 	set_sbi_flag(sbi, SBI_CP_DISABLED);</div><div class='add'>+	stat_inc_cp_call_count(sbi, TOTAL_CALL);</div><div class='ctx'> 	err = f2fs_write_checkpoint(sbi, &amp;cpc);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out_unlock;</div><div class='hunk'>@@ -2088,54 +2625,107 @@ static int f2fs_disable_checkpoint(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	spin_unlock(&amp;sbi-&gt;stat_lock);</div><div class='ctx'> </div><div class='ctx'> out_unlock:</div><div class='del'>-	up_write(&amp;sbi-&gt;gc_lock);</div><div class='add'>+	f2fs_up_write(&amp;sbi-&gt;gc_lock);</div><div class='ctx'> restore_flag:</div><div class='add'>+	sbi-&gt;gc_mode = gc_mode;</div><div class='ctx'> 	sbi-&gt;sb-&gt;s_flags = s_flags;	/* Restore SB_RDONLY status */</div><div class='add'>+	f2fs_info(sbi, "f2fs_disable_checkpoint() finish, err:%d", err);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void f2fs_enable_checkpoint(struct f2fs_sb_info *sbi)</div><div class='add'>+static int f2fs_enable_checkpoint(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='del'>-	int retry = DEFAULT_RETRY_IO_COUNT;</div><div class='add'>+	unsigned int nr_pages = get_pages(sbi, F2FS_DIRTY_DATA) / 16;</div><div class='add'>+	long long start, writeback, lock, sync_inode, end;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	f2fs_info(sbi, "%s start, meta: %lld, node: %lld, data: %lld",</div><div class='add'>+					__func__,</div><div class='add'>+					get_pages(sbi, F2FS_DIRTY_META),</div><div class='add'>+					get_pages(sbi, F2FS_DIRTY_NODES),</div><div class='add'>+					get_pages(sbi, F2FS_DIRTY_DATA));</div><div class='add'>+</div><div class='add'>+	f2fs_update_time(sbi, ENABLE_TIME);</div><div class='add'>+</div><div class='add'>+	start = ktime_get();</div><div class='ctx'> </div><div class='ctx'> 	/* we should flush all the data to keep data consistency */</div><div class='del'>-	do {</div><div class='add'>+	while (get_pages(sbi, F2FS_DIRTY_DATA)) {</div><div class='add'>+		writeback_inodes_sb_nr(sbi-&gt;sb, nr_pages, WB_REASON_SYNC);</div><div class='add'>+		f2fs_io_schedule_timeout(DEFAULT_SCHEDULE_TIMEOUT);</div><div class='add'>+</div><div class='add'>+		if (f2fs_time_over(sbi, ENABLE_TIME))</div><div class='add'>+			break;</div><div class='add'>+	}</div><div class='add'>+	writeback = ktime_get();</div><div class='add'>+</div><div class='add'>+	f2fs_down_write(&amp;sbi-&gt;cp_enable_rwsem);</div><div class='add'>+</div><div class='add'>+	lock = ktime_get();</div><div class='add'>+</div><div class='add'>+	if (get_pages(sbi, F2FS_DIRTY_DATA))</div><div class='ctx'> 		sync_inodes_sb(sbi-&gt;sb);</div><div class='del'>-		cond_resched();</div><div class='del'>-		congestion_wait(BLK_RW_ASYNC, DEFAULT_IO_TIMEOUT);</div><div class='del'>-	} while (get_pages(sbi, F2FS_DIRTY_DATA) &amp;&amp; retry--);</div><div class='ctx'> </div><div class='del'>-	if (unlikely(retry &lt; 0))</div><div class='del'>-		f2fs_warn(sbi, "checkpoint=enable has some unwritten data.");</div><div class='add'>+	if (unlikely(get_pages(sbi, F2FS_DIRTY_DATA)))</div><div class='add'>+		f2fs_warn(sbi, "%s: has some unwritten data: %lld",</div><div class='add'>+			__func__, get_pages(sbi, F2FS_DIRTY_DATA));</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;sbi-&gt;gc_lock);</div><div class='add'>+	sync_inode = ktime_get();</div><div class='add'>+</div><div class='add'>+	f2fs_down_write(&amp;sbi-&gt;gc_lock);</div><div class='ctx'> 	f2fs_dirty_to_prefree(sbi);</div><div class='ctx'> </div><div class='ctx'> 	clear_sbi_flag(sbi, SBI_CP_DISABLED);</div><div class='ctx'> 	set_sbi_flag(sbi, SBI_IS_DIRTY);</div><div class='del'>-	up_write(&amp;sbi-&gt;gc_lock);</div><div class='add'>+	f2fs_up_write(&amp;sbi-&gt;gc_lock);</div><div class='add'>+</div><div class='add'>+	f2fs_info(sbi, "%s sync_fs, meta: %lld, imeta: %lld, node: %lld, dents: %lld, qdata: %lld",</div><div class='add'>+					__func__,</div><div class='add'>+					get_pages(sbi, F2FS_DIRTY_META),</div><div class='add'>+					get_pages(sbi, F2FS_DIRTY_IMETA),</div><div class='add'>+					get_pages(sbi, F2FS_DIRTY_NODES),</div><div class='add'>+					get_pages(sbi, F2FS_DIRTY_DENTS),</div><div class='add'>+					get_pages(sbi, F2FS_DIRTY_QDATA));</div><div class='add'>+	ret = f2fs_sync_fs(sbi-&gt;sb, 1);</div><div class='add'>+	if (ret)</div><div class='add'>+		f2fs_err(sbi, "%s sync_fs failed, ret: %d", __func__, ret);</div><div class='ctx'> </div><div class='del'>-	f2fs_sync_fs(sbi-&gt;sb, 1);</div><div class='add'>+	/* Let's ensure there's no pending checkpoint anymore */</div><div class='add'>+	f2fs_flush_ckpt_thread(sbi);</div><div class='add'>+</div><div class='add'>+	f2fs_up_write(&amp;sbi-&gt;cp_enable_rwsem);</div><div class='add'>+</div><div class='add'>+	end = ktime_get();</div><div class='add'>+</div><div class='add'>+	f2fs_info(sbi, "%s end, writeback:%llu, "</div><div class='add'>+				"lock:%llu, sync_inode:%llu, sync_fs:%llu",</div><div class='add'>+				__func__,</div><div class='add'>+				ktime_ms_delta(writeback, start),</div><div class='add'>+				ktime_ms_delta(lock, writeback),</div><div class='add'>+				ktime_ms_delta(sync_inode, lock),</div><div class='add'>+				ktime_ms_delta(end, sync_inode));</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_remount(struct super_block *sb, int *flags, char *data)</div><div class='add'>+static int __f2fs_remount(struct fs_context *fc, struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_SB(sb);</div><div class='ctx'> 	struct f2fs_mount_info org_mount_opt;</div><div class='ctx'> 	unsigned long old_sb_flags;</div><div class='add'>+	unsigned int flags = fc-&gt;sb_flags;</div><div class='ctx'> 	int err;</div><div class='ctx'> 	bool need_restart_gc = false, need_stop_gc = false;</div><div class='del'>-	bool need_restart_ckpt = false, need_stop_ckpt = false;</div><div class='ctx'> 	bool need_restart_flush = false, need_stop_flush = false;</div><div class='ctx'> 	bool need_restart_discard = false, need_stop_discard = false;</div><div class='del'>-	bool no_extent_cache = !test_opt(sbi, EXTENT_CACHE);</div><div class='add'>+	bool need_enable_checkpoint = false, need_disable_checkpoint = false;</div><div class='add'>+	bool no_read_extent_cache = !test_opt(sbi, READ_EXTENT_CACHE);</div><div class='add'>+	bool no_age_extent_cache = !test_opt(sbi, AGE_EXTENT_CACHE);</div><div class='ctx'> 	bool enable_checkpoint = !test_opt(sbi, DISABLE_CHECKPOINT);</div><div class='del'>-	bool no_io_align = !F2FS_IO_ALIGNED(sbi);</div><div class='ctx'> 	bool no_atgc = !test_opt(sbi, ATGC);</div><div class='ctx'> 	bool no_discard = !test_opt(sbi, DISCARD);</div><div class='ctx'> 	bool no_compress_cache = !test_opt(sbi, COMPRESS_CACHE);</div><div class='ctx'> 	bool block_unit_discard = f2fs_block_unit_discard(sbi);</div><div class='del'>-	struct discard_cmd_control *dcc;</div><div class='add'>+	bool no_nat_bits = !test_opt(sbi, NAT_BITS);</div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='ctx'> 	int i, j;</div><div class='ctx'> #endif</div><div class='hunk'>@@ -2147,6 +2737,8 @@ static int f2fs_remount(struct super_block *sb, int *flags, char *data)</div><div class='ctx'> 	org_mount_opt = sbi-&gt;mount_opt;</div><div class='ctx'> 	old_sb_flags = sb-&gt;s_flags;</div><div class='ctx'> </div><div class='add'>+	sbi-&gt;umount_lock_holder = current;</div><div class='add'>+</div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='ctx'> 	org_mount_opt.s_jquota_fmt = F2FS_OPTION(sbi).s_jquota_fmt;</div><div class='ctx'> 	for (i = 0; i &lt; MAXQUOTAS; i++) {</div><div class='hunk'>@@ -2166,7 +2758,7 @@ static int f2fs_remount(struct super_block *sb, int *flags, char *data)</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> 	/* recover superblocks we couldn't write due to previous RO mount */</div><div class='del'>-	if (!(*flags &amp; SB_RDONLY) &amp;&amp; is_sbi_flag_set(sbi, SBI_NEED_SB_WRITE)) {</div><div class='add'>+	if (!(flags &amp; SB_RDONLY) &amp;&amp; is_sbi_flag_set(sbi, SBI_NEED_SB_WRITE)) {</div><div class='ctx'> 		err = f2fs_commit_super(sbi, false);</div><div class='ctx'> 		f2fs_info(sbi, "Try to recover all the superblocks, ret: %d",</div><div class='ctx'> 			  err);</div><div class='hunk'>@@ -2174,31 +2766,39 @@ static int f2fs_remount(struct super_block *sb, int *flags, char *data)</div><div class='ctx'> 			clear_sbi_flag(sbi, SBI_NEED_SB_WRITE);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	default_options(sbi);</div><div class='add'>+	default_options(sbi, true);</div><div class='add'>+</div><div class='add'>+	err = f2fs_check_opt_consistency(fc, sb);</div><div class='add'>+	if (err)</div><div class='add'>+		goto restore_opts;</div><div class='add'>+</div><div class='add'>+	f2fs_apply_options(fc, sb);</div><div class='ctx'> </div><div class='del'>-	/* parse mount options */</div><div class='del'>-	err = parse_options(sb, data, true);</div><div class='add'>+	err = f2fs_sanity_check_options(sbi, true);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto restore_opts;</div><div class='ctx'> </div><div class='add'>+	/* flush outstanding errors before changing fs state */</div><div class='add'>+	flush_work(&amp;sbi-&gt;s_error_work);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Previous and new state of filesystem is RO,</div><div class='ctx'> 	 * so skip checking GC and FLUSH_MERGE conditions.</div><div class='ctx'> 	 */</div><div class='del'>-	if (f2fs_readonly(sb) &amp;&amp; (*flags &amp; SB_RDONLY))</div><div class='add'>+	if (f2fs_readonly(sb) &amp;&amp; (flags &amp; SB_RDONLY))</div><div class='ctx'> 		goto skip;</div><div class='ctx'> </div><div class='del'>-	if (f2fs_sb_has_readonly(sbi) &amp;&amp; !(*flags &amp; SB_RDONLY)) {</div><div class='add'>+	if (f2fs_dev_is_readonly(sbi) &amp;&amp; !(flags &amp; SB_RDONLY)) {</div><div class='ctx'> 		err = -EROFS;</div><div class='ctx'> 		goto restore_opts;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='del'>-	if (!f2fs_readonly(sb) &amp;&amp; (*flags &amp; SB_RDONLY)) {</div><div class='add'>+	if (!f2fs_readonly(sb) &amp;&amp; (flags &amp; SB_RDONLY)) {</div><div class='ctx'> 		err = dquot_suspend(sb, -1);</div><div class='ctx'> 		if (err &lt; 0)</div><div class='ctx'> 			goto restore_opts;</div><div class='del'>-	} else if (f2fs_readonly(sb) &amp;&amp; !(*flags &amp; SB_RDONLY)) {</div><div class='add'>+	} else if (f2fs_readonly(sb) &amp;&amp; !(flags &amp; SB_RDONLY)) {</div><div class='ctx'> 		/* dquot_resume needs RW */</div><div class='ctx'> 		sb-&gt;s_flags &amp;= ~SB_RDONLY;</div><div class='ctx'> 		if (sb_any_quota_suspended(sb)) {</div><div class='hunk'>@@ -2218,15 +2818,15 @@ static int f2fs_remount(struct super_block *sb, int *flags, char *data)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* disallow enable/disable extent_cache dynamically */</div><div class='del'>-	if (no_extent_cache == !!test_opt(sbi, EXTENT_CACHE)) {</div><div class='add'>+	if (no_read_extent_cache == !!test_opt(sbi, READ_EXTENT_CACHE)) {</div><div class='ctx'> 		err = -EINVAL;</div><div class='ctx'> 		f2fs_warn(sbi, "switch extent_cache option is not allowed");</div><div class='ctx'> 		goto restore_opts;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	if (no_io_align == !!F2FS_IO_ALIGNED(sbi)) {</div><div class='add'>+	/* disallow enable/disable age extent_cache dynamically */</div><div class='add'>+	if (no_age_extent_cache == !!test_opt(sbi, AGE_EXTENT_CACHE)) {</div><div class='ctx'> 		err = -EINVAL;</div><div class='del'>-		f2fs_warn(sbi, "switch io_bits option is not allowed");</div><div class='add'>+		f2fs_warn(sbi, "switch age_extent_cache option is not allowed");</div><div class='ctx'> 		goto restore_opts;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -2242,7 +2842,13 @@ static int f2fs_remount(struct super_block *sb, int *flags, char *data)</div><div class='ctx'> 		goto restore_opts;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if ((*flags &amp; SB_RDONLY) &amp;&amp; test_opt(sbi, DISABLE_CHECKPOINT)) {</div><div class='add'>+	if (no_nat_bits == !!test_opt(sbi, NAT_BITS)) {</div><div class='add'>+		err = -EINVAL;</div><div class='add'>+		f2fs_warn(sbi, "switch nat_bits option is not allowed");</div><div class='add'>+		goto restore_opts;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if ((flags &amp; SB_RDONLY) &amp;&amp; test_opt(sbi, DISABLE_CHECKPOINT)) {</div><div class='ctx'> 		err = -EINVAL;</div><div class='ctx'> 		f2fs_warn(sbi, "disabling checkpoint not compatible with read-only");</div><div class='ctx'> 		goto restore_opts;</div><div class='hunk'>@@ -2253,7 +2859,7 @@ static int f2fs_remount(struct super_block *sb, int *flags, char *data)</div><div class='ctx'> 	 * or if background_gc = off is passed in mount</div><div class='ctx'> 	 * option. Also sync the filesystem.</div><div class='ctx'> 	 */</div><div class='del'>-	if ((*flags &amp; SB_RDONLY) ||</div><div class='add'>+	if ((flags &amp; SB_RDONLY) ||</div><div class='ctx'> 			(F2FS_OPTION(sbi).bggc_mode == BGGC_MODE_OFF &amp;&amp;</div><div class='ctx'> 			!test_opt(sbi, GC_MERGE))) {</div><div class='ctx'> 		if (sbi-&gt;gc_thread) {</div><div class='hunk'>@@ -2267,8 +2873,7 @@ static int f2fs_remount(struct super_block *sb, int *flags, char *data)</div><div class='ctx'> 		need_stop_gc = true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (*flags &amp; SB_RDONLY ||</div><div class='del'>-		F2FS_OPTION(sbi).whint_mode != org_mount_opt.whint_mode) {</div><div class='add'>+	if (flags &amp; SB_RDONLY) {</div><div class='ctx'> 		sync_inodes_sb(sb);</div><div class='ctx'> </div><div class='ctx'> 		set_sbi_flag(sbi, SBI_IS_DIRTY);</div><div class='hunk'>@@ -2277,33 +2882,18 @@ static int f2fs_remount(struct super_block *sb, int *flags, char *data)</div><div class='ctx'> 		clear_sbi_flag(sbi, SBI_IS_CLOSE);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if ((*flags &amp; SB_RDONLY) || test_opt(sbi, DISABLE_CHECKPOINT) ||</div><div class='del'>-			!test_opt(sbi, MERGE_CHECKPOINT)) {</div><div class='del'>-		f2fs_stop_ckpt_thread(sbi);</div><div class='del'>-		need_restart_ckpt = true;</div><div class='del'>-	} else {</div><div class='del'>-		err = f2fs_start_ckpt_thread(sbi);</div><div class='del'>-		if (err) {</div><div class='del'>-			f2fs_err(sbi,</div><div class='del'>-			    "Failed to start F2FS issue_checkpoint_thread (%d)",</div><div class='del'>-			    err);</div><div class='del'>-			goto restore_gc;</div><div class='del'>-		}</div><div class='del'>-		need_stop_ckpt = true;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We stop issue flush thread if FS is mounted as RO</div><div class='ctx'> 	 * or if flush_merge is not passed in mount option.</div><div class='ctx'> 	 */</div><div class='del'>-	if ((*flags &amp; SB_RDONLY) || !test_opt(sbi, FLUSH_MERGE)) {</div><div class='add'>+	if ((flags &amp; SB_RDONLY) || !test_opt(sbi, FLUSH_MERGE)) {</div><div class='ctx'> 		clear_opt(sbi, FLUSH_MERGE);</div><div class='ctx'> 		f2fs_destroy_flush_cmd_control(sbi, false);</div><div class='ctx'> 		need_restart_flush = true;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		err = f2fs_create_flush_cmd_control(sbi);</div><div class='ctx'> 		if (err)</div><div class='del'>-			goto restore_ckpt;</div><div class='add'>+			goto restore_gc;</div><div class='ctx'> 		need_stop_flush = true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -2314,21 +2904,45 @@ static int f2fs_remount(struct super_block *sb, int *flags, char *data)</div><div class='ctx'> 				goto restore_flush;</div><div class='ctx'> 			need_stop_discard = true;</div><div class='ctx'> 		} else {</div><div class='del'>-			dcc = SM_I(sbi)-&gt;dcc_info;</div><div class='ctx'> 			f2fs_stop_discard_thread(sbi);</div><div class='del'>-			if (atomic_read(&amp;dcc-&gt;discard_cmd_cnt))</div><div class='del'>-				f2fs_issue_discard_timeout(sbi);</div><div class='add'>+			f2fs_issue_discard_timeout(sbi);</div><div class='ctx'> 			need_restart_discard = true;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	adjust_unusable_cap_perc(sbi);</div><div class='ctx'> 	if (enable_checkpoint == !!test_opt(sbi, DISABLE_CHECKPOINT)) {</div><div class='ctx'> 		if (test_opt(sbi, DISABLE_CHECKPOINT)) {</div><div class='ctx'> 			err = f2fs_disable_checkpoint(sbi);</div><div class='ctx'> 			if (err)</div><div class='ctx'> 				goto restore_discard;</div><div class='add'>+			need_enable_checkpoint = true;</div><div class='ctx'> 		} else {</div><div class='del'>-			f2fs_enable_checkpoint(sbi);</div><div class='add'>+			err = f2fs_enable_checkpoint(sbi);</div><div class='add'>+			if (err)</div><div class='add'>+				goto restore_discard;</div><div class='add'>+			need_disable_checkpoint = true;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Place this routine at the end, since a new checkpoint would be</div><div class='add'>+	 * triggered while remount and we need to take care of it before</div><div class='add'>+	 * returning from remount.</div><div class='add'>+	 */</div><div class='add'>+	if ((flags &amp; SB_RDONLY) || test_opt(sbi, DISABLE_CHECKPOINT) ||</div><div class='add'>+			!test_opt(sbi, MERGE_CHECKPOINT)) {</div><div class='add'>+		f2fs_stop_ckpt_thread(sbi);</div><div class='add'>+	} else {</div><div class='add'>+		/* Flush if the previous checkpoint, if exists. */</div><div class='add'>+		f2fs_flush_ckpt_thread(sbi);</div><div class='add'>+</div><div class='add'>+		err = f2fs_start_ckpt_thread(sbi);</div><div class='add'>+		if (err) {</div><div class='add'>+			f2fs_err(sbi,</div><div class='add'>+			    "Failed to start F2FS issue_checkpoint_thread (%d)",</div><div class='add'>+			    err);</div><div class='add'>+			goto restore_checkpoint;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -2343,9 +2957,18 @@ skip:</div><div class='ctx'> 		(test_opt(sbi, POSIX_ACL) ? SB_POSIXACL : 0);</div><div class='ctx'> </div><div class='ctx'> 	limit_reserve_root(sbi);</div><div class='del'>-	adjust_unusable_cap_perc(sbi);</div><div class='del'>-	*flags = (*flags &amp; ~SB_LAZYTIME) | (sb-&gt;s_flags &amp; SB_LAZYTIME);</div><div class='add'>+	fc-&gt;sb_flags = (flags &amp; ~SB_LAZYTIME) | (sb-&gt;s_flags &amp; SB_LAZYTIME);</div><div class='add'>+</div><div class='add'>+	sbi-&gt;umount_lock_holder = NULL;</div><div class='ctx'> 	return 0;</div><div class='add'>+restore_checkpoint:</div><div class='add'>+	if (need_enable_checkpoint) {</div><div class='add'>+		if (f2fs_enable_checkpoint(sbi))</div><div class='add'>+			f2fs_warn(sbi, "checkpoint has not been enabled");</div><div class='add'>+	} else if (need_disable_checkpoint) {</div><div class='add'>+		if (f2fs_disable_checkpoint(sbi))</div><div class='add'>+			f2fs_warn(sbi, "checkpoint has not been disabled");</div><div class='add'>+	}</div><div class='ctx'> restore_discard:</div><div class='ctx'> 	if (need_restart_discard) {</div><div class='ctx'> 		if (f2fs_start_discard_thread(sbi))</div><div class='hunk'>@@ -2361,13 +2984,6 @@ restore_flush:</div><div class='ctx'> 		clear_opt(sbi, FLUSH_MERGE);</div><div class='ctx'> 		f2fs_destroy_flush_cmd_control(sbi, false);</div><div class='ctx'> 	}</div><div class='del'>-restore_ckpt:</div><div class='del'>-	if (need_restart_ckpt) {</div><div class='del'>-		if (f2fs_start_ckpt_thread(sbi))</div><div class='del'>-			f2fs_warn(sbi, "background ckpt thread has stopped");</div><div class='del'>-	} else if (need_stop_ckpt) {</div><div class='del'>-		f2fs_stop_ckpt_thread(sbi);</div><div class='del'>-	}</div><div class='ctx'> restore_gc:</div><div class='ctx'> 	if (need_restart_gc) {</div><div class='ctx'> 		if (f2fs_start_gc_thread(sbi))</div><div class='hunk'>@@ -2385,23 +3001,74 @@ restore_opts:</div><div class='ctx'> #endif</div><div class='ctx'> 	sbi-&gt;mount_opt = org_mount_opt;</div><div class='ctx'> 	sb-&gt;s_flags = old_sb_flags;</div><div class='add'>+</div><div class='add'>+	sbi-&gt;umount_lock_holder = NULL;</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void f2fs_shutdown(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	f2fs_do_shutdown(F2FS_SB(sb), F2FS_GOING_DOWN_NOSYNC, false, false);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='add'>+static bool f2fs_need_recovery(struct f2fs_sb_info *sbi)</div><div class='add'>+{</div><div class='add'>+	/* need to recovery orphan */</div><div class='add'>+	if (is_set_ckpt_flags(sbi, CP_ORPHAN_PRESENT_FLAG))</div><div class='add'>+		return true;</div><div class='add'>+	/* need to recovery data */</div><div class='add'>+	if (test_opt(sbi, DISABLE_ROLL_FORWARD))</div><div class='add'>+		return false;</div><div class='add'>+	if (test_opt(sbi, NORECOVERY))</div><div class='add'>+		return false;</div><div class='add'>+	return !is_set_ckpt_flags(sbi, CP_UMOUNT_FLAG);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool f2fs_recover_quota_begin(struct f2fs_sb_info *sbi)</div><div class='add'>+{</div><div class='add'>+	bool readonly = f2fs_readonly(sbi-&gt;sb);</div><div class='add'>+</div><div class='add'>+	if (!f2fs_need_recovery(sbi))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/* it doesn't need to check f2fs_sb_has_readonly() */</div><div class='add'>+	if (f2fs_hw_is_readonly(sbi))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	if (readonly) {</div><div class='add'>+		sbi-&gt;sb-&gt;s_flags &amp;= ~SB_RDONLY;</div><div class='add'>+		set_sbi_flag(sbi, SBI_IS_WRITABLE);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Turn on quotas which were not enabled for read-only mounts if</div><div class='add'>+	 * filesystem has quota feature, so that they are updated correctly.</div><div class='add'>+	 */</div><div class='add'>+	return f2fs_enable_quota_files(sbi, readonly);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void f2fs_recover_quota_end(struct f2fs_sb_info *sbi,</div><div class='add'>+						bool quota_enabled)</div><div class='add'>+{</div><div class='add'>+	if (quota_enabled)</div><div class='add'>+		f2fs_quota_off_umount(sbi-&gt;sb);</div><div class='add'>+</div><div class='add'>+	if (is_sbi_flag_set(sbi, SBI_IS_WRITABLE)) {</div><div class='add'>+		clear_sbi_flag(sbi, SBI_IS_WRITABLE);</div><div class='add'>+		sbi-&gt;sb-&gt;s_flags |= SB_RDONLY;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /* Read data from quotafile */</div><div class='ctx'> static ssize_t f2fs_quota_read(struct super_block *sb, int type, char *data,</div><div class='ctx'> 			       size_t len, loff_t off)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = sb_dqopt(sb)-&gt;files[type];</div><div class='ctx'> 	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='del'>-	block_t blkidx = F2FS_BYTES_TO_BLK(off);</div><div class='del'>-	int offset = off &amp; (sb-&gt;s_blocksize - 1);</div><div class='ctx'> 	int tocopy;</div><div class='ctx'> 	size_t toread;</div><div class='ctx'> 	loff_t i_size = i_size_read(inode);</div><div class='del'>-	struct page *page;</div><div class='del'>-	char *kaddr;</div><div class='ctx'> </div><div class='ctx'> 	if (off &gt; i_size)</div><div class='ctx'> 		return 0;</div><div class='hunk'>@@ -2410,40 +3077,42 @@ static ssize_t f2fs_quota_read(struct super_block *sb, int type, char *data,</div><div class='ctx'> 		len = i_size - off;</div><div class='ctx'> 	toread = len;</div><div class='ctx'> 	while (toread &gt; 0) {</div><div class='del'>-		tocopy = min_t(unsigned long, sb-&gt;s_blocksize - offset, toread);</div><div class='add'>+		struct folio *folio;</div><div class='add'>+		size_t offset;</div><div class='add'>+</div><div class='ctx'> repeat:</div><div class='del'>-		page = read_cache_page_gfp(mapping, blkidx, GFP_NOFS);</div><div class='del'>-		if (IS_ERR(page)) {</div><div class='del'>-			if (PTR_ERR(page) == -ENOMEM) {</div><div class='del'>-				congestion_wait(BLK_RW_ASYNC,</div><div class='del'>-						DEFAULT_IO_TIMEOUT);</div><div class='add'>+		folio = mapping_read_folio_gfp(mapping, off &gt;&gt; PAGE_SHIFT,</div><div class='add'>+				GFP_NOFS);</div><div class='add'>+		if (IS_ERR(folio)) {</div><div class='add'>+			if (PTR_ERR(folio) == -ENOMEM) {</div><div class='add'>+				memalloc_retry_wait(GFP_NOFS);</div><div class='ctx'> 				goto repeat;</div><div class='ctx'> 			}</div><div class='ctx'> 			set_sbi_flag(F2FS_SB(sb), SBI_QUOTA_NEED_REPAIR);</div><div class='del'>-			return PTR_ERR(page);</div><div class='add'>+			return PTR_ERR(folio);</div><div class='ctx'> 		}</div><div class='add'>+		offset = offset_in_folio(folio, off);</div><div class='add'>+		tocopy = min(folio_size(folio) - offset, toread);</div><div class='ctx'> </div><div class='del'>-		lock_page(page);</div><div class='add'>+		folio_lock(folio);</div><div class='ctx'> </div><div class='del'>-		if (unlikely(page-&gt;mapping != mapping)) {</div><div class='del'>-			f2fs_put_page(page, 1);</div><div class='add'>+		if (unlikely(folio-&gt;mapping != mapping)) {</div><div class='add'>+			f2fs_folio_put(folio, true);</div><div class='ctx'> 			goto repeat;</div><div class='ctx'> 		}</div><div class='del'>-		if (unlikely(!PageUptodate(page))) {</div><div class='del'>-			f2fs_put_page(page, 1);</div><div class='del'>-			set_sbi_flag(F2FS_SB(sb), SBI_QUOTA_NEED_REPAIR);</div><div class='del'>-			return -EIO;</div><div class='del'>-		}</div><div class='ctx'> </div><div class='del'>-		kaddr = kmap_atomic(page);</div><div class='del'>-		memcpy(data, kaddr + offset, tocopy);</div><div class='del'>-		kunmap_atomic(kaddr);</div><div class='del'>-		f2fs_put_page(page, 1);</div><div class='add'>+		/*</div><div class='add'>+		 * should never happen, just leave f2fs_bug_on() here to catch</div><div class='add'>+		 * any potential bug.</div><div class='add'>+		 */</div><div class='add'>+		f2fs_bug_on(F2FS_SB(sb), !folio_test_uptodate(folio));</div><div class='add'>+</div><div class='add'>+		memcpy_from_folio(data, folio, offset, tocopy);</div><div class='add'>+		f2fs_folio_put(folio, true);</div><div class='ctx'> </div><div class='del'>-		offset = 0;</div><div class='ctx'> 		toread -= tocopy;</div><div class='ctx'> 		data += tocopy;</div><div class='del'>-		blkidx++;</div><div class='add'>+		off += tocopy;</div><div class='ctx'> 	}</div><div class='ctx'> 	return len;</div><div class='ctx'> }</div><div class='hunk'>@@ -2457,9 +3126,8 @@ static ssize_t f2fs_quota_write(struct super_block *sb, int type,</div><div class='ctx'> 	const struct address_space_operations *a_ops = mapping-&gt;a_ops;</div><div class='ctx'> 	int offset = off &amp; (sb-&gt;s_blocksize - 1);</div><div class='ctx'> 	size_t towrite = len;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	void *fsdata = NULL;</div><div class='del'>-	char *kaddr;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> 	int tocopy;</div><div class='ctx'> </div><div class='hunk'>@@ -2467,25 +3135,21 @@ static ssize_t f2fs_quota_write(struct super_block *sb, int type,</div><div class='ctx'> 		tocopy = min_t(unsigned long, sb-&gt;s_blocksize - offset,</div><div class='ctx'> 								towrite);</div><div class='ctx'> retry:</div><div class='del'>-		err = a_ops-&gt;write_begin(NULL, mapping, off, tocopy, 0,</div><div class='del'>-							&amp;page, &amp;fsdata);</div><div class='add'>+		err = a_ops-&gt;write_begin(NULL, mapping, off, tocopy,</div><div class='add'>+							&amp;folio, &amp;fsdata);</div><div class='ctx'> 		if (unlikely(err)) {</div><div class='ctx'> 			if (err == -ENOMEM) {</div><div class='del'>-				congestion_wait(BLK_RW_ASYNC,</div><div class='del'>-						DEFAULT_IO_TIMEOUT);</div><div class='add'>+				memalloc_retry_wait(GFP_NOFS);</div><div class='ctx'> 				goto retry;</div><div class='ctx'> 			}</div><div class='ctx'> 			set_sbi_flag(F2FS_SB(sb), SBI_QUOTA_NEED_REPAIR);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		kaddr = kmap_atomic(page);</div><div class='del'>-		memcpy(kaddr + offset, data, tocopy);</div><div class='del'>-		kunmap_atomic(kaddr);</div><div class='del'>-		flush_dcache_page(page);</div><div class='add'>+		memcpy_to_folio(folio, offset_in_folio(folio, off), data, tocopy);</div><div class='ctx'> </div><div class='ctx'> 		a_ops-&gt;write_end(NULL, mapping, off, tocopy, tocopy,</div><div class='del'>-						page, fsdata);</div><div class='add'>+						folio, fsdata);</div><div class='ctx'> 		offset = 0;</div><div class='ctx'> 		towrite -= tocopy;</div><div class='ctx'> 		off += tocopy;</div><div class='hunk'>@@ -2495,22 +3159,20 @@ retry:</div><div class='ctx'> </div><div class='ctx'> 	if (len == towrite)</div><div class='ctx'> 		return err;</div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_mtime_to_ts(inode, inode_set_ctime_current(inode));</div><div class='ctx'> 	f2fs_mark_inode_dirty_sync(inode, false);</div><div class='ctx'> 	return len - towrite;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int f2fs_dquot_initialize(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	if (time_to_inject(F2FS_I_SB(inode), FAULT_DQUOT_INIT)) {</div><div class='del'>-		f2fs_show_injection_info(F2FS_I_SB(inode), FAULT_DQUOT_INIT);</div><div class='add'>+	if (time_to_inject(F2FS_I_SB(inode), FAULT_DQUOT_INIT))</div><div class='ctx'> 		return -ESRCH;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	return dquot_initialize(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct dquot **f2fs_get_dquots(struct inode *inode)</div><div class='add'>+static struct dquot __rcu **f2fs_get_dquots(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	return F2FS_I(inode)-&gt;i_dquot;</div><div class='ctx'> }</div><div class='hunk'>@@ -2564,6 +3226,7 @@ static int f2fs_quota_enable(struct super_block *sb, int type, int format_id,</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *qf_inode;</div><div class='ctx'> 	unsigned long qf_inum;</div><div class='add'>+	unsigned long qf_flag = F2FS_QUOTA_DEFAULT_FL;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(!f2fs_sb_has_quota_ino(F2FS_SB(sb)));</div><div class='hunk'>@@ -2579,7 +3242,15 @@ static int f2fs_quota_enable(struct super_block *sb, int type, int format_id,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Don't account quota for quota files to avoid recursion */</div><div class='add'>+	inode_lock(qf_inode);</div><div class='ctx'> 	qf_inode-&gt;i_flags |= S_NOQUOTA;</div><div class='add'>+</div><div class='add'>+	if ((F2FS_I(qf_inode)-&gt;i_flags &amp; qf_flag) != qf_flag) {</div><div class='add'>+		F2FS_I(qf_inode)-&gt;i_flags |= qf_flag;</div><div class='add'>+		f2fs_set_inode_flags(qf_inode);</div><div class='add'>+	}</div><div class='add'>+	inode_unlock(qf_inode);</div><div class='add'>+</div><div class='ctx'> 	err = dquot_load_quota_inode(qf_inode, type, format_id, flags);</div><div class='ctx'> 	iput(qf_inode);</div><div class='ctx'> 	return err;</div><div class='hunk'>@@ -2650,12 +3321,12 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int f2fs_quota_sync(struct super_block *sb, int type)</div><div class='add'>+int f2fs_do_quota_sync(struct super_block *sb, int type)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_SB(sb);</div><div class='ctx'> 	struct quota_info *dqopt = sb_dqopt(sb);</div><div class='ctx'> 	int cnt;</div><div class='del'>-	int ret;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Now when everything is written we can discard the pagecache so</div><div class='hunk'>@@ -2666,29 +3337,31 @@ int f2fs_quota_sync(struct super_block *sb, int type)</div><div class='ctx'> 		if (type != -1 &amp;&amp; cnt != type)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		if (!sb_has_quota_active(sb, type))</div><div class='del'>-			return 0;</div><div class='add'>+		if (!sb_has_quota_active(sb, cnt))</div><div class='add'>+			continue;</div><div class='ctx'> </div><div class='del'>-		inode_lock(dqopt-&gt;files[cnt]);</div><div class='add'>+		if (!f2fs_sb_has_quota_ino(sbi))</div><div class='add'>+			inode_lock(dqopt-&gt;files[cnt]);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * do_quotactl</div><div class='ctx'> 		 *  f2fs_quota_sync</div><div class='del'>-		 *  down_read(quota_sem)</div><div class='add'>+		 *  f2fs_down_read(quota_sem)</div><div class='ctx'> 		 *  dquot_writeback_dquots()</div><div class='ctx'> 		 *  f2fs_dquot_commit</div><div class='ctx'> 		 *			      block_operation</div><div class='del'>-		 *			      down_read(quota_sem)</div><div class='add'>+		 *			      f2fs_down_read(quota_sem)</div><div class='ctx'> 		 */</div><div class='ctx'> 		f2fs_lock_op(sbi);</div><div class='del'>-		down_read(&amp;sbi-&gt;quota_sem);</div><div class='add'>+		f2fs_down_read(&amp;sbi-&gt;quota_sem);</div><div class='ctx'> </div><div class='ctx'> 		ret = f2fs_quota_sync_file(sbi, cnt);</div><div class='ctx'> </div><div class='del'>-		up_read(&amp;sbi-&gt;quota_sem);</div><div class='add'>+		f2fs_up_read(&amp;sbi-&gt;quota_sem);</div><div class='ctx'> 		f2fs_unlock_op(sbi);</div><div class='ctx'> </div><div class='del'>-		inode_unlock(dqopt-&gt;files[cnt]);</div><div class='add'>+		if (!f2fs_sb_has_quota_ino(sbi))</div><div class='add'>+			inode_unlock(dqopt-&gt;files[cnt]);</div><div class='ctx'> </div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -2696,11 +3369,21 @@ int f2fs_quota_sync(struct super_block *sb, int type)</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int f2fs_quota_sync(struct super_block *sb, int type)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	F2FS_SB(sb)-&gt;umount_lock_holder = current;</div><div class='add'>+	ret = f2fs_do_quota_sync(sb, type);</div><div class='add'>+	F2FS_SB(sb)-&gt;umount_lock_holder = NULL;</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int f2fs_quota_on(struct super_block *sb, int type, int format_id,</div><div class='ctx'> 							const struct path *path)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='del'>-	int err;</div><div class='add'>+	int err = 0;</div><div class='ctx'> </div><div class='ctx'> 	/* if quota sysfile exists, deny enabling quota with specific file */</div><div class='ctx'> 	if (f2fs_sb_has_quota_ino(F2FS_SB(sb))) {</div><div class='hunk'>@@ -2708,23 +3391,37 @@ static int f2fs_quota_on(struct super_block *sb, int type, int format_id,</div><div class='ctx'> 		return -EBUSY;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = f2fs_quota_sync(sb, type);</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='add'>+	if (path-&gt;dentry-&gt;d_sb != sb)</div><div class='add'>+		return -EXDEV;</div><div class='ctx'> </div><div class='del'>-	err = dquot_quota_on(sb, type, format_id, path);</div><div class='add'>+	F2FS_SB(sb)-&gt;umount_lock_holder = current;</div><div class='add'>+</div><div class='add'>+	err = f2fs_do_quota_sync(sb, type);</div><div class='ctx'> 	if (err)</div><div class='del'>-		return err;</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='ctx'> 	inode = d_inode(path-&gt;dentry);</div><div class='ctx'> </div><div class='add'>+	err = filemap_fdatawrite(inode-&gt;i_mapping);</div><div class='add'>+	if (err)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	err = filemap_fdatawait(inode-&gt;i_mapping);</div><div class='add'>+	if (err)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	err = dquot_quota_on(sb, type, format_id, path);</div><div class='add'>+	if (err)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='ctx'> 	inode_lock(inode);</div><div class='del'>-	F2FS_I(inode)-&gt;i_flags |= F2FS_NOATIME_FL | F2FS_IMMUTABLE_FL;</div><div class='add'>+	F2FS_I(inode)-&gt;i_flags |= F2FS_QUOTA_DEFAULT_FL;</div><div class='ctx'> 	f2fs_set_inode_flags(inode);</div><div class='ctx'> 	inode_unlock(inode);</div><div class='ctx'> 	f2fs_mark_inode_dirty_sync(inode, false);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='add'>+out:</div><div class='add'>+	F2FS_SB(sb)-&gt;umount_lock_holder = NULL;</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int __f2fs_quota_off(struct super_block *sb, int type)</div><div class='hunk'>@@ -2735,7 +3432,7 @@ static int __f2fs_quota_off(struct super_block *sb, int type)</div><div class='ctx'> 	if (!inode || !igrab(inode))</div><div class='ctx'> 		return dquot_quota_off(sb, type);</div><div class='ctx'> </div><div class='del'>-	err = f2fs_quota_sync(sb, type);</div><div class='add'>+	err = f2fs_do_quota_sync(sb, type);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out_put;</div><div class='ctx'> </div><div class='hunk'>@@ -2744,7 +3441,7 @@ static int __f2fs_quota_off(struct super_block *sb, int type)</div><div class='ctx'> 		goto out_put;</div><div class='ctx'> </div><div class='ctx'> 	inode_lock(inode);</div><div class='del'>-	F2FS_I(inode)-&gt;i_flags &amp;= ~(F2FS_NOATIME_FL | F2FS_IMMUTABLE_FL);</div><div class='add'>+	F2FS_I(inode)-&gt;i_flags &amp;= ~F2FS_QUOTA_DEFAULT_FL;</div><div class='ctx'> 	f2fs_set_inode_flags(inode);</div><div class='ctx'> 	inode_unlock(inode);</div><div class='ctx'> 	f2fs_mark_inode_dirty_sync(inode, false);</div><div class='hunk'>@@ -2758,6 +3455,8 @@ static int f2fs_quota_off(struct super_block *sb, int type)</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_SB(sb);</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='add'>+	F2FS_SB(sb)-&gt;umount_lock_holder = current;</div><div class='add'>+</div><div class='ctx'> 	err = __f2fs_quota_off(sb, type);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -2767,6 +3466,9 @@ static int f2fs_quota_off(struct super_block *sb, int type)</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (is_journalled_quota(sbi))</div><div class='ctx'> 		set_sbi_flag(sbi, SBI_QUOTA_NEED_REPAIR);</div><div class='add'>+</div><div class='add'>+	F2FS_SB(sb)-&gt;umount_lock_holder = NULL;</div><div class='add'>+</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2810,11 +3512,11 @@ static int f2fs_dquot_commit(struct dquot *dquot)</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_SB(dquot-&gt;dq_sb);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	down_read_nested(&amp;sbi-&gt;quota_sem, SINGLE_DEPTH_NESTING);</div><div class='add'>+	f2fs_down_read_nested(&amp;sbi-&gt;quota_sem, SINGLE_DEPTH_NESTING);</div><div class='ctx'> 	ret = dquot_commit(dquot);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		set_sbi_flag(sbi, SBI_QUOTA_NEED_REPAIR);</div><div class='del'>-	up_read(&amp;sbi-&gt;quota_sem);</div><div class='add'>+	f2fs_up_read(&amp;sbi-&gt;quota_sem);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2823,11 +3525,11 @@ static int f2fs_dquot_acquire(struct dquot *dquot)</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_SB(dquot-&gt;dq_sb);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;sbi-&gt;quota_sem);</div><div class='add'>+	f2fs_down_read(&amp;sbi-&gt;quota_sem);</div><div class='ctx'> 	ret = dquot_acquire(dquot);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		set_sbi_flag(sbi, SBI_QUOTA_NEED_REPAIR);</div><div class='del'>-	up_read(&amp;sbi-&gt;quota_sem);</div><div class='add'>+	f2fs_up_read(&amp;sbi-&gt;quota_sem);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2899,7 +3601,7 @@ int f2fs_dquot_initialize(struct inode *inode)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int f2fs_quota_sync(struct super_block *sb, int type)</div><div class='add'>+int f2fs_do_quota_sync(struct super_block *sb, int type)</div><div class='ctx'> {</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -2927,7 +3629,7 @@ static const struct super_operations f2fs_sops = {</div><div class='ctx'> 	.freeze_fs	= f2fs_freeze,</div><div class='ctx'> 	.unfreeze_fs	= f2fs_unfreeze,</div><div class='ctx'> 	.statfs		= f2fs_statfs,</div><div class='del'>-	.remount_fs	= f2fs_remount,</div><div class='add'>+	.shutdown	= f2fs_shutdown,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_FS_ENCRYPTION</div><div class='hunk'>@@ -2968,44 +3670,41 @@ static bool f2fs_has_stable_inodes(struct super_block *sb)</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void f2fs_get_ino_and_lblk_bits(struct super_block *sb,</div><div class='del'>-				       int *ino_bits_ret, int *lblk_bits_ret)</div><div class='del'>-{</div><div class='del'>-	*ino_bits_ret = 8 * sizeof(nid_t);</div><div class='del'>-	*lblk_bits_ret = 8 * sizeof(block_t);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int f2fs_get_num_devices(struct super_block *sb)</div><div class='add'>+static struct block_device **f2fs_get_devices(struct super_block *sb,</div><div class='add'>+					      unsigned int *num_devs)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_SB(sb);</div><div class='add'>+	struct block_device **devs;</div><div class='add'>+	int i;</div><div class='ctx'> </div><div class='del'>-	if (f2fs_is_multi_device(sbi))</div><div class='del'>-		return sbi-&gt;s_ndevs;</div><div class='del'>-	return 1;</div><div class='del'>-}</div><div class='add'>+	if (!f2fs_is_multi_device(sbi))</div><div class='add'>+		return NULL;</div><div class='ctx'> </div><div class='del'>-static void f2fs_get_devices(struct super_block *sb,</div><div class='del'>-			     struct request_queue **devs)</div><div class='del'>-{</div><div class='del'>-	struct f2fs_sb_info *sbi = F2FS_SB(sb);</div><div class='del'>-	int i;</div><div class='add'>+	devs = kmalloc_array(sbi-&gt;s_ndevs, sizeof(*devs), GFP_KERNEL);</div><div class='add'>+	if (!devs)</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; sbi-&gt;s_ndevs; i++)</div><div class='del'>-		devs[i] = bdev_get_queue(FDEV(i).bdev);</div><div class='add'>+		devs[i] = FDEV(i).bdev;</div><div class='add'>+	*num_devs = sbi-&gt;s_ndevs;</div><div class='add'>+	return devs;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct fscrypt_operations f2fs_cryptops = {</div><div class='del'>-	.key_prefix		= "f2fs:",</div><div class='add'>+	.inode_info_offs	= (int)offsetof(struct f2fs_inode_info, i_crypt_info) -</div><div class='add'>+				  (int)offsetof(struct f2fs_inode_info, vfs_inode),</div><div class='add'>+	.needs_bounce_pages	= 1,</div><div class='add'>+	.has_32bit_inodes	= 1,</div><div class='add'>+	.supports_subblock_data_units = 1,</div><div class='add'>+	.legacy_key_prefix	= "f2fs:",</div><div class='ctx'> 	.get_context		= f2fs_get_context,</div><div class='ctx'> 	.set_context		= f2fs_set_context,</div><div class='ctx'> 	.get_dummy_policy	= f2fs_get_dummy_policy,</div><div class='ctx'> 	.empty_dir		= f2fs_empty_dir,</div><div class='ctx'> 	.has_stable_inodes	= f2fs_has_stable_inodes,</div><div class='del'>-	.get_ino_and_lblk_bits	= f2fs_get_ino_and_lblk_bits,</div><div class='del'>-	.get_num_devices	= f2fs_get_num_devices,</div><div class='ctx'> 	.get_devices		= f2fs_get_devices,</div><div class='ctx'> };</div><div class='del'>-#endif</div><div class='add'>+#endif /* CONFIG_FS_ENCRYPTION */</div><div class='ctx'> </div><div class='ctx'> static struct inode *f2fs_nfs_get_inode(struct super_block *sb,</div><div class='ctx'> 		u64 ino, u32 generation)</div><div class='hunk'>@@ -3047,6 +3746,7 @@ static struct dentry *f2fs_fh_to_parent(struct super_block *sb, struct fid *fid,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct export_operations f2fs_export_ops = {</div><div class='add'>+	.encode_fh = generic_encode_ino32_fh,</div><div class='ctx'> 	.fh_to_dentry = f2fs_fh_to_dentry,</div><div class='ctx'> 	.fh_to_parent = f2fs_fh_to_parent,</div><div class='ctx'> 	.get_parent = f2fs_get_parent,</div><div class='hunk'>@@ -3080,27 +3780,54 @@ loff_t max_file_blocks(struct inode *inode)</div><div class='ctx'> 	leaf_count *= NIDS_PER_BLOCK;</div><div class='ctx'> 	result += leaf_count;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * For compatibility with FSCRYPT_POLICY_FLAG_IV_INO_LBLK_{64,32} with</div><div class='add'>+	 * a 4K crypto data unit, we must restrict the max filesize to what can</div><div class='add'>+	 * fit within U32_MAX + 1 data units.</div><div class='add'>+	 */</div><div class='add'>+</div><div class='add'>+	result = umin(result, F2FS_BYTES_TO_BLK(((loff_t)U32_MAX + 1) * 4096));</div><div class='add'>+</div><div class='ctx'> 	return result;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __f2fs_commit_super(struct buffer_head *bh,</div><div class='del'>-			struct f2fs_super_block *super)</div><div class='add'>+static int __f2fs_commit_super(struct f2fs_sb_info *sbi, struct folio *folio,</div><div class='add'>+						pgoff_t index, bool update)</div><div class='ctx'> {</div><div class='del'>-	lock_buffer(bh);</div><div class='del'>-	if (super)</div><div class='del'>-		memcpy(bh-&gt;b_data + F2FS_SUPER_OFFSET, super, sizeof(*super));</div><div class='del'>-	set_buffer_dirty(bh);</div><div class='del'>-	unlock_buffer(bh);</div><div class='del'>-</div><div class='add'>+	struct bio *bio;</div><div class='ctx'> 	/* it's rare case, we can do fua all the time */</div><div class='del'>-	return __sync_dirty_buffer(bh, REQ_SYNC | REQ_PREFLUSH | REQ_FUA);</div><div class='add'>+	blk_opf_t opf = REQ_OP_WRITE | REQ_SYNC | REQ_PREFLUSH | REQ_FUA;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	folio_lock(folio);</div><div class='add'>+	folio_wait_writeback(folio);</div><div class='add'>+	if (update)</div><div class='add'>+		memcpy(F2FS_SUPER_BLOCK(folio, index), F2FS_RAW_SUPER(sbi),</div><div class='add'>+					sizeof(struct f2fs_super_block));</div><div class='add'>+	folio_mark_dirty(folio);</div><div class='add'>+	folio_clear_dirty_for_io(folio);</div><div class='add'>+	folio_start_writeback(folio);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+</div><div class='add'>+	bio = bio_alloc(sbi-&gt;sb-&gt;s_bdev, 1, opf, GFP_NOFS);</div><div class='add'>+</div><div class='add'>+	/* it doesn't need to set crypto context for superblock update */</div><div class='add'>+	bio-&gt;bi_iter.bi_sector = SECTOR_FROM_BLOCK(folio-&gt;index);</div><div class='add'>+</div><div class='add'>+	if (!bio_add_folio(bio, folio, folio_size(folio), 0))</div><div class='add'>+		f2fs_bug_on(sbi, 1);</div><div class='add'>+</div><div class='add'>+	ret = submit_bio_wait(bio);</div><div class='add'>+	bio_put(bio);</div><div class='add'>+	folio_end_writeback(folio);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline bool sanity_check_area_boundary(struct f2fs_sb_info *sbi,</div><div class='del'>-					struct buffer_head *bh)</div><div class='add'>+					struct folio *folio, pgoff_t index)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_super_block *raw_super = (struct f2fs_super_block *)</div><div class='del'>-					(bh-&gt;b_data + F2FS_SUPER_OFFSET);</div><div class='add'>+	struct f2fs_super_block *raw_super = F2FS_SUPER_BLOCK(folio, index);</div><div class='ctx'> 	struct super_block *sb = sbi-&gt;sb;</div><div class='ctx'> 	u32 segment0_blkaddr = le32_to_cpu(raw_super-&gt;segment0_blkaddr);</div><div class='ctx'> 	u32 cp_blkaddr = le32_to_cpu(raw_super-&gt;cp_blkaddr);</div><div class='hunk'>@@ -3116,9 +3843,9 @@ static inline bool sanity_check_area_boundary(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	u32 segment_count = le32_to_cpu(raw_super-&gt;segment_count);</div><div class='ctx'> 	u32 log_blocks_per_seg = le32_to_cpu(raw_super-&gt;log_blocks_per_seg);</div><div class='ctx'> 	u64 main_end_blkaddr = main_blkaddr +</div><div class='del'>-				(segment_count_main &lt;&lt; log_blocks_per_seg);</div><div class='add'>+				((u64)segment_count_main &lt;&lt; log_blocks_per_seg);</div><div class='ctx'> 	u64 seg_end_blkaddr = segment0_blkaddr +</div><div class='del'>-				(segment_count &lt;&lt; log_blocks_per_seg);</div><div class='add'>+				((u64)segment_count &lt;&lt; log_blocks_per_seg);</div><div class='ctx'> </div><div class='ctx'> 	if (segment0_blkaddr != cp_blkaddr) {</div><div class='ctx'> 		f2fs_info(sbi, "Mismatch start address, segment0(%u) cp_blkaddr(%u)",</div><div class='hunk'>@@ -3171,11 +3898,11 @@ static inline bool sanity_check_area_boundary(struct f2fs_sb_info *sbi,</div><div class='ctx'> 		raw_super-&gt;segment_count = cpu_to_le32((main_end_blkaddr -</div><div class='ctx'> 				segment0_blkaddr) &gt;&gt; log_blocks_per_seg);</div><div class='ctx'> </div><div class='del'>-		if (f2fs_readonly(sb) || bdev_read_only(sb-&gt;s_bdev)) {</div><div class='add'>+		if (f2fs_readonly(sb) || f2fs_hw_is_readonly(sbi)) {</div><div class='ctx'> 			set_sbi_flag(sbi, SBI_NEED_SB_WRITE);</div><div class='ctx'> 			res = "internally";</div><div class='ctx'> 		} else {</div><div class='del'>-			err = __f2fs_commit_super(bh, NULL);</div><div class='add'>+			err = __f2fs_commit_super(sbi, folio, index, false);</div><div class='ctx'> 			res = err ? "failed" : "done";</div><div class='ctx'> 		}</div><div class='ctx'> 		f2fs_info(sbi, "Fix alignment : %s, start(%u) end(%llu) block(%u)",</div><div class='hunk'>@@ -3188,12 +3915,11 @@ static inline bool sanity_check_area_boundary(struct f2fs_sb_info *sbi,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int sanity_check_raw_super(struct f2fs_sb_info *sbi,</div><div class='del'>-				struct buffer_head *bh)</div><div class='add'>+					struct folio *folio, pgoff_t index)</div><div class='ctx'> {</div><div class='ctx'> 	block_t segment_count, segs_per_sec, secs_per_zone, segment_count_main;</div><div class='ctx'> 	block_t total_sections, blocks_per_seg;</div><div class='del'>-	struct f2fs_super_block *raw_super = (struct f2fs_super_block *)</div><div class='del'>-					(bh-&gt;b_data + F2FS_SUPER_OFFSET);</div><div class='add'>+	struct f2fs_super_block *raw_super = F2FS_SUPER_BLOCK(folio, index);</div><div class='ctx'> 	size_t crc_offset = 0;</div><div class='ctx'> 	__u32 crc = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -3213,13 +3939,13 @@ static int sanity_check_raw_super(struct f2fs_sb_info *sbi,</div><div class='ctx'> 			return -EFSCORRUPTED;</div><div class='ctx'> 		}</div><div class='ctx'> 		crc = le32_to_cpu(raw_super-&gt;crc);</div><div class='del'>-		if (!f2fs_crc_valid(sbi, crc, raw_super, crc_offset)) {</div><div class='add'>+		if (crc != f2fs_crc32(raw_super, crc_offset)) {</div><div class='ctx'> 			f2fs_info(sbi, "Invalid SB checksum value: %u", crc);</div><div class='ctx'> 			return -EFSCORRUPTED;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Currently, support only 4KB block size */</div><div class='add'>+	/* only support block_size equals to PAGE_SIZE */</div><div class='ctx'> 	if (le32_to_cpu(raw_super-&gt;log_blocksize) != F2FS_BLKSIZE_BITS) {</div><div class='ctx'> 		f2fs_info(sbi, "Invalid log_blocksize (%u), supports only %u",</div><div class='ctx'> 			  le32_to_cpu(raw_super-&gt;log_blocksize),</div><div class='hunk'>@@ -3234,7 +3960,7 @@ static int sanity_check_raw_super(struct f2fs_sb_info *sbi,</div><div class='ctx'> 		return -EFSCORRUPTED;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Currently, support 512/1024/2048/4096 bytes sector size */</div><div class='add'>+	/* Currently, support 512/1024/2048/4096/16K bytes sector size */</div><div class='ctx'> 	if (le32_to_cpu(raw_super-&gt;log_sectorsize) &gt;</div><div class='ctx'> 				F2FS_MAX_LOG_SECTOR_SIZE ||</div><div class='ctx'> 		le32_to_cpu(raw_super-&gt;log_sectorsize) &lt;</div><div class='hunk'>@@ -3259,7 +3985,7 @@ static int sanity_check_raw_super(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	total_sections = le32_to_cpu(raw_super-&gt;section_count);</div><div class='ctx'> </div><div class='ctx'> 	/* blocks_per_seg should be 512, given the above check */</div><div class='del'>-	blocks_per_seg = 1 &lt;&lt; le32_to_cpu(raw_super-&gt;log_blocks_per_seg);</div><div class='add'>+	blocks_per_seg = BIT(le32_to_cpu(raw_super-&gt;log_blocks_per_seg));</div><div class='ctx'> </div><div class='ctx'> 	if (segment_count &gt; F2FS_MAX_SEGMENT ||</div><div class='ctx'> 				segment_count &lt; F2FS_MIN_SEGMENTS) {</div><div class='hunk'>@@ -3351,9 +4077,23 @@ static int sanity_check_raw_super(struct f2fs_sb_info *sbi,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* check CP/SIT/NAT/SSA/MAIN_AREA area boundary */</div><div class='del'>-	if (sanity_check_area_boundary(sbi, bh))</div><div class='add'>+	if (sanity_check_area_boundary(sbi, folio, index))</div><div class='ctx'> 		return -EFSCORRUPTED;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Check for legacy summary layout on 16KB+ block devices.</div><div class='add'>+	 * Modern f2fs-tools packs multiple 4KB summary areas into one block,</div><div class='add'>+	 * whereas legacy versions used one block per summary, leading</div><div class='add'>+	 * to a much larger SSA.</div><div class='add'>+	 */</div><div class='add'>+	if (SUMS_PER_BLOCK &gt; 1 &amp;&amp;</div><div class='add'>+		    !(__F2FS_HAS_FEATURE(raw_super, F2FS_FEATURE_PACKED_SSA))) {</div><div class='add'>+		f2fs_info(sbi, "Error: Device formatted with a legacy version. "</div><div class='add'>+			"Please reformat with a tool supporting the packed ssa "</div><div class='add'>+			"feature for block sizes larger than 4kb.");</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3372,6 +4112,7 @@ int f2fs_sanity_check_ckpt(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	block_t user_block_count, valid_user_blocks;</div><div class='ctx'> 	block_t avail_node_count, valid_node_count;</div><div class='ctx'> 	unsigned int nat_blocks, nat_bits_bytes, nat_bits_blocks;</div><div class='add'>+	unsigned int sit_blk_cnt;</div><div class='ctx'> 	int i, j;</div><div class='ctx'> </div><div class='ctx'> 	total = le32_to_cpu(raw_super-&gt;segment_count);</div><div class='hunk'>@@ -3422,7 +4163,7 @@ int f2fs_sanity_check_ckpt(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	main_segs = le32_to_cpu(raw_super-&gt;segment_count_main);</div><div class='del'>-	blocks_per_seg = sbi-&gt;blocks_per_seg;</div><div class='add'>+	blocks_per_seg = BLKS_PER_SEG(sbi);</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; NR_CURSEG_NODE_TYPE; i++) {</div><div class='ctx'> 		if (le32_to_cpu(ckpt-&gt;cur_node_segno[i]) &gt;= main_segs ||</div><div class='hunk'>@@ -3483,6 +4224,13 @@ skip_cross:</div><div class='ctx'> 		return 1;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	sit_blk_cnt = DIV_ROUND_UP(main_segs, SIT_ENTRY_PER_BLOCK);</div><div class='add'>+	if (sit_bitmap_size * 8 &lt; sit_blk_cnt) {</div><div class='add'>+		f2fs_err(sbi, "Wrong bitmap size: sit: %u, sit_blk_cnt:%u",</div><div class='add'>+			 sit_bitmap_size, sit_blk_cnt);</div><div class='add'>+		return 1;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	cp_pack_start_sum = __start_sum_addr(sbi);</div><div class='ctx'> 	cp_payload = __cp_payload(sbi);</div><div class='ctx'> 	if (cp_pack_start_sum &lt; cp_payload + 1 ||</div><div class='hunk'>@@ -3528,26 +4276,33 @@ static void init_sb_info(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	sbi-&gt;log_sectors_per_block =</div><div class='ctx'> 		le32_to_cpu(raw_super-&gt;log_sectors_per_block);</div><div class='ctx'> 	sbi-&gt;log_blocksize = le32_to_cpu(raw_super-&gt;log_blocksize);</div><div class='del'>-	sbi-&gt;blocksize = 1 &lt;&lt; sbi-&gt;log_blocksize;</div><div class='add'>+	sbi-&gt;blocksize = BIT(sbi-&gt;log_blocksize);</div><div class='ctx'> 	sbi-&gt;log_blocks_per_seg = le32_to_cpu(raw_super-&gt;log_blocks_per_seg);</div><div class='del'>-	sbi-&gt;blocks_per_seg = 1 &lt;&lt; sbi-&gt;log_blocks_per_seg;</div><div class='add'>+	sbi-&gt;blocks_per_seg = BIT(sbi-&gt;log_blocks_per_seg);</div><div class='ctx'> 	sbi-&gt;segs_per_sec = le32_to_cpu(raw_super-&gt;segs_per_sec);</div><div class='ctx'> 	sbi-&gt;secs_per_zone = le32_to_cpu(raw_super-&gt;secs_per_zone);</div><div class='ctx'> 	sbi-&gt;total_sections = le32_to_cpu(raw_super-&gt;section_count);</div><div class='del'>-	sbi-&gt;total_node_count =</div><div class='del'>-		(le32_to_cpu(raw_super-&gt;segment_count_nat) / 2)</div><div class='del'>-			* sbi-&gt;blocks_per_seg * NAT_ENTRY_PER_BLOCK;</div><div class='add'>+	sbi-&gt;total_node_count = SEGS_TO_BLKS(sbi,</div><div class='add'>+			((le32_to_cpu(raw_super-&gt;segment_count_nat) / 2) *</div><div class='add'>+			NAT_ENTRY_PER_BLOCK));</div><div class='add'>+	sbi-&gt;allocate_section_hint = le32_to_cpu(raw_super-&gt;section_count);</div><div class='add'>+	sbi-&gt;allocate_section_policy = ALLOCATE_FORWARD_NOHINT;</div><div class='ctx'> 	F2FS_ROOT_INO(sbi) = le32_to_cpu(raw_super-&gt;root_ino);</div><div class='ctx'> 	F2FS_NODE_INO(sbi) = le32_to_cpu(raw_super-&gt;node_ino);</div><div class='ctx'> 	F2FS_META_INO(sbi) = le32_to_cpu(raw_super-&gt;meta_ino);</div><div class='ctx'> 	sbi-&gt;cur_victim_sec = NULL_SECNO;</div><div class='add'>+	sbi-&gt;gc_mode = GC_NORMAL;</div><div class='ctx'> 	sbi-&gt;next_victim_seg[BG_GC] = NULL_SEGNO;</div><div class='ctx'> 	sbi-&gt;next_victim_seg[FG_GC] = NULL_SEGNO;</div><div class='ctx'> 	sbi-&gt;max_victim_search = DEF_MAX_VICTIM_SEARCH;</div><div class='del'>-	sbi-&gt;migration_granularity = sbi-&gt;segs_per_sec;</div><div class='add'>+	sbi-&gt;migration_granularity = SEGS_PER_SEC(sbi);</div><div class='add'>+	sbi-&gt;migration_window_granularity = f2fs_sb_has_blkzoned(sbi) ?</div><div class='add'>+		DEF_MIGRATION_WINDOW_GRANULARITY_ZONED : SEGS_PER_SEC(sbi);</div><div class='ctx'> 	sbi-&gt;seq_file_ra_mul = MIN_RA_MUL;</div><div class='ctx'> 	sbi-&gt;max_fragment_chunk = DEF_FRAGMENT_SIZE;</div><div class='ctx'> 	sbi-&gt;max_fragment_hole = DEF_FRAGMENT_SIZE;</div><div class='add'>+	spin_lock_init(&amp;sbi-&gt;gc_remaining_trials_lock);</div><div class='add'>+	atomic64_set(&amp;sbi-&gt;current_atomic_write, 0);</div><div class='ctx'> </div><div class='ctx'> 	sbi-&gt;dir_level = DEF_DIR_LEVEL;</div><div class='ctx'> 	sbi-&gt;interval_time[CP_TIME] = DEF_CP_INTERVAL;</div><div class='hunk'>@@ -3555,6 +4310,7 @@ static void init_sb_info(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	sbi-&gt;interval_time[DISCARD_TIME] = DEF_IDLE_INTERVAL;</div><div class='ctx'> 	sbi-&gt;interval_time[GC_TIME] = DEF_IDLE_INTERVAL;</div><div class='ctx'> 	sbi-&gt;interval_time[DISABLE_TIME] = DEF_DISABLE_INTERVAL;</div><div class='add'>+	sbi-&gt;interval_time[ENABLE_TIME] = DEF_ENABLE_INTERVAL;</div><div class='ctx'> 	sbi-&gt;interval_time[UMOUNT_DISCARD_TIMEOUT] =</div><div class='ctx'> 				DEF_UMOUNT_DISCARD_TIMEOUT;</div><div class='ctx'> 	clear_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='hunk'>@@ -3567,14 +4323,14 @@ static void init_sb_info(struct f2fs_sb_info *sbi)</div><div class='ctx'> </div><div class='ctx'> 	INIT_LIST_HEAD(&amp;sbi-&gt;s_list);</div><div class='ctx'> 	mutex_init(&amp;sbi-&gt;umount_mutex);</div><div class='del'>-	init_rwsem(&amp;sbi-&gt;io_order_lock);</div><div class='add'>+	init_f2fs_rwsem(&amp;sbi-&gt;io_order_lock);</div><div class='ctx'> 	spin_lock_init(&amp;sbi-&gt;cp_lock);</div><div class='ctx'> </div><div class='ctx'> 	sbi-&gt;dirty_device = 0;</div><div class='ctx'> 	spin_lock_init(&amp;sbi-&gt;dev_lock);</div><div class='ctx'> </div><div class='del'>-	init_rwsem(&amp;sbi-&gt;sb_lock);</div><div class='del'>-	init_rwsem(&amp;sbi-&gt;pin_sem);</div><div class='add'>+	init_f2fs_rwsem(&amp;sbi-&gt;sb_lock);</div><div class='add'>+	init_f2fs_rwsem(&amp;sbi-&gt;pin_sem);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int init_percpu_info(struct f2fs_sb_info *sbi)</div><div class='hunk'>@@ -3585,35 +4341,49 @@ static int init_percpu_info(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='add'>+	err = percpu_counter_init(&amp;sbi-&gt;rf_node_block_count, 0, GFP_KERNEL);</div><div class='add'>+	if (err)</div><div class='add'>+		goto err_valid_block;</div><div class='add'>+</div><div class='ctx'> 	err = percpu_counter_init(&amp;sbi-&gt;total_valid_inode_count, 0,</div><div class='ctx'> 								GFP_KERNEL);</div><div class='ctx'> 	if (err)</div><div class='del'>-		percpu_counter_destroy(&amp;sbi-&gt;alloc_valid_block_count);</div><div class='add'>+		goto err_node_block;</div><div class='add'>+	return 0;</div><div class='ctx'> </div><div class='add'>+err_node_block:</div><div class='add'>+	percpu_counter_destroy(&amp;sbi-&gt;rf_node_block_count);</div><div class='add'>+err_valid_block:</div><div class='add'>+	percpu_counter_destroy(&amp;sbi-&gt;alloc_valid_block_count);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_BLK_DEV_ZONED</div><div class='ctx'> </div><div class='ctx'> struct f2fs_report_zones_args {</div><div class='add'>+	struct f2fs_sb_info *sbi;</div><div class='ctx'> 	struct f2fs_dev_info *dev;</div><div class='del'>-	bool zone_cap_mismatch;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static int f2fs_report_zone_cb(struct blk_zone *zone, unsigned int idx,</div><div class='ctx'> 			      void *data)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_report_zones_args *rz_args = data;</div><div class='add'>+	block_t unusable_blocks = (zone-&gt;len - zone-&gt;capacity) &gt;&gt;</div><div class='add'>+					F2FS_LOG_SECTORS_PER_BLOCK;</div><div class='ctx'> </div><div class='ctx'> 	if (zone-&gt;type == BLK_ZONE_TYPE_CONVENTIONAL)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	set_bit(idx, rz_args-&gt;dev-&gt;blkz_seq);</div><div class='del'>-	rz_args-&gt;dev-&gt;zone_capacity_blocks[idx] = zone-&gt;capacity &gt;&gt;</div><div class='del'>-						F2FS_LOG_SECTORS_PER_BLOCK;</div><div class='del'>-	if (zone-&gt;len != zone-&gt;capacity &amp;&amp; !rz_args-&gt;zone_cap_mismatch)</div><div class='del'>-		rz_args-&gt;zone_cap_mismatch = true;</div><div class='del'>-</div><div class='add'>+	if (!rz_args-&gt;sbi-&gt;unusable_blocks_per_sec) {</div><div class='add'>+		rz_args-&gt;sbi-&gt;unusable_blocks_per_sec = unusable_blocks;</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+	if (rz_args-&gt;sbi-&gt;unusable_blocks_per_sec != unusable_blocks) {</div><div class='add'>+		f2fs_err(rz_args-&gt;sbi, "F2FS supports single zone capacity\n");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3622,22 +4392,33 @@ static int init_blkz_info(struct f2fs_sb_info *sbi, int devi)</div><div class='ctx'> 	struct block_device *bdev = FDEV(devi).bdev;</div><div class='ctx'> 	sector_t nr_sectors = bdev_nr_sectors(bdev);</div><div class='ctx'> 	struct f2fs_report_zones_args rep_zone_arg;</div><div class='add'>+	u64 zone_sectors;</div><div class='add'>+	unsigned int max_open_zones;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!f2fs_sb_has_blkzoned(sbi))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='add'>+	if (bdev_is_zoned(FDEV(devi).bdev)) {</div><div class='add'>+		max_open_zones = bdev_max_open_zones(bdev);</div><div class='add'>+		if (max_open_zones &amp;&amp; (max_open_zones &lt; sbi-&gt;max_open_zones))</div><div class='add'>+			sbi-&gt;max_open_zones = max_open_zones;</div><div class='add'>+		if (sbi-&gt;max_open_zones &lt; F2FS_OPTION(sbi).active_logs) {</div><div class='add'>+			f2fs_err(sbi,</div><div class='add'>+				"zoned: max open zones %u is too small, need at least %u open zones",</div><div class='add'>+				sbi-&gt;max_open_zones, F2FS_OPTION(sbi).active_logs);</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	zone_sectors = bdev_zone_sectors(bdev);</div><div class='ctx'> 	if (sbi-&gt;blocks_per_blkz &amp;&amp; sbi-&gt;blocks_per_blkz !=</div><div class='del'>-				SECTOR_TO_BLOCK(bdev_zone_sectors(bdev)))</div><div class='add'>+				SECTOR_TO_BLOCK(zone_sectors))</div><div class='ctx'> 		return -EINVAL;</div><div class='del'>-	sbi-&gt;blocks_per_blkz = SECTOR_TO_BLOCK(bdev_zone_sectors(bdev));</div><div class='del'>-	if (sbi-&gt;log_blocks_per_blkz &amp;&amp; sbi-&gt;log_blocks_per_blkz !=</div><div class='del'>-				__ilog2_u32(sbi-&gt;blocks_per_blkz))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	sbi-&gt;log_blocks_per_blkz = __ilog2_u32(sbi-&gt;blocks_per_blkz);</div><div class='del'>-	FDEV(devi).nr_blkz = SECTOR_TO_BLOCK(nr_sectors) &gt;&gt;</div><div class='del'>-					sbi-&gt;log_blocks_per_blkz;</div><div class='del'>-	if (nr_sectors &amp; (bdev_zone_sectors(bdev) - 1))</div><div class='add'>+	sbi-&gt;blocks_per_blkz = SECTOR_TO_BLOCK(zone_sectors);</div><div class='add'>+	FDEV(devi).nr_blkz = div_u64(SECTOR_TO_BLOCK(nr_sectors),</div><div class='add'>+					sbi-&gt;blocks_per_blkz);</div><div class='add'>+	if (nr_sectors &amp; (zone_sectors - 1))</div><div class='ctx'> 		FDEV(devi).nr_blkz++;</div><div class='ctx'> </div><div class='ctx'> 	FDEV(devi).blkz_seq = f2fs_kvzalloc(sbi,</div><div class='hunk'>@@ -3647,26 +4428,13 @@ static int init_blkz_info(struct f2fs_sb_info *sbi, int devi)</div><div class='ctx'> 	if (!FDEV(devi).blkz_seq)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	/* Get block zones type and zone-capacity */</div><div class='del'>-	FDEV(devi).zone_capacity_blocks = f2fs_kzalloc(sbi,</div><div class='del'>-					FDEV(devi).nr_blkz * sizeof(block_t),</div><div class='del'>-					GFP_KERNEL);</div><div class='del'>-	if (!FDEV(devi).zone_capacity_blocks)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='add'>+	rep_zone_arg.sbi = sbi;</div><div class='ctx'> 	rep_zone_arg.dev = &amp;FDEV(devi);</div><div class='del'>-	rep_zone_arg.zone_cap_mismatch = false;</div><div class='ctx'> </div><div class='ctx'> 	ret = blkdev_report_zones(bdev, 0, BLK_ALL_ZONES, f2fs_report_zone_cb,</div><div class='ctx'> 				  &amp;rep_zone_arg);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='del'>-</div><div class='del'>-	if (!rep_zone_arg.zone_cap_mismatch) {</div><div class='del'>-		kfree(FDEV(devi).zone_capacity_blocks);</div><div class='del'>-		FDEV(devi).zone_capacity_blocks = NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='hunk'>@@ -3683,7 +4451,7 @@ static int read_raw_super_block(struct f2fs_sb_info *sbi,</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = sbi-&gt;sb;</div><div class='ctx'> 	int block;</div><div class='del'>-	struct buffer_head *bh;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	struct f2fs_super_block *super;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -3692,32 +4460,32 @@ static int read_raw_super_block(struct f2fs_sb_info *sbi,</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	for (block = 0; block &lt; 2; block++) {</div><div class='del'>-		bh = sb_bread(sb, block);</div><div class='del'>-		if (!bh) {</div><div class='add'>+		folio = read_mapping_folio(sb-&gt;s_bdev-&gt;bd_mapping, block, NULL);</div><div class='add'>+		if (IS_ERR(folio)) {</div><div class='ctx'> 			f2fs_err(sbi, "Unable to read %dth superblock",</div><div class='ctx'> 				 block + 1);</div><div class='del'>-			err = -EIO;</div><div class='add'>+			err = PTR_ERR(folio);</div><div class='ctx'> 			*recovery = 1;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* sanity checking of raw super */</div><div class='del'>-		err = sanity_check_raw_super(sbi, bh);</div><div class='add'>+		err = sanity_check_raw_super(sbi, folio, block);</div><div class='ctx'> 		if (err) {</div><div class='ctx'> 			f2fs_err(sbi, "Can't find valid F2FS filesystem in %dth superblock",</div><div class='ctx'> 				 block + 1);</div><div class='del'>-			brelse(bh);</div><div class='add'>+			folio_put(folio);</div><div class='ctx'> 			*recovery = 1;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (!*raw_super) {</div><div class='del'>-			memcpy(super, bh-&gt;b_data + F2FS_SUPER_OFFSET,</div><div class='add'>+			memcpy(super, F2FS_SUPER_BLOCK(folio, block),</div><div class='ctx'> 							sizeof(*super));</div><div class='ctx'> 			*valid_super_block = block;</div><div class='ctx'> 			*raw_super = super;</div><div class='ctx'> 		}</div><div class='del'>-		brelse(bh);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* No valid superblock */</div><div class='hunk'>@@ -3731,48 +4499,213 @@ static int read_raw_super_block(struct f2fs_sb_info *sbi,</div><div class='ctx'> </div><div class='ctx'> int f2fs_commit_super(struct f2fs_sb_info *sbi, bool recover)</div><div class='ctx'> {</div><div class='del'>-	struct buffer_head *bh;</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	pgoff_t index;</div><div class='ctx'> 	__u32 crc = 0;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if ((recover &amp;&amp; f2fs_readonly(sbi-&gt;sb)) ||</div><div class='del'>-				bdev_read_only(sbi-&gt;sb-&gt;s_bdev)) {</div><div class='add'>+				f2fs_hw_is_readonly(sbi)) {</div><div class='ctx'> 		set_sbi_flag(sbi, SBI_NEED_SB_WRITE);</div><div class='ctx'> 		return -EROFS;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* we should update superblock crc here */</div><div class='ctx'> 	if (!recover &amp;&amp; f2fs_sb_has_sb_chksum(sbi)) {</div><div class='del'>-		crc = f2fs_crc32(sbi, F2FS_RAW_SUPER(sbi),</div><div class='add'>+		crc = f2fs_crc32(F2FS_RAW_SUPER(sbi),</div><div class='ctx'> 				offsetof(struct f2fs_super_block, crc));</div><div class='ctx'> 		F2FS_RAW_SUPER(sbi)-&gt;crc = cpu_to_le32(crc);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* write back-up superblock first */</div><div class='del'>-	bh = sb_bread(sbi-&gt;sb, sbi-&gt;valid_super_block ? 0 : 1);</div><div class='del'>-	if (!bh)</div><div class='del'>-		return -EIO;</div><div class='del'>-	err = __f2fs_commit_super(bh, F2FS_RAW_SUPER(sbi));</div><div class='del'>-	brelse(bh);</div><div class='add'>+	index = sbi-&gt;valid_super_block ? 0 : 1;</div><div class='add'>+	folio = read_mapping_folio(sbi-&gt;sb-&gt;s_bdev-&gt;bd_mapping, index, NULL);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio);</div><div class='add'>+	err = __f2fs_commit_super(sbi, folio, index, true);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> </div><div class='ctx'> 	/* if we are in recovery path, skip writing valid superblock */</div><div class='ctx'> 	if (recover || err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='ctx'> 	/* write current valid superblock */</div><div class='del'>-	bh = sb_bread(sbi-&gt;sb, sbi-&gt;valid_super_block);</div><div class='del'>-	if (!bh)</div><div class='del'>-		return -EIO;</div><div class='del'>-	err = __f2fs_commit_super(bh, F2FS_RAW_SUPER(sbi));</div><div class='del'>-	brelse(bh);</div><div class='add'>+	index = sbi-&gt;valid_super_block;</div><div class='add'>+	folio = read_mapping_folio(sbi-&gt;sb-&gt;s_bdev-&gt;bd_mapping, index, NULL);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio);</div><div class='add'>+	err = __f2fs_commit_super(sbi, folio, index, true);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void save_stop_reason(struct f2fs_sb_info *sbi, unsigned char reason)</div><div class='add'>+{</div><div class='add'>+	unsigned long flags;</div><div class='add'>+</div><div class='add'>+	spin_lock_irqsave(&amp;sbi-&gt;error_lock, flags);</div><div class='add'>+	if (sbi-&gt;stop_reason[reason] &lt; GENMASK(BITS_PER_BYTE - 1, 0))</div><div class='add'>+		sbi-&gt;stop_reason[reason]++;</div><div class='add'>+	spin_unlock_irqrestore(&amp;sbi-&gt;error_lock, flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void f2fs_record_stop_reason(struct f2fs_sb_info *sbi)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_super_block *raw_super = F2FS_RAW_SUPER(sbi);</div><div class='add'>+	unsigned long flags;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	f2fs_down_write(&amp;sbi-&gt;sb_lock);</div><div class='add'>+</div><div class='add'>+	spin_lock_irqsave(&amp;sbi-&gt;error_lock, flags);</div><div class='add'>+	if (sbi-&gt;error_dirty) {</div><div class='add'>+		memcpy(F2FS_RAW_SUPER(sbi)-&gt;s_errors, sbi-&gt;errors,</div><div class='add'>+							MAX_F2FS_ERRORS);</div><div class='add'>+		sbi-&gt;error_dirty = false;</div><div class='add'>+	}</div><div class='add'>+	memcpy(raw_super-&gt;s_stop_reason, sbi-&gt;stop_reason, MAX_STOP_REASON);</div><div class='add'>+	spin_unlock_irqrestore(&amp;sbi-&gt;error_lock, flags);</div><div class='add'>+</div><div class='add'>+	err = f2fs_commit_super(sbi, false);</div><div class='add'>+</div><div class='add'>+	f2fs_up_write(&amp;sbi-&gt;sb_lock);</div><div class='add'>+	if (err)</div><div class='add'>+		f2fs_err_ratelimited(sbi,</div><div class='add'>+			"f2fs_commit_super fails to record stop_reason, err:%d",</div><div class='add'>+			err);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void f2fs_save_errors(struct f2fs_sb_info *sbi, unsigned char flag)</div><div class='add'>+{</div><div class='add'>+	unsigned long flags;</div><div class='add'>+</div><div class='add'>+	spin_lock_irqsave(&amp;sbi-&gt;error_lock, flags);</div><div class='add'>+	if (!test_bit(flag, (unsigned long *)sbi-&gt;errors)) {</div><div class='add'>+		set_bit(flag, (unsigned long *)sbi-&gt;errors);</div><div class='add'>+		sbi-&gt;error_dirty = true;</div><div class='add'>+	}</div><div class='add'>+	spin_unlock_irqrestore(&amp;sbi-&gt;error_lock, flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void f2fs_handle_error(struct f2fs_sb_info *sbi, unsigned char error)</div><div class='add'>+{</div><div class='add'>+	f2fs_save_errors(sbi, error);</div><div class='add'>+</div><div class='add'>+	if (!sbi-&gt;error_dirty)</div><div class='add'>+		return;</div><div class='add'>+	if (!test_bit(error, (unsigned long *)sbi-&gt;errors))</div><div class='add'>+		return;</div><div class='add'>+	schedule_work(&amp;sbi-&gt;s_error_work);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool system_going_down(void)</div><div class='add'>+{</div><div class='add'>+	return system_state == SYSTEM_HALT || system_state == SYSTEM_POWER_OFF</div><div class='add'>+		|| system_state == SYSTEM_RESTART;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void f2fs_handle_critical_error(struct f2fs_sb_info *sbi, unsigned char reason)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = sbi-&gt;sb;</div><div class='add'>+	bool shutdown = reason == STOP_CP_REASON_SHUTDOWN;</div><div class='add'>+	bool continue_fs = !shutdown &amp;&amp;</div><div class='add'>+			F2FS_OPTION(sbi).errors == MOUNT_ERRORS_CONTINUE;</div><div class='add'>+</div><div class='add'>+	set_ckpt_flags(sbi, CP_ERROR_FLAG);</div><div class='add'>+</div><div class='add'>+	if (!f2fs_hw_is_readonly(sbi)) {</div><div class='add'>+		save_stop_reason(sbi, reason);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * always create an asynchronous task to record stop_reason</div><div class='add'>+		 * in order to avoid potential deadlock when running into</div><div class='add'>+		 * f2fs_record_stop_reason() synchronously.</div><div class='add'>+		 */</div><div class='add'>+		schedule_work(&amp;sbi-&gt;s_error_work);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We force ERRORS_RO behavior when system is rebooting. Otherwise we</div><div class='add'>+	 * could panic during 'reboot -f' as the underlying device got already</div><div class='add'>+	 * disabled.</div><div class='add'>+	 */</div><div class='add'>+	if (F2FS_OPTION(sbi).errors == MOUNT_ERRORS_PANIC &amp;&amp;</div><div class='add'>+				!shutdown &amp;&amp; !system_going_down() &amp;&amp;</div><div class='add'>+				!is_sbi_flag_set(sbi, SBI_IS_SHUTDOWN))</div><div class='add'>+		panic("F2FS-fs (device %s): panic forced after error\n",</div><div class='add'>+							sb-&gt;s_id);</div><div class='add'>+</div><div class='add'>+	if (shutdown)</div><div class='add'>+		set_sbi_flag(sbi, SBI_IS_SHUTDOWN);</div><div class='add'>+	else</div><div class='add'>+		dump_stack();</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Continue filesystem operators if errors=continue. Should not set</div><div class='add'>+	 * RO by shutdown, since RO bypasses thaw_super which can hang the</div><div class='add'>+	 * system.</div><div class='add'>+	 */</div><div class='add'>+	if (continue_fs || f2fs_readonly(sb) || shutdown) {</div><div class='add'>+		f2fs_warn(sbi, "Stopped filesystem due to reason: %d", reason);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	f2fs_warn(sbi, "Remounting filesystem read-only");</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We have already set CP_ERROR_FLAG flag to stop all updates</div><div class='add'>+	 * to filesystem, so it doesn't need to set SB_RDONLY flag here</div><div class='add'>+	 * because the flag should be set covered w/ sb-&gt;s_umount semaphore</div><div class='add'>+	 * via remount procedure, otherwise, it will confuse code like</div><div class='add'>+	 * freeze_super() which will lead to deadlocks and other problems.</div><div class='add'>+	 */</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void f2fs_record_error_work(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_sb_info *sbi = container_of(work,</div><div class='add'>+					struct f2fs_sb_info, s_error_work);</div><div class='add'>+</div><div class='add'>+	f2fs_record_stop_reason(sbi);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline unsigned int get_first_seq_zone_segno(struct f2fs_sb_info *sbi)</div><div class='add'>+{</div><div class='add'>+#ifdef CONFIG_BLK_DEV_ZONED</div><div class='add'>+	unsigned int zoneno, total_zones;</div><div class='add'>+	int devi;</div><div class='add'>+</div><div class='add'>+	if (!f2fs_sb_has_blkzoned(sbi))</div><div class='add'>+		return NULL_SEGNO;</div><div class='add'>+</div><div class='add'>+	for (devi = 0; devi &lt; sbi-&gt;s_ndevs; devi++) {</div><div class='add'>+		if (!bdev_is_zoned(FDEV(devi).bdev))</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		total_zones = GET_ZONE_FROM_SEG(sbi, FDEV(devi).total_segments);</div><div class='add'>+</div><div class='add'>+		for (zoneno = 0; zoneno &lt; total_zones; zoneno++) {</div><div class='add'>+			unsigned int segs, blks;</div><div class='add'>+</div><div class='add'>+			if (!f2fs_zone_is_seq(sbi, devi, zoneno))</div><div class='add'>+				continue;</div><div class='add'>+</div><div class='add'>+			segs = GET_SEG_FROM_SEC(sbi,</div><div class='add'>+					zoneno * sbi-&gt;secs_per_zone);</div><div class='add'>+			blks = SEGS_TO_BLKS(sbi, segs);</div><div class='add'>+			return GET_SEGNO(sbi, FDEV(devi).start_blk + blks);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='add'>+	return NULL_SEGNO;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int f2fs_scan_devices(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_super_block *raw_super = F2FS_RAW_SUPER(sbi);</div><div class='ctx'> 	unsigned int max_devices = MAX_DEVICES;</div><div class='ctx'> 	unsigned int logical_blksize;</div><div class='add'>+	blk_mode_t mode = sb_open_mode(sbi-&gt;sb-&gt;s_flags);</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='ctx'> 	/* Initialize single device information */</div><div class='hunk'>@@ -3795,18 +4728,28 @@ static int f2fs_scan_devices(struct f2fs_sb_info *sbi)</div><div class='ctx'> </div><div class='ctx'> 	logical_blksize = bdev_logical_block_size(sbi-&gt;sb-&gt;s_bdev);</div><div class='ctx'> 	sbi-&gt;aligned_blksize = true;</div><div class='add'>+	sbi-&gt;bggc_io_aware = AWARE_ALL_IO;</div><div class='add'>+#ifdef CONFIG_BLK_DEV_ZONED</div><div class='add'>+	sbi-&gt;max_open_zones = UINT_MAX;</div><div class='add'>+	sbi-&gt;blkzone_alloc_policy = BLKZONE_ALLOC_PRIOR_SEQ;</div><div class='add'>+	sbi-&gt;bggc_io_aware = AWARE_READ_IO;</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; max_devices; i++) {</div><div class='add'>+		if (max_devices == 1) {</div><div class='add'>+			FDEV(i).total_segments =</div><div class='add'>+				le32_to_cpu(raw_super-&gt;segment_count_main);</div><div class='add'>+			FDEV(i).start_blk = 0;</div><div class='add'>+			FDEV(i).end_blk = FDEV(i).total_segments *</div><div class='add'>+						BLKS_PER_SEG(sbi);</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-		if (i &gt; 0 &amp;&amp; !RDEV(i).path[0])</div><div class='add'>+		if (i == 0)</div><div class='add'>+			FDEV(0).bdev_file = sbi-&gt;sb-&gt;s_bdev_file;</div><div class='add'>+		else if (!RDEV(i).path[0])</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		if (max_devices == 1) {</div><div class='del'>-			/* Single zoned block device mount */</div><div class='del'>-			FDEV(0).bdev =</div><div class='del'>-				blkdev_get_by_dev(sbi-&gt;sb-&gt;s_bdev-&gt;bd_dev,</div><div class='del'>-					sbi-&gt;sb-&gt;s_mode, sbi-&gt;sb-&gt;s_type);</div><div class='del'>-		} else {</div><div class='add'>+		if (max_devices &gt; 1) {</div><div class='ctx'> 			/* Multi-device mount */</div><div class='ctx'> 			memcpy(FDEV(i).path, RDEV(i).path, MAX_PATH_LEN);</div><div class='ctx'> 			FDEV(i).total_segments =</div><div class='hunk'>@@ -3814,21 +4757,24 @@ static int f2fs_scan_devices(struct f2fs_sb_info *sbi)</div><div class='ctx'> 			if (i == 0) {</div><div class='ctx'> 				FDEV(i).start_blk = 0;</div><div class='ctx'> 				FDEV(i).end_blk = FDEV(i).start_blk +</div><div class='del'>-				    (FDEV(i).total_segments &lt;&lt;</div><div class='del'>-				    sbi-&gt;log_blocks_per_seg) - 1 +</div><div class='del'>-				    le32_to_cpu(raw_super-&gt;segment0_blkaddr);</div><div class='add'>+					SEGS_TO_BLKS(sbi,</div><div class='add'>+					FDEV(i).total_segments) - 1 +</div><div class='add'>+					le32_to_cpu(raw_super-&gt;segment0_blkaddr);</div><div class='add'>+				sbi-&gt;allocate_section_hint = FDEV(i).total_segments /</div><div class='add'>+							SEGS_PER_SEC(sbi);</div><div class='ctx'> 			} else {</div><div class='ctx'> 				FDEV(i).start_blk = FDEV(i - 1).end_blk + 1;</div><div class='ctx'> 				FDEV(i).end_blk = FDEV(i).start_blk +</div><div class='del'>-					(FDEV(i).total_segments &lt;&lt;</div><div class='del'>-					sbi-&gt;log_blocks_per_seg) - 1;</div><div class='add'>+						SEGS_TO_BLKS(sbi,</div><div class='add'>+						FDEV(i).total_segments) - 1;</div><div class='add'>+				FDEV(i).bdev_file = bdev_file_open_by_path(</div><div class='add'>+					FDEV(i).path, mode, sbi-&gt;sb, NULL);</div><div class='ctx'> 			}</div><div class='del'>-			FDEV(i).bdev = blkdev_get_by_path(FDEV(i).path,</div><div class='del'>-					sbi-&gt;sb-&gt;s_mode, sbi-&gt;sb-&gt;s_type);</div><div class='ctx'> 		}</div><div class='del'>-		if (IS_ERR(FDEV(i).bdev))</div><div class='del'>-			return PTR_ERR(FDEV(i).bdev);</div><div class='add'>+		if (IS_ERR(FDEV(i).bdev_file))</div><div class='add'>+			return PTR_ERR(FDEV(i).bdev_file);</div><div class='ctx'> </div><div class='add'>+		FDEV(i).bdev = file_bdev(FDEV(i).bdev_file);</div><div class='ctx'> 		/* to release errored devices */</div><div class='ctx'> 		sbi-&gt;s_ndevs = i + 1;</div><div class='ctx'> </div><div class='hunk'>@@ -3836,24 +4782,21 @@ static int f2fs_scan_devices(struct f2fs_sb_info *sbi)</div><div class='ctx'> 			sbi-&gt;aligned_blksize = false;</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_BLK_DEV_ZONED</div><div class='del'>-		if (bdev_zoned_model(FDEV(i).bdev) == BLK_ZONED_HM &amp;&amp;</div><div class='del'>-				!f2fs_sb_has_blkzoned(sbi)) {</div><div class='del'>-			f2fs_err(sbi, "Zoned block device feature not enabled");</div><div class='del'>-			return -EINVAL;</div><div class='del'>-		}</div><div class='del'>-		if (bdev_zoned_model(FDEV(i).bdev) != BLK_ZONED_NONE) {</div><div class='add'>+		if (bdev_is_zoned(FDEV(i).bdev)) {</div><div class='add'>+			if (!f2fs_sb_has_blkzoned(sbi)) {</div><div class='add'>+				f2fs_err(sbi, "Zoned block device feature not enabled");</div><div class='add'>+				return -EINVAL;</div><div class='add'>+			}</div><div class='ctx'> 			if (init_blkz_info(sbi, i)) {</div><div class='ctx'> 				f2fs_err(sbi, "Failed to initialize F2FS blkzone information");</div><div class='ctx'> 				return -EINVAL;</div><div class='ctx'> 			}</div><div class='ctx'> 			if (max_devices == 1)</div><div class='ctx'> 				break;</div><div class='del'>-			f2fs_info(sbi, "Mount Device [%2d]: %20s, %8u, %8x - %8x (zone: %s)",</div><div class='add'>+			f2fs_info(sbi, "Mount Device [%2d]: %20s, %8u, %8x - %8x (zone: Host-managed)",</div><div class='ctx'> 				  i, FDEV(i).path,</div><div class='ctx'> 				  FDEV(i).total_segments,</div><div class='del'>-				  FDEV(i).start_blk, FDEV(i).end_blk,</div><div class='del'>-				  bdev_zoned_model(FDEV(i).bdev) == BLK_ZONED_HA ?</div><div class='del'>-				  "Host-aware" : "Host-managed");</div><div class='add'>+				  FDEV(i).start_blk, FDEV(i).end_blk);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> #endif</div><div class='hunk'>@@ -3862,38 +4805,43 @@ static int f2fs_scan_devices(struct f2fs_sb_info *sbi)</div><div class='ctx'> 			  FDEV(i).total_segments,</div><div class='ctx'> 			  FDEV(i).start_blk, FDEV(i).end_blk);</div><div class='ctx'> 	}</div><div class='del'>-	f2fs_info(sbi,</div><div class='del'>-		  "IO Block Size: %8d KB", F2FS_IO_SIZE_KB(sbi));</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int f2fs_setup_casefold(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='ctx'> 	if (f2fs_sb_has_casefold(sbi) &amp;&amp; !sbi-&gt;sb-&gt;s_encoding) {</div><div class='ctx'> 		const struct f2fs_sb_encodings *encoding_info;</div><div class='ctx'> 		struct unicode_map *encoding;</div><div class='ctx'> 		__u16 encoding_flags;</div><div class='ctx'> </div><div class='del'>-		if (f2fs_sb_read_encoding(sbi-&gt;raw_super, &amp;encoding_info,</div><div class='del'>-					  &amp;encoding_flags)) {</div><div class='add'>+		encoding_info = f2fs_sb_read_encoding(sbi-&gt;raw_super);</div><div class='add'>+		if (!encoding_info) {</div><div class='ctx'> 			f2fs_err(sbi,</div><div class='ctx'> 				 "Encoding requested by superblock is unknown");</div><div class='ctx'> 			return -EINVAL;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		encoding_flags = le16_to_cpu(sbi-&gt;raw_super-&gt;s_encoding_flags);</div><div class='ctx'> 		encoding = utf8_load(encoding_info-&gt;version);</div><div class='ctx'> 		if (IS_ERR(encoding)) {</div><div class='ctx'> 			f2fs_err(sbi,</div><div class='del'>-				 "can't mount with superblock charset: %s-%s "</div><div class='add'>+				 "can't mount with superblock charset: %s-%u.%u.%u "</div><div class='ctx'> 				 "not supported by the kernel. flags: 0x%x.",</div><div class='del'>-				 encoding_info-&gt;name, encoding_info-&gt;version,</div><div class='add'>+				 encoding_info-&gt;name,</div><div class='add'>+				 unicode_major(encoding_info-&gt;version),</div><div class='add'>+				 unicode_minor(encoding_info-&gt;version),</div><div class='add'>+				 unicode_rev(encoding_info-&gt;version),</div><div class='ctx'> 				 encoding_flags);</div><div class='ctx'> 			return PTR_ERR(encoding);</div><div class='ctx'> 		}</div><div class='ctx'> 		f2fs_info(sbi, "Using encoding defined by superblock: "</div><div class='del'>-			 "%s-%s with flags 0x%hx", encoding_info-&gt;name,</div><div class='del'>-			 encoding_info-&gt;version?:"\b", encoding_flags);</div><div class='add'>+			 "%s-%u.%u.%u with flags 0x%hx", encoding_info-&gt;name,</div><div class='add'>+			 unicode_major(encoding_info-&gt;version),</div><div class='add'>+			 unicode_minor(encoding_info-&gt;version),</div><div class='add'>+			 unicode_rev(encoding_info-&gt;version),</div><div class='add'>+			 encoding_flags);</div><div class='ctx'> </div><div class='ctx'> 		sbi-&gt;sb-&gt;s_encoding = encoding;</div><div class='ctx'> 		sbi-&gt;sb-&gt;s_encoding_flags = encoding_flags;</div><div class='hunk'>@@ -3909,30 +4857,33 @@ static int f2fs_setup_casefold(struct f2fs_sb_info *sbi)</div><div class='ctx'> </div><div class='ctx'> static void f2fs_tuning_parameters(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='del'>-	struct f2fs_sm_info *sm_i = SM_I(sbi);</div><div class='del'>-</div><div class='ctx'> 	/* adjust parameters according to the volume size */</div><div class='del'>-	if (sm_i-&gt;main_segments &lt;= SMALL_VOLUME_SEGMENTS) {</div><div class='del'>-		F2FS_OPTION(sbi).alloc_mode = ALLOC_MODE_REUSE;</div><div class='add'>+	if (MAIN_SEGS(sbi) &lt;= SMALL_VOLUME_SEGMENTS) {</div><div class='ctx'> 		if (f2fs_block_unit_discard(sbi))</div><div class='del'>-			sm_i-&gt;dcc_info-&gt;discard_granularity = 1;</div><div class='del'>-		sm_i-&gt;ipu_policy = 1 &lt;&lt; F2FS_IPU_FORCE;</div><div class='add'>+			SM_I(sbi)-&gt;dcc_info-&gt;discard_granularity =</div><div class='add'>+						MIN_DISCARD_GRANULARITY;</div><div class='add'>+		if (!f2fs_lfs_mode(sbi))</div><div class='add'>+			SM_I(sbi)-&gt;ipu_policy = BIT(F2FS_IPU_FORCE) |</div><div class='add'>+						BIT(F2FS_IPU_HONOR_OPU_WRITE);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	sbi-&gt;readdir_ra = 1;</div><div class='add'>+	sbi-&gt;readdir_ra = true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int f2fs_fill_super(struct super_block *sb, void *data, int silent)</div><div class='add'>+static int f2fs_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> {</div><div class='add'>+	struct f2fs_fs_context *ctx = fc-&gt;fs_private;</div><div class='ctx'> 	struct f2fs_sb_info *sbi;</div><div class='ctx'> 	struct f2fs_super_block *raw_super;</div><div class='ctx'> 	struct inode *root;</div><div class='ctx'> 	int err;</div><div class='ctx'> 	bool skip_recovery = false, need_fsck = false;</div><div class='del'>-	char *options = NULL;</div><div class='ctx'> 	int recovery, i, valid_super_block;</div><div class='ctx'> 	struct curseg_info *seg_i;</div><div class='ctx'> 	int retry_cnt = 1;</div><div class='add'>+#ifdef CONFIG_QUOTA</div><div class='add'>+	bool quota_enabled = false;</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='ctx'> try_onemore:</div><div class='ctx'> 	err = -EINVAL;</div><div class='hunk'>@@ -3947,14 +4898,24 @@ try_onemore:</div><div class='ctx'> </div><div class='ctx'> 	sbi-&gt;sb = sb;</div><div class='ctx'> </div><div class='del'>-	/* Load the checksum driver */</div><div class='del'>-	sbi-&gt;s_chksum_driver = crypto_alloc_shash("crc32", 0, 0);</div><div class='del'>-	if (IS_ERR(sbi-&gt;s_chksum_driver)) {</div><div class='del'>-		f2fs_err(sbi, "Cannot load crc32 driver.");</div><div class='del'>-		err = PTR_ERR(sbi-&gt;s_chksum_driver);</div><div class='del'>-		sbi-&gt;s_chksum_driver = NULL;</div><div class='del'>-		goto free_sbi;</div><div class='add'>+	/* initialize locks within allocated memory */</div><div class='add'>+	init_f2fs_rwsem(&amp;sbi-&gt;gc_lock);</div><div class='add'>+	mutex_init(&amp;sbi-&gt;writepages);</div><div class='add'>+	init_f2fs_rwsem(&amp;sbi-&gt;cp_global_sem);</div><div class='add'>+	init_f2fs_rwsem(&amp;sbi-&gt;node_write);</div><div class='add'>+	init_f2fs_rwsem(&amp;sbi-&gt;node_change);</div><div class='add'>+	spin_lock_init(&amp;sbi-&gt;stat_lock);</div><div class='add'>+	init_f2fs_rwsem(&amp;sbi-&gt;cp_rwsem);</div><div class='add'>+	init_f2fs_rwsem(&amp;sbi-&gt;cp_enable_rwsem);</div><div class='add'>+	init_f2fs_rwsem(&amp;sbi-&gt;quota_sem);</div><div class='add'>+	init_waitqueue_head(&amp;sbi-&gt;cp_wait);</div><div class='add'>+	spin_lock_init(&amp;sbi-&gt;error_lock);</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; NR_INODE_TYPE; i++) {</div><div class='add'>+		INIT_LIST_HEAD(&amp;sbi-&gt;inode_list[i]);</div><div class='add'>+		spin_lock_init(&amp;sbi-&gt;inode_lock[i]);</div><div class='ctx'> 	}</div><div class='add'>+	mutex_init(&amp;sbi-&gt;flush_lock);</div><div class='ctx'> </div><div class='ctx'> 	/* set a block size */</div><div class='ctx'> 	if (unlikely(!sb_set_blocksize(sb, F2FS_BLKSIZE))) {</div><div class='hunk'>@@ -3970,20 +4931,24 @@ try_onemore:</div><div class='ctx'> 	sb-&gt;s_fs_info = sbi;</div><div class='ctx'> 	sbi-&gt;raw_super = raw_super;</div><div class='ctx'> </div><div class='add'>+	INIT_WORK(&amp;sbi-&gt;s_error_work, f2fs_record_error_work);</div><div class='add'>+	memcpy(sbi-&gt;errors, raw_super-&gt;s_errors, MAX_F2FS_ERRORS);</div><div class='add'>+	memcpy(sbi-&gt;stop_reason, raw_super-&gt;s_stop_reason, MAX_STOP_REASON);</div><div class='add'>+</div><div class='ctx'> 	/* precompute checksum seed for metadata */</div><div class='ctx'> 	if (f2fs_sb_has_inode_chksum(sbi))</div><div class='del'>-		sbi-&gt;s_chksum_seed = f2fs_chksum(sbi, ~0, raw_super-&gt;uuid,</div><div class='del'>-						sizeof(raw_super-&gt;uuid));</div><div class='add'>+		sbi-&gt;s_chksum_seed = f2fs_chksum(~0, raw_super-&gt;uuid,</div><div class='add'>+						 sizeof(raw_super-&gt;uuid));</div><div class='ctx'> </div><div class='del'>-	default_options(sbi);</div><div class='del'>-	/* parse mount options */</div><div class='del'>-	options = kstrdup((const char *)data, GFP_KERNEL);</div><div class='del'>-	if (data &amp;&amp; !options) {</div><div class='del'>-		err = -ENOMEM;</div><div class='add'>+	default_options(sbi, false);</div><div class='add'>+</div><div class='add'>+	err = f2fs_check_opt_consistency(fc, sb);</div><div class='add'>+	if (err)</div><div class='ctx'> 		goto free_sb_buf;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	err = parse_options(sb, options, false);</div><div class='add'>+	f2fs_apply_options(fc, sb);</div><div class='add'>+</div><div class='add'>+	err = f2fs_sanity_check_options(sbi, false);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto free_options;</div><div class='ctx'> </div><div class='hunk'>@@ -4021,49 +4986,28 @@ try_onemore:</div><div class='ctx'> 	sb-&gt;s_time_gran = 1;</div><div class='ctx'> 	sb-&gt;s_flags = (sb-&gt;s_flags &amp; ~SB_POSIXACL) |</div><div class='ctx'> 		(test_opt(sbi, POSIX_ACL) ? SB_POSIXACL : 0);</div><div class='del'>-	memcpy(&amp;sb-&gt;s_uuid, raw_super-&gt;uuid, sizeof(raw_super-&gt;uuid));</div><div class='add'>+	if (test_opt(sbi, INLINECRYPT))</div><div class='add'>+		sb-&gt;s_flags |= SB_INLINECRYPT;</div><div class='add'>+</div><div class='add'>+	if (test_opt(sbi, LAZYTIME))</div><div class='add'>+		sb-&gt;s_flags |= SB_LAZYTIME;</div><div class='add'>+	else</div><div class='add'>+		sb-&gt;s_flags &amp;= ~SB_LAZYTIME;</div><div class='add'>+</div><div class='add'>+	super_set_uuid(sb, (void *) raw_super-&gt;uuid, sizeof(raw_super-&gt;uuid));</div><div class='add'>+	super_set_sysfs_name_bdev(sb);</div><div class='ctx'> 	sb-&gt;s_iflags |= SB_I_CGROUPWB;</div><div class='ctx'> </div><div class='ctx'> 	/* init f2fs-specific super block info */</div><div class='ctx'> 	sbi-&gt;valid_super_block = valid_super_block;</div><div class='del'>-	init_rwsem(&amp;sbi-&gt;gc_lock);</div><div class='del'>-	mutex_init(&amp;sbi-&gt;writepages);</div><div class='del'>-	init_rwsem(&amp;sbi-&gt;cp_global_sem);</div><div class='del'>-	init_rwsem(&amp;sbi-&gt;node_write);</div><div class='del'>-	init_rwsem(&amp;sbi-&gt;node_change);</div><div class='ctx'> </div><div class='ctx'> 	/* disallow all the data/node/meta page writes */</div><div class='ctx'> 	set_sbi_flag(sbi, SBI_POR_DOING);</div><div class='del'>-	spin_lock_init(&amp;sbi-&gt;stat_lock);</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; NR_PAGE_TYPE; i++) {</div><div class='del'>-		int n = (i == META) ? 1 : NR_TEMP_TYPE;</div><div class='del'>-		int j;</div><div class='del'>-</div><div class='del'>-		sbi-&gt;write_io[i] =</div><div class='del'>-			f2fs_kmalloc(sbi,</div><div class='del'>-				     array_size(n,</div><div class='del'>-						sizeof(struct f2fs_bio_info)),</div><div class='del'>-				     GFP_KERNEL);</div><div class='del'>-		if (!sbi-&gt;write_io[i]) {</div><div class='del'>-			err = -ENOMEM;</div><div class='del'>-			goto free_bio_info;</div><div class='del'>-		}</div><div class='ctx'> </div><div class='del'>-		for (j = HOT; j &lt; n; j++) {</div><div class='del'>-			init_rwsem(&amp;sbi-&gt;write_io[i][j].io_rwsem);</div><div class='del'>-			sbi-&gt;write_io[i][j].sbi = sbi;</div><div class='del'>-			sbi-&gt;write_io[i][j].bio = NULL;</div><div class='del'>-			spin_lock_init(&amp;sbi-&gt;write_io[i][j].io_lock);</div><div class='del'>-			INIT_LIST_HEAD(&amp;sbi-&gt;write_io[i][j].io_list);</div><div class='del'>-			INIT_LIST_HEAD(&amp;sbi-&gt;write_io[i][j].bio_list);</div><div class='del'>-			init_rwsem(&amp;sbi-&gt;write_io[i][j].bio_list_lock);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	err = f2fs_init_write_merge_io(sbi);</div><div class='add'>+	if (err)</div><div class='add'>+		goto free_bio_info;</div><div class='ctx'> </div><div class='del'>-	init_rwsem(&amp;sbi-&gt;cp_rwsem);</div><div class='del'>-	init_rwsem(&amp;sbi-&gt;quota_sem);</div><div class='del'>-	init_waitqueue_head(&amp;sbi-&gt;cp_wait);</div><div class='ctx'> 	init_sb_info(sbi);</div><div class='ctx'> </div><div class='ctx'> 	err = f2fs_init_iostat(sbi);</div><div class='hunk'>@@ -4074,22 +5018,9 @@ try_onemore:</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto free_iostat;</div><div class='ctx'> </div><div class='del'>-	if (F2FS_IO_ALIGNED(sbi)) {</div><div class='del'>-		sbi-&gt;write_io_dummy =</div><div class='del'>-			mempool_create_page_pool(2 * (F2FS_IO_SIZE(sbi) - 1), 0);</div><div class='del'>-		if (!sbi-&gt;write_io_dummy) {</div><div class='del'>-			err = -ENOMEM;</div><div class='del'>-			goto free_percpu;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* init per sbi slab cache */</div><div class='del'>-	err = f2fs_init_xattr_caches(sbi);</div><div class='del'>-	if (err)</div><div class='del'>-		goto free_io_dummy;</div><div class='ctx'> 	err = f2fs_init_page_array_cache(sbi);</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto free_xattr_cache;</div><div class='add'>+		goto free_percpu;</div><div class='ctx'> </div><div class='ctx'> 	/* get an inode for meta space */</div><div class='ctx'> 	sbi-&gt;meta_inode = f2fs_iget(sb, F2FS_META_INO(sbi));</div><div class='hunk'>@@ -4141,12 +5072,6 @@ try_onemore:</div><div class='ctx'> 	limit_reserve_root(sbi);</div><div class='ctx'> 	adjust_unusable_cap_perc(sbi);</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; NR_INODE_TYPE; i++) {</div><div class='del'>-		INIT_LIST_HEAD(&amp;sbi-&gt;inode_list[i]);</div><div class='del'>-		spin_lock_init(&amp;sbi-&gt;inode_lock[i]);</div><div class='del'>-	}</div><div class='del'>-	mutex_init(&amp;sbi-&gt;flush_lock);</div><div class='del'>-</div><div class='ctx'> 	f2fs_init_extent_cache_info(sbi);</div><div class='ctx'> </div><div class='ctx'> 	f2fs_init_ino_entry_info(sbi);</div><div class='hunk'>@@ -4183,6 +5108,13 @@ try_onemore:</div><div class='ctx'> 	/* For write statistics */</div><div class='ctx'> 	sbi-&gt;sectors_written_start = f2fs_get_sectors_written(sbi);</div><div class='ctx'> </div><div class='add'>+	/* get segno of first zoned block device */</div><div class='add'>+	sbi-&gt;first_seq_zone_segno = get_first_seq_zone_segno(sbi);</div><div class='add'>+</div><div class='add'>+	sbi-&gt;reserved_pin_section = f2fs_sb_has_blkzoned(sbi) ?</div><div class='add'>+			ZONED_PIN_SEC_REQUIRED_COUNT :</div><div class='add'>+			GET_SEC_FROM_SEG(sbi, overprovision_segments(sbi));</div><div class='add'>+</div><div class='ctx'> 	/* Read accumulated write IO statistics if exists */</div><div class='ctx'> 	seg_i = CURSEG_I(sbi, CURSEG_HOT_NODE);</div><div class='ctx'> 	if (__exist_node_summaries(sbi))</div><div class='hunk'>@@ -4217,6 +5149,7 @@ try_onemore:</div><div class='ctx'> 		goto free_node_inode;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	generic_set_sb_d_ops(sb);</div><div class='ctx'> 	sb-&gt;s_root = d_make_root(root); /* allocate root dentry */</div><div class='ctx'> 	if (!sb-&gt;s_root) {</div><div class='ctx'> 		err = -ENOMEM;</div><div class='hunk'>@@ -4231,6 +5164,7 @@ try_onemore:</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto free_compress_inode;</div><div class='ctx'> </div><div class='add'>+	sbi-&gt;umount_lock_holder = current;</div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='ctx'> 	/* Enable quota usage during mount */</div><div class='ctx'> 	if (f2fs_sb_has_quota_ino(sbi) &amp;&amp; !f2fs_readonly(sb)) {</div><div class='hunk'>@@ -4238,14 +5172,18 @@ try_onemore:</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			f2fs_err(sbi, "Cannot turn on quotas: error %d", err);</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	quota_enabled = f2fs_recover_quota_begin(sbi);</div><div class='ctx'> #endif</div><div class='ctx'> 	/* if there are any orphan inodes, free them */</div><div class='ctx'> 	err = f2fs_recover_orphan_inodes(sbi);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto free_meta;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(is_set_ckpt_flags(sbi, CP_DISABLED_FLAG)))</div><div class='add'>+	if (unlikely(is_set_ckpt_flags(sbi, CP_DISABLED_FLAG))) {</div><div class='add'>+		skip_recovery = true;</div><div class='ctx'> 		goto reset_checkpoint;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* recover fsynced data */</div><div class='ctx'> 	if (!test_opt(sbi, DISABLE_ROLL_FORWARD) &amp;&amp;</div><div class='hunk'>@@ -4287,37 +5225,47 @@ try_onemore:</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='ctx'> 		err = f2fs_recover_fsync_data(sbi, true);</div><div class='del'>-</div><div class='del'>-		if (!f2fs_readonly(sb) &amp;&amp; err &gt; 0) {</div><div class='del'>-			err = -EINVAL;</div><div class='del'>-			f2fs_err(sbi, "Need to recover fsync data");</div><div class='del'>-			goto free_meta;</div><div class='add'>+		if (err &gt; 0) {</div><div class='add'>+			if (!f2fs_readonly(sb)) {</div><div class='add'>+				f2fs_err(sbi, "Need to recover fsync data");</div><div class='add'>+				err = -EINVAL;</div><div class='add'>+				goto free_meta;</div><div class='add'>+			} else {</div><div class='add'>+				f2fs_info(sbi, "drop all fsynced data");</div><div class='add'>+				err = 0;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+reset_checkpoint:</div><div class='add'>+#ifdef CONFIG_QUOTA</div><div class='add'>+	f2fs_recover_quota_end(sbi, quota_enabled);</div><div class='add'>+#endif</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If the f2fs is not readonly and fsync data recovery succeeds,</div><div class='del'>-	 * check zoned block devices' write pointer consistency.</div><div class='add'>+	 * write pointer consistency of cursegs and other zones are already</div><div class='add'>+	 * checked and fixed during recovery. However, if recovery fails,</div><div class='add'>+	 * write pointers are left untouched, and retry-mount should check</div><div class='add'>+	 * them here.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!err &amp;&amp; !f2fs_readonly(sb) &amp;&amp; f2fs_sb_has_blkzoned(sbi)) {</div><div class='del'>-		err = f2fs_check_write_pointer(sbi);</div><div class='del'>-		if (err)</div><div class='del'>-			goto free_meta;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-reset_checkpoint:</div><div class='del'>-	f2fs_init_inmem_curseg(sbi);</div><div class='add'>+	if (skip_recovery)</div><div class='add'>+		err = f2fs_check_and_fix_write_pointer(sbi);</div><div class='add'>+	if (err)</div><div class='add'>+		goto free_meta;</div><div class='ctx'> </div><div class='ctx'> 	/* f2fs_recover_fsync_data() cleared this already */</div><div class='ctx'> 	clear_sbi_flag(sbi, SBI_POR_DOING);</div><div class='ctx'> </div><div class='del'>-	if (test_opt(sbi, DISABLE_CHECKPOINT)) {</div><div class='add'>+	err = f2fs_init_inmem_curseg(sbi);</div><div class='add'>+	if (err)</div><div class='add'>+		goto sync_free_meta;</div><div class='add'>+</div><div class='add'>+	if (test_opt(sbi, DISABLE_CHECKPOINT))</div><div class='ctx'> 		err = f2fs_disable_checkpoint(sbi);</div><div class='del'>-		if (err)</div><div class='del'>-			goto sync_free_meta;</div><div class='del'>-	} else if (is_set_ckpt_flags(sbi, CP_DISABLED_FLAG)) {</div><div class='del'>-		f2fs_enable_checkpoint(sbi);</div><div class='del'>-	}</div><div class='add'>+	else if (is_set_ckpt_flags(sbi, CP_DISABLED_FLAG))</div><div class='add'>+		err = f2fs_enable_checkpoint(sbi);</div><div class='add'>+	if (err)</div><div class='add'>+		goto sync_free_meta;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If filesystem is not mounted as read-only then</div><div class='hunk'>@@ -4330,7 +5278,6 @@ reset_checkpoint:</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto sync_free_meta;</div><div class='ctx'> 	}</div><div class='del'>-	kvfree(options);</div><div class='ctx'> </div><div class='ctx'> 	/* recover broken superblock */</div><div class='ctx'> 	if (recovery) {</div><div class='hunk'>@@ -4348,6 +5295,8 @@ reset_checkpoint:</div><div class='ctx'> 	f2fs_update_time(sbi, CP_TIME);</div><div class='ctx'> 	f2fs_update_time(sbi, REQ_TIME);</div><div class='ctx'> 	clear_sbi_flag(sbi, SBI_CP_DISABLED_QUICK);</div><div class='add'>+</div><div class='add'>+	sbi-&gt;umount_lock_holder = NULL;</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> sync_free_meta:</div><div class='hunk'>@@ -4389,9 +5338,11 @@ free_nm:</div><div class='ctx'> 	f2fs_destroy_node_manager(sbi);</div><div class='ctx'> free_sm:</div><div class='ctx'> 	f2fs_destroy_segment_manager(sbi);</div><div class='del'>-	f2fs_destroy_post_read_wq(sbi);</div><div class='ctx'> stop_ckpt_thread:</div><div class='ctx'> 	f2fs_stop_ckpt_thread(sbi);</div><div class='add'>+	/* flush s_error_work before sbi destroy */</div><div class='add'>+	flush_work(&amp;sbi-&gt;s_error_work);</div><div class='add'>+	f2fs_destroy_post_read_wq(sbi);</div><div class='ctx'> free_devices:</div><div class='ctx'> 	destroy_device_list(sbi);</div><div class='ctx'> 	kvfree(sbi-&gt;ckpt);</div><div class='hunk'>@@ -4401,19 +5352,15 @@ free_meta_inode:</div><div class='ctx'> 	sbi-&gt;meta_inode = NULL;</div><div class='ctx'> free_page_array_cache:</div><div class='ctx'> 	f2fs_destroy_page_array_cache(sbi);</div><div class='del'>-free_xattr_cache:</div><div class='del'>-	f2fs_destroy_xattr_caches(sbi);</div><div class='del'>-free_io_dummy:</div><div class='del'>-	mempool_destroy(sbi-&gt;write_io_dummy);</div><div class='ctx'> free_percpu:</div><div class='ctx'> 	destroy_percpu_info(sbi);</div><div class='ctx'> free_iostat:</div><div class='ctx'> 	f2fs_destroy_iostat(sbi);</div><div class='ctx'> free_bio_info:</div><div class='ctx'> 	for (i = 0; i &lt; NR_PAGE_TYPE; i++)</div><div class='del'>-		kvfree(sbi-&gt;write_io[i]);</div><div class='add'>+		kfree(sbi-&gt;write_io[i]);</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='ctx'> 	utf8_unload(sb-&gt;s_encoding);</div><div class='ctx'> 	sb-&gt;s_encoding = NULL;</div><div class='ctx'> #endif</div><div class='hunk'>@@ -4422,14 +5369,13 @@ free_options:</div><div class='ctx'> 	for (i = 0; i &lt; MAXQUOTAS; i++)</div><div class='ctx'> 		kfree(F2FS_OPTION(sbi).s_qf_names[i]);</div><div class='ctx'> #endif</div><div class='del'>-	fscrypt_free_dummy_policy(&amp;F2FS_OPTION(sbi).dummy_enc_policy);</div><div class='del'>-	kvfree(options);</div><div class='add'>+	/* no need to free dummy_enc_policy, we just keep it in ctx when failed */</div><div class='add'>+	swap(F2FS_CTX_INFO(ctx).dummy_enc_policy, F2FS_OPTION(sbi).dummy_enc_policy);</div><div class='ctx'> free_sb_buf:</div><div class='ctx'> 	kfree(raw_super);</div><div class='ctx'> free_sbi:</div><div class='del'>-	if (sbi-&gt;s_chksum_driver)</div><div class='del'>-		crypto_free_shash(sbi-&gt;s_chksum_driver);</div><div class='ctx'> 	kfree(sbi);</div><div class='add'>+	sb-&gt;s_fs_info = NULL;</div><div class='ctx'> </div><div class='ctx'> 	/* give only one another chance */</div><div class='ctx'> 	if (retry_cnt &gt; 0 &amp;&amp; skip_recovery) {</div><div class='hunk'>@@ -4440,16 +5386,45 @@ free_sbi:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct dentry *f2fs_mount(struct file_system_type *fs_type, int flags,</div><div class='del'>-			const char *dev_name, void *data)</div><div class='add'>+static int f2fs_get_tree(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	return mount_bdev(fs_type, flags, dev_name, data, f2fs_fill_super);</div><div class='add'>+	return get_tree_bdev(fc, f2fs_fill_super);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int f2fs_reconfigure(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = fc-&gt;root-&gt;d_sb;</div><div class='add'>+</div><div class='add'>+	return __f2fs_remount(fc, sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void f2fs_fc_free(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_fs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+</div><div class='add'>+	if (!ctx)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_QUOTA</div><div class='add'>+	f2fs_unnote_qf_name_all(fc);</div><div class='add'>+#endif</div><div class='add'>+	fscrypt_free_dummy_policy(&amp;F2FS_CTX_INFO(ctx).dummy_enc_policy);</div><div class='add'>+	kfree(ctx);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct fs_context_operations f2fs_context_ops = {</div><div class='add'>+	.parse_param	= f2fs_parse_param,</div><div class='add'>+	.get_tree	= f2fs_get_tree,</div><div class='add'>+	.reconfigure = f2fs_reconfigure,</div><div class='add'>+	.free	= f2fs_fc_free,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> static void kill_f2fs_super(struct super_block *sb)</div><div class='ctx'> {</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_SB(sb);</div><div class='add'>+</div><div class='ctx'> 	if (sb-&gt;s_root) {</div><div class='del'>-		struct f2fs_sb_info *sbi = F2FS_SB(sb);</div><div class='add'>+		sbi-&gt;umount_lock_holder = current;</div><div class='ctx'> </div><div class='ctx'> 		set_sbi_flag(sbi, SBI_IS_CLOSE);</div><div class='ctx'> 		f2fs_stop_gc_thread(sbi);</div><div class='hunk'>@@ -4469,6 +5444,7 @@ static void kill_f2fs_super(struct super_block *sb)</div><div class='ctx'> 			struct cp_control cpc = {</div><div class='ctx'> 				.reason = CP_UMOUNT,</div><div class='ctx'> 			};</div><div class='add'>+			stat_inc_cp_call_count(sbi, TOTAL_CALL);</div><div class='ctx'> 			f2fs_write_checkpoint(sbi, &amp;cpc);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -4476,14 +5452,34 @@ static void kill_f2fs_super(struct super_block *sb)</div><div class='ctx'> 			sb-&gt;s_flags &amp;= ~SB_RDONLY;</div><div class='ctx'> 	}</div><div class='ctx'> 	kill_block_super(sb);</div><div class='add'>+	/* Release block devices last, after fscrypt_destroy_keyring(). */</div><div class='add'>+	if (sbi) {</div><div class='add'>+		destroy_device_list(sbi);</div><div class='add'>+		kfree(sbi);</div><div class='add'>+		sb-&gt;s_fs_info = NULL;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int f2fs_init_fs_context(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_fs_context *ctx;</div><div class='add'>+</div><div class='add'>+	ctx = kzalloc(sizeof(struct f2fs_fs_context), GFP_KERNEL);</div><div class='add'>+	if (!ctx)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	fc-&gt;fs_private = ctx;</div><div class='add'>+	fc-&gt;ops = &amp;f2fs_context_ops;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct file_system_type f2fs_fs_type = {</div><div class='ctx'> 	.owner		= THIS_MODULE,</div><div class='ctx'> 	.name		= "f2fs",</div><div class='del'>-	.mount		= f2fs_mount,</div><div class='add'>+	.init_fs_context = f2fs_init_fs_context,</div><div class='ctx'> 	.kill_sb	= kill_f2fs_super,</div><div class='del'>-	.fs_flags	= FS_REQUIRES_DEV,</div><div class='add'>+	.fs_flags	= FS_REQUIRES_DEV | FS_ALLOW_IDMAP,</div><div class='ctx'> };</div><div class='ctx'> MODULE_ALIAS_FS("f2fs");</div><div class='ctx'> </div><div class='hunk'>@@ -4492,9 +5488,7 @@ static int __init init_inodecache(void)</div><div class='ctx'> 	f2fs_inode_cachep = kmem_cache_create("f2fs_inode_cache",</div><div class='ctx'> 			sizeof(struct f2fs_inode_info), 0,</div><div class='ctx'> 			SLAB_RECLAIM_ACCOUNT|SLAB_ACCOUNT, NULL);</div><div class='del'>-	if (!f2fs_inode_cachep)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	return 0;</div><div class='add'>+	return f2fs_inode_cachep ? 0 : -ENOMEM;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void destroy_inodecache(void)</div><div class='hunk'>@@ -4511,12 +5505,6 @@ static int __init init_f2fs_fs(void)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	if (PAGE_SIZE != F2FS_BLKSIZE) {</div><div class='del'>-		printk("F2FS not supported on PAGE_SIZE(%lu) != %d\n",</div><div class='del'>-				PAGE_SIZE, F2FS_BLKSIZE);</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	err = init_inodecache();</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto fail;</div><div class='hunk'>@@ -4541,12 +5529,9 @@ static int __init init_f2fs_fs(void)</div><div class='ctx'> 	err = f2fs_init_sysfs();</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto free_garbage_collection_cache;</div><div class='del'>-	err = register_shrinker(&amp;f2fs_shrinker_info);</div><div class='add'>+	err = f2fs_init_shrinker();</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto free_sysfs;</div><div class='del'>-	err = register_filesystem(&amp;f2fs_fs_type);</div><div class='del'>-	if (err)</div><div class='del'>-		goto free_shrinker;</div><div class='ctx'> 	f2fs_create_root_stats();</div><div class='ctx'> 	err = f2fs_init_post_read_processing();</div><div class='ctx'> 	if (err)</div><div class='hunk'>@@ -4559,7 +5544,7 @@ static int __init init_f2fs_fs(void)</div><div class='ctx'> 		goto free_iostat;</div><div class='ctx'> 	err = f2fs_init_bioset();</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto free_bio_enrty_cache;</div><div class='add'>+		goto free_bio_entry_cache;</div><div class='ctx'> 	err = f2fs_init_compress_mempool();</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto free_bioset;</div><div class='hunk'>@@ -4569,14 +5554,24 @@ static int __init init_f2fs_fs(void)</div><div class='ctx'> 	err = f2fs_create_casefold_cache();</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto free_compress_cache;</div><div class='add'>+	err = f2fs_init_xattr_cache();</div><div class='add'>+	if (err)</div><div class='add'>+		goto free_casefold_cache;</div><div class='add'>+	err = register_filesystem(&amp;f2fs_fs_type);</div><div class='add'>+	if (err)</div><div class='add'>+		goto free_xattr_cache;</div><div class='ctx'> 	return 0;</div><div class='add'>+free_xattr_cache:</div><div class='add'>+	f2fs_destroy_xattr_cache();</div><div class='add'>+free_casefold_cache:</div><div class='add'>+	f2fs_destroy_casefold_cache();</div><div class='ctx'> free_compress_cache:</div><div class='ctx'> 	f2fs_destroy_compress_cache();</div><div class='ctx'> free_compress_mempool:</div><div class='ctx'> 	f2fs_destroy_compress_mempool();</div><div class='ctx'> free_bioset:</div><div class='ctx'> 	f2fs_destroy_bioset();</div><div class='del'>-free_bio_enrty_cache:</div><div class='add'>+free_bio_entry_cache:</div><div class='ctx'> 	f2fs_destroy_bio_entry_cache();</div><div class='ctx'> free_iostat:</div><div class='ctx'> 	f2fs_destroy_iostat_processing();</div><div class='hunk'>@@ -4584,9 +5579,7 @@ free_post_read:</div><div class='ctx'> 	f2fs_destroy_post_read_processing();</div><div class='ctx'> free_root_stats:</div><div class='ctx'> 	f2fs_destroy_root_stats();</div><div class='del'>-	unregister_filesystem(&amp;f2fs_fs_type);</div><div class='del'>-free_shrinker:</div><div class='del'>-	unregister_shrinker(&amp;f2fs_shrinker_info);</div><div class='add'>+	f2fs_exit_shrinker();</div><div class='ctx'> free_sysfs:</div><div class='ctx'> 	f2fs_exit_sysfs();</div><div class='ctx'> free_garbage_collection_cache:</div><div class='hunk'>@@ -4609,6 +5602,8 @@ fail:</div><div class='ctx'> </div><div class='ctx'> static void __exit exit_f2fs_fs(void)</div><div class='ctx'> {</div><div class='add'>+	unregister_filesystem(&amp;f2fs_fs_type);</div><div class='add'>+	f2fs_destroy_xattr_cache();</div><div class='ctx'> 	f2fs_destroy_casefold_cache();</div><div class='ctx'> 	f2fs_destroy_compress_cache();</div><div class='ctx'> 	f2fs_destroy_compress_mempool();</div><div class='hunk'>@@ -4617,8 +5612,7 @@ static void __exit exit_f2fs_fs(void)</div><div class='ctx'> 	f2fs_destroy_iostat_processing();</div><div class='ctx'> 	f2fs_destroy_post_read_processing();</div><div class='ctx'> 	f2fs_destroy_root_stats();</div><div class='del'>-	unregister_filesystem(&amp;f2fs_fs_type);</div><div class='del'>-	unregister_shrinker(&amp;f2fs_shrinker_info);</div><div class='add'>+	f2fs_exit_shrinker();</div><div class='ctx'> 	f2fs_exit_sysfs();</div><div class='ctx'> 	f2fs_destroy_garbage_collection_cache();</div><div class='ctx'> 	f2fs_destroy_extent_cache();</div><div class='hunk'>@@ -4635,5 +5629,3 @@ module_exit(exit_f2fs_fs)</div><div class='ctx'> MODULE_AUTHOR("Samsung Electronics's Praesto Team");</div><div class='ctx'> MODULE_DESCRIPTION("Flash Friendly File System");</div><div class='ctx'> MODULE_LICENSE("GPL");</div><div class='del'>-MODULE_SOFTDEP("pre: crc32");</div><div class='del'>-</div><div class='head'>diff --git a/fs/f2fs/sysfs.c b/fs/f2fs/sysfs.c<br/>index 7d289249cd7e..c42f4f979d13 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/sysfs.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/sysfs.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/sysfs.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/sysfs.c</a></div><div class='hunk'>@@ -41,16 +41,32 @@ enum {</div><div class='ctx'> 	ATGC_INFO,	/* struct atgc_management */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+static const char *gc_mode_names[MAX_GC_MODE] = {</div><div class='add'>+	"GC_NORMAL",</div><div class='add'>+	"GC_IDLE_CB",</div><div class='add'>+	"GC_IDLE_GREEDY",</div><div class='add'>+	"GC_IDLE_AT",</div><div class='add'>+	"GC_URGENT_HIGH",</div><div class='add'>+	"GC_URGENT_LOW",</div><div class='add'>+	"GC_URGENT_MID"</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> struct f2fs_attr {</div><div class='ctx'> 	struct attribute attr;</div><div class='del'>-	ssize_t (*show)(struct f2fs_attr *, struct f2fs_sb_info *, char *);</div><div class='del'>-	ssize_t (*store)(struct f2fs_attr *, struct f2fs_sb_info *,</div><div class='del'>-			 const char *, size_t);</div><div class='add'>+	ssize_t (*show)(struct f2fs_attr *a, struct f2fs_sb_info *sbi, char *buf);</div><div class='add'>+	ssize_t (*store)(struct f2fs_attr *a, struct f2fs_sb_info *sbi,</div><div class='add'>+			 const char *buf, size_t len);</div><div class='ctx'> 	int struct_type;</div><div class='ctx'> 	int offset;</div><div class='ctx'> 	int id;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+struct f2fs_base_attr {</div><div class='add'>+	struct attribute attr;</div><div class='add'>+	ssize_t (*show)(struct f2fs_base_attr *a, char *buf);</div><div class='add'>+	ssize_t (*store)(struct f2fs_base_attr *a, const char *buf, size_t len);</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> static ssize_t f2fs_sbi_show(struct f2fs_attr *a,</div><div class='ctx'> 			     struct f2fs_sb_info *sbi, char *buf);</div><div class='ctx'> </div><div class='hunk'>@@ -85,28 +101,28 @@ static unsigned char *__struct_ptr(struct f2fs_sb_info *sbi, int struct_type)</div><div class='ctx'> static ssize_t dirty_segments_show(struct f2fs_attr *a,</div><div class='ctx'> 		struct f2fs_sb_info *sbi, char *buf)</div><div class='ctx'> {</div><div class='del'>-	return sprintf(buf, "%llu\n",</div><div class='add'>+	return sysfs_emit(buf, "%llu\n",</div><div class='ctx'> 			(unsigned long long)(dirty_segments(sbi)));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t free_segments_show(struct f2fs_attr *a,</div><div class='ctx'> 		struct f2fs_sb_info *sbi, char *buf)</div><div class='ctx'> {</div><div class='del'>-	return sprintf(buf, "%llu\n",</div><div class='add'>+	return sysfs_emit(buf, "%llu\n",</div><div class='ctx'> 			(unsigned long long)(free_segments(sbi)));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t ovp_segments_show(struct f2fs_attr *a,</div><div class='ctx'> 		struct f2fs_sb_info *sbi, char *buf)</div><div class='ctx'> {</div><div class='del'>-	return sprintf(buf, "%llu\n",</div><div class='add'>+	return sysfs_emit(buf, "%llu\n",</div><div class='ctx'> 			(unsigned long long)(overprovision_segments(sbi)));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t lifetime_write_kbytes_show(struct f2fs_attr *a,</div><div class='ctx'> 		struct f2fs_sb_info *sbi, char *buf)</div><div class='ctx'> {</div><div class='del'>-	return sprintf(buf, "%llu\n",</div><div class='add'>+	return sysfs_emit(buf, "%llu\n",</div><div class='ctx'> 			(unsigned long long)(sbi-&gt;kbytes_written +</div><div class='ctx'> 			((f2fs_get_sectors_written(sbi) -</div><div class='ctx'> 				sbi-&gt;sectors_written_start) &gt;&gt; 1)));</div><div class='hunk'>@@ -115,7 +131,61 @@ static ssize_t lifetime_write_kbytes_show(struct f2fs_attr *a,</div><div class='ctx'> static ssize_t sb_status_show(struct f2fs_attr *a,</div><div class='ctx'> 		struct f2fs_sb_info *sbi, char *buf)</div><div class='ctx'> {</div><div class='del'>-	return sprintf(buf, "%lx\n", sbi-&gt;s_flag);</div><div class='add'>+	return sysfs_emit(buf, "%lx\n", sbi-&gt;s_flag);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t cp_status_show(struct f2fs_attr *a,</div><div class='add'>+		struct f2fs_sb_info *sbi, char *buf)</div><div class='add'>+{</div><div class='add'>+	return sysfs_emit(buf, "%x\n", le32_to_cpu(F2FS_CKPT(sbi)-&gt;ckpt_flags));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t pending_discard_show(struct f2fs_attr *a,</div><div class='add'>+		struct f2fs_sb_info *sbi, char *buf)</div><div class='add'>+{</div><div class='add'>+	if (!SM_I(sbi)-&gt;dcc_info)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	return sysfs_emit(buf, "%llu\n", (unsigned long long)atomic_read(</div><div class='add'>+				&amp;SM_I(sbi)-&gt;dcc_info-&gt;discard_cmd_cnt));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t issued_discard_show(struct f2fs_attr *a,</div><div class='add'>+		struct f2fs_sb_info *sbi, char *buf)</div><div class='add'>+{</div><div class='add'>+	if (!SM_I(sbi)-&gt;dcc_info)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	return sysfs_emit(buf, "%llu\n", (unsigned long long)atomic_read(</div><div class='add'>+				&amp;SM_I(sbi)-&gt;dcc_info-&gt;issued_discard));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t queued_discard_show(struct f2fs_attr *a,</div><div class='add'>+		struct f2fs_sb_info *sbi, char *buf)</div><div class='add'>+{</div><div class='add'>+	if (!SM_I(sbi)-&gt;dcc_info)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	return sysfs_emit(buf, "%llu\n", (unsigned long long)atomic_read(</div><div class='add'>+				&amp;SM_I(sbi)-&gt;dcc_info-&gt;queued_discard));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t undiscard_blks_show(struct f2fs_attr *a,</div><div class='add'>+		struct f2fs_sb_info *sbi, char *buf)</div><div class='add'>+{</div><div class='add'>+	if (!SM_I(sbi)-&gt;dcc_info)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	return sysfs_emit(buf, "%u\n",</div><div class='add'>+				SM_I(sbi)-&gt;dcc_info-&gt;undiscard_blks);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t atgc_enabled_show(struct f2fs_attr *a,</div><div class='add'>+		struct f2fs_sb_info *sbi, char *buf)</div><div class='add'>+{</div><div class='add'>+	return sysfs_emit(buf, "%d\n", sbi-&gt;am.atgc_enabled ? 1 : 0);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t gc_mode_show(struct f2fs_attr *a,</div><div class='add'>+		struct f2fs_sb_info *sbi, char *buf)</div><div class='add'>+{</div><div class='add'>+	return sysfs_emit(buf, "%s\n", gc_mode_names[sbi-&gt;gc_mode]);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t features_show(struct f2fs_attr *a,</div><div class='hunk'>@@ -124,57 +194,60 @@ static ssize_t features_show(struct f2fs_attr *a,</div><div class='ctx'> 	int len = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (f2fs_sb_has_encrypt(sbi))</div><div class='del'>-		len += scnprintf(buf, PAGE_SIZE - len, "%s",</div><div class='add'>+		len += sysfs_emit_at(buf, len, "%s",</div><div class='ctx'> 						"encryption");</div><div class='ctx'> 	if (f2fs_sb_has_blkzoned(sbi))</div><div class='del'>-		len += scnprintf(buf + len, PAGE_SIZE - len, "%s%s",</div><div class='add'>+		len += sysfs_emit_at(buf, len, "%s%s",</div><div class='ctx'> 				len ? ", " : "", "blkzoned");</div><div class='ctx'> 	if (f2fs_sb_has_extra_attr(sbi))</div><div class='del'>-		len += scnprintf(buf + len, PAGE_SIZE - len, "%s%s",</div><div class='add'>+		len += sysfs_emit_at(buf, len, "%s%s",</div><div class='ctx'> 				len ? ", " : "", "extra_attr");</div><div class='ctx'> 	if (f2fs_sb_has_project_quota(sbi))</div><div class='del'>-		len += scnprintf(buf + len, PAGE_SIZE - len, "%s%s",</div><div class='add'>+		len += sysfs_emit_at(buf, len, "%s%s",</div><div class='ctx'> 				len ? ", " : "", "projquota");</div><div class='ctx'> 	if (f2fs_sb_has_inode_chksum(sbi))</div><div class='del'>-		len += scnprintf(buf + len, PAGE_SIZE - len, "%s%s",</div><div class='add'>+		len += sysfs_emit_at(buf, len, "%s%s",</div><div class='ctx'> 				len ? ", " : "", "inode_checksum");</div><div class='ctx'> 	if (f2fs_sb_has_flexible_inline_xattr(sbi))</div><div class='del'>-		len += scnprintf(buf + len, PAGE_SIZE - len, "%s%s",</div><div class='add'>+		len += sysfs_emit_at(buf, len, "%s%s",</div><div class='ctx'> 				len ? ", " : "", "flexible_inline_xattr");</div><div class='ctx'> 	if (f2fs_sb_has_quota_ino(sbi))</div><div class='del'>-		len += scnprintf(buf + len, PAGE_SIZE - len, "%s%s",</div><div class='add'>+		len += sysfs_emit_at(buf, len, "%s%s",</div><div class='ctx'> 				len ? ", " : "", "quota_ino");</div><div class='ctx'> 	if (f2fs_sb_has_inode_crtime(sbi))</div><div class='del'>-		len += scnprintf(buf + len, PAGE_SIZE - len, "%s%s",</div><div class='add'>+		len += sysfs_emit_at(buf, len, "%s%s",</div><div class='ctx'> 				len ? ", " : "", "inode_crtime");</div><div class='ctx'> 	if (f2fs_sb_has_lost_found(sbi))</div><div class='del'>-		len += scnprintf(buf + len, PAGE_SIZE - len, "%s%s",</div><div class='add'>+		len += sysfs_emit_at(buf, len, "%s%s",</div><div class='ctx'> 				len ? ", " : "", "lost_found");</div><div class='ctx'> 	if (f2fs_sb_has_verity(sbi))</div><div class='del'>-		len += scnprintf(buf + len, PAGE_SIZE - len, "%s%s",</div><div class='add'>+		len += sysfs_emit_at(buf, len, "%s%s",</div><div class='ctx'> 				len ? ", " : "", "verity");</div><div class='ctx'> 	if (f2fs_sb_has_sb_chksum(sbi))</div><div class='del'>-		len += scnprintf(buf + len, PAGE_SIZE - len, "%s%s",</div><div class='add'>+		len += sysfs_emit_at(buf, len, "%s%s",</div><div class='ctx'> 				len ? ", " : "", "sb_checksum");</div><div class='ctx'> 	if (f2fs_sb_has_casefold(sbi))</div><div class='del'>-		len += scnprintf(buf + len, PAGE_SIZE - len, "%s%s",</div><div class='add'>+		len += sysfs_emit_at(buf, len, "%s%s",</div><div class='ctx'> 				len ? ", " : "", "casefold");</div><div class='ctx'> 	if (f2fs_sb_has_readonly(sbi))</div><div class='del'>-		len += scnprintf(buf + len, PAGE_SIZE - len, "%s%s",</div><div class='add'>+		len += sysfs_emit_at(buf, len, "%s%s",</div><div class='ctx'> 				len ? ", " : "", "readonly");</div><div class='ctx'> 	if (f2fs_sb_has_compression(sbi))</div><div class='del'>-		len += scnprintf(buf + len, PAGE_SIZE - len, "%s%s",</div><div class='add'>+		len += sysfs_emit_at(buf, len, "%s%s",</div><div class='ctx'> 				len ? ", " : "", "compression");</div><div class='del'>-	len += scnprintf(buf + len, PAGE_SIZE - len, "%s%s",</div><div class='add'>+	if (f2fs_sb_has_packed_ssa(sbi))</div><div class='add'>+		len += sysfs_emit_at(buf, len, "%s%s",</div><div class='add'>+				len ? ", " : "", "packed_ssa");</div><div class='add'>+	len += sysfs_emit_at(buf, len, "%s%s",</div><div class='ctx'> 				len ? ", " : "", "pin_file");</div><div class='del'>-	len += scnprintf(buf + len, PAGE_SIZE - len, "\n");</div><div class='add'>+	len += sysfs_emit_at(buf, len, "\n");</div><div class='ctx'> 	return len;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t current_reserved_blocks_show(struct f2fs_attr *a,</div><div class='ctx'> 					struct f2fs_sb_info *sbi, char *buf)</div><div class='ctx'> {</div><div class='del'>-	return sprintf(buf, "%u\n", sbi-&gt;current_reserved_blocks);</div><div class='add'>+	return sysfs_emit(buf, "%u\n", sbi-&gt;current_reserved_blocks);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t unusable_show(struct f2fs_attr *a,</div><div class='hunk'>@@ -186,29 +259,51 @@ static ssize_t unusable_show(struct f2fs_attr *a,</div><div class='ctx'> 		unusable = sbi-&gt;unusable_block_count;</div><div class='ctx'> 	else</div><div class='ctx'> 		unusable = f2fs_get_unusable_blocks(sbi);</div><div class='del'>-	return sprintf(buf, "%llu\n", (unsigned long long)unusable);</div><div class='add'>+	return sysfs_emit(buf, "%llu\n", (unsigned long long)unusable);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t encoding_show(struct f2fs_attr *a,</div><div class='ctx'> 		struct f2fs_sb_info *sbi, char *buf)</div><div class='ctx'> {</div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='ctx'> 	struct super_block *sb = sbi-&gt;sb;</div><div class='ctx'> </div><div class='ctx'> 	if (f2fs_sb_has_casefold(sbi))</div><div class='del'>-		return sysfs_emit(buf, "%s (%d.%d.%d)\n",</div><div class='del'>-			sb-&gt;s_encoding-&gt;charset,</div><div class='add'>+		return sysfs_emit(buf, "UTF-8 (%d.%d.%d)\n",</div><div class='ctx'> 			(sb-&gt;s_encoding-&gt;version &gt;&gt; 16) &amp; 0xff,</div><div class='ctx'> 			(sb-&gt;s_encoding-&gt;version &gt;&gt; 8) &amp; 0xff,</div><div class='ctx'> 			sb-&gt;s_encoding-&gt;version &amp; 0xff);</div><div class='ctx'> #endif</div><div class='del'>-	return sprintf(buf, "(none)");</div><div class='add'>+	return sysfs_emit(buf, "(none)\n");</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t encoding_flags_show(struct f2fs_attr *a,</div><div class='add'>+		struct f2fs_sb_info *sbi, char *buf)</div><div class='add'>+{</div><div class='add'>+	return sysfs_emit(buf, "%x\n",</div><div class='add'>+		le16_to_cpu(F2FS_RAW_SUPER(sbi)-&gt;s_encoding_flags));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t effective_lookup_mode_show(struct f2fs_attr *a,</div><div class='add'>+		struct f2fs_sb_info *sbi, char *buf)</div><div class='add'>+{</div><div class='add'>+	switch (F2FS_OPTION(sbi).lookup_mode) {</div><div class='add'>+	case LOOKUP_PERF:</div><div class='add'>+		return sysfs_emit(buf, "perf\n");</div><div class='add'>+	case LOOKUP_COMPAT:</div><div class='add'>+		return sysfs_emit(buf, "compat\n");</div><div class='add'>+	case LOOKUP_AUTO:</div><div class='add'>+		if (sb_no_casefold_compat_fallback(sbi-&gt;sb))</div><div class='add'>+			return sysfs_emit(buf, "auto:perf\n");</div><div class='add'>+		return sysfs_emit(buf, "auto:compat\n");</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t mounted_time_sec_show(struct f2fs_attr *a,</div><div class='ctx'> 		struct f2fs_sb_info *sbi, char *buf)</div><div class='ctx'> {</div><div class='del'>-	return sprintf(buf, "%llu", SIT_I(sbi)-&gt;mounted_time);</div><div class='add'>+	return sysfs_emit(buf, "%llu\n", SIT_I(sbi)-&gt;mounted_time);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_F2FS_STAT_FS</div><div class='hunk'>@@ -217,7 +312,7 @@ static ssize_t moved_blocks_foreground_show(struct f2fs_attr *a,</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_stat_info *si = F2FS_STAT(sbi);</div><div class='ctx'> </div><div class='del'>-	return sprintf(buf, "%llu\n",</div><div class='add'>+	return sysfs_emit(buf, "%llu\n",</div><div class='ctx'> 		(unsigned long long)(si-&gt;tot_blks -</div><div class='ctx'> 			(si-&gt;bg_data_blks + si-&gt;bg_node_blks)));</div><div class='ctx'> }</div><div class='hunk'>@@ -227,7 +322,7 @@ static ssize_t moved_blocks_background_show(struct f2fs_attr *a,</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_stat_info *si = F2FS_STAT(sbi);</div><div class='ctx'> </div><div class='del'>-	return sprintf(buf, "%llu\n",</div><div class='add'>+	return sysfs_emit(buf, "%llu\n",</div><div class='ctx'> 		(unsigned long long)(si-&gt;bg_data_blks + si-&gt;bg_node_blks));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -238,7 +333,7 @@ static ssize_t avg_vblocks_show(struct f2fs_attr *a,</div><div class='ctx'> </div><div class='ctx'> 	si-&gt;dirty_count = dirty_segments(sbi);</div><div class='ctx'> 	f2fs_update_sit_info(sbi);</div><div class='del'>-	return sprintf(buf, "%llu\n", (unsigned long long)(si-&gt;avg_vblocks));</div><div class='add'>+	return sysfs_emit(buf, "%llu\n", (unsigned long long)(si-&gt;avg_vblocks));</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='hunk'>@@ -266,35 +361,27 @@ static ssize_t f2fs_sbi_show(struct f2fs_attr *a,</div><div class='ctx'> 		int hot_count = sbi-&gt;raw_super-&gt;hot_ext_count;</div><div class='ctx'> 		int len = 0, i;</div><div class='ctx'> </div><div class='del'>-		len += scnprintf(buf + len, PAGE_SIZE - len,</div><div class='del'>-						"cold file extension:\n");</div><div class='add'>+		len += sysfs_emit_at(buf, len, "cold file extension:\n");</div><div class='ctx'> 		for (i = 0; i &lt; cold_count; i++)</div><div class='del'>-			len += scnprintf(buf + len, PAGE_SIZE - len, "%s\n",</div><div class='del'>-								extlist[i]);</div><div class='add'>+			len += sysfs_emit_at(buf, len, "%s\n", extlist[i]);</div><div class='ctx'> </div><div class='del'>-		len += scnprintf(buf + len, PAGE_SIZE - len,</div><div class='del'>-						"hot file extension:\n");</div><div class='add'>+		len += sysfs_emit_at(buf, len, "hot file extension:\n");</div><div class='ctx'> 		for (i = cold_count; i &lt; cold_count + hot_count; i++)</div><div class='del'>-			len += scnprintf(buf + len, PAGE_SIZE - len, "%s\n",</div><div class='del'>-								extlist[i]);</div><div class='add'>+			len += sysfs_emit_at(buf, len, "%s\n", extlist[i]);</div><div class='add'>+</div><div class='ctx'> 		return len;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!strcmp(a-&gt;attr.name, "ckpt_thread_ioprio")) {</div><div class='ctx'> 		struct ckpt_req_control *cprc = &amp;sbi-&gt;cprc_info;</div><div class='del'>-		int len = 0;</div><div class='ctx'> 		int class = IOPRIO_PRIO_CLASS(cprc-&gt;ckpt_thread_ioprio);</div><div class='del'>-		int data = IOPRIO_PRIO_DATA(cprc-&gt;ckpt_thread_ioprio);</div><div class='add'>+		int level = IOPRIO_PRIO_LEVEL(cprc-&gt;ckpt_thread_ioprio);</div><div class='ctx'> </div><div class='del'>-		if (class == IOPRIO_CLASS_RT)</div><div class='del'>-			len += scnprintf(buf + len, PAGE_SIZE - len, "rt,");</div><div class='del'>-		else if (class == IOPRIO_CLASS_BE)</div><div class='del'>-			len += scnprintf(buf + len, PAGE_SIZE - len, "be,");</div><div class='del'>-		else</div><div class='add'>+		if (class != IOPRIO_CLASS_RT &amp;&amp; class != IOPRIO_CLASS_BE)</div><div class='ctx'> 			return -EINVAL;</div><div class='ctx'> </div><div class='del'>-		len += scnprintf(buf + len, PAGE_SIZE - len, "%d\n", data);</div><div class='del'>-		return len;</div><div class='add'>+		return sysfs_emit(buf, "%s,%d\n",</div><div class='add'>+			class == IOPRIO_CLASS_RT ? "rt" : "be", level);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='hunk'>@@ -316,9 +403,34 @@ static ssize_t f2fs_sbi_show(struct f2fs_attr *a,</div><div class='ctx'> 			sbi-&gt;gc_reclaimed_segs[sbi-&gt;gc_segment_mode]);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "current_atomic_write")) {</div><div class='add'>+		s64 current_write = atomic64_read(&amp;sbi-&gt;current_atomic_write);</div><div class='add'>+</div><div class='add'>+		return sysfs_emit(buf, "%lld\n", current_write);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "peak_atomic_write"))</div><div class='add'>+		return sysfs_emit(buf, "%lld\n", sbi-&gt;peak_atomic_write);</div><div class='add'>+</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "committed_atomic_block"))</div><div class='add'>+		return sysfs_emit(buf, "%llu\n", sbi-&gt;committed_atomic_block);</div><div class='add'>+</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "revoked_atomic_block"))</div><div class='add'>+		return sysfs_emit(buf, "%llu\n", sbi-&gt;revoked_atomic_block);</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_F2FS_STAT_FS</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "cp_foreground_calls"))</div><div class='add'>+		return sysfs_emit(buf, "%d\n",</div><div class='add'>+				atomic_read(&amp;sbi-&gt;cp_call_count[TOTAL_CALL]) -</div><div class='add'>+				atomic_read(&amp;sbi-&gt;cp_call_count[BACKGROUND]));</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "cp_background_calls"))</div><div class='add'>+		return sysfs_emit(buf, "%d\n",</div><div class='add'>+				atomic_read(&amp;sbi-&gt;cp_call_count[BACKGROUND]));</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> 	ui = (unsigned int *)(ptr + a-&gt;offset);</div><div class='ctx'> </div><div class='del'>-	return sprintf(buf, "%u\n", *ui);</div><div class='add'>+	return sysfs_emit(buf, "%u\n", *ui);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t __sbi_store(struct f2fs_attr *a,</div><div class='hunk'>@@ -355,7 +467,7 @@ static ssize_t __sbi_store(struct f2fs_attr *a,</div><div class='ctx'> 		if (!strlen(name) || strlen(name) &gt;= F2FS_EXTENSION_LEN)</div><div class='ctx'> 			return -EINVAL;</div><div class='ctx'> </div><div class='del'>-		down_write(&amp;sbi-&gt;sb_lock);</div><div class='add'>+		f2fs_down_write(&amp;sbi-&gt;sb_lock);</div><div class='ctx'> </div><div class='ctx'> 		ret = f2fs_update_extension_list(sbi, name, hot, set);</div><div class='ctx'> 		if (ret)</div><div class='hunk'>@@ -365,7 +477,7 @@ static ssize_t __sbi_store(struct f2fs_attr *a,</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			f2fs_update_extension_list(sbi, name, hot, !set);</div><div class='ctx'> out:</div><div class='del'>-		up_write(&amp;sbi-&gt;sb_lock);</div><div class='add'>+		f2fs_up_write(&amp;sbi-&gt;sb_lock);</div><div class='ctx'> 		return ret ? ret : count;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -373,7 +485,7 @@ out:</div><div class='ctx'> 		const char *name = strim((char *)buf);</div><div class='ctx'> 		struct ckpt_req_control *cprc = &amp;sbi-&gt;cprc_info;</div><div class='ctx'> 		int class;</div><div class='del'>-		long data;</div><div class='add'>+		long level;</div><div class='ctx'> 		int ret;</div><div class='ctx'> </div><div class='ctx'> 		if (!strncmp(name, "rt,", 3))</div><div class='hunk'>@@ -384,13 +496,13 @@ out:</div><div class='ctx'> 			return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 		name += 3;</div><div class='del'>-		ret = kstrtol(name, 10, &amp;data);</div><div class='add'>+		ret = kstrtol(name, 10, &amp;level);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='del'>-		if (data &gt;= IOPRIO_NR_LEVELS || data &lt; 0)</div><div class='add'>+		if (level &gt;= IOPRIO_NR_LEVELS || level &lt; 0)</div><div class='ctx'> 			return -EINVAL;</div><div class='ctx'> </div><div class='del'>-		cprc-&gt;ckpt_thread_ioprio = IOPRIO_PRIO_VALUE(class, data);</div><div class='add'>+		cprc-&gt;ckpt_thread_ioprio = IOPRIO_PRIO_VALUE(class, level);</div><div class='ctx'> 		if (test_opt(sbi, MERGE_CHECKPOINT)) {</div><div class='ctx'> 			ret = set_task_ioprio(cprc-&gt;f2fs_issue_ckpt,</div><div class='ctx'> 					cprc-&gt;ckpt_thread_ioprio);</div><div class='hunk'>@@ -407,10 +519,16 @@ out:</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> #ifdef CONFIG_F2FS_FAULT_INJECTION</div><div class='del'>-	if (a-&gt;struct_type == FAULT_INFO_TYPE &amp;&amp; t &gt;= (1 &lt;&lt; FAULT_MAX))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (a-&gt;struct_type == FAULT_INFO_RATE &amp;&amp; t &gt;= UINT_MAX)</div><div class='del'>-		return -EINVAL;</div><div class='add'>+	if (a-&gt;struct_type == FAULT_INFO_TYPE) {</div><div class='add'>+		if (f2fs_build_fault_attr(sbi, 0, t, FAULT_TYPE))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='add'>+	if (a-&gt;struct_type == FAULT_INFO_RATE) {</div><div class='add'>+		if (f2fs_build_fault_attr(sbi, t, 0, FAULT_RATE))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='ctx'> #endif</div><div class='ctx'> 	if (a-&gt;struct_type == RESERVED_BLOCKS) {</div><div class='ctx'> 		spin_lock(&amp;sbi-&gt;stat_lock);</div><div class='hunk'>@@ -426,6 +544,17 @@ out:</div><div class='ctx'> 		return count;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "discard_io_aware_gran")) {</div><div class='add'>+		if (t &gt; MAX_PLIST_NUM)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		if (!f2fs_block_unit_discard(sbi))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		if (t == *ui)</div><div class='add'>+			return count;</div><div class='add'>+		*ui = t;</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (!strcmp(a-&gt;attr.name, "discard_granularity")) {</div><div class='ctx'> 		if (t == 0 || t &gt; MAX_PLIST_NUM)</div><div class='ctx'> 			return -EINVAL;</div><div class='hunk'>@@ -437,13 +566,38 @@ out:</div><div class='ctx'> 		return count;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "max_ordered_discard")) {</div><div class='add'>+		if (t == 0 || t &gt; MAX_PLIST_NUM)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		if (!f2fs_block_unit_discard(sbi))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		*ui = t;</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "discard_urgent_util")) {</div><div class='add'>+		if (t &gt; 100)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		*ui = t;</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "discard_io_aware")) {</div><div class='add'>+		if (t &gt;= DPOLICY_IO_AWARE_MAX)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		*ui = t;</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (!strcmp(a-&gt;attr.name, "migration_granularity")) {</div><div class='del'>-		if (t == 0 || t &gt; sbi-&gt;segs_per_sec)</div><div class='add'>+		if (t == 0 || t &gt; SEGS_PER_SEC(sbi))</div><div class='ctx'> 			return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!strcmp(a-&gt;attr.name, "trim_sections"))</div><div class='del'>-		return -EINVAL;</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "migration_window_granularity")) {</div><div class='add'>+		if (t == 0 || t &gt; SEGS_PER_SEC(sbi))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (!strcmp(a-&gt;attr.name, "gc_urgent")) {</div><div class='ctx'> 		if (t == 0) {</div><div class='hunk'>@@ -451,13 +605,20 @@ out:</div><div class='ctx'> 		} else if (t == 1) {</div><div class='ctx'> 			sbi-&gt;gc_mode = GC_URGENT_HIGH;</div><div class='ctx'> 			if (sbi-&gt;gc_thread) {</div><div class='del'>-				sbi-&gt;gc_thread-&gt;gc_wake = 1;</div><div class='add'>+				sbi-&gt;gc_thread-&gt;gc_wake = true;</div><div class='ctx'> 				wake_up_interruptible_all(</div><div class='ctx'> 					&amp;sbi-&gt;gc_thread-&gt;gc_wait_queue_head);</div><div class='ctx'> 				wake_up_discard_thread(sbi, true);</div><div class='ctx'> 			}</div><div class='ctx'> 		} else if (t == 2) {</div><div class='ctx'> 			sbi-&gt;gc_mode = GC_URGENT_LOW;</div><div class='add'>+		} else if (t == 3) {</div><div class='add'>+			sbi-&gt;gc_mode = GC_URGENT_MID;</div><div class='add'>+			if (sbi-&gt;gc_thread) {</div><div class='add'>+				sbi-&gt;gc_thread-&gt;gc_wake = true;</div><div class='add'>+				wake_up_interruptible_all(</div><div class='add'>+					&amp;sbi-&gt;gc_thread-&gt;gc_wait_queue_head);</div><div class='add'>+			}</div><div class='ctx'> 		} else {</div><div class='ctx'> 			return -EINVAL;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -471,13 +632,42 @@ out:</div><div class='ctx'> 		} else if (t == GC_IDLE_AT) {</div><div class='ctx'> 			if (!sbi-&gt;am.atgc_enabled)</div><div class='ctx'> 				return -EINVAL;</div><div class='del'>-			sbi-&gt;gc_mode = GC_AT;</div><div class='add'>+			sbi-&gt;gc_mode = GC_IDLE_AT;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			sbi-&gt;gc_mode = GC_NORMAL;</div><div class='ctx'> 		}</div><div class='ctx'> 		return count;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "gc_remaining_trials")) {</div><div class='add'>+		spin_lock(&amp;sbi-&gt;gc_remaining_trials_lock);</div><div class='add'>+		sbi-&gt;gc_remaining_trials = t;</div><div class='add'>+		spin_unlock(&amp;sbi-&gt;gc_remaining_trials_lock);</div><div class='add'>+</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "gc_no_zoned_gc_percent")) {</div><div class='add'>+		if (t &gt; 100)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		*ui = (unsigned int)t;</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "gc_boost_zoned_gc_percent")) {</div><div class='add'>+		if (t &gt; 100)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		*ui = (unsigned int)t;</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "gc_valid_thresh_ratio")) {</div><div class='add'>+		if (t &gt; 100)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		*ui = (unsigned int)t;</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> #ifdef CONFIG_F2FS_IOSTAT</div><div class='ctx'> 	if (!strcmp(a-&gt;attr.name, "iostat_enable")) {</div><div class='ctx'> 		sbi-&gt;iostat_enable = !!t;</div><div class='hunk'>@@ -489,9 +679,18 @@ out:</div><div class='ctx'> 	if (!strcmp(a-&gt;attr.name, "iostat_period_ms")) {</div><div class='ctx'> 		if (t &lt; MIN_IOSTAT_PERIOD_MS || t &gt; MAX_IOSTAT_PERIOD_MS)</div><div class='ctx'> 			return -EINVAL;</div><div class='del'>-		spin_lock(&amp;sbi-&gt;iostat_lock);</div><div class='add'>+		spin_lock_irq(&amp;sbi-&gt;iostat_lock);</div><div class='ctx'> 		sbi-&gt;iostat_period_ms = (unsigned int)t;</div><div class='del'>-		spin_unlock(&amp;sbi-&gt;iostat_lock);</div><div class='add'>+		spin_unlock_irq(&amp;sbi-&gt;iostat_lock);</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BLK_DEV_ZONED</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "blkzone_alloc_policy")) {</div><div class='add'>+		if (t &lt; BLKZONE_ALLOC_PRIOR_SEQ || t &gt; BLKZONE_ALLOC_PRIOR_CONV)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		sbi-&gt;blkzone_alloc_policy = t;</div><div class='ctx'> 		return count;</div><div class='ctx'> 	}</div><div class='ctx'> #endif</div><div class='hunk'>@@ -512,6 +711,20 @@ out:</div><div class='ctx'> 		sbi-&gt;compr_new_inode = 0;</div><div class='ctx'> 		return count;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "compress_percent")) {</div><div class='add'>+		if (t == 0 || t &gt; 100)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		*ui = t;</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "compress_watermark")) {</div><div class='add'>+		if (t == 0 || t &gt; 100)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		*ui = t;</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> 	if (!strcmp(a-&gt;attr.name, "atgc_candidate_ratio")) {</div><div class='hunk'>@@ -536,6 +749,13 @@ out:</div><div class='ctx'> 		return count;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "gc_pin_file_threshold")) {</div><div class='add'>+		if (t &gt; MAX_GC_FAILED_PINNED_FILES)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		sbi-&gt;gc_pin_file_threshold = t;</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (!strcmp(a-&gt;attr.name, "gc_reclaimed_segments")) {</div><div class='ctx'> 		if (t != 0)</div><div class='ctx'> 			return -EINVAL;</div><div class='hunk'>@@ -567,6 +787,125 @@ out:</div><div class='ctx'> 		return count;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "peak_atomic_write")) {</div><div class='add'>+		if (t != 0)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		sbi-&gt;peak_atomic_write = 0;</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "committed_atomic_block")) {</div><div class='add'>+		if (t != 0)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		sbi-&gt;committed_atomic_block = 0;</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "revoked_atomic_block")) {</div><div class='add'>+		if (t != 0)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		sbi-&gt;revoked_atomic_block = 0;</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "readdir_ra")) {</div><div class='add'>+		sbi-&gt;readdir_ra = !!t;</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "hot_data_age_threshold")) {</div><div class='add'>+		if (t == 0 || t &gt;= sbi-&gt;warm_data_age_threshold)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		if (t == *ui)</div><div class='add'>+			return count;</div><div class='add'>+		*ui = (unsigned int)t;</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "warm_data_age_threshold")) {</div><div class='add'>+		if (t &lt;= sbi-&gt;hot_data_age_threshold)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		if (t == *ui)</div><div class='add'>+			return count;</div><div class='add'>+		*ui = (unsigned int)t;</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "last_age_weight")) {</div><div class='add'>+		if (t &gt; 100)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		if (t == *ui)</div><div class='add'>+			return count;</div><div class='add'>+		*ui = (unsigned int)t;</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "max_read_extent_count")) {</div><div class='add'>+		if (t &gt; UINT_MAX)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		*ui = (unsigned int)t;</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "ipu_policy")) {</div><div class='add'>+		if (t &gt;= BIT(F2FS_IPU_MAX))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		/* allow F2FS_IPU_NOCACHE only for IPU in the pinned file */</div><div class='add'>+		if (f2fs_lfs_mode(sbi) &amp;&amp; (t &amp; ~BIT(F2FS_IPU_NOCACHE)))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		SM_I(sbi)-&gt;ipu_policy = (unsigned int)t;</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "dir_level")) {</div><div class='add'>+		if (t &gt; MAX_DIR_HASH_DEPTH)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		sbi-&gt;dir_level = t;</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "reserved_pin_section")) {</div><div class='add'>+		if (t &gt; GET_SEC_FROM_SEG(sbi, overprovision_segments(sbi)))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		*ui = (unsigned int)t;</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "gc_boost_gc_multiple")) {</div><div class='add'>+		if (t &lt; 1 || t &gt; SEGS_PER_SEC(sbi))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		sbi-&gt;gc_thread-&gt;boost_gc_multiple = (unsigned int)t;</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "gc_boost_gc_greedy")) {</div><div class='add'>+		if (t &gt; GC_GREEDY)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		sbi-&gt;gc_thread-&gt;boost_gc_greedy = (unsigned int)t;</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "bggc_io_aware")) {</div><div class='add'>+		if (t &lt; AWARE_ALL_IO || t &gt; AWARE_NONE)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		sbi-&gt;bggc_io_aware = t;</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "allocate_section_hint")) {</div><div class='add'>+		if (t &lt; 0 || t &gt; MAIN_SECS(sbi))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		sbi-&gt;allocate_section_hint = t;</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "allocate_section_policy")) {</div><div class='add'>+		if (t &lt; ALLOCATE_FORWARD_NOHINT || t &gt; ALLOCATE_FORWARD_FROM_HINT)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		sbi-&gt;allocate_section_policy = t;</div><div class='add'>+		return count;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	*ui = (unsigned int)t;</div><div class='ctx'> </div><div class='ctx'> 	return count;</div><div class='hunk'>@@ -618,6 +957,25 @@ static void f2fs_sb_release(struct kobject *kobj)</div><div class='ctx'> 	complete(&amp;sbi-&gt;s_kobj_unregister);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static ssize_t f2fs_base_attr_show(struct kobject *kobj,</div><div class='add'>+				struct attribute *attr, char *buf)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_base_attr *a = container_of(attr,</div><div class='add'>+				struct f2fs_base_attr, attr);</div><div class='add'>+</div><div class='add'>+	return a-&gt;show ? a-&gt;show(a, buf) : 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t f2fs_base_attr_store(struct kobject *kobj,</div><div class='add'>+				struct attribute *attr,</div><div class='add'>+				const char *buf, size_t len)</div><div class='add'>+{</div><div class='add'>+	struct f2fs_base_attr *a = container_of(attr,</div><div class='add'>+				struct f2fs_base_attr, attr);</div><div class='add'>+</div><div class='add'>+	return a-&gt;store ? a-&gt;store(a, buf, len) : 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Note that there are three feature list entries:</div><div class='ctx'>  * 1) /sys/fs/f2fs/features</div><div class='hunk'>@@ -636,24 +994,56 @@ static void f2fs_sb_release(struct kobject *kobj)</div><div class='ctx'>  *     please add new on-disk feature in this list only.</div><div class='ctx'>  *     - ref. F2FS_SB_FEATURE_RO_ATTR()</div><div class='ctx'>  */</div><div class='del'>-static ssize_t f2fs_feature_show(struct f2fs_attr *a,</div><div class='del'>-		struct f2fs_sb_info *sbi, char *buf)</div><div class='add'>+static ssize_t f2fs_feature_show(struct f2fs_base_attr *a, char *buf)</div><div class='ctx'> {</div><div class='del'>-	return sprintf(buf, "supported\n");</div><div class='add'>+	return sysfs_emit(buf, "supported\n");</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #define F2FS_FEATURE_RO_ATTR(_name)				\</div><div class='del'>-static struct f2fs_attr f2fs_attr_##_name = {			\</div><div class='add'>+static struct f2fs_base_attr f2fs_base_attr_##_name = {		\</div><div class='ctx'> 	.attr = {.name = __stringify(_name), .mode = 0444 },	\</div><div class='ctx'> 	.show	= f2fs_feature_show,				\</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static ssize_t f2fs_tune_show(struct f2fs_base_attr *a, char *buf)</div><div class='add'>+{</div><div class='add'>+	unsigned int res = 0;</div><div class='add'>+</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "reclaim_caches_kb"))</div><div class='add'>+		res = f2fs_donate_files();</div><div class='add'>+</div><div class='add'>+	return sysfs_emit(buf, "%u\n", res);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t f2fs_tune_store(struct f2fs_base_attr *a,</div><div class='add'>+			const char *buf, size_t count)</div><div class='add'>+{</div><div class='add'>+	unsigned long t;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = kstrtoul(skip_spaces(buf), 0, &amp;t);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	if (!strcmp(a-&gt;attr.name, "reclaim_caches_kb"))</div><div class='add'>+		f2fs_reclaim_caches(t);</div><div class='add'>+</div><div class='add'>+	return count;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define F2FS_TUNE_RW_ATTR(_name)				\</div><div class='add'>+static struct f2fs_base_attr f2fs_base_attr_##_name = {		\</div><div class='add'>+	.attr = {.name = __stringify(_name), .mode = 0644 },	\</div><div class='add'>+	.show	= f2fs_tune_show,				\</div><div class='add'>+	.store	= f2fs_tune_store,				\</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static ssize_t f2fs_sb_feature_show(struct f2fs_attr *a,</div><div class='ctx'> 		struct f2fs_sb_info *sbi, char *buf)</div><div class='ctx'> {</div><div class='ctx'> 	if (F2FS_HAS_FEATURE(sbi, a-&gt;id))</div><div class='del'>-		return sprintf(buf, "supported\n");</div><div class='del'>-	return sprintf(buf, "unsupported\n");</div><div class='add'>+		return sysfs_emit(buf, "supported\n");</div><div class='add'>+	return sysfs_emit(buf, "unsupported\n");</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #define F2FS_SB_FEATURE_RO_ATTR(_name, _feat)			\</div><div class='hunk'>@@ -672,6 +1062,11 @@ static struct f2fs_attr f2fs_attr_##_name = {			\</div><div class='ctx'> 	.offset = _offset					\</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#define F2FS_RO_ATTR(struct_type, struct_name, name, elname)	\</div><div class='add'>+	F2FS_ATTR_OFFSET(struct_type, name, 0444,		\</div><div class='add'>+		f2fs_sbi_show, NULL,				\</div><div class='add'>+		offsetof(struct struct_name, elname))</div><div class='add'>+</div><div class='ctx'> #define F2FS_RW_ATTR(struct_type, struct_name, name, elname)	\</div><div class='ctx'> 	F2FS_ATTR_OFFSET(struct_type, name, 0644,		\</div><div class='ctx'> 		f2fs_sbi_show, f2fs_sbi_store,			\</div><div class='hunk'>@@ -680,60 +1075,177 @@ static struct f2fs_attr f2fs_attr_##_name = {			\</div><div class='ctx'> #define F2FS_GENERAL_RO_ATTR(name) \</div><div class='ctx'> static struct f2fs_attr f2fs_attr_##name = __ATTR(name, 0444, name##_show, NULL)</div><div class='ctx'> </div><div class='del'>-#define F2FS_STAT_ATTR(_struct_type, _struct_name, _name, _elname)	\</div><div class='del'>-static struct f2fs_attr f2fs_attr_##_name = {			\</div><div class='del'>-	.attr = {.name = __stringify(_name), .mode = 0444 },	\</div><div class='del'>-	.show = f2fs_sbi_show,					\</div><div class='del'>-	.struct_type = _struct_type,				\</div><div class='del'>-	.offset = offsetof(struct _struct_name, _elname),       \</div><div class='del'>-}</div><div class='add'>+#ifdef CONFIG_F2FS_STAT_FS</div><div class='add'>+#define STAT_INFO_RO_ATTR(name, elname)				\</div><div class='add'>+	F2FS_RO_ATTR(STAT_INFO, f2fs_stat_info, name, elname)</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='del'>-F2FS_RW_ATTR(GC_THREAD, f2fs_gc_kthread, gc_urgent_sleep_time,</div><div class='del'>-							urgent_sleep_time);</div><div class='del'>-F2FS_RW_ATTR(GC_THREAD, f2fs_gc_kthread, gc_min_sleep_time, min_sleep_time);</div><div class='del'>-F2FS_RW_ATTR(GC_THREAD, f2fs_gc_kthread, gc_max_sleep_time, max_sleep_time);</div><div class='del'>-F2FS_RW_ATTR(GC_THREAD, f2fs_gc_kthread, gc_no_gc_sleep_time, no_gc_sleep_time);</div><div class='del'>-F2FS_RW_ATTR(F2FS_SBI, f2fs_sb_info, gc_idle, gc_mode);</div><div class='del'>-F2FS_RW_ATTR(F2FS_SBI, f2fs_sb_info, gc_urgent, gc_mode);</div><div class='del'>-F2FS_RW_ATTR(SM_INFO, f2fs_sm_info, reclaim_segments, rec_prefree_segments);</div><div class='del'>-F2FS_RW_ATTR(DCC_INFO, discard_cmd_control, max_small_discards, max_discards);</div><div class='del'>-F2FS_RW_ATTR(DCC_INFO, discard_cmd_control, discard_granularity, discard_granularity);</div><div class='del'>-F2FS_RW_ATTR(RESERVED_BLOCKS, f2fs_sb_info, reserved_blocks, reserved_blocks);</div><div class='del'>-F2FS_RW_ATTR(SM_INFO, f2fs_sm_info, batched_trim_sections, trim_sections);</div><div class='del'>-F2FS_RW_ATTR(SM_INFO, f2fs_sm_info, ipu_policy, ipu_policy);</div><div class='del'>-F2FS_RW_ATTR(SM_INFO, f2fs_sm_info, min_ipu_util, min_ipu_util);</div><div class='del'>-F2FS_RW_ATTR(SM_INFO, f2fs_sm_info, min_fsync_blocks, min_fsync_blocks);</div><div class='del'>-F2FS_RW_ATTR(SM_INFO, f2fs_sm_info, min_seq_blocks, min_seq_blocks);</div><div class='del'>-F2FS_RW_ATTR(SM_INFO, f2fs_sm_info, min_hot_blocks, min_hot_blocks);</div><div class='del'>-F2FS_RW_ATTR(SM_INFO, f2fs_sm_info, min_ssr_sections, min_ssr_sections);</div><div class='del'>-F2FS_RW_ATTR(NM_INFO, f2fs_nm_info, ram_thresh, ram_thresh);</div><div class='del'>-F2FS_RW_ATTR(NM_INFO, f2fs_nm_info, ra_nid_pages, ra_nid_pages);</div><div class='del'>-F2FS_RW_ATTR(NM_INFO, f2fs_nm_info, dirty_nats_ratio, dirty_nats_ratio);</div><div class='del'>-F2FS_RW_ATTR(F2FS_SBI, f2fs_sb_info, max_victim_search, max_victim_search);</div><div class='del'>-F2FS_RW_ATTR(F2FS_SBI, f2fs_sb_info, migration_granularity, migration_granularity);</div><div class='del'>-F2FS_RW_ATTR(F2FS_SBI, f2fs_sb_info, dir_level, dir_level);</div><div class='del'>-F2FS_RW_ATTR(F2FS_SBI, f2fs_sb_info, cp_interval, interval_time[CP_TIME]);</div><div class='del'>-F2FS_RW_ATTR(F2FS_SBI, f2fs_sb_info, idle_interval, interval_time[REQ_TIME]);</div><div class='del'>-F2FS_RW_ATTR(F2FS_SBI, f2fs_sb_info, discard_idle_interval,</div><div class='del'>-					interval_time[DISCARD_TIME]);</div><div class='del'>-F2FS_RW_ATTR(F2FS_SBI, f2fs_sb_info, gc_idle_interval, interval_time[GC_TIME]);</div><div class='del'>-F2FS_RW_ATTR(F2FS_SBI, f2fs_sb_info,</div><div class='del'>-		umount_discard_timeout, interval_time[UMOUNT_DISCARD_TIMEOUT]);</div><div class='del'>-#ifdef CONFIG_F2FS_IOSTAT</div><div class='del'>-F2FS_RW_ATTR(F2FS_SBI, f2fs_sb_info, iostat_enable, iostat_enable);</div><div class='del'>-F2FS_RW_ATTR(F2FS_SBI, f2fs_sb_info, iostat_period_ms, iostat_period_ms);</div><div class='add'>+#define GC_THREAD_RW_ATTR(name, elname)				\</div><div class='add'>+	F2FS_RW_ATTR(GC_THREAD, f2fs_gc_kthread, name, elname)</div><div class='add'>+</div><div class='add'>+#define SM_INFO_RW_ATTR(name, elname)				\</div><div class='add'>+	F2FS_RW_ATTR(SM_INFO, f2fs_sm_info, name, elname)</div><div class='add'>+</div><div class='add'>+#define SM_INFO_GENERAL_RW_ATTR(elname)				\</div><div class='add'>+	SM_INFO_RW_ATTR(elname, elname)</div><div class='add'>+</div><div class='add'>+#define DCC_INFO_RW_ATTR(name, elname)				\</div><div class='add'>+	F2FS_RW_ATTR(DCC_INFO, discard_cmd_control, name, elname)</div><div class='add'>+</div><div class='add'>+#define DCC_INFO_GENERAL_RW_ATTR(elname)			\</div><div class='add'>+	DCC_INFO_RW_ATTR(elname, elname)</div><div class='add'>+</div><div class='add'>+#define NM_INFO_RW_ATTR(name, elname)				\</div><div class='add'>+	F2FS_RW_ATTR(NM_INFO, f2fs_nm_info, name, elname)</div><div class='add'>+</div><div class='add'>+#define NM_INFO_GENERAL_RW_ATTR(elname)				\</div><div class='add'>+	NM_INFO_RW_ATTR(elname, elname)</div><div class='add'>+</div><div class='add'>+#define F2FS_SBI_RW_ATTR(name, elname)				\</div><div class='add'>+	F2FS_RW_ATTR(F2FS_SBI, f2fs_sb_info, name, elname)</div><div class='add'>+</div><div class='add'>+#define F2FS_SBI_GENERAL_RW_ATTR(elname)			\</div><div class='add'>+	F2FS_SBI_RW_ATTR(elname, elname)</div><div class='add'>+</div><div class='add'>+#define F2FS_SBI_GENERAL_RO_ATTR(elname)			\</div><div class='add'>+	F2FS_RO_ATTR(F2FS_SBI, f2fs_sb_info, elname, elname)</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_F2FS_FAULT_INJECTION</div><div class='add'>+#define FAULT_INFO_GENERAL_RW_ATTR(type, elname)		\</div><div class='add'>+	F2FS_RW_ATTR(type, f2fs_fault_info, elname, elname)</div><div class='ctx'> #endif</div><div class='del'>-F2FS_RW_ATTR(F2FS_SBI, f2fs_sb_info, readdir_ra, readdir_ra);</div><div class='del'>-F2FS_RW_ATTR(F2FS_SBI, f2fs_sb_info, max_io_bytes, max_io_bytes);</div><div class='del'>-F2FS_RW_ATTR(F2FS_SBI, f2fs_sb_info, gc_pin_file_thresh, gc_pin_file_threshold);</div><div class='add'>+</div><div class='add'>+#define RESERVED_BLOCKS_GENERAL_RW_ATTR(elname)			\</div><div class='add'>+	F2FS_RW_ATTR(RESERVED_BLOCKS, f2fs_sb_info, elname, elname)</div><div class='add'>+</div><div class='add'>+#define CPRC_INFO_GENERAL_RW_ATTR(elname)			\</div><div class='add'>+	F2FS_RW_ATTR(CPRC_INFO, ckpt_req_control, elname, elname)</div><div class='add'>+</div><div class='add'>+#define ATGC_INFO_RW_ATTR(name, elname)				\</div><div class='add'>+	F2FS_RW_ATTR(ATGC_INFO, atgc_management, name, elname)</div><div class='add'>+</div><div class='add'>+/* GC_THREAD ATTR */</div><div class='add'>+GC_THREAD_RW_ATTR(gc_urgent_sleep_time, urgent_sleep_time);</div><div class='add'>+GC_THREAD_RW_ATTR(gc_min_sleep_time, min_sleep_time);</div><div class='add'>+GC_THREAD_RW_ATTR(gc_max_sleep_time, max_sleep_time);</div><div class='add'>+GC_THREAD_RW_ATTR(gc_no_gc_sleep_time, no_gc_sleep_time);</div><div class='add'>+GC_THREAD_RW_ATTR(gc_no_zoned_gc_percent, no_zoned_gc_percent);</div><div class='add'>+GC_THREAD_RW_ATTR(gc_boost_zoned_gc_percent, boost_zoned_gc_percent);</div><div class='add'>+GC_THREAD_RW_ATTR(gc_valid_thresh_ratio, valid_thresh_ratio);</div><div class='add'>+GC_THREAD_RW_ATTR(gc_boost_gc_multiple, boost_gc_multiple);</div><div class='add'>+GC_THREAD_RW_ATTR(gc_boost_gc_greedy, boost_gc_greedy);</div><div class='add'>+</div><div class='add'>+/* SM_INFO ATTR */</div><div class='add'>+SM_INFO_RW_ATTR(reclaim_segments, rec_prefree_segments);</div><div class='add'>+SM_INFO_GENERAL_RW_ATTR(ipu_policy);</div><div class='add'>+SM_INFO_GENERAL_RW_ATTR(min_ipu_util);</div><div class='add'>+SM_INFO_GENERAL_RW_ATTR(min_fsync_blocks);</div><div class='add'>+SM_INFO_GENERAL_RW_ATTR(min_seq_blocks);</div><div class='add'>+SM_INFO_GENERAL_RW_ATTR(min_hot_blocks);</div><div class='add'>+SM_INFO_GENERAL_RW_ATTR(min_ssr_sections);</div><div class='add'>+SM_INFO_GENERAL_RW_ATTR(reserved_segments);</div><div class='add'>+</div><div class='add'>+/* DCC_INFO ATTR */</div><div class='add'>+DCC_INFO_RW_ATTR(max_small_discards, max_discards);</div><div class='add'>+DCC_INFO_GENERAL_RW_ATTR(max_discard_request);</div><div class='add'>+DCC_INFO_GENERAL_RW_ATTR(min_discard_issue_time);</div><div class='add'>+DCC_INFO_GENERAL_RW_ATTR(mid_discard_issue_time);</div><div class='add'>+DCC_INFO_GENERAL_RW_ATTR(max_discard_issue_time);</div><div class='add'>+DCC_INFO_GENERAL_RW_ATTR(discard_io_aware_gran);</div><div class='add'>+DCC_INFO_GENERAL_RW_ATTR(discard_urgent_util);</div><div class='add'>+DCC_INFO_GENERAL_RW_ATTR(discard_granularity);</div><div class='add'>+DCC_INFO_GENERAL_RW_ATTR(max_ordered_discard);</div><div class='add'>+DCC_INFO_GENERAL_RW_ATTR(discard_io_aware);</div><div class='add'>+</div><div class='add'>+/* NM_INFO ATTR */</div><div class='add'>+NM_INFO_RW_ATTR(max_roll_forward_node_blocks, max_rf_node_blocks);</div><div class='add'>+NM_INFO_GENERAL_RW_ATTR(ram_thresh);</div><div class='add'>+NM_INFO_GENERAL_RW_ATTR(ra_nid_pages);</div><div class='add'>+NM_INFO_GENERAL_RW_ATTR(dirty_nats_ratio);</div><div class='add'>+</div><div class='add'>+/* F2FS_SBI ATTR */</div><div class='ctx'> F2FS_RW_ATTR(F2FS_SBI, f2fs_super_block, extension_list, extension_list);</div><div class='add'>+F2FS_SBI_RW_ATTR(gc_idle, gc_mode);</div><div class='add'>+F2FS_SBI_RW_ATTR(gc_urgent, gc_mode);</div><div class='add'>+F2FS_SBI_RW_ATTR(cp_interval, interval_time[CP_TIME]);</div><div class='add'>+F2FS_SBI_RW_ATTR(idle_interval, interval_time[REQ_TIME]);</div><div class='add'>+F2FS_SBI_RW_ATTR(discard_idle_interval, interval_time[DISCARD_TIME]);</div><div class='add'>+F2FS_SBI_RW_ATTR(gc_idle_interval, interval_time[GC_TIME]);</div><div class='add'>+F2FS_SBI_RW_ATTR(umount_discard_timeout, interval_time[UMOUNT_DISCARD_TIMEOUT]);</div><div class='add'>+F2FS_SBI_RW_ATTR(gc_pin_file_thresh, gc_pin_file_threshold);</div><div class='add'>+F2FS_SBI_RW_ATTR(gc_reclaimed_segments, gc_reclaimed_segs);</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(max_victim_search);</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(migration_granularity);</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(migration_window_granularity);</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(dir_level);</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(allocate_section_hint);</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(allocate_section_policy);</div><div class='add'>+#ifdef CONFIG_F2FS_IOSTAT</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(iostat_enable);</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(iostat_period_ms);</div><div class='add'>+#endif</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(readdir_ra);</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(max_io_bytes);</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(data_io_flag);</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(node_io_flag);</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(gc_remaining_trials);</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(seq_file_ra_mul);</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(gc_segment_mode);</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(max_fragment_chunk);</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(max_fragment_hole);</div><div class='add'>+#ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(compr_written_block);</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(compr_saved_block);</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(compr_new_inode);</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(compress_percent);</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(compress_watermark);</div><div class='add'>+#endif</div><div class='add'>+/* atomic write */</div><div class='add'>+F2FS_SBI_GENERAL_RO_ATTR(current_atomic_write);</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(peak_atomic_write);</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(committed_atomic_block);</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(revoked_atomic_block);</div><div class='add'>+/* block age extent cache */</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(hot_data_age_threshold);</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(warm_data_age_threshold);</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(last_age_weight);</div><div class='add'>+/* read extent cache */</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(max_read_extent_count);</div><div class='add'>+#ifdef CONFIG_BLK_DEV_ZONED</div><div class='add'>+F2FS_SBI_GENERAL_RO_ATTR(unusable_blocks_per_sec);</div><div class='add'>+F2FS_SBI_GENERAL_RO_ATTR(max_open_zones);</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(blkzone_alloc_policy);</div><div class='add'>+#endif</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(carve_out);</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(reserved_pin_section);</div><div class='add'>+F2FS_SBI_GENERAL_RW_ATTR(bggc_io_aware);</div><div class='add'>+</div><div class='add'>+/* STAT_INFO ATTR */</div><div class='add'>+#ifdef CONFIG_F2FS_STAT_FS</div><div class='add'>+STAT_INFO_RO_ATTR(cp_foreground_calls, cp_call_count[FOREGROUND]);</div><div class='add'>+STAT_INFO_RO_ATTR(cp_background_calls, cp_call_count[BACKGROUND]);</div><div class='add'>+STAT_INFO_RO_ATTR(gc_foreground_calls, gc_call_count[FOREGROUND]);</div><div class='add'>+STAT_INFO_RO_ATTR(gc_background_calls, gc_call_count[BACKGROUND]);</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+/* FAULT_INFO ATTR */</div><div class='ctx'> #ifdef CONFIG_F2FS_FAULT_INJECTION</div><div class='del'>-F2FS_RW_ATTR(FAULT_INFO_RATE, f2fs_fault_info, inject_rate, inject_rate);</div><div class='del'>-F2FS_RW_ATTR(FAULT_INFO_TYPE, f2fs_fault_info, inject_type, inject_type);</div><div class='add'>+FAULT_INFO_GENERAL_RW_ATTR(FAULT_INFO_RATE, inject_rate);</div><div class='add'>+FAULT_INFO_GENERAL_RW_ATTR(FAULT_INFO_TYPE, inject_type);</div><div class='ctx'> #endif</div><div class='del'>-F2FS_RW_ATTR(F2FS_SBI, f2fs_sb_info, data_io_flag, data_io_flag);</div><div class='del'>-F2FS_RW_ATTR(F2FS_SBI, f2fs_sb_info, node_io_flag, node_io_flag);</div><div class='del'>-F2FS_RW_ATTR(CPRC_INFO, ckpt_req_control, ckpt_thread_ioprio, ckpt_thread_ioprio);</div><div class='add'>+</div><div class='add'>+/* RESERVED_BLOCKS ATTR */</div><div class='add'>+RESERVED_BLOCKS_GENERAL_RW_ATTR(reserved_blocks);</div><div class='add'>+</div><div class='add'>+/* CPRC_INFO ATTR */</div><div class='add'>+CPRC_INFO_GENERAL_RW_ATTR(ckpt_thread_ioprio);</div><div class='add'>+</div><div class='add'>+/* ATGC_INFO ATTR */</div><div class='add'>+ATGC_INFO_RW_ATTR(atgc_candidate_ratio, candidate_ratio);</div><div class='add'>+ATGC_INFO_RW_ATTR(atgc_candidate_count, max_candidate_count);</div><div class='add'>+ATGC_INFO_RW_ATTR(atgc_age_weight, age_weight);</div><div class='add'>+ATGC_INFO_RW_ATTR(atgc_age_threshold, age_threshold);</div><div class='add'>+</div><div class='ctx'> F2FS_GENERAL_RO_ATTR(dirty_segments);</div><div class='ctx'> F2FS_GENERAL_RO_ATTR(free_segments);</div><div class='ctx'> F2FS_GENERAL_RO_ATTR(ovp_segments);</div><div class='hunk'>@@ -742,13 +1254,14 @@ F2FS_GENERAL_RO_ATTR(features);</div><div class='ctx'> F2FS_GENERAL_RO_ATTR(current_reserved_blocks);</div><div class='ctx'> F2FS_GENERAL_RO_ATTR(unusable);</div><div class='ctx'> F2FS_GENERAL_RO_ATTR(encoding);</div><div class='add'>+F2FS_GENERAL_RO_ATTR(encoding_flags);</div><div class='add'>+F2FS_GENERAL_RO_ATTR(effective_lookup_mode);</div><div class='ctx'> F2FS_GENERAL_RO_ATTR(mounted_time_sec);</div><div class='ctx'> F2FS_GENERAL_RO_ATTR(main_blkaddr);</div><div class='add'>+F2FS_GENERAL_RO_ATTR(pending_discard);</div><div class='add'>+F2FS_GENERAL_RO_ATTR(atgc_enabled);</div><div class='add'>+F2FS_GENERAL_RO_ATTR(gc_mode);</div><div class='ctx'> #ifdef CONFIG_F2FS_STAT_FS</div><div class='del'>-F2FS_STAT_ATTR(STAT_INFO, f2fs_stat_info, cp_foreground_calls, cp_count);</div><div class='del'>-F2FS_STAT_ATTR(STAT_INFO, f2fs_stat_info, cp_background_calls, bg_cp_count);</div><div class='del'>-F2FS_STAT_ATTR(STAT_INFO, f2fs_stat_info, gc_foreground_calls, call_count);</div><div class='del'>-F2FS_STAT_ATTR(STAT_INFO, f2fs_stat_info, gc_background_calls, bg_gc);</div><div class='ctx'> F2FS_GENERAL_RO_ATTR(moved_blocks_background);</div><div class='ctx'> F2FS_GENERAL_RO_ATTR(moved_blocks_foreground);</div><div class='ctx'> F2FS_GENERAL_RO_ATTR(avg_vblocks);</div><div class='hunk'>@@ -757,7 +1270,7 @@ F2FS_GENERAL_RO_ATTR(avg_vblocks);</div><div class='ctx'> #ifdef CONFIG_FS_ENCRYPTION</div><div class='ctx'> F2FS_FEATURE_RO_ATTR(encryption);</div><div class='ctx'> F2FS_FEATURE_RO_ATTR(test_dummy_encryption_v2);</div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='ctx'> F2FS_FEATURE_RO_ATTR(encrypted_casefold);</div><div class='ctx'> #endif</div><div class='ctx'> #endif /* CONFIG_FS_ENCRYPTION */</div><div class='hunk'>@@ -776,29 +1289,18 @@ F2FS_FEATURE_RO_ATTR(lost_found);</div><div class='ctx'> F2FS_FEATURE_RO_ATTR(verity);</div><div class='ctx'> #endif</div><div class='ctx'> F2FS_FEATURE_RO_ATTR(sb_checksum);</div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='ctx'> F2FS_FEATURE_RO_ATTR(casefold);</div><div class='ctx'> #endif</div><div class='ctx'> F2FS_FEATURE_RO_ATTR(readonly);</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='ctx'> F2FS_FEATURE_RO_ATTR(compression);</div><div class='del'>-F2FS_RW_ATTR(F2FS_SBI, f2fs_sb_info, compr_written_block, compr_written_block);</div><div class='del'>-F2FS_RW_ATTR(F2FS_SBI, f2fs_sb_info, compr_saved_block, compr_saved_block);</div><div class='del'>-F2FS_RW_ATTR(F2FS_SBI, f2fs_sb_info, compr_new_inode, compr_new_inode);</div><div class='ctx'> #endif</div><div class='ctx'> F2FS_FEATURE_RO_ATTR(pin_file);</div><div class='del'>-</div><div class='del'>-/* For ATGC */</div><div class='del'>-F2FS_RW_ATTR(ATGC_INFO, atgc_management, atgc_candidate_ratio, candidate_ratio);</div><div class='del'>-F2FS_RW_ATTR(ATGC_INFO, atgc_management, atgc_candidate_count, max_candidate_count);</div><div class='del'>-F2FS_RW_ATTR(ATGC_INFO, atgc_management, atgc_age_weight, age_weight);</div><div class='del'>-F2FS_RW_ATTR(ATGC_INFO, atgc_management, atgc_age_threshold, age_threshold);</div><div class='del'>-</div><div class='del'>-F2FS_RW_ATTR(F2FS_SBI, f2fs_sb_info, seq_file_ra_mul, seq_file_ra_mul);</div><div class='del'>-F2FS_RW_ATTR(F2FS_SBI, f2fs_sb_info, gc_segment_mode, gc_segment_mode);</div><div class='del'>-F2FS_RW_ATTR(F2FS_SBI, f2fs_sb_info, gc_reclaimed_segments, gc_reclaimed_segs);</div><div class='del'>-F2FS_RW_ATTR(F2FS_SBI, f2fs_sb_info, max_fragment_chunk, max_fragment_chunk);</div><div class='del'>-F2FS_RW_ATTR(F2FS_SBI, f2fs_sb_info, max_fragment_hole, max_fragment_hole);</div><div class='add'>+#ifdef CONFIG_UNICODE</div><div class='add'>+F2FS_FEATURE_RO_ATTR(linear_lookup);</div><div class='add'>+#endif</div><div class='add'>+F2FS_FEATURE_RO_ATTR(packed_ssa);</div><div class='ctx'> </div><div class='ctx'> #define ATTR_LIST(name) (&amp;f2fs_attr_##name.attr)</div><div class='ctx'> static struct attribute *f2fs_attrs[] = {</div><div class='hunk'>@@ -806,30 +1308,48 @@ static struct attribute *f2fs_attrs[] = {</div><div class='ctx'> 	ATTR_LIST(gc_min_sleep_time),</div><div class='ctx'> 	ATTR_LIST(gc_max_sleep_time),</div><div class='ctx'> 	ATTR_LIST(gc_no_gc_sleep_time),</div><div class='add'>+	ATTR_LIST(gc_no_zoned_gc_percent),</div><div class='add'>+	ATTR_LIST(gc_boost_zoned_gc_percent),</div><div class='add'>+	ATTR_LIST(gc_valid_thresh_ratio),</div><div class='add'>+	ATTR_LIST(gc_boost_gc_multiple),</div><div class='add'>+	ATTR_LIST(gc_boost_gc_greedy),</div><div class='ctx'> 	ATTR_LIST(gc_idle),</div><div class='ctx'> 	ATTR_LIST(gc_urgent),</div><div class='ctx'> 	ATTR_LIST(reclaim_segments),</div><div class='ctx'> 	ATTR_LIST(main_blkaddr),</div><div class='ctx'> 	ATTR_LIST(max_small_discards),</div><div class='add'>+	ATTR_LIST(max_discard_request),</div><div class='add'>+	ATTR_LIST(min_discard_issue_time),</div><div class='add'>+	ATTR_LIST(mid_discard_issue_time),</div><div class='add'>+	ATTR_LIST(max_discard_issue_time),</div><div class='add'>+	ATTR_LIST(discard_io_aware_gran),</div><div class='add'>+	ATTR_LIST(discard_urgent_util),</div><div class='ctx'> 	ATTR_LIST(discard_granularity),</div><div class='del'>-	ATTR_LIST(batched_trim_sections),</div><div class='add'>+	ATTR_LIST(max_ordered_discard),</div><div class='add'>+	ATTR_LIST(discard_io_aware),</div><div class='add'>+	ATTR_LIST(pending_discard),</div><div class='add'>+	ATTR_LIST(gc_mode),</div><div class='ctx'> 	ATTR_LIST(ipu_policy),</div><div class='ctx'> 	ATTR_LIST(min_ipu_util),</div><div class='ctx'> 	ATTR_LIST(min_fsync_blocks),</div><div class='ctx'> 	ATTR_LIST(min_seq_blocks),</div><div class='ctx'> 	ATTR_LIST(min_hot_blocks),</div><div class='ctx'> 	ATTR_LIST(min_ssr_sections),</div><div class='add'>+	ATTR_LIST(reserved_segments),</div><div class='ctx'> 	ATTR_LIST(max_victim_search),</div><div class='ctx'> 	ATTR_LIST(migration_granularity),</div><div class='add'>+	ATTR_LIST(migration_window_granularity),</div><div class='ctx'> 	ATTR_LIST(dir_level),</div><div class='ctx'> 	ATTR_LIST(ram_thresh),</div><div class='ctx'> 	ATTR_LIST(ra_nid_pages),</div><div class='ctx'> 	ATTR_LIST(dirty_nats_ratio),</div><div class='add'>+	ATTR_LIST(max_roll_forward_node_blocks),</div><div class='ctx'> 	ATTR_LIST(cp_interval),</div><div class='ctx'> 	ATTR_LIST(idle_interval),</div><div class='ctx'> 	ATTR_LIST(discard_idle_interval),</div><div class='ctx'> 	ATTR_LIST(gc_idle_interval),</div><div class='ctx'> 	ATTR_LIST(umount_discard_timeout),</div><div class='add'>+	ATTR_LIST(bggc_io_aware),</div><div class='ctx'> #ifdef CONFIG_F2FS_IOSTAT</div><div class='ctx'> 	ATTR_LIST(iostat_enable),</div><div class='ctx'> 	ATTR_LIST(iostat_period_ms),</div><div class='hunk'>@@ -844,6 +1364,7 @@ static struct attribute *f2fs_attrs[] = {</div><div class='ctx'> #endif</div><div class='ctx'> 	ATTR_LIST(data_io_flag),</div><div class='ctx'> 	ATTR_LIST(node_io_flag),</div><div class='add'>+	ATTR_LIST(gc_remaining_trials),</div><div class='ctx'> 	ATTR_LIST(ckpt_thread_ioprio),</div><div class='ctx'> 	ATTR_LIST(dirty_segments),</div><div class='ctx'> 	ATTR_LIST(free_segments),</div><div class='hunk'>@@ -854,6 +1375,8 @@ static struct attribute *f2fs_attrs[] = {</div><div class='ctx'> 	ATTR_LIST(reserved_blocks),</div><div class='ctx'> 	ATTR_LIST(current_reserved_blocks),</div><div class='ctx'> 	ATTR_LIST(encoding),</div><div class='add'>+	ATTR_LIST(encoding_flags),</div><div class='add'>+	ATTR_LIST(effective_lookup_mode),</div><div class='ctx'> 	ATTR_LIST(mounted_time_sec),</div><div class='ctx'> #ifdef CONFIG_F2FS_STAT_FS</div><div class='ctx'> 	ATTR_LIST(cp_foreground_calls),</div><div class='hunk'>@@ -864,63 +1387,97 @@ static struct attribute *f2fs_attrs[] = {</div><div class='ctx'> 	ATTR_LIST(moved_blocks_background),</div><div class='ctx'> 	ATTR_LIST(avg_vblocks),</div><div class='ctx'> #endif</div><div class='add'>+#ifdef CONFIG_BLK_DEV_ZONED</div><div class='add'>+	ATTR_LIST(unusable_blocks_per_sec),</div><div class='add'>+	ATTR_LIST(max_open_zones),</div><div class='add'>+	ATTR_LIST(blkzone_alloc_policy),</div><div class='add'>+#endif</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='ctx'> 	ATTR_LIST(compr_written_block),</div><div class='ctx'> 	ATTR_LIST(compr_saved_block),</div><div class='ctx'> 	ATTR_LIST(compr_new_inode),</div><div class='add'>+	ATTR_LIST(compress_percent),</div><div class='add'>+	ATTR_LIST(compress_watermark),</div><div class='ctx'> #endif</div><div class='ctx'> 	/* For ATGC */</div><div class='ctx'> 	ATTR_LIST(atgc_candidate_ratio),</div><div class='ctx'> 	ATTR_LIST(atgc_candidate_count),</div><div class='ctx'> 	ATTR_LIST(atgc_age_weight),</div><div class='ctx'> 	ATTR_LIST(atgc_age_threshold),</div><div class='add'>+	ATTR_LIST(atgc_enabled),</div><div class='ctx'> 	ATTR_LIST(seq_file_ra_mul),</div><div class='ctx'> 	ATTR_LIST(gc_segment_mode),</div><div class='ctx'> 	ATTR_LIST(gc_reclaimed_segments),</div><div class='ctx'> 	ATTR_LIST(max_fragment_chunk),</div><div class='ctx'> 	ATTR_LIST(max_fragment_hole),</div><div class='add'>+	ATTR_LIST(current_atomic_write),</div><div class='add'>+	ATTR_LIST(peak_atomic_write),</div><div class='add'>+	ATTR_LIST(committed_atomic_block),</div><div class='add'>+	ATTR_LIST(revoked_atomic_block),</div><div class='add'>+	ATTR_LIST(hot_data_age_threshold),</div><div class='add'>+	ATTR_LIST(warm_data_age_threshold),</div><div class='add'>+	ATTR_LIST(last_age_weight),</div><div class='add'>+	ATTR_LIST(max_read_extent_count),</div><div class='add'>+	ATTR_LIST(carve_out),</div><div class='add'>+	ATTR_LIST(reserved_pin_section),</div><div class='add'>+	ATTR_LIST(allocate_section_hint),</div><div class='add'>+	ATTR_LIST(allocate_section_policy),</div><div class='ctx'> 	NULL,</div><div class='ctx'> };</div><div class='ctx'> ATTRIBUTE_GROUPS(f2fs);</div><div class='ctx'> </div><div class='add'>+#define BASE_ATTR_LIST(name) (&amp;f2fs_base_attr_##name.attr)</div><div class='ctx'> static struct attribute *f2fs_feat_attrs[] = {</div><div class='ctx'> #ifdef CONFIG_FS_ENCRYPTION</div><div class='del'>-	ATTR_LIST(encryption),</div><div class='del'>-	ATTR_LIST(test_dummy_encryption_v2),</div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='del'>-	ATTR_LIST(encrypted_casefold),</div><div class='add'>+	BASE_ATTR_LIST(encryption),</div><div class='add'>+	BASE_ATTR_LIST(test_dummy_encryption_v2),</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='add'>+	BASE_ATTR_LIST(encrypted_casefold),</div><div class='ctx'> #endif</div><div class='ctx'> #endif /* CONFIG_FS_ENCRYPTION */</div><div class='ctx'> #ifdef CONFIG_BLK_DEV_ZONED</div><div class='del'>-	ATTR_LIST(block_zoned),</div><div class='add'>+	BASE_ATTR_LIST(block_zoned),</div><div class='ctx'> #endif</div><div class='del'>-	ATTR_LIST(atomic_write),</div><div class='del'>-	ATTR_LIST(extra_attr),</div><div class='del'>-	ATTR_LIST(project_quota),</div><div class='del'>-	ATTR_LIST(inode_checksum),</div><div class='del'>-	ATTR_LIST(flexible_inline_xattr),</div><div class='del'>-	ATTR_LIST(quota_ino),</div><div class='del'>-	ATTR_LIST(inode_crtime),</div><div class='del'>-	ATTR_LIST(lost_found),</div><div class='add'>+	BASE_ATTR_LIST(atomic_write),</div><div class='add'>+	BASE_ATTR_LIST(extra_attr),</div><div class='add'>+	BASE_ATTR_LIST(project_quota),</div><div class='add'>+	BASE_ATTR_LIST(inode_checksum),</div><div class='add'>+	BASE_ATTR_LIST(flexible_inline_xattr),</div><div class='add'>+	BASE_ATTR_LIST(quota_ino),</div><div class='add'>+	BASE_ATTR_LIST(inode_crtime),</div><div class='add'>+	BASE_ATTR_LIST(lost_found),</div><div class='ctx'> #ifdef CONFIG_FS_VERITY</div><div class='del'>-	ATTR_LIST(verity),</div><div class='add'>+	BASE_ATTR_LIST(verity),</div><div class='ctx'> #endif</div><div class='del'>-	ATTR_LIST(sb_checksum),</div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='del'>-	ATTR_LIST(casefold),</div><div class='add'>+	BASE_ATTR_LIST(sb_checksum),</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='add'>+	BASE_ATTR_LIST(casefold),</div><div class='ctx'> #endif</div><div class='del'>-	ATTR_LIST(readonly),</div><div class='add'>+	BASE_ATTR_LIST(readonly),</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_COMPRESSION</div><div class='del'>-	ATTR_LIST(compression),</div><div class='add'>+	BASE_ATTR_LIST(compression),</div><div class='add'>+#endif</div><div class='add'>+	BASE_ATTR_LIST(pin_file),</div><div class='add'>+#ifdef CONFIG_UNICODE</div><div class='add'>+	BASE_ATTR_LIST(linear_lookup),</div><div class='ctx'> #endif</div><div class='del'>-	ATTR_LIST(pin_file),</div><div class='add'>+	BASE_ATTR_LIST(packed_ssa),</div><div class='ctx'> 	NULL,</div><div class='ctx'> };</div><div class='ctx'> ATTRIBUTE_GROUPS(f2fs_feat);</div><div class='ctx'> </div><div class='ctx'> F2FS_GENERAL_RO_ATTR(sb_status);</div><div class='add'>+F2FS_GENERAL_RO_ATTR(cp_status);</div><div class='add'>+F2FS_GENERAL_RO_ATTR(issued_discard);</div><div class='add'>+F2FS_GENERAL_RO_ATTR(queued_discard);</div><div class='add'>+F2FS_GENERAL_RO_ATTR(undiscard_blks);</div><div class='add'>+</div><div class='ctx'> static struct attribute *f2fs_stat_attrs[] = {</div><div class='ctx'> 	ATTR_LIST(sb_status),</div><div class='add'>+	ATTR_LIST(cp_status),</div><div class='add'>+	ATTR_LIST(issued_discard),</div><div class='add'>+	ATTR_LIST(queued_discard),</div><div class='add'>+	ATTR_LIST(undiscard_blks),</div><div class='ctx'> 	NULL,</div><div class='ctx'> };</div><div class='ctx'> ATTRIBUTE_GROUPS(f2fs_stat);</div><div class='hunk'>@@ -939,6 +1496,8 @@ F2FS_SB_FEATURE_RO_ATTR(sb_checksum, SB_CHKSUM);</div><div class='ctx'> F2FS_SB_FEATURE_RO_ATTR(casefold, CASEFOLD);</div><div class='ctx'> F2FS_SB_FEATURE_RO_ATTR(compression, COMPRESSION);</div><div class='ctx'> F2FS_SB_FEATURE_RO_ATTR(readonly, RO);</div><div class='add'>+F2FS_SB_FEATURE_RO_ATTR(device_alias, DEVICE_ALIAS);</div><div class='add'>+F2FS_SB_FEATURE_RO_ATTR(packed_ssa, PACKED_SSA);</div><div class='ctx'> </div><div class='ctx'> static struct attribute *f2fs_sb_feat_attrs[] = {</div><div class='ctx'> 	ATTR_LIST(sb_encryption),</div><div class='hunk'>@@ -955,22 +1514,32 @@ static struct attribute *f2fs_sb_feat_attrs[] = {</div><div class='ctx'> 	ATTR_LIST(sb_casefold),</div><div class='ctx'> 	ATTR_LIST(sb_compression),</div><div class='ctx'> 	ATTR_LIST(sb_readonly),</div><div class='add'>+	ATTR_LIST(sb_device_alias),</div><div class='add'>+	ATTR_LIST(sb_packed_ssa),</div><div class='ctx'> 	NULL,</div><div class='ctx'> };</div><div class='ctx'> ATTRIBUTE_GROUPS(f2fs_sb_feat);</div><div class='ctx'> </div><div class='add'>+F2FS_TUNE_RW_ATTR(reclaim_caches_kb);</div><div class='add'>+</div><div class='add'>+static struct attribute *f2fs_tune_attrs[] = {</div><div class='add'>+	BASE_ATTR_LIST(reclaim_caches_kb),</div><div class='add'>+	NULL,</div><div class='add'>+};</div><div class='add'>+ATTRIBUTE_GROUPS(f2fs_tune);</div><div class='add'>+</div><div class='ctx'> static const struct sysfs_ops f2fs_attr_ops = {</div><div class='ctx'> 	.show	= f2fs_attr_show,</div><div class='ctx'> 	.store	= f2fs_attr_store,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static struct kobj_type f2fs_sb_ktype = {</div><div class='add'>+static const struct kobj_type f2fs_sb_ktype = {</div><div class='ctx'> 	.default_groups = f2fs_groups,</div><div class='ctx'> 	.sysfs_ops	= &amp;f2fs_attr_ops,</div><div class='ctx'> 	.release	= f2fs_sb_release,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static struct kobj_type f2fs_ktype = {</div><div class='add'>+static const struct kobj_type f2fs_ktype = {</div><div class='ctx'> 	.sysfs_ops	= &amp;f2fs_attr_ops,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -978,15 +1547,34 @@ static struct kset f2fs_kset = {</div><div class='ctx'> 	.kobj	= {.ktype = &amp;f2fs_ktype},</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static struct kobj_type f2fs_feat_ktype = {</div><div class='add'>+static const struct sysfs_ops f2fs_feat_attr_ops = {</div><div class='add'>+	.show	= f2fs_base_attr_show,</div><div class='add'>+	.store	= f2fs_base_attr_store,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct kobj_type f2fs_feat_ktype = {</div><div class='ctx'> 	.default_groups = f2fs_feat_groups,</div><div class='del'>-	.sysfs_ops	= &amp;f2fs_attr_ops,</div><div class='add'>+	.sysfs_ops	= &amp;f2fs_feat_attr_ops,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static struct kobject f2fs_feat = {</div><div class='ctx'> 	.kset	= &amp;f2fs_kset,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+static const struct sysfs_ops f2fs_tune_attr_ops = {</div><div class='add'>+	.show	= f2fs_base_attr_show,</div><div class='add'>+	.store	= f2fs_base_attr_store,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct kobj_type f2fs_tune_ktype = {</div><div class='add'>+	.default_groups = f2fs_tune_groups,</div><div class='add'>+	.sysfs_ops	= &amp;f2fs_tune_attr_ops,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static struct kobject f2fs_tune = {</div><div class='add'>+	.kset	= &amp;f2fs_kset,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> static ssize_t f2fs_stat_attr_show(struct kobject *kobj,</div><div class='ctx'> 				struct attribute *attr, char *buf)</div><div class='ctx'> {</div><div class='hunk'>@@ -1019,7 +1607,7 @@ static const struct sysfs_ops f2fs_stat_attr_ops = {</div><div class='ctx'> 	.store	= f2fs_stat_attr_store,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static struct kobj_type f2fs_stat_ktype = {</div><div class='add'>+static const struct kobj_type f2fs_stat_ktype = {</div><div class='ctx'> 	.default_groups = f2fs_stat_groups,</div><div class='ctx'> 	.sysfs_ops	= &amp;f2fs_stat_attr_ops,</div><div class='ctx'> 	.release	= f2fs_stat_kobj_release,</div><div class='hunk'>@@ -1046,7 +1634,7 @@ static const struct sysfs_ops f2fs_feature_list_attr_ops = {</div><div class='ctx'> 	.show	= f2fs_sb_feat_attr_show,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static struct kobj_type f2fs_feature_list_ktype = {</div><div class='add'>+static const struct kobj_type f2fs_feature_list_ktype = {</div><div class='ctx'> 	.default_groups = f2fs_sb_feat_groups,</div><div class='ctx'> 	.sysfs_ops	= &amp;f2fs_feature_list_attr_ops,</div><div class='ctx'> 	.release	= f2fs_feature_list_kobj_release,</div><div class='hunk'>@@ -1088,7 +1676,7 @@ static int __maybe_unused segment_bits_seq_show(struct seq_file *seq,</div><div class='ctx'> 			le32_to_cpu(sbi-&gt;raw_super-&gt;segment_count_main);</div><div class='ctx'> 	int i, j;</div><div class='ctx'> </div><div class='del'>-	seq_puts(seq, "format: segment_type|valid_blocks|bitmaps\n"</div><div class='add'>+	seq_puts(seq, "format: segment_type|valid_blocks|bitmaps|mtime\n"</div><div class='ctx'> 		"segment_type(0:HD, 1:WD, 2:CD, 3:HN, 4:WN, 5:CN)\n");</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; total_segs; i++) {</div><div class='hunk'>@@ -1098,6 +1686,7 @@ static int __maybe_unused segment_bits_seq_show(struct seq_file *seq,</div><div class='ctx'> 		seq_printf(seq, "%d|%-3u|", se-&gt;type, se-&gt;valid_blocks);</div><div class='ctx'> 		for (j = 0; j &lt; SIT_VBLOCK_MAP_SIZE; j++)</div><div class='ctx'> 			seq_printf(seq, " %.2x", se-&gt;cur_valid_map[j]);</div><div class='add'>+		seq_printf(seq, "| %llx", se-&gt;mtime);</div><div class='ctx'> 		seq_putc(seq, '\n');</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -1125,6 +1714,172 @@ static int __maybe_unused victim_bits_seq_show(struct seq_file *seq,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int __maybe_unused discard_plist_seq_show(struct seq_file *seq,</div><div class='add'>+						void *offset)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = seq-&gt;private;</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_SB(sb);</div><div class='add'>+	struct discard_cmd_control *dcc = SM_I(sbi)-&gt;dcc_info;</div><div class='add'>+	int i, count;</div><div class='add'>+</div><div class='add'>+	seq_puts(seq, "Discard pend list(Show diacrd_cmd count on each entry, .:not exist):\n");</div><div class='add'>+	if (!f2fs_realtime_discard_enable(sbi))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if (dcc) {</div><div class='add'>+		mutex_lock(&amp;dcc-&gt;cmd_lock);</div><div class='add'>+		for (i = 0; i &lt; MAX_PLIST_NUM; i++) {</div><div class='add'>+			struct list_head *pend_list;</div><div class='add'>+			struct discard_cmd *dc, *tmp;</div><div class='add'>+</div><div class='add'>+			if (i % 8 == 0)</div><div class='add'>+				seq_printf(seq, "  %-3d", i);</div><div class='add'>+			count = 0;</div><div class='add'>+			pend_list = &amp;dcc-&gt;pend_list[i];</div><div class='add'>+			list_for_each_entry_safe(dc, tmp, pend_list, list)</div><div class='add'>+				count++;</div><div class='add'>+			if (count)</div><div class='add'>+				seq_printf(seq, " %7d", count);</div><div class='add'>+			else</div><div class='add'>+				seq_puts(seq, "       .");</div><div class='add'>+			if (i % 8 == 7)</div><div class='add'>+				seq_putc(seq, '\n');</div><div class='add'>+		}</div><div class='add'>+		seq_putc(seq, '\n');</div><div class='add'>+		mutex_unlock(&amp;dcc-&gt;cmd_lock);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int __maybe_unused disk_map_seq_show(struct seq_file *seq,</div><div class='add'>+						void *offset)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = seq-&gt;private;</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_SB(sb);</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	seq_printf(seq, "Address Layout   : %5luB Block address (# of Segments)\n",</div><div class='add'>+					F2FS_BLKSIZE);</div><div class='add'>+	seq_printf(seq, " SB            : %12s\n", "0/1024B");</div><div class='add'>+	seq_printf(seq, " seg0_blkaddr  : 0x%010x\n", SEG0_BLKADDR(sbi));</div><div class='add'>+	seq_printf(seq, " Checkpoint    : 0x%010x (%10d)\n",</div><div class='add'>+			le32_to_cpu(F2FS_RAW_SUPER(sbi)-&gt;cp_blkaddr), 2);</div><div class='add'>+	seq_printf(seq, " SIT           : 0x%010x (%10d)\n",</div><div class='add'>+			SIT_I(sbi)-&gt;sit_base_addr,</div><div class='add'>+			le32_to_cpu(F2FS_RAW_SUPER(sbi)-&gt;segment_count_sit));</div><div class='add'>+	seq_printf(seq, " NAT           : 0x%010x (%10d)\n",</div><div class='add'>+			NM_I(sbi)-&gt;nat_blkaddr,</div><div class='add'>+			le32_to_cpu(F2FS_RAW_SUPER(sbi)-&gt;segment_count_nat));</div><div class='add'>+	seq_printf(seq, " SSA           : 0x%010x (%10d)\n",</div><div class='add'>+			SM_I(sbi)-&gt;ssa_blkaddr,</div><div class='add'>+			le32_to_cpu(F2FS_RAW_SUPER(sbi)-&gt;segment_count_ssa));</div><div class='add'>+	seq_printf(seq, " Main          : 0x%010x (%10d)\n",</div><div class='add'>+			SM_I(sbi)-&gt;main_blkaddr,</div><div class='add'>+			le32_to_cpu(F2FS_RAW_SUPER(sbi)-&gt;segment_count_main));</div><div class='add'>+	seq_printf(seq, " Block size    : %12lu KB\n", F2FS_BLKSIZE &gt;&gt; 10);</div><div class='add'>+	seq_printf(seq, " Segment size  : %12d MB\n",</div><div class='add'>+			(BLKS_PER_SEG(sbi) &lt;&lt; (F2FS_BLKSIZE_BITS - 10)) &gt;&gt; 10);</div><div class='add'>+	seq_printf(seq, " Segs/Sections : %12d\n",</div><div class='add'>+			SEGS_PER_SEC(sbi));</div><div class='add'>+	seq_printf(seq, " Section size  : %12d MB\n",</div><div class='add'>+			(BLKS_PER_SEC(sbi) &lt;&lt; (F2FS_BLKSIZE_BITS - 10)) &gt;&gt; 10);</div><div class='add'>+	seq_printf(seq, " # of Sections : %12d\n",</div><div class='add'>+			le32_to_cpu(F2FS_RAW_SUPER(sbi)-&gt;section_count));</div><div class='add'>+</div><div class='add'>+	if (!f2fs_is_multi_device(sbi))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	seq_puts(seq, "\nDisk Map for multi devices:\n");</div><div class='add'>+	for (i = 0; i &lt; sbi-&gt;s_ndevs; i++)</div><div class='add'>+		seq_printf(seq, "Disk:%2d (zoned=%d): 0x%010x - 0x%010x on %s\n",</div><div class='add'>+			i, bdev_is_zoned(FDEV(i).bdev),</div><div class='add'>+			FDEV(i).start_blk, FDEV(i).end_blk,</div><div class='add'>+			FDEV(i).path);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int __maybe_unused donation_list_seq_show(struct seq_file *seq,</div><div class='add'>+						void *offset)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = seq-&gt;private;</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_SB(sb);</div><div class='add'>+	struct inode *inode;</div><div class='add'>+	struct f2fs_inode_info *fi;</div><div class='add'>+	struct dentry *dentry;</div><div class='add'>+	char *buf, *path;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	buf = f2fs_getname(sbi);</div><div class='add'>+	if (!buf)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	seq_printf(seq, "Donation List\n");</div><div class='add'>+	seq_printf(seq, " # of files  : %u\n", sbi-&gt;donate_files);</div><div class='add'>+	seq_printf(seq, " %-50s %10s %20s %20s %22s\n",</div><div class='add'>+			"File path", "Status", "Donation offset (kb)",</div><div class='add'>+			"Donation size (kb)", "File cached size (kb)");</div><div class='add'>+	seq_printf(seq, "---\n");</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; sbi-&gt;donate_files; i++) {</div><div class='add'>+		spin_lock(&amp;sbi-&gt;inode_lock[DONATE_INODE]);</div><div class='add'>+		if (list_empty(&amp;sbi-&gt;inode_list[DONATE_INODE])) {</div><div class='add'>+			spin_unlock(&amp;sbi-&gt;inode_lock[DONATE_INODE]);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		fi = list_first_entry(&amp;sbi-&gt;inode_list[DONATE_INODE],</div><div class='add'>+					struct f2fs_inode_info, gdonate_list);</div><div class='add'>+		list_move_tail(&amp;fi-&gt;gdonate_list, &amp;sbi-&gt;inode_list[DONATE_INODE]);</div><div class='add'>+		inode = igrab(&amp;fi-&gt;vfs_inode);</div><div class='add'>+		spin_unlock(&amp;sbi-&gt;inode_lock[DONATE_INODE]);</div><div class='add'>+</div><div class='add'>+		if (!inode)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		inode_lock_shared(inode);</div><div class='add'>+</div><div class='add'>+		dentry = d_find_alias(inode);</div><div class='add'>+		if (!dentry) {</div><div class='add'>+			path = NULL;</div><div class='add'>+		} else {</div><div class='add'>+			path = dentry_path_raw(dentry, buf, PATH_MAX);</div><div class='add'>+			if (IS_ERR(path))</div><div class='add'>+				goto next;</div><div class='add'>+		}</div><div class='add'>+		seq_printf(seq, " %-50s %10s %20llu %20llu %22llu\n",</div><div class='add'>+				path ? path : "&lt;unlinked&gt;",</div><div class='add'>+				is_inode_flag_set(inode, FI_DONATE_FINISHED) ?</div><div class='add'>+				"Evicted" : "Donated",</div><div class='add'>+				(loff_t)fi-&gt;donate_start &lt;&lt; (PAGE_SHIFT - 10),</div><div class='add'>+				(loff_t)(fi-&gt;donate_end + 1) &lt;&lt; (PAGE_SHIFT - 10),</div><div class='add'>+				(loff_t)inode-&gt;i_mapping-&gt;nrpages &lt;&lt; (PAGE_SHIFT - 10));</div><div class='add'>+next:</div><div class='add'>+		dput(dentry);</div><div class='add'>+		inode_unlock_shared(inode);</div><div class='add'>+		iput(inode);</div><div class='add'>+	}</div><div class='add'>+	f2fs_putname(buf);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_F2FS_FAULT_INJECTION</div><div class='add'>+static int __maybe_unused inject_stats_seq_show(struct seq_file *seq,</div><div class='add'>+						void *offset)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = seq-&gt;private;</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_SB(sb);</div><div class='add'>+	struct f2fs_fault_info *ffi = &amp;F2FS_OPTION(sbi).fault_info;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	seq_puts(seq, "fault_type		injected_count\n");</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; FAULT_MAX; i++)</div><div class='add'>+		seq_printf(seq, "%-24s%-10u\n", f2fs_fault_name[i],</div><div class='add'>+						ffi-&gt;inject_count[i]);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> int __init f2fs_init_sysfs(void)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -1137,17 +1892,32 @@ int __init f2fs_init_sysfs(void)</div><div class='ctx'> </div><div class='ctx'> 	ret = kobject_init_and_add(&amp;f2fs_feat, &amp;f2fs_feat_ktype,</div><div class='ctx'> 				   NULL, "features");</div><div class='del'>-	if (ret) {</div><div class='del'>-		kobject_put(&amp;f2fs_feat);</div><div class='del'>-		kset_unregister(&amp;f2fs_kset);</div><div class='del'>-	} else {</div><div class='del'>-		f2fs_proc_root = proc_mkdir("fs/f2fs", NULL);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto put_kobject;</div><div class='add'>+</div><div class='add'>+	ret = kobject_init_and_add(&amp;f2fs_tune, &amp;f2fs_tune_ktype,</div><div class='add'>+				   NULL, "tuning");</div><div class='add'>+	if (ret)</div><div class='add'>+		goto put_kobject;</div><div class='add'>+</div><div class='add'>+	f2fs_proc_root = proc_mkdir("fs/f2fs", NULL);</div><div class='add'>+	if (!f2fs_proc_root) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto put_kobject;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+put_kobject:</div><div class='add'>+	kobject_put(&amp;f2fs_tune);</div><div class='add'>+	kobject_put(&amp;f2fs_feat);</div><div class='add'>+	kset_unregister(&amp;f2fs_kset);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void f2fs_exit_sysfs(void)</div><div class='ctx'> {</div><div class='add'>+	kobject_put(&amp;f2fs_tune);</div><div class='ctx'> 	kobject_put(&amp;f2fs_feat);</div><div class='ctx'> 	kset_unregister(&amp;f2fs_kset);</div><div class='ctx'> 	remove_proc_entry("fs/f2fs", NULL);</div><div class='hunk'>@@ -1181,21 +1951,32 @@ int f2fs_register_sysfs(struct f2fs_sb_info *sbi)</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto put_feature_list_kobj;</div><div class='ctx'> </div><div class='del'>-	if (f2fs_proc_root)</div><div class='del'>-		sbi-&gt;s_proc = proc_mkdir(sb-&gt;s_id, f2fs_proc_root);</div><div class='add'>+	sbi-&gt;s_proc = proc_mkdir(sb-&gt;s_id, f2fs_proc_root);</div><div class='add'>+	if (!sbi-&gt;s_proc) {</div><div class='add'>+		err = -ENOMEM;</div><div class='add'>+		goto put_feature_list_kobj;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (sbi-&gt;s_proc) {</div><div class='del'>-		proc_create_single_data("segment_info", 0444, sbi-&gt;s_proc,</div><div class='add'>+	proc_create_single_data("segment_info", 0444, sbi-&gt;s_proc,</div><div class='ctx'> 				segment_info_seq_show, sb);</div><div class='del'>-		proc_create_single_data("segment_bits", 0444, sbi-&gt;s_proc,</div><div class='add'>+	proc_create_single_data("segment_bits", 0444, sbi-&gt;s_proc,</div><div class='ctx'> 				segment_bits_seq_show, sb);</div><div class='ctx'> #ifdef CONFIG_F2FS_IOSTAT</div><div class='del'>-		proc_create_single_data("iostat_info", 0444, sbi-&gt;s_proc,</div><div class='add'>+	proc_create_single_data("iostat_info", 0444, sbi-&gt;s_proc,</div><div class='ctx'> 				iostat_info_seq_show, sb);</div><div class='ctx'> #endif</div><div class='del'>-		proc_create_single_data("victim_bits", 0444, sbi-&gt;s_proc,</div><div class='add'>+	proc_create_single_data("victim_bits", 0444, sbi-&gt;s_proc,</div><div class='ctx'> 				victim_bits_seq_show, sb);</div><div class='del'>-	}</div><div class='add'>+	proc_create_single_data("discard_plist_info", 0444, sbi-&gt;s_proc,</div><div class='add'>+				discard_plist_seq_show, sb);</div><div class='add'>+	proc_create_single_data("disk_map", 0444, sbi-&gt;s_proc,</div><div class='add'>+				disk_map_seq_show, sb);</div><div class='add'>+	proc_create_single_data("donation_list", 0444, sbi-&gt;s_proc,</div><div class='add'>+				donation_list_seq_show, sb);</div><div class='add'>+#ifdef CONFIG_F2FS_FAULT_INJECTION</div><div class='add'>+	proc_create_single_data("inject_stats", 0444, sbi-&gt;s_proc,</div><div class='add'>+				inject_stats_seq_show, sb);</div><div class='add'>+#endif</div><div class='ctx'> 	return 0;</div><div class='ctx'> put_feature_list_kobj:</div><div class='ctx'> 	kobject_put(&amp;sbi-&gt;s_feature_list_kobj);</div><div class='hunk'>@@ -1211,24 +1992,13 @@ put_sb_kobj:</div><div class='ctx'> </div><div class='ctx'> void f2fs_unregister_sysfs(struct f2fs_sb_info *sbi)</div><div class='ctx'> {</div><div class='del'>-	if (sbi-&gt;s_proc) {</div><div class='del'>-#ifdef CONFIG_F2FS_IOSTAT</div><div class='del'>-		remove_proc_entry("iostat_info", sbi-&gt;s_proc);</div><div class='del'>-#endif</div><div class='del'>-		remove_proc_entry("segment_info", sbi-&gt;s_proc);</div><div class='del'>-		remove_proc_entry("segment_bits", sbi-&gt;s_proc);</div><div class='del'>-		remove_proc_entry("victim_bits", sbi-&gt;s_proc);</div><div class='del'>-		remove_proc_entry(sbi-&gt;sb-&gt;s_id, f2fs_proc_root);</div><div class='del'>-	}</div><div class='add'>+	remove_proc_subtree(sbi-&gt;sb-&gt;s_id, f2fs_proc_root);</div><div class='ctx'> </div><div class='del'>-	kobject_del(&amp;sbi-&gt;s_stat_kobj);</div><div class='ctx'> 	kobject_put(&amp;sbi-&gt;s_stat_kobj);</div><div class='ctx'> 	wait_for_completion(&amp;sbi-&gt;s_stat_kobj_unregister);</div><div class='del'>-	kobject_del(&amp;sbi-&gt;s_feature_list_kobj);</div><div class='ctx'> 	kobject_put(&amp;sbi-&gt;s_feature_list_kobj);</div><div class='ctx'> 	wait_for_completion(&amp;sbi-&gt;s_feature_list_kobj_unregister);</div><div class='ctx'> </div><div class='del'>-	kobject_del(&amp;sbi-&gt;s_kobj);</div><div class='ctx'> 	kobject_put(&amp;sbi-&gt;s_kobj);</div><div class='ctx'> 	wait_for_completion(&amp;sbi-&gt;s_kobj_unregister);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/f2fs/verity.c b/fs/f2fs/verity.c<br/>index fe5acdccaae1..05b935b55216 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/verity.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/verity.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/verity.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/verity.c</a></div><div class='hunk'>@@ -47,16 +47,13 @@ static int pagecache_read(struct inode *inode, void *buf, size_t count,</div><div class='ctx'> 		size_t n = min_t(size_t, count,</div><div class='ctx'> 				 PAGE_SIZE - offset_in_page(pos));</div><div class='ctx'> 		struct page *page;</div><div class='del'>-		void *addr;</div><div class='ctx'> </div><div class='ctx'> 		page = read_mapping_page(inode-&gt;i_mapping, pos &gt;&gt; PAGE_SHIFT,</div><div class='ctx'> 					 NULL);</div><div class='ctx'> 		if (IS_ERR(page))</div><div class='ctx'> 			return PTR_ERR(page);</div><div class='ctx'> </div><div class='del'>-		addr = kmap_atomic(page);</div><div class='del'>-		memcpy(buf, addr + offset_in_page(pos), n);</div><div class='del'>-		kunmap_atomic(addr);</div><div class='add'>+		memcpy_from_page(buf, page, offset_in_page(pos), n);</div><div class='ctx'> </div><div class='ctx'> 		put_page(page);</div><div class='ctx'> </div><div class='hunk'>@@ -74,28 +71,26 @@ static int pagecache_read(struct inode *inode, void *buf, size_t count,</div><div class='ctx'> static int pagecache_write(struct inode *inode, const void *buf, size_t count,</div><div class='ctx'> 			   loff_t pos)</div><div class='ctx'> {</div><div class='del'>-	if (pos + count &gt; inode-&gt;i_sb-&gt;s_maxbytes)</div><div class='add'>+	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='add'>+	const struct address_space_operations *aops = mapping-&gt;a_ops;</div><div class='add'>+</div><div class='add'>+	if (pos + count &gt; F2FS_BLK_TO_BYTES(max_file_blocks(inode)))</div><div class='ctx'> 		return -EFBIG;</div><div class='ctx'> </div><div class='ctx'> 	while (count) {</div><div class='ctx'> 		size_t n = min_t(size_t, count,</div><div class='ctx'> 				 PAGE_SIZE - offset_in_page(pos));</div><div class='del'>-		struct page *page;</div><div class='del'>-		void *fsdata;</div><div class='del'>-		void *addr;</div><div class='add'>+		struct folio *folio;</div><div class='add'>+		void *fsdata = NULL;</div><div class='ctx'> 		int res;</div><div class='ctx'> </div><div class='del'>-		res = pagecache_write_begin(NULL, inode-&gt;i_mapping, pos, n, 0,</div><div class='del'>-					    &amp;page, &amp;fsdata);</div><div class='add'>+		res = aops-&gt;write_begin(NULL, mapping, pos, n, &amp;folio, &amp;fsdata);</div><div class='ctx'> 		if (res)</div><div class='ctx'> 			return res;</div><div class='ctx'> </div><div class='del'>-		addr = kmap_atomic(page);</div><div class='del'>-		memcpy(addr + offset_in_page(pos), buf, n);</div><div class='del'>-		kunmap_atomic(addr);</div><div class='add'>+		memcpy_to_folio(folio, offset_in_folio(folio, pos), buf, n);</div><div class='ctx'> </div><div class='del'>-		res = pagecache_write_end(NULL, inode-&gt;i_mapping, pos, n, n,</div><div class='del'>-					  page, fsdata);</div><div class='add'>+		res = aops-&gt;write_end(NULL, mapping, pos, n, n, folio, fsdata);</div><div class='ctx'> 		if (res &lt; 0)</div><div class='ctx'> 			return res;</div><div class='ctx'> 		if (res != n)</div><div class='hunk'>@@ -128,7 +123,7 @@ static int f2fs_begin_enable_verity(struct file *filp)</div><div class='ctx'> 	if (f2fs_verity_in_progress(inode))</div><div class='ctx'> 		return -EBUSY;</div><div class='ctx'> </div><div class='del'>-	if (f2fs_is_atomic_file(inode) || f2fs_is_volatile_file(inode))</div><div class='add'>+	if (f2fs_is_atomic_file(inode))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -208,7 +203,7 @@ cleanup:</div><div class='ctx'> 	 * from re-instantiating cached pages we are truncating (since unlike</div><div class='ctx'> 	 * normal file accesses, garbage collection isn't limited by i_size).</div><div class='ctx'> 	 */</div><div class='del'>-	down_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+	f2fs_down_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> 	truncate_inode_pages(inode-&gt;i_mapping, inode-&gt;i_size);</div><div class='ctx'> 	err2 = f2fs_truncate(inode);</div><div class='ctx'> 	if (err2) {</div><div class='hunk'>@@ -216,7 +211,7 @@ cleanup:</div><div class='ctx'> 			 err2);</div><div class='ctx'> 		set_sbi_flag(sbi, SBI_NEED_FSCK);</div><div class='ctx'> 	}</div><div class='del'>-	up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='add'>+	f2fs_up_write(&amp;F2FS_I(inode)-&gt;i_gc_rwsem[WRITE]);</div><div class='ctx'> 	clear_inode_flag(inode, FI_VERITY_IN_PROGRESS);</div><div class='ctx'> 	return err ?: err2;</div><div class='ctx'> }</div><div class='hunk'>@@ -242,9 +237,12 @@ static int f2fs_get_verity_descriptor(struct inode *inode, void *buf,</div><div class='ctx'> 	pos = le64_to_cpu(dloc.pos);</div><div class='ctx'> </div><div class='ctx'> 	/* Get the descriptor */</div><div class='del'>-	if (pos + size &lt; pos || pos + size &gt; inode-&gt;i_sb-&gt;s_maxbytes ||</div><div class='add'>+	if (pos + size &lt; pos ||</div><div class='add'>+	    pos + size &gt; F2FS_BLK_TO_BYTES(max_file_blocks(inode)) ||</div><div class='ctx'> 	    pos &lt; f2fs_verity_metadata_pos(inode) || size &gt; INT_MAX) {</div><div class='ctx'> 		f2fs_warn(F2FS_I_SB(inode), "invalid verity xattr");</div><div class='add'>+		f2fs_handle_error(F2FS_I_SB(inode),</div><div class='add'>+				ERROR_CORRUPTED_VERITY_XATTR);</div><div class='ctx'> 		return -EFSCORRUPTED;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (buf_size) {</div><div class='hunk'>@@ -261,31 +259,36 @@ static struct page *f2fs_read_merkle_tree_page(struct inode *inode,</div><div class='ctx'> 					       pgoff_t index,</div><div class='ctx'> 					       unsigned long num_ra_pages)</div><div class='ctx'> {</div><div class='del'>-	DEFINE_READAHEAD(ractl, NULL, NULL, inode-&gt;i_mapping, index);</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> </div><div class='ctx'> 	index += f2fs_verity_metadata_pos(inode) &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> </div><div class='del'>-	page = find_get_page_flags(inode-&gt;i_mapping, index, FGP_ACCESSED);</div><div class='del'>-	if (!page || !PageUptodate(page)) {</div><div class='del'>-		if (page)</div><div class='del'>-			put_page(page);</div><div class='add'>+	folio = f2fs_filemap_get_folio(inode-&gt;i_mapping, index, FGP_ACCESSED, 0);</div><div class='add'>+	if (IS_ERR(folio) || !folio_test_uptodate(folio)) {</div><div class='add'>+		DEFINE_READAHEAD(ractl, NULL, NULL, inode-&gt;i_mapping, index);</div><div class='add'>+</div><div class='add'>+		if (!IS_ERR(folio))</div><div class='add'>+			folio_put(folio);</div><div class='ctx'> 		else if (num_ra_pages &gt; 1)</div><div class='ctx'> 			page_cache_ra_unbounded(&amp;ractl, num_ra_pages, 0);</div><div class='del'>-		page = read_mapping_page(inode-&gt;i_mapping, index, NULL);</div><div class='add'>+		folio = read_mapping_folio(inode-&gt;i_mapping, index, NULL);</div><div class='add'>+		if (IS_ERR(folio))</div><div class='add'>+			return ERR_CAST(folio);</div><div class='ctx'> 	}</div><div class='del'>-	return page;</div><div class='add'>+	return folio_file_page(folio, index);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int f2fs_write_merkle_tree_block(struct inode *inode, const void *buf,</div><div class='del'>-					u64 index, int log_blocksize)</div><div class='add'>+					u64 pos, unsigned int size)</div><div class='ctx'> {</div><div class='del'>-	loff_t pos = f2fs_verity_metadata_pos(inode) + (index &lt;&lt; log_blocksize);</div><div class='add'>+	pos += f2fs_verity_metadata_pos(inode);</div><div class='ctx'> </div><div class='del'>-	return pagecache_write(inode, buf, 1 &lt;&lt; log_blocksize, pos);</div><div class='add'>+	return pagecache_write(inode, buf, size, pos);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct fsverity_operations f2fs_verityops = {</div><div class='add'>+	.inode_info_offs	= (int)offsetof(struct f2fs_inode_info, i_verity_info) -</div><div class='add'>+				  (int)offsetof(struct f2fs_inode_info, vfs_inode),</div><div class='ctx'> 	.begin_enable_verity	= f2fs_begin_enable_verity,</div><div class='ctx'> 	.end_enable_verity	= f2fs_end_enable_verity,</div><div class='ctx'> 	.get_verity_descriptor	= f2fs_get_verity_descriptor,</div><div class='head'>diff --git a/fs/f2fs/xattr.c b/fs/f2fs/xattr.c<br/>index e348f33bcb2b..b4e5c406632f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/xattr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/xattr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/xattr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/xattr.c</a></div><div class='hunk'>@@ -23,11 +23,12 @@</div><div class='ctx'> #include "xattr.h"</div><div class='ctx'> #include "segment.h"</div><div class='ctx'> </div><div class='add'>+static struct kmem_cache *inline_xattr_slab;</div><div class='ctx'> static void *xattr_alloc(struct f2fs_sb_info *sbi, int size, bool *is_inline)</div><div class='ctx'> {</div><div class='del'>-	if (likely(size == sbi-&gt;inline_xattr_slab_size)) {</div><div class='add'>+	if (likely(size == DEFAULT_XATTR_SLAB_SIZE)) {</div><div class='ctx'> 		*is_inline = true;</div><div class='del'>-		return f2fs_kmem_cache_alloc(sbi-&gt;inline_xattr_slab,</div><div class='add'>+		return f2fs_kmem_cache_alloc(inline_xattr_slab,</div><div class='ctx'> 					GFP_F2FS_ZERO, false, sbi);</div><div class='ctx'> 	}</div><div class='ctx'> 	*is_inline = false;</div><div class='hunk'>@@ -38,7 +39,7 @@ static void xattr_free(struct f2fs_sb_info *sbi, void *xattr_addr,</div><div class='ctx'> 							bool is_inline)</div><div class='ctx'> {</div><div class='ctx'> 	if (is_inline)</div><div class='del'>-		kmem_cache_free(sbi-&gt;inline_xattr_slab, xattr_addr);</div><div class='add'>+		kmem_cache_free(inline_xattr_slab, xattr_addr);</div><div class='ctx'> 	else</div><div class='ctx'> 		kfree(xattr_addr);</div><div class='ctx'> }</div><div class='hunk'>@@ -65,7 +66,7 @@ static int f2fs_xattr_generic_get(const struct xattr_handler *handler,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int f2fs_xattr_generic_set(const struct xattr_handler *handler,</div><div class='del'>-		struct user_namespace *mnt_userns,</div><div class='add'>+		struct mnt_idmap *idmap,</div><div class='ctx'> 		struct dentry *unused, struct inode *inode,</div><div class='ctx'> 		const char *name, const void *value,</div><div class='ctx'> 		size_t size, int flags)</div><div class='hunk'>@@ -109,7 +110,7 @@ static int f2fs_xattr_advise_get(const struct xattr_handler *handler,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int f2fs_xattr_advise_set(const struct xattr_handler *handler,</div><div class='del'>-		struct user_namespace *mnt_userns,</div><div class='add'>+		struct mnt_idmap *idmap,</div><div class='ctx'> 		struct dentry *unused, struct inode *inode,</div><div class='ctx'> 		const char *name, const void *value,</div><div class='ctx'> 		size_t size, int flags)</div><div class='hunk'>@@ -117,7 +118,7 @@ static int f2fs_xattr_advise_set(const struct xattr_handler *handler,</div><div class='ctx'> 	unsigned char old_advise = F2FS_I(inode)-&gt;i_advise;</div><div class='ctx'> 	unsigned char new_advise;</div><div class='ctx'> </div><div class='del'>-	if (!inode_owner_or_capable(&amp;init_user_ns, inode))</div><div class='add'>+	if (!inode_owner_or_capable(&amp;nop_mnt_idmap, inode))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> 	if (value == NULL)</div><div class='ctx'> 		return -EINVAL;</div><div class='hunk'>@@ -136,7 +137,7 @@ static int f2fs_xattr_advise_set(const struct xattr_handler *handler,</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_F2FS_FS_SECURITY</div><div class='ctx'> static int f2fs_initxattrs(struct inode *inode, const struct xattr *xattr_array,</div><div class='del'>-		void *page)</div><div class='add'>+		void *folio)</div><div class='ctx'> {</div><div class='ctx'> 	const struct xattr *xattr;</div><div class='ctx'> 	int err = 0;</div><div class='hunk'>@@ -144,7 +145,7 @@ static int f2fs_initxattrs(struct inode *inode, const struct xattr *xattr_array,</div><div class='ctx'> 	for (xattr = xattr_array; xattr-&gt;name != NULL; xattr++) {</div><div class='ctx'> 		err = f2fs_setxattr(inode, F2FS_XATTR_INDEX_SECURITY,</div><div class='ctx'> 				xattr-&gt;name, xattr-&gt;value,</div><div class='del'>-				xattr-&gt;value_len, (struct page *)page, 0);</div><div class='add'>+				xattr-&gt;value_len, folio, 0);</div><div class='ctx'> 		if (err &lt; 0)</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -152,10 +153,10 @@ static int f2fs_initxattrs(struct inode *inode, const struct xattr *xattr_array,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int f2fs_init_security(struct inode *inode, struct inode *dir,</div><div class='del'>-				const struct qstr *qstr, struct page *ipage)</div><div class='add'>+				const struct qstr *qstr, struct folio *ifolio)</div><div class='ctx'> {</div><div class='ctx'> 	return security_inode_init_security(inode, dir, qstr,</div><div class='del'>-				&amp;f2fs_initxattrs, ipage);</div><div class='add'>+				f2fs_initxattrs, ifolio);</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='hunk'>@@ -189,11 +190,11 @@ const struct xattr_handler f2fs_xattr_security_handler = {</div><div class='ctx'> 	.set	= f2fs_xattr_generic_set,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static const struct xattr_handler *f2fs_xattr_handler_map[] = {</div><div class='add'>+static const struct xattr_handler * const f2fs_xattr_handler_map[] = {</div><div class='ctx'> 	[F2FS_XATTR_INDEX_USER] = &amp;f2fs_xattr_user_handler,</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_POSIX_ACL</div><div class='del'>-	[F2FS_XATTR_INDEX_POSIX_ACL_ACCESS] = &amp;posix_acl_access_xattr_handler,</div><div class='del'>-	[F2FS_XATTR_INDEX_POSIX_ACL_DEFAULT] = &amp;posix_acl_default_xattr_handler,</div><div class='add'>+	[F2FS_XATTR_INDEX_POSIX_ACL_ACCESS] = &amp;nop_posix_acl_access,</div><div class='add'>+	[F2FS_XATTR_INDEX_POSIX_ACL_DEFAULT] = &amp;nop_posix_acl_default,</div><div class='ctx'> #endif</div><div class='ctx'> 	[F2FS_XATTR_INDEX_TRUSTED] = &amp;f2fs_xattr_trusted_handler,</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_SECURITY</div><div class='hunk'>@@ -202,12 +203,8 @@ static const struct xattr_handler *f2fs_xattr_handler_map[] = {</div><div class='ctx'> 	[F2FS_XATTR_INDEX_ADVISE] = &amp;f2fs_xattr_advise_handler,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-const struct xattr_handler *f2fs_xattr_handlers[] = {</div><div class='add'>+const struct xattr_handler * const f2fs_xattr_handlers[] = {</div><div class='ctx'> 	&amp;f2fs_xattr_user_handler,</div><div class='del'>-#ifdef CONFIG_F2FS_FS_POSIX_ACL</div><div class='del'>-	&amp;posix_acl_access_xattr_handler,</div><div class='del'>-	&amp;posix_acl_default_xattr_handler,</div><div class='del'>-#endif</div><div class='ctx'> 	&amp;f2fs_xattr_trusted_handler,</div><div class='ctx'> #ifdef CONFIG_F2FS_FS_SECURITY</div><div class='ctx'> 	&amp;f2fs_xattr_security_handler,</div><div class='hunk'>@@ -216,25 +213,33 @@ const struct xattr_handler *f2fs_xattr_handlers[] = {</div><div class='ctx'> 	NULL,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static inline const struct xattr_handler *f2fs_xattr_handler(int index)</div><div class='add'>+static inline const char *f2fs_xattr_prefix(int index,</div><div class='add'>+					    struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	const struct xattr_handler *handler = NULL;</div><div class='ctx'> </div><div class='ctx'> 	if (index &gt; 0 &amp;&amp; index &lt; ARRAY_SIZE(f2fs_xattr_handler_map))</div><div class='ctx'> 		handler = f2fs_xattr_handler_map[index];</div><div class='del'>-	return handler;</div><div class='add'>+</div><div class='add'>+	if (!xattr_handler_can_list(handler, dentry))</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	return xattr_prefix(handler);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct f2fs_xattr_entry *__find_xattr(void *base_addr,</div><div class='del'>-				void *last_base_addr, int index,</div><div class='del'>-				size_t len, const char *name)</div><div class='add'>+				void *last_base_addr, void **last_addr,</div><div class='add'>+				int index, size_t len, const char *name)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_xattr_entry *entry;</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_xattr(entry, base_addr) {</div><div class='ctx'> 		if ((void *)(entry) + sizeof(__u32) &gt; last_base_addr ||</div><div class='del'>-			(void *)XATTR_NEXT_ENTRY(entry) &gt; last_base_addr)</div><div class='add'>+			(void *)XATTR_NEXT_ENTRY(entry) &gt; last_base_addr) {</div><div class='add'>+			if (last_addr)</div><div class='add'>+				*last_addr = entry;</div><div class='ctx'> 			return NULL;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		if (entry-&gt;e_name_index != index)</div><div class='ctx'> 			continue;</div><div class='hunk'>@@ -254,19 +259,9 @@ static struct f2fs_xattr_entry *__find_inline_xattr(struct inode *inode,</div><div class='ctx'> 	unsigned int inline_size = inline_xattr_size(inode);</div><div class='ctx'> 	void *max_addr = base_addr + inline_size;</div><div class='ctx'> </div><div class='del'>-	list_for_each_xattr(entry, base_addr) {</div><div class='del'>-		if ((void *)entry + sizeof(__u32) &gt; max_addr ||</div><div class='del'>-			(void *)XATTR_NEXT_ENTRY(entry) &gt; max_addr) {</div><div class='del'>-			*last_addr = entry;</div><div class='del'>-			return NULL;</div><div class='del'>-		}</div><div class='del'>-		if (entry-&gt;e_name_index != index)</div><div class='del'>-			continue;</div><div class='del'>-		if (entry-&gt;e_name_len != len)</div><div class='del'>-			continue;</div><div class='del'>-		if (!memcmp(entry-&gt;e_name, name, len))</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='add'>+	entry = __find_xattr(base_addr, max_addr, last_addr, index, len, name);</div><div class='add'>+	if (!entry)</div><div class='add'>+		return NULL;</div><div class='ctx'> </div><div class='ctx'> 	/* inline xattr header or entry across max inline xattr size */</div><div class='ctx'> 	if (IS_XATTR_LAST_ENTRY(entry) &amp;&amp;</div><div class='hunk'>@@ -277,25 +272,25 @@ static struct f2fs_xattr_entry *__find_inline_xattr(struct inode *inode,</div><div class='ctx'> 	return entry;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int read_inline_xattr(struct inode *inode, struct page *ipage,</div><div class='add'>+static int read_inline_xattr(struct inode *inode, struct folio *ifolio,</div><div class='ctx'> 							void *txattr_addr)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	unsigned int inline_size = inline_xattr_size(inode);</div><div class='del'>-	struct page *page = NULL;</div><div class='add'>+	struct folio *folio = NULL;</div><div class='ctx'> 	void *inline_addr;</div><div class='ctx'> </div><div class='del'>-	if (ipage) {</div><div class='del'>-		inline_addr = inline_xattr_addr(inode, ipage);</div><div class='add'>+	if (ifolio) {</div><div class='add'>+		inline_addr = inline_xattr_addr(inode, ifolio);</div><div class='ctx'> 	} else {</div><div class='del'>-		page = f2fs_get_node_page(sbi, inode-&gt;i_ino);</div><div class='del'>-		if (IS_ERR(page))</div><div class='del'>-			return PTR_ERR(page);</div><div class='add'>+		folio = f2fs_get_inode_folio(sbi, inode-&gt;i_ino);</div><div class='add'>+		if (IS_ERR(folio))</div><div class='add'>+			return PTR_ERR(folio);</div><div class='ctx'> </div><div class='del'>-		inline_addr = inline_xattr_addr(inode, page);</div><div class='add'>+		inline_addr = inline_xattr_addr(inode, folio);</div><div class='ctx'> 	}</div><div class='ctx'> 	memcpy(txattr_addr, inline_addr, inline_size);</div><div class='del'>-	f2fs_put_page(page, 1);</div><div class='add'>+	f2fs_folio_put(folio, true);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -305,22 +300,22 @@ static int read_xattr_block(struct inode *inode, void *txattr_addr)</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	nid_t xnid = F2FS_I(inode)-&gt;i_xattr_nid;</div><div class='ctx'> 	unsigned int inline_size = inline_xattr_size(inode);</div><div class='del'>-	struct page *xpage;</div><div class='add'>+	struct folio *xfolio;</div><div class='ctx'> 	void *xattr_addr;</div><div class='ctx'> </div><div class='ctx'> 	/* The inode already has an extended attribute block. */</div><div class='del'>-	xpage = f2fs_get_node_page(sbi, xnid);</div><div class='del'>-	if (IS_ERR(xpage))</div><div class='del'>-		return PTR_ERR(xpage);</div><div class='add'>+	xfolio = f2fs_get_xnode_folio(sbi, xnid);</div><div class='add'>+	if (IS_ERR(xfolio))</div><div class='add'>+		return PTR_ERR(xfolio);</div><div class='ctx'> </div><div class='del'>-	xattr_addr = page_address(xpage);</div><div class='add'>+	xattr_addr = folio_address(xfolio);</div><div class='ctx'> 	memcpy(txattr_addr + inline_size, xattr_addr, VALID_XATTR_BLOCK_SIZE);</div><div class='del'>-	f2fs_put_page(xpage, 1);</div><div class='add'>+	f2fs_folio_put(xfolio, true);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int lookup_all_xattrs(struct inode *inode, struct page *ipage,</div><div class='add'>+static int lookup_all_xattrs(struct inode *inode, struct folio *ifolio,</div><div class='ctx'> 				unsigned int index, unsigned int len,</div><div class='ctx'> 				const char *name, struct f2fs_xattr_entry **xe,</div><div class='ctx'> 				void **base_addr, int *base_size,</div><div class='hunk'>@@ -344,7 +339,7 @@ static int lookup_all_xattrs(struct inode *inode, struct page *ipage,</div><div class='ctx'> </div><div class='ctx'> 	/* read from inline xattr */</div><div class='ctx'> 	if (inline_size) {</div><div class='del'>-		err = read_inline_xattr(inode, ipage, txattr_addr);</div><div class='add'>+		err = read_inline_xattr(inode, ifolio, txattr_addr);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -368,12 +363,14 @@ static int lookup_all_xattrs(struct inode *inode, struct page *ipage,</div><div class='ctx'> 	else</div><div class='ctx'> 		cur_addr = txattr_addr;</div><div class='ctx'> </div><div class='del'>-	*xe = __find_xattr(cur_addr, last_txattr_addr, index, len, name);</div><div class='add'>+	*xe = __find_xattr(cur_addr, last_txattr_addr, NULL, index, len, name);</div><div class='ctx'> 	if (!*xe) {</div><div class='del'>-		f2fs_err(F2FS_I_SB(inode), "inode (%lu) has corrupted xattr",</div><div class='add'>+		f2fs_err(F2FS_I_SB(inode), "lookup inode (%lu) has corrupted xattr",</div><div class='ctx'> 								inode-&gt;i_ino);</div><div class='ctx'> 		set_sbi_flag(F2FS_I_SB(inode), SBI_NEED_FSCK);</div><div class='del'>-		err = -EFSCORRUPTED;</div><div class='add'>+		err = -ENODATA;</div><div class='add'>+		f2fs_handle_error(F2FS_I_SB(inode),</div><div class='add'>+					ERROR_CORRUPTED_XATTR);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> check:</div><div class='hunk'>@@ -389,7 +386,7 @@ out:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int read_all_xattrs(struct inode *inode, struct page *ipage,</div><div class='add'>+static int read_all_xattrs(struct inode *inode, struct folio *ifolio,</div><div class='ctx'> 							void **base_addr)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_xattr_header *header;</div><div class='hunk'>@@ -406,7 +403,7 @@ static int read_all_xattrs(struct inode *inode, struct page *ipage,</div><div class='ctx'> </div><div class='ctx'> 	/* read from inline xattr */</div><div class='ctx'> 	if (inline_size) {</div><div class='del'>-		err = read_inline_xattr(inode, ipage, txattr_addr);</div><div class='add'>+		err = read_inline_xattr(inode, ifolio, txattr_addr);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto fail;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -433,14 +430,14 @@ fail:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int write_all_xattrs(struct inode *inode, __u32 hsize,</div><div class='del'>-				void *txattr_addr, struct page *ipage)</div><div class='add'>+				void *txattr_addr, struct folio *ifolio)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	size_t inline_size = inline_xattr_size(inode);</div><div class='del'>-	struct page *in_page = NULL;</div><div class='add'>+	struct folio *in_folio = NULL;</div><div class='ctx'> 	void *xattr_addr;</div><div class='ctx'> 	void *inline_addr = NULL;</div><div class='del'>-	struct page *xpage;</div><div class='add'>+	struct folio *xfolio;</div><div class='ctx'> 	nid_t new_nid = 0;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -450,73 +447,73 @@ static inline int write_all_xattrs(struct inode *inode, __u32 hsize,</div><div class='ctx'> </div><div class='ctx'> 	/* write to inline xattr */</div><div class='ctx'> 	if (inline_size) {</div><div class='del'>-		if (ipage) {</div><div class='del'>-			inline_addr = inline_xattr_addr(inode, ipage);</div><div class='add'>+		if (ifolio) {</div><div class='add'>+			inline_addr = inline_xattr_addr(inode, ifolio);</div><div class='ctx'> 		} else {</div><div class='del'>-			in_page = f2fs_get_node_page(sbi, inode-&gt;i_ino);</div><div class='del'>-			if (IS_ERR(in_page)) {</div><div class='add'>+			in_folio = f2fs_get_inode_folio(sbi, inode-&gt;i_ino);</div><div class='add'>+			if (IS_ERR(in_folio)) {</div><div class='ctx'> 				f2fs_alloc_nid_failed(sbi, new_nid);</div><div class='del'>-				return PTR_ERR(in_page);</div><div class='add'>+				return PTR_ERR(in_folio);</div><div class='ctx'> 			}</div><div class='del'>-			inline_addr = inline_xattr_addr(inode, in_page);</div><div class='add'>+			inline_addr = inline_xattr_addr(inode, in_folio);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		f2fs_wait_on_page_writeback(ipage ? ipage : in_page,</div><div class='add'>+		f2fs_folio_wait_writeback(ifolio ? ifolio : in_folio,</div><div class='ctx'> 							NODE, true, true);</div><div class='ctx'> 		/* no need to use xattr node block */</div><div class='ctx'> 		if (hsize &lt;= inline_size) {</div><div class='ctx'> 			err = f2fs_truncate_xattr_node(inode);</div><div class='ctx'> 			f2fs_alloc_nid_failed(sbi, new_nid);</div><div class='ctx'> 			if (err) {</div><div class='del'>-				f2fs_put_page(in_page, 1);</div><div class='add'>+				f2fs_folio_put(in_folio, true);</div><div class='ctx'> 				return err;</div><div class='ctx'> 			}</div><div class='ctx'> 			memcpy(inline_addr, txattr_addr, inline_size);</div><div class='del'>-			set_page_dirty(ipage ? ipage : in_page);</div><div class='add'>+			folio_mark_dirty(ifolio ? ifolio : in_folio);</div><div class='ctx'> 			goto in_page_out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* write to xattr node block */</div><div class='ctx'> 	if (F2FS_I(inode)-&gt;i_xattr_nid) {</div><div class='del'>-		xpage = f2fs_get_node_page(sbi, F2FS_I(inode)-&gt;i_xattr_nid);</div><div class='del'>-		if (IS_ERR(xpage)) {</div><div class='del'>-			err = PTR_ERR(xpage);</div><div class='add'>+		xfolio = f2fs_get_xnode_folio(sbi, F2FS_I(inode)-&gt;i_xattr_nid);</div><div class='add'>+		if (IS_ERR(xfolio)) {</div><div class='add'>+			err = PTR_ERR(xfolio);</div><div class='ctx'> 			f2fs_alloc_nid_failed(sbi, new_nid);</div><div class='ctx'> 			goto in_page_out;</div><div class='ctx'> 		}</div><div class='ctx'> 		f2fs_bug_on(sbi, new_nid);</div><div class='del'>-		f2fs_wait_on_page_writeback(xpage, NODE, true, true);</div><div class='add'>+		f2fs_folio_wait_writeback(xfolio, NODE, true, true);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		struct dnode_of_data dn;</div><div class='ctx'> </div><div class='ctx'> 		set_new_dnode(&amp;dn, inode, NULL, NULL, new_nid);</div><div class='del'>-		xpage = f2fs_new_node_page(&amp;dn, XATTR_NODE_OFFSET);</div><div class='del'>-		if (IS_ERR(xpage)) {</div><div class='del'>-			err = PTR_ERR(xpage);</div><div class='add'>+		xfolio = f2fs_new_node_folio(&amp;dn, XATTR_NODE_OFFSET);</div><div class='add'>+		if (IS_ERR(xfolio)) {</div><div class='add'>+			err = PTR_ERR(xfolio);</div><div class='ctx'> 			f2fs_alloc_nid_failed(sbi, new_nid);</div><div class='ctx'> 			goto in_page_out;</div><div class='ctx'> 		}</div><div class='ctx'> 		f2fs_alloc_nid_done(sbi, new_nid);</div><div class='ctx'> 	}</div><div class='del'>-	xattr_addr = page_address(xpage);</div><div class='add'>+	xattr_addr = folio_address(xfolio);</div><div class='ctx'> </div><div class='ctx'> 	if (inline_size)</div><div class='ctx'> 		memcpy(inline_addr, txattr_addr, inline_size);</div><div class='ctx'> 	memcpy(xattr_addr, txattr_addr + inline_size, VALID_XATTR_BLOCK_SIZE);</div><div class='ctx'> </div><div class='ctx'> 	if (inline_size)</div><div class='del'>-		set_page_dirty(ipage ? ipage : in_page);</div><div class='del'>-	set_page_dirty(xpage);</div><div class='add'>+		folio_mark_dirty(ifolio ? ifolio : in_folio);</div><div class='add'>+	folio_mark_dirty(xfolio);</div><div class='ctx'> </div><div class='del'>-	f2fs_put_page(xpage, 1);</div><div class='add'>+	f2fs_folio_put(xfolio, true);</div><div class='ctx'> in_page_out:</div><div class='del'>-	f2fs_put_page(in_page, 1);</div><div class='add'>+	f2fs_folio_put(in_folio, true);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int f2fs_getxattr(struct inode *inode, int index, const char *name,</div><div class='del'>-		void *buffer, size_t buffer_size, struct page *ipage)</div><div class='add'>+		void *buffer, size_t buffer_size, struct folio *ifolio)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_xattr_entry *entry = NULL;</div><div class='ctx'> 	int error;</div><div class='hunk'>@@ -532,10 +529,12 @@ int f2fs_getxattr(struct inode *inode, int index, const char *name,</div><div class='ctx'> 	if (len &gt; F2FS_NAME_LEN)</div><div class='ctx'> 		return -ERANGE;</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;F2FS_I(inode)-&gt;i_xattr_sem);</div><div class='del'>-	error = lookup_all_xattrs(inode, ipage, index, len, name,</div><div class='add'>+	if (!ifolio)</div><div class='add'>+		f2fs_down_read(&amp;F2FS_I(inode)-&gt;i_xattr_sem);</div><div class='add'>+	error = lookup_all_xattrs(inode, ifolio, index, len, name,</div><div class='ctx'> 				&amp;entry, &amp;base_addr, &amp;base_size, &amp;is_inline);</div><div class='del'>-	up_read(&amp;F2FS_I(inode)-&gt;i_xattr_sem);</div><div class='add'>+	if (!ifolio)</div><div class='add'>+		f2fs_up_read(&amp;F2FS_I(inode)-&gt;i_xattr_sem);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='hunk'>@@ -569,34 +568,34 @@ ssize_t f2fs_listxattr(struct dentry *dentry, char *buffer, size_t buffer_size)</div><div class='ctx'> 	int error;</div><div class='ctx'> 	size_t rest = buffer_size;</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;F2FS_I(inode)-&gt;i_xattr_sem);</div><div class='add'>+	f2fs_down_read(&amp;F2FS_I(inode)-&gt;i_xattr_sem);</div><div class='ctx'> 	error = read_all_xattrs(inode, NULL, &amp;base_addr);</div><div class='del'>-	up_read(&amp;F2FS_I(inode)-&gt;i_xattr_sem);</div><div class='add'>+	f2fs_up_read(&amp;F2FS_I(inode)-&gt;i_xattr_sem);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='ctx'> 	last_base_addr = (void *)base_addr + XATTR_SIZE(inode);</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_xattr(entry, base_addr) {</div><div class='del'>-		const struct xattr_handler *handler =</div><div class='del'>-			f2fs_xattr_handler(entry-&gt;e_name_index);</div><div class='ctx'> 		const char *prefix;</div><div class='ctx'> 		size_t prefix_len;</div><div class='ctx'> 		size_t size;</div><div class='ctx'> </div><div class='add'>+		prefix = f2fs_xattr_prefix(entry-&gt;e_name_index, dentry);</div><div class='add'>+</div><div class='ctx'> 		if ((void *)(entry) + sizeof(__u32) &gt; last_base_addr ||</div><div class='ctx'> 			(void *)XATTR_NEXT_ENTRY(entry) &gt; last_base_addr) {</div><div class='del'>-			f2fs_err(F2FS_I_SB(inode), "inode (%lu) has corrupted xattr",</div><div class='add'>+			f2fs_err(F2FS_I_SB(inode), "list inode (%lu) has corrupted xattr",</div><div class='ctx'> 						inode-&gt;i_ino);</div><div class='ctx'> 			set_sbi_flag(F2FS_I_SB(inode), SBI_NEED_FSCK);</div><div class='del'>-			error = -EFSCORRUPTED;</div><div class='del'>-			goto cleanup;</div><div class='add'>+			f2fs_handle_error(F2FS_I_SB(inode),</div><div class='add'>+						ERROR_CORRUPTED_XATTR);</div><div class='add'>+			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (!handler || (handler-&gt;list &amp;&amp; !handler-&gt;list(dentry)))</div><div class='add'>+		if (!prefix)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		prefix = xattr_prefix(handler);</div><div class='ctx'> 		prefix_len = strlen(prefix);</div><div class='ctx'> 		size = prefix_len + entry-&gt;e_name_len + 1;</div><div class='ctx'> 		if (buffer) {</div><div class='hunk'>@@ -629,8 +628,9 @@ static bool f2fs_xattr_value_same(struct f2fs_xattr_entry *entry,</div><div class='ctx'> </div><div class='ctx'> static int __f2fs_setxattr(struct inode *inode, int index,</div><div class='ctx'> 			const char *name, const void *value, size_t size,</div><div class='del'>-			struct page *ipage, int flags)</div><div class='add'>+			struct folio *ifolio, int flags)</div><div class='ctx'> {</div><div class='add'>+	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	struct f2fs_xattr_entry *here, *last;</div><div class='ctx'> 	void *base_addr, *last_base_addr;</div><div class='ctx'> 	int found, newsize;</div><div class='hunk'>@@ -651,20 +651,32 @@ static int __f2fs_setxattr(struct inode *inode, int index,</div><div class='ctx'> </div><div class='ctx'> 	if (size &gt; MAX_VALUE_LEN(inode))</div><div class='ctx'> 		return -E2BIG;</div><div class='del'>-</div><div class='del'>-	error = read_all_xattrs(inode, ipage, &amp;base_addr);</div><div class='add'>+retry:</div><div class='add'>+	error = read_all_xattrs(inode, ifolio, &amp;base_addr);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='ctx'> 	last_base_addr = (void *)base_addr + XATTR_SIZE(inode);</div><div class='ctx'> </div><div class='ctx'> 	/* find entry with wanted name. */</div><div class='del'>-	here = __find_xattr(base_addr, last_base_addr, index, len, name);</div><div class='add'>+	here = __find_xattr(base_addr, last_base_addr, NULL, index, len, name);</div><div class='ctx'> 	if (!here) {</div><div class='del'>-		f2fs_err(F2FS_I_SB(inode), "inode (%lu) has corrupted xattr",</div><div class='add'>+		if (!F2FS_I(inode)-&gt;i_xattr_nid) {</div><div class='add'>+			error = f2fs_recover_xattr_data(inode, NULL);</div><div class='add'>+			f2fs_notice(F2FS_I_SB(inode),</div><div class='add'>+				"recover xattr in inode (%lu), error(%d)",</div><div class='add'>+					inode-&gt;i_ino, error);</div><div class='add'>+			if (!error) {</div><div class='add'>+				kfree(base_addr);</div><div class='add'>+				goto retry;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+		f2fs_err(F2FS_I_SB(inode), "set inode (%lu) has corrupted xattr",</div><div class='ctx'> 								inode-&gt;i_ino);</div><div class='ctx'> 		set_sbi_flag(F2FS_I_SB(inode), SBI_NEED_FSCK);</div><div class='ctx'> 		error = -EFSCORRUPTED;</div><div class='add'>+		f2fs_handle_error(F2FS_I_SB(inode),</div><div class='add'>+					ERROR_CORRUPTED_XATTR);</div><div class='ctx'> 		goto exit;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -684,8 +696,19 @@ static int __f2fs_setxattr(struct inode *inode, int index,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	last = here;</div><div class='del'>-	while (!IS_XATTR_LAST_ENTRY(last))</div><div class='add'>+	while (!IS_XATTR_LAST_ENTRY(last)) {</div><div class='add'>+		if ((void *)(last) + sizeof(__u32) &gt; last_base_addr ||</div><div class='add'>+			(void *)XATTR_NEXT_ENTRY(last) &gt; last_base_addr) {</div><div class='add'>+			f2fs_err(F2FS_I_SB(inode), "inode (%lu) has invalid last xattr entry, entry_size: %zu",</div><div class='add'>+					inode-&gt;i_ino, ENTRY_SIZE(last));</div><div class='add'>+			set_sbi_flag(F2FS_I_SB(inode), SBI_NEED_FSCK);</div><div class='add'>+			error = -EFSCORRUPTED;</div><div class='add'>+			f2fs_handle_error(F2FS_I_SB(inode),</div><div class='add'>+						ERROR_CORRUPTED_XATTR);</div><div class='add'>+			goto exit;</div><div class='add'>+		}</div><div class='ctx'> 		last = XATTR_NEXT_ENTRY(last);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	newsize = XATTR_ALIGN(sizeof(struct f2fs_xattr_entry) + len + size);</div><div class='ctx'> </div><div class='hunk'>@@ -736,26 +759,41 @@ static int __f2fs_setxattr(struct inode *inode, int index,</div><div class='ctx'> 		memcpy(pval, value, size);</div><div class='ctx'> 		last-&gt;e_value_size = cpu_to_le16(size);</div><div class='ctx'> 		new_hsize += newsize;</div><div class='add'>+		/*</div><div class='add'>+		 * Explicitly add the null terminator.  The unused xattr space</div><div class='add'>+		 * is supposed to always be zeroed, which would make this</div><div class='add'>+		 * unnecessary, but don't depend on that.</div><div class='add'>+		 */</div><div class='add'>+		*(u32 *)((u8 *)last + newsize) = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	error = write_all_xattrs(inode, new_hsize, base_addr, ipage);</div><div class='add'>+	error = write_all_xattrs(inode, new_hsize, base_addr, ifolio);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto exit;</div><div class='ctx'> </div><div class='ctx'> 	if (index == F2FS_XATTR_INDEX_ENCRYPTION &amp;&amp;</div><div class='ctx'> 			!strcmp(name, F2FS_XATTR_NAME_ENCRYPTION_CONTEXT))</div><div class='ctx'> 		f2fs_set_encrypted_inode(inode);</div><div class='del'>-	f2fs_mark_inode_dirty_sync(inode, true);</div><div class='del'>-	if (!error &amp;&amp; S_ISDIR(inode-&gt;i_mode))</div><div class='del'>-		set_sbi_flag(F2FS_I_SB(inode), SBI_NEED_CP);</div><div class='ctx'> </div><div class='add'>+	if (!S_ISDIR(inode-&gt;i_mode))</div><div class='add'>+		goto same;</div><div class='add'>+	/*</div><div class='add'>+	 * In restrict mode, fsync() always try to trigger checkpoint for all</div><div class='add'>+	 * metadata consistency, in other mode, it triggers checkpoint when</div><div class='add'>+	 * parent's xattr metadata was updated.</div><div class='add'>+	 */</div><div class='add'>+	if (F2FS_OPTION(sbi).fsync_mode == FSYNC_MODE_STRICT)</div><div class='add'>+		set_sbi_flag(sbi, SBI_NEED_CP);</div><div class='add'>+	else</div><div class='add'>+		f2fs_add_ino_entry(sbi, inode-&gt;i_ino, XATTR_DIR_INO);</div><div class='ctx'> same:</div><div class='ctx'> 	if (is_inode_flag_set(inode, FI_ACL_MODE)) {</div><div class='ctx'> 		inode-&gt;i_mode = F2FS_I(inode)-&gt;i_acl_mode;</div><div class='del'>-		inode-&gt;i_ctime = current_time(inode);</div><div class='ctx'> 		clear_inode_flag(inode, FI_ACL_MODE);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='add'>+	f2fs_mark_inode_dirty_sync(inode, true);</div><div class='ctx'> exit:</div><div class='ctx'> 	kfree(base_addr);</div><div class='ctx'> 	return error;</div><div class='hunk'>@@ -763,7 +801,7 @@ exit:</div><div class='ctx'> </div><div class='ctx'> int f2fs_setxattr(struct inode *inode, int index, const char *name,</div><div class='ctx'> 				const void *value, size_t size,</div><div class='del'>-				struct page *ipage, int flags)</div><div class='add'>+				struct folio *ifolio, int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct f2fs_sb_info *sbi = F2FS_I_SB(inode);</div><div class='ctx'> 	int err;</div><div class='hunk'>@@ -778,40 +816,29 @@ int f2fs_setxattr(struct inode *inode, int index, const char *name,</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='ctx'> 	/* this case is only from f2fs_init_inode_metadata */</div><div class='del'>-	if (ipage)</div><div class='add'>+	if (ifolio)</div><div class='ctx'> 		return __f2fs_setxattr(inode, index, name, value,</div><div class='del'>-						size, ipage, flags);</div><div class='add'>+						size, ifolio, flags);</div><div class='ctx'> 	f2fs_balance_fs(sbi, true);</div><div class='ctx'> </div><div class='ctx'> 	f2fs_lock_op(sbi);</div><div class='del'>-	down_write(&amp;F2FS_I(inode)-&gt;i_xattr_sem);</div><div class='del'>-	err = __f2fs_setxattr(inode, index, name, value, size, ipage, flags);</div><div class='del'>-	up_write(&amp;F2FS_I(inode)-&gt;i_xattr_sem);</div><div class='add'>+	f2fs_down_write(&amp;F2FS_I(inode)-&gt;i_xattr_sem);</div><div class='add'>+	err = __f2fs_setxattr(inode, index, name, value, size, NULL, flags);</div><div class='add'>+	f2fs_up_write(&amp;F2FS_I(inode)-&gt;i_xattr_sem);</div><div class='ctx'> 	f2fs_unlock_op(sbi);</div><div class='ctx'> </div><div class='ctx'> 	f2fs_update_time(sbi, REQ_TIME);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int f2fs_init_xattr_caches(struct f2fs_sb_info *sbi)</div><div class='add'>+int __init f2fs_init_xattr_cache(void)</div><div class='ctx'> {</div><div class='del'>-	dev_t dev = sbi-&gt;sb-&gt;s_bdev-&gt;bd_dev;</div><div class='del'>-	char slab_name[32];</div><div class='del'>-</div><div class='del'>-	sprintf(slab_name, "f2fs_xattr_entry-%u:%u", MAJOR(dev), MINOR(dev));</div><div class='del'>-</div><div class='del'>-	sbi-&gt;inline_xattr_slab_size = F2FS_OPTION(sbi).inline_xattr_size *</div><div class='del'>-					sizeof(__le32) + XATTR_PADDING_SIZE;</div><div class='del'>-</div><div class='del'>-	sbi-&gt;inline_xattr_slab = f2fs_kmem_cache_create(slab_name,</div><div class='del'>-					sbi-&gt;inline_xattr_slab_size);</div><div class='del'>-	if (!sbi-&gt;inline_xattr_slab)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='add'>+	inline_xattr_slab = f2fs_kmem_cache_create("f2fs_xattr_entry",</div><div class='add'>+					DEFAULT_XATTR_SLAB_SIZE);</div><div class='add'>+	return inline_xattr_slab ? 0 : -ENOMEM;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void f2fs_destroy_xattr_caches(struct f2fs_sb_info *sbi)</div><div class='add'>+void f2fs_destroy_xattr_cache(void)</div><div class='ctx'> {</div><div class='del'>-	kmem_cache_destroy(sbi-&gt;inline_xattr_slab);</div><div class='del'>-}</div><div class='add'>+	kmem_cache_destroy(inline_xattr_slab);</div><div class='add'>+}
\ No newline at end of file</div><div class='head'>diff --git a/fs/f2fs/xattr.h b/fs/f2fs/xattr.h<br/>index 416d652774a3..bce3d93e4755 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/f2fs/xattr.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/f2fs/xattr.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/f2fs/xattr.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/f2fs/xattr.h</a></div><div class='hunk'>@@ -83,11 +83,14 @@ struct f2fs_xattr_entry {</div><div class='ctx'> 				sizeof(struct f2fs_xattr_header) -	\</div><div class='ctx'> 				sizeof(struct f2fs_xattr_entry))</div><div class='ctx'> </div><div class='add'>+#define MIN_INLINE_XATTR_SIZE (sizeof(struct f2fs_xattr_header) / sizeof(__le32))</div><div class='ctx'> #define MAX_INLINE_XATTR_SIZE						\</div><div class='ctx'> 			(DEF_ADDRS_PER_INODE -				\</div><div class='ctx'> 			F2FS_TOTAL_EXTRA_ATTR_SIZE / sizeof(__le32) -	\</div><div class='ctx'> 			DEF_INLINE_RESERVED_SIZE -			\</div><div class='ctx'> 			MIN_INLINE_DENTRY_SIZE / sizeof(__le32))</div><div class='add'>+#define DEFAULT_XATTR_SLAB_SIZE	(DEFAULT_INLINE_XATTR_ADDRS *		\</div><div class='add'>+				sizeof(__le32) + XATTR_PADDING_SIZE)</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * On-disk structure of f2fs_xattr</div><div class='hunk'>@@ -124,41 +127,41 @@ extern const struct xattr_handler f2fs_xattr_trusted_handler;</div><div class='ctx'> extern const struct xattr_handler f2fs_xattr_advise_handler;</div><div class='ctx'> extern const struct xattr_handler f2fs_xattr_security_handler;</div><div class='ctx'> </div><div class='del'>-extern const struct xattr_handler *f2fs_xattr_handlers[];</div><div class='add'>+extern const struct xattr_handler * const f2fs_xattr_handlers[];</div><div class='ctx'> </div><div class='del'>-extern int f2fs_setxattr(struct inode *, int, const char *,</div><div class='del'>-				const void *, size_t, struct page *, int);</div><div class='del'>-extern int f2fs_getxattr(struct inode *, int, const char *, void *,</div><div class='del'>-						size_t, struct page *);</div><div class='del'>-extern ssize_t f2fs_listxattr(struct dentry *, char *, size_t);</div><div class='del'>-extern int f2fs_init_xattr_caches(struct f2fs_sb_info *);</div><div class='del'>-extern void f2fs_destroy_xattr_caches(struct f2fs_sb_info *);</div><div class='add'>+int f2fs_setxattr(struct inode *, int, const char *, const void *,</div><div class='add'>+		size_t, struct folio *, int);</div><div class='add'>+int f2fs_getxattr(struct inode *, int, const char *, void *,</div><div class='add'>+		size_t, struct folio *);</div><div class='add'>+ssize_t f2fs_listxattr(struct dentry *, char *, size_t);</div><div class='add'>+int __init f2fs_init_xattr_cache(void);</div><div class='add'>+void f2fs_destroy_xattr_cache(void);</div><div class='ctx'> #else</div><div class='ctx'> </div><div class='ctx'> #define f2fs_xattr_handlers	NULL</div><div class='ctx'> #define f2fs_listxattr		NULL</div><div class='ctx'> static inline int f2fs_setxattr(struct inode *inode, int index,</div><div class='ctx'> 		const char *name, const void *value, size_t size,</div><div class='del'>-		struct page *page, int flags)</div><div class='add'>+		struct folio *folio, int flags)</div><div class='ctx'> {</div><div class='ctx'> 	return -EOPNOTSUPP;</div><div class='ctx'> }</div><div class='ctx'> static inline int f2fs_getxattr(struct inode *inode, int index,</div><div class='ctx'> 			const char *name, void *buffer,</div><div class='del'>-			size_t buffer_size, struct page *dpage)</div><div class='add'>+			size_t buffer_size, struct folio *dfolio)</div><div class='ctx'> {</div><div class='ctx'> 	return -EOPNOTSUPP;</div><div class='ctx'> }</div><div class='del'>-static inline int f2fs_init_xattr_caches(struct f2fs_sb_info *sbi) { return 0; }</div><div class='del'>-static inline void f2fs_destroy_xattr_caches(struct f2fs_sb_info *sbi) { }</div><div class='add'>+static inline int __init f2fs_init_xattr_cache(void) { return 0; }</div><div class='add'>+static inline void f2fs_destroy_xattr_cache(void) { }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_F2FS_FS_SECURITY</div><div class='del'>-extern int f2fs_init_security(struct inode *, struct inode *,</div><div class='del'>-				const struct qstr *, struct page *);</div><div class='add'>+int f2fs_init_security(struct inode *, struct inode *,</div><div class='add'>+				const struct qstr *, struct folio *);</div><div class='ctx'> #else</div><div class='ctx'> static inline int f2fs_init_security(struct inode *inode, struct inode *dir,</div><div class='del'>-				const struct qstr *qstr, struct page *ipage)</div><div class='add'>+				const struct qstr *qstr, struct folio *ifolio)</div><div class='ctx'> {</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/fat/Kconfig b/fs/fat/Kconfig<br/>index 238cc55f84c4..25fae1c83725 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fat/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fat/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fat/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fat/Kconfig</a></div><div class='hunk'>@@ -1,7 +1,9 @@</div><div class='ctx'> # SPDX-License-Identifier: GPL-2.0-only</div><div class='ctx'> config FAT_FS</div><div class='ctx'> 	tristate</div><div class='add'>+	select BUFFER_HEAD</div><div class='ctx'> 	select NLS</div><div class='add'>+	select LEGACY_DIRECT_IO</div><div class='ctx'> 	help</div><div class='ctx'> 	  If you want to use one of the FAT-based file systems (the MS-DOS and</div><div class='ctx'> 	  VFAT (Windows 95) file systems), then you must say Y or M here</div><div class='head'>diff --git a/fs/fat/cache.c b/fs/fat/cache.c<br/>index 738e427e2d21..2af424e200b3 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fat/cache.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fat/cache.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fat/cache.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fat/cache.c</a></div><div class='hunk'>@@ -47,7 +47,7 @@ int __init fat_cache_init(void)</div><div class='ctx'> {</div><div class='ctx'> 	fat_cache_cachep = kmem_cache_create("fat_cache",</div><div class='ctx'> 				sizeof(struct fat_cache),</div><div class='del'>-				0, SLAB_RECLAIM_ACCOUNT|SLAB_MEM_SPREAD,</div><div class='add'>+				0, SLAB_RECLAIM_ACCOUNT,</div><div class='ctx'> 				init_once);</div><div class='ctx'> 	if (fat_cache_cachep == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='head'>diff --git a/fs/fat/dir.c b/fs/fat/dir.c<br/>index c4a274285858..92b091783966 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fat/dir.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fat/dir.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fat/dir.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fat/dir.c</a></div><div class='hunk'>@@ -269,6 +269,18 @@ enum { PARSE_INVALID = 1, PARSE_NOT_LONGNAME, PARSE_EOF, };</div><div class='ctx'> /**</div><div class='ctx'>  * fat_parse_long - Parse extended directory entry.</div><div class='ctx'>  *</div><div class='add'>+ * @dir: Pointer to the inode that represents the directory.</div><div class='add'>+ * @pos: On input, contains the starting position to read from.</div><div class='add'>+ *       On output, updated with the new position.</div><div class='add'>+ * @bh: Pointer to the buffer head that may be used for reading directory</div><div class='add'>+ *	 entries. May be updated.</div><div class='add'>+ * @de: On input, points to the current directory entry.</div><div class='add'>+ *      On output, points to the next directory entry.</div><div class='add'>+ * @unicode: Pointer to a buffer where the parsed Unicode long filename will be</div><div class='add'>+ *	      stored.</div><div class='add'>+ * @nr_slots: Pointer to a variable that will store the number of longname</div><div class='add'>+ *	       slots found.</div><div class='add'>+ *</div><div class='ctx'>  * This function returns zero on success, negative value on error, or one of</div><div class='ctx'>  * the following:</div><div class='ctx'>  *</div><div class='hunk'>@@ -705,7 +717,7 @@ static int fat_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #define FAT_IOCTL_FILLDIR_FUNC(func, dirent_type)			   \</div><div class='del'>-static int func(struct dir_context *ctx, const char *name, int name_len,   \</div><div class='add'>+static bool func(struct dir_context *ctx, const char *name, int name_len,  \</div><div class='ctx'> 			     loff_t offset, u64 ino, unsigned int d_type)  \</div><div class='ctx'> {									   \</div><div class='ctx'> 	struct fat_ioctl_filldir_callback *buf =			   \</div><div class='hunk'>@@ -714,7 +726,7 @@ static int func(struct dir_context *ctx, const char *name, int name_len,   \</div><div class='ctx'> 	struct dirent_type __user *d2 = d1 + 1;				   \</div><div class='ctx'> 									   \</div><div class='ctx'> 	if (buf-&gt;result)						   \</div><div class='del'>-		return -EINVAL;						   \</div><div class='add'>+		return false;						   \</div><div class='ctx'> 	buf-&gt;result++;							   \</div><div class='ctx'> 									   \</div><div class='ctx'> 	if (name != NULL) {						   \</div><div class='hunk'>@@ -722,7 +734,7 @@ static int func(struct dir_context *ctx, const char *name, int name_len,   \</div><div class='ctx'> 		if (name_len &gt;= sizeof(d1-&gt;d_name))			   \</div><div class='ctx'> 			name_len = sizeof(d1-&gt;d_name) - 1;		   \</div><div class='ctx'> 									   \</div><div class='del'>-		if (put_user(0, d2-&gt;d_name)			||	   \</div><div class='add'>+		if (put_user(0, &amp;d2-&gt;d_name[0])			||	   \</div><div class='ctx'> 		    put_user(0, &amp;d2-&gt;d_reclen)			||	   \</div><div class='ctx'> 		    copy_to_user(d1-&gt;d_name, name, name_len)	||	   \</div><div class='ctx'> 		    put_user(0, d1-&gt;d_name + name_len)		||	   \</div><div class='hunk'>@@ -750,10 +762,10 @@ static int func(struct dir_context *ctx, const char *name, int name_len,   \</div><div class='ctx'> 		    put_user(short_len, &amp;d1-&gt;d_reclen))			   \</div><div class='ctx'> 			goto efault;					   \</div><div class='ctx'> 	}								   \</div><div class='del'>-	return 0;							   \</div><div class='add'>+	return true;							   \</div><div class='ctx'> efault:									   \</div><div class='ctx'> 	buf-&gt;result = -EFAULT;						   \</div><div class='del'>-	return -EFAULT;							   \</div><div class='add'>+	return false;							   \</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> FAT_IOCTL_FILLDIR_FUNC(fat_ioctl_filldir, __fat_dirent)</div><div class='hunk'>@@ -1197,7 +1209,7 @@ EXPORT_SYMBOL_GPL(fat_alloc_new_dir);</div><div class='ctx'> </div><div class='ctx'> static int fat_add_new_entries(struct inode *dir, void *slots, int nr_slots,</div><div class='ctx'> 			       int *nr_cluster, struct msdos_dir_entry **de,</div><div class='del'>-			       struct buffer_head **bh, loff_t *i_pos)</div><div class='add'>+			       struct buffer_head **bh)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = dir-&gt;i_sb;</div><div class='ctx'> 	struct msdos_sb_info *sbi = MSDOS_SB(sb);</div><div class='hunk'>@@ -1257,7 +1269,6 @@ static int fat_add_new_entries(struct inode *dir, void *slots, int nr_slots,</div><div class='ctx'> 	get_bh(bhs[n]);</div><div class='ctx'> 	*bh = bhs[n];</div><div class='ctx'> 	*de = (struct msdos_dir_entry *)((*bh)-&gt;b_data + offset);</div><div class='del'>-	*i_pos = fat_make_i_pos(sb, *bh, *de);</div><div class='ctx'> </div><div class='ctx'> 	/* Second stage: clear the rest of cluster, and write outs */</div><div class='ctx'> 	err = fat_zeroed_cluster(dir, start_blknr, ++n, bhs, MAX_BUF_PER_PAGE);</div><div class='hunk'>@@ -1286,7 +1297,7 @@ int fat_add_entries(struct inode *dir, void *slots, int nr_slots,</div><div class='ctx'> 	struct buffer_head *bh, *prev, *bhs[3]; /* 32*slots (672bytes) */</div><div class='ctx'> 	struct msdos_dir_entry *de;</div><div class='ctx'> 	int err, free_slots, i, nr_bhs;</div><div class='del'>-	loff_t pos, i_pos;</div><div class='add'>+	loff_t pos;</div><div class='ctx'> </div><div class='ctx'> 	sinfo-&gt;nr_slots = nr_slots;</div><div class='ctx'> </div><div class='hunk'>@@ -1374,7 +1385,7 @@ found:</div><div class='ctx'> 		 * add the cluster to dir.</div><div class='ctx'> 		 */</div><div class='ctx'> 		cluster = fat_add_new_entries(dir, slots, nr_slots, &amp;nr_cluster,</div><div class='del'>-					      &amp;de, &amp;bh, &amp;i_pos);</div><div class='add'>+					      &amp;de, &amp;bh);</div><div class='ctx'> 		if (cluster &lt; 0) {</div><div class='ctx'> 			err = cluster;</div><div class='ctx'> 			goto error_remove;</div><div class='head'>diff --git a/fs/fat/fat.h b/fs/fat/fat.h<br/>index 02d4d4234956..d3e426de5f01 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fat/fat.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fat/fat.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fat/fat.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fat/fat.h</a></div><div class='hunk'>@@ -7,6 +7,8 @@</div><div class='ctx'> #include &lt;linux/hash.h&gt;</div><div class='ctx'> #include &lt;linux/ratelimit.h&gt;</div><div class='ctx'> #include &lt;linux/msdos_fs.h&gt;</div><div class='add'>+#include &lt;linux/fs_context.h&gt;</div><div class='add'>+#include &lt;linux/fs_parser.h&gt;</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * vfat shortname flags</div><div class='hunk'>@@ -51,7 +53,8 @@ struct fat_mount_options {</div><div class='ctx'> 		 tz_set:1,	   /* Filesystem timestamps' offset set */</div><div class='ctx'> 		 rodir:1,	   /* allow ATTR_RO for directory */</div><div class='ctx'> 		 discard:1,	   /* Issue discard requests on deletions */</div><div class='del'>-		 dos1xfloppy:1;	   /* Assume default BPB for DOS 1.x floppies */</div><div class='add'>+		 dos1xfloppy:1,	   /* Assume default BPB for DOS 1.x floppies */</div><div class='add'>+		 debug:1;	   /* Not currently used */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> #define FAT_HASH_BITS	8</div><div class='hunk'>@@ -126,6 +129,7 @@ struct msdos_inode_info {</div><div class='ctx'> 	struct hlist_node i_fat_hash;	/* hash by i_location */</div><div class='ctx'> 	struct hlist_node i_dir_hash;	/* hash by i_logstart */</div><div class='ctx'> 	struct rw_semaphore truncate_lock; /* protect bmap against truncate */</div><div class='add'>+	struct timespec64 i_crtime;	/* File creation (birth) time */</div><div class='ctx'> 	struct inode vfs_inode;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -397,10 +401,10 @@ extern long fat_generic_ioctl(struct file *filp, unsigned int cmd,</div><div class='ctx'> 			      unsigned long arg);</div><div class='ctx'> extern const struct file_operations fat_file_operations;</div><div class='ctx'> extern const struct inode_operations fat_file_inode_operations;</div><div class='del'>-extern int fat_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='add'>+extern int fat_setattr(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		       struct iattr *attr);</div><div class='ctx'> extern void fat_truncate_blocks(struct inode *inode, loff_t offset);</div><div class='del'>-extern int fat_getattr(struct user_namespace *mnt_userns,</div><div class='add'>+extern int fat_getattr(struct mnt_idmap *idmap,</div><div class='ctx'> 		       const struct path *path, struct kstat *stat,</div><div class='ctx'> 		       u32 request_mask, unsigned int flags);</div><div class='ctx'> extern int fat_file_fsync(struct file *file, loff_t start, loff_t end,</div><div class='hunk'>@@ -414,12 +418,21 @@ extern struct inode *fat_iget(struct super_block *sb, loff_t i_pos);</div><div class='ctx'> extern struct inode *fat_build_inode(struct super_block *sb,</div><div class='ctx'> 			struct msdos_dir_entry *de, loff_t i_pos);</div><div class='ctx'> extern int fat_sync_inode(struct inode *inode);</div><div class='del'>-extern int fat_fill_super(struct super_block *sb, void *data, int silent,</div><div class='del'>-			  int isvfat, void (*setup)(struct super_block *));</div><div class='add'>+extern int fat_fill_super(struct super_block *sb, struct fs_context *fc,</div><div class='add'>+			  void (*setup)(struct super_block *));</div><div class='ctx'> extern int fat_fill_inode(struct inode *inode, struct msdos_dir_entry *de);</div><div class='ctx'> </div><div class='ctx'> extern int fat_flush_inodes(struct super_block *sb, struct inode *i1,</div><div class='ctx'> 			    struct inode *i2);</div><div class='add'>+</div><div class='add'>+extern const struct fs_parameter_spec fat_param_spec[];</div><div class='add'>+int fat_init_fs_context(struct fs_context *fc, bool is_vfat);</div><div class='add'>+void fat_free_fc(struct fs_context *fc);</div><div class='add'>+</div><div class='add'>+int fat_parse_param(struct fs_context *fc, struct fs_parameter *param,</div><div class='add'>+		    bool is_vfat);</div><div class='add'>+int fat_reconfigure(struct fs_context *fc);</div><div class='add'>+</div><div class='ctx'> static inline unsigned long fat_dir_hash(int logstart)</div><div class='ctx'> {</div><div class='ctx'> 	return hash_32(logstart, FAT_HASH_BITS);</div><div class='hunk'>@@ -433,8 +446,15 @@ void __fat_fs_error(struct super_block *sb, int report, const char *fmt, ...);</div><div class='ctx'> 	__fat_fs_error(sb, 1, fmt , ## args)</div><div class='ctx'> #define fat_fs_error_ratelimit(sb, fmt, args...) \</div><div class='ctx'> 	__fat_fs_error(sb, __ratelimit(&amp;MSDOS_SB(sb)-&gt;ratelimit), fmt , ## args)</div><div class='add'>+</div><div class='add'>+#define FAT_PRINTK_PREFIX "%sFAT-fs (%s): "</div><div class='add'>+#define fat_msg(sb, level, fmt, args...)				\</div><div class='add'>+do {									\</div><div class='add'>+	printk_index_subsys_emit(FAT_PRINTK_PREFIX, level, fmt, ##args);\</div><div class='add'>+	_fat_msg(sb, level, fmt, ##args);				\</div><div class='add'>+} while (0)</div><div class='ctx'> __printf(3, 4) __cold</div><div class='del'>-void fat_msg(struct super_block *sb, const char *level, const char *fmt, ...);</div><div class='add'>+void _fat_msg(struct super_block *sb, const char *level, const char *fmt, ...);</div><div class='ctx'> #define fat_msg_ratelimit(sb, level, fmt, args...)	\</div><div class='ctx'> 	do {	\</div><div class='ctx'> 			if (__ratelimit(&amp;MSDOS_SB(sb)-&gt;ratelimit))	\</div><div class='hunk'>@@ -446,10 +466,13 @@ extern void fat_time_fat2unix(struct msdos_sb_info *sbi, struct timespec64 *ts,</div><div class='ctx'> 			      __le16 __time, __le16 __date, u8 time_cs);</div><div class='ctx'> extern void fat_time_unix2fat(struct msdos_sb_info *sbi, struct timespec64 *ts,</div><div class='ctx'> 			      __le16 *time, __le16 *date, u8 *time_cs);</div><div class='add'>+extern struct timespec64 fat_truncate_atime(const struct msdos_sb_info *sbi,</div><div class='add'>+					    const struct timespec64 *ts);</div><div class='add'>+extern struct timespec64 fat_truncate_mtime(const struct msdos_sb_info *sbi,</div><div class='add'>+					    const struct timespec64 *ts);</div><div class='ctx'> extern int fat_truncate_time(struct inode *inode, struct timespec64 *now,</div><div class='ctx'> 			     int flags);</div><div class='del'>-extern int fat_update_time(struct inode *inode, struct timespec64 *now,</div><div class='del'>-			   int flags);</div><div class='add'>+extern int fat_update_time(struct inode *inode, int flags);</div><div class='ctx'> extern int fat_sync_bhs(struct buffer_head **bhs, int nr_bhs);</div><div class='ctx'> </div><div class='ctx'> int fat_cache_init(void);</div><div class='head'>diff --git a/fs/fat/fat_test.c b/fs/fat/fat_test.c<br/>index 2dab4ca1d0d8..1f0062659067 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fat/fat_test.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fat/fat_test.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fat/fat_test.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fat/fat_test.c</a></div><div class='hunk'>@@ -193,4 +193,5 @@ static struct kunit_suite fat_test_suite = {</div><div class='ctx'> </div><div class='ctx'> kunit_test_suites(&amp;fat_test_suite);</div><div class='ctx'> </div><div class='add'>+MODULE_DESCRIPTION("KUnit tests for FAT filesystems");</div><div class='ctx'> MODULE_LICENSE("GPL v2");</div><div class='head'>diff --git a/fs/fat/fatent.c b/fs/fat/fatent.c<br/>index 978ac6751aeb..a7061c2ad8e4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fat/fatent.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fat/fatent.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fat/fatent.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fat/fatent.c</a></div><div class='hunk'>@@ -94,7 +94,8 @@ static int fat12_ent_bread(struct super_block *sb, struct fat_entry *fatent,</div><div class='ctx'> err_brelse:</div><div class='ctx'> 	brelse(bhs[0]);</div><div class='ctx'> err:</div><div class='del'>-	fat_msg(sb, KERN_ERR, "FAT read failed (blocknr %llu)", (llu)blocknr);</div><div class='add'>+	fat_msg_ratelimit(sb, KERN_ERR, "FAT read failed (blocknr %llu)",</div><div class='add'>+			  (llu)blocknr);</div><div class='ctx'> 	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -107,8 +108,8 @@ static int fat_ent_bread(struct super_block *sb, struct fat_entry *fatent,</div><div class='ctx'> 	fatent-&gt;fat_inode = MSDOS_SB(sb)-&gt;fat_inode;</div><div class='ctx'> 	fatent-&gt;bhs[0] = sb_bread(sb, blocknr);</div><div class='ctx'> 	if (!fatent-&gt;bhs[0]) {</div><div class='del'>-		fat_msg(sb, KERN_ERR, "FAT read failed (blocknr %llu)",</div><div class='del'>-		       (llu)blocknr);</div><div class='add'>+		fat_msg_ratelimit(sb, KERN_ERR, "FAT read failed (blocknr %llu)",</div><div class='add'>+				  (llu)blocknr);</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> 	fatent-&gt;nr_bhs = 1;</div><div class='hunk'>@@ -355,7 +356,7 @@ int fat_ent_read(struct inode *inode, struct fat_entry *fatent, int entry)</div><div class='ctx'> </div><div class='ctx'> 	if (!fat_valid_entry(sbi, entry)) {</div><div class='ctx'> 		fatent_brelse(fatent);</div><div class='del'>-		fat_fs_error(sb, "invalid access to FAT (entry 0x%08x)", entry);</div><div class='add'>+		fat_fs_error_ratelimit(sb, "invalid access to FAT (entry 0x%08x)", entry);</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='head'>diff --git a/fs/fat/file.c b/fs/fat/file.c<br/>index 13855ba49cd9..4fc49a614fb8 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fat/file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fat/file.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fat/file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fat/file.c</a></div><div class='hunk'>@@ -90,12 +90,13 @@ static int fat_ioctl_set_attributes(struct file *file, u32 __user *user_attr)</div><div class='ctx'> 	 * out the RO attribute for checking by the security</div><div class='ctx'> 	 * module, just because it maps to a file mode.</div><div class='ctx'> 	 */</div><div class='del'>-	err = security_inode_setattr(file-&gt;f_path.dentry, &amp;ia);</div><div class='add'>+	err = security_inode_setattr(file_mnt_idmap(file),</div><div class='add'>+				     file-&gt;f_path.dentry, &amp;ia);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out_unlock_inode;</div><div class='ctx'> </div><div class='ctx'> 	/* This MUST be done before doing anything irreversible... */</div><div class='del'>-	err = fat_setattr(file_mnt_user_ns(file), file-&gt;f_path.dentry, &amp;ia);</div><div class='add'>+	err = fat_setattr(file_mnt_idmap(file), file-&gt;f_path.dentry, &amp;ia);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out_unlock_inode;</div><div class='ctx'> </div><div class='hunk'>@@ -127,13 +128,12 @@ static int fat_ioctl_fitrim(struct inode *inode, unsigned long arg)</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	struct fstrim_range __user *user_range;</div><div class='ctx'> 	struct fstrim_range range;</div><div class='del'>-	struct request_queue *q = bdev_get_queue(sb-&gt;s_bdev);</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (!capable(CAP_SYS_ADMIN))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='del'>-	if (!blk_queue_discard(q))</div><div class='add'>+	if (!bdev_max_discard_sectors(sb-&gt;s_bdev))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='ctx'> 	user_range = (struct fstrim_range __user *)arg;</div><div class='hunk'>@@ -141,7 +141,7 @@ static int fat_ioctl_fitrim(struct inode *inode, unsigned long arg)</div><div class='ctx'> 		return -EFAULT;</div><div class='ctx'> </div><div class='ctx'> 	range.minlen = max_t(unsigned int, range.minlen,</div><div class='del'>-			     q-&gt;limits.discard_granularity);</div><div class='add'>+			     bdev_discard_granularity(sb-&gt;s_bdev));</div><div class='ctx'> </div><div class='ctx'> 	err = fat_trim_fs(inode, &amp;range);</div><div class='ctx'> 	if (err &lt; 0)</div><div class='hunk'>@@ -175,9 +175,10 @@ long fat_generic_ioctl(struct file *filp, unsigned int cmd, unsigned long arg)</div><div class='ctx'> static int fat_file_release(struct inode *inode, struct file *filp)</div><div class='ctx'> {</div><div class='ctx'> 	if ((filp-&gt;f_mode &amp; FMODE_WRITE) &amp;&amp;</div><div class='del'>-	     MSDOS_SB(inode-&gt;i_sb)-&gt;options.flush) {</div><div class='add'>+	    MSDOS_SB(inode-&gt;i_sb)-&gt;options.flush) {</div><div class='ctx'> 		fat_flush_inodes(inode-&gt;i_sb, inode, NULL);</div><div class='del'>-		congestion_wait(BLK_RW_ASYNC, HZ/10);</div><div class='add'>+		set_current_state(TASK_UNINTERRUPTIBLE);</div><div class='add'>+		io_schedule_timeout(HZ/10);</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -203,12 +204,12 @@ const struct file_operations fat_file_operations = {</div><div class='ctx'> 	.llseek		= generic_file_llseek,</div><div class='ctx'> 	.read_iter	= generic_file_read_iter,</div><div class='ctx'> 	.write_iter	= generic_file_write_iter,</div><div class='del'>-	.mmap		= generic_file_mmap,</div><div class='add'>+	.mmap_prepare	= generic_file_mmap_prepare,</div><div class='ctx'> 	.release	= fat_file_release,</div><div class='ctx'> 	.unlocked_ioctl	= fat_generic_ioctl,</div><div class='ctx'> 	.compat_ioctl	= compat_ptr_ioctl,</div><div class='ctx'> 	.fsync		= fat_file_fsync,</div><div class='del'>-	.splice_read	= generic_file_splice_read,</div><div class='add'>+	.splice_read	= filemap_splice_read,</div><div class='ctx'> 	.splice_write	= iter_file_splice_write,</div><div class='ctx'> 	.fallocate	= fat_fallocate,</div><div class='ctx'> };</div><div class='hunk'>@@ -394,17 +395,25 @@ void fat_truncate_blocks(struct inode *inode, loff_t offset)</div><div class='ctx'> 	fat_flush_inodes(inode-&gt;i_sb, inode, NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int fat_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='add'>+int fat_getattr(struct mnt_idmap *idmap, const struct path *path,</div><div class='ctx'> 		struct kstat *stat, u32 request_mask, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(path-&gt;dentry);</div><div class='del'>-	generic_fillattr(mnt_userns, inode, stat);</div><div class='del'>-	stat-&gt;blksize = MSDOS_SB(inode-&gt;i_sb)-&gt;cluster_size;</div><div class='add'>+	struct msdos_sb_info *sbi = MSDOS_SB(inode-&gt;i_sb);</div><div class='add'>+</div><div class='add'>+	generic_fillattr(idmap, request_mask, inode, stat);</div><div class='add'>+	stat-&gt;blksize = sbi-&gt;cluster_size;</div><div class='ctx'> </div><div class='del'>-	if (MSDOS_SB(inode-&gt;i_sb)-&gt;options.nfs == FAT_NFS_NOSTALE_RO) {</div><div class='add'>+	if (sbi-&gt;options.nfs == FAT_NFS_NOSTALE_RO) {</div><div class='ctx'> 		/* Use i_pos for ino. This is used as fileid of nfs. */</div><div class='del'>-		stat-&gt;ino = fat_i_pos_read(MSDOS_SB(inode-&gt;i_sb), inode);</div><div class='add'>+		stat-&gt;ino = fat_i_pos_read(sbi, inode);</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	if (sbi-&gt;options.isvfat &amp;&amp; request_mask &amp; STATX_BTIME) {</div><div class='add'>+		stat-&gt;result_mask |= STATX_BTIME;</div><div class='add'>+		stat-&gt;btime = MSDOS_I(inode)-&gt;i_crtime;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(fat_getattr);</div><div class='hunk'>@@ -447,13 +456,14 @@ static int fat_sanitize_mode(const struct msdos_sb_info *sbi,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fat_allow_set_time(struct user_namespace *mnt_userns,</div><div class='add'>+static int fat_allow_set_time(struct mnt_idmap *idmap,</div><div class='ctx'> 			      struct msdos_sb_info *sbi, struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	umode_t allow_utime = sbi-&gt;options.allow_utime;</div><div class='ctx'> </div><div class='del'>-	if (!uid_eq(current_fsuid(), i_uid_into_mnt(mnt_userns, inode))) {</div><div class='del'>-		if (in_group_p(i_gid_into_mnt(mnt_userns, inode)))</div><div class='add'>+	if (!vfsuid_eq_kuid(i_uid_into_vfsuid(idmap, inode),</div><div class='add'>+			    current_fsuid())) {</div><div class='add'>+		if (vfsgid_in_group_p(i_gid_into_vfsgid(idmap, inode)))</div><div class='ctx'> 			allow_utime &gt;&gt;= 3;</div><div class='ctx'> 		if (allow_utime &amp; MAY_WRITE)</div><div class='ctx'> 			return 1;</div><div class='hunk'>@@ -467,7 +477,7 @@ static int fat_allow_set_time(struct user_namespace *mnt_userns,</div><div class='ctx'> /* valid file mode bits */</div><div class='ctx'> #define FAT_VALID_MODE	(S_IFREG | S_IFDIR | S_IRWXUGO)</div><div class='ctx'> </div><div class='del'>-int fat_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='add'>+int fat_setattr(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		struct iattr *attr)</div><div class='ctx'> {</div><div class='ctx'> 	struct msdos_sb_info *sbi = MSDOS_SB(dentry-&gt;d_sb);</div><div class='hunk'>@@ -478,11 +488,11 @@ int fat_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 	/* Check for setting the inode time. */</div><div class='ctx'> 	ia_valid = attr-&gt;ia_valid;</div><div class='ctx'> 	if (ia_valid &amp; TIMES_SET_FLAGS) {</div><div class='del'>-		if (fat_allow_set_time(mnt_userns, sbi, inode))</div><div class='add'>+		if (fat_allow_set_time(idmap, sbi, inode))</div><div class='ctx'> 			attr-&gt;ia_valid &amp;= ~TIMES_SET_FLAGS;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	error = setattr_prepare(mnt_userns, dentry, attr);</div><div class='add'>+	error = setattr_prepare(idmap, dentry, attr);</div><div class='ctx'> 	attr-&gt;ia_valid = ia_valid;</div><div class='ctx'> 	if (error) {</div><div class='ctx'> 		if (sbi-&gt;options.quiet)</div><div class='hunk'>@@ -508,9 +518,11 @@ int fat_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (((attr-&gt;ia_valid &amp; ATTR_UID) &amp;&amp;</div><div class='del'>-	     (!uid_eq(attr-&gt;ia_uid, sbi-&gt;options.fs_uid))) ||</div><div class='add'>+	     (!uid_eq(from_vfsuid(idmap, i_user_ns(inode), attr-&gt;ia_vfsuid),</div><div class='add'>+		      sbi-&gt;options.fs_uid))) ||</div><div class='ctx'> 	    ((attr-&gt;ia_valid &amp; ATTR_GID) &amp;&amp;</div><div class='del'>-	     (!gid_eq(attr-&gt;ia_gid, sbi-&gt;options.fs_gid))) ||</div><div class='add'>+	     (!gid_eq(from_vfsgid(idmap, i_user_ns(inode), attr-&gt;ia_vfsgid),</div><div class='add'>+		      sbi-&gt;options.fs_gid))) ||</div><div class='ctx'> 	    ((attr-&gt;ia_valid &amp; ATTR_MODE) &amp;&amp;</div><div class='ctx'> 	     (attr-&gt;ia_mode &amp; ~FAT_VALID_MODE)))</div><div class='ctx'> 		error = -EPERM;</div><div class='hunk'>@@ -552,7 +564,7 @@ int fat_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 		fat_truncate_time(inode, &amp;attr-&gt;ia_mtime, S_MTIME);</div><div class='ctx'> 	attr-&gt;ia_valid &amp;= ~(ATTR_ATIME|ATTR_CTIME|ATTR_MTIME);</div><div class='ctx'> </div><div class='del'>-	setattr_copy(mnt_userns, inode, attr);</div><div class='add'>+	setattr_copy(idmap, inode, attr);</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='ctx'> out:</div><div class='ctx'> 	return error;</div><div class='head'>diff --git a/fs/fat/inode.c b/fs/fat/inode.c<br/>index a6f1c6d426d1..0b6009cd1844 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fat/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fat/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fat/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fat/inode.c</a></div><div class='hunk'>@@ -16,13 +16,13 @@</div><div class='ctx'> #include &lt;linux/mpage.h&gt;</div><div class='ctx'> #include &lt;linux/vfs.h&gt;</div><div class='ctx'> #include &lt;linux/seq_file.h&gt;</div><div class='del'>-#include &lt;linux/parser.h&gt;</div><div class='ctx'> #include &lt;linux/uio.h&gt;</div><div class='ctx'> #include &lt;linux/blkdev.h&gt;</div><div class='ctx'> #include &lt;linux/backing-dev.h&gt;</div><div class='del'>-#include &lt;asm/unaligned.h&gt;</div><div class='add'>+#include &lt;linux/unaligned.h&gt;</div><div class='ctx'> #include &lt;linux/random.h&gt;</div><div class='ctx'> #include &lt;linux/iversion.h&gt;</div><div class='add'>+#include &lt;linux/fs_struct.h&gt;</div><div class='ctx'> #include "fat.h"</div><div class='ctx'> </div><div class='ctx'> #ifndef CONFIG_FAT_DEFAULT_IOCHARSET</div><div class='hunk'>@@ -194,20 +194,15 @@ static int fat_get_block(struct inode *inode, sector_t iblock,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fat_writepage(struct page *page, struct writeback_control *wbc)</div><div class='del'>-{</div><div class='del'>-	return block_write_full_page(page, fat_get_block, wbc);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int fat_writepages(struct address_space *mapping,</div><div class='ctx'> 			  struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='ctx'> 	return mpage_writepages(mapping, wbc, fat_get_block);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fat_readpage(struct file *file, struct page *page)</div><div class='add'>+static int fat_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	return mpage_readpage(page, fat_get_block);</div><div class='add'>+	return mpage_read_folio(folio, fat_get_block);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void fat_readahead(struct readahead_control *rac)</div><div class='hunk'>@@ -225,28 +220,29 @@ static void fat_write_failed(struct address_space *mapping, loff_t to)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fat_write_begin(struct file *file, struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned flags,</div><div class='del'>-			struct page **pagep, void **fsdata)</div><div class='add'>+static int fat_write_begin(const struct kiocb *iocb,</div><div class='add'>+			   struct address_space *mapping,</div><div class='add'>+			   loff_t pos, unsigned len,</div><div class='add'>+			   struct folio **foliop, void **fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	*pagep = NULL;</div><div class='del'>-	err = cont_write_begin(file, mapping, pos, len, flags,</div><div class='del'>-				pagep, fsdata, fat_get_block,</div><div class='add'>+	err = cont_write_begin(iocb, mapping, pos, len,</div><div class='add'>+				foliop, fsdata, fat_get_block,</div><div class='ctx'> 				&amp;MSDOS_I(mapping-&gt;host)-&gt;mmu_private);</div><div class='ctx'> 	if (err &lt; 0)</div><div class='ctx'> 		fat_write_failed(mapping, pos + len);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fat_write_end(struct file *file, struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned copied,</div><div class='del'>-			struct page *pagep, void *fsdata)</div><div class='add'>+static int fat_write_end(const struct kiocb *iocb,</div><div class='add'>+			 struct address_space *mapping,</div><div class='add'>+			 loff_t pos, unsigned len, unsigned copied,</div><div class='add'>+			 struct folio *folio, void *fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='ctx'> 	int err;</div><div class='del'>-	err = generic_write_end(file, mapping, pos, len, copied, pagep, fsdata);</div><div class='add'>+	err = generic_write_end(iocb, mapping, pos, len, copied, folio, fsdata);</div><div class='ctx'> 	if (err &lt; len)</div><div class='ctx'> 		fat_write_failed(mapping, pos + len);</div><div class='ctx'> 	if (!(err &lt; 0) &amp;&amp; !(MSDOS_I(inode)-&gt;i_attrs &amp; ATTR_ARCH)) {</div><div class='hunk'>@@ -342,15 +338,16 @@ int fat_block_truncate_page(struct inode *inode, loff_t from)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct address_space_operations fat_aops = {</div><div class='del'>-	.set_page_dirty	= __set_page_dirty_buffers,</div><div class='del'>-	.readpage	= fat_readpage,</div><div class='add'>+	.dirty_folio	= block_dirty_folio,</div><div class='add'>+	.invalidate_folio = block_invalidate_folio,</div><div class='add'>+	.read_folio	= fat_read_folio,</div><div class='ctx'> 	.readahead	= fat_readahead,</div><div class='del'>-	.writepage	= fat_writepage,</div><div class='ctx'> 	.writepages	= fat_writepages,</div><div class='ctx'> 	.write_begin	= fat_write_begin,</div><div class='ctx'> 	.write_end	= fat_write_end,</div><div class='ctx'> 	.direct_IO	= fat_direct_IO,</div><div class='del'>-	.bmap		= _fat_bmap</div><div class='add'>+	.bmap		= _fat_bmap,</div><div class='add'>+	.migrate_folio	= buffer_migrate_folio,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -516,13 +513,14 @@ static int fat_validate_dir(struct inode *dir)</div><div class='ctx'> int fat_fill_inode(struct inode *inode, struct msdos_dir_entry *de)</div><div class='ctx'> {</div><div class='ctx'> 	struct msdos_sb_info *sbi = MSDOS_SB(inode-&gt;i_sb);</div><div class='add'>+	struct timespec64 mtime;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='ctx'> 	MSDOS_I(inode)-&gt;i_pos = 0;</div><div class='ctx'> 	inode-&gt;i_uid = sbi-&gt;options.fs_uid;</div><div class='ctx'> 	inode-&gt;i_gid = sbi-&gt;options.fs_gid;</div><div class='ctx'> 	inode_inc_iversion(inode);</div><div class='del'>-	inode-&gt;i_generation = prandom_u32();</div><div class='add'>+	inode-&gt;i_generation = get_random_u32();</div><div class='ctx'> </div><div class='ctx'> 	if ((de-&gt;attr &amp; ATTR_DIR) &amp;&amp; !IS_FREE(de-&gt;name)) {</div><div class='ctx'> 		inode-&gt;i_generation &amp;= ~1;</div><div class='hunk'>@@ -565,13 +563,18 @@ int fat_fill_inode(struct inode *inode, struct msdos_dir_entry *de)</div><div class='ctx'> 	inode-&gt;i_blocks = ((inode-&gt;i_size + (sbi-&gt;cluster_size - 1))</div><div class='ctx'> 			   &amp; ~((loff_t)sbi-&gt;cluster_size - 1)) &gt;&gt; 9;</div><div class='ctx'> </div><div class='del'>-	fat_time_fat2unix(sbi, &amp;inode-&gt;i_mtime, de-&gt;time, de-&gt;date, 0);</div><div class='add'>+	fat_time_fat2unix(sbi, &amp;mtime, de-&gt;time, de-&gt;date, 0);</div><div class='add'>+	inode_set_mtime_to_ts(inode, mtime);</div><div class='add'>+	inode_set_ctime_to_ts(inode, mtime);</div><div class='ctx'> 	if (sbi-&gt;options.isvfat) {</div><div class='del'>-		fat_time_fat2unix(sbi, &amp;inode-&gt;i_ctime, de-&gt;ctime,</div><div class='add'>+		struct timespec64 atime;</div><div class='add'>+</div><div class='add'>+		fat_time_fat2unix(sbi, &amp;atime, 0, de-&gt;adate, 0);</div><div class='add'>+		inode_set_atime_to_ts(inode, atime);</div><div class='add'>+		fat_time_fat2unix(sbi, &amp;MSDOS_I(inode)-&gt;i_crtime, de-&gt;ctime,</div><div class='ctx'> 				  de-&gt;cdate, de-&gt;ctime_cs);</div><div class='del'>-		fat_time_fat2unix(sbi, &amp;inode-&gt;i_atime, 0, de-&gt;adate, 0);</div><div class='ctx'> 	} else</div><div class='del'>-		fat_truncate_time(inode, &amp;inode-&gt;i_mtime, S_ATIME|S_CTIME);</div><div class='add'>+		inode_set_atime_to_ts(inode, fat_truncate_atime(sbi, &amp;mtime));</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -745,7 +748,7 @@ static struct kmem_cache *fat_inode_cachep;</div><div class='ctx'> static struct inode *fat_alloc_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct msdos_inode_info *ei;</div><div class='del'>-	ei = kmem_cache_alloc(fat_inode_cachep, GFP_NOFS);</div><div class='add'>+	ei = alloc_inode_sb(sb, fat_inode_cachep, GFP_NOFS);</div><div class='ctx'> 	if (!ei)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='hunk'>@@ -756,6 +759,8 @@ static struct inode *fat_alloc_inode(struct super_block *sb)</div><div class='ctx'> 	ei-&gt;i_logstart = 0;</div><div class='ctx'> 	ei-&gt;i_attrs = 0;</div><div class='ctx'> 	ei-&gt;i_pos = 0;</div><div class='add'>+	ei-&gt;i_crtime.tv_sec = 0;</div><div class='add'>+	ei-&gt;i_crtime.tv_nsec = 0;</div><div class='ctx'> </div><div class='ctx'> 	return &amp;ei-&gt;vfs_inode;</div><div class='ctx'> }</div><div class='hunk'>@@ -783,7 +788,7 @@ static int __init fat_init_inodecache(void)</div><div class='ctx'> 	fat_inode_cachep = kmem_cache_create("fat_inode_cache",</div><div class='ctx'> 					     sizeof(struct msdos_inode_info),</div><div class='ctx'> 					     0, (SLAB_RECLAIM_ACCOUNT|</div><div class='del'>-						SLAB_MEM_SPREAD|SLAB_ACCOUNT),</div><div class='add'>+						SLAB_ACCOUNT),</div><div class='ctx'> 					     init_once);</div><div class='ctx'> 	if (fat_inode_cachep == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='hunk'>@@ -800,16 +805,17 @@ static void __exit fat_destroy_inodecache(void)</div><div class='ctx'> 	kmem_cache_destroy(fat_inode_cachep);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fat_remount(struct super_block *sb, int *flags, char *data)</div><div class='add'>+int fat_reconfigure(struct fs_context *fc)</div><div class='ctx'> {</div><div class='ctx'> 	bool new_rdonly;</div><div class='add'>+	struct super_block *sb = fc-&gt;root-&gt;d_sb;</div><div class='ctx'> 	struct msdos_sb_info *sbi = MSDOS_SB(sb);</div><div class='del'>-	*flags |= SB_NODIRATIME | (sbi-&gt;options.isvfat ? 0 : SB_NOATIME);</div><div class='add'>+	fc-&gt;sb_flags |= SB_NODIRATIME | (sbi-&gt;options.isvfat ? 0 : SB_NOATIME);</div><div class='ctx'> </div><div class='ctx'> 	sync_filesystem(sb);</div><div class='ctx'> </div><div class='ctx'> 	/* make sure we update state on remount. */</div><div class='del'>-	new_rdonly = *flags &amp; SB_RDONLY;</div><div class='add'>+	new_rdonly = fc-&gt;sb_flags &amp; SB_RDONLY;</div><div class='ctx'> 	if (new_rdonly != sb_rdonly(sb)) {</div><div class='ctx'> 		if (new_rdonly)</div><div class='ctx'> 			fat_set_state(sb, 0, 0);</div><div class='hunk'>@@ -818,6 +824,7 @@ static int fat_remount(struct super_block *sb, int *flags, char *data)</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL_GPL(fat_reconfigure);</div><div class='ctx'> </div><div class='ctx'> static int fat_statfs(struct dentry *dentry, struct kstatfs *buf)</div><div class='ctx'> {</div><div class='hunk'>@@ -850,6 +857,7 @@ static int __fat_write_inode(struct inode *inode, int wait)</div><div class='ctx'> 	struct msdos_sb_info *sbi = MSDOS_SB(sb);</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> 	struct msdos_dir_entry *raw_entry;</div><div class='add'>+	struct timespec64 mtime;</div><div class='ctx'> 	loff_t i_pos;</div><div class='ctx'> 	sector_t blocknr;</div><div class='ctx'> 	int err, offset;</div><div class='hunk'>@@ -883,14 +891,16 @@ retry:</div><div class='ctx'> 		raw_entry-&gt;size = cpu_to_le32(inode-&gt;i_size);</div><div class='ctx'> 	raw_entry-&gt;attr = fat_make_attrs(inode);</div><div class='ctx'> 	fat_set_start(raw_entry, MSDOS_I(inode)-&gt;i_logstart);</div><div class='del'>-	fat_time_unix2fat(sbi, &amp;inode-&gt;i_mtime, &amp;raw_entry-&gt;time,</div><div class='add'>+	mtime = inode_get_mtime(inode);</div><div class='add'>+	fat_time_unix2fat(sbi, &amp;mtime, &amp;raw_entry-&gt;time,</div><div class='ctx'> 			  &amp;raw_entry-&gt;date, NULL);</div><div class='ctx'> 	if (sbi-&gt;options.isvfat) {</div><div class='add'>+		struct timespec64 ts = inode_get_atime(inode);</div><div class='ctx'> 		__le16 atime;</div><div class='del'>-		fat_time_unix2fat(sbi, &amp;inode-&gt;i_ctime, &amp;raw_entry-&gt;ctime,</div><div class='add'>+</div><div class='add'>+		fat_time_unix2fat(sbi, &amp;ts, &amp;atime, &amp;raw_entry-&gt;adate, NULL);</div><div class='add'>+		fat_time_unix2fat(sbi, &amp;MSDOS_I(inode)-&gt;i_crtime, &amp;raw_entry-&gt;ctime,</div><div class='ctx'> 				  &amp;raw_entry-&gt;cdate, &amp;raw_entry-&gt;ctime_cs);</div><div class='del'>-		fat_time_unix2fat(sbi, &amp;inode-&gt;i_atime, &amp;atime,</div><div class='del'>-				  &amp;raw_entry-&gt;adate, NULL);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;sbi-&gt;inode_hash_lock);</div><div class='ctx'> 	mark_buffer_dirty(bh);</div><div class='hunk'>@@ -932,8 +942,6 @@ static const struct super_operations fat_sops = {</div><div class='ctx'> 	.evict_inode	= fat_evict_inode,</div><div class='ctx'> 	.put_super	= fat_put_super,</div><div class='ctx'> 	.statfs		= fat_statfs,</div><div class='del'>-	.remount_fs	= fat_remount,</div><div class='del'>-</div><div class='ctx'> 	.show_options	= fat_show_options,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -1030,355 +1038,282 @@ static int fat_show_options(struct seq_file *m, struct dentry *root)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> enum {</div><div class='del'>-	Opt_check_n, Opt_check_r, Opt_check_s, Opt_uid, Opt_gid,</div><div class='del'>-	Opt_umask, Opt_dmask, Opt_fmask, Opt_allow_utime, Opt_codepage,</div><div class='del'>-	Opt_usefree, Opt_nocase, Opt_quiet, Opt_showexec, Opt_debug,</div><div class='del'>-	Opt_immutable, Opt_dots, Opt_nodots,</div><div class='del'>-	Opt_charset, Opt_shortname_lower, Opt_shortname_win95,</div><div class='del'>-	Opt_shortname_winnt, Opt_shortname_mixed, Opt_utf8_no, Opt_utf8_yes,</div><div class='del'>-	Opt_uni_xl_no, Opt_uni_xl_yes, Opt_nonumtail_no, Opt_nonumtail_yes,</div><div class='del'>-	Opt_obsolete, Opt_flush, Opt_tz_utc, Opt_rodir, Opt_err_cont,</div><div class='del'>-	Opt_err_panic, Opt_err_ro, Opt_discard, Opt_nfs, Opt_time_offset,</div><div class='del'>-	Opt_nfs_stale_rw, Opt_nfs_nostale_ro, Opt_err, Opt_dos1xfloppy,</div><div class='add'>+	Opt_check, Opt_uid, Opt_gid, Opt_umask, Opt_dmask, Opt_fmask,</div><div class='add'>+	Opt_allow_utime, Opt_codepage, Opt_usefree, Opt_nocase, Opt_quiet,</div><div class='add'>+	Opt_showexec, Opt_debug, Opt_immutable, Opt_dots, Opt_dotsOK,</div><div class='add'>+	Opt_charset, Opt_shortname, Opt_utf8, Opt_utf8_bool,</div><div class='add'>+	Opt_uni_xl, Opt_uni_xl_bool, Opt_nonumtail, Opt_nonumtail_bool,</div><div class='add'>+	Opt_obsolete, Opt_flush, Opt_tz, Opt_rodir, Opt_errors, Opt_discard,</div><div class='add'>+	Opt_nfs, Opt_nfs_enum, Opt_time_offset, Opt_dos1xfloppy,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static const match_table_t fat_tokens = {</div><div class='del'>-	{Opt_check_r, "check=relaxed"},</div><div class='del'>-	{Opt_check_s, "check=strict"},</div><div class='del'>-	{Opt_check_n, "check=normal"},</div><div class='del'>-	{Opt_check_r, "check=r"},</div><div class='del'>-	{Opt_check_s, "check=s"},</div><div class='del'>-	{Opt_check_n, "check=n"},</div><div class='del'>-	{Opt_uid, "uid=%u"},</div><div class='del'>-	{Opt_gid, "gid=%u"},</div><div class='del'>-	{Opt_umask, "umask=%o"},</div><div class='del'>-	{Opt_dmask, "dmask=%o"},</div><div class='del'>-	{Opt_fmask, "fmask=%o"},</div><div class='del'>-	{Opt_allow_utime, "allow_utime=%o"},</div><div class='del'>-	{Opt_codepage, "codepage=%u"},</div><div class='del'>-	{Opt_usefree, "usefree"},</div><div class='del'>-	{Opt_nocase, "nocase"},</div><div class='del'>-	{Opt_quiet, "quiet"},</div><div class='del'>-	{Opt_showexec, "showexec"},</div><div class='del'>-	{Opt_debug, "debug"},</div><div class='del'>-	{Opt_immutable, "sys_immutable"},</div><div class='del'>-	{Opt_flush, "flush"},</div><div class='del'>-	{Opt_tz_utc, "tz=UTC"},</div><div class='del'>-	{Opt_time_offset, "time_offset=%d"},</div><div class='del'>-	{Opt_err_cont, "errors=continue"},</div><div class='del'>-	{Opt_err_panic, "errors=panic"},</div><div class='del'>-	{Opt_err_ro, "errors=remount-ro"},</div><div class='del'>-	{Opt_discard, "discard"},</div><div class='del'>-	{Opt_nfs_stale_rw, "nfs"},</div><div class='del'>-	{Opt_nfs_stale_rw, "nfs=stale_rw"},</div><div class='del'>-	{Opt_nfs_nostale_ro, "nfs=nostale_ro"},</div><div class='del'>-	{Opt_dos1xfloppy, "dos1xfloppy"},</div><div class='del'>-	{Opt_obsolete, "conv=binary"},</div><div class='del'>-	{Opt_obsolete, "conv=text"},</div><div class='del'>-	{Opt_obsolete, "conv=auto"},</div><div class='del'>-	{Opt_obsolete, "conv=b"},</div><div class='del'>-	{Opt_obsolete, "conv=t"},</div><div class='del'>-	{Opt_obsolete, "conv=a"},</div><div class='del'>-	{Opt_obsolete, "fat=%u"},</div><div class='del'>-	{Opt_obsolete, "blocksize=%u"},</div><div class='del'>-	{Opt_obsolete, "cvf_format=%20s"},</div><div class='del'>-	{Opt_obsolete, "cvf_options=%100s"},</div><div class='del'>-	{Opt_obsolete, "posix"},</div><div class='del'>-	{Opt_err, NULL},</div><div class='add'>+static const struct constant_table fat_param_check[] = {</div><div class='add'>+	{"relaxed",	'r'},</div><div class='add'>+	{"r",		'r'},</div><div class='add'>+	{"strict",	's'},</div><div class='add'>+	{"s",		's'},</div><div class='add'>+	{"normal",	'n'},</div><div class='add'>+	{"n",		'n'},</div><div class='add'>+	{}</div><div class='ctx'> };</div><div class='del'>-static const match_table_t msdos_tokens = {</div><div class='del'>-	{Opt_nodots, "nodots"},</div><div class='del'>-	{Opt_nodots, "dotsOK=no"},</div><div class='del'>-	{Opt_dots, "dots"},</div><div class='del'>-	{Opt_dots, "dotsOK=yes"},</div><div class='del'>-	{Opt_err, NULL}</div><div class='del'>-};</div><div class='del'>-static const match_table_t vfat_tokens = {</div><div class='del'>-	{Opt_charset, "iocharset=%s"},</div><div class='del'>-	{Opt_shortname_lower, "shortname=lower"},</div><div class='del'>-	{Opt_shortname_win95, "shortname=win95"},</div><div class='del'>-	{Opt_shortname_winnt, "shortname=winnt"},</div><div class='del'>-	{Opt_shortname_mixed, "shortname=mixed"},</div><div class='del'>-	{Opt_utf8_no, "utf8=0"},		/* 0 or no or false */</div><div class='del'>-	{Opt_utf8_no, "utf8=no"},</div><div class='del'>-	{Opt_utf8_no, "utf8=false"},</div><div class='del'>-	{Opt_utf8_yes, "utf8=1"},		/* empty or 1 or yes or true */</div><div class='del'>-	{Opt_utf8_yes, "utf8=yes"},</div><div class='del'>-	{Opt_utf8_yes, "utf8=true"},</div><div class='del'>-	{Opt_utf8_yes, "utf8"},</div><div class='del'>-	{Opt_uni_xl_no, "uni_xlate=0"},		/* 0 or no or false */</div><div class='del'>-	{Opt_uni_xl_no, "uni_xlate=no"},</div><div class='del'>-	{Opt_uni_xl_no, "uni_xlate=false"},</div><div class='del'>-	{Opt_uni_xl_yes, "uni_xlate=1"},	/* empty or 1 or yes or true */</div><div class='del'>-	{Opt_uni_xl_yes, "uni_xlate=yes"},</div><div class='del'>-	{Opt_uni_xl_yes, "uni_xlate=true"},</div><div class='del'>-	{Opt_uni_xl_yes, "uni_xlate"},</div><div class='del'>-	{Opt_nonumtail_no, "nonumtail=0"},	/* 0 or no or false */</div><div class='del'>-	{Opt_nonumtail_no, "nonumtail=no"},</div><div class='del'>-	{Opt_nonumtail_no, "nonumtail=false"},</div><div class='del'>-	{Opt_nonumtail_yes, "nonumtail=1"},	/* empty or 1 or yes or true */</div><div class='del'>-	{Opt_nonumtail_yes, "nonumtail=yes"},</div><div class='del'>-	{Opt_nonumtail_yes, "nonumtail=true"},</div><div class='del'>-	{Opt_nonumtail_yes, "nonumtail"},</div><div class='del'>-	{Opt_rodir, "rodir"},</div><div class='del'>-	{Opt_err, NULL}</div><div class='add'>+</div><div class='add'>+static const struct constant_table fat_param_tz[] = {</div><div class='add'>+	{"UTC",		0},</div><div class='add'>+	{}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int parse_options(struct super_block *sb, char *options, int is_vfat,</div><div class='del'>-			 int silent, int *debug, struct fat_mount_options *opts)</div><div class='del'>-{</div><div class='del'>-	char *p;</div><div class='del'>-	substring_t args[MAX_OPT_ARGS];</div><div class='del'>-	int option;</div><div class='del'>-	char *iocharset;</div><div class='add'>+static const struct constant_table fat_param_errors[] = {</div><div class='add'>+	{"continue",	FAT_ERRORS_CONT},</div><div class='add'>+	{"panic",	FAT_ERRORS_PANIC},</div><div class='add'>+	{"remount-ro",	FAT_ERRORS_RO},</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-	opts-&gt;isvfat = is_vfat;</div><div class='ctx'> </div><div class='del'>-	opts-&gt;fs_uid = current_uid();</div><div class='del'>-	opts-&gt;fs_gid = current_gid();</div><div class='del'>-	opts-&gt;fs_fmask = opts-&gt;fs_dmask = current_umask();</div><div class='del'>-	opts-&gt;allow_utime = -1;</div><div class='del'>-	opts-&gt;codepage = fat_default_codepage;</div><div class='del'>-	fat_reset_iocharset(opts);</div><div class='del'>-	if (is_vfat) {</div><div class='del'>-		opts-&gt;shortname = VFAT_SFN_DISPLAY_WINNT|VFAT_SFN_CREATE_WIN95;</div><div class='del'>-		opts-&gt;rodir = 0;</div><div class='del'>-	} else {</div><div class='del'>-		opts-&gt;shortname = 0;</div><div class='del'>-		opts-&gt;rodir = 1;</div><div class='del'>-	}</div><div class='del'>-	opts-&gt;name_check = 'n';</div><div class='del'>-	opts-&gt;quiet = opts-&gt;showexec = opts-&gt;sys_immutable = opts-&gt;dotsOK =  0;</div><div class='del'>-	opts-&gt;unicode_xlate = 0;</div><div class='del'>-	opts-&gt;numtail = 1;</div><div class='del'>-	opts-&gt;usefree = opts-&gt;nocase = 0;</div><div class='del'>-	opts-&gt;tz_set = 0;</div><div class='del'>-	opts-&gt;nfs = 0;</div><div class='del'>-	opts-&gt;errors = FAT_ERRORS_RO;</div><div class='del'>-	*debug = 0;</div><div class='add'>+static const struct constant_table fat_param_nfs[] = {</div><div class='add'>+	{"stale_rw",	FAT_NFS_STALE_RW},</div><div class='add'>+	{"nostale_ro",	FAT_NFS_NOSTALE_RO},</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-	opts-&gt;utf8 = IS_ENABLED(CONFIG_FAT_DEFAULT_UTF8) &amp;&amp; is_vfat;</div><div class='add'>+/*</div><div class='add'>+ * These are all obsolete but we still reject invalid options.</div><div class='add'>+ * The corresponding values are therefore meaningless.</div><div class='add'>+ */</div><div class='add'>+static const struct constant_table fat_param_conv[] = {</div><div class='add'>+	{"binary",	0},</div><div class='add'>+	{"text",	0},</div><div class='add'>+	{"auto",	0},</div><div class='add'>+	{"b",		0},</div><div class='add'>+	{"t",		0},</div><div class='add'>+	{"a",		0},</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-	if (!options)</div><div class='del'>-		goto out;</div><div class='add'>+/* Core options. See below for vfat and msdos extras */</div><div class='add'>+const struct fs_parameter_spec fat_param_spec[] = {</div><div class='add'>+	fsparam_enum	("check",	Opt_check, fat_param_check),</div><div class='add'>+	fsparam_uid	("uid",		Opt_uid),</div><div class='add'>+	fsparam_gid	("gid",		Opt_gid),</div><div class='add'>+	fsparam_u32oct	("umask",	Opt_umask),</div><div class='add'>+	fsparam_u32oct	("dmask",	Opt_dmask),</div><div class='add'>+	fsparam_u32oct	("fmask",	Opt_fmask),</div><div class='add'>+	fsparam_u32oct	("allow_utime",	Opt_allow_utime),</div><div class='add'>+	fsparam_u32	("codepage",	Opt_codepage),</div><div class='add'>+	fsparam_flag	("usefree",	Opt_usefree),</div><div class='add'>+	fsparam_flag	("nocase",	Opt_nocase),</div><div class='add'>+	fsparam_flag	("quiet",	Opt_quiet),</div><div class='add'>+	fsparam_flag	("showexec",	Opt_showexec),</div><div class='add'>+	fsparam_flag	("debug",	Opt_debug),</div><div class='add'>+	fsparam_flag	("sys_immutable", Opt_immutable),</div><div class='add'>+	fsparam_flag	("flush",	Opt_flush),</div><div class='add'>+	fsparam_enum	("tz",		Opt_tz, fat_param_tz),</div><div class='add'>+	fsparam_s32	("time_offset",	Opt_time_offset),</div><div class='add'>+	fsparam_enum	("errors",	Opt_errors, fat_param_errors),</div><div class='add'>+	fsparam_flag	("discard",	Opt_discard),</div><div class='add'>+	fsparam_flag	("nfs",		Opt_nfs),</div><div class='add'>+	fsparam_enum	("nfs",		Opt_nfs_enum, fat_param_nfs),</div><div class='add'>+	fsparam_flag	("dos1xfloppy",	Opt_dos1xfloppy),</div><div class='add'>+	__fsparam(fs_param_is_enum,	"conv",</div><div class='add'>+		  Opt_obsolete, fs_param_deprecated, fat_param_conv),</div><div class='add'>+	__fsparam(fs_param_is_u32,	"fat",</div><div class='add'>+		  Opt_obsolete, fs_param_deprecated, NULL),</div><div class='add'>+	__fsparam(fs_param_is_u32,	"blocksize",</div><div class='add'>+		  Opt_obsolete, fs_param_deprecated, NULL),</div><div class='add'>+	__fsparam(fs_param_is_string,	"cvf_format",</div><div class='add'>+		  Opt_obsolete, fs_param_deprecated, NULL),</div><div class='add'>+	__fsparam(fs_param_is_string,	"cvf_options",</div><div class='add'>+		  Opt_obsolete, fs_param_deprecated, NULL),</div><div class='add'>+	__fsparam(NULL,			"posix",</div><div class='add'>+		  Opt_obsolete, fs_param_deprecated, NULL),</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='add'>+EXPORT_SYMBOL_GPL(fat_param_spec);</div><div class='ctx'> </div><div class='del'>-	while ((p = strsep(&amp;options, ",")) != NULL) {</div><div class='del'>-		int token;</div><div class='del'>-		if (!*p)</div><div class='del'>-			continue;</div><div class='add'>+static const struct fs_parameter_spec msdos_param_spec[] = {</div><div class='add'>+	fsparam_flag_no	("dots",	Opt_dots),</div><div class='add'>+	fsparam_bool	("dotsOK",	Opt_dotsOK),</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-		token = match_token(p, fat_tokens, args);</div><div class='del'>-		if (token == Opt_err) {</div><div class='del'>-			if (is_vfat)</div><div class='del'>-				token = match_token(p, vfat_tokens, args);</div><div class='del'>-			else</div><div class='del'>-				token = match_token(p, msdos_tokens, args);</div><div class='del'>-		}</div><div class='del'>-		switch (token) {</div><div class='del'>-		case Opt_check_s:</div><div class='del'>-			opts-&gt;name_check = 's';</div><div class='del'>-			break;</div><div class='del'>-		case Opt_check_r:</div><div class='del'>-			opts-&gt;name_check = 'r';</div><div class='del'>-			break;</div><div class='del'>-		case Opt_check_n:</div><div class='del'>-			opts-&gt;name_check = 'n';</div><div class='del'>-			break;</div><div class='del'>-		case Opt_usefree:</div><div class='del'>-			opts-&gt;usefree = 1;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_nocase:</div><div class='del'>-			if (!is_vfat)</div><div class='del'>-				opts-&gt;nocase = 1;</div><div class='del'>-			else {</div><div class='del'>-				/* for backward compatibility */</div><div class='del'>-				opts-&gt;shortname = VFAT_SFN_DISPLAY_WIN95</div><div class='del'>-					| VFAT_SFN_CREATE_WIN95;</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		case Opt_quiet:</div><div class='del'>-			opts-&gt;quiet = 1;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_showexec:</div><div class='del'>-			opts-&gt;showexec = 1;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_debug:</div><div class='del'>-			*debug = 1;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_immutable:</div><div class='del'>-			opts-&gt;sys_immutable = 1;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_uid:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;option))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			opts-&gt;fs_uid = make_kuid(current_user_ns(), option);</div><div class='del'>-			if (!uid_valid(opts-&gt;fs_uid))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_gid:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;option))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			opts-&gt;fs_gid = make_kgid(current_user_ns(), option);</div><div class='del'>-			if (!gid_valid(opts-&gt;fs_gid))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_umask:</div><div class='del'>-			if (match_octal(&amp;args[0], &amp;option))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			opts-&gt;fs_fmask = opts-&gt;fs_dmask = option;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_dmask:</div><div class='del'>-			if (match_octal(&amp;args[0], &amp;option))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			opts-&gt;fs_dmask = option;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_fmask:</div><div class='del'>-			if (match_octal(&amp;args[0], &amp;option))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			opts-&gt;fs_fmask = option;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_allow_utime:</div><div class='del'>-			if (match_octal(&amp;args[0], &amp;option))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			opts-&gt;allow_utime = option &amp; (S_IWGRP | S_IWOTH);</div><div class='del'>-			break;</div><div class='del'>-		case Opt_codepage:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;option))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			opts-&gt;codepage = option;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_flush:</div><div class='del'>-			opts-&gt;flush = 1;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_time_offset:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;option))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			/*</div><div class='del'>-			 * GMT+-12 zones may have DST corrections so at least</div><div class='del'>-			 * 13 hours difference is needed. Make the limit 24</div><div class='del'>-			 * just in case someone invents something unusual.</div><div class='del'>-			 */</div><div class='del'>-			if (option &lt; -24 * 60 || option &gt; 24 * 60)</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			opts-&gt;tz_set = 1;</div><div class='del'>-			opts-&gt;time_offset = option;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_tz_utc:</div><div class='del'>-			opts-&gt;tz_set = 1;</div><div class='del'>-			opts-&gt;time_offset = 0;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_err_cont:</div><div class='del'>-			opts-&gt;errors = FAT_ERRORS_CONT;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_err_panic:</div><div class='del'>-			opts-&gt;errors = FAT_ERRORS_PANIC;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_err_ro:</div><div class='del'>-			opts-&gt;errors = FAT_ERRORS_RO;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_nfs_stale_rw:</div><div class='del'>-			opts-&gt;nfs = FAT_NFS_STALE_RW;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_nfs_nostale_ro:</div><div class='del'>-			opts-&gt;nfs = FAT_NFS_NOSTALE_RO;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_dos1xfloppy:</div><div class='del'>-			opts-&gt;dos1xfloppy = 1;</div><div class='del'>-			break;</div><div class='add'>+static const struct constant_table fat_param_shortname[] = {</div><div class='add'>+	{"lower",	VFAT_SFN_DISPLAY_LOWER | VFAT_SFN_CREATE_WIN95},</div><div class='add'>+	{"win95",	VFAT_SFN_DISPLAY_WIN95 | VFAT_SFN_CREATE_WIN95},</div><div class='add'>+	{"winnt",	VFAT_SFN_DISPLAY_WINNT | VFAT_SFN_CREATE_WINNT},</div><div class='add'>+	{"mixed",	VFAT_SFN_DISPLAY_WINNT | VFAT_SFN_CREATE_WIN95},</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-		/* msdos specific */</div><div class='del'>-		case Opt_dots:</div><div class='del'>-			opts-&gt;dotsOK = 1;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_nodots:</div><div class='del'>-			opts-&gt;dotsOK = 0;</div><div class='del'>-			break;</div><div class='add'>+static const struct fs_parameter_spec vfat_param_spec[] = {</div><div class='add'>+	fsparam_string	("iocharset",	Opt_charset),</div><div class='add'>+	fsparam_enum	("shortname",	Opt_shortname, fat_param_shortname),</div><div class='add'>+	fsparam_flag	("utf8",	Opt_utf8),</div><div class='add'>+	fsparam_bool	("utf8",	Opt_utf8_bool),</div><div class='add'>+	fsparam_flag	("uni_xlate",	Opt_uni_xl),</div><div class='add'>+	fsparam_bool	("uni_xlate",	Opt_uni_xl_bool),</div><div class='add'>+	fsparam_flag	("nonumtail",	Opt_nonumtail),</div><div class='add'>+	fsparam_bool	("nonumtail",	Opt_nonumtail_bool),</div><div class='add'>+	fsparam_flag	("rodir",	Opt_rodir),</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-		/* vfat specific */</div><div class='del'>-		case Opt_charset:</div><div class='del'>-			fat_reset_iocharset(opts);</div><div class='del'>-			iocharset = match_strdup(&amp;args[0]);</div><div class='del'>-			if (!iocharset)</div><div class='del'>-				return -ENOMEM;</div><div class='del'>-			opts-&gt;iocharset = iocharset;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_shortname_lower:</div><div class='del'>-			opts-&gt;shortname = VFAT_SFN_DISPLAY_LOWER</div><div class='del'>-					| VFAT_SFN_CREATE_WIN95;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_shortname_win95:</div><div class='del'>-			opts-&gt;shortname = VFAT_SFN_DISPLAY_WIN95</div><div class='del'>-					| VFAT_SFN_CREATE_WIN95;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_shortname_winnt:</div><div class='del'>-			opts-&gt;shortname = VFAT_SFN_DISPLAY_WINNT</div><div class='del'>-					| VFAT_SFN_CREATE_WINNT;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_shortname_mixed:</div><div class='del'>-			opts-&gt;shortname = VFAT_SFN_DISPLAY_WINNT</div><div class='del'>-					| VFAT_SFN_CREATE_WIN95;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_utf8_no:		/* 0 or no or false */</div><div class='del'>-			opts-&gt;utf8 = 0;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_utf8_yes:		/* empty or 1 or yes or true */</div><div class='del'>-			opts-&gt;utf8 = 1;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_uni_xl_no:		/* 0 or no or false */</div><div class='del'>-			opts-&gt;unicode_xlate = 0;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_uni_xl_yes:		/* empty or 1 or yes or true */</div><div class='del'>-			opts-&gt;unicode_xlate = 1;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_nonumtail_no:		/* 0 or no or false */</div><div class='del'>-			opts-&gt;numtail = 1;	/* negated option */</div><div class='del'>-			break;</div><div class='del'>-		case Opt_nonumtail_yes:		/* empty or 1 or yes or true */</div><div class='del'>-			opts-&gt;numtail = 0;	/* negated option */</div><div class='del'>-			break;</div><div class='del'>-		case Opt_rodir:</div><div class='del'>-			opts-&gt;rodir = 1;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_discard:</div><div class='del'>-			opts-&gt;discard = 1;</div><div class='del'>-			break;</div><div class='add'>+int fat_parse_param(struct fs_context *fc, struct fs_parameter *param,</div><div class='add'>+			   bool is_vfat)</div><div class='add'>+{</div><div class='add'>+	struct fat_mount_options *opts = fc-&gt;fs_private;</div><div class='add'>+	struct fs_parse_result result;</div><div class='add'>+	int opt;</div><div class='ctx'> </div><div class='del'>-		/* obsolete mount options */</div><div class='del'>-		case Opt_obsolete:</div><div class='del'>-			fat_msg(sb, KERN_INFO, "\"%s\" option is obsolete, "</div><div class='del'>-			       "not supported now", p);</div><div class='del'>-			break;</div><div class='del'>-		/* unknown option */</div><div class='del'>-		default:</div><div class='del'>-			if (!silent) {</div><div class='del'>-				fat_msg(sb, KERN_ERR,</div><div class='del'>-				       "Unrecognized mount option \"%s\" "</div><div class='del'>-				       "or missing value", p);</div><div class='del'>-			}</div><div class='del'>-			return -EINVAL;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	/* remount options have traditionally been ignored */</div><div class='add'>+	if (fc-&gt;purpose == FS_CONTEXT_FOR_RECONFIGURE)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	/* UTF-8 doesn't provide FAT semantics */</div><div class='del'>-	if (!strcmp(opts-&gt;iocharset, "utf8")) {</div><div class='del'>-		fat_msg(sb, KERN_WARNING, "utf8 is not a recommended IO charset"</div><div class='del'>-		       " for FAT filesystems, filesystem will be "</div><div class='del'>-		       "case sensitive!");</div><div class='add'>+	opt = fs_parse(fc, fat_param_spec, param, &amp;result);</div><div class='add'>+	/* If option not found in fat_param_spec, try vfat/msdos options */</div><div class='add'>+	if (opt == -ENOPARAM) {</div><div class='add'>+		if (is_vfat)</div><div class='add'>+			opt = fs_parse(fc, vfat_param_spec, param, &amp;result);</div><div class='add'>+		else</div><div class='add'>+			opt = fs_parse(fc, msdos_param_spec, param, &amp;result);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* If user doesn't specify allow_utime, it's initialized from dmask. */</div><div class='del'>-	if (opts-&gt;allow_utime == (unsigned short)-1)</div><div class='del'>-		opts-&gt;allow_utime = ~opts-&gt;fs_dmask &amp; (S_IWGRP | S_IWOTH);</div><div class='del'>-	if (opts-&gt;unicode_xlate)</div><div class='del'>-		opts-&gt;utf8 = 0;</div><div class='del'>-	if (opts-&gt;nfs == FAT_NFS_NOSTALE_RO) {</div><div class='del'>-		sb-&gt;s_flags |= SB_RDONLY;</div><div class='del'>-		sb-&gt;s_export_op = &amp;fat_export_ops_nostale;</div><div class='add'>+	if (opt &lt; 0)</div><div class='add'>+		return opt;</div><div class='add'>+</div><div class='add'>+	switch (opt) {</div><div class='add'>+	case Opt_check:</div><div class='add'>+		opts-&gt;name_check = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_usefree:</div><div class='add'>+		opts-&gt;usefree = 1;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_nocase:</div><div class='add'>+		if (!is_vfat)</div><div class='add'>+			opts-&gt;nocase = 1;</div><div class='add'>+		else {</div><div class='add'>+			/* for backward compatibility */</div><div class='add'>+			opts-&gt;shortname = VFAT_SFN_DISPLAY_WIN95</div><div class='add'>+				| VFAT_SFN_CREATE_WIN95;</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='add'>+	case Opt_quiet:</div><div class='add'>+		opts-&gt;quiet = 1;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_showexec:</div><div class='add'>+		opts-&gt;showexec = 1;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_debug:</div><div class='add'>+		opts-&gt;debug = 1;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_immutable:</div><div class='add'>+		opts-&gt;sys_immutable = 1;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_uid:</div><div class='add'>+		opts-&gt;fs_uid = result.uid;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_gid:</div><div class='add'>+		opts-&gt;fs_gid = result.gid;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_umask:</div><div class='add'>+		opts-&gt;fs_fmask = opts-&gt;fs_dmask = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_dmask:</div><div class='add'>+		opts-&gt;fs_dmask = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_fmask:</div><div class='add'>+		opts-&gt;fs_fmask = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_allow_utime:</div><div class='add'>+		opts-&gt;allow_utime = result.uint_32 &amp; (S_IWGRP | S_IWOTH);</div><div class='add'>+		break;</div><div class='add'>+	case Opt_codepage:</div><div class='add'>+		opts-&gt;codepage = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_flush:</div><div class='add'>+		opts-&gt;flush = 1;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_time_offset:</div><div class='add'>+		/*</div><div class='add'>+		 * GMT+-12 zones may have DST corrections so at least</div><div class='add'>+		 * 13 hours difference is needed. Make the limit 24</div><div class='add'>+		 * just in case someone invents something unusual.</div><div class='add'>+		 */</div><div class='add'>+		if (result.int_32 &lt; -24 * 60 || result.int_32 &gt; 24 * 60)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		opts-&gt;tz_set = 1;</div><div class='add'>+		opts-&gt;time_offset = result.int_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_tz:</div><div class='add'>+		opts-&gt;tz_set = 1;</div><div class='add'>+		opts-&gt;time_offset = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_errors:</div><div class='add'>+		opts-&gt;errors = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_nfs:</div><div class='add'>+		opts-&gt;nfs = FAT_NFS_STALE_RW;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_nfs_enum:</div><div class='add'>+		opts-&gt;nfs = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_dos1xfloppy:</div><div class='add'>+		opts-&gt;dos1xfloppy = 1;</div><div class='add'>+		break;</div><div class='add'>+</div><div class='add'>+	/* msdos specific */</div><div class='add'>+	case Opt_dots:	/* dots / nodots */</div><div class='add'>+		opts-&gt;dotsOK = !result.negated;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_dotsOK:	/* dotsOK = yes/no */</div><div class='add'>+		opts-&gt;dotsOK = result.boolean;</div><div class='add'>+		break;</div><div class='add'>+</div><div class='add'>+	/* vfat specific */</div><div class='add'>+	case Opt_charset:</div><div class='add'>+		fat_reset_iocharset(opts);</div><div class='add'>+		opts-&gt;iocharset = param-&gt;string;</div><div class='add'>+		param-&gt;string = NULL;	/* Steal string */</div><div class='add'>+		break;</div><div class='add'>+	case Opt_shortname:</div><div class='add'>+		opts-&gt;shortname = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_utf8:</div><div class='add'>+		opts-&gt;utf8 = 1;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_utf8_bool:</div><div class='add'>+		opts-&gt;utf8 = result.boolean;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_uni_xl:</div><div class='add'>+		opts-&gt;unicode_xlate = 1;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_uni_xl_bool:</div><div class='add'>+		opts-&gt;unicode_xlate = result.boolean;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_nonumtail:</div><div class='add'>+		opts-&gt;numtail = 0;	/* negated option */</div><div class='add'>+		break;</div><div class='add'>+	case Opt_nonumtail_bool:</div><div class='add'>+		opts-&gt;numtail = !result.boolean; /* negated option */</div><div class='add'>+		break;</div><div class='add'>+	case Opt_rodir:</div><div class='add'>+		opts-&gt;rodir = 1;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_discard:</div><div class='add'>+		opts-&gt;discard = 1;</div><div class='add'>+		break;</div><div class='add'>+</div><div class='add'>+	/* obsolete mount options */</div><div class='add'>+	case Opt_obsolete:</div><div class='add'>+		printk(KERN_INFO "FAT-fs: \"%s\" option is obsolete, "</div><div class='add'>+			"not supported now", param-&gt;key);</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL_GPL(fat_parse_param);</div><div class='ctx'> </div><div class='ctx'> static int fat_read_root(struct inode *inode)</div><div class='ctx'> {</div><div class='hunk'>@@ -1408,8 +1343,8 @@ static int fat_read_root(struct inode *inode)</div><div class='ctx'> 	MSDOS_I(inode)-&gt;mmu_private = inode-&gt;i_size;</div><div class='ctx'> </div><div class='ctx'> 	fat_save_attrs(inode, ATTR_DIR);</div><div class='del'>-	inode-&gt;i_mtime.tv_sec = inode-&gt;i_atime.tv_sec = inode-&gt;i_ctime.tv_sec = 0;</div><div class='del'>-	inode-&gt;i_mtime.tv_nsec = inode-&gt;i_atime.tv_nsec = inode-&gt;i_ctime.tv_nsec = 0;</div><div class='add'>+	inode_set_mtime_to_ts(inode,</div><div class='add'>+			      inode_set_atime_to_ts(inode, inode_set_ctime(inode, 0, 0)));</div><div class='ctx'> 	set_nlink(inode, fat_subdirs(inode)+2);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -1597,9 +1532,11 @@ out:</div><div class='ctx'> /*</div><div class='ctx'>  * Read the super block of an MS-DOS FS.</div><div class='ctx'>  */</div><div class='del'>-int fat_fill_super(struct super_block *sb, void *data, int silent, int isvfat,</div><div class='add'>+int fat_fill_super(struct super_block *sb, struct fs_context *fc,</div><div class='ctx'> 		   void (*setup)(struct super_block *))</div><div class='ctx'> {</div><div class='add'>+	struct fat_mount_options *opts = fc-&gt;fs_private;</div><div class='add'>+	int silent = fc-&gt;sb_flags &amp; SB_SILENT;</div><div class='ctx'> 	struct inode *root_inode = NULL, *fat_inode = NULL;</div><div class='ctx'> 	struct inode *fsinfo_inode = NULL;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='hunk'>@@ -1607,7 +1544,6 @@ int fat_fill_super(struct super_block *sb, void *data, int silent, int isvfat,</div><div class='ctx'> 	struct msdos_sb_info *sbi;</div><div class='ctx'> 	u16 logical_sector_size;</div><div class='ctx'> 	u32 total_sectors, total_clusters, fat_clusters, rootdir_sectors;</div><div class='del'>-	int debug;</div><div class='ctx'> 	long error;</div><div class='ctx'> 	char buf[50];</div><div class='ctx'> 	struct timespec64 ts;</div><div class='hunk'>@@ -1636,14 +1572,36 @@ int fat_fill_super(struct super_block *sb, void *data, int silent, int isvfat,</div><div class='ctx'> 	ratelimit_state_init(&amp;sbi-&gt;ratelimit, DEFAULT_RATELIMIT_INTERVAL,</div><div class='ctx'> 			     DEFAULT_RATELIMIT_BURST);</div><div class='ctx'> </div><div class='del'>-	error = parse_options(sb, data, isvfat, silent, &amp;debug, &amp;sbi-&gt;options);</div><div class='del'>-	if (error)</div><div class='del'>-		goto out_fail;</div><div class='add'>+	/* UTF-8 doesn't provide FAT semantics */</div><div class='add'>+	if (!strcmp(opts-&gt;iocharset, "utf8")) {</div><div class='add'>+		fat_msg(sb, KERN_WARNING, "utf8 is not a recommended IO charset"</div><div class='add'>+		       " for FAT filesystems, filesystem will be"</div><div class='add'>+		       " case sensitive!");</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* If user doesn't specify allow_utime, it's initialized from dmask. */</div><div class='add'>+	if (opts-&gt;allow_utime == (unsigned short)-1)</div><div class='add'>+		opts-&gt;allow_utime = ~opts-&gt;fs_dmask &amp; (S_IWGRP | S_IWOTH);</div><div class='add'>+	if (opts-&gt;unicode_xlate)</div><div class='add'>+		opts-&gt;utf8 = 0;</div><div class='add'>+	if (opts-&gt;nfs == FAT_NFS_NOSTALE_RO) {</div><div class='add'>+		sb-&gt;s_flags |= SB_RDONLY;</div><div class='add'>+		sb-&gt;s_export_op = &amp;fat_export_ops_nostale;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Apply parsed options to sbi (structure copy) */</div><div class='add'>+	sbi-&gt;options = *opts;</div><div class='add'>+	/* Transfer ownership of iocharset to sbi-&gt;options */</div><div class='add'>+	opts-&gt;iocharset = NULL;</div><div class='ctx'> </div><div class='ctx'> 	setup(sb); /* flavour-specific stuff that needs options */</div><div class='ctx'> </div><div class='add'>+	error = -EINVAL;</div><div class='add'>+	if (!sb_min_blocksize(sb, 512)) {</div><div class='add'>+		fat_msg(sb, KERN_ERR, "unable to set blocksize");</div><div class='add'>+		goto out_fail;</div><div class='add'>+	}</div><div class='ctx'> 	error = -EIO;</div><div class='del'>-	sb_min_blocksize(sb, 512);</div><div class='ctx'> 	bh = sb_bread(sb, 0);</div><div class='ctx'> 	if (bh == NULL) {</div><div class='ctx'> 		fat_msg(sb, KERN_ERR, "unable to read boot sector");</div><div class='hunk'>@@ -1755,6 +1713,9 @@ int fat_fill_super(struct super_block *sb, void *data, int silent, int isvfat,</div><div class='ctx'> 	else /* fat 16 or 12 */</div><div class='ctx'> 		sbi-&gt;vol_id = bpb.fat16_vol_id;</div><div class='ctx'> </div><div class='add'>+	__le32 vol_id_le = cpu_to_le32(sbi-&gt;vol_id);</div><div class='add'>+	super_set_uuid(sb, (void *) &amp;vol_id_le, sizeof(vol_id_le));</div><div class='add'>+</div><div class='ctx'> 	sbi-&gt;dir_per_block = sb-&gt;s_blocksize / sizeof(struct msdos_dir_entry);</div><div class='ctx'> 	sbi-&gt;dir_per_block_bits = ffs(sbi-&gt;dir_per_block) - 1;</div><div class='ctx'> </div><div class='hunk'>@@ -1871,13 +1832,9 @@ int fat_fill_super(struct super_block *sb, void *data, int silent, int isvfat,</div><div class='ctx'> 		goto out_fail;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (sbi-&gt;options.discard) {</div><div class='del'>-		struct request_queue *q = bdev_get_queue(sb-&gt;s_bdev);</div><div class='del'>-		if (!blk_queue_discard(q))</div><div class='del'>-			fat_msg(sb, KERN_WARNING,</div><div class='del'>-					"mounting with \"discard\" option, but "</div><div class='del'>-					"the device does not support discard");</div><div class='del'>-	}</div><div class='add'>+	if (sbi-&gt;options.discard &amp;&amp; !bdev_max_discard_sectors(sb-&gt;s_bdev))</div><div class='add'>+		fat_msg(sb, KERN_WARNING,</div><div class='add'>+			"mounting with \"discard\" option, but the device does not support discard");</div><div class='ctx'> </div><div class='ctx'> 	fat_set_state(sb, 1, 0);</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -1888,10 +1845,8 @@ out_invalid:</div><div class='ctx'> 		fat_msg(sb, KERN_INFO, "Can't find a valid FAT filesystem");</div><div class='ctx'> </div><div class='ctx'> out_fail:</div><div class='del'>-	if (fsinfo_inode)</div><div class='del'>-		iput(fsinfo_inode);</div><div class='del'>-	if (fat_inode)</div><div class='del'>-		iput(fat_inode);</div><div class='add'>+	iput(fsinfo_inode);</div><div class='add'>+	iput(fat_inode);</div><div class='ctx'> 	unload_nls(sbi-&gt;nls_io);</div><div class='ctx'> 	unload_nls(sbi-&gt;nls_disk);</div><div class='ctx'> 	fat_reset_iocharset(&amp;sbi-&gt;options);</div><div class='hunk'>@@ -1946,6 +1901,57 @@ int fat_flush_inodes(struct super_block *sb, struct inode *i1, struct inode *i2)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(fat_flush_inodes);</div><div class='ctx'> </div><div class='add'>+int fat_init_fs_context(struct fs_context *fc, bool is_vfat)</div><div class='add'>+{</div><div class='add'>+	struct fat_mount_options *opts;</div><div class='add'>+</div><div class='add'>+	opts = kzalloc(sizeof(*opts), GFP_KERNEL);</div><div class='add'>+	if (!opts)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	opts-&gt;isvfat = is_vfat;</div><div class='add'>+	opts-&gt;fs_uid = current_uid();</div><div class='add'>+	opts-&gt;fs_gid = current_gid();</div><div class='add'>+	opts-&gt;fs_fmask = opts-&gt;fs_dmask = current_umask();</div><div class='add'>+	opts-&gt;allow_utime = -1;</div><div class='add'>+	opts-&gt;codepage = fat_default_codepage;</div><div class='add'>+	fat_reset_iocharset(opts);</div><div class='add'>+	if (is_vfat) {</div><div class='add'>+		opts-&gt;shortname = VFAT_SFN_DISPLAY_WINNT|VFAT_SFN_CREATE_WIN95;</div><div class='add'>+		opts-&gt;rodir = 0;</div><div class='add'>+	} else {</div><div class='add'>+		opts-&gt;shortname = 0;</div><div class='add'>+		opts-&gt;rodir = 1;</div><div class='add'>+	}</div><div class='add'>+	opts-&gt;name_check = 'n';</div><div class='add'>+	opts-&gt;quiet = opts-&gt;showexec = opts-&gt;sys_immutable = opts-&gt;dotsOK =  0;</div><div class='add'>+	opts-&gt;unicode_xlate = 0;</div><div class='add'>+	opts-&gt;numtail = 1;</div><div class='add'>+	opts-&gt;usefree = opts-&gt;nocase = 0;</div><div class='add'>+	opts-&gt;tz_set = 0;</div><div class='add'>+	opts-&gt;nfs = 0;</div><div class='add'>+	opts-&gt;errors = FAT_ERRORS_RO;</div><div class='add'>+	opts-&gt;debug = 0;</div><div class='add'>+</div><div class='add'>+	opts-&gt;utf8 = IS_ENABLED(CONFIG_FAT_DEFAULT_UTF8) &amp;&amp; is_vfat;</div><div class='add'>+</div><div class='add'>+	fc-&gt;fs_private = opts;</div><div class='add'>+	/* fc-&gt;ops assigned by caller */</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(fat_init_fs_context);</div><div class='add'>+</div><div class='add'>+void fat_free_fc(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct fat_mount_options *opts = fc-&gt;fs_private;</div><div class='add'>+</div><div class='add'>+	if (opts-&gt;iocharset != fat_default_iocharset)</div><div class='add'>+		kfree(opts-&gt;iocharset);</div><div class='add'>+	kfree(fc-&gt;fs_private);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(fat_free_fc);</div><div class='add'>+</div><div class='ctx'> static int __init init_fat_fs(void)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='hunk'>@@ -1974,4 +1980,5 @@ static void __exit exit_fat_fs(void)</div><div class='ctx'> module_init(init_fat_fs)</div><div class='ctx'> module_exit(exit_fat_fs)</div><div class='ctx'> </div><div class='add'>+MODULE_DESCRIPTION("Core FAT filesystem support");</div><div class='ctx'> MODULE_LICENSE("GPL");</div><div class='head'>diff --git a/fs/fat/misc.c b/fs/fat/misc.c<br/>index 91ca3c304211..950da09f0961 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fat/misc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fat/misc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fat/misc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fat/misc.c</a></div><div class='hunk'>@@ -42,10 +42,16 @@ void __fat_fs_error(struct super_block *sb, int report, const char *fmt, ...)</div><div class='ctx'> EXPORT_SYMBOL_GPL(__fat_fs_error);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * fat_msg() - print preformated FAT specific messages. Every thing what is</div><div class='del'>- * not fat_fs_error() should be fat_msg().</div><div class='add'>+ * _fat_msg() - Print a preformatted FAT message based on a superblock.</div><div class='add'>+ * @sb: A pointer to a &amp;struct super_block</div><div class='add'>+ * @level: A Kernel printk level constant</div><div class='add'>+ * @fmt: The printf-style format string to print.</div><div class='add'>+ *</div><div class='add'>+ * Everything that is not fat_fs_error() should be fat_msg().</div><div class='add'>+ *</div><div class='add'>+ * fat_msg() wraps _fat_msg() for printk indexing.</div><div class='ctx'>  */</div><div class='del'>-void fat_msg(struct super_block *sb, const char *level, const char *fmt, ...)</div><div class='add'>+void _fat_msg(struct super_block *sb, const char *level, const char *fmt, ...)</div><div class='ctx'> {</div><div class='ctx'> 	struct va_format vaf;</div><div class='ctx'> 	va_list args;</div><div class='hunk'>@@ -53,7 +59,7 @@ void fat_msg(struct super_block *sb, const char *level, const char *fmt, ...)</div><div class='ctx'> 	va_start(args, fmt);</div><div class='ctx'> 	vaf.fmt = fmt;</div><div class='ctx'> 	vaf.va = &amp;args;</div><div class='del'>-	printk("%sFAT-fs (%s): %pV\n", level, sb-&gt;s_id, &amp;vaf);</div><div class='add'>+	_printk(FAT_PRINTK_PREFIX "%pV\n", level, sb-&gt;s_id, &amp;vaf);</div><div class='ctx'> 	va_end(args);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -152,9 +158,9 @@ int fat_chain_add(struct inode *inode, int new_dclus, int nr_cluster)</div><div class='ctx'> 			mark_inode_dirty(inode);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (new_fclus != (inode-&gt;i_blocks &gt;&gt; (sbi-&gt;cluster_bits - 9))) {</div><div class='del'>-		fat_fs_error(sb, "clusters badly computed (%d != %llu)",</div><div class='del'>-			     new_fclus,</div><div class='del'>-			     (llu)(inode-&gt;i_blocks &gt;&gt; (sbi-&gt;cluster_bits - 9)));</div><div class='add'>+		fat_fs_error_ratelimit(</div><div class='add'>+			sb, "clusters badly computed (%d != %llu)", new_fclus,</div><div class='add'>+			(llu)(inode-&gt;i_blocks &gt;&gt; (sbi-&gt;cluster_bits - 9)));</div><div class='ctx'> 		fat_cache_inval_inode(inode);</div><div class='ctx'> 	}</div><div class='ctx'> 	inode-&gt;i_blocks += nr_cluster &lt;&lt; (sbi-&gt;cluster_bits - 9);</div><div class='hunk'>@@ -187,7 +193,7 @@ static long days_in_year[] = {</div><div class='ctx'> 	0,   0,  31,  59,  90, 120, 151, 181, 212, 243, 273, 304, 334, 0, 0, 0,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static inline int fat_tz_offset(struct msdos_sb_info *sbi)</div><div class='add'>+static inline int fat_tz_offset(const struct msdos_sb_info *sbi)</div><div class='ctx'> {</div><div class='ctx'> 	return (sbi-&gt;options.tz_set ?</div><div class='ctx'> 	       -sbi-&gt;options.time_offset :</div><div class='hunk'>@@ -275,23 +281,35 @@ static inline struct timespec64 fat_timespec64_trunc_2secs(struct timespec64 ts)</div><div class='ctx'> 	return (struct timespec64){ ts.tv_sec &amp; ~1ULL, 0 };</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline struct timespec64 fat_timespec64_trunc_10ms(struct timespec64 ts)</div><div class='add'>+/*</div><div class='add'>+ * truncate atime to 24 hour granularity (00:00:00 in local timezone)</div><div class='add'>+ */</div><div class='add'>+struct timespec64 fat_truncate_atime(const struct msdos_sb_info *sbi,</div><div class='add'>+				     const struct timespec64 *ts)</div><div class='ctx'> {</div><div class='del'>-	if (ts.tv_nsec)</div><div class='del'>-		ts.tv_nsec -= ts.tv_nsec % 10000000UL;</div><div class='del'>-	return ts;</div><div class='add'>+	/* to localtime */</div><div class='add'>+	time64_t seconds = ts-&gt;tv_sec - fat_tz_offset(sbi);</div><div class='add'>+	s32 remainder;</div><div class='add'>+</div><div class='add'>+	div_s64_rem(seconds, SECS_PER_DAY, &amp;remainder);</div><div class='add'>+	/* to day boundary, and back to unix time */</div><div class='add'>+	seconds = seconds + fat_tz_offset(sbi) - remainder;</div><div class='add'>+</div><div class='add'>+	return (struct timespec64){ seconds, 0 };</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * truncate mtime to 2 second granularity</div><div class='add'>+ */</div><div class='add'>+struct timespec64 fat_truncate_mtime(const struct msdos_sb_info *sbi,</div><div class='add'>+				     const struct timespec64 *ts)</div><div class='add'>+{</div><div class='add'>+	return fat_timespec64_trunc_2secs(*ts);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * truncate the various times with appropriate granularity:</div><div class='del'>- *   root inode:</div><div class='del'>- *     all times always 0</div><div class='del'>- *   all other inodes:</div><div class='del'>- *     mtime - 2 seconds</div><div class='del'>- *     ctime</div><div class='del'>- *       msdos - 2 seconds</div><div class='del'>- *       vfat  - 10 milliseconds</div><div class='del'>- *     atime - 24 hours (00:00:00 in local timezone)</div><div class='add'>+ *   all times in root node are always 0</div><div class='ctx'>  */</div><div class='ctx'> int fat_truncate_time(struct inode *inode, struct timespec64 *now, int flags)</div><div class='ctx'> {</div><div class='hunk'>@@ -306,31 +324,22 @@ int fat_truncate_time(struct inode *inode, struct timespec64 *now, int flags)</div><div class='ctx'> 		ts = current_time(inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (flags &amp; S_ATIME) {</div><div class='del'>-		/* to localtime */</div><div class='del'>-		time64_t seconds = now-&gt;tv_sec - fat_tz_offset(sbi);</div><div class='del'>-		s32 remainder;</div><div class='del'>-</div><div class='del'>-		div_s64_rem(seconds, SECS_PER_DAY, &amp;remainder);</div><div class='del'>-		/* to day boundary, and back to unix time */</div><div class='del'>-		seconds = seconds + fat_tz_offset(sbi) - remainder;</div><div class='del'>-</div><div class='del'>-		inode-&gt;i_atime = (struct timespec64){ seconds, 0 };</div><div class='del'>-	}</div><div class='del'>-	if (flags &amp; S_CTIME) {</div><div class='del'>-		if (sbi-&gt;options.isvfat)</div><div class='del'>-			inode-&gt;i_ctime = fat_timespec64_trunc_10ms(*now);</div><div class='del'>-		else</div><div class='del'>-			inode-&gt;i_ctime = fat_timespec64_trunc_2secs(*now);</div><div class='del'>-	}</div><div class='add'>+	if (flags &amp; S_ATIME)</div><div class='add'>+		inode_set_atime_to_ts(inode, fat_truncate_atime(sbi, now));</div><div class='add'>+	/*</div><div class='add'>+	 * ctime and mtime share the same on-disk field, and should be</div><div class='add'>+	 * identical in memory. all mtime updates will be applied to ctime,</div><div class='add'>+	 * but ctime updates are ignored.</div><div class='add'>+	 */</div><div class='ctx'> 	if (flags &amp; S_MTIME)</div><div class='del'>-		inode-&gt;i_mtime = fat_timespec64_trunc_2secs(*now);</div><div class='add'>+		inode_set_mtime_to_ts(inode,</div><div class='add'>+				      inode_set_ctime_to_ts(inode, fat_truncate_mtime(sbi, now)));</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(fat_truncate_time);</div><div class='ctx'> </div><div class='del'>-int fat_update_time(struct inode *inode, struct timespec64 *now, int flags)</div><div class='add'>+int fat_update_time(struct inode *inode, int flags)</div><div class='ctx'> {</div><div class='ctx'> 	int dirty_flags = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -338,16 +347,13 @@ int fat_update_time(struct inode *inode, struct timespec64 *now, int flags)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; (S_ATIME | S_CTIME | S_MTIME)) {</div><div class='del'>-		fat_truncate_time(inode, now, flags);</div><div class='add'>+		fat_truncate_time(inode, NULL, flags);</div><div class='ctx'> 		if (inode-&gt;i_sb-&gt;s_flags &amp; SB_LAZYTIME)</div><div class='ctx'> 			dirty_flags |= I_DIRTY_TIME;</div><div class='ctx'> 		else</div><div class='ctx'> 			dirty_flags |= I_DIRTY_SYNC;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if ((flags &amp; S_VERSION) &amp;&amp; inode_maybe_inc_iversion(inode, false))</div><div class='del'>-		dirty_flags |= I_DIRTY_SYNC;</div><div class='del'>-</div><div class='ctx'> 	__mark_inode_dirty(inode, dirty_flags);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/fat/namei_msdos.c b/fs/fat/namei_msdos.c<br/>index efba301d68ae..0b920ee40a7f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fat/namei_msdos.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fat/namei_msdos.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fat/namei_msdos.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fat/namei_msdos.c</a></div><div class='hunk'>@@ -261,7 +261,7 @@ static int msdos_add_entry(struct inode *dir, const unsigned char *name,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /***** Create a file */</div><div class='del'>-static int msdos_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int msdos_create(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 			struct dentry *dentry, umode_t mode, bool excl)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = dir-&gt;i_sb;</div><div class='hunk'>@@ -339,8 +339,8 @@ out:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /***** Make a directory */</div><div class='del'>-static int msdos_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-		       struct dentry *dentry, umode_t mode)</div><div class='add'>+static struct dentry *msdos_mkdir(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+				  struct dentry *dentry, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = dir-&gt;i_sb;</div><div class='ctx'> 	struct fat_slot_info sinfo;</div><div class='hunk'>@@ -389,13 +389,13 @@ static int msdos_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> </div><div class='ctx'> 	mutex_unlock(&amp;MSDOS_SB(sb)-&gt;s_lock);</div><div class='ctx'> 	fat_flush_inodes(sb, dir, inode);</div><div class='del'>-	return 0;</div><div class='add'>+	return NULL;</div><div class='ctx'> </div><div class='ctx'> out_free:</div><div class='ctx'> 	fat_free_clusters(dir, cluster);</div><div class='ctx'> out:</div><div class='ctx'> 	mutex_unlock(&amp;MSDOS_SB(sb)-&gt;s_lock);</div><div class='del'>-	return err;</div><div class='add'>+	return ERR_PTR(err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /***** Unlink a file */</div><div class='hunk'>@@ -594,7 +594,7 @@ error_inode:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /***** Rename, a wrapper for rename_same_dir &amp; rename_diff_dir */</div><div class='del'>-static int msdos_rename(struct user_namespace *mnt_userns,</div><div class='add'>+static int msdos_rename(struct mnt_idmap *idmap,</div><div class='ctx'> 			struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> 			struct inode *new_dir, struct dentry *new_dentry,</div><div class='ctx'> 			unsigned int flags)</div><div class='hunk'>@@ -646,28 +646,52 @@ static const struct inode_operations msdos_dir_inode_operations = {</div><div class='ctx'> static void setup(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	MSDOS_SB(sb)-&gt;dir_ops = &amp;msdos_dir_inode_operations;</div><div class='del'>-	sb-&gt;s_d_op = &amp;msdos_dentry_operations;</div><div class='add'>+	set_default_d_op(sb, &amp;msdos_dentry_operations);</div><div class='ctx'> 	sb-&gt;s_flags |= SB_NOATIME;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int msdos_fill_super(struct super_block *sb, void *data, int silent)</div><div class='add'>+static int msdos_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	return fat_fill_super(sb, fc, setup);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int msdos_get_tree(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	return get_tree_bdev(fc, msdos_fill_super);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int msdos_parse_param(struct fs_context *fc, struct fs_parameter *param)</div><div class='ctx'> {</div><div class='del'>-	return fat_fill_super(sb, data, silent, 0, setup);</div><div class='add'>+	return fat_parse_param(fc, param, false);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct dentry *msdos_mount(struct file_system_type *fs_type,</div><div class='del'>-			int flags, const char *dev_name,</div><div class='del'>-			void *data)</div><div class='add'>+static const struct fs_context_operations msdos_context_ops = {</div><div class='add'>+	.parse_param	= msdos_parse_param,</div><div class='add'>+	.get_tree	= msdos_get_tree,</div><div class='add'>+	.reconfigure	= fat_reconfigure,</div><div class='add'>+	.free		= fat_free_fc,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int msdos_init_fs_context(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	return mount_bdev(fs_type, flags, dev_name, data, msdos_fill_super);</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	/* Initialize with is_vfat == false */</div><div class='add'>+	err = fat_init_fs_context(fc, false);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	fc-&gt;ops = &amp;msdos_context_ops;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct file_system_type msdos_fs_type = {</div><div class='ctx'> 	.owner		= THIS_MODULE,</div><div class='ctx'> 	.name		= "msdos",</div><div class='del'>-	.mount		= msdos_mount,</div><div class='ctx'> 	.kill_sb	= kill_block_super,</div><div class='ctx'> 	.fs_flags	= FS_REQUIRES_DEV | FS_ALLOW_IDMAP,</div><div class='add'>+	.init_fs_context = msdos_init_fs_context,</div><div class='add'>+	.parameters	= fat_param_spec,</div><div class='ctx'> };</div><div class='ctx'> MODULE_ALIAS_FS("msdos");</div><div class='ctx'> </div><div class='head'>diff --git a/fs/fat/namei_vfat.c b/fs/fat/namei_vfat.c<br/>index 5369d82e0bfb..5dbc4cbb8fce 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fat/namei_vfat.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fat/namei_vfat.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fat/namei_vfat.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fat/namei_vfat.c</a></div><div class='hunk'>@@ -43,17 +43,13 @@ static inline void vfat_d_version_set(struct dentry *dentry,</div><div class='ctx'>  * If it happened, the negative dentry isn't actually negative</div><div class='ctx'>  * anymore.  So, drop it.</div><div class='ctx'>  */</div><div class='del'>-static int vfat_revalidate_shortname(struct dentry *dentry)</div><div class='add'>+static bool vfat_revalidate_shortname(struct dentry *dentry, struct inode *dir)</div><div class='ctx'> {</div><div class='del'>-	int ret = 1;</div><div class='del'>-	spin_lock(&amp;dentry-&gt;d_lock);</div><div class='del'>-	if (!inode_eq_iversion(d_inode(dentry-&gt;d_parent), vfat_d_version(dentry)))</div><div class='del'>-		ret = 0;</div><div class='del'>-	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='del'>-	return ret;</div><div class='add'>+	return inode_eq_iversion(dir, vfat_d_version(dentry));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int vfat_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='add'>+static int vfat_revalidate(struct inode *dir, const struct qstr *name,</div><div class='add'>+			   struct dentry *dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	if (flags &amp; LOOKUP_RCU)</div><div class='ctx'> 		return -ECHILD;</div><div class='hunk'>@@ -61,10 +57,11 @@ static int vfat_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='ctx'> 	/* This is not negative dentry. Always valid. */</div><div class='ctx'> 	if (d_really_is_positive(dentry))</div><div class='ctx'> 		return 1;</div><div class='del'>-	return vfat_revalidate_shortname(dentry);</div><div class='add'>+	return vfat_revalidate_shortname(dentry, dir);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int vfat_revalidate_ci(struct dentry *dentry, unsigned int flags)</div><div class='add'>+static int vfat_revalidate_ci(struct inode *dir, const struct qstr *name,</div><div class='add'>+			      struct dentry *dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	if (flags &amp; LOOKUP_RCU)</div><div class='ctx'> 		return -ECHILD;</div><div class='hunk'>@@ -97,7 +94,7 @@ static int vfat_revalidate_ci(struct dentry *dentry, unsigned int flags)</div><div class='ctx'> 	if (flags &amp; (LOOKUP_CREATE | LOOKUP_RENAME_TARGET))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	return vfat_revalidate_shortname(dentry);</div><div class='add'>+	return vfat_revalidate_shortname(dentry, dir);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* returns the length of a struct qstr, ignoring trailing dots */</div><div class='hunk'>@@ -200,7 +197,7 @@ static const struct dentry_operations vfat_dentry_ops = {</div><div class='ctx'> </div><div class='ctx'> /* Characters that are undesirable in an MS-DOS file name */</div><div class='ctx'> </div><div class='del'>-static inline wchar_t vfat_bad_char(wchar_t w)</div><div class='add'>+static inline bool vfat_bad_char(wchar_t w)</div><div class='ctx'> {</div><div class='ctx'> 	return (w &lt; 0x0020)</div><div class='ctx'> 	    || (w == '*') || (w == '?') || (w == '&lt;') || (w == '&gt;')</div><div class='hunk'>@@ -208,7 +205,7 @@ static inline wchar_t vfat_bad_char(wchar_t w)</div><div class='ctx'> 	    || (w == '\\');</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline wchar_t vfat_replace_char(wchar_t w)</div><div class='add'>+static inline bool vfat_replace_char(wchar_t w)</div><div class='ctx'> {</div><div class='ctx'> 	return (w == '[') || (w == ']') || (w == ';') || (w == ',')</div><div class='ctx'> 	    || (w == '+') || (w == '=');</div><div class='hunk'>@@ -756,7 +753,7 @@ error:</div><div class='ctx'> 	return ERR_PTR(err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int vfat_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int vfat_create(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		       struct dentry *dentry, umode_t mode, bool excl)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = dir-&gt;i_sb;</div><div class='hunk'>@@ -780,8 +777,6 @@ static int vfat_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	inode_inc_iversion(inode);</div><div class='del'>-	fat_truncate_time(inode, &amp;ts, S_ATIME|S_CTIME|S_MTIME);</div><div class='del'>-	/* timestamp is already written, so mark_inode_dirty() is unneeded. */</div><div class='ctx'> </div><div class='ctx'> 	d_instantiate(dentry, inode);</div><div class='ctx'> out:</div><div class='hunk'>@@ -846,8 +841,8 @@ out:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int vfat_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-		      struct dentry *dentry, umode_t mode)</div><div class='add'>+static struct dentry *vfat_mkdir(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+				  struct dentry *dentry, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = dir-&gt;i_sb;</div><div class='ctx'> 	struct inode *inode;</div><div class='hunk'>@@ -878,37 +873,70 @@ static int vfat_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	}</div><div class='ctx'> 	inode_inc_iversion(inode);</div><div class='ctx'> 	set_nlink(inode, 2);</div><div class='del'>-	fat_truncate_time(inode, &amp;ts, S_ATIME|S_CTIME|S_MTIME);</div><div class='del'>-	/* timestamp is already written, so mark_inode_dirty() is unneeded. */</div><div class='ctx'> </div><div class='ctx'> 	d_instantiate(dentry, inode);</div><div class='ctx'> </div><div class='ctx'> 	mutex_unlock(&amp;MSDOS_SB(sb)-&gt;s_lock);</div><div class='del'>-	return 0;</div><div class='add'>+	return NULL;</div><div class='ctx'> </div><div class='ctx'> out_free:</div><div class='ctx'> 	fat_free_clusters(dir, cluster);</div><div class='ctx'> out:</div><div class='ctx'> 	mutex_unlock(&amp;MSDOS_SB(sb)-&gt;s_lock);</div><div class='del'>-	return err;</div><div class='add'>+	return ERR_PTR(err);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int vfat_get_dotdot_de(struct inode *inode, struct buffer_head **bh,</div><div class='add'>+			      struct msdos_dir_entry **de)</div><div class='add'>+{</div><div class='add'>+	if (S_ISDIR(inode-&gt;i_mode)) {</div><div class='add'>+		if (fat_get_dotdot_entry(inode, bh, de))</div><div class='add'>+			return -EIO;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int vfat_sync_ipos(struct inode *dir, struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	if (IS_DIRSYNC(dir))</div><div class='add'>+		return fat_sync_inode(inode);</div><div class='add'>+	mark_inode_dirty(inode);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int vfat_update_dotdot_de(struct inode *dir, struct inode *inode,</div><div class='add'>+				 struct buffer_head *dotdot_bh,</div><div class='add'>+				 struct msdos_dir_entry *dotdot_de)</div><div class='add'>+{</div><div class='add'>+	fat_set_start(dotdot_de, MSDOS_I(dir)-&gt;i_logstart);</div><div class='add'>+	mark_buffer_dirty_inode(dotdot_bh, inode);</div><div class='add'>+	if (IS_DIRSYNC(dir))</div><div class='add'>+		return sync_dirty_buffer(dotdot_bh);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void vfat_update_dir_metadata(struct inode *dir, struct timespec64 *ts)</div><div class='add'>+{</div><div class='add'>+	inode_inc_iversion(dir);</div><div class='add'>+	fat_truncate_time(dir, ts, S_CTIME | S_MTIME);</div><div class='add'>+	if (IS_DIRSYNC(dir))</div><div class='add'>+		(void)fat_sync_inode(dir);</div><div class='add'>+	else</div><div class='add'>+		mark_inode_dirty(dir);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int vfat_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='del'>-		       struct dentry *old_dentry, struct inode *new_dir,</div><div class='del'>-		       struct dentry *new_dentry, unsigned int flags)</div><div class='add'>+static int vfat_rename(struct inode *old_dir, struct dentry *old_dentry,</div><div class='add'>+		       struct inode *new_dir, struct dentry *new_dentry)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *dotdot_bh;</div><div class='del'>-	struct msdos_dir_entry *dotdot_de;</div><div class='add'>+	struct msdos_dir_entry *dotdot_de = NULL;</div><div class='ctx'> 	struct inode *old_inode, *new_inode;</div><div class='ctx'> 	struct fat_slot_info old_sinfo, sinfo;</div><div class='ctx'> 	struct timespec64 ts;</div><div class='ctx'> 	loff_t new_i_pos;</div><div class='del'>-	int err, is_dir, update_dotdot, corrupt = 0;</div><div class='add'>+	int err, is_dir, corrupt = 0;</div><div class='ctx'> 	struct super_block *sb = old_dir-&gt;i_sb;</div><div class='ctx'> </div><div class='del'>-	if (flags &amp; ~RENAME_NOREPLACE)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='ctx'> 	old_sinfo.bh = sinfo.bh = dotdot_bh = NULL;</div><div class='ctx'> 	old_inode = d_inode(old_dentry);</div><div class='ctx'> 	new_inode = d_inode(new_dentry);</div><div class='hunk'>@@ -917,15 +945,13 @@ static int vfat_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	is_dir = S_ISDIR(old_inode-&gt;i_mode);</div><div class='del'>-	update_dotdot = (is_dir &amp;&amp; old_dir != new_dir);</div><div class='del'>-	if (update_dotdot) {</div><div class='del'>-		if (fat_get_dotdot_entry(old_inode, &amp;dotdot_bh, &amp;dotdot_de)) {</div><div class='del'>-			err = -EIO;</div><div class='add'>+	if (old_dir != new_dir) {</div><div class='add'>+		err = vfat_get_dotdot_de(old_inode, &amp;dotdot_bh, &amp;dotdot_de);</div><div class='add'>+		if (err)</div><div class='ctx'> 			goto out;</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	is_dir = S_ISDIR(old_inode-&gt;i_mode);</div><div class='ctx'> 	ts = current_time(old_dir);</div><div class='ctx'> 	if (new_inode) {</div><div class='ctx'> 		if (is_dir) {</div><div class='hunk'>@@ -946,21 +972,15 @@ static int vfat_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> </div><div class='ctx'> 	fat_detach(old_inode);</div><div class='ctx'> 	fat_attach(old_inode, new_i_pos);</div><div class='del'>-	if (IS_DIRSYNC(new_dir)) {</div><div class='del'>-		err = fat_sync_inode(old_inode);</div><div class='del'>-		if (err)</div><div class='del'>-			goto error_inode;</div><div class='del'>-	} else</div><div class='del'>-		mark_inode_dirty(old_inode);</div><div class='add'>+	err = vfat_sync_ipos(new_dir, old_inode);</div><div class='add'>+	if (err)</div><div class='add'>+		goto error_inode;</div><div class='ctx'> </div><div class='del'>-	if (update_dotdot) {</div><div class='del'>-		fat_set_start(dotdot_de, MSDOS_I(new_dir)-&gt;i_logstart);</div><div class='del'>-		mark_buffer_dirty_inode(dotdot_bh, old_inode);</div><div class='del'>-		if (IS_DIRSYNC(new_dir)) {</div><div class='del'>-			err = sync_dirty_buffer(dotdot_bh);</div><div class='del'>-			if (err)</div><div class='del'>-				goto error_dotdot;</div><div class='del'>-		}</div><div class='add'>+	if (dotdot_de) {</div><div class='add'>+		err = vfat_update_dotdot_de(new_dir, old_inode, dotdot_bh,</div><div class='add'>+					    dotdot_de);</div><div class='add'>+		if (err)</div><div class='add'>+			goto error_dotdot;</div><div class='ctx'> 		drop_nlink(old_dir);</div><div class='ctx'> 		if (!new_inode)</div><div class='ctx'>  			inc_nlink(new_dir);</div><div class='hunk'>@@ -970,12 +990,7 @@ static int vfat_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> 	old_sinfo.bh = NULL;</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto error_dotdot;</div><div class='del'>-	inode_inc_iversion(old_dir);</div><div class='del'>-	fat_truncate_time(old_dir, &amp;ts, S_CTIME|S_MTIME);</div><div class='del'>-	if (IS_DIRSYNC(old_dir))</div><div class='del'>-		(void)fat_sync_inode(old_dir);</div><div class='del'>-	else</div><div class='del'>-		mark_inode_dirty(old_dir);</div><div class='add'>+	vfat_update_dir_metadata(old_dir, &amp;ts);</div><div class='ctx'> </div><div class='ctx'> 	if (new_inode) {</div><div class='ctx'> 		drop_nlink(new_inode);</div><div class='hunk'>@@ -995,10 +1010,9 @@ error_dotdot:</div><div class='ctx'> 	/* data cluster is shared, serious corruption */</div><div class='ctx'> 	corrupt = 1;</div><div class='ctx'> </div><div class='del'>-	if (update_dotdot) {</div><div class='del'>-		fat_set_start(dotdot_de, MSDOS_I(old_dir)-&gt;i_logstart);</div><div class='del'>-		mark_buffer_dirty_inode(dotdot_bh, old_inode);</div><div class='del'>-		corrupt |= sync_dirty_buffer(dotdot_bh);</div><div class='add'>+	if (dotdot_de) {</div><div class='add'>+		corrupt |= vfat_update_dotdot_de(old_dir, old_inode, dotdot_bh,</div><div class='add'>+						 dotdot_de);</div><div class='ctx'> 	}</div><div class='ctx'> error_inode:</div><div class='ctx'> 	fat_detach(old_inode);</div><div class='hunk'>@@ -1020,18 +1034,150 @@ error_inode:</div><div class='ctx'> 	if (corrupt &lt; 0) {</div><div class='ctx'> 		fat_fs_error(new_dir-&gt;i_sb,</div><div class='ctx'> 			     "%s: Filesystem corrupted (i_pos %lld)",</div><div class='del'>-			     __func__, sinfo.i_pos);</div><div class='add'>+			     __func__, new_i_pos);</div><div class='add'>+	}</div><div class='add'>+	goto out;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void vfat_exchange_ipos(struct inode *old_inode, struct inode *new_inode,</div><div class='add'>+			       loff_t old_i_pos, loff_t new_i_pos)</div><div class='add'>+{</div><div class='add'>+	fat_detach(old_inode);</div><div class='add'>+	fat_detach(new_inode);</div><div class='add'>+	fat_attach(old_inode, new_i_pos);</div><div class='add'>+	fat_attach(new_inode, old_i_pos);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void vfat_move_nlink(struct inode *src, struct inode *dst)</div><div class='add'>+{</div><div class='add'>+	drop_nlink(src);</div><div class='add'>+	inc_nlink(dst);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int vfat_rename_exchange(struct inode *old_dir, struct dentry *old_dentry,</div><div class='add'>+				struct inode *new_dir, struct dentry *new_dentry)</div><div class='add'>+{</div><div class='add'>+	struct buffer_head *old_dotdot_bh = NULL, *new_dotdot_bh = NULL;</div><div class='add'>+	struct msdos_dir_entry *old_dotdot_de = NULL, *new_dotdot_de = NULL;</div><div class='add'>+	struct inode *old_inode, *new_inode;</div><div class='add'>+	struct timespec64 ts = current_time(old_dir);</div><div class='add'>+	loff_t old_i_pos, new_i_pos;</div><div class='add'>+	int err, corrupt = 0;</div><div class='add'>+	struct super_block *sb = old_dir-&gt;i_sb;</div><div class='add'>+</div><div class='add'>+	old_inode = d_inode(old_dentry);</div><div class='add'>+	new_inode = d_inode(new_dentry);</div><div class='add'>+</div><div class='add'>+	/* Acquire super block lock for the operation to be atomic */</div><div class='add'>+	mutex_lock(&amp;MSDOS_SB(sb)-&gt;s_lock);</div><div class='add'>+</div><div class='add'>+	/* if directories are not the same, get ".." info to update */</div><div class='add'>+	if (old_dir != new_dir) {</div><div class='add'>+		err = vfat_get_dotdot_de(old_inode, &amp;old_dotdot_bh,</div><div class='add'>+					 &amp;old_dotdot_de);</div><div class='add'>+		if (err)</div><div class='add'>+			goto out;</div><div class='add'>+</div><div class='add'>+		err = vfat_get_dotdot_de(new_inode, &amp;new_dotdot_bh,</div><div class='add'>+					 &amp;new_dotdot_de);</div><div class='add'>+		if (err)</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	old_i_pos = MSDOS_I(old_inode)-&gt;i_pos;</div><div class='add'>+	new_i_pos = MSDOS_I(new_inode)-&gt;i_pos;</div><div class='add'>+</div><div class='add'>+	vfat_exchange_ipos(old_inode, new_inode, old_i_pos, new_i_pos);</div><div class='add'>+</div><div class='add'>+	err = vfat_sync_ipos(old_dir, new_inode);</div><div class='add'>+	if (err)</div><div class='add'>+		goto error_exchange;</div><div class='add'>+	err = vfat_sync_ipos(new_dir, old_inode);</div><div class='add'>+	if (err)</div><div class='add'>+		goto error_exchange;</div><div class='add'>+</div><div class='add'>+	/* update ".." directory entry info */</div><div class='add'>+	if (old_dotdot_de) {</div><div class='add'>+		err = vfat_update_dotdot_de(new_dir, old_inode, old_dotdot_bh,</div><div class='add'>+					    old_dotdot_de);</div><div class='add'>+		if (err)</div><div class='add'>+			goto error_old_dotdot;</div><div class='add'>+	}</div><div class='add'>+	if (new_dotdot_de) {</div><div class='add'>+		err = vfat_update_dotdot_de(old_dir, new_inode, new_dotdot_bh,</div><div class='add'>+					    new_dotdot_de);</div><div class='add'>+		if (err)</div><div class='add'>+			goto error_new_dotdot;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* if cross directory and only one is a directory, adjust nlink */</div><div class='add'>+	if (!old_dotdot_de != !new_dotdot_de) {</div><div class='add'>+		if (old_dotdot_de)</div><div class='add'>+			vfat_move_nlink(old_dir, new_dir);</div><div class='add'>+		else</div><div class='add'>+			vfat_move_nlink(new_dir, old_dir);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	vfat_update_dir_metadata(old_dir, &amp;ts);</div><div class='add'>+	/* if directories are not the same, update new_dir as well */</div><div class='add'>+	if (old_dir != new_dir)</div><div class='add'>+		vfat_update_dir_metadata(new_dir, &amp;ts);</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	brelse(old_dotdot_bh);</div><div class='add'>+	brelse(new_dotdot_bh);</div><div class='add'>+	mutex_unlock(&amp;MSDOS_SB(sb)-&gt;s_lock);</div><div class='add'>+</div><div class='add'>+	return err;</div><div class='add'>+</div><div class='add'>+error_new_dotdot:</div><div class='add'>+	if (new_dotdot_de) {</div><div class='add'>+		corrupt |= vfat_update_dotdot_de(new_dir, new_inode,</div><div class='add'>+						 new_dotdot_bh, new_dotdot_de);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+error_old_dotdot:</div><div class='add'>+	if (old_dotdot_de) {</div><div class='add'>+		corrupt |= vfat_update_dotdot_de(old_dir, old_inode,</div><div class='add'>+						 old_dotdot_bh, old_dotdot_de);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+error_exchange:</div><div class='add'>+	vfat_exchange_ipos(old_inode, new_inode, new_i_pos, old_i_pos);</div><div class='add'>+	corrupt |= vfat_sync_ipos(new_dir, new_inode);</div><div class='add'>+	corrupt |= vfat_sync_ipos(old_dir, old_inode);</div><div class='add'>+</div><div class='add'>+	if (corrupt &lt; 0) {</div><div class='add'>+		fat_fs_error(new_dir-&gt;i_sb,</div><div class='add'>+			     "%s: Filesystem corrupted (i_pos %lld, %lld)",</div><div class='add'>+			     __func__, old_i_pos, new_i_pos);</div><div class='ctx'> 	}</div><div class='ctx'> 	goto out;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int vfat_rename2(struct mnt_idmap *idmap, struct inode *old_dir,</div><div class='add'>+			struct dentry *old_dentry, struct inode *new_dir,</div><div class='add'>+			struct dentry *new_dentry, unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	if (flags &amp; ~(RENAME_NOREPLACE | RENAME_EXCHANGE))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	if (flags &amp; RENAME_EXCHANGE) {</div><div class='add'>+		return vfat_rename_exchange(old_dir, old_dentry,</div><div class='add'>+					    new_dir, new_dentry);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* VFS already handled RENAME_NOREPLACE, handle it as a normal rename */</div><div class='add'>+	return vfat_rename(old_dir, old_dentry, new_dir, new_dentry);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static const struct inode_operations vfat_dir_inode_operations = {</div><div class='ctx'> 	.create		= vfat_create,</div><div class='ctx'> 	.lookup		= vfat_lookup,</div><div class='ctx'> 	.unlink		= vfat_unlink,</div><div class='ctx'> 	.mkdir		= vfat_mkdir,</div><div class='ctx'> 	.rmdir		= vfat_rmdir,</div><div class='del'>-	.rename		= vfat_rename,</div><div class='add'>+	.rename		= vfat_rename2,</div><div class='ctx'> 	.setattr	= fat_setattr,</div><div class='ctx'> 	.getattr	= fat_getattr,</div><div class='ctx'> 	.update_time	= fat_update_time,</div><div class='hunk'>@@ -1041,29 +1187,53 @@ static void setup(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	MSDOS_SB(sb)-&gt;dir_ops = &amp;vfat_dir_inode_operations;</div><div class='ctx'> 	if (MSDOS_SB(sb)-&gt;options.name_check != 's')</div><div class='del'>-		sb-&gt;s_d_op = &amp;vfat_ci_dentry_ops;</div><div class='add'>+		set_default_d_op(sb, &amp;vfat_ci_dentry_ops);</div><div class='ctx'> 	else</div><div class='del'>-		sb-&gt;s_d_op = &amp;vfat_dentry_ops;</div><div class='add'>+		set_default_d_op(sb, &amp;vfat_dentry_ops);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int vfat_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	return fat_fill_super(sb, fc, setup);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int vfat_get_tree(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	return get_tree_bdev(fc, vfat_fill_super);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int vfat_fill_super(struct super_block *sb, void *data, int silent)</div><div class='add'>+static int vfat_parse_param(struct fs_context *fc, struct fs_parameter *param)</div><div class='ctx'> {</div><div class='del'>-	return fat_fill_super(sb, data, silent, 1, setup);</div><div class='add'>+	return fat_parse_param(fc, param, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct dentry *vfat_mount(struct file_system_type *fs_type,</div><div class='del'>-		       int flags, const char *dev_name,</div><div class='del'>-		       void *data)</div><div class='add'>+static const struct fs_context_operations vfat_context_ops = {</div><div class='add'>+	.parse_param	= vfat_parse_param,</div><div class='add'>+	.get_tree	= vfat_get_tree,</div><div class='add'>+	.reconfigure	= fat_reconfigure,</div><div class='add'>+	.free		= fat_free_fc,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int vfat_init_fs_context(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	return mount_bdev(fs_type, flags, dev_name, data, vfat_fill_super);</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	/* Initialize with is_vfat == true */</div><div class='add'>+	err = fat_init_fs_context(fc, true);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	fc-&gt;ops = &amp;vfat_context_ops;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct file_system_type vfat_fs_type = {</div><div class='ctx'> 	.owner		= THIS_MODULE,</div><div class='ctx'> 	.name		= "vfat",</div><div class='del'>-	.mount		= vfat_mount,</div><div class='ctx'> 	.kill_sb	= kill_block_super,</div><div class='ctx'> 	.fs_flags	= FS_REQUIRES_DEV | FS_ALLOW_IDMAP,</div><div class='add'>+	.init_fs_context = vfat_init_fs_context,</div><div class='add'>+	.parameters     = fat_param_spec,</div><div class='ctx'> };</div><div class='ctx'> MODULE_ALIAS_FS("vfat");</div><div class='ctx'> </div><div class='head'>diff --git a/fs/fat/nfs.c b/fs/fat/nfs.c<br/>index af191371c352..509eea96a457 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fat/nfs.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fat/nfs.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fat/nfs.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fat/nfs.c</a></div><div class='hunk'>@@ -17,7 +17,7 @@ struct fat_fid {</div><div class='ctx'> #define FAT_FID_SIZE_WITHOUT_PARENT 3</div><div class='ctx'> #define FAT_FID_SIZE_WITH_PARENT (sizeof(struct fat_fid)/sizeof(u32))</div><div class='ctx'> </div><div class='del'>-/**</div><div class='add'>+/*</div><div class='ctx'>  * Look up a directory inode given its starting cluster.</div><div class='ctx'>  */</div><div class='ctx'> static struct inode *fat_dget(struct super_block *sb, int i_logstart)</div><div class='hunk'>@@ -130,12 +130,18 @@ fat_encode_fh_nostale(struct inode *inode, __u32 *fh, int *lenp,</div><div class='ctx'> 		fid-&gt;parent_i_gen = parent-&gt;i_generation;</div><div class='ctx'> 		type = FILEID_FAT_WITH_PARENT;</div><div class='ctx'> 		*lenp = FAT_FID_SIZE_WITH_PARENT;</div><div class='add'>+	} else {</div><div class='add'>+		/*</div><div class='add'>+		 * We need to initialize this field because the fh is actually</div><div class='add'>+		 * 12 bytes long</div><div class='add'>+		 */</div><div class='add'>+		fid-&gt;parent_i_pos_hi = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return type;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='add'>+/*</div><div class='ctx'>  * Map a NFS file handle to a corresponding dentry.</div><div class='ctx'>  * The dentry may or may not be connected to the filesystem root.</div><div class='ctx'>  */</div><div class='hunk'>@@ -279,6 +285,7 @@ static struct dentry *fat_get_parent(struct dentry *child_dir)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct export_operations fat_export_ops = {</div><div class='add'>+	.encode_fh	= generic_encode_ino32_fh,</div><div class='ctx'> 	.fh_to_dentry   = fat_fh_to_dentry,</div><div class='ctx'> 	.fh_to_parent   = fat_fh_to_parent,</div><div class='ctx'> 	.get_parent     = fat_get_parent,</div><div class='head'>diff --git a/fs/fcntl.c b/fs/fcntl.c<br/>index 9c6c6a3e2de5..f93dbca08435 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fcntl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fcntl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fcntl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fcntl.c</a></div><div class='hunk'>@@ -10,8 +10,8 @@</div><div class='ctx'> #include &lt;linux/mm.h&gt;</div><div class='ctx'> #include &lt;linux/sched/task.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/filelock.h&gt;</div><div class='ctx'> #include &lt;linux/file.h&gt;</div><div class='del'>-#include &lt;linux/fdtable.h&gt;</div><div class='ctx'> #include &lt;linux/capability.h&gt;</div><div class='ctx'> #include &lt;linux/dnotify.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='hunk'>@@ -26,14 +26,17 @@</div><div class='ctx'> #include &lt;linux/memfd.h&gt;</div><div class='ctx'> #include &lt;linux/compat.h&gt;</div><div class='ctx'> #include &lt;linux/mount.h&gt;</div><div class='add'>+#include &lt;linux/rw_hint.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/poll.h&gt;</div><div class='ctx'> #include &lt;asm/siginfo.h&gt;</div><div class='ctx'> #include &lt;linux/uaccess.h&gt;</div><div class='ctx'> </div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='ctx'> #define SETFL_MASK (O_APPEND | O_NONBLOCK | O_NDELAY | O_DIRECT | O_NOATIME)</div><div class='ctx'> </div><div class='del'>-static int setfl(int fd, struct file * filp, unsigned long arg)</div><div class='add'>+static int setfl(int fd, struct file * filp, unsigned int arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode * inode = file_inode(filp);</div><div class='ctx'> 	int error = 0;</div><div class='hunk'>@@ -47,7 +50,7 @@ static int setfl(int fd, struct file * filp, unsigned long arg)</div><div class='ctx'> </div><div class='ctx'> 	/* O_NOATIME can only be set by the owner or superuser */</div><div class='ctx'> 	if ((arg &amp; O_NOATIME) &amp;&amp; !(filp-&gt;f_flags &amp; O_NOATIME))</div><div class='del'>-		if (!inode_owner_or_capable(file_mnt_user_ns(filp), inode))</div><div class='add'>+		if (!inode_owner_or_capable(file_mnt_idmap(filp), inode))</div><div class='ctx'> 			return -EPERM;</div><div class='ctx'> </div><div class='ctx'> 	/* required for strict SunOS emulation */</div><div class='hunk'>@@ -56,11 +59,10 @@ static int setfl(int fd, struct file * filp, unsigned long arg)</div><div class='ctx'> 		   arg |= O_NONBLOCK;</div><div class='ctx'> </div><div class='ctx'> 	/* Pipe packetized mode is controlled by O_DIRECT flag */</div><div class='del'>-	if (!S_ISFIFO(inode-&gt;i_mode) &amp;&amp; (arg &amp; O_DIRECT)) {</div><div class='del'>-		if (!filp-&gt;f_mapping || !filp-&gt;f_mapping-&gt;a_ops ||</div><div class='del'>-			!filp-&gt;f_mapping-&gt;a_ops-&gt;direct_IO)</div><div class='del'>-				return -EINVAL;</div><div class='del'>-	}</div><div class='add'>+	if (!S_ISFIFO(inode-&gt;i_mode) &amp;&amp;</div><div class='add'>+	    (arg &amp; O_DIRECT) &amp;&amp;</div><div class='add'>+	    !(filp-&gt;f_mode &amp; FMODE_CAN_ODIRECT))</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	if (filp-&gt;f_op-&gt;check_flags)</div><div class='ctx'> 		error = filp-&gt;f_op-&gt;check_flags(arg);</div><div class='hunk'>@@ -79,43 +81,82 @@ static int setfl(int fd, struct file * filp, unsigned long arg)</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_lock(&amp;filp-&gt;f_lock);</div><div class='ctx'> 	filp-&gt;f_flags = (arg &amp; SETFL_MASK) | (filp-&gt;f_flags &amp; ~SETFL_MASK);</div><div class='add'>+	filp-&gt;f_iocb_flags = iocb_flags(filp);</div><div class='ctx'> 	spin_unlock(&amp;filp-&gt;f_lock);</div><div class='ctx'> </div><div class='ctx'>  out:</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void f_modown(struct file *filp, struct pid *pid, enum pid_type type,</div><div class='del'>-                     int force)</div><div class='add'>+/*</div><div class='add'>+ * Allocate an file-&gt;f_owner struct if it doesn't exist, handling racing</div><div class='add'>+ * allocations correctly.</div><div class='add'>+ */</div><div class='add'>+int file_f_owner_allocate(struct file *file)</div><div class='ctx'> {</div><div class='del'>-	write_lock_irq(&amp;filp-&gt;f_owner.lock);</div><div class='del'>-	if (force || !filp-&gt;f_owner.pid) {</div><div class='del'>-		put_pid(filp-&gt;f_owner.pid);</div><div class='del'>-		filp-&gt;f_owner.pid = get_pid(pid);</div><div class='del'>-		filp-&gt;f_owner.pid_type = type;</div><div class='add'>+	struct fown_struct *f_owner;</div><div class='ctx'> </div><div class='del'>-		if (pid) {</div><div class='del'>-			const struct cred *cred = current_cred();</div><div class='del'>-			filp-&gt;f_owner.uid = cred-&gt;uid;</div><div class='del'>-			filp-&gt;f_owner.euid = cred-&gt;euid;</div><div class='del'>-		}</div><div class='add'>+	f_owner = file_f_owner(file);</div><div class='add'>+	if (f_owner)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	f_owner = kzalloc(sizeof(struct fown_struct), GFP_KERNEL);</div><div class='add'>+	if (!f_owner)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	rwlock_init(&amp;f_owner-&gt;lock);</div><div class='add'>+	f_owner-&gt;file = file;</div><div class='add'>+	/* If someone else raced us, drop our allocation. */</div><div class='add'>+	if (unlikely(cmpxchg(&amp;file-&gt;f_owner, NULL, f_owner)))</div><div class='add'>+		kfree(f_owner);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(file_f_owner_allocate);</div><div class='add'>+</div><div class='add'>+void file_f_owner_release(struct file *file)</div><div class='add'>+{</div><div class='add'>+	struct fown_struct *f_owner;</div><div class='add'>+</div><div class='add'>+	f_owner = file_f_owner(file);</div><div class='add'>+	if (f_owner) {</div><div class='add'>+		put_pid(f_owner-&gt;pid);</div><div class='add'>+		kfree(f_owner);</div><div class='ctx'> 	}</div><div class='del'>-	write_unlock_irq(&amp;filp-&gt;f_owner.lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void __f_setown(struct file *filp, struct pid *pid, enum pid_type type,</div><div class='ctx'> 		int force)</div><div class='ctx'> {</div><div class='del'>-	security_file_set_fowner(filp);</div><div class='del'>-	f_modown(filp, pid, type, force);</div><div class='add'>+	struct fown_struct *f_owner;</div><div class='add'>+</div><div class='add'>+	f_owner = file_f_owner(filp);</div><div class='add'>+	if (WARN_ON_ONCE(!f_owner))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	write_lock_irq(&amp;f_owner-&gt;lock);</div><div class='add'>+	if (force || !f_owner-&gt;pid) {</div><div class='add'>+		put_pid(f_owner-&gt;pid);</div><div class='add'>+		f_owner-&gt;pid = get_pid(pid);</div><div class='add'>+		f_owner-&gt;pid_type = type;</div><div class='add'>+</div><div class='add'>+		if (pid) {</div><div class='add'>+			const struct cred *cred = current_cred();</div><div class='add'>+			security_file_set_fowner(filp);</div><div class='add'>+			f_owner-&gt;uid = cred-&gt;uid;</div><div class='add'>+			f_owner-&gt;euid = cred-&gt;euid;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	write_unlock_irq(&amp;f_owner-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(__f_setown);</div><div class='ctx'> </div><div class='del'>-int f_setown(struct file *filp, unsigned long arg, int force)</div><div class='add'>+int f_setown(struct file *filp, int who, int force)</div><div class='ctx'> {</div><div class='ctx'> 	enum pid_type type;</div><div class='ctx'> 	struct pid *pid = NULL;</div><div class='del'>-	int who = arg, ret = 0;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	might_sleep();</div><div class='ctx'> </div><div class='ctx'> 	type = PIDTYPE_TGID;</div><div class='ctx'> 	if (who &lt; 0) {</div><div class='hunk'>@@ -127,6 +168,10 @@ int f_setown(struct file *filp, unsigned long arg, int force)</div><div class='ctx'> 		who = -who;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	ret = file_f_owner_allocate(filp);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='ctx'> 	rcu_read_lock();</div><div class='ctx'> 	if (who) {</div><div class='ctx'> 		pid = find_vpid(who);</div><div class='hunk'>@@ -144,22 +189,27 @@ EXPORT_SYMBOL(f_setown);</div><div class='ctx'> </div><div class='ctx'> void f_delown(struct file *filp)</div><div class='ctx'> {</div><div class='del'>-	f_modown(filp, NULL, PIDTYPE_TGID, 1);</div><div class='add'>+	__f_setown(filp, NULL, PIDTYPE_TGID, 1);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> pid_t f_getown(struct file *filp)</div><div class='ctx'> {</div><div class='ctx'> 	pid_t pid = 0;</div><div class='add'>+	struct fown_struct *f_owner;</div><div class='ctx'> </div><div class='del'>-	read_lock_irq(&amp;filp-&gt;f_owner.lock);</div><div class='add'>+	f_owner = file_f_owner(filp);</div><div class='add'>+	if (!f_owner)</div><div class='add'>+		return pid;</div><div class='add'>+</div><div class='add'>+	read_lock_irq(&amp;f_owner-&gt;lock);</div><div class='ctx'> 	rcu_read_lock();</div><div class='del'>-	if (pid_task(filp-&gt;f_owner.pid, filp-&gt;f_owner.pid_type)) {</div><div class='del'>-		pid = pid_vnr(filp-&gt;f_owner.pid);</div><div class='del'>-		if (filp-&gt;f_owner.pid_type == PIDTYPE_PGID)</div><div class='add'>+	if (pid_task(f_owner-&gt;pid, f_owner-&gt;pid_type)) {</div><div class='add'>+		pid = pid_vnr(f_owner-&gt;pid);</div><div class='add'>+		if (f_owner-&gt;pid_type == PIDTYPE_PGID)</div><div class='ctx'> 			pid = -pid;</div><div class='ctx'> 	}</div><div class='ctx'> 	rcu_read_unlock();</div><div class='del'>-	read_unlock_irq(&amp;filp-&gt;f_owner.lock);</div><div class='add'>+	read_unlock_irq(&amp;f_owner-&gt;lock);</div><div class='ctx'> 	return pid;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -192,6 +242,10 @@ static int f_setown_ex(struct file *filp, unsigned long arg)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	ret = file_f_owner_allocate(filp);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='ctx'> 	rcu_read_lock();</div><div class='ctx'> 	pid = find_vpid(owner.pid);</div><div class='ctx'> 	if (owner.pid &amp;&amp; !pid)</div><div class='hunk'>@@ -208,13 +262,20 @@ static int f_getown_ex(struct file *filp, unsigned long arg)</div><div class='ctx'> 	struct f_owner_ex __user *owner_p = (void __user *)arg;</div><div class='ctx'> 	struct f_owner_ex owner = {};</div><div class='ctx'> 	int ret = 0;</div><div class='add'>+	struct fown_struct *f_owner;</div><div class='add'>+	enum pid_type pid_type = PIDTYPE_PID;</div><div class='ctx'> </div><div class='del'>-	read_lock_irq(&amp;filp-&gt;f_owner.lock);</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	if (pid_task(filp-&gt;f_owner.pid, filp-&gt;f_owner.pid_type))</div><div class='del'>-		owner.pid = pid_vnr(filp-&gt;f_owner.pid);</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-	switch (filp-&gt;f_owner.pid_type) {</div><div class='add'>+	f_owner = file_f_owner(filp);</div><div class='add'>+	if (f_owner) {</div><div class='add'>+		read_lock_irq(&amp;f_owner-&gt;lock);</div><div class='add'>+		rcu_read_lock();</div><div class='add'>+		if (pid_task(f_owner-&gt;pid, f_owner-&gt;pid_type))</div><div class='add'>+			owner.pid = pid_vnr(f_owner-&gt;pid);</div><div class='add'>+		rcu_read_unlock();</div><div class='add'>+		pid_type = f_owner-&gt;pid_type;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	switch (pid_type) {</div><div class='ctx'> 	case PIDTYPE_PID:</div><div class='ctx'> 		owner.type = F_OWNER_TID;</div><div class='ctx'> 		break;</div><div class='hunk'>@@ -232,7 +293,8 @@ static int f_getown_ex(struct file *filp, unsigned long arg)</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='del'>-	read_unlock_irq(&amp;filp-&gt;f_owner.lock);</div><div class='add'>+	if (f_owner)</div><div class='add'>+		read_unlock_irq(&amp;f_owner-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	if (!ret) {</div><div class='ctx'> 		ret = copy_to_user(owner_p, &amp;owner, sizeof(owner));</div><div class='hunk'>@@ -246,14 +308,18 @@ static int f_getown_ex(struct file *filp, unsigned long arg)</div><div class='ctx'> static int f_getowner_uids(struct file *filp, unsigned long arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct user_namespace *user_ns = current_user_ns();</div><div class='add'>+	struct fown_struct *f_owner;</div><div class='ctx'> 	uid_t __user *dst = (void __user *)arg;</div><div class='del'>-	uid_t src[2];</div><div class='add'>+	uid_t src[2] = {0, 0};</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	read_lock_irq(&amp;filp-&gt;f_owner.lock);</div><div class='del'>-	src[0] = from_kuid(user_ns, filp-&gt;f_owner.uid);</div><div class='del'>-	src[1] = from_kuid(user_ns, filp-&gt;f_owner.euid);</div><div class='del'>-	read_unlock_irq(&amp;filp-&gt;f_owner.lock);</div><div class='add'>+	f_owner = file_f_owner(filp);</div><div class='add'>+	if (f_owner) {</div><div class='add'>+		read_lock_irq(&amp;f_owner-&gt;lock);</div><div class='add'>+		src[0] = from_kuid(user_ns, f_owner-&gt;uid);</div><div class='add'>+		src[1] = from_kuid(user_ns, f_owner-&gt;euid);</div><div class='add'>+		read_unlock_irq(&amp;f_owner-&gt;lock);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	err  = put_user(src[0], &amp;dst[0]);</div><div class='ctx'> 	err |= put_user(src[1], &amp;dst[1]);</div><div class='hunk'>@@ -267,8 +333,15 @@ static int f_getowner_uids(struct file *filp, unsigned long arg)</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-static bool rw_hint_valid(enum rw_hint hint)</div><div class='add'>+static bool rw_hint_valid(u64 hint)</div><div class='ctx'> {</div><div class='add'>+	BUILD_BUG_ON(WRITE_LIFE_NOT_SET != RWH_WRITE_LIFE_NOT_SET);</div><div class='add'>+	BUILD_BUG_ON(WRITE_LIFE_NONE != RWH_WRITE_LIFE_NONE);</div><div class='add'>+	BUILD_BUG_ON(WRITE_LIFE_SHORT != RWH_WRITE_LIFE_SHORT);</div><div class='add'>+	BUILD_BUG_ON(WRITE_LIFE_MEDIUM != RWH_WRITE_LIFE_MEDIUM);</div><div class='add'>+	BUILD_BUG_ON(WRITE_LIFE_LONG != RWH_WRITE_LIFE_LONG);</div><div class='add'>+	BUILD_BUG_ON(WRITE_LIFE_EXTREME != RWH_WRITE_LIFE_EXTREME);</div><div class='add'>+</div><div class='ctx'> 	switch (hint) {</div><div class='ctx'> 	case RWH_WRITE_LIFE_NOT_SET:</div><div class='ctx'> 	case RWH_WRITE_LIFE_NONE:</div><div class='hunk'>@@ -282,78 +355,126 @@ static bool rw_hint_valid(enum rw_hint hint)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static long fcntl_rw_hint(struct file *file, unsigned int cmd,</div><div class='del'>-			  unsigned long arg)</div><div class='add'>+static long fcntl_get_rw_hint(struct file *file, unsigned long arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='ctx'> 	u64 __user *argp = (u64 __user *)arg;</div><div class='del'>-	enum rw_hint hint;</div><div class='del'>-	u64 h;</div><div class='add'>+	u64 hint = READ_ONCE(inode-&gt;i_write_hint);</div><div class='ctx'> </div><div class='del'>-	switch (cmd) {</div><div class='del'>-	case F_GET_FILE_RW_HINT:</div><div class='del'>-		h = file_write_hint(file);</div><div class='del'>-		if (copy_to_user(argp, &amp;h, sizeof(*argp)))</div><div class='del'>-			return -EFAULT;</div><div class='del'>-		return 0;</div><div class='del'>-	case F_SET_FILE_RW_HINT:</div><div class='del'>-		if (copy_from_user(&amp;h, argp, sizeof(h)))</div><div class='del'>-			return -EFAULT;</div><div class='del'>-		hint = (enum rw_hint) h;</div><div class='del'>-		if (!rw_hint_valid(hint))</div><div class='del'>-			return -EINVAL;</div><div class='add'>+	if (copy_to_user(argp, &amp;hint, sizeof(*argp)))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		spin_lock(&amp;file-&gt;f_lock);</div><div class='del'>-		file-&gt;f_write_hint = hint;</div><div class='del'>-		spin_unlock(&amp;file-&gt;f_lock);</div><div class='del'>-		return 0;</div><div class='del'>-	case F_GET_RW_HINT:</div><div class='del'>-		h = inode-&gt;i_write_hint;</div><div class='del'>-		if (copy_to_user(argp, &amp;h, sizeof(*argp)))</div><div class='del'>-			return -EFAULT;</div><div class='del'>-		return 0;</div><div class='del'>-	case F_SET_RW_HINT:</div><div class='del'>-		if (copy_from_user(&amp;h, argp, sizeof(h)))</div><div class='del'>-			return -EFAULT;</div><div class='del'>-		hint = (enum rw_hint) h;</div><div class='del'>-		if (!rw_hint_valid(hint))</div><div class='del'>-			return -EINVAL;</div><div class='add'>+static long fcntl_set_rw_hint(struct file *file, unsigned long arg)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='add'>+	u64 __user *argp = (u64 __user *)arg;</div><div class='add'>+	u64 hint;</div><div class='ctx'> </div><div class='del'>-		inode_lock(inode);</div><div class='del'>-		inode-&gt;i_write_hint = hint;</div><div class='del'>-		inode_unlock(inode);</div><div class='del'>-		return 0;</div><div class='del'>-	default:</div><div class='add'>+	if (!inode_owner_or_capable(file_mnt_idmap(file), inode))</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	if (copy_from_user(&amp;hint, argp, sizeof(hint)))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+	if (!rw_hint_valid(hint))</div><div class='ctx'> 		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	WRITE_ONCE(inode-&gt;i_write_hint, hint);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * file-&gt;f_mapping-&gt;host may differ from inode. As an example,</div><div class='add'>+	 * blkdev_open() modifies file-&gt;f_mapping.</div><div class='add'>+	 */</div><div class='add'>+	if (file-&gt;f_mapping-&gt;host != inode)</div><div class='add'>+		WRITE_ONCE(file-&gt;f_mapping-&gt;host-&gt;i_write_hint, hint);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Is the file descriptor a dup of the file? */</div><div class='add'>+static long f_dupfd_query(int fd, struct file *filp)</div><div class='add'>+{</div><div class='add'>+	CLASS(fd_raw, f)(fd);</div><div class='add'>+</div><div class='add'>+	if (fd_empty(f))</div><div class='add'>+		return -EBADF;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We can do the 'fdput()' immediately, as the only thing that</div><div class='add'>+	 * matters is the pointer value which isn't changed by the fdput.</div><div class='add'>+	 *</div><div class='add'>+	 * Technically we didn't need a ref at all, and 'fdget()' was</div><div class='add'>+	 * overkill, but given our lockless file pointer lookup, the</div><div class='add'>+	 * alternatives are complicated.</div><div class='add'>+	 */</div><div class='add'>+	return fd_file(f) == filp;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Let the caller figure out whether a given file was just created. */</div><div class='add'>+static long f_created_query(const struct file *filp)</div><div class='add'>+{</div><div class='add'>+	return !!(filp-&gt;f_mode &amp; FMODE_CREATED);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int f_owner_sig(struct file *filp, int signum, bool setsig)</div><div class='add'>+{</div><div class='add'>+	int ret = 0;</div><div class='add'>+	struct fown_struct *f_owner;</div><div class='add'>+</div><div class='add'>+	might_sleep();</div><div class='add'>+</div><div class='add'>+	if (setsig) {</div><div class='add'>+		if (!valid_signal(signum))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+</div><div class='add'>+		ret = file_f_owner_allocate(filp);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	f_owner = file_f_owner(filp);</div><div class='add'>+	if (setsig)</div><div class='add'>+		f_owner-&gt;signum = signum;</div><div class='add'>+	else if (f_owner)</div><div class='add'>+		ret = f_owner-&gt;signum;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static long do_fcntl(int fd, unsigned int cmd, unsigned long arg,</div><div class='ctx'> 		struct file *filp)</div><div class='ctx'> {</div><div class='ctx'> 	void __user *argp = (void __user *)arg;</div><div class='add'>+	struct delegation deleg;</div><div class='add'>+	int argi = (int)arg;</div><div class='ctx'> 	struct flock flock;</div><div class='ctx'> 	long err = -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	switch (cmd) {</div><div class='add'>+	case F_CREATED_QUERY:</div><div class='add'>+		err = f_created_query(filp);</div><div class='add'>+		break;</div><div class='ctx'> 	case F_DUPFD:</div><div class='del'>-		err = f_dupfd(arg, filp, 0);</div><div class='add'>+		err = f_dupfd(argi, filp, 0);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case F_DUPFD_CLOEXEC:</div><div class='del'>-		err = f_dupfd(arg, filp, O_CLOEXEC);</div><div class='add'>+		err = f_dupfd(argi, filp, O_CLOEXEC);</div><div class='add'>+		break;</div><div class='add'>+	case F_DUPFD_QUERY:</div><div class='add'>+		err = f_dupfd_query(argi, filp);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case F_GETFD:</div><div class='ctx'> 		err = get_close_on_exec(fd) ? FD_CLOEXEC : 0;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case F_SETFD:</div><div class='ctx'> 		err = 0;</div><div class='del'>-		set_close_on_exec(fd, arg &amp; FD_CLOEXEC);</div><div class='add'>+		set_close_on_exec(fd, argi &amp; FD_CLOEXEC);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case F_GETFL:</div><div class='ctx'> 		err = filp-&gt;f_flags;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case F_SETFL:</div><div class='del'>-		err = setfl(fd, filp, arg);</div><div class='add'>+		err = setfl(fd, filp, argi);</div><div class='ctx'> 		break;</div><div class='ctx'> #if BITS_PER_LONG != 32</div><div class='ctx'> 	/* 32-bit arches must use fcntl64() */</div><div class='hunk'>@@ -390,7 +511,7 @@ static long do_fcntl(int fd, unsigned int cmd, unsigned long arg,</div><div class='ctx'> 		force_successful_syscall_return();</div><div class='ctx'> 		break;</div><div class='ctx'> 	case F_SETOWN:</div><div class='del'>-		err = f_setown(filp, arg, 1);</div><div class='add'>+		err = f_setown(filp, argi, 1);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case F_GETOWN_EX:</div><div class='ctx'> 		err = f_getown_ex(filp, arg);</div><div class='hunk'>@@ -402,38 +523,45 @@ static long do_fcntl(int fd, unsigned int cmd, unsigned long arg,</div><div class='ctx'> 		err = f_getowner_uids(filp, arg);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case F_GETSIG:</div><div class='del'>-		err = filp-&gt;f_owner.signum;</div><div class='add'>+		err = f_owner_sig(filp, 0, false);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case F_SETSIG:</div><div class='del'>-		/* arg == 0 restores default behaviour. */</div><div class='del'>-		if (!valid_signal(arg)) {</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		err = 0;</div><div class='del'>-		filp-&gt;f_owner.signum = arg;</div><div class='add'>+		err = f_owner_sig(filp, argi, true);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case F_GETLEASE:</div><div class='ctx'> 		err = fcntl_getlease(filp);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case F_SETLEASE:</div><div class='del'>-		err = fcntl_setlease(fd, filp, arg);</div><div class='add'>+		err = fcntl_setlease(fd, filp, argi);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case F_NOTIFY:</div><div class='del'>-		err = fcntl_dirnotify(fd, filp, arg);</div><div class='add'>+		err = fcntl_dirnotify(fd, filp, argi);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case F_SETPIPE_SZ:</div><div class='ctx'> 	case F_GETPIPE_SZ:</div><div class='del'>-		err = pipe_fcntl(filp, cmd, arg);</div><div class='add'>+		err = pipe_fcntl(filp, cmd, argi);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case F_ADD_SEALS:</div><div class='ctx'> 	case F_GET_SEALS:</div><div class='del'>-		err = memfd_fcntl(filp, cmd, arg);</div><div class='add'>+		err = memfd_fcntl(filp, cmd, argi);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case F_GET_RW_HINT:</div><div class='add'>+		err = fcntl_get_rw_hint(filp, arg);</div><div class='add'>+		break;</div><div class='ctx'> 	case F_SET_RW_HINT:</div><div class='del'>-	case F_GET_FILE_RW_HINT:</div><div class='del'>-	case F_SET_FILE_RW_HINT:</div><div class='del'>-		err = fcntl_rw_hint(filp, cmd, arg);</div><div class='add'>+		err = fcntl_set_rw_hint(filp, arg);</div><div class='add'>+		break;</div><div class='add'>+	case F_GETDELEG:</div><div class='add'>+		if (copy_from_user(&amp;deleg, argp, sizeof(deleg)))</div><div class='add'>+			return -EFAULT;</div><div class='add'>+		err = fcntl_getdeleg(filp, &amp;deleg);</div><div class='add'>+		if (!err &amp;&amp; copy_to_user(argp, &amp;deleg, sizeof(deleg)))</div><div class='add'>+			return -EFAULT;</div><div class='add'>+		break;</div><div class='add'>+	case F_SETDELEG:</div><div class='add'>+		if (copy_from_user(&amp;deleg, argp, sizeof(deleg)))</div><div class='add'>+			return -EFAULT;</div><div class='add'>+		err = fcntl_setdeleg(fd, filp, &amp;deleg);</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		break;</div><div class='hunk'>@@ -444,8 +572,10 @@ static long do_fcntl(int fd, unsigned int cmd, unsigned long arg,</div><div class='ctx'> static int check_fcntl_cmd(unsigned cmd)</div><div class='ctx'> {</div><div class='ctx'> 	switch (cmd) {</div><div class='add'>+	case F_CREATED_QUERY:</div><div class='ctx'> 	case F_DUPFD:</div><div class='ctx'> 	case F_DUPFD_CLOEXEC:</div><div class='add'>+	case F_DUPFD_QUERY:</div><div class='ctx'> 	case F_GETFD:</div><div class='ctx'> 	case F_SETFD:</div><div class='ctx'> 	case F_GETFL:</div><div class='hunk'>@@ -456,24 +586,21 @@ static int check_fcntl_cmd(unsigned cmd)</div><div class='ctx'> </div><div class='ctx'> SYSCALL_DEFINE3(fcntl, unsigned int, fd, unsigned int, cmd, unsigned long, arg)</div><div class='ctx'> {	</div><div class='del'>-	struct fd f = fdget_raw(fd);</div><div class='del'>-	long err = -EBADF;</div><div class='add'>+	CLASS(fd_raw, f)(fd);</div><div class='add'>+	long err;</div><div class='ctx'> </div><div class='del'>-	if (!f.file)</div><div class='del'>-		goto out;</div><div class='add'>+	if (fd_empty(f))</div><div class='add'>+		return -EBADF;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(f.file-&gt;f_mode &amp; FMODE_PATH)) {</div><div class='add'>+	if (unlikely(fd_file(f)-&gt;f_mode &amp; FMODE_PATH)) {</div><div class='ctx'> 		if (!check_fcntl_cmd(cmd))</div><div class='del'>-			goto out1;</div><div class='add'>+			return -EBADF;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = security_file_fcntl(f.file, cmd, arg);</div><div class='add'>+	err = security_file_fcntl(fd_file(f), cmd, arg);</div><div class='ctx'> 	if (!err)</div><div class='del'>-		err = do_fcntl(fd, cmd, arg, f.file);</div><div class='add'>+		err = do_fcntl(fd, cmd, arg, fd_file(f));</div><div class='ctx'> </div><div class='del'>-out1:</div><div class='del'>- 	fdput(f);</div><div class='del'>-out:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -482,21 +609,21 @@ SYSCALL_DEFINE3(fcntl64, unsigned int, fd, unsigned int, cmd,</div><div class='ctx'> 		unsigned long, arg)</div><div class='ctx'> {	</div><div class='ctx'> 	void __user *argp = (void __user *)arg;</div><div class='del'>-	struct fd f = fdget_raw(fd);</div><div class='add'>+	CLASS(fd_raw, f)(fd);</div><div class='ctx'> 	struct flock64 flock;</div><div class='del'>-	long err = -EBADF;</div><div class='add'>+	long err;</div><div class='ctx'> </div><div class='del'>-	if (!f.file)</div><div class='del'>-		goto out;</div><div class='add'>+	if (fd_empty(f))</div><div class='add'>+		return -EBADF;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(f.file-&gt;f_mode &amp; FMODE_PATH)) {</div><div class='add'>+	if (unlikely(fd_file(f)-&gt;f_mode &amp; FMODE_PATH)) {</div><div class='ctx'> 		if (!check_fcntl_cmd(cmd))</div><div class='del'>-			goto out1;</div><div class='add'>+			return -EBADF;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = security_file_fcntl(f.file, cmd, arg);</div><div class='add'>+	err = security_file_fcntl(fd_file(f), cmd, arg);</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto out1;</div><div class='add'>+		return err;</div><div class='ctx'> 	</div><div class='ctx'> 	switch (cmd) {</div><div class='ctx'> 	case F_GETLK64:</div><div class='hunk'>@@ -504,7 +631,7 @@ SYSCALL_DEFINE3(fcntl64, unsigned int, fd, unsigned int, cmd,</div><div class='ctx'> 		err = -EFAULT;</div><div class='ctx'> 		if (copy_from_user(&amp;flock, argp, sizeof(flock)))</div><div class='ctx'> 			break;</div><div class='del'>-		err = fcntl_getlk64(f.file, cmd, &amp;flock);</div><div class='add'>+		err = fcntl_getlk64(fd_file(f), cmd, &amp;flock);</div><div class='ctx'> 		if (!err &amp;&amp; copy_to_user(argp, &amp;flock, sizeof(flock)))</div><div class='ctx'> 			err = -EFAULT;</div><div class='ctx'> 		break;</div><div class='hunk'>@@ -515,15 +642,12 @@ SYSCALL_DEFINE3(fcntl64, unsigned int, fd, unsigned int, cmd,</div><div class='ctx'> 		err = -EFAULT;</div><div class='ctx'> 		if (copy_from_user(&amp;flock, argp, sizeof(flock)))</div><div class='ctx'> 			break;</div><div class='del'>-		err = fcntl_setlk64(fd, f.file, cmd, &amp;flock);</div><div class='add'>+		err = fcntl_setlk64(fd, fd_file(f), cmd, &amp;flock);</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='del'>-		err = do_fcntl(fd, cmd, arg, f.file);</div><div class='add'>+		err = do_fcntl(fd, cmd, arg, fd_file(f));</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='del'>-out1:</div><div class='del'>-	fdput(f);</div><div class='del'>-out:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='hunk'>@@ -619,28 +743,28 @@ static int fixup_compat_flock(struct flock *flock)</div><div class='ctx'> static long do_compat_fcntl64(unsigned int fd, unsigned int cmd,</div><div class='ctx'> 			     compat_ulong_t arg)</div><div class='ctx'> {</div><div class='del'>-	struct fd f = fdget_raw(fd);</div><div class='add'>+	CLASS(fd_raw, f)(fd);</div><div class='ctx'> 	struct flock flock;</div><div class='del'>-	long err = -EBADF;</div><div class='add'>+	long err;</div><div class='ctx'> </div><div class='del'>-	if (!f.file)</div><div class='del'>-		return err;</div><div class='add'>+	if (fd_empty(f))</div><div class='add'>+		return -EBADF;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(f.file-&gt;f_mode &amp; FMODE_PATH)) {</div><div class='add'>+	if (unlikely(fd_file(f)-&gt;f_mode &amp; FMODE_PATH)) {</div><div class='ctx'> 		if (!check_fcntl_cmd(cmd))</div><div class='del'>-			goto out_put;</div><div class='add'>+			return -EBADF;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = security_file_fcntl(f.file, cmd, arg);</div><div class='add'>+	err = security_file_fcntl(fd_file(f), cmd, arg);</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto out_put;</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='ctx'> 	switch (cmd) {</div><div class='ctx'> 	case F_GETLK:</div><div class='ctx'> 		err = get_compat_flock(&amp;flock, compat_ptr(arg));</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			break;</div><div class='del'>-		err = fcntl_getlk(f.file, convert_fcntl_cmd(cmd), &amp;flock);</div><div class='add'>+		err = fcntl_getlk(fd_file(f), convert_fcntl_cmd(cmd), &amp;flock);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			break;</div><div class='ctx'> 		err = fixup_compat_flock(&amp;flock);</div><div class='hunk'>@@ -652,7 +776,7 @@ static long do_compat_fcntl64(unsigned int fd, unsigned int cmd,</div><div class='ctx'> 		err = get_compat_flock64(&amp;flock, compat_ptr(arg));</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			break;</div><div class='del'>-		err = fcntl_getlk(f.file, convert_fcntl_cmd(cmd), &amp;flock);</div><div class='add'>+		err = fcntl_getlk(fd_file(f), convert_fcntl_cmd(cmd), &amp;flock);</div><div class='ctx'> 		if (!err)</div><div class='ctx'> 			err = put_compat_flock64(&amp;flock, compat_ptr(arg));</div><div class='ctx'> 		break;</div><div class='hunk'>@@ -661,7 +785,7 @@ static long do_compat_fcntl64(unsigned int fd, unsigned int cmd,</div><div class='ctx'> 		err = get_compat_flock(&amp;flock, compat_ptr(arg));</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			break;</div><div class='del'>-		err = fcntl_setlk(fd, f.file, convert_fcntl_cmd(cmd), &amp;flock);</div><div class='add'>+		err = fcntl_setlk(fd, fd_file(f), convert_fcntl_cmd(cmd), &amp;flock);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case F_SETLK64:</div><div class='ctx'> 	case F_SETLKW64:</div><div class='hunk'>@@ -670,14 +794,12 @@ static long do_compat_fcntl64(unsigned int fd, unsigned int cmd,</div><div class='ctx'> 		err = get_compat_flock64(&amp;flock, compat_ptr(arg));</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			break;</div><div class='del'>-		err = fcntl_setlk(fd, f.file, convert_fcntl_cmd(cmd), &amp;flock);</div><div class='add'>+		err = fcntl_setlk(fd, fd_file(f), convert_fcntl_cmd(cmd), &amp;flock);</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='del'>-		err = do_fcntl(fd, cmd, arg, f.file);</div><div class='add'>+		err = do_fcntl(fd, cmd, arg, fd_file(f));</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='del'>-out_put:</div><div class='del'>-	fdput(f);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -824,14 +946,19 @@ static void send_sigurg_to_task(struct task_struct *p,</div><div class='ctx'> 		do_send_sig_info(SIGURG, SEND_SIG_PRIV, p, type);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int send_sigurg(struct fown_struct *fown)</div><div class='add'>+int send_sigurg(struct file *file)</div><div class='ctx'> {</div><div class='add'>+	struct fown_struct *fown;</div><div class='ctx'> 	struct task_struct *p;</div><div class='ctx'> 	enum pid_type type;</div><div class='ctx'> 	struct pid *pid;</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	</div><div class='add'>+	fown = file_f_owner(file);</div><div class='add'>+	if (!fown)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='ctx'> 	read_lock_irqsave(&amp;fown-&gt;lock, flags);</div><div class='ctx'> </div><div class='ctx'> 	type = fown-&gt;pid_type;</div><div class='hunk'>@@ -860,13 +987,7 @@ int send_sigurg(struct fown_struct *fown)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static DEFINE_SPINLOCK(fasync_lock);</div><div class='del'>-static struct kmem_cache *fasync_cache __read_mostly;</div><div class='del'>-</div><div class='del'>-static void fasync_free_rcu(struct rcu_head *head)</div><div class='del'>-{</div><div class='del'>-	kmem_cache_free(fasync_cache,</div><div class='del'>-			container_of(head, struct fasync_struct, fa_rcu));</div><div class='del'>-}</div><div class='add'>+static struct kmem_cache *fasync_cache __ro_after_init;</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Remove a fasync entry. If successfully removed, return</div><div class='hunk'>@@ -893,7 +1014,7 @@ int fasync_remove_entry(struct file *filp, struct fasync_struct **fapp)</div><div class='ctx'> 		write_unlock_irq(&amp;fa-&gt;fa_lock);</div><div class='ctx'> </div><div class='ctx'> 		*fp = fa-&gt;fa_next;</div><div class='del'>-		call_rcu(&amp;fa-&gt;fa_rcu, fasync_free_rcu);</div><div class='add'>+		kfree_rcu(fa, fa_rcu);</div><div class='ctx'> 		filp-&gt;f_flags &amp;= ~FASYNC;</div><div class='ctx'> 		result = 1;</div><div class='ctx'> 		break;</div><div class='hunk'>@@ -1013,13 +1134,16 @@ static void kill_fasync_rcu(struct fasync_struct *fa, int sig, int band)</div><div class='ctx'> 		}</div><div class='ctx'> 		read_lock_irqsave(&amp;fa-&gt;fa_lock, flags);</div><div class='ctx'> 		if (fa-&gt;fa_file) {</div><div class='del'>-			fown = &amp;fa-&gt;fa_file-&gt;f_owner;</div><div class='add'>+			fown = file_f_owner(fa-&gt;fa_file);</div><div class='add'>+			if (!fown)</div><div class='add'>+				goto next;</div><div class='ctx'> 			/* Don't send SIGURG to processes which have not set a</div><div class='ctx'> 			   queued signum: SIGURG has its own default signalling</div><div class='ctx'> 			   mechanism. */</div><div class='ctx'> 			if (!(sig == SIGURG &amp;&amp; fown-&gt;signum == 0))</div><div class='ctx'> 				send_sigio(fown, fa-&gt;fa_fd, band);</div><div class='ctx'> 		}</div><div class='add'>+next:</div><div class='ctx'> 		read_unlock_irqrestore(&amp;fa-&gt;fa_lock, flags);</div><div class='ctx'> 		fa = rcu_dereference(fa-&gt;fa_next);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1045,10 +1169,10 @@ static int __init fcntl_init(void)</div><div class='ctx'> 	 * Exceptions: O_NONBLOCK is a two bit define on parisc; O_NDELAY</div><div class='ctx'> 	 * is defined as O_NONBLOCK on some platforms and not on others.</div><div class='ctx'> 	 */</div><div class='del'>-	BUILD_BUG_ON(21 - 1 /* for O_RDONLY being 0 */ !=</div><div class='add'>+	BUILD_BUG_ON(20 - 1 /* for O_RDONLY being 0 */ !=</div><div class='ctx'> 		HWEIGHT32(</div><div class='ctx'> 			(VALID_OPEN_FLAGS &amp; ~(O_NONBLOCK | O_NDELAY)) |</div><div class='del'>-			__FMODE_EXEC | __FMODE_NONOTIFY));</div><div class='add'>+			__FMODE_EXEC));</div><div class='ctx'> </div><div class='ctx'> 	fasync_cache = kmem_cache_create("fasync_cache",</div><div class='ctx'> 					 sizeof(struct fasync_struct), 0,</div><div class='head'>diff --git a/fs/fhandle.c b/fs/fhandle.c<br/>index 6630c69c23a2..3de1547ec9d4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fhandle.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fhandle.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fhandle.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fhandle.c</a></div><div class='hunk'>@@ -11,12 +11,14 @@</div><div class='ctx'> #include &lt;linux/personality.h&gt;</div><div class='ctx'> #include &lt;linux/uaccess.h&gt;</div><div class='ctx'> #include &lt;linux/compat.h&gt;</div><div class='add'>+#include &lt;linux/nsfs.h&gt;</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> #include "mount.h"</div><div class='ctx'> </div><div class='del'>-static long do_sys_name_to_handle(struct path *path,</div><div class='add'>+static long do_sys_name_to_handle(const struct path *path,</div><div class='ctx'> 				  struct file_handle __user *ufh,</div><div class='del'>-				  int __user *mnt_id)</div><div class='add'>+				  void __user *mnt_id, bool unique_mntid,</div><div class='add'>+				  int fh_flags)</div><div class='ctx'> {</div><div class='ctx'> 	long retval;</div><div class='ctx'> 	struct file_handle f_handle;</div><div class='hunk'>@@ -24,20 +26,27 @@ static long do_sys_name_to_handle(struct path *path,</div><div class='ctx'> 	struct file_handle *handle = NULL;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * We need to make sure whether the file system</div><div class='del'>-	 * support decoding of the file handle</div><div class='add'>+	 * We need to make sure whether the file system support decoding of</div><div class='add'>+	 * the file handle if decodeable file handle was requested.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!path-&gt;dentry-&gt;d_sb-&gt;s_export_op ||</div><div class='del'>-	    !path-&gt;dentry-&gt;d_sb-&gt;s_export_op-&gt;fh_to_dentry)</div><div class='add'>+	if (!exportfs_can_encode_fh(path-&gt;dentry-&gt;d_sb-&gt;s_export_op, fh_flags))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * A request to encode a connectable handle for a disconnected dentry</div><div class='add'>+	 * is unexpected since AT_EMPTY_PATH is not allowed.</div><div class='add'>+	 */</div><div class='add'>+	if (fh_flags &amp; EXPORT_FH_CONNECTABLE &amp;&amp;</div><div class='add'>+	    WARN_ON(path-&gt;dentry-&gt;d_flags &amp; DCACHE_DISCONNECTED))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='ctx'> 	if (copy_from_user(&amp;f_handle, ufh, sizeof(struct file_handle)))</div><div class='ctx'> 		return -EFAULT;</div><div class='ctx'> </div><div class='ctx'> 	if (f_handle.handle_bytes &gt; MAX_HANDLE_SZ)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	handle = kmalloc(sizeof(struct file_handle) + f_handle.handle_bytes,</div><div class='add'>+	handle = kzalloc(struct_size(handle, f_handle, f_handle.handle_bytes),</div><div class='ctx'> 			 GFP_KERNEL);</div><div class='ctx'> 	if (!handle)</div><div class='ctx'> 		return -ENOMEM;</div><div class='hunk'>@@ -45,33 +54,59 @@ static long do_sys_name_to_handle(struct path *path,</div><div class='ctx'> 	/* convert handle size to multiple of sizeof(u32) */</div><div class='ctx'> 	handle_dwords = f_handle.handle_bytes &gt;&gt; 2;</div><div class='ctx'> </div><div class='del'>-	/* we ask for a non connected handle */</div><div class='add'>+	/* Encode a possibly decodeable/connectable file handle */</div><div class='ctx'> 	retval = exportfs_encode_fh(path-&gt;dentry,</div><div class='ctx'> 				    (struct fid *)handle-&gt;f_handle,</div><div class='del'>-				    &amp;handle_dwords,  0);</div><div class='add'>+				    &amp;handle_dwords, fh_flags);</div><div class='ctx'> 	handle-&gt;handle_type = retval;</div><div class='ctx'> 	/* convert handle size to bytes */</div><div class='ctx'> 	handle_bytes = handle_dwords * sizeof(u32);</div><div class='ctx'> 	handle-&gt;handle_bytes = handle_bytes;</div><div class='ctx'> 	if ((handle-&gt;handle_bytes &gt; f_handle.handle_bytes) ||</div><div class='del'>-	    (retval == FILEID_INVALID) || (retval == -ENOSPC)) {</div><div class='add'>+	    (retval == FILEID_INVALID) || (retval &lt; 0)) {</div><div class='ctx'> 		/* As per old exportfs_encode_fh documentation</div><div class='ctx'> 		 * we could return ENOSPC to indicate overflow</div><div class='ctx'> 		 * But file system returned 255 always. So handle</div><div class='ctx'> 		 * both the values</div><div class='ctx'> 		 */</div><div class='add'>+		if (retval == FILEID_INVALID || retval == -ENOSPC)</div><div class='add'>+			retval = -EOVERFLOW;</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * set the handle size to zero so we copy only</div><div class='ctx'> 		 * non variable part of the file_handle</div><div class='ctx'> 		 */</div><div class='ctx'> 		handle_bytes = 0;</div><div class='del'>-		retval = -EOVERFLOW;</div><div class='del'>-	} else</div><div class='add'>+	} else {</div><div class='add'>+		/*</div><div class='add'>+		 * When asked to encode a connectable file handle, encode this</div><div class='add'>+		 * property in the file handle itself, so that we later know</div><div class='add'>+		 * how to decode it.</div><div class='add'>+		 * For sanity, also encode in the file handle if the encoded</div><div class='add'>+		 * object is a directory and verify this during decode, because</div><div class='add'>+		 * decoding directory file handles is quite different than</div><div class='add'>+		 * decoding connectable non-directory file handles.</div><div class='add'>+		 */</div><div class='add'>+		if (fh_flags &amp; EXPORT_FH_CONNECTABLE) {</div><div class='add'>+			handle-&gt;handle_type |= FILEID_IS_CONNECTABLE;</div><div class='add'>+			if (d_is_dir(path-&gt;dentry))</div><div class='add'>+				handle-&gt;handle_type |= FILEID_IS_DIR;</div><div class='add'>+		}</div><div class='ctx'> 		retval = 0;</div><div class='add'>+	}</div><div class='ctx'> 	/* copy the mount id */</div><div class='del'>-	if (put_user(real_mount(path-&gt;mnt)-&gt;mnt_id, mnt_id) ||</div><div class='del'>-	    copy_to_user(ufh, handle,</div><div class='del'>-			 sizeof(struct file_handle) + handle_bytes))</div><div class='add'>+	if (unique_mntid) {</div><div class='add'>+		if (put_user(real_mount(path-&gt;mnt)-&gt;mnt_id_unique,</div><div class='add'>+			     (u64 __user *) mnt_id))</div><div class='add'>+			retval = -EFAULT;</div><div class='add'>+	} else {</div><div class='add'>+		if (put_user(real_mount(path-&gt;mnt)-&gt;mnt_id,</div><div class='add'>+			     (int __user *) mnt_id))</div><div class='add'>+			retval = -EFAULT;</div><div class='add'>+	}</div><div class='add'>+	/* copy the handle */</div><div class='add'>+	if (retval != -EFAULT &amp;&amp;</div><div class='add'>+		copy_to_user(ufh, handle,</div><div class='add'>+			     struct_size(handle, f_handle, handle_bytes)))</div><div class='ctx'> 		retval = -EFAULT;</div><div class='ctx'> 	kfree(handle);</div><div class='ctx'> 	return retval;</div><div class='hunk'>@@ -83,7 +118,9 @@ static long do_sys_name_to_handle(struct path *path,</div><div class='ctx'>  * @name: name that should be converted to handle.</div><div class='ctx'>  * @handle: resulting file handle</div><div class='ctx'>  * @mnt_id: mount id of the file system containing the file</div><div class='add'>+ *          (u64 if AT_HANDLE_MNT_ID_UNIQUE, otherwise int)</div><div class='ctx'>  * @flag: flag value to indicate whether to follow symlink or not</div><div class='add'>+ *        and whether a decodable file handle is required.</div><div class='ctx'>  *</div><div class='ctx'>  * @handle-&gt;handle_size indicate the space available to store the</div><div class='ctx'>  * variable part of the file handle in bytes. If there is not</div><div class='hunk'>@@ -91,109 +128,252 @@ static long do_sys_name_to_handle(struct path *path,</div><div class='ctx'>  * value required.</div><div class='ctx'>  */</div><div class='ctx'> SYSCALL_DEFINE5(name_to_handle_at, int, dfd, const char __user *, name,</div><div class='del'>-		struct file_handle __user *, handle, int __user *, mnt_id,</div><div class='add'>+		struct file_handle __user *, handle, void __user *, mnt_id,</div><div class='ctx'> 		int, flag)</div><div class='ctx'> {</div><div class='ctx'> 	struct path path;</div><div class='ctx'> 	int lookup_flags;</div><div class='add'>+	int fh_flags = 0;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	if ((flag &amp; ~(AT_SYMLINK_FOLLOW | AT_EMPTY_PATH)) != 0)</div><div class='add'>+	if (flag &amp; ~(AT_SYMLINK_FOLLOW | AT_EMPTY_PATH | AT_HANDLE_FID |</div><div class='add'>+		     AT_HANDLE_MNT_ID_UNIQUE | AT_HANDLE_CONNECTABLE))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * AT_HANDLE_FID means there is no intention to decode file handle</div><div class='add'>+	 * AT_HANDLE_CONNECTABLE means there is an intention to decode a</div><div class='add'>+	 * connected fd (with known path), so these flags are conflicting.</div><div class='add'>+	 * AT_EMPTY_PATH could be used along with a dfd that refers to a</div><div class='add'>+	 * disconnected non-directory, which cannot be used to encode a</div><div class='add'>+	 * connectable file handle, because its parent is unknown.</div><div class='add'>+	 */</div><div class='add'>+	if (flag &amp; AT_HANDLE_CONNECTABLE &amp;&amp;</div><div class='add'>+	    flag &amp; (AT_HANDLE_FID | AT_EMPTY_PATH))</div><div class='ctx'> 		return -EINVAL;</div><div class='add'>+	else if (flag &amp; AT_HANDLE_FID)</div><div class='add'>+		fh_flags |= EXPORT_FH_FID;</div><div class='add'>+	else if (flag &amp; AT_HANDLE_CONNECTABLE)</div><div class='add'>+		fh_flags |= EXPORT_FH_CONNECTABLE;</div><div class='ctx'> </div><div class='ctx'> 	lookup_flags = (flag &amp; AT_SYMLINK_FOLLOW) ? LOOKUP_FOLLOW : 0;</div><div class='ctx'> 	if (flag &amp; AT_EMPTY_PATH)</div><div class='ctx'> 		lookup_flags |= LOOKUP_EMPTY;</div><div class='ctx'> 	err = user_path_at(dfd, name, lookup_flags, &amp;path);</div><div class='ctx'> 	if (!err) {</div><div class='del'>-		err = do_sys_name_to_handle(&amp;path, handle, mnt_id);</div><div class='add'>+		err = do_sys_name_to_handle(&amp;path, handle, mnt_id,</div><div class='add'>+					    flag &amp; AT_HANDLE_MNT_ID_UNIQUE,</div><div class='add'>+					    fh_flags);</div><div class='ctx'> 		path_put(&amp;path);</div><div class='ctx'> 	}</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct vfsmount *get_vfsmount_from_fd(int fd)</div><div class='add'>+static int get_path_anchor(int fd, struct path *root)</div><div class='ctx'> {</div><div class='del'>-	struct vfsmount *mnt;</div><div class='add'>+	if (fd &gt;= 0) {</div><div class='add'>+		CLASS(fd, f)(fd);</div><div class='add'>+		if (fd_empty(f))</div><div class='add'>+			return -EBADF;</div><div class='add'>+		*root = fd_file(f)-&gt;f_path;</div><div class='add'>+		path_get(root);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (fd == AT_FDCWD) {</div><div class='del'>-		struct fs_struct *fs = current-&gt;fs;</div><div class='del'>-		spin_lock(&amp;fs-&gt;lock);</div><div class='del'>-		mnt = mntget(fs-&gt;pwd.mnt);</div><div class='del'>-		spin_unlock(&amp;fs-&gt;lock);</div><div class='del'>-	} else {</div><div class='del'>-		struct fd f = fdget(fd);</div><div class='del'>-		if (!f.file)</div><div class='del'>-			return ERR_PTR(-EBADF);</div><div class='del'>-		mnt = mntget(f.file-&gt;f_path.mnt);</div><div class='del'>-		fdput(f);</div><div class='add'>+		get_fs_pwd(current-&gt;fs, root);</div><div class='add'>+		return 0;</div><div class='ctx'> 	}</div><div class='del'>-	return mnt;</div><div class='add'>+</div><div class='add'>+	if (fd == FD_PIDFS_ROOT) {</div><div class='add'>+		pidfs_get_root(root);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (fd == FD_NSFS_ROOT) {</div><div class='add'>+		nsfs_get_root(root);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return -EBADF;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int vfs_dentry_acceptable(void *context, struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	return 1;</div><div class='add'>+	struct handle_to_path_ctx *ctx = context;</div><div class='add'>+	struct user_namespace *user_ns = current_user_ns();</div><div class='add'>+	struct dentry *d, *root = ctx-&gt;root.dentry;</div><div class='add'>+	struct mnt_idmap *idmap = mnt_idmap(ctx-&gt;root.mnt);</div><div class='add'>+	int retval = 0;</div><div class='add'>+</div><div class='add'>+	if (!root)</div><div class='add'>+		return 1;</div><div class='add'>+</div><div class='add'>+	/* Old permission model with global CAP_DAC_READ_SEARCH. */</div><div class='add'>+	if (!ctx-&gt;flags)</div><div class='add'>+		return 1;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Verify that the decoded dentry itself has a valid id mapping.</div><div class='add'>+	 * In case the decoded dentry is the mountfd root itself, this</div><div class='add'>+	 * verifies that the mountfd inode itself has a valid id mapping.</div><div class='add'>+	 */</div><div class='add'>+	if (!privileged_wrt_inode_uidgid(user_ns, idmap, d_inode(dentry)))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * It's racy as we're not taking rename_lock but we're able to ignore</div><div class='add'>+	 * permissions and we just need an approximation whether we were able</div><div class='add'>+	 * to follow a path to the file.</div><div class='add'>+	 *</div><div class='add'>+	 * It's also potentially expensive on some filesystems especially if</div><div class='add'>+	 * there is a deep path.</div><div class='add'>+	 */</div><div class='add'>+	d = dget(dentry);</div><div class='add'>+	while (d != root &amp;&amp; !IS_ROOT(d)) {</div><div class='add'>+		struct dentry *parent = dget_parent(d);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * We know that we have the ability to override DAC permissions</div><div class='add'>+		 * as we've verified this earlier via CAP_DAC_READ_SEARCH. But</div><div class='add'>+		 * we also need to make sure that there aren't any unmapped</div><div class='add'>+		 * inodes in the path that would prevent us from reaching the</div><div class='add'>+		 * file.</div><div class='add'>+		 */</div><div class='add'>+		if (!privileged_wrt_inode_uidgid(user_ns, idmap,</div><div class='add'>+						 d_inode(parent))) {</div><div class='add'>+			dput(d);</div><div class='add'>+			dput(parent);</div><div class='add'>+			return retval;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		dput(d);</div><div class='add'>+		d = parent;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!(ctx-&gt;flags &amp; HANDLE_CHECK_SUBTREE) || d == root)</div><div class='add'>+		retval = 1;</div><div class='add'>+	/*</div><div class='add'>+	 * exportfs_decode_fh_raw() does not call acceptable() callback with</div><div class='add'>+	 * a disconnected directory dentry, so we should have reached either</div><div class='add'>+	 * mount fd directory or sb root.</div><div class='add'>+	 */</div><div class='add'>+	if (ctx-&gt;fh_flags &amp; EXPORT_FH_DIR_ONLY)</div><div class='add'>+		WARN_ON_ONCE(d != root &amp;&amp; d != root-&gt;d_sb-&gt;s_root);</div><div class='add'>+	dput(d);</div><div class='add'>+	return retval;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int do_handle_to_path(int mountdirfd, struct file_handle *handle,</div><div class='del'>-			     struct path *path)</div><div class='add'>+static int do_handle_to_path(struct file_handle *handle, struct path *path,</div><div class='add'>+			     struct handle_to_path_ctx *ctx)</div><div class='ctx'> {</div><div class='del'>-	int retval = 0;</div><div class='ctx'> 	int handle_dwords;</div><div class='add'>+	struct vfsmount *mnt = ctx-&gt;root.mnt;</div><div class='add'>+	struct dentry *dentry;</div><div class='ctx'> </div><div class='del'>-	path-&gt;mnt = get_vfsmount_from_fd(mountdirfd);</div><div class='del'>-	if (IS_ERR(path-&gt;mnt)) {</div><div class='del'>-		retval = PTR_ERR(path-&gt;mnt);</div><div class='del'>-		goto out_err;</div><div class='del'>-	}</div><div class='ctx'> 	/* change the handle size to multiple of sizeof(u32) */</div><div class='ctx'> 	handle_dwords = handle-&gt;handle_bytes &gt;&gt; 2;</div><div class='del'>-	path-&gt;dentry = exportfs_decode_fh(path-&gt;mnt,</div><div class='del'>-					  (struct fid *)handle-&gt;f_handle,</div><div class='del'>-					  handle_dwords, handle-&gt;handle_type,</div><div class='del'>-					  vfs_dentry_acceptable, NULL);</div><div class='del'>-	if (IS_ERR(path-&gt;dentry)) {</div><div class='del'>-		retval = PTR_ERR(path-&gt;dentry);</div><div class='del'>-		goto out_mnt;</div><div class='add'>+	dentry = exportfs_decode_fh_raw(mnt, (struct fid *)handle-&gt;f_handle,</div><div class='add'>+					handle_dwords, handle-&gt;handle_type,</div><div class='add'>+					ctx-&gt;fh_flags, vfs_dentry_acceptable,</div><div class='add'>+					ctx);</div><div class='add'>+	if (IS_ERR_OR_NULL(dentry)) {</div><div class='add'>+		if (dentry == ERR_PTR(-ENOMEM))</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+		return -ESTALE;</div><div class='ctx'> 	}</div><div class='add'>+	path-&gt;dentry = dentry;</div><div class='add'>+	path-&gt;mnt = mntget(mnt);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int may_decode_fh(struct handle_to_path_ctx *ctx,</div><div class='add'>+				unsigned int o_flags)</div><div class='add'>+{</div><div class='add'>+	struct path *root = &amp;ctx-&gt;root;</div><div class='add'>+</div><div class='add'>+	if (capable(CAP_DAC_READ_SEARCH))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Allow relaxed permissions of file handles if the caller has</div><div class='add'>+	 * the ability to mount the filesystem or create a bind-mount of</div><div class='add'>+	 * the provided @mountdirfd.</div><div class='add'>+	 *</div><div class='add'>+	 * In both cases the caller may be able to get an unobstructed</div><div class='add'>+	 * way to the encoded file handle. If the caller is only able to</div><div class='add'>+	 * create a bind-mount we need to verify that there are no</div><div class='add'>+	 * locked mounts on top of it that could prevent us from getting</div><div class='add'>+	 * to the encoded file.</div><div class='add'>+	 *</div><div class='add'>+	 * In principle, locked mounts can prevent the caller from</div><div class='add'>+	 * mounting the filesystem but that only applies to procfs and</div><div class='add'>+	 * sysfs neither of which support decoding file handles.</div><div class='add'>+	 *</div><div class='add'>+	 * Restrict to O_DIRECTORY to provide a deterministic API that</div><div class='add'>+	 * avoids a confusing api in the face of disconnected non-dir</div><div class='add'>+	 * dentries.</div><div class='add'>+	 *</div><div class='add'>+	 * There's only one dentry for each directory inode (VFS rule)...</div><div class='add'>+	 */</div><div class='add'>+	if (!(o_flags &amp; O_DIRECTORY))</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	if (ns_capable(root-&gt;mnt-&gt;mnt_sb-&gt;s_user_ns, CAP_SYS_ADMIN))</div><div class='add'>+		ctx-&gt;flags = HANDLE_CHECK_PERMS;</div><div class='add'>+	else if (is_mounted(root-&gt;mnt) &amp;&amp;</div><div class='add'>+		 ns_capable(real_mount(root-&gt;mnt)-&gt;mnt_ns-&gt;user_ns,</div><div class='add'>+			    CAP_SYS_ADMIN) &amp;&amp;</div><div class='add'>+		 !has_locked_children(real_mount(root-&gt;mnt), root-&gt;dentry))</div><div class='add'>+		ctx-&gt;flags = HANDLE_CHECK_PERMS | HANDLE_CHECK_SUBTREE;</div><div class='add'>+	else</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	/* Are we able to override DAC permissions? */</div><div class='add'>+	if (!ns_capable(current_user_ns(), CAP_DAC_READ_SEARCH))</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	ctx-&gt;fh_flags = EXPORT_FH_DIR_ONLY;</div><div class='ctx'> 	return 0;</div><div class='del'>-out_mnt:</div><div class='del'>-	mntput(path-&gt;mnt);</div><div class='del'>-out_err:</div><div class='del'>-	return retval;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int handle_to_path(int mountdirfd, struct file_handle __user *ufh,</div><div class='del'>-		   struct path *path)</div><div class='add'>+		   struct path *path, unsigned int o_flags)</div><div class='ctx'> {</div><div class='ctx'> 	int retval = 0;</div><div class='ctx'> 	struct file_handle f_handle;</div><div class='del'>-	struct file_handle *handle = NULL;</div><div class='add'>+	struct file_handle *handle __free(kfree) = NULL;</div><div class='add'>+	struct handle_to_path_ctx ctx = {};</div><div class='add'>+	const struct export_operations *eops;</div><div class='add'>+</div><div class='add'>+	if (copy_from_user(&amp;f_handle, ufh, sizeof(struct file_handle)))</div><div class='add'>+		return -EFAULT;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * With handle we don't look at the execute bit on the</div><div class='del'>-	 * directory. Ideally we would like CAP_DAC_SEARCH.</div><div class='del'>-	 * But we don't have that</div><div class='del'>-	 */</div><div class='del'>-	if (!capable(CAP_DAC_READ_SEARCH)) {</div><div class='del'>-		retval = -EPERM;</div><div class='del'>-		goto out_err;</div><div class='del'>-	}</div><div class='del'>-	if (copy_from_user(&amp;f_handle, ufh, sizeof(struct file_handle))) {</div><div class='del'>-		retval = -EFAULT;</div><div class='del'>-		goto out_err;</div><div class='del'>-	}</div><div class='ctx'> 	if ((f_handle.handle_bytes &gt; MAX_HANDLE_SZ) ||</div><div class='del'>-	    (f_handle.handle_bytes == 0)) {</div><div class='del'>-		retval = -EINVAL;</div><div class='del'>-		goto out_err;</div><div class='del'>-	}</div><div class='del'>-	handle = kmalloc(sizeof(struct file_handle) + f_handle.handle_bytes,</div><div class='add'>+	    (f_handle.handle_bytes == 0))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	if (f_handle.handle_type &lt; 0 ||</div><div class='add'>+	    FILEID_USER_FLAGS(f_handle.handle_type) &amp; ~FILEID_VALID_USER_FLAGS)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	retval = get_path_anchor(mountdirfd, &amp;ctx.root);</div><div class='add'>+	if (retval)</div><div class='add'>+		return retval;</div><div class='add'>+</div><div class='add'>+	eops = ctx.root.mnt-&gt;mnt_sb-&gt;s_export_op;</div><div class='add'>+	if (eops &amp;&amp; eops-&gt;permission)</div><div class='add'>+		retval = eops-&gt;permission(&amp;ctx, o_flags);</div><div class='add'>+	else</div><div class='add'>+		retval = may_decode_fh(&amp;ctx, o_flags);</div><div class='add'>+	if (retval)</div><div class='add'>+		goto out_path;</div><div class='add'>+</div><div class='add'>+	handle = kmalloc(struct_size(handle, f_handle, f_handle.handle_bytes),</div><div class='ctx'> 			 GFP_KERNEL);</div><div class='ctx'> 	if (!handle) {</div><div class='ctx'> 		retval = -ENOMEM;</div><div class='del'>-		goto out_err;</div><div class='add'>+		goto out_path;</div><div class='ctx'> 	}</div><div class='ctx'> 	/* copy the full handle */</div><div class='ctx'> 	*handle = f_handle;</div><div class='hunk'>@@ -201,45 +381,51 @@ static int handle_to_path(int mountdirfd, struct file_handle __user *ufh,</div><div class='ctx'> 			   &amp;ufh-&gt;f_handle,</div><div class='ctx'> 			   f_handle.handle_bytes)) {</div><div class='ctx'> 		retval = -EFAULT;</div><div class='del'>-		goto out_handle;</div><div class='add'>+		goto out_path;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	retval = do_handle_to_path(mountdirfd, handle, path);</div><div class='add'>+	/*</div><div class='add'>+	 * If handle was encoded with AT_HANDLE_CONNECTABLE, verify that we</div><div class='add'>+	 * are decoding an fd with connected path, which is accessible from</div><div class='add'>+	 * the mount fd path.</div><div class='add'>+	 */</div><div class='add'>+	if (f_handle.handle_type &amp; FILEID_IS_CONNECTABLE) {</div><div class='add'>+		ctx.fh_flags |= EXPORT_FH_CONNECTABLE;</div><div class='add'>+		ctx.flags |= HANDLE_CHECK_SUBTREE;</div><div class='add'>+	}</div><div class='add'>+	if (f_handle.handle_type &amp; FILEID_IS_DIR)</div><div class='add'>+		ctx.fh_flags |= EXPORT_FH_DIR_ONLY;</div><div class='add'>+	/* Filesystem code should not be exposed to user flags */</div><div class='add'>+	handle-&gt;handle_type &amp;= ~FILEID_USER_FLAGS_MASK;</div><div class='add'>+	retval = do_handle_to_path(handle, path, &amp;ctx);</div><div class='ctx'> </div><div class='del'>-out_handle:</div><div class='del'>-	kfree(handle);</div><div class='del'>-out_err:</div><div class='add'>+out_path:</div><div class='add'>+	path_put(&amp;ctx.root);</div><div class='ctx'> 	return retval;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static struct file *file_open_handle(struct path *path, int open_flag)</div><div class='add'>+{</div><div class='add'>+	const struct export_operations *eops;</div><div class='add'>+</div><div class='add'>+	eops = path-&gt;mnt-&gt;mnt_sb-&gt;s_export_op;</div><div class='add'>+	if (eops-&gt;open)</div><div class='add'>+		return eops-&gt;open(path, open_flag);</div><div class='add'>+</div><div class='add'>+	return file_open_root(path, "", open_flag, 0);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static long do_handle_open(int mountdirfd, struct file_handle __user *ufh,</div><div class='ctx'> 			   int open_flag)</div><div class='ctx'> {</div><div class='del'>-	long retval = 0;</div><div class='del'>-	struct path path;</div><div class='del'>-	struct file *file;</div><div class='del'>-	int fd;</div><div class='add'>+	long retval;</div><div class='add'>+	struct path path __free(path_put) = {};</div><div class='ctx'> </div><div class='del'>-	retval = handle_to_path(mountdirfd, ufh, &amp;path);</div><div class='add'>+	retval = handle_to_path(mountdirfd, ufh, &amp;path, open_flag);</div><div class='ctx'> 	if (retval)</div><div class='ctx'> 		return retval;</div><div class='ctx'> </div><div class='del'>-	fd = get_unused_fd_flags(open_flag);</div><div class='del'>-	if (fd &lt; 0) {</div><div class='del'>-		path_put(&amp;path);</div><div class='del'>-		return fd;</div><div class='del'>-	}</div><div class='del'>-	file = file_open_root(&amp;path, "", open_flag, 0);</div><div class='del'>-	if (IS_ERR(file)) {</div><div class='del'>-		put_unused_fd(fd);</div><div class='del'>-		retval =  PTR_ERR(file);</div><div class='del'>-	} else {</div><div class='del'>-		retval = fd;</div><div class='del'>-		fsnotify_open(file);</div><div class='del'>-		fd_install(fd, file);</div><div class='del'>-	}</div><div class='del'>-	path_put(&amp;path);</div><div class='del'>-	return retval;</div><div class='add'>+	return FD_ADD(open_flag, file_open_handle(&amp;path, open_flag));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='head'>diff --git a/fs/file.c b/fs/file.c<br/>index 8627dacfc424..0a4f3bdb2dec 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/file.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/file.c</a></div><div class='hunk'>@@ -20,10 +20,79 @@</div><div class='ctx'> #include &lt;linux/spinlock.h&gt;</div><div class='ctx'> #include &lt;linux/rcupdate.h&gt;</div><div class='ctx'> #include &lt;linux/close_range.h&gt;</div><div class='add'>+#include &lt;linux/file_ref.h&gt;</div><div class='ctx'> #include &lt;net/sock.h&gt;</div><div class='add'>+#include &lt;linux/init_task.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "internal.h"</div><div class='ctx'> </div><div class='add'>+static noinline bool __file_ref_put_badval(file_ref_t *ref, unsigned long cnt)</div><div class='add'>+{</div><div class='add'>+	/*</div><div class='add'>+	 * If the reference count was already in the dead zone, then this</div><div class='add'>+	 * put() operation is imbalanced. Warn, put the reference count back to</div><div class='add'>+	 * DEAD and tell the caller to not deconstruct the object.</div><div class='add'>+	 */</div><div class='add'>+	if (WARN_ONCE(cnt &gt;= FILE_REF_RELEASED, "imbalanced put on file reference count")) {</div><div class='add'>+		atomic_long_set(&amp;ref-&gt;refcnt, FILE_REF_DEAD);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This is a put() operation on a saturated refcount. Restore the</div><div class='add'>+	 * mean saturation value and tell the caller to not deconstruct the</div><div class='add'>+	 * object.</div><div class='add'>+	 */</div><div class='add'>+	if (cnt &gt; FILE_REF_MAXREF)</div><div class='add'>+		atomic_long_set(&amp;ref-&gt;refcnt, FILE_REF_SATURATED);</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * __file_ref_put - Slowpath of file_ref_put()</div><div class='add'>+ * @ref:	Pointer to the reference count</div><div class='add'>+ * @cnt:	Current reference count</div><div class='add'>+ *</div><div class='add'>+ * Invoked when the reference count is outside of the valid zone.</div><div class='add'>+ *</div><div class='add'>+ * Return:</div><div class='add'>+ *	True if this was the last reference with no future references</div><div class='add'>+ *	possible. This signals the caller that it can safely schedule the</div><div class='add'>+ *	object, which is protected by the reference counter, for</div><div class='add'>+ *	deconstruction.</div><div class='add'>+ *</div><div class='add'>+ *	False if there are still active references or the put() raced</div><div class='add'>+ *	with a concurrent get()/put() pair. Caller is not allowed to</div><div class='add'>+ *	deconstruct the protected object.</div><div class='add'>+ */</div><div class='add'>+bool __file_ref_put(file_ref_t *ref, unsigned long cnt)</div><div class='add'>+{</div><div class='add'>+	/* Did this drop the last reference? */</div><div class='add'>+	if (likely(cnt == FILE_REF_NOREF)) {</div><div class='add'>+		/*</div><div class='add'>+		 * Carefully try to set the reference count to FILE_REF_DEAD.</div><div class='add'>+		 *</div><div class='add'>+		 * This can fail if a concurrent get() operation has</div><div class='add'>+		 * elevated it again or the corresponding put() even marked</div><div class='add'>+		 * it dead already. Both are valid situations and do not</div><div class='add'>+		 * require a retry. If this fails the caller is not</div><div class='add'>+		 * allowed to deconstruct the object.</div><div class='add'>+		 */</div><div class='add'>+		if (!atomic_long_try_cmpxchg_release(&amp;ref-&gt;refcnt, &amp;cnt, FILE_REF_DEAD))</div><div class='add'>+			return false;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * The caller can safely schedule the object for</div><div class='add'>+		 * deconstruction. Provide acquire ordering.</div><div class='add'>+		 */</div><div class='add'>+		smp_acquire__after_ctrl_dep();</div><div class='add'>+		return true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return __file_ref_put_badval(ref, cnt);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(__file_ref_put);</div><div class='add'>+</div><div class='ctx'> unsigned int sysctl_nr_open __read_mostly = 1024*1024;</div><div class='ctx'> unsigned int sysctl_nr_open_min = BITS_PER_LONG;</div><div class='ctx'> /* our min() is unusable in constant expressions ;-/ */</div><div class='hunk'>@@ -46,27 +115,23 @@ static void free_fdtable_rcu(struct rcu_head *rcu)</div><div class='ctx'> #define BITBIT_NR(nr)	BITS_TO_LONGS(BITS_TO_LONGS(nr))</div><div class='ctx'> #define BITBIT_SIZE(nr)	(BITBIT_NR(nr) * sizeof(long))</div><div class='ctx'> </div><div class='add'>+#define fdt_words(fdt) ((fdt)-&gt;max_fds / BITS_PER_LONG) // words in -&gt;open_fds</div><div class='ctx'> /*</div><div class='ctx'>  * Copy 'count' fd bits from the old table to the new table and clear the extra</div><div class='ctx'>  * space if any.  This does not copy the file pointers.  Called with the files</div><div class='ctx'>  * spinlock held for write.</div><div class='ctx'>  */</div><div class='del'>-static void copy_fd_bitmaps(struct fdtable *nfdt, struct fdtable *ofdt,</div><div class='del'>-			    unsigned int count)</div><div class='add'>+static inline void copy_fd_bitmaps(struct fdtable *nfdt, struct fdtable *ofdt,</div><div class='add'>+			    unsigned int copy_words)</div><div class='ctx'> {</div><div class='del'>-	unsigned int cpy, set;</div><div class='del'>-</div><div class='del'>-	cpy = count / BITS_PER_BYTE;</div><div class='del'>-	set = (nfdt-&gt;max_fds - count) / BITS_PER_BYTE;</div><div class='del'>-	memcpy(nfdt-&gt;open_fds, ofdt-&gt;open_fds, cpy);</div><div class='del'>-	memset((char *)nfdt-&gt;open_fds + cpy, 0, set);</div><div class='del'>-	memcpy(nfdt-&gt;close_on_exec, ofdt-&gt;close_on_exec, cpy);</div><div class='del'>-	memset((char *)nfdt-&gt;close_on_exec + cpy, 0, set);</div><div class='del'>-</div><div class='del'>-	cpy = BITBIT_SIZE(count);</div><div class='del'>-	set = BITBIT_SIZE(nfdt-&gt;max_fds) - cpy;</div><div class='del'>-	memcpy(nfdt-&gt;full_fds_bits, ofdt-&gt;full_fds_bits, cpy);</div><div class='del'>-	memset((char *)nfdt-&gt;full_fds_bits + cpy, 0, set);</div><div class='add'>+	unsigned int nwords = fdt_words(nfdt);</div><div class='add'>+</div><div class='add'>+	bitmap_copy_and_extend(nfdt-&gt;open_fds, ofdt-&gt;open_fds,</div><div class='add'>+			copy_words * BITS_PER_LONG, nwords * BITS_PER_LONG);</div><div class='add'>+	bitmap_copy_and_extend(nfdt-&gt;close_on_exec, ofdt-&gt;close_on_exec,</div><div class='add'>+			copy_words * BITS_PER_LONG, nwords * BITS_PER_LONG);</div><div class='add'>+	bitmap_copy_and_extend(nfdt-&gt;full_fds_bits, ofdt-&gt;full_fds_bits,</div><div class='add'>+			copy_words, nwords);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -84,12 +149,20 @@ static void copy_fdtable(struct fdtable *nfdt, struct fdtable *ofdt)</div><div class='ctx'> 	memcpy(nfdt-&gt;fd, ofdt-&gt;fd, cpy);</div><div class='ctx'> 	memset((char *)nfdt-&gt;fd + cpy, 0, set);</div><div class='ctx'> </div><div class='del'>-	copy_fd_bitmaps(nfdt, ofdt, ofdt-&gt;max_fds);</div><div class='add'>+	copy_fd_bitmaps(nfdt, ofdt, fdt_words(ofdt));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct fdtable * alloc_fdtable(unsigned int nr)</div><div class='add'>+/*</div><div class='add'>+ * Note how the fdtable bitmap allocations very much have to be a multiple of</div><div class='add'>+ * BITS_PER_LONG. This is not only because we walk those things in chunks of</div><div class='add'>+ * 'unsigned long' in some places, but simply because that is how the Linux</div><div class='add'>+ * kernel bitmaps are defined to work: they are not "bits in an array of bytes",</div><div class='add'>+ * they are very much "bits in an array of unsigned long".</div><div class='add'>+ */</div><div class='add'>+static struct fdtable *alloc_fdtable(unsigned int slots_wanted)</div><div class='ctx'> {</div><div class='ctx'> 	struct fdtable *fdt;</div><div class='add'>+	unsigned int nr;</div><div class='ctx'> 	void *data;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -97,21 +170,47 @@ static struct fdtable * alloc_fdtable(unsigned int nr)</div><div class='ctx'> 	 * Allocation steps are keyed to the size of the fdarray, since it</div><div class='ctx'> 	 * grows far faster than any of the other dynamic data. We try to fit</div><div class='ctx'> 	 * the fdarray into comfortable page-tuned chunks: starting at 1024B</div><div class='del'>-	 * and growing in powers of two from there on.</div><div class='add'>+	 * and growing in powers of two from there on.  Since we called only</div><div class='add'>+	 * with slots_wanted &gt; BITS_PER_LONG (embedded instance in files-&gt;fdtab</div><div class='add'>+	 * already gives BITS_PER_LONG slots), the above boils down to</div><div class='add'>+	 * 1.  use the smallest power of two large enough to give us that many</div><div class='add'>+	 * slots.</div><div class='add'>+	 * 2.  on 32bit skip 64 and 128 - the minimal capacity we want there is</div><div class='add'>+	 * 256 slots (i.e. 1Kb fd array).</div><div class='add'>+	 * 3.  on 64bit don't skip anything, 1Kb fd array means 128 slots there</div><div class='add'>+	 * and we are never going to be asked for 64 or less.</div><div class='ctx'> 	 */</div><div class='del'>-	nr /= (1024 / sizeof(struct file *));</div><div class='del'>-	nr = roundup_pow_of_two(nr + 1);</div><div class='del'>-	nr *= (1024 / sizeof(struct file *));</div><div class='add'>+	if (IS_ENABLED(CONFIG_32BIT) &amp;&amp; slots_wanted &lt; 256)</div><div class='add'>+		nr = 256;</div><div class='add'>+	else</div><div class='add'>+		nr = roundup_pow_of_two(slots_wanted);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Note that this can drive nr *below* what we had passed if sysctl_nr_open</div><div class='del'>-	 * had been set lower between the check in expand_files() and here.  Deal</div><div class='del'>-	 * with that in caller, it's cheaper that way.</div><div class='add'>+	 * had been set lower between the check in expand_files() and here.</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * We make sure that nr remains a multiple of BITS_PER_LONG - otherwise</div><div class='ctx'> 	 * bitmaps handling below becomes unpleasant, to put it mildly...</div><div class='ctx'> 	 */</div><div class='del'>-	if (unlikely(nr &gt; sysctl_nr_open))</div><div class='del'>-		nr = ((sysctl_nr_open - 1) | (BITS_PER_LONG - 1)) + 1;</div><div class='add'>+	if (unlikely(nr &gt; sysctl_nr_open)) {</div><div class='add'>+		nr = round_down(sysctl_nr_open, BITS_PER_LONG);</div><div class='add'>+		if (nr &lt; slots_wanted)</div><div class='add'>+			return ERR_PTR(-EMFILE);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Check if the allocation size would exceed INT_MAX. kvmalloc_array()</div><div class='add'>+	 * and kvmalloc() will warn if the allocation size is greater than</div><div class='add'>+	 * INT_MAX, as filp_cachep objects are not __GFP_NOWARN.</div><div class='add'>+	 *</div><div class='add'>+	 * This can happen when sysctl_nr_open is set to a very high value and</div><div class='add'>+	 * a process tries to use a file descriptor near that limit. For example,</div><div class='add'>+	 * if sysctl_nr_open is set to 1073741816 (0x3ffffff8) - which is what</div><div class='add'>+	 * systemd typically sets it to - then trying to use a file descriptor</div><div class='add'>+	 * close to that value will require allocating a file descriptor table</div><div class='add'>+	 * that exceeds 8GB in size.</div><div class='add'>+	 */</div><div class='add'>+	if (unlikely(nr &gt; INT_MAX / sizeof(struct file *)))</div><div class='add'>+		return ERR_PTR(-EMFILE);</div><div class='ctx'> </div><div class='ctx'> 	fdt = kmalloc(sizeof(struct fdtable), GFP_KERNEL_ACCOUNT);</div><div class='ctx'> 	if (!fdt)</div><div class='hunk'>@@ -140,14 +239,14 @@ out_arr:</div><div class='ctx'> out_fdt:</div><div class='ctx'> 	kfree(fdt);</div><div class='ctx'> out:</div><div class='del'>-	return NULL;</div><div class='add'>+	return ERR_PTR(-ENOMEM);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Expand the file descriptor table.</div><div class='ctx'>  * This function will allocate a new fdtable and both fd array and fdset, of</div><div class='ctx'>  * the given size.</div><div class='del'>- * Return &lt;0 error code on error; 1 on successful completion.</div><div class='add'>+ * Return &lt;0 error code on error; 0 on successful completion.</div><div class='ctx'>  * The files-&gt;file_lock should be held on entry, and will be held on exit.</div><div class='ctx'>  */</div><div class='ctx'> static int expand_fdtable(struct files_struct *files, unsigned int nr)</div><div class='hunk'>@@ -157,7 +256,7 @@ static int expand_fdtable(struct files_struct *files, unsigned int nr)</div><div class='ctx'> 	struct fdtable *new_fdt, *cur_fdt;</div><div class='ctx'> </div><div class='ctx'> 	spin_unlock(&amp;files-&gt;file_lock);</div><div class='del'>-	new_fdt = alloc_fdtable(nr);</div><div class='add'>+	new_fdt = alloc_fdtable(nr + 1);</div><div class='ctx'> </div><div class='ctx'> 	/* make sure all fd_install() have seen resize_in_progress</div><div class='ctx'> 	 * or have finished their rcu_read_lock_sched() section.</div><div class='hunk'>@@ -166,16 +265,8 @@ static int expand_fdtable(struct files_struct *files, unsigned int nr)</div><div class='ctx'> 		synchronize_rcu();</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;files-&gt;file_lock);</div><div class='del'>-	if (!new_fdt)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	/*</div><div class='del'>-	 * extremely unlikely race - sysctl_nr_open decreased between the check in</div><div class='del'>-	 * caller and alloc_fdtable().  Cheaper to catch it here...</div><div class='del'>-	 */</div><div class='del'>-	if (unlikely(new_fdt-&gt;max_fds &lt;= nr)) {</div><div class='del'>-		__free_fdtable(new_fdt);</div><div class='del'>-		return -EMFILE;</div><div class='del'>-	}</div><div class='add'>+	if (IS_ERR(new_fdt))</div><div class='add'>+		return PTR_ERR(new_fdt);</div><div class='ctx'> 	cur_fdt = files_fdtable(files);</div><div class='ctx'> 	BUG_ON(nr &lt; cur_fdt-&gt;max_fds);</div><div class='ctx'> 	copy_fdtable(new_fdt, cur_fdt);</div><div class='hunk'>@@ -184,15 +275,14 @@ static int expand_fdtable(struct files_struct *files, unsigned int nr)</div><div class='ctx'> 		call_rcu(&amp;cur_fdt-&gt;rcu, free_fdtable_rcu);</div><div class='ctx'> 	/* coupled with smp_rmb() in fd_install() */</div><div class='ctx'> 	smp_wmb();</div><div class='del'>-	return 1;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Expand files.</div><div class='ctx'>  * This function will expand the file structures, if the requested size exceeds</div><div class='ctx'>  * the current capacity and there is room for expansion.</div><div class='del'>- * Return &lt;0 error code on error; 0 when nothing done; 1 when files were</div><div class='del'>- * expanded and execution may have blocked.</div><div class='add'>+ * Return &lt;0 error code on error; 0 on success.</div><div class='ctx'>  * The files-&gt;file_lock should be held on entry, and will be held on exit.</div><div class='ctx'>  */</div><div class='ctx'> static int expand_files(struct files_struct *files, unsigned int nr)</div><div class='hunk'>@@ -200,50 +290,50 @@ static int expand_files(struct files_struct *files, unsigned int nr)</div><div class='ctx'> 	__acquires(files-&gt;file_lock)</div><div class='ctx'> {</div><div class='ctx'> 	struct fdtable *fdt;</div><div class='del'>-	int expanded = 0;</div><div class='add'>+	int error;</div><div class='ctx'> </div><div class='ctx'> repeat:</div><div class='ctx'> 	fdt = files_fdtable(files);</div><div class='ctx'> </div><div class='ctx'> 	/* Do we need to expand? */</div><div class='ctx'> 	if (nr &lt; fdt-&gt;max_fds)</div><div class='del'>-		return expanded;</div><div class='del'>-</div><div class='del'>-	/* Can we expand? */</div><div class='del'>-	if (nr &gt;= sysctl_nr_open)</div><div class='del'>-		return -EMFILE;</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(files-&gt;resize_in_progress)) {</div><div class='ctx'> 		spin_unlock(&amp;files-&gt;file_lock);</div><div class='del'>-		expanded = 1;</div><div class='ctx'> 		wait_event(files-&gt;resize_wait, !files-&gt;resize_in_progress);</div><div class='ctx'> 		spin_lock(&amp;files-&gt;file_lock);</div><div class='ctx'> 		goto repeat;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/* Can we expand? */</div><div class='add'>+	if (unlikely(nr &gt;= sysctl_nr_open))</div><div class='add'>+		return -EMFILE;</div><div class='add'>+</div><div class='ctx'> 	/* All good, so we try */</div><div class='ctx'> 	files-&gt;resize_in_progress = true;</div><div class='del'>-	expanded = expand_fdtable(files, nr);</div><div class='add'>+	error = expand_fdtable(files, nr);</div><div class='ctx'> 	files-&gt;resize_in_progress = false;</div><div class='ctx'> </div><div class='ctx'> 	wake_up_all(&amp;files-&gt;resize_wait);</div><div class='del'>-	return expanded;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void __set_close_on_exec(unsigned int fd, struct fdtable *fdt)</div><div class='del'>-{</div><div class='del'>-	__set_bit(fd, fdt-&gt;close_on_exec);</div><div class='add'>+	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void __clear_close_on_exec(unsigned int fd, struct fdtable *fdt)</div><div class='add'>+static inline void __set_close_on_exec(unsigned int fd, struct fdtable *fdt,</div><div class='add'>+				       bool set)</div><div class='ctx'> {</div><div class='del'>-	if (test_bit(fd, fdt-&gt;close_on_exec))</div><div class='del'>-		__clear_bit(fd, fdt-&gt;close_on_exec);</div><div class='add'>+	if (set) {</div><div class='add'>+		__set_bit(fd, fdt-&gt;close_on_exec);</div><div class='add'>+	} else {</div><div class='add'>+		if (test_bit(fd, fdt-&gt;close_on_exec))</div><div class='add'>+			__clear_bit(fd, fdt-&gt;close_on_exec);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void __set_open_fd(unsigned int fd, struct fdtable *fdt)</div><div class='add'>+static inline void __set_open_fd(unsigned int fd, struct fdtable *fdt, bool set)</div><div class='ctx'> {</div><div class='ctx'> 	__set_bit(fd, fdt-&gt;open_fds);</div><div class='add'>+	__set_close_on_exec(fd, fdt, set);</div><div class='ctx'> 	fd /= BITS_PER_LONG;</div><div class='ctx'> 	if (!~fdt-&gt;open_fds[fd])</div><div class='ctx'> 		__set_bit(fd, fdt-&gt;full_fds_bits);</div><div class='hunk'>@@ -252,49 +342,54 @@ static inline void __set_open_fd(unsigned int fd, struct fdtable *fdt)</div><div class='ctx'> static inline void __clear_open_fd(unsigned int fd, struct fdtable *fdt)</div><div class='ctx'> {</div><div class='ctx'> 	__clear_bit(fd, fdt-&gt;open_fds);</div><div class='del'>-	__clear_bit(fd / BITS_PER_LONG, fdt-&gt;full_fds_bits);</div><div class='add'>+	fd /= BITS_PER_LONG;</div><div class='add'>+	if (test_bit(fd, fdt-&gt;full_fds_bits))</div><div class='add'>+		__clear_bit(fd, fdt-&gt;full_fds_bits);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static unsigned int count_open_files(struct fdtable *fdt)</div><div class='add'>+static inline bool fd_is_open(unsigned int fd, const struct fdtable *fdt)</div><div class='ctx'> {</div><div class='del'>-	unsigned int size = fdt-&gt;max_fds;</div><div class='del'>-	unsigned int i;</div><div class='del'>-</div><div class='del'>-	/* Find the last open fd */</div><div class='del'>-	for (i = size / BITS_PER_LONG; i &gt; 0; ) {</div><div class='del'>-		if (fdt-&gt;open_fds[--i])</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-	i = (i + 1) * BITS_PER_LONG;</div><div class='del'>-	return i;</div><div class='add'>+	return test_bit(fd, fdt-&gt;open_fds);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static unsigned int sane_fdtable_size(struct fdtable *fdt, unsigned int max_fds)</div><div class='add'>+/*</div><div class='add'>+ * Note that a sane fdtable size always has to be a multiple of</div><div class='add'>+ * BITS_PER_LONG, since we have bitmaps that are sized by this.</div><div class='add'>+ *</div><div class='add'>+ * punch_hole is optional - when close_range() is asked to unshare</div><div class='add'>+ * and close, we don't need to copy descriptors in that range, so</div><div class='add'>+ * a smaller cloned descriptor table might suffice if the last</div><div class='add'>+ * currently opened descriptor falls into that range.</div><div class='add'>+ */</div><div class='add'>+static unsigned int sane_fdtable_size(struct fdtable *fdt, struct fd_range *punch_hole)</div><div class='ctx'> {</div><div class='del'>-	unsigned int count;</div><div class='del'>-</div><div class='del'>-	count = count_open_files(fdt);</div><div class='del'>-	if (max_fds &lt; NR_OPEN_DEFAULT)</div><div class='del'>-		max_fds = NR_OPEN_DEFAULT;</div><div class='del'>-	return min(count, max_fds);</div><div class='add'>+	unsigned int last = find_last_bit(fdt-&gt;open_fds, fdt-&gt;max_fds);</div><div class='add'>+</div><div class='add'>+	if (last == fdt-&gt;max_fds)</div><div class='add'>+		return NR_OPEN_DEFAULT;</div><div class='add'>+	if (punch_hole &amp;&amp; punch_hole-&gt;to &gt;= last &amp;&amp; punch_hole-&gt;from &lt;= last) {</div><div class='add'>+		last = find_last_bit(fdt-&gt;open_fds, punch_hole-&gt;from);</div><div class='add'>+		if (last == punch_hole-&gt;from)</div><div class='add'>+			return NR_OPEN_DEFAULT;</div><div class='add'>+	}</div><div class='add'>+	return ALIGN(last + 1, BITS_PER_LONG);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Allocate a new files structure and copy contents from the</div><div class='del'>- * passed in files structure.</div><div class='del'>- * errorp will be valid only when the returned files_struct is NULL.</div><div class='add'>+ * Allocate a new descriptor table and copy contents from the passed in</div><div class='add'>+ * instance.  Returns a pointer to cloned table on success, ERR_PTR()</div><div class='add'>+ * on failure.  For 'punch_hole' see sane_fdtable_size().</div><div class='ctx'>  */</div><div class='del'>-struct files_struct *dup_fd(struct files_struct *oldf, unsigned int max_fds, int *errorp)</div><div class='add'>+struct files_struct *dup_fd(struct files_struct *oldf, struct fd_range *punch_hole)</div><div class='ctx'> {</div><div class='ctx'> 	struct files_struct *newf;</div><div class='ctx'> 	struct file **old_fds, **new_fds;</div><div class='ctx'> 	unsigned int open_files, i;</div><div class='ctx'> 	struct fdtable *old_fdt, *new_fdt;</div><div class='ctx'> </div><div class='del'>-	*errorp = -ENOMEM;</div><div class='ctx'> 	newf = kmem_cache_alloc(files_cachep, GFP_KERNEL);</div><div class='ctx'> 	if (!newf)</div><div class='del'>-		goto out;</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='ctx'> 	atomic_set(&amp;newf-&gt;count, 1);</div><div class='ctx'> </div><div class='hunk'>@@ -311,7 +406,7 @@ struct files_struct *dup_fd(struct files_struct *oldf, unsigned int max_fds, int</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;oldf-&gt;file_lock);</div><div class='ctx'> 	old_fdt = files_fdtable(oldf);</div><div class='del'>-	open_files = sane_fdtable_size(old_fdt, max_fds);</div><div class='add'>+	open_files = sane_fdtable_size(old_fdt, punch_hole);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Check whether we need to allocate a larger fd array and fd set.</div><div class='hunk'>@@ -322,17 +417,10 @@ struct files_struct *dup_fd(struct files_struct *oldf, unsigned int max_fds, int</div><div class='ctx'> 		if (new_fdt != &amp;newf-&gt;fdtab)</div><div class='ctx'> 			__free_fdtable(new_fdt);</div><div class='ctx'> </div><div class='del'>-		new_fdt = alloc_fdtable(open_files - 1);</div><div class='del'>-		if (!new_fdt) {</div><div class='del'>-			*errorp = -ENOMEM;</div><div class='del'>-			goto out_release;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/* beyond sysctl_nr_open; nothing to do */</div><div class='del'>-		if (unlikely(new_fdt-&gt;max_fds &lt; open_files)) {</div><div class='del'>-			__free_fdtable(new_fdt);</div><div class='del'>-			*errorp = -EMFILE;</div><div class='del'>-			goto out_release;</div><div class='add'>+		new_fdt = alloc_fdtable(open_files);</div><div class='add'>+		if (IS_ERR(new_fdt)) {</div><div class='add'>+			kmem_cache_free(files_cachep, newf);</div><div class='add'>+			return ERR_CAST(new_fdt);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='hunk'>@@ -342,25 +430,33 @@ struct files_struct *dup_fd(struct files_struct *oldf, unsigned int max_fds, int</div><div class='ctx'> 		 */</div><div class='ctx'> 		spin_lock(&amp;oldf-&gt;file_lock);</div><div class='ctx'> 		old_fdt = files_fdtable(oldf);</div><div class='del'>-		open_files = sane_fdtable_size(old_fdt, max_fds);</div><div class='add'>+		open_files = sane_fdtable_size(old_fdt, punch_hole);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	copy_fd_bitmaps(new_fdt, old_fdt, open_files);</div><div class='add'>+	copy_fd_bitmaps(new_fdt, old_fdt, open_files / BITS_PER_LONG);</div><div class='ctx'> </div><div class='ctx'> 	old_fds = old_fdt-&gt;fd;</div><div class='ctx'> 	new_fds = new_fdt-&gt;fd;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * We may be racing against fd allocation from other threads using this</div><div class='add'>+	 * files_struct, despite holding -&gt;file_lock.</div><div class='add'>+	 *</div><div class='add'>+	 * alloc_fd() might have already claimed a slot, while fd_install()</div><div class='add'>+	 * did not populate it yet. Note the latter operates locklessly, so</div><div class='add'>+	 * the file can show up as we are walking the array below.</div><div class='add'>+	 *</div><div class='add'>+	 * At the same time we know no files will disappear as all other</div><div class='add'>+	 * operations take the lock.</div><div class='add'>+	 *</div><div class='add'>+	 * Instead of trying to placate userspace racing with itself, we</div><div class='add'>+	 * ref the file if we see it and mark the fd slot as unused otherwise.</div><div class='add'>+	 */</div><div class='ctx'> 	for (i = open_files; i != 0; i--) {</div><div class='del'>-		struct file *f = *old_fds++;</div><div class='add'>+		struct file *f = rcu_dereference_raw(*old_fds++);</div><div class='ctx'> 		if (f) {</div><div class='ctx'> 			get_file(f);</div><div class='ctx'> 		} else {</div><div class='del'>-			/*</div><div class='del'>-			 * The fd may be claimed in the fd bitmap but not yet</div><div class='del'>-			 * instantiated in the files array if a sibling thread</div><div class='del'>-			 * is partway through open().  So make sure that this</div><div class='del'>-			 * fd is available to the new process.</div><div class='del'>-			 */</div><div class='ctx'> 			__clear_open_fd(open_files - i, new_fdt);</div><div class='ctx'> 		}</div><div class='ctx'> 		rcu_assign_pointer(*new_fds++, f);</div><div class='hunk'>@@ -373,11 +469,6 @@ struct files_struct *dup_fd(struct files_struct *oldf, unsigned int max_fds, int</div><div class='ctx'> 	rcu_assign_pointer(newf-&gt;fdt, new_fdt);</div><div class='ctx'> </div><div class='ctx'> 	return newf;</div><div class='del'>-</div><div class='del'>-out_release:</div><div class='del'>-	kmem_cache_free(files_cachep, newf);</div><div class='del'>-out:</div><div class='del'>-	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct fdtable *close_files(struct files_struct * files)</div><div class='hunk'>@@ -398,7 +489,7 @@ static struct fdtable *close_files(struct files_struct * files)</div><div class='ctx'> 		set = fdt-&gt;open_fds[j++];</div><div class='ctx'> 		while (set) {</div><div class='ctx'> 			if (set &amp; 1) {</div><div class='del'>-				struct file * file = xchg(&amp;fdt-&gt;fd[i], NULL);</div><div class='add'>+				struct file *file = fdt-&gt;fd[i];</div><div class='ctx'> 				if (file) {</div><div class='ctx'> 					filp_close(file, files);</div><div class='ctx'> 					cond_resched();</div><div class='hunk'>@@ -452,12 +543,21 @@ struct files_struct init_files = {</div><div class='ctx'> </div><div class='ctx'> static unsigned int find_next_fd(struct fdtable *fdt, unsigned int start)</div><div class='ctx'> {</div><div class='del'>-	unsigned int maxfd = fdt-&gt;max_fds;</div><div class='add'>+	unsigned int maxfd = fdt-&gt;max_fds; /* always multiple of BITS_PER_LONG */</div><div class='ctx'> 	unsigned int maxbit = maxfd / BITS_PER_LONG;</div><div class='ctx'> 	unsigned int bitbit = start / BITS_PER_LONG;</div><div class='add'>+	unsigned int bit;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Try to avoid looking at the second level bitmap</div><div class='add'>+	 */</div><div class='add'>+	bit = find_next_zero_bit(&amp;fdt-&gt;open_fds[bitbit], BITS_PER_LONG,</div><div class='add'>+				 start &amp; (BITS_PER_LONG - 1));</div><div class='add'>+	if (bit &lt; BITS_PER_LONG)</div><div class='add'>+		return bit + bitbit * BITS_PER_LONG;</div><div class='ctx'> </div><div class='ctx'> 	bitbit = find_next_zero_bit(fdt-&gt;full_fds_bits, maxbit, bitbit) * BITS_PER_LONG;</div><div class='del'>-	if (bitbit &gt; maxfd)</div><div class='add'>+	if (bitbit &gt;= maxfd)</div><div class='ctx'> 		return maxfd;</div><div class='ctx'> 	if (bitbit &gt; start)</div><div class='ctx'> 		start = bitbit;</div><div class='hunk'>@@ -481,7 +581,7 @@ repeat:</div><div class='ctx'> 	if (fd &lt; files-&gt;next_fd)</div><div class='ctx'> 		fd = files-&gt;next_fd;</div><div class='ctx'> </div><div class='del'>-	if (fd &lt; fdt-&gt;max_fds)</div><div class='add'>+	if (likely(fd &lt; fdt-&gt;max_fds))</div><div class='ctx'> 		fd = find_next_fd(fdt, fd);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -489,36 +589,23 @@ repeat:</div><div class='ctx'> 	 * will limit the total number of files that can be opened.</div><div class='ctx'> 	 */</div><div class='ctx'> 	error = -EMFILE;</div><div class='del'>-	if (fd &gt;= end)</div><div class='add'>+	if (unlikely(fd &gt;= end))</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	error = expand_files(files, fd);</div><div class='del'>-	if (error &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+	if (unlikely(fd &gt;= fdt-&gt;max_fds)) {</div><div class='add'>+		error = expand_files(files, fd);</div><div class='add'>+		if (error &lt; 0)</div><div class='add'>+			goto out;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * If we needed to expand the fs array we</div><div class='del'>-	 * might have blocked - try again.</div><div class='del'>-	 */</div><div class='del'>-	if (error)</div><div class='ctx'> 		goto repeat;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (start &lt;= files-&gt;next_fd)</div><div class='ctx'> 		files-&gt;next_fd = fd + 1;</div><div class='ctx'> </div><div class='del'>-	__set_open_fd(fd, fdt);</div><div class='del'>-	if (flags &amp; O_CLOEXEC)</div><div class='del'>-		__set_close_on_exec(fd, fdt);</div><div class='del'>-	else</div><div class='del'>-		__clear_close_on_exec(fd, fdt);</div><div class='add'>+	__set_open_fd(fd, fdt, flags &amp; O_CLOEXEC);</div><div class='ctx'> 	error = fd;</div><div class='del'>-#if 1</div><div class='del'>-	/* Sanity check */</div><div class='del'>-	if (rcu_access_pointer(fdt-&gt;fd[fd]) != NULL) {</div><div class='del'>-		printk(KERN_WARNING "alloc_fd: slot %d not NULL!\n", fd);</div><div class='del'>-		rcu_assign_pointer(fdt-&gt;fd[fd], NULL);</div><div class='del'>-	}</div><div class='del'>-#endif</div><div class='add'>+	VFS_BUG_ON(rcu_access_pointer(fdt-&gt;fd[fd]) != NULL);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	spin_unlock(&amp;files-&gt;file_lock);</div><div class='hunk'>@@ -555,41 +642,59 @@ void put_unused_fd(unsigned int fd)</div><div class='ctx'> EXPORT_SYMBOL(put_unused_fd);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Install a file pointer in the fd array.</div><div class='add'>+ * Install a file pointer in the fd array while it is being resized.</div><div class='add'>+ *</div><div class='add'>+ * We need to make sure our update to the array does not get lost as the resizing</div><div class='add'>+ * thread can be copying the content as we modify it.</div><div class='ctx'>  *</div><div class='del'>- * The VFS is full of places where we drop the files lock between</div><div class='del'>- * setting the open_fds bitmap and installing the file in the file</div><div class='del'>- * array.  At any such point, we are vulnerable to a dup2() race</div><div class='del'>- * installing a file in the array before us.  We need to detect this and</div><div class='del'>- * fput() the struct file we are about to overwrite in this case.</div><div class='add'>+ * We have two ways to do it:</div><div class='add'>+ * - go off CPU waiting for resize_in_progress to clear</div><div class='add'>+ * - take the spin lock</div><div class='ctx'>  *</div><div class='del'>- * It should never happen - if we allow dup2() do it, _really_ bad things</div><div class='del'>- * will follow.</div><div class='add'>+ * The latter is trivial to implement and saves us from having to might_sleep()</div><div class='add'>+ * for debugging purposes.</div><div class='add'>+ *</div><div class='add'>+ * This is moved out of line from fd_install() to convince gcc to optimize that</div><div class='add'>+ * routine better.</div><div class='add'>+ */</div><div class='add'>+static void noinline fd_install_slowpath(unsigned int fd, struct file *file)</div><div class='add'>+{</div><div class='add'>+	struct files_struct *files = current-&gt;files;</div><div class='add'>+	struct fdtable *fdt;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;files-&gt;file_lock);</div><div class='add'>+	fdt = files_fdtable(files);</div><div class='add'>+	VFS_BUG_ON(rcu_access_pointer(fdt-&gt;fd[fd]) != NULL);</div><div class='add'>+	rcu_assign_pointer(fdt-&gt;fd[fd], file);</div><div class='add'>+	spin_unlock(&amp;files-&gt;file_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fd_install - install a file pointer in the fd array</div><div class='add'>+ * @fd: file descriptor to install the file in</div><div class='add'>+ * @file: the file to install</div><div class='ctx'>  *</div><div class='ctx'>  * This consumes the "file" refcount, so callers should treat it</div><div class='ctx'>  * as if they had called fput(file).</div><div class='ctx'>  */</div><div class='del'>-</div><div class='ctx'> void fd_install(unsigned int fd, struct file *file)</div><div class='ctx'> {</div><div class='ctx'> 	struct files_struct *files = current-&gt;files;</div><div class='ctx'> 	struct fdtable *fdt;</div><div class='ctx'> </div><div class='del'>-	rcu_read_lock_sched();</div><div class='add'>+	if (WARN_ON_ONCE(unlikely(file-&gt;f_mode &amp; FMODE_BACKING)))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='add'>+	rcu_read_lock_sched();</div><div class='ctx'> 	if (unlikely(files-&gt;resize_in_progress)) {</div><div class='ctx'> 		rcu_read_unlock_sched();</div><div class='del'>-		spin_lock(&amp;files-&gt;file_lock);</div><div class='del'>-		fdt = files_fdtable(files);</div><div class='del'>-		BUG_ON(fdt-&gt;fd[fd] != NULL);</div><div class='del'>-		rcu_assign_pointer(fdt-&gt;fd[fd], file);</div><div class='del'>-		spin_unlock(&amp;files-&gt;file_lock);</div><div class='add'>+		fd_install_slowpath(fd, file);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> 	/* coupled with smp_wmb() in expand_fdtable() */</div><div class='ctx'> 	smp_rmb();</div><div class='ctx'> 	fdt = rcu_dereference_sched(files-&gt;fdt);</div><div class='del'>-	BUG_ON(fdt-&gt;fd[fd] != NULL);</div><div class='add'>+	VFS_BUG_ON(rcu_access_pointer(fdt-&gt;fd[fd]) != NULL);</div><div class='ctx'> 	rcu_assign_pointer(fdt-&gt;fd[fd], file);</div><div class='ctx'> 	rcu_read_unlock_sched();</div><div class='ctx'> }</div><div class='hunk'>@@ -597,36 +702,32 @@ void fd_install(unsigned int fd, struct file *file)</div><div class='ctx'> EXPORT_SYMBOL(fd_install);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * pick_file - return file associatd with fd</div><div class='add'>+ * file_close_fd_locked - return file associated with fd</div><div class='ctx'>  * @files: file struct to retrieve file from</div><div class='ctx'>  * @fd: file descriptor to retrieve file for</div><div class='ctx'>  *</div><div class='del'>- * If this functions returns an EINVAL error pointer the fd was beyond the</div><div class='del'>- * current maximum number of file descriptors for that fdtable.</div><div class='add'>+ * Doesn't take a separate reference count.</div><div class='add'>+ *</div><div class='add'>+ * Context: files_lock must be held.</div><div class='ctx'>  *</div><div class='del'>- * Returns: The file associated with @fd, on error returns an error pointer.</div><div class='add'>+ * Returns: The file associated with @fd (NULL if @fd is not open)</div><div class='ctx'>  */</div><div class='del'>-static struct file *pick_file(struct files_struct *files, unsigned fd)</div><div class='add'>+struct file *file_close_fd_locked(struct files_struct *files, unsigned fd)</div><div class='ctx'> {</div><div class='add'>+	struct fdtable *fdt = files_fdtable(files);</div><div class='ctx'> 	struct file *file;</div><div class='del'>-	struct fdtable *fdt;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;files-&gt;file_lock);</div><div class='del'>-	fdt = files_fdtable(files);</div><div class='del'>-	if (fd &gt;= fdt-&gt;max_fds) {</div><div class='del'>-		file = ERR_PTR(-EINVAL);</div><div class='del'>-		goto out_unlock;</div><div class='del'>-	}</div><div class='del'>-	file = fdt-&gt;fd[fd];</div><div class='del'>-	if (!file) {</div><div class='del'>-		file = ERR_PTR(-EBADF);</div><div class='del'>-		goto out_unlock;</div><div class='del'>-	}</div><div class='del'>-	rcu_assign_pointer(fdt-&gt;fd[fd], NULL);</div><div class='del'>-	__put_unused_fd(files, fd);</div><div class='add'>+	lockdep_assert_held(&amp;files-&gt;file_lock);</div><div class='ctx'> </div><div class='del'>-out_unlock:</div><div class='del'>-	spin_unlock(&amp;files-&gt;file_lock);</div><div class='add'>+	if (fd &gt;= fdt-&gt;max_fds)</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	fd = array_index_nospec(fd, fdt-&gt;max_fds);</div><div class='add'>+	file = rcu_dereference_raw(fdt-&gt;fd[fd]);</div><div class='add'>+	if (file) {</div><div class='add'>+		rcu_assign_pointer(fdt-&gt;fd[fd], NULL);</div><div class='add'>+		__put_unused_fd(files, fd);</div><div class='add'>+	}</div><div class='ctx'> 	return file;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -635,17 +736,19 @@ int close_fd(unsigned fd)</div><div class='ctx'> 	struct files_struct *files = current-&gt;files;</div><div class='ctx'> 	struct file *file;</div><div class='ctx'> </div><div class='del'>-	file = pick_file(files, fd);</div><div class='del'>-	if (IS_ERR(file))</div><div class='add'>+	spin_lock(&amp;files-&gt;file_lock);</div><div class='add'>+	file = file_close_fd_locked(files, fd);</div><div class='add'>+	spin_unlock(&amp;files-&gt;file_lock);</div><div class='add'>+	if (!file)</div><div class='ctx'> 		return -EBADF;</div><div class='ctx'> </div><div class='ctx'> 	return filp_close(file, files);</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(close_fd); /* for ksys_close() */</div><div class='add'>+EXPORT_SYMBOL(close_fd);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * last_fd - return last valid index into fd table</div><div class='del'>- * @cur_fds: files struct</div><div class='add'>+ * @fdt: File descriptor table.</div><div class='ctx'>  *</div><div class='ctx'>  * Context: Either rcu read lock or files_lock must be held.</div><div class='ctx'>  *</div><div class='hunk'>@@ -670,36 +773,45 @@ static inline void __range_cloexec(struct files_struct *cur_fds,</div><div class='ctx'> 	spin_unlock(&amp;cur_fds-&gt;file_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void __range_close(struct files_struct *cur_fds, unsigned int fd,</div><div class='add'>+static inline void __range_close(struct files_struct *files, unsigned int fd,</div><div class='ctx'> 				 unsigned int max_fd)</div><div class='ctx'> {</div><div class='del'>-	while (fd &lt;= max_fd) {</div><div class='del'>-		struct file *file;</div><div class='add'>+	struct file *file;</div><div class='add'>+	unsigned n;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;files-&gt;file_lock);</div><div class='add'>+	n = last_fd(files_fdtable(files));</div><div class='add'>+	max_fd = min(max_fd, n);</div><div class='ctx'> </div><div class='del'>-		file = pick_file(cur_fds, fd++);</div><div class='del'>-		if (!IS_ERR(file)) {</div><div class='del'>-			/* found a valid file to close */</div><div class='del'>-			filp_close(file, cur_fds);</div><div class='add'>+	for (; fd &lt;= max_fd; fd++) {</div><div class='add'>+		file = file_close_fd_locked(files, fd);</div><div class='add'>+		if (file) {</div><div class='add'>+			spin_unlock(&amp;files-&gt;file_lock);</div><div class='add'>+			filp_close(file, files);</div><div class='ctx'> 			cond_resched();</div><div class='del'>-			continue;</div><div class='add'>+			spin_lock(&amp;files-&gt;file_lock);</div><div class='add'>+		} else if (need_resched()) {</div><div class='add'>+			spin_unlock(&amp;files-&gt;file_lock);</div><div class='add'>+			cond_resched();</div><div class='add'>+			spin_lock(&amp;files-&gt;file_lock);</div><div class='ctx'> 		}</div><div class='del'>-</div><div class='del'>-		/* beyond the last fd in that table */</div><div class='del'>-		if (PTR_ERR(file) == -EINVAL)</div><div class='del'>-			return;</div><div class='ctx'> 	}</div><div class='add'>+	spin_unlock(&amp;files-&gt;file_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * __close_range() - Close all file descriptors in a given range.</div><div class='add'>+ * sys_close_range() - Close all file descriptors in a given range.</div><div class='ctx'>  *</div><div class='ctx'>  * @fd:     starting file descriptor to close</div><div class='ctx'>  * @max_fd: last file descriptor to close</div><div class='add'>+ * @flags:  CLOSE_RANGE flags.</div><div class='ctx'>  *</div><div class='ctx'>  * This closes a range of file descriptors. All file descriptors</div><div class='ctx'>  * from @fd up to and including @max_fd are closed.</div><div class='add'>+ * Currently, errors to close a given file descriptor are ignored.</div><div class='ctx'>  */</div><div class='del'>-int __close_range(unsigned fd, unsigned max_fd, unsigned int flags)</div><div class='add'>+SYSCALL_DEFINE3(close_range, unsigned int, fd, unsigned int, max_fd,</div><div class='add'>+		unsigned int, flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct task_struct *me = current;</div><div class='ctx'> 	struct files_struct *cur_fds = me-&gt;files, *fds = NULL;</div><div class='hunk'>@@ -710,37 +822,25 @@ int __close_range(unsigned fd, unsigned max_fd, unsigned int flags)</div><div class='ctx'> 	if (fd &gt; max_fd)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	if (flags &amp; CLOSE_RANGE_UNSHARE) {</div><div class='del'>-		int ret;</div><div class='del'>-		unsigned int max_unshare_fds = NR_OPEN_MAX;</div><div class='add'>+	if ((flags &amp; CLOSE_RANGE_UNSHARE) &amp;&amp; atomic_read(&amp;cur_fds-&gt;count) &gt; 1) {</div><div class='add'>+		struct fd_range range = {fd, max_fd}, *punch_hole = &amp;range;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * If the caller requested all fds to be made cloexec we always</div><div class='ctx'> 		 * copy all of the file descriptors since they still want to</div><div class='ctx'> 		 * use them.</div><div class='ctx'> 		 */</div><div class='del'>-		if (!(flags &amp; CLOSE_RANGE_CLOEXEC)) {</div><div class='del'>-			/*</div><div class='del'>-			 * If the requested range is greater than the current</div><div class='del'>-			 * maximum, we're closing everything so only copy all</div><div class='del'>-			 * file descriptors beneath the lowest file descriptor.</div><div class='del'>-			 */</div><div class='del'>-			rcu_read_lock();</div><div class='del'>-			if (max_fd &gt;= last_fd(files_fdtable(cur_fds)))</div><div class='del'>-				max_unshare_fds = fd;</div><div class='del'>-			rcu_read_unlock();</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		ret = unshare_fd(CLONE_FILES, max_unshare_fds, &amp;fds);</div><div class='del'>-		if (ret)</div><div class='del'>-			return ret;</div><div class='add'>+		if (flags &amp; CLOSE_RANGE_CLOEXEC)</div><div class='add'>+			punch_hole = NULL;</div><div class='ctx'> </div><div class='add'>+		fds = dup_fd(cur_fds, punch_hole);</div><div class='add'>+		if (IS_ERR(fds))</div><div class='add'>+			return PTR_ERR(fds);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We used to share our file descriptor table, and have now</div><div class='ctx'> 		 * created a private one, make sure we're using it below.</div><div class='ctx'> 		 */</div><div class='del'>-		if (fds)</div><div class='del'>-			swap(cur_fds, fds);</div><div class='add'>+		swap(cur_fds, fds);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; CLOSE_RANGE_CLOEXEC)</div><div class='hunk'>@@ -762,47 +862,24 @@ int __close_range(unsigned fd, unsigned max_fd, unsigned int flags)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * See close_fd_get_file() below, this variant assumes current-&gt;files-&gt;file_lock</div><div class='del'>- * is held.</div><div class='add'>+/**</div><div class='add'>+ * file_close_fd - return file associated with fd</div><div class='add'>+ * @fd: file descriptor to retrieve file for</div><div class='add'>+ *</div><div class='add'>+ * Doesn't take a separate reference count.</div><div class='add'>+ *</div><div class='add'>+ * Returns: The file associated with @fd (NULL if @fd is not open)</div><div class='ctx'>  */</div><div class='del'>-int __close_fd_get_file(unsigned int fd, struct file **res)</div><div class='add'>+struct file *file_close_fd(unsigned int fd)</div><div class='ctx'> {</div><div class='ctx'> 	struct files_struct *files = current-&gt;files;</div><div class='ctx'> 	struct file *file;</div><div class='del'>-	struct fdtable *fdt;</div><div class='del'>-</div><div class='del'>-	fdt = files_fdtable(files);</div><div class='del'>-	if (fd &gt;= fdt-&gt;max_fds)</div><div class='del'>-		goto out_err;</div><div class='del'>-	file = fdt-&gt;fd[fd];</div><div class='del'>-	if (!file)</div><div class='del'>-		goto out_err;</div><div class='del'>-	rcu_assign_pointer(fdt-&gt;fd[fd], NULL);</div><div class='del'>-	__put_unused_fd(files, fd);</div><div class='del'>-	get_file(file);</div><div class='del'>-	*res = file;</div><div class='del'>-	return 0;</div><div class='del'>-out_err:</div><div class='del'>-	*res = NULL;</div><div class='del'>-	return -ENOENT;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * variant of close_fd that gets a ref on the file for later fput.</div><div class='del'>- * The caller must ensure that filp_close() called on the file, and then</div><div class='del'>- * an fput().</div><div class='del'>- */</div><div class='del'>-int close_fd_get_file(unsigned int fd, struct file **res)</div><div class='del'>-{</div><div class='del'>-	struct files_struct *files = current-&gt;files;</div><div class='del'>-	int ret;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;files-&gt;file_lock);</div><div class='del'>-	ret = __close_fd_get_file(fd, res);</div><div class='add'>+	file = file_close_fd_locked(files, fd);</div><div class='ctx'> 	spin_unlock(&amp;files-&gt;file_lock);</div><div class='ctx'> </div><div class='del'>-	return ret;</div><div class='add'>+	return file;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void do_close_on_exec(struct files_struct *files)</div><div class='hunk'>@@ -841,49 +918,199 @@ void do_close_on_exec(struct files_struct *files)</div><div class='ctx'> 	spin_unlock(&amp;files-&gt;file_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct file *__fget_files(struct files_struct *files, unsigned int fd,</div><div class='del'>-				 fmode_t mask, unsigned int refs)</div><div class='add'>+static struct file *__get_file_rcu(struct file __rcu **f)</div><div class='ctx'> {</div><div class='del'>-	struct file *file;</div><div class='add'>+	struct file __rcu *file;</div><div class='add'>+	struct file __rcu *file_reloaded;</div><div class='add'>+	struct file __rcu *file_reloaded_cmp;</div><div class='ctx'> </div><div class='del'>-	rcu_read_lock();</div><div class='del'>-loop:</div><div class='del'>-	file = files_lookup_fd_rcu(files, fd);</div><div class='del'>-	if (file) {</div><div class='del'>-		/* File object ref couldn't be taken.</div><div class='del'>-		 * dup2() atomicity guarantee is the reason</div><div class='del'>-		 * we loop to catch the new file (or NULL pointer)</div><div class='del'>-		 */</div><div class='del'>-		if (file-&gt;f_mode &amp; mask)</div><div class='del'>-			file = NULL;</div><div class='del'>-		else if (!get_file_rcu_many(file, refs))</div><div class='del'>-			goto loop;</div><div class='add'>+	file = rcu_dereference_raw(*f);</div><div class='add'>+	if (!file)</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	if (unlikely(!file_ref_get(&amp;file-&gt;f_ref)))</div><div class='add'>+		return ERR_PTR(-EAGAIN);</div><div class='add'>+</div><div class='add'>+	file_reloaded = rcu_dereference_raw(*f);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Ensure that all accesses have a dependency on the load from</div><div class='add'>+	 * rcu_dereference_raw() above so we get correct ordering</div><div class='add'>+	 * between reuse/allocation and the pointer check below.</div><div class='add'>+	 */</div><div class='add'>+	file_reloaded_cmp = file_reloaded;</div><div class='add'>+	OPTIMIZER_HIDE_VAR(file_reloaded_cmp);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * file_ref_get() above provided a full memory barrier when we</div><div class='add'>+	 * acquired a reference.</div><div class='add'>+	 *</div><div class='add'>+	 * This is paired with the write barrier from assigning to the</div><div class='add'>+	 * __rcu protected file pointer so that if that pointer still</div><div class='add'>+	 * matches the current file, we know we have successfully</div><div class='add'>+	 * acquired a reference to the right file.</div><div class='add'>+	 *</div><div class='add'>+	 * If the pointers don't match the file has been reallocated by</div><div class='add'>+	 * SLAB_TYPESAFE_BY_RCU.</div><div class='add'>+	 */</div><div class='add'>+	if (file == file_reloaded_cmp)</div><div class='add'>+		return file_reloaded;</div><div class='add'>+</div><div class='add'>+	fput(file);</div><div class='add'>+	return ERR_PTR(-EAGAIN);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * get_file_rcu - try go get a reference to a file under rcu</div><div class='add'>+ * @f: the file to get a reference on</div><div class='add'>+ *</div><div class='add'>+ * This function tries to get a reference on @f carefully verifying that</div><div class='add'>+ * @f hasn't been reused.</div><div class='add'>+ *</div><div class='add'>+ * This function should rarely have to be used and only by users who</div><div class='add'>+ * understand the implications of SLAB_TYPESAFE_BY_RCU. Try to avoid it.</div><div class='add'>+ *</div><div class='add'>+ * Return: Returns @f with the reference count increased or NULL.</div><div class='add'>+ */</div><div class='add'>+struct file *get_file_rcu(struct file __rcu **f)</div><div class='add'>+{</div><div class='add'>+	for (;;) {</div><div class='add'>+		struct file __rcu *file;</div><div class='add'>+</div><div class='add'>+		file = __get_file_rcu(f);</div><div class='add'>+		if (!IS_ERR(file))</div><div class='add'>+			return file;</div><div class='ctx'> 	}</div><div class='del'>-	rcu_read_unlock();</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(get_file_rcu);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * get_file_active - try go get a reference to a file</div><div class='add'>+ * @f: the file to get a reference on</div><div class='add'>+ *</div><div class='add'>+ * In contast to get_file_rcu() the pointer itself isn't part of the</div><div class='add'>+ * reference counting.</div><div class='add'>+ *</div><div class='add'>+ * This function should rarely have to be used and only by users who</div><div class='add'>+ * understand the implications of SLAB_TYPESAFE_BY_RCU. Try to avoid it.</div><div class='add'>+ *</div><div class='add'>+ * Return: Returns @f with the reference count increased or NULL.</div><div class='add'>+ */</div><div class='add'>+struct file *get_file_active(struct file **f)</div><div class='add'>+{</div><div class='add'>+	struct file __rcu *file;</div><div class='ctx'> </div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	file = __get_file_rcu(f);</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+	if (IS_ERR(file))</div><div class='add'>+		file = NULL;</div><div class='ctx'> 	return file;</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL_GPL(get_file_active);</div><div class='ctx'> </div><div class='del'>-static inline struct file *__fget(unsigned int fd, fmode_t mask,</div><div class='del'>-				  unsigned int refs)</div><div class='add'>+static inline struct file *__fget_files_rcu(struct files_struct *files,</div><div class='add'>+       unsigned int fd, fmode_t mask)</div><div class='ctx'> {</div><div class='del'>-	return __fget_files(current-&gt;files, fd, mask, refs);</div><div class='add'>+	for (;;) {</div><div class='add'>+		struct file *file;</div><div class='add'>+		struct fdtable *fdt = rcu_dereference_raw(files-&gt;fdt);</div><div class='add'>+		struct file __rcu **fdentry;</div><div class='add'>+		unsigned long nospec_mask;</div><div class='add'>+</div><div class='add'>+		/* Mask is a 0 for invalid fd's, ~0 for valid ones */</div><div class='add'>+		nospec_mask = array_index_mask_nospec(fd, fdt-&gt;max_fds);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * fdentry points to the 'fd' offset, or fdt-&gt;fd[0].</div><div class='add'>+		 * Loading from fdt-&gt;fd[0] is always safe, because the</div><div class='add'>+		 * array always exists.</div><div class='add'>+		 */</div><div class='add'>+		fdentry = fdt-&gt;fd + (fd &amp; nospec_mask);</div><div class='add'>+</div><div class='add'>+		/* Do the load, then mask any invalid result */</div><div class='add'>+		file = rcu_dereference_raw(*fdentry);</div><div class='add'>+		file = (void *)(nospec_mask &amp; (unsigned long)file);</div><div class='add'>+		if (unlikely(!file))</div><div class='add'>+			return NULL;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Ok, we have a file pointer that was valid at</div><div class='add'>+		 * some point, but it might have become stale since.</div><div class='add'>+		 *</div><div class='add'>+		 * We need to confirm it by incrementing the refcount</div><div class='add'>+		 * and then check the lookup again.</div><div class='add'>+		 *</div><div class='add'>+		 * file_ref_get() gives us a full memory barrier. We</div><div class='add'>+		 * only really need an 'acquire' one to protect the</div><div class='add'>+		 * loads below, but we don't have that.</div><div class='add'>+		 */</div><div class='add'>+		if (unlikely(!file_ref_get(&amp;file-&gt;f_ref)))</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Such a race can take two forms:</div><div class='add'>+		 *</div><div class='add'>+		 *  (a) the file ref already went down to zero and the</div><div class='add'>+		 *      file hasn't been reused yet or the file count</div><div class='add'>+		 *      isn't zero but the file has already been reused.</div><div class='add'>+		 *</div><div class='add'>+		 *  (b) the file table entry has changed under us.</div><div class='add'>+		 *       Note that we don't need to re-check the 'fdt-&gt;fd'</div><div class='add'>+		 *       pointer having changed, because it always goes</div><div class='add'>+		 *       hand-in-hand with 'fdt'.</div><div class='add'>+		 *</div><div class='add'>+		 * If so, we need to put our ref and try again.</div><div class='add'>+		 */</div><div class='add'>+		if (unlikely(file != rcu_dereference_raw(*fdentry)) ||</div><div class='add'>+		    unlikely(rcu_dereference_raw(files-&gt;fdt) != fdt)) {</div><div class='add'>+			fput(file);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * This isn't the file we're looking for or we're not</div><div class='add'>+		 * allowed to get a reference to it.</div><div class='add'>+		 */</div><div class='add'>+		if (unlikely(file-&gt;f_mode &amp; mask)) {</div><div class='add'>+			fput(file);</div><div class='add'>+			return NULL;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Ok, we have a ref to the file, and checked that it</div><div class='add'>+		 * still exists.</div><div class='add'>+		 */</div><div class='add'>+		return file;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct file *__fget_files(struct files_struct *files, unsigned int fd,</div><div class='add'>+				 fmode_t mask)</div><div class='add'>+{</div><div class='add'>+	struct file *file;</div><div class='add'>+</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	file = __fget_files_rcu(files, fd, mask);</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+</div><div class='add'>+	return file;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct file *fget_many(unsigned int fd, unsigned int refs)</div><div class='add'>+static inline struct file *__fget(unsigned int fd, fmode_t mask)</div><div class='ctx'> {</div><div class='del'>-	return __fget(fd, FMODE_PATH, refs);</div><div class='add'>+	return __fget_files(current-&gt;files, fd, mask);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct file *fget(unsigned int fd)</div><div class='ctx'> {</div><div class='del'>-	return __fget(fd, FMODE_PATH, 1);</div><div class='add'>+	return __fget(fd, FMODE_PATH);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(fget);</div><div class='ctx'> </div><div class='ctx'> struct file *fget_raw(unsigned int fd)</div><div class='ctx'> {</div><div class='del'>-	return __fget(fd, 0, 1);</div><div class='add'>+	return __fget(fd, 0);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(fget_raw);</div><div class='ctx'> </div><div class='hunk'>@@ -893,28 +1120,13 @@ struct file *fget_task(struct task_struct *task, unsigned int fd)</div><div class='ctx'> </div><div class='ctx'> 	task_lock(task);</div><div class='ctx'> 	if (task-&gt;files)</div><div class='del'>-		file = __fget_files(task-&gt;files, fd, 0, 1);</div><div class='del'>-	task_unlock(task);</div><div class='del'>-</div><div class='del'>-	return file;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct file *task_lookup_fd_rcu(struct task_struct *task, unsigned int fd)</div><div class='del'>-{</div><div class='del'>-	/* Must be called with rcu_read_lock held */</div><div class='del'>-	struct files_struct *files;</div><div class='del'>-	struct file *file = NULL;</div><div class='del'>-</div><div class='del'>-	task_lock(task);</div><div class='del'>-	files = task-&gt;files;</div><div class='del'>-	if (files)</div><div class='del'>-		file = files_lookup_fd_rcu(files, fd);</div><div class='add'>+		file = __fget_files(task-&gt;files, fd, 0);</div><div class='ctx'> 	task_unlock(task);</div><div class='ctx'> </div><div class='ctx'> 	return file;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct file *task_lookup_next_fd_rcu(struct task_struct *task, unsigned int *ret_fd)</div><div class='add'>+struct file *fget_task_next(struct task_struct *task, unsigned int *ret_fd)</div><div class='ctx'> {</div><div class='ctx'> 	/* Must be called with rcu_read_lock held */</div><div class='ctx'> 	struct files_struct *files;</div><div class='hunk'>@@ -924,16 +1136,19 @@ struct file *task_lookup_next_fd_rcu(struct task_struct *task, unsigned int *ret</div><div class='ctx'> 	task_lock(task);</div><div class='ctx'> 	files = task-&gt;files;</div><div class='ctx'> 	if (files) {</div><div class='add'>+		rcu_read_lock();</div><div class='ctx'> 		for (; fd &lt; files_fdtable(files)-&gt;max_fds; fd++) {</div><div class='del'>-			file = files_lookup_fd_rcu(files, fd);</div><div class='add'>+			file = __fget_files_rcu(files, fd, 0);</div><div class='ctx'> 			if (file)</div><div class='ctx'> 				break;</div><div class='ctx'> 		}</div><div class='add'>+		rcu_read_unlock();</div><div class='ctx'> 	}</div><div class='ctx'> 	task_unlock(task);</div><div class='ctx'> 	*ret_fd = fd;</div><div class='ctx'> 	return file;</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL(fget_task_next);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Lightweight file lookup - no refcnt increment if fd table isn't shared.</div><div class='hunk'>@@ -950,47 +1165,96 @@ struct file *task_lookup_next_fd_rcu(struct task_struct *task, unsigned int *ret</div><div class='ctx'>  *</div><div class='ctx'>  * The fput_needed flag returned by fget_light should be passed to the</div><div class='ctx'>  * corresponding fput_light.</div><div class='add'>+ *</div><div class='add'>+ * (As an exception to rule 2, you can call filp_close between fget_light and</div><div class='add'>+ * fput_light provided that you capture a real refcount with get_file before</div><div class='add'>+ * the call to filp_close, and ensure that this real refcount is fput *after*</div><div class='add'>+ * the fput_light call.)</div><div class='add'>+ *</div><div class='add'>+ * See also the documentation in rust/kernel/file.rs.</div><div class='ctx'>  */</div><div class='del'>-static unsigned long __fget_light(unsigned int fd, fmode_t mask)</div><div class='add'>+static inline struct fd __fget_light(unsigned int fd, fmode_t mask)</div><div class='ctx'> {</div><div class='ctx'> 	struct files_struct *files = current-&gt;files;</div><div class='ctx'> 	struct file *file;</div><div class='ctx'> </div><div class='del'>-	if (atomic_read(&amp;files-&gt;count) == 1) {</div><div class='add'>+	/*</div><div class='add'>+	 * If another thread is concurrently calling close_fd() followed</div><div class='add'>+	 * by put_files_struct(), we must not observe the old table</div><div class='add'>+	 * entry combined with the new refcount - otherwise we could</div><div class='add'>+	 * return a file that is concurrently being freed.</div><div class='add'>+	 *</div><div class='add'>+	 * atomic_read_acquire() pairs with atomic_dec_and_test() in</div><div class='add'>+	 * put_files_struct().</div><div class='add'>+	 */</div><div class='add'>+	if (likely(atomic_read_acquire(&amp;files-&gt;count) == 1)) {</div><div class='ctx'> 		file = files_lookup_fd_raw(files, fd);</div><div class='ctx'> 		if (!file || unlikely(file-&gt;f_mode &amp; mask))</div><div class='del'>-			return 0;</div><div class='del'>-		return (unsigned long)file;</div><div class='add'>+			return EMPTY_FD;</div><div class='add'>+		return BORROWED_FD(file);</div><div class='ctx'> 	} else {</div><div class='del'>-		file = __fget(fd, mask, 1);</div><div class='add'>+		file = __fget_files(files, fd, mask);</div><div class='ctx'> 		if (!file)</div><div class='del'>-			return 0;</div><div class='del'>-		return FDPUT_FPUT | (unsigned long)file;</div><div class='add'>+			return EMPTY_FD;</div><div class='add'>+		return CLONED_FD(file);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='del'>-unsigned long __fdget(unsigned int fd)</div><div class='add'>+struct fd fdget(unsigned int fd)</div><div class='ctx'> {</div><div class='ctx'> 	return __fget_light(fd, FMODE_PATH);</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(__fdget);</div><div class='add'>+EXPORT_SYMBOL(fdget);</div><div class='ctx'> </div><div class='del'>-unsigned long __fdget_raw(unsigned int fd)</div><div class='add'>+struct fd fdget_raw(unsigned int fd)</div><div class='ctx'> {</div><div class='ctx'> 	return __fget_light(fd, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-unsigned long __fdget_pos(unsigned int fd)</div><div class='add'>+/*</div><div class='add'>+ * Try to avoid f_pos locking. We only need it if the</div><div class='add'>+ * file is marked for FMODE_ATOMIC_POS, and it can be</div><div class='add'>+ * accessed multiple ways.</div><div class='add'>+ *</div><div class='add'>+ * Always do it for directories, because pidfd_getfd()</div><div class='add'>+ * can make a file accessible even if it otherwise would</div><div class='add'>+ * not be, and for directories this is a correctness</div><div class='add'>+ * issue, not a "POSIX requirement".</div><div class='add'>+ */</div><div class='add'>+static inline bool file_needs_f_pos_lock(struct file *file)</div><div class='add'>+{</div><div class='add'>+	if (!(file-&gt;f_mode &amp; FMODE_ATOMIC_POS))</div><div class='add'>+		return false;</div><div class='add'>+	if (__file_ref_read_raw(&amp;file-&gt;f_ref) != FILE_REF_ONEREF)</div><div class='add'>+		return true;</div><div class='add'>+	if (file-&gt;f_op-&gt;iterate_shared)</div><div class='add'>+		return true;</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool file_seek_cur_needs_f_lock(struct file *file)</div><div class='ctx'> {</div><div class='del'>-	unsigned long v = __fdget(fd);</div><div class='del'>-	struct file *file = (struct file *)(v &amp; ~3);</div><div class='add'>+	if (!(file-&gt;f_mode &amp; FMODE_ATOMIC_POS) &amp;&amp; !file-&gt;f_op-&gt;iterate_shared)</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-	if (file &amp;&amp; (file-&gt;f_mode &amp; FMODE_ATOMIC_POS)) {</div><div class='del'>-		if (file_count(file) &gt; 1) {</div><div class='del'>-			v |= FDPUT_POS_UNLOCK;</div><div class='del'>-			mutex_lock(&amp;file-&gt;f_pos_lock);</div><div class='del'>-		}</div><div class='add'>+	/*</div><div class='add'>+	 * Note that we are not guaranteed to be called after fdget_pos() on</div><div class='add'>+	 * this file obj, in which case the caller is expected to provide the</div><div class='add'>+	 * appropriate locking.</div><div class='add'>+	 */</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct fd fdget_pos(unsigned int fd)</div><div class='add'>+{</div><div class='add'>+	struct fd f = fdget(fd);</div><div class='add'>+	struct file *file = fd_file(f);</div><div class='add'>+</div><div class='add'>+	if (likely(file) &amp;&amp; file_needs_f_pos_lock(file)) {</div><div class='add'>+		f.word |= FDPUT_POS_UNLOCK;</div><div class='add'>+		mutex_lock(&amp;file-&gt;f_pos_lock);</div><div class='ctx'> 	}</div><div class='del'>-	return v;</div><div class='add'>+	return f;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void __f_unlock_pos(struct file *f)</div><div class='hunk'>@@ -1007,24 +1271,16 @@ void __f_unlock_pos(struct file *f)</div><div class='ctx'> void set_close_on_exec(unsigned int fd, int flag)</div><div class='ctx'> {</div><div class='ctx'> 	struct files_struct *files = current-&gt;files;</div><div class='del'>-	struct fdtable *fdt;</div><div class='ctx'> 	spin_lock(&amp;files-&gt;file_lock);</div><div class='del'>-	fdt = files_fdtable(files);</div><div class='del'>-	if (flag)</div><div class='del'>-		__set_close_on_exec(fd, fdt);</div><div class='del'>-	else</div><div class='del'>-		__clear_close_on_exec(fd, fdt);</div><div class='add'>+	__set_close_on_exec(fd, files_fdtable(files), flag);</div><div class='ctx'> 	spin_unlock(&amp;files-&gt;file_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> bool get_close_on_exec(unsigned int fd)</div><div class='ctx'> {</div><div class='del'>-	struct files_struct *files = current-&gt;files;</div><div class='del'>-	struct fdtable *fdt;</div><div class='ctx'> 	bool res;</div><div class='ctx'> 	rcu_read_lock();</div><div class='del'>-	fdt = files_fdtable(files);</div><div class='del'>-	res = close_on_exec(fd, fdt);</div><div class='add'>+	res = close_on_exec(fd, current-&gt;files);</div><div class='ctx'> 	rcu_read_unlock();</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='hunk'>@@ -1037,30 +1293,39 @@ __releases(&amp;files-&gt;file_lock)</div><div class='ctx'> 	struct fdtable *fdt;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * We need to detect attempts to do dup2() over allocated but still</div><div class='del'>-	 * not finished descriptor.  NB: OpenBSD avoids that at the price of</div><div class='del'>-	 * extra work in their equivalent of fget() - they insert struct</div><div class='del'>-	 * file immediately after grabbing descriptor, mark it larval if</div><div class='del'>-	 * more work (e.g. actual opening) is needed and make sure that</div><div class='del'>-	 * fget() treats larval files as absent.  Potentially interesting,</div><div class='del'>-	 * but while extra work in fget() is trivial, locking implications</div><div class='del'>-	 * and amount of surgery on open()-related paths in VFS are not.</div><div class='del'>-	 * FreeBSD fails with -EBADF in the same situation, NetBSD "solution"</div><div class='del'>-	 * deadlocks in rather amusing ways, AFAICS.  All of that is out of</div><div class='del'>-	 * scope of POSIX or SUS, since neither considers shared descriptor</div><div class='del'>-	 * tables and this condition does not arise without those.</div><div class='add'>+	 * dup2() is expected to close the file installed in the target fd slot</div><div class='add'>+	 * (if any). However, userspace hand-picking a fd may be racing against</div><div class='add'>+	 * its own threads which happened to allocate it in open() et al but did</div><div class='add'>+	 * not populate it yet.</div><div class='add'>+	 *</div><div class='add'>+	 * Broadly speaking we may be racing against the following:</div><div class='add'>+	 * fd = get_unused_fd_flags();     // fd slot reserved, -&gt;fd[fd] == NULL</div><div class='add'>+	 * file = hard_work_goes_here();</div><div class='add'>+	 * fd_install(fd, file);           // only now -&gt;fd[fd] == file</div><div class='add'>+	 *</div><div class='add'>+	 * It is an invariant that a successfully allocated fd has a NULL entry</div><div class='add'>+	 * in the array until the matching fd_install().</div><div class='add'>+	 *</div><div class='add'>+	 * If we fit the window, we have the fd to populate, yet no target file</div><div class='add'>+	 * to close. Trying to ignore it and install our new file would violate</div><div class='add'>+	 * the invariant and make fd_install() overwrite our file.</div><div class='add'>+	 *</div><div class='add'>+	 * Things can be done(tm) to handle this. However, the issue does not</div><div class='add'>+	 * concern legitimate programs and we only need to make sure the kernel</div><div class='add'>+	 * does not trip over it.</div><div class='add'>+	 *</div><div class='add'>+	 * The simplest way out is to return an error if we find ourselves here.</div><div class='add'>+	 *</div><div class='add'>+	 * POSIX is silent on the issue, we return -EBUSY.</div><div class='ctx'> 	 */</div><div class='ctx'> 	fdt = files_fdtable(files);</div><div class='del'>-	tofree = fdt-&gt;fd[fd];</div><div class='add'>+	fd = array_index_nospec(fd, fdt-&gt;max_fds);</div><div class='add'>+	tofree = rcu_dereference_raw(fdt-&gt;fd[fd]);</div><div class='ctx'> 	if (!tofree &amp;&amp; fd_is_open(fd, fdt))</div><div class='ctx'> 		goto Ebusy;</div><div class='ctx'> 	get_file(file);</div><div class='ctx'> 	rcu_assign_pointer(fdt-&gt;fd[fd], file);</div><div class='del'>-	__set_open_fd(fd, fdt);</div><div class='del'>-	if (flags &amp; O_CLOEXEC)</div><div class='del'>-		__set_close_on_exec(fd, fdt);</div><div class='del'>-	else</div><div class='del'>-		__clear_close_on_exec(fd, fdt);</div><div class='add'>+	__set_open_fd(fd, fdt, flags &amp; O_CLOEXEC);</div><div class='ctx'> 	spin_unlock(&amp;files-&gt;file_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (tofree)</div><div class='hunk'>@@ -1088,7 +1353,10 @@ int replace_fd(unsigned fd, struct file *file, unsigned flags)</div><div class='ctx'> 	err = expand_files(files, fd);</div><div class='ctx'> 	if (unlikely(err &lt; 0))</div><div class='ctx'> 		goto out_unlock;</div><div class='del'>-	return do_dup2(files, file, fd, flags);</div><div class='add'>+	err = do_dup2(files, file, fd, flags);</div><div class='add'>+	if (err &lt; 0)</div><div class='add'>+		return err;</div><div class='add'>+	return 0;</div><div class='ctx'> </div><div class='ctx'> out_unlock:</div><div class='ctx'> 	spin_unlock(&amp;files-&gt;file_lock);</div><div class='hunk'>@@ -1096,7 +1364,7 @@ out_unlock:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * __receive_fd() - Install received file into file descriptor table</div><div class='add'>+ * receive_fd() - Install received file into file descriptor table</div><div class='ctx'>  * @file: struct file that was received from another process</div><div class='ctx'>  * @ufd: __user pointer to write new fd number to</div><div class='ctx'>  * @o_flags: the O_* flags to apply to the new fd entry</div><div class='hunk'>@@ -1110,31 +1378,29 @@ out_unlock:</div><div class='ctx'>  *</div><div class='ctx'>  * Returns newly install fd or -ve on error.</div><div class='ctx'>  */</div><div class='del'>-int __receive_fd(struct file *file, int __user *ufd, unsigned int o_flags)</div><div class='add'>+int receive_fd(struct file *file, int __user *ufd, unsigned int o_flags)</div><div class='ctx'> {</div><div class='del'>-	int new_fd;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='ctx'> 	error = security_file_receive(file);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='del'>-	new_fd = get_unused_fd_flags(o_flags);</div><div class='del'>-	if (new_fd &lt; 0)</div><div class='del'>-		return new_fd;</div><div class='add'>+	FD_PREPARE(fdf, o_flags, file);</div><div class='add'>+	if (fdf.err)</div><div class='add'>+		return fdf.err;</div><div class='add'>+	get_file(file);</div><div class='ctx'> </div><div class='ctx'> 	if (ufd) {</div><div class='del'>-		error = put_user(new_fd, ufd);</div><div class='del'>-		if (error) {</div><div class='del'>-			put_unused_fd(new_fd);</div><div class='add'>+		error = put_user(fd_prepare_fd(fdf), ufd);</div><div class='add'>+		if (error)</div><div class='ctx'> 			return error;</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	fd_install(new_fd, get_file(file));</div><div class='del'>-	__receive_sock(file);</div><div class='del'>-	return new_fd;</div><div class='add'>+	__receive_sock(fd_prepare_file(fdf));</div><div class='add'>+	return fd_publish(fdf);</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL_GPL(receive_fd);</div><div class='ctx'> </div><div class='ctx'> int receive_fd_replace(int new_fd, struct file *file, unsigned int o_flags)</div><div class='ctx'> {</div><div class='hunk'>@@ -1150,12 +1416,6 @@ int receive_fd_replace(int new_fd, struct file *file, unsigned int o_flags)</div><div class='ctx'> 	return new_fd;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int receive_fd(struct file *file, unsigned int o_flags)</div><div class='del'>-{</div><div class='del'>-	return __receive_fd(file, NULL, o_flags);</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL_GPL(receive_fd);</div><div class='del'>-</div><div class='ctx'> static int ksys_dup3(unsigned int oldfd, unsigned int newfd, int flags)</div><div class='ctx'> {</div><div class='ctx'> 	int err = -EBADF;</div><div class='hunk'>@@ -1199,12 +1459,16 @@ SYSCALL_DEFINE2(dup2, unsigned int, oldfd, unsigned int, newfd)</div><div class='ctx'> {</div><div class='ctx'> 	if (unlikely(newfd == oldfd)) { /* corner case */</div><div class='ctx'> 		struct files_struct *files = current-&gt;files;</div><div class='add'>+		struct file *f;</div><div class='ctx'> 		int retval = oldfd;</div><div class='ctx'> </div><div class='ctx'> 		rcu_read_lock();</div><div class='del'>-		if (!files_lookup_fd_rcu(files, oldfd))</div><div class='add'>+		f = __fget_files_rcu(files, oldfd, 0);</div><div class='add'>+		if (!f)</div><div class='ctx'> 			retval = -EBADF;</div><div class='ctx'> 		rcu_read_unlock();</div><div class='add'>+		if (f)</div><div class='add'>+			fput(f);</div><div class='ctx'> 		return retval;</div><div class='ctx'> 	}</div><div class='ctx'> 	return ksys_dup3(oldfd, newfd, 0);</div><div class='head'>diff --git a/fs/file_attr.c b/fs/file_attr.c<br/>new file mode 100644<br/>index 000000000000..4c4916632f11<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/file_attr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/file_attr.c</a></div><div class='hunk'>@@ -0,0 +1,490 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+#include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/security.h&gt;</div><div class='add'>+#include &lt;linux/fscrypt.h&gt;</div><div class='add'>+#include &lt;linux/fileattr.h&gt;</div><div class='add'>+#include &lt;linux/export.h&gt;</div><div class='add'>+#include &lt;linux/syscalls.h&gt;</div><div class='add'>+#include &lt;linux/namei.h&gt;</div><div class='add'>+</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fileattr_fill_xflags - initialize fileattr with xflags</div><div class='add'>+ * @fa:		fileattr pointer</div><div class='add'>+ * @xflags:	FS_XFLAG_* flags</div><div class='add'>+ *</div><div class='add'>+ * Set -&gt;fsx_xflags, -&gt;fsx_valid and -&gt;flags (translated xflags).  All</div><div class='add'>+ * other fields are zeroed.</div><div class='add'>+ */</div><div class='add'>+void fileattr_fill_xflags(struct file_kattr *fa, u32 xflags)</div><div class='add'>+{</div><div class='add'>+	memset(fa, 0, sizeof(*fa));</div><div class='add'>+	fa-&gt;fsx_valid = true;</div><div class='add'>+	fa-&gt;fsx_xflags = xflags;</div><div class='add'>+	if (fa-&gt;fsx_xflags &amp; FS_XFLAG_IMMUTABLE)</div><div class='add'>+		fa-&gt;flags |= FS_IMMUTABLE_FL;</div><div class='add'>+	if (fa-&gt;fsx_xflags &amp; FS_XFLAG_APPEND)</div><div class='add'>+		fa-&gt;flags |= FS_APPEND_FL;</div><div class='add'>+	if (fa-&gt;fsx_xflags &amp; FS_XFLAG_SYNC)</div><div class='add'>+		fa-&gt;flags |= FS_SYNC_FL;</div><div class='add'>+	if (fa-&gt;fsx_xflags &amp; FS_XFLAG_NOATIME)</div><div class='add'>+		fa-&gt;flags |= FS_NOATIME_FL;</div><div class='add'>+	if (fa-&gt;fsx_xflags &amp; FS_XFLAG_NODUMP)</div><div class='add'>+		fa-&gt;flags |= FS_NODUMP_FL;</div><div class='add'>+	if (fa-&gt;fsx_xflags &amp; FS_XFLAG_DAX)</div><div class='add'>+		fa-&gt;flags |= FS_DAX_FL;</div><div class='add'>+	if (fa-&gt;fsx_xflags &amp; FS_XFLAG_PROJINHERIT)</div><div class='add'>+		fa-&gt;flags |= FS_PROJINHERIT_FL;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(fileattr_fill_xflags);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fileattr_fill_flags - initialize fileattr with flags</div><div class='add'>+ * @fa:		fileattr pointer</div><div class='add'>+ * @flags:	FS_*_FL flags</div><div class='add'>+ *</div><div class='add'>+ * Set -&gt;flags, -&gt;flags_valid and -&gt;fsx_xflags (translated flags).</div><div class='add'>+ * All other fields are zeroed.</div><div class='add'>+ */</div><div class='add'>+void fileattr_fill_flags(struct file_kattr *fa, u32 flags)</div><div class='add'>+{</div><div class='add'>+	memset(fa, 0, sizeof(*fa));</div><div class='add'>+	fa-&gt;flags_valid = true;</div><div class='add'>+	fa-&gt;flags = flags;</div><div class='add'>+	if (fa-&gt;flags &amp; FS_SYNC_FL)</div><div class='add'>+		fa-&gt;fsx_xflags |= FS_XFLAG_SYNC;</div><div class='add'>+	if (fa-&gt;flags &amp; FS_IMMUTABLE_FL)</div><div class='add'>+		fa-&gt;fsx_xflags |= FS_XFLAG_IMMUTABLE;</div><div class='add'>+	if (fa-&gt;flags &amp; FS_APPEND_FL)</div><div class='add'>+		fa-&gt;fsx_xflags |= FS_XFLAG_APPEND;</div><div class='add'>+	if (fa-&gt;flags &amp; FS_NODUMP_FL)</div><div class='add'>+		fa-&gt;fsx_xflags |= FS_XFLAG_NODUMP;</div><div class='add'>+	if (fa-&gt;flags &amp; FS_NOATIME_FL)</div><div class='add'>+		fa-&gt;fsx_xflags |= FS_XFLAG_NOATIME;</div><div class='add'>+	if (fa-&gt;flags &amp; FS_DAX_FL)</div><div class='add'>+		fa-&gt;fsx_xflags |= FS_XFLAG_DAX;</div><div class='add'>+	if (fa-&gt;flags &amp; FS_PROJINHERIT_FL)</div><div class='add'>+		fa-&gt;fsx_xflags |= FS_XFLAG_PROJINHERIT;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(fileattr_fill_flags);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * vfs_fileattr_get - retrieve miscellaneous file attributes</div><div class='add'>+ * @dentry:	the object to retrieve from</div><div class='add'>+ * @fa:		fileattr pointer</div><div class='add'>+ *</div><div class='add'>+ * Call i_op-&gt;fileattr_get() callback, if exists.</div><div class='add'>+ *</div><div class='add'>+ * Return: 0 on success, or a negative error on failure.</div><div class='add'>+ */</div><div class='add'>+int vfs_fileattr_get(struct dentry *dentry, struct file_kattr *fa)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='add'>+	int error;</div><div class='add'>+</div><div class='add'>+	if (!inode-&gt;i_op-&gt;fileattr_get)</div><div class='add'>+		return -ENOIOCTLCMD;</div><div class='add'>+</div><div class='add'>+	error = security_inode_file_getattr(dentry, fa);</div><div class='add'>+	if (error)</div><div class='add'>+		return error;</div><div class='add'>+</div><div class='add'>+	return inode-&gt;i_op-&gt;fileattr_get(dentry, fa);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(vfs_fileattr_get);</div><div class='add'>+</div><div class='add'>+static void fileattr_to_file_attr(const struct file_kattr *fa,</div><div class='add'>+				  struct file_attr *fattr)</div><div class='add'>+{</div><div class='add'>+	__u32 mask = FS_XFLAGS_MASK;</div><div class='add'>+</div><div class='add'>+	memset(fattr, 0, sizeof(struct file_attr));</div><div class='add'>+	fattr-&gt;fa_xflags = fa-&gt;fsx_xflags &amp; mask;</div><div class='add'>+	fattr-&gt;fa_extsize = fa-&gt;fsx_extsize;</div><div class='add'>+	fattr-&gt;fa_nextents = fa-&gt;fsx_nextents;</div><div class='add'>+	fattr-&gt;fa_projid = fa-&gt;fsx_projid;</div><div class='add'>+	fattr-&gt;fa_cowextsize = fa-&gt;fsx_cowextsize;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * copy_fsxattr_to_user - copy fsxattr to userspace.</div><div class='add'>+ * @fa:		fileattr pointer</div><div class='add'>+ * @ufa:	fsxattr user pointer</div><div class='add'>+ *</div><div class='add'>+ * Return: 0 on success, or -EFAULT on failure.</div><div class='add'>+ */</div><div class='add'>+int copy_fsxattr_to_user(const struct file_kattr *fa, struct fsxattr __user *ufa)</div><div class='add'>+{</div><div class='add'>+	struct fsxattr xfa;</div><div class='add'>+	__u32 mask = FS_XFLAGS_MASK;</div><div class='add'>+</div><div class='add'>+	memset(&amp;xfa, 0, sizeof(xfa));</div><div class='add'>+	xfa.fsx_xflags = fa-&gt;fsx_xflags &amp; mask;</div><div class='add'>+	xfa.fsx_extsize = fa-&gt;fsx_extsize;</div><div class='add'>+	xfa.fsx_nextents = fa-&gt;fsx_nextents;</div><div class='add'>+	xfa.fsx_projid = fa-&gt;fsx_projid;</div><div class='add'>+	xfa.fsx_cowextsize = fa-&gt;fsx_cowextsize;</div><div class='add'>+</div><div class='add'>+	if (copy_to_user(ufa, &amp;xfa, sizeof(xfa)))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(copy_fsxattr_to_user);</div><div class='add'>+</div><div class='add'>+static int file_attr_to_fileattr(const struct file_attr *fattr,</div><div class='add'>+				 struct file_kattr *fa)</div><div class='add'>+{</div><div class='add'>+	__u64 mask = FS_XFLAGS_MASK;</div><div class='add'>+</div><div class='add'>+	if (fattr-&gt;fa_xflags &amp; ~mask)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	fileattr_fill_xflags(fa, fattr-&gt;fa_xflags);</div><div class='add'>+	fa-&gt;fsx_xflags &amp;= ~FS_XFLAG_RDONLY_MASK;</div><div class='add'>+	fa-&gt;fsx_extsize = fattr-&gt;fa_extsize;</div><div class='add'>+	fa-&gt;fsx_projid = fattr-&gt;fa_projid;</div><div class='add'>+	fa-&gt;fsx_cowextsize = fattr-&gt;fa_cowextsize;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int copy_fsxattr_from_user(struct file_kattr *fa,</div><div class='add'>+				  struct fsxattr __user *ufa)</div><div class='add'>+{</div><div class='add'>+	struct fsxattr xfa;</div><div class='add'>+	__u32 mask = FS_XFLAGS_MASK;</div><div class='add'>+</div><div class='add'>+	if (copy_from_user(&amp;xfa, ufa, sizeof(xfa)))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+</div><div class='add'>+	if (xfa.fsx_xflags &amp; ~mask)</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+</div><div class='add'>+	fileattr_fill_xflags(fa, xfa.fsx_xflags);</div><div class='add'>+	fa-&gt;fsx_xflags &amp;= ~FS_XFLAG_RDONLY_MASK;</div><div class='add'>+	fa-&gt;fsx_extsize = xfa.fsx_extsize;</div><div class='add'>+	fa-&gt;fsx_nextents = xfa.fsx_nextents;</div><div class='add'>+	fa-&gt;fsx_projid = xfa.fsx_projid;</div><div class='add'>+	fa-&gt;fsx_cowextsize = xfa.fsx_cowextsize;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Generic function to check FS_IOC_FSSETXATTR/FS_IOC_SETFLAGS values and reject</div><div class='add'>+ * any invalid configurations.</div><div class='add'>+ *</div><div class='add'>+ * Note: must be called with inode lock held.</div><div class='add'>+ */</div><div class='add'>+static int fileattr_set_prepare(struct inode *inode,</div><div class='add'>+			      const struct file_kattr *old_ma,</div><div class='add'>+			      struct file_kattr *fa)</div><div class='add'>+{</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The IMMUTABLE and APPEND_ONLY flags can only be changed by</div><div class='add'>+	 * the relevant capability.</div><div class='add'>+	 */</div><div class='add'>+	if ((fa-&gt;flags ^ old_ma-&gt;flags) &amp; (FS_APPEND_FL | FS_IMMUTABLE_FL) &amp;&amp;</div><div class='add'>+	    !capable(CAP_LINUX_IMMUTABLE))</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	err = fscrypt_prepare_setflags(inode, old_ma-&gt;flags, fa-&gt;flags);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Project Quota ID state is only allowed to change from within the init</div><div class='add'>+	 * namespace. Enforce that restriction only if we are trying to change</div><div class='add'>+	 * the quota ID state. Everything else is allowed in user namespaces.</div><div class='add'>+	 */</div><div class='add'>+	if (current_user_ns() != &amp;init_user_ns) {</div><div class='add'>+		if (old_ma-&gt;fsx_projid != fa-&gt;fsx_projid)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		if ((old_ma-&gt;fsx_xflags ^ fa-&gt;fsx_xflags) &amp;</div><div class='add'>+				FS_XFLAG_PROJINHERIT)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+	} else {</div><div class='add'>+		/*</div><div class='add'>+		 * Caller is allowed to change the project ID. If it is being</div><div class='add'>+		 * changed, make sure that the new value is valid.</div><div class='add'>+		 */</div><div class='add'>+		if (old_ma-&gt;fsx_projid != fa-&gt;fsx_projid &amp;&amp;</div><div class='add'>+		    !projid_valid(make_kprojid(&amp;init_user_ns, fa-&gt;fsx_projid)))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Check extent size hints. */</div><div class='add'>+	if ((fa-&gt;fsx_xflags &amp; FS_XFLAG_EXTSIZE) &amp;&amp; !S_ISREG(inode-&gt;i_mode))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	if ((fa-&gt;fsx_xflags &amp; FS_XFLAG_EXTSZINHERIT) &amp;&amp;</div><div class='add'>+			!S_ISDIR(inode-&gt;i_mode))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	if ((fa-&gt;fsx_xflags &amp; FS_XFLAG_COWEXTSIZE) &amp;&amp;</div><div class='add'>+	    !S_ISREG(inode-&gt;i_mode) &amp;&amp; !S_ISDIR(inode-&gt;i_mode))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * It is only valid to set the DAX flag on regular files and</div><div class='add'>+	 * directories on filesystems.</div><div class='add'>+	 */</div><div class='add'>+	if ((fa-&gt;fsx_xflags &amp; FS_XFLAG_DAX) &amp;&amp;</div><div class='add'>+	    !(S_ISREG(inode-&gt;i_mode) || S_ISDIR(inode-&gt;i_mode)))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	/* Extent size hints of zero turn off the flags. */</div><div class='add'>+	if (fa-&gt;fsx_extsize == 0)</div><div class='add'>+		fa-&gt;fsx_xflags &amp;= ~(FS_XFLAG_EXTSIZE | FS_XFLAG_EXTSZINHERIT);</div><div class='add'>+	if (fa-&gt;fsx_cowextsize == 0)</div><div class='add'>+		fa-&gt;fsx_xflags &amp;= ~FS_XFLAG_COWEXTSIZE;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * vfs_fileattr_set - change miscellaneous file attributes</div><div class='add'>+ * @idmap:	idmap of the mount</div><div class='add'>+ * @dentry:	the object to change</div><div class='add'>+ * @fa:		fileattr pointer</div><div class='add'>+ *</div><div class='add'>+ * After verifying permissions, call i_op-&gt;fileattr_set() callback, if</div><div class='add'>+ * exists.</div><div class='add'>+ *</div><div class='add'>+ * Verifying attributes involves retrieving current attributes with</div><div class='add'>+ * i_op-&gt;fileattr_get(), this also allows initializing attributes that have</div><div class='add'>+ * not been set by the caller to current values.  Inode lock is held</div><div class='add'>+ * thoughout to prevent racing with another instance.</div><div class='add'>+ *</div><div class='add'>+ * Return: 0 on success, or a negative error on failure.</div><div class='add'>+ */</div><div class='add'>+int vfs_fileattr_set(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='add'>+		     struct file_kattr *fa)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='add'>+	struct file_kattr old_ma = {};</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	if (!inode-&gt;i_op-&gt;fileattr_set)</div><div class='add'>+		return -ENOIOCTLCMD;</div><div class='add'>+</div><div class='add'>+	if (!inode_owner_or_capable(idmap, inode))</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	inode_lock(inode);</div><div class='add'>+	err = vfs_fileattr_get(dentry, &amp;old_ma);</div><div class='add'>+	if (!err) {</div><div class='add'>+		/* initialize missing bits from old_ma */</div><div class='add'>+		if (fa-&gt;flags_valid) {</div><div class='add'>+			fa-&gt;fsx_xflags |= old_ma.fsx_xflags &amp; ~FS_XFLAG_COMMON;</div><div class='add'>+			fa-&gt;fsx_extsize = old_ma.fsx_extsize;</div><div class='add'>+			fa-&gt;fsx_nextents = old_ma.fsx_nextents;</div><div class='add'>+			fa-&gt;fsx_projid = old_ma.fsx_projid;</div><div class='add'>+			fa-&gt;fsx_cowextsize = old_ma.fsx_cowextsize;</div><div class='add'>+		} else {</div><div class='add'>+			fa-&gt;flags |= old_ma.flags &amp; ~FS_COMMON_FL;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		err = fileattr_set_prepare(inode, &amp;old_ma, fa);</div><div class='add'>+		if (err)</div><div class='add'>+			goto out;</div><div class='add'>+		err = security_inode_file_setattr(dentry, fa);</div><div class='add'>+		if (err)</div><div class='add'>+			goto out;</div><div class='add'>+		err = inode-&gt;i_op-&gt;fileattr_set(idmap, dentry, fa);</div><div class='add'>+		if (err)</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	inode_unlock(inode);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(vfs_fileattr_set);</div><div class='add'>+</div><div class='add'>+int ioctl_getflags(struct file *file, unsigned int __user *argp)</div><div class='add'>+{</div><div class='add'>+	struct file_kattr fa = { .flags_valid = true }; /* hint only */</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = vfs_fileattr_get(file-&gt;f_path.dentry, &amp;fa);</div><div class='add'>+	if (!err)</div><div class='add'>+		err = put_user(fa.flags, argp);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int ioctl_setflags(struct file *file, unsigned int __user *argp)</div><div class='add'>+{</div><div class='add'>+	struct mnt_idmap *idmap = file_mnt_idmap(file);</div><div class='add'>+	struct dentry *dentry = file-&gt;f_path.dentry;</div><div class='add'>+	struct file_kattr fa;</div><div class='add'>+	unsigned int flags;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = get_user(flags, argp);</div><div class='add'>+	if (!err) {</div><div class='add'>+		err = mnt_want_write_file(file);</div><div class='add'>+		if (!err) {</div><div class='add'>+			fileattr_fill_flags(&amp;fa, flags);</div><div class='add'>+			err = vfs_fileattr_set(idmap, dentry, &amp;fa);</div><div class='add'>+			mnt_drop_write_file(file);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int ioctl_fsgetxattr(struct file *file, void __user *argp)</div><div class='add'>+{</div><div class='add'>+	struct file_kattr fa = { .fsx_valid = true }; /* hint only */</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = vfs_fileattr_get(file-&gt;f_path.dentry, &amp;fa);</div><div class='add'>+	if (!err)</div><div class='add'>+		err = copy_fsxattr_to_user(&amp;fa, argp);</div><div class='add'>+</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int ioctl_fssetxattr(struct file *file, void __user *argp)</div><div class='add'>+{</div><div class='add'>+	struct mnt_idmap *idmap = file_mnt_idmap(file);</div><div class='add'>+	struct dentry *dentry = file-&gt;f_path.dentry;</div><div class='add'>+	struct file_kattr fa;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = copy_fsxattr_from_user(&amp;fa, argp);</div><div class='add'>+	if (!err) {</div><div class='add'>+		err = mnt_want_write_file(file);</div><div class='add'>+		if (!err) {</div><div class='add'>+			err = vfs_fileattr_set(idmap, dentry, &amp;fa);</div><div class='add'>+			mnt_drop_write_file(file);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+SYSCALL_DEFINE5(file_getattr, int, dfd, const char __user *, filename,</div><div class='add'>+		struct file_attr __user *, ufattr, size_t, usize,</div><div class='add'>+		unsigned int, at_flags)</div><div class='add'>+{</div><div class='add'>+	struct path filepath __free(path_put) = {};</div><div class='add'>+	struct filename *name __free(putname) = NULL;</div><div class='add'>+	unsigned int lookup_flags = 0;</div><div class='add'>+	struct file_attr fattr;</div><div class='add'>+	struct file_kattr fa;</div><div class='add'>+	int error;</div><div class='add'>+</div><div class='add'>+	BUILD_BUG_ON(sizeof(struct file_attr) &lt; FILE_ATTR_SIZE_VER0);</div><div class='add'>+	BUILD_BUG_ON(sizeof(struct file_attr) != FILE_ATTR_SIZE_LATEST);</div><div class='add'>+</div><div class='add'>+	if ((at_flags &amp; ~(AT_SYMLINK_NOFOLLOW | AT_EMPTY_PATH)) != 0)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	if (!(at_flags &amp; AT_SYMLINK_NOFOLLOW))</div><div class='add'>+		lookup_flags |= LOOKUP_FOLLOW;</div><div class='add'>+</div><div class='add'>+	if (usize &gt; PAGE_SIZE)</div><div class='add'>+		return -E2BIG;</div><div class='add'>+</div><div class='add'>+	if (usize &lt; FILE_ATTR_SIZE_VER0)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	name = getname_maybe_null(filename, at_flags);</div><div class='add'>+	if (IS_ERR(name))</div><div class='add'>+		return PTR_ERR(name);</div><div class='add'>+</div><div class='add'>+	if (!name &amp;&amp; dfd &gt;= 0) {</div><div class='add'>+		CLASS(fd, f)(dfd);</div><div class='add'>+		if (fd_empty(f))</div><div class='add'>+			return -EBADF;</div><div class='add'>+</div><div class='add'>+		filepath = fd_file(f)-&gt;f_path;</div><div class='add'>+		path_get(&amp;filepath);</div><div class='add'>+	} else {</div><div class='add'>+		error = filename_lookup(dfd, name, lookup_flags, &amp;filepath,</div><div class='add'>+					NULL);</div><div class='add'>+		if (error)</div><div class='add'>+			return error;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	error = vfs_fileattr_get(filepath.dentry, &amp;fa);</div><div class='add'>+	if (error == -ENOIOCTLCMD || error == -ENOTTY)</div><div class='add'>+		error = -EOPNOTSUPP;</div><div class='add'>+	if (error)</div><div class='add'>+		return error;</div><div class='add'>+</div><div class='add'>+	fileattr_to_file_attr(&amp;fa, &amp;fattr);</div><div class='add'>+	error = copy_struct_to_user(ufattr, usize, &amp;fattr,</div><div class='add'>+				    sizeof(struct file_attr), NULL);</div><div class='add'>+</div><div class='add'>+	return error;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+SYSCALL_DEFINE5(file_setattr, int, dfd, const char __user *, filename,</div><div class='add'>+		struct file_attr __user *, ufattr, size_t, usize,</div><div class='add'>+		unsigned int, at_flags)</div><div class='add'>+{</div><div class='add'>+	struct path filepath __free(path_put) = {};</div><div class='add'>+	struct filename *name __free(putname) = NULL;</div><div class='add'>+	unsigned int lookup_flags = 0;</div><div class='add'>+	struct file_attr fattr;</div><div class='add'>+	struct file_kattr fa;</div><div class='add'>+	int error;</div><div class='add'>+</div><div class='add'>+	BUILD_BUG_ON(sizeof(struct file_attr) &lt; FILE_ATTR_SIZE_VER0);</div><div class='add'>+	BUILD_BUG_ON(sizeof(struct file_attr) != FILE_ATTR_SIZE_LATEST);</div><div class='add'>+</div><div class='add'>+	if ((at_flags &amp; ~(AT_SYMLINK_NOFOLLOW | AT_EMPTY_PATH)) != 0)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	if (!(at_flags &amp; AT_SYMLINK_NOFOLLOW))</div><div class='add'>+		lookup_flags |= LOOKUP_FOLLOW;</div><div class='add'>+</div><div class='add'>+	if (usize &gt; PAGE_SIZE)</div><div class='add'>+		return -E2BIG;</div><div class='add'>+</div><div class='add'>+	if (usize &lt; FILE_ATTR_SIZE_VER0)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	error = copy_struct_from_user(&amp;fattr, sizeof(struct file_attr), ufattr,</div><div class='add'>+				      usize);</div><div class='add'>+	if (error)</div><div class='add'>+		return error;</div><div class='add'>+</div><div class='add'>+	error = file_attr_to_fileattr(&amp;fattr, &amp;fa);</div><div class='add'>+	if (error)</div><div class='add'>+		return error;</div><div class='add'>+</div><div class='add'>+	name = getname_maybe_null(filename, at_flags);</div><div class='add'>+	if (IS_ERR(name))</div><div class='add'>+		return PTR_ERR(name);</div><div class='add'>+</div><div class='add'>+	if (!name &amp;&amp; dfd &gt;= 0) {</div><div class='add'>+		CLASS(fd, f)(dfd);</div><div class='add'>+		if (fd_empty(f))</div><div class='add'>+			return -EBADF;</div><div class='add'>+</div><div class='add'>+		filepath = fd_file(f)-&gt;f_path;</div><div class='add'>+		path_get(&amp;filepath);</div><div class='add'>+	} else {</div><div class='add'>+		error = filename_lookup(dfd, name, lookup_flags, &amp;filepath,</div><div class='add'>+					NULL);</div><div class='add'>+		if (error)</div><div class='add'>+			return error;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	error = mnt_want_write(filepath.mnt);</div><div class='add'>+	if (!error) {</div><div class='add'>+		error = vfs_fileattr_set(mnt_idmap(filepath.mnt),</div><div class='add'>+					 filepath.dentry, &amp;fa);</div><div class='add'>+		if (error == -ENOIOCTLCMD || error == -ENOTTY)</div><div class='add'>+			error = -EOPNOTSUPP;</div><div class='add'>+		mnt_drop_write(filepath.mnt);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return error;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/file_table.c b/fs/file_table.c<br/>index 45437f8e1003..cd4a3db4659a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/file_table.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/file_table.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/file_table.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/file_table.c</a></div><div class='hunk'>@@ -9,10 +9,10 @@</div><div class='ctx'> #include &lt;linux/string.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/file.h&gt;</div><div class='del'>-#include &lt;linux/fdtable.h&gt;</div><div class='ctx'> #include &lt;linux/init.h&gt;</div><div class='ctx'> #include &lt;linux/module.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/filelock.h&gt;</div><div class='ctx'> #include &lt;linux/security.h&gt;</div><div class='ctx'> #include &lt;linux/cred.h&gt;</div><div class='ctx'> #include &lt;linux/eventpoll.h&gt;</div><div class='hunk'>@@ -25,37 +25,59 @@</div><div class='ctx'> #include &lt;linux/percpu_counter.h&gt;</div><div class='ctx'> #include &lt;linux/percpu.h&gt;</div><div class='ctx'> #include &lt;linux/task_work.h&gt;</div><div class='del'>-#include &lt;linux/ima.h&gt;</div><div class='ctx'> #include &lt;linux/swap.h&gt;</div><div class='add'>+#include &lt;linux/kmemleak.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/atomic.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "internal.h"</div><div class='ctx'> </div><div class='ctx'> /* sysctl tunables... */</div><div class='del'>-struct files_stat_struct files_stat = {</div><div class='add'>+static struct files_stat_struct files_stat = {</div><div class='ctx'> 	.max_files = NR_FILE</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /* SLAB cache for file structures */</div><div class='del'>-static struct kmem_cache *filp_cachep __read_mostly;</div><div class='add'>+static struct kmem_cache *filp_cachep __ro_after_init;</div><div class='add'>+static struct kmem_cache *bfilp_cachep __ro_after_init;</div><div class='ctx'> </div><div class='ctx'> static struct percpu_counter nr_files __cacheline_aligned_in_smp;</div><div class='ctx'> </div><div class='del'>-static void file_free_rcu(struct rcu_head *head)</div><div class='add'>+/* Container for backing file with optional user path */</div><div class='add'>+struct backing_file {</div><div class='add'>+	struct file file;</div><div class='add'>+	union {</div><div class='add'>+		struct path user_path;</div><div class='add'>+		freeptr_t bf_freeptr;</div><div class='add'>+	};</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+#define backing_file(f) container_of(f, struct backing_file, file)</div><div class='add'>+</div><div class='add'>+const struct path *backing_file_user_path(const struct file *f)</div><div class='ctx'> {</div><div class='del'>-	struct file *f = container_of(head, struct file, f_u.fu_rcuhead);</div><div class='add'>+	return &amp;backing_file(f)-&gt;user_path;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(backing_file_user_path);</div><div class='ctx'> </div><div class='del'>-	put_cred(f-&gt;f_cred);</div><div class='del'>-	kmem_cache_free(filp_cachep, f);</div><div class='add'>+void backing_file_set_user_path(struct file *f, const struct path *path)</div><div class='add'>+{</div><div class='add'>+	backing_file(f)-&gt;user_path = *path;</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL_GPL(backing_file_set_user_path);</div><div class='ctx'> </div><div class='ctx'> static inline void file_free(struct file *f)</div><div class='ctx'> {</div><div class='ctx'> 	security_file_free(f);</div><div class='del'>-	if (!(f-&gt;f_mode &amp; FMODE_NOACCOUNT))</div><div class='add'>+	if (likely(!(f-&gt;f_mode &amp; FMODE_NOACCOUNT)))</div><div class='ctx'> 		percpu_counter_dec(&amp;nr_files);</div><div class='del'>-	call_rcu(&amp;f-&gt;f_u.fu_rcuhead, file_free_rcu);</div><div class='add'>+	put_cred(f-&gt;f_cred);</div><div class='add'>+	if (unlikely(f-&gt;f_mode &amp; FMODE_BACKING)) {</div><div class='add'>+		path_put(backing_file_user_path(f));</div><div class='add'>+		kmem_cache_free(bfilp_cachep, backing_file(f));</div><div class='add'>+	} else {</div><div class='add'>+		kmem_cache_free(filp_cachep, f);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -75,49 +97,112 @@ unsigned long get_max_files(void)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(get_max_files);</div><div class='ctx'> </div><div class='add'>+#if defined(CONFIG_SYSCTL) &amp;&amp; defined(CONFIG_PROC_FS)</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Handle nr_files sysctl</div><div class='ctx'>  */</div><div class='del'>-#if defined(CONFIG_SYSCTL) &amp;&amp; defined(CONFIG_PROC_FS)</div><div class='del'>-int proc_nr_files(struct ctl_table *table, int write,</div><div class='del'>-                     void *buffer, size_t *lenp, loff_t *ppos)</div><div class='add'>+static int proc_nr_files(const struct ctl_table *table, int write, void *buffer,</div><div class='add'>+			 size_t *lenp, loff_t *ppos)</div><div class='ctx'> {</div><div class='del'>-	files_stat.nr_files = get_nr_files();</div><div class='add'>+	files_stat.nr_files = percpu_counter_sum_positive(&amp;nr_files);</div><div class='ctx'> 	return proc_doulongvec_minmax(table, write, buffer, lenp, ppos);</div><div class='ctx'> }</div><div class='del'>-#else</div><div class='del'>-int proc_nr_files(struct ctl_table *table, int write,</div><div class='del'>-                     void *buffer, size_t *lenp, loff_t *ppos)</div><div class='add'>+</div><div class='add'>+static const struct ctl_table fs_stat_sysctls[] = {</div><div class='add'>+	{</div><div class='add'>+		.procname	= "file-nr",</div><div class='add'>+		.data		= &amp;files_stat,</div><div class='add'>+		.maxlen		= sizeof(files_stat),</div><div class='add'>+		.mode		= 0444,</div><div class='add'>+		.proc_handler	= proc_nr_files,</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+		.procname	= "file-max",</div><div class='add'>+		.data		= &amp;files_stat.max_files,</div><div class='add'>+		.maxlen		= sizeof(files_stat.max_files),</div><div class='add'>+		.mode		= 0644,</div><div class='add'>+		.proc_handler	= proc_doulongvec_minmax,</div><div class='add'>+		.extra1		= SYSCTL_LONG_ZERO,</div><div class='add'>+		.extra2		= SYSCTL_LONG_MAX,</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+		.procname	= "nr_open",</div><div class='add'>+		.data		= &amp;sysctl_nr_open,</div><div class='add'>+		.maxlen		= sizeof(unsigned int),</div><div class='add'>+		.mode		= 0644,</div><div class='add'>+		.proc_handler	= proc_douintvec_minmax,</div><div class='add'>+		.extra1		= &amp;sysctl_nr_open_min,</div><div class='add'>+		.extra2		= &amp;sysctl_nr_open_max,</div><div class='add'>+	},</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int __init init_fs_stat_sysctls(void)</div><div class='ctx'> {</div><div class='del'>-	return -ENOSYS;</div><div class='add'>+	register_sysctl_init("fs", fs_stat_sysctls);</div><div class='add'>+	if (IS_ENABLED(CONFIG_BINFMT_MISC)) {</div><div class='add'>+		struct ctl_table_header *hdr;</div><div class='add'>+</div><div class='add'>+		hdr = register_sysctl_mount_point("fs/binfmt_misc");</div><div class='add'>+		kmemleak_not_leak(hdr);</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='add'>+fs_initcall(init_fs_stat_sysctls);</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-static struct file *__alloc_file(int flags, const struct cred *cred)</div><div class='add'>+static int init_file(struct file *f, int flags, const struct cred *cred)</div><div class='ctx'> {</div><div class='del'>-	struct file *f;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	f = kmem_cache_zalloc(filp_cachep, GFP_KERNEL);</div><div class='del'>-	if (unlikely(!f))</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='del'>-</div><div class='ctx'> 	f-&gt;f_cred = get_cred(cred);</div><div class='ctx'> 	error = security_file_alloc(f);</div><div class='ctx'> 	if (unlikely(error)) {</div><div class='del'>-		file_free_rcu(&amp;f-&gt;f_u.fu_rcuhead);</div><div class='del'>-		return ERR_PTR(error);</div><div class='add'>+		put_cred(f-&gt;f_cred);</div><div class='add'>+		return error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	atomic_long_set(&amp;f-&gt;f_count, 1);</div><div class='del'>-	rwlock_init(&amp;f-&gt;f_owner.lock);</div><div class='ctx'> 	spin_lock_init(&amp;f-&gt;f_lock);</div><div class='add'>+	/*</div><div class='add'>+	 * Note that f_pos_lock is only used for files raising</div><div class='add'>+	 * FMODE_ATOMIC_POS and directories. Other files such as pipes</div><div class='add'>+	 * don't need it and since f_pos_lock is in a union may reuse</div><div class='add'>+	 * the space for other purposes. They are expected to initialize</div><div class='add'>+	 * the respective member when opening the file.</div><div class='add'>+	 */</div><div class='ctx'> 	mutex_init(&amp;f-&gt;f_pos_lock);</div><div class='del'>-	f-&gt;f_flags = flags;</div><div class='del'>-	f-&gt;f_mode = OPEN_FMODE(flags);</div><div class='del'>-	/* f-&gt;f_version: 0 */</div><div class='add'>+	memset(&amp;f-&gt;__f_path, 0, sizeof(f-&gt;f_path));</div><div class='add'>+	memset(&amp;f-&gt;f_ra, 0, sizeof(f-&gt;f_ra));</div><div class='add'>+</div><div class='add'>+	f-&gt;f_flags	= flags;</div><div class='add'>+	f-&gt;f_mode	= OPEN_FMODE(flags);</div><div class='add'>+</div><div class='add'>+	f-&gt;f_op		= NULL;</div><div class='add'>+	f-&gt;f_mapping	= NULL;</div><div class='add'>+	f-&gt;private_data = NULL;</div><div class='add'>+	f-&gt;f_inode	= NULL;</div><div class='add'>+	f-&gt;f_owner	= NULL;</div><div class='add'>+#ifdef CONFIG_EPOLL</div><div class='add'>+	f-&gt;f_ep		= NULL;</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='del'>-	return f;</div><div class='add'>+	f-&gt;f_iocb_flags = 0;</div><div class='add'>+	f-&gt;f_pos	= 0;</div><div class='add'>+	f-&gt;f_wb_err	= 0;</div><div class='add'>+	f-&gt;f_sb_err	= 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We're SLAB_TYPESAFE_BY_RCU so initialize f_ref last. While</div><div class='add'>+	 * fget-rcu pattern users need to be able to handle spurious</div><div class='add'>+	 * refcount bumps we should reinitialize the reused file first.</div><div class='add'>+	 */</div><div class='add'>+	file_ref_init(&amp;f-&gt;f_ref, 1);</div><div class='add'>+	/*</div><div class='add'>+	 * Disable permission and pre-content events for all files by default.</div><div class='add'>+	 * They may be enabled later by fsnotify_open_perm_and_set_mode().</div><div class='add'>+	 */</div><div class='add'>+	file_set_fsnotify_mode(f, FMODE_NONOTIFY_PERM);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Find an unused file structure and return a pointer to it.</div><div class='hunk'>@@ -134,11 +219,13 @@ struct file *alloc_empty_file(int flags, const struct cred *cred)</div><div class='ctx'> {</div><div class='ctx'> 	static long old_max;</div><div class='ctx'> 	struct file *f;</div><div class='add'>+	int error;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Privileged users can go above max_files</div><div class='ctx'> 	 */</div><div class='del'>-	if (get_nr_files() &gt;= files_stat.max_files &amp;&amp; !capable(CAP_SYS_ADMIN)) {</div><div class='add'>+	if (unlikely(get_nr_files() &gt;= files_stat.max_files) &amp;&amp;</div><div class='add'>+	    !capable(CAP_SYS_ADMIN)) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * percpu_counters are inaccurate.  Do an expensive check before</div><div class='ctx'> 		 * we go and fail.</div><div class='hunk'>@@ -147,9 +234,17 @@ struct file *alloc_empty_file(int flags, const struct cred *cred)</div><div class='ctx'> 			goto over;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	f = __alloc_file(flags, cred);</div><div class='del'>-	if (!IS_ERR(f))</div><div class='del'>-		percpu_counter_inc(&amp;nr_files);</div><div class='add'>+	f = kmem_cache_alloc(filp_cachep, GFP_KERNEL);</div><div class='add'>+	if (unlikely(!f))</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+</div><div class='add'>+	error = init_file(f, flags, cred);</div><div class='add'>+	if (unlikely(error)) {</div><div class='add'>+		kmem_cache_free(filp_cachep, f);</div><div class='add'>+		return ERR_PTR(error);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	percpu_counter_inc(&amp;nr_files);</div><div class='ctx'> </div><div class='ctx'> 	return f;</div><div class='ctx'> </div><div class='hunk'>@@ -165,83 +260,176 @@ over:</div><div class='ctx'> /*</div><div class='ctx'>  * Variant of alloc_empty_file() that doesn't check and modify nr_files.</div><div class='ctx'>  *</div><div class='del'>- * Should not be used unless there's a very good reason to do so.</div><div class='add'>+ * This is only for kernel internal use, and the allocate file must not be</div><div class='add'>+ * installed into file tables or such.</div><div class='ctx'>  */</div><div class='ctx'> struct file *alloc_empty_file_noaccount(int flags, const struct cred *cred)</div><div class='ctx'> {</div><div class='del'>-	struct file *f = __alloc_file(flags, cred);</div><div class='add'>+	struct file *f;</div><div class='add'>+	int error;</div><div class='add'>+</div><div class='add'>+	f = kmem_cache_alloc(filp_cachep, GFP_KERNEL);</div><div class='add'>+	if (unlikely(!f))</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+</div><div class='add'>+	error = init_file(f, flags, cred);</div><div class='add'>+	if (unlikely(error)) {</div><div class='add'>+		kmem_cache_free(filp_cachep, f);</div><div class='add'>+		return ERR_PTR(error);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (!IS_ERR(f))</div><div class='del'>-		f-&gt;f_mode |= FMODE_NOACCOUNT;</div><div class='add'>+	f-&gt;f_mode |= FMODE_NOACCOUNT;</div><div class='ctx'> </div><div class='ctx'> 	return f;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Variant of alloc_empty_file() that allocates a backing_file container</div><div class='add'>+ * and doesn't check and modify nr_files.</div><div class='add'>+ *</div><div class='add'>+ * This is only for kernel internal use, and the allocate file must not be</div><div class='add'>+ * installed into file tables or such.</div><div class='add'>+ */</div><div class='add'>+struct file *alloc_empty_backing_file(int flags, const struct cred *cred)</div><div class='add'>+{</div><div class='add'>+	struct backing_file *ff;</div><div class='add'>+	int error;</div><div class='add'>+</div><div class='add'>+	ff = kmem_cache_alloc(bfilp_cachep, GFP_KERNEL);</div><div class='add'>+	if (unlikely(!ff))</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+</div><div class='add'>+	error = init_file(&amp;ff-&gt;file, flags, cred);</div><div class='add'>+	if (unlikely(error)) {</div><div class='add'>+		kmem_cache_free(bfilp_cachep, ff);</div><div class='add'>+		return ERR_PTR(error);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ff-&gt;file.f_mode |= FMODE_BACKING | FMODE_NOACCOUNT;</div><div class='add'>+	return &amp;ff-&gt;file;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /**</div><div class='del'>- * alloc_file - allocate and initialize a 'struct file'</div><div class='add'>+ * file_init_path - initialize a 'struct file' based on path</div><div class='ctx'>  *</div><div class='add'>+ * @file: the file to set up</div><div class='ctx'>  * @path: the (dentry, vfsmount) pair for the new file</div><div class='del'>- * @flags: O_... flags with which the new file will be opened</div><div class='ctx'>  * @fop: the 'struct file_operations' for the new file</div><div class='ctx'>  */</div><div class='del'>-static struct file *alloc_file(const struct path *path, int flags,</div><div class='del'>-		const struct file_operations *fop)</div><div class='add'>+static void file_init_path(struct file *file, const struct path *path,</div><div class='add'>+			   const struct file_operations *fop)</div><div class='ctx'> {</div><div class='del'>-	struct file *file;</div><div class='del'>-</div><div class='del'>-	file = alloc_empty_file(flags, current_cred());</div><div class='del'>-	if (IS_ERR(file))</div><div class='del'>-		return file;</div><div class='del'>-</div><div class='del'>-	file-&gt;f_path = *path;</div><div class='add'>+	file-&gt;__f_path = *path;</div><div class='ctx'> 	file-&gt;f_inode = path-&gt;dentry-&gt;d_inode;</div><div class='ctx'> 	file-&gt;f_mapping = path-&gt;dentry-&gt;d_inode-&gt;i_mapping;</div><div class='ctx'> 	file-&gt;f_wb_err = filemap_sample_wb_err(file-&gt;f_mapping);</div><div class='ctx'> 	file-&gt;f_sb_err = file_sample_sb_err(file);</div><div class='add'>+	if (fop-&gt;llseek)</div><div class='add'>+		file-&gt;f_mode |= FMODE_LSEEK;</div><div class='ctx'> 	if ((file-&gt;f_mode &amp; FMODE_READ) &amp;&amp;</div><div class='ctx'> 	     likely(fop-&gt;read || fop-&gt;read_iter))</div><div class='ctx'> 		file-&gt;f_mode |= FMODE_CAN_READ;</div><div class='ctx'> 	if ((file-&gt;f_mode &amp; FMODE_WRITE) &amp;&amp;</div><div class='ctx'> 	     likely(fop-&gt;write || fop-&gt;write_iter))</div><div class='ctx'> 		file-&gt;f_mode |= FMODE_CAN_WRITE;</div><div class='add'>+	file-&gt;f_iocb_flags = iocb_flags(file);</div><div class='ctx'> 	file-&gt;f_mode |= FMODE_OPENED;</div><div class='ctx'> 	file-&gt;f_op = fop;</div><div class='ctx'> 	if ((file-&gt;f_mode &amp; (FMODE_READ | FMODE_WRITE)) == FMODE_READ)</div><div class='ctx'> 		i_readcount_inc(path-&gt;dentry-&gt;d_inode);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * alloc_file - allocate and initialize a 'struct file'</div><div class='add'>+ *</div><div class='add'>+ * @path: the (dentry, vfsmount) pair for the new file</div><div class='add'>+ * @flags: O_... flags with which the new file will be opened</div><div class='add'>+ * @fop: the 'struct file_operations' for the new file</div><div class='add'>+ */</div><div class='add'>+static struct file *alloc_file(const struct path *path, int flags,</div><div class='add'>+		const struct file_operations *fop)</div><div class='add'>+{</div><div class='add'>+	struct file *file;</div><div class='add'>+</div><div class='add'>+	file = alloc_empty_file(flags, current_cred());</div><div class='add'>+	if (!IS_ERR(file))</div><div class='add'>+		file_init_path(file, path, fop);</div><div class='ctx'> 	return file;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline int alloc_path_pseudo(const char *name, struct inode *inode,</div><div class='add'>+				    struct vfsmount *mnt, struct path *path)</div><div class='add'>+{</div><div class='add'>+	path-&gt;dentry = d_alloc_pseudo(mnt-&gt;mnt_sb, &amp;QSTR(name));</div><div class='add'>+	if (!path-&gt;dentry)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	path-&gt;mnt = mntget(mnt);</div><div class='add'>+	d_instantiate(path-&gt;dentry, inode);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> struct file *alloc_file_pseudo(struct inode *inode, struct vfsmount *mnt,</div><div class='del'>-				const char *name, int flags,</div><div class='del'>-				const struct file_operations *fops)</div><div class='add'>+			       const char *name, int flags,</div><div class='add'>+			       const struct file_operations *fops)</div><div class='ctx'> {</div><div class='del'>-	static const struct dentry_operations anon_ops = {</div><div class='del'>-		.d_dname = simple_dname</div><div class='del'>-	};</div><div class='del'>-	struct qstr this = QSTR_INIT(name, strlen(name));</div><div class='add'>+	int ret;</div><div class='ctx'> 	struct path path;</div><div class='ctx'> 	struct file *file;</div><div class='ctx'> </div><div class='del'>-	path.dentry = d_alloc_pseudo(mnt-&gt;mnt_sb, &amp;this);</div><div class='del'>-	if (!path.dentry)</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='del'>-	if (!mnt-&gt;mnt_sb-&gt;s_d_op)</div><div class='del'>-		d_set_d_op(path.dentry, &amp;anon_ops);</div><div class='del'>-	path.mnt = mntget(mnt);</div><div class='del'>-	d_instantiate(path.dentry, inode);</div><div class='add'>+	ret = alloc_path_pseudo(name, inode, mnt, &amp;path);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ERR_PTR(ret);</div><div class='add'>+</div><div class='ctx'> 	file = alloc_file(&amp;path, flags, fops);</div><div class='ctx'> 	if (IS_ERR(file)) {</div><div class='ctx'> 		ihold(inode);</div><div class='ctx'> 		path_put(&amp;path);</div><div class='add'>+		return file;</div><div class='ctx'> 	}</div><div class='add'>+	/*</div><div class='add'>+	 * Disable all fsnotify events for pseudo files by default.</div><div class='add'>+	 * They may be enabled by caller with file_set_fsnotify_mode().</div><div class='add'>+	 */</div><div class='add'>+	file_set_fsnotify_mode(file, FMODE_NONOTIFY);</div><div class='ctx'> 	return file;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(alloc_file_pseudo);</div><div class='ctx'> </div><div class='add'>+struct file *alloc_file_pseudo_noaccount(struct inode *inode,</div><div class='add'>+					 struct vfsmount *mnt, const char *name,</div><div class='add'>+					 int flags,</div><div class='add'>+					 const struct file_operations *fops)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+	struct path path;</div><div class='add'>+	struct file *file;</div><div class='add'>+</div><div class='add'>+	ret = alloc_path_pseudo(name, inode, mnt, &amp;path);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ERR_PTR(ret);</div><div class='add'>+</div><div class='add'>+	file = alloc_empty_file_noaccount(flags, current_cred());</div><div class='add'>+	if (IS_ERR(file)) {</div><div class='add'>+		ihold(inode);</div><div class='add'>+		path_put(&amp;path);</div><div class='add'>+		return file;</div><div class='add'>+	}</div><div class='add'>+	file_init_path(file, &amp;path, fops);</div><div class='add'>+	/*</div><div class='add'>+	 * Disable all fsnotify events for pseudo files by default.</div><div class='add'>+	 * They may be enabled by caller with file_set_fsnotify_mode().</div><div class='add'>+	 */</div><div class='add'>+	file_set_fsnotify_mode(file, FMODE_NONOTIFY);</div><div class='add'>+	return file;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(alloc_file_pseudo_noaccount);</div><div class='add'>+</div><div class='ctx'> struct file *alloc_file_clone(struct file *base, int flags,</div><div class='ctx'> 				const struct file_operations *fops)</div><div class='ctx'> {</div><div class='del'>-	struct file *f = alloc_file(&amp;base-&gt;f_path, flags, fops);</div><div class='add'>+	struct file *f;</div><div class='add'>+</div><div class='add'>+	f = alloc_file(&amp;base-&gt;f_path, flags, fops);</div><div class='ctx'> 	if (!IS_ERR(f)) {</div><div class='ctx'> 		path_get(&amp;f-&gt;f_path);</div><div class='ctx'> 		f-&gt;f_mapping = base-&gt;f_mapping;</div><div class='hunk'>@@ -271,7 +459,7 @@ static void __fput(struct file *file)</div><div class='ctx'> 	eventpoll_release(file);</div><div class='ctx'> 	locks_remove_file(file);</div><div class='ctx'> </div><div class='del'>-	ima_file_free(file);</div><div class='add'>+	security_file_release(file);</div><div class='ctx'> 	if (unlikely(file-&gt;f_flags &amp; FASYNC)) {</div><div class='ctx'> 		if (file-&gt;f_op-&gt;fasync)</div><div class='ctx'> 			file-&gt;f_op-&gt;fasync(-1, file, 0);</div><div class='hunk'>@@ -283,13 +471,8 @@ static void __fput(struct file *file)</div><div class='ctx'> 		cdev_put(inode-&gt;i_cdev);</div><div class='ctx'> 	}</div><div class='ctx'> 	fops_put(file-&gt;f_op);</div><div class='del'>-	put_pid(file-&gt;f_owner.pid);</div><div class='del'>-	if ((mode &amp; (FMODE_READ | FMODE_WRITE)) == FMODE_READ)</div><div class='del'>-		i_readcount_dec(inode);</div><div class='del'>-	if (mode &amp; FMODE_WRITER) {</div><div class='del'>-		put_write_access(inode);</div><div class='del'>-		__mnt_drop_write(mnt);</div><div class='del'>-	}</div><div class='add'>+	file_f_owner_release(file);</div><div class='add'>+	put_file_access(file);</div><div class='ctx'> 	dput(dentry);</div><div class='ctx'> 	if (unlikely(mode &amp; FMODE_NEED_UNMOUNT))</div><div class='ctx'> 		dissolve_on_fput(mnt);</div><div class='hunk'>@@ -304,15 +487,17 @@ static void delayed_fput(struct work_struct *unused)</div><div class='ctx'> 	struct llist_node *node = llist_del_all(&amp;delayed_fput_list);</div><div class='ctx'> 	struct file *f, *t;</div><div class='ctx'> </div><div class='del'>-	llist_for_each_entry_safe(f, t, node, f_u.fu_llist)</div><div class='add'>+	llist_for_each_entry_safe(f, t, node, f_llist)</div><div class='ctx'> 		__fput(f);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void ____fput(struct callback_head *work)</div><div class='ctx'> {</div><div class='del'>-	__fput(container_of(work, struct file, f_u.fu_rcuhead));</div><div class='add'>+	__fput(container_of(work, struct file, f_task_work));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static DECLARE_DELAYED_WORK(delayed_fput_work, delayed_fput);</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * If kernel thread really needs to have the final fput() it has done</div><div class='ctx'>  * to complete, call this.  The only user right now is the boot - we</div><div class='hunk'>@@ -326,36 +511,40 @@ static void ____fput(struct callback_head *work)</div><div class='ctx'> void flush_delayed_fput(void)</div><div class='ctx'> {</div><div class='ctx'> 	delayed_fput(NULL);</div><div class='add'>+	flush_delayed_work(&amp;delayed_fput_work);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(flush_delayed_fput);</div><div class='ctx'> </div><div class='del'>-static DECLARE_DELAYED_WORK(delayed_fput_work, delayed_fput);</div><div class='del'>-</div><div class='del'>-void fput_many(struct file *file, unsigned int refs)</div><div class='add'>+static void __fput_deferred(struct file *file)</div><div class='ctx'> {</div><div class='del'>-	if (atomic_long_sub_and_test(refs, &amp;file-&gt;f_count)) {</div><div class='del'>-		struct task_struct *task = current;</div><div class='del'>-</div><div class='del'>-		if (likely(!in_interrupt() &amp;&amp; !(task-&gt;flags &amp; PF_KTHREAD))) {</div><div class='del'>-			init_task_work(&amp;file-&gt;f_u.fu_rcuhead, ____fput);</div><div class='del'>-			if (!task_work_add(task, &amp;file-&gt;f_u.fu_rcuhead, TWA_RESUME))</div><div class='del'>-				return;</div><div class='del'>-			/*</div><div class='del'>-			 * After this task has run exit_task_work(),</div><div class='del'>-			 * task_work_add() will fail.  Fall through to delayed</div><div class='del'>-			 * fput to avoid leaking *file.</div><div class='del'>-			 */</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (llist_add(&amp;file-&gt;f_u.fu_llist, &amp;delayed_fput_list))</div><div class='del'>-			schedule_delayed_work(&amp;delayed_fput_work, 1);</div><div class='add'>+	struct task_struct *task = current;</div><div class='add'>+</div><div class='add'>+	if (unlikely(!(file-&gt;f_mode &amp; (FMODE_BACKING | FMODE_OPENED)))) {</div><div class='add'>+		file_free(file);</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	if (likely(!in_interrupt() &amp;&amp; !(task-&gt;flags &amp; PF_KTHREAD))) {</div><div class='add'>+		init_task_work(&amp;file-&gt;f_task_work, ____fput);</div><div class='add'>+		if (!task_work_add(task, &amp;file-&gt;f_task_work, TWA_RESUME))</div><div class='add'>+			return;</div><div class='add'>+		/*</div><div class='add'>+		 * After this task has run exit_task_work(),</div><div class='add'>+		 * task_work_add() will fail.  Fall through to delayed</div><div class='add'>+		 * fput to avoid leaking *file.</div><div class='add'>+		 */</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (llist_add(&amp;file-&gt;f_llist, &amp;delayed_fput_list))</div><div class='add'>+		schedule_delayed_work(&amp;delayed_fput_work, 1);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void fput(struct file *file)</div><div class='ctx'> {</div><div class='del'>-	fput_many(file, 1);</div><div class='add'>+	if (unlikely(file_ref_put(&amp;file-&gt;f_ref)))</div><div class='add'>+		__fput_deferred(file);</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL(fput);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * synchronous analog of fput(); for kernel threads that might be needed</div><div class='hunk'>@@ -367,19 +556,50 @@ void fput(struct file *file)</div><div class='ctx'>  */</div><div class='ctx'> void __fput_sync(struct file *file)</div><div class='ctx'> {</div><div class='del'>-	if (atomic_long_dec_and_test(&amp;file-&gt;f_count)) {</div><div class='del'>-		struct task_struct *task = current;</div><div class='del'>-		BUG_ON(!(task-&gt;flags &amp; PF_KTHREAD));</div><div class='add'>+	if (file_ref_put(&amp;file-&gt;f_ref))</div><div class='ctx'> 		__fput(file);</div><div class='del'>-	}</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL(__fput_sync);</div><div class='ctx'> </div><div class='del'>-EXPORT_SYMBOL(fput);</div><div class='add'>+/*</div><div class='add'>+ * Equivalent to __fput_sync(), but optimized for being called with the last</div><div class='add'>+ * reference.</div><div class='add'>+ *</div><div class='add'>+ * See file_ref_put_close() for details.</div><div class='add'>+ */</div><div class='add'>+void fput_close_sync(struct file *file)</div><div class='add'>+{</div><div class='add'>+	if (likely(file_ref_put_close(&amp;file-&gt;f_ref)))</div><div class='add'>+		__fput(file);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Equivalent to fput(), but optimized for being called with the last</div><div class='add'>+ * reference.</div><div class='add'>+ *</div><div class='add'>+ * See file_ref_put_close() for details.</div><div class='add'>+ */</div><div class='add'>+void fput_close(struct file *file)</div><div class='add'>+{</div><div class='add'>+	if (file_ref_put_close(&amp;file-&gt;f_ref))</div><div class='add'>+		__fput_deferred(file);</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> void __init files_init(void)</div><div class='ctx'> {</div><div class='del'>-	filp_cachep = kmem_cache_create("filp", sizeof(struct file), 0,</div><div class='del'>-			SLAB_HWCACHE_ALIGN | SLAB_PANIC | SLAB_ACCOUNT, NULL);</div><div class='add'>+	struct kmem_cache_args args = {</div><div class='add'>+		.use_freeptr_offset = true,</div><div class='add'>+		.freeptr_offset = offsetof(struct file, f_freeptr),</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+	filp_cachep = kmem_cache_create("filp", sizeof(struct file), &amp;args,</div><div class='add'>+				SLAB_HWCACHE_ALIGN | SLAB_PANIC |</div><div class='add'>+				SLAB_ACCOUNT | SLAB_TYPESAFE_BY_RCU);</div><div class='add'>+</div><div class='add'>+	args.freeptr_offset = offsetof(struct backing_file, bf_freeptr);</div><div class='add'>+	bfilp_cachep = kmem_cache_create("bfilp", sizeof(struct backing_file),</div><div class='add'>+				&amp;args, SLAB_HWCACHE_ALIGN | SLAB_PANIC |</div><div class='add'>+				SLAB_ACCOUNT | SLAB_TYPESAFE_BY_RCU);</div><div class='ctx'> 	percpu_counter_init(&amp;nr_files, 0, GFP_KERNEL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/filesystems.c b/fs/filesystems.c<br/>index 58b9067b2391..95e5256821a5 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/filesystems.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/filesystems.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/filesystems.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/filesystems.c</a></div><div class='hunk'>@@ -156,15 +156,19 @@ static int fs_index(const char __user * __name)</div><div class='ctx'> static int fs_name(unsigned int index, char __user * buf)</div><div class='ctx'> {</div><div class='ctx'> 	struct file_system_type * tmp;</div><div class='del'>-	int len, res;</div><div class='add'>+	int len, res = -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	read_lock(&amp;file_systems_lock);</div><div class='del'>-	for (tmp = file_systems; tmp; tmp = tmp-&gt;next, index--)</div><div class='del'>-		if (index &lt;= 0 &amp;&amp; try_module_get(tmp-&gt;owner))</div><div class='add'>+	for (tmp = file_systems; tmp; tmp = tmp-&gt;next, index--) {</div><div class='add'>+		if (index == 0) {</div><div class='add'>+			if (try_module_get(tmp-&gt;owner))</div><div class='add'>+				res = 0;</div><div class='ctx'> 			break;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> 	read_unlock(&amp;file_systems_lock);</div><div class='del'>-	if (!tmp)</div><div class='del'>-		return -EINVAL;</div><div class='add'>+	if (res)</div><div class='add'>+		return res;</div><div class='ctx'> </div><div class='ctx'> 	/* OK, we got the reference, so we can safely block */</div><div class='ctx'> 	len = strlen(tmp-&gt;name) + 1;</div><div class='head'>diff --git a/fs/freevxfs/Kconfig b/fs/freevxfs/Kconfig<br/>index c05c71d57291..912107ebea6f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/freevxfs/Kconfig</a></div><div class='hunk'>@@ -2,13 +2,14 @@</div><div class='ctx'> config VXFS_FS</div><div class='ctx'> 	tristate "FreeVxFS file system support (VERITAS VxFS(TM) compatible)"</div><div class='ctx'> 	depends on BLOCK</div><div class='add'>+	select BUFFER_HEAD</div><div class='ctx'> 	help</div><div class='ctx'> 	  FreeVxFS is a file system driver that support the VERITAS VxFS(TM)</div><div class='ctx'> 	  file system format.  VERITAS VxFS(TM) is the standard file system</div><div class='ctx'> 	  of SCO UnixWare (and possibly others) and optionally available</div><div class='ctx'> 	  for Sunsoft Solaris, HP-UX and many other operating systems. However</div><div class='ctx'> 	  these particular OS implementations of vxfs may differ in on-disk</div><div class='del'>-	  data endianess and/or superblock offset. The vxfs module has been</div><div class='add'>+	  data endianness and/or superblock offset. The vxfs module has been</div><div class='ctx'> 	  tested with SCO UnixWare and HP-UX B.10.20 (pa-risc 1.1 arch.)</div><div class='ctx'> 	  Currently only readonly access is supported and VxFX versions</div><div class='ctx'> 	  2, 3 and 4. Tests were performed with HP-UX VxFS version 3.</div><div class='head'>diff --git a/fs/freevxfs/vxfs.h b/fs/freevxfs/vxfs.h<br/>index a41ea0ba6943..bffd156d6434 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/vxfs.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/vxfs.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/vxfs.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/freevxfs/vxfs.h</a></div><div class='hunk'>@@ -1,32 +1,7 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0-only */</div><div class='ctx'> /*</div><div class='ctx'>  * Copyright (c) 2000-2001 Christoph Hellwig.</div><div class='ctx'>  * Copyright (c) 2016 Krzysztof Blaszkowski</div><div class='del'>- * All rights reserved.</div><div class='del'>- *</div><div class='del'>- * Redistribution and use in source and binary forms, with or without</div><div class='del'>- * modification, are permitted provided that the following conditions</div><div class='del'>- * are met:</div><div class='del'>- * 1. Redistributions of source code must retain the above copyright</div><div class='del'>- *    notice, this list of conditions, and the following disclaimer,</div><div class='del'>- *    without modification.</div><div class='del'>- * 2. The name of the author may not be used to endorse or promote products</div><div class='del'>- *    derived from this software without specific prior written permission.</div><div class='del'>- *</div><div class='del'>- * Alternatively, this software may be distributed under the terms of the</div><div class='del'>- * GNU General Public License ("GPL").</div><div class='del'>- *</div><div class='del'>- * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND</div><div class='del'>- * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE</div><div class='del'>- * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE</div><div class='del'>- * ARE DISCLAIMED. IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE FOR</div><div class='del'>- * ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL</div><div class='del'>- * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS</div><div class='del'>- * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)</div><div class='del'>- * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT</div><div class='del'>- * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY</div><div class='del'>- * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF</div><div class='del'>- * SUCH DAMAGE.</div><div class='del'>- *</div><div class='ctx'>  */</div><div class='ctx'> #ifndef _VXFS_SUPER_H_</div><div class='ctx'> #define _VXFS_SUPER_H_</div><div class='head'>diff --git a/fs/freevxfs/vxfs_bmap.c b/fs/freevxfs/vxfs_bmap.c<br/>index 1fd41cf98b9f..26d367e3668d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/vxfs_bmap.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/vxfs_bmap.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/vxfs_bmap.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/freevxfs/vxfs_bmap.c</a></div><div class='hunk'>@@ -1,30 +1,6 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-only</div><div class='ctx'> /*</div><div class='ctx'>  * Copyright (c) 2000-2001 Christoph Hellwig.</div><div class='del'>- * All rights reserved.</div><div class='del'>- *</div><div class='del'>- * Redistribution and use in source and binary forms, with or without</div><div class='del'>- * modification, are permitted provided that the following conditions</div><div class='del'>- * are met:</div><div class='del'>- * 1. Redistributions of source code must retain the above copyright</div><div class='del'>- *    notice, this list of conditions, and the following disclaimer,</div><div class='del'>- *    without modification.</div><div class='del'>- * 2. The name of the author may not be used to endorse or promote products</div><div class='del'>- *    derived from this software without specific prior written permission.</div><div class='del'>- *</div><div class='del'>- * Alternatively, this software may be distributed under the terms of the</div><div class='del'>- * GNU General Public License ("GPL").</div><div class='del'>- *</div><div class='del'>- * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND</div><div class='del'>- * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE</div><div class='del'>- * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE</div><div class='del'>- * ARE DISCLAIMED. IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE FOR</div><div class='del'>- * ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL</div><div class='del'>- * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS</div><div class='del'>- * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)</div><div class='del'>- * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT</div><div class='del'>- * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY</div><div class='del'>- * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF</div><div class='del'>- * SUCH DAMAGE.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -53,7 +29,7 @@ vxfs_typdump(struct vxfs_typed *typ)</div><div class='ctx'> /**</div><div class='ctx'>  * vxfs_bmap_ext4 - do bmap for ext4 extents</div><div class='ctx'>  * @ip:		pointer to the inode we do bmap for</div><div class='del'>- * @iblock:	logical block.</div><div class='add'>+ * @bn:		logical block.</div><div class='ctx'>  *</div><div class='ctx'>  * Description:</div><div class='ctx'>  *   vxfs_bmap_ext4 performs the bmap operation for inodes with</div><div class='hunk'>@@ -121,7 +97,7 @@ fail_buf:</div><div class='ctx'>  *   vxfs_bmap_indir reads a &amp;struct vxfs_typed at @indir</div><div class='ctx'>  *   and performs the type-defined action.</div><div class='ctx'>  *</div><div class='del'>- * Return Value:</div><div class='add'>+ * Returns:</div><div class='ctx'>  *   The physical block number on success, else Zero.</div><div class='ctx'>  *</div><div class='ctx'>  * Note:</div><div class='hunk'>@@ -203,7 +179,7 @@ out:</div><div class='ctx'>  * Description:</div><div class='ctx'>  *   Performs the bmap operation for typed extents.</div><div class='ctx'>  *</div><div class='del'>- * Return Value:</div><div class='add'>+ * Returns:</div><div class='ctx'>  *   The physical block number on success, else Zero.</div><div class='ctx'>  */</div><div class='ctx'> static daddr_t</div><div class='hunk'>@@ -267,7 +243,7 @@ vxfs_bmap_typed(struct inode *ip, long iblock)</div><div class='ctx'>  *   vxfs_bmap1 perfoms a logical to physical block mapping</div><div class='ctx'>  *   for vxfs-internal purposes.</div><div class='ctx'>  *</div><div class='del'>- * Return Value:</div><div class='add'>+ * Returns:</div><div class='ctx'>  *   The physical block number on success, else Zero.</div><div class='ctx'>  */</div><div class='ctx'> daddr_t</div><div class='head'>diff --git a/fs/freevxfs/vxfs_dir.h b/fs/freevxfs/vxfs_dir.h<br/>index acc5477b3f23..8c67627f2a3d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/vxfs_dir.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/vxfs_dir.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/vxfs_dir.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/freevxfs/vxfs_dir.h</a></div><div class='hunk'>@@ -1,31 +1,6 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0-only */</div><div class='ctx'> /*</div><div class='ctx'>  * Copyright (c) 2000-2001 Christoph Hellwig.</div><div class='del'>- * All rights reserved.</div><div class='del'>- *</div><div class='del'>- * Redistribution and use in source and binary forms, with or without</div><div class='del'>- * modification, are permitted provided that the following conditions</div><div class='del'>- * are met:</div><div class='del'>- * 1. Redistributions of source code must retain the above copyright</div><div class='del'>- *    notice, this list of conditions, and the following disclaimer,</div><div class='del'>- *    without modification.</div><div class='del'>- * 2. The name of the author may not be used to endorse or promote products</div><div class='del'>- *    derived from this software without specific prior written permission.</div><div class='del'>- *</div><div class='del'>- * Alternatively, this software may be distributed under the terms of the</div><div class='del'>- * GNU General Public License ("GPL").</div><div class='del'>- *</div><div class='del'>- * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND</div><div class='del'>- * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE</div><div class='del'>- * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE</div><div class='del'>- * ARE DISCLAIMED. IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE FOR</div><div class='del'>- * ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL</div><div class='del'>- * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS</div><div class='del'>- * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)</div><div class='del'>- * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT</div><div class='del'>- * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY</div><div class='del'>- * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF</div><div class='del'>- * SUCH DAMAGE.</div><div class='del'>- *</div><div class='ctx'>  */</div><div class='ctx'> #ifndef _VXFS_DIR_H_</div><div class='ctx'> #define _VXFS_DIR_H_</div><div class='hunk'>@@ -50,7 +25,7 @@</div><div class='ctx'> struct vxfs_dirblk {</div><div class='ctx'> 	__fs16		d_free;		/* free space in dirblock */</div><div class='ctx'> 	__fs16		d_nhash;	/* no of hash chains */</div><div class='del'>-	__fs16		d_hash[1];	/* hash chain */</div><div class='add'>+	__fs16		d_hash[];	/* hash chain */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='head'>diff --git a/fs/freevxfs/vxfs_extern.h b/fs/freevxfs/vxfs_extern.h<br/>index f5c428e21024..3a2180c5e208 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/vxfs_extern.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/vxfs_extern.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/vxfs_extern.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/freevxfs/vxfs_extern.h</a></div><div class='hunk'>@@ -1,31 +1,6 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0-only */</div><div class='ctx'> /*</div><div class='ctx'>  * Copyright (c) 2000-2001 Christoph Hellwig.</div><div class='del'>- * All rights reserved.</div><div class='del'>- *</div><div class='del'>- * Redistribution and use in source and binary forms, with or without</div><div class='del'>- * modification, are permitted provided that the following conditions</div><div class='del'>- * are met:</div><div class='del'>- * 1. Redistributions of source code must retain the above copyright</div><div class='del'>- *    notice, this list of conditions, and the following disclaimer,</div><div class='del'>- *    without modification.</div><div class='del'>- * 2. The name of the author may not be used to endorse or promote products</div><div class='del'>- *    derived from this software without specific prior written permission.</div><div class='del'>- *</div><div class='del'>- * Alternatively, this software may be distributed under the terms of the</div><div class='del'>- * GNU General Public License ("GPL").</div><div class='del'>- *</div><div class='del'>- * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND</div><div class='del'>- * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE</div><div class='del'>- * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE</div><div class='del'>- * ARE DISCLAIMED. IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE FOR</div><div class='del'>- * ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL</div><div class='del'>- * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS</div><div class='del'>- * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)</div><div class='del'>- * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT</div><div class='del'>- * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY</div><div class='del'>- * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF</div><div class='del'>- * SUCH DAMAGE.</div><div class='del'>- *</div><div class='ctx'>  */</div><div class='ctx'> #ifndef _VXFS_EXTERN_H_</div><div class='ctx'> #define _VXFS_EXTERN_H_</div><div class='head'>diff --git a/fs/freevxfs/vxfs_fshead.c b/fs/freevxfs/vxfs_fshead.c<br/>index a4610a77649e..c1174a3f8990 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/vxfs_fshead.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/vxfs_fshead.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/vxfs_fshead.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/freevxfs/vxfs_fshead.c</a></div><div class='hunk'>@@ -1,31 +1,7 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-only</div><div class='ctx'> /*</div><div class='ctx'>  * Copyright (c) 2000-2001 Christoph Hellwig.</div><div class='ctx'>  * Copyright (c) 2016 Krzysztof Blaszkowski</div><div class='del'>- * All rights reserved.</div><div class='del'>- *</div><div class='del'>- * Redistribution and use in source and binary forms, with or without</div><div class='del'>- * modification, are permitted provided that the following conditions</div><div class='del'>- * are met:</div><div class='del'>- * 1. Redistributions of source code must retain the above copyright</div><div class='del'>- *    notice, this list of conditions, and the following disclaimer,</div><div class='del'>- *    without modification.</div><div class='del'>- * 2. The name of the author may not be used to endorse or promote products</div><div class='del'>- *    derived from this software without specific prior written permission.</div><div class='del'>- *</div><div class='del'>- * Alternatively, this software may be distributed under the terms of the</div><div class='del'>- * GNU General Public License ("GPL").</div><div class='del'>- *</div><div class='del'>- * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND</div><div class='del'>- * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE</div><div class='del'>- * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE</div><div class='del'>- * ARE DISCLAIMED. IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE FOR</div><div class='del'>- * ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL</div><div class='del'>- * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS</div><div class='del'>- * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)</div><div class='del'>- * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT</div><div class='del'>- * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY</div><div class='del'>- * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF</div><div class='del'>- * SUCH DAMAGE.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='head'>diff --git a/fs/freevxfs/vxfs_fshead.h b/fs/freevxfs/vxfs_fshead.h<br/>index e026f0c49159..dfd2147599c4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/vxfs_fshead.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/vxfs_fshead.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/vxfs_fshead.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/freevxfs/vxfs_fshead.h</a></div><div class='hunk'>@@ -1,32 +1,7 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0-only */</div><div class='ctx'> /*</div><div class='ctx'>  * Copyright (c) 2000-2001 Christoph Hellwig.</div><div class='ctx'>  * Copyright (c) 2016 Krzysztof Blaszkowski</div><div class='del'>- * All rights reserved.</div><div class='del'>- *</div><div class='del'>- * Redistribution and use in source and binary forms, with or without</div><div class='del'>- * modification, are permitted provided that the following conditions</div><div class='del'>- * are met:</div><div class='del'>- * 1. Redistributions of source code must retain the above copyright</div><div class='del'>- *    notice, this list of conditions, and the following disclaimer,</div><div class='del'>- *    without modification.</div><div class='del'>- * 2. The name of the author may not be used to endorse or promote products</div><div class='del'>- *    derived from this software without specific prior written permission.</div><div class='del'>- *</div><div class='del'>- * Alternatively, this software may be distributed under the terms of the</div><div class='del'>- * GNU General Public License ("GPL").</div><div class='del'>- *</div><div class='del'>- * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND</div><div class='del'>- * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE</div><div class='del'>- * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE</div><div class='del'>- * ARE DISCLAIMED. IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE FOR</div><div class='del'>- * ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL</div><div class='del'>- * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS</div><div class='del'>- * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)</div><div class='del'>- * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT</div><div class='del'>- * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY</div><div class='del'>- * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF</div><div class='del'>- * SUCH DAMAGE.</div><div class='del'>- *</div><div class='ctx'>  */</div><div class='ctx'> #ifndef _VXFS_FSHEAD_H_</div><div class='ctx'> #define _VXFS_FSHEAD_H_</div><div class='head'>diff --git a/fs/freevxfs/vxfs_immed.c b/fs/freevxfs/vxfs_immed.c<br/>index bfc780c682fb..ed51fcd34757 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/vxfs_immed.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/vxfs_immed.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/vxfs_immed.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/freevxfs/vxfs_immed.c</a></div><div class='hunk'>@@ -1,30 +1,6 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-only</div><div class='ctx'> /*</div><div class='ctx'>  * Copyright (c) 2000-2001 Christoph Hellwig.</div><div class='del'>- * All rights reserved.</div><div class='del'>- *</div><div class='del'>- * Redistribution and use in source and binary forms, with or without</div><div class='del'>- * modification, are permitted provided that the following conditions</div><div class='del'>- * are met:</div><div class='del'>- * 1. Redistributions of source code must retain the above copyright</div><div class='del'>- *    notice, this list of conditions, and the following disclaimer,</div><div class='del'>- *    without modification.</div><div class='del'>- * 2. The name of the author may not be used to endorse or promote products</div><div class='del'>- *    derived from this software without specific prior written permission.</div><div class='del'>- *</div><div class='del'>- * Alternatively, this software may be distributed under the terms of the</div><div class='del'>- * GNU General Public License ("GPL").</div><div class='del'>- *</div><div class='del'>- * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND</div><div class='del'>- * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE</div><div class='del'>- * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE</div><div class='del'>- * ARE DISCLAIMED. IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE FOR</div><div class='del'>- * ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL</div><div class='del'>- * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS</div><div class='del'>- * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)</div><div class='del'>- * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT</div><div class='del'>- * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY</div><div class='del'>- * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF</div><div class='del'>- * SUCH DAMAGE.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -37,45 +13,41 @@</div><div class='ctx'> #include "vxfs_extern.h"</div><div class='ctx'> #include "vxfs_inode.h"</div><div class='ctx'> </div><div class='del'>-</div><div class='del'>-static int	vxfs_immed_readpage(struct file *, struct page *);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Address space operations for immed files and directories.</div><div class='del'>- */</div><div class='del'>-const struct address_space_operations vxfs_immed_aops = {</div><div class='del'>-	.readpage =		vxfs_immed_readpage,</div><div class='del'>-};</div><div class='del'>-</div><div class='ctx'> /**</div><div class='del'>- * vxfs_immed_readpage - read part of an immed inode into pagecache</div><div class='del'>- * @file:	file context (unused)</div><div class='del'>- * @page:	page frame to fill in.</div><div class='add'>+ * vxfs_immed_read_folio - read part of an immed inode into pagecache</div><div class='add'>+ * @fp:		file context (unused)</div><div class='add'>+ * @folio:	folio to fill in.</div><div class='ctx'>  *</div><div class='ctx'>  * Description:</div><div class='del'>- *   vxfs_immed_readpage reads a part of the immed area of the</div><div class='del'>- *   file that hosts @pp into the pagecache.</div><div class='add'>+ *   vxfs_immed_read_folio reads a part of the immed area of the</div><div class='add'>+ *   file that hosts @folio into the pagecache.</div><div class='ctx'>  *</div><div class='ctx'>  * Returns:</div><div class='ctx'>  *   Zero on success, else a negative error code.</div><div class='ctx'>  *</div><div class='ctx'>  * Locking status:</div><div class='del'>- *   @page is locked and will be unlocked.</div><div class='add'>+ *   @folio is locked and will be unlocked.</div><div class='ctx'>  */</div><div class='del'>-static int</div><div class='del'>-vxfs_immed_readpage(struct file *fp, struct page *pp)</div><div class='add'>+static int vxfs_immed_read_folio(struct file *fp, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct vxfs_inode_info	*vip = VXFS_INO(pp-&gt;mapping-&gt;host);</div><div class='del'>-	u_int64_t	offset = (u_int64_t)pp-&gt;index &lt;&lt; PAGE_SHIFT;</div><div class='del'>-	caddr_t		kaddr;</div><div class='add'>+	struct vxfs_inode_info *vip = VXFS_INO(folio-&gt;mapping-&gt;host);</div><div class='add'>+	void *src = vip-&gt;vii_immed.vi_immed + folio_pos(folio);</div><div class='add'>+	unsigned long i;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; folio_nr_pages(folio); i++) {</div><div class='add'>+		memcpy_to_page(folio_page(folio, i), 0, src, PAGE_SIZE);</div><div class='add'>+		src += PAGE_SIZE;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	kaddr = kmap(pp);</div><div class='del'>-	memcpy(kaddr, vip-&gt;vii_immed.vi_immed + offset, PAGE_SIZE);</div><div class='del'>-	kunmap(pp);</div><div class='del'>-	</div><div class='del'>-	flush_dcache_page(pp);</div><div class='del'>-	SetPageUptodate(pp);</div><div class='del'>-        unlock_page(pp);</div><div class='add'>+	folio_mark_uptodate(folio);</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Address space operations for immed files and directories.</div><div class='add'>+ */</div><div class='add'>+const struct address_space_operations vxfs_immed_aops = {</div><div class='add'>+	.read_folio =	vxfs_immed_read_folio,</div><div class='add'>+};</div><div class='head'>diff --git a/fs/freevxfs/vxfs_inode.c b/fs/freevxfs/vxfs_inode.c<br/>index 1f41b25ef38b..21fc94b98209 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/vxfs_inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/vxfs_inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/vxfs_inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/freevxfs/vxfs_inode.c</a></div><div class='hunk'>@@ -1,31 +1,7 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-only</div><div class='ctx'> /*</div><div class='ctx'>  * Copyright (c) 2000-2001 Christoph Hellwig.</div><div class='ctx'>  * Copyright (c) 2016 Krzysztof Blaszkowski</div><div class='del'>- * All rights reserved.</div><div class='del'>- *</div><div class='del'>- * Redistribution and use in source and binary forms, with or without</div><div class='del'>- * modification, are permitted provided that the following conditions</div><div class='del'>- * are met:</div><div class='del'>- * 1. Redistributions of source code must retain the above copyright</div><div class='del'>- *    notice, this list of conditions, and the following disclaimer,</div><div class='del'>- *    without modification.</div><div class='del'>- * 2. The name of the author may not be used to endorse or promote products</div><div class='del'>- *    derived from this software without specific prior written permission.</div><div class='del'>- *</div><div class='del'>- * Alternatively, this software may be distributed under the terms of the</div><div class='del'>- * GNU General Public License ("GPL").</div><div class='del'>- *</div><div class='del'>- * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND</div><div class='del'>- * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE</div><div class='del'>- * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE</div><div class='del'>- * ARE DISCLAIMED. IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE FOR</div><div class='del'>- * ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL</div><div class='del'>- * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS</div><div class='del'>- * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)</div><div class='del'>- * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT</div><div class='del'>- * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY</div><div class='del'>- * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF</div><div class='del'>- * SUCH DAMAGE.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -133,12 +109,9 @@ static inline void dip2vip_cpy(struct vxfs_sb_info *sbi,</div><div class='ctx'> 	set_nlink(inode, vip-&gt;vii_nlink);</div><div class='ctx'> 	inode-&gt;i_size = vip-&gt;vii_size;</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_atime.tv_sec = vip-&gt;vii_atime;</div><div class='del'>-	inode-&gt;i_ctime.tv_sec = vip-&gt;vii_ctime;</div><div class='del'>-	inode-&gt;i_mtime.tv_sec = vip-&gt;vii_mtime;</div><div class='del'>-	inode-&gt;i_atime.tv_nsec = 0;</div><div class='del'>-	inode-&gt;i_ctime.tv_nsec = 0;</div><div class='del'>-	inode-&gt;i_mtime.tv_nsec = 0;</div><div class='add'>+	inode_set_atime(inode, vip-&gt;vii_atime, 0);</div><div class='add'>+	inode_set_ctime(inode, vip-&gt;vii_ctime, 0);</div><div class='add'>+	inode_set_mtime(inode, vip-&gt;vii_mtime, 0);</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_blocks = vip-&gt;vii_blocks;</div><div class='ctx'> 	inode-&gt;i_generation = vip-&gt;vii_gen;</div><div class='hunk'>@@ -285,7 +258,7 @@ vxfs_iget(struct super_block *sbp, ino_t ino)</div><div class='ctx'> 	ip = iget_locked(sbp, ino);</div><div class='ctx'> 	if (!ip)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='del'>-	if (!(ip-&gt;i_state &amp; I_NEW))</div><div class='add'>+	if (!(inode_state_read_once(ip) &amp; I_NEW))</div><div class='ctx'> 		return ip;</div><div class='ctx'> </div><div class='ctx'> 	vip = VXFS_INO(ip);</div><div class='head'>diff --git a/fs/freevxfs/vxfs_inode.h b/fs/freevxfs/vxfs_inode.h<br/>index f012abed125d..1e9e138d2b33 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/vxfs_inode.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/vxfs_inode.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/vxfs_inode.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/freevxfs/vxfs_inode.h</a></div><div class='hunk'>@@ -1,32 +1,7 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0-only */</div><div class='ctx'> /*</div><div class='ctx'>  * Copyright (c) 2000-2001 Christoph Hellwig.</div><div class='ctx'>  * Copyright (c) 2016 Krzysztof Blaszkowski</div><div class='del'>- * All rights reserved.</div><div class='del'>- *</div><div class='del'>- * Redistribution and use in source and binary forms, with or without</div><div class='del'>- * modification, are permitted provided that the following conditions</div><div class='del'>- * are met:</div><div class='del'>- * 1. Redistributions of source code must retain the above copyright</div><div class='del'>- *    notice, this list of conditions, and the following disclaimer,</div><div class='del'>- *    without modification.</div><div class='del'>- * 2. The name of the author may not be used to endorse or promote products</div><div class='del'>- *    derived from this software without specific prior written permission.</div><div class='del'>- *</div><div class='del'>- * Alternatively, this software may be distributed under the terms of the</div><div class='del'>- * GNU General Public License ("GPL").</div><div class='del'>- *</div><div class='del'>- * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND</div><div class='del'>- * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE</div><div class='del'>- * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE</div><div class='del'>- * ARE DISCLAIMED. IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE FOR</div><div class='del'>- * ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL</div><div class='del'>- * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS</div><div class='del'>- * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)</div><div class='del'>- * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT</div><div class='del'>- * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY</div><div class='del'>- * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF</div><div class='del'>- * SUCH DAMAGE.</div><div class='del'>- *</div><div class='ctx'>  */</div><div class='ctx'> #ifndef _VXFS_INODE_H_</div><div class='ctx'> #define _VXFS_INODE_H_</div><div class='head'>diff --git a/fs/freevxfs/vxfs_lookup.c b/fs/freevxfs/vxfs_lookup.c<br/>index a51425634f65..1b0bca8b4cc6 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/vxfs_lookup.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/vxfs_lookup.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/vxfs_lookup.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/freevxfs/vxfs_lookup.c</a></div><div class='hunk'>@@ -1,31 +1,7 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-only</div><div class='ctx'> /*</div><div class='ctx'>  * Copyright (c) 2000-2001 Christoph Hellwig.</div><div class='ctx'>  * Copyright (c) 2016 Krzysztof Blaszkowski</div><div class='del'>- * All rights reserved.</div><div class='del'>- *</div><div class='del'>- * Redistribution and use in source and binary forms, with or without</div><div class='del'>- * modification, are permitted provided that the following conditions</div><div class='del'>- * are met:</div><div class='del'>- * 1. Redistributions of source code must retain the above copyright</div><div class='del'>- *    notice, this list of conditions, and the following disclaimer,</div><div class='del'>- *    without modification.</div><div class='del'>- * 2. The name of the author may not be used to endorse or promote products</div><div class='del'>- *    derived from this software without specific prior written permission.</div><div class='del'>- *</div><div class='del'>- * Alternatively, this software may be distributed under the terms of the</div><div class='del'>- * GNU General Public License ("GPL").</div><div class='del'>- *</div><div class='del'>- * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND</div><div class='del'>- * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE</div><div class='del'>- * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE</div><div class='del'>- * ARE DISCLAIMED. IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE FOR</div><div class='del'>- * ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL</div><div class='del'>- * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS</div><div class='del'>- * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)</div><div class='del'>- * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT</div><div class='del'>- * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY</div><div class='del'>- * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF</div><div class='del'>- * SUCH DAMAGE.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -201,8 +177,7 @@ vxfs_lookup(struct inode *dip, struct dentry *dp, unsigned int flags)</div><div class='ctx'> /**</div><div class='ctx'>  * vxfs_readdir - read a directory</div><div class='ctx'>  * @fp:		the directory to read</div><div class='del'>- * @retp:	return buffer</div><div class='del'>- * @filler:	filldir callback</div><div class='add'>+ * @ctx:	dir_context for filldir/readdir</div><div class='ctx'>  *</div><div class='ctx'>  * Description:</div><div class='ctx'>  *   vxfs_readdir fills @retp with directory entries from @fp</div><div class='head'>diff --git a/fs/freevxfs/vxfs_olt.c b/fs/freevxfs/vxfs_olt.c<br/>index 813da6685151..23f35187c289 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/vxfs_olt.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/vxfs_olt.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/vxfs_olt.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/freevxfs/vxfs_olt.c</a></div><div class='hunk'>@@ -1,30 +1,6 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-only</div><div class='ctx'> /*</div><div class='ctx'>  * Copyright (c) 2000-2001 Christoph Hellwig.</div><div class='del'>- * All rights reserved.</div><div class='del'>- *</div><div class='del'>- * Redistribution and use in source and binary forms, with or without</div><div class='del'>- * modification, are permitted provided that the following conditions</div><div class='del'>- * are met:</div><div class='del'>- * 1. Redistributions of source code must retain the above copyright</div><div class='del'>- *    notice, this list of conditions, and the following disclaimer,</div><div class='del'>- *    without modification.</div><div class='del'>- * 2. The name of the author may not be used to endorse or promote products</div><div class='del'>- *    derived from this software without specific prior written permission.</div><div class='del'>- *</div><div class='del'>- * Alternatively, this software may be distributed under the terms of the</div><div class='del'>- * GNU General Public License ("GPL").</div><div class='del'>- *</div><div class='del'>- * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND</div><div class='del'>- * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE</div><div class='del'>- * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE</div><div class='del'>- * ARE DISCLAIMED. IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE FOR</div><div class='del'>- * ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL</div><div class='del'>- * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS</div><div class='del'>- * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)</div><div class='del'>- * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT</div><div class='del'>- * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY</div><div class='del'>- * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF</div><div class='del'>- * SUCH DAMAGE.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> /* </div><div class='head'>diff --git a/fs/freevxfs/vxfs_olt.h b/fs/freevxfs/vxfs_olt.h<br/>index 0c0b0c9fa557..53afba08d617 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/vxfs_olt.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/vxfs_olt.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/vxfs_olt.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/freevxfs/vxfs_olt.h</a></div><div class='hunk'>@@ -1,31 +1,6 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0-only */</div><div class='ctx'> /*</div><div class='ctx'>  * Copyright (c) 2000-2001 Christoph Hellwig.</div><div class='del'>- * All rights reserved.</div><div class='del'>- *</div><div class='del'>- * Redistribution and use in source and binary forms, with or without</div><div class='del'>- * modification, are permitted provided that the following conditions</div><div class='del'>- * are met:</div><div class='del'>- * 1. Redistributions of source code must retain the above copyright</div><div class='del'>- *    notice, this list of conditions, and the following disclaimer,</div><div class='del'>- *    without modification.</div><div class='del'>- * 2. The name of the author may not be used to endorse or promote products</div><div class='del'>- *    derived from this software without specific prior written permission.</div><div class='del'>- *</div><div class='del'>- * Alternatively, this software may be distributed under the terms of the</div><div class='del'>- * GNU General Public License ("GPL").</div><div class='del'>- *</div><div class='del'>- * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND</div><div class='del'>- * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE</div><div class='del'>- * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE</div><div class='del'>- * ARE DISCLAIMED. IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE FOR</div><div class='del'>- * ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL</div><div class='del'>- * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS</div><div class='del'>- * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)</div><div class='del'>- * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT</div><div class='del'>- * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY</div><div class='del'>- * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF</div><div class='del'>- * SUCH DAMAGE.</div><div class='del'>- *</div><div class='ctx'>  */</div><div class='ctx'> #ifndef _VXFS_OLT_H_</div><div class='ctx'> #define _VXFS_OLT_H_</div><div class='head'>diff --git a/fs/freevxfs/vxfs_subr.c b/fs/freevxfs/vxfs_subr.c<br/>index e806694d4145..f439877ea6e8 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/vxfs_subr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/vxfs_subr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/vxfs_subr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/freevxfs/vxfs_subr.c</a></div><div class='hunk'>@@ -1,30 +1,6 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-only</div><div class='ctx'> /*</div><div class='ctx'>  * Copyright (c) 2000-2001 Christoph Hellwig.</div><div class='del'>- * All rights reserved.</div><div class='del'>- *</div><div class='del'>- * Redistribution and use in source and binary forms, with or without</div><div class='del'>- * modification, are permitted provided that the following conditions</div><div class='del'>- * are met:</div><div class='del'>- * 1. Redistributions of source code must retain the above copyright</div><div class='del'>- *    notice, this list of conditions, and the following disclaimer,</div><div class='del'>- *    without modification.</div><div class='del'>- * 2. The name of the author may not be used to endorse or promote products</div><div class='del'>- *    derived from this software without specific prior written permission.</div><div class='del'>- *</div><div class='del'>- * Alternatively, this software may be distributed under the terms of the</div><div class='del'>- * GNU General Public License ("GPL").</div><div class='del'>- *</div><div class='del'>- * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND</div><div class='del'>- * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE</div><div class='del'>- * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE</div><div class='del'>- * ARE DISCLAIMED. IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE FOR</div><div class='del'>- * ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL</div><div class='del'>- * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS</div><div class='del'>- * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)</div><div class='del'>- * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT</div><div class='del'>- * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY</div><div class='del'>- * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF</div><div class='del'>- * SUCH DAMAGE.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -38,11 +14,11 @@</div><div class='ctx'> #include "vxfs_extern.h"</div><div class='ctx'> </div><div class='ctx'> </div><div class='del'>-static int		vxfs_readpage(struct file *, struct page *);</div><div class='add'>+static int		vxfs_read_folio(struct file *, struct folio *);</div><div class='ctx'> static sector_t		vxfs_bmap(struct address_space *, sector_t);</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations vxfs_aops = {</div><div class='del'>-	.readpage =		vxfs_readpage,</div><div class='add'>+	.read_folio =		vxfs_read_folio,</div><div class='ctx'> 	.bmap =			vxfs_bmap,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -55,7 +31,7 @@ vxfs_put_page(struct page *pp)</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * vxfs_get_page - read a page into memory.</div><div class='del'>- * @ip:		inode to read from</div><div class='add'>+ * @mapping:	mapping to read from</div><div class='ctx'>  * @n:		page number</div><div class='ctx'>  *</div><div class='ctx'>  * Description:</div><div class='hunk'>@@ -75,15 +51,9 @@ vxfs_get_page(struct address_space *mapping, u_long n)</div><div class='ctx'> 		kmap(pp);</div><div class='ctx'> 		/** if (!PageChecked(pp)) **/</div><div class='ctx'> 			/** vxfs_check_page(pp); **/</div><div class='del'>-		if (PageError(pp))</div><div class='del'>-			goto fail;</div><div class='ctx'> 	}</div><div class='ctx'> 	</div><div class='ctx'> 	return (pp);</div><div class='del'>-		 </div><div class='del'>-fail:</div><div class='del'>-	vxfs_put_page(pp);</div><div class='del'>-	return ERR_PTR(-EIO);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -111,14 +81,14 @@ vxfs_bread(struct inode *ip, int block)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * vxfs_get_block - locate buffer for given inode,block tuple </div><div class='add'>+ * vxfs_getblk - locate buffer for given inode,block tuple</div><div class='ctx'>  * @ip:		inode</div><div class='ctx'>  * @iblock:	logical block</div><div class='ctx'>  * @bp:		buffer skeleton</div><div class='ctx'>  * @create:	%TRUE if blocks may be newly allocated.</div><div class='ctx'>  *</div><div class='ctx'>  * Description:</div><div class='del'>- *   The vxfs_get_block function fills @bp with the right physical</div><div class='add'>+ *   The vxfs_getblk function fills @bp with the right physical</div><div class='ctx'>  *   block and device number to perform a lowlevel read/write on</div><div class='ctx'>  *   it.</div><div class='ctx'>  *</div><div class='hunk'>@@ -141,24 +111,23 @@ vxfs_getblk(struct inode *ip, sector_t iblock,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * vxfs_readpage - read one page synchronously into the pagecache</div><div class='add'>+ * vxfs_read_folio - read one page synchronously into the pagecache</div><div class='ctx'>  * @file:	file context (unused)</div><div class='del'>- * @page:	page frame to fill in.</div><div class='add'>+ * @folio:	folio to fill in.</div><div class='ctx'>  *</div><div class='ctx'>  * Description:</div><div class='del'>- *   The vxfs_readpage routine reads @page synchronously into the</div><div class='add'>+ *   The vxfs_read_folio routine reads @folio synchronously into the</div><div class='ctx'>  *   pagecache.</div><div class='ctx'>  *</div><div class='ctx'>  * Returns:</div><div class='ctx'>  *   Zero on success, else a negative error code.</div><div class='ctx'>  *</div><div class='ctx'>  * Locking status:</div><div class='del'>- *   @page is locked and will be unlocked.</div><div class='add'>+ *   @folio is locked and will be unlocked.</div><div class='ctx'>  */</div><div class='del'>-static int</div><div class='del'>-vxfs_readpage(struct file *file, struct page *page)</div><div class='add'>+static int vxfs_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	return block_read_full_page(page, vxfs_getblk);</div><div class='add'>+	return block_read_full_folio(folio, vxfs_getblk);</div><div class='ctx'> }</div><div class='ctx'>  </div><div class='ctx'> /**</div><div class='head'>diff --git a/fs/freevxfs/vxfs_super.c b/fs/freevxfs/vxfs_super.c<br/>index 578a5062706e..fabe60778658 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/vxfs_super.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/freevxfs/vxfs_super.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/freevxfs/vxfs_super.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/freevxfs/vxfs_super.c</a></div><div class='hunk'>@@ -1,31 +1,7 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-only</div><div class='ctx'> /*</div><div class='ctx'>  * Copyright (c) 2000-2001 Christoph Hellwig.</div><div class='ctx'>  * Copyright (c) 2016 Krzysztof Blaszkowski</div><div class='del'>- * All rights reserved.</div><div class='del'>- *</div><div class='del'>- * Redistribution and use in source and binary forms, with or without</div><div class='del'>- * modification, are permitted provided that the following conditions</div><div class='del'>- * are met:</div><div class='del'>- * 1. Redistributions of source code must retain the above copyright</div><div class='del'>- *    notice, this list of conditions, and the following disclaimer,</div><div class='del'>- *    without modification.</div><div class='del'>- * 2. The name of the author may not be used to endorse or promote products</div><div class='del'>- *    derived from this software without specific prior written permission.</div><div class='del'>- *</div><div class='del'>- * Alternatively, this software may be distributed under the terms of the</div><div class='del'>- * GNU General Public License ("GPL").</div><div class='del'>- *</div><div class='del'>- * THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND</div><div class='del'>- * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE</div><div class='del'>- * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE</div><div class='del'>- * ARE DISCLAIMED. IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE FOR</div><div class='del'>- * ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL</div><div class='del'>- * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS</div><div class='del'>- * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)</div><div class='del'>- * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT</div><div class='del'>- * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY</div><div class='del'>- * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF</div><div class='del'>- * SUCH DAMAGE.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -41,7 +17,7 @@</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/stat.h&gt;</div><div class='ctx'> #include &lt;linux/vfs.h&gt;</div><div class='del'>-#include &lt;linux/mount.h&gt;</div><div class='add'>+#include &lt;linux/fs_context.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "vxfs.h"</div><div class='ctx'> #include "vxfs_extern.h"</div><div class='hunk'>@@ -100,6 +76,7 @@ vxfs_statfs(struct dentry *dentry, struct kstatfs *bufp)</div><div class='ctx'> {</div><div class='ctx'> 	struct vxfs_sb_info		*infp = VXFS_SBI(dentry-&gt;d_sb);</div><div class='ctx'> 	struct vxfs_sb *raw_sb = infp-&gt;vsi_raw;</div><div class='add'>+	u64 id = huge_encode_dev(dentry-&gt;d_sb-&gt;s_bdev-&gt;bd_dev);</div><div class='ctx'> </div><div class='ctx'> 	bufp-&gt;f_type = VXFS_SUPER_MAGIC;</div><div class='ctx'> 	bufp-&gt;f_bsize = dentry-&gt;d_sb-&gt;s_blocksize;</div><div class='hunk'>@@ -108,15 +85,16 @@ vxfs_statfs(struct dentry *dentry, struct kstatfs *bufp)</div><div class='ctx'> 	bufp-&gt;f_bavail = 0;</div><div class='ctx'> 	bufp-&gt;f_files = 0;</div><div class='ctx'> 	bufp-&gt;f_ffree = fs32_to_cpu(infp, raw_sb-&gt;vs_ifree);</div><div class='add'>+	bufp-&gt;f_fsid = u64_to_fsid(id);</div><div class='ctx'> 	bufp-&gt;f_namelen = VXFS_NAMELEN;</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int vxfs_remount(struct super_block *sb, int *flags, char *data)</div><div class='add'>+static int vxfs_reconfigure(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	sync_filesystem(sb);</div><div class='del'>-	*flags |= SB_RDONLY;</div><div class='add'>+	sync_filesystem(fc-&gt;root-&gt;d_sb);</div><div class='add'>+	fc-&gt;sb_flags |= SB_RDONLY;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -124,7 +102,7 @@ static struct inode *vxfs_alloc_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct vxfs_inode_info *vi;</div><div class='ctx'> </div><div class='del'>-	vi = kmem_cache_alloc(vxfs_inode_cachep, GFP_KERNEL);</div><div class='add'>+	vi = alloc_inode_sb(sb, vxfs_inode_cachep, GFP_KERNEL);</div><div class='ctx'> 	if (!vi)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	inode_init_once(&amp;vi-&gt;vfs_inode);</div><div class='hunk'>@@ -142,24 +120,24 @@ static const struct super_operations vxfs_super_ops = {</div><div class='ctx'> 	.evict_inode		= vxfs_evict_inode,</div><div class='ctx'> 	.put_super		= vxfs_put_super,</div><div class='ctx'> 	.statfs			= vxfs_statfs,</div><div class='del'>-	.remount_fs		= vxfs_remount,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int vxfs_try_sb_magic(struct super_block *sbp, int silent,</div><div class='add'>+static int vxfs_try_sb_magic(struct super_block *sbp, struct fs_context *fc,</div><div class='ctx'> 		unsigned blk, __fs32 magic)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *bp;</div><div class='ctx'> 	struct vxfs_sb *rsbp;</div><div class='ctx'> 	struct vxfs_sb_info *infp = VXFS_SBI(sbp);</div><div class='add'>+	int silent = fc-&gt;sb_flags &amp; SB_SILENT;</div><div class='ctx'> 	int rc = -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	bp = sb_bread(sbp, blk);</div><div class='ctx'> 	do {</div><div class='ctx'> 		if (!bp || !buffer_mapped(bp)) {</div><div class='ctx'> 			if (!silent) {</div><div class='del'>-				printk(KERN_WARNING</div><div class='del'>-					"vxfs: unable to read disk superblock at %u\n",</div><div class='del'>-					blk);</div><div class='add'>+				warnf(fc,</div><div class='add'>+				      "vxfs: unable to read disk superblock at %u",</div><div class='add'>+				      blk);</div><div class='ctx'> 			}</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -168,9 +146,9 @@ static int vxfs_try_sb_magic(struct super_block *sbp, int silent,</div><div class='ctx'> 		rsbp = (struct vxfs_sb *)bp-&gt;b_data;</div><div class='ctx'> 		if (rsbp-&gt;vs_magic != magic) {</div><div class='ctx'> 			if (!silent)</div><div class='del'>-				printk(KERN_NOTICE</div><div class='del'>-					"vxfs: WRONG superblock magic %08x at %u\n",</div><div class='del'>-					rsbp-&gt;vs_magic, blk);</div><div class='add'>+				infof(fc,</div><div class='add'>+				      "vxfs: WRONG superblock magic %08x at %u",</div><div class='add'>+				      rsbp-&gt;vs_magic, blk);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -189,10 +167,9 @@ static int vxfs_try_sb_magic(struct super_block *sbp, int silent,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * vxfs_read_super - read superblock into memory and initialize filesystem</div><div class='add'>+ * vxfs_fill_super - read superblock into memory and initialize filesystem</div><div class='ctx'>  * @sbp:		VFS superblock (to fill)</div><div class='del'>- * @dp:			fs private mount data</div><div class='del'>- * @silent:		do not complain loudly when sth is wrong</div><div class='add'>+ * @fc:			filesytem context</div><div class='ctx'>  *</div><div class='ctx'>  * Description:</div><div class='ctx'>  *   We are called on the first mount of a filesystem to read the</div><div class='hunk'>@@ -204,26 +181,27 @@ static int vxfs_try_sb_magic(struct super_block *sbp, int silent,</div><div class='ctx'>  * Locking:</div><div class='ctx'>  *   We are under @sbp-&gt;s_lock.</div><div class='ctx'>  */</div><div class='del'>-static int vxfs_fill_super(struct super_block *sbp, void *dp, int silent)</div><div class='add'>+static int vxfs_fill_super(struct super_block *sbp, struct fs_context *fc)</div><div class='ctx'> {</div><div class='ctx'> 	struct vxfs_sb_info	*infp;</div><div class='ctx'> 	struct vxfs_sb		*rsbp;</div><div class='ctx'> 	u_long			bsize;</div><div class='ctx'> 	struct inode *root;</div><div class='ctx'> 	int ret = -EINVAL;</div><div class='add'>+	int silent = fc-&gt;sb_flags &amp; SB_SILENT;</div><div class='ctx'> 	u32 j;</div><div class='ctx'> </div><div class='ctx'> 	sbp-&gt;s_flags |= SB_RDONLY;</div><div class='ctx'> </div><div class='ctx'> 	infp = kzalloc(sizeof(*infp), GFP_KERNEL);</div><div class='ctx'> 	if (!infp) {</div><div class='del'>-		printk(KERN_WARNING "vxfs: unable to allocate incore superblock\n");</div><div class='add'>+		warnf(fc, "vxfs: unable to allocate incore superblock");</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	bsize = sb_min_blocksize(sbp, BLOCK_SIZE);</div><div class='ctx'> 	if (!bsize) {</div><div class='del'>-		printk(KERN_WARNING "vxfs: unable to set blocksize\n");</div><div class='add'>+		warnf(fc, "vxfs: unable to set blocksize");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -232,24 +210,24 @@ static int vxfs_fill_super(struct super_block *sbp, void *dp, int silent)</div><div class='ctx'> 	sbp-&gt;s_time_min = 0;</div><div class='ctx'> 	sbp-&gt;s_time_max = U32_MAX;</div><div class='ctx'> </div><div class='del'>-	if (!vxfs_try_sb_magic(sbp, silent, 1,</div><div class='add'>+	if (!vxfs_try_sb_magic(sbp, fc, 1,</div><div class='ctx'> 			(__force __fs32)cpu_to_le32(VXFS_SUPER_MAGIC))) {</div><div class='ctx'> 		/* Unixware, x86 */</div><div class='ctx'> 		infp-&gt;byte_order = VXFS_BO_LE;</div><div class='del'>-	} else if (!vxfs_try_sb_magic(sbp, silent, 8,</div><div class='add'>+	} else if (!vxfs_try_sb_magic(sbp, fc, 8,</div><div class='ctx'> 			(__force __fs32)cpu_to_be32(VXFS_SUPER_MAGIC))) {</div><div class='ctx'> 		/* HP-UX, parisc */</div><div class='ctx'> 		infp-&gt;byte_order = VXFS_BO_BE;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		if (!silent)</div><div class='del'>-			printk(KERN_NOTICE "vxfs: can't find superblock.\n");</div><div class='add'>+			infof(fc, "vxfs: can't find superblock.");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	rsbp = infp-&gt;vsi_raw;</div><div class='ctx'> 	j = fs32_to_cpu(infp, rsbp-&gt;vs_version);</div><div class='ctx'> 	if ((j &lt; 2 || j &gt; 4) &amp;&amp; !silent) {</div><div class='del'>-		printk(KERN_NOTICE "vxfs: unsupported VxFS version (%d)\n", j);</div><div class='add'>+		infof(fc, "vxfs: unsupported VxFS version (%d)", j);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -266,17 +244,17 @@ static int vxfs_fill_super(struct super_block *sbp, void *dp, int silent)</div><div class='ctx'> </div><div class='ctx'> 	j = fs32_to_cpu(infp, rsbp-&gt;vs_bsize);</div><div class='ctx'> 	if (!sb_set_blocksize(sbp, j)) {</div><div class='del'>-		printk(KERN_WARNING "vxfs: unable to set final block size\n");</div><div class='add'>+		warnf(fc, "vxfs: unable to set final block size");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (vxfs_read_olt(sbp, bsize)) {</div><div class='del'>-		printk(KERN_WARNING "vxfs: unable to read olt\n");</div><div class='add'>+		warnf(fc, "vxfs: unable to read olt");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (vxfs_read_fshead(sbp)) {</div><div class='del'>-		printk(KERN_WARNING "vxfs: unable to read fshead\n");</div><div class='add'>+		warnf(fc, "vxfs: unable to read fshead");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -287,7 +265,7 @@ static int vxfs_fill_super(struct super_block *sbp, void *dp, int silent)</div><div class='ctx'> 	}</div><div class='ctx'> 	sbp-&gt;s_root = d_make_root(root);</div><div class='ctx'> 	if (!sbp-&gt;s_root) {</div><div class='del'>-		printk(KERN_WARNING "vxfs: unable to get root dentry.\n");</div><div class='add'>+		warnf(fc, "vxfs: unable to get root dentry.");</div><div class='ctx'> 		goto out_free_ilist;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -306,18 +284,29 @@ out:</div><div class='ctx'> /*</div><div class='ctx'>  * The usual module blurb.</div><div class='ctx'>  */</div><div class='del'>-static struct dentry *vxfs_mount(struct file_system_type *fs_type,</div><div class='del'>-	int flags, const char *dev_name, void *data)</div><div class='add'>+static int vxfs_get_tree(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	return get_tree_bdev(fc, vxfs_fill_super);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct fs_context_operations vxfs_context_ops = {</div><div class='add'>+	.get_tree	= vxfs_get_tree,</div><div class='add'>+	.reconfigure	= vxfs_reconfigure,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int vxfs_init_fs_context(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	return mount_bdev(fs_type, flags, dev_name, data, vxfs_fill_super);</div><div class='add'>+	fc-&gt;ops = &amp;vxfs_context_ops;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct file_system_type vxfs_fs_type = {</div><div class='ctx'> 	.owner		= THIS_MODULE,</div><div class='ctx'> 	.name		= "vxfs",</div><div class='del'>-	.mount		= vxfs_mount,</div><div class='ctx'> 	.kill_sb	= kill_block_super,</div><div class='ctx'> 	.fs_flags	= FS_REQUIRES_DEV,</div><div class='add'>+	.init_fs_context = vxfs_init_fs_context,</div><div class='ctx'> };</div><div class='ctx'> MODULE_ALIAS_FS("vxfs"); /* makes mount -t vxfs autoload the module */</div><div class='ctx'> MODULE_ALIAS("vxfs");</div><div class='hunk'>@@ -329,7 +318,7 @@ vxfs_init(void)</div><div class='ctx'> </div><div class='ctx'> 	vxfs_inode_cachep = kmem_cache_create_usercopy("vxfs_inode",</div><div class='ctx'> 			sizeof(struct vxfs_inode_info), 0,</div><div class='del'>-			SLAB_RECLAIM_ACCOUNT|SLAB_MEM_SPREAD,</div><div class='add'>+			SLAB_RECLAIM_ACCOUNT,</div><div class='ctx'> 			offsetof(struct vxfs_inode_info, vii_immed.vi_immed),</div><div class='ctx'> 			sizeof_field(struct vxfs_inode_info,</div><div class='ctx'> 				vii_immed.vi_immed),</div><div class='head'>diff --git a/fs/fs-writeback.c b/fs/fs-writeback.c<br/>index 67f0e88eed01..6800886c4d10 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fs-writeback.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fs-writeback.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fs-writeback.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fs-writeback.c</a></div><div class='hunk'>@@ -14,6 +14,7 @@</div><div class='ctx'>  *		Additions for address_space-based writeback</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/sched/sysctl.h&gt;</div><div class='ctx'> #include &lt;linux/kernel.h&gt;</div><div class='ctx'> #include &lt;linux/export.h&gt;</div><div class='ctx'> #include &lt;linux/spinlock.h&gt;</div><div class='hunk'>@@ -32,11 +33,6 @@</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * 4MB minimal write chunk size</div><div class='del'>- */</div><div class='del'>-#define MIN_WRITEBACK_PAGES	(4096UL &gt;&gt; (PAGE_SHIFT - 10))</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * Passed into wb_writeback(), essentially a subset of writeback_control</div><div class='ctx'>  */</div><div class='ctx'> struct wb_writeback_work {</div><div class='hunk'>@@ -65,7 +61,7 @@ struct wb_writeback_work {</div><div class='ctx'>  * timestamps written to disk after 12 hours, but in the worst case a</div><div class='ctx'>  * few inodes might not their timestamps updated for 24 hours.</div><div class='ctx'>  */</div><div class='del'>-unsigned int dirtytime_expire_interval = 12 * 60 * 60;</div><div class='add'>+static unsigned int dirtytime_expire_interval = 12 * 60 * 60;</div><div class='ctx'> </div><div class='ctx'> static inline struct inode *wb_inode(struct list_head *head)</div><div class='ctx'> {</div><div class='hunk'>@@ -120,6 +116,8 @@ static bool inode_io_list_move_locked(struct inode *inode,</div><div class='ctx'> 				      struct list_head *head)</div><div class='ctx'> {</div><div class='ctx'> 	assert_spin_locked(&amp;wb-&gt;list_lock);</div><div class='add'>+	assert_spin_locked(&amp;inode-&gt;i_lock);</div><div class='add'>+	WARN_ON_ONCE(inode_state_read(inode) &amp; I_FREEING);</div><div class='ctx'> </div><div class='ctx'> 	list_move(&amp;inode-&gt;i_io_list, head);</div><div class='ctx'> </div><div class='hunk'>@@ -133,14 +131,38 @@ static bool inode_io_list_move_locked(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> static void wb_wakeup(struct bdi_writeback *wb)</div><div class='ctx'> {</div><div class='del'>-	spin_lock_bh(&amp;wb-&gt;work_lock);</div><div class='add'>+	spin_lock_irq(&amp;wb-&gt;work_lock);</div><div class='ctx'> 	if (test_bit(WB_registered, &amp;wb-&gt;state))</div><div class='ctx'> 		mod_delayed_work(bdi_wq, &amp;wb-&gt;dwork, 0);</div><div class='del'>-	spin_unlock_bh(&amp;wb-&gt;work_lock);</div><div class='add'>+	spin_unlock_irq(&amp;wb-&gt;work_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void finish_writeback_work(struct bdi_writeback *wb,</div><div class='del'>-				  struct wb_writeback_work *work)</div><div class='add'>+/*</div><div class='add'>+ * This function is used when the first inode for this wb is marked dirty. It</div><div class='add'>+ * wakes-up the corresponding bdi thread which should then take care of the</div><div class='add'>+ * periodic background write-out of dirty inodes. Since the write-out would</div><div class='add'>+ * starts only 'dirty_writeback_interval' centisecs from now anyway, we just</div><div class='add'>+ * set up a timer which wakes the bdi thread up later.</div><div class='add'>+ *</div><div class='add'>+ * Note, we wouldn't bother setting up the timer, but this function is on the</div><div class='add'>+ * fast-path (used by '__mark_inode_dirty()'), so we save few context switches</div><div class='add'>+ * by delaying the wake-up.</div><div class='add'>+ *</div><div class='add'>+ * We have to be careful not to postpone flush work if it is scheduled for</div><div class='add'>+ * earlier. Thus we use queue_delayed_work().</div><div class='add'>+ */</div><div class='add'>+static void wb_wakeup_delayed(struct bdi_writeback *wb)</div><div class='add'>+{</div><div class='add'>+	unsigned long timeout;</div><div class='add'>+</div><div class='add'>+	timeout = msecs_to_jiffies(dirty_writeback_interval * 10);</div><div class='add'>+	spin_lock_irq(&amp;wb-&gt;work_lock);</div><div class='add'>+	if (test_bit(WB_registered, &amp;wb-&gt;state))</div><div class='add'>+		queue_delayed_work(bdi_wq, &amp;wb-&gt;dwork, timeout);</div><div class='add'>+	spin_unlock_irq(&amp;wb-&gt;work_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void finish_writeback_work(struct wb_writeback_work *work)</div><div class='ctx'> {</div><div class='ctx'> 	struct wb_completion *done = work-&gt;done;</div><div class='ctx'> </div><div class='hunk'>@@ -163,15 +185,28 @@ static void wb_queue_work(struct bdi_writeback *wb,</div><div class='ctx'> 	if (work-&gt;done)</div><div class='ctx'> 		atomic_inc(&amp;work-&gt;done-&gt;cnt);</div><div class='ctx'> </div><div class='del'>-	spin_lock_bh(&amp;wb-&gt;work_lock);</div><div class='add'>+	spin_lock_irq(&amp;wb-&gt;work_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (test_bit(WB_registered, &amp;wb-&gt;state)) {</div><div class='ctx'> 		list_add_tail(&amp;work-&gt;list, &amp;wb-&gt;work_list);</div><div class='ctx'> 		mod_delayed_work(bdi_wq, &amp;wb-&gt;dwork, 0);</div><div class='ctx'> 	} else</div><div class='del'>-		finish_writeback_work(wb, work);</div><div class='add'>+		finish_writeback_work(work);</div><div class='ctx'> </div><div class='del'>-	spin_unlock_bh(&amp;wb-&gt;work_lock);</div><div class='add'>+	spin_unlock_irq(&amp;wb-&gt;work_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool wb_wait_for_completion_cb(struct wb_completion *done)</div><div class='add'>+{</div><div class='add'>+	unsigned long waited_secs = (jiffies - done-&gt;wait_start) / HZ;</div><div class='add'>+</div><div class='add'>+	done-&gt;progress_stamp = jiffies;</div><div class='add'>+	if (waited_secs &gt; sysctl_hung_task_timeout_secs)</div><div class='add'>+		pr_info("INFO: The task %s:%d has been waiting for writeback "</div><div class='add'>+			"completion for more than %lu seconds.",</div><div class='add'>+			current-&gt;comm, current-&gt;pid, waited_secs);</div><div class='add'>+</div><div class='add'>+	return !atomic_read(&amp;done-&gt;cnt);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -186,8 +221,9 @@ static void wb_queue_work(struct bdi_writeback *wb,</div><div class='ctx'>  */</div><div class='ctx'> void wb_wait_for_completion(struct wb_completion *done)</div><div class='ctx'> {</div><div class='add'>+	done-&gt;wait_start = jiffies;</div><div class='ctx'> 	atomic_dec(&amp;done-&gt;cnt);		/* put down the initial count */</div><div class='del'>-	wait_event(*done-&gt;waitq, !atomic_read(&amp;done-&gt;cnt));</div><div class='add'>+	wait_event(*done-&gt;waitq, wb_wait_for_completion_cb(done));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_CGROUP_WRITEBACK</div><div class='hunk'>@@ -235,7 +271,7 @@ void wb_wait_for_completion(struct wb_completion *done)</div><div class='ctx'> static atomic_t isw_nr_in_flight = ATOMIC_INIT(0);</div><div class='ctx'> static struct workqueue_struct *isw_wq;</div><div class='ctx'> </div><div class='del'>-void __inode_attach_wb(struct inode *inode, struct page *page)</div><div class='add'>+void __inode_attach_wb(struct inode *inode, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct backing_dev_info *bdi = inode_to_bdi(inode);</div><div class='ctx'> 	struct bdi_writeback *wb = NULL;</div><div class='hunk'>@@ -243,8 +279,8 @@ void __inode_attach_wb(struct inode *inode, struct page *page)</div><div class='ctx'> 	if (inode_cgwb_enabled(inode)) {</div><div class='ctx'> 		struct cgroup_subsys_state *memcg_css;</div><div class='ctx'> </div><div class='del'>-		if (page) {</div><div class='del'>-			memcg_css = mem_cgroup_css_from_page(page);</div><div class='add'>+		if (folio) {</div><div class='add'>+			memcg_css = mem_cgroup_css_from_folio(folio);</div><div class='ctx'> 			wb = wb_get_create(bdi, memcg_css, GFP_ATOMIC);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			/* must pin memcg_css, see wb_get_create() */</div><div class='hunk'>@@ -264,7 +300,6 @@ void __inode_attach_wb(struct inode *inode, struct page *page)</div><div class='ctx'> 	if (unlikely(cmpxchg(&amp;inode-&gt;i_wb, NULL, wb)))</div><div class='ctx'> 		wb_put(wb);</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL_GPL(__inode_attach_wb);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * inode_cgwb_move_to_attached - put the inode onto wb-&gt;b_attached list</div><div class='hunk'>@@ -279,8 +314,9 @@ static void inode_cgwb_move_to_attached(struct inode *inode,</div><div class='ctx'> {</div><div class='ctx'> 	assert_spin_locked(&amp;wb-&gt;list_lock);</div><div class='ctx'> 	assert_spin_locked(&amp;inode-&gt;i_lock);</div><div class='add'>+	WARN_ON_ONCE(inode_state_read(inode) &amp; I_FREEING);</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_state &amp;= ~I_SYNC_QUEUED;</div><div class='add'>+	inode_state_clear(inode, I_SYNC_QUEUED);</div><div class='ctx'> 	if (wb != &amp;wb-&gt;bdi-&gt;wb)</div><div class='ctx'> 		list_move(&amp;inode-&gt;i_io_list, &amp;wb-&gt;b_attached);</div><div class='ctx'> 	else</div><div class='hunk'>@@ -342,7 +378,8 @@ static struct bdi_writeback *inode_to_wb_and_lock_list(struct inode *inode)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct inode_switch_wbs_context {</div><div class='del'>-	struct rcu_work		work;</div><div class='add'>+	/* List of queued switching contexts for the wb */</div><div class='add'>+	struct llist_node	list;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Multiple inodes can be switched at once.  The switching procedure</div><div class='hunk'>@@ -352,7 +389,6 @@ struct inode_switch_wbs_context {</div><div class='ctx'> 	 * array embedded into struct inode_switch_wbs_context.  Otherwise</div><div class='ctx'> 	 * an inode could be left in a non-consistent state.</div><div class='ctx'> 	 */</div><div class='del'>-	struct bdi_writeback	*new_wb;</div><div class='ctx'> 	struct inode		*inodes[];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -372,7 +408,7 @@ static bool inode_do_switch_wbs(struct inode *inode,</div><div class='ctx'> {</div><div class='ctx'> 	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='ctx'> 	XA_STATE(xas, &amp;mapping-&gt;i_pages, 0);</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	bool switched = false;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='hunk'>@@ -382,28 +418,30 @@ static bool inode_do_switch_wbs(struct inode *inode,</div><div class='ctx'> 	 * Once I_FREEING or I_WILL_FREE are visible under i_lock, the eviction</div><div class='ctx'> 	 * path owns the inode and we shouldn't modify -&gt;i_io_list.</div><div class='ctx'> 	 */</div><div class='del'>-	if (unlikely(inode-&gt;i_state &amp; (I_FREEING | I_WILL_FREE)))</div><div class='add'>+	if (unlikely(inode_state_read(inode) &amp; (I_FREEING | I_WILL_FREE)))</div><div class='ctx'> 		goto skip_switch;</div><div class='ctx'> </div><div class='ctx'> 	trace_inode_switch_wbs(inode, old_wb, new_wb);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Count and transfer stats.  Note that PAGECACHE_TAG_DIRTY points</div><div class='del'>-	 * to possibly dirty pages while PAGECACHE_TAG_WRITEBACK points to</div><div class='del'>-	 * pages actually under writeback.</div><div class='add'>+	 * to possibly dirty folios while PAGECACHE_TAG_WRITEBACK points to</div><div class='add'>+	 * folios actually under writeback.</div><div class='ctx'> 	 */</div><div class='del'>-	xas_for_each_marked(&amp;xas, page, ULONG_MAX, PAGECACHE_TAG_DIRTY) {</div><div class='del'>-		if (PageDirty(page)) {</div><div class='del'>-			dec_wb_stat(old_wb, WB_RECLAIMABLE);</div><div class='del'>-			inc_wb_stat(new_wb, WB_RECLAIMABLE);</div><div class='add'>+	xas_for_each_marked(&amp;xas, folio, ULONG_MAX, PAGECACHE_TAG_DIRTY) {</div><div class='add'>+		if (folio_test_dirty(folio)) {</div><div class='add'>+			long nr = folio_nr_pages(folio);</div><div class='add'>+			wb_stat_mod(old_wb, WB_RECLAIMABLE, -nr);</div><div class='add'>+			wb_stat_mod(new_wb, WB_RECLAIMABLE, nr);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	xas_set(&amp;xas, 0);</div><div class='del'>-	xas_for_each_marked(&amp;xas, page, ULONG_MAX, PAGECACHE_TAG_WRITEBACK) {</div><div class='del'>-		WARN_ON_ONCE(!PageWriteback(page));</div><div class='del'>-		dec_wb_stat(old_wb, WB_WRITEBACK);</div><div class='del'>-		inc_wb_stat(new_wb, WB_WRITEBACK);</div><div class='add'>+	xas_for_each_marked(&amp;xas, folio, ULONG_MAX, PAGECACHE_TAG_WRITEBACK) {</div><div class='add'>+		long nr = folio_nr_pages(folio);</div><div class='add'>+		WARN_ON_ONCE(!folio_test_writeback(folio));</div><div class='add'>+		wb_stat_mod(old_wb, WB_WRITEBACK, -nr);</div><div class='add'>+		wb_stat_mod(new_wb, WB_WRITEBACK, nr);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (mapping_tagged(mapping, PAGECACHE_TAG_WRITEBACK)) {</div><div class='hunk'>@@ -417,22 +455,23 @@ static bool inode_do_switch_wbs(struct inode *inode,</div><div class='ctx'> 	 * Transfer to @new_wb's IO list if necessary.  If the @inode is dirty,</div><div class='ctx'> 	 * the specific list @inode was on is ignored and the @inode is put on</div><div class='ctx'> 	 * -&gt;b_dirty which is always correct including from -&gt;b_dirty_time.</div><div class='del'>-	 * The transfer preserves @inode-&gt;dirtied_when ordering.  If the @inode</div><div class='del'>-	 * was clean, it means it was on the b_attached list, so move it onto</div><div class='del'>-	 * the b_attached list of @new_wb.</div><div class='add'>+	 * If the @inode was clean, it means it was on the b_attached list, so</div><div class='add'>+	 * move it onto the b_attached list of @new_wb.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (!list_empty(&amp;inode-&gt;i_io_list)) {</div><div class='ctx'> 		inode-&gt;i_wb = new_wb;</div><div class='ctx'> </div><div class='del'>-		if (inode-&gt;i_state &amp; I_DIRTY_ALL) {</div><div class='del'>-			struct inode *pos;</div><div class='del'>-</div><div class='del'>-			list_for_each_entry(pos, &amp;new_wb-&gt;b_dirty, i_io_list)</div><div class='del'>-				if (time_after_eq(inode-&gt;dirtied_when,</div><div class='del'>-						  pos-&gt;dirtied_when))</div><div class='del'>-					break;</div><div class='add'>+		if (inode_state_read(inode) &amp; I_DIRTY_ALL) {</div><div class='add'>+			/*</div><div class='add'>+			 * We need to keep b_dirty list sorted by</div><div class='add'>+			 * dirtied_time_when. However properly sorting the</div><div class='add'>+			 * inode in the list gets too expensive when switching</div><div class='add'>+			 * many inodes. So just attach inode at the end of the</div><div class='add'>+			 * dirty list and clobber the dirtied_time_when.</div><div class='add'>+			 */</div><div class='add'>+			inode-&gt;dirtied_time_when = jiffies;</div><div class='ctx'> 			inode_io_list_move_locked(inode, new_wb,</div><div class='del'>-						  pos-&gt;i_io_list.prev);</div><div class='add'>+						  &amp;new_wb-&gt;b_dirty);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			inode_cgwb_move_to_attached(inode, new_wb);</div><div class='ctx'> 		}</div><div class='hunk'>@@ -447,10 +486,11 @@ static bool inode_do_switch_wbs(struct inode *inode,</div><div class='ctx'> 	switched = true;</div><div class='ctx'> skip_switch:</div><div class='ctx'> 	/*</div><div class='del'>-	 * Paired with load_acquire in unlocked_inode_to_wb_begin() and</div><div class='add'>+	 * Paired with an acquire fence in unlocked_inode_to_wb_begin() and</div><div class='ctx'> 	 * ensures that the new wb is visible if they see !I_WB_SWITCH.</div><div class='ctx'> 	 */</div><div class='del'>-	smp_store_release(&amp;inode-&gt;i_state, inode-&gt;i_state &amp; ~I_WB_SWITCH);</div><div class='add'>+	smp_wmb();</div><div class='add'>+	inode_state_clear(inode, I_WB_SWITCH);</div><div class='ctx'> </div><div class='ctx'> 	xa_unlock_irq(&amp;mapping-&gt;i_pages);</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='hunk'>@@ -458,13 +498,11 @@ skip_switch:</div><div class='ctx'> 	return switched;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void inode_switch_wbs_work_fn(struct work_struct *work)</div><div class='add'>+static void process_inode_switch_wbs(struct bdi_writeback *new_wb,</div><div class='add'>+				     struct inode_switch_wbs_context *isw)</div><div class='ctx'> {</div><div class='del'>-	struct inode_switch_wbs_context *isw =</div><div class='del'>-		container_of(to_rcu_work(work), struct inode_switch_wbs_context, work);</div><div class='ctx'> 	struct backing_dev_info *bdi = inode_to_bdi(isw-&gt;inodes[0]);</div><div class='ctx'> 	struct bdi_writeback *old_wb = isw-&gt;inodes[0]-&gt;i_wb;</div><div class='del'>-	struct bdi_writeback *new_wb = isw-&gt;new_wb;</div><div class='ctx'> 	unsigned long nr_switched = 0;</div><div class='ctx'> 	struct inode **inodep;</div><div class='ctx'> </div><div class='hunk'>@@ -474,6 +512,7 @@ static void inode_switch_wbs_work_fn(struct work_struct *work)</div><div class='ctx'> 	 */</div><div class='ctx'> 	down_read(&amp;bdi-&gt;wb_switch_rwsem);</div><div class='ctx'> </div><div class='add'>+	inodep = isw-&gt;inodes;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * By the time control reaches here, RCU grace period has passed</div><div class='ctx'> 	 * since I_WB_SWITCH assertion and all wb stat update transactions</div><div class='hunk'>@@ -484,6 +523,7 @@ static void inode_switch_wbs_work_fn(struct work_struct *work)</div><div class='ctx'> 	 * gives us exclusion against all wb related operations on @inode</div><div class='ctx'> 	 * including IO list manipulations and stat updates.</div><div class='ctx'> 	 */</div><div class='add'>+relock:</div><div class='ctx'> 	if (old_wb &lt; new_wb) {</div><div class='ctx'> 		spin_lock(&amp;old_wb-&gt;list_lock);</div><div class='ctx'> 		spin_lock_nested(&amp;new_wb-&gt;list_lock, SINGLE_DEPTH_NESTING);</div><div class='hunk'>@@ -492,10 +532,17 @@ static void inode_switch_wbs_work_fn(struct work_struct *work)</div><div class='ctx'> 		spin_lock_nested(&amp;old_wb-&gt;list_lock, SINGLE_DEPTH_NESTING);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	for (inodep = isw-&gt;inodes; *inodep; inodep++) {</div><div class='add'>+	while (*inodep) {</div><div class='ctx'> 		WARN_ON_ONCE((*inodep)-&gt;i_wb != old_wb);</div><div class='ctx'> 		if (inode_do_switch_wbs(*inodep, old_wb, new_wb))</div><div class='ctx'> 			nr_switched++;</div><div class='add'>+		inodep++;</div><div class='add'>+		if (*inodep &amp;&amp; need_resched()) {</div><div class='add'>+			spin_unlock(&amp;new_wb-&gt;list_lock);</div><div class='add'>+			spin_unlock(&amp;old_wb-&gt;list_lock);</div><div class='add'>+			cond_resched();</div><div class='add'>+			goto relock;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	spin_unlock(&amp;new_wb-&gt;list_lock);</div><div class='hunk'>@@ -515,6 +562,38 @@ static void inode_switch_wbs_work_fn(struct work_struct *work)</div><div class='ctx'> 	atomic_dec(&amp;isw_nr_in_flight);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void inode_switch_wbs_work_fn(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct bdi_writeback *new_wb = container_of(work, struct bdi_writeback,</div><div class='add'>+						    switch_work);</div><div class='add'>+	struct inode_switch_wbs_context *isw, *next_isw;</div><div class='add'>+	struct llist_node *list;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Grab out reference to wb so that it cannot get freed under us</div><div class='add'>+	 * after we process all the isw items.</div><div class='add'>+	 */</div><div class='add'>+	wb_get(new_wb);</div><div class='add'>+	while (1) {</div><div class='add'>+		list = llist_del_all(&amp;new_wb-&gt;switch_wbs_ctxs);</div><div class='add'>+		/* Nothing to do? */</div><div class='add'>+		if (!list)</div><div class='add'>+			break;</div><div class='add'>+		/*</div><div class='add'>+		 * In addition to synchronizing among switchers, I_WB_SWITCH</div><div class='add'>+		 * tells the RCU protected stat update paths to grab the i_page</div><div class='add'>+		 * lock so that stat transfer can synchronize against them.</div><div class='add'>+		 * Let's continue after I_WB_SWITCH is guaranteed to be</div><div class='add'>+		 * visible.</div><div class='add'>+		 */</div><div class='add'>+		synchronize_rcu();</div><div class='add'>+</div><div class='add'>+		llist_for_each_entry_safe(isw, next_isw, list, list)</div><div class='add'>+			process_inode_switch_wbs(new_wb, isw);</div><div class='add'>+	}</div><div class='add'>+	wb_put(new_wb);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static bool inode_prepare_wbs_switch(struct inode *inode,</div><div class='ctx'> 				     struct bdi_writeback *new_wb)</div><div class='ctx'> {</div><div class='hunk'>@@ -532,18 +611,25 @@ static bool inode_prepare_wbs_switch(struct inode *inode,</div><div class='ctx'> 	/* while holding I_WB_SWITCH, no one else can update the association */</div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	if (!(inode-&gt;i_sb-&gt;s_flags &amp; SB_ACTIVE) ||</div><div class='del'>-	    inode-&gt;i_state &amp; (I_WB_SWITCH | I_FREEING | I_WILL_FREE) ||</div><div class='add'>+	    inode_state_read(inode) &amp; (I_WB_SWITCH | I_FREEING | I_WILL_FREE) ||</div><div class='ctx'> 	    inode_to_wb(inode) == new_wb) {</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 		return false;</div><div class='ctx'> 	}</div><div class='del'>-	inode-&gt;i_state |= I_WB_SWITCH;</div><div class='add'>+	inode_state_set(inode, I_WB_SWITCH);</div><div class='ctx'> 	__iget(inode);</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> </div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void wb_queue_isw(struct bdi_writeback *wb,</div><div class='add'>+			 struct inode_switch_wbs_context *isw)</div><div class='add'>+{</div><div class='add'>+	if (llist_add(&amp;isw-&gt;list, &amp;wb-&gt;switch_wbs_ctxs))</div><div class='add'>+		queue_work(isw_wq, &amp;wb-&gt;switch_work);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /**</div><div class='ctx'>  * inode_switch_wbs - change the wb association of an inode</div><div class='ctx'>  * @inode: target inode</div><div class='hunk'>@@ -557,9 +643,10 @@ static void inode_switch_wbs(struct inode *inode, int new_wb_id)</div><div class='ctx'> 	struct backing_dev_info *bdi = inode_to_bdi(inode);</div><div class='ctx'> 	struct cgroup_subsys_state *memcg_css;</div><div class='ctx'> 	struct inode_switch_wbs_context *isw;</div><div class='add'>+	struct bdi_writeback *new_wb = NULL;</div><div class='ctx'> </div><div class='ctx'> 	/* noop if seems to be already in progress */</div><div class='del'>-	if (inode-&gt;i_state &amp; I_WB_SWITCH)</div><div class='add'>+	if (inode_state_read_once(inode) &amp; I_WB_SWITCH)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	/* avoid queueing a new switch if too many are already in flight */</div><div class='hunk'>@@ -581,33 +668,46 @@ static void inode_switch_wbs(struct inode *inode, int new_wb_id)</div><div class='ctx'> 	if (!memcg_css)</div><div class='ctx'> 		goto out_free;</div><div class='ctx'> </div><div class='del'>-	isw-&gt;new_wb = wb_get_create(bdi, memcg_css, GFP_ATOMIC);</div><div class='add'>+	new_wb = wb_get_create(bdi, memcg_css, GFP_ATOMIC);</div><div class='ctx'> 	css_put(memcg_css);</div><div class='del'>-	if (!isw-&gt;new_wb)</div><div class='add'>+	if (!new_wb)</div><div class='ctx'> 		goto out_free;</div><div class='ctx'> </div><div class='del'>-	if (!inode_prepare_wbs_switch(inode, isw-&gt;new_wb))</div><div class='add'>+	if (!inode_prepare_wbs_switch(inode, new_wb))</div><div class='ctx'> 		goto out_free;</div><div class='ctx'> </div><div class='ctx'> 	isw-&gt;inodes[0] = inode;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * In addition to synchronizing among switchers, I_WB_SWITCH tells</div><div class='del'>-	 * the RCU protected stat update paths to grab the i_page</div><div class='del'>-	 * lock so that stat transfer can synchronize against them.</div><div class='del'>-	 * Let's continue after I_WB_SWITCH is guaranteed to be visible.</div><div class='del'>-	 */</div><div class='del'>-	INIT_RCU_WORK(&amp;isw-&gt;work, inode_switch_wbs_work_fn);</div><div class='del'>-	queue_rcu_work(isw_wq, &amp;isw-&gt;work);</div><div class='add'>+	trace_inode_switch_wbs_queue(inode-&gt;i_wb, new_wb, 1);</div><div class='add'>+	wb_queue_isw(new_wb, isw);</div><div class='ctx'> 	return;</div><div class='ctx'> </div><div class='ctx'> out_free:</div><div class='ctx'> 	atomic_dec(&amp;isw_nr_in_flight);</div><div class='del'>-	if (isw-&gt;new_wb)</div><div class='del'>-		wb_put(isw-&gt;new_wb);</div><div class='add'>+	if (new_wb)</div><div class='add'>+		wb_put(new_wb);</div><div class='ctx'> 	kfree(isw);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool isw_prepare_wbs_switch(struct bdi_writeback *new_wb,</div><div class='add'>+				   struct inode_switch_wbs_context *isw,</div><div class='add'>+				   struct list_head *list, int *nr)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode;</div><div class='add'>+</div><div class='add'>+	list_for_each_entry(inode, list, i_io_list) {</div><div class='add'>+		if (!inode_prepare_wbs_switch(inode, new_wb))</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		isw-&gt;inodes[*nr] = inode;</div><div class='add'>+		(*nr)++;</div><div class='add'>+</div><div class='add'>+		if (*nr &gt;= WB_MAX_INODES_PER_ISW - 1)</div><div class='add'>+			return true;</div><div class='add'>+	}</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /**</div><div class='ctx'>  * cleanup_offline_cgwb - detach associated inodes</div><div class='ctx'>  * @wb: target wb</div><div class='hunk'>@@ -620,7 +720,7 @@ bool cleanup_offline_cgwb(struct bdi_writeback *wb)</div><div class='ctx'> {</div><div class='ctx'> 	struct cgroup_subsys_state *memcg_css;</div><div class='ctx'> 	struct inode_switch_wbs_context *isw;</div><div class='del'>-	struct inode *inode;</div><div class='add'>+	struct bdi_writeback *new_wb;</div><div class='ctx'> 	int nr;</div><div class='ctx'> 	bool restart = false;</div><div class='ctx'> </div><div class='hunk'>@@ -633,44 +733,39 @@ bool cleanup_offline_cgwb(struct bdi_writeback *wb)</div><div class='ctx'> </div><div class='ctx'> 	for (memcg_css = wb-&gt;memcg_css-&gt;parent; memcg_css;</div><div class='ctx'> 	     memcg_css = memcg_css-&gt;parent) {</div><div class='del'>-		isw-&gt;new_wb = wb_get_create(wb-&gt;bdi, memcg_css, GFP_KERNEL);</div><div class='del'>-		if (isw-&gt;new_wb)</div><div class='add'>+		new_wb = wb_get_create(wb-&gt;bdi, memcg_css, GFP_KERNEL);</div><div class='add'>+		if (new_wb)</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='del'>-	if (unlikely(!isw-&gt;new_wb))</div><div class='del'>-		isw-&gt;new_wb = &amp;wb-&gt;bdi-&gt;wb; /* wb_get() is noop for bdi's wb */</div><div class='add'>+	if (unlikely(!new_wb))</div><div class='add'>+		new_wb = &amp;wb-&gt;bdi-&gt;wb; /* wb_get() is noop for bdi's wb */</div><div class='ctx'> </div><div class='ctx'> 	nr = 0;</div><div class='ctx'> 	spin_lock(&amp;wb-&gt;list_lock);</div><div class='del'>-	list_for_each_entry(inode, &amp;wb-&gt;b_attached, i_io_list) {</div><div class='del'>-		if (!inode_prepare_wbs_switch(inode, isw-&gt;new_wb))</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		isw-&gt;inodes[nr++] = inode;</div><div class='del'>-</div><div class='del'>-		if (nr &gt;= WB_MAX_INODES_PER_ISW - 1) {</div><div class='del'>-			restart = true;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	/*</div><div class='add'>+	 * In addition to the inodes that have completed writeback, also switch</div><div class='add'>+	 * cgwbs for those inodes only with dirty timestamps. Otherwise, those</div><div class='add'>+	 * inodes won't be written back for a long time when lazytime is</div><div class='add'>+	 * enabled, and thus pinning the dying cgwbs. It won't break the</div><div class='add'>+	 * bandwidth restrictions, as writeback of inode metadata is not</div><div class='add'>+	 * accounted for.</div><div class='add'>+	 */</div><div class='add'>+	restart = isw_prepare_wbs_switch(new_wb, isw, &amp;wb-&gt;b_attached, &amp;nr);</div><div class='add'>+	if (!restart)</div><div class='add'>+		restart = isw_prepare_wbs_switch(new_wb, isw, &amp;wb-&gt;b_dirty_time,</div><div class='add'>+						 &amp;nr);</div><div class='ctx'> 	spin_unlock(&amp;wb-&gt;list_lock);</div><div class='ctx'> </div><div class='ctx'> 	/* no attached inodes? bail out */</div><div class='ctx'> 	if (nr == 0) {</div><div class='ctx'> 		atomic_dec(&amp;isw_nr_in_flight);</div><div class='del'>-		wb_put(isw-&gt;new_wb);</div><div class='add'>+		wb_put(new_wb);</div><div class='ctx'> 		kfree(isw);</div><div class='ctx'> 		return restart;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * In addition to synchronizing among switchers, I_WB_SWITCH tells</div><div class='del'>-	 * the RCU protected stat update paths to grab the i_page</div><div class='del'>-	 * lock so that stat transfer can synchronize against them.</div><div class='del'>-	 * Let's continue after I_WB_SWITCH is guaranteed to be visible.</div><div class='del'>-	 */</div><div class='del'>-	INIT_RCU_WORK(&amp;isw-&gt;work, inode_switch_wbs_work_fn);</div><div class='del'>-	queue_rcu_work(isw_wq, &amp;isw-&gt;work);</div><div class='add'>+	trace_inode_switch_wbs_queue(wb, new_wb, nr);</div><div class='add'>+	wb_queue_isw(new_wb, isw);</div><div class='ctx'> </div><div class='ctx'> 	return restart;</div><div class='ctx'> }</div><div class='hunk'>@@ -685,8 +780,9 @@ bool cleanup_offline_cgwb(struct bdi_writeback *wb)</div><div class='ctx'>  * writeback completion, wbc_detach_inode() should be called.  This is used</div><div class='ctx'>  * to track the cgroup writeback context.</div><div class='ctx'>  */</div><div class='del'>-void wbc_attach_and_unlock_inode(struct writeback_control *wbc,</div><div class='del'>-				 struct inode *inode)</div><div class='add'>+static void wbc_attach_and_unlock_inode(struct writeback_control *wbc,</div><div class='add'>+		struct inode *inode)</div><div class='add'>+	__releases(&amp;inode-&gt;i_lock)</div><div class='ctx'> {</div><div class='ctx'> 	if (!inode_cgwb_enabled(inode)) {</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='hunk'>@@ -716,7 +812,24 @@ void wbc_attach_and_unlock_inode(struct writeback_control *wbc,</div><div class='ctx'> 	if (unlikely(wb_dying(wbc-&gt;wb) &amp;&amp; !css_is_dying(wbc-&gt;wb-&gt;memcg_css)))</div><div class='ctx'> 		inode_switch_wbs(inode, wbc-&gt;wb_id);</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL_GPL(wbc_attach_and_unlock_inode);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * wbc_attach_fdatawrite_inode - associate wbc and inode for fdatawrite</div><div class='add'>+ * @wbc: writeback_control of interest</div><div class='add'>+ * @inode: target inode</div><div class='add'>+ *</div><div class='add'>+ * This function is to be used by filemap_writeback(), which is an alternative</div><div class='add'>+ * entry point into writeback code, and first ensures @inode is associated with</div><div class='add'>+ * a bdi_writeback and attaches it to @wbc.</div><div class='add'>+ */</div><div class='add'>+void wbc_attach_fdatawrite_inode(struct writeback_control *wbc,</div><div class='add'>+		struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+	inode_attach_wb(inode, NULL);</div><div class='add'>+	wbc_attach_and_unlock_inode(wbc, inode);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(wbc_attach_fdatawrite_inode);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * wbc_detach_inode - disassociate wbc from inode and perform foreign detection</div><div class='hunk'>@@ -736,7 +849,7 @@ EXPORT_SYMBOL_GPL(wbc_attach_and_unlock_inode);</div><div class='ctx'>  * incorrectly attributed).</div><div class='ctx'>  *</div><div class='ctx'>  * To resolve this issue, cgroup writeback detects the majority dirtier of</div><div class='del'>- * an inode and transfers the ownership to it.  To avoid unnnecessary</div><div class='add'>+ * an inode and transfers the ownership to it.  To avoid unnecessary</div><div class='ctx'>  * oscillation, the detection mechanism keeps track of history and gives</div><div class='ctx'>  * out the switch verdict only if the foreign usage pattern is stable over</div><div class='ctx'>  * a certain amount of time and/or writeback attempts.</div><div class='hunk'>@@ -824,7 +937,7 @@ void wbc_detach_inode(struct writeback_control *wbc)</div><div class='ctx'> 		 * is okay.  The main goal is avoiding keeping an inode on</div><div class='ctx'> 		 * the wrong wb for an extended period of time.</div><div class='ctx'> 		 */</div><div class='del'>-		if (hweight32(history) &gt; WB_FRN_HIST_THR_SLOTS)</div><div class='add'>+		if (hweight16(history) &gt; WB_FRN_HIST_THR_SLOTS)</div><div class='ctx'> 			inode_switch_wbs(inode, max_id);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -844,14 +957,14 @@ EXPORT_SYMBOL_GPL(wbc_detach_inode);</div><div class='ctx'> /**</div><div class='ctx'>  * wbc_account_cgroup_owner - account writeback to update inode cgroup ownership</div><div class='ctx'>  * @wbc: writeback_control of the writeback in progress</div><div class='del'>- * @page: page being written out</div><div class='add'>+ * @folio: folio being written out</div><div class='ctx'>  * @bytes: number of bytes being written out</div><div class='ctx'>  *</div><div class='del'>- * @bytes from @page are about to written out during the writeback</div><div class='add'>+ * @bytes from @folio are about to written out during the writeback</div><div class='ctx'>  * controlled by @wbc.  Keep the book for foreign inode detection.  See</div><div class='ctx'>  * wbc_detach_inode().</div><div class='ctx'>  */</div><div class='del'>-void wbc_account_cgroup_owner(struct writeback_control *wbc, struct page *page,</div><div class='add'>+void wbc_account_cgroup_owner(struct writeback_control *wbc, struct folio *folio,</div><div class='ctx'> 			      size_t bytes)</div><div class='ctx'> {</div><div class='ctx'> 	struct cgroup_subsys_state *css;</div><div class='hunk'>@@ -866,7 +979,7 @@ void wbc_account_cgroup_owner(struct writeback_control *wbc, struct page *page,</div><div class='ctx'> 	if (!wbc-&gt;wb || wbc-&gt;no_cgroup_owner)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	css = mem_cgroup_css_from_page(page);</div><div class='add'>+	css = mem_cgroup_css_from_folio(folio);</div><div class='ctx'> 	/* dead cgroups shouldn't contribute to inode ownership arbitration */</div><div class='ctx'> 	if (!(css-&gt;flags &amp; CSS_ONLINE))</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -892,43 +1005,6 @@ void wbc_account_cgroup_owner(struct writeback_control *wbc, struct page *page,</div><div class='ctx'> EXPORT_SYMBOL_GPL(wbc_account_cgroup_owner);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * inode_congested - test whether an inode is congested</div><div class='del'>- * @inode: inode to test for congestion (may be NULL)</div><div class='del'>- * @cong_bits: mask of WB_[a]sync_congested bits to test</div><div class='del'>- *</div><div class='del'>- * Tests whether @inode is congested.  @cong_bits is the mask of congestion</div><div class='del'>- * bits to test and the return value is the mask of set bits.</div><div class='del'>- *</div><div class='del'>- * If cgroup writeback is enabled for @inode, the congestion state is</div><div class='del'>- * determined by whether the cgwb (cgroup bdi_writeback) for the blkcg</div><div class='del'>- * associated with @inode is congested; otherwise, the root wb's congestion</div><div class='del'>- * state is used.</div><div class='del'>- *</div><div class='del'>- * @inode is allowed to be NULL as this function is often called on</div><div class='del'>- * mapping-&gt;host which is NULL for the swapper space.</div><div class='del'>- */</div><div class='del'>-int inode_congested(struct inode *inode, int cong_bits)</div><div class='del'>-{</div><div class='del'>-	/*</div><div class='del'>-	 * Once set, -&gt;i_wb never becomes NULL while the inode is alive.</div><div class='del'>-	 * Start transaction iff -&gt;i_wb is visible.</div><div class='del'>-	 */</div><div class='del'>-	if (inode &amp;&amp; inode_to_wb_is_valid(inode)) {</div><div class='del'>-		struct bdi_writeback *wb;</div><div class='del'>-		struct wb_lock_cookie lock_cookie = {};</div><div class='del'>-		bool congested;</div><div class='del'>-</div><div class='del'>-		wb = unlocked_inode_to_wb_begin(inode, &amp;lock_cookie);</div><div class='del'>-		congested = wb_congested(wb, cong_bits);</div><div class='del'>-		unlocked_inode_to_wb_end(inode, &amp;lock_cookie);</div><div class='del'>-		return congested;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return wb_congested(&amp;inode_to_bdi(inode)-&gt;wb, cong_bits);</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL_GPL(inode_congested);</div><div class='del'>-</div><div class='del'>-/**</div><div class='ctx'>  * wb_split_bdi_pages - split nr_pages to write according to bandwidth</div><div class='ctx'>  * @wb: target bdi_writeback to split @nr_pages to</div><div class='ctx'>  * @nr_pages: number of pages to write for the whole bdi</div><div class='hunk'>@@ -1008,6 +1084,16 @@ restart:</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		/*</div><div class='add'>+		 * If wb_tryget fails, the wb has been shutdown, skip it.</div><div class='add'>+		 *</div><div class='add'>+		 * Pin @wb so that it stays on @bdi-&gt;wb_list.  This allows</div><div class='add'>+		 * continuing iteration from @wb after dropping and</div><div class='add'>+		 * regrabbing rcu read lock.</div><div class='add'>+		 */</div><div class='add'>+		if (!wb_tryget(wb))</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='ctx'> 		/* alloc failed, execute synchronously using on-stack fallback */</div><div class='ctx'> 		work = &amp;fallback_work;</div><div class='ctx'> 		*work = *base_work;</div><div class='hunk'>@@ -1016,13 +1102,6 @@ restart:</div><div class='ctx'> 		work-&gt;done = &amp;fallback_work_done;</div><div class='ctx'> </div><div class='ctx'> 		wb_queue_work(wb, work);</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Pin @wb so that it stays on @bdi-&gt;wb_list.  This allows</div><div class='del'>-		 * continuing iteration from @wb after dropping and</div><div class='del'>-		 * regrabbing rcu read lock.</div><div class='del'>-		 */</div><div class='del'>-		wb_get(wb);</div><div class='ctx'> 		last_wb = wb;</div><div class='ctx'> </div><div class='ctx'> 		rcu_read_unlock();</div><div class='hunk'>@@ -1094,7 +1173,7 @@ int cgroup_writeback_by_id(u64 bdi_id, int memcg_id,</div><div class='ctx'> 	dirty = dirty * 10 / 8;</div><div class='ctx'> </div><div class='ctx'> 	/* issue the writeback work */</div><div class='del'>-	work = kzalloc(sizeof(*work), GFP_NOWAIT | __GFP_NOWARN);</div><div class='add'>+	work = kzalloc(sizeof(*work), GFP_NOWAIT);</div><div class='ctx'> 	if (work) {</div><div class='ctx'> 		work-&gt;nr_pages = dirty;</div><div class='ctx'> 		work-&gt;sync_mode = WB_SYNC_NONE;</div><div class='hunk'>@@ -1118,6 +1197,7 @@ out_bdi_put:</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * cgroup_writeback_umount - flush inode wb switches for umount</div><div class='add'>+ * @sb: target super_block</div><div class='ctx'>  *</div><div class='ctx'>  * This function is called when a super_block is about to be destroyed and</div><div class='ctx'>  * flushes in-flight inode wb switches.  An inode wb switch goes through</div><div class='hunk'>@@ -1126,8 +1206,12 @@ out_bdi_put:</div><div class='ctx'>  * rare occurrences and synchronize_rcu() can take a while, perform</div><div class='ctx'>  * flushing iff wb switches are in flight.</div><div class='ctx'>  */</div><div class='del'>-void cgroup_writeback_umount(void)</div><div class='add'>+void cgroup_writeback_umount(struct super_block *sb)</div><div class='ctx'> {</div><div class='add'>+</div><div class='add'>+	if (!(sb-&gt;s_bdi-&gt;capabilities &amp; BDI_CAP_WRITEBACK))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * SB_ACTIVE should be reliably cleared before checking</div><div class='ctx'> 	 * isw_nr_in_flight, see generic_shutdown_super().</div><div class='hunk'>@@ -1146,7 +1230,7 @@ void cgroup_writeback_umount(void)</div><div class='ctx'> </div><div class='ctx'> static int __init cgroup_writeback_init(void)</div><div class='ctx'> {</div><div class='del'>-	isw_wq = alloc_workqueue("inode_switch_wbs", 0, 0);</div><div class='add'>+	isw_wq = alloc_workqueue("inode_switch_wbs", WQ_PERCPU, 0);</div><div class='ctx'> 	if (!isw_wq)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -1163,8 +1247,9 @@ static void inode_cgwb_move_to_attached(struct inode *inode,</div><div class='ctx'> {</div><div class='ctx'> 	assert_spin_locked(&amp;wb-&gt;list_lock);</div><div class='ctx'> 	assert_spin_locked(&amp;inode-&gt;i_lock);</div><div class='add'>+	WARN_ON_ONCE(inode_state_read(inode) &amp; I_FREEING);</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_state &amp;= ~I_SYNC_QUEUED;</div><div class='add'>+	inode_state_clear(inode, I_SYNC_QUEUED);</div><div class='ctx'> 	list_del_init(&amp;inode-&gt;i_io_list);</div><div class='ctx'> 	wb_io_lists_depopulated(wb);</div><div class='ctx'> }</div><div class='hunk'>@@ -1207,6 +1292,13 @@ static void bdi_split_work_to_wbs(struct backing_dev_info *bdi,</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline void wbc_attach_and_unlock_inode(struct writeback_control *wbc,</div><div class='add'>+					       struct inode *inode)</div><div class='add'>+	__releases(&amp;inode-&gt;i_lock)</div><div class='add'>+{</div><div class='add'>+	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> #endif	/* CONFIG_CGROUP_WRITEBACK */</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1267,10 +1359,17 @@ void inode_io_list_del(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct bdi_writeback *wb;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * FIXME: ext4 can call here from ext4_evict_inode() after evict() already</div><div class='add'>+	 * unlinked the inode.</div><div class='add'>+	 */</div><div class='add'>+	if (list_empty_careful(&amp;inode-&gt;i_io_list))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='ctx'> 	wb = inode_to_wb_and_lock_list(inode);</div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_state &amp;= ~I_SYNC_QUEUED;</div><div class='add'>+	inode_state_clear(inode, I_SYNC_QUEUED);</div><div class='ctx'> 	list_del_init(&amp;inode-&gt;i_io_list);</div><div class='ctx'> 	wb_io_lists_depopulated(wb);</div><div class='ctx'> </div><div class='hunk'>@@ -1328,6 +1427,17 @@ static void redirty_tail_locked(struct inode *inode, struct bdi_writeback *wb)</div><div class='ctx'> {</div><div class='ctx'> 	assert_spin_locked(&amp;inode-&gt;i_lock);</div><div class='ctx'> </div><div class='add'>+	inode_state_clear(inode, I_SYNC_QUEUED);</div><div class='add'>+	/*</div><div class='add'>+	 * When the inode is being freed just don't bother with dirty list</div><div class='add'>+	 * tracking. Flush worker will ignore this inode anyway and it will</div><div class='add'>+	 * trigger assertions in inode_io_list_move_locked().</div><div class='add'>+	 */</div><div class='add'>+	if (inode_state_read(inode) &amp; I_FREEING) {</div><div class='add'>+		list_del_init(&amp;inode-&gt;i_io_list);</div><div class='add'>+		wb_io_lists_depopulated(wb);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='ctx'> 	if (!list_empty(&amp;wb-&gt;b_dirty)) {</div><div class='ctx'> 		struct inode *tail;</div><div class='ctx'> </div><div class='hunk'>@@ -1336,7 +1446,6 @@ static void redirty_tail_locked(struct inode *inode, struct bdi_writeback *wb)</div><div class='ctx'> 			inode-&gt;dirtied_when = jiffies;</div><div class='ctx'> 	}</div><div class='ctx'> 	inode_io_list_move_locked(inode, wb, &amp;wb-&gt;b_dirty);</div><div class='del'>-	inode-&gt;i_state &amp;= ~I_SYNC_QUEUED;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void redirty_tail(struct inode *inode, struct bdi_writeback *wb)</div><div class='hunk'>@@ -1356,12 +1465,13 @@ static void requeue_io(struct inode *inode, struct bdi_writeback *wb)</div><div class='ctx'> </div><div class='ctx'> static void inode_sync_complete(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	inode-&gt;i_state &amp;= ~I_SYNC;</div><div class='add'>+	assert_spin_locked(&amp;inode-&gt;i_lock);</div><div class='add'>+</div><div class='add'>+	inode_state_clear(inode, I_SYNC);</div><div class='ctx'> 	/* If inode is clean an unused, put it into LRU now... */</div><div class='del'>-	inode_add_lru(inode);</div><div class='del'>-	/* Waiters must see I_SYNC cleared before being woken up */</div><div class='del'>-	smp_mb();</div><div class='del'>-	wake_up_bit(&amp;inode-&gt;i_state, __I_SYNC);</div><div class='add'>+	inode_lru_list_add(inode);</div><div class='add'>+	/* Called with inode-&gt;i_lock which ensures memory ordering. */</div><div class='add'>+	inode_wake_up_bit(inode, __I_SYNC);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool inode_dirtied_after(struct inode *inode, unsigned long t)</div><div class='hunk'>@@ -1379,8 +1489,6 @@ static bool inode_dirtied_after(struct inode *inode, unsigned long t)</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#define EXPIRE_DIRTY_ATIME 0x0001</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Move expired (dirtied before dirtied_before) dirty inodes from</div><div class='ctx'>  * @delaying_queue to @dispatch_queue.</div><div class='hunk'>@@ -1400,10 +1508,10 @@ static int move_expired_inodes(struct list_head *delaying_queue,</div><div class='ctx'> 		inode = wb_inode(delaying_queue-&gt;prev);</div><div class='ctx'> 		if (inode_dirtied_after(inode, dirtied_before))</div><div class='ctx'> 			break;</div><div class='add'>+		spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 		list_move(&amp;inode-&gt;i_io_list, &amp;tmp);</div><div class='ctx'> 		moved++;</div><div class='del'>-		spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-		inode-&gt;i_state |= I_SYNC_QUEUED;</div><div class='add'>+		inode_state_set(inode, I_SYNC_QUEUED);</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 		if (sb_is_blkdev_sb(inode-&gt;i_sb))</div><div class='ctx'> 			continue;</div><div class='hunk'>@@ -1418,7 +1526,12 @@ static int move_expired_inodes(struct list_head *delaying_queue,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Move inodes from one superblock together */</div><div class='add'>+	/*</div><div class='add'>+	 * Although inode's i_io_list is moved from 'tmp' to 'dispatch_queue',</div><div class='add'>+	 * we don't take inode-&gt;i_lock here because it is just a pointless overhead.</div><div class='add'>+	 * Inode is already marked as I_SYNC_QUEUED so writeback list handling is</div><div class='add'>+	 * fully under our control.</div><div class='add'>+	 */</div><div class='ctx'> 	while (!list_empty(&amp;tmp)) {</div><div class='ctx'> 		sb = wb_inode(tmp.prev)-&gt;i_sb;</div><div class='ctx'> 		list_for_each_prev_safe(pos, node, &amp;tmp) {</div><div class='hunk'>@@ -1477,30 +1590,27 @@ static int write_inode(struct inode *inode, struct writeback_control *wbc)</div><div class='ctx'>  * Wait for writeback on an inode to complete. Called with i_lock held.</div><div class='ctx'>  * Caller must make sure inode cannot go away when we drop i_lock.</div><div class='ctx'>  */</div><div class='del'>-static void __inode_wait_for_writeback(struct inode *inode)</div><div class='del'>-	__releases(inode-&gt;i_lock)</div><div class='del'>-	__acquires(inode-&gt;i_lock)</div><div class='add'>+void inode_wait_for_writeback(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	DEFINE_WAIT_BIT(wq, &amp;inode-&gt;i_state, __I_SYNC);</div><div class='del'>-	wait_queue_head_t *wqh;</div><div class='add'>+	struct wait_bit_queue_entry wqe;</div><div class='add'>+	struct wait_queue_head *wq_head;</div><div class='add'>+</div><div class='add'>+	assert_spin_locked(&amp;inode-&gt;i_lock);</div><div class='ctx'> </div><div class='del'>-	wqh = bit_waitqueue(&amp;inode-&gt;i_state, __I_SYNC);</div><div class='del'>-	while (inode-&gt;i_state &amp; I_SYNC) {</div><div class='add'>+	if (!(inode_state_read(inode) &amp; I_SYNC))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	wq_head = inode_bit_waitqueue(&amp;wqe, inode, __I_SYNC);</div><div class='add'>+	for (;;) {</div><div class='add'>+		prepare_to_wait_event(wq_head, &amp;wqe.wq_entry, TASK_UNINTERRUPTIBLE);</div><div class='add'>+		/* Checking I_SYNC with inode-&gt;i_lock guarantees memory ordering. */</div><div class='add'>+		if (!(inode_state_read(inode) &amp; I_SYNC))</div><div class='add'>+			break;</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='del'>-		__wait_on_bit(wqh, &amp;wq, bit_wait,</div><div class='del'>-			      TASK_UNINTERRUPTIBLE);</div><div class='add'>+		schedule();</div><div class='ctx'> 		spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Wait for writeback on an inode to complete. Caller must have inode pinned.</div><div class='del'>- */</div><div class='del'>-void inode_wait_for_writeback(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-	__inode_wait_for_writeback(inode);</div><div class='del'>-	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+	finish_wait(wq_head, &amp;wqe.wq_entry);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1511,16 +1621,20 @@ void inode_wait_for_writeback(struct inode *inode)</div><div class='ctx'> static void inode_sleep_on_writeback(struct inode *inode)</div><div class='ctx'> 	__releases(inode-&gt;i_lock)</div><div class='ctx'> {</div><div class='del'>-	DEFINE_WAIT(wait);</div><div class='del'>-	wait_queue_head_t *wqh = bit_waitqueue(&amp;inode-&gt;i_state, __I_SYNC);</div><div class='del'>-	int sleep;</div><div class='add'>+	struct wait_bit_queue_entry wqe;</div><div class='add'>+	struct wait_queue_head *wq_head;</div><div class='add'>+	bool sleep;</div><div class='add'>+</div><div class='add'>+	assert_spin_locked(&amp;inode-&gt;i_lock);</div><div class='ctx'> </div><div class='del'>-	prepare_to_wait(wqh, &amp;wait, TASK_UNINTERRUPTIBLE);</div><div class='del'>-	sleep = inode-&gt;i_state &amp; I_SYNC;</div><div class='add'>+	wq_head = inode_bit_waitqueue(&amp;wqe, inode, __I_SYNC);</div><div class='add'>+	prepare_to_wait_event(wq_head, &amp;wqe.wq_entry, TASK_UNINTERRUPTIBLE);</div><div class='add'>+	/* Checking I_SYNC with inode-&gt;i_lock guarantees memory ordering. */</div><div class='add'>+	sleep = !!(inode_state_read(inode) &amp; I_SYNC);</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	if (sleep)</div><div class='ctx'> 		schedule();</div><div class='del'>-	finish_wait(wqh, &amp;wait);</div><div class='add'>+	finish_wait(wq_head, &amp;wqe.wq_entry);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1532,9 +1646,10 @@ static void inode_sleep_on_writeback(struct inode *inode)</div><div class='ctx'>  * thread's back can have unexpected consequences.</div><div class='ctx'>  */</div><div class='ctx'> static void requeue_inode(struct inode *inode, struct bdi_writeback *wb,</div><div class='del'>-			  struct writeback_control *wbc)</div><div class='add'>+			  struct writeback_control *wbc,</div><div class='add'>+			  unsigned long dirtied_before)</div><div class='ctx'> {</div><div class='del'>-	if (inode-&gt;i_state &amp; I_FREEING)</div><div class='add'>+	if (inode_state_read(inode) &amp; I_FREEING)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1542,16 +1657,21 @@ static void requeue_inode(struct inode *inode, struct bdi_writeback *wb,</div><div class='ctx'> 	 * shot. If still dirty, it will be redirty_tail()'ed below.  Update</div><div class='ctx'> 	 * the dirty time to prevent enqueue and sync it again.</div><div class='ctx'> 	 */</div><div class='del'>-	if ((inode-&gt;i_state &amp; I_DIRTY) &amp;&amp;</div><div class='add'>+	if ((inode_state_read(inode) &amp; I_DIRTY) &amp;&amp;</div><div class='ctx'> 	    (wbc-&gt;sync_mode == WB_SYNC_ALL || wbc-&gt;tagged_writepages))</div><div class='ctx'> 		inode-&gt;dirtied_when = jiffies;</div><div class='ctx'> </div><div class='ctx'> 	if (wbc-&gt;pages_skipped) {</div><div class='ctx'> 		/*</div><div class='del'>-		 * writeback is not making progress due to locked</div><div class='del'>-		 * buffers. Skip this inode for now.</div><div class='add'>+		 * Writeback is not making progress due to locked buffers.</div><div class='add'>+		 * Skip this inode for now. Although having skipped pages</div><div class='add'>+		 * is odd for clean inodes, it can happen for some</div><div class='add'>+		 * filesystems so handle that gracefully.</div><div class='ctx'> 		 */</div><div class='del'>-		redirty_tail_locked(inode, wb);</div><div class='add'>+		if (inode_state_read(inode) &amp; I_DIRTY_ALL)</div><div class='add'>+			redirty_tail_locked(inode, wb);</div><div class='add'>+		else</div><div class='add'>+			inode_cgwb_move_to_attached(inode, wb);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1560,7 +1680,8 @@ static void requeue_inode(struct inode *inode, struct bdi_writeback *wb,</div><div class='ctx'> 		 * We didn't write back all the pages.  nfs_writepages()</div><div class='ctx'> 		 * sometimes bales out without doing anything.</div><div class='ctx'> 		 */</div><div class='del'>-		if (wbc-&gt;nr_to_write &lt;= 0) {</div><div class='add'>+		if (wbc-&gt;nr_to_write &lt;= 0 &amp;&amp;</div><div class='add'>+		    !inode_dirtied_after(inode, dirtied_before)) {</div><div class='ctx'> 			/* Slice used up. Queue for next turn. */</div><div class='ctx'> 			requeue_io(inode, wb);</div><div class='ctx'> 		} else {</div><div class='hunk'>@@ -1573,17 +1694,17 @@ static void requeue_inode(struct inode *inode, struct bdi_writeback *wb,</div><div class='ctx'> 			 */</div><div class='ctx'> 			redirty_tail_locked(inode, wb);</div><div class='ctx'> 		}</div><div class='del'>-	} else if (inode-&gt;i_state &amp; I_DIRTY) {</div><div class='add'>+	} else if (inode_state_read(inode) &amp; I_DIRTY) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Filesystems can dirty the inode during writeback operations,</div><div class='ctx'> 		 * such as delayed allocation during submission or metadata</div><div class='ctx'> 		 * updates after data IO completion.</div><div class='ctx'> 		 */</div><div class='ctx'> 		redirty_tail_locked(inode, wb);</div><div class='del'>-	} else if (inode-&gt;i_state &amp; I_DIRTY_TIME) {</div><div class='add'>+	} else if (inode_state_read(inode) &amp; I_DIRTY_TIME) {</div><div class='ctx'> 		inode-&gt;dirtied_when = jiffies;</div><div class='ctx'> 		inode_io_list_move_locked(inode, wb, &amp;wb-&gt;b_dirty_time);</div><div class='del'>-		inode-&gt;i_state &amp;= ~I_SYNC_QUEUED;</div><div class='add'>+		inode_state_clear(inode, I_SYNC_QUEUED);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		/* The inode is clean. Remove from writeback lists. */</div><div class='ctx'> 		inode_cgwb_move_to_attached(inode, wb);</div><div class='hunk'>@@ -1609,7 +1730,7 @@ __writeback_single_inode(struct inode *inode, struct writeback_control *wbc)</div><div class='ctx'> 	unsigned dirty;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	WARN_ON(!(inode-&gt;i_state &amp; I_SYNC));</div><div class='add'>+	WARN_ON(!(inode_state_read_once(inode) &amp; I_SYNC));</div><div class='ctx'> </div><div class='ctx'> 	trace_writeback_single_inode_start(inode, wbc, nr_to_write);</div><div class='ctx'> </div><div class='hunk'>@@ -1633,7 +1754,7 @@ __writeback_single_inode(struct inode *inode, struct writeback_control *wbc)</div><div class='ctx'> 	 * mark_inode_dirty_sync() to notify the filesystem about it and to</div><div class='ctx'> 	 * change I_DIRTY_TIME into I_DIRTY_SYNC.</div><div class='ctx'> 	 */</div><div class='del'>-	if ((inode-&gt;i_state &amp; I_DIRTY_TIME) &amp;&amp;</div><div class='add'>+	if ((inode_state_read_once(inode) &amp; I_DIRTY_TIME) &amp;&amp;</div><div class='ctx'> 	    (wbc-&gt;sync_mode == WB_SYNC_ALL ||</div><div class='ctx'> 	     time_after(jiffies, inode-&gt;dirtied_time_when +</div><div class='ctx'> 			dirtytime_expire_interval * HZ))) {</div><div class='hunk'>@@ -1648,8 +1769,8 @@ __writeback_single_inode(struct inode *inode, struct writeback_control *wbc)</div><div class='ctx'> 	 * after handling timestamp expiration, as that may dirty the inode too.</div><div class='ctx'> 	 */</div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-	dirty = inode-&gt;i_state &amp; I_DIRTY;</div><div class='del'>-	inode-&gt;i_state &amp;= ~dirty;</div><div class='add'>+	dirty = inode_state_read(inode) &amp; I_DIRTY;</div><div class='add'>+	inode_state_clear(inode, dirty);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Paired with smp_mb() in __mark_inode_dirty().  This allows</div><div class='hunk'>@@ -1665,7 +1786,14 @@ __writeback_single_inode(struct inode *inode, struct writeback_control *wbc)</div><div class='ctx'> 	smp_mb();</div><div class='ctx'> </div><div class='ctx'> 	if (mapping_tagged(mapping, PAGECACHE_TAG_DIRTY))</div><div class='del'>-		inode-&gt;i_state |= I_DIRTY_PAGES;</div><div class='add'>+		inode_state_set(inode, I_DIRTY_PAGES);</div><div class='add'>+	else if (unlikely(inode_state_read(inode) &amp; I_PINNING_NETFS_WB)) {</div><div class='add'>+		if (!(inode_state_read(inode) &amp; I_DIRTY_PAGES)) {</div><div class='add'>+			inode_state_clear(inode, I_PINNING_NETFS_WB);</div><div class='add'>+			wbc-&gt;unpinned_netfs_wb = true;</div><div class='add'>+			dirty |= I_PINNING_NETFS_WB; /* Cause write_inode */</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> </div><div class='hunk'>@@ -1675,6 +1803,7 @@ __writeback_single_inode(struct inode *inode, struct writeback_control *wbc)</div><div class='ctx'> 		if (ret == 0)</div><div class='ctx'> 			ret = err;</div><div class='ctx'> 	}</div><div class='add'>+	wbc-&gt;unpinned_netfs_wb = false;</div><div class='ctx'> 	trace_writeback_single_inode(inode, wbc, nr_to_write);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -1695,12 +1824,12 @@ static int writeback_single_inode(struct inode *inode,</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-	if (!atomic_read(&amp;inode-&gt;i_count))</div><div class='del'>-		WARN_ON(!(inode-&gt;i_state &amp; (I_WILL_FREE|I_FREEING)));</div><div class='add'>+	if (!icount_read(inode))</div><div class='add'>+		WARN_ON(!(inode_state_read(inode) &amp; (I_WILL_FREE | I_FREEING)));</div><div class='ctx'> 	else</div><div class='del'>-		WARN_ON(inode-&gt;i_state &amp; I_WILL_FREE);</div><div class='add'>+		WARN_ON(inode_state_read(inode) &amp; I_WILL_FREE);</div><div class='ctx'> </div><div class='del'>-	if (inode-&gt;i_state &amp; I_SYNC) {</div><div class='add'>+	if (inode_state_read(inode) &amp; I_SYNC) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Writeback is already running on the inode.  For WB_SYNC_NONE,</div><div class='ctx'> 		 * that's enough and we can just return.  For WB_SYNC_ALL, we</div><div class='hunk'>@@ -1709,9 +1838,9 @@ static int writeback_single_inode(struct inode *inode,</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (wbc-&gt;sync_mode != WB_SYNC_ALL)</div><div class='ctx'> 			goto out;</div><div class='del'>-		__inode_wait_for_writeback(inode);</div><div class='add'>+		inode_wait_for_writeback(inode);</div><div class='ctx'> 	}</div><div class='del'>-	WARN_ON(inode-&gt;i_state &amp; I_SYNC);</div><div class='add'>+	WARN_ON(inode_state_read(inode) &amp; I_SYNC);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If the inode is already fully clean, then there's nothing to do.</div><div class='ctx'> 	 *</div><div class='hunk'>@@ -1719,11 +1848,11 @@ static int writeback_single_inode(struct inode *inode,</div><div class='ctx'> 	 * still under writeback, e.g. due to prior WB_SYNC_NONE writeback.  If</div><div class='ctx'> 	 * there are any such pages, we'll need to wait for them.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!(inode-&gt;i_state &amp; I_DIRTY_ALL) &amp;&amp;</div><div class='add'>+	if (!(inode_state_read(inode) &amp; I_DIRTY_ALL) &amp;&amp;</div><div class='ctx'> 	    (wbc-&gt;sync_mode != WB_SYNC_ALL ||</div><div class='ctx'> 	     !mapping_tagged(inode-&gt;i_mapping, PAGECACHE_TAG_WRITEBACK)))</div><div class='ctx'> 		goto out;</div><div class='del'>-	inode-&gt;i_state |= I_SYNC;</div><div class='add'>+	inode_state_set(inode, I_SYNC);</div><div class='ctx'> 	wbc_attach_and_unlock_inode(wbc, inode);</div><div class='ctx'> </div><div class='ctx'> 	ret = __writeback_single_inode(inode, wbc);</div><div class='hunk'>@@ -1733,12 +1862,29 @@ static int writeback_single_inode(struct inode *inode,</div><div class='ctx'> 	wb = inode_to_wb_and_lock_list(inode);</div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	/*</div><div class='del'>-	 * If the inode is now fully clean, then it can be safely removed from</div><div class='del'>-	 * its writeback list (if any).  Otherwise the flusher threads are</div><div class='del'>-	 * responsible for the writeback lists.</div><div class='add'>+	 * If the inode is freeing, its i_io_list shoudn't be updated</div><div class='add'>+	 * as it can be finally deleted at this moment.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!(inode-&gt;i_state &amp; I_DIRTY_ALL))</div><div class='del'>-		inode_cgwb_move_to_attached(inode, wb);</div><div class='add'>+	if (!(inode_state_read(inode) &amp; I_FREEING)) {</div><div class='add'>+		/*</div><div class='add'>+		 * If the inode is now fully clean, then it can be safely</div><div class='add'>+		 * removed from its writeback list (if any). Otherwise the</div><div class='add'>+		 * flusher threads are responsible for the writeback lists.</div><div class='add'>+		 */</div><div class='add'>+		if (!(inode_state_read(inode) &amp; I_DIRTY_ALL))</div><div class='add'>+			inode_cgwb_move_to_attached(inode, wb);</div><div class='add'>+		else if (!(inode_state_read(inode) &amp; I_SYNC_QUEUED)) {</div><div class='add'>+			if ((inode_state_read(inode) &amp; I_DIRTY))</div><div class='add'>+				redirty_tail_locked(inode, wb);</div><div class='add'>+			else if (inode_state_read(inode) &amp; I_DIRTY_TIME) {</div><div class='add'>+				inode-&gt;dirtied_when = jiffies;</div><div class='add'>+				inode_io_list_move_locked(inode,</div><div class='add'>+							  wb,</div><div class='add'>+							  &amp;wb-&gt;b_dirty_time);</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	spin_unlock(&amp;wb-&gt;list_lock);</div><div class='ctx'> 	inode_sync_complete(inode);</div><div class='ctx'> out:</div><div class='hunk'>@@ -1746,8 +1892,8 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static long writeback_chunk_size(struct bdi_writeback *wb,</div><div class='del'>-				 struct wb_writeback_work *work)</div><div class='add'>+static long writeback_chunk_size(struct super_block *sb,</div><div class='add'>+		struct bdi_writeback *wb, struct wb_writeback_work *work)</div><div class='ctx'> {</div><div class='ctx'> 	long pages;</div><div class='ctx'> </div><div class='hunk'>@@ -1765,16 +1911,13 @@ static long writeback_chunk_size(struct bdi_writeback *wb,</div><div class='ctx'> 	 *                   (maybe slowly) sync all tagged pages</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (work-&gt;sync_mode == WB_SYNC_ALL || work-&gt;tagged_writepages)</div><div class='del'>-		pages = LONG_MAX;</div><div class='del'>-	else {</div><div class='del'>-		pages = min(wb-&gt;avg_write_bandwidth / 2,</div><div class='del'>-			    global_wb_domain.dirty_limit / DIRTY_SCOPE);</div><div class='del'>-		pages = min(pages, work-&gt;nr_pages);</div><div class='del'>-		pages = round_down(pages + MIN_WRITEBACK_PAGES,</div><div class='del'>-				   MIN_WRITEBACK_PAGES);</div><div class='del'>-	}</div><div class='add'>+		return LONG_MAX;</div><div class='ctx'> </div><div class='del'>-	return pages;</div><div class='add'>+	pages = min(wb-&gt;avg_write_bandwidth / 2,</div><div class='add'>+		    global_wb_domain.dirty_limit / DIRTY_SCOPE);</div><div class='add'>+	pages = min(pages, work-&gt;nr_pages);</div><div class='add'>+	return round_down(pages + sb-&gt;s_min_writeback_pages,</div><div class='add'>+			sb-&gt;s_min_writeback_pages);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1802,11 +1945,17 @@ static long writeback_sb_inodes(struct super_block *sb,</div><div class='ctx'> 	};</div><div class='ctx'> 	unsigned long start_time = jiffies;</div><div class='ctx'> 	long write_chunk;</div><div class='del'>-	long wrote = 0;  /* count both pages and inodes */</div><div class='add'>+	long total_wrote = 0;  /* count both pages and inodes */</div><div class='add'>+	unsigned long dirtied_before = jiffies;</div><div class='add'>+</div><div class='add'>+	if (work-&gt;for_kupdate)</div><div class='add'>+		dirtied_before = jiffies -</div><div class='add'>+			msecs_to_jiffies(dirty_expire_interval * 10);</div><div class='ctx'> </div><div class='ctx'> 	while (!list_empty(&amp;wb-&gt;b_io)) {</div><div class='ctx'> 		struct inode *inode = wb_inode(wb-&gt;b_io.prev);</div><div class='ctx'> 		struct bdi_writeback *tmp_wb;</div><div class='add'>+		long wrote;</div><div class='ctx'> </div><div class='ctx'> 		if (inode-&gt;i_sb != sb) {</div><div class='ctx'> 			if (work-&gt;sb) {</div><div class='hunk'>@@ -1833,12 +1982,12 @@ static long writeback_sb_inodes(struct super_block *sb,</div><div class='ctx'> 		 * kind writeout is handled by the freer.</div><div class='ctx'> 		 */</div><div class='ctx'> 		spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-		if (inode-&gt;i_state &amp; (I_NEW | I_FREEING | I_WILL_FREE)) {</div><div class='add'>+		if (inode_state_read(inode) &amp; (I_NEW | I_FREEING | I_WILL_FREE)) {</div><div class='ctx'> 			redirty_tail_locked(inode, wb);</div><div class='ctx'> 			spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='del'>-		if ((inode-&gt;i_state &amp; I_SYNC) &amp;&amp; wbc.sync_mode != WB_SYNC_ALL) {</div><div class='add'>+		if ((inode_state_read(inode) &amp; I_SYNC) &amp;&amp; wbc.sync_mode != WB_SYNC_ALL) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * If this inode is locked for writeback and we are not</div><div class='ctx'> 			 * doing writeback-for-data-integrity, move it to</div><div class='hunk'>@@ -1848,8 +1997,8 @@ static long writeback_sb_inodes(struct super_block *sb,</div><div class='ctx'> 			 * We'll have another go at writing back this inode</div><div class='ctx'> 			 * when we completed a full scan of b_io.</div><div class='ctx'> 			 */</div><div class='del'>-			spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 			requeue_io(inode, wb);</div><div class='add'>+			spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 			trace_writeback_sb_inodes_requeue(inode);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1860,17 +2009,17 @@ static long writeback_sb_inodes(struct super_block *sb,</div><div class='ctx'> 		 * are doing WB_SYNC_NONE writeback. So this catches only the</div><div class='ctx'> 		 * WB_SYNC_ALL case.</div><div class='ctx'> 		 */</div><div class='del'>-		if (inode-&gt;i_state &amp; I_SYNC) {</div><div class='add'>+		if (inode_state_read(inode) &amp; I_SYNC) {</div><div class='ctx'> 			/* Wait for I_SYNC. This function drops i_lock... */</div><div class='ctx'> 			inode_sleep_on_writeback(inode);</div><div class='ctx'> 			/* Inode may be gone, start again */</div><div class='ctx'> 			spin_lock(&amp;wb-&gt;list_lock);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='del'>-		inode-&gt;i_state |= I_SYNC;</div><div class='add'>+		inode_state_set(inode, I_SYNC);</div><div class='ctx'> 		wbc_attach_and_unlock_inode(&amp;wbc, inode);</div><div class='ctx'> </div><div class='del'>-		write_chunk = writeback_chunk_size(wb, work);</div><div class='add'>+		write_chunk = writeback_chunk_size(inode-&gt;i_sb, wb, work);</div><div class='ctx'> 		wbc.nr_to_write = write_chunk;</div><div class='ctx'> 		wbc.pages_skipped = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -1880,9 +2029,17 @@ static long writeback_sb_inodes(struct super_block *sb,</div><div class='ctx'> 		 */</div><div class='ctx'> 		__writeback_single_inode(inode, &amp;wbc);</div><div class='ctx'> </div><div class='add'>+		/* Report progress to inform the hung task detector of the progress. */</div><div class='add'>+		if (work-&gt;done &amp;&amp; work-&gt;done-&gt;progress_stamp &amp;&amp;</div><div class='add'>+		   (jiffies - work-&gt;done-&gt;progress_stamp) &gt; HZ *</div><div class='add'>+		   sysctl_hung_task_timeout_secs / 2)</div><div class='add'>+			wake_up_all(work-&gt;done-&gt;waitq);</div><div class='add'>+</div><div class='ctx'> 		wbc_detach_inode(&amp;wbc);</div><div class='ctx'> 		work-&gt;nr_pages -= write_chunk - wbc.nr_to_write;</div><div class='del'>-		wrote += write_chunk - wbc.nr_to_write;</div><div class='add'>+		wrote = write_chunk - wbc.nr_to_write - wbc.pages_skipped;</div><div class='add'>+		wrote = wrote &lt; 0 ? 0 : wrote;</div><div class='add'>+		total_wrote += wrote;</div><div class='ctx'> </div><div class='ctx'> 		if (need_resched()) {</div><div class='ctx'> 			/*</div><div class='hunk'>@@ -1893,8 +2050,7 @@ static long writeback_sb_inodes(struct super_block *sb,</div><div class='ctx'> 			 * unplug, so get our IOs out the door before we</div><div class='ctx'> 			 * give up the CPU.</div><div class='ctx'> 			 */</div><div class='del'>-			if (current-&gt;plug)</div><div class='del'>-				blk_flush_plug(current-&gt;plug, false);</div><div class='add'>+			blk_flush_plug(current-&gt;plug, false);</div><div class='ctx'> 			cond_resched();</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -1904,9 +2060,9 @@ static long writeback_sb_inodes(struct super_block *sb,</div><div class='ctx'> 		 */</div><div class='ctx'> 		tmp_wb = inode_to_wb_and_lock_list(inode);</div><div class='ctx'> 		spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-		if (!(inode-&gt;i_state &amp; I_DIRTY_ALL))</div><div class='del'>-			wrote++;</div><div class='del'>-		requeue_inode(inode, tmp_wb, &amp;wbc);</div><div class='add'>+		if (!(inode_state_read(inode) &amp; I_DIRTY_ALL))</div><div class='add'>+			total_wrote++;</div><div class='add'>+		requeue_inode(inode, tmp_wb, &amp;wbc, dirtied_before);</div><div class='ctx'> 		inode_sync_complete(inode);</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> </div><div class='hunk'>@@ -1919,14 +2075,14 @@ static long writeback_sb_inodes(struct super_block *sb,</div><div class='ctx'> 		 * bail out to wb_writeback() often enough to check</div><div class='ctx'> 		 * background threshold and other termination conditions.</div><div class='ctx'> 		 */</div><div class='del'>-		if (wrote) {</div><div class='add'>+		if (total_wrote) {</div><div class='ctx'> 			if (time_is_before_jiffies(start_time + HZ / 10UL))</div><div class='ctx'> 				break;</div><div class='ctx'> 			if (work-&gt;nr_pages &lt;= 0)</div><div class='ctx'> 				break;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	return wrote;</div><div class='add'>+	return total_wrote;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static long __writeback_inodes_wb(struct bdi_writeback *wb,</div><div class='hunk'>@@ -1939,9 +2095,9 @@ static long __writeback_inodes_wb(struct bdi_writeback *wb,</div><div class='ctx'> 		struct inode *inode = wb_inode(wb-&gt;b_io.prev);</div><div class='ctx'> 		struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> </div><div class='del'>-		if (!trylock_super(sb)) {</div><div class='add'>+		if (!super_trylock_shared(sb)) {</div><div class='ctx'> 			/*</div><div class='del'>-			 * trylock_super() may fail consistently due to</div><div class='add'>+			 * super_trylock_shared() may fail consistently due to</div><div class='ctx'> 			 * s_umount being grabbed by someone else. Don't use</div><div class='ctx'> 			 * requeue_io() to avoid busy retrying the inode/sb.</div><div class='ctx'> 			 */</div><div class='hunk'>@@ -2008,9 +2164,9 @@ static long wb_writeback(struct bdi_writeback *wb,</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	long progress;</div><div class='ctx'> 	struct blk_plug plug;</div><div class='add'>+	bool queued = false;</div><div class='ctx'> </div><div class='ctx'> 	blk_start_plug(&amp;plug);</div><div class='del'>-	spin_lock(&amp;wb-&gt;list_lock);</div><div class='ctx'> 	for (;;) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Stop writeback when nr_pages has been consumed</div><div class='hunk'>@@ -2035,21 +2191,27 @@ static long wb_writeback(struct bdi_writeback *wb,</div><div class='ctx'> 		if (work-&gt;for_background &amp;&amp; !wb_over_bg_thresh(wb))</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * Kupdate and background works are special and we want to</div><div class='del'>-		 * include all inodes that need writing. Livelock avoidance is</div><div class='del'>-		 * handled by these works yielding to any other work so we are</div><div class='del'>-		 * safe.</div><div class='del'>-		 */</div><div class='del'>-		if (work-&gt;for_kupdate) {</div><div class='del'>-			dirtied_before = jiffies -</div><div class='del'>-				msecs_to_jiffies(dirty_expire_interval * 10);</div><div class='del'>-		} else if (work-&gt;for_background)</div><div class='del'>-			dirtied_before = jiffies;</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;wb-&gt;list_lock);</div><div class='ctx'> </div><div class='ctx'> 		trace_writeback_start(wb, work);</div><div class='del'>-		if (list_empty(&amp;wb-&gt;b_io))</div><div class='add'>+		if (list_empty(&amp;wb-&gt;b_io)) {</div><div class='add'>+			/*</div><div class='add'>+			 * Kupdate and background works are special and we want</div><div class='add'>+			 * to include all inodes that need writing. Livelock</div><div class='add'>+			 * avoidance is handled by these works yielding to any</div><div class='add'>+			 * other work so we are safe.</div><div class='add'>+			 */</div><div class='add'>+			if (work-&gt;for_kupdate) {</div><div class='add'>+				dirtied_before = jiffies -</div><div class='add'>+					msecs_to_jiffies(dirty_expire_interval *</div><div class='add'>+							 10);</div><div class='add'>+			} else if (work-&gt;for_background)</div><div class='add'>+				dirtied_before = jiffies;</div><div class='add'>+</div><div class='ctx'> 			queue_io(wb, work, dirtied_before);</div><div class='add'>+			queued = true;</div><div class='add'>+		}</div><div class='ctx'> 		if (work-&gt;sb)</div><div class='ctx'> 			progress = writeback_sb_inodes(work-&gt;sb, wb, work);</div><div class='ctx'> 		else</div><div class='hunk'>@@ -2064,13 +2226,19 @@ static long wb_writeback(struct bdi_writeback *wb,</div><div class='ctx'> 		 * mean the overall work is done. So we keep looping as long</div><div class='ctx'> 		 * as made some progress on cleaning pages or inodes.</div><div class='ctx'> 		 */</div><div class='del'>-		if (progress)</div><div class='add'>+		if (progress || !queued) {</div><div class='add'>+			spin_unlock(&amp;wb-&gt;list_lock);</div><div class='ctx'> 			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * No more inodes for IO, bail</div><div class='ctx'> 		 */</div><div class='del'>-		if (list_empty(&amp;wb-&gt;b_more_io))</div><div class='add'>+		if (list_empty(&amp;wb-&gt;b_more_io)) {</div><div class='add'>+			spin_unlock(&amp;wb-&gt;list_lock);</div><div class='ctx'> 			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Nothing written. Wait for some inode to</div><div class='ctx'> 		 * become available for writeback. Otherwise</div><div class='hunk'>@@ -2082,9 +2250,7 @@ static long wb_writeback(struct bdi_writeback *wb,</div><div class='ctx'> 		spin_unlock(&amp;wb-&gt;list_lock);</div><div class='ctx'> 		/* This function drops i_lock... */</div><div class='ctx'> 		inode_sleep_on_writeback(inode);</div><div class='del'>-		spin_lock(&amp;wb-&gt;list_lock);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;wb-&gt;list_lock);</div><div class='ctx'> 	blk_finish_plug(&amp;plug);</div><div class='ctx'> </div><div class='ctx'> 	return nr_pages - work-&gt;nr_pages;</div><div class='hunk'>@@ -2097,13 +2263,13 @@ static struct wb_writeback_work *get_next_work_item(struct bdi_writeback *wb)</div><div class='ctx'> {</div><div class='ctx'> 	struct wb_writeback_work *work = NULL;</div><div class='ctx'> </div><div class='del'>-	spin_lock_bh(&amp;wb-&gt;work_lock);</div><div class='add'>+	spin_lock_irq(&amp;wb-&gt;work_lock);</div><div class='ctx'> 	if (!list_empty(&amp;wb-&gt;work_list)) {</div><div class='ctx'> 		work = list_entry(wb-&gt;work_list.next,</div><div class='ctx'> 				  struct wb_writeback_work, list);</div><div class='ctx'> 		list_del_init(&amp;work-&gt;list);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock_bh(&amp;wb-&gt;work_lock);</div><div class='add'>+	spin_unlock_irq(&amp;wb-&gt;work_lock);</div><div class='ctx'> 	return work;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2195,7 +2361,7 @@ static long wb_do_writeback(struct bdi_writeback *wb)</div><div class='ctx'> 	while ((work = get_next_work_item(wb)) != NULL) {</div><div class='ctx'> 		trace_writeback_exec(wb, work);</div><div class='ctx'> 		wrote += wb_writeback(wb, work);</div><div class='del'>-		finish_writeback_work(wb, work);</div><div class='add'>+		finish_writeback_work(work);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -2224,7 +2390,6 @@ void wb_workfn(struct work_struct *work)</div><div class='ctx'> 	long pages_written;</div><div class='ctx'> </div><div class='ctx'> 	set_worker_desc("flush-%s", bdi_dev_name(wb-&gt;bdi));</div><div class='del'>-	current-&gt;flags |= PF_SWAPWRITE;</div><div class='ctx'> </div><div class='ctx'> 	if (likely(!current_is_workqueue_rescuer() ||</div><div class='ctx'> 		   !test_bit(WB_registered, &amp;wb-&gt;state))) {</div><div class='hunk'>@@ -2253,13 +2418,10 @@ void wb_workfn(struct work_struct *work)</div><div class='ctx'> 		wb_wakeup(wb);</div><div class='ctx'> 	else if (wb_has_dirty_io(wb) &amp;&amp; dirty_writeback_interval)</div><div class='ctx'> 		wb_wakeup_delayed(wb);</div><div class='del'>-</div><div class='del'>-	current-&gt;flags &amp;= ~PF_SWAPWRITE;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Start writeback of `nr_pages' pages on this bdi. If `nr_pages' is zero,</div><div class='del'>- * write back the whole world.</div><div class='add'>+ * Start writeback of all dirty pages on this bdi.</div><div class='ctx'>  */</div><div class='ctx'> static void __wakeup_flusher_threads_bdi(struct backing_dev_info *bdi,</div><div class='ctx'> 					 enum wb_reason reason)</div><div class='hunk'>@@ -2291,8 +2453,7 @@ void wakeup_flusher_threads(enum wb_reason reason)</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If we are expecting writeback progress we must submit plugged IO.</div><div class='ctx'> 	 */</div><div class='del'>-	if (blk_needs_flush_plug(current))</div><div class='del'>-		blk_flush_plug(current-&gt;plug, true);</div><div class='add'>+	blk_flush_plug(current-&gt;plug, true);</div><div class='ctx'> </div><div class='ctx'> 	rcu_read_lock();</div><div class='ctx'> 	list_for_each_entry_rcu(bdi, &amp;bdi_list, bdi_list)</div><div class='hunk'>@@ -2334,24 +2495,36 @@ static void wakeup_dirtytime_writeback(struct work_struct *w)</div><div class='ctx'> 	schedule_delayed_work(&amp;dirtytime_work, dirtytime_expire_interval * HZ);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __init start_dirtytime_writeback(void)</div><div class='del'>-{</div><div class='del'>-	schedule_delayed_work(&amp;dirtytime_work, dirtytime_expire_interval * HZ);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-__initcall(start_dirtytime_writeback);</div><div class='del'>-</div><div class='del'>-int dirtytime_interval_handler(struct ctl_table *table, int write,</div><div class='add'>+static int dirtytime_interval_handler(const struct ctl_table *table, int write,</div><div class='ctx'> 			       void *buffer, size_t *lenp, loff_t *ppos)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	ret = proc_dointvec_minmax(table, write, buffer, lenp, ppos);</div><div class='ctx'> 	if (ret == 0 &amp;&amp; write)</div><div class='del'>-		mod_delayed_work(system_wq, &amp;dirtytime_work, 0);</div><div class='add'>+		mod_delayed_work(system_percpu_wq, &amp;dirtytime_work, 0);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static const struct ctl_table vm_fs_writeback_table[] = {</div><div class='add'>+	{</div><div class='add'>+		.procname	= "dirtytime_expire_seconds",</div><div class='add'>+		.data		= &amp;dirtytime_expire_interval,</div><div class='add'>+		.maxlen		= sizeof(dirtytime_expire_interval),</div><div class='add'>+		.mode		= 0644,</div><div class='add'>+		.proc_handler	= dirtytime_interval_handler,</div><div class='add'>+		.extra1		= SYSCTL_ZERO,</div><div class='add'>+	},</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int __init start_dirtytime_writeback(void)</div><div class='add'>+{</div><div class='add'>+	schedule_delayed_work(&amp;dirtytime_work, dirtytime_expire_interval * HZ);</div><div class='add'>+	register_sysctl_init("vm", vm_fs_writeback_table);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+__initcall(start_dirtytime_writeback);</div><div class='add'>+</div><div class='ctx'> /**</div><div class='ctx'>  * __mark_inode_dirty -	internal function to mark an inode dirty</div><div class='ctx'>  *</div><div class='hunk'>@@ -2383,11 +2556,26 @@ void __mark_inode_dirty(struct inode *inode, int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	int dirtytime = 0;</div><div class='add'>+	struct bdi_writeback *wb = NULL;</div><div class='ctx'> </div><div class='ctx'> 	trace_writeback_mark_inode_dirty(inode, flags);</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; I_DIRTY_INODE) {</div><div class='ctx'> 		/*</div><div class='add'>+		 * Inode timestamp update will piggback on this dirtying.</div><div class='add'>+		 * We tell -&gt;dirty_inode callback that timestamps need to</div><div class='add'>+		 * be updated by setting I_DIRTY_TIME in flags.</div><div class='add'>+		 */</div><div class='add'>+		if (inode_state_read_once(inode) &amp; I_DIRTY_TIME) {</div><div class='add'>+			spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+			if (inode_state_read(inode) &amp; I_DIRTY_TIME) {</div><div class='add'>+				inode_state_clear(inode, I_DIRTY_TIME);</div><div class='add'>+				flags |= I_DIRTY_TIME;</div><div class='add'>+			}</div><div class='add'>+			spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='ctx'> 		 * Notify the filesystem about the inode being dirtied, so that</div><div class='ctx'> 		 * (if needed) it can update on-disk fields and journal the</div><div class='ctx'> 		 * inode.  This is only needed when the inode itself is being</div><div class='hunk'>@@ -2396,7 +2584,8 @@ void __mark_inode_dirty(struct inode *inode, int flags)</div><div class='ctx'> 		 */</div><div class='ctx'> 		trace_writeback_dirty_inode_start(inode, flags);</div><div class='ctx'> 		if (sb-&gt;s_op-&gt;dirty_inode)</div><div class='del'>-			sb-&gt;s_op-&gt;dirty_inode(inode, flags &amp; I_DIRTY_INODE);</div><div class='add'>+			sb-&gt;s_op-&gt;dirty_inode(inode,</div><div class='add'>+				flags &amp; (I_DIRTY_INODE | I_DIRTY_TIME));</div><div class='ctx'> 		trace_writeback_dirty_inode(inode, flags);</div><div class='ctx'> </div><div class='ctx'> 		/* I_DIRTY_INODE supersedes I_DIRTY_TIME. */</div><div class='hunk'>@@ -2417,22 +2606,27 @@ void __mark_inode_dirty(struct inode *inode, int flags)</div><div class='ctx'> 	 */</div><div class='ctx'> 	smp_mb();</div><div class='ctx'> </div><div class='del'>-	if (((inode-&gt;i_state &amp; flags) == flags) ||</div><div class='del'>-	    (dirtytime &amp;&amp; (inode-&gt;i_state &amp; I_DIRTY_INODE)))</div><div class='add'>+	if ((inode_state_read_once(inode) &amp; flags) == flags)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-	if (dirtytime &amp;&amp; (inode-&gt;i_state &amp; I_DIRTY_INODE))</div><div class='del'>-		goto out_unlock_inode;</div><div class='del'>-	if ((inode-&gt;i_state &amp; flags) != flags) {</div><div class='del'>-		const int was_dirty = inode-&gt;i_state &amp; I_DIRTY;</div><div class='add'>+	if ((inode_state_read(inode) &amp; flags) != flags) {</div><div class='add'>+		const int was_dirty = inode_state_read(inode) &amp; I_DIRTY;</div><div class='ctx'> </div><div class='ctx'> 		inode_attach_wb(inode, NULL);</div><div class='ctx'> </div><div class='del'>-		/* I_DIRTY_INODE supersedes I_DIRTY_TIME. */</div><div class='del'>-		if (flags &amp; I_DIRTY_INODE)</div><div class='del'>-			inode-&gt;i_state &amp;= ~I_DIRTY_TIME;</div><div class='del'>-		inode-&gt;i_state |= flags;</div><div class='add'>+		inode_state_set(inode, flags);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Grab inode's wb early because it requires dropping i_lock and we</div><div class='add'>+		 * need to make sure following checks happen atomically with dirty</div><div class='add'>+		 * list handling so that we don't move inodes under flush worker's</div><div class='add'>+		 * hands.</div><div class='add'>+		 */</div><div class='add'>+		if (!was_dirty) {</div><div class='add'>+			wb = locked_inode_to_wb_and_lock_list(inode);</div><div class='add'>+			spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * If the inode is queued for writeback by flush worker, just</div><div class='hunk'>@@ -2440,8 +2634,8 @@ void __mark_inode_dirty(struct inode *inode, int flags)</div><div class='ctx'> 		 * the inode it will place it on the appropriate superblock</div><div class='ctx'> 		 * list, based upon its state.</div><div class='ctx'> 		 */</div><div class='del'>-		if (inode-&gt;i_state &amp; I_SYNC_QUEUED)</div><div class='del'>-			goto out_unlock_inode;</div><div class='add'>+		if (inode_state_read(inode) &amp; I_SYNC_QUEUED)</div><div class='add'>+			goto out_unlock;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Only add valid (hashed) inodes to the superblock's</div><div class='hunk'>@@ -2449,27 +2643,24 @@ void __mark_inode_dirty(struct inode *inode, int flags)</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (!S_ISBLK(inode-&gt;i_mode)) {</div><div class='ctx'> 			if (inode_unhashed(inode))</div><div class='del'>-				goto out_unlock_inode;</div><div class='add'>+				goto out_unlock;</div><div class='ctx'> 		}</div><div class='del'>-		if (inode-&gt;i_state &amp; I_FREEING)</div><div class='del'>-			goto out_unlock_inode;</div><div class='add'>+		if (inode_state_read(inode) &amp; I_FREEING)</div><div class='add'>+			goto out_unlock;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * If the inode was already on b_dirty/b_io/b_more_io, don't</div><div class='ctx'> 		 * reposition it (that would break b_dirty time-ordering).</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (!was_dirty) {</div><div class='del'>-			struct bdi_writeback *wb;</div><div class='ctx'> 			struct list_head *dirty_list;</div><div class='ctx'> 			bool wakeup_bdi = false;</div><div class='ctx'> </div><div class='del'>-			wb = locked_inode_to_wb_and_lock_list(inode);</div><div class='del'>-</div><div class='ctx'> 			inode-&gt;dirtied_when = jiffies;</div><div class='ctx'> 			if (dirtytime)</div><div class='ctx'> 				inode-&gt;dirtied_time_when = jiffies;</div><div class='ctx'> </div><div class='del'>-			if (inode-&gt;i_state &amp; I_DIRTY)</div><div class='add'>+			if (inode_state_read(inode) &amp; I_DIRTY)</div><div class='ctx'> 				dirty_list = &amp;wb-&gt;b_dirty;</div><div class='ctx'> 			else</div><div class='ctx'> 				dirty_list = &amp;wb-&gt;b_dirty_time;</div><div class='hunk'>@@ -2477,9 +2668,6 @@ void __mark_inode_dirty(struct inode *inode, int flags)</div><div class='ctx'> 			wakeup_bdi = inode_io_list_move_locked(inode, wb,</div><div class='ctx'> 							       dirty_list);</div><div class='ctx'> </div><div class='del'>-			spin_unlock(&amp;wb-&gt;list_lock);</div><div class='del'>-			trace_writeback_dirty_inode_enqueue(inode);</div><div class='del'>-</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * If this is the first dirty inode for this bdi,</div><div class='ctx'> 			 * we have to wake-up the corresponding bdi thread</div><div class='hunk'>@@ -2489,10 +2677,17 @@ void __mark_inode_dirty(struct inode *inode, int flags)</div><div class='ctx'> 			if (wakeup_bdi &amp;&amp;</div><div class='ctx'> 			    (wb-&gt;bdi-&gt;capabilities &amp; BDI_CAP_WRITEBACK))</div><div class='ctx'> 				wb_wakeup_delayed(wb);</div><div class='add'>+</div><div class='add'>+			spin_unlock(&amp;wb-&gt;list_lock);</div><div class='add'>+			spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+			trace_writeback_dirty_inode_enqueue(inode);</div><div class='add'>+</div><div class='ctx'> 			return;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-out_unlock_inode:</div><div class='add'>+out_unlock:</div><div class='add'>+	if (wb)</div><div class='add'>+		spin_unlock(&amp;wb-&gt;list_lock);</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(__mark_inode_dirty);</div><div class='hunk'>@@ -2562,7 +2757,7 @@ static void wait_sb_inodes(struct super_block *sb)</div><div class='ctx'> 		spin_unlock_irq(&amp;sb-&gt;s_inode_wblist_lock);</div><div class='ctx'> </div><div class='ctx'> 		spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-		if (inode-&gt;i_state &amp; (I_FREEING|I_WILL_FREE|I_NEW)) {</div><div class='add'>+		if (inode_state_read(inode) &amp; (I_FREEING | I_WILL_FREE | I_NEW)) {</div><div class='ctx'> 			spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> </div><div class='ctx'> 			spin_lock_irq(&amp;sb-&gt;s_inode_wblist_lock);</div><div class='hunk'>@@ -2642,7 +2837,7 @@ EXPORT_SYMBOL(writeback_inodes_sb_nr);</div><div class='ctx'>  */</div><div class='ctx'> void writeback_inodes_sb(struct super_block *sb, enum wb_reason reason)</div><div class='ctx'> {</div><div class='del'>-	return writeback_inodes_sb_nr(sb, get_nr_dirty_pages(), reason);</div><div class='add'>+	writeback_inodes_sb_nr(sb, get_nr_dirty_pages(), reason);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(writeback_inodes_sb);</div><div class='ctx'> </div><div class='head'>diff --git a/fs/fs_context.c b/fs/fs_context.c<br/>index b7e43a780a62..93b7ebf8d927 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fs_context.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fs_context.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fs_context.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fs_context.c</a></div><div class='hunk'>@@ -161,21 +161,24 @@ int vfs_parse_fs_param(struct fs_context *fc, struct fs_parameter *param)</div><div class='ctx'> EXPORT_SYMBOL(vfs_parse_fs_param);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * vfs_parse_fs_string - Convenience function to just parse a string.</div><div class='add'>+ * vfs_parse_fs_qstr - Convenience function to just parse a string.</div><div class='add'>+ * @fc: Filesystem context.</div><div class='add'>+ * @key: Parameter name.</div><div class='add'>+ * @value: Default value.</div><div class='ctx'>  */</div><div class='del'>-int vfs_parse_fs_string(struct fs_context *fc, const char *key,</div><div class='del'>-			const char *value, size_t v_size)</div><div class='add'>+int vfs_parse_fs_qstr(struct fs_context *fc, const char *key,</div><div class='add'>+			const struct qstr *value)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	struct fs_parameter param = {</div><div class='ctx'> 		.key	= key,</div><div class='ctx'> 		.type	= fs_value_is_flag,</div><div class='del'>-		.size	= v_size,</div><div class='add'>+		.size	= value ? value-&gt;len : 0,</div><div class='ctx'> 	};</div><div class='ctx'> </div><div class='ctx'> 	if (value) {</div><div class='del'>-		param.string = kmemdup_nul(value, v_size, GFP_KERNEL);</div><div class='add'>+		param.string = kmemdup_nul(value-&gt;name, value-&gt;len, GFP_KERNEL);</div><div class='ctx'> 		if (!param.string)</div><div class='ctx'> 			return -ENOMEM;</div><div class='ctx'> 		param.type = fs_value_is_string;</div><div class='hunk'>@@ -185,20 +188,22 @@ int vfs_parse_fs_string(struct fs_context *fc, const char *key,</div><div class='ctx'> 	kfree(param.string);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(vfs_parse_fs_string);</div><div class='add'>+EXPORT_SYMBOL(vfs_parse_fs_qstr);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * generic_parse_monolithic - Parse key[=val][,key[=val]]* mount data</div><div class='del'>- * @ctx: The superblock configuration to fill in.</div><div class='add'>+ * vfs_parse_monolithic_sep - Parse key[=val][,key[=val]]* mount data</div><div class='add'>+ * @fc: The superblock configuration to fill in.</div><div class='ctx'>  * @data: The data to parse</div><div class='add'>+ * @sep: callback for separating next option</div><div class='ctx'>  *</div><div class='del'>- * Parse a blob of data that's in key[=val][,key[=val]]* form.  This can be</div><div class='del'>- * called from the -&gt;monolithic_mount_data() fs_context operation.</div><div class='add'>+ * Parse a blob of data that's in key[=val][,key[=val]]* form with a custom</div><div class='add'>+ * option separator callback.</div><div class='ctx'>  *</div><div class='ctx'>  * Returns 0 on success or the error returned by the -&gt;parse_option() fs_context</div><div class='ctx'>  * operation on failure.</div><div class='ctx'>  */</div><div class='del'>-int generic_parse_monolithic(struct fs_context *fc, void *data)</div><div class='add'>+int vfs_parse_monolithic_sep(struct fs_context *fc, void *data,</div><div class='add'>+			     char *(*sep)(char **))</div><div class='ctx'> {</div><div class='ctx'> 	char *options = data, *key;</div><div class='ctx'> 	int ret = 0;</div><div class='hunk'>@@ -210,18 +215,16 @@ int generic_parse_monolithic(struct fs_context *fc, void *data)</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	while ((key = strsep(&amp;options, ",")) != NULL) {</div><div class='add'>+	while ((key = sep(&amp;options)) != NULL) {</div><div class='ctx'> 		if (*key) {</div><div class='del'>-			size_t v_len = 0;</div><div class='ctx'> 			char *value = strchr(key, '=');</div><div class='ctx'> </div><div class='ctx'> 			if (value) {</div><div class='del'>-				if (value == key)</div><div class='add'>+				if (unlikely(value == key))</div><div class='ctx'> 					continue;</div><div class='ctx'> 				*value++ = 0;</div><div class='del'>-				v_len = strlen(value);</div><div class='ctx'> 			}</div><div class='del'>-			ret = vfs_parse_fs_string(fc, key, value, v_len);</div><div class='add'>+			ret = vfs_parse_fs_string(fc, key, value);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='ctx'> 				break;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -229,6 +232,28 @@ int generic_parse_monolithic(struct fs_context *fc, void *data)</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL(vfs_parse_monolithic_sep);</div><div class='add'>+</div><div class='add'>+static char *vfs_parse_comma_sep(char **s)</div><div class='add'>+{</div><div class='add'>+	return strsep(s, ",");</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * generic_parse_monolithic - Parse key[=val][,key[=val]]* mount data</div><div class='add'>+ * @fc: The superblock configuration to fill in.</div><div class='add'>+ * @data: The data to parse</div><div class='add'>+ *</div><div class='add'>+ * Parse a blob of data that's in key[=val][,key[=val]]* form.  This can be</div><div class='add'>+ * called from the -&gt;monolithic_mount_data() fs_context operation.</div><div class='add'>+ *</div><div class='add'>+ * Returns 0 on success or the error returned by the -&gt;parse_option() fs_context</div><div class='add'>+ * operation on failure.</div><div class='add'>+ */</div><div class='add'>+int generic_parse_monolithic(struct fs_context *fc, void *data)</div><div class='add'>+{</div><div class='add'>+	return vfs_parse_monolithic_sep(fc, data, vfs_parse_comma_sep);</div><div class='add'>+}</div><div class='ctx'> EXPORT_SYMBOL(generic_parse_monolithic);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -315,10 +340,31 @@ struct fs_context *fs_context_for_reconfigure(struct dentry *dentry,</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(fs_context_for_reconfigure);</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * fs_context_for_submount: allocate a new fs_context for a submount</div><div class='add'>+ * @type: file_system_type of the new context</div><div class='add'>+ * @reference: reference dentry from which to copy relevant info</div><div class='add'>+ *</div><div class='add'>+ * Allocate a new fs_context suitable for a submount. This also ensures that</div><div class='add'>+ * the fc-&gt;security object is inherited from @reference (if needed).</div><div class='add'>+ */</div><div class='ctx'> struct fs_context *fs_context_for_submount(struct file_system_type *type,</div><div class='ctx'> 					   struct dentry *reference)</div><div class='ctx'> {</div><div class='del'>-	return alloc_fs_context(type, reference, 0, 0, FS_CONTEXT_FOR_SUBMOUNT);</div><div class='add'>+	struct fs_context *fc;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	fc = alloc_fs_context(type, reference, 0, 0, FS_CONTEXT_FOR_SUBMOUNT);</div><div class='add'>+	if (IS_ERR(fc))</div><div class='add'>+		return fc;</div><div class='add'>+</div><div class='add'>+	ret = security_fs_context_submount(fc, reference-&gt;d_sb);</div><div class='add'>+	if (ret) {</div><div class='add'>+		put_fs_context(fc);</div><div class='add'>+		return ERR_PTR(ret);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return fc;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(fs_context_for_submount);</div><div class='ctx'> </div><div class='hunk'>@@ -333,7 +379,7 @@ void fc_drop_locked(struct fs_context *fc)</div><div class='ctx'> static void legacy_fs_context_free(struct fs_context *fc);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * vfs_dup_fc_config: Duplicate a filesystem context.</div><div class='add'>+ * vfs_dup_fs_context - Duplicate a filesystem context.</div><div class='ctx'>  * @src_fc: The context to copy.</div><div class='ctx'>  */</div><div class='ctx'> struct fs_context *vfs_dup_fs_context(struct fs_context *src_fc)</div><div class='hunk'>@@ -379,7 +425,9 @@ EXPORT_SYMBOL(vfs_dup_fs_context);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * logfc - Log a message to a filesystem context</div><div class='del'>- * @fc: The filesystem context to log to.</div><div class='add'>+ * @log: The filesystem context to log to, or NULL to use printk.</div><div class='add'>+ * @prefix: A string to prefix the output with, or NULL.</div><div class='add'>+ * @level: 'w' for a warning, 'e' for an error.  Anything else is a notice.</div><div class='ctx'>  * @fmt: The format of the buffer.</div><div class='ctx'>  */</div><div class='ctx'> void logfc(struct fc_log *log, const char *prefix, char level, const char *fmt, ...)</div><div class='hunk'>@@ -398,6 +446,10 @@ void logfc(struct fc_log *log, const char *prefix, char level, const char *fmt,</div><div class='ctx'> 			printk(KERN_ERR "%s%s%pV\n", prefix ? prefix : "",</div><div class='ctx'> 						prefix ? ": " : "", &amp;vaf);</div><div class='ctx'> 			break;</div><div class='add'>+		case 'i':</div><div class='add'>+			printk(KERN_INFO "%s%s%pV\n", prefix ? prefix : "",</div><div class='add'>+						prefix ? ": " : "", &amp;vaf);</div><div class='add'>+			break;</div><div class='ctx'> 		default:</div><div class='ctx'> 			printk(KERN_NOTICE "%s%s%pV\n", prefix ? prefix : "",</div><div class='ctx'> 						prefix ? ": " : "", &amp;vaf);</div><div class='hunk'>@@ -442,7 +494,7 @@ static void put_fc_log(struct fs_context *fc)</div><div class='ctx'> 	if (log) {</div><div class='ctx'> 		if (refcount_dec_and_test(&amp;log-&gt;usage)) {</div><div class='ctx'> 			fc-&gt;log.log = NULL;</div><div class='del'>-			for (i = 0; i &lt;= 7; i++)</div><div class='add'>+			for (i = 0; i &lt; ARRAY_SIZE(log-&gt;buffer) ; i++)</div><div class='ctx'> 				if (log-&gt;need_free &amp; (1 &lt;&lt; i))</div><div class='ctx'> 					kfree(log-&gt;buffer[i]);</div><div class='ctx'> 			kfree(log);</div><div class='hunk'>@@ -548,7 +600,7 @@ static int legacy_parse_param(struct fs_context *fc, struct fs_parameter *param)</div><div class='ctx'> 			      param-&gt;key);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (len &gt; PAGE_SIZE - 2 - size)</div><div class='add'>+	if (size + len + 2 &gt; PAGE_SIZE)</div><div class='ctx'> 		return invalf(fc, "VFS: Legacy: Cumulative options too large");</div><div class='ctx'> 	if (strchr(param-&gt;key, ',') ||</div><div class='ctx'> 	    (param-&gt;type == fs_value_is_string &amp;&amp;</div><div class='hunk'>@@ -561,7 +613,8 @@ static int legacy_parse_param(struct fs_context *fc, struct fs_parameter *param)</div><div class='ctx'> 			return -ENOMEM;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ctx-&gt;legacy_data[size++] = ',';</div><div class='add'>+	if (size)</div><div class='add'>+		ctx-&gt;legacy_data[size++] = ',';</div><div class='ctx'> 	len = strlen(param-&gt;key);</div><div class='ctx'> 	memcpy(ctx-&gt;legacy_data + size, param-&gt;key, len);</div><div class='ctx'> 	size += len;</div><div class='hunk'>@@ -691,6 +744,7 @@ void vfs_clean_context(struct fs_context *fc)</div><div class='ctx'> 	security_free_mnt_opts(&amp;fc-&gt;security);</div><div class='ctx'> 	kfree(fc-&gt;source);</div><div class='ctx'> 	fc-&gt;source = NULL;</div><div class='add'>+	fc-&gt;exclusive = false;</div><div class='ctx'> </div><div class='ctx'> 	fc-&gt;purpose = FS_CONTEXT_FOR_RECONFIGURE;</div><div class='ctx'> 	fc-&gt;phase = FS_CONTEXT_AWAITING_RECONF;</div><div class='head'>diff --git a/fs/fs_types.c b/fs/fs_dirent.c<br/>index 78365e5dc08c..e5e08f213816 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fs_types.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fs_types.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fs_dirent.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fs_dirent.c</a></div><div class='hunk'>@@ -1,5 +1,5 @@</div><div class='ctx'> // SPDX-License-Identifier: GPL-2.0</div><div class='del'>-#include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/fs_dirent.h&gt;</div><div class='ctx'> #include &lt;linux/export.h&gt;</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='head'>diff --git a/fs/fs_parser.c b/fs/fs_parser.c<br/>index 3df07c0e32b3..c092a9f79e32 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fs_parser.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fs_parser.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fs_parser.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fs_parser.c</a></div><div class='hunk'>@@ -13,7 +13,7 @@</div><div class='ctx'> #include &lt;linux/namei.h&gt;</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> </div><div class='del'>-static const struct constant_table bool_names[] = {</div><div class='add'>+const struct constant_table bool_names[] = {</div><div class='ctx'> 	{ "0",		false },</div><div class='ctx'> 	{ "1",		true },</div><div class='ctx'> 	{ "false",	false },</div><div class='hunk'>@@ -22,6 +22,7 @@ static const struct constant_table bool_names[] = {</div><div class='ctx'> 	{ "yes",	true },</div><div class='ctx'> 	{ },</div><div class='ctx'> };</div><div class='add'>+EXPORT_SYMBOL(bool_names);</div><div class='ctx'> </div><div class='ctx'> static const struct constant_table *</div><div class='ctx'> __lookup_constant(const struct constant_table *tbl, const char *name)</div><div class='hunk'>@@ -83,8 +84,8 @@ static const struct fs_parameter_spec *fs_lookup_key(</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * fs_parse - Parse a filesystem configuration parameter</div><div class='del'>- * @fc: The filesystem context to log errors through.</div><div class='add'>+ * __fs_parse - Parse a filesystem configuration parameter</div><div class='add'>+ * @log: The filesystem context to log errors through.</div><div class='ctx'>  * @desc: The parameter description to use.</div><div class='ctx'>  * @param: The parameter.</div><div class='ctx'>  * @result: Where to place the result of the parse</div><div class='hunk'>@@ -138,15 +139,16 @@ EXPORT_SYMBOL(__fs_parse);</div><div class='ctx'>  * @fc: The filesystem context to log errors through.</div><div class='ctx'>  * @param: The parameter.</div><div class='ctx'>  * @want_bdev: T if want a blockdev</div><div class='add'>+ * @flags: Pathwalk flags passed to filename_lookup()</div><div class='ctx'>  * @_path: The result of the lookup</div><div class='ctx'>  */</div><div class='ctx'> int fs_lookup_param(struct fs_context *fc,</div><div class='ctx'> 		    struct fs_parameter *param,</div><div class='ctx'> 		    bool want_bdev,</div><div class='add'>+		    unsigned int flags,</div><div class='ctx'> 		    struct path *_path)</div><div class='ctx'> {</div><div class='ctx'> 	struct filename *f;</div><div class='del'>-	unsigned int flags = 0;</div><div class='ctx'> 	bool put_f;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -155,6 +157,7 @@ int fs_lookup_param(struct fs_context *fc,</div><div class='ctx'> 		f = getname_kernel(param-&gt;string);</div><div class='ctx'> 		if (IS_ERR(f))</div><div class='ctx'> 			return PTR_ERR(f);</div><div class='add'>+		param-&gt;dirfd = AT_FDCWD;</div><div class='ctx'> 		put_f = true;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case fs_value_is_filename:</div><div class='hunk'>@@ -199,6 +202,8 @@ int fs_param_is_bool(struct p_log *log, const struct fs_parameter_spec *p,</div><div class='ctx'> 	int b;</div><div class='ctx'> 	if (param-&gt;type != fs_value_is_string)</div><div class='ctx'> 		return fs_param_bad_value(log, param);</div><div class='add'>+	if (!*param-&gt;string &amp;&amp; (p-&gt;flags &amp; fs_param_can_be_empty))</div><div class='add'>+		return 0;</div><div class='ctx'> 	b = lookup_constant(bool_names, param-&gt;string, -1);</div><div class='ctx'> 	if (b == -1)</div><div class='ctx'> 		return fs_param_bad_value(log, param);</div><div class='hunk'>@@ -211,8 +216,11 @@ int fs_param_is_u32(struct p_log *log, const struct fs_parameter_spec *p,</div><div class='ctx'> 		    struct fs_parameter *param, struct fs_parse_result *result)</div><div class='ctx'> {</div><div class='ctx'> 	int base = (unsigned long)p-&gt;data;</div><div class='del'>-	if (param-&gt;type != fs_value_is_string ||</div><div class='del'>-	    kstrtouint(param-&gt;string, base, &amp;result-&gt;uint_32) &lt; 0)</div><div class='add'>+	if (param-&gt;type != fs_value_is_string)</div><div class='add'>+		return fs_param_bad_value(log, param);</div><div class='add'>+	if (!*param-&gt;string &amp;&amp; (p-&gt;flags &amp; fs_param_can_be_empty))</div><div class='add'>+		return 0;</div><div class='add'>+	if (kstrtouint(param-&gt;string, base, &amp;result-&gt;uint_32) &lt; 0)</div><div class='ctx'> 		return fs_param_bad_value(log, param);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -221,8 +229,11 @@ EXPORT_SYMBOL(fs_param_is_u32);</div><div class='ctx'> int fs_param_is_s32(struct p_log *log, const struct fs_parameter_spec *p,</div><div class='ctx'> 		    struct fs_parameter *param, struct fs_parse_result *result)</div><div class='ctx'> {</div><div class='del'>-	if (param-&gt;type != fs_value_is_string ||</div><div class='del'>-	    kstrtoint(param-&gt;string, 0, &amp;result-&gt;int_32) &lt; 0)</div><div class='add'>+	if (param-&gt;type != fs_value_is_string)</div><div class='add'>+		return fs_param_bad_value(log, param);</div><div class='add'>+	if (!*param-&gt;string &amp;&amp; (p-&gt;flags &amp; fs_param_can_be_empty))</div><div class='add'>+		return 0;</div><div class='add'>+	if (kstrtoint(param-&gt;string, 0, &amp;result-&gt;int_32) &lt; 0)</div><div class='ctx'> 		return fs_param_bad_value(log, param);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -231,8 +242,11 @@ EXPORT_SYMBOL(fs_param_is_s32);</div><div class='ctx'> int fs_param_is_u64(struct p_log *log, const struct fs_parameter_spec *p,</div><div class='ctx'> 		    struct fs_parameter *param, struct fs_parse_result *result)</div><div class='ctx'> {</div><div class='del'>-	if (param-&gt;type != fs_value_is_string ||</div><div class='del'>-	    kstrtoull(param-&gt;string, 0, &amp;result-&gt;uint_64) &lt; 0)</div><div class='add'>+	if (param-&gt;type != fs_value_is_string)</div><div class='add'>+		return fs_param_bad_value(log, param);</div><div class='add'>+	if (!*param-&gt;string &amp;&amp; (p-&gt;flags &amp; fs_param_can_be_empty))</div><div class='add'>+		return 0;</div><div class='add'>+	if (kstrtoull(param-&gt;string, 0, &amp;result-&gt;uint_64) &lt; 0)</div><div class='ctx'> 		return fs_param_bad_value(log, param);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -244,6 +258,8 @@ int fs_param_is_enum(struct p_log *log, const struct fs_parameter_spec *p,</div><div class='ctx'> 	const struct constant_table *c;</div><div class='ctx'> 	if (param-&gt;type != fs_value_is_string)</div><div class='ctx'> 		return fs_param_bad_value(log, param);</div><div class='add'>+	if (!*param-&gt;string &amp;&amp; (p-&gt;flags &amp; fs_param_can_be_empty))</div><div class='add'>+		return 0;</div><div class='ctx'> 	c = __lookup_constant(p-&gt;data, param-&gt;string);</div><div class='ctx'> 	if (!c)</div><div class='ctx'> 		return fs_param_bad_value(log, param);</div><div class='hunk'>@@ -255,7 +271,8 @@ EXPORT_SYMBOL(fs_param_is_enum);</div><div class='ctx'> int fs_param_is_string(struct p_log *log, const struct fs_parameter_spec *p,</div><div class='ctx'> 		       struct fs_parameter *param, struct fs_parse_result *result)</div><div class='ctx'> {</div><div class='del'>-	if (param-&gt;type != fs_value_is_string || !*param-&gt;string)</div><div class='add'>+	if (param-&gt;type != fs_value_is_string ||</div><div class='add'>+	    (!*param-&gt;string &amp;&amp; !(p-&gt;flags &amp; fs_param_can_be_empty)))</div><div class='ctx'> 		return fs_param_bad_value(log, param);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -275,7 +292,8 @@ int fs_param_is_fd(struct p_log *log, const struct fs_parameter_spec *p,</div><div class='ctx'> {</div><div class='ctx'> 	switch (param-&gt;type) {</div><div class='ctx'> 	case fs_value_is_string:</div><div class='del'>-		if (kstrtouint(param-&gt;string, 0, &amp;result-&gt;uint_32) &lt; 0)</div><div class='add'>+		if ((!*param-&gt;string &amp;&amp; !(p-&gt;flags &amp; fs_param_can_be_empty)) ||</div><div class='add'>+		    kstrtouint(param-&gt;string, 0, &amp;result-&gt;uint_32) &lt; 0)</div><div class='ctx'> 			break;</div><div class='ctx'> 		if (result-&gt;uint_32 &lt;= INT_MAX)</div><div class='ctx'> 			return 0;</div><div class='hunk'>@@ -292,74 +310,79 @@ int fs_param_is_fd(struct p_log *log, const struct fs_parameter_spec *p,</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(fs_param_is_fd);</div><div class='ctx'> </div><div class='del'>-int fs_param_is_blockdev(struct p_log *log, const struct fs_parameter_spec *p,</div><div class='del'>-		  struct fs_parameter *param, struct fs_parse_result *result)</div><div class='add'>+int fs_param_is_file_or_string(struct p_log *log,</div><div class='add'>+			       const struct fs_parameter_spec *p,</div><div class='add'>+			       struct fs_parameter *param,</div><div class='add'>+			       struct fs_parse_result *result)</div><div class='ctx'> {</div><div class='del'>-	return 0;</div><div class='add'>+	switch (param-&gt;type) {</div><div class='add'>+	case fs_value_is_string:</div><div class='add'>+		return fs_param_is_string(log, p, param, result);</div><div class='add'>+	case fs_value_is_file:</div><div class='add'>+		result-&gt;uint_32 = param-&gt;dirfd;</div><div class='add'>+		if (result-&gt;uint_32 &lt;= INT_MAX)</div><div class='add'>+			return 0;</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+	return fs_param_bad_value(log, param);</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(fs_param_is_blockdev);</div><div class='add'>+EXPORT_SYMBOL(fs_param_is_file_or_string);</div><div class='ctx'> </div><div class='del'>-int fs_param_is_path(struct p_log *log, const struct fs_parameter_spec *p,</div><div class='del'>-		     struct fs_parameter *param, struct fs_parse_result *result)</div><div class='add'>+int fs_param_is_uid(struct p_log *log, const struct fs_parameter_spec *p,</div><div class='add'>+		    struct fs_parameter *param, struct fs_parse_result *result)</div><div class='ctx'> {</div><div class='add'>+	kuid_t uid;</div><div class='add'>+</div><div class='add'>+	if (fs_param_is_u32(log, p, param, result) != 0)</div><div class='add'>+		return fs_param_bad_value(log, param);</div><div class='add'>+</div><div class='add'>+	uid = make_kuid(current_user_ns(), result-&gt;uint_32);</div><div class='add'>+	if (!uid_valid(uid))</div><div class='add'>+		return inval_plog(log, "Invalid uid '%s'", param-&gt;string);</div><div class='add'>+</div><div class='add'>+	result-&gt;uid = uid;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(fs_param_is_path);</div><div class='add'>+EXPORT_SYMBOL(fs_param_is_uid);</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_VALIDATE_FS_PARSER</div><div class='del'>-/**</div><div class='del'>- * validate_constant_table - Validate a constant table</div><div class='del'>- * @tbl: The constant table to validate.</div><div class='del'>- * @tbl_size: The size of the table.</div><div class='del'>- * @low: The lowest permissible value.</div><div class='del'>- * @high: The highest permissible value.</div><div class='del'>- * @special: One special permissible value outside of the range.</div><div class='del'>- */</div><div class='del'>-bool validate_constant_table(const struct constant_table *tbl, size_t tbl_size,</div><div class='del'>-			     int low, int high, int special)</div><div class='add'>+int fs_param_is_gid(struct p_log *log, const struct fs_parameter_spec *p,</div><div class='add'>+		    struct fs_parameter *param, struct fs_parse_result *result)</div><div class='ctx'> {</div><div class='del'>-	size_t i;</div><div class='del'>-	bool good = true;</div><div class='add'>+	kgid_t gid;</div><div class='ctx'> </div><div class='del'>-	if (tbl_size == 0) {</div><div class='del'>-		pr_warn("VALIDATE C-TBL: Empty\n");</div><div class='del'>-		return true;</div><div class='del'>-	}</div><div class='add'>+	if (fs_param_is_u32(log, p, param, result) != 0)</div><div class='add'>+		return fs_param_bad_value(log, param);</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; tbl_size; i++) {</div><div class='del'>-		if (!tbl[i].name) {</div><div class='del'>-			pr_err("VALIDATE C-TBL[%zu]: Null\n", i);</div><div class='del'>-			good = false;</div><div class='del'>-		} else if (i &gt; 0 &amp;&amp; tbl[i - 1].name) {</div><div class='del'>-			int c = strcmp(tbl[i-1].name, tbl[i].name);</div><div class='add'>+	gid = make_kgid(current_user_ns(), result-&gt;uint_32);</div><div class='add'>+	if (!gid_valid(gid))</div><div class='add'>+		return inval_plog(log, "Invalid gid '%s'", param-&gt;string);</div><div class='ctx'> </div><div class='del'>-			if (c == 0) {</div><div class='del'>-				pr_err("VALIDATE C-TBL[%zu]: Duplicate %s\n",</div><div class='del'>-				       i, tbl[i].name);</div><div class='del'>-				good = false;</div><div class='del'>-			}</div><div class='del'>-			if (c &gt; 0) {</div><div class='del'>-				pr_err("VALIDATE C-TBL[%zu]: Missorted %s&gt;=%s\n",</div><div class='del'>-				       i, tbl[i-1].name, tbl[i].name);</div><div class='del'>-				good = false;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='add'>+	result-&gt;gid = gid;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(fs_param_is_gid);</div><div class='ctx'> </div><div class='del'>-		if (tbl[i].value != special &amp;&amp;</div><div class='del'>-		    (tbl[i].value &lt; low || tbl[i].value &gt; high)) {</div><div class='del'>-			pr_err("VALIDATE C-TBL[%zu]: %s-&gt;%d const out of range (%d-%d)\n",</div><div class='del'>-			       i, tbl[i].name, tbl[i].value, low, high);</div><div class='del'>-			good = false;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+int fs_param_is_blockdev(struct p_log *log, const struct fs_parameter_spec *p,</div><div class='add'>+		  struct fs_parameter *param, struct fs_parse_result *result)</div><div class='add'>+{</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(fs_param_is_blockdev);</div><div class='ctx'> </div><div class='del'>-	return good;</div><div class='add'>+int fs_param_is_path(struct p_log *log, const struct fs_parameter_spec *p,</div><div class='add'>+		     struct fs_parameter *param, struct fs_parse_result *result)</div><div class='add'>+{</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL(fs_param_is_path);</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_VALIDATE_FS_PARSER</div><div class='ctx'> /**</div><div class='del'>- * fs_validate_description - Validate a parameter description</div><div class='del'>- * @name: The parameter name to search for.</div><div class='del'>- * @desc: The parameter description to validate.</div><div class='add'>+ * fs_validate_description - Validate a parameter specification array</div><div class='add'>+ * @name: Owner name of the parameter specification array</div><div class='add'>+ * @desc: The parameter specification array to validate.</div><div class='ctx'>  */</div><div class='ctx'> bool fs_validate_description(const char *name,</div><div class='ctx'> 	const struct fs_parameter_spec *desc)</div><div class='head'>diff --git a/fs/fs_struct.c b/fs/fs_struct.c<br/>index 04b3f5b9c629..b8c46c5a38a0 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fs_struct.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fs_struct.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fs_struct.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fs_struct.c</a></div><div class='hunk'>@@ -17,12 +17,10 @@ void set_fs_root(struct fs_struct *fs, const struct path *path)</div><div class='ctx'> 	struct path old_root;</div><div class='ctx'> </div><div class='ctx'> 	path_get(path);</div><div class='del'>-	spin_lock(&amp;fs-&gt;lock);</div><div class='del'>-	write_seqcount_begin(&amp;fs-&gt;seq);</div><div class='add'>+	write_seqlock(&amp;fs-&gt;seq);</div><div class='ctx'> 	old_root = fs-&gt;root;</div><div class='ctx'> 	fs-&gt;root = *path;</div><div class='del'>-	write_seqcount_end(&amp;fs-&gt;seq);</div><div class='del'>-	spin_unlock(&amp;fs-&gt;lock);</div><div class='add'>+	write_sequnlock(&amp;fs-&gt;seq);</div><div class='ctx'> 	if (old_root.dentry)</div><div class='ctx'> 		path_put(&amp;old_root);</div><div class='ctx'> }</div><div class='hunk'>@@ -36,12 +34,10 @@ void set_fs_pwd(struct fs_struct *fs, const struct path *path)</div><div class='ctx'> 	struct path old_pwd;</div><div class='ctx'> </div><div class='ctx'> 	path_get(path);</div><div class='del'>-	spin_lock(&amp;fs-&gt;lock);</div><div class='del'>-	write_seqcount_begin(&amp;fs-&gt;seq);</div><div class='add'>+	write_seqlock(&amp;fs-&gt;seq);</div><div class='ctx'> 	old_pwd = fs-&gt;pwd;</div><div class='ctx'> 	fs-&gt;pwd = *path;</div><div class='del'>-	write_seqcount_end(&amp;fs-&gt;seq);</div><div class='del'>-	spin_unlock(&amp;fs-&gt;lock);</div><div class='add'>+	write_sequnlock(&amp;fs-&gt;seq);</div><div class='ctx'> </div><div class='ctx'> 	if (old_pwd.dentry)</div><div class='ctx'> 		path_put(&amp;old_pwd);</div><div class='hunk'>@@ -62,24 +58,22 @@ void chroot_fs_refs(const struct path *old_root, const struct path *new_root)</div><div class='ctx'> 	int count = 0;</div><div class='ctx'> </div><div class='ctx'> 	read_lock(&amp;tasklist_lock);</div><div class='del'>-	do_each_thread(g, p) {</div><div class='add'>+	for_each_process_thread(g, p) {</div><div class='ctx'> 		task_lock(p);</div><div class='ctx'> 		fs = p-&gt;fs;</div><div class='ctx'> 		if (fs) {</div><div class='ctx'> 			int hits = 0;</div><div class='del'>-			spin_lock(&amp;fs-&gt;lock);</div><div class='del'>-			write_seqcount_begin(&amp;fs-&gt;seq);</div><div class='add'>+			write_seqlock(&amp;fs-&gt;seq);</div><div class='ctx'> 			hits += replace_path(&amp;fs-&gt;root, old_root, new_root);</div><div class='ctx'> 			hits += replace_path(&amp;fs-&gt;pwd, old_root, new_root);</div><div class='del'>-			write_seqcount_end(&amp;fs-&gt;seq);</div><div class='ctx'> 			while (hits--) {</div><div class='ctx'> 				count++;</div><div class='ctx'> 				path_get(new_root);</div><div class='ctx'> 			}</div><div class='del'>-			spin_unlock(&amp;fs-&gt;lock);</div><div class='add'>+			write_sequnlock(&amp;fs-&gt;seq);</div><div class='ctx'> 		}</div><div class='ctx'> 		task_unlock(p);</div><div class='del'>-	} while_each_thread(g, p);</div><div class='add'>+	}</div><div class='ctx'> 	read_unlock(&amp;tasklist_lock);</div><div class='ctx'> 	while (count--)</div><div class='ctx'> 		path_put(old_root);</div><div class='hunk'>@@ -99,10 +93,10 @@ void exit_fs(struct task_struct *tsk)</div><div class='ctx'> 	if (fs) {</div><div class='ctx'> 		int kill;</div><div class='ctx'> 		task_lock(tsk);</div><div class='del'>-		spin_lock(&amp;fs-&gt;lock);</div><div class='add'>+		read_seqlock_excl(&amp;fs-&gt;seq);</div><div class='ctx'> 		tsk-&gt;fs = NULL;</div><div class='ctx'> 		kill = !--fs-&gt;users;</div><div class='del'>-		spin_unlock(&amp;fs-&gt;lock);</div><div class='add'>+		read_sequnlock_excl(&amp;fs-&gt;seq);</div><div class='ctx'> 		task_unlock(tsk);</div><div class='ctx'> 		if (kill)</div><div class='ctx'> 			free_fs_struct(fs);</div><div class='hunk'>@@ -116,16 +110,15 @@ struct fs_struct *copy_fs_struct(struct fs_struct *old)</div><div class='ctx'> 	if (fs) {</div><div class='ctx'> 		fs-&gt;users = 1;</div><div class='ctx'> 		fs-&gt;in_exec = 0;</div><div class='del'>-		spin_lock_init(&amp;fs-&gt;lock);</div><div class='del'>-		seqcount_spinlock_init(&amp;fs-&gt;seq, &amp;fs-&gt;lock);</div><div class='add'>+		seqlock_init(&amp;fs-&gt;seq);</div><div class='ctx'> 		fs-&gt;umask = old-&gt;umask;</div><div class='ctx'> </div><div class='del'>-		spin_lock(&amp;old-&gt;lock);</div><div class='add'>+		read_seqlock_excl(&amp;old-&gt;seq);</div><div class='ctx'> 		fs-&gt;root = old-&gt;root;</div><div class='ctx'> 		path_get(&amp;fs-&gt;root);</div><div class='ctx'> 		fs-&gt;pwd = old-&gt;pwd;</div><div class='ctx'> 		path_get(&amp;fs-&gt;pwd);</div><div class='del'>-		spin_unlock(&amp;old-&gt;lock);</div><div class='add'>+		read_sequnlock_excl(&amp;old-&gt;seq);</div><div class='ctx'> 	}</div><div class='ctx'> 	return fs;</div><div class='ctx'> }</div><div class='hunk'>@@ -140,10 +133,10 @@ int unshare_fs_struct(void)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	task_lock(current);</div><div class='del'>-	spin_lock(&amp;fs-&gt;lock);</div><div class='add'>+	read_seqlock_excl(&amp;fs-&gt;seq);</div><div class='ctx'> 	kill = !--fs-&gt;users;</div><div class='ctx'> 	current-&gt;fs = new_fs;</div><div class='del'>-	spin_unlock(&amp;fs-&gt;lock);</div><div class='add'>+	read_sequnlock_excl(&amp;fs-&gt;seq);</div><div class='ctx'> 	task_unlock(current);</div><div class='ctx'> </div><div class='ctx'> 	if (kill)</div><div class='hunk'>@@ -153,16 +146,9 @@ int unshare_fs_struct(void)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(unshare_fs_struct);</div><div class='ctx'> </div><div class='del'>-int current_umask(void)</div><div class='del'>-{</div><div class='del'>-	return current-&gt;fs-&gt;umask;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(current_umask);</div><div class='del'>-</div><div class='ctx'> /* to be mentioned only in INIT_TASK */</div><div class='ctx'> struct fs_struct init_fs = {</div><div class='ctx'> 	.users		= 1,</div><div class='del'>-	.lock		= __SPIN_LOCK_UNLOCKED(init_fs.lock),</div><div class='del'>-	.seq		= SEQCNT_SPINLOCK_ZERO(init_fs.seq, &amp;init_fs.lock),</div><div class='add'>+	.seq		= __SEQLOCK_UNLOCKED(init_fs.seq),</div><div class='ctx'> 	.umask		= 0022,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/fscache/Kconfig b/fs/fscache/Kconfig<br/>deleted file mode 100644<br/>index b313a978ae0a..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fscache/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fscache/Kconfig</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,40 +0,0 @@</div><div class='del'>-# SPDX-License-Identifier: GPL-2.0-only</div><div class='del'>-</div><div class='del'>-config FSCACHE</div><div class='del'>-	tristate "General filesystem local caching manager"</div><div class='del'>-	select NETFS_SUPPORT</div><div class='del'>-	help</div><div class='del'>-	  This option enables a generic filesystem caching manager that can be</div><div class='del'>-	  used by various network and other filesystems to cache data locally.</div><div class='del'>-	  Different sorts of caches can be plugged in, depending on the</div><div class='del'>-	  resources available.</div><div class='del'>-</div><div class='del'>-	  See Documentation/filesystems/caching/fscache.rst for more information.</div><div class='del'>-</div><div class='del'>-config FSCACHE_STATS</div><div class='del'>-	bool "Gather statistical information on local caching"</div><div class='del'>-	depends on FSCACHE &amp;&amp; PROC_FS</div><div class='del'>-	select NETFS_STATS</div><div class='del'>-	help</div><div class='del'>-	  This option causes statistical information to be gathered on local</div><div class='del'>-	  caching and exported through file:</div><div class='del'>-</div><div class='del'>-		/proc/fs/fscache/stats</div><div class='del'>-</div><div class='del'>-	  The gathering of statistics adds a certain amount of overhead to</div><div class='del'>-	  execution as there are a quite a few stats gathered, and on a</div><div class='del'>-	  multi-CPU system these may be on cachelines that keep bouncing</div><div class='del'>-	  between CPUs.  On the other hand, the stats are very useful for</div><div class='del'>-	  debugging purposes.  Saying 'Y' here is recommended.</div><div class='del'>-</div><div class='del'>-	  See Documentation/filesystems/caching/fscache.rst for more information.</div><div class='del'>-</div><div class='del'>-config FSCACHE_DEBUG</div><div class='del'>-	bool "Debug FS-Cache"</div><div class='del'>-	depends on FSCACHE</div><div class='del'>-	help</div><div class='del'>-	  This permits debugging to be dynamically enabled in the local caching</div><div class='del'>-	  management module.  If this is set, the debugging output may be</div><div class='del'>-	  enabled by setting bits in /sys/modules/fscache/parameter/debug.</div><div class='del'>-</div><div class='del'>-	  See Documentation/filesystems/caching/fscache.rst for more information.</div><div class='head'>diff --git a/fs/fscache/Makefile b/fs/fscache/Makefile<br/>deleted file mode 100644<br/>index 03a871d689bb..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fscache/Makefile?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fscache/Makefile</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,20 +0,0 @@</div><div class='del'>-# SPDX-License-Identifier: GPL-2.0</div><div class='del'>-#</div><div class='del'>-# Makefile for general filesystem caching code</div><div class='del'>-#</div><div class='del'>-</div><div class='del'>-fscache-y := \</div><div class='del'>-	cache.o \</div><div class='del'>-	cookie.o \</div><div class='del'>-	fsdef.o \</div><div class='del'>-	io.o \</div><div class='del'>-	main.o \</div><div class='del'>-	netfs.o \</div><div class='del'>-	object.o \</div><div class='del'>-	operation.o \</div><div class='del'>-	page.o</div><div class='del'>-</div><div class='del'>-fscache-$(CONFIG_PROC_FS) += proc.o</div><div class='del'>-fscache-$(CONFIG_FSCACHE_STATS) += stats.o</div><div class='del'>-</div><div class='del'>-obj-$(CONFIG_FSCACHE) := fscache.o</div><div class='head'>diff --git a/fs/fscache/cache.c b/fs/fscache/cache.c<br/>deleted file mode 100644<br/>index bd4f44c1cce0..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fscache/cache.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fscache/cache.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,416 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='del'>-/* FS-Cache cache handling</div><div class='del'>- *</div><div class='del'>- * Copyright (C) 2007 Red Hat, Inc. All Rights Reserved.</div><div class='del'>- * Written by David Howells (dhowells@redhat.com)</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#define FSCACHE_DEBUG_LEVEL CACHE</div><div class='del'>-#include &lt;linux/module.h&gt;</div><div class='del'>-#include &lt;linux/slab.h&gt;</div><div class='del'>-#include "internal.h"</div><div class='del'>-</div><div class='del'>-LIST_HEAD(fscache_cache_list);</div><div class='del'>-DECLARE_RWSEM(fscache_addremove_sem);</div><div class='del'>-DECLARE_WAIT_QUEUE_HEAD(fscache_cache_cleared_wq);</div><div class='del'>-EXPORT_SYMBOL(fscache_cache_cleared_wq);</div><div class='del'>-</div><div class='del'>-static LIST_HEAD(fscache_cache_tag_list);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * look up a cache tag</div><div class='del'>- */</div><div class='del'>-struct fscache_cache_tag *__fscache_lookup_cache_tag(const char *name)</div><div class='del'>-{</div><div class='del'>-	struct fscache_cache_tag *tag, *xtag;</div><div class='del'>-</div><div class='del'>-	/* firstly check for the existence of the tag under read lock */</div><div class='del'>-	down_read(&amp;fscache_addremove_sem);</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(tag, &amp;fscache_cache_tag_list, link) {</div><div class='del'>-		if (strcmp(tag-&gt;name, name) == 0) {</div><div class='del'>-			atomic_inc(&amp;tag-&gt;usage);</div><div class='del'>-			up_read(&amp;fscache_addremove_sem);</div><div class='del'>-			return tag;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	up_read(&amp;fscache_addremove_sem);</div><div class='del'>-</div><div class='del'>-	/* the tag does not exist - create a candidate */</div><div class='del'>-	xtag = kzalloc(sizeof(*xtag) + strlen(name) + 1, GFP_KERNEL);</div><div class='del'>-	if (!xtag)</div><div class='del'>-		/* return a dummy tag if out of memory */</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='del'>-</div><div class='del'>-	atomic_set(&amp;xtag-&gt;usage, 1);</div><div class='del'>-	strcpy(xtag-&gt;name, name);</div><div class='del'>-</div><div class='del'>-	/* write lock, search again and add if still not present */</div><div class='del'>-	down_write(&amp;fscache_addremove_sem);</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(tag, &amp;fscache_cache_tag_list, link) {</div><div class='del'>-		if (strcmp(tag-&gt;name, name) == 0) {</div><div class='del'>-			atomic_inc(&amp;tag-&gt;usage);</div><div class='del'>-			up_write(&amp;fscache_addremove_sem);</div><div class='del'>-			kfree(xtag);</div><div class='del'>-			return tag;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	list_add_tail(&amp;xtag-&gt;link, &amp;fscache_cache_tag_list);</div><div class='del'>-	up_write(&amp;fscache_addremove_sem);</div><div class='del'>-	return xtag;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * release a reference to a cache tag</div><div class='del'>- */</div><div class='del'>-void __fscache_release_cache_tag(struct fscache_cache_tag *tag)</div><div class='del'>-{</div><div class='del'>-	if (tag != ERR_PTR(-ENOMEM)) {</div><div class='del'>-		down_write(&amp;fscache_addremove_sem);</div><div class='del'>-</div><div class='del'>-		if (atomic_dec_and_test(&amp;tag-&gt;usage))</div><div class='del'>-			list_del_init(&amp;tag-&gt;link);</div><div class='del'>-		else</div><div class='del'>-			tag = NULL;</div><div class='del'>-</div><div class='del'>-		up_write(&amp;fscache_addremove_sem);</div><div class='del'>-</div><div class='del'>-		kfree(tag);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * select a cache in which to store an object</div><div class='del'>- * - the cache addremove semaphore must be at least read-locked by the caller</div><div class='del'>- * - the object will never be an index</div><div class='del'>- */</div><div class='del'>-struct fscache_cache *fscache_select_cache_for_object(</div><div class='del'>-	struct fscache_cookie *cookie)</div><div class='del'>-{</div><div class='del'>-	struct fscache_cache_tag *tag;</div><div class='del'>-	struct fscache_object *object;</div><div class='del'>-	struct fscache_cache *cache;</div><div class='del'>-</div><div class='del'>-	_enter("");</div><div class='del'>-</div><div class='del'>-	if (list_empty(&amp;fscache_cache_list)) {</div><div class='del'>-		_leave(" = NULL [no cache]");</div><div class='del'>-		return NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* we check the parent to determine the cache to use */</div><div class='del'>-	spin_lock(&amp;cookie-&gt;lock);</div><div class='del'>-</div><div class='del'>-	/* the first in the parent's backing list should be the preferred</div><div class='del'>-	 * cache */</div><div class='del'>-	if (!hlist_empty(&amp;cookie-&gt;backing_objects)) {</div><div class='del'>-		object = hlist_entry(cookie-&gt;backing_objects.first,</div><div class='del'>-				     struct fscache_object, cookie_link);</div><div class='del'>-</div><div class='del'>-		cache = object-&gt;cache;</div><div class='del'>-		if (fscache_object_is_dying(object) ||</div><div class='del'>-		    test_bit(FSCACHE_IOERROR, &amp;cache-&gt;flags))</div><div class='del'>-			cache = NULL;</div><div class='del'>-</div><div class='del'>-		spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-		_leave(" = %s [parent]", cache ? cache-&gt;tag-&gt;name : "NULL");</div><div class='del'>-		return cache;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* the parent is unbacked */</div><div class='del'>-	if (cookie-&gt;type != FSCACHE_COOKIE_TYPE_INDEX) {</div><div class='del'>-		/* cookie not an index and is unbacked */</div><div class='del'>-		spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-		_leave(" = NULL [cookie ub,ni]");</div><div class='del'>-		return NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-</div><div class='del'>-	if (!cookie-&gt;def-&gt;select_cache)</div><div class='del'>-		goto no_preference;</div><div class='del'>-</div><div class='del'>-	/* ask the netfs for its preference */</div><div class='del'>-	tag = cookie-&gt;def-&gt;select_cache(cookie-&gt;parent-&gt;netfs_data,</div><div class='del'>-					cookie-&gt;netfs_data);</div><div class='del'>-	if (!tag)</div><div class='del'>-		goto no_preference;</div><div class='del'>-</div><div class='del'>-	if (tag == ERR_PTR(-ENOMEM)) {</div><div class='del'>-		_leave(" = NULL [nomem tag]");</div><div class='del'>-		return NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!tag-&gt;cache) {</div><div class='del'>-		_leave(" = NULL [unbacked tag]");</div><div class='del'>-		return NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (test_bit(FSCACHE_IOERROR, &amp;tag-&gt;cache-&gt;flags))</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	_leave(" = %s [specific]", tag-&gt;name);</div><div class='del'>-	return tag-&gt;cache;</div><div class='del'>-</div><div class='del'>-no_preference:</div><div class='del'>-	/* netfs has no preference - just select first cache */</div><div class='del'>-	cache = list_entry(fscache_cache_list.next,</div><div class='del'>-			   struct fscache_cache, link);</div><div class='del'>-	_leave(" = %s [first]", cache-&gt;tag-&gt;name);</div><div class='del'>-	return cache;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * fscache_init_cache - Initialise a cache record</div><div class='del'>- * @cache: The cache record to be initialised</div><div class='del'>- * @ops: The cache operations to be installed in that record</div><div class='del'>- * @idfmt: Format string to define identifier</div><div class='del'>- * @...: sprintf-style arguments</div><div class='del'>- *</div><div class='del'>- * Initialise a record of a cache and fill in the name.</div><div class='del'>- *</div><div class='del'>- * See Documentation/filesystems/caching/backend-api.rst for a complete</div><div class='del'>- * description.</div><div class='del'>- */</div><div class='del'>-void fscache_init_cache(struct fscache_cache *cache,</div><div class='del'>-			const struct fscache_cache_ops *ops,</div><div class='del'>-			const char *idfmt,</div><div class='del'>-			...)</div><div class='del'>-{</div><div class='del'>-	va_list va;</div><div class='del'>-</div><div class='del'>-	memset(cache, 0, sizeof(*cache));</div><div class='del'>-</div><div class='del'>-	cache-&gt;ops = ops;</div><div class='del'>-</div><div class='del'>-	va_start(va, idfmt);</div><div class='del'>-	vsnprintf(cache-&gt;identifier, sizeof(cache-&gt;identifier), idfmt, va);</div><div class='del'>-	va_end(va);</div><div class='del'>-</div><div class='del'>-	INIT_WORK(&amp;cache-&gt;op_gc, fscache_operation_gc);</div><div class='del'>-	INIT_LIST_HEAD(&amp;cache-&gt;link);</div><div class='del'>-	INIT_LIST_HEAD(&amp;cache-&gt;object_list);</div><div class='del'>-	INIT_LIST_HEAD(&amp;cache-&gt;op_gc_list);</div><div class='del'>-	spin_lock_init(&amp;cache-&gt;object_list_lock);</div><div class='del'>-	spin_lock_init(&amp;cache-&gt;op_gc_list_lock);</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(fscache_init_cache);</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * fscache_add_cache - Declare a cache as being open for business</div><div class='del'>- * @cache: The record describing the cache</div><div class='del'>- * @ifsdef: The record of the cache object describing the top-level index</div><div class='del'>- * @tagname: The tag describing this cache</div><div class='del'>- *</div><div class='del'>- * Add a cache to the system, making it available for netfs's to use.</div><div class='del'>- *</div><div class='del'>- * See Documentation/filesystems/caching/backend-api.rst for a complete</div><div class='del'>- * description.</div><div class='del'>- */</div><div class='del'>-int fscache_add_cache(struct fscache_cache *cache,</div><div class='del'>-		      struct fscache_object *ifsdef,</div><div class='del'>-		      const char *tagname)</div><div class='del'>-{</div><div class='del'>-	struct fscache_cache_tag *tag;</div><div class='del'>-</div><div class='del'>-	ASSERTCMP(ifsdef-&gt;cookie, ==, &amp;fscache_fsdef_index);</div><div class='del'>-	BUG_ON(!cache-&gt;ops);</div><div class='del'>-	BUG_ON(!ifsdef);</div><div class='del'>-</div><div class='del'>-	cache-&gt;flags = 0;</div><div class='del'>-	ifsdef-&gt;event_mask =</div><div class='del'>-		((1 &lt;&lt; NR_FSCACHE_OBJECT_EVENTS) - 1) &amp;</div><div class='del'>-		~(1 &lt;&lt; FSCACHE_OBJECT_EV_CLEARED);</div><div class='del'>-	__set_bit(FSCACHE_OBJECT_IS_AVAILABLE, &amp;ifsdef-&gt;flags);</div><div class='del'>-</div><div class='del'>-	if (!tagname)</div><div class='del'>-		tagname = cache-&gt;identifier;</div><div class='del'>-</div><div class='del'>-	BUG_ON(!tagname[0]);</div><div class='del'>-</div><div class='del'>-	_enter("{%s.%s},,%s", cache-&gt;ops-&gt;name, cache-&gt;identifier, tagname);</div><div class='del'>-</div><div class='del'>-	/* we use the cache tag to uniquely identify caches */</div><div class='del'>-	tag = __fscache_lookup_cache_tag(tagname);</div><div class='del'>-	if (IS_ERR(tag))</div><div class='del'>-		goto nomem;</div><div class='del'>-</div><div class='del'>-	if (test_and_set_bit(FSCACHE_TAG_RESERVED, &amp;tag-&gt;flags))</div><div class='del'>-		goto tag_in_use;</div><div class='del'>-</div><div class='del'>-	cache-&gt;kobj = kobject_create_and_add(tagname, fscache_root);</div><div class='del'>-	if (!cache-&gt;kobj)</div><div class='del'>-		goto error;</div><div class='del'>-</div><div class='del'>-	ifsdef-&gt;cache = cache;</div><div class='del'>-	cache-&gt;fsdef = ifsdef;</div><div class='del'>-</div><div class='del'>-	down_write(&amp;fscache_addremove_sem);</div><div class='del'>-</div><div class='del'>-	tag-&gt;cache = cache;</div><div class='del'>-	cache-&gt;tag = tag;</div><div class='del'>-</div><div class='del'>-	/* add the cache to the list */</div><div class='del'>-	list_add(&amp;cache-&gt;link, &amp;fscache_cache_list);</div><div class='del'>-</div><div class='del'>-	/* add the cache's netfs definition index object to the cache's</div><div class='del'>-	 * list */</div><div class='del'>-	spin_lock(&amp;cache-&gt;object_list_lock);</div><div class='del'>-	list_add_tail(&amp;ifsdef-&gt;cache_link, &amp;cache-&gt;object_list);</div><div class='del'>-	spin_unlock(&amp;cache-&gt;object_list_lock);</div><div class='del'>-</div><div class='del'>-	/* add the cache's netfs definition index object to the top level index</div><div class='del'>-	 * cookie as a known backing object */</div><div class='del'>-	spin_lock(&amp;fscache_fsdef_index.lock);</div><div class='del'>-</div><div class='del'>-	hlist_add_head(&amp;ifsdef-&gt;cookie_link,</div><div class='del'>-		       &amp;fscache_fsdef_index.backing_objects);</div><div class='del'>-</div><div class='del'>-	refcount_inc(&amp;fscache_fsdef_index.ref);</div><div class='del'>-</div><div class='del'>-	/* done */</div><div class='del'>-	spin_unlock(&amp;fscache_fsdef_index.lock);</div><div class='del'>-	up_write(&amp;fscache_addremove_sem);</div><div class='del'>-</div><div class='del'>-	pr_notice("Cache \"%s\" added (type %s)\n",</div><div class='del'>-		  cache-&gt;tag-&gt;name, cache-&gt;ops-&gt;name);</div><div class='del'>-	kobject_uevent(cache-&gt;kobj, KOBJ_ADD);</div><div class='del'>-</div><div class='del'>-	_leave(" = 0 [%s]", cache-&gt;identifier);</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-tag_in_use:</div><div class='del'>-	pr_err("Cache tag '%s' already in use\n", tagname);</div><div class='del'>-	__fscache_release_cache_tag(tag);</div><div class='del'>-	_leave(" = -EXIST");</div><div class='del'>-	return -EEXIST;</div><div class='del'>-</div><div class='del'>-error:</div><div class='del'>-	__fscache_release_cache_tag(tag);</div><div class='del'>-	_leave(" = -EINVAL");</div><div class='del'>-	return -EINVAL;</div><div class='del'>-</div><div class='del'>-nomem:</div><div class='del'>-	_leave(" = -ENOMEM");</div><div class='del'>-	return -ENOMEM;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(fscache_add_cache);</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * fscache_io_error - Note a cache I/O error</div><div class='del'>- * @cache: The record describing the cache</div><div class='del'>- *</div><div class='del'>- * Note that an I/O error occurred in a cache and that it should no longer be</div><div class='del'>- * used for anything.  This also reports the error into the kernel log.</div><div class='del'>- *</div><div class='del'>- * See Documentation/filesystems/caching/backend-api.rst for a complete</div><div class='del'>- * description.</div><div class='del'>- */</div><div class='del'>-void fscache_io_error(struct fscache_cache *cache)</div><div class='del'>-{</div><div class='del'>-	if (!test_and_set_bit(FSCACHE_IOERROR, &amp;cache-&gt;flags))</div><div class='del'>-		pr_err("Cache '%s' stopped due to I/O error\n",</div><div class='del'>-		       cache-&gt;ops-&gt;name);</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(fscache_io_error);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * request withdrawal of all the objects in a cache</div><div class='del'>- * - all the objects being withdrawn are moved onto the supplied list</div><div class='del'>- */</div><div class='del'>-static void fscache_withdraw_all_objects(struct fscache_cache *cache,</div><div class='del'>-					 struct list_head *dying_objects)</div><div class='del'>-{</div><div class='del'>-	struct fscache_object *object;</div><div class='del'>-</div><div class='del'>-	while (!list_empty(&amp;cache-&gt;object_list)) {</div><div class='del'>-		spin_lock(&amp;cache-&gt;object_list_lock);</div><div class='del'>-</div><div class='del'>-		if (!list_empty(&amp;cache-&gt;object_list)) {</div><div class='del'>-			object = list_entry(cache-&gt;object_list.next,</div><div class='del'>-					    struct fscache_object, cache_link);</div><div class='del'>-			list_move_tail(&amp;object-&gt;cache_link, dying_objects);</div><div class='del'>-</div><div class='del'>-			_debug("withdraw %x", object-&gt;cookie-&gt;debug_id);</div><div class='del'>-</div><div class='del'>-			/* This must be done under object_list_lock to prevent</div><div class='del'>-			 * a race with fscache_drop_object().</div><div class='del'>-			 */</div><div class='del'>-			fscache_raise_event(object, FSCACHE_OBJECT_EV_KILL);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		spin_unlock(&amp;cache-&gt;object_list_lock);</div><div class='del'>-		cond_resched();</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * fscache_withdraw_cache - Withdraw a cache from the active service</div><div class='del'>- * @cache: The record describing the cache</div><div class='del'>- *</div><div class='del'>- * Withdraw a cache from service, unbinding all its cache objects from the</div><div class='del'>- * netfs cookies they're currently representing.</div><div class='del'>- *</div><div class='del'>- * See Documentation/filesystems/caching/backend-api.rst for a complete</div><div class='del'>- * description.</div><div class='del'>- */</div><div class='del'>-void fscache_withdraw_cache(struct fscache_cache *cache)</div><div class='del'>-{</div><div class='del'>-	LIST_HEAD(dying_objects);</div><div class='del'>-</div><div class='del'>-	_enter("");</div><div class='del'>-</div><div class='del'>-	pr_notice("Withdrawing cache \"%s\"\n",</div><div class='del'>-		  cache-&gt;tag-&gt;name);</div><div class='del'>-</div><div class='del'>-	/* make the cache unavailable for cookie acquisition */</div><div class='del'>-	if (test_and_set_bit(FSCACHE_CACHE_WITHDRAWN, &amp;cache-&gt;flags))</div><div class='del'>-		BUG();</div><div class='del'>-</div><div class='del'>-	down_write(&amp;fscache_addremove_sem);</div><div class='del'>-	list_del_init(&amp;cache-&gt;link);</div><div class='del'>-	cache-&gt;tag-&gt;cache = NULL;</div><div class='del'>-	up_write(&amp;fscache_addremove_sem);</div><div class='del'>-</div><div class='del'>-	/* make sure all pages pinned by operations on behalf of the netfs are</div><div class='del'>-	 * written to disk */</div><div class='del'>-	fscache_stat(&amp;fscache_n_cop_sync_cache);</div><div class='del'>-	cache-&gt;ops-&gt;sync_cache(cache);</div><div class='del'>-	fscache_stat_d(&amp;fscache_n_cop_sync_cache);</div><div class='del'>-</div><div class='del'>-	/* dissociate all the netfs pages backed by this cache from the block</div><div class='del'>-	 * mappings in the cache */</div><div class='del'>-	fscache_stat(&amp;fscache_n_cop_dissociate_pages);</div><div class='del'>-	cache-&gt;ops-&gt;dissociate_pages(cache);</div><div class='del'>-	fscache_stat_d(&amp;fscache_n_cop_dissociate_pages);</div><div class='del'>-</div><div class='del'>-	/* we now have to destroy all the active objects pertaining to this</div><div class='del'>-	 * cache - which we do by passing them off to thread pool to be</div><div class='del'>-	 * disposed of */</div><div class='del'>-	_debug("destroy");</div><div class='del'>-</div><div class='del'>-	fscache_withdraw_all_objects(cache, &amp;dying_objects);</div><div class='del'>-</div><div class='del'>-	/* wait for all extant objects to finish their outstanding operations</div><div class='del'>-	 * and go away */</div><div class='del'>-	_debug("wait for finish");</div><div class='del'>-	wait_event(fscache_cache_cleared_wq,</div><div class='del'>-		   atomic_read(&amp;cache-&gt;object_count) == 0);</div><div class='del'>-	_debug("wait for clearance");</div><div class='del'>-	wait_event(fscache_cache_cleared_wq,</div><div class='del'>-		   list_empty(&amp;cache-&gt;object_list));</div><div class='del'>-	_debug("cleared");</div><div class='del'>-	ASSERT(list_empty(&amp;dying_objects));</div><div class='del'>-</div><div class='del'>-	kobject_put(cache-&gt;kobj);</div><div class='del'>-</div><div class='del'>-	clear_bit(FSCACHE_TAG_RESERVED, &amp;cache-&gt;tag-&gt;flags);</div><div class='del'>-	fscache_release_cache_tag(cache-&gt;tag);</div><div class='del'>-	cache-&gt;tag = NULL;</div><div class='del'>-</div><div class='del'>-	_leave("");</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(fscache_withdraw_cache);</div><div class='head'>diff --git a/fs/fscache/cookie.c b/fs/fscache/cookie.c<br/>deleted file mode 100644<br/>index cd42be646ed3..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fscache/cookie.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fscache/cookie.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,1071 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='del'>-/* netfs cookie management</div><div class='del'>- *</div><div class='del'>- * Copyright (C) 2004-2007 Red Hat, Inc. All Rights Reserved.</div><div class='del'>- * Written by David Howells (dhowells@redhat.com)</div><div class='del'>- *</div><div class='del'>- * See Documentation/filesystems/caching/netfs-api.rst for more information on</div><div class='del'>- * the netfs API.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#define FSCACHE_DEBUG_LEVEL COOKIE</div><div class='del'>-#include &lt;linux/module.h&gt;</div><div class='del'>-#include &lt;linux/slab.h&gt;</div><div class='del'>-#include "internal.h"</div><div class='del'>-</div><div class='del'>-struct kmem_cache *fscache_cookie_jar;</div><div class='del'>-</div><div class='del'>-static atomic_t fscache_object_debug_id = ATOMIC_INIT(0);</div><div class='del'>-</div><div class='del'>-#define fscache_cookie_hash_shift 15</div><div class='del'>-static struct hlist_bl_head fscache_cookie_hash[1 &lt;&lt; fscache_cookie_hash_shift];</div><div class='del'>-static LIST_HEAD(fscache_cookies);</div><div class='del'>-static DEFINE_RWLOCK(fscache_cookies_lock);</div><div class='del'>-</div><div class='del'>-static int fscache_acquire_non_index_cookie(struct fscache_cookie *cookie,</div><div class='del'>-					    loff_t object_size);</div><div class='del'>-static int fscache_alloc_object(struct fscache_cache *cache,</div><div class='del'>-				struct fscache_cookie *cookie);</div><div class='del'>-static int fscache_attach_object(struct fscache_cookie *cookie,</div><div class='del'>-				 struct fscache_object *object);</div><div class='del'>-</div><div class='del'>-static void fscache_print_cookie(struct fscache_cookie *cookie, char prefix)</div><div class='del'>-{</div><div class='del'>-	struct fscache_object *object;</div><div class='del'>-	struct hlist_node *o;</div><div class='del'>-	const u8 *k;</div><div class='del'>-	unsigned loop;</div><div class='del'>-</div><div class='del'>-	pr_err("%c-cookie c=%08x [p=%08x fl=%lx nc=%u na=%u]\n",</div><div class='del'>-	       prefix,</div><div class='del'>-	       cookie-&gt;debug_id,</div><div class='del'>-	       cookie-&gt;parent ? cookie-&gt;parent-&gt;debug_id : 0,</div><div class='del'>-	       cookie-&gt;flags,</div><div class='del'>-	       atomic_read(&amp;cookie-&gt;n_children),</div><div class='del'>-	       atomic_read(&amp;cookie-&gt;n_active));</div><div class='del'>-	pr_err("%c-cookie d=%p{%s} n=%p\n",</div><div class='del'>-	       prefix,</div><div class='del'>-	       cookie-&gt;def,</div><div class='del'>-	       cookie-&gt;def ? cookie-&gt;def-&gt;name : "?",</div><div class='del'>-	       cookie-&gt;netfs_data);</div><div class='del'>-</div><div class='del'>-	o = READ_ONCE(cookie-&gt;backing_objects.first);</div><div class='del'>-	if (o) {</div><div class='del'>-		object = hlist_entry(o, struct fscache_object, cookie_link);</div><div class='del'>-		pr_err("%c-cookie o=%u\n", prefix, object-&gt;debug_id);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	pr_err("%c-key=[%u] '", prefix, cookie-&gt;key_len);</div><div class='del'>-	k = (cookie-&gt;key_len &lt;= sizeof(cookie-&gt;inline_key)) ?</div><div class='del'>-		cookie-&gt;inline_key : cookie-&gt;key;</div><div class='del'>-	for (loop = 0; loop &lt; cookie-&gt;key_len; loop++)</div><div class='del'>-		pr_cont("%02x", k[loop]);</div><div class='del'>-	pr_cont("'\n");</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void fscache_free_cookie(struct fscache_cookie *cookie)</div><div class='del'>-{</div><div class='del'>-	if (cookie) {</div><div class='del'>-		BUG_ON(!hlist_empty(&amp;cookie-&gt;backing_objects));</div><div class='del'>-		write_lock(&amp;fscache_cookies_lock);</div><div class='del'>-		list_del(&amp;cookie-&gt;proc_link);</div><div class='del'>-		write_unlock(&amp;fscache_cookies_lock);</div><div class='del'>-		if (cookie-&gt;aux_len &gt; sizeof(cookie-&gt;inline_aux))</div><div class='del'>-			kfree(cookie-&gt;aux);</div><div class='del'>-		if (cookie-&gt;key_len &gt; sizeof(cookie-&gt;inline_key))</div><div class='del'>-			kfree(cookie-&gt;key);</div><div class='del'>-		kmem_cache_free(fscache_cookie_jar, cookie);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Set the index key in a cookie.  The cookie struct has space for a 16-byte</div><div class='del'>- * key plus length and hash, but if that's not big enough, it's instead a</div><div class='del'>- * pointer to a buffer containing 3 bytes of hash, 1 byte of length and then</div><div class='del'>- * the key data.</div><div class='del'>- */</div><div class='del'>-static int fscache_set_key(struct fscache_cookie *cookie,</div><div class='del'>-			   const void *index_key, size_t index_key_len)</div><div class='del'>-{</div><div class='del'>-	u32 *buf;</div><div class='del'>-	int bufs;</div><div class='del'>-</div><div class='del'>-	bufs = DIV_ROUND_UP(index_key_len, sizeof(*buf));</div><div class='del'>-</div><div class='del'>-	if (index_key_len &gt; sizeof(cookie-&gt;inline_key)) {</div><div class='del'>-		buf = kcalloc(bufs, sizeof(*buf), GFP_KERNEL);</div><div class='del'>-		if (!buf)</div><div class='del'>-			return -ENOMEM;</div><div class='del'>-		cookie-&gt;key = buf;</div><div class='del'>-	} else {</div><div class='del'>-		buf = (u32 *)cookie-&gt;inline_key;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	memcpy(buf, index_key, index_key_len);</div><div class='del'>-	cookie-&gt;key_hash = fscache_hash(0, buf, bufs);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static long fscache_compare_cookie(const struct fscache_cookie *a,</div><div class='del'>-				   const struct fscache_cookie *b)</div><div class='del'>-{</div><div class='del'>-	const void *ka, *kb;</div><div class='del'>-</div><div class='del'>-	if (a-&gt;key_hash != b-&gt;key_hash)</div><div class='del'>-		return (long)a-&gt;key_hash - (long)b-&gt;key_hash;</div><div class='del'>-	if (a-&gt;parent != b-&gt;parent)</div><div class='del'>-		return (long)a-&gt;parent - (long)b-&gt;parent;</div><div class='del'>-	if (a-&gt;key_len != b-&gt;key_len)</div><div class='del'>-		return (long)a-&gt;key_len - (long)b-&gt;key_len;</div><div class='del'>-	if (a-&gt;type != b-&gt;type)</div><div class='del'>-		return (long)a-&gt;type - (long)b-&gt;type;</div><div class='del'>-</div><div class='del'>-	if (a-&gt;key_len &lt;= sizeof(a-&gt;inline_key)) {</div><div class='del'>-		ka = &amp;a-&gt;inline_key;</div><div class='del'>-		kb = &amp;b-&gt;inline_key;</div><div class='del'>-	} else {</div><div class='del'>-		ka = a-&gt;key;</div><div class='del'>-		kb = b-&gt;key;</div><div class='del'>-	}</div><div class='del'>-	return memcmp(ka, kb, a-&gt;key_len);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static atomic_t fscache_cookie_debug_id = ATOMIC_INIT(1);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Allocate a cookie.</div><div class='del'>- */</div><div class='del'>-struct fscache_cookie *fscache_alloc_cookie(</div><div class='del'>-	struct fscache_cookie *parent,</div><div class='del'>-	const struct fscache_cookie_def *def,</div><div class='del'>-	const void *index_key, size_t index_key_len,</div><div class='del'>-	const void *aux_data, size_t aux_data_len,</div><div class='del'>-	void *netfs_data,</div><div class='del'>-	loff_t object_size)</div><div class='del'>-{</div><div class='del'>-	struct fscache_cookie *cookie;</div><div class='del'>-</div><div class='del'>-	/* allocate and initialise a cookie */</div><div class='del'>-	cookie = kmem_cache_zalloc(fscache_cookie_jar, GFP_KERNEL);</div><div class='del'>-	if (!cookie)</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	cookie-&gt;key_len = index_key_len;</div><div class='del'>-	cookie-&gt;aux_len = aux_data_len;</div><div class='del'>-</div><div class='del'>-	if (fscache_set_key(cookie, index_key, index_key_len) &lt; 0)</div><div class='del'>-		goto nomem;</div><div class='del'>-</div><div class='del'>-	if (cookie-&gt;aux_len &lt;= sizeof(cookie-&gt;inline_aux)) {</div><div class='del'>-		memcpy(cookie-&gt;inline_aux, aux_data, cookie-&gt;aux_len);</div><div class='del'>-	} else {</div><div class='del'>-		cookie-&gt;aux = kmemdup(aux_data, cookie-&gt;aux_len, GFP_KERNEL);</div><div class='del'>-		if (!cookie-&gt;aux)</div><div class='del'>-			goto nomem;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	refcount_set(&amp;cookie-&gt;ref, 1);</div><div class='del'>-	atomic_set(&amp;cookie-&gt;n_children, 0);</div><div class='del'>-	cookie-&gt;debug_id = atomic_inc_return(&amp;fscache_cookie_debug_id);</div><div class='del'>-</div><div class='del'>-	/* We keep the active count elevated until relinquishment to prevent an</div><div class='del'>-	 * attempt to wake up every time the object operations queue quiesces.</div><div class='del'>-	 */</div><div class='del'>-	atomic_set(&amp;cookie-&gt;n_active, 1);</div><div class='del'>-</div><div class='del'>-	cookie-&gt;def		= def;</div><div class='del'>-	cookie-&gt;parent		= parent;</div><div class='del'>-	cookie-&gt;netfs_data	= netfs_data;</div><div class='del'>-	cookie-&gt;flags		= (1 &lt;&lt; FSCACHE_COOKIE_NO_DATA_YET);</div><div class='del'>-	cookie-&gt;type		= def-&gt;type;</div><div class='del'>-	spin_lock_init(&amp;cookie-&gt;lock);</div><div class='del'>-	spin_lock_init(&amp;cookie-&gt;stores_lock);</div><div class='del'>-	INIT_HLIST_HEAD(&amp;cookie-&gt;backing_objects);</div><div class='del'>-</div><div class='del'>-	/* radix tree insertion won't use the preallocation pool unless it's</div><div class='del'>-	 * told it may not wait */</div><div class='del'>-	INIT_RADIX_TREE(&amp;cookie-&gt;stores, GFP_NOFS &amp; ~__GFP_DIRECT_RECLAIM);</div><div class='del'>-</div><div class='del'>-	write_lock(&amp;fscache_cookies_lock);</div><div class='del'>-	list_add_tail(&amp;cookie-&gt;proc_link, &amp;fscache_cookies);</div><div class='del'>-	write_unlock(&amp;fscache_cookies_lock);</div><div class='del'>-	return cookie;</div><div class='del'>-</div><div class='del'>-nomem:</div><div class='del'>-	fscache_free_cookie(cookie);</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Attempt to insert the new cookie into the hash.  If there's a collision, we</div><div class='del'>- * return the old cookie if it's not in use and an error otherwise.</div><div class='del'>- */</div><div class='del'>-struct fscache_cookie *fscache_hash_cookie(struct fscache_cookie *candidate)</div><div class='del'>-{</div><div class='del'>-	struct fscache_cookie *cursor;</div><div class='del'>-	struct hlist_bl_head *h;</div><div class='del'>-	struct hlist_bl_node *p;</div><div class='del'>-	unsigned int bucket;</div><div class='del'>-</div><div class='del'>-	bucket = candidate-&gt;key_hash &amp; (ARRAY_SIZE(fscache_cookie_hash) - 1);</div><div class='del'>-	h = &amp;fscache_cookie_hash[bucket];</div><div class='del'>-</div><div class='del'>-	hlist_bl_lock(h);</div><div class='del'>-	hlist_bl_for_each_entry(cursor, p, h, hash_link) {</div><div class='del'>-		if (fscache_compare_cookie(candidate, cursor) == 0)</div><div class='del'>-			goto collision;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	__set_bit(FSCACHE_COOKIE_ACQUIRED, &amp;candidate-&gt;flags);</div><div class='del'>-	fscache_cookie_get(candidate-&gt;parent, fscache_cookie_get_acquire_parent);</div><div class='del'>-	atomic_inc(&amp;candidate-&gt;parent-&gt;n_children);</div><div class='del'>-	hlist_bl_add_head(&amp;candidate-&gt;hash_link, h);</div><div class='del'>-	hlist_bl_unlock(h);</div><div class='del'>-	return candidate;</div><div class='del'>-</div><div class='del'>-collision:</div><div class='del'>-	if (test_and_set_bit(FSCACHE_COOKIE_ACQUIRED, &amp;cursor-&gt;flags)) {</div><div class='del'>-		trace_fscache_cookie(cursor-&gt;debug_id, refcount_read(&amp;cursor-&gt;ref),</div><div class='del'>-				     fscache_cookie_collision);</div><div class='del'>-		pr_err("Duplicate cookie detected\n");</div><div class='del'>-		fscache_print_cookie(cursor, 'O');</div><div class='del'>-		fscache_print_cookie(candidate, 'N');</div><div class='del'>-		hlist_bl_unlock(h);</div><div class='del'>-		return NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	fscache_cookie_get(cursor, fscache_cookie_get_reacquire);</div><div class='del'>-	hlist_bl_unlock(h);</div><div class='del'>-	return cursor;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * request a cookie to represent an object (index, datafile, xattr, etc)</div><div class='del'>- * - parent specifies the parent object</div><div class='del'>- *   - the top level index cookie for each netfs is stored in the fscache_netfs</div><div class='del'>- *     struct upon registration</div><div class='del'>- * - def points to the definition</div><div class='del'>- * - the netfs_data will be passed to the functions pointed to in *def</div><div class='del'>- * - all attached caches will be searched to see if they contain this object</div><div class='del'>- * - index objects aren't stored on disk until there's a dependent file that</div><div class='del'>- *   needs storing</div><div class='del'>- * - other objects are stored in a selected cache immediately, and all the</div><div class='del'>- *   indices forming the path to it are instantiated if necessary</div><div class='del'>- * - we never let on to the netfs about errors</div><div class='del'>- *   - we may set a negative cookie pointer, but that's okay</div><div class='del'>- */</div><div class='del'>-struct fscache_cookie *__fscache_acquire_cookie(</div><div class='del'>-	struct fscache_cookie *parent,</div><div class='del'>-	const struct fscache_cookie_def *def,</div><div class='del'>-	const void *index_key, size_t index_key_len,</div><div class='del'>-	const void *aux_data, size_t aux_data_len,</div><div class='del'>-	void *netfs_data,</div><div class='del'>-	loff_t object_size,</div><div class='del'>-	bool enable)</div><div class='del'>-{</div><div class='del'>-	struct fscache_cookie *candidate, *cookie;</div><div class='del'>-</div><div class='del'>-	BUG_ON(!def);</div><div class='del'>-</div><div class='del'>-	_enter("{%s},{%s},%p,%u",</div><div class='del'>-	       parent ? (char *) parent-&gt;def-&gt;name : "&lt;no-parent&gt;",</div><div class='del'>-	       def-&gt;name, netfs_data, enable);</div><div class='del'>-</div><div class='del'>-	if (!index_key || !index_key_len || index_key_len &gt; 255 || aux_data_len &gt; 255)</div><div class='del'>-		return NULL;</div><div class='del'>-	if (!aux_data || !aux_data_len) {</div><div class='del'>-		aux_data = NULL;</div><div class='del'>-		aux_data_len = 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_acquires);</div><div class='del'>-</div><div class='del'>-	/* if there's no parent cookie, then we don't create one here either */</div><div class='del'>-	if (!parent) {</div><div class='del'>-		fscache_stat(&amp;fscache_n_acquires_null);</div><div class='del'>-		_leave(" [no parent]");</div><div class='del'>-		return NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* validate the definition */</div><div class='del'>-	BUG_ON(!def-&gt;name[0]);</div><div class='del'>-</div><div class='del'>-	BUG_ON(def-&gt;type == FSCACHE_COOKIE_TYPE_INDEX &amp;&amp;</div><div class='del'>-	       parent-&gt;type != FSCACHE_COOKIE_TYPE_INDEX);</div><div class='del'>-</div><div class='del'>-	candidate = fscache_alloc_cookie(parent, def,</div><div class='del'>-					 index_key, index_key_len,</div><div class='del'>-					 aux_data, aux_data_len,</div><div class='del'>-					 netfs_data, object_size);</div><div class='del'>-	if (!candidate) {</div><div class='del'>-		fscache_stat(&amp;fscache_n_acquires_oom);</div><div class='del'>-		_leave(" [ENOMEM]");</div><div class='del'>-		return NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	cookie = fscache_hash_cookie(candidate);</div><div class='del'>-	if (!cookie) {</div><div class='del'>-		trace_fscache_cookie(candidate-&gt;debug_id, 1,</div><div class='del'>-				     fscache_cookie_discard);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (cookie == candidate)</div><div class='del'>-		candidate = NULL;</div><div class='del'>-</div><div class='del'>-	switch (cookie-&gt;type) {</div><div class='del'>-	case FSCACHE_COOKIE_TYPE_INDEX:</div><div class='del'>-		fscache_stat(&amp;fscache_n_cookie_index);</div><div class='del'>-		break;</div><div class='del'>-	case FSCACHE_COOKIE_TYPE_DATAFILE:</div><div class='del'>-		fscache_stat(&amp;fscache_n_cookie_data);</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		fscache_stat(&amp;fscache_n_cookie_special);</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	trace_fscache_acquire(cookie);</div><div class='del'>-</div><div class='del'>-	if (enable) {</div><div class='del'>-		/* if the object is an index then we need do nothing more here</div><div class='del'>-		 * - we create indices on disk when we need them as an index</div><div class='del'>-		 * may exist in multiple caches */</div><div class='del'>-		if (cookie-&gt;type != FSCACHE_COOKIE_TYPE_INDEX) {</div><div class='del'>-			if (fscache_acquire_non_index_cookie(cookie, object_size) == 0) {</div><div class='del'>-				set_bit(FSCACHE_COOKIE_ENABLED, &amp;cookie-&gt;flags);</div><div class='del'>-			} else {</div><div class='del'>-				atomic_dec(&amp;parent-&gt;n_children);</div><div class='del'>-				fscache_cookie_put(cookie,</div><div class='del'>-						   fscache_cookie_put_acquire_nobufs);</div><div class='del'>-				fscache_stat(&amp;fscache_n_acquires_nobufs);</div><div class='del'>-				_leave(" = NULL");</div><div class='del'>-				return NULL;</div><div class='del'>-			}</div><div class='del'>-		} else {</div><div class='del'>-			set_bit(FSCACHE_COOKIE_ENABLED, &amp;cookie-&gt;flags);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_acquires_ok);</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	fscache_free_cookie(candidate);</div><div class='del'>-	return cookie;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(__fscache_acquire_cookie);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Enable a cookie to permit it to accept new operations.</div><div class='del'>- */</div><div class='del'>-void __fscache_enable_cookie(struct fscache_cookie *cookie,</div><div class='del'>-			     const void *aux_data,</div><div class='del'>-			     loff_t object_size,</div><div class='del'>-			     bool (*can_enable)(void *data),</div><div class='del'>-			     void *data)</div><div class='del'>-{</div><div class='del'>-	_enter("%x", cookie-&gt;debug_id);</div><div class='del'>-</div><div class='del'>-	trace_fscache_enable(cookie);</div><div class='del'>-</div><div class='del'>-	wait_on_bit_lock(&amp;cookie-&gt;flags, FSCACHE_COOKIE_ENABLEMENT_LOCK,</div><div class='del'>-			 TASK_UNINTERRUPTIBLE);</div><div class='del'>-</div><div class='del'>-	fscache_update_aux(cookie, aux_data);</div><div class='del'>-</div><div class='del'>-	if (test_bit(FSCACHE_COOKIE_ENABLED, &amp;cookie-&gt;flags))</div><div class='del'>-		goto out_unlock;</div><div class='del'>-</div><div class='del'>-	if (can_enable &amp;&amp; !can_enable(data)) {</div><div class='del'>-		/* The netfs decided it didn't want to enable after all */</div><div class='del'>-	} else if (cookie-&gt;type != FSCACHE_COOKIE_TYPE_INDEX) {</div><div class='del'>-		/* Wait for outstanding disablement to complete */</div><div class='del'>-		__fscache_wait_on_invalidate(cookie);</div><div class='del'>-</div><div class='del'>-		if (fscache_acquire_non_index_cookie(cookie, object_size) == 0)</div><div class='del'>-			set_bit(FSCACHE_COOKIE_ENABLED, &amp;cookie-&gt;flags);</div><div class='del'>-	} else {</div><div class='del'>-		set_bit(FSCACHE_COOKIE_ENABLED, &amp;cookie-&gt;flags);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-out_unlock:</div><div class='del'>-	clear_bit_unlock(FSCACHE_COOKIE_ENABLEMENT_LOCK, &amp;cookie-&gt;flags);</div><div class='del'>-	wake_up_bit(&amp;cookie-&gt;flags, FSCACHE_COOKIE_ENABLEMENT_LOCK);</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(__fscache_enable_cookie);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * acquire a non-index cookie</div><div class='del'>- * - this must make sure the index chain is instantiated and instantiate the</div><div class='del'>- *   object representation too</div><div class='del'>- */</div><div class='del'>-static int fscache_acquire_non_index_cookie(struct fscache_cookie *cookie,</div><div class='del'>-					    loff_t object_size)</div><div class='del'>-{</div><div class='del'>-	struct fscache_object *object;</div><div class='del'>-	struct fscache_cache *cache;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	_enter("");</div><div class='del'>-</div><div class='del'>-	set_bit(FSCACHE_COOKIE_UNAVAILABLE, &amp;cookie-&gt;flags);</div><div class='del'>-</div><div class='del'>-	/* now we need to see whether the backing objects for this cookie yet</div><div class='del'>-	 * exist, if not there'll be nothing to search */</div><div class='del'>-	down_read(&amp;fscache_addremove_sem);</div><div class='del'>-</div><div class='del'>-	if (list_empty(&amp;fscache_cache_list)) {</div><div class='del'>-		up_read(&amp;fscache_addremove_sem);</div><div class='del'>-		_leave(" = 0 [no caches]");</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* select a cache in which to store the object */</div><div class='del'>-	cache = fscache_select_cache_for_object(cookie-&gt;parent);</div><div class='del'>-	if (!cache) {</div><div class='del'>-		up_read(&amp;fscache_addremove_sem);</div><div class='del'>-		fscache_stat(&amp;fscache_n_acquires_no_cache);</div><div class='del'>-		_leave(" = -ENOMEDIUM [no cache]");</div><div class='del'>-		return -ENOMEDIUM;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	_debug("cache %s", cache-&gt;tag-&gt;name);</div><div class='del'>-</div><div class='del'>-	set_bit(FSCACHE_COOKIE_LOOKING_UP, &amp;cookie-&gt;flags);</div><div class='del'>-</div><div class='del'>-	/* ask the cache to allocate objects for this cookie and its parent</div><div class='del'>-	 * chain */</div><div class='del'>-	ret = fscache_alloc_object(cache, cookie);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		up_read(&amp;fscache_addremove_sem);</div><div class='del'>-		_leave(" = %d", ret);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;cookie-&gt;lock);</div><div class='del'>-	if (hlist_empty(&amp;cookie-&gt;backing_objects)) {</div><div class='del'>-		spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-		goto unavailable;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	object = hlist_entry(cookie-&gt;backing_objects.first,</div><div class='del'>-			     struct fscache_object, cookie_link);</div><div class='del'>-</div><div class='del'>-	fscache_set_store_limit(object, object_size);</div><div class='del'>-</div><div class='del'>-	/* initiate the process of looking up all the objects in the chain</div><div class='del'>-	 * (done by fscache_initialise_object()) */</div><div class='del'>-	fscache_raise_event(object, FSCACHE_OBJECT_EV_NEW_CHILD);</div><div class='del'>-</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-</div><div class='del'>-	/* we may be required to wait for lookup to complete at this point */</div><div class='del'>-	if (!fscache_defer_lookup) {</div><div class='del'>-		wait_on_bit(&amp;cookie-&gt;flags, FSCACHE_COOKIE_LOOKING_UP,</div><div class='del'>-			    TASK_UNINTERRUPTIBLE);</div><div class='del'>-		if (test_bit(FSCACHE_COOKIE_UNAVAILABLE, &amp;cookie-&gt;flags))</div><div class='del'>-			goto unavailable;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	up_read(&amp;fscache_addremove_sem);</div><div class='del'>-	_leave(" = 0 [deferred]");</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-unavailable:</div><div class='del'>-	up_read(&amp;fscache_addremove_sem);</div><div class='del'>-	_leave(" = -ENOBUFS");</div><div class='del'>-	return -ENOBUFS;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * recursively allocate cache object records for a cookie/cache combination</div><div class='del'>- * - caller must be holding the addremove sem</div><div class='del'>- */</div><div class='del'>-static int fscache_alloc_object(struct fscache_cache *cache,</div><div class='del'>-				struct fscache_cookie *cookie)</div><div class='del'>-{</div><div class='del'>-	struct fscache_object *object;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	_enter("%s,%x{%s}", cache-&gt;tag-&gt;name, cookie-&gt;debug_id, cookie-&gt;def-&gt;name);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;cookie-&gt;lock);</div><div class='del'>-	hlist_for_each_entry(object, &amp;cookie-&gt;backing_objects,</div><div class='del'>-			     cookie_link) {</div><div class='del'>-		if (object-&gt;cache == cache)</div><div class='del'>-			goto object_already_extant;</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-</div><div class='del'>-	/* ask the cache to allocate an object (we may end up with duplicate</div><div class='del'>-	 * objects at this stage, but we sort that out later) */</div><div class='del'>-	fscache_stat(&amp;fscache_n_cop_alloc_object);</div><div class='del'>-	object = cache-&gt;ops-&gt;alloc_object(cache, cookie);</div><div class='del'>-	fscache_stat_d(&amp;fscache_n_cop_alloc_object);</div><div class='del'>-	if (IS_ERR(object)) {</div><div class='del'>-		fscache_stat(&amp;fscache_n_object_no_alloc);</div><div class='del'>-		ret = PTR_ERR(object);</div><div class='del'>-		goto error;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ASSERTCMP(object-&gt;cookie, ==, cookie);</div><div class='del'>-	fscache_stat(&amp;fscache_n_object_alloc);</div><div class='del'>-</div><div class='del'>-	object-&gt;debug_id = atomic_inc_return(&amp;fscache_object_debug_id);</div><div class='del'>-</div><div class='del'>-	_debug("ALLOC OBJ%x: %s {%lx}",</div><div class='del'>-	       object-&gt;debug_id, cookie-&gt;def-&gt;name, object-&gt;events);</div><div class='del'>-</div><div class='del'>-	ret = fscache_alloc_object(cache, cookie-&gt;parent);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto error_put;</div><div class='del'>-</div><div class='del'>-	/* only attach if we managed to allocate all we needed, otherwise</div><div class='del'>-	 * discard the object we just allocated and instead use the one</div><div class='del'>-	 * attached to the cookie */</div><div class='del'>-	if (fscache_attach_object(cookie, object) &lt; 0) {</div><div class='del'>-		fscache_stat(&amp;fscache_n_cop_put_object);</div><div class='del'>-		cache-&gt;ops-&gt;put_object(object, fscache_obj_put_attach_fail);</div><div class='del'>-		fscache_stat_d(&amp;fscache_n_cop_put_object);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	_leave(" = 0");</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-object_already_extant:</div><div class='del'>-	ret = -ENOBUFS;</div><div class='del'>-	if (fscache_object_is_dying(object) ||</div><div class='del'>-	    fscache_cache_is_broken(object)) {</div><div class='del'>-		spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-		goto error;</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-	_leave(" = 0 [found]");</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-error_put:</div><div class='del'>-	fscache_stat(&amp;fscache_n_cop_put_object);</div><div class='del'>-	cache-&gt;ops-&gt;put_object(object, fscache_obj_put_alloc_fail);</div><div class='del'>-	fscache_stat_d(&amp;fscache_n_cop_put_object);</div><div class='del'>-error:</div><div class='del'>-	_leave(" = %d", ret);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * attach a cache object to a cookie</div><div class='del'>- */</div><div class='del'>-static int fscache_attach_object(struct fscache_cookie *cookie,</div><div class='del'>-				 struct fscache_object *object)</div><div class='del'>-{</div><div class='del'>-	struct fscache_object *p;</div><div class='del'>-	struct fscache_cache *cache = object-&gt;cache;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	_enter("{%s},{OBJ%x}", cookie-&gt;def-&gt;name, object-&gt;debug_id);</div><div class='del'>-</div><div class='del'>-	ASSERTCMP(object-&gt;cookie, ==, cookie);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;cookie-&gt;lock);</div><div class='del'>-</div><div class='del'>-	/* there may be multiple initial creations of this object, but we only</div><div class='del'>-	 * want one */</div><div class='del'>-	ret = -EEXIST;</div><div class='del'>-	hlist_for_each_entry(p, &amp;cookie-&gt;backing_objects, cookie_link) {</div><div class='del'>-		if (p-&gt;cache == object-&gt;cache) {</div><div class='del'>-			if (fscache_object_is_dying(p))</div><div class='del'>-				ret = -ENOBUFS;</div><div class='del'>-			goto cant_attach_object;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* pin the parent object */</div><div class='del'>-	spin_lock_nested(&amp;cookie-&gt;parent-&gt;lock, 1);</div><div class='del'>-	hlist_for_each_entry(p, &amp;cookie-&gt;parent-&gt;backing_objects,</div><div class='del'>-			     cookie_link) {</div><div class='del'>-		if (p-&gt;cache == object-&gt;cache) {</div><div class='del'>-			if (fscache_object_is_dying(p)) {</div><div class='del'>-				ret = -ENOBUFS;</div><div class='del'>-				spin_unlock(&amp;cookie-&gt;parent-&gt;lock);</div><div class='del'>-				goto cant_attach_object;</div><div class='del'>-			}</div><div class='del'>-			object-&gt;parent = p;</div><div class='del'>-			spin_lock(&amp;p-&gt;lock);</div><div class='del'>-			p-&gt;n_children++;</div><div class='del'>-			spin_unlock(&amp;p-&gt;lock);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;parent-&gt;lock);</div><div class='del'>-</div><div class='del'>-	/* attach to the cache's object list */</div><div class='del'>-	if (list_empty(&amp;object-&gt;cache_link)) {</div><div class='del'>-		spin_lock(&amp;cache-&gt;object_list_lock);</div><div class='del'>-		list_add(&amp;object-&gt;cache_link, &amp;cache-&gt;object_list);</div><div class='del'>-		spin_unlock(&amp;cache-&gt;object_list_lock);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Attach to the cookie.  The object already has a ref on it. */</div><div class='del'>-	hlist_add_head(&amp;object-&gt;cookie_link, &amp;cookie-&gt;backing_objects);</div><div class='del'>-	ret = 0;</div><div class='del'>-</div><div class='del'>-cant_attach_object:</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-	_leave(" = %d", ret);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Invalidate an object.  Callable with spinlocks held.</div><div class='del'>- */</div><div class='del'>-void __fscache_invalidate(struct fscache_cookie *cookie)</div><div class='del'>-{</div><div class='del'>-	struct fscache_object *object;</div><div class='del'>-</div><div class='del'>-	_enter("{%s}", cookie-&gt;def-&gt;name);</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_invalidates);</div><div class='del'>-</div><div class='del'>-	/* Only permit invalidation of data files.  Invalidating an index will</div><div class='del'>-	 * require the caller to release all its attachments to the tree rooted</div><div class='del'>-	 * there, and if it's doing that, it may as well just retire the</div><div class='del'>-	 * cookie.</div><div class='del'>-	 */</div><div class='del'>-	ASSERTCMP(cookie-&gt;type, ==, FSCACHE_COOKIE_TYPE_DATAFILE);</div><div class='del'>-</div><div class='del'>-	/* If there's an object, we tell the object state machine to handle the</div><div class='del'>-	 * invalidation on our behalf, otherwise there's nothing to do.</div><div class='del'>-	 */</div><div class='del'>-	if (!hlist_empty(&amp;cookie-&gt;backing_objects)) {</div><div class='del'>-		spin_lock(&amp;cookie-&gt;lock);</div><div class='del'>-</div><div class='del'>-		if (fscache_cookie_enabled(cookie) &amp;&amp;</div><div class='del'>-		    !hlist_empty(&amp;cookie-&gt;backing_objects) &amp;&amp;</div><div class='del'>-		    !test_and_set_bit(FSCACHE_COOKIE_INVALIDATING,</div><div class='del'>-				      &amp;cookie-&gt;flags)) {</div><div class='del'>-			object = hlist_entry(cookie-&gt;backing_objects.first,</div><div class='del'>-					     struct fscache_object,</div><div class='del'>-					     cookie_link);</div><div class='del'>-			if (fscache_object_is_live(object))</div><div class='del'>-				fscache_raise_event(</div><div class='del'>-					object, FSCACHE_OBJECT_EV_INVALIDATE);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	_leave("");</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(__fscache_invalidate);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Wait for object invalidation to complete.</div><div class='del'>- */</div><div class='del'>-void __fscache_wait_on_invalidate(struct fscache_cookie *cookie)</div><div class='del'>-{</div><div class='del'>-	_enter("%x", cookie-&gt;debug_id);</div><div class='del'>-</div><div class='del'>-	wait_on_bit(&amp;cookie-&gt;flags, FSCACHE_COOKIE_INVALIDATING,</div><div class='del'>-		    TASK_UNINTERRUPTIBLE);</div><div class='del'>-</div><div class='del'>-	_leave("");</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(__fscache_wait_on_invalidate);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * update the index entries backing a cookie</div><div class='del'>- */</div><div class='del'>-void __fscache_update_cookie(struct fscache_cookie *cookie, const void *aux_data)</div><div class='del'>-{</div><div class='del'>-	struct fscache_object *object;</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_updates);</div><div class='del'>-</div><div class='del'>-	if (!cookie) {</div><div class='del'>-		fscache_stat(&amp;fscache_n_updates_null);</div><div class='del'>-		_leave(" [no cookie]");</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	_enter("{%s}", cookie-&gt;def-&gt;name);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;cookie-&gt;lock);</div><div class='del'>-</div><div class='del'>-	fscache_update_aux(cookie, aux_data);</div><div class='del'>-</div><div class='del'>-	if (fscache_cookie_enabled(cookie)) {</div><div class='del'>-		/* update the index entry on disk in each cache backing this</div><div class='del'>-		 * cookie.</div><div class='del'>-		 */</div><div class='del'>-		hlist_for_each_entry(object,</div><div class='del'>-				     &amp;cookie-&gt;backing_objects, cookie_link) {</div><div class='del'>-			fscache_raise_event(object, FSCACHE_OBJECT_EV_UPDATE);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-	_leave("");</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(__fscache_update_cookie);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Disable a cookie to stop it from accepting new requests from the netfs.</div><div class='del'>- */</div><div class='del'>-void __fscache_disable_cookie(struct fscache_cookie *cookie,</div><div class='del'>-			      const void *aux_data,</div><div class='del'>-			      bool invalidate)</div><div class='del'>-{</div><div class='del'>-	struct fscache_object *object;</div><div class='del'>-	bool awaken = false;</div><div class='del'>-</div><div class='del'>-	_enter("%x,%u", cookie-&gt;debug_id, invalidate);</div><div class='del'>-</div><div class='del'>-	trace_fscache_disable(cookie);</div><div class='del'>-</div><div class='del'>-	ASSERTCMP(atomic_read(&amp;cookie-&gt;n_active), &gt;, 0);</div><div class='del'>-</div><div class='del'>-	if (atomic_read(&amp;cookie-&gt;n_children) != 0) {</div><div class='del'>-		pr_err("Cookie '%s' still has children\n",</div><div class='del'>-		       cookie-&gt;def-&gt;name);</div><div class='del'>-		BUG();</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	wait_on_bit_lock(&amp;cookie-&gt;flags, FSCACHE_COOKIE_ENABLEMENT_LOCK,</div><div class='del'>-			 TASK_UNINTERRUPTIBLE);</div><div class='del'>-</div><div class='del'>-	fscache_update_aux(cookie, aux_data);</div><div class='del'>-</div><div class='del'>-	if (!test_and_clear_bit(FSCACHE_COOKIE_ENABLED, &amp;cookie-&gt;flags))</div><div class='del'>-		goto out_unlock_enable;</div><div class='del'>-</div><div class='del'>-	/* If the cookie is being invalidated, wait for that to complete first</div><div class='del'>-	 * so that we can reuse the flag.</div><div class='del'>-	 */</div><div class='del'>-	__fscache_wait_on_invalidate(cookie);</div><div class='del'>-</div><div class='del'>-	/* Dispose of the backing objects */</div><div class='del'>-	set_bit(FSCACHE_COOKIE_INVALIDATING, &amp;cookie-&gt;flags);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;cookie-&gt;lock);</div><div class='del'>-	if (!hlist_empty(&amp;cookie-&gt;backing_objects)) {</div><div class='del'>-		hlist_for_each_entry(object, &amp;cookie-&gt;backing_objects, cookie_link) {</div><div class='del'>-			if (invalidate)</div><div class='del'>-				set_bit(FSCACHE_OBJECT_RETIRED, &amp;object-&gt;flags);</div><div class='del'>-			clear_bit(FSCACHE_OBJECT_PENDING_WRITE, &amp;object-&gt;flags);</div><div class='del'>-			fscache_raise_event(object, FSCACHE_OBJECT_EV_KILL);</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-		if (test_and_clear_bit(FSCACHE_COOKIE_INVALIDATING, &amp;cookie-&gt;flags))</div><div class='del'>-			awaken = true;</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-	if (awaken)</div><div class='del'>-		wake_up_bit(&amp;cookie-&gt;flags, FSCACHE_COOKIE_INVALIDATING);</div><div class='del'>-</div><div class='del'>-	/* Wait for cessation of activity requiring access to the netfs (when</div><div class='del'>-	 * n_active reaches 0).  This makes sure outstanding reads and writes</div><div class='del'>-	 * have completed.</div><div class='del'>-	 */</div><div class='del'>-	if (!atomic_dec_and_test(&amp;cookie-&gt;n_active)) {</div><div class='del'>-		wait_var_event(&amp;cookie-&gt;n_active,</div><div class='del'>-			       !atomic_read(&amp;cookie-&gt;n_active));</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Make sure any pending writes are cancelled. */</div><div class='del'>-	if (cookie-&gt;type != FSCACHE_COOKIE_TYPE_INDEX)</div><div class='del'>-		fscache_invalidate_writes(cookie);</div><div class='del'>-</div><div class='del'>-	/* Reset the cookie state if it wasn't relinquished */</div><div class='del'>-	if (!test_bit(FSCACHE_COOKIE_RELINQUISHED, &amp;cookie-&gt;flags)) {</div><div class='del'>-		atomic_inc(&amp;cookie-&gt;n_active);</div><div class='del'>-		set_bit(FSCACHE_COOKIE_NO_DATA_YET, &amp;cookie-&gt;flags);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-out_unlock_enable:</div><div class='del'>-	clear_bit_unlock(FSCACHE_COOKIE_ENABLEMENT_LOCK, &amp;cookie-&gt;flags);</div><div class='del'>-	wake_up_bit(&amp;cookie-&gt;flags, FSCACHE_COOKIE_ENABLEMENT_LOCK);</div><div class='del'>-	_leave("");</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(__fscache_disable_cookie);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * release a cookie back to the cache</div><div class='del'>- * - the object will be marked as recyclable on disk if retire is true</div><div class='del'>- * - all dependents of this cookie must have already been unregistered</div><div class='del'>- *   (indices/files/pages)</div><div class='del'>- */</div><div class='del'>-void __fscache_relinquish_cookie(struct fscache_cookie *cookie,</div><div class='del'>-				 const void *aux_data,</div><div class='del'>-				 bool retire)</div><div class='del'>-{</div><div class='del'>-	fscache_stat(&amp;fscache_n_relinquishes);</div><div class='del'>-	if (retire)</div><div class='del'>-		fscache_stat(&amp;fscache_n_relinquishes_retire);</div><div class='del'>-</div><div class='del'>-	if (!cookie) {</div><div class='del'>-		fscache_stat(&amp;fscache_n_relinquishes_null);</div><div class='del'>-		_leave(" [no cookie]");</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	_enter("%x{%s,%d},%d",</div><div class='del'>-	       cookie-&gt;debug_id, cookie-&gt;def-&gt;name,</div><div class='del'>-	       atomic_read(&amp;cookie-&gt;n_active), retire);</div><div class='del'>-</div><div class='del'>-	trace_fscache_relinquish(cookie, retire);</div><div class='del'>-</div><div class='del'>-	/* No further netfs-accessing operations on this cookie permitted */</div><div class='del'>-	if (test_and_set_bit(FSCACHE_COOKIE_RELINQUISHED, &amp;cookie-&gt;flags))</div><div class='del'>-		BUG();</div><div class='del'>-</div><div class='del'>-	__fscache_disable_cookie(cookie, aux_data, retire);</div><div class='del'>-</div><div class='del'>-	/* Clear pointers back to the netfs */</div><div class='del'>-	cookie-&gt;netfs_data	= NULL;</div><div class='del'>-	cookie-&gt;def		= NULL;</div><div class='del'>-	BUG_ON(!radix_tree_empty(&amp;cookie-&gt;stores));</div><div class='del'>-</div><div class='del'>-	if (cookie-&gt;parent) {</div><div class='del'>-		ASSERTCMP(refcount_read(&amp;cookie-&gt;parent-&gt;ref), &gt;, 0);</div><div class='del'>-		ASSERTCMP(atomic_read(&amp;cookie-&gt;parent-&gt;n_children), &gt;, 0);</div><div class='del'>-		atomic_dec(&amp;cookie-&gt;parent-&gt;n_children);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Dispose of the netfs's link to the cookie */</div><div class='del'>-	fscache_cookie_put(cookie, fscache_cookie_put_relinquish);</div><div class='del'>-</div><div class='del'>-	_leave("");</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(__fscache_relinquish_cookie);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Remove a cookie from the hash table.</div><div class='del'>- */</div><div class='del'>-static void fscache_unhash_cookie(struct fscache_cookie *cookie)</div><div class='del'>-{</div><div class='del'>-	struct hlist_bl_head *h;</div><div class='del'>-	unsigned int bucket;</div><div class='del'>-</div><div class='del'>-	bucket = cookie-&gt;key_hash &amp; (ARRAY_SIZE(fscache_cookie_hash) - 1);</div><div class='del'>-	h = &amp;fscache_cookie_hash[bucket];</div><div class='del'>-</div><div class='del'>-	hlist_bl_lock(h);</div><div class='del'>-	hlist_bl_del(&amp;cookie-&gt;hash_link);</div><div class='del'>-	hlist_bl_unlock(h);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Drop a reference to a cookie.</div><div class='del'>- */</div><div class='del'>-void fscache_cookie_put(struct fscache_cookie *cookie,</div><div class='del'>-			enum fscache_cookie_trace where)</div><div class='del'>-{</div><div class='del'>-	struct fscache_cookie *parent;</div><div class='del'>-	int ref;</div><div class='del'>-</div><div class='del'>-	_enter("%x", cookie-&gt;debug_id);</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		unsigned int cookie_debug_id = cookie-&gt;debug_id;</div><div class='del'>-		bool zero = __refcount_dec_and_test(&amp;cookie-&gt;ref, &amp;ref);</div><div class='del'>-</div><div class='del'>-		trace_fscache_cookie(cookie_debug_id, ref - 1, where);</div><div class='del'>-		if (!zero)</div><div class='del'>-			return;</div><div class='del'>-</div><div class='del'>-		parent = cookie-&gt;parent;</div><div class='del'>-		fscache_unhash_cookie(cookie);</div><div class='del'>-		fscache_free_cookie(cookie);</div><div class='del'>-</div><div class='del'>-		cookie = parent;</div><div class='del'>-		where = fscache_cookie_put_parent;</div><div class='del'>-	} while (cookie);</div><div class='del'>-</div><div class='del'>-	_leave("");</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Get a reference to a cookie.</div><div class='del'>- */</div><div class='del'>-struct fscache_cookie *fscache_cookie_get(struct fscache_cookie *cookie,</div><div class='del'>-					  enum fscache_cookie_trace where)</div><div class='del'>-{</div><div class='del'>-	int ref;</div><div class='del'>-</div><div class='del'>-	__refcount_inc(&amp;cookie-&gt;ref, &amp;ref);</div><div class='del'>-	trace_fscache_cookie(cookie-&gt;debug_id, ref + 1, where);</div><div class='del'>-	return cookie;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * check the consistency between the netfs inode and the backing cache</div><div class='del'>- *</div><div class='del'>- * NOTE: it only serves no-index type</div><div class='del'>- */</div><div class='del'>-int __fscache_check_consistency(struct fscache_cookie *cookie,</div><div class='del'>-				const void *aux_data)</div><div class='del'>-{</div><div class='del'>-	struct fscache_operation *op;</div><div class='del'>-	struct fscache_object *object;</div><div class='del'>-	bool wake_cookie = false;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	_enter("%p,", cookie);</div><div class='del'>-</div><div class='del'>-	ASSERTCMP(cookie-&gt;type, ==, FSCACHE_COOKIE_TYPE_DATAFILE);</div><div class='del'>-</div><div class='del'>-	if (fscache_wait_for_deferred_lookup(cookie) &lt; 0)</div><div class='del'>-		return -ERESTARTSYS;</div><div class='del'>-</div><div class='del'>-	if (hlist_empty(&amp;cookie-&gt;backing_objects))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	op = kzalloc(sizeof(*op), GFP_NOIO | __GFP_NOMEMALLOC | __GFP_NORETRY);</div><div class='del'>-	if (!op)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	fscache_operation_init(cookie, op, NULL, NULL, NULL);</div><div class='del'>-	op-&gt;flags = FSCACHE_OP_MYTHREAD |</div><div class='del'>-		(1 &lt;&lt; FSCACHE_OP_WAITING) |</div><div class='del'>-		(1 &lt;&lt; FSCACHE_OP_UNUSE_COOKIE);</div><div class='del'>-	trace_fscache_page_op(cookie, NULL, op, fscache_page_op_check_consistency);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;cookie-&gt;lock);</div><div class='del'>-</div><div class='del'>-	fscache_update_aux(cookie, aux_data);</div><div class='del'>-</div><div class='del'>-	if (!fscache_cookie_enabled(cookie) ||</div><div class='del'>-	    hlist_empty(&amp;cookie-&gt;backing_objects))</div><div class='del'>-		goto inconsistent;</div><div class='del'>-	object = hlist_entry(cookie-&gt;backing_objects.first,</div><div class='del'>-			     struct fscache_object, cookie_link);</div><div class='del'>-	if (test_bit(FSCACHE_IOERROR, &amp;object-&gt;cache-&gt;flags))</div><div class='del'>-		goto inconsistent;</div><div class='del'>-</div><div class='del'>-	op-&gt;debug_id = atomic_inc_return(&amp;fscache_op_debug_id);</div><div class='del'>-</div><div class='del'>-	__fscache_use_cookie(cookie);</div><div class='del'>-	if (fscache_submit_op(object, op) &lt; 0)</div><div class='del'>-		goto submit_failed;</div><div class='del'>-</div><div class='del'>-	/* the work queue now carries its own ref on the object */</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-</div><div class='del'>-	ret = fscache_wait_for_operation_activation(object, op, NULL, NULL);</div><div class='del'>-	if (ret == 0) {</div><div class='del'>-		/* ask the cache to honour the operation */</div><div class='del'>-		ret = object-&gt;cache-&gt;ops-&gt;check_consistency(op);</div><div class='del'>-		fscache_op_complete(op, false);</div><div class='del'>-	} else if (ret == -ENOBUFS) {</div><div class='del'>-		ret = 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	fscache_put_operation(op);</div><div class='del'>-	_leave(" = %d", ret);</div><div class='del'>-	return ret;</div><div class='del'>-</div><div class='del'>-submit_failed:</div><div class='del'>-	wake_cookie = __fscache_unuse_cookie(cookie);</div><div class='del'>-inconsistent:</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-	if (wake_cookie)</div><div class='del'>-		__fscache_wake_unused_cookie(cookie);</div><div class='del'>-	kfree(op);</div><div class='del'>-	_leave(" = -ESTALE");</div><div class='del'>-	return -ESTALE;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(__fscache_check_consistency);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Generate a list of extant cookies in /proc/fs/fscache/cookies</div><div class='del'>- */</div><div class='del'>-static int fscache_cookies_seq_show(struct seq_file *m, void *v)</div><div class='del'>-{</div><div class='del'>-	struct fscache_cookie *cookie;</div><div class='del'>-	unsigned int keylen = 0, auxlen = 0;</div><div class='del'>-	char _type[3], *type;</div><div class='del'>-	u8 *p;</div><div class='del'>-</div><div class='del'>-	if (v == &amp;fscache_cookies) {</div><div class='del'>-		seq_puts(m,</div><div class='del'>-			 "COOKIE   PARENT   USAGE CHILD ACT TY FL  DEF              NETFS_DATA\n"</div><div class='del'>-			 "======== ======== ===== ===== === == === ================ ==========\n"</div><div class='del'>-			 );</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	cookie = list_entry(v, struct fscache_cookie, proc_link);</div><div class='del'>-</div><div class='del'>-	switch (cookie-&gt;type) {</div><div class='del'>-	case 0:</div><div class='del'>-		type = "IX";</div><div class='del'>-		break;</div><div class='del'>-	case 1:</div><div class='del'>-		type = "DT";</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		snprintf(_type, sizeof(_type), "%02u",</div><div class='del'>-			 cookie-&gt;type);</div><div class='del'>-		type = _type;</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	seq_printf(m,</div><div class='del'>-		   "%08x %08x %5u %5u %3u %s %03lx %-16s %px",</div><div class='del'>-		   cookie-&gt;debug_id,</div><div class='del'>-		   cookie-&gt;parent ? cookie-&gt;parent-&gt;debug_id : 0,</div><div class='del'>-		   refcount_read(&amp;cookie-&gt;ref),</div><div class='del'>-		   atomic_read(&amp;cookie-&gt;n_children),</div><div class='del'>-		   atomic_read(&amp;cookie-&gt;n_active),</div><div class='del'>-		   type,</div><div class='del'>-		   cookie-&gt;flags,</div><div class='del'>-		   cookie-&gt;def-&gt;name,</div><div class='del'>-		   cookie-&gt;netfs_data);</div><div class='del'>-</div><div class='del'>-	keylen = cookie-&gt;key_len;</div><div class='del'>-	auxlen = cookie-&gt;aux_len;</div><div class='del'>-</div><div class='del'>-	if (keylen &gt; 0 || auxlen &gt; 0) {</div><div class='del'>-		seq_puts(m, " ");</div><div class='del'>-		p = keylen &lt;= sizeof(cookie-&gt;inline_key) ?</div><div class='del'>-			cookie-&gt;inline_key : cookie-&gt;key;</div><div class='del'>-		for (; keylen &gt; 0; keylen--)</div><div class='del'>-			seq_printf(m, "%02x", *p++);</div><div class='del'>-		if (auxlen &gt; 0) {</div><div class='del'>-			seq_puts(m, ", ");</div><div class='del'>-			p = auxlen &lt;= sizeof(cookie-&gt;inline_aux) ?</div><div class='del'>-				cookie-&gt;inline_aux : cookie-&gt;aux;</div><div class='del'>-			for (; auxlen &gt; 0; auxlen--)</div><div class='del'>-				seq_printf(m, "%02x", *p++);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	seq_puts(m, "\n");</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void *fscache_cookies_seq_start(struct seq_file *m, loff_t *_pos)</div><div class='del'>-	__acquires(fscache_cookies_lock)</div><div class='del'>-{</div><div class='del'>-	read_lock(&amp;fscache_cookies_lock);</div><div class='del'>-	return seq_list_start_head(&amp;fscache_cookies, *_pos);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void *fscache_cookies_seq_next(struct seq_file *m, void *v, loff_t *_pos)</div><div class='del'>-{</div><div class='del'>-	return seq_list_next(v, &amp;fscache_cookies, _pos);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void fscache_cookies_seq_stop(struct seq_file *m, void *v)</div><div class='del'>-	__releases(rcu)</div><div class='del'>-{</div><div class='del'>-	read_unlock(&amp;fscache_cookies_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-const struct seq_operations fscache_cookies_seq_ops = {</div><div class='del'>-	.start  = fscache_cookies_seq_start,</div><div class='del'>-	.next   = fscache_cookies_seq_next,</div><div class='del'>-	.stop   = fscache_cookies_seq_stop,</div><div class='del'>-	.show   = fscache_cookies_seq_show,</div><div class='del'>-};</div><div class='head'>diff --git a/fs/fscache/fsdef.c b/fs/fscache/fsdef.c<br/>deleted file mode 100644<br/>index 0402673c680e..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fscache/fsdef.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fscache/fsdef.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,98 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='del'>-/* Filesystem index definition</div><div class='del'>- *</div><div class='del'>- * Copyright (C) 2004-2007 Red Hat, Inc. All Rights Reserved.</div><div class='del'>- * Written by David Howells (dhowells@redhat.com)</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#define FSCACHE_DEBUG_LEVEL CACHE</div><div class='del'>-#include &lt;linux/module.h&gt;</div><div class='del'>-#include "internal.h"</div><div class='del'>-</div><div class='del'>-static</div><div class='del'>-enum fscache_checkaux fscache_fsdef_netfs_check_aux(void *cookie_netfs_data,</div><div class='del'>-						    const void *data,</div><div class='del'>-						    uint16_t datalen,</div><div class='del'>-						    loff_t object_size);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * The root index is owned by FS-Cache itself.</div><div class='del'>- *</div><div class='del'>- * When a netfs requests caching facilities, FS-Cache will, if one doesn't</div><div class='del'>- * already exist, create an entry in the root index with the key being the name</div><div class='del'>- * of the netfs ("AFS" for example), and the auxiliary data holding the index</div><div class='del'>- * structure version supplied by the netfs:</div><div class='del'>- *</div><div class='del'>- *				     FSDEF</div><div class='del'>- *				       |</div><div class='del'>- *				 +-----------+</div><div class='del'>- *				 |           |</div><div class='del'>- *				NFS         AFS</div><div class='del'>- *			       [v=1]       [v=1]</div><div class='del'>- *</div><div class='del'>- * If an entry with the appropriate name does already exist, the version is</div><div class='del'>- * compared.  If the version is different, the entire subtree from that entry</div><div class='del'>- * will be discarded and a new entry created.</div><div class='del'>- *</div><div class='del'>- * The new entry will be an index, and a cookie referring to it will be passed</div><div class='del'>- * to the netfs.  This is then the root handle by which the netfs accesses the</div><div class='del'>- * cache.  It can create whatever objects it likes in that index, including</div><div class='del'>- * further indices.</div><div class='del'>- */</div><div class='del'>-static struct fscache_cookie_def fscache_fsdef_index_def = {</div><div class='del'>-	.name		= ".FS-Cache",</div><div class='del'>-	.type		= FSCACHE_COOKIE_TYPE_INDEX,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct fscache_cookie fscache_fsdef_index = {</div><div class='del'>-	.debug_id	= 1,</div><div class='del'>-	.ref		= REFCOUNT_INIT(1),</div><div class='del'>-	.n_active	= ATOMIC_INIT(1),</div><div class='del'>-	.lock		= __SPIN_LOCK_UNLOCKED(fscache_fsdef_index.lock),</div><div class='del'>-	.backing_objects = HLIST_HEAD_INIT,</div><div class='del'>-	.def		= &amp;fscache_fsdef_index_def,</div><div class='del'>-	.flags		= 1 &lt;&lt; FSCACHE_COOKIE_ENABLED,</div><div class='del'>-	.type		= FSCACHE_COOKIE_TYPE_INDEX,</div><div class='del'>-};</div><div class='del'>-EXPORT_SYMBOL(fscache_fsdef_index);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Definition of an entry in the root index.  Each entry is an index, keyed to</div><div class='del'>- * a specific netfs and only applicable to a particular version of the index</div><div class='del'>- * structure used by that netfs.</div><div class='del'>- */</div><div class='del'>-struct fscache_cookie_def fscache_fsdef_netfs_def = {</div><div class='del'>-	.name		= "FSDEF.netfs",</div><div class='del'>-	.type		= FSCACHE_COOKIE_TYPE_INDEX,</div><div class='del'>-	.check_aux	= fscache_fsdef_netfs_check_aux,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * check that the index structure version number stored in the auxiliary data</div><div class='del'>- * matches the one the netfs gave us</div><div class='del'>- */</div><div class='del'>-static enum fscache_checkaux fscache_fsdef_netfs_check_aux(</div><div class='del'>-	void *cookie_netfs_data,</div><div class='del'>-	const void *data,</div><div class='del'>-	uint16_t datalen,</div><div class='del'>-	loff_t object_size)</div><div class='del'>-{</div><div class='del'>-	struct fscache_netfs *netfs = cookie_netfs_data;</div><div class='del'>-	uint32_t version;</div><div class='del'>-</div><div class='del'>-	_enter("{%s},,%hu", netfs-&gt;name, datalen);</div><div class='del'>-</div><div class='del'>-	if (datalen != sizeof(version)) {</div><div class='del'>-		_leave(" = OBSOLETE [dl=%d v=%zu]", datalen, sizeof(version));</div><div class='del'>-		return FSCACHE_CHECKAUX_OBSOLETE;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	memcpy(&amp;version, data, sizeof(version));</div><div class='del'>-	if (version != netfs-&gt;version) {</div><div class='del'>-		_leave(" = OBSOLETE [ver=%x net=%x]", version, netfs-&gt;version);</div><div class='del'>-		return FSCACHE_CHECKAUX_OBSOLETE;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	_leave(" = OKAY");</div><div class='del'>-	return FSCACHE_CHECKAUX_OKAY;</div><div class='del'>-}</div><div class='head'>diff --git a/fs/fscache/internal.h b/fs/fscache/internal.h<br/>deleted file mode 100644<br/>index c3e4804b8fcb..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fscache/internal.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fscache/internal.h</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,461 +0,0 @@</div><div class='del'>-/* SPDX-License-Identifier: GPL-2.0-or-later */</div><div class='del'>-/* Internal definitions for FS-Cache</div><div class='del'>- *</div><div class='del'>- * Copyright (C) 2004-2007 Red Hat, Inc. All Rights Reserved.</div><div class='del'>- * Written by David Howells (dhowells@redhat.com)</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Lock order, in the order in which multiple locks should be obtained:</div><div class='del'>- * - fscache_addremove_sem</div><div class='del'>- * - cookie-&gt;lock</div><div class='del'>- * - cookie-&gt;parent-&gt;lock</div><div class='del'>- * - cache-&gt;object_list_lock</div><div class='del'>- * - object-&gt;lock</div><div class='del'>- * - object-&gt;parent-&gt;lock</div><div class='del'>- * - cookie-&gt;stores_lock</div><div class='del'>- * - fscache_thread_lock</div><div class='del'>- *</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#ifdef pr_fmt</div><div class='del'>-#undef pr_fmt</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-#define pr_fmt(fmt) "FS-Cache: " fmt</div><div class='del'>-</div><div class='del'>-#include &lt;linux/fscache-cache.h&gt;</div><div class='del'>-#include &lt;trace/events/fscache.h&gt;</div><div class='del'>-#include &lt;linux/sched.h&gt;</div><div class='del'>-#include &lt;linux/seq_file.h&gt;</div><div class='del'>-</div><div class='del'>-#define FSCACHE_MIN_THREADS	4</div><div class='del'>-#define FSCACHE_MAX_THREADS	32</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * cache.c</div><div class='del'>- */</div><div class='del'>-extern struct list_head fscache_cache_list;</div><div class='del'>-extern struct rw_semaphore fscache_addremove_sem;</div><div class='del'>-</div><div class='del'>-extern struct fscache_cache *fscache_select_cache_for_object(</div><div class='del'>-	struct fscache_cookie *);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * cookie.c</div><div class='del'>- */</div><div class='del'>-extern struct kmem_cache *fscache_cookie_jar;</div><div class='del'>-extern const struct seq_operations fscache_cookies_seq_ops;</div><div class='del'>-</div><div class='del'>-extern void fscache_free_cookie(struct fscache_cookie *);</div><div class='del'>-extern struct fscache_cookie *fscache_alloc_cookie(struct fscache_cookie *,</div><div class='del'>-						   const struct fscache_cookie_def *,</div><div class='del'>-						   const void *, size_t,</div><div class='del'>-						   const void *, size_t,</div><div class='del'>-						   void *, loff_t);</div><div class='del'>-extern struct fscache_cookie *fscache_hash_cookie(struct fscache_cookie *);</div><div class='del'>-extern struct fscache_cookie *fscache_cookie_get(struct fscache_cookie *,</div><div class='del'>-						 enum fscache_cookie_trace);</div><div class='del'>-extern void fscache_cookie_put(struct fscache_cookie *,</div><div class='del'>-			       enum fscache_cookie_trace);</div><div class='del'>-</div><div class='del'>-static inline void fscache_cookie_see(struct fscache_cookie *cookie,</div><div class='del'>-				      enum fscache_cookie_trace where)</div><div class='del'>-{</div><div class='del'>-	trace_fscache_cookie(cookie-&gt;debug_id, refcount_read(&amp;cookie-&gt;ref),</div><div class='del'>-			     where);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * fsdef.c</div><div class='del'>- */</div><div class='del'>-extern struct fscache_cookie fscache_fsdef_index;</div><div class='del'>-extern struct fscache_cookie_def fscache_fsdef_netfs_def;</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * main.c</div><div class='del'>- */</div><div class='del'>-extern unsigned fscache_defer_lookup;</div><div class='del'>-extern unsigned fscache_defer_create;</div><div class='del'>-extern unsigned fscache_debug;</div><div class='del'>-extern struct kobject *fscache_root;</div><div class='del'>-extern struct workqueue_struct *fscache_object_wq;</div><div class='del'>-extern struct workqueue_struct *fscache_op_wq;</div><div class='del'>-DECLARE_PER_CPU(wait_queue_head_t, fscache_object_cong_wait);</div><div class='del'>-</div><div class='del'>-extern unsigned int fscache_hash(unsigned int salt, unsigned int *data, unsigned int n);</div><div class='del'>-</div><div class='del'>-static inline bool fscache_object_congested(void)</div><div class='del'>-{</div><div class='del'>-	return workqueue_congested(WORK_CPU_UNBOUND, fscache_object_wq);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * object.c</div><div class='del'>- */</div><div class='del'>-extern void fscache_enqueue_object(struct fscache_object *);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * operation.c</div><div class='del'>- */</div><div class='del'>-extern int fscache_submit_exclusive_op(struct fscache_object *,</div><div class='del'>-				       struct fscache_operation *);</div><div class='del'>-extern int fscache_submit_op(struct fscache_object *,</div><div class='del'>-			     struct fscache_operation *);</div><div class='del'>-extern int fscache_cancel_op(struct fscache_operation *, bool);</div><div class='del'>-extern void fscache_cancel_all_ops(struct fscache_object *);</div><div class='del'>-extern void fscache_abort_object(struct fscache_object *);</div><div class='del'>-extern void fscache_start_operations(struct fscache_object *);</div><div class='del'>-extern void fscache_operation_gc(struct work_struct *);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * page.c</div><div class='del'>- */</div><div class='del'>-extern int fscache_wait_for_deferred_lookup(struct fscache_cookie *);</div><div class='del'>-extern int fscache_wait_for_operation_activation(struct fscache_object *,</div><div class='del'>-						 struct fscache_operation *,</div><div class='del'>-						 atomic_t *,</div><div class='del'>-						 atomic_t *);</div><div class='del'>-extern void fscache_invalidate_writes(struct fscache_cookie *);</div><div class='del'>-struct fscache_retrieval *fscache_alloc_retrieval(struct fscache_cookie *cookie,</div><div class='del'>-						  struct address_space *mapping,</div><div class='del'>-						  fscache_rw_complete_t end_io_func,</div><div class='del'>-						  void *context);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * proc.c</div><div class='del'>- */</div><div class='del'>-#ifdef CONFIG_PROC_FS</div><div class='del'>-extern int __init fscache_proc_init(void);</div><div class='del'>-extern void fscache_proc_cleanup(void);</div><div class='del'>-#else</div><div class='del'>-#define fscache_proc_init()	(0)</div><div class='del'>-#define fscache_proc_cleanup()	do {} while (0)</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * stats.c</div><div class='del'>- */</div><div class='del'>-#ifdef CONFIG_FSCACHE_STATS</div><div class='del'>-extern atomic_t fscache_n_ops_processed[FSCACHE_MAX_THREADS];</div><div class='del'>-extern atomic_t fscache_n_objs_processed[FSCACHE_MAX_THREADS];</div><div class='del'>-</div><div class='del'>-extern atomic_t fscache_n_op_pend;</div><div class='del'>-extern atomic_t fscache_n_op_run;</div><div class='del'>-extern atomic_t fscache_n_op_enqueue;</div><div class='del'>-extern atomic_t fscache_n_op_deferred_release;</div><div class='del'>-extern atomic_t fscache_n_op_initialised;</div><div class='del'>-extern atomic_t fscache_n_op_release;</div><div class='del'>-extern atomic_t fscache_n_op_gc;</div><div class='del'>-extern atomic_t fscache_n_op_cancelled;</div><div class='del'>-extern atomic_t fscache_n_op_rejected;</div><div class='del'>-</div><div class='del'>-extern atomic_t fscache_n_attr_changed;</div><div class='del'>-extern atomic_t fscache_n_attr_changed_ok;</div><div class='del'>-extern atomic_t fscache_n_attr_changed_nobufs;</div><div class='del'>-extern atomic_t fscache_n_attr_changed_nomem;</div><div class='del'>-extern atomic_t fscache_n_attr_changed_calls;</div><div class='del'>-</div><div class='del'>-extern atomic_t fscache_n_allocs;</div><div class='del'>-extern atomic_t fscache_n_allocs_ok;</div><div class='del'>-extern atomic_t fscache_n_allocs_wait;</div><div class='del'>-extern atomic_t fscache_n_allocs_nobufs;</div><div class='del'>-extern atomic_t fscache_n_allocs_intr;</div><div class='del'>-extern atomic_t fscache_n_allocs_object_dead;</div><div class='del'>-extern atomic_t fscache_n_alloc_ops;</div><div class='del'>-extern atomic_t fscache_n_alloc_op_waits;</div><div class='del'>-</div><div class='del'>-extern atomic_t fscache_n_retrievals;</div><div class='del'>-extern atomic_t fscache_n_retrievals_ok;</div><div class='del'>-extern atomic_t fscache_n_retrievals_wait;</div><div class='del'>-extern atomic_t fscache_n_retrievals_nodata;</div><div class='del'>-extern atomic_t fscache_n_retrievals_nobufs;</div><div class='del'>-extern atomic_t fscache_n_retrievals_intr;</div><div class='del'>-extern atomic_t fscache_n_retrievals_nomem;</div><div class='del'>-extern atomic_t fscache_n_retrievals_object_dead;</div><div class='del'>-extern atomic_t fscache_n_retrieval_ops;</div><div class='del'>-extern atomic_t fscache_n_retrieval_op_waits;</div><div class='del'>-</div><div class='del'>-extern atomic_t fscache_n_stores;</div><div class='del'>-extern atomic_t fscache_n_stores_ok;</div><div class='del'>-extern atomic_t fscache_n_stores_again;</div><div class='del'>-extern atomic_t fscache_n_stores_nobufs;</div><div class='del'>-extern atomic_t fscache_n_stores_oom;</div><div class='del'>-extern atomic_t fscache_n_store_ops;</div><div class='del'>-extern atomic_t fscache_n_store_calls;</div><div class='del'>-extern atomic_t fscache_n_store_pages;</div><div class='del'>-extern atomic_t fscache_n_store_radix_deletes;</div><div class='del'>-extern atomic_t fscache_n_store_pages_over_limit;</div><div class='del'>-</div><div class='del'>-extern atomic_t fscache_n_store_vmscan_not_storing;</div><div class='del'>-extern atomic_t fscache_n_store_vmscan_gone;</div><div class='del'>-extern atomic_t fscache_n_store_vmscan_busy;</div><div class='del'>-extern atomic_t fscache_n_store_vmscan_cancelled;</div><div class='del'>-extern atomic_t fscache_n_store_vmscan_wait;</div><div class='del'>-</div><div class='del'>-extern atomic_t fscache_n_marks;</div><div class='del'>-extern atomic_t fscache_n_uncaches;</div><div class='del'>-</div><div class='del'>-extern atomic_t fscache_n_acquires;</div><div class='del'>-extern atomic_t fscache_n_acquires_null;</div><div class='del'>-extern atomic_t fscache_n_acquires_no_cache;</div><div class='del'>-extern atomic_t fscache_n_acquires_ok;</div><div class='del'>-extern atomic_t fscache_n_acquires_nobufs;</div><div class='del'>-extern atomic_t fscache_n_acquires_oom;</div><div class='del'>-</div><div class='del'>-extern atomic_t fscache_n_invalidates;</div><div class='del'>-extern atomic_t fscache_n_invalidates_run;</div><div class='del'>-</div><div class='del'>-extern atomic_t fscache_n_updates;</div><div class='del'>-extern atomic_t fscache_n_updates_null;</div><div class='del'>-extern atomic_t fscache_n_updates_run;</div><div class='del'>-</div><div class='del'>-extern atomic_t fscache_n_relinquishes;</div><div class='del'>-extern atomic_t fscache_n_relinquishes_null;</div><div class='del'>-extern atomic_t fscache_n_relinquishes_waitcrt;</div><div class='del'>-extern atomic_t fscache_n_relinquishes_retire;</div><div class='del'>-</div><div class='del'>-extern atomic_t fscache_n_cookie_index;</div><div class='del'>-extern atomic_t fscache_n_cookie_data;</div><div class='del'>-extern atomic_t fscache_n_cookie_special;</div><div class='del'>-</div><div class='del'>-extern atomic_t fscache_n_object_alloc;</div><div class='del'>-extern atomic_t fscache_n_object_no_alloc;</div><div class='del'>-extern atomic_t fscache_n_object_lookups;</div><div class='del'>-extern atomic_t fscache_n_object_lookups_negative;</div><div class='del'>-extern atomic_t fscache_n_object_lookups_positive;</div><div class='del'>-extern atomic_t fscache_n_object_lookups_timed_out;</div><div class='del'>-extern atomic_t fscache_n_object_created;</div><div class='del'>-extern atomic_t fscache_n_object_avail;</div><div class='del'>-extern atomic_t fscache_n_object_dead;</div><div class='del'>-</div><div class='del'>-extern atomic_t fscache_n_checkaux_none;</div><div class='del'>-extern atomic_t fscache_n_checkaux_okay;</div><div class='del'>-extern atomic_t fscache_n_checkaux_update;</div><div class='del'>-extern atomic_t fscache_n_checkaux_obsolete;</div><div class='del'>-</div><div class='del'>-extern atomic_t fscache_n_cop_alloc_object;</div><div class='del'>-extern atomic_t fscache_n_cop_lookup_object;</div><div class='del'>-extern atomic_t fscache_n_cop_lookup_complete;</div><div class='del'>-extern atomic_t fscache_n_cop_grab_object;</div><div class='del'>-extern atomic_t fscache_n_cop_invalidate_object;</div><div class='del'>-extern atomic_t fscache_n_cop_update_object;</div><div class='del'>-extern atomic_t fscache_n_cop_drop_object;</div><div class='del'>-extern atomic_t fscache_n_cop_put_object;</div><div class='del'>-extern atomic_t fscache_n_cop_sync_cache;</div><div class='del'>-extern atomic_t fscache_n_cop_attr_changed;</div><div class='del'>-extern atomic_t fscache_n_cop_read_or_alloc_page;</div><div class='del'>-extern atomic_t fscache_n_cop_read_or_alloc_pages;</div><div class='del'>-extern atomic_t fscache_n_cop_allocate_page;</div><div class='del'>-extern atomic_t fscache_n_cop_allocate_pages;</div><div class='del'>-extern atomic_t fscache_n_cop_write_page;</div><div class='del'>-extern atomic_t fscache_n_cop_uncache_page;</div><div class='del'>-extern atomic_t fscache_n_cop_dissociate_pages;</div><div class='del'>-</div><div class='del'>-extern atomic_t fscache_n_cache_no_space_reject;</div><div class='del'>-extern atomic_t fscache_n_cache_stale_objects;</div><div class='del'>-extern atomic_t fscache_n_cache_retired_objects;</div><div class='del'>-extern atomic_t fscache_n_cache_culled_objects;</div><div class='del'>-</div><div class='del'>-static inline void fscache_stat(atomic_t *stat)</div><div class='del'>-{</div><div class='del'>-	atomic_inc(stat);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void fscache_stat_d(atomic_t *stat)</div><div class='del'>-{</div><div class='del'>-	atomic_dec(stat);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#define __fscache_stat(stat) (stat)</div><div class='del'>-</div><div class='del'>-int fscache_stats_show(struct seq_file *m, void *v);</div><div class='del'>-#else</div><div class='del'>-</div><div class='del'>-#define __fscache_stat(stat) (NULL)</div><div class='del'>-#define fscache_stat(stat) do {} while (0)</div><div class='del'>-#define fscache_stat_d(stat) do {} while (0)</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * raise an event on an object</div><div class='del'>- * - if the event is not masked for that object, then the object is</div><div class='del'>- *   queued for attention by the thread pool.</div><div class='del'>- */</div><div class='del'>-static inline void fscache_raise_event(struct fscache_object *object,</div><div class='del'>-				       unsigned event)</div><div class='del'>-{</div><div class='del'>-	BUG_ON(event &gt;= NR_FSCACHE_OBJECT_EVENTS);</div><div class='del'>-#if 0</div><div class='del'>-	printk("*** fscache_raise_event(OBJ%d{%lx},%x)\n",</div><div class='del'>-	       object-&gt;debug_id, object-&gt;event_mask, (1 &lt;&lt; event));</div><div class='del'>-#endif</div><div class='del'>-	if (!test_and_set_bit(event, &amp;object-&gt;events) &amp;&amp;</div><div class='del'>-	    test_bit(event, &amp;object-&gt;event_mask))</div><div class='del'>-		fscache_enqueue_object(object);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * get an extra reference to a netfs retrieval context</div><div class='del'>- */</div><div class='del'>-static inline</div><div class='del'>-void *fscache_get_context(struct fscache_cookie *cookie, void *context)</div><div class='del'>-{</div><div class='del'>-	if (cookie-&gt;def-&gt;get_context)</div><div class='del'>-		cookie-&gt;def-&gt;get_context(cookie-&gt;netfs_data, context);</div><div class='del'>-	return context;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * release a reference to a netfs retrieval context</div><div class='del'>- */</div><div class='del'>-static inline</div><div class='del'>-void fscache_put_context(struct fscache_cookie *cookie, void *context)</div><div class='del'>-{</div><div class='del'>-	if (cookie-&gt;def-&gt;put_context)</div><div class='del'>-		cookie-&gt;def-&gt;put_context(cookie-&gt;netfs_data, context);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Update the auxiliary data on a cookie.</div><div class='del'>- */</div><div class='del'>-static inline</div><div class='del'>-void fscache_update_aux(struct fscache_cookie *cookie, const void *aux_data)</div><div class='del'>-{</div><div class='del'>-	void *p;</div><div class='del'>-</div><div class='del'>-	if (!aux_data)</div><div class='del'>-		return;</div><div class='del'>-	if (cookie-&gt;aux_len &lt;= sizeof(cookie-&gt;inline_aux))</div><div class='del'>-		p = cookie-&gt;inline_aux;</div><div class='del'>-	else</div><div class='del'>-		p = cookie-&gt;aux;</div><div class='del'>-</div><div class='del'>-	if (memcmp(p, aux_data, cookie-&gt;aux_len) != 0) {</div><div class='del'>-		memcpy(p, aux_data, cookie-&gt;aux_len);</div><div class='del'>-		set_bit(FSCACHE_COOKIE_AUX_UPDATED, &amp;cookie-&gt;flags);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*****************************************************************************/</div><div class='del'>-/*</div><div class='del'>- * debug tracing</div><div class='del'>- */</div><div class='del'>-#define dbgprintk(FMT, ...) \</div><div class='del'>-	printk(KERN_DEBUG "[%-6.6s] "FMT"\n", current-&gt;comm, ##__VA_ARGS__)</div><div class='del'>-</div><div class='del'>-#define kenter(FMT, ...) dbgprintk("==&gt; %s("FMT")", __func__, ##__VA_ARGS__)</div><div class='del'>-#define kleave(FMT, ...) dbgprintk("&lt;== %s()"FMT"", __func__, ##__VA_ARGS__)</div><div class='del'>-#define kdebug(FMT, ...) dbgprintk(FMT, ##__VA_ARGS__)</div><div class='del'>-</div><div class='del'>-#define kjournal(FMT, ...) no_printk(FMT, ##__VA_ARGS__)</div><div class='del'>-</div><div class='del'>-#ifdef __KDEBUG</div><div class='del'>-#define _enter(FMT, ...) kenter(FMT, ##__VA_ARGS__)</div><div class='del'>-#define _leave(FMT, ...) kleave(FMT, ##__VA_ARGS__)</div><div class='del'>-#define _debug(FMT, ...) kdebug(FMT, ##__VA_ARGS__)</div><div class='del'>-</div><div class='del'>-#elif defined(CONFIG_FSCACHE_DEBUG)</div><div class='del'>-#define _enter(FMT, ...)			\</div><div class='del'>-do {						\</div><div class='del'>-	if (__do_kdebug(ENTER))			\</div><div class='del'>-		kenter(FMT, ##__VA_ARGS__);	\</div><div class='del'>-} while (0)</div><div class='del'>-</div><div class='del'>-#define _leave(FMT, ...)			\</div><div class='del'>-do {						\</div><div class='del'>-	if (__do_kdebug(LEAVE))			\</div><div class='del'>-		kleave(FMT, ##__VA_ARGS__);	\</div><div class='del'>-} while (0)</div><div class='del'>-</div><div class='del'>-#define _debug(FMT, ...)			\</div><div class='del'>-do {						\</div><div class='del'>-	if (__do_kdebug(DEBUG))			\</div><div class='del'>-		kdebug(FMT, ##__VA_ARGS__);	\</div><div class='del'>-} while (0)</div><div class='del'>-</div><div class='del'>-#else</div><div class='del'>-#define _enter(FMT, ...) no_printk("==&gt; %s("FMT")", __func__, ##__VA_ARGS__)</div><div class='del'>-#define _leave(FMT, ...) no_printk("&lt;== %s()"FMT"", __func__, ##__VA_ARGS__)</div><div class='del'>-#define _debug(FMT, ...) no_printk(FMT, ##__VA_ARGS__)</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * determine whether a particular optional debugging point should be logged</div><div class='del'>- * - we need to go through three steps to persuade cpp to correctly join the</div><div class='del'>- *   shorthand in FSCACHE_DEBUG_LEVEL with its prefix</div><div class='del'>- */</div><div class='del'>-#define ____do_kdebug(LEVEL, POINT) \</div><div class='del'>-	unlikely((fscache_debug &amp; \</div><div class='del'>-		  (FSCACHE_POINT_##POINT &lt;&lt; (FSCACHE_DEBUG_ ## LEVEL * 3))))</div><div class='del'>-#define ___do_kdebug(LEVEL, POINT) \</div><div class='del'>-	____do_kdebug(LEVEL, POINT)</div><div class='del'>-#define __do_kdebug(POINT) \</div><div class='del'>-	___do_kdebug(FSCACHE_DEBUG_LEVEL, POINT)</div><div class='del'>-</div><div class='del'>-#define FSCACHE_DEBUG_CACHE	0</div><div class='del'>-#define FSCACHE_DEBUG_COOKIE	1</div><div class='del'>-#define FSCACHE_DEBUG_PAGE	2</div><div class='del'>-#define FSCACHE_DEBUG_OPERATION	3</div><div class='del'>-</div><div class='del'>-#define FSCACHE_POINT_ENTER	1</div><div class='del'>-#define FSCACHE_POINT_LEAVE	2</div><div class='del'>-#define FSCACHE_POINT_DEBUG	4</div><div class='del'>-</div><div class='del'>-#ifndef FSCACHE_DEBUG_LEVEL</div><div class='del'>-#define FSCACHE_DEBUG_LEVEL CACHE</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * assertions</div><div class='del'>- */</div><div class='del'>-#if 1 /* defined(__KDEBUGALL) */</div><div class='del'>-</div><div class='del'>-#define ASSERT(X)							\</div><div class='del'>-do {									\</div><div class='del'>-	if (unlikely(!(X))) {						\</div><div class='del'>-		pr_err("\n");					\</div><div class='del'>-		pr_err("Assertion failed\n");	\</div><div class='del'>-		BUG();							\</div><div class='del'>-	}								\</div><div class='del'>-} while (0)</div><div class='del'>-</div><div class='del'>-#define ASSERTCMP(X, OP, Y)						\</div><div class='del'>-do {									\</div><div class='del'>-	if (unlikely(!((X) OP (Y)))) {					\</div><div class='del'>-		pr_err("\n");					\</div><div class='del'>-		pr_err("Assertion failed\n");	\</div><div class='del'>-		pr_err("%lx " #OP " %lx is false\n",		\</div><div class='del'>-		       (unsigned long)(X), (unsigned long)(Y));		\</div><div class='del'>-		BUG();							\</div><div class='del'>-	}								\</div><div class='del'>-} while (0)</div><div class='del'>-</div><div class='del'>-#define ASSERTIF(C, X)							\</div><div class='del'>-do {									\</div><div class='del'>-	if (unlikely((C) &amp;&amp; !(X))) {					\</div><div class='del'>-		pr_err("\n");					\</div><div class='del'>-		pr_err("Assertion failed\n");	\</div><div class='del'>-		BUG();							\</div><div class='del'>-	}								\</div><div class='del'>-} while (0)</div><div class='del'>-</div><div class='del'>-#define ASSERTIFCMP(C, X, OP, Y)					\</div><div class='del'>-do {									\</div><div class='del'>-	if (unlikely((C) &amp;&amp; !((X) OP (Y)))) {				\</div><div class='del'>-		pr_err("\n");					\</div><div class='del'>-		pr_err("Assertion failed\n");	\</div><div class='del'>-		pr_err("%lx " #OP " %lx is false\n",		\</div><div class='del'>-		       (unsigned long)(X), (unsigned long)(Y));		\</div><div class='del'>-		BUG();							\</div><div class='del'>-	}								\</div><div class='del'>-} while (0)</div><div class='del'>-</div><div class='del'>-#else</div><div class='del'>-</div><div class='del'>-#define ASSERT(X)			do {} while (0)</div><div class='del'>-#define ASSERTCMP(X, OP, Y)		do {} while (0)</div><div class='del'>-#define ASSERTIF(C, X)			do {} while (0)</div><div class='del'>-#define ASSERTIFCMP(C, X, OP, Y)	do {} while (0)</div><div class='del'>-</div><div class='del'>-#endif /* assert or not */</div><div class='head'>diff --git a/fs/fscache/io.c b/fs/fscache/io.c<br/>deleted file mode 100644<br/>index 8ecc1141802f..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fscache/io.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fscache/io.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,116 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='del'>-/* Cache data I/O routines</div><div class='del'>- *</div><div class='del'>- * Copyright (C) 2021 Red Hat, Inc. All Rights Reserved.</div><div class='del'>- * Written by David Howells (dhowells@redhat.com)</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#define FSCACHE_DEBUG_LEVEL PAGE</div><div class='del'>-#include &lt;linux/module.h&gt;</div><div class='del'>-#define FSCACHE_USE_NEW_IO_API</div><div class='del'>-#include &lt;linux/fscache-cache.h&gt;</div><div class='del'>-#include &lt;linux/slab.h&gt;</div><div class='del'>-#include &lt;linux/netfs.h&gt;</div><div class='del'>-#include "internal.h"</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Start a cache read operation.</div><div class='del'>- * - we return:</div><div class='del'>- *   -ENOMEM	- out of memory, some pages may be being read</div><div class='del'>- *   -ERESTARTSYS - interrupted, some pages may be being read</div><div class='del'>- *   -ENOBUFS	- no backing object or space available in which to cache any</div><div class='del'>- *                pages not being read</div><div class='del'>- *   -ENODATA	- no data available in the backing object for some or all of</div><div class='del'>- *                the pages</div><div class='del'>- *   0		- dispatched a read on all pages</div><div class='del'>- */</div><div class='del'>-int __fscache_begin_read_operation(struct netfs_read_request *rreq,</div><div class='del'>-				   struct fscache_cookie *cookie)</div><div class='del'>-{</div><div class='del'>-	struct fscache_retrieval *op;</div><div class='del'>-	struct fscache_object *object;</div><div class='del'>-	bool wake_cookie = false;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	_enter("rr=%08x", rreq-&gt;debug_id);</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_retrievals);</div><div class='del'>-</div><div class='del'>-	if (hlist_empty(&amp;cookie-&gt;backing_objects))</div><div class='del'>-		goto nobufs;</div><div class='del'>-</div><div class='del'>-	if (test_bit(FSCACHE_COOKIE_INVALIDATING, &amp;cookie-&gt;flags)) {</div><div class='del'>-		_leave(" = -ENOBUFS [invalidating]");</div><div class='del'>-		return -ENOBUFS;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ASSERTCMP(cookie-&gt;def-&gt;type, !=, FSCACHE_COOKIE_TYPE_INDEX);</div><div class='del'>-</div><div class='del'>-	if (fscache_wait_for_deferred_lookup(cookie) &lt; 0)</div><div class='del'>-		return -ERESTARTSYS;</div><div class='del'>-</div><div class='del'>-	op = fscache_alloc_retrieval(cookie, NULL, NULL, NULL);</div><div class='del'>-	if (!op)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	trace_fscache_page_op(cookie, NULL, &amp;op-&gt;op, fscache_page_op_retr_multi);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;cookie-&gt;lock);</div><div class='del'>-</div><div class='del'>-	if (!fscache_cookie_enabled(cookie) ||</div><div class='del'>-	    hlist_empty(&amp;cookie-&gt;backing_objects))</div><div class='del'>-		goto nobufs_unlock;</div><div class='del'>-	object = hlist_entry(cookie-&gt;backing_objects.first,</div><div class='del'>-			     struct fscache_object, cookie_link);</div><div class='del'>-</div><div class='del'>-	__fscache_use_cookie(cookie);</div><div class='del'>-	atomic_inc(&amp;object-&gt;n_reads);</div><div class='del'>-	__set_bit(FSCACHE_OP_DEC_READ_CNT, &amp;op-&gt;op.flags);</div><div class='del'>-</div><div class='del'>-	if (fscache_submit_op(object, &amp;op-&gt;op) &lt; 0)</div><div class='del'>-		goto nobufs_unlock_dec;</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_retrieval_ops);</div><div class='del'>-</div><div class='del'>-	/* we wait for the operation to become active, and then process it</div><div class='del'>-	 * *here*, in this thread, and not in the thread pool */</div><div class='del'>-	ret = fscache_wait_for_operation_activation(</div><div class='del'>-		object, &amp;op-&gt;op,</div><div class='del'>-		__fscache_stat(&amp;fscache_n_retrieval_op_waits),</div><div class='del'>-		__fscache_stat(&amp;fscache_n_retrievals_object_dead));</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto error;</div><div class='del'>-</div><div class='del'>-	/* ask the cache to honour the operation */</div><div class='del'>-	ret = object-&gt;cache-&gt;ops-&gt;begin_read_operation(rreq, op);</div><div class='del'>-</div><div class='del'>-error:</div><div class='del'>-	if (ret == -ENOMEM)</div><div class='del'>-		fscache_stat(&amp;fscache_n_retrievals_nomem);</div><div class='del'>-	else if (ret == -ERESTARTSYS)</div><div class='del'>-		fscache_stat(&amp;fscache_n_retrievals_intr);</div><div class='del'>-	else if (ret == -ENODATA)</div><div class='del'>-		fscache_stat(&amp;fscache_n_retrievals_nodata);</div><div class='del'>-	else if (ret &lt; 0)</div><div class='del'>-		fscache_stat(&amp;fscache_n_retrievals_nobufs);</div><div class='del'>-	else</div><div class='del'>-		fscache_stat(&amp;fscache_n_retrievals_ok);</div><div class='del'>-</div><div class='del'>-	fscache_put_retrieval(op);</div><div class='del'>-	_leave(" = %d", ret);</div><div class='del'>-	return ret;</div><div class='del'>-</div><div class='del'>-nobufs_unlock_dec:</div><div class='del'>-	atomic_dec(&amp;object-&gt;n_reads);</div><div class='del'>-	wake_cookie = __fscache_unuse_cookie(cookie);</div><div class='del'>-nobufs_unlock:</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-	fscache_put_retrieval(op);</div><div class='del'>-	if (wake_cookie)</div><div class='del'>-		__fscache_wake_unused_cookie(cookie);</div><div class='del'>-nobufs:</div><div class='del'>-	fscache_stat(&amp;fscache_n_retrievals_nobufs);</div><div class='del'>-	_leave(" = -ENOBUFS");</div><div class='del'>-	return -ENOBUFS;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(__fscache_begin_read_operation);</div><div class='head'>diff --git a/fs/fscache/main.c b/fs/fscache/main.c<br/>deleted file mode 100644<br/>index 4207f98e405f..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fscache/main.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fscache/main.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,230 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='del'>-/* General filesystem local caching manager</div><div class='del'>- *</div><div class='del'>- * Copyright (C) 2004-2007 Red Hat, Inc. All Rights Reserved.</div><div class='del'>- * Written by David Howells (dhowells@redhat.com)</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#define FSCACHE_DEBUG_LEVEL CACHE</div><div class='del'>-#include &lt;linux/module.h&gt;</div><div class='del'>-#include &lt;linux/init.h&gt;</div><div class='del'>-#include &lt;linux/sched.h&gt;</div><div class='del'>-#include &lt;linux/completion.h&gt;</div><div class='del'>-#include &lt;linux/slab.h&gt;</div><div class='del'>-#include &lt;linux/seq_file.h&gt;</div><div class='del'>-#define CREATE_TRACE_POINTS</div><div class='del'>-#include "internal.h"</div><div class='del'>-</div><div class='del'>-MODULE_DESCRIPTION("FS Cache Manager");</div><div class='del'>-MODULE_AUTHOR("Red Hat, Inc.");</div><div class='del'>-MODULE_LICENSE("GPL");</div><div class='del'>-</div><div class='del'>-unsigned fscache_defer_lookup = 1;</div><div class='del'>-module_param_named(defer_lookup, fscache_defer_lookup, uint,</div><div class='del'>-		   S_IWUSR | S_IRUGO);</div><div class='del'>-MODULE_PARM_DESC(fscache_defer_lookup,</div><div class='del'>-		 "Defer cookie lookup to background thread");</div><div class='del'>-</div><div class='del'>-unsigned fscache_defer_create = 1;</div><div class='del'>-module_param_named(defer_create, fscache_defer_create, uint,</div><div class='del'>-		   S_IWUSR | S_IRUGO);</div><div class='del'>-MODULE_PARM_DESC(fscache_defer_create,</div><div class='del'>-		 "Defer cookie creation to background thread");</div><div class='del'>-</div><div class='del'>-unsigned fscache_debug;</div><div class='del'>-module_param_named(debug, fscache_debug, uint,</div><div class='del'>-		   S_IWUSR | S_IRUGO);</div><div class='del'>-MODULE_PARM_DESC(fscache_debug,</div><div class='del'>-		 "FS-Cache debugging mask");</div><div class='del'>-</div><div class='del'>-struct kobject *fscache_root;</div><div class='del'>-struct workqueue_struct *fscache_object_wq;</div><div class='del'>-struct workqueue_struct *fscache_op_wq;</div><div class='del'>-</div><div class='del'>-DEFINE_PER_CPU(wait_queue_head_t, fscache_object_cong_wait);</div><div class='del'>-</div><div class='del'>-/* these values serve as lower bounds, will be adjusted in fscache_init() */</div><div class='del'>-static unsigned fscache_object_max_active = 4;</div><div class='del'>-static unsigned fscache_op_max_active = 2;</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_SYSCTL</div><div class='del'>-static struct ctl_table_header *fscache_sysctl_header;</div><div class='del'>-</div><div class='del'>-static int fscache_max_active_sysctl(struct ctl_table *table, int write,</div><div class='del'>-				     void *buffer, size_t *lenp, loff_t *ppos)</div><div class='del'>-{</div><div class='del'>-	struct workqueue_struct **wqp = table-&gt;extra1;</div><div class='del'>-	unsigned int *datap = table-&gt;data;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ret = proc_dointvec(table, write, buffer, lenp, ppos);</div><div class='del'>-	if (ret == 0)</div><div class='del'>-		workqueue_set_max_active(*wqp, *datap);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct ctl_table fscache_sysctls[] = {</div><div class='del'>-	{</div><div class='del'>-		.procname	= "object_max_active",</div><div class='del'>-		.data		= &amp;fscache_object_max_active,</div><div class='del'>-		.maxlen		= sizeof(unsigned),</div><div class='del'>-		.mode		= 0644,</div><div class='del'>-		.proc_handler	= fscache_max_active_sysctl,</div><div class='del'>-		.extra1		= &amp;fscache_object_wq,</div><div class='del'>-	},</div><div class='del'>-	{</div><div class='del'>-		.procname	= "operation_max_active",</div><div class='del'>-		.data		= &amp;fscache_op_max_active,</div><div class='del'>-		.maxlen		= sizeof(unsigned),</div><div class='del'>-		.mode		= 0644,</div><div class='del'>-		.proc_handler	= fscache_max_active_sysctl,</div><div class='del'>-		.extra1		= &amp;fscache_op_wq,</div><div class='del'>-	},</div><div class='del'>-	{}</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static struct ctl_table fscache_sysctls_root[] = {</div><div class='del'>-	{</div><div class='del'>-		.procname	= "fscache",</div><div class='del'>-		.mode		= 0555,</div><div class='del'>-		.child		= fscache_sysctls,</div><div class='del'>-	},</div><div class='del'>-	{}</div><div class='del'>-};</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Mixing scores (in bits) for (7,20):</div><div class='del'>- * Input delta: 1-bit      2-bit</div><div class='del'>- * 1 round:     330.3     9201.6</div><div class='del'>- * 2 rounds:   1246.4    25475.4</div><div class='del'>- * 3 rounds:   1907.1    31295.1</div><div class='del'>- * 4 rounds:   2042.3    31718.6</div><div class='del'>- * Perfect:    2048      31744</div><div class='del'>- *            (32*64)   (32*31/2 * 64)</div><div class='del'>- */</div><div class='del'>-#define HASH_MIX(x, y, a)	\</div><div class='del'>-	(	x ^= (a),	\</div><div class='del'>-	y ^= x,	x = rol32(x, 7),\</div><div class='del'>-	x += y,	y = rol32(y,20),\</div><div class='del'>-	y *= 9			)</div><div class='del'>-</div><div class='del'>-static inline unsigned int fold_hash(unsigned long x, unsigned long y)</div><div class='del'>-{</div><div class='del'>-	/* Use arch-optimized multiply if one exists */</div><div class='del'>-	return __hash_32(y ^ __hash_32(x));</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Generate a hash.  This is derived from full_name_hash(), but we want to be</div><div class='del'>- * sure it is arch independent and that it doesn't change as bits of the</div><div class='del'>- * computed hash value might appear on disk.  The caller also guarantees that</div><div class='del'>- * the hashed data will be a series of aligned 32-bit words.</div><div class='del'>- */</div><div class='del'>-unsigned int fscache_hash(unsigned int salt, unsigned int *data, unsigned int n)</div><div class='del'>-{</div><div class='del'>-	unsigned int a, x = 0, y = salt;</div><div class='del'>-</div><div class='del'>-	for (; n; n--) {</div><div class='del'>-		a = *data++;</div><div class='del'>-		HASH_MIX(x, y, a);</div><div class='del'>-	}</div><div class='del'>-	return fold_hash(x, y);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * initialise the fs caching module</div><div class='del'>- */</div><div class='del'>-static int __init fscache_init(void)</div><div class='del'>-{</div><div class='del'>-	unsigned int nr_cpus = num_possible_cpus();</div><div class='del'>-	unsigned int cpu;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	fscache_object_max_active =</div><div class='del'>-		clamp_val(nr_cpus,</div><div class='del'>-			  fscache_object_max_active, WQ_UNBOUND_MAX_ACTIVE);</div><div class='del'>-</div><div class='del'>-	ret = -ENOMEM;</div><div class='del'>-	fscache_object_wq = alloc_workqueue("fscache_object", WQ_UNBOUND,</div><div class='del'>-					    fscache_object_max_active);</div><div class='del'>-	if (!fscache_object_wq)</div><div class='del'>-		goto error_object_wq;</div><div class='del'>-</div><div class='del'>-	fscache_op_max_active =</div><div class='del'>-		clamp_val(fscache_object_max_active / 2,</div><div class='del'>-			  fscache_op_max_active, WQ_UNBOUND_MAX_ACTIVE);</div><div class='del'>-</div><div class='del'>-	ret = -ENOMEM;</div><div class='del'>-	fscache_op_wq = alloc_workqueue("fscache_operation", WQ_UNBOUND,</div><div class='del'>-					fscache_op_max_active);</div><div class='del'>-	if (!fscache_op_wq)</div><div class='del'>-		goto error_op_wq;</div><div class='del'>-</div><div class='del'>-	for_each_possible_cpu(cpu)</div><div class='del'>-		init_waitqueue_head(&amp;per_cpu(fscache_object_cong_wait, cpu));</div><div class='del'>-</div><div class='del'>-	ret = fscache_proc_init();</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto error_proc;</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_SYSCTL</div><div class='del'>-	ret = -ENOMEM;</div><div class='del'>-	fscache_sysctl_header = register_sysctl_table(fscache_sysctls_root);</div><div class='del'>-	if (!fscache_sysctl_header)</div><div class='del'>-		goto error_sysctl;</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-	fscache_cookie_jar = kmem_cache_create("fscache_cookie_jar",</div><div class='del'>-					       sizeof(struct fscache_cookie),</div><div class='del'>-					       0, 0, NULL);</div><div class='del'>-	if (!fscache_cookie_jar) {</div><div class='del'>-		pr_notice("Failed to allocate a cookie jar\n");</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto error_cookie_jar;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	fscache_root = kobject_create_and_add("fscache", kernel_kobj);</div><div class='del'>-	if (!fscache_root)</div><div class='del'>-		goto error_kobj;</div><div class='del'>-</div><div class='del'>-	pr_notice("Loaded\n");</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-error_kobj:</div><div class='del'>-	kmem_cache_destroy(fscache_cookie_jar);</div><div class='del'>-error_cookie_jar:</div><div class='del'>-#ifdef CONFIG_SYSCTL</div><div class='del'>-	unregister_sysctl_table(fscache_sysctl_header);</div><div class='del'>-error_sysctl:</div><div class='del'>-#endif</div><div class='del'>-	fscache_proc_cleanup();</div><div class='del'>-error_proc:</div><div class='del'>-	destroy_workqueue(fscache_op_wq);</div><div class='del'>-error_op_wq:</div><div class='del'>-	destroy_workqueue(fscache_object_wq);</div><div class='del'>-error_object_wq:</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-fs_initcall(fscache_init);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * clean up on module removal</div><div class='del'>- */</div><div class='del'>-static void __exit fscache_exit(void)</div><div class='del'>-{</div><div class='del'>-	_enter("");</div><div class='del'>-</div><div class='del'>-	kobject_put(fscache_root);</div><div class='del'>-	kmem_cache_destroy(fscache_cookie_jar);</div><div class='del'>-#ifdef CONFIG_SYSCTL</div><div class='del'>-	unregister_sysctl_table(fscache_sysctl_header);</div><div class='del'>-#endif</div><div class='del'>-	fscache_proc_cleanup();</div><div class='del'>-	destroy_workqueue(fscache_op_wq);</div><div class='del'>-	destroy_workqueue(fscache_object_wq);</div><div class='del'>-	pr_notice("Unloaded\n");</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-module_exit(fscache_exit);</div><div class='head'>diff --git a/fs/fscache/netfs.c b/fs/fscache/netfs.c<br/>deleted file mode 100644<br/>index d6bdb7b5e723..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fscache/netfs.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fscache/netfs.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,74 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='del'>-/* FS-Cache netfs (client) registration</div><div class='del'>- *</div><div class='del'>- * Copyright (C) 2008 Red Hat, Inc. All Rights Reserved.</div><div class='del'>- * Written by David Howells (dhowells@redhat.com)</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#define FSCACHE_DEBUG_LEVEL COOKIE</div><div class='del'>-#include &lt;linux/module.h&gt;</div><div class='del'>-#include &lt;linux/slab.h&gt;</div><div class='del'>-#include "internal.h"</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * register a network filesystem for caching</div><div class='del'>- */</div><div class='del'>-int __fscache_register_netfs(struct fscache_netfs *netfs)</div><div class='del'>-{</div><div class='del'>-	struct fscache_cookie *candidate, *cookie;</div><div class='del'>-</div><div class='del'>-	_enter("{%s}", netfs-&gt;name);</div><div class='del'>-</div><div class='del'>-	/* allocate a cookie for the primary index */</div><div class='del'>-	candidate = fscache_alloc_cookie(&amp;fscache_fsdef_index,</div><div class='del'>-					 &amp;fscache_fsdef_netfs_def,</div><div class='del'>-					 netfs-&gt;name, strlen(netfs-&gt;name),</div><div class='del'>-					 &amp;netfs-&gt;version, sizeof(netfs-&gt;version),</div><div class='del'>-					 netfs, 0);</div><div class='del'>-	if (!candidate) {</div><div class='del'>-		_leave(" = -ENOMEM");</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	candidate-&gt;flags = 1 &lt;&lt; FSCACHE_COOKIE_ENABLED;</div><div class='del'>-</div><div class='del'>-	/* check the netfs type is not already present */</div><div class='del'>-	cookie = fscache_hash_cookie(candidate);</div><div class='del'>-	if (!cookie)</div><div class='del'>-		goto already_registered;</div><div class='del'>-	if (cookie != candidate) {</div><div class='del'>-		trace_fscache_cookie(candidate-&gt;debug_id, 1, fscache_cookie_discard);</div><div class='del'>-		fscache_free_cookie(candidate);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	fscache_cookie_get(cookie-&gt;parent, fscache_cookie_get_register_netfs);</div><div class='del'>-	atomic_inc(&amp;cookie-&gt;parent-&gt;n_children);</div><div class='del'>-</div><div class='del'>-	netfs-&gt;primary_index = cookie;</div><div class='del'>-</div><div class='del'>-	pr_notice("Netfs '%s' registered for caching\n", netfs-&gt;name);</div><div class='del'>-	trace_fscache_netfs(netfs);</div><div class='del'>-	_leave(" = 0");</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-already_registered:</div><div class='del'>-	fscache_cookie_put(candidate, fscache_cookie_put_dup_netfs);</div><div class='del'>-	_leave(" = -EEXIST");</div><div class='del'>-	return -EEXIST;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(__fscache_register_netfs);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * unregister a network filesystem from the cache</div><div class='del'>- * - all cookies must have been released first</div><div class='del'>- */</div><div class='del'>-void __fscache_unregister_netfs(struct fscache_netfs *netfs)</div><div class='del'>-{</div><div class='del'>-	_enter("{%s.%u}", netfs-&gt;name, netfs-&gt;version);</div><div class='del'>-</div><div class='del'>-	fscache_relinquish_cookie(netfs-&gt;primary_index, NULL, false);</div><div class='del'>-	pr_notice("Netfs '%s' unregistered from caching\n", netfs-&gt;name);</div><div class='del'>-</div><div class='del'>-	_leave("");</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(__fscache_unregister_netfs);</div><div class='head'>diff --git a/fs/fscache/object.c b/fs/fscache/object.c<br/>deleted file mode 100644<br/>index 6a675652129b..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fscache/object.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fscache/object.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,1125 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='del'>-/* FS-Cache object state machine handler</div><div class='del'>- *</div><div class='del'>- * Copyright (C) 2007 Red Hat, Inc. All Rights Reserved.</div><div class='del'>- * Written by David Howells (dhowells@redhat.com)</div><div class='del'>- *</div><div class='del'>- * See Documentation/filesystems/caching/object.rst for a description of the</div><div class='del'>- * object state machine and the in-kernel representations.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#define FSCACHE_DEBUG_LEVEL COOKIE</div><div class='del'>-#include &lt;linux/module.h&gt;</div><div class='del'>-#include &lt;linux/slab.h&gt;</div><div class='del'>-#include &lt;linux/prefetch.h&gt;</div><div class='del'>-#include "internal.h"</div><div class='del'>-</div><div class='del'>-static const struct fscache_state *fscache_abort_initialisation(struct fscache_object *, int);</div><div class='del'>-static const struct fscache_state *fscache_kill_dependents(struct fscache_object *, int);</div><div class='del'>-static const struct fscache_state *fscache_drop_object(struct fscache_object *, int);</div><div class='del'>-static const struct fscache_state *fscache_initialise_object(struct fscache_object *, int);</div><div class='del'>-static const struct fscache_state *fscache_invalidate_object(struct fscache_object *, int);</div><div class='del'>-static const struct fscache_state *fscache_jumpstart_dependents(struct fscache_object *, int);</div><div class='del'>-static const struct fscache_state *fscache_kill_object(struct fscache_object *, int);</div><div class='del'>-static const struct fscache_state *fscache_lookup_failure(struct fscache_object *, int);</div><div class='del'>-static const struct fscache_state *fscache_look_up_object(struct fscache_object *, int);</div><div class='del'>-static const struct fscache_state *fscache_object_available(struct fscache_object *, int);</div><div class='del'>-static const struct fscache_state *fscache_parent_ready(struct fscache_object *, int);</div><div class='del'>-static const struct fscache_state *fscache_update_object(struct fscache_object *, int);</div><div class='del'>-static const struct fscache_state *fscache_object_dead(struct fscache_object *, int);</div><div class='del'>-</div><div class='del'>-#define __STATE_NAME(n) fscache_osm_##n</div><div class='del'>-#define STATE(n) (&amp;__STATE_NAME(n))</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Define a work state.  Work states are execution states.  No event processing</div><div class='del'>- * is performed by them.  The function attached to a work state returns a</div><div class='del'>- * pointer indicating the next state to which the state machine should</div><div class='del'>- * transition.  Returning NO_TRANSIT repeats the current state, but goes back</div><div class='del'>- * to the scheduler first.</div><div class='del'>- */</div><div class='del'>-#define WORK_STATE(n, sn, f) \</div><div class='del'>-	const struct fscache_state __STATE_NAME(n) = {			\</div><div class='del'>-		.name = #n,						\</div><div class='del'>-		.short_name = sn,					\</div><div class='del'>-		.work = f						\</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Returns from work states.</div><div class='del'>- */</div><div class='del'>-#define transit_to(state) ({ prefetch(&amp;STATE(state)-&gt;work); STATE(state); })</div><div class='del'>-</div><div class='del'>-#define NO_TRANSIT ((struct fscache_state *)NULL)</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Define a wait state.  Wait states are event processing states.  No execution</div><div class='del'>- * is performed by them.  Wait states are just tables of "if event X occurs,</div><div class='del'>- * clear it and transition to state Y".  The dispatcher returns to the</div><div class='del'>- * scheduler if none of the events in which the wait state has an interest are</div><div class='del'>- * currently pending.</div><div class='del'>- */</div><div class='del'>-#define WAIT_STATE(n, sn, ...) \</div><div class='del'>-	const struct fscache_state __STATE_NAME(n) = {			\</div><div class='del'>-		.name = #n,						\</div><div class='del'>-		.short_name = sn,					\</div><div class='del'>-		.work = NULL,						\</div><div class='del'>-		.transitions = { __VA_ARGS__, { 0, NULL } }		\</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-#define TRANSIT_TO(state, emask) \</div><div class='del'>-	{ .events = (emask), .transit_to = STATE(state) }</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * The object state machine.</div><div class='del'>- */</div><div class='del'>-static WORK_STATE(INIT_OBJECT,		"INIT", fscache_initialise_object);</div><div class='del'>-static WORK_STATE(PARENT_READY,		"PRDY", fscache_parent_ready);</div><div class='del'>-static WORK_STATE(ABORT_INIT,		"ABRT", fscache_abort_initialisation);</div><div class='del'>-static WORK_STATE(LOOK_UP_OBJECT,	"LOOK", fscache_look_up_object);</div><div class='del'>-static WORK_STATE(OBJECT_AVAILABLE,	"AVBL", fscache_object_available);</div><div class='del'>-static WORK_STATE(JUMPSTART_DEPS,	"JUMP", fscache_jumpstart_dependents);</div><div class='del'>-</div><div class='del'>-static WORK_STATE(INVALIDATE_OBJECT,	"INVL", fscache_invalidate_object);</div><div class='del'>-static WORK_STATE(UPDATE_OBJECT,	"UPDT", fscache_update_object);</div><div class='del'>-</div><div class='del'>-static WORK_STATE(LOOKUP_FAILURE,	"LCFL", fscache_lookup_failure);</div><div class='del'>-static WORK_STATE(KILL_OBJECT,		"KILL", fscache_kill_object);</div><div class='del'>-static WORK_STATE(KILL_DEPENDENTS,	"KDEP", fscache_kill_dependents);</div><div class='del'>-static WORK_STATE(DROP_OBJECT,		"DROP", fscache_drop_object);</div><div class='del'>-static WORK_STATE(OBJECT_DEAD,		"DEAD", fscache_object_dead);</div><div class='del'>-</div><div class='del'>-static WAIT_STATE(WAIT_FOR_INIT,	"?INI",</div><div class='del'>-		  TRANSIT_TO(INIT_OBJECT,	1 &lt;&lt; FSCACHE_OBJECT_EV_NEW_CHILD));</div><div class='del'>-</div><div class='del'>-static WAIT_STATE(WAIT_FOR_PARENT,	"?PRN",</div><div class='del'>-		  TRANSIT_TO(PARENT_READY,	1 &lt;&lt; FSCACHE_OBJECT_EV_PARENT_READY));</div><div class='del'>-</div><div class='del'>-static WAIT_STATE(WAIT_FOR_CMD,		"?CMD",</div><div class='del'>-		  TRANSIT_TO(INVALIDATE_OBJECT,	1 &lt;&lt; FSCACHE_OBJECT_EV_INVALIDATE),</div><div class='del'>-		  TRANSIT_TO(UPDATE_OBJECT,	1 &lt;&lt; FSCACHE_OBJECT_EV_UPDATE),</div><div class='del'>-		  TRANSIT_TO(JUMPSTART_DEPS,	1 &lt;&lt; FSCACHE_OBJECT_EV_NEW_CHILD));</div><div class='del'>-</div><div class='del'>-static WAIT_STATE(WAIT_FOR_CLEARANCE,	"?CLR",</div><div class='del'>-		  TRANSIT_TO(KILL_OBJECT,	1 &lt;&lt; FSCACHE_OBJECT_EV_CLEARED));</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Out-of-band event transition tables.  These are for handling unexpected</div><div class='del'>- * events, such as an I/O error.  If an OOB event occurs, the state machine</div><div class='del'>- * clears and disables the event and forces a transition to the nominated work</div><div class='del'>- * state (acurrently executing work states will complete first).</div><div class='del'>- *</div><div class='del'>- * In such a situation, object-&gt;state remembers the state the machine should</div><div class='del'>- * have been in/gone to and returning NO_TRANSIT returns to that.</div><div class='del'>- */</div><div class='del'>-static const struct fscache_transition fscache_osm_init_oob[] = {</div><div class='del'>-	   TRANSIT_TO(ABORT_INIT,</div><div class='del'>-		      (1 &lt;&lt; FSCACHE_OBJECT_EV_ERROR) |</div><div class='del'>-		      (1 &lt;&lt; FSCACHE_OBJECT_EV_KILL)),</div><div class='del'>-	   { 0, NULL }</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static const struct fscache_transition fscache_osm_lookup_oob[] = {</div><div class='del'>-	   TRANSIT_TO(LOOKUP_FAILURE,</div><div class='del'>-		      (1 &lt;&lt; FSCACHE_OBJECT_EV_ERROR) |</div><div class='del'>-		      (1 &lt;&lt; FSCACHE_OBJECT_EV_KILL)),</div><div class='del'>-	   { 0, NULL }</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static const struct fscache_transition fscache_osm_run_oob[] = {</div><div class='del'>-	   TRANSIT_TO(KILL_OBJECT,</div><div class='del'>-		      (1 &lt;&lt; FSCACHE_OBJECT_EV_ERROR) |</div><div class='del'>-		      (1 &lt;&lt; FSCACHE_OBJECT_EV_KILL)),</div><div class='del'>-	   { 0, NULL }</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static int  fscache_get_object(struct fscache_object *,</div><div class='del'>-			       enum fscache_obj_ref_trace);</div><div class='del'>-static void fscache_put_object(struct fscache_object *,</div><div class='del'>-			       enum fscache_obj_ref_trace);</div><div class='del'>-static bool fscache_enqueue_dependents(struct fscache_object *, int);</div><div class='del'>-static void fscache_dequeue_object(struct fscache_object *);</div><div class='del'>-static void fscache_update_aux_data(struct fscache_object *);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * we need to notify the parent when an op completes that we had outstanding</div><div class='del'>- * upon it</div><div class='del'>- */</div><div class='del'>-static inline void fscache_done_parent_op(struct fscache_object *object)</div><div class='del'>-{</div><div class='del'>-	struct fscache_object *parent = object-&gt;parent;</div><div class='del'>-</div><div class='del'>-	_enter("OBJ%x {OBJ%x,%x}",</div><div class='del'>-	       object-&gt;debug_id, parent-&gt;debug_id, parent-&gt;n_ops);</div><div class='del'>-</div><div class='del'>-	spin_lock_nested(&amp;parent-&gt;lock, 1);</div><div class='del'>-	parent-&gt;n_obj_ops--;</div><div class='del'>-	parent-&gt;n_ops--;</div><div class='del'>-	if (parent-&gt;n_ops == 0)</div><div class='del'>-		fscache_raise_event(parent, FSCACHE_OBJECT_EV_CLEARED);</div><div class='del'>-	spin_unlock(&amp;parent-&gt;lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Object state machine dispatcher.</div><div class='del'>- */</div><div class='del'>-static void fscache_object_sm_dispatcher(struct fscache_object *object)</div><div class='del'>-{</div><div class='del'>-	const struct fscache_transition *t;</div><div class='del'>-	const struct fscache_state *state, *new_state;</div><div class='del'>-	unsigned long events, event_mask;</div><div class='del'>-	bool oob;</div><div class='del'>-	int event = -1;</div><div class='del'>-</div><div class='del'>-	ASSERT(object != NULL);</div><div class='del'>-</div><div class='del'>-	_enter("{OBJ%x,%s,%lx}",</div><div class='del'>-	       object-&gt;debug_id, object-&gt;state-&gt;name, object-&gt;events);</div><div class='del'>-</div><div class='del'>-	event_mask = object-&gt;event_mask;</div><div class='del'>-restart:</div><div class='del'>-	object-&gt;event_mask = 0; /* Mask normal event handling */</div><div class='del'>-	state = object-&gt;state;</div><div class='del'>-restart_masked:</div><div class='del'>-	events = object-&gt;events;</div><div class='del'>-</div><div class='del'>-	/* Handle any out-of-band events (typically an error) */</div><div class='del'>-	if (events &amp; object-&gt;oob_event_mask) {</div><div class='del'>-		_debug("{OBJ%x} oob %lx",</div><div class='del'>-		       object-&gt;debug_id, events &amp; object-&gt;oob_event_mask);</div><div class='del'>-		oob = true;</div><div class='del'>-		for (t = object-&gt;oob_table; t-&gt;events; t++) {</div><div class='del'>-			if (events &amp; t-&gt;events) {</div><div class='del'>-				state = t-&gt;transit_to;</div><div class='del'>-				ASSERT(state-&gt;work != NULL);</div><div class='del'>-				event = fls(events &amp; t-&gt;events) - 1;</div><div class='del'>-				__clear_bit(event, &amp;object-&gt;oob_event_mask);</div><div class='del'>-				clear_bit(event, &amp;object-&gt;events);</div><div class='del'>-				goto execute_work_state;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	oob = false;</div><div class='del'>-</div><div class='del'>-	/* Wait states are just transition tables */</div><div class='del'>-	if (!state-&gt;work) {</div><div class='del'>-		if (events &amp; event_mask) {</div><div class='del'>-			for (t = state-&gt;transitions; t-&gt;events; t++) {</div><div class='del'>-				if (events &amp; t-&gt;events) {</div><div class='del'>-					new_state = t-&gt;transit_to;</div><div class='del'>-					event = fls(events &amp; t-&gt;events) - 1;</div><div class='del'>-					trace_fscache_osm(object, state,</div><div class='del'>-							  true, false, event);</div><div class='del'>-					clear_bit(event, &amp;object-&gt;events);</div><div class='del'>-					_debug("{OBJ%x} ev %d: %s -&gt; %s",</div><div class='del'>-					       object-&gt;debug_id, event,</div><div class='del'>-					       state-&gt;name, new_state-&gt;name);</div><div class='del'>-					object-&gt;state = state = new_state;</div><div class='del'>-					goto execute_work_state;</div><div class='del'>-				}</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			/* The event mask didn't include all the tabled bits */</div><div class='del'>-			BUG();</div><div class='del'>-		}</div><div class='del'>-		/* Randomly woke up */</div><div class='del'>-		goto unmask_events;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-execute_work_state:</div><div class='del'>-	_debug("{OBJ%x} exec %s", object-&gt;debug_id, state-&gt;name);</div><div class='del'>-</div><div class='del'>-	trace_fscache_osm(object, state, false, oob, event);</div><div class='del'>-	new_state = state-&gt;work(object, event);</div><div class='del'>-	event = -1;</div><div class='del'>-	if (new_state == NO_TRANSIT) {</div><div class='del'>-		_debug("{OBJ%x} %s notrans", object-&gt;debug_id, state-&gt;name);</div><div class='del'>-		if (unlikely(state == STATE(OBJECT_DEAD))) {</div><div class='del'>-			_leave(" [dead]");</div><div class='del'>-			return;</div><div class='del'>-		}</div><div class='del'>-		fscache_enqueue_object(object);</div><div class='del'>-		event_mask = object-&gt;oob_event_mask;</div><div class='del'>-		goto unmask_events;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	_debug("{OBJ%x} %s -&gt; %s",</div><div class='del'>-	       object-&gt;debug_id, state-&gt;name, new_state-&gt;name);</div><div class='del'>-	object-&gt;state = state = new_state;</div><div class='del'>-</div><div class='del'>-	if (state-&gt;work) {</div><div class='del'>-		if (unlikely(state == STATE(OBJECT_DEAD))) {</div><div class='del'>-			_leave(" [dead]");</div><div class='del'>-			return;</div><div class='del'>-		}</div><div class='del'>-		goto restart_masked;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Transited to wait state */</div><div class='del'>-	event_mask = object-&gt;oob_event_mask;</div><div class='del'>-	for (t = state-&gt;transitions; t-&gt;events; t++)</div><div class='del'>-		event_mask |= t-&gt;events;</div><div class='del'>-</div><div class='del'>-unmask_events:</div><div class='del'>-	object-&gt;event_mask = event_mask;</div><div class='del'>-	smp_mb();</div><div class='del'>-	events = object-&gt;events;</div><div class='del'>-	if (events &amp; event_mask)</div><div class='del'>-		goto restart;</div><div class='del'>-	_leave(" [msk %lx]", event_mask);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * execute an object</div><div class='del'>- */</div><div class='del'>-static void fscache_object_work_func(struct work_struct *work)</div><div class='del'>-{</div><div class='del'>-	struct fscache_object *object =</div><div class='del'>-		container_of(work, struct fscache_object, work);</div><div class='del'>-</div><div class='del'>-	_enter("{OBJ%x}", object-&gt;debug_id);</div><div class='del'>-</div><div class='del'>-	fscache_object_sm_dispatcher(object);</div><div class='del'>-	fscache_put_object(object, fscache_obj_put_work);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * fscache_object_init - Initialise a cache object description</div><div class='del'>- * @object: Object description</div><div class='del'>- * @cookie: Cookie object will be attached to</div><div class='del'>- * @cache: Cache in which backing object will be found</div><div class='del'>- *</div><div class='del'>- * Initialise a cache object description to its basic values.</div><div class='del'>- *</div><div class='del'>- * See Documentation/filesystems/caching/backend-api.rst for a complete</div><div class='del'>- * description.</div><div class='del'>- */</div><div class='del'>-void fscache_object_init(struct fscache_object *object,</div><div class='del'>-			 struct fscache_cookie *cookie,</div><div class='del'>-			 struct fscache_cache *cache)</div><div class='del'>-{</div><div class='del'>-	const struct fscache_transition *t;</div><div class='del'>-</div><div class='del'>-	atomic_inc(&amp;cache-&gt;object_count);</div><div class='del'>-</div><div class='del'>-	object-&gt;state = STATE(WAIT_FOR_INIT);</div><div class='del'>-	object-&gt;oob_table = fscache_osm_init_oob;</div><div class='del'>-	object-&gt;flags = 1 &lt;&lt; FSCACHE_OBJECT_IS_LIVE;</div><div class='del'>-	spin_lock_init(&amp;object-&gt;lock);</div><div class='del'>-	INIT_LIST_HEAD(&amp;object-&gt;cache_link);</div><div class='del'>-	INIT_HLIST_NODE(&amp;object-&gt;cookie_link);</div><div class='del'>-	INIT_WORK(&amp;object-&gt;work, fscache_object_work_func);</div><div class='del'>-	INIT_LIST_HEAD(&amp;object-&gt;dependents);</div><div class='del'>-	INIT_LIST_HEAD(&amp;object-&gt;dep_link);</div><div class='del'>-	INIT_LIST_HEAD(&amp;object-&gt;pending_ops);</div><div class='del'>-	object-&gt;n_children = 0;</div><div class='del'>-	object-&gt;n_ops = object-&gt;n_in_progress = object-&gt;n_exclusive = 0;</div><div class='del'>-	object-&gt;events = 0;</div><div class='del'>-	object-&gt;store_limit = 0;</div><div class='del'>-	object-&gt;store_limit_l = 0;</div><div class='del'>-	object-&gt;cache = cache;</div><div class='del'>-	object-&gt;cookie = cookie;</div><div class='del'>-	fscache_cookie_get(cookie, fscache_cookie_get_attach_object);</div><div class='del'>-	object-&gt;parent = NULL;</div><div class='del'>-#ifdef CONFIG_FSCACHE_OBJECT_LIST</div><div class='del'>-	RB_CLEAR_NODE(&amp;object-&gt;objlist_link);</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-	object-&gt;oob_event_mask = 0;</div><div class='del'>-	for (t = object-&gt;oob_table; t-&gt;events; t++)</div><div class='del'>-		object-&gt;oob_event_mask |= t-&gt;events;</div><div class='del'>-	object-&gt;event_mask = object-&gt;oob_event_mask;</div><div class='del'>-	for (t = object-&gt;state-&gt;transitions; t-&gt;events; t++)</div><div class='del'>-		object-&gt;event_mask |= t-&gt;events;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(fscache_object_init);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Mark the object as no longer being live, making sure that we synchronise</div><div class='del'>- * against op submission.</div><div class='del'>- */</div><div class='del'>-static inline void fscache_mark_object_dead(struct fscache_object *object)</div><div class='del'>-{</div><div class='del'>-	spin_lock(&amp;object-&gt;lock);</div><div class='del'>-	clear_bit(FSCACHE_OBJECT_IS_LIVE, &amp;object-&gt;flags);</div><div class='del'>-	spin_unlock(&amp;object-&gt;lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Abort object initialisation before we start it.</div><div class='del'>- */</div><div class='del'>-static const struct fscache_state *fscache_abort_initialisation(struct fscache_object *object,</div><div class='del'>-								int event)</div><div class='del'>-{</div><div class='del'>-	_enter("{OBJ%x},%d", object-&gt;debug_id, event);</div><div class='del'>-</div><div class='del'>-	object-&gt;oob_event_mask = 0;</div><div class='del'>-	fscache_dequeue_object(object);</div><div class='del'>-	return transit_to(KILL_OBJECT);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * initialise an object</div><div class='del'>- * - check the specified object's parent to see if we can make use of it</div><div class='del'>- *   immediately to do a creation</div><div class='del'>- * - we may need to start the process of creating a parent and we need to wait</div><div class='del'>- *   for the parent's lookup and creation to complete if it's not there yet</div><div class='del'>- */</div><div class='del'>-static const struct fscache_state *fscache_initialise_object(struct fscache_object *object,</div><div class='del'>-							     int event)</div><div class='del'>-{</div><div class='del'>-	struct fscache_object *parent;</div><div class='del'>-	bool success;</div><div class='del'>-</div><div class='del'>-	_enter("{OBJ%x},%d", object-&gt;debug_id, event);</div><div class='del'>-</div><div class='del'>-	ASSERT(list_empty(&amp;object-&gt;dep_link));</div><div class='del'>-</div><div class='del'>-	parent = object-&gt;parent;</div><div class='del'>-	if (!parent) {</div><div class='del'>-		_leave(" [no parent]");</div><div class='del'>-		return transit_to(DROP_OBJECT);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	_debug("parent: %s of:%lx", parent-&gt;state-&gt;name, parent-&gt;flags);</div><div class='del'>-</div><div class='del'>-	if (fscache_object_is_dying(parent)) {</div><div class='del'>-		_leave(" [bad parent]");</div><div class='del'>-		return transit_to(DROP_OBJECT);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (fscache_object_is_available(parent)) {</div><div class='del'>-		_leave(" [ready]");</div><div class='del'>-		return transit_to(PARENT_READY);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	_debug("wait");</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;parent-&gt;lock);</div><div class='del'>-	fscache_stat(&amp;fscache_n_cop_grab_object);</div><div class='del'>-	success = false;</div><div class='del'>-	if (fscache_object_is_live(parent) &amp;&amp;</div><div class='del'>-	    object-&gt;cache-&gt;ops-&gt;grab_object(object, fscache_obj_get_add_to_deps)) {</div><div class='del'>-		list_add(&amp;object-&gt;dep_link, &amp;parent-&gt;dependents);</div><div class='del'>-		success = true;</div><div class='del'>-	}</div><div class='del'>-	fscache_stat_d(&amp;fscache_n_cop_grab_object);</div><div class='del'>-	spin_unlock(&amp;parent-&gt;lock);</div><div class='del'>-	if (!success) {</div><div class='del'>-		_leave(" [grab failed]");</div><div class='del'>-		return transit_to(DROP_OBJECT);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* fscache_acquire_non_index_cookie() uses this</div><div class='del'>-	 * to wake the chain up */</div><div class='del'>-	fscache_raise_event(parent, FSCACHE_OBJECT_EV_NEW_CHILD);</div><div class='del'>-	_leave(" [wait]");</div><div class='del'>-	return transit_to(WAIT_FOR_PARENT);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Once the parent object is ready, we should kick off our lookup op.</div><div class='del'>- */</div><div class='del'>-static const struct fscache_state *fscache_parent_ready(struct fscache_object *object,</div><div class='del'>-							int event)</div><div class='del'>-{</div><div class='del'>-	struct fscache_object *parent = object-&gt;parent;</div><div class='del'>-</div><div class='del'>-	_enter("{OBJ%x},%d", object-&gt;debug_id, event);</div><div class='del'>-</div><div class='del'>-	ASSERT(parent != NULL);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;parent-&gt;lock);</div><div class='del'>-	parent-&gt;n_ops++;</div><div class='del'>-	parent-&gt;n_obj_ops++;</div><div class='del'>-	spin_unlock(&amp;parent-&gt;lock);</div><div class='del'>-</div><div class='del'>-	_leave("");</div><div class='del'>-	return transit_to(LOOK_UP_OBJECT);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * look an object up in the cache from which it was allocated</div><div class='del'>- * - we hold an "access lock" on the parent object, so the parent object cannot</div><div class='del'>- *   be withdrawn by either party till we've finished</div><div class='del'>- */</div><div class='del'>-static const struct fscache_state *fscache_look_up_object(struct fscache_object *object,</div><div class='del'>-							  int event)</div><div class='del'>-{</div><div class='del'>-	struct fscache_cookie *cookie = object-&gt;cookie;</div><div class='del'>-	struct fscache_object *parent = object-&gt;parent;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	_enter("{OBJ%x},%d", object-&gt;debug_id, event);</div><div class='del'>-</div><div class='del'>-	object-&gt;oob_table = fscache_osm_lookup_oob;</div><div class='del'>-</div><div class='del'>-	ASSERT(parent != NULL);</div><div class='del'>-	ASSERTCMP(parent-&gt;n_ops, &gt;, 0);</div><div class='del'>-	ASSERTCMP(parent-&gt;n_obj_ops, &gt;, 0);</div><div class='del'>-</div><div class='del'>-	/* make sure the parent is still available */</div><div class='del'>-	ASSERT(fscache_object_is_available(parent));</div><div class='del'>-</div><div class='del'>-	if (fscache_object_is_dying(parent) ||</div><div class='del'>-	    test_bit(FSCACHE_IOERROR, &amp;object-&gt;cache-&gt;flags) ||</div><div class='del'>-	    !fscache_use_cookie(object)) {</div><div class='del'>-		_leave(" [unavailable]");</div><div class='del'>-		return transit_to(LOOKUP_FAILURE);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	_debug("LOOKUP \"%s\" in \"%s\"",</div><div class='del'>-	       cookie-&gt;def-&gt;name, object-&gt;cache-&gt;tag-&gt;name);</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_object_lookups);</div><div class='del'>-	fscache_stat(&amp;fscache_n_cop_lookup_object);</div><div class='del'>-	ret = object-&gt;cache-&gt;ops-&gt;lookup_object(object);</div><div class='del'>-	fscache_stat_d(&amp;fscache_n_cop_lookup_object);</div><div class='del'>-</div><div class='del'>-	fscache_unuse_cookie(object);</div><div class='del'>-</div><div class='del'>-	if (ret == -ETIMEDOUT) {</div><div class='del'>-		/* probably stuck behind another object, so move this one to</div><div class='del'>-		 * the back of the queue */</div><div class='del'>-		fscache_stat(&amp;fscache_n_object_lookups_timed_out);</div><div class='del'>-		_leave(" [timeout]");</div><div class='del'>-		return NO_TRANSIT;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		_leave(" [error]");</div><div class='del'>-		return transit_to(LOOKUP_FAILURE);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	_leave(" [ok]");</div><div class='del'>-	return transit_to(OBJECT_AVAILABLE);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * fscache_object_lookup_negative - Note negative cookie lookup</div><div class='del'>- * @object: Object pointing to cookie to mark</div><div class='del'>- *</div><div class='del'>- * Note negative lookup, permitting those waiting to read data from an already</div><div class='del'>- * existing backing object to continue as there's no data for them to read.</div><div class='del'>- */</div><div class='del'>-void fscache_object_lookup_negative(struct fscache_object *object)</div><div class='del'>-{</div><div class='del'>-	struct fscache_cookie *cookie = object-&gt;cookie;</div><div class='del'>-</div><div class='del'>-	_enter("{OBJ%x,%s}", object-&gt;debug_id, object-&gt;state-&gt;name);</div><div class='del'>-</div><div class='del'>-	if (!test_and_set_bit(FSCACHE_OBJECT_IS_LOOKED_UP, &amp;object-&gt;flags)) {</div><div class='del'>-		fscache_stat(&amp;fscache_n_object_lookups_negative);</div><div class='del'>-</div><div class='del'>-		/* Allow write requests to begin stacking up and read requests to begin</div><div class='del'>-		 * returning ENODATA.</div><div class='del'>-		 */</div><div class='del'>-		set_bit(FSCACHE_COOKIE_NO_DATA_YET, &amp;cookie-&gt;flags);</div><div class='del'>-		clear_bit(FSCACHE_COOKIE_UNAVAILABLE, &amp;cookie-&gt;flags);</div><div class='del'>-</div><div class='del'>-		clear_bit_unlock(FSCACHE_COOKIE_LOOKING_UP, &amp;cookie-&gt;flags);</div><div class='del'>-		wake_up_bit(&amp;cookie-&gt;flags, FSCACHE_COOKIE_LOOKING_UP);</div><div class='del'>-	}</div><div class='del'>-	_leave("");</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(fscache_object_lookup_negative);</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * fscache_obtained_object - Note successful object lookup or creation</div><div class='del'>- * @object: Object pointing to cookie to mark</div><div class='del'>- *</div><div class='del'>- * Note successful lookup and/or creation, permitting those waiting to write</div><div class='del'>- * data to a backing object to continue.</div><div class='del'>- *</div><div class='del'>- * Note that after calling this, an object's cookie may be relinquished by the</div><div class='del'>- * netfs, and so must be accessed with object lock held.</div><div class='del'>- */</div><div class='del'>-void fscache_obtained_object(struct fscache_object *object)</div><div class='del'>-{</div><div class='del'>-	struct fscache_cookie *cookie = object-&gt;cookie;</div><div class='del'>-</div><div class='del'>-	_enter("{OBJ%x,%s}", object-&gt;debug_id, object-&gt;state-&gt;name);</div><div class='del'>-</div><div class='del'>-	/* if we were still looking up, then we must have a positive lookup</div><div class='del'>-	 * result, in which case there may be data available */</div><div class='del'>-	if (!test_and_set_bit(FSCACHE_OBJECT_IS_LOOKED_UP, &amp;object-&gt;flags)) {</div><div class='del'>-		fscache_stat(&amp;fscache_n_object_lookups_positive);</div><div class='del'>-</div><div class='del'>-		/* We do (presumably) have data */</div><div class='del'>-		clear_bit_unlock(FSCACHE_COOKIE_NO_DATA_YET, &amp;cookie-&gt;flags);</div><div class='del'>-		clear_bit(FSCACHE_COOKIE_UNAVAILABLE, &amp;cookie-&gt;flags);</div><div class='del'>-</div><div class='del'>-		/* Allow write requests to begin stacking up and read requests</div><div class='del'>-		 * to begin shovelling data.</div><div class='del'>-		 */</div><div class='del'>-		clear_bit_unlock(FSCACHE_COOKIE_LOOKING_UP, &amp;cookie-&gt;flags);</div><div class='del'>-		wake_up_bit(&amp;cookie-&gt;flags, FSCACHE_COOKIE_LOOKING_UP);</div><div class='del'>-	} else {</div><div class='del'>-		fscache_stat(&amp;fscache_n_object_created);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	set_bit(FSCACHE_OBJECT_IS_AVAILABLE, &amp;object-&gt;flags);</div><div class='del'>-	_leave("");</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(fscache_obtained_object);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * handle an object that has just become available</div><div class='del'>- */</div><div class='del'>-static const struct fscache_state *fscache_object_available(struct fscache_object *object,</div><div class='del'>-							    int event)</div><div class='del'>-{</div><div class='del'>-	_enter("{OBJ%x},%d", object-&gt;debug_id, event);</div><div class='del'>-</div><div class='del'>-	object-&gt;oob_table = fscache_osm_run_oob;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;object-&gt;lock);</div><div class='del'>-</div><div class='del'>-	fscache_done_parent_op(object);</div><div class='del'>-	if (object-&gt;n_in_progress == 0) {</div><div class='del'>-		if (object-&gt;n_ops &gt; 0) {</div><div class='del'>-			ASSERTCMP(object-&gt;n_ops, &gt;=, object-&gt;n_obj_ops);</div><div class='del'>-			fscache_start_operations(object);</div><div class='del'>-		} else {</div><div class='del'>-			ASSERT(list_empty(&amp;object-&gt;pending_ops));</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;object-&gt;lock);</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_cop_lookup_complete);</div><div class='del'>-	object-&gt;cache-&gt;ops-&gt;lookup_complete(object);</div><div class='del'>-	fscache_stat_d(&amp;fscache_n_cop_lookup_complete);</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_object_avail);</div><div class='del'>-</div><div class='del'>-	_leave("");</div><div class='del'>-	return transit_to(JUMPSTART_DEPS);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Wake up this object's dependent objects now that we've become available.</div><div class='del'>- */</div><div class='del'>-static const struct fscache_state *fscache_jumpstart_dependents(struct fscache_object *object,</div><div class='del'>-								int event)</div><div class='del'>-{</div><div class='del'>-	_enter("{OBJ%x},%d", object-&gt;debug_id, event);</div><div class='del'>-</div><div class='del'>-	if (!fscache_enqueue_dependents(object, FSCACHE_OBJECT_EV_PARENT_READY))</div><div class='del'>-		return NO_TRANSIT; /* Not finished; requeue */</div><div class='del'>-	return transit_to(WAIT_FOR_CMD);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Handle lookup or creation failute.</div><div class='del'>- */</div><div class='del'>-static const struct fscache_state *fscache_lookup_failure(struct fscache_object *object,</div><div class='del'>-							  int event)</div><div class='del'>-{</div><div class='del'>-	struct fscache_cookie *cookie;</div><div class='del'>-</div><div class='del'>-	_enter("{OBJ%x},%d", object-&gt;debug_id, event);</div><div class='del'>-</div><div class='del'>-	object-&gt;oob_event_mask = 0;</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_cop_lookup_complete);</div><div class='del'>-	object-&gt;cache-&gt;ops-&gt;lookup_complete(object);</div><div class='del'>-	fscache_stat_d(&amp;fscache_n_cop_lookup_complete);</div><div class='del'>-</div><div class='del'>-	set_bit(FSCACHE_OBJECT_KILLED_BY_CACHE, &amp;object-&gt;flags);</div><div class='del'>-</div><div class='del'>-	cookie = object-&gt;cookie;</div><div class='del'>-	set_bit(FSCACHE_COOKIE_UNAVAILABLE, &amp;cookie-&gt;flags);</div><div class='del'>-	if (test_and_clear_bit(FSCACHE_COOKIE_LOOKING_UP, &amp;cookie-&gt;flags))</div><div class='del'>-		wake_up_bit(&amp;cookie-&gt;flags, FSCACHE_COOKIE_LOOKING_UP);</div><div class='del'>-</div><div class='del'>-	fscache_done_parent_op(object);</div><div class='del'>-	return transit_to(KILL_OBJECT);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Wait for completion of all active operations on this object and the death of</div><div class='del'>- * all child objects of this object.</div><div class='del'>- */</div><div class='del'>-static const struct fscache_state *fscache_kill_object(struct fscache_object *object,</div><div class='del'>-						       int event)</div><div class='del'>-{</div><div class='del'>-	_enter("{OBJ%x,%d,%d},%d",</div><div class='del'>-	       object-&gt;debug_id, object-&gt;n_ops, object-&gt;n_children, event);</div><div class='del'>-</div><div class='del'>-	fscache_mark_object_dead(object);</div><div class='del'>-	object-&gt;oob_event_mask = 0;</div><div class='del'>-</div><div class='del'>-	if (test_bit(FSCACHE_OBJECT_RETIRED, &amp;object-&gt;flags)) {</div><div class='del'>-		/* Reject any new read/write ops and abort any that are pending. */</div><div class='del'>-		clear_bit(FSCACHE_OBJECT_PENDING_WRITE, &amp;object-&gt;flags);</div><div class='del'>-		fscache_cancel_all_ops(object);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (list_empty(&amp;object-&gt;dependents) &amp;&amp;</div><div class='del'>-	    object-&gt;n_ops == 0 &amp;&amp;</div><div class='del'>-	    object-&gt;n_children == 0)</div><div class='del'>-		return transit_to(DROP_OBJECT);</div><div class='del'>-</div><div class='del'>-	if (object-&gt;n_in_progress == 0) {</div><div class='del'>-		spin_lock(&amp;object-&gt;lock);</div><div class='del'>-		if (object-&gt;n_ops &gt; 0 &amp;&amp; object-&gt;n_in_progress == 0)</div><div class='del'>-			fscache_start_operations(object);</div><div class='del'>-		spin_unlock(&amp;object-&gt;lock);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!list_empty(&amp;object-&gt;dependents))</div><div class='del'>-		return transit_to(KILL_DEPENDENTS);</div><div class='del'>-</div><div class='del'>-	return transit_to(WAIT_FOR_CLEARANCE);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Kill dependent objects.</div><div class='del'>- */</div><div class='del'>-static const struct fscache_state *fscache_kill_dependents(struct fscache_object *object,</div><div class='del'>-							   int event)</div><div class='del'>-{</div><div class='del'>-	_enter("{OBJ%x},%d", object-&gt;debug_id, event);</div><div class='del'>-</div><div class='del'>-	if (!fscache_enqueue_dependents(object, FSCACHE_OBJECT_EV_KILL))</div><div class='del'>-		return NO_TRANSIT; /* Not finished */</div><div class='del'>-	return transit_to(WAIT_FOR_CLEARANCE);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Drop an object's attachments</div><div class='del'>- */</div><div class='del'>-static const struct fscache_state *fscache_drop_object(struct fscache_object *object,</div><div class='del'>-						       int event)</div><div class='del'>-{</div><div class='del'>-	struct fscache_object *parent = object-&gt;parent;</div><div class='del'>-	struct fscache_cookie *cookie = object-&gt;cookie;</div><div class='del'>-	struct fscache_cache *cache = object-&gt;cache;</div><div class='del'>-	bool awaken = false;</div><div class='del'>-</div><div class='del'>-	_enter("{OBJ%x,%d},%d", object-&gt;debug_id, object-&gt;n_children, event);</div><div class='del'>-</div><div class='del'>-	ASSERT(cookie != NULL);</div><div class='del'>-	ASSERT(!hlist_unhashed(&amp;object-&gt;cookie_link));</div><div class='del'>-</div><div class='del'>-	if (test_bit(FSCACHE_COOKIE_AUX_UPDATED, &amp;cookie-&gt;flags)) {</div><div class='del'>-		_debug("final update");</div><div class='del'>-		fscache_update_aux_data(object);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Make sure the cookie no longer points here and that the netfs isn't</div><div class='del'>-	 * waiting for us.</div><div class='del'>-	 */</div><div class='del'>-	spin_lock(&amp;cookie-&gt;lock);</div><div class='del'>-	hlist_del_init(&amp;object-&gt;cookie_link);</div><div class='del'>-	if (hlist_empty(&amp;cookie-&gt;backing_objects) &amp;&amp;</div><div class='del'>-	    test_and_clear_bit(FSCACHE_COOKIE_INVALIDATING, &amp;cookie-&gt;flags))</div><div class='del'>-		awaken = true;</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-</div><div class='del'>-	if (awaken)</div><div class='del'>-		wake_up_bit(&amp;cookie-&gt;flags, FSCACHE_COOKIE_INVALIDATING);</div><div class='del'>-	if (test_and_clear_bit(FSCACHE_COOKIE_LOOKING_UP, &amp;cookie-&gt;flags))</div><div class='del'>-		wake_up_bit(&amp;cookie-&gt;flags, FSCACHE_COOKIE_LOOKING_UP);</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-	/* Prevent a race with our last child, which has to signal EV_CLEARED</div><div class='del'>-	 * before dropping our spinlock.</div><div class='del'>-	 */</div><div class='del'>-	spin_lock(&amp;object-&gt;lock);</div><div class='del'>-	spin_unlock(&amp;object-&gt;lock);</div><div class='del'>-</div><div class='del'>-	/* Discard from the cache's collection of objects */</div><div class='del'>-	spin_lock(&amp;cache-&gt;object_list_lock);</div><div class='del'>-	list_del_init(&amp;object-&gt;cache_link);</div><div class='del'>-	spin_unlock(&amp;cache-&gt;object_list_lock);</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_cop_drop_object);</div><div class='del'>-	cache-&gt;ops-&gt;drop_object(object);</div><div class='del'>-	fscache_stat_d(&amp;fscache_n_cop_drop_object);</div><div class='del'>-</div><div class='del'>-	/* The parent object wants to know when all it dependents have gone */</div><div class='del'>-	if (parent) {</div><div class='del'>-		_debug("release parent OBJ%x {%d}",</div><div class='del'>-		       parent-&gt;debug_id, parent-&gt;n_children);</div><div class='del'>-</div><div class='del'>-		spin_lock(&amp;parent-&gt;lock);</div><div class='del'>-		parent-&gt;n_children--;</div><div class='del'>-		if (parent-&gt;n_children == 0)</div><div class='del'>-			fscache_raise_event(parent, FSCACHE_OBJECT_EV_CLEARED);</div><div class='del'>-		spin_unlock(&amp;parent-&gt;lock);</div><div class='del'>-		object-&gt;parent = NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* this just shifts the object release to the work processor */</div><div class='del'>-	fscache_put_object(object, fscache_obj_put_drop_obj);</div><div class='del'>-	fscache_stat(&amp;fscache_n_object_dead);</div><div class='del'>-</div><div class='del'>-	_leave("");</div><div class='del'>-	return transit_to(OBJECT_DEAD);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * get a ref on an object</div><div class='del'>- */</div><div class='del'>-static int fscache_get_object(struct fscache_object *object,</div><div class='del'>-			      enum fscache_obj_ref_trace why)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_cop_grab_object);</div><div class='del'>-	ret = object-&gt;cache-&gt;ops-&gt;grab_object(object, why) ? 0 : -EAGAIN;</div><div class='del'>-	fscache_stat_d(&amp;fscache_n_cop_grab_object);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Discard a ref on an object</div><div class='del'>- */</div><div class='del'>-static void fscache_put_object(struct fscache_object *object,</div><div class='del'>-			       enum fscache_obj_ref_trace why)</div><div class='del'>-{</div><div class='del'>-	fscache_stat(&amp;fscache_n_cop_put_object);</div><div class='del'>-	object-&gt;cache-&gt;ops-&gt;put_object(object, why);</div><div class='del'>-	fscache_stat_d(&amp;fscache_n_cop_put_object);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * fscache_object_destroy - Note that a cache object is about to be destroyed</div><div class='del'>- * @object: The object to be destroyed</div><div class='del'>- *</div><div class='del'>- * Note the imminent destruction and deallocation of a cache object record.</div><div class='del'>- */</div><div class='del'>-void fscache_object_destroy(struct fscache_object *object)</div><div class='del'>-{</div><div class='del'>-	/* We can get rid of the cookie now */</div><div class='del'>-	fscache_cookie_put(object-&gt;cookie, fscache_cookie_put_object);</div><div class='del'>-	object-&gt;cookie = NULL;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(fscache_object_destroy);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * enqueue an object for metadata-type processing</div><div class='del'>- */</div><div class='del'>-void fscache_enqueue_object(struct fscache_object *object)</div><div class='del'>-{</div><div class='del'>-	_enter("{OBJ%x}", object-&gt;debug_id);</div><div class='del'>-</div><div class='del'>-	if (fscache_get_object(object, fscache_obj_get_queue) &gt;= 0) {</div><div class='del'>-		wait_queue_head_t *cong_wq =</div><div class='del'>-			&amp;get_cpu_var(fscache_object_cong_wait);</div><div class='del'>-</div><div class='del'>-		if (queue_work(fscache_object_wq, &amp;object-&gt;work)) {</div><div class='del'>-			if (fscache_object_congested())</div><div class='del'>-				wake_up(cong_wq);</div><div class='del'>-		} else</div><div class='del'>-			fscache_put_object(object, fscache_obj_put_queue);</div><div class='del'>-</div><div class='del'>-		put_cpu_var(fscache_object_cong_wait);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * fscache_object_sleep_till_congested - Sleep until object wq is congested</div><div class='del'>- * @timeoutp: Scheduler sleep timeout</div><div class='del'>- *</div><div class='del'>- * Allow an object handler to sleep until the object workqueue is congested.</div><div class='del'>- *</div><div class='del'>- * The caller must set up a wake up event before calling this and must have set</div><div class='del'>- * the appropriate sleep mode (such as TASK_UNINTERRUPTIBLE) and tested its own</div><div class='del'>- * condition before calling this function as no test is made here.</div><div class='del'>- *</div><div class='del'>- * %true is returned if the object wq is congested, %false otherwise.</div><div class='del'>- */</div><div class='del'>-bool fscache_object_sleep_till_congested(signed long *timeoutp)</div><div class='del'>-{</div><div class='del'>-	wait_queue_head_t *cong_wq = this_cpu_ptr(&amp;fscache_object_cong_wait);</div><div class='del'>-	DEFINE_WAIT(wait);</div><div class='del'>-</div><div class='del'>-	if (fscache_object_congested())</div><div class='del'>-		return true;</div><div class='del'>-</div><div class='del'>-	add_wait_queue_exclusive(cong_wq, &amp;wait);</div><div class='del'>-	if (!fscache_object_congested())</div><div class='del'>-		*timeoutp = schedule_timeout(*timeoutp);</div><div class='del'>-	finish_wait(cong_wq, &amp;wait);</div><div class='del'>-</div><div class='del'>-	return fscache_object_congested();</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL_GPL(fscache_object_sleep_till_congested);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Enqueue the dependents of an object for metadata-type processing.</div><div class='del'>- *</div><div class='del'>- * If we don't manage to finish the list before the scheduler wants to run</div><div class='del'>- * again then return false immediately.  We return true if the list was</div><div class='del'>- * cleared.</div><div class='del'>- */</div><div class='del'>-static bool fscache_enqueue_dependents(struct fscache_object *object, int event)</div><div class='del'>-{</div><div class='del'>-	struct fscache_object *dep;</div><div class='del'>-	bool ret = true;</div><div class='del'>-</div><div class='del'>-	_enter("{OBJ%x}", object-&gt;debug_id);</div><div class='del'>-</div><div class='del'>-	if (list_empty(&amp;object-&gt;dependents))</div><div class='del'>-		return true;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;object-&gt;lock);</div><div class='del'>-</div><div class='del'>-	while (!list_empty(&amp;object-&gt;dependents)) {</div><div class='del'>-		dep = list_entry(object-&gt;dependents.next,</div><div class='del'>-				 struct fscache_object, dep_link);</div><div class='del'>-		list_del_init(&amp;dep-&gt;dep_link);</div><div class='del'>-</div><div class='del'>-		fscache_raise_event(dep, event);</div><div class='del'>-		fscache_put_object(dep, fscache_obj_put_enq_dep);</div><div class='del'>-</div><div class='del'>-		if (!list_empty(&amp;object-&gt;dependents) &amp;&amp; need_resched()) {</div><div class='del'>-			ret = false;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_unlock(&amp;object-&gt;lock);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * remove an object from whatever queue it's waiting on</div><div class='del'>- */</div><div class='del'>-static void fscache_dequeue_object(struct fscache_object *object)</div><div class='del'>-{</div><div class='del'>-	_enter("{OBJ%x}", object-&gt;debug_id);</div><div class='del'>-</div><div class='del'>-	if (!list_empty(&amp;object-&gt;dep_link)) {</div><div class='del'>-		spin_lock(&amp;object-&gt;parent-&gt;lock);</div><div class='del'>-		list_del_init(&amp;object-&gt;dep_link);</div><div class='del'>-		spin_unlock(&amp;object-&gt;parent-&gt;lock);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	_leave("");</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * fscache_check_aux - Ask the netfs whether an object on disk is still valid</div><div class='del'>- * @object: The object to ask about</div><div class='del'>- * @data: The auxiliary data for the object</div><div class='del'>- * @datalen: The size of the auxiliary data</div><div class='del'>- * @object_size: The size of the object according to the server.</div><div class='del'>- *</div><div class='del'>- * This function consults the netfs about the coherency state of an object.</div><div class='del'>- * The caller must be holding a ref on cookie-&gt;n_active (held by</div><div class='del'>- * fscache_look_up_object() on behalf of the cache backend during object lookup</div><div class='del'>- * and creation).</div><div class='del'>- */</div><div class='del'>-enum fscache_checkaux fscache_check_aux(struct fscache_object *object,</div><div class='del'>-					const void *data, uint16_t datalen,</div><div class='del'>-					loff_t object_size)</div><div class='del'>-{</div><div class='del'>-	enum fscache_checkaux result;</div><div class='del'>-</div><div class='del'>-	if (!object-&gt;cookie-&gt;def-&gt;check_aux) {</div><div class='del'>-		fscache_stat(&amp;fscache_n_checkaux_none);</div><div class='del'>-		return FSCACHE_CHECKAUX_OKAY;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	result = object-&gt;cookie-&gt;def-&gt;check_aux(object-&gt;cookie-&gt;netfs_data,</div><div class='del'>-						data, datalen, object_size);</div><div class='del'>-	switch (result) {</div><div class='del'>-		/* entry okay as is */</div><div class='del'>-	case FSCACHE_CHECKAUX_OKAY:</div><div class='del'>-		fscache_stat(&amp;fscache_n_checkaux_okay);</div><div class='del'>-		break;</div><div class='del'>-</div><div class='del'>-		/* entry requires update */</div><div class='del'>-	case FSCACHE_CHECKAUX_NEEDS_UPDATE:</div><div class='del'>-		fscache_stat(&amp;fscache_n_checkaux_update);</div><div class='del'>-		break;</div><div class='del'>-</div><div class='del'>-		/* entry requires deletion */</div><div class='del'>-	case FSCACHE_CHECKAUX_OBSOLETE:</div><div class='del'>-		fscache_stat(&amp;fscache_n_checkaux_obsolete);</div><div class='del'>-		break;</div><div class='del'>-</div><div class='del'>-	default:</div><div class='del'>-		BUG();</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return result;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(fscache_check_aux);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Asynchronously invalidate an object.</div><div class='del'>- */</div><div class='del'>-static const struct fscache_state *_fscache_invalidate_object(struct fscache_object *object,</div><div class='del'>-							      int event)</div><div class='del'>-{</div><div class='del'>-	struct fscache_operation *op;</div><div class='del'>-	struct fscache_cookie *cookie = object-&gt;cookie;</div><div class='del'>-</div><div class='del'>-	_enter("{OBJ%x},%d", object-&gt;debug_id, event);</div><div class='del'>-</div><div class='del'>-	/* We're going to need the cookie.  If the cookie is not available then</div><div class='del'>-	 * retire the object instead.</div><div class='del'>-	 */</div><div class='del'>-	if (!fscache_use_cookie(object)) {</div><div class='del'>-		ASSERT(radix_tree_empty(&amp;object-&gt;cookie-&gt;stores));</div><div class='del'>-		set_bit(FSCACHE_OBJECT_RETIRED, &amp;object-&gt;flags);</div><div class='del'>-		_leave(" [no cookie]");</div><div class='del'>-		return transit_to(KILL_OBJECT);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Reject any new read/write ops and abort any that are pending. */</div><div class='del'>-	fscache_invalidate_writes(cookie);</div><div class='del'>-	clear_bit(FSCACHE_OBJECT_PENDING_WRITE, &amp;object-&gt;flags);</div><div class='del'>-	fscache_cancel_all_ops(object);</div><div class='del'>-</div><div class='del'>-	/* Now we have to wait for in-progress reads and writes */</div><div class='del'>-	op = kzalloc(sizeof(*op), GFP_KERNEL);</div><div class='del'>-	if (!op)</div><div class='del'>-		goto nomem;</div><div class='del'>-</div><div class='del'>-	fscache_operation_init(cookie, op, object-&gt;cache-&gt;ops-&gt;invalidate_object,</div><div class='del'>-			       NULL, NULL);</div><div class='del'>-	op-&gt;flags = FSCACHE_OP_ASYNC |</div><div class='del'>-		(1 &lt;&lt; FSCACHE_OP_EXCLUSIVE) |</div><div class='del'>-		(1 &lt;&lt; FSCACHE_OP_UNUSE_COOKIE);</div><div class='del'>-	trace_fscache_page_op(cookie, NULL, op, fscache_page_op_invalidate);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;cookie-&gt;lock);</div><div class='del'>-	if (fscache_submit_exclusive_op(object, op) &lt; 0)</div><div class='del'>-		goto submit_op_failed;</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-	fscache_put_operation(op);</div><div class='del'>-</div><div class='del'>-	/* Once we've completed the invalidation, we know there will be no data</div><div class='del'>-	 * stored in the cache and thus we can reinstate the data-check-skip</div><div class='del'>-	 * optimisation.</div><div class='del'>-	 */</div><div class='del'>-	set_bit(FSCACHE_COOKIE_NO_DATA_YET, &amp;cookie-&gt;flags);</div><div class='del'>-</div><div class='del'>-	/* We can allow read and write requests to come in once again.  They'll</div><div class='del'>-	 * queue up behind our exclusive invalidation operation.</div><div class='del'>-	 */</div><div class='del'>-	if (test_and_clear_bit(FSCACHE_COOKIE_INVALIDATING, &amp;cookie-&gt;flags))</div><div class='del'>-		wake_up_bit(&amp;cookie-&gt;flags, FSCACHE_COOKIE_INVALIDATING);</div><div class='del'>-	_leave(" [ok]");</div><div class='del'>-	return transit_to(UPDATE_OBJECT);</div><div class='del'>-</div><div class='del'>-nomem:</div><div class='del'>-	fscache_mark_object_dead(object);</div><div class='del'>-	fscache_unuse_cookie(object);</div><div class='del'>-	_leave(" [ENOMEM]");</div><div class='del'>-	return transit_to(KILL_OBJECT);</div><div class='del'>-</div><div class='del'>-submit_op_failed:</div><div class='del'>-	fscache_mark_object_dead(object);</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-	fscache_unuse_cookie(object);</div><div class='del'>-	kfree(op);</div><div class='del'>-	_leave(" [EIO]");</div><div class='del'>-	return transit_to(KILL_OBJECT);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static const struct fscache_state *fscache_invalidate_object(struct fscache_object *object,</div><div class='del'>-							     int event)</div><div class='del'>-{</div><div class='del'>-	const struct fscache_state *s;</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_invalidates_run);</div><div class='del'>-	fscache_stat(&amp;fscache_n_cop_invalidate_object);</div><div class='del'>-	s = _fscache_invalidate_object(object, event);</div><div class='del'>-	fscache_stat_d(&amp;fscache_n_cop_invalidate_object);</div><div class='del'>-	return s;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Update auxiliary data.</div><div class='del'>- */</div><div class='del'>-static void fscache_update_aux_data(struct fscache_object *object)</div><div class='del'>-{</div><div class='del'>-	fscache_stat(&amp;fscache_n_updates_run);</div><div class='del'>-	fscache_stat(&amp;fscache_n_cop_update_object);</div><div class='del'>-	object-&gt;cache-&gt;ops-&gt;update_object(object);</div><div class='del'>-	fscache_stat_d(&amp;fscache_n_cop_update_object);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Asynchronously update an object.</div><div class='del'>- */</div><div class='del'>-static const struct fscache_state *fscache_update_object(struct fscache_object *object,</div><div class='del'>-							 int event)</div><div class='del'>-{</div><div class='del'>-	_enter("{OBJ%x},%d", object-&gt;debug_id, event);</div><div class='del'>-</div><div class='del'>-	fscache_update_aux_data(object);</div><div class='del'>-</div><div class='del'>-	_leave("");</div><div class='del'>-	return transit_to(WAIT_FOR_CMD);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * fscache_object_retrying_stale - Note retrying stale object</div><div class='del'>- * @object: The object that will be retried</div><div class='del'>- *</div><div class='del'>- * Note that an object lookup found an on-disk object that was adjudged to be</div><div class='del'>- * stale and has been deleted.  The lookup will be retried.</div><div class='del'>- */</div><div class='del'>-void fscache_object_retrying_stale(struct fscache_object *object)</div><div class='del'>-{</div><div class='del'>-	fscache_stat(&amp;fscache_n_cache_no_space_reject);</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(fscache_object_retrying_stale);</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * fscache_object_mark_killed - Note that an object was killed</div><div class='del'>- * @object: The object that was culled</div><div class='del'>- * @why: The reason the object was killed.</div><div class='del'>- *</div><div class='del'>- * Note that an object was killed.  Returns true if the object was</div><div class='del'>- * already marked killed, false if it wasn't.</div><div class='del'>- */</div><div class='del'>-void fscache_object_mark_killed(struct fscache_object *object,</div><div class='del'>-				enum fscache_why_object_killed why)</div><div class='del'>-{</div><div class='del'>-	if (test_and_set_bit(FSCACHE_OBJECT_KILLED_BY_CACHE, &amp;object-&gt;flags)) {</div><div class='del'>-		pr_err("Error: Object already killed by cache [%s]\n",</div><div class='del'>-		       object-&gt;cache-&gt;identifier);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	switch (why) {</div><div class='del'>-	case FSCACHE_OBJECT_NO_SPACE:</div><div class='del'>-		fscache_stat(&amp;fscache_n_cache_no_space_reject);</div><div class='del'>-		break;</div><div class='del'>-	case FSCACHE_OBJECT_IS_STALE:</div><div class='del'>-		fscache_stat(&amp;fscache_n_cache_stale_objects);</div><div class='del'>-		break;</div><div class='del'>-	case FSCACHE_OBJECT_WAS_RETIRED:</div><div class='del'>-		fscache_stat(&amp;fscache_n_cache_retired_objects);</div><div class='del'>-		break;</div><div class='del'>-	case FSCACHE_OBJECT_WAS_CULLED:</div><div class='del'>-		fscache_stat(&amp;fscache_n_cache_culled_objects);</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(fscache_object_mark_killed);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * The object is dead.  We can get here if an object gets queued by an event</div><div class='del'>- * that would lead to its death (such as EV_KILL) when the dispatcher is</div><div class='del'>- * already running (and so can be requeued) but hasn't yet cleared the event</div><div class='del'>- * mask.</div><div class='del'>- */</div><div class='del'>-static const struct fscache_state *fscache_object_dead(struct fscache_object *object,</div><div class='del'>-						       int event)</div><div class='del'>-{</div><div class='del'>-	if (!test_and_set_bit(FSCACHE_OBJECT_RUN_AFTER_DEAD,</div><div class='del'>-			      &amp;object-&gt;flags))</div><div class='del'>-		return NO_TRANSIT;</div><div class='del'>-</div><div class='del'>-	WARN(true, "FS-Cache object redispatched after death");</div><div class='del'>-	return NO_TRANSIT;</div><div class='del'>-}</div><div class='head'>diff --git a/fs/fscache/operation.c b/fs/fscache/operation.c<br/>deleted file mode 100644<br/>index e002cdfaf3cc..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fscache/operation.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fscache/operation.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,633 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='del'>-/* FS-Cache worker operation management routines</div><div class='del'>- *</div><div class='del'>- * Copyright (C) 2008 Red Hat, Inc. All Rights Reserved.</div><div class='del'>- * Written by David Howells (dhowells@redhat.com)</div><div class='del'>- *</div><div class='del'>- * See Documentation/filesystems/caching/operations.rst</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#define FSCACHE_DEBUG_LEVEL OPERATION</div><div class='del'>-#include &lt;linux/module.h&gt;</div><div class='del'>-#include &lt;linux/seq_file.h&gt;</div><div class='del'>-#include &lt;linux/slab.h&gt;</div><div class='del'>-#include "internal.h"</div><div class='del'>-</div><div class='del'>-atomic_t fscache_op_debug_id;</div><div class='del'>-EXPORT_SYMBOL(fscache_op_debug_id);</div><div class='del'>-</div><div class='del'>-static void fscache_operation_dummy_cancel(struct fscache_operation *op)</div><div class='del'>-{</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * fscache_operation_init - Do basic initialisation of an operation</div><div class='del'>- * @cookie: The cookie to operate on</div><div class='del'>- * @op: The operation to initialise</div><div class='del'>- * @processor: The function to perform the operation</div><div class='del'>- * @cancel: A function to handle operation cancellation</div><div class='del'>- * @release: The release function to assign</div><div class='del'>- *</div><div class='del'>- * Do basic initialisation of an operation.  The caller must still set flags,</div><div class='del'>- * object and processor if needed.</div><div class='del'>- */</div><div class='del'>-void fscache_operation_init(struct fscache_cookie *cookie,</div><div class='del'>-			    struct fscache_operation *op,</div><div class='del'>-			    fscache_operation_processor_t processor,</div><div class='del'>-			    fscache_operation_cancel_t cancel,</div><div class='del'>-			    fscache_operation_release_t release)</div><div class='del'>-{</div><div class='del'>-	INIT_WORK(&amp;op-&gt;work, fscache_op_work_func);</div><div class='del'>-	atomic_set(&amp;op-&gt;usage, 1);</div><div class='del'>-	op-&gt;state = FSCACHE_OP_ST_INITIALISED;</div><div class='del'>-	op-&gt;debug_id = atomic_inc_return(&amp;fscache_op_debug_id);</div><div class='del'>-	op-&gt;processor = processor;</div><div class='del'>-	op-&gt;cancel = cancel ?: fscache_operation_dummy_cancel;</div><div class='del'>-	op-&gt;release = release;</div><div class='del'>-	INIT_LIST_HEAD(&amp;op-&gt;pend_link);</div><div class='del'>-	fscache_stat(&amp;fscache_n_op_initialised);</div><div class='del'>-	trace_fscache_op(cookie, op, fscache_op_init);</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(fscache_operation_init);</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * fscache_enqueue_operation - Enqueue an operation for processing</div><div class='del'>- * @op: The operation to enqueue</div><div class='del'>- *</div><div class='del'>- * Enqueue an operation for processing by the FS-Cache thread pool.</div><div class='del'>- *</div><div class='del'>- * This will get its own ref on the object.</div><div class='del'>- */</div><div class='del'>-void fscache_enqueue_operation(struct fscache_operation *op)</div><div class='del'>-{</div><div class='del'>-	struct fscache_cookie *cookie = op-&gt;object-&gt;cookie;</div><div class='del'>-	</div><div class='del'>-	_enter("{OBJ%x OP%x,%u}",</div><div class='del'>-	       op-&gt;object-&gt;debug_id, op-&gt;debug_id, atomic_read(&amp;op-&gt;usage));</div><div class='del'>-</div><div class='del'>-	ASSERT(list_empty(&amp;op-&gt;pend_link));</div><div class='del'>-	ASSERT(op-&gt;processor != NULL);</div><div class='del'>-	ASSERT(fscache_object_is_available(op-&gt;object));</div><div class='del'>-	ASSERTCMP(atomic_read(&amp;op-&gt;usage), &gt;, 0);</div><div class='del'>-	ASSERTIFCMP(op-&gt;state != FSCACHE_OP_ST_IN_PROGRESS,</div><div class='del'>-		    op-&gt;state, ==,  FSCACHE_OP_ST_CANCELLED);</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_op_enqueue);</div><div class='del'>-	switch (op-&gt;flags &amp; FSCACHE_OP_TYPE) {</div><div class='del'>-	case FSCACHE_OP_ASYNC:</div><div class='del'>-		trace_fscache_op(cookie, op, fscache_op_enqueue_async);</div><div class='del'>-		_debug("queue async");</div><div class='del'>-		atomic_inc(&amp;op-&gt;usage);</div><div class='del'>-		if (!queue_work(fscache_op_wq, &amp;op-&gt;work))</div><div class='del'>-			fscache_put_operation(op);</div><div class='del'>-		break;</div><div class='del'>-	case FSCACHE_OP_MYTHREAD:</div><div class='del'>-		trace_fscache_op(cookie, op, fscache_op_enqueue_mythread);</div><div class='del'>-		_debug("queue for caller's attention");</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		pr_err("Unexpected op type %lx", op-&gt;flags);</div><div class='del'>-		BUG();</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(fscache_enqueue_operation);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * start an op running</div><div class='del'>- */</div><div class='del'>-static void fscache_run_op(struct fscache_object *object,</div><div class='del'>-			   struct fscache_operation *op)</div><div class='del'>-{</div><div class='del'>-	ASSERTCMP(op-&gt;state, ==, FSCACHE_OP_ST_PENDING);</div><div class='del'>-</div><div class='del'>-	op-&gt;state = FSCACHE_OP_ST_IN_PROGRESS;</div><div class='del'>-	object-&gt;n_in_progress++;</div><div class='del'>-	if (test_and_clear_bit(FSCACHE_OP_WAITING, &amp;op-&gt;flags))</div><div class='del'>-		wake_up_bit(&amp;op-&gt;flags, FSCACHE_OP_WAITING);</div><div class='del'>-	if (op-&gt;processor)</div><div class='del'>-		fscache_enqueue_operation(op);</div><div class='del'>-	else</div><div class='del'>-		trace_fscache_op(object-&gt;cookie, op, fscache_op_run);</div><div class='del'>-	fscache_stat(&amp;fscache_n_op_run);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * report an unexpected submission</div><div class='del'>- */</div><div class='del'>-static void fscache_report_unexpected_submission(struct fscache_object *object,</div><div class='del'>-						 struct fscache_operation *op,</div><div class='del'>-						 const struct fscache_state *ostate)</div><div class='del'>-{</div><div class='del'>-	static bool once_only;</div><div class='del'>-	struct fscache_operation *p;</div><div class='del'>-	unsigned n;</div><div class='del'>-</div><div class='del'>-	if (once_only)</div><div class='del'>-		return;</div><div class='del'>-	once_only = true;</div><div class='del'>-</div><div class='del'>-	kdebug("unexpected submission OP%x [OBJ%x %s]",</div><div class='del'>-	       op-&gt;debug_id, object-&gt;debug_id, object-&gt;state-&gt;name);</div><div class='del'>-	kdebug("objstate=%s [%s]", object-&gt;state-&gt;name, ostate-&gt;name);</div><div class='del'>-	kdebug("objflags=%lx", object-&gt;flags);</div><div class='del'>-	kdebug("objevent=%lx [%lx]", object-&gt;events, object-&gt;event_mask);</div><div class='del'>-	kdebug("ops=%u inp=%u exc=%u",</div><div class='del'>-	       object-&gt;n_ops, object-&gt;n_in_progress, object-&gt;n_exclusive);</div><div class='del'>-</div><div class='del'>-	if (!list_empty(&amp;object-&gt;pending_ops)) {</div><div class='del'>-		n = 0;</div><div class='del'>-		list_for_each_entry(p, &amp;object-&gt;pending_ops, pend_link) {</div><div class='del'>-			ASSERTCMP(p-&gt;object, ==, object);</div><div class='del'>-			kdebug("%p %p", op-&gt;processor, op-&gt;release);</div><div class='del'>-			n++;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		kdebug("n=%u", n);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	dump_stack();</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * submit an exclusive operation for an object</div><div class='del'>- * - other ops are excluded from running simultaneously with this one</div><div class='del'>- * - this gets any extra refs it needs on an op</div><div class='del'>- */</div><div class='del'>-int fscache_submit_exclusive_op(struct fscache_object *object,</div><div class='del'>-				struct fscache_operation *op)</div><div class='del'>-{</div><div class='del'>-	const struct fscache_state *ostate;</div><div class='del'>-	unsigned long flags;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	_enter("{OBJ%x OP%x},", object-&gt;debug_id, op-&gt;debug_id);</div><div class='del'>-</div><div class='del'>-	trace_fscache_op(object-&gt;cookie, op, fscache_op_submit_ex);</div><div class='del'>-</div><div class='del'>-	ASSERTCMP(op-&gt;state, ==, FSCACHE_OP_ST_INITIALISED);</div><div class='del'>-	ASSERTCMP(atomic_read(&amp;op-&gt;usage), &gt;, 0);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;object-&gt;lock);</div><div class='del'>-	ASSERTCMP(object-&gt;n_ops, &gt;=, object-&gt;n_in_progress);</div><div class='del'>-	ASSERTCMP(object-&gt;n_ops, &gt;=, object-&gt;n_exclusive);</div><div class='del'>-	ASSERT(list_empty(&amp;op-&gt;pend_link));</div><div class='del'>-</div><div class='del'>-	ostate = object-&gt;state;</div><div class='del'>-	smp_rmb();</div><div class='del'>-</div><div class='del'>-	op-&gt;state = FSCACHE_OP_ST_PENDING;</div><div class='del'>-	flags = READ_ONCE(object-&gt;flags);</div><div class='del'>-	if (unlikely(!(flags &amp; BIT(FSCACHE_OBJECT_IS_LIVE)))) {</div><div class='del'>-		fscache_stat(&amp;fscache_n_op_rejected);</div><div class='del'>-		op-&gt;cancel(op);</div><div class='del'>-		op-&gt;state = FSCACHE_OP_ST_CANCELLED;</div><div class='del'>-		ret = -ENOBUFS;</div><div class='del'>-	} else if (unlikely(fscache_cache_is_broken(object))) {</div><div class='del'>-		op-&gt;cancel(op);</div><div class='del'>-		op-&gt;state = FSCACHE_OP_ST_CANCELLED;</div><div class='del'>-		ret = -EIO;</div><div class='del'>-	} else if (flags &amp; BIT(FSCACHE_OBJECT_IS_AVAILABLE)) {</div><div class='del'>-		op-&gt;object = object;</div><div class='del'>-		object-&gt;n_ops++;</div><div class='del'>-		object-&gt;n_exclusive++;	/* reads and writes must wait */</div><div class='del'>-</div><div class='del'>-		if (object-&gt;n_in_progress &gt; 0) {</div><div class='del'>-			atomic_inc(&amp;op-&gt;usage);</div><div class='del'>-			list_add_tail(&amp;op-&gt;pend_link, &amp;object-&gt;pending_ops);</div><div class='del'>-			fscache_stat(&amp;fscache_n_op_pend);</div><div class='del'>-		} else if (!list_empty(&amp;object-&gt;pending_ops)) {</div><div class='del'>-			atomic_inc(&amp;op-&gt;usage);</div><div class='del'>-			list_add_tail(&amp;op-&gt;pend_link, &amp;object-&gt;pending_ops);</div><div class='del'>-			fscache_stat(&amp;fscache_n_op_pend);</div><div class='del'>-			fscache_start_operations(object);</div><div class='del'>-		} else {</div><div class='del'>-			ASSERTCMP(object-&gt;n_in_progress, ==, 0);</div><div class='del'>-			fscache_run_op(object, op);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/* need to issue a new write op after this */</div><div class='del'>-		clear_bit(FSCACHE_OBJECT_PENDING_WRITE, &amp;object-&gt;flags);</div><div class='del'>-		ret = 0;</div><div class='del'>-	} else if (flags &amp; BIT(FSCACHE_OBJECT_IS_LOOKED_UP)) {</div><div class='del'>-		op-&gt;object = object;</div><div class='del'>-		object-&gt;n_ops++;</div><div class='del'>-		object-&gt;n_exclusive++;	/* reads and writes must wait */</div><div class='del'>-		atomic_inc(&amp;op-&gt;usage);</div><div class='del'>-		list_add_tail(&amp;op-&gt;pend_link, &amp;object-&gt;pending_ops);</div><div class='del'>-		fscache_stat(&amp;fscache_n_op_pend);</div><div class='del'>-		ret = 0;</div><div class='del'>-	} else if (flags &amp; BIT(FSCACHE_OBJECT_KILLED_BY_CACHE)) {</div><div class='del'>-		op-&gt;cancel(op);</div><div class='del'>-		op-&gt;state = FSCACHE_OP_ST_CANCELLED;</div><div class='del'>-		ret = -ENOBUFS;</div><div class='del'>-	} else {</div><div class='del'>-		fscache_report_unexpected_submission(object, op, ostate);</div><div class='del'>-		op-&gt;cancel(op);</div><div class='del'>-		op-&gt;state = FSCACHE_OP_ST_CANCELLED;</div><div class='del'>-		ret = -ENOBUFS;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_unlock(&amp;object-&gt;lock);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * submit an operation for an object</div><div class='del'>- * - objects may be submitted only in the following states:</div><div class='del'>- *   - during object creation (write ops may be submitted)</div><div class='del'>- *   - whilst the object is active</div><div class='del'>- *   - after an I/O error incurred in one of the two above states (op rejected)</div><div class='del'>- * - this gets any extra refs it needs on an op</div><div class='del'>- */</div><div class='del'>-int fscache_submit_op(struct fscache_object *object,</div><div class='del'>-		      struct fscache_operation *op)</div><div class='del'>-{</div><div class='del'>-	const struct fscache_state *ostate;</div><div class='del'>-	unsigned long flags;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	_enter("{OBJ%x OP%x},{%u}",</div><div class='del'>-	       object-&gt;debug_id, op-&gt;debug_id, atomic_read(&amp;op-&gt;usage));</div><div class='del'>-</div><div class='del'>-	trace_fscache_op(object-&gt;cookie, op, fscache_op_submit);</div><div class='del'>-</div><div class='del'>-	ASSERTCMP(op-&gt;state, ==, FSCACHE_OP_ST_INITIALISED);</div><div class='del'>-	ASSERTCMP(atomic_read(&amp;op-&gt;usage), &gt;, 0);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;object-&gt;lock);</div><div class='del'>-	ASSERTCMP(object-&gt;n_ops, &gt;=, object-&gt;n_in_progress);</div><div class='del'>-	ASSERTCMP(object-&gt;n_ops, &gt;=, object-&gt;n_exclusive);</div><div class='del'>-	ASSERT(list_empty(&amp;op-&gt;pend_link));</div><div class='del'>-</div><div class='del'>-	ostate = object-&gt;state;</div><div class='del'>-	smp_rmb();</div><div class='del'>-</div><div class='del'>-	op-&gt;state = FSCACHE_OP_ST_PENDING;</div><div class='del'>-	flags = READ_ONCE(object-&gt;flags);</div><div class='del'>-	if (unlikely(!(flags &amp; BIT(FSCACHE_OBJECT_IS_LIVE)))) {</div><div class='del'>-		fscache_stat(&amp;fscache_n_op_rejected);</div><div class='del'>-		op-&gt;cancel(op);</div><div class='del'>-		op-&gt;state = FSCACHE_OP_ST_CANCELLED;</div><div class='del'>-		ret = -ENOBUFS;</div><div class='del'>-	} else if (unlikely(fscache_cache_is_broken(object))) {</div><div class='del'>-		op-&gt;cancel(op);</div><div class='del'>-		op-&gt;state = FSCACHE_OP_ST_CANCELLED;</div><div class='del'>-		ret = -EIO;</div><div class='del'>-	} else if (flags &amp; BIT(FSCACHE_OBJECT_IS_AVAILABLE)) {</div><div class='del'>-		op-&gt;object = object;</div><div class='del'>-		object-&gt;n_ops++;</div><div class='del'>-</div><div class='del'>-		if (object-&gt;n_exclusive &gt; 0) {</div><div class='del'>-			atomic_inc(&amp;op-&gt;usage);</div><div class='del'>-			list_add_tail(&amp;op-&gt;pend_link, &amp;object-&gt;pending_ops);</div><div class='del'>-			fscache_stat(&amp;fscache_n_op_pend);</div><div class='del'>-		} else if (!list_empty(&amp;object-&gt;pending_ops)) {</div><div class='del'>-			atomic_inc(&amp;op-&gt;usage);</div><div class='del'>-			list_add_tail(&amp;op-&gt;pend_link, &amp;object-&gt;pending_ops);</div><div class='del'>-			fscache_stat(&amp;fscache_n_op_pend);</div><div class='del'>-			fscache_start_operations(object);</div><div class='del'>-		} else {</div><div class='del'>-			ASSERTCMP(object-&gt;n_exclusive, ==, 0);</div><div class='del'>-			fscache_run_op(object, op);</div><div class='del'>-		}</div><div class='del'>-		ret = 0;</div><div class='del'>-	} else if (flags &amp; BIT(FSCACHE_OBJECT_IS_LOOKED_UP)) {</div><div class='del'>-		op-&gt;object = object;</div><div class='del'>-		object-&gt;n_ops++;</div><div class='del'>-		atomic_inc(&amp;op-&gt;usage);</div><div class='del'>-		list_add_tail(&amp;op-&gt;pend_link, &amp;object-&gt;pending_ops);</div><div class='del'>-		fscache_stat(&amp;fscache_n_op_pend);</div><div class='del'>-		ret = 0;</div><div class='del'>-	} else if (flags &amp; BIT(FSCACHE_OBJECT_KILLED_BY_CACHE)) {</div><div class='del'>-		op-&gt;cancel(op);</div><div class='del'>-		op-&gt;state = FSCACHE_OP_ST_CANCELLED;</div><div class='del'>-		ret = -ENOBUFS;</div><div class='del'>-	} else {</div><div class='del'>-		fscache_report_unexpected_submission(object, op, ostate);</div><div class='del'>-		ASSERT(!fscache_object_is_active(object));</div><div class='del'>-		op-&gt;cancel(op);</div><div class='del'>-		op-&gt;state = FSCACHE_OP_ST_CANCELLED;</div><div class='del'>-		ret = -ENOBUFS;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_unlock(&amp;object-&gt;lock);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * queue an object for withdrawal on error, aborting all following asynchronous</div><div class='del'>- * operations</div><div class='del'>- */</div><div class='del'>-void fscache_abort_object(struct fscache_object *object)</div><div class='del'>-{</div><div class='del'>-	_enter("{OBJ%x}", object-&gt;debug_id);</div><div class='del'>-</div><div class='del'>-	fscache_raise_event(object, FSCACHE_OBJECT_EV_ERROR);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Jump start the operation processing on an object.  The caller must hold</div><div class='del'>- * object-&gt;lock.</div><div class='del'>- */</div><div class='del'>-void fscache_start_operations(struct fscache_object *object)</div><div class='del'>-{</div><div class='del'>-	struct fscache_operation *op;</div><div class='del'>-	bool stop = false;</div><div class='del'>-</div><div class='del'>-	while (!list_empty(&amp;object-&gt;pending_ops) &amp;&amp; !stop) {</div><div class='del'>-		op = list_entry(object-&gt;pending_ops.next,</div><div class='del'>-				struct fscache_operation, pend_link);</div><div class='del'>-</div><div class='del'>-		if (test_bit(FSCACHE_OP_EXCLUSIVE, &amp;op-&gt;flags)) {</div><div class='del'>-			if (object-&gt;n_in_progress &gt; 0)</div><div class='del'>-				break;</div><div class='del'>-			stop = true;</div><div class='del'>-		}</div><div class='del'>-		list_del_init(&amp;op-&gt;pend_link);</div><div class='del'>-		fscache_run_op(object, op);</div><div class='del'>-</div><div class='del'>-		/* the pending queue was holding a ref on the object */</div><div class='del'>-		fscache_put_operation(op);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ASSERTCMP(object-&gt;n_in_progress, &lt;=, object-&gt;n_ops);</div><div class='del'>-</div><div class='del'>-	_debug("woke %d ops on OBJ%x",</div><div class='del'>-	       object-&gt;n_in_progress, object-&gt;debug_id);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * cancel an operation that's pending on an object</div><div class='del'>- */</div><div class='del'>-int fscache_cancel_op(struct fscache_operation *op,</div><div class='del'>-		      bool cancel_in_progress_op)</div><div class='del'>-{</div><div class='del'>-	struct fscache_object *object = op-&gt;object;</div><div class='del'>-	bool put = false;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	_enter("OBJ%x OP%x}", op-&gt;object-&gt;debug_id, op-&gt;debug_id);</div><div class='del'>-</div><div class='del'>-	trace_fscache_op(object-&gt;cookie, op, fscache_op_cancel);</div><div class='del'>-</div><div class='del'>-	ASSERTCMP(op-&gt;state, &gt;=, FSCACHE_OP_ST_PENDING);</div><div class='del'>-	ASSERTCMP(op-&gt;state, !=, FSCACHE_OP_ST_CANCELLED);</div><div class='del'>-	ASSERTCMP(atomic_read(&amp;op-&gt;usage), &gt;, 0);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;object-&gt;lock);</div><div class='del'>-</div><div class='del'>-	ret = -EBUSY;</div><div class='del'>-	if (op-&gt;state == FSCACHE_OP_ST_PENDING) {</div><div class='del'>-		ASSERT(!list_empty(&amp;op-&gt;pend_link));</div><div class='del'>-		list_del_init(&amp;op-&gt;pend_link);</div><div class='del'>-		put = true;</div><div class='del'>-</div><div class='del'>-		fscache_stat(&amp;fscache_n_op_cancelled);</div><div class='del'>-		op-&gt;cancel(op);</div><div class='del'>-		op-&gt;state = FSCACHE_OP_ST_CANCELLED;</div><div class='del'>-		if (test_bit(FSCACHE_OP_EXCLUSIVE, &amp;op-&gt;flags))</div><div class='del'>-			object-&gt;n_exclusive--;</div><div class='del'>-		if (test_and_clear_bit(FSCACHE_OP_WAITING, &amp;op-&gt;flags))</div><div class='del'>-			wake_up_bit(&amp;op-&gt;flags, FSCACHE_OP_WAITING);</div><div class='del'>-		ret = 0;</div><div class='del'>-	} else if (op-&gt;state == FSCACHE_OP_ST_IN_PROGRESS &amp;&amp; cancel_in_progress_op) {</div><div class='del'>-		ASSERTCMP(object-&gt;n_in_progress, &gt;, 0);</div><div class='del'>-		if (test_bit(FSCACHE_OP_EXCLUSIVE, &amp;op-&gt;flags))</div><div class='del'>-			object-&gt;n_exclusive--;</div><div class='del'>-		object-&gt;n_in_progress--;</div><div class='del'>-		if (object-&gt;n_in_progress == 0)</div><div class='del'>-			fscache_start_operations(object);</div><div class='del'>-</div><div class='del'>-		fscache_stat(&amp;fscache_n_op_cancelled);</div><div class='del'>-		op-&gt;cancel(op);</div><div class='del'>-		op-&gt;state = FSCACHE_OP_ST_CANCELLED;</div><div class='del'>-		if (test_bit(FSCACHE_OP_EXCLUSIVE, &amp;op-&gt;flags))</div><div class='del'>-			object-&gt;n_exclusive--;</div><div class='del'>-		if (test_and_clear_bit(FSCACHE_OP_WAITING, &amp;op-&gt;flags))</div><div class='del'>-			wake_up_bit(&amp;op-&gt;flags, FSCACHE_OP_WAITING);</div><div class='del'>-		ret = 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (put)</div><div class='del'>-		fscache_put_operation(op);</div><div class='del'>-	spin_unlock(&amp;object-&gt;lock);</div><div class='del'>-	_leave(" = %d", ret);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Cancel all pending operations on an object</div><div class='del'>- */</div><div class='del'>-void fscache_cancel_all_ops(struct fscache_object *object)</div><div class='del'>-{</div><div class='del'>-	struct fscache_operation *op;</div><div class='del'>-</div><div class='del'>-	_enter("OBJ%x", object-&gt;debug_id);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;object-&gt;lock);</div><div class='del'>-</div><div class='del'>-	while (!list_empty(&amp;object-&gt;pending_ops)) {</div><div class='del'>-		op = list_entry(object-&gt;pending_ops.next,</div><div class='del'>-				struct fscache_operation, pend_link);</div><div class='del'>-		fscache_stat(&amp;fscache_n_op_cancelled);</div><div class='del'>-		list_del_init(&amp;op-&gt;pend_link);</div><div class='del'>-</div><div class='del'>-		trace_fscache_op(object-&gt;cookie, op, fscache_op_cancel_all);</div><div class='del'>-</div><div class='del'>-		ASSERTCMP(op-&gt;state, ==, FSCACHE_OP_ST_PENDING);</div><div class='del'>-		op-&gt;cancel(op);</div><div class='del'>-		op-&gt;state = FSCACHE_OP_ST_CANCELLED;</div><div class='del'>-</div><div class='del'>-		if (test_bit(FSCACHE_OP_EXCLUSIVE, &amp;op-&gt;flags))</div><div class='del'>-			object-&gt;n_exclusive--;</div><div class='del'>-		if (test_and_clear_bit(FSCACHE_OP_WAITING, &amp;op-&gt;flags))</div><div class='del'>-			wake_up_bit(&amp;op-&gt;flags, FSCACHE_OP_WAITING);</div><div class='del'>-		fscache_put_operation(op);</div><div class='del'>-		cond_resched_lock(&amp;object-&gt;lock);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_unlock(&amp;object-&gt;lock);</div><div class='del'>-	_leave("");</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Record the completion or cancellation of an in-progress operation.</div><div class='del'>- */</div><div class='del'>-void fscache_op_complete(struct fscache_operation *op, bool cancelled)</div><div class='del'>-{</div><div class='del'>-	struct fscache_object *object = op-&gt;object;</div><div class='del'>-</div><div class='del'>-	_enter("OBJ%x", object-&gt;debug_id);</div><div class='del'>-</div><div class='del'>-	ASSERTCMP(op-&gt;state, ==, FSCACHE_OP_ST_IN_PROGRESS);</div><div class='del'>-	ASSERTCMP(object-&gt;n_in_progress, &gt;, 0);</div><div class='del'>-	ASSERTIFCMP(test_bit(FSCACHE_OP_EXCLUSIVE, &amp;op-&gt;flags),</div><div class='del'>-		    object-&gt;n_exclusive, &gt;, 0);</div><div class='del'>-	ASSERTIFCMP(test_bit(FSCACHE_OP_EXCLUSIVE, &amp;op-&gt;flags),</div><div class='del'>-		    object-&gt;n_in_progress, ==, 1);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;object-&gt;lock);</div><div class='del'>-</div><div class='del'>-	if (!cancelled) {</div><div class='del'>-		trace_fscache_op(object-&gt;cookie, op, fscache_op_completed);</div><div class='del'>-		op-&gt;state = FSCACHE_OP_ST_COMPLETE;</div><div class='del'>-	} else {</div><div class='del'>-		op-&gt;cancel(op);</div><div class='del'>-		trace_fscache_op(object-&gt;cookie, op, fscache_op_cancelled);</div><div class='del'>-		op-&gt;state = FSCACHE_OP_ST_CANCELLED;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (test_bit(FSCACHE_OP_EXCLUSIVE, &amp;op-&gt;flags))</div><div class='del'>-		object-&gt;n_exclusive--;</div><div class='del'>-	object-&gt;n_in_progress--;</div><div class='del'>-	if (object-&gt;n_in_progress == 0)</div><div class='del'>-		fscache_start_operations(object);</div><div class='del'>-</div><div class='del'>-	spin_unlock(&amp;object-&gt;lock);</div><div class='del'>-	_leave("");</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(fscache_op_complete);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * release an operation</div><div class='del'>- * - queues pending ops if this is the last in-progress op</div><div class='del'>- */</div><div class='del'>-void fscache_put_operation(struct fscache_operation *op)</div><div class='del'>-{</div><div class='del'>-	struct fscache_object *object;</div><div class='del'>-	struct fscache_cache *cache;</div><div class='del'>-</div><div class='del'>-	_enter("{OBJ%x OP%x,%d}",</div><div class='del'>-	       op-&gt;object ? op-&gt;object-&gt;debug_id : 0,</div><div class='del'>-	       op-&gt;debug_id, atomic_read(&amp;op-&gt;usage));</div><div class='del'>-</div><div class='del'>-	ASSERTCMP(atomic_read(&amp;op-&gt;usage), &gt;, 0);</div><div class='del'>-</div><div class='del'>-	if (!atomic_dec_and_test(&amp;op-&gt;usage))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	trace_fscache_op(op-&gt;object ? op-&gt;object-&gt;cookie : NULL, op, fscache_op_put);</div><div class='del'>-</div><div class='del'>-	_debug("PUT OP");</div><div class='del'>-	ASSERTIFCMP(op-&gt;state != FSCACHE_OP_ST_INITIALISED &amp;&amp;</div><div class='del'>-		    op-&gt;state != FSCACHE_OP_ST_COMPLETE,</div><div class='del'>-		    op-&gt;state, ==, FSCACHE_OP_ST_CANCELLED);</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_op_release);</div><div class='del'>-</div><div class='del'>-	if (op-&gt;release) {</div><div class='del'>-		op-&gt;release(op);</div><div class='del'>-		op-&gt;release = NULL;</div><div class='del'>-	}</div><div class='del'>-	op-&gt;state = FSCACHE_OP_ST_DEAD;</div><div class='del'>-</div><div class='del'>-	object = op-&gt;object;</div><div class='del'>-	if (likely(object)) {</div><div class='del'>-		if (test_bit(FSCACHE_OP_DEC_READ_CNT, &amp;op-&gt;flags))</div><div class='del'>-			atomic_dec(&amp;object-&gt;n_reads);</div><div class='del'>-		if (test_bit(FSCACHE_OP_UNUSE_COOKIE, &amp;op-&gt;flags))</div><div class='del'>-			fscache_unuse_cookie(object);</div><div class='del'>-</div><div class='del'>-		/* now... we may get called with the object spinlock held, so we</div><div class='del'>-		 * complete the cleanup here only if we can immediately acquire the</div><div class='del'>-		 * lock, and defer it otherwise */</div><div class='del'>-		if (!spin_trylock(&amp;object-&gt;lock)) {</div><div class='del'>-			_debug("defer put");</div><div class='del'>-			fscache_stat(&amp;fscache_n_op_deferred_release);</div><div class='del'>-</div><div class='del'>-			cache = object-&gt;cache;</div><div class='del'>-			spin_lock(&amp;cache-&gt;op_gc_list_lock);</div><div class='del'>-			list_add_tail(&amp;op-&gt;pend_link, &amp;cache-&gt;op_gc_list);</div><div class='del'>-			spin_unlock(&amp;cache-&gt;op_gc_list_lock);</div><div class='del'>-			schedule_work(&amp;cache-&gt;op_gc);</div><div class='del'>-			_leave(" [defer]");</div><div class='del'>-			return;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		ASSERTCMP(object-&gt;n_ops, &gt;, 0);</div><div class='del'>-		object-&gt;n_ops--;</div><div class='del'>-		if (object-&gt;n_ops == 0)</div><div class='del'>-			fscache_raise_event(object, FSCACHE_OBJECT_EV_CLEARED);</div><div class='del'>-</div><div class='del'>-		spin_unlock(&amp;object-&gt;lock);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	kfree(op);</div><div class='del'>-	_leave(" [done]");</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(fscache_put_operation);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * garbage collect operations that have had their release deferred</div><div class='del'>- */</div><div class='del'>-void fscache_operation_gc(struct work_struct *work)</div><div class='del'>-{</div><div class='del'>-	struct fscache_operation *op;</div><div class='del'>-	struct fscache_object *object;</div><div class='del'>-	struct fscache_cache *cache =</div><div class='del'>-		container_of(work, struct fscache_cache, op_gc);</div><div class='del'>-	int count = 0;</div><div class='del'>-</div><div class='del'>-	_enter("");</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		spin_lock(&amp;cache-&gt;op_gc_list_lock);</div><div class='del'>-		if (list_empty(&amp;cache-&gt;op_gc_list)) {</div><div class='del'>-			spin_unlock(&amp;cache-&gt;op_gc_list_lock);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		op = list_entry(cache-&gt;op_gc_list.next,</div><div class='del'>-				struct fscache_operation, pend_link);</div><div class='del'>-		list_del(&amp;op-&gt;pend_link);</div><div class='del'>-		spin_unlock(&amp;cache-&gt;op_gc_list_lock);</div><div class='del'>-</div><div class='del'>-		object = op-&gt;object;</div><div class='del'>-		trace_fscache_op(object-&gt;cookie, op, fscache_op_gc);</div><div class='del'>-</div><div class='del'>-		spin_lock(&amp;object-&gt;lock);</div><div class='del'>-</div><div class='del'>-		_debug("GC DEFERRED REL OBJ%x OP%x",</div><div class='del'>-		       object-&gt;debug_id, op-&gt;debug_id);</div><div class='del'>-		fscache_stat(&amp;fscache_n_op_gc);</div><div class='del'>-</div><div class='del'>-		ASSERTCMP(atomic_read(&amp;op-&gt;usage), ==, 0);</div><div class='del'>-		ASSERTCMP(op-&gt;state, ==, FSCACHE_OP_ST_DEAD);</div><div class='del'>-</div><div class='del'>-		ASSERTCMP(object-&gt;n_ops, &gt;, 0);</div><div class='del'>-		object-&gt;n_ops--;</div><div class='del'>-		if (object-&gt;n_ops == 0)</div><div class='del'>-			fscache_raise_event(object, FSCACHE_OBJECT_EV_CLEARED);</div><div class='del'>-</div><div class='del'>-		spin_unlock(&amp;object-&gt;lock);</div><div class='del'>-		kfree(op);</div><div class='del'>-</div><div class='del'>-	} while (count++ &lt; 20);</div><div class='del'>-</div><div class='del'>-	if (!list_empty(&amp;cache-&gt;op_gc_list))</div><div class='del'>-		schedule_work(&amp;cache-&gt;op_gc);</div><div class='del'>-</div><div class='del'>-	_leave("");</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * execute an operation using fs_op_wq to provide processing context -</div><div class='del'>- * the caller holds a ref to this object, so we don't need to hold one</div><div class='del'>- */</div><div class='del'>-void fscache_op_work_func(struct work_struct *work)</div><div class='del'>-{</div><div class='del'>-	struct fscache_operation *op =</div><div class='del'>-		container_of(work, struct fscache_operation, work);</div><div class='del'>-</div><div class='del'>-	_enter("{OBJ%x OP%x,%d}",</div><div class='del'>-	       op-&gt;object-&gt;debug_id, op-&gt;debug_id, atomic_read(&amp;op-&gt;usage));</div><div class='del'>-</div><div class='del'>-	trace_fscache_op(op-&gt;object-&gt;cookie, op, fscache_op_work);</div><div class='del'>-</div><div class='del'>-	ASSERT(op-&gt;processor != NULL);</div><div class='del'>-	op-&gt;processor(op);</div><div class='del'>-	fscache_put_operation(op);</div><div class='del'>-</div><div class='del'>-	_leave("");</div><div class='del'>-}</div><div class='head'>diff --git a/fs/fscache/page.c b/fs/fscache/page.c<br/>deleted file mode 100644<br/>index 27df94ef0e0b..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fscache/page.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fscache/page.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,1242 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='del'>-/* Cache page management and data I/O routines</div><div class='del'>- *</div><div class='del'>- * Copyright (C) 2004-2008 Red Hat, Inc. All Rights Reserved.</div><div class='del'>- * Written by David Howells (dhowells@redhat.com)</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#define FSCACHE_DEBUG_LEVEL PAGE</div><div class='del'>-#include &lt;linux/module.h&gt;</div><div class='del'>-#include &lt;linux/fscache-cache.h&gt;</div><div class='del'>-#include &lt;linux/buffer_head.h&gt;</div><div class='del'>-#include &lt;linux/pagevec.h&gt;</div><div class='del'>-#include &lt;linux/slab.h&gt;</div><div class='del'>-#include "internal.h"</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * check to see if a page is being written to the cache</div><div class='del'>- */</div><div class='del'>-bool __fscache_check_page_write(struct fscache_cookie *cookie, struct page *page)</div><div class='del'>-{</div><div class='del'>-	void *val;</div><div class='del'>-</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	val = radix_tree_lookup(&amp;cookie-&gt;stores, page-&gt;index);</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-	trace_fscache_check_page(cookie, page, val, 0);</div><div class='del'>-</div><div class='del'>-	return val != NULL;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(__fscache_check_page_write);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * wait for a page to finish being written to the cache</div><div class='del'>- */</div><div class='del'>-void __fscache_wait_on_page_write(struct fscache_cookie *cookie, struct page *page)</div><div class='del'>-{</div><div class='del'>-	wait_queue_head_t *wq = bit_waitqueue(&amp;cookie-&gt;flags, 0);</div><div class='del'>-</div><div class='del'>-	trace_fscache_page(cookie, page, fscache_page_write_wait);</div><div class='del'>-</div><div class='del'>-	wait_event(*wq, !__fscache_check_page_write(cookie, page));</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(__fscache_wait_on_page_write);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * wait for a page to finish being written to the cache. Put a timeout here</div><div class='del'>- * since we might be called recursively via parent fs.</div><div class='del'>- */</div><div class='del'>-static</div><div class='del'>-bool release_page_wait_timeout(struct fscache_cookie *cookie, struct page *page)</div><div class='del'>-{</div><div class='del'>-	wait_queue_head_t *wq = bit_waitqueue(&amp;cookie-&gt;flags, 0);</div><div class='del'>-</div><div class='del'>-	return wait_event_timeout(*wq, !__fscache_check_page_write(cookie, page),</div><div class='del'>-				  HZ);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * decide whether a page can be released, possibly by cancelling a store to it</div><div class='del'>- * - we're allowed to sleep if __GFP_DIRECT_RECLAIM is flagged</div><div class='del'>- */</div><div class='del'>-bool __fscache_maybe_release_page(struct fscache_cookie *cookie,</div><div class='del'>-				  struct page *page,</div><div class='del'>-				  gfp_t gfp)</div><div class='del'>-{</div><div class='del'>-	struct page *xpage;</div><div class='del'>-	void *val;</div><div class='del'>-</div><div class='del'>-	_enter("%p,%p,%x", cookie, page, gfp);</div><div class='del'>-</div><div class='del'>-	trace_fscache_page(cookie, page, fscache_page_maybe_release);</div><div class='del'>-</div><div class='del'>-try_again:</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	val = radix_tree_lookup(&amp;cookie-&gt;stores, page-&gt;index);</div><div class='del'>-	if (!val) {</div><div class='del'>-		rcu_read_unlock();</div><div class='del'>-		fscache_stat(&amp;fscache_n_store_vmscan_not_storing);</div><div class='del'>-		__fscache_uncache_page(cookie, page);</div><div class='del'>-		return true;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* see if the page is actually undergoing storage - if so we can't get</div><div class='del'>-	 * rid of it till the cache has finished with it */</div><div class='del'>-	if (radix_tree_tag_get(&amp;cookie-&gt;stores, page-&gt;index,</div><div class='del'>-			       FSCACHE_COOKIE_STORING_TAG)) {</div><div class='del'>-		rcu_read_unlock();</div><div class='del'>-		goto page_busy;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* the page is pending storage, so we attempt to cancel the store and</div><div class='del'>-	 * discard the store request so that the page can be reclaimed */</div><div class='del'>-	spin_lock(&amp;cookie-&gt;stores_lock);</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-</div><div class='del'>-	if (radix_tree_tag_get(&amp;cookie-&gt;stores, page-&gt;index,</div><div class='del'>-			       FSCACHE_COOKIE_STORING_TAG)) {</div><div class='del'>-		/* the page started to undergo storage whilst we were looking,</div><div class='del'>-		 * so now we can only wait or return */</div><div class='del'>-		spin_unlock(&amp;cookie-&gt;stores_lock);</div><div class='del'>-		goto page_busy;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	xpage = radix_tree_delete(&amp;cookie-&gt;stores, page-&gt;index);</div><div class='del'>-	trace_fscache_page(cookie, page, fscache_page_radix_delete);</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;stores_lock);</div><div class='del'>-</div><div class='del'>-	if (xpage) {</div><div class='del'>-		fscache_stat(&amp;fscache_n_store_vmscan_cancelled);</div><div class='del'>-		fscache_stat(&amp;fscache_n_store_radix_deletes);</div><div class='del'>-		ASSERTCMP(xpage, ==, page);</div><div class='del'>-	} else {</div><div class='del'>-		fscache_stat(&amp;fscache_n_store_vmscan_gone);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	wake_up_bit(&amp;cookie-&gt;flags, 0);</div><div class='del'>-	trace_fscache_wake_cookie(cookie);</div><div class='del'>-	if (xpage)</div><div class='del'>-		put_page(xpage);</div><div class='del'>-	__fscache_uncache_page(cookie, page);</div><div class='del'>-	return true;</div><div class='del'>-</div><div class='del'>-page_busy:</div><div class='del'>-	/* We will wait here if we're allowed to, but that could deadlock the</div><div class='del'>-	 * allocator as the work threads writing to the cache may all end up</div><div class='del'>-	 * sleeping on memory allocation, so we may need to impose a timeout</div><div class='del'>-	 * too. */</div><div class='del'>-	if (!(gfp &amp; __GFP_DIRECT_RECLAIM) || !(gfp &amp; __GFP_FS)) {</div><div class='del'>-		fscache_stat(&amp;fscache_n_store_vmscan_busy);</div><div class='del'>-		return false;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_store_vmscan_wait);</div><div class='del'>-	if (!release_page_wait_timeout(cookie, page))</div><div class='del'>-		_debug("fscache writeout timeout page: %p{%lx}",</div><div class='del'>-			page, page-&gt;index);</div><div class='del'>-</div><div class='del'>-	gfp &amp;= ~__GFP_DIRECT_RECLAIM;</div><div class='del'>-	goto try_again;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(__fscache_maybe_release_page);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * note that a page has finished being written to the cache</div><div class='del'>- */</div><div class='del'>-static void fscache_end_page_write(struct fscache_object *object,</div><div class='del'>-				   struct page *page)</div><div class='del'>-{</div><div class='del'>-	struct fscache_cookie *cookie;</div><div class='del'>-	struct page *xpage = NULL, *val;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;object-&gt;lock);</div><div class='del'>-	cookie = object-&gt;cookie;</div><div class='del'>-	if (cookie) {</div><div class='del'>-		/* delete the page from the tree if it is now no longer</div><div class='del'>-		 * pending */</div><div class='del'>-		spin_lock(&amp;cookie-&gt;stores_lock);</div><div class='del'>-		radix_tree_tag_clear(&amp;cookie-&gt;stores, page-&gt;index,</div><div class='del'>-				     FSCACHE_COOKIE_STORING_TAG);</div><div class='del'>-		trace_fscache_page(cookie, page, fscache_page_radix_clear_store);</div><div class='del'>-		if (!radix_tree_tag_get(&amp;cookie-&gt;stores, page-&gt;index,</div><div class='del'>-					FSCACHE_COOKIE_PENDING_TAG)) {</div><div class='del'>-			fscache_stat(&amp;fscache_n_store_radix_deletes);</div><div class='del'>-			xpage = radix_tree_delete(&amp;cookie-&gt;stores, page-&gt;index);</div><div class='del'>-			trace_fscache_page(cookie, page, fscache_page_radix_delete);</div><div class='del'>-			trace_fscache_page(cookie, page, fscache_page_write_end);</div><div class='del'>-</div><div class='del'>-			val = radix_tree_lookup(&amp;cookie-&gt;stores, page-&gt;index);</div><div class='del'>-			trace_fscache_check_page(cookie, page, val, 1);</div><div class='del'>-		} else {</div><div class='del'>-			trace_fscache_page(cookie, page, fscache_page_write_end_pend);</div><div class='del'>-		}</div><div class='del'>-		spin_unlock(&amp;cookie-&gt;stores_lock);</div><div class='del'>-		wake_up_bit(&amp;cookie-&gt;flags, 0);</div><div class='del'>-		trace_fscache_wake_cookie(cookie);</div><div class='del'>-	} else {</div><div class='del'>-		trace_fscache_page(cookie, page, fscache_page_write_end_noc);</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;object-&gt;lock);</div><div class='del'>-	if (xpage)</div><div class='del'>-		put_page(xpage);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * actually apply the changed attributes to a cache object</div><div class='del'>- */</div><div class='del'>-static void fscache_attr_changed_op(struct fscache_operation *op)</div><div class='del'>-{</div><div class='del'>-	struct fscache_object *object = op-&gt;object;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	_enter("{OBJ%x OP%x}", object-&gt;debug_id, op-&gt;debug_id);</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_attr_changed_calls);</div><div class='del'>-</div><div class='del'>-	if (fscache_object_is_active(object)) {</div><div class='del'>-		fscache_stat(&amp;fscache_n_cop_attr_changed);</div><div class='del'>-		ret = object-&gt;cache-&gt;ops-&gt;attr_changed(object);</div><div class='del'>-		fscache_stat_d(&amp;fscache_n_cop_attr_changed);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			fscache_abort_object(object);</div><div class='del'>-		fscache_op_complete(op, ret &lt; 0);</div><div class='del'>-	} else {</div><div class='del'>-		fscache_op_complete(op, true);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	_leave("");</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * notification that the attributes on an object have changed</div><div class='del'>- */</div><div class='del'>-int __fscache_attr_changed(struct fscache_cookie *cookie)</div><div class='del'>-{</div><div class='del'>-	struct fscache_operation *op;</div><div class='del'>-	struct fscache_object *object;</div><div class='del'>-	bool wake_cookie = false;</div><div class='del'>-</div><div class='del'>-	_enter("%p", cookie);</div><div class='del'>-</div><div class='del'>-	ASSERTCMP(cookie-&gt;def-&gt;type, !=, FSCACHE_COOKIE_TYPE_INDEX);</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_attr_changed);</div><div class='del'>-</div><div class='del'>-	op = kzalloc(sizeof(*op), GFP_KERNEL);</div><div class='del'>-	if (!op) {</div><div class='del'>-		fscache_stat(&amp;fscache_n_attr_changed_nomem);</div><div class='del'>-		_leave(" = -ENOMEM");</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	fscache_operation_init(cookie, op, fscache_attr_changed_op, NULL, NULL);</div><div class='del'>-	trace_fscache_page_op(cookie, NULL, op, fscache_page_op_attr_changed);</div><div class='del'>-	op-&gt;flags = FSCACHE_OP_ASYNC |</div><div class='del'>-		(1 &lt;&lt; FSCACHE_OP_EXCLUSIVE) |</div><div class='del'>-		(1 &lt;&lt; FSCACHE_OP_UNUSE_COOKIE);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;cookie-&gt;lock);</div><div class='del'>-</div><div class='del'>-	if (!fscache_cookie_enabled(cookie) ||</div><div class='del'>-	    hlist_empty(&amp;cookie-&gt;backing_objects))</div><div class='del'>-		goto nobufs;</div><div class='del'>-	object = hlist_entry(cookie-&gt;backing_objects.first,</div><div class='del'>-			     struct fscache_object, cookie_link);</div><div class='del'>-</div><div class='del'>-	__fscache_use_cookie(cookie);</div><div class='del'>-	if (fscache_submit_exclusive_op(object, op) &lt; 0)</div><div class='del'>-		goto nobufs_dec;</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-	fscache_stat(&amp;fscache_n_attr_changed_ok);</div><div class='del'>-	fscache_put_operation(op);</div><div class='del'>-	_leave(" = 0");</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-nobufs_dec:</div><div class='del'>-	wake_cookie = __fscache_unuse_cookie(cookie);</div><div class='del'>-nobufs:</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-	fscache_put_operation(op);</div><div class='del'>-	if (wake_cookie)</div><div class='del'>-		__fscache_wake_unused_cookie(cookie);</div><div class='del'>-	fscache_stat(&amp;fscache_n_attr_changed_nobufs);</div><div class='del'>-	_leave(" = %d", -ENOBUFS);</div><div class='del'>-	return -ENOBUFS;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(__fscache_attr_changed);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Handle cancellation of a pending retrieval op</div><div class='del'>- */</div><div class='del'>-static void fscache_do_cancel_retrieval(struct fscache_operation *_op)</div><div class='del'>-{</div><div class='del'>-	struct fscache_retrieval *op =</div><div class='del'>-		container_of(_op, struct fscache_retrieval, op);</div><div class='del'>-</div><div class='del'>-	atomic_set(&amp;op-&gt;n_pages, 0);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * release a retrieval op reference</div><div class='del'>- */</div><div class='del'>-static void fscache_release_retrieval_op(struct fscache_operation *_op)</div><div class='del'>-{</div><div class='del'>-	struct fscache_retrieval *op =</div><div class='del'>-		container_of(_op, struct fscache_retrieval, op);</div><div class='del'>-</div><div class='del'>-	_enter("{OP%x}", op-&gt;op.debug_id);</div><div class='del'>-</div><div class='del'>-	ASSERTIFCMP(op-&gt;op.state != FSCACHE_OP_ST_INITIALISED,</div><div class='del'>-		    atomic_read(&amp;op-&gt;n_pages), ==, 0);</div><div class='del'>-</div><div class='del'>-	if (op-&gt;context)</div><div class='del'>-		fscache_put_context(op-&gt;cookie, op-&gt;context);</div><div class='del'>-</div><div class='del'>-	_leave("");</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * allocate a retrieval op</div><div class='del'>- */</div><div class='del'>-struct fscache_retrieval *fscache_alloc_retrieval(</div><div class='del'>-	struct fscache_cookie *cookie,</div><div class='del'>-	struct address_space *mapping,</div><div class='del'>-	fscache_rw_complete_t end_io_func,</div><div class='del'>-	void *context)</div><div class='del'>-{</div><div class='del'>-	struct fscache_retrieval *op;</div><div class='del'>-</div><div class='del'>-	/* allocate a retrieval operation and attempt to submit it */</div><div class='del'>-	op = kzalloc(sizeof(*op), GFP_NOIO);</div><div class='del'>-	if (!op) {</div><div class='del'>-		fscache_stat(&amp;fscache_n_retrievals_nomem);</div><div class='del'>-		return NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	fscache_operation_init(cookie, &amp;op-&gt;op, NULL,</div><div class='del'>-			       fscache_do_cancel_retrieval,</div><div class='del'>-			       fscache_release_retrieval_op);</div><div class='del'>-	op-&gt;op.flags	= FSCACHE_OP_MYTHREAD |</div><div class='del'>-		(1UL &lt;&lt; FSCACHE_OP_WAITING) |</div><div class='del'>-		(1UL &lt;&lt; FSCACHE_OP_UNUSE_COOKIE);</div><div class='del'>-	op-&gt;cookie	= cookie;</div><div class='del'>-	op-&gt;mapping	= mapping;</div><div class='del'>-	op-&gt;end_io_func	= end_io_func;</div><div class='del'>-	op-&gt;context	= context;</div><div class='del'>-	INIT_LIST_HEAD(&amp;op-&gt;to_do);</div><div class='del'>-</div><div class='del'>-	/* Pin the netfs read context in case we need to do the actual netfs</div><div class='del'>-	 * read because we've encountered a cache read failure.</div><div class='del'>-	 */</div><div class='del'>-	if (context)</div><div class='del'>-		fscache_get_context(op-&gt;cookie, context);</div><div class='del'>-	return op;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * wait for a deferred lookup to complete</div><div class='del'>- */</div><div class='del'>-int fscache_wait_for_deferred_lookup(struct fscache_cookie *cookie)</div><div class='del'>-{</div><div class='del'>-	_enter("");</div><div class='del'>-</div><div class='del'>-	if (!test_bit(FSCACHE_COOKIE_LOOKING_UP, &amp;cookie-&gt;flags)) {</div><div class='del'>-		_leave(" = 0 [imm]");</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_retrievals_wait);</div><div class='del'>-</div><div class='del'>-	if (wait_on_bit(&amp;cookie-&gt;flags, FSCACHE_COOKIE_LOOKING_UP,</div><div class='del'>-			TASK_INTERRUPTIBLE) != 0) {</div><div class='del'>-		fscache_stat(&amp;fscache_n_retrievals_intr);</div><div class='del'>-		_leave(" = -ERESTARTSYS");</div><div class='del'>-		return -ERESTARTSYS;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ASSERT(!test_bit(FSCACHE_COOKIE_LOOKING_UP, &amp;cookie-&gt;flags));</div><div class='del'>-</div><div class='del'>-	smp_rmb();</div><div class='del'>-	_leave(" = 0 [dly]");</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * wait for an object to become active (or dead)</div><div class='del'>- */</div><div class='del'>-int fscache_wait_for_operation_activation(struct fscache_object *object,</div><div class='del'>-					  struct fscache_operation *op,</div><div class='del'>-					  atomic_t *stat_op_waits,</div><div class='del'>-					  atomic_t *stat_object_dead)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (!test_bit(FSCACHE_OP_WAITING, &amp;op-&gt;flags))</div><div class='del'>-		goto check_if_dead;</div><div class='del'>-</div><div class='del'>-	_debug("&gt;&gt;&gt; WT");</div><div class='del'>-	if (stat_op_waits)</div><div class='del'>-		fscache_stat(stat_op_waits);</div><div class='del'>-	if (wait_on_bit(&amp;op-&gt;flags, FSCACHE_OP_WAITING,</div><div class='del'>-			TASK_INTERRUPTIBLE) != 0) {</div><div class='del'>-		trace_fscache_op(object-&gt;cookie, op, fscache_op_signal);</div><div class='del'>-		ret = fscache_cancel_op(op, false);</div><div class='del'>-		if (ret == 0)</div><div class='del'>-			return -ERESTARTSYS;</div><div class='del'>-</div><div class='del'>-		/* it's been removed from the pending queue by another party,</div><div class='del'>-		 * so we should get to run shortly */</div><div class='del'>-		wait_on_bit(&amp;op-&gt;flags, FSCACHE_OP_WAITING,</div><div class='del'>-			    TASK_UNINTERRUPTIBLE);</div><div class='del'>-	}</div><div class='del'>-	_debug("&lt;&lt;&lt; GO");</div><div class='del'>-</div><div class='del'>-check_if_dead:</div><div class='del'>-	if (op-&gt;state == FSCACHE_OP_ST_CANCELLED) {</div><div class='del'>-		if (stat_object_dead)</div><div class='del'>-			fscache_stat(stat_object_dead);</div><div class='del'>-		_leave(" = -ENOBUFS [cancelled]");</div><div class='del'>-		return -ENOBUFS;</div><div class='del'>-	}</div><div class='del'>-	if (unlikely(fscache_object_is_dying(object) ||</div><div class='del'>-		     fscache_cache_is_broken(object))) {</div><div class='del'>-		enum fscache_operation_state state = op-&gt;state;</div><div class='del'>-		trace_fscache_op(object-&gt;cookie, op, fscache_op_signal);</div><div class='del'>-		fscache_cancel_op(op, true);</div><div class='del'>-		if (stat_object_dead)</div><div class='del'>-			fscache_stat(stat_object_dead);</div><div class='del'>-		_leave(" = -ENOBUFS [obj dead %d]", state);</div><div class='del'>-		return -ENOBUFS;</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * read a page from the cache or allocate a block in which to store it</div><div class='del'>- * - we return:</div><div class='del'>- *   -ENOMEM	- out of memory, nothing done</div><div class='del'>- *   -ERESTARTSYS - interrupted</div><div class='del'>- *   -ENOBUFS	- no backing object available in which to cache the block</div><div class='del'>- *   -ENODATA	- no data available in the backing object for this block</div><div class='del'>- *   0		- dispatched a read - it'll call end_io_func() when finished</div><div class='del'>- */</div><div class='del'>-int __fscache_read_or_alloc_page(struct fscache_cookie *cookie,</div><div class='del'>-				 struct page *page,</div><div class='del'>-				 fscache_rw_complete_t end_io_func,</div><div class='del'>-				 void *context,</div><div class='del'>-				 gfp_t gfp)</div><div class='del'>-{</div><div class='del'>-	struct fscache_retrieval *op;</div><div class='del'>-	struct fscache_object *object;</div><div class='del'>-	bool wake_cookie = false;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	_enter("%p,%p,,,", cookie, page);</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_retrievals);</div><div class='del'>-</div><div class='del'>-	if (hlist_empty(&amp;cookie-&gt;backing_objects))</div><div class='del'>-		goto nobufs;</div><div class='del'>-</div><div class='del'>-	if (test_bit(FSCACHE_COOKIE_INVALIDATING, &amp;cookie-&gt;flags)) {</div><div class='del'>-		_leave(" = -ENOBUFS [invalidating]");</div><div class='del'>-		return -ENOBUFS;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ASSERTCMP(cookie-&gt;def-&gt;type, !=, FSCACHE_COOKIE_TYPE_INDEX);</div><div class='del'>-	ASSERTCMP(page, !=, NULL);</div><div class='del'>-</div><div class='del'>-	if (fscache_wait_for_deferred_lookup(cookie) &lt; 0)</div><div class='del'>-		return -ERESTARTSYS;</div><div class='del'>-</div><div class='del'>-	op = fscache_alloc_retrieval(cookie, page-&gt;mapping,</div><div class='del'>-				     end_io_func, context);</div><div class='del'>-	if (!op) {</div><div class='del'>-		_leave(" = -ENOMEM");</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	}</div><div class='del'>-	atomic_set(&amp;op-&gt;n_pages, 1);</div><div class='del'>-	trace_fscache_page_op(cookie, page, &amp;op-&gt;op, fscache_page_op_retr_one);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;cookie-&gt;lock);</div><div class='del'>-</div><div class='del'>-	if (!fscache_cookie_enabled(cookie) ||</div><div class='del'>-	    hlist_empty(&amp;cookie-&gt;backing_objects))</div><div class='del'>-		goto nobufs_unlock;</div><div class='del'>-	object = hlist_entry(cookie-&gt;backing_objects.first,</div><div class='del'>-			     struct fscache_object, cookie_link);</div><div class='del'>-</div><div class='del'>-	ASSERT(test_bit(FSCACHE_OBJECT_IS_LOOKED_UP, &amp;object-&gt;flags));</div><div class='del'>-</div><div class='del'>-	__fscache_use_cookie(cookie);</div><div class='del'>-	atomic_inc(&amp;object-&gt;n_reads);</div><div class='del'>-	__set_bit(FSCACHE_OP_DEC_READ_CNT, &amp;op-&gt;op.flags);</div><div class='del'>-</div><div class='del'>-	if (fscache_submit_op(object, &amp;op-&gt;op) &lt; 0)</div><div class='del'>-		goto nobufs_unlock_dec;</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_retrieval_ops);</div><div class='del'>-</div><div class='del'>-	/* we wait for the operation to become active, and then process it</div><div class='del'>-	 * *here*, in this thread, and not in the thread pool */</div><div class='del'>-	ret = fscache_wait_for_operation_activation(</div><div class='del'>-		object, &amp;op-&gt;op,</div><div class='del'>-		__fscache_stat(&amp;fscache_n_retrieval_op_waits),</div><div class='del'>-		__fscache_stat(&amp;fscache_n_retrievals_object_dead));</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto error;</div><div class='del'>-</div><div class='del'>-	/* ask the cache to honour the operation */</div><div class='del'>-	if (test_bit(FSCACHE_COOKIE_NO_DATA_YET, &amp;object-&gt;cookie-&gt;flags)) {</div><div class='del'>-		fscache_stat(&amp;fscache_n_cop_allocate_page);</div><div class='del'>-		ret = object-&gt;cache-&gt;ops-&gt;allocate_page(op, page, gfp);</div><div class='del'>-		fscache_stat_d(&amp;fscache_n_cop_allocate_page);</div><div class='del'>-		if (ret == 0)</div><div class='del'>-			ret = -ENODATA;</div><div class='del'>-	} else {</div><div class='del'>-		fscache_stat(&amp;fscache_n_cop_read_or_alloc_page);</div><div class='del'>-		ret = object-&gt;cache-&gt;ops-&gt;read_or_alloc_page(op, page, gfp);</div><div class='del'>-		fscache_stat_d(&amp;fscache_n_cop_read_or_alloc_page);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-error:</div><div class='del'>-	if (ret == -ENOMEM)</div><div class='del'>-		fscache_stat(&amp;fscache_n_retrievals_nomem);</div><div class='del'>-	else if (ret == -ERESTARTSYS)</div><div class='del'>-		fscache_stat(&amp;fscache_n_retrievals_intr);</div><div class='del'>-	else if (ret == -ENODATA)</div><div class='del'>-		fscache_stat(&amp;fscache_n_retrievals_nodata);</div><div class='del'>-	else if (ret &lt; 0)</div><div class='del'>-		fscache_stat(&amp;fscache_n_retrievals_nobufs);</div><div class='del'>-	else</div><div class='del'>-		fscache_stat(&amp;fscache_n_retrievals_ok);</div><div class='del'>-</div><div class='del'>-	fscache_put_retrieval(op);</div><div class='del'>-	_leave(" = %d", ret);</div><div class='del'>-	return ret;</div><div class='del'>-</div><div class='del'>-nobufs_unlock_dec:</div><div class='del'>-	atomic_dec(&amp;object-&gt;n_reads);</div><div class='del'>-	wake_cookie = __fscache_unuse_cookie(cookie);</div><div class='del'>-nobufs_unlock:</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-	if (wake_cookie)</div><div class='del'>-		__fscache_wake_unused_cookie(cookie);</div><div class='del'>-	fscache_put_retrieval(op);</div><div class='del'>-nobufs:</div><div class='del'>-	fscache_stat(&amp;fscache_n_retrievals_nobufs);</div><div class='del'>-	_leave(" = -ENOBUFS");</div><div class='del'>-	return -ENOBUFS;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(__fscache_read_or_alloc_page);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * read a list of page from the cache or allocate a block in which to store</div><div class='del'>- * them</div><div class='del'>- * - we return:</div><div class='del'>- *   -ENOMEM	- out of memory, some pages may be being read</div><div class='del'>- *   -ERESTARTSYS - interrupted, some pages may be being read</div><div class='del'>- *   -ENOBUFS	- no backing object or space available in which to cache any</div><div class='del'>- *                pages not being read</div><div class='del'>- *   -ENODATA	- no data available in the backing object for some or all of</div><div class='del'>- *                the pages</div><div class='del'>- *   0		- dispatched a read on all pages</div><div class='del'>- *</div><div class='del'>- * end_io_func() will be called for each page read from the cache as it is</div><div class='del'>- * finishes being read</div><div class='del'>- *</div><div class='del'>- * any pages for which a read is dispatched will be removed from pages and</div><div class='del'>- * nr_pages</div><div class='del'>- */</div><div class='del'>-int __fscache_read_or_alloc_pages(struct fscache_cookie *cookie,</div><div class='del'>-				  struct address_space *mapping,</div><div class='del'>-				  struct list_head *pages,</div><div class='del'>-				  unsigned *nr_pages,</div><div class='del'>-				  fscache_rw_complete_t end_io_func,</div><div class='del'>-				  void *context,</div><div class='del'>-				  gfp_t gfp)</div><div class='del'>-{</div><div class='del'>-	struct fscache_retrieval *op;</div><div class='del'>-	struct fscache_object *object;</div><div class='del'>-	bool wake_cookie = false;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	_enter("%p,,%d,,,", cookie, *nr_pages);</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_retrievals);</div><div class='del'>-</div><div class='del'>-	if (hlist_empty(&amp;cookie-&gt;backing_objects))</div><div class='del'>-		goto nobufs;</div><div class='del'>-</div><div class='del'>-	if (test_bit(FSCACHE_COOKIE_INVALIDATING, &amp;cookie-&gt;flags)) {</div><div class='del'>-		_leave(" = -ENOBUFS [invalidating]");</div><div class='del'>-		return -ENOBUFS;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ASSERTCMP(cookie-&gt;def-&gt;type, !=, FSCACHE_COOKIE_TYPE_INDEX);</div><div class='del'>-	ASSERTCMP(*nr_pages, &gt;, 0);</div><div class='del'>-	ASSERT(!list_empty(pages));</div><div class='del'>-</div><div class='del'>-	if (fscache_wait_for_deferred_lookup(cookie) &lt; 0)</div><div class='del'>-		return -ERESTARTSYS;</div><div class='del'>-</div><div class='del'>-	op = fscache_alloc_retrieval(cookie, mapping, end_io_func, context);</div><div class='del'>-	if (!op)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	atomic_set(&amp;op-&gt;n_pages, *nr_pages);</div><div class='del'>-	trace_fscache_page_op(cookie, NULL, &amp;op-&gt;op, fscache_page_op_retr_multi);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;cookie-&gt;lock);</div><div class='del'>-</div><div class='del'>-	if (!fscache_cookie_enabled(cookie) ||</div><div class='del'>-	    hlist_empty(&amp;cookie-&gt;backing_objects))</div><div class='del'>-		goto nobufs_unlock;</div><div class='del'>-	object = hlist_entry(cookie-&gt;backing_objects.first,</div><div class='del'>-			     struct fscache_object, cookie_link);</div><div class='del'>-</div><div class='del'>-	__fscache_use_cookie(cookie);</div><div class='del'>-	atomic_inc(&amp;object-&gt;n_reads);</div><div class='del'>-	__set_bit(FSCACHE_OP_DEC_READ_CNT, &amp;op-&gt;op.flags);</div><div class='del'>-</div><div class='del'>-	if (fscache_submit_op(object, &amp;op-&gt;op) &lt; 0)</div><div class='del'>-		goto nobufs_unlock_dec;</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_retrieval_ops);</div><div class='del'>-</div><div class='del'>-	/* we wait for the operation to become active, and then process it</div><div class='del'>-	 * *here*, in this thread, and not in the thread pool */</div><div class='del'>-	ret = fscache_wait_for_operation_activation(</div><div class='del'>-		object, &amp;op-&gt;op,</div><div class='del'>-		__fscache_stat(&amp;fscache_n_retrieval_op_waits),</div><div class='del'>-		__fscache_stat(&amp;fscache_n_retrievals_object_dead));</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto error;</div><div class='del'>-</div><div class='del'>-	/* ask the cache to honour the operation */</div><div class='del'>-	if (test_bit(FSCACHE_COOKIE_NO_DATA_YET, &amp;object-&gt;cookie-&gt;flags)) {</div><div class='del'>-		fscache_stat(&amp;fscache_n_cop_allocate_pages);</div><div class='del'>-		ret = object-&gt;cache-&gt;ops-&gt;allocate_pages(</div><div class='del'>-			op, pages, nr_pages, gfp);</div><div class='del'>-		fscache_stat_d(&amp;fscache_n_cop_allocate_pages);</div><div class='del'>-	} else {</div><div class='del'>-		fscache_stat(&amp;fscache_n_cop_read_or_alloc_pages);</div><div class='del'>-		ret = object-&gt;cache-&gt;ops-&gt;read_or_alloc_pages(</div><div class='del'>-			op, pages, nr_pages, gfp);</div><div class='del'>-		fscache_stat_d(&amp;fscache_n_cop_read_or_alloc_pages);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-error:</div><div class='del'>-	if (ret == -ENOMEM)</div><div class='del'>-		fscache_stat(&amp;fscache_n_retrievals_nomem);</div><div class='del'>-	else if (ret == -ERESTARTSYS)</div><div class='del'>-		fscache_stat(&amp;fscache_n_retrievals_intr);</div><div class='del'>-	else if (ret == -ENODATA)</div><div class='del'>-		fscache_stat(&amp;fscache_n_retrievals_nodata);</div><div class='del'>-	else if (ret &lt; 0)</div><div class='del'>-		fscache_stat(&amp;fscache_n_retrievals_nobufs);</div><div class='del'>-	else</div><div class='del'>-		fscache_stat(&amp;fscache_n_retrievals_ok);</div><div class='del'>-</div><div class='del'>-	fscache_put_retrieval(op);</div><div class='del'>-	_leave(" = %d", ret);</div><div class='del'>-	return ret;</div><div class='del'>-</div><div class='del'>-nobufs_unlock_dec:</div><div class='del'>-	atomic_dec(&amp;object-&gt;n_reads);</div><div class='del'>-	wake_cookie = __fscache_unuse_cookie(cookie);</div><div class='del'>-nobufs_unlock:</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-	fscache_put_retrieval(op);</div><div class='del'>-	if (wake_cookie)</div><div class='del'>-		__fscache_wake_unused_cookie(cookie);</div><div class='del'>-nobufs:</div><div class='del'>-	fscache_stat(&amp;fscache_n_retrievals_nobufs);</div><div class='del'>-	_leave(" = -ENOBUFS");</div><div class='del'>-	return -ENOBUFS;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(__fscache_read_or_alloc_pages);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * allocate a block in the cache on which to store a page</div><div class='del'>- * - we return:</div><div class='del'>- *   -ENOMEM	- out of memory, nothing done</div><div class='del'>- *   -ERESTARTSYS - interrupted</div><div class='del'>- *   -ENOBUFS	- no backing object available in which to cache the block</div><div class='del'>- *   0		- block allocated</div><div class='del'>- */</div><div class='del'>-int __fscache_alloc_page(struct fscache_cookie *cookie,</div><div class='del'>-			 struct page *page,</div><div class='del'>-			 gfp_t gfp)</div><div class='del'>-{</div><div class='del'>-	struct fscache_retrieval *op;</div><div class='del'>-	struct fscache_object *object;</div><div class='del'>-	bool wake_cookie = false;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	_enter("%p,%p,,,", cookie, page);</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_allocs);</div><div class='del'>-</div><div class='del'>-	if (hlist_empty(&amp;cookie-&gt;backing_objects))</div><div class='del'>-		goto nobufs;</div><div class='del'>-</div><div class='del'>-	ASSERTCMP(cookie-&gt;def-&gt;type, !=, FSCACHE_COOKIE_TYPE_INDEX);</div><div class='del'>-	ASSERTCMP(page, !=, NULL);</div><div class='del'>-</div><div class='del'>-	if (test_bit(FSCACHE_COOKIE_INVALIDATING, &amp;cookie-&gt;flags)) {</div><div class='del'>-		_leave(" = -ENOBUFS [invalidating]");</div><div class='del'>-		return -ENOBUFS;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (fscache_wait_for_deferred_lookup(cookie) &lt; 0)</div><div class='del'>-		return -ERESTARTSYS;</div><div class='del'>-</div><div class='del'>-	op = fscache_alloc_retrieval(cookie, page-&gt;mapping, NULL, NULL);</div><div class='del'>-	if (!op)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	atomic_set(&amp;op-&gt;n_pages, 1);</div><div class='del'>-	trace_fscache_page_op(cookie, page, &amp;op-&gt;op, fscache_page_op_alloc_one);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;cookie-&gt;lock);</div><div class='del'>-</div><div class='del'>-	if (!fscache_cookie_enabled(cookie) ||</div><div class='del'>-	    hlist_empty(&amp;cookie-&gt;backing_objects))</div><div class='del'>-		goto nobufs_unlock;</div><div class='del'>-	object = hlist_entry(cookie-&gt;backing_objects.first,</div><div class='del'>-			     struct fscache_object, cookie_link);</div><div class='del'>-</div><div class='del'>-	__fscache_use_cookie(cookie);</div><div class='del'>-	if (fscache_submit_op(object, &amp;op-&gt;op) &lt; 0)</div><div class='del'>-		goto nobufs_unlock_dec;</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_alloc_ops);</div><div class='del'>-</div><div class='del'>-	ret = fscache_wait_for_operation_activation(</div><div class='del'>-		object, &amp;op-&gt;op,</div><div class='del'>-		__fscache_stat(&amp;fscache_n_alloc_op_waits),</div><div class='del'>-		__fscache_stat(&amp;fscache_n_allocs_object_dead));</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto error;</div><div class='del'>-</div><div class='del'>-	/* ask the cache to honour the operation */</div><div class='del'>-	fscache_stat(&amp;fscache_n_cop_allocate_page);</div><div class='del'>-	ret = object-&gt;cache-&gt;ops-&gt;allocate_page(op, page, gfp);</div><div class='del'>-	fscache_stat_d(&amp;fscache_n_cop_allocate_page);</div><div class='del'>-</div><div class='del'>-error:</div><div class='del'>-	if (ret == -ERESTARTSYS)</div><div class='del'>-		fscache_stat(&amp;fscache_n_allocs_intr);</div><div class='del'>-	else if (ret &lt; 0)</div><div class='del'>-		fscache_stat(&amp;fscache_n_allocs_nobufs);</div><div class='del'>-	else</div><div class='del'>-		fscache_stat(&amp;fscache_n_allocs_ok);</div><div class='del'>-</div><div class='del'>-	fscache_put_retrieval(op);</div><div class='del'>-	_leave(" = %d", ret);</div><div class='del'>-	return ret;</div><div class='del'>-</div><div class='del'>-nobufs_unlock_dec:</div><div class='del'>-	wake_cookie = __fscache_unuse_cookie(cookie);</div><div class='del'>-nobufs_unlock:</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-	fscache_put_retrieval(op);</div><div class='del'>-	if (wake_cookie)</div><div class='del'>-		__fscache_wake_unused_cookie(cookie);</div><div class='del'>-nobufs:</div><div class='del'>-	fscache_stat(&amp;fscache_n_allocs_nobufs);</div><div class='del'>-	_leave(" = -ENOBUFS");</div><div class='del'>-	return -ENOBUFS;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(__fscache_alloc_page);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Unmark pages allocate in the readahead code path (via:</div><div class='del'>- * fscache_readpages_or_alloc) after delegating to the base filesystem</div><div class='del'>- */</div><div class='del'>-void __fscache_readpages_cancel(struct fscache_cookie *cookie,</div><div class='del'>-				struct list_head *pages)</div><div class='del'>-{</div><div class='del'>-	struct page *page;</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(page, pages, lru) {</div><div class='del'>-		if (PageFsCache(page))</div><div class='del'>-			__fscache_uncache_page(cookie, page);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(__fscache_readpages_cancel);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * release a write op reference</div><div class='del'>- */</div><div class='del'>-static void fscache_release_write_op(struct fscache_operation *_op)</div><div class='del'>-{</div><div class='del'>-	_enter("{OP%x}", _op-&gt;debug_id);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * perform the background storage of a page into the cache</div><div class='del'>- */</div><div class='del'>-static void fscache_write_op(struct fscache_operation *_op)</div><div class='del'>-{</div><div class='del'>-	struct fscache_storage *op =</div><div class='del'>-		container_of(_op, struct fscache_storage, op);</div><div class='del'>-	struct fscache_object *object = op-&gt;op.object;</div><div class='del'>-	struct fscache_cookie *cookie;</div><div class='del'>-	struct page *page;</div><div class='del'>-	unsigned n;</div><div class='del'>-	void *results[1];</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	_enter("{OP%x,%d}", op-&gt;op.debug_id, atomic_read(&amp;op-&gt;op.usage));</div><div class='del'>-</div><div class='del'>-again:</div><div class='del'>-	spin_lock(&amp;object-&gt;lock);</div><div class='del'>-	cookie = object-&gt;cookie;</div><div class='del'>-</div><div class='del'>-	if (!fscache_object_is_active(object)) {</div><div class='del'>-		/* If we get here, then the on-disk cache object likely no</div><div class='del'>-		 * longer exists, so we should just cancel this write</div><div class='del'>-		 * operation.</div><div class='del'>-		 */</div><div class='del'>-		spin_unlock(&amp;object-&gt;lock);</div><div class='del'>-		fscache_op_complete(&amp;op-&gt;op, true);</div><div class='del'>-		_leave(" [inactive]");</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!cookie) {</div><div class='del'>-		/* If we get here, then the cookie belonging to the object was</div><div class='del'>-		 * detached, probably by the cookie being withdrawn due to</div><div class='del'>-		 * memory pressure, which means that the pages we might write</div><div class='del'>-		 * to the cache from no longer exist - therefore, we can just</div><div class='del'>-		 * cancel this write operation.</div><div class='del'>-		 */</div><div class='del'>-		spin_unlock(&amp;object-&gt;lock);</div><div class='del'>-		fscache_op_complete(&amp;op-&gt;op, true);</div><div class='del'>-		_leave(" [cancel] op{f=%lx s=%u} obj{s=%s f=%lx}",</div><div class='del'>-		       _op-&gt;flags, _op-&gt;state, object-&gt;state-&gt;short_name,</div><div class='del'>-		       object-&gt;flags);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;cookie-&gt;stores_lock);</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_store_calls);</div><div class='del'>-</div><div class='del'>-	/* find a page to store */</div><div class='del'>-	results[0] = NULL;</div><div class='del'>-	page = NULL;</div><div class='del'>-	n = radix_tree_gang_lookup_tag(&amp;cookie-&gt;stores, results, 0, 1,</div><div class='del'>-				       FSCACHE_COOKIE_PENDING_TAG);</div><div class='del'>-	trace_fscache_gang_lookup(cookie, &amp;op-&gt;op, results, n, op-&gt;store_limit);</div><div class='del'>-	if (n != 1)</div><div class='del'>-		goto superseded;</div><div class='del'>-	page = results[0];</div><div class='del'>-	_debug("gang %d [%lx]", n, page-&gt;index);</div><div class='del'>-</div><div class='del'>-	radix_tree_tag_set(&amp;cookie-&gt;stores, page-&gt;index,</div><div class='del'>-			   FSCACHE_COOKIE_STORING_TAG);</div><div class='del'>-	radix_tree_tag_clear(&amp;cookie-&gt;stores, page-&gt;index,</div><div class='del'>-			     FSCACHE_COOKIE_PENDING_TAG);</div><div class='del'>-	trace_fscache_page(cookie, page, fscache_page_radix_pend2store);</div><div class='del'>-</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;stores_lock);</div><div class='del'>-	spin_unlock(&amp;object-&gt;lock);</div><div class='del'>-</div><div class='del'>-	if (page-&gt;index &gt;= op-&gt;store_limit)</div><div class='del'>-		goto discard_page;</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_store_pages);</div><div class='del'>-	fscache_stat(&amp;fscache_n_cop_write_page);</div><div class='del'>-	ret = object-&gt;cache-&gt;ops-&gt;write_page(op, page);</div><div class='del'>-	fscache_stat_d(&amp;fscache_n_cop_write_page);</div><div class='del'>-	trace_fscache_wrote_page(cookie, page, &amp;op-&gt;op, ret);</div><div class='del'>-	fscache_end_page_write(object, page);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		fscache_abort_object(object);</div><div class='del'>-		fscache_op_complete(&amp;op-&gt;op, true);</div><div class='del'>-	} else {</div><div class='del'>-		fscache_enqueue_operation(&amp;op-&gt;op);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	_leave("");</div><div class='del'>-	return;</div><div class='del'>-</div><div class='del'>-discard_page:</div><div class='del'>-	fscache_stat(&amp;fscache_n_store_pages_over_limit);</div><div class='del'>-	trace_fscache_wrote_page(cookie, page, &amp;op-&gt;op, -ENOBUFS);</div><div class='del'>-	fscache_end_page_write(object, page);</div><div class='del'>-	goto again;</div><div class='del'>-</div><div class='del'>-superseded:</div><div class='del'>-	/* this writer is going away and there aren't any more things to</div><div class='del'>-	 * write */</div><div class='del'>-	_debug("cease");</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;stores_lock);</div><div class='del'>-	clear_bit(FSCACHE_OBJECT_PENDING_WRITE, &amp;object-&gt;flags);</div><div class='del'>-	spin_unlock(&amp;object-&gt;lock);</div><div class='del'>-	fscache_op_complete(&amp;op-&gt;op, false);</div><div class='del'>-	_leave("");</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Clear the pages pending writing for invalidation</div><div class='del'>- */</div><div class='del'>-void fscache_invalidate_writes(struct fscache_cookie *cookie)</div><div class='del'>-{</div><div class='del'>-	struct page *page;</div><div class='del'>-	void *results[16];</div><div class='del'>-	int n, i;</div><div class='del'>-</div><div class='del'>-	_enter("");</div><div class='del'>-</div><div class='del'>-	for (;;) {</div><div class='del'>-		spin_lock(&amp;cookie-&gt;stores_lock);</div><div class='del'>-		n = radix_tree_gang_lookup_tag(&amp;cookie-&gt;stores, results, 0,</div><div class='del'>-					       ARRAY_SIZE(results),</div><div class='del'>-					       FSCACHE_COOKIE_PENDING_TAG);</div><div class='del'>-		if (n == 0) {</div><div class='del'>-			spin_unlock(&amp;cookie-&gt;stores_lock);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		for (i = n - 1; i &gt;= 0; i--) {</div><div class='del'>-			page = results[i];</div><div class='del'>-			radix_tree_delete(&amp;cookie-&gt;stores, page-&gt;index);</div><div class='del'>-			trace_fscache_page(cookie, page, fscache_page_radix_delete);</div><div class='del'>-			trace_fscache_page(cookie, page, fscache_page_inval);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		spin_unlock(&amp;cookie-&gt;stores_lock);</div><div class='del'>-</div><div class='del'>-		for (i = n - 1; i &gt;= 0; i--)</div><div class='del'>-			put_page(results[i]);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	wake_up_bit(&amp;cookie-&gt;flags, 0);</div><div class='del'>-	trace_fscache_wake_cookie(cookie);</div><div class='del'>-</div><div class='del'>-	_leave("");</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * request a page be stored in the cache</div><div class='del'>- * - returns:</div><div class='del'>- *   -ENOMEM	- out of memory, nothing done</div><div class='del'>- *   -ENOBUFS	- no backing object available in which to cache the page</div><div class='del'>- *   0		- dispatched a write - it'll call end_io_func() when finished</div><div class='del'>- *</div><div class='del'>- * if the cookie still has a backing object at this point, that object can be</div><div class='del'>- * in one of a few states with respect to storage processing:</div><div class='del'>- *</div><div class='del'>- *  (1) negative lookup, object not yet created (FSCACHE_COOKIE_CREATING is</div><div class='del'>- *      set)</div><div class='del'>- *</div><div class='del'>- *	(a) no writes yet</div><div class='del'>- *</div><div class='del'>- *	(b) writes deferred till post-creation (mark page for writing and</div><div class='del'>- *	    return immediately)</div><div class='del'>- *</div><div class='del'>- *  (2) negative lookup, object created, initial fill being made from netfs</div><div class='del'>- *</div><div class='del'>- *	(a) fill point not yet reached this page (mark page for writing and</div><div class='del'>- *          return)</div><div class='del'>- *</div><div class='del'>- *	(b) fill point passed this page (queue op to store this page)</div><div class='del'>- *</div><div class='del'>- *  (3) object extant (queue op to store this page)</div><div class='del'>- *</div><div class='del'>- * any other state is invalid</div><div class='del'>- */</div><div class='del'>-int __fscache_write_page(struct fscache_cookie *cookie,</div><div class='del'>-			 struct page *page,</div><div class='del'>-			 loff_t object_size,</div><div class='del'>-			 gfp_t gfp)</div><div class='del'>-{</div><div class='del'>-	struct fscache_storage *op;</div><div class='del'>-	struct fscache_object *object;</div><div class='del'>-	bool wake_cookie = false;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	_enter("%p,%x,", cookie, (u32) page-&gt;flags);</div><div class='del'>-</div><div class='del'>-	ASSERTCMP(cookie-&gt;def-&gt;type, !=, FSCACHE_COOKIE_TYPE_INDEX);</div><div class='del'>-	ASSERT(PageFsCache(page));</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_stores);</div><div class='del'>-</div><div class='del'>-	if (test_bit(FSCACHE_COOKIE_INVALIDATING, &amp;cookie-&gt;flags)) {</div><div class='del'>-		_leave(" = -ENOBUFS [invalidating]");</div><div class='del'>-		return -ENOBUFS;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	op = kzalloc(sizeof(*op), GFP_NOIO | __GFP_NOMEMALLOC | __GFP_NORETRY);</div><div class='del'>-	if (!op)</div><div class='del'>-		goto nomem;</div><div class='del'>-</div><div class='del'>-	fscache_operation_init(cookie, &amp;op-&gt;op, fscache_write_op, NULL,</div><div class='del'>-			       fscache_release_write_op);</div><div class='del'>-	op-&gt;op.flags = FSCACHE_OP_ASYNC |</div><div class='del'>-		(1 &lt;&lt; FSCACHE_OP_WAITING) |</div><div class='del'>-		(1 &lt;&lt; FSCACHE_OP_UNUSE_COOKIE);</div><div class='del'>-</div><div class='del'>-	ret = radix_tree_maybe_preload(gfp &amp; ~__GFP_HIGHMEM);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto nomem_free;</div><div class='del'>-</div><div class='del'>-	trace_fscache_page_op(cookie, page, &amp;op-&gt;op, fscache_page_op_write_one);</div><div class='del'>-</div><div class='del'>-	ret = -ENOBUFS;</div><div class='del'>-	spin_lock(&amp;cookie-&gt;lock);</div><div class='del'>-</div><div class='del'>-	if (!fscache_cookie_enabled(cookie) ||</div><div class='del'>-	    hlist_empty(&amp;cookie-&gt;backing_objects))</div><div class='del'>-		goto nobufs;</div><div class='del'>-	object = hlist_entry(cookie-&gt;backing_objects.first,</div><div class='del'>-			     struct fscache_object, cookie_link);</div><div class='del'>-	if (test_bit(FSCACHE_IOERROR, &amp;object-&gt;cache-&gt;flags))</div><div class='del'>-		goto nobufs;</div><div class='del'>-</div><div class='del'>-	trace_fscache_page(cookie, page, fscache_page_write);</div><div class='del'>-</div><div class='del'>-	/* add the page to the pending-storage radix tree on the backing</div><div class='del'>-	 * object */</div><div class='del'>-	spin_lock(&amp;object-&gt;lock);</div><div class='del'>-</div><div class='del'>-	if (object-&gt;store_limit_l != object_size)</div><div class='del'>-		fscache_set_store_limit(object, object_size);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;cookie-&gt;stores_lock);</div><div class='del'>-</div><div class='del'>-	_debug("store limit %llx", (unsigned long long) object-&gt;store_limit);</div><div class='del'>-</div><div class='del'>-	ret = radix_tree_insert(&amp;cookie-&gt;stores, page-&gt;index, page);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		if (ret == -EEXIST)</div><div class='del'>-			goto already_queued;</div><div class='del'>-		_debug("insert failed %d", ret);</div><div class='del'>-		goto nobufs_unlock_obj;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	trace_fscache_page(cookie, page, fscache_page_radix_insert);</div><div class='del'>-	radix_tree_tag_set(&amp;cookie-&gt;stores, page-&gt;index,</div><div class='del'>-			   FSCACHE_COOKIE_PENDING_TAG);</div><div class='del'>-	trace_fscache_page(cookie, page, fscache_page_radix_set_pend);</div><div class='del'>-	get_page(page);</div><div class='del'>-</div><div class='del'>-	/* we only want one writer at a time, but we do need to queue new</div><div class='del'>-	 * writers after exclusive ops */</div><div class='del'>-	if (test_and_set_bit(FSCACHE_OBJECT_PENDING_WRITE, &amp;object-&gt;flags))</div><div class='del'>-		goto already_pending;</div><div class='del'>-</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;stores_lock);</div><div class='del'>-	spin_unlock(&amp;object-&gt;lock);</div><div class='del'>-</div><div class='del'>-	op-&gt;op.debug_id	= atomic_inc_return(&amp;fscache_op_debug_id);</div><div class='del'>-	op-&gt;store_limit = object-&gt;store_limit;</div><div class='del'>-</div><div class='del'>-	__fscache_use_cookie(cookie);</div><div class='del'>-	if (fscache_submit_op(object, &amp;op-&gt;op) &lt; 0)</div><div class='del'>-		goto submit_failed;</div><div class='del'>-</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-	radix_tree_preload_end();</div><div class='del'>-	fscache_stat(&amp;fscache_n_store_ops);</div><div class='del'>-	fscache_stat(&amp;fscache_n_stores_ok);</div><div class='del'>-</div><div class='del'>-	/* the work queue now carries its own ref on the object */</div><div class='del'>-	fscache_put_operation(&amp;op-&gt;op);</div><div class='del'>-	_leave(" = 0");</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-already_queued:</div><div class='del'>-	fscache_stat(&amp;fscache_n_stores_again);</div><div class='del'>-already_pending:</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;stores_lock);</div><div class='del'>-	spin_unlock(&amp;object-&gt;lock);</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-	radix_tree_preload_end();</div><div class='del'>-	fscache_put_operation(&amp;op-&gt;op);</div><div class='del'>-	fscache_stat(&amp;fscache_n_stores_ok);</div><div class='del'>-	_leave(" = 0");</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-submit_failed:</div><div class='del'>-	spin_lock(&amp;cookie-&gt;stores_lock);</div><div class='del'>-	radix_tree_delete(&amp;cookie-&gt;stores, page-&gt;index);</div><div class='del'>-	trace_fscache_page(cookie, page, fscache_page_radix_delete);</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;stores_lock);</div><div class='del'>-	wake_cookie = __fscache_unuse_cookie(cookie);</div><div class='del'>-	put_page(page);</div><div class='del'>-	ret = -ENOBUFS;</div><div class='del'>-	goto nobufs;</div><div class='del'>-</div><div class='del'>-nobufs_unlock_obj:</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;stores_lock);</div><div class='del'>-	spin_unlock(&amp;object-&gt;lock);</div><div class='del'>-nobufs:</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-	radix_tree_preload_end();</div><div class='del'>-	fscache_put_operation(&amp;op-&gt;op);</div><div class='del'>-	if (wake_cookie)</div><div class='del'>-		__fscache_wake_unused_cookie(cookie);</div><div class='del'>-	fscache_stat(&amp;fscache_n_stores_nobufs);</div><div class='del'>-	_leave(" = -ENOBUFS");</div><div class='del'>-	return -ENOBUFS;</div><div class='del'>-</div><div class='del'>-nomem_free:</div><div class='del'>-	fscache_put_operation(&amp;op-&gt;op);</div><div class='del'>-nomem:</div><div class='del'>-	fscache_stat(&amp;fscache_n_stores_oom);</div><div class='del'>-	_leave(" = -ENOMEM");</div><div class='del'>-	return -ENOMEM;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(__fscache_write_page);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * remove a page from the cache</div><div class='del'>- */</div><div class='del'>-void __fscache_uncache_page(struct fscache_cookie *cookie, struct page *page)</div><div class='del'>-{</div><div class='del'>-	struct fscache_object *object;</div><div class='del'>-</div><div class='del'>-	_enter(",%p", page);</div><div class='del'>-</div><div class='del'>-	ASSERTCMP(cookie-&gt;def-&gt;type, !=, FSCACHE_COOKIE_TYPE_INDEX);</div><div class='del'>-	ASSERTCMP(page, !=, NULL);</div><div class='del'>-</div><div class='del'>-	fscache_stat(&amp;fscache_n_uncaches);</div><div class='del'>-</div><div class='del'>-	/* cache withdrawal may beat us to it */</div><div class='del'>-	if (!PageFsCache(page))</div><div class='del'>-		goto done;</div><div class='del'>-</div><div class='del'>-	trace_fscache_page(cookie, page, fscache_page_uncache);</div><div class='del'>-</div><div class='del'>-	/* get the object */</div><div class='del'>-	spin_lock(&amp;cookie-&gt;lock);</div><div class='del'>-</div><div class='del'>-	if (hlist_empty(&amp;cookie-&gt;backing_objects)) {</div><div class='del'>-		ClearPageFsCache(page);</div><div class='del'>-		goto done_unlock;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	object = hlist_entry(cookie-&gt;backing_objects.first,</div><div class='del'>-			     struct fscache_object, cookie_link);</div><div class='del'>-</div><div class='del'>-	/* there might now be stuff on disk we could read */</div><div class='del'>-	clear_bit(FSCACHE_COOKIE_NO_DATA_YET, &amp;cookie-&gt;flags);</div><div class='del'>-</div><div class='del'>-	/* only invoke the cache backend if we managed to mark the page</div><div class='del'>-	 * uncached here; this deals with synchronisation vs withdrawal */</div><div class='del'>-	if (TestClearPageFsCache(page) &amp;&amp;</div><div class='del'>-	    object-&gt;cache-&gt;ops-&gt;uncache_page) {</div><div class='del'>-		/* the cache backend releases the cookie lock */</div><div class='del'>-		fscache_stat(&amp;fscache_n_cop_uncache_page);</div><div class='del'>-		object-&gt;cache-&gt;ops-&gt;uncache_page(object, page);</div><div class='del'>-		fscache_stat_d(&amp;fscache_n_cop_uncache_page);</div><div class='del'>-		goto done;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-done_unlock:</div><div class='del'>-	spin_unlock(&amp;cookie-&gt;lock);</div><div class='del'>-done:</div><div class='del'>-	_leave("");</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(__fscache_uncache_page);</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * fscache_mark_page_cached - Mark a page as being cached</div><div class='del'>- * @op: The retrieval op pages are being marked for</div><div class='del'>- * @page: The page to be marked</div><div class='del'>- *</div><div class='del'>- * Mark a netfs page as being cached.  After this is called, the netfs</div><div class='del'>- * must call fscache_uncache_page() to remove the mark.</div><div class='del'>- */</div><div class='del'>-void fscache_mark_page_cached(struct fscache_retrieval *op, struct page *page)</div><div class='del'>-{</div><div class='del'>-	struct fscache_cookie *cookie = op-&gt;op.object-&gt;cookie;</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_FSCACHE_STATS</div><div class='del'>-	atomic_inc(&amp;fscache_n_marks);</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-	trace_fscache_page(cookie, page, fscache_page_cached);</div><div class='del'>-</div><div class='del'>-	_debug("- mark %p{%lx}", page, page-&gt;index);</div><div class='del'>-	if (TestSetPageFsCache(page)) {</div><div class='del'>-		static bool once_only;</div><div class='del'>-		if (!once_only) {</div><div class='del'>-			once_only = true;</div><div class='del'>-			pr_warn("Cookie type %s marked page %lx multiple times\n",</div><div class='del'>-				cookie-&gt;def-&gt;name, page-&gt;index);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (cookie-&gt;def-&gt;mark_page_cached)</div><div class='del'>-		cookie-&gt;def-&gt;mark_page_cached(cookie-&gt;netfs_data,</div><div class='del'>-					      op-&gt;mapping, page);</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(fscache_mark_page_cached);</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * fscache_mark_pages_cached - Mark pages as being cached</div><div class='del'>- * @op: The retrieval op pages are being marked for</div><div class='del'>- * @pagevec: The pages to be marked</div><div class='del'>- *</div><div class='del'>- * Mark a bunch of netfs pages as being cached.  After this is called,</div><div class='del'>- * the netfs must call fscache_uncache_page() to remove the mark.</div><div class='del'>- */</div><div class='del'>-void fscache_mark_pages_cached(struct fscache_retrieval *op,</div><div class='del'>-			       struct pagevec *pagevec)</div><div class='del'>-{</div><div class='del'>-	unsigned long loop;</div><div class='del'>-</div><div class='del'>-	for (loop = 0; loop &lt; pagevec-&gt;nr; loop++)</div><div class='del'>-		fscache_mark_page_cached(op, pagevec-&gt;pages[loop]);</div><div class='del'>-</div><div class='del'>-	pagevec_reinit(pagevec);</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(fscache_mark_pages_cached);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Uncache all the pages in an inode that are marked PG_fscache, assuming them</div><div class='del'>- * to be associated with the given cookie.</div><div class='del'>- */</div><div class='del'>-void __fscache_uncache_all_inode_pages(struct fscache_cookie *cookie,</div><div class='del'>-				       struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='del'>-	struct pagevec pvec;</div><div class='del'>-	pgoff_t next;</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	_enter("%p,%p", cookie, inode);</div><div class='del'>-</div><div class='del'>-	if (!mapping || mapping-&gt;nrpages == 0) {</div><div class='del'>-		_leave(" [no pages]");</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	pagevec_init(&amp;pvec);</div><div class='del'>-	next = 0;</div><div class='del'>-	do {</div><div class='del'>-		if (!pagevec_lookup(&amp;pvec, mapping, &amp;next))</div><div class='del'>-			break;</div><div class='del'>-		for (i = 0; i &lt; pagevec_count(&amp;pvec); i++) {</div><div class='del'>-			struct page *page = pvec.pages[i];</div><div class='del'>-			if (PageFsCache(page)) {</div><div class='del'>-				__fscache_wait_on_page_write(cookie, page);</div><div class='del'>-				__fscache_uncache_page(cookie, page);</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-		pagevec_release(&amp;pvec);</div><div class='del'>-		cond_resched();</div><div class='del'>-	} while (next);</div><div class='del'>-</div><div class='del'>-	_leave("");</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(__fscache_uncache_all_inode_pages);</div><div class='head'>diff --git a/fs/fscache/proc.c b/fs/fscache/proc.c<br/>deleted file mode 100644<br/>index 061df8f61ffc..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fscache/proc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fscache/proc.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,71 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='del'>-/* FS-Cache statistics viewing interface</div><div class='del'>- *</div><div class='del'>- * Copyright (C) 2007 Red Hat, Inc. All Rights Reserved.</div><div class='del'>- * Written by David Howells (dhowells@redhat.com)</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#define FSCACHE_DEBUG_LEVEL OPERATION</div><div class='del'>-#include &lt;linux/module.h&gt;</div><div class='del'>-#include &lt;linux/proc_fs.h&gt;</div><div class='del'>-#include &lt;linux/seq_file.h&gt;</div><div class='del'>-#include "internal.h"</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * initialise the /proc/fs/fscache/ directory</div><div class='del'>- */</div><div class='del'>-int __init fscache_proc_init(void)</div><div class='del'>-{</div><div class='del'>-	_enter("");</div><div class='del'>-</div><div class='del'>-	if (!proc_mkdir("fs/fscache", NULL))</div><div class='del'>-		goto error_dir;</div><div class='del'>-</div><div class='del'>-	if (!proc_create_seq("fs/fscache/cookies", S_IFREG | 0444, NULL,</div><div class='del'>-			     &amp;fscache_cookies_seq_ops))</div><div class='del'>-		goto error_cookies;</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_FSCACHE_STATS</div><div class='del'>-	if (!proc_create_single("fs/fscache/stats", S_IFREG | 0444, NULL,</div><div class='del'>-			fscache_stats_show))</div><div class='del'>-		goto error_stats;</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_FSCACHE_OBJECT_LIST</div><div class='del'>-	if (!proc_create("fs/fscache/objects", S_IFREG | 0444, NULL,</div><div class='del'>-			 &amp;fscache_objlist_proc_ops))</div><div class='del'>-		goto error_objects;</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-	_leave(" = 0");</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_FSCACHE_OBJECT_LIST</div><div class='del'>-error_objects:</div><div class='del'>-#endif</div><div class='del'>-#ifdef CONFIG_FSCACHE_STATS</div><div class='del'>-	remove_proc_entry("fs/fscache/stats", NULL);</div><div class='del'>-error_stats:</div><div class='del'>-#endif</div><div class='del'>-	remove_proc_entry("fs/fscache/cookies", NULL);</div><div class='del'>-error_cookies:</div><div class='del'>-	remove_proc_entry("fs/fscache", NULL);</div><div class='del'>-error_dir:</div><div class='del'>-	_leave(" = -ENOMEM");</div><div class='del'>-	return -ENOMEM;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * clean up the /proc/fs/fscache/ directory</div><div class='del'>- */</div><div class='del'>-void fscache_proc_cleanup(void)</div><div class='del'>-{</div><div class='del'>-#ifdef CONFIG_FSCACHE_OBJECT_LIST</div><div class='del'>-	remove_proc_entry("fs/fscache/objects", NULL);</div><div class='del'>-#endif</div><div class='del'>-#ifdef CONFIG_FSCACHE_STATS</div><div class='del'>-	remove_proc_entry("fs/fscache/stats", NULL);</div><div class='del'>-#endif</div><div class='del'>-	remove_proc_entry("fs/fscache/cookies", NULL);</div><div class='del'>-	remove_proc_entry("fs/fscache", NULL);</div><div class='del'>-}</div><div class='head'>diff --git a/fs/fscache/stats.c b/fs/fscache/stats.c<br/>deleted file mode 100644<br/>index a7c3ed89a3e0..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fscache/stats.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fscache/stats.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,283 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='del'>-/* FS-Cache statistics</div><div class='del'>- *</div><div class='del'>- * Copyright (C) 2007 Red Hat, Inc. All Rights Reserved.</div><div class='del'>- * Written by David Howells (dhowells@redhat.com)</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#define FSCACHE_DEBUG_LEVEL THREAD</div><div class='del'>-#include &lt;linux/module.h&gt;</div><div class='del'>-#include &lt;linux/proc_fs.h&gt;</div><div class='del'>-#include &lt;linux/seq_file.h&gt;</div><div class='del'>-#include "internal.h"</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * operation counters</div><div class='del'>- */</div><div class='del'>-atomic_t fscache_n_op_pend;</div><div class='del'>-atomic_t fscache_n_op_run;</div><div class='del'>-atomic_t fscache_n_op_enqueue;</div><div class='del'>-atomic_t fscache_n_op_deferred_release;</div><div class='del'>-atomic_t fscache_n_op_initialised;</div><div class='del'>-atomic_t fscache_n_op_release;</div><div class='del'>-atomic_t fscache_n_op_gc;</div><div class='del'>-atomic_t fscache_n_op_cancelled;</div><div class='del'>-atomic_t fscache_n_op_rejected;</div><div class='del'>-</div><div class='del'>-atomic_t fscache_n_attr_changed;</div><div class='del'>-atomic_t fscache_n_attr_changed_ok;</div><div class='del'>-atomic_t fscache_n_attr_changed_nobufs;</div><div class='del'>-atomic_t fscache_n_attr_changed_nomem;</div><div class='del'>-atomic_t fscache_n_attr_changed_calls;</div><div class='del'>-</div><div class='del'>-atomic_t fscache_n_allocs;</div><div class='del'>-atomic_t fscache_n_allocs_ok;</div><div class='del'>-atomic_t fscache_n_allocs_wait;</div><div class='del'>-atomic_t fscache_n_allocs_nobufs;</div><div class='del'>-atomic_t fscache_n_allocs_intr;</div><div class='del'>-atomic_t fscache_n_allocs_object_dead;</div><div class='del'>-atomic_t fscache_n_alloc_ops;</div><div class='del'>-atomic_t fscache_n_alloc_op_waits;</div><div class='del'>-</div><div class='del'>-atomic_t fscache_n_retrievals;</div><div class='del'>-atomic_t fscache_n_retrievals_ok;</div><div class='del'>-atomic_t fscache_n_retrievals_wait;</div><div class='del'>-atomic_t fscache_n_retrievals_nodata;</div><div class='del'>-atomic_t fscache_n_retrievals_nobufs;</div><div class='del'>-atomic_t fscache_n_retrievals_intr;</div><div class='del'>-atomic_t fscache_n_retrievals_nomem;</div><div class='del'>-atomic_t fscache_n_retrievals_object_dead;</div><div class='del'>-atomic_t fscache_n_retrieval_ops;</div><div class='del'>-atomic_t fscache_n_retrieval_op_waits;</div><div class='del'>-</div><div class='del'>-atomic_t fscache_n_stores;</div><div class='del'>-atomic_t fscache_n_stores_ok;</div><div class='del'>-atomic_t fscache_n_stores_again;</div><div class='del'>-atomic_t fscache_n_stores_nobufs;</div><div class='del'>-atomic_t fscache_n_stores_oom;</div><div class='del'>-atomic_t fscache_n_store_ops;</div><div class='del'>-atomic_t fscache_n_store_calls;</div><div class='del'>-atomic_t fscache_n_store_pages;</div><div class='del'>-atomic_t fscache_n_store_radix_deletes;</div><div class='del'>-atomic_t fscache_n_store_pages_over_limit;</div><div class='del'>-</div><div class='del'>-atomic_t fscache_n_store_vmscan_not_storing;</div><div class='del'>-atomic_t fscache_n_store_vmscan_gone;</div><div class='del'>-atomic_t fscache_n_store_vmscan_busy;</div><div class='del'>-atomic_t fscache_n_store_vmscan_cancelled;</div><div class='del'>-atomic_t fscache_n_store_vmscan_wait;</div><div class='del'>-</div><div class='del'>-atomic_t fscache_n_marks;</div><div class='del'>-atomic_t fscache_n_uncaches;</div><div class='del'>-</div><div class='del'>-atomic_t fscache_n_acquires;</div><div class='del'>-atomic_t fscache_n_acquires_null;</div><div class='del'>-atomic_t fscache_n_acquires_no_cache;</div><div class='del'>-atomic_t fscache_n_acquires_ok;</div><div class='del'>-atomic_t fscache_n_acquires_nobufs;</div><div class='del'>-atomic_t fscache_n_acquires_oom;</div><div class='del'>-</div><div class='del'>-atomic_t fscache_n_invalidates;</div><div class='del'>-atomic_t fscache_n_invalidates_run;</div><div class='del'>-</div><div class='del'>-atomic_t fscache_n_updates;</div><div class='del'>-atomic_t fscache_n_updates_null;</div><div class='del'>-atomic_t fscache_n_updates_run;</div><div class='del'>-</div><div class='del'>-atomic_t fscache_n_relinquishes;</div><div class='del'>-atomic_t fscache_n_relinquishes_null;</div><div class='del'>-atomic_t fscache_n_relinquishes_waitcrt;</div><div class='del'>-atomic_t fscache_n_relinquishes_retire;</div><div class='del'>-</div><div class='del'>-atomic_t fscache_n_cookie_index;</div><div class='del'>-atomic_t fscache_n_cookie_data;</div><div class='del'>-atomic_t fscache_n_cookie_special;</div><div class='del'>-</div><div class='del'>-atomic_t fscache_n_object_alloc;</div><div class='del'>-atomic_t fscache_n_object_no_alloc;</div><div class='del'>-atomic_t fscache_n_object_lookups;</div><div class='del'>-atomic_t fscache_n_object_lookups_negative;</div><div class='del'>-atomic_t fscache_n_object_lookups_positive;</div><div class='del'>-atomic_t fscache_n_object_lookups_timed_out;</div><div class='del'>-atomic_t fscache_n_object_created;</div><div class='del'>-atomic_t fscache_n_object_avail;</div><div class='del'>-atomic_t fscache_n_object_dead;</div><div class='del'>-</div><div class='del'>-atomic_t fscache_n_checkaux_none;</div><div class='del'>-atomic_t fscache_n_checkaux_okay;</div><div class='del'>-atomic_t fscache_n_checkaux_update;</div><div class='del'>-atomic_t fscache_n_checkaux_obsolete;</div><div class='del'>-</div><div class='del'>-atomic_t fscache_n_cop_alloc_object;</div><div class='del'>-atomic_t fscache_n_cop_lookup_object;</div><div class='del'>-atomic_t fscache_n_cop_lookup_complete;</div><div class='del'>-atomic_t fscache_n_cop_grab_object;</div><div class='del'>-atomic_t fscache_n_cop_invalidate_object;</div><div class='del'>-atomic_t fscache_n_cop_update_object;</div><div class='del'>-atomic_t fscache_n_cop_drop_object;</div><div class='del'>-atomic_t fscache_n_cop_put_object;</div><div class='del'>-atomic_t fscache_n_cop_sync_cache;</div><div class='del'>-atomic_t fscache_n_cop_attr_changed;</div><div class='del'>-atomic_t fscache_n_cop_read_or_alloc_page;</div><div class='del'>-atomic_t fscache_n_cop_read_or_alloc_pages;</div><div class='del'>-atomic_t fscache_n_cop_allocate_page;</div><div class='del'>-atomic_t fscache_n_cop_allocate_pages;</div><div class='del'>-atomic_t fscache_n_cop_write_page;</div><div class='del'>-atomic_t fscache_n_cop_uncache_page;</div><div class='del'>-atomic_t fscache_n_cop_dissociate_pages;</div><div class='del'>-</div><div class='del'>-atomic_t fscache_n_cache_no_space_reject;</div><div class='del'>-atomic_t fscache_n_cache_stale_objects;</div><div class='del'>-atomic_t fscache_n_cache_retired_objects;</div><div class='del'>-atomic_t fscache_n_cache_culled_objects;</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * display the general statistics</div><div class='del'>- */</div><div class='del'>-int fscache_stats_show(struct seq_file *m, void *v)</div><div class='del'>-{</div><div class='del'>-	seq_puts(m, "FS-Cache statistics\n");</div><div class='del'>-</div><div class='del'>-	seq_printf(m, "Cookies: idx=%u dat=%u spc=%u\n",</div><div class='del'>-		   atomic_read(&amp;fscache_n_cookie_index),</div><div class='del'>-		   atomic_read(&amp;fscache_n_cookie_data),</div><div class='del'>-		   atomic_read(&amp;fscache_n_cookie_special));</div><div class='del'>-</div><div class='del'>-	seq_printf(m, "Objects: alc=%u nal=%u avl=%u ded=%u\n",</div><div class='del'>-		   atomic_read(&amp;fscache_n_object_alloc),</div><div class='del'>-		   atomic_read(&amp;fscache_n_object_no_alloc),</div><div class='del'>-		   atomic_read(&amp;fscache_n_object_avail),</div><div class='del'>-		   atomic_read(&amp;fscache_n_object_dead));</div><div class='del'>-	seq_printf(m, "ChkAux : non=%u ok=%u upd=%u obs=%u\n",</div><div class='del'>-		   atomic_read(&amp;fscache_n_checkaux_none),</div><div class='del'>-		   atomic_read(&amp;fscache_n_checkaux_okay),</div><div class='del'>-		   atomic_read(&amp;fscache_n_checkaux_update),</div><div class='del'>-		   atomic_read(&amp;fscache_n_checkaux_obsolete));</div><div class='del'>-</div><div class='del'>-	seq_printf(m, "Pages  : mrk=%u unc=%u\n",</div><div class='del'>-		   atomic_read(&amp;fscache_n_marks),</div><div class='del'>-		   atomic_read(&amp;fscache_n_uncaches));</div><div class='del'>-</div><div class='del'>-	seq_printf(m, "Acquire: n=%u nul=%u noc=%u ok=%u nbf=%u"</div><div class='del'>-		   " oom=%u\n",</div><div class='del'>-		   atomic_read(&amp;fscache_n_acquires),</div><div class='del'>-		   atomic_read(&amp;fscache_n_acquires_null),</div><div class='del'>-		   atomic_read(&amp;fscache_n_acquires_no_cache),</div><div class='del'>-		   atomic_read(&amp;fscache_n_acquires_ok),</div><div class='del'>-		   atomic_read(&amp;fscache_n_acquires_nobufs),</div><div class='del'>-		   atomic_read(&amp;fscache_n_acquires_oom));</div><div class='del'>-</div><div class='del'>-	seq_printf(m, "Lookups: n=%u neg=%u pos=%u crt=%u tmo=%u\n",</div><div class='del'>-		   atomic_read(&amp;fscache_n_object_lookups),</div><div class='del'>-		   atomic_read(&amp;fscache_n_object_lookups_negative),</div><div class='del'>-		   atomic_read(&amp;fscache_n_object_lookups_positive),</div><div class='del'>-		   atomic_read(&amp;fscache_n_object_created),</div><div class='del'>-		   atomic_read(&amp;fscache_n_object_lookups_timed_out));</div><div class='del'>-</div><div class='del'>-	seq_printf(m, "Invals : n=%u run=%u\n",</div><div class='del'>-		   atomic_read(&amp;fscache_n_invalidates),</div><div class='del'>-		   atomic_read(&amp;fscache_n_invalidates_run));</div><div class='del'>-</div><div class='del'>-	seq_printf(m, "Updates: n=%u nul=%u run=%u\n",</div><div class='del'>-		   atomic_read(&amp;fscache_n_updates),</div><div class='del'>-		   atomic_read(&amp;fscache_n_updates_null),</div><div class='del'>-		   atomic_read(&amp;fscache_n_updates_run));</div><div class='del'>-</div><div class='del'>-	seq_printf(m, "Relinqs: n=%u nul=%u wcr=%u rtr=%u\n",</div><div class='del'>-		   atomic_read(&amp;fscache_n_relinquishes),</div><div class='del'>-		   atomic_read(&amp;fscache_n_relinquishes_null),</div><div class='del'>-		   atomic_read(&amp;fscache_n_relinquishes_waitcrt),</div><div class='del'>-		   atomic_read(&amp;fscache_n_relinquishes_retire));</div><div class='del'>-</div><div class='del'>-	seq_printf(m, "AttrChg: n=%u ok=%u nbf=%u oom=%u run=%u\n",</div><div class='del'>-		   atomic_read(&amp;fscache_n_attr_changed),</div><div class='del'>-		   atomic_read(&amp;fscache_n_attr_changed_ok),</div><div class='del'>-		   atomic_read(&amp;fscache_n_attr_changed_nobufs),</div><div class='del'>-		   atomic_read(&amp;fscache_n_attr_changed_nomem),</div><div class='del'>-		   atomic_read(&amp;fscache_n_attr_changed_calls));</div><div class='del'>-</div><div class='del'>-	seq_printf(m, "Allocs : n=%u ok=%u wt=%u nbf=%u int=%u\n",</div><div class='del'>-		   atomic_read(&amp;fscache_n_allocs),</div><div class='del'>-		   atomic_read(&amp;fscache_n_allocs_ok),</div><div class='del'>-		   atomic_read(&amp;fscache_n_allocs_wait),</div><div class='del'>-		   atomic_read(&amp;fscache_n_allocs_nobufs),</div><div class='del'>-		   atomic_read(&amp;fscache_n_allocs_intr));</div><div class='del'>-	seq_printf(m, "Allocs : ops=%u owt=%u abt=%u\n",</div><div class='del'>-		   atomic_read(&amp;fscache_n_alloc_ops),</div><div class='del'>-		   atomic_read(&amp;fscache_n_alloc_op_waits),</div><div class='del'>-		   atomic_read(&amp;fscache_n_allocs_object_dead));</div><div class='del'>-</div><div class='del'>-	seq_printf(m, "Retrvls: n=%u ok=%u wt=%u nod=%u nbf=%u"</div><div class='del'>-		   " int=%u oom=%u\n",</div><div class='del'>-		   atomic_read(&amp;fscache_n_retrievals),</div><div class='del'>-		   atomic_read(&amp;fscache_n_retrievals_ok),</div><div class='del'>-		   atomic_read(&amp;fscache_n_retrievals_wait),</div><div class='del'>-		   atomic_read(&amp;fscache_n_retrievals_nodata),</div><div class='del'>-		   atomic_read(&amp;fscache_n_retrievals_nobufs),</div><div class='del'>-		   atomic_read(&amp;fscache_n_retrievals_intr),</div><div class='del'>-		   atomic_read(&amp;fscache_n_retrievals_nomem));</div><div class='del'>-	seq_printf(m, "Retrvls: ops=%u owt=%u abt=%u\n",</div><div class='del'>-		   atomic_read(&amp;fscache_n_retrieval_ops),</div><div class='del'>-		   atomic_read(&amp;fscache_n_retrieval_op_waits),</div><div class='del'>-		   atomic_read(&amp;fscache_n_retrievals_object_dead));</div><div class='del'>-</div><div class='del'>-	seq_printf(m, "Stores : n=%u ok=%u agn=%u nbf=%u oom=%u\n",</div><div class='del'>-		   atomic_read(&amp;fscache_n_stores),</div><div class='del'>-		   atomic_read(&amp;fscache_n_stores_ok),</div><div class='del'>-		   atomic_read(&amp;fscache_n_stores_again),</div><div class='del'>-		   atomic_read(&amp;fscache_n_stores_nobufs),</div><div class='del'>-		   atomic_read(&amp;fscache_n_stores_oom));</div><div class='del'>-	seq_printf(m, "Stores : ops=%u run=%u pgs=%u rxd=%u olm=%u\n",</div><div class='del'>-		   atomic_read(&amp;fscache_n_store_ops),</div><div class='del'>-		   atomic_read(&amp;fscache_n_store_calls),</div><div class='del'>-		   atomic_read(&amp;fscache_n_store_pages),</div><div class='del'>-		   atomic_read(&amp;fscache_n_store_radix_deletes),</div><div class='del'>-		   atomic_read(&amp;fscache_n_store_pages_over_limit));</div><div class='del'>-</div><div class='del'>-	seq_printf(m, "VmScan : nos=%u gon=%u bsy=%u can=%u wt=%u\n",</div><div class='del'>-		   atomic_read(&amp;fscache_n_store_vmscan_not_storing),</div><div class='del'>-		   atomic_read(&amp;fscache_n_store_vmscan_gone),</div><div class='del'>-		   atomic_read(&amp;fscache_n_store_vmscan_busy),</div><div class='del'>-		   atomic_read(&amp;fscache_n_store_vmscan_cancelled),</div><div class='del'>-		   atomic_read(&amp;fscache_n_store_vmscan_wait));</div><div class='del'>-</div><div class='del'>-	seq_printf(m, "Ops    : pend=%u run=%u enq=%u can=%u rej=%u\n",</div><div class='del'>-		   atomic_read(&amp;fscache_n_op_pend),</div><div class='del'>-		   atomic_read(&amp;fscache_n_op_run),</div><div class='del'>-		   atomic_read(&amp;fscache_n_op_enqueue),</div><div class='del'>-		   atomic_read(&amp;fscache_n_op_cancelled),</div><div class='del'>-		   atomic_read(&amp;fscache_n_op_rejected));</div><div class='del'>-	seq_printf(m, "Ops    : ini=%u dfr=%u rel=%u gc=%u\n",</div><div class='del'>-		   atomic_read(&amp;fscache_n_op_initialised),</div><div class='del'>-		   atomic_read(&amp;fscache_n_op_deferred_release),</div><div class='del'>-		   atomic_read(&amp;fscache_n_op_release),</div><div class='del'>-		   atomic_read(&amp;fscache_n_op_gc));</div><div class='del'>-</div><div class='del'>-	seq_printf(m, "CacheOp: alo=%d luo=%d luc=%d gro=%d\n",</div><div class='del'>-		   atomic_read(&amp;fscache_n_cop_alloc_object),</div><div class='del'>-		   atomic_read(&amp;fscache_n_cop_lookup_object),</div><div class='del'>-		   atomic_read(&amp;fscache_n_cop_lookup_complete),</div><div class='del'>-		   atomic_read(&amp;fscache_n_cop_grab_object));</div><div class='del'>-	seq_printf(m, "CacheOp: inv=%d upo=%d dro=%d pto=%d atc=%d syn=%d\n",</div><div class='del'>-		   atomic_read(&amp;fscache_n_cop_invalidate_object),</div><div class='del'>-		   atomic_read(&amp;fscache_n_cop_update_object),</div><div class='del'>-		   atomic_read(&amp;fscache_n_cop_drop_object),</div><div class='del'>-		   atomic_read(&amp;fscache_n_cop_put_object),</div><div class='del'>-		   atomic_read(&amp;fscache_n_cop_attr_changed),</div><div class='del'>-		   atomic_read(&amp;fscache_n_cop_sync_cache));</div><div class='del'>-	seq_printf(m, "CacheOp: rap=%d ras=%d alp=%d als=%d wrp=%d ucp=%d dsp=%d\n",</div><div class='del'>-		   atomic_read(&amp;fscache_n_cop_read_or_alloc_page),</div><div class='del'>-		   atomic_read(&amp;fscache_n_cop_read_or_alloc_pages),</div><div class='del'>-		   atomic_read(&amp;fscache_n_cop_allocate_page),</div><div class='del'>-		   atomic_read(&amp;fscache_n_cop_allocate_pages),</div><div class='del'>-		   atomic_read(&amp;fscache_n_cop_write_page),</div><div class='del'>-		   atomic_read(&amp;fscache_n_cop_uncache_page),</div><div class='del'>-		   atomic_read(&amp;fscache_n_cop_dissociate_pages));</div><div class='del'>-	seq_printf(m, "CacheEv: nsp=%d stl=%d rtr=%d cul=%d\n",</div><div class='del'>-		   atomic_read(&amp;fscache_n_cache_no_space_reject),</div><div class='del'>-		   atomic_read(&amp;fscache_n_cache_stale_objects),</div><div class='del'>-		   atomic_read(&amp;fscache_n_cache_retired_objects),</div><div class='del'>-		   atomic_read(&amp;fscache_n_cache_culled_objects));</div><div class='del'>-	netfs_stats_show(m);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='head'>diff --git a/fs/fsopen.c b/fs/fsopen.c<br/>index 27a890aa493a..f645c99204eb 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fsopen.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fsopen.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fsopen.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fsopen.c</a></div><div class='hunk'>@@ -18,50 +18,56 @@</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> #include "mount.h"</div><div class='ctx'> </div><div class='add'>+static inline const char *fetch_message_locked(struct fc_log *log, size_t len,</div><div class='add'>+					       bool *need_free)</div><div class='add'>+{</div><div class='add'>+	const char *p;</div><div class='add'>+	int index;</div><div class='add'>+</div><div class='add'>+	if (unlikely(log-&gt;head == log-&gt;tail))</div><div class='add'>+		return ERR_PTR(-ENODATA);</div><div class='add'>+</div><div class='add'>+	index = log-&gt;tail &amp; (ARRAY_SIZE(log-&gt;buffer) - 1);</div><div class='add'>+	p = log-&gt;buffer[index];</div><div class='add'>+	if (unlikely(strlen(p) &gt; len))</div><div class='add'>+		return ERR_PTR(-EMSGSIZE);</div><div class='add'>+</div><div class='add'>+	log-&gt;buffer[index] = NULL;</div><div class='add'>+	*need_free = log-&gt;need_free &amp; (1 &lt;&lt; index);</div><div class='add'>+	log-&gt;need_free &amp;= ~(1 &lt;&lt; index);</div><div class='add'>+	log-&gt;tail++;</div><div class='add'>+</div><div class='add'>+	return p;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Allow the user to read back any error, warning or informational messages.</div><div class='add'>+ * Only one message is returned for each read(2) call.</div><div class='ctx'>  */</div><div class='ctx'> static ssize_t fscontext_read(struct file *file,</div><div class='ctx'> 			      char __user *_buf, size_t len, loff_t *pos)</div><div class='ctx'> {</div><div class='ctx'> 	struct fs_context *fc = file-&gt;private_data;</div><div class='del'>-	struct fc_log *log = fc-&gt;log.log;</div><div class='del'>-	unsigned int logsize = ARRAY_SIZE(log-&gt;buffer);</div><div class='del'>-	ssize_t ret;</div><div class='del'>-	char *p;</div><div class='add'>+	ssize_t err;</div><div class='add'>+	const char *p __free(kfree) = NULL, *message;</div><div class='ctx'> 	bool need_free;</div><div class='del'>-	int index, n;</div><div class='del'>-</div><div class='del'>-	ret = mutex_lock_interruptible(&amp;fc-&gt;uapi_mutex);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	if (log-&gt;head == log-&gt;tail) {</div><div class='del'>-		mutex_unlock(&amp;fc-&gt;uapi_mutex);</div><div class='del'>-		return -ENODATA;</div><div class='del'>-	}</div><div class='add'>+	int n;</div><div class='ctx'> </div><div class='del'>-	index = log-&gt;tail &amp; (logsize - 1);</div><div class='del'>-	p = log-&gt;buffer[index];</div><div class='del'>-	need_free = log-&gt;need_free &amp; (1 &lt;&lt; index);</div><div class='del'>-	log-&gt;buffer[index] = NULL;</div><div class='del'>-	log-&gt;need_free &amp;= ~(1 &lt;&lt; index);</div><div class='del'>-	log-&gt;tail++;</div><div class='add'>+	err = mutex_lock_interruptible(&amp;fc-&gt;uapi_mutex);</div><div class='add'>+	if (err &lt; 0)</div><div class='add'>+		return err;</div><div class='add'>+	message = fetch_message_locked(fc-&gt;log.log, len, &amp;need_free);</div><div class='ctx'> 	mutex_unlock(&amp;fc-&gt;uapi_mutex);</div><div class='add'>+	if (IS_ERR(message))</div><div class='add'>+		return PTR_ERR(message);</div><div class='ctx'> </div><div class='del'>-	ret = -EMSGSIZE;</div><div class='del'>-	n = strlen(p);</div><div class='del'>-	if (n &gt; len)</div><div class='del'>-		goto err_free;</div><div class='del'>-	ret = -EFAULT;</div><div class='del'>-	if (copy_to_user(_buf, p, n) != 0)</div><div class='del'>-		goto err_free;</div><div class='del'>-	ret = n;</div><div class='del'>-</div><div class='del'>-err_free:</div><div class='ctx'> 	if (need_free)</div><div class='del'>-		kfree(p);</div><div class='del'>-	return ret;</div><div class='add'>+		p = message;</div><div class='add'>+</div><div class='add'>+	n = strlen(message);</div><div class='add'>+	if (copy_to_user(_buf, message, n))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+	return n;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int fscontext_release(struct inode *inode, struct file *file)</div><div class='hunk'>@@ -78,7 +84,6 @@ static int fscontext_release(struct inode *inode, struct file *file)</div><div class='ctx'> const struct file_operations fscontext_fops = {</div><div class='ctx'> 	.read		= fscontext_read,</div><div class='ctx'> 	.release	= fscontext_release,</div><div class='del'>-	.llseek		= no_llseek,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -119,7 +124,7 @@ SYSCALL_DEFINE2(fsopen, const char __user *, _fs_name, unsigned int, flags)</div><div class='ctx'> 	const char *fs_name;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (!ns_capable(current-&gt;nsproxy-&gt;mnt_ns-&gt;user_ns, CAP_SYS_ADMIN))</div><div class='add'>+	if (!may_mount())</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; ~FSOPEN_CLOEXEC)</div><div class='hunk'>@@ -162,7 +167,7 @@ SYSCALL_DEFINE3(fspick, int, dfd, const char __user *, path, unsigned int, flags</div><div class='ctx'> 	unsigned int lookup_flags;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (!ns_capable(current-&gt;nsproxy-&gt;mnt_ns-&gt;user_ns, CAP_SYS_ADMIN))</div><div class='add'>+	if (!may_mount())</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='ctx'> 	if ((flags &amp; ~(FSPICK_CLOEXEC |</div><div class='hunk'>@@ -209,6 +214,68 @@ err:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int vfs_cmd_create(struct fs_context *fc, bool exclusive)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (fc-&gt;phase != FS_CONTEXT_CREATE_PARAMS)</div><div class='add'>+		return -EBUSY;</div><div class='add'>+</div><div class='add'>+	if (!mount_capable(fc))</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	fc-&gt;phase = FS_CONTEXT_CREATING;</div><div class='add'>+	fc-&gt;exclusive = exclusive;</div><div class='add'>+</div><div class='add'>+	ret = vfs_get_tree(fc);</div><div class='add'>+	if (ret) {</div><div class='add'>+		fc-&gt;phase = FS_CONTEXT_FAILED;</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	sb = fc-&gt;root-&gt;d_sb;</div><div class='add'>+	ret = security_sb_kern_mount(sb);</div><div class='add'>+	if (unlikely(ret)) {</div><div class='add'>+		fc_drop_locked(fc);</div><div class='add'>+		fc-&gt;phase = FS_CONTEXT_FAILED;</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* vfs_get_tree() callchains will have grabbed @s_umount */</div><div class='add'>+	up_write(&amp;sb-&gt;s_umount);</div><div class='add'>+	fc-&gt;phase = FS_CONTEXT_AWAITING_MOUNT;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int vfs_cmd_reconfigure(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (fc-&gt;phase != FS_CONTEXT_RECONF_PARAMS)</div><div class='add'>+		return -EBUSY;</div><div class='add'>+</div><div class='add'>+	fc-&gt;phase = FS_CONTEXT_RECONFIGURING;</div><div class='add'>+</div><div class='add'>+	sb = fc-&gt;root-&gt;d_sb;</div><div class='add'>+	if (!ns_capable(sb-&gt;s_user_ns, CAP_SYS_ADMIN)) {</div><div class='add'>+		fc-&gt;phase = FS_CONTEXT_FAILED;</div><div class='add'>+		return -EPERM;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	down_write(&amp;sb-&gt;s_umount);</div><div class='add'>+	ret = reconfigure_super(fc);</div><div class='add'>+	up_write(&amp;sb-&gt;s_umount);</div><div class='add'>+	if (ret) {</div><div class='add'>+		fc-&gt;phase = FS_CONTEXT_FAILED;</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	vfs_clean_context(fc);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Check the state and apply the configuration.  Note that this function is</div><div class='ctx'>  * allowed to 'steal' the value by setting param-&gt;xxx to NULL before returning.</div><div class='hunk'>@@ -216,7 +283,6 @@ err:</div><div class='ctx'> static int vfs_fsconfig_locked(struct fs_context *fc, int cmd,</div><div class='ctx'> 			       struct fs_parameter *param)</div><div class='ctx'> {</div><div class='del'>-	struct super_block *sb;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	ret = finish_clean_context(fc);</div><div class='hunk'>@@ -224,39 +290,11 @@ static int vfs_fsconfig_locked(struct fs_context *fc, int cmd,</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	switch (cmd) {</div><div class='ctx'> 	case FSCONFIG_CMD_CREATE:</div><div class='del'>-		if (fc-&gt;phase != FS_CONTEXT_CREATE_PARAMS)</div><div class='del'>-			return -EBUSY;</div><div class='del'>-		if (!mount_capable(fc))</div><div class='del'>-			return -EPERM;</div><div class='del'>-		fc-&gt;phase = FS_CONTEXT_CREATING;</div><div class='del'>-		ret = vfs_get_tree(fc);</div><div class='del'>-		if (ret)</div><div class='del'>-			break;</div><div class='del'>-		sb = fc-&gt;root-&gt;d_sb;</div><div class='del'>-		ret = security_sb_kern_mount(sb);</div><div class='del'>-		if (unlikely(ret)) {</div><div class='del'>-			fc_drop_locked(fc);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		up_write(&amp;sb-&gt;s_umount);</div><div class='del'>-		fc-&gt;phase = FS_CONTEXT_AWAITING_MOUNT;</div><div class='del'>-		return 0;</div><div class='add'>+		return vfs_cmd_create(fc, false);</div><div class='add'>+	case FSCONFIG_CMD_CREATE_EXCL:</div><div class='add'>+		return vfs_cmd_create(fc, true);</div><div class='ctx'> 	case FSCONFIG_CMD_RECONFIGURE:</div><div class='del'>-		if (fc-&gt;phase != FS_CONTEXT_RECONF_PARAMS)</div><div class='del'>-			return -EBUSY;</div><div class='del'>-		fc-&gt;phase = FS_CONTEXT_RECONFIGURING;</div><div class='del'>-		sb = fc-&gt;root-&gt;d_sb;</div><div class='del'>-		if (!ns_capable(sb-&gt;s_user_ns, CAP_SYS_ADMIN)) {</div><div class='del'>-			ret = -EPERM;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		down_write(&amp;sb-&gt;s_umount);</div><div class='del'>-		ret = reconfigure_super(fc);</div><div class='del'>-		up_write(&amp;sb-&gt;s_umount);</div><div class='del'>-		if (ret)</div><div class='del'>-			break;</div><div class='del'>-		vfs_clean_context(fc);</div><div class='del'>-		return 0;</div><div class='add'>+		return vfs_cmd_reconfigure(fc);</div><div class='ctx'> 	default:</div><div class='ctx'> 		if (fc-&gt;phase != FS_CONTEXT_CREATE_PARAMS &amp;&amp;</div><div class='ctx'> 		    fc-&gt;phase != FS_CONTEXT_RECONF_PARAMS)</div><div class='hunk'>@@ -264,8 +302,6 @@ static int vfs_fsconfig_locked(struct fs_context *fc, int cmd,</div><div class='ctx'> </div><div class='ctx'> 		return vfs_parse_fs_param(fc, param);</div><div class='ctx'> 	}</div><div class='del'>-	fc-&gt;phase = FS_CONTEXT_FAILED;</div><div class='del'>-	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -319,7 +355,6 @@ SYSCALL_DEFINE5(fsconfig,</div><div class='ctx'> 		int, aux)</div><div class='ctx'> {</div><div class='ctx'> 	struct fs_context *fc;</div><div class='del'>-	struct fd f;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	int lookup_flags = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -353,6 +388,7 @@ SYSCALL_DEFINE5(fsconfig,</div><div class='ctx'> 			return -EINVAL;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case FSCONFIG_CMD_CREATE:</div><div class='add'>+	case FSCONFIG_CMD_CREATE_EXCL:</div><div class='ctx'> 	case FSCONFIG_CMD_RECONFIGURE:</div><div class='ctx'> 		if (_key || _value || aux)</div><div class='ctx'> 			return -EINVAL;</div><div class='hunk'>@@ -361,31 +397,28 @@ SYSCALL_DEFINE5(fsconfig,</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	f = fdget(fd);</div><div class='del'>-	if (!f.file)</div><div class='add'>+	CLASS(fd, f)(fd);</div><div class='add'>+	if (fd_empty(f))</div><div class='ctx'> 		return -EBADF;</div><div class='del'>-	ret = -EINVAL;</div><div class='del'>-	if (f.file-&gt;f_op != &amp;fscontext_fops)</div><div class='del'>-		goto out_f;</div><div class='add'>+	if (fd_file(f)-&gt;f_op != &amp;fscontext_fops)</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	fc = f.file-&gt;private_data;</div><div class='add'>+	fc = fd_file(f)-&gt;private_data;</div><div class='ctx'> 	if (fc-&gt;ops == &amp;legacy_fs_context_ops) {</div><div class='ctx'> 		switch (cmd) {</div><div class='ctx'> 		case FSCONFIG_SET_BINARY:</div><div class='ctx'> 		case FSCONFIG_SET_PATH:</div><div class='ctx'> 		case FSCONFIG_SET_PATH_EMPTY:</div><div class='ctx'> 		case FSCONFIG_SET_FD:</div><div class='del'>-			ret = -EOPNOTSUPP;</div><div class='del'>-			goto out_f;</div><div class='add'>+		case FSCONFIG_CMD_CREATE_EXCL:</div><div class='add'>+			return -EOPNOTSUPP;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (_key) {</div><div class='ctx'> 		param.key = strndup_user(_key, 256);</div><div class='del'>-		if (IS_ERR(param.key)) {</div><div class='del'>-			ret = PTR_ERR(param.key);</div><div class='del'>-			goto out_f;</div><div class='del'>-		}</div><div class='add'>+		if (IS_ERR(param.key))</div><div class='add'>+			return PTR_ERR(param.key);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	switch (cmd) {</div><div class='hunk'>@@ -415,7 +448,7 @@ SYSCALL_DEFINE5(fsconfig,</div><div class='ctx'> 		fallthrough;</div><div class='ctx'> 	case FSCONFIG_SET_PATH:</div><div class='ctx'> 		param.type = fs_value_is_filename;</div><div class='del'>-		param.name = getname_flags(_value, lookup_flags, NULL);</div><div class='add'>+		param.name = getname_flags(_value, lookup_flags);</div><div class='ctx'> 		if (IS_ERR(param.name)) {</div><div class='ctx'> 			ret = PTR_ERR(param.name);</div><div class='ctx'> 			goto out_key;</div><div class='hunk'>@@ -426,9 +459,10 @@ SYSCALL_DEFINE5(fsconfig,</div><div class='ctx'> 	case FSCONFIG_SET_FD:</div><div class='ctx'> 		param.type = fs_value_is_file;</div><div class='ctx'> 		ret = -EBADF;</div><div class='del'>-		param.file = fget(aux);</div><div class='add'>+		param.file = fget_raw(aux);</div><div class='ctx'> 		if (!param.file)</div><div class='ctx'> 			goto out_key;</div><div class='add'>+		param.dirfd = aux;</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		break;</div><div class='hunk'>@@ -463,7 +497,5 @@ SYSCALL_DEFINE5(fsconfig,</div><div class='ctx'> 	}</div><div class='ctx'> out_key:</div><div class='ctx'> 	kfree(param.key);</div><div class='del'>-out_f:</div><div class='del'>-	fdput(f);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/fuse/Kconfig b/fs/fuse/Kconfig<br/>index 40ce9a1c12e5..3a4ae632c94a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fuse/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fuse/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fuse/Kconfig</a></div><div class='hunk'>@@ -2,6 +2,7 @@</div><div class='ctx'> config FUSE_FS</div><div class='ctx'> 	tristate "FUSE (Filesystem in Userspace) support"</div><div class='ctx'> 	select FS_POSIX_ACL</div><div class='add'>+	select FS_IOMAP</div><div class='ctx'> 	help</div><div class='ctx'> 	  With FUSE it is possible to implement a fully functional filesystem</div><div class='ctx'> 	  in a userspace program.</div><div class='hunk'>@@ -12,7 +13,7 @@ config FUSE_FS</div><div class='ctx'> 	  although chances are your distribution already has that library</div><div class='ctx'> 	  installed if you've installed the "fuse" package itself.</div><div class='ctx'> </div><div class='del'>-	  See &lt;file:Documentation/filesystems/fuse.rst&gt; for more information.</div><div class='add'>+	  See &lt;file:Documentation/filesystems/fuse/fuse.rst&gt; for more information.</div><div class='ctx'> 	  See &lt;file:Documentation/Changes&gt; for needed library/utility version.</div><div class='ctx'> </div><div class='ctx'> 	  If you want to develop a userspace FS, or if you want to use</div><div class='hunk'>@@ -45,10 +46,33 @@ config FUSE_DAX</div><div class='ctx'> 	select INTERVAL_TREE</div><div class='ctx'> 	depends on VIRTIO_FS</div><div class='ctx'> 	depends on FS_DAX</div><div class='del'>-	depends on DAX_DRIVER</div><div class='add'>+	depends on DAX</div><div class='ctx'> 	help</div><div class='ctx'> 	  This allows bypassing guest page cache and allows mapping host page</div><div class='ctx'> 	  cache directly in guest address space.</div><div class='ctx'> </div><div class='ctx'> 	  If you want to allow mounting a Virtio Filesystem with the "dax"</div><div class='ctx'> 	  option, answer Y.</div><div class='add'>+</div><div class='add'>+config FUSE_PASSTHROUGH</div><div class='add'>+	bool "FUSE passthrough operations support"</div><div class='add'>+	default y</div><div class='add'>+	depends on FUSE_FS</div><div class='add'>+	select FS_STACK</div><div class='add'>+	help</div><div class='add'>+	  This allows bypassing FUSE server by mapping specific FUSE operations</div><div class='add'>+	  to be performed directly on a backing file.</div><div class='add'>+</div><div class='add'>+	  If you want to allow passthrough operations, answer Y.</div><div class='add'>+</div><div class='add'>+config FUSE_IO_URING</div><div class='add'>+	bool "FUSE communication over io-uring"</div><div class='add'>+	default y</div><div class='add'>+	depends on FUSE_FS</div><div class='add'>+	depends on IO_URING</div><div class='add'>+	help</div><div class='add'>+	  This allows sending FUSE requests over the io-uring interface and</div><div class='add'>+          also adds request core affinity.</div><div class='add'>+</div><div class='add'>+	  If you want to allow fuse server/client communication through io-uring,</div><div class='add'>+	  answer Y</div><div class='head'>diff --git a/fs/fuse/Makefile b/fs/fuse/Makefile<br/>index 0c48b35c058d..22ad9538dfc4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fuse/Makefile?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/Makefile</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fuse/Makefile?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fuse/Makefile</a></div><div class='hunk'>@@ -3,11 +3,19 @@</div><div class='ctx'> # Makefile for the FUSE filesystem.</div><div class='ctx'> #</div><div class='ctx'> </div><div class='add'>+# Needed for trace events</div><div class='add'>+ccflags-y = -I$(src)</div><div class='add'>+</div><div class='ctx'> obj-$(CONFIG_FUSE_FS) += fuse.o</div><div class='ctx'> obj-$(CONFIG_CUSE) += cuse.o</div><div class='ctx'> obj-$(CONFIG_VIRTIO_FS) += virtiofs.o</div><div class='ctx'> </div><div class='del'>-fuse-y := dev.o dir.o file.o inode.o control.o xattr.o acl.o readdir.o ioctl.o</div><div class='add'>+fuse-y := trace.o	# put trace.o first so we see ftrace errors sooner</div><div class='add'>+fuse-y += dev.o dir.o file.o inode.o control.o xattr.o acl.o readdir.o ioctl.o</div><div class='add'>+fuse-y += iomode.o</div><div class='ctx'> fuse-$(CONFIG_FUSE_DAX) += dax.o</div><div class='add'>+fuse-$(CONFIG_FUSE_PASSTHROUGH) += passthrough.o backing.o</div><div class='add'>+fuse-$(CONFIG_SYSCTL) += sysctl.o</div><div class='add'>+fuse-$(CONFIG_FUSE_IO_URING) += dev_uring.o</div><div class='ctx'> </div><div class='ctx'> virtiofs-y := virtio_fs.o</div><div class='head'>diff --git a/fs/fuse/acl.c b/fs/fuse/acl.c<br/>index 337cb29a8dd5..8f484b105f13 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fuse/acl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/acl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fuse/acl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fuse/acl.c</a></div><div class='hunk'>@@ -11,9 +11,9 @@</div><div class='ctx'> #include &lt;linux/posix_acl.h&gt;</div><div class='ctx'> #include &lt;linux/posix_acl_xattr.h&gt;</div><div class='ctx'> </div><div class='del'>-struct posix_acl *fuse_get_acl(struct inode *inode, int type, bool rcu)</div><div class='add'>+static struct posix_acl *__fuse_get_acl(struct fuse_conn *fc,</div><div class='add'>+					struct inode *inode, int type, bool rcu)</div><div class='ctx'> {</div><div class='del'>-	struct fuse_conn *fc = get_fuse_conn(inode);</div><div class='ctx'> 	int size;</div><div class='ctx'> 	const char *name;</div><div class='ctx'> 	void *value = NULL;</div><div class='hunk'>@@ -25,7 +25,7 @@ struct posix_acl *fuse_get_acl(struct inode *inode, int type, bool rcu)</div><div class='ctx'> 	if (fuse_is_bad(inode))</div><div class='ctx'> 		return ERR_PTR(-EIO);</div><div class='ctx'> </div><div class='del'>-	if (!fc-&gt;posix_acl || fc-&gt;no_getxattr)</div><div class='add'>+	if (fc-&gt;no_getxattr)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='ctx'> 	if (type == ACL_TYPE_ACCESS)</div><div class='hunk'>@@ -53,9 +53,49 @@ struct posix_acl *fuse_get_acl(struct inode *inode, int type, bool rcu)</div><div class='ctx'> 	return acl;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int fuse_set_acl(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='add'>+static inline bool fuse_no_acl(const struct fuse_conn *fc,</div><div class='add'>+			       const struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	/*</div><div class='add'>+	 * Refuse interacting with POSIX ACLs for daemons that</div><div class='add'>+	 * don't support FUSE_POSIX_ACL and are not mounted on</div><div class='add'>+	 * the host to retain backwards compatibility.</div><div class='add'>+	 */</div><div class='add'>+	return !fc-&gt;posix_acl &amp;&amp; (i_user_ns(inode) != &amp;init_user_ns);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct posix_acl *fuse_get_acl(struct mnt_idmap *idmap,</div><div class='add'>+			       struct dentry *dentry, int type)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='add'>+	struct fuse_conn *fc = get_fuse_conn(inode);</div><div class='add'>+</div><div class='add'>+	if (fuse_no_acl(fc, inode))</div><div class='add'>+		return ERR_PTR(-EOPNOTSUPP);</div><div class='add'>+</div><div class='add'>+	return __fuse_get_acl(fc, inode, type, false);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct posix_acl *fuse_get_inode_acl(struct inode *inode, int type, bool rcu)</div><div class='add'>+{</div><div class='add'>+	struct fuse_conn *fc = get_fuse_conn(inode);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * FUSE daemons before FUSE_POSIX_ACL was introduced could get and set</div><div class='add'>+	 * POSIX ACLs without them being used for permission checking by the</div><div class='add'>+	 * vfs. Retain that behavior for backwards compatibility as there are</div><div class='add'>+	 * filesystems that do all permission checking for acls in the daemon</div><div class='add'>+	 * and not in the kernel.</div><div class='add'>+	 */</div><div class='add'>+	if (!fc-&gt;posix_acl)</div><div class='add'>+		return NULL;</div><div class='add'>+	return __fuse_get_acl(fc,  inode, type, rcu);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int fuse_set_acl(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		 struct posix_acl *acl, int type)</div><div class='ctx'> {</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	struct fuse_conn *fc = get_fuse_conn(inode);</div><div class='ctx'> 	const char *name;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -63,7 +103,7 @@ int fuse_set_acl(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='ctx'> 	if (fuse_is_bad(inode))</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> </div><div class='del'>-	if (!fc-&gt;posix_acl || fc-&gt;no_setxattr)</div><div class='add'>+	if (fc-&gt;no_setxattr || fuse_no_acl(fc, inode))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='ctx'> 	if (type == ACL_TYPE_ACCESS)</div><div class='hunk'>@@ -98,8 +138,14 @@ int fuse_set_acl(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='ctx'> 			return ret;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (!in_group_p(i_gid_into_mnt(&amp;init_user_ns, inode)) &amp;&amp;</div><div class='del'>-		    !capable_wrt_inode_uidgid(&amp;init_user_ns, inode, CAP_FSETID))</div><div class='add'>+		/*</div><div class='add'>+		 * Fuse daemons without FUSE_POSIX_ACL never changed the passed</div><div class='add'>+		 * through POSIX ACLs. Such daemons don't expect setgid bits to</div><div class='add'>+		 * be stripped.</div><div class='add'>+		 */</div><div class='add'>+		if (fc-&gt;posix_acl &amp;&amp;</div><div class='add'>+		    !in_group_or_capable(idmap, inode,</div><div class='add'>+					 i_gid_into_vfsgid(idmap, inode)))</div><div class='ctx'> 			extra_flags |= FUSE_SETXATTR_ACL_KILL_SGID;</div><div class='ctx'> </div><div class='ctx'> 		ret = fuse_setxattr(inode, name, value, size, 0, extra_flags);</div><div class='hunk'>@@ -107,8 +153,15 @@ int fuse_set_acl(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='ctx'> 	} else {</div><div class='ctx'> 		ret = fuse_removexattr(inode, name);</div><div class='ctx'> 	}</div><div class='del'>-	forget_all_cached_acls(inode);</div><div class='del'>-	fuse_invalidate_attr(inode);</div><div class='add'>+</div><div class='add'>+	if (fc-&gt;posix_acl) {</div><div class='add'>+		/*</div><div class='add'>+		 * Fuse daemons without FUSE_POSIX_ACL never cached POSIX ACLs</div><div class='add'>+		 * and didn't invalidate attributes. Retain that behavior.</div><div class='add'>+		 */</div><div class='add'>+		forget_all_cached_acls(inode);</div><div class='add'>+		fuse_invalidate_attr(inode);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/fuse/backing.c b/fs/fuse/backing.c<br/>new file mode 100644<br/>index 000000000000..4afda419dd14<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fuse/backing.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fuse/backing.c</a></div><div class='hunk'>@@ -0,0 +1,179 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+/*</div><div class='add'>+ * FUSE passthrough to backing file.</div><div class='add'>+ *</div><div class='add'>+ * Copyright (c) 2023 CTERA Networks.</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include "fuse_i.h"</div><div class='add'>+</div><div class='add'>+#include &lt;linux/file.h&gt;</div><div class='add'>+</div><div class='add'>+struct fuse_backing *fuse_backing_get(struct fuse_backing *fb)</div><div class='add'>+{</div><div class='add'>+	if (fb &amp;&amp; refcount_inc_not_zero(&amp;fb-&gt;count))</div><div class='add'>+		return fb;</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fuse_backing_free(struct fuse_backing *fb)</div><div class='add'>+{</div><div class='add'>+	pr_debug("%s: fb=0x%p\n", __func__, fb);</div><div class='add'>+</div><div class='add'>+	if (fb-&gt;file)</div><div class='add'>+		fput(fb-&gt;file);</div><div class='add'>+	put_cred(fb-&gt;cred);</div><div class='add'>+	kfree_rcu(fb, rcu);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void fuse_backing_put(struct fuse_backing *fb)</div><div class='add'>+{</div><div class='add'>+	if (fb &amp;&amp; refcount_dec_and_test(&amp;fb-&gt;count))</div><div class='add'>+		fuse_backing_free(fb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void fuse_backing_files_init(struct fuse_conn *fc)</div><div class='add'>+{</div><div class='add'>+	idr_init(&amp;fc-&gt;backing_files_map);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int fuse_backing_id_alloc(struct fuse_conn *fc, struct fuse_backing *fb)</div><div class='add'>+{</div><div class='add'>+	int id;</div><div class='add'>+</div><div class='add'>+	idr_preload(GFP_KERNEL);</div><div class='add'>+	spin_lock(&amp;fc-&gt;lock);</div><div class='add'>+	/* FIXME: xarray might be space inefficient */</div><div class='add'>+	id = idr_alloc_cyclic(&amp;fc-&gt;backing_files_map, fb, 1, 0, GFP_ATOMIC);</div><div class='add'>+	spin_unlock(&amp;fc-&gt;lock);</div><div class='add'>+	idr_preload_end();</div><div class='add'>+</div><div class='add'>+	WARN_ON_ONCE(id == 0);</div><div class='add'>+	return id;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct fuse_backing *fuse_backing_id_remove(struct fuse_conn *fc,</div><div class='add'>+						   int id)</div><div class='add'>+{</div><div class='add'>+	struct fuse_backing *fb;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fc-&gt;lock);</div><div class='add'>+	fb = idr_remove(&amp;fc-&gt;backing_files_map, id);</div><div class='add'>+	spin_unlock(&amp;fc-&gt;lock);</div><div class='add'>+</div><div class='add'>+	return fb;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int fuse_backing_id_free(int id, void *p, void *data)</div><div class='add'>+{</div><div class='add'>+	struct fuse_backing *fb = p;</div><div class='add'>+</div><div class='add'>+	WARN_ON_ONCE(refcount_read(&amp;fb-&gt;count) != 1);</div><div class='add'>+	fuse_backing_free(fb);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void fuse_backing_files_free(struct fuse_conn *fc)</div><div class='add'>+{</div><div class='add'>+	idr_for_each(&amp;fc-&gt;backing_files_map, fuse_backing_id_free, NULL);</div><div class='add'>+	idr_destroy(&amp;fc-&gt;backing_files_map);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int fuse_backing_open(struct fuse_conn *fc, struct fuse_backing_map *map)</div><div class='add'>+{</div><div class='add'>+	struct file *file;</div><div class='add'>+	struct super_block *backing_sb;</div><div class='add'>+	struct fuse_backing *fb = NULL;</div><div class='add'>+	int res;</div><div class='add'>+</div><div class='add'>+	pr_debug("%s: fd=%d flags=0x%x\n", __func__, map-&gt;fd, map-&gt;flags);</div><div class='add'>+</div><div class='add'>+	/* TODO: relax CAP_SYS_ADMIN once backing files are visible to lsof */</div><div class='add'>+	res = -EPERM;</div><div class='add'>+	if (!fc-&gt;passthrough || !capable(CAP_SYS_ADMIN))</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	res = -EINVAL;</div><div class='add'>+	if (map-&gt;flags || map-&gt;padding)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	file = fget_raw(map-&gt;fd);</div><div class='add'>+	res = -EBADF;</div><div class='add'>+	if (!file)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	/* read/write/splice/mmap passthrough only relevant for regular files */</div><div class='add'>+	res = d_is_dir(file-&gt;f_path.dentry) ? -EISDIR : -EINVAL;</div><div class='add'>+	if (!d_is_reg(file-&gt;f_path.dentry))</div><div class='add'>+		goto out_fput;</div><div class='add'>+</div><div class='add'>+	backing_sb = file_inode(file)-&gt;i_sb;</div><div class='add'>+	res = -ELOOP;</div><div class='add'>+	if (backing_sb-&gt;s_stack_depth &gt;= fc-&gt;max_stack_depth)</div><div class='add'>+		goto out_fput;</div><div class='add'>+</div><div class='add'>+	fb = kmalloc(sizeof(struct fuse_backing), GFP_KERNEL);</div><div class='add'>+	res = -ENOMEM;</div><div class='add'>+	if (!fb)</div><div class='add'>+		goto out_fput;</div><div class='add'>+</div><div class='add'>+	fb-&gt;file = file;</div><div class='add'>+	fb-&gt;cred = prepare_creds();</div><div class='add'>+	refcount_set(&amp;fb-&gt;count, 1);</div><div class='add'>+</div><div class='add'>+	res = fuse_backing_id_alloc(fc, fb);</div><div class='add'>+	if (res &lt; 0) {</div><div class='add'>+		fuse_backing_free(fb);</div><div class='add'>+		fb = NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	pr_debug("%s: fb=0x%p, ret=%i\n", __func__, fb, res);</div><div class='add'>+</div><div class='add'>+	return res;</div><div class='add'>+</div><div class='add'>+out_fput:</div><div class='add'>+	fput(file);</div><div class='add'>+	goto out;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int fuse_backing_close(struct fuse_conn *fc, int backing_id)</div><div class='add'>+{</div><div class='add'>+	struct fuse_backing *fb = NULL;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	pr_debug("%s: backing_id=%d\n", __func__, backing_id);</div><div class='add'>+</div><div class='add'>+	/* TODO: relax CAP_SYS_ADMIN once backing files are visible to lsof */</div><div class='add'>+	err = -EPERM;</div><div class='add'>+	if (!fc-&gt;passthrough || !capable(CAP_SYS_ADMIN))</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	err = -EINVAL;</div><div class='add'>+	if (backing_id &lt;= 0)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	err = -ENOENT;</div><div class='add'>+	fb = fuse_backing_id_remove(fc, backing_id);</div><div class='add'>+	if (!fb)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	fuse_backing_put(fb);</div><div class='add'>+	err = 0;</div><div class='add'>+out:</div><div class='add'>+	pr_debug("%s: fb=0x%p, err=%i\n", __func__, fb, err);</div><div class='add'>+</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct fuse_backing *fuse_backing_lookup(struct fuse_conn *fc, int backing_id)</div><div class='add'>+{</div><div class='add'>+	struct fuse_backing *fb;</div><div class='add'>+</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	fb = idr_find(&amp;fc-&gt;backing_files_map, backing_id);</div><div class='add'>+	fb = fuse_backing_get(fb);</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+</div><div class='add'>+	return fb;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/fuse/control.c b/fs/fuse/control.c<br/>index 000d2e5627e9..140bd5730d99 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fuse/control.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/control.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fuse/control.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fuse/control.c</a></div><div class='hunk'>@@ -11,6 +11,7 @@</div><div class='ctx'> #include &lt;linux/init.h&gt;</div><div class='ctx'> #include &lt;linux/module.h&gt;</div><div class='ctx'> #include &lt;linux/fs_context.h&gt;</div><div class='add'>+#include &lt;linux/namei.h&gt;</div><div class='ctx'> </div><div class='ctx'> #define FUSE_CTL_SUPER_MAGIC 0x65735543</div><div class='ctx'> </div><div class='hunk'>@@ -164,7 +165,6 @@ static ssize_t fuse_conn_congestion_threshold_write(struct file *file,</div><div class='ctx'> {</div><div class='ctx'> 	unsigned val;</div><div class='ctx'> 	struct fuse_conn *fc;</div><div class='del'>-	struct fuse_mount *fm;</div><div class='ctx'> 	ssize_t ret;</div><div class='ctx'> </div><div class='ctx'> 	ret = fuse_conn_limit_write(file, buf, count, ppos, &amp;val,</div><div class='hunk'>@@ -175,27 +175,7 @@ static ssize_t fuse_conn_congestion_threshold_write(struct file *file,</div><div class='ctx'> 	if (!fc)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;fc-&gt;killsb);</div><div class='del'>-	spin_lock(&amp;fc-&gt;bg_lock);</div><div class='del'>-	fc-&gt;congestion_threshold = val;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Get any fuse_mount belonging to this fuse_conn; s_bdi is</div><div class='del'>-	 * shared between all of them</div><div class='del'>-	 */</div><div class='del'>-</div><div class='del'>-	if (!list_empty(&amp;fc-&gt;mounts)) {</div><div class='del'>-		fm = list_first_entry(&amp;fc-&gt;mounts, struct fuse_mount, fc_entry);</div><div class='del'>-		if (fc-&gt;num_background &lt; fc-&gt;congestion_threshold) {</div><div class='del'>-			clear_bdi_congested(fm-&gt;sb-&gt;s_bdi, BLK_RW_SYNC);</div><div class='del'>-			clear_bdi_congested(fm-&gt;sb-&gt;s_bdi, BLK_RW_ASYNC);</div><div class='del'>-		} else {</div><div class='del'>-			set_bdi_congested(fm-&gt;sb-&gt;s_bdi, BLK_RW_SYNC);</div><div class='del'>-			set_bdi_congested(fm-&gt;sb-&gt;s_bdi, BLK_RW_ASYNC);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;fc-&gt;bg_lock);</div><div class='del'>-	up_read(&amp;fc-&gt;killsb);</div><div class='add'>+	WRITE_ONCE(fc-&gt;congestion_threshold, val);</div><div class='ctx'> 	fuse_conn_put(fc);</div><div class='ctx'> out:</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -204,40 +184,34 @@ out:</div><div class='ctx'> static const struct file_operations fuse_ctl_abort_ops = {</div><div class='ctx'> 	.open = nonseekable_open,</div><div class='ctx'> 	.write = fuse_conn_abort_write,</div><div class='del'>-	.llseek = no_llseek,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct file_operations fuse_ctl_waiting_ops = {</div><div class='ctx'> 	.open = nonseekable_open,</div><div class='ctx'> 	.read = fuse_conn_waiting_read,</div><div class='del'>-	.llseek = no_llseek,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct file_operations fuse_conn_max_background_ops = {</div><div class='ctx'> 	.open = nonseekable_open,</div><div class='ctx'> 	.read = fuse_conn_max_background_read,</div><div class='ctx'> 	.write = fuse_conn_max_background_write,</div><div class='del'>-	.llseek = no_llseek,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct file_operations fuse_conn_congestion_threshold_ops = {</div><div class='ctx'> 	.open = nonseekable_open,</div><div class='ctx'> 	.read = fuse_conn_congestion_threshold_read,</div><div class='ctx'> 	.write = fuse_conn_congestion_threshold_write,</div><div class='del'>-	.llseek = no_llseek,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static struct dentry *fuse_ctl_add_dentry(struct dentry *parent,</div><div class='ctx'> 					  struct fuse_conn *fc,</div><div class='del'>-					  const char *name,</div><div class='del'>-					  int mode, int nlink,</div><div class='add'>+					  const char *name, int mode,</div><div class='ctx'> 					  const struct inode_operations *iop,</div><div class='ctx'> 					  const struct file_operations *fop)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dentry;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(fc-&gt;ctl_ndents &gt;= FUSE_CTL_NUM_DENTRIES);</div><div class='ctx'> 	dentry = d_alloc_name(parent, name);</div><div class='ctx'> 	if (!dentry)</div><div class='ctx'> 		return NULL;</div><div class='hunk'>@@ -252,17 +226,24 @@ static struct dentry *fuse_ctl_add_dentry(struct dentry *parent,</div><div class='ctx'> 	inode-&gt;i_mode = mode;</div><div class='ctx'> 	inode-&gt;i_uid = fc-&gt;user_id;</div><div class='ctx'> 	inode-&gt;i_gid = fc-&gt;group_id;</div><div class='del'>-	inode-&gt;i_atime = inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	simple_inode_init_ts(inode);</div><div class='ctx'> 	/* setting -&gt;i_op to NULL is not allowed */</div><div class='ctx'> 	if (iop)</div><div class='ctx'> 		inode-&gt;i_op = iop;</div><div class='ctx'> 	inode-&gt;i_fop = fop;</div><div class='del'>-	set_nlink(inode, nlink);</div><div class='add'>+	if (S_ISDIR(mode)) {</div><div class='add'>+		inc_nlink(d_inode(parent));</div><div class='add'>+		inc_nlink(inode);</div><div class='add'>+	}</div><div class='ctx'> 	inode-&gt;i_private = fc;</div><div class='del'>-	d_add(dentry, inode);</div><div class='del'>-</div><div class='del'>-	fc-&gt;ctl_dentry[fc-&gt;ctl_ndents++] = dentry;</div><div class='add'>+	d_make_persistent(dentry, inode);</div><div class='add'>+	dput(dentry);</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * We are returning a borrowed reference here - it's only good while</div><div class='add'>+	 * fuse_mutex is held.  Actually it's d_make_persistent() return</div><div class='add'>+	 * value...</div><div class='add'>+	 */</div><div class='ctx'> 	return dentry;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -275,26 +256,25 @@ int fuse_ctl_add_conn(struct fuse_conn *fc)</div><div class='ctx'> 	struct dentry *parent;</div><div class='ctx'> 	char name[32];</div><div class='ctx'> </div><div class='del'>-	if (!fuse_control_sb)</div><div class='add'>+	if (!fuse_control_sb || fc-&gt;no_control)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	parent = fuse_control_sb-&gt;s_root;</div><div class='del'>-	inc_nlink(d_inode(parent));</div><div class='ctx'> 	sprintf(name, "%u", fc-&gt;dev);</div><div class='del'>-	parent = fuse_ctl_add_dentry(parent, fc, name, S_IFDIR | 0500, 2,</div><div class='add'>+	parent = fuse_ctl_add_dentry(parent, fc, name, S_IFDIR | 0500,</div><div class='ctx'> 				     &amp;simple_dir_inode_operations,</div><div class='ctx'> 				     &amp;simple_dir_operations);</div><div class='ctx'> 	if (!parent)</div><div class='ctx'> 		goto err;</div><div class='ctx'> </div><div class='del'>-	if (!fuse_ctl_add_dentry(parent, fc, "waiting", S_IFREG | 0400, 1,</div><div class='add'>+	if (!fuse_ctl_add_dentry(parent, fc, "waiting", S_IFREG | 0400,</div><div class='ctx'> 				 NULL, &amp;fuse_ctl_waiting_ops) ||</div><div class='del'>-	    !fuse_ctl_add_dentry(parent, fc, "abort", S_IFREG | 0200, 1,</div><div class='add'>+	    !fuse_ctl_add_dentry(parent, fc, "abort", S_IFREG | 0200,</div><div class='ctx'> 				 NULL, &amp;fuse_ctl_abort_ops) ||</div><div class='ctx'> 	    !fuse_ctl_add_dentry(parent, fc, "max_background", S_IFREG | 0600,</div><div class='del'>-				 1, NULL, &amp;fuse_conn_max_background_ops) ||</div><div class='add'>+				 NULL, &amp;fuse_conn_max_background_ops) ||</div><div class='ctx'> 	    !fuse_ctl_add_dentry(parent, fc, "congestion_threshold",</div><div class='del'>-				 S_IFREG | 0600, 1, NULL,</div><div class='add'>+				 S_IFREG | 0600, NULL,</div><div class='ctx'> 				 &amp;fuse_conn_congestion_threshold_ops))</div><div class='ctx'> 		goto err;</div><div class='ctx'> </div><div class='hunk'>@@ -305,27 +285,24 @@ int fuse_ctl_add_conn(struct fuse_conn *fc)</div><div class='ctx'> 	return -ENOMEM;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void remove_one(struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	d_inode(dentry)-&gt;i_private = NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Remove a connection from the control filesystem (if it exists).</div><div class='ctx'>  * Caller must hold fuse_mutex</div><div class='ctx'>  */</div><div class='ctx'> void fuse_ctl_remove_conn(struct fuse_conn *fc)</div><div class='ctx'> {</div><div class='del'>-	int i;</div><div class='add'>+	char name[32];</div><div class='ctx'> </div><div class='del'>-	if (!fuse_control_sb)</div><div class='add'>+	if (!fuse_control_sb || fc-&gt;no_control)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	for (i = fc-&gt;ctl_ndents - 1; i &gt;= 0; i--) {</div><div class='del'>-		struct dentry *dentry = fc-&gt;ctl_dentry[i];</div><div class='del'>-		d_inode(dentry)-&gt;i_private = NULL;</div><div class='del'>-		if (!i) {</div><div class='del'>-			/* Get rid of submounts: */</div><div class='del'>-			d_invalidate(dentry);</div><div class='del'>-		}</div><div class='del'>-		dput(dentry);</div><div class='del'>-	}</div><div class='del'>-	drop_nlink(d_inode(fuse_control_sb-&gt;s_root));</div><div class='add'>+	sprintf(name, "%u", fc-&gt;dev);</div><div class='add'>+	simple_remove_by_name(fuse_control_sb-&gt;s_root, name, remove_one);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int fuse_ctl_fill_super(struct super_block *sb, struct fs_context *fsc)</div><div class='hunk'>@@ -371,15 +348,11 @@ static int fuse_ctl_init_fs_context(struct fs_context *fsc)</div><div class='ctx'> </div><div class='ctx'> static void fuse_ctl_kill_sb(struct super_block *sb)</div><div class='ctx'> {</div><div class='del'>-	struct fuse_conn *fc;</div><div class='del'>-</div><div class='ctx'> 	mutex_lock(&amp;fuse_mutex);</div><div class='ctx'> 	fuse_control_sb = NULL;</div><div class='del'>-	list_for_each_entry(fc, &amp;fuse_conn_list, entry)</div><div class='del'>-		fc-&gt;ctl_ndents = 0;</div><div class='ctx'> 	mutex_unlock(&amp;fuse_mutex);</div><div class='ctx'> </div><div class='del'>-	kill_litter_super(sb);</div><div class='add'>+	kill_anon_super(sb);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct file_system_type fuse_ctl_fs_type = {</div><div class='head'>diff --git a/fs/fuse/cuse.c b/fs/fuse/cuse.c<br/>index c7d882a9fe33..28c96961e85d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fuse/cuse.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/cuse.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fuse/cuse.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fuse/cuse.c</a></div><div class='hunk'>@@ -52,6 +52,7 @@</div><div class='ctx'> #include &lt;linux/user_namespace.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "fuse_i.h"</div><div class='add'>+#include "fuse_dev_i.h"</div><div class='ctx'> </div><div class='ctx'> #define CUSE_CONNTBL_LEN	64</div><div class='ctx'> </div><div class='hunk'>@@ -256,7 +257,7 @@ static int cuse_parse_one(char **pp, char *end, char **keyp, char **valp)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * cuse_parse_dev_info - parse device info</div><div class='add'>+ * cuse_parse_devinfo - parse device info</div><div class='ctx'>  * @p: device info string</div><div class='ctx'>  * @len: length of device info string</div><div class='ctx'>  * @devinfo: out parameter for parsed device info</div><div class='hunk'>@@ -303,13 +304,17 @@ struct cuse_init_args {</div><div class='ctx'> 	struct fuse_args_pages ap;</div><div class='ctx'> 	struct cuse_init_in in;</div><div class='ctx'> 	struct cuse_init_out out;</div><div class='del'>-	struct page *page;</div><div class='del'>-	struct fuse_page_desc desc;</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	struct fuse_folio_desc desc;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * cuse_process_init_reply - finish initializing CUSE channel</div><div class='ctx'>  *</div><div class='add'>+ * @fm: The fuse mount information containing the CUSE connection.</div><div class='add'>+ * @args: The arguments passed to the init reply.</div><div class='add'>+ * @error: The error code signifying if any error occurred during the process.</div><div class='add'>+ *</div><div class='ctx'>  * This function creates the character device and sets up all the</div><div class='ctx'>  * required data structures for it.  Please read the comment at the</div><div class='ctx'>  * top of this file for high level overview.</div><div class='hunk'>@@ -322,7 +327,7 @@ static void cuse_process_init_reply(struct fuse_mount *fm,</div><div class='ctx'> 	struct fuse_args_pages *ap = &amp;ia-&gt;ap;</div><div class='ctx'> 	struct cuse_conn *cc = fc_to_cc(fc), *pos;</div><div class='ctx'> 	struct cuse_init_out *arg = &amp;ia-&gt;out;</div><div class='del'>-	struct page *page = ap-&gt;pages[0];</div><div class='add'>+	struct folio *folio = ap-&gt;folios[0];</div><div class='ctx'> 	struct cuse_devinfo devinfo = { };</div><div class='ctx'> 	struct device *dev;</div><div class='ctx'> 	struct cdev *cdev;</div><div class='hunk'>@@ -339,7 +344,7 @@ static void cuse_process_init_reply(struct fuse_mount *fm,</div><div class='ctx'> 	/* parse init reply */</div><div class='ctx'> 	cc-&gt;unrestricted_ioctl = arg-&gt;flags &amp; CUSE_UNRESTRICTED_IOCTL;</div><div class='ctx'> </div><div class='del'>-	rc = cuse_parse_devinfo(page_address(page), ap-&gt;args.out_args[1].size,</div><div class='add'>+	rc = cuse_parse_devinfo(folio_address(folio), ap-&gt;args.out_args[1].size,</div><div class='ctx'> 				&amp;devinfo);</div><div class='ctx'> 	if (rc)</div><div class='ctx'> 		goto err;</div><div class='hunk'>@@ -407,7 +412,7 @@ static void cuse_process_init_reply(struct fuse_mount *fm,</div><div class='ctx'> 	kobject_uevent(&amp;dev-&gt;kobj, KOBJ_ADD);</div><div class='ctx'> out:</div><div class='ctx'> 	kfree(ia);</div><div class='del'>-	__free_page(page);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> 	return;</div><div class='ctx'> </div><div class='ctx'> err_cdev:</div><div class='hunk'>@@ -425,7 +430,7 @@ err:</div><div class='ctx'> static int cuse_send_init(struct cuse_conn *cc)</div><div class='ctx'> {</div><div class='ctx'> 	int rc;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	struct fuse_mount *fm = &amp;cc-&gt;fm;</div><div class='ctx'> 	struct cuse_init_args *ia;</div><div class='ctx'> 	struct fuse_args_pages *ap;</div><div class='hunk'>@@ -433,13 +438,14 @@ static int cuse_send_init(struct cuse_conn *cc)</div><div class='ctx'> 	BUILD_BUG_ON(CUSE_INIT_INFO_MAX &gt; PAGE_SIZE);</div><div class='ctx'> </div><div class='ctx'> 	rc = -ENOMEM;</div><div class='del'>-	page = alloc_page(GFP_KERNEL | __GFP_ZERO);</div><div class='del'>-	if (!page)</div><div class='add'>+</div><div class='add'>+	folio = folio_alloc(GFP_KERNEL | __GFP_ZERO, 0);</div><div class='add'>+	if (!folio)</div><div class='ctx'> 		goto err;</div><div class='ctx'> </div><div class='ctx'> 	ia = kzalloc(sizeof(*ia), GFP_KERNEL);</div><div class='ctx'> 	if (!ia)</div><div class='del'>-		goto err_free_page;</div><div class='add'>+		goto err_free_folio;</div><div class='ctx'> </div><div class='ctx'> 	ap = &amp;ia-&gt;ap;</div><div class='ctx'> 	ia-&gt;in.major = FUSE_KERNEL_VERSION;</div><div class='hunk'>@@ -455,18 +461,18 @@ static int cuse_send_init(struct cuse_conn *cc)</div><div class='ctx'> 	ap-&gt;args.out_args[1].size = CUSE_INIT_INFO_MAX;</div><div class='ctx'> 	ap-&gt;args.out_argvar = true;</div><div class='ctx'> 	ap-&gt;args.out_pages = true;</div><div class='del'>-	ap-&gt;num_pages = 1;</div><div class='del'>-	ap-&gt;pages = &amp;ia-&gt;page;</div><div class='add'>+	ap-&gt;num_folios = 1;</div><div class='add'>+	ap-&gt;folios = &amp;ia-&gt;folio;</div><div class='ctx'> 	ap-&gt;descs = &amp;ia-&gt;desc;</div><div class='del'>-	ia-&gt;page = page;</div><div class='add'>+	ia-&gt;folio = folio;</div><div class='ctx'> 	ia-&gt;desc.length = ap-&gt;args.out_args[1].size;</div><div class='ctx'> 	ap-&gt;args.end = cuse_process_init_reply;</div><div class='ctx'> </div><div class='ctx'> 	rc = fuse_simple_background(fm, &amp;ap-&gt;args, GFP_KERNEL);</div><div class='ctx'> 	if (rc) {</div><div class='ctx'> 		kfree(ia);</div><div class='del'>-err_free_page:</div><div class='del'>-		__free_page(page);</div><div class='add'>+err_free_folio:</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 	}</div><div class='ctx'> err:</div><div class='ctx'> 	return rc;</div><div class='hunk'>@@ -474,8 +480,7 @@ err:</div><div class='ctx'> </div><div class='ctx'> static void cuse_fc_release(struct fuse_conn *fc)</div><div class='ctx'> {</div><div class='del'>-	struct cuse_conn *cc = fc_to_cc(fc);</div><div class='del'>-	kfree_rcu(cc, fc.rcu);</div><div class='add'>+	kfree(fc_to_cc(fc));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -543,9 +548,8 @@ static int cuse_channel_open(struct inode *inode, struct file *file)</div><div class='ctx'>  */</div><div class='ctx'> static int cuse_channel_release(struct inode *inode, struct file *file)</div><div class='ctx'> {</div><div class='del'>-	struct fuse_dev *fud = file-&gt;private_data;</div><div class='add'>+	struct fuse_dev *fud = __fuse_get_dev(file);</div><div class='ctx'> 	struct cuse_conn *cc = fc_to_cc(fud-&gt;fc);</div><div class='del'>-	int rc;</div><div class='ctx'> </div><div class='ctx'> 	/* remove from the conntbl, no more access from this point on */</div><div class='ctx'> 	mutex_lock(&amp;cuse_lock);</div><div class='hunk'>@@ -560,9 +564,7 @@ static int cuse_channel_release(struct inode *inode, struct file *file)</div><div class='ctx'> 		cdev_del(cc-&gt;cdev);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	rc = fuse_dev_release(inode, file);	/* puts the base reference */</div><div class='del'>-</div><div class='del'>-	return rc;</div><div class='add'>+	return fuse_dev_release(inode, file);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct file_operations cuse_channel_fops; /* initialized during init */</div><div class='hunk'>@@ -626,7 +628,7 @@ static int __init cuse_init(void)</div><div class='ctx'> 	/* CUSE is not prepared for FUSE_DEV_IOC_CLONE */</div><div class='ctx'> 	cuse_channel_fops.unlocked_ioctl	= NULL;</div><div class='ctx'> </div><div class='del'>-	cuse_class = class_create(THIS_MODULE, "cuse");</div><div class='add'>+	cuse_class = class_create("cuse");</div><div class='ctx'> 	if (IS_ERR(cuse_class))</div><div class='ctx'> 		return PTR_ERR(cuse_class);</div><div class='ctx'> </div><div class='head'>diff --git a/fs/fuse/dax.c b/fs/fuse/dax.c<br/>index 713818d74de6..ac6d4c1064cc 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fuse/dax.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/dax.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fuse/dax.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fuse/dax.c</a></div><div class='hunk'>@@ -10,7 +10,6 @@</div><div class='ctx'> #include &lt;linux/dax.h&gt;</div><div class='ctx'> #include &lt;linux/uio.h&gt;</div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='del'>-#include &lt;linux/pfn_t.h&gt;</div><div class='ctx'> #include &lt;linux/iomap.h&gt;</div><div class='ctx'> #include &lt;linux/interval_tree.h&gt;</div><div class='ctx'> </div><div class='hunk'>@@ -138,9 +137,9 @@ static struct fuse_dax_mapping *alloc_dax_mapping(struct fuse_conn_dax *fcd)</div><div class='ctx'> 		WARN_ON(fcd-&gt;nr_free_ranges &lt;= 0);</div><div class='ctx'> 		fcd-&gt;nr_free_ranges--;</div><div class='ctx'> 	}</div><div class='add'>+	__kick_dmap_free_worker(fcd, 0);</div><div class='ctx'> 	spin_unlock(&amp;fcd-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	kick_dmap_free_worker(fcd, 0);</div><div class='ctx'> 	return dmap;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -240,11 +239,12 @@ static int fuse_send_removemapping(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 	args.opcode = FUSE_REMOVEMAPPING;</div><div class='ctx'> 	args.nodeid = fi-&gt;nodeid;</div><div class='del'>-	args.in_numargs = 2;</div><div class='del'>-	args.in_args[0].size = sizeof(*inargp);</div><div class='del'>-	args.in_args[0].value = inargp;</div><div class='del'>-	args.in_args[1].size = inargp-&gt;count * sizeof(*remove_one);</div><div class='del'>-	args.in_args[1].value = remove_one;</div><div class='add'>+	args.in_numargs = 3;</div><div class='add'>+	fuse_set_zero_arg0(&amp;args);</div><div class='add'>+	args.in_args[1].size = sizeof(*inargp);</div><div class='add'>+	args.in_args[1].value = inargp;</div><div class='add'>+	args.in_args[2].size = inargp-&gt;count * sizeof(*remove_one);</div><div class='add'>+	args.in_args[2].value = remove_one;</div><div class='ctx'> 	return fuse_simple_request(fm, &amp;args);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -665,36 +665,12 @@ static void fuse_wait_dax_page(struct inode *inode)</div><div class='ctx'> 	filemap_invalidate_lock(inode-&gt;i_mapping);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Should be called with mapping-&gt;invalidate_lock held exclusively */</div><div class='del'>-static int __fuse_dax_break_layouts(struct inode *inode, bool *retry,</div><div class='del'>-				    loff_t start, loff_t end)</div><div class='del'>-{</div><div class='del'>-	struct page *page;</div><div class='del'>-</div><div class='del'>-	page = dax_layout_busy_page_range(inode-&gt;i_mapping, start, end);</div><div class='del'>-	if (!page)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	*retry = true;</div><div class='del'>-	return ___wait_var_event(&amp;page-&gt;_refcount,</div><div class='del'>-			atomic_read(&amp;page-&gt;_refcount) == 1, TASK_INTERRUPTIBLE,</div><div class='del'>-			0, 0, fuse_wait_dax_page(inode));</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* dmap_end == 0 leads to unmapping of whole file */</div><div class='add'>+/* Should be called with mapping-&gt;invalidate_lock held exclusively. */</div><div class='ctx'> int fuse_dax_break_layouts(struct inode *inode, u64 dmap_start,</div><div class='ctx'> 				  u64 dmap_end)</div><div class='ctx'> {</div><div class='del'>-	bool	retry;</div><div class='del'>-	int	ret;</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		retry = false;</div><div class='del'>-		ret = __fuse_dax_break_layouts(inode, &amp;retry, dmap_start,</div><div class='del'>-					       dmap_end);</div><div class='del'>-	} while (ret == 0 &amp;&amp; retry);</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='add'>+	return dax_break_layout(inode, dmap_start, dmap_end,</div><div class='add'>+				fuse_wait_dax_page);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> ssize_t fuse_dax_read_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='hunk'>@@ -774,23 +750,13 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fuse_dax_writepages(struct address_space *mapping,</div><div class='del'>-			       struct writeback_control *wbc)</div><div class='del'>-{</div><div class='del'>-</div><div class='del'>-	struct inode *inode = mapping-&gt;host;</div><div class='del'>-	struct fuse_conn *fc = get_fuse_conn(inode);</div><div class='del'>-</div><div class='del'>-	return dax_writeback_mapping_range(mapping, fc-&gt;dax-&gt;dev, wbc);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static vm_fault_t __fuse_dax_fault(struct vm_fault *vmf,</div><div class='del'>-				   enum page_entry_size pe_size, bool write)</div><div class='add'>+static vm_fault_t __fuse_dax_fault(struct vm_fault *vmf, unsigned int order,</div><div class='add'>+		bool write)</div><div class='ctx'> {</div><div class='ctx'> 	vm_fault_t ret;</div><div class='ctx'> 	struct inode *inode = file_inode(vmf-&gt;vma-&gt;vm_file);</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='del'>-	pfn_t pfn;</div><div class='add'>+	unsigned long pfn;</div><div class='ctx'> 	int error = 0;</div><div class='ctx'> 	struct fuse_conn *fc = get_fuse_conn(inode);</div><div class='ctx'> 	struct fuse_conn_dax *fcd = fc-&gt;dax;</div><div class='hunk'>@@ -809,7 +775,7 @@ retry:</div><div class='ctx'> 	 * to populate page cache or access memory we are trying to free.</div><div class='ctx'> 	 */</div><div class='ctx'> 	filemap_invalidate_lock_shared(inode-&gt;i_mapping);</div><div class='del'>-	ret = dax_iomap_fault(vmf, pe_size, &amp;pfn, &amp;error, &amp;fuse_iomap_ops);</div><div class='add'>+	ret = dax_iomap_fault(vmf, order, &amp;pfn, &amp;error, &amp;fuse_iomap_ops);</div><div class='ctx'> 	if ((ret &amp; VM_FAULT_ERROR) &amp;&amp; error == -EAGAIN) {</div><div class='ctx'> 		error = 0;</div><div class='ctx'> 		retry = true;</div><div class='hunk'>@@ -818,7 +784,7 @@ retry:</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (ret &amp; VM_FAULT_NEEDDSYNC)</div><div class='del'>-		ret = dax_finish_sync_fault(vmf, pe_size, pfn);</div><div class='add'>+		ret = dax_finish_sync_fault(vmf, order, pfn);</div><div class='ctx'> 	filemap_invalidate_unlock_shared(inode-&gt;i_mapping);</div><div class='ctx'> </div><div class='ctx'> 	if (write)</div><div class='hunk'>@@ -829,24 +795,22 @@ retry:</div><div class='ctx'> </div><div class='ctx'> static vm_fault_t fuse_dax_fault(struct vm_fault *vmf)</div><div class='ctx'> {</div><div class='del'>-	return __fuse_dax_fault(vmf, PE_SIZE_PTE,</div><div class='del'>-				vmf-&gt;flags &amp; FAULT_FLAG_WRITE);</div><div class='add'>+	return __fuse_dax_fault(vmf, 0, vmf-&gt;flags &amp; FAULT_FLAG_WRITE);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static vm_fault_t fuse_dax_huge_fault(struct vm_fault *vmf,</div><div class='del'>-			       enum page_entry_size pe_size)</div><div class='add'>+static vm_fault_t fuse_dax_huge_fault(struct vm_fault *vmf, unsigned int order)</div><div class='ctx'> {</div><div class='del'>-	return __fuse_dax_fault(vmf, pe_size, vmf-&gt;flags &amp; FAULT_FLAG_WRITE);</div><div class='add'>+	return __fuse_dax_fault(vmf, order, vmf-&gt;flags &amp; FAULT_FLAG_WRITE);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static vm_fault_t fuse_dax_page_mkwrite(struct vm_fault *vmf)</div><div class='ctx'> {</div><div class='del'>-	return __fuse_dax_fault(vmf, PE_SIZE_PTE, true);</div><div class='add'>+	return __fuse_dax_fault(vmf, 0, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static vm_fault_t fuse_dax_pfn_mkwrite(struct vm_fault *vmf)</div><div class='ctx'> {</div><div class='del'>-	return __fuse_dax_fault(vmf, PE_SIZE_PTE, true);</div><div class='add'>+	return __fuse_dax_fault(vmf, 0, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct vm_operations_struct fuse_dax_vm_ops = {</div><div class='hunk'>@@ -860,7 +824,7 @@ int fuse_dax_mmap(struct file *file, struct vm_area_struct *vma)</div><div class='ctx'> {</div><div class='ctx'> 	file_accessed(file);</div><div class='ctx'> 	vma-&gt;vm_ops = &amp;fuse_dax_vm_ops;</div><div class='del'>-	vma-&gt;vm_flags |= VM_MIXEDMAP | VM_HUGEPAGE;</div><div class='add'>+	vm_flags_set(vma, VM_MIXEDMAP | VM_HUGEPAGE);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1224,6 +1188,7 @@ void fuse_dax_conn_free(struct fuse_conn *fc)</div><div class='ctx'> 	if (fc-&gt;dax) {</div><div class='ctx'> 		fuse_free_dax_mem_ranges(&amp;fc-&gt;dax-&gt;free_ranges);</div><div class='ctx'> 		kfree(fc-&gt;dax);</div><div class='add'>+		fc-&gt;dax = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1241,8 +1206,8 @@ static int fuse_dax_mem_range_init(struct fuse_conn_dax *fcd)</div><div class='ctx'> 	INIT_DELAYED_WORK(&amp;fcd-&gt;free_work, fuse_dax_free_mem_worker);</div><div class='ctx'> </div><div class='ctx'> 	id = dax_read_lock();</div><div class='del'>-	nr_pages = dax_direct_access(fcd-&gt;dev, 0, PHYS_PFN(dax_size), NULL,</div><div class='del'>-				     NULL);</div><div class='add'>+	nr_pages = dax_direct_access(fcd-&gt;dev, 0, PHYS_PFN(dax_size),</div><div class='add'>+			DAX_ACCESS, NULL, NULL);</div><div class='ctx'> 	dax_read_unlock(id);</div><div class='ctx'> 	if (nr_pages &lt; 0) {</div><div class='ctx'> 		pr_debug("dax_direct_access() returned %ld\n", nr_pages);</div><div class='hunk'>@@ -1279,11 +1244,14 @@ out_err:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int fuse_dax_conn_alloc(struct fuse_conn *fc, struct dax_device *dax_dev)</div><div class='add'>+int fuse_dax_conn_alloc(struct fuse_conn *fc, enum fuse_dax_mode dax_mode,</div><div class='add'>+			struct dax_device *dax_dev)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_conn_dax *fcd;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='add'>+	fc-&gt;dax_mode = dax_mode;</div><div class='add'>+</div><div class='ctx'> 	if (!dax_dev)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='hunk'>@@ -1321,23 +1289,50 @@ bool fuse_dax_inode_alloc(struct super_block *sb, struct fuse_inode *fi)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct address_space_operations fuse_dax_file_aops  = {</div><div class='del'>-	.writepages	= fuse_dax_writepages,</div><div class='ctx'> 	.direct_IO	= noop_direct_IO,</div><div class='del'>-	.set_page_dirty	= __set_page_dirty_no_writeback,</div><div class='del'>-	.invalidatepage	= noop_invalidatepage,</div><div class='add'>+	.dirty_folio	= noop_dirty_folio,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-void fuse_dax_inode_init(struct inode *inode)</div><div class='add'>+static bool fuse_should_enable_dax(struct inode *inode, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_conn *fc = get_fuse_conn(inode);</div><div class='add'>+	enum fuse_dax_mode dax_mode = fc-&gt;dax_mode;</div><div class='ctx'> </div><div class='add'>+	if (dax_mode == FUSE_DAX_NEVER)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * fc-&gt;dax may be NULL in 'inode' mode when filesystem device doesn't</div><div class='add'>+	 * support DAX, in which case it will silently fallback to 'never' mode.</div><div class='add'>+	 */</div><div class='ctx'> 	if (!fc-&gt;dax)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	if (dax_mode == FUSE_DAX_ALWAYS)</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	/* dax_mode is FUSE_DAX_INODE* */</div><div class='add'>+	return fc-&gt;inode_dax &amp;&amp; (flags &amp; FUSE_ATTR_DAX);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void fuse_dax_inode_init(struct inode *inode, unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	if (!fuse_should_enable_dax(inode, flags))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_flags |= S_DAX;</div><div class='ctx'> 	inode-&gt;i_data.a_ops = &amp;fuse_dax_file_aops;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void fuse_dax_dontcache(struct inode *inode, unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	struct fuse_conn *fc = get_fuse_conn(inode);</div><div class='add'>+</div><div class='add'>+	if (fuse_is_inode_dax_mode(fc-&gt;dax_mode) &amp;&amp;</div><div class='add'>+	    ((bool) IS_DAX(inode) != (bool) (flags &amp; FUSE_ATTR_DAX)))</div><div class='add'>+		d_mark_dontcache(inode);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> bool fuse_dax_check_alignment(struct fuse_conn *fc, unsigned int map_alignment)</div><div class='ctx'> {</div><div class='ctx'> 	if (fc-&gt;dax &amp;&amp; (map_alignment &gt; FUSE_DAX_SHIFT)) {</div><div class='head'>diff --git a/fs/fuse/dev.c b/fs/fuse/dev.c<br/>index 79f7eda49e06..6d59cbc877c6 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fuse/dev.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/dev.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fuse/dev.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fuse/dev.c</a></div><div class='hunk'>@@ -6,7 +6,9 @@</div><div class='ctx'>   See the file COPYING.</div><div class='ctx'> */</div><div class='ctx'> </div><div class='add'>+#include "dev_uring_i.h"</div><div class='ctx'> #include "fuse_i.h"</div><div class='add'>+#include "fuse_dev_i.h"</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/init.h&gt;</div><div class='ctx'> #include &lt;linux/module.h&gt;</div><div class='hunk'>@@ -21,23 +23,107 @@</div><div class='ctx'> #include &lt;linux/swap.h&gt;</div><div class='ctx'> #include &lt;linux/splice.h&gt;</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='add'>+#include &lt;linux/seq_file.h&gt;</div><div class='add'>+</div><div class='add'>+#include "fuse_trace.h"</div><div class='ctx'> </div><div class='ctx'> MODULE_ALIAS_MISCDEV(FUSE_MINOR);</div><div class='ctx'> MODULE_ALIAS("devname:fuse");</div><div class='ctx'> </div><div class='del'>-/* Ordinary requests have even IDs, while interrupts IDs are odd */</div><div class='del'>-#define FUSE_INT_REQ_BIT (1ULL &lt;&lt; 0)</div><div class='del'>-#define FUSE_REQ_ID_STEP (1ULL &lt;&lt; 1)</div><div class='del'>-</div><div class='ctx'> static struct kmem_cache *fuse_req_cachep;</div><div class='ctx'> </div><div class='del'>-static struct fuse_dev *fuse_get_dev(struct file *file)</div><div class='add'>+const unsigned long fuse_timeout_timer_freq =</div><div class='add'>+	secs_to_jiffies(FUSE_TIMEOUT_TIMER_FREQ);</div><div class='add'>+</div><div class='add'>+bool fuse_request_expired(struct fuse_conn *fc, struct list_head *list)</div><div class='ctx'> {</div><div class='del'>-	/*</div><div class='del'>-	 * Lockless access is OK, because file-&gt;private data is set</div><div class='del'>-	 * once during mount and is valid until the file is released.</div><div class='del'>-	 */</div><div class='del'>-	return READ_ONCE(file-&gt;private_data);</div><div class='add'>+	struct fuse_req *req;</div><div class='add'>+</div><div class='add'>+	req = list_first_entry_or_null(list, struct fuse_req, list);</div><div class='add'>+	if (!req)</div><div class='add'>+		return false;</div><div class='add'>+	return time_is_before_jiffies(req-&gt;create_time + fc-&gt;timeout.req_timeout);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool fuse_fpq_processing_expired(struct fuse_conn *fc, struct list_head *processing)</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; FUSE_PQ_HASH_SIZE; i++)</div><div class='add'>+		if (fuse_request_expired(fc, &amp;processing[i]))</div><div class='add'>+			return true;</div><div class='add'>+</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Check if any requests aren't being completed by the time the request timeout</div><div class='add'>+ * elapses. To do so, we:</div><div class='add'>+ * - check the fiq pending list</div><div class='add'>+ * - check the bg queue</div><div class='add'>+ * - check the fpq io and processing lists</div><div class='add'>+ *</div><div class='add'>+ * To make this fast, we only check against the head request on each list since</div><div class='add'>+ * these are generally queued in order of creation time (eg newer requests get</div><div class='add'>+ * queued to the tail). We might miss a few edge cases (eg requests transitioning</div><div class='add'>+ * between lists, re-sent requests at the head of the pending list having a</div><div class='add'>+ * later creation time than other requests on that list, etc.) but that is fine</div><div class='add'>+ * since if the request never gets fulfilled, it will eventually be caught.</div><div class='add'>+ */</div><div class='add'>+void fuse_check_timeout(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct delayed_work *dwork = to_delayed_work(work);</div><div class='add'>+	struct fuse_conn *fc = container_of(dwork, struct fuse_conn,</div><div class='add'>+					    timeout.work);</div><div class='add'>+	struct fuse_iqueue *fiq = &amp;fc-&gt;iq;</div><div class='add'>+	struct fuse_dev *fud;</div><div class='add'>+	struct fuse_pqueue *fpq;</div><div class='add'>+	bool expired = false;</div><div class='add'>+</div><div class='add'>+	if (!atomic_read(&amp;fc-&gt;num_waiting))</div><div class='add'>+	    goto out;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fiq-&gt;lock);</div><div class='add'>+	expired = fuse_request_expired(fc, &amp;fiq-&gt;pending);</div><div class='add'>+	spin_unlock(&amp;fiq-&gt;lock);</div><div class='add'>+	if (expired)</div><div class='add'>+		goto abort_conn;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fc-&gt;bg_lock);</div><div class='add'>+	expired = fuse_request_expired(fc, &amp;fc-&gt;bg_queue);</div><div class='add'>+	spin_unlock(&amp;fc-&gt;bg_lock);</div><div class='add'>+	if (expired)</div><div class='add'>+		goto abort_conn;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fc-&gt;lock);</div><div class='add'>+	if (!fc-&gt;connected) {</div><div class='add'>+		spin_unlock(&amp;fc-&gt;lock);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+	list_for_each_entry(fud, &amp;fc-&gt;devices, entry) {</div><div class='add'>+		fpq = &amp;fud-&gt;pq;</div><div class='add'>+		spin_lock(&amp;fpq-&gt;lock);</div><div class='add'>+		if (fuse_request_expired(fc, &amp;fpq-&gt;io) ||</div><div class='add'>+		    fuse_fpq_processing_expired(fc, fpq-&gt;processing)) {</div><div class='add'>+			spin_unlock(&amp;fpq-&gt;lock);</div><div class='add'>+			spin_unlock(&amp;fc-&gt;lock);</div><div class='add'>+			goto abort_conn;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		spin_unlock(&amp;fpq-&gt;lock);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;fc-&gt;lock);</div><div class='add'>+</div><div class='add'>+	if (fuse_uring_request_expired(fc))</div><div class='add'>+	    goto abort_conn;</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	queue_delayed_work(system_percpu_wq, &amp;fc-&gt;timeout.work,</div><div class='add'>+			   fuse_timeout_timer_freq);</div><div class='add'>+	return;</div><div class='add'>+</div><div class='add'>+abort_conn:</div><div class='add'>+	fuse_abort_conn(fc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void fuse_request_init(struct fuse_mount *fm, struct fuse_req *req)</div><div class='hunk'>@@ -48,6 +134,7 @@ static void fuse_request_init(struct fuse_mount *fm, struct fuse_req *req)</div><div class='ctx'> 	refcount_set(&amp;req-&gt;count, 1);</div><div class='ctx'> 	__set_bit(FR_PENDING, &amp;req-&gt;flags);</div><div class='ctx'> 	req-&gt;fm = fm;</div><div class='add'>+	req-&gt;create_time = jiffies;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct fuse_req *fuse_request_alloc(struct fuse_mount *fm, gfp_t flags)</div><div class='hunk'>@@ -84,7 +171,8 @@ void fuse_set_initialized(struct fuse_conn *fc)</div><div class='ctx'> </div><div class='ctx'> static bool fuse_block_alloc(struct fuse_conn *fc, bool for_background)</div><div class='ctx'> {</div><div class='del'>-	return !fc-&gt;initialized || (for_background &amp;&amp; fc-&gt;blocked);</div><div class='add'>+	return !fc-&gt;initialized || (for_background &amp;&amp; fc-&gt;blocked) ||</div><div class='add'>+	       (fc-&gt;io_uring &amp;&amp; fc-&gt;connected &amp;&amp; !fuse_uring_ready(fc));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void fuse_drop_waiting(struct fuse_conn *fc)</div><div class='hunk'>@@ -103,17 +191,24 @@ static void fuse_drop_waiting(struct fuse_conn *fc)</div><div class='ctx'> </div><div class='ctx'> static void fuse_put_request(struct fuse_req *req);</div><div class='ctx'> </div><div class='del'>-static struct fuse_req *fuse_get_req(struct fuse_mount *fm, bool for_background)</div><div class='add'>+static struct fuse_req *fuse_get_req(struct mnt_idmap *idmap,</div><div class='add'>+				     struct fuse_mount *fm,</div><div class='add'>+				     bool for_background)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_conn *fc = fm-&gt;fc;</div><div class='ctx'> 	struct fuse_req *req;</div><div class='add'>+	bool no_idmap = !fm-&gt;sb || (fm-&gt;sb-&gt;s_iflags &amp; SB_I_NOIDMAP);</div><div class='add'>+	kuid_t fsuid;</div><div class='add'>+	kgid_t fsgid;</div><div class='ctx'> 	int err;</div><div class='add'>+</div><div class='ctx'> 	atomic_inc(&amp;fc-&gt;num_waiting);</div><div class='ctx'> </div><div class='ctx'> 	if (fuse_block_alloc(fc, for_background)) {</div><div class='ctx'> 		err = -EINTR;</div><div class='del'>-		if (wait_event_killable_exclusive(fc-&gt;blocked_waitq,</div><div class='del'>-				!fuse_block_alloc(fc, for_background)))</div><div class='add'>+		if (wait_event_state_exclusive(fc-&gt;blocked_waitq,</div><div class='add'>+				!fuse_block_alloc(fc, for_background),</div><div class='add'>+				(TASK_KILLABLE | TASK_FREEZABLE)))</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	/* Matches smp_wmb() in fuse_set_initialized() */</div><div class='hunk'>@@ -135,19 +230,32 @@ static struct fuse_req *fuse_get_req(struct fuse_mount *fm, bool for_background)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	req-&gt;in.h.uid = from_kuid(fc-&gt;user_ns, current_fsuid());</div><div class='del'>-	req-&gt;in.h.gid = from_kgid(fc-&gt;user_ns, current_fsgid());</div><div class='ctx'> 	req-&gt;in.h.pid = pid_nr_ns(task_pid(current), fc-&gt;pid_ns);</div><div class='ctx'> </div><div class='ctx'> 	__set_bit(FR_WAITING, &amp;req-&gt;flags);</div><div class='ctx'> 	if (for_background)</div><div class='ctx'> 		__set_bit(FR_BACKGROUND, &amp;req-&gt;flags);</div><div class='ctx'> </div><div class='del'>-	if (unlikely(req-&gt;in.h.uid == ((uid_t)-1) ||</div><div class='del'>-		     req-&gt;in.h.gid == ((gid_t)-1))) {</div><div class='add'>+	/*</div><div class='add'>+	 * Keep the old behavior when idmappings support was not</div><div class='add'>+	 * declared by a FUSE server.</div><div class='add'>+	 *</div><div class='add'>+	 * For those FUSE servers who support idmapped mounts,</div><div class='add'>+	 * we send UID/GID only along with "inode creation"</div><div class='add'>+	 * fuse requests, otherwise idmap == &amp;invalid_mnt_idmap and</div><div class='add'>+	 * req-&gt;in.h.{u,g}id will be equal to FUSE_INVALID_UIDGID.</div><div class='add'>+	 */</div><div class='add'>+	fsuid = no_idmap ? current_fsuid() : mapped_fsuid(idmap, fc-&gt;user_ns);</div><div class='add'>+	fsgid = no_idmap ? current_fsgid() : mapped_fsgid(idmap, fc-&gt;user_ns);</div><div class='add'>+	req-&gt;in.h.uid = from_kuid(fc-&gt;user_ns, fsuid);</div><div class='add'>+	req-&gt;in.h.gid = from_kgid(fc-&gt;user_ns, fsgid);</div><div class='add'>+</div><div class='add'>+	if (no_idmap &amp;&amp; unlikely(req-&gt;in.h.uid == ((uid_t)-1) ||</div><div class='add'>+				 req-&gt;in.h.gid == ((gid_t)-1))) {</div><div class='ctx'> 		fuse_put_request(req);</div><div class='ctx'> 		return ERR_PTR(-EOVERFLOW);</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> 	return req;</div><div class='ctx'> </div><div class='ctx'>  out:</div><div class='hunk'>@@ -192,19 +300,31 @@ unsigned int fuse_len_args(unsigned int numargs, struct fuse_arg *args)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(fuse_len_args);</div><div class='ctx'> </div><div class='del'>-u64 fuse_get_unique(struct fuse_iqueue *fiq)</div><div class='add'>+static u64 fuse_get_unique_locked(struct fuse_iqueue *fiq)</div><div class='ctx'> {</div><div class='ctx'> 	fiq-&gt;reqctr += FUSE_REQ_ID_STEP;</div><div class='ctx'> 	return fiq-&gt;reqctr;</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+u64 fuse_get_unique(struct fuse_iqueue *fiq)</div><div class='add'>+{</div><div class='add'>+	u64 ret;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fiq-&gt;lock);</div><div class='add'>+	ret = fuse_get_unique_locked(fiq);</div><div class='add'>+	spin_unlock(&amp;fiq-&gt;lock);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='ctx'> EXPORT_SYMBOL_GPL(fuse_get_unique);</div><div class='ctx'> </div><div class='del'>-static unsigned int fuse_req_hash(u64 unique)</div><div class='add'>+unsigned int fuse_req_hash(u64 unique)</div><div class='ctx'> {</div><div class='ctx'> 	return hash_long(unique &amp; ~FUSE_INT_REQ_BIT, FUSE_PQ_HASH_BITS);</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL_GPL(fuse_req_hash);</div><div class='ctx'> </div><div class='del'>-/**</div><div class='add'>+/*</div><div class='ctx'>  * A new request is available, wake fiq-&gt;waitq</div><div class='ctx'>  */</div><div class='ctx'> static void fuse_dev_wake_and_unlock(struct fuse_iqueue *fiq)</div><div class='hunk'>@@ -215,22 +335,90 @@ __releases(fiq-&gt;lock)</div><div class='ctx'> 	spin_unlock(&amp;fiq-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void fuse_dev_queue_forget(struct fuse_iqueue *fiq,</div><div class='add'>+			   struct fuse_forget_link *forget)</div><div class='add'>+{</div><div class='add'>+	spin_lock(&amp;fiq-&gt;lock);</div><div class='add'>+	if (fiq-&gt;connected) {</div><div class='add'>+		fiq-&gt;forget_list_tail-&gt;next = forget;</div><div class='add'>+		fiq-&gt;forget_list_tail = forget;</div><div class='add'>+		fuse_dev_wake_and_unlock(fiq);</div><div class='add'>+	} else {</div><div class='add'>+		kfree(forget);</div><div class='add'>+		spin_unlock(&amp;fiq-&gt;lock);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void fuse_dev_queue_interrupt(struct fuse_iqueue *fiq, struct fuse_req *req)</div><div class='add'>+{</div><div class='add'>+	spin_lock(&amp;fiq-&gt;lock);</div><div class='add'>+	if (list_empty(&amp;req-&gt;intr_entry)) {</div><div class='add'>+		list_add_tail(&amp;req-&gt;intr_entry, &amp;fiq-&gt;interrupts);</div><div class='add'>+		/*</div><div class='add'>+		 * Pairs with smp_mb() implied by test_and_set_bit()</div><div class='add'>+		 * from fuse_request_end().</div><div class='add'>+		 */</div><div class='add'>+		smp_mb();</div><div class='add'>+		if (test_bit(FR_FINISHED, &amp;req-&gt;flags)) {</div><div class='add'>+			list_del_init(&amp;req-&gt;intr_entry);</div><div class='add'>+			spin_unlock(&amp;fiq-&gt;lock);</div><div class='add'>+		} else  {</div><div class='add'>+			fuse_dev_wake_and_unlock(fiq);</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		spin_unlock(&amp;fiq-&gt;lock);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void fuse_request_assign_unique_locked(struct fuse_iqueue *fiq,</div><div class='add'>+						     struct fuse_req *req)</div><div class='add'>+{</div><div class='add'>+	if (req-&gt;in.h.opcode != FUSE_NOTIFY_REPLY)</div><div class='add'>+		req-&gt;in.h.unique = fuse_get_unique_locked(fiq);</div><div class='add'>+</div><div class='add'>+	/* tracepoint captures in.h.unique and in.h.len */</div><div class='add'>+	trace_fuse_request_send(req);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+inline void fuse_request_assign_unique(struct fuse_iqueue *fiq,</div><div class='add'>+				       struct fuse_req *req)</div><div class='add'>+{</div><div class='add'>+	if (req-&gt;in.h.opcode != FUSE_NOTIFY_REPLY)</div><div class='add'>+		req-&gt;in.h.unique = fuse_get_unique(fiq);</div><div class='add'>+</div><div class='add'>+	/* tracepoint captures in.h.unique and in.h.len */</div><div class='add'>+	trace_fuse_request_send(req);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(fuse_request_assign_unique);</div><div class='add'>+</div><div class='add'>+static void fuse_dev_queue_req(struct fuse_iqueue *fiq, struct fuse_req *req)</div><div class='add'>+{</div><div class='add'>+	spin_lock(&amp;fiq-&gt;lock);</div><div class='add'>+	if (fiq-&gt;connected) {</div><div class='add'>+		fuse_request_assign_unique_locked(fiq, req);</div><div class='add'>+		list_add_tail(&amp;req-&gt;list, &amp;fiq-&gt;pending);</div><div class='add'>+		fuse_dev_wake_and_unlock(fiq);</div><div class='add'>+	} else {</div><div class='add'>+		spin_unlock(&amp;fiq-&gt;lock);</div><div class='add'>+		req-&gt;out.h.error = -ENOTCONN;</div><div class='add'>+		clear_bit(FR_PENDING, &amp;req-&gt;flags);</div><div class='add'>+		fuse_request_end(req);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> const struct fuse_iqueue_ops fuse_dev_fiq_ops = {</div><div class='del'>-	.wake_forget_and_unlock		= fuse_dev_wake_and_unlock,</div><div class='del'>-	.wake_interrupt_and_unlock	= fuse_dev_wake_and_unlock,</div><div class='del'>-	.wake_pending_and_unlock	= fuse_dev_wake_and_unlock,</div><div class='add'>+	.send_forget	= fuse_dev_queue_forget,</div><div class='add'>+	.send_interrupt	= fuse_dev_queue_interrupt,</div><div class='add'>+	.send_req	= fuse_dev_queue_req,</div><div class='ctx'> };</div><div class='ctx'> EXPORT_SYMBOL_GPL(fuse_dev_fiq_ops);</div><div class='ctx'> </div><div class='del'>-static void queue_request_and_unlock(struct fuse_iqueue *fiq,</div><div class='del'>-				     struct fuse_req *req)</div><div class='del'>-__releases(fiq-&gt;lock)</div><div class='add'>+static void fuse_send_one(struct fuse_iqueue *fiq, struct fuse_req *req)</div><div class='ctx'> {</div><div class='ctx'> 	req-&gt;in.h.len = sizeof(struct fuse_in_header) +</div><div class='ctx'> 		fuse_len_args(req-&gt;args-&gt;in_numargs,</div><div class='ctx'> 			      (struct fuse_arg *) req-&gt;args-&gt;in_args);</div><div class='del'>-	list_add_tail(&amp;req-&gt;list, &amp;fiq-&gt;pending);</div><div class='del'>-	fiq-&gt;ops-&gt;wake_pending_and_unlock(fiq);</div><div class='add'>+	fiq-&gt;ops-&gt;send_req(fiq, req);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void fuse_queue_forget(struct fuse_conn *fc, struct fuse_forget_link *forget,</div><div class='hunk'>@@ -241,15 +429,7 @@ void fuse_queue_forget(struct fuse_conn *fc, struct fuse_forget_link *forget,</div><div class='ctx'> 	forget-&gt;forget_one.nodeid = nodeid;</div><div class='ctx'> 	forget-&gt;forget_one.nlookup = nlookup;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;fiq-&gt;lock);</div><div class='del'>-	if (fiq-&gt;connected) {</div><div class='del'>-		fiq-&gt;forget_list_tail-&gt;next = forget;</div><div class='del'>-		fiq-&gt;forget_list_tail = forget;</div><div class='del'>-		fiq-&gt;ops-&gt;wake_forget_and_unlock(fiq);</div><div class='del'>-	} else {</div><div class='del'>-		kfree(forget);</div><div class='del'>-		spin_unlock(&amp;fiq-&gt;lock);</div><div class='del'>-	}</div><div class='add'>+	fiq-&gt;ops-&gt;send_forget(fiq, forget);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void flush_bg_queue(struct fuse_conn *fc)</div><div class='hunk'>@@ -263,9 +443,7 @@ static void flush_bg_queue(struct fuse_conn *fc)</div><div class='ctx'> 		req = list_first_entry(&amp;fc-&gt;bg_queue, struct fuse_req, list);</div><div class='ctx'> 		list_del(&amp;req-&gt;list);</div><div class='ctx'> 		fc-&gt;active_background++;</div><div class='del'>-		spin_lock(&amp;fiq-&gt;lock);</div><div class='del'>-		req-&gt;in.h.unique = fuse_get_unique(fiq);</div><div class='del'>-		queue_request_and_unlock(fiq, req);</div><div class='add'>+		fuse_send_one(fiq, req);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -286,6 +464,7 @@ void fuse_request_end(struct fuse_req *req)</div><div class='ctx'> 	if (test_and_set_bit(FR_FINISHED, &amp;req-&gt;flags))</div><div class='ctx'> 		goto put_request;</div><div class='ctx'> </div><div class='add'>+	trace_fuse_request_end(req);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * test_and_set_bit() implies smp_mb() between bit</div><div class='ctx'> 	 * changing and below FR_INTERRUPTED check. Pairs with</div><div class='hunk'>@@ -315,10 +494,6 @@ void fuse_request_end(struct fuse_req *req)</div><div class='ctx'> 				wake_up(&amp;fc-&gt;blocked_waitq);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (fc-&gt;num_background == fc-&gt;congestion_threshold &amp;&amp; fm-&gt;sb) {</div><div class='del'>-			clear_bdi_congested(fm-&gt;sb-&gt;s_bdi, BLK_RW_SYNC);</div><div class='del'>-			clear_bdi_congested(fm-&gt;sb-&gt;s_bdi, BLK_RW_ASYNC);</div><div class='del'>-		}</div><div class='ctx'> 		fc-&gt;num_background--;</div><div class='ctx'> 		fc-&gt;active_background--;</div><div class='ctx'> 		flush_bg_queue(fc);</div><div class='hunk'>@@ -339,30 +514,31 @@ static int queue_interrupt(struct fuse_req *req)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_iqueue *fiq = &amp;req-&gt;fm-&gt;fc-&gt;iq;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;fiq-&gt;lock);</div><div class='ctx'> 	/* Check for we've sent request to interrupt this req */</div><div class='del'>-	if (unlikely(!test_bit(FR_INTERRUPTED, &amp;req-&gt;flags))) {</div><div class='del'>-		spin_unlock(&amp;fiq-&gt;lock);</div><div class='add'>+	if (unlikely(!test_bit(FR_INTERRUPTED, &amp;req-&gt;flags)))</div><div class='ctx'> 		return -EINVAL;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	if (list_empty(&amp;req-&gt;intr_entry)) {</div><div class='del'>-		list_add_tail(&amp;req-&gt;intr_entry, &amp;fiq-&gt;interrupts);</div><div class='add'>+	fiq-&gt;ops-&gt;send_interrupt(fiq, req);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool fuse_remove_pending_req(struct fuse_req *req, spinlock_t *lock)</div><div class='add'>+{</div><div class='add'>+	spin_lock(lock);</div><div class='add'>+	if (test_bit(FR_PENDING, &amp;req-&gt;flags)) {</div><div class='ctx'> 		/*</div><div class='del'>-		 * Pairs with smp_mb() implied by test_and_set_bit()</div><div class='del'>-		 * from fuse_request_end().</div><div class='add'>+		 * FR_PENDING does not get cleared as the request will end</div><div class='add'>+		 * up in destruction anyway.</div><div class='ctx'> 		 */</div><div class='del'>-		smp_mb();</div><div class='del'>-		if (test_bit(FR_FINISHED, &amp;req-&gt;flags)) {</div><div class='del'>-			list_del_init(&amp;req-&gt;intr_entry);</div><div class='del'>-			spin_unlock(&amp;fiq-&gt;lock);</div><div class='del'>-			return 0;</div><div class='del'>-		}</div><div class='del'>-		fiq-&gt;ops-&gt;wake_interrupt_and_unlock(fiq);</div><div class='del'>-	} else {</div><div class='del'>-		spin_unlock(&amp;fiq-&gt;lock);</div><div class='add'>+		list_del(&amp;req-&gt;list);</div><div class='add'>+		spin_unlock(lock);</div><div class='add'>+		__fuse_put_request(req);</div><div class='add'>+		req-&gt;out.h.error = -EINTR;</div><div class='add'>+		return true;</div><div class='ctx'> 	}</div><div class='del'>-	return 0;</div><div class='add'>+	spin_unlock(lock);</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void request_wait_answer(struct fuse_req *req)</div><div class='hunk'>@@ -386,22 +562,20 @@ static void request_wait_answer(struct fuse_req *req)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!test_bit(FR_FORCE, &amp;req-&gt;flags)) {</div><div class='add'>+		bool removed;</div><div class='add'>+</div><div class='ctx'> 		/* Only fatal signals may interrupt this */</div><div class='ctx'> 		err = wait_event_killable(req-&gt;waitq,</div><div class='ctx'> 					test_bit(FR_FINISHED, &amp;req-&gt;flags));</div><div class='ctx'> 		if (!err)</div><div class='ctx'> 			return;</div><div class='ctx'> </div><div class='del'>-		spin_lock(&amp;fiq-&gt;lock);</div><div class='del'>-		/* Request is not yet in userspace, bail out */</div><div class='del'>-		if (test_bit(FR_PENDING, &amp;req-&gt;flags)) {</div><div class='del'>-			list_del(&amp;req-&gt;list);</div><div class='del'>-			spin_unlock(&amp;fiq-&gt;lock);</div><div class='del'>-			__fuse_put_request(req);</div><div class='del'>-			req-&gt;out.h.error = -EINTR;</div><div class='add'>+		if (test_bit(FR_URING, &amp;req-&gt;flags))</div><div class='add'>+			removed = fuse_uring_remove_pending_req(req);</div><div class='add'>+		else</div><div class='add'>+			removed = fuse_remove_pending_req(req, &amp;fiq-&gt;lock);</div><div class='add'>+		if (removed)</div><div class='ctx'> 			return;</div><div class='del'>-		}</div><div class='del'>-		spin_unlock(&amp;fiq-&gt;lock);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -416,21 +590,15 @@ static void __fuse_request_send(struct fuse_req *req)</div><div class='ctx'> 	struct fuse_iqueue *fiq = &amp;req-&gt;fm-&gt;fc-&gt;iq;</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(test_bit(FR_BACKGROUND, &amp;req-&gt;flags));</div><div class='del'>-	spin_lock(&amp;fiq-&gt;lock);</div><div class='del'>-	if (!fiq-&gt;connected) {</div><div class='del'>-		spin_unlock(&amp;fiq-&gt;lock);</div><div class='del'>-		req-&gt;out.h.error = -ENOTCONN;</div><div class='del'>-	} else {</div><div class='del'>-		req-&gt;in.h.unique = fuse_get_unique(fiq);</div><div class='del'>-		/* acquire extra reference, since request is still needed</div><div class='del'>-		   after fuse_request_end() */</div><div class='del'>-		__fuse_get_request(req);</div><div class='del'>-		queue_request_and_unlock(fiq, req);</div><div class='ctx'> </div><div class='del'>-		request_wait_answer(req);</div><div class='del'>-		/* Pairs with smp_wmb() in fuse_request_end() */</div><div class='del'>-		smp_rmb();</div><div class='del'>-	}</div><div class='add'>+	/* acquire extra reference, since request is still needed after</div><div class='add'>+	   fuse_request_end() */</div><div class='add'>+	__fuse_get_request(req);</div><div class='add'>+	fuse_send_one(fiq, req);</div><div class='add'>+</div><div class='add'>+	request_wait_answer(req);</div><div class='add'>+	/* Pairs with smp_wmb() in fuse_request_end() */</div><div class='add'>+	smp_rmb();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void fuse_adjust_compat(struct fuse_conn *fc, struct fuse_args *args)</div><div class='hunk'>@@ -470,8 +638,14 @@ static void fuse_force_creds(struct fuse_req *req)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_conn *fc = req-&gt;fm-&gt;fc;</div><div class='ctx'> </div><div class='del'>-	req-&gt;in.h.uid = from_kuid_munged(fc-&gt;user_ns, current_fsuid());</div><div class='del'>-	req-&gt;in.h.gid = from_kgid_munged(fc-&gt;user_ns, current_fsgid());</div><div class='add'>+	if (!req-&gt;fm-&gt;sb || req-&gt;fm-&gt;sb-&gt;s_iflags &amp; SB_I_NOIDMAP) {</div><div class='add'>+		req-&gt;in.h.uid = from_kuid_munged(fc-&gt;user_ns, current_fsuid());</div><div class='add'>+		req-&gt;in.h.gid = from_kgid_munged(fc-&gt;user_ns, current_fsgid());</div><div class='add'>+	} else {</div><div class='add'>+		req-&gt;in.h.uid = FUSE_INVALID_UIDGID;</div><div class='add'>+		req-&gt;in.h.gid = FUSE_INVALID_UIDGID;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	req-&gt;in.h.pid = pid_nr_ns(task_pid(current), fc-&gt;pid_ns);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -480,11 +654,15 @@ static void fuse_args_to_req(struct fuse_req *req, struct fuse_args *args)</div><div class='ctx'> 	req-&gt;in.h.opcode = args-&gt;opcode;</div><div class='ctx'> 	req-&gt;in.h.nodeid = args-&gt;nodeid;</div><div class='ctx'> 	req-&gt;args = args;</div><div class='add'>+	if (args-&gt;is_ext)</div><div class='add'>+		req-&gt;in.h.total_extlen = args-&gt;in_args[args-&gt;ext_idx].size / 8;</div><div class='ctx'> 	if (args-&gt;end)</div><div class='ctx'> 		__set_bit(FR_ASYNC, &amp;req-&gt;flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-ssize_t fuse_simple_request(struct fuse_mount *fm, struct fuse_args *args)</div><div class='add'>+ssize_t __fuse_simple_request(struct mnt_idmap *idmap,</div><div class='add'>+			      struct fuse_mount *fm,</div><div class='add'>+			      struct fuse_args *args)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_conn *fc = fm-&gt;fc;</div><div class='ctx'> 	struct fuse_req *req;</div><div class='hunk'>@@ -501,7 +679,7 @@ ssize_t fuse_simple_request(struct fuse_mount *fm, struct fuse_args *args)</div><div class='ctx'> 		__set_bit(FR_FORCE, &amp;req-&gt;flags);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		WARN_ON(args-&gt;nocreds);</div><div class='del'>-		req = fuse_get_req(fm, false);</div><div class='add'>+		req = fuse_get_req(idmap, fm, false);</div><div class='ctx'> 		if (IS_ERR(req))</div><div class='ctx'> 			return PTR_ERR(req);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -523,7 +701,25 @@ ssize_t fuse_simple_request(struct fuse_mount *fm, struct fuse_args *args)</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool fuse_request_queue_background(struct fuse_req *req)</div><div class='add'>+#ifdef CONFIG_FUSE_IO_URING</div><div class='add'>+static bool fuse_request_queue_background_uring(struct fuse_conn *fc,</div><div class='add'>+					       struct fuse_req *req)</div><div class='add'>+{</div><div class='add'>+	struct fuse_iqueue *fiq = &amp;fc-&gt;iq;</div><div class='add'>+</div><div class='add'>+	req-&gt;in.h.len = sizeof(struct fuse_in_header) +</div><div class='add'>+		fuse_len_args(req-&gt;args-&gt;in_numargs,</div><div class='add'>+			      (struct fuse_arg *) req-&gt;args-&gt;in_args);</div><div class='add'>+	fuse_request_assign_unique(fiq, req);</div><div class='add'>+</div><div class='add'>+	return fuse_uring_queue_bq_req(req);</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * @return true if queued</div><div class='add'>+ */</div><div class='add'>+static int fuse_request_queue_background(struct fuse_req *req)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_mount *fm = req-&gt;fm;</div><div class='ctx'> 	struct fuse_conn *fc = fm-&gt;fc;</div><div class='hunk'>@@ -535,15 +731,17 @@ static bool fuse_request_queue_background(struct fuse_req *req)</div><div class='ctx'> 		atomic_inc(&amp;fc-&gt;num_waiting);</div><div class='ctx'> 	}</div><div class='ctx'> 	__set_bit(FR_ISREPLY, &amp;req-&gt;flags);</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_FUSE_IO_URING</div><div class='add'>+	if (fuse_uring_ready(fc))</div><div class='add'>+		return fuse_request_queue_background_uring(fc, req);</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> 	spin_lock(&amp;fc-&gt;bg_lock);</div><div class='ctx'> 	if (likely(fc-&gt;connected)) {</div><div class='ctx'> 		fc-&gt;num_background++;</div><div class='ctx'> 		if (fc-&gt;num_background == fc-&gt;max_background)</div><div class='ctx'> 			fc-&gt;blocked = 1;</div><div class='del'>-		if (fc-&gt;num_background == fc-&gt;congestion_threshold &amp;&amp; fm-&gt;sb) {</div><div class='del'>-			set_bdi_congested(fm-&gt;sb-&gt;s_bdi, BLK_RW_SYNC);</div><div class='del'>-			set_bdi_congested(fm-&gt;sb-&gt;s_bdi, BLK_RW_ASYNC);</div><div class='del'>-		}</div><div class='ctx'> 		list_add_tail(&amp;req-&gt;list, &amp;fc-&gt;bg_queue);</div><div class='ctx'> 		flush_bg_queue(fc);</div><div class='ctx'> 		queued = true;</div><div class='hunk'>@@ -566,7 +764,7 @@ int fuse_simple_background(struct fuse_mount *fm, struct fuse_args *args,</div><div class='ctx'> 		__set_bit(FR_BACKGROUND, &amp;req-&gt;flags);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		WARN_ON(args-&gt;nocreds);</div><div class='del'>-		req = fuse_get_req(fm, true);</div><div class='add'>+		req = fuse_get_req(&amp;invalid_mnt_idmap, fm, true);</div><div class='ctx'> 		if (IS_ERR(req))</div><div class='ctx'> 			return PTR_ERR(req);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -587,9 +785,8 @@ static int fuse_simple_notify_reply(struct fuse_mount *fm,</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_req *req;</div><div class='ctx'> 	struct fuse_iqueue *fiq = &amp;fm-&gt;fc-&gt;iq;</div><div class='del'>-	int err = 0;</div><div class='ctx'> </div><div class='del'>-	req = fuse_get_req(fm, false);</div><div class='add'>+	req = fuse_get_req(&amp;invalid_mnt_idmap, fm, false);</div><div class='ctx'> 	if (IS_ERR(req))</div><div class='ctx'> 		return PTR_ERR(req);</div><div class='ctx'> </div><div class='hunk'>@@ -598,16 +795,9 @@ static int fuse_simple_notify_reply(struct fuse_mount *fm,</div><div class='ctx'> </div><div class='ctx'> 	fuse_args_to_req(req, args);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;fiq-&gt;lock);</div><div class='del'>-	if (fiq-&gt;connected) {</div><div class='del'>-		queue_request_and_unlock(fiq, req);</div><div class='del'>-	} else {</div><div class='del'>-		err = -ENODEV;</div><div class='del'>-		spin_unlock(&amp;fiq-&gt;lock);</div><div class='del'>-		fuse_put_request(req);</div><div class='del'>-	}</div><div class='add'>+	fuse_send_one(fiq, req);</div><div class='ctx'> </div><div class='del'>-	return err;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -647,22 +837,8 @@ static int unlock_request(struct fuse_req *req)</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct fuse_copy_state {</div><div class='del'>-	int write;</div><div class='del'>-	struct fuse_req *req;</div><div class='del'>-	struct iov_iter *iter;</div><div class='del'>-	struct pipe_buffer *pipebufs;</div><div class='del'>-	struct pipe_buffer *currbuf;</div><div class='del'>-	struct pipe_inode_info *pipe;</div><div class='del'>-	unsigned long nr_segs;</div><div class='del'>-	struct page *pg;</div><div class='del'>-	unsigned len;</div><div class='del'>-	unsigned offset;</div><div class='del'>-	unsigned move_pages:1;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static void fuse_copy_init(struct fuse_copy_state *cs, int write,</div><div class='del'>-			   struct iov_iter *iter)</div><div class='add'>+void fuse_copy_init(struct fuse_copy_state *cs, bool write,</div><div class='add'>+		    struct iov_iter *iter)</div><div class='ctx'> {</div><div class='ctx'> 	memset(cs, 0, sizeof(*cs));</div><div class='ctx'> 	cs-&gt;write = write;</div><div class='hunk'>@@ -670,7 +846,7 @@ static void fuse_copy_init(struct fuse_copy_state *cs, int write,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Unmap and put previous page of userspace buffer */</div><div class='del'>-static void fuse_copy_finish(struct fuse_copy_state *cs)</div><div class='add'>+void fuse_copy_finish(struct fuse_copy_state *cs)</div><div class='ctx'> {</div><div class='ctx'> 	if (cs-&gt;currbuf) {</div><div class='ctx'> 		struct pipe_buffer *buf = cs-&gt;currbuf;</div><div class='hunk'>@@ -738,14 +914,13 @@ static int fuse_copy_fill(struct fuse_copy_state *cs)</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='ctx'> 		size_t off;</div><div class='del'>-		err = iov_iter_get_pages(cs-&gt;iter, &amp;page, PAGE_SIZE, 1, &amp;off);</div><div class='add'>+		err = iov_iter_get_pages2(cs-&gt;iter, &amp;page, PAGE_SIZE, 1, &amp;off);</div><div class='ctx'> 		if (err &lt; 0)</div><div class='ctx'> 			return err;</div><div class='ctx'> 		BUG_ON(!err);</div><div class='ctx'> 		cs-&gt;len = err;</div><div class='ctx'> 		cs-&gt;offset = off;</div><div class='ctx'> 		cs-&gt;pg = page;</div><div class='del'>-		iov_iter_advance(cs-&gt;iter, err);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return lock_request(cs-&gt;req);</div><div class='hunk'>@@ -770,36 +945,45 @@ static int fuse_copy_do(struct fuse_copy_state *cs, void **val, unsigned *size)</div><div class='ctx'> 	*size -= ncpy;</div><div class='ctx'> 	cs-&gt;len -= ncpy;</div><div class='ctx'> 	cs-&gt;offset += ncpy;</div><div class='add'>+	if (cs-&gt;is_uring)</div><div class='add'>+		cs-&gt;ring.copied_sz += ncpy;</div><div class='add'>+</div><div class='ctx'> 	return ncpy;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fuse_check_page(struct page *page)</div><div class='add'>+static int fuse_check_folio(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	if (page_mapcount(page) ||</div><div class='del'>-	    page-&gt;mapping != NULL ||</div><div class='del'>-	    (page-&gt;flags &amp; PAGE_FLAGS_CHECK_AT_PREP &amp;</div><div class='add'>+	if (folio_mapped(folio) ||</div><div class='add'>+	    folio-&gt;mapping != NULL ||</div><div class='add'>+	    (folio-&gt;flags.f &amp; PAGE_FLAGS_CHECK_AT_PREP &amp;</div><div class='ctx'> 	     ~(1 &lt;&lt; PG_locked |</div><div class='ctx'> 	       1 &lt;&lt; PG_referenced |</div><div class='del'>-	       1 &lt;&lt; PG_uptodate |</div><div class='ctx'> 	       1 &lt;&lt; PG_lru |</div><div class='ctx'> 	       1 &lt;&lt; PG_active |</div><div class='ctx'> 	       1 &lt;&lt; PG_workingset |</div><div class='ctx'> 	       1 &lt;&lt; PG_reclaim |</div><div class='del'>-	       1 &lt;&lt; PG_waiters))) {</div><div class='del'>-		dump_page(page, "fuse: trying to steal weird page");</div><div class='add'>+	       1 &lt;&lt; PG_waiters |</div><div class='add'>+	       LRU_GEN_MASK | LRU_REFS_MASK))) {</div><div class='add'>+		dump_page(&amp;folio-&gt;page, "fuse: trying to steal weird page");</div><div class='ctx'> 		return 1;</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fuse_try_move_page(struct fuse_copy_state *cs, struct page **pagep)</div><div class='add'>+/*</div><div class='add'>+ * Attempt to steal a page from the splice() pipe and move it into the</div><div class='add'>+ * pagecache. If successful, the pointer in @pagep will be updated. The</div><div class='add'>+ * folio that was originally in @pagep will lose a reference and the new</div><div class='add'>+ * folio returned in @pagep will carry a reference.</div><div class='add'>+ */</div><div class='add'>+static int fuse_try_move_folio(struct fuse_copy_state *cs, struct folio **foliop)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='del'>-	struct page *oldpage = *pagep;</div><div class='del'>-	struct page *newpage;</div><div class='add'>+	struct folio *oldfolio = *foliop;</div><div class='add'>+	struct folio *newfolio;</div><div class='ctx'> 	struct pipe_buffer *buf = cs-&gt;pipebufs;</div><div class='ctx'> </div><div class='del'>-	get_page(oldpage);</div><div class='add'>+	folio_get(oldfolio);</div><div class='ctx'> 	err = unlock_request(cs-&gt;req);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out_put_old;</div><div class='hunk'>@@ -816,36 +1000,40 @@ static int fuse_try_move_page(struct fuse_copy_state *cs, struct page **pagep)</div><div class='ctx'> 	cs-&gt;pipebufs++;</div><div class='ctx'> 	cs-&gt;nr_segs--;</div><div class='ctx'> </div><div class='del'>-	if (cs-&gt;len != PAGE_SIZE)</div><div class='add'>+	if (cs-&gt;len != folio_size(oldfolio))</div><div class='ctx'> 		goto out_fallback;</div><div class='ctx'> </div><div class='ctx'> 	if (!pipe_buf_try_steal(cs-&gt;pipe, buf))</div><div class='ctx'> 		goto out_fallback;</div><div class='ctx'> </div><div class='del'>-	newpage = buf-&gt;page;</div><div class='add'>+	newfolio = page_folio(buf-&gt;page);</div><div class='ctx'> </div><div class='del'>-	if (!PageUptodate(newpage))</div><div class='del'>-		SetPageUptodate(newpage);</div><div class='add'>+	folio_clear_uptodate(newfolio);</div><div class='add'>+	folio_clear_mappedtodisk(newfolio);</div><div class='ctx'> </div><div class='del'>-	ClearPageMappedToDisk(newpage);</div><div class='del'>-</div><div class='del'>-	if (fuse_check_page(newpage) != 0)</div><div class='add'>+	if (fuse_check_folio(newfolio) != 0)</div><div class='ctx'> 		goto out_fallback_unlock;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * This is a new and locked page, it shouldn't be mapped or</div><div class='ctx'> 	 * have any special flags on it</div><div class='ctx'> 	 */</div><div class='del'>-	if (WARN_ON(page_mapped(oldpage)))</div><div class='add'>+	if (WARN_ON(folio_mapped(oldfolio)))</div><div class='ctx'> 		goto out_fallback_unlock;</div><div class='del'>-	if (WARN_ON(page_has_private(oldpage)))</div><div class='add'>+	if (WARN_ON(folio_has_private(oldfolio)))</div><div class='ctx'> 		goto out_fallback_unlock;</div><div class='del'>-	if (WARN_ON(PageDirty(oldpage) || PageWriteback(oldpage)))</div><div class='add'>+	if (WARN_ON(folio_test_dirty(oldfolio) ||</div><div class='add'>+				folio_test_writeback(oldfolio)))</div><div class='ctx'> 		goto out_fallback_unlock;</div><div class='del'>-	if (WARN_ON(PageMlocked(oldpage)))</div><div class='add'>+	if (WARN_ON(folio_test_mlocked(oldfolio)))</div><div class='ctx'> 		goto out_fallback_unlock;</div><div class='ctx'> </div><div class='del'>-	replace_page_cache_page(oldpage, newpage);</div><div class='add'>+	replace_page_cache_folio(oldfolio, newfolio);</div><div class='add'>+</div><div class='add'>+	folio_get(newfolio);</div><div class='add'>+</div><div class='add'>+	if (!(buf-&gt;flags &amp; PIPE_BUF_FLAG_LRU))</div><div class='add'>+		folio_add_lru(newfolio);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Release while we have extra ref on stolen page.  Otherwise</div><div class='hunk'>@@ -853,38 +1041,33 @@ static int fuse_try_move_page(struct fuse_copy_state *cs, struct page **pagep)</div><div class='ctx'> 	 */</div><div class='ctx'> 	pipe_buf_release(cs-&gt;pipe, buf);</div><div class='ctx'> </div><div class='del'>-	get_page(newpage);</div><div class='del'>-</div><div class='del'>-	if (!(buf-&gt;flags &amp; PIPE_BUF_FLAG_LRU))</div><div class='del'>-		lru_cache_add(newpage);</div><div class='del'>-</div><div class='ctx'> 	err = 0;</div><div class='ctx'> 	spin_lock(&amp;cs-&gt;req-&gt;waitq.lock);</div><div class='ctx'> 	if (test_bit(FR_ABORTED, &amp;cs-&gt;req-&gt;flags))</div><div class='ctx'> 		err = -ENOENT;</div><div class='ctx'> 	else</div><div class='del'>-		*pagep = newpage;</div><div class='add'>+		*foliop = newfolio;</div><div class='ctx'> 	spin_unlock(&amp;cs-&gt;req-&gt;waitq.lock);</div><div class='ctx'> </div><div class='ctx'> 	if (err) {</div><div class='del'>-		unlock_page(newpage);</div><div class='del'>-		put_page(newpage);</div><div class='add'>+		folio_unlock(newfolio);</div><div class='add'>+		folio_put(newfolio);</div><div class='ctx'> 		goto out_put_old;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	unlock_page(oldpage);</div><div class='add'>+	folio_unlock(oldfolio);</div><div class='ctx'> 	/* Drop ref for ap-&gt;pages[] array */</div><div class='del'>-	put_page(oldpage);</div><div class='add'>+	folio_put(oldfolio);</div><div class='ctx'> 	cs-&gt;len = 0;</div><div class='ctx'> </div><div class='ctx'> 	err = 0;</div><div class='ctx'> out_put_old:</div><div class='ctx'> 	/* Drop ref obtained in this function */</div><div class='del'>-	put_page(oldpage);</div><div class='add'>+	folio_put(oldfolio);</div><div class='ctx'> 	return err;</div><div class='ctx'> </div><div class='ctx'> out_fallback_unlock:</div><div class='del'>-	unlock_page(newpage);</div><div class='add'>+	folio_unlock(newfolio);</div><div class='ctx'> out_fallback:</div><div class='ctx'> 	cs-&gt;pg = buf-&gt;page;</div><div class='ctx'> 	cs-&gt;offset = buf-&gt;offset;</div><div class='hunk'>@@ -896,8 +1079,8 @@ out_fallback:</div><div class='ctx'> 	goto out_put_old;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fuse_ref_page(struct fuse_copy_state *cs, struct page *page,</div><div class='del'>-			 unsigned offset, unsigned count)</div><div class='add'>+static int fuse_ref_folio(struct fuse_copy_state *cs, struct folio *folio,</div><div class='add'>+			  unsigned offset, unsigned count)</div><div class='ctx'> {</div><div class='ctx'> 	struct pipe_buffer *buf;</div><div class='ctx'> 	int err;</div><div class='hunk'>@@ -905,17 +1088,17 @@ static int fuse_ref_page(struct fuse_copy_state *cs, struct page *page,</div><div class='ctx'> 	if (cs-&gt;nr_segs &gt;= cs-&gt;pipe-&gt;max_usage)</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> </div><div class='del'>-	get_page(page);</div><div class='add'>+	folio_get(folio);</div><div class='ctx'> 	err = unlock_request(cs-&gt;req);</div><div class='ctx'> 	if (err) {</div><div class='del'>-		put_page(page);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 		return err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	fuse_copy_finish(cs);</div><div class='ctx'> </div><div class='ctx'> 	buf = cs-&gt;pipebufs;</div><div class='del'>-	buf-&gt;page = page;</div><div class='add'>+	buf-&gt;page = &amp;folio-&gt;page;</div><div class='ctx'> 	buf-&gt;offset = offset;</div><div class='ctx'> 	buf-&gt;len = count;</div><div class='ctx'> </div><div class='hunk'>@@ -927,25 +1110,39 @@ static int fuse_ref_page(struct fuse_copy_state *cs, struct page *page,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Copy a page in the request to/from the userspace buffer.  Must be</div><div class='add'>+ * Copy a folio in the request to/from the userspace buffer.  Must be</div><div class='ctx'>  * done atomically</div><div class='ctx'>  */</div><div class='del'>-static int fuse_copy_page(struct fuse_copy_state *cs, struct page **pagep,</div><div class='del'>-			  unsigned offset, unsigned count, int zeroing)</div><div class='add'>+static int fuse_copy_folio(struct fuse_copy_state *cs, struct folio **foliop,</div><div class='add'>+			   unsigned offset, unsigned count, int zeroing)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='del'>-	struct page *page = *pagep;</div><div class='add'>+	struct folio *folio = *foliop;</div><div class='add'>+	size_t size;</div><div class='ctx'> </div><div class='del'>-	if (page &amp;&amp; zeroing &amp;&amp; count &lt; PAGE_SIZE)</div><div class='del'>-		clear_highpage(page);</div><div class='add'>+	if (folio) {</div><div class='add'>+		size = folio_size(folio);</div><div class='add'>+		if (zeroing &amp;&amp; count &lt; size)</div><div class='add'>+			folio_zero_range(folio, 0, size);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	while (count) {</div><div class='del'>-		if (cs-&gt;write &amp;&amp; cs-&gt;pipebufs &amp;&amp; page) {</div><div class='del'>-			return fuse_ref_page(cs, page, offset, count);</div><div class='add'>+		if (cs-&gt;write &amp;&amp; cs-&gt;pipebufs &amp;&amp; folio) {</div><div class='add'>+			/*</div><div class='add'>+			 * Can't control lifetime of pipe buffers, so always</div><div class='add'>+			 * copy user pages.</div><div class='add'>+			 */</div><div class='add'>+			if (cs-&gt;req-&gt;args-&gt;user_pages) {</div><div class='add'>+				err = fuse_copy_fill(cs);</div><div class='add'>+				if (err)</div><div class='add'>+					return err;</div><div class='add'>+			} else {</div><div class='add'>+				return fuse_ref_folio(cs, folio, offset, count);</div><div class='add'>+			}</div><div class='ctx'> 		} else if (!cs-&gt;len) {</div><div class='del'>-			if (cs-&gt;move_pages &amp;&amp; page &amp;&amp;</div><div class='del'>-			    offset == 0 &amp;&amp; count == PAGE_SIZE) {</div><div class='del'>-				err = fuse_try_move_page(cs, pagep);</div><div class='add'>+			if (cs-&gt;move_folios &amp;&amp; folio &amp;&amp;</div><div class='add'>+			    offset == 0 &amp;&amp; count == size) {</div><div class='add'>+				err = fuse_try_move_folio(cs, foliop);</div><div class='ctx'> 				if (err &lt;= 0)</div><div class='ctx'> 					return err;</div><div class='ctx'> 			} else {</div><div class='hunk'>@@ -954,34 +1151,41 @@ static int fuse_copy_page(struct fuse_copy_state *cs, struct page **pagep,</div><div class='ctx'> 					return err;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		if (page) {</div><div class='del'>-			void *mapaddr = kmap_local_page(page);</div><div class='del'>-			void *buf = mapaddr + offset;</div><div class='del'>-			offset += fuse_copy_do(cs, &amp;buf, &amp;count);</div><div class='add'>+		if (folio) {</div><div class='add'>+			void *mapaddr = kmap_local_folio(folio, offset);</div><div class='add'>+			void *buf = mapaddr;</div><div class='add'>+			unsigned int copy = count;</div><div class='add'>+			unsigned int bytes_copied;</div><div class='add'>+</div><div class='add'>+			if (folio_test_highmem(folio) &amp;&amp; count &gt; PAGE_SIZE - offset_in_page(offset))</div><div class='add'>+				copy = PAGE_SIZE - offset_in_page(offset);</div><div class='add'>+</div><div class='add'>+			bytes_copied = fuse_copy_do(cs, &amp;buf, &amp;copy);</div><div class='ctx'> 			kunmap_local(mapaddr);</div><div class='add'>+			offset += bytes_copied;</div><div class='add'>+			count -= bytes_copied;</div><div class='ctx'> 		} else</div><div class='ctx'> 			offset += fuse_copy_do(cs, NULL, &amp;count);</div><div class='ctx'> 	}</div><div class='del'>-	if (page &amp;&amp; !cs-&gt;write)</div><div class='del'>-		flush_dcache_page(page);</div><div class='add'>+	if (folio &amp;&amp; !cs-&gt;write)</div><div class='add'>+		flush_dcache_folio(folio);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Copy pages in the request to/from userspace buffer */</div><div class='del'>-static int fuse_copy_pages(struct fuse_copy_state *cs, unsigned nbytes,</div><div class='del'>-			   int zeroing)</div><div class='add'>+/* Copy folios in the request to/from userspace buffer */</div><div class='add'>+static int fuse_copy_folios(struct fuse_copy_state *cs, unsigned nbytes,</div><div class='add'>+			    int zeroing)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned i;</div><div class='ctx'> 	struct fuse_req *req = cs-&gt;req;</div><div class='ctx'> 	struct fuse_args_pages *ap = container_of(req-&gt;args, typeof(*ap), args);</div><div class='ctx'> </div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; ap-&gt;num_pages &amp;&amp; (nbytes || zeroing); i++) {</div><div class='add'>+	for (i = 0; i &lt; ap-&gt;num_folios &amp;&amp; (nbytes || zeroing); i++) {</div><div class='ctx'> 		int err;</div><div class='ctx'> 		unsigned int offset = ap-&gt;descs[i].offset;</div><div class='ctx'> 		unsigned int count = min(nbytes, ap-&gt;descs[i].length);</div><div class='ctx'> </div><div class='del'>-		err = fuse_copy_page(cs, &amp;ap-&gt;pages[i], offset, count, zeroing);</div><div class='add'>+		err = fuse_copy_folio(cs, &amp;ap-&gt;folios[i], offset, count, zeroing);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			return err;</div><div class='ctx'> </div><div class='hunk'>@@ -1005,9 +1209,9 @@ static int fuse_copy_one(struct fuse_copy_state *cs, void *val, unsigned size)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Copy request arguments to/from userspace buffer */</div><div class='del'>-static int fuse_copy_args(struct fuse_copy_state *cs, unsigned numargs,</div><div class='del'>-			  unsigned argpages, struct fuse_arg *args,</div><div class='del'>-			  int zeroing)</div><div class='add'>+int fuse_copy_args(struct fuse_copy_state *cs, unsigned numargs,</div><div class='add'>+		   unsigned argpages, struct fuse_arg *args,</div><div class='add'>+		   int zeroing)</div><div class='ctx'> {</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> 	unsigned i;</div><div class='hunk'>@@ -1015,7 +1219,7 @@ static int fuse_copy_args(struct fuse_copy_state *cs, unsigned numargs,</div><div class='ctx'> 	for (i = 0; !err &amp;&amp; i &lt; numargs; i++)  {</div><div class='ctx'> 		struct fuse_arg *arg = &amp;args[i];</div><div class='ctx'> 		if (i == numargs - 1 &amp;&amp; argpages)</div><div class='del'>-			err = fuse_copy_pages(cs, arg-&gt;size, zeroing);</div><div class='add'>+			err = fuse_copy_folios(cs, arg-&gt;size, zeroing);</div><div class='ctx'> 		else</div><div class='ctx'> 			err = fuse_copy_one(cs, arg-&gt;value, arg-&gt;size);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1071,9 +1275,9 @@ __releases(fiq-&gt;lock)</div><div class='ctx'> 	return err ? err : reqsize;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct fuse_forget_link *fuse_dequeue_forget(struct fuse_iqueue *fiq,</div><div class='del'>-					     unsigned int max,</div><div class='del'>-					     unsigned int *countp)</div><div class='add'>+static struct fuse_forget_link *fuse_dequeue_forget(struct fuse_iqueue *fiq,</div><div class='add'>+						    unsigned int max,</div><div class='add'>+						    unsigned int *countp)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_forget_link *head = fiq-&gt;forget_list_head.next;</div><div class='ctx'> 	struct fuse_forget_link **newhead = &amp;head;</div><div class='hunk'>@@ -1092,7 +1296,6 @@ struct fuse_forget_link *fuse_dequeue_forget(struct fuse_iqueue *fiq,</div><div class='ctx'> </div><div class='ctx'> 	return head;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(fuse_dequeue_forget);</div><div class='ctx'> </div><div class='ctx'> static int fuse_read_single_forget(struct fuse_iqueue *fiq,</div><div class='ctx'> 				   struct fuse_copy_state *cs,</div><div class='hunk'>@@ -1107,7 +1310,7 @@ __releases(fiq-&gt;lock)</div><div class='ctx'> 	struct fuse_in_header ih = {</div><div class='ctx'> 		.opcode = FUSE_FORGET,</div><div class='ctx'> 		.nodeid = forget-&gt;forget_one.nodeid,</div><div class='del'>-		.unique = fuse_get_unique(fiq),</div><div class='add'>+		.unique = fuse_get_unique_locked(fiq),</div><div class='ctx'> 		.len = sizeof(ih) + sizeof(arg),</div><div class='ctx'> 	};</div><div class='ctx'> </div><div class='hunk'>@@ -1138,7 +1341,7 @@ __releases(fiq-&gt;lock)</div><div class='ctx'> 	struct fuse_batch_forget_in arg = { .count = 0 };</div><div class='ctx'> 	struct fuse_in_header ih = {</div><div class='ctx'> 		.opcode = FUSE_BATCH_FORGET,</div><div class='del'>-		.unique = fuse_get_unique(fiq),</div><div class='add'>+		.unique = fuse_get_unique_locked(fiq),</div><div class='ctx'> 		.len = sizeof(ih) + sizeof(arg),</div><div class='ctx'> 	};</div><div class='ctx'> </div><div class='hunk'>@@ -1345,19 +1548,39 @@ static int fuse_dev_open(struct inode *inode, struct file *file)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+struct fuse_dev *fuse_get_dev(struct file *file)</div><div class='add'>+{</div><div class='add'>+	struct fuse_dev *fud = __fuse_get_dev(file);</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	if (likely(fud))</div><div class='add'>+		return fud;</div><div class='add'>+</div><div class='add'>+	err = wait_event_interruptible(fuse_dev_waitq,</div><div class='add'>+				       READ_ONCE(file-&gt;private_data) != FUSE_DEV_SYNC_INIT);</div><div class='add'>+	if (err)</div><div class='add'>+		return ERR_PTR(err);</div><div class='add'>+</div><div class='add'>+	fud = __fuse_get_dev(file);</div><div class='add'>+	if (!fud)</div><div class='add'>+		return ERR_PTR(-EPERM);</div><div class='add'>+</div><div class='add'>+	return fud;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static ssize_t fuse_dev_read(struct kiocb *iocb, struct iov_iter *to)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_copy_state cs;</div><div class='ctx'> 	struct file *file = iocb-&gt;ki_filp;</div><div class='ctx'> 	struct fuse_dev *fud = fuse_get_dev(file);</div><div class='ctx'> </div><div class='del'>-	if (!fud)</div><div class='del'>-		return -EPERM;</div><div class='add'>+	if (IS_ERR(fud))</div><div class='add'>+		return PTR_ERR(fud);</div><div class='ctx'> </div><div class='del'>-	if (!iter_is_iovec(to))</div><div class='add'>+	if (!user_backed_iter(to))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	fuse_copy_init(&amp;cs, 1, to);</div><div class='add'>+	fuse_copy_init(&amp;cs, true, to);</div><div class='ctx'> </div><div class='ctx'> 	return fuse_dev_do_read(fud, file, &amp;cs, iov_iter_count(to));</div><div class='ctx'> }</div><div class='hunk'>@@ -1372,22 +1595,22 @@ static ssize_t fuse_dev_splice_read(struct file *in, loff_t *ppos,</div><div class='ctx'> 	struct fuse_copy_state cs;</div><div class='ctx'> 	struct fuse_dev *fud = fuse_get_dev(in);</div><div class='ctx'> </div><div class='del'>-	if (!fud)</div><div class='del'>-		return -EPERM;</div><div class='add'>+	if (IS_ERR(fud))</div><div class='add'>+		return PTR_ERR(fud);</div><div class='ctx'> </div><div class='ctx'> 	bufs = kvmalloc_array(pipe-&gt;max_usage, sizeof(struct pipe_buffer),</div><div class='ctx'> 			      GFP_KERNEL);</div><div class='ctx'> 	if (!bufs)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	fuse_copy_init(&amp;cs, 1, NULL);</div><div class='add'>+	fuse_copy_init(&amp;cs, true, NULL);</div><div class='ctx'> 	cs.pipebufs = bufs;</div><div class='ctx'> 	cs.pipe = pipe;</div><div class='ctx'> 	ret = fuse_dev_do_read(fud, in, &amp;cs, len);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	if (pipe_occupancy(pipe-&gt;head, pipe-&gt;tail) + cs.nr_segs &gt; pipe-&gt;max_usage) {</div><div class='add'>+	if (pipe_buf_usage(pipe) + cs.nr_segs &gt; pipe-&gt;max_usage) {</div><div class='ctx'> 		ret = -EIO;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1417,35 +1640,31 @@ static int fuse_notify_poll(struct fuse_conn *fc, unsigned int size,</div><div class='ctx'> 			    struct fuse_copy_state *cs)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_notify_poll_wakeup_out outarg;</div><div class='del'>-	int err = -EINVAL;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (size != sizeof(outarg))</div><div class='del'>-		goto err;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	err = fuse_copy_one(cs, &amp;outarg, sizeof(outarg));</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto err;</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='ctx'> 	fuse_copy_finish(cs);</div><div class='ctx'> 	return fuse_notify_poll_wakeup(fc, &amp;outarg);</div><div class='del'>-</div><div class='del'>-err:</div><div class='del'>-	fuse_copy_finish(cs);</div><div class='del'>-	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int fuse_notify_inval_inode(struct fuse_conn *fc, unsigned int size,</div><div class='ctx'> 				   struct fuse_copy_state *cs)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_notify_inval_inode_out outarg;</div><div class='del'>-	int err = -EINVAL;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (size != sizeof(outarg))</div><div class='del'>-		goto err;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	err = fuse_copy_one(cs, &amp;outarg, sizeof(outarg));</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto err;</div><div class='add'>+		return err;</div><div class='ctx'> 	fuse_copy_finish(cs);</div><div class='ctx'> </div><div class='ctx'> 	down_read(&amp;fc-&gt;killsb);</div><div class='hunk'>@@ -1453,39 +1672,33 @@ static int fuse_notify_inval_inode(struct fuse_conn *fc, unsigned int size,</div><div class='ctx'> 				       outarg.off, outarg.len);</div><div class='ctx'> 	up_read(&amp;fc-&gt;killsb);</div><div class='ctx'> 	return err;</div><div class='del'>-</div><div class='del'>-err:</div><div class='del'>-	fuse_copy_finish(cs);</div><div class='del'>-	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int fuse_notify_inval_entry(struct fuse_conn *fc, unsigned int size,</div><div class='ctx'> 				   struct fuse_copy_state *cs)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_notify_inval_entry_out outarg;</div><div class='del'>-	int err = -ENOMEM;</div><div class='add'>+	int err;</div><div class='ctx'> 	char *buf;</div><div class='ctx'> 	struct qstr name;</div><div class='ctx'> </div><div class='del'>-	buf = kzalloc(FUSE_NAME_MAX + 1, GFP_KERNEL);</div><div class='del'>-	if (!buf)</div><div class='del'>-		goto err;</div><div class='del'>-</div><div class='del'>-	err = -EINVAL;</div><div class='ctx'> 	if (size &lt; sizeof(outarg))</div><div class='del'>-		goto err;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	err = fuse_copy_one(cs, &amp;outarg, sizeof(outarg));</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto err;</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='del'>-	err = -ENAMETOOLONG;</div><div class='del'>-	if (outarg.namelen &gt; FUSE_NAME_MAX)</div><div class='del'>-		goto err;</div><div class='add'>+	if (outarg.namelen &gt; fc-&gt;name_max)</div><div class='add'>+		return -ENAMETOOLONG;</div><div class='ctx'> </div><div class='ctx'> 	err = -EINVAL;</div><div class='ctx'> 	if (size != sizeof(outarg) + outarg.namelen + 1)</div><div class='del'>-		goto err;</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	buf = kzalloc(outarg.namelen + 1, GFP_KERNEL);</div><div class='add'>+	if (!buf)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	name.name = buf;</div><div class='ctx'> 	name.len = outarg.namelen;</div><div class='hunk'>@@ -1496,14 +1709,10 @@ static int fuse_notify_inval_entry(struct fuse_conn *fc, unsigned int size,</div><div class='ctx'> 	buf[outarg.namelen] = 0;</div><div class='ctx'> </div><div class='ctx'> 	down_read(&amp;fc-&gt;killsb);</div><div class='del'>-	err = fuse_reverse_inval_entry(fc, outarg.parent, 0, &amp;name);</div><div class='add'>+	err = fuse_reverse_inval_entry(fc, outarg.parent, 0, &amp;name, outarg.flags);</div><div class='ctx'> 	up_read(&amp;fc-&gt;killsb);</div><div class='del'>-	kfree(buf);</div><div class='del'>-	return err;</div><div class='del'>-</div><div class='ctx'> err:</div><div class='ctx'> 	kfree(buf);</div><div class='del'>-	fuse_copy_finish(cs);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1511,29 +1720,26 @@ static int fuse_notify_delete(struct fuse_conn *fc, unsigned int size,</div><div class='ctx'> 			      struct fuse_copy_state *cs)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_notify_delete_out outarg;</div><div class='del'>-	int err = -ENOMEM;</div><div class='add'>+	int err;</div><div class='ctx'> 	char *buf;</div><div class='ctx'> 	struct qstr name;</div><div class='ctx'> </div><div class='del'>-	buf = kzalloc(FUSE_NAME_MAX + 1, GFP_KERNEL);</div><div class='del'>-	if (!buf)</div><div class='del'>-		goto err;</div><div class='del'>-</div><div class='del'>-	err = -EINVAL;</div><div class='ctx'> 	if (size &lt; sizeof(outarg))</div><div class='del'>-		goto err;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	err = fuse_copy_one(cs, &amp;outarg, sizeof(outarg));</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto err;</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='del'>-	err = -ENAMETOOLONG;</div><div class='del'>-	if (outarg.namelen &gt; FUSE_NAME_MAX)</div><div class='del'>-		goto err;</div><div class='add'>+	if (outarg.namelen &gt; fc-&gt;name_max)</div><div class='add'>+		return -ENAMETOOLONG;</div><div class='ctx'> </div><div class='del'>-	err = -EINVAL;</div><div class='ctx'> 	if (size != sizeof(outarg) + outarg.namelen + 1)</div><div class='del'>-		goto err;</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	buf = kzalloc(outarg.namelen + 1, GFP_KERNEL);</div><div class='add'>+	if (!buf)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	name.name = buf;</div><div class='ctx'> 	name.len = outarg.namelen;</div><div class='hunk'>@@ -1544,14 +1750,10 @@ static int fuse_notify_delete(struct fuse_conn *fc, unsigned int size,</div><div class='ctx'> 	buf[outarg.namelen] = 0;</div><div class='ctx'> </div><div class='ctx'> 	down_read(&amp;fc-&gt;killsb);</div><div class='del'>-	err = fuse_reverse_inval_entry(fc, outarg.parent, outarg.child, &amp;name);</div><div class='add'>+	err = fuse_reverse_inval_entry(fc, outarg.parent, outarg.child, &amp;name, 0);</div><div class='ctx'> 	up_read(&amp;fc-&gt;killsb);</div><div class='del'>-	kfree(buf);</div><div class='del'>-	return err;</div><div class='del'>-</div><div class='ctx'> err:</div><div class='ctx'> 	kfree(buf);</div><div class='del'>-	fuse_copy_finish(cs);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1569,17 +1771,15 @@ static int fuse_notify_store(struct fuse_conn *fc, unsigned int size,</div><div class='ctx'> 	loff_t file_size;</div><div class='ctx'> 	loff_t end;</div><div class='ctx'> </div><div class='del'>-	err = -EINVAL;</div><div class='ctx'> 	if (size &lt; sizeof(outarg))</div><div class='del'>-		goto out_finish;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	err = fuse_copy_one(cs, &amp;outarg, sizeof(outarg));</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto out_finish;</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='del'>-	err = -EINVAL;</div><div class='ctx'> 	if (size - sizeof(outarg) != outarg.size)</div><div class='del'>-		goto out_finish;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	nodeid = outarg.nodeid;</div><div class='ctx'> </div><div class='hunk'>@@ -1602,29 +1802,35 @@ static int fuse_notify_store(struct fuse_conn *fc, unsigned int size,</div><div class='ctx'> </div><div class='ctx'> 	num = outarg.size;</div><div class='ctx'> 	while (num) {</div><div class='del'>-		struct page *page;</div><div class='del'>-		unsigned int this_num;</div><div class='del'>-</div><div class='del'>-		err = -ENOMEM;</div><div class='del'>-		page = find_or_create_page(mapping, index,</div><div class='del'>-					   mapping_gfp_mask(mapping));</div><div class='del'>-		if (!page)</div><div class='add'>+		struct folio *folio;</div><div class='add'>+		unsigned int folio_offset;</div><div class='add'>+		unsigned int nr_bytes;</div><div class='add'>+		unsigned int nr_pages;</div><div class='add'>+</div><div class='add'>+		folio = filemap_grab_folio(mapping, index);</div><div class='add'>+		err = PTR_ERR(folio);</div><div class='add'>+		if (IS_ERR(folio))</div><div class='ctx'> 			goto out_iput;</div><div class='ctx'> </div><div class='del'>-		this_num = min_t(unsigned, num, PAGE_SIZE - offset);</div><div class='del'>-		err = fuse_copy_page(cs, &amp;page, offset, this_num, 0);</div><div class='del'>-		if (!err &amp;&amp; offset == 0 &amp;&amp;</div><div class='del'>-		    (this_num == PAGE_SIZE || file_size == end))</div><div class='del'>-			SetPageUptodate(page);</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		put_page(page);</div><div class='add'>+		folio_offset = ((index - folio-&gt;index) &lt;&lt; PAGE_SHIFT) + offset;</div><div class='add'>+		nr_bytes = min_t(unsigned, num, folio_size(folio) - folio_offset);</div><div class='add'>+		nr_pages = (offset + nr_bytes + PAGE_SIZE - 1) &gt;&gt; PAGE_SHIFT;</div><div class='add'>+</div><div class='add'>+		err = fuse_copy_folio(cs, &amp;folio, folio_offset, nr_bytes, 0);</div><div class='add'>+		if (!folio_test_uptodate(folio) &amp;&amp; !err &amp;&amp; offset == 0 &amp;&amp;</div><div class='add'>+		    (nr_bytes == folio_size(folio) || file_size == end)) {</div><div class='add'>+			folio_zero_segment(folio, nr_bytes, folio_size(folio));</div><div class='add'>+			folio_mark_uptodate(folio);</div><div class='add'>+		}</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> </div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto out_iput;</div><div class='ctx'> </div><div class='del'>-		num -= this_num;</div><div class='add'>+		num -= nr_bytes;</div><div class='ctx'> 		offset = 0;</div><div class='del'>-		index++;</div><div class='add'>+		index += nr_pages;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	err = 0;</div><div class='hunk'>@@ -1633,8 +1839,6 @@ out_iput:</div><div class='ctx'> 	iput(inode);</div><div class='ctx'> out_up_killsb:</div><div class='ctx'> 	up_read(&amp;fc-&gt;killsb);</div><div class='del'>-out_finish:</div><div class='del'>-	fuse_copy_finish(cs);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1649,7 +1853,7 @@ static void fuse_retrieve_end(struct fuse_mount *fm, struct fuse_args *args,</div><div class='ctx'> 	struct fuse_retrieve_args *ra =</div><div class='ctx'> 		container_of(args, typeof(*ra), ap.args);</div><div class='ctx'> </div><div class='del'>-	release_pages(ra-&gt;ap.pages, ra-&gt;ap.num_pages);</div><div class='add'>+	release_pages(ra-&gt;ap.folios, ra-&gt;ap.num_folios);</div><div class='ctx'> 	kfree(ra);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1681,50 +1885,57 @@ static int fuse_retrieve(struct fuse_mount *fm, struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 	num_pages = (num + offset + PAGE_SIZE - 1) &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> 	num_pages = min(num_pages, fc-&gt;max_pages);</div><div class='add'>+	num = min(num, num_pages &lt;&lt; PAGE_SHIFT);</div><div class='ctx'> </div><div class='del'>-	args_size += num_pages * (sizeof(ap-&gt;pages[0]) + sizeof(ap-&gt;descs[0]));</div><div class='add'>+	args_size += num_pages * (sizeof(ap-&gt;folios[0]) + sizeof(ap-&gt;descs[0]));</div><div class='ctx'> </div><div class='ctx'> 	ra = kzalloc(args_size, GFP_KERNEL);</div><div class='ctx'> 	if (!ra)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	ap = &amp;ra-&gt;ap;</div><div class='del'>-	ap-&gt;pages = (void *) (ra + 1);</div><div class='del'>-	ap-&gt;descs = (void *) (ap-&gt;pages + num_pages);</div><div class='add'>+	ap-&gt;folios = (void *) (ra + 1);</div><div class='add'>+	ap-&gt;descs = (void *) (ap-&gt;folios + num_pages);</div><div class='ctx'> </div><div class='ctx'> 	args = &amp;ap-&gt;args;</div><div class='ctx'> 	args-&gt;nodeid = outarg-&gt;nodeid;</div><div class='ctx'> 	args-&gt;opcode = FUSE_NOTIFY_REPLY;</div><div class='del'>-	args-&gt;in_numargs = 2;</div><div class='add'>+	args-&gt;in_numargs = 3;</div><div class='ctx'> 	args-&gt;in_pages = true;</div><div class='ctx'> 	args-&gt;end = fuse_retrieve_end;</div><div class='ctx'> </div><div class='ctx'> 	index = outarg-&gt;offset &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> </div><div class='del'>-	while (num &amp;&amp; ap-&gt;num_pages &lt; num_pages) {</div><div class='del'>-		struct page *page;</div><div class='del'>-		unsigned int this_num;</div><div class='add'>+	while (num &amp;&amp; ap-&gt;num_folios &lt; num_pages) {</div><div class='add'>+		struct folio *folio;</div><div class='add'>+		unsigned int folio_offset;</div><div class='add'>+		unsigned int nr_bytes;</div><div class='add'>+		unsigned int nr_pages;</div><div class='ctx'> </div><div class='del'>-		page = find_get_page(mapping, index);</div><div class='del'>-		if (!page)</div><div class='add'>+		folio = filemap_get_folio(mapping, index);</div><div class='add'>+		if (IS_ERR(folio))</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		this_num = min_t(unsigned, num, PAGE_SIZE - offset);</div><div class='del'>-		ap-&gt;pages[ap-&gt;num_pages] = page;</div><div class='del'>-		ap-&gt;descs[ap-&gt;num_pages].offset = offset;</div><div class='del'>-		ap-&gt;descs[ap-&gt;num_pages].length = this_num;</div><div class='del'>-		ap-&gt;num_pages++;</div><div class='add'>+		folio_offset = ((index - folio-&gt;index) &lt;&lt; PAGE_SHIFT) + offset;</div><div class='add'>+		nr_bytes = min(folio_size(folio) - folio_offset, num);</div><div class='add'>+		nr_pages = (offset + nr_bytes + PAGE_SIZE - 1) &gt;&gt; PAGE_SHIFT;</div><div class='add'>+</div><div class='add'>+		ap-&gt;folios[ap-&gt;num_folios] = folio;</div><div class='add'>+		ap-&gt;descs[ap-&gt;num_folios].offset = folio_offset;</div><div class='add'>+		ap-&gt;descs[ap-&gt;num_folios].length = nr_bytes;</div><div class='add'>+		ap-&gt;num_folios++;</div><div class='ctx'> </div><div class='ctx'> 		offset = 0;</div><div class='del'>-		num -= this_num;</div><div class='del'>-		total_len += this_num;</div><div class='del'>-		index++;</div><div class='add'>+		num -= nr_bytes;</div><div class='add'>+		total_len += nr_bytes;</div><div class='add'>+		index += nr_pages;</div><div class='ctx'> 	}</div><div class='ctx'> 	ra-&gt;inarg.offset = outarg-&gt;offset;</div><div class='ctx'> 	ra-&gt;inarg.size = total_len;</div><div class='del'>-	args-&gt;in_args[0].size = sizeof(ra-&gt;inarg);</div><div class='del'>-	args-&gt;in_args[0].value = &amp;ra-&gt;inarg;</div><div class='del'>-	args-&gt;in_args[1].size = total_len;</div><div class='add'>+	fuse_set_zero_arg0(args);</div><div class='add'>+	args-&gt;in_args[1].size = sizeof(ra-&gt;inarg);</div><div class='add'>+	args-&gt;in_args[1].value = &amp;ra-&gt;inarg;</div><div class='add'>+	args-&gt;in_args[2].size = total_len;</div><div class='ctx'> </div><div class='ctx'> 	err = fuse_simple_notify_reply(fm, args, outarg-&gt;notify_unique);</div><div class='ctx'> 	if (err)</div><div class='hunk'>@@ -1742,13 +1953,12 @@ static int fuse_notify_retrieve(struct fuse_conn *fc, unsigned int size,</div><div class='ctx'> 	u64 nodeid;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	err = -EINVAL;</div><div class='ctx'> 	if (size != sizeof(outarg))</div><div class='del'>-		goto copy_finish;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	err = fuse_copy_one(cs, &amp;outarg, sizeof(outarg));</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto copy_finish;</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='ctx'> 	fuse_copy_finish(cs);</div><div class='ctx'> </div><div class='hunk'>@@ -1764,17 +1974,126 @@ static int fuse_notify_retrieve(struct fuse_conn *fc, unsigned int size,</div><div class='ctx'> 	up_read(&amp;fc-&gt;killsb);</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-copy_finish:</div><div class='del'>-	fuse_copy_finish(cs);</div><div class='del'>-	return err;</div><div class='add'>+/*</div><div class='add'>+ * Resending all processing queue requests.</div><div class='add'>+ *</div><div class='add'>+ * During a FUSE daemon panics and failover, it is possible for some inflight</div><div class='add'>+ * requests to be lost and never returned. As a result, applications awaiting</div><div class='add'>+ * replies would become stuck forever. To address this, we can use notification</div><div class='add'>+ * to trigger resending of these pending requests to the FUSE daemon, ensuring</div><div class='add'>+ * they are properly processed again.</div><div class='add'>+ *</div><div class='add'>+ * Please note that this strategy is applicable only to idempotent requests or</div><div class='add'>+ * if the FUSE daemon takes careful measures to avoid processing duplicated</div><div class='add'>+ * non-idempotent requests.</div><div class='add'>+ */</div><div class='add'>+static void fuse_resend(struct fuse_conn *fc)</div><div class='add'>+{</div><div class='add'>+	struct fuse_dev *fud;</div><div class='add'>+	struct fuse_req *req, *next;</div><div class='add'>+	struct fuse_iqueue *fiq = &amp;fc-&gt;iq;</div><div class='add'>+	LIST_HEAD(to_queue);</div><div class='add'>+	unsigned int i;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fc-&gt;lock);</div><div class='add'>+	if (!fc-&gt;connected) {</div><div class='add'>+		spin_unlock(&amp;fc-&gt;lock);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	list_for_each_entry(fud, &amp;fc-&gt;devices, entry) {</div><div class='add'>+		struct fuse_pqueue *fpq = &amp;fud-&gt;pq;</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;fpq-&gt;lock);</div><div class='add'>+		for (i = 0; i &lt; FUSE_PQ_HASH_SIZE; i++)</div><div class='add'>+			list_splice_tail_init(&amp;fpq-&gt;processing[i], &amp;to_queue);</div><div class='add'>+		spin_unlock(&amp;fpq-&gt;lock);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;fc-&gt;lock);</div><div class='add'>+</div><div class='add'>+	list_for_each_entry_safe(req, next, &amp;to_queue, list) {</div><div class='add'>+		set_bit(FR_PENDING, &amp;req-&gt;flags);</div><div class='add'>+		clear_bit(FR_SENT, &amp;req-&gt;flags);</div><div class='add'>+		/* mark the request as resend request */</div><div class='add'>+		req-&gt;in.h.unique |= FUSE_UNIQUE_RESEND;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fiq-&gt;lock);</div><div class='add'>+	if (!fiq-&gt;connected) {</div><div class='add'>+		spin_unlock(&amp;fiq-&gt;lock);</div><div class='add'>+		list_for_each_entry(req, &amp;to_queue, list)</div><div class='add'>+			clear_bit(FR_PENDING, &amp;req-&gt;flags);</div><div class='add'>+		fuse_dev_end_requests(&amp;to_queue);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+	/* iq and pq requests are both oldest to newest */</div><div class='add'>+	list_splice(&amp;to_queue, &amp;fiq-&gt;pending);</div><div class='add'>+	fuse_dev_wake_and_unlock(fiq);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int fuse_notify_resend(struct fuse_conn *fc)</div><div class='add'>+{</div><div class='add'>+	fuse_resend(fc);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Increments the fuse connection epoch.  This will result of dentries from</div><div class='add'>+ * previous epochs to be invalidated.  Additionally, if inval_wq is set, a work</div><div class='add'>+ * queue is scheduled to trigger the invalidation.</div><div class='add'>+ */</div><div class='add'>+static int fuse_notify_inc_epoch(struct fuse_conn *fc)</div><div class='add'>+{</div><div class='add'>+	atomic_inc(&amp;fc-&gt;epoch);</div><div class='add'>+	if (inval_wq)</div><div class='add'>+		schedule_work(&amp;fc-&gt;epoch_work);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int fuse_notify_prune(struct fuse_conn *fc, unsigned int size,</div><div class='add'>+			     struct fuse_copy_state *cs)</div><div class='add'>+{</div><div class='add'>+	struct fuse_notify_prune_out outarg;</div><div class='add'>+	const unsigned int batch = 512;</div><div class='add'>+	u64 *nodeids __free(kfree) = kmalloc(sizeof(u64) * batch, GFP_KERNEL);</div><div class='add'>+	unsigned int num, i;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	if (!nodeids)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	if (size &lt; sizeof(outarg))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	err = fuse_copy_one(cs, &amp;outarg, sizeof(outarg));</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	if (size - sizeof(outarg) != outarg.count * sizeof(u64))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	for (; outarg.count; outarg.count -= num) {</div><div class='add'>+		num = min(batch, outarg.count);</div><div class='add'>+		err = fuse_copy_one(cs, nodeids, num * sizeof(u64));</div><div class='add'>+		if (err)</div><div class='add'>+			return err;</div><div class='add'>+</div><div class='add'>+		scoped_guard(rwsem_read, &amp;fc-&gt;killsb) {</div><div class='add'>+			for (i = 0; i &lt; num; i++)</div><div class='add'>+				fuse_try_prune_one_inode(fc, nodeids[i]);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int fuse_notify(struct fuse_conn *fc, enum fuse_notify_code code,</div><div class='ctx'> 		       unsigned int size, struct fuse_copy_state *cs)</div><div class='ctx'> {</div><div class='del'>-	/* Don't try to move pages (yet) */</div><div class='del'>-	cs-&gt;move_pages = 0;</div><div class='add'>+	/* Don't try to move folios (yet) */</div><div class='add'>+	cs-&gt;move_folios = false;</div><div class='ctx'> </div><div class='ctx'> 	switch (code) {</div><div class='ctx'> 	case FUSE_NOTIFY_POLL:</div><div class='hunk'>@@ -1795,14 +2114,22 @@ static int fuse_notify(struct fuse_conn *fc, enum fuse_notify_code code,</div><div class='ctx'> 	case FUSE_NOTIFY_DELETE:</div><div class='ctx'> 		return fuse_notify_delete(fc, size, cs);</div><div class='ctx'> </div><div class='add'>+	case FUSE_NOTIFY_RESEND:</div><div class='add'>+		return fuse_notify_resend(fc);</div><div class='add'>+</div><div class='add'>+	case FUSE_NOTIFY_INC_EPOCH:</div><div class='add'>+		return fuse_notify_inc_epoch(fc);</div><div class='add'>+</div><div class='add'>+	case FUSE_NOTIFY_PRUNE:</div><div class='add'>+		return fuse_notify_prune(fc, size, cs);</div><div class='add'>+</div><div class='ctx'> 	default:</div><div class='del'>-		fuse_copy_finish(cs);</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Look up request on processing list by unique ID */</div><div class='del'>-static struct fuse_req *request_find(struct fuse_pqueue *fpq, u64 unique)</div><div class='add'>+struct fuse_req *fuse_request_find(struct fuse_pqueue *fpq, u64 unique)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int hash = fuse_req_hash(unique);</div><div class='ctx'> 	struct fuse_req *req;</div><div class='hunk'>@@ -1814,10 +2141,17 @@ static struct fuse_req *request_find(struct fuse_pqueue *fpq, u64 unique)</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int copy_out_args(struct fuse_copy_state *cs, struct fuse_args *args,</div><div class='del'>-			 unsigned nbytes)</div><div class='add'>+int fuse_copy_out_args(struct fuse_copy_state *cs, struct fuse_args *args,</div><div class='add'>+		       unsigned nbytes)</div><div class='ctx'> {</div><div class='del'>-	unsigned reqsize = sizeof(struct fuse_out_header);</div><div class='add'>+</div><div class='add'>+	unsigned int reqsize = 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Uring has all headers separated from args - args is payload only</div><div class='add'>+	 */</div><div class='add'>+	if (!cs-&gt;is_uring)</div><div class='add'>+		reqsize = sizeof(struct fuse_out_header);</div><div class='ctx'> </div><div class='ctx'> 	reqsize += fuse_len_args(args-&gt;out_numargs, args-&gt;out_args);</div><div class='ctx'> </div><div class='hunk'>@@ -1869,7 +2203,7 @@ static ssize_t fuse_dev_do_write(struct fuse_dev *fud,</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (!oh.unique) {</div><div class='ctx'> 		err = fuse_notify(fc, oh.error, nbytes - sizeof(oh), cs);</div><div class='del'>-		goto out;</div><div class='add'>+		goto copy_finish;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	err = -EINVAL;</div><div class='hunk'>@@ -1879,7 +2213,7 @@ static ssize_t fuse_dev_do_write(struct fuse_dev *fud,</div><div class='ctx'> 	spin_lock(&amp;fpq-&gt;lock);</div><div class='ctx'> 	req = NULL;</div><div class='ctx'> 	if (fpq-&gt;connected)</div><div class='del'>-		req = request_find(fpq, oh.unique &amp; ~FUSE_INT_REQ_BIT);</div><div class='add'>+		req = fuse_request_find(fpq, oh.unique &amp; ~FUSE_INT_REQ_BIT);</div><div class='ctx'> </div><div class='ctx'> 	err = -ENOENT;</div><div class='ctx'> 	if (!req) {</div><div class='hunk'>@@ -1912,12 +2246,12 @@ static ssize_t fuse_dev_do_write(struct fuse_dev *fud,</div><div class='ctx'> 	spin_unlock(&amp;fpq-&gt;lock);</div><div class='ctx'> 	cs-&gt;req = req;</div><div class='ctx'> 	if (!req-&gt;args-&gt;page_replace)</div><div class='del'>-		cs-&gt;move_pages = 0;</div><div class='add'>+		cs-&gt;move_folios = false;</div><div class='ctx'> </div><div class='ctx'> 	if (oh.error)</div><div class='ctx'> 		err = nbytes != sizeof(oh) ? -EINVAL : 0;</div><div class='ctx'> 	else</div><div class='del'>-		err = copy_out_args(cs, req-&gt;args, nbytes);</div><div class='add'>+		err = fuse_copy_out_args(cs, req-&gt;args, nbytes);</div><div class='ctx'> 	fuse_copy_finish(cs);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;fpq-&gt;lock);</div><div class='hunk'>@@ -1942,15 +2276,15 @@ copy_finish:</div><div class='ctx'> static ssize_t fuse_dev_write(struct kiocb *iocb, struct iov_iter *from)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_copy_state cs;</div><div class='del'>-	struct fuse_dev *fud = fuse_get_dev(iocb-&gt;ki_filp);</div><div class='add'>+	struct fuse_dev *fud = __fuse_get_dev(iocb-&gt;ki_filp);</div><div class='ctx'> </div><div class='ctx'> 	if (!fud)</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='del'>-	if (!iter_is_iovec(from))</div><div class='add'>+	if (!user_backed_iter(from))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	fuse_copy_init(&amp;cs, 0, from);</div><div class='add'>+	fuse_copy_init(&amp;cs, false, from);</div><div class='ctx'> </div><div class='ctx'> 	return fuse_dev_do_write(fud, &amp;cs, iov_iter_count(from));</div><div class='ctx'> }</div><div class='hunk'>@@ -1959,16 +2293,15 @@ static ssize_t fuse_dev_splice_write(struct pipe_inode_info *pipe,</div><div class='ctx'> 				     struct file *out, loff_t *ppos,</div><div class='ctx'> 				     size_t len, unsigned int flags)</div><div class='ctx'> {</div><div class='del'>-	unsigned int head, tail, mask, count;</div><div class='add'>+	unsigned int head, tail, count;</div><div class='ctx'> 	unsigned nbuf;</div><div class='ctx'> 	unsigned idx;</div><div class='ctx'> 	struct pipe_buffer *bufs;</div><div class='ctx'> 	struct fuse_copy_state cs;</div><div class='del'>-	struct fuse_dev *fud;</div><div class='add'>+	struct fuse_dev *fud = __fuse_get_dev(out);</div><div class='ctx'> 	size_t rem;</div><div class='ctx'> 	ssize_t ret;</div><div class='ctx'> </div><div class='del'>-	fud = fuse_get_dev(out);</div><div class='ctx'> 	if (!fud)</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='hunk'>@@ -1976,8 +2309,7 @@ static ssize_t fuse_dev_splice_write(struct pipe_inode_info *pipe,</div><div class='ctx'> </div><div class='ctx'> 	head = pipe-&gt;head;</div><div class='ctx'> 	tail = pipe-&gt;tail;</div><div class='del'>-	mask = pipe-&gt;ring_size - 1;</div><div class='del'>-	count = head - tail;</div><div class='add'>+	count = pipe_occupancy(head, tail);</div><div class='ctx'> </div><div class='ctx'> 	bufs = kvmalloc_array(count, sizeof(struct pipe_buffer), GFP_KERNEL);</div><div class='ctx'> 	if (!bufs) {</div><div class='hunk'>@@ -1987,8 +2319,8 @@ static ssize_t fuse_dev_splice_write(struct pipe_inode_info *pipe,</div><div class='ctx'> </div><div class='ctx'> 	nbuf = 0;</div><div class='ctx'> 	rem = 0;</div><div class='del'>-	for (idx = tail; idx != head &amp;&amp; rem &lt; len; idx++)</div><div class='del'>-		rem += pipe-&gt;bufs[idx &amp; mask].len;</div><div class='add'>+	for (idx = tail; !pipe_empty(head, idx) &amp;&amp; rem &lt; len; idx++)</div><div class='add'>+		rem += pipe_buf(pipe, idx)-&gt;len;</div><div class='ctx'> </div><div class='ctx'> 	ret = -EINVAL;</div><div class='ctx'> 	if (rem &lt; len)</div><div class='hunk'>@@ -1999,10 +2331,10 @@ static ssize_t fuse_dev_splice_write(struct pipe_inode_info *pipe,</div><div class='ctx'> 		struct pipe_buffer *ibuf;</div><div class='ctx'> 		struct pipe_buffer *obuf;</div><div class='ctx'> </div><div class='del'>-		if (WARN_ON(nbuf &gt;= count || tail == head))</div><div class='add'>+		if (WARN_ON(nbuf &gt;= count || pipe_empty(head, tail)))</div><div class='ctx'> 			goto out_free;</div><div class='ctx'> </div><div class='del'>-		ibuf = &amp;pipe-&gt;bufs[tail &amp; mask];</div><div class='add'>+		ibuf = pipe_buf(pipe, tail);</div><div class='ctx'> 		obuf = &amp;bufs[nbuf];</div><div class='ctx'> </div><div class='ctx'> 		if (rem &gt;= ibuf-&gt;len) {</div><div class='hunk'>@@ -2025,13 +2357,13 @@ static ssize_t fuse_dev_splice_write(struct pipe_inode_info *pipe,</div><div class='ctx'> 	}</div><div class='ctx'> 	pipe_unlock(pipe);</div><div class='ctx'> </div><div class='del'>-	fuse_copy_init(&amp;cs, 0, NULL);</div><div class='add'>+	fuse_copy_init(&amp;cs, false, NULL);</div><div class='ctx'> 	cs.pipebufs = bufs;</div><div class='ctx'> 	cs.nr_segs = nbuf;</div><div class='ctx'> 	cs.pipe = pipe;</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; SPLICE_F_MOVE)</div><div class='del'>-		cs.move_pages = 1;</div><div class='add'>+		cs.move_folios = true;</div><div class='ctx'> </div><div class='ctx'> 	ret = fuse_dev_do_write(fud, &amp;cs, len);</div><div class='ctx'> </div><div class='hunk'>@@ -2055,7 +2387,7 @@ static __poll_t fuse_dev_poll(struct file *file, poll_table *wait)</div><div class='ctx'> 	struct fuse_iqueue *fiq;</div><div class='ctx'> 	struct fuse_dev *fud = fuse_get_dev(file);</div><div class='ctx'> </div><div class='del'>-	if (!fud)</div><div class='add'>+	if (IS_ERR(fud))</div><div class='ctx'> 		return EPOLLERR;</div><div class='ctx'> </div><div class='ctx'> 	fiq = &amp;fud-&gt;fc-&gt;iq;</div><div class='hunk'>@@ -2072,7 +2404,7 @@ static __poll_t fuse_dev_poll(struct file *file, poll_table *wait)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Abort all requests on the given list (pending or processing) */</div><div class='del'>-static void end_requests(struct list_head *head)</div><div class='add'>+void fuse_dev_end_requests(struct list_head *head)</div><div class='ctx'> {</div><div class='ctx'> 	while (!list_empty(head)) {</div><div class='ctx'> 		struct fuse_req *req;</div><div class='hunk'>@@ -2108,7 +2440,7 @@ static void end_polls(struct fuse_conn *fc)</div><div class='ctx'>  * The same effect is usually achievable through killing the filesystem daemon</div><div class='ctx'>  * and all users of the filesystem.  The exception is the combination of an</div><div class='ctx'>  * asynchronous request and the tricky deadlock (see</div><div class='del'>- * Documentation/filesystems/fuse.rst).</div><div class='add'>+ * Documentation/filesystems/fuse/fuse.rst).</div><div class='ctx'>  *</div><div class='ctx'>  * Aborting requests under I/O goes as follows: 1: Separate out unlocked</div><div class='ctx'>  * requests, they should be finished off immediately.  Locked requests will be</div><div class='hunk'>@@ -2128,6 +2460,9 @@ void fuse_abort_conn(struct fuse_conn *fc)</div><div class='ctx'> 		LIST_HEAD(to_end);</div><div class='ctx'> 		unsigned int i;</div><div class='ctx'> </div><div class='add'>+		if (fc-&gt;timeout.req_timeout)</div><div class='add'>+			cancel_delayed_work(&amp;fc-&gt;timeout.work);</div><div class='add'>+</div><div class='ctx'> 		/* Background queuing checks fc-&gt;connected under bg_lock */</div><div class='ctx'> 		spin_lock(&amp;fc-&gt;bg_lock);</div><div class='ctx'> 		fc-&gt;connected = 0;</div><div class='hunk'>@@ -2175,7 +2510,13 @@ void fuse_abort_conn(struct fuse_conn *fc)</div><div class='ctx'> 		wake_up_all(&amp;fc-&gt;blocked_waitq);</div><div class='ctx'> 		spin_unlock(&amp;fc-&gt;lock);</div><div class='ctx'> </div><div class='del'>-		end_requests(&amp;to_end);</div><div class='add'>+		fuse_dev_end_requests(&amp;to_end);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * fc-&gt;lock must not be taken to avoid conflicts with io-uring</div><div class='add'>+		 * locks</div><div class='add'>+		 */</div><div class='add'>+		fuse_uring_abort(fc);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		spin_unlock(&amp;fc-&gt;lock);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2187,11 +2528,13 @@ void fuse_wait_aborted(struct fuse_conn *fc)</div><div class='ctx'> 	/* matches implicit memory barrier in fuse_drop_waiting() */</div><div class='ctx'> 	smp_mb();</div><div class='ctx'> 	wait_event(fc-&gt;blocked_waitq, atomic_read(&amp;fc-&gt;num_waiting) == 0);</div><div class='add'>+</div><div class='add'>+	fuse_uring_wait_stopped_queues(fc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int fuse_dev_release(struct inode *inode, struct file *file)</div><div class='ctx'> {</div><div class='del'>-	struct fuse_dev *fud = fuse_get_dev(file);</div><div class='add'>+	struct fuse_dev *fud = __fuse_get_dev(file);</div><div class='ctx'> </div><div class='ctx'> 	if (fud) {</div><div class='ctx'> 		struct fuse_conn *fc = fud-&gt;fc;</div><div class='hunk'>@@ -2205,7 +2548,7 @@ int fuse_dev_release(struct inode *inode, struct file *file)</div><div class='ctx'> 			list_splice_init(&amp;fpq-&gt;processing[i], &amp;to_end);</div><div class='ctx'> 		spin_unlock(&amp;fpq-&gt;lock);</div><div class='ctx'> </div><div class='del'>-		end_requests(&amp;to_end);</div><div class='add'>+		fuse_dev_end_requests(&amp;to_end);</div><div class='ctx'> </div><div class='ctx'> 		/* Are we the last open device? */</div><div class='ctx'> 		if (atomic_dec_and_test(&amp;fc-&gt;dev_count)) {</div><div class='hunk'>@@ -2222,8 +2565,8 @@ static int fuse_dev_fasync(int fd, struct file *file, int on)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_dev *fud = fuse_get_dev(file);</div><div class='ctx'> </div><div class='del'>-	if (!fud)</div><div class='del'>-		return -EPERM;</div><div class='add'>+	if (IS_ERR(fud))</div><div class='add'>+		return PTR_ERR(fud);</div><div class='ctx'> </div><div class='ctx'> 	/* No locking - fasync_helper does its own locking */</div><div class='ctx'> 	return fasync_helper(fd, file, on, &amp;fud-&gt;fc-&gt;iq.fasync);</div><div class='hunk'>@@ -2233,7 +2576,7 @@ static int fuse_device_clone(struct fuse_conn *fc, struct file *new)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_dev *fud;</div><div class='ctx'> </div><div class='del'>-	if (new-&gt;private_data)</div><div class='add'>+	if (__fuse_get_dev(new))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	fud = fuse_dev_alloc_install(fc);</div><div class='hunk'>@@ -2246,49 +2589,121 @@ static int fuse_device_clone(struct fuse_conn *fc, struct file *new)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static long fuse_dev_ioctl(struct file *file, unsigned int cmd,</div><div class='del'>-			   unsigned long arg)</div><div class='add'>+static long fuse_dev_ioctl_clone(struct file *file, __u32 __user *argp)</div><div class='ctx'> {</div><div class='ctx'> 	int res;</div><div class='ctx'> 	int oldfd;</div><div class='ctx'> 	struct fuse_dev *fud = NULL;</div><div class='ctx'> </div><div class='add'>+	if (get_user(oldfd, argp))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+</div><div class='add'>+	CLASS(fd, f)(oldfd);</div><div class='add'>+	if (fd_empty(f))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Check against file-&gt;f_op because CUSE</div><div class='add'>+	 * uses the same ioctl handler.</div><div class='add'>+	 */</div><div class='add'>+	if (fd_file(f)-&gt;f_op == file-&gt;f_op)</div><div class='add'>+		fud = __fuse_get_dev(fd_file(f));</div><div class='add'>+</div><div class='add'>+	res = -EINVAL;</div><div class='add'>+	if (fud) {</div><div class='add'>+		mutex_lock(&amp;fuse_mutex);</div><div class='add'>+		res = fuse_device_clone(fud-&gt;fc, file);</div><div class='add'>+		mutex_unlock(&amp;fuse_mutex);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return res;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static long fuse_dev_ioctl_backing_open(struct file *file,</div><div class='add'>+					struct fuse_backing_map __user *argp)</div><div class='add'>+{</div><div class='add'>+	struct fuse_dev *fud = fuse_get_dev(file);</div><div class='add'>+	struct fuse_backing_map map;</div><div class='add'>+</div><div class='add'>+	if (IS_ERR(fud))</div><div class='add'>+		return PTR_ERR(fud);</div><div class='add'>+</div><div class='add'>+	if (!IS_ENABLED(CONFIG_FUSE_PASSTHROUGH))</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+</div><div class='add'>+	if (copy_from_user(&amp;map, argp, sizeof(map)))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+</div><div class='add'>+	return fuse_backing_open(fud-&gt;fc, &amp;map);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static long fuse_dev_ioctl_backing_close(struct file *file, __u32 __user *argp)</div><div class='add'>+{</div><div class='add'>+	struct fuse_dev *fud = fuse_get_dev(file);</div><div class='add'>+	int backing_id;</div><div class='add'>+</div><div class='add'>+	if (IS_ERR(fud))</div><div class='add'>+		return PTR_ERR(fud);</div><div class='add'>+</div><div class='add'>+	if (!IS_ENABLED(CONFIG_FUSE_PASSTHROUGH))</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+</div><div class='add'>+	if (get_user(backing_id, argp))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+</div><div class='add'>+	return fuse_backing_close(fud-&gt;fc, backing_id);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static long fuse_dev_ioctl_sync_init(struct file *file)</div><div class='add'>+{</div><div class='add'>+	int err = -EINVAL;</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;fuse_mutex);</div><div class='add'>+	if (!__fuse_get_dev(file)) {</div><div class='add'>+		WRITE_ONCE(file-&gt;private_data, FUSE_DEV_SYNC_INIT);</div><div class='add'>+		err = 0;</div><div class='add'>+	}</div><div class='add'>+	mutex_unlock(&amp;fuse_mutex);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static long fuse_dev_ioctl(struct file *file, unsigned int cmd,</div><div class='add'>+			   unsigned long arg)</div><div class='add'>+{</div><div class='add'>+	void __user *argp = (void __user *)arg;</div><div class='add'>+</div><div class='ctx'> 	switch (cmd) {</div><div class='ctx'> 	case FUSE_DEV_IOC_CLONE:</div><div class='del'>-		res = -EFAULT;</div><div class='del'>-		if (!get_user(oldfd, (__u32 __user *)arg)) {</div><div class='del'>-			struct file *old = fget(oldfd);</div><div class='del'>-</div><div class='del'>-			res = -EINVAL;</div><div class='del'>-			if (old) {</div><div class='del'>-				/*</div><div class='del'>-				 * Check against file-&gt;f_op because CUSE</div><div class='del'>-				 * uses the same ioctl handler.</div><div class='del'>-				 */</div><div class='del'>-				if (old-&gt;f_op == file-&gt;f_op &amp;&amp;</div><div class='del'>-				    old-&gt;f_cred-&gt;user_ns == file-&gt;f_cred-&gt;user_ns)</div><div class='del'>-					fud = fuse_get_dev(old);</div><div class='del'>-</div><div class='del'>-				if (fud) {</div><div class='del'>-					mutex_lock(&amp;fuse_mutex);</div><div class='del'>-					res = fuse_device_clone(fud-&gt;fc, file);</div><div class='del'>-					mutex_unlock(&amp;fuse_mutex);</div><div class='del'>-				}</div><div class='del'>-				fput(old);</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-		break;</div><div class='add'>+		return fuse_dev_ioctl_clone(file, argp);</div><div class='add'>+</div><div class='add'>+	case FUSE_DEV_IOC_BACKING_OPEN:</div><div class='add'>+		return fuse_dev_ioctl_backing_open(file, argp);</div><div class='add'>+</div><div class='add'>+	case FUSE_DEV_IOC_BACKING_CLOSE:</div><div class='add'>+		return fuse_dev_ioctl_backing_close(file, argp);</div><div class='add'>+</div><div class='add'>+	case FUSE_DEV_IOC_SYNC_INIT:</div><div class='add'>+		return fuse_dev_ioctl_sync_init(file);</div><div class='add'>+</div><div class='ctx'> 	default:</div><div class='del'>-		res = -ENOTTY;</div><div class='del'>-		break;</div><div class='add'>+		return -ENOTTY;</div><div class='ctx'> 	}</div><div class='del'>-	return res;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_PROC_FS</div><div class='add'>+static void fuse_dev_show_fdinfo(struct seq_file *seq, struct file *file)</div><div class='add'>+{</div><div class='add'>+	struct fuse_dev *fud = __fuse_get_dev(file);</div><div class='add'>+	if (!fud)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	seq_printf(seq, "fuse_connection:\t%u\n", fud-&gt;fc-&gt;dev);</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> const struct file_operations fuse_dev_operations = {</div><div class='ctx'> 	.owner		= THIS_MODULE,</div><div class='ctx'> 	.open		= fuse_dev_open,</div><div class='del'>-	.llseek		= no_llseek,</div><div class='ctx'> 	.read_iter	= fuse_dev_read,</div><div class='ctx'> 	.splice_read	= fuse_dev_splice_read,</div><div class='ctx'> 	.write_iter	= fuse_dev_write,</div><div class='hunk'>@@ -2298,6 +2713,12 @@ const struct file_operations fuse_dev_operations = {</div><div class='ctx'> 	.fasync		= fuse_dev_fasync,</div><div class='ctx'> 	.unlocked_ioctl = fuse_dev_ioctl,</div><div class='ctx'> 	.compat_ioctl   = compat_ptr_ioctl,</div><div class='add'>+#ifdef CONFIG_FUSE_IO_URING</div><div class='add'>+	.uring_cmd	= fuse_uring_cmd,</div><div class='add'>+#endif</div><div class='add'>+#ifdef CONFIG_PROC_FS</div><div class='add'>+	.show_fdinfo	= fuse_dev_show_fdinfo,</div><div class='add'>+#endif</div><div class='ctx'> };</div><div class='ctx'> EXPORT_SYMBOL_GPL(fuse_dev_operations);</div><div class='ctx'> </div><div class='head'>diff --git a/fs/fuse/dev_uring.c b/fs/fuse/dev_uring.c<br/>new file mode 100644<br/>index 000000000000..5ceb217ced1b<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fuse/dev_uring.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fuse/dev_uring.c</a></div><div class='hunk'>@@ -0,0 +1,1373 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+/*</div><div class='add'>+ * FUSE: Filesystem in Userspace</div><div class='add'>+ * Copyright (c) 2023-2024 DataDirect Networks.</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include "fuse_i.h"</div><div class='add'>+#include "dev_uring_i.h"</div><div class='add'>+#include "fuse_dev_i.h"</div><div class='add'>+#include "fuse_trace.h"</div><div class='add'>+</div><div class='add'>+#include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/io_uring/cmd.h&gt;</div><div class='add'>+</div><div class='add'>+static bool __read_mostly enable_uring;</div><div class='add'>+module_param(enable_uring, bool, 0644);</div><div class='add'>+MODULE_PARM_DESC(enable_uring,</div><div class='add'>+		 "Enable userspace communication through io-uring");</div><div class='add'>+</div><div class='add'>+#define FUSE_URING_IOV_SEGS 2 /* header and payload */</div><div class='add'>+</div><div class='add'>+</div><div class='add'>+bool fuse_uring_enabled(void)</div><div class='add'>+{</div><div class='add'>+	return enable_uring;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct fuse_uring_pdu {</div><div class='add'>+	struct fuse_ring_ent *ent;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct fuse_iqueue_ops fuse_io_uring_ops;</div><div class='add'>+</div><div class='add'>+static void uring_cmd_set_ring_ent(struct io_uring_cmd *cmd,</div><div class='add'>+				   struct fuse_ring_ent *ring_ent)</div><div class='add'>+{</div><div class='add'>+	struct fuse_uring_pdu *pdu =</div><div class='add'>+		io_uring_cmd_to_pdu(cmd, struct fuse_uring_pdu);</div><div class='add'>+</div><div class='add'>+	pdu-&gt;ent = ring_ent;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct fuse_ring_ent *uring_cmd_to_ring_ent(struct io_uring_cmd *cmd)</div><div class='add'>+{</div><div class='add'>+	struct fuse_uring_pdu *pdu =</div><div class='add'>+		io_uring_cmd_to_pdu(cmd, struct fuse_uring_pdu);</div><div class='add'>+</div><div class='add'>+	return pdu-&gt;ent;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fuse_uring_flush_bg(struct fuse_ring_queue *queue)</div><div class='add'>+{</div><div class='add'>+	struct fuse_ring *ring = queue-&gt;ring;</div><div class='add'>+	struct fuse_conn *fc = ring-&gt;fc;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held(&amp;queue-&gt;lock);</div><div class='add'>+	lockdep_assert_held(&amp;fc-&gt;bg_lock);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Allow one bg request per queue, ignoring global fc limits.</div><div class='add'>+	 * This prevents a single queue from consuming all resources and</div><div class='add'>+	 * eliminates the need for remote queue wake-ups when global</div><div class='add'>+	 * limits are met but this queue has no more waiting requests.</div><div class='add'>+	 */</div><div class='add'>+	while ((fc-&gt;active_background &lt; fc-&gt;max_background ||</div><div class='add'>+		!queue-&gt;active_background) &amp;&amp;</div><div class='add'>+	       (!list_empty(&amp;queue-&gt;fuse_req_bg_queue))) {</div><div class='add'>+		struct fuse_req *req;</div><div class='add'>+</div><div class='add'>+		req = list_first_entry(&amp;queue-&gt;fuse_req_bg_queue,</div><div class='add'>+				       struct fuse_req, list);</div><div class='add'>+		fc-&gt;active_background++;</div><div class='add'>+		queue-&gt;active_background++;</div><div class='add'>+</div><div class='add'>+		list_move_tail(&amp;req-&gt;list, &amp;queue-&gt;fuse_req_queue);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fuse_uring_req_end(struct fuse_ring_ent *ent, struct fuse_req *req,</div><div class='add'>+			       int error)</div><div class='add'>+{</div><div class='add'>+	struct fuse_ring_queue *queue = ent-&gt;queue;</div><div class='add'>+	struct fuse_ring *ring = queue-&gt;ring;</div><div class='add'>+	struct fuse_conn *fc = ring-&gt;fc;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_not_held(&amp;queue-&gt;lock);</div><div class='add'>+	spin_lock(&amp;queue-&gt;lock);</div><div class='add'>+	ent-&gt;fuse_req = NULL;</div><div class='add'>+	list_del_init(&amp;req-&gt;list);</div><div class='add'>+	if (test_bit(FR_BACKGROUND, &amp;req-&gt;flags)) {</div><div class='add'>+		queue-&gt;active_background--;</div><div class='add'>+		spin_lock(&amp;fc-&gt;bg_lock);</div><div class='add'>+		fuse_uring_flush_bg(queue);</div><div class='add'>+		spin_unlock(&amp;fc-&gt;bg_lock);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_unlock(&amp;queue-&gt;lock);</div><div class='add'>+</div><div class='add'>+	if (error)</div><div class='add'>+		req-&gt;out.h.error = error;</div><div class='add'>+</div><div class='add'>+	clear_bit(FR_SENT, &amp;req-&gt;flags);</div><div class='add'>+	fuse_request_end(req);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Abort all list queued request on the given ring queue */</div><div class='add'>+static void fuse_uring_abort_end_queue_requests(struct fuse_ring_queue *queue)</div><div class='add'>+{</div><div class='add'>+	struct fuse_req *req;</div><div class='add'>+	LIST_HEAD(req_list);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;queue-&gt;lock);</div><div class='add'>+	list_for_each_entry(req, &amp;queue-&gt;fuse_req_queue, list)</div><div class='add'>+		clear_bit(FR_PENDING, &amp;req-&gt;flags);</div><div class='add'>+	list_splice_init(&amp;queue-&gt;fuse_req_queue, &amp;req_list);</div><div class='add'>+	spin_unlock(&amp;queue-&gt;lock);</div><div class='add'>+</div><div class='add'>+	/* must not hold queue lock to avoid order issues with fi-&gt;lock */</div><div class='add'>+	fuse_dev_end_requests(&amp;req_list);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void fuse_uring_abort_end_requests(struct fuse_ring *ring)</div><div class='add'>+{</div><div class='add'>+	int qid;</div><div class='add'>+	struct fuse_ring_queue *queue;</div><div class='add'>+	struct fuse_conn *fc = ring-&gt;fc;</div><div class='add'>+</div><div class='add'>+	for (qid = 0; qid &lt; ring-&gt;nr_queues; qid++) {</div><div class='add'>+		queue = READ_ONCE(ring-&gt;queues[qid]);</div><div class='add'>+		if (!queue)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		queue-&gt;stopped = true;</div><div class='add'>+</div><div class='add'>+		WARN_ON_ONCE(ring-&gt;fc-&gt;max_background != UINT_MAX);</div><div class='add'>+		spin_lock(&amp;queue-&gt;lock);</div><div class='add'>+		spin_lock(&amp;fc-&gt;bg_lock);</div><div class='add'>+		fuse_uring_flush_bg(queue);</div><div class='add'>+		spin_unlock(&amp;fc-&gt;bg_lock);</div><div class='add'>+		spin_unlock(&amp;queue-&gt;lock);</div><div class='add'>+		fuse_uring_abort_end_queue_requests(queue);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool ent_list_request_expired(struct fuse_conn *fc, struct list_head *list)</div><div class='add'>+{</div><div class='add'>+	struct fuse_ring_ent *ent;</div><div class='add'>+	struct fuse_req *req;</div><div class='add'>+</div><div class='add'>+	ent = list_first_entry_or_null(list, struct fuse_ring_ent, list);</div><div class='add'>+	if (!ent)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	req = ent-&gt;fuse_req;</div><div class='add'>+</div><div class='add'>+	return time_is_before_jiffies(req-&gt;create_time +</div><div class='add'>+				      fc-&gt;timeout.req_timeout);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool fuse_uring_request_expired(struct fuse_conn *fc)</div><div class='add'>+{</div><div class='add'>+	struct fuse_ring *ring = fc-&gt;ring;</div><div class='add'>+	struct fuse_ring_queue *queue;</div><div class='add'>+	int qid;</div><div class='add'>+</div><div class='add'>+	if (!ring)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	for (qid = 0; qid &lt; ring-&gt;nr_queues; qid++) {</div><div class='add'>+		queue = READ_ONCE(ring-&gt;queues[qid]);</div><div class='add'>+		if (!queue)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;queue-&gt;lock);</div><div class='add'>+		if (fuse_request_expired(fc, &amp;queue-&gt;fuse_req_queue) ||</div><div class='add'>+		    fuse_request_expired(fc, &amp;queue-&gt;fuse_req_bg_queue) ||</div><div class='add'>+		    ent_list_request_expired(fc, &amp;queue-&gt;ent_w_req_queue) ||</div><div class='add'>+		    ent_list_request_expired(fc, &amp;queue-&gt;ent_in_userspace)) {</div><div class='add'>+			spin_unlock(&amp;queue-&gt;lock);</div><div class='add'>+			return true;</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;queue-&gt;lock);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void fuse_uring_destruct(struct fuse_conn *fc)</div><div class='add'>+{</div><div class='add'>+	struct fuse_ring *ring = fc-&gt;ring;</div><div class='add'>+	int qid;</div><div class='add'>+</div><div class='add'>+	if (!ring)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	for (qid = 0; qid &lt; ring-&gt;nr_queues; qid++) {</div><div class='add'>+		struct fuse_ring_queue *queue = ring-&gt;queues[qid];</div><div class='add'>+		struct fuse_ring_ent *ent, *next;</div><div class='add'>+</div><div class='add'>+		if (!queue)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		WARN_ON(!list_empty(&amp;queue-&gt;ent_avail_queue));</div><div class='add'>+		WARN_ON(!list_empty(&amp;queue-&gt;ent_w_req_queue));</div><div class='add'>+		WARN_ON(!list_empty(&amp;queue-&gt;ent_commit_queue));</div><div class='add'>+		WARN_ON(!list_empty(&amp;queue-&gt;ent_in_userspace));</div><div class='add'>+</div><div class='add'>+		list_for_each_entry_safe(ent, next, &amp;queue-&gt;ent_released,</div><div class='add'>+					 list) {</div><div class='add'>+			list_del_init(&amp;ent-&gt;list);</div><div class='add'>+			kfree(ent);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		kfree(queue-&gt;fpq.processing);</div><div class='add'>+		kfree(queue);</div><div class='add'>+		ring-&gt;queues[qid] = NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	kfree(ring-&gt;queues);</div><div class='add'>+	kfree(ring);</div><div class='add'>+	fc-&gt;ring = NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Basic ring setup for this connection based on the provided configuration</div><div class='add'>+ */</div><div class='add'>+static struct fuse_ring *fuse_uring_create(struct fuse_conn *fc)</div><div class='add'>+{</div><div class='add'>+	struct fuse_ring *ring;</div><div class='add'>+	size_t nr_queues = num_possible_cpus();</div><div class='add'>+	struct fuse_ring *res = NULL;</div><div class='add'>+	size_t max_payload_size;</div><div class='add'>+</div><div class='add'>+	ring = kzalloc(sizeof(*fc-&gt;ring), GFP_KERNEL_ACCOUNT);</div><div class='add'>+	if (!ring)</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	ring-&gt;queues = kcalloc(nr_queues, sizeof(struct fuse_ring_queue *),</div><div class='add'>+			       GFP_KERNEL_ACCOUNT);</div><div class='add'>+	if (!ring-&gt;queues)</div><div class='add'>+		goto out_err;</div><div class='add'>+</div><div class='add'>+	max_payload_size = max(FUSE_MIN_READ_BUFFER, fc-&gt;max_write);</div><div class='add'>+	max_payload_size = max(max_payload_size, fc-&gt;max_pages * PAGE_SIZE);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fc-&gt;lock);</div><div class='add'>+	if (fc-&gt;ring) {</div><div class='add'>+		/* race, another thread created the ring in the meantime */</div><div class='add'>+		spin_unlock(&amp;fc-&gt;lock);</div><div class='add'>+		res = fc-&gt;ring;</div><div class='add'>+		goto out_err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	init_waitqueue_head(&amp;ring-&gt;stop_waitq);</div><div class='add'>+</div><div class='add'>+	ring-&gt;nr_queues = nr_queues;</div><div class='add'>+	ring-&gt;fc = fc;</div><div class='add'>+	ring-&gt;max_payload_sz = max_payload_size;</div><div class='add'>+	smp_store_release(&amp;fc-&gt;ring, ring);</div><div class='add'>+</div><div class='add'>+	spin_unlock(&amp;fc-&gt;lock);</div><div class='add'>+	return ring;</div><div class='add'>+</div><div class='add'>+out_err:</div><div class='add'>+	kfree(ring-&gt;queues);</div><div class='add'>+	kfree(ring);</div><div class='add'>+	return res;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct fuse_ring_queue *fuse_uring_create_queue(struct fuse_ring *ring,</div><div class='add'>+						       int qid)</div><div class='add'>+{</div><div class='add'>+	struct fuse_conn *fc = ring-&gt;fc;</div><div class='add'>+	struct fuse_ring_queue *queue;</div><div class='add'>+	struct list_head *pq;</div><div class='add'>+</div><div class='add'>+	queue = kzalloc(sizeof(*queue), GFP_KERNEL_ACCOUNT);</div><div class='add'>+	if (!queue)</div><div class='add'>+		return NULL;</div><div class='add'>+	pq = kcalloc(FUSE_PQ_HASH_SIZE, sizeof(struct list_head), GFP_KERNEL);</div><div class='add'>+	if (!pq) {</div><div class='add'>+		kfree(queue);</div><div class='add'>+		return NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	queue-&gt;qid = qid;</div><div class='add'>+	queue-&gt;ring = ring;</div><div class='add'>+	spin_lock_init(&amp;queue-&gt;lock);</div><div class='add'>+</div><div class='add'>+	INIT_LIST_HEAD(&amp;queue-&gt;ent_avail_queue);</div><div class='add'>+	INIT_LIST_HEAD(&amp;queue-&gt;ent_commit_queue);</div><div class='add'>+	INIT_LIST_HEAD(&amp;queue-&gt;ent_w_req_queue);</div><div class='add'>+	INIT_LIST_HEAD(&amp;queue-&gt;ent_in_userspace);</div><div class='add'>+	INIT_LIST_HEAD(&amp;queue-&gt;fuse_req_queue);</div><div class='add'>+	INIT_LIST_HEAD(&amp;queue-&gt;fuse_req_bg_queue);</div><div class='add'>+	INIT_LIST_HEAD(&amp;queue-&gt;ent_released);</div><div class='add'>+</div><div class='add'>+	queue-&gt;fpq.processing = pq;</div><div class='add'>+	fuse_pqueue_init(&amp;queue-&gt;fpq);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fc-&gt;lock);</div><div class='add'>+	if (ring-&gt;queues[qid]) {</div><div class='add'>+		spin_unlock(&amp;fc-&gt;lock);</div><div class='add'>+		kfree(queue-&gt;fpq.processing);</div><div class='add'>+		kfree(queue);</div><div class='add'>+		return ring-&gt;queues[qid];</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * write_once and lock as the caller mostly doesn't take the lock at all</div><div class='add'>+	 */</div><div class='add'>+	WRITE_ONCE(ring-&gt;queues[qid], queue);</div><div class='add'>+	spin_unlock(&amp;fc-&gt;lock);</div><div class='add'>+</div><div class='add'>+	return queue;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fuse_uring_stop_fuse_req_end(struct fuse_req *req)</div><div class='add'>+{</div><div class='add'>+	clear_bit(FR_SENT, &amp;req-&gt;flags);</div><div class='add'>+	req-&gt;out.h.error = -ECONNABORTED;</div><div class='add'>+	fuse_request_end(req);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Release a request/entry on connection tear down</div><div class='add'>+ */</div><div class='add'>+static void fuse_uring_entry_teardown(struct fuse_ring_ent *ent)</div><div class='add'>+{</div><div class='add'>+	struct fuse_req *req;</div><div class='add'>+	struct io_uring_cmd *cmd;</div><div class='add'>+</div><div class='add'>+	struct fuse_ring_queue *queue = ent-&gt;queue;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;queue-&gt;lock);</div><div class='add'>+	cmd = ent-&gt;cmd;</div><div class='add'>+	ent-&gt;cmd = NULL;</div><div class='add'>+	req = ent-&gt;fuse_req;</div><div class='add'>+	ent-&gt;fuse_req = NULL;</div><div class='add'>+	if (req) {</div><div class='add'>+		/* remove entry from queue-&gt;fpq-&gt;processing */</div><div class='add'>+		list_del_init(&amp;req-&gt;list);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The entry must not be freed immediately, due to access of direct</div><div class='add'>+	 * pointer access of entries through IO_URING_F_CANCEL - there is a risk</div><div class='add'>+	 * of race between daemon termination (which triggers IO_URING_F_CANCEL</div><div class='add'>+	 * and accesses entries without checking the list state first</div><div class='add'>+	 */</div><div class='add'>+	list_move(&amp;ent-&gt;list, &amp;queue-&gt;ent_released);</div><div class='add'>+	ent-&gt;state = FRRS_RELEASED;</div><div class='add'>+	spin_unlock(&amp;queue-&gt;lock);</div><div class='add'>+</div><div class='add'>+	if (cmd)</div><div class='add'>+		io_uring_cmd_done(cmd, -ENOTCONN, IO_URING_F_UNLOCKED);</div><div class='add'>+</div><div class='add'>+	if (req)</div><div class='add'>+		fuse_uring_stop_fuse_req_end(req);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fuse_uring_stop_list_entries(struct list_head *head,</div><div class='add'>+					 struct fuse_ring_queue *queue,</div><div class='add'>+					 enum fuse_ring_req_state exp_state)</div><div class='add'>+{</div><div class='add'>+	struct fuse_ring *ring = queue-&gt;ring;</div><div class='add'>+	struct fuse_ring_ent *ent, *next;</div><div class='add'>+	ssize_t queue_refs = SSIZE_MAX;</div><div class='add'>+	LIST_HEAD(to_teardown);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;queue-&gt;lock);</div><div class='add'>+	list_for_each_entry_safe(ent, next, head, list) {</div><div class='add'>+		if (ent-&gt;state != exp_state) {</div><div class='add'>+			pr_warn("entry teardown qid=%d state=%d expected=%d",</div><div class='add'>+				queue-&gt;qid, ent-&gt;state, exp_state);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		ent-&gt;state = FRRS_TEARDOWN;</div><div class='add'>+		list_move(&amp;ent-&gt;list, &amp;to_teardown);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;queue-&gt;lock);</div><div class='add'>+</div><div class='add'>+	/* no queue lock to avoid lock order issues */</div><div class='add'>+	list_for_each_entry_safe(ent, next, &amp;to_teardown, list) {</div><div class='add'>+		fuse_uring_entry_teardown(ent);</div><div class='add'>+		queue_refs = atomic_dec_return(&amp;ring-&gt;queue_refs);</div><div class='add'>+		WARN_ON_ONCE(queue_refs &lt; 0);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fuse_uring_teardown_entries(struct fuse_ring_queue *queue)</div><div class='add'>+{</div><div class='add'>+	fuse_uring_stop_list_entries(&amp;queue-&gt;ent_in_userspace, queue,</div><div class='add'>+				     FRRS_USERSPACE);</div><div class='add'>+	fuse_uring_stop_list_entries(&amp;queue-&gt;ent_avail_queue, queue,</div><div class='add'>+				     FRRS_AVAILABLE);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Log state debug info</div><div class='add'>+ */</div><div class='add'>+static void fuse_uring_log_ent_state(struct fuse_ring *ring)</div><div class='add'>+{</div><div class='add'>+	int qid;</div><div class='add'>+	struct fuse_ring_ent *ent;</div><div class='add'>+</div><div class='add'>+	for (qid = 0; qid &lt; ring-&gt;nr_queues; qid++) {</div><div class='add'>+		struct fuse_ring_queue *queue = ring-&gt;queues[qid];</div><div class='add'>+</div><div class='add'>+		if (!queue)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;queue-&gt;lock);</div><div class='add'>+		/*</div><div class='add'>+		 * Log entries from the intermediate queue, the other queues</div><div class='add'>+		 * should be empty</div><div class='add'>+		 */</div><div class='add'>+		list_for_each_entry(ent, &amp;queue-&gt;ent_w_req_queue, list) {</div><div class='add'>+			pr_info(" ent-req-queue ring=%p qid=%d ent=%p state=%d\n",</div><div class='add'>+				ring, qid, ent, ent-&gt;state);</div><div class='add'>+		}</div><div class='add'>+		list_for_each_entry(ent, &amp;queue-&gt;ent_commit_queue, list) {</div><div class='add'>+			pr_info(" ent-commit-queue ring=%p qid=%d ent=%p state=%d\n",</div><div class='add'>+				ring, qid, ent, ent-&gt;state);</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;queue-&gt;lock);</div><div class='add'>+	}</div><div class='add'>+	ring-&gt;stop_debug_log = 1;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fuse_uring_async_stop_queues(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	int qid;</div><div class='add'>+	struct fuse_ring *ring =</div><div class='add'>+		container_of(work, struct fuse_ring, async_teardown_work.work);</div><div class='add'>+</div><div class='add'>+	/* XXX code dup */</div><div class='add'>+	for (qid = 0; qid &lt; ring-&gt;nr_queues; qid++) {</div><div class='add'>+		struct fuse_ring_queue *queue = READ_ONCE(ring-&gt;queues[qid]);</div><div class='add'>+</div><div class='add'>+		if (!queue)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		fuse_uring_teardown_entries(queue);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Some ring entries might be in the middle of IO operations,</div><div class='add'>+	 * i.e. in process to get handled by file_operations::uring_cmd</div><div class='add'>+	 * or on the way to userspace - we could handle that with conditions in</div><div class='add'>+	 * run time code, but easier/cleaner to have an async tear down handler</div><div class='add'>+	 * If there are still queue references left</div><div class='add'>+	 */</div><div class='add'>+	if (atomic_read(&amp;ring-&gt;queue_refs) &gt; 0) {</div><div class='add'>+		if (time_after(jiffies,</div><div class='add'>+			       ring-&gt;teardown_time + FUSE_URING_TEARDOWN_TIMEOUT))</div><div class='add'>+			fuse_uring_log_ent_state(ring);</div><div class='add'>+</div><div class='add'>+		schedule_delayed_work(&amp;ring-&gt;async_teardown_work,</div><div class='add'>+				      FUSE_URING_TEARDOWN_INTERVAL);</div><div class='add'>+	} else {</div><div class='add'>+		wake_up_all(&amp;ring-&gt;stop_waitq);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Stop the ring queues</div><div class='add'>+ */</div><div class='add'>+void fuse_uring_stop_queues(struct fuse_ring *ring)</div><div class='add'>+{</div><div class='add'>+	int qid;</div><div class='add'>+</div><div class='add'>+	for (qid = 0; qid &lt; ring-&gt;nr_queues; qid++) {</div><div class='add'>+		struct fuse_ring_queue *queue = READ_ONCE(ring-&gt;queues[qid]);</div><div class='add'>+</div><div class='add'>+		if (!queue)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		fuse_uring_teardown_entries(queue);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (atomic_read(&amp;ring-&gt;queue_refs) &gt; 0) {</div><div class='add'>+		ring-&gt;teardown_time = jiffies;</div><div class='add'>+		INIT_DELAYED_WORK(&amp;ring-&gt;async_teardown_work,</div><div class='add'>+				  fuse_uring_async_stop_queues);</div><div class='add'>+		schedule_delayed_work(&amp;ring-&gt;async_teardown_work,</div><div class='add'>+				      FUSE_URING_TEARDOWN_INTERVAL);</div><div class='add'>+	} else {</div><div class='add'>+		wake_up_all(&amp;ring-&gt;stop_waitq);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Handle IO_URING_F_CANCEL, typically should come on daemon termination.</div><div class='add'>+ *</div><div class='add'>+ * Releasing the last entry should trigger fuse_dev_release() if</div><div class='add'>+ * the daemon was terminated</div><div class='add'>+ */</div><div class='add'>+static void fuse_uring_cancel(struct io_uring_cmd *cmd,</div><div class='add'>+			      unsigned int issue_flags)</div><div class='add'>+{</div><div class='add'>+	struct fuse_ring_ent *ent = uring_cmd_to_ring_ent(cmd);</div><div class='add'>+	struct fuse_ring_queue *queue;</div><div class='add'>+	bool need_cmd_done = false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * direct access on ent - it must not be destructed as long as</div><div class='add'>+	 * IO_URING_F_CANCEL might come up</div><div class='add'>+	 */</div><div class='add'>+	queue = ent-&gt;queue;</div><div class='add'>+	spin_lock(&amp;queue-&gt;lock);</div><div class='add'>+	if (ent-&gt;state == FRRS_AVAILABLE) {</div><div class='add'>+		ent-&gt;state = FRRS_USERSPACE;</div><div class='add'>+		list_move_tail(&amp;ent-&gt;list, &amp;queue-&gt;ent_in_userspace);</div><div class='add'>+		need_cmd_done = true;</div><div class='add'>+		ent-&gt;cmd = NULL;</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;queue-&gt;lock);</div><div class='add'>+</div><div class='add'>+	if (need_cmd_done) {</div><div class='add'>+		/* no queue lock to avoid lock order issues */</div><div class='add'>+		io_uring_cmd_done(cmd, -ENOTCONN, issue_flags);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fuse_uring_prepare_cancel(struct io_uring_cmd *cmd, int issue_flags,</div><div class='add'>+				      struct fuse_ring_ent *ring_ent)</div><div class='add'>+{</div><div class='add'>+	uring_cmd_set_ring_ent(cmd, ring_ent);</div><div class='add'>+	io_uring_cmd_mark_cancelable(cmd, issue_flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Checks for errors and stores it into the request</div><div class='add'>+ */</div><div class='add'>+static int fuse_uring_out_header_has_err(struct fuse_out_header *oh,</div><div class='add'>+					 struct fuse_req *req,</div><div class='add'>+					 struct fuse_conn *fc)</div><div class='add'>+{</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = -EINVAL;</div><div class='add'>+	if (oh-&gt;unique == 0) {</div><div class='add'>+		/* Not supported through io-uring yet */</div><div class='add'>+		pr_warn_once("notify through fuse-io-uring not supported\n");</div><div class='add'>+		goto err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (oh-&gt;error &lt;= -ERESTARTSYS || oh-&gt;error &gt; 0)</div><div class='add'>+		goto err;</div><div class='add'>+</div><div class='add'>+	if (oh-&gt;error) {</div><div class='add'>+		err = oh-&gt;error;</div><div class='add'>+		goto err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	err = -ENOENT;</div><div class='add'>+	if ((oh-&gt;unique &amp; ~FUSE_INT_REQ_BIT) != req-&gt;in.h.unique) {</div><div class='add'>+		pr_warn_ratelimited("unique mismatch, expected: %llu got %llu\n",</div><div class='add'>+				    req-&gt;in.h.unique,</div><div class='add'>+				    oh-&gt;unique &amp; ~FUSE_INT_REQ_BIT);</div><div class='add'>+		goto err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Is it an interrupt reply ID?</div><div class='add'>+	 * XXX: Not supported through fuse-io-uring yet, it should not even</div><div class='add'>+	 *      find the request - should not happen.</div><div class='add'>+	 */</div><div class='add'>+	WARN_ON_ONCE(oh-&gt;unique &amp; FUSE_INT_REQ_BIT);</div><div class='add'>+</div><div class='add'>+	err = 0;</div><div class='add'>+err:</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int fuse_uring_copy_from_ring(struct fuse_ring *ring,</div><div class='add'>+				     struct fuse_req *req,</div><div class='add'>+				     struct fuse_ring_ent *ent)</div><div class='add'>+{</div><div class='add'>+	struct fuse_copy_state cs;</div><div class='add'>+	struct fuse_args *args = req-&gt;args;</div><div class='add'>+	struct iov_iter iter;</div><div class='add'>+	int err;</div><div class='add'>+	struct fuse_uring_ent_in_out ring_in_out;</div><div class='add'>+</div><div class='add'>+	err = copy_from_user(&amp;ring_in_out, &amp;ent-&gt;headers-&gt;ring_ent_in_out,</div><div class='add'>+			     sizeof(ring_in_out));</div><div class='add'>+	if (err)</div><div class='add'>+		return -EFAULT;</div><div class='add'>+</div><div class='add'>+	err = import_ubuf(ITER_SOURCE, ent-&gt;payload, ring-&gt;max_payload_sz,</div><div class='add'>+			  &amp;iter);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	fuse_copy_init(&amp;cs, false, &amp;iter);</div><div class='add'>+	cs.is_uring = true;</div><div class='add'>+	cs.req = req;</div><div class='add'>+</div><div class='add'>+	err = fuse_copy_out_args(&amp;cs, args, ring_in_out.payload_sz);</div><div class='add'>+	fuse_copy_finish(&amp;cs);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Copy data from the req to the ring buffer</div><div class='add'>+ */</div><div class='add'>+static int fuse_uring_args_to_ring(struct fuse_ring *ring, struct fuse_req *req,</div><div class='add'>+				   struct fuse_ring_ent *ent)</div><div class='add'>+{</div><div class='add'>+	struct fuse_copy_state cs;</div><div class='add'>+	struct fuse_args *args = req-&gt;args;</div><div class='add'>+	struct fuse_in_arg *in_args = args-&gt;in_args;</div><div class='add'>+	int num_args = args-&gt;in_numargs;</div><div class='add'>+	int err;</div><div class='add'>+	struct iov_iter iter;</div><div class='add'>+	struct fuse_uring_ent_in_out ent_in_out = {</div><div class='add'>+		.flags = 0,</div><div class='add'>+		.commit_id = req-&gt;in.h.unique,</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+	err = import_ubuf(ITER_DEST, ent-&gt;payload, ring-&gt;max_payload_sz, &amp;iter);</div><div class='add'>+	if (err) {</div><div class='add'>+		pr_info_ratelimited("fuse: Import of user buffer failed\n");</div><div class='add'>+		return err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	fuse_copy_init(&amp;cs, true, &amp;iter);</div><div class='add'>+	cs.is_uring = true;</div><div class='add'>+	cs.req = req;</div><div class='add'>+</div><div class='add'>+	if (num_args &gt; 0) {</div><div class='add'>+		/*</div><div class='add'>+		 * Expectation is that the first argument is the per op header.</div><div class='add'>+		 * Some op code have that as zero size.</div><div class='add'>+		 */</div><div class='add'>+		if (args-&gt;in_args[0].size &gt; 0) {</div><div class='add'>+			err = copy_to_user(&amp;ent-&gt;headers-&gt;op_in, in_args-&gt;value,</div><div class='add'>+					   in_args-&gt;size);</div><div class='add'>+			if (err) {</div><div class='add'>+				pr_info_ratelimited(</div><div class='add'>+					"Copying the header failed.\n");</div><div class='add'>+				return -EFAULT;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+		in_args++;</div><div class='add'>+		num_args--;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* copy the payload */</div><div class='add'>+	err = fuse_copy_args(&amp;cs, num_args, args-&gt;in_pages,</div><div class='add'>+			     (struct fuse_arg *)in_args, 0);</div><div class='add'>+	fuse_copy_finish(&amp;cs);</div><div class='add'>+	if (err) {</div><div class='add'>+		pr_info_ratelimited("%s fuse_copy_args failed\n", __func__);</div><div class='add'>+		return err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ent_in_out.payload_sz = cs.ring.copied_sz;</div><div class='add'>+	err = copy_to_user(&amp;ent-&gt;headers-&gt;ring_ent_in_out, &amp;ent_in_out,</div><div class='add'>+			   sizeof(ent_in_out));</div><div class='add'>+	return err ? -EFAULT : 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int fuse_uring_copy_to_ring(struct fuse_ring_ent *ent,</div><div class='add'>+				   struct fuse_req *req)</div><div class='add'>+{</div><div class='add'>+	struct fuse_ring_queue *queue = ent-&gt;queue;</div><div class='add'>+	struct fuse_ring *ring = queue-&gt;ring;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = -EIO;</div><div class='add'>+	if (WARN_ON(ent-&gt;state != FRRS_FUSE_REQ)) {</div><div class='add'>+		pr_err("qid=%d ring-req=%p invalid state %d on send\n",</div><div class='add'>+		       queue-&gt;qid, ent, ent-&gt;state);</div><div class='add'>+		return err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	err = -EINVAL;</div><div class='add'>+	if (WARN_ON(req-&gt;in.h.unique == 0))</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	/* copy the request */</div><div class='add'>+	err = fuse_uring_args_to_ring(ring, req, ent);</div><div class='add'>+	if (unlikely(err)) {</div><div class='add'>+		pr_info_ratelimited("Copy to ring failed: %d\n", err);</div><div class='add'>+		return err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* copy fuse_in_header */</div><div class='add'>+	err = copy_to_user(&amp;ent-&gt;headers-&gt;in_out, &amp;req-&gt;in.h,</div><div class='add'>+			   sizeof(req-&gt;in.h));</div><div class='add'>+	if (err) {</div><div class='add'>+		err = -EFAULT;</div><div class='add'>+		return err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int fuse_uring_prepare_send(struct fuse_ring_ent *ent,</div><div class='add'>+				   struct fuse_req *req)</div><div class='add'>+{</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = fuse_uring_copy_to_ring(ent, req);</div><div class='add'>+	if (!err)</div><div class='add'>+		set_bit(FR_SENT, &amp;req-&gt;flags);</div><div class='add'>+	else</div><div class='add'>+		fuse_uring_req_end(ent, req, err);</div><div class='add'>+</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Write data to the ring buffer and send the request to userspace,</div><div class='add'>+ * userspace will read it</div><div class='add'>+ * This is comparable with classical read(/dev/fuse)</div><div class='add'>+ */</div><div class='add'>+static int fuse_uring_send_next_to_ring(struct fuse_ring_ent *ent,</div><div class='add'>+					struct fuse_req *req,</div><div class='add'>+					unsigned int issue_flags)</div><div class='add'>+{</div><div class='add'>+	struct fuse_ring_queue *queue = ent-&gt;queue;</div><div class='add'>+	int err;</div><div class='add'>+	struct io_uring_cmd *cmd;</div><div class='add'>+</div><div class='add'>+	err = fuse_uring_prepare_send(ent, req);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;queue-&gt;lock);</div><div class='add'>+	cmd = ent-&gt;cmd;</div><div class='add'>+	ent-&gt;cmd = NULL;</div><div class='add'>+	ent-&gt;state = FRRS_USERSPACE;</div><div class='add'>+	list_move_tail(&amp;ent-&gt;list, &amp;queue-&gt;ent_in_userspace);</div><div class='add'>+	spin_unlock(&amp;queue-&gt;lock);</div><div class='add'>+</div><div class='add'>+	io_uring_cmd_done(cmd, 0, issue_flags);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Make a ring entry available for fuse_req assignment</div><div class='add'>+ */</div><div class='add'>+static void fuse_uring_ent_avail(struct fuse_ring_ent *ent,</div><div class='add'>+				 struct fuse_ring_queue *queue)</div><div class='add'>+{</div><div class='add'>+	WARN_ON_ONCE(!ent-&gt;cmd);</div><div class='add'>+	list_move(&amp;ent-&gt;list, &amp;queue-&gt;ent_avail_queue);</div><div class='add'>+	ent-&gt;state = FRRS_AVAILABLE;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Used to find the request on SQE commit */</div><div class='add'>+static void fuse_uring_add_to_pq(struct fuse_ring_ent *ent,</div><div class='add'>+				 struct fuse_req *req)</div><div class='add'>+{</div><div class='add'>+	struct fuse_ring_queue *queue = ent-&gt;queue;</div><div class='add'>+	struct fuse_pqueue *fpq = &amp;queue-&gt;fpq;</div><div class='add'>+	unsigned int hash;</div><div class='add'>+</div><div class='add'>+	req-&gt;ring_entry = ent;</div><div class='add'>+	hash = fuse_req_hash(req-&gt;in.h.unique);</div><div class='add'>+	list_move_tail(&amp;req-&gt;list, &amp;fpq-&gt;processing[hash]);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Assign a fuse queue entry to the given entry</div><div class='add'>+ */</div><div class='add'>+static void fuse_uring_add_req_to_ring_ent(struct fuse_ring_ent *ent,</div><div class='add'>+					   struct fuse_req *req)</div><div class='add'>+{</div><div class='add'>+	struct fuse_ring_queue *queue = ent-&gt;queue;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held(&amp;queue-&gt;lock);</div><div class='add'>+</div><div class='add'>+	if (WARN_ON_ONCE(ent-&gt;state != FRRS_AVAILABLE &amp;&amp;</div><div class='add'>+			 ent-&gt;state != FRRS_COMMIT)) {</div><div class='add'>+		pr_warn("%s qid=%d state=%d\n", __func__, ent-&gt;queue-&gt;qid,</div><div class='add'>+			ent-&gt;state);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	clear_bit(FR_PENDING, &amp;req-&gt;flags);</div><div class='add'>+	ent-&gt;fuse_req = req;</div><div class='add'>+	ent-&gt;state = FRRS_FUSE_REQ;</div><div class='add'>+	list_move_tail(&amp;ent-&gt;list, &amp;queue-&gt;ent_w_req_queue);</div><div class='add'>+	fuse_uring_add_to_pq(ent, req);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Fetch the next fuse request if available */</div><div class='add'>+static struct fuse_req *fuse_uring_ent_assign_req(struct fuse_ring_ent *ent)</div><div class='add'>+	__must_hold(&amp;queue-&gt;lock)</div><div class='add'>+{</div><div class='add'>+	struct fuse_req *req;</div><div class='add'>+	struct fuse_ring_queue *queue = ent-&gt;queue;</div><div class='add'>+	struct list_head *req_queue = &amp;queue-&gt;fuse_req_queue;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held(&amp;queue-&gt;lock);</div><div class='add'>+</div><div class='add'>+	/* get and assign the next entry while it is still holding the lock */</div><div class='add'>+	req = list_first_entry_or_null(req_queue, struct fuse_req, list);</div><div class='add'>+	if (req)</div><div class='add'>+		fuse_uring_add_req_to_ring_ent(ent, req);</div><div class='add'>+</div><div class='add'>+	return req;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Read data from the ring buffer, which user space has written to</div><div class='add'>+ * This is comparible with handling of classical write(/dev/fuse).</div><div class='add'>+ * Also make the ring request available again for new fuse requests.</div><div class='add'>+ */</div><div class='add'>+static void fuse_uring_commit(struct fuse_ring_ent *ent, struct fuse_req *req,</div><div class='add'>+			      unsigned int issue_flags)</div><div class='add'>+{</div><div class='add'>+	struct fuse_ring *ring = ent-&gt;queue-&gt;ring;</div><div class='add'>+	struct fuse_conn *fc = ring-&gt;fc;</div><div class='add'>+	ssize_t err = 0;</div><div class='add'>+</div><div class='add'>+	err = copy_from_user(&amp;req-&gt;out.h, &amp;ent-&gt;headers-&gt;in_out,</div><div class='add'>+			     sizeof(req-&gt;out.h));</div><div class='add'>+	if (err) {</div><div class='add'>+		req-&gt;out.h.error = -EFAULT;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	err = fuse_uring_out_header_has_err(&amp;req-&gt;out.h, req, fc);</div><div class='add'>+	if (err) {</div><div class='add'>+		/* req-&gt;out.h.error already set */</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	err = fuse_uring_copy_from_ring(ring, req, ent);</div><div class='add'>+out:</div><div class='add'>+	fuse_uring_req_end(ent, req, err);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Get the next fuse req and send it</div><div class='add'>+ */</div><div class='add'>+static void fuse_uring_next_fuse_req(struct fuse_ring_ent *ent,</div><div class='add'>+				     struct fuse_ring_queue *queue,</div><div class='add'>+				     unsigned int issue_flags)</div><div class='add'>+{</div><div class='add'>+	int err;</div><div class='add'>+	struct fuse_req *req;</div><div class='add'>+</div><div class='add'>+retry:</div><div class='add'>+	spin_lock(&amp;queue-&gt;lock);</div><div class='add'>+	fuse_uring_ent_avail(ent, queue);</div><div class='add'>+	req = fuse_uring_ent_assign_req(ent);</div><div class='add'>+	spin_unlock(&amp;queue-&gt;lock);</div><div class='add'>+</div><div class='add'>+	if (req) {</div><div class='add'>+		err = fuse_uring_send_next_to_ring(ent, req, issue_flags);</div><div class='add'>+		if (err)</div><div class='add'>+			goto retry;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int fuse_ring_ent_set_commit(struct fuse_ring_ent *ent)</div><div class='add'>+{</div><div class='add'>+	struct fuse_ring_queue *queue = ent-&gt;queue;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held(&amp;queue-&gt;lock);</div><div class='add'>+</div><div class='add'>+	if (WARN_ON_ONCE(ent-&gt;state != FRRS_USERSPACE))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	ent-&gt;state = FRRS_COMMIT;</div><div class='add'>+	list_move(&amp;ent-&gt;list, &amp;queue-&gt;ent_commit_queue);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* FUSE_URING_CMD_COMMIT_AND_FETCH handler */</div><div class='add'>+static int fuse_uring_commit_fetch(struct io_uring_cmd *cmd, int issue_flags,</div><div class='add'>+				   struct fuse_conn *fc)</div><div class='add'>+{</div><div class='add'>+	const struct fuse_uring_cmd_req *cmd_req = io_uring_sqe_cmd(cmd-&gt;sqe);</div><div class='add'>+	struct fuse_ring_ent *ent;</div><div class='add'>+	int err;</div><div class='add'>+	struct fuse_ring *ring = fc-&gt;ring;</div><div class='add'>+	struct fuse_ring_queue *queue;</div><div class='add'>+	uint64_t commit_id = READ_ONCE(cmd_req-&gt;commit_id);</div><div class='add'>+	unsigned int qid = READ_ONCE(cmd_req-&gt;qid);</div><div class='add'>+	struct fuse_pqueue *fpq;</div><div class='add'>+	struct fuse_req *req;</div><div class='add'>+</div><div class='add'>+	err = -ENOTCONN;</div><div class='add'>+	if (!ring)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	if (qid &gt;= ring-&gt;nr_queues)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	queue = ring-&gt;queues[qid];</div><div class='add'>+	if (!queue)</div><div class='add'>+		return err;</div><div class='add'>+	fpq = &amp;queue-&gt;fpq;</div><div class='add'>+</div><div class='add'>+	if (!READ_ONCE(fc-&gt;connected) || READ_ONCE(queue-&gt;stopped))</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;queue-&gt;lock);</div><div class='add'>+	/* Find a request based on the unique ID of the fuse request</div><div class='add'>+	 * This should get revised, as it needs a hash calculation and list</div><div class='add'>+	 * search. And full struct fuse_pqueue is needed (memory overhead).</div><div class='add'>+	 * As well as the link from req to ring_ent.</div><div class='add'>+	 */</div><div class='add'>+	req = fuse_request_find(fpq, commit_id);</div><div class='add'>+	err = -ENOENT;</div><div class='add'>+	if (!req) {</div><div class='add'>+		pr_info("qid=%d commit_id %llu not found\n", queue-&gt;qid,</div><div class='add'>+			commit_id);</div><div class='add'>+		spin_unlock(&amp;queue-&gt;lock);</div><div class='add'>+		return err;</div><div class='add'>+	}</div><div class='add'>+	list_del_init(&amp;req-&gt;list);</div><div class='add'>+	ent = req-&gt;ring_entry;</div><div class='add'>+	req-&gt;ring_entry = NULL;</div><div class='add'>+</div><div class='add'>+	err = fuse_ring_ent_set_commit(ent);</div><div class='add'>+	if (err != 0) {</div><div class='add'>+		pr_info_ratelimited("qid=%d commit_id %llu state %d",</div><div class='add'>+				    queue-&gt;qid, commit_id, ent-&gt;state);</div><div class='add'>+		spin_unlock(&amp;queue-&gt;lock);</div><div class='add'>+		req-&gt;out.h.error = err;</div><div class='add'>+		clear_bit(FR_SENT, &amp;req-&gt;flags);</div><div class='add'>+		fuse_request_end(req);</div><div class='add'>+		return err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ent-&gt;cmd = cmd;</div><div class='add'>+	spin_unlock(&amp;queue-&gt;lock);</div><div class='add'>+</div><div class='add'>+	/* without the queue lock, as other locks are taken */</div><div class='add'>+	fuse_uring_prepare_cancel(cmd, issue_flags, ent);</div><div class='add'>+	fuse_uring_commit(ent, req, issue_flags);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Fetching the next request is absolutely required as queued</div><div class='add'>+	 * fuse requests would otherwise not get processed - committing</div><div class='add'>+	 * and fetching is done in one step vs legacy fuse, which has separated</div><div class='add'>+	 * read (fetch request) and write (commit result).</div><div class='add'>+	 */</div><div class='add'>+	fuse_uring_next_fuse_req(ent, queue, issue_flags);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool is_ring_ready(struct fuse_ring *ring, int current_qid)</div><div class='add'>+{</div><div class='add'>+	int qid;</div><div class='add'>+	struct fuse_ring_queue *queue;</div><div class='add'>+	bool ready = true;</div><div class='add'>+</div><div class='add'>+	for (qid = 0; qid &lt; ring-&gt;nr_queues &amp;&amp; ready; qid++) {</div><div class='add'>+		if (current_qid == qid)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		queue = ring-&gt;queues[qid];</div><div class='add'>+		if (!queue) {</div><div class='add'>+			ready = false;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;queue-&gt;lock);</div><div class='add'>+		if (list_empty(&amp;queue-&gt;ent_avail_queue))</div><div class='add'>+			ready = false;</div><div class='add'>+		spin_unlock(&amp;queue-&gt;lock);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return ready;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * fuse_uring_req_fetch command handling</div><div class='add'>+ */</div><div class='add'>+static void fuse_uring_do_register(struct fuse_ring_ent *ent,</div><div class='add'>+				   struct io_uring_cmd *cmd,</div><div class='add'>+				   unsigned int issue_flags)</div><div class='add'>+{</div><div class='add'>+	struct fuse_ring_queue *queue = ent-&gt;queue;</div><div class='add'>+	struct fuse_ring *ring = queue-&gt;ring;</div><div class='add'>+	struct fuse_conn *fc = ring-&gt;fc;</div><div class='add'>+	struct fuse_iqueue *fiq = &amp;fc-&gt;iq;</div><div class='add'>+</div><div class='add'>+	fuse_uring_prepare_cancel(cmd, issue_flags, ent);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;queue-&gt;lock);</div><div class='add'>+	ent-&gt;cmd = cmd;</div><div class='add'>+	fuse_uring_ent_avail(ent, queue);</div><div class='add'>+	spin_unlock(&amp;queue-&gt;lock);</div><div class='add'>+</div><div class='add'>+	if (!ring-&gt;ready) {</div><div class='add'>+		bool ready = is_ring_ready(ring, queue-&gt;qid);</div><div class='add'>+</div><div class='add'>+		if (ready) {</div><div class='add'>+			WRITE_ONCE(fiq-&gt;ops, &amp;fuse_io_uring_ops);</div><div class='add'>+			WRITE_ONCE(ring-&gt;ready, true);</div><div class='add'>+			wake_up_all(&amp;fc-&gt;blocked_waitq);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * sqe-&gt;addr is a ptr to an iovec array, iov[0] has the headers, iov[1]</div><div class='add'>+ * the payload</div><div class='add'>+ */</div><div class='add'>+static int fuse_uring_get_iovec_from_sqe(const struct io_uring_sqe *sqe,</div><div class='add'>+					 struct iovec iov[FUSE_URING_IOV_SEGS])</div><div class='add'>+{</div><div class='add'>+	struct iovec __user *uiov = u64_to_user_ptr(READ_ONCE(sqe-&gt;addr));</div><div class='add'>+	struct iov_iter iter;</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	if (sqe-&gt;len != FUSE_URING_IOV_SEGS)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Direction for buffer access will actually be READ and WRITE,</div><div class='add'>+	 * using write for the import should include READ access as well.</div><div class='add'>+	 */</div><div class='add'>+	ret = import_iovec(WRITE, uiov, FUSE_URING_IOV_SEGS,</div><div class='add'>+			   FUSE_URING_IOV_SEGS, &amp;iov, &amp;iter);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct fuse_ring_ent *</div><div class='add'>+fuse_uring_create_ring_ent(struct io_uring_cmd *cmd,</div><div class='add'>+			   struct fuse_ring_queue *queue)</div><div class='add'>+{</div><div class='add'>+	struct fuse_ring *ring = queue-&gt;ring;</div><div class='add'>+	struct fuse_ring_ent *ent;</div><div class='add'>+	size_t payload_size;</div><div class='add'>+	struct iovec iov[FUSE_URING_IOV_SEGS];</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = fuse_uring_get_iovec_from_sqe(cmd-&gt;sqe, iov);</div><div class='add'>+	if (err) {</div><div class='add'>+		pr_info_ratelimited("Failed to get iovec from sqe, err=%d\n",</div><div class='add'>+				    err);</div><div class='add'>+		return ERR_PTR(err);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	err = -EINVAL;</div><div class='add'>+	if (iov[0].iov_len &lt; sizeof(struct fuse_uring_req_header)) {</div><div class='add'>+		pr_info_ratelimited("Invalid header len %zu\n", iov[0].iov_len);</div><div class='add'>+		return ERR_PTR(err);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	payload_size = iov[1].iov_len;</div><div class='add'>+	if (payload_size &lt; ring-&gt;max_payload_sz) {</div><div class='add'>+		pr_info_ratelimited("Invalid req payload len %zu\n",</div><div class='add'>+				    payload_size);</div><div class='add'>+		return ERR_PTR(err);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	err = -ENOMEM;</div><div class='add'>+	ent = kzalloc(sizeof(*ent), GFP_KERNEL_ACCOUNT);</div><div class='add'>+	if (!ent)</div><div class='add'>+		return ERR_PTR(err);</div><div class='add'>+</div><div class='add'>+	INIT_LIST_HEAD(&amp;ent-&gt;list);</div><div class='add'>+</div><div class='add'>+	ent-&gt;queue = queue;</div><div class='add'>+	ent-&gt;headers = iov[0].iov_base;</div><div class='add'>+	ent-&gt;payload = iov[1].iov_base;</div><div class='add'>+</div><div class='add'>+	atomic_inc(&amp;ring-&gt;queue_refs);</div><div class='add'>+	return ent;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Register header and payload buffer with the kernel and puts the</div><div class='add'>+ * entry as "ready to get fuse requests" on the queue</div><div class='add'>+ */</div><div class='add'>+static int fuse_uring_register(struct io_uring_cmd *cmd,</div><div class='add'>+			       unsigned int issue_flags, struct fuse_conn *fc)</div><div class='add'>+{</div><div class='add'>+	const struct fuse_uring_cmd_req *cmd_req = io_uring_sqe_cmd(cmd-&gt;sqe);</div><div class='add'>+	struct fuse_ring *ring = smp_load_acquire(&amp;fc-&gt;ring);</div><div class='add'>+	struct fuse_ring_queue *queue;</div><div class='add'>+	struct fuse_ring_ent *ent;</div><div class='add'>+	int err;</div><div class='add'>+	unsigned int qid = READ_ONCE(cmd_req-&gt;qid);</div><div class='add'>+</div><div class='add'>+	err = -ENOMEM;</div><div class='add'>+	if (!ring) {</div><div class='add'>+		ring = fuse_uring_create(fc);</div><div class='add'>+		if (!ring)</div><div class='add'>+			return err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (qid &gt;= ring-&gt;nr_queues) {</div><div class='add'>+		pr_info_ratelimited("fuse: Invalid ring qid %u\n", qid);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	queue = ring-&gt;queues[qid];</div><div class='add'>+	if (!queue) {</div><div class='add'>+		queue = fuse_uring_create_queue(ring, qid);</div><div class='add'>+		if (!queue)</div><div class='add'>+			return err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The created queue above does not need to be destructed in</div><div class='add'>+	 * case of entry errors below, will be done at ring destruction time.</div><div class='add'>+	 */</div><div class='add'>+</div><div class='add'>+	ent = fuse_uring_create_ring_ent(cmd, queue);</div><div class='add'>+	if (IS_ERR(ent))</div><div class='add'>+		return PTR_ERR(ent);</div><div class='add'>+</div><div class='add'>+	fuse_uring_do_register(ent, cmd, issue_flags);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Entry function from io_uring to handle the given passthrough command</div><div class='add'>+ * (op code IORING_OP_URING_CMD)</div><div class='add'>+ */</div><div class='add'>+int fuse_uring_cmd(struct io_uring_cmd *cmd, unsigned int issue_flags)</div><div class='add'>+{</div><div class='add'>+	struct fuse_dev *fud;</div><div class='add'>+	struct fuse_conn *fc;</div><div class='add'>+	u32 cmd_op = cmd-&gt;cmd_op;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	if ((unlikely(issue_flags &amp; IO_URING_F_CANCEL))) {</div><div class='add'>+		fuse_uring_cancel(cmd, issue_flags);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* This extra SQE size holds struct fuse_uring_cmd_req */</div><div class='add'>+	if (!(issue_flags &amp; IO_URING_F_SQE128))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	fud = fuse_get_dev(cmd-&gt;file);</div><div class='add'>+	if (IS_ERR(fud)) {</div><div class='add'>+		pr_info_ratelimited("No fuse device found\n");</div><div class='add'>+		return PTR_ERR(fud);</div><div class='add'>+	}</div><div class='add'>+	fc = fud-&gt;fc;</div><div class='add'>+</div><div class='add'>+	/* Once a connection has io-uring enabled on it, it can't be disabled */</div><div class='add'>+	if (!enable_uring &amp;&amp; !fc-&gt;io_uring) {</div><div class='add'>+		pr_info_ratelimited("fuse-io-uring is disabled\n");</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (fc-&gt;aborted)</div><div class='add'>+		return -ECONNABORTED;</div><div class='add'>+	if (!fc-&gt;connected)</div><div class='add'>+		return -ENOTCONN;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * fuse_uring_register() needs the ring to be initialized,</div><div class='add'>+	 * we need to know the max payload size</div><div class='add'>+	 */</div><div class='add'>+	if (!fc-&gt;initialized)</div><div class='add'>+		return -EAGAIN;</div><div class='add'>+</div><div class='add'>+	switch (cmd_op) {</div><div class='add'>+	case FUSE_IO_URING_CMD_REGISTER:</div><div class='add'>+		err = fuse_uring_register(cmd, issue_flags, fc);</div><div class='add'>+		if (err) {</div><div class='add'>+			pr_info_once("FUSE_IO_URING_CMD_REGISTER failed err=%d\n",</div><div class='add'>+				     err);</div><div class='add'>+			fc-&gt;io_uring = 0;</div><div class='add'>+			wake_up_all(&amp;fc-&gt;blocked_waitq);</div><div class='add'>+			return err;</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='add'>+	case FUSE_IO_URING_CMD_COMMIT_AND_FETCH:</div><div class='add'>+		err = fuse_uring_commit_fetch(cmd, issue_flags, fc);</div><div class='add'>+		if (err) {</div><div class='add'>+			pr_info_once("FUSE_IO_URING_COMMIT_AND_FETCH failed err=%d\n",</div><div class='add'>+				     err);</div><div class='add'>+			return err;</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return -EIOCBQUEUED;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fuse_uring_send(struct fuse_ring_ent *ent, struct io_uring_cmd *cmd,</div><div class='add'>+			    ssize_t ret, unsigned int issue_flags)</div><div class='add'>+{</div><div class='add'>+	struct fuse_ring_queue *queue = ent-&gt;queue;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;queue-&gt;lock);</div><div class='add'>+	ent-&gt;state = FRRS_USERSPACE;</div><div class='add'>+	list_move_tail(&amp;ent-&gt;list, &amp;queue-&gt;ent_in_userspace);</div><div class='add'>+	ent-&gt;cmd = NULL;</div><div class='add'>+	spin_unlock(&amp;queue-&gt;lock);</div><div class='add'>+</div><div class='add'>+	io_uring_cmd_done(cmd, ret, issue_flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * This prepares and sends the ring request in fuse-uring task context.</div><div class='add'>+ * User buffers are not mapped yet - the application does not have permission</div><div class='add'>+ * to write to it - this has to be executed in ring task context.</div><div class='add'>+ */</div><div class='add'>+static void fuse_uring_send_in_task(struct io_tw_req tw_req, io_tw_token_t tw)</div><div class='add'>+{</div><div class='add'>+	unsigned int issue_flags = IO_URING_CMD_TASK_WORK_ISSUE_FLAGS;</div><div class='add'>+	struct io_uring_cmd *cmd = io_uring_cmd_from_tw(tw_req);</div><div class='add'>+	struct fuse_ring_ent *ent = uring_cmd_to_ring_ent(cmd);</div><div class='add'>+	struct fuse_ring_queue *queue = ent-&gt;queue;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	if (!tw.cancel) {</div><div class='add'>+		err = fuse_uring_prepare_send(ent, ent-&gt;fuse_req);</div><div class='add'>+		if (err) {</div><div class='add'>+			fuse_uring_next_fuse_req(ent, queue, issue_flags);</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		err = -ECANCELED;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	fuse_uring_send(ent, cmd, err, issue_flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct fuse_ring_queue *fuse_uring_task_to_queue(struct fuse_ring *ring)</div><div class='add'>+{</div><div class='add'>+	unsigned int qid;</div><div class='add'>+	struct fuse_ring_queue *queue;</div><div class='add'>+</div><div class='add'>+	qid = task_cpu(current);</div><div class='add'>+</div><div class='add'>+	if (WARN_ONCE(qid &gt;= ring-&gt;nr_queues,</div><div class='add'>+		      "Core number (%u) exceeds nr queues (%zu)\n", qid,</div><div class='add'>+		      ring-&gt;nr_queues))</div><div class='add'>+		qid = 0;</div><div class='add'>+</div><div class='add'>+	queue = ring-&gt;queues[qid];</div><div class='add'>+	WARN_ONCE(!queue, "Missing queue for qid %d\n", qid);</div><div class='add'>+</div><div class='add'>+	return queue;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fuse_uring_dispatch_ent(struct fuse_ring_ent *ent)</div><div class='add'>+{</div><div class='add'>+	struct io_uring_cmd *cmd = ent-&gt;cmd;</div><div class='add'>+</div><div class='add'>+	uring_cmd_set_ring_ent(cmd, ent);</div><div class='add'>+	io_uring_cmd_complete_in_task(cmd, fuse_uring_send_in_task);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* queue a fuse request and send it if a ring entry is available */</div><div class='add'>+void fuse_uring_queue_fuse_req(struct fuse_iqueue *fiq, struct fuse_req *req)</div><div class='add'>+{</div><div class='add'>+	struct fuse_conn *fc = req-&gt;fm-&gt;fc;</div><div class='add'>+	struct fuse_ring *ring = fc-&gt;ring;</div><div class='add'>+	struct fuse_ring_queue *queue;</div><div class='add'>+	struct fuse_ring_ent *ent = NULL;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = -EINVAL;</div><div class='add'>+	queue = fuse_uring_task_to_queue(ring);</div><div class='add'>+	if (!queue)</div><div class='add'>+		goto err;</div><div class='add'>+</div><div class='add'>+	fuse_request_assign_unique(fiq, req);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;queue-&gt;lock);</div><div class='add'>+	err = -ENOTCONN;</div><div class='add'>+	if (unlikely(queue-&gt;stopped))</div><div class='add'>+		goto err_unlock;</div><div class='add'>+</div><div class='add'>+	set_bit(FR_URING, &amp;req-&gt;flags);</div><div class='add'>+	req-&gt;ring_queue = queue;</div><div class='add'>+	ent = list_first_entry_or_null(&amp;queue-&gt;ent_avail_queue,</div><div class='add'>+				       struct fuse_ring_ent, list);</div><div class='add'>+	if (ent)</div><div class='add'>+		fuse_uring_add_req_to_ring_ent(ent, req);</div><div class='add'>+	else</div><div class='add'>+		list_add_tail(&amp;req-&gt;list, &amp;queue-&gt;fuse_req_queue);</div><div class='add'>+	spin_unlock(&amp;queue-&gt;lock);</div><div class='add'>+</div><div class='add'>+	if (ent)</div><div class='add'>+		fuse_uring_dispatch_ent(ent);</div><div class='add'>+</div><div class='add'>+	return;</div><div class='add'>+</div><div class='add'>+err_unlock:</div><div class='add'>+	spin_unlock(&amp;queue-&gt;lock);</div><div class='add'>+err:</div><div class='add'>+	req-&gt;out.h.error = err;</div><div class='add'>+	clear_bit(FR_PENDING, &amp;req-&gt;flags);</div><div class='add'>+	fuse_request_end(req);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool fuse_uring_queue_bq_req(struct fuse_req *req)</div><div class='add'>+{</div><div class='add'>+	struct fuse_conn *fc = req-&gt;fm-&gt;fc;</div><div class='add'>+	struct fuse_ring *ring = fc-&gt;ring;</div><div class='add'>+	struct fuse_ring_queue *queue;</div><div class='add'>+	struct fuse_ring_ent *ent = NULL;</div><div class='add'>+</div><div class='add'>+	queue = fuse_uring_task_to_queue(ring);</div><div class='add'>+	if (!queue)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;queue-&gt;lock);</div><div class='add'>+	if (unlikely(queue-&gt;stopped)) {</div><div class='add'>+		spin_unlock(&amp;queue-&gt;lock);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	set_bit(FR_URING, &amp;req-&gt;flags);</div><div class='add'>+	req-&gt;ring_queue = queue;</div><div class='add'>+	list_add_tail(&amp;req-&gt;list, &amp;queue-&gt;fuse_req_bg_queue);</div><div class='add'>+</div><div class='add'>+	ent = list_first_entry_or_null(&amp;queue-&gt;ent_avail_queue,</div><div class='add'>+				       struct fuse_ring_ent, list);</div><div class='add'>+	spin_lock(&amp;fc-&gt;bg_lock);</div><div class='add'>+	fc-&gt;num_background++;</div><div class='add'>+	if (fc-&gt;num_background == fc-&gt;max_background)</div><div class='add'>+		fc-&gt;blocked = 1;</div><div class='add'>+	fuse_uring_flush_bg(queue);</div><div class='add'>+	spin_unlock(&amp;fc-&gt;bg_lock);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Due to bg_queue flush limits there might be other bg requests</div><div class='add'>+	 * in the queue that need to be handled first. Or no further req</div><div class='add'>+	 * might be available.</div><div class='add'>+	 */</div><div class='add'>+	req = list_first_entry_or_null(&amp;queue-&gt;fuse_req_queue, struct fuse_req,</div><div class='add'>+				       list);</div><div class='add'>+	if (ent &amp;&amp; req) {</div><div class='add'>+		fuse_uring_add_req_to_ring_ent(ent, req);</div><div class='add'>+		spin_unlock(&amp;queue-&gt;lock);</div><div class='add'>+</div><div class='add'>+		fuse_uring_dispatch_ent(ent);</div><div class='add'>+	} else {</div><div class='add'>+		spin_unlock(&amp;queue-&gt;lock);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool fuse_uring_remove_pending_req(struct fuse_req *req)</div><div class='add'>+{</div><div class='add'>+	struct fuse_ring_queue *queue = req-&gt;ring_queue;</div><div class='add'>+</div><div class='add'>+	return fuse_remove_pending_req(req, &amp;queue-&gt;lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct fuse_iqueue_ops fuse_io_uring_ops = {</div><div class='add'>+	/* should be send over io-uring as enhancement */</div><div class='add'>+	.send_forget = fuse_dev_queue_forget,</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * could be send over io-uring, but interrupts should be rare,</div><div class='add'>+	 * no need to make the code complex</div><div class='add'>+	 */</div><div class='add'>+	.send_interrupt = fuse_dev_queue_interrupt,</div><div class='add'>+	.send_req = fuse_uring_queue_fuse_req,</div><div class='add'>+};</div><div class='head'>diff --git a/fs/fuse/dev_uring_i.h b/fs/fuse/dev_uring_i.h<br/>new file mode 100644<br/>index 000000000000..51a563922ce1<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fuse/dev_uring_i.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fuse/dev_uring_i.h</a></div><div class='hunk'>@@ -0,0 +1,211 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0</div><div class='add'>+ *</div><div class='add'>+ * FUSE: Filesystem in Userspace</div><div class='add'>+ * Copyright (c) 2023-2024 DataDirect Networks.</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#ifndef _FS_FUSE_DEV_URING_I_H</div><div class='add'>+#define _FS_FUSE_DEV_URING_I_H</div><div class='add'>+</div><div class='add'>+#include "fuse_i.h"</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_FUSE_IO_URING</div><div class='add'>+</div><div class='add'>+#define FUSE_URING_TEARDOWN_TIMEOUT (5 * HZ)</div><div class='add'>+#define FUSE_URING_TEARDOWN_INTERVAL (HZ/20)</div><div class='add'>+</div><div class='add'>+enum fuse_ring_req_state {</div><div class='add'>+	FRRS_INVALID = 0,</div><div class='add'>+</div><div class='add'>+	/* The ring entry received from userspace and it is being processed */</div><div class='add'>+	FRRS_COMMIT,</div><div class='add'>+</div><div class='add'>+	/* The ring entry is waiting for new fuse requests */</div><div class='add'>+	FRRS_AVAILABLE,</div><div class='add'>+</div><div class='add'>+	/* The ring entry got assigned a fuse req */</div><div class='add'>+	FRRS_FUSE_REQ,</div><div class='add'>+</div><div class='add'>+	/* The ring entry is in or on the way to user space */</div><div class='add'>+	FRRS_USERSPACE,</div><div class='add'>+</div><div class='add'>+	/* The ring entry is in teardown */</div><div class='add'>+	FRRS_TEARDOWN,</div><div class='add'>+</div><div class='add'>+	/* The ring entry is released, but not freed yet */</div><div class='add'>+	FRRS_RELEASED,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/** A fuse ring entry, part of the ring queue */</div><div class='add'>+struct fuse_ring_ent {</div><div class='add'>+	/* userspace buffer */</div><div class='add'>+	struct fuse_uring_req_header __user *headers;</div><div class='add'>+	void __user *payload;</div><div class='add'>+</div><div class='add'>+	/* the ring queue that owns the request */</div><div class='add'>+	struct fuse_ring_queue *queue;</div><div class='add'>+</div><div class='add'>+	/* fields below are protected by queue-&gt;lock */</div><div class='add'>+</div><div class='add'>+	struct io_uring_cmd *cmd;</div><div class='add'>+</div><div class='add'>+	struct list_head list;</div><div class='add'>+</div><div class='add'>+	enum fuse_ring_req_state state;</div><div class='add'>+</div><div class='add'>+	struct fuse_req *fuse_req;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct fuse_ring_queue {</div><div class='add'>+	/*</div><div class='add'>+	 * back pointer to the main fuse uring structure that holds this</div><div class='add'>+	 * queue</div><div class='add'>+	 */</div><div class='add'>+	struct fuse_ring *ring;</div><div class='add'>+</div><div class='add'>+	/* queue id, corresponds to the cpu core */</div><div class='add'>+	unsigned int qid;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * queue lock, taken when any value in the queue changes _and_ also</div><div class='add'>+	 * a ring entry state changes.</div><div class='add'>+	 */</div><div class='add'>+	spinlock_t lock;</div><div class='add'>+</div><div class='add'>+	/* available ring entries (struct fuse_ring_ent) */</div><div class='add'>+	struct list_head ent_avail_queue;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * entries in the process of being committed or in the process</div><div class='add'>+	 * to be sent to userspace</div><div class='add'>+	 */</div><div class='add'>+	struct list_head ent_w_req_queue;</div><div class='add'>+	struct list_head ent_commit_queue;</div><div class='add'>+</div><div class='add'>+	/* entries in userspace */</div><div class='add'>+	struct list_head ent_in_userspace;</div><div class='add'>+</div><div class='add'>+	/* entries that are released */</div><div class='add'>+	struct list_head ent_released;</div><div class='add'>+</div><div class='add'>+	/* fuse requests waiting for an entry slot */</div><div class='add'>+	struct list_head fuse_req_queue;</div><div class='add'>+</div><div class='add'>+	/* background fuse requests */</div><div class='add'>+	struct list_head fuse_req_bg_queue;</div><div class='add'>+</div><div class='add'>+	struct fuse_pqueue fpq;</div><div class='add'>+</div><div class='add'>+	unsigned int active_background;</div><div class='add'>+</div><div class='add'>+	bool stopped;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * Describes if uring is for communication and holds alls the data needed</div><div class='add'>+ * for uring communication</div><div class='add'>+ */</div><div class='add'>+struct fuse_ring {</div><div class='add'>+	/* back pointer */</div><div class='add'>+	struct fuse_conn *fc;</div><div class='add'>+</div><div class='add'>+	/* number of ring queues */</div><div class='add'>+	size_t nr_queues;</div><div class='add'>+</div><div class='add'>+	/* maximum payload/arg size */</div><div class='add'>+	size_t max_payload_sz;</div><div class='add'>+</div><div class='add'>+	struct fuse_ring_queue **queues;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Log ring entry states on stop when entries cannot be released</div><div class='add'>+	 */</div><div class='add'>+	unsigned int stop_debug_log : 1;</div><div class='add'>+</div><div class='add'>+	wait_queue_head_t stop_waitq;</div><div class='add'>+</div><div class='add'>+	/* async tear down */</div><div class='add'>+	struct delayed_work async_teardown_work;</div><div class='add'>+</div><div class='add'>+	/* log */</div><div class='add'>+	unsigned long teardown_time;</div><div class='add'>+</div><div class='add'>+	atomic_t queue_refs;</div><div class='add'>+</div><div class='add'>+	bool ready;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+bool fuse_uring_enabled(void);</div><div class='add'>+void fuse_uring_destruct(struct fuse_conn *fc);</div><div class='add'>+void fuse_uring_stop_queues(struct fuse_ring *ring);</div><div class='add'>+void fuse_uring_abort_end_requests(struct fuse_ring *ring);</div><div class='add'>+int fuse_uring_cmd(struct io_uring_cmd *cmd, unsigned int issue_flags);</div><div class='add'>+void fuse_uring_queue_fuse_req(struct fuse_iqueue *fiq, struct fuse_req *req);</div><div class='add'>+bool fuse_uring_queue_bq_req(struct fuse_req *req);</div><div class='add'>+bool fuse_uring_remove_pending_req(struct fuse_req *req);</div><div class='add'>+bool fuse_uring_request_expired(struct fuse_conn *fc);</div><div class='add'>+</div><div class='add'>+static inline void fuse_uring_abort(struct fuse_conn *fc)</div><div class='add'>+{</div><div class='add'>+	struct fuse_ring *ring = fc-&gt;ring;</div><div class='add'>+</div><div class='add'>+	if (ring == NULL)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (atomic_read(&amp;ring-&gt;queue_refs) &gt; 0) {</div><div class='add'>+		fuse_uring_abort_end_requests(ring);</div><div class='add'>+		fuse_uring_stop_queues(ring);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void fuse_uring_wait_stopped_queues(struct fuse_conn *fc)</div><div class='add'>+{</div><div class='add'>+	struct fuse_ring *ring = fc-&gt;ring;</div><div class='add'>+</div><div class='add'>+	if (ring)</div><div class='add'>+		wait_event(ring-&gt;stop_waitq,</div><div class='add'>+			   atomic_read(&amp;ring-&gt;queue_refs) == 0);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool fuse_uring_ready(struct fuse_conn *fc)</div><div class='add'>+{</div><div class='add'>+	return fc-&gt;ring &amp;&amp; fc-&gt;ring-&gt;ready;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#else /* CONFIG_FUSE_IO_URING */</div><div class='add'>+</div><div class='add'>+static inline void fuse_uring_destruct(struct fuse_conn *fc)</div><div class='add'>+{</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool fuse_uring_enabled(void)</div><div class='add'>+{</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void fuse_uring_abort(struct fuse_conn *fc)</div><div class='add'>+{</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void fuse_uring_wait_stopped_queues(struct fuse_conn *fc)</div><div class='add'>+{</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool fuse_uring_ready(struct fuse_conn *fc)</div><div class='add'>+{</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool fuse_uring_remove_pending_req(struct fuse_req *req)</div><div class='add'>+{</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool fuse_uring_request_expired(struct fuse_conn *fc)</div><div class='add'>+{</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#endif /* CONFIG_FUSE_IO_URING */</div><div class='add'>+</div><div class='add'>+#endif /* _FS_FUSE_DEV_URING_I_H */</div><div class='head'>diff --git a/fs/fuse/dir.c b/fs/fuse/dir.c<br/>index 0654bfedcbb0..4b6b3d2758ff 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fuse/dir.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/dir.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fuse/dir.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fuse/dir.c</a></div><div class='hunk'>@@ -11,12 +11,82 @@</div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='ctx'> #include &lt;linux/file.h&gt;</div><div class='ctx'> #include &lt;linux/fs_context.h&gt;</div><div class='add'>+#include &lt;linux/moduleparam.h&gt;</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='ctx'> #include &lt;linux/namei.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/xattr.h&gt;</div><div class='ctx'> #include &lt;linux/iversion.h&gt;</div><div class='ctx'> #include &lt;linux/posix_acl.h&gt;</div><div class='add'>+#include &lt;linux/security.h&gt;</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+#include &lt;linux/kernel.h&gt;</div><div class='add'>+</div><div class='add'>+static bool __read_mostly allow_sys_admin_access;</div><div class='add'>+module_param(allow_sys_admin_access, bool, 0644);</div><div class='add'>+MODULE_PARM_DESC(allow_sys_admin_access,</div><div class='add'>+		 "Allow users with CAP_SYS_ADMIN in initial userns to bypass allow_other access check");</div><div class='add'>+</div><div class='add'>+struct dentry_bucket {</div><div class='add'>+	struct rb_root tree;</div><div class='add'>+	spinlock_t lock;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+#define HASH_BITS	5</div><div class='add'>+#define HASH_SIZE	(1 &lt;&lt; HASH_BITS)</div><div class='add'>+static struct dentry_bucket dentry_hash[HASH_SIZE];</div><div class='add'>+struct delayed_work dentry_tree_work;</div><div class='add'>+</div><div class='add'>+/* Minimum invalidation work queue frequency */</div><div class='add'>+#define FUSE_DENTRY_INVAL_FREQ_MIN 5</div><div class='add'>+</div><div class='add'>+unsigned __read_mostly inval_wq;</div><div class='add'>+static int inval_wq_set(const char *val, const struct kernel_param *kp)</div><div class='add'>+{</div><div class='add'>+	unsigned int num;</div><div class='add'>+	unsigned int old = inval_wq;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (!val)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	ret = kstrtouint(val, 0, &amp;num);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	if ((num &lt; FUSE_DENTRY_INVAL_FREQ_MIN) &amp;&amp; (num != 0))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	/* This should prevent overflow in secs_to_jiffies() */</div><div class='add'>+	if (num &gt; USHRT_MAX)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	*((unsigned int *)kp-&gt;arg) = num;</div><div class='add'>+</div><div class='add'>+	if (num &amp;&amp; !old)</div><div class='add'>+		schedule_delayed_work(&amp;dentry_tree_work,</div><div class='add'>+				      secs_to_jiffies(num));</div><div class='add'>+	else if (!num &amp;&amp; old)</div><div class='add'>+		cancel_delayed_work_sync(&amp;dentry_tree_work);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+static const struct kernel_param_ops inval_wq_ops = {</div><div class='add'>+	.set = inval_wq_set,</div><div class='add'>+	.get = param_get_uint,</div><div class='add'>+};</div><div class='add'>+module_param_cb(inval_wq, &amp;inval_wq_ops, &amp;inval_wq, 0644);</div><div class='add'>+__MODULE_PARM_TYPE(inval_wq, "uint");</div><div class='add'>+MODULE_PARM_DESC(inval_wq,</div><div class='add'>+		 "Dentries invalidation work queue period in secs (&gt;= "</div><div class='add'>+		 __stringify(FUSE_DENTRY_INVAL_FREQ_MIN) ").");</div><div class='add'>+</div><div class='add'>+static inline struct dentry_bucket *get_dentry_bucket(struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	int i = hash_ptr(dentry, HASH_BITS);</div><div class='add'>+</div><div class='add'>+	return &amp;dentry_hash[i];</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> static void fuse_advise_use_readdirplus(struct inode *dir)</div><div class='ctx'> {</div><div class='hunk'>@@ -25,33 +95,151 @@ static void fuse_advise_use_readdirplus(struct inode *dir)</div><div class='ctx'> 	set_bit(FUSE_I_ADVISE_RDPLUS, &amp;fi-&gt;state);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#if BITS_PER_LONG &gt;= 64</div><div class='del'>-static inline void __fuse_dentry_settime(struct dentry *entry, u64 time)</div><div class='add'>+struct fuse_dentry {</div><div class='add'>+	u64 time;</div><div class='add'>+	union {</div><div class='add'>+		struct rcu_head rcu;</div><div class='add'>+		struct rb_node node;</div><div class='add'>+	};</div><div class='add'>+	struct dentry *dentry;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static void __fuse_dentry_tree_del_node(struct fuse_dentry *fd,</div><div class='add'>+					struct dentry_bucket *bucket)</div><div class='ctx'> {</div><div class='del'>-	entry-&gt;d_fsdata = (void *) time;</div><div class='add'>+	if (!RB_EMPTY_NODE(&amp;fd-&gt;node)) {</div><div class='add'>+		rb_erase(&amp;fd-&gt;node, &amp;bucket-&gt;tree);</div><div class='add'>+		RB_CLEAR_NODE(&amp;fd-&gt;node);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u64 fuse_dentry_time(const struct dentry *entry)</div><div class='add'>+static void fuse_dentry_tree_del_node(struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	return (u64)entry-&gt;d_fsdata;</div><div class='add'>+	struct fuse_dentry *fd = dentry-&gt;d_fsdata;</div><div class='add'>+	struct dentry_bucket *bucket = get_dentry_bucket(dentry);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;bucket-&gt;lock);</div><div class='add'>+	__fuse_dentry_tree_del_node(fd, bucket);</div><div class='add'>+	spin_unlock(&amp;bucket-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#else</div><div class='del'>-union fuse_dentry {</div><div class='del'>-	u64 time;</div><div class='del'>-	struct rcu_head rcu;</div><div class='del'>-};</div><div class='add'>+static void fuse_dentry_tree_add_node(struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	struct fuse_dentry *fd = dentry-&gt;d_fsdata;</div><div class='add'>+	struct dentry_bucket *bucket;</div><div class='add'>+	struct fuse_dentry *cur;</div><div class='add'>+	struct rb_node **p, *parent = NULL;</div><div class='add'>+</div><div class='add'>+	if (!inval_wq)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	bucket = get_dentry_bucket(dentry);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;bucket-&gt;lock);</div><div class='add'>+</div><div class='add'>+	__fuse_dentry_tree_del_node(fd, bucket);</div><div class='add'>+</div><div class='add'>+	p = &amp;bucket-&gt;tree.rb_node;</div><div class='add'>+	while (*p) {</div><div class='add'>+		parent = *p;</div><div class='add'>+		cur = rb_entry(*p, struct fuse_dentry, node);</div><div class='add'>+		if (fd-&gt;time &lt; cur-&gt;time)</div><div class='add'>+			p = &amp;(*p)-&gt;rb_left;</div><div class='add'>+		else</div><div class='add'>+			p = &amp;(*p)-&gt;rb_right;</div><div class='add'>+	}</div><div class='add'>+	rb_link_node(&amp;fd-&gt;node, parent, p);</div><div class='add'>+	rb_insert_color(&amp;fd-&gt;node, &amp;bucket-&gt;tree);</div><div class='add'>+	spin_unlock(&amp;bucket-&gt;lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * work queue which, when enabled, will periodically check for expired dentries</div><div class='add'>+ * in the dentries tree.</div><div class='add'>+ */</div><div class='add'>+static void fuse_dentry_tree_work(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	LIST_HEAD(dispose);</div><div class='add'>+	struct fuse_dentry *fd;</div><div class='add'>+	struct rb_node *node;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; HASH_SIZE; i++) {</div><div class='add'>+		spin_lock(&amp;dentry_hash[i].lock);</div><div class='add'>+		node = rb_first(&amp;dentry_hash[i].tree);</div><div class='add'>+		while (node) {</div><div class='add'>+			fd = rb_entry(node, struct fuse_dentry, node);</div><div class='add'>+			if (time_after64(get_jiffies_64(), fd-&gt;time)) {</div><div class='add'>+				rb_erase(&amp;fd-&gt;node, &amp;dentry_hash[i].tree);</div><div class='add'>+				RB_CLEAR_NODE(&amp;fd-&gt;node);</div><div class='add'>+				spin_unlock(&amp;dentry_hash[i].lock);</div><div class='add'>+				d_dispose_if_unused(fd-&gt;dentry, &amp;dispose);</div><div class='add'>+				cond_resched();</div><div class='add'>+				spin_lock(&amp;dentry_hash[i].lock);</div><div class='add'>+			} else</div><div class='add'>+				break;</div><div class='add'>+			node = rb_first(&amp;dentry_hash[i].tree);</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;dentry_hash[i].lock);</div><div class='add'>+		shrink_dentry_list(&amp;dispose);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (inval_wq)</div><div class='add'>+		schedule_delayed_work(&amp;dentry_tree_work,</div><div class='add'>+				      secs_to_jiffies(inval_wq));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void fuse_epoch_work(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct fuse_conn *fc = container_of(work, struct fuse_conn,</div><div class='add'>+					    epoch_work);</div><div class='add'>+	struct fuse_mount *fm;</div><div class='add'>+	struct inode *inode;</div><div class='add'>+</div><div class='add'>+	down_read(&amp;fc-&gt;killsb);</div><div class='add'>+</div><div class='add'>+	inode = fuse_ilookup(fc, FUSE_ROOT_ID, &amp;fm);</div><div class='add'>+	if (inode) {</div><div class='add'>+		iput(inode);</div><div class='add'>+		/* Remove all possible active references to cached inodes */</div><div class='add'>+		shrink_dcache_sb(fm-&gt;sb);</div><div class='add'>+	} else</div><div class='add'>+		pr_warn("Failed to get root inode");</div><div class='add'>+</div><div class='add'>+	up_read(&amp;fc-&gt;killsb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void fuse_dentry_tree_init(void)</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; HASH_SIZE; i++) {</div><div class='add'>+		spin_lock_init(&amp;dentry_hash[i].lock);</div><div class='add'>+		dentry_hash[i].tree = RB_ROOT;</div><div class='add'>+	}</div><div class='add'>+	INIT_DELAYED_WORK(&amp;dentry_tree_work, fuse_dentry_tree_work);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void fuse_dentry_tree_cleanup(void)</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	inval_wq = 0;</div><div class='add'>+	cancel_delayed_work_sync(&amp;dentry_tree_work);</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; HASH_SIZE; i++)</div><div class='add'>+		WARN_ON_ONCE(!RB_EMPTY_ROOT(&amp;dentry_hash[i].tree));</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> static inline void __fuse_dentry_settime(struct dentry *dentry, u64 time)</div><div class='ctx'> {</div><div class='del'>-	((union fuse_dentry *) dentry-&gt;d_fsdata)-&gt;time = time;</div><div class='add'>+	((struct fuse_dentry *) dentry-&gt;d_fsdata)-&gt;time = time;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline u64 fuse_dentry_time(const struct dentry *entry)</div><div class='ctx'> {</div><div class='del'>-	return ((union fuse_dentry *) entry-&gt;d_fsdata)-&gt;time;</div><div class='add'>+	return ((struct fuse_dentry *) entry-&gt;d_fsdata)-&gt;time;</div><div class='ctx'> }</div><div class='del'>-#endif</div><div class='ctx'> </div><div class='ctx'> static void fuse_dentry_settime(struct dentry *dentry, u64 time)</div><div class='ctx'> {</div><div class='hunk'>@@ -72,6 +260,7 @@ static void fuse_dentry_settime(struct dentry *dentry, u64 time)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	__fuse_dentry_settime(dentry, time);</div><div class='add'>+	fuse_dentry_tree_add_node(dentry);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -83,7 +272,7 @@ static void fuse_dentry_settime(struct dentry *dentry, u64 time)</div><div class='ctx'> /*</div><div class='ctx'>  * Calculate the time in jiffies until a dentry/attributes are valid</div><div class='ctx'>  */</div><div class='del'>-static u64 time_to_jiffies(u64 sec, u32 nsec)</div><div class='add'>+u64 fuse_time_to_jiffies(u64 sec, u32 nsec)</div><div class='ctx'> {</div><div class='ctx'> 	if (sec || nsec) {</div><div class='ctx'> 		struct timespec64 ts = {</div><div class='hunk'>@@ -103,17 +292,7 @@ static u64 time_to_jiffies(u64 sec, u32 nsec)</div><div class='ctx'> void fuse_change_entry_timeout(struct dentry *entry, struct fuse_entry_out *o)</div><div class='ctx'> {</div><div class='ctx'> 	fuse_dentry_settime(entry,</div><div class='del'>-		time_to_jiffies(o-&gt;entry_valid, o-&gt;entry_valid_nsec));</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static u64 attr_timeout(struct fuse_attr_out *o)</div><div class='del'>-{</div><div class='del'>-	return time_to_jiffies(o-&gt;attr_valid, o-&gt;attr_valid_nsec);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-u64 entry_attr_timeout(struct fuse_entry_out *o)</div><div class='del'>-{</div><div class='del'>-	return time_to_jiffies(o-&gt;attr_valid, o-&gt;attr_valid_nsec);</div><div class='add'>+		fuse_time_to_jiffies(o-&gt;entry_valid, o-&gt;entry_valid_nsec));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void fuse_invalidate_attr_mask(struct inode *inode, u32 mask)</div><div class='hunk'>@@ -136,7 +315,7 @@ static void fuse_dir_changed(struct inode *dir)</div><div class='ctx'> 	inode_maybe_inc_iversion(dir, false);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='add'>+/*</div><div class='ctx'>  * Mark the attributes as stale due to an atime change.  Avoid the invalidate if</div><div class='ctx'>  * atime is not used.</div><div class='ctx'>  */</div><div class='hunk'>@@ -176,9 +355,12 @@ static void fuse_lookup_init(struct fuse_conn *fc, struct fuse_args *args,</div><div class='ctx'> 	memset(outarg, 0, sizeof(struct fuse_entry_out));</div><div class='ctx'> 	args-&gt;opcode = FUSE_LOOKUP;</div><div class='ctx'> 	args-&gt;nodeid = nodeid;</div><div class='del'>-	args-&gt;in_numargs = 1;</div><div class='del'>-	args-&gt;in_args[0].size = name-&gt;len + 1;</div><div class='del'>-	args-&gt;in_args[0].value = name-&gt;name;</div><div class='add'>+	args-&gt;in_numargs = 3;</div><div class='add'>+	fuse_set_zero_arg0(args);</div><div class='add'>+	args-&gt;in_args[1].size = name-&gt;len;</div><div class='add'>+	args-&gt;in_args[1].value = name-&gt;name;</div><div class='add'>+	args-&gt;in_args[2].size = 1;</div><div class='add'>+	args-&gt;in_args[2].value = "";</div><div class='ctx'> 	args-&gt;out_numargs = 1;</div><div class='ctx'> 	args-&gt;out_args[0].size = sizeof(struct fuse_entry_out);</div><div class='ctx'> 	args-&gt;out_args[0].value = outarg;</div><div class='hunk'>@@ -193,19 +375,24 @@ static void fuse_lookup_init(struct fuse_conn *fc, struct fuse_args *args,</div><div class='ctx'>  * the lookup once more.  If the lookup results in the same inode,</div><div class='ctx'>  * then refresh the attributes, timeouts and mark the dentry valid.</div><div class='ctx'>  */</div><div class='del'>-static int fuse_dentry_revalidate(struct dentry *entry, unsigned int flags)</div><div class='add'>+static int fuse_dentry_revalidate(struct inode *dir, const struct qstr *name,</div><div class='add'>+				  struct dentry *entry, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='del'>-	struct dentry *parent;</div><div class='ctx'> 	struct fuse_mount *fm;</div><div class='add'>+	struct fuse_conn *fc;</div><div class='ctx'> 	struct fuse_inode *fi;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='add'>+	fc = get_fuse_conn_super(dir-&gt;i_sb);</div><div class='add'>+	if (entry-&gt;d_time &lt; atomic_read(&amp;fc-&gt;epoch))</div><div class='add'>+		goto invalid;</div><div class='add'>+</div><div class='ctx'> 	inode = d_inode_rcu(entry);</div><div class='ctx'> 	if (inode &amp;&amp; fuse_is_bad(inode))</div><div class='ctx'> 		goto invalid;</div><div class='ctx'> 	else if (time_before64(fuse_dentry_time(entry), get_jiffies_64()) ||</div><div class='del'>-		 (flags &amp; (LOOKUP_EXCL | LOOKUP_REVAL))) {</div><div class='add'>+		 (flags &amp; (LOOKUP_EXCL | LOOKUP_REVAL | LOOKUP_RENAME_TARGET))) {</div><div class='ctx'> 		struct fuse_entry_out outarg;</div><div class='ctx'> 		FUSE_ARGS(args);</div><div class='ctx'> 		struct fuse_forget_link *forget;</div><div class='hunk'>@@ -228,11 +415,9 @@ static int fuse_dentry_revalidate(struct dentry *entry, unsigned int flags)</div><div class='ctx'> </div><div class='ctx'> 		attr_version = fuse_get_attr_version(fm-&gt;fc);</div><div class='ctx'> </div><div class='del'>-		parent = dget_parent(entry);</div><div class='del'>-		fuse_lookup_init(fm-&gt;fc, &amp;args, get_node_id(d_inode(parent)),</div><div class='del'>-				 &amp;entry-&gt;d_name, &amp;outarg);</div><div class='add'>+		fuse_lookup_init(fm-&gt;fc, &amp;args, get_node_id(dir),</div><div class='add'>+				 name, &amp;outarg);</div><div class='ctx'> 		ret = fuse_simple_request(fm, &amp;args);</div><div class='del'>-		dput(parent);</div><div class='ctx'> 		/* Zero nodeid is same as -ENOENT */</div><div class='ctx'> 		if (!ret &amp;&amp; !outarg.nodeid)</div><div class='ctx'> 			ret = -ENOENT;</div><div class='hunk'>@@ -249,15 +434,15 @@ static int fuse_dentry_revalidate(struct dentry *entry, unsigned int flags)</div><div class='ctx'> 			spin_unlock(&amp;fi-&gt;lock);</div><div class='ctx'> 		}</div><div class='ctx'> 		kfree(forget);</div><div class='del'>-		if (ret == -ENOMEM)</div><div class='add'>+		if (ret == -ENOMEM || ret == -EINTR)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		if (ret || fuse_invalid_attr(&amp;outarg.attr) ||</div><div class='ctx'> 		    fuse_stale_inode(inode, outarg.generation, &amp;outarg.attr))</div><div class='ctx'> 			goto invalid;</div><div class='ctx'> </div><div class='ctx'> 		forget_all_cached_acls(inode);</div><div class='del'>-		fuse_change_attributes(inode, &amp;outarg.attr,</div><div class='del'>-				       entry_attr_timeout(&amp;outarg),</div><div class='add'>+		fuse_change_attributes(inode, &amp;outarg.attr, NULL,</div><div class='add'>+				       ATTR_TIMEOUT(&amp;outarg),</div><div class='ctx'> 				       attr_version);</div><div class='ctx'> 		fuse_change_entry_timeout(entry, &amp;outarg);</div><div class='ctx'> 	} else if (inode) {</div><div class='hunk'>@@ -266,9 +451,7 @@ static int fuse_dentry_revalidate(struct dentry *entry, unsigned int flags)</div><div class='ctx'> 			if (test_bit(FUSE_I_INIT_RDPLUS, &amp;fi-&gt;state))</div><div class='ctx'> 				return -ECHILD;</div><div class='ctx'> 		} else if (test_and_clear_bit(FUSE_I_INIT_RDPLUS, &amp;fi-&gt;state)) {</div><div class='del'>-			parent = dget_parent(entry);</div><div class='del'>-			fuse_advise_use_readdirplus(d_inode(parent));</div><div class='del'>-			dput(parent);</div><div class='add'>+			fuse_advise_use_readdirplus(dir);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	ret = 1;</div><div class='hunk'>@@ -280,21 +463,36 @@ invalid:</div><div class='ctx'> 	goto out;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#if BITS_PER_LONG &lt; 64</div><div class='ctx'> static int fuse_dentry_init(struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	dentry-&gt;d_fsdata = kzalloc(sizeof(union fuse_dentry),</div><div class='del'>-				   GFP_KERNEL_ACCOUNT | __GFP_RECLAIMABLE);</div><div class='add'>+	struct fuse_dentry *fd;</div><div class='ctx'> </div><div class='del'>-	return dentry-&gt;d_fsdata ? 0 : -ENOMEM;</div><div class='add'>+	fd = kzalloc(sizeof(struct fuse_dentry),</div><div class='add'>+			  GFP_KERNEL_ACCOUNT | __GFP_RECLAIMABLE);</div><div class='add'>+	if (!fd)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	fd-&gt;dentry = dentry;</div><div class='add'>+	RB_CLEAR_NODE(&amp;fd-&gt;node);</div><div class='add'>+	dentry-&gt;d_fsdata = fd;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fuse_dentry_prune(struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	struct fuse_dentry *fd = dentry-&gt;d_fsdata;</div><div class='add'>+</div><div class='add'>+	if (!RB_EMPTY_NODE(&amp;fd-&gt;node))</div><div class='add'>+		fuse_dentry_tree_del_node(dentry);</div><div class='ctx'> }</div><div class='add'>+</div><div class='ctx'> static void fuse_dentry_release(struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	union fuse_dentry *fd = dentry-&gt;d_fsdata;</div><div class='add'>+	struct fuse_dentry *fd = dentry-&gt;d_fsdata;</div><div class='ctx'> </div><div class='ctx'> 	kfree_rcu(fd, rcu);</div><div class='ctx'> }</div><div class='del'>-#endif</div><div class='ctx'> </div><div class='ctx'> static int fuse_dentry_delete(const struct dentry *dentry)</div><div class='ctx'> {</div><div class='hunk'>@@ -321,9 +519,6 @@ static struct vfsmount *fuse_dentry_automount(struct path *path)</div><div class='ctx'> </div><div class='ctx'> 	/* Create the submount */</div><div class='ctx'> 	mnt = fc_mount(fsc);</div><div class='del'>-	if (!IS_ERR(mnt))</div><div class='del'>-		mntget(mnt);</div><div class='del'>-</div><div class='ctx'> 	put_fs_context(fsc);</div><div class='ctx'> 	return mnt;</div><div class='ctx'> }</div><div class='hunk'>@@ -331,30 +526,26 @@ static struct vfsmount *fuse_dentry_automount(struct path *path)</div><div class='ctx'> const struct dentry_operations fuse_dentry_operations = {</div><div class='ctx'> 	.d_revalidate	= fuse_dentry_revalidate,</div><div class='ctx'> 	.d_delete	= fuse_dentry_delete,</div><div class='del'>-#if BITS_PER_LONG &lt; 64</div><div class='ctx'> 	.d_init		= fuse_dentry_init,</div><div class='add'>+	.d_prune	= fuse_dentry_prune,</div><div class='ctx'> 	.d_release	= fuse_dentry_release,</div><div class='del'>-#endif</div><div class='ctx'> 	.d_automount	= fuse_dentry_automount,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-const struct dentry_operations fuse_root_dentry_operations = {</div><div class='del'>-#if BITS_PER_LONG &lt; 64</div><div class='del'>-	.d_init		= fuse_dentry_init,</div><div class='del'>-	.d_release	= fuse_dentry_release,</div><div class='del'>-#endif</div><div class='del'>-};</div><div class='del'>-</div><div class='ctx'> int fuse_valid_type(int m)</div><div class='ctx'> {</div><div class='ctx'> 	return S_ISREG(m) || S_ISDIR(m) || S_ISLNK(m) || S_ISCHR(m) ||</div><div class='ctx'> 		S_ISBLK(m) || S_ISFIFO(m) || S_ISSOCK(m);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool fuse_valid_size(u64 size)</div><div class='add'>+{</div><div class='add'>+	return size &lt;= LLONG_MAX;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> bool fuse_invalid_attr(struct fuse_attr *attr)</div><div class='ctx'> {</div><div class='del'>-	return !fuse_valid_type(attr-&gt;mode) ||</div><div class='del'>-		attr-&gt;size &gt; LLONG_MAX;</div><div class='add'>+	return !fuse_valid_type(attr-&gt;mode) || !fuse_valid_size(attr-&gt;size);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int fuse_lookup_name(struct super_block *sb, u64 nodeid, const struct qstr *name,</div><div class='hunk'>@@ -363,12 +554,12 @@ int fuse_lookup_name(struct super_block *sb, u64 nodeid, const struct qstr *name</div><div class='ctx'> 	struct fuse_mount *fm = get_fuse_mount_super(sb);</div><div class='ctx'> 	FUSE_ARGS(args);</div><div class='ctx'> 	struct fuse_forget_link *forget;</div><div class='del'>-	u64 attr_version;</div><div class='add'>+	u64 attr_version, evict_ctr;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	*inode = NULL;</div><div class='ctx'> 	err = -ENAMETOOLONG;</div><div class='del'>-	if (name-&gt;len &gt; FUSE_NAME_MAX)</div><div class='add'>+	if (name-&gt;len &gt; fm-&gt;fc-&gt;name_max)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> </div><div class='hunk'>@@ -378,6 +569,7 @@ int fuse_lookup_name(struct super_block *sb, u64 nodeid, const struct qstr *name</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	attr_version = fuse_get_attr_version(fm-&gt;fc);</div><div class='add'>+	evict_ctr = fuse_get_evict_ctr(fm-&gt;fc);</div><div class='ctx'> </div><div class='ctx'> 	fuse_lookup_init(fm-&gt;fc, &amp;args, nodeid, name, outarg);</div><div class='ctx'> 	err = fuse_simple_request(fm, &amp;args);</div><div class='hunk'>@@ -386,14 +578,16 @@ int fuse_lookup_name(struct super_block *sb, u64 nodeid, const struct qstr *name</div><div class='ctx'> 		goto out_put_forget;</div><div class='ctx'> </div><div class='ctx'> 	err = -EIO;</div><div class='del'>-	if (!outarg-&gt;nodeid)</div><div class='del'>-		goto out_put_forget;</div><div class='ctx'> 	if (fuse_invalid_attr(&amp;outarg-&gt;attr))</div><div class='ctx'> 		goto out_put_forget;</div><div class='add'>+	if (outarg-&gt;nodeid == FUSE_ROOT_ID &amp;&amp; outarg-&gt;generation != 0) {</div><div class='add'>+		pr_warn_once("root generation should be zero\n");</div><div class='add'>+		outarg-&gt;generation = 0;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	*inode = fuse_iget(sb, outarg-&gt;nodeid, outarg-&gt;generation,</div><div class='del'>-			   &amp;outarg-&gt;attr, entry_attr_timeout(outarg),</div><div class='del'>-			   attr_version);</div><div class='add'>+			   &amp;outarg-&gt;attr, ATTR_TIMEOUT(outarg),</div><div class='add'>+			   attr_version, evict_ctr);</div><div class='ctx'> 	err = -ENOMEM;</div><div class='ctx'> 	if (!*inode) {</div><div class='ctx'> 		fuse_queue_forget(fm-&gt;fc, forget, outarg-&gt;nodeid, 1);</div><div class='hunk'>@@ -410,16 +604,20 @@ int fuse_lookup_name(struct super_block *sb, u64 nodeid, const struct qstr *name</div><div class='ctx'> static struct dentry *fuse_lookup(struct inode *dir, struct dentry *entry,</div><div class='ctx'> 				  unsigned int flags)</div><div class='ctx'> {</div><div class='del'>-	int err;</div><div class='ctx'> 	struct fuse_entry_out outarg;</div><div class='add'>+	struct fuse_conn *fc;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct dentry *newent;</div><div class='add'>+	int err, epoch;</div><div class='ctx'> 	bool outarg_valid = true;</div><div class='ctx'> 	bool locked;</div><div class='ctx'> </div><div class='ctx'> 	if (fuse_is_bad(dir))</div><div class='ctx'> 		return ERR_PTR(-EIO);</div><div class='ctx'> </div><div class='add'>+	fc = get_fuse_conn_super(dir-&gt;i_sb);</div><div class='add'>+	epoch = atomic_read(&amp;fc-&gt;epoch);</div><div class='add'>+</div><div class='ctx'> 	locked = fuse_lock_inode(dir);</div><div class='ctx'> 	err = fuse_lookup_name(dir-&gt;i_sb, get_node_id(dir), &amp;entry-&gt;d_name,</div><div class='ctx'> 			       &amp;outarg, &amp;inode);</div><div class='hunk'>@@ -441,6 +639,7 @@ static struct dentry *fuse_lookup(struct inode *dir, struct dentry *entry,</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> </div><div class='ctx'> 	entry = newent ? newent : entry;</div><div class='add'>+	entry-&gt;d_time = epoch;</div><div class='ctx'> 	if (outarg_valid)</div><div class='ctx'> 		fuse_change_entry_timeout(entry, &amp;outarg);</div><div class='ctx'> 	else</div><div class='hunk'>@@ -456,37 +655,187 @@ static struct dentry *fuse_lookup(struct inode *dir, struct dentry *entry,</div><div class='ctx'> 	return ERR_PTR(err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int get_security_context(struct dentry *entry, umode_t mode,</div><div class='add'>+				struct fuse_in_arg *ext)</div><div class='add'>+{</div><div class='add'>+	struct fuse_secctx *fctx;</div><div class='add'>+	struct fuse_secctx_header *header;</div><div class='add'>+	struct lsm_context lsmctx = { };</div><div class='add'>+	void *ptr;</div><div class='add'>+	u32 total_len = sizeof(*header);</div><div class='add'>+	int err, nr_ctx = 0;</div><div class='add'>+	const char *name = NULL;</div><div class='add'>+	size_t namesize;</div><div class='add'>+</div><div class='add'>+	err = security_dentry_init_security(entry, mode, &amp;entry-&gt;d_name,</div><div class='add'>+					    &amp;name, &amp;lsmctx);</div><div class='add'>+</div><div class='add'>+	/* If no LSM is supporting this security hook ignore error */</div><div class='add'>+	if (err &amp;&amp; err != -EOPNOTSUPP)</div><div class='add'>+		goto out_err;</div><div class='add'>+</div><div class='add'>+	if (lsmctx.len) {</div><div class='add'>+		nr_ctx = 1;</div><div class='add'>+		namesize = strlen(name) + 1;</div><div class='add'>+		err = -EIO;</div><div class='add'>+		if (WARN_ON(namesize &gt; XATTR_NAME_MAX + 1 ||</div><div class='add'>+		    lsmctx.len &gt; S32_MAX))</div><div class='add'>+			goto out_err;</div><div class='add'>+		total_len += FUSE_REC_ALIGN(sizeof(*fctx) + namesize +</div><div class='add'>+					    lsmctx.len);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	err = -ENOMEM;</div><div class='add'>+	header = ptr = kzalloc(total_len, GFP_KERNEL);</div><div class='add'>+	if (!ptr)</div><div class='add'>+		goto out_err;</div><div class='add'>+</div><div class='add'>+	header-&gt;nr_secctx = nr_ctx;</div><div class='add'>+	header-&gt;size = total_len;</div><div class='add'>+	ptr += sizeof(*header);</div><div class='add'>+	if (nr_ctx) {</div><div class='add'>+		fctx = ptr;</div><div class='add'>+		fctx-&gt;size = lsmctx.len;</div><div class='add'>+		ptr += sizeof(*fctx);</div><div class='add'>+</div><div class='add'>+		strscpy(ptr, name, namesize);</div><div class='add'>+		ptr += namesize;</div><div class='add'>+</div><div class='add'>+		memcpy(ptr, lsmctx.context, lsmctx.len);</div><div class='add'>+	}</div><div class='add'>+	ext-&gt;size = total_len;</div><div class='add'>+	ext-&gt;value = header;</div><div class='add'>+	err = 0;</div><div class='add'>+out_err:</div><div class='add'>+	if (nr_ctx)</div><div class='add'>+		security_release_secctx(&amp;lsmctx);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void *extend_arg(struct fuse_in_arg *buf, u32 bytes)</div><div class='add'>+{</div><div class='add'>+	void *p;</div><div class='add'>+	u32 newlen = buf-&gt;size + bytes;</div><div class='add'>+</div><div class='add'>+	p = krealloc(buf-&gt;value, newlen, GFP_KERNEL);</div><div class='add'>+	if (!p) {</div><div class='add'>+		kfree(buf-&gt;value);</div><div class='add'>+		buf-&gt;size = 0;</div><div class='add'>+		buf-&gt;value = NULL;</div><div class='add'>+		return NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	memset(p + buf-&gt;size, 0, bytes);</div><div class='add'>+	buf-&gt;value = p;</div><div class='add'>+	buf-&gt;size = newlen;</div><div class='add'>+</div><div class='add'>+	return p + newlen - bytes;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static u32 fuse_ext_size(size_t size)</div><div class='add'>+{</div><div class='add'>+	return FUSE_REC_ALIGN(sizeof(struct fuse_ext_header) + size);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * This adds just a single supplementary group that matches the parent's group.</div><div class='add'>+ */</div><div class='add'>+static int get_create_supp_group(struct mnt_idmap *idmap,</div><div class='add'>+				 struct inode *dir,</div><div class='add'>+				 struct fuse_in_arg *ext)</div><div class='add'>+{</div><div class='add'>+	struct fuse_conn *fc = get_fuse_conn(dir);</div><div class='add'>+	struct fuse_ext_header *xh;</div><div class='add'>+	struct fuse_supp_groups *sg;</div><div class='add'>+	kgid_t kgid = dir-&gt;i_gid;</div><div class='add'>+	vfsgid_t vfsgid = make_vfsgid(idmap, fc-&gt;user_ns, kgid);</div><div class='add'>+	gid_t parent_gid = from_kgid(fc-&gt;user_ns, kgid);</div><div class='add'>+</div><div class='add'>+	u32 sg_len = fuse_ext_size(sizeof(*sg) + sizeof(sg-&gt;groups[0]));</div><div class='add'>+</div><div class='add'>+	if (parent_gid == (gid_t) -1 || vfsgid_eq_kgid(vfsgid, current_fsgid()) ||</div><div class='add'>+	    !vfsgid_in_group_p(vfsgid))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	xh = extend_arg(ext, sg_len);</div><div class='add'>+	if (!xh)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	xh-&gt;size = sg_len;</div><div class='add'>+	xh-&gt;type = FUSE_EXT_GROUPS;</div><div class='add'>+</div><div class='add'>+	sg = (struct fuse_supp_groups *) &amp;xh[1];</div><div class='add'>+	sg-&gt;nr_groups = 1;</div><div class='add'>+	sg-&gt;groups[0] = parent_gid;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int get_create_ext(struct mnt_idmap *idmap,</div><div class='add'>+			  struct fuse_args *args,</div><div class='add'>+			  struct inode *dir, struct dentry *dentry,</div><div class='add'>+			  umode_t mode)</div><div class='add'>+{</div><div class='add'>+	struct fuse_conn *fc = get_fuse_conn_super(dentry-&gt;d_sb);</div><div class='add'>+	struct fuse_in_arg ext = { .size = 0, .value = NULL };</div><div class='add'>+	int err = 0;</div><div class='add'>+</div><div class='add'>+	if (fc-&gt;init_security)</div><div class='add'>+		err = get_security_context(dentry, mode, &amp;ext);</div><div class='add'>+	if (!err &amp;&amp; fc-&gt;create_supp_group)</div><div class='add'>+		err = get_create_supp_group(idmap, dir, &amp;ext);</div><div class='add'>+</div><div class='add'>+	if (!err &amp;&amp; ext.size) {</div><div class='add'>+		WARN_ON(args-&gt;in_numargs &gt;= ARRAY_SIZE(args-&gt;in_args));</div><div class='add'>+		args-&gt;is_ext = true;</div><div class='add'>+		args-&gt;ext_idx = args-&gt;in_numargs++;</div><div class='add'>+		args-&gt;in_args[args-&gt;ext_idx] = ext;</div><div class='add'>+	} else {</div><div class='add'>+		kfree(ext.value);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void free_ext_value(struct fuse_args *args)</div><div class='add'>+{</div><div class='add'>+	if (args-&gt;is_ext)</div><div class='add'>+		kfree(args-&gt;in_args[args-&gt;ext_idx].value);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Atomic create+open operation</div><div class='ctx'>  *</div><div class='ctx'>  * If the filesystem doesn't support this, then fall back to separate</div><div class='ctx'>  * 'mknod' + 'open' requests.</div><div class='ctx'>  */</div><div class='del'>-static int fuse_create_open(struct inode *dir, struct dentry *entry,</div><div class='del'>-			    struct file *file, unsigned int flags,</div><div class='del'>-			    umode_t mode)</div><div class='add'>+static int fuse_create_open(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+			    struct dentry *entry, struct file *file,</div><div class='add'>+			    unsigned int flags, umode_t mode, u32 opcode)</div><div class='ctx'> {</div><div class='del'>-	int err;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct fuse_mount *fm = get_fuse_mount(dir);</div><div class='ctx'> 	FUSE_ARGS(args);</div><div class='ctx'> 	struct fuse_forget_link *forget;</div><div class='ctx'> 	struct fuse_create_in inarg;</div><div class='del'>-	struct fuse_open_out outopen;</div><div class='add'>+	struct fuse_open_out *outopenp;</div><div class='ctx'> 	struct fuse_entry_out outentry;</div><div class='ctx'> 	struct fuse_inode *fi;</div><div class='ctx'> 	struct fuse_file *ff;</div><div class='add'>+	int epoch, err;</div><div class='add'>+	bool trunc = flags &amp; O_TRUNC;</div><div class='ctx'> </div><div class='ctx'> 	/* Userspace expects S_IFREG in create mode */</div><div class='ctx'> 	BUG_ON((mode &amp; S_IFMT) != S_IFREG);</div><div class='ctx'> </div><div class='add'>+	epoch = atomic_read(&amp;fm-&gt;fc-&gt;epoch);</div><div class='ctx'> 	forget = fuse_alloc_forget();</div><div class='ctx'> 	err = -ENOMEM;</div><div class='ctx'> 	if (!forget)</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> </div><div class='ctx'> 	err = -ENOMEM;</div><div class='del'>-	ff = fuse_file_alloc(fm);</div><div class='add'>+	ff = fuse_file_alloc(fm, true);</div><div class='ctx'> 	if (!ff)</div><div class='ctx'> 		goto out_put_forget_req;</div><div class='ctx'> </div><div class='hunk'>@@ -500,12 +849,12 @@ static int fuse_create_open(struct inode *dir, struct dentry *entry,</div><div class='ctx'> 	inarg.mode = mode;</div><div class='ctx'> 	inarg.umask = current_umask();</div><div class='ctx'> </div><div class='del'>-	if (fm-&gt;fc-&gt;handle_killpriv_v2 &amp;&amp; (flags &amp; O_TRUNC) &amp;&amp;</div><div class='add'>+	if (fm-&gt;fc-&gt;handle_killpriv_v2 &amp;&amp; trunc &amp;&amp;</div><div class='ctx'> 	    !(flags &amp; O_EXCL) &amp;&amp; !capable(CAP_FSETID)) {</div><div class='ctx'> 		inarg.open_flags |= FUSE_OPEN_KILL_SUIDGID;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	args.opcode = FUSE_CREATE;</div><div class='add'>+	args.opcode = opcode;</div><div class='ctx'> 	args.nodeid = get_node_id(dir);</div><div class='ctx'> 	args.in_numargs = 2;</div><div class='ctx'> 	args.in_args[0].size = sizeof(inarg);</div><div class='hunk'>@@ -515,9 +864,17 @@ static int fuse_create_open(struct inode *dir, struct dentry *entry,</div><div class='ctx'> 	args.out_numargs = 2;</div><div class='ctx'> 	args.out_args[0].size = sizeof(outentry);</div><div class='ctx'> 	args.out_args[0].value = &amp;outentry;</div><div class='del'>-	args.out_args[1].size = sizeof(outopen);</div><div class='del'>-	args.out_args[1].value = &amp;outopen;</div><div class='del'>-	err = fuse_simple_request(fm, &amp;args);</div><div class='add'>+	/* Store outarg for fuse_finish_open() */</div><div class='add'>+	outopenp = &amp;ff-&gt;args-&gt;open_outarg;</div><div class='add'>+	args.out_args[1].size = sizeof(*outopenp);</div><div class='add'>+	args.out_args[1].value = outopenp;</div><div class='add'>+</div><div class='add'>+	err = get_create_ext(idmap, &amp;args, dir, entry, mode);</div><div class='add'>+	if (err)</div><div class='add'>+		goto out_free_ff;</div><div class='add'>+</div><div class='add'>+	err = fuse_simple_idmap_request(idmap, fm, &amp;args);</div><div class='add'>+	free_ext_value(&amp;args);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out_free_ff;</div><div class='ctx'> </div><div class='hunk'>@@ -526,11 +883,11 @@ static int fuse_create_open(struct inode *dir, struct dentry *entry,</div><div class='ctx'> 	    fuse_invalid_attr(&amp;outentry.attr))</div><div class='ctx'> 		goto out_free_ff;</div><div class='ctx'> </div><div class='del'>-	ff-&gt;fh = outopen.fh;</div><div class='add'>+	ff-&gt;fh = outopenp-&gt;fh;</div><div class='ctx'> 	ff-&gt;nodeid = outentry.nodeid;</div><div class='del'>-	ff-&gt;open_flags = outopen.open_flags;</div><div class='add'>+	ff-&gt;open_flags = outopenp-&gt;open_flags;</div><div class='ctx'> 	inode = fuse_iget(dir-&gt;i_sb, outentry.nodeid, outentry.generation,</div><div class='del'>-			  &amp;outentry.attr, entry_attr_timeout(&amp;outentry), 0);</div><div class='add'>+			  &amp;outentry.attr, ATTR_TIMEOUT(&amp;outentry), 0, 0);</div><div class='ctx'> 	if (!inode) {</div><div class='ctx'> 		flags &amp;= ~(O_CREAT | O_EXCL | O_TRUNC);</div><div class='ctx'> 		fuse_sync_release(NULL, ff, flags);</div><div class='hunk'>@@ -540,15 +897,22 @@ static int fuse_create_open(struct inode *dir, struct dentry *entry,</div><div class='ctx'> 	}</div><div class='ctx'> 	kfree(forget);</div><div class='ctx'> 	d_instantiate(entry, inode);</div><div class='add'>+	entry-&gt;d_time = epoch;</div><div class='ctx'> 	fuse_change_entry_timeout(entry, &amp;outentry);</div><div class='ctx'> 	fuse_dir_changed(dir);</div><div class='del'>-	err = finish_open(file, entry, generic_file_open);</div><div class='add'>+	err = generic_file_open(inode, file);</div><div class='add'>+	if (!err) {</div><div class='add'>+		file-&gt;private_data = ff;</div><div class='add'>+		err = finish_open(file, entry, fuse_finish_open);</div><div class='add'>+	}</div><div class='ctx'> 	if (err) {</div><div class='ctx'> 		fi = get_fuse_inode(inode);</div><div class='ctx'> 		fuse_sync_release(fi, ff, flags);</div><div class='ctx'> 	} else {</div><div class='del'>-		file-&gt;private_data = ff;</div><div class='del'>-		fuse_finish_open(inode, file);</div><div class='add'>+		if (fm-&gt;fc-&gt;atomic_o_trunc &amp;&amp; trunc)</div><div class='add'>+			truncate_pagecache(inode, 0);</div><div class='add'>+		else if (!(ff-&gt;open_flags &amp; FOPEN_KEEP_CACHE))</div><div class='add'>+			invalidate_inode_pages2(inode-&gt;i_mapping);</div><div class='ctx'> 	}</div><div class='ctx'> 	return err;</div><div class='ctx'> </div><div class='hunk'>@@ -560,30 +924,27 @@ out_err:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fuse_mknod(struct user_namespace *, struct inode *, struct dentry *,</div><div class='add'>+static int fuse_mknod(struct mnt_idmap *, struct inode *, struct dentry *,</div><div class='ctx'> 		      umode_t, dev_t);</div><div class='ctx'> static int fuse_atomic_open(struct inode *dir, struct dentry *entry,</div><div class='ctx'> 			    struct file *file, unsigned flags,</div><div class='ctx'> 			    umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='add'>+	struct mnt_idmap *idmap = file_mnt_idmap(file);</div><div class='ctx'> 	struct fuse_conn *fc = get_fuse_conn(dir);</div><div class='del'>-	struct dentry *res = NULL;</div><div class='ctx'> </div><div class='ctx'> 	if (fuse_is_bad(dir))</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> </div><div class='ctx'> 	if (d_in_lookup(entry)) {</div><div class='del'>-		res = fuse_lookup(dir, entry, 0);</div><div class='del'>-		if (IS_ERR(res))</div><div class='del'>-			return PTR_ERR(res);</div><div class='del'>-</div><div class='del'>-		if (res)</div><div class='del'>-			entry = res;</div><div class='add'>+		struct dentry *res = fuse_lookup(dir, entry, 0);</div><div class='add'>+		if (res || d_really_is_positive(entry))</div><div class='add'>+			return finish_no_open(file, res);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!(flags &amp; O_CREAT) || d_really_is_positive(entry))</div><div class='del'>-		goto no_open;</div><div class='add'>+	if (!(flags &amp; O_CREAT))</div><div class='add'>+		return finish_no_open(file, NULL);</div><div class='ctx'> </div><div class='ctx'> 	/* Only creates */</div><div class='ctx'> 	file-&gt;f_mode |= FMODE_CREATED;</div><div class='hunk'>@@ -591,49 +952,57 @@ static int fuse_atomic_open(struct inode *dir, struct dentry *entry,</div><div class='ctx'> 	if (fc-&gt;no_create)</div><div class='ctx'> 		goto mknod;</div><div class='ctx'> </div><div class='del'>-	err = fuse_create_open(dir, entry, file, flags, mode);</div><div class='add'>+	err = fuse_create_open(idmap, dir, entry, file, flags, mode, FUSE_CREATE);</div><div class='ctx'> 	if (err == -ENOSYS) {</div><div class='ctx'> 		fc-&gt;no_create = 1;</div><div class='ctx'> 		goto mknod;</div><div class='del'>-	}</div><div class='del'>-out_dput:</div><div class='del'>-	dput(res);</div><div class='add'>+	} else if (err == -EEXIST)</div><div class='add'>+		fuse_invalidate_entry(entry);</div><div class='ctx'> 	return err;</div><div class='ctx'> </div><div class='ctx'> mknod:</div><div class='del'>-	err = fuse_mknod(&amp;init_user_ns, dir, entry, mode, 0);</div><div class='add'>+	err = fuse_mknod(idmap, dir, entry, mode, 0);</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto out_dput;</div><div class='del'>-no_open:</div><div class='del'>-	return finish_no_open(file, res);</div><div class='add'>+		return err;</div><div class='add'>+	return finish_no_open(file, NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Code shared between mknod, mkdir, symlink and link</div><div class='ctx'>  */</div><div class='del'>-static int create_new_entry(struct fuse_mount *fm, struct fuse_args *args,</div><div class='del'>-			    struct inode *dir, struct dentry *entry,</div><div class='del'>-			    umode_t mode)</div><div class='add'>+static struct dentry *create_new_entry(struct mnt_idmap *idmap, struct fuse_mount *fm,</div><div class='add'>+				       struct fuse_args *args, struct inode *dir,</div><div class='add'>+				       struct dentry *entry, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_entry_out outarg;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct dentry *d;</div><div class='del'>-	int err;</div><div class='ctx'> 	struct fuse_forget_link *forget;</div><div class='add'>+	int epoch, err;</div><div class='ctx'> </div><div class='ctx'> 	if (fuse_is_bad(dir))</div><div class='del'>-		return -EIO;</div><div class='add'>+		return ERR_PTR(-EIO);</div><div class='add'>+</div><div class='add'>+	epoch = atomic_read(&amp;fm-&gt;fc-&gt;epoch);</div><div class='ctx'> </div><div class='ctx'> 	forget = fuse_alloc_forget();</div><div class='ctx'> 	if (!forget)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='ctx'> 	memset(&amp;outarg, 0, sizeof(outarg));</div><div class='ctx'> 	args-&gt;nodeid = get_node_id(dir);</div><div class='ctx'> 	args-&gt;out_numargs = 1;</div><div class='ctx'> 	args-&gt;out_args[0].size = sizeof(outarg);</div><div class='ctx'> 	args-&gt;out_args[0].value = &amp;outarg;</div><div class='del'>-	err = fuse_simple_request(fm, args);</div><div class='add'>+</div><div class='add'>+	if (args-&gt;opcode != FUSE_LINK) {</div><div class='add'>+		err = get_create_ext(idmap, args, dir, entry, mode);</div><div class='add'>+		if (err)</div><div class='add'>+			goto out_put_forget_req;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	err = fuse_simple_idmap_request(idmap, fm, args);</div><div class='add'>+	free_ext_value(args);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out_put_forget_req;</div><div class='ctx'> </div><div class='hunk'>@@ -645,33 +1014,52 @@ static int create_new_entry(struct fuse_mount *fm, struct fuse_args *args,</div><div class='ctx'> 		goto out_put_forget_req;</div><div class='ctx'> </div><div class='ctx'> 	inode = fuse_iget(dir-&gt;i_sb, outarg.nodeid, outarg.generation,</div><div class='del'>-			  &amp;outarg.attr, entry_attr_timeout(&amp;outarg), 0);</div><div class='add'>+			  &amp;outarg.attr, ATTR_TIMEOUT(&amp;outarg), 0, 0);</div><div class='ctx'> 	if (!inode) {</div><div class='ctx'> 		fuse_queue_forget(fm-&gt;fc, forget, outarg.nodeid, 1);</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='ctx'> 	}</div><div class='ctx'> 	kfree(forget);</div><div class='ctx'> </div><div class='ctx'> 	d_drop(entry);</div><div class='ctx'> 	d = d_splice_alias(inode, entry);</div><div class='ctx'> 	if (IS_ERR(d))</div><div class='del'>-		return PTR_ERR(d);</div><div class='add'>+		return d;</div><div class='ctx'> </div><div class='ctx'> 	if (d) {</div><div class='add'>+		d-&gt;d_time = epoch;</div><div class='ctx'> 		fuse_change_entry_timeout(d, &amp;outarg);</div><div class='del'>-		dput(d);</div><div class='ctx'> 	} else {</div><div class='add'>+		entry-&gt;d_time = epoch;</div><div class='ctx'> 		fuse_change_entry_timeout(entry, &amp;outarg);</div><div class='ctx'> 	}</div><div class='ctx'> 	fuse_dir_changed(dir);</div><div class='del'>-	return 0;</div><div class='add'>+	return d;</div><div class='ctx'> </div><div class='ctx'>  out_put_forget_req:</div><div class='add'>+	if (err == -EEXIST)</div><div class='add'>+		fuse_invalidate_entry(entry);</div><div class='ctx'> 	kfree(forget);</div><div class='del'>-	return err;</div><div class='add'>+	return ERR_PTR(err);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int create_new_nondir(struct mnt_idmap *idmap, struct fuse_mount *fm,</div><div class='add'>+			     struct fuse_args *args, struct inode *dir,</div><div class='add'>+			     struct dentry *entry, umode_t mode)</div><div class='add'>+{</div><div class='add'>+	/*</div><div class='add'>+	 * Note that when creating anything other than a directory we</div><div class='add'>+	 * can be sure create_new_entry() will NOT return an alternate</div><div class='add'>+	 * dentry as d_splice_alias() only returns an alternate dentry</div><div class='add'>+	 * for directories.  So we don't need to check for that case</div><div class='add'>+	 * when passing back the result.</div><div class='add'>+	 */</div><div class='add'>+	WARN_ON_ONCE(S_ISDIR(mode));</div><div class='add'>+</div><div class='add'>+	return PTR_ERR(create_new_entry(idmap, fm, args, dir, entry, mode));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fuse_mknod(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int fuse_mknod(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		      struct dentry *entry, umode_t mode, dev_t rdev)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_mknod_in inarg;</div><div class='hunk'>@@ -691,17 +1079,35 @@ static int fuse_mknod(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	args.in_args[0].value = &amp;inarg;</div><div class='ctx'> 	args.in_args[1].size = entry-&gt;d_name.len + 1;</div><div class='ctx'> 	args.in_args[1].value = entry-&gt;d_name.name;</div><div class='del'>-	return create_new_entry(fm, &amp;args, dir, entry, mode);</div><div class='add'>+	return create_new_nondir(idmap, fm, &amp;args, dir, entry, mode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fuse_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int fuse_create(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		       struct dentry *entry, umode_t mode, bool excl)</div><div class='ctx'> {</div><div class='del'>-	return fuse_mknod(&amp;init_user_ns, dir, entry, mode, 0);</div><div class='add'>+	return fuse_mknod(idmap, dir, entry, mode, 0);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int fuse_tmpfile(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+			struct file *file, umode_t mode)</div><div class='add'>+{</div><div class='add'>+	struct fuse_conn *fc = get_fuse_conn(dir);</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	if (fc-&gt;no_tmpfile)</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+</div><div class='add'>+	err = fuse_create_open(idmap, dir, file-&gt;f_path.dentry, file,</div><div class='add'>+			       file-&gt;f_flags, mode, FUSE_TMPFILE);</div><div class='add'>+	if (err == -ENOSYS) {</div><div class='add'>+		fc-&gt;no_tmpfile = 1;</div><div class='add'>+		err = -EOPNOTSUPP;</div><div class='add'>+	}</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fuse_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-		      struct dentry *entry, umode_t mode)</div><div class='add'>+static struct dentry *fuse_mkdir(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+				 struct dentry *entry, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_mkdir_in inarg;</div><div class='ctx'> 	struct fuse_mount *fm = get_fuse_mount(dir);</div><div class='hunk'>@@ -719,10 +1125,10 @@ static int fuse_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	args.in_args[0].value = &amp;inarg;</div><div class='ctx'> 	args.in_args[1].size = entry-&gt;d_name.len + 1;</div><div class='ctx'> 	args.in_args[1].value = entry-&gt;d_name.name;</div><div class='del'>-	return create_new_entry(fm, &amp;args, dir, entry, S_IFDIR);</div><div class='add'>+	return create_new_entry(idmap, fm, &amp;args, dir, entry, S_IFDIR);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fuse_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int fuse_symlink(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 			struct dentry *entry, const char *link)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_mount *fm = get_fuse_mount(dir);</div><div class='hunk'>@@ -730,12 +1136,13 @@ static int fuse_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	FUSE_ARGS(args);</div><div class='ctx'> </div><div class='ctx'> 	args.opcode = FUSE_SYMLINK;</div><div class='del'>-	args.in_numargs = 2;</div><div class='del'>-	args.in_args[0].size = entry-&gt;d_name.len + 1;</div><div class='del'>-	args.in_args[0].value = entry-&gt;d_name.name;</div><div class='del'>-	args.in_args[1].size = len;</div><div class='del'>-	args.in_args[1].value = link;</div><div class='del'>-	return create_new_entry(fm, &amp;args, dir, entry, S_IFLNK);</div><div class='add'>+	args.in_numargs = 3;</div><div class='add'>+	fuse_set_zero_arg0(&amp;args);</div><div class='add'>+	args.in_args[1].size = entry-&gt;d_name.len + 1;</div><div class='add'>+	args.in_args[1].value = entry-&gt;d_name.name;</div><div class='add'>+	args.in_args[2].size = len;</div><div class='add'>+	args.in_args[2].value = link;</div><div class='add'>+	return create_new_nondir(idmap, fm, &amp;args, dir, entry, S_IFLNK);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void fuse_flush_time_update(struct inode *inode)</div><div class='hunk'>@@ -748,7 +1155,7 @@ void fuse_flush_time_update(struct inode *inode)</div><div class='ctx'> static void fuse_update_ctime_in_cache(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	if (!IS_NOCMTIME(inode)) {</div><div class='del'>-		inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+		inode_set_ctime_current(inode);</div><div class='ctx'> 		mark_inode_dirty_sync(inode);</div><div class='ctx'> 		fuse_flush_time_update(inode);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -794,14 +1201,15 @@ static int fuse_unlink(struct inode *dir, struct dentry *entry)</div><div class='ctx'> </div><div class='ctx'> 	args.opcode = FUSE_UNLINK;</div><div class='ctx'> 	args.nodeid = get_node_id(dir);</div><div class='del'>-	args.in_numargs = 1;</div><div class='del'>-	args.in_args[0].size = entry-&gt;d_name.len + 1;</div><div class='del'>-	args.in_args[0].value = entry-&gt;d_name.name;</div><div class='add'>+	args.in_numargs = 2;</div><div class='add'>+	fuse_set_zero_arg0(&amp;args);</div><div class='add'>+	args.in_args[1].size = entry-&gt;d_name.len + 1;</div><div class='add'>+	args.in_args[1].value = entry-&gt;d_name.name;</div><div class='ctx'> 	err = fuse_simple_request(fm, &amp;args);</div><div class='ctx'> 	if (!err) {</div><div class='ctx'> 		fuse_dir_changed(dir);</div><div class='ctx'> 		fuse_entry_unlinked(entry);</div><div class='del'>-	} else if (err == -EINTR)</div><div class='add'>+	} else if (err == -EINTR || err == -ENOENT)</div><div class='ctx'> 		fuse_invalidate_entry(entry);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='hunk'>@@ -817,19 +1225,20 @@ static int fuse_rmdir(struct inode *dir, struct dentry *entry)</div><div class='ctx'> </div><div class='ctx'> 	args.opcode = FUSE_RMDIR;</div><div class='ctx'> 	args.nodeid = get_node_id(dir);</div><div class='del'>-	args.in_numargs = 1;</div><div class='del'>-	args.in_args[0].size = entry-&gt;d_name.len + 1;</div><div class='del'>-	args.in_args[0].value = entry-&gt;d_name.name;</div><div class='add'>+	args.in_numargs = 2;</div><div class='add'>+	fuse_set_zero_arg0(&amp;args);</div><div class='add'>+	args.in_args[1].size = entry-&gt;d_name.len + 1;</div><div class='add'>+	args.in_args[1].value = entry-&gt;d_name.name;</div><div class='ctx'> 	err = fuse_simple_request(fm, &amp;args);</div><div class='ctx'> 	if (!err) {</div><div class='ctx'> 		fuse_dir_changed(dir);</div><div class='ctx'> 		fuse_entry_unlinked(entry);</div><div class='del'>-	} else if (err == -EINTR)</div><div class='add'>+	} else if (err == -EINTR || err == -ENOENT)</div><div class='ctx'> 		fuse_invalidate_entry(entry);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fuse_rename_common(struct inode *olddir, struct dentry *oldent,</div><div class='add'>+static int fuse_rename_common(struct mnt_idmap *idmap, struct inode *olddir, struct dentry *oldent,</div><div class='ctx'> 			      struct inode *newdir, struct dentry *newent,</div><div class='ctx'> 			      unsigned int flags, int opcode, size_t argsize)</div><div class='ctx'> {</div><div class='hunk'>@@ -850,7 +1259,7 @@ static int fuse_rename_common(struct inode *olddir, struct dentry *oldent,</div><div class='ctx'> 	args.in_args[1].value = oldent-&gt;d_name.name;</div><div class='ctx'> 	args.in_args[2].size = newent-&gt;d_name.len + 1;</div><div class='ctx'> 	args.in_args[2].value = newent-&gt;d_name.name;</div><div class='del'>-	err = fuse_simple_request(fm, &amp;args);</div><div class='add'>+	err = fuse_simple_idmap_request(idmap, fm, &amp;args);</div><div class='ctx'> 	if (!err) {</div><div class='ctx'> 		/* ctime changes */</div><div class='ctx'> 		fuse_update_ctime(d_inode(oldent));</div><div class='hunk'>@@ -865,7 +1274,7 @@ static int fuse_rename_common(struct inode *olddir, struct dentry *oldent,</div><div class='ctx'> 		/* newent will end up negative */</div><div class='ctx'> 		if (!(flags &amp; RENAME_EXCHANGE) &amp;&amp; d_really_is_positive(newent))</div><div class='ctx'> 			fuse_entry_unlinked(newent);</div><div class='del'>-	} else if (err == -EINTR) {</div><div class='add'>+	} else if (err == -EINTR || err == -ENOENT) {</div><div class='ctx'> 		/* If request was interrupted, DEITY only knows if the</div><div class='ctx'> 		   rename actually took place.  If the invalidation</div><div class='ctx'> 		   fails (e.g. some process has CWD under the renamed</div><div class='hunk'>@@ -879,7 +1288,7 @@ static int fuse_rename_common(struct inode *olddir, struct dentry *oldent,</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fuse_rename2(struct user_namespace *mnt_userns, struct inode *olddir,</div><div class='add'>+static int fuse_rename2(struct mnt_idmap *idmap, struct inode *olddir,</div><div class='ctx'> 			struct dentry *oldent, struct inode *newdir,</div><div class='ctx'> 			struct dentry *newent, unsigned int flags)</div><div class='ctx'> {</div><div class='hunk'>@@ -896,7 +1305,8 @@ static int fuse_rename2(struct user_namespace *mnt_userns, struct inode *olddir,</div><div class='ctx'> 		if (fc-&gt;no_rename2 || fc-&gt;minor &lt; 23)</div><div class='ctx'> 			return -EINVAL;</div><div class='ctx'> </div><div class='del'>-		err = fuse_rename_common(olddir, oldent, newdir, newent, flags,</div><div class='add'>+		err = fuse_rename_common((flags &amp; RENAME_WHITEOUT) ? idmap : &amp;invalid_mnt_idmap,</div><div class='add'>+					 olddir, oldent, newdir, newent, flags,</div><div class='ctx'> 					 FUSE_RENAME2,</div><div class='ctx'> 					 sizeof(struct fuse_rename2_in));</div><div class='ctx'> 		if (err == -ENOSYS) {</div><div class='hunk'>@@ -904,7 +1314,7 @@ static int fuse_rename2(struct user_namespace *mnt_userns, struct inode *olddir,</div><div class='ctx'> 			err = -EINVAL;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='del'>-		err = fuse_rename_common(olddir, oldent, newdir, newent, 0,</div><div class='add'>+		err = fuse_rename_common(&amp;invalid_mnt_idmap, olddir, oldent, newdir, newent, 0,</div><div class='ctx'> 					 FUSE_RENAME,</div><div class='ctx'> 					 sizeof(struct fuse_rename_in));</div><div class='ctx'> 	}</div><div class='hunk'>@@ -921,6 +1331,9 @@ static int fuse_link(struct dentry *entry, struct inode *newdir,</div><div class='ctx'> 	struct fuse_mount *fm = get_fuse_mount(inode);</div><div class='ctx'> 	FUSE_ARGS(args);</div><div class='ctx'> </div><div class='add'>+	if (fm-&gt;fc-&gt;no_link)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='ctx'> 	memset(&amp;inarg, 0, sizeof(inarg));</div><div class='ctx'> 	inarg.oldnodeid = get_node_id(inode);</div><div class='ctx'> 	args.opcode = FUSE_LINK;</div><div class='hunk'>@@ -929,27 +1342,37 @@ static int fuse_link(struct dentry *entry, struct inode *newdir,</div><div class='ctx'> 	args.in_args[0].value = &amp;inarg;</div><div class='ctx'> 	args.in_args[1].size = newent-&gt;d_name.len + 1;</div><div class='ctx'> 	args.in_args[1].value = newent-&gt;d_name.name;</div><div class='del'>-	err = create_new_entry(fm, &amp;args, newdir, newent, inode-&gt;i_mode);</div><div class='add'>+	err = create_new_nondir(&amp;invalid_mnt_idmap, fm, &amp;args, newdir, newent, inode-&gt;i_mode);</div><div class='ctx'> 	if (!err)</div><div class='ctx'> 		fuse_update_ctime_in_cache(inode);</div><div class='ctx'> 	else if (err == -EINTR)</div><div class='ctx'> 		fuse_invalidate_attr(inode);</div><div class='ctx'> </div><div class='add'>+	if (err == -ENOSYS)</div><div class='add'>+		fm-&gt;fc-&gt;no_link = 1;</div><div class='add'>+out:</div><div class='add'>+	if (fm-&gt;fc-&gt;no_link)</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void fuse_fillattr(struct inode *inode, struct fuse_attr *attr,</div><div class='del'>-			  struct kstat *stat)</div><div class='add'>+static void fuse_fillattr(struct mnt_idmap *idmap, struct inode *inode,</div><div class='add'>+			  struct fuse_attr *attr, struct kstat *stat)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int blkbits;</div><div class='ctx'> 	struct fuse_conn *fc = get_fuse_conn(inode);</div><div class='add'>+	vfsuid_t vfsuid = make_vfsuid(idmap, fc-&gt;user_ns,</div><div class='add'>+				      make_kuid(fc-&gt;user_ns, attr-&gt;uid));</div><div class='add'>+	vfsgid_t vfsgid = make_vfsgid(idmap, fc-&gt;user_ns,</div><div class='add'>+				      make_kgid(fc-&gt;user_ns, attr-&gt;gid));</div><div class='ctx'> </div><div class='ctx'> 	stat-&gt;dev = inode-&gt;i_sb-&gt;s_dev;</div><div class='ctx'> 	stat-&gt;ino = attr-&gt;ino;</div><div class='ctx'> 	stat-&gt;mode = (inode-&gt;i_mode &amp; S_IFMT) | (attr-&gt;mode &amp; 07777);</div><div class='ctx'> 	stat-&gt;nlink = attr-&gt;nlink;</div><div class='del'>-	stat-&gt;uid = make_kuid(fc-&gt;user_ns, attr-&gt;uid);</div><div class='del'>-	stat-&gt;gid = make_kgid(fc-&gt;user_ns, attr-&gt;gid);</div><div class='add'>+	stat-&gt;uid = vfsuid_into_kuid(vfsuid);</div><div class='add'>+	stat-&gt;gid = vfsgid_into_kgid(vfsgid);</div><div class='ctx'> 	stat-&gt;rdev = inode-&gt;i_rdev;</div><div class='ctx'> 	stat-&gt;atime.tv_sec = attr-&gt;atime;</div><div class='ctx'> 	stat-&gt;atime.tv_nsec = attr-&gt;atimensec;</div><div class='hunk'>@@ -968,8 +1391,89 @@ static void fuse_fillattr(struct inode *inode, struct fuse_attr *attr,</div><div class='ctx'> 	stat-&gt;blksize = 1 &lt;&lt; blkbits;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fuse_do_getattr(struct inode *inode, struct kstat *stat,</div><div class='del'>-			   struct file *file)</div><div class='add'>+static void fuse_statx_to_attr(struct fuse_statx *sx, struct fuse_attr *attr)</div><div class='add'>+{</div><div class='add'>+	memset(attr, 0, sizeof(*attr));</div><div class='add'>+	attr-&gt;ino = sx-&gt;ino;</div><div class='add'>+	attr-&gt;size = sx-&gt;size;</div><div class='add'>+	attr-&gt;blocks = sx-&gt;blocks;</div><div class='add'>+	attr-&gt;atime = sx-&gt;atime.tv_sec;</div><div class='add'>+	attr-&gt;mtime = sx-&gt;mtime.tv_sec;</div><div class='add'>+	attr-&gt;ctime = sx-&gt;ctime.tv_sec;</div><div class='add'>+	attr-&gt;atimensec = sx-&gt;atime.tv_nsec;</div><div class='add'>+	attr-&gt;mtimensec = sx-&gt;mtime.tv_nsec;</div><div class='add'>+	attr-&gt;ctimensec = sx-&gt;ctime.tv_nsec;</div><div class='add'>+	attr-&gt;mode = sx-&gt;mode;</div><div class='add'>+	attr-&gt;nlink = sx-&gt;nlink;</div><div class='add'>+	attr-&gt;uid = sx-&gt;uid;</div><div class='add'>+	attr-&gt;gid = sx-&gt;gid;</div><div class='add'>+	attr-&gt;rdev = new_encode_dev(MKDEV(sx-&gt;rdev_major, sx-&gt;rdev_minor));</div><div class='add'>+	attr-&gt;blksize = sx-&gt;blksize;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int fuse_do_statx(struct mnt_idmap *idmap, struct inode *inode,</div><div class='add'>+			 struct file *file, struct kstat *stat)</div><div class='add'>+{</div><div class='add'>+	int err;</div><div class='add'>+	struct fuse_attr attr;</div><div class='add'>+	struct fuse_statx *sx;</div><div class='add'>+	struct fuse_statx_in inarg;</div><div class='add'>+	struct fuse_statx_out outarg;</div><div class='add'>+	struct fuse_mount *fm = get_fuse_mount(inode);</div><div class='add'>+	u64 attr_version = fuse_get_attr_version(fm-&gt;fc);</div><div class='add'>+	FUSE_ARGS(args);</div><div class='add'>+</div><div class='add'>+	memset(&amp;inarg, 0, sizeof(inarg));</div><div class='add'>+	memset(&amp;outarg, 0, sizeof(outarg));</div><div class='add'>+	/* Directories have separate file-handle space */</div><div class='add'>+	if (file &amp;&amp; S_ISREG(inode-&gt;i_mode)) {</div><div class='add'>+		struct fuse_file *ff = file-&gt;private_data;</div><div class='add'>+</div><div class='add'>+		inarg.getattr_flags |= FUSE_GETATTR_FH;</div><div class='add'>+		inarg.fh = ff-&gt;fh;</div><div class='add'>+	}</div><div class='add'>+	/* For now leave sync hints as the default, request all stats. */</div><div class='add'>+	inarg.sx_flags = 0;</div><div class='add'>+	inarg.sx_mask = STATX_BASIC_STATS | STATX_BTIME;</div><div class='add'>+	args.opcode = FUSE_STATX;</div><div class='add'>+	args.nodeid = get_node_id(inode);</div><div class='add'>+	args.in_numargs = 1;</div><div class='add'>+	args.in_args[0].size = sizeof(inarg);</div><div class='add'>+	args.in_args[0].value = &amp;inarg;</div><div class='add'>+	args.out_numargs = 1;</div><div class='add'>+	args.out_args[0].size = sizeof(outarg);</div><div class='add'>+	args.out_args[0].value = &amp;outarg;</div><div class='add'>+	err = fuse_simple_request(fm, &amp;args);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	sx = &amp;outarg.stat;</div><div class='add'>+	if (((sx-&gt;mask &amp; STATX_SIZE) &amp;&amp; !fuse_valid_size(sx-&gt;size)) ||</div><div class='add'>+	    ((sx-&gt;mask &amp; STATX_TYPE) &amp;&amp; (!fuse_valid_type(sx-&gt;mode) ||</div><div class='add'>+					 inode_wrong_type(inode, sx-&gt;mode)))) {</div><div class='add'>+		fuse_make_bad(inode);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	fuse_statx_to_attr(&amp;outarg.stat, &amp;attr);</div><div class='add'>+	if ((sx-&gt;mask &amp; STATX_BASIC_STATS) == STATX_BASIC_STATS) {</div><div class='add'>+		fuse_change_attributes(inode, &amp;attr, &amp;outarg.stat,</div><div class='add'>+				       ATTR_TIMEOUT(&amp;outarg), attr_version);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (stat) {</div><div class='add'>+		stat-&gt;result_mask = sx-&gt;mask &amp; (STATX_BASIC_STATS | STATX_BTIME);</div><div class='add'>+		stat-&gt;btime.tv_sec = sx-&gt;btime.tv_sec;</div><div class='add'>+		stat-&gt;btime.tv_nsec = min_t(u32, sx-&gt;btime.tv_nsec, NSEC_PER_SEC - 1);</div><div class='add'>+		fuse_fillattr(idmap, inode, &amp;attr, stat);</div><div class='add'>+		stat-&gt;result_mask |= STATX_TYPE;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int fuse_do_getattr(struct mnt_idmap *idmap, struct inode *inode,</div><div class='add'>+			   struct kstat *stat, struct file *file)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='ctx'> 	struct fuse_getattr_in inarg;</div><div class='hunk'>@@ -1004,27 +1508,37 @@ static int fuse_do_getattr(struct inode *inode, struct kstat *stat,</div><div class='ctx'> 			fuse_make_bad(inode);</div><div class='ctx'> 			err = -EIO;</div><div class='ctx'> 		} else {</div><div class='del'>-			fuse_change_attributes(inode, &amp;outarg.attr,</div><div class='del'>-					       attr_timeout(&amp;outarg),</div><div class='add'>+			fuse_change_attributes(inode, &amp;outarg.attr, NULL,</div><div class='add'>+					       ATTR_TIMEOUT(&amp;outarg),</div><div class='ctx'> 					       attr_version);</div><div class='ctx'> 			if (stat)</div><div class='del'>-				fuse_fillattr(inode, &amp;outarg.attr, stat);</div><div class='add'>+				fuse_fillattr(idmap, inode, &amp;outarg.attr, stat);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fuse_update_get_attr(struct inode *inode, struct file *file,</div><div class='del'>-				struct kstat *stat, u32 request_mask,</div><div class='del'>-				unsigned int flags)</div><div class='add'>+static int fuse_update_get_attr(struct mnt_idmap *idmap, struct inode *inode,</div><div class='add'>+				struct file *file, struct kstat *stat,</div><div class='add'>+				u32 request_mask, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_inode *fi = get_fuse_inode(inode);</div><div class='add'>+	struct fuse_conn *fc = get_fuse_conn(inode);</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> 	bool sync;</div><div class='ctx'> 	u32 inval_mask = READ_ONCE(fi-&gt;inval_mask);</div><div class='ctx'> 	u32 cache_mask = fuse_get_cache_mask(inode);</div><div class='ctx'> </div><div class='del'>-	if (flags &amp; AT_STATX_FORCE_SYNC)</div><div class='add'>+</div><div class='add'>+	/* FUSE only supports basic stats and possibly btime */</div><div class='add'>+	request_mask &amp;= STATX_BASIC_STATS | STATX_BTIME;</div><div class='add'>+retry:</div><div class='add'>+	if (fc-&gt;no_statx)</div><div class='add'>+		request_mask &amp;= STATX_BASIC_STATS;</div><div class='add'>+</div><div class='add'>+	if (!request_mask)</div><div class='add'>+		sync = false;</div><div class='add'>+	else if (flags &amp; AT_STATX_FORCE_SYNC)</div><div class='ctx'> 		sync = true;</div><div class='ctx'> 	else if (flags &amp; AT_STATX_DONT_SYNC)</div><div class='ctx'> 		sync = false;</div><div class='hunk'>@@ -1035,11 +1549,26 @@ static int fuse_update_get_attr(struct inode *inode, struct file *file,</div><div class='ctx'> </div><div class='ctx'> 	if (sync) {</div><div class='ctx'> 		forget_all_cached_acls(inode);</div><div class='del'>-		err = fuse_do_getattr(inode, stat, file);</div><div class='add'>+		/* Try statx if BTIME is requested */</div><div class='add'>+		if (!fc-&gt;no_statx &amp;&amp; (request_mask &amp; ~STATX_BASIC_STATS)) {</div><div class='add'>+			err = fuse_do_statx(idmap, inode, file, stat);</div><div class='add'>+			if (err == -ENOSYS) {</div><div class='add'>+				fc-&gt;no_statx = 1;</div><div class='add'>+				err = 0;</div><div class='add'>+				goto retry;</div><div class='add'>+			}</div><div class='add'>+		} else {</div><div class='add'>+			err = fuse_do_getattr(idmap, inode, stat, file);</div><div class='add'>+		}</div><div class='ctx'> 	} else if (stat) {</div><div class='del'>-		generic_fillattr(&amp;init_user_ns, inode, stat);</div><div class='add'>+		generic_fillattr(idmap, request_mask, inode, stat);</div><div class='ctx'> 		stat-&gt;mode = fi-&gt;orig_i_mode;</div><div class='ctx'> 		stat-&gt;ino = fi-&gt;orig_ino;</div><div class='add'>+		stat-&gt;blksize = 1 &lt;&lt; fi-&gt;cached_i_blkbits;</div><div class='add'>+		if (test_bit(FUSE_I_BTIME, &amp;fi-&gt;state)) {</div><div class='add'>+			stat-&gt;btime = fi-&gt;i_btime;</div><div class='add'>+			stat-&gt;result_mask |= STATX_BTIME;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='hunk'>@@ -1047,11 +1576,11 @@ static int fuse_update_get_attr(struct inode *inode, struct file *file,</div><div class='ctx'> </div><div class='ctx'> int fuse_update_attributes(struct inode *inode, struct file *file, u32 mask)</div><div class='ctx'> {</div><div class='del'>-	return fuse_update_get_attr(inode, file, NULL, mask, 0);</div><div class='add'>+	return fuse_update_get_attr(&amp;nop_mnt_idmap, inode, file, NULL, mask, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int fuse_reverse_inval_entry(struct fuse_conn *fc, u64 parent_nodeid,</div><div class='del'>-			     u64 child_nodeid, struct qstr *name)</div><div class='add'>+			     u64 child_nodeid, struct qstr *name, u32 flags)</div><div class='ctx'> {</div><div class='ctx'> 	int err = -ENOTDIR;</div><div class='ctx'> 	struct inode *parent;</div><div class='hunk'>@@ -1062,25 +1591,25 @@ int fuse_reverse_inval_entry(struct fuse_conn *fc, u64 parent_nodeid,</div><div class='ctx'> 	if (!parent)</div><div class='ctx'> 		return -ENOENT;</div><div class='ctx'> </div><div class='del'>-	inode_lock_nested(parent, I_MUTEX_PARENT);</div><div class='ctx'> 	if (!S_ISDIR(parent-&gt;i_mode))</div><div class='del'>-		goto unlock;</div><div class='add'>+		goto put_parent;</div><div class='ctx'> </div><div class='ctx'> 	err = -ENOENT;</div><div class='ctx'> 	dir = d_find_alias(parent);</div><div class='ctx'> 	if (!dir)</div><div class='del'>-		goto unlock;</div><div class='add'>+		goto put_parent;</div><div class='ctx'> </div><div class='del'>-	name-&gt;hash = full_name_hash(dir, name-&gt;name, name-&gt;len);</div><div class='del'>-	entry = d_lookup(dir, name);</div><div class='add'>+	entry = start_removing_noperm(dir, name);</div><div class='ctx'> 	dput(dir);</div><div class='del'>-	if (!entry)</div><div class='del'>-		goto unlock;</div><div class='add'>+	if (IS_ERR(entry))</div><div class='add'>+		goto put_parent;</div><div class='ctx'> </div><div class='ctx'> 	fuse_dir_changed(parent);</div><div class='del'>-	fuse_invalidate_entry(entry);</div><div class='add'>+	if (!(flags &amp; FUSE_EXPIRE_ONLY))</div><div class='add'>+		d_invalidate(entry);</div><div class='add'>+	fuse_invalidate_entry_cache(entry);</div><div class='ctx'> </div><div class='del'>-	if (child_nodeid != 0 &amp;&amp; d_really_is_positive(entry)) {</div><div class='add'>+	if (child_nodeid != 0) {</div><div class='ctx'> 		inode_lock(d_inode(entry));</div><div class='ctx'> 		if (get_node_id(d_inode(entry)) != child_nodeid) {</div><div class='ctx'> 			err = -ENOENT;</div><div class='hunk'>@@ -1108,14 +1637,25 @@ int fuse_reverse_inval_entry(struct fuse_conn *fc, u64 parent_nodeid,</div><div class='ctx'> 	} else {</div><div class='ctx'> 		err = 0;</div><div class='ctx'> 	}</div><div class='del'>-	dput(entry);</div><div class='ctx'> </div><div class='del'>- unlock:</div><div class='del'>-	inode_unlock(parent);</div><div class='add'>+	end_removing(entry);</div><div class='add'>+ put_parent:</div><div class='ctx'> 	iput(parent);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline bool fuse_permissible_uidgid(struct fuse_conn *fc)</div><div class='add'>+{</div><div class='add'>+	const struct cred *cred = current_cred();</div><div class='add'>+</div><div class='add'>+	return (uid_eq(cred-&gt;euid, fc-&gt;user_id) &amp;&amp;</div><div class='add'>+		uid_eq(cred-&gt;suid, fc-&gt;user_id) &amp;&amp;</div><div class='add'>+		uid_eq(cred-&gt;uid,  fc-&gt;user_id) &amp;&amp;</div><div class='add'>+		gid_eq(cred-&gt;egid, fc-&gt;group_id) &amp;&amp;</div><div class='add'>+		gid_eq(cred-&gt;sgid, fc-&gt;group_id) &amp;&amp;</div><div class='add'>+		gid_eq(cred-&gt;gid,  fc-&gt;group_id));</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Calling into a user-controlled filesystem gives the filesystem</div><div class='ctx'>  * daemon ptrace-like capabilities over the current process.  This</div><div class='hunk'>@@ -1129,23 +1669,19 @@ int fuse_reverse_inval_entry(struct fuse_conn *fc, u64 parent_nodeid,</div><div class='ctx'>  * for which the owner of the mount has ptrace privilege.  This</div><div class='ctx'>  * excludes processes started by other users, suid or sgid processes.</div><div class='ctx'>  */</div><div class='del'>-int fuse_allow_current_process(struct fuse_conn *fc)</div><div class='add'>+bool fuse_allow_current_process(struct fuse_conn *fc)</div><div class='ctx'> {</div><div class='del'>-	const struct cred *cred;</div><div class='add'>+	bool allow;</div><div class='ctx'> </div><div class='ctx'> 	if (fc-&gt;allow_other)</div><div class='del'>-		return current_in_userns(fc-&gt;user_ns);</div><div class='add'>+		allow = current_in_userns(fc-&gt;user_ns);</div><div class='add'>+	else</div><div class='add'>+		allow = fuse_permissible_uidgid(fc);</div><div class='ctx'> </div><div class='del'>-	cred = current_cred();</div><div class='del'>-	if (uid_eq(cred-&gt;euid, fc-&gt;user_id) &amp;&amp;</div><div class='del'>-	    uid_eq(cred-&gt;suid, fc-&gt;user_id) &amp;&amp;</div><div class='del'>-	    uid_eq(cred-&gt;uid,  fc-&gt;user_id) &amp;&amp;</div><div class='del'>-	    gid_eq(cred-&gt;egid, fc-&gt;group_id) &amp;&amp;</div><div class='del'>-	    gid_eq(cred-&gt;sgid, fc-&gt;group_id) &amp;&amp;</div><div class='del'>-	    gid_eq(cred-&gt;gid,  fc-&gt;group_id))</div><div class='del'>-		return 1;</div><div class='add'>+	if (!allow &amp;&amp; allow_sys_admin_access &amp;&amp; capable(CAP_SYS_ADMIN))</div><div class='add'>+		allow = true;</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+	return allow;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int fuse_access(struct inode *inode, int mask)</div><div class='hunk'>@@ -1157,6 +1693,14 @@ static int fuse_access(struct inode *inode, int mask)</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(mask &amp; MAY_NOT_BLOCK);</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * We should not send FUSE_ACCESS to the userspace</div><div class='add'>+	 * when idmapped mounts are enabled as for this case</div><div class='add'>+	 * we have fc-&gt;default_permissions = 1 and access</div><div class='add'>+	 * permission checks are done on the kernel side.</div><div class='add'>+	 */</div><div class='add'>+	WARN_ON_ONCE(!(fm-&gt;sb-&gt;s_iflags &amp; SB_I_NOIDMAP));</div><div class='add'>+</div><div class='ctx'> 	if (fm-&gt;fc-&gt;no_access)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='hunk'>@@ -1181,7 +1725,7 @@ static int fuse_perm_getattr(struct inode *inode, int mask)</div><div class='ctx'> 		return -ECHILD;</div><div class='ctx'> </div><div class='ctx'> 	forget_all_cached_acls(inode);</div><div class='del'>-	return fuse_do_getattr(inode, NULL, NULL);</div><div class='add'>+	return fuse_do_getattr(&amp;nop_mnt_idmap, inode, NULL, NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1189,7 +1733,7 @@ static int fuse_perm_getattr(struct inode *inode, int mask)</div><div class='ctx'>  *</div><div class='ctx'>  * 1) Local access checking ('default_permissions' mount option) based</div><div class='ctx'>  * on file mode.  This is the plain old disk filesystem permission</div><div class='del'>- * modell.</div><div class='add'>+ * model.</div><div class='ctx'>  *</div><div class='ctx'>  * 2) "Remote" access checking, where server is responsible for</div><div class='ctx'>  * checking permission in each inode operation.  An exception to this</div><div class='hunk'>@@ -1197,7 +1741,7 @@ static int fuse_perm_getattr(struct inode *inode, int mask)</div><div class='ctx'>  * access request is sent.  Execute permission is still checked</div><div class='ctx'>  * locally based on file mode.</div><div class='ctx'>  */</div><div class='del'>-static int fuse_permission(struct user_namespace *mnt_userns,</div><div class='add'>+static int fuse_permission(struct mnt_idmap *idmap,</div><div class='ctx'> 			   struct inode *inode, int mask)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_conn *fc = get_fuse_conn(inode);</div><div class='hunk'>@@ -1229,7 +1773,7 @@ static int fuse_permission(struct user_namespace *mnt_userns,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (fc-&gt;default_permissions) {</div><div class='del'>-		err = generic_permission(&amp;init_user_ns, inode, mask);</div><div class='add'>+		err = generic_permission(idmap, inode, mask);</div><div class='ctx'> </div><div class='ctx'> 		/* If permission is denied, try to refresh file</div><div class='ctx'> 		   attributes.  This is also needed, because the root</div><div class='hunk'>@@ -1237,7 +1781,7 @@ static int fuse_permission(struct user_namespace *mnt_userns,</div><div class='ctx'> 		if (err == -EACCES &amp;&amp; !refreshed) {</div><div class='ctx'> 			err = fuse_perm_getattr(inode, mask);</div><div class='ctx'> 			if (!err)</div><div class='del'>-				err = generic_permission(&amp;init_user_ns,</div><div class='add'>+				err = generic_permission(idmap,</div><div class='ctx'> 							 inode, mask);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -1260,13 +1804,13 @@ static int fuse_permission(struct user_namespace *mnt_userns,</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fuse_readlink_page(struct inode *inode, struct page *page)</div><div class='add'>+static int fuse_readlink_folio(struct inode *inode, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_mount *fm = get_fuse_mount(inode);</div><div class='del'>-	struct fuse_page_desc desc = { .length = PAGE_SIZE - 1 };</div><div class='add'>+	struct fuse_folio_desc desc = { .length = folio_size(folio) - 1 };</div><div class='ctx'> 	struct fuse_args_pages ap = {</div><div class='del'>-		.num_pages = 1,</div><div class='del'>-		.pages = &amp;page,</div><div class='add'>+		.num_folios = 1,</div><div class='add'>+		.folios = &amp;folio,</div><div class='ctx'> 		.descs = &amp;desc,</div><div class='ctx'> 	};</div><div class='ctx'> 	char *link;</div><div class='hunk'>@@ -1289,7 +1833,7 @@ static int fuse_readlink_page(struct inode *inode, struct page *page)</div><div class='ctx'> 	if (WARN_ON(res &gt;= PAGE_SIZE))</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> </div><div class='del'>-	link = page_address(page);</div><div class='add'>+	link = folio_address(folio);</div><div class='ctx'> 	link[res] = '\0';</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -1299,7 +1843,7 @@ static const char *fuse_get_link(struct dentry *dentry, struct inode *inode,</div><div class='ctx'> 				 struct delayed_call *callback)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_conn *fc = get_fuse_conn(inode);</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	err = -EIO;</div><div class='hunk'>@@ -1307,26 +1851,26 @@ static const char *fuse_get_link(struct dentry *dentry, struct inode *inode,</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> </div><div class='ctx'> 	if (fc-&gt;cache_symlinks)</div><div class='del'>-		return page_get_link(dentry, inode, callback);</div><div class='add'>+		return page_get_link_raw(dentry, inode, callback);</div><div class='ctx'> </div><div class='ctx'> 	err = -ECHILD;</div><div class='ctx'> 	if (!dentry)</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> </div><div class='del'>-	page = alloc_page(GFP_KERNEL);</div><div class='add'>+	folio = folio_alloc(GFP_KERNEL, 0);</div><div class='ctx'> 	err = -ENOMEM;</div><div class='del'>-	if (!page)</div><div class='add'>+	if (!folio)</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> </div><div class='del'>-	err = fuse_readlink_page(inode, page);</div><div class='add'>+	err = fuse_readlink_folio(inode, folio);</div><div class='ctx'> 	if (err) {</div><div class='del'>-		__free_page(page);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	set_delayed_call(callback, page_put_link, page);</div><div class='add'>+	set_delayed_call(callback, page_put_link, folio);</div><div class='ctx'> </div><div class='del'>-	return page_address(page);</div><div class='add'>+	return folio_address(folio);</div><div class='ctx'> </div><div class='ctx'> out_err:</div><div class='ctx'> 	return ERR_PTR(err);</div><div class='hunk'>@@ -1334,7 +1878,32 @@ out_err:</div><div class='ctx'> </div><div class='ctx'> static int fuse_dir_open(struct inode *inode, struct file *file)</div><div class='ctx'> {</div><div class='del'>-	return fuse_open_common(inode, file, true);</div><div class='add'>+	struct fuse_mount *fm = get_fuse_mount(inode);</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	if (fuse_is_bad(inode))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	err = generic_file_open(inode, file);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	err = fuse_do_open(fm, get_node_id(inode), file, true);</div><div class='add'>+	if (!err) {</div><div class='add'>+		struct fuse_file *ff = file-&gt;private_data;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Keep handling FOPEN_STREAM and FOPEN_NONSEEKABLE for</div><div class='add'>+		 * directories for backward compatibility, though it's unlikely</div><div class='add'>+		 * to be useful.</div><div class='add'>+		 */</div><div class='add'>+		if (ff-&gt;open_flags &amp; (FOPEN_STREAM | FOPEN_NONSEEKABLE))</div><div class='add'>+			nonseekable_open(inode, file);</div><div class='add'>+		if (!(ff-&gt;open_flags &amp; FOPEN_KEEP_CACHE))</div><div class='add'>+			invalidate_inode_pages2(inode-&gt;i_mapping);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int fuse_dir_release(struct inode *inode, struct file *file)</div><div class='hunk'>@@ -1410,17 +1979,29 @@ static bool update_mtime(unsigned ivalid, bool trust_local_mtime)</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void iattr_to_fattr(struct fuse_conn *fc, struct iattr *iattr,</div><div class='del'>-			   struct fuse_setattr_in *arg, bool trust_local_cmtime)</div><div class='add'>+static void iattr_to_fattr(struct mnt_idmap *idmap, struct fuse_conn *fc,</div><div class='add'>+			   struct iattr *iattr, struct fuse_setattr_in *arg,</div><div class='add'>+			   bool trust_local_cmtime)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned ivalid = iattr-&gt;ia_valid;</div><div class='ctx'> </div><div class='ctx'> 	if (ivalid &amp; ATTR_MODE)</div><div class='ctx'> 		arg-&gt;valid |= FATTR_MODE,   arg-&gt;mode = iattr-&gt;ia_mode;</div><div class='del'>-	if (ivalid &amp; ATTR_UID)</div><div class='del'>-		arg-&gt;valid |= FATTR_UID,    arg-&gt;uid = from_kuid(fc-&gt;user_ns, iattr-&gt;ia_uid);</div><div class='del'>-	if (ivalid &amp; ATTR_GID)</div><div class='del'>-		arg-&gt;valid |= FATTR_GID,    arg-&gt;gid = from_kgid(fc-&gt;user_ns, iattr-&gt;ia_gid);</div><div class='add'>+</div><div class='add'>+	if (ivalid &amp; ATTR_UID) {</div><div class='add'>+		kuid_t fsuid = from_vfsuid(idmap, fc-&gt;user_ns, iattr-&gt;ia_vfsuid);</div><div class='add'>+</div><div class='add'>+		arg-&gt;valid |= FATTR_UID;</div><div class='add'>+		arg-&gt;uid = from_kuid(fc-&gt;user_ns, fsuid);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (ivalid &amp; ATTR_GID) {</div><div class='add'>+		kgid_t fsgid = from_vfsgid(idmap, fc-&gt;user_ns, iattr-&gt;ia_vfsgid);</div><div class='add'>+</div><div class='add'>+		arg-&gt;valid |= FATTR_GID;</div><div class='add'>+		arg-&gt;gid = from_kgid(fc-&gt;user_ns, fsgid);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (ivalid &amp; ATTR_SIZE)</div><div class='ctx'> 		arg-&gt;valid |= FATTR_SIZE,   arg-&gt;size = iattr-&gt;ia_size;</div><div class='ctx'> 	if (ivalid &amp; ATTR_ATIME) {</div><div class='hunk'>@@ -1516,12 +2097,12 @@ int fuse_flush_times(struct inode *inode, struct fuse_file *ff)</div><div class='ctx'> 	memset(&amp;outarg, 0, sizeof(outarg));</div><div class='ctx'> </div><div class='ctx'> 	inarg.valid = FATTR_MTIME;</div><div class='del'>-	inarg.mtime = inode-&gt;i_mtime.tv_sec;</div><div class='del'>-	inarg.mtimensec = inode-&gt;i_mtime.tv_nsec;</div><div class='add'>+	inarg.mtime = inode_get_mtime_sec(inode);</div><div class='add'>+	inarg.mtimensec = inode_get_mtime_nsec(inode);</div><div class='ctx'> 	if (fm-&gt;fc-&gt;minor &gt;= 23) {</div><div class='ctx'> 		inarg.valid |= FATTR_CTIME;</div><div class='del'>-		inarg.ctime = inode-&gt;i_ctime.tv_sec;</div><div class='del'>-		inarg.ctimensec = inode-&gt;i_ctime.tv_nsec;</div><div class='add'>+		inarg.ctime = inode_get_ctime_sec(inode);</div><div class='add'>+		inarg.ctimensec = inode_get_ctime_nsec(inode);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (ff) {</div><div class='ctx'> 		inarg.valid |= FATTR_FH;</div><div class='hunk'>@@ -1540,8 +2121,8 @@ int fuse_flush_times(struct inode *inode, struct fuse_file *ff)</div><div class='ctx'>  * vmtruncate() doesn't allow for this case, so do the rlimit checking</div><div class='ctx'>  * and the actual truncation by hand.</div><div class='ctx'>  */</div><div class='del'>-int fuse_do_setattr(struct dentry *dentry, struct iattr *attr,</div><div class='del'>-		    struct file *file)</div><div class='add'>+int fuse_do_setattr(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='add'>+		    struct iattr *attr, struct file *file)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	struct fuse_mount *fm = get_fuse_mount(inode);</div><div class='hunk'>@@ -1557,11 +2138,12 @@ int fuse_do_setattr(struct dentry *dentry, struct iattr *attr,</div><div class='ctx'> 	int err;</div><div class='ctx'> 	bool trust_local_cmtime = is_wb;</div><div class='ctx'> 	bool fault_blocked = false;</div><div class='add'>+	u64 attr_version;</div><div class='ctx'> </div><div class='ctx'> 	if (!fc-&gt;default_permissions)</div><div class='ctx'> 		attr-&gt;ia_valid |= ATTR_FORCE;</div><div class='ctx'> </div><div class='del'>-	err = setattr_prepare(&amp;init_user_ns, dentry, attr);</div><div class='add'>+	err = setattr_prepare(idmap, dentry, attr);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='hunk'>@@ -1574,7 +2156,7 @@ int fuse_do_setattr(struct dentry *dentry, struct iattr *attr,</div><div class='ctx'> 	if (FUSE_IS_DAX(inode) &amp;&amp; is_truncate) {</div><div class='ctx'> 		filemap_invalidate_lock(mapping);</div><div class='ctx'> 		fault_blocked = true;</div><div class='del'>-		err = fuse_dax_break_layouts(inode, 0, 0);</div><div class='add'>+		err = fuse_dax_break_layouts(inode, 0, -1);</div><div class='ctx'> 		if (err) {</div><div class='ctx'> 			filemap_invalidate_unlock(mapping);</div><div class='ctx'> 			return err;</div><div class='hunk'>@@ -1620,7 +2202,7 @@ int fuse_do_setattr(struct dentry *dentry, struct iattr *attr,</div><div class='ctx'> </div><div class='ctx'> 	memset(&amp;inarg, 0, sizeof(inarg));</div><div class='ctx'> 	memset(&amp;outarg, 0, sizeof(outarg));</div><div class='del'>-	iattr_to_fattr(fc, attr, &amp;inarg, trust_local_cmtime);</div><div class='add'>+	iattr_to_fattr(idmap, fc, attr, &amp;inarg, trust_local_cmtime);</div><div class='ctx'> 	if (file) {</div><div class='ctx'> 		struct fuse_file *ff = file-&gt;private_data;</div><div class='ctx'> 		inarg.valid |= FATTR_FH;</div><div class='hunk'>@@ -1641,6 +2223,8 @@ int fuse_do_setattr(struct dentry *dentry, struct iattr *attr,</div><div class='ctx'> 		if (fc-&gt;handle_killpriv_v2 &amp;&amp; !capable(CAP_FSETID))</div><div class='ctx'> 			inarg.valid |= FATTR_KILL_SUIDGID;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	attr_version = fuse_get_attr_version(fm-&gt;fc);</div><div class='ctx'> 	fuse_setattr_fill(fc, &amp;args, inode, &amp;inarg, &amp;outarg);</div><div class='ctx'> 	err = fuse_simple_request(fm, &amp;args);</div><div class='ctx'> 	if (err) {</div><div class='hunk'>@@ -1660,15 +2244,23 @@ int fuse_do_setattr(struct dentry *dentry, struct iattr *attr,</div><div class='ctx'> 	/* the kernel maintains i_mtime locally */</div><div class='ctx'> 	if (trust_local_cmtime) {</div><div class='ctx'> 		if (attr-&gt;ia_valid &amp; ATTR_MTIME)</div><div class='del'>-			inode-&gt;i_mtime = attr-&gt;ia_mtime;</div><div class='add'>+			inode_set_mtime_to_ts(inode, attr-&gt;ia_mtime);</div><div class='ctx'> 		if (attr-&gt;ia_valid &amp; ATTR_CTIME)</div><div class='del'>-			inode-&gt;i_ctime = attr-&gt;ia_ctime;</div><div class='add'>+			inode_set_ctime_to_ts(inode, attr-&gt;ia_ctime);</div><div class='ctx'> 		/* FIXME: clear I_DIRTY_SYNC? */</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	fuse_change_attributes_common(inode, &amp;outarg.attr,</div><div class='del'>-				      attr_timeout(&amp;outarg),</div><div class='del'>-				      fuse_get_cache_mask(inode));</div><div class='add'>+	if (fi-&gt;attr_version &gt; attr_version) {</div><div class='add'>+		/*</div><div class='add'>+		 * Apply attributes, for example for fsnotify_change(), but set</div><div class='add'>+		 * attribute timeout to zero.</div><div class='add'>+		 */</div><div class='add'>+		outarg.attr_valid = outarg.attr_valid_nsec = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	fuse_change_attributes_common(inode, &amp;outarg.attr, NULL,</div><div class='add'>+				      ATTR_TIMEOUT(&amp;outarg),</div><div class='add'>+				      fuse_get_cache_mask(inode), 0);</div><div class='ctx'> 	oldsize = inode-&gt;i_size;</div><div class='ctx'> 	/* see the comment in fuse_change_attributes() */</div><div class='ctx'> 	if (!is_wb || is_truncate)</div><div class='hunk'>@@ -1682,7 +2274,7 @@ int fuse_do_setattr(struct dentry *dentry, struct iattr *attr,</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Only call invalidate_inode_pages2() after removing</div><div class='del'>-	 * FUSE_NOWRITE, otherwise fuse_launder_page() would deadlock.</div><div class='add'>+	 * FUSE_NOWRITE, otherwise fuse_launder_folio() would deadlock.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if ((is_truncate || !is_wb) &amp;&amp;</div><div class='ctx'> 	    S_ISREG(inode-&gt;i_mode) &amp;&amp; oldsize != outarg.attr.size) {</div><div class='hunk'>@@ -1708,7 +2300,7 @@ error:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fuse_setattr(struct user_namespace *mnt_userns, struct dentry *entry,</div><div class='add'>+static int fuse_setattr(struct mnt_idmap *idmap, struct dentry *entry,</div><div class='ctx'> 			struct iattr *attr)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(entry);</div><div class='hunk'>@@ -1737,7 +2329,7 @@ static int fuse_setattr(struct user_namespace *mnt_userns, struct dentry *entry,</div><div class='ctx'> 			 * ia_mode calculation may have used stale i_mode.</div><div class='ctx'> 			 * Refresh and recalculate.</div><div class='ctx'> 			 */</div><div class='del'>-			ret = fuse_do_getattr(inode, NULL, file);</div><div class='add'>+			ret = fuse_do_getattr(idmap, inode, NULL, file);</div><div class='ctx'> 			if (ret)</div><div class='ctx'> 				return ret;</div><div class='ctx'> </div><div class='hunk'>@@ -1755,7 +2347,7 @@ static int fuse_setattr(struct user_namespace *mnt_userns, struct dentry *entry,</div><div class='ctx'> 	if (!attr-&gt;ia_valid)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	ret = fuse_do_setattr(entry, attr, file);</div><div class='add'>+	ret = fuse_do_setattr(idmap, entry, attr, file);</div><div class='ctx'> 	if (!ret) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * If filesystem supports acls it may have updated acl xattrs in</div><div class='hunk'>@@ -1771,7 +2363,7 @@ static int fuse_setattr(struct user_namespace *mnt_userns, struct dentry *entry,</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fuse_getattr(struct user_namespace *mnt_userns,</div><div class='add'>+static int fuse_getattr(struct mnt_idmap *idmap,</div><div class='ctx'> 			const struct path *path, struct kstat *stat,</div><div class='ctx'> 			u32 request_mask, unsigned int flags)</div><div class='ctx'> {</div><div class='hunk'>@@ -1794,7 +2386,7 @@ static int fuse_getattr(struct user_namespace *mnt_userns,</div><div class='ctx'> 		return -EACCES;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return fuse_update_get_attr(inode, NULL, stat, request_mask, flags);</div><div class='add'>+	return fuse_update_get_attr(idmap, inode, NULL, stat, request_mask, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct inode_operations fuse_dir_inode_operations = {</div><div class='hunk'>@@ -1808,10 +2400,12 @@ static const struct inode_operations fuse_dir_inode_operations = {</div><div class='ctx'> 	.setattr	= fuse_setattr,</div><div class='ctx'> 	.create		= fuse_create,</div><div class='ctx'> 	.atomic_open	= fuse_atomic_open,</div><div class='add'>+	.tmpfile	= fuse_tmpfile,</div><div class='ctx'> 	.mknod		= fuse_mknod,</div><div class='ctx'> 	.permission	= fuse_permission,</div><div class='ctx'> 	.getattr	= fuse_getattr,</div><div class='ctx'> 	.listxattr	= fuse_listxattr,</div><div class='add'>+	.get_inode_acl	= fuse_get_inode_acl,</div><div class='ctx'> 	.get_acl	= fuse_get_acl,</div><div class='ctx'> 	.set_acl	= fuse_set_acl,</div><div class='ctx'> 	.fileattr_get	= fuse_fileattr_get,</div><div class='hunk'>@@ -1827,6 +2421,7 @@ static const struct file_operations fuse_dir_operations = {</div><div class='ctx'> 	.fsync		= fuse_dir_fsync,</div><div class='ctx'> 	.unlocked_ioctl	= fuse_dir_ioctl,</div><div class='ctx'> 	.compat_ioctl	= fuse_dir_compat_ioctl,</div><div class='add'>+	.setlease	= simple_nosetlease,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct inode_operations fuse_common_inode_operations = {</div><div class='hunk'>@@ -1834,6 +2429,7 @@ static const struct inode_operations fuse_common_inode_operations = {</div><div class='ctx'> 	.permission	= fuse_permission,</div><div class='ctx'> 	.getattr	= fuse_getattr,</div><div class='ctx'> 	.listxattr	= fuse_listxattr,</div><div class='add'>+	.get_inode_acl	= fuse_get_inode_acl,</div><div class='ctx'> 	.get_acl	= fuse_get_acl,</div><div class='ctx'> 	.set_acl	= fuse_set_acl,</div><div class='ctx'> 	.fileattr_get	= fuse_fileattr_get,</div><div class='hunk'>@@ -1866,20 +2462,20 @@ void fuse_init_dir(struct inode *inode)</div><div class='ctx'> 	fi-&gt;rdc.version = 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fuse_symlink_readpage(struct file *null, struct page *page)</div><div class='add'>+static int fuse_symlink_read_folio(struct file *null, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	int err = fuse_readlink_page(page-&gt;mapping-&gt;host, page);</div><div class='add'>+	int err = fuse_readlink_folio(folio-&gt;mapping-&gt;host, folio);</div><div class='ctx'> </div><div class='ctx'> 	if (!err)</div><div class='del'>-		SetPageUptodate(page);</div><div class='add'>+		folio_mark_uptodate(folio);</div><div class='ctx'> </div><div class='del'>-	unlock_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct address_space_operations fuse_symlink_aops = {</div><div class='del'>-	.readpage	= fuse_symlink_readpage,</div><div class='add'>+	.read_folio	= fuse_symlink_read_folio,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> void fuse_init_symlink(struct inode *inode)</div><div class='head'>diff --git a/fs/fuse/file.c b/fs/fuse/file.c<br/>index 9d6c5f6361f7..01bc894e9c2b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fuse/file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/file.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fuse/file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fuse/file.c</a></div><div class='hunk'>@@ -18,6 +18,10 @@</div><div class='ctx'> #include &lt;linux/falloc.h&gt;</div><div class='ctx'> #include &lt;linux/uio.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/filelock.h&gt;</div><div class='add'>+#include &lt;linux/splice.h&gt;</div><div class='add'>+#include &lt;linux/task_io_accounting_ops.h&gt;</div><div class='add'>+#include &lt;linux/iomap.h&gt;</div><div class='ctx'> </div><div class='ctx'> static int fuse_send_open(struct fuse_mount *fm, u64 nodeid,</div><div class='ctx'> 			  unsigned int open_flags, int opcode,</div><div class='hunk'>@@ -48,13 +52,7 @@ static int fuse_send_open(struct fuse_mount *fm, u64 nodeid,</div><div class='ctx'> 	return fuse_simple_request(fm, &amp;args);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct fuse_release_args {</div><div class='del'>-	struct fuse_args args;</div><div class='del'>-	struct fuse_release_in inarg;</div><div class='del'>-	struct inode *inode;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct fuse_file *fuse_file_alloc(struct fuse_mount *fm)</div><div class='add'>+struct fuse_file *fuse_file_alloc(struct fuse_mount *fm, bool release)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_file *ff;</div><div class='ctx'> </div><div class='hunk'>@@ -63,15 +61,15 @@ struct fuse_file *fuse_file_alloc(struct fuse_mount *fm)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='ctx'> 	ff-&gt;fm = fm;</div><div class='del'>-	ff-&gt;release_args = kzalloc(sizeof(*ff-&gt;release_args),</div><div class='del'>-				   GFP_KERNEL_ACCOUNT);</div><div class='del'>-	if (!ff-&gt;release_args) {</div><div class='del'>-		kfree(ff);</div><div class='del'>-		return NULL;</div><div class='add'>+	if (release) {</div><div class='add'>+		ff-&gt;args = kzalloc(sizeof(*ff-&gt;args), GFP_KERNEL_ACCOUNT);</div><div class='add'>+		if (!ff-&gt;args) {</div><div class='add'>+			kfree(ff);</div><div class='add'>+			return NULL;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	INIT_LIST_HEAD(&amp;ff-&gt;write_entry);</div><div class='del'>-	mutex_init(&amp;ff-&gt;readdir.lock);</div><div class='ctx'> 	refcount_set(&amp;ff-&gt;count, 1);</div><div class='ctx'> 	RB_CLEAR_NODE(&amp;ff-&gt;polled_node);</div><div class='ctx'> 	init_waitqueue_head(&amp;ff-&gt;poll_wait);</div><div class='hunk'>@@ -83,8 +81,7 @@ struct fuse_file *fuse_file_alloc(struct fuse_mount *fm)</div><div class='ctx'> </div><div class='ctx'> void fuse_file_free(struct fuse_file *ff)</div><div class='ctx'> {</div><div class='del'>-	kfree(ff-&gt;release_args);</div><div class='del'>-	mutex_destroy(&amp;ff-&gt;readdir.lock);</div><div class='add'>+	kfree(ff-&gt;args);</div><div class='ctx'> 	kfree(ff);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -103,13 +100,18 @@ static void fuse_release_end(struct fuse_mount *fm, struct fuse_args *args,</div><div class='ctx'> 	kfree(ra);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void fuse_file_put(struct fuse_file *ff, bool sync, bool isdir)</div><div class='add'>+static void fuse_file_put(struct fuse_file *ff, bool sync)</div><div class='ctx'> {</div><div class='ctx'> 	if (refcount_dec_and_test(&amp;ff-&gt;count)) {</div><div class='del'>-		struct fuse_args *args = &amp;ff-&gt;release_args-&gt;args;</div><div class='add'>+		struct fuse_release_args *ra = &amp;ff-&gt;args-&gt;release_args;</div><div class='add'>+		struct fuse_args *args = (ra ? &amp;ra-&gt;args : NULL);</div><div class='add'>+</div><div class='add'>+		if (ra &amp;&amp; ra-&gt;inode)</div><div class='add'>+			fuse_file_io_release(ff, ra-&gt;inode);</div><div class='ctx'> </div><div class='del'>-		if (isdir ? ff-&gt;fm-&gt;fc-&gt;no_opendir : ff-&gt;fm-&gt;fc-&gt;no_open) {</div><div class='del'>-			/* Do nothing when client does not implement 'open' */</div><div class='add'>+		if (!args) {</div><div class='add'>+			/* Do nothing when server does not implement 'opendir' */</div><div class='add'>+		} else if (args-&gt;opcode == FUSE_RELEASE &amp;&amp; ff-&gt;fm-&gt;fc-&gt;no_open) {</div><div class='ctx'> 			fuse_release_end(ff-&gt;fm, args, 0);</div><div class='ctx'> 		} else if (sync) {</div><div class='ctx'> 			fuse_simple_request(ff-&gt;fm, args);</div><div class='hunk'>@@ -130,31 +132,45 @@ struct fuse_file *fuse_file_open(struct fuse_mount *fm, u64 nodeid,</div><div class='ctx'> 	struct fuse_conn *fc = fm-&gt;fc;</div><div class='ctx'> 	struct fuse_file *ff;</div><div class='ctx'> 	int opcode = isdir ? FUSE_OPENDIR : FUSE_OPEN;</div><div class='add'>+	bool open = isdir ? !fc-&gt;no_opendir : !fc-&gt;no_open;</div><div class='add'>+	bool release = !isdir || open;</div><div class='ctx'> </div><div class='del'>-	ff = fuse_file_alloc(fm);</div><div class='add'>+	/*</div><div class='add'>+	 * ff-&gt;args-&gt;release_args still needs to be allocated (so we can hold an</div><div class='add'>+	 * inode reference while there are pending inflight file operations when</div><div class='add'>+	 * -&gt;release() is called, see fuse_prepare_release()) even if</div><div class='add'>+	 * fc-&gt;no_open is set else it becomes possible for reclaim to deadlock</div><div class='add'>+	 * if while servicing the readahead request the server triggers reclaim</div><div class='add'>+	 * and reclaim evicts the inode of the file being read ahead.</div><div class='add'>+	 */</div><div class='add'>+	ff = fuse_file_alloc(fm, release);</div><div class='ctx'> 	if (!ff)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='ctx'> 	ff-&gt;fh = 0;</div><div class='ctx'> 	/* Default for no-open */</div><div class='ctx'> 	ff-&gt;open_flags = FOPEN_KEEP_CACHE | (isdir ? FOPEN_CACHE_DIR : 0);</div><div class='del'>-	if (isdir ? !fc-&gt;no_opendir : !fc-&gt;no_open) {</div><div class='del'>-		struct fuse_open_out outarg;</div><div class='add'>+	if (open) {</div><div class='add'>+		/* Store outarg for fuse_finish_open() */</div><div class='add'>+		struct fuse_open_out *outargp = &amp;ff-&gt;args-&gt;open_outarg;</div><div class='ctx'> 		int err;</div><div class='ctx'> </div><div class='del'>-		err = fuse_send_open(fm, nodeid, open_flags, opcode, &amp;outarg);</div><div class='add'>+		err = fuse_send_open(fm, nodeid, open_flags, opcode, outargp);</div><div class='ctx'> 		if (!err) {</div><div class='del'>-			ff-&gt;fh = outarg.fh;</div><div class='del'>-			ff-&gt;open_flags = outarg.open_flags;</div><div class='del'>-</div><div class='add'>+			ff-&gt;fh = outargp-&gt;fh;</div><div class='add'>+			ff-&gt;open_flags = outargp-&gt;open_flags;</div><div class='ctx'> 		} else if (err != -ENOSYS) {</div><div class='ctx'> 			fuse_file_free(ff);</div><div class='ctx'> 			return ERR_PTR(err);</div><div class='ctx'> 		} else {</div><div class='del'>-			if (isdir)</div><div class='add'>+			if (isdir) {</div><div class='add'>+				/* No release needed */</div><div class='add'>+				kfree(ff-&gt;args);</div><div class='add'>+				ff-&gt;args = NULL;</div><div class='ctx'> 				fc-&gt;no_opendir = 1;</div><div class='del'>-			else</div><div class='add'>+			} else {</div><div class='ctx'> 				fc-&gt;no_open = 1;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -193,44 +209,50 @@ static void fuse_link_write_file(struct file *file)</div><div class='ctx'> 	spin_unlock(&amp;fi-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void fuse_finish_open(struct inode *inode, struct file *file)</div><div class='add'>+int fuse_finish_open(struct inode *inode, struct file *file)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_file *ff = file-&gt;private_data;</div><div class='ctx'> 	struct fuse_conn *fc = get_fuse_conn(inode);</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = fuse_file_io_open(file, inode);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='ctx'> 	if (ff-&gt;open_flags &amp; FOPEN_STREAM)</div><div class='ctx'> 		stream_open(inode, file);</div><div class='ctx'> 	else if (ff-&gt;open_flags &amp; FOPEN_NONSEEKABLE)</div><div class='ctx'> 		nonseekable_open(inode, file);</div><div class='ctx'> </div><div class='del'>-	if (fc-&gt;atomic_o_trunc &amp;&amp; (file-&gt;f_flags &amp; O_TRUNC)) {</div><div class='del'>-		struct fuse_inode *fi = get_fuse_inode(inode);</div><div class='del'>-</div><div class='del'>-		spin_lock(&amp;fi-&gt;lock);</div><div class='del'>-		fi-&gt;attr_version = atomic64_inc_return(&amp;fc-&gt;attr_version);</div><div class='del'>-		i_size_write(inode, 0);</div><div class='del'>-		spin_unlock(&amp;fi-&gt;lock);</div><div class='del'>-		truncate_pagecache(inode, 0);</div><div class='del'>-		file_update_time(file);</div><div class='del'>-		fuse_invalidate_attr_mask(inode, FUSE_STATX_MODSIZE);</div><div class='del'>-	} else if (!(ff-&gt;open_flags &amp; FOPEN_KEEP_CACHE)) {</div><div class='del'>-		invalidate_inode_pages2(inode-&gt;i_mapping);</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	if ((file-&gt;f_mode &amp; FMODE_WRITE) &amp;&amp; fc-&gt;writeback_cache)</div><div class='ctx'> 		fuse_link_write_file(file);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fuse_truncate_update_attr(struct inode *inode, struct file *file)</div><div class='add'>+{</div><div class='add'>+	struct fuse_conn *fc = get_fuse_conn(inode);</div><div class='add'>+	struct fuse_inode *fi = get_fuse_inode(inode);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fi-&gt;lock);</div><div class='add'>+	fi-&gt;attr_version = atomic64_inc_return(&amp;fc-&gt;attr_version);</div><div class='add'>+	i_size_write(inode, 0);</div><div class='add'>+	spin_unlock(&amp;fi-&gt;lock);</div><div class='add'>+	file_update_time(file);</div><div class='add'>+	fuse_invalidate_attr_mask(inode, FUSE_STATX_MODSIZE);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int fuse_open_common(struct inode *inode, struct file *file, bool isdir)</div><div class='add'>+static int fuse_open(struct inode *inode, struct file *file)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_mount *fm = get_fuse_mount(inode);</div><div class='add'>+	struct fuse_inode *fi = get_fuse_inode(inode);</div><div class='ctx'> 	struct fuse_conn *fc = fm-&gt;fc;</div><div class='add'>+	struct fuse_file *ff;</div><div class='ctx'> 	int err;</div><div class='del'>-	bool is_wb_truncate = (file-&gt;f_flags &amp; O_TRUNC) &amp;&amp;</div><div class='del'>-			  fc-&gt;atomic_o_trunc &amp;&amp;</div><div class='del'>-			  fc-&gt;writeback_cache;</div><div class='del'>-	bool dax_truncate = (file-&gt;f_flags &amp; O_TRUNC) &amp;&amp;</div><div class='del'>-			  fc-&gt;atomic_o_trunc &amp;&amp; FUSE_IS_DAX(inode);</div><div class='add'>+	bool is_truncate = (file-&gt;f_flags &amp; O_TRUNC) &amp;&amp; fc-&gt;atomic_o_trunc;</div><div class='add'>+	bool is_wb_truncate = is_truncate &amp;&amp; fc-&gt;writeback_cache;</div><div class='add'>+	bool dax_truncate = is_truncate &amp;&amp; FUSE_IS_DAX(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (fuse_is_bad(inode))</div><div class='ctx'> 		return -EIO;</div><div class='hunk'>@@ -239,39 +261,54 @@ int fuse_open_common(struct inode *inode, struct file *file, bool isdir)</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	if (is_wb_truncate || dax_truncate) {</div><div class='add'>+	if (is_wb_truncate || dax_truncate)</div><div class='ctx'> 		inode_lock(inode);</div><div class='del'>-		fuse_set_nowrite(inode);</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	if (dax_truncate) {</div><div class='ctx'> 		filemap_invalidate_lock(inode-&gt;i_mapping);</div><div class='del'>-		err = fuse_dax_break_layouts(inode, 0, 0);</div><div class='add'>+		err = fuse_dax_break_layouts(inode, 0, -1);</div><div class='ctx'> 		if (err)</div><div class='del'>-			goto out;</div><div class='add'>+			goto out_inode_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = fuse_do_open(fm, get_node_id(inode), file, isdir);</div><div class='del'>-	if (!err)</div><div class='del'>-		fuse_finish_open(inode, file);</div><div class='add'>+	if (is_wb_truncate || dax_truncate)</div><div class='add'>+		fuse_set_nowrite(inode);</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	if (dax_truncate)</div><div class='del'>-		filemap_invalidate_unlock(inode-&gt;i_mapping);</div><div class='add'>+	err = fuse_do_open(fm, get_node_id(inode), file, false);</div><div class='add'>+	if (!err) {</div><div class='add'>+		ff = file-&gt;private_data;</div><div class='add'>+		err = fuse_finish_open(inode, file);</div><div class='add'>+		if (err)</div><div class='add'>+			fuse_sync_release(fi, ff, file-&gt;f_flags);</div><div class='add'>+		else if (is_truncate)</div><div class='add'>+			fuse_truncate_update_attr(inode, file);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (is_wb_truncate | dax_truncate) {</div><div class='add'>+	if (is_wb_truncate || dax_truncate)</div><div class='ctx'> 		fuse_release_nowrite(inode);</div><div class='del'>-		inode_unlock(inode);</div><div class='add'>+	if (!err) {</div><div class='add'>+		if (is_truncate)</div><div class='add'>+			truncate_pagecache(inode, 0);</div><div class='add'>+		else if (!(ff-&gt;open_flags &amp; FOPEN_KEEP_CACHE))</div><div class='add'>+			invalidate_inode_pages2(inode-&gt;i_mapping);</div><div class='ctx'> 	}</div><div class='add'>+	if (dax_truncate)</div><div class='add'>+		filemap_invalidate_unlock(inode-&gt;i_mapping);</div><div class='add'>+out_inode_unlock:</div><div class='add'>+	if (is_wb_truncate || dax_truncate)</div><div class='add'>+		inode_unlock(inode);</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void fuse_prepare_release(struct fuse_inode *fi, struct fuse_file *ff,</div><div class='del'>-				 unsigned int flags, int opcode)</div><div class='add'>+				 unsigned int flags, int opcode, bool sync)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_conn *fc = ff-&gt;fm-&gt;fc;</div><div class='del'>-	struct fuse_release_args *ra = ff-&gt;release_args;</div><div class='add'>+	struct fuse_release_args *ra = &amp;ff-&gt;args-&gt;release_args;</div><div class='add'>+</div><div class='add'>+	if (fuse_file_passthrough(ff))</div><div class='add'>+		fuse_passthrough_release(ff, fuse_inode_backing(fi));</div><div class='ctx'> </div><div class='ctx'> 	/* Inode is NULL on error path of fuse_create_open() */</div><div class='ctx'> 	if (likely(fi)) {</div><div class='hunk'>@@ -286,6 +323,11 @@ static void fuse_prepare_release(struct fuse_inode *fi, struct fuse_file *ff,</div><div class='ctx'> </div><div class='ctx'> 	wake_up_interruptible_all(&amp;ff-&gt;poll_wait);</div><div class='ctx'> </div><div class='add'>+	if (!ra)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/* ff-&gt;args was used for open outarg */</div><div class='add'>+	memset(ff-&gt;args, 0, sizeof(*ff-&gt;args));</div><div class='ctx'> 	ra-&gt;inarg.fh = ff-&gt;fh;</div><div class='ctx'> 	ra-&gt;inarg.flags = flags;</div><div class='ctx'> 	ra-&gt;args.in_numargs = 1;</div><div class='hunk'>@@ -295,23 +337,28 @@ static void fuse_prepare_release(struct fuse_inode *fi, struct fuse_file *ff,</div><div class='ctx'> 	ra-&gt;args.nodeid = ff-&gt;nodeid;</div><div class='ctx'> 	ra-&gt;args.force = true;</div><div class='ctx'> 	ra-&gt;args.nocreds = true;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Hold inode until release is finished.</div><div class='add'>+	 * From fuse_sync_release() the refcount is 1 and everything's</div><div class='add'>+	 * synchronous, so we are fine with not doing igrab() here.</div><div class='add'>+	 */</div><div class='add'>+	ra-&gt;inode = sync ? NULL : igrab(&amp;fi-&gt;inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void fuse_file_release(struct inode *inode, struct fuse_file *ff,</div><div class='ctx'> 		       unsigned int open_flags, fl_owner_t id, bool isdir)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_inode *fi = get_fuse_inode(inode);</div><div class='del'>-	struct fuse_release_args *ra = ff-&gt;release_args;</div><div class='add'>+	struct fuse_release_args *ra = &amp;ff-&gt;args-&gt;release_args;</div><div class='ctx'> 	int opcode = isdir ? FUSE_RELEASEDIR : FUSE_RELEASE;</div><div class='ctx'> </div><div class='del'>-	fuse_prepare_release(fi, ff, open_flags, opcode);</div><div class='add'>+	fuse_prepare_release(fi, ff, open_flags, opcode, false);</div><div class='ctx'> </div><div class='del'>-	if (ff-&gt;flock) {</div><div class='add'>+	if (ra &amp;&amp; ff-&gt;flock) {</div><div class='ctx'> 		ra-&gt;inarg.release_flags |= FUSE_RELEASE_FLOCK_UNLOCK;</div><div class='ctx'> 		ra-&gt;inarg.lock_owner = fuse_lock_owner_id(ff-&gt;fm-&gt;fc, id);</div><div class='ctx'> 	}</div><div class='del'>-	/* Hold inode until release is finished */</div><div class='del'>-	ra-&gt;inode = igrab(inode);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Normally this will send the RELEASE request, however if</div><div class='hunk'>@@ -321,8 +368,14 @@ void fuse_file_release(struct inode *inode, struct fuse_file *ff,</div><div class='ctx'> 	 * Make the release synchronous if this is a fuseblk mount,</div><div class='ctx'> 	 * synchronous RELEASE is allowed (and desirable) in this case</div><div class='ctx'> 	 * because the server can be trusted not to screw up.</div><div class='add'>+	 *</div><div class='add'>+	 * Always use the asynchronous file put because the current thread</div><div class='add'>+	 * might be the fuse server.  This can happen if a process starts some</div><div class='add'>+	 * aio and closes the fd before the aio completes.  Since aio takes its</div><div class='add'>+	 * own ref to the file, the IO completion has to drop the ref, which is</div><div class='add'>+	 * how the fuse server can end up closing its clients' files.</div><div class='ctx'> 	 */</div><div class='del'>-	fuse_file_put(ff, ff-&gt;fm-&gt;fc-&gt;destroy, isdir);</div><div class='add'>+	fuse_file_put(ff, false);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void fuse_release_common(struct file *file, bool isdir)</div><div class='hunk'>@@ -331,13 +384,17 @@ void fuse_release_common(struct file *file, bool isdir)</div><div class='ctx'> 			  (fl_owner_t) file, isdir);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fuse_open(struct inode *inode, struct file *file)</div><div class='del'>-{</div><div class='del'>-	return fuse_open_common(inode, file, false);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int fuse_release(struct inode *inode, struct file *file)</div><div class='ctx'> {</div><div class='add'>+	struct fuse_conn *fc = get_fuse_conn(inode);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Dirty pages might remain despite write_inode_now() call from</div><div class='add'>+	 * fuse_flush() due to writes racing with the close.</div><div class='add'>+	 */</div><div class='add'>+	if (fc-&gt;writeback_cache)</div><div class='add'>+		write_inode_now(inode, 1);</div><div class='add'>+</div><div class='ctx'> 	fuse_release_common(file, false);</div><div class='ctx'> </div><div class='ctx'> 	/* return value is ignored by VFS */</div><div class='hunk'>@@ -348,12 +405,8 @@ void fuse_sync_release(struct fuse_inode *fi, struct fuse_file *ff,</div><div class='ctx'> 		       unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	WARN_ON(refcount_read(&amp;ff-&gt;count) &gt; 1);</div><div class='del'>-	fuse_prepare_release(fi, ff, flags, FUSE_RELEASE);</div><div class='del'>-	/*</div><div class='del'>-	 * iput(NULL) is a no-op and since the refcount is 1 and everything's</div><div class='del'>-	 * synchronous, we are fine with not doing igrab() here"</div><div class='del'>-	 */</div><div class='del'>-	fuse_file_put(ff, true, false);</div><div class='add'>+	fuse_prepare_release(fi, ff, flags, FUSE_RELEASE, true);</div><div class='add'>+	fuse_file_put(ff, true);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(fuse_sync_release);</div><div class='ctx'> </div><div class='hunk'>@@ -381,74 +434,11 @@ u64 fuse_lock_owner_id(struct fuse_conn *fc, fl_owner_t id)</div><div class='ctx'> </div><div class='ctx'> struct fuse_writepage_args {</div><div class='ctx'> 	struct fuse_io_args ia;</div><div class='del'>-	struct rb_node writepages_entry;</div><div class='ctx'> 	struct list_head queue_entry;</div><div class='del'>-	struct fuse_writepage_args *next;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct fuse_sync_bucket *bucket;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static struct fuse_writepage_args *fuse_find_writeback(struct fuse_inode *fi,</div><div class='del'>-					    pgoff_t idx_from, pgoff_t idx_to)</div><div class='del'>-{</div><div class='del'>-	struct rb_node *n;</div><div class='del'>-</div><div class='del'>-	n = fi-&gt;writepages.rb_node;</div><div class='del'>-</div><div class='del'>-	while (n) {</div><div class='del'>-		struct fuse_writepage_args *wpa;</div><div class='del'>-		pgoff_t curr_index;</div><div class='del'>-</div><div class='del'>-		wpa = rb_entry(n, struct fuse_writepage_args, writepages_entry);</div><div class='del'>-		WARN_ON(get_fuse_inode(wpa-&gt;inode) != fi);</div><div class='del'>-		curr_index = wpa-&gt;ia.write.in.offset &gt;&gt; PAGE_SHIFT;</div><div class='del'>-		if (idx_from &gt;= curr_index + wpa-&gt;ia.ap.num_pages)</div><div class='del'>-			n = n-&gt;rb_right;</div><div class='del'>-		else if (idx_to &lt; curr_index)</div><div class='del'>-			n = n-&gt;rb_left;</div><div class='del'>-		else</div><div class='del'>-			return wpa;</div><div class='del'>-	}</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Check if any page in a range is under writeback</div><div class='del'>- *</div><div class='del'>- * This is currently done by walking the list of writepage requests</div><div class='del'>- * for the inode, which can be pretty inefficient.</div><div class='del'>- */</div><div class='del'>-static bool fuse_range_is_writeback(struct inode *inode, pgoff_t idx_from,</div><div class='del'>-				   pgoff_t idx_to)</div><div class='del'>-{</div><div class='del'>-	struct fuse_inode *fi = get_fuse_inode(inode);</div><div class='del'>-	bool found;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;fi-&gt;lock);</div><div class='del'>-	found = fuse_find_writeback(fi, idx_from, idx_to);</div><div class='del'>-	spin_unlock(&amp;fi-&gt;lock);</div><div class='del'>-</div><div class='del'>-	return found;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline bool fuse_page_is_writeback(struct inode *inode, pgoff_t index)</div><div class='del'>-{</div><div class='del'>-	return fuse_range_is_writeback(inode, index, index);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Wait for page writeback to be completed.</div><div class='del'>- *</div><div class='del'>- * Since fuse doesn't rely on the VM writeback tracking, this has to</div><div class='del'>- * use some other means.</div><div class='del'>- */</div><div class='del'>-static void fuse_wait_on_page_writeback(struct inode *inode, pgoff_t index)</div><div class='del'>-{</div><div class='del'>-	struct fuse_inode *fi = get_fuse_inode(inode);</div><div class='del'>-</div><div class='del'>-	wait_event(fi-&gt;page_waitq, !fuse_page_is_writeback(inode, index));</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Wait for all pending writepages on the inode to finish.</div><div class='ctx'>  *</div><div class='hunk'>@@ -483,10 +473,6 @@ static int fuse_flush(struct file *file, fl_owner_t id)</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	inode_lock(inode);</div><div class='del'>-	fuse_sync_writes(inode);</div><div class='del'>-	inode_unlock(inode);</div><div class='del'>-</div><div class='ctx'> 	err = filemap_check_errors(file-&gt;f_mapping);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='hunk'>@@ -611,16 +597,20 @@ void fuse_read_args_fill(struct fuse_io_args *ia, struct file *file, loff_t pos,</div><div class='ctx'> 	args-&gt;out_args[0].size = count;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void fuse_release_user_pages(struct fuse_args_pages *ap,</div><div class='add'>+static void fuse_release_user_pages(struct fuse_args_pages *ap, ssize_t nres,</div><div class='ctx'> 				    bool should_dirty)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int i;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; ap-&gt;num_pages; i++) {</div><div class='add'>+	for (i = 0; i &lt; ap-&gt;num_folios; i++) {</div><div class='ctx'> 		if (should_dirty)</div><div class='del'>-			set_page_dirty_lock(ap-&gt;pages[i]);</div><div class='del'>-		put_page(ap-&gt;pages[i]);</div><div class='add'>+			folio_mark_dirty_lock(ap-&gt;folios[i]);</div><div class='add'>+		if (ap-&gt;args.is_pinned)</div><div class='add'>+			unpin_folio(ap-&gt;folios[i]);</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	if (nres &gt; 0 &amp;&amp; ap-&gt;args.invalidate_vmap)</div><div class='add'>+		invalidate_kernel_vmap_range(ap-&gt;args.vmap_base, nres);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void fuse_io_release(struct kref *kref)</div><div class='hunk'>@@ -639,7 +629,7 @@ static ssize_t fuse_get_res_by_io(struct fuse_io_priv *io)</div><div class='ctx'> 	return io-&gt;bytes &lt; 0 ? io-&gt;size : io-&gt;bytes;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='add'>+/*</div><div class='ctx'>  * In case of short read, the caller sets 'pos' to the position of</div><div class='ctx'>  * actual end of fuse request in IO request. Otherwise, if bytes_requested</div><div class='ctx'>  * == bytes_transferred or rw == WRITE, the caller sets 'pos' to -1.</div><div class='hunk'>@@ -690,16 +680,16 @@ static void fuse_aio_complete(struct fuse_io_priv *io, int err, ssize_t pos)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct fuse_io_args *fuse_io_alloc(struct fuse_io_priv *io,</div><div class='del'>-					  unsigned int npages)</div><div class='add'>+						 unsigned int nfolios)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_io_args *ia;</div><div class='ctx'> </div><div class='ctx'> 	ia = kzalloc(sizeof(*ia), GFP_KERNEL);</div><div class='ctx'> 	if (ia) {</div><div class='ctx'> 		ia-&gt;io = io;</div><div class='del'>-		ia-&gt;ap.pages = fuse_pages_alloc(npages, GFP_KERNEL,</div><div class='del'>-						&amp;ia-&gt;ap.descs);</div><div class='del'>-		if (!ia-&gt;ap.pages) {</div><div class='add'>+		ia-&gt;ap.folios = fuse_folios_alloc(nfolios, GFP_KERNEL,</div><div class='add'>+						  &amp;ia-&gt;ap.descs);</div><div class='add'>+		if (!ia-&gt;ap.folios) {</div><div class='ctx'> 			kfree(ia);</div><div class='ctx'> 			ia = NULL;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -709,7 +699,7 @@ static struct fuse_io_args *fuse_io_alloc(struct fuse_io_priv *io,</div><div class='ctx'> </div><div class='ctx'> static void fuse_io_free(struct fuse_io_args *ia)</div><div class='ctx'> {</div><div class='del'>-	kfree(ia-&gt;ap.pages);</div><div class='add'>+	kfree(ia-&gt;ap.folios);</div><div class='ctx'> 	kfree(ia);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -719,25 +709,29 @@ static void fuse_aio_complete_req(struct fuse_mount *fm, struct fuse_args *args,</div><div class='ctx'> 	struct fuse_io_args *ia = container_of(args, typeof(*ia), ap.args);</div><div class='ctx'> 	struct fuse_io_priv *io = ia-&gt;io;</div><div class='ctx'> 	ssize_t pos = -1;</div><div class='del'>-</div><div class='del'>-	fuse_release_user_pages(&amp;ia-&gt;ap, io-&gt;should_dirty);</div><div class='add'>+	size_t nres;</div><div class='ctx'> </div><div class='ctx'> 	if (err) {</div><div class='ctx'> 		/* Nothing */</div><div class='ctx'> 	} else if (io-&gt;write) {</div><div class='ctx'> 		if (ia-&gt;write.out.size &gt; ia-&gt;write.in.size) {</div><div class='ctx'> 			err = -EIO;</div><div class='del'>-		} else if (ia-&gt;write.in.size != ia-&gt;write.out.size) {</div><div class='del'>-			pos = ia-&gt;write.in.offset - io-&gt;offset +</div><div class='del'>-				ia-&gt;write.out.size;</div><div class='add'>+		} else {</div><div class='add'>+			nres = ia-&gt;write.out.size;</div><div class='add'>+			if (ia-&gt;write.in.size != ia-&gt;write.out.size)</div><div class='add'>+				pos = ia-&gt;write.in.offset - io-&gt;offset +</div><div class='add'>+				      ia-&gt;write.out.size;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='ctx'> 		u32 outsize = args-&gt;out_args[0].size;</div><div class='ctx'> </div><div class='add'>+		nres = outsize;</div><div class='ctx'> 		if (ia-&gt;read.in.size != outsize)</div><div class='ctx'> 			pos = ia-&gt;read.in.offset - io-&gt;offset + outsize;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	fuse_release_user_pages(&amp;ia-&gt;ap, err ?: nres, io-&gt;should_dirty);</div><div class='add'>+</div><div class='ctx'> 	fuse_aio_complete(io, err, pos);</div><div class='ctx'> 	fuse_io_free(ia);</div><div class='ctx'> }</div><div class='hunk'>@@ -808,34 +802,31 @@ static void fuse_short_read(struct inode *inode, u64 attr_ver, size_t num_read,</div><div class='ctx'> 	 * reached the client fs yet.  So the hole is not present there.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (!fc-&gt;writeback_cache) {</div><div class='del'>-		loff_t pos = page_offset(ap-&gt;pages[0]) + num_read;</div><div class='add'>+		loff_t pos = folio_pos(ap-&gt;folios[0]) + num_read;</div><div class='ctx'> 		fuse_read_update_size(inode, pos, attr_ver);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fuse_do_readpage(struct file *file, struct page *page)</div><div class='add'>+static int fuse_do_readfolio(struct file *file, struct folio *folio,</div><div class='add'>+			     size_t off, size_t len)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	struct fuse_mount *fm = get_fuse_mount(inode);</div><div class='del'>-	loff_t pos = page_offset(page);</div><div class='del'>-	struct fuse_page_desc desc = { .length = PAGE_SIZE };</div><div class='add'>+	loff_t pos = folio_pos(folio) + off;</div><div class='add'>+	struct fuse_folio_desc desc = {</div><div class='add'>+		.offset = off,</div><div class='add'>+		.length = len,</div><div class='add'>+	};</div><div class='ctx'> 	struct fuse_io_args ia = {</div><div class='ctx'> 		.ap.args.page_zeroing = true,</div><div class='ctx'> 		.ap.args.out_pages = true,</div><div class='del'>-		.ap.num_pages = 1,</div><div class='del'>-		.ap.pages = &amp;page,</div><div class='add'>+		.ap.num_folios = 1,</div><div class='add'>+		.ap.folios = &amp;folio,</div><div class='ctx'> 		.ap.descs = &amp;desc,</div><div class='ctx'> 	};</div><div class='ctx'> 	ssize_t res;</div><div class='ctx'> 	u64 attr_ver;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Page writeback can extend beyond the lifetime of the</div><div class='del'>-	 * page-cache page, so make sure we read a properly synced</div><div class='del'>-	 * page.</div><div class='del'>-	 */</div><div class='del'>-	fuse_wait_on_page_writeback(inode, page-&gt;index);</div><div class='del'>-</div><div class='ctx'> 	attr_ver = fuse_get_attr_version(fm-&gt;fc);</div><div class='ctx'> </div><div class='ctx'> 	/* Don't overflow end offset */</div><div class='hunk'>@@ -852,25 +843,155 @@ static int fuse_do_readpage(struct file *file, struct page *page)</div><div class='ctx'> 	if (res &lt; desc.length)</div><div class='ctx'> 		fuse_short_read(inode, attr_ver, res, &amp;ia.ap);</div><div class='ctx'> </div><div class='del'>-	SetPageUptodate(page);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int fuse_iomap_begin(struct inode *inode, loff_t offset, loff_t length,</div><div class='add'>+			    unsigned int flags, struct iomap *iomap,</div><div class='add'>+			    struct iomap *srcmap)</div><div class='add'>+{</div><div class='add'>+	iomap-&gt;type = IOMAP_MAPPED;</div><div class='add'>+	iomap-&gt;length = length;</div><div class='add'>+	iomap-&gt;offset = offset;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct iomap_ops fuse_iomap_ops = {</div><div class='add'>+	.iomap_begin	= fuse_iomap_begin,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct fuse_fill_read_data {</div><div class='add'>+	struct file *file;</div><div class='add'>+</div><div class='add'>+	/* Fields below are used if sending the read request asynchronously */</div><div class='add'>+	struct fuse_conn *fc;</div><div class='add'>+	struct fuse_io_args *ia;</div><div class='add'>+	unsigned int nr_bytes;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/* forward declarations */</div><div class='add'>+static bool fuse_folios_need_send(struct fuse_conn *fc, loff_t pos,</div><div class='add'>+				  unsigned len, struct fuse_args_pages *ap,</div><div class='add'>+				  unsigned cur_bytes, bool write);</div><div class='add'>+static void fuse_send_readpages(struct fuse_io_args *ia, struct file *file,</div><div class='add'>+				unsigned int count, bool async);</div><div class='add'>+</div><div class='add'>+static int fuse_handle_readahead(struct folio *folio,</div><div class='add'>+				 struct readahead_control *rac,</div><div class='add'>+				 struct fuse_fill_read_data *data, loff_t pos,</div><div class='add'>+				 size_t len)</div><div class='add'>+{</div><div class='add'>+	struct fuse_io_args *ia = data-&gt;ia;</div><div class='add'>+	size_t off = offset_in_folio(folio, pos);</div><div class='add'>+	struct fuse_conn *fc = data-&gt;fc;</div><div class='add'>+	struct fuse_args_pages *ap;</div><div class='add'>+	unsigned int nr_pages;</div><div class='add'>+</div><div class='add'>+	if (ia &amp;&amp; fuse_folios_need_send(fc, pos, len, &amp;ia-&gt;ap, data-&gt;nr_bytes,</div><div class='add'>+					false)) {</div><div class='add'>+		fuse_send_readpages(ia, data-&gt;file, data-&gt;nr_bytes,</div><div class='add'>+				    fc-&gt;async_read);</div><div class='add'>+		data-&gt;nr_bytes = 0;</div><div class='add'>+		data-&gt;ia = NULL;</div><div class='add'>+		ia = NULL;</div><div class='add'>+	}</div><div class='add'>+	if (!ia) {</div><div class='add'>+		if (fc-&gt;num_background &gt;= fc-&gt;congestion_threshold &amp;&amp;</div><div class='add'>+		    rac-&gt;ra-&gt;async_size &gt;= readahead_count(rac))</div><div class='add'>+			/*</div><div class='add'>+			 * Congested and only async pages left, so skip the</div><div class='add'>+			 * rest.</div><div class='add'>+			 */</div><div class='add'>+			return -EAGAIN;</div><div class='add'>+</div><div class='add'>+		nr_pages = min(fc-&gt;max_pages, readahead_count(rac));</div><div class='add'>+		data-&gt;ia = fuse_io_alloc(NULL, nr_pages);</div><div class='add'>+		if (!data-&gt;ia)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+		ia = data-&gt;ia;</div><div class='add'>+	}</div><div class='add'>+	folio_get(folio);</div><div class='add'>+	ap = &amp;ia-&gt;ap;</div><div class='add'>+	ap-&gt;folios[ap-&gt;num_folios] = folio;</div><div class='add'>+	ap-&gt;descs[ap-&gt;num_folios].offset = off;</div><div class='add'>+	ap-&gt;descs[ap-&gt;num_folios].length = len;</div><div class='add'>+	data-&gt;nr_bytes += len;</div><div class='add'>+	ap-&gt;num_folios++;</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fuse_readpage(struct file *file, struct page *page)</div><div class='add'>+static int fuse_iomap_read_folio_range_async(const struct iomap_iter *iter,</div><div class='add'>+					     struct iomap_read_folio_ctx *ctx,</div><div class='add'>+					     size_t len)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-	int err;</div><div class='add'>+	struct fuse_fill_read_data *data = ctx-&gt;read_ctx;</div><div class='add'>+	struct folio *folio = ctx-&gt;cur_folio;</div><div class='add'>+	loff_t pos =  iter-&gt;pos;</div><div class='add'>+	size_t off = offset_in_folio(folio, pos);</div><div class='add'>+	struct file *file = data-&gt;file;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	err = -EIO;</div><div class='del'>-	if (fuse_is_bad(inode))</div><div class='del'>-		goto out;</div><div class='add'>+	if (ctx-&gt;rac) {</div><div class='add'>+		ret = fuse_handle_readahead(folio, ctx-&gt;rac, data, pos, len);</div><div class='add'>+	} else {</div><div class='add'>+		/*</div><div class='add'>+		 *  for non-readahead read requests, do reads synchronously</div><div class='add'>+		 *  since it's not guaranteed that the server can handle</div><div class='add'>+		 *  out-of-order reads</div><div class='add'>+		 */</div><div class='add'>+		ret = fuse_do_readfolio(file, folio, off, len);</div><div class='add'>+		if (!ret)</div><div class='add'>+			iomap_finish_folio_read(folio, off, len, ret);</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	err = fuse_do_readpage(file, page);</div><div class='add'>+static void fuse_iomap_read_submit(struct iomap_read_folio_ctx *ctx)</div><div class='add'>+{</div><div class='add'>+	struct fuse_fill_read_data *data = ctx-&gt;read_ctx;</div><div class='add'>+</div><div class='add'>+	if (data-&gt;ia)</div><div class='add'>+		fuse_send_readpages(data-&gt;ia, data-&gt;file, data-&gt;nr_bytes,</div><div class='add'>+				    data-&gt;fc-&gt;async_read);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct iomap_read_ops fuse_iomap_read_ops = {</div><div class='add'>+	.read_folio_range = fuse_iomap_read_folio_range_async,</div><div class='add'>+	.submit_read = fuse_iomap_read_submit,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int fuse_read_folio(struct file *file, struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+	struct fuse_fill_read_data data = {</div><div class='add'>+		.file = file,</div><div class='add'>+	};</div><div class='add'>+	struct iomap_read_folio_ctx ctx = {</div><div class='add'>+		.cur_folio = folio,</div><div class='add'>+		.ops = &amp;fuse_iomap_read_ops,</div><div class='add'>+		.read_ctx = &amp;data,</div><div class='add'>+</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+	if (fuse_is_bad(inode)) {</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	iomap_read_folio(&amp;fuse_iomap_ops, &amp;ctx);</div><div class='ctx'> 	fuse_invalidate_atime(inode);</div><div class='del'>- out:</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	return err;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int fuse_iomap_read_folio_range(const struct iomap_iter *iter,</div><div class='add'>+				       struct folio *folio, loff_t pos,</div><div class='add'>+				       size_t len)</div><div class='add'>+{</div><div class='add'>+	struct file *file = iter-&gt;private;</div><div class='add'>+	size_t off = offset_in_folio(folio, pos);</div><div class='add'>+</div><div class='add'>+	return fuse_do_readfolio(file, folio, off, len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void fuse_readpages_end(struct fuse_mount *fm, struct fuse_args *args,</div><div class='hunk'>@@ -881,46 +1002,39 @@ static void fuse_readpages_end(struct fuse_mount *fm, struct fuse_args *args,</div><div class='ctx'> 	struct fuse_args_pages *ap = &amp;ia-&gt;ap;</div><div class='ctx'> 	size_t count = ia-&gt;read.in.size;</div><div class='ctx'> 	size_t num_read = args-&gt;out_args[0].size;</div><div class='del'>-	struct address_space *mapping = NULL;</div><div class='del'>-</div><div class='del'>-	for (i = 0; mapping == NULL &amp;&amp; i &lt; ap-&gt;num_pages; i++)</div><div class='del'>-		mapping = ap-&gt;pages[i]-&gt;mapping;</div><div class='add'>+	struct address_space *mapping;</div><div class='add'>+	struct inode *inode;</div><div class='ctx'> </div><div class='del'>-	if (mapping) {</div><div class='del'>-		struct inode *inode = mapping-&gt;host;</div><div class='add'>+	WARN_ON_ONCE(!ap-&gt;num_folios);</div><div class='add'>+	mapping = ap-&gt;folios[0]-&gt;mapping;</div><div class='add'>+	inode = mapping-&gt;host;</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * Short read means EOF. If file size is larger, truncate it</div><div class='del'>-		 */</div><div class='del'>-		if (!err &amp;&amp; num_read &lt; count)</div><div class='del'>-			fuse_short_read(inode, ia-&gt;read.attr_ver, num_read, ap);</div><div class='del'>-</div><div class='del'>-		fuse_invalidate_atime(inode);</div><div class='del'>-	}</div><div class='add'>+	/*</div><div class='add'>+	 * Short read means EOF. If file size is larger, truncate it</div><div class='add'>+	 */</div><div class='add'>+	if (!err &amp;&amp; num_read &lt; count)</div><div class='add'>+		fuse_short_read(inode, ia-&gt;read.attr_ver, num_read, ap);</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; ap-&gt;num_pages; i++) {</div><div class='del'>-		struct page *page = ap-&gt;pages[i];</div><div class='add'>+	fuse_invalidate_atime(inode);</div><div class='ctx'> </div><div class='del'>-		if (!err)</div><div class='del'>-			SetPageUptodate(page);</div><div class='del'>-		else</div><div class='del'>-			SetPageError(page);</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		put_page(page);</div><div class='add'>+	for (i = 0; i &lt; ap-&gt;num_folios; i++) {</div><div class='add'>+		iomap_finish_folio_read(ap-&gt;folios[i], ap-&gt;descs[i].offset,</div><div class='add'>+					ap-&gt;descs[i].length, err);</div><div class='add'>+		folio_put(ap-&gt;folios[i]);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (ia-&gt;ff)</div><div class='del'>-		fuse_file_put(ia-&gt;ff, false, false);</div><div class='add'>+		fuse_file_put(ia-&gt;ff, false);</div><div class='ctx'> </div><div class='ctx'> 	fuse_io_free(ia);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void fuse_send_readpages(struct fuse_io_args *ia, struct file *file)</div><div class='add'>+static void fuse_send_readpages(struct fuse_io_args *ia, struct file *file,</div><div class='add'>+				unsigned int count, bool async)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_file *ff = file-&gt;private_data;</div><div class='ctx'> 	struct fuse_mount *fm = ff-&gt;fm;</div><div class='ctx'> 	struct fuse_args_pages *ap = &amp;ia-&gt;ap;</div><div class='del'>-	loff_t pos = page_offset(ap-&gt;pages[0]);</div><div class='del'>-	size_t count = ap-&gt;num_pages &lt;&lt; PAGE_SHIFT;</div><div class='add'>+	loff_t pos = folio_pos(ap-&gt;folios[0]);</div><div class='ctx'> 	ssize_t res;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='hunk'>@@ -931,13 +1045,13 @@ static void fuse_send_readpages(struct fuse_io_args *ia, struct file *file)</div><div class='ctx'> 	/* Don't overflow end offset */</div><div class='ctx'> 	if (pos + (count - 1) == LLONG_MAX) {</div><div class='ctx'> 		count--;</div><div class='del'>-		ap-&gt;descs[ap-&gt;num_pages - 1].length--;</div><div class='add'>+		ap-&gt;descs[ap-&gt;num_folios - 1].length--;</div><div class='ctx'> 	}</div><div class='ctx'> 	WARN_ON((loff_t) (pos + count) &lt; 0);</div><div class='ctx'> </div><div class='ctx'> 	fuse_read_args_fill(ia, file, pos, count, FUSE_READ);</div><div class='ctx'> 	ia-&gt;read.attr_ver = fuse_get_attr_version(fm-&gt;fc);</div><div class='del'>-	if (fm-&gt;fc-&gt;async_read) {</div><div class='add'>+	if (async) {</div><div class='ctx'> 		ia-&gt;ff = fuse_file_get(ff);</div><div class='ctx'> 		ap-&gt;args.end = fuse_readpages_end;</div><div class='ctx'> 		err = fuse_simple_background(fm, &amp;ap-&gt;args, GFP_KERNEL);</div><div class='hunk'>@@ -954,36 +1068,20 @@ static void fuse_readahead(struct readahead_control *rac)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = rac-&gt;mapping-&gt;host;</div><div class='ctx'> 	struct fuse_conn *fc = get_fuse_conn(inode);</div><div class='del'>-	unsigned int i, max_pages, nr_pages = 0;</div><div class='add'>+	struct fuse_fill_read_data data = {</div><div class='add'>+		.file = rac-&gt;file,</div><div class='add'>+		.fc = fc,</div><div class='add'>+	};</div><div class='add'>+	struct iomap_read_folio_ctx ctx = {</div><div class='add'>+		.ops = &amp;fuse_iomap_read_ops,</div><div class='add'>+		.rac = rac,</div><div class='add'>+		.read_ctx = &amp;data</div><div class='add'>+	};</div><div class='ctx'> </div><div class='ctx'> 	if (fuse_is_bad(inode))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	max_pages = min_t(unsigned int, fc-&gt;max_pages,</div><div class='del'>-			fc-&gt;max_read / PAGE_SIZE);</div><div class='del'>-</div><div class='del'>-	for (;;) {</div><div class='del'>-		struct fuse_io_args *ia;</div><div class='del'>-		struct fuse_args_pages *ap;</div><div class='del'>-</div><div class='del'>-		nr_pages = readahead_count(rac) - nr_pages;</div><div class='del'>-		if (nr_pages &gt; max_pages)</div><div class='del'>-			nr_pages = max_pages;</div><div class='del'>-		if (nr_pages == 0)</div><div class='del'>-			break;</div><div class='del'>-		ia = fuse_io_alloc(NULL, nr_pages);</div><div class='del'>-		if (!ia)</div><div class='del'>-			return;</div><div class='del'>-		ap = &amp;ia-&gt;ap;</div><div class='del'>-		nr_pages = __readahead_batch(rac, ap-&gt;pages, nr_pages);</div><div class='del'>-		for (i = 0; i &lt; nr_pages; i++) {</div><div class='del'>-			fuse_wait_on_page_writeback(inode,</div><div class='del'>-						    readahead_index(rac) + i);</div><div class='del'>-			ap-&gt;descs[i].length = PAGE_SIZE;</div><div class='del'>-		}</div><div class='del'>-		ap-&gt;num_pages = nr_pages;</div><div class='del'>-		fuse_send_readpages(ia, rac-&gt;file);</div><div class='del'>-	}</div><div class='add'>+	iomap_readahead(&amp;fuse_iomap_ops, &amp;ctx);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t fuse_cache_read_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='hunk'>@@ -1033,7 +1131,7 @@ static unsigned int fuse_write_flags(struct kiocb *iocb)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int flags = iocb-&gt;ki_filp-&gt;f_flags;</div><div class='ctx'> </div><div class='del'>-	if (iocb-&gt;ki_flags &amp; IOCB_DSYNC)</div><div class='add'>+	if (iocb_is_dsync(iocb))</div><div class='ctx'> 		flags |= O_DSYNC;</div><div class='ctx'> 	if (iocb-&gt;ki_flags &amp; IOCB_SYNC)</div><div class='ctx'> 		flags |= O_SYNC;</div><div class='hunk'>@@ -1099,8 +1197,8 @@ static ssize_t fuse_send_write_pages(struct fuse_io_args *ia,</div><div class='ctx'> 	bool short_write;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; ap-&gt;num_pages; i++)</div><div class='del'>-		fuse_wait_on_page_writeback(inode, ap-&gt;pages[i]-&gt;index);</div><div class='add'>+	for (i = 0; i &lt; ap-&gt;num_folios; i++)</div><div class='add'>+		folio_wait_writeback(ap-&gt;folios[i]);</div><div class='ctx'> </div><div class='ctx'> 	fuse_write_args_fill(ia, ff, pos, count);</div><div class='ctx'> 	ia-&gt;write.in.flags = fuse_write_flags(iocb);</div><div class='hunk'>@@ -1114,24 +1212,24 @@ static ssize_t fuse_send_write_pages(struct fuse_io_args *ia,</div><div class='ctx'> 	short_write = ia-&gt;write.out.size &lt; count;</div><div class='ctx'> 	offset = ap-&gt;descs[0].offset;</div><div class='ctx'> 	count = ia-&gt;write.out.size;</div><div class='del'>-	for (i = 0; i &lt; ap-&gt;num_pages; i++) {</div><div class='del'>-		struct page *page = ap-&gt;pages[i];</div><div class='add'>+	for (i = 0; i &lt; ap-&gt;num_folios; i++) {</div><div class='add'>+		struct folio *folio = ap-&gt;folios[i];</div><div class='ctx'> </div><div class='ctx'> 		if (err) {</div><div class='del'>-			ClearPageUptodate(page);</div><div class='add'>+			folio_clear_uptodate(folio);</div><div class='ctx'> 		} else {</div><div class='del'>-			if (count &gt;= PAGE_SIZE - offset)</div><div class='del'>-				count -= PAGE_SIZE - offset;</div><div class='add'>+			if (count &gt;= folio_size(folio) - offset)</div><div class='add'>+				count -= folio_size(folio) - offset;</div><div class='ctx'> 			else {</div><div class='ctx'> 				if (short_write)</div><div class='del'>-					ClearPageUptodate(page);</div><div class='add'>+					folio_clear_uptodate(folio);</div><div class='ctx'> 				count = 0;</div><div class='ctx'> 			}</div><div class='ctx'> 			offset = 0;</div><div class='ctx'> 		}</div><div class='del'>-		if (ia-&gt;write.page_locked &amp;&amp; (i == ap-&gt;num_pages - 1))</div><div class='del'>-			unlock_page(page);</div><div class='del'>-		put_page(page);</div><div class='add'>+		if (ia-&gt;write.folio_locked &amp;&amp; (i == ap-&gt;num_folios - 1))</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='hunk'>@@ -1140,73 +1238,84 @@ static ssize_t fuse_send_write_pages(struct fuse_io_args *ia,</div><div class='ctx'> static ssize_t fuse_fill_write_pages(struct fuse_io_args *ia,</div><div class='ctx'> 				     struct address_space *mapping,</div><div class='ctx'> 				     struct iov_iter *ii, loff_t pos,</div><div class='del'>-				     unsigned int max_pages)</div><div class='add'>+				     unsigned int max_folios)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_args_pages *ap = &amp;ia-&gt;ap;</div><div class='ctx'> 	struct fuse_conn *fc = get_fuse_conn(mapping-&gt;host);</div><div class='ctx'> 	unsigned offset = pos &amp; (PAGE_SIZE - 1);</div><div class='ctx'> 	size_t count = 0;</div><div class='del'>-	int err;</div><div class='add'>+	unsigned int num;</div><div class='add'>+	int err = 0;</div><div class='add'>+</div><div class='add'>+	num = min(iov_iter_count(ii), fc-&gt;max_write);</div><div class='ctx'> </div><div class='ctx'> 	ap-&gt;args.in_pages = true;</div><div class='del'>-	ap-&gt;descs[0].offset = offset;</div><div class='ctx'> </div><div class='del'>-	do {</div><div class='add'>+	while (num &amp;&amp; ap-&gt;num_folios &lt; max_folios) {</div><div class='ctx'> 		size_t tmp;</div><div class='del'>-		struct page *page;</div><div class='add'>+		struct folio *folio;</div><div class='ctx'> 		pgoff_t index = pos &gt;&gt; PAGE_SHIFT;</div><div class='del'>-		size_t bytes = min_t(size_t, PAGE_SIZE - offset,</div><div class='del'>-				     iov_iter_count(ii));</div><div class='del'>-</div><div class='del'>-		bytes = min_t(size_t, bytes, fc-&gt;max_write - count);</div><div class='add'>+		unsigned int bytes;</div><div class='add'>+		unsigned int folio_offset;</div><div class='ctx'> </div><div class='ctx'>  again:</div><div class='del'>-		err = -EFAULT;</div><div class='del'>-		if (fault_in_iov_iter_readable(ii, bytes))</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		err = -ENOMEM;</div><div class='del'>-		page = grab_cache_page_write_begin(mapping, index, 0);</div><div class='del'>-		if (!page)</div><div class='add'>+		folio = __filemap_get_folio(mapping, index, FGP_WRITEBEGIN,</div><div class='add'>+					    mapping_gfp_mask(mapping));</div><div class='add'>+		if (IS_ERR(folio)) {</div><div class='add'>+			err = PTR_ERR(folio);</div><div class='ctx'> 			break;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		if (mapping_writably_mapped(mapping))</div><div class='del'>-			flush_dcache_page(page);</div><div class='add'>+			flush_dcache_folio(folio);</div><div class='add'>+</div><div class='add'>+		folio_offset = ((index - folio-&gt;index) &lt;&lt; PAGE_SHIFT) + offset;</div><div class='add'>+		bytes = min(folio_size(folio) - folio_offset, num);</div><div class='ctx'> </div><div class='del'>-		tmp = copy_page_from_iter_atomic(page, offset, bytes, ii);</div><div class='del'>-		flush_dcache_page(page);</div><div class='add'>+		tmp = copy_folio_from_iter_atomic(folio, folio_offset, bytes, ii);</div><div class='add'>+		flush_dcache_folio(folio);</div><div class='ctx'> </div><div class='ctx'> 		if (!tmp) {</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			put_page(page);</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+			folio_put(folio);</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * Ensure forward progress by faulting in</div><div class='add'>+			 * while not holding the folio lock:</div><div class='add'>+			 */</div><div class='add'>+			if (fault_in_iov_iter_readable(ii, bytes)) {</div><div class='add'>+				err = -EFAULT;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+</div><div class='ctx'> 			goto again;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		err = 0;</div><div class='del'>-		ap-&gt;pages[ap-&gt;num_pages] = page;</div><div class='del'>-		ap-&gt;descs[ap-&gt;num_pages].length = tmp;</div><div class='del'>-		ap-&gt;num_pages++;</div><div class='add'>+		ap-&gt;folios[ap-&gt;num_folios] = folio;</div><div class='add'>+		ap-&gt;descs[ap-&gt;num_folios].offset = folio_offset;</div><div class='add'>+		ap-&gt;descs[ap-&gt;num_folios].length = tmp;</div><div class='add'>+		ap-&gt;num_folios++;</div><div class='ctx'> </div><div class='ctx'> 		count += tmp;</div><div class='ctx'> 		pos += tmp;</div><div class='add'>+		num -= tmp;</div><div class='ctx'> 		offset += tmp;</div><div class='del'>-		if (offset == PAGE_SIZE)</div><div class='add'>+		if (offset == folio_size(folio))</div><div class='ctx'> 			offset = 0;</div><div class='ctx'> </div><div class='del'>-		/* If we copied full page, mark it uptodate */</div><div class='del'>-		if (tmp == PAGE_SIZE)</div><div class='del'>-			SetPageUptodate(page);</div><div class='add'>+		/* If we copied full folio, mark it uptodate */</div><div class='add'>+		if (tmp == folio_size(folio))</div><div class='add'>+			folio_mark_uptodate(folio);</div><div class='ctx'> </div><div class='del'>-		if (PageUptodate(page)) {</div><div class='del'>-			unlock_page(page);</div><div class='add'>+		if (folio_test_uptodate(folio)) {</div><div class='add'>+			folio_unlock(folio);</div><div class='ctx'> 		} else {</div><div class='del'>-			ia-&gt;write.page_locked = true;</div><div class='add'>+			ia-&gt;write.folio_locked = true;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-		if (!fc-&gt;big_writes)</div><div class='add'>+		if (!fc-&gt;big_writes || offset != 0)</div><div class='ctx'> 			break;</div><div class='del'>-	} while (iov_iter_count(ii) &amp;&amp; count &lt; fc-&gt;max_write &amp;&amp;</div><div class='del'>-		 ap-&gt;num_pages &lt; max_pages &amp;&amp; offset == 0);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	return count &gt; 0 ? count : err;</div><div class='ctx'> }</div><div class='hunk'>@@ -1220,13 +1329,13 @@ static inline unsigned int fuse_wr_pages(loff_t pos, size_t len,</div><div class='ctx'> 		     max_pages);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static ssize_t fuse_perform_write(struct kiocb *iocb,</div><div class='del'>-				  struct address_space *mapping,</div><div class='del'>-				  struct iov_iter *ii, loff_t pos)</div><div class='add'>+static ssize_t fuse_perform_write(struct kiocb *iocb, struct iov_iter *ii)</div><div class='ctx'> {</div><div class='add'>+	struct address_space *mapping = iocb-&gt;ki_filp-&gt;f_mapping;</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='ctx'> 	struct fuse_conn *fc = get_fuse_conn(inode);</div><div class='ctx'> 	struct fuse_inode *fi = get_fuse_inode(inode);</div><div class='add'>+	loff_t pos = iocb-&gt;ki_pos;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> 	ssize_t res = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -1240,8 +1349,8 @@ static ssize_t fuse_perform_write(struct kiocb *iocb,</div><div class='ctx'> 		unsigned int nr_pages = fuse_wr_pages(pos, iov_iter_count(ii),</div><div class='ctx'> 						      fc-&gt;max_pages);</div><div class='ctx'> </div><div class='del'>-		ap-&gt;pages = fuse_pages_alloc(nr_pages, GFP_KERNEL, &amp;ap-&gt;descs);</div><div class='del'>-		if (!ap-&gt;pages) {</div><div class='add'>+		ap-&gt;folios = fuse_folios_alloc(nr_pages, GFP_KERNEL, &amp;ap-&gt;descs);</div><div class='add'>+		if (!ap-&gt;folios) {</div><div class='ctx'> 			err = -ENOMEM;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1263,25 +1372,112 @@ static ssize_t fuse_perform_write(struct kiocb *iocb,</div><div class='ctx'> 					err = -EIO;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		kfree(ap-&gt;pages);</div><div class='add'>+		kfree(ap-&gt;folios);</div><div class='ctx'> 	} while (!err &amp;&amp; iov_iter_count(ii));</div><div class='ctx'> </div><div class='ctx'> 	fuse_write_update_attr(inode, pos, res);</div><div class='ctx'> 	clear_bit(FUSE_I_SIZE_UNSTABLE, &amp;fi-&gt;state);</div><div class='ctx'> </div><div class='del'>-	return res &gt; 0 ? res : err;</div><div class='add'>+	if (!res)</div><div class='add'>+		return err;</div><div class='add'>+	iocb-&gt;ki_pos += res;</div><div class='add'>+	return res;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool fuse_io_past_eof(struct kiocb *iocb, struct iov_iter *iter)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='add'>+</div><div class='add'>+	return iocb-&gt;ki_pos + iov_iter_count(iter) &gt; i_size_read(inode);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * @return true if an exclusive lock for direct IO writes is needed</div><div class='add'>+ */</div><div class='add'>+static bool fuse_dio_wr_exclusive_lock(struct kiocb *iocb, struct iov_iter *from)</div><div class='add'>+{</div><div class='add'>+	struct file *file = iocb-&gt;ki_filp;</div><div class='add'>+	struct fuse_file *ff = file-&gt;private_data;</div><div class='add'>+	struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='add'>+	struct fuse_inode *fi = get_fuse_inode(inode);</div><div class='add'>+</div><div class='add'>+	/* Server side has to advise that it supports parallel dio writes. */</div><div class='add'>+	if (!(ff-&gt;open_flags &amp; FOPEN_PARALLEL_DIRECT_WRITES))</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Append will need to know the eventual EOF - always needs an</div><div class='add'>+	 * exclusive lock.</div><div class='add'>+	 */</div><div class='add'>+	if (iocb-&gt;ki_flags &amp; IOCB_APPEND)</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	/* shared locks are not allowed with parallel page cache IO */</div><div class='add'>+	if (test_bit(FUSE_I_CACHE_IO_MODE, &amp;fi-&gt;state))</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	/* Parallel dio beyond EOF is not supported, at least for now. */</div><div class='add'>+	if (fuse_io_past_eof(iocb, from))</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fuse_dio_lock(struct kiocb *iocb, struct iov_iter *from,</div><div class='add'>+			  bool *exclusive)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='add'>+	struct fuse_inode *fi = get_fuse_inode(inode);</div><div class='add'>+</div><div class='add'>+	*exclusive = fuse_dio_wr_exclusive_lock(iocb, from);</div><div class='add'>+	if (*exclusive) {</div><div class='add'>+		inode_lock(inode);</div><div class='add'>+	} else {</div><div class='add'>+		inode_lock_shared(inode);</div><div class='add'>+		/*</div><div class='add'>+		 * New parallal dio allowed only if inode is not in caching</div><div class='add'>+		 * mode and denies new opens in caching mode. This check</div><div class='add'>+		 * should be performed only after taking shared inode lock.</div><div class='add'>+		 * Previous past eof check was without inode lock and might</div><div class='add'>+		 * have raced, so check it again.</div><div class='add'>+		 */</div><div class='add'>+		if (fuse_io_past_eof(iocb, from) ||</div><div class='add'>+		    fuse_inode_uncached_io_start(fi, NULL) != 0) {</div><div class='add'>+			inode_unlock_shared(inode);</div><div class='add'>+			inode_lock(inode);</div><div class='add'>+			*exclusive = true;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fuse_dio_unlock(struct kiocb *iocb, bool exclusive)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='add'>+	struct fuse_inode *fi = get_fuse_inode(inode);</div><div class='add'>+</div><div class='add'>+	if (exclusive) {</div><div class='add'>+		inode_unlock(inode);</div><div class='add'>+	} else {</div><div class='add'>+		/* Allow opens in caching mode after last parallel dio end */</div><div class='add'>+		fuse_inode_uncached_io_end(fi);</div><div class='add'>+		inode_unlock_shared(inode);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct iomap_write_ops fuse_iomap_write_ops = {</div><div class='add'>+	.read_folio_range = fuse_iomap_read_folio_range,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> static ssize_t fuse_cache_write_iter(struct kiocb *iocb, struct iov_iter *from)</div><div class='ctx'> {</div><div class='ctx'> 	struct file *file = iocb-&gt;ki_filp;</div><div class='add'>+	struct mnt_idmap *idmap = file_mnt_idmap(file);</div><div class='ctx'> 	struct address_space *mapping = file-&gt;f_mapping;</div><div class='ctx'> 	ssize_t written = 0;</div><div class='del'>-	ssize_t written_buffered = 0;</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='del'>-	ssize_t err;</div><div class='add'>+	ssize_t err, count;</div><div class='ctx'> 	struct fuse_conn *fc = get_fuse_conn(inode);</div><div class='del'>-	loff_t endbyte = 0;</div><div class='add'>+	bool writeback = false;</div><div class='ctx'> </div><div class='ctx'> 	if (fc-&gt;writeback_cache) {</div><div class='ctx'> 		/* Update size (EOF optimization) and mode (SUID clearing) */</div><div class='hunk'>@@ -1290,65 +1486,42 @@ static ssize_t fuse_cache_write_iter(struct kiocb *iocb, struct iov_iter *from)</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			return err;</div><div class='ctx'> </div><div class='del'>-		if (fc-&gt;handle_killpriv_v2 &amp;&amp;</div><div class='del'>-		    should_remove_suid(file_dentry(file))) {</div><div class='del'>-			goto writethrough;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		return generic_file_write_iter(iocb, from);</div><div class='add'>+		if (!fc-&gt;handle_killpriv_v2 ||</div><div class='add'>+		    !setattr_should_drop_suidgid(idmap, file_inode(file)))</div><div class='add'>+			writeback = true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-writethrough:</div><div class='ctx'> 	inode_lock(inode);</div><div class='ctx'> </div><div class='del'>-	/* We can write back this queue in page reclaim */</div><div class='del'>-	current-&gt;backing_dev_info = inode_to_bdi(inode);</div><div class='del'>-</div><div class='del'>-	err = generic_write_checks(iocb, from);</div><div class='add'>+	err = count = generic_write_checks(iocb, from);</div><div class='ctx'> 	if (err &lt;= 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	err = file_remove_privs(file);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out;</div><div class='add'>+	task_io_account_write(count);</div><div class='ctx'> </div><div class='del'>-	err = file_update_time(file);</div><div class='add'>+	err = kiocb_modified(iocb);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	if (iocb-&gt;ki_flags &amp; IOCB_DIRECT) {</div><div class='del'>-		loff_t pos = iocb-&gt;ki_pos;</div><div class='ctx'> 		written = generic_file_direct_write(iocb, from);</div><div class='ctx'> 		if (written &lt; 0 || !iov_iter_count(from))</div><div class='ctx'> 			goto out;</div><div class='del'>-</div><div class='del'>-		pos += written;</div><div class='del'>-</div><div class='del'>-		written_buffered = fuse_perform_write(iocb, mapping, from, pos);</div><div class='del'>-		if (written_buffered &lt; 0) {</div><div class='del'>-			err = written_buffered;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		endbyte = pos + written_buffered - 1;</div><div class='del'>-</div><div class='del'>-		err = filemap_write_and_wait_range(file-&gt;f_mapping, pos,</div><div class='del'>-						   endbyte);</div><div class='del'>-		if (err)</div><div class='del'>-			goto out;</div><div class='del'>-</div><div class='del'>-		invalidate_mapping_pages(file-&gt;f_mapping,</div><div class='del'>-					 pos &gt;&gt; PAGE_SHIFT,</div><div class='del'>-					 endbyte &gt;&gt; PAGE_SHIFT);</div><div class='del'>-</div><div class='del'>-		written += written_buffered;</div><div class='del'>-		iocb-&gt;ki_pos = pos + written_buffered;</div><div class='add'>+		written = direct_write_fallback(iocb, from, written,</div><div class='add'>+				fuse_perform_write(iocb, from));</div><div class='add'>+	} else if (writeback) {</div><div class='add'>+		/*</div><div class='add'>+		 * Use iomap so that we can do granular uptodate reads</div><div class='add'>+		 * and granular dirty tracking for large folios.</div><div class='add'>+		 */</div><div class='add'>+		written = iomap_file_buffered_write(iocb, from,</div><div class='add'>+						    &amp;fuse_iomap_ops,</div><div class='add'>+						    &amp;fuse_iomap_write_ops,</div><div class='add'>+						    file);</div><div class='ctx'> 	} else {</div><div class='del'>-		written = fuse_perform_write(iocb, mapping, from, iocb-&gt;ki_pos);</div><div class='del'>-		if (written &gt;= 0)</div><div class='del'>-			iocb-&gt;ki_pos += written;</div><div class='add'>+		written = fuse_perform_write(iocb, from);</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='del'>-	current-&gt;backing_dev_info = NULL;</div><div class='ctx'> 	inode_unlock(inode);</div><div class='ctx'> 	if (written &gt; 0)</div><div class='ctx'> 		written = generic_write_sync(iocb, written);</div><div class='hunk'>@@ -1358,7 +1531,7 @@ out:</div><div class='ctx'> </div><div class='ctx'> static inline unsigned long fuse_get_user_addr(const struct iov_iter *ii)</div><div class='ctx'> {</div><div class='del'>-	return (unsigned long)ii-&gt;iov-&gt;iov_base + ii-&gt;iov_offset;</div><div class='add'>+	return (unsigned long)iter_iov(ii)-&gt;iov_base + ii-&gt;iov_offset;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline size_t fuse_get_frag_size(const struct iov_iter *ii,</div><div class='hunk'>@@ -1369,55 +1542,97 @@ static inline size_t fuse_get_frag_size(const struct iov_iter *ii,</div><div class='ctx'> </div><div class='ctx'> static int fuse_get_user_pages(struct fuse_args_pages *ap, struct iov_iter *ii,</div><div class='ctx'> 			       size_t *nbytesp, int write,</div><div class='del'>-			       unsigned int max_pages)</div><div class='add'>+			       unsigned int max_pages,</div><div class='add'>+			       bool use_pages_for_kvec_io)</div><div class='ctx'> {</div><div class='add'>+	bool flush_or_invalidate = false;</div><div class='add'>+	unsigned int nr_pages = 0;</div><div class='ctx'> 	size_t nbytes = 0;  /* # bytes already packed in req */</div><div class='ctx'> 	ssize_t ret = 0;</div><div class='ctx'> </div><div class='del'>-	/* Special case for kernel I/O: can copy directly into the buffer */</div><div class='add'>+	/* Special case for kernel I/O: can copy directly into the buffer.</div><div class='add'>+	 * However if the implementation of fuse_conn requires pages instead of</div><div class='add'>+	 * pointer (e.g., virtio-fs), use iov_iter_extract_pages() instead.</div><div class='add'>+	 */</div><div class='ctx'> 	if (iov_iter_is_kvec(ii)) {</div><div class='del'>-		unsigned long user_addr = fuse_get_user_addr(ii);</div><div class='del'>-		size_t frag_size = fuse_get_frag_size(ii, *nbytesp);</div><div class='add'>+		void *user_addr = (void *)fuse_get_user_addr(ii);</div><div class='ctx'> </div><div class='del'>-		if (write)</div><div class='del'>-			ap-&gt;args.in_args[1].value = (void *) user_addr;</div><div class='del'>-		else</div><div class='del'>-			ap-&gt;args.out_args[0].value = (void *) user_addr;</div><div class='add'>+		if (!use_pages_for_kvec_io) {</div><div class='add'>+			size_t frag_size = fuse_get_frag_size(ii, *nbytesp);</div><div class='ctx'> </div><div class='del'>-		iov_iter_advance(ii, frag_size);</div><div class='del'>-		*nbytesp = frag_size;</div><div class='del'>-		return 0;</div><div class='add'>+			if (write)</div><div class='add'>+				ap-&gt;args.in_args[1].value = user_addr;</div><div class='add'>+			else</div><div class='add'>+				ap-&gt;args.out_args[0].value = user_addr;</div><div class='add'>+</div><div class='add'>+			iov_iter_advance(ii, frag_size);</div><div class='add'>+			*nbytesp = frag_size;</div><div class='add'>+			return 0;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (is_vmalloc_addr(user_addr)) {</div><div class='add'>+			ap-&gt;args.vmap_base = user_addr;</div><div class='add'>+			flush_or_invalidate = true;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	while (nbytes &lt; *nbytesp &amp;&amp; ap-&gt;num_pages &lt; max_pages) {</div><div class='del'>-		unsigned npages;</div><div class='add'>+	/*</div><div class='add'>+	 * Until there is support for iov_iter_extract_folios(), we have to</div><div class='add'>+	 * manually extract pages using iov_iter_extract_pages() and then</div><div class='add'>+	 * copy that to a folios array.</div><div class='add'>+	 */</div><div class='add'>+	struct page **pages = kzalloc(max_pages * sizeof(struct page *),</div><div class='add'>+				      GFP_KERNEL);</div><div class='add'>+	if (!pages) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	while (nbytes &lt; *nbytesp &amp;&amp; nr_pages &lt; max_pages) {</div><div class='add'>+		unsigned nfolios, i;</div><div class='ctx'> 		size_t start;</div><div class='del'>-		ret = iov_iter_get_pages(ii, &amp;ap-&gt;pages[ap-&gt;num_pages],</div><div class='del'>-					*nbytesp - nbytes,</div><div class='del'>-					max_pages - ap-&gt;num_pages,</div><div class='del'>-					&amp;start);</div><div class='add'>+</div><div class='add'>+		ret = iov_iter_extract_pages(ii, &amp;pages,</div><div class='add'>+					     *nbytesp - nbytes,</div><div class='add'>+					     max_pages - nr_pages,</div><div class='add'>+					     0, &amp;start);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		iov_iter_advance(ii, ret);</div><div class='ctx'> 		nbytes += ret;</div><div class='ctx'> </div><div class='del'>-		ret += start;</div><div class='del'>-		npages = DIV_ROUND_UP(ret, PAGE_SIZE);</div><div class='add'>+		nfolios = DIV_ROUND_UP(ret + start, PAGE_SIZE);</div><div class='add'>+</div><div class='add'>+		for (i = 0; i &lt; nfolios; i++) {</div><div class='add'>+			struct folio *folio = page_folio(pages[i]);</div><div class='add'>+			unsigned int offset = start +</div><div class='add'>+				(folio_page_idx(folio, pages[i]) &lt;&lt; PAGE_SHIFT);</div><div class='add'>+			unsigned int len = min_t(unsigned int, ret, PAGE_SIZE - start);</div><div class='ctx'> </div><div class='del'>-		ap-&gt;descs[ap-&gt;num_pages].offset = start;</div><div class='del'>-		fuse_page_descs_length_init(ap-&gt;descs, ap-&gt;num_pages, npages);</div><div class='add'>+			ap-&gt;descs[ap-&gt;num_folios].offset = offset;</div><div class='add'>+			ap-&gt;descs[ap-&gt;num_folios].length = len;</div><div class='add'>+			ap-&gt;folios[ap-&gt;num_folios] = folio;</div><div class='add'>+			start = 0;</div><div class='add'>+			ret -= len;</div><div class='add'>+			ap-&gt;num_folios++;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-		ap-&gt;num_pages += npages;</div><div class='del'>-		ap-&gt;descs[ap-&gt;num_pages - 1].length -=</div><div class='del'>-			(PAGE_SIZE - ret) &amp; (PAGE_SIZE - 1);</div><div class='add'>+		nr_pages += nfolios;</div><div class='ctx'> 	}</div><div class='add'>+	kfree(pages);</div><div class='add'>+</div><div class='add'>+	if (write &amp;&amp; flush_or_invalidate)</div><div class='add'>+		flush_kernel_vmap_range(ap-&gt;args.vmap_base, nbytes);</div><div class='ctx'> </div><div class='add'>+	ap-&gt;args.invalidate_vmap = !write &amp;&amp; flush_or_invalidate;</div><div class='add'>+	ap-&gt;args.is_pinned = iov_iter_extract_will_pin(ii);</div><div class='add'>+	ap-&gt;args.user_pages = true;</div><div class='ctx'> 	if (write)</div><div class='ctx'> 		ap-&gt;args.in_pages = true;</div><div class='ctx'> 	else</div><div class='ctx'> 		ap-&gt;args.out_pages = true;</div><div class='ctx'> </div><div class='add'>+out:</div><div class='ctx'> 	*nbytesp = nbytes;</div><div class='ctx'> </div><div class='ctx'> 	return ret &lt; 0 ? ret : 0;</div><div class='hunk'>@@ -1429,7 +1644,8 @@ ssize_t fuse_direct_io(struct fuse_io_priv *io, struct iov_iter *iter,</div><div class='ctx'> 	int write = flags &amp; FUSE_DIO_WRITE;</div><div class='ctx'> 	int cuse = flags &amp; FUSE_DIO_CUSE;</div><div class='ctx'> 	struct file *file = io-&gt;iocb-&gt;ki_filp;</div><div class='del'>-	struct inode *inode = file-&gt;f_mapping-&gt;host;</div><div class='add'>+	struct address_space *mapping = file-&gt;f_mapping;</div><div class='add'>+	struct inode *inode = mapping-&gt;host;</div><div class='ctx'> 	struct fuse_file *ff = file-&gt;private_data;</div><div class='ctx'> 	struct fuse_conn *fc = ff-&gt;fm-&gt;fc;</div><div class='ctx'> 	size_t nmax = write ? fc-&gt;max_write : fc-&gt;max_read;</div><div class='hunk'>@@ -1441,13 +1657,21 @@ ssize_t fuse_direct_io(struct fuse_io_priv *io, struct iov_iter *iter,</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> 	struct fuse_io_args *ia;</div><div class='ctx'> 	unsigned int max_pages;</div><div class='add'>+	bool fopen_direct_io = ff-&gt;open_flags &amp; FOPEN_DIRECT_IO;</div><div class='ctx'> </div><div class='ctx'> 	max_pages = iov_iter_npages(iter, fc-&gt;max_pages);</div><div class='ctx'> 	ia = fuse_io_alloc(io, max_pages);</div><div class='ctx'> 	if (!ia)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	if (!cuse &amp;&amp; fuse_range_is_writeback(inode, idx_from, idx_to)) {</div><div class='add'>+	if (fopen_direct_io) {</div><div class='add'>+		res = filemap_write_and_wait_range(mapping, pos, pos + count - 1);</div><div class='add'>+		if (res) {</div><div class='add'>+			fuse_io_free(ia);</div><div class='add'>+			return res;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	if (!cuse &amp;&amp; filemap_range_has_writeback(mapping, pos, (pos + count - 1))) {</div><div class='ctx'> 		if (!write)</div><div class='ctx'> 			inode_lock(inode);</div><div class='ctx'> 		fuse_sync_writes(inode);</div><div class='hunk'>@@ -1455,14 +1679,22 @@ ssize_t fuse_direct_io(struct fuse_io_priv *io, struct iov_iter *iter,</div><div class='ctx'> 			inode_unlock(inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	io-&gt;should_dirty = !write &amp;&amp; iter_is_iovec(iter);</div><div class='add'>+	if (fopen_direct_io &amp;&amp; write) {</div><div class='add'>+		res = invalidate_inode_pages2_range(mapping, idx_from, idx_to);</div><div class='add'>+		if (res) {</div><div class='add'>+			fuse_io_free(ia);</div><div class='add'>+			return res;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	io-&gt;should_dirty = !write &amp;&amp; user_backed_iter(iter);</div><div class='ctx'> 	while (count) {</div><div class='ctx'> 		ssize_t nres;</div><div class='ctx'> 		fl_owner_t owner = current-&gt;files;</div><div class='ctx'> 		size_t nbytes = min(count, nmax);</div><div class='ctx'> </div><div class='ctx'> 		err = fuse_get_user_pages(&amp;ia-&gt;ap, iter, &amp;nbytes, write,</div><div class='del'>-					  max_pages);</div><div class='add'>+					  max_pages, fc-&gt;use_pages_for_kvec_io);</div><div class='ctx'> 		if (err &amp;&amp; !nbytes)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='hunk'>@@ -1476,7 +1708,7 @@ ssize_t fuse_direct_io(struct fuse_io_priv *io, struct iov_iter *iter,</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (!io-&gt;async || nres &lt; 0) {</div><div class='del'>-			fuse_release_user_pages(&amp;ia-&gt;ap, io-&gt;should_dirty);</div><div class='add'>+			fuse_release_user_pages(&amp;ia-&gt;ap, nres, io-&gt;should_dirty);</div><div class='ctx'> 			fuse_io_free(ia);</div><div class='ctx'> 		}</div><div class='ctx'> 		ia = NULL;</div><div class='hunk'>@@ -1506,6 +1738,15 @@ ssize_t fuse_direct_io(struct fuse_io_priv *io, struct iov_iter *iter,</div><div class='ctx'> 	if (res &gt; 0)</div><div class='ctx'> 		*ppos = pos;</div><div class='ctx'> </div><div class='add'>+	if (res &gt; 0 &amp;&amp; write &amp;&amp; fopen_direct_io) {</div><div class='add'>+		/*</div><div class='add'>+		 * As in generic_file_direct_write(), invalidate after the</div><div class='add'>+		 * write, to invalidate read-ahead cache that may have competed</div><div class='add'>+		 * with the write.</div><div class='add'>+		 */</div><div class='add'>+		invalidate_inode_pages2_range(mapping, idx_from, idx_to);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	return res &gt; 0 ? res : err;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(fuse_direct_io);</div><div class='hunk'>@@ -1530,7 +1771,7 @@ static ssize_t fuse_direct_read_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='ctx'> {</div><div class='ctx'> 	ssize_t res;</div><div class='ctx'> </div><div class='del'>-	if (!is_sync_kiocb(iocb) &amp;&amp; iocb-&gt;ki_flags &amp; IOCB_DIRECT) {</div><div class='add'>+	if (!is_sync_kiocb(iocb)) {</div><div class='ctx'> 		res = fuse_direct_IO(iocb, to);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		struct fuse_io_priv io = FUSE_IO_PRIV_SYNC(iocb);</div><div class='hunk'>@@ -1544,22 +1785,24 @@ static ssize_t fuse_direct_read_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='ctx'> static ssize_t fuse_direct_write_iter(struct kiocb *iocb, struct iov_iter *from)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='del'>-	struct fuse_io_priv io = FUSE_IO_PRIV_SYNC(iocb);</div><div class='ctx'> 	ssize_t res;</div><div class='add'>+	bool exclusive;</div><div class='ctx'> </div><div class='del'>-	/* Don't allow parallel writes to the same file */</div><div class='del'>-	inode_lock(inode);</div><div class='add'>+	fuse_dio_lock(iocb, from, &amp;exclusive);</div><div class='ctx'> 	res = generic_write_checks(iocb, from);</div><div class='ctx'> 	if (res &gt; 0) {</div><div class='del'>-		if (!is_sync_kiocb(iocb) &amp;&amp; iocb-&gt;ki_flags &amp; IOCB_DIRECT) {</div><div class='add'>+		task_io_account_write(res);</div><div class='add'>+		if (!is_sync_kiocb(iocb)) {</div><div class='ctx'> 			res = fuse_direct_IO(iocb, from);</div><div class='ctx'> 		} else {</div><div class='add'>+			struct fuse_io_priv io = FUSE_IO_PRIV_SYNC(iocb);</div><div class='add'>+</div><div class='ctx'> 			res = fuse_direct_io(&amp;io, from, &amp;iocb-&gt;ki_pos,</div><div class='ctx'> 					     FUSE_DIO_WRITE);</div><div class='ctx'> 			fuse_write_update_attr(inode, iocb-&gt;ki_pos, res);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	inode_unlock(inode);</div><div class='add'>+	fuse_dio_unlock(iocb, exclusive);</div><div class='ctx'> </div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='hunk'>@@ -1576,10 +1819,13 @@ static ssize_t fuse_file_read_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='ctx'> 	if (FUSE_IS_DAX(inode))</div><div class='ctx'> 		return fuse_dax_read_iter(iocb, to);</div><div class='ctx'> </div><div class='del'>-	if (!(ff-&gt;open_flags &amp; FOPEN_DIRECT_IO))</div><div class='del'>-		return fuse_cache_read_iter(iocb, to);</div><div class='del'>-	else</div><div class='add'>+	/* FOPEN_DIRECT_IO overrides FOPEN_PASSTHROUGH */</div><div class='add'>+	if (ff-&gt;open_flags &amp; FOPEN_DIRECT_IO)</div><div class='ctx'> 		return fuse_direct_read_iter(iocb, to);</div><div class='add'>+	else if (fuse_file_passthrough(ff))</div><div class='add'>+		return fuse_passthrough_read_iter(iocb, to);</div><div class='add'>+	else</div><div class='add'>+		return fuse_cache_read_iter(iocb, to);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t fuse_file_write_iter(struct kiocb *iocb, struct iov_iter *from)</div><div class='hunk'>@@ -1594,44 +1840,69 @@ static ssize_t fuse_file_write_iter(struct kiocb *iocb, struct iov_iter *from)</div><div class='ctx'> 	if (FUSE_IS_DAX(inode))</div><div class='ctx'> 		return fuse_dax_write_iter(iocb, from);</div><div class='ctx'> </div><div class='del'>-	if (!(ff-&gt;open_flags &amp; FOPEN_DIRECT_IO))</div><div class='add'>+	/* FOPEN_DIRECT_IO overrides FOPEN_PASSTHROUGH */</div><div class='add'>+	if (ff-&gt;open_flags &amp; FOPEN_DIRECT_IO)</div><div class='add'>+		return fuse_direct_write_iter(iocb, from);</div><div class='add'>+	else if (fuse_file_passthrough(ff))</div><div class='add'>+		return fuse_passthrough_write_iter(iocb, from);</div><div class='add'>+	else</div><div class='ctx'> 		return fuse_cache_write_iter(iocb, from);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t fuse_splice_read(struct file *in, loff_t *ppos,</div><div class='add'>+				struct pipe_inode_info *pipe, size_t len,</div><div class='add'>+				unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	struct fuse_file *ff = in-&gt;private_data;</div><div class='add'>+</div><div class='add'>+	/* FOPEN_DIRECT_IO overrides FOPEN_PASSTHROUGH */</div><div class='add'>+	if (fuse_file_passthrough(ff) &amp;&amp; !(ff-&gt;open_flags &amp; FOPEN_DIRECT_IO))</div><div class='add'>+		return fuse_passthrough_splice_read(in, ppos, pipe, len, flags);</div><div class='ctx'> 	else</div><div class='del'>-		return fuse_direct_write_iter(iocb, from);</div><div class='add'>+		return filemap_splice_read(in, ppos, pipe, len, flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t fuse_splice_write(struct pipe_inode_info *pipe, struct file *out,</div><div class='add'>+				 loff_t *ppos, size_t len, unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	struct fuse_file *ff = out-&gt;private_data;</div><div class='add'>+</div><div class='add'>+	/* FOPEN_DIRECT_IO overrides FOPEN_PASSTHROUGH */</div><div class='add'>+	if (fuse_file_passthrough(ff) &amp;&amp; !(ff-&gt;open_flags &amp; FOPEN_DIRECT_IO))</div><div class='add'>+		return fuse_passthrough_splice_write(pipe, out, ppos, len, flags);</div><div class='add'>+	else</div><div class='add'>+		return iter_file_splice_write(pipe, out, ppos, len, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void fuse_writepage_free(struct fuse_writepage_args *wpa)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_args_pages *ap = &amp;wpa-&gt;ia.ap;</div><div class='del'>-	int i;</div><div class='ctx'> </div><div class='ctx'> 	if (wpa-&gt;bucket)</div><div class='ctx'> 		fuse_sync_bucket_dec(wpa-&gt;bucket);</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; ap-&gt;num_pages; i++)</div><div class='del'>-		__free_page(ap-&gt;pages[i]);</div><div class='del'>-</div><div class='del'>-	if (wpa-&gt;ia.ff)</div><div class='del'>-		fuse_file_put(wpa-&gt;ia.ff, false, false);</div><div class='add'>+	fuse_file_put(wpa-&gt;ia.ff, false);</div><div class='ctx'> </div><div class='del'>-	kfree(ap-&gt;pages);</div><div class='add'>+	kfree(ap-&gt;folios);</div><div class='ctx'> 	kfree(wpa);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void fuse_writepage_finish(struct fuse_mount *fm,</div><div class='del'>-				  struct fuse_writepage_args *wpa)</div><div class='add'>+static void fuse_writepage_finish(struct fuse_writepage_args *wpa)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_args_pages *ap = &amp;wpa-&gt;ia.ap;</div><div class='ctx'> 	struct inode *inode = wpa-&gt;inode;</div><div class='ctx'> 	struct fuse_inode *fi = get_fuse_inode(inode);</div><div class='del'>-	struct backing_dev_info *bdi = inode_to_bdi(inode);</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; ap-&gt;num_pages; i++) {</div><div class='del'>-		dec_wb_stat(&amp;bdi-&gt;wb, WB_WRITEBACK);</div><div class='del'>-		dec_node_page_state(ap-&gt;pages[i], NR_WRITEBACK_TEMP);</div><div class='del'>-		wb_writeout_inc(&amp;bdi-&gt;wb);</div><div class='del'>-	}</div><div class='add'>+	for (i = 0; i &lt; ap-&gt;num_folios; i++)</div><div class='add'>+		/*</div><div class='add'>+		 * Benchmarks showed that ending writeback within the</div><div class='add'>+		 * scope of the fi-&gt;lock alleviates xarray lock</div><div class='add'>+		 * contention and noticeably improves performance.</div><div class='add'>+		 */</div><div class='add'>+		iomap_finish_folio_write(inode, ap-&gt;folios[i],</div><div class='add'>+					 ap-&gt;descs[i].length);</div><div class='add'>+</div><div class='ctx'> 	wake_up(&amp;fi-&gt;page_waitq);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1641,12 +1912,15 @@ static void fuse_send_writepage(struct fuse_mount *fm,</div><div class='ctx'> __releases(fi-&gt;lock)</div><div class='ctx'> __acquires(fi-&gt;lock)</div><div class='ctx'> {</div><div class='del'>-	struct fuse_writepage_args *aux, *next;</div><div class='ctx'> 	struct fuse_inode *fi = get_fuse_inode(wpa-&gt;inode);</div><div class='add'>+	struct fuse_args_pages *ap = &amp;wpa-&gt;ia.ap;</div><div class='ctx'> 	struct fuse_write_in *inarg = &amp;wpa-&gt;ia.write.in;</div><div class='del'>-	struct fuse_args *args = &amp;wpa-&gt;ia.ap.args;</div><div class='del'>-	__u64 data_size = wpa-&gt;ia.ap.num_pages * PAGE_SIZE;</div><div class='del'>-	int err;</div><div class='add'>+	struct fuse_args *args = &amp;ap-&gt;args;</div><div class='add'>+	__u64 data_size = 0;</div><div class='add'>+	int err, i;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; ap-&gt;num_folios; i++)</div><div class='add'>+		data_size += ap-&gt;descs[i].length;</div><div class='ctx'> </div><div class='ctx'> 	fi-&gt;writectr++;</div><div class='ctx'> 	if (inarg-&gt;offset + data_size &lt;= size) {</div><div class='hunk'>@@ -1677,17 +1951,8 @@ __acquires(fi-&gt;lock)</div><div class='ctx'> </div><div class='ctx'>  out_free:</div><div class='ctx'> 	fi-&gt;writectr--;</div><div class='del'>-	rb_erase(&amp;wpa-&gt;writepages_entry, &amp;fi-&gt;writepages);</div><div class='del'>-	fuse_writepage_finish(fm, wpa);</div><div class='add'>+	fuse_writepage_finish(wpa);</div><div class='ctx'> 	spin_unlock(&amp;fi-&gt;lock);</div><div class='del'>-</div><div class='del'>-	/* After fuse_writepage_finish() aux request list is private */</div><div class='del'>-	for (aux = wpa-&gt;next; aux; aux = next) {</div><div class='del'>-		next = aux-&gt;next;</div><div class='del'>-		aux-&gt;next = NULL;</div><div class='del'>-		fuse_writepage_free(aux);</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	fuse_writepage_free(wpa);</div><div class='ctx'> 	spin_lock(&amp;fi-&gt;lock);</div><div class='ctx'> }</div><div class='hunk'>@@ -1715,43 +1980,6 @@ __acquires(fi-&gt;lock)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct fuse_writepage_args *fuse_insert_writeback(struct rb_root *root,</div><div class='del'>-						struct fuse_writepage_args *wpa)</div><div class='del'>-{</div><div class='del'>-	pgoff_t idx_from = wpa-&gt;ia.write.in.offset &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	pgoff_t idx_to = idx_from + wpa-&gt;ia.ap.num_pages - 1;</div><div class='del'>-	struct rb_node **p = &amp;root-&gt;rb_node;</div><div class='del'>-	struct rb_node  *parent = NULL;</div><div class='del'>-</div><div class='del'>-	WARN_ON(!wpa-&gt;ia.ap.num_pages);</div><div class='del'>-	while (*p) {</div><div class='del'>-		struct fuse_writepage_args *curr;</div><div class='del'>-		pgoff_t curr_index;</div><div class='del'>-</div><div class='del'>-		parent = *p;</div><div class='del'>-		curr = rb_entry(parent, struct fuse_writepage_args,</div><div class='del'>-				writepages_entry);</div><div class='del'>-		WARN_ON(curr-&gt;inode != wpa-&gt;inode);</div><div class='del'>-		curr_index = curr-&gt;ia.write.in.offset &gt;&gt; PAGE_SHIFT;</div><div class='del'>-</div><div class='del'>-		if (idx_from &gt;= curr_index + curr-&gt;ia.ap.num_pages)</div><div class='del'>-			p = &amp;(*p)-&gt;rb_right;</div><div class='del'>-		else if (idx_to &lt; curr_index)</div><div class='del'>-			p = &amp;(*p)-&gt;rb_left;</div><div class='del'>-		else</div><div class='del'>-			return curr;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rb_link_node(&amp;wpa-&gt;writepages_entry, parent, p);</div><div class='del'>-	rb_insert_color(&amp;wpa-&gt;writepages_entry, root);</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void tree_insert(struct rb_root *root, struct fuse_writepage_args *wpa)</div><div class='del'>-{</div><div class='del'>-	WARN_ON(fuse_insert_writeback(root, wpa));</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static void fuse_writepage_end(struct fuse_mount *fm, struct fuse_args *args,</div><div class='ctx'> 			       int error)</div><div class='ctx'> {</div><div class='hunk'>@@ -1771,44 +1999,8 @@ static void fuse_writepage_end(struct fuse_mount *fm, struct fuse_args *args,</div><div class='ctx'> 	if (!fc-&gt;writeback_cache)</div><div class='ctx'> 		fuse_invalidate_attr_mask(inode, FUSE_STATX_MODIFY);</div><div class='ctx'> 	spin_lock(&amp;fi-&gt;lock);</div><div class='del'>-	rb_erase(&amp;wpa-&gt;writepages_entry, &amp;fi-&gt;writepages);</div><div class='del'>-	while (wpa-&gt;next) {</div><div class='del'>-		struct fuse_mount *fm = get_fuse_mount(inode);</div><div class='del'>-		struct fuse_write_in *inarg = &amp;wpa-&gt;ia.write.in;</div><div class='del'>-		struct fuse_writepage_args *next = wpa-&gt;next;</div><div class='del'>-</div><div class='del'>-		wpa-&gt;next = next-&gt;next;</div><div class='del'>-		next-&gt;next = NULL;</div><div class='del'>-		next-&gt;ia.ff = fuse_file_get(wpa-&gt;ia.ff);</div><div class='del'>-		tree_insert(&amp;fi-&gt;writepages, next);</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Skip fuse_flush_writepages() to make it easy to crop requests</div><div class='del'>-		 * based on primary request size.</div><div class='del'>-		 *</div><div class='del'>-		 * 1st case (trivial): there are no concurrent activities using</div><div class='del'>-		 * fuse_set/release_nowrite.  Then we're on safe side because</div><div class='del'>-		 * fuse_flush_writepages() would call fuse_send_writepage()</div><div class='del'>-		 * anyway.</div><div class='del'>-		 *</div><div class='del'>-		 * 2nd case: someone called fuse_set_nowrite and it is waiting</div><div class='del'>-		 * now for completion of all in-flight requests.  This happens</div><div class='del'>-		 * rarely and no more than once per page, so this should be</div><div class='del'>-		 * okay.</div><div class='del'>-		 *</div><div class='del'>-		 * 3rd case: someone (e.g. fuse_do_setattr()) is in the middle</div><div class='del'>-		 * of fuse_set_nowrite..fuse_release_nowrite section.  The fact</div><div class='del'>-		 * that fuse_set_nowrite returned implies that all in-flight</div><div class='del'>-		 * requests were completed along with all of their secondary</div><div class='del'>-		 * requests.  Further primary requests are blocked by negative</div><div class='del'>-		 * writectr.  Hence there cannot be any in-flight requests and</div><div class='del'>-		 * no invocations of fuse_writepage_end() while we're in</div><div class='del'>-		 * fuse_set_nowrite..fuse_release_nowrite section.</div><div class='del'>-		 */</div><div class='del'>-		fuse_send_writepage(fm, next, inarg-&gt;offset + inarg-&gt;size);</div><div class='del'>-	}</div><div class='ctx'> 	fi-&gt;writectr--;</div><div class='del'>-	fuse_writepage_finish(fm, wpa);</div><div class='add'>+	fuse_writepage_finish(wpa);</div><div class='ctx'> 	spin_unlock(&amp;fi-&gt;lock);</div><div class='ctx'> 	fuse_writepage_free(wpa);</div><div class='ctx'> }</div><div class='hunk'>@@ -1840,21 +2032,10 @@ int fuse_write_inode(struct inode *inode, struct writeback_control *wbc)</div><div class='ctx'> 	struct fuse_file *ff;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Inode is always written before the last reference is dropped and</div><div class='del'>-	 * hence this should not be reached from reclaim.</div><div class='del'>-	 *</div><div class='del'>-	 * Writing back the inode from reclaim can deadlock if the request</div><div class='del'>-	 * processing itself needs an allocation.  Allocations triggering</div><div class='del'>-	 * reclaim while serving a request can't be prevented, because it can</div><div class='del'>-	 * involve any number of unrelated userspace processes.</div><div class='del'>-	 */</div><div class='del'>-	WARN_ON(wbc-&gt;for_reclaim);</div><div class='del'>-</div><div class='ctx'> 	ff = __fuse_write_file_get(fi);</div><div class='ctx'> 	err = fuse_flush_times(inode, ff);</div><div class='ctx'> 	if (ff)</div><div class='del'>-		fuse_file_put(ff, false, false);</div><div class='add'>+		fuse_file_put(ff, false);</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='hunk'>@@ -1867,9 +2048,9 @@ static struct fuse_writepage_args *fuse_writepage_args_alloc(void)</div><div class='ctx'> 	wpa = kzalloc(sizeof(*wpa), GFP_NOFS);</div><div class='ctx'> 	if (wpa) {</div><div class='ctx'> 		ap = &amp;wpa-&gt;ia.ap;</div><div class='del'>-		ap-&gt;num_pages = 0;</div><div class='del'>-		ap-&gt;pages = fuse_pages_alloc(1, GFP_NOFS, &amp;ap-&gt;descs);</div><div class='del'>-		if (!ap-&gt;pages) {</div><div class='add'>+		ap-&gt;num_folios = 0;</div><div class='add'>+		ap-&gt;folios = fuse_folios_alloc(1, GFP_NOFS, &amp;ap-&gt;descs);</div><div class='add'>+		if (!ap-&gt;folios) {</div><div class='ctx'> 			kfree(wpa);</div><div class='ctx'> 			wpa = NULL;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1892,455 +2073,244 @@ static void fuse_writepage_add_to_bucket(struct fuse_conn *fc,</div><div class='ctx'> 	rcu_read_unlock();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fuse_writepage_locked(struct page *page)</div><div class='add'>+static void fuse_writepage_args_page_fill(struct fuse_writepage_args *wpa, struct folio *folio,</div><div class='add'>+					  uint32_t folio_index, loff_t offset, unsigned len)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *mapping = page-&gt;mapping;</div><div class='del'>-	struct inode *inode = mapping-&gt;host;</div><div class='add'>+	struct fuse_args_pages *ap = &amp;wpa-&gt;ia.ap;</div><div class='add'>+</div><div class='add'>+	ap-&gt;folios[folio_index] = folio;</div><div class='add'>+	ap-&gt;descs[folio_index].offset = offset;</div><div class='add'>+	ap-&gt;descs[folio_index].length = len;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct fuse_writepage_args *fuse_writepage_args_setup(struct folio *folio,</div><div class='add'>+							     size_t offset,</div><div class='add'>+							     struct fuse_file *ff)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	struct fuse_conn *fc = get_fuse_conn(inode);</div><div class='del'>-	struct fuse_inode *fi = get_fuse_inode(inode);</div><div class='ctx'> 	struct fuse_writepage_args *wpa;</div><div class='ctx'> 	struct fuse_args_pages *ap;</div><div class='del'>-	struct page *tmp_page;</div><div class='del'>-	int error = -ENOMEM;</div><div class='del'>-</div><div class='del'>-	set_page_writeback(page);</div><div class='ctx'> </div><div class='ctx'> 	wpa = fuse_writepage_args_alloc();</div><div class='ctx'> 	if (!wpa)</div><div class='del'>-		goto err;</div><div class='del'>-	ap = &amp;wpa-&gt;ia.ap;</div><div class='del'>-</div><div class='del'>-	tmp_page = alloc_page(GFP_NOFS | __GFP_HIGHMEM);</div><div class='del'>-	if (!tmp_page)</div><div class='del'>-		goto err_free;</div><div class='del'>-</div><div class='del'>-	error = -EIO;</div><div class='del'>-	wpa-&gt;ia.ff = fuse_write_file_get(fi);</div><div class='del'>-	if (!wpa-&gt;ia.ff)</div><div class='del'>-		goto err_nofile;</div><div class='add'>+		return NULL;</div><div class='ctx'> </div><div class='ctx'> 	fuse_writepage_add_to_bucket(fc, wpa);</div><div class='del'>-	fuse_write_args_fill(&amp;wpa-&gt;ia, wpa-&gt;ia.ff, page_offset(page), 0);</div><div class='del'>-</div><div class='del'>-	copy_highpage(tmp_page, page);</div><div class='add'>+	fuse_write_args_fill(&amp;wpa-&gt;ia, ff, folio_pos(folio) + offset, 0);</div><div class='ctx'> 	wpa-&gt;ia.write.in.write_flags |= FUSE_WRITE_CACHE;</div><div class='del'>-	wpa-&gt;next = NULL;</div><div class='del'>-	ap-&gt;args.in_pages = true;</div><div class='del'>-	ap-&gt;num_pages = 1;</div><div class='del'>-	ap-&gt;pages[0] = tmp_page;</div><div class='del'>-	ap-&gt;descs[0].offset = 0;</div><div class='del'>-	ap-&gt;descs[0].length = PAGE_SIZE;</div><div class='del'>-	ap-&gt;args.end = fuse_writepage_end;</div><div class='ctx'> 	wpa-&gt;inode = inode;</div><div class='add'>+	wpa-&gt;ia.ff = ff;</div><div class='ctx'> </div><div class='del'>-	inc_wb_stat(&amp;inode_to_bdi(inode)-&gt;wb, WB_WRITEBACK);</div><div class='del'>-	inc_node_page_state(tmp_page, NR_WRITEBACK_TEMP);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;fi-&gt;lock);</div><div class='del'>-	tree_insert(&amp;fi-&gt;writepages, wpa);</div><div class='del'>-	list_add_tail(&amp;wpa-&gt;queue_entry, &amp;fi-&gt;queued_writes);</div><div class='del'>-	fuse_flush_writepages(inode);</div><div class='del'>-	spin_unlock(&amp;fi-&gt;lock);</div><div class='del'>-</div><div class='del'>-	end_page_writeback(page);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-err_nofile:</div><div class='del'>-	__free_page(tmp_page);</div><div class='del'>-err_free:</div><div class='del'>-	kfree(wpa);</div><div class='del'>-err:</div><div class='del'>-	mapping_set_error(page-&gt;mapping, error);</div><div class='del'>-	end_page_writeback(page);</div><div class='del'>-	return error;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int fuse_writepage(struct page *page, struct writeback_control *wbc)</div><div class='del'>-{</div><div class='del'>-	int err;</div><div class='del'>-</div><div class='del'>-	if (fuse_page_is_writeback(page-&gt;mapping-&gt;host, page-&gt;index)) {</div><div class='del'>-		/*</div><div class='del'>-		 * -&gt;writepages() should be called for sync() and friends.  We</div><div class='del'>-		 * should only get here on direct reclaim and then we are</div><div class='del'>-		 * allowed to skip a page which is already in flight</div><div class='del'>-		 */</div><div class='del'>-		WARN_ON(wbc-&gt;sync_mode == WB_SYNC_ALL);</div><div class='del'>-</div><div class='del'>-		redirty_page_for_writepage(wbc, page);</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	err = fuse_writepage_locked(page);</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	ap = &amp;wpa-&gt;ia.ap;</div><div class='add'>+	ap-&gt;args.in_pages = true;</div><div class='add'>+	ap-&gt;args.end = fuse_writepage_end;</div><div class='ctx'> </div><div class='del'>-	return err;</div><div class='add'>+	return wpa;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct fuse_fill_wb_data {</div><div class='ctx'> 	struct fuse_writepage_args *wpa;</div><div class='ctx'> 	struct fuse_file *ff;</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	struct page **orig_pages;</div><div class='del'>-	unsigned int max_pages;</div><div class='add'>+	unsigned int max_folios;</div><div class='add'>+	/*</div><div class='add'>+	 * nr_bytes won't overflow since fuse_folios_need_send() caps</div><div class='add'>+	 * wb requests to never exceed fc-&gt;max_pages (which has an upper bound</div><div class='add'>+	 * of U16_MAX).</div><div class='add'>+	 */</div><div class='add'>+	unsigned int nr_bytes;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static bool fuse_pages_realloc(struct fuse_fill_wb_data *data)</div><div class='add'>+static bool fuse_pages_realloc(struct fuse_fill_wb_data *data,</div><div class='add'>+			       unsigned int max_pages)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_args_pages *ap = &amp;data-&gt;wpa-&gt;ia.ap;</div><div class='del'>-	struct fuse_conn *fc = get_fuse_conn(data-&gt;inode);</div><div class='del'>-	struct page **pages;</div><div class='del'>-	struct fuse_page_desc *descs;</div><div class='del'>-	unsigned int npages = min_t(unsigned int,</div><div class='del'>-				    max_t(unsigned int, data-&gt;max_pages * 2,</div><div class='del'>-					  FUSE_DEFAULT_MAX_PAGES_PER_REQ),</div><div class='del'>-				    fc-&gt;max_pages);</div><div class='del'>-	WARN_ON(npages &lt;= data-&gt;max_pages);</div><div class='del'>-</div><div class='del'>-	pages = fuse_pages_alloc(npages, GFP_NOFS, &amp;descs);</div><div class='del'>-	if (!pages)</div><div class='add'>+	struct folio **folios;</div><div class='add'>+	struct fuse_folio_desc *descs;</div><div class='add'>+	unsigned int nfolios = min_t(unsigned int,</div><div class='add'>+				     max_t(unsigned int, data-&gt;max_folios * 2,</div><div class='add'>+					   FUSE_DEFAULT_MAX_PAGES_PER_REQ),</div><div class='add'>+				    max_pages);</div><div class='add'>+	WARN_ON(nfolios &lt;= data-&gt;max_folios);</div><div class='add'>+</div><div class='add'>+	folios = fuse_folios_alloc(nfolios, GFP_NOFS, &amp;descs);</div><div class='add'>+	if (!folios)</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	memcpy(pages, ap-&gt;pages, sizeof(struct page *) * ap-&gt;num_pages);</div><div class='del'>-	memcpy(descs, ap-&gt;descs, sizeof(struct fuse_page_desc) * ap-&gt;num_pages);</div><div class='del'>-	kfree(ap-&gt;pages);</div><div class='del'>-	ap-&gt;pages = pages;</div><div class='add'>+	memcpy(folios, ap-&gt;folios, sizeof(struct folio *) * ap-&gt;num_folios);</div><div class='add'>+	memcpy(descs, ap-&gt;descs, sizeof(struct fuse_folio_desc) * ap-&gt;num_folios);</div><div class='add'>+	kfree(ap-&gt;folios);</div><div class='add'>+	ap-&gt;folios = folios;</div><div class='ctx'> 	ap-&gt;descs = descs;</div><div class='del'>-	data-&gt;max_pages = npages;</div><div class='add'>+	data-&gt;max_folios = nfolios;</div><div class='ctx'> </div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void fuse_writepages_send(struct fuse_fill_wb_data *data)</div><div class='add'>+static void fuse_writepages_send(struct inode *inode,</div><div class='add'>+				 struct fuse_fill_wb_data *data)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_writepage_args *wpa = data-&gt;wpa;</div><div class='del'>-	struct inode *inode = data-&gt;inode;</div><div class='ctx'> 	struct fuse_inode *fi = get_fuse_inode(inode);</div><div class='del'>-	int num_pages = wpa-&gt;ia.ap.num_pages;</div><div class='del'>-	int i;</div><div class='ctx'> </div><div class='del'>-	wpa-&gt;ia.ff = fuse_file_get(data-&gt;ff);</div><div class='ctx'> 	spin_lock(&amp;fi-&gt;lock);</div><div class='ctx'> 	list_add_tail(&amp;wpa-&gt;queue_entry, &amp;fi-&gt;queued_writes);</div><div class='ctx'> 	fuse_flush_writepages(inode);</div><div class='ctx'> 	spin_unlock(&amp;fi-&gt;lock);</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; num_pages; i++)</div><div class='del'>-		end_page_writeback(data-&gt;orig_pages[i]);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Check under fi-&gt;lock if the page is under writeback, and insert it onto the</div><div class='del'>- * rb_tree if not. Otherwise iterate auxiliary write requests, to see if there's</div><div class='del'>- * one already added for a page at this offset.  If there's none, then insert</div><div class='del'>- * this new request onto the auxiliary list, otherwise reuse the existing one by</div><div class='del'>- * swapping the new temp page with the old one.</div><div class='del'>- */</div><div class='del'>-static bool fuse_writepage_add(struct fuse_writepage_args *new_wpa,</div><div class='del'>-			       struct page *page)</div><div class='add'>+static bool fuse_folios_need_send(struct fuse_conn *fc, loff_t pos,</div><div class='add'>+				  unsigned len, struct fuse_args_pages *ap,</div><div class='add'>+				  unsigned cur_bytes, bool write)</div><div class='ctx'> {</div><div class='del'>-	struct fuse_inode *fi = get_fuse_inode(new_wpa-&gt;inode);</div><div class='del'>-	struct fuse_writepage_args *tmp;</div><div class='del'>-	struct fuse_writepage_args *old_wpa;</div><div class='del'>-	struct fuse_args_pages *new_ap = &amp;new_wpa-&gt;ia.ap;</div><div class='add'>+	struct folio *prev_folio;</div><div class='add'>+	struct fuse_folio_desc prev_desc;</div><div class='add'>+	unsigned bytes = cur_bytes + len;</div><div class='add'>+	loff_t prev_pos;</div><div class='add'>+	size_t max_bytes = write ? fc-&gt;max_write : fc-&gt;max_read;</div><div class='ctx'> </div><div class='del'>-	WARN_ON(new_ap-&gt;num_pages != 0);</div><div class='del'>-	new_ap-&gt;num_pages = 1;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;fi-&gt;lock);</div><div class='del'>-	old_wpa = fuse_insert_writeback(&amp;fi-&gt;writepages, new_wpa);</div><div class='del'>-	if (!old_wpa) {</div><div class='del'>-		spin_unlock(&amp;fi-&gt;lock);</div><div class='del'>-		return true;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	for (tmp = old_wpa-&gt;next; tmp; tmp = tmp-&gt;next) {</div><div class='del'>-		pgoff_t curr_index;</div><div class='del'>-</div><div class='del'>-		WARN_ON(tmp-&gt;inode != new_wpa-&gt;inode);</div><div class='del'>-		curr_index = tmp-&gt;ia.write.in.offset &gt;&gt; PAGE_SHIFT;</div><div class='del'>-		if (curr_index == page-&gt;index) {</div><div class='del'>-			WARN_ON(tmp-&gt;ia.ap.num_pages != 1);</div><div class='del'>-			swap(tmp-&gt;ia.ap.pages[0], new_ap-&gt;pages[0]);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!tmp) {</div><div class='del'>-		new_wpa-&gt;next = old_wpa-&gt;next;</div><div class='del'>-		old_wpa-&gt;next = new_wpa;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_unlock(&amp;fi-&gt;lock);</div><div class='del'>-</div><div class='del'>-	if (tmp) {</div><div class='del'>-		struct backing_dev_info *bdi = inode_to_bdi(new_wpa-&gt;inode);</div><div class='del'>-</div><div class='del'>-		dec_wb_stat(&amp;bdi-&gt;wb, WB_WRITEBACK);</div><div class='del'>-		dec_node_page_state(new_ap-&gt;pages[0], NR_WRITEBACK_TEMP);</div><div class='del'>-		wb_writeout_inc(&amp;bdi-&gt;wb);</div><div class='del'>-		fuse_writepage_free(new_wpa);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool fuse_writepage_need_send(struct fuse_conn *fc, struct page *page,</div><div class='del'>-				     struct fuse_args_pages *ap,</div><div class='del'>-				     struct fuse_fill_wb_data *data)</div><div class='del'>-{</div><div class='del'>-	WARN_ON(!ap-&gt;num_pages);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Being under writeback is unlikely but possible.  For example direct</div><div class='del'>-	 * read to an mmaped fuse file will set the page dirty twice; once when</div><div class='del'>-	 * the pages are faulted with get_user_pages(), and then after the read</div><div class='del'>-	 * completed.</div><div class='del'>-	 */</div><div class='del'>-	if (fuse_page_is_writeback(data-&gt;inode, page-&gt;index))</div><div class='del'>-		return true;</div><div class='add'>+	WARN_ON(!ap-&gt;num_folios);</div><div class='ctx'> </div><div class='ctx'> 	/* Reached max pages */</div><div class='del'>-	if (ap-&gt;num_pages == fc-&gt;max_pages)</div><div class='add'>+	if ((bytes + PAGE_SIZE - 1) &gt;&gt; PAGE_SHIFT &gt; fc-&gt;max_pages)</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='del'>-	/* Reached max write bytes */</div><div class='del'>-	if ((ap-&gt;num_pages + 1) * PAGE_SIZE &gt; fc-&gt;max_write)</div><div class='add'>+	if (bytes &gt; max_bytes)</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='ctx'> 	/* Discontinuity */</div><div class='del'>-	if (data-&gt;orig_pages[ap-&gt;num_pages - 1]-&gt;index + 1 != page-&gt;index)</div><div class='del'>-		return true;</div><div class='del'>-</div><div class='del'>-	/* Need to grow the pages array?  If so, did the expansion fail? */</div><div class='del'>-	if (ap-&gt;num_pages == data-&gt;max_pages &amp;&amp; !fuse_pages_realloc(data))</div><div class='add'>+	prev_folio = ap-&gt;folios[ap-&gt;num_folios - 1];</div><div class='add'>+	prev_desc = ap-&gt;descs[ap-&gt;num_folios - 1];</div><div class='add'>+	prev_pos = folio_pos(prev_folio) + prev_desc.offset + prev_desc.length;</div><div class='add'>+	if (prev_pos != pos)</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fuse_writepages_fill(struct page *page,</div><div class='del'>-		struct writeback_control *wbc, void *_data)</div><div class='add'>+static ssize_t fuse_iomap_writeback_range(struct iomap_writepage_ctx *wpc,</div><div class='add'>+					  struct folio *folio, u64 pos,</div><div class='add'>+					  unsigned len, u64 end_pos)</div><div class='ctx'> {</div><div class='del'>-	struct fuse_fill_wb_data *data = _data;</div><div class='add'>+	struct fuse_fill_wb_data *data = wpc-&gt;wb_ctx;</div><div class='ctx'> 	struct fuse_writepage_args *wpa = data-&gt;wpa;</div><div class='ctx'> 	struct fuse_args_pages *ap = &amp;wpa-&gt;ia.ap;</div><div class='del'>-	struct inode *inode = data-&gt;inode;</div><div class='add'>+	struct inode *inode = wpc-&gt;inode;</div><div class='ctx'> 	struct fuse_inode *fi = get_fuse_inode(inode);</div><div class='ctx'> 	struct fuse_conn *fc = get_fuse_conn(inode);</div><div class='del'>-	struct page *tmp_page;</div><div class='del'>-	int err;</div><div class='add'>+	loff_t offset = offset_in_folio(folio, pos);</div><div class='add'>+</div><div class='add'>+	WARN_ON_ONCE(!data);</div><div class='ctx'> </div><div class='ctx'> 	if (!data-&gt;ff) {</div><div class='del'>-		err = -EIO;</div><div class='ctx'> 		data-&gt;ff = fuse_write_file_get(fi);</div><div class='ctx'> 		if (!data-&gt;ff)</div><div class='del'>-			goto out_unlock;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (wpa &amp;&amp; fuse_writepage_need_send(fc, page, ap, data)) {</div><div class='del'>-		fuse_writepages_send(data);</div><div class='del'>-		data-&gt;wpa = NULL;</div><div class='add'>+			return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = -ENOMEM;</div><div class='del'>-	tmp_page = alloc_page(GFP_NOFS | __GFP_HIGHMEM);</div><div class='del'>-	if (!tmp_page)</div><div class='del'>-		goto out_unlock;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * The page must not be redirtied until the writeout is completed</div><div class='del'>-	 * (i.e. userspace has sent a reply to the write request).  Otherwise</div><div class='del'>-	 * there could be more than one temporary page instance for each real</div><div class='del'>-	 * page.</div><div class='del'>-	 *</div><div class='del'>-	 * This is ensured by holding the page lock in page_mkwrite() while</div><div class='del'>-	 * checking fuse_page_is_writeback().  We already hold the page lock</div><div class='del'>-	 * since clear_page_dirty_for_io() and keep it held until we add the</div><div class='del'>-	 * request to the fi-&gt;writepages list and increment ap-&gt;num_pages.</div><div class='del'>-	 * After this fuse_page_is_writeback() will indicate that the page is</div><div class='del'>-	 * under writeback, so we can release the page lock.</div><div class='del'>-	 */</div><div class='del'>-	if (data-&gt;wpa == NULL) {</div><div class='del'>-		err = -ENOMEM;</div><div class='del'>-		wpa = fuse_writepage_args_alloc();</div><div class='del'>-		if (!wpa) {</div><div class='del'>-			__free_page(tmp_page);</div><div class='del'>-			goto out_unlock;</div><div class='add'>+	if (wpa) {</div><div class='add'>+		bool send = fuse_folios_need_send(fc, pos, len, ap,</div><div class='add'>+						  data-&gt;nr_bytes, true);</div><div class='add'>+</div><div class='add'>+		if (!send) {</div><div class='add'>+			/*</div><div class='add'>+			 * Need to grow the pages array?  If so, did the</div><div class='add'>+			 * expansion fail?</div><div class='add'>+			 */</div><div class='add'>+			send = (ap-&gt;num_folios == data-&gt;max_folios) &amp;&amp;</div><div class='add'>+				!fuse_pages_realloc(data, fc-&gt;max_pages);</div><div class='ctx'> 		}</div><div class='del'>-		fuse_writepage_add_to_bucket(fc, wpa);</div><div class='ctx'> </div><div class='del'>-		data-&gt;max_pages = 1;</div><div class='add'>+		if (send) {</div><div class='add'>+			fuse_writepages_send(inode, data);</div><div class='add'>+			data-&gt;wpa = NULL;</div><div class='add'>+			data-&gt;nr_bytes = 0;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='add'>+	if (data-&gt;wpa == NULL) {</div><div class='add'>+		wpa = fuse_writepage_args_setup(folio, offset, data-&gt;ff);</div><div class='add'>+		if (!wpa)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+		fuse_file_get(wpa-&gt;ia.ff);</div><div class='add'>+		data-&gt;max_folios = 1;</div><div class='ctx'> 		ap = &amp;wpa-&gt;ia.ap;</div><div class='del'>-		fuse_write_args_fill(&amp;wpa-&gt;ia, data-&gt;ff, page_offset(page), 0);</div><div class='del'>-		wpa-&gt;ia.write.in.write_flags |= FUSE_WRITE_CACHE;</div><div class='del'>-		wpa-&gt;next = NULL;</div><div class='del'>-		ap-&gt;args.in_pages = true;</div><div class='del'>-		ap-&gt;args.end = fuse_writepage_end;</div><div class='del'>-		ap-&gt;num_pages = 0;</div><div class='del'>-		wpa-&gt;inode = inode;</div><div class='ctx'> 	}</div><div class='del'>-	set_page_writeback(page);</div><div class='del'>-</div><div class='del'>-	copy_highpage(tmp_page, page);</div><div class='del'>-	ap-&gt;pages[ap-&gt;num_pages] = tmp_page;</div><div class='del'>-	ap-&gt;descs[ap-&gt;num_pages].offset = 0;</div><div class='del'>-	ap-&gt;descs[ap-&gt;num_pages].length = PAGE_SIZE;</div><div class='del'>-	data-&gt;orig_pages[ap-&gt;num_pages] = page;</div><div class='ctx'> </div><div class='del'>-	inc_wb_stat(&amp;inode_to_bdi(inode)-&gt;wb, WB_WRITEBACK);</div><div class='del'>-	inc_node_page_state(tmp_page, NR_WRITEBACK_TEMP);</div><div class='add'>+	fuse_writepage_args_page_fill(wpa, folio, ap-&gt;num_folios,</div><div class='add'>+				      offset, len);</div><div class='add'>+	data-&gt;nr_bytes += len;</div><div class='ctx'> </div><div class='del'>-	err = 0;</div><div class='del'>-	if (data-&gt;wpa) {</div><div class='del'>-		/*</div><div class='del'>-		 * Protected by fi-&gt;lock against concurrent access by</div><div class='del'>-		 * fuse_page_is_writeback().</div><div class='del'>-		 */</div><div class='del'>-		spin_lock(&amp;fi-&gt;lock);</div><div class='del'>-		ap-&gt;num_pages++;</div><div class='del'>-		spin_unlock(&amp;fi-&gt;lock);</div><div class='del'>-	} else if (fuse_writepage_add(wpa, page)) {</div><div class='add'>+	ap-&gt;num_folios++;</div><div class='add'>+	if (!data-&gt;wpa)</div><div class='ctx'> 		data-&gt;wpa = wpa;</div><div class='del'>-	} else {</div><div class='del'>-		end_page_writeback(page);</div><div class='del'>-	}</div><div class='del'>-out_unlock:</div><div class='del'>-	unlock_page(page);</div><div class='ctx'> </div><div class='del'>-	return err;</div><div class='add'>+	return len;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fuse_writepages(struct address_space *mapping,</div><div class='del'>-			   struct writeback_control *wbc)</div><div class='add'>+static int fuse_iomap_writeback_submit(struct iomap_writepage_ctx *wpc,</div><div class='add'>+				       int error)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = mapping-&gt;host;</div><div class='del'>-	struct fuse_conn *fc = get_fuse_conn(inode);</div><div class='del'>-	struct fuse_fill_wb_data data;</div><div class='del'>-	int err;</div><div class='del'>-</div><div class='del'>-	err = -EIO;</div><div class='del'>-	if (fuse_is_bad(inode))</div><div class='del'>-		goto out;</div><div class='add'>+	struct fuse_fill_wb_data *data = wpc-&gt;wb_ctx;</div><div class='ctx'> </div><div class='del'>-	data.inode = inode;</div><div class='del'>-	data.wpa = NULL;</div><div class='del'>-	data.ff = NULL;</div><div class='add'>+	WARN_ON_ONCE(!data);</div><div class='ctx'> </div><div class='del'>-	err = -ENOMEM;</div><div class='del'>-	data.orig_pages = kcalloc(fc-&gt;max_pages,</div><div class='del'>-				  sizeof(struct page *),</div><div class='del'>-				  GFP_NOFS);</div><div class='del'>-	if (!data.orig_pages)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	err = write_cache_pages(mapping, wbc, fuse_writepages_fill, &amp;data);</div><div class='del'>-	if (data.wpa) {</div><div class='del'>-		WARN_ON(!data.wpa-&gt;ia.ap.num_pages);</div><div class='del'>-		fuse_writepages_send(&amp;data);</div><div class='add'>+	if (data-&gt;wpa) {</div><div class='add'>+		WARN_ON(!data-&gt;wpa-&gt;ia.ap.num_folios);</div><div class='add'>+		fuse_writepages_send(wpc-&gt;inode, data);</div><div class='ctx'> 	}</div><div class='del'>-	if (data.ff)</div><div class='del'>-		fuse_file_put(data.ff, false, false);</div><div class='ctx'> </div><div class='del'>-	kfree(data.orig_pages);</div><div class='del'>-out:</div><div class='del'>-	return err;</div><div class='del'>-}</div><div class='add'>+	if (data-&gt;ff)</div><div class='add'>+		fuse_file_put(data-&gt;ff, false);</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * It's worthy to make sure that space is reserved on disk for the write,</div><div class='del'>- * but how to implement it without killing performance need more thinking.</div><div class='del'>- */</div><div class='del'>-static int fuse_write_begin(struct file *file, struct address_space *mapping,</div><div class='del'>-		loff_t pos, unsigned len, unsigned flags,</div><div class='del'>-		struct page **pagep, void **fsdata)</div><div class='del'>-{</div><div class='del'>-	pgoff_t index = pos &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	struct fuse_conn *fc = get_fuse_conn(file_inode(file));</div><div class='del'>-	struct page *page;</div><div class='del'>-	loff_t fsize;</div><div class='del'>-	int err = -ENOMEM;</div><div class='del'>-</div><div class='del'>-	WARN_ON(!fc-&gt;writeback_cache);</div><div class='del'>-</div><div class='del'>-	page = grab_cache_page_write_begin(mapping, index, flags);</div><div class='del'>-	if (!page)</div><div class='del'>-		goto error;</div><div class='del'>-</div><div class='del'>-	fuse_wait_on_page_writeback(mapping-&gt;host, page-&gt;index);</div><div class='del'>-</div><div class='del'>-	if (PageUptodate(page) || len == PAGE_SIZE)</div><div class='del'>-		goto success;</div><div class='del'>-	/*</div><div class='del'>-	 * Check if the start this page comes after the end of file, in which</div><div class='del'>-	 * case the readpage can be optimized away.</div><div class='del'>-	 */</div><div class='del'>-	fsize = i_size_read(mapping-&gt;host);</div><div class='del'>-	if (fsize &lt;= (pos &amp; PAGE_MASK)) {</div><div class='del'>-		size_t off = pos &amp; ~PAGE_MASK;</div><div class='del'>-		if (off)</div><div class='del'>-			zero_user_segment(page, 0, off);</div><div class='del'>-		goto success;</div><div class='del'>-	}</div><div class='del'>-	err = fuse_do_readpage(file, page);</div><div class='del'>-	if (err)</div><div class='del'>-		goto cleanup;</div><div class='del'>-success:</div><div class='del'>-	*pagep = page;</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-cleanup:</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='del'>-error:</div><div class='del'>-	return err;</div><div class='add'>+	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fuse_write_end(struct file *file, struct address_space *mapping,</div><div class='del'>-		loff_t pos, unsigned len, unsigned copied,</div><div class='del'>-		struct page *page, void *fsdata)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-</div><div class='del'>-	/* Haven't copied anything?  Skip zeroing, size extending, dirtying. */</div><div class='del'>-	if (!copied)</div><div class='del'>-		goto unlock;</div><div class='del'>-</div><div class='del'>-	pos += copied;</div><div class='del'>-	if (!PageUptodate(page)) {</div><div class='del'>-		/* Zero any unwritten bytes at the end of the page */</div><div class='del'>-		size_t endoff = pos &amp; ~PAGE_MASK;</div><div class='del'>-		if (endoff)</div><div class='del'>-			zero_user_segment(page, endoff, PAGE_SIZE);</div><div class='del'>-		SetPageUptodate(page);</div><div class='del'>-	}</div><div class='add'>+static const struct iomap_writeback_ops fuse_writeback_ops = {</div><div class='add'>+	.writeback_range	= fuse_iomap_writeback_range,</div><div class='add'>+	.writeback_submit	= fuse_iomap_writeback_submit,</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-	if (pos &gt; inode-&gt;i_size)</div><div class='del'>-		i_size_write(inode, pos);</div><div class='add'>+static int fuse_writepages(struct address_space *mapping,</div><div class='add'>+			   struct writeback_control *wbc)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = mapping-&gt;host;</div><div class='add'>+	struct fuse_conn *fc = get_fuse_conn(inode);</div><div class='add'>+	struct fuse_fill_wb_data data = {};</div><div class='add'>+	struct iomap_writepage_ctx wpc = {</div><div class='add'>+		.inode = inode,</div><div class='add'>+		.iomap.type = IOMAP_MAPPED,</div><div class='add'>+		.wbc = wbc,</div><div class='add'>+		.ops = &amp;fuse_writeback_ops,</div><div class='add'>+		.wb_ctx	= &amp;data,</div><div class='add'>+	};</div><div class='ctx'> </div><div class='del'>-	set_page_dirty(page);</div><div class='add'>+	if (fuse_is_bad(inode))</div><div class='add'>+		return -EIO;</div><div class='ctx'> </div><div class='del'>-unlock:</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='add'>+	if (wbc-&gt;sync_mode == WB_SYNC_NONE &amp;&amp;</div><div class='add'>+	    fc-&gt;num_background &gt;= fc-&gt;congestion_threshold)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	return copied;</div><div class='add'>+	return iomap_writepages(&amp;wpc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int fuse_launder_page(struct page *page)</div><div class='add'>+static int fuse_launder_folio(struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	int err = 0;</div><div class='del'>-	if (clear_page_dirty_for_io(page)) {</div><div class='del'>-		struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct fuse_fill_wb_data data = {};</div><div class='add'>+	struct iomap_writepage_ctx wpc = {</div><div class='add'>+		.inode = folio-&gt;mapping-&gt;host,</div><div class='add'>+		.iomap.type = IOMAP_MAPPED,</div><div class='add'>+		.ops = &amp;fuse_writeback_ops,</div><div class='add'>+		.wb_ctx	= &amp;data,</div><div class='add'>+	};</div><div class='ctx'> </div><div class='del'>-		/* Serialize with pending writeback for the same page */</div><div class='del'>-		fuse_wait_on_page_writeback(inode, page-&gt;index);</div><div class='del'>-		err = fuse_writepage_locked(page);</div><div class='add'>+	if (folio_clear_dirty_for_io(folio)) {</div><div class='add'>+		err = iomap_writeback_folio(&amp;wpc, folio);</div><div class='add'>+		err = fuse_iomap_writeback_submit(&amp;wpc, err);</div><div class='ctx'> 		if (!err)</div><div class='del'>-			fuse_wait_on_page_writeback(inode, page-&gt;index);</div><div class='add'>+			folio_wait_writeback(folio);</div><div class='ctx'> 	}</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='hunk'>@@ -2374,17 +2344,17 @@ static void fuse_vma_close(struct vm_area_struct *vma)</div><div class='ctx'>  */</div><div class='ctx'> static vm_fault_t fuse_page_mkwrite(struct vm_fault *vmf)</div><div class='ctx'> {</div><div class='del'>-	struct page *page = vmf-&gt;page;</div><div class='add'>+	struct folio *folio = page_folio(vmf-&gt;page);</div><div class='ctx'> 	struct inode *inode = file_inode(vmf-&gt;vma-&gt;vm_file);</div><div class='ctx'> </div><div class='ctx'> 	file_update_time(vmf-&gt;vma-&gt;vm_file);</div><div class='del'>-	lock_page(page);</div><div class='del'>-	if (page-&gt;mapping != inode-&gt;i_mapping) {</div><div class='del'>-		unlock_page(page);</div><div class='add'>+	folio_lock(folio);</div><div class='add'>+	if (folio-&gt;mapping != inode-&gt;i_mapping) {</div><div class='add'>+		folio_unlock(folio);</div><div class='ctx'> 		return VM_FAULT_NOPAGE;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	fuse_wait_on_page_writeback(inode, page-&gt;index);</div><div class='add'>+	folio_wait_writeback(folio);</div><div class='ctx'> 	return VM_FAULT_LOCKED;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2398,19 +2368,53 @@ static const struct vm_operations_struct fuse_file_vm_ops = {</div><div class='ctx'> static int fuse_file_mmap(struct file *file, struct vm_area_struct *vma)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_file *ff = file-&gt;private_data;</div><div class='add'>+	struct fuse_conn *fc = ff-&gt;fm-&gt;fc;</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='add'>+	int rc;</div><div class='ctx'> </div><div class='ctx'> 	/* DAX mmap is superior to direct_io mmap */</div><div class='del'>-	if (FUSE_IS_DAX(file_inode(file)))</div><div class='add'>+	if (FUSE_IS_DAX(inode))</div><div class='ctx'> 		return fuse_dax_mmap(file, vma);</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * If inode is in passthrough io mode, because it has some file open</div><div class='add'>+	 * in passthrough mode, either mmap to backing file or fail mmap,</div><div class='add'>+	 * because mixing cached mmap and passthrough io mode is not allowed.</div><div class='add'>+	 */</div><div class='add'>+	if (fuse_file_passthrough(ff))</div><div class='add'>+		return fuse_passthrough_mmap(file, vma);</div><div class='add'>+	else if (fuse_inode_backing(get_fuse_inode(inode)))</div><div class='add'>+		return -ENODEV;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * FOPEN_DIRECT_IO handling is special compared to O_DIRECT,</div><div class='add'>+	 * as does not allow MAP_SHARED mmap without FUSE_DIRECT_IO_ALLOW_MMAP.</div><div class='add'>+	 */</div><div class='ctx'> 	if (ff-&gt;open_flags &amp; FOPEN_DIRECT_IO) {</div><div class='del'>-		/* Can't provide the coherency needed for MAP_SHARED */</div><div class='del'>-		if (vma-&gt;vm_flags &amp; VM_MAYSHARE)</div><div class='add'>+		/*</div><div class='add'>+		 * Can't provide the coherency needed for MAP_SHARED</div><div class='add'>+		 * if FUSE_DIRECT_IO_ALLOW_MMAP isn't set.</div><div class='add'>+		 */</div><div class='add'>+		if ((vma-&gt;vm_flags &amp; VM_MAYSHARE) &amp;&amp; !fc-&gt;direct_io_allow_mmap)</div><div class='ctx'> 			return -ENODEV;</div><div class='ctx'> </div><div class='ctx'> 		invalidate_inode_pages2(file-&gt;f_mapping);</div><div class='ctx'> </div><div class='del'>-		return generic_file_mmap(file, vma);</div><div class='add'>+		if (!(vma-&gt;vm_flags &amp; VM_MAYSHARE)) {</div><div class='add'>+			/* MAP_PRIVATE */</div><div class='add'>+			return generic_file_mmap(file, vma);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * First mmap of direct_io file enters caching inode io mode.</div><div class='add'>+		 * Also waits for parallel dio writers to go into serial mode</div><div class='add'>+		 * (exclusive instead of shared lock).</div><div class='add'>+		 * After first mmap, the inode stays in caching io mode until</div><div class='add'>+		 * the direct_io file release.</div><div class='add'>+		 */</div><div class='add'>+		rc = fuse_file_cached_io_open(inode, ff);</div><div class='add'>+		if (rc)</div><div class='add'>+			return rc;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if ((vma-&gt;vm_flags &amp; VM_SHARED) &amp;&amp; (vma-&gt;vm_flags &amp; VM_MAYWRITE))</div><div class='hunk'>@@ -2443,14 +2447,14 @@ static int convert_fuse_file_lock(struct fuse_conn *fc,</div><div class='ctx'> 		 * translate it into the caller's pid namespace.</div><div class='ctx'> 		 */</div><div class='ctx'> 		rcu_read_lock();</div><div class='del'>-		fl-&gt;fl_pid = pid_nr_ns(find_pid_ns(ffl-&gt;pid, fc-&gt;pid_ns), &amp;init_pid_ns);</div><div class='add'>+		fl-&gt;c.flc_pid = pid_nr_ns(find_pid_ns(ffl-&gt;pid, fc-&gt;pid_ns), &amp;init_pid_ns);</div><div class='ctx'> 		rcu_read_unlock();</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	default:</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='del'>-	fl-&gt;fl_type = ffl-&gt;type;</div><div class='add'>+	fl-&gt;c.flc_type = ffl-&gt;type;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2464,10 +2468,10 @@ static void fuse_lk_fill(struct fuse_args *args, struct file *file,</div><div class='ctx'> </div><div class='ctx'> 	memset(inarg, 0, sizeof(*inarg));</div><div class='ctx'> 	inarg-&gt;fh = ff-&gt;fh;</div><div class='del'>-	inarg-&gt;owner = fuse_lock_owner_id(fc, fl-&gt;fl_owner);</div><div class='add'>+	inarg-&gt;owner = fuse_lock_owner_id(fc, fl-&gt;c.flc_owner);</div><div class='ctx'> 	inarg-&gt;lk.start = fl-&gt;fl_start;</div><div class='ctx'> 	inarg-&gt;lk.end = fl-&gt;fl_end;</div><div class='del'>-	inarg-&gt;lk.type = fl-&gt;fl_type;</div><div class='add'>+	inarg-&gt;lk.type = fl-&gt;c.flc_type;</div><div class='ctx'> 	inarg-&gt;lk.pid = pid;</div><div class='ctx'> 	if (flock)</div><div class='ctx'> 		inarg-&gt;lk_flags |= FUSE_LK_FLOCK;</div><div class='hunk'>@@ -2504,8 +2508,8 @@ static int fuse_setlk(struct file *file, struct file_lock *fl, int flock)</div><div class='ctx'> 	struct fuse_mount *fm = get_fuse_mount(inode);</div><div class='ctx'> 	FUSE_ARGS(args);</div><div class='ctx'> 	struct fuse_lk_in inarg;</div><div class='del'>-	int opcode = (fl-&gt;fl_flags &amp; FL_SLEEP) ? FUSE_SETLKW : FUSE_SETLK;</div><div class='del'>-	struct pid *pid = fl-&gt;fl_type != F_UNLCK ? task_tgid(current) : NULL;</div><div class='add'>+	int opcode = (fl-&gt;c.flc_flags &amp; FL_SLEEP) ? FUSE_SETLKW : FUSE_SETLK;</div><div class='add'>+	struct pid *pid = fl-&gt;c.flc_type != F_UNLCK ? task_tgid(current) : NULL;</div><div class='ctx'> 	pid_t pid_nr = pid_nr_ns(pid, fm-&gt;fc-&gt;pid_ns);</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='hunk'>@@ -2514,10 +2518,6 @@ static int fuse_setlk(struct file *file, struct file_lock *fl, int flock)</div><div class='ctx'> 		return -ENOLCK;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Unlock on close is handled by the flush method */</div><div class='del'>-	if ((fl-&gt;fl_flags &amp; FL_CLOSE_POSIX) == FL_CLOSE_POSIX)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='ctx'> 	fuse_lk_fill(&amp;args, file, fl, opcode, pid_nr, flock, &amp;inarg);</div><div class='ctx'> 	err = fuse_simple_request(fm, &amp;args);</div><div class='ctx'> </div><div class='hunk'>@@ -2805,7 +2805,7 @@ static void fuse_do_truncate(struct file *file)</div><div class='ctx'> 	attr.ia_file = file;</div><div class='ctx'> 	attr.ia_valid |= ATTR_FILE;</div><div class='ctx'> </div><div class='del'>-	fuse_do_setattr(file_dentry(file), &amp;attr, file);</div><div class='add'>+	fuse_do_setattr(file_mnt_idmap(file), file_dentry(file), &amp;attr, file);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline loff_t fuse_round_up(struct fuse_conn *fc, loff_t off)</div><div class='hunk'>@@ -2901,6 +2901,7 @@ fuse_direct_IO(struct kiocb *iocb, struct iov_iter *iter)</div><div class='ctx'> </div><div class='ctx'> 	if (iov_iter_rw(iter) == WRITE) {</div><div class='ctx'> 		fuse_write_update_attr(inode, pos, ret);</div><div class='add'>+		/* For extending writes we already hold exclusive lock */</div><div class='ctx'> 		if (ret &lt; 0 &amp;&amp; offset + count &gt; i_size)</div><div class='ctx'> 			fuse_do_truncate(file);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2910,7 +2911,7 @@ fuse_direct_IO(struct kiocb *iocb, struct iov_iter *iter)</div><div class='ctx'> </div><div class='ctx'> static int fuse_writeback_range(struct inode *inode, loff_t start, loff_t end)</div><div class='ctx'> {</div><div class='del'>-	int err = filemap_write_and_wait_range(inode-&gt;i_mapping, start, -1);</div><div class='add'>+	int err = filemap_write_and_wait_range(inode-&gt;i_mapping, start, LLONG_MAX);</div><div class='ctx'> </div><div class='ctx'> 	if (!err)</div><div class='ctx'> 		fuse_sync_writes(inode);</div><div class='hunk'>@@ -2933,11 +2934,9 @@ static long fuse_file_fallocate(struct file *file, int mode, loff_t offset,</div><div class='ctx'> 		.mode = mode</div><div class='ctx'> 	};</div><div class='ctx'> 	int err;</div><div class='del'>-	bool lock_inode = !(mode &amp; FALLOC_FL_KEEP_SIZE) ||</div><div class='del'>-			   (mode &amp; (FALLOC_FL_PUNCH_HOLE |</div><div class='del'>-				    FALLOC_FL_ZERO_RANGE));</div><div class='del'>-</div><div class='del'>-	bool block_faults = FUSE_IS_DAX(inode) &amp;&amp; lock_inode;</div><div class='add'>+	bool block_faults = FUSE_IS_DAX(inode) &amp;&amp;</div><div class='add'>+		(!(mode &amp; FALLOC_FL_KEEP_SIZE) ||</div><div class='add'>+		 (mode &amp; (FALLOC_FL_PUNCH_HOLE | FALLOC_FL_ZERO_RANGE)));</div><div class='ctx'> </div><div class='ctx'> 	if (mode &amp; ~(FALLOC_FL_KEEP_SIZE | FALLOC_FL_PUNCH_HOLE |</div><div class='ctx'> 		     FALLOC_FL_ZERO_RANGE))</div><div class='hunk'>@@ -2946,22 +2945,20 @@ static long fuse_file_fallocate(struct file *file, int mode, loff_t offset,</div><div class='ctx'> 	if (fm-&gt;fc-&gt;no_fallocate)</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='del'>-	if (lock_inode) {</div><div class='del'>-		inode_lock(inode);</div><div class='del'>-		if (block_faults) {</div><div class='del'>-			filemap_invalidate_lock(inode-&gt;i_mapping);</div><div class='del'>-			err = fuse_dax_break_layouts(inode, 0, 0);</div><div class='del'>-			if (err)</div><div class='del'>-				goto out;</div><div class='del'>-		}</div><div class='add'>+	inode_lock(inode);</div><div class='add'>+	if (block_faults) {</div><div class='add'>+		filemap_invalidate_lock(inode-&gt;i_mapping);</div><div class='add'>+		err = fuse_dax_break_layouts(inode, 0, -1);</div><div class='add'>+		if (err)</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		if (mode &amp; (FALLOC_FL_PUNCH_HOLE | FALLOC_FL_ZERO_RANGE)) {</div><div class='del'>-			loff_t endbyte = offset + length - 1;</div><div class='add'>+	if (mode &amp; (FALLOC_FL_PUNCH_HOLE | FALLOC_FL_ZERO_RANGE)) {</div><div class='add'>+		loff_t endbyte = offset + length - 1;</div><div class='ctx'> </div><div class='del'>-			err = fuse_writeback_range(inode, offset, endbyte);</div><div class='del'>-			if (err)</div><div class='del'>-				goto out;</div><div class='del'>-		}</div><div class='add'>+		err = fuse_writeback_range(inode, offset, endbyte);</div><div class='add'>+		if (err)</div><div class='add'>+			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!(mode &amp; FALLOC_FL_KEEP_SIZE) &amp;&amp;</div><div class='hunk'>@@ -2971,6 +2968,10 @@ static long fuse_file_fallocate(struct file *file, int mode, loff_t offset,</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	err = file_modified(file);</div><div class='add'>+	if (err)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='ctx'> 	if (!(mode &amp; FALLOC_FL_KEEP_SIZE))</div><div class='ctx'> 		set_bit(FUSE_I_SIZE_UNSTABLE, &amp;fi-&gt;state);</div><div class='ctx'> </div><div class='hunk'>@@ -3005,8 +3006,7 @@ out:</div><div class='ctx'> 	if (block_faults)</div><div class='ctx'> 		filemap_invalidate_unlock(inode-&gt;i_mapping);</div><div class='ctx'> </div><div class='del'>-	if (lock_inode)</div><div class='del'>-		inode_unlock(inode);</div><div class='add'>+	inode_unlock(inode);</div><div class='ctx'> </div><div class='ctx'> 	fuse_flush_time_update(inode);</div><div class='ctx'> </div><div class='hunk'>@@ -3035,6 +3035,8 @@ static ssize_t __fuse_copy_file_range(struct file *file_in, loff_t pos_in,</div><div class='ctx'> 		.flags = flags</div><div class='ctx'> 	};</div><div class='ctx'> 	struct fuse_write_out outarg;</div><div class='add'>+	struct fuse_copy_file_range_out outarg_64;</div><div class='add'>+	u64 bytes_copied;</div><div class='ctx'> 	ssize_t err;</div><div class='ctx'> 	/* mark unstable when write-back is not used, and file_out gets</div><div class='ctx'> 	 * extended */</div><div class='hunk'>@@ -3084,30 +3086,51 @@ static ssize_t __fuse_copy_file_range(struct file *file_in, loff_t pos_in,</div><div class='ctx'> 	if (is_unstable)</div><div class='ctx'> 		set_bit(FUSE_I_SIZE_UNSTABLE, &amp;fi_out-&gt;state);</div><div class='ctx'> </div><div class='del'>-	args.opcode = FUSE_COPY_FILE_RANGE;</div><div class='add'>+	args.opcode = FUSE_COPY_FILE_RANGE_64;</div><div class='ctx'> 	args.nodeid = ff_in-&gt;nodeid;</div><div class='ctx'> 	args.in_numargs = 1;</div><div class='ctx'> 	args.in_args[0].size = sizeof(inarg);</div><div class='ctx'> 	args.in_args[0].value = &amp;inarg;</div><div class='ctx'> 	args.out_numargs = 1;</div><div class='del'>-	args.out_args[0].size = sizeof(outarg);</div><div class='del'>-	args.out_args[0].value = &amp;outarg;</div><div class='add'>+	args.out_args[0].size = sizeof(outarg_64);</div><div class='add'>+	args.out_args[0].value = &amp;outarg_64;</div><div class='add'>+	if (fc-&gt;no_copy_file_range_64) {</div><div class='add'>+fallback:</div><div class='add'>+		/* Fall back to old op that can't handle large copy length */</div><div class='add'>+		args.opcode = FUSE_COPY_FILE_RANGE;</div><div class='add'>+		args.out_args[0].size = sizeof(outarg);</div><div class='add'>+		args.out_args[0].value = &amp;outarg;</div><div class='add'>+		inarg.len = len = min_t(size_t, len, UINT_MAX &amp; PAGE_MASK);</div><div class='add'>+	}</div><div class='ctx'> 	err = fuse_simple_request(fm, &amp;args);</div><div class='ctx'> 	if (err == -ENOSYS) {</div><div class='del'>-		fc-&gt;no_copy_file_range = 1;</div><div class='del'>-		err = -EOPNOTSUPP;</div><div class='add'>+		if (fc-&gt;no_copy_file_range_64) {</div><div class='add'>+			fc-&gt;no_copy_file_range = 1;</div><div class='add'>+			err = -EOPNOTSUPP;</div><div class='add'>+		} else {</div><div class='add'>+			fc-&gt;no_copy_file_range_64 = 1;</div><div class='add'>+			goto fallback;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='add'>+	bytes_copied = fc-&gt;no_copy_file_range_64 ?</div><div class='add'>+		outarg.size : outarg_64.bytes_copied;</div><div class='add'>+</div><div class='add'>+	if (bytes_copied &gt; len) {</div><div class='add'>+		err = -EIO;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	truncate_inode_pages_range(inode_out-&gt;i_mapping,</div><div class='ctx'> 				   ALIGN_DOWN(pos_out, PAGE_SIZE),</div><div class='del'>-				   ALIGN(pos_out + outarg.size, PAGE_SIZE) - 1);</div><div class='add'>+				   ALIGN(pos_out + bytes_copied, PAGE_SIZE) - 1);</div><div class='ctx'> </div><div class='ctx'> 	file_update_time(file_out);</div><div class='del'>-	fuse_write_update_attr(inode_out, pos_out + outarg.size, outarg.size);</div><div class='add'>+	fuse_write_update_attr(inode_out, pos_out + bytes_copied, bytes_copied);</div><div class='ctx'> </div><div class='del'>-	err = outarg.size;</div><div class='add'>+	err = bytes_copied;</div><div class='ctx'> out:</div><div class='ctx'> 	if (is_unstable)</div><div class='ctx'> 		clear_bit(FUSE_I_SIZE_UNSTABLE, &amp;fi_out-&gt;state);</div><div class='hunk'>@@ -3130,8 +3153,8 @@ static ssize_t fuse_copy_file_range(struct file *src_file, loff_t src_off,</div><div class='ctx'> 				     len, flags);</div><div class='ctx'> </div><div class='ctx'> 	if (ret == -EOPNOTSUPP || ret == -EXDEV)</div><div class='del'>-		ret = generic_copy_file_range(src_file, src_off, dst_file,</div><div class='del'>-					      dst_off, len, flags);</div><div class='add'>+		ret = splice_copy_file_range(src_file, src_off, dst_file,</div><div class='add'>+					     dst_off, len);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3147,8 +3170,8 @@ static const struct file_operations fuse_file_operations = {</div><div class='ctx'> 	.lock		= fuse_file_lock,</div><div class='ctx'> 	.get_unmapped_area = thp_get_unmapped_area,</div><div class='ctx'> 	.flock		= fuse_file_flock,</div><div class='del'>-	.splice_read	= generic_file_splice_read,</div><div class='del'>-	.splice_write	= iter_file_splice_write,</div><div class='add'>+	.splice_read	= fuse_splice_read,</div><div class='add'>+	.splice_write	= fuse_splice_write,</div><div class='ctx'> 	.unlocked_ioctl	= fuse_file_ioctl,</div><div class='ctx'> 	.compat_ioctl	= fuse_file_compat_ioctl,</div><div class='ctx'> 	.poll		= fuse_file_poll,</div><div class='hunk'>@@ -3157,31 +3180,36 @@ static const struct file_operations fuse_file_operations = {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct address_space_operations fuse_file_aops  = {</div><div class='del'>-	.readpage	= fuse_readpage,</div><div class='add'>+	.read_folio	= fuse_read_folio,</div><div class='ctx'> 	.readahead	= fuse_readahead,</div><div class='del'>-	.writepage	= fuse_writepage,</div><div class='ctx'> 	.writepages	= fuse_writepages,</div><div class='del'>-	.launder_page	= fuse_launder_page,</div><div class='del'>-	.set_page_dirty	= __set_page_dirty_nobuffers,</div><div class='add'>+	.launder_folio	= fuse_launder_folio,</div><div class='add'>+	.dirty_folio	= iomap_dirty_folio,</div><div class='add'>+	.release_folio	= iomap_release_folio,</div><div class='add'>+	.invalidate_folio = iomap_invalidate_folio,</div><div class='add'>+	.is_partially_uptodate = iomap_is_partially_uptodate,</div><div class='add'>+	.migrate_folio	= filemap_migrate_folio,</div><div class='ctx'> 	.bmap		= fuse_bmap,</div><div class='ctx'> 	.direct_IO	= fuse_direct_IO,</div><div class='del'>-	.write_begin	= fuse_write_begin,</div><div class='del'>-	.write_end	= fuse_write_end,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-void fuse_init_file_inode(struct inode *inode)</div><div class='add'>+void fuse_init_file_inode(struct inode *inode, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_inode *fi = get_fuse_inode(inode);</div><div class='add'>+	struct fuse_conn *fc = get_fuse_conn(inode);</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_fop = &amp;fuse_file_operations;</div><div class='ctx'> 	inode-&gt;i_data.a_ops = &amp;fuse_file_aops;</div><div class='add'>+	if (fc-&gt;writeback_cache)</div><div class='add'>+		mapping_set_writeback_may_deadlock_on_reclaim(&amp;inode-&gt;i_data);</div><div class='ctx'> </div><div class='ctx'> 	INIT_LIST_HEAD(&amp;fi-&gt;write_files);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;fi-&gt;queued_writes);</div><div class='ctx'> 	fi-&gt;writectr = 0;</div><div class='add'>+	fi-&gt;iocachectr = 0;</div><div class='ctx'> 	init_waitqueue_head(&amp;fi-&gt;page_waitq);</div><div class='del'>-	fi-&gt;writepages = RB_ROOT;</div><div class='add'>+	init_waitqueue_head(&amp;fi-&gt;direct_io_waitq);</div><div class='ctx'> </div><div class='ctx'> 	if (IS_ENABLED(CONFIG_FUSE_DAX))</div><div class='del'>-		fuse_dax_inode_init(inode);</div><div class='add'>+		fuse_dax_inode_init(inode, flags);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/fuse/fuse_dev_i.h b/fs/fuse/fuse_dev_i.h<br/>new file mode 100644<br/>index 000000000000..134bf44aff0d<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fuse/fuse_dev_i.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fuse/fuse_dev_i.h</a></div><div class='hunk'>@@ -0,0 +1,79 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0</div><div class='add'>+ *</div><div class='add'>+ * FUSE: Filesystem in Userspace</div><div class='add'>+ * Copyright (C) 2001-2008  Miklos Szeredi &lt;miklos@szeredi.hu&gt;</div><div class='add'>+ */</div><div class='add'>+#ifndef _FS_FUSE_DEV_I_H</div><div class='add'>+#define _FS_FUSE_DEV_I_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+</div><div class='add'>+/* Ordinary requests have even IDs, while interrupts IDs are odd */</div><div class='add'>+#define FUSE_INT_REQ_BIT (1ULL &lt;&lt; 0)</div><div class='add'>+#define FUSE_REQ_ID_STEP (1ULL &lt;&lt; 1)</div><div class='add'>+</div><div class='add'>+extern struct wait_queue_head fuse_dev_waitq;</div><div class='add'>+</div><div class='add'>+struct fuse_arg;</div><div class='add'>+struct fuse_args;</div><div class='add'>+struct fuse_pqueue;</div><div class='add'>+struct fuse_req;</div><div class='add'>+struct fuse_iqueue;</div><div class='add'>+struct fuse_forget_link;</div><div class='add'>+</div><div class='add'>+struct fuse_copy_state {</div><div class='add'>+	struct fuse_req *req;</div><div class='add'>+	struct iov_iter *iter;</div><div class='add'>+	struct pipe_buffer *pipebufs;</div><div class='add'>+	struct pipe_buffer *currbuf;</div><div class='add'>+	struct pipe_inode_info *pipe;</div><div class='add'>+	unsigned long nr_segs;</div><div class='add'>+	struct page *pg;</div><div class='add'>+	unsigned int len;</div><div class='add'>+	unsigned int offset;</div><div class='add'>+	bool write:1;</div><div class='add'>+	bool move_folios:1;</div><div class='add'>+	bool is_uring:1;</div><div class='add'>+	struct {</div><div class='add'>+		unsigned int copied_sz; /* copied size into the user buffer */</div><div class='add'>+	} ring;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+#define FUSE_DEV_SYNC_INIT ((struct fuse_dev *) 1)</div><div class='add'>+#define FUSE_DEV_PTR_MASK (~1UL)</div><div class='add'>+</div><div class='add'>+static inline struct fuse_dev *__fuse_get_dev(struct file *file)</div><div class='add'>+{</div><div class='add'>+	/*</div><div class='add'>+	 * Lockless access is OK, because file-&gt;private data is set</div><div class='add'>+	 * once during mount and is valid until the file is released.</div><div class='add'>+	 */</div><div class='add'>+	struct fuse_dev *fud = READ_ONCE(file-&gt;private_data);</div><div class='add'>+</div><div class='add'>+	return (typeof(fud)) ((unsigned long) fud &amp; FUSE_DEV_PTR_MASK);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct fuse_dev *fuse_get_dev(struct file *file);</div><div class='add'>+</div><div class='add'>+unsigned int fuse_req_hash(u64 unique);</div><div class='add'>+struct fuse_req *fuse_request_find(struct fuse_pqueue *fpq, u64 unique);</div><div class='add'>+</div><div class='add'>+void fuse_dev_end_requests(struct list_head *head);</div><div class='add'>+</div><div class='add'>+void fuse_copy_init(struct fuse_copy_state *cs, bool write,</div><div class='add'>+			   struct iov_iter *iter);</div><div class='add'>+void fuse_copy_finish(struct fuse_copy_state *cs);</div><div class='add'>+int fuse_copy_args(struct fuse_copy_state *cs, unsigned int numargs,</div><div class='add'>+		   unsigned int argpages, struct fuse_arg *args,</div><div class='add'>+		   int zeroing);</div><div class='add'>+int fuse_copy_out_args(struct fuse_copy_state *cs, struct fuse_args *args,</div><div class='add'>+		       unsigned int nbytes);</div><div class='add'>+void fuse_dev_queue_forget(struct fuse_iqueue *fiq,</div><div class='add'>+			   struct fuse_forget_link *forget);</div><div class='add'>+void fuse_dev_queue_interrupt(struct fuse_iqueue *fiq, struct fuse_req *req);</div><div class='add'>+bool fuse_remove_pending_req(struct fuse_req *req, spinlock_t *lock);</div><div class='add'>+</div><div class='add'>+bool fuse_request_expired(struct fuse_conn *fc, struct list_head *list);</div><div class='add'>+</div><div class='add'>+#endif</div><div class='add'>+</div><div class='head'>diff --git a/fs/fuse/fuse_i.h b/fs/fuse/fuse_i.h<br/>index 198637b41e19..7f16049387d1 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fuse/fuse_i.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/fuse_i.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fuse/fuse_i.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fuse/fuse_i.h</a></div><div class='hunk'>@@ -35,18 +35,45 @@</div><div class='ctx'> /** Default max number of pages that can be used in a single read request */</div><div class='ctx'> #define FUSE_DEFAULT_MAX_PAGES_PER_REQ 32</div><div class='ctx'> </div><div class='del'>-/** Maximum of max_pages received in init_out */</div><div class='del'>-#define FUSE_MAX_MAX_PAGES 256</div><div class='del'>-</div><div class='ctx'> /** Bias for fi-&gt;writectr, meaning new writepages must not be sent */</div><div class='ctx'> #define FUSE_NOWRITE INT_MIN</div><div class='ctx'> </div><div class='del'>-/** It could be as large as PATH_MAX, but would that have any uses? */</div><div class='del'>-#define FUSE_NAME_MAX 1024</div><div class='add'>+/** Maximum length of a filename, not including terminating null */</div><div class='add'>+</div><div class='add'>+/* maximum, small enough for FUSE_MIN_READ_BUFFER*/</div><div class='add'>+#define FUSE_NAME_LOW_MAX 1024</div><div class='add'>+/* maximum, but needs a request buffer &gt; FUSE_MIN_READ_BUFFER */</div><div class='add'>+#define FUSE_NAME_MAX (PATH_MAX - 1)</div><div class='ctx'> </div><div class='ctx'> /** Number of dentries for each connection in the control filesystem */</div><div class='ctx'> #define FUSE_CTL_NUM_DENTRIES 5</div><div class='ctx'> </div><div class='add'>+/* Frequency (in seconds) of request timeout checks, if opted into */</div><div class='add'>+#define FUSE_TIMEOUT_TIMER_FREQ 15</div><div class='add'>+</div><div class='add'>+/** Frequency (in jiffies) of request timeout checks, if opted into */</div><div class='add'>+extern const unsigned long fuse_timeout_timer_freq;</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Dentries invalidation workqueue period, in seconds.  The value of this</div><div class='add'>+ * parameter shall be &gt;= FUSE_DENTRY_INVAL_FREQ_MIN seconds, or 0 (zero), in</div><div class='add'>+ * which case no workqueue will be created.</div><div class='add'>+ */</div><div class='add'>+extern unsigned inval_wq __read_mostly;</div><div class='add'>+</div><div class='add'>+/** Maximum of max_pages received in init_out */</div><div class='add'>+extern unsigned int fuse_max_pages_limit;</div><div class='add'>+/*</div><div class='add'>+ * Default timeout (in seconds) for the server to reply to a request</div><div class='add'>+ * before the connection is aborted, if no timeout was specified on mount.</div><div class='add'>+ */</div><div class='add'>+extern unsigned int fuse_default_req_timeout;</div><div class='add'>+/*</div><div class='add'>+ * Max timeout (in seconds) for the server to reply to a request before</div><div class='add'>+ * the connection is aborted.</div><div class='add'>+ */</div><div class='add'>+extern unsigned int fuse_max_req_timeout;</div><div class='add'>+</div><div class='ctx'> /** List of active connections */</div><div class='ctx'> extern struct list_head fuse_conn_list;</div><div class='ctx'> </div><div class='hunk'>@@ -54,8 +81,8 @@ extern struct list_head fuse_conn_list;</div><div class='ctx'> extern struct mutex fuse_mutex;</div><div class='ctx'> </div><div class='ctx'> /** Module parameters */</div><div class='del'>-extern unsigned max_user_bgreq;</div><div class='del'>-extern unsigned max_user_congthresh;</div><div class='add'>+extern unsigned int max_user_bgreq;</div><div class='add'>+extern unsigned int max_user_congthresh;</div><div class='ctx'> </div><div class='ctx'> /* One forget request */</div><div class='ctx'> struct fuse_forget_link {</div><div class='hunk'>@@ -63,6 +90,29 @@ struct fuse_forget_link {</div><div class='ctx'> 	struct fuse_forget_link *next;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+/* Submount lookup tracking */</div><div class='add'>+struct fuse_submount_lookup {</div><div class='add'>+	/** Refcount */</div><div class='add'>+	refcount_t count;</div><div class='add'>+</div><div class='add'>+	/** Unique ID, which identifies the inode between userspace</div><div class='add'>+	 * and kernel */</div><div class='add'>+	u64 nodeid;</div><div class='add'>+</div><div class='add'>+	/** The request used for sending the FORGET message */</div><div class='add'>+	struct fuse_forget_link *forget;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/** Container for data related to mapping to backing file */</div><div class='add'>+struct fuse_backing {</div><div class='add'>+	struct file *file;</div><div class='add'>+	struct cred *cred;</div><div class='add'>+</div><div class='add'>+	/** refcount */</div><div class='add'>+	refcount_t count;</div><div class='add'>+	struct rcu_head rcu;</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> /** FUSE inode */</div><div class='ctx'> struct fuse_inode {</div><div class='ctx'> 	/** Inode data */</div><div class='hunk'>@@ -88,6 +138,9 @@ struct fuse_inode {</div><div class='ctx'> 	    preserve the original mode */</div><div class='ctx'> 	umode_t orig_i_mode;</div><div class='ctx'> </div><div class='add'>+	/* Cache birthtime */</div><div class='add'>+	struct timespec64 i_btime;</div><div class='add'>+</div><div class='ctx'> 	/** 64 bit inode number */</div><div class='ctx'> 	u64 orig_ino;</div><div class='ctx'> </div><div class='hunk'>@@ -95,7 +148,7 @@ struct fuse_inode {</div><div class='ctx'> 	u64 attr_version;</div><div class='ctx'> </div><div class='ctx'> 	union {</div><div class='del'>-		/* Write related fields (regular file only) */</div><div class='add'>+		/* read/write io cache (regular file only) */</div><div class='ctx'> 		struct {</div><div class='ctx'> 			/* Files usable in writepage.  Protected by fi-&gt;lock */</div><div class='ctx'> 			struct list_head write_files;</div><div class='hunk'>@@ -107,11 +160,14 @@ struct fuse_inode {</div><div class='ctx'> 			 * (FUSE_NOWRITE) means more writes are blocked */</div><div class='ctx'> 			int writectr;</div><div class='ctx'> </div><div class='add'>+			/** Number of files/maps using page cache */</div><div class='add'>+			int iocachectr;</div><div class='add'>+</div><div class='ctx'> 			/* Waitq for writepage completion */</div><div class='ctx'> 			wait_queue_head_t page_waitq;</div><div class='ctx'> </div><div class='del'>-			/* List of writepage requestst (pending or sent) */</div><div class='del'>-			struct rb_root writepages;</div><div class='add'>+			/* waitq for direct-io completion */</div><div class='add'>+			wait_queue_head_t direct_io_waitq;</div><div class='ctx'> 		};</div><div class='ctx'> </div><div class='ctx'> 		/* readdir cache (directory only) */</div><div class='hunk'>@@ -155,6 +211,18 @@ struct fuse_inode {</div><div class='ctx'> 	 */</div><div class='ctx'> 	struct fuse_inode_dax *dax;</div><div class='ctx'> #endif</div><div class='add'>+	/** Submount specific lookup tracking */</div><div class='add'>+	struct fuse_submount_lookup *submount_lookup;</div><div class='add'>+#ifdef CONFIG_FUSE_PASSTHROUGH</div><div class='add'>+	/** Reference to backing file in passthrough mode */</div><div class='add'>+	struct fuse_backing *fb;</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The underlying inode-&gt;i_blkbits value will not be modified,</div><div class='add'>+	 * so preserve the blocksize specified by the server.</div><div class='add'>+	 */</div><div class='add'>+	u8 cached_i_blkbits;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /** FUSE inode state bits */</div><div class='hunk'>@@ -167,19 +235,28 @@ enum {</div><div class='ctx'> 	FUSE_I_SIZE_UNSTABLE,</div><div class='ctx'> 	/* Bad inode */</div><div class='ctx'> 	FUSE_I_BAD,</div><div class='add'>+	/* Has btime */</div><div class='add'>+	FUSE_I_BTIME,</div><div class='add'>+	/* Wants or already has page cache IO */</div><div class='add'>+	FUSE_I_CACHE_IO_MODE,</div><div class='add'>+	/*</div><div class='add'>+	 * Client has exclusive access to the inode, either because fs is local</div><div class='add'>+	 * or the fuse server has an exclusive "lease" on distributed fs</div><div class='add'>+	 */</div><div class='add'>+	FUSE_I_EXCLUSIVE,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct fuse_conn;</div><div class='ctx'> struct fuse_mount;</div><div class='del'>-struct fuse_release_args;</div><div class='add'>+union fuse_file_args;</div><div class='ctx'> </div><div class='ctx'> /** FUSE specific file data */</div><div class='ctx'> struct fuse_file {</div><div class='ctx'> 	/** Fuse connection for this file */</div><div class='ctx'> 	struct fuse_mount *fm;</div><div class='ctx'> </div><div class='del'>-	/* Argument space reserved for release */</div><div class='del'>-	struct fuse_release_args *release_args;</div><div class='add'>+	/* Argument space reserved for open/release */</div><div class='add'>+	union fuse_file_args *args;</div><div class='ctx'> </div><div class='ctx'> 	/** Kernel file handle guaranteed to be unique */</div><div class='ctx'> 	u64 kh;</div><div class='hunk'>@@ -201,12 +278,6 @@ struct fuse_file {</div><div class='ctx'> </div><div class='ctx'> 	/* Readdir related */</div><div class='ctx'> 	struct {</div><div class='del'>-		/*</div><div class='del'>-		 * Protects below fields against (crazy) parallel readdir on</div><div class='del'>-		 * same open file.  Uncontended in the normal case.</div><div class='del'>-		 */</div><div class='del'>-		struct mutex lock;</div><div class='del'>-</div><div class='ctx'> 		/* Dir stream position */</div><div class='ctx'> 		loff_t pos;</div><div class='ctx'> </div><div class='hunk'>@@ -224,6 +295,15 @@ struct fuse_file {</div><div class='ctx'> 	/** Wait queue head for poll */</div><div class='ctx'> 	wait_queue_head_t poll_wait;</div><div class='ctx'> </div><div class='add'>+	/** Does file hold a fi-&gt;iocachectr refcount? */</div><div class='add'>+	enum { IOM_NONE, IOM_CACHED, IOM_UNCACHED } iomode;</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_FUSE_PASSTHROUGH</div><div class='add'>+	/** Reference to backing file in passthrough mode */</div><div class='add'>+	struct file *passthrough;</div><div class='add'>+	const struct cred *cred;</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> 	/** Has flock been performed on this file? */</div><div class='ctx'> 	bool flock:1;</div><div class='ctx'> };</div><div class='hunk'>@@ -240,8 +320,8 @@ struct fuse_arg {</div><div class='ctx'> 	void *value;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/** FUSE page descriptor */</div><div class='del'>-struct fuse_page_desc {</div><div class='add'>+/** FUSE folio descriptor */</div><div class='add'>+struct fuse_folio_desc {</div><div class='ctx'> 	unsigned int length;</div><div class='ctx'> 	unsigned int offset;</div><div class='ctx'> };</div><div class='hunk'>@@ -249,27 +329,47 @@ struct fuse_page_desc {</div><div class='ctx'> struct fuse_args {</div><div class='ctx'> 	uint64_t nodeid;</div><div class='ctx'> 	uint32_t opcode;</div><div class='del'>-	unsigned short in_numargs;</div><div class='del'>-	unsigned short out_numargs;</div><div class='add'>+	uint8_t in_numargs;</div><div class='add'>+	uint8_t out_numargs;</div><div class='add'>+	uint8_t ext_idx;</div><div class='ctx'> 	bool force:1;</div><div class='ctx'> 	bool noreply:1;</div><div class='ctx'> 	bool nocreds:1;</div><div class='ctx'> 	bool in_pages:1;</div><div class='ctx'> 	bool out_pages:1;</div><div class='add'>+	bool user_pages:1;</div><div class='ctx'> 	bool out_argvar:1;</div><div class='ctx'> 	bool page_zeroing:1;</div><div class='ctx'> 	bool page_replace:1;</div><div class='ctx'> 	bool may_block:1;</div><div class='del'>-	struct fuse_in_arg in_args[3];</div><div class='add'>+	bool is_ext:1;</div><div class='add'>+	bool is_pinned:1;</div><div class='add'>+	bool invalidate_vmap:1;</div><div class='add'>+	struct fuse_in_arg in_args[4];</div><div class='ctx'> 	struct fuse_arg out_args[2];</div><div class='ctx'> 	void (*end)(struct fuse_mount *fm, struct fuse_args *args, int error);</div><div class='add'>+	/* Used for kvec iter backed by vmalloc address */</div><div class='add'>+	void *vmap_base;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct fuse_args_pages {</div><div class='ctx'> 	struct fuse_args args;</div><div class='del'>-	struct page **pages;</div><div class='del'>-	struct fuse_page_desc *descs;</div><div class='del'>-	unsigned int num_pages;</div><div class='add'>+	struct folio **folios;</div><div class='add'>+	struct fuse_folio_desc *descs;</div><div class='add'>+	unsigned int num_folios;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct fuse_release_args {</div><div class='add'>+	struct fuse_args args;</div><div class='add'>+	struct fuse_release_in inarg;</div><div class='add'>+	struct inode *inode;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+union fuse_file_args {</div><div class='add'>+	/* Used during open() */</div><div class='add'>+	struct fuse_open_out open_outarg;</div><div class='add'>+	/* Used during release() */</div><div class='add'>+	struct fuse_release_args release_args;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> #define FUSE_ARGS(args) struct fuse_args args = {}</div><div class='hunk'>@@ -313,6 +413,7 @@ struct fuse_io_priv {</div><div class='ctx'>  * FR_FINISHED:		request is finished</div><div class='ctx'>  * FR_PRIVATE:		request is on private list</div><div class='ctx'>  * FR_ASYNC:		request is asynchronous</div><div class='add'>+ * FR_URING:		request is handled through fuse-io-uring</div><div class='ctx'>  */</div><div class='ctx'> enum fuse_req_flag {</div><div class='ctx'> 	FR_ISREPLY,</div><div class='hunk'>@@ -327,6 +428,7 @@ enum fuse_req_flag {</div><div class='ctx'> 	FR_FINISHED,</div><div class='ctx'> 	FR_PRIVATE,</div><div class='ctx'> 	FR_ASYNC,</div><div class='add'>+	FR_URING,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -373,6 +475,13 @@ struct fuse_req {</div><div class='ctx'> </div><div class='ctx'> 	/** fuse_mount this request belongs to */</div><div class='ctx'> 	struct fuse_mount *fm;</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_FUSE_IO_URING</div><div class='add'>+	void *ring_entry;</div><div class='add'>+	void *ring_queue;</div><div class='add'>+#endif</div><div class='add'>+	/** When (in jiffies) the request was created */</div><div class='add'>+	unsigned long create_time;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct fuse_iqueue;</div><div class='hunk'>@@ -387,22 +496,19 @@ struct fuse_iqueue;</div><div class='ctx'>  */</div><div class='ctx'> struct fuse_iqueue_ops {</div><div class='ctx'> 	/**</div><div class='del'>-	 * Signal that a forget has been queued</div><div class='add'>+	 * Send one forget</div><div class='ctx'> 	 */</div><div class='del'>-	void (*wake_forget_and_unlock)(struct fuse_iqueue *fiq)</div><div class='del'>-		__releases(fiq-&gt;lock);</div><div class='add'>+	void (*send_forget)(struct fuse_iqueue *fiq, struct fuse_forget_link *link);</div><div class='ctx'> </div><div class='ctx'> 	/**</div><div class='del'>-	 * Signal that an INTERRUPT request has been queued</div><div class='add'>+	 * Send interrupt for request</div><div class='ctx'> 	 */</div><div class='del'>-	void (*wake_interrupt_and_unlock)(struct fuse_iqueue *fiq)</div><div class='del'>-		__releases(fiq-&gt;lock);</div><div class='add'>+	void (*send_interrupt)(struct fuse_iqueue *fiq, struct fuse_req *req);</div><div class='ctx'> </div><div class='ctx'> 	/**</div><div class='del'>-	 * Signal that a request has been queued</div><div class='add'>+	 * Send one request</div><div class='ctx'> 	 */</div><div class='del'>-	void (*wake_pending_and_unlock)(struct fuse_iqueue *fiq)</div><div class='del'>-		__releases(fiq-&gt;lock);</div><div class='add'>+	void (*send_req)(struct fuse_iqueue *fiq, struct fuse_req *req);</div><div class='ctx'> </div><div class='ctx'> 	/**</div><div class='ctx'> 	 * Clean up when fuse_iqueue is destroyed</div><div class='hunk'>@@ -480,6 +586,18 @@ struct fuse_dev {</div><div class='ctx'> 	struct list_head entry;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+enum fuse_dax_mode {</div><div class='add'>+	FUSE_DAX_INODE_DEFAULT,	/* default */</div><div class='add'>+	FUSE_DAX_ALWAYS,	/* "-o dax=always" */</div><div class='add'>+	FUSE_DAX_NEVER,		/* "-o dax=never" */</div><div class='add'>+	FUSE_DAX_INODE_USER,	/* "-o dax=inode" */</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static inline bool fuse_is_inode_dax_mode(enum fuse_dax_mode mode)</div><div class='add'>+{</div><div class='add'>+	return mode == FUSE_DAX_INODE_DEFAULT || mode == FUSE_DAX_INODE_USER;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> struct fuse_fs_context {</div><div class='ctx'> 	int fd;</div><div class='ctx'> 	struct file *file;</div><div class='hunk'>@@ -497,7 +615,7 @@ struct fuse_fs_context {</div><div class='ctx'> 	bool no_control:1;</div><div class='ctx'> 	bool no_force_umount:1;</div><div class='ctx'> 	bool legacy_opts_show:1;</div><div class='del'>-	bool dax:1;</div><div class='add'>+	enum fuse_dax_mode dax_mode;</div><div class='ctx'> 	unsigned int max_read;</div><div class='ctx'> 	unsigned int blksize;</div><div class='ctx'> 	const char *subtype;</div><div class='hunk'>@@ -533,6 +651,11 @@ struct fuse_conn {</div><div class='ctx'> 	/** Number of fuse_dev's */</div><div class='ctx'> 	atomic_t dev_count;</div><div class='ctx'> </div><div class='add'>+	/** Current epoch for up-to-date dentries */</div><div class='add'>+	atomic_t epoch;</div><div class='add'>+</div><div class='add'>+	struct work_struct epoch_work;</div><div class='add'>+</div><div class='ctx'> 	struct rcu_head rcu;</div><div class='ctx'> </div><div class='ctx'> 	/** The user id for this mount */</div><div class='hunk'>@@ -614,7 +737,7 @@ struct fuse_conn {</div><div class='ctx'> 	/** Connection successful.  Only set in INIT */</div><div class='ctx'> 	unsigned conn_init:1;</div><div class='ctx'> </div><div class='del'>-	/** Do readpages asynchronously?  Only set in INIT */</div><div class='add'>+	/** Do readahead asynchronously?  Only set in INIT */</div><div class='ctx'> 	unsigned async_read:1;</div><div class='ctx'> </div><div class='ctx'> 	/** Return an unique read error after abort.  Only set in INIT */</div><div class='hunk'>@@ -747,6 +870,9 @@ struct fuse_conn {</div><div class='ctx'> 	/** Does the filesystem support copy_file_range? */</div><div class='ctx'> 	unsigned no_copy_file_range:1;</div><div class='ctx'> </div><div class='add'>+	/** Does the filesystem support copy_file_range_64? */</div><div class='add'>+	unsigned no_copy_file_range_64:1;</div><div class='add'>+</div><div class='ctx'> 	/* Send DESTROY request */</div><div class='ctx'> 	unsigned int destroy:1;</div><div class='ctx'> </div><div class='hunk'>@@ -765,30 +891,66 @@ struct fuse_conn {</div><div class='ctx'> 	/* Propagate syncfs() to server */</div><div class='ctx'> 	unsigned int sync_fs:1;</div><div class='ctx'> </div><div class='add'>+	/* Initialize security xattrs when creating a new inode */</div><div class='add'>+	unsigned int init_security:1;</div><div class='add'>+</div><div class='add'>+	/* Add supplementary group info when creating a new inode */</div><div class='add'>+	unsigned int create_supp_group:1;</div><div class='add'>+</div><div class='add'>+	/* Does the filesystem support per inode DAX? */</div><div class='add'>+	unsigned int inode_dax:1;</div><div class='add'>+</div><div class='add'>+	/* Is tmpfile not implemented by fs? */</div><div class='add'>+	unsigned int no_tmpfile:1;</div><div class='add'>+</div><div class='add'>+	/* Relax restrictions to allow shared mmap in FOPEN_DIRECT_IO mode */</div><div class='add'>+	unsigned int direct_io_allow_mmap:1;</div><div class='add'>+</div><div class='add'>+	/* Is statx not implemented by fs? */</div><div class='add'>+	unsigned int no_statx:1;</div><div class='add'>+</div><div class='add'>+	/** Passthrough support for read/write IO */</div><div class='add'>+	unsigned int passthrough:1;</div><div class='add'>+</div><div class='add'>+	/* Use pages instead of pointer for kernel I/O */</div><div class='add'>+	unsigned int use_pages_for_kvec_io:1;</div><div class='add'>+</div><div class='add'>+	/* Is link not implemented by fs? */</div><div class='add'>+	unsigned int no_link:1;</div><div class='add'>+</div><div class='add'>+	/* Is synchronous FUSE_INIT allowed? */</div><div class='add'>+	unsigned int sync_init:1;</div><div class='add'>+</div><div class='add'>+	/* Use io_uring for communication */</div><div class='add'>+	unsigned int io_uring;</div><div class='add'>+</div><div class='add'>+	/** Maximum stack depth for passthrough backing files */</div><div class='add'>+	int max_stack_depth;</div><div class='add'>+</div><div class='ctx'> 	/** The number of requests waiting for completion */</div><div class='ctx'> 	atomic_t num_waiting;</div><div class='ctx'> </div><div class='ctx'> 	/** Negotiated minor version */</div><div class='ctx'> 	unsigned minor;</div><div class='ctx'> </div><div class='del'>-	/** Entry on the fuse_mount_list */</div><div class='add'>+	/** Entry on the fuse_conn_list */</div><div class='ctx'> 	struct list_head entry;</div><div class='ctx'> </div><div class='ctx'> 	/** Device ID from the root super block */</div><div class='ctx'> 	dev_t dev;</div><div class='ctx'> </div><div class='del'>-	/** Dentries in the control filesystem */</div><div class='del'>-	struct dentry *ctl_dentry[FUSE_CTL_NUM_DENTRIES];</div><div class='del'>-</div><div class='del'>-	/** number of dentries used in the above array */</div><div class='del'>-	int ctl_ndents;</div><div class='del'>-</div><div class='ctx'> 	/** Key for lock owner ID scrambling */</div><div class='ctx'> 	u32 scramble_key[4];</div><div class='ctx'> </div><div class='ctx'> 	/** Version counter for attribute changes */</div><div class='ctx'> 	atomic64_t attr_version;</div><div class='ctx'> </div><div class='add'>+	/** Version counter for evict inode */</div><div class='add'>+	atomic64_t evict_ctr;</div><div class='add'>+</div><div class='add'>+	/* maximum file name length */</div><div class='add'>+	u32 name_max;</div><div class='add'>+</div><div class='ctx'> 	/** Called on final put */</div><div class='ctx'> 	void (*release)(struct fuse_conn *);</div><div class='ctx'> </div><div class='hunk'>@@ -802,6 +964,9 @@ struct fuse_conn {</div><div class='ctx'> 	struct list_head devices;</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_FUSE_DAX</div><div class='add'>+	/* Dax mode */</div><div class='add'>+	enum fuse_dax_mode dax_mode;</div><div class='add'>+</div><div class='ctx'> 	/* Dax specific conn data, non-NULL if DAX is enabled */</div><div class='ctx'> 	struct fuse_conn_dax *dax;</div><div class='ctx'> #endif</div><div class='hunk'>@@ -811,6 +976,25 @@ struct fuse_conn {</div><div class='ctx'> </div><div class='ctx'> 	/* New writepages go into this bucket */</div><div class='ctx'> 	struct fuse_sync_bucket __rcu *curr_bucket;</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_FUSE_PASSTHROUGH</div><div class='add'>+	/** IDR for backing files ids */</div><div class='add'>+	struct idr backing_files_map;</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_FUSE_IO_URING</div><div class='add'>+	/**  uring connection information*/</div><div class='add'>+	struct fuse_ring *ring;</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+	/** Only used if the connection opts into request timeouts */</div><div class='add'>+	struct {</div><div class='add'>+		/* Worker for checking if any requests have timed out */</div><div class='add'>+		struct delayed_work work;</div><div class='add'>+</div><div class='add'>+		/* Request timeout (in jiffies). 0 = no timeout */</div><div class='add'>+		unsigned int req_timeout;</div><div class='add'>+	} timeout;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -832,8 +1016,22 @@ struct fuse_mount {</div><div class='ctx'> </div><div class='ctx'> 	/* Entry on fc-&gt;mounts */</div><div class='ctx'> 	struct list_head fc_entry;</div><div class='add'>+	struct rcu_head rcu;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Empty header for FUSE opcodes without specific header needs.</div><div class='add'>+ * Used as a placeholder in args-&gt;in_args[0] for consistency</div><div class='add'>+ * across all FUSE operations, simplifying request handling.</div><div class='add'>+ */</div><div class='add'>+struct fuse_zero_header {};</div><div class='add'>+</div><div class='add'>+static inline void fuse_set_zero_arg0(struct fuse_args *args)</div><div class='add'>+{</div><div class='add'>+	args-&gt;in_args[0].size = sizeof(struct fuse_zero_header);</div><div class='add'>+	args-&gt;in_args[0].value = NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline struct fuse_mount *get_fuse_mount_super(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	return sb-&gt;s_fs_info;</div><div class='hunk'>@@ -854,7 +1052,7 @@ static inline struct fuse_conn *get_fuse_conn(struct inode *inode)</div><div class='ctx'> 	return get_fuse_mount_super(inode-&gt;i_sb)-&gt;fc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline struct fuse_inode *get_fuse_inode(struct inode *inode)</div><div class='add'>+static inline struct fuse_inode *get_fuse_inode(const struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	return container_of(inode, struct fuse_inode, inode);</div><div class='ctx'> }</div><div class='hunk'>@@ -874,6 +1072,11 @@ static inline u64 fuse_get_attr_version(struct fuse_conn *fc)</div><div class='ctx'> 	return atomic64_read(&amp;fc-&gt;attr_version);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline u64 fuse_get_evict_ctr(struct fuse_conn *fc)</div><div class='add'>+{</div><div class='add'>+	return atomic64_read(&amp;fc-&gt;evict_ctr);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline bool fuse_stale_inode(const struct inode *inode, int generation,</div><div class='ctx'> 				    struct fuse_attr *attr)</div><div class='ctx'> {</div><div class='hunk'>@@ -883,7 +1086,6 @@ static inline bool fuse_stale_inode(const struct inode *inode, int generation,</div><div class='ctx'> </div><div class='ctx'> static inline void fuse_make_bad(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	remove_inode_hash(inode);</div><div class='ctx'> 	set_bit(FUSE_I_BAD, &amp;get_fuse_inode(inode)-&gt;state);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -892,25 +1094,32 @@ static inline bool fuse_is_bad(struct inode *inode)</div><div class='ctx'> 	return unlikely(test_bit(FUSE_I_BAD, &amp;get_fuse_inode(inode)-&gt;state));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline struct page **fuse_pages_alloc(unsigned int npages, gfp_t flags,</div><div class='del'>-					     struct fuse_page_desc **desc)</div><div class='add'>+static inline bool fuse_inode_is_exclusive(const struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct page **pages;</div><div class='add'>+	const struct fuse_inode *fi = get_fuse_inode(inode);</div><div class='ctx'> </div><div class='del'>-	pages = kzalloc(npages * (sizeof(struct page *) +</div><div class='del'>-				  sizeof(struct fuse_page_desc)), flags);</div><div class='del'>-	*desc = (void *) (pages + npages);</div><div class='add'>+	return test_bit(FUSE_I_EXCLUSIVE, &amp;fi-&gt;state);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	return pages;</div><div class='add'>+static inline struct folio **fuse_folios_alloc(unsigned int nfolios, gfp_t flags,</div><div class='add'>+					       struct fuse_folio_desc **desc)</div><div class='add'>+{</div><div class='add'>+	struct folio **folios;</div><div class='add'>+</div><div class='add'>+	folios = kzalloc(nfolios * (sizeof(struct folio *) +</div><div class='add'>+				    sizeof(struct fuse_folio_desc)), flags);</div><div class='add'>+	*desc = (void *) (folios + nfolios);</div><div class='add'>+</div><div class='add'>+	return folios;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void fuse_page_descs_length_init(struct fuse_page_desc *descs,</div><div class='del'>-					       unsigned int index,</div><div class='del'>-					       unsigned int nr_pages)</div><div class='add'>+static inline void fuse_folio_descs_length_init(struct fuse_folio_desc *descs,</div><div class='add'>+						unsigned int index,</div><div class='add'>+						unsigned int nr_folios)</div><div class='ctx'> {</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	for (i = index; i &lt; index + nr_pages; i++)</div><div class='add'>+	for (i = index; i &lt; index + nr_folios; i++)</div><div class='ctx'> 		descs[i].length = PAGE_SIZE - descs[i].offset;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -927,14 +1136,14 @@ static inline void fuse_sync_bucket_dec(struct fuse_sync_bucket *bucket)</div><div class='ctx'> extern const struct file_operations fuse_dev_operations;</div><div class='ctx'> </div><div class='ctx'> extern const struct dentry_operations fuse_dentry_operations;</div><div class='del'>-extern const struct dentry_operations fuse_root_dentry_operations;</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * Get a filled in inode</div><div class='ctx'>  */</div><div class='ctx'> struct inode *fuse_iget(struct super_block *sb, u64 nodeid,</div><div class='ctx'> 			int generation, struct fuse_attr *attr,</div><div class='del'>-			u64 attr_valid, u64 attr_version);</div><div class='add'>+			u64 attr_valid, u64 attr_version,</div><div class='add'>+			u64 evict_ctr);</div><div class='ctx'> </div><div class='ctx'> int fuse_lookup_name(struct super_block *sb, u64 nodeid, const struct qstr *name,</div><div class='ctx'> 		     struct fuse_entry_out *outarg, struct inode **inode);</div><div class='hunk'>@@ -947,10 +1156,6 @@ void fuse_queue_forget(struct fuse_conn *fc, struct fuse_forget_link *forget,</div><div class='ctx'> </div><div class='ctx'> struct fuse_forget_link *fuse_alloc_forget(void);</div><div class='ctx'> </div><div class='del'>-struct fuse_forget_link *fuse_dequeue_forget(struct fuse_iqueue *fiq,</div><div class='del'>-					     unsigned int max,</div><div class='del'>-					     unsigned int *countp);</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Initialize READ or READDIR request</div><div class='ctx'>  */</div><div class='hunk'>@@ -963,7 +1168,7 @@ struct fuse_io_args {</div><div class='ctx'> 		struct {</div><div class='ctx'> 			struct fuse_write_in in;</div><div class='ctx'> 			struct fuse_write_out out;</div><div class='del'>-			bool page_locked;</div><div class='add'>+			bool folio_locked;</div><div class='ctx'> 		} write;</div><div class='ctx'> 	};</div><div class='ctx'> 	struct fuse_args_pages ap;</div><div class='hunk'>@@ -975,14 +1180,9 @@ void fuse_read_args_fill(struct fuse_io_args *ia, struct file *file, loff_t pos,</div><div class='ctx'> 			 size_t count, int opcode);</div><div class='ctx'> </div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * Send OPEN or OPENDIR request</div><div class='del'>- */</div><div class='del'>-int fuse_open_common(struct inode *inode, struct file *file, bool isdir);</div><div class='del'>-</div><div class='del'>-struct fuse_file *fuse_file_alloc(struct fuse_mount *fm);</div><div class='add'>+struct fuse_file *fuse_file_alloc(struct fuse_mount *fm, bool release);</div><div class='ctx'> void fuse_file_free(struct fuse_file *ff);</div><div class='del'>-void fuse_finish_open(struct inode *inode, struct file *file);</div><div class='add'>+int fuse_finish_open(struct inode *inode, struct file *file);</div><div class='ctx'> </div><div class='ctx'> void fuse_sync_release(struct fuse_inode *fi, struct fuse_file *ff,</div><div class='ctx'> 		       unsigned int flags);</div><div class='hunk'>@@ -1007,7 +1207,7 @@ int fuse_notify_poll_wakeup(struct fuse_conn *fc,</div><div class='ctx'> /**</div><div class='ctx'>  * Initialize file operations on a regular file</div><div class='ctx'>  */</div><div class='del'>-void fuse_init_file_inode(struct inode *inode);</div><div class='add'>+void fuse_init_file_inode(struct inode *inode, unsigned int flags);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * Initialize inode operations on regular files and special files</div><div class='hunk'>@@ -1028,10 +1228,13 @@ void fuse_init_symlink(struct inode *inode);</div><div class='ctx'>  * Change attributes of an inode</div><div class='ctx'>  */</div><div class='ctx'> void fuse_change_attributes(struct inode *inode, struct fuse_attr *attr,</div><div class='add'>+			    struct fuse_statx *sx,</div><div class='ctx'> 			    u64 attr_valid, u64 attr_version);</div><div class='ctx'> </div><div class='ctx'> void fuse_change_attributes_common(struct inode *inode, struct fuse_attr *attr,</div><div class='del'>-				   u64 attr_valid, u32 cache_mask);</div><div class='add'>+				   struct fuse_statx *sx,</div><div class='add'>+				   u64 attr_valid, u32 cache_mask,</div><div class='add'>+				   u64 evict_ctr);</div><div class='ctx'> </div><div class='ctx'> u32 fuse_get_cache_mask(struct inode *inode);</div><div class='ctx'> </div><div class='hunk'>@@ -1051,11 +1254,31 @@ void __exit fuse_ctl_cleanup(void);</div><div class='ctx'> /**</div><div class='ctx'>  * Simple request sending that does request allocation and freeing</div><div class='ctx'>  */</div><div class='del'>-ssize_t fuse_simple_request(struct fuse_mount *fm, struct fuse_args *args);</div><div class='add'>+ssize_t __fuse_simple_request(struct mnt_idmap *idmap,</div><div class='add'>+			      struct fuse_mount *fm,</div><div class='add'>+			      struct fuse_args *args);</div><div class='add'>+</div><div class='add'>+static inline ssize_t fuse_simple_request(struct fuse_mount *fm, struct fuse_args *args)</div><div class='add'>+{</div><div class='add'>+	return __fuse_simple_request(&amp;invalid_mnt_idmap, fm, args);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline ssize_t fuse_simple_idmap_request(struct mnt_idmap *idmap,</div><div class='add'>+						struct fuse_mount *fm,</div><div class='add'>+						struct fuse_args *args)</div><div class='add'>+{</div><div class='add'>+	return __fuse_simple_request(idmap, fm, args);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> int fuse_simple_background(struct fuse_mount *fm, struct fuse_args *args,</div><div class='ctx'> 			   gfp_t gfp_flags);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='add'>+ * Assign a unique id to a fuse request</div><div class='add'>+ */</div><div class='add'>+void fuse_request_assign_unique(struct fuse_iqueue *fiq, struct fuse_req *req);</div><div class='add'>+</div><div class='add'>+/**</div><div class='ctx'>  * End a finished request</div><div class='ctx'>  */</div><div class='ctx'> void fuse_request_end(struct fuse_req *req);</div><div class='hunk'>@@ -1064,6 +1287,14 @@ void fuse_request_end(struct fuse_req *req);</div><div class='ctx'> void fuse_abort_conn(struct fuse_conn *fc);</div><div class='ctx'> void fuse_wait_aborted(struct fuse_conn *fc);</div><div class='ctx'> </div><div class='add'>+/* Check if any requests timed out */</div><div class='add'>+void fuse_check_timeout(struct work_struct *work);</div><div class='add'>+</div><div class='add'>+void fuse_dentry_tree_init(void);</div><div class='add'>+void fuse_dentry_tree_cleanup(void);</div><div class='add'>+</div><div class='add'>+void fuse_epoch_work(struct work_struct *work);</div><div class='add'>+</div><div class='ctx'> /**</div><div class='ctx'>  * Invalidate inode attributes</div><div class='ctx'>  */</div><div class='hunk'>@@ -1081,7 +1312,10 @@ void fuse_invalidate_entry_cache(struct dentry *entry);</div><div class='ctx'> </div><div class='ctx'> void fuse_invalidate_atime(struct inode *inode);</div><div class='ctx'> </div><div class='del'>-u64 entry_attr_timeout(struct fuse_entry_out *o);</div><div class='add'>+u64 fuse_time_to_jiffies(u64 sec, u32 nsec);</div><div class='add'>+#define ATTR_TIMEOUT(o) \</div><div class='add'>+	fuse_time_to_jiffies((o)-&gt;attr_valid, (o)-&gt;attr_valid_nsec)</div><div class='add'>+</div><div class='ctx'> void fuse_change_entry_timeout(struct dentry *entry, struct fuse_entry_out *o);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -1090,6 +1324,11 @@ void fuse_change_entry_timeout(struct dentry *entry, struct fuse_entry_out *o);</div><div class='ctx'> struct fuse_conn *fuse_conn_get(struct fuse_conn *fc);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='add'>+ * Initialize the fuse processing queue</div><div class='add'>+ */</div><div class='add'>+void fuse_pqueue_init(struct fuse_pqueue *fpq);</div><div class='add'>+</div><div class='add'>+/**</div><div class='ctx'>  * Initialize fuse_conn</div><div class='ctx'>  */</div><div class='ctx'> void fuse_conn_init(struct fuse_conn *fc, struct fuse_mount *fm,</div><div class='hunk'>@@ -1105,7 +1344,7 @@ struct fuse_dev *fuse_dev_alloc_install(struct fuse_conn *fc);</div><div class='ctx'> struct fuse_dev *fuse_dev_alloc(void);</div><div class='ctx'> void fuse_dev_install(struct fuse_dev *fud, struct fuse_conn *fc);</div><div class='ctx'> void fuse_dev_free(struct fuse_dev *fud);</div><div class='del'>-void fuse_send_init(struct fuse_mount *fm);</div><div class='add'>+int fuse_send_init(struct fuse_mount *fm);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * Fill in superblock and initialize fuse connection</div><div class='hunk'>@@ -1154,7 +1393,7 @@ bool fuse_invalid_attr(struct fuse_attr *attr);</div><div class='ctx'> /**</div><div class='ctx'>  * Is current process allowed to perform filesystem operation?</div><div class='ctx'>  */</div><div class='del'>-int fuse_allow_current_process(struct fuse_conn *fc);</div><div class='add'>+bool fuse_allow_current_process(struct fuse_conn *fc);</div><div class='ctx'> </div><div class='ctx'> u64 fuse_lock_owner_id(struct fuse_conn *fc, fl_owner_t id);</div><div class='ctx'> </div><div class='hunk'>@@ -1195,7 +1434,13 @@ int fuse_reverse_inval_inode(struct fuse_conn *fc, u64 nodeid,</div><div class='ctx'>  * then the dentry is unhashed (d_delete()).</div><div class='ctx'>  */</div><div class='ctx'> int fuse_reverse_inval_entry(struct fuse_conn *fc, u64 parent_nodeid,</div><div class='del'>-			     u64 child_nodeid, struct qstr *name);</div><div class='add'>+			     u64 child_nodeid, struct qstr *name, u32 flags);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Try to prune this inode.  If neither the inode itself nor dentries associated</div><div class='add'>+ * with this inode have any external reference, then the inode can be freed.</div><div class='add'>+ */</div><div class='add'>+void fuse_try_prune_one_inode(struct fuse_conn *fc, u64 nodeid);</div><div class='ctx'> </div><div class='ctx'> int fuse_do_open(struct fuse_mount *fm, u64 nodeid, struct file *file,</div><div class='ctx'> 		 bool isdir);</div><div class='hunk'>@@ -1224,8 +1469,8 @@ bool fuse_write_update_attr(struct inode *inode, loff_t pos, ssize_t written);</div><div class='ctx'> int fuse_flush_times(struct inode *inode, struct fuse_file *ff);</div><div class='ctx'> int fuse_write_inode(struct inode *inode, struct writeback_control *wbc);</div><div class='ctx'> </div><div class='del'>-int fuse_do_setattr(struct dentry *dentry, struct iattr *attr,</div><div class='del'>-		    struct file *file);</div><div class='add'>+int fuse_do_setattr(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='add'>+		    struct iattr *attr, struct file *file);</div><div class='ctx'> </div><div class='ctx'> void fuse_set_initialized(struct fuse_conn *fc);</div><div class='ctx'> </div><div class='hunk'>@@ -1238,13 +1483,13 @@ ssize_t fuse_getxattr(struct inode *inode, const char *name, void *value,</div><div class='ctx'> 		      size_t size);</div><div class='ctx'> ssize_t fuse_listxattr(struct dentry *entry, char *list, size_t size);</div><div class='ctx'> int fuse_removexattr(struct inode *inode, const char *name);</div><div class='del'>-extern const struct xattr_handler *fuse_xattr_handlers[];</div><div class='del'>-extern const struct xattr_handler *fuse_acl_xattr_handlers[];</div><div class='del'>-extern const struct xattr_handler *fuse_no_acl_xattr_handlers[];</div><div class='add'>+extern const struct xattr_handler * const fuse_xattr_handlers[];</div><div class='ctx'> </div><div class='ctx'> struct posix_acl;</div><div class='del'>-struct posix_acl *fuse_get_acl(struct inode *inode, int type, bool rcu);</div><div class='del'>-int fuse_set_acl(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='add'>+struct posix_acl *fuse_get_inode_acl(struct inode *inode, int type, bool rcu);</div><div class='add'>+struct posix_acl *fuse_get_acl(struct mnt_idmap *idmap,</div><div class='add'>+			       struct dentry *dentry, int type);</div><div class='add'>+int fuse_set_acl(struct mnt_idmap *, struct dentry *dentry,</div><div class='ctx'> 		 struct posix_acl *acl, int type);</div><div class='ctx'> </div><div class='ctx'> /* readdir.c */</div><div class='hunk'>@@ -1269,11 +1514,13 @@ ssize_t fuse_dax_read_iter(struct kiocb *iocb, struct iov_iter *to);</div><div class='ctx'> ssize_t fuse_dax_write_iter(struct kiocb *iocb, struct iov_iter *from);</div><div class='ctx'> int fuse_dax_mmap(struct file *file, struct vm_area_struct *vma);</div><div class='ctx'> int fuse_dax_break_layouts(struct inode *inode, u64 dmap_start, u64 dmap_end);</div><div class='del'>-int fuse_dax_conn_alloc(struct fuse_conn *fc, struct dax_device *dax_dev);</div><div class='add'>+int fuse_dax_conn_alloc(struct fuse_conn *fc, enum fuse_dax_mode mode,</div><div class='add'>+			struct dax_device *dax_dev);</div><div class='ctx'> void fuse_dax_conn_free(struct fuse_conn *fc);</div><div class='ctx'> bool fuse_dax_inode_alloc(struct super_block *sb, struct fuse_inode *fi);</div><div class='del'>-void fuse_dax_inode_init(struct inode *inode);</div><div class='add'>+void fuse_dax_inode_init(struct inode *inode, unsigned int flags);</div><div class='ctx'> void fuse_dax_inode_cleanup(struct inode *inode);</div><div class='add'>+void fuse_dax_dontcache(struct inode *inode, unsigned int flags);</div><div class='ctx'> bool fuse_dax_check_alignment(struct fuse_conn *fc, unsigned int map_alignment);</div><div class='ctx'> void fuse_dax_cancel_work(struct fuse_conn *fc);</div><div class='ctx'> </div><div class='hunk'>@@ -1281,15 +1528,100 @@ void fuse_dax_cancel_work(struct fuse_conn *fc);</div><div class='ctx'> long fuse_file_ioctl(struct file *file, unsigned int cmd, unsigned long arg);</div><div class='ctx'> long fuse_file_compat_ioctl(struct file *file, unsigned int cmd,</div><div class='ctx'> 			    unsigned long arg);</div><div class='del'>-int fuse_fileattr_get(struct dentry *dentry, struct fileattr *fa);</div><div class='del'>-int fuse_fileattr_set(struct user_namespace *mnt_userns,</div><div class='del'>-		      struct dentry *dentry, struct fileattr *fa);</div><div class='add'>+int fuse_fileattr_get(struct dentry *dentry, struct file_kattr *fa);</div><div class='add'>+int fuse_fileattr_set(struct mnt_idmap *idmap,</div><div class='add'>+		      struct dentry *dentry, struct file_kattr *fa);</div><div class='ctx'> </div><div class='del'>-/* file.c */</div><div class='add'>+/* iomode.c */</div><div class='add'>+int fuse_file_cached_io_open(struct inode *inode, struct fuse_file *ff);</div><div class='add'>+int fuse_inode_uncached_io_start(struct fuse_inode *fi,</div><div class='add'>+				 struct fuse_backing *fb);</div><div class='add'>+void fuse_inode_uncached_io_end(struct fuse_inode *fi);</div><div class='ctx'> </div><div class='add'>+int fuse_file_io_open(struct file *file, struct inode *inode);</div><div class='add'>+void fuse_file_io_release(struct fuse_file *ff, struct inode *inode);</div><div class='add'>+</div><div class='add'>+/* file.c */</div><div class='ctx'> struct fuse_file *fuse_file_open(struct fuse_mount *fm, u64 nodeid,</div><div class='ctx'> 				 unsigned int open_flags, bool isdir);</div><div class='ctx'> void fuse_file_release(struct inode *inode, struct fuse_file *ff,</div><div class='ctx'> 		       unsigned int open_flags, fl_owner_t id, bool isdir);</div><div class='ctx'> </div><div class='add'>+/* backing.c */</div><div class='add'>+#ifdef CONFIG_FUSE_PASSTHROUGH</div><div class='add'>+struct fuse_backing *fuse_backing_get(struct fuse_backing *fb);</div><div class='add'>+void fuse_backing_put(struct fuse_backing *fb);</div><div class='add'>+struct fuse_backing *fuse_backing_lookup(struct fuse_conn *fc, int backing_id);</div><div class='add'>+#else</div><div class='add'>+</div><div class='add'>+static inline struct fuse_backing *fuse_backing_get(struct fuse_backing *fb)</div><div class='add'>+{</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void fuse_backing_put(struct fuse_backing *fb)</div><div class='add'>+{</div><div class='add'>+}</div><div class='add'>+static inline struct fuse_backing *fuse_backing_lookup(struct fuse_conn *fc,</div><div class='add'>+						       int backing_id)</div><div class='add'>+{</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+void fuse_backing_files_init(struct fuse_conn *fc);</div><div class='add'>+void fuse_backing_files_free(struct fuse_conn *fc);</div><div class='add'>+int fuse_backing_open(struct fuse_conn *fc, struct fuse_backing_map *map);</div><div class='add'>+int fuse_backing_close(struct fuse_conn *fc, int backing_id);</div><div class='add'>+</div><div class='add'>+/* passthrough.c */</div><div class='add'>+static inline struct fuse_backing *fuse_inode_backing(struct fuse_inode *fi)</div><div class='add'>+{</div><div class='add'>+#ifdef CONFIG_FUSE_PASSTHROUGH</div><div class='add'>+	return READ_ONCE(fi-&gt;fb);</div><div class='add'>+#else</div><div class='add'>+	return NULL;</div><div class='add'>+#endif</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline struct fuse_backing *fuse_inode_backing_set(struct fuse_inode *fi,</div><div class='add'>+							  struct fuse_backing *fb)</div><div class='add'>+{</div><div class='add'>+#ifdef CONFIG_FUSE_PASSTHROUGH</div><div class='add'>+	return xchg(&amp;fi-&gt;fb, fb);</div><div class='add'>+#else</div><div class='add'>+	return NULL;</div><div class='add'>+#endif</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct fuse_backing *fuse_passthrough_open(struct file *file, int backing_id);</div><div class='add'>+void fuse_passthrough_release(struct fuse_file *ff, struct fuse_backing *fb);</div><div class='add'>+</div><div class='add'>+static inline struct file *fuse_file_passthrough(struct fuse_file *ff)</div><div class='add'>+{</div><div class='add'>+#ifdef CONFIG_FUSE_PASSTHROUGH</div><div class='add'>+	return ff-&gt;passthrough;</div><div class='add'>+#else</div><div class='add'>+	return NULL;</div><div class='add'>+#endif</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+ssize_t fuse_passthrough_read_iter(struct kiocb *iocb, struct iov_iter *iter);</div><div class='add'>+ssize_t fuse_passthrough_write_iter(struct kiocb *iocb, struct iov_iter *iter);</div><div class='add'>+ssize_t fuse_passthrough_splice_read(struct file *in, loff_t *ppos,</div><div class='add'>+				     struct pipe_inode_info *pipe,</div><div class='add'>+				     size_t len, unsigned int flags);</div><div class='add'>+ssize_t fuse_passthrough_splice_write(struct pipe_inode_info *pipe,</div><div class='add'>+				      struct file *out, loff_t *ppos,</div><div class='add'>+				      size_t len, unsigned int flags);</div><div class='add'>+ssize_t fuse_passthrough_mmap(struct file *file, struct vm_area_struct *vma);</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_SYSCTL</div><div class='add'>+extern int fuse_sysctl_register(void);</div><div class='add'>+extern void fuse_sysctl_unregister(void);</div><div class='add'>+#else</div><div class='add'>+#define fuse_sysctl_register()		(0)</div><div class='add'>+#define fuse_sysctl_unregister()	do { } while (0)</div><div class='add'>+#endif /* CONFIG_SYSCTL */</div><div class='add'>+</div><div class='ctx'> #endif /* _FS_FUSE_I_H */</div><div class='head'>diff --git a/fs/fuse/fuse_trace.h b/fs/fuse/fuse_trace.h<br/>new file mode 100644<br/>index 000000000000..bbe9ddd8c716<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fuse/fuse_trace.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fuse/fuse_trace.h</a></div><div class='hunk'>@@ -0,0 +1,132 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+#undef TRACE_SYSTEM</div><div class='add'>+#define TRACE_SYSTEM fuse</div><div class='add'>+</div><div class='add'>+#if !defined(_TRACE_FUSE_H) || defined(TRACE_HEADER_MULTI_READ)</div><div class='add'>+#define _TRACE_FUSE_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/tracepoint.h&gt;</div><div class='add'>+</div><div class='add'>+#define OPCODES							\</div><div class='add'>+	EM( FUSE_LOOKUP,		"FUSE_LOOKUP")		\</div><div class='add'>+	EM( FUSE_FORGET,		"FUSE_FORGET")		\</div><div class='add'>+	EM( FUSE_GETATTR,		"FUSE_GETATTR")		\</div><div class='add'>+	EM( FUSE_SETATTR,		"FUSE_SETATTR")		\</div><div class='add'>+	EM( FUSE_READLINK,		"FUSE_READLINK")	\</div><div class='add'>+	EM( FUSE_SYMLINK,		"FUSE_SYMLINK")		\</div><div class='add'>+	EM( FUSE_MKNOD,			"FUSE_MKNOD")		\</div><div class='add'>+	EM( FUSE_MKDIR,			"FUSE_MKDIR")		\</div><div class='add'>+	EM( FUSE_UNLINK,		"FUSE_UNLINK")		\</div><div class='add'>+	EM( FUSE_RMDIR,			"FUSE_RMDIR")		\</div><div class='add'>+	EM( FUSE_RENAME,		"FUSE_RENAME")		\</div><div class='add'>+	EM( FUSE_LINK,			"FUSE_LINK")		\</div><div class='add'>+	EM( FUSE_OPEN,			"FUSE_OPEN")		\</div><div class='add'>+	EM( FUSE_READ,			"FUSE_READ")		\</div><div class='add'>+	EM( FUSE_WRITE,			"FUSE_WRITE")		\</div><div class='add'>+	EM( FUSE_STATFS,		"FUSE_STATFS")		\</div><div class='add'>+	EM( FUSE_RELEASE,		"FUSE_RELEASE")		\</div><div class='add'>+	EM( FUSE_FSYNC,			"FUSE_FSYNC")		\</div><div class='add'>+	EM( FUSE_SETXATTR,		"FUSE_SETXATTR")	\</div><div class='add'>+	EM( FUSE_GETXATTR,		"FUSE_GETXATTR")	\</div><div class='add'>+	EM( FUSE_LISTXATTR,		"FUSE_LISTXATTR")	\</div><div class='add'>+	EM( FUSE_REMOVEXATTR,		"FUSE_REMOVEXATTR")	\</div><div class='add'>+	EM( FUSE_FLUSH,			"FUSE_FLUSH")		\</div><div class='add'>+	EM( FUSE_INIT,			"FUSE_INIT")		\</div><div class='add'>+	EM( FUSE_OPENDIR,		"FUSE_OPENDIR")		\</div><div class='add'>+	EM( FUSE_READDIR,		"FUSE_READDIR")		\</div><div class='add'>+	EM( FUSE_RELEASEDIR,		"FUSE_RELEASEDIR")	\</div><div class='add'>+	EM( FUSE_FSYNCDIR,		"FUSE_FSYNCDIR")	\</div><div class='add'>+	EM( FUSE_GETLK,			"FUSE_GETLK")		\</div><div class='add'>+	EM( FUSE_SETLK,			"FUSE_SETLK")		\</div><div class='add'>+	EM( FUSE_SETLKW,		"FUSE_SETLKW")		\</div><div class='add'>+	EM( FUSE_ACCESS,		"FUSE_ACCESS")		\</div><div class='add'>+	EM( FUSE_CREATE,		"FUSE_CREATE")		\</div><div class='add'>+	EM( FUSE_INTERRUPT,		"FUSE_INTERRUPT")	\</div><div class='add'>+	EM( FUSE_BMAP,			"FUSE_BMAP")		\</div><div class='add'>+	EM( FUSE_DESTROY,		"FUSE_DESTROY")		\</div><div class='add'>+	EM( FUSE_IOCTL,			"FUSE_IOCTL")		\</div><div class='add'>+	EM( FUSE_POLL,			"FUSE_POLL")		\</div><div class='add'>+	EM( FUSE_NOTIFY_REPLY,		"FUSE_NOTIFY_REPLY")	\</div><div class='add'>+	EM( FUSE_BATCH_FORGET,		"FUSE_BATCH_FORGET")	\</div><div class='add'>+	EM( FUSE_FALLOCATE,		"FUSE_FALLOCATE")	\</div><div class='add'>+	EM( FUSE_READDIRPLUS,		"FUSE_READDIRPLUS")	\</div><div class='add'>+	EM( FUSE_RENAME2,		"FUSE_RENAME2")		\</div><div class='add'>+	EM( FUSE_LSEEK,			"FUSE_LSEEK")		\</div><div class='add'>+	EM( FUSE_COPY_FILE_RANGE,	"FUSE_COPY_FILE_RANGE")	\</div><div class='add'>+	EM( FUSE_SETUPMAPPING,		"FUSE_SETUPMAPPING")	\</div><div class='add'>+	EM( FUSE_REMOVEMAPPING,		"FUSE_REMOVEMAPPING")	\</div><div class='add'>+	EM( FUSE_SYNCFS,		"FUSE_SYNCFS")		\</div><div class='add'>+	EM( FUSE_TMPFILE,		"FUSE_TMPFILE")		\</div><div class='add'>+	EM( FUSE_STATX,			"FUSE_STATX")		\</div><div class='add'>+	EMe(CUSE_INIT,			"CUSE_INIT")</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * This will turn the above table into TRACE_DEFINE_ENUM() for each of the</div><div class='add'>+ * entries.</div><div class='add'>+ */</div><div class='add'>+#undef EM</div><div class='add'>+#undef EMe</div><div class='add'>+#define EM(a, b)	TRACE_DEFINE_ENUM(a);</div><div class='add'>+#define EMe(a, b)	TRACE_DEFINE_ENUM(a);</div><div class='add'>+</div><div class='add'>+OPCODES</div><div class='add'>+</div><div class='add'>+/* Now we redfine it with the table that __print_symbolic needs. */</div><div class='add'>+#undef EM</div><div class='add'>+#undef EMe</div><div class='add'>+#define EM(a, b)	{a, b},</div><div class='add'>+#define EMe(a, b)	{a, b}</div><div class='add'>+</div><div class='add'>+TRACE_EVENT(fuse_request_send,</div><div class='add'>+	TP_PROTO(const struct fuse_req *req),</div><div class='add'>+</div><div class='add'>+	TP_ARGS(req),</div><div class='add'>+</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(dev_t,			connection)</div><div class='add'>+		__field(uint64_t,		unique)</div><div class='add'>+		__field(enum fuse_opcode,	opcode)</div><div class='add'>+		__field(uint32_t,		len)</div><div class='add'>+	),</div><div class='add'>+</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;connection	=	req-&gt;fm-&gt;fc-&gt;dev;</div><div class='add'>+		__entry-&gt;unique		=	req-&gt;in.h.unique;</div><div class='add'>+		__entry-&gt;opcode		=	req-&gt;in.h.opcode;</div><div class='add'>+		__entry-&gt;len		=	req-&gt;in.h.len;</div><div class='add'>+	),</div><div class='add'>+</div><div class='add'>+	TP_printk("connection %u req %llu opcode %u (%s) len %u ",</div><div class='add'>+		  __entry-&gt;connection, __entry-&gt;unique, __entry-&gt;opcode,</div><div class='add'>+		  __print_symbolic(__entry-&gt;opcode, OPCODES), __entry-&gt;len)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+TRACE_EVENT(fuse_request_end,</div><div class='add'>+	TP_PROTO(const struct fuse_req *req),</div><div class='add'>+</div><div class='add'>+	TP_ARGS(req),</div><div class='add'>+</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(dev_t,		connection)</div><div class='add'>+		__field(uint64_t,	unique)</div><div class='add'>+		__field(uint32_t,	len)</div><div class='add'>+		__field(int32_t,	error)</div><div class='add'>+	),</div><div class='add'>+</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;connection	=	req-&gt;fm-&gt;fc-&gt;dev;</div><div class='add'>+		__entry-&gt;unique		=	req-&gt;in.h.unique;</div><div class='add'>+		__entry-&gt;len		=	req-&gt;out.h.len;</div><div class='add'>+		__entry-&gt;error		=	req-&gt;out.h.error;</div><div class='add'>+	),</div><div class='add'>+</div><div class='add'>+	TP_printk("connection %u req %llu len %u error %d", __entry-&gt;connection,</div><div class='add'>+		  __entry-&gt;unique, __entry-&gt;len, __entry-&gt;error)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+#endif /* _TRACE_FUSE_H */</div><div class='add'>+</div><div class='add'>+#undef TRACE_INCLUDE_PATH</div><div class='add'>+#define TRACE_INCLUDE_PATH .</div><div class='add'>+#define TRACE_INCLUDE_FILE fuse_trace</div><div class='add'>+#include &lt;trace/define_trace.h&gt;</div><div class='head'>diff --git a/fs/fuse/inode.c b/fs/fuse/inode.c<br/>index 8b89e3ba7df3..819e50d66622 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fuse/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fuse/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fuse/inode.c</a></div><div class='hunk'>@@ -7,7 +7,10 @@</div><div class='ctx'> */</div><div class='ctx'> </div><div class='ctx'> #include "fuse_i.h"</div><div class='add'>+#include "fuse_dev_i.h"</div><div class='add'>+#include "dev_uring_i.h"</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/dax.h&gt;</div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/file.h&gt;</div><div class='hunk'>@@ -23,6 +26,7 @@</div><div class='ctx'> #include &lt;linux/exportfs.h&gt;</div><div class='ctx'> #include &lt;linux/posix_acl.h&gt;</div><div class='ctx'> #include &lt;linux/pid_namespace.h&gt;</div><div class='add'>+#include &lt;uapi/linux/magic.h&gt;</div><div class='ctx'> </div><div class='ctx'> MODULE_AUTHOR("Miklos Szeredi &lt;miklos@szeredi.hu&gt;");</div><div class='ctx'> MODULE_DESCRIPTION("Filesystem in Userspace");</div><div class='hunk'>@@ -31,10 +35,16 @@ MODULE_LICENSE("GPL");</div><div class='ctx'> static struct kmem_cache *fuse_inode_cachep;</div><div class='ctx'> struct list_head fuse_conn_list;</div><div class='ctx'> DEFINE_MUTEX(fuse_mutex);</div><div class='add'>+DECLARE_WAIT_QUEUE_HEAD(fuse_dev_waitq);</div><div class='ctx'> </div><div class='ctx'> static int set_global_limit(const char *val, const struct kernel_param *kp);</div><div class='ctx'> </div><div class='del'>-unsigned max_user_bgreq;</div><div class='add'>+unsigned int fuse_max_pages_limit = 256;</div><div class='add'>+/* default is no timeout */</div><div class='add'>+unsigned int fuse_default_req_timeout;</div><div class='add'>+unsigned int fuse_max_req_timeout;</div><div class='add'>+</div><div class='add'>+unsigned int max_user_bgreq;</div><div class='ctx'> module_param_call(max_user_bgreq, set_global_limit, param_get_uint,</div><div class='ctx'> 		  &amp;max_user_bgreq, 0644);</div><div class='ctx'> __MODULE_PARM_TYPE(max_user_bgreq, "uint");</div><div class='hunk'>@@ -42,7 +52,7 @@ MODULE_PARM_DESC(max_user_bgreq,</div><div class='ctx'>  "Global limit for the maximum number of backgrounded requests an "</div><div class='ctx'>  "unprivileged user can set");</div><div class='ctx'> </div><div class='del'>-unsigned max_user_congthresh;</div><div class='add'>+unsigned int max_user_congthresh;</div><div class='ctx'> module_param_call(max_user_congthresh, set_global_limit, param_get_uint,</div><div class='ctx'> 		  &amp;max_user_congthresh, 0644);</div><div class='ctx'> __MODULE_PARM_TYPE(max_user_congthresh, "uint");</div><div class='hunk'>@@ -50,8 +60,6 @@ MODULE_PARM_DESC(max_user_congthresh,</div><div class='ctx'>  "Global limit for the maximum congestion threshold an "</div><div class='ctx'>  "unprivileged user can set");</div><div class='ctx'> </div><div class='del'>-#define FUSE_SUPER_MAGIC 0x65735546</div><div class='del'>-</div><div class='ctx'> #define FUSE_DEFAULT_BLKSIZE 512</div><div class='ctx'> </div><div class='ctx'> /** Maximum number of outstanding background requests */</div><div class='hunk'>@@ -69,21 +77,37 @@ struct fuse_forget_link *fuse_alloc_forget(void)</div><div class='ctx'> 	return kzalloc(sizeof(struct fuse_forget_link), GFP_KERNEL_ACCOUNT);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static struct fuse_submount_lookup *fuse_alloc_submount_lookup(void)</div><div class='add'>+{</div><div class='add'>+	struct fuse_submount_lookup *sl;</div><div class='add'>+</div><div class='add'>+	sl = kzalloc(sizeof(struct fuse_submount_lookup), GFP_KERNEL_ACCOUNT);</div><div class='add'>+	if (!sl)</div><div class='add'>+		return NULL;</div><div class='add'>+	sl-&gt;forget = fuse_alloc_forget();</div><div class='add'>+	if (!sl-&gt;forget)</div><div class='add'>+		goto out_free;</div><div class='add'>+</div><div class='add'>+	return sl;</div><div class='add'>+</div><div class='add'>+out_free:</div><div class='add'>+	kfree(sl);</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static struct inode *fuse_alloc_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_inode *fi;</div><div class='ctx'> </div><div class='del'>-	fi = kmem_cache_alloc(fuse_inode_cachep, GFP_KERNEL);</div><div class='add'>+	fi = alloc_inode_sb(sb, fuse_inode_cachep, GFP_KERNEL);</div><div class='ctx'> 	if (!fi)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='del'>-	fi-&gt;i_time = 0;</div><div class='del'>-	fi-&gt;inval_mask = 0;</div><div class='del'>-	fi-&gt;nodeid = 0;</div><div class='del'>-	fi-&gt;nlookup = 0;</div><div class='del'>-	fi-&gt;attr_version = 0;</div><div class='del'>-	fi-&gt;orig_ino = 0;</div><div class='del'>-	fi-&gt;state = 0;</div><div class='add'>+	/* Initialize private data (i.e. everything except fi-&gt;inode) */</div><div class='add'>+	BUILD_BUG_ON(offsetof(struct fuse_inode, inode) != 0);</div><div class='add'>+	memset((void *) fi + sizeof(fi-&gt;inode), 0, sizeof(*fi) - sizeof(fi-&gt;inode));</div><div class='add'>+</div><div class='add'>+	fi-&gt;inval_mask = ~0;</div><div class='ctx'> 	mutex_init(&amp;fi-&gt;mutex);</div><div class='ctx'> 	spin_lock_init(&amp;fi-&gt;lock);</div><div class='ctx'> 	fi-&gt;forget = fuse_alloc_forget();</div><div class='hunk'>@@ -93,6 +117,9 @@ static struct inode *fuse_alloc_inode(struct super_block *sb)</div><div class='ctx'> 	if (IS_ENABLED(CONFIG_FUSE_DAX) &amp;&amp; !fuse_dax_inode_alloc(sb, fi))</div><div class='ctx'> 		goto out_free_forget;</div><div class='ctx'> </div><div class='add'>+	if (IS_ENABLED(CONFIG_FUSE_PASSTHROUGH))</div><div class='add'>+		fuse_inode_backing_set(fi, NULL);</div><div class='add'>+</div><div class='ctx'> 	return &amp;fi-&gt;inode;</div><div class='ctx'> </div><div class='ctx'> out_free_forget:</div><div class='hunk'>@@ -111,15 +138,32 @@ static void fuse_free_inode(struct inode *inode)</div><div class='ctx'> #ifdef CONFIG_FUSE_DAX</div><div class='ctx'> 	kfree(fi-&gt;dax);</div><div class='ctx'> #endif</div><div class='add'>+	if (IS_ENABLED(CONFIG_FUSE_PASSTHROUGH))</div><div class='add'>+		fuse_backing_put(fuse_inode_backing(fi));</div><div class='add'>+</div><div class='ctx'> 	kmem_cache_free(fuse_inode_cachep, fi);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void fuse_cleanup_submount_lookup(struct fuse_conn *fc,</div><div class='add'>+					 struct fuse_submount_lookup *sl)</div><div class='add'>+{</div><div class='add'>+	if (!refcount_dec_and_test(&amp;sl-&gt;count))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	fuse_queue_forget(fc, sl-&gt;forget, sl-&gt;nodeid, 1);</div><div class='add'>+	sl-&gt;forget = NULL;</div><div class='add'>+	kfree(sl);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void fuse_evict_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_inode *fi = get_fuse_inode(inode);</div><div class='ctx'> </div><div class='ctx'> 	/* Will write inode on close/munmap and in all other dirtiers */</div><div class='del'>-	WARN_ON(inode-&gt;i_state &amp; I_DIRTY_INODE);</div><div class='add'>+	WARN_ON(inode_state_read_once(inode) &amp; I_DIRTY_INODE);</div><div class='add'>+</div><div class='add'>+	if (FUSE_IS_DAX(inode))</div><div class='add'>+		dax_break_layout_final(inode);</div><div class='ctx'> </div><div class='ctx'> 	truncate_inode_pages_final(&amp;inode-&gt;i_data);</div><div class='ctx'> 	clear_inode(inode);</div><div class='hunk'>@@ -133,8 +177,22 @@ static void fuse_evict_inode(struct inode *inode)</div><div class='ctx'> 					  fi-&gt;nlookup);</div><div class='ctx'> 			fi-&gt;forget = NULL;</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='add'>+		if (fi-&gt;submount_lookup) {</div><div class='add'>+			fuse_cleanup_submount_lookup(fc, fi-&gt;submount_lookup);</div><div class='add'>+			fi-&gt;submount_lookup = NULL;</div><div class='add'>+		}</div><div class='add'>+		/*</div><div class='add'>+		 * Evict of non-deleted inode may race with outstanding</div><div class='add'>+		 * LOOKUP/READDIRPLUS requests and result in inconsistency when</div><div class='add'>+		 * the request finishes.  Deal with that here by bumping a</div><div class='add'>+		 * counter that can be compared to the starting value.</div><div class='add'>+		 */</div><div class='add'>+		if (inode-&gt;i_nlink &gt; 0)</div><div class='add'>+			atomic64_inc(&amp;fc-&gt;evict_ctr);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (S_ISREG(inode-&gt;i_mode) &amp;&amp; !fuse_is_bad(inode)) {</div><div class='add'>+		WARN_ON(fi-&gt;iocachectr != 0);</div><div class='ctx'> 		WARN_ON(!list_empty(&amp;fi-&gt;write_files));</div><div class='ctx'> 		WARN_ON(!list_empty(&amp;fi-&gt;queued_writes));</div><div class='ctx'> 	}</div><div class='hunk'>@@ -164,16 +222,31 @@ static ino_t fuse_squash_ino(u64 ino64)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void fuse_change_attributes_common(struct inode *inode, struct fuse_attr *attr,</div><div class='del'>-				   u64 attr_valid, u32 cache_mask)</div><div class='add'>+				   struct fuse_statx *sx,</div><div class='add'>+				   u64 attr_valid, u32 cache_mask,</div><div class='add'>+				   u64 evict_ctr)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_conn *fc = get_fuse_conn(inode);</div><div class='ctx'> 	struct fuse_inode *fi = get_fuse_inode(inode);</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;fi-&gt;lock);</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Clear basic stats from invalid mask.</div><div class='add'>+	 *</div><div class='add'>+	 * Don't do this if this is coming from a fuse_iget() call and there</div><div class='add'>+	 * might have been a racing evict which would've invalidated the result</div><div class='add'>+	 * if the attr_version would've been preserved.</div><div class='add'>+	 *</div><div class='add'>+	 * !evict_ctr -&gt; this is create</div><div class='add'>+	 * fi-&gt;attr_version != 0 -&gt; this is not a new inode</div><div class='add'>+	 * evict_ctr == fuse_get_evict_ctr() -&gt; no evicts while during request</div><div class='add'>+	 */</div><div class='add'>+	if (!evict_ctr || fi-&gt;attr_version || evict_ctr == fuse_get_evict_ctr(fc))</div><div class='add'>+		set_mask_bits(&amp;fi-&gt;inval_mask, STATX_BASIC_STATS, 0);</div><div class='add'>+</div><div class='ctx'> 	fi-&gt;attr_version = atomic64_inc_return(&amp;fc-&gt;attr_version);</div><div class='ctx'> 	fi-&gt;i_time = attr_valid;</div><div class='del'>-	WRITE_ONCE(fi-&gt;inval_mask, 0);</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_ino     = fuse_squash_ino(attr-&gt;ino);</div><div class='ctx'> 	inode-&gt;i_mode    = (inode-&gt;i_mode &amp; S_IFMT) | (attr-&gt;mode &amp; 07777);</div><div class='hunk'>@@ -181,22 +254,44 @@ void fuse_change_attributes_common(struct inode *inode, struct fuse_attr *attr,</div><div class='ctx'> 	inode-&gt;i_uid     = make_kuid(fc-&gt;user_ns, attr-&gt;uid);</div><div class='ctx'> 	inode-&gt;i_gid     = make_kgid(fc-&gt;user_ns, attr-&gt;gid);</div><div class='ctx'> 	inode-&gt;i_blocks  = attr-&gt;blocks;</div><div class='del'>-	inode-&gt;i_atime.tv_sec   = attr-&gt;atime;</div><div class='del'>-	inode-&gt;i_atime.tv_nsec  = attr-&gt;atimensec;</div><div class='add'>+</div><div class='add'>+	/* Sanitize nsecs */</div><div class='add'>+	attr-&gt;atimensec = min_t(u32, attr-&gt;atimensec, NSEC_PER_SEC - 1);</div><div class='add'>+	attr-&gt;mtimensec = min_t(u32, attr-&gt;mtimensec, NSEC_PER_SEC - 1);</div><div class='add'>+	attr-&gt;ctimensec = min_t(u32, attr-&gt;ctimensec, NSEC_PER_SEC - 1);</div><div class='add'>+</div><div class='add'>+	inode_set_atime(inode, attr-&gt;atime, attr-&gt;atimensec);</div><div class='ctx'> 	/* mtime from server may be stale due to local buffered write */</div><div class='ctx'> 	if (!(cache_mask &amp; STATX_MTIME)) {</div><div class='del'>-		inode-&gt;i_mtime.tv_sec   = attr-&gt;mtime;</div><div class='del'>-		inode-&gt;i_mtime.tv_nsec  = attr-&gt;mtimensec;</div><div class='add'>+		inode_set_mtime(inode, attr-&gt;mtime, attr-&gt;mtimensec);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!(cache_mask &amp; STATX_CTIME)) {</div><div class='del'>-		inode-&gt;i_ctime.tv_sec   = attr-&gt;ctime;</div><div class='del'>-		inode-&gt;i_ctime.tv_nsec  = attr-&gt;ctimensec;</div><div class='add'>+		inode_set_ctime(inode, attr-&gt;ctime, attr-&gt;ctimensec);</div><div class='ctx'> 	}</div><div class='add'>+	if (sx) {</div><div class='add'>+		/* Sanitize nsecs */</div><div class='add'>+		sx-&gt;btime.tv_nsec =</div><div class='add'>+			min_t(u32, sx-&gt;btime.tv_nsec, NSEC_PER_SEC - 1);</div><div class='ctx'> </div><div class='del'>-	if (attr-&gt;blksize != 0)</div><div class='del'>-		inode-&gt;i_blkbits = ilog2(attr-&gt;blksize);</div><div class='add'>+		/*</div><div class='add'>+		 * Btime has been queried, cache is valid (whether or not btime</div><div class='add'>+		 * is available or not) so clear STATX_BTIME from inval_mask.</div><div class='add'>+		 *</div><div class='add'>+		 * Availability of the btime attribute is indicated in</div><div class='add'>+		 * FUSE_I_BTIME</div><div class='add'>+		 */</div><div class='add'>+		set_mask_bits(&amp;fi-&gt;inval_mask, STATX_BTIME, 0);</div><div class='add'>+		if (sx-&gt;mask &amp; STATX_BTIME) {</div><div class='add'>+			set_bit(FUSE_I_BTIME, &amp;fi-&gt;state);</div><div class='add'>+			fi-&gt;i_btime.tv_sec = sx-&gt;btime.tv_sec;</div><div class='add'>+			fi-&gt;i_btime.tv_nsec = sx-&gt;btime.tv_nsec;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (attr-&gt;blksize)</div><div class='add'>+		fi-&gt;cached_i_blkbits = ilog2(attr-&gt;blksize);</div><div class='ctx'> 	else</div><div class='del'>-		inode-&gt;i_blkbits = inode-&gt;i_sb-&gt;s_blocksize_bits;</div><div class='add'>+		fi-&gt;cached_i_blkbits = inode-&gt;i_sb-&gt;s_blocksize_bits;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Don't set the sticky bit in i_mode, unless we want the VFS</div><div class='hunk'>@@ -230,8 +325,9 @@ u32 fuse_get_cache_mask(struct inode *inode)</div><div class='ctx'> 	return STATX_MTIME | STATX_CTIME | STATX_SIZE;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void fuse_change_attributes(struct inode *inode, struct fuse_attr *attr,</div><div class='del'>-			    u64 attr_valid, u64 attr_version)</div><div class='add'>+static void fuse_change_attributes_i(struct inode *inode, struct fuse_attr *attr,</div><div class='add'>+				     struct fuse_statx *sx, u64 attr_valid,</div><div class='add'>+				     u64 attr_version, u64 evict_ctr)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_conn *fc = get_fuse_conn(inode);</div><div class='ctx'> 	struct fuse_inode *fi = get_fuse_inode(inode);</div><div class='hunk'>@@ -250,12 +346,12 @@ void fuse_change_attributes(struct inode *inode, struct fuse_attr *attr,</div><div class='ctx'> 		attr-&gt;size = i_size_read(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (cache_mask &amp; STATX_MTIME) {</div><div class='del'>-		attr-&gt;mtime = inode-&gt;i_mtime.tv_sec;</div><div class='del'>-		attr-&gt;mtimensec = inode-&gt;i_mtime.tv_nsec;</div><div class='add'>+		attr-&gt;mtime = inode_get_mtime_sec(inode);</div><div class='add'>+		attr-&gt;mtimensec = inode_get_mtime_nsec(inode);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (cache_mask &amp; STATX_CTIME) {</div><div class='del'>-		attr-&gt;ctime = inode-&gt;i_ctime.tv_sec;</div><div class='del'>-		attr-&gt;ctimensec = inode-&gt;i_ctime.tv_nsec;</div><div class='add'>+		attr-&gt;ctime = inode_get_ctime_sec(inode);</div><div class='add'>+		attr-&gt;ctimensec = inode_get_ctime_nsec(inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if ((attr_version != 0 &amp;&amp; fi-&gt;attr_version &gt; attr_version) ||</div><div class='hunk'>@@ -264,8 +360,9 @@ void fuse_change_attributes(struct inode *inode, struct fuse_attr *attr,</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	old_mtime = inode-&gt;i_mtime;</div><div class='del'>-	fuse_change_attributes_common(inode, attr, attr_valid, cache_mask);</div><div class='add'>+	old_mtime = inode_get_mtime(inode);</div><div class='add'>+	fuse_change_attributes_common(inode, attr, sx, attr_valid, cache_mask,</div><div class='add'>+				      evict_ctr);</div><div class='ctx'> </div><div class='ctx'> 	oldsize = inode-&gt;i_size;</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -301,19 +398,35 @@ void fuse_change_attributes(struct inode *inode, struct fuse_attr *attr,</div><div class='ctx'> 		if (inval)</div><div class='ctx'> 			invalidate_inode_pages2(inode-&gt;i_mapping);</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	if (IS_ENABLED(CONFIG_FUSE_DAX))</div><div class='add'>+		fuse_dax_dontcache(inode, attr-&gt;flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void fuse_change_attributes(struct inode *inode, struct fuse_attr *attr,</div><div class='add'>+			    struct fuse_statx *sx, u64 attr_valid,</div><div class='add'>+			    u64 attr_version)</div><div class='add'>+{</div><div class='add'>+	fuse_change_attributes_i(inode, attr, sx, attr_valid, attr_version, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void fuse_init_inode(struct inode *inode, struct fuse_attr *attr)</div><div class='add'>+static void fuse_init_submount_lookup(struct fuse_submount_lookup *sl,</div><div class='add'>+				      u64 nodeid)</div><div class='add'>+{</div><div class='add'>+	sl-&gt;nodeid = nodeid;</div><div class='add'>+	refcount_set(&amp;sl-&gt;count, 1);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fuse_init_inode(struct inode *inode, struct fuse_attr *attr,</div><div class='add'>+			    struct fuse_conn *fc)</div><div class='ctx'> {</div><div class='ctx'> 	inode-&gt;i_mode = attr-&gt;mode &amp; S_IFMT;</div><div class='ctx'> 	inode-&gt;i_size = attr-&gt;size;</div><div class='del'>-	inode-&gt;i_mtime.tv_sec  = attr-&gt;mtime;</div><div class='del'>-	inode-&gt;i_mtime.tv_nsec = attr-&gt;mtimensec;</div><div class='del'>-	inode-&gt;i_ctime.tv_sec  = attr-&gt;ctime;</div><div class='del'>-	inode-&gt;i_ctime.tv_nsec = attr-&gt;ctimensec;</div><div class='add'>+	inode_set_mtime(inode, attr-&gt;mtime, attr-&gt;mtimensec);</div><div class='add'>+	inode_set_ctime(inode, attr-&gt;ctime, attr-&gt;ctimensec);</div><div class='ctx'> 	if (S_ISREG(inode-&gt;i_mode)) {</div><div class='ctx'> 		fuse_init_common(inode);</div><div class='del'>-		fuse_init_file_inode(inode);</div><div class='add'>+		fuse_init_file_inode(inode, attr-&gt;flags);</div><div class='ctx'> 	} else if (S_ISDIR(inode-&gt;i_mode))</div><div class='ctx'> 		fuse_init_dir(inode);</div><div class='ctx'> 	else if (S_ISLNK(inode-&gt;i_mode))</div><div class='hunk'>@@ -325,6 +438,12 @@ static void fuse_init_inode(struct inode *inode, struct fuse_attr *attr)</div><div class='ctx'> 				   new_decode_dev(attr-&gt;rdev));</div><div class='ctx'> 	} else</div><div class='ctx'> 		BUG();</div><div class='add'>+	/*</div><div class='add'>+	 * Ensure that we don't cache acls for daemons without FUSE_POSIX_ACL</div><div class='add'>+	 * so they see the exact same behavior as before.</div><div class='add'>+	 */</div><div class='add'>+	if (!fc-&gt;posix_acl)</div><div class='add'>+		inode-&gt;i_acl = inode-&gt;i_default_acl = ACL_DONT_CACHE;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int fuse_inode_eq(struct inode *inode, void *_nodeidp)</div><div class='hunk'>@@ -345,7 +464,8 @@ static int fuse_inode_set(struct inode *inode, void *_nodeidp)</div><div class='ctx'> </div><div class='ctx'> struct inode *fuse_iget(struct super_block *sb, u64 nodeid,</div><div class='ctx'> 			int generation, struct fuse_attr *attr,</div><div class='del'>-			u64 attr_valid, u64 attr_version)</div><div class='add'>+			u64 attr_valid, u64 attr_version,</div><div class='add'>+			u64 evict_ctr)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct fuse_inode *fi;</div><div class='hunk'>@@ -360,12 +480,22 @@ struct inode *fuse_iget(struct super_block *sb, u64 nodeid,</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (fc-&gt;auto_submounts &amp;&amp; (attr-&gt;flags &amp; FUSE_ATTR_SUBMOUNT) &amp;&amp;</div><div class='ctx'> 	    S_ISDIR(attr-&gt;mode)) {</div><div class='add'>+		struct fuse_inode *fi;</div><div class='add'>+</div><div class='ctx'> 		inode = new_inode(sb);</div><div class='ctx'> 		if (!inode)</div><div class='ctx'> 			return NULL;</div><div class='ctx'> </div><div class='del'>-		fuse_init_inode(inode, attr);</div><div class='del'>-		get_fuse_inode(inode)-&gt;nodeid = nodeid;</div><div class='add'>+		fuse_init_inode(inode, attr, fc);</div><div class='add'>+		fi = get_fuse_inode(inode);</div><div class='add'>+		fi-&gt;nodeid = nodeid;</div><div class='add'>+		fi-&gt;submount_lookup = fuse_alloc_submount_lookup();</div><div class='add'>+		if (!fi-&gt;submount_lookup) {</div><div class='add'>+			iput(inode);</div><div class='add'>+			return NULL;</div><div class='add'>+		}</div><div class='add'>+		/* Sets nlookup = 1 on fi-&gt;submount_lookup-&gt;nlookup */</div><div class='add'>+		fuse_init_submount_lookup(fi-&gt;submount_lookup, nodeid);</div><div class='ctx'> 		inode-&gt;i_flags |= S_AUTOMOUNT;</div><div class='ctx'> 		goto done;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -375,26 +505,29 @@ retry:</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='del'>-	if ((inode-&gt;i_state &amp; I_NEW)) {</div><div class='add'>+	if ((inode_state_read_once(inode) &amp; I_NEW)) {</div><div class='ctx'> 		inode-&gt;i_flags |= S_NOATIME;</div><div class='ctx'> 		if (!fc-&gt;writeback_cache || !S_ISREG(attr-&gt;mode))</div><div class='ctx'> 			inode-&gt;i_flags |= S_NOCMTIME;</div><div class='ctx'> 		inode-&gt;i_generation = generation;</div><div class='del'>-		fuse_init_inode(inode, attr);</div><div class='add'>+		fuse_init_inode(inode, attr, fc);</div><div class='ctx'> 		unlock_new_inode(inode);</div><div class='ctx'> 	} else if (fuse_stale_inode(inode, generation, attr)) {</div><div class='ctx'> 		/* nodeid was reused, any I/O on the old inode should fail */</div><div class='ctx'> 		fuse_make_bad(inode);</div><div class='del'>-		iput(inode);</div><div class='del'>-		goto retry;</div><div class='add'>+		if (inode != d_inode(sb-&gt;s_root)) {</div><div class='add'>+			remove_inode_hash(inode);</div><div class='add'>+			iput(inode);</div><div class='add'>+			goto retry;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='del'>-done:</div><div class='ctx'> 	fi = get_fuse_inode(inode);</div><div class='ctx'> 	spin_lock(&amp;fi-&gt;lock);</div><div class='ctx'> 	fi-&gt;nlookup++;</div><div class='ctx'> 	spin_unlock(&amp;fi-&gt;lock);</div><div class='del'>-	fuse_change_attributes(inode, attr, attr_valid, attr_version);</div><div class='del'>-</div><div class='add'>+done:</div><div class='add'>+	fuse_change_attributes_i(inode, attr, NULL, attr_valid, attr_version,</div><div class='add'>+				 evict_ctr);</div><div class='ctx'> 	return inode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -452,6 +585,17 @@ int fuse_reverse_inval_inode(struct fuse_conn *fc, u64 nodeid,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void fuse_try_prune_one_inode(struct fuse_conn *fc, u64 nodeid)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode;</div><div class='add'>+</div><div class='add'>+	inode = fuse_ilookup(fc, nodeid,  NULL);</div><div class='add'>+	if (!inode)</div><div class='add'>+		return;</div><div class='add'>+	d_prune_aliases(inode);</div><div class='add'>+	iput(inode);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> bool fuse_lock_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	bool locked = false;</div><div class='hunk'>@@ -474,8 +618,14 @@ static void fuse_umount_begin(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_conn *fc = get_fuse_conn_super(sb);</div><div class='ctx'> </div><div class='del'>-	if (!fc-&gt;no_force_umount)</div><div class='del'>-		fuse_abort_conn(fc);</div><div class='add'>+	if (fc-&gt;no_force_umount)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	fuse_abort_conn(fc);</div><div class='add'>+</div><div class='add'>+	// Only retire block-device-based superblocks.</div><div class='add'>+	if (sb-&gt;s_bdev != NULL)</div><div class='add'>+		retire_super(sb);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void fuse_send_destroy(struct fuse_mount *fm)</div><div class='hunk'>@@ -640,8 +790,8 @@ static const struct fs_parameter_spec fuse_fs_parameters[] = {</div><div class='ctx'> 	fsparam_string	("source",		OPT_SOURCE),</div><div class='ctx'> 	fsparam_u32	("fd",			OPT_FD),</div><div class='ctx'> 	fsparam_u32oct	("rootmode",		OPT_ROOTMODE),</div><div class='del'>-	fsparam_u32	("user_id",		OPT_USER_ID),</div><div class='del'>-	fsparam_u32	("group_id",		OPT_GROUP_ID),</div><div class='add'>+	fsparam_uid	("user_id",		OPT_USER_ID),</div><div class='add'>+	fsparam_gid	("group_id",		OPT_GROUP_ID),</div><div class='ctx'> 	fsparam_flag	("default_permissions",	OPT_DEFAULT_PERMISSIONS),</div><div class='ctx'> 	fsparam_flag	("allow_other",		OPT_ALLOW_OTHER),</div><div class='ctx'> 	fsparam_u32	("max_read",		OPT_MAX_READ),</div><div class='hunk'>@@ -655,6 +805,8 @@ static int fuse_parse_param(struct fs_context *fsc, struct fs_parameter *param)</div><div class='ctx'> 	struct fs_parse_result result;</div><div class='ctx'> 	struct fuse_fs_context *ctx = fsc-&gt;fs_private;</div><div class='ctx'> 	int opt;</div><div class='add'>+	kuid_t kuid;</div><div class='add'>+	kgid_t kgid;</div><div class='ctx'> </div><div class='ctx'> 	if (fsc-&gt;purpose == FS_CONTEXT_FOR_RECONFIGURE) {</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -699,16 +851,26 @@ static int fuse_parse_param(struct fs_context *fsc, struct fs_parameter *param)</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	case OPT_USER_ID:</div><div class='del'>-		ctx-&gt;user_id = make_kuid(fsc-&gt;user_ns, result.uint_32);</div><div class='del'>-		if (!uid_valid(ctx-&gt;user_id))</div><div class='add'>+		kuid = result.uid;</div><div class='add'>+		/*</div><div class='add'>+		 * The requested uid must be representable in the</div><div class='add'>+		 * filesystem's idmapping.</div><div class='add'>+		 */</div><div class='add'>+		if (!kuid_has_mapping(fsc-&gt;user_ns, kuid))</div><div class='ctx'> 			return invalfc(fsc, "Invalid user_id");</div><div class='add'>+		ctx-&gt;user_id = kuid;</div><div class='ctx'> 		ctx-&gt;user_id_present = true;</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	case OPT_GROUP_ID:</div><div class='del'>-		ctx-&gt;group_id = make_kgid(fsc-&gt;user_ns, result.uint_32);</div><div class='del'>-		if (!gid_valid(ctx-&gt;group_id))</div><div class='add'>+		kgid = result.gid;</div><div class='add'>+		/*</div><div class='add'>+		 * The requested gid must be representable in the</div><div class='add'>+		 * filesystem's idmapping.</div><div class='add'>+		 */</div><div class='add'>+		if (!kgid_has_mapping(fsc-&gt;user_ns, kgid))</div><div class='ctx'> 			return invalfc(fsc, "Invalid group_id");</div><div class='add'>+		ctx-&gt;group_id = kgid;</div><div class='ctx'> 		ctx-&gt;group_id_present = true;</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='hunk'>@@ -767,8 +929,12 @@ static int fuse_show_options(struct seq_file *m, struct dentry *root)</div><div class='ctx'> 			seq_printf(m, ",blksize=%lu", sb-&gt;s_blocksize);</div><div class='ctx'> 	}</div><div class='ctx'> #ifdef CONFIG_FUSE_DAX</div><div class='del'>-	if (fc-&gt;dax)</div><div class='del'>-		seq_puts(m, ",dax");</div><div class='add'>+	if (fc-&gt;dax_mode == FUSE_DAX_ALWAYS)</div><div class='add'>+		seq_puts(m, ",dax=always");</div><div class='add'>+	else if (fc-&gt;dax_mode == FUSE_DAX_NEVER)</div><div class='add'>+		seq_puts(m, ",dax=never");</div><div class='add'>+	else if (fc-&gt;dax_mode == FUSE_DAX_INODE_USER)</div><div class='add'>+		seq_puts(m, ",dax=inode");</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -789,7 +955,7 @@ static void fuse_iqueue_init(struct fuse_iqueue *fiq,</div><div class='ctx'> 	fiq-&gt;priv = priv;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void fuse_pqueue_init(struct fuse_pqueue *fpq)</div><div class='add'>+void fuse_pqueue_init(struct fuse_pqueue *fpq)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int i;</div><div class='ctx'> </div><div class='hunk'>@@ -810,6 +976,8 @@ void fuse_conn_init(struct fuse_conn *fc, struct fuse_mount *fm,</div><div class='ctx'> 	init_rwsem(&amp;fc-&gt;killsb);</div><div class='ctx'> 	refcount_set(&amp;fc-&gt;count, 1);</div><div class='ctx'> 	atomic_set(&amp;fc-&gt;dev_count, 1);</div><div class='add'>+	atomic_set(&amp;fc-&gt;epoch, 1);</div><div class='add'>+	INIT_WORK(&amp;fc-&gt;epoch_work, fuse_epoch_work);</div><div class='ctx'> 	init_waitqueue_head(&amp;fc-&gt;blocked_waitq);</div><div class='ctx'> 	fuse_iqueue_init(&amp;fc-&gt;iq, fiq_ops, fiq_priv);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;fc-&gt;bg_queue);</div><div class='hunk'>@@ -824,11 +992,17 @@ void fuse_conn_init(struct fuse_conn *fc, struct fuse_mount *fm,</div><div class='ctx'> 	fc-&gt;initialized = 0;</div><div class='ctx'> 	fc-&gt;connected = 1;</div><div class='ctx'> 	atomic64_set(&amp;fc-&gt;attr_version, 1);</div><div class='add'>+	atomic64_set(&amp;fc-&gt;evict_ctr, 1);</div><div class='ctx'> 	get_random_bytes(&amp;fc-&gt;scramble_key, sizeof(fc-&gt;scramble_key));</div><div class='ctx'> 	fc-&gt;pid_ns = get_pid_ns(task_active_pid_ns(current));</div><div class='ctx'> 	fc-&gt;user_ns = get_user_ns(user_ns);</div><div class='ctx'> 	fc-&gt;max_pages = FUSE_DEFAULT_MAX_PAGES_PER_REQ;</div><div class='del'>-	fc-&gt;max_pages_limit = FUSE_MAX_MAX_PAGES;</div><div class='add'>+	fc-&gt;max_pages_limit = fuse_max_pages_limit;</div><div class='add'>+	fc-&gt;name_max = FUSE_NAME_LOW_MAX;</div><div class='add'>+	fc-&gt;timeout.req_timeout = 0;</div><div class='add'>+</div><div class='add'>+	if (IS_ENABLED(CONFIG_FUSE_PASSTHROUGH))</div><div class='add'>+		fuse_backing_files_init(fc);</div><div class='ctx'> </div><div class='ctx'> 	INIT_LIST_HEAD(&amp;fc-&gt;mounts);</div><div class='ctx'> 	list_add(&amp;fm-&gt;fc_entry, &amp;fc-&gt;mounts);</div><div class='hunk'>@@ -836,25 +1010,40 @@ void fuse_conn_init(struct fuse_conn *fc, struct fuse_mount *fm,</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(fuse_conn_init);</div><div class='ctx'> </div><div class='add'>+static void delayed_release(struct rcu_head *p)</div><div class='add'>+{</div><div class='add'>+	struct fuse_conn *fc = container_of(p, struct fuse_conn, rcu);</div><div class='add'>+</div><div class='add'>+	fuse_uring_destruct(fc);</div><div class='add'>+</div><div class='add'>+	put_user_ns(fc-&gt;user_ns);</div><div class='add'>+	fc-&gt;release(fc);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> void fuse_conn_put(struct fuse_conn *fc)</div><div class='ctx'> {</div><div class='del'>-	if (refcount_dec_and_test(&amp;fc-&gt;count)) {</div><div class='del'>-		struct fuse_iqueue *fiq = &amp;fc-&gt;iq;</div><div class='del'>-		struct fuse_sync_bucket *bucket;</div><div class='del'>-</div><div class='del'>-		if (IS_ENABLED(CONFIG_FUSE_DAX))</div><div class='del'>-			fuse_dax_conn_free(fc);</div><div class='del'>-		if (fiq-&gt;ops-&gt;release)</div><div class='del'>-			fiq-&gt;ops-&gt;release(fiq);</div><div class='del'>-		put_pid_ns(fc-&gt;pid_ns);</div><div class='del'>-		put_user_ns(fc-&gt;user_ns);</div><div class='del'>-		bucket = rcu_dereference_protected(fc-&gt;curr_bucket, 1);</div><div class='del'>-		if (bucket) {</div><div class='del'>-			WARN_ON(atomic_read(&amp;bucket-&gt;count) != 1);</div><div class='del'>-			kfree(bucket);</div><div class='del'>-		}</div><div class='del'>-		fc-&gt;release(fc);</div><div class='add'>+	struct fuse_iqueue *fiq = &amp;fc-&gt;iq;</div><div class='add'>+	struct fuse_sync_bucket *bucket;</div><div class='add'>+</div><div class='add'>+	if (!refcount_dec_and_test(&amp;fc-&gt;count))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (IS_ENABLED(CONFIG_FUSE_DAX))</div><div class='add'>+		fuse_dax_conn_free(fc);</div><div class='add'>+	if (fc-&gt;timeout.req_timeout)</div><div class='add'>+		cancel_delayed_work_sync(&amp;fc-&gt;timeout.work);</div><div class='add'>+	cancel_work_sync(&amp;fc-&gt;epoch_work);</div><div class='add'>+	if (fiq-&gt;ops-&gt;release)</div><div class='add'>+		fiq-&gt;ops-&gt;release(fiq);</div><div class='add'>+	put_pid_ns(fc-&gt;pid_ns);</div><div class='add'>+	bucket = rcu_dereference_protected(fc-&gt;curr_bucket, 1);</div><div class='add'>+	if (bucket) {</div><div class='add'>+		WARN_ON(atomic_read(&amp;bucket-&gt;count) != 1);</div><div class='add'>+		kfree(bucket);</div><div class='ctx'> 	}</div><div class='add'>+	if (IS_ENABLED(CONFIG_FUSE_PASSTHROUGH))</div><div class='add'>+		fuse_backing_files_free(fc);</div><div class='add'>+	call_rcu(&amp;fc-&gt;rcu, delayed_release);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(fuse_conn_put);</div><div class='ctx'> </div><div class='hunk'>@@ -865,7 +1054,7 @@ struct fuse_conn *fuse_conn_get(struct fuse_conn *fc)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(fuse_conn_get);</div><div class='ctx'> </div><div class='del'>-static struct inode *fuse_get_root_inode(struct super_block *sb, unsigned mode)</div><div class='add'>+static struct inode *fuse_get_root_inode(struct super_block *sb, unsigned int mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_attr attr;</div><div class='ctx'> 	memset(&amp;attr, 0, sizeof(attr));</div><div class='hunk'>@@ -873,7 +1062,7 @@ static struct inode *fuse_get_root_inode(struct super_block *sb, unsigned mode)</div><div class='ctx'> 	attr.mode = mode;</div><div class='ctx'> 	attr.ino = FUSE_ROOT_ID;</div><div class='ctx'> 	attr.nlink = 1;</div><div class='del'>-	return fuse_iget(sb, 1, 0, &amp;attr, 0, 0);</div><div class='add'>+	return fuse_iget(sb, FUSE_ROOT_ID, 0, &amp;attr, 0, 0, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct fuse_inode_handle {</div><div class='hunk'>@@ -957,7 +1146,7 @@ static int fuse_encode_fh(struct inode *inode, u32 *fh, int *max_len,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	*max_len = len;</div><div class='del'>-	return parent ? 0x82 : 0x81;</div><div class='add'>+	return parent ? FILEID_INO64_GEN_PARENT : FILEID_INO64_GEN;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct dentry *fuse_fh_to_dentry(struct super_block *sb,</div><div class='hunk'>@@ -965,7 +1154,8 @@ static struct dentry *fuse_fh_to_dentry(struct super_block *sb,</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_inode_handle handle;</div><div class='ctx'> </div><div class='del'>-	if ((fh_type != 0x81 &amp;&amp; fh_type != 0x82) || fh_len &lt; 3)</div><div class='add'>+	if ((fh_type != FILEID_INO64_GEN &amp;&amp;</div><div class='add'>+	     fh_type != FILEID_INO64_GEN_PARENT) || fh_len &lt; 3)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='ctx'> 	handle.nodeid = (u64) fid-&gt;raw[0] &lt;&lt; 32;</div><div class='hunk'>@@ -979,7 +1169,7 @@ static struct dentry *fuse_fh_to_parent(struct super_block *sb,</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_inode_handle parent;</div><div class='ctx'> </div><div class='del'>-	if (fh_type != 0x82 || fh_len &lt; 6)</div><div class='add'>+	if (fh_type != FILEID_INO64_GEN_PARENT || fh_len &lt; 6)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='ctx'> 	parent.nodeid = (u64) fid-&gt;raw[3] &lt;&lt; 32;</div><div class='hunk'>@@ -1015,6 +1205,11 @@ static struct dentry *fuse_get_parent(struct dentry *child)</div><div class='ctx'> 	return parent;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/* only for fid encoding; no support for file handle */</div><div class='add'>+static const struct export_operations fuse_export_fid_operations = {</div><div class='add'>+	.encode_fh	= fuse_encode_fh,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> static const struct export_operations fuse_export_operations = {</div><div class='ctx'> 	.fh_to_dentry	= fuse_fh_to_dentry,</div><div class='ctx'> 	.fh_to_parent	= fuse_fh_to_parent,</div><div class='hunk'>@@ -1027,14 +1222,14 @@ static const struct super_operations fuse_super_operations = {</div><div class='ctx'> 	.free_inode     = fuse_free_inode,</div><div class='ctx'> 	.evict_inode	= fuse_evict_inode,</div><div class='ctx'> 	.write_inode	= fuse_write_inode,</div><div class='del'>-	.drop_inode	= generic_delete_inode,</div><div class='add'>+	.drop_inode	= inode_just_drop,</div><div class='ctx'> 	.umount_begin	= fuse_umount_begin,</div><div class='ctx'> 	.statfs		= fuse_statfs,</div><div class='ctx'> 	.sync_fs	= fuse_sync_fs,</div><div class='ctx'> 	.show_options	= fuse_show_options,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static void sanitize_global_limit(unsigned *limit)</div><div class='add'>+static void sanitize_global_limit(unsigned int *limit)</div><div class='ctx'> {</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The default maximum number of async requests is calculated to consume</div><div class='hunk'>@@ -1055,7 +1250,7 @@ static int set_global_limit(const char *val, const struct kernel_param *kp)</div><div class='ctx'> 	if (rv)</div><div class='ctx'> 		return rv;</div><div class='ctx'> </div><div class='del'>-	sanitize_global_limit((unsigned *)kp-&gt;arg);</div><div class='add'>+	sanitize_global_limit((unsigned int *)kp-&gt;arg);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -1087,6 +1282,34 @@ static void process_init_limits(struct fuse_conn *fc, struct fuse_init_out *arg)</div><div class='ctx'> 	spin_unlock(&amp;fc-&gt;bg_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void set_request_timeout(struct fuse_conn *fc, unsigned int timeout)</div><div class='add'>+{</div><div class='add'>+	fc-&gt;timeout.req_timeout = secs_to_jiffies(timeout);</div><div class='add'>+	INIT_DELAYED_WORK(&amp;fc-&gt;timeout.work, fuse_check_timeout);</div><div class='add'>+	queue_delayed_work(system_percpu_wq, &amp;fc-&gt;timeout.work,</div><div class='add'>+			   fuse_timeout_timer_freq);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void init_server_timeout(struct fuse_conn *fc, unsigned int timeout)</div><div class='add'>+{</div><div class='add'>+	if (!timeout &amp;&amp; !fuse_max_req_timeout &amp;&amp; !fuse_default_req_timeout)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (!timeout)</div><div class='add'>+		timeout = fuse_default_req_timeout;</div><div class='add'>+</div><div class='add'>+	if (fuse_max_req_timeout) {</div><div class='add'>+		if (timeout)</div><div class='add'>+			timeout = min(fuse_max_req_timeout, timeout);</div><div class='add'>+		else</div><div class='add'>+			timeout = fuse_max_req_timeout;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	timeout = max(FUSE_TIMEOUT_TIMER_FREQ, timeout);</div><div class='add'>+</div><div class='add'>+	set_request_timeout(fc, timeout);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> struct fuse_init_args {</div><div class='ctx'> 	struct fuse_args args;</div><div class='ctx'> 	struct fuse_init_in in;</div><div class='hunk'>@@ -1105,83 +1328,142 @@ static void process_init_reply(struct fuse_mount *fm, struct fuse_args *args,</div><div class='ctx'> 		ok = false;</div><div class='ctx'> 	else {</div><div class='ctx'> 		unsigned long ra_pages;</div><div class='add'>+		unsigned int timeout = 0;</div><div class='ctx'> </div><div class='ctx'> 		process_init_limits(fc, arg);</div><div class='ctx'> </div><div class='ctx'> 		if (arg-&gt;minor &gt;= 6) {</div><div class='add'>+			u64 flags = arg-&gt;flags;</div><div class='add'>+</div><div class='add'>+			if (flags &amp; FUSE_INIT_EXT)</div><div class='add'>+				flags |= (u64) arg-&gt;flags2 &lt;&lt; 32;</div><div class='add'>+</div><div class='ctx'> 			ra_pages = arg-&gt;max_readahead / PAGE_SIZE;</div><div class='del'>-			if (arg-&gt;flags &amp; FUSE_ASYNC_READ)</div><div class='add'>+			if (flags &amp; FUSE_ASYNC_READ)</div><div class='ctx'> 				fc-&gt;async_read = 1;</div><div class='del'>-			if (!(arg-&gt;flags &amp; FUSE_POSIX_LOCKS))</div><div class='add'>+			if (!(flags &amp; FUSE_POSIX_LOCKS))</div><div class='ctx'> 				fc-&gt;no_lock = 1;</div><div class='ctx'> 			if (arg-&gt;minor &gt;= 17) {</div><div class='del'>-				if (!(arg-&gt;flags &amp; FUSE_FLOCK_LOCKS))</div><div class='add'>+				if (!(flags &amp; FUSE_FLOCK_LOCKS))</div><div class='ctx'> 					fc-&gt;no_flock = 1;</div><div class='ctx'> 			} else {</div><div class='del'>-				if (!(arg-&gt;flags &amp; FUSE_POSIX_LOCKS))</div><div class='add'>+				if (!(flags &amp; FUSE_POSIX_LOCKS))</div><div class='ctx'> 					fc-&gt;no_flock = 1;</div><div class='ctx'> 			}</div><div class='del'>-			if (arg-&gt;flags &amp; FUSE_ATOMIC_O_TRUNC)</div><div class='add'>+			if (flags &amp; FUSE_ATOMIC_O_TRUNC)</div><div class='ctx'> 				fc-&gt;atomic_o_trunc = 1;</div><div class='ctx'> 			if (arg-&gt;minor &gt;= 9) {</div><div class='ctx'> 				/* LOOKUP has dependency on proto version */</div><div class='del'>-				if (arg-&gt;flags &amp; FUSE_EXPORT_SUPPORT)</div><div class='add'>+				if (flags &amp; FUSE_EXPORT_SUPPORT)</div><div class='ctx'> 					fc-&gt;export_support = 1;</div><div class='ctx'> 			}</div><div class='del'>-			if (arg-&gt;flags &amp; FUSE_BIG_WRITES)</div><div class='add'>+			if (flags &amp; FUSE_BIG_WRITES)</div><div class='ctx'> 				fc-&gt;big_writes = 1;</div><div class='del'>-			if (arg-&gt;flags &amp; FUSE_DONT_MASK)</div><div class='add'>+			if (flags &amp; FUSE_DONT_MASK)</div><div class='ctx'> 				fc-&gt;dont_mask = 1;</div><div class='del'>-			if (arg-&gt;flags &amp; FUSE_AUTO_INVAL_DATA)</div><div class='add'>+			if (flags &amp; FUSE_AUTO_INVAL_DATA)</div><div class='ctx'> 				fc-&gt;auto_inval_data = 1;</div><div class='del'>-			else if (arg-&gt;flags &amp; FUSE_EXPLICIT_INVAL_DATA)</div><div class='add'>+			else if (flags &amp; FUSE_EXPLICIT_INVAL_DATA)</div><div class='ctx'> 				fc-&gt;explicit_inval_data = 1;</div><div class='del'>-			if (arg-&gt;flags &amp; FUSE_DO_READDIRPLUS) {</div><div class='add'>+			if (flags &amp; FUSE_DO_READDIRPLUS) {</div><div class='ctx'> 				fc-&gt;do_readdirplus = 1;</div><div class='del'>-				if (arg-&gt;flags &amp; FUSE_READDIRPLUS_AUTO)</div><div class='add'>+				if (flags &amp; FUSE_READDIRPLUS_AUTO)</div><div class='ctx'> 					fc-&gt;readdirplus_auto = 1;</div><div class='ctx'> 			}</div><div class='del'>-			if (arg-&gt;flags &amp; FUSE_ASYNC_DIO)</div><div class='add'>+			if (flags &amp; FUSE_ASYNC_DIO)</div><div class='ctx'> 				fc-&gt;async_dio = 1;</div><div class='del'>-			if (arg-&gt;flags &amp; FUSE_WRITEBACK_CACHE)</div><div class='add'>+			if (flags &amp; FUSE_WRITEBACK_CACHE)</div><div class='ctx'> 				fc-&gt;writeback_cache = 1;</div><div class='del'>-			if (arg-&gt;flags &amp; FUSE_PARALLEL_DIROPS)</div><div class='add'>+			if (flags &amp; FUSE_PARALLEL_DIROPS)</div><div class='ctx'> 				fc-&gt;parallel_dirops = 1;</div><div class='del'>-			if (arg-&gt;flags &amp; FUSE_HANDLE_KILLPRIV)</div><div class='add'>+			if (flags &amp; FUSE_HANDLE_KILLPRIV)</div><div class='ctx'> 				fc-&gt;handle_killpriv = 1;</div><div class='ctx'> 			if (arg-&gt;time_gran &amp;&amp; arg-&gt;time_gran &lt;= 1000000000)</div><div class='ctx'> 				fm-&gt;sb-&gt;s_time_gran = arg-&gt;time_gran;</div><div class='del'>-			if ((arg-&gt;flags &amp; FUSE_POSIX_ACL)) {</div><div class='add'>+			if ((flags &amp; FUSE_POSIX_ACL)) {</div><div class='ctx'> 				fc-&gt;default_permissions = 1;</div><div class='ctx'> 				fc-&gt;posix_acl = 1;</div><div class='del'>-				fm-&gt;sb-&gt;s_xattr = fuse_acl_xattr_handlers;</div><div class='ctx'> 			}</div><div class='del'>-			if (arg-&gt;flags &amp; FUSE_CACHE_SYMLINKS)</div><div class='add'>+			if (flags &amp; FUSE_CACHE_SYMLINKS)</div><div class='ctx'> 				fc-&gt;cache_symlinks = 1;</div><div class='del'>-			if (arg-&gt;flags &amp; FUSE_ABORT_ERROR)</div><div class='add'>+			if (flags &amp; FUSE_ABORT_ERROR)</div><div class='ctx'> 				fc-&gt;abort_err = 1;</div><div class='del'>-			if (arg-&gt;flags &amp; FUSE_MAX_PAGES) {</div><div class='add'>+			if (flags &amp; FUSE_MAX_PAGES) {</div><div class='ctx'> 				fc-&gt;max_pages =</div><div class='ctx'> 					min_t(unsigned int, fc-&gt;max_pages_limit,</div><div class='ctx'> 					max_t(unsigned int, arg-&gt;max_pages, 1));</div><div class='add'>+</div><div class='add'>+				/*</div><div class='add'>+				 * PATH_MAX file names might need two pages for</div><div class='add'>+				 * ops like rename</div><div class='add'>+				 */</div><div class='add'>+				if (fc-&gt;max_pages &gt; 1)</div><div class='add'>+					fc-&gt;name_max = FUSE_NAME_MAX;</div><div class='ctx'> 			}</div><div class='del'>-			if (IS_ENABLED(CONFIG_FUSE_DAX) &amp;&amp;</div><div class='del'>-			    arg-&gt;flags &amp; FUSE_MAP_ALIGNMENT &amp;&amp;</div><div class='del'>-			    !fuse_dax_check_alignment(fc, arg-&gt;map_alignment)) {</div><div class='del'>-				ok = false;</div><div class='add'>+			if (IS_ENABLED(CONFIG_FUSE_DAX)) {</div><div class='add'>+				if (flags &amp; FUSE_MAP_ALIGNMENT &amp;&amp;</div><div class='add'>+				    !fuse_dax_check_alignment(fc, arg-&gt;map_alignment)) {</div><div class='add'>+					ok = false;</div><div class='add'>+				}</div><div class='add'>+				if (flags &amp; FUSE_HAS_INODE_DAX)</div><div class='add'>+					fc-&gt;inode_dax = 1;</div><div class='ctx'> 			}</div><div class='del'>-			if (arg-&gt;flags &amp; FUSE_HANDLE_KILLPRIV_V2) {</div><div class='add'>+			if (flags &amp; FUSE_HANDLE_KILLPRIV_V2) {</div><div class='ctx'> 				fc-&gt;handle_killpriv_v2 = 1;</div><div class='ctx'> 				fm-&gt;sb-&gt;s_flags |= SB_NOSEC;</div><div class='ctx'> 			}</div><div class='del'>-			if (arg-&gt;flags &amp; FUSE_SETXATTR_EXT)</div><div class='add'>+			if (flags &amp; FUSE_SETXATTR_EXT)</div><div class='ctx'> 				fc-&gt;setxattr_ext = 1;</div><div class='add'>+			if (flags &amp; FUSE_SECURITY_CTX)</div><div class='add'>+				fc-&gt;init_security = 1;</div><div class='add'>+			if (flags &amp; FUSE_CREATE_SUPP_GROUP)</div><div class='add'>+				fc-&gt;create_supp_group = 1;</div><div class='add'>+			if (flags &amp; FUSE_DIRECT_IO_ALLOW_MMAP)</div><div class='add'>+				fc-&gt;direct_io_allow_mmap = 1;</div><div class='add'>+			/*</div><div class='add'>+			 * max_stack_depth is the max stack depth of FUSE fs,</div><div class='add'>+			 * so it has to be at least 1 to support passthrough</div><div class='add'>+			 * to backing files.</div><div class='add'>+			 *</div><div class='add'>+			 * with max_stack_depth &gt; 1, the backing files can be</div><div class='add'>+			 * on a stacked fs (e.g. overlayfs) themselves and with</div><div class='add'>+			 * max_stack_depth == 1, FUSE fs can be stacked as the</div><div class='add'>+			 * underlying fs of a stacked fs (e.g. overlayfs).</div><div class='add'>+			 *</div><div class='add'>+			 * Also don't allow the combination of FUSE_PASSTHROUGH</div><div class='add'>+			 * and FUSE_WRITEBACK_CACHE, current design doesn't handle</div><div class='add'>+			 * them together.</div><div class='add'>+			 */</div><div class='add'>+			if (IS_ENABLED(CONFIG_FUSE_PASSTHROUGH) &amp;&amp;</div><div class='add'>+			    (flags &amp; FUSE_PASSTHROUGH) &amp;&amp;</div><div class='add'>+			    arg-&gt;max_stack_depth &gt; 0 &amp;&amp;</div><div class='add'>+			    arg-&gt;max_stack_depth &lt;= FILESYSTEM_MAX_STACK_DEPTH &amp;&amp;</div><div class='add'>+			    !(flags &amp; FUSE_WRITEBACK_CACHE))  {</div><div class='add'>+				fc-&gt;passthrough = 1;</div><div class='add'>+				fc-&gt;max_stack_depth = arg-&gt;max_stack_depth;</div><div class='add'>+				fm-&gt;sb-&gt;s_stack_depth = arg-&gt;max_stack_depth;</div><div class='add'>+			}</div><div class='add'>+			if (flags &amp; FUSE_NO_EXPORT_SUPPORT)</div><div class='add'>+				fm-&gt;sb-&gt;s_export_op = &amp;fuse_export_fid_operations;</div><div class='add'>+			if (flags &amp; FUSE_ALLOW_IDMAP) {</div><div class='add'>+				if (fc-&gt;default_permissions)</div><div class='add'>+					fm-&gt;sb-&gt;s_iflags &amp;= ~SB_I_NOIDMAP;</div><div class='add'>+				else</div><div class='add'>+					ok = false;</div><div class='add'>+			}</div><div class='add'>+			if (flags &amp; FUSE_OVER_IO_URING &amp;&amp; fuse_uring_enabled())</div><div class='add'>+				fc-&gt;io_uring = 1;</div><div class='add'>+</div><div class='add'>+			if (flags &amp; FUSE_REQUEST_TIMEOUT)</div><div class='add'>+				timeout = arg-&gt;request_timeout;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			ra_pages = fc-&gt;max_read / PAGE_SIZE;</div><div class='ctx'> 			fc-&gt;no_lock = 1;</div><div class='ctx'> 			fc-&gt;no_flock = 1;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		init_server_timeout(fc, timeout);</div><div class='add'>+</div><div class='ctx'> 		fm-&gt;sb-&gt;s_bdi-&gt;ra_pages =</div><div class='ctx'> 				min(fm-&gt;sb-&gt;s_bdi-&gt;ra_pages, ra_pages);</div><div class='ctx'> 		fc-&gt;minor = arg-&gt;minor;</div><div class='hunk'>@@ -1200,16 +1482,17 @@ static void process_init_reply(struct fuse_mount *fm, struct fuse_args *args,</div><div class='ctx'> 	wake_up_all(&amp;fc-&gt;blocked_waitq);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void fuse_send_init(struct fuse_mount *fm)</div><div class='add'>+static struct fuse_init_args *fuse_new_init(struct fuse_mount *fm)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_init_args *ia;</div><div class='add'>+	u64 flags;</div><div class='ctx'> </div><div class='ctx'> 	ia = kzalloc(sizeof(*ia), GFP_KERNEL | __GFP_NOFAIL);</div><div class='ctx'> </div><div class='ctx'> 	ia-&gt;in.major = FUSE_KERNEL_VERSION;</div><div class='ctx'> 	ia-&gt;in.minor = FUSE_KERNEL_MINOR_VERSION;</div><div class='ctx'> 	ia-&gt;in.max_readahead = fm-&gt;sb-&gt;s_bdi-&gt;ra_pages * PAGE_SIZE;</div><div class='del'>-	ia-&gt;in.flags |=</div><div class='add'>+	flags =</div><div class='ctx'> 		FUSE_ASYNC_READ | FUSE_POSIX_LOCKS | FUSE_ATOMIC_O_TRUNC |</div><div class='ctx'> 		FUSE_EXPORT_SUPPORT | FUSE_BIG_WRITES | FUSE_DONT_MASK |</div><div class='ctx'> 		FUSE_SPLICE_WRITE | FUSE_SPLICE_MOVE | FUSE_SPLICE_READ |</div><div class='hunk'>@@ -1219,13 +1502,31 @@ void fuse_send_init(struct fuse_mount *fm)</div><div class='ctx'> 		FUSE_PARALLEL_DIROPS | FUSE_HANDLE_KILLPRIV | FUSE_POSIX_ACL |</div><div class='ctx'> 		FUSE_ABORT_ERROR | FUSE_MAX_PAGES | FUSE_CACHE_SYMLINKS |</div><div class='ctx'> 		FUSE_NO_OPENDIR_SUPPORT | FUSE_EXPLICIT_INVAL_DATA |</div><div class='del'>-		FUSE_HANDLE_KILLPRIV_V2 | FUSE_SETXATTR_EXT;</div><div class='add'>+		FUSE_HANDLE_KILLPRIV_V2 | FUSE_SETXATTR_EXT | FUSE_INIT_EXT |</div><div class='add'>+		FUSE_SECURITY_CTX | FUSE_CREATE_SUPP_GROUP |</div><div class='add'>+		FUSE_HAS_EXPIRE_ONLY | FUSE_DIRECT_IO_ALLOW_MMAP |</div><div class='add'>+		FUSE_NO_EXPORT_SUPPORT | FUSE_HAS_RESEND | FUSE_ALLOW_IDMAP |</div><div class='add'>+		FUSE_REQUEST_TIMEOUT;</div><div class='ctx'> #ifdef CONFIG_FUSE_DAX</div><div class='ctx'> 	if (fm-&gt;fc-&gt;dax)</div><div class='del'>-		ia-&gt;in.flags |= FUSE_MAP_ALIGNMENT;</div><div class='add'>+		flags |= FUSE_MAP_ALIGNMENT;</div><div class='add'>+	if (fuse_is_inode_dax_mode(fm-&gt;fc-&gt;dax_mode))</div><div class='add'>+		flags |= FUSE_HAS_INODE_DAX;</div><div class='ctx'> #endif</div><div class='ctx'> 	if (fm-&gt;fc-&gt;auto_submounts)</div><div class='del'>-		ia-&gt;in.flags |= FUSE_SUBMOUNTS;</div><div class='add'>+		flags |= FUSE_SUBMOUNTS;</div><div class='add'>+	if (IS_ENABLED(CONFIG_FUSE_PASSTHROUGH))</div><div class='add'>+		flags |= FUSE_PASSTHROUGH;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This is just an information flag for fuse server. No need to check</div><div class='add'>+	 * the reply - server is either sending IORING_OP_URING_CMD or not.</div><div class='add'>+	 */</div><div class='add'>+	if (fuse_uring_enabled())</div><div class='add'>+		flags |= FUSE_OVER_IO_URING;</div><div class='add'>+</div><div class='add'>+	ia-&gt;in.flags = flags;</div><div class='add'>+	ia-&gt;in.flags2 = flags &gt;&gt; 32;</div><div class='ctx'> </div><div class='ctx'> 	ia-&gt;args.opcode = FUSE_INIT;</div><div class='ctx'> 	ia-&gt;args.in_numargs = 1;</div><div class='hunk'>@@ -1240,17 +1541,37 @@ void fuse_send_init(struct fuse_mount *fm)</div><div class='ctx'> 	ia-&gt;args.out_args[0].value = &amp;ia-&gt;out;</div><div class='ctx'> 	ia-&gt;args.force = true;</div><div class='ctx'> 	ia-&gt;args.nocreds = true;</div><div class='del'>-	ia-&gt;args.end = process_init_reply;</div><div class='ctx'> </div><div class='del'>-	if (fuse_simple_background(fm, &amp;ia-&gt;args, GFP_KERNEL) != 0)</div><div class='del'>-		process_init_reply(fm, &amp;ia-&gt;args, -ENOTCONN);</div><div class='add'>+	return ia;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int fuse_send_init(struct fuse_mount *fm)</div><div class='add'>+{</div><div class='add'>+	struct fuse_init_args *ia = fuse_new_init(fm);</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	if (fm-&gt;fc-&gt;sync_init) {</div><div class='add'>+		err = fuse_simple_request(fm, &amp;ia-&gt;args);</div><div class='add'>+		/* Ignore size of init reply */</div><div class='add'>+		if (err &gt; 0)</div><div class='add'>+			err = 0;</div><div class='add'>+	} else {</div><div class='add'>+		ia-&gt;args.end = process_init_reply;</div><div class='add'>+		err = fuse_simple_background(fm, &amp;ia-&gt;args, GFP_KERNEL);</div><div class='add'>+		if (!err)</div><div class='add'>+			return 0;</div><div class='add'>+	}</div><div class='add'>+	process_init_reply(fm, &amp;ia-&gt;args, err);</div><div class='add'>+	if (fm-&gt;fc-&gt;conn_error)</div><div class='add'>+		return -ENOTCONN;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(fuse_send_init);</div><div class='ctx'> </div><div class='ctx'> void fuse_free_conn(struct fuse_conn *fc)</div><div class='ctx'> {</div><div class='ctx'> 	WARN_ON(!list_empty(&amp;fc-&gt;devices));</div><div class='del'>-	kfree_rcu(fc, rcu);</div><div class='add'>+	kfree(fc);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(fuse_free_conn);</div><div class='ctx'> </div><div class='hunk'>@@ -1273,8 +1594,6 @@ static int fuse_bdi_init(struct fuse_conn *fc, struct super_block *sb)</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	/* fuse does it's own writeback accounting */</div><div class='del'>-	sb-&gt;s_bdi-&gt;capabilities &amp;= ~BDI_CAP_WRITEBACK_ACCT;</div><div class='ctx'> 	sb-&gt;s_bdi-&gt;capabilities |= BDI_CAP_STRICTLIMIT;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1357,20 +1676,24 @@ EXPORT_SYMBOL_GPL(fuse_dev_free);</div><div class='ctx'> static void fuse_fill_attr_from_inode(struct fuse_attr *attr,</div><div class='ctx'> 				      const struct fuse_inode *fi)</div><div class='ctx'> {</div><div class='add'>+	struct timespec64 atime = inode_get_atime(&amp;fi-&gt;inode);</div><div class='add'>+	struct timespec64 mtime = inode_get_mtime(&amp;fi-&gt;inode);</div><div class='add'>+	struct timespec64 ctime = inode_get_ctime(&amp;fi-&gt;inode);</div><div class='add'>+</div><div class='ctx'> 	*attr = (struct fuse_attr){</div><div class='ctx'> 		.ino		= fi-&gt;inode.i_ino,</div><div class='ctx'> 		.size		= fi-&gt;inode.i_size,</div><div class='ctx'> 		.blocks		= fi-&gt;inode.i_blocks,</div><div class='del'>-		.atime		= fi-&gt;inode.i_atime.tv_sec,</div><div class='del'>-		.mtime		= fi-&gt;inode.i_mtime.tv_sec,</div><div class='del'>-		.ctime		= fi-&gt;inode.i_ctime.tv_sec,</div><div class='del'>-		.atimensec	= fi-&gt;inode.i_atime.tv_nsec,</div><div class='del'>-		.mtimensec	= fi-&gt;inode.i_mtime.tv_nsec,</div><div class='del'>-		.ctimensec	= fi-&gt;inode.i_ctime.tv_nsec,</div><div class='add'>+		.atime		= atime.tv_sec,</div><div class='add'>+		.mtime		= mtime.tv_sec,</div><div class='add'>+		.ctime		= ctime.tv_sec,</div><div class='add'>+		.atimensec	= atime.tv_nsec,</div><div class='add'>+		.mtimensec	= mtime.tv_nsec,</div><div class='add'>+		.ctimensec	= ctime.tv_nsec,</div><div class='ctx'> 		.mode		= fi-&gt;inode.i_mode,</div><div class='ctx'> 		.nlink		= fi-&gt;inode.i_nlink,</div><div class='del'>-		.uid		= fi-&gt;inode.i_uid.val,</div><div class='del'>-		.gid		= fi-&gt;inode.i_gid.val,</div><div class='add'>+		.uid		= __kuid_val(fi-&gt;inode.i_uid),</div><div class='add'>+		.gid		= __kgid_val(fi-&gt;inode.i_gid),</div><div class='ctx'> 		.rdev		= fi-&gt;inode.i_rdev,</div><div class='ctx'> 		.blksize	= 1u &lt;&lt; fi-&gt;inode.i_blkbits,</div><div class='ctx'> 	};</div><div class='hunk'>@@ -1385,16 +1708,10 @@ static void fuse_sb_defaults(struct super_block *sb)</div><div class='ctx'> 	sb-&gt;s_time_gran = 1;</div><div class='ctx'> 	sb-&gt;s_export_op = &amp;fuse_export_operations;</div><div class='ctx'> 	sb-&gt;s_iflags |= SB_I_IMA_UNVERIFIABLE_SIGNATURE;</div><div class='add'>+	sb-&gt;s_iflags |= SB_I_NOIDMAP;</div><div class='ctx'> 	if (sb-&gt;s_user_ns != &amp;init_user_ns)</div><div class='ctx'> 		sb-&gt;s_iflags |= SB_I_UNTRUSTED_MOUNTER;</div><div class='ctx'> 	sb-&gt;s_flags &amp;= ~(SB_NOSEC | SB_I_VERSION);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If we are not in the initial user namespace posix</div><div class='del'>-	 * acls must be translated.</div><div class='del'>-	 */</div><div class='del'>-	if (sb-&gt;s_user_ns != &amp;init_user_ns)</div><div class='del'>-		sb-&gt;s_xattr = fuse_no_acl_xattr_handlers;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int fuse_fill_super_submount(struct super_block *sb,</div><div class='hunk'>@@ -1404,6 +1721,8 @@ static int fuse_fill_super_submount(struct super_block *sb,</div><div class='ctx'> 	struct super_block *parent_sb = parent_fi-&gt;inode.i_sb;</div><div class='ctx'> 	struct fuse_attr root_attr;</div><div class='ctx'> 	struct inode *root;</div><div class='add'>+	struct fuse_submount_lookup *sl;</div><div class='add'>+	struct fuse_inode *fi;</div><div class='ctx'> </div><div class='ctx'> 	fuse_sb_defaults(sb);</div><div class='ctx'> 	fm-&gt;sb = sb;</div><div class='hunk'>@@ -1412,6 +1731,7 @@ static int fuse_fill_super_submount(struct super_block *sb,</div><div class='ctx'> 	sb-&gt;s_bdi = bdi_get(parent_sb-&gt;s_bdi);</div><div class='ctx'> </div><div class='ctx'> 	sb-&gt;s_xattr = parent_sb-&gt;s_xattr;</div><div class='add'>+	sb-&gt;s_export_op = parent_sb-&gt;s_export_op;</div><div class='ctx'> 	sb-&gt;s_time_gran = parent_sb-&gt;s_time_gran;</div><div class='ctx'> 	sb-&gt;s_blocksize = parent_sb-&gt;s_blocksize;</div><div class='ctx'> 	sb-&gt;s_blocksize_bits = parent_sb-&gt;s_blocksize_bits;</div><div class='hunk'>@@ -1420,18 +1740,34 @@ static int fuse_fill_super_submount(struct super_block *sb,</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	fuse_fill_attr_from_inode(&amp;root_attr, parent_fi);</div><div class='del'>-	root = fuse_iget(sb, parent_fi-&gt;nodeid, 0, &amp;root_attr, 0, 0);</div><div class='add'>+	root = fuse_iget(sb, parent_fi-&gt;nodeid, 0, &amp;root_attr, 0, 0,</div><div class='add'>+			 fuse_get_evict_ctr(fm-&gt;fc));</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * This inode is just a duplicate, so it is not looked up and</div><div class='ctx'> 	 * its nlookup should not be incremented.  fuse_iget() does</div><div class='ctx'> 	 * that, though, so undo it here.</div><div class='ctx'> 	 */</div><div class='del'>-	get_fuse_inode(root)-&gt;nlookup--;</div><div class='del'>-	sb-&gt;s_d_op = &amp;fuse_dentry_operations;</div><div class='add'>+	fi = get_fuse_inode(root);</div><div class='add'>+	fi-&gt;nlookup--;</div><div class='add'>+</div><div class='add'>+	set_default_d_op(sb, &amp;fuse_dentry_operations);</div><div class='ctx'> 	sb-&gt;s_root = d_make_root(root);</div><div class='ctx'> 	if (!sb-&gt;s_root)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Grab the parent's submount_lookup pointer and take a</div><div class='add'>+	 * reference on the shared nlookup from the parent.  This is to</div><div class='add'>+	 * prevent the last forget for this nodeid from getting</div><div class='add'>+	 * triggered until all users have finished with it.</div><div class='add'>+	 */</div><div class='add'>+	sl = parent_fi-&gt;submount_lookup;</div><div class='add'>+	WARN_ON(!sl);</div><div class='add'>+	if (sl) {</div><div class='add'>+		refcount_inc(&amp;sl-&gt;count);</div><div class='add'>+		fi-&gt;submount_lookup = sl;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1506,6 +1842,7 @@ int fuse_fill_super_common(struct super_block *sb, struct fuse_fs_context *ctx)</div><div class='ctx'> 		if (!sb_set_blocksize(sb, ctx-&gt;blksize))</div><div class='ctx'> 			goto err;</div><div class='ctx'> #endif</div><div class='add'>+		fc-&gt;sync_fs = 1;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		sb-&gt;s_blocksize = PAGE_SIZE;</div><div class='ctx'> 		sb-&gt;s_blocksize_bits = PAGE_SHIFT;</div><div class='hunk'>@@ -1514,7 +1851,7 @@ int fuse_fill_super_common(struct super_block *sb, struct fuse_fs_context *ctx)</div><div class='ctx'> 	sb-&gt;s_subtype = ctx-&gt;subtype;</div><div class='ctx'> 	ctx-&gt;subtype = NULL;</div><div class='ctx'> 	if (IS_ENABLED(CONFIG_FUSE_DAX)) {</div><div class='del'>-		err = fuse_dax_conn_alloc(fc, ctx-&gt;dax_dev);</div><div class='add'>+		err = fuse_dax_conn_alloc(fc, ctx-&gt;dax_mode, ctx-&gt;dax_dev);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto err;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1549,17 +1886,19 @@ int fuse_fill_super_common(struct super_block *sb, struct fuse_fs_context *ctx)</div><div class='ctx'> </div><div class='ctx'> 	err = -ENOMEM;</div><div class='ctx'> 	root = fuse_get_root_inode(sb, ctx-&gt;rootmode);</div><div class='del'>-	sb-&gt;s_d_op = &amp;fuse_root_dentry_operations;</div><div class='add'>+	set_default_d_op(sb, &amp;fuse_dentry_operations);</div><div class='ctx'> 	root_dentry = d_make_root(root);</div><div class='ctx'> 	if (!root_dentry)</div><div class='ctx'> 		goto err_dev_free;</div><div class='del'>-	/* Root dentry doesn't have .d_revalidate */</div><div class='del'>-	sb-&gt;s_d_op = &amp;fuse_dentry_operations;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;fuse_mutex);</div><div class='ctx'> 	err = -EINVAL;</div><div class='del'>-	if (ctx-&gt;fudptr &amp;&amp; *ctx-&gt;fudptr)</div><div class='del'>-		goto err_unlock;</div><div class='add'>+	if (ctx-&gt;fudptr &amp;&amp; *ctx-&gt;fudptr) {</div><div class='add'>+		if (*ctx-&gt;fudptr == FUSE_DEV_SYNC_INIT)</div><div class='add'>+			fc-&gt;sync_init = 1;</div><div class='add'>+		else</div><div class='add'>+			goto err_unlock;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	err = fuse_ctl_add_conn(fc);</div><div class='ctx'> 	if (err)</div><div class='hunk'>@@ -1567,8 +1906,10 @@ int fuse_fill_super_common(struct super_block *sb, struct fuse_fs_context *ctx)</div><div class='ctx'> </div><div class='ctx'> 	list_add_tail(&amp;fc-&gt;entry, &amp;fuse_conn_list);</div><div class='ctx'> 	sb-&gt;s_root = root_dentry;</div><div class='del'>-	if (ctx-&gt;fudptr)</div><div class='add'>+	if (ctx-&gt;fudptr) {</div><div class='ctx'> 		*ctx-&gt;fudptr = fud;</div><div class='add'>+		wake_up_all(&amp;fuse_dev_waitq);</div><div class='add'>+	}</div><div class='ctx'> 	mutex_unlock(&amp;fuse_mutex);</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='hunk'>@@ -1589,6 +1930,7 @@ EXPORT_SYMBOL_GPL(fuse_fill_super_common);</div><div class='ctx'> static int fuse_fill_super(struct super_block *sb, struct fs_context *fsc)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_fs_context *ctx = fsc-&gt;fs_private;</div><div class='add'>+	struct fuse_mount *fm;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (!ctx-&gt;file || !ctx-&gt;rootmode_present ||</div><div class='hunk'>@@ -1609,8 +1951,10 @@ static int fuse_fill_super(struct super_block *sb, struct fs_context *fsc)</div><div class='ctx'> 		return err;</div><div class='ctx'> 	/* file-&gt;private_data shall be visible on all CPUs after this */</div><div class='ctx'> 	smp_mb();</div><div class='del'>-	fuse_send_init(get_fuse_mount_super(sb));</div><div class='del'>-	return 0;</div><div class='add'>+</div><div class='add'>+	fm = get_fuse_mount_super(sb);</div><div class='add'>+</div><div class='add'>+	return fuse_send_init(fm);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1671,7 +2015,7 @@ static int fuse_get_tree(struct fs_context *fsc)</div><div class='ctx'> 	 * Allow creating a fuse mount with an already initialized fuse</div><div class='ctx'> 	 * connection</div><div class='ctx'> 	 */</div><div class='del'>-	fud = READ_ONCE(ctx-&gt;file-&gt;private_data);</div><div class='add'>+	fud = __fuse_get_dev(ctx-&gt;file);</div><div class='ctx'> 	if (ctx-&gt;file-&gt;f_op == &amp;fuse_dev_operations &amp;&amp; fud) {</div><div class='ctx'> 		fsc-&gt;sget_key = fud-&gt;fc;</div><div class='ctx'> 		sb = sget_fc(fsc, fuse_test_super, fuse_set_no_super);</div><div class='hunk'>@@ -1772,7 +2116,7 @@ static void fuse_sb_destroy(struct super_block *sb)</div><div class='ctx'> void fuse_mount_destroy(struct fuse_mount *fm)</div><div class='ctx'> {</div><div class='ctx'> 	fuse_conn_put(fm-&gt;fc);</div><div class='del'>-	kfree(fm);</div><div class='add'>+	kfree_rcu(fm, rcu);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(fuse_mount_destroy);</div><div class='ctx'> </div><div class='hunk'>@@ -1786,7 +2130,7 @@ static void fuse_kill_sb_anon(struct super_block *sb)</div><div class='ctx'> static struct file_system_type fuse_fs_type = {</div><div class='ctx'> 	.owner		= THIS_MODULE,</div><div class='ctx'> 	.name		= "fuse",</div><div class='del'>-	.fs_flags	= FS_HAS_SUBTYPE | FS_USERNS_MOUNT,</div><div class='add'>+	.fs_flags	= FS_HAS_SUBTYPE | FS_USERNS_MOUNT | FS_ALLOW_IDMAP,</div><div class='ctx'> 	.init_fs_context = fuse_init_fs_context,</div><div class='ctx'> 	.parameters	= fuse_fs_parameters,</div><div class='ctx'> 	.kill_sb	= fuse_kill_sb_anon,</div><div class='hunk'>@@ -1807,7 +2151,7 @@ static struct file_system_type fuseblk_fs_type = {</div><div class='ctx'> 	.init_fs_context = fuse_init_fs_context,</div><div class='ctx'> 	.parameters	= fuse_fs_parameters,</div><div class='ctx'> 	.kill_sb	= fuse_kill_sb_blk,</div><div class='del'>-	.fs_flags	= FS_REQUIRES_DEV | FS_HAS_SUBTYPE,</div><div class='add'>+	.fs_flags	= FS_REQUIRES_DEV | FS_HAS_SUBTYPE | FS_ALLOW_IDMAP,</div><div class='ctx'> };</div><div class='ctx'> MODULE_ALIAS_FS("fuseblk");</div><div class='ctx'> </div><div class='hunk'>@@ -1858,8 +2202,14 @@ static int __init fuse_fs_init(void)</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out3;</div><div class='ctx'> </div><div class='add'>+	err = fuse_sysctl_register();</div><div class='add'>+	if (err)</div><div class='add'>+		goto out4;</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='add'>+ out4:</div><div class='add'>+	unregister_filesystem(&amp;fuse_fs_type);</div><div class='ctx'>  out3:</div><div class='ctx'> 	unregister_fuseblk();</div><div class='ctx'>  out2:</div><div class='hunk'>@@ -1870,6 +2220,7 @@ static int __init fuse_fs_init(void)</div><div class='ctx'> </div><div class='ctx'> static void fuse_fs_cleanup(void)</div><div class='ctx'> {</div><div class='add'>+	fuse_sysctl_unregister();</div><div class='ctx'> 	unregister_filesystem(&amp;fuse_fs_type);</div><div class='ctx'> 	unregister_fuseblk();</div><div class='ctx'> </div><div class='hunk'>@@ -1935,6 +2286,8 @@ static int __init fuse_init(void)</div><div class='ctx'> 	if (res)</div><div class='ctx'> 		goto err_sysfs_cleanup;</div><div class='ctx'> </div><div class='add'>+	fuse_dentry_tree_init();</div><div class='add'>+</div><div class='ctx'> 	sanitize_global_limit(&amp;max_user_bgreq);</div><div class='ctx'> 	sanitize_global_limit(&amp;max_user_congthresh);</div><div class='ctx'> </div><div class='hunk'>@@ -1954,6 +2307,7 @@ static void __exit fuse_exit(void)</div><div class='ctx'> {</div><div class='ctx'> 	pr_debug("exit\n");</div><div class='ctx'> </div><div class='add'>+	fuse_dentry_tree_cleanup();</div><div class='ctx'> 	fuse_ctl_cleanup();</div><div class='ctx'> 	fuse_sysfs_cleanup();</div><div class='ctx'> 	fuse_fs_cleanup();</div><div class='head'>diff --git a/fs/fuse/ioctl.c b/fs/fuse/ioctl.c<br/>index fbc09dab1f85..fdc175e93f74 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fuse/ioctl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/ioctl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fuse/ioctl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fuse/ioctl.c</a></div><div class='hunk'>@@ -8,6 +8,29 @@</div><div class='ctx'> #include &lt;linux/uio.h&gt;</div><div class='ctx'> #include &lt;linux/compat.h&gt;</div><div class='ctx'> #include &lt;linux/fileattr.h&gt;</div><div class='add'>+#include &lt;linux/fsverity.h&gt;</div><div class='add'>+</div><div class='add'>+#define FUSE_VERITY_ENABLE_ARG_MAX_PAGES 256</div><div class='add'>+</div><div class='add'>+static ssize_t fuse_send_ioctl(struct fuse_mount *fm, struct fuse_args *args,</div><div class='add'>+			       struct fuse_ioctl_out *outarg)</div><div class='add'>+{</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	args-&gt;out_args[0].size = sizeof(*outarg);</div><div class='add'>+	args-&gt;out_args[0].value = outarg;</div><div class='add'>+</div><div class='add'>+	ret = fuse_simple_request(fm, args);</div><div class='add'>+</div><div class='add'>+	/* Translate ENOSYS, which shouldn't be returned from fs */</div><div class='add'>+	if (ret == -ENOSYS)</div><div class='add'>+		ret = -ENOTTY;</div><div class='add'>+</div><div class='add'>+	if (ret &gt;= 0 &amp;&amp; outarg-&gt;result == -ENOSYS)</div><div class='add'>+		outarg-&gt;result = -ENOTTY;</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * CUSE servers compiled on 32bit broke on 64bit kernels because the</div><div class='hunk'>@@ -97,6 +120,53 @@ static int fuse_copy_ioctl_iovec(struct fuse_conn *fc, struct iovec *dst,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/* For fs-verity, determine iov lengths from input */</div><div class='add'>+static int fuse_setup_measure_verity(unsigned long arg, struct iovec *iov)</div><div class='add'>+{</div><div class='add'>+	__u16 digest_size;</div><div class='add'>+	struct fsverity_digest __user *uarg = (void __user *)arg;</div><div class='add'>+</div><div class='add'>+	if (copy_from_user(&amp;digest_size, &amp;uarg-&gt;digest_size, sizeof(digest_size)))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+</div><div class='add'>+	if (digest_size &gt; SIZE_MAX - sizeof(struct fsverity_digest))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	iov-&gt;iov_len = sizeof(struct fsverity_digest) + digest_size;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int fuse_setup_enable_verity(unsigned long arg, struct iovec *iov,</div><div class='add'>+				    unsigned int *in_iovs)</div><div class='add'>+{</div><div class='add'>+	struct fsverity_enable_arg enable;</div><div class='add'>+	struct fsverity_enable_arg __user *uarg = (void __user *)arg;</div><div class='add'>+	const __u32 max_buffer_len = FUSE_VERITY_ENABLE_ARG_MAX_PAGES * PAGE_SIZE;</div><div class='add'>+</div><div class='add'>+	if (copy_from_user(&amp;enable, uarg, sizeof(enable)))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+</div><div class='add'>+	if (enable.salt_size &gt; max_buffer_len || enable.sig_size &gt; max_buffer_len)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	if (enable.salt_size &gt; 0) {</div><div class='add'>+		iov++;</div><div class='add'>+		(*in_iovs)++;</div><div class='add'>+</div><div class='add'>+		iov-&gt;iov_base = u64_to_user_ptr(enable.salt_ptr);</div><div class='add'>+		iov-&gt;iov_len = enable.salt_size;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (enable.sig_size &gt; 0) {</div><div class='add'>+		iov++;</div><div class='add'>+		(*in_iovs)++;</div><div class='add'>+</div><div class='add'>+		iov-&gt;iov_base = u64_to_user_ptr(enable.sig_ptr);</div><div class='add'>+		iov-&gt;iov_len = enable.sig_size;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * For ioctls, there is no generic way to determine how much memory</div><div class='hunk'>@@ -170,7 +240,7 @@ long fuse_do_ioctl(struct file *file, unsigned int cmd, unsigned long arg,</div><div class='ctx'> #else</div><div class='ctx'> 	if (flags &amp; FUSE_IOCTL_COMPAT) {</div><div class='ctx'> 		inarg.flags |= FUSE_IOCTL_32BIT;</div><div class='del'>-#ifdef CONFIG_X86_X32</div><div class='add'>+#ifdef CONFIG_X86_X32_ABI</div><div class='ctx'> 		if (in_x32_syscall())</div><div class='ctx'> 			inarg.flags |= FUSE_IOCTL_COMPAT_X32;</div><div class='ctx'> #endif</div><div class='hunk'>@@ -181,12 +251,12 @@ long fuse_do_ioctl(struct file *file, unsigned int cmd, unsigned long arg,</div><div class='ctx'> 	BUILD_BUG_ON(sizeof(struct fuse_ioctl_iovec) * FUSE_IOCTL_MAX_IOV &gt; PAGE_SIZE);</div><div class='ctx'> </div><div class='ctx'> 	err = -ENOMEM;</div><div class='del'>-	ap.pages = fuse_pages_alloc(fm-&gt;fc-&gt;max_pages, GFP_KERNEL, &amp;ap.descs);</div><div class='add'>+	ap.folios = fuse_folios_alloc(fm-&gt;fc-&gt;max_pages, GFP_KERNEL, &amp;ap.descs);</div><div class='ctx'> 	iov_page = (struct iovec *) __get_free_page(GFP_KERNEL);</div><div class='del'>-	if (!ap.pages || !iov_page)</div><div class='add'>+	if (!ap.folios || !iov_page)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	fuse_page_descs_length_init(ap.descs, 0, fm-&gt;fc-&gt;max_pages);</div><div class='add'>+	fuse_folio_descs_length_init(ap.descs, 0, fm-&gt;fc-&gt;max_pages);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If restricted, initialize IO parameters as encoded in @cmd.</div><div class='hunk'>@@ -207,6 +277,18 @@ long fuse_do_ioctl(struct file *file, unsigned int cmd, unsigned long arg,</div><div class='ctx'> 			out_iov = iov;</div><div class='ctx'> 			out_iovs = 1;</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='add'>+		err = 0;</div><div class='add'>+		switch (cmd) {</div><div class='add'>+		case FS_IOC_MEASURE_VERITY:</div><div class='add'>+			err = fuse_setup_measure_verity(arg, iov);</div><div class='add'>+			break;</div><div class='add'>+		case FS_IOC_ENABLE_VERITY:</div><div class='add'>+			err = fuse_setup_enable_verity(arg, iov, &amp;in_iovs);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		if (err)</div><div class='add'>+			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'>  retry:</div><div class='hunk'>@@ -224,14 +306,13 @@ long fuse_do_ioctl(struct file *file, unsigned int cmd, unsigned long arg,</div><div class='ctx'> 	err = -ENOMEM;</div><div class='ctx'> 	if (max_pages &gt; fm-&gt;fc-&gt;max_pages)</div><div class='ctx'> 		goto out;</div><div class='del'>-	while (ap.num_pages &lt; max_pages) {</div><div class='del'>-		ap.pages[ap.num_pages] = alloc_page(GFP_KERNEL | __GFP_HIGHMEM);</div><div class='del'>-		if (!ap.pages[ap.num_pages])</div><div class='add'>+	while (ap.num_folios &lt; max_pages) {</div><div class='add'>+		ap.folios[ap.num_folios] = folio_alloc(GFP_KERNEL | __GFP_HIGHMEM, 0);</div><div class='add'>+		if (!ap.folios[ap.num_folios])</div><div class='ctx'> 			goto out;</div><div class='del'>-		ap.num_pages++;</div><div class='add'>+		ap.num_folios++;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-</div><div class='ctx'> 	/* okay, let's send it to the client */</div><div class='ctx'> 	ap.args.opcode = FUSE_IOCTL;</div><div class='ctx'> 	ap.args.nodeid = ff-&gt;nodeid;</div><div class='hunk'>@@ -244,22 +325,20 @@ long fuse_do_ioctl(struct file *file, unsigned int cmd, unsigned long arg,</div><div class='ctx'> 		ap.args.in_pages = true;</div><div class='ctx'> </div><div class='ctx'> 		err = -EFAULT;</div><div class='del'>-		iov_iter_init(&amp;ii, WRITE, in_iov, in_iovs, in_size);</div><div class='del'>-		for (i = 0; iov_iter_count(&amp;ii) &amp;&amp; !WARN_ON(i &gt;= ap.num_pages); i++) {</div><div class='del'>-			c = copy_page_from_iter(ap.pages[i], 0, PAGE_SIZE, &amp;ii);</div><div class='add'>+		iov_iter_init(&amp;ii, ITER_SOURCE, in_iov, in_iovs, in_size);</div><div class='add'>+		for (i = 0; iov_iter_count(&amp;ii) &amp;&amp; !WARN_ON(i &gt;= ap.num_folios); i++) {</div><div class='add'>+			c = copy_folio_from_iter(ap.folios[i], 0, PAGE_SIZE, &amp;ii);</div><div class='ctx'> 			if (c != PAGE_SIZE &amp;&amp; iov_iter_count(&amp;ii))</div><div class='ctx'> 				goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ap.args.out_numargs = 2;</div><div class='del'>-	ap.args.out_args[0].size = sizeof(outarg);</div><div class='del'>-	ap.args.out_args[0].value = &amp;outarg;</div><div class='ctx'> 	ap.args.out_args[1].size = out_size;</div><div class='ctx'> 	ap.args.out_pages = true;</div><div class='ctx'> 	ap.args.out_argvar = true;</div><div class='ctx'> </div><div class='del'>-	transferred = fuse_simple_request(fm, &amp;ap.args);</div><div class='add'>+	transferred = fuse_send_ioctl(fm, &amp;ap.args, &amp;outarg);</div><div class='ctx'> 	err = transferred;</div><div class='ctx'> 	if (transferred &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -286,7 +365,7 @@ long fuse_do_ioctl(struct file *file, unsigned int cmd, unsigned long arg,</div><div class='ctx'> 		    in_iovs + out_iovs &gt; FUSE_IOCTL_MAX_IOV)</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='del'>-		vaddr = kmap_local_page(ap.pages[0]);</div><div class='add'>+		vaddr = kmap_local_folio(ap.folios[0], 0);</div><div class='ctx'> 		err = fuse_copy_ioctl_iovec(fm-&gt;fc, iov_page, vaddr,</div><div class='ctx'> 					    transferred, in_iovs + out_iovs,</div><div class='ctx'> 					    (flags &amp; FUSE_IOCTL_COMPAT) != 0);</div><div class='hunk'>@@ -313,18 +392,18 @@ long fuse_do_ioctl(struct file *file, unsigned int cmd, unsigned long arg,</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	err = -EFAULT;</div><div class='del'>-	iov_iter_init(&amp;ii, READ, out_iov, out_iovs, transferred);</div><div class='del'>-	for (i = 0; iov_iter_count(&amp;ii) &amp;&amp; !WARN_ON(i &gt;= ap.num_pages); i++) {</div><div class='del'>-		c = copy_page_to_iter(ap.pages[i], 0, PAGE_SIZE, &amp;ii);</div><div class='add'>+	iov_iter_init(&amp;ii, ITER_DEST, out_iov, out_iovs, transferred);</div><div class='add'>+	for (i = 0; iov_iter_count(&amp;ii) &amp;&amp; !WARN_ON(i &gt;= ap.num_folios); i++) {</div><div class='add'>+		c = copy_folio_to_iter(ap.folios[i], 0, PAGE_SIZE, &amp;ii);</div><div class='ctx'> 		if (c != PAGE_SIZE &amp;&amp; iov_iter_count(&amp;ii))</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	err = 0;</div><div class='ctx'>  out:</div><div class='ctx'> 	free_page((unsigned long) iov_page);</div><div class='del'>-	while (ap.num_pages)</div><div class='del'>-		__free_page(ap.pages[--ap.num_pages]);</div><div class='del'>-	kfree(ap.pages);</div><div class='add'>+	while (ap.num_folios)</div><div class='add'>+		folio_put(ap.folios[--ap.num_folios]);</div><div class='add'>+	kfree(ap.folios);</div><div class='ctx'> </div><div class='ctx'> 	return err ? err : outarg.result;</div><div class='ctx'> }</div><div class='hunk'>@@ -388,15 +467,16 @@ static int fuse_priv_ioctl(struct inode *inode, struct fuse_file *ff,</div><div class='ctx'> 	args.in_args[1].size = inarg.in_size;</div><div class='ctx'> 	args.in_args[1].value = ptr;</div><div class='ctx'> 	args.out_numargs = 2;</div><div class='del'>-	args.out_args[0].size = sizeof(outarg);</div><div class='del'>-	args.out_args[0].value = &amp;outarg;</div><div class='ctx'> 	args.out_args[1].size = inarg.out_size;</div><div class='ctx'> 	args.out_args[1].value = ptr;</div><div class='ctx'> </div><div class='del'>-	err = fuse_simple_request(fm, &amp;args);</div><div class='del'>-	if (!err &amp;&amp; outarg.flags &amp; FUSE_IOCTL_RETRY)</div><div class='del'>-		err = -EIO;</div><div class='del'>-</div><div class='add'>+	err = fuse_send_ioctl(fm, &amp;args, &amp;outarg);</div><div class='add'>+	if (!err) {</div><div class='add'>+		if (outarg.result &lt; 0)</div><div class='add'>+			err = outarg.result;</div><div class='add'>+		else if (outarg.flags &amp; FUSE_IOCTL_RETRY)</div><div class='add'>+			err = -EIO;</div><div class='add'>+	}</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -405,6 +485,12 @@ static struct fuse_file *fuse_priv_ioctl_prepare(struct inode *inode)</div><div class='ctx'> 	struct fuse_mount *fm = get_fuse_mount(inode);</div><div class='ctx'> 	bool isdir = S_ISDIR(inode-&gt;i_mode);</div><div class='ctx'> </div><div class='add'>+	if (!fuse_allow_current_process(fm-&gt;fc))</div><div class='add'>+		return ERR_PTR(-EACCES);</div><div class='add'>+</div><div class='add'>+	if (fuse_is_bad(inode))</div><div class='add'>+		return ERR_PTR(-EIO);</div><div class='add'>+</div><div class='ctx'> 	if (!S_ISREG(inode-&gt;i_mode) &amp;&amp; !isdir)</div><div class='ctx'> 		return ERR_PTR(-ENOTTY);</div><div class='ctx'> </div><div class='hunk'>@@ -416,7 +502,7 @@ static void fuse_priv_ioctl_cleanup(struct inode *inode, struct fuse_file *ff)</div><div class='ctx'> 	fuse_file_release(inode, ff, O_RDONLY, NULL, S_ISDIR(inode-&gt;i_mode));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int fuse_fileattr_get(struct dentry *dentry, struct fileattr *fa)</div><div class='add'>+int fuse_fileattr_get(struct dentry *dentry, struct file_kattr *fa)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	struct fuse_file *ff;</div><div class='hunk'>@@ -453,8 +539,8 @@ cleanup:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int fuse_fileattr_set(struct user_namespace *mnt_userns,</div><div class='del'>-		      struct dentry *dentry, struct fileattr *fa)</div><div class='add'>+int fuse_fileattr_set(struct mnt_idmap *idmap,</div><div class='add'>+		      struct dentry *dentry, struct file_kattr *fa)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	struct fuse_file *ff;</div><div class='head'>diff --git a/fs/fuse/iomode.c b/fs/fuse/iomode.c<br/>new file mode 100644<br/>index 000000000000..3728933188f3<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fuse/iomode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fuse/iomode.c</a></div><div class='hunk'>@@ -0,0 +1,275 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+/*</div><div class='add'>+ * FUSE inode io modes.</div><div class='add'>+ *</div><div class='add'>+ * Copyright (c) 2024 CTERA Networks.</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include "fuse_i.h"</div><div class='add'>+</div><div class='add'>+#include &lt;linux/kernel.h&gt;</div><div class='add'>+#include &lt;linux/sched.h&gt;</div><div class='add'>+#include &lt;linux/file.h&gt;</div><div class='add'>+#include &lt;linux/fs.h&gt;</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Return true if need to wait for new opens in caching mode.</div><div class='add'>+ */</div><div class='add'>+static inline bool fuse_is_io_cache_wait(struct fuse_inode *fi)</div><div class='add'>+{</div><div class='add'>+	return READ_ONCE(fi-&gt;iocachectr) &lt; 0 &amp;&amp; !fuse_inode_backing(fi);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Called on cached file open() and on first mmap() of direct_io file.</div><div class='add'>+ * Takes cached_io inode mode reference to be dropped on file release.</div><div class='add'>+ *</div><div class='add'>+ * Blocks new parallel dio writes and waits for the in-progress parallel dio</div><div class='add'>+ * writes to complete.</div><div class='add'>+ */</div><div class='add'>+int fuse_file_cached_io_open(struct inode *inode, struct fuse_file *ff)</div><div class='add'>+{</div><div class='add'>+	struct fuse_inode *fi = get_fuse_inode(inode);</div><div class='add'>+</div><div class='add'>+	/* There are no io modes if server does not implement open */</div><div class='add'>+	if (!ff-&gt;args)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fi-&gt;lock);</div><div class='add'>+	/*</div><div class='add'>+	 * Setting the bit advises new direct-io writes to use an exclusive</div><div class='add'>+	 * lock - without it the wait below might be forever.</div><div class='add'>+	 */</div><div class='add'>+	while (fuse_is_io_cache_wait(fi)) {</div><div class='add'>+		set_bit(FUSE_I_CACHE_IO_MODE, &amp;fi-&gt;state);</div><div class='add'>+		spin_unlock(&amp;fi-&gt;lock);</div><div class='add'>+		wait_event(fi-&gt;direct_io_waitq, !fuse_is_io_cache_wait(fi));</div><div class='add'>+		spin_lock(&amp;fi-&gt;lock);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Check if inode entered passthrough io mode while waiting for parallel</div><div class='add'>+	 * dio write completion.</div><div class='add'>+	 */</div><div class='add'>+	if (fuse_inode_backing(fi)) {</div><div class='add'>+		clear_bit(FUSE_I_CACHE_IO_MODE, &amp;fi-&gt;state);</div><div class='add'>+		spin_unlock(&amp;fi-&gt;lock);</div><div class='add'>+		return -ETXTBSY;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	WARN_ON(ff-&gt;iomode == IOM_UNCACHED);</div><div class='add'>+	if (ff-&gt;iomode == IOM_NONE) {</div><div class='add'>+		ff-&gt;iomode = IOM_CACHED;</div><div class='add'>+		if (fi-&gt;iocachectr == 0)</div><div class='add'>+			set_bit(FUSE_I_CACHE_IO_MODE, &amp;fi-&gt;state);</div><div class='add'>+		fi-&gt;iocachectr++;</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;fi-&gt;lock);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fuse_file_cached_io_release(struct fuse_file *ff,</div><div class='add'>+					struct fuse_inode *fi)</div><div class='add'>+{</div><div class='add'>+	spin_lock(&amp;fi-&gt;lock);</div><div class='add'>+	WARN_ON(fi-&gt;iocachectr &lt;= 0);</div><div class='add'>+	WARN_ON(ff-&gt;iomode != IOM_CACHED);</div><div class='add'>+	ff-&gt;iomode = IOM_NONE;</div><div class='add'>+	fi-&gt;iocachectr--;</div><div class='add'>+	if (fi-&gt;iocachectr == 0)</div><div class='add'>+		clear_bit(FUSE_I_CACHE_IO_MODE, &amp;fi-&gt;state);</div><div class='add'>+	spin_unlock(&amp;fi-&gt;lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Start strictly uncached io mode where cache access is not allowed */</div><div class='add'>+int fuse_inode_uncached_io_start(struct fuse_inode *fi, struct fuse_backing *fb)</div><div class='add'>+{</div><div class='add'>+	struct fuse_backing *oldfb;</div><div class='add'>+	int err = 0;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fi-&gt;lock);</div><div class='add'>+	/* deny conflicting backing files on same fuse inode */</div><div class='add'>+	oldfb = fuse_inode_backing(fi);</div><div class='add'>+	if (fb &amp;&amp; oldfb &amp;&amp; oldfb != fb) {</div><div class='add'>+		err = -EBUSY;</div><div class='add'>+		goto unlock;</div><div class='add'>+	}</div><div class='add'>+	if (fi-&gt;iocachectr &gt; 0) {</div><div class='add'>+		err = -ETXTBSY;</div><div class='add'>+		goto unlock;</div><div class='add'>+	}</div><div class='add'>+	fi-&gt;iocachectr--;</div><div class='add'>+</div><div class='add'>+	/* fuse inode holds a single refcount of backing file */</div><div class='add'>+	if (fb &amp;&amp; !oldfb) {</div><div class='add'>+		oldfb = fuse_inode_backing_set(fi, fb);</div><div class='add'>+		WARN_ON_ONCE(oldfb != NULL);</div><div class='add'>+	} else {</div><div class='add'>+		fuse_backing_put(fb);</div><div class='add'>+	}</div><div class='add'>+unlock:</div><div class='add'>+	spin_unlock(&amp;fi-&gt;lock);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Takes uncached_io inode mode reference to be dropped on file release */</div><div class='add'>+static int fuse_file_uncached_io_open(struct inode *inode,</div><div class='add'>+				      struct fuse_file *ff,</div><div class='add'>+				      struct fuse_backing *fb)</div><div class='add'>+{</div><div class='add'>+	struct fuse_inode *fi = get_fuse_inode(inode);</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = fuse_inode_uncached_io_start(fi, fb);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	WARN_ON(ff-&gt;iomode != IOM_NONE);</div><div class='add'>+	ff-&gt;iomode = IOM_UNCACHED;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void fuse_inode_uncached_io_end(struct fuse_inode *fi)</div><div class='add'>+{</div><div class='add'>+	struct fuse_backing *oldfb = NULL;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fi-&gt;lock);</div><div class='add'>+	WARN_ON(fi-&gt;iocachectr &gt;= 0);</div><div class='add'>+	fi-&gt;iocachectr++;</div><div class='add'>+	if (!fi-&gt;iocachectr) {</div><div class='add'>+		wake_up(&amp;fi-&gt;direct_io_waitq);</div><div class='add'>+		oldfb = fuse_inode_backing_set(fi, NULL);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;fi-&gt;lock);</div><div class='add'>+	if (oldfb)</div><div class='add'>+		fuse_backing_put(oldfb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Drop uncached_io reference from passthrough open */</div><div class='add'>+static void fuse_file_uncached_io_release(struct fuse_file *ff,</div><div class='add'>+					  struct fuse_inode *fi)</div><div class='add'>+{</div><div class='add'>+	WARN_ON(ff-&gt;iomode != IOM_UNCACHED);</div><div class='add'>+	ff-&gt;iomode = IOM_NONE;</div><div class='add'>+	fuse_inode_uncached_io_end(fi);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Open flags that are allowed in combination with FOPEN_PASSTHROUGH.</div><div class='add'>+ * A combination of FOPEN_PASSTHROUGH and FOPEN_DIRECT_IO means that read/write</div><div class='add'>+ * operations go directly to the server, but mmap is done on the backing file.</div><div class='add'>+ * FOPEN_PASSTHROUGH mode should not co-exist with any users of the fuse inode</div><div class='add'>+ * page cache, so FOPEN_KEEP_CACHE is a strange and undesired combination.</div><div class='add'>+ */</div><div class='add'>+#define FOPEN_PASSTHROUGH_MASK \</div><div class='add'>+	(FOPEN_PASSTHROUGH | FOPEN_DIRECT_IO | FOPEN_PARALLEL_DIRECT_WRITES | \</div><div class='add'>+	 FOPEN_NOFLUSH)</div><div class='add'>+</div><div class='add'>+static int fuse_file_passthrough_open(struct inode *inode, struct file *file)</div><div class='add'>+{</div><div class='add'>+	struct fuse_file *ff = file-&gt;private_data;</div><div class='add'>+	struct fuse_conn *fc = get_fuse_conn(inode);</div><div class='add'>+	struct fuse_backing *fb;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	/* Check allowed conditions for file open in passthrough mode */</div><div class='add'>+	if (!IS_ENABLED(CONFIG_FUSE_PASSTHROUGH) || !fc-&gt;passthrough ||</div><div class='add'>+	    (ff-&gt;open_flags &amp; ~FOPEN_PASSTHROUGH_MASK))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	fb = fuse_passthrough_open(file, ff-&gt;args-&gt;open_outarg.backing_id);</div><div class='add'>+	if (IS_ERR(fb))</div><div class='add'>+		return PTR_ERR(fb);</div><div class='add'>+</div><div class='add'>+	/* First passthrough file open denies caching inode io mode */</div><div class='add'>+	err = fuse_file_uncached_io_open(inode, ff, fb);</div><div class='add'>+	if (!err)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	fuse_passthrough_release(ff, fb);</div><div class='add'>+	fuse_backing_put(fb);</div><div class='add'>+</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Request access to submit new io to inode via open file */</div><div class='add'>+int fuse_file_io_open(struct file *file, struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct fuse_file *ff = file-&gt;private_data;</div><div class='add'>+	struct fuse_inode *fi = get_fuse_inode(inode);</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * io modes are not relevant with DAX and with server that does not</div><div class='add'>+	 * implement open.</div><div class='add'>+	 */</div><div class='add'>+	if (FUSE_IS_DAX(inode) || !ff-&gt;args)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Server is expected to use FOPEN_PASSTHROUGH for all opens of an inode</div><div class='add'>+	 * which is already open for passthrough.</div><div class='add'>+	 */</div><div class='add'>+	err = -EINVAL;</div><div class='add'>+	if (fuse_inode_backing(fi) &amp;&amp; !(ff-&gt;open_flags &amp; FOPEN_PASSTHROUGH))</div><div class='add'>+		goto fail;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * FOPEN_PARALLEL_DIRECT_WRITES requires FOPEN_DIRECT_IO.</div><div class='add'>+	 */</div><div class='add'>+	if (!(ff-&gt;open_flags &amp; FOPEN_DIRECT_IO))</div><div class='add'>+		ff-&gt;open_flags &amp;= ~FOPEN_PARALLEL_DIRECT_WRITES;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * First passthrough file open denies caching inode io mode.</div><div class='add'>+	 * First caching file open enters caching inode io mode.</div><div class='add'>+	 *</div><div class='add'>+	 * Note that if user opens a file open with O_DIRECT, but server did</div><div class='add'>+	 * not specify FOPEN_DIRECT_IO, a later fcntl() could remove O_DIRECT,</div><div class='add'>+	 * so we put the inode in caching mode to prevent parallel dio.</div><div class='add'>+	 */</div><div class='add'>+	if ((ff-&gt;open_flags &amp; FOPEN_DIRECT_IO) &amp;&amp;</div><div class='add'>+	    !(ff-&gt;open_flags &amp; FOPEN_PASSTHROUGH))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if (ff-&gt;open_flags &amp; FOPEN_PASSTHROUGH)</div><div class='add'>+		err = fuse_file_passthrough_open(inode, file);</div><div class='add'>+	else</div><div class='add'>+		err = fuse_file_cached_io_open(inode, ff);</div><div class='add'>+	if (err)</div><div class='add'>+		goto fail;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+fail:</div><div class='add'>+	pr_debug("failed to open file in requested io mode (open_flags=0x%x, err=%i).\n",</div><div class='add'>+		 ff-&gt;open_flags, err);</div><div class='add'>+	/*</div><div class='add'>+	 * The file open mode determines the inode io mode.</div><div class='add'>+	 * Using incorrect open mode is a server mistake, which results in</div><div class='add'>+	 * user visible failure of open() with EIO error.</div><div class='add'>+	 */</div><div class='add'>+	return -EIO;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* No more pending io and no new io possible to inode via open/mmapped file */</div><div class='add'>+void fuse_file_io_release(struct fuse_file *ff, struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct fuse_inode *fi = get_fuse_inode(inode);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Last passthrough file close allows caching inode io mode.</div><div class='add'>+	 * Last caching file close exits caching inode io mode.</div><div class='add'>+	 */</div><div class='add'>+	switch (ff-&gt;iomode) {</div><div class='add'>+	case IOM_NONE:</div><div class='add'>+		/* Nothing to do */</div><div class='add'>+		break;</div><div class='add'>+	case IOM_UNCACHED:</div><div class='add'>+		fuse_file_uncached_io_release(ff, fi);</div><div class='add'>+		break;</div><div class='add'>+	case IOM_CACHED:</div><div class='add'>+		fuse_file_cached_io_release(ff, fi);</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='head'>diff --git a/fs/fuse/passthrough.c b/fs/fuse/passthrough.c<br/>new file mode 100644<br/>index 000000000000..72de97c03d0e<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fuse/passthrough.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fuse/passthrough.c</a></div><div class='hunk'>@@ -0,0 +1,197 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+/*</div><div class='add'>+ * FUSE passthrough to backing file.</div><div class='add'>+ *</div><div class='add'>+ * Copyright (c) 2023 CTERA Networks.</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include "fuse_i.h"</div><div class='add'>+</div><div class='add'>+#include &lt;linux/file.h&gt;</div><div class='add'>+#include &lt;linux/backing-file.h&gt;</div><div class='add'>+#include &lt;linux/splice.h&gt;</div><div class='add'>+</div><div class='add'>+static void fuse_file_accessed(struct file *file)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='add'>+</div><div class='add'>+	fuse_invalidate_atime(inode);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fuse_passthrough_end_write(struct kiocb *iocb, ssize_t ret)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='add'>+</div><div class='add'>+	fuse_write_update_attr(inode, iocb-&gt;ki_pos, ret);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+ssize_t fuse_passthrough_read_iter(struct kiocb *iocb, struct iov_iter *iter)</div><div class='add'>+{</div><div class='add'>+	struct file *file = iocb-&gt;ki_filp;</div><div class='add'>+	struct fuse_file *ff = file-&gt;private_data;</div><div class='add'>+	struct file *backing_file = fuse_file_passthrough(ff);</div><div class='add'>+	size_t count = iov_iter_count(iter);</div><div class='add'>+	ssize_t ret;</div><div class='add'>+	struct backing_file_ctx ctx = {</div><div class='add'>+		.cred = ff-&gt;cred,</div><div class='add'>+		.accessed = fuse_file_accessed,</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+</div><div class='add'>+	pr_debug("%s: backing_file=0x%p, pos=%lld, len=%zu\n", __func__,</div><div class='add'>+		 backing_file, iocb-&gt;ki_pos, count);</div><div class='add'>+</div><div class='add'>+	if (!count)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	ret = backing_file_read_iter(backing_file, iter, iocb, iocb-&gt;ki_flags,</div><div class='add'>+				     &amp;ctx);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+ssize_t fuse_passthrough_write_iter(struct kiocb *iocb,</div><div class='add'>+				    struct iov_iter *iter)</div><div class='add'>+{</div><div class='add'>+	struct file *file = iocb-&gt;ki_filp;</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='add'>+	struct fuse_file *ff = file-&gt;private_data;</div><div class='add'>+	struct file *backing_file = fuse_file_passthrough(ff);</div><div class='add'>+	size_t count = iov_iter_count(iter);</div><div class='add'>+	ssize_t ret;</div><div class='add'>+	struct backing_file_ctx ctx = {</div><div class='add'>+		.cred = ff-&gt;cred,</div><div class='add'>+		.end_write = fuse_passthrough_end_write,</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+	pr_debug("%s: backing_file=0x%p, pos=%lld, len=%zu\n", __func__,</div><div class='add'>+		 backing_file, iocb-&gt;ki_pos, count);</div><div class='add'>+</div><div class='add'>+	if (!count)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	inode_lock(inode);</div><div class='add'>+	ret = backing_file_write_iter(backing_file, iter, iocb, iocb-&gt;ki_flags,</div><div class='add'>+				      &amp;ctx);</div><div class='add'>+	inode_unlock(inode);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+ssize_t fuse_passthrough_splice_read(struct file *in, loff_t *ppos,</div><div class='add'>+				     struct pipe_inode_info *pipe,</div><div class='add'>+				     size_t len, unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	struct fuse_file *ff = in-&gt;private_data;</div><div class='add'>+	struct file *backing_file = fuse_file_passthrough(ff);</div><div class='add'>+	struct backing_file_ctx ctx = {</div><div class='add'>+		.cred = ff-&gt;cred,</div><div class='add'>+		.accessed = fuse_file_accessed,</div><div class='add'>+	};</div><div class='add'>+	struct kiocb iocb;</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	pr_debug("%s: backing_file=0x%p, pos=%lld, len=%zu, flags=0x%x\n", __func__,</div><div class='add'>+		 backing_file, *ppos, len, flags);</div><div class='add'>+</div><div class='add'>+	init_sync_kiocb(&amp;iocb, in);</div><div class='add'>+	iocb.ki_pos = *ppos;</div><div class='add'>+	ret = backing_file_splice_read(backing_file, &amp;iocb, pipe, len, flags, &amp;ctx);</div><div class='add'>+	*ppos = iocb.ki_pos;</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+ssize_t fuse_passthrough_splice_write(struct pipe_inode_info *pipe,</div><div class='add'>+				      struct file *out, loff_t *ppos,</div><div class='add'>+				      size_t len, unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	struct fuse_file *ff = out-&gt;private_data;</div><div class='add'>+	struct file *backing_file = fuse_file_passthrough(ff);</div><div class='add'>+	struct inode *inode = file_inode(out);</div><div class='add'>+	ssize_t ret;</div><div class='add'>+	struct backing_file_ctx ctx = {</div><div class='add'>+		.cred = ff-&gt;cred,</div><div class='add'>+		.end_write = fuse_passthrough_end_write,</div><div class='add'>+	};</div><div class='add'>+	struct kiocb iocb;</div><div class='add'>+</div><div class='add'>+	pr_debug("%s: backing_file=0x%p, pos=%lld, len=%zu, flags=0x%x\n", __func__,</div><div class='add'>+		 backing_file, *ppos, len, flags);</div><div class='add'>+</div><div class='add'>+	inode_lock(inode);</div><div class='add'>+	init_sync_kiocb(&amp;iocb, out);</div><div class='add'>+	iocb.ki_pos = *ppos;</div><div class='add'>+	ret = backing_file_splice_write(pipe, backing_file, &amp;iocb, len, flags, &amp;ctx);</div><div class='add'>+	*ppos = iocb.ki_pos;</div><div class='add'>+	inode_unlock(inode);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+ssize_t fuse_passthrough_mmap(struct file *file, struct vm_area_struct *vma)</div><div class='add'>+{</div><div class='add'>+	struct fuse_file *ff = file-&gt;private_data;</div><div class='add'>+	struct file *backing_file = fuse_file_passthrough(ff);</div><div class='add'>+	struct backing_file_ctx ctx = {</div><div class='add'>+		.cred = ff-&gt;cred,</div><div class='add'>+		.accessed = fuse_file_accessed,</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+	pr_debug("%s: backing_file=0x%p, start=%lu, end=%lu\n", __func__,</div><div class='add'>+		 backing_file, vma-&gt;vm_start, vma-&gt;vm_end);</div><div class='add'>+</div><div class='add'>+	return backing_file_mmap(backing_file, vma, &amp;ctx);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Setup passthrough to a backing file.</div><div class='add'>+ *</div><div class='add'>+ * Returns an fb object with elevated refcount to be stored in fuse inode.</div><div class='add'>+ */</div><div class='add'>+struct fuse_backing *fuse_passthrough_open(struct file *file, int backing_id)</div><div class='add'>+{</div><div class='add'>+	struct fuse_file *ff = file-&gt;private_data;</div><div class='add'>+	struct fuse_conn *fc = ff-&gt;fm-&gt;fc;</div><div class='add'>+	struct fuse_backing *fb = NULL;</div><div class='add'>+	struct file *backing_file;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = -EINVAL;</div><div class='add'>+	if (backing_id &lt;= 0)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	err = -ENOENT;</div><div class='add'>+	fb = fuse_backing_lookup(fc, backing_id);</div><div class='add'>+	if (!fb)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	/* Allocate backing file per fuse file to store fuse path */</div><div class='add'>+	backing_file = backing_file_open(&amp;file-&gt;f_path, file-&gt;f_flags,</div><div class='add'>+					 &amp;fb-&gt;file-&gt;f_path, fb-&gt;cred);</div><div class='add'>+	err = PTR_ERR(backing_file);</div><div class='add'>+	if (IS_ERR(backing_file)) {</div><div class='add'>+		fuse_backing_put(fb);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	err = 0;</div><div class='add'>+	ff-&gt;passthrough = backing_file;</div><div class='add'>+	ff-&gt;cred = get_cred(fb-&gt;cred);</div><div class='add'>+out:</div><div class='add'>+	pr_debug("%s: backing_id=%d, fb=0x%p, backing_file=0x%p, err=%i\n", __func__,</div><div class='add'>+		 backing_id, fb, ff-&gt;passthrough, err);</div><div class='add'>+</div><div class='add'>+	return err ? ERR_PTR(err) : fb;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void fuse_passthrough_release(struct fuse_file *ff, struct fuse_backing *fb)</div><div class='add'>+{</div><div class='add'>+	pr_debug("%s: fb=0x%p, backing_file=0x%p\n", __func__,</div><div class='add'>+		 fb, ff-&gt;passthrough);</div><div class='add'>+</div><div class='add'>+	fput(ff-&gt;passthrough);</div><div class='add'>+	ff-&gt;passthrough = NULL;</div><div class='add'>+	put_cred(ff-&gt;cred);</div><div class='add'>+	ff-&gt;cred = NULL;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/fuse/readdir.c b/fs/fuse/readdir.c<br/>index b4e565711045..c2aae2eef086 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fuse/readdir.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/readdir.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fuse/readdir.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fuse/readdir.c</a></div><div class='hunk'>@@ -77,8 +77,10 @@ static void fuse_add_dirent_to_cache(struct file *file,</div><div class='ctx'> 		goto unlock;</div><div class='ctx'> </div><div class='ctx'> 	addr = kmap_local_page(page);</div><div class='del'>-	if (!offset)</div><div class='add'>+	if (!offset) {</div><div class='ctx'> 		clear_page(addr);</div><div class='add'>+		SetPageUptodate(page);</div><div class='add'>+	}</div><div class='ctx'> 	memcpy(addr + offset, dirent, reclen);</div><div class='ctx'> 	kunmap_local(addr);</div><div class='ctx'> 	fi-&gt;rdc.size = (index &lt;&lt; PAGE_SHIFT) + offset + reclen;</div><div class='hunk'>@@ -118,7 +120,7 @@ static bool fuse_emit(struct file *file, struct dir_context *ctx,</div><div class='ctx'> 		fuse_add_dirent_to_cache(file, dirent, ctx-&gt;pos);</div><div class='ctx'> </div><div class='ctx'> 	return dir_emit(ctx, dirent-&gt;name, dirent-&gt;namelen, dirent-&gt;ino,</div><div class='del'>-			dirent-&gt;type);</div><div class='add'>+			dirent-&gt;type | FILLDIR_FLAG_NOINTR);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int parse_dirfile(char *buf, size_t nbytes, struct file *file,</div><div class='hunk'>@@ -147,7 +149,7 @@ static int parse_dirfile(char *buf, size_t nbytes, struct file *file,</div><div class='ctx'> </div><div class='ctx'> static int fuse_direntplus_link(struct file *file,</div><div class='ctx'> 				struct fuse_direntplus *direntplus,</div><div class='del'>-				u64 attr_version)</div><div class='add'>+				u64 attr_version, u64 evict_ctr)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_entry_out *o = &amp;direntplus-&gt;entry_out;</div><div class='ctx'> 	struct fuse_dirent *dirent = &amp;direntplus-&gt;dirent;</div><div class='hunk'>@@ -159,6 +161,7 @@ static int fuse_direntplus_link(struct file *file,</div><div class='ctx'> 	struct fuse_conn *fc;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	DECLARE_WAIT_QUEUE_HEAD_ONSTACK(wq);</div><div class='add'>+	int epoch;</div><div class='ctx'> </div><div class='ctx'> 	if (!o-&gt;nodeid) {</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -188,6 +191,7 @@ static int fuse_direntplus_link(struct file *file,</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> </div><div class='ctx'> 	fc = get_fuse_conn(dir);</div><div class='add'>+	epoch = atomic_read(&amp;fc-&gt;epoch);</div><div class='ctx'> </div><div class='ctx'> 	name.hash = full_name_hash(parent, name.name, name.len);</div><div class='ctx'> 	dentry = d_lookup(parent, &amp;name);</div><div class='hunk'>@@ -221,8 +225,8 @@ retry:</div><div class='ctx'> 		spin_unlock(&amp;fi-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 		forget_all_cached_acls(inode);</div><div class='del'>-		fuse_change_attributes(inode, &amp;o-&gt;attr,</div><div class='del'>-				       entry_attr_timeout(o),</div><div class='add'>+		fuse_change_attributes(inode, &amp;o-&gt;attr, NULL,</div><div class='add'>+				       ATTR_TIMEOUT(o),</div><div class='ctx'> 				       attr_version);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * The other branch comes via fuse_iget()</div><div class='hunk'>@@ -230,8 +234,8 @@ retry:</div><div class='ctx'> 		 */</div><div class='ctx'> 	} else {</div><div class='ctx'> 		inode = fuse_iget(dir-&gt;i_sb, o-&gt;nodeid, o-&gt;generation,</div><div class='del'>-				  &amp;o-&gt;attr, entry_attr_timeout(o),</div><div class='del'>-				  attr_version);</div><div class='add'>+				  &amp;o-&gt;attr, ATTR_TIMEOUT(o),</div><div class='add'>+				  attr_version, evict_ctr);</div><div class='ctx'> 		if (!inode)</div><div class='ctx'> 			inode = ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='hunk'>@@ -241,11 +245,20 @@ retry:</div><div class='ctx'> 			dput(dentry);</div><div class='ctx'> 			dentry = alias;</div><div class='ctx'> 		}</div><div class='del'>-		if (IS_ERR(dentry))</div><div class='add'>+		if (IS_ERR(dentry)) {</div><div class='add'>+			if (!IS_ERR(inode)) {</div><div class='add'>+				struct fuse_inode *fi = get_fuse_inode(inode);</div><div class='add'>+</div><div class='add'>+				spin_lock(&amp;fi-&gt;lock);</div><div class='add'>+				fi-&gt;nlookup--;</div><div class='add'>+				spin_unlock(&amp;fi-&gt;lock);</div><div class='add'>+			}</div><div class='ctx'> 			return PTR_ERR(dentry);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> 	if (fc-&gt;readdirplus_auto)</div><div class='ctx'> 		set_bit(FUSE_I_INIT_RDPLUS, &amp;get_fuse_inode(inode)-&gt;state);</div><div class='add'>+	dentry-&gt;d_time = epoch;</div><div class='ctx'> 	fuse_change_entry_timeout(dentry, o);</div><div class='ctx'> </div><div class='ctx'> 	dput(dentry);</div><div class='hunk'>@@ -274,7 +287,8 @@ static void fuse_force_forget(struct file *file, u64 nodeid)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int parse_dirplusfile(char *buf, size_t nbytes, struct file *file,</div><div class='del'>-			     struct dir_context *ctx, u64 attr_version)</div><div class='add'>+			     struct dir_context *ctx, u64 attr_version,</div><div class='add'>+			     u64 evict_ctr)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_direntplus *direntplus;</div><div class='ctx'> 	struct fuse_dirent *dirent;</div><div class='hunk'>@@ -309,7 +323,7 @@ static int parse_dirplusfile(char *buf, size_t nbytes, struct file *file,</div><div class='ctx'> 		buf += reclen;</div><div class='ctx'> 		nbytes -= reclen;</div><div class='ctx'> </div><div class='del'>-		ret = fuse_direntplus_link(file, direntplus, attr_version);</div><div class='add'>+		ret = fuse_direntplus_link(file, direntplus, attr_version, evict_ctr);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			fuse_force_forget(file, direntplus-&gt;entry_out.nodeid);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -321,34 +335,32 @@ static int fuse_readdir_uncached(struct file *file, struct dir_context *ctx)</div><div class='ctx'> {</div><div class='ctx'> 	int plus;</div><div class='ctx'> 	ssize_t res;</div><div class='del'>-	struct page *page;</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='ctx'> 	struct fuse_mount *fm = get_fuse_mount(inode);</div><div class='add'>+	struct fuse_conn *fc = fm-&gt;fc;</div><div class='ctx'> 	struct fuse_io_args ia = {};</div><div class='del'>-	struct fuse_args_pages *ap = &amp;ia.ap;</div><div class='del'>-	struct fuse_page_desc desc = { .length = PAGE_SIZE };</div><div class='del'>-	u64 attr_version = 0;</div><div class='add'>+	struct fuse_args *args = &amp;ia.ap.args;</div><div class='add'>+	void *buf;</div><div class='add'>+	size_t bufsize = clamp((unsigned int) ctx-&gt;count, PAGE_SIZE, fc-&gt;max_pages &lt;&lt; PAGE_SHIFT);</div><div class='add'>+	u64 attr_version = 0, evict_ctr = 0;</div><div class='ctx'> 	bool locked;</div><div class='ctx'> </div><div class='del'>-	page = alloc_page(GFP_KERNEL);</div><div class='del'>-	if (!page)</div><div class='add'>+	buf = kvmalloc(bufsize, GFP_KERNEL);</div><div class='add'>+	if (!buf)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='add'>+	args-&gt;out_args[0].value = buf;</div><div class='add'>+</div><div class='ctx'> 	plus = fuse_use_readdirplus(inode, ctx);</div><div class='del'>-	ap-&gt;args.out_pages = true;</div><div class='del'>-	ap-&gt;num_pages = 1;</div><div class='del'>-	ap-&gt;pages = &amp;page;</div><div class='del'>-	ap-&gt;descs = &amp;desc;</div><div class='ctx'> 	if (plus) {</div><div class='ctx'> 		attr_version = fuse_get_attr_version(fm-&gt;fc);</div><div class='del'>-		fuse_read_args_fill(&amp;ia, file, ctx-&gt;pos, PAGE_SIZE,</div><div class='del'>-				    FUSE_READDIRPLUS);</div><div class='add'>+		evict_ctr = fuse_get_evict_ctr(fm-&gt;fc);</div><div class='add'>+		fuse_read_args_fill(&amp;ia, file, ctx-&gt;pos, bufsize, FUSE_READDIRPLUS);</div><div class='ctx'> 	} else {</div><div class='del'>-		fuse_read_args_fill(&amp;ia, file, ctx-&gt;pos, PAGE_SIZE,</div><div class='del'>-				    FUSE_READDIR);</div><div class='add'>+		fuse_read_args_fill(&amp;ia, file, ctx-&gt;pos, bufsize, FUSE_READDIR);</div><div class='ctx'> 	}</div><div class='ctx'> 	locked = fuse_lock_inode(inode);</div><div class='del'>-	res = fuse_simple_request(fm, &amp;ap-&gt;args);</div><div class='add'>+	res = fuse_simple_request(fm, args);</div><div class='ctx'> 	fuse_unlock_inode(inode, locked);</div><div class='ctx'> 	if (res &gt;= 0) {</div><div class='ctx'> 		if (!res) {</div><div class='hunk'>@@ -357,15 +369,14 @@ static int fuse_readdir_uncached(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 			if (ff-&gt;open_flags &amp; FOPEN_CACHE_DIR)</div><div class='ctx'> 				fuse_readdir_cache_end(file, ctx-&gt;pos);</div><div class='ctx'> 		} else if (plus) {</div><div class='del'>-			res = parse_dirplusfile(page_address(page), res,</div><div class='del'>-						file, ctx, attr_version);</div><div class='add'>+			res = parse_dirplusfile(buf, res, file, ctx, attr_version,</div><div class='add'>+						evict_ctr);</div><div class='ctx'> 		} else {</div><div class='del'>-			res = parse_dirfile(page_address(page), res, file,</div><div class='del'>-					    ctx);</div><div class='add'>+			res = parse_dirfile(buf, res, file, ctx);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	__free_page(page);</div><div class='add'>+	kvfree(buf);</div><div class='ctx'> 	fuse_invalidate_atime(inode);</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='hunk'>@@ -406,7 +417,7 @@ static enum fuse_parse_result fuse_parse_cache(struct fuse_file *ff,</div><div class='ctx'> 		if (ff-&gt;readdir.pos == ctx-&gt;pos) {</div><div class='ctx'> 			res = FOUND_SOME;</div><div class='ctx'> 			if (!dir_emit(ctx, dirent-&gt;name, dirent-&gt;namelen,</div><div class='del'>-				      dirent-&gt;ino, dirent-&gt;type))</div><div class='add'>+				      dirent-&gt;ino, dirent-&gt;type | FILLDIR_FLAG_NOINTR))</div><div class='ctx'> 				return FOUND_ALL;</div><div class='ctx'> 			ctx-&gt;pos = dirent-&gt;off;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -466,7 +477,7 @@ retry_locked:</div><div class='ctx'> 	if (!fi-&gt;rdc.cached) {</div><div class='ctx'> 		/* Starting cache? Set cache mtime. */</div><div class='ctx'> 		if (!ctx-&gt;pos &amp;&amp; !fi-&gt;rdc.size) {</div><div class='del'>-			fi-&gt;rdc.mtime = inode-&gt;i_mtime;</div><div class='add'>+			fi-&gt;rdc.mtime = inode_get_mtime(inode);</div><div class='ctx'> 			fi-&gt;rdc.iversion = inode_query_iversion(inode);</div><div class='ctx'> 		}</div><div class='ctx'> 		spin_unlock(&amp;fi-&gt;rdc.lock);</div><div class='hunk'>@@ -478,8 +489,10 @@ retry_locked:</div><div class='ctx'> 	 * changed, and reset the cache if so.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (!ctx-&gt;pos) {</div><div class='add'>+		struct timespec64 mtime = inode_get_mtime(inode);</div><div class='add'>+</div><div class='ctx'> 		if (inode_peek_iversion(inode) != fi-&gt;rdc.iversion ||</div><div class='del'>-		    !timespec64_equal(&amp;fi-&gt;rdc.mtime, &amp;inode-&gt;i_mtime)) {</div><div class='add'>+		    !timespec64_equal(&amp;fi-&gt;rdc.mtime, &amp;mtime)) {</div><div class='ctx'> 			fuse_rdc_reset(inode);</div><div class='ctx'> 			goto retry_locked;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -516,6 +529,12 @@ retry_locked:</div><div class='ctx'> </div><div class='ctx'> 	page = find_get_page_flags(file-&gt;f_mapping, index,</div><div class='ctx'> 				   FGP_ACCESSED | FGP_LOCK);</div><div class='add'>+	/* Page gone missing, then re-added to cache, but not initialized? */</div><div class='add'>+	if (page &amp;&amp; !PageUptodate(page)) {</div><div class='add'>+		unlock_page(page);</div><div class='add'>+		put_page(page);</div><div class='add'>+		page = NULL;</div><div class='add'>+	}</div><div class='ctx'> 	spin_lock(&amp;fi-&gt;rdc.lock);</div><div class='ctx'> 	if (!page) {</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -539,9 +558,9 @@ retry_locked:</div><div class='ctx'> 	 * Contents of the page are now protected against changing by holding</div><div class='ctx'> 	 * the page lock.</div><div class='ctx'> 	 */</div><div class='del'>-	addr = kmap(page);</div><div class='add'>+	addr = kmap_local_page(page);</div><div class='ctx'> 	res = fuse_parse_cache(ff, addr, size, ctx);</div><div class='del'>-	kunmap(page);</div><div class='add'>+	kunmap_local(addr);</div><div class='ctx'> 	unlock_page(page);</div><div class='ctx'> 	put_page(page);</div><div class='ctx'> </div><div class='hunk'>@@ -574,15 +593,11 @@ int fuse_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 	if (fuse_is_bad(inode))</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;ff-&gt;readdir.lock);</div><div class='del'>-</div><div class='ctx'> 	err = UNCACHED;</div><div class='ctx'> 	if (ff-&gt;open_flags &amp; FOPEN_CACHE_DIR)</div><div class='ctx'> 		err = fuse_readdir_cached(file, ctx);</div><div class='ctx'> 	if (err == UNCACHED)</div><div class='ctx'> 		err = fuse_readdir_uncached(file, ctx);</div><div class='ctx'> </div><div class='del'>-	mutex_unlock(&amp;ff-&gt;readdir.lock);</div><div class='del'>-</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/fuse/sysctl.c b/fs/fuse/sysctl.c<br/>new file mode 100644<br/>index 000000000000..e2d921abcb88<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fuse/sysctl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fuse/sysctl.c</a></div><div class='hunk'>@@ -0,0 +1,64 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+/*</div><div class='add'>+ * linux/fs/fuse/fuse_sysctl.c</div><div class='add'>+ *</div><div class='add'>+ * Sysctl interface to fuse parameters</div><div class='add'>+ */</div><div class='add'>+#include &lt;linux/sysctl.h&gt;</div><div class='add'>+</div><div class='add'>+#include "fuse_i.h"</div><div class='add'>+</div><div class='add'>+static struct ctl_table_header *fuse_table_header;</div><div class='add'>+</div><div class='add'>+/* Bound by fuse_init_out max_pages, which is a u16 */</div><div class='add'>+static unsigned int sysctl_fuse_max_pages_limit = 65535;</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * fuse_init_out request timeouts are u16.</div><div class='add'>+ * This goes up to ~18 hours, which is plenty for a timeout.</div><div class='add'>+ */</div><div class='add'>+static unsigned int sysctl_fuse_req_timeout_limit = 65535;</div><div class='add'>+</div><div class='add'>+static const struct ctl_table fuse_sysctl_table[] = {</div><div class='add'>+	{</div><div class='add'>+		.procname	= "max_pages_limit",</div><div class='add'>+		.data		= &amp;fuse_max_pages_limit,</div><div class='add'>+		.maxlen		= sizeof(fuse_max_pages_limit),</div><div class='add'>+		.mode		= 0644,</div><div class='add'>+		.proc_handler	= proc_douintvec_minmax,</div><div class='add'>+		.extra1		= SYSCTL_ONE,</div><div class='add'>+		.extra2		= &amp;sysctl_fuse_max_pages_limit,</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+		.procname	= "default_request_timeout",</div><div class='add'>+		.data		= &amp;fuse_default_req_timeout,</div><div class='add'>+		.maxlen		= sizeof(fuse_default_req_timeout),</div><div class='add'>+		.mode		= 0644,</div><div class='add'>+		.proc_handler	= proc_douintvec_minmax,</div><div class='add'>+		.extra1		= SYSCTL_ZERO,</div><div class='add'>+		.extra2		= &amp;sysctl_fuse_req_timeout_limit,</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+		.procname	= "max_request_timeout",</div><div class='add'>+		.data		= &amp;fuse_max_req_timeout,</div><div class='add'>+		.maxlen		= sizeof(fuse_max_req_timeout),</div><div class='add'>+		.mode		= 0644,</div><div class='add'>+		.proc_handler	= proc_douintvec_minmax,</div><div class='add'>+		.extra1		= SYSCTL_ZERO,</div><div class='add'>+		.extra2		= &amp;sysctl_fuse_req_timeout_limit,</div><div class='add'>+	},</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+int fuse_sysctl_register(void)</div><div class='add'>+{</div><div class='add'>+	fuse_table_header = register_sysctl("fs/fuse", fuse_sysctl_table);</div><div class='add'>+	if (!fuse_table_header)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void fuse_sysctl_unregister(void)</div><div class='add'>+{</div><div class='add'>+	unregister_sysctl_table(fuse_table_header);</div><div class='add'>+	fuse_table_header = NULL;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/fuse/trace.c b/fs/fuse/trace.c<br/>new file mode 100644<br/>index 000000000000..93bd72efc98c<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fuse/trace.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fuse/trace.c</a></div><div class='hunk'>@@ -0,0 +1,13 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+/*</div><div class='add'>+ * Copyright (C) 2025 Oracle.  All Rights Reserved.</div><div class='add'>+ * Author: Darrick J. Wong &lt;djwong@kernel.org&gt;</div><div class='add'>+ */</div><div class='add'>+#include "dev_uring_i.h"</div><div class='add'>+#include "fuse_i.h"</div><div class='add'>+#include "fuse_dev_i.h"</div><div class='add'>+</div><div class='add'>+#include &lt;linux/pagemap.h&gt;</div><div class='add'>+</div><div class='add'>+#define CREATE_TRACE_POINTS</div><div class='add'>+#include "fuse_trace.h"</div><div class='head'>diff --git a/fs/fuse/virtio_fs.c b/fs/fuse/virtio_fs.c<br/>index 4cfa4bc1f579..b2f6486fe1d5 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fuse/virtio_fs.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/virtio_fs.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fuse/virtio_fs.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fuse/virtio_fs.c</a></div><div class='hunk'>@@ -7,7 +7,9 @@</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/dax.h&gt;</div><div class='ctx'> #include &lt;linux/pci.h&gt;</div><div class='del'>-#include &lt;linux/pfn_t.h&gt;</div><div class='add'>+#include &lt;linux/interrupt.h&gt;</div><div class='add'>+#include &lt;linux/group_cpus.h&gt;</div><div class='add'>+#include &lt;linux/memremap.h&gt;</div><div class='ctx'> #include &lt;linux/module.h&gt;</div><div class='ctx'> #include &lt;linux/virtio.h&gt;</div><div class='ctx'> #include &lt;linux/virtio_fs.h&gt;</div><div class='hunk'>@@ -15,8 +17,10 @@</div><div class='ctx'> #include &lt;linux/fs_context.h&gt;</div><div class='ctx'> #include &lt;linux/fs_parser.h&gt;</div><div class='ctx'> #include &lt;linux/highmem.h&gt;</div><div class='add'>+#include &lt;linux/cleanup.h&gt;</div><div class='ctx'> #include &lt;linux/uio.h&gt;</div><div class='ctx'> #include "fuse_i.h"</div><div class='add'>+#include "fuse_dev_i.h"</div><div class='ctx'> </div><div class='ctx'> /* Used to help calculate the FUSE connection's max_pages limit for a request's</div><div class='ctx'>  * size. Parts of the struct fuse_req are sliced into scattergather lists in</div><div class='hunk'>@@ -30,6 +34,9 @@</div><div class='ctx'> static DEFINE_MUTEX(virtio_fs_mutex);</div><div class='ctx'> static LIST_HEAD(virtio_fs_instances);</div><div class='ctx'> </div><div class='add'>+/* The /sys/fs/virtio_fs/ kset */</div><div class='add'>+static struct kset *virtio_fs_kset;</div><div class='add'>+</div><div class='ctx'> enum {</div><div class='ctx'> 	VQ_HIPRIO,</div><div class='ctx'> 	VQ_REQUEST</div><div class='hunk'>@@ -44,17 +51,19 @@ struct virtio_fs_vq {</div><div class='ctx'> 	struct work_struct done_work;</div><div class='ctx'> 	struct list_head queued_reqs;</div><div class='ctx'> 	struct list_head end_reqs;	/* End these requests */</div><div class='del'>-	struct delayed_work dispatch_work;</div><div class='add'>+	struct work_struct dispatch_work;</div><div class='ctx'> 	struct fuse_dev *fud;</div><div class='ctx'> 	bool connected;</div><div class='ctx'> 	long in_flight;</div><div class='ctx'> 	struct completion in_flight_zero; /* No inflight requests */</div><div class='add'>+	struct kobject *kobj;</div><div class='ctx'> 	char name[VQ_NAME_LEN];</div><div class='ctx'> } ____cacheline_aligned_in_smp;</div><div class='ctx'> </div><div class='ctx'> /* A virtio-fs device instance */</div><div class='ctx'> struct virtio_fs {</div><div class='del'>-	struct kref refcount;</div><div class='add'>+	struct kobject kobj;</div><div class='add'>+	struct kobject *mqs_kobj;</div><div class='ctx'> 	struct list_head list;    /* on virtio_fs_instances */</div><div class='ctx'> 	char *tag;</div><div class='ctx'> 	struct virtio_fs_vq *vqs;</div><div class='hunk'>@@ -62,6 +71,8 @@ struct virtio_fs {</div><div class='ctx'> 	unsigned int num_request_queues; /* number of request queues */</div><div class='ctx'> 	struct dax_device *dax_dev;</div><div class='ctx'> </div><div class='add'>+	unsigned int *mq_map; /* index = cpu id, value = request vq id */</div><div class='add'>+</div><div class='ctx'> 	/* DAX memory window where file contents are mapped */</div><div class='ctx'> 	void *window_kaddr;</div><div class='ctx'> 	phys_addr_t window_phys_addr;</div><div class='hunk'>@@ -86,14 +97,24 @@ struct virtio_fs_req_work {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static int virtio_fs_enqueue_req(struct virtio_fs_vq *fsvq,</div><div class='del'>-				 struct fuse_req *req, bool in_flight);</div><div class='add'>+				 struct fuse_req *req, bool in_flight,</div><div class='add'>+				 gfp_t gfp);</div><div class='add'>+</div><div class='add'>+static const struct constant_table dax_param_enums[] = {</div><div class='add'>+	{"always",	FUSE_DAX_ALWAYS },</div><div class='add'>+	{"never",	FUSE_DAX_NEVER },</div><div class='add'>+	{"inode",	FUSE_DAX_INODE_USER },</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='ctx'> </div><div class='ctx'> enum {</div><div class='ctx'> 	OPT_DAX,</div><div class='add'>+	OPT_DAX_ENUM,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct fs_parameter_spec virtio_fs_parameters[] = {</div><div class='ctx'> 	fsparam_flag("dax", OPT_DAX),</div><div class='add'>+	fsparam_enum("dax", OPT_DAX_ENUM, dax_param_enums),</div><div class='ctx'> 	{}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -110,7 +131,10 @@ static int virtio_fs_parse_param(struct fs_context *fsc,</div><div class='ctx'> </div><div class='ctx'> 	switch (opt) {</div><div class='ctx'> 	case OPT_DAX:</div><div class='del'>-		ctx-&gt;dax = 1;</div><div class='add'>+		ctx-&gt;dax_mode = FUSE_DAX_ALWAYS;</div><div class='add'>+		break;</div><div class='add'>+	case OPT_DAX_ENUM:</div><div class='add'>+		ctx-&gt;dax_mode = result.uint_32;</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		return -EINVAL;</div><div class='hunk'>@@ -148,27 +172,125 @@ static inline void dec_in_flight_req(struct virtio_fs_vq *fsvq)</div><div class='ctx'> 		complete(&amp;fsvq-&gt;in_flight_zero);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void release_virtio_fs_obj(struct kref *ref)</div><div class='add'>+static ssize_t tag_show(struct kobject *kobj,</div><div class='add'>+		struct kobj_attribute *attr, char *buf)</div><div class='add'>+{</div><div class='add'>+	struct virtio_fs *fs = container_of(kobj, struct virtio_fs, kobj);</div><div class='add'>+</div><div class='add'>+	return sysfs_emit(buf, "%s\n", fs-&gt;tag);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct kobj_attribute virtio_fs_tag_attr = __ATTR_RO(tag);</div><div class='add'>+</div><div class='add'>+static struct attribute *virtio_fs_attrs[] = {</div><div class='add'>+	&amp;virtio_fs_tag_attr.attr,</div><div class='add'>+	NULL</div><div class='add'>+};</div><div class='add'>+ATTRIBUTE_GROUPS(virtio_fs);</div><div class='add'>+</div><div class='add'>+static void virtio_fs_ktype_release(struct kobject *kobj)</div><div class='ctx'> {</div><div class='del'>-	struct virtio_fs *vfs = container_of(ref, struct virtio_fs, refcount);</div><div class='add'>+	struct virtio_fs *vfs = container_of(kobj, struct virtio_fs, kobj);</div><div class='ctx'> </div><div class='add'>+	kfree(vfs-&gt;mq_map);</div><div class='ctx'> 	kfree(vfs-&gt;vqs);</div><div class='ctx'> 	kfree(vfs);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static const struct kobj_type virtio_fs_ktype = {</div><div class='add'>+	.release = virtio_fs_ktype_release,</div><div class='add'>+	.sysfs_ops = &amp;kobj_sysfs_ops,</div><div class='add'>+	.default_groups = virtio_fs_groups,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static struct virtio_fs_vq *virtio_fs_kobj_to_vq(struct virtio_fs *fs,</div><div class='add'>+		struct kobject *kobj)</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; fs-&gt;nvqs; i++) {</div><div class='add'>+		if (kobj == fs-&gt;vqs[i].kobj)</div><div class='add'>+			return &amp;fs-&gt;vqs[i];</div><div class='add'>+	}</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t name_show(struct kobject *kobj,</div><div class='add'>+		struct kobj_attribute *attr, char *buf)</div><div class='add'>+{</div><div class='add'>+	struct virtio_fs *fs = container_of(kobj-&gt;parent-&gt;parent, struct virtio_fs, kobj);</div><div class='add'>+	struct virtio_fs_vq *fsvq = virtio_fs_kobj_to_vq(fs, kobj);</div><div class='add'>+</div><div class='add'>+	if (!fsvq)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	return sysfs_emit(buf, "%s\n", fsvq-&gt;name);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct kobj_attribute virtio_fs_vq_name_attr = __ATTR_RO(name);</div><div class='add'>+</div><div class='add'>+static ssize_t cpu_list_show(struct kobject *kobj,</div><div class='add'>+		struct kobj_attribute *attr, char *buf)</div><div class='add'>+{</div><div class='add'>+	struct virtio_fs *fs = container_of(kobj-&gt;parent-&gt;parent, struct virtio_fs, kobj);</div><div class='add'>+	struct virtio_fs_vq *fsvq = virtio_fs_kobj_to_vq(fs, kobj);</div><div class='add'>+	unsigned int cpu, qid;</div><div class='add'>+	const size_t size = PAGE_SIZE - 1;</div><div class='add'>+	bool first = true;</div><div class='add'>+	int ret = 0, pos = 0;</div><div class='add'>+</div><div class='add'>+	if (!fsvq)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	qid = fsvq-&gt;vq-&gt;index;</div><div class='add'>+	for (cpu = 0; cpu &lt; nr_cpu_ids; cpu++) {</div><div class='add'>+		if (qid &lt; VQ_REQUEST || (fs-&gt;mq_map[cpu] == qid)) {</div><div class='add'>+			if (first)</div><div class='add'>+				ret = snprintf(buf + pos, size - pos, "%u", cpu);</div><div class='add'>+			else</div><div class='add'>+				ret = snprintf(buf + pos, size - pos, ", %u", cpu);</div><div class='add'>+</div><div class='add'>+			if (ret &gt;= size - pos)</div><div class='add'>+				break;</div><div class='add'>+			first = false;</div><div class='add'>+			pos += ret;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	ret = snprintf(buf + pos, size + 1 - pos, "\n");</div><div class='add'>+	return pos + ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct kobj_attribute virtio_fs_vq_cpu_list_attr = __ATTR_RO(cpu_list);</div><div class='add'>+</div><div class='add'>+static struct attribute *virtio_fs_vq_attrs[] = {</div><div class='add'>+	&amp;virtio_fs_vq_name_attr.attr,</div><div class='add'>+	&amp;virtio_fs_vq_cpu_list_attr.attr,</div><div class='add'>+	NULL</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static struct attribute_group virtio_fs_vq_attr_group = {</div><div class='add'>+	.attrs = virtio_fs_vq_attrs,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> /* Make sure virtiofs_mutex is held */</div><div class='add'>+static void virtio_fs_put_locked(struct virtio_fs *fs)</div><div class='add'>+{</div><div class='add'>+	lockdep_assert_held(&amp;virtio_fs_mutex);</div><div class='add'>+</div><div class='add'>+	kobject_put(&amp;fs-&gt;kobj);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void virtio_fs_put(struct virtio_fs *fs)</div><div class='ctx'> {</div><div class='del'>-	kref_put(&amp;fs-&gt;refcount, release_virtio_fs_obj);</div><div class='add'>+	mutex_lock(&amp;virtio_fs_mutex);</div><div class='add'>+	virtio_fs_put_locked(fs);</div><div class='add'>+	mutex_unlock(&amp;virtio_fs_mutex);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void virtio_fs_fiq_release(struct fuse_iqueue *fiq)</div><div class='ctx'> {</div><div class='ctx'> 	struct virtio_fs *vfs = fiq-&gt;priv;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;virtio_fs_mutex);</div><div class='ctx'> 	virtio_fs_put(vfs);</div><div class='del'>-	mutex_unlock(&amp;virtio_fs_mutex);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void virtio_fs_drain_queue(struct virtio_fs_vq *fsvq)</div><div class='hunk'>@@ -189,7 +311,7 @@ static void virtio_fs_drain_queue(struct virtio_fs_vq *fsvq)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	flush_work(&amp;fsvq-&gt;done_work);</div><div class='del'>-	flush_delayed_work(&amp;fsvq-&gt;dispatch_work);</div><div class='add'>+	flush_work(&amp;fsvq-&gt;dispatch_work);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void virtio_fs_drain_all_queues_locked(struct virtio_fs *fs)</div><div class='hunk'>@@ -229,27 +351,107 @@ static void virtio_fs_start_all_queues(struct virtio_fs *fs)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void virtio_fs_delete_queues_sysfs(struct virtio_fs *fs)</div><div class='add'>+{</div><div class='add'>+	struct virtio_fs_vq *fsvq;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; fs-&gt;nvqs; i++) {</div><div class='add'>+		fsvq = &amp;fs-&gt;vqs[i];</div><div class='add'>+		kobject_put(fsvq-&gt;kobj);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int virtio_fs_add_queues_sysfs(struct virtio_fs *fs)</div><div class='add'>+{</div><div class='add'>+	struct virtio_fs_vq *fsvq;</div><div class='add'>+	char buff[12];</div><div class='add'>+	int i, j, ret;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; fs-&gt;nvqs; i++) {</div><div class='add'>+		fsvq = &amp;fs-&gt;vqs[i];</div><div class='add'>+</div><div class='add'>+		sprintf(buff, "%d", i);</div><div class='add'>+		fsvq-&gt;kobj = kobject_create_and_add(buff, fs-&gt;mqs_kobj);</div><div class='add'>+		if (!fsvq-&gt;kobj) {</div><div class='add'>+			ret = -ENOMEM;</div><div class='add'>+			goto out_del;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		ret = sysfs_create_group(fsvq-&gt;kobj, &amp;virtio_fs_vq_attr_group);</div><div class='add'>+		if (ret) {</div><div class='add'>+			kobject_put(fsvq-&gt;kobj);</div><div class='add'>+			goto out_del;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+out_del:</div><div class='add'>+	for (j = 0; j &lt; i; j++) {</div><div class='add'>+		fsvq = &amp;fs-&gt;vqs[j];</div><div class='add'>+		kobject_put(fsvq-&gt;kobj);</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /* Add a new instance to the list or return -EEXIST if tag name exists*/</div><div class='del'>-static int virtio_fs_add_instance(struct virtio_fs *fs)</div><div class='add'>+static int virtio_fs_add_instance(struct virtio_device *vdev,</div><div class='add'>+				  struct virtio_fs *fs)</div><div class='ctx'> {</div><div class='ctx'> 	struct virtio_fs *fs2;</div><div class='del'>-	bool duplicate = false;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;virtio_fs_mutex);</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(fs2, &amp;virtio_fs_instances, list) {</div><div class='del'>-		if (strcmp(fs-&gt;tag, fs2-&gt;tag) == 0)</div><div class='del'>-			duplicate = true;</div><div class='add'>+		if (strcmp(fs-&gt;tag, fs2-&gt;tag) == 0) {</div><div class='add'>+			mutex_unlock(&amp;virtio_fs_mutex);</div><div class='add'>+			return -EEXIST;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Use the virtio_device's index as a unique identifier, there is no</div><div class='add'>+	 * need to allocate our own identifiers because the virtio_fs instance</div><div class='add'>+	 * is only visible to userspace as long as the underlying virtio_device</div><div class='add'>+	 * exists.</div><div class='add'>+	 */</div><div class='add'>+	fs-&gt;kobj.kset = virtio_fs_kset;</div><div class='add'>+	ret = kobject_add(&amp;fs-&gt;kobj, NULL, "%d", vdev-&gt;index);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out_unlock;</div><div class='add'>+</div><div class='add'>+	fs-&gt;mqs_kobj = kobject_create_and_add("mqs", &amp;fs-&gt;kobj);</div><div class='add'>+	if (!fs-&gt;mqs_kobj) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out_del;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!duplicate)</div><div class='del'>-		list_add_tail(&amp;fs-&gt;list, &amp;virtio_fs_instances);</div><div class='add'>+	ret = sysfs_create_link(&amp;fs-&gt;kobj, &amp;vdev-&gt;dev.kobj, "device");</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out_put;</div><div class='add'>+</div><div class='add'>+	ret = virtio_fs_add_queues_sysfs(fs);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_remove;</div><div class='add'>+</div><div class='add'>+	list_add_tail(&amp;fs-&gt;list, &amp;virtio_fs_instances);</div><div class='ctx'> </div><div class='ctx'> 	mutex_unlock(&amp;virtio_fs_mutex);</div><div class='ctx'> </div><div class='del'>-	if (duplicate)</div><div class='del'>-		return -EEXIST;</div><div class='add'>+	kobject_uevent(&amp;fs-&gt;kobj, KOBJ_ADD);</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='add'>+</div><div class='add'>+out_remove:</div><div class='add'>+	sysfs_remove_link(&amp;fs-&gt;kobj, "device");</div><div class='add'>+out_put:</div><div class='add'>+	kobject_put(fs-&gt;mqs_kobj);</div><div class='add'>+out_del:</div><div class='add'>+	kobject_del(&amp;fs-&gt;kobj);</div><div class='add'>+out_unlock:</div><div class='add'>+	mutex_unlock(&amp;virtio_fs_mutex);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Return the virtio_fs with a given tag, or NULL */</div><div class='hunk'>@@ -261,7 +463,7 @@ static struct virtio_fs *virtio_fs_find_instance(const char *tag)</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(fs, &amp;virtio_fs_instances, list) {</div><div class='ctx'> 		if (strcmp(fs-&gt;tag, tag) == 0) {</div><div class='del'>-			kref_get(&amp;fs-&gt;refcount);</div><div class='add'>+			kobject_get(&amp;fs-&gt;kobj);</div><div class='ctx'> 			goto found;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -310,6 +512,17 @@ static int virtio_fs_read_tag(struct virtio_device *vdev, struct virtio_fs *fs)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	memcpy(fs-&gt;tag, tag_buf, len);</div><div class='ctx'> 	fs-&gt;tag[len] = '\0';</div><div class='add'>+</div><div class='add'>+	/* While the VIRTIO specification allows any character, newlines are</div><div class='add'>+	 * awkward on mount(8) command-lines and cause problems in the sysfs</div><div class='add'>+	 * "tag" attr and uevent TAG= properties. Forbid them.</div><div class='add'>+	 */</div><div class='add'>+	if (strchr(fs-&gt;tag, '\n')) {</div><div class='add'>+		dev_dbg(&amp;vdev-&gt;dev, "refusing virtiofs tag with newline character\n");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	dev_info(&amp;vdev-&gt;dev, "discovered new tag: %s\n", fs-&gt;tag);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -332,7 +545,11 @@ static void virtio_fs_hiprio_done_work(struct work_struct *work)</div><div class='ctx'> 			kfree(req);</div><div class='ctx'> 			dec_in_flight_req(fsvq);</div><div class='ctx'> 		}</div><div class='del'>-	} while (!virtqueue_enable_cb(vq) &amp;&amp; likely(!virtqueue_is_broken(vq)));</div><div class='add'>+	} while (!virtqueue_enable_cb(vq));</div><div class='add'>+</div><div class='add'>+	if (!list_empty(&amp;fsvq-&gt;queued_reqs))</div><div class='add'>+		schedule_work(&amp;fsvq-&gt;dispatch_work);</div><div class='add'>+</div><div class='ctx'> 	spin_unlock(&amp;fsvq-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -340,7 +557,7 @@ static void virtio_fs_request_dispatch_work(struct work_struct *work)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_req *req;</div><div class='ctx'> 	struct virtio_fs_vq *fsvq = container_of(work, struct virtio_fs_vq,</div><div class='del'>-						 dispatch_work.work);</div><div class='add'>+						 dispatch_work);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	pr_debug("virtio-fs: worker %s called.\n", __func__);</div><div class='hunk'>@@ -360,6 +577,8 @@ static void virtio_fs_request_dispatch_work(struct work_struct *work)</div><div class='ctx'> </div><div class='ctx'> 	/* Dispatch pending requests */</div><div class='ctx'> 	while (1) {</div><div class='add'>+		unsigned int flags;</div><div class='add'>+</div><div class='ctx'> 		spin_lock(&amp;fsvq-&gt;lock);</div><div class='ctx'> 		req = list_first_entry_or_null(&amp;fsvq-&gt;queued_reqs,</div><div class='ctx'> 					       struct fuse_req, list);</div><div class='hunk'>@@ -370,13 +589,13 @@ static void virtio_fs_request_dispatch_work(struct work_struct *work)</div><div class='ctx'> 		list_del_init(&amp;req-&gt;list);</div><div class='ctx'> 		spin_unlock(&amp;fsvq-&gt;lock);</div><div class='ctx'> </div><div class='del'>-		ret = virtio_fs_enqueue_req(fsvq, req, true);</div><div class='add'>+		flags = memalloc_nofs_save();</div><div class='add'>+		ret = virtio_fs_enqueue_req(fsvq, req, true, GFP_KERNEL);</div><div class='add'>+		memalloc_nofs_restore(flags);</div><div class='ctx'> 		if (ret &lt; 0) {</div><div class='del'>-			if (ret == -ENOMEM || ret == -ENOSPC) {</div><div class='add'>+			if (ret == -ENOSPC) {</div><div class='ctx'> 				spin_lock(&amp;fsvq-&gt;lock);</div><div class='ctx'> 				list_add_tail(&amp;req-&gt;list, &amp;fsvq-&gt;queued_reqs);</div><div class='del'>-				schedule_delayed_work(&amp;fsvq-&gt;dispatch_work,</div><div class='del'>-						      msecs_to_jiffies(1));</div><div class='ctx'> 				spin_unlock(&amp;fsvq-&gt;lock);</div><div class='ctx'> 				return;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -419,12 +638,10 @@ static int send_forget_request(struct virtio_fs_vq *fsvq,</div><div class='ctx'> </div><div class='ctx'> 	ret = virtqueue_add_outbuf(vq, &amp;sg, 1, forget, GFP_ATOMIC);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='del'>-		if (ret == -ENOMEM || ret == -ENOSPC) {</div><div class='add'>+		if (ret == -ENOSPC) {</div><div class='ctx'> 			pr_debug("virtio-fs: Could not queue FORGET: err=%d. Will try later\n",</div><div class='ctx'> 				 ret);</div><div class='ctx'> 			list_add_tail(&amp;forget-&gt;list, &amp;fsvq-&gt;queued_reqs);</div><div class='del'>-			schedule_delayed_work(&amp;fsvq-&gt;dispatch_work,</div><div class='del'>-					      msecs_to_jiffies(1));</div><div class='ctx'> 			if (!in_flight)</div><div class='ctx'> 				inc_in_flight_req(fsvq);</div><div class='ctx'> 			/* Queue is full */</div><div class='hunk'>@@ -456,7 +673,7 @@ static void virtio_fs_hiprio_dispatch_work(struct work_struct *work)</div><div class='ctx'> {</div><div class='ctx'> 	struct virtio_fs_forget *forget;</div><div class='ctx'> 	struct virtio_fs_vq *fsvq = container_of(work, struct virtio_fs_vq,</div><div class='del'>-						 dispatch_work.work);</div><div class='add'>+						 dispatch_work);</div><div class='ctx'> 	pr_debug("virtio-fs: worker %s called.\n", __func__);</div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		spin_lock(&amp;fsvq-&gt;lock);</div><div class='hunk'>@@ -475,7 +692,7 @@ static void virtio_fs_hiprio_dispatch_work(struct work_struct *work)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Allocate and copy args into req-&gt;argbuf */</div><div class='del'>-static int copy_args_to_argbuf(struct fuse_req *req)</div><div class='add'>+static int copy_args_to_argbuf(struct fuse_req *req, gfp_t gfp)</div><div class='ctx'> {</div><div class='ctx'> 	struct fuse_args *args = req-&gt;args;</div><div class='ctx'> 	unsigned int offset = 0;</div><div class='hunk'>@@ -489,7 +706,7 @@ static int copy_args_to_argbuf(struct fuse_req *req)</div><div class='ctx'> 	len = fuse_len_args(num_in, (struct fuse_arg *) args-&gt;in_args) +</div><div class='ctx'> 	      fuse_len_args(num_out, args-&gt;out_args);</div><div class='ctx'> </div><div class='del'>-	req-&gt;argbuf = kmalloc(len, GFP_ATOMIC);</div><div class='add'>+	req-&gt;argbuf = kmalloc(len, gfp);</div><div class='ctx'> 	if (!req-&gt;argbuf)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='hunk'>@@ -545,11 +762,10 @@ static void copy_args_from_argbuf(struct fuse_args *args, struct fuse_req *req)</div><div class='ctx'> static void virtio_fs_request_complete(struct fuse_req *req,</div><div class='ctx'> 				       struct virtio_fs_vq *fsvq)</div><div class='ctx'> {</div><div class='del'>-	struct fuse_pqueue *fpq = &amp;fsvq-&gt;fud-&gt;pq;</div><div class='ctx'> 	struct fuse_args *args;</div><div class='ctx'> 	struct fuse_args_pages *ap;</div><div class='ctx'> 	unsigned int len, i, thislen;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * TODO verify that server properly follows FUSE protocol</div><div class='hunk'>@@ -561,12 +777,12 @@ static void virtio_fs_request_complete(struct fuse_req *req,</div><div class='ctx'> 	if (args-&gt;out_pages &amp;&amp; args-&gt;page_zeroing) {</div><div class='ctx'> 		len = args-&gt;out_args[args-&gt;out_numargs - 1].size;</div><div class='ctx'> 		ap = container_of(args, typeof(*ap), args);</div><div class='del'>-		for (i = 0; i &lt; ap-&gt;num_pages; i++) {</div><div class='add'>+		for (i = 0; i &lt; ap-&gt;num_folios; i++) {</div><div class='ctx'> 			thislen = ap-&gt;descs[i].length;</div><div class='ctx'> 			if (len &lt; thislen) {</div><div class='ctx'> 				WARN_ON(ap-&gt;descs[i].offset);</div><div class='del'>-				page = ap-&gt;pages[i];</div><div class='del'>-				zero_user_segment(page, len, thislen);</div><div class='add'>+				folio = ap-&gt;folios[i];</div><div class='add'>+				folio_zero_segment(folio, len, thislen);</div><div class='ctx'> 				len = 0;</div><div class='ctx'> 			} else {</div><div class='ctx'> 				len -= thislen;</div><div class='hunk'>@@ -574,9 +790,7 @@ static void virtio_fs_request_complete(struct fuse_req *req,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;fpq-&gt;lock);</div><div class='ctx'> 	clear_bit(FR_SENT, &amp;req-&gt;flags);</div><div class='del'>-	spin_unlock(&amp;fpq-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	fuse_request_end(req);</div><div class='ctx'> 	spin_lock(&amp;fsvq-&gt;lock);</div><div class='hunk'>@@ -614,7 +828,7 @@ static void virtio_fs_requests_done_work(struct work_struct *work)</div><div class='ctx'> 			list_move_tail(&amp;req-&gt;list, &amp;reqs);</div><div class='ctx'> 			spin_unlock(&amp;fpq-&gt;lock);</div><div class='ctx'> 		}</div><div class='del'>-	} while (!virtqueue_enable_cb(vq) &amp;&amp; likely(!virtqueue_is_broken(vq)));</div><div class='add'>+	} while (!virtqueue_enable_cb(vq));</div><div class='ctx'> 	spin_unlock(&amp;fsvq-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	/* End requests */</div><div class='hunk'>@@ -634,6 +848,50 @@ static void virtio_fs_requests_done_work(struct work_struct *work)</div><div class='ctx'> 			virtio_fs_request_complete(req, fsvq);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	/* Try to push previously queued requests, as the queue might no longer be full */</div><div class='add'>+	spin_lock(&amp;fsvq-&gt;lock);</div><div class='add'>+	if (!list_empty(&amp;fsvq-&gt;queued_reqs))</div><div class='add'>+		schedule_work(&amp;fsvq-&gt;dispatch_work);</div><div class='add'>+	spin_unlock(&amp;fsvq-&gt;lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void virtio_fs_map_queues(struct virtio_device *vdev, struct virtio_fs *fs)</div><div class='add'>+{</div><div class='add'>+	const struct cpumask *mask, *masks;</div><div class='add'>+	unsigned int q, cpu, nr_masks;</div><div class='add'>+</div><div class='add'>+	/* First attempt to map using existing transport layer affinities</div><div class='add'>+	 * e.g. PCIe MSI-X</div><div class='add'>+	 */</div><div class='add'>+	if (!vdev-&gt;config-&gt;get_vq_affinity)</div><div class='add'>+		goto fallback;</div><div class='add'>+</div><div class='add'>+	for (q = 0; q &lt; fs-&gt;num_request_queues; q++) {</div><div class='add'>+		mask = vdev-&gt;config-&gt;get_vq_affinity(vdev, VQ_REQUEST + q);</div><div class='add'>+		if (!mask)</div><div class='add'>+			goto fallback;</div><div class='add'>+</div><div class='add'>+		for_each_cpu(cpu, mask)</div><div class='add'>+			fs-&gt;mq_map[cpu] = q + VQ_REQUEST;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return;</div><div class='add'>+fallback:</div><div class='add'>+	/* Attempt to map evenly in groups over the CPUs */</div><div class='add'>+	masks = group_cpus_evenly(fs-&gt;num_request_queues, &amp;nr_masks);</div><div class='add'>+	/* If even this fails we default to all CPUs use first request queue */</div><div class='add'>+	if (!masks) {</div><div class='add'>+		for_each_possible_cpu(cpu)</div><div class='add'>+			fs-&gt;mq_map[cpu] = VQ_REQUEST;</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for (q = 0; q &lt; fs-&gt;num_request_queues; q++) {</div><div class='add'>+		for_each_cpu(cpu, &amp;masks[q % nr_masks])</div><div class='add'>+			fs-&gt;mq_map[cpu] = q + VQ_REQUEST;</div><div class='add'>+	}</div><div class='add'>+	kfree(masks);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Virtqueue interrupt handler */</div><div class='hunk'>@@ -657,12 +915,12 @@ static void virtio_fs_init_vq(struct virtio_fs_vq *fsvq, char *name,</div><div class='ctx'> </div><div class='ctx'> 	if (vq_type == VQ_REQUEST) {</div><div class='ctx'> 		INIT_WORK(&amp;fsvq-&gt;done_work, virtio_fs_requests_done_work);</div><div class='del'>-		INIT_DELAYED_WORK(&amp;fsvq-&gt;dispatch_work,</div><div class='del'>-				  virtio_fs_request_dispatch_work);</div><div class='add'>+		INIT_WORK(&amp;fsvq-&gt;dispatch_work,</div><div class='add'>+				virtio_fs_request_dispatch_work);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		INIT_WORK(&amp;fsvq-&gt;done_work, virtio_fs_hiprio_done_work);</div><div class='del'>-		INIT_DELAYED_WORK(&amp;fsvq-&gt;dispatch_work,</div><div class='del'>-				  virtio_fs_hiprio_dispatch_work);</div><div class='add'>+		INIT_WORK(&amp;fsvq-&gt;dispatch_work,</div><div class='add'>+				virtio_fs_hiprio_dispatch_work);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -670,9 +928,13 @@ static void virtio_fs_init_vq(struct virtio_fs_vq *fsvq, char *name,</div><div class='ctx'> static int virtio_fs_setup_vqs(struct virtio_device *vdev,</div><div class='ctx'> 			       struct virtio_fs *fs)</div><div class='ctx'> {</div><div class='add'>+	struct virtqueue_info *vqs_info;</div><div class='ctx'> 	struct virtqueue **vqs;</div><div class='del'>-	vq_callback_t **callbacks;</div><div class='del'>-	const char **names;</div><div class='add'>+	/* Specify pre_vectors to ensure that the queues before the</div><div class='add'>+	 * request queues (e.g. hiprio) don't claim any of the CPUs in</div><div class='add'>+	 * the multi-queue mapping and interrupt affinities</div><div class='add'>+	 */</div><div class='add'>+	struct irq_affinity desc = { .pre_vectors = VQ_REQUEST };</div><div class='ctx'> 	unsigned int i;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -681,24 +943,27 @@ static int virtio_fs_setup_vqs(struct virtio_device *vdev,</div><div class='ctx'> 	if (fs-&gt;num_request_queues == 0)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='add'>+	/* Truncate nr of request queues to nr_cpu_id */</div><div class='add'>+	fs-&gt;num_request_queues = min_t(unsigned int, fs-&gt;num_request_queues,</div><div class='add'>+					nr_cpu_ids);</div><div class='ctx'> 	fs-&gt;nvqs = VQ_REQUEST + fs-&gt;num_request_queues;</div><div class='ctx'> 	fs-&gt;vqs = kcalloc(fs-&gt;nvqs, sizeof(fs-&gt;vqs[VQ_HIPRIO]), GFP_KERNEL);</div><div class='ctx'> 	if (!fs-&gt;vqs)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	vqs = kmalloc_array(fs-&gt;nvqs, sizeof(vqs[VQ_HIPRIO]), GFP_KERNEL);</div><div class='del'>-	callbacks = kmalloc_array(fs-&gt;nvqs, sizeof(callbacks[VQ_HIPRIO]),</div><div class='del'>-					GFP_KERNEL);</div><div class='del'>-	names = kmalloc_array(fs-&gt;nvqs, sizeof(names[VQ_HIPRIO]), GFP_KERNEL);</div><div class='del'>-	if (!vqs || !callbacks || !names) {</div><div class='add'>+	fs-&gt;mq_map = kcalloc_node(nr_cpu_ids, sizeof(*fs-&gt;mq_map), GFP_KERNEL,</div><div class='add'>+					dev_to_node(&amp;vdev-&gt;dev));</div><div class='add'>+	vqs_info = kcalloc(fs-&gt;nvqs, sizeof(*vqs_info), GFP_KERNEL);</div><div class='add'>+	if (!vqs || !vqs_info || !fs-&gt;mq_map) {</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Initialize the hiprio/forget request virtqueue */</div><div class='del'>-	callbacks[VQ_HIPRIO] = virtio_fs_vq_done;</div><div class='add'>+	vqs_info[VQ_HIPRIO].callback = virtio_fs_vq_done;</div><div class='ctx'> 	virtio_fs_init_vq(&amp;fs-&gt;vqs[VQ_HIPRIO], "hiprio", VQ_HIPRIO);</div><div class='del'>-	names[VQ_HIPRIO] = fs-&gt;vqs[VQ_HIPRIO].name;</div><div class='add'>+	vqs_info[VQ_HIPRIO].name = fs-&gt;vqs[VQ_HIPRIO].name;</div><div class='ctx'> </div><div class='ctx'> 	/* Initialize the requests virtqueues */</div><div class='ctx'> 	for (i = VQ_REQUEST; i &lt; fs-&gt;nvqs; i++) {</div><div class='hunk'>@@ -706,11 +971,11 @@ static int virtio_fs_setup_vqs(struct virtio_device *vdev,</div><div class='ctx'> </div><div class='ctx'> 		snprintf(vq_name, VQ_NAME_LEN, "requests.%u", i - VQ_REQUEST);</div><div class='ctx'> 		virtio_fs_init_vq(&amp;fs-&gt;vqs[i], vq_name, VQ_REQUEST);</div><div class='del'>-		callbacks[i] = virtio_fs_vq_done;</div><div class='del'>-		names[i] = fs-&gt;vqs[i].name;</div><div class='add'>+		vqs_info[i].callback = virtio_fs_vq_done;</div><div class='add'>+		vqs_info[i].name = fs-&gt;vqs[i].name;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = virtio_find_vqs(vdev, fs-&gt;nvqs, vqs, callbacks, names, NULL);</div><div class='add'>+	ret = virtio_find_vqs(vdev, fs-&gt;nvqs, vqs, vqs_info, &amp;desc);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -719,17 +984,17 @@ static int virtio_fs_setup_vqs(struct virtio_device *vdev,</div><div class='ctx'> </div><div class='ctx'> 	virtio_fs_start_all_queues(fs);</div><div class='ctx'> out:</div><div class='del'>-	kfree(names);</div><div class='del'>-	kfree(callbacks);</div><div class='add'>+	kfree(vqs_info);</div><div class='ctx'> 	kfree(vqs);</div><div class='del'>-	if (ret)</div><div class='add'>+	if (ret) {</div><div class='ctx'> 		kfree(fs-&gt;vqs);</div><div class='add'>+		kfree(fs-&gt;mq_map);</div><div class='add'>+	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Free virtqueues (device must already be reset) */</div><div class='del'>-static void virtio_fs_cleanup_vqs(struct virtio_device *vdev,</div><div class='del'>-				  struct virtio_fs *fs)</div><div class='add'>+static void virtio_fs_cleanup_vqs(struct virtio_device *vdev)</div><div class='ctx'> {</div><div class='ctx'> 	vdev-&gt;config-&gt;del_vqs(vdev);</div><div class='ctx'> }</div><div class='hunk'>@@ -739,43 +1004,31 @@ static void virtio_fs_cleanup_vqs(struct virtio_device *vdev,</div><div class='ctx'>  * offset.</div><div class='ctx'>  */</div><div class='ctx'> static long virtio_fs_direct_access(struct dax_device *dax_dev, pgoff_t pgoff,</div><div class='del'>-				    long nr_pages, void **kaddr, pfn_t *pfn)</div><div class='add'>+				    long nr_pages, enum dax_access_mode mode,</div><div class='add'>+				    void **kaddr, unsigned long *pfn)</div><div class='ctx'> {</div><div class='ctx'> 	struct virtio_fs *fs = dax_get_private(dax_dev);</div><div class='ctx'> 	phys_addr_t offset = PFN_PHYS(pgoff);</div><div class='del'>-	size_t max_nr_pages = fs-&gt;window_len/PAGE_SIZE - pgoff;</div><div class='add'>+	size_t max_nr_pages = fs-&gt;window_len / PAGE_SIZE - pgoff;</div><div class='ctx'> </div><div class='ctx'> 	if (kaddr)</div><div class='ctx'> 		*kaddr = fs-&gt;window_kaddr + offset;</div><div class='ctx'> 	if (pfn)</div><div class='del'>-		*pfn = phys_to_pfn_t(fs-&gt;window_phys_addr + offset,</div><div class='del'>-					PFN_DEV | PFN_MAP);</div><div class='add'>+		*pfn = PHYS_PFN(fs-&gt;window_phys_addr + offset);</div><div class='ctx'> 	return nr_pages &gt; max_nr_pages ? max_nr_pages : nr_pages;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static size_t virtio_fs_copy_from_iter(struct dax_device *dax_dev,</div><div class='del'>-				       pgoff_t pgoff, void *addr,</div><div class='del'>-				       size_t bytes, struct iov_iter *i)</div><div class='del'>-{</div><div class='del'>-	return copy_from_iter(addr, bytes, i);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static size_t virtio_fs_copy_to_iter(struct dax_device *dax_dev,</div><div class='del'>-				       pgoff_t pgoff, void *addr,</div><div class='del'>-				       size_t bytes, struct iov_iter *i)</div><div class='del'>-{</div><div class='del'>-	return copy_to_iter(addr, bytes, i);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int virtio_fs_zero_page_range(struct dax_device *dax_dev,</div><div class='ctx'> 				     pgoff_t pgoff, size_t nr_pages)</div><div class='ctx'> {</div><div class='ctx'> 	long rc;</div><div class='ctx'> 	void *kaddr;</div><div class='ctx'> </div><div class='del'>-	rc = dax_direct_access(dax_dev, pgoff, nr_pages, &amp;kaddr, NULL);</div><div class='add'>+	rc = dax_direct_access(dax_dev, pgoff, nr_pages, DAX_ACCESS, &amp;kaddr,</div><div class='add'>+			       NULL);</div><div class='ctx'> 	if (rc &lt; 0)</div><div class='del'>-		return rc;</div><div class='add'>+		return dax_mem2blk_err(rc);</div><div class='add'>+</div><div class='ctx'> 	memset(kaddr, 0, nr_pages &lt;&lt; PAGE_SHIFT);</div><div class='ctx'> 	dax_flush(dax_dev, kaddr, nr_pages &lt;&lt; PAGE_SHIFT);</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -783,8 +1036,6 @@ static int virtio_fs_zero_page_range(struct dax_device *dax_dev,</div><div class='ctx'> </div><div class='ctx'> static const struct dax_operations virtio_fs_dax_ops = {</div><div class='ctx'> 	.direct_access = virtio_fs_direct_access,</div><div class='del'>-	.copy_from_iter = virtio_fs_copy_from_iter,</div><div class='del'>-	.copy_to_iter = virtio_fs_copy_to_iter,</div><div class='ctx'> 	.zero_page_range = virtio_fs_zero_page_range,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -796,8 +1047,11 @@ static void virtio_fs_cleanup_dax(void *data)</div><div class='ctx'> 	put_dax(dax_dev);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+DEFINE_FREE(cleanup_dax, struct dax_dev *, if (!IS_ERR_OR_NULL(_T)) virtio_fs_cleanup_dax(_T))</div><div class='add'>+</div><div class='ctx'> static int virtio_fs_setup_dax(struct virtio_device *vdev, struct virtio_fs *fs)</div><div class='ctx'> {</div><div class='add'>+	struct dax_device *dax_dev __free(cleanup_dax) = NULL;</div><div class='ctx'> 	struct virtio_shm_region cache_reg;</div><div class='ctx'> 	struct dev_pagemap *pgmap;</div><div class='ctx'> 	bool have_cache;</div><div class='hunk'>@@ -805,6 +1059,12 @@ static int virtio_fs_setup_dax(struct virtio_device *vdev, struct virtio_fs *fs)</div><div class='ctx'> 	if (!IS_ENABLED(CONFIG_FUSE_DAX))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='add'>+	dax_dev = alloc_dax(fs, &amp;virtio_fs_dax_ops);</div><div class='add'>+	if (IS_ERR(dax_dev)) {</div><div class='add'>+		int rc = PTR_ERR(dax_dev);</div><div class='add'>+		return rc == -EOPNOTSUPP ? 0 : rc;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/* Get cache region */</div><div class='ctx'> 	have_cache = virtio_get_shm_region(vdev, &amp;cache_reg,</div><div class='ctx'> 					   (u8)VIRTIO_FS_SHMCAP_ID_CACHE);</div><div class='hunk'>@@ -850,10 +1110,7 @@ static int virtio_fs_setup_dax(struct virtio_device *vdev, struct virtio_fs *fs)</div><div class='ctx'> 	dev_dbg(&amp;vdev-&gt;dev, "%s: window kaddr 0x%px phys_addr 0x%llx len 0x%llx\n",</div><div class='ctx'> 		__func__, fs-&gt;window_kaddr, cache_reg.addr, cache_reg.len);</div><div class='ctx'> </div><div class='del'>-	fs-&gt;dax_dev = alloc_dax(fs, NULL, &amp;virtio_fs_dax_ops, 0);</div><div class='del'>-	if (IS_ERR(fs-&gt;dax_dev))</div><div class='del'>-		return PTR_ERR(fs-&gt;dax_dev);</div><div class='del'>-</div><div class='add'>+	fs-&gt;dax_dev = no_free_ptr(dax_dev);</div><div class='ctx'> 	return devm_add_action_or_reset(&amp;vdev-&gt;dev, virtio_fs_cleanup_dax,</div><div class='ctx'> 					fs-&gt;dax_dev);</div><div class='ctx'> }</div><div class='hunk'>@@ -866,7 +1123,7 @@ static int virtio_fs_probe(struct virtio_device *vdev)</div><div class='ctx'> 	fs = kzalloc(sizeof(*fs), GFP_KERNEL);</div><div class='ctx'> 	if (!fs)</div><div class='ctx'> 		return -ENOMEM;</div><div class='del'>-	kref_init(&amp;fs-&gt;refcount);</div><div class='add'>+	kobject_init(&amp;fs-&gt;kobj, &amp;virtio_fs_ktype);</div><div class='ctx'> 	vdev-&gt;priv = fs;</div><div class='ctx'> </div><div class='ctx'> 	ret = virtio_fs_read_tag(vdev, fs);</div><div class='hunk'>@@ -877,7 +1134,7 @@ static int virtio_fs_probe(struct virtio_device *vdev)</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	/* TODO vq affinity */</div><div class='add'>+	virtio_fs_map_queues(vdev, fs);</div><div class='ctx'> </div><div class='ctx'> 	ret = virtio_fs_setup_dax(vdev, fs);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='hunk'>@@ -888,20 +1145,19 @@ static int virtio_fs_probe(struct virtio_device *vdev)</div><div class='ctx'> 	 */</div><div class='ctx'> 	virtio_device_ready(vdev);</div><div class='ctx'> </div><div class='del'>-	ret = virtio_fs_add_instance(fs);</div><div class='add'>+	ret = virtio_fs_add_instance(vdev, fs);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out_vqs;</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> out_vqs:</div><div class='del'>-	vdev-&gt;config-&gt;reset(vdev);</div><div class='del'>-	virtio_fs_cleanup_vqs(vdev, fs);</div><div class='del'>-	kfree(fs-&gt;vqs);</div><div class='add'>+	virtio_reset_device(vdev);</div><div class='add'>+	virtio_fs_cleanup_vqs(vdev);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	vdev-&gt;priv = NULL;</div><div class='del'>-	kfree(fs);</div><div class='add'>+	kobject_put(&amp;fs-&gt;kobj);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -925,14 +1181,18 @@ static void virtio_fs_remove(struct virtio_device *vdev)</div><div class='ctx'> 	mutex_lock(&amp;virtio_fs_mutex);</div><div class='ctx'> 	/* This device is going away. No one should get new reference */</div><div class='ctx'> 	list_del_init(&amp;fs-&gt;list);</div><div class='add'>+	virtio_fs_delete_queues_sysfs(fs);</div><div class='add'>+	sysfs_remove_link(&amp;fs-&gt;kobj, "device");</div><div class='add'>+	kobject_put(fs-&gt;mqs_kobj);</div><div class='add'>+	kobject_del(&amp;fs-&gt;kobj);</div><div class='ctx'> 	virtio_fs_stop_all_queues(fs);</div><div class='ctx'> 	virtio_fs_drain_all_queues_locked(fs);</div><div class='del'>-	vdev-&gt;config-&gt;reset(vdev);</div><div class='del'>-	virtio_fs_cleanup_vqs(vdev, fs);</div><div class='add'>+	virtio_reset_device(vdev);</div><div class='add'>+	virtio_fs_cleanup_vqs(vdev);</div><div class='ctx'> </div><div class='ctx'> 	vdev-&gt;priv = NULL;</div><div class='ctx'> 	/* Put device reference on virtio_fs object */</div><div class='del'>-	virtio_fs_put(fs);</div><div class='add'>+	virtio_fs_put_locked(fs);</div><div class='ctx'> 	mutex_unlock(&amp;virtio_fs_mutex);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -960,7 +1220,6 @@ static const unsigned int feature_table[] = {};</div><div class='ctx'> </div><div class='ctx'> static struct virtio_driver virtio_fs_driver = {</div><div class='ctx'> 	.driver.name		= KBUILD_MODNAME,</div><div class='del'>-	.driver.owner		= THIS_MODULE,</div><div class='ctx'> 	.id_table		= id_table,</div><div class='ctx'> 	.feature_table		= feature_table,</div><div class='ctx'> 	.feature_table_size	= ARRAY_SIZE(feature_table),</div><div class='hunk'>@@ -972,22 +1231,13 @@ static struct virtio_driver virtio_fs_driver = {</div><div class='ctx'> #endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static void virtio_fs_wake_forget_and_unlock(struct fuse_iqueue *fiq)</div><div class='del'>-__releases(fiq-&gt;lock)</div><div class='add'>+static void virtio_fs_send_forget(struct fuse_iqueue *fiq, struct fuse_forget_link *link)</div><div class='ctx'> {</div><div class='del'>-	struct fuse_forget_link *link;</div><div class='ctx'> 	struct virtio_fs_forget *forget;</div><div class='ctx'> 	struct virtio_fs_forget_req *req;</div><div class='del'>-	struct virtio_fs *fs;</div><div class='del'>-	struct virtio_fs_vq *fsvq;</div><div class='del'>-	u64 unique;</div><div class='del'>-</div><div class='del'>-	link = fuse_dequeue_forget(fiq, 1, NULL);</div><div class='del'>-	unique = fuse_get_unique(fiq);</div><div class='del'>-</div><div class='del'>-	fs = fiq-&gt;priv;</div><div class='del'>-	fsvq = &amp;fs-&gt;vqs[VQ_HIPRIO];</div><div class='del'>-	spin_unlock(&amp;fiq-&gt;lock);</div><div class='add'>+	struct virtio_fs *fs = fiq-&gt;priv;</div><div class='add'>+	struct virtio_fs_vq *fsvq = &amp;fs-&gt;vqs[VQ_HIPRIO];</div><div class='add'>+	u64 unique = fuse_get_unique(fiq);</div><div class='ctx'> </div><div class='ctx'> 	/* Allocate a buffer for the request */</div><div class='ctx'> 	forget = kmalloc(sizeof(*forget), GFP_NOFS | __GFP_NOFAIL);</div><div class='hunk'>@@ -1007,8 +1257,7 @@ __releases(fiq-&gt;lock)</div><div class='ctx'> 	kfree(link);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void virtio_fs_wake_interrupt_and_unlock(struct fuse_iqueue *fiq)</div><div class='del'>-__releases(fiq-&gt;lock)</div><div class='add'>+static void virtio_fs_send_interrupt(struct fuse_iqueue *fiq, struct fuse_req *req)</div><div class='ctx'> {</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * TODO interrupts.</div><div class='hunk'>@@ -1017,19 +1266,18 @@ __releases(fiq-&gt;lock)</div><div class='ctx'> 	 * Exceptions are blocking lock operations; for example fcntl(F_SETLKW)</div><div class='ctx'> 	 * with shared lock between host and guest.</div><div class='ctx'> 	 */</div><div class='del'>-	spin_unlock(&amp;fiq-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Count number of scatter-gather elements required */</div><div class='del'>-static unsigned int sg_count_fuse_pages(struct fuse_page_desc *page_descs,</div><div class='del'>-				       unsigned int num_pages,</div><div class='del'>-				       unsigned int total_len)</div><div class='add'>+static unsigned int sg_count_fuse_folios(struct fuse_folio_desc *folio_descs,</div><div class='add'>+					 unsigned int num_folios,</div><div class='add'>+					 unsigned int total_len)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int i;</div><div class='ctx'> 	unsigned int this_len;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; num_pages &amp;&amp; total_len; i++) {</div><div class='del'>-		this_len =  min(page_descs[i].length, total_len);</div><div class='add'>+	for (i = 0; i &lt; num_folios &amp;&amp; total_len; i++) {</div><div class='add'>+		this_len =  min(folio_descs[i].length, total_len);</div><div class='ctx'> 		total_len -= this_len;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1048,8 +1296,8 @@ static unsigned int sg_count_fuse_req(struct fuse_req *req)</div><div class='ctx'> </div><div class='ctx'> 	if (args-&gt;in_pages) {</div><div class='ctx'> 		size = args-&gt;in_args[args-&gt;in_numargs - 1].size;</div><div class='del'>-		total_sgs += sg_count_fuse_pages(ap-&gt;descs, ap-&gt;num_pages,</div><div class='del'>-						 size);</div><div class='add'>+		total_sgs += sg_count_fuse_folios(ap-&gt;descs, ap-&gt;num_folios,</div><div class='add'>+						  size);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!test_bit(FR_ISREPLY, &amp;req-&gt;flags))</div><div class='hunk'>@@ -1062,27 +1310,27 @@ static unsigned int sg_count_fuse_req(struct fuse_req *req)</div><div class='ctx'> </div><div class='ctx'> 	if (args-&gt;out_pages) {</div><div class='ctx'> 		size = args-&gt;out_args[args-&gt;out_numargs - 1].size;</div><div class='del'>-		total_sgs += sg_count_fuse_pages(ap-&gt;descs, ap-&gt;num_pages,</div><div class='del'>-						 size);</div><div class='add'>+		total_sgs += sg_count_fuse_folios(ap-&gt;descs, ap-&gt;num_folios,</div><div class='add'>+						  size);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return total_sgs;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Add pages to scatter-gather list and return number of elements used */</div><div class='del'>-static unsigned int sg_init_fuse_pages(struct scatterlist *sg,</div><div class='del'>-				       struct page **pages,</div><div class='del'>-				       struct fuse_page_desc *page_descs,</div><div class='del'>-				       unsigned int num_pages,</div><div class='del'>-				       unsigned int total_len)</div><div class='add'>+/* Add folios to scatter-gather list and return number of elements used */</div><div class='add'>+static unsigned int sg_init_fuse_folios(struct scatterlist *sg,</div><div class='add'>+					struct folio **folios,</div><div class='add'>+					struct fuse_folio_desc *folio_descs,</div><div class='add'>+					unsigned int num_folios,</div><div class='add'>+				        unsigned int total_len)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int i;</div><div class='ctx'> 	unsigned int this_len;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; num_pages &amp;&amp; total_len; i++) {</div><div class='add'>+	for (i = 0; i &lt; num_folios &amp;&amp; total_len; i++) {</div><div class='ctx'> 		sg_init_table(&amp;sg[i], 1);</div><div class='del'>-		this_len =  min(page_descs[i].length, total_len);</div><div class='del'>-		sg_set_page(&amp;sg[i], pages[i], this_len, page_descs[i].offset);</div><div class='add'>+		this_len =  min(folio_descs[i].length, total_len);</div><div class='add'>+		sg_set_folio(&amp;sg[i], folios[i], this_len, folio_descs[i].offset);</div><div class='ctx'> 		total_len -= this_len;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1107,10 +1355,10 @@ static unsigned int sg_init_fuse_args(struct scatterlist *sg,</div><div class='ctx'> 		sg_init_one(&amp;sg[total_sgs++], argbuf, len);</div><div class='ctx'> </div><div class='ctx'> 	if (argpages)</div><div class='del'>-		total_sgs += sg_init_fuse_pages(&amp;sg[total_sgs],</div><div class='del'>-						ap-&gt;pages, ap-&gt;descs,</div><div class='del'>-						ap-&gt;num_pages,</div><div class='del'>-						args[numargs - 1].size);</div><div class='add'>+		total_sgs += sg_init_fuse_folios(&amp;sg[total_sgs],</div><div class='add'>+						 ap-&gt;folios, ap-&gt;descs,</div><div class='add'>+						 ap-&gt;num_folios,</div><div class='add'>+						 args[numargs - 1].size);</div><div class='ctx'> </div><div class='ctx'> 	if (len_used)</div><div class='ctx'> 		*len_used = len;</div><div class='hunk'>@@ -1120,7 +1368,8 @@ static unsigned int sg_init_fuse_args(struct scatterlist *sg,</div><div class='ctx'> </div><div class='ctx'> /* Add a request to a virtqueue and kick the device */</div><div class='ctx'> static int virtio_fs_enqueue_req(struct virtio_fs_vq *fsvq,</div><div class='del'>-				 struct fuse_req *req, bool in_flight)</div><div class='add'>+				 struct fuse_req *req, bool in_flight,</div><div class='add'>+				 gfp_t gfp)</div><div class='ctx'> {</div><div class='ctx'> 	/* requests need at least 4 elements */</div><div class='ctx'> 	struct scatterlist *stack_sgs[6];</div><div class='hunk'>@@ -1133,7 +1382,7 @@ static int virtio_fs_enqueue_req(struct virtio_fs_vq *fsvq,</div><div class='ctx'> 	unsigned int out_sgs = 0;</div><div class='ctx'> 	unsigned int in_sgs = 0;</div><div class='ctx'> 	unsigned int total_sgs;</div><div class='del'>-	unsigned int i;</div><div class='add'>+	unsigned int i, hash;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	bool notify;</div><div class='ctx'> 	struct fuse_pqueue *fpq;</div><div class='hunk'>@@ -1141,8 +1390,8 @@ static int virtio_fs_enqueue_req(struct virtio_fs_vq *fsvq,</div><div class='ctx'> 	/* Does the sglist fit on the stack? */</div><div class='ctx'> 	total_sgs = sg_count_fuse_req(req);</div><div class='ctx'> 	if (total_sgs &gt; ARRAY_SIZE(stack_sgs)) {</div><div class='del'>-		sgs = kmalloc_array(total_sgs, sizeof(sgs[0]), GFP_ATOMIC);</div><div class='del'>-		sg = kmalloc_array(total_sgs, sizeof(sg[0]), GFP_ATOMIC);</div><div class='add'>+		sgs = kmalloc_array(total_sgs, sizeof(sgs[0]), gfp);</div><div class='add'>+		sg = kmalloc_array(total_sgs, sizeof(sg[0]), gfp);</div><div class='ctx'> 		if (!sgs || !sg) {</div><div class='ctx'> 			ret = -ENOMEM;</div><div class='ctx'> 			goto out;</div><div class='hunk'>@@ -1150,7 +1399,7 @@ static int virtio_fs_enqueue_req(struct virtio_fs_vq *fsvq,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Use a bounce buffer since stack args cannot be mapped */</div><div class='del'>-	ret = copy_args_to_argbuf(req);</div><div class='add'>+	ret = copy_args_to_argbuf(req, gfp);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -1193,8 +1442,9 @@ static int virtio_fs_enqueue_req(struct virtio_fs_vq *fsvq,</div><div class='ctx'> </div><div class='ctx'> 	/* Request successfully sent. */</div><div class='ctx'> 	fpq = &amp;fsvq-&gt;fud-&gt;pq;</div><div class='add'>+	hash = fuse_req_hash(req-&gt;in.h.unique);</div><div class='ctx'> 	spin_lock(&amp;fpq-&gt;lock);</div><div class='del'>-	list_add_tail(&amp;req-&gt;list, fpq-&gt;processing);</div><div class='add'>+	list_add_tail(&amp;req-&gt;list, &amp;fpq-&gt;processing[hash]);</div><div class='ctx'> 	spin_unlock(&amp;fpq-&gt;lock);</div><div class='ctx'> 	set_bit(FR_SENT, &amp;req-&gt;flags);</div><div class='ctx'> 	/* matches barrier in request_wait_answer() */</div><div class='hunk'>@@ -1222,33 +1472,30 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void virtio_fs_wake_pending_and_unlock(struct fuse_iqueue *fiq)</div><div class='del'>-__releases(fiq-&gt;lock)</div><div class='add'>+static void virtio_fs_send_req(struct fuse_iqueue *fiq, struct fuse_req *req)</div><div class='ctx'> {</div><div class='del'>-	unsigned int queue_id = VQ_REQUEST; /* TODO multiqueue */</div><div class='add'>+	unsigned int queue_id;</div><div class='ctx'> 	struct virtio_fs *fs;</div><div class='del'>-	struct fuse_req *req;</div><div class='ctx'> 	struct virtio_fs_vq *fsvq;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	WARN_ON(list_empty(&amp;fiq-&gt;pending));</div><div class='del'>-	req = list_last_entry(&amp;fiq-&gt;pending, struct fuse_req, list);</div><div class='add'>+	fuse_request_assign_unique(fiq, req);</div><div class='add'>+</div><div class='ctx'> 	clear_bit(FR_PENDING, &amp;req-&gt;flags);</div><div class='del'>-	list_del_init(&amp;req-&gt;list);</div><div class='del'>-	WARN_ON(!list_empty(&amp;fiq-&gt;pending));</div><div class='del'>-	spin_unlock(&amp;fiq-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	fs = fiq-&gt;priv;</div><div class='add'>+	queue_id = fs-&gt;mq_map[raw_smp_processor_id()];</div><div class='ctx'> </div><div class='del'>-	pr_debug("%s: opcode %u unique %#llx nodeid %#llx in.len %u out.len %u\n",</div><div class='del'>-		  __func__, req-&gt;in.h.opcode, req-&gt;in.h.unique,</div><div class='add'>+	pr_debug("%s: opcode %u unique %#llx nodeid %#llx in.len %u out.len %u queue_id %u\n",</div><div class='add'>+		 __func__, req-&gt;in.h.opcode, req-&gt;in.h.unique,</div><div class='ctx'> 		 req-&gt;in.h.nodeid, req-&gt;in.h.len,</div><div class='del'>-		 fuse_len_args(req-&gt;args-&gt;out_numargs, req-&gt;args-&gt;out_args));</div><div class='add'>+		 fuse_len_args(req-&gt;args-&gt;out_numargs, req-&gt;args-&gt;out_args),</div><div class='add'>+		 queue_id);</div><div class='ctx'> </div><div class='ctx'> 	fsvq = &amp;fs-&gt;vqs[queue_id];</div><div class='del'>-	ret = virtio_fs_enqueue_req(fsvq, req, false);</div><div class='add'>+	ret = virtio_fs_enqueue_req(fsvq, req, false, GFP_ATOMIC);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='del'>-		if (ret == -ENOMEM || ret == -ENOSPC) {</div><div class='add'>+		if (ret == -ENOSPC) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Virtqueue full. Retry submission from worker</div><div class='ctx'> 			 * context as we might be holding fc-&gt;bg_lock.</div><div class='hunk'>@@ -1256,8 +1503,6 @@ __releases(fiq-&gt;lock)</div><div class='ctx'> 			spin_lock(&amp;fsvq-&gt;lock);</div><div class='ctx'> 			list_add_tail(&amp;req-&gt;list, &amp;fsvq-&gt;queued_reqs);</div><div class='ctx'> 			inc_in_flight_req(fsvq);</div><div class='del'>-			schedule_delayed_work(&amp;fsvq-&gt;dispatch_work,</div><div class='del'>-						msecs_to_jiffies(1));</div><div class='ctx'> 			spin_unlock(&amp;fsvq-&gt;lock);</div><div class='ctx'> 			return;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1267,17 +1512,17 @@ __releases(fiq-&gt;lock)</div><div class='ctx'> 		/* Can't end request in submission context. Use a worker */</div><div class='ctx'> 		spin_lock(&amp;fsvq-&gt;lock);</div><div class='ctx'> 		list_add_tail(&amp;req-&gt;list, &amp;fsvq-&gt;end_reqs);</div><div class='del'>-		schedule_delayed_work(&amp;fsvq-&gt;dispatch_work, 0);</div><div class='add'>+		schedule_work(&amp;fsvq-&gt;dispatch_work);</div><div class='ctx'> 		spin_unlock(&amp;fsvq-&gt;lock);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct fuse_iqueue_ops virtio_fs_fiq_ops = {</div><div class='del'>-	.wake_forget_and_unlock		= virtio_fs_wake_forget_and_unlock,</div><div class='del'>-	.wake_interrupt_and_unlock	= virtio_fs_wake_interrupt_and_unlock,</div><div class='del'>-	.wake_pending_and_unlock	= virtio_fs_wake_pending_and_unlock,</div><div class='del'>-	.release			= virtio_fs_fiq_release,</div><div class='add'>+	.send_forget	= virtio_fs_send_forget,</div><div class='add'>+	.send_interrupt	= virtio_fs_send_interrupt,</div><div class='add'>+	.send_req	= virtio_fs_send_req,</div><div class='add'>+	.release	= virtio_fs_fiq_release,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static inline void virtio_fs_ctx_set_defaults(struct fuse_fs_context *ctx)</div><div class='hunk'>@@ -1326,8 +1571,8 @@ static int virtio_fs_fill_super(struct super_block *sb, struct fs_context *fsc)</div><div class='ctx'> </div><div class='ctx'> 	/* virtiofs allocates and installs its own fuse devices */</div><div class='ctx'> 	ctx-&gt;fudptr = NULL;</div><div class='del'>-	if (ctx-&gt;dax) {</div><div class='del'>-		if (!fs-&gt;dax_dev) {</div><div class='add'>+	if (ctx-&gt;dax_mode != FUSE_DAX_NEVER) {</div><div class='add'>+		if (ctx-&gt;dax_mode == FUSE_DAX_ALWAYS &amp;&amp; !fs-&gt;dax_dev) {</div><div class='ctx'> 			err = -EINVAL;</div><div class='ctx'> 			pr_err("virtio-fs: dax can't be enabled as filesystem"</div><div class='ctx'> 			       " device does not support it.\n");</div><div class='hunk'>@@ -1421,6 +1666,9 @@ static int virtio_fs_get_tree(struct fs_context *fsc)</div><div class='ctx'> 	unsigned int virtqueue_size;</div><div class='ctx'> 	int err = -EIO;</div><div class='ctx'> </div><div class='add'>+	if (!fsc-&gt;source)</div><div class='add'>+		return invalf(fsc, "No source specified");</div><div class='add'>+</div><div class='ctx'> 	/* This gets a reference on virtio_fs object. This ptr gets installed</div><div class='ctx'> 	 * in fc-&gt;iq-&gt;priv. Once fuse_conn is going away, it calls -&gt;put()</div><div class='ctx'> 	 * to drop the reference to this object.</div><div class='hunk'>@@ -1449,6 +1697,7 @@ static int virtio_fs_get_tree(struct fs_context *fsc)</div><div class='ctx'> 	fc-&gt;delete_stale = true;</div><div class='ctx'> 	fc-&gt;auto_submounts = true;</div><div class='ctx'> 	fc-&gt;sync_fs = true;</div><div class='add'>+	fc-&gt;use_pages_for_kvec_io = true;</div><div class='ctx'> </div><div class='ctx'> 	/* Tell FUSE to split requests that exceed the virtqueue's size */</div><div class='ctx'> 	fc-&gt;max_pages_limit = min_t(unsigned int, fc-&gt;max_pages_limit,</div><div class='hunk'>@@ -1477,9 +1726,7 @@ static int virtio_fs_get_tree(struct fs_context *fsc)</div><div class='ctx'> </div><div class='ctx'> out_err:</div><div class='ctx'> 	kfree(fc);</div><div class='del'>-	mutex_lock(&amp;virtio_fs_mutex);</div><div class='ctx'> 	virtio_fs_put(fs);</div><div class='del'>-	mutex_unlock(&amp;virtio_fs_mutex);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1509,23 +1756,59 @@ static struct file_system_type virtio_fs_type = {</div><div class='ctx'> 	.name		= "virtiofs",</div><div class='ctx'> 	.init_fs_context = virtio_fs_init_fs_context,</div><div class='ctx'> 	.kill_sb	= virtio_kill_sb,</div><div class='add'>+	.fs_flags	= FS_ALLOW_IDMAP,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+static int virtio_fs_uevent(const struct kobject *kobj, struct kobj_uevent_env *env)</div><div class='add'>+{</div><div class='add'>+	const struct virtio_fs *fs = container_of(kobj, struct virtio_fs, kobj);</div><div class='add'>+</div><div class='add'>+	add_uevent_var(env, "TAG=%s", fs-&gt;tag);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct kset_uevent_ops virtio_fs_uevent_ops = {</div><div class='add'>+	.uevent = virtio_fs_uevent,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int __init virtio_fs_sysfs_init(void)</div><div class='add'>+{</div><div class='add'>+	virtio_fs_kset = kset_create_and_add("virtiofs", &amp;virtio_fs_uevent_ops,</div><div class='add'>+					     fs_kobj);</div><div class='add'>+	if (!virtio_fs_kset)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void virtio_fs_sysfs_exit(void)</div><div class='add'>+{</div><div class='add'>+	kset_unregister(virtio_fs_kset);</div><div class='add'>+	virtio_fs_kset = NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int __init virtio_fs_init(void)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = register_virtio_driver(&amp;virtio_fs_driver);</div><div class='add'>+	ret = virtio_fs_sysfs_init();</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='add'>+	ret = register_virtio_driver(&amp;virtio_fs_driver);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto sysfs_exit;</div><div class='add'>+</div><div class='ctx'> 	ret = register_filesystem(&amp;virtio_fs_type);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		unregister_virtio_driver(&amp;virtio_fs_driver);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto unregister_virtio_driver;</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='add'>+</div><div class='add'>+unregister_virtio_driver:</div><div class='add'>+	unregister_virtio_driver(&amp;virtio_fs_driver);</div><div class='add'>+sysfs_exit:</div><div class='add'>+	virtio_fs_sysfs_exit();</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> module_init(virtio_fs_init);</div><div class='ctx'> </div><div class='hunk'>@@ -1533,6 +1816,7 @@ static void __exit virtio_fs_exit(void)</div><div class='ctx'> {</div><div class='ctx'> 	unregister_filesystem(&amp;virtio_fs_type);</div><div class='ctx'> 	unregister_virtio_driver(&amp;virtio_fs_driver);</div><div class='add'>+	virtio_fs_sysfs_exit();</div><div class='ctx'> }</div><div class='ctx'> module_exit(virtio_fs_exit);</div><div class='ctx'> </div><div class='head'>diff --git a/fs/fuse/xattr.c b/fs/fuse/xattr.c<br/>index 0d3e7177fce0..93dfb06b6cea 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/fuse/xattr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/fuse/xattr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/fuse/xattr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/fuse/xattr.c</a></div><div class='hunk'>@@ -81,7 +81,7 @@ ssize_t fuse_getxattr(struct inode *inode, const char *name, void *value,</div><div class='ctx'> 	}</div><div class='ctx'> 	ret = fuse_simple_request(fm, &amp;args);</div><div class='ctx'> 	if (!ret &amp;&amp; !size)</div><div class='del'>-		ret = min_t(ssize_t, outarg.size, XATTR_SIZE_MAX);</div><div class='add'>+		ret = min_t(size_t, outarg.size, XATTR_SIZE_MAX);</div><div class='ctx'> 	if (ret == -ENOSYS) {</div><div class='ctx'> 		fm-&gt;fc-&gt;no_getxattr = 1;</div><div class='ctx'> 		ret = -EOPNOTSUPP;</div><div class='hunk'>@@ -143,7 +143,7 @@ ssize_t fuse_listxattr(struct dentry *entry, char *list, size_t size)</div><div class='ctx'> 	}</div><div class='ctx'> 	ret = fuse_simple_request(fm, &amp;args);</div><div class='ctx'> 	if (!ret &amp;&amp; !size)</div><div class='del'>-		ret = min_t(ssize_t, outarg.size, XATTR_LIST_MAX);</div><div class='add'>+		ret = min_t(size_t, outarg.size, XATTR_LIST_MAX);</div><div class='ctx'> 	if (ret &gt; 0 &amp;&amp; size)</div><div class='ctx'> 		ret = fuse_verify_xattr_list(list, ret);</div><div class='ctx'> 	if (ret == -ENOSYS) {</div><div class='hunk'>@@ -164,9 +164,10 @@ int fuse_removexattr(struct inode *inode, const char *name)</div><div class='ctx'> </div><div class='ctx'> 	args.opcode = FUSE_REMOVEXATTR;</div><div class='ctx'> 	args.nodeid = get_node_id(inode);</div><div class='del'>-	args.in_numargs = 1;</div><div class='del'>-	args.in_args[0].size = strlen(name) + 1;</div><div class='del'>-	args.in_args[0].value = name;</div><div class='add'>+	args.in_numargs = 2;</div><div class='add'>+	fuse_set_zero_arg0(&amp;args);</div><div class='add'>+	args.in_args[1].size = strlen(name) + 1;</div><div class='add'>+	args.in_args[1].value = name;</div><div class='ctx'> 	err = fuse_simple_request(fm, &amp;args);</div><div class='ctx'> 	if (err == -ENOSYS) {</div><div class='ctx'> 		fm-&gt;fc-&gt;no_removexattr = 1;</div><div class='hunk'>@@ -189,7 +190,7 @@ static int fuse_xattr_get(const struct xattr_handler *handler,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int fuse_xattr_set(const struct xattr_handler *handler,</div><div class='del'>-			  struct user_namespace *mnt_userns,</div><div class='add'>+			  struct mnt_idmap *idmap,</div><div class='ctx'> 			  struct dentry *dentry, struct inode *inode,</div><div class='ctx'> 			  const char *name, const void *value, size_t size,</div><div class='ctx'> 			  int flags)</div><div class='hunk'>@@ -203,64 +204,13 @@ static int fuse_xattr_set(const struct xattr_handler *handler,</div><div class='ctx'> 	return fuse_setxattr(inode, name, value, size, flags, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool no_xattr_list(struct dentry *dentry)</div><div class='del'>-{</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int no_xattr_get(const struct xattr_handler *handler,</div><div class='del'>-			struct dentry *dentry, struct inode *inode,</div><div class='del'>-			const char *name, void *value, size_t size)</div><div class='del'>-{</div><div class='del'>-	return -EOPNOTSUPP;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int no_xattr_set(const struct xattr_handler *handler,</div><div class='del'>-			struct user_namespace *mnt_userns,</div><div class='del'>-			struct dentry *dentry, struct inode *nodee,</div><div class='del'>-			const char *name, const void *value,</div><div class='del'>-			size_t size, int flags)</div><div class='del'>-{</div><div class='del'>-	return -EOPNOTSUPP;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static const struct xattr_handler fuse_xattr_handler = {</div><div class='ctx'> 	.prefix = "",</div><div class='ctx'> 	.get    = fuse_xattr_get,</div><div class='ctx'> 	.set    = fuse_xattr_set,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-const struct xattr_handler *fuse_xattr_handlers[] = {</div><div class='del'>-	&amp;fuse_xattr_handler,</div><div class='del'>-	NULL</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-const struct xattr_handler *fuse_acl_xattr_handlers[] = {</div><div class='del'>-	&amp;posix_acl_access_xattr_handler,</div><div class='del'>-	&amp;posix_acl_default_xattr_handler,</div><div class='del'>-	&amp;fuse_xattr_handler,</div><div class='del'>-	NULL</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static const struct xattr_handler fuse_no_acl_access_xattr_handler = {</div><div class='del'>-	.name  = XATTR_NAME_POSIX_ACL_ACCESS,</div><div class='del'>-	.flags = ACL_TYPE_ACCESS,</div><div class='del'>-	.list  = no_xattr_list,</div><div class='del'>-	.get   = no_xattr_get,</div><div class='del'>-	.set   = no_xattr_set,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static const struct xattr_handler fuse_no_acl_default_xattr_handler = {</div><div class='del'>-	.name  = XATTR_NAME_POSIX_ACL_DEFAULT,</div><div class='del'>-	.flags = ACL_TYPE_ACCESS,</div><div class='del'>-	.list  = no_xattr_list,</div><div class='del'>-	.get   = no_xattr_get,</div><div class='del'>-	.set   = no_xattr_set,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-const struct xattr_handler *fuse_no_acl_xattr_handlers[] = {</div><div class='del'>-	&amp;fuse_no_acl_access_xattr_handler,</div><div class='del'>-	&amp;fuse_no_acl_default_xattr_handler,</div><div class='add'>+const struct xattr_handler * const fuse_xattr_handlers[] = {</div><div class='ctx'> 	&amp;fuse_xattr_handler,</div><div class='ctx'> 	NULL</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/gfs2/Kconfig b/fs/gfs2/Kconfig<br/>index 03c966840422..7bd231d16d4a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/Kconfig</a></div><div class='hunk'>@@ -1,9 +1,9 @@</div><div class='ctx'> # SPDX-License-Identifier: GPL-2.0-only</div><div class='ctx'> config GFS2_FS</div><div class='ctx'> 	tristate "GFS2 file system support"</div><div class='add'>+	select BUFFER_HEAD</div><div class='ctx'> 	select FS_POSIX_ACL</div><div class='ctx'> 	select CRC32</div><div class='del'>-	select LIBCRC32C</div><div class='ctx'> 	select QUOTACTL</div><div class='ctx'> 	select FS_IOMAP</div><div class='ctx'> 	help</div><div class='head'>diff --git a/fs/gfs2/acl.c b/fs/gfs2/acl.c<br/>index 734d1f05d823..443640e6fb9c 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/acl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/acl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/acl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/acl.c</a></div><div class='hunk'>@@ -109,9 +109,10 @@ out:</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int gfs2_set_acl(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='add'>+int gfs2_set_acl(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		 struct posix_acl *acl, int type)</div><div class='ctx'> {</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	struct gfs2_inode *ip = GFS2_I(inode);</div><div class='ctx'> 	struct gfs2_holder gh;</div><div class='ctx'> 	bool need_unlock = false;</div><div class='hunk'>@@ -134,14 +135,14 @@ int gfs2_set_acl(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 	mode = inode-&gt;i_mode;</div><div class='ctx'> 	if (type == ACL_TYPE_ACCESS &amp;&amp; acl) {</div><div class='del'>-		ret = posix_acl_update_mode(&amp;init_user_ns, inode, &amp;mode, &amp;acl);</div><div class='add'>+		ret = posix_acl_update_mode(&amp;nop_mnt_idmap, inode, &amp;mode, &amp;acl);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = __gfs2_set_acl(inode, acl, type);</div><div class='ctx'> 	if (!ret &amp;&amp; mode != inode-&gt;i_mode) {</div><div class='del'>-		inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+		inode_set_ctime_current(inode);</div><div class='ctx'> 		inode-&gt;i_mode = mode;</div><div class='ctx'> 		mark_inode_dirty(inode);</div><div class='ctx'> 	}</div><div class='head'>diff --git a/fs/gfs2/acl.h b/fs/gfs2/acl.h<br/>index cd180ca7c959..82f5b09c04e6 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/acl.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/acl.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/acl.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/acl.h</a></div><div class='hunk'>@@ -11,9 +11,9 @@</div><div class='ctx'> </div><div class='ctx'> #define GFS2_ACL_MAX_ENTRIES(sdp) ((300 &lt;&lt; (sdp)-&gt;sd_sb.sb_bsize_shift) &gt;&gt; 12)</div><div class='ctx'> </div><div class='del'>-extern struct posix_acl *gfs2_get_acl(struct inode *inode, int type, bool rcu);</div><div class='del'>-extern int __gfs2_set_acl(struct inode *inode, struct posix_acl *acl, int type);</div><div class='del'>-extern int gfs2_set_acl(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='del'>-			struct posix_acl *acl, int type);</div><div class='add'>+struct posix_acl *gfs2_get_acl(struct inode *inode, int type, bool rcu);</div><div class='add'>+int __gfs2_set_acl(struct inode *inode, struct posix_acl *acl, int type);</div><div class='add'>+int gfs2_set_acl(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='add'>+		 struct posix_acl *acl, int type);</div><div class='ctx'> </div><div class='ctx'> #endif /* __ACL_DOT_H__ */</div><div class='head'>diff --git a/fs/gfs2/aops.c b/fs/gfs2/aops.c<br/>index 005e920f5d4a..e79ad087512a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/aops.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/aops.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/aops.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/aops.c</a></div><div class='hunk'>@@ -37,27 +37,6 @@</div><div class='ctx'> #include "aops.h"</div><div class='ctx'> </div><div class='ctx'> </div><div class='del'>-void gfs2_page_add_databufs(struct gfs2_inode *ip, struct page *page,</div><div class='del'>-			    unsigned int from, unsigned int len)</div><div class='del'>-{</div><div class='del'>-	struct buffer_head *head = page_buffers(page);</div><div class='del'>-	unsigned int bsize = head-&gt;b_size;</div><div class='del'>-	struct buffer_head *bh;</div><div class='del'>-	unsigned int to = from + len;</div><div class='del'>-	unsigned int start, end;</div><div class='del'>-</div><div class='del'>-	for (bh = head, start = 0; bh != head || !start;</div><div class='del'>-	     bh = bh-&gt;b_this_page, start = end) {</div><div class='del'>-		end = start + bsize;</div><div class='del'>-		if (end &lt;= from)</div><div class='del'>-			continue;</div><div class='del'>-		if (start &gt;= to)</div><div class='del'>-			break;</div><div class='del'>-		set_buffer_uptodate(bh);</div><div class='del'>-		gfs2_trans_add_data(ip-&gt;i_gl, bh);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /**</div><div class='ctx'>  * gfs2_get_block_noalloc - Fills in a buffer head with details about a block</div><div class='ctx'>  * @inode: The inode</div><div class='hunk'>@@ -82,115 +61,90 @@ static int gfs2_get_block_noalloc(struct inode *inode, sector_t lblock,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * gfs2_writepage - Write page for writeback mappings</div><div class='del'>- * @page: The page</div><div class='del'>- * @wbc: The writeback control</div><div class='del'>- */</div><div class='del'>-static int gfs2_writepage(struct page *page, struct writeback_control *wbc)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-	struct gfs2_inode *ip = GFS2_I(inode);</div><div class='del'>-	struct gfs2_sbd *sdp = GFS2_SB(inode);</div><div class='del'>-	struct iomap_writepage_ctx wpc = { };</div><div class='del'>-</div><div class='del'>-	if (gfs2_assert_withdraw(sdp, gfs2_glock_is_held_excl(ip-&gt;i_gl)))</div><div class='del'>-		goto out;</div><div class='del'>-	if (current-&gt;journal_info)</div><div class='del'>-		goto redirty;</div><div class='del'>-	return iomap_writepage(page, wbc, &amp;wpc, &amp;gfs2_writeback_ops);</div><div class='del'>-</div><div class='del'>-redirty:</div><div class='del'>-	redirty_page_for_writepage(wbc, page);</div><div class='del'>-out:</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * gfs2_write_jdata_page - gfs2 jdata-specific version of block_write_full_page</div><div class='del'>- * @page: The page to write</div><div class='add'>+ * gfs2_write_jdata_folio - gfs2 jdata-specific version of block_write_full_folio</div><div class='add'>+ * @folio: The folio to write</div><div class='ctx'>  * @wbc: The writeback control</div><div class='ctx'>  *</div><div class='del'>- * This is the same as calling block_write_full_page, but it also</div><div class='add'>+ * This is the same as calling block_write_full_folio, but it also</div><div class='ctx'>  * writes pages outside of i_size</div><div class='ctx'>  */</div><div class='del'>-static int gfs2_write_jdata_page(struct page *page,</div><div class='add'>+static int gfs2_write_jdata_folio(struct folio *folio,</div><div class='ctx'> 				 struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='del'>-	struct inode * const inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode * const inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	loff_t i_size = i_size_read(inode);</div><div class='del'>-	const pgoff_t end_index = i_size &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	unsigned offset;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * The page straddles i_size.  It must be zeroed out on each and every</div><div class='add'>+	 * The folio straddles i_size.  It must be zeroed out on each and every</div><div class='ctx'> 	 * writepage invocation because it may be mmapped.  "A file is mapped</div><div class='ctx'> 	 * in multiples of the page size.  For a file that is not a multiple of</div><div class='del'>-	 * the  page size, the remaining memory is zeroed when mapped, and</div><div class='add'>+	 * the page size, the remaining memory is zeroed when mapped, and</div><div class='ctx'> 	 * writes to that region are not written out to the file."</div><div class='ctx'> 	 */</div><div class='del'>-	offset = i_size &amp; (PAGE_SIZE - 1);</div><div class='del'>-	if (page-&gt;index == end_index &amp;&amp; offset)</div><div class='del'>-		zero_user_segment(page, offset, PAGE_SIZE);</div><div class='add'>+	if (folio_pos(folio) &lt; i_size &amp;&amp; i_size &lt; folio_next_pos(folio))</div><div class='add'>+		folio_zero_segment(folio, offset_in_folio(folio, i_size),</div><div class='add'>+				folio_size(folio));</div><div class='ctx'> </div><div class='del'>-	return __block_write_full_page(inode, page, gfs2_get_block_noalloc, wbc,</div><div class='del'>-				       end_buffer_async_write);</div><div class='add'>+	return __block_write_full_folio(inode, folio, gfs2_get_block_noalloc,</div><div class='add'>+			wbc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * __gfs2_jdata_writepage - The core of jdata writepage</div><div class='del'>- * @page: The page to write</div><div class='add'>+ * __gfs2_jdata_write_folio - The core of jdata writepage</div><div class='add'>+ * @folio: The folio to write</div><div class='ctx'>  * @wbc: The writeback control</div><div class='ctx'>  *</div><div class='del'>- * This is shared between writepage and writepages and implements the</div><div class='del'>- * core of the writepage operation. If a transaction is required then</div><div class='del'>- * PageChecked will have been set and the transaction will have</div><div class='add'>+ * Implements the core of write back. If a transaction is required then</div><div class='add'>+ * the checked flag will have been set and the transaction will have</div><div class='ctx'>  * already been started before this is called.</div><div class='ctx'>  */</div><div class='del'>-</div><div class='del'>-static int __gfs2_jdata_writepage(struct page *page, struct writeback_control *wbc)</div><div class='add'>+static int __gfs2_jdata_write_folio(struct folio *folio,</div><div class='add'>+		struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	struct gfs2_inode *ip = GFS2_I(inode);</div><div class='del'>-	struct gfs2_sbd *sdp = GFS2_SB(inode);</div><div class='ctx'> </div><div class='del'>-	if (PageChecked(page)) {</div><div class='del'>-		ClearPageChecked(page);</div><div class='del'>-		if (!page_has_buffers(page)) {</div><div class='del'>-			create_empty_buffers(page, inode-&gt;i_sb-&gt;s_blocksize,</div><div class='del'>-					     BIT(BH_Dirty)|BIT(BH_Uptodate));</div><div class='add'>+	if (folio_test_checked(folio)) {</div><div class='add'>+		folio_clear_checked(folio);</div><div class='add'>+		if (!folio_buffers(folio)) {</div><div class='add'>+			create_empty_buffers(folio,</div><div class='add'>+					inode-&gt;i_sb-&gt;s_blocksize,</div><div class='add'>+					BIT(BH_Dirty)|BIT(BH_Uptodate));</div><div class='ctx'> 		}</div><div class='del'>-		gfs2_page_add_databufs(ip, page, 0, sdp-&gt;sd_vfs-&gt;s_blocksize);</div><div class='add'>+		gfs2_trans_add_databufs(ip-&gt;i_gl, folio, 0, folio_size(folio));</div><div class='ctx'> 	}</div><div class='del'>-	return gfs2_write_jdata_page(page, wbc);</div><div class='add'>+	return gfs2_write_jdata_folio(folio, wbc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * gfs2_jdata_writepage - Write complete page</div><div class='del'>- * @page: Page to write</div><div class='add'>+ * gfs2_jdata_writeback - Write jdata folios to the log</div><div class='add'>+ * @mapping: The mapping to write</div><div class='ctx'>  * @wbc: The writeback control</div><div class='ctx'>  *</div><div class='ctx'>  * Returns: errno</div><div class='del'>- *</div><div class='ctx'>  */</div><div class='del'>-</div><div class='del'>-static int gfs2_jdata_writepage(struct page *page, struct writeback_control *wbc)</div><div class='add'>+int gfs2_jdata_writeback(struct address_space *mapping, struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *inode = mapping-&gt;host;</div><div class='ctx'> 	struct gfs2_inode *ip = GFS2_I(inode);</div><div class='del'>-	struct gfs2_sbd *sdp = GFS2_SB(inode);</div><div class='add'>+	struct gfs2_sbd *sdp = GFS2_SB(mapping-&gt;host);</div><div class='add'>+	struct folio *folio = NULL;</div><div class='add'>+	int error;</div><div class='ctx'> </div><div class='del'>-	if (gfs2_assert_withdraw(sdp, gfs2_glock_is_held_excl(ip-&gt;i_gl)))</div><div class='del'>-		goto out;</div><div class='del'>-	if (PageChecked(page) || current-&gt;journal_info)</div><div class='del'>-		goto out_ignore;</div><div class='del'>-	return __gfs2_jdata_writepage(page, wbc);</div><div class='add'>+	BUG_ON(current-&gt;journal_info);</div><div class='add'>+	if (gfs2_assert_withdraw(sdp, ip-&gt;i_gl-&gt;gl_state == LM_ST_EXCLUSIVE))</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-out_ignore:</div><div class='del'>-	redirty_page_for_writepage(wbc, page);</div><div class='del'>-out:</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	return 0;</div><div class='add'>+	while ((folio = writeback_iter(mapping, wbc, folio, &amp;error))) {</div><div class='add'>+		if (folio_test_checked(folio)) {</div><div class='add'>+			folio_redirty_for_writepage(wbc, folio);</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+		error = __gfs2_jdata_write_folio(folio, wbc);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -204,99 +158,99 @@ static int gfs2_writepages(struct address_space *mapping,</div><div class='ctx'> 			   struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_sbd *sdp = gfs2_mapping2sbd(mapping);</div><div class='del'>-	struct iomap_writepage_ctx wpc = { };</div><div class='add'>+	struct iomap_writepage_ctx wpc = {</div><div class='add'>+		.inode		= mapping-&gt;host,</div><div class='add'>+		.wbc		= wbc,</div><div class='add'>+		.ops		= &amp;gfs2_writeback_ops,</div><div class='add'>+	};</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Even if we didn't write any pages here, we might still be holding</div><div class='add'>+	 * Even if we didn't write enough pages here, we might still be holding</div><div class='ctx'> 	 * dirty pages in the ail. We forcibly flush the ail because we don't</div><div class='ctx'> 	 * want balance_dirty_pages() to loop indefinitely trying to write out</div><div class='ctx'> 	 * pages held in the ail that it can't find.</div><div class='ctx'> 	 */</div><div class='del'>-	ret = iomap_writepages(mapping, wbc, &amp;wpc, &amp;gfs2_writeback_ops);</div><div class='del'>-	if (ret == 0)</div><div class='add'>+	ret = iomap_writepages(&amp;wpc);</div><div class='add'>+	if (ret == 0 &amp;&amp; wbc-&gt;nr_to_write &gt; 0)</div><div class='ctx'> 		set_bit(SDF_FORCE_AIL_FLUSH, &amp;sdp-&gt;sd_flags);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * gfs2_write_jdata_pagevec - Write back a pagevec's worth of pages</div><div class='add'>+ * gfs2_write_jdata_batch - Write back a folio batch's worth of folios</div><div class='ctx'>  * @mapping: The mapping</div><div class='ctx'>  * @wbc: The writeback control</div><div class='del'>- * @pvec: The vector of pages</div><div class='del'>- * @nr_pages: The number of pages to write</div><div class='add'>+ * @fbatch: The batch of folios</div><div class='ctx'>  * @done_index: Page index</div><div class='ctx'>  *</div><div class='ctx'>  * Returns: non-zero if loop should terminate, zero otherwise</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static int gfs2_write_jdata_pagevec(struct address_space *mapping,</div><div class='add'>+static int gfs2_write_jdata_batch(struct address_space *mapping,</div><div class='ctx'> 				    struct writeback_control *wbc,</div><div class='del'>-				    struct pagevec *pvec,</div><div class='del'>-				    int nr_pages,</div><div class='add'>+				    struct folio_batch *fbatch,</div><div class='ctx'> 				    pgoff_t *done_index)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='ctx'> 	struct gfs2_sbd *sdp = GFS2_SB(inode);</div><div class='del'>-	unsigned nrblocks = nr_pages * (PAGE_SIZE &gt;&gt; inode-&gt;i_blkbits);</div><div class='add'>+	unsigned nrblocks;</div><div class='ctx'> 	int i;</div><div class='ctx'> 	int ret;</div><div class='add'>+	size_t size = 0;</div><div class='add'>+	int nr_folios = folio_batch_count(fbatch);</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; nr_folios; i++)</div><div class='add'>+		size += folio_size(fbatch-&gt;folios[i]);</div><div class='add'>+	nrblocks = size &gt;&gt; inode-&gt;i_blkbits;</div><div class='ctx'> </div><div class='ctx'> 	ret = gfs2_trans_begin(sdp, nrblocks, nrblocks);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	for(i = 0; i &lt; nr_pages; i++) {</div><div class='del'>-		struct page *page = pvec-&gt;pages[i];</div><div class='add'>+	for (i = 0; i &lt; nr_folios; i++) {</div><div class='add'>+		struct folio *folio = fbatch-&gt;folios[i];</div><div class='ctx'> </div><div class='del'>-		*done_index = page-&gt;index;</div><div class='add'>+		*done_index = folio-&gt;index;</div><div class='ctx'> </div><div class='del'>-		lock_page(page);</div><div class='add'>+		folio_lock(folio);</div><div class='ctx'> </div><div class='del'>-		if (unlikely(page-&gt;mapping != mapping)) {</div><div class='add'>+		if (unlikely(folio-&gt;mapping != mapping)) {</div><div class='ctx'> continue_unlock:</div><div class='del'>-			unlock_page(page);</div><div class='add'>+			folio_unlock(folio);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (!PageDirty(page)) {</div><div class='add'>+		if (!folio_test_dirty(folio)) {</div><div class='ctx'> 			/* someone wrote it for us */</div><div class='ctx'> 			goto continue_unlock;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (PageWriteback(page)) {</div><div class='add'>+		if (folio_test_writeback(folio)) {</div><div class='ctx'> 			if (wbc-&gt;sync_mode != WB_SYNC_NONE)</div><div class='del'>-				wait_on_page_writeback(page);</div><div class='add'>+				folio_wait_writeback(folio);</div><div class='ctx'> 			else</div><div class='ctx'> 				goto continue_unlock;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		BUG_ON(PageWriteback(page));</div><div class='del'>-		if (!clear_page_dirty_for_io(page))</div><div class='add'>+		BUG_ON(folio_test_writeback(folio));</div><div class='add'>+		if (!folio_clear_dirty_for_io(folio))</div><div class='ctx'> 			goto continue_unlock;</div><div class='ctx'> </div><div class='ctx'> 		trace_wbc_writepage(wbc, inode_to_bdi(inode));</div><div class='ctx'> </div><div class='del'>-		ret = __gfs2_jdata_writepage(page, wbc);</div><div class='add'>+		ret = __gfs2_jdata_write_folio(folio, wbc);</div><div class='ctx'> 		if (unlikely(ret)) {</div><div class='del'>-			if (ret == AOP_WRITEPAGE_ACTIVATE) {</div><div class='del'>-				unlock_page(page);</div><div class='del'>-				ret = 0;</div><div class='del'>-			} else {</div><div class='del'>-</div><div class='del'>-				/*</div><div class='del'>-				 * done_index is set past this page,</div><div class='del'>-				 * so media errors will not choke</div><div class='del'>-				 * background writeout for the entire</div><div class='del'>-				 * file. This has consequences for</div><div class='del'>-				 * range_cyclic semantics (ie. it may</div><div class='del'>-				 * not be suitable for data integrity</div><div class='del'>-				 * writeout).</div><div class='del'>-				 */</div><div class='del'>-				*done_index = page-&gt;index + 1;</div><div class='del'>-				ret = 1;</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='add'>+			/*</div><div class='add'>+			 * done_index is set past this page, so media errors</div><div class='add'>+			 * will not choke background writeout for the entire</div><div class='add'>+			 * file. This has consequences for range_cyclic</div><div class='add'>+			 * semantics (ie. it may not be suitable for data</div><div class='add'>+			 * integrity writeout).</div><div class='add'>+			 */</div><div class='add'>+			*done_index = folio_next_index(folio);</div><div class='add'>+			ret = 1;</div><div class='add'>+			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='hunk'>@@ -330,8 +284,8 @@ static int gfs2_write_cache_jdata(struct address_space *mapping,</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	int done = 0;</div><div class='del'>-	struct pagevec pvec;</div><div class='del'>-	int nr_pages;</div><div class='add'>+	struct folio_batch fbatch;</div><div class='add'>+	int nr_folios;</div><div class='ctx'> 	pgoff_t writeback_index;</div><div class='ctx'> 	pgoff_t index;</div><div class='ctx'> 	pgoff_t end;</div><div class='hunk'>@@ -340,7 +294,7 @@ static int gfs2_write_cache_jdata(struct address_space *mapping,</div><div class='ctx'> 	int range_whole = 0;</div><div class='ctx'> 	xa_mark_t tag;</div><div class='ctx'> </div><div class='del'>-	pagevec_init(&amp;pvec);</div><div class='add'>+	folio_batch_init(&amp;fbatch);</div><div class='ctx'> 	if (wbc-&gt;range_cyclic) {</div><div class='ctx'> 		writeback_index = mapping-&gt;writeback_index; /* prev offset */</div><div class='ctx'> 		index = writeback_index;</div><div class='hunk'>@@ -356,27 +310,25 @@ static int gfs2_write_cache_jdata(struct address_space *mapping,</div><div class='ctx'> 			range_whole = 1;</div><div class='ctx'> 		cycled = 1; /* ignore range_cyclic tests */</div><div class='ctx'> 	}</div><div class='del'>-	if (wbc-&gt;sync_mode == WB_SYNC_ALL || wbc-&gt;tagged_writepages)</div><div class='del'>-		tag = PAGECACHE_TAG_TOWRITE;</div><div class='del'>-	else</div><div class='del'>-		tag = PAGECACHE_TAG_DIRTY;</div><div class='add'>+	tag = wbc_to_tag(wbc);</div><div class='ctx'> </div><div class='ctx'> retry:</div><div class='ctx'> 	if (wbc-&gt;sync_mode == WB_SYNC_ALL || wbc-&gt;tagged_writepages)</div><div class='ctx'> 		tag_pages_for_writeback(mapping, index, end);</div><div class='ctx'> 	done_index = index;</div><div class='ctx'> 	while (!done &amp;&amp; (index &lt;= end)) {</div><div class='del'>-		nr_pages = pagevec_lookup_range_tag(&amp;pvec, mapping, &amp;index, end,</div><div class='del'>-				tag);</div><div class='del'>-		if (nr_pages == 0)</div><div class='add'>+		nr_folios = filemap_get_folios_tag(mapping, &amp;index, end,</div><div class='add'>+				tag, &amp;fbatch);</div><div class='add'>+		if (nr_folios == 0)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		ret = gfs2_write_jdata_pagevec(mapping, wbc, &amp;pvec, nr_pages, &amp;done_index);</div><div class='add'>+		ret = gfs2_write_jdata_batch(mapping, wbc, &amp;fbatch,</div><div class='add'>+				&amp;done_index);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			done = 1;</div><div class='ctx'> 		if (ret &gt; 0)</div><div class='ctx'> 			ret = 0;</div><div class='del'>-		pagevec_release(&amp;pvec);</div><div class='add'>+		folio_batch_release(&amp;fbatch);</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -423,83 +375,69 @@ static int gfs2_jdata_writepages(struct address_space *mapping,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * stuffed_readpage - Fill in a Linux page with stuffed file data</div><div class='add'>+ * stuffed_read_folio - Fill in a Linux folio with stuffed file data</div><div class='ctx'>  * @ip: the inode</div><div class='del'>- * @page: the page</div><div class='add'>+ * @folio: the folio</div><div class='ctx'>  *</div><div class='ctx'>  * Returns: errno</div><div class='ctx'>  */</div><div class='del'>-static int stuffed_readpage(struct gfs2_inode *ip, struct page *page)</div><div class='add'>+static int stuffed_read_folio(struct gfs2_inode *ip, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct buffer_head *dibh;</div><div class='del'>-	u64 dsize = i_size_read(&amp;ip-&gt;i_inode);</div><div class='del'>-	void *kaddr;</div><div class='del'>-	int error;</div><div class='add'>+	struct buffer_head *dibh = NULL;</div><div class='add'>+	size_t dsize = i_size_read(&amp;ip-&gt;i_inode);</div><div class='add'>+	void *from = NULL;</div><div class='add'>+	int error = 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Due to the order of unstuffing files and -&gt;fault(), we can be</div><div class='del'>-	 * asked for a zero page in the case of a stuffed file being extended,</div><div class='add'>+	 * asked for a zero folio in the case of a stuffed file being extended,</div><div class='ctx'> 	 * so we need to supply one here. It doesn't happen often.</div><div class='ctx'> 	 */</div><div class='del'>-	if (unlikely(page-&gt;index)) {</div><div class='del'>-		zero_user(page, 0, PAGE_SIZE);</div><div class='del'>-		SetPageUptodate(page);</div><div class='del'>-		return 0;</div><div class='add'>+	if (unlikely(folio-&gt;index)) {</div><div class='add'>+		dsize = 0;</div><div class='add'>+	} else {</div><div class='add'>+		error = gfs2_meta_inode_buffer(ip, &amp;dibh);</div><div class='add'>+		if (error)</div><div class='add'>+			goto out;</div><div class='add'>+		from = dibh-&gt;b_data + sizeof(struct gfs2_dinode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	error = gfs2_meta_inode_buffer(ip, &amp;dibh);</div><div class='del'>-	if (error)</div><div class='del'>-		return error;</div><div class='del'>-</div><div class='del'>-	kaddr = kmap_atomic(page);</div><div class='del'>-	if (dsize &gt; gfs2_max_stuffed_size(ip))</div><div class='del'>-		dsize = gfs2_max_stuffed_size(ip);</div><div class='del'>-	memcpy(kaddr, dibh-&gt;b_data + sizeof(struct gfs2_dinode), dsize);</div><div class='del'>-	memset(kaddr + dsize, 0, PAGE_SIZE - dsize);</div><div class='del'>-	kunmap_atomic(kaddr);</div><div class='del'>-	flush_dcache_page(page);</div><div class='add'>+	folio_fill_tail(folio, 0, from, dsize);</div><div class='ctx'> 	brelse(dibh);</div><div class='del'>-	SetPageUptodate(page);</div><div class='add'>+out:</div><div class='add'>+	folio_end_read(folio, error == 0);</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-</div><div class='del'>-static int __gfs2_readpage(void *file, struct page *page)</div><div class='add'>+/**</div><div class='add'>+ * gfs2_read_folio - read a folio from a file</div><div class='add'>+ * @file: The file to read</div><div class='add'>+ * @folio: The folio in the file</div><div class='add'>+ */</div><div class='add'>+static int gfs2_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	struct gfs2_inode *ip = GFS2_I(inode);</div><div class='ctx'> 	struct gfs2_sbd *sdp = GFS2_SB(inode);</div><div class='del'>-	int error;</div><div class='add'>+	int error = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (!gfs2_is_jdata(ip) ||</div><div class='del'>-	    (i_blocksize(inode) == PAGE_SIZE &amp;&amp; !page_has_buffers(page))) {</div><div class='del'>-		error = iomap_readpage(page, &amp;gfs2_iomap_ops);</div><div class='add'>+	    (i_blocksize(inode) == PAGE_SIZE &amp;&amp; !folio_buffers(folio))) {</div><div class='add'>+		iomap_bio_read_folio(folio, &amp;gfs2_iomap_ops);</div><div class='ctx'> 	} else if (gfs2_is_stuffed(ip)) {</div><div class='del'>-		error = stuffed_readpage(ip, page);</div><div class='del'>-		unlock_page(page);</div><div class='add'>+		error = stuffed_read_folio(ip, folio);</div><div class='ctx'> 	} else {</div><div class='del'>-		error = mpage_readpage(page, gfs2_block_map);</div><div class='add'>+		error = mpage_read_folio(folio, gfs2_block_map);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (unlikely(gfs2_withdrawn(sdp)))</div><div class='add'>+	if (gfs2_withdrawn(sdp))</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> </div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * gfs2_readpage - read a page of a file</div><div class='del'>- * @file: The file to read</div><div class='del'>- * @page: The page of the file</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-static int gfs2_readpage(struct file *file, struct page *page)</div><div class='del'>-{</div><div class='del'>-	return __gfs2_readpage(file, page);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='ctx'>  * gfs2_internal_read - read an internal file</div><div class='ctx'>  * @ip: The gfs2 inode</div><div class='ctx'>  * @buf: The buffer to fill</div><div class='hunk'>@@ -508,31 +446,29 @@ static int gfs2_readpage(struct file *file, struct page *page)</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-int gfs2_internal_read(struct gfs2_inode *ip, char *buf, loff_t *pos,</div><div class='del'>-                       unsigned size)</div><div class='add'>+ssize_t gfs2_internal_read(struct gfs2_inode *ip, char *buf, loff_t *pos,</div><div class='add'>+			   size_t size)</div><div class='ctx'> {</div><div class='ctx'> 	struct address_space *mapping = ip-&gt;i_inode.i_mapping;</div><div class='ctx'> 	unsigned long index = *pos &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	unsigned offset = *pos &amp; (PAGE_SIZE - 1);</div><div class='del'>-	unsigned copied = 0;</div><div class='del'>-	unsigned amt;</div><div class='del'>-	struct page *page;</div><div class='del'>-	void *p;</div><div class='add'>+	size_t copied = 0;</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='del'>-		amt = size - copied;</div><div class='del'>-		if (offset + size &gt; PAGE_SIZE)</div><div class='del'>-			amt = PAGE_SIZE - offset;</div><div class='del'>-		page = read_cache_page(mapping, index, __gfs2_readpage, NULL);</div><div class='del'>-		if (IS_ERR(page))</div><div class='del'>-			return PTR_ERR(page);</div><div class='del'>-		p = kmap_atomic(page);</div><div class='del'>-		memcpy(buf + copied, p + offset, amt);</div><div class='del'>-		kunmap_atomic(p);</div><div class='del'>-		put_page(page);</div><div class='del'>-		copied += amt;</div><div class='del'>-		index++;</div><div class='del'>-		offset = 0;</div><div class='add'>+		size_t offset, chunk;</div><div class='add'>+		struct folio *folio;</div><div class='add'>+</div><div class='add'>+		folio = read_cache_folio(mapping, index, gfs2_read_folio, NULL);</div><div class='add'>+		if (IS_ERR(folio)) {</div><div class='add'>+			if (PTR_ERR(folio) == -EINTR)</div><div class='add'>+				continue;</div><div class='add'>+			return PTR_ERR(folio);</div><div class='add'>+		}</div><div class='add'>+		offset = *pos + copied - folio_pos(folio);</div><div class='add'>+		chunk = min(size - copied, folio_size(folio) - offset);</div><div class='add'>+		memcpy_from_folio(buf + copied, folio, offset, chunk);</div><div class='add'>+		index = folio_next_index(folio);</div><div class='add'>+		folio_put(folio);</div><div class='add'>+		copied += chunk;</div><div class='ctx'> 	} while(copied &lt; size);</div><div class='ctx'> 	(*pos) += size;</div><div class='ctx'> 	return size;</div><div class='hunk'>@@ -563,7 +499,7 @@ static void gfs2_readahead(struct readahead_control *rac)</div><div class='ctx'> 	else if (gfs2_is_jdata(ip))</div><div class='ctx'> 		mpage_readahead(rac, gfs2_block_map);</div><div class='ctx'> 	else</div><div class='del'>-		iomap_readahead(rac, &amp;gfs2_iomap_ops);</div><div class='add'>+		iomap_bio_readahead(rac, &amp;gfs2_iomap_ops);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -606,18 +542,12 @@ out:</div><div class='ctx'> 	gfs2_trans_end(sdp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * jdata_set_page_dirty - Page dirtying function</div><div class='del'>- * @page: The page to dirty</div><div class='del'>- *</div><div class='del'>- * Returns: 1 if it dirtyed the page, or 0 otherwise</div><div class='del'>- */</div><div class='del'>- </div><div class='del'>-static int jdata_set_page_dirty(struct page *page)</div><div class='add'>+static bool gfs2_jdata_dirty_folio(struct address_space *mapping,</div><div class='add'>+		struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	if (current-&gt;journal_info)</div><div class='del'>-		SetPageChecked(page);</div><div class='del'>-	return __set_page_dirty_buffers(page);</div><div class='add'>+		folio_set_checked(folio);</div><div class='add'>+	return block_dirty_folio(mapping, folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -672,22 +602,23 @@ static void gfs2_discard(struct gfs2_sbd *sdp, struct buffer_head *bh)</div><div class='ctx'> 	unlock_buffer(bh);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void gfs2_invalidatepage(struct page *page, unsigned int offset,</div><div class='del'>-				unsigned int length)</div><div class='add'>+static void gfs2_invalidate_folio(struct folio *folio, size_t offset,</div><div class='add'>+				size_t length)</div><div class='ctx'> {</div><div class='del'>-	struct gfs2_sbd *sdp = GFS2_SB(page-&gt;mapping-&gt;host);</div><div class='del'>-	unsigned int stop = offset + length;</div><div class='del'>-	int partial_page = (offset || length &lt; PAGE_SIZE);</div><div class='add'>+	struct gfs2_sbd *sdp = GFS2_SB(folio-&gt;mapping-&gt;host);</div><div class='add'>+	size_t stop = offset + length;</div><div class='add'>+	int partial_page = (offset || length &lt; folio_size(folio));</div><div class='ctx'> 	struct buffer_head *bh, *head;</div><div class='ctx'> 	unsigned long pos = 0;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(!PageLocked(page));</div><div class='add'>+	BUG_ON(!folio_test_locked(folio));</div><div class='ctx'> 	if (!partial_page)</div><div class='del'>-		ClearPageChecked(page);</div><div class='del'>-	if (!page_has_buffers(page))</div><div class='add'>+		folio_clear_checked(folio);</div><div class='add'>+	head = folio_buffers(folio);</div><div class='add'>+	if (!head)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	bh = head = page_buffers(page);</div><div class='add'>+	bh = head;</div><div class='ctx'> 	do {</div><div class='ctx'> 		if (pos + bh-&gt;b_size &gt; stop)</div><div class='ctx'> 			return;</div><div class='hunk'>@@ -699,42 +630,44 @@ static void gfs2_invalidatepage(struct page *page, unsigned int offset,</div><div class='ctx'> 	} while (bh != head);</div><div class='ctx'> out:</div><div class='ctx'> 	if (!partial_page)</div><div class='del'>-		try_to_release_page(page, 0);</div><div class='add'>+		filemap_release_folio(folio, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * gfs2_releasepage - free the metadata associated with a page</div><div class='del'>- * @page: the page that's being released</div><div class='add'>+ * gfs2_release_folio - free the metadata associated with a folio</div><div class='add'>+ * @folio: the folio that's being released</div><div class='ctx'>  * @gfp_mask: passed from Linux VFS, ignored by us</div><div class='ctx'>  *</div><div class='del'>- * Calls try_to_free_buffers() to free the buffers and put the page if the</div><div class='add'>+ * Calls try_to_free_buffers() to free the buffers and put the folio if the</div><div class='ctx'>  * buffers can be released.</div><div class='ctx'>  *</div><div class='del'>- * Returns: 1 if the page was put or else 0</div><div class='add'>+ * Returns: true if the folio was put or else false</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-int gfs2_releasepage(struct page *page, gfp_t gfp_mask)</div><div class='add'>+bool gfs2_release_folio(struct folio *folio, gfp_t gfp_mask)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *mapping = page-&gt;mapping;</div><div class='add'>+	struct address_space *mapping = folio-&gt;mapping;</div><div class='ctx'> 	struct gfs2_sbd *sdp = gfs2_mapping2sbd(mapping);</div><div class='ctx'> 	struct buffer_head *bh, *head;</div><div class='ctx'> 	struct gfs2_bufdata *bd;</div><div class='ctx'> </div><div class='del'>-	if (!page_has_buffers(page))</div><div class='del'>-		return 0;</div><div class='add'>+	head = folio_buffers(folio);</div><div class='add'>+	if (!head)</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * From xfs_vm_releasepage: mm accommodates an old ext3 case where</div><div class='del'>-	 * clean pages might not have had the dirty bit cleared.  Thus, it can</div><div class='del'>-	 * send actual dirty pages to -&gt;releasepage() via shrink_active_list().</div><div class='add'>+	 * mm accommodates an old ext3 case where clean folios might</div><div class='add'>+	 * not have had the dirty bit cleared.	Thus, it can send actual</div><div class='add'>+	 * dirty folios to -&gt;release_folio() via shrink_active_list().</div><div class='ctx'> 	 *</div><div class='del'>-	 * As a workaround, we skip pages that contain dirty buffers below.</div><div class='del'>-	 * Once -&gt;releasepage isn't called on dirty pages anymore, we can warn</div><div class='del'>-	 * on dirty buffers like we used to here again.</div><div class='add'>+	 * As a workaround, we skip folios that contain dirty buffers</div><div class='add'>+	 * below.  Once -&gt;release_folio isn't called on dirty folios</div><div class='add'>+	 * anymore, we can warn on dirty buffers like we used to here</div><div class='add'>+	 * again.</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='ctx'> 	gfs2_log_lock(sdp);</div><div class='del'>-	head = bh = page_buffers(page);</div><div class='add'>+	bh = head;</div><div class='ctx'> 	do {</div><div class='ctx'> 		if (atomic_read(&amp;bh-&gt;b_count))</div><div class='ctx'> 			goto cannot_release;</div><div class='hunk'>@@ -744,9 +677,9 @@ int gfs2_releasepage(struct page *page, gfp_t gfp_mask)</div><div class='ctx'> 		if (buffer_dirty(bh) || WARN_ON(buffer_pinned(bh)))</div><div class='ctx'> 			goto cannot_release;</div><div class='ctx'> 		bh = bh-&gt;b_this_page;</div><div class='del'>-	} while(bh != head);</div><div class='add'>+	} while (bh != head);</div><div class='ctx'> </div><div class='del'>-	head = bh = page_buffers(page);</div><div class='add'>+	bh = head;</div><div class='ctx'> 	do {</div><div class='ctx'> 		bd = bh-&gt;b_private;</div><div class='ctx'> 		if (bd) {</div><div class='hunk'>@@ -767,39 +700,37 @@ int gfs2_releasepage(struct page *page, gfp_t gfp_mask)</div><div class='ctx'> 	} while (bh != head);</div><div class='ctx'> 	gfs2_log_unlock(sdp);</div><div class='ctx'> </div><div class='del'>-	return try_to_free_buffers(page);</div><div class='add'>+	return try_to_free_buffers(folio);</div><div class='ctx'> </div><div class='ctx'> cannot_release:</div><div class='ctx'> 	gfs2_log_unlock(sdp);</div><div class='del'>-	return 0;</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct address_space_operations gfs2_aops = {</div><div class='del'>-	.writepage = gfs2_writepage,</div><div class='ctx'> 	.writepages = gfs2_writepages,</div><div class='del'>-	.readpage = gfs2_readpage,</div><div class='add'>+	.read_folio = gfs2_read_folio,</div><div class='ctx'> 	.readahead = gfs2_readahead,</div><div class='del'>-	.set_page_dirty = __set_page_dirty_nobuffers,</div><div class='del'>-	.releasepage = iomap_releasepage,</div><div class='del'>-	.invalidatepage = iomap_invalidatepage,</div><div class='add'>+	.dirty_folio = iomap_dirty_folio,</div><div class='add'>+	.release_folio = iomap_release_folio,</div><div class='add'>+	.invalidate_folio = iomap_invalidate_folio,</div><div class='ctx'> 	.bmap = gfs2_bmap,</div><div class='del'>-	.direct_IO = noop_direct_IO,</div><div class='del'>-	.migratepage = iomap_migrate_page,</div><div class='add'>+	.migrate_folio = filemap_migrate_folio,</div><div class='ctx'> 	.is_partially_uptodate = iomap_is_partially_uptodate,</div><div class='del'>-	.error_remove_page = generic_error_remove_page,</div><div class='add'>+	.error_remove_folio = generic_error_remove_folio,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct address_space_operations gfs2_jdata_aops = {</div><div class='del'>-	.writepage = gfs2_jdata_writepage,</div><div class='ctx'> 	.writepages = gfs2_jdata_writepages,</div><div class='del'>-	.readpage = gfs2_readpage,</div><div class='add'>+	.read_folio = gfs2_read_folio,</div><div class='ctx'> 	.readahead = gfs2_readahead,</div><div class='del'>-	.set_page_dirty = jdata_set_page_dirty,</div><div class='add'>+	.dirty_folio = gfs2_jdata_dirty_folio,</div><div class='ctx'> 	.bmap = gfs2_bmap,</div><div class='del'>-	.invalidatepage = gfs2_invalidatepage,</div><div class='del'>-	.releasepage = gfs2_releasepage,</div><div class='add'>+	.migrate_folio = buffer_migrate_folio,</div><div class='add'>+	.invalidate_folio = gfs2_invalidate_folio,</div><div class='add'>+	.release_folio = gfs2_release_folio,</div><div class='ctx'> 	.is_partially_uptodate = block_is_partially_uptodate,</div><div class='del'>-	.error_remove_page = generic_error_remove_page,</div><div class='add'>+	.error_remove_folio = generic_error_remove_folio,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> void gfs2_set_aops(struct inode *inode)</div><div class='head'>diff --git a/fs/gfs2/aops.h b/fs/gfs2/aops.h<br/>index ff9877a68780..bf002522a782 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/aops.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/aops.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/aops.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/aops.h</a></div><div class='hunk'>@@ -8,8 +8,7 @@</div><div class='ctx'> </div><div class='ctx'> #include "incore.h"</div><div class='ctx'> </div><div class='del'>-extern void adjust_fs_space(struct inode *inode);</div><div class='del'>-extern void gfs2_page_add_databufs(struct gfs2_inode *ip, struct page *page,</div><div class='del'>-				   unsigned int from, unsigned int len);</div><div class='add'>+void adjust_fs_space(struct inode *inode);</div><div class='add'>+int gfs2_jdata_writeback(struct address_space *mapping, struct writeback_control *wbc);</div><div class='ctx'> </div><div class='ctx'> #endif /* __AOPS_DOT_H__ */</div><div class='head'>diff --git a/fs/gfs2/bmap.c b/fs/gfs2/bmap.c<br/>index 7235d539e969..131091520de6 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/bmap.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/bmap.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/bmap.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/bmap.c</a></div><div class='hunk'>@@ -43,56 +43,51 @@ struct metapath {</div><div class='ctx'> static int punch_hole(struct gfs2_inode *ip, u64 offset, u64 length);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * gfs2_unstuffer_page - unstuff a stuffed inode into a block cached by a page</div><div class='add'>+ * gfs2_unstuffer_folio - unstuff a stuffed inode into a block cached by a folio</div><div class='ctx'>  * @ip: the inode</div><div class='ctx'>  * @dibh: the dinode buffer</div><div class='ctx'>  * @block: the block number that was allocated</div><div class='del'>- * @page: The (optional) page. This is looked up if @page is NULL</div><div class='add'>+ * @folio: The folio.</div><div class='ctx'>  *</div><div class='ctx'>  * Returns: errno</div><div class='ctx'>  */</div><div class='del'>-</div><div class='del'>-static int gfs2_unstuffer_page(struct gfs2_inode *ip, struct buffer_head *dibh,</div><div class='del'>-			       u64 block, struct page *page)</div><div class='add'>+static int gfs2_unstuffer_folio(struct gfs2_inode *ip, struct buffer_head *dibh,</div><div class='add'>+			       u64 block, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = &amp;ip-&gt;i_inode;</div><div class='ctx'> </div><div class='del'>-	if (!PageUptodate(page)) {</div><div class='del'>-		void *kaddr = kmap(page);</div><div class='add'>+	if (!folio_test_uptodate(folio)) {</div><div class='add'>+		void *kaddr = kmap_local_folio(folio, 0);</div><div class='ctx'> 		u64 dsize = i_size_read(inode);</div><div class='ctx'>  </div><div class='del'>-		if (dsize &gt; gfs2_max_stuffed_size(ip))</div><div class='del'>-			dsize = gfs2_max_stuffed_size(ip);</div><div class='del'>-</div><div class='ctx'> 		memcpy(kaddr, dibh-&gt;b_data + sizeof(struct gfs2_dinode), dsize);</div><div class='del'>-		memset(kaddr + dsize, 0, PAGE_SIZE - dsize);</div><div class='del'>-		kunmap(page);</div><div class='add'>+		memset(kaddr + dsize, 0, folio_size(folio) - dsize);</div><div class='add'>+		kunmap_local(kaddr);</div><div class='ctx'> </div><div class='del'>-		SetPageUptodate(page);</div><div class='add'>+		folio_mark_uptodate(folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (gfs2_is_jdata(ip)) {</div><div class='del'>-		struct buffer_head *bh;</div><div class='add'>+		struct buffer_head *bh = folio_buffers(folio);</div><div class='ctx'> </div><div class='del'>-		if (!page_has_buffers(page))</div><div class='del'>-			create_empty_buffers(page, BIT(inode-&gt;i_blkbits),</div><div class='del'>-					     BIT(BH_Uptodate));</div><div class='add'>+		if (!bh)</div><div class='add'>+			bh = create_empty_buffers(folio,</div><div class='add'>+				BIT(inode-&gt;i_blkbits), BIT(BH_Uptodate));</div><div class='ctx'> </div><div class='del'>-		bh = page_buffers(page);</div><div class='ctx'> 		if (!buffer_mapped(bh))</div><div class='ctx'> 			map_bh(bh, inode-&gt;i_sb, block);</div><div class='ctx'> </div><div class='ctx'> 		set_buffer_uptodate(bh);</div><div class='ctx'> 		gfs2_trans_add_data(ip-&gt;i_gl, bh);</div><div class='ctx'> 	} else {</div><div class='del'>-		set_page_dirty(page);</div><div class='add'>+		folio_mark_dirty(folio);</div><div class='ctx'> 		gfs2_ordered_add_inode(ip);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __gfs2_unstuff_inode(struct gfs2_inode *ip, struct page *page)</div><div class='add'>+static int __gfs2_unstuff_inode(struct gfs2_inode *ip, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *bh, *dibh;</div><div class='ctx'> 	struct gfs2_dinode *di;</div><div class='hunk'>@@ -109,7 +104,7 @@ static int __gfs2_unstuff_inode(struct gfs2_inode *ip, struct page *page)</div><div class='ctx'> 		   and write it out to disk */</div><div class='ctx'> </div><div class='ctx'> 		unsigned int n = 1;</div><div class='del'>-		error = gfs2_alloc_blocks(ip, &amp;block, &amp;n, 0, NULL);</div><div class='add'>+		error = gfs2_alloc_blocks(ip, &amp;block, &amp;n, 0);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			goto out_brelse;</div><div class='ctx'> 		if (isdir) {</div><div class='hunk'>@@ -121,7 +116,7 @@ static int __gfs2_unstuff_inode(struct gfs2_inode *ip, struct page *page)</div><div class='ctx'> 					      dibh, sizeof(struct gfs2_dinode));</div><div class='ctx'> 			brelse(bh);</div><div class='ctx'> 		} else {</div><div class='del'>-			error = gfs2_unstuffer_page(ip, dibh, block, page);</div><div class='add'>+			error = gfs2_unstuffer_folio(ip, dibh, block, folio);</div><div class='ctx'> 			if (error)</div><div class='ctx'> 				goto out_brelse;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -160,17 +155,17 @@ out_brelse:</div><div class='ctx'> int gfs2_unstuff_dinode(struct gfs2_inode *ip)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = &amp;ip-&gt;i_inode;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='ctx'> 	down_write(&amp;ip-&gt;i_rw_mutex);</div><div class='del'>-	page = find_or_create_page(inode-&gt;i_mapping, 0, GFP_NOFS);</div><div class='del'>-	error = -ENOMEM;</div><div class='del'>-	if (!page)</div><div class='add'>+	folio = filemap_grab_folio(inode-&gt;i_mapping, 0);</div><div class='add'>+	error = PTR_ERR(folio);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='ctx'> 		goto out;</div><div class='del'>-	error = __gfs2_unstuff_inode(ip, page);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='add'>+	error = __gfs2_unstuff_inode(ip, folio);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> out:</div><div class='ctx'> 	up_write(&amp;ip-&gt;i_rw_mutex);</div><div class='ctx'> 	return error;</div><div class='hunk'>@@ -310,9 +305,8 @@ static void gfs2_metapath_ra(struct gfs2_glock *gl, __be64 *start, __be64 *end)</div><div class='ctx'> 		if (trylock_buffer(rabh)) {</div><div class='ctx'> 			if (!buffer_uptodate(rabh)) {</div><div class='ctx'> 				rabh-&gt;b_end_io = end_buffer_read_sync;</div><div class='del'>-				submit_bh(REQ_OP_READ,</div><div class='del'>-					  REQ_RAHEAD | REQ_META | REQ_PRIO,</div><div class='del'>-					  rabh);</div><div class='add'>+				submit_bh(REQ_OP_READ | REQ_RAHEAD | REQ_META |</div><div class='add'>+					  REQ_PRIO, rabh);</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> 			unlock_buffer(rabh);</div><div class='hunk'>@@ -321,6 +315,12 @@ static void gfs2_metapath_ra(struct gfs2_glock *gl, __be64 *start, __be64 *end)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline struct buffer_head *</div><div class='add'>+metapath_dibh(struct metapath *mp)</div><div class='add'>+{</div><div class='add'>+	return mp-&gt;mp_bh[0];</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int __fillup_metapath(struct gfs2_inode *ip, struct metapath *mp,</div><div class='ctx'> 			     unsigned int x, unsigned int h)</div><div class='ctx'> {</div><div class='hunk'>@@ -419,13 +419,12 @@ static void release_metapath(struct metapath *mp)</div><div class='ctx'>  * gfs2_extent_length - Returns length of an extent of blocks</div><div class='ctx'>  * @bh: The metadata block</div><div class='ctx'>  * @ptr: Current position in @bh</div><div class='del'>- * @limit: Max extent length to return</div><div class='ctx'>  * @eob: Set to 1 if we hit "end of block"</div><div class='ctx'>  *</div><div class='ctx'>  * Returns: The length of the extent (minimum of one block)</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static inline unsigned int gfs2_extent_length(struct buffer_head *bh, __be64 *ptr, size_t limit, int *eob)</div><div class='add'>+static inline unsigned int gfs2_extent_length(struct buffer_head *bh, __be64 *ptr, int *eob)</div><div class='ctx'> {</div><div class='ctx'> 	const __be64 *end = (__be64 *)(bh-&gt;b_data + bh-&gt;b_size);</div><div class='ctx'> 	const __be64 *first = ptr;</div><div class='hunk'>@@ -606,9 +605,9 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline __be64 *gfs2_indirect_init(struct metapath *mp,</div><div class='del'>-					 struct gfs2_glock *gl, unsigned int i,</div><div class='del'>-					 unsigned offset, u64 bn)</div><div class='add'>+static inline void gfs2_indirect_init(struct metapath *mp,</div><div class='add'>+				      struct gfs2_glock *gl, unsigned int i,</div><div class='add'>+				      unsigned offset, u64 bn)</div><div class='ctx'> {</div><div class='ctx'> 	__be64 *ptr = (__be64 *)(mp-&gt;mp_bh[i - 1]-&gt;b_data +</div><div class='ctx'> 		       ((i &gt; 1) ? sizeof(struct gfs2_meta_header) :</div><div class='hunk'>@@ -621,7 +620,6 @@ static inline __be64 *gfs2_indirect_init(struct metapath *mp,</div><div class='ctx'> 	gfs2_buffer_clear_tail(mp-&gt;mp_bh[i], sizeof(struct gfs2_meta_header));</div><div class='ctx'> 	ptr += offset;</div><div class='ctx'> 	*ptr = cpu_to_be64(bn);</div><div class='del'>-	return ptr;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> enum alloc_state {</div><div class='hunk'>@@ -665,7 +663,7 @@ static int __gfs2_iomap_alloc(struct inode *inode, struct iomap *iomap,</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_inode *ip = GFS2_I(inode);</div><div class='ctx'> 	struct gfs2_sbd *sdp = GFS2_SB(inode);</div><div class='del'>-	struct buffer_head *dibh = mp-&gt;mp_bh[0];</div><div class='add'>+	struct buffer_head *dibh = metapath_dibh(mp);</div><div class='ctx'> 	u64 bn;</div><div class='ctx'> 	unsigned n, i, blks, alloced = 0, iblks = 0, branch_start = 0;</div><div class='ctx'> 	size_t dblks = iomap-&gt;length &gt;&gt; inode-&gt;i_blkbits;</div><div class='hunk'>@@ -707,7 +705,7 @@ static int __gfs2_iomap_alloc(struct inode *inode, struct iomap *iomap,</div><div class='ctx'> 	i = mp-&gt;mp_aheight;</div><div class='ctx'> 	do {</div><div class='ctx'> 		n = blks - alloced;</div><div class='del'>-		ret = gfs2_alloc_blocks(ip, &amp;bn, &amp;n, 0, NULL);</div><div class='add'>+		ret = gfs2_alloc_blocks(ip, &amp;bn, &amp;n, 0);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		alloced += n;</div><div class='hunk'>@@ -918,7 +916,7 @@ unstuff:</div><div class='ctx'> 		goto do_alloc;</div><div class='ctx'> </div><div class='ctx'> 	bh = mp-&gt;mp_bh[ip-&gt;i_height - 1];</div><div class='del'>-	len = gfs2_extent_length(bh, ptr, len, &amp;eob);</div><div class='add'>+	len = gfs2_extent_length(bh, ptr, &amp;eob);</div><div class='ctx'> </div><div class='ctx'> 	iomap-&gt;addr = be64_to_cpu(*ptr) &lt;&lt; inode-&gt;i_blkbits;</div><div class='ctx'> 	iomap-&gt;length = len &lt;&lt; inode-&gt;i_blkbits;</div><div class='hunk'>@@ -940,7 +938,7 @@ do_alloc:</div><div class='ctx'> 		else if (height == ip-&gt;i_height)</div><div class='ctx'> 			ret = gfs2_hole_size(inode, lblock, len, mp, iomap);</div><div class='ctx'> 		else</div><div class='del'>-			iomap-&gt;length = size - pos;</div><div class='add'>+			iomap-&gt;length = size - iomap-&gt;offset;</div><div class='ctx'> 	} else if (flags &amp; IOMAP_WRITE) {</div><div class='ctx'> 		u64 alloc_size;</div><div class='ctx'> </div><div class='hunk'>@@ -961,36 +959,56 @@ hole_found:</div><div class='ctx'> 	goto out;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int gfs2_iomap_page_prepare(struct inode *inode, loff_t pos,</div><div class='del'>-				   unsigned len)</div><div class='add'>+static struct folio *</div><div class='add'>+gfs2_iomap_get_folio(struct iomap_iter *iter, loff_t pos, unsigned len)</div><div class='ctx'> {</div><div class='add'>+	struct inode *inode = iter-&gt;inode;</div><div class='add'>+	struct gfs2_inode *ip = GFS2_I(inode);</div><div class='ctx'> 	unsigned int blockmask = i_blocksize(inode) - 1;</div><div class='ctx'> 	struct gfs2_sbd *sdp = GFS2_SB(inode);</div><div class='ctx'> 	unsigned int blocks;</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	int status;</div><div class='add'>+</div><div class='add'>+	if (!gfs2_is_jdata(ip) &amp;&amp; !gfs2_is_stuffed(ip))</div><div class='add'>+		return iomap_get_folio(iter, pos, len);</div><div class='ctx'> </div><div class='ctx'> 	blocks = ((pos &amp; blockmask) + len + blockmask) &gt;&gt; inode-&gt;i_blkbits;</div><div class='del'>-	return gfs2_trans_begin(sdp, RES_DINODE + blocks, 0);</div><div class='add'>+	status = gfs2_trans_begin(sdp, RES_DINODE + blocks, 0);</div><div class='add'>+	if (status)</div><div class='add'>+		return ERR_PTR(status);</div><div class='add'>+</div><div class='add'>+	folio = iomap_get_folio(iter, pos, len);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		gfs2_trans_end(sdp);</div><div class='add'>+	return folio;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void gfs2_iomap_page_done(struct inode *inode, loff_t pos,</div><div class='del'>-				 unsigned copied, struct page *page)</div><div class='add'>+static void gfs2_iomap_put_folio(struct inode *inode, loff_t pos,</div><div class='add'>+				 unsigned copied, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_trans *tr = current-&gt;journal_info;</div><div class='ctx'> 	struct gfs2_inode *ip = GFS2_I(inode);</div><div class='ctx'> 	struct gfs2_sbd *sdp = GFS2_SB(inode);</div><div class='ctx'> </div><div class='del'>-	if (page &amp;&amp; !gfs2_is_stuffed(ip))</div><div class='del'>-		gfs2_page_add_databufs(ip, page, offset_in_page(pos), copied);</div><div class='add'>+	if (gfs2_is_jdata(ip) &amp;&amp; !gfs2_is_stuffed(ip))</div><div class='add'>+		gfs2_trans_add_databufs(ip-&gt;i_gl, folio,</div><div class='add'>+					offset_in_folio(folio, pos),</div><div class='add'>+					copied);</div><div class='ctx'> </div><div class='del'>-	if (tr-&gt;tr_num_buf_new)</div><div class='del'>-		__mark_inode_dirty(inode, I_DIRTY_DATASYNC);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> </div><div class='del'>-	gfs2_trans_end(sdp);</div><div class='add'>+	if (gfs2_is_jdata(ip) || gfs2_is_stuffed(ip)) {</div><div class='add'>+		if (tr-&gt;tr_num_buf_new)</div><div class='add'>+			__mark_inode_dirty(inode, I_DIRTY_DATASYNC);</div><div class='add'>+		gfs2_trans_end(sdp);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static const struct iomap_page_ops gfs2_iomap_page_ops = {</div><div class='del'>-	.page_prepare = gfs2_iomap_page_prepare,</div><div class='del'>-	.page_done = gfs2_iomap_page_done,</div><div class='add'>+const struct iomap_write_ops gfs2_iomap_write_ops = {</div><div class='add'>+	.get_folio = gfs2_iomap_get_folio,</div><div class='add'>+	.put_folio = gfs2_iomap_put_folio,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static int gfs2_iomap_begin_write(struct inode *inode, loff_t pos,</div><div class='hunk'>@@ -1065,8 +1083,6 @@ static int gfs2_iomap_begin_write(struct inode *inode, loff_t pos,</div><div class='ctx'> 		gfs2_trans_end(sdp);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (gfs2_is_stuffed(ip) || gfs2_is_jdata(ip))</div><div class='del'>-		iomap-&gt;page_ops = &amp;gfs2_iomap_page_ops;</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> out_trans_end:</div><div class='hunk'>@@ -1154,13 +1170,12 @@ static int gfs2_iomap_end(struct inode *inode, loff_t pos, loff_t length,</div><div class='ctx'> </div><div class='ctx'> 	if (length != written &amp;&amp; (iomap-&gt;flags &amp; IOMAP_F_NEW)) {</div><div class='ctx'> 		/* Deallocate blocks that were just allocated. */</div><div class='del'>-		loff_t blockmask = i_blocksize(inode) - 1;</div><div class='del'>-		loff_t end = (pos + length) &amp; ~blockmask;</div><div class='add'>+		loff_t hstart = round_up(pos + written, i_blocksize(inode));</div><div class='add'>+		loff_t hend = iomap-&gt;offset + iomap-&gt;length;</div><div class='ctx'> </div><div class='del'>-		pos = (pos + written + blockmask) &amp; ~blockmask;</div><div class='del'>-		if (pos &lt; end) {</div><div class='del'>-			truncate_pagecache_range(inode, pos, end - 1);</div><div class='del'>-			punch_hole(ip, pos, end - pos);</div><div class='add'>+		if (hstart &lt; hend) {</div><div class='add'>+			truncate_pagecache_range(inode, hstart, hend - 1);</div><div class='add'>+			punch_hole(ip, hstart, hend - hstart);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1283,13 +1298,16 @@ int gfs2_alloc_extent(struct inode *inode, u64 lblock, u64 *dblock,</div><div class='ctx'> /*</div><div class='ctx'>  * NOTE: Never call gfs2_block_zero_range with an open transaction because it</div><div class='ctx'>  * uses iomap write to perform its actions, which begin their own transactions</div><div class='del'>- * (iomap_begin, page_prepare, etc.)</div><div class='add'>+ * (iomap_begin, get_folio, etc.)</div><div class='ctx'>  */</div><div class='del'>-static int gfs2_block_zero_range(struct inode *inode, loff_t from,</div><div class='del'>-				 unsigned int length)</div><div class='add'>+static int gfs2_block_zero_range(struct inode *inode, loff_t from, loff_t length)</div><div class='ctx'> {</div><div class='ctx'> 	BUG_ON(current-&gt;journal_info);</div><div class='del'>-	return iomap_zero_range(inode, from, length, NULL, &amp;gfs2_iomap_ops);</div><div class='add'>+	if (from &gt;= inode-&gt;i_size)</div><div class='add'>+		return 0;</div><div class='add'>+	length = min(length, inode-&gt;i_size - from);</div><div class='add'>+	return iomap_zero_range(inode, from, length, NULL, &amp;gfs2_iomap_ops,</div><div class='add'>+			&amp;gfs2_iomap_write_ops, NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #define GFS2_JTRUNC_REVOKES 8192</div><div class='hunk'>@@ -1378,7 +1396,7 @@ static int trunc_start(struct inode *inode, u64 newsize)</div><div class='ctx'> 		ip-&gt;i_diskflags |= GFS2_DIF_TRUNC_IN_PROG;</div><div class='ctx'> </div><div class='ctx'> 	i_size_write(inode, newsize);</div><div class='del'>-	ip-&gt;i_inode.i_mtime = ip-&gt;i_inode.i_ctime = current_time(&amp;ip-&gt;i_inode);</div><div class='add'>+	inode_set_mtime_to_ts(&amp;ip-&gt;i_inode, inode_set_ctime_current(&amp;ip-&gt;i_inode));</div><div class='ctx'> 	gfs2_dinode_out(ip, dibh-&gt;b_data);</div><div class='ctx'> </div><div class='ctx'> 	if (journaled)</div><div class='hunk'>@@ -1575,8 +1593,7 @@ out_unlock:</div><div class='ctx'> </div><div class='ctx'> 			/* Every transaction boundary, we rewrite the dinode</div><div class='ctx'> 			   to keep its di_blocks current in case of failure. */</div><div class='del'>-			ip-&gt;i_inode.i_mtime = ip-&gt;i_inode.i_ctime =</div><div class='del'>-				current_time(&amp;ip-&gt;i_inode);</div><div class='add'>+			inode_set_mtime_to_ts(&amp;ip-&gt;i_inode, inode_set_ctime_current(&amp;ip-&gt;i_inode));</div><div class='ctx'> 			gfs2_trans_add_meta(ip-&gt;i_gl, dibh);</div><div class='ctx'> 			gfs2_dinode_out(ip, dibh-&gt;b_data);</div><div class='ctx'> 			brelse(dibh);</div><div class='hunk'>@@ -1708,7 +1725,8 @@ static int punch_hole(struct gfs2_inode *ip, u64 offset, u64 length)</div><div class='ctx'> 	struct buffer_head *dibh, *bh;</div><div class='ctx'> 	struct gfs2_holder rd_gh;</div><div class='ctx'> 	unsigned int bsize_shift = sdp-&gt;sd_sb.sb_bsize_shift;</div><div class='del'>-	u64 lblock = (offset + (1 &lt;&lt; bsize_shift) - 1) &gt;&gt; bsize_shift;</div><div class='add'>+	unsigned int bsize = 1 &lt;&lt; bsize_shift;</div><div class='add'>+	u64 lblock = (offset + bsize - 1) &gt;&gt; bsize_shift;</div><div class='ctx'> 	__u16 start_list[GFS2_MAX_META_HEIGHT];</div><div class='ctx'> 	__u16 __end_list[GFS2_MAX_META_HEIGHT], *end_list = NULL;</div><div class='ctx'> 	unsigned int start_aligned, end_aligned;</div><div class='hunk'>@@ -1719,10 +1737,10 @@ static int punch_hole(struct gfs2_inode *ip, u64 offset, u64 length)</div><div class='ctx'> 	u64 prev_bnr = 0;</div><div class='ctx'> 	__be64 *start, *end;</div><div class='ctx'> </div><div class='del'>-	if (offset &gt;= maxsize) {</div><div class='add'>+	if (offset + bsize - 1 &gt;= maxsize) {</div><div class='ctx'> 		/*</div><div class='del'>-		 * The starting point lies beyond the allocated meta-data;</div><div class='del'>-		 * there are no blocks do deallocate.</div><div class='add'>+		 * The starting point lies beyond the allocated metadata;</div><div class='add'>+		 * there are no blocks to deallocate.</div><div class='ctx'> 		 */</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1816,7 +1834,7 @@ static int punch_hole(struct gfs2_inode *ip, u64 offset, u64 length)</div><div class='ctx'> 			gfs2_assert_withdraw(sdp, bh);</div><div class='ctx'> 			if (gfs2_assert_withdraw(sdp,</div><div class='ctx'> 						 prev_bnr != bh-&gt;b_blocknr)) {</div><div class='del'>-				fs_emerg(sdp, "inode %llu, block:%llu, i_h:%u,"</div><div class='add'>+				fs_emerg(sdp, "inode %llu, block:%llu, i_h:%u, "</div><div class='ctx'> 					 "s_h:%u, mp_h:%u\n",</div><div class='ctx'> 				       (unsigned long long)ip-&gt;i_no_addr,</div><div class='ctx'> 				       prev_bnr, ip-&gt;i_height, strip_h, mp_h);</div><div class='hunk'>@@ -1942,7 +1960,7 @@ static int punch_hole(struct gfs2_inode *ip, u64 offset, u64 length)</div><div class='ctx'> 		gfs2_statfs_change(sdp, 0, +btotal, 0);</div><div class='ctx'> 		gfs2_quota_change(ip, -(s64)btotal, ip-&gt;i_inode.i_uid,</div><div class='ctx'> 				  ip-&gt;i_inode.i_gid);</div><div class='del'>-		ip-&gt;i_inode.i_mtime = ip-&gt;i_inode.i_ctime = current_time(&amp;ip-&gt;i_inode);</div><div class='add'>+		inode_set_mtime_to_ts(&amp;ip-&gt;i_inode, inode_set_ctime_current(&amp;ip-&gt;i_inode));</div><div class='ctx'> 		gfs2_trans_add_meta(ip-&gt;i_gl, dibh);</div><div class='ctx'> 		gfs2_dinode_out(ip, dibh-&gt;b_data);</div><div class='ctx'> 		up_write(&amp;ip-&gt;i_rw_mutex);</div><div class='hunk'>@@ -1985,7 +2003,7 @@ static int trunc_end(struct gfs2_inode *ip)</div><div class='ctx'> 		gfs2_buffer_clear_tail(dibh, sizeof(struct gfs2_dinode));</div><div class='ctx'> 		gfs2_ordered_del_inode(ip);</div><div class='ctx'> 	}</div><div class='del'>-	ip-&gt;i_inode.i_mtime = ip-&gt;i_inode.i_ctime = current_time(&amp;ip-&gt;i_inode);</div><div class='add'>+	inode_set_mtime_to_ts(&amp;ip-&gt;i_inode, inode_set_ctime_current(&amp;ip-&gt;i_inode));</div><div class='ctx'> 	ip-&gt;i_diskflags &amp;= ~GFS2_DIF_TRUNC_IN_PROG;</div><div class='ctx'> </div><div class='ctx'> 	gfs2_trans_add_meta(ip-&gt;i_gl, dibh);</div><div class='hunk'>@@ -2027,14 +2045,6 @@ static int do_shrink(struct inode *inode, u64 newsize)</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void gfs2_trim_blocks(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ret = do_shrink(inode, inode-&gt;i_size);</div><div class='del'>-	WARN_ON(ret != 0);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /**</div><div class='ctx'>  * do_grow - Touch and update inode size</div><div class='ctx'>  * @inode: The inode</div><div class='hunk'>@@ -2094,7 +2104,7 @@ static int do_grow(struct inode *inode, u64 size)</div><div class='ctx'> 		goto do_end_trans;</div><div class='ctx'> </div><div class='ctx'> 	truncate_setsize(inode, size);</div><div class='del'>-	ip-&gt;i_inode.i_mtime = ip-&gt;i_inode.i_ctime = current_time(&amp;ip-&gt;i_inode);</div><div class='add'>+	inode_set_mtime_to_ts(&amp;ip-&gt;i_inode, inode_set_ctime_current(&amp;ip-&gt;i_inode));</div><div class='ctx'> 	gfs2_trans_add_meta(ip-&gt;i_gl, dibh);</div><div class='ctx'> 	gfs2_dinode_out(ip, dibh-&gt;b_data);</div><div class='ctx'> 	brelse(dibh);</div><div class='hunk'>@@ -2146,7 +2156,7 @@ int gfs2_setattr_size(struct inode *inode, u64 newsize)</div><div class='ctx'> </div><div class='ctx'> 	ret = do_shrink(inode, newsize);</div><div class='ctx'> out:</div><div class='del'>-	gfs2_rs_delete(ip, NULL);</div><div class='add'>+	gfs2_rs_delete(ip);</div><div class='ctx'> 	gfs2_qa_put(ip);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -2462,23 +2472,26 @@ out:</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int gfs2_map_blocks(struct iomap_writepage_ctx *wpc, struct inode *inode,</div><div class='del'>-		loff_t offset)</div><div class='add'>+static ssize_t gfs2_writeback_range(struct iomap_writepage_ctx *wpc,</div><div class='add'>+		struct folio *folio, u64 offset, unsigned int len, u64 end_pos)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (WARN_ON_ONCE(gfs2_is_stuffed(GFS2_I(inode))))</div><div class='add'>+	if (WARN_ON_ONCE(gfs2_is_stuffed(GFS2_I(wpc-&gt;inode))))</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> </div><div class='del'>-	if (offset &gt;= wpc-&gt;iomap.offset &amp;&amp;</div><div class='del'>-	    offset &lt; wpc-&gt;iomap.offset + wpc-&gt;iomap.length)</div><div class='del'>-		return 0;</div><div class='add'>+	if (offset &lt; wpc-&gt;iomap.offset ||</div><div class='add'>+	    offset &gt;= wpc-&gt;iomap.offset + wpc-&gt;iomap.length) {</div><div class='add'>+		int ret;</div><div class='ctx'> </div><div class='del'>-	memset(&amp;wpc-&gt;iomap, 0, sizeof(wpc-&gt;iomap));</div><div class='del'>-	ret = gfs2_iomap_get(inode, offset, INT_MAX, &amp;wpc-&gt;iomap);</div><div class='del'>-	return ret;</div><div class='add'>+		memset(&amp;wpc-&gt;iomap, 0, sizeof(wpc-&gt;iomap));</div><div class='add'>+		ret = gfs2_iomap_get(wpc-&gt;inode, offset, INT_MAX, &amp;wpc-&gt;iomap);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return iomap_add_to_ioend(wpc, folio, offset, end_pos, len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct iomap_writeback_ops gfs2_writeback_ops = {</div><div class='del'>-	.map_blocks		= gfs2_map_blocks,</div><div class='add'>+	.writeback_range	= gfs2_writeback_range,</div><div class='add'>+	.writeback_submit	= iomap_ioend_writeback_submit,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/gfs2/bmap.h b/fs/gfs2/bmap.h<br/>index 53cce6c08e81..6cdc72dd55a3 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/bmap.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/bmap.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/bmap.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/bmap.h</a></div><div class='hunk'>@@ -44,27 +44,27 @@ static inline void gfs2_write_calc_reserv(const struct gfs2_inode *ip,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> extern const struct iomap_ops gfs2_iomap_ops;</div><div class='add'>+extern const struct iomap_write_ops gfs2_iomap_write_ops;</div><div class='ctx'> extern const struct iomap_writeback_ops gfs2_writeback_ops;</div><div class='ctx'> </div><div class='del'>-extern int gfs2_unstuff_dinode(struct gfs2_inode *ip);</div><div class='del'>-extern int gfs2_block_map(struct inode *inode, sector_t lblock,</div><div class='del'>-			  struct buffer_head *bh, int create);</div><div class='del'>-extern int gfs2_iomap_get(struct inode *inode, loff_t pos, loff_t length,</div><div class='del'>-			  struct iomap *iomap);</div><div class='del'>-extern int gfs2_iomap_alloc(struct inode *inode, loff_t pos, loff_t length,</div><div class='del'>-			    struct iomap *iomap);</div><div class='del'>-extern int gfs2_get_extent(struct inode *inode, u64 lblock, u64 *dblock,</div><div class='del'>-			   unsigned int *extlen);</div><div class='del'>-extern int gfs2_alloc_extent(struct inode *inode, u64 lblock, u64 *dblock,</div><div class='del'>-			     unsigned *extlen, bool *new);</div><div class='del'>-extern int gfs2_setattr_size(struct inode *inode, u64 size);</div><div class='del'>-extern void gfs2_trim_blocks(struct inode *inode);</div><div class='del'>-extern int gfs2_truncatei_resume(struct gfs2_inode *ip);</div><div class='del'>-extern int gfs2_file_dealloc(struct gfs2_inode *ip);</div><div class='del'>-extern int gfs2_write_alloc_required(struct gfs2_inode *ip, u64 offset,</div><div class='del'>-				     unsigned int len);</div><div class='del'>-extern int gfs2_map_journal_extents(struct gfs2_sbd *sdp, struct gfs2_jdesc *jd);</div><div class='del'>-extern void gfs2_free_journal_extents(struct gfs2_jdesc *jd);</div><div class='del'>-extern int __gfs2_punch_hole(struct file *file, loff_t offset, loff_t length);</div><div class='add'>+int gfs2_unstuff_dinode(struct gfs2_inode *ip);</div><div class='add'>+int gfs2_block_map(struct inode *inode, sector_t lblock,</div><div class='add'>+		   struct buffer_head *bh, int create);</div><div class='add'>+int gfs2_iomap_get(struct inode *inode, loff_t pos, loff_t length,</div><div class='add'>+		   struct iomap *iomap);</div><div class='add'>+int gfs2_iomap_alloc(struct inode *inode, loff_t pos, loff_t length,</div><div class='add'>+		     struct iomap *iomap);</div><div class='add'>+int gfs2_get_extent(struct inode *inode, u64 lblock, u64 *dblock,</div><div class='add'>+		    unsigned int *extlen);</div><div class='add'>+int gfs2_alloc_extent(struct inode *inode, u64 lblock, u64 *dblock,</div><div class='add'>+		      unsigned *extlen, bool *new);</div><div class='add'>+int gfs2_setattr_size(struct inode *inode, u64 size);</div><div class='add'>+int gfs2_truncatei_resume(struct gfs2_inode *ip);</div><div class='add'>+int gfs2_file_dealloc(struct gfs2_inode *ip);</div><div class='add'>+int gfs2_write_alloc_required(struct gfs2_inode *ip, u64 offset,</div><div class='add'>+			      unsigned int len);</div><div class='add'>+int gfs2_map_journal_extents(struct gfs2_sbd *sdp, struct gfs2_jdesc *jd);</div><div class='add'>+void gfs2_free_journal_extents(struct gfs2_jdesc *jd);</div><div class='add'>+int __gfs2_punch_hole(struct file *file, loff_t offset, loff_t length);</div><div class='ctx'> </div><div class='ctx'> #endif /* __BMAP_DOT_H__ */</div><div class='head'>diff --git a/fs/gfs2/dentry.c b/fs/gfs2/dentry.c<br/>index 2e215e8c3c88..95050e719233 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/dentry.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/dentry.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/dentry.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/dentry.c</a></div><div class='hunk'>@@ -21,7 +21,9 @@</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * gfs2_drevalidate - Check directory lookup consistency</div><div class='del'>- * @dentry: the mapping to check</div><div class='add'>+ * @dir: expected parent directory inode</div><div class='add'>+ * @name: expexted name</div><div class='add'>+ * @dentry: dentry to check</div><div class='ctx'>  * @flags: lookup flags</div><div class='ctx'>  *</div><div class='ctx'>  * Check to make sure the lookup necessary to arrive at this inode from its</div><div class='hunk'>@@ -30,50 +32,43 @@</div><div class='ctx'>  * Returns: 1 if the dentry is ok, 0 if it isn't</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static int gfs2_drevalidate(struct dentry *dentry, unsigned int flags)</div><div class='add'>+static int gfs2_drevalidate(struct inode *dir, const struct qstr *name,</div><div class='add'>+			    struct dentry *dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *parent;</div><div class='del'>-	struct gfs2_sbd *sdp;</div><div class='del'>-	struct gfs2_inode *dip;</div><div class='add'>+	struct gfs2_sbd *sdp = GFS2_SB(dir);</div><div class='add'>+	struct gfs2_inode *dip = GFS2_I(dir);</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct gfs2_holder d_gh;</div><div class='ctx'> 	struct gfs2_inode *ip = NULL;</div><div class='del'>-	int error, valid = 0;</div><div class='add'>+	int error, valid;</div><div class='ctx'> 	int had_lock = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; LOOKUP_RCU)</div><div class='ctx'> 		return -ECHILD;</div><div class='ctx'> </div><div class='del'>-	parent = dget_parent(dentry);</div><div class='del'>-	sdp = GFS2_SB(d_inode(parent));</div><div class='del'>-	dip = GFS2_I(d_inode(parent));</div><div class='ctx'> 	inode = d_inode(dentry);</div><div class='ctx'> </div><div class='ctx'> 	if (inode) {</div><div class='ctx'> 		if (is_bad_inode(inode))</div><div class='del'>-			goto out;</div><div class='add'>+			return 0;</div><div class='ctx'> 		ip = GFS2_I(inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (sdp-&gt;sd_lockstruct.ls_ops-&gt;lm_mount == NULL) {</div><div class='del'>-		valid = 1;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (sdp-&gt;sd_lockstruct.ls_ops-&gt;lm_mount == NULL)</div><div class='add'>+		return 1;</div><div class='ctx'> </div><div class='ctx'> 	had_lock = (gfs2_glock_is_locked_by_me(dip-&gt;i_gl) != NULL);</div><div class='ctx'> 	if (!had_lock) {</div><div class='ctx'> 		error = gfs2_glock_nq_init(dip-&gt;i_gl, LM_ST_SHARED, 0, &amp;d_gh);</div><div class='ctx'> 		if (error)</div><div class='del'>-			goto out;</div><div class='add'>+			return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	error = gfs2_dir_check(d_inode(parent), &amp;dentry-&gt;d_name, ip);</div><div class='add'>+	error = gfs2_dir_check(dir, name, ip);</div><div class='ctx'> 	valid = inode ? !error : (error == -ENOENT);</div><div class='ctx'> </div><div class='ctx'> 	if (!had_lock)</div><div class='ctx'> 		gfs2_glock_dq_uninit(&amp;d_gh);</div><div class='del'>-out:</div><div class='del'>-	dput(parent);</div><div class='ctx'> 	return valid;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/gfs2/dir.c b/fs/gfs2/dir.c<br/>index 42b7dfffb5e7..509e2f0d97e7 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/dir.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/dir.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/dir.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/dir.c</a></div><div class='hunk'>@@ -60,6 +60,7 @@</div><div class='ctx'> #include &lt;linux/crc32.h&gt;</div><div class='ctx'> #include &lt;linux/vmalloc.h&gt;</div><div class='ctx'> #include &lt;linux/bio.h&gt;</div><div class='add'>+#include &lt;linux/log2.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "gfs2.h"</div><div class='ctx'> #include "incore.h"</div><div class='hunk'>@@ -130,7 +131,7 @@ static int gfs2_dir_write_stuffed(struct gfs2_inode *ip, const char *buf,</div><div class='ctx'> 	memcpy(dibh-&gt;b_data + offset + sizeof(struct gfs2_dinode), buf, size);</div><div class='ctx'> 	if (ip-&gt;i_inode.i_size &lt; offset + size)</div><div class='ctx'> 		i_size_write(&amp;ip-&gt;i_inode, offset + size);</div><div class='del'>-	ip-&gt;i_inode.i_mtime = ip-&gt;i_inode.i_ctime = current_time(&amp;ip-&gt;i_inode);</div><div class='add'>+	inode_set_mtime_to_ts(&amp;ip-&gt;i_inode, inode_set_ctime_current(&amp;ip-&gt;i_inode));</div><div class='ctx'> 	gfs2_dinode_out(ip, dibh-&gt;b_data);</div><div class='ctx'> </div><div class='ctx'> 	brelse(dibh);</div><div class='hunk'>@@ -227,7 +228,7 @@ out:</div><div class='ctx'> </div><div class='ctx'> 	if (ip-&gt;i_inode.i_size &lt; offset + copied)</div><div class='ctx'> 		i_size_write(&amp;ip-&gt;i_inode, offset + copied);</div><div class='del'>-	ip-&gt;i_inode.i_mtime = ip-&gt;i_inode.i_ctime = current_time(&amp;ip-&gt;i_inode);</div><div class='add'>+	inode_set_mtime_to_ts(&amp;ip-&gt;i_inode, inode_set_ctime_current(&amp;ip-&gt;i_inode));</div><div class='ctx'> </div><div class='ctx'> 	gfs2_trans_add_meta(ip-&gt;i_gl, dibh);</div><div class='ctx'> 	gfs2_dinode_out(ip, dibh-&gt;b_data);</div><div class='hunk'>@@ -562,15 +563,18 @@ static struct gfs2_dirent *gfs2_dirent_scan(struct inode *inode, void *buf,</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	ret = gfs2_dirent_offset(GFS2_SB(inode), buf);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto consist_inode;</div><div class='del'>-</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		gfs2_consist_inode(GFS2_I(inode));</div><div class='add'>+		return ERR_PTR(-EIO);</div><div class='add'>+	}</div><div class='ctx'> 	offset = ret;</div><div class='ctx'> 	prev = NULL;</div><div class='ctx'> 	dent = buf + offset;</div><div class='ctx'> 	size = be16_to_cpu(dent-&gt;de_rec_len);</div><div class='del'>-	if (gfs2_check_dirent(GFS2_SB(inode), dent, offset, size, len, 1))</div><div class='del'>-		goto consist_inode;</div><div class='add'>+	if (gfs2_check_dirent(GFS2_SB(inode), dent, offset, size, len, 1)) {</div><div class='add'>+		gfs2_consist_inode(GFS2_I(inode));</div><div class='add'>+		return ERR_PTR(-EIO);</div><div class='add'>+	}</div><div class='ctx'> 	do {</div><div class='ctx'> 		ret = scan(dent, name, opaque);</div><div class='ctx'> 		if (ret)</div><div class='hunk'>@@ -582,8 +586,10 @@ static struct gfs2_dirent *gfs2_dirent_scan(struct inode *inode, void *buf,</div><div class='ctx'> 		dent = buf + offset;</div><div class='ctx'> 		size = be16_to_cpu(dent-&gt;de_rec_len);</div><div class='ctx'> 		if (gfs2_check_dirent(GFS2_SB(inode), dent, offset, size,</div><div class='del'>-				      len, 0))</div><div class='del'>-			goto consist_inode;</div><div class='add'>+				      len, 0)) {</div><div class='add'>+			gfs2_consist_inode(GFS2_I(inode));</div><div class='add'>+			return ERR_PTR(-EIO);</div><div class='add'>+		}</div><div class='ctx'> 	} while(1);</div><div class='ctx'> </div><div class='ctx'> 	switch(ret) {</div><div class='hunk'>@@ -597,10 +603,6 @@ static struct gfs2_dirent *gfs2_dirent_scan(struct inode *inode, void *buf,</div><div class='ctx'> 		BUG_ON(ret &gt; 0);</div><div class='ctx'> 		return ERR_PTR(ret);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-consist_inode:</div><div class='del'>-	gfs2_consist_inode(GFS2_I(inode));</div><div class='del'>-	return ERR_PTR(-EIO);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int dirent_check_reclen(struct gfs2_inode *dip,</div><div class='hunk'>@@ -609,14 +611,16 @@ static int dirent_check_reclen(struct gfs2_inode *dip,</div><div class='ctx'> 	const void *ptr = d;</div><div class='ctx'> 	u16 rec_len = be16_to_cpu(d-&gt;de_rec_len);</div><div class='ctx'> </div><div class='del'>-	if (unlikely(rec_len &lt; sizeof(struct gfs2_dirent)))</div><div class='del'>-		goto broken;</div><div class='add'>+	if (unlikely(rec_len &lt; sizeof(struct gfs2_dirent))) {</div><div class='add'>+		gfs2_consist_inode(dip);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='ctx'> 	ptr += rec_len;</div><div class='ctx'> 	if (ptr &lt; end_p)</div><div class='ctx'> 		return rec_len;</div><div class='ctx'> 	if (ptr == end_p)</div><div class='ctx'> 		return -ENOENT;</div><div class='del'>-broken:</div><div class='add'>+</div><div class='ctx'> 	gfs2_consist_inode(dip);</div><div class='ctx'> 	return -EIO;</div><div class='ctx'> }</div><div class='hunk'>@@ -868,7 +872,7 @@ static struct gfs2_leaf *new_leaf(struct inode *inode, struct buffer_head **pbh,</div><div class='ctx'> 	struct gfs2_dirent *dent;</div><div class='ctx'> 	struct timespec64 tv = current_time(inode);</div><div class='ctx'> </div><div class='del'>-	error = gfs2_alloc_blocks(ip, &amp;bn, &amp;n, 0, NULL);</div><div class='add'>+	error = gfs2_alloc_blocks(ip, &amp;bn, &amp;n, 0);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	bh = gfs2_meta_new(ip-&gt;i_gl, bn);</div><div class='hunk'>@@ -909,7 +913,6 @@ static int dir_make_exhash(struct inode *inode)</div><div class='ctx'> 	struct qstr args;</div><div class='ctx'> 	struct buffer_head *bh, *dibh;</div><div class='ctx'> 	struct gfs2_leaf *leaf;</div><div class='del'>-	int y;</div><div class='ctx'> 	u32 x;</div><div class='ctx'> 	__be64 *lp;</div><div class='ctx'> 	u64 bn;</div><div class='hunk'>@@ -976,9 +979,7 @@ static int dir_make_exhash(struct inode *inode)</div><div class='ctx'> 	i_size_write(inode, sdp-&gt;sd_sb.sb_bsize / 2);</div><div class='ctx'> 	gfs2_add_inode_blocks(&amp;dip-&gt;i_inode, 1);</div><div class='ctx'> 	dip-&gt;i_diskflags |= GFS2_DIF_EXHASH;</div><div class='del'>-</div><div class='del'>-	for (x = sdp-&gt;sd_hash_ptrs, y = -1; x; x &gt;&gt;= 1, y++) ;</div><div class='del'>-	dip-&gt;i_depth = y;</div><div class='add'>+	dip-&gt;i_depth = ilog2(sdp-&gt;sd_hash_ptrs);</div><div class='ctx'> </div><div class='ctx'> 	gfs2_dinode_out(dip, dibh-&gt;b_data);</div><div class='ctx'> </div><div class='hunk'>@@ -1508,9 +1509,8 @@ static void gfs2_dir_readahead(struct inode *inode, unsigned hsize, u32 index,</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> 			bh-&gt;b_end_io = end_buffer_read_sync;</div><div class='del'>-			submit_bh(REQ_OP_READ,</div><div class='del'>-				  REQ_RAHEAD | REQ_META | REQ_PRIO,</div><div class='del'>-				  bh);</div><div class='add'>+			submit_bh(REQ_OP_READ | REQ_RAHEAD | REQ_META |</div><div class='add'>+				  REQ_PRIO, bh);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> 		brelse(bh);</div><div class='hunk'>@@ -1815,7 +1815,7 @@ int gfs2_dir_add(struct inode *inode, const struct qstr *name,</div><div class='ctx'> 			gfs2_inum_out(nip, dent);</div><div class='ctx'> 			dent-&gt;de_type = cpu_to_be16(IF2DT(nip-&gt;i_inode.i_mode));</div><div class='ctx'> 			dent-&gt;de_rahead = cpu_to_be16(gfs2_inode_ra_len(nip));</div><div class='del'>-			tv = current_time(&amp;ip-&gt;i_inode);</div><div class='add'>+			tv = inode_set_ctime_current(&amp;ip-&gt;i_inode);</div><div class='ctx'> 			if (ip-&gt;i_diskflags &amp; GFS2_DIF_EXHASH) {</div><div class='ctx'> 				leaf = (struct gfs2_leaf *)bh-&gt;b_data;</div><div class='ctx'> 				be16_add_cpu(&amp;leaf-&gt;lf_entries, 1);</div><div class='hunk'>@@ -1826,7 +1826,7 @@ int gfs2_dir_add(struct inode *inode, const struct qstr *name,</div><div class='ctx'> 			da-&gt;bh = NULL;</div><div class='ctx'> 			brelse(bh);</div><div class='ctx'> 			ip-&gt;i_entries++;</div><div class='del'>-			ip-&gt;i_inode.i_mtime = ip-&gt;i_inode.i_ctime = tv;</div><div class='add'>+			inode_set_mtime_to_ts(&amp;ip-&gt;i_inode, tv);</div><div class='ctx'> 			if (S_ISDIR(nip-&gt;i_inode.i_mode))</div><div class='ctx'> 				inc_nlink(&amp;ip-&gt;i_inode);</div><div class='ctx'> 			mark_inode_dirty(inode);</div><div class='hunk'>@@ -1877,7 +1877,7 @@ int gfs2_dir_del(struct gfs2_inode *dip, const struct dentry *dentry)</div><div class='ctx'> 	const struct qstr *name = &amp;dentry-&gt;d_name;</div><div class='ctx'> 	struct gfs2_dirent *dent, *prev = NULL;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='del'>-	struct timespec64 tv = current_time(&amp;dip-&gt;i_inode);</div><div class='add'>+	struct timespec64 tv;</div><div class='ctx'> </div><div class='ctx'> 	/* Returns _either_ the entry (if its first in block) or the</div><div class='ctx'> 	   previous entry otherwise */</div><div class='hunk'>@@ -1897,6 +1897,7 @@ int gfs2_dir_del(struct gfs2_inode *dip, const struct dentry *dentry)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	dirent_del(dip, bh, prev, dent);</div><div class='add'>+	tv = inode_set_ctime_current(&amp;dip-&gt;i_inode);</div><div class='ctx'> 	if (dip-&gt;i_diskflags &amp; GFS2_DIF_EXHASH) {</div><div class='ctx'> 		struct gfs2_leaf *leaf = (struct gfs2_leaf *)bh-&gt;b_data;</div><div class='ctx'> 		u16 entries = be16_to_cpu(leaf-&gt;lf_entries);</div><div class='hunk'>@@ -1911,7 +1912,7 @@ int gfs2_dir_del(struct gfs2_inode *dip, const struct dentry *dentry)</div><div class='ctx'> 	if (!dip-&gt;i_entries)</div><div class='ctx'> 		gfs2_consist_inode(dip);</div><div class='ctx'> 	dip-&gt;i_entries--;</div><div class='del'>-	dip-&gt;i_inode.i_mtime = dip-&gt;i_inode.i_ctime = tv;</div><div class='add'>+	inode_set_mtime_to_ts(&amp;dip-&gt;i_inode, tv);</div><div class='ctx'> 	if (d_is_dir(dentry))</div><div class='ctx'> 		drop_nlink(&amp;dip-&gt;i_inode);</div><div class='ctx'> 	mark_inode_dirty(&amp;dip-&gt;i_inode);</div><div class='hunk'>@@ -1952,7 +1953,7 @@ int gfs2_dir_mvino(struct gfs2_inode *dip, const struct qstr *filename,</div><div class='ctx'> 	dent-&gt;de_type = cpu_to_be16(new_type);</div><div class='ctx'> 	brelse(bh);</div><div class='ctx'> </div><div class='del'>-	dip-&gt;i_inode.i_mtime = dip-&gt;i_inode.i_ctime = current_time(&amp;dip-&gt;i_inode);</div><div class='add'>+	inode_set_mtime_to_ts(&amp;dip-&gt;i_inode, inode_set_ctime_current(&amp;dip-&gt;i_inode));</div><div class='ctx'> 	mark_inode_dirty_sync(&amp;dip-&gt;i_inode);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -2017,7 +2018,7 @@ static int leaf_dealloc(struct gfs2_inode *dip, u32 index, u32 len,</div><div class='ctx'> 		l_blocks++;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	gfs2_rlist_alloc(&amp;rlist);</div><div class='add'>+	gfs2_rlist_alloc(&amp;rlist, LM_ST_EXCLUSIVE, LM_FLAG_NODE_SCOPE);</div><div class='ctx'> </div><div class='ctx'> 	for (x = 0; x &lt; rlist.rl_rgrps; x++) {</div><div class='ctx'> 		struct gfs2_rgrpd *rgd = gfs2_glock2rgrp(rlist.rl_ghs[x].gh_gl);</div><div class='head'>diff --git a/fs/gfs2/dir.h b/fs/gfs2/dir.h<br/>index 5b76480c17c9..25a857c78b53 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/dir.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/dir.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/dir.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/dir.h</a></div><div class='hunk'>@@ -23,32 +23,32 @@ struct gfs2_diradd {</div><div class='ctx'> 	int save_loc;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-extern struct inode *gfs2_dir_search(struct inode *dir,</div><div class='del'>-				     const struct qstr *filename,</div><div class='del'>-				     bool fail_on_exist);</div><div class='del'>-extern int gfs2_dir_check(struct inode *dir, const struct qstr *filename,</div><div class='del'>-			  const struct gfs2_inode *ip);</div><div class='del'>-extern int gfs2_dir_add(struct inode *inode, const struct qstr *filename,</div><div class='del'>-			const struct gfs2_inode *ip, struct gfs2_diradd *da);</div><div class='add'>+struct inode *gfs2_dir_search(struct inode *dir,</div><div class='add'>+			      const struct qstr *filename,</div><div class='add'>+			      bool fail_on_exist);</div><div class='add'>+int gfs2_dir_check(struct inode *dir, const struct qstr *filename,</div><div class='add'>+		   const struct gfs2_inode *ip);</div><div class='add'>+int gfs2_dir_add(struct inode *inode, const struct qstr *filename,</div><div class='add'>+		 const struct gfs2_inode *ip, struct gfs2_diradd *da);</div><div class='ctx'> static inline void gfs2_dir_no_add(struct gfs2_diradd *da)</div><div class='ctx'> {</div><div class='ctx'> 	brelse(da-&gt;bh);</div><div class='ctx'> 	da-&gt;bh = NULL;</div><div class='ctx'> }</div><div class='del'>-extern int gfs2_dir_del(struct gfs2_inode *dip, const struct dentry *dentry);</div><div class='del'>-extern int gfs2_dir_read(struct inode *inode, struct dir_context *ctx,</div><div class='del'>-			 struct file_ra_state *f_ra);</div><div class='del'>-extern int gfs2_dir_mvino(struct gfs2_inode *dip, const struct qstr *filename,</div><div class='del'>-			  const struct gfs2_inode *nip, unsigned int new_type);</div><div class='add'>+int gfs2_dir_del(struct gfs2_inode *dip, const struct dentry *dentry);</div><div class='add'>+int gfs2_dir_read(struct inode *inode, struct dir_context *ctx,</div><div class='add'>+		  struct file_ra_state *f_ra);</div><div class='add'>+int gfs2_dir_mvino(struct gfs2_inode *dip, const struct qstr *filename,</div><div class='add'>+		   const struct gfs2_inode *nip, unsigned int new_type);</div><div class='ctx'> </div><div class='del'>-extern int gfs2_dir_exhash_dealloc(struct gfs2_inode *dip);</div><div class='add'>+int gfs2_dir_exhash_dealloc(struct gfs2_inode *dip);</div><div class='ctx'> </div><div class='del'>-extern int gfs2_diradd_alloc_required(struct inode *dir,</div><div class='del'>-				      const struct qstr *filename,</div><div class='del'>-				      struct gfs2_diradd *da);</div><div class='del'>-extern int gfs2_dir_get_new_buffer(struct gfs2_inode *ip, u64 block,</div><div class='del'>-				   struct buffer_head **bhp);</div><div class='del'>-extern void gfs2_dir_hash_inval(struct gfs2_inode *ip);</div><div class='add'>+int gfs2_diradd_alloc_required(struct inode *dir,</div><div class='add'>+			       const struct qstr *filename,</div><div class='add'>+			       struct gfs2_diradd *da);</div><div class='add'>+int gfs2_dir_get_new_buffer(struct gfs2_inode *ip, u64 block,</div><div class='add'>+			    struct buffer_head **bhp);</div><div class='add'>+void gfs2_dir_hash_inval(struct gfs2_inode *ip);</div><div class='ctx'> </div><div class='ctx'> static inline u32 gfs2_disk_hash(const char *data, int len)</div><div class='ctx'> {</div><div class='head'>diff --git a/fs/gfs2/export.c b/fs/gfs2/export.c<br/>index 756d05779200..3334c394ce9c 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/export.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/export.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/export.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/export.c</a></div><div class='hunk'>@@ -66,7 +66,7 @@ struct get_name_filldir {</div><div class='ctx'> 	char *name;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int get_name_filldir(struct dir_context *ctx, const char *name,</div><div class='add'>+static bool get_name_filldir(struct dir_context *ctx, const char *name,</div><div class='ctx'> 			    int length, loff_t offset, u64 inum,</div><div class='ctx'> 			    unsigned int type)</div><div class='ctx'> {</div><div class='hunk'>@@ -74,12 +74,12 @@ static int get_name_filldir(struct dir_context *ctx, const char *name,</div><div class='ctx'> 		container_of(ctx, struct get_name_filldir, ctx);</div><div class='ctx'> </div><div class='ctx'> 	if (inum != gnfd-&gt;inum.no_addr)</div><div class='del'>-		return 0;</div><div class='add'>+		return true;</div><div class='ctx'> </div><div class='ctx'> 	memcpy(gnfd-&gt;name, name, length);</div><div class='ctx'> 	gnfd-&gt;name[length] = 0;</div><div class='ctx'> </div><div class='del'>-	return 1;</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int gfs2_get_name(struct dentry *parent, char *name,</div><div class='hunk'>@@ -138,8 +138,6 @@ static struct dentry *gfs2_get_dentry(struct super_block *sb,</div><div class='ctx'> 		return ERR_PTR(-ESTALE);</div><div class='ctx'> 	inode = gfs2_lookup_by_inum(sdp, inum-&gt;no_addr, inum-&gt;no_formal_ino,</div><div class='ctx'> 				    GFS2_BLKST_DINODE);</div><div class='del'>-	if (IS_ERR(inode))</div><div class='del'>-		return ERR_CAST(inode);</div><div class='ctx'> 	return d_obtain_alias(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/gfs2/file.c b/fs/gfs2/file.c<br/>index adafaaf7d24d..b2d23c98c996 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/file.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/file.c</a></div><div class='hunk'>@@ -15,6 +15,7 @@</div><div class='ctx'> #include &lt;linux/mm.h&gt;</div><div class='ctx'> #include &lt;linux/mount.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/filelock.h&gt;</div><div class='ctx'> #include &lt;linux/gfs2_ondisk.h&gt;</div><div class='ctx'> #include &lt;linux/falloc.h&gt;</div><div class='ctx'> #include &lt;linux/swap.h&gt;</div><div class='hunk'>@@ -154,7 +155,7 @@ static inline u32 gfs2_gfsflags_to_fsflags(struct inode *inode, u32 gfsflags)</div><div class='ctx'> 	return fsflags;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int gfs2_fileattr_get(struct dentry *dentry, struct fileattr *fa)</div><div class='add'>+int gfs2_fileattr_get(struct dentry *dentry, struct file_kattr *fa)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	struct gfs2_inode *ip = GFS2_I(inode);</div><div class='hunk'>@@ -235,7 +236,7 @@ static int do_gfs2_set_flags(struct inode *inode, u32 reqflags, u32 mask)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	if (!IS_IMMUTABLE(inode)) {</div><div class='del'>-		error = gfs2_permission(&amp;init_user_ns, inode, MAY_WRITE);</div><div class='add'>+		error = gfs2_permission(&amp;nop_mnt_idmap, inode, MAY_WRITE);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -250,6 +251,7 @@ static int do_gfs2_set_flags(struct inode *inode, u32 reqflags, u32 mask)</div><div class='ctx'> 		error = filemap_fdatawait(inode-&gt;i_mapping);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			goto out;</div><div class='add'>+		truncate_inode_pages(inode-&gt;i_mapping, 0);</div><div class='ctx'> 		if (new_flags &amp; GFS2_DIF_JDATA)</div><div class='ctx'> 			gfs2_ordered_del_inode(ip);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -259,7 +261,7 @@ static int do_gfs2_set_flags(struct inode *inode, u32 reqflags, u32 mask)</div><div class='ctx'> 	error = gfs2_meta_inode_buffer(ip, &amp;bh);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out_trans_end;</div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> 	gfs2_trans_add_meta(ip-&gt;i_gl, bh);</div><div class='ctx'> 	ip-&gt;i_diskflags = new_flags;</div><div class='ctx'> 	gfs2_dinode_out(ip, bh-&gt;b_data);</div><div class='hunk'>@@ -273,8 +275,8 @@ out:</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int gfs2_fileattr_set(struct user_namespace *mnt_userns,</div><div class='del'>-		      struct dentry *dentry, struct fileattr *fa)</div><div class='add'>+int gfs2_fileattr_set(struct mnt_idmap *idmap,</div><div class='add'>+		      struct dentry *dentry, struct file_kattr *fa)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	u32 fsflags = fa-&gt;flags, gfsflags = 0;</div><div class='hunk'>@@ -375,23 +377,23 @@ static void gfs2_size_hint(struct file *filep, loff_t offset, size_t size)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * gfs2_allocate_page_backing - Allocate blocks for a write fault</div><div class='del'>- * @page: The (locked) page to allocate backing for</div><div class='add'>+ * gfs2_allocate_folio_backing - Allocate blocks for a write fault</div><div class='add'>+ * @folio: The (locked) folio to allocate backing for</div><div class='ctx'>  * @length: Size of the allocation</div><div class='ctx'>  *</div><div class='del'>- * We try to allocate all the blocks required for the page in one go.  This</div><div class='add'>+ * We try to allocate all the blocks required for the folio in one go.  This</div><div class='ctx'>  * might fail for various reasons, so we keep trying until all the blocks to</div><div class='del'>- * back this page are allocated.  If some of the blocks are already allocated,</div><div class='add'>+ * back this folio are allocated.  If some of the blocks are already allocated,</div><div class='ctx'>  * that is ok too.</div><div class='ctx'>  */</div><div class='del'>-static int gfs2_allocate_page_backing(struct page *page, unsigned int length)</div><div class='add'>+static int gfs2_allocate_folio_backing(struct folio *folio, size_t length)</div><div class='ctx'> {</div><div class='del'>-	u64 pos = page_offset(page);</div><div class='add'>+	u64 pos = folio_pos(folio);</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='ctx'> 		struct iomap iomap = { };</div><div class='ctx'> </div><div class='del'>-		if (gfs2_iomap_alloc(page-&gt;mapping-&gt;host, pos, length, &amp;iomap))</div><div class='add'>+		if (gfs2_iomap_alloc(folio-&gt;mapping-&gt;host, pos, length, &amp;iomap))</div><div class='ctx'> 			return -EIO;</div><div class='ctx'> </div><div class='ctx'> 		if (length &lt; iomap.length)</div><div class='hunk'>@@ -413,16 +415,16 @@ static int gfs2_allocate_page_backing(struct page *page, unsigned int length)</div><div class='ctx'> </div><div class='ctx'> static vm_fault_t gfs2_page_mkwrite(struct vm_fault *vmf)</div><div class='ctx'> {</div><div class='del'>-	struct page *page = vmf-&gt;page;</div><div class='add'>+	struct folio *folio = page_folio(vmf-&gt;page);</div><div class='ctx'> 	struct inode *inode = file_inode(vmf-&gt;vma-&gt;vm_file);</div><div class='ctx'> 	struct gfs2_inode *ip = GFS2_I(inode);</div><div class='ctx'> 	struct gfs2_sbd *sdp = GFS2_SB(inode);</div><div class='del'>-	struct gfs2_alloc_parms ap = { .aflags = 0, };</div><div class='del'>-	u64 offset = page_offset(page);</div><div class='add'>+	struct gfs2_alloc_parms ap = {};</div><div class='add'>+	u64 pos = folio_pos(folio);</div><div class='ctx'> 	unsigned int data_blocks, ind_blocks, rblocks;</div><div class='ctx'> 	vm_fault_t ret = VM_FAULT_LOCKED;</div><div class='ctx'> 	struct gfs2_holder gh;</div><div class='del'>-	unsigned int length;</div><div class='add'>+	size_t length;</div><div class='ctx'> 	loff_t size;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='hunk'>@@ -431,27 +433,27 @@ static vm_fault_t gfs2_page_mkwrite(struct vm_fault *vmf)</div><div class='ctx'> 	gfs2_holder_init(ip-&gt;i_gl, LM_ST_EXCLUSIVE, 0, &amp;gh);</div><div class='ctx'> 	err = gfs2_glock_nq(&amp;gh);</div><div class='ctx'> 	if (err) {</div><div class='del'>-		ret = block_page_mkwrite_return(err);</div><div class='add'>+		ret = vmf_fs_error(err);</div><div class='ctx'> 		goto out_uninit;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Check page index against inode size */</div><div class='add'>+	/* Check folio index against inode size */</div><div class='ctx'> 	size = i_size_read(inode);</div><div class='del'>-	if (offset &gt;= size) {</div><div class='add'>+	if (pos &gt;= size) {</div><div class='ctx'> 		ret = VM_FAULT_SIGBUS;</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Update file times before taking page lock */</div><div class='add'>+	/* Update file times before taking folio lock */</div><div class='ctx'> 	file_update_time(vmf-&gt;vma-&gt;vm_file);</div><div class='ctx'> </div><div class='del'>-	/* page is wholly or partially inside EOF */</div><div class='del'>-	if (size - offset &lt; PAGE_SIZE)</div><div class='del'>-		length = size - offset;</div><div class='add'>+	/* folio is wholly or partially inside EOF */</div><div class='add'>+	if (size - pos &lt; folio_size(folio))</div><div class='add'>+		length = size - pos;</div><div class='ctx'> 	else</div><div class='del'>-		length = PAGE_SIZE;</div><div class='add'>+		length = folio_size(folio);</div><div class='ctx'> </div><div class='del'>-	gfs2_size_hint(vmf-&gt;vma-&gt;vm_file, offset, length);</div><div class='add'>+	gfs2_size_hint(vmf-&gt;vma-&gt;vm_file, pos, length);</div><div class='ctx'> </div><div class='ctx'> 	set_bit(GLF_DIRTY, &amp;ip-&gt;i_gl-&gt;gl_flags);</div><div class='ctx'> 	set_bit(GIF_SW_PAGED, &amp;ip-&gt;i_flags);</div><div class='hunk'>@@ -462,18 +464,19 @@ static vm_fault_t gfs2_page_mkwrite(struct vm_fault *vmf)</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='ctx'> 	if (!gfs2_is_stuffed(ip) &amp;&amp;</div><div class='del'>-	    !gfs2_write_alloc_required(ip, offset, length)) {</div><div class='del'>-		lock_page(page);</div><div class='del'>-		if (!PageUptodate(page) || page-&gt;mapping != inode-&gt;i_mapping) {</div><div class='add'>+	    !gfs2_write_alloc_required(ip, pos, length)) {</div><div class='add'>+		folio_lock(folio);</div><div class='add'>+		if (!folio_test_uptodate(folio) ||</div><div class='add'>+		    folio-&gt;mapping != inode-&gt;i_mapping) {</div><div class='ctx'> 			ret = VM_FAULT_NOPAGE;</div><div class='del'>-			unlock_page(page);</div><div class='add'>+			folio_unlock(folio);</div><div class='ctx'> 		}</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	err = gfs2_rindex_update(sdp);</div><div class='ctx'> 	if (err) {</div><div class='del'>-		ret = block_page_mkwrite_return(err);</div><div class='add'>+		ret = vmf_fs_error(err);</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -481,12 +484,12 @@ static vm_fault_t gfs2_page_mkwrite(struct vm_fault *vmf)</div><div class='ctx'> 	ap.target = data_blocks + ind_blocks;</div><div class='ctx'> 	err = gfs2_quota_lock_check(ip, &amp;ap);</div><div class='ctx'> 	if (err) {</div><div class='del'>-		ret = block_page_mkwrite_return(err);</div><div class='add'>+		ret = vmf_fs_error(err);</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> 	err = gfs2_inplace_reserve(ip, &amp;ap);</div><div class='ctx'> 	if (err) {</div><div class='del'>-		ret = block_page_mkwrite_return(err);</div><div class='add'>+		ret = vmf_fs_error(err);</div><div class='ctx'> 		goto out_quota_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -499,35 +502,35 @@ static vm_fault_t gfs2_page_mkwrite(struct vm_fault *vmf)</div><div class='ctx'> 	}</div><div class='ctx'> 	err = gfs2_trans_begin(sdp, rblocks, 0);</div><div class='ctx'> 	if (err) {</div><div class='del'>-		ret = block_page_mkwrite_return(err);</div><div class='add'>+		ret = vmf_fs_error(err);</div><div class='ctx'> 		goto out_trans_fail;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Unstuff, if required, and allocate backing blocks for page */</div><div class='add'>+	/* Unstuff, if required, and allocate backing blocks for folio */</div><div class='ctx'> 	if (gfs2_is_stuffed(ip)) {</div><div class='ctx'> 		err = gfs2_unstuff_dinode(ip);</div><div class='ctx'> 		if (err) {</div><div class='del'>-			ret = block_page_mkwrite_return(err);</div><div class='add'>+			ret = vmf_fs_error(err);</div><div class='ctx'> 			goto out_trans_end;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	lock_page(page);</div><div class='add'>+	folio_lock(folio);</div><div class='ctx'> 	/* If truncated, we must retry the operation, we may have raced</div><div class='ctx'> 	 * with the glock demotion code.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!PageUptodate(page) || page-&gt;mapping != inode-&gt;i_mapping) {</div><div class='add'>+	if (!folio_test_uptodate(folio) || folio-&gt;mapping != inode-&gt;i_mapping) {</div><div class='ctx'> 		ret = VM_FAULT_NOPAGE;</div><div class='ctx'> 		goto out_page_locked;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = gfs2_allocate_page_backing(page, length);</div><div class='add'>+	err = gfs2_allocate_folio_backing(folio, length);</div><div class='ctx'> 	if (err)</div><div class='del'>-		ret = block_page_mkwrite_return(err);</div><div class='add'>+		ret = vmf_fs_error(err);</div><div class='ctx'> </div><div class='ctx'> out_page_locked:</div><div class='ctx'> 	if (ret != VM_FAULT_LOCKED)</div><div class='del'>-		unlock_page(page);</div><div class='add'>+		folio_unlock(folio);</div><div class='ctx'> out_trans_end:</div><div class='ctx'> 	gfs2_trans_end(sdp);</div><div class='ctx'> out_trans_fail:</div><div class='hunk'>@@ -539,8 +542,8 @@ out_unlock:</div><div class='ctx'> out_uninit:</div><div class='ctx'> 	gfs2_holder_uninit(&amp;gh);</div><div class='ctx'> 	if (ret == VM_FAULT_LOCKED) {</div><div class='del'>-		set_page_dirty(page);</div><div class='del'>-		wait_for_stable_page(page);</div><div class='add'>+		folio_mark_dirty(folio);</div><div class='add'>+		folio_wait_stable(folio);</div><div class='ctx'> 	}</div><div class='ctx'> 	sb_end_pagefault(inode-&gt;i_sb);</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -557,7 +560,7 @@ static vm_fault_t gfs2_fault(struct vm_fault *vmf)</div><div class='ctx'> 	gfs2_holder_init(ip-&gt;i_gl, LM_ST_SHARED, 0, &amp;gh);</div><div class='ctx'> 	err = gfs2_glock_nq(&amp;gh);</div><div class='ctx'> 	if (err) {</div><div class='del'>-		ret = block_page_mkwrite_return(err);</div><div class='add'>+		ret = vmf_fs_error(err);</div><div class='ctx'> 		goto out_uninit;</div><div class='ctx'> 	}</div><div class='ctx'> 	ret = filemap_fault(vmf);</div><div class='hunk'>@@ -629,6 +632,9 @@ int gfs2_open_common(struct inode *inode, struct file *file)</div><div class='ctx'> 		ret = generic_file_open(inode, file);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='add'>+</div><div class='add'>+		if (!gfs2_is_jdata(GFS2_I(inode)))</div><div class='add'>+			file-&gt;f_mode |= FMODE_CAN_ODIRECT;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	fp = kzalloc(sizeof(struct gfs2_file), GFP_NOFS);</div><div class='hunk'>@@ -704,10 +710,11 @@ static int gfs2_release(struct inode *inode, struct file *file)</div><div class='ctx'> 	kfree(file-&gt;private_data);</div><div class='ctx'> 	file-&gt;private_data = NULL;</div><div class='ctx'> </div><div class='del'>-	if (gfs2_rs_active(&amp;ip-&gt;i_res))</div><div class='del'>-		gfs2_rs_delete(ip, &amp;inode-&gt;i_writecount);</div><div class='del'>-	if (file-&gt;f_mode &amp; FMODE_WRITE)</div><div class='add'>+	if (file-&gt;f_mode &amp; FMODE_WRITE) {</div><div class='add'>+		if (gfs2_rs_active(&amp;ip-&gt;i_res))</div><div class='add'>+			gfs2_rs_delete(ip);</div><div class='ctx'> 		gfs2_qa_put(ip);</div><div class='add'>+	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -737,7 +744,7 @@ static int gfs2_fsync(struct file *file, loff_t start, loff_t end,</div><div class='ctx'> {</div><div class='ctx'> 	struct address_space *mapping = file-&gt;f_mapping;</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='del'>-	int sync_state = inode-&gt;i_state &amp; I_DIRTY;</div><div class='add'>+	int sync_state = inode_state_read_once(inode) &amp; I_DIRTY;</div><div class='ctx'> 	struct gfs2_inode *ip = GFS2_I(inode);</div><div class='ctx'> 	int ret = 0, ret1 = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -769,33 +776,35 @@ static int gfs2_fsync(struct file *file, loff_t start, loff_t end,</div><div class='ctx'> 	return ret ? ret : ret1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline bool should_fault_in_pages(ssize_t ret, struct iov_iter *i,</div><div class='add'>+static inline bool should_fault_in_pages(struct iov_iter *i,</div><div class='add'>+					 struct kiocb *iocb,</div><div class='ctx'> 					 size_t *prev_count,</div><div class='ctx'> 					 size_t *window_size)</div><div class='ctx'> {</div><div class='del'>-	char __user *p = i-&gt;iov[0].iov_base + i-&gt;iov_offset;</div><div class='ctx'> 	size_t count = iov_iter_count(i);</div><div class='del'>-	int pages = 1;</div><div class='add'>+	size_t size, offs;</div><div class='ctx'> </div><div class='del'>-	if (likely(!count))</div><div class='add'>+	if (!count)</div><div class='ctx'> 		return false;</div><div class='del'>-	if (ret &lt;= 0 &amp;&amp; ret != -EFAULT)</div><div class='del'>-		return false;</div><div class='del'>-	if (!iter_is_iovec(i))</div><div class='add'>+	if (!user_backed_iter(i))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	if (*prev_count != count || !*window_size) {</div><div class='del'>-		int pages, nr_dirtied;</div><div class='add'>+	/*</div><div class='add'>+	 * Try to fault in multiple pages initially.  When that doesn't result</div><div class='add'>+	 * in any progress, fall back to a single page.</div><div class='add'>+	 */</div><div class='add'>+	size = PAGE_SIZE;</div><div class='add'>+	offs = offset_in_page(iocb-&gt;ki_pos);</div><div class='add'>+	if (*prev_count != count) {</div><div class='add'>+		size_t nr_dirtied;</div><div class='ctx'> </div><div class='del'>-		pages = min_t(int, BIO_MAX_VECS,</div><div class='del'>-			      DIV_ROUND_UP(iov_iter_count(i), PAGE_SIZE));</div><div class='ctx'> 		nr_dirtied = max(current-&gt;nr_dirtied_pause -</div><div class='del'>-				 current-&gt;nr_dirtied, 1);</div><div class='del'>-		pages = min(pages, nr_dirtied);</div><div class='add'>+				 current-&gt;nr_dirtied, 8);</div><div class='add'>+		size = min_t(size_t, SZ_1M, nr_dirtied &lt;&lt; PAGE_SHIFT);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	*prev_count = count;</div><div class='del'>-	*window_size = (size_t)PAGE_SIZE * pages - offset_in_page(p);</div><div class='add'>+	*window_size = size - offs;</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -805,13 +814,13 @@ static ssize_t gfs2_file_direct_read(struct kiocb *iocb, struct iov_iter *to,</div><div class='ctx'> 	struct file *file = iocb-&gt;ki_filp;</div><div class='ctx'> 	struct gfs2_inode *ip = GFS2_I(file-&gt;f_mapping-&gt;host);</div><div class='ctx'> 	size_t prev_count = 0, window_size = 0;</div><div class='del'>-	size_t written = 0;</div><div class='add'>+	size_t read = 0;</div><div class='ctx'> 	ssize_t ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * In this function, we disable page faults when we're holding the</div><div class='ctx'> 	 * inode glock while doing I/O.  If a page fault occurs, we indicate</div><div class='del'>-	 * that the inode glock may be dropped, fault in the pages manually,</div><div class='add'>+	 * that the inode glock should be dropped, fault in the pages manually,</div><div class='ctx'> 	 * and retry.</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * Unlike generic_file_read_iter, for reads, iomap_dio_rw can trigger</div><div class='hunk'>@@ -833,35 +842,33 @@ retry:</div><div class='ctx'> 	ret = gfs2_glock_nq(gh);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out_uninit;</div><div class='del'>-retry_under_glock:</div><div class='ctx'> 	pagefault_disable();</div><div class='ctx'> 	to-&gt;nofault = true;</div><div class='ctx'> 	ret = iomap_dio_rw(iocb, to, &amp;gfs2_iomap_ops, NULL,</div><div class='del'>-			   IOMAP_DIO_PARTIAL, written);</div><div class='add'>+			   IOMAP_DIO_PARTIAL, NULL, read);</div><div class='ctx'> 	to-&gt;nofault = false;</div><div class='ctx'> 	pagefault_enable();</div><div class='add'>+	if (ret &lt;= 0 &amp;&amp; ret != -EFAULT)</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	/* No increment (+=) because iomap_dio_rw returns a cumulative value. */</div><div class='ctx'> 	if (ret &gt; 0)</div><div class='del'>-		written = ret;</div><div class='del'>-</div><div class='del'>-	if (should_fault_in_pages(ret, to, &amp;prev_count, &amp;window_size)) {</div><div class='del'>-		size_t leftover;</div><div class='add'>+		read = ret;</div><div class='ctx'> </div><div class='del'>-		gfs2_holder_allow_demote(gh);</div><div class='del'>-		leftover = fault_in_iov_iter_writeable(to, window_size);</div><div class='del'>-		gfs2_holder_disallow_demote(gh);</div><div class='del'>-		if (leftover != window_size) {</div><div class='del'>-			if (!gfs2_holder_queued(gh))</div><div class='del'>-				goto retry;</div><div class='del'>-			goto retry_under_glock;</div><div class='del'>-		}</div><div class='add'>+	if (should_fault_in_pages(to, iocb, &amp;prev_count, &amp;window_size)) {</div><div class='add'>+		gfs2_glock_dq(gh);</div><div class='add'>+		window_size -= fault_in_iov_iter_writeable(to, window_size);</div><div class='add'>+		if (window_size)</div><div class='add'>+			goto retry;</div><div class='ctx'> 	}</div><div class='add'>+out_unlock:</div><div class='ctx'> 	if (gfs2_holder_queued(gh))</div><div class='ctx'> 		gfs2_glock_dq(gh);</div><div class='ctx'> out_uninit:</div><div class='ctx'> 	gfs2_holder_uninit(gh);</div><div class='add'>+	/* User space doesn't expect partial success. */</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='del'>-	return written;</div><div class='add'>+	return read;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t gfs2_file_direct_write(struct kiocb *iocb, struct iov_iter *from,</div><div class='hunk'>@@ -871,13 +878,14 @@ static ssize_t gfs2_file_direct_write(struct kiocb *iocb, struct iov_iter *from,</div><div class='ctx'> 	struct inode *inode = file-&gt;f_mapping-&gt;host;</div><div class='ctx'> 	struct gfs2_inode *ip = GFS2_I(inode);</div><div class='ctx'> 	size_t prev_count = 0, window_size = 0;</div><div class='del'>-	size_t read = 0;</div><div class='add'>+	size_t written = 0;</div><div class='add'>+	bool enough_retries;</div><div class='ctx'> 	ssize_t ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * In this function, we disable page faults when we're holding the</div><div class='ctx'> 	 * inode glock while doing I/O.  If a page fault occurs, we indicate</div><div class='del'>-	 * that the inode glock may be dropped, fault in the pages manually,</div><div class='add'>+	 * that the inode glock should be dropped, fault in the pages manually,</div><div class='ctx'> 	 * and retry.</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * For writes, iomap_dio_rw only triggers manual page faults, so we</div><div class='hunk'>@@ -897,41 +905,45 @@ retry:</div><div class='ctx'> 	ret = gfs2_glock_nq(gh);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out_uninit;</div><div class='del'>-retry_under_glock:</div><div class='ctx'> 	/* Silently fall back to buffered I/O when writing beyond EOF */</div><div class='ctx'> 	if (iocb-&gt;ki_pos + iov_iter_count(from) &gt; i_size_read(&amp;ip-&gt;i_inode))</div><div class='del'>-		goto out;</div><div class='add'>+		goto out_unlock;</div><div class='ctx'> </div><div class='ctx'> 	from-&gt;nofault = true;</div><div class='ctx'> 	ret = iomap_dio_rw(iocb, from, &amp;gfs2_iomap_ops, NULL,</div><div class='del'>-			   IOMAP_DIO_PARTIAL, read);</div><div class='add'>+			   IOMAP_DIO_PARTIAL, NULL, written);</div><div class='ctx'> 	from-&gt;nofault = false;</div><div class='del'>-</div><div class='del'>-	if (ret == -ENOTBLK)</div><div class='del'>-		ret = 0;</div><div class='add'>+	if (ret &lt;= 0) {</div><div class='add'>+		if (ret == -ENOTBLK)</div><div class='add'>+			ret = 0;</div><div class='add'>+		if (ret != -EFAULT)</div><div class='add'>+			goto out_unlock;</div><div class='add'>+	}</div><div class='add'>+	/* No increment (+=) because iomap_dio_rw returns a cumulative value. */</div><div class='ctx'> 	if (ret &gt; 0)</div><div class='del'>-		read = ret;</div><div class='del'>-</div><div class='del'>-	if (should_fault_in_pages(ret, from, &amp;prev_count, &amp;window_size)) {</div><div class='del'>-		size_t leftover;</div><div class='add'>+		written = ret;</div><div class='ctx'> </div><div class='del'>-		gfs2_holder_allow_demote(gh);</div><div class='del'>-		leftover = fault_in_iov_iter_readable(from, window_size);</div><div class='del'>-		gfs2_holder_disallow_demote(gh);</div><div class='del'>-		if (leftover != window_size) {</div><div class='del'>-			if (!gfs2_holder_queued(gh))</div><div class='add'>+	enough_retries = prev_count == iov_iter_count(from) &amp;&amp;</div><div class='add'>+			 window_size &lt;= PAGE_SIZE;</div><div class='add'>+	if (should_fault_in_pages(from, iocb, &amp;prev_count, &amp;window_size)) {</div><div class='add'>+		gfs2_glock_dq(gh);</div><div class='add'>+		window_size -= fault_in_iov_iter_readable(from, window_size);</div><div class='add'>+		if (window_size) {</div><div class='add'>+			if (!enough_retries)</div><div class='ctx'> 				goto retry;</div><div class='del'>-			goto retry_under_glock;</div><div class='add'>+			/* fall back to buffered I/O */</div><div class='add'>+			ret = 0;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-out:</div><div class='add'>+out_unlock:</div><div class='ctx'> 	if (gfs2_holder_queued(gh))</div><div class='ctx'> 		gfs2_glock_dq(gh);</div><div class='ctx'> out_uninit:</div><div class='ctx'> 	gfs2_holder_uninit(gh);</div><div class='add'>+	/* User space doesn't expect partial success. */</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='del'>-	return read;</div><div class='add'>+	return written;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t gfs2_file_read_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='hunk'>@@ -939,30 +951,29 @@ static ssize_t gfs2_file_read_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='ctx'> 	struct gfs2_inode *ip;</div><div class='ctx'> 	struct gfs2_holder gh;</div><div class='ctx'> 	size_t prev_count = 0, window_size = 0;</div><div class='del'>-	size_t written = 0;</div><div class='add'>+	size_t read = 0;</div><div class='ctx'> 	ssize_t ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * In this function, we disable page faults when we're holding the</div><div class='ctx'> 	 * inode glock while doing I/O.  If a page fault occurs, we indicate</div><div class='del'>-	 * that the inode glock may be dropped, fault in the pages manually,</div><div class='add'>+	 * that the inode glock should be dropped, fault in the pages manually,</div><div class='ctx'> 	 * and retry.</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='del'>-	if (iocb-&gt;ki_flags &amp; IOCB_DIRECT) {</div><div class='del'>-		ret = gfs2_file_direct_read(iocb, to, &amp;gh);</div><div class='del'>-		if (likely(ret != -ENOTBLK))</div><div class='del'>-			return ret;</div><div class='del'>-		iocb-&gt;ki_flags &amp;= ~IOCB_DIRECT;</div><div class='del'>-	}</div><div class='add'>+	if (iocb-&gt;ki_flags &amp; IOCB_DIRECT)</div><div class='add'>+		return gfs2_file_direct_read(iocb, to, &amp;gh);</div><div class='add'>+</div><div class='add'>+	pagefault_disable();</div><div class='ctx'> 	iocb-&gt;ki_flags |= IOCB_NOIO;</div><div class='ctx'> 	ret = generic_file_read_iter(iocb, to);</div><div class='ctx'> 	iocb-&gt;ki_flags &amp;= ~IOCB_NOIO;</div><div class='add'>+	pagefault_enable();</div><div class='ctx'> 	if (ret &gt;= 0) {</div><div class='ctx'> 		if (!iov_iter_count(to))</div><div class='ctx'> 			return ret;</div><div class='del'>-		written = ret;</div><div class='del'>-	} else {</div><div class='add'>+		read = ret;</div><div class='add'>+	} else if (ret != -EFAULT) {</div><div class='ctx'> 		if (ret != -EAGAIN)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 		if (iocb-&gt;ki_flags &amp; IOCB_NOWAIT)</div><div class='hunk'>@@ -974,33 +985,26 @@ retry:</div><div class='ctx'> 	ret = gfs2_glock_nq(&amp;gh);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out_uninit;</div><div class='del'>-retry_under_glock:</div><div class='ctx'> 	pagefault_disable();</div><div class='ctx'> 	ret = generic_file_read_iter(iocb, to);</div><div class='ctx'> 	pagefault_enable();</div><div class='add'>+	if (ret &lt;= 0 &amp;&amp; ret != -EFAULT)</div><div class='add'>+		goto out_unlock;</div><div class='ctx'> 	if (ret &gt; 0)</div><div class='del'>-		written += ret;</div><div class='del'>-</div><div class='del'>-	if (should_fault_in_pages(ret, to, &amp;prev_count, &amp;window_size)) {</div><div class='del'>-		size_t leftover;</div><div class='add'>+		read += ret;</div><div class='ctx'> </div><div class='del'>-		gfs2_holder_allow_demote(&amp;gh);</div><div class='del'>-		leftover = fault_in_iov_iter_writeable(to, window_size);</div><div class='del'>-		gfs2_holder_disallow_demote(&amp;gh);</div><div class='del'>-		if (leftover != window_size) {</div><div class='del'>-			if (!gfs2_holder_queued(&amp;gh)) {</div><div class='del'>-				if (written)</div><div class='del'>-					goto out_uninit;</div><div class='del'>-				goto retry;</div><div class='del'>-			}</div><div class='del'>-			goto retry_under_glock;</div><div class='del'>-		}</div><div class='add'>+	if (should_fault_in_pages(to, iocb, &amp;prev_count, &amp;window_size)) {</div><div class='add'>+		gfs2_glock_dq(&amp;gh);</div><div class='add'>+		window_size -= fault_in_iov_iter_writeable(to, window_size);</div><div class='add'>+		if (window_size)</div><div class='add'>+			goto retry;</div><div class='ctx'> 	}</div><div class='add'>+out_unlock:</div><div class='ctx'> 	if (gfs2_holder_queued(&amp;gh))</div><div class='ctx'> 		gfs2_glock_dq(&amp;gh);</div><div class='ctx'> out_uninit:</div><div class='ctx'> 	gfs2_holder_uninit(&amp;gh);</div><div class='del'>-	return written ? written : ret;</div><div class='add'>+	return read ? read : ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t gfs2_file_buffered_write(struct kiocb *iocb,</div><div class='hunk'>@@ -1013,13 +1017,14 @@ static ssize_t gfs2_file_buffered_write(struct kiocb *iocb,</div><div class='ctx'> 	struct gfs2_sbd *sdp = GFS2_SB(inode);</div><div class='ctx'> 	struct gfs2_holder *statfs_gh = NULL;</div><div class='ctx'> 	size_t prev_count = 0, window_size = 0;</div><div class='del'>-	size_t read = 0;</div><div class='add'>+	size_t orig_count = iov_iter_count(from);</div><div class='add'>+	size_t written = 0;</div><div class='ctx'> 	ssize_t ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * In this function, we disable page faults when we're holding the</div><div class='ctx'> 	 * inode glock while doing I/O.  If a page fault occurs, we indicate</div><div class='del'>-	 * that the inode glock may be dropped, fault in the pages manually,</div><div class='add'>+	 * that the inode glock should be dropped, fault in the pages manually,</div><div class='ctx'> 	 * and retry.</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='hunk'>@@ -1030,11 +1035,19 @@ static ssize_t gfs2_file_buffered_write(struct kiocb *iocb,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	gfs2_holder_init(ip-&gt;i_gl, LM_ST_EXCLUSIVE, 0, gh);</div><div class='add'>+	if (should_fault_in_pages(from, iocb, &amp;prev_count, &amp;window_size)) {</div><div class='ctx'> retry:</div><div class='add'>+		window_size -= fault_in_iov_iter_readable(from, window_size);</div><div class='add'>+		if (!window_size) {</div><div class='add'>+			ret = -EFAULT;</div><div class='add'>+			goto out_uninit;</div><div class='add'>+		}</div><div class='add'>+		from-&gt;count = min(from-&gt;count, window_size);</div><div class='add'>+	}</div><div class='ctx'> 	ret = gfs2_glock_nq(gh);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out_uninit;</div><div class='del'>-retry_under_glock:</div><div class='add'>+</div><div class='ctx'> 	if (inode == sdp-&gt;sd_rindex) {</div><div class='ctx'> 		struct gfs2_inode *m_ip = GFS2_I(sdp-&gt;sd_statfs_inode);</div><div class='ctx'> </div><div class='hunk'>@@ -1044,42 +1057,32 @@ retry_under_glock:</div><div class='ctx'> 			goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	current-&gt;backing_dev_info = inode_to_bdi(inode);</div><div class='ctx'> 	pagefault_disable();</div><div class='del'>-	ret = iomap_file_buffered_write(iocb, from, &amp;gfs2_iomap_ops);</div><div class='add'>+	ret = iomap_file_buffered_write(iocb, from, &amp;gfs2_iomap_ops,</div><div class='add'>+			&amp;gfs2_iomap_write_ops, NULL);</div><div class='ctx'> 	pagefault_enable();</div><div class='del'>-	current-&gt;backing_dev_info = NULL;</div><div class='del'>-	if (ret &gt; 0) {</div><div class='del'>-		iocb-&gt;ki_pos += ret;</div><div class='del'>-		read += ret;</div><div class='del'>-	}</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		written += ret;</div><div class='ctx'> </div><div class='ctx'> 	if (inode == sdp-&gt;sd_rindex)</div><div class='ctx'> 		gfs2_glock_dq_uninit(statfs_gh);</div><div class='ctx'> </div><div class='del'>-	if (should_fault_in_pages(ret, from, &amp;prev_count, &amp;window_size)) {</div><div class='del'>-		size_t leftover;</div><div class='add'>+	if (ret &lt;= 0 &amp;&amp; ret != -EFAULT)</div><div class='add'>+		goto out_unlock;</div><div class='ctx'> </div><div class='del'>-		gfs2_holder_allow_demote(gh);</div><div class='del'>-		leftover = fault_in_iov_iter_readable(from, window_size);</div><div class='del'>-		gfs2_holder_disallow_demote(gh);</div><div class='del'>-		if (leftover != window_size) {</div><div class='del'>-			if (!gfs2_holder_queued(gh)) {</div><div class='del'>-				if (read)</div><div class='del'>-					goto out_uninit;</div><div class='del'>-				goto retry;</div><div class='del'>-			}</div><div class='del'>-			goto retry_under_glock;</div><div class='del'>-		}</div><div class='add'>+	from-&gt;count = orig_count - written;</div><div class='add'>+	if (should_fault_in_pages(from, iocb, &amp;prev_count, &amp;window_size)) {</div><div class='add'>+		gfs2_glock_dq(gh);</div><div class='add'>+		goto retry;</div><div class='ctx'> 	}</div><div class='ctx'> out_unlock:</div><div class='ctx'> 	if (gfs2_holder_queued(gh))</div><div class='ctx'> 		gfs2_glock_dq(gh);</div><div class='ctx'> out_uninit:</div><div class='ctx'> 	gfs2_holder_uninit(gh);</div><div class='del'>-	if (statfs_gh)</div><div class='del'>-		kfree(statfs_gh);</div><div class='del'>-	return read ? read : ret;</div><div class='add'>+	kfree(statfs_gh);</div><div class='add'>+	from-&gt;count = orig_count - written;</div><div class='add'>+	return written ? written : ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -1120,14 +1123,16 @@ static ssize_t gfs2_file_write_iter(struct kiocb *iocb, struct iov_iter *from)</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='del'>-	ret = file_update_time(file);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto out_unlock;</div><div class='del'>-</div><div class='ctx'> 	if (iocb-&gt;ki_flags &amp; IOCB_DIRECT) {</div><div class='ctx'> 		struct address_space *mapping = file-&gt;f_mapping;</div><div class='ctx'> 		ssize_t buffered, ret2;</div><div class='ctx'> </div><div class='add'>+		/*</div><div class='add'>+		 * Note that under direct I/O, we don't allow and inode</div><div class='add'>+		 * timestamp updates, so we're not calling file_update_time()</div><div class='add'>+		 * here.</div><div class='add'>+		 */</div><div class='add'>+</div><div class='ctx'> 		ret = gfs2_file_direct_write(iocb, from, &amp;gh);</div><div class='ctx'> 		if (ret &lt; 0 || !iov_iter_count(from))</div><div class='ctx'> 			goto out_unlock;</div><div class='hunk'>@@ -1154,6 +1159,10 @@ static ssize_t gfs2_file_write_iter(struct kiocb *iocb, struct iov_iter *from)</div><div class='ctx'> 		if (!ret || ret2 &gt; 0)</div><div class='ctx'> 			ret += ret2;</div><div class='ctx'> 	} else {</div><div class='add'>+		ret = file_update_time(file);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out_unlock;</div><div class='add'>+</div><div class='ctx'> 		ret = gfs2_file_buffered_write(iocb, from, &amp;gh);</div><div class='ctx'> 		if (likely(ret &gt; 0))</div><div class='ctx'> 			ret = generic_write_sync(iocb, ret);</div><div class='hunk'>@@ -1245,7 +1254,7 @@ static long __gfs2_fallocate(struct file *file, int mode, loff_t offset, loff_t</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='ctx'> 	struct gfs2_sbd *sdp = GFS2_SB(inode);</div><div class='ctx'> 	struct gfs2_inode *ip = GFS2_I(inode);</div><div class='del'>-	struct gfs2_alloc_parms ap = { .aflags = 0, };</div><div class='add'>+	struct gfs2_alloc_parms ap = {};</div><div class='ctx'> 	unsigned int data_blocks = 0, ind_blocks = 0, rblocks;</div><div class='ctx'> 	loff_t bytes, max_bytes, max_blks;</div><div class='ctx'> 	int error;</div><div class='hunk'>@@ -1433,25 +1442,44 @@ static int gfs2_lock(struct file *file, int cmd, struct file_lock *fl)</div><div class='ctx'> 	struct gfs2_inode *ip = GFS2_I(file-&gt;f_mapping-&gt;host);</div><div class='ctx'> 	struct gfs2_sbd *sdp = GFS2_SB(file-&gt;f_mapping-&gt;host);</div><div class='ctx'> 	struct lm_lockstruct *ls = &amp;sdp-&gt;sd_lockstruct;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	if (!(fl-&gt;fl_flags &amp; FL_POSIX))</div><div class='add'>+	if (!(fl-&gt;c.flc_flags &amp; FL_POSIX))</div><div class='ctx'> 		return -ENOLCK;</div><div class='del'>-	if (cmd == F_CANCELLK) {</div><div class='del'>-		/* Hack: */</div><div class='del'>-		cmd = F_SETLK;</div><div class='del'>-		fl-&gt;fl_type = F_UNLCK;</div><div class='del'>-	}</div><div class='del'>-	if (unlikely(gfs2_withdrawn(sdp))) {</div><div class='del'>-		if (fl-&gt;fl_type == F_UNLCK)</div><div class='add'>+	if (gfs2_withdrawn(sdp)) {</div><div class='add'>+		if (lock_is_unlock(fl))</div><div class='ctx'> 			locks_lock_file_wait(file, fl);</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='del'>-	if (IS_GETLK(cmd))</div><div class='del'>-		return dlm_posix_get(ls-&gt;ls_dlm, ip-&gt;i_no_addr, file, fl);</div><div class='del'>-	else if (fl-&gt;fl_type == F_UNLCK)</div><div class='del'>-		return dlm_posix_unlock(ls-&gt;ls_dlm, ip-&gt;i_no_addr, file, fl);</div><div class='del'>-	else</div><div class='del'>-		return dlm_posix_lock(ls-&gt;ls_dlm, ip-&gt;i_no_addr, file, cmd, fl);</div><div class='add'>+	down_read(&amp;ls-&gt;ls_sem);</div><div class='add'>+	ret = -ENODEV;</div><div class='add'>+	if (likely(ls-&gt;ls_dlm != NULL)) {</div><div class='add'>+		if (cmd == F_CANCELLK)</div><div class='add'>+			ret = dlm_posix_cancel(ls-&gt;ls_dlm, ip-&gt;i_no_addr, file, fl);</div><div class='add'>+		else if (IS_GETLK(cmd))</div><div class='add'>+			ret = dlm_posix_get(ls-&gt;ls_dlm, ip-&gt;i_no_addr, file, fl);</div><div class='add'>+		else if (lock_is_unlock(fl))</div><div class='add'>+			ret = dlm_posix_unlock(ls-&gt;ls_dlm, ip-&gt;i_no_addr, file, fl);</div><div class='add'>+		else</div><div class='add'>+			ret = dlm_posix_lock(ls-&gt;ls_dlm, ip-&gt;i_no_addr, file, cmd, fl);</div><div class='add'>+	}</div><div class='add'>+	up_read(&amp;ls-&gt;ls_sem);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void __flock_holder_uninit(struct file *file, struct gfs2_holder *fl_gh)</div><div class='add'>+{</div><div class='add'>+	struct gfs2_glock *gl = gfs2_glock_hold(fl_gh-&gt;gh_gl);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Make sure gfs2_glock_put() won't sleep under the file-&gt;f_lock</div><div class='add'>+	 * spinlock.</div><div class='add'>+	 */</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;file-&gt;f_lock);</div><div class='add'>+	gfs2_holder_uninit(fl_gh);</div><div class='add'>+	spin_unlock(&amp;file-&gt;f_lock);</div><div class='add'>+	gfs2_glock_put(gl);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int do_flock(struct file *file, int cmd, struct file_lock *fl)</div><div class='hunk'>@@ -1465,8 +1493,10 @@ static int do_flock(struct file *file, int cmd, struct file_lock *fl)</div><div class='ctx'> 	int error = 0;</div><div class='ctx'> 	int sleeptime;</div><div class='ctx'> </div><div class='del'>-	state = (fl-&gt;fl_type == F_WRLCK) ? LM_ST_EXCLUSIVE : LM_ST_SHARED;</div><div class='del'>-	flags = (IS_SETLKW(cmd) ? 0 : LM_FLAG_TRY_1CB) | GL_EXACT;</div><div class='add'>+	state = lock_is_write(fl) ? LM_ST_EXCLUSIVE : LM_ST_SHARED;</div><div class='add'>+	flags = GL_EXACT | GL_NOPID;</div><div class='add'>+	if (!IS_SETLKW(cmd))</div><div class='add'>+		flags |= LM_FLAG_TRY_1CB;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;fp-&gt;f_fl_mutex);</div><div class='ctx'> </div><div class='hunk'>@@ -1475,8 +1505,8 @@ static int do_flock(struct file *file, int cmd, struct file_lock *fl)</div><div class='ctx'> 		if (fl_gh-&gt;gh_state == state)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		locks_init_lock(&amp;request);</div><div class='del'>-		request.fl_type = F_UNLCK;</div><div class='del'>-		request.fl_flags = FL_FLOCK;</div><div class='add'>+		request.c.flc_type = F_UNLCK;</div><div class='add'>+		request.c.flc_flags = FL_FLOCK;</div><div class='ctx'> 		locks_lock_file_wait(file, &amp;request);</div><div class='ctx'> 		gfs2_glock_dq(fl_gh);</div><div class='ctx'> 		gfs2_holder_reinit(state, flags, fl_gh);</div><div class='hunk'>@@ -1485,19 +1515,21 @@ static int do_flock(struct file *file, int cmd, struct file_lock *fl)</div><div class='ctx'> 				       &amp;gfs2_flock_glops, CREATE, &amp;gl);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			goto out;</div><div class='add'>+		spin_lock(&amp;file-&gt;f_lock);</div><div class='ctx'> 		gfs2_holder_init(gl, state, flags, fl_gh);</div><div class='add'>+		spin_unlock(&amp;file-&gt;f_lock);</div><div class='ctx'> 		gfs2_glock_put(gl);</div><div class='ctx'> 	}</div><div class='ctx'> 	for (sleeptime = 1; sleeptime &lt;= 4; sleeptime &lt;&lt;= 1) {</div><div class='ctx'> 		error = gfs2_glock_nq(fl_gh);</div><div class='ctx'> 		if (error != GLR_TRYFAILED)</div><div class='ctx'> 			break;</div><div class='del'>-		fl_gh-&gt;gh_flags = LM_FLAG_TRY | GL_EXACT;</div><div class='del'>-		fl_gh-&gt;gh_error = 0;</div><div class='add'>+		fl_gh-&gt;gh_flags &amp;= ~LM_FLAG_TRY_1CB;</div><div class='add'>+		fl_gh-&gt;gh_flags |= LM_FLAG_TRY;</div><div class='ctx'> 		msleep(sleeptime);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (error) {</div><div class='del'>-		gfs2_holder_uninit(fl_gh);</div><div class='add'>+		__flock_holder_uninit(file, fl_gh);</div><div class='ctx'> 		if (error == GLR_TRYFAILED)</div><div class='ctx'> 			error = -EAGAIN;</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -1519,7 +1551,7 @@ static void do_unflock(struct file *file, struct file_lock *fl)</div><div class='ctx'> 	locks_lock_file_wait(file, fl);</div><div class='ctx'> 	if (gfs2_holder_initialized(fl_gh)) {</div><div class='ctx'> 		gfs2_glock_dq(fl_gh);</div><div class='del'>-		gfs2_holder_uninit(fl_gh);</div><div class='add'>+		__flock_holder_uninit(file, fl_gh);</div><div class='ctx'> 	}</div><div class='ctx'> 	mutex_unlock(&amp;fp-&gt;f_fl_mutex);</div><div class='ctx'> }</div><div class='hunk'>@@ -1535,10 +1567,10 @@ static void do_unflock(struct file *file, struct file_lock *fl)</div><div class='ctx'> </div><div class='ctx'> static int gfs2_flock(struct file *file, int cmd, struct file_lock *fl)</div><div class='ctx'> {</div><div class='del'>-	if (!(fl-&gt;fl_flags &amp; FL_FLOCK))</div><div class='add'>+	if (!(fl-&gt;c.flc_flags &amp; FL_FLOCK))</div><div class='ctx'> 		return -ENOLCK;</div><div class='ctx'> </div><div class='del'>-	if (fl-&gt;fl_type == F_UNLCK) {</div><div class='add'>+	if (lock_is_unlock(fl)) {</div><div class='ctx'> 		do_unflock(file, fl);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -1559,10 +1591,11 @@ const struct file_operations gfs2_file_fops = {</div><div class='ctx'> 	.fsync		= gfs2_fsync,</div><div class='ctx'> 	.lock		= gfs2_lock,</div><div class='ctx'> 	.flock		= gfs2_flock,</div><div class='del'>-	.splice_read	= generic_file_splice_read,</div><div class='add'>+	.splice_read	= copy_splice_read,</div><div class='ctx'> 	.splice_write	= gfs2_file_splice_write,</div><div class='ctx'> 	.setlease	= simple_nosetlease,</div><div class='ctx'> 	.fallocate	= gfs2_fallocate,</div><div class='add'>+	.fop_flags	= FOP_ASYNC_LOCK,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct file_operations gfs2_dir_fops = {</div><div class='hunk'>@@ -1575,6 +1608,7 @@ const struct file_operations gfs2_dir_fops = {</div><div class='ctx'> 	.lock		= gfs2_lock,</div><div class='ctx'> 	.flock		= gfs2_flock,</div><div class='ctx'> 	.llseek		= default_llseek,</div><div class='add'>+	.fop_flags	= FOP_ASYNC_LOCK,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> #endif /* CONFIG_GFS2_FS_LOCKING_DLM */</div><div class='hunk'>@@ -1590,7 +1624,7 @@ const struct file_operations gfs2_file_fops_nolock = {</div><div class='ctx'> 	.open		= gfs2_open,</div><div class='ctx'> 	.release	= gfs2_release,</div><div class='ctx'> 	.fsync		= gfs2_fsync,</div><div class='del'>-	.splice_read	= generic_file_splice_read,</div><div class='add'>+	.splice_read	= copy_splice_read,</div><div class='ctx'> 	.splice_write	= gfs2_file_splice_write,</div><div class='ctx'> 	.setlease	= generic_setlease,</div><div class='ctx'> 	.fallocate	= gfs2_fallocate,</div><div class='head'>diff --git a/fs/gfs2/glock.c b/fs/gfs2/glock.c<br/>index 19f38aee1b61..92e029104d8a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/glock.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/glock.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/glock.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/glock.c</a></div><div class='hunk'>@@ -33,6 +33,9 @@</div><div class='ctx'> #include &lt;linux/list_sort.h&gt;</div><div class='ctx'> #include &lt;linux/lockref.h&gt;</div><div class='ctx'> #include &lt;linux/rhashtable.h&gt;</div><div class='add'>+#include &lt;linux/pid_namespace.h&gt;</div><div class='add'>+#include &lt;linux/file.h&gt;</div><div class='add'>+#include &lt;linux/random.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "gfs2.h"</div><div class='ctx'> #include "incore.h"</div><div class='hunk'>@@ -58,11 +61,10 @@ struct gfs2_glock_iter {</div><div class='ctx'> typedef void (*glock_examiner) (struct gfs2_glock * gl);</div><div class='ctx'> </div><div class='ctx'> static void do_xmote(struct gfs2_glock *gl, struct gfs2_holder *gh, unsigned int target);</div><div class='del'>-static void __gfs2_glock_dq(struct gfs2_holder *gh);</div><div class='add'>+static void request_demote(struct gfs2_glock *gl, unsigned int state,</div><div class='add'>+			   unsigned long delay, bool remote);</div><div class='ctx'> </div><div class='ctx'> static struct dentry *gfs2_root;</div><div class='del'>-static struct workqueue_struct *glock_workqueue;</div><div class='del'>-struct workqueue_struct *gfs2_delete_workqueue;</div><div class='ctx'> static LIST_HEAD(lru_list);</div><div class='ctx'> static atomic_t lru_count = ATOMIC_INIT(0);</div><div class='ctx'> static DEFINE_SPINLOCK(lru_lock);</div><div class='hunk'>@@ -127,50 +129,51 @@ static void gfs2_glock_dealloc(struct rcu_head *rcu)</div><div class='ctx'> 	struct gfs2_glock *gl = container_of(rcu, struct gfs2_glock, gl_rcu);</div><div class='ctx'> </div><div class='ctx'> 	kfree(gl-&gt;gl_lksb.sb_lvbptr);</div><div class='del'>-	if (gl-&gt;gl_ops-&gt;go_flags &amp; GLOF_ASPACE)</div><div class='del'>-		kmem_cache_free(gfs2_glock_aspace_cachep, gl);</div><div class='del'>-	else</div><div class='add'>+	if (gl-&gt;gl_ops-&gt;go_flags &amp; GLOF_ASPACE) {</div><div class='add'>+		struct gfs2_glock_aspace *gla =</div><div class='add'>+			container_of(gl, struct gfs2_glock_aspace, glock);</div><div class='add'>+		kmem_cache_free(gfs2_glock_aspace_cachep, gla);</div><div class='add'>+	} else</div><div class='ctx'> 		kmem_cache_free(gfs2_glock_cachep, gl);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * glock_blocked_by_withdraw - determine if we can still use a glock</div><div class='del'>- * @gl: the glock</div><div class='del'>- *</div><div class='del'>- * We need to allow some glocks to be enqueued, dequeued, promoted, and demoted</div><div class='del'>- * when we're withdrawn. For example, to maintain metadata integrity, we should</div><div class='del'>- * disallow the use of inode and rgrp glocks when withdrawn. Other glocks, like</div><div class='del'>- * iopen or the transaction glocks may be safely used because none of their</div><div class='del'>- * metadata goes through the journal. So in general, we should disallow all</div><div class='del'>- * glocks that are journaled, and allow all the others. One exception is:</div><div class='del'>- * we need to allow our active journal to be promoted and demoted so others</div><div class='del'>- * may recover it and we can reacquire it when they're done.</div><div class='del'>- */</div><div class='del'>-static bool glock_blocked_by_withdraw(struct gfs2_glock *gl)</div><div class='add'>+static void __gfs2_glock_free(struct gfs2_glock *gl)</div><div class='ctx'> {</div><div class='add'>+	rhashtable_remove_fast(&amp;gl_hash_table, &amp;gl-&gt;gl_node, ht_parms);</div><div class='add'>+	smp_mb();</div><div class='add'>+	wake_up_glock(gl);</div><div class='add'>+	call_rcu(&amp;gl-&gt;gl_rcu, gfs2_glock_dealloc);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void gfs2_glock_free(struct gfs2_glock *gl) {</div><div class='ctx'> 	struct gfs2_sbd *sdp = gl-&gt;gl_name.ln_sbd;</div><div class='ctx'> </div><div class='del'>-	if (likely(!gfs2_withdrawn(sdp)))</div><div class='del'>-		return false;</div><div class='del'>-	if (gl-&gt;gl_ops-&gt;go_flags &amp; GLOF_NONDISK)</div><div class='del'>-		return false;</div><div class='del'>-	if (!sdp-&gt;sd_jdesc ||</div><div class='del'>-	    gl-&gt;gl_name.ln_number == sdp-&gt;sd_jdesc-&gt;jd_no_addr)</div><div class='del'>-		return false;</div><div class='del'>-	return true;</div><div class='add'>+	__gfs2_glock_free(gl);</div><div class='add'>+	if (atomic_dec_and_test(&amp;sdp-&gt;sd_glock_disposal))</div><div class='add'>+		wake_up(&amp;sdp-&gt;sd_kill_wait);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void gfs2_glock_free(struct gfs2_glock *gl)</div><div class='del'>-{</div><div class='add'>+void gfs2_glock_free_later(struct gfs2_glock *gl) {</div><div class='ctx'> 	struct gfs2_sbd *sdp = gl-&gt;gl_name.ln_sbd;</div><div class='ctx'> </div><div class='del'>-	gfs2_glock_assert_withdraw(gl, atomic_read(&amp;gl-&gt;gl_revokes) == 0);</div><div class='del'>-	rhashtable_remove_fast(&amp;gl_hash_table, &amp;gl-&gt;gl_node, ht_parms);</div><div class='del'>-	smp_mb();</div><div class='del'>-	wake_up_glock(gl);</div><div class='del'>-	call_rcu(&amp;gl-&gt;gl_rcu, gfs2_glock_dealloc);</div><div class='add'>+	spin_lock(&amp;lru_lock);</div><div class='add'>+	list_add(&amp;gl-&gt;gl_lru, &amp;sdp-&gt;sd_dead_glocks);</div><div class='add'>+	spin_unlock(&amp;lru_lock);</div><div class='ctx'> 	if (atomic_dec_and_test(&amp;sdp-&gt;sd_glock_disposal))</div><div class='del'>-		wake_up(&amp;sdp-&gt;sd_glock_wait);</div><div class='add'>+		wake_up(&amp;sdp-&gt;sd_kill_wait);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void gfs2_free_dead_glocks(struct gfs2_sbd *sdp)</div><div class='add'>+{</div><div class='add'>+	struct list_head *list = &amp;sdp-&gt;sd_dead_glocks;</div><div class='add'>+</div><div class='add'>+	while(!list_empty(list)) {</div><div class='add'>+		struct gfs2_glock *gl;</div><div class='add'>+</div><div class='add'>+		gl = list_first_entry(list, struct gfs2_glock, gl_lru);</div><div class='add'>+		list_del_init(&amp;gl-&gt;gl_lru);</div><div class='add'>+		__gfs2_glock_free(gl);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -179,46 +182,16 @@ void gfs2_glock_free(struct gfs2_glock *gl)</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-void gfs2_glock_hold(struct gfs2_glock *gl)</div><div class='add'>+struct gfs2_glock *gfs2_glock_hold(struct gfs2_glock *gl)</div><div class='ctx'> {</div><div class='ctx'> 	GLOCK_BUG_ON(gl, __lockref_is_dead(&amp;gl-&gt;gl_lockref));</div><div class='ctx'> 	lockref_get(&amp;gl-&gt;gl_lockref);</div><div class='add'>+	return gl;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * demote_ok - Check to see if it's ok to unlock a glock</div><div class='del'>- * @gl: the glock</div><div class='del'>- *</div><div class='del'>- * Returns: 1 if it's ok</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-static int demote_ok(const struct gfs2_glock *gl)</div><div class='del'>-{</div><div class='del'>-	const struct gfs2_glock_operations *glops = gl-&gt;gl_ops;</div><div class='del'>-</div><div class='del'>-	if (gl-&gt;gl_state == LM_ST_UNLOCKED)</div><div class='del'>-		return 0;</div><div class='del'>-	/*</div><div class='del'>-	 * Note that demote_ok is used for the lru process of disposing of</div><div class='del'>-	 * glocks. For this purpose, we don't care if the glock's holders</div><div class='del'>-	 * have the HIF_MAY_DEMOTE flag set or not. If someone is using</div><div class='del'>-	 * them, don't demote.</div><div class='del'>-	 */</div><div class='del'>-	if (!list_empty(&amp;gl-&gt;gl_holders))</div><div class='del'>-		return 0;</div><div class='del'>-	if (glops-&gt;go_demote_ok)</div><div class='del'>-		return glops-&gt;go_demote_ok(gl);</div><div class='del'>-	return 1;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-void gfs2_glock_add_to_lru(struct gfs2_glock *gl)</div><div class='add'>+static void gfs2_glock_add_to_lru(struct gfs2_glock *gl)</div><div class='ctx'> {</div><div class='del'>-	if (!(gl-&gt;gl_ops-&gt;go_flags &amp; GLOF_LRU))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='ctx'> 	spin_lock(&amp;lru_lock);</div><div class='del'>-</div><div class='ctx'> 	list_move_tail(&amp;gl-&gt;gl_lru, &amp;lru_list);</div><div class='ctx'> </div><div class='ctx'> 	if (!test_bit(GLF_LRU, &amp;gl-&gt;gl_flags)) {</div><div class='hunk'>@@ -231,9 +204,6 @@ void gfs2_glock_add_to_lru(struct gfs2_glock *gl)</div><div class='ctx'> </div><div class='ctx'> static void gfs2_glock_remove_from_lru(struct gfs2_glock *gl)</div><div class='ctx'> {</div><div class='del'>-	if (!(gl-&gt;gl_ops-&gt;go_flags &amp; GLOF_LRU))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='ctx'> 	spin_lock(&amp;lru_lock);</div><div class='ctx'> 	if (test_bit(GLF_LRU, &amp;gl-&gt;gl_flags)) {</div><div class='ctx'> 		list_del_init(&amp;gl-&gt;gl_lru);</div><div class='hunk'>@@ -247,8 +217,10 @@ static void gfs2_glock_remove_from_lru(struct gfs2_glock *gl)</div><div class='ctx'>  * Enqueue the glock on the work queue.  Passes one glock reference on to the</div><div class='ctx'>  * work queue.</div><div class='ctx'>  */</div><div class='del'>-static void __gfs2_glock_queue_work(struct gfs2_glock *gl, unsigned long delay) {</div><div class='del'>-	if (!queue_delayed_work(glock_workqueue, &amp;gl-&gt;gl_work, delay)) {</div><div class='add'>+static void gfs2_glock_queue_work(struct gfs2_glock *gl, unsigned long delay) {</div><div class='add'>+	struct gfs2_sbd *sdp = gl-&gt;gl_name.ln_sbd;</div><div class='add'>+</div><div class='add'>+	if (!queue_delayed_work(sdp-&gt;sd_glock_wq, &amp;gl-&gt;gl_work, delay)) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We are holding the lockref spinlock, and the work was still</div><div class='ctx'> 		 * queued above.  The queued work (glock_work_func) takes that</div><div class='hunk'>@@ -260,21 +232,14 @@ static void __gfs2_glock_queue_work(struct gfs2_glock *gl, unsigned long delay)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void gfs2_glock_queue_work(struct gfs2_glock *gl, unsigned long delay) {</div><div class='del'>-	spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='del'>-	__gfs2_glock_queue_work(gl, delay);</div><div class='del'>-	spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static void __gfs2_glock_put(struct gfs2_glock *gl)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_sbd *sdp = gl-&gt;gl_name.ln_sbd;</div><div class='ctx'> 	struct address_space *mapping = gfs2_glock2aspace(gl);</div><div class='ctx'> </div><div class='ctx'> 	lockref_mark_dead(&amp;gl-&gt;gl_lockref);</div><div class='del'>-</div><div class='del'>-	gfs2_glock_remove_from_lru(gl);</div><div class='ctx'> 	spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='add'>+	gfs2_glock_remove_from_lru(gl);</div><div class='ctx'> 	GLOCK_BUG_ON(gl, !list_empty(&amp;gl-&gt;gl_holders));</div><div class='ctx'> 	if (mapping) {</div><div class='ctx'> 		truncate_inode_pages_final(mapping);</div><div class='hunk'>@@ -285,12 +250,18 @@ static void __gfs2_glock_put(struct gfs2_glock *gl)</div><div class='ctx'> 	sdp-&gt;sd_lockstruct.ls_ops-&gt;lm_put_lock(gl);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Cause the glock to be put in work queue context.</div><div class='del'>- */</div><div class='del'>-void gfs2_glock_queue_put(struct gfs2_glock *gl)</div><div class='add'>+static bool __gfs2_glock_put_or_lock(struct gfs2_glock *gl)</div><div class='ctx'> {</div><div class='del'>-	gfs2_glock_queue_work(gl, 0);</div><div class='add'>+	if (lockref_put_or_lock(&amp;gl-&gt;gl_lockref))</div><div class='add'>+		return true;</div><div class='add'>+	GLOCK_BUG_ON(gl, gl-&gt;gl_lockref.count != 1);</div><div class='add'>+	if (gl-&gt;gl_state != LM_ST_UNLOCKED) {</div><div class='add'>+		gl-&gt;gl_lockref.count--;</div><div class='add'>+		gfs2_glock_add_to_lru(gl);</div><div class='add'>+		spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='add'>+		return true;</div><div class='add'>+	}</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -301,15 +272,28 @@ void gfs2_glock_queue_put(struct gfs2_glock *gl)</div><div class='ctx'> </div><div class='ctx'> void gfs2_glock_put(struct gfs2_glock *gl)</div><div class='ctx'> {</div><div class='del'>-	/* last put could call sleepable dlm api */</div><div class='del'>-	might_sleep();</div><div class='del'>-</div><div class='del'>-	if (lockref_put_or_lock(&amp;gl-&gt;gl_lockref))</div><div class='add'>+	if (__gfs2_glock_put_or_lock(gl))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	__gfs2_glock_put(gl);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * gfs2_glock_put_async - Decrement reference count without sleeping</div><div class='add'>+ * @gl: The glock to put</div><div class='add'>+ *</div><div class='add'>+ * Decrement the reference count on glock immediately unless it is the last</div><div class='add'>+ * reference.  Defer putting the last reference to work queue context.</div><div class='add'>+ */</div><div class='add'>+void gfs2_glock_put_async(struct gfs2_glock *gl)</div><div class='add'>+{</div><div class='add'>+	if (__gfs2_glock_put_or_lock(gl))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	gfs2_glock_queue_work(gl, 0);</div><div class='add'>+	spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /**</div><div class='ctx'>  * may_grant - check if it's ok to grant a new lock</div><div class='ctx'>  * @gl: The glock</div><div class='hunk'>@@ -389,7 +373,7 @@ static void do_error(struct gfs2_glock *gl, const int ret)</div><div class='ctx'> 	struct gfs2_holder *gh, *tmp;</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry_safe(gh, tmp, &amp;gl-&gt;gl_holders, gh_list) {</div><div class='del'>-		if (!test_bit(HIF_WAIT, &amp;gh-&gt;gh_iflags))</div><div class='add'>+		if (test_bit(HIF_HOLDER, &amp;gh-&gt;gh_iflags))</div><div class='ctx'> 			continue;</div><div class='ctx'> 		if (ret &amp; LM_OUT_ERROR)</div><div class='ctx'> 			gh-&gt;gh_error = -EIO;</div><div class='hunk'>@@ -404,40 +388,6 @@ static void do_error(struct gfs2_glock *gl, const int ret)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * demote_incompat_holders - demote incompatible demoteable holders</div><div class='del'>- * @gl: the glock we want to promote</div><div class='del'>- * @new_gh: the new holder to be promoted</div><div class='del'>- */</div><div class='del'>-static void demote_incompat_holders(struct gfs2_glock *gl,</div><div class='del'>-				    struct gfs2_holder *new_gh)</div><div class='del'>-{</div><div class='del'>-	struct gfs2_holder *gh;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Demote incompatible holders before we make ourselves eligible.</div><div class='del'>-	 * (This holder may or may not allow auto-demoting, but we don't want</div><div class='del'>-	 * to demote the new holder before it's even granted.)</div><div class='del'>-	 */</div><div class='del'>-	list_for_each_entry(gh, &amp;gl-&gt;gl_holders, gh_list) {</div><div class='del'>-		/*</div><div class='del'>-		 * Since holders are at the front of the list, we stop when we</div><div class='del'>-		 * find the first non-holder.</div><div class='del'>-		 */</div><div class='del'>-		if (!test_bit(HIF_HOLDER, &amp;gh-&gt;gh_iflags))</div><div class='del'>-			return;</div><div class='del'>-		if (test_bit(HIF_MAY_DEMOTE, &amp;gh-&gt;gh_iflags) &amp;&amp;</div><div class='del'>-		    !may_grant(gl, new_gh, gh)) {</div><div class='del'>-			/*</div><div class='del'>-			 * We should not recurse into do_promote because</div><div class='del'>-			 * __gfs2_glock_dq only calls handle_callback,</div><div class='del'>-			 * gfs2_glock_add_to_lru and __gfs2_glock_queue_work.</div><div class='del'>-			 */</div><div class='del'>-			__gfs2_glock_dq(gh);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='ctx'>  * find_first_holder - find the first "holder" gh</div><div class='ctx'>  * @gl: the glock</div><div class='ctx'>  */</div><div class='hunk'>@@ -455,32 +405,11 @@ static inline struct gfs2_holder *find_first_holder(const struct gfs2_glock *gl)</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * find_first_strong_holder - find the first non-demoteable holder</div><div class='del'>- * @gl: the glock</div><div class='del'>- *</div><div class='del'>- * Find the first holder that doesn't have the HIF_MAY_DEMOTE flag set.</div><div class='del'>- */</div><div class='del'>-static inline struct gfs2_holder *</div><div class='del'>-find_first_strong_holder(struct gfs2_glock *gl)</div><div class='del'>-{</div><div class='del'>-	struct gfs2_holder *gh;</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(gh, &amp;gl-&gt;gl_holders, gh_list) {</div><div class='del'>-		if (!test_bit(HIF_HOLDER, &amp;gh-&gt;gh_iflags))</div><div class='del'>-			return NULL;</div><div class='del'>-		if (!test_bit(HIF_MAY_DEMOTE, &amp;gh-&gt;gh_iflags))</div><div class='del'>-			return gh;</div><div class='del'>-	}</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * gfs2_instantiate - Call the glops instantiate function</div><div class='del'>- * @gl: The glock</div><div class='add'>+ * @gh: The glock holder</div><div class='ctx'>  *</div><div class='del'>- * Returns: 0 if instantiate was successful, 2 if type specific operation is</div><div class='del'>- * underway, or error.</div><div class='add'>+ * Returns: 0 if instantiate was successful, or error.</div><div class='ctx'>  */</div><div class='ctx'> int gfs2_instantiate(struct gfs2_holder *gh)</div><div class='ctx'> {</div><div class='hunk'>@@ -490,13 +419,13 @@ int gfs2_instantiate(struct gfs2_holder *gh)</div><div class='ctx'> </div><div class='ctx'> again:</div><div class='ctx'> 	if (!test_bit(GLF_INSTANTIATE_NEEDED, &amp;gl-&gt;gl_flags))</div><div class='del'>-		return 0;</div><div class='add'>+		goto done;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Since we unlock the lockref lock, we set a flag to indicate</div><div class='ctx'> 	 * instantiate is in progress.</div><div class='ctx'> 	 */</div><div class='del'>-	if (test_bit(GLF_INSTANTIATE_IN_PROG, &amp;gl-&gt;gl_flags)) {</div><div class='add'>+	if (test_and_set_bit(GLF_INSTANTIATE_IN_PROG, &amp;gl-&gt;gl_flags)) {</div><div class='ctx'> 		wait_on_bit(&amp;gl-&gt;gl_flags, GLF_INSTANTIATE_IN_PROG,</div><div class='ctx'> 			    TASK_UNINTERRUPTIBLE);</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -509,84 +438,53 @@ again:</div><div class='ctx'> 		goto again;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	set_bit(GLF_INSTANTIATE_IN_PROG, &amp;gl-&gt;gl_flags);</div><div class='del'>-</div><div class='del'>-	ret = glops-&gt;go_instantiate(gh);</div><div class='add'>+	ret = glops-&gt;go_instantiate(gl);</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		clear_bit(GLF_INSTANTIATE_NEEDED, &amp;gl-&gt;gl_flags);</div><div class='del'>-	clear_bit(GLF_INSTANTIATE_IN_PROG, &amp;gl-&gt;gl_flags);</div><div class='del'>-	smp_mb__after_atomic();</div><div class='del'>-	wake_up_bit(&amp;gl-&gt;gl_flags, GLF_INSTANTIATE_IN_PROG);</div><div class='del'>-	return ret;</div><div class='add'>+	clear_and_wake_up_bit(GLF_INSTANTIATE_IN_PROG, &amp;gl-&gt;gl_flags);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+done:</div><div class='add'>+	if (glops-&gt;go_held)</div><div class='add'>+		return glops-&gt;go_held(gh);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * do_promote - promote as many requests as possible on the current queue</div><div class='ctx'>  * @gl: The glock</div><div class='del'>- * </div><div class='del'>- * Returns: 1 if there is a blocked holder at the head of the list, or 2</div><div class='del'>- *          if a type specific operation is underway.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static int do_promote(struct gfs2_glock *gl)</div><div class='del'>-__releases(&amp;gl-&gt;gl_lockref.lock)</div><div class='del'>-__acquires(&amp;gl-&gt;gl_lockref.lock)</div><div class='add'>+static void do_promote(struct gfs2_glock *gl)</div><div class='ctx'> {</div><div class='del'>-	struct gfs2_holder *gh, *tmp, *first_gh;</div><div class='del'>-	bool incompat_holders_demoted = false;</div><div class='del'>-	bool lock_released;</div><div class='del'>-	int ret;</div><div class='add'>+	struct gfs2_sbd *sdp = gl-&gt;gl_name.ln_sbd;</div><div class='add'>+	struct gfs2_holder *gh, *current_gh;</div><div class='ctx'> </div><div class='del'>-restart:</div><div class='del'>-	first_gh = find_first_strong_holder(gl);</div><div class='del'>-	list_for_each_entry_safe(gh, tmp, &amp;gl-&gt;gl_holders, gh_list) {</div><div class='del'>-		lock_released = false;</div><div class='add'>+	if (gfs2_withdrawn(sdp)) {</div><div class='add'>+		do_error(gl, LM_OUT_ERROR);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	current_gh = find_first_holder(gl);</div><div class='add'>+	list_for_each_entry(gh, &amp;gl-&gt;gl_holders, gh_list) {</div><div class='ctx'> 		if (test_bit(HIF_HOLDER, &amp;gh-&gt;gh_iflags))</div><div class='ctx'> 			continue;</div><div class='del'>-		if (!may_grant(gl, first_gh, gh)) {</div><div class='add'>+		if (!may_grant(gl, current_gh, gh)) {</div><div class='ctx'> 			/*</div><div class='del'>-			 * If we get here, it means we may not grant this holder for</div><div class='del'>-			 * some reason. If this holder is the head of the list, it</div><div class='del'>-			 * means we have a blocked holder at the head, so return 1.</div><div class='add'>+			 * If we get here, it means we may not grant this</div><div class='add'>+			 * holder for some reason.</div><div class='ctx'> 			 */</div><div class='del'>-			if (gh-&gt;gh_list.prev == &amp;gl-&gt;gl_holders)</div><div class='del'>-				return 1;</div><div class='del'>-			do_error(gl, 0);</div><div class='add'>+			if (current_gh)</div><div class='add'>+				do_error(gl, 0); /* Fail queued try locks */</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-		if (!incompat_holders_demoted) {</div><div class='del'>-			demote_incompat_holders(gl, first_gh);</div><div class='del'>-			incompat_holders_demoted = true;</div><div class='del'>-			first_gh = gh;</div><div class='del'>-		}</div><div class='del'>-		if (test_bit(GLF_INSTANTIATE_NEEDED, &amp;gl-&gt;gl_flags) &amp;&amp;</div><div class='del'>-		    !(gh-&gt;gh_flags &amp; GL_SKIP) &amp;&amp; gl-&gt;gl_ops-&gt;go_instantiate) {</div><div class='del'>-			lock_released = true;</div><div class='del'>-			spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='del'>-			ret = gfs2_instantiate(gh);</div><div class='del'>-			spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='del'>-			if (ret) {</div><div class='del'>-				if (ret == 1)</div><div class='del'>-					return 2;</div><div class='del'>-				gh-&gt;gh_error = ret;</div><div class='del'>-				list_del_init(&amp;gh-&gt;gh_list);</div><div class='del'>-				trace_gfs2_glock_queue(gh, 0);</div><div class='del'>-				gfs2_holder_wake(gh);</div><div class='del'>-				goto restart;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='ctx'> 		set_bit(HIF_HOLDER, &amp;gh-&gt;gh_iflags);</div><div class='ctx'> 		trace_gfs2_promote(gh);</div><div class='ctx'> 		gfs2_holder_wake(gh);</div><div class='del'>-		/*</div><div class='del'>-		 * If we released the gl_lockref.lock the holders list may have</div><div class='del'>-		 * changed. For that reason, we start again at the start of</div><div class='del'>-		 * the holders queue.</div><div class='del'>-		 */</div><div class='del'>-		if (lock_released)</div><div class='del'>-			goto restart;</div><div class='add'>+		if (!current_gh)</div><div class='add'>+			current_gh = gh;</div><div class='ctx'> 	}</div><div class='del'>-	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -606,6 +504,23 @@ static inline struct gfs2_holder *find_first_waiter(const struct gfs2_glock *gl)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='add'>+ * find_last_waiter - find the last gh that's waiting for the glock</div><div class='add'>+ * @gl: the glock</div><div class='add'>+ *</div><div class='add'>+ * This also is a fast way of finding out if there are any waiters.</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+static inline struct gfs2_holder *find_last_waiter(const struct gfs2_glock *gl)</div><div class='add'>+{</div><div class='add'>+	struct gfs2_holder *gh;</div><div class='add'>+</div><div class='add'>+	if (list_empty(&amp;gl-&gt;gl_holders))</div><div class='add'>+		return NULL;</div><div class='add'>+	gh = list_last_entry(&amp;gl-&gt;gl_holders, struct gfs2_holder, gh_list);</div><div class='add'>+	return test_bit(HIF_HOLDER, &amp;gh-&gt;gh_iflags) ? NULL : gh;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='ctx'>  * state_change - record that the glock is now in a different state</div><div class='ctx'>  * @gl: the glock</div><div class='ctx'>  * @new_state: the new state</div><div class='hunk'>@@ -613,18 +528,6 @@ static inline struct gfs2_holder *find_first_waiter(const struct gfs2_glock *gl)</div><div class='ctx'> </div><div class='ctx'> static void state_change(struct gfs2_glock *gl, unsigned int new_state)</div><div class='ctx'> {</div><div class='del'>-	int held1, held2;</div><div class='del'>-</div><div class='del'>-	held1 = (gl-&gt;gl_state != LM_ST_UNLOCKED);</div><div class='del'>-	held2 = (new_state != LM_ST_UNLOCKED);</div><div class='del'>-</div><div class='del'>-	if (held1 != held2) {</div><div class='del'>-		GLOCK_BUG_ON(gl, __lockref_is_dead(&amp;gl-&gt;gl_lockref));</div><div class='del'>-		if (held2)</div><div class='del'>-			gl-&gt;gl_lockref.count++;</div><div class='del'>-		else</div><div class='del'>-			gl-&gt;gl_lockref.count--;</div><div class='del'>-	}</div><div class='ctx'> 	if (new_state != gl-&gt;gl_target)</div><div class='ctx'> 		/* shorten our minimum hold time */</div><div class='ctx'> 		gl-&gt;gl_hold_time = max(gl-&gt;gl_hold_time - GL_GLOCK_HOLD_DECR,</div><div class='hunk'>@@ -633,11 +536,11 @@ static void state_change(struct gfs2_glock *gl, unsigned int new_state)</div><div class='ctx'> 	gl-&gt;gl_tchange = jiffies;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void gfs2_set_demote(struct gfs2_glock *gl)</div><div class='add'>+static void gfs2_set_demote(int nr, struct gfs2_glock *gl)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_sbd *sdp = gl-&gt;gl_name.ln_sbd;</div><div class='ctx'> </div><div class='del'>-	set_bit(GLF_DEMOTE, &amp;gl-&gt;gl_flags);</div><div class='add'>+	set_bit(nr, &amp;gl-&gt;gl_flags);</div><div class='ctx'> 	smp_mb();</div><div class='ctx'> 	wake_up(&amp;sdp-&gt;sd_async_glock_wait);</div><div class='ctx'> }</div><div class='hunk'>@@ -660,30 +563,31 @@ static void gfs2_demote_wake(struct gfs2_glock *gl)</div><div class='ctx'> static void finish_xmote(struct gfs2_glock *gl, unsigned int ret)</div><div class='ctx'> {</div><div class='ctx'> 	const struct gfs2_glock_operations *glops = gl-&gt;gl_ops;</div><div class='del'>-	struct gfs2_holder *gh;</div><div class='del'>-	unsigned state = ret &amp; LM_OUT_ST_MASK;</div><div class='del'>-	int rv;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='del'>-	trace_gfs2_glock_state_change(gl, state);</div><div class='del'>-	state_change(gl, state);</div><div class='del'>-	gh = find_first_waiter(gl);</div><div class='add'>+	if (!(ret &amp; ~LM_OUT_ST_MASK)) {</div><div class='add'>+		unsigned state = ret &amp; LM_OUT_ST_MASK;</div><div class='add'>+</div><div class='add'>+		trace_gfs2_glock_state_change(gl, state);</div><div class='add'>+		state_change(gl, state);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* Demote to UN request arrived during demote to SH or DF */</div><div class='ctx'> 	if (test_bit(GLF_DEMOTE_IN_PROGRESS, &amp;gl-&gt;gl_flags) &amp;&amp;</div><div class='del'>-	    state != LM_ST_UNLOCKED &amp;&amp; gl-&gt;gl_demote_state == LM_ST_UNLOCKED)</div><div class='add'>+	    gl-&gt;gl_state != LM_ST_UNLOCKED &amp;&amp;</div><div class='add'>+	    gl-&gt;gl_demote_state == LM_ST_UNLOCKED)</div><div class='ctx'> 		gl-&gt;gl_target = LM_ST_UNLOCKED;</div><div class='ctx'> </div><div class='ctx'> 	/* Check for state != intended state */</div><div class='del'>-	if (unlikely(state != gl-&gt;gl_target)) {</div><div class='add'>+	if (unlikely(gl-&gt;gl_state != gl-&gt;gl_target)) {</div><div class='add'>+		struct gfs2_holder *gh = find_first_waiter(gl);</div><div class='add'>+</div><div class='ctx'> 		if (gh &amp;&amp; !test_bit(GLF_DEMOTE_IN_PROGRESS, &amp;gl-&gt;gl_flags)) {</div><div class='del'>-			/* move to back of queue and try next entry */</div><div class='ctx'> 			if (ret &amp; LM_OUT_CANCELED) {</div><div class='del'>-				if ((gh-&gt;gh_flags &amp; LM_FLAG_PRIORITY) == 0)</div><div class='del'>-					list_move_tail(&amp;gh-&gt;gh_list, &amp;gl-&gt;gl_holders);</div><div class='del'>-				gh = find_first_waiter(gl);</div><div class='del'>-				gl-&gt;gl_target = gh-&gt;gh_state;</div><div class='del'>-				goto retry;</div><div class='add'>+				list_del_init(&amp;gh-&gt;gh_list);</div><div class='add'>+				trace_gfs2_glock_queue(gh, 0);</div><div class='add'>+				gfs2_holder_wake(gh);</div><div class='add'>+				gl-&gt;gl_target = gl-&gt;gl_state;</div><div class='add'>+				goto out;</div><div class='ctx'> 			}</div><div class='ctx'> 			/* Some error or failed "try lock" - report it */</div><div class='ctx'> 			if ((ret &amp; LM_OUT_ERROR) ||</div><div class='hunk'>@@ -693,10 +597,9 @@ static void finish_xmote(struct gfs2_glock *gl, unsigned int ret)</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		switch(state) {</div><div class='add'>+		switch(gl-&gt;gl_state) {</div><div class='ctx'> 		/* Unlocked due to conversion deadlock, try again */</div><div class='ctx'> 		case LM_ST_UNLOCKED:</div><div class='del'>-retry:</div><div class='ctx'> 			do_xmote(gl, gh, gl-&gt;gl_target);</div><div class='ctx'> 			break;</div><div class='ctx'> 		/* Conversion fails, unlock and try again */</div><div class='hunk'>@@ -705,19 +608,24 @@ retry:</div><div class='ctx'> 			do_xmote(gl, gh, LM_ST_UNLOCKED);</div><div class='ctx'> 			break;</div><div class='ctx'> 		default: /* Everything else */</div><div class='del'>-			fs_err(gl-&gt;gl_name.ln_sbd, "wanted %u got %u\n",</div><div class='del'>-			       gl-&gt;gl_target, state);</div><div class='add'>+			fs_err(gl-&gt;gl_name.ln_sbd,</div><div class='add'>+			       "glock %u:%llu requested=%u ret=%u\n",</div><div class='add'>+			       gl-&gt;gl_name.ln_type, gl-&gt;gl_name.ln_number,</div><div class='add'>+			       gl-&gt;gl_req, ret);</div><div class='ctx'> 			GLOCK_BUG_ON(gl, 1);</div><div class='ctx'> 		}</div><div class='del'>-		spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Fast path - we got what we asked for */</div><div class='del'>-	if (test_and_clear_bit(GLF_DEMOTE_IN_PROGRESS, &amp;gl-&gt;gl_flags))</div><div class='add'>+	if (test_bit(GLF_DEMOTE_IN_PROGRESS, &amp;gl-&gt;gl_flags)) {</div><div class='add'>+		clear_bit(GLF_DEMOTE_IN_PROGRESS, &amp;gl-&gt;gl_flags);</div><div class='ctx'> 		gfs2_demote_wake(gl);</div><div class='del'>-	if (state != LM_ST_UNLOCKED) {</div><div class='add'>+	}</div><div class='add'>+	if (gl-&gt;gl_state != LM_ST_UNLOCKED) {</div><div class='ctx'> 		if (glops-&gt;go_xmote_bh) {</div><div class='add'>+			int rv;</div><div class='add'>+</div><div class='ctx'> 			spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='ctx'> 			rv = glops-&gt;go_xmote_bh(gl);</div><div class='ctx'> 			spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='hunk'>@@ -726,24 +634,11 @@ retry:</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		rv = do_promote(gl);</div><div class='del'>-		if (rv == 2)</div><div class='del'>-			goto out_locked;</div><div class='add'>+		do_promote(gl);</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='del'>-	clear_bit(GLF_LOCK, &amp;gl-&gt;gl_flags);</div><div class='del'>-out_locked:</div><div class='del'>-	spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool is_system_glock(struct gfs2_glock *gl)</div><div class='del'>-{</div><div class='del'>-	struct gfs2_sbd *sdp = gl-&gt;gl_name.ln_sbd;</div><div class='del'>-	struct gfs2_inode *m_ip = GFS2_I(sdp-&gt;sd_statfs_inode);</div><div class='del'>-</div><div class='del'>-	if (gl == m_ip-&gt;i_gl)</div><div class='del'>-		return true;</div><div class='del'>-	return false;</div><div class='add'>+	if (!test_bit(GLF_CANCELING, &amp;gl-&gt;gl_flags))</div><div class='add'>+		clear_bit(GLF_LOCK, &amp;gl-&gt;gl_flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -754,127 +649,93 @@ static bool is_system_glock(struct gfs2_glock *gl)</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static void do_xmote(struct gfs2_glock *gl, struct gfs2_holder *gh, unsigned int target)</div><div class='add'>+static void do_xmote(struct gfs2_glock *gl, struct gfs2_holder *gh,</div><div class='add'>+					 unsigned int target)</div><div class='ctx'> __releases(&amp;gl-&gt;gl_lockref.lock)</div><div class='ctx'> __acquires(&amp;gl-&gt;gl_lockref.lock)</div><div class='ctx'> {</div><div class='ctx'> 	const struct gfs2_glock_operations *glops = gl-&gt;gl_ops;</div><div class='ctx'> 	struct gfs2_sbd *sdp = gl-&gt;gl_name.ln_sbd;</div><div class='del'>-	unsigned int lck_flags = (unsigned int)(gh ? gh-&gt;gh_flags : 0);</div><div class='add'>+	struct lm_lockstruct *ls = &amp;sdp-&gt;sd_lockstruct;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (target != LM_ST_UNLOCKED &amp;&amp; glock_blocked_by_withdraw(gl) &amp;&amp;</div><div class='del'>-	    gh &amp;&amp; !(gh-&gt;gh_flags &amp; LM_FLAG_NOEXP))</div><div class='del'>-		return;</div><div class='del'>-	lck_flags &amp;= (LM_FLAG_TRY | LM_FLAG_TRY_1CB | LM_FLAG_NOEXP |</div><div class='del'>-		      LM_FLAG_PRIORITY);</div><div class='add'>+	/*</div><div class='add'>+	 * When a filesystem is withdrawing, the remaining cluster nodes will</div><div class='add'>+	 * take care of recovering the withdrawing node's journal.  We only</div><div class='add'>+	 * need to make sure that once we trigger remote recovery, we won't</div><div class='add'>+	 * write to the shared block device anymore.  This means that here,</div><div class='add'>+	 *</div><div class='add'>+	 * - no new writes to the filesystem must be triggered (-&gt;go_sync()).</div><div class='add'>+	 *</div><div class='add'>+	 * - any cached data should be discarded by calling -&gt;go_inval(), dirty</div><div class='add'>+	 *   or not and journaled or unjournaled.</div><div class='add'>+	 *</div><div class='add'>+	 * - no more dlm locking operations should be issued (-&gt;lm_lock()).</div><div class='add'>+	 */</div><div class='add'>+</div><div class='ctx'> 	GLOCK_BUG_ON(gl, gl-&gt;gl_state == target);</div><div class='ctx'> 	GLOCK_BUG_ON(gl, gl-&gt;gl_state == gl-&gt;gl_target);</div><div class='del'>-	if ((target == LM_ST_UNLOCKED || target == LM_ST_DEFERRED) &amp;&amp;</div><div class='del'>-	    glops-&gt;go_inval) {</div><div class='del'>-		/*</div><div class='del'>-		 * If another process is already doing the invalidate, let that</div><div class='del'>-		 * finish first.  The glock state machine will get back to this</div><div class='del'>-		 * holder again later.</div><div class='del'>-		 */</div><div class='del'>-		if (test_and_set_bit(GLF_INVALIDATE_IN_PROGRESS,</div><div class='del'>-				     &amp;gl-&gt;gl_flags))</div><div class='del'>-			return;</div><div class='del'>-		do_error(gl, 0); /* Fail queued try locks */</div><div class='del'>-	}</div><div class='del'>-	gl-&gt;gl_req = target;</div><div class='del'>-	set_bit(GLF_BLOCKING, &amp;gl-&gt;gl_flags);</div><div class='del'>-	if ((gl-&gt;gl_req == LM_ST_UNLOCKED) ||</div><div class='del'>-	    (gl-&gt;gl_state == LM_ST_EXCLUSIVE) ||</div><div class='del'>-	    (lck_flags &amp; (LM_FLAG_TRY|LM_FLAG_TRY_1CB)))</div><div class='del'>-		clear_bit(GLF_BLOCKING, &amp;gl-&gt;gl_flags);</div><div class='add'>+</div><div class='add'>+	if (!glops-&gt;go_inval || !glops-&gt;go_sync)</div><div class='add'>+		goto skip_inval;</div><div class='add'>+</div><div class='ctx'> 	spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='del'>-	if (glops-&gt;go_sync) {</div><div class='add'>+	if (!gfs2_withdrawn(sdp)) {</div><div class='ctx'> 		ret = glops-&gt;go_sync(gl);</div><div class='del'>-		/* If we had a problem syncing (due to io errors or whatever,</div><div class='del'>-		 * we should not invalidate the metadata or tell dlm to</div><div class='del'>-		 * release the glock to other nodes.</div><div class='del'>-		 */</div><div class='ctx'> 		if (ret) {</div><div class='ctx'> 			if (cmpxchg(&amp;sdp-&gt;sd_log_error, 0, ret)) {</div><div class='del'>-				fs_err(sdp, "Error %d syncing glock \n", ret);</div><div class='add'>+				fs_err(sdp, "Error %d syncing glock\n", ret);</div><div class='ctx'> 				gfs2_dump_glock(NULL, gl, true);</div><div class='add'>+				gfs2_withdraw(sdp);</div><div class='ctx'> 			}</div><div class='del'>-			goto skip_inval;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	if (test_bit(GLF_INVALIDATE_IN_PROGRESS, &amp;gl-&gt;gl_flags)) {</div><div class='del'>-		/*</div><div class='del'>-		 * The call to go_sync should have cleared out the ail list.</div><div class='del'>-		 * If there are still items, we have a problem. We ought to</div><div class='del'>-		 * withdraw, but we can't because the withdraw code also uses</div><div class='del'>-		 * glocks. Warn about the error, dump the glock, then fall</div><div class='del'>-		 * through and wait for logd to do the withdraw for us.</div><div class='del'>-		 */</div><div class='del'>-		if ((atomic_read(&amp;gl-&gt;gl_ail_count) != 0) &amp;&amp;</div><div class='del'>-		    (!cmpxchg(&amp;sdp-&gt;sd_log_error, 0, -EIO))) {</div><div class='del'>-			gfs2_glock_assert_warn(gl,</div><div class='del'>-					       !atomic_read(&amp;gl-&gt;gl_ail_count));</div><div class='del'>-			gfs2_dump_glock(NULL, gl, true);</div><div class='del'>-		}</div><div class='add'>+</div><div class='add'>+	if (target == LM_ST_UNLOCKED || target == LM_ST_DEFERRED)</div><div class='ctx'> 		glops-&gt;go_inval(gl, target == LM_ST_DEFERRED ? 0 : DIO_METADATA);</div><div class='del'>-		clear_bit(GLF_INVALIDATE_IN_PROGRESS, &amp;gl-&gt;gl_flags);</div><div class='del'>-	}</div><div class='add'>+	spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='ctx'> </div><div class='ctx'> skip_inval:</div><div class='del'>-	gfs2_glock_hold(gl);</div><div class='del'>-	/*</div><div class='del'>-	 * Check for an error encountered since we called go_sync and go_inval.</div><div class='del'>-	 * If so, we can't withdraw from the glock code because the withdraw</div><div class='del'>-	 * code itself uses glocks (see function signal_our_withdraw) to</div><div class='del'>-	 * change the mount to read-only. Most importantly, we must not call</div><div class='del'>-	 * dlm to unlock the glock until the journal is in a known good state</div><div class='del'>-	 * (after journal replay) otherwise other nodes may use the object</div><div class='del'>-	 * (rgrp or dinode) and then later, journal replay will corrupt the</div><div class='del'>-	 * file system. The best we can do here is wait for the logd daemon</div><div class='del'>-	 * to see sd_log_error and withdraw, and in the meantime, requeue the</div><div class='del'>-	 * work for later.</div><div class='del'>-	 *</div><div class='del'>-	 * We make a special exception for some system glocks, such as the</div><div class='del'>-	 * system statfs inode glock, which needs to be granted before the</div><div class='del'>-	 * gfs2_quotad daemon can exit, and that exit needs to finish before</div><div class='del'>-	 * we can unmount the withdrawn file system.</div><div class='del'>-	 *</div><div class='del'>-	 * However, if we're just unlocking the lock (say, for unmount, when</div><div class='del'>-	 * gfs2_gl_hash_clear calls clear_glock) and recovery is complete</div><div class='del'>-	 * then it's okay to tell dlm to unlock it.</div><div class='del'>-	 */</div><div class='del'>-	if (unlikely(sdp-&gt;sd_log_error &amp;&amp; !gfs2_withdrawn(sdp)))</div><div class='del'>-		gfs2_withdraw_delayed(sdp);</div><div class='del'>-	if (glock_blocked_by_withdraw(gl) &amp;&amp;</div><div class='del'>-	    (target != LM_ST_UNLOCKED ||</div><div class='del'>-	     test_bit(SDF_WITHDRAW_RECOVERY, &amp;sdp-&gt;sd_flags))) {</div><div class='del'>-		if (!is_system_glock(gl)) {</div><div class='del'>-			gfs2_glock_queue_work(gl, GL_GLOCK_DFT_HOLD);</div><div class='del'>-			goto out;</div><div class='del'>-		} else {</div><div class='del'>-			clear_bit(GLF_INVALIDATE_IN_PROGRESS, &amp;gl-&gt;gl_flags);</div><div class='del'>-		}</div><div class='add'>+	if (gfs2_withdrawn(sdp)) {</div><div class='add'>+		if (target != LM_ST_UNLOCKED)</div><div class='add'>+			target = LM_OUT_ERROR;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (sdp-&gt;sd_lockstruct.ls_ops-&gt;lm_lock)	{</div><div class='del'>-		/* lock_dlm */</div><div class='del'>-		ret = sdp-&gt;sd_lockstruct.ls_ops-&gt;lm_lock(gl, target, lck_flags);</div><div class='del'>-		if (ret == -EINVAL &amp;&amp; gl-&gt;gl_target == LM_ST_UNLOCKED &amp;&amp;</div><div class='del'>-		    target == LM_ST_UNLOCKED &amp;&amp;</div><div class='del'>-		    test_bit(SDF_SKIP_DLM_UNLOCK, &amp;sdp-&gt;sd_flags)) {</div><div class='del'>-			finish_xmote(gl, target);</div><div class='del'>-			gfs2_glock_queue_work(gl, 0);</div><div class='del'>-		} else if (ret) {</div><div class='add'>+	if (ls-&gt;ls_ops-&gt;lm_lock) {</div><div class='add'>+		set_bit(GLF_PENDING_REPLY, &amp;gl-&gt;gl_flags);</div><div class='add'>+		spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='add'>+		ret = ls-&gt;ls_ops-&gt;lm_lock(gl, target, gh ? gh-&gt;gh_flags : 0);</div><div class='add'>+		spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='add'>+</div><div class='add'>+		if (!ret) {</div><div class='add'>+			/* The operation will be completed asynchronously. */</div><div class='add'>+			gl-&gt;gl_lockref.count++;</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+		clear_bit(GLF_PENDING_REPLY, &amp;gl-&gt;gl_flags);</div><div class='add'>+</div><div class='add'>+		if (ret == -ENODEV) {</div><div class='add'>+			/*</div><div class='add'>+			 * The lockspace has been released and the lock has</div><div class='add'>+			 * been unlocked implicitly.</div><div class='add'>+			 */</div><div class='add'>+			if (target != LM_ST_UNLOCKED) {</div><div class='add'>+				target = LM_OUT_ERROR;</div><div class='add'>+				goto out;</div><div class='add'>+			}</div><div class='add'>+		} else {</div><div class='ctx'> 			fs_err(sdp, "lm_lock ret %d\n", ret);</div><div class='ctx'> 			GLOCK_BUG_ON(gl, !gfs2_withdrawn(sdp));</div><div class='add'>+			return;</div><div class='ctx'> 		}</div><div class='del'>-	} else { /* lock_nolock */</div><div class='del'>-		finish_xmote(gl, target);</div><div class='del'>-		gfs2_glock_queue_work(gl, 0);</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> out:</div><div class='del'>-	spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='add'>+	/* Complete the operation now. */</div><div class='add'>+	finish_xmote(gl, target);</div><div class='add'>+	gl-&gt;gl_lockref.count++;</div><div class='add'>+	gfs2_glock_queue_work(gl, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -888,16 +749,26 @@ static void run_queue(struct gfs2_glock *gl, const int nonblock)</div><div class='ctx'> __releases(&amp;gl-&gt;gl_lockref.lock)</div><div class='ctx'> __acquires(&amp;gl-&gt;gl_lockref.lock)</div><div class='ctx'> {</div><div class='del'>-	struct gfs2_holder *gh = NULL;</div><div class='del'>-	int ret;</div><div class='add'>+	struct gfs2_holder *gh;</div><div class='ctx'> </div><div class='del'>-	if (test_and_set_bit(GLF_LOCK, &amp;gl-&gt;gl_flags))</div><div class='add'>+	if (test_bit(GLF_LOCK, &amp;gl-&gt;gl_flags))</div><div class='ctx'> 		return;</div><div class='add'>+	set_bit(GLF_LOCK, &amp;gl-&gt;gl_flags);</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * The GLF_DEMOTE_IN_PROGRESS flag is only set intermittently during</div><div class='add'>+	 * locking operations.  We have just started a locking operation by</div><div class='add'>+	 * setting the GLF_LOCK flag, so the GLF_DEMOTE_IN_PROGRESS flag must</div><div class='add'>+	 * be cleared.</div><div class='add'>+	 */</div><div class='ctx'> 	GLOCK_BUG_ON(gl, test_bit(GLF_DEMOTE_IN_PROGRESS, &amp;gl-&gt;gl_flags));</div><div class='ctx'> </div><div class='del'>-	if (test_bit(GLF_DEMOTE, &amp;gl-&gt;gl_flags) &amp;&amp;</div><div class='del'>-	    gl-&gt;gl_demote_state != gl-&gt;gl_state) {</div><div class='add'>+	if (test_bit(GLF_DEMOTE, &amp;gl-&gt;gl_flags)) {</div><div class='add'>+		if (gl-&gt;gl_demote_state == gl-&gt;gl_state) {</div><div class='add'>+			gfs2_demote_wake(gl);</div><div class='add'>+			goto promote;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		if (find_first_holder(gl))</div><div class='ctx'> 			goto out_unlock;</div><div class='ctx'> 		if (nonblock)</div><div class='hunk'>@@ -905,34 +776,67 @@ __acquires(&amp;gl-&gt;gl_lockref.lock)</div><div class='ctx'> 		set_bit(GLF_DEMOTE_IN_PROGRESS, &amp;gl-&gt;gl_flags);</div><div class='ctx'> 		GLOCK_BUG_ON(gl, gl-&gt;gl_demote_state == LM_ST_EXCLUSIVE);</div><div class='ctx'> 		gl-&gt;gl_target = gl-&gt;gl_demote_state;</div><div class='del'>-	} else {</div><div class='del'>-		if (test_bit(GLF_DEMOTE, &amp;gl-&gt;gl_flags))</div><div class='del'>-			gfs2_demote_wake(gl);</div><div class='del'>-		ret = do_promote(gl);</div><div class='del'>-		if (ret == 0)</div><div class='del'>-			goto out_unlock;</div><div class='del'>-		if (ret == 2)</div><div class='del'>-			goto out;</div><div class='del'>-		gh = find_first_waiter(gl);</div><div class='del'>-		gl-&gt;gl_target = gh-&gt;gh_state;</div><div class='del'>-		if (!(gh-&gt;gh_flags &amp; (LM_FLAG_TRY | LM_FLAG_TRY_1CB)))</div><div class='del'>-			do_error(gl, 0); /* Fail queued try locks */</div><div class='add'>+		do_xmote(gl, NULL, gl-&gt;gl_target);</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+promote:</div><div class='add'>+	do_promote(gl);</div><div class='add'>+	if (find_first_holder(gl))</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	gh = find_first_waiter(gl);</div><div class='add'>+	if (!gh)</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	if (nonblock)</div><div class='add'>+		goto out_sched;</div><div class='add'>+	gl-&gt;gl_target = gh-&gt;gh_state;</div><div class='add'>+	if (!(gh-&gt;gh_flags &amp; (LM_FLAG_TRY | LM_FLAG_TRY_1CB)))</div><div class='add'>+		do_error(gl, 0); /* Fail queued try locks */</div><div class='ctx'> 	do_xmote(gl, gh, gl-&gt;gl_target);</div><div class='del'>-out:</div><div class='ctx'> 	return;</div><div class='ctx'> </div><div class='ctx'> out_sched:</div><div class='ctx'> 	clear_bit(GLF_LOCK, &amp;gl-&gt;gl_flags);</div><div class='del'>-	smp_mb__after_atomic();</div><div class='ctx'> 	gl-&gt;gl_lockref.count++;</div><div class='del'>-	__gfs2_glock_queue_work(gl, 0);</div><div class='add'>+	gfs2_glock_queue_work(gl, 0);</div><div class='ctx'> 	return;</div><div class='ctx'> </div><div class='ctx'> out_unlock:</div><div class='ctx'> 	clear_bit(GLF_LOCK, &amp;gl-&gt;gl_flags);</div><div class='del'>-	smp_mb__after_atomic();</div><div class='del'>-	return;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * glock_set_object - set the gl_object field of a glock</div><div class='add'>+ * @gl: the glock</div><div class='add'>+ * @object: the object</div><div class='add'>+ */</div><div class='add'>+void glock_set_object(struct gfs2_glock *gl, void *object)</div><div class='add'>+{</div><div class='add'>+	void *prev_object;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='add'>+	prev_object = gl-&gt;gl_object;</div><div class='add'>+	gl-&gt;gl_object = object;</div><div class='add'>+	spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='add'>+	if (gfs2_assert_warn(gl-&gt;gl_name.ln_sbd, prev_object == NULL))</div><div class='add'>+		gfs2_dump_glock(NULL, gl, true);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * glock_clear_object - clear the gl_object field of a glock</div><div class='add'>+ * @gl: the glock</div><div class='add'>+ * @object: object the glock currently points at</div><div class='add'>+ */</div><div class='add'>+void glock_clear_object(struct gfs2_glock *gl, void *object)</div><div class='add'>+{</div><div class='add'>+	void *prev_object;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='add'>+	prev_object = gl-&gt;gl_object;</div><div class='add'>+	gl-&gt;gl_object = NULL;</div><div class='add'>+	spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='add'>+	if (gfs2_assert_warn(gl-&gt;gl_name.ln_sbd, prev_object == object))</div><div class='add'>+		gfs2_dump_glock(NULL, gl, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void gfs2_inode_remember_delete(struct gfs2_glock *gl, u64 generation)</div><div class='hunk'>@@ -967,50 +871,76 @@ static void gfs2_glock_poke(struct gfs2_glock *gl)</div><div class='ctx'> 	gfs2_holder_uninit(&amp;gh);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool gfs2_try_evict(struct gfs2_glock *gl)</div><div class='add'>+static struct gfs2_inode *gfs2_grab_existing_inode(struct gfs2_glock *gl)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_inode *ip;</div><div class='del'>-	bool evicted = false;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * If there is contention on the iopen glock and we have an inode, try</div><div class='del'>-	 * to grab and release the inode so that it can be evicted.  This will</div><div class='del'>-	 * allow the remote node to go ahead and delete the inode without us</div><div class='del'>-	 * having to do it, which will avoid rgrp glock thrashing.</div><div class='del'>-	 *</div><div class='del'>-	 * The remote node is likely still holding the corresponding inode</div><div class='del'>-	 * glock, so it will run before we get to verify that the delete has</div><div class='del'>-	 * happened below.</div><div class='del'>-	 */</div><div class='ctx'> 	spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='ctx'> 	ip = gl-&gt;gl_object;</div><div class='ctx'> 	if (ip &amp;&amp; !igrab(&amp;ip-&gt;i_inode))</div><div class='ctx'> 		ip = NULL;</div><div class='ctx'> 	spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='ctx'> 	if (ip) {</div><div class='del'>-		struct gfs2_glock *inode_gl = NULL;</div><div class='add'>+		wait_on_new_inode(&amp;ip-&gt;i_inode);</div><div class='add'>+		if (is_bad_inode(&amp;ip-&gt;i_inode)) {</div><div class='add'>+			iput(&amp;ip-&gt;i_inode);</div><div class='add'>+			ip = NULL;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	return ip;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		gl-&gt;gl_no_formal_ino = ip-&gt;i_no_formal_ino;</div><div class='del'>-		set_bit(GIF_DEFERRED_DELETE, &amp;ip-&gt;i_flags);</div><div class='add'>+static void gfs2_try_to_evict(struct gfs2_glock *gl)</div><div class='add'>+{</div><div class='add'>+	struct gfs2_inode *ip;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If there is contention on the iopen glock and we have an inode, try</div><div class='add'>+	 * to grab and release the inode so that it can be evicted.  The</div><div class='add'>+	 * GLF_DEFER_DELETE flag indicates to gfs2_evict_inode() that the inode</div><div class='add'>+	 * should not be deleted locally.  This will allow the remote node to</div><div class='add'>+	 * go ahead and delete the inode without us having to do it, which will</div><div class='add'>+	 * avoid rgrp glock thrashing.</div><div class='add'>+	 *</div><div class='add'>+	 * The remote node is likely still holding the corresponding inode</div><div class='add'>+	 * glock, so it will run before we get to verify that the delete has</div><div class='add'>+	 * happened below.  (Verification is triggered by the call to</div><div class='add'>+	 * gfs2_queue_verify_delete() in gfs2_evict_inode().)</div><div class='add'>+	 */</div><div class='add'>+	ip = gfs2_grab_existing_inode(gl);</div><div class='add'>+	if (ip) {</div><div class='add'>+		set_bit(GLF_DEFER_DELETE, &amp;gl-&gt;gl_flags);</div><div class='ctx'> 		d_prune_aliases(&amp;ip-&gt;i_inode);</div><div class='ctx'> 		iput(&amp;ip-&gt;i_inode);</div><div class='add'>+		clear_bit(GLF_DEFER_DELETE, &amp;gl-&gt;gl_flags);</div><div class='ctx'> </div><div class='ctx'> 		/* If the inode was evicted, gl-&gt;gl_object will now be NULL. */</div><div class='del'>-		spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='del'>-		ip = gl-&gt;gl_object;</div><div class='add'>+		ip = gfs2_grab_existing_inode(gl);</div><div class='ctx'> 		if (ip) {</div><div class='del'>-			inode_gl = ip-&gt;i_gl;</div><div class='del'>-			lockref_get(&amp;inode_gl-&gt;gl_lockref);</div><div class='del'>-			clear_bit(GIF_DEFERRED_DELETE, &amp;ip-&gt;i_flags);</div><div class='add'>+			gfs2_glock_poke(ip-&gt;i_gl);</div><div class='add'>+			iput(&amp;ip-&gt;i_inode);</div><div class='ctx'> 		}</div><div class='del'>-		spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='del'>-		if (inode_gl) {</div><div class='del'>-			gfs2_glock_poke(inode_gl);</div><div class='del'>-			gfs2_glock_put(inode_gl);</div><div class='del'>-		}</div><div class='del'>-		evicted = !ip;</div><div class='ctx'> 	}</div><div class='del'>-	return evicted;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool gfs2_queue_try_to_evict(struct gfs2_glock *gl)</div><div class='add'>+{</div><div class='add'>+	struct gfs2_sbd *sdp = gl-&gt;gl_name.ln_sbd;</div><div class='add'>+</div><div class='add'>+	if (test_and_set_bit(GLF_TRY_TO_EVICT, &amp;gl-&gt;gl_flags))</div><div class='add'>+		return false;</div><div class='add'>+	return !mod_delayed_work(sdp-&gt;sd_delete_wq, &amp;gl-&gt;gl_delete, 0);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool gfs2_queue_verify_delete(struct gfs2_glock *gl, bool later)</div><div class='add'>+{</div><div class='add'>+	struct gfs2_sbd *sdp = gl-&gt;gl_name.ln_sbd;</div><div class='add'>+	unsigned long delay;</div><div class='add'>+</div><div class='add'>+	if (test_and_set_bit(GLF_VERIFY_DELETE, &amp;gl-&gt;gl_flags))</div><div class='add'>+		return false;</div><div class='add'>+	delay = later ? HZ + get_random_long() % (HZ * 9) : 0;</div><div class='add'>+	return queue_delayed_work(sdp-&gt;sd_delete_wq, &amp;gl-&gt;gl_delete, delay);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void delete_work_func(struct work_struct *work)</div><div class='hunk'>@@ -1018,45 +948,34 @@ static void delete_work_func(struct work_struct *work)</div><div class='ctx'> 	struct delayed_work *dwork = to_delayed_work(work);</div><div class='ctx'> 	struct gfs2_glock *gl = container_of(dwork, struct gfs2_glock, gl_delete);</div><div class='ctx'> 	struct gfs2_sbd *sdp = gl-&gt;gl_name.ln_sbd;</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	u64 no_addr = gl-&gt;gl_name.ln_number;</div><div class='add'>+	bool verify_delete = test_and_clear_bit(GLF_VERIFY_DELETE, &amp;gl-&gt;gl_flags);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='del'>-	clear_bit(GLF_PENDING_DELETE, &amp;gl-&gt;gl_flags);</div><div class='del'>-	spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='add'>+	/*</div><div class='add'>+	 * Check for the GLF_VERIFY_DELETE above: this ensures that we won't</div><div class='add'>+	 * immediately process GLF_VERIFY_DELETE work that the below call to</div><div class='add'>+	 * gfs2_try_to_evict() queues.</div><div class='add'>+	 */</div><div class='ctx'> </div><div class='del'>-	if (test_bit(GLF_DEMOTE, &amp;gl-&gt;gl_flags)) {</div><div class='del'>-		/*</div><div class='del'>-		 * If we can evict the inode, give the remote node trying to</div><div class='del'>-		 * delete the inode some time before verifying that the delete</div><div class='del'>-		 * has happened.  Otherwise, if we cause contention on the inode glock</div><div class='del'>-		 * immediately, the remote node will think that we still have</div><div class='del'>-		 * the inode in use, and so it will give up waiting.</div><div class='del'>-		 *</div><div class='del'>-		 * If we can't evict the inode, signal to the remote node that</div><div class='del'>-		 * the inode is still in use.  We'll later try to delete the</div><div class='del'>-		 * inode locally in gfs2_evict_inode.</div><div class='del'>-		 *</div><div class='del'>-		 * FIXME: We only need to verify that the remote node has</div><div class='del'>-		 * deleted the inode because nodes before this remote delete</div><div class='del'>-		 * rework won't cooperate.  At a later time, when we no longer</div><div class='del'>-		 * care about compatibility with such nodes, we can skip this</div><div class='del'>-		 * step entirely.</div><div class='del'>-		 */</div><div class='del'>-		if (gfs2_try_evict(gl)) {</div><div class='del'>-			if (gfs2_queue_delete_work(gl, 5 * HZ))</div><div class='add'>+	if (test_and_clear_bit(GLF_TRY_TO_EVICT, &amp;gl-&gt;gl_flags))</div><div class='add'>+		gfs2_try_to_evict(gl);</div><div class='add'>+</div><div class='add'>+	if (verify_delete) {</div><div class='add'>+		u64 no_addr = gl-&gt;gl_name.ln_number;</div><div class='add'>+		struct inode *inode;</div><div class='add'>+</div><div class='add'>+		inode = gfs2_lookup_by_inum(sdp, no_addr, gl-&gt;gl_no_formal_ino,</div><div class='add'>+					    GFS2_BLKST_UNLINKED);</div><div class='add'>+		if (IS_ERR(inode)) {</div><div class='add'>+			if (PTR_ERR(inode) == -EAGAIN &amp;&amp;</div><div class='add'>+			    !test_bit(SDF_KILL, &amp;sdp-&gt;sd_flags) &amp;&amp;</div><div class='add'>+			    gfs2_queue_verify_delete(gl, true))</div><div class='ctx'> 				return;</div><div class='add'>+		} else {</div><div class='add'>+			d_prune_aliases(inode);</div><div class='add'>+			iput(inode);</div><div class='ctx'> 		}</div><div class='del'>-		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	inode = gfs2_lookup_by_inum(sdp, no_addr, gl-&gt;gl_no_formal_ino,</div><div class='del'>-				    GFS2_BLKST_UNLINKED);</div><div class='del'>-	if (!IS_ERR_OR_NULL(inode)) {</div><div class='del'>-		d_prune_aliases(inode);</div><div class='del'>-		iput(inode);</div><div class='del'>-	}</div><div class='del'>-out:</div><div class='ctx'> 	gfs2_glock_put(gl);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1066,43 +985,44 @@ static void glock_work_func(struct work_struct *work)</div><div class='ctx'> 	struct gfs2_glock *gl = container_of(work, struct gfs2_glock, gl_work.work);</div><div class='ctx'> 	unsigned int drop_refs = 1;</div><div class='ctx'> </div><div class='del'>-	if (test_and_clear_bit(GLF_REPLY_PENDING, &amp;gl-&gt;gl_flags)) {</div><div class='add'>+	spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='add'>+	if (test_bit(GLF_HAVE_REPLY, &amp;gl-&gt;gl_flags)) {</div><div class='add'>+		clear_bit(GLF_HAVE_REPLY, &amp;gl-&gt;gl_flags);</div><div class='ctx'> 		finish_xmote(gl, gl-&gt;gl_reply);</div><div class='ctx'> 		drop_refs++;</div><div class='ctx'> 	}</div><div class='del'>-	spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='ctx'> 	if (test_bit(GLF_PENDING_DEMOTE, &amp;gl-&gt;gl_flags) &amp;&amp;</div><div class='ctx'> 	    gl-&gt;gl_state != LM_ST_UNLOCKED &amp;&amp;</div><div class='ctx'> 	    gl-&gt;gl_demote_state != LM_ST_EXCLUSIVE) {</div><div class='del'>-		unsigned long holdtime, now = jiffies;</div><div class='add'>+		if (gl-&gt;gl_name.ln_type == LM_TYPE_INODE) {</div><div class='add'>+			unsigned long holdtime, now = jiffies;</div><div class='ctx'> </div><div class='del'>-		holdtime = gl-&gt;gl_tchange + gl-&gt;gl_hold_time;</div><div class='del'>-		if (time_before(now, holdtime))</div><div class='del'>-			delay = holdtime - now;</div><div class='add'>+			holdtime = gl-&gt;gl_tchange + gl-&gt;gl_hold_time;</div><div class='add'>+			if (time_before(now, holdtime))</div><div class='add'>+				delay = holdtime - now;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		if (!delay) {</div><div class='ctx'> 			clear_bit(GLF_PENDING_DEMOTE, &amp;gl-&gt;gl_flags);</div><div class='del'>-			gfs2_set_demote(gl);</div><div class='add'>+			gfs2_set_demote(GLF_DEMOTE, gl);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	run_queue(gl, 0);</div><div class='ctx'> 	if (delay) {</div><div class='ctx'> 		/* Keep one glock reference for the work we requeue. */</div><div class='ctx'> 		drop_refs--;</div><div class='del'>-		if (gl-&gt;gl_name.ln_type != LM_TYPE_INODE)</div><div class='del'>-			delay = 0;</div><div class='del'>-		__gfs2_glock_queue_work(gl, delay);</div><div class='add'>+		gfs2_glock_queue_work(gl, delay);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Drop the remaining glock references manually here. (Mind that</div><div class='del'>-	 * __gfs2_glock_queue_work depends on the lockref spinlock begin held</div><div class='del'>-	 * here as well.)</div><div class='del'>-	 */</div><div class='add'>+	/* Drop the remaining glock references manually. */</div><div class='add'>+	GLOCK_BUG_ON(gl, gl-&gt;gl_lockref.count &lt; drop_refs);</div><div class='ctx'> 	gl-&gt;gl_lockref.count -= drop_refs;</div><div class='ctx'> 	if (!gl-&gt;gl_lockref.count) {</div><div class='del'>-		__gfs2_glock_put(gl);</div><div class='del'>-		return;</div><div class='add'>+		if (gl-&gt;gl_state == LM_ST_UNLOCKED) {</div><div class='add'>+			__gfs2_glock_put(gl);</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+		gfs2_glock_add_to_lru(gl);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='ctx'> }</div><div class='hunk'>@@ -1138,6 +1058,8 @@ again:</div><div class='ctx'> out:</div><div class='ctx'> 	rcu_read_unlock();</div><div class='ctx'> 	finish_wait(wq, &amp;wait.wait);</div><div class='add'>+	if (gl)</div><div class='add'>+		gfs2_glock_remove_from_lru(gl);</div><div class='ctx'> 	return gl;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1158,51 +1080,51 @@ int gfs2_glock_get(struct gfs2_sbd *sdp, u64 number,</div><div class='ctx'> 		   const struct gfs2_glock_operations *glops, int create,</div><div class='ctx'> 		   struct gfs2_glock **glp)</div><div class='ctx'> {</div><div class='del'>-	struct super_block *s = sdp-&gt;sd_vfs;</div><div class='ctx'> 	struct lm_lockname name = { .ln_number = number,</div><div class='ctx'> 				    .ln_type = glops-&gt;go_type,</div><div class='ctx'> 				    .ln_sbd = sdp };</div><div class='ctx'> 	struct gfs2_glock *gl, *tmp;</div><div class='ctx'> 	struct address_space *mapping;</div><div class='del'>-	struct kmem_cache *cachep;</div><div class='del'>-	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	gl = find_insert_glock(&amp;name, NULL);</div><div class='del'>-	if (gl) {</div><div class='del'>-		*glp = gl;</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='add'>+	if (gl)</div><div class='add'>+		goto found;</div><div class='ctx'> 	if (!create)</div><div class='ctx'> 		return -ENOENT;</div><div class='ctx'> </div><div class='del'>-	if (glops-&gt;go_flags &amp; GLOF_ASPACE)</div><div class='del'>-		cachep = gfs2_glock_aspace_cachep;</div><div class='del'>-	else</div><div class='del'>-		cachep = gfs2_glock_cachep;</div><div class='del'>-	gl = kmem_cache_alloc(cachep, GFP_NOFS);</div><div class='del'>-	if (!gl)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='add'>+	if (glops-&gt;go_flags &amp; GLOF_ASPACE) {</div><div class='add'>+		struct gfs2_glock_aspace *gla =</div><div class='add'>+			kmem_cache_alloc(gfs2_glock_aspace_cachep, GFP_NOFS);</div><div class='add'>+		if (!gla)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+		gl = &amp;gla-&gt;glock;</div><div class='add'>+	} else {</div><div class='add'>+		gl = kmem_cache_alloc(gfs2_glock_cachep, GFP_NOFS);</div><div class='add'>+		if (!gl)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+	}</div><div class='ctx'> 	memset(&amp;gl-&gt;gl_lksb, 0, sizeof(struct dlm_lksb));</div><div class='add'>+	gl-&gt;gl_ops = glops;</div><div class='ctx'> </div><div class='ctx'> 	if (glops-&gt;go_flags &amp; GLOF_LVB) {</div><div class='ctx'> 		gl-&gt;gl_lksb.sb_lvbptr = kzalloc(GDLM_LVB_SIZE, GFP_NOFS);</div><div class='ctx'> 		if (!gl-&gt;gl_lksb.sb_lvbptr) {</div><div class='del'>-			kmem_cache_free(cachep, gl);</div><div class='add'>+			gfs2_glock_dealloc(&amp;gl-&gt;gl_rcu);</div><div class='ctx'> 			return -ENOMEM;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	atomic_inc(&amp;sdp-&gt;sd_glock_disposal);</div><div class='ctx'> 	gl-&gt;gl_node.next = NULL;</div><div class='del'>-	gl-&gt;gl_flags = glops-&gt;go_instantiate ? BIT(GLF_INSTANTIATE_NEEDED) : 0;</div><div class='add'>+	gl-&gt;gl_flags = BIT(GLF_INITIAL);</div><div class='add'>+	if (glops-&gt;go_instantiate)</div><div class='add'>+		gl-&gt;gl_flags |= BIT(GLF_INSTANTIATE_NEEDED);</div><div class='ctx'> 	gl-&gt;gl_name = name;</div><div class='add'>+	lockref_init(&amp;gl-&gt;gl_lockref);</div><div class='ctx'> 	lockdep_set_subclass(&amp;gl-&gt;gl_lockref.lock, glops-&gt;go_subclass);</div><div class='del'>-	gl-&gt;gl_lockref.count = 1;</div><div class='ctx'> 	gl-&gt;gl_state = LM_ST_UNLOCKED;</div><div class='ctx'> 	gl-&gt;gl_target = LM_ST_UNLOCKED;</div><div class='ctx'> 	gl-&gt;gl_demote_state = LM_ST_EXCLUSIVE;</div><div class='del'>-	gl-&gt;gl_ops = glops;</div><div class='ctx'> 	gl-&gt;gl_dstamp = 0;</div><div class='ctx'> 	preempt_disable();</div><div class='ctx'> 	/* We use the global stats to estimate the initial per-glock stats */</div><div class='hunk'>@@ -1219,56 +1141,52 @@ int gfs2_glock_get(struct gfs2_sbd *sdp, u64 number,</div><div class='ctx'> </div><div class='ctx'> 	mapping = gfs2_glock2aspace(gl);</div><div class='ctx'> 	if (mapping) {</div><div class='add'>+		gfp_t gfp_mask;</div><div class='add'>+</div><div class='ctx'>                 mapping-&gt;a_ops = &amp;gfs2_meta_aops;</div><div class='del'>-		mapping-&gt;host = s-&gt;s_bdev-&gt;bd_inode;</div><div class='add'>+		mapping-&gt;host = sdp-&gt;sd_inode;</div><div class='ctx'> 		mapping-&gt;flags = 0;</div><div class='del'>-		mapping_set_gfp_mask(mapping, GFP_NOFS);</div><div class='del'>-		mapping-&gt;private_data = NULL;</div><div class='add'>+		gfp_mask = mapping_gfp_mask(sdp-&gt;sd_inode-&gt;i_mapping);</div><div class='add'>+		mapping_set_gfp_mask(mapping, gfp_mask);</div><div class='add'>+		mapping-&gt;i_private_data = NULL;</div><div class='ctx'> 		mapping-&gt;writeback_index = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	tmp = find_insert_glock(&amp;name, gl);</div><div class='del'>-	if (!tmp) {</div><div class='del'>-		*glp = gl;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	if (IS_ERR(tmp)) {</div><div class='del'>-		ret = PTR_ERR(tmp);</div><div class='del'>-		goto out_free;</div><div class='del'>-	}</div><div class='del'>-	*glp = tmp;</div><div class='add'>+	if (tmp) {</div><div class='add'>+		gfs2_glock_dealloc(&amp;gl-&gt;gl_rcu);</div><div class='add'>+		if (atomic_dec_and_test(&amp;sdp-&gt;sd_glock_disposal))</div><div class='add'>+			wake_up(&amp;sdp-&gt;sd_kill_wait);</div><div class='ctx'> </div><div class='del'>-out_free:</div><div class='del'>-	kfree(gl-&gt;gl_lksb.sb_lvbptr);</div><div class='del'>-	kmem_cache_free(cachep, gl);</div><div class='del'>-	if (atomic_dec_and_test(&amp;sdp-&gt;sd_glock_disposal))</div><div class='del'>-		wake_up(&amp;sdp-&gt;sd_glock_wait);</div><div class='add'>+		if (IS_ERR(tmp))</div><div class='add'>+			return PTR_ERR(tmp);</div><div class='add'>+		gl = tmp;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	return ret;</div><div class='add'>+found:</div><div class='add'>+	*glp = gl;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * gfs2_holder_init - initialize a struct gfs2_holder in the default way</div><div class='add'>+ * __gfs2_holder_init - initialize a struct gfs2_holder in the default way</div><div class='ctx'>  * @gl: the glock</div><div class='ctx'>  * @state: the state we're requesting</div><div class='ctx'>  * @flags: the modifier flags</div><div class='ctx'>  * @gh: the holder structure</div><div class='del'>- *</div><div class='add'>+ * @ip: caller's return address for debugging</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> void __gfs2_holder_init(struct gfs2_glock *gl, unsigned int state, u16 flags,</div><div class='ctx'> 			struct gfs2_holder *gh, unsigned long ip)</div><div class='ctx'> {</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;gh-&gt;gh_list);</div><div class='del'>-	gh-&gt;gh_gl = gl;</div><div class='add'>+	gh-&gt;gh_gl = gfs2_glock_hold(gl);</div><div class='ctx'> 	gh-&gt;gh_ip = ip;</div><div class='ctx'> 	gh-&gt;gh_owner_pid = get_pid(task_pid(current));</div><div class='ctx'> 	gh-&gt;gh_state = state;</div><div class='ctx'> 	gh-&gt;gh_flags = flags;</div><div class='del'>-	gh-&gt;gh_error = 0;</div><div class='ctx'> 	gh-&gt;gh_iflags = 0;</div><div class='del'>-	gfs2_glock_hold(gl);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -1317,6 +1235,25 @@ static void gfs2_glock_update_hold_time(struct gfs2_glock *gl,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='add'>+ * gfs2_glock_holder_ready - holder is ready and its error code can be collected</div><div class='add'>+ * @gh: the glock holder</div><div class='add'>+ *</div><div class='add'>+ * Called when a glock holder no longer needs to be waited for because it is</div><div class='add'>+ * now either held (HIF_HOLDER set; gh_error == 0), or acquiring the lock has</div><div class='add'>+ * failed (gh_error != 0).</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+int gfs2_glock_holder_ready(struct gfs2_holder *gh)</div><div class='add'>+{</div><div class='add'>+	if (gh-&gt;gh_error || (gh-&gt;gh_flags &amp; GL_SKIP))</div><div class='add'>+		return gh-&gt;gh_error;</div><div class='add'>+	gh-&gt;gh_error = gfs2_instantiate(gh);</div><div class='add'>+	if (gh-&gt;gh_error)</div><div class='add'>+		gfs2_glock_dq(gh);</div><div class='add'>+	return gh-&gt;gh_error;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='ctx'>  * gfs2_glock_wait - wait on a glock acquisition</div><div class='ctx'>  * @gh: the glock holder</div><div class='ctx'>  *</div><div class='hunk'>@@ -1330,7 +1267,7 @@ int gfs2_glock_wait(struct gfs2_holder *gh)</div><div class='ctx'> 	might_sleep();</div><div class='ctx'> 	wait_on_bit(&amp;gh-&gt;gh_iflags, HIF_WAIT, TASK_UNINTERRUPTIBLE);</div><div class='ctx'> 	gfs2_glock_update_hold_time(gh-&gt;gh_gl, start_time);</div><div class='del'>-	return gh-&gt;gh_error;</div><div class='add'>+	return gfs2_glock_holder_ready(gh);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int glocks_pending(unsigned int num_gh, struct gfs2_holder *ghs)</div><div class='hunk'>@@ -1358,7 +1295,6 @@ int gfs2_glock_async_wait(unsigned int num_gh, struct gfs2_holder *ghs)</div><div class='ctx'> 	struct gfs2_sbd *sdp = ghs[0].gh_gl-&gt;gl_name.ln_sbd;</div><div class='ctx'> 	int i, ret = 0, timeout = 0;</div><div class='ctx'> 	unsigned long start_time = jiffies;</div><div class='del'>-	bool keep_waiting;</div><div class='ctx'> </div><div class='ctx'> 	might_sleep();</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1368,58 +1304,38 @@ int gfs2_glock_async_wait(unsigned int num_gh, struct gfs2_holder *ghs)</div><div class='ctx'> 	for (i = 0; i &lt; num_gh; i++)</div><div class='ctx'> 		timeout += ghs[i].gh_gl-&gt;gl_hold_time &lt;&lt; 1;</div><div class='ctx'> </div><div class='del'>-wait_for_dlm:</div><div class='ctx'> 	if (!wait_event_timeout(sdp-&gt;sd_async_glock_wait,</div><div class='del'>-				!glocks_pending(num_gh, ghs), timeout))</div><div class='add'>+				!glocks_pending(num_gh, ghs), timeout)) {</div><div class='ctx'> 		ret = -ESTALE; /* request timed out. */</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * If dlm granted all our requests, we need to adjust the glock</div><div class='del'>-	 * minimum hold time values according to how long we waited.</div><div class='del'>-	 *</div><div class='del'>-	 * If our request timed out, we need to repeatedly release any held</div><div class='del'>-	 * glocks we acquired thus far to allow dlm to acquire the remaining</div><div class='del'>-	 * glocks without deadlocking.  We cannot currently cancel outstanding</div><div class='del'>-	 * glock acquisitions.</div><div class='del'>-	 *</div><div class='del'>-	 * The HIF_WAIT bit tells us which requests still need a response from</div><div class='del'>-	 * dlm.</div><div class='del'>-	 *</div><div class='del'>-	 * If dlm sent us any errors, we return the first error we find.</div><div class='del'>-	 */</div><div class='del'>-	keep_waiting = false;</div><div class='ctx'> 	for (i = 0; i &lt; num_gh; i++) {</div><div class='del'>-		/* Skip holders we have already dequeued below. */</div><div class='del'>-		if (!gfs2_holder_queued(&amp;ghs[i]))</div><div class='del'>-			continue;</div><div class='del'>-		/* Skip holders with a pending DLM response. */</div><div class='del'>-		if (test_bit(HIF_WAIT, &amp;ghs[i].gh_iflags)) {</div><div class='del'>-			keep_waiting = true;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='add'>+		struct gfs2_holder *gh = &amp;ghs[i];</div><div class='add'>+		int ret2;</div><div class='ctx'> </div><div class='del'>-		if (test_bit(HIF_HOLDER, &amp;ghs[i].gh_iflags)) {</div><div class='del'>-			if (ret == -ESTALE)</div><div class='del'>-				gfs2_glock_dq(&amp;ghs[i]);</div><div class='del'>-			else</div><div class='del'>-				gfs2_glock_update_hold_time(ghs[i].gh_gl,</div><div class='del'>-							    start_time);</div><div class='add'>+		if (test_bit(HIF_HOLDER, &amp;gh-&gt;gh_iflags)) {</div><div class='add'>+			gfs2_glock_update_hold_time(gh-&gt;gh_gl,</div><div class='add'>+						    start_time);</div><div class='ctx'> 		}</div><div class='add'>+		ret2 = gfs2_glock_holder_ready(gh);</div><div class='ctx'> 		if (!ret)</div><div class='del'>-			ret = ghs[i].gh_error;</div><div class='add'>+			ret = ret2;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (keep_waiting)</div><div class='del'>-		goto wait_for_dlm;</div><div class='add'>+out:</div><div class='add'>+	if (ret) {</div><div class='add'>+		for (i = 0; i &lt; num_gh; i++) {</div><div class='add'>+			struct gfs2_holder *gh = &amp;ghs[i];</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * At this point, we've either acquired all locks or released them all.</div><div class='del'>-	 */</div><div class='add'>+			gfs2_glock_dq(gh);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * handle_callback - process a demote request</div><div class='add'>+ * request_demote - process a demote request</div><div class='ctx'>  * @gl: the glock</div><div class='ctx'>  * @state: the state the caller wants us to change to</div><div class='ctx'>  * @delay: zero to demote immediately; otherwise pending demote</div><div class='hunk'>@@ -1429,13 +1345,10 @@ wait_for_dlm:</div><div class='ctx'>  * practise: LM_ST_SHARED and LM_ST_UNLOCKED</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static void handle_callback(struct gfs2_glock *gl, unsigned int state,</div><div class='del'>-			    unsigned long delay, bool remote)</div><div class='add'>+static void request_demote(struct gfs2_glock *gl, unsigned int state,</div><div class='add'>+			   unsigned long delay, bool remote)</div><div class='ctx'> {</div><div class='del'>-	if (delay)</div><div class='del'>-		set_bit(GLF_PENDING_DEMOTE, &amp;gl-&gt;gl_flags);</div><div class='del'>-	else</div><div class='del'>-		gfs2_set_demote(gl);</div><div class='add'>+	gfs2_set_demote(delay ? GLF_PENDING_DEMOTE : GLF_DEMOTE, gl);</div><div class='ctx'> 	if (gl-&gt;gl_demote_state == LM_ST_EXCLUSIVE) {</div><div class='ctx'> 		gl-&gt;gl_demote_state = state;</div><div class='ctx'> 		gl-&gt;gl_demote_time = jiffies;</div><div class='hunk'>@@ -1467,6 +1380,31 @@ void gfs2_print_dbg(struct seq_file *seq, const char *fmt, ...)</div><div class='ctx'> 	va_end(args);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool gfs2_should_queue_trylock(struct gfs2_glock *gl,</div><div class='add'>+				      struct gfs2_holder *gh)</div><div class='add'>+{</div><div class='add'>+	struct gfs2_holder *current_gh, *gh2;</div><div class='add'>+</div><div class='add'>+	current_gh = find_first_holder(gl);</div><div class='add'>+	if (current_gh &amp;&amp; !may_grant(gl, current_gh, gh))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	list_for_each_entry(gh2, &amp;gl-&gt;gl_holders, gh_list) {</div><div class='add'>+		if (test_bit(HIF_HOLDER, &amp;gh2-&gt;gh_iflags))</div><div class='add'>+			continue;</div><div class='add'>+		if (!(gh2-&gt;gh_flags &amp; (LM_FLAG_TRY | LM_FLAG_TRY_1CB)))</div><div class='add'>+			return false;</div><div class='add'>+	}</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool pid_is_meaningful(const struct gfs2_holder *gh)</div><div class='add'>+{</div><div class='add'>+        if (!(gh-&gt;gh_flags &amp; GL_NOPID))</div><div class='add'>+                return true;</div><div class='add'>+	return !test_bit(HIF_HOLDER, &amp;gh-&gt;gh_iflags);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /**</div><div class='ctx'>  * add_to_queue - Add a holder to the wait queue (but look for recursion)</div><div class='ctx'>  * @gh: the holder structure to add</div><div class='hunk'>@@ -1478,65 +1416,35 @@ void gfs2_print_dbg(struct seq_file *seq, const char *fmt, ...)</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> static inline void add_to_queue(struct gfs2_holder *gh)</div><div class='del'>-__releases(&amp;gl-&gt;gl_lockref.lock)</div><div class='del'>-__acquires(&amp;gl-&gt;gl_lockref.lock)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_glock *gl = gh-&gt;gh_gl;</div><div class='ctx'> 	struct gfs2_sbd *sdp = gl-&gt;gl_name.ln_sbd;</div><div class='del'>-	struct list_head *insert_pt = NULL;</div><div class='ctx'> 	struct gfs2_holder *gh2;</div><div class='del'>-	int try_futile = 0;</div><div class='ctx'> </div><div class='ctx'> 	GLOCK_BUG_ON(gl, gh-&gt;gh_owner_pid == NULL);</div><div class='ctx'> 	if (test_and_set_bit(HIF_WAIT, &amp;gh-&gt;gh_iflags))</div><div class='ctx'> 		GLOCK_BUG_ON(gl, true);</div><div class='ctx'> </div><div class='del'>-	if (gh-&gt;gh_flags &amp; (LM_FLAG_TRY | LM_FLAG_TRY_1CB)) {</div><div class='del'>-		if (test_bit(GLF_LOCK, &amp;gl-&gt;gl_flags)) {</div><div class='del'>-			struct gfs2_holder *first_gh;</div><div class='del'>-</div><div class='del'>-			first_gh = find_first_strong_holder(gl);</div><div class='del'>-			try_futile = !may_grant(gl, first_gh, gh);</div><div class='del'>-		}</div><div class='del'>-		if (test_bit(GLF_INVALIDATE_IN_PROGRESS, &amp;gl-&gt;gl_flags))</div><div class='del'>-			goto fail;</div><div class='add'>+	if ((gh-&gt;gh_flags &amp; (LM_FLAG_TRY | LM_FLAG_TRY_1CB)) &amp;&amp;</div><div class='add'>+	    !gfs2_should_queue_trylock(gl, gh)) {</div><div class='add'>+		gh-&gt;gh_error = GLR_TRYFAILED;</div><div class='add'>+		gfs2_holder_wake(gh);</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(gh2, &amp;gl-&gt;gl_holders, gh_list) {</div><div class='del'>-		if (unlikely(gh2-&gt;gh_owner_pid == gh-&gt;gh_owner_pid &amp;&amp;</div><div class='del'>-		    (gh-&gt;gh_gl-&gt;gl_ops-&gt;go_type != LM_TYPE_FLOCK) &amp;&amp;</div><div class='del'>-		    !test_bit(HIF_MAY_DEMOTE, &amp;gh2-&gt;gh_iflags)))</div><div class='del'>-			goto trap_recursive;</div><div class='del'>-		if (try_futile &amp;&amp;</div><div class='del'>-		    !(gh2-&gt;gh_flags &amp; (LM_FLAG_TRY | LM_FLAG_TRY_1CB))) {</div><div class='del'>-fail:</div><div class='del'>-			gh-&gt;gh_error = GLR_TRYFAILED;</div><div class='del'>-			gfs2_holder_wake(gh);</div><div class='del'>-			return;</div><div class='del'>-		}</div><div class='del'>-		if (test_bit(HIF_HOLDER, &amp;gh2-&gt;gh_iflags))</div><div class='add'>+		if (likely(gh2-&gt;gh_owner_pid != gh-&gt;gh_owner_pid))</div><div class='add'>+			continue;</div><div class='add'>+		if (gh-&gt;gh_gl-&gt;gl_ops-&gt;go_type == LM_TYPE_FLOCK)</div><div class='add'>+			continue;</div><div class='add'>+		if (!pid_is_meaningful(gh2))</div><div class='ctx'> 			continue;</div><div class='del'>-		if (unlikely((gh-&gt;gh_flags &amp; LM_FLAG_PRIORITY) &amp;&amp; !insert_pt))</div><div class='del'>-			insert_pt = &amp;gh2-&gt;gh_list;</div><div class='add'>+		goto trap_recursive;</div><div class='ctx'> 	}</div><div class='ctx'> 	trace_gfs2_glock_queue(gh, 1);</div><div class='ctx'> 	gfs2_glstats_inc(gl, GFS2_LKS_QCOUNT);</div><div class='ctx'> 	gfs2_sbstats_inc(gl, GFS2_LKS_QCOUNT);</div><div class='del'>-	if (likely(insert_pt == NULL)) {</div><div class='del'>-		list_add_tail(&amp;gh-&gt;gh_list, &amp;gl-&gt;gl_holders);</div><div class='del'>-		if (unlikely(gh-&gt;gh_flags &amp; LM_FLAG_PRIORITY))</div><div class='del'>-			goto do_cancel;</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-	list_add_tail(&amp;gh-&gt;gh_list, insert_pt);</div><div class='del'>-do_cancel:</div><div class='del'>-	gh = list_first_entry(&amp;gl-&gt;gl_holders, struct gfs2_holder, gh_list);</div><div class='del'>-	if (!(gh-&gt;gh_flags &amp; LM_FLAG_PRIORITY)) {</div><div class='del'>-		spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='del'>-		if (sdp-&gt;sd_lockstruct.ls_ops-&gt;lm_cancel)</div><div class='del'>-			sdp-&gt;sd_lockstruct.ls_ops-&gt;lm_cancel(gl);</div><div class='del'>-		spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='del'>-	}</div><div class='add'>+	list_add_tail(&amp;gh-&gt;gh_list, &amp;gl-&gt;gl_holders);</div><div class='ctx'> 	return;</div><div class='ctx'> </div><div class='ctx'> trap_recursive:</div><div class='hunk'>@@ -1564,25 +1472,44 @@ trap_recursive:</div><div class='ctx'> int gfs2_glock_nq(struct gfs2_holder *gh)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_glock *gl = gh-&gt;gh_gl;</div><div class='del'>-	int error = 0;</div><div class='add'>+	struct gfs2_sbd *sdp = gl-&gt;gl_name.ln_sbd;</div><div class='add'>+	int error;</div><div class='ctx'> </div><div class='del'>-	if (glock_blocked_by_withdraw(gl) &amp;&amp; !(gh-&gt;gh_flags &amp; LM_FLAG_NOEXP))</div><div class='add'>+	if (gfs2_withdrawn(sdp))</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> </div><div class='del'>-	if (test_bit(GLF_LRU, &amp;gl-&gt;gl_flags))</div><div class='del'>-		gfs2_glock_remove_from_lru(gl);</div><div class='add'>+	if (gh-&gt;gh_flags &amp; GL_NOBLOCK) {</div><div class='add'>+		struct gfs2_holder *current_gh;</div><div class='ctx'> </div><div class='add'>+		error = -ECHILD;</div><div class='add'>+		spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='add'>+		if (find_last_waiter(gl))</div><div class='add'>+			goto unlock;</div><div class='add'>+		current_gh = find_first_holder(gl);</div><div class='add'>+		if (!may_grant(gl, current_gh, gh))</div><div class='add'>+			goto unlock;</div><div class='add'>+		set_bit(HIF_HOLDER, &amp;gh-&gt;gh_iflags);</div><div class='add'>+		list_add_tail(&amp;gh-&gt;gh_list, &amp;gl-&gt;gl_holders);</div><div class='add'>+		trace_gfs2_promote(gh);</div><div class='add'>+		error = 0;</div><div class='add'>+unlock:</div><div class='add'>+		spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='add'>+		return error;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	gh-&gt;gh_error = 0;</div><div class='ctx'> 	spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='ctx'> 	add_to_queue(gh);</div><div class='del'>-	if (unlikely((LM_FLAG_NOEXP &amp; gh-&gt;gh_flags) &amp;&amp;</div><div class='del'>-		     test_and_clear_bit(GLF_FROZEN, &amp;gl-&gt;gl_flags))) {</div><div class='del'>-		set_bit(GLF_REPLY_PENDING, &amp;gl-&gt;gl_flags);</div><div class='add'>+	if (unlikely((LM_FLAG_RECOVER &amp; gh-&gt;gh_flags) &amp;&amp;</div><div class='add'>+		     test_and_clear_bit(GLF_HAVE_FROZEN_REPLY, &amp;gl-&gt;gl_flags))) {</div><div class='add'>+		set_bit(GLF_HAVE_REPLY, &amp;gl-&gt;gl_flags);</div><div class='ctx'> 		gl-&gt;gl_lockref.count++;</div><div class='del'>-		__gfs2_glock_queue_work(gl, 0);</div><div class='add'>+		gfs2_glock_queue_work(gl, 0);</div><div class='ctx'> 	}</div><div class='ctx'> 	run_queue(gl, 1);</div><div class='ctx'> 	spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='ctx'> </div><div class='add'>+	error = 0;</div><div class='ctx'> 	if (!(gh-&gt;gh_flags &amp; GL_ASYNC))</div><div class='ctx'> 		error = gfs2_glock_wait(gh);</div><div class='ctx'> </div><div class='hunk'>@@ -1601,90 +1528,40 @@ int gfs2_glock_poll(struct gfs2_holder *gh)</div><div class='ctx'> 	return test_bit(HIF_WAIT, &amp;gh-&gt;gh_iflags) ? 0 : 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline bool needs_demote(struct gfs2_glock *gl)</div><div class='del'>-{</div><div class='del'>-	return (test_bit(GLF_DEMOTE, &amp;gl-&gt;gl_flags) ||</div><div class='del'>-		test_bit(GLF_PENDING_DEMOTE, &amp;gl-&gt;gl_flags));</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static void __gfs2_glock_dq(struct gfs2_holder *gh)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_glock *gl = gh-&gt;gh_gl;</div><div class='del'>-	struct gfs2_sbd *sdp = gl-&gt;gl_name.ln_sbd;</div><div class='ctx'> 	unsigned delay = 0;</div><div class='ctx'> 	int fast_path = 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * This while loop is similar to function demote_incompat_holders:</div><div class='del'>-	 * If the glock is due to be demoted (which may be from another node</div><div class='del'>-	 * or even if this holder is GL_NOCACHE), the weak holders are</div><div class='del'>-	 * demoted as well, allowing the glock to be demoted.</div><div class='add'>+	 * This holder should not be cached, so mark it for demote.</div><div class='add'>+	 * Note: this should be done before the glock_needs_demote</div><div class='add'>+	 * check below.</div><div class='ctx'> 	 */</div><div class='del'>-	while (gh) {</div><div class='del'>-		/*</div><div class='del'>-		 * If we're in the process of file system withdraw, we cannot</div><div class='del'>-		 * just dequeue any glocks until our journal is recovered, lest</div><div class='del'>-		 * we introduce file system corruption. We need two exceptions</div><div class='del'>-		 * to this rule: We need to allow unlocking of nondisk glocks</div><div class='del'>-		 * and the glock for our own journal that needs recovery.</div><div class='del'>-		 */</div><div class='del'>-		if (test_bit(SDF_WITHDRAW_RECOVERY, &amp;sdp-&gt;sd_flags) &amp;&amp;</div><div class='del'>-		    glock_blocked_by_withdraw(gl) &amp;&amp;</div><div class='del'>-		    gh-&gt;gh_gl != sdp-&gt;sd_jinode_gl) {</div><div class='del'>-			sdp-&gt;sd_glock_dqs_held++;</div><div class='del'>-			spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='del'>-			might_sleep();</div><div class='del'>-			wait_on_bit(&amp;sdp-&gt;sd_flags, SDF_WITHDRAW_RECOVERY,</div><div class='del'>-				    TASK_UNINTERRUPTIBLE);</div><div class='del'>-			spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * This holder should not be cached, so mark it for demote.</div><div class='del'>-		 * Note: this should be done before the check for needs_demote</div><div class='del'>-		 * below.</div><div class='del'>-		 */</div><div class='del'>-		if (gh-&gt;gh_flags &amp; GL_NOCACHE)</div><div class='del'>-			handle_callback(gl, LM_ST_UNLOCKED, 0, false);</div><div class='add'>+	if (gh-&gt;gh_flags &amp; GL_NOCACHE)</div><div class='add'>+		request_demote(gl, LM_ST_UNLOCKED, 0, false);</div><div class='ctx'> </div><div class='del'>-		list_del_init(&amp;gh-&gt;gh_list);</div><div class='del'>-		clear_bit(HIF_HOLDER, &amp;gh-&gt;gh_iflags);</div><div class='del'>-		trace_gfs2_glock_queue(gh, 0);</div><div class='add'>+	list_del_init(&amp;gh-&gt;gh_list);</div><div class='add'>+	clear_bit(HIF_HOLDER, &amp;gh-&gt;gh_iflags);</div><div class='add'>+	trace_gfs2_glock_queue(gh, 0);</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * If there hasn't been a demote request we are done.</div><div class='del'>-		 * (Let the remaining holders, if any, keep holding it.)</div><div class='del'>-		 */</div><div class='del'>-		if (!needs_demote(gl)) {</div><div class='del'>-			if (list_empty(&amp;gl-&gt;gl_holders))</div><div class='del'>-				fast_path = 1;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		/*</div><div class='del'>-		 * If we have another strong holder (we cannot auto-demote)</div><div class='del'>-		 * we are done. It keeps holding it until it is done.</div><div class='del'>-		 */</div><div class='del'>-		if (find_first_strong_holder(gl))</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * If we have a weak holder at the head of the list, it</div><div class='del'>-		 * (and all others like it) must be auto-demoted. If there</div><div class='del'>-		 * are no more weak holders, we exit the while loop.</div><div class='del'>-		 */</div><div class='del'>-		gh = find_first_holder(gl);</div><div class='add'>+	/*</div><div class='add'>+	 * If there hasn't been a demote request we are done.</div><div class='add'>+	 * (Let the remaining holders, if any, keep holding it.)</div><div class='add'>+	 */</div><div class='add'>+	if (!glock_needs_demote(gl)) {</div><div class='add'>+		if (list_empty(&amp;gl-&gt;gl_holders))</div><div class='add'>+			fast_path = 1;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!test_bit(GLF_LFLUSH, &amp;gl-&gt;gl_flags) &amp;&amp; demote_ok(gl))</div><div class='del'>-		gfs2_glock_add_to_lru(gl);</div><div class='del'>-</div><div class='ctx'> 	if (unlikely(!fast_path)) {</div><div class='ctx'> 		gl-&gt;gl_lockref.count++;</div><div class='ctx'> 		if (test_bit(GLF_PENDING_DEMOTE, &amp;gl-&gt;gl_flags) &amp;&amp;</div><div class='ctx'> 		    !test_bit(GLF_DEMOTE, &amp;gl-&gt;gl_flags) &amp;&amp;</div><div class='ctx'> 		    gl-&gt;gl_name.ln_type == LM_TYPE_INODE)</div><div class='ctx'> 			delay = gl-&gt;gl_hold_time;</div><div class='del'>-		__gfs2_glock_queue_work(gl, delay);</div><div class='add'>+		gfs2_glock_queue_work(gl, delay);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1698,7 +1575,32 @@ void gfs2_glock_dq(struct gfs2_holder *gh)</div><div class='ctx'> 	struct gfs2_glock *gl = gh-&gt;gh_gl;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='add'>+	if (!gfs2_holder_queued(gh)) {</div><div class='add'>+		/*</div><div class='add'>+		 * May have already been dequeued because the locking request</div><div class='add'>+		 * was GL_ASYNC and it has failed in the meantime.</div><div class='add'>+		 */</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (list_is_first(&amp;gh-&gt;gh_list, &amp;gl-&gt;gl_holders) &amp;&amp;</div><div class='add'>+	    !test_bit(HIF_HOLDER, &amp;gh-&gt;gh_iflags) &amp;&amp;</div><div class='add'>+	    test_bit(GLF_LOCK, &amp;gl-&gt;gl_flags) &amp;&amp;</div><div class='add'>+	    !test_bit(GLF_DEMOTE_IN_PROGRESS, &amp;gl-&gt;gl_flags) &amp;&amp;</div><div class='add'>+	    !test_bit(GLF_CANCELING, &amp;gl-&gt;gl_flags)) {</div><div class='add'>+		set_bit(GLF_CANCELING, &amp;gl-&gt;gl_flags);</div><div class='add'>+		spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='add'>+		gl-&gt;gl_name.ln_sbd-&gt;sd_lockstruct.ls_ops-&gt;lm_cancel(gl);</div><div class='add'>+		wait_on_bit(&amp;gh-&gt;gh_iflags, HIF_WAIT, TASK_UNINTERRUPTIBLE);</div><div class='add'>+		spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='add'>+		clear_bit(GLF_CANCELING, &amp;gl-&gt;gl_flags);</div><div class='add'>+		clear_bit(GLF_LOCK, &amp;gl-&gt;gl_flags);</div><div class='add'>+		if (!gfs2_holder_queued(gh))</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	__gfs2_glock_dq(gh);</div><div class='add'>+out:</div><div class='ctx'> 	spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1773,7 +1675,7 @@ static int glock_compare(const void *arg_a, const void *arg_b)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * nq_m_sync - synchonously acquire more than one glock in deadlock free order</div><div class='add'>+ * nq_m_sync - synchronously acquire more than one glock in deadlock free order</div><div class='ctx'>  * @num_gh: the number of structures</div><div class='ctx'>  * @ghs: an array of struct gfs2_holder structures</div><div class='ctx'>  * @p: placeholder for the holder structure to pass back</div><div class='hunk'>@@ -1794,8 +1696,6 @@ static int nq_m_sync(unsigned int num_gh, struct gfs2_holder *ghs,</div><div class='ctx'> 	sort(p, num_gh, sizeof(struct gfs2_holder *), glock_compare, NULL);</div><div class='ctx'> </div><div class='ctx'> 	for (x = 0; x &lt; num_gh; x++) {</div><div class='del'>-		p[x]-&gt;gh_flags &amp;= ~(LM_FLAG_TRY | GL_ASYNC);</div><div class='del'>-</div><div class='ctx'> 		error = gfs2_glock_nq(p[x]);</div><div class='ctx'> 		if (error) {</div><div class='ctx'> 			while (x--)</div><div class='hunk'>@@ -1812,7 +1712,6 @@ static int nq_m_sync(unsigned int num_gh, struct gfs2_holder *ghs,</div><div class='ctx'>  * @num_gh: the number of structures</div><div class='ctx'>  * @ghs: an array of struct gfs2_holder structures</div><div class='ctx'>  *</div><div class='del'>- *</div><div class='ctx'>  * Returns: 0 on success (all glocks acquired),</div><div class='ctx'>  *          errno on failure (no glocks acquired)</div><div class='ctx'>  */</div><div class='hunk'>@@ -1827,7 +1726,6 @@ int gfs2_glock_nq_m(unsigned int num_gh, struct gfs2_holder *ghs)</div><div class='ctx'> 	case 0:</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	case 1:</div><div class='del'>-		ghs-&gt;gh_flags &amp;= ~(LM_FLAG_TRY | GL_ASYNC);</div><div class='ctx'> 		return gfs2_glock_nq(ghs);</div><div class='ctx'> 	default:</div><div class='ctx'> 		if (num_gh &lt;= 4)</div><div class='hunk'>@@ -1861,45 +1759,24 @@ void gfs2_glock_dq_m(unsigned int num_gh, struct gfs2_holder *ghs)</div><div class='ctx'> </div><div class='ctx'> void gfs2_glock_cb(struct gfs2_glock *gl, unsigned int state)</div><div class='ctx'> {</div><div class='del'>-	struct gfs2_holder mock_gh = { .gh_gl = gl, .gh_state = state, };</div><div class='ctx'> 	unsigned long delay = 0;</div><div class='del'>-	unsigned long holdtime;</div><div class='del'>-	unsigned long now = jiffies;</div><div class='ctx'> </div><div class='ctx'> 	gfs2_glock_hold(gl);</div><div class='ctx'> 	spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='del'>-	holdtime = gl-&gt;gl_tchange + gl-&gt;gl_hold_time;</div><div class='ctx'> 	if (!list_empty(&amp;gl-&gt;gl_holders) &amp;&amp;</div><div class='ctx'> 	    gl-&gt;gl_name.ln_type == LM_TYPE_INODE) {</div><div class='add'>+		unsigned long now = jiffies;</div><div class='add'>+		unsigned long holdtime;</div><div class='add'>+</div><div class='add'>+		holdtime = gl-&gt;gl_tchange + gl-&gt;gl_hold_time;</div><div class='add'>+</div><div class='ctx'> 		if (time_before(now, holdtime))</div><div class='ctx'> 			delay = holdtime - now;</div><div class='del'>-		if (test_bit(GLF_REPLY_PENDING, &amp;gl-&gt;gl_flags))</div><div class='add'>+		if (test_bit(GLF_HAVE_REPLY, &amp;gl-&gt;gl_flags))</div><div class='ctx'> 			delay = gl-&gt;gl_hold_time;</div><div class='ctx'> 	}</div><div class='del'>-	/*</div><div class='del'>-	 * Note 1: We cannot call demote_incompat_holders from handle_callback</div><div class='del'>-	 * or gfs2_set_demote due to recursion problems like: gfs2_glock_dq -&gt;</div><div class='del'>-	 * handle_callback -&gt; demote_incompat_holders -&gt; gfs2_glock_dq</div><div class='del'>-	 * Plus, we only want to demote the holders if the request comes from</div><div class='del'>-	 * a remote cluster node because local holder conflicts are resolved</div><div class='del'>-	 * elsewhere.</div><div class='del'>-	 *</div><div class='del'>-	 * Note 2: if a remote node wants this glock in EX mode, lock_dlm will</div><div class='del'>-	 * request that we set our state to UNLOCKED. Here we mock up a holder</div><div class='del'>-	 * to make it look like someone wants the lock EX locally. Any SH</div><div class='del'>-	 * and DF requests should be able to share the lock without demoting.</div><div class='del'>-	 *</div><div class='del'>-	 * Note 3: We only want to demote the demoteable holders when there</div><div class='del'>-	 * are no more strong holders. The demoteable holders might as well</div><div class='del'>-	 * keep the glock until the last strong holder is done with it.</div><div class='del'>-	 */</div><div class='del'>-	if (!find_first_strong_holder(gl)) {</div><div class='del'>-		if (state == LM_ST_UNLOCKED)</div><div class='del'>-			mock_gh.gh_state = LM_ST_EXCLUSIVE;</div><div class='del'>-		demote_incompat_holders(gl, &amp;mock_gh);</div><div class='del'>-	}</div><div class='del'>-	handle_callback(gl, state, delay, true);</div><div class='del'>-	__gfs2_glock_queue_work(gl, delay);</div><div class='add'>+	request_demote(gl, state, delay, true);</div><div class='add'>+	gfs2_glock_queue_work(gl, delay);</div><div class='ctx'> 	spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1909,7 +1786,7 @@ void gfs2_glock_cb(struct gfs2_glock *gl, unsigned int state)</div><div class='ctx'>  *</div><div class='ctx'>  * Glocks are not frozen if (a) the result of the dlm operation is</div><div class='ctx'>  * an error, (b) the locking operation was an unlock operation or</div><div class='del'>- * (c) if there is a "noexp" flagged request anywhere in the queue</div><div class='add'>+ * (c) if there is a "recover" flagged request anywhere in the queue</div><div class='ctx'>  *</div><div class='ctx'>  * Returns: 1 if freezing should occur, 0 otherwise</div><div class='ctx'>  */</div><div class='hunk'>@@ -1926,7 +1803,7 @@ static int gfs2_should_freeze(const struct gfs2_glock *gl)</div><div class='ctx'> 	list_for_each_entry(gh, &amp;gl-&gt;gl_holders, gh_list) {</div><div class='ctx'> 		if (test_bit(HIF_HOLDER, &amp;gh-&gt;gh_iflags))</div><div class='ctx'> 			continue;</div><div class='del'>-		if (LM_FLAG_NOEXP &amp; gh-&gt;gh_flags)</div><div class='add'>+		if (LM_FLAG_RECOVER &amp; gh-&gt;gh_flags)</div><div class='ctx'> 			return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1947,19 +1824,20 @@ void gfs2_glock_complete(struct gfs2_glock *gl, int ret)</div><div class='ctx'> 	struct lm_lockstruct *ls = &amp;gl-&gt;gl_name.ln_sbd-&gt;sd_lockstruct;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='add'>+	clear_bit(GLF_PENDING_REPLY, &amp;gl-&gt;gl_flags);</div><div class='ctx'> 	gl-&gt;gl_reply = ret;</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(test_bit(DFL_BLOCK_LOCKS, &amp;ls-&gt;ls_recover_flags))) {</div><div class='ctx'> 		if (gfs2_should_freeze(gl)) {</div><div class='del'>-			set_bit(GLF_FROZEN, &amp;gl-&gt;gl_flags);</div><div class='add'>+			set_bit(GLF_HAVE_FROZEN_REPLY, &amp;gl-&gt;gl_flags);</div><div class='ctx'> 			spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='ctx'> 			return;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	gl-&gt;gl_lockref.count++;</div><div class='del'>-	set_bit(GLF_REPLY_PENDING, &amp;gl-&gt;gl_flags);</div><div class='del'>-	__gfs2_glock_queue_work(gl, 0);</div><div class='add'>+	set_bit(GLF_HAVE_REPLY, &amp;gl-&gt;gl_flags);</div><div class='add'>+	gfs2_glock_queue_work(gl, 0);</div><div class='ctx'> 	spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1979,6 +1857,16 @@ static int glock_cmp(void *priv, const struct list_head *a,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool can_free_glock(struct gfs2_glock *gl)</div><div class='add'>+{</div><div class='add'>+	struct gfs2_sbd *sdp = gl-&gt;gl_name.ln_sbd;</div><div class='add'>+</div><div class='add'>+	return !test_bit(GLF_LOCK, &amp;gl-&gt;gl_flags) &amp;&amp;</div><div class='add'>+	       !gl-&gt;gl_lockref.count &amp;&amp;</div><div class='add'>+	       (!test_bit(GLF_LFLUSH, &amp;gl-&gt;gl_flags) ||</div><div class='add'>+		test_bit(SDF_KILL, &amp;sdp-&gt;sd_flags));</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /**</div><div class='ctx'>  * gfs2_dispose_glock_lru - Demote a list of glocks</div><div class='ctx'>  * @list: The list to dispose of</div><div class='hunk'>@@ -1993,37 +1881,38 @@ static int glock_cmp(void *priv, const struct list_head *a,</div><div class='ctx'>  * private)</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static void gfs2_dispose_glock_lru(struct list_head *list)</div><div class='add'>+static unsigned long gfs2_dispose_glock_lru(struct list_head *list)</div><div class='ctx'> __releases(&amp;lru_lock)</div><div class='ctx'> __acquires(&amp;lru_lock)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_glock *gl;</div><div class='add'>+	unsigned long freed = 0;</div><div class='ctx'> </div><div class='ctx'> 	list_sort(NULL, list, glock_cmp);</div><div class='ctx'> </div><div class='ctx'> 	while(!list_empty(list)) {</div><div class='ctx'> 		gl = list_first_entry(list, struct gfs2_glock, gl_lru);</div><div class='del'>-		list_del_init(&amp;gl-&gt;gl_lru);</div><div class='del'>-		clear_bit(GLF_LRU, &amp;gl-&gt;gl_flags);</div><div class='ctx'> 		if (!spin_trylock(&amp;gl-&gt;gl_lockref.lock)) {</div><div class='ctx'> add_back_to_lru:</div><div class='del'>-			list_add(&amp;gl-&gt;gl_lru, &amp;lru_list);</div><div class='del'>-			set_bit(GLF_LRU, &amp;gl-&gt;gl_flags);</div><div class='del'>-			atomic_inc(&amp;lru_count);</div><div class='add'>+			list_move(&amp;gl-&gt;gl_lru, &amp;lru_list);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='del'>-		if (test_and_set_bit(GLF_LOCK, &amp;gl-&gt;gl_flags)) {</div><div class='add'>+		if (!can_free_glock(gl)) {</div><div class='ctx'> 			spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='ctx'> 			goto add_back_to_lru;</div><div class='ctx'> 		}</div><div class='add'>+		list_del_init(&amp;gl-&gt;gl_lru);</div><div class='add'>+		atomic_dec(&amp;lru_count);</div><div class='add'>+		clear_bit(GLF_LRU, &amp;gl-&gt;gl_flags);</div><div class='add'>+		freed++;</div><div class='ctx'> 		gl-&gt;gl_lockref.count++;</div><div class='del'>-		if (demote_ok(gl))</div><div class='del'>-			handle_callback(gl, LM_ST_UNLOCKED, 0, false);</div><div class='del'>-		WARN_ON(!test_and_clear_bit(GLF_LOCK, &amp;gl-&gt;gl_flags));</div><div class='del'>-		__gfs2_glock_queue_work(gl, 0);</div><div class='add'>+		if (gl-&gt;gl_state != LM_ST_UNLOCKED)</div><div class='add'>+			request_demote(gl, LM_ST_UNLOCKED, 0, false);</div><div class='add'>+		gfs2_glock_queue_work(gl, 0);</div><div class='ctx'> 		spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='ctx'> 		cond_resched_lock(&amp;lru_lock);</div><div class='ctx'> 	}</div><div class='add'>+	return freed;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -2035,30 +1924,21 @@ add_back_to_lru:</div><div class='ctx'>  * gfs2_dispose_glock_lru() above.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static long gfs2_scan_glock_lru(int nr)</div><div class='add'>+static unsigned long gfs2_scan_glock_lru(unsigned long nr)</div><div class='ctx'> {</div><div class='del'>-	struct gfs2_glock *gl;</div><div class='del'>-	LIST_HEAD(skipped);</div><div class='add'>+	struct gfs2_glock *gl, *next;</div><div class='ctx'> 	LIST_HEAD(dispose);</div><div class='del'>-	long freed = 0;</div><div class='add'>+	unsigned long freed = 0;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;lru_lock);</div><div class='del'>-	while ((nr-- &gt;= 0) &amp;&amp; !list_empty(&amp;lru_list)) {</div><div class='del'>-		gl = list_first_entry(&amp;lru_list, struct gfs2_glock, gl_lru);</div><div class='del'>-</div><div class='del'>-		/* Test for being demotable */</div><div class='del'>-		if (!test_bit(GLF_LOCK, &amp;gl-&gt;gl_flags)) {</div><div class='add'>+	list_for_each_entry_safe(gl, next, &amp;lru_list, gl_lru) {</div><div class='add'>+		if (!nr--)</div><div class='add'>+			break;</div><div class='add'>+		if (can_free_glock(gl))</div><div class='ctx'> 			list_move(&amp;gl-&gt;gl_lru, &amp;dispose);</div><div class='del'>-			atomic_dec(&amp;lru_count);</div><div class='del'>-			freed++;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		list_move(&amp;gl-&gt;gl_lru, &amp;skipped);</div><div class='ctx'> 	}</div><div class='del'>-	list_splice(&amp;skipped, &amp;lru_list);</div><div class='ctx'> 	if (!list_empty(&amp;dispose))</div><div class='del'>-		gfs2_dispose_glock_lru(&amp;dispose);</div><div class='add'>+		freed = gfs2_dispose_glock_lru(&amp;dispose);</div><div class='ctx'> 	spin_unlock(&amp;lru_lock);</div><div class='ctx'> </div><div class='ctx'> 	return freed;</div><div class='hunk'>@@ -2078,11 +1958,7 @@ static unsigned long gfs2_glock_shrink_count(struct shrinker *shrink,</div><div class='ctx'> 	return vfs_pressure_ratio(atomic_read(&amp;lru_count));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct shrinker glock_shrinker = {</div><div class='del'>-	.seeks = DEFAULT_SEEKS,</div><div class='del'>-	.count_objects = gfs2_glock_shrink_count,</div><div class='del'>-	.scan_objects = gfs2_glock_shrink_scan,</div><div class='del'>-};</div><div class='add'>+static struct shrinker *glock_shrinker;</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * glock_hash_walk - Call a function for glock in a hash bucket</div><div class='hunk'>@@ -2115,37 +1991,21 @@ static void glock_hash_walk(glock_examiner examiner, const struct gfs2_sbd *sdp)</div><div class='ctx'> 	rhashtable_walk_exit(&amp;iter);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-bool gfs2_queue_delete_work(struct gfs2_glock *gl, unsigned long delay)</div><div class='del'>-{</div><div class='del'>-	bool queued;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='del'>-	queued = queue_delayed_work(gfs2_delete_workqueue,</div><div class='del'>-				    &amp;gl-&gt;gl_delete, delay);</div><div class='del'>-	if (queued)</div><div class='del'>-		set_bit(GLF_PENDING_DELETE, &amp;gl-&gt;gl_flags);</div><div class='del'>-	spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='del'>-	return queued;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> void gfs2_cancel_delete_work(struct gfs2_glock *gl)</div><div class='ctx'> {</div><div class='del'>-	if (cancel_delayed_work(&amp;gl-&gt;gl_delete)) {</div><div class='del'>-		clear_bit(GLF_PENDING_DELETE, &amp;gl-&gt;gl_flags);</div><div class='add'>+	clear_bit(GLF_TRY_TO_EVICT, &amp;gl-&gt;gl_flags);</div><div class='add'>+	clear_bit(GLF_VERIFY_DELETE, &amp;gl-&gt;gl_flags);</div><div class='add'>+	if (cancel_delayed_work(&amp;gl-&gt;gl_delete))</div><div class='ctx'> 		gfs2_glock_put(gl);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-bool gfs2_delete_work_queued(const struct gfs2_glock *gl)</div><div class='del'>-{</div><div class='del'>-	return test_bit(GLF_PENDING_DELETE, &amp;gl-&gt;gl_flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void flush_delete_work(struct gfs2_glock *gl)</div><div class='ctx'> {</div><div class='ctx'> 	if (gl-&gt;gl_name.ln_type == LM_TYPE_IOPEN) {</div><div class='add'>+		struct gfs2_sbd *sdp = gl-&gt;gl_name.ln_sbd;</div><div class='add'>+</div><div class='ctx'> 		if (cancel_delayed_work(&amp;gl-&gt;gl_delete)) {</div><div class='del'>-			queue_delayed_work(gfs2_delete_workqueue,</div><div class='add'>+			queue_delayed_work(sdp-&gt;sd_delete_wq,</div><div class='ctx'> 					   &amp;gl-&gt;gl_delete, 0);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2154,7 +2014,7 @@ static void flush_delete_work(struct gfs2_glock *gl)</div><div class='ctx'> void gfs2_flush_delete_work(struct gfs2_sbd *sdp)</div><div class='ctx'> {</div><div class='ctx'> 	glock_hash_walk(flush_delete_work, sdp);</div><div class='del'>-	flush_workqueue(gfs2_delete_workqueue);</div><div class='add'>+	flush_workqueue(sdp-&gt;sd_delete_wq);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -2165,12 +2025,16 @@ void gfs2_flush_delete_work(struct gfs2_sbd *sdp)</div><div class='ctx'> </div><div class='ctx'> static void thaw_glock(struct gfs2_glock *gl)</div><div class='ctx'> {</div><div class='del'>-	if (!test_and_clear_bit(GLF_FROZEN, &amp;gl-&gt;gl_flags))</div><div class='add'>+	if (!test_and_clear_bit(GLF_HAVE_FROZEN_REPLY, &amp;gl-&gt;gl_flags))</div><div class='ctx'> 		return;</div><div class='ctx'> 	if (!lockref_get_not_dead(&amp;gl-&gt;gl_lockref))</div><div class='ctx'> 		return;</div><div class='del'>-	set_bit(GLF_REPLY_PENDING, &amp;gl-&gt;gl_flags);</div><div class='add'>+</div><div class='add'>+	gfs2_glock_remove_from_lru(gl);</div><div class='add'>+	spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='add'>+	set_bit(GLF_HAVE_REPLY, &amp;gl-&gt;gl_flags);</div><div class='ctx'> 	gfs2_glock_queue_work(gl, 0);</div><div class='add'>+	spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -2187,8 +2051,8 @@ static void clear_glock(struct gfs2_glock *gl)</div><div class='ctx'> 	if (!__lockref_is_dead(&amp;gl-&gt;gl_lockref)) {</div><div class='ctx'> 		gl-&gt;gl_lockref.count++;</div><div class='ctx'> 		if (gl-&gt;gl_state != LM_ST_UNLOCKED)</div><div class='del'>-			handle_callback(gl, LM_ST_UNLOCKED, 0, false);</div><div class='del'>-		__gfs2_glock_queue_work(gl, 0);</div><div class='add'>+			request_demote(gl, LM_ST_UNLOCKED, 0, false);</div><div class='add'>+		gfs2_glock_queue_work(gl, 0);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='ctx'> }</div><div class='hunk'>@@ -2216,6 +2080,28 @@ static void dump_glock_func(struct gfs2_glock *gl)</div><div class='ctx'> 	dump_glock(NULL, gl, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void withdraw_glock(struct gfs2_glock *gl)</div><div class='add'>+{</div><div class='add'>+	spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='add'>+	if (!__lockref_is_dead(&amp;gl-&gt;gl_lockref)) {</div><div class='add'>+		/*</div><div class='add'>+		 * We don't want to write back any more dirty data.  Unlock the</div><div class='add'>+		 * remaining inode and resource group glocks; this will cause</div><div class='add'>+		 * their -&gt;go_inval() hooks to toss out all the remaining</div><div class='add'>+		 * cached data, dirty or not.</div><div class='add'>+		 */</div><div class='add'>+		if (gl-&gt;gl_ops-&gt;go_inval &amp;&amp; gl-&gt;gl_state != LM_ST_UNLOCKED)</div><div class='add'>+			request_demote(gl, LM_ST_UNLOCKED, 0, false);</div><div class='add'>+		do_error(gl, LM_OUT_ERROR); /* remove pending waiters */</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void gfs2_withdraw_glocks(struct gfs2_sbd *sdp)</div><div class='add'>+{</div><div class='add'>+	glock_hash_walk(withdraw_glock, sdp);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /**</div><div class='ctx'>  * gfs2_gl_hash_clear - Empty out the glock hash table</div><div class='ctx'>  * @sdp: the filesystem</div><div class='hunk'>@@ -2225,28 +2111,31 @@ static void dump_glock_func(struct gfs2_glock *gl)</div><div class='ctx'> </div><div class='ctx'> void gfs2_gl_hash_clear(struct gfs2_sbd *sdp)</div><div class='ctx'> {</div><div class='add'>+	unsigned long start = jiffies;</div><div class='add'>+	bool timed_out = false;</div><div class='add'>+</div><div class='ctx'> 	set_bit(SDF_SKIP_DLM_UNLOCK, &amp;sdp-&gt;sd_flags);</div><div class='del'>-	flush_workqueue(glock_workqueue);</div><div class='add'>+	flush_workqueue(sdp-&gt;sd_glock_wq);</div><div class='ctx'> 	glock_hash_walk(clear_glock, sdp);</div><div class='del'>-	flush_workqueue(glock_workqueue);</div><div class='del'>-	wait_event_timeout(sdp-&gt;sd_glock_wait,</div><div class='del'>-			   atomic_read(&amp;sdp-&gt;sd_glock_disposal) == 0,</div><div class='del'>-			   HZ * 600);</div><div class='del'>-	glock_hash_walk(dump_glock_func, sdp);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void gfs2_glock_finish_truncate(struct gfs2_inode *ip)</div><div class='del'>-{</div><div class='del'>-	struct gfs2_glock *gl = ip-&gt;i_gl;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ret = gfs2_truncatei_resume(ip);</div><div class='del'>-	gfs2_glock_assert_withdraw(gl, ret == 0);</div><div class='add'>+	flush_workqueue(sdp-&gt;sd_glock_wq);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='del'>-	clear_bit(GLF_LOCK, &amp;gl-&gt;gl_flags);</div><div class='del'>-	run_queue(gl, 1);</div><div class='del'>-	spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='add'>+	while (!timed_out) {</div><div class='add'>+		wait_event_timeout(sdp-&gt;sd_kill_wait,</div><div class='add'>+				   !atomic_read(&amp;sdp-&gt;sd_glock_disposal),</div><div class='add'>+				   HZ * 60);</div><div class='add'>+		if (!atomic_read(&amp;sdp-&gt;sd_glock_disposal))</div><div class='add'>+			break;</div><div class='add'>+		timed_out = time_after(jiffies, start + (HZ * 600));</div><div class='add'>+		fs_warn(sdp, "%u glocks left after %u seconds%s\n",</div><div class='add'>+			atomic_read(&amp;sdp-&gt;sd_glock_disposal),</div><div class='add'>+			jiffies_to_msecs(jiffies - start) / 1000,</div><div class='add'>+			timed_out ? ":" : "; still waiting");</div><div class='add'>+	}</div><div class='add'>+	gfs2_lm_unmount(sdp);</div><div class='add'>+	gfs2_free_dead_glocks(sdp);</div><div class='add'>+	glock_hash_walk(dump_glock_func, sdp);</div><div class='add'>+	destroy_workqueue(sdp-&gt;sd_glock_wq);</div><div class='add'>+	sdp-&gt;sd_glock_wq = NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const char *state2str(unsigned state)</div><div class='hunk'>@@ -2271,12 +2160,10 @@ static const char *hflags2str(char *buf, u16 flags, unsigned long iflags)</div><div class='ctx'> 		*p++ = 't';</div><div class='ctx'> 	if (flags &amp; LM_FLAG_TRY_1CB)</div><div class='ctx'> 		*p++ = 'T';</div><div class='del'>-	if (flags &amp; LM_FLAG_NOEXP)</div><div class='add'>+	if (flags &amp; LM_FLAG_RECOVER)</div><div class='ctx'> 		*p++ = 'e';</div><div class='ctx'> 	if (flags &amp; LM_FLAG_ANY)</div><div class='ctx'> 		*p++ = 'A';</div><div class='del'>-	if (flags &amp; LM_FLAG_PRIORITY)</div><div class='del'>-		*p++ = 'p';</div><div class='ctx'> 	if (flags &amp; LM_FLAG_NODE_SCOPE)</div><div class='ctx'> 		*p++ = 'n';</div><div class='ctx'> 	if (flags &amp; GL_ASYNC)</div><div class='hunk'>@@ -2289,8 +2176,6 @@ static const char *hflags2str(char *buf, u16 flags, unsigned long iflags)</div><div class='ctx'> 		*p++ = 'H';</div><div class='ctx'> 	if (test_bit(HIF_WAIT, &amp;iflags))</div><div class='ctx'> 		*p++ = 'W';</div><div class='del'>-	if (test_bit(HIF_MAY_DEMOTE, &amp;iflags))</div><div class='del'>-		*p++ = 'D';</div><div class='ctx'> 	if (flags &amp; GL_SKIP)</div><div class='ctx'> 		*p++ = 's';</div><div class='ctx'> 	*p = 0;</div><div class='hunk'>@@ -2308,19 +2193,24 @@ static const char *hflags2str(char *buf, u16 flags, unsigned long iflags)</div><div class='ctx'> static void dump_holder(struct seq_file *seq, const struct gfs2_holder *gh,</div><div class='ctx'> 			const char *fs_id_buf)</div><div class='ctx'> {</div><div class='del'>-	struct task_struct *gh_owner = NULL;</div><div class='add'>+	const char *comm = "(none)";</div><div class='add'>+	pid_t owner_pid = 0;</div><div class='ctx'> 	char flags_buf[32];</div><div class='ctx'> </div><div class='ctx'> 	rcu_read_lock();</div><div class='del'>-	if (gh-&gt;gh_owner_pid)</div><div class='add'>+	if (pid_is_meaningful(gh)) {</div><div class='add'>+		struct task_struct *gh_owner;</div><div class='add'>+</div><div class='add'>+		comm = "(ended)";</div><div class='add'>+		owner_pid = pid_nr(gh-&gt;gh_owner_pid);</div><div class='ctx'> 		gh_owner = pid_task(gh-&gt;gh_owner_pid, PIDTYPE_PID);</div><div class='add'>+		if (gh_owner)</div><div class='add'>+			comm = gh_owner-&gt;comm;</div><div class='add'>+	}</div><div class='ctx'> 	gfs2_print_dbg(seq, "%s H: s:%s f:%s e:%d p:%ld [%s] %pS\n",</div><div class='ctx'> 		       fs_id_buf, state2str(gh-&gt;gh_state),</div><div class='ctx'> 		       hflags2str(flags_buf, gh-&gt;gh_flags, gh-&gt;gh_iflags),</div><div class='del'>-		       gh-&gt;gh_error,</div><div class='del'>-		       gh-&gt;gh_owner_pid ? (long)pid_nr(gh-&gt;gh_owner_pid) : -1,</div><div class='del'>-		       gh_owner ? gh_owner-&gt;comm : "(ended)",</div><div class='del'>-		       (void *)gh-&gt;gh_ip);</div><div class='add'>+		       gh-&gt;gh_error, (long)owner_pid, comm, (void *)gh-&gt;gh_ip);</div><div class='ctx'> 	rcu_read_unlock();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2341,13 +2231,13 @@ static const char *gflags2str(char *buf, const struct gfs2_glock *gl)</div><div class='ctx'> 		*p++ = 'y';</div><div class='ctx'> 	if (test_bit(GLF_LFLUSH, gflags))</div><div class='ctx'> 		*p++ = 'f';</div><div class='del'>-	if (test_bit(GLF_INVALIDATE_IN_PROGRESS, gflags))</div><div class='del'>-		*p++ = 'i';</div><div class='del'>-	if (test_bit(GLF_REPLY_PENDING, gflags))</div><div class='add'>+	if (test_bit(GLF_PENDING_REPLY, gflags))</div><div class='add'>+		*p++ = 'R';</div><div class='add'>+	if (test_bit(GLF_HAVE_REPLY, gflags))</div><div class='ctx'> 		*p++ = 'r';</div><div class='ctx'> 	if (test_bit(GLF_INITIAL, gflags))</div><div class='del'>-		*p++ = 'I';</div><div class='del'>-	if (test_bit(GLF_FROZEN, gflags))</div><div class='add'>+		*p++ = 'a';</div><div class='add'>+	if (test_bit(GLF_HAVE_FROZEN_REPLY, gflags))</div><div class='ctx'> 		*p++ = 'F';</div><div class='ctx'> 	if (!list_empty(&amp;gl-&gt;gl_holders))</div><div class='ctx'> 		*p++ = 'q';</div><div class='hunk'>@@ -2357,14 +2247,18 @@ static const char *gflags2str(char *buf, const struct gfs2_glock *gl)</div><div class='ctx'> 		*p++ = 'o';</div><div class='ctx'> 	if (test_bit(GLF_BLOCKING, gflags))</div><div class='ctx'> 		*p++ = 'b';</div><div class='del'>-	if (test_bit(GLF_PENDING_DELETE, gflags))</div><div class='del'>-		*p++ = 'P';</div><div class='del'>-	if (test_bit(GLF_FREEING, gflags))</div><div class='del'>-		*p++ = 'x';</div><div class='ctx'> 	if (test_bit(GLF_INSTANTIATE_NEEDED, gflags))</div><div class='ctx'> 		*p++ = 'n';</div><div class='ctx'> 	if (test_bit(GLF_INSTANTIATE_IN_PROG, gflags))</div><div class='ctx'> 		*p++ = 'N';</div><div class='add'>+	if (test_bit(GLF_TRY_TO_EVICT, gflags))</div><div class='add'>+		*p++ = 'e';</div><div class='add'>+	if (test_bit(GLF_VERIFY_DELETE, gflags))</div><div class='add'>+		*p++ = 'E';</div><div class='add'>+	if (test_bit(GLF_DEFER_DELETE, gflags))</div><div class='add'>+		*p++ = 's';</div><div class='add'>+	if (test_bit(GLF_CANCELING, gflags))</div><div class='add'>+		*p++ = 'C';</div><div class='ctx'> 	*p = 0;</div><div class='ctx'> 	return buf;</div><div class='ctx'> }</div><div class='hunk'>@@ -2508,28 +2402,16 @@ int __init gfs2_glock_init(void)</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='del'>-	glock_workqueue = alloc_workqueue("glock_workqueue", WQ_MEM_RECLAIM |</div><div class='del'>-					  WQ_HIGHPRI | WQ_FREEZABLE, 0);</div><div class='del'>-	if (!glock_workqueue) {</div><div class='del'>-		rhashtable_destroy(&amp;gl_hash_table);</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	}</div><div class='del'>-	gfs2_delete_workqueue = alloc_workqueue("delete_workqueue",</div><div class='del'>-						WQ_MEM_RECLAIM | WQ_FREEZABLE,</div><div class='del'>-						0);</div><div class='del'>-	if (!gfs2_delete_workqueue) {</div><div class='del'>-		destroy_workqueue(glock_workqueue);</div><div class='add'>+	glock_shrinker = shrinker_alloc(0, "gfs2-glock");</div><div class='add'>+	if (!glock_shrinker) {</div><div class='ctx'> 		rhashtable_destroy(&amp;gl_hash_table);</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = register_shrinker(&amp;glock_shrinker);</div><div class='del'>-	if (ret) {</div><div class='del'>-		destroy_workqueue(gfs2_delete_workqueue);</div><div class='del'>-		destroy_workqueue(glock_workqueue);</div><div class='del'>-		rhashtable_destroy(&amp;gl_hash_table);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='add'>+	glock_shrinker-&gt;count_objects = gfs2_glock_shrink_count;</div><div class='add'>+	glock_shrinker-&gt;scan_objects = gfs2_glock_shrink_scan;</div><div class='add'>+</div><div class='add'>+	shrinker_register(glock_shrinker);</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; GLOCK_WAIT_TABLE_SIZE; i++)</div><div class='ctx'> 		init_waitqueue_head(glock_wait_table + i);</div><div class='hunk'>@@ -2539,10 +2421,8 @@ int __init gfs2_glock_init(void)</div><div class='ctx'> </div><div class='ctx'> void gfs2_glock_exit(void)</div><div class='ctx'> {</div><div class='del'>-	unregister_shrinker(&amp;glock_shrinker);</div><div class='add'>+	shrinker_free(glock_shrinker);</div><div class='ctx'> 	rhashtable_destroy(&amp;gl_hash_table);</div><div class='del'>-	destroy_workqueue(glock_workqueue);</div><div class='del'>-	destroy_workqueue(gfs2_delete_workqueue);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void gfs2_glock_iter_next(struct gfs2_glock_iter *gi, loff_t n)</div><div class='hunk'>@@ -2552,8 +2432,7 @@ static void gfs2_glock_iter_next(struct gfs2_glock_iter *gi, loff_t n)</div><div class='ctx'> 	if (gl) {</div><div class='ctx'> 		if (n == 0)</div><div class='ctx'> 			return;</div><div class='del'>-		if (!lockref_put_not_zero(&amp;gl-&gt;gl_lockref))</div><div class='del'>-			gfs2_glock_queue_put(gl);</div><div class='add'>+		gfs2_glock_put_async(gl);</div><div class='ctx'> 	}</div><div class='ctx'> 	for (;;) {</div><div class='ctx'> 		gl = rhashtable_walk_next(&amp;gi-&gt;hti);</div><div class='hunk'>@@ -2735,6 +2614,168 @@ static const struct file_operations gfs2_glstats_fops = {</div><div class='ctx'> 	.release = gfs2_glocks_release,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+struct gfs2_glockfd_iter {</div><div class='add'>+	struct super_block *sb;</div><div class='add'>+	unsigned int tgid;</div><div class='add'>+	struct task_struct *task;</div><div class='add'>+	unsigned int fd;</div><div class='add'>+	struct file *file;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static struct task_struct *gfs2_glockfd_next_task(struct gfs2_glockfd_iter *i)</div><div class='add'>+{</div><div class='add'>+	struct pid_namespace *ns = task_active_pid_ns(current);</div><div class='add'>+	struct pid *pid;</div><div class='add'>+</div><div class='add'>+	if (i-&gt;task)</div><div class='add'>+		put_task_struct(i-&gt;task);</div><div class='add'>+</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+retry:</div><div class='add'>+	i-&gt;task = NULL;</div><div class='add'>+	pid = find_ge_pid(i-&gt;tgid, ns);</div><div class='add'>+	if (pid) {</div><div class='add'>+		i-&gt;tgid = pid_nr_ns(pid, ns);</div><div class='add'>+		i-&gt;task = pid_task(pid, PIDTYPE_TGID);</div><div class='add'>+		if (!i-&gt;task) {</div><div class='add'>+			i-&gt;tgid++;</div><div class='add'>+			goto retry;</div><div class='add'>+		}</div><div class='add'>+		get_task_struct(i-&gt;task);</div><div class='add'>+	}</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+	return i-&gt;task;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct file *gfs2_glockfd_next_file(struct gfs2_glockfd_iter *i)</div><div class='add'>+{</div><div class='add'>+	if (i-&gt;file) {</div><div class='add'>+		fput(i-&gt;file);</div><div class='add'>+		i-&gt;file = NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for(;; i-&gt;fd++) {</div><div class='add'>+		i-&gt;file = fget_task_next(i-&gt;task, &amp;i-&gt;fd);</div><div class='add'>+		if (!i-&gt;file) {</div><div class='add'>+			i-&gt;fd = 0;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (file_inode(i-&gt;file)-&gt;i_sb == i-&gt;sb)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		fput(i-&gt;file);</div><div class='add'>+	}</div><div class='add'>+	return i-&gt;file;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void *gfs2_glockfd_seq_start(struct seq_file *seq, loff_t *pos)</div><div class='add'>+{</div><div class='add'>+	struct gfs2_glockfd_iter *i = seq-&gt;private;</div><div class='add'>+</div><div class='add'>+	if (*pos)</div><div class='add'>+		return NULL;</div><div class='add'>+	while (gfs2_glockfd_next_task(i)) {</div><div class='add'>+		if (gfs2_glockfd_next_file(i))</div><div class='add'>+			return i;</div><div class='add'>+		i-&gt;tgid++;</div><div class='add'>+	}</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void *gfs2_glockfd_seq_next(struct seq_file *seq, void *iter_ptr,</div><div class='add'>+				   loff_t *pos)</div><div class='add'>+{</div><div class='add'>+	struct gfs2_glockfd_iter *i = seq-&gt;private;</div><div class='add'>+</div><div class='add'>+	(*pos)++;</div><div class='add'>+	i-&gt;fd++;</div><div class='add'>+	do {</div><div class='add'>+		if (gfs2_glockfd_next_file(i))</div><div class='add'>+			return i;</div><div class='add'>+		i-&gt;tgid++;</div><div class='add'>+	} while (gfs2_glockfd_next_task(i));</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void gfs2_glockfd_seq_stop(struct seq_file *seq, void *iter_ptr)</div><div class='add'>+{</div><div class='add'>+	struct gfs2_glockfd_iter *i = seq-&gt;private;</div><div class='add'>+</div><div class='add'>+	if (i-&gt;file)</div><div class='add'>+		fput(i-&gt;file);</div><div class='add'>+	if (i-&gt;task)</div><div class='add'>+		put_task_struct(i-&gt;task);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void gfs2_glockfd_seq_show_flock(struct seq_file *seq,</div><div class='add'>+					struct gfs2_glockfd_iter *i)</div><div class='add'>+{</div><div class='add'>+	struct gfs2_file *fp = i-&gt;file-&gt;private_data;</div><div class='add'>+	struct gfs2_holder *fl_gh = &amp;fp-&gt;f_fl_gh;</div><div class='add'>+	struct lm_lockname gl_name = { .ln_type = LM_TYPE_RESERVED };</div><div class='add'>+</div><div class='add'>+	if (!READ_ONCE(fl_gh-&gt;gh_gl))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;i-&gt;file-&gt;f_lock);</div><div class='add'>+	if (gfs2_holder_initialized(fl_gh))</div><div class='add'>+		gl_name = fl_gh-&gt;gh_gl-&gt;gl_name;</div><div class='add'>+	spin_unlock(&amp;i-&gt;file-&gt;f_lock);</div><div class='add'>+</div><div class='add'>+	if (gl_name.ln_type != LM_TYPE_RESERVED) {</div><div class='add'>+		seq_printf(seq, "%d %u %u/%llx\n",</div><div class='add'>+			   i-&gt;tgid, i-&gt;fd, gl_name.ln_type,</div><div class='add'>+			   (unsigned long long)gl_name.ln_number);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int gfs2_glockfd_seq_show(struct seq_file *seq, void *iter_ptr)</div><div class='add'>+{</div><div class='add'>+	struct gfs2_glockfd_iter *i = seq-&gt;private;</div><div class='add'>+	struct inode *inode = file_inode(i-&gt;file);</div><div class='add'>+	struct gfs2_glock *gl;</div><div class='add'>+</div><div class='add'>+	inode_lock_shared(inode);</div><div class='add'>+	gl = GFS2_I(inode)-&gt;i_iopen_gh.gh_gl;</div><div class='add'>+	if (gl) {</div><div class='add'>+		seq_printf(seq, "%d %u %u/%llx\n",</div><div class='add'>+			   i-&gt;tgid, i-&gt;fd, gl-&gt;gl_name.ln_type,</div><div class='add'>+			   (unsigned long long)gl-&gt;gl_name.ln_number);</div><div class='add'>+	}</div><div class='add'>+	gfs2_glockfd_seq_show_flock(seq, i);</div><div class='add'>+	inode_unlock_shared(inode);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct seq_operations gfs2_glockfd_seq_ops = {</div><div class='add'>+	.start = gfs2_glockfd_seq_start,</div><div class='add'>+	.next  = gfs2_glockfd_seq_next,</div><div class='add'>+	.stop  = gfs2_glockfd_seq_stop,</div><div class='add'>+	.show  = gfs2_glockfd_seq_show,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int gfs2_glockfd_open(struct inode *inode, struct file *file)</div><div class='add'>+{</div><div class='add'>+	struct gfs2_glockfd_iter *i;</div><div class='add'>+	struct gfs2_sbd *sdp = inode-&gt;i_private;</div><div class='add'>+</div><div class='add'>+	i = __seq_open_private(file, &amp;gfs2_glockfd_seq_ops,</div><div class='add'>+			       sizeof(struct gfs2_glockfd_iter));</div><div class='add'>+	if (!i)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	i-&gt;sb = sdp-&gt;sd_vfs;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct file_operations gfs2_glockfd_fops = {</div><div class='add'>+	.owner   = THIS_MODULE,</div><div class='add'>+	.open    = gfs2_glockfd_open,</div><div class='add'>+	.read    = seq_read,</div><div class='add'>+	.llseek  = seq_lseek,</div><div class='add'>+	.release = seq_release_private,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> DEFINE_SEQ_ATTRIBUTE(gfs2_sbstats);</div><div class='ctx'> </div><div class='ctx'> void gfs2_create_debugfs_file(struct gfs2_sbd *sdp)</div><div class='hunk'>@@ -2744,6 +2785,9 @@ void gfs2_create_debugfs_file(struct gfs2_sbd *sdp)</div><div class='ctx'> 	debugfs_create_file("glocks", S_IFREG | S_IRUGO, sdp-&gt;debugfs_dir, sdp,</div><div class='ctx'> 			    &amp;gfs2_glocks_fops);</div><div class='ctx'> </div><div class='add'>+	debugfs_create_file("glockfd", S_IFREG | S_IRUGO, sdp-&gt;debugfs_dir, sdp,</div><div class='add'>+			    &amp;gfs2_glockfd_fops);</div><div class='add'>+</div><div class='ctx'> 	debugfs_create_file("glstats", S_IFREG | S_IRUGO, sdp-&gt;debugfs_dir, sdp,</div><div class='ctx'> 			    &amp;gfs2_glstats_fops);</div><div class='ctx'> </div><div class='head'>diff --git a/fs/gfs2/glock.h b/fs/gfs2/glock.h<br/>index 4f8642301801..55d5985f32a0 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/glock.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/glock.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/glock.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/glock.h</a></div><div class='hunk'>@@ -58,23 +58,19 @@ enum {</div><div class='ctx'>  * LM_FLAG_TRY_1CB</div><div class='ctx'>  * Send one blocking callback if TRY is set and the lock is not granted.</div><div class='ctx'>  *</div><div class='del'>- * LM_FLAG_NOEXP</div><div class='add'>+ * LM_FLAG_RECOVER</div><div class='ctx'>  * GFS sets this flag on lock requests it makes while doing journal recovery.</div><div class='del'>- * These special requests should not be blocked due to the recovery like</div><div class='del'>- * ordinary locks would be.</div><div class='add'>+ * While ordinary requests are blocked until the end of recovery, requests</div><div class='add'>+ * with this flag set do proceed.</div><div class='ctx'>  *</div><div class='ctx'>  * LM_FLAG_ANY</div><div class='ctx'>  * A SHARED request may also be granted in DEFERRED, or a DEFERRED request may</div><div class='ctx'>  * also be granted in SHARED.  The preferred state is whichever is compatible</div><div class='ctx'>  * with other granted locks, or the specified state if no other locks exist.</div><div class='ctx'>  *</div><div class='del'>- * LM_FLAG_PRIORITY</div><div class='del'>- * Override fairness considerations.  Suppose a lock is held in a shared state</div><div class='del'>- * and there is a pending request for the deferred state.  A shared lock</div><div class='del'>- * request with the priority flag would be allowed to bypass the deferred</div><div class='del'>- * request and directly join the other shared lock.  A shared lock request</div><div class='del'>- * without the priority flag might be forced to wait until the deferred</div><div class='del'>- * requested had acquired and released the lock.</div><div class='add'>+ * In addition, when a lock is already held in EX mode locally, a SHARED or</div><div class='add'>+ * DEFERRED mode request with the LM_FLAG_ANY flag set will be granted.</div><div class='add'>+ * (The LM_FLAG_ANY flag is only use for SHARED mode requests currently.)</div><div class='ctx'>  *</div><div class='ctx'>  * LM_FLAG_NODE_SCOPE</div><div class='ctx'>  * This holder agrees to share the lock within this node. In other words,</div><div class='hunk'>@@ -84,14 +80,15 @@ enum {</div><div class='ctx'> </div><div class='ctx'> #define LM_FLAG_TRY		0x0001</div><div class='ctx'> #define LM_FLAG_TRY_1CB		0x0002</div><div class='del'>-#define LM_FLAG_NOEXP		0x0004</div><div class='add'>+#define LM_FLAG_RECOVER		0x0004</div><div class='ctx'> #define LM_FLAG_ANY		0x0008</div><div class='del'>-#define LM_FLAG_PRIORITY	0x0010</div><div class='ctx'> #define LM_FLAG_NODE_SCOPE	0x0020</div><div class='ctx'> #define GL_ASYNC		0x0040</div><div class='ctx'> #define GL_EXACT		0x0080</div><div class='ctx'> #define GL_SKIP			0x0100</div><div class='add'>+#define GL_NOPID		0x0200</div><div class='ctx'> #define GL_NOCACHE		0x0400</div><div class='add'>+#define GL_NOBLOCK		0x0800</div><div class='ctx'>   </div><div class='ctx'> /*</div><div class='ctx'>  * lm_async_cb return flags</div><div class='hunk'>@@ -99,12 +96,22 @@ enum {</div><div class='ctx'>  * LM_OUT_ST_MASK</div><div class='ctx'>  * Masks the lower two bits of lock state in the returned value.</div><div class='ctx'>  *</div><div class='add'>+ * LM_OUT_TRY_AGAIN</div><div class='add'>+ * The trylock request failed.</div><div class='add'>+ *</div><div class='add'>+ * LM_OUT_DEADLOCK</div><div class='add'>+ * The lock request failed because it would deadlock.</div><div class='add'>+ *</div><div class='ctx'>  * LM_OUT_CANCELED</div><div class='ctx'>  * The lock request was canceled.</div><div class='ctx'>  *</div><div class='add'>+ * LM_OUT_ERROR</div><div class='add'>+ * The lock request timed out or failed.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> #define LM_OUT_ST_MASK		0x00000003</div><div class='add'>+#define LM_OUT_TRY_AGAIN	0x00000020</div><div class='add'>+#define LM_OUT_DEADLOCK		0x00000010</div><div class='ctx'> #define LM_OUT_CANCELED		0x00000008</div><div class='ctx'> #define LM_OUT_ERROR		0x00000004</div><div class='ctx'> </div><div class='hunk'>@@ -129,7 +136,7 @@ struct lm_lockops {</div><div class='ctx'> 	void (*lm_first_done) (struct gfs2_sbd *sdp);</div><div class='ctx'> 	void (*lm_recovery_result) (struct gfs2_sbd *sdp, unsigned int jid,</div><div class='ctx'> 				    unsigned int result);</div><div class='del'>-	void (*lm_unmount) (struct gfs2_sbd *sdp);</div><div class='add'>+	void (*lm_unmount) (struct gfs2_sbd *sdp, bool clean);</div><div class='ctx'> 	void (*lm_withdraw) (struct gfs2_sbd *sdp);</div><div class='ctx'> 	void (*lm_put_lock) (struct gfs2_glock *gl);</div><div class='ctx'> 	int (*lm_lock) (struct gfs2_glock *gl, unsigned int req_state,</div><div class='hunk'>@@ -138,7 +145,11 @@ struct lm_lockops {</div><div class='ctx'> 	const match_table_t *lm_tokens;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-extern struct workqueue_struct *gfs2_delete_workqueue;</div><div class='add'>+struct gfs2_glock_aspace {</div><div class='add'>+	struct gfs2_glock glock;</div><div class='add'>+	struct address_space mapping;</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> static inline struct gfs2_holder *gfs2_glock_is_locked_by_me(struct gfs2_glock *gl)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_holder *gh;</div><div class='hunk'>@@ -150,8 +161,6 @@ static inline struct gfs2_holder *gfs2_glock_is_locked_by_me(struct gfs2_glock *</div><div class='ctx'> 	list_for_each_entry(gh, &amp;gl-&gt;gl_holders, gh_list) {</div><div class='ctx'> 		if (!test_bit(HIF_HOLDER, &amp;gh-&gt;gh_iflags))</div><div class='ctx'> 			break;</div><div class='del'>-		if (test_bit(HIF_MAY_DEMOTE, &amp;gh-&gt;gh_iflags))</div><div class='del'>-			continue;</div><div class='ctx'> 		if (gh-&gt;gh_owner_pid == pid)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -162,61 +171,50 @@ out:</div><div class='ctx'> 	return gh;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int gfs2_glock_is_held_excl(struct gfs2_glock *gl)</div><div class='del'>-{</div><div class='del'>-	return gl-&gt;gl_state == LM_ST_EXCLUSIVE;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline int gfs2_glock_is_held_dfrd(struct gfs2_glock *gl)</div><div class='del'>-{</div><div class='del'>-	return gl-&gt;gl_state == LM_ST_DEFERRED;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline int gfs2_glock_is_held_shrd(struct gfs2_glock *gl)</div><div class='del'>-{</div><div class='del'>-	return gl-&gt;gl_state == LM_ST_SHARED;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static inline struct address_space *gfs2_glock2aspace(struct gfs2_glock *gl)</div><div class='ctx'> {</div><div class='del'>-	if (gl-&gt;gl_ops-&gt;go_flags &amp; GLOF_ASPACE)</div><div class='del'>-		return (struct address_space *)(gl + 1);</div><div class='add'>+	if (gl-&gt;gl_ops-&gt;go_flags &amp; GLOF_ASPACE) {</div><div class='add'>+		struct gfs2_glock_aspace *gla =</div><div class='add'>+			container_of(gl, struct gfs2_glock_aspace, glock);</div><div class='add'>+		return &amp;gla-&gt;mapping;</div><div class='add'>+	}</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-extern int gfs2_glock_get(struct gfs2_sbd *sdp, u64 number,</div><div class='del'>-			  const struct gfs2_glock_operations *glops,</div><div class='del'>-			  int create, struct gfs2_glock **glp);</div><div class='del'>-extern void gfs2_glock_hold(struct gfs2_glock *gl);</div><div class='del'>-extern void gfs2_glock_put(struct gfs2_glock *gl);</div><div class='del'>-extern void gfs2_glock_queue_put(struct gfs2_glock *gl);</div><div class='add'>+int gfs2_glock_get(struct gfs2_sbd *sdp, u64 number,</div><div class='add'>+		   const struct gfs2_glock_operations *glops,</div><div class='add'>+		   int create, struct gfs2_glock **glp);</div><div class='add'>+struct gfs2_glock *gfs2_glock_hold(struct gfs2_glock *gl);</div><div class='add'>+void gfs2_glock_put(struct gfs2_glock *gl);</div><div class='add'>+void gfs2_glock_put_async(struct gfs2_glock *gl);</div><div class='ctx'> </div><div class='del'>-extern void __gfs2_holder_init(struct gfs2_glock *gl, unsigned int state,</div><div class='del'>-			       u16 flags, struct gfs2_holder *gh,</div><div class='del'>-			       unsigned long ip);</div><div class='add'>+void __gfs2_holder_init(struct gfs2_glock *gl, unsigned int state,</div><div class='add'>+		        u16 flags, struct gfs2_holder *gh,</div><div class='add'>+		        unsigned long ip);</div><div class='ctx'> static inline void gfs2_holder_init(struct gfs2_glock *gl, unsigned int state,</div><div class='ctx'> 				    u16 flags, struct gfs2_holder *gh) {</div><div class='ctx'> 	__gfs2_holder_init(gl, state, flags, gh, _RET_IP_);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-extern void gfs2_holder_reinit(unsigned int state, u16 flags,</div><div class='del'>-			       struct gfs2_holder *gh);</div><div class='del'>-extern void gfs2_holder_uninit(struct gfs2_holder *gh);</div><div class='del'>-extern int gfs2_glock_nq(struct gfs2_holder *gh);</div><div class='del'>-extern int gfs2_glock_poll(struct gfs2_holder *gh);</div><div class='del'>-extern int gfs2_instantiate(struct gfs2_holder *gh);</div><div class='del'>-extern int gfs2_glock_wait(struct gfs2_holder *gh);</div><div class='del'>-extern int gfs2_glock_async_wait(unsigned int num_gh, struct gfs2_holder *ghs);</div><div class='del'>-extern void gfs2_glock_dq(struct gfs2_holder *gh);</div><div class='del'>-extern void gfs2_glock_dq_wait(struct gfs2_holder *gh);</div><div class='del'>-extern void gfs2_glock_dq_uninit(struct gfs2_holder *gh);</div><div class='del'>-extern int gfs2_glock_nq_num(struct gfs2_sbd *sdp, u64 number,</div><div class='del'>-			     const struct gfs2_glock_operations *glops,</div><div class='del'>-			     unsigned int state, u16 flags,</div><div class='del'>-			     struct gfs2_holder *gh);</div><div class='del'>-extern int gfs2_glock_nq_m(unsigned int num_gh, struct gfs2_holder *ghs);</div><div class='del'>-extern void gfs2_glock_dq_m(unsigned int num_gh, struct gfs2_holder *ghs);</div><div class='del'>-extern void gfs2_dump_glock(struct seq_file *seq, struct gfs2_glock *gl,</div><div class='add'>+void gfs2_holder_reinit(unsigned int state, u16 flags,</div><div class='add'>+		        struct gfs2_holder *gh);</div><div class='add'>+void gfs2_holder_uninit(struct gfs2_holder *gh);</div><div class='add'>+int gfs2_glock_nq(struct gfs2_holder *gh);</div><div class='add'>+int gfs2_glock_poll(struct gfs2_holder *gh);</div><div class='add'>+int gfs2_instantiate(struct gfs2_holder *gh);</div><div class='add'>+int gfs2_glock_holder_ready(struct gfs2_holder *gh);</div><div class='add'>+int gfs2_glock_wait(struct gfs2_holder *gh);</div><div class='add'>+int gfs2_glock_async_wait(unsigned int num_gh, struct gfs2_holder *ghs);</div><div class='add'>+void gfs2_glock_dq(struct gfs2_holder *gh);</div><div class='add'>+void gfs2_glock_dq_wait(struct gfs2_holder *gh);</div><div class='add'>+void gfs2_glock_dq_uninit(struct gfs2_holder *gh);</div><div class='add'>+int gfs2_glock_nq_num(struct gfs2_sbd *sdp, u64 number,</div><div class='add'>+		      const struct gfs2_glock_operations *glops,</div><div class='add'>+		      unsigned int state, u16 flags,</div><div class='add'>+		      struct gfs2_holder *gh);</div><div class='add'>+int gfs2_glock_nq_m(unsigned int num_gh, struct gfs2_holder *ghs);</div><div class='add'>+void gfs2_glock_dq_m(unsigned int num_gh, struct gfs2_holder *ghs);</div><div class='add'>+void gfs2_dump_glock(struct seq_file *seq, struct gfs2_glock *gl,</div><div class='ctx'> 			    bool fsid);</div><div class='ctx'> #define GLOCK_BUG_ON(gl,x) do { if (unlikely(x)) {		\</div><div class='ctx'> 			gfs2_dump_glock(NULL, gl, true);	\</div><div class='hunk'>@@ -230,7 +228,7 @@ extern void gfs2_dump_glock(struct seq_file *seq, struct gfs2_glock *gl,</div><div class='ctx'> 			gfs2_assert_withdraw((gl)-&gt;gl_name.ln_sbd, (x)); } } \</div><div class='ctx'> 	while (0)</div><div class='ctx'> </div><div class='del'>-extern __printf(2, 3)</div><div class='add'>+__printf(2, 3)</div><div class='ctx'> void gfs2_print_dbg(struct seq_file *seq, const char *fmt, ...);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -258,25 +256,28 @@ static inline int gfs2_glock_nq_init(struct gfs2_glock *gl,</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-extern void gfs2_glock_cb(struct gfs2_glock *gl, unsigned int state);</div><div class='del'>-extern void gfs2_glock_complete(struct gfs2_glock *gl, int ret);</div><div class='del'>-extern bool gfs2_queue_delete_work(struct gfs2_glock *gl, unsigned long delay);</div><div class='del'>-extern void gfs2_cancel_delete_work(struct gfs2_glock *gl);</div><div class='del'>-extern bool gfs2_delete_work_queued(const struct gfs2_glock *gl);</div><div class='del'>-extern void gfs2_flush_delete_work(struct gfs2_sbd *sdp);</div><div class='del'>-extern void gfs2_gl_hash_clear(struct gfs2_sbd *sdp);</div><div class='del'>-extern void gfs2_glock_finish_truncate(struct gfs2_inode *ip);</div><div class='del'>-extern void gfs2_glock_thaw(struct gfs2_sbd *sdp);</div><div class='del'>-extern void gfs2_glock_add_to_lru(struct gfs2_glock *gl);</div><div class='del'>-extern void gfs2_glock_free(struct gfs2_glock *gl);</div><div class='del'>-</div><div class='del'>-extern int __init gfs2_glock_init(void);</div><div class='del'>-extern void gfs2_glock_exit(void);</div><div class='del'>-</div><div class='del'>-extern void gfs2_create_debugfs_file(struct gfs2_sbd *sdp);</div><div class='del'>-extern void gfs2_delete_debugfs_file(struct gfs2_sbd *sdp);</div><div class='del'>-extern void gfs2_register_debugfs(void);</div><div class='del'>-extern void gfs2_unregister_debugfs(void);</div><div class='add'>+void gfs2_glock_cb(struct gfs2_glock *gl, unsigned int state);</div><div class='add'>+void gfs2_glock_complete(struct gfs2_glock *gl, int ret);</div><div class='add'>+bool gfs2_queue_try_to_evict(struct gfs2_glock *gl);</div><div class='add'>+bool gfs2_queue_verify_delete(struct gfs2_glock *gl, bool later);</div><div class='add'>+void gfs2_cancel_delete_work(struct gfs2_glock *gl);</div><div class='add'>+void gfs2_flush_delete_work(struct gfs2_sbd *sdp);</div><div class='add'>+void gfs2_gl_hash_clear(struct gfs2_sbd *sdp);</div><div class='add'>+void gfs2_withdraw_glocks(struct gfs2_sbd *sdp);</div><div class='add'>+void gfs2_glock_thaw(struct gfs2_sbd *sdp);</div><div class='add'>+void gfs2_glock_free(struct gfs2_glock *gl);</div><div class='add'>+void gfs2_glock_free_later(struct gfs2_glock *gl);</div><div class='add'>+</div><div class='add'>+int __init gfs2_glock_init(void);</div><div class='add'>+void gfs2_glock_exit(void);</div><div class='add'>+</div><div class='add'>+void gfs2_create_debugfs_file(struct gfs2_sbd *sdp);</div><div class='add'>+void gfs2_delete_debugfs_file(struct gfs2_sbd *sdp);</div><div class='add'>+void gfs2_register_debugfs(void);</div><div class='add'>+void gfs2_unregister_debugfs(void);</div><div class='add'>+</div><div class='add'>+void glock_set_object(struct gfs2_glock *gl, void *object);</div><div class='add'>+void glock_clear_object(struct gfs2_glock *gl, void *object);</div><div class='ctx'> </div><div class='ctx'> extern const struct lm_lockops gfs2_dlm_ops;</div><div class='ctx'> </div><div class='hunk'>@@ -295,65 +296,13 @@ static inline bool gfs2_holder_queued(struct gfs2_holder *gh)</div><div class='ctx'> 	return !list_empty(&amp;gh-&gt;gh_list);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * glock_set_object - set the gl_object field of a glock</div><div class='del'>- * @gl: the glock</div><div class='del'>- * @object: the object</div><div class='del'>- */</div><div class='del'>-static inline void glock_set_object(struct gfs2_glock *gl, void *object)</div><div class='del'>-{</div><div class='del'>-	spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='del'>-	if (gfs2_assert_warn(gl-&gt;gl_name.ln_sbd, gl-&gt;gl_object == NULL))</div><div class='del'>-		gfs2_dump_glock(NULL, gl, true);</div><div class='del'>-	gl-&gt;gl_object = object;</div><div class='del'>-	spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='del'>-}</div><div class='add'>+void gfs2_inode_remember_delete(struct gfs2_glock *gl, u64 generation);</div><div class='add'>+bool gfs2_inode_already_deleted(struct gfs2_glock *gl, u64 generation);</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * glock_clear_object - clear the gl_object field of a glock</div><div class='del'>- * @gl: the glock</div><div class='del'>- * @object: the object</div><div class='del'>- *</div><div class='del'>- * I'd love to similarly add this:</div><div class='del'>- *	else if (gfs2_assert_warn(gl-&gt;gl_sbd, gl-&gt;gl_object == object))</div><div class='del'>- *		gfs2_dump_glock(NULL, gl, true);</div><div class='del'>- * Unfortunately, that's not possible because as soon as gfs2_delete_inode</div><div class='del'>- * frees the block in the rgrp, another process can reassign it for an I_NEW</div><div class='del'>- * inode in gfs2_create_inode because that calls new_inode, not gfs2_iget.</div><div class='del'>- * That means gfs2_delete_inode may subsequently try to call this function</div><div class='del'>- * for a glock that's already pointing to a brand new inode. If we clear the</div><div class='del'>- * new inode's gl_object, we'll introduce metadata corruption. Function</div><div class='del'>- * gfs2_delete_inode calls clear_inode which calls gfs2_clear_inode which also</div><div class='del'>- * tries to clear gl_object, so it's more than just gfs2_delete_inode.</div><div class='del'>- *</div><div class='del'>- */</div><div class='del'>-static inline void glock_clear_object(struct gfs2_glock *gl, void *object)</div><div class='del'>-{</div><div class='del'>-	spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='del'>-	if (gl-&gt;gl_object == object)</div><div class='del'>-		gl-&gt;gl_object = NULL;</div><div class='del'>-	spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void gfs2_holder_allow_demote(struct gfs2_holder *gh)</div><div class='add'>+static inline bool glock_needs_demote(struct gfs2_glock *gl)</div><div class='ctx'> {</div><div class='del'>-	struct gfs2_glock *gl = gh-&gt;gh_gl;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='del'>-	set_bit(HIF_MAY_DEMOTE, &amp;gh-&gt;gh_iflags);</div><div class='del'>-	spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void gfs2_holder_disallow_demote(struct gfs2_holder *gh)</div><div class='del'>-{</div><div class='del'>-	struct gfs2_glock *gl = gh-&gt;gh_gl;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;gl-&gt;gl_lockref.lock);</div><div class='del'>-	clear_bit(HIF_MAY_DEMOTE, &amp;gh-&gt;gh_iflags);</div><div class='del'>-	spin_unlock(&amp;gl-&gt;gl_lockref.lock);</div><div class='add'>+	return (test_bit(GLF_DEMOTE, &amp;gl-&gt;gl_flags) ||</div><div class='add'>+		test_bit(GLF_PENDING_DEMOTE, &amp;gl-&gt;gl_flags));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-extern void gfs2_inode_remember_delete(struct gfs2_glock *gl, u64 generation);</div><div class='del'>-extern bool gfs2_inode_already_deleted(struct gfs2_glock *gl, u64 generation);</div><div class='del'>-</div><div class='ctx'> #endif /* __GLOCK_DOT_H__ */</div><div class='head'>diff --git a/fs/gfs2/glops.c b/fs/gfs2/glops.c<br/>index 650ad77c4d0b..2173ccf5034b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/glops.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/glops.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/glops.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/glops.c</a></div><div class='hunk'>@@ -11,6 +11,7 @@</div><div class='ctx'> #include &lt;linux/bio.h&gt;</div><div class='ctx'> #include &lt;linux/posix_acl.h&gt;</div><div class='ctx'> #include &lt;linux/security.h&gt;</div><div class='add'>+#include &lt;linux/log2.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "gfs2.h"</div><div class='ctx'> #include "incore.h"</div><div class='hunk'>@@ -29,8 +30,6 @@</div><div class='ctx'> </div><div class='ctx'> struct workqueue_struct *gfs2_freeze_wq;</div><div class='ctx'> </div><div class='del'>-extern struct workqueue_struct *gfs2_control_wq;</div><div class='del'>-</div><div class='ctx'> static void gfs2_ail_error(struct gfs2_glock *gl, const struct buffer_head *bh)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_sbd *sdp = gl-&gt;gl_name.ln_sbd;</div><div class='hunk'>@@ -39,12 +38,12 @@ static void gfs2_ail_error(struct gfs2_glock *gl, const struct buffer_head *bh)</div><div class='ctx'> 	       "AIL buffer %p: blocknr %llu state 0x%08lx mapping %p page "</div><div class='ctx'> 	       "state 0x%lx\n",</div><div class='ctx'> 	       bh, (unsigned long long)bh-&gt;b_blocknr, bh-&gt;b_state,</div><div class='del'>-	       bh-&gt;b_page-&gt;mapping, bh-&gt;b_page-&gt;flags);</div><div class='add'>+	       bh-&gt;b_folio-&gt;mapping, bh-&gt;b_folio-&gt;flags.f);</div><div class='ctx'> 	fs_err(sdp, "AIL glock %u:%llu mapping %p\n",</div><div class='ctx'> 	       gl-&gt;gl_name.ln_type, gl-&gt;gl_name.ln_number,</div><div class='ctx'> 	       gfs2_glock2aspace(gl));</div><div class='ctx'> 	gfs2_lm(sdp, "AIL error\n");</div><div class='del'>-	gfs2_withdraw_delayed(sdp);</div><div class='add'>+	gfs2_withdraw(sdp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -90,7 +89,7 @@ static int gfs2_ail_empty_gl(struct gfs2_glock *gl)</div><div class='ctx'> 	struct gfs2_sbd *sdp = gl-&gt;gl_name.ln_sbd;</div><div class='ctx'> 	struct gfs2_trans tr;</div><div class='ctx'> 	unsigned int revokes;</div><div class='del'>-	int ret;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	revokes = atomic_read(&amp;gl-&gt;gl_ail_count);</div><div class='ctx'> </div><div class='hunk'>@@ -124,15 +123,18 @@ static int gfs2_ail_empty_gl(struct gfs2_glock *gl)</div><div class='ctx'> 	memset(&amp;tr, 0, sizeof(tr));</div><div class='ctx'> 	set_bit(TR_ONSTACK, &amp;tr.tr_flags);</div><div class='ctx'> 	ret = __gfs2_trans_begin(&amp;tr, sdp, 0, revokes, _RET_IP_);</div><div class='del'>-	if (ret)</div><div class='add'>+	if (ret) {</div><div class='add'>+		fs_err(sdp, "Transaction error %d: Unable to write revokes.", ret);</div><div class='ctx'> 		goto flush;</div><div class='add'>+	}</div><div class='ctx'> 	__gfs2_ail_flush(gl, 0, revokes);</div><div class='ctx'> 	gfs2_trans_end(sdp);</div><div class='ctx'> </div><div class='ctx'> flush:</div><div class='del'>-	gfs2_log_flush(sdp, NULL, GFS2_LOG_HEAD_FLUSH_NORMAL |</div><div class='del'>-		       GFS2_LFC_AIL_EMPTY_GL);</div><div class='del'>-	return 0;</div><div class='add'>+	if (!ret)</div><div class='add'>+		gfs2_log_flush(sdp, NULL, GFS2_LOG_HEAD_FLUSH_NORMAL |</div><div class='add'>+				GFS2_LFC_AIL_EMPTY_GL);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void gfs2_ail_flush(struct gfs2_glock *gl, bool fsync)</div><div class='hunk'>@@ -162,7 +164,7 @@ void gfs2_ail_flush(struct gfs2_glock *gl, bool fsync)</div><div class='ctx'> static int gfs2_rgrp_metasync(struct gfs2_glock *gl)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_sbd *sdp = gl-&gt;gl_name.ln_sbd;</div><div class='del'>-	struct address_space *metamapping = &amp;sdp-&gt;sd_aspace;</div><div class='add'>+	struct address_space *metamapping = gfs2_aspace(sdp);</div><div class='ctx'> 	struct gfs2_rgrpd *rgd = gfs2_glock2rgrp(gl);</div><div class='ctx'> 	const unsigned bsize = sdp-&gt;sd_sb.sb_bsize;</div><div class='ctx'> 	loff_t start = (rgd-&gt;rd_addr * bsize) &amp; PAGE_MASK;</div><div class='hunk'>@@ -193,7 +195,7 @@ static int rgrp_go_sync(struct gfs2_glock *gl)</div><div class='ctx'> 	struct gfs2_rgrpd *rgd = gfs2_glock2rgrp(gl);</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	if (!test_and_clear_bit(GLF_DIRTY, &amp;gl-&gt;gl_flags))</div><div class='add'>+	if (!rgd || !test_and_clear_bit(GLF_DIRTY, &amp;gl-&gt;gl_flags))</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	GLOCK_BUG_ON(gl, gl-&gt;gl_state != LM_ST_EXCLUSIVE);</div><div class='ctx'> </div><div class='hunk'>@@ -219,19 +221,22 @@ static int rgrp_go_sync(struct gfs2_glock *gl)</div><div class='ctx'> static void rgrp_go_inval(struct gfs2_glock *gl, int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_sbd *sdp = gl-&gt;gl_name.ln_sbd;</div><div class='del'>-	struct address_space *mapping = &amp;sdp-&gt;sd_aspace;</div><div class='add'>+	struct address_space *mapping = gfs2_aspace(sdp);</div><div class='ctx'> 	struct gfs2_rgrpd *rgd = gfs2_glock2rgrp(gl);</div><div class='ctx'> 	const unsigned bsize = sdp-&gt;sd_sb.sb_bsize;</div><div class='del'>-	loff_t start = (rgd-&gt;rd_addr * bsize) &amp; PAGE_MASK;</div><div class='del'>-	loff_t end = PAGE_ALIGN((rgd-&gt;rd_addr + rgd-&gt;rd_length) * bsize) - 1;</div><div class='add'>+	loff_t start, end;</div><div class='ctx'> </div><div class='add'>+	if (!rgd)</div><div class='add'>+		return;</div><div class='add'>+	start = (rgd-&gt;rd_addr * bsize) &amp; PAGE_MASK;</div><div class='add'>+	end = PAGE_ALIGN((rgd-&gt;rd_addr + rgd-&gt;rd_length) * bsize) - 1;</div><div class='ctx'> 	gfs2_rgrp_brelse(rgd);</div><div class='ctx'> 	WARN_ON_ONCE(!(flags &amp; DIO_METADATA));</div><div class='add'>+	gfs2_assert_withdraw(sdp, !atomic_read(&amp;gl-&gt;gl_ail_count));</div><div class='ctx'> 	truncate_inode_pages_range(mapping, start, end);</div><div class='del'>-	set_bit(GLF_INSTANTIATE_NEEDED, &amp;gl-&gt;gl_flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void gfs2_rgrp_go_dump(struct seq_file *seq, struct gfs2_glock *gl,</div><div class='add'>+static void gfs2_rgrp_go_dump(struct seq_file *seq, const struct gfs2_glock *gl,</div><div class='ctx'> 			      const char *fs_id_buf)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_rgrpd *rgd = gl-&gt;gl_object;</div><div class='hunk'>@@ -324,7 +329,9 @@ static int inode_go_sync(struct gfs2_glock *gl)</div><div class='ctx'> 	ret = gfs2_inode_metasync(gl);</div><div class='ctx'> 	if (!error)</div><div class='ctx'> 		error = ret;</div><div class='del'>-	gfs2_ail_empty_gl(gl);</div><div class='add'>+	ret = gfs2_ail_empty_gl(gl);</div><div class='add'>+	if (!error)</div><div class='add'>+		error = ret;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Writeback of the data mapping may cause the dirty flag to be set</div><div class='ctx'> 	 * so we have to clear it again here.</div><div class='hunk'>@@ -352,6 +359,8 @@ static void inode_go_inval(struct gfs2_glock *gl, int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_inode *ip = gfs2_glock2inode(gl);</div><div class='ctx'> </div><div class='add'>+	gfs2_assert_withdraw(gl-&gt;gl_name.ln_sbd, !atomic_read(&amp;gl-&gt;gl_ail_count));</div><div class='add'>+</div><div class='ctx'> 	if (flags &amp; DIO_METADATA) {</div><div class='ctx'> 		struct address_space *mapping = gfs2_glock2aspace(gl);</div><div class='ctx'> 		truncate_inode_pages(mapping, 0);</div><div class='hunk'>@@ -375,61 +384,51 @@ static void inode_go_inval(struct gfs2_glock *gl, int flags)</div><div class='ctx'> 	gfs2_clear_glop_pending(ip);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * inode_go_demote_ok - Check to see if it's ok to unlock an inode glock</div><div class='del'>- * @gl: the glock</div><div class='del'>- *</div><div class='del'>- * Returns: 1 if it's ok</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-static int inode_go_demote_ok(const struct gfs2_glock *gl)</div><div class='del'>-{</div><div class='del'>-	struct gfs2_sbd *sdp = gl-&gt;gl_name.ln_sbd;</div><div class='del'>-</div><div class='del'>-	if (sdp-&gt;sd_jindex == gl-&gt;gl_object || sdp-&gt;sd_rindex == gl-&gt;gl_object)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	return 1;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int gfs2_dinode_in(struct gfs2_inode *ip, const void *buf)</div><div class='ctx'> {</div><div class='add'>+	struct gfs2_sbd *sdp = GFS2_SB(&amp;ip-&gt;i_inode);</div><div class='ctx'> 	const struct gfs2_dinode *str = buf;</div><div class='del'>-	struct timespec64 atime;</div><div class='add'>+	struct timespec64 atime, iatime;</div><div class='ctx'> 	u16 height, depth;</div><div class='ctx'> 	umode_t mode = be32_to_cpu(str-&gt;di_mode);</div><div class='del'>-	bool is_new = ip-&gt;i_inode.i_state &amp; I_NEW;</div><div class='add'>+	struct inode *inode = &amp;ip-&gt;i_inode;</div><div class='add'>+	bool is_new = inode_state_read_once(inode) &amp; I_NEW;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(ip-&gt;i_no_addr != be64_to_cpu(str-&gt;di_num.no_addr)))</div><div class='del'>-		goto corrupt;</div><div class='del'>-	if (unlikely(!is_new &amp;&amp; inode_wrong_type(&amp;ip-&gt;i_inode, mode)))</div><div class='del'>-		goto corrupt;</div><div class='add'>+	if (unlikely(ip-&gt;i_no_addr != be64_to_cpu(str-&gt;di_num.no_addr))) {</div><div class='add'>+		gfs2_consist_inode(ip);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+	if (unlikely(!is_new &amp;&amp; inode_wrong_type(inode, mode))) {</div><div class='add'>+		gfs2_consist_inode(ip);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='ctx'> 	ip-&gt;i_no_formal_ino = be64_to_cpu(str-&gt;di_num.no_formal_ino);</div><div class='del'>-	ip-&gt;i_inode.i_mode = mode;</div><div class='add'>+	inode-&gt;i_mode = mode;</div><div class='ctx'> 	if (is_new) {</div><div class='del'>-		ip-&gt;i_inode.i_rdev = 0;</div><div class='add'>+		inode-&gt;i_rdev = 0;</div><div class='ctx'> 		switch (mode &amp; S_IFMT) {</div><div class='ctx'> 		case S_IFBLK:</div><div class='ctx'> 		case S_IFCHR:</div><div class='del'>-			ip-&gt;i_inode.i_rdev = MKDEV(be32_to_cpu(str-&gt;di_major),</div><div class='del'>-						   be32_to_cpu(str-&gt;di_minor));</div><div class='add'>+			inode-&gt;i_rdev = MKDEV(be32_to_cpu(str-&gt;di_major),</div><div class='add'>+					      be32_to_cpu(str-&gt;di_minor));</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	i_uid_write(&amp;ip-&gt;i_inode, be32_to_cpu(str-&gt;di_uid));</div><div class='del'>-	i_gid_write(&amp;ip-&gt;i_inode, be32_to_cpu(str-&gt;di_gid));</div><div class='del'>-	set_nlink(&amp;ip-&gt;i_inode, be32_to_cpu(str-&gt;di_nlink));</div><div class='del'>-	i_size_write(&amp;ip-&gt;i_inode, be64_to_cpu(str-&gt;di_size));</div><div class='del'>-	gfs2_set_inode_blocks(&amp;ip-&gt;i_inode, be64_to_cpu(str-&gt;di_blocks));</div><div class='add'>+	i_uid_write(inode, be32_to_cpu(str-&gt;di_uid));</div><div class='add'>+	i_gid_write(inode, be32_to_cpu(str-&gt;di_gid));</div><div class='add'>+	set_nlink(inode, be32_to_cpu(str-&gt;di_nlink));</div><div class='add'>+	i_size_write(inode, be64_to_cpu(str-&gt;di_size));</div><div class='add'>+	gfs2_set_inode_blocks(inode, be64_to_cpu(str-&gt;di_blocks));</div><div class='ctx'> 	atime.tv_sec = be64_to_cpu(str-&gt;di_atime);</div><div class='ctx'> 	atime.tv_nsec = be32_to_cpu(str-&gt;di_atime_nsec);</div><div class='del'>-	if (timespec64_compare(&amp;ip-&gt;i_inode.i_atime, &amp;atime) &lt; 0)</div><div class='del'>-		ip-&gt;i_inode.i_atime = atime;</div><div class='del'>-	ip-&gt;i_inode.i_mtime.tv_sec = be64_to_cpu(str-&gt;di_mtime);</div><div class='del'>-	ip-&gt;i_inode.i_mtime.tv_nsec = be32_to_cpu(str-&gt;di_mtime_nsec);</div><div class='del'>-	ip-&gt;i_inode.i_ctime.tv_sec = be64_to_cpu(str-&gt;di_ctime);</div><div class='del'>-	ip-&gt;i_inode.i_ctime.tv_nsec = be32_to_cpu(str-&gt;di_ctime_nsec);</div><div class='add'>+	iatime = inode_get_atime(inode);</div><div class='add'>+	if (timespec64_compare(&amp;iatime, &amp;atime) &lt; 0)</div><div class='add'>+		inode_set_atime_to_ts(inode, atime);</div><div class='add'>+	inode_set_mtime(inode, be64_to_cpu(str-&gt;di_mtime),</div><div class='add'>+			be32_to_cpu(str-&gt;di_mtime_nsec));</div><div class='add'>+	inode_set_ctime(inode, be64_to_cpu(str-&gt;di_ctime),</div><div class='add'>+			be32_to_cpu(str-&gt;di_ctime_nsec));</div><div class='ctx'> </div><div class='ctx'> 	ip-&gt;i_goal = be64_to_cpu(str-&gt;di_goal_meta);</div><div class='ctx'> 	ip-&gt;i_generation = be64_to_cpu(str-&gt;di_generation);</div><div class='hunk'>@@ -437,25 +436,35 @@ static int gfs2_dinode_in(struct gfs2_inode *ip, const void *buf)</div><div class='ctx'> 	ip-&gt;i_diskflags = be32_to_cpu(str-&gt;di_flags);</div><div class='ctx'> 	ip-&gt;i_eattr = be64_to_cpu(str-&gt;di_eattr);</div><div class='ctx'> 	/* i_diskflags and i_eattr must be set before gfs2_set_inode_flags() */</div><div class='del'>-	gfs2_set_inode_flags(&amp;ip-&gt;i_inode);</div><div class='add'>+	gfs2_set_inode_flags(inode);</div><div class='ctx'> 	height = be16_to_cpu(str-&gt;di_height);</div><div class='del'>-	if (unlikely(height &gt; GFS2_MAX_META_HEIGHT))</div><div class='del'>-		goto corrupt;</div><div class='add'>+	if (unlikely(height &gt; sdp-&gt;sd_max_height)) {</div><div class='add'>+		gfs2_consist_inode(ip);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='ctx'> 	ip-&gt;i_height = (u8)height;</div><div class='ctx'> </div><div class='ctx'> 	depth = be16_to_cpu(str-&gt;di_depth);</div><div class='del'>-	if (unlikely(depth &gt; GFS2_DIR_MAX_DEPTH))</div><div class='del'>-		goto corrupt;</div><div class='add'>+	if (unlikely(depth &gt; GFS2_DIR_MAX_DEPTH)) {</div><div class='add'>+		gfs2_consist_inode(ip);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+	if ((ip-&gt;i_diskflags &amp; GFS2_DIF_EXHASH) &amp;&amp;</div><div class='add'>+	    depth &lt; ilog2(sdp-&gt;sd_hash_ptrs)) {</div><div class='add'>+		gfs2_consist_inode(ip);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='ctx'> 	ip-&gt;i_depth = (u8)depth;</div><div class='ctx'> 	ip-&gt;i_entries = be32_to_cpu(str-&gt;di_entries);</div><div class='ctx'> </div><div class='del'>-	if (S_ISREG(ip-&gt;i_inode.i_mode))</div><div class='del'>-		gfs2_set_aops(&amp;ip-&gt;i_inode);</div><div class='add'>+	if (gfs2_is_stuffed(ip) &amp;&amp; inode-&gt;i_size &gt; gfs2_max_stuffed_size(ip)) {</div><div class='add'>+		gfs2_consist_inode(ip);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+	if (S_ISREG(inode-&gt;i_mode))</div><div class='add'>+		gfs2_set_aops(inode);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='del'>-corrupt:</div><div class='del'>-	gfs2_consist_inode(ip);</div><div class='del'>-	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -465,7 +474,7 @@ corrupt:</div><div class='ctx'>  * Returns: errno</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-int gfs2_inode_refresh(struct gfs2_inode *ip)</div><div class='add'>+static int gfs2_inode_refresh(struct gfs2_inode *ip)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *dibh;</div><div class='ctx'> 	int error;</div><div class='hunk'>@@ -481,40 +490,45 @@ int gfs2_inode_refresh(struct gfs2_inode *ip)</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * inode_go_instantiate - read in an inode if necessary</div><div class='del'>- * @gh: The glock holder</div><div class='add'>+ * @gl: The glock</div><div class='ctx'>  *</div><div class='ctx'>  * Returns: errno</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static int inode_go_instantiate(struct gfs2_holder *gh)</div><div class='add'>+static int inode_go_instantiate(struct gfs2_glock *gl)</div><div class='ctx'> {</div><div class='del'>-	struct gfs2_glock *gl = gh-&gt;gh_gl;</div><div class='del'>-	struct gfs2_sbd *sdp = gl-&gt;gl_name.ln_sbd;</div><div class='ctx'> 	struct gfs2_inode *ip = gl-&gt;gl_object;</div><div class='del'>-	int error = 0;</div><div class='add'>+	struct gfs2_glock *io_gl;</div><div class='add'>+	int error;</div><div class='ctx'> </div><div class='ctx'> 	if (!ip) /* no inode to populate - read it in later */</div><div class='del'>-		goto out;</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> 	error = gfs2_inode_refresh(ip);</div><div class='ctx'> 	if (error)</div><div class='del'>-		goto out;</div><div class='add'>+		return error;</div><div class='add'>+	io_gl = ip-&gt;i_iopen_gh.gh_gl;</div><div class='add'>+	io_gl-&gt;gl_no_formal_ino = ip-&gt;i_no_formal_ino;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int inode_go_held(struct gfs2_holder *gh)</div><div class='add'>+{</div><div class='add'>+	struct gfs2_glock *gl = gh-&gt;gh_gl;</div><div class='add'>+	struct gfs2_inode *ip = gl-&gt;gl_object;</div><div class='add'>+	int error = 0;</div><div class='add'>+</div><div class='add'>+	if (!ip) /* no inode to populate - read it in later */</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> 	if (gh-&gt;gh_state != LM_ST_DEFERRED)</div><div class='ctx'> 		inode_dio_wait(&amp;ip-&gt;i_inode);</div><div class='ctx'> </div><div class='ctx'> 	if ((ip-&gt;i_diskflags &amp; GFS2_DIF_TRUNC_IN_PROG) &amp;&amp;</div><div class='ctx'> 	    (gl-&gt;gl_state == LM_ST_EXCLUSIVE) &amp;&amp;</div><div class='del'>-	    (gh-&gt;gh_state == LM_ST_EXCLUSIVE)) {</div><div class='del'>-		spin_lock(&amp;sdp-&gt;sd_trunc_lock);</div><div class='del'>-		if (list_empty(&amp;ip-&gt;i_trunc_list))</div><div class='del'>-			list_add(&amp;ip-&gt;i_trunc_list, &amp;sdp-&gt;sd_trunc_list);</div><div class='del'>-		spin_unlock(&amp;sdp-&gt;sd_trunc_lock);</div><div class='del'>-		wake_up(&amp;sdp-&gt;sd_quota_wait);</div><div class='del'>-		error = 1;</div><div class='del'>-	}</div><div class='add'>+	    (gh-&gt;gh_state == LM_ST_EXCLUSIVE))</div><div class='add'>+		error = gfs2_truncatei_resume(ip);</div><div class='ctx'> </div><div class='del'>-out:</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -526,71 +540,54 @@ out:</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static void inode_go_dump(struct seq_file *seq, struct gfs2_glock *gl,</div><div class='add'>+static void inode_go_dump(struct seq_file *seq, const struct gfs2_glock *gl,</div><div class='ctx'> 			  const char *fs_id_buf)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_inode *ip = gl-&gt;gl_object;</div><div class='del'>-	struct inode *inode = &amp;ip-&gt;i_inode;</div><div class='del'>-	unsigned long nrpages;</div><div class='add'>+	const struct inode *inode = &amp;ip-&gt;i_inode;</div><div class='ctx'> </div><div class='ctx'> 	if (ip == NULL)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	xa_lock_irq(&amp;inode-&gt;i_data.i_pages);</div><div class='del'>-	nrpages = inode-&gt;i_data.nrpages;</div><div class='del'>-	xa_unlock_irq(&amp;inode-&gt;i_data.i_pages);</div><div class='del'>-</div><div class='ctx'> 	gfs2_print_dbg(seq, "%s I: n:%llu/%llu t:%u f:0x%02lx d:0x%08x s:%llu "</div><div class='ctx'> 		       "p:%lu\n", fs_id_buf,</div><div class='ctx'> 		  (unsigned long long)ip-&gt;i_no_formal_ino,</div><div class='ctx'> 		  (unsigned long long)ip-&gt;i_no_addr,</div><div class='del'>-		  IF2DT(ip-&gt;i_inode.i_mode), ip-&gt;i_flags,</div><div class='add'>+		  IF2DT(inode-&gt;i_mode), ip-&gt;i_flags,</div><div class='ctx'> 		  (unsigned int)ip-&gt;i_diskflags,</div><div class='del'>-		  (unsigned long long)i_size_read(inode), nrpages);</div><div class='add'>+		  (unsigned long long)i_size_read(inode),</div><div class='add'>+		  inode-&gt;i_data.nrpages);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * freeze_go_sync - promote/demote the freeze glock</div><div class='add'>+ * freeze_go_callback - A cluster node is requesting a freeze</div><div class='ctx'>  * @gl: the glock</div><div class='add'>+ * @remote: true if this came from a different cluster node</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static int freeze_go_sync(struct gfs2_glock *gl)</div><div class='add'>+static void freeze_go_callback(struct gfs2_glock *gl, bool remote)</div><div class='ctx'> {</div><div class='del'>-	int error = 0;</div><div class='ctx'> 	struct gfs2_sbd *sdp = gl-&gt;gl_name.ln_sbd;</div><div class='add'>+	struct super_block *sb = sdp-&gt;sd_vfs;</div><div class='add'>+</div><div class='add'>+	if (!remote ||</div><div class='add'>+	    (gl-&gt;gl_state != LM_ST_SHARED &amp;&amp;</div><div class='add'>+	     gl-&gt;gl_state != LM_ST_UNLOCKED) ||</div><div class='add'>+	    gl-&gt;gl_demote_state != LM_ST_UNLOCKED)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * We need to check gl_state == LM_ST_SHARED here and not gl_req ==</div><div class='del'>-	 * LM_ST_EXCLUSIVE. That's because when any node does a freeze,</div><div class='del'>-	 * all the nodes should have the freeze glock in SH mode and they all</div><div class='del'>-	 * call do_xmote: One for EX and the others for UN. They ALL must</div><div class='del'>-	 * freeze locally, and they ALL must queue freeze work. The freeze_work</div><div class='del'>-	 * calls freeze_func, which tries to reacquire the freeze glock in SH,</div><div class='del'>-	 * effectively waiting for the thaw on the node who holds it in EX.</div><div class='del'>-	 * Once thawed, the work func acquires the freeze glock in</div><div class='del'>-	 * SH and everybody goes back to thawed.</div><div class='add'>+	 * Try to get an active super block reference to prevent racing with</div><div class='add'>+	 * unmount (see super_trylock_shared()).  But note that unmount isn't</div><div class='add'>+	 * the only place where a write lock on s_umount is taken, and we can</div><div class='add'>+	 * fail here because of things like remount as well.</div><div class='ctx'> 	 */</div><div class='del'>-	if (gl-&gt;gl_state == LM_ST_SHARED &amp;&amp; !gfs2_withdrawn(sdp) &amp;&amp;</div><div class='del'>-	    !test_bit(SDF_NORECOVERY, &amp;sdp-&gt;sd_flags)) {</div><div class='del'>-		atomic_set(&amp;sdp-&gt;sd_freeze_state, SFS_STARTING_FREEZE);</div><div class='del'>-		error = freeze_super(sdp-&gt;sd_vfs);</div><div class='del'>-		if (error) {</div><div class='del'>-			fs_info(sdp, "GFS2: couldn't freeze filesystem: %d\n",</div><div class='del'>-				error);</div><div class='del'>-			if (gfs2_withdrawn(sdp)) {</div><div class='del'>-				atomic_set(&amp;sdp-&gt;sd_freeze_state, SFS_UNFROZEN);</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			gfs2_assert_withdraw(sdp, 0);</div><div class='del'>-		}</div><div class='del'>-		queue_work(gfs2_freeze_wq, &amp;sdp-&gt;sd_freeze_work);</div><div class='del'>-		if (test_bit(SDF_JOURNAL_LIVE, &amp;sdp-&gt;sd_flags))</div><div class='del'>-			gfs2_log_flush(sdp, NULL, GFS2_LOG_HEAD_FLUSH_FREEZE |</div><div class='del'>-				       GFS2_LFC_FREEZE_GO_SYNC);</div><div class='del'>-		else /* read-only mounts */</div><div class='del'>-			atomic_set(&amp;sdp-&gt;sd_freeze_state, SFS_FROZEN);</div><div class='add'>+	if (down_read_trylock(&amp;sb-&gt;s_umount)) {</div><div class='add'>+		atomic_inc(&amp;sb-&gt;s_active);</div><div class='add'>+		up_read(&amp;sb-&gt;s_umount);</div><div class='add'>+		if (!queue_work(gfs2_freeze_wq, &amp;sdp-&gt;sd_freeze_work))</div><div class='add'>+			deactivate_super(sb);</div><div class='ctx'> 	}</div><div class='del'>-	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -608,31 +605,18 @@ static int freeze_go_xmote_bh(struct gfs2_glock *gl)</div><div class='ctx'> 	if (test_bit(SDF_JOURNAL_LIVE, &amp;sdp-&gt;sd_flags)) {</div><div class='ctx'> 		j_gl-&gt;gl_ops-&gt;go_inval(j_gl, DIO_METADATA);</div><div class='ctx'> </div><div class='del'>-		error = gfs2_find_jhead(sdp-&gt;sd_jdesc, &amp;head, false);</div><div class='del'>-		if (gfs2_assert_withdraw_delayed(sdp, !error))</div><div class='add'>+		error = gfs2_find_jhead(sdp-&gt;sd_jdesc, &amp;head);</div><div class='add'>+		if (gfs2_assert_withdraw(sdp, !error))</div><div class='ctx'> 			return error;</div><div class='del'>-		if (gfs2_assert_withdraw_delayed(sdp, head.lh_flags &amp;</div><div class='del'>-						 GFS2_LOG_HEAD_UNMOUNT))</div><div class='add'>+		if (gfs2_assert_withdraw(sdp, head.lh_flags &amp;</div><div class='add'>+					 GFS2_LOG_HEAD_UNMOUNT))</div><div class='ctx'> 			return -EIO;</div><div class='del'>-		sdp-&gt;sd_log_sequence = head.lh_sequence + 1;</div><div class='del'>-		gfs2_log_pointers_init(sdp, head.lh_blkno);</div><div class='add'>+		gfs2_log_pointers_init(sdp, &amp;head);</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * freeze_go_demote_ok</div><div class='del'>- * @gl: the glock</div><div class='del'>- *</div><div class='del'>- * Always returns 0</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-static int freeze_go_demote_ok(const struct gfs2_glock *gl)</div><div class='del'>-{</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='ctx'>  * iopen_go_callback - schedule the dcache entry for the inode to be deleted</div><div class='ctx'>  * @gl: the glock</div><div class='ctx'>  * @remote: true if this came from a different cluster node</div><div class='hunk'>@@ -644,104 +628,29 @@ static void iopen_go_callback(struct gfs2_glock *gl, bool remote)</div><div class='ctx'> 	struct gfs2_inode *ip = gl-&gt;gl_object;</div><div class='ctx'> 	struct gfs2_sbd *sdp = gl-&gt;gl_name.ln_sbd;</div><div class='ctx'> </div><div class='del'>-	if (!remote || sb_rdonly(sdp-&gt;sd_vfs))</div><div class='add'>+	if (!remote || test_bit(SDF_KILL, &amp;sdp-&gt;sd_flags))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	if (gl-&gt;gl_demote_state == LM_ST_UNLOCKED &amp;&amp;</div><div class='ctx'> 	    gl-&gt;gl_state == LM_ST_SHARED &amp;&amp; ip) {</div><div class='ctx'> 		gl-&gt;gl_lockref.count++;</div><div class='del'>-		if (!queue_delayed_work(gfs2_delete_workqueue,</div><div class='del'>-					&amp;gl-&gt;gl_delete, 0))</div><div class='add'>+		if (!gfs2_queue_try_to_evict(gl))</div><div class='ctx'> 			gl-&gt;gl_lockref.count--;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int iopen_go_demote_ok(const struct gfs2_glock *gl)</div><div class='del'>-{</div><div class='del'>-       return !gfs2_delete_work_queued(gl);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * inode_go_free - wake up anyone waiting for dlm's unlock ast to free it</div><div class='del'>- * @gl: glock being freed</div><div class='del'>- *</div><div class='del'>- * For now, this is only used for the journal inode glock. In withdraw</div><div class='del'>- * situations, we need to wait for the glock to be freed so that we know</div><div class='del'>- * other nodes may proceed with recovery / journal replay.</div><div class='del'>- */</div><div class='del'>-static void inode_go_free(struct gfs2_glock *gl)</div><div class='del'>-{</div><div class='del'>-	/* Note that we cannot reference gl_object because it's already set</div><div class='del'>-	 * to NULL by this point in its lifecycle. */</div><div class='del'>-	if (!test_bit(GLF_FREEING, &amp;gl-&gt;gl_flags))</div><div class='del'>-		return;</div><div class='del'>-	clear_bit_unlock(GLF_FREEING, &amp;gl-&gt;gl_flags);</div><div class='del'>-	wake_up_bit(&amp;gl-&gt;gl_flags, GLF_FREEING);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * nondisk_go_callback - used to signal when a node did a withdraw</div><div class='del'>- * @gl: the nondisk glock</div><div class='del'>- * @remote: true if this came from a different cluster node</div><div class='del'>- *</div><div class='del'>- */</div><div class='del'>-static void nondisk_go_callback(struct gfs2_glock *gl, bool remote)</div><div class='del'>-{</div><div class='del'>-	struct gfs2_sbd *sdp = gl-&gt;gl_name.ln_sbd;</div><div class='del'>-</div><div class='del'>-	/* Ignore the callback unless it's from another node, and it's the</div><div class='del'>-	   live lock. */</div><div class='del'>-	if (!remote || gl-&gt;gl_name.ln_number != GFS2_LIVE_LOCK)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	/* First order of business is to cancel the demote request. We don't</div><div class='del'>-	 * really want to demote a nondisk glock. At best it's just to inform</div><div class='del'>-	 * us of another node's withdraw. We'll keep it in SH mode. */</div><div class='del'>-	clear_bit(GLF_DEMOTE, &amp;gl-&gt;gl_flags);</div><div class='del'>-	clear_bit(GLF_PENDING_DEMOTE, &amp;gl-&gt;gl_flags);</div><div class='del'>-</div><div class='del'>-	/* Ignore the unlock if we're withdrawn, unmounting, or in recovery. */</div><div class='del'>-	if (test_bit(SDF_NORECOVERY, &amp;sdp-&gt;sd_flags) ||</div><div class='del'>-	    test_bit(SDF_WITHDRAWN, &amp;sdp-&gt;sd_flags) ||</div><div class='del'>-	    test_bit(SDF_REMOTE_WITHDRAW, &amp;sdp-&gt;sd_flags))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	/* We only care when a node wants us to unlock, because that means</div><div class='del'>-	 * they want a journal recovered. */</div><div class='del'>-	if (gl-&gt;gl_demote_state != LM_ST_UNLOCKED)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	if (sdp-&gt;sd_args.ar_spectator) {</div><div class='del'>-		fs_warn(sdp, "Spectator node cannot recover journals.\n");</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	fs_warn(sdp, "Some node has withdrawn; checking for recovery.\n");</div><div class='del'>-	set_bit(SDF_REMOTE_WITHDRAW, &amp;sdp-&gt;sd_flags);</div><div class='del'>-	/*</div><div class='del'>-	 * We can't call remote_withdraw directly here or gfs2_recover_journal</div><div class='del'>-	 * because this is called from the glock unlock function and the</div><div class='del'>-	 * remote_withdraw needs to enqueue and dequeue the same "live" glock</div><div class='del'>-	 * we were called from. So we queue it to the control work queue in</div><div class='del'>-	 * lock_dlm.</div><div class='del'>-	 */</div><div class='del'>-	queue_delayed_work(gfs2_control_wq, &amp;sdp-&gt;sd_control_work, 0);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> const struct gfs2_glock_operations gfs2_meta_glops = {</div><div class='ctx'> 	.go_type = LM_TYPE_META,</div><div class='del'>-	.go_flags = GLOF_NONDISK,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct gfs2_glock_operations gfs2_inode_glops = {</div><div class='ctx'> 	.go_sync = inode_go_sync,</div><div class='ctx'> 	.go_inval = inode_go_inval,</div><div class='del'>-	.go_demote_ok = inode_go_demote_ok,</div><div class='ctx'> 	.go_instantiate = inode_go_instantiate,</div><div class='add'>+	.go_held = inode_go_held,</div><div class='ctx'> 	.go_dump = inode_go_dump,</div><div class='ctx'> 	.go_type = LM_TYPE_INODE,</div><div class='del'>-	.go_flags = GLOF_ASPACE | GLOF_LRU | GLOF_LVB,</div><div class='del'>-	.go_free = inode_go_free,</div><div class='add'>+	.go_flags = GLOF_ASPACE | GLOF_LVB,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct gfs2_glock_operations gfs2_rgrp_glops = {</div><div class='hunk'>@@ -754,40 +663,33 @@ const struct gfs2_glock_operations gfs2_rgrp_glops = {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct gfs2_glock_operations gfs2_freeze_glops = {</div><div class='del'>-	.go_sync = freeze_go_sync,</div><div class='ctx'> 	.go_xmote_bh = freeze_go_xmote_bh,</div><div class='del'>-	.go_demote_ok = freeze_go_demote_ok,</div><div class='add'>+	.go_callback = freeze_go_callback,</div><div class='ctx'> 	.go_type = LM_TYPE_NONDISK,</div><div class='del'>-	.go_flags = GLOF_NONDISK,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct gfs2_glock_operations gfs2_iopen_glops = {</div><div class='ctx'> 	.go_type = LM_TYPE_IOPEN,</div><div class='ctx'> 	.go_callback = iopen_go_callback,</div><div class='del'>-	.go_demote_ok = iopen_go_demote_ok,</div><div class='del'>-	.go_flags = GLOF_LRU | GLOF_NONDISK,</div><div class='add'>+	.go_dump = inode_go_dump,</div><div class='ctx'> 	.go_subclass = 1,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct gfs2_glock_operations gfs2_flock_glops = {</div><div class='ctx'> 	.go_type = LM_TYPE_FLOCK,</div><div class='del'>-	.go_flags = GLOF_LRU | GLOF_NONDISK,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct gfs2_glock_operations gfs2_nondisk_glops = {</div><div class='ctx'> 	.go_type = LM_TYPE_NONDISK,</div><div class='del'>-	.go_flags = GLOF_NONDISK,</div><div class='del'>-	.go_callback = nondisk_go_callback,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct gfs2_glock_operations gfs2_quota_glops = {</div><div class='ctx'> 	.go_type = LM_TYPE_QUOTA,</div><div class='del'>-	.go_flags = GLOF_LVB | GLOF_LRU | GLOF_NONDISK,</div><div class='add'>+	.go_flags = GLOF_LVB,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct gfs2_glock_operations gfs2_journal_glops = {</div><div class='ctx'> 	.go_type = LM_TYPE_JOURNAL,</div><div class='del'>-	.go_flags = GLOF_NONDISK,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct gfs2_glock_operations *gfs2_glops_list[] = {</div><div class='head'>diff --git a/fs/gfs2/glops.h b/fs/gfs2/glops.h<br/>index 695898afcaf1..9341423798df 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/glops.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/glops.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/glops.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/glops.h</a></div><div class='hunk'>@@ -22,7 +22,7 @@ extern const struct gfs2_glock_operations gfs2_quota_glops;</div><div class='ctx'> extern const struct gfs2_glock_operations gfs2_journal_glops;</div><div class='ctx'> extern const struct gfs2_glock_operations *gfs2_glops_list[];</div><div class='ctx'> </div><div class='del'>-extern int gfs2_inode_metasync(struct gfs2_glock *gl);</div><div class='del'>-extern void gfs2_ail_flush(struct gfs2_glock *gl, bool fsync);</div><div class='add'>+int gfs2_inode_metasync(struct gfs2_glock *gl);</div><div class='add'>+void gfs2_ail_flush(struct gfs2_glock *gl, bool fsync);</div><div class='ctx'> </div><div class='ctx'> #endif /* __GLOPS_DOT_H__ */</div><div class='head'>diff --git a/fs/gfs2/incore.h b/fs/gfs2/incore.h<br/>index 8c00fb389ae5..d05d8fe4e456 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/incore.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/incore.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/incore.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/incore.h</a></div><div class='hunk'>@@ -218,19 +218,16 @@ struct gfs2_glock_operations {</div><div class='ctx'> 	int (*go_sync) (struct gfs2_glock *gl);</div><div class='ctx'> 	int (*go_xmote_bh)(struct gfs2_glock *gl);</div><div class='ctx'> 	void (*go_inval) (struct gfs2_glock *gl, int flags);</div><div class='del'>-	int (*go_demote_ok) (const struct gfs2_glock *gl);</div><div class='del'>-	int (*go_instantiate) (struct gfs2_holder *gh);</div><div class='del'>-	void (*go_dump)(struct seq_file *seq, struct gfs2_glock *gl,</div><div class='add'>+	int (*go_instantiate) (struct gfs2_glock *gl);</div><div class='add'>+	int (*go_held)(struct gfs2_holder *gh);</div><div class='add'>+	void (*go_dump)(struct seq_file *seq, const struct gfs2_glock *gl,</div><div class='ctx'> 			const char *fs_id_buf);</div><div class='ctx'> 	void (*go_callback)(struct gfs2_glock *gl, bool remote);</div><div class='del'>-	void (*go_free)(struct gfs2_glock *gl);</div><div class='ctx'> 	const int go_subclass;</div><div class='ctx'> 	const int go_type;</div><div class='ctx'> 	const unsigned long go_flags;</div><div class='ctx'> #define GLOF_ASPACE 1 /* address space attached */</div><div class='ctx'> #define GLOF_LVB    2 /* Lock Value Block attached */</div><div class='del'>-#define GLOF_LRU    4 /* LRU managed */</div><div class='del'>-#define GLOF_NONDISK   8 /* not I/O related */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> enum {</div><div class='hunk'>@@ -251,7 +248,6 @@ struct gfs2_lkstats {</div><div class='ctx'> </div><div class='ctx'> enum {</div><div class='ctx'> 	/* States */</div><div class='del'>-	HIF_MAY_DEMOTE		= 1,</div><div class='ctx'> 	HIF_HOLDER		= 6,  /* Set for gh that "holds" the glock */</div><div class='ctx'> 	HIF_WAIT		= 10,</div><div class='ctx'> };</div><div class='hunk'>@@ -321,16 +317,18 @@ enum {</div><div class='ctx'> 	GLF_DEMOTE_IN_PROGRESS		= 5,</div><div class='ctx'> 	GLF_DIRTY			= 6,</div><div class='ctx'> 	GLF_LFLUSH			= 7,</div><div class='del'>-	GLF_INVALIDATE_IN_PROGRESS	= 8,</div><div class='del'>-	GLF_REPLY_PENDING		= 9,</div><div class='add'>+	GLF_HAVE_REPLY			= 9,</div><div class='ctx'> 	GLF_INITIAL			= 10,</div><div class='del'>-	GLF_FROZEN			= 11,</div><div class='add'>+	GLF_HAVE_FROZEN_REPLY		= 11,</div><div class='ctx'> 	GLF_INSTANTIATE_IN_PROG		= 12, /* instantiate happening now */</div><div class='ctx'> 	GLF_LRU				= 13,</div><div class='ctx'> 	GLF_OBJECT			= 14, /* Used only for tracing */</div><div class='ctx'> 	GLF_BLOCKING			= 15,</div><div class='del'>-	GLF_PENDING_DELETE		= 17,</div><div class='del'>-	GLF_FREEING			= 18, /* Wait for glock to be freed */</div><div class='add'>+	GLF_TRY_TO_EVICT		= 17, /* iopen glocks only */</div><div class='add'>+	GLF_VERIFY_DELETE		= 18, /* iopen glocks only */</div><div class='add'>+	GLF_PENDING_REPLY		= 19,</div><div class='add'>+	GLF_DEFER_DELETE		= 20, /* iopen glocks only */</div><div class='add'>+	GLF_CANCELING			= 21,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct gfs2_glock {</div><div class='hunk'>@@ -373,11 +371,8 @@ struct gfs2_glock {</div><div class='ctx'> </div><div class='ctx'> enum {</div><div class='ctx'> 	GIF_QD_LOCKED		= 1,</div><div class='del'>-	GIF_ALLOC_FAILED	= 2,</div><div class='ctx'> 	GIF_SW_PAGED		= 3,</div><div class='del'>-	GIF_FREE_VFS_INODE      = 5,</div><div class='ctx'> 	GIF_GLOP_PENDING	= 6,</div><div class='del'>-	GIF_DEFERRED_DELETE	= 7,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct gfs2_inode {</div><div class='hunk'>@@ -396,7 +391,6 @@ struct gfs2_inode {</div><div class='ctx'> 	atomic_t i_sizehint;  /* hint of the write size */</div><div class='ctx'> 	struct rw_semaphore i_rw_mutex;</div><div class='ctx'> 	struct list_head i_ordered;</div><div class='del'>-	struct list_head i_trunc_list;</div><div class='ctx'> 	__be64 *i_hash_cache;</div><div class='ctx'> 	u32 i_entries;</div><div class='ctx'> 	u32 i_diskflags;</div><div class='hunk'>@@ -452,7 +446,7 @@ struct gfs2_quota_data {</div><div class='ctx'> 	s64 qd_change_sync;</div><div class='ctx'> </div><div class='ctx'> 	unsigned int qd_slot;</div><div class='del'>-	unsigned int qd_slot_count;</div><div class='add'>+	unsigned int qd_slot_ref;</div><div class='ctx'> </div><div class='ctx'> 	struct buffer_head *qd_bh;</div><div class='ctx'> 	struct gfs2_quota_change *qd_bh_qc;</div><div class='hunk'>@@ -523,8 +517,6 @@ struct gfs2_jdesc {</div><div class='ctx'> </div><div class='ctx'> 	struct list_head jd_revoke_list;</div><div class='ctx'> 	unsigned int jd_replay_tail;</div><div class='del'>-</div><div class='del'>-	u64 jd_no_addr;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct gfs2_statfs_change_host {</div><div class='hunk'>@@ -537,6 +529,7 @@ struct gfs2_statfs_change_host {</div><div class='ctx'> #define GFS2_QUOTA_OFF		0</div><div class='ctx'> #define GFS2_QUOTA_ACCOUNT	1</div><div class='ctx'> #define GFS2_QUOTA_ON		2</div><div class='add'>+#define GFS2_QUOTA_QUIET	3 /* on but not complaining */</div><div class='ctx'> </div><div class='ctx'> #define GFS2_DATA_DEFAULT	GFS2_DATA_ORDERED</div><div class='ctx'> #define GFS2_DATA_WRITEBACK	1</div><div class='hunk'>@@ -544,8 +537,7 @@ struct gfs2_statfs_change_host {</div><div class='ctx'> </div><div class='ctx'> #define GFS2_ERRORS_DEFAULT     GFS2_ERRORS_WITHDRAW</div><div class='ctx'> #define GFS2_ERRORS_WITHDRAW    0</div><div class='del'>-#define GFS2_ERRORS_CONTINUE    1 /* place holder for future feature */</div><div class='del'>-#define GFS2_ERRORS_RO          2 /* place holder for future feature */</div><div class='add'>+#define GFS2_ERRORS_DEACTIVATE  1</div><div class='ctx'> #define GFS2_ERRORS_PANIC       3</div><div class='ctx'> </div><div class='ctx'> struct gfs2_args {</div><div class='hunk'>@@ -561,7 +553,7 @@ struct gfs2_args {</div><div class='ctx'> 	unsigned int ar_data:2;			/* ordered/writeback */</div><div class='ctx'> 	unsigned int ar_meta:1;			/* mount metafs */</div><div class='ctx'> 	unsigned int ar_discard:1;		/* discard requests */</div><div class='del'>-	unsigned int ar_errors:2;               /* errors=withdraw | panic */</div><div class='add'>+	unsigned int ar_errors:2;               /* errors=withdraw | deactivate | panic */</div><div class='ctx'> 	unsigned int ar_nobarrier:1;            /* do not send barriers */</div><div class='ctx'> 	unsigned int ar_rgrplvb:1;		/* use lvbs for rgrp info */</div><div class='ctx'> 	unsigned int ar_got_rgrplvb:1;		/* Was the rgrplvb opt given? */</div><div class='hunk'>@@ -587,6 +579,7 @@ struct gfs2_tune {</div><div class='ctx'> 	unsigned int gt_complain_secs;</div><div class='ctx'> 	unsigned int gt_statfs_quantum;</div><div class='ctx'> 	unsigned int gt_statfs_slow;</div><div class='add'>+	unsigned int gt_withdraw_helper_timeout;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> enum {</div><div class='hunk'>@@ -600,18 +593,10 @@ enum {</div><div class='ctx'> 	SDF_RORECOVERY		= 7, /* read only recovery */</div><div class='ctx'> 	SDF_SKIP_DLM_UNLOCK	= 8,</div><div class='ctx'> 	SDF_FORCE_AIL_FLUSH     = 9,</div><div class='del'>-	SDF_FS_FROZEN           = 10,</div><div class='del'>-	SDF_WITHDRAWING		= 11, /* Will withdraw eventually */</div><div class='del'>-	SDF_WITHDRAW_IN_PROG	= 12, /* Withdraw is in progress */</div><div class='del'>-	SDF_REMOTE_WITHDRAW	= 13, /* Performing remote recovery */</div><div class='del'>-	SDF_WITHDRAW_RECOVERY	= 14, /* Wait for journal recovery when we are</div><div class='del'>-					 withdrawing */</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-enum gfs2_freeze_state {</div><div class='del'>-	SFS_UNFROZEN		= 0,</div><div class='del'>-	SFS_STARTING_FREEZE	= 1,</div><div class='del'>-	SFS_FROZEN		= 2,</div><div class='add'>+	SDF_FREEZE_INITIATOR	= 10,</div><div class='add'>+	SDF_KILL		= 15,</div><div class='add'>+	SDF_EVICTING		= 16,</div><div class='add'>+	SDF_FROZEN		= 17,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> #define GFS2_FSNAME_LEN		256</div><div class='hunk'>@@ -661,6 +646,8 @@ struct lm_lockstruct {</div><div class='ctx'> 	struct completion ls_sync_wait; /* {control,mounted}_{lock,unlock} */</div><div class='ctx'> 	char *ls_lvb_bits;</div><div class='ctx'> </div><div class='add'>+	struct rw_semaphore ls_sem;</div><div class='add'>+</div><div class='ctx'> 	spinlock_t ls_recover_spin; /* protects following fields */</div><div class='ctx'> 	unsigned long ls_recover_flags; /* DFL_ */</div><div class='ctx'> 	uint32_t ls_recover_mount; /* gen in first recover_done cb */</div><div class='hunk'>@@ -719,11 +706,13 @@ struct gfs2_sbd {</div><div class='ctx'> 	struct gfs2_glock *sd_rename_gl;</div><div class='ctx'> 	struct gfs2_glock *sd_freeze_gl;</div><div class='ctx'> 	struct work_struct sd_freeze_work;</div><div class='del'>-	wait_queue_head_t sd_glock_wait;</div><div class='add'>+	struct work_struct sd_withdraw_work;</div><div class='add'>+	wait_queue_head_t sd_kill_wait;</div><div class='ctx'> 	wait_queue_head_t sd_async_glock_wait;</div><div class='ctx'> 	atomic_t sd_glock_disposal;</div><div class='ctx'> 	struct completion sd_locking_init;</div><div class='del'>-	struct completion sd_wdack;</div><div class='add'>+	struct completion sd_withdraw_helper;</div><div class='add'>+	int sd_withdraw_helper_status;</div><div class='ctx'> 	struct delayed_work sd_control_work;</div><div class='ctx'> </div><div class='ctx'> 	/* Inode Stuff */</div><div class='hunk'>@@ -764,7 +753,6 @@ struct gfs2_sbd {</div><div class='ctx'> 	struct gfs2_jdesc *sd_jdesc;</div><div class='ctx'> 	struct gfs2_holder sd_journal_gh;</div><div class='ctx'> 	struct gfs2_holder sd_jinode_gh;</div><div class='del'>-	struct gfs2_glock *sd_jinode_gl;</div><div class='ctx'> </div><div class='ctx'> 	struct gfs2_holder sd_sc_gh;</div><div class='ctx'> 	struct buffer_head *sd_sc_bh;</div><div class='hunk'>@@ -772,6 +760,11 @@ struct gfs2_sbd {</div><div class='ctx'> </div><div class='ctx'> 	struct completion sd_journal_ready;</div><div class='ctx'> </div><div class='add'>+	/* Workqueue stuff */</div><div class='add'>+</div><div class='add'>+	struct workqueue_struct *sd_glock_wq;</div><div class='add'>+	struct workqueue_struct *sd_delete_wq;</div><div class='add'>+</div><div class='ctx'> 	/* Daemon stuff */</div><div class='ctx'> </div><div class='ctx'> 	struct task_struct *sd_logd_process;</div><div class='hunk'>@@ -781,11 +774,8 @@ struct gfs2_sbd {</div><div class='ctx'> </div><div class='ctx'> 	struct list_head sd_quota_list;</div><div class='ctx'> 	atomic_t sd_quota_count;</div><div class='del'>-	struct mutex sd_quota_mutex;</div><div class='ctx'> 	struct mutex sd_quota_sync_mutex;</div><div class='ctx'> 	wait_queue_head_t sd_quota_wait;</div><div class='del'>-	struct list_head sd_trunc_list;</div><div class='del'>-	spinlock_t sd_trunc_lock;</div><div class='ctx'> </div><div class='ctx'> 	unsigned int sd_quota_slots;</div><div class='ctx'> 	unsigned long *sd_quota_bitmap;</div><div class='hunk'>@@ -795,7 +785,7 @@ struct gfs2_sbd {</div><div class='ctx'> </div><div class='ctx'> 	/* Log stuff */</div><div class='ctx'> </div><div class='del'>-	struct address_space sd_aspace;</div><div class='add'>+	struct inode *sd_inode;</div><div class='ctx'> </div><div class='ctx'> 	spinlock_t sd_log_lock;</div><div class='ctx'> </div><div class='hunk'>@@ -824,7 +814,6 @@ struct gfs2_sbd {</div><div class='ctx'> 	atomic_t sd_log_in_flight;</div><div class='ctx'> 	wait_queue_head_t sd_log_flush_wait;</div><div class='ctx'> 	int sd_log_error; /* First log error */</div><div class='del'>-	wait_queue_head_t sd_withdraw_wait;</div><div class='ctx'> </div><div class='ctx'> 	unsigned int sd_log_tail;</div><div class='ctx'> 	unsigned int sd_log_flush_tail;</div><div class='hunk'>@@ -837,8 +826,8 @@ struct gfs2_sbd {</div><div class='ctx'> </div><div class='ctx'> 	/* For quiescing the filesystem */</div><div class='ctx'> 	struct gfs2_holder sd_freeze_gh;</div><div class='del'>-	atomic_t sd_freeze_state;</div><div class='ctx'> 	struct mutex sd_freeze_mutex;</div><div class='add'>+	struct list_head sd_dead_glocks;</div><div class='ctx'> </div><div class='ctx'> 	char sd_fsname[GFS2_FSNAME_LEN + 3 * sizeof(int) + 2];</div><div class='ctx'> 	char sd_table_name[GFS2_FSNAME_LEN];</div><div class='hunk'>@@ -848,9 +837,15 @@ struct gfs2_sbd {</div><div class='ctx'> </div><div class='ctx'> 	unsigned long sd_last_warning;</div><div class='ctx'> 	struct dentry *debugfs_dir;    /* debugfs directory */</div><div class='del'>-	unsigned long sd_glock_dqs_held;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+#define GFS2_BAD_INO 1</div><div class='add'>+</div><div class='add'>+static inline struct address_space *gfs2_aspace(struct gfs2_sbd *sdp)</div><div class='add'>+{</div><div class='add'>+	return sdp-&gt;sd_inode-&gt;i_mapping;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline void gfs2_glstats_inc(struct gfs2_glock *gl, int which)</div><div class='ctx'> {</div><div class='ctx'> 	gl-&gt;gl_stats.stats[which]++;</div><div class='hunk'>@@ -864,7 +859,7 @@ static inline void gfs2_sbstats_inc(const struct gfs2_glock *gl, int which)</div><div class='ctx'> 	preempt_enable();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-extern struct gfs2_rgrpd *gfs2_glock2rgrp(struct gfs2_glock *gl);</div><div class='add'>+struct gfs2_rgrpd *gfs2_glock2rgrp(struct gfs2_glock *gl);</div><div class='ctx'> </div><div class='ctx'> static inline unsigned gfs2_max_stuffed_size(const struct gfs2_inode *ip)</div><div class='ctx'> {</div><div class='head'>diff --git a/fs/gfs2/inode.c b/fs/gfs2/inode.c<br/>index 6424b903e885..36618e353199 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/inode.c</a></div><div class='hunk'>@@ -40,37 +40,6 @@ static const struct inode_operations gfs2_file_iops;</div><div class='ctx'> static const struct inode_operations gfs2_dir_iops;</div><div class='ctx'> static const struct inode_operations gfs2_symlink_iops;</div><div class='ctx'> </div><div class='del'>-static int iget_test(struct inode *inode, void *opaque)</div><div class='del'>-{</div><div class='del'>-	u64 no_addr = *(u64 *)opaque;</div><div class='del'>-</div><div class='del'>-	return GFS2_I(inode)-&gt;i_no_addr == no_addr;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int iget_set(struct inode *inode, void *opaque)</div><div class='del'>-{</div><div class='del'>-	u64 no_addr = *(u64 *)opaque;</div><div class='del'>-</div><div class='del'>-	GFS2_I(inode)-&gt;i_no_addr = no_addr;</div><div class='del'>-	inode-&gt;i_ino = no_addr;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct inode *gfs2_iget(struct super_block *sb, u64 no_addr)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode;</div><div class='del'>-</div><div class='del'>-repeat:</div><div class='del'>-	inode = iget5_locked(sb, no_addr, iget_test, iget_set, &amp;no_addr);</div><div class='del'>-	if (!inode)</div><div class='del'>-		return inode;</div><div class='del'>-	if (is_bad_inode(inode)) {</div><div class='del'>-		iput(inode);</div><div class='del'>-		goto repeat;</div><div class='del'>-	}</div><div class='del'>-	return inode;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /**</div><div class='ctx'>  * gfs2_set_iop - Sets inode operations</div><div class='ctx'>  * @inode: The inode with correct i_mode filled in</div><div class='hunk'>@@ -104,6 +73,35 @@ static void gfs2_set_iop(struct inode *inode)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int iget_test(struct inode *inode, void *opaque)</div><div class='add'>+{</div><div class='add'>+	u64 no_addr = *(u64 *)opaque;</div><div class='add'>+</div><div class='add'>+	return GFS2_I(inode)-&gt;i_no_addr == no_addr;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int iget_set(struct inode *inode, void *opaque)</div><div class='add'>+{</div><div class='add'>+	u64 no_addr = *(u64 *)opaque;</div><div class='add'>+</div><div class='add'>+	GFS2_I(inode)-&gt;i_no_addr = no_addr;</div><div class='add'>+	inode-&gt;i_ino = no_addr;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void gfs2_setup_inode(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	gfp_t gfp_mask;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Ensure all page cache allocations are done from GFP_NOFS context to</div><div class='add'>+	 * prevent direct reclaim recursion back into the filesystem and blowing</div><div class='add'>+	 * stacks or deadlocking.</div><div class='add'>+	 */</div><div class='add'>+	gfp_mask = mapping_gfp_mask(inode-&gt;i_mapping);</div><div class='add'>+	mapping_set_gfp_mask(inode-&gt;i_mapping, gfp_mask &amp; ~__GFP_FS);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /**</div><div class='ctx'>  * gfs2_inode_lookup - Lookup an inode</div><div class='ctx'>  * @sb: The super block</div><div class='hunk'>@@ -132,35 +130,52 @@ struct inode *gfs2_inode_lookup(struct super_block *sb, unsigned int type,</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct gfs2_inode *ip;</div><div class='del'>-	struct gfs2_glock *io_gl = NULL;</div><div class='ctx'> 	struct gfs2_holder i_gh;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='ctx'> 	gfs2_holder_mark_uninitialized(&amp;i_gh);</div><div class='del'>-	inode = gfs2_iget(sb, no_addr);</div><div class='add'>+	inode = iget5_locked(sb, no_addr, iget_test, iget_set, &amp;no_addr);</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='ctx'> 	ip = GFS2_I(inode);</div><div class='ctx'> </div><div class='del'>-	if (inode-&gt;i_state &amp; I_NEW) {</div><div class='add'>+	if (inode_state_read_once(inode) &amp; I_NEW) {</div><div class='ctx'> 		struct gfs2_sbd *sdp = GFS2_SB(inode);</div><div class='add'>+		struct gfs2_glock *io_gl;</div><div class='add'>+		int extra_flags = 0;</div><div class='ctx'> </div><div class='del'>-		error = gfs2_glock_get(sdp, no_addr, &amp;gfs2_inode_glops, CREATE, &amp;ip-&gt;i_gl);</div><div class='add'>+		gfs2_setup_inode(inode);</div><div class='add'>+		error = gfs2_glock_get(sdp, no_addr, &amp;gfs2_inode_glops, CREATE,</div><div class='add'>+				       &amp;ip-&gt;i_gl);</div><div class='ctx'> 		if (unlikely(error))</div><div class='ctx'> 			goto fail;</div><div class='del'>-		flush_delayed_work(&amp;ip-&gt;i_gl-&gt;gl_work);</div><div class='ctx'> </div><div class='del'>-		error = gfs2_glock_get(sdp, no_addr, &amp;gfs2_iopen_glops, CREATE, &amp;io_gl);</div><div class='add'>+		error = gfs2_glock_get(sdp, no_addr, &amp;gfs2_iopen_glops, CREATE,</div><div class='add'>+				       &amp;io_gl);</div><div class='ctx'> 		if (unlikely(error))</div><div class='ctx'> 			goto fail;</div><div class='del'>-		if (blktype != GFS2_BLKST_UNLINKED)</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * The only caller that sets @blktype to GFS2_BLKST_UNLINKED is</div><div class='add'>+		 * delete_work_func().  Make sure not to cancel the delete work</div><div class='add'>+		 * from within itself here.</div><div class='add'>+		 */</div><div class='add'>+		if (blktype == GFS2_BLKST_UNLINKED)</div><div class='add'>+			extra_flags |= LM_FLAG_TRY;</div><div class='add'>+		else</div><div class='ctx'> 			gfs2_cancel_delete_work(io_gl);</div><div class='add'>+		error = gfs2_glock_nq_init(io_gl, LM_ST_SHARED,</div><div class='add'>+					   GL_EXACT | GL_NOPID | extra_flags,</div><div class='add'>+					   &amp;ip-&gt;i_iopen_gh);</div><div class='add'>+		gfs2_glock_put(io_gl);</div><div class='add'>+		if (unlikely(error))</div><div class='add'>+			goto fail;</div><div class='ctx'> </div><div class='ctx'> 		if (type == DT_UNKNOWN || blktype != GFS2_BLKST_FREE) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * The GL_SKIP flag indicates to skip reading the inode</div><div class='del'>-			 * block.  We read the inode with gfs2_inode_refresh</div><div class='add'>+			 * block.  We read the inode when instantiating it</div><div class='ctx'> 			 * after possibly checking the block type.</div><div class='ctx'> 			 */</div><div class='ctx'> 			error = gfs2_glock_nq_init(ip-&gt;i_gl, LM_ST_EXCLUSIVE,</div><div class='hunk'>@@ -181,24 +196,22 @@ struct inode *gfs2_inode_lookup(struct super_block *sb, unsigned int type,</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		glock_set_object(ip-&gt;i_gl, ip);</div><div class='ctx'> 		set_bit(GLF_INSTANTIATE_NEEDED, &amp;ip-&gt;i_gl-&gt;gl_flags);</div><div class='del'>-		error = gfs2_glock_nq_init(io_gl, LM_ST_SHARED, GL_EXACT, &amp;ip-&gt;i_iopen_gh);</div><div class='del'>-		if (unlikely(error))</div><div class='del'>-			goto fail;</div><div class='del'>-		glock_set_object(ip-&gt;i_iopen_gh.gh_gl, ip);</div><div class='del'>-		gfs2_glock_put(io_gl);</div><div class='del'>-		io_gl = NULL;</div><div class='ctx'> </div><div class='ctx'> 		/* Lowest possible timestamp; will be overwritten in gfs2_dinode_in. */</div><div class='del'>-		inode-&gt;i_atime.tv_sec = 1LL &lt;&lt; (8 * sizeof(inode-&gt;i_atime.tv_sec) - 1);</div><div class='del'>-		inode-&gt;i_atime.tv_nsec = 0;</div><div class='add'>+		inode_set_atime(inode,</div><div class='add'>+				1LL &lt;&lt; (8 * sizeof(inode_get_atime_sec(inode)) - 1),</div><div class='add'>+				0);</div><div class='add'>+</div><div class='add'>+		glock_set_object(ip-&gt;i_gl, ip);</div><div class='ctx'> </div><div class='ctx'> 		if (type == DT_UNKNOWN) {</div><div class='ctx'> 			/* Inode glock must be locked already */</div><div class='ctx'> 			error = gfs2_instantiate(&amp;i_gh);</div><div class='del'>-			if (error)</div><div class='add'>+			if (error) {</div><div class='add'>+				glock_clear_object(ip-&gt;i_gl, ip);</div><div class='ctx'> 				goto fail;</div><div class='add'>+			}</div><div class='ctx'> 		} else {</div><div class='ctx'> 			ip-&gt;i_no_formal_ino = no_formal_ino;</div><div class='ctx'> 			inode-&gt;i_mode = DT2IF(type);</div><div class='hunk'>@@ -206,33 +219,31 @@ struct inode *gfs2_inode_lookup(struct super_block *sb, unsigned int type,</div><div class='ctx'> </div><div class='ctx'> 		if (gfs2_holder_initialized(&amp;i_gh))</div><div class='ctx'> 			gfs2_glock_dq_uninit(&amp;i_gh);</div><div class='add'>+		glock_set_object(ip-&gt;i_iopen_gh.gh_gl, ip);</div><div class='ctx'> </div><div class='ctx'> 		gfs2_set_iop(inode);</div><div class='add'>+		unlock_new_inode(inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (no_formal_ino &amp;&amp; ip-&gt;i_no_formal_ino &amp;&amp;</div><div class='ctx'> 	    no_formal_ino != ip-&gt;i_no_formal_ino) {</div><div class='del'>-		error = -ESTALE;</div><div class='del'>-		if (inode-&gt;i_state &amp; I_NEW)</div><div class='del'>-			goto fail;</div><div class='ctx'> 		iput(inode);</div><div class='del'>-		return ERR_PTR(error);</div><div class='add'>+		return ERR_PTR(-ESTALE);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (inode-&gt;i_state &amp; I_NEW)</div><div class='del'>-		unlock_new_inode(inode);</div><div class='del'>-</div><div class='ctx'> 	return inode;</div><div class='ctx'> </div><div class='ctx'> fail:</div><div class='del'>-	if (gfs2_holder_initialized(&amp;ip-&gt;i_iopen_gh)) {</div><div class='del'>-		glock_clear_object(ip-&gt;i_iopen_gh.gh_gl, ip);</div><div class='add'>+	if (error == GLR_TRYFAILED)</div><div class='add'>+		error = -EAGAIN;</div><div class='add'>+	if (gfs2_holder_initialized(&amp;ip-&gt;i_iopen_gh))</div><div class='ctx'> 		gfs2_glock_dq_uninit(&amp;ip-&gt;i_iopen_gh);</div><div class='del'>-	}</div><div class='del'>-	if (io_gl)</div><div class='del'>-		gfs2_glock_put(io_gl);</div><div class='ctx'> 	if (gfs2_holder_initialized(&amp;i_gh))</div><div class='ctx'> 		gfs2_glock_dq_uninit(&amp;i_gh);</div><div class='add'>+	if (ip-&gt;i_gl) {</div><div class='add'>+		gfs2_glock_put(ip-&gt;i_gl);</div><div class='add'>+		ip-&gt;i_gl = NULL;</div><div class='add'>+	}</div><div class='ctx'> 	iget_failed(inode);</div><div class='ctx'> 	return ERR_PTR(error);</div><div class='ctx'> }</div><div class='hunk'>@@ -269,21 +280,28 @@ fail_iput:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> </div><div class='del'>-struct inode *gfs2_lookup_simple(struct inode *dip, const char *name)</div><div class='add'>+/**</div><div class='add'>+ * gfs2_lookup_meta - Look up an inode in a metadata directory</div><div class='add'>+ * @dip: The directory</div><div class='add'>+ * @name: The name of the inode</div><div class='add'>+ */</div><div class='add'>+struct inode *gfs2_lookup_meta(struct inode *dip, const char *name)</div><div class='ctx'> {</div><div class='ctx'> 	struct qstr qstr;</div><div class='ctx'> 	struct inode *inode;</div><div class='add'>+</div><div class='ctx'> 	gfs2_str2qstr(&amp;qstr, name);</div><div class='ctx'> 	inode = gfs2_lookupi(dip, &amp;qstr, 1);</div><div class='del'>-	/* gfs2_lookupi has inconsistent callers: vfs</div><div class='del'>-	 * related routines expect NULL for no entry found,</div><div class='del'>-	 * gfs2_lookup_simple callers expect ENOENT</div><div class='del'>-	 * and do not check for NULL.</div><div class='add'>+	if (IS_ERR_OR_NULL(inode))</div><div class='add'>+		return inode ? inode : ERR_PTR(-ENOENT);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Must not call back into the filesystem when allocating</div><div class='add'>+	 * pages in the metadata inode's address space.</div><div class='ctx'> 	 */</div><div class='del'>-	if (inode == NULL)</div><div class='del'>-		return ERR_PTR(-ENOENT);</div><div class='del'>-	else</div><div class='del'>-		return inode;</div><div class='add'>+	mapping_set_gfp_mask(inode-&gt;i_mapping, GFP_NOFS);</div><div class='add'>+</div><div class='add'>+	return inode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> </div><div class='hunk'>@@ -328,7 +346,7 @@ struct inode *gfs2_lookupi(struct inode *dir, const struct qstr *name,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!is_root) {</div><div class='del'>-		error = gfs2_permission(&amp;init_user_ns, dir, MAY_EXEC);</div><div class='add'>+		error = gfs2_permission(&amp;nop_mnt_idmap, dir, MAY_EXEC);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -358,7 +376,7 @@ static int create_ok(struct gfs2_inode *dip, const struct qstr *name,</div><div class='ctx'> {</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	error = gfs2_permission(&amp;init_user_ns, &amp;dip-&gt;i_inode,</div><div class='add'>+	error = gfs2_permission(&amp;nop_mnt_idmap, &amp;dip-&gt;i_inode,</div><div class='ctx'> 				MAY_WRITE | MAY_EXEC);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='hunk'>@@ -415,13 +433,18 @@ static int alloc_dinode(struct gfs2_inode *ip, u32 flags, unsigned *dblocks)</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out_ipreserv;</div><div class='ctx'> </div><div class='del'>-	error = gfs2_alloc_blocks(ip, &amp;ip-&gt;i_no_addr, dblocks, 1, &amp;ip-&gt;i_generation);</div><div class='add'>+	error = gfs2_alloc_blocks(ip, &amp;ip-&gt;i_no_addr, dblocks, 1);</div><div class='add'>+	if (error)</div><div class='add'>+		goto out_trans_end;</div><div class='add'>+</div><div class='ctx'> 	ip-&gt;i_no_formal_ino = ip-&gt;i_generation;</div><div class='ctx'> 	ip-&gt;i_inode.i_ino = ip-&gt;i_no_addr;</div><div class='ctx'> 	ip-&gt;i_goal = ip-&gt;i_no_addr;</div><div class='add'>+	if (*dblocks &gt; 1)</div><div class='add'>+		ip-&gt;i_eattr = ip-&gt;i_no_addr + 1;</div><div class='ctx'> </div><div class='add'>+out_trans_end:</div><div class='ctx'> 	gfs2_trans_end(sdp);</div><div class='del'>-</div><div class='ctx'> out_ipreserv:</div><div class='ctx'> 	gfs2_inplace_release(ip);</div><div class='ctx'> out_quota:</div><div class='hunk'>@@ -430,6 +453,72 @@ out:</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void gfs2_final_release_pages(struct gfs2_inode *ip)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = &amp;ip-&gt;i_inode;</div><div class='add'>+	struct gfs2_glock *gl = ip-&gt;i_gl;</div><div class='add'>+</div><div class='add'>+	/* This can only happen during incomplete inode creation. */</div><div class='add'>+	if (unlikely(!gl))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	truncate_inode_pages(gfs2_glock2aspace(gl), 0);</div><div class='add'>+	truncate_inode_pages(&amp;inode-&gt;i_data, 0);</div><div class='add'>+</div><div class='add'>+	if (atomic_read(&amp;gl-&gt;gl_revokes) == 0) {</div><div class='add'>+		clear_bit(GLF_LFLUSH, &amp;gl-&gt;gl_flags);</div><div class='add'>+		clear_bit(GLF_DIRTY, &amp;gl-&gt;gl_flags);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int gfs2_dinode_dealloc(struct gfs2_inode *ip)</div><div class='add'>+{</div><div class='add'>+	struct gfs2_sbd *sdp = GFS2_SB(&amp;ip-&gt;i_inode);</div><div class='add'>+	struct gfs2_rgrpd *rgd;</div><div class='add'>+	struct gfs2_holder gh;</div><div class='add'>+	int error;</div><div class='add'>+</div><div class='add'>+	if (gfs2_get_inode_blocks(&amp;ip-&gt;i_inode) != 1) {</div><div class='add'>+		gfs2_consist_inode(ip);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	gfs2_rindex_update(sdp);</div><div class='add'>+</div><div class='add'>+	error = gfs2_quota_hold(ip, NO_UID_QUOTA_CHANGE, NO_GID_QUOTA_CHANGE);</div><div class='add'>+	if (error)</div><div class='add'>+		return error;</div><div class='add'>+</div><div class='add'>+	rgd = gfs2_blk2rgrpd(sdp, ip-&gt;i_no_addr, 1);</div><div class='add'>+	if (!rgd) {</div><div class='add'>+		gfs2_consist_inode(ip);</div><div class='add'>+		error = -EIO;</div><div class='add'>+		goto out_qs;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	error = gfs2_glock_nq_init(rgd-&gt;rd_gl, LM_ST_EXCLUSIVE,</div><div class='add'>+				   LM_FLAG_NODE_SCOPE, &amp;gh);</div><div class='add'>+	if (error)</div><div class='add'>+		goto out_qs;</div><div class='add'>+</div><div class='add'>+	error = gfs2_trans_begin(sdp, RES_RG_BIT + RES_STATFS + RES_QUOTA,</div><div class='add'>+				 sdp-&gt;sd_jdesc-&gt;jd_blocks);</div><div class='add'>+	if (error)</div><div class='add'>+		goto out_rg_gunlock;</div><div class='add'>+</div><div class='add'>+	gfs2_free_di(rgd, ip);</div><div class='add'>+</div><div class='add'>+	gfs2_final_release_pages(ip);</div><div class='add'>+</div><div class='add'>+	gfs2_trans_end(sdp);</div><div class='add'>+</div><div class='add'>+out_rg_gunlock:</div><div class='add'>+	gfs2_glock_dq_uninit(&amp;gh);</div><div class='add'>+out_qs:</div><div class='add'>+	gfs2_quota_unhold(ip);</div><div class='add'>+	return error;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void gfs2_init_dir(struct buffer_head *dibh,</div><div class='ctx'> 			  const struct gfs2_inode *parent)</div><div class='ctx'> {</div><div class='hunk'>@@ -599,6 +688,12 @@ static int gfs2_initxattrs(struct inode *inode, const struct xattr *xattr_array,</div><div class='ctx'>  * @size: The initial size of the inode (ignored for directories)</div><div class='ctx'>  * @excl: Force fail if inode exists</div><div class='ctx'>  *</div><div class='add'>+ * FIXME: Change to allocate the disk blocks and write them out in the same</div><div class='add'>+ * transaction.  That way, we can no longer end up in a situation in which an</div><div class='add'>+ * inode is allocated, the node crashes, and the block looks like a valid</div><div class='add'>+ * inode.  (With atomic creates in place, we will also no longer need to zero</div><div class='add'>+ * the link count and dirty the inode here on failure.)</div><div class='add'>+ *</div><div class='ctx'>  * Returns: 0 on success, or error code</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='hunk'>@@ -609,15 +704,16 @@ static int gfs2_create_inode(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> {</div><div class='ctx'> 	const struct qstr *name = &amp;dentry-&gt;d_name;</div><div class='ctx'> 	struct posix_acl *default_acl, *acl;</div><div class='del'>-	struct gfs2_holder ghs[2];</div><div class='add'>+	struct gfs2_holder d_gh, gh;</div><div class='ctx'> 	struct inode *inode = NULL;</div><div class='ctx'> 	struct gfs2_inode *dip = GFS2_I(dir), *ip;</div><div class='ctx'> 	struct gfs2_sbd *sdp = GFS2_SB(&amp;dip-&gt;i_inode);</div><div class='ctx'> 	struct gfs2_glock *io_gl;</div><div class='del'>-	int error, free_vfs_inode = 1;</div><div class='add'>+	int error, dealloc_error;</div><div class='ctx'> 	u32 aflags = 0;</div><div class='ctx'> 	unsigned blocks = 1;</div><div class='ctx'> 	struct gfs2_diradd da = { .bh = NULL, .save_loc = 1, };</div><div class='add'>+	bool xattr_initialized = false;</div><div class='ctx'> </div><div class='ctx'> 	if (!name-&gt;len || name-&gt;len &gt; GFS2_FNAMESIZE)</div><div class='ctx'> 		return -ENAMETOOLONG;</div><div class='hunk'>@@ -630,10 +726,10 @@ static int gfs2_create_inode(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> </div><div class='del'>-	error = gfs2_glock_nq_init(dip-&gt;i_gl, LM_ST_EXCLUSIVE, 0, ghs);</div><div class='add'>+	error = gfs2_glock_nq_init(dip-&gt;i_gl, LM_ST_EXCLUSIVE, 0, &amp;d_gh);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto fail;</div><div class='del'>-	gfs2_holder_mark_uninitialized(ghs + 1);</div><div class='add'>+	gfs2_holder_mark_uninitialized(&amp;gh);</div><div class='ctx'> </div><div class='ctx'> 	error = create_ok(dip, name, mode);</div><div class='ctx'> 	if (error)</div><div class='hunk'>@@ -644,7 +740,8 @@ static int gfs2_create_inode(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	if (!IS_ERR(inode)) {</div><div class='ctx'> 		if (S_ISDIR(inode-&gt;i_mode)) {</div><div class='ctx'> 			iput(inode);</div><div class='del'>-			inode = ERR_PTR(-EISDIR);</div><div class='add'>+			inode = NULL;</div><div class='add'>+			error = -EISDIR;</div><div class='ctx'> 			goto fail_gunlock;</div><div class='ctx'> 		}</div><div class='ctx'> 		d_instantiate(dentry, inode);</div><div class='hunk'>@@ -655,7 +752,7 @@ static int gfs2_create_inode(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 			else</div><div class='ctx'> 				error = finish_no_open(file, NULL);</div><div class='ctx'> 		}</div><div class='del'>-		gfs2_glock_dq_uninit(ghs);</div><div class='add'>+		gfs2_glock_dq_uninit(&amp;d_gh);</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	} else if (error != -ENOENT) {</div><div class='ctx'> 		goto fail_gunlock;</div><div class='hunk'>@@ -669,12 +766,13 @@ static int gfs2_create_inode(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	error = -ENOMEM;</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		goto fail_gunlock;</div><div class='add'>+	gfs2_setup_inode(inode);</div><div class='add'>+	ip = GFS2_I(inode);</div><div class='ctx'> </div><div class='ctx'> 	error = posix_acl_create(dir, &amp;mode, &amp;default_acl, &amp;acl);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto fail_gunlock;</div><div class='ctx'> </div><div class='del'>-	ip = GFS2_I(inode);</div><div class='ctx'> 	error = gfs2_qa_get(ip);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto fail_free_acls;</div><div class='hunk'>@@ -683,7 +781,7 @@ static int gfs2_create_inode(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	set_nlink(inode, S_ISDIR(mode) ? 2 : 1);</div><div class='ctx'> 	inode-&gt;i_rdev = dev;</div><div class='ctx'> 	inode-&gt;i_size = size;</div><div class='del'>-	inode-&gt;i_atime = inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	simple_inode_init_ts(inode);</div><div class='ctx'> 	munge_mode_uid_gid(dip, inode);</div><div class='ctx'> 	check_and_update_goal(dip);</div><div class='ctx'> 	ip-&gt;i_goal = dip-&gt;i_goal;</div><div class='hunk'>@@ -729,52 +827,57 @@ static int gfs2_create_inode(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> </div><div class='ctx'> 	error = gfs2_glock_get(sdp, ip-&gt;i_no_addr, &amp;gfs2_inode_glops, CREATE, &amp;ip-&gt;i_gl);</div><div class='ctx'> 	if (error)</div><div class='del'>-		goto fail_free_inode;</div><div class='del'>-	flush_delayed_work(&amp;ip-&gt;i_gl-&gt;gl_work);</div><div class='add'>+		goto fail_dealloc_inode;</div><div class='ctx'> </div><div class='ctx'> 	error = gfs2_glock_get(sdp, ip-&gt;i_no_addr, &amp;gfs2_iopen_glops, CREATE, &amp;io_gl);</div><div class='ctx'> 	if (error)</div><div class='del'>-		goto fail_free_inode;</div><div class='add'>+		goto fail_dealloc_inode;</div><div class='ctx'> 	gfs2_cancel_delete_work(io_gl);</div><div class='add'>+	io_gl-&gt;gl_no_formal_ino = ip-&gt;i_no_formal_ino;</div><div class='ctx'> </div><div class='del'>-	error = gfs2_glock_nq_init(ip-&gt;i_gl, LM_ST_EXCLUSIVE, GL_SKIP, ghs + 1);</div><div class='add'>+retry:</div><div class='add'>+	error = insert_inode_locked4(inode, ip-&gt;i_no_addr, iget_test, &amp;ip-&gt;i_no_addr);</div><div class='add'>+	if (error == -EBUSY)</div><div class='add'>+		goto retry;</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto fail_gunlock2;</div><div class='ctx'> </div><div class='del'>-	glock_set_object(ip-&gt;i_gl, ip);</div><div class='del'>-	error = gfs2_trans_begin(sdp, blocks, 0);</div><div class='add'>+	error = gfs2_glock_nq_init(io_gl, LM_ST_SHARED, GL_EXACT | GL_NOPID,</div><div class='add'>+				   &amp;ip-&gt;i_iopen_gh);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto fail_gunlock2;</div><div class='ctx'> </div><div class='add'>+	error = gfs2_glock_nq_init(ip-&gt;i_gl, LM_ST_EXCLUSIVE, GL_SKIP, &amp;gh);</div><div class='add'>+	if (error)</div><div class='add'>+		goto fail_gunlock3;</div><div class='add'>+	clear_bit(GLF_INSTANTIATE_NEEDED, &amp;ip-&gt;i_gl-&gt;gl_flags);</div><div class='add'>+</div><div class='add'>+	error = gfs2_trans_begin(sdp, blocks, 0);</div><div class='add'>+	if (error)</div><div class='add'>+		goto fail_gunlock3;</div><div class='add'>+</div><div class='ctx'> 	if (blocks &gt; 1) {</div><div class='del'>-		ip-&gt;i_eattr = ip-&gt;i_no_addr + 1;</div><div class='ctx'> 		gfs2_init_xattr(ip);</div><div class='add'>+		xattr_initialized = true;</div><div class='ctx'> 	}</div><div class='ctx'> 	init_dinode(dip, ip, symname);</div><div class='ctx'> 	gfs2_trans_end(sdp);</div><div class='ctx'> </div><div class='del'>-	error = gfs2_glock_nq_init(io_gl, LM_ST_SHARED, GL_EXACT, &amp;ip-&gt;i_iopen_gh);</div><div class='del'>-	if (error)</div><div class='del'>-		goto fail_gunlock2;</div><div class='del'>-</div><div class='add'>+	glock_set_object(ip-&gt;i_gl, ip);</div><div class='ctx'> 	glock_set_object(io_gl, ip);</div><div class='ctx'> 	gfs2_set_iop(inode);</div><div class='del'>-	insert_inode_hash(inode);</div><div class='ctx'> </div><div class='del'>-	free_vfs_inode = 0; /* After this point, the inode is no longer</div><div class='del'>-			       considered free. Any failures need to undo</div><div class='del'>-			       the gfs2 structures. */</div><div class='ctx'> 	if (default_acl) {</div><div class='ctx'> 		error = __gfs2_set_acl(inode, default_acl, ACL_TYPE_DEFAULT);</div><div class='ctx'> 		if (error)</div><div class='del'>-			goto fail_gunlock3;</div><div class='add'>+			goto fail_gunlock4;</div><div class='ctx'> 		posix_acl_release(default_acl);</div><div class='ctx'> 		default_acl = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (acl) {</div><div class='ctx'> 		error = __gfs2_set_acl(inode, acl, ACL_TYPE_ACCESS);</div><div class='ctx'> 		if (error)</div><div class='del'>-			goto fail_gunlock3;</div><div class='add'>+			goto fail_gunlock4;</div><div class='ctx'> 		posix_acl_release(acl);</div><div class='ctx'> 		acl = NULL;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -782,11 +885,11 @@ static int gfs2_create_inode(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	error = security_inode_init_security(&amp;ip-&gt;i_inode, &amp;dip-&gt;i_inode, name,</div><div class='ctx'> 					     &amp;gfs2_initxattrs, NULL);</div><div class='ctx'> 	if (error)</div><div class='del'>-		goto fail_gunlock3;</div><div class='add'>+		goto fail_gunlock4;</div><div class='ctx'> </div><div class='ctx'> 	error = link_dinode(dip, name, ip, &amp;da);</div><div class='ctx'> 	if (error)</div><div class='del'>-		goto fail_gunlock3;</div><div class='add'>+		goto fail_gunlock4;</div><div class='ctx'> </div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='ctx'> 	d_instantiate(dentry, inode);</div><div class='hunk'>@@ -796,43 +899,53 @@ static int gfs2_create_inode(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 		file-&gt;f_mode |= FMODE_CREATED;</div><div class='ctx'> 		error = finish_open(file, dentry, gfs2_open_common);</div><div class='ctx'> 	}</div><div class='del'>-	gfs2_glock_dq_uninit(ghs);</div><div class='add'>+	gfs2_glock_dq_uninit(&amp;d_gh);</div><div class='ctx'> 	gfs2_qa_put(ip);</div><div class='del'>-	gfs2_glock_dq_uninit(ghs + 1);</div><div class='add'>+	gfs2_glock_dq_uninit(&amp;gh);</div><div class='ctx'> 	gfs2_glock_put(io_gl);</div><div class='ctx'> 	gfs2_qa_put(dip);</div><div class='add'>+	unlock_new_inode(inode);</div><div class='ctx'> 	return error;</div><div class='ctx'> </div><div class='del'>-fail_gunlock3:</div><div class='add'>+fail_gunlock4:</div><div class='add'>+	glock_clear_object(ip-&gt;i_gl, ip);</div><div class='ctx'> 	glock_clear_object(io_gl, ip);</div><div class='add'>+fail_gunlock3:</div><div class='ctx'> 	gfs2_glock_dq_uninit(&amp;ip-&gt;i_iopen_gh);</div><div class='ctx'> fail_gunlock2:</div><div class='del'>-	glock_clear_object(io_gl, ip);</div><div class='ctx'> 	gfs2_glock_put(io_gl);</div><div class='add'>+fail_dealloc_inode:</div><div class='add'>+	dealloc_error = 0;</div><div class='add'>+	if (ip-&gt;i_eattr)</div><div class='add'>+		dealloc_error = gfs2_ea_dealloc(ip, xattr_initialized);</div><div class='add'>+	clear_nlink(inode);</div><div class='add'>+	mark_inode_dirty(inode);</div><div class='add'>+	if (!dealloc_error)</div><div class='add'>+		dealloc_error = gfs2_dinode_dealloc(ip);</div><div class='add'>+	if (dealloc_error)</div><div class='add'>+		fs_warn(sdp, "%s: %d\n", __func__, dealloc_error);</div><div class='add'>+	ip-&gt;i_no_addr = 0;</div><div class='ctx'> fail_free_inode:</div><div class='ctx'> 	if (ip-&gt;i_gl) {</div><div class='del'>-		glock_clear_object(ip-&gt;i_gl, ip);</div><div class='del'>-		if (free_vfs_inode) /* else evict will do the put for us */</div><div class='del'>-			gfs2_glock_put(ip-&gt;i_gl);</div><div class='add'>+		gfs2_glock_put(ip-&gt;i_gl);</div><div class='add'>+		ip-&gt;i_gl = NULL;</div><div class='ctx'> 	}</div><div class='del'>-	gfs2_rs_delete(ip, NULL);</div><div class='add'>+	gfs2_rs_deltree(&amp;ip-&gt;i_res);</div><div class='ctx'> 	gfs2_qa_put(ip);</div><div class='ctx'> fail_free_acls:</div><div class='ctx'> 	posix_acl_release(default_acl);</div><div class='ctx'> 	posix_acl_release(acl);</div><div class='ctx'> fail_gunlock:</div><div class='ctx'> 	gfs2_dir_no_add(&amp;da);</div><div class='del'>-	gfs2_glock_dq_uninit(ghs);</div><div class='add'>+	gfs2_glock_dq_uninit(&amp;d_gh);</div><div class='ctx'> 	if (!IS_ERR_OR_NULL(inode)) {</div><div class='del'>-		clear_nlink(inode);</div><div class='del'>-		if (!free_vfs_inode)</div><div class='del'>-			mark_inode_dirty(inode);</div><div class='del'>-		set_bit(free_vfs_inode ? GIF_FREE_VFS_INODE : GIF_ALLOC_FAILED,</div><div class='del'>-			&amp;GFS2_I(inode)-&gt;i_flags);</div><div class='del'>-		iput(inode);</div><div class='add'>+		if (inode_state_read_once(inode) &amp; I_NEW)</div><div class='add'>+			iget_failed(inode);</div><div class='add'>+		else</div><div class='add'>+			iput(inode);</div><div class='ctx'> 	}</div><div class='del'>-	if (gfs2_holder_initialized(ghs + 1))</div><div class='del'>-		gfs2_glock_dq_uninit(ghs + 1);</div><div class='add'>+	if (gfs2_holder_initialized(&amp;gh))</div><div class='add'>+		gfs2_glock_dq_uninit(&amp;gh);</div><div class='ctx'> fail:</div><div class='ctx'> 	gfs2_qa_put(dip);</div><div class='ctx'> 	return error;</div><div class='hunk'>@@ -840,7 +953,7 @@ fail:</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * gfs2_create - Create a file</div><div class='del'>- * @mnt_userns: User namespace of the mount the inode was found from</div><div class='add'>+ * @idmap: idmap of the mount the inode was found from</div><div class='ctx'>  * @dir: The directory in which to create the file</div><div class='ctx'>  * @dentry: The dentry of the new file</div><div class='ctx'>  * @mode: The mode of the new file</div><div class='hunk'>@@ -849,7 +962,7 @@ fail:</div><div class='ctx'>  * Returns: errno</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static int gfs2_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int gfs2_create(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		       struct dentry *dentry, umode_t mode, bool excl)</div><div class='ctx'> {</div><div class='ctx'> 	return gfs2_create_inode(dir, dentry, NULL, S_IFREG | mode, 0, NULL, 0, excl);</div><div class='hunk'>@@ -930,7 +1043,7 @@ static int gfs2_link(struct dentry *old_dentry, struct inode *dir,</div><div class='ctx'> 	struct gfs2_sbd *sdp = GFS2_SB(dir);</div><div class='ctx'> 	struct inode *inode = d_inode(old_dentry);</div><div class='ctx'> 	struct gfs2_inode *ip = GFS2_I(inode);</div><div class='del'>-	struct gfs2_holder ghs[2];</div><div class='add'>+	struct gfs2_holder d_gh, gh;</div><div class='ctx'> 	struct buffer_head *dibh;</div><div class='ctx'> 	struct gfs2_diradd da = { .bh = NULL, .save_loc = 1, };</div><div class='ctx'> 	int error;</div><div class='hunk'>@@ -942,14 +1055,14 @@ static int gfs2_link(struct dentry *old_dentry, struct inode *dir,</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='del'>-	gfs2_holder_init(dip-&gt;i_gl, LM_ST_EXCLUSIVE, 0, ghs);</div><div class='del'>-	gfs2_holder_init(ip-&gt;i_gl, LM_ST_EXCLUSIVE, 0, ghs + 1);</div><div class='add'>+	gfs2_holder_init(dip-&gt;i_gl, LM_ST_EXCLUSIVE, 0, &amp;d_gh);</div><div class='add'>+	gfs2_holder_init(ip-&gt;i_gl, LM_ST_EXCLUSIVE, 0, &amp;gh);</div><div class='ctx'> </div><div class='del'>-	error = gfs2_glock_nq(ghs); /* parent */</div><div class='add'>+	error = gfs2_glock_nq(&amp;d_gh);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out_parent;</div><div class='ctx'> </div><div class='del'>-	error = gfs2_glock_nq(ghs + 1); /* child */</div><div class='add'>+	error = gfs2_glock_nq(&amp;gh);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out_child;</div><div class='ctx'> </div><div class='hunk'>@@ -957,7 +1070,7 @@ static int gfs2_link(struct dentry *old_dentry, struct inode *dir,</div><div class='ctx'> 	if (inode-&gt;i_nlink == 0)</div><div class='ctx'> 		goto out_gunlock;</div><div class='ctx'> </div><div class='del'>-	error = gfs2_permission(&amp;init_user_ns, dir, MAY_WRITE | MAY_EXEC);</div><div class='add'>+	error = gfs2_permission(&amp;nop_mnt_idmap, dir, MAY_WRITE | MAY_EXEC);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out_gunlock;</div><div class='ctx'> </div><div class='hunk'>@@ -981,9 +1094,6 @@ static int gfs2_link(struct dentry *old_dentry, struct inode *dir,</div><div class='ctx'> 	error = -EPERM;</div><div class='ctx'> 	if (IS_IMMUTABLE(inode) || IS_APPEND(inode))</div><div class='ctx'> 		goto out_gunlock;</div><div class='del'>-	error = -EINVAL;</div><div class='del'>-	if (!ip-&gt;i_inode.i_nlink)</div><div class='del'>-		goto out_gunlock;</div><div class='ctx'> 	error = -EMLINK;</div><div class='ctx'> 	if (ip-&gt;i_inode.i_nlink == (u32)-1)</div><div class='ctx'> 		goto out_gunlock;</div><div class='hunk'>@@ -1021,7 +1131,7 @@ static int gfs2_link(struct dentry *old_dentry, struct inode *dir,</div><div class='ctx'> </div><div class='ctx'> 	gfs2_trans_add_meta(ip-&gt;i_gl, dibh);</div><div class='ctx'> 	inc_nlink(&amp;ip-&gt;i_inode);</div><div class='del'>-	ip-&gt;i_inode.i_ctime = current_time(&amp;ip-&gt;i_inode);</div><div class='add'>+	inode_set_ctime_current(&amp;ip-&gt;i_inode);</div><div class='ctx'> 	ihold(inode);</div><div class='ctx'> 	d_instantiate(dentry, inode);</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='hunk'>@@ -1038,13 +1148,13 @@ out_gunlock_q:</div><div class='ctx'> 		gfs2_quota_unlock(dip);</div><div class='ctx'> out_gunlock:</div><div class='ctx'> 	gfs2_dir_no_add(&amp;da);</div><div class='del'>-	gfs2_glock_dq(ghs + 1);</div><div class='add'>+	gfs2_glock_dq(&amp;gh);</div><div class='ctx'> out_child:</div><div class='del'>-	gfs2_glock_dq(ghs);</div><div class='add'>+	gfs2_glock_dq(&amp;d_gh);</div><div class='ctx'> out_parent:</div><div class='ctx'> 	gfs2_qa_put(dip);</div><div class='del'>-	gfs2_holder_uninit(ghs);</div><div class='del'>-	gfs2_holder_uninit(ghs + 1);</div><div class='add'>+	gfs2_holder_uninit(&amp;d_gh);</div><div class='add'>+	gfs2_holder_uninit(&amp;gh);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1075,7 +1185,7 @@ static int gfs2_unlink_ok(struct gfs2_inode *dip, const struct qstr *name,</div><div class='ctx'> 	if (IS_APPEND(&amp;dip-&gt;i_inode))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='del'>-	error = gfs2_permission(&amp;init_user_ns, &amp;dip-&gt;i_inode,</div><div class='add'>+	error = gfs2_permission(&amp;nop_mnt_idmap, &amp;dip-&gt;i_inode,</div><div class='ctx'> 				MAY_WRITE | MAY_EXEC);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='hunk'>@@ -1106,7 +1216,7 @@ static int gfs2_unlink_inode(struct gfs2_inode *dip,</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='ctx'> 	ip-&gt;i_entries = 0;</div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> 	if (S_ISDIR(inode-&gt;i_mode))</div><div class='ctx'> 		clear_nlink(inode);</div><div class='ctx'> 	else</div><div class='hunk'>@@ -1135,7 +1245,7 @@ static int gfs2_unlink(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	struct gfs2_sbd *sdp = GFS2_SB(dir);</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	struct gfs2_inode *ip = GFS2_I(inode);</div><div class='del'>-	struct gfs2_holder ghs[3];</div><div class='add'>+	struct gfs2_holder d_gh, r_gh, gh;</div><div class='ctx'> 	struct gfs2_rgrpd *rgd;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='hunk'>@@ -1145,21 +1255,21 @@ static int gfs2_unlink(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> </div><div class='ctx'> 	error = -EROFS;</div><div class='ctx'> </div><div class='del'>-	gfs2_holder_init(dip-&gt;i_gl, LM_ST_EXCLUSIVE, 0, ghs);</div><div class='del'>-	gfs2_holder_init(ip-&gt;i_gl,  LM_ST_EXCLUSIVE, 0, ghs + 1);</div><div class='add'>+	gfs2_holder_init(dip-&gt;i_gl, LM_ST_EXCLUSIVE, 0, &amp;d_gh);</div><div class='add'>+	gfs2_holder_init(ip-&gt;i_gl,  LM_ST_EXCLUSIVE, 0, &amp;gh);</div><div class='ctx'> </div><div class='ctx'> 	rgd = gfs2_blk2rgrpd(sdp, ip-&gt;i_no_addr, 1);</div><div class='ctx'> 	if (!rgd)</div><div class='ctx'> 		goto out_inodes;</div><div class='ctx'> </div><div class='del'>-	gfs2_holder_init(rgd-&gt;rd_gl, LM_ST_EXCLUSIVE, LM_FLAG_NODE_SCOPE, ghs + 2);</div><div class='add'>+	gfs2_holder_init(rgd-&gt;rd_gl, LM_ST_EXCLUSIVE, LM_FLAG_NODE_SCOPE, &amp;r_gh);</div><div class='ctx'> </div><div class='ctx'> </div><div class='del'>-	error = gfs2_glock_nq(ghs); /* parent */</div><div class='add'>+	error = gfs2_glock_nq(&amp;d_gh);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out_parent;</div><div class='ctx'> </div><div class='del'>-	error = gfs2_glock_nq(ghs + 1); /* child */</div><div class='add'>+	error = gfs2_glock_nq(&amp;gh);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out_child;</div><div class='ctx'> </div><div class='hunk'>@@ -1173,7 +1283,7 @@ static int gfs2_unlink(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 			goto out_rgrp;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	error = gfs2_glock_nq(ghs + 2); /* rgrp */</div><div class='add'>+	error = gfs2_glock_nq(&amp;r_gh); /* rgrp */</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out_rgrp;</div><div class='ctx'> </div><div class='hunk'>@@ -1189,22 +1299,22 @@ static int gfs2_unlink(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	gfs2_trans_end(sdp);</div><div class='ctx'> </div><div class='ctx'> out_gunlock:</div><div class='del'>-	gfs2_glock_dq(ghs + 2);</div><div class='add'>+	gfs2_glock_dq(&amp;r_gh);</div><div class='ctx'> out_rgrp:</div><div class='del'>-	gfs2_glock_dq(ghs + 1);</div><div class='add'>+	gfs2_glock_dq(&amp;gh);</div><div class='ctx'> out_child:</div><div class='del'>-	gfs2_glock_dq(ghs);</div><div class='add'>+	gfs2_glock_dq(&amp;d_gh);</div><div class='ctx'> out_parent:</div><div class='del'>-	gfs2_holder_uninit(ghs + 2);</div><div class='add'>+	gfs2_holder_uninit(&amp;r_gh);</div><div class='ctx'> out_inodes:</div><div class='del'>-	gfs2_holder_uninit(ghs + 1);</div><div class='del'>-	gfs2_holder_uninit(ghs);</div><div class='add'>+	gfs2_holder_uninit(&amp;gh);</div><div class='add'>+	gfs2_holder_uninit(&amp;d_gh);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * gfs2_symlink - Create a symlink</div><div class='del'>- * @mnt_userns: User namespace of the mount the inode was found from</div><div class='add'>+ * @idmap: idmap of the mount the inode was found from</div><div class='ctx'>  * @dir: The directory to create the symlink in</div><div class='ctx'>  * @dentry: The dentry to put the symlink in</div><div class='ctx'>  * @symname: The thing which the link points to</div><div class='hunk'>@@ -1212,7 +1322,7 @@ out_inodes:</div><div class='ctx'>  * Returns: errno</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static int gfs2_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int gfs2_symlink(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 			struct dentry *dentry, const char *symname)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int size;</div><div class='hunk'>@@ -1226,24 +1336,25 @@ static int gfs2_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * gfs2_mkdir - Make a directory</div><div class='del'>- * @mnt_userns: User namespace of the mount the inode was found from</div><div class='add'>+ * @idmap: idmap of the mount the inode was found from</div><div class='ctx'>  * @dir: The parent directory of the new one</div><div class='ctx'>  * @dentry: The dentry of the new directory</div><div class='ctx'>  * @mode: The mode of the new directory</div><div class='ctx'>  *</div><div class='del'>- * Returns: errno</div><div class='add'>+ * Returns: the dentry, or ERR_PTR(errno)</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static int gfs2_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-		      struct dentry *dentry, umode_t mode)</div><div class='add'>+static struct dentry *gfs2_mkdir(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+				 struct dentry *dentry, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned dsize = gfs2_max_stuffed_size(GFS2_I(dir));</div><div class='del'>-	return gfs2_create_inode(dir, dentry, NULL, S_IFDIR | mode, 0, NULL, dsize, 0);</div><div class='add'>+</div><div class='add'>+	return ERR_PTR(gfs2_create_inode(dir, dentry, NULL, S_IFDIR | mode, 0, NULL, dsize, 0));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * gfs2_mknod - Make a special file</div><div class='del'>- * @mnt_userns: User namespace of the mount the inode was found from</div><div class='add'>+ * @idmap: idmap of the mount the inode was found from</div><div class='ctx'>  * @dir: The directory in which the special file will reside</div><div class='ctx'>  * @dentry: The dentry of the special file</div><div class='ctx'>  * @mode: The mode of the special file</div><div class='hunk'>@@ -1251,7 +1362,7 @@ static int gfs2_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static int gfs2_mknod(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int gfs2_mknod(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		      struct dentry *dentry, umode_t mode, dev_t dev)</div><div class='ctx'> {</div><div class='ctx'> 	return gfs2_create_inode(dir, dentry, NULL, mode, dev, NULL, 0, 0);</div><div class='hunk'>@@ -1272,27 +1383,19 @@ static int gfs2_atomic_open(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 			    struct file *file, unsigned flags,</div><div class='ctx'> 			    umode_t mode)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *d;</div><div class='ctx'> 	bool excl = !!(flags &amp; O_EXCL);</div><div class='ctx'> </div><div class='del'>-	if (!d_in_lookup(dentry))</div><div class='del'>-		goto skip_lookup;</div><div class='del'>-</div><div class='del'>-	d = __gfs2_lookup(dir, dentry, file);</div><div class='del'>-	if (IS_ERR(d))</div><div class='del'>-		return PTR_ERR(d);</div><div class='del'>-	if (d != NULL)</div><div class='del'>-		dentry = d;</div><div class='del'>-	if (d_really_is_positive(dentry)) {</div><div class='del'>-		if (!(file-&gt;f_mode &amp; FMODE_OPENED))</div><div class='add'>+	if (d_in_lookup(dentry)) {</div><div class='add'>+		struct dentry *d = __gfs2_lookup(dir, dentry, file);</div><div class='add'>+		if (file-&gt;f_mode &amp; FMODE_OPENED) {</div><div class='add'>+			if (IS_ERR(d))</div><div class='add'>+				return PTR_ERR(d);</div><div class='add'>+			dput(d);</div><div class='add'>+			return excl &amp;&amp; (flags &amp; O_CREAT) ? -EEXIST : 0;</div><div class='add'>+		}</div><div class='add'>+		if (d || d_really_is_positive(dentry))</div><div class='ctx'> 			return finish_no_open(file, d);</div><div class='del'>-		dput(d);</div><div class='del'>-		return excl &amp;&amp; (flags &amp; O_CREAT) ? -EEXIST : 0;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	BUG_ON(d != NULL);</div><div class='del'>-</div><div class='del'>-skip_lookup:</div><div class='ctx'> 	if (!(flags &amp; O_CREAT))</div><div class='ctx'> 		return -ENOENT;</div><div class='ctx'> </div><div class='hunk'>@@ -1363,7 +1466,7 @@ static int update_moved_ino(struct gfs2_inode *ip, struct gfs2_inode *ndip,</div><div class='ctx'> 	if (dir_rename)</div><div class='ctx'> 		return gfs2_dir_mvino(ip, &amp;gfs2_qdotdot, ndip, DT_DIR);</div><div class='ctx'> </div><div class='del'>-	ip-&gt;i_inode.i_ctime = current_time(&amp;ip-&gt;i_inode);</div><div class='add'>+	inode_set_ctime_current(&amp;ip-&gt;i_inode);</div><div class='ctx'> 	mark_inode_dirty_sync(&amp;ip-&gt;i_inode);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -1501,7 +1604,7 @@ static int gfs2_rename(struct inode *odir, struct dentry *odentry,</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='del'>-		error = gfs2_permission(&amp;init_user_ns, ndir,</div><div class='add'>+		error = gfs2_permission(&amp;nop_mnt_idmap, ndir,</div><div class='ctx'> 					MAY_WRITE | MAY_EXEC);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			goto out_gunlock;</div><div class='hunk'>@@ -1538,7 +1641,7 @@ static int gfs2_rename(struct inode *odir, struct dentry *odentry,</div><div class='ctx'> 	/* Check out the dir to be renamed */</div><div class='ctx'> </div><div class='ctx'> 	if (dir_rename) {</div><div class='del'>-		error = gfs2_permission(&amp;init_user_ns, d_inode(odentry),</div><div class='add'>+		error = gfs2_permission(&amp;nop_mnt_idmap, d_inode(odentry),</div><div class='ctx'> 					MAY_WRITE);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			goto out_gunlock;</div><div class='hunk'>@@ -1702,13 +1805,13 @@ static int gfs2_exchange(struct inode *odir, struct dentry *odentry,</div><div class='ctx'> 		goto out_gunlock;</div><div class='ctx'> </div><div class='ctx'> 	if (S_ISDIR(old_mode)) {</div><div class='del'>-		error = gfs2_permission(&amp;init_user_ns, odentry-&gt;d_inode,</div><div class='add'>+		error = gfs2_permission(&amp;nop_mnt_idmap, odentry-&gt;d_inode,</div><div class='ctx'> 					MAY_WRITE);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			goto out_gunlock;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (S_ISDIR(new_mode)) {</div><div class='del'>-		error = gfs2_permission(&amp;init_user_ns, ndentry-&gt;d_inode,</div><div class='add'>+		error = gfs2_permission(&amp;nop_mnt_idmap, ndentry-&gt;d_inode,</div><div class='ctx'> 					MAY_WRITE);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			goto out_gunlock;</div><div class='hunk'>@@ -1763,7 +1866,7 @@ out:</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int gfs2_rename2(struct user_namespace *mnt_userns, struct inode *odir,</div><div class='add'>+static int gfs2_rename2(struct mnt_idmap *idmap, struct inode *odir,</div><div class='ctx'> 			struct dentry *odentry, struct inode *ndir,</div><div class='ctx'> 			struct dentry *ndentry, unsigned int flags)</div><div class='ctx'> {</div><div class='hunk'>@@ -1838,7 +1941,7 @@ out:</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * gfs2_permission</div><div class='del'>- * @mnt_userns: User namespace of the mount the inode was found from</div><div class='add'>+ * @idmap: idmap of the mount the inode was found from</div><div class='ctx'>  * @inode: The inode</div><div class='ctx'>  * @mask: The mask to be tested</div><div class='ctx'>  *</div><div class='hunk'>@@ -1849,19 +1952,27 @@ out:</div><div class='ctx'>  * Returns: errno</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-int gfs2_permission(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='add'>+int gfs2_permission(struct mnt_idmap *idmap, struct inode *inode,</div><div class='ctx'> 		    int mask)</div><div class='ctx'> {</div><div class='add'>+	int may_not_block = mask &amp; MAY_NOT_BLOCK;</div><div class='ctx'> 	struct gfs2_inode *ip;</div><div class='ctx'> 	struct gfs2_holder i_gh;</div><div class='add'>+	struct gfs2_glock *gl;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='ctx'> 	gfs2_holder_mark_uninitialized(&amp;i_gh);</div><div class='ctx'> 	ip = GFS2_I(inode);</div><div class='del'>-	if (gfs2_glock_is_locked_by_me(ip-&gt;i_gl) == NULL) {</div><div class='del'>-		if (mask &amp; MAY_NOT_BLOCK)</div><div class='add'>+	gl = rcu_dereference_check(ip-&gt;i_gl, !may_not_block);</div><div class='add'>+	if (unlikely(!gl)) {</div><div class='add'>+		/* inode is getting torn down, must be RCU mode */</div><div class='add'>+		WARN_ON_ONCE(!may_not_block);</div><div class='add'>+		return -ECHILD;</div><div class='add'>+        }</div><div class='add'>+	if (gfs2_glock_is_locked_by_me(gl) == NULL) {</div><div class='add'>+		if (may_not_block)</div><div class='ctx'> 			return -ECHILD;</div><div class='del'>-		error = gfs2_glock_nq_init(ip-&gt;i_gl, LM_ST_SHARED, LM_FLAG_ANY, &amp;i_gh);</div><div class='add'>+		error = gfs2_glock_nq_init(gl, LM_ST_SHARED, LM_FLAG_ANY, &amp;i_gh);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			return error;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1869,7 +1980,7 @@ int gfs2_permission(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='ctx'> 	if ((mask &amp; MAY_WRITE) &amp;&amp; IS_IMMUTABLE(inode))</div><div class='ctx'> 		error = -EPERM;</div><div class='ctx'> 	else</div><div class='del'>-		error = generic_permission(&amp;init_user_ns, inode, mask);</div><div class='add'>+		error = generic_permission(&amp;nop_mnt_idmap, inode, mask);</div><div class='ctx'> 	if (gfs2_holder_initialized(&amp;i_gh))</div><div class='ctx'> 		gfs2_glock_dq_uninit(&amp;i_gh);</div><div class='ctx'> </div><div class='hunk'>@@ -1878,7 +1989,7 @@ int gfs2_permission(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> static int __gfs2_setattr_simple(struct inode *inode, struct iattr *attr)</div><div class='ctx'> {</div><div class='del'>-	setattr_copy(&amp;init_user_ns, inode, attr);</div><div class='add'>+	setattr_copy(&amp;nop_mnt_idmap, inode, attr);</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -1906,7 +2017,7 @@ static int setattr_chown(struct inode *inode, struct iattr *attr)</div><div class='ctx'> 	kuid_t ouid, nuid;</div><div class='ctx'> 	kgid_t ogid, ngid;</div><div class='ctx'> 	int error;</div><div class='del'>-	struct gfs2_alloc_parms ap;</div><div class='add'>+	struct gfs2_alloc_parms ap = {};</div><div class='ctx'> </div><div class='ctx'> 	ouid = inode-&gt;i_uid;</div><div class='ctx'> 	ogid = inode-&gt;i_gid;</div><div class='hunk'>@@ -1963,7 +2074,7 @@ out:</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * gfs2_setattr - Change attributes on an inode</div><div class='del'>- * @mnt_userns: User namespace of the mount the inode was found from</div><div class='add'>+ * @idmap: idmap of the mount the inode was found from</div><div class='ctx'>  * @dentry: The dentry which is changing</div><div class='ctx'>  * @attr: The structure describing the change</div><div class='ctx'>  *</div><div class='hunk'>@@ -1973,7 +2084,7 @@ out:</div><div class='ctx'>  * Returns: errno</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static int gfs2_setattr(struct user_namespace *mnt_userns,</div><div class='add'>+static int gfs2_setattr(struct mnt_idmap *idmap,</div><div class='ctx'> 			struct dentry *dentry, struct iattr *attr)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='hunk'>@@ -1989,11 +2100,11 @@ static int gfs2_setattr(struct user_namespace *mnt_userns,</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	error = may_setattr(&amp;init_user_ns, inode, attr-&gt;ia_valid);</div><div class='add'>+	error = may_setattr(&amp;nop_mnt_idmap, inode, attr-&gt;ia_valid);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto error;</div><div class='ctx'> </div><div class='del'>-	error = setattr_prepare(&amp;init_user_ns, dentry, attr);</div><div class='add'>+	error = setattr_prepare(&amp;nop_mnt_idmap, dentry, attr);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto error;</div><div class='ctx'> </div><div class='hunk'>@@ -2004,7 +2115,7 @@ static int gfs2_setattr(struct user_namespace *mnt_userns,</div><div class='ctx'> 	else {</div><div class='ctx'> 		error = gfs2_setattr_simple(inode, attr);</div><div class='ctx'> 		if (!error &amp;&amp; attr-&gt;ia_valid &amp; ATTR_MODE)</div><div class='del'>-			error = posix_acl_chmod(&amp;init_user_ns, inode,</div><div class='add'>+			error = posix_acl_chmod(&amp;nop_mnt_idmap, dentry,</div><div class='ctx'> 						inode-&gt;i_mode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -2019,7 +2130,7 @@ out:</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * gfs2_getattr - Read out an inode's attributes</div><div class='del'>- * @mnt_userns:	user namespace of the mount the inode was found from</div><div class='add'>+ * @idmap: idmap of the mount the inode was found from</div><div class='ctx'>  * @path: Object to query</div><div class='ctx'>  * @stat: The inode's stats</div><div class='ctx'>  * @request_mask: Mask of STATX_xxx flags indicating the caller's interests</div><div class='hunk'>@@ -2034,7 +2145,7 @@ out:</div><div class='ctx'>  * Returns: errno</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static int gfs2_getattr(struct user_namespace *mnt_userns,</div><div class='add'>+static int gfs2_getattr(struct mnt_idmap *idmap,</div><div class='ctx'> 			const struct path *path, struct kstat *stat,</div><div class='ctx'> 			u32 request_mask, unsigned int flags)</div><div class='ctx'> {</div><div class='hunk'>@@ -2063,7 +2174,7 @@ static int gfs2_getattr(struct user_namespace *mnt_userns,</div><div class='ctx'> 				  STATX_ATTR_IMMUTABLE |</div><div class='ctx'> 				  STATX_ATTR_NODUMP);</div><div class='ctx'> </div><div class='del'>-	generic_fillattr(&amp;init_user_ns, inode, stat);</div><div class='add'>+	generic_fillattr(&amp;nop_mnt_idmap, request_mask, inode, stat);</div><div class='ctx'> </div><div class='ctx'> 	if (gfs2_holder_initialized(&amp;gh))</div><div class='ctx'> 		gfs2_glock_dq_uninit(&amp;gh);</div><div class='hunk'>@@ -2131,8 +2242,7 @@ loff_t gfs2_seek_hole(struct file *file, loff_t offset)</div><div class='ctx'> 	return vfs_setpos(file, ret, inode-&gt;i_sb-&gt;s_maxbytes);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int gfs2_update_time(struct inode *inode, struct timespec64 *time,</div><div class='del'>-			    int flags)</div><div class='add'>+static int gfs2_update_time(struct inode *inode, int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_inode *ip = GFS2_I(inode);</div><div class='ctx'> 	struct gfs2_glock *gl = ip-&gt;i_gl;</div><div class='hunk'>@@ -2140,14 +2250,15 @@ static int gfs2_update_time(struct inode *inode, struct timespec64 *time,</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='ctx'> 	gh = gfs2_glock_is_locked_by_me(gl);</div><div class='del'>-	if (gh &amp;&amp; !gfs2_glock_is_held_excl(gl)) {</div><div class='add'>+	if (gh &amp;&amp; gl-&gt;gl_state != LM_ST_EXCLUSIVE) {</div><div class='ctx'> 		gfs2_glock_dq(gh);</div><div class='ctx'> 		gfs2_holder_reinit(LM_ST_EXCLUSIVE, 0, gh);</div><div class='ctx'> 		error = gfs2_glock_nq(gh);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			return error;</div><div class='ctx'> 	}</div><div class='del'>-	return generic_update_time(inode, time, flags);</div><div class='add'>+	generic_update_time(inode, flags);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct inode_operations gfs2_file_iops = {</div><div class='hunk'>@@ -2156,7 +2267,7 @@ static const struct inode_operations gfs2_file_iops = {</div><div class='ctx'> 	.getattr = gfs2_getattr,</div><div class='ctx'> 	.listxattr = gfs2_listxattr,</div><div class='ctx'> 	.fiemap = gfs2_fiemap,</div><div class='del'>-	.get_acl = gfs2_get_acl,</div><div class='add'>+	.get_inode_acl = gfs2_get_acl,</div><div class='ctx'> 	.set_acl = gfs2_set_acl,</div><div class='ctx'> 	.update_time = gfs2_update_time,</div><div class='ctx'> 	.fileattr_get = gfs2_fileattr_get,</div><div class='hunk'>@@ -2178,7 +2289,7 @@ static const struct inode_operations gfs2_dir_iops = {</div><div class='ctx'> 	.getattr = gfs2_getattr,</div><div class='ctx'> 	.listxattr = gfs2_listxattr,</div><div class='ctx'> 	.fiemap = gfs2_fiemap,</div><div class='del'>-	.get_acl = gfs2_get_acl,</div><div class='add'>+	.get_inode_acl = gfs2_get_acl,</div><div class='ctx'> 	.set_acl = gfs2_set_acl,</div><div class='ctx'> 	.update_time = gfs2_update_time,</div><div class='ctx'> 	.atomic_open = gfs2_atomic_open,</div><div class='head'>diff --git a/fs/gfs2/inode.h b/fs/gfs2/inode.h<br/>index 7b2c1f390db7..2fcd96dd1361 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/inode.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/inode.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/inode.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/inode.h</a></div><div class='hunk'>@@ -12,10 +12,10 @@</div><div class='ctx'> #include &lt;linux/mm.h&gt;</div><div class='ctx'> #include "util.h"</div><div class='ctx'> </div><div class='del'>-extern int gfs2_releasepage(struct page *page, gfp_t gfp_mask);</div><div class='del'>-extern int gfs2_internal_read(struct gfs2_inode *ip,</div><div class='del'>-			      char *buf, loff_t *pos, unsigned size);</div><div class='del'>-extern void gfs2_set_aops(struct inode *inode);</div><div class='add'>+bool gfs2_release_folio(struct folio *folio, gfp_t gfp_mask);</div><div class='add'>+ssize_t gfs2_internal_read(struct gfs2_inode *ip,</div><div class='add'>+			   char *buf, loff_t *pos, size_t size);</div><div class='add'>+void gfs2_set_aops(struct inode *inode);</div><div class='ctx'> </div><div class='ctx'> static inline int gfs2_is_stuffed(const struct gfs2_inode *ip)</div><div class='ctx'> {</div><div class='hunk'>@@ -44,19 +44,17 @@ static inline int gfs2_is_dir(const struct gfs2_inode *ip)</div><div class='ctx'> </div><div class='ctx'> static inline void gfs2_set_inode_blocks(struct inode *inode, u64 blocks)</div><div class='ctx'> {</div><div class='del'>-	inode-&gt;i_blocks = blocks &lt;&lt;</div><div class='del'>-		(GFS2_SB(inode)-&gt;sd_sb.sb_bsize_shift - GFS2_BASIC_BLOCK_SHIFT);</div><div class='add'>+	inode-&gt;i_blocks = blocks &lt;&lt; (inode-&gt;i_blkbits - SECTOR_SHIFT);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline u64 gfs2_get_inode_blocks(const struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	return inode-&gt;i_blocks &gt;&gt;</div><div class='del'>-		(GFS2_SB(inode)-&gt;sd_sb.sb_bsize_shift - GFS2_BASIC_BLOCK_SHIFT);</div><div class='add'>+	return inode-&gt;i_blocks &gt;&gt; (inode-&gt;i_blkbits - SECTOR_SHIFT);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void gfs2_add_inode_blocks(struct inode *inode, s64 change)</div><div class='ctx'> {</div><div class='del'>-	change &lt;&lt;= inode-&gt;i_blkbits - GFS2_BASIC_BLOCK_SHIFT;</div><div class='add'>+	change &lt;&lt;= inode-&gt;i_blkbits - SECTOR_SHIFT;</div><div class='ctx'> 	gfs2_assert(GFS2_SB(inode), (change &gt;= 0 || inode-&gt;i_blocks &gt;= -change));</div><div class='ctx'> 	inode-&gt;i_blocks += change;</div><div class='ctx'> }</div><div class='hunk'>@@ -88,33 +86,33 @@ err:</div><div class='ctx'> 	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-extern struct inode *gfs2_inode_lookup(struct super_block *sb, unsigned type, </div><div class='del'>-				       u64 no_addr, u64 no_formal_ino,</div><div class='del'>-				       unsigned int blktype);</div><div class='del'>-extern struct inode *gfs2_lookup_by_inum(struct gfs2_sbd *sdp, u64 no_addr,</div><div class='del'>-					 u64 no_formal_ino,</div><div class='del'>-					 unsigned int blktype);</div><div class='del'>-</div><div class='del'>-extern int gfs2_inode_refresh(struct gfs2_inode *ip);</div><div class='del'>-</div><div class='del'>-extern struct inode *gfs2_lookupi(struct inode *dir, const struct qstr *name,</div><div class='del'>-				  int is_root);</div><div class='del'>-extern int gfs2_permission(struct user_namespace *mnt_userns,</div><div class='del'>-			   struct inode *inode, int mask);</div><div class='del'>-extern struct inode *gfs2_lookup_simple(struct inode *dip, const char *name);</div><div class='del'>-extern void gfs2_dinode_out(const struct gfs2_inode *ip, void *buf);</div><div class='del'>-extern int gfs2_open_common(struct inode *inode, struct file *file);</div><div class='del'>-extern loff_t gfs2_seek_data(struct file *file, loff_t offset);</div><div class='del'>-extern loff_t gfs2_seek_hole(struct file *file, loff_t offset);</div><div class='add'>+void gfs2_setup_inode(struct inode *inode);</div><div class='add'>+struct inode *gfs2_inode_lookup(struct super_block *sb, unsigned type,</div><div class='add'>+			        u64 no_addr, u64 no_formal_ino,</div><div class='add'>+			        unsigned int blktype);</div><div class='add'>+struct inode *gfs2_lookup_by_inum(struct gfs2_sbd *sdp, u64 no_addr,</div><div class='add'>+				  u64 no_formal_ino,</div><div class='add'>+				  unsigned int blktype);</div><div class='add'>+int gfs2_dinode_dealloc(struct gfs2_inode *ip);</div><div class='add'>+</div><div class='add'>+struct inode *gfs2_lookupi(struct inode *dir, const struct qstr *name,</div><div class='add'>+			   int is_root);</div><div class='add'>+int gfs2_permission(struct mnt_idmap *idmap,</div><div class='add'>+		    struct inode *inode, int mask);</div><div class='add'>+struct inode *gfs2_lookup_meta(struct inode *dip, const char *name);</div><div class='add'>+void gfs2_dinode_out(const struct gfs2_inode *ip, void *buf);</div><div class='add'>+int gfs2_open_common(struct inode *inode, struct file *file);</div><div class='add'>+loff_t gfs2_seek_data(struct file *file, loff_t offset);</div><div class='add'>+loff_t gfs2_seek_hole(struct file *file, loff_t offset);</div><div class='ctx'> </div><div class='ctx'> extern const struct file_operations gfs2_file_fops_nolock;</div><div class='ctx'> extern const struct file_operations gfs2_dir_fops_nolock;</div><div class='ctx'> </div><div class='del'>-extern int gfs2_fileattr_get(struct dentry *dentry, struct fileattr *fa);</div><div class='del'>-extern int gfs2_fileattr_set(struct user_namespace *mnt_userns,</div><div class='del'>-			     struct dentry *dentry, struct fileattr *fa);</div><div class='del'>-extern void gfs2_set_inode_flags(struct inode *inode);</div><div class='del'>- </div><div class='add'>+int gfs2_fileattr_get(struct dentry *dentry, struct file_kattr *fa);</div><div class='add'>+int gfs2_fileattr_set(struct mnt_idmap *idmap,</div><div class='add'>+		      struct dentry *dentry, struct file_kattr *fa);</div><div class='add'>+void gfs2_set_inode_flags(struct inode *inode);</div><div class='add'>+</div><div class='ctx'> #ifdef CONFIG_GFS2_FS_LOCKING_DLM</div><div class='ctx'> extern const struct file_operations gfs2_file_fops;</div><div class='ctx'> extern const struct file_operations gfs2_dir_fops;</div><div class='head'>diff --git a/fs/gfs2/lock_dlm.c b/fs/gfs2/lock_dlm.c<br/>index 50578f881e6d..b8d249925395 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/lock_dlm.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/lock_dlm.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/lock_dlm.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/lock_dlm.c</a></div><div class='hunk'>@@ -15,9 +15,6 @@</div><div class='ctx'> #include &lt;linux/sched/signal.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "incore.h"</div><div class='del'>-#include "glock.h"</div><div class='del'>-#include "glops.h"</div><div class='del'>-#include "recovery.h"</div><div class='ctx'> #include "util.h"</div><div class='ctx'> #include "sys.h"</div><div class='ctx'> #include "trace_gfs2.h"</div><div class='hunk'>@@ -58,6 +55,7 @@ static inline void gfs2_update_stats(struct gfs2_lkstats *s, unsigned index,</div><div class='ctx'> /**</div><div class='ctx'>  * gfs2_update_reply_times - Update locking statistics</div><div class='ctx'>  * @gl: The glock to update</div><div class='add'>+ * @blocking: The operation may have been blocking</div><div class='ctx'>  *</div><div class='ctx'>  * This assumes that gl-&gt;gl_dstamp has been set earlier.</div><div class='ctx'>  *</div><div class='hunk'>@@ -72,12 +70,12 @@ static inline void gfs2_update_stats(struct gfs2_lkstats *s, unsigned index,</div><div class='ctx'>  * TRY_1CB flags are set are classified as non-blocking. All</div><div class='ctx'>  * other DLM requests are counted as (potentially) blocking.</div><div class='ctx'>  */</div><div class='del'>-static inline void gfs2_update_reply_times(struct gfs2_glock *gl)</div><div class='add'>+static inline void gfs2_update_reply_times(struct gfs2_glock *gl,</div><div class='add'>+					   bool blocking)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_pcpu_lkstats *lks;</div><div class='ctx'> 	const unsigned gltype = gl-&gt;gl_name.ln_type;</div><div class='del'>-	unsigned index = test_bit(GLF_BLOCKING, &amp;gl-&gt;gl_flags) ?</div><div class='del'>-			 GFS2_LKS_SRTTB : GFS2_LKS_SRTT;</div><div class='add'>+	unsigned index = blocking ? GFS2_LKS_SRTTB : GFS2_LKS_SRTT;</div><div class='ctx'> 	s64 rtt;</div><div class='ctx'> </div><div class='ctx'> 	preempt_disable();</div><div class='hunk'>@@ -119,9 +117,18 @@ static inline void gfs2_update_request_times(struct gfs2_glock *gl)</div><div class='ctx'> static void gdlm_ast(void *arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_glock *gl = arg;</div><div class='del'>-	unsigned ret = gl-&gt;gl_state;</div><div class='add'>+	bool blocking;</div><div class='add'>+	unsigned ret;</div><div class='add'>+</div><div class='add'>+	blocking = test_bit(GLF_BLOCKING, &amp;gl-&gt;gl_flags);</div><div class='add'>+	gfs2_update_reply_times(gl, blocking);</div><div class='add'>+	clear_bit(GLF_BLOCKING, &amp;gl-&gt;gl_flags);</div><div class='add'>+</div><div class='add'>+	/* If the glock is dead, we only react to a dlm_unlock() reply. */</div><div class='add'>+	if (__lockref_is_dead(&amp;gl-&gt;gl_lockref) &amp;&amp;</div><div class='add'>+	    gl-&gt;gl_lksb.sb_status != -DLM_EUNLOCK)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	gfs2_update_reply_times(gl);</div><div class='ctx'> 	BUG_ON(gl-&gt;gl_lksb.sb_flags &amp; DLM_SBF_DEMOTED);</div><div class='ctx'> </div><div class='ctx'> 	if ((gl-&gt;gl_lksb.sb_flags &amp; DLM_SBF_VALNOTVALID) &amp;&amp; gl-&gt;gl_lksb.sb_lvbptr)</div><div class='hunk'>@@ -129,18 +136,19 @@ static void gdlm_ast(void *arg)</div><div class='ctx'> </div><div class='ctx'> 	switch (gl-&gt;gl_lksb.sb_status) {</div><div class='ctx'> 	case -DLM_EUNLOCK: /* Unlocked, so glock can be freed */</div><div class='del'>-		if (gl-&gt;gl_ops-&gt;go_free)</div><div class='del'>-			gl-&gt;gl_ops-&gt;go_free(gl);</div><div class='ctx'> 		gfs2_glock_free(gl);</div><div class='ctx'> 		return;</div><div class='ctx'> 	case -DLM_ECANCEL: /* Cancel while getting lock */</div><div class='del'>-		ret |= LM_OUT_CANCELED;</div><div class='add'>+		ret = LM_OUT_CANCELED;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	case -EAGAIN: /* Try lock fails */</div><div class='add'>+		ret = LM_OUT_TRY_AGAIN;</div><div class='add'>+		goto out;</div><div class='ctx'> 	case -EDEADLK: /* Deadlock detected */</div><div class='add'>+		ret = LM_OUT_DEADLOCK;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	case -ETIMEDOUT: /* Canceled due to timeout */</div><div class='del'>-		ret |= LM_OUT_ERROR;</div><div class='add'>+		ret = LM_OUT_ERROR;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	case 0: /* Success */</div><div class='ctx'> 		break;</div><div class='hunk'>@@ -149,20 +157,22 @@ static void gdlm_ast(void *arg)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = gl-&gt;gl_req;</div><div class='del'>-	if (gl-&gt;gl_lksb.sb_flags &amp; DLM_SBF_ALTMODE) {</div><div class='del'>-		if (gl-&gt;gl_req == LM_ST_SHARED)</div><div class='del'>-			ret = LM_ST_DEFERRED;</div><div class='del'>-		else if (gl-&gt;gl_req == LM_ST_DEFERRED)</div><div class='del'>-			ret = LM_ST_SHARED;</div><div class='del'>-		else</div><div class='del'>-			BUG();</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	set_bit(GLF_INITIAL, &amp;gl-&gt;gl_flags);</div><div class='add'>+	/*</div><div class='add'>+	 * The GLF_INITIAL flag is initially set for new glocks.  Upon the</div><div class='add'>+	 * first successful new (non-conversion) request, we clear this flag to</div><div class='add'>+	 * indicate that a DLM lock exists and that gl-&gt;gl_lksb.sb_lkid is the</div><div class='add'>+	 * identifier to use for identifying it.</div><div class='add'>+	 *</div><div class='add'>+	 * Any failed initial requests do not create a DLM lock, so we ignore</div><div class='add'>+	 * the gl-&gt;gl_lksb.sb_lkid values that come with such requests.</div><div class='add'>+	 */</div><div class='add'>+</div><div class='add'>+	clear_bit(GLF_INITIAL, &amp;gl-&gt;gl_flags);</div><div class='ctx'> 	gfs2_glock_complete(gl, ret);</div><div class='ctx'> 	return;</div><div class='ctx'> out:</div><div class='del'>-	if (!test_bit(GLF_INITIAL, &amp;gl-&gt;gl_flags))</div><div class='add'>+	if (test_bit(GLF_INITIAL, &amp;gl-&gt;gl_flags))</div><div class='ctx'> 		gl-&gt;gl_lksb.sb_lkid = 0;</div><div class='ctx'> 	gfs2_glock_complete(gl, ret);</div><div class='ctx'> }</div><div class='hunk'>@@ -171,6 +181,9 @@ static void gdlm_bast(void *arg, int mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_glock *gl = arg;</div><div class='ctx'> </div><div class='add'>+	if (__lockref_is_dead(&amp;gl-&gt;gl_lockref))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='ctx'> 	switch (mode) {</div><div class='ctx'> 	case DLM_LOCK_EX:</div><div class='ctx'> 		gfs2_glock_cb(gl, LM_ST_UNLOCKED);</div><div class='hunk'>@@ -206,8 +219,21 @@ static int make_mode(struct gfs2_sbd *sdp, const unsigned int lmstate)</div><div class='ctx'> 	return -1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/* Taken from fs/dlm/lock.c. */</div><div class='add'>+</div><div class='add'>+static bool middle_conversion(int cur, int req)</div><div class='add'>+{</div><div class='add'>+	return (cur == DLM_LOCK_PR &amp;&amp; req == DLM_LOCK_CW) ||</div><div class='add'>+	       (cur == DLM_LOCK_CW &amp;&amp; req == DLM_LOCK_PR);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool down_conversion(int cur, int req)</div><div class='add'>+{</div><div class='add'>+	return !middle_conversion(cur, req) &amp;&amp; req &lt; cur;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static u32 make_flags(struct gfs2_glock *gl, const unsigned int gfs_flags,</div><div class='del'>-		      const int req)</div><div class='add'>+		      const int req, bool blocking)</div><div class='ctx'> {</div><div class='ctx'> 	u32 lkf = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -222,23 +248,16 @@ static u32 make_flags(struct gfs2_glock *gl, const unsigned int gfs_flags,</div><div class='ctx'> 		lkf |= DLM_LKF_NOQUEUEBAST;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (gfs_flags &amp; LM_FLAG_PRIORITY) {</div><div class='del'>-		lkf |= DLM_LKF_NOORDER;</div><div class='del'>-		lkf |= DLM_LKF_HEADQUE;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (gfs_flags &amp; LM_FLAG_ANY) {</div><div class='del'>-		if (req == DLM_LOCK_PR)</div><div class='del'>-			lkf |= DLM_LKF_ALTCW;</div><div class='del'>-		else if (req == DLM_LOCK_CW)</div><div class='del'>-			lkf |= DLM_LKF_ALTPR;</div><div class='del'>-		else</div><div class='del'>-			BUG();</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (gl-&gt;gl_lksb.sb_lkid != 0) {</div><div class='add'>+	if (!test_bit(GLF_INITIAL, &amp;gl-&gt;gl_flags)) {</div><div class='ctx'> 		lkf |= DLM_LKF_CONVERT;</div><div class='del'>-		if (test_bit(GLF_BLOCKING, &amp;gl-&gt;gl_flags))</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * The DLM_LKF_QUECVT flag needs to be set for "first come,</div><div class='add'>+		 * first served" semantics, but it must only be set for</div><div class='add'>+		 * "upward" lock conversions or else DLM will reject the</div><div class='add'>+		 * request as invalid.</div><div class='add'>+		 */</div><div class='add'>+		if (blocking)</div><div class='ctx'> 			lkf |= DLM_LKF_QUECVT;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -258,80 +277,123 @@ static int gdlm_lock(struct gfs2_glock *gl, unsigned int req_state,</div><div class='ctx'> 		     unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct lm_lockstruct *ls = &amp;gl-&gt;gl_name.ln_sbd-&gt;sd_lockstruct;</div><div class='del'>-	int req;</div><div class='add'>+	bool blocking;</div><div class='add'>+	int cur, req;</div><div class='ctx'> 	u32 lkf;</div><div class='ctx'> 	char strname[GDLM_STRNAME_BYTES] = "";</div><div class='add'>+	int error;</div><div class='ctx'> </div><div class='add'>+	gl-&gt;gl_req = req_state;</div><div class='add'>+	cur = make_mode(gl-&gt;gl_name.ln_sbd, gl-&gt;gl_state);</div><div class='ctx'> 	req = make_mode(gl-&gt;gl_name.ln_sbd, req_state);</div><div class='del'>-	lkf = make_flags(gl, flags, req);</div><div class='add'>+	blocking = !down_conversion(cur, req) &amp;&amp;</div><div class='add'>+		   !(flags &amp; (LM_FLAG_TRY|LM_FLAG_TRY_1CB));</div><div class='add'>+	lkf = make_flags(gl, flags, req, blocking);</div><div class='add'>+	if (blocking)</div><div class='add'>+		set_bit(GLF_BLOCKING, &amp;gl-&gt;gl_flags);</div><div class='ctx'> 	gfs2_glstats_inc(gl, GFS2_LKS_DCOUNT);</div><div class='ctx'> 	gfs2_sbstats_inc(gl, GFS2_LKS_DCOUNT);</div><div class='del'>-	if (gl-&gt;gl_lksb.sb_lkid) {</div><div class='del'>-		gfs2_update_request_times(gl);</div><div class='del'>-	} else {</div><div class='add'>+	if (test_bit(GLF_INITIAL, &amp;gl-&gt;gl_flags)) {</div><div class='ctx'> 		memset(strname, ' ', GDLM_STRNAME_BYTES - 1);</div><div class='ctx'> 		strname[GDLM_STRNAME_BYTES - 1] = '\0';</div><div class='ctx'> 		gfs2_reverse_hex(strname + 7, gl-&gt;gl_name.ln_type);</div><div class='ctx'> 		gfs2_reverse_hex(strname + 23, gl-&gt;gl_name.ln_number);</div><div class='ctx'> 		gl-&gt;gl_dstamp = ktime_get_real();</div><div class='add'>+	} else {</div><div class='add'>+		gfs2_update_request_times(gl);</div><div class='ctx'> 	}</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Submit the actual lock request.</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='del'>-	return dlm_lock(ls-&gt;ls_dlm, req, &amp;gl-&gt;gl_lksb, lkf, strname,</div><div class='del'>-			GDLM_STRNAME_BYTES - 1, 0, gdlm_ast, gl, gdlm_bast);</div><div class='add'>+again:</div><div class='add'>+	down_read(&amp;ls-&gt;ls_sem);</div><div class='add'>+	error = -ENODEV;</div><div class='add'>+	if (likely(ls-&gt;ls_dlm != NULL)) {</div><div class='add'>+		error = dlm_lock(ls-&gt;ls_dlm, req, &amp;gl-&gt;gl_lksb, lkf, strname,</div><div class='add'>+				GDLM_STRNAME_BYTES - 1, 0, gdlm_ast, gl, gdlm_bast);</div><div class='add'>+	}</div><div class='add'>+	up_read(&amp;ls-&gt;ls_sem);</div><div class='add'>+	if (error == -EBUSY) {</div><div class='add'>+		msleep(20);</div><div class='add'>+		goto again;</div><div class='add'>+	}</div><div class='add'>+	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void gdlm_put_lock(struct gfs2_glock *gl)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_sbd *sdp = gl-&gt;gl_name.ln_sbd;</div><div class='ctx'> 	struct lm_lockstruct *ls = &amp;sdp-&gt;sd_lockstruct;</div><div class='add'>+	uint32_t flags = 0;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	if (gl-&gt;gl_lksb.sb_lkid == 0) {</div><div class='add'>+	BUG_ON(!__lockref_is_dead(&amp;gl-&gt;gl_lockref));</div><div class='add'>+</div><div class='add'>+	if (test_bit(GLF_INITIAL, &amp;gl-&gt;gl_flags)) {</div><div class='ctx'> 		gfs2_glock_free(gl);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	clear_bit(GLF_BLOCKING, &amp;gl-&gt;gl_flags);</div><div class='ctx'> 	gfs2_glstats_inc(gl, GFS2_LKS_DCOUNT);</div><div class='ctx'> 	gfs2_sbstats_inc(gl, GFS2_LKS_DCOUNT);</div><div class='ctx'> 	gfs2_update_request_times(gl);</div><div class='ctx'> </div><div class='del'>-	/* don't want to call dlm if we've unmounted the lock protocol */</div><div class='del'>-	if (test_bit(DFL_UNMOUNT, &amp;ls-&gt;ls_recover_flags)) {</div><div class='del'>-		gfs2_glock_free(gl);</div><div class='add'>+	/*</div><div class='add'>+	 * When the lockspace is released, all remaining glocks will be</div><div class='add'>+	 * unlocked automatically.  This is more efficient than unlocking them</div><div class='add'>+	 * individually, but when the lock is held in DLM_LOCK_EX or</div><div class='add'>+	 * DLM_LOCK_PW mode, the lock value block (LVB) would be lost.</div><div class='add'>+	 */</div><div class='add'>+</div><div class='add'>+	if (test_bit(SDF_SKIP_DLM_UNLOCK, &amp;sdp-&gt;sd_flags) &amp;&amp;</div><div class='add'>+	    (!gl-&gt;gl_lksb.sb_lvbptr || gl-&gt;gl_state != LM_ST_EXCLUSIVE)) {</div><div class='add'>+		gfs2_glock_free_later(gl);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='del'>-	/* don't want to skip dlm_unlock writing the lvb when lock has one */</div><div class='ctx'> </div><div class='del'>-	if (test_bit(SDF_SKIP_DLM_UNLOCK, &amp;sdp-&gt;sd_flags) &amp;&amp;</div><div class='del'>-	    !gl-&gt;gl_lksb.sb_lvbptr) {</div><div class='add'>+	if (gl-&gt;gl_lksb.sb_lvbptr)</div><div class='add'>+		flags |= DLM_LKF_VALBLK;</div><div class='add'>+</div><div class='add'>+again:</div><div class='add'>+	down_read(&amp;ls-&gt;ls_sem);</div><div class='add'>+	error = -ENODEV;</div><div class='add'>+	if (likely(ls-&gt;ls_dlm != NULL)) {</div><div class='add'>+		error = dlm_unlock(ls-&gt;ls_dlm, gl-&gt;gl_lksb.sb_lkid, flags,</div><div class='add'>+				   NULL, gl);</div><div class='add'>+	}</div><div class='add'>+	up_read(&amp;ls-&gt;ls_sem);</div><div class='add'>+	if (error == -EBUSY) {</div><div class='add'>+		msleep(20);</div><div class='add'>+		goto again;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (error == -ENODEV) {</div><div class='ctx'> 		gfs2_glock_free(gl);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	error = dlm_unlock(ls-&gt;ls_dlm, gl-&gt;gl_lksb.sb_lkid, DLM_LKF_VALBLK,</div><div class='del'>-			   NULL, gl);</div><div class='ctx'> 	if (error) {</div><div class='ctx'> 		fs_err(sdp, "gdlm_unlock %x,%llx err=%d\n",</div><div class='ctx'> 		       gl-&gt;gl_name.ln_type,</div><div class='ctx'> 		       (unsigned long long)gl-&gt;gl_name.ln_number, error);</div><div class='del'>-		return;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void gdlm_cancel(struct gfs2_glock *gl)</div><div class='ctx'> {</div><div class='ctx'> 	struct lm_lockstruct *ls = &amp;gl-&gt;gl_name.ln_sbd-&gt;sd_lockstruct;</div><div class='del'>-	dlm_unlock(ls-&gt;ls_dlm, gl-&gt;gl_lksb.sb_lkid, DLM_LKF_CANCEL, NULL, gl);</div><div class='add'>+</div><div class='add'>+	down_read(&amp;ls-&gt;ls_sem);</div><div class='add'>+	if (likely(ls-&gt;ls_dlm != NULL)) {</div><div class='add'>+		dlm_unlock(ls-&gt;ls_dlm, gl-&gt;gl_lksb.sb_lkid, DLM_LKF_CANCEL, NULL, gl);</div><div class='add'>+	}</div><div class='add'>+	up_read(&amp;ls-&gt;ls_sem);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * dlm/gfs2 recovery coordination using dlm_recover callbacks</div><div class='ctx'>  *</div><div class='del'>- *  0. gfs2 checks for another cluster node withdraw, needing journal replay</div><div class='ctx'>  *  1. dlm_controld sees lockspace members change</div><div class='ctx'>  *  2. dlm_controld blocks dlm-kernel locking activity</div><div class='ctx'>  *  3. dlm_controld within dlm-kernel notifies gfs2 (recover_prep)</div><div class='hunk'>@@ -506,7 +568,11 @@ static int sync_unlock(struct gfs2_sbd *sdp, struct dlm_lksb *lksb, char *name)</div><div class='ctx'> 	struct lm_lockstruct *ls = &amp;sdp-&gt;sd_lockstruct;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	error = dlm_unlock(ls-&gt;ls_dlm, lksb-&gt;sb_lkid, 0, lksb, ls);</div><div class='add'>+	down_read(&amp;ls-&gt;ls_sem);</div><div class='add'>+	error = -ENODEV;</div><div class='add'>+	if (likely(ls-&gt;ls_dlm != NULL))</div><div class='add'>+		error = dlm_unlock(ls-&gt;ls_dlm, lksb-&gt;sb_lkid, 0, lksb, ls);</div><div class='add'>+	up_read(&amp;ls-&gt;ls_sem);</div><div class='ctx'> 	if (error) {</div><div class='ctx'> 		fs_err(sdp, "%s lkid %x error %d\n",</div><div class='ctx'> 		       name, lksb-&gt;sb_lkid, error);</div><div class='hunk'>@@ -533,9 +599,14 @@ static int sync_lock(struct gfs2_sbd *sdp, int mode, uint32_t flags,</div><div class='ctx'> 	memset(strname, 0, GDLM_STRNAME_BYTES);</div><div class='ctx'> 	snprintf(strname, GDLM_STRNAME_BYTES, "%8x%16x", LM_TYPE_NONDISK, num);</div><div class='ctx'> </div><div class='del'>-	error = dlm_lock(ls-&gt;ls_dlm, mode, lksb, flags,</div><div class='del'>-			 strname, GDLM_STRNAME_BYTES - 1,</div><div class='del'>-			 0, sync_wait_cb, ls, NULL);</div><div class='add'>+	down_read(&amp;ls-&gt;ls_sem);</div><div class='add'>+	error = -ENODEV;</div><div class='add'>+	if (likely(ls-&gt;ls_dlm != NULL)) {</div><div class='add'>+		error = dlm_lock(ls-&gt;ls_dlm, mode, lksb, flags,</div><div class='add'>+				 strname, GDLM_STRNAME_BYTES - 1,</div><div class='add'>+				 0, sync_wait_cb, ls, NULL);</div><div class='add'>+	}</div><div class='add'>+	up_read(&amp;ls-&gt;ls_sem);</div><div class='ctx'> 	if (error) {</div><div class='ctx'> 		fs_err(sdp, "%s lkid %x flags %x mode %d error %d\n",</div><div class='ctx'> 		       name, lksb-&gt;sb_lkid, flags, mode, error);</div><div class='hunk'>@@ -580,28 +651,6 @@ static int control_lock(struct gfs2_sbd *sdp, int mode, uint32_t flags)</div><div class='ctx'> 			 &amp;ls-&gt;ls_control_lksb, "control_lock");</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * remote_withdraw - react to a node withdrawing from the file system</div><div class='del'>- * @sdp: The superblock</div><div class='del'>- */</div><div class='del'>-static void remote_withdraw(struct gfs2_sbd *sdp)</div><div class='del'>-{</div><div class='del'>-	struct gfs2_jdesc *jd;</div><div class='del'>-	int ret = 0, count = 0;</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(jd, &amp;sdp-&gt;sd_jindex_list, jd_list) {</div><div class='del'>-		if (jd-&gt;jd_jid == sdp-&gt;sd_lockstruct.ls_jid)</div><div class='del'>-			continue;</div><div class='del'>-		ret = gfs2_recover_journal(jd, true);</div><div class='del'>-		if (ret)</div><div class='del'>-			break;</div><div class='del'>-		count++;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Now drop the additional reference we acquired */</div><div class='del'>-	fs_err(sdp, "Journals checked: %d, ret = %d.\n", count, ret);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static void gfs2_control_func(struct work_struct *work)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_sbd *sdp = container_of(work, struct gfs2_sbd, sd_control_work.work);</div><div class='hunk'>@@ -612,13 +661,6 @@ static void gfs2_control_func(struct work_struct *work)</div><div class='ctx'> 	int recover_size;</div><div class='ctx'> 	int i, error;</div><div class='ctx'> </div><div class='del'>-	/* First check for other nodes that may have done a withdraw. */</div><div class='del'>-	if (test_bit(SDF_REMOTE_WITHDRAW, &amp;sdp-&gt;sd_flags)) {</div><div class='del'>-		remote_withdraw(sdp);</div><div class='del'>-		clear_bit(SDF_REMOTE_WITHDRAW, &amp;sdp-&gt;sd_flags);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	spin_lock(&amp;ls-&gt;ls_recover_spin);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * No MOUNT_DONE means we're still mounting; control_mount()</div><div class='hunk'>@@ -942,14 +984,15 @@ locks_done:</div><div class='ctx'> 		if (sdp-&gt;sd_args.ar_spectator) {</div><div class='ctx'> 			fs_info(sdp, "Recovery is required. Waiting for a "</div><div class='ctx'> 				"non-spectator to mount.\n");</div><div class='add'>+			spin_unlock(&amp;ls-&gt;ls_recover_spin);</div><div class='ctx'> 			msleep_interruptible(1000);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			fs_info(sdp, "control_mount wait1 block %u start %u "</div><div class='ctx'> 				"mount %u lvb %u flags %lx\n", block_gen,</div><div class='ctx'> 				start_gen, mount_gen, lvb_gen,</div><div class='ctx'> 				ls-&gt;ls_recover_flags);</div><div class='add'>+			spin_unlock(&amp;ls-&gt;ls_recover_spin);</div><div class='ctx'> 		}</div><div class='del'>-		spin_unlock(&amp;ls-&gt;ls_recover_spin);</div><div class='ctx'> 		goto restart;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1045,7 +1088,7 @@ restart:</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Expand static jid arrays if necessary (by increments of RECOVER_SIZE_INC)</div><div class='del'>- * to accomodate the largest slot number.  (NB dlm slot numbers start at 1,</div><div class='add'>+ * to accommodate the largest slot number.  (NB dlm slot numbers start at 1,</div><div class='ctx'>  * gfs2 jids start at 0, so jid = slot - 1)</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='hunk'>@@ -1261,6 +1304,7 @@ static int gdlm_mount(struct gfs2_sbd *sdp, const char *table)</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='ctx'> 	INIT_DELAYED_WORK(&amp;sdp-&gt;sd_control_work, gfs2_control_func);</div><div class='add'>+	ls-&gt;ls_dlm = NULL;</div><div class='ctx'> 	spin_lock_init(&amp;ls-&gt;ls_recover_spin);</div><div class='ctx'> 	ls-&gt;ls_recover_flags = 0;</div><div class='ctx'> 	ls-&gt;ls_recover_mount = 0;</div><div class='hunk'>@@ -1289,12 +1333,13 @@ static int gdlm_mount(struct gfs2_sbd *sdp, const char *table)</div><div class='ctx'> 	memcpy(cluster, table, strlen(table) - strlen(fsname));</div><div class='ctx'> 	fsname++;</div><div class='ctx'> </div><div class='del'>-	flags = DLM_LSFL_FS | DLM_LSFL_NEWEXCL;</div><div class='add'>+	flags = DLM_LSFL_NEWEXCL;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * create/join lockspace</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='add'>+	init_rwsem(&amp;ls-&gt;ls_sem);</div><div class='ctx'> 	error = dlm_new_lockspace(fsname, cluster, flags, GDLM_LVB_SIZE,</div><div class='ctx'> 				  &amp;gdlm_lockspace_ops, sdp, &amp;ops_result,</div><div class='ctx'> 				  &amp;ls-&gt;ls_dlm);</div><div class='hunk'>@@ -1338,7 +1383,7 @@ static int gdlm_mount(struct gfs2_sbd *sdp, const char *table)</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> fail_release:</div><div class='del'>-	dlm_release_lockspace(ls-&gt;ls_dlm, 2);</div><div class='add'>+	dlm_release_lockspace(ls-&gt;ls_dlm, DLM_RELEASE_NORMAL);</div><div class='ctx'> fail_free:</div><div class='ctx'> 	free_recover_size(ls);</div><div class='ctx'> fail:</div><div class='hunk'>@@ -1358,7 +1403,15 @@ static void gdlm_first_done(struct gfs2_sbd *sdp)</div><div class='ctx'> 		fs_err(sdp, "mount first_done error %d\n", error);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void gdlm_unmount(struct gfs2_sbd *sdp)</div><div class='add'>+/*</div><div class='add'>+ * gdlm_unmount - release our lockspace</div><div class='add'>+ * @sdp: the superblock</div><div class='add'>+ * @clean: Indicates whether or not the remaining nodes in the cluster should</div><div class='add'>+ *	   perform recovery.  Recovery is necessary when a node withdraws and</div><div class='add'>+ *	   its journal remains dirty.  Recovery isn't necessary when a node</div><div class='add'>+ *	   cleanly unmounts a filesystem.</div><div class='add'>+ */</div><div class='add'>+static void gdlm_unmount(struct gfs2_sbd *sdp, bool clean)</div><div class='ctx'> {</div><div class='ctx'> 	struct lm_lockstruct *ls = &amp;sdp-&gt;sd_lockstruct;</div><div class='ctx'> </div><div class='hunk'>@@ -1374,10 +1427,14 @@ static void gdlm_unmount(struct gfs2_sbd *sdp)</div><div class='ctx'> </div><div class='ctx'> 	/* mounted_lock and control_lock will be purged in dlm recovery */</div><div class='ctx'> release:</div><div class='add'>+	down_write(&amp;ls-&gt;ls_sem);</div><div class='ctx'> 	if (ls-&gt;ls_dlm) {</div><div class='del'>-		dlm_release_lockspace(ls-&gt;ls_dlm, 2);</div><div class='add'>+		dlm_release_lockspace(ls-&gt;ls_dlm,</div><div class='add'>+				      clean ? DLM_RELEASE_NORMAL :</div><div class='add'>+					      DLM_RELEASE_RECOVER);</div><div class='ctx'> 		ls-&gt;ls_dlm = NULL;</div><div class='ctx'> 	}</div><div class='add'>+	up_write(&amp;ls-&gt;ls_sem);</div><div class='ctx'> </div><div class='ctx'> 	free_recover_size(ls);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/gfs2/log.c b/fs/gfs2/log.c<br/>index f0ee3ff6f9a8..8312cd2cdae4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/log.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/log.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/log.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/log.c</a></div><div class='hunk'>@@ -31,6 +31,7 @@</div><div class='ctx'> #include "dir.h"</div><div class='ctx'> #include "trace_gfs2.h"</div><div class='ctx'> #include "trans.h"</div><div class='add'>+#include "aops.h"</div><div class='ctx'> </div><div class='ctx'> static void gfs2_log_shutdown(struct gfs2_sbd *sdp);</div><div class='ctx'> </div><div class='hunk'>@@ -111,10 +112,8 @@ __acquires(&amp;sdp-&gt;sd_ail_lock)</div><div class='ctx'> 					  &amp;tr-&gt;tr_ail2_list);</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='del'>-			if (!cmpxchg(&amp;sdp-&gt;sd_log_error, 0, -EIO)) {</div><div class='add'>+			if (!cmpxchg(&amp;sdp-&gt;sd_log_error, 0, -EIO))</div><div class='ctx'> 				gfs2_io_error_bh(sdp, bh);</div><div class='del'>-				gfs2_withdraw_delayed(sdp);</div><div class='del'>-			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (gfs2_withdrawn(sdp)) {</div><div class='hunk'>@@ -127,11 +126,15 @@ __acquires(&amp;sdp-&gt;sd_ail_lock)</div><div class='ctx'> 			continue;</div><div class='ctx'> 		gl = bd-&gt;bd_gl;</div><div class='ctx'> 		list_move(&amp;bd-&gt;bd_ail_st_list, &amp;tr-&gt;tr_ail1_list);</div><div class='del'>-		mapping = bh-&gt;b_page-&gt;mapping;</div><div class='add'>+		mapping = bh-&gt;b_folio-&gt;mapping;</div><div class='ctx'> 		if (!mapping)</div><div class='ctx'> 			continue;</div><div class='ctx'> 		spin_unlock(&amp;sdp-&gt;sd_ail_lock);</div><div class='del'>-		ret = generic_writepages(mapping, wbc);</div><div class='add'>+		BUG_ON(GFS2_SB(mapping-&gt;host) != sdp);</div><div class='add'>+		if (gfs2_is_jdata(GFS2_I(mapping-&gt;host)))</div><div class='add'>+			ret = gfs2_jdata_writeback(mapping, wbc);</div><div class='add'>+		else</div><div class='add'>+			ret = mapping-&gt;a_ops-&gt;writepages(mapping, wbc);</div><div class='ctx'> 		if (need_resched()) {</div><div class='ctx'> 			blk_finish_plug(plug);</div><div class='ctx'> 			cond_resched();</div><div class='hunk'>@@ -140,6 +143,7 @@ __acquires(&amp;sdp-&gt;sd_ail_lock)</div><div class='ctx'> 		spin_lock(&amp;sdp-&gt;sd_ail_lock);</div><div class='ctx'> 		if (ret == -ENODATA) /* if a jdata write into a new hole */</div><div class='ctx'> 			ret = 0; /* ignore it */</div><div class='add'>+		mapping_set_error(mapping, ret);</div><div class='ctx'> 		if (ret || wbc-&gt;nr_to_write &lt;= 0)</div><div class='ctx'> 			break;</div><div class='ctx'> 		return -EBUSY;</div><div class='hunk'>@@ -222,8 +226,7 @@ out:</div><div class='ctx'> 	spin_unlock(&amp;sdp-&gt;sd_ail_lock);</div><div class='ctx'> 	blk_finish_plug(&amp;plug);</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		gfs2_lm(sdp, "gfs2_ail1_start_one (generic_writepages) "</div><div class='del'>-			"returned: %d\n", ret);</div><div class='add'>+		gfs2_lm(sdp, "gfs2_ail1_start_one returned: %d\n", ret);</div><div class='ctx'> 		gfs2_withdraw(sdp);</div><div class='ctx'> 	}</div><div class='ctx'> 	trace_gfs2_ail_flush(sdp, wbc, 0);</div><div class='hunk'>@@ -319,10 +322,8 @@ static int gfs2_ail1_empty_one(struct gfs2_sbd *sdp, struct gfs2_trans *tr,</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (!buffer_uptodate(bh) &amp;&amp;</div><div class='del'>-		    !cmpxchg(&amp;sdp-&gt;sd_log_error, 0, -EIO)) {</div><div class='add'>+		    !cmpxchg(&amp;sdp-&gt;sd_log_error, 0, -EIO))</div><div class='ctx'> 			gfs2_io_error_bh(sdp, bh);</div><div class='del'>-			gfs2_withdraw_delayed(sdp);</div><div class='del'>-		}</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * If we have space for revokes and the bd is no longer on any</div><div class='ctx'> 		 * buf list, we can just add a revoke for it immediately and</div><div class='hunk'>@@ -344,14 +345,15 @@ static int gfs2_ail1_empty_one(struct gfs2_sbd *sdp, struct gfs2_trans *tr,</div><div class='ctx'>  * @sdp: The superblock</div><div class='ctx'>  * @max_revokes: If non-zero, add revokes where appropriate</div><div class='ctx'>  *</div><div class='del'>- * Tries to empty the ail1 lists, starting with the oldest first</div><div class='add'>+ * Tries to empty the ail1 lists, starting with the oldest first.</div><div class='add'>+ * Returns %true if the ail1 list is now empty.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static int gfs2_ail1_empty(struct gfs2_sbd *sdp, int max_revokes)</div><div class='add'>+static bool gfs2_ail1_empty(struct gfs2_sbd *sdp, int max_revokes)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_trans *tr, *s;</div><div class='ctx'> 	int oldest_tr = 1;</div><div class='del'>-	int ret;</div><div class='add'>+	bool empty;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;sdp-&gt;sd_ail_lock);</div><div class='ctx'> 	list_for_each_entry_safe_reverse(tr, s, &amp;sdp-&gt;sd_ail1_list, tr_list) {</div><div class='hunk'>@@ -361,15 +363,10 @@ static int gfs2_ail1_empty(struct gfs2_sbd *sdp, int max_revokes)</div><div class='ctx'> 			oldest_tr = 0;</div><div class='ctx'> 	}</div><div class='ctx'> 	gfs2_log_update_flush_tail(sdp);</div><div class='del'>-	ret = list_empty(&amp;sdp-&gt;sd_ail1_list);</div><div class='add'>+	empty = list_empty(&amp;sdp-&gt;sd_ail1_list);</div><div class='ctx'> 	spin_unlock(&amp;sdp-&gt;sd_ail_lock);</div><div class='ctx'> </div><div class='del'>-	if (test_bit(SDF_WITHDRAWING, &amp;sdp-&gt;sd_flags)) {</div><div class='del'>-		gfs2_lm(sdp, "fatal: I/O error(s)\n");</div><div class='del'>-		gfs2_withdraw(sdp);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='add'>+	return empty;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void gfs2_ail1_wait(struct gfs2_sbd *sdp)</div><div class='hunk'>@@ -782,7 +779,7 @@ void gfs2_glock_remove_revoke(struct gfs2_glock *gl)</div><div class='ctx'> {</div><div class='ctx'> 	if (atomic_dec_return(&amp;gl-&gt;gl_revokes) == 0) {</div><div class='ctx'> 		clear_bit(GLF_LFLUSH, &amp;gl-&gt;gl_flags);</div><div class='del'>-		gfs2_glock_queue_put(gl);</div><div class='add'>+		gfs2_glock_put_async(gl);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -823,7 +820,7 @@ void gfs2_flush_revokes(struct gfs2_sbd *sdp)</div><div class='ctx'> </div><div class='ctx'> void gfs2_write_log_header(struct gfs2_sbd *sdp, struct gfs2_jdesc *jd,</div><div class='ctx'> 			   u64 seq, u32 tail, u32 lblock, u32 flags,</div><div class='del'>-			   int op_flags)</div><div class='add'>+			   blk_opf_t op_flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_log_header *lh;</div><div class='ctx'> 	u32 hash, crc;</div><div class='hunk'>@@ -905,10 +902,10 @@ void gfs2_write_log_header(struct gfs2_sbd *sdp, struct gfs2_jdesc *jd,</div><div class='ctx'> </div><div class='ctx'> static void log_write_header(struct gfs2_sbd *sdp, u32 flags)</div><div class='ctx'> {</div><div class='del'>-	int op_flags = REQ_PREFLUSH | REQ_FUA | REQ_META | REQ_SYNC;</div><div class='del'>-	enum gfs2_freeze_state state = atomic_read(&amp;sdp-&gt;sd_freeze_state);</div><div class='add'>+	blk_opf_t op_flags = REQ_PREFLUSH | REQ_FUA | REQ_META | REQ_SYNC;</div><div class='add'>+	struct super_block *sb = sdp-&gt;sd_vfs;</div><div class='ctx'> </div><div class='del'>-	gfs2_assert_withdraw(sdp, (state != SFS_FROZEN));</div><div class='add'>+	gfs2_assert_withdraw(sdp, sb-&gt;s_writers.frozen != SB_FREEZE_COMPLETE);</div><div class='ctx'> </div><div class='ctx'> 	if (test_bit(SDF_NOBARRIERS, &amp;sdp-&gt;sd_flags)) {</div><div class='ctx'> 		gfs2_ordered_wait(sdp);</div><div class='hunk'>@@ -967,8 +964,9 @@ void gfs2_ail_drain(struct gfs2_sbd *sdp)</div><div class='ctx'> static void empty_ail1_list(struct gfs2_sbd *sdp)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned long start = jiffies;</div><div class='add'>+	bool empty = false;</div><div class='ctx'> </div><div class='del'>-	for (;;) {</div><div class='add'>+	while (!empty) {</div><div class='ctx'> 		if (time_after(jiffies, start + (HZ * 600))) {</div><div class='ctx'> 			fs_err(sdp, "Error: In %s for 10 minutes! t=%d\n",</div><div class='ctx'> 			       __func__, current-&gt;journal_info ? 1 : 0);</div><div class='hunk'>@@ -977,8 +975,10 @@ static void empty_ail1_list(struct gfs2_sbd *sdp)</div><div class='ctx'> 		}</div><div class='ctx'> 		gfs2_ail1_start(sdp);</div><div class='ctx'> 		gfs2_ail1_wait(sdp);</div><div class='del'>-		if (gfs2_ail1_empty(sdp, 0))</div><div class='del'>-			return;</div><div class='add'>+		empty = gfs2_ail1_empty(sdp, 0);</div><div class='add'>+</div><div class='add'>+		if (gfs2_withdrawn(sdp))</div><div class='add'>+			break;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1028,7 +1028,7 @@ void gfs2_log_flush(struct gfs2_sbd *sdp, struct gfs2_glock *gl, u32 flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_trans *tr = NULL;</div><div class='ctx'> 	unsigned int reserved_blocks = 0, used_blocks = 0;</div><div class='del'>-	enum gfs2_freeze_state state = atomic_read(&amp;sdp-&gt;sd_freeze_state);</div><div class='add'>+	bool frozen = test_bit(SDF_FROZEN, &amp;sdp-&gt;sd_flags);</div><div class='ctx'> 	unsigned int first_log_head;</div><div class='ctx'> 	unsigned int reserved_revokes = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -1040,7 +1040,8 @@ repeat:</div><div class='ctx'> 	 * Do this check while holding the log_flush_lock to prevent new</div><div class='ctx'> 	 * buffers from being added to the ail via gfs2_pin()</div><div class='ctx'> 	 */</div><div class='del'>-	if (gfs2_withdrawn(sdp) || !test_bit(SDF_JOURNAL_LIVE, &amp;sdp-&gt;sd_flags))</div><div class='add'>+	if (gfs2_withdrawn(sdp) ||</div><div class='add'>+	    !test_bit(SDF_JOURNAL_LIVE, &amp;sdp-&gt;sd_flags))</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	/* Log might have been flushed while we waited for the flush lock */</div><div class='hunk'>@@ -1059,8 +1060,8 @@ repeat:</div><div class='ctx'> 		if (tr) {</div><div class='ctx'> 			sdp-&gt;sd_log_tr = NULL;</div><div class='ctx'> 			tr-&gt;tr_first = first_log_head;</div><div class='del'>-			if (unlikely (state == SFS_FROZEN)) {</div><div class='del'>-				if (gfs2_assert_withdraw_delayed(sdp,</div><div class='add'>+			if (unlikely(frozen)) {</div><div class='add'>+				if (gfs2_assert_withdraw(sdp,</div><div class='ctx'> 				       !tr-&gt;tr_num_buf_new &amp;&amp; !tr-&gt;tr_num_databuf_new))</div><div class='ctx'> 					goto out_withdraw;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -1084,8 +1085,8 @@ repeat:</div><div class='ctx'> 	if (flags &amp; GFS2_LOG_HEAD_FLUSH_SHUTDOWN)</div><div class='ctx'> 		clear_bit(SDF_JOURNAL_LIVE, &amp;sdp-&gt;sd_flags);</div><div class='ctx'> </div><div class='del'>-	if (unlikely(state == SFS_FROZEN))</div><div class='del'>-		if (gfs2_assert_withdraw_delayed(sdp, !reserved_revokes))</div><div class='add'>+	if (unlikely(frozen))</div><div class='add'>+		if (gfs2_assert_withdraw(sdp, !reserved_revokes))</div><div class='ctx'> 			goto out_withdraw;</div><div class='ctx'> </div><div class='ctx'> 	gfs2_ordered_write(sdp);</div><div class='hunk'>@@ -1094,7 +1095,8 @@ repeat:</div><div class='ctx'> 	lops_before_commit(sdp, tr);</div><div class='ctx'> 	if (gfs2_withdrawn(sdp))</div><div class='ctx'> 		goto out_withdraw;</div><div class='del'>-	gfs2_log_submit_bio(&amp;sdp-&gt;sd_jdesc-&gt;jd_log_bio, REQ_OP_WRITE);</div><div class='add'>+	if (sdp-&gt;sd_jdesc)</div><div class='add'>+		gfs2_log_submit_bio(&amp;sdp-&gt;sd_jdesc-&gt;jd_log_bio, REQ_OP_WRITE);</div><div class='ctx'> 	if (gfs2_withdrawn(sdp))</div><div class='ctx'> 		goto out_withdraw;</div><div class='ctx'> </div><div class='hunk'>@@ -1128,8 +1130,6 @@ repeat:</div><div class='ctx'> 		if (flags &amp; (GFS2_LOG_HEAD_FLUSH_SHUTDOWN |</div><div class='ctx'> 			     GFS2_LOG_HEAD_FLUSH_FREEZE))</div><div class='ctx'> 			gfs2_log_shutdown(sdp);</div><div class='del'>-		if (flags &amp; GFS2_LOG_HEAD_FLUSH_FREEZE)</div><div class='del'>-			atomic_set(&amp;sdp-&gt;sd_freeze_state, SFS_FROZEN);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> out_end:</div><div class='hunk'>@@ -1141,13 +1141,11 @@ out_end:</div><div class='ctx'> 		reserved_blocks += (reserved_revokes - sdp-&gt;sd_ldptrs) / sdp-&gt;sd_inptrs;</div><div class='ctx'> out:</div><div class='ctx'> 	if (used_blocks != reserved_blocks) {</div><div class='del'>-		gfs2_assert_withdraw_delayed(sdp, used_blocks &lt; reserved_blocks);</div><div class='add'>+		gfs2_assert_withdraw(sdp, used_blocks &lt; reserved_blocks);</div><div class='ctx'> 		gfs2_log_release(sdp, reserved_blocks - used_blocks);</div><div class='ctx'> 	}</div><div class='ctx'> 	up_write(&amp;sdp-&gt;sd_log_flush_lock);</div><div class='ctx'> 	gfs2_trans_free(sdp, tr);</div><div class='del'>-	if (gfs2_withdrawing(sdp))</div><div class='del'>-		gfs2_withdraw(sdp);</div><div class='ctx'> 	trace_gfs2_log_flush(sdp, 0, flags);</div><div class='ctx'> 	return;</div><div class='ctx'> </div><div class='hunk'>@@ -1222,6 +1220,21 @@ static void log_refund(struct gfs2_sbd *sdp, struct gfs2_trans *tr)</div><div class='ctx'> 	gfs2_log_unlock(sdp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline int gfs2_jrnl_flush_reqd(struct gfs2_sbd *sdp)</div><div class='add'>+{</div><div class='add'>+	return atomic_read(&amp;sdp-&gt;sd_log_pinned) +</div><div class='add'>+	       atomic_read(&amp;sdp-&gt;sd_log_blks_needed) &gt;=</div><div class='add'>+	       atomic_read(&amp;sdp-&gt;sd_log_thresh1);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int gfs2_ail_flush_reqd(struct gfs2_sbd *sdp)</div><div class='add'>+{</div><div class='add'>+	return sdp-&gt;sd_jdesc-&gt;jd_blocks -</div><div class='add'>+	       atomic_read(&amp;sdp-&gt;sd_log_blks_free) +</div><div class='add'>+	       atomic_read(&amp;sdp-&gt;sd_log_blks_needed) &gt;=</div><div class='add'>+	       atomic_read(&amp;sdp-&gt;sd_log_thresh2);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /**</div><div class='ctx'>  * gfs2_log_commit - Commit a transaction to the log</div><div class='ctx'>  * @sdp: the filesystem</div><div class='hunk'>@@ -1241,9 +1254,7 @@ void gfs2_log_commit(struct gfs2_sbd *sdp, struct gfs2_trans *tr)</div><div class='ctx'> {</div><div class='ctx'> 	log_refund(sdp, tr);</div><div class='ctx'> </div><div class='del'>-	if (atomic_read(&amp;sdp-&gt;sd_log_pinned) &gt; atomic_read(&amp;sdp-&gt;sd_log_thresh1) ||</div><div class='del'>-	    ((sdp-&gt;sd_jdesc-&gt;jd_blocks - atomic_read(&amp;sdp-&gt;sd_log_blks_free)) &gt;</div><div class='del'>-	    atomic_read(&amp;sdp-&gt;sd_log_thresh2)))</div><div class='add'>+	if (gfs2_ail_flush_reqd(sdp) || gfs2_jrnl_flush_reqd(sdp))</div><div class='ctx'> 		wake_up(&amp;sdp-&gt;sd_logd_waitq);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1266,24 +1277,6 @@ static void gfs2_log_shutdown(struct gfs2_sbd *sdp)</div><div class='ctx'> 	gfs2_assert_warn(sdp, list_empty(&amp;sdp-&gt;sd_ail2_list));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int gfs2_jrnl_flush_reqd(struct gfs2_sbd *sdp)</div><div class='del'>-{</div><div class='del'>-	return (atomic_read(&amp;sdp-&gt;sd_log_pinned) +</div><div class='del'>-		atomic_read(&amp;sdp-&gt;sd_log_blks_needed) &gt;=</div><div class='del'>-		atomic_read(&amp;sdp-&gt;sd_log_thresh1));</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline int gfs2_ail_flush_reqd(struct gfs2_sbd *sdp)</div><div class='del'>-{</div><div class='del'>-	unsigned int used_blocks = sdp-&gt;sd_jdesc-&gt;jd_blocks - atomic_read(&amp;sdp-&gt;sd_log_blks_free);</div><div class='del'>-</div><div class='del'>-	if (test_and_clear_bit(SDF_FORCE_AIL_FLUSH, &amp;sdp-&gt;sd_flags))</div><div class='del'>-		return 1;</div><div class='del'>-</div><div class='del'>-	return used_blocks + atomic_read(&amp;sdp-&gt;sd_log_blks_needed) &gt;=</div><div class='del'>-		atomic_read(&amp;sdp-&gt;sd_log_thresh2);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /**</div><div class='ctx'>  * gfs2_logd - Update log tail as Active Items get flushed to in-place blocks</div><div class='ctx'>  * @data: Pointer to GFS2 superblock</div><div class='hunk'>@@ -1296,24 +1289,11 @@ int gfs2_logd(void *data)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_sbd *sdp = data;</div><div class='ctx'> 	unsigned long t = 1;</div><div class='del'>-	DEFINE_WAIT(wait);</div><div class='ctx'> </div><div class='add'>+	set_freezable();</div><div class='ctx'> 	while (!kthread_should_stop()) {</div><div class='del'>-</div><div class='del'>-		if (gfs2_withdrawn(sdp)) {</div><div class='del'>-			msleep_interruptible(HZ);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-		/* Check for errors writing to the journal */</div><div class='del'>-		if (sdp-&gt;sd_log_error) {</div><div class='del'>-			gfs2_lm(sdp,</div><div class='del'>-				"GFS2: fsid=%s: error %d: "</div><div class='del'>-				"withdrawing the file system to "</div><div class='del'>-				"prevent further damage.\n",</div><div class='del'>-				sdp-&gt;sd_fsname, sdp-&gt;sd_log_error);</div><div class='del'>-			gfs2_withdraw(sdp);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='add'>+		if (gfs2_withdrawn(sdp))</div><div class='add'>+			break;</div><div class='ctx'> </div><div class='ctx'> 		if (gfs2_jrnl_flush_reqd(sdp) || t == 0) {</div><div class='ctx'> 			gfs2_ail1_empty(sdp, 0);</div><div class='hunk'>@@ -1321,7 +1301,9 @@ int gfs2_logd(void *data)</div><div class='ctx'> 						  GFS2_LFC_LOGD_JFLUSH_REQD);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (gfs2_ail_flush_reqd(sdp)) {</div><div class='add'>+		if (test_bit(SDF_FORCE_AIL_FLUSH, &amp;sdp-&gt;sd_flags) ||</div><div class='add'>+		    gfs2_ail_flush_reqd(sdp)) {</div><div class='add'>+			clear_bit(SDF_FORCE_AIL_FLUSH, &amp;sdp-&gt;sd_flags);</div><div class='ctx'> 			gfs2_ail1_start(sdp);</div><div class='ctx'> 			gfs2_ail1_wait(sdp);</div><div class='ctx'> 			gfs2_ail1_empty(sdp, 0);</div><div class='hunk'>@@ -1331,19 +1313,13 @@ int gfs2_logd(void *data)</div><div class='ctx'> </div><div class='ctx'> 		t = gfs2_tune_get(sdp, gt_logd_secs) * HZ;</div><div class='ctx'> </div><div class='del'>-		try_to_freeze();</div><div class='del'>-</div><div class='del'>-		do {</div><div class='del'>-			prepare_to_wait(&amp;sdp-&gt;sd_logd_waitq, &amp;wait,</div><div class='del'>-					TASK_INTERRUPTIBLE);</div><div class='del'>-			if (!gfs2_ail_flush_reqd(sdp) &amp;&amp;</div><div class='del'>-			    !gfs2_jrnl_flush_reqd(sdp) &amp;&amp;</div><div class='del'>-			    !kthread_should_stop())</div><div class='del'>-				t = schedule_timeout(t);</div><div class='del'>-		} while(t &amp;&amp; !gfs2_ail_flush_reqd(sdp) &amp;&amp;</div><div class='del'>-			!gfs2_jrnl_flush_reqd(sdp) &amp;&amp;</div><div class='del'>-			!kthread_should_stop());</div><div class='del'>-		finish_wait(&amp;sdp-&gt;sd_logd_waitq, &amp;wait);</div><div class='add'>+		t = wait_event_freezable_timeout(sdp-&gt;sd_logd_waitq,</div><div class='add'>+				test_bit(SDF_FORCE_AIL_FLUSH, &amp;sdp-&gt;sd_flags) ||</div><div class='add'>+				gfs2_ail_flush_reqd(sdp) ||</div><div class='add'>+				gfs2_jrnl_flush_reqd(sdp) ||</div><div class='add'>+				gfs2_withdrawn(sdp) ||</div><div class='add'>+				kthread_should_stop(),</div><div class='add'>+				t);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='head'>diff --git a/fs/gfs2/log.h b/fs/gfs2/log.h<br/>index fc905c2af53c..fc30ebdad83a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/log.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/log.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/log.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/log.h</a></div><div class='hunk'>@@ -44,17 +44,6 @@ __releases(&amp;sdp-&gt;sd_log_lock)</div><div class='ctx'> 	spin_unlock(&amp;sdp-&gt;sd_log_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void gfs2_log_pointers_init(struct gfs2_sbd *sdp,</div><div class='del'>-					  unsigned int value)</div><div class='del'>-{</div><div class='del'>-	if (++value == sdp-&gt;sd_jdesc-&gt;jd_blocks) {</div><div class='del'>-		value = 0;</div><div class='del'>-	}</div><div class='del'>-	sdp-&gt;sd_log_tail = value;</div><div class='del'>-	sdp-&gt;sd_log_flush_tail = value;</div><div class='del'>-	sdp-&gt;sd_log_head = value;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static inline void gfs2_ordered_add_inode(struct gfs2_inode *ip)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_sbd *sdp = GFS2_SB(&amp;ip-&gt;i_inode);</div><div class='hunk'>@@ -70,29 +59,29 @@ static inline void gfs2_ordered_add_inode(struct gfs2_inode *ip)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-extern void gfs2_ordered_del_inode(struct gfs2_inode *ip);</div><div class='del'>-extern unsigned int gfs2_struct2blk(struct gfs2_sbd *sdp, unsigned int nstruct);</div><div class='del'>-extern void gfs2_remove_from_ail(struct gfs2_bufdata *bd);</div><div class='del'>-extern bool gfs2_log_is_empty(struct gfs2_sbd *sdp);</div><div class='del'>-extern void gfs2_log_release_revokes(struct gfs2_sbd *sdp, unsigned int revokes);</div><div class='del'>-extern void gfs2_log_release(struct gfs2_sbd *sdp, unsigned int blks);</div><div class='del'>-extern bool gfs2_log_try_reserve(struct gfs2_sbd *sdp, struct gfs2_trans *tr,</div><div class='del'>-				 unsigned int *extra_revokes);</div><div class='del'>-extern void gfs2_log_reserve(struct gfs2_sbd *sdp, struct gfs2_trans *tr,</div><div class='del'>-			     unsigned int *extra_revokes);</div><div class='del'>-extern void gfs2_write_log_header(struct gfs2_sbd *sdp, struct gfs2_jdesc *jd,</div><div class='del'>-				  u64 seq, u32 tail, u32 lblock, u32 flags,</div><div class='del'>-				  int op_flags);</div><div class='del'>-extern void gfs2_log_flush(struct gfs2_sbd *sdp, struct gfs2_glock *gl,</div><div class='del'>-			   u32 type);</div><div class='del'>-extern void gfs2_log_commit(struct gfs2_sbd *sdp, struct gfs2_trans *trans);</div><div class='del'>-extern void gfs2_ail1_flush(struct gfs2_sbd *sdp, struct writeback_control *wbc);</div><div class='del'>-extern void log_flush_wait(struct gfs2_sbd *sdp);</div><div class='add'>+void gfs2_ordered_del_inode(struct gfs2_inode *ip);</div><div class='add'>+unsigned int gfs2_struct2blk(struct gfs2_sbd *sdp, unsigned int nstruct);</div><div class='add'>+void gfs2_remove_from_ail(struct gfs2_bufdata *bd);</div><div class='add'>+bool gfs2_log_is_empty(struct gfs2_sbd *sdp);</div><div class='add'>+void gfs2_log_release_revokes(struct gfs2_sbd *sdp, unsigned int revokes);</div><div class='add'>+void gfs2_log_release(struct gfs2_sbd *sdp, unsigned int blks);</div><div class='add'>+bool gfs2_log_try_reserve(struct gfs2_sbd *sdp, struct gfs2_trans *tr,</div><div class='add'>+			  unsigned int *extra_revokes);</div><div class='add'>+void gfs2_log_reserve(struct gfs2_sbd *sdp, struct gfs2_trans *tr,</div><div class='add'>+		      unsigned int *extra_revokes);</div><div class='add'>+void gfs2_write_log_header(struct gfs2_sbd *sdp, struct gfs2_jdesc *jd,</div><div class='add'>+			   u64 seq, u32 tail, u32 lblock, u32 flags,</div><div class='add'>+			   blk_opf_t op_flags);</div><div class='add'>+void gfs2_log_flush(struct gfs2_sbd *sdp, struct gfs2_glock *gl,</div><div class='add'>+		    u32 type);</div><div class='add'>+void gfs2_log_commit(struct gfs2_sbd *sdp, struct gfs2_trans *trans);</div><div class='add'>+void gfs2_ail1_flush(struct gfs2_sbd *sdp, struct writeback_control *wbc);</div><div class='add'>+void log_flush_wait(struct gfs2_sbd *sdp);</div><div class='ctx'> </div><div class='del'>-extern int gfs2_logd(void *data);</div><div class='del'>-extern void gfs2_add_revoke(struct gfs2_sbd *sdp, struct gfs2_bufdata *bd);</div><div class='del'>-extern void gfs2_glock_remove_revoke(struct gfs2_glock *gl);</div><div class='del'>-extern void gfs2_flush_revokes(struct gfs2_sbd *sdp);</div><div class='del'>-extern void gfs2_ail_drain(struct gfs2_sbd *sdp);</div><div class='add'>+int gfs2_logd(void *data);</div><div class='add'>+void gfs2_add_revoke(struct gfs2_sbd *sdp, struct gfs2_bufdata *bd);</div><div class='add'>+void gfs2_glock_remove_revoke(struct gfs2_glock *gl);</div><div class='add'>+void gfs2_flush_revokes(struct gfs2_sbd *sdp);</div><div class='add'>+void gfs2_ail_drain(struct gfs2_sbd *sdp);</div><div class='ctx'> </div><div class='ctx'> #endif /* __LOG_DOT_H__ */</div><div class='head'>diff --git a/fs/gfs2/lops.c b/fs/gfs2/lops.c<br/>index ca0bb3a73912..97ebe457c00a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/lops.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/lops.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/lops.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/lops.c</a></div><div class='hunk'>@@ -49,7 +49,7 @@ void gfs2_pin(struct gfs2_sbd *sdp, struct buffer_head *bh)</div><div class='ctx'> 	if (test_set_buffer_pinned(bh))</div><div class='ctx'> 		gfs2_assert_withdraw(sdp, 0);</div><div class='ctx'> 	if (!buffer_uptodate(bh))</div><div class='del'>-		gfs2_io_error_bh_wd(sdp, bh);</div><div class='add'>+		gfs2_io_error_bh(sdp, bh);</div><div class='ctx'> 	bd = bh-&gt;b_private;</div><div class='ctx'> 	/* If this buffer is in the AIL and it has already been written</div><div class='ctx'> 	 * to in-place disk block, remove it from the AIL.</div><div class='hunk'>@@ -157,7 +157,9 @@ u64 gfs2_log_bmap(struct gfs2_jdesc *jd, unsigned int lblock)</div><div class='ctx'> /**</div><div class='ctx'>  * gfs2_end_log_write_bh - end log write of pagecache data with buffers</div><div class='ctx'>  * @sdp: The superblock</div><div class='del'>- * @bvec: The bio_vec</div><div class='add'>+ * @folio: The folio</div><div class='add'>+ * @offset: The first byte within the folio that completed</div><div class='add'>+ * @size: The number of bytes that completed</div><div class='ctx'>  * @error: The i/o status</div><div class='ctx'>  *</div><div class='ctx'>  * This finds the relevant buffers and unlocks them and sets the</div><div class='hunk'>@@ -166,17 +168,13 @@ u64 gfs2_log_bmap(struct gfs2_jdesc *jd, unsigned int lblock)</div><div class='ctx'>  * that is pinned in the pagecache.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static void gfs2_end_log_write_bh(struct gfs2_sbd *sdp,</div><div class='del'>-				  struct bio_vec *bvec,</div><div class='del'>-				  blk_status_t error)</div><div class='add'>+static void gfs2_end_log_write_bh(struct gfs2_sbd *sdp, struct folio *folio,</div><div class='add'>+		size_t offset, size_t size, blk_status_t error)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *bh, *next;</div><div class='del'>-	struct page *page = bvec-&gt;bv_page;</div><div class='del'>-	unsigned size;</div><div class='ctx'> </div><div class='del'>-	bh = page_buffers(page);</div><div class='del'>-	size = bvec-&gt;bv_len;</div><div class='del'>-	while (bh_offset(bh) &lt; bvec-&gt;bv_offset)</div><div class='add'>+	bh = folio_buffers(folio);</div><div class='add'>+	while (bh_offset(bh) &lt; offset)</div><div class='ctx'> 		bh = bh-&gt;b_this_page;</div><div class='ctx'> 	do {</div><div class='ctx'> 		if (error)</div><div class='hunk'>@@ -186,7 +184,7 @@ static void gfs2_end_log_write_bh(struct gfs2_sbd *sdp,</div><div class='ctx'> 		size -= bh-&gt;b_size;</div><div class='ctx'> 		brelse(bh);</div><div class='ctx'> 		bh = next;</div><div class='del'>-	} while(bh &amp;&amp; size);</div><div class='add'>+	} while (bh &amp;&amp; size);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -203,23 +201,24 @@ static void gfs2_end_log_write(struct bio *bio)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_sbd *sdp = bio-&gt;bi_private;</div><div class='ctx'> 	struct bio_vec *bvec;</div><div class='del'>-	struct page *page;</div><div class='ctx'> 	struct bvec_iter_all iter_all;</div><div class='ctx'> </div><div class='ctx'> 	if (bio-&gt;bi_status) {</div><div class='del'>-		if (!cmpxchg(&amp;sdp-&gt;sd_log_error, 0, (int)bio-&gt;bi_status))</div><div class='add'>+		int err = blk_status_to_errno(bio-&gt;bi_status);</div><div class='add'>+</div><div class='add'>+		if (!cmpxchg(&amp;sdp-&gt;sd_log_error, 0, err))</div><div class='ctx'> 			fs_err(sdp, "Error %d writing to journal, jid=%u\n",</div><div class='del'>-			       bio-&gt;bi_status, sdp-&gt;sd_jdesc-&gt;jd_jid);</div><div class='del'>-		gfs2_withdraw_delayed(sdp);</div><div class='del'>-		/* prevent more writes to the journal */</div><div class='del'>-		clear_bit(SDF_JOURNAL_LIVE, &amp;sdp-&gt;sd_flags);</div><div class='del'>-		wake_up(&amp;sdp-&gt;sd_logd_waitq);</div><div class='add'>+			       err, sdp-&gt;sd_jdesc-&gt;jd_jid);</div><div class='add'>+		gfs2_withdraw(sdp);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	bio_for_each_segment_all(bvec, bio, iter_all) {</div><div class='del'>-		page = bvec-&gt;bv_page;</div><div class='del'>-		if (page_has_buffers(page))</div><div class='del'>-			gfs2_end_log_write_bh(sdp, bvec, bio-&gt;bi_status);</div><div class='add'>+		struct page *page = bvec-&gt;bv_page;</div><div class='add'>+		struct folio *folio = page_folio(page);</div><div class='add'>+</div><div class='add'>+		if (folio &amp;&amp; folio_buffers(folio))</div><div class='add'>+			gfs2_end_log_write_bh(sdp, folio, bvec-&gt;bv_offset,</div><div class='add'>+					bvec-&gt;bv_len, bio-&gt;bi_status);</div><div class='ctx'> 		else</div><div class='ctx'> 			mempool_free(page, gfs2_page_pool);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -238,7 +237,7 @@ static void gfs2_end_log_write(struct bio *bio)</div><div class='ctx'>  * there is no pending bio, then this is a no-op.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-void gfs2_log_submit_bio(struct bio **biop, int opf)</div><div class='add'>+void gfs2_log_submit_bio(struct bio **biop, blk_opf_t opf)</div><div class='ctx'> {</div><div class='ctx'> 	struct bio *bio = *biop;</div><div class='ctx'> 	if (bio) {</div><div class='hunk'>@@ -265,10 +264,9 @@ static struct bio *gfs2_log_alloc_bio(struct gfs2_sbd *sdp, u64 blkno,</div><div class='ctx'> 				      bio_end_io_t *end_io)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = sdp-&gt;sd_vfs;</div><div class='del'>-	struct bio *bio = bio_alloc(GFP_NOIO, BIO_MAX_VECS);</div><div class='add'>+	struct bio *bio = bio_alloc(sb-&gt;s_bdev, BIO_MAX_VECS, 0, GFP_NOIO);</div><div class='ctx'> </div><div class='ctx'> 	bio-&gt;bi_iter.bi_sector = blkno &lt;&lt; sdp-&gt;sd_fsb2bb_shift;</div><div class='del'>-	bio_set_dev(bio, sb-&gt;s_bdev);</div><div class='ctx'> 	bio-&gt;bi_end_io = end_io;</div><div class='ctx'> 	bio-&gt;bi_private = sdp;</div><div class='ctx'> </div><div class='hunk'>@@ -293,7 +291,7 @@ static struct bio *gfs2_log_alloc_bio(struct gfs2_sbd *sdp, u64 blkno,</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> static struct bio *gfs2_log_get_bio(struct gfs2_sbd *sdp, u64 blkno,</div><div class='del'>-				    struct bio **biop, int op,</div><div class='add'>+				    struct bio **biop, enum req_op op,</div><div class='ctx'> 				    bio_end_io_t *end_io, bool flush)</div><div class='ctx'> {</div><div class='ctx'> 	struct bio *bio = *biop;</div><div class='hunk'>@@ -360,8 +358,8 @@ static void gfs2_log_write_bh(struct gfs2_sbd *sdp, struct buffer_head *bh)</div><div class='ctx'> </div><div class='ctx'> 	dblock = gfs2_log_bmap(sdp-&gt;sd_jdesc, sdp-&gt;sd_log_flush_head);</div><div class='ctx'> 	gfs2_log_incr_head(sdp);</div><div class='del'>-	gfs2_log_write(sdp, sdp-&gt;sd_jdesc, bh-&gt;b_page, bh-&gt;b_size,</div><div class='del'>-		       bh_offset(bh), dblock);</div><div class='add'>+	gfs2_log_write(sdp, sdp-&gt;sd_jdesc, folio_page(bh-&gt;b_folio, 0),</div><div class='add'>+			bh-&gt;b_size, bh_offset(bh), dblock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -392,46 +390,40 @@ static void gfs2_log_write_page(struct gfs2_sbd *sdp, struct page *page)</div><div class='ctx'>  * Simply unlock the pages in the bio. The main thread will wait on them and</div><div class='ctx'>  * process them in order as necessary.</div><div class='ctx'>  */</div><div class='del'>-</div><div class='ctx'> static void gfs2_end_log_read(struct bio *bio)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='del'>-	struct bio_vec *bvec;</div><div class='del'>-	struct bvec_iter_all iter_all;</div><div class='del'>-</div><div class='del'>-	bio_for_each_segment_all(bvec, bio, iter_all) {</div><div class='del'>-		page = bvec-&gt;bv_page;</div><div class='del'>-		if (bio-&gt;bi_status) {</div><div class='del'>-			int err = blk_status_to_errno(bio-&gt;bi_status);</div><div class='add'>+	int error = blk_status_to_errno(bio-&gt;bi_status);</div><div class='add'>+	struct folio_iter fi;</div><div class='ctx'> </div><div class='del'>-			SetPageError(page);</div><div class='del'>-			mapping_set_error(page-&gt;mapping, err);</div><div class='del'>-		}</div><div class='del'>-		unlock_page(page);</div><div class='add'>+	bio_for_each_folio_all(fi, bio) {</div><div class='add'>+		/* We're abusing wb_err to get the error to gfs2_find_jhead */</div><div class='add'>+		filemap_set_wb_err(fi.folio-&gt;mapping, error);</div><div class='add'>+		folio_end_read(fi.folio, !error);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	bio_put(bio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * gfs2_jhead_pg_srch - Look for the journal head in a given page.</div><div class='add'>+ * gfs2_jhead_folio_search - Look for the journal head in a given page.</div><div class='ctx'>  * @jd: The journal descriptor</div><div class='ctx'>  * @head: The journal head to start from</div><div class='del'>- * @page: The page to look in</div><div class='add'>+ * @folio: The folio to look in</div><div class='ctx'>  *</div><div class='ctx'>  * Returns: 1 if found, 0 otherwise.</div><div class='ctx'>  */</div><div class='del'>-</div><div class='del'>-static bool gfs2_jhead_pg_srch(struct gfs2_jdesc *jd,</div><div class='del'>-			      struct gfs2_log_header_host *head,</div><div class='del'>-			      struct page *page)</div><div class='add'>+static bool gfs2_jhead_folio_search(struct gfs2_jdesc *jd,</div><div class='add'>+				    struct gfs2_log_header_host *head,</div><div class='add'>+				    struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_sbd *sdp = GFS2_SB(jd-&gt;jd_inode);</div><div class='ctx'> 	struct gfs2_log_header_host lh;</div><div class='del'>-	void *kaddr = kmap_atomic(page);</div><div class='add'>+	void *kaddr;</div><div class='ctx'> 	unsigned int offset;</div><div class='ctx'> 	bool ret = false;</div><div class='ctx'> </div><div class='add'>+	VM_BUG_ON_FOLIO(folio_test_large(folio), folio);</div><div class='add'>+	kaddr = kmap_local_folio(folio, 0);</div><div class='ctx'> 	for (offset = 0; offset &lt; PAGE_SIZE; offset += sdp-&gt;sd_sb.sb_bsize) {</div><div class='ctx'> 		if (!__get_log_header(sdp, kaddr + offset, 0, &amp;lh)) {</div><div class='ctx'> 			if (lh.lh_sequence &gt;= head-&gt;lh_sequence)</div><div class='hunk'>@@ -442,7 +434,7 @@ static bool gfs2_jhead_pg_srch(struct gfs2_jdesc *jd,</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	kunmap_atomic(kaddr);</div><div class='add'>+	kunmap_local(kaddr);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -453,48 +445,46 @@ static bool gfs2_jhead_pg_srch(struct gfs2_jdesc *jd,</div><div class='ctx'>  * @head: The journal head to start from</div><div class='ctx'>  * @done: If set, perform only cleanup, else search and set if found.</div><div class='ctx'>  *</div><div class='del'>- * Find the page with 'index' in the journal's mapping. Search the page for</div><div class='add'>+ * Find the folio with 'index' in the journal's mapping. Search the folio for</div><div class='ctx'>  * the journal head if requested (cleanup == false). Release refs on the</div><div class='del'>- * page so the page cache can reclaim it (put_page() twice). We grabbed a</div><div class='del'>- * reference on this page two times, first when we did a find_or_create_page()</div><div class='del'>- * to obtain the page to add it to the bio and second when we do a</div><div class='del'>- * find_get_page() here to get the page to wait on while I/O on it is being</div><div class='add'>+ * folio so the page cache can reclaim it. We grabbed a</div><div class='add'>+ * reference on this folio twice, first when we did a filemap_grab_folio()</div><div class='add'>+ * to obtain the folio to add it to the bio and second when we do a</div><div class='add'>+ * filemap_get_folio() here to get the folio to wait on while I/O on it is being</div><div class='ctx'>  * completed.</div><div class='del'>- * This function is also used to free up a page we might've grabbed but not</div><div class='add'>+ * This function is also used to free up a folio we might've grabbed but not</div><div class='ctx'>  * used. Maybe we added it to a bio, but not submitted it for I/O. Or we</div><div class='ctx'>  * submitted the I/O, but we already found the jhead so we only need to drop</div><div class='del'>- * our references to the page.</div><div class='add'>+ * our references to the folio.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> static void gfs2_jhead_process_page(struct gfs2_jdesc *jd, unsigned long index,</div><div class='ctx'> 				    struct gfs2_log_header_host *head,</div><div class='ctx'> 				    bool *done)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> </div><div class='del'>-	page = find_get_page(jd-&gt;jd_inode-&gt;i_mapping, index);</div><div class='del'>-	wait_on_page_locked(page);</div><div class='add'>+	folio = filemap_get_folio(jd-&gt;jd_inode-&gt;i_mapping, index);</div><div class='ctx'> </div><div class='del'>-	if (PageError(page))</div><div class='add'>+	folio_wait_locked(folio);</div><div class='add'>+	if (!folio_test_uptodate(folio))</div><div class='ctx'> 		*done = true;</div><div class='ctx'> </div><div class='ctx'> 	if (!*done)</div><div class='del'>-		*done = gfs2_jhead_pg_srch(jd, head, page);</div><div class='add'>+		*done = gfs2_jhead_folio_search(jd, head, folio);</div><div class='ctx'> </div><div class='del'>-	put_page(page); /* Once for find_get_page */</div><div class='del'>-	put_page(page); /* Once more for find_or_create_page */</div><div class='add'>+	/* filemap_get_folio() and the earlier filemap_grab_folio() */</div><div class='add'>+	folio_put_refs(folio, 2);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct bio *gfs2_chain_bio(struct bio *prev, unsigned int nr_iovecs)</div><div class='ctx'> {</div><div class='ctx'> 	struct bio *new;</div><div class='ctx'> </div><div class='del'>-	new = bio_alloc(GFP_NOIO, nr_iovecs);</div><div class='del'>-	bio_copy_dev(new, prev);</div><div class='add'>+	new = bio_alloc(prev-&gt;bi_bdev, nr_iovecs, prev-&gt;bi_opf, GFP_NOIO);</div><div class='add'>+	bio_clone_blkg_association(new, prev);</div><div class='ctx'> 	new-&gt;bi_iter.bi_sector = bio_end_sector(prev);</div><div class='del'>-	new-&gt;bi_opf = prev-&gt;bi_opf;</div><div class='del'>-	new-&gt;bi_write_hint = prev-&gt;bi_write_hint;</div><div class='del'>-	bio_chain(new, prev);</div><div class='add'>+	bio_chain(prev, new);</div><div class='ctx'> 	submit_bio(prev);</div><div class='ctx'> 	return new;</div><div class='ctx'> }</div><div class='hunk'>@@ -503,15 +493,13 @@ static struct bio *gfs2_chain_bio(struct bio *prev, unsigned int nr_iovecs)</div><div class='ctx'>  * gfs2_find_jhead - find the head of a log</div><div class='ctx'>  * @jd: The journal descriptor</div><div class='ctx'>  * @head: The log descriptor for the head of the log is returned here</div><div class='del'>- * @keep_cache: If set inode pages will not be truncated</div><div class='ctx'>  *</div><div class='ctx'>  * Do a search of a journal by reading it in large chunks using bios and find</div><div class='ctx'>  * the valid log entry with the highest sequence number.  (i.e. the log head)</div><div class='ctx'>  *</div><div class='ctx'>  * Returns: 0 on success, errno otherwise</div><div class='ctx'>  */</div><div class='del'>-int gfs2_find_jhead(struct gfs2_jdesc *jd, struct gfs2_log_header_host *head,</div><div class='del'>-		    bool keep_cache)</div><div class='add'>+int gfs2_find_jhead(struct gfs2_jdesc *jd, struct gfs2_log_header_host *head)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_sbd *sdp = GFS2_SB(jd-&gt;jd_inode);</div><div class='ctx'> 	struct address_space *mapping = jd-&gt;jd_inode-&gt;i_mapping;</div><div class='hunk'>@@ -521,9 +509,9 @@ int gfs2_find_jhead(struct gfs2_jdesc *jd, struct gfs2_log_header_host *head,</div><div class='ctx'> 	unsigned int shift = PAGE_SHIFT - bsize_shift;</div><div class='ctx'> 	unsigned int max_blocks = 2 * 1024 * 1024 &gt;&gt; bsize_shift;</div><div class='ctx'> 	struct gfs2_journal_extent *je;</div><div class='del'>-	int sz, ret = 0;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> 	struct bio *bio = NULL;</div><div class='del'>-	struct page *page = NULL;</div><div class='add'>+	struct folio *folio = NULL;</div><div class='ctx'> 	bool done = false;</div><div class='ctx'> 	errseq_t since;</div><div class='ctx'> </div><div class='hunk'>@@ -536,11 +524,11 @@ int gfs2_find_jhead(struct gfs2_jdesc *jd, struct gfs2_log_header_host *head,</div><div class='ctx'> 		u64 dblock = je-&gt;dblock;</div><div class='ctx'> </div><div class='ctx'> 		for (; block &lt; je-&gt;lblock + je-&gt;blocks; block++, dblock++) {</div><div class='del'>-			if (!page) {</div><div class='del'>-				page = find_or_create_page(mapping,</div><div class='del'>-						block &gt;&gt; shift, GFP_NOFS);</div><div class='del'>-				if (!page) {</div><div class='del'>-					ret = -ENOMEM;</div><div class='add'>+			if (!folio) {</div><div class='add'>+				folio = filemap_grab_folio(mapping,</div><div class='add'>+						block &gt;&gt; shift);</div><div class='add'>+				if (IS_ERR(folio)) {</div><div class='add'>+					ret = PTR_ERR(folio);</div><div class='ctx'> 					done = true;</div><div class='ctx'> 					goto out;</div><div class='ctx'> 				}</div><div class='hunk'>@@ -551,8 +539,7 @@ int gfs2_find_jhead(struct gfs2_jdesc *jd, struct gfs2_log_header_host *head,</div><div class='ctx'> 				sector_t sector = dblock &lt;&lt; sdp-&gt;sd_fsb2bb_shift;</div><div class='ctx'> </div><div class='ctx'> 				if (bio_end_sector(bio) == sector) {</div><div class='del'>-					sz = bio_add_page(bio, page, bsize, off);</div><div class='del'>-					if (sz == bsize)</div><div class='add'>+					if (bio_add_folio(bio, folio, bsize, off))</div><div class='ctx'> 						goto block_added;</div><div class='ctx'> 				}</div><div class='ctx'> 				if (off) {</div><div class='hunk'>@@ -572,12 +559,11 @@ int gfs2_find_jhead(struct gfs2_jdesc *jd, struct gfs2_log_header_host *head,</div><div class='ctx'> 			bio = gfs2_log_alloc_bio(sdp, dblock, gfs2_end_log_read);</div><div class='ctx'> 			bio-&gt;bi_opf = REQ_OP_READ;</div><div class='ctx'> add_block_to_new_bio:</div><div class='del'>-			sz = bio_add_page(bio, page, bsize, off);</div><div class='del'>-			BUG_ON(sz != bsize);</div><div class='add'>+			bio_add_folio_nofail(bio, folio, bsize, off);</div><div class='ctx'> block_added:</div><div class='ctx'> 			off += bsize;</div><div class='del'>-			if (off == PAGE_SIZE)</div><div class='del'>-				page = NULL;</div><div class='add'>+			if (off == folio_size(folio))</div><div class='add'>+				folio = NULL;</div><div class='ctx'> 			if (blocks_submitted &lt;= blocks_read + max_blocks) {</div><div class='ctx'> 				/* Keep at least one bio in flight */</div><div class='ctx'> 				continue;</div><div class='hunk'>@@ -601,8 +587,7 @@ out:</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		ret = filemap_check_wb_err(mapping, since);</div><div class='ctx'> </div><div class='del'>-	if (!keep_cache)</div><div class='del'>-		truncate_inode_pages(mapping, 0);</div><div class='add'>+	truncate_inode_pages(mapping, 0);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -625,15 +610,13 @@ static struct page *gfs2_get_log_desc(struct gfs2_sbd *sdp, u32 ld_type,</div><div class='ctx'> </div><div class='ctx'> static void gfs2_check_magic(struct buffer_head *bh)</div><div class='ctx'> {</div><div class='del'>-	void *kaddr;</div><div class='ctx'> 	__be32 *ptr;</div><div class='ctx'> </div><div class='ctx'> 	clear_buffer_escaped(bh);</div><div class='del'>-	kaddr = kmap_atomic(bh-&gt;b_page);</div><div class='del'>-	ptr = kaddr + bh_offset(bh);</div><div class='add'>+	ptr = kmap_local_folio(bh-&gt;b_folio, bh_offset(bh));</div><div class='ctx'> 	if (*ptr == cpu_to_be32(GFS2_MAGIC))</div><div class='ctx'> 		set_buffer_escaped(bh);</div><div class='del'>-	kunmap_atomic(kaddr);</div><div class='add'>+	kunmap_local(ptr);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int blocknr_cmp(void *priv, const struct list_head *a,</div><div class='hunk'>@@ -699,14 +682,12 @@ static void gfs2_before_commit(struct gfs2_sbd *sdp, unsigned int limit,</div><div class='ctx'> 			lock_buffer(bd2-&gt;bd_bh);</div><div class='ctx'> </div><div class='ctx'> 			if (buffer_escaped(bd2-&gt;bd_bh)) {</div><div class='del'>-				void *kaddr;</div><div class='add'>+				void *p;</div><div class='add'>+</div><div class='ctx'> 				page = mempool_alloc(gfs2_page_pool, GFP_NOIO);</div><div class='del'>-				ptr = page_address(page);</div><div class='del'>-				kaddr = kmap_atomic(bd2-&gt;bd_bh-&gt;b_page);</div><div class='del'>-				memcpy(ptr, kaddr + bh_offset(bd2-&gt;bd_bh),</div><div class='del'>-				       bd2-&gt;bd_bh-&gt;b_size);</div><div class='del'>-				kunmap_atomic(kaddr);</div><div class='del'>-				*(__be32 *)ptr = 0;</div><div class='add'>+				p = page_address(page);</div><div class='add'>+				memcpy_from_page(p, page, bh_offset(bd2-&gt;bd_bh), bd2-&gt;bd_bh-&gt;b_size);</div><div class='add'>+				*(__be32 *)p = 0;</div><div class='ctx'> 				clear_buffer_escaped(bd2-&gt;bd_bh);</div><div class='ctx'> 				unlock_buffer(bd2-&gt;bd_bh);</div><div class='ctx'> 				brelse(bd2-&gt;bd_bh);</div><div class='head'>diff --git a/fs/gfs2/lops.h b/fs/gfs2/lops.h<br/>index f707601597dc..be740bf33666 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/lops.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/lops.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/lops.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/lops.h</a></div><div class='hunk'>@@ -11,16 +11,18 @@</div><div class='ctx'> #include "incore.h"</div><div class='ctx'> </div><div class='ctx'> extern const struct gfs2_log_operations *gfs2_log_ops[];</div><div class='del'>-extern void gfs2_log_incr_head(struct gfs2_sbd *sdp);</div><div class='del'>-extern u64 gfs2_log_bmap(struct gfs2_jdesc *jd, unsigned int lbn);</div><div class='del'>-extern void gfs2_log_write(struct gfs2_sbd *sdp, struct gfs2_jdesc *jd,</div><div class='del'>-			   struct page *page, unsigned size, unsigned offset,</div><div class='del'>-			   u64 blkno);</div><div class='del'>-extern void gfs2_log_submit_bio(struct bio **biop, int opf);</div><div class='del'>-extern void gfs2_pin(struct gfs2_sbd *sdp, struct buffer_head *bh);</div><div class='del'>-extern int gfs2_find_jhead(struct gfs2_jdesc *jd,</div><div class='del'>-			   struct gfs2_log_header_host *head, bool keep_cache);</div><div class='del'>-extern void gfs2_drain_revokes(struct gfs2_sbd *sdp);</div><div class='add'>+</div><div class='add'>+void gfs2_log_incr_head(struct gfs2_sbd *sdp);</div><div class='add'>+u64 gfs2_log_bmap(struct gfs2_jdesc *jd, unsigned int lbn);</div><div class='add'>+void gfs2_log_write(struct gfs2_sbd *sdp, struct gfs2_jdesc *jd,</div><div class='add'>+		    struct page *page, unsigned size, unsigned offset,</div><div class='add'>+		    u64 blkno);</div><div class='add'>+void gfs2_log_submit_bio(struct bio **biop, blk_opf_t opf);</div><div class='add'>+void gfs2_pin(struct gfs2_sbd *sdp, struct buffer_head *bh);</div><div class='add'>+int gfs2_find_jhead(struct gfs2_jdesc *jd,</div><div class='add'>+		    struct gfs2_log_header_host *head);</div><div class='add'>+void gfs2_drain_revokes(struct gfs2_sbd *sdp);</div><div class='add'>+</div><div class='ctx'> static inline unsigned int buf_limit(struct gfs2_sbd *sdp)</div><div class='ctx'> {</div><div class='ctx'> 	return sdp-&gt;sd_ldptrs;</div><div class='head'>diff --git a/fs/gfs2/main.c b/fs/gfs2/main.c<br/>index 28d0eb23e18e..9d65719353fa 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/main.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/main.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/main.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/main.c</a></div><div class='hunk'>@@ -38,7 +38,6 @@ static void gfs2_init_inode_once(void *foo)</div><div class='ctx'> 	inode_init_once(&amp;ip-&gt;i_inode);</div><div class='ctx'> 	atomic_set(&amp;ip-&gt;i_sizehint, 0);</div><div class='ctx'> 	init_rwsem(&amp;ip-&gt;i_rw_mutex);</div><div class='del'>-	INIT_LIST_HEAD(&amp;ip-&gt;i_trunc_list);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;ip-&gt;i_ordered);</div><div class='ctx'> 	ip-&gt;i_qadata = NULL;</div><div class='ctx'> 	gfs2_holder_mark_uninitialized(&amp;ip-&gt;i_rgd_gh);</div><div class='hunk'>@@ -52,7 +51,6 @@ static void gfs2_init_glock_once(void *foo)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_glock *gl = foo;</div><div class='ctx'> </div><div class='del'>-	spin_lock_init(&amp;gl-&gt;gl_lockref.lock);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;gl-&gt;gl_holders);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;gl-&gt;gl_lru);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;gl-&gt;gl_ail_list);</div><div class='hunk'>@@ -62,11 +60,10 @@ static void gfs2_init_glock_once(void *foo)</div><div class='ctx'> </div><div class='ctx'> static void gfs2_init_gl_aspace_once(void *foo)</div><div class='ctx'> {</div><div class='del'>-	struct gfs2_glock *gl = foo;</div><div class='del'>-	struct address_space *mapping = (struct address_space *)(gl + 1);</div><div class='add'>+	struct gfs2_glock_aspace *gla = foo;</div><div class='ctx'> </div><div class='del'>-	gfs2_init_glock_once(gl);</div><div class='del'>-	address_space_init_once(mapping);</div><div class='add'>+	gfs2_init_glock_once(&amp;gla-&gt;glock);</div><div class='add'>+	address_space_init_once(&amp;gla-&gt;mapping);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -104,8 +101,7 @@ static int __init init_gfs2_fs(void)</div><div class='ctx'> 		goto fail_cachep1;</div><div class='ctx'> </div><div class='ctx'> 	gfs2_glock_aspace_cachep = kmem_cache_create("gfs2_glock(aspace)",</div><div class='del'>-					sizeof(struct gfs2_glock) +</div><div class='del'>-					sizeof(struct address_space),</div><div class='add'>+					sizeof(struct gfs2_glock_aspace),</div><div class='ctx'> 					0, 0, gfs2_init_gl_aspace_once);</div><div class='ctx'> </div><div class='ctx'> 	if (!gfs2_glock_aspace_cachep)</div><div class='hunk'>@@ -114,7 +110,6 @@ static int __init init_gfs2_fs(void)</div><div class='ctx'> 	gfs2_inode_cachep = kmem_cache_create("gfs2_inode",</div><div class='ctx'> 					      sizeof(struct gfs2_inode),</div><div class='ctx'> 					      0,  SLAB_RECLAIM_ACCOUNT|</div><div class='del'>-						  SLAB_MEM_SPREAD|</div><div class='ctx'> 						  SLAB_ACCOUNT,</div><div class='ctx'> 					      gfs2_init_inode_once);</div><div class='ctx'> 	if (!gfs2_inode_cachep)</div><div class='hunk'>@@ -150,22 +145,15 @@ static int __init init_gfs2_fs(void)</div><div class='ctx'> 	if (!gfs2_trans_cachep)</div><div class='ctx'> 		goto fail_cachep8;</div><div class='ctx'> </div><div class='del'>-	error = register_shrinker(&amp;gfs2_qd_shrinker);</div><div class='add'>+	error = gfs2_qd_shrinker_init();</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto fail_shrinker;</div><div class='ctx'> </div><div class='del'>-	error = register_filesystem(&amp;gfs2_fs_type);</div><div class='del'>-	if (error)</div><div class='del'>-		goto fail_fs1;</div><div class='del'>-</div><div class='del'>-	error = register_filesystem(&amp;gfs2meta_fs_type);</div><div class='del'>-	if (error)</div><div class='del'>-		goto fail_fs2;</div><div class='del'>-</div><div class='ctx'> 	error = -ENOMEM;</div><div class='del'>-	gfs_recovery_wq = alloc_workqueue("gfs_recovery",</div><div class='del'>-					  WQ_MEM_RECLAIM | WQ_FREEZABLE, 0);</div><div class='del'>-	if (!gfs_recovery_wq)</div><div class='add'>+	gfs2_recovery_wq = alloc_workqueue("gfs2_recovery",</div><div class='add'>+					  WQ_MEM_RECLAIM | WQ_FREEZABLE | WQ_PERCPU,</div><div class='add'>+					  0);</div><div class='add'>+	if (!gfs2_recovery_wq)</div><div class='ctx'> 		goto fail_wq1;</div><div class='ctx'> </div><div class='ctx'> 	gfs2_control_wq = alloc_workqueue("gfs2_control",</div><div class='hunk'>@@ -173,7 +161,7 @@ static int __init init_gfs2_fs(void)</div><div class='ctx'> 	if (!gfs2_control_wq)</div><div class='ctx'> 		goto fail_wq2;</div><div class='ctx'> </div><div class='del'>-	gfs2_freeze_wq = alloc_workqueue("freeze_workqueue", 0, 0);</div><div class='add'>+	gfs2_freeze_wq = alloc_workqueue("gfs2_freeze", WQ_PERCPU, 0);</div><div class='ctx'> </div><div class='ctx'> 	if (!gfs2_freeze_wq)</div><div class='ctx'> 		goto fail_wq3;</div><div class='hunk'>@@ -183,23 +171,31 @@ static int __init init_gfs2_fs(void)</div><div class='ctx'> 		goto fail_mempool;</div><div class='ctx'> </div><div class='ctx'> 	gfs2_register_debugfs();</div><div class='add'>+	error = register_filesystem(&amp;gfs2_fs_type);</div><div class='add'>+	if (error)</div><div class='add'>+		goto fail_fs1;</div><div class='add'>+</div><div class='add'>+	error = register_filesystem(&amp;gfs2meta_fs_type);</div><div class='add'>+	if (error)</div><div class='add'>+		goto fail_fs2;</div><div class='add'>+</div><div class='ctx'> </div><div class='ctx'> 	pr_info("GFS2 installed\n");</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='add'>+fail_fs2:</div><div class='add'>+	unregister_filesystem(&amp;gfs2_fs_type);</div><div class='add'>+fail_fs1:</div><div class='add'>+	mempool_destroy(gfs2_page_pool);</div><div class='ctx'> fail_mempool:</div><div class='ctx'> 	destroy_workqueue(gfs2_freeze_wq);</div><div class='ctx'> fail_wq3:</div><div class='ctx'> 	destroy_workqueue(gfs2_control_wq);</div><div class='ctx'> fail_wq2:</div><div class='del'>-	destroy_workqueue(gfs_recovery_wq);</div><div class='add'>+	destroy_workqueue(gfs2_recovery_wq);</div><div class='ctx'> fail_wq1:</div><div class='del'>-	unregister_filesystem(&amp;gfs2meta_fs_type);</div><div class='del'>-fail_fs2:</div><div class='del'>-	unregister_filesystem(&amp;gfs2_fs_type);</div><div class='del'>-fail_fs1:</div><div class='del'>-	unregister_shrinker(&amp;gfs2_qd_shrinker);</div><div class='add'>+	gfs2_qd_shrinker_exit();</div><div class='ctx'> fail_shrinker:</div><div class='ctx'> 	kmem_cache_destroy(gfs2_trans_cachep);</div><div class='ctx'> fail_cachep8:</div><div class='hunk'>@@ -232,12 +228,12 @@ fail_lru:</div><div class='ctx'> </div><div class='ctx'> static void __exit exit_gfs2_fs(void)</div><div class='ctx'> {</div><div class='del'>-	unregister_shrinker(&amp;gfs2_qd_shrinker);</div><div class='add'>+	gfs2_qd_shrinker_exit();</div><div class='ctx'> 	gfs2_glock_exit();</div><div class='ctx'> 	gfs2_unregister_debugfs();</div><div class='ctx'> 	unregister_filesystem(&amp;gfs2_fs_type);</div><div class='ctx'> 	unregister_filesystem(&amp;gfs2meta_fs_type);</div><div class='del'>-	destroy_workqueue(gfs_recovery_wq);</div><div class='add'>+	destroy_workqueue(gfs2_recovery_wq);</div><div class='ctx'> 	destroy_workqueue(gfs2_control_wq);</div><div class='ctx'> 	destroy_workqueue(gfs2_freeze_wq);</div><div class='ctx'> 	list_lru_destroy(&amp;gfs2_qd_lru);</div><div class='head'>diff --git a/fs/gfs2/meta_io.c b/fs/gfs2/meta_io.c<br/>index 72d30a682ece..e4356198d8d8 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/meta_io.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/meta_io.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/meta_io.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/meta_io.c</a></div><div class='hunk'>@@ -30,16 +30,16 @@</div><div class='ctx'> #include "util.h"</div><div class='ctx'> #include "trace_gfs2.h"</div><div class='ctx'> </div><div class='del'>-static int gfs2_aspace_writepage(struct page *page, struct writeback_control *wbc)</div><div class='add'>+static void gfs2_aspace_write_folio(struct folio *folio,</div><div class='add'>+		struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *bh, *head;</div><div class='ctx'> 	int nr_underway = 0;</div><div class='del'>-	int write_flags = REQ_META | REQ_PRIO | wbc_to_write_flags(wbc);</div><div class='add'>+	blk_opf_t write_flags = REQ_META | REQ_PRIO | wbc_to_write_flags(wbc);</div><div class='ctx'> </div><div class='del'>-	BUG_ON(!PageLocked(page));</div><div class='del'>-	BUG_ON(!page_has_buffers(page));</div><div class='add'>+	BUG_ON(!folio_test_locked(folio));</div><div class='ctx'> </div><div class='del'>-	head = page_buffers(page);</div><div class='add'>+	head = folio_buffers(folio);</div><div class='ctx'> 	bh = head;</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='hunk'>@@ -55,7 +55,7 @@ static int gfs2_aspace_writepage(struct page *page, struct writeback_control *wb</div><div class='ctx'> 		if (wbc-&gt;sync_mode != WB_SYNC_NONE) {</div><div class='ctx'> 			lock_buffer(bh);</div><div class='ctx'> 		} else if (!trylock_buffer(bh)) {</div><div class='del'>-			redirty_page_for_writepage(wbc, page);</div><div class='add'>+			folio_redirty_for_writepage(wbc, folio);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (test_clear_buffer_dirty(bh)) {</div><div class='hunk'>@@ -66,38 +66,52 @@ static int gfs2_aspace_writepage(struct page *page, struct writeback_control *wb</div><div class='ctx'> 	} while ((bh = bh-&gt;b_this_page) != head);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * The page and its buffers are protected by PageWriteback(), so we can</div><div class='del'>-	 * drop the bh refcounts early.</div><div class='add'>+	 * The folio and its buffers are protected from truncation by</div><div class='add'>+	 * the writeback flag, so we can drop the bh refcounts early.</div><div class='ctx'> 	 */</div><div class='del'>-	BUG_ON(PageWriteback(page));</div><div class='del'>-	set_page_writeback(page);</div><div class='add'>+	BUG_ON(folio_test_writeback(folio));</div><div class='add'>+	folio_start_writeback(folio);</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='ctx'> 		struct buffer_head *next = bh-&gt;b_this_page;</div><div class='ctx'> 		if (buffer_async_write(bh)) {</div><div class='del'>-			submit_bh(REQ_OP_WRITE, write_flags, bh);</div><div class='add'>+			submit_bh(REQ_OP_WRITE | write_flags, bh);</div><div class='ctx'> 			nr_underway++;</div><div class='ctx'> 		}</div><div class='ctx'> 		bh = next;</div><div class='ctx'> 	} while (bh != head);</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> </div><div class='ctx'> 	if (nr_underway == 0)</div><div class='del'>-		end_page_writeback(page);</div><div class='add'>+		folio_end_writeback(folio);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+static int gfs2_aspace_writepages(struct address_space *mapping,</div><div class='add'>+		struct writeback_control *wbc)</div><div class='add'>+{</div><div class='add'>+	struct folio *folio = NULL;</div><div class='add'>+	int error;</div><div class='add'>+</div><div class='add'>+	while ((folio = writeback_iter(mapping, wbc, folio, &amp;error)))</div><div class='add'>+		gfs2_aspace_write_folio(folio, wbc);</div><div class='add'>+</div><div class='add'>+	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations gfs2_meta_aops = {</div><div class='del'>-	.set_page_dirty	= __set_page_dirty_buffers,</div><div class='del'>-	.writepage = gfs2_aspace_writepage,</div><div class='del'>-	.releasepage = gfs2_releasepage,</div><div class='add'>+	.dirty_folio	= block_dirty_folio,</div><div class='add'>+	.invalidate_folio = block_invalidate_folio,</div><div class='add'>+	.writepages = gfs2_aspace_writepages,</div><div class='add'>+	.release_folio = gfs2_release_folio,</div><div class='add'>+	.migrate_folio = buffer_migrate_folio_norefs,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations gfs2_rgrp_aops = {</div><div class='del'>-	.set_page_dirty	= __set_page_dirty_buffers,</div><div class='del'>-	.writepage = gfs2_aspace_writepage,</div><div class='del'>-	.releasepage = gfs2_releasepage,</div><div class='add'>+	.dirty_folio	= block_dirty_folio,</div><div class='add'>+	.invalidate_folio = block_invalidate_folio,</div><div class='add'>+	.writepages = gfs2_aspace_writepages,</div><div class='add'>+	.release_folio = gfs2_release_folio,</div><div class='add'>+	.migrate_folio = buffer_migrate_folio_norefs,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -113,50 +127,45 @@ struct buffer_head *gfs2_getbuf(struct gfs2_glock *gl, u64 blkno, int create)</div><div class='ctx'> {</div><div class='ctx'> 	struct address_space *mapping = gfs2_glock2aspace(gl);</div><div class='ctx'> 	struct gfs2_sbd *sdp = gl-&gt;gl_name.ln_sbd;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> 	unsigned int shift;</div><div class='ctx'> 	unsigned long index;</div><div class='ctx'> 	unsigned int bufnum;</div><div class='ctx'> </div><div class='ctx'> 	if (mapping == NULL)</div><div class='del'>-		mapping = &amp;sdp-&gt;sd_aspace;</div><div class='add'>+		mapping = gfs2_aspace(sdp);</div><div class='ctx'> </div><div class='ctx'> 	shift = PAGE_SHIFT - sdp-&gt;sd_sb.sb_bsize_shift;</div><div class='ctx'> 	index = blkno &gt;&gt; shift;             /* convert block to page */</div><div class='ctx'> 	bufnum = blkno - (index &lt;&lt; shift);  /* block buf index within page */</div><div class='ctx'> </div><div class='ctx'> 	if (create) {</div><div class='del'>-		for (;;) {</div><div class='del'>-			page = grab_cache_page(mapping, index);</div><div class='del'>-			if (page)</div><div class='del'>-				break;</div><div class='del'>-			yield();</div><div class='del'>-		}</div><div class='del'>-		if (!page_has_buffers(page))</div><div class='del'>-			create_empty_buffers(page, sdp-&gt;sd_sb.sb_bsize, 0);</div><div class='add'>+		folio = __filemap_get_folio(mapping, index,</div><div class='add'>+				FGP_LOCK | FGP_ACCESSED | FGP_CREAT,</div><div class='add'>+				mapping_gfp_mask(mapping) | __GFP_NOFAIL);</div><div class='add'>+		bh = folio_buffers(folio);</div><div class='add'>+		if (!bh)</div><div class='add'>+			bh = create_empty_buffers(folio,</div><div class='add'>+				sdp-&gt;sd_sb.sb_bsize, 0);</div><div class='ctx'> 	} else {</div><div class='del'>-		page = find_get_page_flags(mapping, index,</div><div class='del'>-						FGP_LOCK|FGP_ACCESSED);</div><div class='del'>-		if (!page)</div><div class='add'>+		folio = __filemap_get_folio(mapping, index,</div><div class='add'>+				FGP_LOCK | FGP_ACCESSED, 0);</div><div class='add'>+		if (IS_ERR(folio))</div><div class='ctx'> 			return NULL;</div><div class='del'>-		if (!page_has_buffers(page)) {</div><div class='del'>-			bh = NULL;</div><div class='del'>-			goto out_unlock;</div><div class='del'>-		}</div><div class='add'>+		bh = folio_buffers(folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Locate header for our buffer within our page */</div><div class='del'>-	for (bh = page_buffers(page); bufnum--; bh = bh-&gt;b_this_page)</div><div class='del'>-		/* Do nothing */;</div><div class='del'>-	get_bh(bh);</div><div class='add'>+	if (!bh)</div><div class='add'>+		goto out_unlock;</div><div class='ctx'> </div><div class='add'>+	bh = get_nth_bh(bh, bufnum);</div><div class='ctx'> 	if (!buffer_mapped(bh))</div><div class='ctx'> 		map_bh(bh, sdp-&gt;sd_vfs, blkno);</div><div class='ctx'> </div><div class='ctx'> out_unlock:</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> </div><div class='ctx'> 	return bh;</div><div class='ctx'> }</div><div class='hunk'>@@ -191,15 +200,14 @@ struct buffer_head *gfs2_meta_new(struct gfs2_glock *gl, u64 blkno)</div><div class='ctx'> </div><div class='ctx'> static void gfs2_meta_read_endio(struct bio *bio)</div><div class='ctx'> {</div><div class='del'>-	struct bio_vec *bvec;</div><div class='del'>-	struct bvec_iter_all iter_all;</div><div class='add'>+	struct folio_iter fi;</div><div class='ctx'> </div><div class='del'>-	bio_for_each_segment_all(bvec, bio, iter_all) {</div><div class='del'>-		struct page *page = bvec-&gt;bv_page;</div><div class='del'>-		struct buffer_head *bh = page_buffers(page);</div><div class='del'>-		unsigned int len = bvec-&gt;bv_len;</div><div class='add'>+	bio_for_each_folio_all(fi, bio) {</div><div class='add'>+		struct folio *folio = fi.folio;</div><div class='add'>+		struct buffer_head *bh = folio_buffers(folio);</div><div class='add'>+		size_t len = fi.length;</div><div class='ctx'> </div><div class='del'>-		while (bh_offset(bh) &lt; bvec-&gt;bv_offset)</div><div class='add'>+		while (bh_offset(bh) &lt; fi.offset)</div><div class='ctx'> 			bh = bh-&gt;b_this_page;</div><div class='ctx'> 		do {</div><div class='ctx'> 			struct buffer_head *next = bh-&gt;b_this_page;</div><div class='hunk'>@@ -215,19 +223,17 @@ static void gfs2_meta_read_endio(struct bio *bio)</div><div class='ctx'>  * Submit several consecutive buffer head I/O requests as a single bio I/O</div><div class='ctx'>  * request.  (See submit_bh_wbc.)</div><div class='ctx'>  */</div><div class='del'>-static void gfs2_submit_bhs(int op, int op_flags, struct buffer_head *bhs[],</div><div class='del'>-			    int num)</div><div class='add'>+static void gfs2_submit_bhs(blk_opf_t opf, struct buffer_head *bhs[], int num)</div><div class='ctx'> {</div><div class='ctx'> 	while (num &gt; 0) {</div><div class='ctx'> 		struct buffer_head *bh = *bhs;</div><div class='ctx'> 		struct bio *bio;</div><div class='ctx'> </div><div class='del'>-		bio = bio_alloc(GFP_NOIO, num);</div><div class='del'>-		bio-&gt;bi_iter.bi_sector = bh-&gt;b_blocknr * (bh-&gt;b_size &gt;&gt; 9);</div><div class='del'>-		bio_set_dev(bio, bh-&gt;b_bdev);</div><div class='add'>+		bio = bio_alloc(bh-&gt;b_bdev, num, opf, GFP_NOIO);</div><div class='add'>+		bio-&gt;bi_iter.bi_sector = bh-&gt;b_blocknr * (bh-&gt;b_size &gt;&gt; SECTOR_SHIFT);</div><div class='ctx'> 		while (num &gt; 0) {</div><div class='ctx'> 			bh = *bhs;</div><div class='del'>-			if (!bio_add_page(bio, bh-&gt;b_page, bh-&gt;b_size, bh_offset(bh))) {</div><div class='add'>+			if (!bio_add_folio(bio, bh-&gt;b_folio, bh-&gt;b_size, bh_offset(bh))) {</div><div class='ctx'> 				BUG_ON(bio-&gt;bi_iter.bi_size == 0);</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -235,7 +241,6 @@ static void gfs2_submit_bhs(int op, int op_flags, struct buffer_head *bhs[],</div><div class='ctx'> 			num--;</div><div class='ctx'> 		}</div><div class='ctx'> 		bio-&gt;bi_end_io = gfs2_meta_read_endio;</div><div class='del'>-		bio_set_op_attrs(bio, op, op_flags);</div><div class='ctx'> 		submit_bio(bio);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -258,7 +263,7 @@ int gfs2_meta_read(struct gfs2_glock *gl, u64 blkno, int flags,</div><div class='ctx'> 	struct buffer_head *bh, *bhs[2];</div><div class='ctx'> 	int num = 0;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(gfs2_withdrawn(sdp)) &amp;&amp; !gfs2_withdraw_in_prog(sdp)) {</div><div class='add'>+	if (gfs2_withdrawn(sdp)) {</div><div class='ctx'> 		*bhp = NULL;</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -288,7 +293,7 @@ int gfs2_meta_read(struct gfs2_glock *gl, u64 blkno, int flags,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	gfs2_submit_bhs(REQ_OP_READ, REQ_META | REQ_PRIO, bhs, num);</div><div class='add'>+	gfs2_submit_bhs(REQ_OP_READ | REQ_META | REQ_PRIO, bhs, num);</div><div class='ctx'> 	if (!(flags &amp; DIO_WAIT))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='hunk'>@@ -297,7 +302,7 @@ int gfs2_meta_read(struct gfs2_glock *gl, u64 blkno, int flags,</div><div class='ctx'> 	if (unlikely(!buffer_uptodate(bh))) {</div><div class='ctx'> 		struct gfs2_trans *tr = current-&gt;journal_info;</div><div class='ctx'> 		if (tr &amp;&amp; test_bit(TR_TOUCHED, &amp;tr-&gt;tr_flags))</div><div class='del'>-			gfs2_io_error_bh_wd(sdp, bh);</div><div class='add'>+			gfs2_io_error_bh(sdp, bh);</div><div class='ctx'> 		brelse(bh);</div><div class='ctx'> 		*bhp = NULL;</div><div class='ctx'> 		return -EIO;</div><div class='hunk'>@@ -316,7 +321,7 @@ int gfs2_meta_read(struct gfs2_glock *gl, u64 blkno, int flags,</div><div class='ctx'> </div><div class='ctx'> int gfs2_meta_wait(struct gfs2_sbd *sdp, struct buffer_head *bh)</div><div class='ctx'> {</div><div class='del'>-	if (unlikely(gfs2_withdrawn(sdp)) &amp;&amp; !gfs2_withdraw_in_prog(sdp))</div><div class='add'>+	if (gfs2_withdrawn(sdp))</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> </div><div class='ctx'> 	wait_on_buffer(bh);</div><div class='hunk'>@@ -324,10 +329,10 @@ int gfs2_meta_wait(struct gfs2_sbd *sdp, struct buffer_head *bh)</div><div class='ctx'> 	if (!buffer_uptodate(bh)) {</div><div class='ctx'> 		struct gfs2_trans *tr = current-&gt;journal_info;</div><div class='ctx'> 		if (tr &amp;&amp; test_bit(TR_TOUCHED, &amp;tr-&gt;tr_flags))</div><div class='del'>-			gfs2_io_error_bh_wd(sdp, bh);</div><div class='add'>+			gfs2_io_error_bh(sdp, bh);</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='del'>-	if (unlikely(gfs2_withdrawn(sdp)) &amp;&amp; !gfs2_withdraw_in_prog(sdp))</div><div class='add'>+	if (gfs2_withdrawn(sdp))</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -335,7 +340,7 @@ int gfs2_meta_wait(struct gfs2_sbd *sdp, struct buffer_head *bh)</div><div class='ctx'> </div><div class='ctx'> void gfs2_remove_from_journal(struct buffer_head *bh, int meta)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *mapping = bh-&gt;b_page-&gt;mapping;</div><div class='add'>+	struct address_space *mapping = bh-&gt;b_folio-&gt;mapping;</div><div class='ctx'> 	struct gfs2_sbd *sdp = gfs2_mapping2sbd(mapping);</div><div class='ctx'> 	struct gfs2_bufdata *bd = bh-&gt;b_private;</div><div class='ctx'> 	struct gfs2_trans *tr = current-&gt;journal_info;</div><div class='hunk'>@@ -406,26 +411,20 @@ static struct buffer_head *gfs2_getjdatabuf(struct gfs2_inode *ip, u64 blkno)</div><div class='ctx'> {</div><div class='ctx'> 	struct address_space *mapping = ip-&gt;i_inode.i_mapping;</div><div class='ctx'> 	struct gfs2_sbd *sdp = GFS2_SB(&amp;ip-&gt;i_inode);</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> 	unsigned int shift = PAGE_SHIFT - sdp-&gt;sd_sb.sb_bsize_shift;</div><div class='ctx'> 	unsigned long index = blkno &gt;&gt; shift; /* convert block to page */</div><div class='ctx'> 	unsigned int bufnum = blkno - (index &lt;&lt; shift);</div><div class='ctx'> </div><div class='del'>-	page = find_get_page_flags(mapping, index, FGP_LOCK|FGP_ACCESSED);</div><div class='del'>-	if (!page)</div><div class='del'>-		return NULL;</div><div class='del'>-	if (!page_has_buffers(page)) {</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		put_page(page);</div><div class='add'>+	folio = __filemap_get_folio(mapping, index, FGP_LOCK | FGP_ACCESSED, 0);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='ctx'> 		return NULL;</div><div class='del'>-	}</div><div class='del'>-	/* Locate header for our buffer within our page */</div><div class='del'>-	for (bh = page_buffers(page); bufnum--; bh = bh-&gt;b_this_page)</div><div class='del'>-		/* Do nothing */;</div><div class='del'>-	get_bh(bh);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='add'>+	bh = folio_buffers(folio);</div><div class='add'>+	if (bh)</div><div class='add'>+		bh = get_nth_bh(bh, bufnum);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> 	return bh;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -443,6 +442,10 @@ void gfs2_journal_wipe(struct gfs2_inode *ip, u64 bstart, u32 blen)</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> 	int ty;</div><div class='ctx'> </div><div class='add'>+	/* This can only happen during incomplete inode creation. */</div><div class='add'>+	if (!ip-&gt;i_gl)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='ctx'> 	gfs2_ail1_wipe(sdp, bstart, blen);</div><div class='ctx'> 	while (blen) {</div><div class='ctx'> 		ty = REMOVE_META;</div><div class='hunk'>@@ -526,8 +529,7 @@ struct buffer_head *gfs2_meta_ra(struct gfs2_glock *gl, u64 dblock, u32 extlen)</div><div class='ctx'> </div><div class='ctx'> 	if (buffer_uptodate(first_bh))</div><div class='ctx'> 		goto out;</div><div class='del'>-	if (!buffer_locked(first_bh))</div><div class='del'>-		ll_rw_block(REQ_OP_READ, REQ_META | REQ_PRIO, 1, &amp;first_bh);</div><div class='add'>+	bh_read_nowait(first_bh, REQ_META | REQ_PRIO);</div><div class='ctx'> </div><div class='ctx'> 	dblock++;</div><div class='ctx'> 	extlen--;</div><div class='hunk'>@@ -535,10 +537,7 @@ struct buffer_head *gfs2_meta_ra(struct gfs2_glock *gl, u64 dblock, u32 extlen)</div><div class='ctx'> 	while (extlen) {</div><div class='ctx'> 		bh = gfs2_getbuf(gl, dblock, CREATE);</div><div class='ctx'> </div><div class='del'>-		if (!buffer_uptodate(bh) &amp;&amp; !buffer_locked(bh))</div><div class='del'>-			ll_rw_block(REQ_OP_READ,</div><div class='del'>-				    REQ_RAHEAD | REQ_META | REQ_PRIO,</div><div class='del'>-				    1, &amp;bh);</div><div class='add'>+		bh_readahead(bh, REQ_RAHEAD | REQ_META | REQ_PRIO);</div><div class='ctx'> 		brelse(bh);</div><div class='ctx'> 		dblock++;</div><div class='ctx'> 		extlen--;</div><div class='head'>diff --git a/fs/gfs2/meta_io.h b/fs/gfs2/meta_io.h<br/>index 21880d72081a..b7c8a6684d02 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/meta_io.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/meta_io.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/meta_io.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/meta_io.h</a></div><div class='hunk'>@@ -40,29 +40,29 @@ extern const struct address_space_operations gfs2_rgrp_aops;</div><div class='ctx'> static inline struct gfs2_sbd *gfs2_mapping2sbd(struct address_space *mapping)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='del'>-	if (mapping-&gt;a_ops == &amp;gfs2_meta_aops)</div><div class='del'>-		return (((struct gfs2_glock *)mapping) - 1)-&gt;gl_name.ln_sbd;</div><div class='del'>-	else if (mapping-&gt;a_ops == &amp;gfs2_rgrp_aops)</div><div class='del'>-		return container_of(mapping, struct gfs2_sbd, sd_aspace);</div><div class='del'>-	else</div><div class='add'>+	if (mapping-&gt;a_ops == &amp;gfs2_meta_aops) {</div><div class='add'>+		struct gfs2_glock_aspace *gla =</div><div class='add'>+			container_of(mapping, struct gfs2_glock_aspace, mapping);</div><div class='add'>+		return gla-&gt;glock.gl_name.ln_sbd;</div><div class='add'>+	} else</div><div class='ctx'> 		return inode-&gt;i_sb-&gt;s_fs_info;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-extern struct buffer_head *gfs2_meta_new(struct gfs2_glock *gl, u64 blkno);</div><div class='del'>-extern int gfs2_meta_read(struct gfs2_glock *gl, u64 blkno, int flags,</div><div class='del'>-			  int rahead, struct buffer_head **bhp);</div><div class='del'>-extern int gfs2_meta_wait(struct gfs2_sbd *sdp, struct buffer_head *bh);</div><div class='del'>-extern struct buffer_head *gfs2_getbuf(struct gfs2_glock *gl, u64 blkno,</div><div class='del'>-				       int create);</div><div class='add'>+struct buffer_head *gfs2_meta_new(struct gfs2_glock *gl, u64 blkno);</div><div class='add'>+int gfs2_meta_read(struct gfs2_glock *gl, u64 blkno, int flags,</div><div class='add'>+		   int rahead, struct buffer_head **bhp);</div><div class='add'>+int gfs2_meta_wait(struct gfs2_sbd *sdp, struct buffer_head *bh);</div><div class='add'>+struct buffer_head *gfs2_getbuf(struct gfs2_glock *gl, u64 blkno,</div><div class='add'>+			        int create);</div><div class='ctx'> enum {</div><div class='ctx'> 	REMOVE_JDATA = 0,</div><div class='ctx'> 	REMOVE_META = 1,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-extern void gfs2_remove_from_journal(struct buffer_head *bh, int meta);</div><div class='del'>-extern void gfs2_journal_wipe(struct gfs2_inode *ip, u64 bstart, u32 blen);</div><div class='del'>-extern int gfs2_meta_buffer(struct gfs2_inode *ip, u32 mtype, u64 num,</div><div class='del'>-			    struct buffer_head **bhp);</div><div class='add'>+void gfs2_remove_from_journal(struct buffer_head *bh, int meta);</div><div class='add'>+void gfs2_journal_wipe(struct gfs2_inode *ip, u64 bstart, u32 blen);</div><div class='add'>+int gfs2_meta_buffer(struct gfs2_inode *ip, u32 mtype, u64 num,</div><div class='add'>+		     struct buffer_head **bhp);</div><div class='ctx'> </div><div class='ctx'> static inline int gfs2_meta_inode_buffer(struct gfs2_inode *ip,</div><div class='ctx'> 					 struct buffer_head **bhp)</div><div class='head'>diff --git a/fs/gfs2/ops_fstype.c b/fs/gfs2/ops_fstype.c<br/>index 7f8410d8fdc1..e7a88b717991 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/ops_fstype.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/ops_fstype.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/ops_fstype.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/ops_fstype.c</a></div><div class='hunk'>@@ -60,19 +60,21 @@ static void gfs2_tune_init(struct gfs2_tune *gt)</div><div class='ctx'> 	gt-&gt;gt_new_files_jdata = 0;</div><div class='ctx'> 	gt-&gt;gt_max_readahead = BIT(18);</div><div class='ctx'> 	gt-&gt;gt_complain_secs = 10;</div><div class='add'>+	gt-&gt;gt_withdraw_helper_timeout = 5;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void free_sbd(struct gfs2_sbd *sdp)</div><div class='ctx'> {</div><div class='del'>-	if (sdp-&gt;sd_lkstats)</div><div class='del'>-		free_percpu(sdp-&gt;sd_lkstats);</div><div class='add'>+	struct super_block *sb = sdp-&gt;sd_vfs;</div><div class='add'>+</div><div class='add'>+	free_percpu(sdp-&gt;sd_lkstats);</div><div class='add'>+	sb-&gt;s_fs_info = NULL;</div><div class='ctx'> 	kfree(sdp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct gfs2_sbd *init_sbd(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_sbd *sdp;</div><div class='del'>-	struct address_space *mapping;</div><div class='ctx'> </div><div class='ctx'> 	sdp = kzalloc(sizeof(struct gfs2_sbd), GFP_KERNEL);</div><div class='ctx'> 	if (!sdp)</div><div class='hunk'>@@ -87,11 +89,11 @@ static struct gfs2_sbd *init_sbd(struct super_block *sb)</div><div class='ctx'> 	set_bit(SDF_NOJOURNALID, &amp;sdp-&gt;sd_flags);</div><div class='ctx'> 	gfs2_tune_init(&amp;sdp-&gt;sd_tune);</div><div class='ctx'> </div><div class='del'>-	init_waitqueue_head(&amp;sdp-&gt;sd_glock_wait);</div><div class='add'>+	init_waitqueue_head(&amp;sdp-&gt;sd_kill_wait);</div><div class='ctx'> 	init_waitqueue_head(&amp;sdp-&gt;sd_async_glock_wait);</div><div class='ctx'> 	atomic_set(&amp;sdp-&gt;sd_glock_disposal, 0);</div><div class='ctx'> 	init_completion(&amp;sdp-&gt;sd_locking_init);</div><div class='del'>-	init_completion(&amp;sdp-&gt;sd_wdack);</div><div class='add'>+	init_completion(&amp;sdp-&gt;sd_withdraw_helper);</div><div class='ctx'> 	spin_lock_init(&amp;sdp-&gt;sd_statfs_spin);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock_init(&amp;sdp-&gt;sd_rindex_spin);</div><div class='hunk'>@@ -103,25 +105,12 @@ static struct gfs2_sbd *init_sbd(struct super_block *sb)</div><div class='ctx'> 	init_completion(&amp;sdp-&gt;sd_journal_ready);</div><div class='ctx'> </div><div class='ctx'> 	INIT_LIST_HEAD(&amp;sdp-&gt;sd_quota_list);</div><div class='del'>-	mutex_init(&amp;sdp-&gt;sd_quota_mutex);</div><div class='ctx'> 	mutex_init(&amp;sdp-&gt;sd_quota_sync_mutex);</div><div class='ctx'> 	init_waitqueue_head(&amp;sdp-&gt;sd_quota_wait);</div><div class='del'>-	INIT_LIST_HEAD(&amp;sdp-&gt;sd_trunc_list);</div><div class='del'>-	spin_lock_init(&amp;sdp-&gt;sd_trunc_lock);</div><div class='ctx'> 	spin_lock_init(&amp;sdp-&gt;sd_bitmap_lock);</div><div class='ctx'> </div><div class='ctx'> 	INIT_LIST_HEAD(&amp;sdp-&gt;sd_sc_inodes_list);</div><div class='ctx'> </div><div class='del'>-	mapping = &amp;sdp-&gt;sd_aspace;</div><div class='del'>-</div><div class='del'>-	address_space_init_once(mapping);</div><div class='del'>-	mapping-&gt;a_ops = &amp;gfs2_rgrp_aops;</div><div class='del'>-	mapping-&gt;host = sb-&gt;s_bdev-&gt;bd_inode;</div><div class='del'>-	mapping-&gt;flags = 0;</div><div class='del'>-	mapping_set_gfp_mask(mapping, GFP_NOFS);</div><div class='del'>-	mapping-&gt;private_data = NULL;</div><div class='del'>-	mapping-&gt;writeback_index = 0;</div><div class='del'>-</div><div class='ctx'> 	spin_lock_init(&amp;sdp-&gt;sd_log_lock);</div><div class='ctx'> 	atomic_set(&amp;sdp-&gt;sd_log_pinned, 0);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;sdp-&gt;sd_log_revokes);</div><div class='hunk'>@@ -137,8 +126,8 @@ static struct gfs2_sbd *init_sbd(struct super_block *sb)</div><div class='ctx'> 	init_rwsem(&amp;sdp-&gt;sd_log_flush_lock);</div><div class='ctx'> 	atomic_set(&amp;sdp-&gt;sd_log_in_flight, 0);</div><div class='ctx'> 	init_waitqueue_head(&amp;sdp-&gt;sd_log_flush_wait);</div><div class='del'>-	atomic_set(&amp;sdp-&gt;sd_freeze_state, SFS_UNFROZEN);</div><div class='ctx'> 	mutex_init(&amp;sdp-&gt;sd_freeze_mutex);</div><div class='add'>+	INIT_LIST_HEAD(&amp;sdp-&gt;sd_dead_glocks);</div><div class='ctx'> </div><div class='ctx'> 	return sdp;</div><div class='ctx'> </div><div class='hunk'>@@ -175,31 +164,22 @@ static int gfs2_check_sb(struct gfs2_sbd *sdp, int silent)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (sb-&gt;sb_bsize &lt; 512 || sb-&gt;sb_bsize &gt; PAGE_SIZE ||</div><div class='add'>+	if (sb-&gt;sb_bsize &lt; SECTOR_SIZE || sb-&gt;sb_bsize &gt; PAGE_SIZE ||</div><div class='ctx'> 	    (sb-&gt;sb_bsize &amp; (sb-&gt;sb_bsize - 1))) {</div><div class='ctx'> 		pr_warn("Invalid block size\n");</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='add'>+	if (sb-&gt;sb_bsize_shift != ffs(sb-&gt;sb_bsize) - 1) {</div><div class='add'>+		pr_warn("Invalid block size shift\n");</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void end_bio_io_page(struct bio *bio)</div><div class='del'>-{</div><div class='del'>-	struct page *page = bio-&gt;bi_private;</div><div class='del'>-</div><div class='del'>-	if (!bio-&gt;bi_status)</div><div class='del'>-		SetPageUptodate(page);</div><div class='del'>-	else</div><div class='del'>-		pr_warn("error %d reading superblock\n", bio-&gt;bi_status);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void gfs2_sb_in(struct gfs2_sbd *sdp, const void *buf)</div><div class='add'>+static void gfs2_sb_in(struct gfs2_sbd *sdp, const struct gfs2_sb *str)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_sb_host *sb = &amp;sdp-&gt;sd_sb;</div><div class='ctx'> 	struct super_block *s = sdp-&gt;sd_vfs;</div><div class='del'>-	const struct gfs2_sb *str = buf;</div><div class='ctx'> </div><div class='ctx'> 	sb-&gt;sb_magic = be32_to_cpu(str-&gt;sb_header.mh_magic);</div><div class='ctx'> 	sb-&gt;sb_type = be32_to_cpu(str-&gt;sb_header.mh_type);</div><div class='hunk'>@@ -214,7 +194,7 @@ static void gfs2_sb_in(struct gfs2_sbd *sdp, const void *buf)</div><div class='ctx'> </div><div class='ctx'> 	memcpy(sb-&gt;sb_lockproto, str-&gt;sb_lockproto, GFS2_LOCKNAME_LEN);</div><div class='ctx'> 	memcpy(sb-&gt;sb_locktable, str-&gt;sb_locktable, GFS2_LOCKNAME_LEN);</div><div class='del'>-	memcpy(&amp;s-&gt;s_uuid, str-&gt;sb_uuid, 16);</div><div class='add'>+	super_set_uuid(s, str-&gt;sb_uuid, 16);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -238,38 +218,22 @@ static void gfs2_sb_in(struct gfs2_sbd *sdp, const void *buf)</div><div class='ctx'> </div><div class='ctx'> static int gfs2_read_super(struct gfs2_sbd *sdp, sector_t sector, int silent)</div><div class='ctx'> {</div><div class='del'>-	struct super_block *sb = sdp-&gt;sd_vfs;</div><div class='del'>-	struct gfs2_sb *p;</div><div class='del'>-	struct page *page;</div><div class='del'>-	struct bio *bio;</div><div class='add'>+	struct gfs2_sb *sb;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='del'>-	page = alloc_page(GFP_NOFS);</div><div class='del'>-	if (unlikely(!page))</div><div class='add'>+	sb = kmalloc(PAGE_SIZE, GFP_KERNEL);</div><div class='add'>+	if (unlikely(!sb))</div><div class='ctx'> 		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	ClearPageUptodate(page);</div><div class='del'>-	ClearPageDirty(page);</div><div class='del'>-	lock_page(page);</div><div class='del'>-</div><div class='del'>-	bio = bio_alloc(GFP_NOFS, 1);</div><div class='del'>-	bio-&gt;bi_iter.bi_sector = sector * (sb-&gt;s_blocksize &gt;&gt; 9);</div><div class='del'>-	bio_set_dev(bio, sb-&gt;s_bdev);</div><div class='del'>-	bio_add_page(bio, page, PAGE_SIZE, 0);</div><div class='del'>-</div><div class='del'>-	bio-&gt;bi_end_io = end_bio_io_page;</div><div class='del'>-	bio-&gt;bi_private = page;</div><div class='del'>-	bio_set_op_attrs(bio, REQ_OP_READ, REQ_META);</div><div class='del'>-	submit_bio(bio);</div><div class='del'>-	wait_on_page_locked(page);</div><div class='del'>-	bio_put(bio);</div><div class='del'>-	if (!PageUptodate(page)) {</div><div class='del'>-		__free_page(page);</div><div class='del'>-		return -EIO;</div><div class='del'>-	}</div><div class='del'>-	p = kmap(page);</div><div class='del'>-	gfs2_sb_in(sdp, p);</div><div class='del'>-	kunmap(page);</div><div class='del'>-	__free_page(page);</div><div class='add'>+	err = bdev_rw_virt(sdp-&gt;sd_vfs-&gt;s_bdev,</div><div class='add'>+			   sector &lt;&lt; (sdp-&gt;sd_vfs-&gt;s_blocksize_bits - SECTOR_SHIFT),</div><div class='add'>+			   sb, PAGE_SIZE, REQ_OP_READ | REQ_META);</div><div class='add'>+	if (err) {</div><div class='add'>+		pr_warn("error %d reading superblock\n", err);</div><div class='add'>+		kfree(sb);</div><div class='add'>+		return err;</div><div class='add'>+	}</div><div class='add'>+	gfs2_sb_in(sdp, sb);</div><div class='add'>+	kfree(sb);</div><div class='ctx'> 	return gfs2_check_sb(sdp, silent);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -294,8 +258,7 @@ static int gfs2_read_sb(struct gfs2_sbd *sdp, int silent)</div><div class='ctx'> 		return error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	sdp-&gt;sd_fsb2bb_shift = sdp-&gt;sd_sb.sb_bsize_shift -</div><div class='del'>-			       GFS2_BASIC_BLOCK_SHIFT;</div><div class='add'>+	sdp-&gt;sd_fsb2bb_shift = sdp-&gt;sd_sb.sb_bsize_shift - SECTOR_SHIFT;</div><div class='ctx'> 	sdp-&gt;sd_fsb2bb = BIT(sdp-&gt;sd_fsb2bb_shift);</div><div class='ctx'> 	sdp-&gt;sd_diptrs = (sdp-&gt;sd_sb.sb_bsize -</div><div class='ctx'> 			  sizeof(struct gfs2_dinode)) / sizeof(u64);</div><div class='hunk'>@@ -385,8 +348,10 @@ static int init_names(struct gfs2_sbd *sdp, int silent)</div><div class='ctx'> 	if (!table[0])</div><div class='ctx'> 		table = sdp-&gt;sd_vfs-&gt;s_id;</div><div class='ctx'> </div><div class='del'>-	strlcpy(sdp-&gt;sd_proto_name, proto, GFS2_FSNAME_LEN);</div><div class='del'>-	strlcpy(sdp-&gt;sd_table_name, table, GFS2_FSNAME_LEN);</div><div class='add'>+	BUILD_BUG_ON(GFS2_LOCKNAME_LEN &gt; GFS2_FSNAME_LEN);</div><div class='add'>+</div><div class='add'>+	strscpy(sdp-&gt;sd_proto_name, proto, GFS2_LOCKNAME_LEN);</div><div class='add'>+	strscpy(sdp-&gt;sd_table_name, table, GFS2_LOCKNAME_LEN);</div><div class='ctx'> </div><div class='ctx'> 	table = sdp-&gt;sd_table_name;</div><div class='ctx'> 	while ((table = strchr(table, '/')))</div><div class='hunk'>@@ -405,7 +370,8 @@ static int init_locking(struct gfs2_sbd *sdp, struct gfs2_holder *mount_gh,</div><div class='ctx'> </div><div class='ctx'> 	error = gfs2_glock_nq_num(sdp,</div><div class='ctx'> 				  GFS2_MOUNT_LOCK, &amp;gfs2_nondisk_glops,</div><div class='del'>-				  LM_ST_EXCLUSIVE, LM_FLAG_NOEXP | GL_NOCACHE,</div><div class='add'>+				  LM_ST_EXCLUSIVE,</div><div class='add'>+				  LM_FLAG_RECOVER | GL_NOCACHE | GL_NOPID,</div><div class='ctx'> 				  mount_gh);</div><div class='ctx'> 	if (error) {</div><div class='ctx'> 		fs_err(sdp, "can't acquire mount glock: %d\n", error);</div><div class='hunk'>@@ -415,7 +381,7 @@ static int init_locking(struct gfs2_sbd *sdp, struct gfs2_holder *mount_gh,</div><div class='ctx'> 	error = gfs2_glock_nq_num(sdp,</div><div class='ctx'> 				  GFS2_LIVE_LOCK, &amp;gfs2_nondisk_glops,</div><div class='ctx'> 				  LM_ST_SHARED,</div><div class='del'>-				  LM_FLAG_NOEXP | GL_EXACT,</div><div class='add'>+				  LM_FLAG_RECOVER | GL_EXACT | GL_NOPID,</div><div class='ctx'> 				  &amp;sdp-&gt;sd_live_gh);</div><div class='ctx'> 	if (error) {</div><div class='ctx'> 		fs_err(sdp, "can't acquire live glock: %d\n", error);</div><div class='hunk'>@@ -432,7 +398,7 @@ static int init_locking(struct gfs2_sbd *sdp, struct gfs2_holder *mount_gh,</div><div class='ctx'> 	error = gfs2_glock_get(sdp, GFS2_FREEZE_LOCK, &amp;gfs2_freeze_glops,</div><div class='ctx'> 			       CREATE, &amp;sdp-&gt;sd_freeze_gl);</div><div class='ctx'> 	if (error) {</div><div class='del'>-		fs_err(sdp, "can't create transaction glock: %d\n", error);</div><div class='add'>+		fs_err(sdp, "can't create freeze glock: %d\n", error);</div><div class='ctx'> 		goto fail_rename;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -520,7 +486,9 @@ static int init_sb(struct gfs2_sbd *sdp, int silent)</div><div class='ctx'> 		       sdp-&gt;sd_sb.sb_bsize, (unsigned int)PAGE_SIZE);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	sb_set_blocksize(sb, sdp-&gt;sd_sb.sb_bsize);</div><div class='add'>+	ret = -EINVAL;</div><div class='add'>+	if (!sb_set_blocksize(sb, sdp-&gt;sd_sb.sb_bsize))</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='ctx'> 	/* Get the root inode */</div><div class='ctx'> 	no_addr = sdp-&gt;sd_sb.sb_root_dir.no_addr;</div><div class='hunk'>@@ -575,8 +543,6 @@ static int gfs2_jindex_hold(struct gfs2_sbd *sdp, struct gfs2_holder *ji_gh)</div><div class='ctx'> 	mutex_lock(&amp;sdp-&gt;sd_jindex_mutex);</div><div class='ctx'> </div><div class='ctx'> 	for (;;) {</div><div class='del'>-		struct gfs2_inode *jip;</div><div class='del'>-</div><div class='ctx'> 		error = gfs2_glock_nq_init(dip-&gt;i_gl, LM_ST_SHARED, 0, ji_gh);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -617,8 +583,6 @@ static int gfs2_jindex_hold(struct gfs2_sbd *sdp, struct gfs2_holder *ji_gh)</div><div class='ctx'> 		d_mark_dontcache(jd-&gt;jd_inode);</div><div class='ctx'> 		spin_lock(&amp;sdp-&gt;sd_jindex_spin);</div><div class='ctx'> 		jd-&gt;jd_jid = sdp-&gt;sd_journals++;</div><div class='del'>-		jip = GFS2_I(jd-&gt;jd_inode);</div><div class='del'>-		jd-&gt;jd_no_addr = jip-&gt;i_no_addr;</div><div class='ctx'> 		list_add_tail(&amp;jd-&gt;jd_list, &amp;sdp-&gt;sd_jindex_list);</div><div class='ctx'> 		spin_unlock(&amp;sdp-&gt;sd_jindex_spin);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -647,7 +611,7 @@ static int init_statfs(struct gfs2_sbd *sdp)</div><div class='ctx'> 	struct gfs2_jdesc *jd;</div><div class='ctx'> 	struct gfs2_inode *ip;</div><div class='ctx'> </div><div class='del'>-	sdp-&gt;sd_statfs_inode = gfs2_lookup_simple(master, "statfs");</div><div class='add'>+	sdp-&gt;sd_statfs_inode = gfs2_lookup_meta(master, "statfs");</div><div class='ctx'> 	if (IS_ERR(sdp-&gt;sd_statfs_inode)) {</div><div class='ctx'> 		error = PTR_ERR(sdp-&gt;sd_statfs_inode);</div><div class='ctx'> 		fs_err(sdp, "can't read in statfs inode: %d\n", error);</div><div class='hunk'>@@ -656,7 +620,7 @@ static int init_statfs(struct gfs2_sbd *sdp)</div><div class='ctx'> 	if (sdp-&gt;sd_args.ar_spectator)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	pn = gfs2_lookup_simple(master, "per_node");</div><div class='add'>+	pn = gfs2_lookup_meta(master, "per_node");</div><div class='ctx'> 	if (IS_ERR(pn)) {</div><div class='ctx'> 		error = PTR_ERR(pn);</div><div class='ctx'> 		fs_err(sdp, "can't find per_node directory: %d\n", error);</div><div class='hunk'>@@ -673,7 +637,7 @@ static int init_statfs(struct gfs2_sbd *sdp)</div><div class='ctx'> 			goto free_local;</div><div class='ctx'> 		}</div><div class='ctx'> 		sprintf(buf, "statfs_change%u", jd-&gt;jd_jid);</div><div class='del'>-		lsi-&gt;si_sc_inode = gfs2_lookup_simple(pn, buf);</div><div class='add'>+		lsi-&gt;si_sc_inode = gfs2_lookup_meta(pn, buf);</div><div class='ctx'> 		if (IS_ERR(lsi-&gt;si_sc_inode)) {</div><div class='ctx'> 			error = PTR_ERR(lsi-&gt;si_sc_inode);</div><div class='ctx'> 			fs_err(sdp, "can't find local \"sc\" file#%u: %d\n",</div><div class='hunk'>@@ -691,7 +655,7 @@ static int init_statfs(struct gfs2_sbd *sdp)</div><div class='ctx'> 	iput(pn);</div><div class='ctx'> 	pn = NULL;</div><div class='ctx'> 	ip = GFS2_I(sdp-&gt;sd_sc_inode);</div><div class='del'>-	error = gfs2_glock_nq_init(ip-&gt;i_gl, LM_ST_EXCLUSIVE, 0,</div><div class='add'>+	error = gfs2_glock_nq_init(ip-&gt;i_gl, LM_ST_EXCLUSIVE, GL_NOPID,</div><div class='ctx'> 				   &amp;sdp-&gt;sd_sc_gh);</div><div class='ctx'> 	if (error) {</div><div class='ctx'> 		fs_err(sdp, "can't lock local \"sc\" file: %d\n", error);</div><div class='hunk'>@@ -732,15 +696,13 @@ static int init_journal(struct gfs2_sbd *sdp, int undo)</div><div class='ctx'> 	struct inode *master = d_inode(sdp-&gt;sd_master_dir);</div><div class='ctx'> 	struct gfs2_holder ji_gh;</div><div class='ctx'> 	struct gfs2_inode *ip;</div><div class='del'>-	int jindex = 1;</div><div class='ctx'> 	int error = 0;</div><div class='ctx'> </div><div class='del'>-	if (undo) {</div><div class='del'>-		jindex = 0;</div><div class='add'>+	gfs2_holder_mark_uninitialized(&amp;ji_gh);</div><div class='add'>+	if (undo)</div><div class='ctx'> 		goto fail_statfs;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	sdp-&gt;sd_jindex = gfs2_lookup_simple(master, "jindex");</div><div class='add'>+	sdp-&gt;sd_jindex = gfs2_lookup_meta(master, "jindex");</div><div class='ctx'> 	if (IS_ERR(sdp-&gt;sd_jindex)) {</div><div class='ctx'> 		fs_err(sdp, "can't lookup journal index: %d\n", error);</div><div class='ctx'> 		return PTR_ERR(sdp-&gt;sd_jindex);</div><div class='hunk'>@@ -780,7 +742,7 @@ static int init_journal(struct gfs2_sbd *sdp, int undo)</div><div class='ctx'> 		error = gfs2_glock_nq_num(sdp, sdp-&gt;sd_lockstruct.ls_jid,</div><div class='ctx'> 					  &amp;gfs2_journal_glops,</div><div class='ctx'> 					  LM_ST_EXCLUSIVE,</div><div class='del'>-					  LM_FLAG_NOEXP | GL_NOCACHE,</div><div class='add'>+					  LM_FLAG_RECOVER | GL_NOPID,</div><div class='ctx'> 					  &amp;sdp-&gt;sd_journal_gh);</div><div class='ctx'> 		if (error) {</div><div class='ctx'> 			fs_err(sdp, "can't acquire journal glock: %d\n", error);</div><div class='hunk'>@@ -788,9 +750,9 @@ static int init_journal(struct gfs2_sbd *sdp, int undo)</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		ip = GFS2_I(sdp-&gt;sd_jdesc-&gt;jd_inode);</div><div class='del'>-		sdp-&gt;sd_jinode_gl = ip-&gt;i_gl;</div><div class='ctx'> 		error = gfs2_glock_nq_init(ip-&gt;i_gl, LM_ST_SHARED,</div><div class='del'>-					   LM_FLAG_NOEXP | GL_EXACT | GL_NOCACHE,</div><div class='add'>+					   LM_FLAG_RECOVER | GL_EXACT |</div><div class='add'>+					   GL_NOCACHE | GL_NOPID,</div><div class='ctx'> 					   &amp;sdp-&gt;sd_jinode_gh);</div><div class='ctx'> 		if (error) {</div><div class='ctx'> 			fs_err(sdp, "can't acquire journal inode glock: %d\n",</div><div class='hunk'>@@ -849,24 +811,20 @@ static int init_journal(struct gfs2_sbd *sdp, int undo)</div><div class='ctx'> 	sdp-&gt;sd_log_idle = 1;</div><div class='ctx'> 	set_bit(SDF_JOURNAL_CHECKED, &amp;sdp-&gt;sd_flags);</div><div class='ctx'> 	gfs2_glock_dq_uninit(&amp;ji_gh);</div><div class='del'>-	jindex = 0;</div><div class='ctx'> 	INIT_WORK(&amp;sdp-&gt;sd_freeze_work, gfs2_freeze_func);</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> fail_statfs:</div><div class='ctx'> 	uninit_statfs(sdp);</div><div class='ctx'> fail_jinode_gh:</div><div class='del'>-	/* A withdraw may have done dq/uninit so now we need to check it */</div><div class='del'>-	if (!sdp-&gt;sd_args.ar_spectator &amp;&amp;</div><div class='del'>-	    gfs2_holder_initialized(&amp;sdp-&gt;sd_jinode_gh))</div><div class='add'>+	if (!sdp-&gt;sd_args.ar_spectator)</div><div class='ctx'> 		gfs2_glock_dq_uninit(&amp;sdp-&gt;sd_jinode_gh);</div><div class='ctx'> fail_journal_gh:</div><div class='del'>-	if (!sdp-&gt;sd_args.ar_spectator &amp;&amp;</div><div class='del'>-	    gfs2_holder_initialized(&amp;sdp-&gt;sd_journal_gh))</div><div class='add'>+	if (!sdp-&gt;sd_args.ar_spectator)</div><div class='ctx'> 		gfs2_glock_dq_uninit(&amp;sdp-&gt;sd_journal_gh);</div><div class='ctx'> fail_jindex:</div><div class='ctx'> 	gfs2_jindex_free(sdp);</div><div class='del'>-	if (jindex)</div><div class='add'>+	if (gfs2_holder_initialized(&amp;ji_gh))</div><div class='ctx'> 		gfs2_glock_dq_uninit(&amp;ji_gh);</div><div class='ctx'> fail:</div><div class='ctx'> 	iput(sdp-&gt;sd_jindex);</div><div class='hunk'>@@ -889,7 +847,7 @@ static int init_inodes(struct gfs2_sbd *sdp, int undo)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> </div><div class='ctx'> 	/* Read in the resource index inode */</div><div class='del'>-	sdp-&gt;sd_rindex = gfs2_lookup_simple(master, "rindex");</div><div class='add'>+	sdp-&gt;sd_rindex = gfs2_lookup_meta(master, "rindex");</div><div class='ctx'> 	if (IS_ERR(sdp-&gt;sd_rindex)) {</div><div class='ctx'> 		error = PTR_ERR(sdp-&gt;sd_rindex);</div><div class='ctx'> 		fs_err(sdp, "can't get resource index inode: %d\n", error);</div><div class='hunk'>@@ -898,7 +856,7 @@ static int init_inodes(struct gfs2_sbd *sdp, int undo)</div><div class='ctx'> 	sdp-&gt;sd_rindex_uptodate = 0;</div><div class='ctx'> </div><div class='ctx'> 	/* Read in the quota inode */</div><div class='del'>-	sdp-&gt;sd_quota_inode = gfs2_lookup_simple(master, "quota");</div><div class='add'>+	sdp-&gt;sd_quota_inode = gfs2_lookup_meta(master, "quota");</div><div class='ctx'> 	if (IS_ERR(sdp-&gt;sd_quota_inode)) {</div><div class='ctx'> 		error = PTR_ERR(sdp-&gt;sd_quota_inode);</div><div class='ctx'> 		fs_err(sdp, "can't get quota file inode: %d\n", error);</div><div class='hunk'>@@ -942,7 +900,7 @@ static int init_per_node(struct gfs2_sbd *sdp, int undo)</div><div class='ctx'> 	if (undo)</div><div class='ctx'> 		goto fail_qc_gh;</div><div class='ctx'> </div><div class='del'>-	pn = gfs2_lookup_simple(master, "per_node");</div><div class='add'>+	pn = gfs2_lookup_meta(master, "per_node");</div><div class='ctx'> 	if (IS_ERR(pn)) {</div><div class='ctx'> 		error = PTR_ERR(pn);</div><div class='ctx'> 		fs_err(sdp, "can't find per_node directory: %d\n", error);</div><div class='hunk'>@@ -950,7 +908,7 @@ static int init_per_node(struct gfs2_sbd *sdp, int undo)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	sprintf(buf, "quota_change%u", sdp-&gt;sd_jdesc-&gt;jd_jid);</div><div class='del'>-	sdp-&gt;sd_qc_inode = gfs2_lookup_simple(pn, buf);</div><div class='add'>+	sdp-&gt;sd_qc_inode = gfs2_lookup_meta(pn, buf);</div><div class='ctx'> 	if (IS_ERR(sdp-&gt;sd_qc_inode)) {</div><div class='ctx'> 		error = PTR_ERR(sdp-&gt;sd_qc_inode);</div><div class='ctx'> 		fs_err(sdp, "can't find local \"qc\" file: %d\n", error);</div><div class='hunk'>@@ -961,7 +919,7 @@ static int init_per_node(struct gfs2_sbd *sdp, int undo)</div><div class='ctx'> 	pn = NULL;</div><div class='ctx'> </div><div class='ctx'> 	ip = GFS2_I(sdp-&gt;sd_qc_inode);</div><div class='del'>-	error = gfs2_glock_nq_init(ip-&gt;i_gl, LM_ST_EXCLUSIVE, 0,</div><div class='add'>+	error = gfs2_glock_nq_init(ip-&gt;i_gl, LM_ST_EXCLUSIVE, GL_NOPID,</div><div class='ctx'> 				   &amp;sdp-&gt;sd_qc_gh);</div><div class='ctx'> 	if (error) {</div><div class='ctx'> 		fs_err(sdp, "can't lock local \"qc\" file: %d\n", error);</div><div class='hunk'>@@ -1075,8 +1033,8 @@ hostdata_error:</div><div class='ctx'> void gfs2_lm_unmount(struct gfs2_sbd *sdp)</div><div class='ctx'> {</div><div class='ctx'> 	const struct lm_lockops *lm = sdp-&gt;sd_lockstruct.ls_ops;</div><div class='del'>-	if (likely(!gfs2_withdrawn(sdp)) &amp;&amp; lm-&gt;lm_unmount)</div><div class='del'>-		lm-&gt;lm_unmount(sdp);</div><div class='add'>+	if (!gfs2_withdrawn(sdp) &amp;&amp; lm-&gt;lm_unmount)</div><div class='add'>+		lm-&gt;lm_unmount(sdp, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int wait_on_journal(struct gfs2_sbd *sdp)</div><div class='hunk'>@@ -1104,29 +1062,46 @@ static int init_threads(struct gfs2_sbd *sdp)</div><div class='ctx'> 	struct task_struct *p;</div><div class='ctx'> 	int error = 0;</div><div class='ctx'> </div><div class='del'>-	p = kthread_run(gfs2_logd, sdp, "gfs2_logd");</div><div class='add'>+	p = kthread_create(gfs2_logd, sdp, "gfs2_logd/%s", sdp-&gt;sd_fsname);</div><div class='ctx'> 	if (IS_ERR(p)) {</div><div class='ctx'> 		error = PTR_ERR(p);</div><div class='del'>-		fs_err(sdp, "can't start logd thread: %d\n", error);</div><div class='add'>+		fs_err(sdp, "can't create logd thread: %d\n", error);</div><div class='ctx'> 		return error;</div><div class='ctx'> 	}</div><div class='add'>+	get_task_struct(p);</div><div class='ctx'> 	sdp-&gt;sd_logd_process = p;</div><div class='ctx'> </div><div class='del'>-	p = kthread_run(gfs2_quotad, sdp, "gfs2_quotad");</div><div class='add'>+	p = kthread_create(gfs2_quotad, sdp, "gfs2_quotad/%s", sdp-&gt;sd_fsname);</div><div class='ctx'> 	if (IS_ERR(p)) {</div><div class='ctx'> 		error = PTR_ERR(p);</div><div class='del'>-		fs_err(sdp, "can't start quotad thread: %d\n", error);</div><div class='add'>+		fs_err(sdp, "can't create quotad thread: %d\n", error);</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='add'>+	get_task_struct(p);</div><div class='ctx'> 	sdp-&gt;sd_quotad_process = p;</div><div class='add'>+</div><div class='add'>+	wake_up_process(sdp-&gt;sd_logd_process);</div><div class='add'>+	wake_up_process(sdp-&gt;sd_quotad_process);</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> fail:</div><div class='del'>-	kthread_stop(sdp-&gt;sd_logd_process);</div><div class='add'>+	kthread_stop_put(sdp-&gt;sd_logd_process);</div><div class='ctx'> 	sdp-&gt;sd_logd_process = NULL;</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void gfs2_destroy_threads(struct gfs2_sbd *sdp)</div><div class='add'>+{</div><div class='add'>+	if (sdp-&gt;sd_logd_process) {</div><div class='add'>+		kthread_stop_put(sdp-&gt;sd_logd_process);</div><div class='add'>+		sdp-&gt;sd_logd_process = NULL;</div><div class='add'>+	}</div><div class='add'>+	if (sdp-&gt;sd_quotad_process) {</div><div class='add'>+		kthread_stop_put(sdp-&gt;sd_quotad_process);</div><div class='add'>+		sdp-&gt;sd_quotad_process = NULL;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /**</div><div class='ctx'>  * gfs2_fill_super - Read in superblock</div><div class='ctx'>  * @sb: The VFS superblock</div><div class='hunk'>@@ -1140,7 +1115,7 @@ static int gfs2_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> 	int silent = fc-&gt;sb_flags &amp; SB_SILENT;</div><div class='ctx'> 	struct gfs2_sbd *sdp;</div><div class='ctx'> 	struct gfs2_holder mount_gh;</div><div class='del'>-	struct gfs2_holder freeze_gh;</div><div class='add'>+	struct address_space *mapping;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='ctx'> 	sdp = init_sbd(sb);</div><div class='hunk'>@@ -1162,7 +1137,8 @@ static int gfs2_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> 	sb-&gt;s_flags |= SB_NOSEC;</div><div class='ctx'> 	sb-&gt;s_magic = GFS2_MAGIC;</div><div class='ctx'> 	sb-&gt;s_op = &amp;gfs2_super_ops;</div><div class='del'>-	sb-&gt;s_d_op = &amp;gfs2_dops;</div><div class='add'>+</div><div class='add'>+	set_default_d_op(sb, &amp;gfs2_dops);</div><div class='ctx'> 	sb-&gt;s_export_op = &amp;gfs2_export_ops;</div><div class='ctx'> 	sb-&gt;s_qcop = &amp;gfs2_quotactl_ops;</div><div class='ctx'> 	sb-&gt;s_quota_types = QTYPE_MASK_USR | QTYPE_MASK_GRP;</div><div class='hunk'>@@ -1172,10 +1148,12 @@ static int gfs2_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> </div><div class='ctx'> 	/* Set up the buffer cache and fill in some fake block size values</div><div class='ctx'> 	   to allow us to read-in the on-disk superblock. */</div><div class='del'>-	sdp-&gt;sd_sb.sb_bsize = sb_min_blocksize(sb, GFS2_BASIC_BLOCK);</div><div class='add'>+	sdp-&gt;sd_sb.sb_bsize = sb_min_blocksize(sb, SECTOR_SIZE);</div><div class='add'>+	error = -EINVAL;</div><div class='add'>+	if (!sdp-&gt;sd_sb.sb_bsize)</div><div class='add'>+		goto fail_free;</div><div class='ctx'> 	sdp-&gt;sd_sb.sb_bsize_shift = sb-&gt;s_blocksize_bits;</div><div class='del'>-	sdp-&gt;sd_fsb2bb_shift = sdp-&gt;sd_sb.sb_bsize_shift -</div><div class='del'>-                               GFS2_BASIC_BLOCK_SHIFT;</div><div class='add'>+	sdp-&gt;sd_fsb2bb_shift = sdp-&gt;sd_sb.sb_bsize_shift - SECTOR_SHIFT;</div><div class='ctx'> 	sdp-&gt;sd_fsb2bb = BIT(sdp-&gt;sd_fsb2bb_shift);</div><div class='ctx'> </div><div class='ctx'> 	sdp-&gt;sd_tune.gt_logd_secs = sdp-&gt;sd_args.ar_commit;</div><div class='hunk'>@@ -1188,15 +1166,41 @@ static int gfs2_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> 		sdp-&gt;sd_tune.gt_statfs_quantum = 30;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/* Set up an address space for metadata writes */</div><div class='add'>+	sdp-&gt;sd_inode = new_inode(sb);</div><div class='add'>+	error = -ENOMEM;</div><div class='add'>+	if (!sdp-&gt;sd_inode)</div><div class='add'>+		goto fail_free;</div><div class='add'>+	sdp-&gt;sd_inode-&gt;i_ino = GFS2_BAD_INO;</div><div class='add'>+	sdp-&gt;sd_inode-&gt;i_size = OFFSET_MAX;</div><div class='add'>+</div><div class='add'>+	mapping = gfs2_aspace(sdp);</div><div class='add'>+	mapping-&gt;a_ops = &amp;gfs2_rgrp_aops;</div><div class='add'>+	gfs2_setup_inode(sdp-&gt;sd_inode);</div><div class='add'>+</div><div class='ctx'> 	error = init_names(sdp, silent);</div><div class='ctx'> 	if (error)</div><div class='del'>-		goto fail_free;</div><div class='add'>+		goto fail_iput;</div><div class='ctx'> </div><div class='ctx'> 	snprintf(sdp-&gt;sd_fsname, sizeof(sdp-&gt;sd_fsname), "%s", sdp-&gt;sd_table_name);</div><div class='ctx'> </div><div class='add'>+	error = -ENOMEM;</div><div class='add'>+	sdp-&gt;sd_glock_wq = alloc_workqueue("gfs2-glock/%s",</div><div class='add'>+			WQ_MEM_RECLAIM | WQ_HIGHPRI | WQ_FREEZABLE | WQ_PERCPU,</div><div class='add'>+			0,</div><div class='add'>+			sdp-&gt;sd_fsname);</div><div class='add'>+	if (!sdp-&gt;sd_glock_wq)</div><div class='add'>+		goto fail_iput;</div><div class='add'>+</div><div class='add'>+	sdp-&gt;sd_delete_wq = alloc_workqueue("gfs2-delete/%s",</div><div class='add'>+			WQ_MEM_RECLAIM | WQ_FREEZABLE | WQ_PERCPU, 0,</div><div class='add'>+			sdp-&gt;sd_fsname);</div><div class='add'>+	if (!sdp-&gt;sd_delete_wq)</div><div class='add'>+		goto fail_glock_wq;</div><div class='add'>+</div><div class='ctx'> 	error = gfs2_sys_fs_add(sdp);</div><div class='ctx'> 	if (error)</div><div class='del'>-		goto fail_free;</div><div class='add'>+		goto fail_delete_wq;</div><div class='ctx'> </div><div class='ctx'> 	gfs2_create_debugfs_file(sdp);</div><div class='ctx'> </div><div class='hunk'>@@ -1204,6 +1208,8 @@ static int gfs2_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto fail_debug;</div><div class='ctx'> </div><div class='add'>+	INIT_WORK(&amp;sdp-&gt;sd_withdraw_work, gfs2_withdraw_func);</div><div class='add'>+</div><div class='ctx'> 	error = init_locking(sdp, &amp;mount_gh, DO);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto fail_lm;</div><div class='hunk'>@@ -1257,27 +1263,20 @@ static int gfs2_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> </div><div class='ctx'> 	if (!sb_rdonly(sb)) {</div><div class='ctx'> 		error = init_threads(sdp);</div><div class='del'>-		if (error) {</div><div class='del'>-			gfs2_withdraw_delayed(sdp);</div><div class='add'>+		if (error)</div><div class='ctx'> 			goto fail_per_node;</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	error = gfs2_freeze_lock(sdp, &amp;freeze_gh, 0);</div><div class='add'>+	error = gfs2_freeze_lock_shared(sdp);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto fail_per_node;</div><div class='ctx'> </div><div class='ctx'> 	if (!sb_rdonly(sb))</div><div class='ctx'> 		error = gfs2_make_fs_rw(sdp);</div><div class='ctx'> </div><div class='del'>-	gfs2_freeze_unlock(&amp;freeze_gh);</div><div class='ctx'> 	if (error) {</div><div class='del'>-		if (sdp-&gt;sd_quotad_process)</div><div class='del'>-			kthread_stop(sdp-&gt;sd_quotad_process);</div><div class='del'>-		sdp-&gt;sd_quotad_process = NULL;</div><div class='del'>-		if (sdp-&gt;sd_logd_process)</div><div class='del'>-			kthread_stop(sdp-&gt;sd_logd_process);</div><div class='del'>-		sdp-&gt;sd_logd_process = NULL;</div><div class='add'>+		gfs2_freeze_unlock(sdp);</div><div class='add'>+		gfs2_destroy_threads(sdp);</div><div class='ctx'> 		fs_err(sdp, "can't make FS RW: %d\n", error);</div><div class='ctx'> 		goto fail_per_node;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1306,9 +1305,15 @@ fail_lm:</div><div class='ctx'> fail_debug:</div><div class='ctx'> 	gfs2_delete_debugfs_file(sdp);</div><div class='ctx'> 	gfs2_sys_fs_del(sdp);</div><div class='add'>+fail_delete_wq:</div><div class='add'>+	destroy_workqueue(sdp-&gt;sd_delete_wq);</div><div class='add'>+fail_glock_wq:</div><div class='add'>+	if (sdp-&gt;sd_glock_wq)</div><div class='add'>+		destroy_workqueue(sdp-&gt;sd_glock_wq);</div><div class='add'>+fail_iput:</div><div class='add'>+	iput(sdp-&gt;sd_inode);</div><div class='ctx'> fail_free:</div><div class='ctx'> 	free_sbd(sdp);</div><div class='del'>-	sb-&gt;s_fs_info = NULL;</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1375,6 +1380,7 @@ static const struct constant_table gfs2_param_quota[] = {</div><div class='ctx'> 	{"off",        GFS2_QUOTA_OFF},</div><div class='ctx'> 	{"account",    GFS2_QUOTA_ACCOUNT},</div><div class='ctx'> 	{"on",         GFS2_QUOTA_ON},</div><div class='add'>+	{"quiet",      GFS2_QUOTA_QUIET},</div><div class='ctx'> 	{}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -1390,12 +1396,14 @@ static const struct constant_table gfs2_param_data[] = {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> enum opt_errors {</div><div class='del'>-	Opt_errors_withdraw = GFS2_ERRORS_WITHDRAW,</div><div class='del'>-	Opt_errors_panic    = GFS2_ERRORS_PANIC,</div><div class='add'>+	Opt_errors_withdraw   = GFS2_ERRORS_WITHDRAW,</div><div class='add'>+	Opt_errors_deactivate = GFS2_ERRORS_DEACTIVATE,</div><div class='add'>+	Opt_errors_panic      = GFS2_ERRORS_PANIC,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct constant_table gfs2_param_errors[] = {</div><div class='ctx'> 	{"withdraw",   Opt_errors_withdraw },</div><div class='add'>+	{"deactivate", Opt_errors_deactivate },</div><div class='ctx'> 	{"panic",      Opt_errors_panic },</div><div class='ctx'> 	{}</div><div class='ctx'> };</div><div class='hunk'>@@ -1443,13 +1451,13 @@ static int gfs2_parse_param(struct fs_context *fc, struct fs_parameter *param)</div><div class='ctx'> </div><div class='ctx'> 	switch (o) {</div><div class='ctx'> 	case Opt_lockproto:</div><div class='del'>-		strlcpy(args-&gt;ar_lockproto, param-&gt;string, GFS2_LOCKNAME_LEN);</div><div class='add'>+		strscpy(args-&gt;ar_lockproto, param-&gt;string, GFS2_LOCKNAME_LEN);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case Opt_locktable:</div><div class='del'>-		strlcpy(args-&gt;ar_locktable, param-&gt;string, GFS2_LOCKNAME_LEN);</div><div class='add'>+		strscpy(args-&gt;ar_locktable, param-&gt;string, GFS2_LOCKNAME_LEN);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case Opt_hostdata:</div><div class='del'>-		strlcpy(args-&gt;ar_hostdata, param-&gt;string, GFS2_LOCKNAME_LEN);</div><div class='add'>+		strscpy(args-&gt;ar_hostdata, param-&gt;string, GFS2_LOCKNAME_LEN);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case Opt_spectator:</div><div class='ctx'> 		args-&gt;ar_spectator = 1;</div><div class='hunk'>@@ -1582,12 +1590,6 @@ static int gfs2_reconfigure(struct fs_context *fc)</div><div class='ctx'> 		fc-&gt;sb_flags |= SB_RDONLY;</div><div class='ctx'> </div><div class='ctx'> 	if ((sb-&gt;s_flags ^ fc-&gt;sb_flags) &amp; SB_RDONLY) {</div><div class='del'>-		struct gfs2_holder freeze_gh;</div><div class='del'>-</div><div class='del'>-		error = gfs2_freeze_lock(sdp, &amp;freeze_gh, 0);</div><div class='del'>-		if (error)</div><div class='del'>-			return -EINVAL;</div><div class='del'>-</div><div class='ctx'> 		if (fc-&gt;sb_flags &amp; SB_RDONLY) {</div><div class='ctx'> 			gfs2_make_fs_ro(sdp);</div><div class='ctx'> 		} else {</div><div class='hunk'>@@ -1595,7 +1597,6 @@ static int gfs2_reconfigure(struct fs_context *fc)</div><div class='ctx'> 			if (error)</div><div class='ctx'> 				errorfc(fc, "unable to remount read-write");</div><div class='ctx'> 		}</div><div class='del'>-		gfs2_freeze_unlock(&amp;freeze_gh);</div><div class='ctx'> 	}</div><div class='ctx'> 	sdp-&gt;sd_args = *newargs;</div><div class='ctx'> </div><div class='hunk'>@@ -1717,6 +1718,55 @@ static int gfs2_meta_init_fs_context(struct fs_context *fc)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * gfs2_evict_inodes - evict inodes cooperatively</div><div class='add'>+ * @sb: the superblock</div><div class='add'>+ *</div><div class='add'>+ * When evicting an inode with a zero link count, we are trying to upgrade the</div><div class='add'>+ * inode's iopen glock from SH to EX mode in order to determine if we can</div><div class='add'>+ * delete the inode.  The other nodes are supposed to evict the inode from</div><div class='add'>+ * their caches if they can, and to poke the inode's inode glock if they cannot</div><div class='add'>+ * do so.  Either behavior allows gfs2_upgrade_iopen_glock() to proceed</div><div class='add'>+ * quickly, but if the other nodes are not cooperating, the lock upgrading</div><div class='add'>+ * attempt will time out.  Since inodes are evicted sequentially, this can add</div><div class='add'>+ * up quickly.</div><div class='add'>+ *</div><div class='add'>+ * Function evict_inodes() tries to keep the s_inode_list_lock list locked over</div><div class='add'>+ * a long time, which prevents other inodes from being evicted concurrently.</div><div class='add'>+ * This precludes the cooperative behavior we are looking for.  This special</div><div class='add'>+ * version of evict_inodes() avoids that.</div><div class='add'>+ *</div><div class='add'>+ * Modeled after drop_pagecache_sb().</div><div class='add'>+ */</div><div class='add'>+static void gfs2_evict_inodes(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode, *toput_inode = NULL;</div><div class='add'>+	struct gfs2_sbd *sdp = sb-&gt;s_fs_info;</div><div class='add'>+</div><div class='add'>+	set_bit(SDF_EVICTING, &amp;sdp-&gt;sd_flags);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;sb-&gt;s_inode_list_lock);</div><div class='add'>+	list_for_each_entry(inode, &amp;sb-&gt;s_inodes, i_sb_list) {</div><div class='add'>+		spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+		if ((inode_state_read(inode) &amp; (I_FREEING | I_WILL_FREE | I_NEW)) &amp;&amp;</div><div class='add'>+		    !need_resched()) {</div><div class='add'>+			spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+		__iget(inode);</div><div class='add'>+		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+		spin_unlock(&amp;sb-&gt;s_inode_list_lock);</div><div class='add'>+</div><div class='add'>+		iput(toput_inode);</div><div class='add'>+		toput_inode = inode;</div><div class='add'>+</div><div class='add'>+		cond_resched();</div><div class='add'>+		spin_lock(&amp;sb-&gt;s_inode_list_lock);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;sb-&gt;s_inode_list_lock);</div><div class='add'>+	iput(toput_inode);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void gfs2_kill_sb(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_sbd *sdp = sb-&gt;s_fs_info;</div><div class='hunk'>@@ -1732,6 +1782,18 @@ static void gfs2_kill_sb(struct super_block *sb)</div><div class='ctx'> 	sdp-&gt;sd_root_dir = NULL;</div><div class='ctx'> 	sdp-&gt;sd_master_dir = NULL;</div><div class='ctx'> 	shrink_dcache_sb(sb);</div><div class='add'>+</div><div class='add'>+	gfs2_evict_inodes(sb);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Flush and then drain the delete workqueue here (via</div><div class='add'>+	 * destroy_workqueue()) to ensure that any delete work that</div><div class='add'>+	 * may be running will also see the SDF_KILL flag.</div><div class='add'>+	 */</div><div class='add'>+	set_bit(SDF_KILL, &amp;sdp-&gt;sd_flags);</div><div class='add'>+	gfs2_flush_delete_work(sdp);</div><div class='add'>+	destroy_workqueue(sdp-&gt;sd_delete_wq);</div><div class='add'>+</div><div class='ctx'> 	kill_block_super(sb);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/gfs2/quota.c b/fs/gfs2/quota.c<br/>index be0997e24d60..b1692f12a602 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/quota.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/quota.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/quota.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/quota.c</a></div><div class='hunk'>@@ -106,58 +106,68 @@ static inline void spin_unlock_bucket(unsigned int hash)</div><div class='ctx'> static void gfs2_qd_dealloc(struct rcu_head *rcu)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_quota_data *qd = container_of(rcu, struct gfs2_quota_data, qd_rcu);</div><div class='add'>+	struct gfs2_sbd *sdp = qd-&gt;qd_sbd;</div><div class='add'>+</div><div class='ctx'> 	kmem_cache_free(gfs2_quotad_cachep, qd);</div><div class='add'>+	if (atomic_dec_and_test(&amp;sdp-&gt;sd_quota_count))</div><div class='add'>+		wake_up(&amp;sdp-&gt;sd_kill_wait);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void gfs2_qd_dispose(struct list_head *list)</div><div class='add'>+static void gfs2_qd_dispose(struct gfs2_quota_data *qd)</div><div class='ctx'> {</div><div class='del'>-	struct gfs2_quota_data *qd;</div><div class='del'>-	struct gfs2_sbd *sdp;</div><div class='del'>-</div><div class='del'>-	while (!list_empty(list)) {</div><div class='del'>-		qd = list_first_entry(list, struct gfs2_quota_data, qd_lru);</div><div class='del'>-		sdp = qd-&gt;qd_gl-&gt;gl_name.ln_sbd;</div><div class='del'>-</div><div class='del'>-		list_del(&amp;qd-&gt;qd_lru);</div><div class='add'>+	struct gfs2_sbd *sdp = qd-&gt;qd_sbd;</div><div class='ctx'> </div><div class='del'>-		/* Free from the filesystem-specific list */</div><div class='del'>-		spin_lock(&amp;qd_lock);</div><div class='del'>-		list_del(&amp;qd-&gt;qd_list);</div><div class='del'>-		spin_unlock(&amp;qd_lock);</div><div class='add'>+	spin_lock(&amp;qd_lock);</div><div class='add'>+	list_del(&amp;qd-&gt;qd_list);</div><div class='add'>+	spin_unlock(&amp;qd_lock);</div><div class='ctx'> </div><div class='del'>-		spin_lock_bucket(qd-&gt;qd_hash);</div><div class='del'>-		hlist_bl_del_rcu(&amp;qd-&gt;qd_hlist);</div><div class='del'>-		spin_unlock_bucket(qd-&gt;qd_hash);</div><div class='add'>+	spin_lock_bucket(qd-&gt;qd_hash);</div><div class='add'>+	hlist_bl_del_rcu(&amp;qd-&gt;qd_hlist);</div><div class='add'>+	spin_unlock_bucket(qd-&gt;qd_hash);</div><div class='ctx'> </div><div class='add'>+	if (!gfs2_withdrawn(sdp)) {</div><div class='ctx'> 		gfs2_assert_warn(sdp, !qd-&gt;qd_change);</div><div class='del'>-		gfs2_assert_warn(sdp, !qd-&gt;qd_slot_count);</div><div class='add'>+		gfs2_assert_warn(sdp, !qd-&gt;qd_slot_ref);</div><div class='ctx'> 		gfs2_assert_warn(sdp, !qd-&gt;qd_bh_count);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		gfs2_glock_put(qd-&gt;qd_gl);</div><div class='del'>-		atomic_dec(&amp;sdp-&gt;sd_quota_count);</div><div class='add'>+	gfs2_glock_put(qd-&gt;qd_gl);</div><div class='add'>+	call_rcu(&amp;qd-&gt;qd_rcu, gfs2_qd_dealloc);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		/* Delete it from the common reclaim list */</div><div class='del'>-		call_rcu(&amp;qd-&gt;qd_rcu, gfs2_qd_dealloc);</div><div class='add'>+static void gfs2_qd_list_dispose(struct list_head *list)</div><div class='add'>+{</div><div class='add'>+	struct gfs2_quota_data *qd;</div><div class='add'>+</div><div class='add'>+	while (!list_empty(list)) {</div><div class='add'>+		qd = list_first_entry(list, struct gfs2_quota_data, qd_lru);</div><div class='add'>+		list_del(&amp;qd-&gt;qd_lru);</div><div class='add'>+</div><div class='add'>+		gfs2_qd_dispose(qd);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> static enum lru_status gfs2_qd_isolate(struct list_head *item,</div><div class='del'>-		struct list_lru_one *lru, spinlock_t *lru_lock, void *arg)</div><div class='add'>+		struct list_lru_one *lru, void *arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct list_head *dispose = arg;</div><div class='del'>-	struct gfs2_quota_data *qd = list_entry(item, struct gfs2_quota_data, qd_lru);</div><div class='add'>+	struct gfs2_quota_data *qd =</div><div class='add'>+		list_entry(item, struct gfs2_quota_data, qd_lru);</div><div class='add'>+	enum lru_status status;</div><div class='ctx'> </div><div class='ctx'> 	if (!spin_trylock(&amp;qd-&gt;qd_lockref.lock))</div><div class='ctx'> 		return LRU_SKIP;</div><div class='ctx'> </div><div class='add'>+	status = LRU_SKIP;</div><div class='ctx'> 	if (qd-&gt;qd_lockref.count == 0) {</div><div class='ctx'> 		lockref_mark_dead(&amp;qd-&gt;qd_lockref);</div><div class='ctx'> 		list_lru_isolate_move(lru, &amp;qd-&gt;qd_lru, dispose);</div><div class='add'>+		status = LRU_REMOVED;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	spin_unlock(&amp;qd-&gt;qd_lockref.lock);</div><div class='del'>-	return LRU_REMOVED;</div><div class='add'>+	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static unsigned long gfs2_qd_shrink_scan(struct shrinker *shrink,</div><div class='hunk'>@@ -172,7 +182,7 @@ static unsigned long gfs2_qd_shrink_scan(struct shrinker *shrink,</div><div class='ctx'> 	freed = list_lru_shrink_walk(&amp;gfs2_qd_lru, sc,</div><div class='ctx'> 				     gfs2_qd_isolate, &amp;dispose);</div><div class='ctx'> </div><div class='del'>-	gfs2_qd_dispose(&amp;dispose);</div><div class='add'>+	gfs2_qd_list_dispose(&amp;dispose);</div><div class='ctx'> </div><div class='ctx'> 	return freed;</div><div class='ctx'> }</div><div class='hunk'>@@ -183,13 +193,26 @@ static unsigned long gfs2_qd_shrink_count(struct shrinker *shrink,</div><div class='ctx'> 	return vfs_pressure_ratio(list_lru_shrink_count(&amp;gfs2_qd_lru, sc));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct shrinker gfs2_qd_shrinker = {</div><div class='del'>-	.count_objects = gfs2_qd_shrink_count,</div><div class='del'>-	.scan_objects = gfs2_qd_shrink_scan,</div><div class='del'>-	.seeks = DEFAULT_SEEKS,</div><div class='del'>-	.flags = SHRINKER_NUMA_AWARE,</div><div class='del'>-};</div><div class='add'>+static struct shrinker *gfs2_qd_shrinker;</div><div class='ctx'> </div><div class='add'>+int __init gfs2_qd_shrinker_init(void)</div><div class='add'>+{</div><div class='add'>+	gfs2_qd_shrinker = shrinker_alloc(SHRINKER_NUMA_AWARE, "gfs2-qd");</div><div class='add'>+	if (!gfs2_qd_shrinker)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	gfs2_qd_shrinker-&gt;count_objects = gfs2_qd_shrink_count;</div><div class='add'>+	gfs2_qd_shrinker-&gt;scan_objects = gfs2_qd_shrink_scan;</div><div class='add'>+</div><div class='add'>+	shrinker_register(gfs2_qd_shrinker);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void gfs2_qd_shrinker_exit(void)</div><div class='add'>+{</div><div class='add'>+	shrinker_free(gfs2_qd_shrinker);</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> static u64 qd2index(struct gfs2_quota_data *qd)</div><div class='ctx'> {</div><div class='hunk'>@@ -200,12 +223,7 @@ static u64 qd2index(struct gfs2_quota_data *qd)</div><div class='ctx'> </div><div class='ctx'> static u64 qd2offset(struct gfs2_quota_data *qd)</div><div class='ctx'> {</div><div class='del'>-	u64 offset;</div><div class='del'>-</div><div class='del'>-	offset = qd2index(qd);</div><div class='del'>-	offset *= sizeof(struct gfs2_quota);</div><div class='del'>-</div><div class='del'>-	return offset;</div><div class='add'>+	return qd2index(qd) * sizeof(struct gfs2_quota);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct gfs2_quota_data *qd_alloc(unsigned hash, struct gfs2_sbd *sdp, struct kqid qid)</div><div class='hunk'>@@ -218,8 +236,7 @@ static struct gfs2_quota_data *qd_alloc(unsigned hash, struct gfs2_sbd *sdp, str</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='ctx'> 	qd-&gt;qd_sbd = sdp;</div><div class='del'>-	qd-&gt;qd_lockref.count = 1;</div><div class='del'>-	spin_lock_init(&amp;qd-&gt;qd_lockref.lock);</div><div class='add'>+	lockref_init(&amp;qd-&gt;qd_lockref);</div><div class='ctx'> 	qd-&gt;qd_id = qid;</div><div class='ctx'> 	qd-&gt;qd_slot = -1;</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;qd-&gt;qd_lru);</div><div class='hunk'>@@ -250,7 +267,7 @@ static struct gfs2_quota_data *gfs2_qd_search_bucket(unsigned int hash,</div><div class='ctx'> 		if (qd-&gt;qd_sbd != sdp)</div><div class='ctx'> 			continue;</div><div class='ctx'> 		if (lockref_get_not_dead(&amp;qd-&gt;qd_lockref)) {</div><div class='del'>-			list_lru_del(&amp;gfs2_qd_lru, &amp;qd-&gt;qd_lru);</div><div class='add'>+			list_lru_del_obj(&amp;gfs2_qd_lru, &amp;qd-&gt;qd_lru);</div><div class='ctx'> 			return qd;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -297,22 +314,33 @@ static int qd_get(struct gfs2_sbd *sdp, struct kqid qid,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> </div><div class='del'>-static void qd_hold(struct gfs2_quota_data *qd)</div><div class='add'>+static void __qd_hold(struct gfs2_quota_data *qd)</div><div class='ctx'> {</div><div class='del'>-	struct gfs2_sbd *sdp = qd-&gt;qd_gl-&gt;gl_name.ln_sbd;</div><div class='del'>-	gfs2_assert(sdp, !__lockref_is_dead(&amp;qd-&gt;qd_lockref));</div><div class='del'>-	lockref_get(&amp;qd-&gt;qd_lockref);</div><div class='add'>+	struct gfs2_sbd *sdp = qd-&gt;qd_sbd;</div><div class='add'>+	gfs2_assert(sdp, qd-&gt;qd_lockref.count &gt; 0);</div><div class='add'>+	qd-&gt;qd_lockref.count++;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void qd_put(struct gfs2_quota_data *qd)</div><div class='ctx'> {</div><div class='add'>+	struct gfs2_sbd *sdp;</div><div class='add'>+</div><div class='ctx'> 	if (lockref_put_or_lock(&amp;qd-&gt;qd_lockref))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='add'>+	BUG_ON(__lockref_is_dead(&amp;qd-&gt;qd_lockref));</div><div class='add'>+	sdp = qd-&gt;qd_sbd;</div><div class='add'>+	if (unlikely(!test_bit(SDF_JOURNAL_LIVE, &amp;sdp-&gt;sd_flags))) {</div><div class='add'>+		lockref_mark_dead(&amp;qd-&gt;qd_lockref);</div><div class='add'>+		spin_unlock(&amp;qd-&gt;qd_lockref.lock);</div><div class='add'>+</div><div class='add'>+		gfs2_qd_dispose(qd);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	qd-&gt;qd_lockref.count = 0;</div><div class='del'>-	list_lru_add(&amp;gfs2_qd_lru, &amp;qd-&gt;qd_lru);</div><div class='add'>+	list_lru_add_obj(&amp;gfs2_qd_lru, &amp;qd-&gt;qd_lru);</div><div class='ctx'> 	spin_unlock(&amp;qd-&gt;qd_lockref.lock);</div><div class='del'>-</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int slot_get(struct gfs2_quota_data *qd)</div><div class='hunk'>@@ -322,20 +350,19 @@ static int slot_get(struct gfs2_quota_data *qd)</div><div class='ctx'> 	int error = 0;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;sdp-&gt;sd_bitmap_lock);</div><div class='del'>-	if (qd-&gt;qd_slot_count != 0)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	error = -ENOSPC;</div><div class='del'>-	bit = find_first_zero_bit(sdp-&gt;sd_quota_bitmap, sdp-&gt;sd_quota_slots);</div><div class='del'>-	if (bit &lt; sdp-&gt;sd_quota_slots) {</div><div class='add'>+	if (qd-&gt;qd_slot_ref == 0) {</div><div class='add'>+		bit = find_first_zero_bit(sdp-&gt;sd_quota_bitmap,</div><div class='add'>+					  sdp-&gt;sd_quota_slots);</div><div class='add'>+		if (bit &gt;= sdp-&gt;sd_quota_slots) {</div><div class='add'>+			error = -ENOSPC;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> 		set_bit(bit, sdp-&gt;sd_quota_bitmap);</div><div class='ctx'> 		qd-&gt;qd_slot = bit;</div><div class='del'>-		error = 0;</div><div class='del'>-out:</div><div class='del'>-		qd-&gt;qd_slot_count++;</div><div class='ctx'> 	}</div><div class='add'>+	qd-&gt;qd_slot_ref++;</div><div class='add'>+out:</div><div class='ctx'> 	spin_unlock(&amp;sdp-&gt;sd_bitmap_lock);</div><div class='del'>-</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -344,8 +371,8 @@ static void slot_hold(struct gfs2_quota_data *qd)</div><div class='ctx'> 	struct gfs2_sbd *sdp = qd-&gt;qd_sbd;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;sdp-&gt;sd_bitmap_lock);</div><div class='del'>-	gfs2_assert(sdp, qd-&gt;qd_slot_count);</div><div class='del'>-	qd-&gt;qd_slot_count++;</div><div class='add'>+	gfs2_assert(sdp, qd-&gt;qd_slot_ref);</div><div class='add'>+	qd-&gt;qd_slot_ref++;</div><div class='ctx'> 	spin_unlock(&amp;sdp-&gt;sd_bitmap_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -354,8 +381,8 @@ static void slot_put(struct gfs2_quota_data *qd)</div><div class='ctx'> 	struct gfs2_sbd *sdp = qd-&gt;qd_sbd;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;sdp-&gt;sd_bitmap_lock);</div><div class='del'>-	gfs2_assert(sdp, qd-&gt;qd_slot_count);</div><div class='del'>-	if (!--qd-&gt;qd_slot_count) {</div><div class='add'>+	gfs2_assert(sdp, qd-&gt;qd_slot_ref);</div><div class='add'>+	if (!--qd-&gt;qd_slot_ref) {</div><div class='ctx'> 		BUG_ON(!test_and_clear_bit(qd-&gt;qd_slot, sdp-&gt;sd_quota_bitmap));</div><div class='ctx'> 		qd-&gt;qd_slot = -1;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -364,133 +391,124 @@ static void slot_put(struct gfs2_quota_data *qd)</div><div class='ctx'> </div><div class='ctx'> static int bh_get(struct gfs2_quota_data *qd)</div><div class='ctx'> {</div><div class='del'>-	struct gfs2_sbd *sdp = qd-&gt;qd_gl-&gt;gl_name.ln_sbd;</div><div class='del'>-	struct gfs2_inode *ip = GFS2_I(sdp-&gt;sd_qc_inode);</div><div class='add'>+	struct gfs2_sbd *sdp = qd-&gt;qd_sbd;</div><div class='add'>+	struct inode *inode = sdp-&gt;sd_qc_inode;</div><div class='add'>+	struct gfs2_inode *ip = GFS2_I(inode);</div><div class='ctx'> 	unsigned int block, offset;</div><div class='del'>-	struct buffer_head *bh;</div><div class='add'>+	struct buffer_head *bh = NULL;</div><div class='add'>+	struct iomap iomap = { };</div><div class='ctx'> 	int error;</div><div class='del'>-	struct buffer_head bh_map = { .b_state = 0, .b_blocknr = 0 };</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;sdp-&gt;sd_quota_mutex);</div><div class='del'>-</div><div class='del'>-	if (qd-&gt;qd_bh_count++) {</div><div class='del'>-		mutex_unlock(&amp;sdp-&gt;sd_quota_mutex);</div><div class='add'>+	spin_lock(&amp;qd-&gt;qd_lockref.lock);</div><div class='add'>+	if (qd-&gt;qd_bh_count) {</div><div class='add'>+		qd-&gt;qd_bh_count++;</div><div class='add'>+		spin_unlock(&amp;qd-&gt;qd_lockref.lock);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='add'>+	spin_unlock(&amp;qd-&gt;qd_lockref.lock);</div><div class='ctx'> </div><div class='ctx'> 	block = qd-&gt;qd_slot / sdp-&gt;sd_qc_per_block;</div><div class='ctx'> 	offset = qd-&gt;qd_slot % sdp-&gt;sd_qc_per_block;</div><div class='ctx'> </div><div class='del'>-	bh_map.b_size = BIT(ip-&gt;i_inode.i_blkbits);</div><div class='del'>-	error = gfs2_block_map(&amp;ip-&gt;i_inode, block, &amp;bh_map, 0);</div><div class='add'>+	error = gfs2_iomap_get(inode,</div><div class='add'>+			       (loff_t)block &lt;&lt; inode-&gt;i_blkbits,</div><div class='add'>+			       i_blocksize(inode), &amp;iomap);</div><div class='ctx'> 	if (error)</div><div class='del'>-		goto fail;</div><div class='del'>-	error = gfs2_meta_read(ip-&gt;i_gl, bh_map.b_blocknr, DIO_WAIT, 0, &amp;bh);</div><div class='add'>+		return error;</div><div class='add'>+	error = -ENOENT;</div><div class='add'>+	if (iomap.type != IOMAP_MAPPED)</div><div class='add'>+		return error;</div><div class='add'>+</div><div class='add'>+	error = gfs2_meta_read(ip-&gt;i_gl, iomap.addr &gt;&gt; inode-&gt;i_blkbits,</div><div class='add'>+			       DIO_WAIT, 0, &amp;bh);</div><div class='ctx'> 	if (error)</div><div class='del'>-		goto fail;</div><div class='add'>+		return error;</div><div class='ctx'> 	error = -EIO;</div><div class='ctx'> 	if (gfs2_metatype_check(sdp, bh, GFS2_METATYPE_QC))</div><div class='del'>-		goto fail_brelse;</div><div class='del'>-</div><div class='del'>-	qd-&gt;qd_bh = bh;</div><div class='del'>-	qd-&gt;qd_bh_qc = (struct gfs2_quota_change *)</div><div class='del'>-		(bh-&gt;b_data + sizeof(struct gfs2_meta_header) +</div><div class='del'>-		 offset * sizeof(struct gfs2_quota_change));</div><div class='del'>-</div><div class='del'>-	mutex_unlock(&amp;sdp-&gt;sd_quota_mutex);</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+	spin_lock(&amp;qd-&gt;qd_lockref.lock);</div><div class='add'>+	if (qd-&gt;qd_bh == NULL) {</div><div class='add'>+		qd-&gt;qd_bh = bh;</div><div class='add'>+		qd-&gt;qd_bh_qc = (struct gfs2_quota_change *)</div><div class='add'>+			(bh-&gt;b_data + sizeof(struct gfs2_meta_header) +</div><div class='add'>+			 offset * sizeof(struct gfs2_quota_change));</div><div class='add'>+		bh = NULL;</div><div class='add'>+	}</div><div class='add'>+	qd-&gt;qd_bh_count++;</div><div class='add'>+	spin_unlock(&amp;qd-&gt;qd_lockref.lock);</div><div class='add'>+	error = 0;</div><div class='ctx'> </div><div class='del'>-fail_brelse:</div><div class='add'>+out:</div><div class='ctx'> 	brelse(bh);</div><div class='del'>-fail:</div><div class='del'>-	qd-&gt;qd_bh_count--;</div><div class='del'>-	mutex_unlock(&amp;sdp-&gt;sd_quota_mutex);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void bh_put(struct gfs2_quota_data *qd)</div><div class='ctx'> {</div><div class='del'>-	struct gfs2_sbd *sdp = qd-&gt;qd_gl-&gt;gl_name.ln_sbd;</div><div class='add'>+	struct gfs2_sbd *sdp = qd-&gt;qd_sbd;</div><div class='add'>+	struct buffer_head *bh = NULL;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;sdp-&gt;sd_quota_mutex);</div><div class='add'>+	spin_lock(&amp;qd-&gt;qd_lockref.lock);</div><div class='ctx'> 	gfs2_assert(sdp, qd-&gt;qd_bh_count);</div><div class='ctx'> 	if (!--qd-&gt;qd_bh_count) {</div><div class='del'>-		brelse(qd-&gt;qd_bh);</div><div class='add'>+		bh = qd-&gt;qd_bh;</div><div class='ctx'> 		qd-&gt;qd_bh = NULL;</div><div class='ctx'> 		qd-&gt;qd_bh_qc = NULL;</div><div class='ctx'> 	}</div><div class='del'>-	mutex_unlock(&amp;sdp-&gt;sd_quota_mutex);</div><div class='add'>+	spin_unlock(&amp;qd-&gt;qd_lockref.lock);</div><div class='add'>+	brelse(bh);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int qd_check_sync(struct gfs2_sbd *sdp, struct gfs2_quota_data *qd,</div><div class='del'>-			 u64 *sync_gen)</div><div class='add'>+static bool qd_grab_sync(struct gfs2_sbd *sdp, struct gfs2_quota_data *qd,</div><div class='add'>+			 u64 sync_gen)</div><div class='ctx'> {</div><div class='add'>+	bool ret = false;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;qd-&gt;qd_lockref.lock);</div><div class='ctx'> 	if (test_bit(QDF_LOCKED, &amp;qd-&gt;qd_flags) ||</div><div class='ctx'> 	    !test_bit(QDF_CHANGE, &amp;qd-&gt;qd_flags) ||</div><div class='del'>-	    (sync_gen &amp;&amp; (qd-&gt;qd_sync_gen &gt;= *sync_gen)))</div><div class='del'>-		return 0;</div><div class='add'>+	    qd-&gt;qd_sync_gen &gt;= sync_gen)</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='del'>-	if (!lockref_get_not_dead(&amp;qd-&gt;qd_lockref))</div><div class='del'>-		return 0;</div><div class='add'>+	if (__lockref_is_dead(&amp;qd-&gt;qd_lockref))</div><div class='add'>+		goto out;</div><div class='add'>+	qd-&gt;qd_lockref.count++;</div><div class='ctx'> </div><div class='ctx'> 	list_move_tail(&amp;qd-&gt;qd_list, &amp;sdp-&gt;sd_quota_list);</div><div class='ctx'> 	set_bit(QDF_LOCKED, &amp;qd-&gt;qd_flags);</div><div class='ctx'> 	qd-&gt;qd_change_sync = qd-&gt;qd_change;</div><div class='ctx'> 	slot_hold(qd);</div><div class='del'>-	return 1;</div><div class='add'>+	ret = true;</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	spin_unlock(&amp;qd-&gt;qd_lockref.lock);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int qd_fish(struct gfs2_sbd *sdp, struct gfs2_quota_data **qdp)</div><div class='add'>+static void qd_ungrab_sync(struct gfs2_quota_data *qd)</div><div class='ctx'> {</div><div class='del'>-	struct gfs2_quota_data *qd = NULL;</div><div class='del'>-	int error;</div><div class='del'>-	int found = 0;</div><div class='del'>-</div><div class='del'>-	*qdp = NULL;</div><div class='del'>-</div><div class='del'>-	if (sb_rdonly(sdp-&gt;sd_vfs))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;qd_lock);</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(qd, &amp;sdp-&gt;sd_quota_list, qd_list) {</div><div class='del'>-		found = qd_check_sync(sdp, qd, &amp;sdp-&gt;sd_quota_sync_gen);</div><div class='del'>-		if (found)</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!found)</div><div class='del'>-		qd = NULL;</div><div class='del'>-</div><div class='del'>-	spin_unlock(&amp;qd_lock);</div><div class='del'>-</div><div class='del'>-	if (qd) {</div><div class='del'>-		gfs2_assert_warn(sdp, qd-&gt;qd_change_sync);</div><div class='del'>-		error = bh_get(qd);</div><div class='del'>-		if (error) {</div><div class='del'>-			clear_bit(QDF_LOCKED, &amp;qd-&gt;qd_flags);</div><div class='del'>-			slot_put(qd);</div><div class='del'>-			qd_put(qd);</div><div class='del'>-			return error;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	*qdp = qd;</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='add'>+	clear_bit(QDF_LOCKED, &amp;qd-&gt;qd_flags);</div><div class='add'>+	slot_put(qd);</div><div class='add'>+	qd_put(qd);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void qd_unlock(struct gfs2_quota_data *qd)</div><div class='add'>+static void qdsb_put(struct gfs2_quota_data *qd)</div><div class='ctx'> {</div><div class='del'>-	gfs2_assert_warn(qd-&gt;qd_gl-&gt;gl_name.ln_sbd,</div><div class='del'>-			 test_bit(QDF_LOCKED, &amp;qd-&gt;qd_flags));</div><div class='del'>-	clear_bit(QDF_LOCKED, &amp;qd-&gt;qd_flags);</div><div class='ctx'> 	bh_put(qd);</div><div class='ctx'> 	slot_put(qd);</div><div class='ctx'> 	qd_put(qd);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void qd_unlock(struct gfs2_quota_data *qd)</div><div class='add'>+{</div><div class='add'>+	spin_lock(&amp;qd-&gt;qd_lockref.lock);</div><div class='add'>+	gfs2_assert_warn(qd-&gt;qd_sbd, test_bit(QDF_LOCKED, &amp;qd-&gt;qd_flags));</div><div class='add'>+	clear_bit(QDF_LOCKED, &amp;qd-&gt;qd_flags);</div><div class='add'>+	spin_unlock(&amp;qd-&gt;qd_lockref.lock);</div><div class='add'>+	qdsb_put(qd);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int qdsb_get(struct gfs2_sbd *sdp, struct kqid qid,</div><div class='ctx'> 		    struct gfs2_quota_data **qdp)</div><div class='ctx'> {</div><div class='hunk'>@@ -517,13 +535,6 @@ fail:</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void qdsb_put(struct gfs2_quota_data *qd)</div><div class='del'>-{</div><div class='del'>-	bh_put(qd);</div><div class='del'>-	slot_put(qd);</div><div class='del'>-	qd_put(qd);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /**</div><div class='ctx'>  * gfs2_qa_get - make sure we have a quota allocations data structure,</div><div class='ctx'>  *               if necessary</div><div class='hunk'>@@ -531,34 +542,42 @@ static void qdsb_put(struct gfs2_quota_data *qd)</div><div class='ctx'>  */</div><div class='ctx'> int gfs2_qa_get(struct gfs2_inode *ip)</div><div class='ctx'> {</div><div class='del'>-	int error = 0;</div><div class='ctx'> 	struct gfs2_sbd *sdp = GFS2_SB(&amp;ip-&gt;i_inode);</div><div class='add'>+	struct inode *inode = &amp;ip-&gt;i_inode;</div><div class='ctx'> </div><div class='ctx'> 	if (sdp-&gt;sd_args.ar_quota == GFS2_QUOTA_OFF)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;ip-&gt;i_rw_mutex);</div><div class='add'>+	spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	if (ip-&gt;i_qadata == NULL) {</div><div class='del'>-		ip-&gt;i_qadata = kmem_cache_zalloc(gfs2_qadata_cachep, GFP_NOFS);</div><div class='del'>-		if (!ip-&gt;i_qadata) {</div><div class='del'>-			error = -ENOMEM;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+		struct gfs2_qadata *tmp;</div><div class='add'>+</div><div class='add'>+		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+		tmp = kmem_cache_zalloc(gfs2_qadata_cachep, GFP_NOFS);</div><div class='add'>+		if (!tmp)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+		if (ip-&gt;i_qadata == NULL)</div><div class='add'>+			ip-&gt;i_qadata = tmp;</div><div class='add'>+		else</div><div class='add'>+			kmem_cache_free(gfs2_qadata_cachep, tmp);</div><div class='ctx'> 	}</div><div class='ctx'> 	ip-&gt;i_qadata-&gt;qa_ref++;</div><div class='del'>-out:</div><div class='del'>-	up_write(&amp;ip-&gt;i_rw_mutex);</div><div class='del'>-	return error;</div><div class='add'>+	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void gfs2_qa_put(struct gfs2_inode *ip)</div><div class='ctx'> {</div><div class='del'>-	down_write(&amp;ip-&gt;i_rw_mutex);</div><div class='add'>+	struct inode *inode = &amp;ip-&gt;i_inode;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	if (ip-&gt;i_qadata &amp;&amp; --ip-&gt;i_qadata-&gt;qa_ref == 0) {</div><div class='ctx'> 		kmem_cache_free(gfs2_qadata_cachep, ip-&gt;i_qadata);</div><div class='ctx'> 		ip-&gt;i_qadata = NULL;</div><div class='ctx'> 	}</div><div class='del'>-	up_write(&amp;ip-&gt;i_rw_mutex);</div><div class='add'>+	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int gfs2_quota_hold(struct gfs2_inode *ip, kuid_t uid, kgid_t gid)</div><div class='hunk'>@@ -579,6 +598,7 @@ int gfs2_quota_hold(struct gfs2_inode *ip, kuid_t uid, kgid_t gid)</div><div class='ctx'> 	if (gfs2_assert_warn(sdp, !ip-&gt;i_qadata-&gt;qa_qd_num) ||</div><div class='ctx'> 	    gfs2_assert_warn(sdp, !test_bit(GIF_QD_LOCKED, &amp;ip-&gt;i_flags))) {</div><div class='ctx'> 		error = -EIO;</div><div class='add'>+		gfs2_qa_put(ip);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -651,72 +671,81 @@ static int sort_qd(const void *a, const void *b)</div><div class='ctx'> </div><div class='ctx'> static void do_qc(struct gfs2_quota_data *qd, s64 change)</div><div class='ctx'> {</div><div class='del'>-	struct gfs2_sbd *sdp = qd-&gt;qd_gl-&gt;gl_name.ln_sbd;</div><div class='add'>+	struct gfs2_sbd *sdp = qd-&gt;qd_sbd;</div><div class='ctx'> 	struct gfs2_inode *ip = GFS2_I(sdp-&gt;sd_qc_inode);</div><div class='ctx'> 	struct gfs2_quota_change *qc = qd-&gt;qd_bh_qc;</div><div class='add'>+	bool needs_put = false;</div><div class='ctx'> 	s64 x;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;sdp-&gt;sd_quota_mutex);</div><div class='ctx'> 	gfs2_trans_add_meta(ip-&gt;i_gl, qd-&gt;qd_bh);</div><div class='ctx'> </div><div class='del'>-	if (!test_bit(QDF_CHANGE, &amp;qd-&gt;qd_flags)) {</div><div class='del'>-		qc-&gt;qc_change = 0;</div><div class='add'>+	/*</div><div class='add'>+	 * The QDF_CHANGE flag indicates that the slot in the quota change file</div><div class='add'>+	 * is used.  Here, we use the value of qc-&gt;qc_change when the slot is</div><div class='add'>+	 * used, and we assume a value of 0 otherwise.</div><div class='add'>+	 */</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;qd-&gt;qd_lockref.lock);</div><div class='add'>+</div><div class='add'>+	x = 0;</div><div class='add'>+	if (test_bit(QDF_CHANGE, &amp;qd-&gt;qd_flags))</div><div class='add'>+		x = be64_to_cpu(qc-&gt;qc_change);</div><div class='add'>+	x += change;</div><div class='add'>+	qd-&gt;qd_change += change;</div><div class='add'>+</div><div class='add'>+	if (!x &amp;&amp; test_bit(QDF_CHANGE, &amp;qd-&gt;qd_flags)) {</div><div class='add'>+		/* The slot in the quota change file becomes unused. */</div><div class='add'>+		clear_bit(QDF_CHANGE, &amp;qd-&gt;qd_flags);</div><div class='add'>+		qc-&gt;qc_flags = 0;</div><div class='add'>+		qc-&gt;qc_id = 0;</div><div class='add'>+		needs_put = true;</div><div class='add'>+	} else if (x &amp;&amp; !test_bit(QDF_CHANGE, &amp;qd-&gt;qd_flags)) {</div><div class='add'>+		/* The slot in the quota change file becomes used. */</div><div class='add'>+		set_bit(QDF_CHANGE, &amp;qd-&gt;qd_flags);</div><div class='add'>+		__qd_hold(qd);</div><div class='add'>+		slot_hold(qd);</div><div class='add'>+</div><div class='ctx'> 		qc-&gt;qc_flags = 0;</div><div class='ctx'> 		if (qd-&gt;qd_id.type == USRQUOTA)</div><div class='ctx'> 			qc-&gt;qc_flags = cpu_to_be32(GFS2_QCF_USER);</div><div class='ctx'> 		qc-&gt;qc_id = cpu_to_be32(from_kqid(&amp;init_user_ns, qd-&gt;qd_id));</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	x = be64_to_cpu(qc-&gt;qc_change) + change;</div><div class='ctx'> 	qc-&gt;qc_change = cpu_to_be64(x);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;qd_lock);</div><div class='del'>-	qd-&gt;qd_change = x;</div><div class='del'>-	spin_unlock(&amp;qd_lock);</div><div class='add'>+	spin_unlock(&amp;qd-&gt;qd_lockref.lock);</div><div class='ctx'> </div><div class='del'>-	if (!x) {</div><div class='del'>-		gfs2_assert_warn(sdp, test_bit(QDF_CHANGE, &amp;qd-&gt;qd_flags));</div><div class='del'>-		clear_bit(QDF_CHANGE, &amp;qd-&gt;qd_flags);</div><div class='del'>-		qc-&gt;qc_flags = 0;</div><div class='del'>-		qc-&gt;qc_id = 0;</div><div class='add'>+	if (needs_put) {</div><div class='ctx'> 		slot_put(qd);</div><div class='ctx'> 		qd_put(qd);</div><div class='del'>-	} else if (!test_and_set_bit(QDF_CHANGE, &amp;qd-&gt;qd_flags)) {</div><div class='del'>-		qd_hold(qd);</div><div class='del'>-		slot_hold(qd);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='ctx'> 	if (change &lt; 0) /* Reset quiet flag if we freed some blocks */</div><div class='ctx'> 		clear_bit(QDF_QMSG_QUIET, &amp;qd-&gt;qd_flags);</div><div class='del'>-	mutex_unlock(&amp;sdp-&gt;sd_quota_mutex);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int gfs2_write_buf_to_page(struct gfs2_inode *ip, unsigned long index,</div><div class='add'>+static int gfs2_write_buf_to_page(struct gfs2_sbd *sdp, unsigned long index,</div><div class='ctx'> 				  unsigned off, void *buf, unsigned bytes)</div><div class='ctx'> {</div><div class='add'>+	struct gfs2_inode *ip = GFS2_I(sdp-&gt;sd_quota_inode);</div><div class='ctx'> 	struct inode *inode = &amp;ip-&gt;i_inode;</div><div class='del'>-	struct gfs2_sbd *sdp = GFS2_SB(inode);</div><div class='ctx'> 	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='del'>-	void *kaddr;</div><div class='ctx'> 	u64 blk;</div><div class='ctx'> 	unsigned bsize = sdp-&gt;sd_sb.sb_bsize, bnum = 0, boff = 0;</div><div class='ctx'> 	unsigned to_write = bytes, pg_off = off;</div><div class='del'>-	int done = 0;</div><div class='ctx'> </div><div class='ctx'> 	blk = index &lt;&lt; (PAGE_SHIFT - sdp-&gt;sd_sb.sb_bsize_shift);</div><div class='ctx'> 	boff = off % bsize;</div><div class='ctx'> </div><div class='del'>-	page = find_or_create_page(mapping, index, GFP_NOFS);</div><div class='del'>-	if (!page)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	if (!page_has_buffers(page))</div><div class='del'>-		create_empty_buffers(page, bsize, 0);</div><div class='add'>+	folio = filemap_grab_folio(mapping, index);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio);</div><div class='add'>+	bh = folio_buffers(folio);</div><div class='add'>+	if (!bh)</div><div class='add'>+		bh = create_empty_buffers(folio, bsize, 0);</div><div class='ctx'> </div><div class='del'>-	bh = page_buffers(page);</div><div class='del'>-	while (!done) {</div><div class='del'>-		/* Find the beginning block within the page */</div><div class='add'>+	for (;;) {</div><div class='add'>+		/* Find the beginning block within the folio */</div><div class='ctx'> 		if (pg_off &gt;= ((bnum * bsize) + bsize)) {</div><div class='ctx'> 			bh = bh-&gt;b_this_page;</div><div class='ctx'> 			bnum++;</div><div class='hunk'>@@ -729,20 +758,14 @@ static int gfs2_write_buf_to_page(struct gfs2_inode *ip, unsigned long index,</div><div class='ctx'> 				goto unlock_out;</div><div class='ctx'> 			/* If it's a newly allocated disk block, zero it */</div><div class='ctx'> 			if (buffer_new(bh))</div><div class='del'>-				zero_user(page, bnum * bsize, bh-&gt;b_size);</div><div class='add'>+				folio_zero_range(folio, bnum * bsize,</div><div class='add'>+						bh-&gt;b_size);</div><div class='ctx'> 		}</div><div class='del'>-		if (PageUptodate(page))</div><div class='add'>+		if (folio_test_uptodate(folio))</div><div class='ctx'> 			set_buffer_uptodate(bh);</div><div class='del'>-		if (!buffer_uptodate(bh)) {</div><div class='del'>-			ll_rw_block(REQ_OP_READ, REQ_META | REQ_PRIO, 1, &amp;bh);</div><div class='del'>-			wait_on_buffer(bh);</div><div class='del'>-			if (!buffer_uptodate(bh))</div><div class='del'>-				goto unlock_out;</div><div class='del'>-		}</div><div class='del'>-		if (gfs2_is_jdata(ip))</div><div class='del'>-			gfs2_trans_add_data(ip-&gt;i_gl, bh);</div><div class='del'>-		else</div><div class='del'>-			gfs2_ordered_add_inode(ip);</div><div class='add'>+		if (bh_read(bh, REQ_META | REQ_PRIO) &lt; 0)</div><div class='add'>+			goto unlock_out;</div><div class='add'>+		gfs2_trans_add_data(ip-&gt;i_gl, bh);</div><div class='ctx'> </div><div class='ctx'> 		/* If we need to write to the next block as well */</div><div class='ctx'> 		if (to_write &gt; (bsize - boff)) {</div><div class='hunk'>@@ -751,31 +774,29 @@ static int gfs2_write_buf_to_page(struct gfs2_inode *ip, unsigned long index,</div><div class='ctx'> 			boff = pg_off % bsize;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='del'>-		done = 1;</div><div class='add'>+		break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Write to the page, now that we have setup the buffer(s) */</div><div class='del'>-	kaddr = kmap_atomic(page);</div><div class='del'>-	memcpy(kaddr + off, buf, bytes);</div><div class='del'>-	flush_dcache_page(page);</div><div class='del'>-	kunmap_atomic(kaddr);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='add'>+	/* Write to the folio, now that we have setup the buffer(s) */</div><div class='add'>+	memcpy_to_folio(folio, off, buf, bytes);</div><div class='add'>+	flush_dcache_folio(folio);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> unlock_out:</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> 	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int gfs2_write_disk_quota(struct gfs2_inode *ip, struct gfs2_quota *qp,</div><div class='add'>+static int gfs2_write_disk_quota(struct gfs2_sbd *sdp, struct gfs2_quota *qp,</div><div class='ctx'> 				 loff_t loc)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned long pg_beg;</div><div class='ctx'> 	unsigned pg_off, nbytes, overflow = 0;</div><div class='del'>-	int pg_oflow = 0, error;</div><div class='add'>+	int error;</div><div class='ctx'> 	void *ptr;</div><div class='ctx'> </div><div class='ctx'> 	nbytes = sizeof(struct gfs2_quota);</div><div class='hunk'>@@ -784,17 +805,15 @@ static int gfs2_write_disk_quota(struct gfs2_inode *ip, struct gfs2_quota *qp,</div><div class='ctx'> 	pg_off = offset_in_page(loc);</div><div class='ctx'> </div><div class='ctx'> 	/* If the quota straddles a page boundary, split the write in two */</div><div class='del'>-	if ((pg_off + nbytes) &gt; PAGE_SIZE) {</div><div class='del'>-		pg_oflow = 1;</div><div class='add'>+	if ((pg_off + nbytes) &gt; PAGE_SIZE)</div><div class='ctx'> 		overflow = (pg_off + nbytes) - PAGE_SIZE;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	ptr = qp;</div><div class='del'>-	error = gfs2_write_buf_to_page(ip, pg_beg, pg_off, ptr,</div><div class='add'>+	error = gfs2_write_buf_to_page(sdp, pg_beg, pg_off, ptr,</div><div class='ctx'> 				       nbytes - overflow);</div><div class='ctx'> 	/* If there's an overflow, write the remaining bytes to the next page */</div><div class='del'>-	if (!error &amp;&amp; pg_oflow)</div><div class='del'>-		error = gfs2_write_buf_to_page(ip, pg_beg + 1, 0,</div><div class='add'>+	if (!error &amp;&amp; overflow)</div><div class='add'>+		error = gfs2_write_buf_to_page(sdp, pg_beg + 1, 0,</div><div class='ctx'> 					       ptr + nbytes - overflow,</div><div class='ctx'> 					       overflow);</div><div class='ctx'> 	return error;</div><div class='hunk'>@@ -802,7 +821,7 @@ static int gfs2_write_disk_quota(struct gfs2_inode *ip, struct gfs2_quota *qp,</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * gfs2_adjust_quota - adjust record of current block usage</div><div class='del'>- * @ip: The quota inode</div><div class='add'>+ * @sdp: The superblock</div><div class='ctx'>  * @loc: Offset of the entry in the quota file</div><div class='ctx'>  * @change: The amount of usage change to record</div><div class='ctx'>  * @qd: The quota data</div><div class='hunk'>@@ -814,12 +833,12 @@ static int gfs2_write_disk_quota(struct gfs2_inode *ip, struct gfs2_quota *qp,</div><div class='ctx'>  * Returns: 0 or -ve on error</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static int gfs2_adjust_quota(struct gfs2_inode *ip, loff_t loc,</div><div class='add'>+static int gfs2_adjust_quota(struct gfs2_sbd *sdp, loff_t loc,</div><div class='ctx'> 			     s64 change, struct gfs2_quota_data *qd,</div><div class='ctx'> 			     struct qc_dqblk *fdq)</div><div class='ctx'> {</div><div class='add'>+	struct gfs2_inode *ip = GFS2_I(sdp-&gt;sd_quota_inode);</div><div class='ctx'> 	struct inode *inode = &amp;ip-&gt;i_inode;</div><div class='del'>-	struct gfs2_sbd *sdp = GFS2_SB(inode);</div><div class='ctx'> 	struct gfs2_quota q;</div><div class='ctx'> 	int err;</div><div class='ctx'> 	u64 size;</div><div class='hunk'>@@ -836,10 +855,10 @@ static int gfs2_adjust_quota(struct gfs2_inode *ip, loff_t loc,</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='ctx'> 	loc -= sizeof(q); /* gfs2_internal_read would've advanced the loc ptr */</div><div class='del'>-	err = -EIO;</div><div class='ctx'> 	be64_add_cpu(&amp;q.qu_value, change);</div><div class='ctx'> 	if (((s64)be64_to_cpu(q.qu_value)) &lt; 0)</div><div class='ctx'> 		q.qu_value = 0; /* Never go negative on quota usage */</div><div class='add'>+	spin_lock(&amp;qd-&gt;qd_lockref.lock);</div><div class='ctx'> 	qd-&gt;qd_qb.qb_value = q.qu_value;</div><div class='ctx'> 	if (fdq) {</div><div class='ctx'> 		if (fdq-&gt;d_fieldmask &amp; QC_SPC_SOFT) {</div><div class='hunk'>@@ -855,13 +874,14 @@ static int gfs2_adjust_quota(struct gfs2_inode *ip, loff_t loc,</div><div class='ctx'> 			qd-&gt;qd_qb.qb_value = q.qu_value;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='add'>+	spin_unlock(&amp;qd-&gt;qd_lockref.lock);</div><div class='ctx'> </div><div class='del'>-	err = gfs2_write_disk_quota(ip, &amp;q, loc);</div><div class='add'>+	err = gfs2_write_disk_quota(sdp, &amp;q, loc);</div><div class='ctx'> 	if (!err) {</div><div class='ctx'> 		size = loc + sizeof(struct gfs2_quota);</div><div class='ctx'> 		if (size &gt; inode-&gt;i_size)</div><div class='ctx'> 			i_size_write(inode, size);</div><div class='del'>-		inode-&gt;i_mtime = inode-&gt;i_atime = current_time(inode);</div><div class='add'>+		inode_set_mtime_to_ts(inode, inode_set_ctime_current(inode));</div><div class='ctx'> 		mark_inode_dirty(inode);</div><div class='ctx'> 		set_bit(QDF_REFRESH, &amp;qd-&gt;qd_flags);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -869,11 +889,12 @@ static int gfs2_adjust_quota(struct gfs2_inode *ip, loff_t loc,</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int do_sync(unsigned int num_qd, struct gfs2_quota_data **qda)</div><div class='add'>+static int do_sync(unsigned int num_qd, struct gfs2_quota_data **qda,</div><div class='add'>+		   u64 sync_gen)</div><div class='ctx'> {</div><div class='del'>-	struct gfs2_sbd *sdp = (*qda)-&gt;qd_gl-&gt;gl_name.ln_sbd;</div><div class='add'>+	struct gfs2_sbd *sdp = (*qda)-&gt;qd_sbd;</div><div class='ctx'> 	struct gfs2_inode *ip = GFS2_I(sdp-&gt;sd_quota_inode);</div><div class='del'>-	struct gfs2_alloc_parms ap = { .aflags = 0, };</div><div class='add'>+	struct gfs2_alloc_parms ap = {};</div><div class='ctx'> 	unsigned int data_blocks, ind_blocks;</div><div class='ctx'> 	struct gfs2_holder *ghs, i_gh;</div><div class='ctx'> 	unsigned int qx, x;</div><div class='hunk'>@@ -883,18 +904,12 @@ static int do_sync(unsigned int num_qd, struct gfs2_quota_data **qda)</div><div class='ctx'> 	unsigned int nalloc = 0, blocks;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	error = gfs2_qa_get(ip);</div><div class='del'>-	if (error)</div><div class='del'>-		return error;</div><div class='del'>-</div><div class='ctx'> 	gfs2_write_calc_reserv(ip, sizeof(struct gfs2_quota),</div><div class='ctx'> 			      &amp;data_blocks, &amp;ind_blocks);</div><div class='ctx'> </div><div class='ctx'> 	ghs = kmalloc_array(num_qd, sizeof(struct gfs2_holder), GFP_NOFS);</div><div class='del'>-	if (!ghs) {</div><div class='del'>-		error = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (!ghs)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	sort(qda, num_qd, sizeof(struct gfs2_quota_data *), sort_qd, NULL);</div><div class='ctx'> 	inode_lock(&amp;ip-&gt;i_inode);</div><div class='hunk'>@@ -943,7 +958,8 @@ static int do_sync(unsigned int num_qd, struct gfs2_quota_data **qda)</div><div class='ctx'> 	for (x = 0; x &lt; num_qd; x++) {</div><div class='ctx'> 		qd = qda[x];</div><div class='ctx'> 		offset = qd2offset(qd);</div><div class='del'>-		error = gfs2_adjust_quota(ip, offset, qd-&gt;qd_change_sync, qd, NULL);</div><div class='add'>+		error = gfs2_adjust_quota(sdp, offset, qd-&gt;qd_change_sync, qd,</div><div class='add'>+							NULL);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			goto out_end_trans;</div><div class='ctx'> </div><div class='hunk'>@@ -951,8 +967,6 @@ static int do_sync(unsigned int num_qd, struct gfs2_quota_data **qda)</div><div class='ctx'> 		set_bit(QDF_REFRESH, &amp;qd-&gt;qd_flags);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	error = 0;</div><div class='del'>-</div><div class='ctx'> out_end_trans:</div><div class='ctx'> 	gfs2_trans_end(sdp);</div><div class='ctx'> out_ipres:</div><div class='hunk'>@@ -966,8 +980,15 @@ out_dq:</div><div class='ctx'> 	kfree(ghs);</div><div class='ctx'> 	gfs2_log_flush(ip-&gt;i_gl-&gt;gl_name.ln_sbd, ip-&gt;i_gl,</div><div class='ctx'> 		       GFS2_LOG_HEAD_FLUSH_NORMAL | GFS2_LFC_DO_SYNC);</div><div class='del'>-out:</div><div class='del'>-	gfs2_qa_put(ip);</div><div class='add'>+	if (!error) {</div><div class='add'>+		for (x = 0; x &lt; num_qd; x++) {</div><div class='add'>+			qd = qda[x];</div><div class='add'>+			spin_lock(&amp;qd-&gt;qd_lockref.lock);</div><div class='add'>+			if (qd-&gt;qd_sync_gen &lt; sync_gen)</div><div class='add'>+				qd-&gt;qd_sync_gen = sync_gen;</div><div class='add'>+			spin_unlock(&amp;qd-&gt;qd_lockref.lock);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -991,7 +1012,9 @@ static int update_qd(struct gfs2_sbd *sdp, struct gfs2_quota_data *qd)</div><div class='ctx'> 	qlvb-&gt;qb_limit = q.qu_limit;</div><div class='ctx'> 	qlvb-&gt;qb_warn = q.qu_warn;</div><div class='ctx'> 	qlvb-&gt;qb_value = q.qu_value;</div><div class='add'>+	spin_lock(&amp;qd-&gt;qd_lockref.lock);</div><div class='ctx'> 	qd-&gt;qd_qb = *qlvb;</div><div class='add'>+	spin_unlock(&amp;qd-&gt;qd_lockref.lock);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -999,11 +1022,12 @@ static int update_qd(struct gfs2_sbd *sdp, struct gfs2_quota_data *qd)</div><div class='ctx'> static int do_glock(struct gfs2_quota_data *qd, int force_refresh,</div><div class='ctx'> 		    struct gfs2_holder *q_gh)</div><div class='ctx'> {</div><div class='del'>-	struct gfs2_sbd *sdp = qd-&gt;qd_gl-&gt;gl_name.ln_sbd;</div><div class='add'>+	struct gfs2_sbd *sdp = qd-&gt;qd_sbd;</div><div class='ctx'> 	struct gfs2_inode *ip = GFS2_I(sdp-&gt;sd_quota_inode);</div><div class='ctx'> 	struct gfs2_holder i_gh;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='add'>+	gfs2_assert_warn(sdp, sdp == qd-&gt;qd_gl-&gt;gl_name.ln_sbd);</div><div class='ctx'> restart:</div><div class='ctx'> 	error = gfs2_glock_nq_init(qd-&gt;qd_gl, LM_ST_SHARED, 0, q_gh);</div><div class='ctx'> 	if (error)</div><div class='hunk'>@@ -1012,7 +1036,9 @@ restart:</div><div class='ctx'> 	if (test_and_clear_bit(QDF_REFRESH, &amp;qd-&gt;qd_flags))</div><div class='ctx'> 		force_refresh = FORCE;</div><div class='ctx'> </div><div class='add'>+	spin_lock(&amp;qd-&gt;qd_lockref.lock);</div><div class='ctx'> 	qd-&gt;qd_qb = *(struct gfs2_quota_lvb *)qd-&gt;qd_gl-&gt;gl_lksb.sb_lvbptr;</div><div class='add'>+	spin_unlock(&amp;qd-&gt;qd_lockref.lock);</div><div class='ctx'> </div><div class='ctx'> 	if (force_refresh || qd-&gt;qd_qb.qb_magic != cpu_to_be32(GFS2_MAGIC)) {</div><div class='ctx'> 		gfs2_glock_dq_uninit(q_gh);</div><div class='hunk'>@@ -1049,9 +1075,9 @@ int gfs2_quota_lock(struct gfs2_inode *ip, kuid_t uid, kgid_t gid)</div><div class='ctx'> 	struct gfs2_sbd *sdp = GFS2_SB(&amp;ip-&gt;i_inode);</div><div class='ctx'> 	struct gfs2_quota_data *qd;</div><div class='ctx'> 	u32 x;</div><div class='del'>-	int error = 0;</div><div class='add'>+	int error;</div><div class='ctx'> </div><div class='del'>-	if (sdp-&gt;sd_args.ar_quota != GFS2_QUOTA_ON)</div><div class='add'>+	if (sdp-&gt;sd_args.ar_quota == GFS2_QUOTA_OFF)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	error = gfs2_quota_hold(ip, uid, gid);</div><div class='hunk'>@@ -1079,56 +1105,56 @@ int gfs2_quota_lock(struct gfs2_inode *ip, kuid_t uid, kgid_t gid)</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int need_sync(struct gfs2_quota_data *qd)</div><div class='add'>+static bool need_sync(struct gfs2_quota_data *qd)</div><div class='ctx'> {</div><div class='del'>-	struct gfs2_sbd *sdp = qd-&gt;qd_gl-&gt;gl_name.ln_sbd;</div><div class='add'>+	struct gfs2_sbd *sdp = qd-&gt;qd_sbd;</div><div class='ctx'> 	struct gfs2_tune *gt = &amp;sdp-&gt;sd_tune;</div><div class='del'>-	s64 value;</div><div class='add'>+	s64 value, change, limit;</div><div class='ctx'> 	unsigned int num, den;</div><div class='del'>-	int do_sync = 1;</div><div class='add'>+	int ret = false;</div><div class='ctx'> </div><div class='add'>+	spin_lock(&amp;qd-&gt;qd_lockref.lock);</div><div class='ctx'> 	if (!qd-&gt;qd_qb.qb_limit)</div><div class='del'>-		return 0;</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;qd_lock);</div><div class='del'>-	value = qd-&gt;qd_change;</div><div class='del'>-	spin_unlock(&amp;qd_lock);</div><div class='add'>+	change = qd-&gt;qd_change;</div><div class='add'>+	if (change &lt;= 0)</div><div class='add'>+		goto out;</div><div class='add'>+	value = (s64)be64_to_cpu(qd-&gt;qd_qb.qb_value);</div><div class='add'>+	limit = (s64)be64_to_cpu(qd-&gt;qd_qb.qb_limit);</div><div class='add'>+	if (value &gt;= limit)</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;gt-&gt;gt_spin);</div><div class='ctx'> 	num = gt-&gt;gt_quota_scale_num;</div><div class='ctx'> 	den = gt-&gt;gt_quota_scale_den;</div><div class='ctx'> 	spin_unlock(&amp;gt-&gt;gt_spin);</div><div class='ctx'> </div><div class='del'>-	if (value &lt; 0)</div><div class='del'>-		do_sync = 0;</div><div class='del'>-	else if ((s64)be64_to_cpu(qd-&gt;qd_qb.qb_value) &gt;=</div><div class='del'>-		 (s64)be64_to_cpu(qd-&gt;qd_qb.qb_limit))</div><div class='del'>-		do_sync = 0;</div><div class='del'>-	else {</div><div class='del'>-		value *= gfs2_jindex_size(sdp) * num;</div><div class='del'>-		value = div_s64(value, den);</div><div class='del'>-		value += (s64)be64_to_cpu(qd-&gt;qd_qb.qb_value);</div><div class='del'>-		if (value &lt; (s64)be64_to_cpu(qd-&gt;qd_qb.qb_limit))</div><div class='del'>-			do_sync = 0;</div><div class='del'>-	}</div><div class='add'>+	change *= gfs2_jindex_size(sdp) * num;</div><div class='add'>+	change = div_s64(change, den);</div><div class='add'>+	if (value + change &lt; limit)</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='del'>-	return do_sync;</div><div class='add'>+	ret = true;</div><div class='add'>+out:</div><div class='add'>+	spin_unlock(&amp;qd-&gt;qd_lockref.lock);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void gfs2_quota_unlock(struct gfs2_inode *ip)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_sbd *sdp = GFS2_SB(&amp;ip-&gt;i_inode);</div><div class='del'>-	struct gfs2_quota_data *qda[4];</div><div class='add'>+	struct gfs2_quota_data *qda[2 * GFS2_MAXQUOTAS];</div><div class='ctx'> 	unsigned int count = 0;</div><div class='ctx'> 	u32 x;</div><div class='del'>-	int found;</div><div class='ctx'> </div><div class='ctx'> 	if (!test_and_clear_bit(GIF_QD_LOCKED, &amp;ip-&gt;i_flags))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	for (x = 0; x &lt; ip-&gt;i_qadata-&gt;qa_qd_num; x++) {</div><div class='ctx'> 		struct gfs2_quota_data *qd;</div><div class='del'>-		int sync;</div><div class='add'>+		bool sync;</div><div class='add'>+		int error;</div><div class='ctx'> </div><div class='ctx'> 		qd = ip-&gt;i_qadata-&gt;qa_qd[x];</div><div class='ctx'> 		sync = need_sync(qd);</div><div class='hunk'>@@ -1138,17 +1164,16 @@ void gfs2_quota_unlock(struct gfs2_inode *ip)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		spin_lock(&amp;qd_lock);</div><div class='del'>-		found = qd_check_sync(sdp, qd, NULL);</div><div class='add'>+		sync = qd_grab_sync(sdp, qd, U64_MAX);</div><div class='ctx'> 		spin_unlock(&amp;qd_lock);</div><div class='ctx'> </div><div class='del'>-		if (!found)</div><div class='add'>+		if (!sync)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		gfs2_assert_warn(sdp, qd-&gt;qd_change_sync);</div><div class='del'>-		if (bh_get(qd)) {</div><div class='del'>-			clear_bit(QDF_LOCKED, &amp;qd-&gt;qd_flags);</div><div class='del'>-			slot_put(qd);</div><div class='del'>-			qd_put(qd);</div><div class='add'>+		error = bh_get(qd);</div><div class='add'>+		if (error) {</div><div class='add'>+			qd_ungrab_sync(qd);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -1156,7 +1181,9 @@ void gfs2_quota_unlock(struct gfs2_inode *ip)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (count) {</div><div class='del'>-		do_sync(count, qda);</div><div class='add'>+		u64 sync_gen = READ_ONCE(sdp-&gt;sd_quota_sync_gen);</div><div class='add'>+</div><div class='add'>+		do_sync(count, qda, sync_gen);</div><div class='ctx'> 		for (x = 0; x &lt; count; x++)</div><div class='ctx'> 			qd_unlock(qda[x]);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1166,16 +1193,16 @@ void gfs2_quota_unlock(struct gfs2_inode *ip)</div><div class='ctx'> </div><div class='ctx'> #define MAX_LINE 256</div><div class='ctx'> </div><div class='del'>-static int print_message(struct gfs2_quota_data *qd, char *type)</div><div class='add'>+static void print_message(struct gfs2_quota_data *qd, char *type)</div><div class='ctx'> {</div><div class='del'>-	struct gfs2_sbd *sdp = qd-&gt;qd_gl-&gt;gl_name.ln_sbd;</div><div class='del'>-</div><div class='del'>-	fs_info(sdp, "quota %s for %s %u\n",</div><div class='del'>-		type,</div><div class='del'>-		(qd-&gt;qd_id.type == USRQUOTA) ? "user" : "group",</div><div class='del'>-		from_kqid(&amp;init_user_ns, qd-&gt;qd_id));</div><div class='add'>+	struct gfs2_sbd *sdp = qd-&gt;qd_sbd;</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+	if (sdp-&gt;sd_args.ar_quota != GFS2_QUOTA_QUIET) {</div><div class='add'>+		fs_info(sdp, "quota %s for %s %u\n",</div><div class='add'>+			type,</div><div class='add'>+			(qd-&gt;qd_id.type == USRQUOTA) ? "user" : "group",</div><div class='add'>+			from_kqid(&amp;init_user_ns, qd-&gt;qd_id));</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -1215,12 +1242,12 @@ int gfs2_quota_check(struct gfs2_inode *ip, kuid_t uid, kgid_t gid,</div><div class='ctx'> 		      qid_eq(qd-&gt;qd_id, make_kqid_gid(gid))))</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='add'>+		spin_lock(&amp;qd-&gt;qd_lockref.lock);</div><div class='ctx'> 		warn = (s64)be64_to_cpu(qd-&gt;qd_qb.qb_warn);</div><div class='ctx'> 		limit = (s64)be64_to_cpu(qd-&gt;qd_qb.qb_limit);</div><div class='ctx'> 		value = (s64)be64_to_cpu(qd-&gt;qd_qb.qb_value);</div><div class='del'>-		spin_lock(&amp;qd_lock);</div><div class='ctx'> 		value += qd-&gt;qd_change;</div><div class='del'>-		spin_unlock(&amp;qd_lock);</div><div class='add'>+		spin_unlock(&amp;qd-&gt;qd_lockref.lock);</div><div class='ctx'> </div><div class='ctx'> 		if (limit &gt; 0 &amp;&amp; (limit - value) &lt; ap-&gt;allowed)</div><div class='ctx'> 			ap-&gt;allowed = limit - value;</div><div class='hunk'>@@ -1245,7 +1272,8 @@ int gfs2_quota_check(struct gfs2_inode *ip, kuid_t uid, kgid_t gid,</div><div class='ctx'> 					 * HZ)) {</div><div class='ctx'> 			quota_send_warning(qd-&gt;qd_id,</div><div class='ctx'> 					   sdp-&gt;sd_vfs-&gt;s_dev, QUOTA_NL_BSOFTWARN);</div><div class='del'>-			error = print_message(qd, "warning");</div><div class='add'>+			print_message(qd, "warning");</div><div class='add'>+			error = 0;</div><div class='ctx'> 			qd-&gt;qd_last_warn = jiffies;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1259,7 +1287,7 @@ void gfs2_quota_change(struct gfs2_inode *ip, s64 change,</div><div class='ctx'> 	u32 x;</div><div class='ctx'> 	struct gfs2_sbd *sdp = GFS2_SB(&amp;ip-&gt;i_inode);</div><div class='ctx'> </div><div class='del'>-	if (sdp-&gt;sd_args.ar_quota != GFS2_QUOTA_ON ||</div><div class='add'>+	if (sdp-&gt;sd_args.ar_quota == GFS2_QUOTA_OFF ||</div><div class='ctx'> 	    gfs2_assert_warn(sdp, change))</div><div class='ctx'> 		return;</div><div class='ctx'> 	if (ip-&gt;i_diskflags &amp; GFS2_DIF_SYSTEM)</div><div class='hunk'>@@ -1283,40 +1311,55 @@ int gfs2_quota_sync(struct super_block *sb, int type)</div><div class='ctx'> 	struct gfs2_sbd *sdp = sb-&gt;s_fs_info;</div><div class='ctx'> 	struct gfs2_quota_data **qda;</div><div class='ctx'> 	unsigned int max_qd = PAGE_SIZE / sizeof(struct gfs2_holder);</div><div class='del'>-	unsigned int num_qd;</div><div class='del'>-	unsigned int x;</div><div class='add'>+	u64 sync_gen;</div><div class='ctx'> 	int error = 0;</div><div class='ctx'> </div><div class='add'>+	if (sb_rdonly(sdp-&gt;sd_vfs))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='ctx'> 	qda = kcalloc(max_qd, sizeof(struct gfs2_quota_data *), GFP_KERNEL);</div><div class='ctx'> 	if (!qda)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;sdp-&gt;sd_quota_sync_mutex);</div><div class='del'>-	sdp-&gt;sd_quota_sync_gen++;</div><div class='add'>+	sync_gen = sdp-&gt;sd_quota_sync_gen + 1;</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='del'>-		num_qd = 0;</div><div class='add'>+		struct gfs2_quota_data *iter;</div><div class='add'>+		unsigned int num_qd = 0;</div><div class='add'>+		unsigned int x;</div><div class='ctx'> </div><div class='del'>-		for (;;) {</div><div class='del'>-			error = qd_fish(sdp, qda + num_qd);</div><div class='del'>-			if (error || !qda[num_qd])</div><div class='del'>-				break;</div><div class='del'>-			if (++num_qd == max_qd)</div><div class='del'>-				break;</div><div class='add'>+		spin_lock(&amp;qd_lock);</div><div class='add'>+		list_for_each_entry(iter, &amp;sdp-&gt;sd_quota_list, qd_list) {</div><div class='add'>+			if (qd_grab_sync(sdp, iter, sync_gen)) {</div><div class='add'>+				qda[num_qd++] = iter;</div><div class='add'>+				if (num_qd == max_qd)</div><div class='add'>+					break;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='add'>+		spin_unlock(&amp;qd_lock);</div><div class='ctx'> </div><div class='del'>-		if (num_qd) {</div><div class='del'>-			if (!error)</div><div class='del'>-				error = do_sync(num_qd, qda);</div><div class='add'>+		if (!num_qd)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		for (x = 0; x &lt; num_qd; x++) {</div><div class='add'>+			error = bh_get(qda[x]);</div><div class='ctx'> 			if (!error)</div><div class='del'>-				for (x = 0; x &lt; num_qd; x++)</div><div class='del'>-					qda[x]-&gt;qd_sync_gen =</div><div class='del'>-						sdp-&gt;sd_quota_sync_gen;</div><div class='add'>+				continue;</div><div class='ctx'> </div><div class='del'>-			for (x = 0; x &lt; num_qd; x++)</div><div class='del'>-				qd_unlock(qda[x]);</div><div class='add'>+			while (x &lt; num_qd)</div><div class='add'>+				qd_ungrab_sync(qda[--num_qd]);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (!error) {</div><div class='add'>+			WRITE_ONCE(sdp-&gt;sd_quota_sync_gen, sync_gen);</div><div class='add'>+			error = do_sync(num_qd, qda, sync_gen);</div><div class='ctx'> 		}</div><div class='del'>-	} while (!error &amp;&amp; num_qd == max_qd);</div><div class='add'>+</div><div class='add'>+		for (x = 0; x &lt; num_qd; x++)</div><div class='add'>+			qd_unlock(qda[x]);</div><div class='add'>+	} while (!error);</div><div class='ctx'> </div><div class='ctx'> 	mutex_unlock(&amp;sdp-&gt;sd_quota_sync_mutex);</div><div class='ctx'> 	kfree(qda);</div><div class='hunk'>@@ -1351,6 +1394,7 @@ int gfs2_quota_init(struct gfs2_sbd *sdp)</div><div class='ctx'> 	unsigned int found = 0;</div><div class='ctx'> 	unsigned int hash;</div><div class='ctx'> 	unsigned int bm_size;</div><div class='add'>+	struct buffer_head *bh;</div><div class='ctx'> 	u64 dblock;</div><div class='ctx'> 	u32 extlen = 0;</div><div class='ctx'> 	int error;</div><div class='hunk'>@@ -1370,8 +1414,7 @@ int gfs2_quota_init(struct gfs2_sbd *sdp)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='ctx'> 	for (x = 0; x &lt; blocks; x++) {</div><div class='del'>-		struct buffer_head *bh;</div><div class='del'>-		const struct gfs2_quota_change *qc;</div><div class='add'>+		struct gfs2_quota_change *qc;</div><div class='ctx'> 		unsigned int y;</div><div class='ctx'> </div><div class='ctx'> 		if (!extlen) {</div><div class='hunk'>@@ -1384,15 +1427,13 @@ int gfs2_quota_init(struct gfs2_sbd *sdp)</div><div class='ctx'> 		bh = gfs2_meta_ra(ip-&gt;i_gl, dblock, extlen);</div><div class='ctx'> 		if (!bh)</div><div class='ctx'> 			goto fail;</div><div class='del'>-		if (gfs2_metatype_check(sdp, bh, GFS2_METATYPE_QC)) {</div><div class='del'>-			brelse(bh);</div><div class='del'>-			goto fail;</div><div class='del'>-		}</div><div class='add'>+		if (gfs2_metatype_check(sdp, bh, GFS2_METATYPE_QC))</div><div class='add'>+			goto fail_brelse;</div><div class='ctx'> </div><div class='del'>-		qc = (const struct gfs2_quota_change *)(bh-&gt;b_data + sizeof(struct gfs2_meta_header));</div><div class='add'>+		qc = (struct gfs2_quota_change *)(bh-&gt;b_data + sizeof(struct gfs2_meta_header));</div><div class='ctx'> 		for (y = 0; y &lt; sdp-&gt;sd_qc_per_block &amp;&amp; slot &lt; sdp-&gt;sd_quota_slots;</div><div class='ctx'> 		     y++, slot++) {</div><div class='del'>-			struct gfs2_quota_data *qd;</div><div class='add'>+			struct gfs2_quota_data *old_qd, *qd;</div><div class='ctx'> 			s64 qc_change = be64_to_cpu(qc-&gt;qc_change);</div><div class='ctx'> 			u32 qc_flags = be32_to_cpu(qc-&gt;qc_flags);</div><div class='ctx'> 			enum quota_type qtype = (qc_flags &amp; GFS2_QCF_USER) ?</div><div class='hunk'>@@ -1405,29 +1446,51 @@ int gfs2_quota_init(struct gfs2_sbd *sdp)</div><div class='ctx'> </div><div class='ctx'> 			hash = gfs2_qd_hash(sdp, qc_id);</div><div class='ctx'> 			qd = qd_alloc(hash, sdp, qc_id);</div><div class='del'>-			if (qd == NULL) {</div><div class='del'>-				brelse(bh);</div><div class='del'>-				goto fail;</div><div class='del'>-			}</div><div class='add'>+			if (qd == NULL)</div><div class='add'>+				goto fail_brelse;</div><div class='ctx'> </div><div class='add'>+			qd-&gt;qd_lockref.count = 0;</div><div class='ctx'> 			set_bit(QDF_CHANGE, &amp;qd-&gt;qd_flags);</div><div class='ctx'> 			qd-&gt;qd_change = qc_change;</div><div class='ctx'> 			qd-&gt;qd_slot = slot;</div><div class='del'>-			qd-&gt;qd_slot_count = 1;</div><div class='add'>+			qd-&gt;qd_slot_ref = 1;</div><div class='ctx'> </div><div class='ctx'> 			spin_lock(&amp;qd_lock);</div><div class='add'>+			spin_lock_bucket(hash);</div><div class='add'>+			old_qd = gfs2_qd_search_bucket(hash, sdp, qc_id);</div><div class='add'>+			if (old_qd) {</div><div class='add'>+				fs_err(sdp, "Corruption found in quota_change%u"</div><div class='add'>+					    "file: duplicate identifier in "</div><div class='add'>+					    "slot %u\n",</div><div class='add'>+					    sdp-&gt;sd_jdesc-&gt;jd_jid, slot);</div><div class='add'>+</div><div class='add'>+				spin_unlock_bucket(hash);</div><div class='add'>+				spin_unlock(&amp;qd_lock);</div><div class='add'>+				qd_put(old_qd);</div><div class='add'>+</div><div class='add'>+				gfs2_glock_put(qd-&gt;qd_gl);</div><div class='add'>+				kmem_cache_free(gfs2_quotad_cachep, qd);</div><div class='add'>+</div><div class='add'>+				/* zero out the duplicate slot */</div><div class='add'>+				lock_buffer(bh);</div><div class='add'>+				memset(qc, 0, sizeof(*qc));</div><div class='add'>+				mark_buffer_dirty(bh);</div><div class='add'>+				unlock_buffer(bh);</div><div class='add'>+</div><div class='add'>+				continue;</div><div class='add'>+			}</div><div class='ctx'> 			BUG_ON(test_and_set_bit(slot, sdp-&gt;sd_quota_bitmap));</div><div class='ctx'> 			list_add(&amp;qd-&gt;qd_list, &amp;sdp-&gt;sd_quota_list);</div><div class='ctx'> 			atomic_inc(&amp;sdp-&gt;sd_quota_count);</div><div class='del'>-			spin_unlock(&amp;qd_lock);</div><div class='del'>-</div><div class='del'>-			spin_lock_bucket(hash);</div><div class='ctx'> 			hlist_bl_add_head_rcu(&amp;qd-&gt;qd_hlist, &amp;qd_hash_table[hash]);</div><div class='ctx'> 			spin_unlock_bucket(hash);</div><div class='add'>+			spin_unlock(&amp;qd_lock);</div><div class='ctx'> </div><div class='ctx'> 			found++;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		if (buffer_dirty(bh))</div><div class='add'>+			sync_dirty_buffer(bh);</div><div class='ctx'> 		brelse(bh);</div><div class='ctx'> 		dblock++;</div><div class='ctx'> 		extlen--;</div><div class='hunk'>@@ -1438,6 +1501,10 @@ int gfs2_quota_init(struct gfs2_sbd *sdp)</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='add'>+fail_brelse:</div><div class='add'>+	if (buffer_dirty(bh))</div><div class='add'>+		sync_dirty_buffer(bh);</div><div class='add'>+	brelse(bh);</div><div class='ctx'> fail:</div><div class='ctx'> 	gfs2_quota_cleanup(sdp);</div><div class='ctx'> 	return error;</div><div class='hunk'>@@ -1445,36 +1512,36 @@ fail:</div><div class='ctx'> </div><div class='ctx'> void gfs2_quota_cleanup(struct gfs2_sbd *sdp)</div><div class='ctx'> {</div><div class='del'>-	struct list_head *head = &amp;sdp-&gt;sd_quota_list;</div><div class='ctx'> 	struct gfs2_quota_data *qd;</div><div class='add'>+	LIST_HEAD(dispose);</div><div class='add'>+	int count;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;qd_lock);</div><div class='del'>-	while (!list_empty(head)) {</div><div class='del'>-		qd = list_last_entry(head, struct gfs2_quota_data, qd_list);</div><div class='del'>-</div><div class='del'>-		list_del(&amp;qd-&gt;qd_list);</div><div class='del'>-</div><div class='del'>-		/* Also remove if this qd exists in the reclaim list */</div><div class='del'>-		list_lru_del(&amp;gfs2_qd_lru, &amp;qd-&gt;qd_lru);</div><div class='del'>-		atomic_dec(&amp;sdp-&gt;sd_quota_count);</div><div class='del'>-		spin_unlock(&amp;qd_lock);</div><div class='del'>-</div><div class='del'>-		spin_lock_bucket(qd-&gt;qd_hash);</div><div class='del'>-		hlist_bl_del_rcu(&amp;qd-&gt;qd_hlist);</div><div class='del'>-		spin_unlock_bucket(qd-&gt;qd_hash);</div><div class='del'>-</div><div class='del'>-		gfs2_assert_warn(sdp, !qd-&gt;qd_change);</div><div class='del'>-		gfs2_assert_warn(sdp, !qd-&gt;qd_slot_count);</div><div class='del'>-		gfs2_assert_warn(sdp, !qd-&gt;qd_bh_count);</div><div class='add'>+	BUG_ON(!test_bit(SDF_NORECOVERY, &amp;sdp-&gt;sd_flags) &amp;&amp;</div><div class='add'>+		test_bit(SDF_JOURNAL_LIVE, &amp;sdp-&gt;sd_flags));</div><div class='ctx'> </div><div class='del'>-		gfs2_glock_put(qd-&gt;qd_gl);</div><div class='del'>-		call_rcu(&amp;qd-&gt;qd_rcu, gfs2_qd_dealloc);</div><div class='add'>+	spin_lock(&amp;qd_lock);</div><div class='add'>+	list_for_each_entry(qd, &amp;sdp-&gt;sd_quota_list, qd_list) {</div><div class='add'>+		spin_lock(&amp;qd-&gt;qd_lockref.lock);</div><div class='add'>+		if (qd-&gt;qd_lockref.count != 0) {</div><div class='add'>+			spin_unlock(&amp;qd-&gt;qd_lockref.lock);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+		lockref_mark_dead(&amp;qd-&gt;qd_lockref);</div><div class='add'>+		spin_unlock(&amp;qd-&gt;qd_lockref.lock);</div><div class='ctx'> </div><div class='del'>-		spin_lock(&amp;qd_lock);</div><div class='add'>+		list_lru_del_obj(&amp;gfs2_qd_lru, &amp;qd-&gt;qd_lru);</div><div class='add'>+		list_add(&amp;qd-&gt;qd_lru, &amp;dispose);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;qd_lock);</div><div class='ctx'> </div><div class='del'>-	gfs2_assert_warn(sdp, !atomic_read(&amp;sdp-&gt;sd_quota_count));</div><div class='add'>+	gfs2_qd_list_dispose(&amp;dispose);</div><div class='add'>+</div><div class='add'>+	wait_event_timeout(sdp-&gt;sd_kill_wait,</div><div class='add'>+		(count = atomic_read(&amp;sdp-&gt;sd_quota_count)) == 0,</div><div class='add'>+		HZ * 60);</div><div class='add'>+</div><div class='add'>+	if (count != 0)</div><div class='add'>+		fs_err(sdp, "%d left-over quota data objects\n", count);</div><div class='ctx'> </div><div class='ctx'> 	kvfree(sdp-&gt;sd_quota_bitmap);</div><div class='ctx'> 	sdp-&gt;sd_quota_bitmap = NULL;</div><div class='hunk'>@@ -1491,39 +1558,6 @@ static void quotad_error(struct gfs2_sbd *sdp, const char *msg, int error)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void quotad_check_timeo(struct gfs2_sbd *sdp, const char *msg,</div><div class='del'>-			       int (*fxn)(struct super_block *sb, int type),</div><div class='del'>-			       unsigned long t, unsigned long *timeo,</div><div class='del'>-			       unsigned int *new_timeo)</div><div class='del'>-{</div><div class='del'>-	if (t &gt;= *timeo) {</div><div class='del'>-		int error = fxn(sdp-&gt;sd_vfs, 0);</div><div class='del'>-		quotad_error(sdp, msg, error);</div><div class='del'>-		*timeo = gfs2_tune_get_i(&amp;sdp-&gt;sd_tune, new_timeo) * HZ;</div><div class='del'>-	} else {</div><div class='del'>-		*timeo -= t;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void quotad_check_trunc_list(struct gfs2_sbd *sdp)</div><div class='del'>-{</div><div class='del'>-	struct gfs2_inode *ip;</div><div class='del'>-</div><div class='del'>-	while(1) {</div><div class='del'>-		ip = NULL;</div><div class='del'>-		spin_lock(&amp;sdp-&gt;sd_trunc_lock);</div><div class='del'>-		if (!list_empty(&amp;sdp-&gt;sd_trunc_list)) {</div><div class='del'>-			ip = list_first_entry(&amp;sdp-&gt;sd_trunc_list,</div><div class='del'>-					struct gfs2_inode, i_trunc_list);</div><div class='del'>-			list_del_init(&amp;ip-&gt;i_trunc_list);</div><div class='del'>-		}</div><div class='del'>-		spin_unlock(&amp;sdp-&gt;sd_trunc_lock);</div><div class='del'>-		if (ip == NULL)</div><div class='del'>-			return;</div><div class='del'>-		gfs2_glock_finish_truncate(ip);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> void gfs2_wake_up_statfs(struct gfs2_sbd *sdp) {</div><div class='ctx'> 	if (!sdp-&gt;sd_statfs_force_sync) {</div><div class='ctx'> 		sdp-&gt;sd_statfs_force_sync = 1;</div><div class='hunk'>@@ -1541,49 +1575,51 @@ void gfs2_wake_up_statfs(struct gfs2_sbd *sdp) {</div><div class='ctx'> int gfs2_quotad(void *data)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_sbd *sdp = data;</div><div class='del'>-	struct gfs2_tune *tune = &amp;sdp-&gt;sd_tune;</div><div class='del'>-	unsigned long statfs_timeo = 0;</div><div class='del'>-	unsigned long quotad_timeo = 0;</div><div class='del'>-	unsigned long t = 0;</div><div class='del'>-	DEFINE_WAIT(wait);</div><div class='del'>-	int empty;</div><div class='add'>+	unsigned long now = jiffies;</div><div class='add'>+	unsigned long statfs_deadline = now;</div><div class='add'>+	unsigned long quotad_deadline = now;</div><div class='ctx'> </div><div class='add'>+	set_freezable();</div><div class='ctx'> 	while (!kthread_should_stop()) {</div><div class='add'>+		unsigned long t;</div><div class='ctx'> </div><div class='ctx'> 		if (gfs2_withdrawn(sdp))</div><div class='del'>-			goto bypass;</div><div class='del'>-		/* Update the master statfs file */</div><div class='del'>-		if (sdp-&gt;sd_statfs_force_sync) {</div><div class='del'>-			int error = gfs2_statfs_sync(sdp-&gt;sd_vfs, 0);</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		now = jiffies;</div><div class='add'>+		if (sdp-&gt;sd_statfs_force_sync ||</div><div class='add'>+		    time_after(now, statfs_deadline)) {</div><div class='add'>+			unsigned int quantum;</div><div class='add'>+			int error;</div><div class='add'>+</div><div class='add'>+			/* Update the master statfs file */</div><div class='add'>+			error = gfs2_statfs_sync(sdp-&gt;sd_vfs, 0);</div><div class='ctx'> 			quotad_error(sdp, "statfs", error);</div><div class='del'>-			statfs_timeo = gfs2_tune_get(sdp, gt_statfs_quantum) * HZ;</div><div class='del'>-		}</div><div class='del'>-		else</div><div class='del'>-			quotad_check_timeo(sdp, "statfs", gfs2_statfs_sync, t,</div><div class='del'>-				   	   &amp;statfs_timeo,</div><div class='del'>-					   &amp;tune-&gt;gt_statfs_quantum);</div><div class='ctx'> </div><div class='del'>-		/* Update quota file */</div><div class='del'>-		quotad_check_timeo(sdp, "sync", gfs2_quota_sync, t,</div><div class='del'>-				   &amp;quotad_timeo, &amp;tune-&gt;gt_quota_quantum);</div><div class='add'>+			quantum = gfs2_tune_get(sdp, gt_statfs_quantum);</div><div class='add'>+			statfs_deadline = now + quantum * HZ;</div><div class='add'>+		}</div><div class='add'>+		if (time_after(now, quotad_deadline)) {</div><div class='add'>+			unsigned int quantum;</div><div class='add'>+			int error;</div><div class='ctx'> </div><div class='del'>-		/* Check for &amp; recover partially truncated inodes */</div><div class='del'>-		quotad_check_trunc_list(sdp);</div><div class='add'>+			/* Update the quota file */</div><div class='add'>+			error = gfs2_quota_sync(sdp-&gt;sd_vfs, 0);</div><div class='add'>+			quotad_error(sdp, "sync", error);</div><div class='ctx'> </div><div class='del'>-		try_to_freeze();</div><div class='add'>+			quantum = gfs2_tune_get(sdp, gt_quota_quantum);</div><div class='add'>+			quotad_deadline = now + quantum * HZ;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-bypass:</div><div class='del'>-		t = min(quotad_timeo, statfs_timeo);</div><div class='add'>+		t = min(statfs_deadline - now, quotad_deadline - now);</div><div class='add'>+		wait_event_freezable_timeout(sdp-&gt;sd_quota_wait,</div><div class='add'>+				sdp-&gt;sd_statfs_force_sync ||</div><div class='add'>+				gfs2_withdrawn(sdp) ||</div><div class='add'>+				kthread_should_stop(),</div><div class='add'>+				t);</div><div class='ctx'> </div><div class='del'>-		prepare_to_wait(&amp;sdp-&gt;sd_quota_wait, &amp;wait, TASK_INTERRUPTIBLE);</div><div class='del'>-		spin_lock(&amp;sdp-&gt;sd_trunc_lock);</div><div class='del'>-		empty = list_empty(&amp;sdp-&gt;sd_trunc_list);</div><div class='del'>-		spin_unlock(&amp;sdp-&gt;sd_trunc_lock);</div><div class='del'>-		if (empty &amp;&amp; !sdp-&gt;sd_statfs_force_sync)</div><div class='del'>-			t -= schedule_timeout(t);</div><div class='del'>-		else</div><div class='add'>+		if (sdp-&gt;sd_statfs_force_sync)</div><div class='ctx'> 			t = 0;</div><div class='del'>-		finish_wait(&amp;sdp-&gt;sd_quota_wait, &amp;wait);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -1596,6 +1632,8 @@ static int gfs2_quota_get_state(struct super_block *sb, struct qc_state *state)</div><div class='ctx'> 	memset(state, 0, sizeof(*state));</div><div class='ctx'> </div><div class='ctx'> 	switch (sdp-&gt;sd_args.ar_quota) {</div><div class='add'>+	case GFS2_QUOTA_QUIET:</div><div class='add'>+		fallthrough;</div><div class='ctx'> 	case GFS2_QUOTA_ON:</div><div class='ctx'> 		state-&gt;s_state[USRQUOTA].flags |= QCI_LIMITS_ENFORCED;</div><div class='ctx'> 		state-&gt;s_state[GRPQUOTA].flags |= QCI_LIMITS_ENFORCED;</div><div class='hunk'>@@ -1724,7 +1762,7 @@ static int gfs2_set_dqblk(struct super_block *sb, struct kqid qid,</div><div class='ctx'> 	if (gfs2_is_stuffed(ip))</div><div class='ctx'> 		alloc_required = 1;</div><div class='ctx'> 	if (alloc_required) {</div><div class='del'>-		struct gfs2_alloc_parms ap = { .aflags = 0, };</div><div class='add'>+		struct gfs2_alloc_parms ap = {};</div><div class='ctx'> 		gfs2_write_calc_reserv(ip, sizeof(struct gfs2_quota),</div><div class='ctx'> 				       &amp;data_blocks, &amp;ind_blocks);</div><div class='ctx'> 		blocks = 1 + data_blocks + ind_blocks;</div><div class='hunk'>@@ -1742,7 +1780,7 @@ static int gfs2_set_dqblk(struct super_block *sb, struct kqid qid,</div><div class='ctx'> 		goto out_release;</div><div class='ctx'> </div><div class='ctx'> 	/* Apply changes */</div><div class='del'>-	error = gfs2_adjust_quota(ip, offset, 0, qd, fdq);</div><div class='add'>+	error = gfs2_adjust_quota(sdp, offset, 0, qd, fdq);</div><div class='ctx'> 	if (!error)</div><div class='ctx'> 		clear_bit(QDF_QMSG_QUIET, &amp;qd-&gt;qd_flags);</div><div class='ctx'> </div><div class='head'>diff --git a/fs/gfs2/quota.h b/fs/gfs2/quota.h<br/>index 21ada332d555..988f38dc5b2c 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/quota.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/quota.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/quota.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/quota.h</a></div><div class='hunk'>@@ -15,27 +15,27 @@ struct gfs2_sbd;</div><div class='ctx'> #define NO_UID_QUOTA_CHANGE INVALID_UID</div><div class='ctx'> #define NO_GID_QUOTA_CHANGE INVALID_GID</div><div class='ctx'> </div><div class='del'>-extern int gfs2_qa_get(struct gfs2_inode *ip);</div><div class='del'>-extern void gfs2_qa_put(struct gfs2_inode *ip);</div><div class='del'>-extern int gfs2_quota_hold(struct gfs2_inode *ip, kuid_t uid, kgid_t gid);</div><div class='del'>-extern void gfs2_quota_unhold(struct gfs2_inode *ip);</div><div class='add'>+int gfs2_qa_get(struct gfs2_inode *ip);</div><div class='add'>+void gfs2_qa_put(struct gfs2_inode *ip);</div><div class='add'>+int gfs2_quota_hold(struct gfs2_inode *ip, kuid_t uid, kgid_t gid);</div><div class='add'>+void gfs2_quota_unhold(struct gfs2_inode *ip);</div><div class='ctx'> </div><div class='del'>-extern int gfs2_quota_lock(struct gfs2_inode *ip, kuid_t uid, kgid_t gid);</div><div class='del'>-extern void gfs2_quota_unlock(struct gfs2_inode *ip);</div><div class='add'>+int gfs2_quota_lock(struct gfs2_inode *ip, kuid_t uid, kgid_t gid);</div><div class='add'>+void gfs2_quota_unlock(struct gfs2_inode *ip);</div><div class='ctx'> </div><div class='del'>-extern int gfs2_quota_check(struct gfs2_inode *ip, kuid_t uid, kgid_t gid,</div><div class='del'>-			    struct gfs2_alloc_parms *ap);</div><div class='del'>-extern void gfs2_quota_change(struct gfs2_inode *ip, s64 change,</div><div class='del'>-			      kuid_t uid, kgid_t gid);</div><div class='add'>+int gfs2_quota_check(struct gfs2_inode *ip, kuid_t uid, kgid_t gid,</div><div class='add'>+		     struct gfs2_alloc_parms *ap);</div><div class='add'>+void gfs2_quota_change(struct gfs2_inode *ip, s64 change,</div><div class='add'>+		       kuid_t uid, kgid_t gid);</div><div class='ctx'> </div><div class='del'>-extern int gfs2_quota_sync(struct super_block *sb, int type);</div><div class='del'>-extern int gfs2_quota_refresh(struct gfs2_sbd *sdp, struct kqid qid);</div><div class='add'>+int gfs2_quota_sync(struct super_block *sb, int type);</div><div class='add'>+int gfs2_quota_refresh(struct gfs2_sbd *sdp, struct kqid qid);</div><div class='ctx'> </div><div class='del'>-extern int gfs2_quota_init(struct gfs2_sbd *sdp);</div><div class='del'>-extern void gfs2_quota_cleanup(struct gfs2_sbd *sdp);</div><div class='del'>-extern int gfs2_quotad(void *data);</div><div class='add'>+int gfs2_quota_init(struct gfs2_sbd *sdp);</div><div class='add'>+void gfs2_quota_cleanup(struct gfs2_sbd *sdp);</div><div class='add'>+int gfs2_quotad(void *data);</div><div class='ctx'> </div><div class='del'>-extern void gfs2_wake_up_statfs(struct gfs2_sbd *sdp);</div><div class='add'>+void gfs2_wake_up_statfs(struct gfs2_sbd *sdp);</div><div class='ctx'> </div><div class='ctx'> static inline int gfs2_quota_lock_check(struct gfs2_inode *ip,</div><div class='ctx'> 					struct gfs2_alloc_parms *ap)</div><div class='hunk'>@@ -44,13 +44,13 @@ static inline int gfs2_quota_lock_check(struct gfs2_inode *ip,</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	ap-&gt;allowed = UINT_MAX; /* Assume we are permitted a whole lot */</div><div class='del'>-	if (capable(CAP_SYS_RESOURCE) ||</div><div class='del'>-	    sdp-&gt;sd_args.ar_quota == GFS2_QUOTA_OFF)</div><div class='add'>+	if (sdp-&gt;sd_args.ar_quota == GFS2_QUOTA_OFF ||</div><div class='add'>+	    capable(CAP_SYS_RESOURCE))</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	ret = gfs2_quota_lock(ip, NO_UID_QUOTA_CHANGE, NO_GID_QUOTA_CHANGE);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='del'>-	if (sdp-&gt;sd_args.ar_quota != GFS2_QUOTA_ON)</div><div class='add'>+	if (sdp-&gt;sd_args.ar_quota == GFS2_QUOTA_ACCOUNT)</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	ret = gfs2_quota_check(ip, ip-&gt;i_inode.i_uid, ip-&gt;i_inode.i_gid, ap);</div><div class='ctx'> 	if (ret)</div><div class='hunk'>@@ -59,8 +59,10 @@ static inline int gfs2_quota_lock_check(struct gfs2_inode *ip,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> extern const struct quotactl_ops gfs2_quotactl_ops;</div><div class='del'>-extern struct shrinker gfs2_qd_shrinker;</div><div class='add'>+int __init gfs2_qd_shrinker_init(void);</div><div class='add'>+void gfs2_qd_shrinker_exit(void);</div><div class='ctx'> extern struct list_lru gfs2_qd_lru;</div><div class='del'>-extern void __init gfs2_quota_hash_init(void);</div><div class='add'>+</div><div class='add'>+void __init gfs2_quota_hash_init(void);</div><div class='ctx'> </div><div class='ctx'> #endif /* __QUOTA_DOT_H__ */</div><div class='head'>diff --git a/fs/gfs2/recovery.c b/fs/gfs2/recovery.c<br/>index 016ed1b2ca1d..8c8202c68b64 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/recovery.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/recovery.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/recovery.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/recovery.c</a></div><div class='hunk'>@@ -27,7 +27,7 @@</div><div class='ctx'> #include "util.h"</div><div class='ctx'> #include "dir.h"</div><div class='ctx'> </div><div class='del'>-struct workqueue_struct *gfs_recovery_wq;</div><div class='add'>+struct workqueue_struct *gfs2_recovery_wq;</div><div class='ctx'> </div><div class='ctx'> int gfs2_replay_read_block(struct gfs2_jdesc *jd, unsigned int blk,</div><div class='ctx'> 			   struct buffer_head **bh)</div><div class='hunk'>@@ -55,17 +55,16 @@ int gfs2_replay_read_block(struct gfs2_jdesc *jd, unsigned int blk,</div><div class='ctx'> int gfs2_revoke_add(struct gfs2_jdesc *jd, u64 blkno, unsigned int where)</div><div class='ctx'> {</div><div class='ctx'> 	struct list_head *head = &amp;jd-&gt;jd_revoke_list;</div><div class='del'>-	struct gfs2_revoke_replay *rr;</div><div class='del'>-	int found = 0;</div><div class='add'>+	struct gfs2_revoke_replay *rr = NULL, *iter;</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry(rr, head, rr_list) {</div><div class='del'>-		if (rr-&gt;rr_blkno == blkno) {</div><div class='del'>-			found = 1;</div><div class='add'>+	list_for_each_entry(iter, head, rr_list) {</div><div class='add'>+		if (iter-&gt;rr_blkno == blkno) {</div><div class='add'>+			rr = iter;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (found) {</div><div class='add'>+	if (rr) {</div><div class='ctx'> 		rr-&gt;rr_where = where;</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -83,18 +82,17 @@ int gfs2_revoke_add(struct gfs2_jdesc *jd, u64 blkno, unsigned int where)</div><div class='ctx'> </div><div class='ctx'> int gfs2_revoke_check(struct gfs2_jdesc *jd, u64 blkno, unsigned int where)</div><div class='ctx'> {</div><div class='del'>-	struct gfs2_revoke_replay *rr;</div><div class='add'>+	struct gfs2_revoke_replay *rr = NULL, *iter;</div><div class='ctx'> 	int wrap, a, b, revoke;</div><div class='del'>-	int found = 0;</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry(rr, &amp;jd-&gt;jd_revoke_list, rr_list) {</div><div class='del'>-		if (rr-&gt;rr_blkno == blkno) {</div><div class='del'>-			found = 1;</div><div class='add'>+	list_for_each_entry(iter, &amp;jd-&gt;jd_revoke_list, rr_list) {</div><div class='add'>+		if (iter-&gt;rr_blkno == blkno) {</div><div class='add'>+			rr = iter;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!found)</div><div class='add'>+	if (!rr)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	wrap = (rr-&gt;rr_where &lt; jd-&gt;jd_replay_tail);</div><div class='hunk'>@@ -120,6 +118,7 @@ void gfs2_revoke_clean(struct gfs2_jdesc *jd)</div><div class='ctx'> int __get_log_header(struct gfs2_sbd *sdp, const struct gfs2_log_header *lh,</div><div class='ctx'> 		     unsigned int blkno, struct gfs2_log_header_host *head)</div><div class='ctx'> {</div><div class='add'>+	const u32 zero = 0;</div><div class='ctx'> 	u32 hash, crc;</div><div class='ctx'> </div><div class='ctx'> 	if (lh-&gt;lh_header.mh_magic != cpu_to_be32(GFS2_MAGIC) ||</div><div class='hunk'>@@ -128,7 +127,7 @@ int __get_log_header(struct gfs2_sbd *sdp, const struct gfs2_log_header *lh,</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='ctx'> 	hash = crc32(~0, lh, LH_V1_SIZE - 4);</div><div class='del'>-	hash = ~crc32_le_shift(hash, 4); /* assume lh_hash is zero */</div><div class='add'>+	hash = ~crc32(hash, &amp;zero, 4); /* assume lh_hash is zero */</div><div class='ctx'> </div><div class='ctx'> 	if (be32_to_cpu(lh-&gt;lh_hash) != hash)</div><div class='ctx'> 		return 1;</div><div class='hunk'>@@ -265,16 +264,12 @@ static void clean_journal(struct gfs2_jdesc *jd,</div><div class='ctx'> 			  struct gfs2_log_header_host *head)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_sbd *sdp = GFS2_SB(jd-&gt;jd_inode);</div><div class='del'>-	u32 lblock = head-&gt;lh_blkno;</div><div class='ctx'> </div><div class='del'>-	gfs2_replay_incr_blk(jd, &amp;lblock);</div><div class='del'>-	gfs2_write_log_header(sdp, jd, head-&gt;lh_sequence + 1, 0, lblock,</div><div class='add'>+	gfs2_replay_incr_blk(jd, &amp;head-&gt;lh_blkno);</div><div class='add'>+	head-&gt;lh_sequence++;</div><div class='add'>+	gfs2_write_log_header(sdp, jd, head-&gt;lh_sequence, 0, head-&gt;lh_blkno,</div><div class='ctx'> 			      GFS2_LOG_HEAD_UNMOUNT | GFS2_LOG_HEAD_RECOVERY,</div><div class='ctx'> 			      REQ_PREFLUSH | REQ_FUA | REQ_META | REQ_SYNC);</div><div class='del'>-	if (jd-&gt;jd_jid == sdp-&gt;sd_lockstruct.ls_jid) {</div><div class='del'>-		sdp-&gt;sd_log_flush_head = lblock;</div><div class='del'>-		gfs2_log_incr_head(sdp);</div><div class='del'>-	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> </div><div class='hunk'>@@ -406,7 +401,7 @@ void gfs2_recover_func(struct work_struct *work)</div><div class='ctx'> 	struct gfs2_inode *ip = GFS2_I(jd-&gt;jd_inode);</div><div class='ctx'> 	struct gfs2_sbd *sdp = GFS2_SB(jd-&gt;jd_inode);</div><div class='ctx'> 	struct gfs2_log_header_host head;</div><div class='del'>-	struct gfs2_holder j_gh, ji_gh, thaw_gh;</div><div class='add'>+	struct gfs2_holder j_gh, ji_gh;</div><div class='ctx'> 	ktime_t t_start, t_jlck, t_jhd, t_tlck, t_rep;</div><div class='ctx'> 	int ro = 0;</div><div class='ctx'> 	unsigned int pass;</div><div class='hunk'>@@ -422,14 +417,15 @@ void gfs2_recover_func(struct work_struct *work)</div><div class='ctx'> 	if (sdp-&gt;sd_args.ar_spectator)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	if (jd-&gt;jd_jid != sdp-&gt;sd_lockstruct.ls_jid) {</div><div class='del'>-		fs_info(sdp, "jid=%u: Trying to acquire journal lock...\n",</div><div class='add'>+		fs_info(sdp, "jid=%u: Trying to acquire journal glock...\n",</div><div class='ctx'> 			jd-&gt;jd_jid);</div><div class='ctx'> 		jlocked = 1;</div><div class='del'>-		/* Acquire the journal lock so we can do recovery */</div><div class='add'>+		/* Acquire the journal glock so we can do recovery */</div><div class='ctx'> </div><div class='ctx'> 		error = gfs2_glock_nq_num(sdp, jd-&gt;jd_jid, &amp;gfs2_journal_glops,</div><div class='ctx'> 					  LM_ST_EXCLUSIVE,</div><div class='del'>-					  LM_FLAG_NOEXP | LM_FLAG_TRY | GL_NOCACHE,</div><div class='add'>+					  LM_FLAG_RECOVER | LM_FLAG_TRY |</div><div class='add'>+					  GL_NOCACHE,</div><div class='ctx'> 					  &amp;j_gh);</div><div class='ctx'> 		switch (error) {</div><div class='ctx'> 		case 0:</div><div class='hunk'>@@ -445,7 +441,8 @@ void gfs2_recover_func(struct work_struct *work)</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		error = gfs2_glock_nq_init(ip-&gt;i_gl, LM_ST_SHARED,</div><div class='del'>-					   LM_FLAG_NOEXP | GL_NOCACHE, &amp;ji_gh);</div><div class='add'>+					   LM_FLAG_RECOVER | GL_NOCACHE,</div><div class='add'>+					   &amp;ji_gh);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			goto fail_gunlock_j;</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -459,7 +456,7 @@ void gfs2_recover_func(struct work_struct *work)</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto fail_gunlock_ji;</div><div class='ctx'> </div><div class='del'>-	error = gfs2_find_jhead(jd, &amp;head, true);</div><div class='add'>+	error = gfs2_find_jhead(jd, &amp;head);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto fail_gunlock_ji;</div><div class='ctx'> 	t_jhd = ktime_get();</div><div class='hunk'>@@ -467,14 +464,14 @@ void gfs2_recover_func(struct work_struct *work)</div><div class='ctx'> 		ktime_ms_delta(t_jhd, t_jlck));</div><div class='ctx'> </div><div class='ctx'> 	if (!(head.lh_flags &amp; GFS2_LOG_HEAD_UNMOUNT)) {</div><div class='del'>-		fs_info(sdp, "jid=%u: Acquiring the transaction lock...\n",</div><div class='del'>-			jd-&gt;jd_jid);</div><div class='del'>-</div><div class='del'>-		/* Acquire a shared hold on the freeze lock */</div><div class='add'>+		mutex_lock(&amp;sdp-&gt;sd_freeze_mutex);</div><div class='ctx'> </div><div class='del'>-		error = gfs2_freeze_lock(sdp, &amp;thaw_gh, LM_FLAG_PRIORITY);</div><div class='del'>-		if (error)</div><div class='add'>+		if (test_bit(SDF_FROZEN, &amp;sdp-&gt;sd_flags)) {</div><div class='add'>+			mutex_unlock(&amp;sdp-&gt;sd_freeze_mutex);</div><div class='add'>+			fs_warn(sdp, "jid=%u: Can't replay: filesystem "</div><div class='add'>+				"is frozen\n", jd-&gt;jd_jid);</div><div class='ctx'> 			goto fail_gunlock_ji;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		if (test_bit(SDF_RORECOVERY, &amp;sdp-&gt;sd_flags)) {</div><div class='ctx'> 			ro = 1;</div><div class='hunk'>@@ -498,7 +495,7 @@ void gfs2_recover_func(struct work_struct *work)</div><div class='ctx'> 			fs_warn(sdp, "jid=%u: Can't replay: read-only block "</div><div class='ctx'> 				"device\n", jd-&gt;jd_jid);</div><div class='ctx'> 			error = -EROFS;</div><div class='del'>-			goto fail_gunlock_thaw;</div><div class='add'>+			goto fail_gunlock_nofreeze;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		t_tlck = ktime_get();</div><div class='hunk'>@@ -516,7 +513,7 @@ void gfs2_recover_func(struct work_struct *work)</div><div class='ctx'> 			lops_after_scan(jd, error, pass);</div><div class='ctx'> 			if (error) {</div><div class='ctx'> 				up_read(&amp;sdp-&gt;sd_log_flush_lock);</div><div class='del'>-				goto fail_gunlock_thaw;</div><div class='add'>+				goto fail_gunlock_nofreeze;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -524,7 +521,7 @@ void gfs2_recover_func(struct work_struct *work)</div><div class='ctx'> 		clean_journal(jd, &amp;head);</div><div class='ctx'> 		up_read(&amp;sdp-&gt;sd_log_flush_lock);</div><div class='ctx'> </div><div class='del'>-		gfs2_freeze_unlock(&amp;thaw_gh);</div><div class='add'>+		mutex_unlock(&amp;sdp-&gt;sd_freeze_mutex);</div><div class='ctx'> 		t_rep = ktime_get();</div><div class='ctx'> 		fs_info(sdp, "jid=%u: Journal replayed in %lldms [jlck:%lldms, "</div><div class='ctx'> 			"jhead:%lldms, tlck:%lldms, replay:%lldms]\n",</div><div class='hunk'>@@ -535,6 +532,9 @@ void gfs2_recover_func(struct work_struct *work)</div><div class='ctx'> 			ktime_ms_delta(t_rep, t_tlck));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (jd-&gt;jd_jid == sdp-&gt;sd_lockstruct.ls_jid)</div><div class='add'>+		gfs2_log_pointers_init(sdp, &amp;head);</div><div class='add'>+</div><div class='ctx'> 	gfs2_recovery_done(sdp, jd-&gt;jd_jid, LM_RD_SUCCESS);</div><div class='ctx'> </div><div class='ctx'> 	if (jlocked) {</div><div class='hunk'>@@ -545,8 +545,8 @@ void gfs2_recover_func(struct work_struct *work)</div><div class='ctx'> 	fs_info(sdp, "jid=%u: Done\n", jd-&gt;jd_jid);</div><div class='ctx'> 	goto done;</div><div class='ctx'> </div><div class='del'>-fail_gunlock_thaw:</div><div class='del'>-	gfs2_freeze_unlock(&amp;thaw_gh);</div><div class='add'>+fail_gunlock_nofreeze:</div><div class='add'>+	mutex_unlock(&amp;sdp-&gt;sd_freeze_mutex);</div><div class='ctx'> fail_gunlock_ji:</div><div class='ctx'> 	if (jlocked) {</div><div class='ctx'> 		gfs2_glock_dq_uninit(&amp;ji_gh);</div><div class='hunk'>@@ -572,7 +572,7 @@ int gfs2_recover_journal(struct gfs2_jdesc *jd, bool wait)</div><div class='ctx'> 		return -EBUSY;</div><div class='ctx'> </div><div class='ctx'> 	/* we have JDF_RECOVERY, queue should always succeed */</div><div class='del'>-	rv = queue_work(gfs_recovery_wq, &amp;jd-&gt;jd_work);</div><div class='add'>+	rv = queue_work(gfs2_recovery_wq, &amp;jd-&gt;jd_work);</div><div class='ctx'> 	BUG_ON(!rv);</div><div class='ctx'> </div><div class='ctx'> 	if (wait)</div><div class='hunk'>@@ -582,3 +582,13 @@ int gfs2_recover_journal(struct gfs2_jdesc *jd, bool wait)</div><div class='ctx'> 	return wait ? jd-&gt;jd_recover_error : 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void gfs2_log_pointers_init(struct gfs2_sbd *sdp,</div><div class='add'>+			    struct gfs2_log_header_host *head)</div><div class='add'>+{</div><div class='add'>+	sdp-&gt;sd_log_sequence = head-&gt;lh_sequence + 1;</div><div class='add'>+	gfs2_replay_incr_blk(sdp-&gt;sd_jdesc, &amp;head-&gt;lh_blkno);</div><div class='add'>+	sdp-&gt;sd_log_tail = head-&gt;lh_blkno;</div><div class='add'>+	sdp-&gt;sd_log_flush_head = head-&gt;lh_blkno;</div><div class='add'>+	sdp-&gt;sd_log_flush_tail = head-&gt;lh_blkno;</div><div class='add'>+	sdp-&gt;sd_log_head = head-&gt;lh_blkno;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/gfs2/recovery.h b/fs/gfs2/recovery.h<br/>index 0d30f8e804f4..5a5ba72ecd75 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/recovery.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/recovery.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/recovery.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/recovery.h</a></div><div class='hunk'>@@ -9,7 +9,7 @@</div><div class='ctx'> </div><div class='ctx'> #include "incore.h"</div><div class='ctx'> </div><div class='del'>-extern struct workqueue_struct *gfs_recovery_wq;</div><div class='add'>+extern struct workqueue_struct *gfs2_recovery_wq;</div><div class='ctx'> </div><div class='ctx'> static inline void gfs2_replay_incr_blk(struct gfs2_jdesc *jd, u32 *blk)</div><div class='ctx'> {</div><div class='hunk'>@@ -17,17 +17,19 @@ static inline void gfs2_replay_incr_blk(struct gfs2_jdesc *jd, u32 *blk)</div><div class='ctx'> 	        *blk = 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-extern int gfs2_replay_read_block(struct gfs2_jdesc *jd, unsigned int blk,</div><div class='add'>+int gfs2_replay_read_block(struct gfs2_jdesc *jd, unsigned int blk,</div><div class='ctx'> 			   struct buffer_head **bh);</div><div class='ctx'> </div><div class='del'>-extern int gfs2_revoke_add(struct gfs2_jdesc *jd, u64 blkno, unsigned int where);</div><div class='del'>-extern int gfs2_revoke_check(struct gfs2_jdesc *jd, u64 blkno, unsigned int where);</div><div class='del'>-extern void gfs2_revoke_clean(struct gfs2_jdesc *jd);</div><div class='add'>+int gfs2_revoke_add(struct gfs2_jdesc *jd, u64 blkno, unsigned int where);</div><div class='add'>+int gfs2_revoke_check(struct gfs2_jdesc *jd, u64 blkno, unsigned int where);</div><div class='add'>+void gfs2_revoke_clean(struct gfs2_jdesc *jd);</div><div class='ctx'> </div><div class='del'>-extern int gfs2_recover_journal(struct gfs2_jdesc *gfs2_jd, bool wait);</div><div class='del'>-extern void gfs2_recover_func(struct work_struct *work);</div><div class='del'>-extern int __get_log_header(struct gfs2_sbd *sdp,</div><div class='del'>-			    const struct gfs2_log_header *lh, unsigned int blkno,</div><div class='add'>+int gfs2_recover_journal(struct gfs2_jdesc *gfs2_jd, bool wait);</div><div class='add'>+void gfs2_recover_func(struct work_struct *work);</div><div class='add'>+int __get_log_header(struct gfs2_sbd *sdp,</div><div class='add'>+		     const struct gfs2_log_header *lh, unsigned int blkno,</div><div class='add'>+		     struct gfs2_log_header_host *head);</div><div class='add'>+void gfs2_log_pointers_init(struct gfs2_sbd *sdp,</div><div class='ctx'> 			    struct gfs2_log_header_host *head);</div><div class='ctx'> </div><div class='ctx'> #endif /* __RECOVERY_DOT_H__ */</div><div class='head'>diff --git a/fs/gfs2/rgrp.c b/fs/gfs2/rgrp.c<br/>index 0fb3c01bc557..b14e54b38ee8 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/rgrp.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/rgrp.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/rgrp.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/rgrp.c</a></div><div class='hunk'>@@ -159,13 +159,13 @@ static inline u8 gfs2_testbit(const struct gfs2_rbm *rbm, bool use_clone)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * gfs2_bit_search</div><div class='add'>+ * gfs2_bit_search - search bitmap for a state</div><div class='ctx'>  * @ptr: Pointer to bitmap data</div><div class='ctx'>  * @mask: Mask to use (normally 0x55555.... but adjusted for search start)</div><div class='ctx'>  * @state: The state we are searching for</div><div class='ctx'>  *</div><div class='del'>- * We xor the bitmap data with a patter which is the bitwise opposite</div><div class='del'>- * of what we are looking for, this gives rise to a pattern of ones</div><div class='add'>+ * We xor the bitmap data with a pattern which is the bitwise opposite</div><div class='add'>+ * of what we are looking for. This gives rise to a pattern of ones</div><div class='ctx'>  * wherever there is a match. Since we have two bits per entry, we</div><div class='ctx'>  * take this pattern, shift it down by one place and then and it with</div><div class='ctx'>  * the original. All the even bit positions (0,2,4, etc) then represent</div><div class='hunk'>@@ -680,13 +680,14 @@ void gfs2_rs_deltree(struct gfs2_blkreserv *rs)</div><div class='ctx'> /**</div><div class='ctx'>  * gfs2_rs_delete - delete a multi-block reservation</div><div class='ctx'>  * @ip: The inode for this reservation</div><div class='del'>- * @wcount: The inode's write count, or NULL</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='del'>-void gfs2_rs_delete(struct gfs2_inode *ip, atomic_t *wcount)</div><div class='add'>+void gfs2_rs_delete(struct gfs2_inode *ip)</div><div class='ctx'> {</div><div class='add'>+	struct inode *inode = &amp;ip-&gt;i_inode;</div><div class='add'>+</div><div class='ctx'> 	down_write(&amp;ip-&gt;i_rw_mutex);</div><div class='del'>-	if ((wcount == NULL) || (atomic_read(wcount) &lt;= 1))</div><div class='add'>+	if (atomic_read(&amp;inode-&gt;i_writecount) &lt;= 1)</div><div class='ctx'> 		gfs2_rs_deltree(&amp;ip-&gt;i_res);</div><div class='ctx'> 	up_write(&amp;ip-&gt;i_rw_mutex);</div><div class='ctx'> }</div><div class='hunk'>@@ -813,11 +814,11 @@ static int compute_bitstructs(struct gfs2_rgrpd *rgd)</div><div class='ctx'> 	bi = rgd-&gt;rd_bits + (length - 1);</div><div class='ctx'> 	if ((bi-&gt;bi_start + bi-&gt;bi_bytes) * GFS2_NBBY != rgd-&gt;rd_data) {</div><div class='ctx'> 		gfs2_lm(sdp,</div><div class='del'>-			"ri_addr = %llu\n"</div><div class='del'>-			"ri_length = %u\n"</div><div class='del'>-			"ri_data0 = %llu\n"</div><div class='del'>-			"ri_data = %u\n"</div><div class='del'>-			"ri_bitbytes = %u\n"</div><div class='add'>+			"ri_addr=%llu "</div><div class='add'>+			"ri_length=%u "</div><div class='add'>+			"ri_data0=%llu "</div><div class='add'>+			"ri_data=%u "</div><div class='add'>+			"ri_bitbytes=%u "</div><div class='ctx'> 			"start=%u len=%u offset=%u\n",</div><div class='ctx'> 			(unsigned long long)rgd-&gt;rd_addr,</div><div class='ctx'> 			rgd-&gt;rd_length,</div><div class='hunk'>@@ -922,15 +923,15 @@ static int read_rindex_entry(struct gfs2_inode *ip)</div><div class='ctx'> 	spin_lock_init(&amp;rgd-&gt;rd_rsspin);</div><div class='ctx'> 	mutex_init(&amp;rgd-&gt;rd_mutex);</div><div class='ctx'> </div><div class='del'>-	error = compute_bitstructs(rgd);</div><div class='del'>-	if (error)</div><div class='del'>-		goto fail;</div><div class='del'>-</div><div class='ctx'> 	error = gfs2_glock_get(sdp, rgd-&gt;rd_addr,</div><div class='ctx'> 			       &amp;gfs2_rgrp_glops, CREATE, &amp;rgd-&gt;rd_gl);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> </div><div class='add'>+	error = compute_bitstructs(rgd);</div><div class='add'>+	if (error)</div><div class='add'>+		goto fail_glock;</div><div class='add'>+</div><div class='ctx'> 	rgd-&gt;rd_rgl = (struct gfs2_rgrp_lvb *)rgd-&gt;rd_gl-&gt;gl_lksb.sb_lvbptr;</div><div class='ctx'> 	rgd-&gt;rd_flags &amp;= ~GFS2_RDF_PREFERRED;</div><div class='ctx'> 	if (rgd-&gt;rd_data &gt; sdp-&gt;sd_max_rg_data)</div><div class='hunk'>@@ -944,6 +945,7 @@ static int read_rindex_entry(struct gfs2_inode *ip)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	error = 0; /* someone else read in the rgrp; free it and ignore it */</div><div class='add'>+fail_glock:</div><div class='ctx'> 	gfs2_glock_put(rgd-&gt;rd_gl);</div><div class='ctx'> </div><div class='ctx'> fail:</div><div class='hunk'>@@ -1186,7 +1188,7 @@ static void rgrp_set_bitmap_flags(struct gfs2_rgrpd *rgd)</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * gfs2_rgrp_go_instantiate - Read in a RG's header and bitmaps</div><div class='del'>- * @gh: the glock holder representing the rgrpd to read in</div><div class='add'>+ * @gl: the glock representing the rgrpd to read in</div><div class='ctx'>  *</div><div class='ctx'>  * Read in all of a Resource Group's header and bitmap blocks.</div><div class='ctx'>  * Caller must eventually call gfs2_rgrp_brelse() to free the bitmaps.</div><div class='hunk'>@@ -1194,9 +1196,8 @@ static void rgrp_set_bitmap_flags(struct gfs2_rgrpd *rgd)</div><div class='ctx'>  * Returns: errno</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-int gfs2_rgrp_go_instantiate(struct gfs2_holder *gh)</div><div class='add'>+int gfs2_rgrp_go_instantiate(struct gfs2_glock *gl)</div><div class='ctx'> {</div><div class='del'>-	struct gfs2_glock *gl = gh-&gt;gh_gl;</div><div class='ctx'> 	struct gfs2_rgrpd *rgd = gl-&gt;gl_object;</div><div class='ctx'> 	struct gfs2_sbd *sdp = rgd-&gt;rd_sbd;</div><div class='ctx'> 	unsigned int length = rgd-&gt;rd_length;</div><div class='hunk'>@@ -1313,7 +1314,7 @@ int gfs2_rgrp_send_discards(struct gfs2_sbd *sdp, u64 offset,</div><div class='ctx'> 	u64 blk;</div><div class='ctx'> 	sector_t start = 0;</div><div class='ctx'> 	sector_t nr_blks = 0;</div><div class='del'>-	int rv;</div><div class='add'>+	int rv = -EIO;</div><div class='ctx'> 	unsigned int x;</div><div class='ctx'> 	u32 trimmed = 0;</div><div class='ctx'> 	u8 diff;</div><div class='hunk'>@@ -1369,7 +1370,7 @@ fail:</div><div class='ctx'> 	if (sdp-&gt;sd_args.ar_discard)</div><div class='ctx'> 		fs_warn(sdp, "error %d on discard request, turning discards off for this filesystem\n", rv);</div><div class='ctx'> 	sdp-&gt;sd_args.ar_discard = 0;</div><div class='del'>-	return -EIO;</div><div class='add'>+	return rv;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -1384,7 +1385,7 @@ int gfs2_fitrim(struct file *filp, void __user *argp)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(filp);</div><div class='ctx'> 	struct gfs2_sbd *sdp = GFS2_SB(inode);</div><div class='del'>-	struct request_queue *q = bdev_get_queue(sdp-&gt;sd_vfs-&gt;s_bdev);</div><div class='add'>+	struct block_device *bdev = sdp-&gt;sd_vfs-&gt;s_bdev;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> 	struct gfs2_rgrpd *rgd;</div><div class='ctx'> 	struct gfs2_rgrpd *rgd_end;</div><div class='hunk'>@@ -1403,7 +1404,7 @@ int gfs2_fitrim(struct file *filp, void __user *argp)</div><div class='ctx'> 	if (!test_bit(SDF_JOURNAL_LIVE, &amp;sdp-&gt;sd_flags))</div><div class='ctx'> 		return -EROFS;</div><div class='ctx'> </div><div class='del'>-	if (!blk_queue_discard(q))</div><div class='add'>+	if (!bdev_max_discard_sectors(bdev))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='ctx'> 	if (copy_from_user(&amp;r, argp, sizeof(r)))</div><div class='hunk'>@@ -1415,8 +1416,8 @@ int gfs2_fitrim(struct file *filp, void __user *argp)</div><div class='ctx'> </div><div class='ctx'> 	start = r.start &gt;&gt; bs_shift;</div><div class='ctx'> 	end = start + (r.len &gt;&gt; bs_shift);</div><div class='del'>-	minlen = max_t(u64, r.minlen,</div><div class='del'>-		       q-&gt;limits.discard_granularity) &gt;&gt; bs_shift;</div><div class='add'>+	minlen = max_t(u64, r.minlen, sdp-&gt;sd_sb.sb_bsize);</div><div class='add'>+	minlen = max_t(u64, minlen, bdev_discard_granularity(bdev)) &gt;&gt; bs_shift;</div><div class='ctx'> </div><div class='ctx'> 	if (end &lt;= start || minlen &gt; sdp-&gt;sd_max_rg_data)</div><div class='ctx'> 		return -EINVAL;</div><div class='hunk'>@@ -1878,7 +1879,7 @@ static void try_rgrp_unlink(struct gfs2_rgrpd *rgd, u64 *last_unlinked, u64 skip</div><div class='ctx'> 		 */</div><div class='ctx'> 		ip = gl-&gt;gl_object;</div><div class='ctx'> </div><div class='del'>-		if (ip || !gfs2_queue_delete_work(gl, 0))</div><div class='add'>+		if (ip || !gfs2_queue_verify_delete(gl, false))</div><div class='ctx'> 			gfs2_glock_put(gl);</div><div class='ctx'> 		else</div><div class='ctx'> 			found++;</div><div class='hunk'>@@ -1966,7 +1967,7 @@ static bool gfs2_rgrp_congested(const struct gfs2_rgrpd *rgd, int loops)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * gfs2_rgrp_used_recently</div><div class='add'>+ * gfs2_rgrp_used_recently - test if an rgrp has been used recently</div><div class='ctx'>  * @rs: The block reservation with the rgrp to test</div><div class='ctx'>  * @msecs: The time limit in milliseconds</div><div class='ctx'>  *</div><div class='hunk'>@@ -1986,10 +1987,8 @@ static bool gfs2_rgrp_used_recently(const struct gfs2_blkreserv *rs,</div><div class='ctx'> static u32 gfs2_orlov_skip(const struct gfs2_inode *ip)</div><div class='ctx'> {</div><div class='ctx'> 	const struct gfs2_sbd *sdp = GFS2_SB(&amp;ip-&gt;i_inode);</div><div class='del'>-	u32 skip;</div><div class='ctx'> </div><div class='del'>-	get_random_bytes(&amp;skip, sizeof(skip));</div><div class='del'>-	return skip % sdp-&gt;sd_rgrps;</div><div class='add'>+	return get_random_u32() % sdp-&gt;sd_rgrps;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool gfs2_select_rgrp(struct gfs2_rgrpd **pos, const struct gfs2_rgrpd *begin)</div><div class='hunk'>@@ -2305,7 +2304,7 @@ void gfs2_rgrp_dump(struct seq_file *seq, struct gfs2_rgrpd *rgd,</div><div class='ctx'> 		       (unsigned long long)rgd-&gt;rd_addr, rgd-&gt;rd_flags,</div><div class='ctx'> 		       rgd-&gt;rd_free, rgd-&gt;rd_free_clone, rgd-&gt;rd_dinodes,</div><div class='ctx'> 		       rgd-&gt;rd_requested, rgd-&gt;rd_reserved, rgd-&gt;rd_extfail_pt);</div><div class='del'>-	if (rgd-&gt;rd_sbd-&gt;sd_args.ar_rgrplvb) {</div><div class='add'>+	if (rgd-&gt;rd_sbd-&gt;sd_args.ar_rgrplvb &amp;&amp; rgd-&gt;rd_rgl) {</div><div class='ctx'> 		struct gfs2_rgrp_lvb *rgl = rgd-&gt;rd_rgl;</div><div class='ctx'> </div><div class='ctx'> 		gfs2_print_dbg(seq, "%s  L: f:%02x b:%u i:%u\n", fs_id_buf,</div><div class='hunk'>@@ -2410,13 +2409,12 @@ static void gfs2_set_alloc_start(struct gfs2_rbm *rbm,</div><div class='ctx'>  * @bn: Used to return the starting block number</div><div class='ctx'>  * @nblocks: requested number of blocks/extent length (value/result)</div><div class='ctx'>  * @dinode: 1 if we're allocating a dinode block, else 0</div><div class='del'>- * @generation: the generation number of the inode</div><div class='ctx'>  *</div><div class='ctx'>  * Returns: 0 or error</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> int gfs2_alloc_blocks(struct gfs2_inode *ip, u64 *bn, unsigned int *nblocks,</div><div class='del'>-		      bool dinode, u64 *generation)</div><div class='add'>+		      bool dinode)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_sbd *sdp = GFS2_SB(&amp;ip-&gt;i_inode);</div><div class='ctx'> 	struct buffer_head *dibh;</div><div class='hunk'>@@ -2476,10 +2474,13 @@ int gfs2_alloc_blocks(struct gfs2_inode *ip, u64 *bn, unsigned int *nblocks,</div><div class='ctx'> 	rbm.rgd-&gt;rd_free -= *nblocks;</div><div class='ctx'> 	spin_unlock(&amp;rbm.rgd-&gt;rd_rsspin);</div><div class='ctx'> 	if (dinode) {</div><div class='add'>+		u64 generation;</div><div class='add'>+</div><div class='ctx'> 		rbm.rgd-&gt;rd_dinodes++;</div><div class='del'>-		*generation = rbm.rgd-&gt;rd_igeneration++;</div><div class='del'>-		if (*generation == 0)</div><div class='del'>-			*generation = rbm.rgd-&gt;rd_igeneration++;</div><div class='add'>+		generation = rbm.rgd-&gt;rd_igeneration++;</div><div class='add'>+		if (generation == 0)</div><div class='add'>+			generation = rbm.rgd-&gt;rd_igeneration++;</div><div class='add'>+		ip-&gt;i_generation = generation;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	gfs2_trans_add_meta(rbm.rgd-&gt;rd_gl, rbm.rgd-&gt;rd_bits[0].bi_bh);</div><div class='hunk'>@@ -2583,8 +2584,8 @@ void gfs2_free_di(struct gfs2_rgrpd *rgd, struct gfs2_inode *ip)</div><div class='ctx'> </div><div class='ctx'> 	gfs2_trans_add_meta(rgd-&gt;rd_gl, rgd-&gt;rd_bits[0].bi_bh);</div><div class='ctx'> 	gfs2_rgrp_out(rgd, rgd-&gt;rd_bits[0].bi_bh-&gt;b_data);</div><div class='del'>-	rgrp_unlock_local(rgd);</div><div class='ctx'> 	be32_add_cpu(&amp;rgd-&gt;rd_rgl-&gt;rl_unlinked, -1);</div><div class='add'>+	rgrp_unlock_local(rgd);</div><div class='ctx'> </div><div class='ctx'> 	gfs2_statfs_change(sdp, 0, +1, -1);</div><div class='ctx'> 	trace_gfs2_block_alloc(ip, rgd, ip-&gt;i_no_addr, 1, GFS2_BLKST_FREE);</div><div class='hunk'>@@ -2718,12 +2719,15 @@ void gfs2_rlist_add(struct gfs2_inode *ip, struct gfs2_rgrp_list *rlist,</div><div class='ctx'>  * gfs2_rlist_alloc - all RGs have been added to the rlist, now allocate</div><div class='ctx'>  *      and initialize an array of glock holders for them</div><div class='ctx'>  * @rlist: the list of resource groups</div><div class='add'>+ * @state: the state we're requesting</div><div class='add'>+ * @flags: the modifier flags</div><div class='ctx'>  *</div><div class='ctx'>  * FIXME: Don't use NOFAIL</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-void gfs2_rlist_alloc(struct gfs2_rgrp_list *rlist)</div><div class='add'>+void gfs2_rlist_alloc(struct gfs2_rgrp_list *rlist,</div><div class='add'>+		      unsigned int state, u16 flags)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int x;</div><div class='ctx'> </div><div class='hunk'>@@ -2731,8 +2735,8 @@ void gfs2_rlist_alloc(struct gfs2_rgrp_list *rlist)</div><div class='ctx'> 				      sizeof(struct gfs2_holder),</div><div class='ctx'> 				      GFP_NOFS | __GFP_NOFAIL);</div><div class='ctx'> 	for (x = 0; x &lt; rlist-&gt;rl_rgrps; x++)</div><div class='del'>-		gfs2_holder_init(rlist-&gt;rl_rgd[x]-&gt;rd_gl, LM_ST_EXCLUSIVE,</div><div class='del'>-				 LM_FLAG_NODE_SCOPE, &amp;rlist-&gt;rl_ghs[x]);</div><div class='add'>+		gfs2_holder_init(rlist-&gt;rl_rgd[x]-&gt;rd_gl, state, flags,</div><div class='add'>+				 &amp;rlist-&gt;rl_ghs[x]);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='head'>diff --git a/fs/gfs2/rgrp.h b/fs/gfs2/rgrp.h<br/>index 3e2ca1fb4305..8d20e99385db 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/rgrp.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/rgrp.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/rgrp.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/rgrp.h</a></div><div class='hunk'>@@ -22,38 +22,38 @@ struct gfs2_rgrpd;</div><div class='ctx'> struct gfs2_sbd;</div><div class='ctx'> struct gfs2_holder;</div><div class='ctx'> </div><div class='del'>-extern void gfs2_rgrp_verify(struct gfs2_rgrpd *rgd);</div><div class='add'>+void gfs2_rgrp_verify(struct gfs2_rgrpd *rgd);</div><div class='ctx'> </div><div class='del'>-extern struct gfs2_rgrpd *gfs2_blk2rgrpd(struct gfs2_sbd *sdp, u64 blk, bool exact);</div><div class='del'>-extern struct gfs2_rgrpd *gfs2_rgrpd_get_first(struct gfs2_sbd *sdp);</div><div class='del'>-extern struct gfs2_rgrpd *gfs2_rgrpd_get_next(struct gfs2_rgrpd *rgd);</div><div class='add'>+struct gfs2_rgrpd *gfs2_blk2rgrpd(struct gfs2_sbd *sdp, u64 blk, bool exact);</div><div class='add'>+struct gfs2_rgrpd *gfs2_rgrpd_get_first(struct gfs2_sbd *sdp);</div><div class='add'>+struct gfs2_rgrpd *gfs2_rgrpd_get_next(struct gfs2_rgrpd *rgd);</div><div class='ctx'> </div><div class='del'>-extern void gfs2_clear_rgrpd(struct gfs2_sbd *sdp);</div><div class='del'>-extern int gfs2_rindex_update(struct gfs2_sbd *sdp);</div><div class='del'>-extern void gfs2_free_clones(struct gfs2_rgrpd *rgd);</div><div class='del'>-extern int gfs2_rgrp_go_instantiate(struct gfs2_holder *gh);</div><div class='del'>-extern void gfs2_rgrp_brelse(struct gfs2_rgrpd *rgd);</div><div class='add'>+void gfs2_clear_rgrpd(struct gfs2_sbd *sdp);</div><div class='add'>+int gfs2_rindex_update(struct gfs2_sbd *sdp);</div><div class='add'>+void gfs2_free_clones(struct gfs2_rgrpd *rgd);</div><div class='add'>+int gfs2_rgrp_go_instantiate(struct gfs2_glock *gl);</div><div class='add'>+void gfs2_rgrp_brelse(struct gfs2_rgrpd *rgd);</div><div class='ctx'> </div><div class='del'>-extern struct gfs2_alloc *gfs2_alloc_get(struct gfs2_inode *ip);</div><div class='add'>+struct gfs2_alloc *gfs2_alloc_get(struct gfs2_inode *ip);</div><div class='ctx'> </div><div class='ctx'> #define GFS2_AF_ORLOV 1</div><div class='del'>-extern int gfs2_inplace_reserve(struct gfs2_inode *ip,</div><div class='del'>-				struct gfs2_alloc_parms *ap);</div><div class='del'>-extern void gfs2_inplace_release(struct gfs2_inode *ip);</div><div class='del'>-</div><div class='del'>-extern int gfs2_alloc_blocks(struct gfs2_inode *ip, u64 *bn, unsigned int *n,</div><div class='del'>-			     bool dinode, u64 *generation);</div><div class='del'>-</div><div class='del'>-extern void gfs2_rs_deltree(struct gfs2_blkreserv *rs);</div><div class='del'>-extern void gfs2_rs_delete(struct gfs2_inode *ip, atomic_t *wcount);</div><div class='del'>-extern void __gfs2_free_blocks(struct gfs2_inode *ip, struct gfs2_rgrpd *rgd,</div><div class='del'>-			       u64 bstart, u32 blen, int meta);</div><div class='del'>-extern void gfs2_free_meta(struct gfs2_inode *ip, struct gfs2_rgrpd *rgd,</div><div class='del'>-			   u64 bstart, u32 blen);</div><div class='del'>-extern void gfs2_free_di(struct gfs2_rgrpd *rgd, struct gfs2_inode *ip);</div><div class='del'>-extern void gfs2_unlink_di(struct inode *inode);</div><div class='del'>-extern int gfs2_check_blk_type(struct gfs2_sbd *sdp, u64 no_addr,</div><div class='del'>-			       unsigned int type);</div><div class='add'>+int gfs2_inplace_reserve(struct gfs2_inode *ip,</div><div class='add'>+			 struct gfs2_alloc_parms *ap);</div><div class='add'>+void gfs2_inplace_release(struct gfs2_inode *ip);</div><div class='add'>+</div><div class='add'>+int gfs2_alloc_blocks(struct gfs2_inode *ip, u64 *bn, unsigned int *n,</div><div class='add'>+		      bool dinode);</div><div class='add'>+</div><div class='add'>+void gfs2_rs_deltree(struct gfs2_blkreserv *rs);</div><div class='add'>+void gfs2_rs_delete(struct gfs2_inode *ip);</div><div class='add'>+void __gfs2_free_blocks(struct gfs2_inode *ip, struct gfs2_rgrpd *rgd,</div><div class='add'>+		        u64 bstart, u32 blen, int meta);</div><div class='add'>+void gfs2_free_meta(struct gfs2_inode *ip, struct gfs2_rgrpd *rgd,</div><div class='add'>+		    u64 bstart, u32 blen);</div><div class='add'>+void gfs2_free_di(struct gfs2_rgrpd *rgd, struct gfs2_inode *ip);</div><div class='add'>+void gfs2_unlink_di(struct inode *inode);</div><div class='add'>+int gfs2_check_blk_type(struct gfs2_sbd *sdp, u64 no_addr,</div><div class='add'>+		        unsigned int type);</div><div class='ctx'> </div><div class='ctx'> struct gfs2_rgrp_list {</div><div class='ctx'> 	unsigned int rl_rgrps;</div><div class='hunk'>@@ -62,17 +62,19 @@ struct gfs2_rgrp_list {</div><div class='ctx'> 	struct gfs2_holder *rl_ghs;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-extern void gfs2_rlist_add(struct gfs2_inode *ip, struct gfs2_rgrp_list *rlist,</div><div class='del'>-			   u64 block);</div><div class='del'>-extern void gfs2_rlist_alloc(struct gfs2_rgrp_list *rlist);</div><div class='del'>-extern void gfs2_rlist_free(struct gfs2_rgrp_list *rlist);</div><div class='del'>-extern u64 gfs2_ri_total(struct gfs2_sbd *sdp);</div><div class='del'>-extern void gfs2_rgrp_dump(struct seq_file *seq, struct gfs2_rgrpd *rgd,</div><div class='del'>-			   const char *fs_id_buf);</div><div class='del'>-extern int gfs2_rgrp_send_discards(struct gfs2_sbd *sdp, u64 offset,</div><div class='del'>-				   struct buffer_head *bh,</div><div class='del'>-				   const struct gfs2_bitmap *bi, unsigned minlen, u64 *ptrimmed);</div><div class='del'>-extern int gfs2_fitrim(struct file *filp, void __user *argp);</div><div class='add'>+void gfs2_rlist_add(struct gfs2_inode *ip, struct gfs2_rgrp_list *rlist,</div><div class='add'>+		    u64 block);</div><div class='add'>+void gfs2_rlist_alloc(struct gfs2_rgrp_list *rlist,</div><div class='add'>+		      unsigned int state, u16 flags);</div><div class='add'>+void gfs2_rlist_free(struct gfs2_rgrp_list *rlist);</div><div class='add'>+u64 gfs2_ri_total(struct gfs2_sbd *sdp);</div><div class='add'>+void gfs2_rgrp_dump(struct seq_file *seq, struct gfs2_rgrpd *rgd,</div><div class='add'>+		    const char *fs_id_buf);</div><div class='add'>+int gfs2_rgrp_send_discards(struct gfs2_sbd *sdp, u64 offset,</div><div class='add'>+			    struct buffer_head *bh,</div><div class='add'>+			    const struct gfs2_bitmap *bi, unsigned minlen,</div><div class='add'>+			    u64 *ptrimmed);</div><div class='add'>+int gfs2_fitrim(struct file *filp, void __user *argp);</div><div class='ctx'> </div><div class='ctx'> /* This is how to tell if a reservation is in the rgrp tree: */</div><div class='ctx'> static inline bool gfs2_rs_active(const struct gfs2_blkreserv *rs)</div><div class='hunk'>@@ -87,9 +89,9 @@ static inline int rgrp_contains_block(struct gfs2_rgrpd *rgd, u64 block)</div><div class='ctx'> 	return first &lt;= block &amp;&amp; block &lt; last;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-extern void check_and_update_goal(struct gfs2_inode *ip);</div><div class='add'>+void check_and_update_goal(struct gfs2_inode *ip);</div><div class='ctx'> </div><div class='del'>-extern void rgrp_lock_local(struct gfs2_rgrpd *rgd);</div><div class='del'>-extern void rgrp_unlock_local(struct gfs2_rgrpd *rgd);</div><div class='add'>+void rgrp_lock_local(struct gfs2_rgrpd *rgd);</div><div class='add'>+void rgrp_unlock_local(struct gfs2_rgrpd *rgd);</div><div class='ctx'> </div><div class='ctx'> #endif /* __RGRP_DOT_H__ */</div><div class='head'>diff --git a/fs/gfs2/super.c b/fs/gfs2/super.c<br/>index 5b121371508a..f6cd907b3ec6 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/super.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/super.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/super.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/super.c</a></div><div class='hunk'>@@ -44,10 +44,10 @@</div><div class='ctx'> #include "xattr.h"</div><div class='ctx'> #include "lops.h"</div><div class='ctx'> </div><div class='del'>-enum dinode_demise {</div><div class='del'>-	SHOULD_DELETE_DINODE,</div><div class='del'>-	SHOULD_NOT_DELETE_DINODE,</div><div class='del'>-	SHOULD_DEFER_EVICTION,</div><div class='add'>+enum evict_behavior {</div><div class='add'>+	EVICT_SHOULD_DELETE,</div><div class='add'>+	EVICT_SHOULD_SKIP_DELETE,</div><div class='add'>+	EVICT_SHOULD_DEFER_DELETE,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -67,9 +67,13 @@ void gfs2_jindex_free(struct gfs2_sbd *sdp)</div><div class='ctx'> 	sdp-&gt;sd_journals = 0;</div><div class='ctx'> 	spin_unlock(&amp;sdp-&gt;sd_jindex_spin);</div><div class='ctx'> </div><div class='add'>+	down_write(&amp;sdp-&gt;sd_log_flush_lock);</div><div class='ctx'> 	sdp-&gt;sd_jdesc = NULL;</div><div class='add'>+	up_write(&amp;sdp-&gt;sd_log_flush_lock);</div><div class='add'>+</div><div class='ctx'> 	while (!list_empty(&amp;list)) {</div><div class='ctx'> 		jd = list_first_entry(&amp;list, struct gfs2_jdesc, jd_list);</div><div class='add'>+		BUG_ON(jd-&gt;jd_log_bio);</div><div class='ctx'> 		gfs2_free_journal_extents(jd);</div><div class='ctx'> 		list_del(&amp;jd-&gt;jd_list);</div><div class='ctx'> 		iput(jd-&gt;jd_inode);</div><div class='hunk'>@@ -130,28 +134,22 @@ int gfs2_make_fs_rw(struct gfs2_sbd *sdp)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_inode *ip = GFS2_I(sdp-&gt;sd_jdesc-&gt;jd_inode);</div><div class='ctx'> 	struct gfs2_glock *j_gl = ip-&gt;i_gl;</div><div class='del'>-	struct gfs2_log_header_host head;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='ctx'> 	j_gl-&gt;gl_ops-&gt;go_inval(j_gl, DIO_METADATA);</div><div class='ctx'> 	if (gfs2_withdrawn(sdp))</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> </div><div class='del'>-	error = gfs2_find_jhead(sdp-&gt;sd_jdesc, &amp;head, false);</div><div class='del'>-	if (error || gfs2_withdrawn(sdp))</div><div class='del'>-		return error;</div><div class='del'>-</div><div class='del'>-	if (!(head.lh_flags &amp; GFS2_LOG_HEAD_UNMOUNT)) {</div><div class='del'>-		gfs2_consist(sdp);</div><div class='add'>+	if (sdp-&gt;sd_log_sequence == 0) {</div><div class='add'>+		fs_err(sdp, "unknown status of our own journal jid %d",</div><div class='add'>+		       sdp-&gt;sd_lockstruct.ls_jid);</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/*  Initialize some head of the log stuff  */</div><div class='del'>-	sdp-&gt;sd_log_sequence = head.lh_sequence + 1;</div><div class='del'>-	gfs2_log_pointers_init(sdp, head.lh_blkno);</div><div class='del'>-</div><div class='ctx'> 	error = gfs2_quota_init(sdp);</div><div class='del'>-	if (!error &amp;&amp; !gfs2_withdrawn(sdp))</div><div class='add'>+	if (!error &amp;&amp; gfs2_withdrawn(sdp))</div><div class='add'>+		error = -EIO;</div><div class='add'>+	if (!error)</div><div class='ctx'> 		set_bit(SDF_JOURNAL_LIVE, &amp;sdp-&gt;sd_flags);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='hunk'>@@ -328,7 +326,12 @@ static int gfs2_lock_fs_check_clean(struct gfs2_sbd *sdp)</div><div class='ctx'> 	struct lfcc *lfcc;</div><div class='ctx'> 	LIST_HEAD(list);</div><div class='ctx'> 	struct gfs2_log_header_host lh;</div><div class='del'>-	int error;</div><div class='add'>+	int error, error2;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Grab all the journal glocks in SH mode.  We are *probably* doing</div><div class='add'>+	 * that to prevent recovery.</div><div class='add'>+	 */</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(jd, &amp;sdp-&gt;sd_jindex_list, jd_list) {</div><div class='ctx'> 		lfcc = kmalloc(sizeof(struct lfcc), GFP_KERNEL);</div><div class='hunk'>@@ -345,16 +348,19 @@ static int gfs2_lock_fs_check_clean(struct gfs2_sbd *sdp)</div><div class='ctx'> 		list_add(&amp;lfcc-&gt;list, &amp;list);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	gfs2_freeze_unlock(sdp);</div><div class='add'>+</div><div class='ctx'> 	error = gfs2_glock_nq_init(sdp-&gt;sd_freeze_gl, LM_ST_EXCLUSIVE,</div><div class='del'>-				   LM_FLAG_NOEXP, &amp;sdp-&gt;sd_freeze_gh);</div><div class='add'>+				   LM_FLAG_RECOVER | GL_NOPID,</div><div class='add'>+				   &amp;sdp-&gt;sd_freeze_gh);</div><div class='ctx'> 	if (error)</div><div class='del'>-		goto out;</div><div class='add'>+		goto relock_shared;</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(jd, &amp;sdp-&gt;sd_jindex_list, jd_list) {</div><div class='ctx'> 		error = gfs2_jdesc_check(jd);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			break;</div><div class='del'>-		error = gfs2_find_jhead(jd, &amp;lh, false);</div><div class='add'>+		error = gfs2_find_jhead(jd, &amp;lh);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			break;</div><div class='ctx'> 		if (!(lh.lh_flags &amp; GFS2_LOG_HEAD_UNMOUNT)) {</div><div class='hunk'>@@ -363,8 +369,14 @@ static int gfs2_lock_fs_check_clean(struct gfs2_sbd *sdp)</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (error)</div><div class='del'>-		gfs2_freeze_unlock(&amp;sdp-&gt;sd_freeze_gh);</div><div class='add'>+	if (!error)</div><div class='add'>+		goto out;  /* success */</div><div class='add'>+</div><div class='add'>+	gfs2_freeze_unlock(sdp);</div><div class='add'>+</div><div class='add'>+relock_shared:</div><div class='add'>+	error2 = gfs2_freeze_lock_shared(sdp);</div><div class='add'>+	gfs2_assert_withdraw(sdp, !error2);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	while (!list_empty(&amp;list)) {</div><div class='hunk'>@@ -378,6 +390,7 @@ out:</div><div class='ctx'> </div><div class='ctx'> void gfs2_dinode_out(const struct gfs2_inode *ip, void *buf)</div><div class='ctx'> {</div><div class='add'>+	const struct inode *inode = &amp;ip-&gt;i_inode;</div><div class='ctx'> 	struct gfs2_dinode *str = buf;</div><div class='ctx'> </div><div class='ctx'> 	str-&gt;di_header.mh_magic = cpu_to_be32(GFS2_MAGIC);</div><div class='hunk'>@@ -385,15 +398,15 @@ void gfs2_dinode_out(const struct gfs2_inode *ip, void *buf)</div><div class='ctx'> 	str-&gt;di_header.mh_format = cpu_to_be32(GFS2_FORMAT_DI);</div><div class='ctx'> 	str-&gt;di_num.no_addr = cpu_to_be64(ip-&gt;i_no_addr);</div><div class='ctx'> 	str-&gt;di_num.no_formal_ino = cpu_to_be64(ip-&gt;i_no_formal_ino);</div><div class='del'>-	str-&gt;di_mode = cpu_to_be32(ip-&gt;i_inode.i_mode);</div><div class='del'>-	str-&gt;di_uid = cpu_to_be32(i_uid_read(&amp;ip-&gt;i_inode));</div><div class='del'>-	str-&gt;di_gid = cpu_to_be32(i_gid_read(&amp;ip-&gt;i_inode));</div><div class='del'>-	str-&gt;di_nlink = cpu_to_be32(ip-&gt;i_inode.i_nlink);</div><div class='del'>-	str-&gt;di_size = cpu_to_be64(i_size_read(&amp;ip-&gt;i_inode));</div><div class='del'>-	str-&gt;di_blocks = cpu_to_be64(gfs2_get_inode_blocks(&amp;ip-&gt;i_inode));</div><div class='del'>-	str-&gt;di_atime = cpu_to_be64(ip-&gt;i_inode.i_atime.tv_sec);</div><div class='del'>-	str-&gt;di_mtime = cpu_to_be64(ip-&gt;i_inode.i_mtime.tv_sec);</div><div class='del'>-	str-&gt;di_ctime = cpu_to_be64(ip-&gt;i_inode.i_ctime.tv_sec);</div><div class='add'>+	str-&gt;di_mode = cpu_to_be32(inode-&gt;i_mode);</div><div class='add'>+	str-&gt;di_uid = cpu_to_be32(i_uid_read(inode));</div><div class='add'>+	str-&gt;di_gid = cpu_to_be32(i_gid_read(inode));</div><div class='add'>+	str-&gt;di_nlink = cpu_to_be32(inode-&gt;i_nlink);</div><div class='add'>+	str-&gt;di_size = cpu_to_be64(i_size_read(inode));</div><div class='add'>+	str-&gt;di_blocks = cpu_to_be64(gfs2_get_inode_blocks(inode));</div><div class='add'>+	str-&gt;di_atime = cpu_to_be64(inode_get_atime_sec(inode));</div><div class='add'>+	str-&gt;di_mtime = cpu_to_be64(inode_get_mtime_sec(inode));</div><div class='add'>+	str-&gt;di_ctime = cpu_to_be64(inode_get_ctime_sec(inode));</div><div class='ctx'> </div><div class='ctx'> 	str-&gt;di_goal_meta = cpu_to_be64(ip-&gt;i_goal);</div><div class='ctx'> 	str-&gt;di_goal_data = cpu_to_be64(ip-&gt;i_goal);</div><div class='hunk'>@@ -401,16 +414,16 @@ void gfs2_dinode_out(const struct gfs2_inode *ip, void *buf)</div><div class='ctx'> </div><div class='ctx'> 	str-&gt;di_flags = cpu_to_be32(ip-&gt;i_diskflags);</div><div class='ctx'> 	str-&gt;di_height = cpu_to_be16(ip-&gt;i_height);</div><div class='del'>-	str-&gt;di_payload_format = cpu_to_be32(S_ISDIR(ip-&gt;i_inode.i_mode) &amp;&amp;</div><div class='add'>+	str-&gt;di_payload_format = cpu_to_be32(S_ISDIR(inode-&gt;i_mode) &amp;&amp;</div><div class='ctx'> 					     !(ip-&gt;i_diskflags &amp; GFS2_DIF_EXHASH) ?</div><div class='ctx'> 					     GFS2_FORMAT_DE : 0);</div><div class='ctx'> 	str-&gt;di_depth = cpu_to_be16(ip-&gt;i_depth);</div><div class='ctx'> 	str-&gt;di_entries = cpu_to_be32(ip-&gt;i_entries);</div><div class='ctx'> </div><div class='ctx'> 	str-&gt;di_eattr = cpu_to_be64(ip-&gt;i_eattr);</div><div class='del'>-	str-&gt;di_atime_nsec = cpu_to_be32(ip-&gt;i_inode.i_atime.tv_nsec);</div><div class='del'>-	str-&gt;di_mtime_nsec = cpu_to_be32(ip-&gt;i_inode.i_mtime.tv_nsec);</div><div class='del'>-	str-&gt;di_ctime_nsec = cpu_to_be32(ip-&gt;i_inode.i_ctime.tv_nsec);</div><div class='add'>+	str-&gt;di_atime_nsec = cpu_to_be32(inode_get_atime_nsec(inode));</div><div class='add'>+	str-&gt;di_mtime_nsec = cpu_to_be32(inode_get_mtime_nsec(inode));</div><div class='add'>+	str-&gt;di_ctime_nsec = cpu_to_be32(inode_get_ctime_nsec(inode));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -457,7 +470,7 @@ static int gfs2_write_inode(struct inode *inode, struct writeback_control *wbc)</div><div class='ctx'>  * @flags: The type of dirty</div><div class='ctx'>  *</div><div class='ctx'>  * Unfortunately it can be called under any combination of inode</div><div class='del'>- * glock and transaction lock, so we have to check carefully.</div><div class='add'>+ * glock and freeze glock, so we have to check carefully.</div><div class='ctx'>  *</div><div class='ctx'>  * At the moment this deals only with atime - it should be possible</div><div class='ctx'>  * to expand that role in future, once a review of the locking has</div><div class='hunk'>@@ -474,7 +487,11 @@ static void gfs2_dirty_inode(struct inode *inode, int flags)</div><div class='ctx'> 	int need_endtrans = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(gfs2_withdrawn(sdp)))</div><div class='add'>+	/* This can only happen during incomplete inode creation. */</div><div class='add'>+	if (unlikely(!ip-&gt;i_gl))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (gfs2_withdrawn(sdp))</div><div class='ctx'> 		return;</div><div class='ctx'> 	if (!gfs2_glock_is_locked_by_me(ip-&gt;i_gl)) {</div><div class='ctx'> 		ret = gfs2_glock_nq_init(ip-&gt;i_gl, LM_ST_EXCLUSIVE, 0, &amp;gh);</div><div class='hunk'>@@ -521,38 +538,32 @@ void gfs2_make_fs_ro(struct gfs2_sbd *sdp)</div><div class='ctx'> {</div><div class='ctx'> 	int log_write_allowed = test_bit(SDF_JOURNAL_LIVE, &amp;sdp-&gt;sd_flags);</div><div class='ctx'> </div><div class='del'>-	gfs2_flush_delete_work(sdp);</div><div class='del'>-	if (!log_write_allowed &amp;&amp; current == sdp-&gt;sd_quotad_process)</div><div class='del'>-		fs_warn(sdp, "The quotad daemon is withdrawing.\n");</div><div class='del'>-	else if (sdp-&gt;sd_quotad_process)</div><div class='del'>-		kthread_stop(sdp-&gt;sd_quotad_process);</div><div class='del'>-	sdp-&gt;sd_quotad_process = NULL;</div><div class='add'>+	if (!test_bit(SDF_KILL, &amp;sdp-&gt;sd_flags))</div><div class='add'>+		gfs2_flush_delete_work(sdp);</div><div class='ctx'> </div><div class='del'>-	if (!log_write_allowed &amp;&amp; current == sdp-&gt;sd_logd_process)</div><div class='del'>-		fs_warn(sdp, "The logd daemon is withdrawing.\n");</div><div class='del'>-	else if (sdp-&gt;sd_logd_process)</div><div class='del'>-		kthread_stop(sdp-&gt;sd_logd_process);</div><div class='del'>-	sdp-&gt;sd_logd_process = NULL;</div><div class='add'>+	gfs2_destroy_threads(sdp);</div><div class='ctx'> </div><div class='ctx'> 	if (log_write_allowed) {</div><div class='ctx'> 		gfs2_quota_sync(sdp-&gt;sd_vfs, 0);</div><div class='ctx'> 		gfs2_statfs_sync(sdp-&gt;sd_vfs, 0);</div><div class='ctx'> </div><div class='add'>+		/* We do two log flushes here. The first one commits dirty inodes</div><div class='add'>+		 * and rgrps to the journal, but queues up revokes to the ail list.</div><div class='add'>+		 * The second flush writes out and removes the revokes.</div><div class='add'>+		 *</div><div class='add'>+		 * The first must be done before the FLUSH_SHUTDOWN code</div><div class='add'>+		 * clears the LIVE flag, otherwise it will not be able to start</div><div class='add'>+		 * a transaction to write its revokes, and the error will cause</div><div class='add'>+		 * a withdraw of the file system. */</div><div class='add'>+		gfs2_log_flush(sdp, NULL, GFS2_LFC_MAKE_FS_RO);</div><div class='ctx'> 		gfs2_log_flush(sdp, NULL, GFS2_LOG_HEAD_FLUSH_SHUTDOWN |</div><div class='ctx'> 			       GFS2_LFC_MAKE_FS_RO);</div><div class='ctx'> 		wait_event_timeout(sdp-&gt;sd_log_waitq,</div><div class='ctx'> 				   gfs2_log_is_empty(sdp),</div><div class='ctx'> 				   HZ * 5);</div><div class='ctx'> 		gfs2_assert_warn(sdp, gfs2_log_is_empty(sdp));</div><div class='del'>-	} else {</div><div class='del'>-		wait_event_timeout(sdp-&gt;sd_log_waitq,</div><div class='del'>-				   gfs2_log_is_empty(sdp),</div><div class='del'>-				   HZ * 5);</div><div class='ctx'> 	}</div><div class='ctx'> 	gfs2_quota_cleanup(sdp);</div><div class='del'>-</div><div class='del'>-	if (!log_write_allowed)</div><div class='del'>-		sdp-&gt;sd_vfs-&gt;s_flags |= SB_RDONLY;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -583,15 +594,23 @@ restart:</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;sdp-&gt;sd_jindex_spin);</div><div class='ctx'> </div><div class='del'>-	if (!sb_rdonly(sb)) {</div><div class='add'>+	if (!sb_rdonly(sb))</div><div class='ctx'> 		gfs2_make_fs_ro(sdp);</div><div class='add'>+	else {</div><div class='add'>+		if (gfs2_withdrawn(sdp))</div><div class='add'>+			gfs2_destroy_threads(sdp);</div><div class='add'>+</div><div class='add'>+		gfs2_quota_cleanup(sdp);</div><div class='ctx'> 	}</div><div class='del'>-	WARN_ON(gfs2_withdrawing(sdp));</div><div class='add'>+</div><div class='add'>+	flush_work(&amp;sdp-&gt;sd_withdraw_work);</div><div class='ctx'> </div><div class='ctx'> 	/*  At this point, we're through modifying the disk  */</div><div class='ctx'> </div><div class='ctx'> 	/*  Release stuff  */</div><div class='ctx'> </div><div class='add'>+	gfs2_freeze_unlock(sdp);</div><div class='add'>+</div><div class='ctx'> 	iput(sdp-&gt;sd_jindex);</div><div class='ctx'> 	iput(sdp-&gt;sd_statfs_inode);</div><div class='ctx'> 	iput(sdp-&gt;sd_rindex);</div><div class='hunk'>@@ -617,12 +636,9 @@ restart:</div><div class='ctx'> 	gfs2_jindex_free(sdp);</div><div class='ctx'> 	/*  Take apart glock structures and buffer lists  */</div><div class='ctx'> 	gfs2_gl_hash_clear(sdp);</div><div class='del'>-	truncate_inode_pages_final(&amp;sdp-&gt;sd_aspace);</div><div class='add'>+	iput(sdp-&gt;sd_inode);</div><div class='ctx'> 	gfs2_delete_debugfs_file(sdp);</div><div class='del'>-	/*  Unmount the locking protocol  */</div><div class='del'>-	gfs2_lm_unmount(sdp);</div><div class='ctx'> </div><div class='del'>-	/*  At this point, we're through participating in the lockspace  */</div><div class='ctx'> 	gfs2_sys_fs_del(sdp);</div><div class='ctx'> 	free_sbd(sdp);</div><div class='ctx'> }</div><div class='hunk'>@@ -646,59 +662,94 @@ static int gfs2_sync_fs(struct super_block *sb, int wait)</div><div class='ctx'> 	return sdp-&gt;sd_log_error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void gfs2_freeze_func(struct work_struct *work)</div><div class='add'>+static int gfs2_do_thaw(struct gfs2_sbd *sdp, enum freeze_holder who, const void *freeze_owner)</div><div class='ctx'> {</div><div class='add'>+	struct super_block *sb = sdp-&gt;sd_vfs;</div><div class='ctx'> 	int error;</div><div class='del'>-	struct gfs2_holder freeze_gh;</div><div class='add'>+</div><div class='add'>+	error = gfs2_freeze_lock_shared(sdp);</div><div class='add'>+	if (error)</div><div class='add'>+		goto fail;</div><div class='add'>+	error = thaw_super(sb, who, freeze_owner);</div><div class='add'>+	if (!error)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+fail:</div><div class='add'>+	fs_info(sdp, "GFS2: couldn't thaw filesystem: %d\n", error);</div><div class='add'>+	gfs2_assert_withdraw(sdp, 0);</div><div class='add'>+	return error;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void gfs2_freeze_func(struct work_struct *work)</div><div class='add'>+{</div><div class='ctx'> 	struct gfs2_sbd *sdp = container_of(work, struct gfs2_sbd, sd_freeze_work);</div><div class='ctx'> 	struct super_block *sb = sdp-&gt;sd_vfs;</div><div class='add'>+	int error;</div><div class='ctx'> </div><div class='del'>-	atomic_inc(&amp;sb-&gt;s_active);</div><div class='del'>-	error = gfs2_freeze_lock(sdp, &amp;freeze_gh, 0);</div><div class='del'>-	if (error) {</div><div class='del'>-		gfs2_assert_withdraw(sdp, 0);</div><div class='del'>-	} else {</div><div class='del'>-		atomic_set(&amp;sdp-&gt;sd_freeze_state, SFS_UNFROZEN);</div><div class='del'>-		error = thaw_super(sb);</div><div class='del'>-		if (error) {</div><div class='del'>-			fs_info(sdp, "GFS2: couldn't thaw filesystem: %d\n",</div><div class='del'>-				error);</div><div class='del'>-			gfs2_assert_withdraw(sdp, 0);</div><div class='del'>-		}</div><div class='del'>-		gfs2_freeze_unlock(&amp;freeze_gh);</div><div class='del'>-	}</div><div class='add'>+	mutex_lock(&amp;sdp-&gt;sd_freeze_mutex);</div><div class='add'>+	error = -EBUSY;</div><div class='add'>+	if (test_bit(SDF_FROZEN, &amp;sdp-&gt;sd_flags))</div><div class='add'>+		goto freeze_failed;</div><div class='add'>+</div><div class='add'>+	error = freeze_super(sb, FREEZE_HOLDER_USERSPACE, NULL);</div><div class='add'>+	if (error)</div><div class='add'>+		goto freeze_failed;</div><div class='add'>+</div><div class='add'>+	gfs2_freeze_unlock(sdp);</div><div class='add'>+	set_bit(SDF_FROZEN, &amp;sdp-&gt;sd_flags);</div><div class='add'>+</div><div class='add'>+	error = gfs2_do_thaw(sdp, FREEZE_HOLDER_USERSPACE, NULL);</div><div class='add'>+	if (error)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	clear_bit(SDF_FROZEN, &amp;sdp-&gt;sd_flags);</div><div class='add'>+	goto out;</div><div class='add'>+</div><div class='add'>+freeze_failed:</div><div class='add'>+	fs_info(sdp, "GFS2: couldn't freeze filesystem: %d\n", error);</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	mutex_unlock(&amp;sdp-&gt;sd_freeze_mutex);</div><div class='ctx'> 	deactivate_super(sb);</div><div class='del'>-	clear_bit_unlock(SDF_FS_FROZEN, &amp;sdp-&gt;sd_flags);</div><div class='del'>-	wake_up_bit(&amp;sdp-&gt;sd_flags, SDF_FS_FROZEN);</div><div class='del'>-	return;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * gfs2_freeze - prevent further writes to the filesystem</div><div class='add'>+ * gfs2_freeze_super - prevent further writes to the filesystem</div><div class='ctx'>  * @sb: the VFS structure for the filesystem</div><div class='add'>+ * @who: freeze flags</div><div class='add'>+ * @freeze_owner: owner of the freeze</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static int gfs2_freeze(struct super_block *sb)</div><div class='add'>+static int gfs2_freeze_super(struct super_block *sb, enum freeze_holder who,</div><div class='add'>+			     const void *freeze_owner)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_sbd *sdp = sb-&gt;s_fs_info;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;sdp-&gt;sd_freeze_mutex);</div><div class='del'>-	if (atomic_read(&amp;sdp-&gt;sd_freeze_state) != SFS_UNFROZEN) {</div><div class='del'>-		error = -EBUSY;</div><div class='del'>-		goto out;</div><div class='add'>+	if (!mutex_trylock(&amp;sdp-&gt;sd_freeze_mutex))</div><div class='add'>+		return -EBUSY;</div><div class='add'>+	if (test_bit(SDF_FROZEN, &amp;sdp-&gt;sd_flags)) {</div><div class='add'>+		mutex_unlock(&amp;sdp-&gt;sd_freeze_mutex);</div><div class='add'>+		return -EBUSY;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	for (;;) {</div><div class='del'>-		if (gfs2_withdrawn(sdp)) {</div><div class='del'>-			error = -EINVAL;</div><div class='add'>+		error = freeze_super(sb, who, freeze_owner);</div><div class='add'>+		if (error) {</div><div class='add'>+			fs_info(sdp, "GFS2: couldn't freeze filesystem: %d\n",</div><div class='add'>+				error);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		error = gfs2_lock_fs_check_clean(sdp);</div><div class='del'>-		if (!error)</div><div class='add'>+		if (!error) {</div><div class='add'>+			set_bit(SDF_FREEZE_INITIATOR, &amp;sdp-&gt;sd_flags);</div><div class='add'>+			set_bit(SDF_FROZEN, &amp;sdp-&gt;sd_flags);</div><div class='ctx'> 			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		(void)gfs2_do_thaw(sdp, who, freeze_owner);</div><div class='ctx'> </div><div class='ctx'> 		if (error == -EBUSY)</div><div class='ctx'> 			fs_err(sdp, "waiting for recovery before freeze\n");</div><div class='hunk'>@@ -712,32 +763,58 @@ static int gfs2_freeze(struct super_block *sb)</div><div class='ctx'> 		fs_err(sdp, "retrying...\n");</div><div class='ctx'> 		msleep(1000);</div><div class='ctx'> 	}</div><div class='del'>-	set_bit(SDF_FS_FROZEN, &amp;sdp-&gt;sd_flags);</div><div class='add'>+</div><div class='ctx'> out:</div><div class='ctx'> 	mutex_unlock(&amp;sdp-&gt;sd_freeze_mutex);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int gfs2_freeze_fs(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct gfs2_sbd *sdp = sb-&gt;s_fs_info;</div><div class='add'>+</div><div class='add'>+	if (test_bit(SDF_JOURNAL_LIVE, &amp;sdp-&gt;sd_flags)) {</div><div class='add'>+		gfs2_log_flush(sdp, NULL, GFS2_LOG_HEAD_FLUSH_FREEZE |</div><div class='add'>+			       GFS2_LFC_FREEZE_GO_SYNC);</div><div class='add'>+		if (gfs2_withdrawn(sdp))</div><div class='add'>+			return -EIO;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /**</div><div class='del'>- * gfs2_unfreeze - reallow writes to the filesystem</div><div class='add'>+ * gfs2_thaw_super - reallow writes to the filesystem</div><div class='ctx'>  * @sb: the VFS structure for the filesystem</div><div class='add'>+ * @who: freeze flags</div><div class='add'>+ * @freeze_owner: owner of the freeze</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static int gfs2_unfreeze(struct super_block *sb)</div><div class='add'>+static int gfs2_thaw_super(struct super_block *sb, enum freeze_holder who,</div><div class='add'>+			   const void *freeze_owner)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_sbd *sdp = sb-&gt;s_fs_info;</div><div class='add'>+	int error;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;sdp-&gt;sd_freeze_mutex);</div><div class='del'>-	if (atomic_read(&amp;sdp-&gt;sd_freeze_state) != SFS_FROZEN ||</div><div class='del'>-	    !gfs2_holder_initialized(&amp;sdp-&gt;sd_freeze_gh)) {</div><div class='add'>+	if (!mutex_trylock(&amp;sdp-&gt;sd_freeze_mutex))</div><div class='add'>+		return -EBUSY;</div><div class='add'>+	if (!test_bit(SDF_FREEZE_INITIATOR, &amp;sdp-&gt;sd_flags)) {</div><div class='ctx'> 		mutex_unlock(&amp;sdp-&gt;sd_freeze_mutex);</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	gfs2_freeze_unlock(&amp;sdp-&gt;sd_freeze_gh);</div><div class='add'>+	atomic_inc(&amp;sb-&gt;s_active);</div><div class='add'>+	gfs2_freeze_unlock(sdp);</div><div class='add'>+</div><div class='add'>+	error = gfs2_do_thaw(sdp, who, freeze_owner);</div><div class='add'>+</div><div class='add'>+	if (!error) {</div><div class='add'>+		clear_bit(SDF_FREEZE_INITIATOR, &amp;sdp-&gt;sd_flags);</div><div class='add'>+		clear_bit(SDF_FROZEN, &amp;sdp-&gt;sd_flags);</div><div class='add'>+	}</div><div class='ctx'> 	mutex_unlock(&amp;sdp-&gt;sd_freeze_mutex);</div><div class='del'>-	return wait_on_bit(&amp;sdp-&gt;sd_flags, SDF_FS_FROZEN, TASK_INTERRUPTIBLE);</div><div class='add'>+	deactivate_super(sb);</div><div class='add'>+	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -903,6 +980,7 @@ static int gfs2_statfs(struct dentry *dentry, struct kstatfs *buf)</div><div class='ctx'> 	buf-&gt;f_files = sc.sc_dinodes + sc.sc_free;</div><div class='ctx'> 	buf-&gt;f_ffree = sc.sc_free;</div><div class='ctx'> 	buf-&gt;f_namelen = GFS2_FNAMESIZE;</div><div class='add'>+	buf-&gt;f_fsid = uuid_to_fsid(sb-&gt;s_uuid.b);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -925,12 +1003,12 @@ static int gfs2_statfs(struct dentry *dentry, struct kstatfs *buf)</div><div class='ctx'> static int gfs2_drop_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_inode *ip = GFS2_I(inode);</div><div class='add'>+	struct gfs2_sbd *sdp = GFS2_SB(inode);</div><div class='ctx'> </div><div class='del'>-	if (!test_bit(GIF_FREE_VFS_INODE, &amp;ip-&gt;i_flags) &amp;&amp;</div><div class='del'>-	    inode-&gt;i_nlink &amp;&amp;</div><div class='add'>+	if (inode-&gt;i_nlink &amp;&amp;</div><div class='ctx'> 	    gfs2_holder_initialized(&amp;ip-&gt;i_iopen_gh)) {</div><div class='ctx'> 		struct gfs2_glock *gl = ip-&gt;i_iopen_gh.gh_gl;</div><div class='del'>-		if (test_bit(GLF_DEMOTE, &amp;gl-&gt;gl_flags))</div><div class='add'>+		if (glock_needs_demote(gl))</div><div class='ctx'> 			clear_nlink(inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -945,22 +1023,18 @@ static int gfs2_drop_inode(struct inode *inode)</div><div class='ctx'> 		struct gfs2_glock *gl = ip-&gt;i_iopen_gh.gh_gl;</div><div class='ctx'> </div><div class='ctx'> 		gfs2_glock_hold(gl);</div><div class='del'>-		if (!gfs2_queue_delete_work(gl, 0))</div><div class='del'>-			gfs2_glock_queue_put(gl);</div><div class='add'>+		if (!gfs2_queue_verify_delete(gl, true))</div><div class='add'>+			gfs2_glock_put_async(gl);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return generic_drop_inode(inode);</div><div class='del'>-}</div><div class='add'>+	/*</div><div class='add'>+	 * No longer cache inodes when trying to evict them all.</div><div class='add'>+	 */</div><div class='add'>+	if (test_bit(SDF_EVICTING, &amp;sdp-&gt;sd_flags))</div><div class='add'>+		return 1;</div><div class='ctx'> </div><div class='del'>-static int is_ancestor(const struct dentry *d1, const struct dentry *d2)</div><div class='del'>-{</div><div class='del'>-	do {</div><div class='del'>-		if (d1 == d2)</div><div class='del'>-			return 1;</div><div class='del'>-		d1 = d1-&gt;d_parent;</div><div class='del'>-	} while (!IS_ROOT(d1));</div><div class='del'>-	return 0;</div><div class='add'>+	return inode_generic_drop(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -975,9 +1049,16 @@ static int gfs2_show_options(struct seq_file *s, struct dentry *root)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_sbd *sdp = root-&gt;d_sb-&gt;s_fs_info;</div><div class='ctx'> 	struct gfs2_args *args = &amp;sdp-&gt;sd_args;</div><div class='del'>-	int val;</div><div class='add'>+	unsigned int logd_secs, statfs_slow, statfs_quantum, quota_quantum;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;sdp-&gt;sd_tune.gt_spin);</div><div class='add'>+	logd_secs = sdp-&gt;sd_tune.gt_logd_secs;</div><div class='add'>+	quota_quantum = sdp-&gt;sd_tune.gt_quota_quantum;</div><div class='add'>+	statfs_quantum = sdp-&gt;sd_tune.gt_statfs_quantum;</div><div class='add'>+	statfs_slow = sdp-&gt;sd_tune.gt_statfs_slow;</div><div class='add'>+	spin_unlock(&amp;sdp-&gt;sd_tune.gt_spin);</div><div class='ctx'> </div><div class='del'>-	if (is_ancestor(root, sdp-&gt;sd_master_dir))</div><div class='add'>+	if (is_subdir(root, sdp-&gt;sd_master_dir))</div><div class='ctx'> 		seq_puts(s, ",meta");</div><div class='ctx'> 	if (args-&gt;ar_lockproto[0])</div><div class='ctx'> 		seq_show_option(s, "lockproto", args-&gt;ar_lockproto);</div><div class='hunk'>@@ -1005,6 +1086,9 @@ static int gfs2_show_options(struct seq_file *s, struct dentry *root)</div><div class='ctx'> 		case GFS2_QUOTA_ON:</div><div class='ctx'> 			state = "on";</div><div class='ctx'> 			break;</div><div class='add'>+		case GFS2_QUOTA_QUIET:</div><div class='add'>+			state = "quiet";</div><div class='add'>+			break;</div><div class='ctx'> 		default:</div><div class='ctx'> 			state = "unknown";</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -1030,17 +1114,14 @@ static int gfs2_show_options(struct seq_file *s, struct dentry *root)</div><div class='ctx'> 	}</div><div class='ctx'> 	if (args-&gt;ar_discard)</div><div class='ctx'> 		seq_puts(s, ",discard");</div><div class='del'>-	val = sdp-&gt;sd_tune.gt_logd_secs;</div><div class='del'>-	if (val != 30)</div><div class='del'>-		seq_printf(s, ",commit=%d", val);</div><div class='del'>-	val = sdp-&gt;sd_tune.gt_statfs_quantum;</div><div class='del'>-	if (val != 30)</div><div class='del'>-		seq_printf(s, ",statfs_quantum=%d", val);</div><div class='del'>-	else if (sdp-&gt;sd_tune.gt_statfs_slow)</div><div class='add'>+	if (logd_secs != 30)</div><div class='add'>+		seq_printf(s, ",commit=%d", logd_secs);</div><div class='add'>+	if (statfs_quantum != 30)</div><div class='add'>+		seq_printf(s, ",statfs_quantum=%d", statfs_quantum);</div><div class='add'>+	else if (statfs_slow)</div><div class='ctx'> 		seq_puts(s, ",statfs_quantum=0");</div><div class='del'>-	val = sdp-&gt;sd_tune.gt_quota_quantum;</div><div class='del'>-	if (val != 60)</div><div class='del'>-		seq_printf(s, ",quota_quantum=%d", val);</div><div class='add'>+	if (quota_quantum != 60)</div><div class='add'>+		seq_printf(s, ",quota_quantum=%d", quota_quantum);</div><div class='ctx'> 	if (args-&gt;ar_statfs_percent)</div><div class='ctx'> 		seq_printf(s, ",statfs_percent=%d", args-&gt;ar_statfs_percent);</div><div class='ctx'> 	if (args-&gt;ar_errors != GFS2_ERRORS_DEFAULT) {</div><div class='hunk'>@@ -1050,6 +1131,9 @@ static int gfs2_show_options(struct seq_file *s, struct dentry *root)</div><div class='ctx'> 		case GFS2_ERRORS_WITHDRAW:</div><div class='ctx'> 			state = "withdraw";</div><div class='ctx'> 			break;</div><div class='add'>+		case GFS2_ERRORS_DEACTIVATE:</div><div class='add'>+			state = "deactivate";</div><div class='add'>+			break;</div><div class='ctx'> 		case GFS2_ERRORS_PANIC:</div><div class='ctx'> 			state = "panic";</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -1070,70 +1154,6 @@ static int gfs2_show_options(struct seq_file *s, struct dentry *root)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void gfs2_final_release_pages(struct gfs2_inode *ip)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = &amp;ip-&gt;i_inode;</div><div class='del'>-	struct gfs2_glock *gl = ip-&gt;i_gl;</div><div class='del'>-</div><div class='del'>-	truncate_inode_pages(gfs2_glock2aspace(ip-&gt;i_gl), 0);</div><div class='del'>-	truncate_inode_pages(&amp;inode-&gt;i_data, 0);</div><div class='del'>-</div><div class='del'>-	if (atomic_read(&amp;gl-&gt;gl_revokes) == 0) {</div><div class='del'>-		clear_bit(GLF_LFLUSH, &amp;gl-&gt;gl_flags);</div><div class='del'>-		clear_bit(GLF_DIRTY, &amp;gl-&gt;gl_flags);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int gfs2_dinode_dealloc(struct gfs2_inode *ip)</div><div class='del'>-{</div><div class='del'>-	struct gfs2_sbd *sdp = GFS2_SB(&amp;ip-&gt;i_inode);</div><div class='del'>-	struct gfs2_rgrpd *rgd;</div><div class='del'>-	struct gfs2_holder gh;</div><div class='del'>-	int error;</div><div class='del'>-</div><div class='del'>-	if (gfs2_get_inode_blocks(&amp;ip-&gt;i_inode) != 1) {</div><div class='del'>-		gfs2_consist_inode(ip);</div><div class='del'>-		return -EIO;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	error = gfs2_rindex_update(sdp);</div><div class='del'>-	if (error)</div><div class='del'>-		return error;</div><div class='del'>-</div><div class='del'>-	error = gfs2_quota_hold(ip, NO_UID_QUOTA_CHANGE, NO_GID_QUOTA_CHANGE);</div><div class='del'>-	if (error)</div><div class='del'>-		return error;</div><div class='del'>-</div><div class='del'>-	rgd = gfs2_blk2rgrpd(sdp, ip-&gt;i_no_addr, 1);</div><div class='del'>-	if (!rgd) {</div><div class='del'>-		gfs2_consist_inode(ip);</div><div class='del'>-		error = -EIO;</div><div class='del'>-		goto out_qs;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	error = gfs2_glock_nq_init(rgd-&gt;rd_gl, LM_ST_EXCLUSIVE,</div><div class='del'>-				   LM_FLAG_NODE_SCOPE, &amp;gh);</div><div class='del'>-	if (error)</div><div class='del'>-		goto out_qs;</div><div class='del'>-</div><div class='del'>-	error = gfs2_trans_begin(sdp, RES_RG_BIT + RES_STATFS + RES_QUOTA,</div><div class='del'>-				 sdp-&gt;sd_jdesc-&gt;jd_blocks);</div><div class='del'>-	if (error)</div><div class='del'>-		goto out_rg_gunlock;</div><div class='del'>-</div><div class='del'>-	gfs2_free_di(rgd, ip);</div><div class='del'>-</div><div class='del'>-	gfs2_final_release_pages(ip);</div><div class='del'>-</div><div class='del'>-	gfs2_trans_end(sdp);</div><div class='del'>-</div><div class='del'>-out_rg_gunlock:</div><div class='del'>-	gfs2_glock_dq_uninit(&amp;gh);</div><div class='del'>-out_qs:</div><div class='del'>-	gfs2_quota_unhold(ip);</div><div class='del'>-	return error;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /**</div><div class='ctx'>  * gfs2_glock_put_eventually</div><div class='ctx'>  * @gl:	The glock to put</div><div class='hunk'>@@ -1145,58 +1165,60 @@ out_qs:</div><div class='ctx'> static void gfs2_glock_put_eventually(struct gfs2_glock *gl)</div><div class='ctx'> {</div><div class='ctx'> 	if (current-&gt;flags &amp; PF_MEMALLOC)</div><div class='del'>-		gfs2_glock_queue_put(gl);</div><div class='add'>+		gfs2_glock_put_async(gl);</div><div class='ctx'> 	else</div><div class='ctx'> 		gfs2_glock_put(gl);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool gfs2_upgrade_iopen_glock(struct inode *inode)</div><div class='add'>+static enum evict_behavior gfs2_upgrade_iopen_glock(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_inode *ip = GFS2_I(inode);</div><div class='ctx'> 	struct gfs2_sbd *sdp = GFS2_SB(inode);</div><div class='ctx'> 	struct gfs2_holder *gh = &amp;ip-&gt;i_iopen_gh;</div><div class='del'>-	long timeout = 5 * HZ;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='ctx'> 	gh-&gt;gh_flags |= GL_NOCACHE;</div><div class='ctx'> 	gfs2_glock_dq_wait(gh);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * If there are no other lock holders, we'll get the lock immediately.</div><div class='add'>+	 * If there are no other lock holders, we will immediately get</div><div class='add'>+	 * exclusive access to the iopen glock here.</div><div class='add'>+	 *</div><div class='ctx'> 	 * Otherwise, the other nodes holding the lock will be notified about</div><div class='del'>-	 * our locking request.  If they don't have the inode open, they'll</div><div class='del'>-	 * evict the cached inode and release the lock.  Otherwise, if they</div><div class='del'>-	 * poke the inode glock, we'll take this as an indication that they</div><div class='del'>-	 * still need the iopen glock and that they'll take care of deleting</div><div class='del'>-	 * the inode when they're done.  As a last resort, if another node</div><div class='del'>-	 * keeps holding the iopen glock without showing any activity on the</div><div class='del'>-	 * inode glock, we'll eventually time out.</div><div class='add'>+	 * our locking request (see iopen_go_callback()).  If they do not have</div><div class='add'>+	 * the inode open, they are expected to evict the cached inode and</div><div class='add'>+	 * release the lock, allowing us to proceed.</div><div class='ctx'> 	 *</div><div class='del'>-	 * Note that we're passing the LM_FLAG_TRY_1CB flag to the first</div><div class='del'>-	 * locking request as an optimization to notify lock holders as soon as</div><div class='del'>-	 * possible.  Without that flag, they'd be notified implicitly by the</div><div class='del'>-	 * second locking request.</div><div class='add'>+	 * Otherwise, if they cannot evict the inode, they are expected to poke</div><div class='add'>+	 * the inode glock (note: not the iopen glock).  We will notice that</div><div class='add'>+	 * and stop waiting for the iopen glock immediately.  The other node(s)</div><div class='add'>+	 * are then expected to take care of deleting the inode when they no</div><div class='add'>+	 * longer use it.</div><div class='add'>+	 *</div><div class='add'>+	 * As a last resort, if another node keeps holding the iopen glock</div><div class='add'>+	 * without showing any activity on the inode glock, we will eventually</div><div class='add'>+	 * time out and fail the iopen glock upgrade.</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='del'>-	gfs2_holder_reinit(LM_ST_EXCLUSIVE, LM_FLAG_TRY_1CB | GL_NOCACHE, gh);</div><div class='del'>-	error = gfs2_glock_nq(gh);</div><div class='del'>-	if (error != GLR_TRYFAILED)</div><div class='del'>-		return !error;</div><div class='del'>-</div><div class='ctx'> 	gfs2_holder_reinit(LM_ST_EXCLUSIVE, GL_ASYNC | GL_NOCACHE, gh);</div><div class='ctx'> 	error = gfs2_glock_nq(gh);</div><div class='ctx'> 	if (error)</div><div class='del'>-		return false;</div><div class='add'>+		return EVICT_SHOULD_SKIP_DELETE;</div><div class='ctx'> </div><div class='del'>-	timeout = wait_event_interruptible_timeout(sdp-&gt;sd_async_glock_wait,</div><div class='add'>+	wait_event_interruptible_timeout(sdp-&gt;sd_async_glock_wait,</div><div class='ctx'> 		!test_bit(HIF_WAIT, &amp;gh-&gt;gh_iflags) ||</div><div class='del'>-		test_bit(GLF_DEMOTE, &amp;ip-&gt;i_gl-&gt;gl_flags),</div><div class='del'>-		timeout);</div><div class='add'>+		glock_needs_demote(ip-&gt;i_gl),</div><div class='add'>+		5 * HZ);</div><div class='ctx'> 	if (!test_bit(HIF_HOLDER, &amp;gh-&gt;gh_iflags)) {</div><div class='ctx'> 		gfs2_glock_dq(gh);</div><div class='del'>-		return false;</div><div class='add'>+		if (glock_needs_demote(ip-&gt;i_gl))</div><div class='add'>+			return EVICT_SHOULD_SKIP_DELETE;</div><div class='add'>+		return EVICT_SHOULD_DEFER_DELETE;</div><div class='ctx'> 	}</div><div class='del'>-	return true;</div><div class='add'>+	error = gfs2_glock_holder_ready(gh);</div><div class='add'>+	if (error)</div><div class='add'>+		return EVICT_SHOULD_SKIP_DELETE;</div><div class='add'>+	return EVICT_SHOULD_DELETE;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -1209,62 +1231,47 @@ static bool gfs2_upgrade_iopen_glock(struct inode *inode)</div><div class='ctx'>  *</div><div class='ctx'>  * Returns: the fate of the dinode</div><div class='ctx'>  */</div><div class='del'>-static enum dinode_demise evict_should_delete(struct inode *inode,</div><div class='del'>-					      struct gfs2_holder *gh)</div><div class='add'>+static enum evict_behavior evict_should_delete(struct inode *inode,</div><div class='add'>+					       struct gfs2_holder *gh)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_inode *ip = GFS2_I(inode);</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	struct gfs2_sbd *sdp = sb-&gt;s_fs_info;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (test_bit(GIF_ALLOC_FAILED, &amp;ip-&gt;i_flags)) {</div><div class='del'>-		BUG_ON(!gfs2_glock_is_locked_by_me(ip-&gt;i_gl));</div><div class='del'>-		goto should_delete;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (test_bit(GIF_DEFERRED_DELETE, &amp;ip-&gt;i_flags))</div><div class='del'>-		return SHOULD_DEFER_EVICTION;</div><div class='add'>+	if (gfs2_holder_initialized(&amp;ip-&gt;i_iopen_gh) &amp;&amp;</div><div class='add'>+	    test_bit(GLF_DEFER_DELETE, &amp;ip-&gt;i_iopen_gh.gh_gl-&gt;gl_flags))</div><div class='add'>+		return EVICT_SHOULD_DEFER_DELETE;</div><div class='ctx'> </div><div class='ctx'> 	/* Deletes should never happen under memory pressure anymore.  */</div><div class='ctx'> 	if (WARN_ON_ONCE(current-&gt;flags &amp; PF_MEMALLOC))</div><div class='del'>-		return SHOULD_DEFER_EVICTION;</div><div class='add'>+		return EVICT_SHOULD_DEFER_DELETE;</div><div class='ctx'> </div><div class='ctx'> 	/* Must not read inode block until block type has been verified */</div><div class='ctx'> 	ret = gfs2_glock_nq_init(ip-&gt;i_gl, LM_ST_EXCLUSIVE, GL_SKIP, gh);</div><div class='del'>-	if (unlikely(ret)) {</div><div class='del'>-		glock_clear_object(ip-&gt;i_iopen_gh.gh_gl, ip);</div><div class='del'>-		ip-&gt;i_iopen_gh.gh_flags |= GL_NOCACHE;</div><div class='del'>-		gfs2_glock_dq_uninit(&amp;ip-&gt;i_iopen_gh);</div><div class='del'>-		return SHOULD_DEFER_EVICTION;</div><div class='del'>-	}</div><div class='add'>+	if (unlikely(ret))</div><div class='add'>+		return EVICT_SHOULD_SKIP_DELETE;</div><div class='ctx'> </div><div class='ctx'> 	if (gfs2_inode_already_deleted(ip-&gt;i_gl, ip-&gt;i_no_formal_ino))</div><div class='del'>-		return SHOULD_NOT_DELETE_DINODE;</div><div class='add'>+		return EVICT_SHOULD_SKIP_DELETE;</div><div class='ctx'> 	ret = gfs2_check_blk_type(sdp, ip-&gt;i_no_addr, GFS2_BLKST_UNLINKED);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		return SHOULD_NOT_DELETE_DINODE;</div><div class='add'>+		return EVICT_SHOULD_SKIP_DELETE;</div><div class='ctx'> </div><div class='del'>-	if (test_bit(GLF_INSTANTIATE_NEEDED, &amp;ip-&gt;i_gl-&gt;gl_flags)) {</div><div class='del'>-		ret = gfs2_instantiate(gh);</div><div class='del'>-		if (ret)</div><div class='del'>-			return SHOULD_NOT_DELETE_DINODE;</div><div class='del'>-	}</div><div class='add'>+	ret = gfs2_instantiate(gh);</div><div class='add'>+	if (ret)</div><div class='add'>+		return EVICT_SHOULD_SKIP_DELETE;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The inode may have been recreated in the meantime.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (inode-&gt;i_nlink)</div><div class='del'>-		return SHOULD_NOT_DELETE_DINODE;</div><div class='add'>+		return EVICT_SHOULD_SKIP_DELETE;</div><div class='ctx'> </div><div class='del'>-should_delete:</div><div class='ctx'> 	if (gfs2_holder_initialized(&amp;ip-&gt;i_iopen_gh) &amp;&amp;</div><div class='del'>-	    test_bit(HIF_HOLDER, &amp;ip-&gt;i_iopen_gh.gh_iflags)) {</div><div class='del'>-		if (!gfs2_upgrade_iopen_glock(inode)) {</div><div class='del'>-			gfs2_holder_uninit(&amp;ip-&gt;i_iopen_gh);</div><div class='del'>-			return SHOULD_NOT_DELETE_DINODE;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	return SHOULD_DELETE_DINODE;</div><div class='add'>+	    test_bit(HIF_HOLDER, &amp;ip-&gt;i_iopen_gh.gh_iflags))</div><div class='add'>+		return gfs2_upgrade_iopen_glock(inode);</div><div class='add'>+	return EVICT_SHOULD_DELETE;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -1284,7 +1291,7 @@ static int evict_unlinked_inode(struct inode *inode)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (ip-&gt;i_eattr) {</div><div class='del'>-		ret = gfs2_ea_dealloc(ip);</div><div class='add'>+		ret = gfs2_ea_dealloc(ip, true);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1295,13 +1302,22 @@ static int evict_unlinked_inode(struct inode *inode)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* We're about to clear the bitmap for the dinode, but as soon as we</div><div class='del'>-	   do, gfs2_create_inode can create another inode at the same block</div><div class='del'>-	   location and try to set gl_object again. We clear gl_object here so</div><div class='del'>-	   that subsequent inode creates don't see an old gl_object. */</div><div class='del'>-	glock_clear_object(ip-&gt;i_gl, ip);</div><div class='add'>+	/*</div><div class='add'>+	 * As soon as we clear the bitmap for the dinode, gfs2_create_inode()</div><div class='add'>+	 * can get called to recreate it, or even gfs2_inode_lookup() if the</div><div class='add'>+	 * inode was recreated on another node in the meantime.</div><div class='add'>+	 *</div><div class='add'>+	 * However, inserting the new inode into the inode hash table will not</div><div class='add'>+	 * succeed until the old inode is removed, and that only happens after</div><div class='add'>+	 * -&gt;evict_inode() returns.  The new inode is attached to its inode and</div><div class='add'>+	 *  iopen glocks after inserting it into the inode hash table, so at</div><div class='add'>+	 *  that point we can be sure that both glocks are unused.</div><div class='add'>+	 */</div><div class='add'>+</div><div class='ctx'> 	ret = gfs2_dinode_dealloc(ip);</div><div class='del'>-	gfs2_inode_remember_delete(ip-&gt;i_gl, ip-&gt;i_no_formal_ino);</div><div class='add'>+	if (!ret &amp;&amp; ip-&gt;i_gl)</div><div class='add'>+		gfs2_inode_remember_delete(ip-&gt;i_gl, ip-&gt;i_no_formal_ino);</div><div class='add'>+</div><div class='ctx'> out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -1366,21 +1382,35 @@ static void gfs2_evict_inode(struct inode *inode)</div><div class='ctx'> 	struct gfs2_sbd *sdp = sb-&gt;s_fs_info;</div><div class='ctx'> 	struct gfs2_inode *ip = GFS2_I(inode);</div><div class='ctx'> 	struct gfs2_holder gh;</div><div class='add'>+	enum evict_behavior behavior;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (test_bit(GIF_FREE_VFS_INODE, &amp;ip-&gt;i_flags)) {</div><div class='del'>-		clear_inode(inode);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (inode-&gt;i_nlink || sb_rdonly(sb))</div><div class='add'>+	gfs2_holder_mark_uninitialized(&amp;gh);</div><div class='add'>+	if (inode-&gt;i_nlink || sb_rdonly(sb) || !ip-&gt;i_no_addr)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	gfs2_holder_mark_uninitialized(&amp;gh);</div><div class='del'>-	ret = evict_should_delete(inode, &amp;gh);</div><div class='del'>-	if (ret == SHOULD_DEFER_EVICTION)</div><div class='add'>+	/*</div><div class='add'>+	 * In case of an incomplete mount, gfs2_evict_inode() may be called for</div><div class='add'>+	 * system files without having an active journal to write to.  In that</div><div class='add'>+	 * case, skip the filesystem evict.</div><div class='add'>+	 */</div><div class='add'>+	if (!sdp-&gt;sd_jdesc)</div><div class='ctx'> 		goto out;</div><div class='del'>-	if (ret == SHOULD_DELETE_DINODE)</div><div class='add'>+</div><div class='add'>+	behavior = evict_should_delete(inode, &amp;gh);</div><div class='add'>+	if (behavior == EVICT_SHOULD_DEFER_DELETE &amp;&amp;</div><div class='add'>+	    !test_bit(SDF_KILL, &amp;sdp-&gt;sd_flags)) {</div><div class='add'>+		struct gfs2_glock *io_gl = ip-&gt;i_iopen_gh.gh_gl;</div><div class='add'>+</div><div class='add'>+		if (io_gl) {</div><div class='add'>+			gfs2_glock_hold(io_gl);</div><div class='add'>+			if (!gfs2_queue_verify_delete(io_gl, true))</div><div class='add'>+				gfs2_glock_put(io_gl);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		behavior = EVICT_SHOULD_SKIP_DELETE;</div><div class='add'>+	}</div><div class='add'>+	if (behavior == EVICT_SHOULD_DELETE)</div><div class='ctx'> 		ret = evict_unlinked_inode(inode);</div><div class='ctx'> 	else</div><div class='ctx'> 		ret = evict_linked_inode(inode);</div><div class='hunk'>@@ -1388,53 +1418,50 @@ static void gfs2_evict_inode(struct inode *inode)</div><div class='ctx'> 	if (gfs2_rs_active(&amp;ip-&gt;i_res))</div><div class='ctx'> 		gfs2_rs_deltree(&amp;ip-&gt;i_res);</div><div class='ctx'> </div><div class='del'>-	if (gfs2_holder_initialized(&amp;gh)) {</div><div class='del'>-		glock_clear_object(ip-&gt;i_gl, ip);</div><div class='del'>-		gfs2_glock_dq_uninit(&amp;gh);</div><div class='del'>-	}</div><div class='ctx'> 	if (ret &amp;&amp; ret != GLR_TRYFAILED &amp;&amp; ret != -EROFS)</div><div class='ctx'> 		fs_warn(sdp, "gfs2_evict_inode: %d\n", ret);</div><div class='ctx'> out:</div><div class='add'>+	if (gfs2_holder_initialized(&amp;gh))</div><div class='add'>+		gfs2_glock_dq_uninit(&amp;gh);</div><div class='ctx'> 	truncate_inode_pages_final(&amp;inode-&gt;i_data);</div><div class='ctx'> 	if (ip-&gt;i_qadata)</div><div class='ctx'> 		gfs2_assert_warn(sdp, ip-&gt;i_qadata-&gt;qa_ref == 0);</div><div class='del'>-	gfs2_rs_delete(ip, NULL);</div><div class='add'>+	gfs2_rs_deltree(&amp;ip-&gt;i_res);</div><div class='ctx'> 	gfs2_ordered_del_inode(ip);</div><div class='ctx'> 	clear_inode(inode);</div><div class='ctx'> 	gfs2_dir_hash_inval(ip);</div><div class='del'>-	if (ip-&gt;i_gl) {</div><div class='del'>-		glock_clear_object(ip-&gt;i_gl, ip);</div><div class='del'>-		wait_on_bit_io(&amp;ip-&gt;i_flags, GIF_GLOP_PENDING, TASK_UNINTERRUPTIBLE);</div><div class='del'>-		gfs2_glock_add_to_lru(ip-&gt;i_gl);</div><div class='del'>-		gfs2_glock_put_eventually(ip-&gt;i_gl);</div><div class='del'>-		ip-&gt;i_gl = NULL;</div><div class='del'>-	}</div><div class='ctx'> 	if (gfs2_holder_initialized(&amp;ip-&gt;i_iopen_gh)) {</div><div class='ctx'> 		struct gfs2_glock *gl = ip-&gt;i_iopen_gh.gh_gl;</div><div class='ctx'> </div><div class='ctx'> 		glock_clear_object(gl, ip);</div><div class='del'>-		if (test_bit(HIF_HOLDER, &amp;ip-&gt;i_iopen_gh.gh_iflags)) {</div><div class='del'>-			ip-&gt;i_iopen_gh.gh_flags |= GL_NOCACHE;</div><div class='del'>-			gfs2_glock_dq(&amp;ip-&gt;i_iopen_gh);</div><div class='del'>-		}</div><div class='ctx'> 		gfs2_glock_hold(gl);</div><div class='del'>-		gfs2_holder_uninit(&amp;ip-&gt;i_iopen_gh);</div><div class='add'>+		ip-&gt;i_iopen_gh.gh_flags |= GL_NOCACHE;</div><div class='add'>+		gfs2_glock_dq_uninit(&amp;ip-&gt;i_iopen_gh);</div><div class='ctx'> 		gfs2_glock_put_eventually(gl);</div><div class='ctx'> 	}</div><div class='add'>+	if (ip-&gt;i_gl) {</div><div class='add'>+		glock_clear_object(ip-&gt;i_gl, ip);</div><div class='add'>+		wait_on_bit_io(&amp;ip-&gt;i_flags, GIF_GLOP_PENDING, TASK_UNINTERRUPTIBLE);</div><div class='add'>+		gfs2_glock_put_eventually(ip-&gt;i_gl);</div><div class='add'>+		rcu_assign_pointer(ip-&gt;i_gl, NULL);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct inode *gfs2_alloc_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_inode *ip;</div><div class='ctx'> </div><div class='del'>-	ip = kmem_cache_alloc(gfs2_inode_cachep, GFP_KERNEL);</div><div class='add'>+	ip = alloc_inode_sb(sb, gfs2_inode_cachep, GFP_KERNEL);</div><div class='ctx'> 	if (!ip)</div><div class='ctx'> 		return NULL;</div><div class='add'>+	ip-&gt;i_no_addr = 0;</div><div class='add'>+	ip-&gt;i_no_formal_ino = 0;</div><div class='ctx'> 	ip-&gt;i_flags = 0;</div><div class='ctx'> 	ip-&gt;i_gl = NULL;</div><div class='ctx'> 	gfs2_holder_mark_uninitialized(&amp;ip-&gt;i_iopen_gh);</div><div class='ctx'> 	memset(&amp;ip-&gt;i_res, 0, sizeof(ip-&gt;i_res));</div><div class='ctx'> 	RB_CLEAR_NODE(&amp;ip-&gt;i_res.rs_node);</div><div class='add'>+	ip-&gt;i_diskflags = 0;</div><div class='ctx'> 	ip-&gt;i_rahead = 0;</div><div class='ctx'> 	return &amp;ip-&gt;i_inode;</div><div class='ctx'> }</div><div class='hunk'>@@ -1444,7 +1471,7 @@ static void gfs2_free_inode(struct inode *inode)</div><div class='ctx'> 	kmem_cache_free(gfs2_inode_cachep, GFS2_I(inode));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-extern void free_local_statfs_inodes(struct gfs2_sbd *sdp)</div><div class='add'>+void free_local_statfs_inodes(struct gfs2_sbd *sdp)</div><div class='ctx'> {</div><div class='ctx'> 	struct local_statfs_inode *lsi, *safe;</div><div class='ctx'> </div><div class='hunk'>@@ -1459,8 +1486,8 @@ extern void free_local_statfs_inodes(struct gfs2_sbd *sdp)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-extern struct inode *find_local_statfs_inode(struct gfs2_sbd *sdp,</div><div class='del'>-					     unsigned int index)</div><div class='add'>+struct inode *find_local_statfs_inode(struct gfs2_sbd *sdp,</div><div class='add'>+				      unsigned int index)</div><div class='ctx'> {</div><div class='ctx'> 	struct local_statfs_inode *lsi;</div><div class='ctx'> </div><div class='hunk'>@@ -1481,8 +1508,9 @@ const struct super_operations gfs2_super_ops = {</div><div class='ctx'> 	.evict_inode		= gfs2_evict_inode,</div><div class='ctx'> 	.put_super		= gfs2_put_super,</div><div class='ctx'> 	.sync_fs		= gfs2_sync_fs,</div><div class='del'>-	.freeze_super		= gfs2_freeze,</div><div class='del'>-	.thaw_super		= gfs2_unfreeze,</div><div class='add'>+	.freeze_super		= gfs2_freeze_super,</div><div class='add'>+	.freeze_fs		= gfs2_freeze_fs,</div><div class='add'>+	.thaw_super		= gfs2_thaw_super,</div><div class='ctx'> 	.statfs			= gfs2_statfs,</div><div class='ctx'> 	.drop_inode		= gfs2_drop_inode,</div><div class='ctx'> 	.show_options		= gfs2_show_options,</div><div class='head'>diff --git a/fs/gfs2/super.h b/fs/gfs2/super.h<br/>index 58d13fd77aed..173f1e74c2a9 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/super.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/super.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/super.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/super.h</a></div><div class='hunk'>@@ -15,7 +15,7 @@</div><div class='ctx'> #define GFS2_FS_FORMAT_MIN (1801)</div><div class='ctx'> #define GFS2_FS_FORMAT_MAX (1802)</div><div class='ctx'> </div><div class='del'>-extern void gfs2_lm_unmount(struct gfs2_sbd *sdp);</div><div class='add'>+void gfs2_lm_unmount(struct gfs2_sbd *sdp);</div><div class='ctx'> </div><div class='ctx'> static inline unsigned int gfs2_jindex_size(struct gfs2_sbd *sdp)</div><div class='ctx'> {</div><div class='hunk'>@@ -26,31 +26,32 @@ static inline unsigned int gfs2_jindex_size(struct gfs2_sbd *sdp)</div><div class='ctx'> 	return x;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-extern void gfs2_jindex_free(struct gfs2_sbd *sdp);</div><div class='add'>+void gfs2_jindex_free(struct gfs2_sbd *sdp);</div><div class='ctx'> </div><div class='del'>-extern struct gfs2_jdesc *gfs2_jdesc_find(struct gfs2_sbd *sdp, unsigned int jid);</div><div class='del'>-extern int gfs2_jdesc_check(struct gfs2_jdesc *jd);</div><div class='del'>-extern int gfs2_lookup_in_master_dir(struct gfs2_sbd *sdp, char *filename,</div><div class='del'>-				     struct gfs2_inode **ipp);</div><div class='add'>+struct gfs2_jdesc *gfs2_jdesc_find(struct gfs2_sbd *sdp, unsigned int jid);</div><div class='add'>+int gfs2_jdesc_check(struct gfs2_jdesc *jd);</div><div class='add'>+int gfs2_lookup_in_master_dir(struct gfs2_sbd *sdp, char *filename,</div><div class='add'>+			      struct gfs2_inode **ipp);</div><div class='ctx'> </div><div class='del'>-extern int gfs2_make_fs_rw(struct gfs2_sbd *sdp);</div><div class='del'>-extern void gfs2_make_fs_ro(struct gfs2_sbd *sdp);</div><div class='del'>-extern void gfs2_online_uevent(struct gfs2_sbd *sdp);</div><div class='del'>-extern int gfs2_statfs_init(struct gfs2_sbd *sdp);</div><div class='del'>-extern void gfs2_statfs_change(struct gfs2_sbd *sdp, s64 total, s64 free,</div><div class='del'>-			       s64 dinodes);</div><div class='del'>-extern void gfs2_statfs_change_in(struct gfs2_statfs_change_host *sc,</div><div class='del'>-				  const void *buf);</div><div class='del'>-extern void gfs2_statfs_change_out(const struct gfs2_statfs_change_host *sc,</div><div class='del'>-				   void *buf);</div><div class='del'>-extern void update_statfs(struct gfs2_sbd *sdp, struct buffer_head *m_bh);</div><div class='del'>-extern int gfs2_statfs_sync(struct super_block *sb, int type);</div><div class='del'>-extern void gfs2_freeze_func(struct work_struct *work);</div><div class='add'>+int gfs2_make_fs_rw(struct gfs2_sbd *sdp);</div><div class='add'>+void gfs2_make_fs_ro(struct gfs2_sbd *sdp);</div><div class='add'>+void gfs2_online_uevent(struct gfs2_sbd *sdp);</div><div class='add'>+void gfs2_destroy_threads(struct gfs2_sbd *sdp);</div><div class='add'>+int gfs2_statfs_init(struct gfs2_sbd *sdp);</div><div class='add'>+void gfs2_statfs_change(struct gfs2_sbd *sdp, s64 total, s64 free,</div><div class='add'>+		        s64 dinodes);</div><div class='add'>+void gfs2_statfs_change_in(struct gfs2_statfs_change_host *sc,</div><div class='add'>+			   const void *buf);</div><div class='add'>+void gfs2_statfs_change_out(const struct gfs2_statfs_change_host *sc,</div><div class='add'>+			    void *buf);</div><div class='add'>+void update_statfs(struct gfs2_sbd *sdp, struct buffer_head *m_bh);</div><div class='add'>+int gfs2_statfs_sync(struct super_block *sb, int type);</div><div class='add'>+void gfs2_freeze_func(struct work_struct *work);</div><div class='ctx'> </div><div class='del'>-extern void free_local_statfs_inodes(struct gfs2_sbd *sdp);</div><div class='del'>-extern struct inode *find_local_statfs_inode(struct gfs2_sbd *sdp,</div><div class='del'>-					     unsigned int index);</div><div class='del'>-extern void free_sbd(struct gfs2_sbd *sdp);</div><div class='add'>+void free_local_statfs_inodes(struct gfs2_sbd *sdp);</div><div class='add'>+struct inode *find_local_statfs_inode(struct gfs2_sbd *sdp,</div><div class='add'>+				      unsigned int index);</div><div class='add'>+void free_sbd(struct gfs2_sbd *sdp);</div><div class='ctx'> </div><div class='ctx'> extern struct file_system_type gfs2_fs_type;</div><div class='ctx'> extern struct file_system_type gfs2meta_fs_type;</div><div class='hunk'>@@ -58,8 +59,8 @@ extern const struct export_operations gfs2_export_ops;</div><div class='ctx'> extern const struct super_operations gfs2_super_ops;</div><div class='ctx'> extern const struct dentry_operations gfs2_dops;</div><div class='ctx'> </div><div class='del'>-extern const struct xattr_handler *gfs2_xattr_handlers_max[];</div><div class='del'>-extern const struct xattr_handler **gfs2_xattr_handlers_min;</div><div class='add'>+extern const struct xattr_handler * const gfs2_xattr_handlers_max[];</div><div class='add'>+extern const struct xattr_handler * const *gfs2_xattr_handlers_min;</div><div class='ctx'> </div><div class='ctx'> #endif /* __SUPER_DOT_H__ */</div><div class='ctx'> </div><div class='head'>diff --git a/fs/gfs2/sys.c b/fs/gfs2/sys.c<br/>index c0a34d9ddee4..7051db9dbea0 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/sys.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/sys.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/sys.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/sys.c</a></div><div class='hunk'>@@ -15,7 +15,7 @@</div><div class='ctx'> #include &lt;linux/kobject.h&gt;</div><div class='ctx'> #include &lt;linux/uaccess.h&gt;</div><div class='ctx'> #include &lt;linux/gfs2_ondisk.h&gt;</div><div class='del'>-#include &lt;linux/genhd.h&gt;</div><div class='add'>+#include &lt;linux/blkdev.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "gfs2.h"</div><div class='ctx'> #include "incore.h"</div><div class='hunk'>@@ -59,7 +59,7 @@ static struct kset *gfs2_kset;</div><div class='ctx'> </div><div class='ctx'> static ssize_t id_show(struct gfs2_sbd *sdp, char *buf)</div><div class='ctx'> {</div><div class='del'>-	return snprintf(buf, PAGE_SIZE, "%u:%u\n",</div><div class='add'>+	return sysfs_emit(buf, "%u:%u\n",</div><div class='ctx'> 			MAJOR(sdp-&gt;sd_vfs-&gt;s_dev), MINOR(sdp-&gt;sd_vfs-&gt;s_dev));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -68,7 +68,7 @@ static ssize_t status_show(struct gfs2_sbd *sdp, char *buf)</div><div class='ctx'> 	unsigned long f = sdp-&gt;sd_flags;</div><div class='ctx'> 	ssize_t s;</div><div class='ctx'> </div><div class='del'>-	s = snprintf(buf, PAGE_SIZE,</div><div class='add'>+	s = sysfs_emit(buf,</div><div class='ctx'> 		     "Journal Checked:          %d\n"</div><div class='ctx'> 		     "Journal Live:             %d\n"</div><div class='ctx'> 		     "Journal ID:               %d\n"</div><div class='hunk'>@@ -82,11 +82,9 @@ static ssize_t status_show(struct gfs2_sbd *sdp, char *buf)</div><div class='ctx'> 		     "RO Recovery:              %d\n"</div><div class='ctx'> 		     "Skip DLM Unlock:          %d\n"</div><div class='ctx'> 		     "Force AIL Flush:          %d\n"</div><div class='add'>+		     "FS Freeze Initiator:      %d\n"</div><div class='ctx'> 		     "FS Frozen:                %d\n"</div><div class='del'>-		     "Withdrawing:              %d\n"</div><div class='del'>-		     "Withdraw In Prog:         %d\n"</div><div class='del'>-		     "Remote Withdraw:          %d\n"</div><div class='del'>-		     "Withdraw Recovery:        %d\n"</div><div class='add'>+		     "Killing:                  %d\n"</div><div class='ctx'> 		     "sd_log_error:             %d\n"</div><div class='ctx'> 		     "sd_log_flush_lock:        %d\n"</div><div class='ctx'> 		     "sd_log_num_revoke:        %u\n"</div><div class='hunk'>@@ -96,7 +94,10 @@ static ssize_t status_show(struct gfs2_sbd *sdp, char *buf)</div><div class='ctx'> 		     "sd_log_flush_head:        %d\n"</div><div class='ctx'> 		     "sd_log_flush_tail:        %d\n"</div><div class='ctx'> 		     "sd_log_blks_reserved:     %d\n"</div><div class='del'>-		     "sd_log_revokes_available: %d\n",</div><div class='add'>+		     "sd_log_revokes_available: %d\n"</div><div class='add'>+		     "sd_log_pinned:            %d\n"</div><div class='add'>+		     "sd_log_thresh1:           %d\n"</div><div class='add'>+		     "sd_log_thresh2:           %d\n",</div><div class='ctx'> 		     test_bit(SDF_JOURNAL_CHECKED, &amp;f),</div><div class='ctx'> 		     test_bit(SDF_JOURNAL_LIVE, &amp;f),</div><div class='ctx'> 		     (sdp-&gt;sd_jdesc ? sdp-&gt;sd_jdesc-&gt;jd_jid : 0),</div><div class='hunk'>@@ -110,11 +111,9 @@ static ssize_t status_show(struct gfs2_sbd *sdp, char *buf)</div><div class='ctx'> 		     test_bit(SDF_RORECOVERY, &amp;f),</div><div class='ctx'> 		     test_bit(SDF_SKIP_DLM_UNLOCK, &amp;f),</div><div class='ctx'> 		     test_bit(SDF_FORCE_AIL_FLUSH, &amp;f),</div><div class='del'>-		     test_bit(SDF_FS_FROZEN, &amp;f),</div><div class='del'>-		     test_bit(SDF_WITHDRAWING, &amp;f),</div><div class='del'>-		     test_bit(SDF_WITHDRAW_IN_PROG, &amp;f),</div><div class='del'>-		     test_bit(SDF_REMOTE_WITHDRAW, &amp;f),</div><div class='del'>-		     test_bit(SDF_WITHDRAW_RECOVERY, &amp;f),</div><div class='add'>+		     test_bit(SDF_FREEZE_INITIATOR, &amp;f),</div><div class='add'>+		     test_bit(SDF_FROZEN, &amp;f),</div><div class='add'>+		     test_bit(SDF_KILL, &amp;f),</div><div class='ctx'> 		     sdp-&gt;sd_log_error,</div><div class='ctx'> 		     rwsem_is_locked(&amp;sdp-&gt;sd_log_flush_lock),</div><div class='ctx'> 		     sdp-&gt;sd_log_num_revoke,</div><div class='hunk'>@@ -124,13 +123,16 @@ static ssize_t status_show(struct gfs2_sbd *sdp, char *buf)</div><div class='ctx'> 		     sdp-&gt;sd_log_flush_head,</div><div class='ctx'> 		     sdp-&gt;sd_log_flush_tail,</div><div class='ctx'> 		     sdp-&gt;sd_log_blks_reserved,</div><div class='del'>-		     atomic_read(&amp;sdp-&gt;sd_log_revokes_available));</div><div class='add'>+		     atomic_read(&amp;sdp-&gt;sd_log_revokes_available),</div><div class='add'>+		     atomic_read(&amp;sdp-&gt;sd_log_pinned),</div><div class='add'>+		     atomic_read(&amp;sdp-&gt;sd_log_thresh1),</div><div class='add'>+		     atomic_read(&amp;sdp-&gt;sd_log_thresh2));</div><div class='ctx'> 	return s;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t fsname_show(struct gfs2_sbd *sdp, char *buf)</div><div class='ctx'> {</div><div class='del'>-	return snprintf(buf, PAGE_SIZE, "%s\n", sdp-&gt;sd_fsname);</div><div class='add'>+	return sysfs_emit(buf, "%s\n", sdp-&gt;sd_fsname);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t uuid_show(struct gfs2_sbd *sdp, char *buf)</div><div class='hunk'>@@ -140,7 +142,7 @@ static ssize_t uuid_show(struct gfs2_sbd *sdp, char *buf)</div><div class='ctx'> 	buf[0] = '\0';</div><div class='ctx'> 	if (uuid_is_null(&amp;s-&gt;s_uuid))</div><div class='ctx'> 		return 0;</div><div class='del'>-	return snprintf(buf, PAGE_SIZE, "%pUB\n", &amp;s-&gt;s_uuid);</div><div class='add'>+	return sysfs_emit(buf, "%pUB\n", &amp;s-&gt;s_uuid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t freeze_show(struct gfs2_sbd *sdp, char *buf)</div><div class='hunk'>@@ -148,7 +150,7 @@ static ssize_t freeze_show(struct gfs2_sbd *sdp, char *buf)</div><div class='ctx'> 	struct super_block *sb = sdp-&gt;sd_vfs;</div><div class='ctx'> 	int frozen = (sb-&gt;s_writers.frozen == SB_UNFROZEN) ? 0 : 1;</div><div class='ctx'> </div><div class='del'>-	return snprintf(buf, PAGE_SIZE, "%d\n", frozen);</div><div class='add'>+	return sysfs_emit(buf, "%d\n", frozen);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t freeze_store(struct gfs2_sbd *sdp, const char *buf, size_t len)</div><div class='hunk'>@@ -164,10 +166,10 @@ static ssize_t freeze_store(struct gfs2_sbd *sdp, const char *buf, size_t len)</div><div class='ctx'> </div><div class='ctx'> 	switch (n) {</div><div class='ctx'> 	case 0:</div><div class='del'>-		error = thaw_super(sdp-&gt;sd_vfs);</div><div class='add'>+		error = thaw_super(sdp-&gt;sd_vfs, FREEZE_HOLDER_USERSPACE, NULL);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case 1:</div><div class='del'>-		error = freeze_super(sdp-&gt;sd_vfs);</div><div class='add'>+		error = freeze_super(sdp-&gt;sd_vfs, FREEZE_HOLDER_USERSPACE, NULL);</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		return -EINVAL;</div><div class='hunk'>@@ -184,7 +186,7 @@ static ssize_t freeze_store(struct gfs2_sbd *sdp, const char *buf, size_t len)</div><div class='ctx'> static ssize_t withdraw_show(struct gfs2_sbd *sdp, char *buf)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int b = gfs2_withdrawn(sdp);</div><div class='del'>-	return snprintf(buf, PAGE_SIZE, "%u\n", b);</div><div class='add'>+	return sysfs_emit(buf, "%u\n", b);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t withdraw_store(struct gfs2_sbd *sdp, const char *buf, size_t len)</div><div class='hunk'>@@ -326,7 +328,7 @@ static ssize_t demote_rq_store(struct gfs2_sbd *sdp, const char *buf, size_t len</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	if (!test_and_set_bit(SDF_DEMOTE, &amp;sdp-&gt;sd_flags))</div><div class='ctx'> 		fs_info(sdp, "demote interface used\n");</div><div class='del'>-	rv = gfs2_glock_get(sdp, glnum, glops, 0, &amp;gl);</div><div class='add'>+	rv = gfs2_glock_get(sdp, glnum, glops, NO_CREATE, &amp;gl);</div><div class='ctx'> 	if (rv)</div><div class='ctx'> 		return rv;</div><div class='ctx'> 	gfs2_glock_cb(gl, glmode);</div><div class='hunk'>@@ -387,7 +389,7 @@ static struct kobj_type gfs2_ktype = {</div><div class='ctx'> static ssize_t proto_name_show(struct gfs2_sbd *sdp, char *buf)</div><div class='ctx'> {</div><div class='ctx'> 	const struct lm_lockops *ops = sdp-&gt;sd_lockstruct.ls_ops;</div><div class='del'>-	return sprintf(buf, "%s\n", ops-&gt;lm_proto_name);</div><div class='add'>+	return sysfs_emit(buf, "%s\n", ops-&gt;lm_proto_name);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t block_show(struct gfs2_sbd *sdp, char *buf)</div><div class='hunk'>@@ -398,7 +400,7 @@ static ssize_t block_show(struct gfs2_sbd *sdp, char *buf)</div><div class='ctx'> </div><div class='ctx'> 	if (test_bit(DFL_BLOCK_LOCKS, &amp;ls-&gt;ls_recover_flags))</div><div class='ctx'> 		val = 1;</div><div class='del'>-	ret = sprintf(buf, "%d\n", val);</div><div class='add'>+	ret = sysfs_emit(buf, "%d\n", val);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -423,33 +425,27 @@ static ssize_t block_store(struct gfs2_sbd *sdp, const char *buf, size_t len)</div><div class='ctx'> 	return len;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static ssize_t wdack_show(struct gfs2_sbd *sdp, char *buf)</div><div class='del'>-{</div><div class='del'>-	int val = completion_done(&amp;sdp-&gt;sd_wdack) ? 1 : 0;</div><div class='del'>-</div><div class='del'>-	return sprintf(buf, "%d\n", val);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static ssize_t wdack_store(struct gfs2_sbd *sdp, const char *buf, size_t len)</div><div class='add'>+static ssize_t withdraw_helper_status_store(struct gfs2_sbd *sdp,</div><div class='add'>+					    const char *buf,</div><div class='add'>+					    size_t len)</div><div class='ctx'> {</div><div class='ctx'> 	int ret, val;</div><div class='ctx'> </div><div class='ctx'> 	ret = kstrtoint(buf, 0, &amp;val);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='del'>-</div><div class='del'>-	if ((val == 1) &amp;&amp;</div><div class='del'>-	    !strcmp(sdp-&gt;sd_lockstruct.ls_ops-&gt;lm_proto_name, "lock_dlm"))</div><div class='del'>-		complete(&amp;sdp-&gt;sd_wdack);</div><div class='del'>-	else</div><div class='add'>+	if (val &lt; 0 || val &gt; 1)</div><div class='ctx'> 		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	sdp-&gt;sd_withdraw_helper_status = val;</div><div class='add'>+	complete(&amp;sdp-&gt;sd_withdraw_helper);</div><div class='ctx'> 	return len;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t lkfirst_show(struct gfs2_sbd *sdp, char *buf)</div><div class='ctx'> {</div><div class='ctx'> 	struct lm_lockstruct *ls = &amp;sdp-&gt;sd_lockstruct;</div><div class='del'>-	return sprintf(buf, "%d\n", ls-&gt;ls_first);</div><div class='add'>+	return sysfs_emit(buf, "%d\n", ls-&gt;ls_first);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t lkfirst_store(struct gfs2_sbd *sdp, const char *buf, size_t len)</div><div class='hunk'>@@ -482,7 +478,7 @@ out:</div><div class='ctx'> static ssize_t first_done_show(struct gfs2_sbd *sdp, char *buf)</div><div class='ctx'> {</div><div class='ctx'> 	struct lm_lockstruct *ls = &amp;sdp-&gt;sd_lockstruct;</div><div class='del'>-	return sprintf(buf, "%d\n", !!test_bit(DFL_FIRST_MOUNT_DONE, &amp;ls-&gt;ls_recover_flags));</div><div class='add'>+	return sysfs_emit(buf, "%d\n", !!test_bit(DFL_FIRST_MOUNT_DONE, &amp;ls-&gt;ls_recover_flags));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int gfs2_recover_set(struct gfs2_sbd *sdp, unsigned jid)</div><div class='hunk'>@@ -540,18 +536,18 @@ out:</div><div class='ctx'> static ssize_t recover_done_show(struct gfs2_sbd *sdp, char *buf)</div><div class='ctx'> {</div><div class='ctx'> 	struct lm_lockstruct *ls = &amp;sdp-&gt;sd_lockstruct;</div><div class='del'>-	return sprintf(buf, "%d\n", ls-&gt;ls_recover_jid_done);</div><div class='add'>+	return sysfs_emit(buf, "%d\n", ls-&gt;ls_recover_jid_done);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t recover_status_show(struct gfs2_sbd *sdp, char *buf)</div><div class='ctx'> {</div><div class='ctx'> 	struct lm_lockstruct *ls = &amp;sdp-&gt;sd_lockstruct;</div><div class='del'>-	return sprintf(buf, "%d\n", ls-&gt;ls_recover_jid_status);</div><div class='add'>+	return sysfs_emit(buf, "%d\n", ls-&gt;ls_recover_jid_status);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t jid_show(struct gfs2_sbd *sdp, char *buf)</div><div class='ctx'> {</div><div class='del'>-	return sprintf(buf, "%d\n", sdp-&gt;sd_lockstruct.ls_jid);</div><div class='add'>+	return sysfs_emit(buf, "%d\n", sdp-&gt;sd_lockstruct.ls_jid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t jid_store(struct gfs2_sbd *sdp, const char *buf, size_t len)</div><div class='hunk'>@@ -589,7 +585,7 @@ static struct gfs2_attr gdlm_attr_##_name = __ATTR(_name,_mode,_show,_store)</div><div class='ctx'> </div><div class='ctx'> GDLM_ATTR(proto_name,		0444, proto_name_show,		NULL);</div><div class='ctx'> GDLM_ATTR(block,		0644, block_show,		block_store);</div><div class='del'>-GDLM_ATTR(withdraw,		0644, wdack_show,		wdack_store);</div><div class='add'>+GDLM_ATTR(withdraw,		0200, NULL,			withdraw_helper_status_store);</div><div class='ctx'> GDLM_ATTR(jid,			0644, jid_show,			jid_store);</div><div class='ctx'> GDLM_ATTR(first,		0644, lkfirst_show,		lkfirst_store);</div><div class='ctx'> GDLM_ATTR(first_done,		0444, first_done_show,		NULL);</div><div class='hunk'>@@ -616,7 +612,7 @@ static struct attribute *lock_module_attrs[] = {</div><div class='ctx'> </div><div class='ctx'> static ssize_t quota_scale_show(struct gfs2_sbd *sdp, char *buf)</div><div class='ctx'> {</div><div class='del'>-	return snprintf(buf, PAGE_SIZE, "%u %u\n",</div><div class='add'>+	return sysfs_emit(buf, "%u %u\n",</div><div class='ctx'> 			sdp-&gt;sd_tune.gt_quota_scale_num,</div><div class='ctx'> 			sdp-&gt;sd_tune.gt_quota_scale_den);</div><div class='ctx'> }</div><div class='hunk'>@@ -669,7 +665,7 @@ static struct gfs2_attr tune_attr_##name = __ATTR(name, 0644, show, store)</div><div class='ctx'> #define TUNE_ATTR_2(name, store)                                              \</div><div class='ctx'> static ssize_t name##_show(struct gfs2_sbd *sdp, char *buf)                   \</div><div class='ctx'> {                                                                             \</div><div class='del'>-	return snprintf(buf, PAGE_SIZE, "%u\n", sdp-&gt;sd_tune.gt_##name);      \</div><div class='add'>+	return sysfs_emit(buf, "%u\n", sdp-&gt;sd_tune.gt_##name);               \</div><div class='ctx'> }                                                                             \</div><div class='ctx'> TUNE_ATTR_3(name, name##_show, store)</div><div class='ctx'> </div><div class='hunk'>@@ -688,6 +684,7 @@ TUNE_ATTR(statfs_slow, 0);</div><div class='ctx'> TUNE_ATTR(new_files_jdata, 0);</div><div class='ctx'> TUNE_ATTR(statfs_quantum, 1);</div><div class='ctx'> TUNE_ATTR_3(quota_scale, quota_scale_show, quota_scale_store);</div><div class='add'>+TUNE_ATTR(withdraw_helper_timeout, 1);</div><div class='ctx'> </div><div class='ctx'> static struct attribute *tune_attrs[] = {</div><div class='ctx'> 	&amp;tune_attr_quota_warn_period.attr,</div><div class='hunk'>@@ -698,6 +695,7 @@ static struct attribute *tune_attrs[] = {</div><div class='ctx'> 	&amp;tune_attr_statfs_quantum.attr,</div><div class='ctx'> 	&amp;tune_attr_quota_scale.attr,</div><div class='ctx'> 	&amp;tune_attr_new_files_jdata.attr,</div><div class='add'>+	&amp;tune_attr_withdraw_helper_timeout.attr,</div><div class='ctx'> 	NULL,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -754,7 +752,6 @@ fail_reg:</div><div class='ctx'> 	fs_err(sdp, "error %d adding sysfs files\n", error);</div><div class='ctx'> 	kobject_put(&amp;sdp-&gt;sd_kobj);</div><div class='ctx'> 	wait_for_completion(&amp;sdp-&gt;sd_kobj_unregister);</div><div class='del'>-	sb-&gt;s_fs_info = NULL;</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -767,11 +764,10 @@ void gfs2_sys_fs_del(struct gfs2_sbd *sdp)</div><div class='ctx'> 	wait_for_completion(&amp;sdp-&gt;sd_kobj_unregister);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int gfs2_uevent(struct kset *kset, struct kobject *kobj,</div><div class='del'>-		       struct kobj_uevent_env *env)</div><div class='add'>+static int gfs2_uevent(const struct kobject *kobj, struct kobj_uevent_env *env)</div><div class='ctx'> {</div><div class='del'>-	struct gfs2_sbd *sdp = container_of(kobj, struct gfs2_sbd, sd_kobj);</div><div class='del'>-	struct super_block *s = sdp-&gt;sd_vfs;</div><div class='add'>+	const struct gfs2_sbd *sdp = container_of(kobj, struct gfs2_sbd, sd_kobj);</div><div class='add'>+	const struct super_block *s = sdp-&gt;sd_vfs;</div><div class='ctx'> </div><div class='ctx'> 	add_uevent_var(env, "LOCKTABLE=%s", sdp-&gt;sd_table_name);</div><div class='ctx'> 	add_uevent_var(env, "LOCKPROTO=%s", sdp-&gt;sd_proto_name);</div><div class='head'>diff --git a/fs/gfs2/trace_gfs2.h b/fs/gfs2/trace_gfs2.h<br/>index a5deb9f86831..fcfbf68ec725 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/trace_gfs2.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/trace_gfs2.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/trace_gfs2.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/trace_gfs2.h</a></div><div class='hunk'>@@ -52,13 +52,19 @@</div><div class='ctx'> 	{(1UL &lt;&lt; GLF_DEMOTE_IN_PROGRESS),	"p" },		\</div><div class='ctx'> 	{(1UL &lt;&lt; GLF_DIRTY),			"y" },		\</div><div class='ctx'> 	{(1UL &lt;&lt; GLF_LFLUSH),			"f" },		\</div><div class='del'>-	{(1UL &lt;&lt; GLF_INVALIDATE_IN_PROGRESS),	"i" },		\</div><div class='del'>-	{(1UL &lt;&lt; GLF_REPLY_PENDING),		"r" },		\</div><div class='del'>-	{(1UL &lt;&lt; GLF_INITIAL),			"I" },		\</div><div class='del'>-	{(1UL &lt;&lt; GLF_FROZEN),			"F" },		\</div><div class='add'>+	{(1UL &lt;&lt; GLF_PENDING_REPLY),		"R" },		\</div><div class='add'>+	{(1UL &lt;&lt; GLF_HAVE_REPLY),		"r" },		\</div><div class='add'>+	{(1UL &lt;&lt; GLF_INITIAL),			"a" },		\</div><div class='add'>+	{(1UL &lt;&lt; GLF_HAVE_FROZEN_REPLY),	"F" },		\</div><div class='ctx'> 	{(1UL &lt;&lt; GLF_LRU),			"L" },		\</div><div class='ctx'> 	{(1UL &lt;&lt; GLF_OBJECT),			"o" },		\</div><div class='del'>-	{(1UL &lt;&lt; GLF_BLOCKING),			"b" })</div><div class='add'>+	{(1UL &lt;&lt; GLF_BLOCKING),			"b" },		\</div><div class='add'>+	{(1UL &lt;&lt; GLF_INSTANTIATE_NEEDED),	"n" },		\</div><div class='add'>+	{(1UL &lt;&lt; GLF_INSTANTIATE_IN_PROG),	"N" },		\</div><div class='add'>+	{(1UL &lt;&lt; GLF_TRY_TO_EVICT),		"e" },		\</div><div class='add'>+	{(1UL &lt;&lt; GLF_VERIFY_DELETE),		"E" },		\</div><div class='add'>+	{(1UL &lt;&lt; GLF_DEFER_DELETE),		"s" },		\</div><div class='add'>+	{(1UL &lt;&lt; GLF_CANCELING),		"C" })</div><div class='ctx'> </div><div class='ctx'> #ifndef NUMPTY</div><div class='ctx'> #define NUMPTY</div><div class='head'>diff --git a/fs/gfs2/trans.c b/fs/gfs2/trans.c<br/>index 63fec11ef2ce..6df65540e13d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/trans.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/trans.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/trans.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/trans.c</a></div><div class='hunk'>@@ -49,7 +49,7 @@ int __gfs2_trans_begin(struct gfs2_trans *tr, struct gfs2_sbd *sdp,</div><div class='ctx'> 	}</div><div class='ctx'> 	BUG_ON(blocks == 0 &amp;&amp; revokes == 0);</div><div class='ctx'> </div><div class='del'>-	if (!test_bit(SDF_JOURNAL_LIVE, &amp;sdp-&gt;sd_flags))</div><div class='add'>+	if (gfs2_withdrawn(sdp))</div><div class='ctx'> 		return -EROFS;</div><div class='ctx'> </div><div class='ctx'> 	tr-&gt;tr_ip = ip;</div><div class='hunk'>@@ -85,25 +85,30 @@ int __gfs2_trans_begin(struct gfs2_trans *tr, struct gfs2_sbd *sdp,</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='ctx'> 	down_read(&amp;sdp-&gt;sd_log_flush_lock);</div><div class='add'>+	if (unlikely(!test_bit(SDF_JOURNAL_LIVE, &amp;sdp-&gt;sd_flags)))</div><div class='add'>+		goto out_not_live;</div><div class='ctx'> 	if (gfs2_log_try_reserve(sdp, tr, &amp;extra_revokes))</div><div class='ctx'> 		goto reserved;</div><div class='add'>+</div><div class='ctx'> 	up_read(&amp;sdp-&gt;sd_log_flush_lock);</div><div class='ctx'> 	gfs2_log_reserve(sdp, tr, &amp;extra_revokes);</div><div class='ctx'> 	down_read(&amp;sdp-&gt;sd_log_flush_lock);</div><div class='del'>-</div><div class='del'>-reserved:</div><div class='del'>-	gfs2_log_release_revokes(sdp, extra_revokes);</div><div class='ctx'> 	if (unlikely(!test_bit(SDF_JOURNAL_LIVE, &amp;sdp-&gt;sd_flags))) {</div><div class='del'>-		gfs2_log_release_revokes(sdp, tr-&gt;tr_revokes);</div><div class='del'>-		up_read(&amp;sdp-&gt;sd_log_flush_lock);</div><div class='add'>+		revokes = tr-&gt;tr_revokes + extra_revokes;</div><div class='add'>+		gfs2_log_release_revokes(sdp, revokes);</div><div class='ctx'> 		gfs2_log_release(sdp, tr-&gt;tr_reserved);</div><div class='del'>-		sb_end_intwrite(sdp-&gt;sd_vfs);</div><div class='del'>-		return -EROFS;</div><div class='add'>+		goto out_not_live;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+reserved:</div><div class='add'>+	gfs2_log_release_revokes(sdp, extra_revokes);</div><div class='ctx'> 	current-&gt;journal_info = tr;</div><div class='del'>-</div><div class='ctx'> 	return 0;</div><div class='add'>+</div><div class='add'>+out_not_live:</div><div class='add'>+	up_read(&amp;sdp-&gt;sd_log_flush_lock);</div><div class='add'>+	sb_end_intwrite(sdp-&gt;sd_vfs);</div><div class='add'>+	return -EROFS;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int gfs2_trans_begin(struct gfs2_sbd *sdp, unsigned int blocks,</div><div class='hunk'>@@ -226,14 +231,35 @@ out:</div><div class='ctx'> 	unlock_buffer(bh);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void gfs2_trans_add_databufs(struct gfs2_glock *gl, struct folio *folio,</div><div class='add'>+			     size_t from, size_t len)</div><div class='add'>+{</div><div class='add'>+	struct buffer_head *head = folio_buffers(folio);</div><div class='add'>+	unsigned int bsize = head-&gt;b_size;</div><div class='add'>+	struct buffer_head *bh;</div><div class='add'>+	size_t to = from + len;</div><div class='add'>+	size_t start, end;</div><div class='add'>+</div><div class='add'>+	for (bh = head, start = 0; bh != head || !start;</div><div class='add'>+	     bh = bh-&gt;b_this_page, start = end) {</div><div class='add'>+		end = start + bsize;</div><div class='add'>+		if (end &lt;= from)</div><div class='add'>+			continue;</div><div class='add'>+		if (start &gt;= to)</div><div class='add'>+			break;</div><div class='add'>+		set_buffer_uptodate(bh);</div><div class='add'>+		gfs2_trans_add_data(gl, bh);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> void gfs2_trans_add_meta(struct gfs2_glock *gl, struct buffer_head *bh)</div><div class='ctx'> {</div><div class='ctx'> </div><div class='ctx'> 	struct gfs2_sbd *sdp = gl-&gt;gl_name.ln_sbd;</div><div class='add'>+	struct super_block *sb = sdp-&gt;sd_vfs;</div><div class='ctx'> 	struct gfs2_bufdata *bd;</div><div class='ctx'> 	struct gfs2_meta_header *mh;</div><div class='ctx'> 	struct gfs2_trans *tr = current-&gt;journal_info;</div><div class='del'>-	enum gfs2_freeze_state state = atomic_read(&amp;sdp-&gt;sd_freeze_state);</div><div class='ctx'> </div><div class='ctx'> 	lock_buffer(bh);</div><div class='ctx'> 	if (buffer_pinned(bh)) {</div><div class='hunk'>@@ -245,12 +271,12 @@ void gfs2_trans_add_meta(struct gfs2_glock *gl, struct buffer_head *bh)</div><div class='ctx'> 	if (bd == NULL) {</div><div class='ctx'> 		gfs2_log_unlock(sdp);</div><div class='ctx'> 		unlock_buffer(bh);</div><div class='del'>-		lock_page(bh-&gt;b_page);</div><div class='add'>+		folio_lock(bh-&gt;b_folio);</div><div class='ctx'> 		if (bh-&gt;b_private == NULL)</div><div class='ctx'> 			bd = gfs2_alloc_bufdata(gl, bh);</div><div class='ctx'> 		else</div><div class='ctx'> 			bd = bh-&gt;b_private;</div><div class='del'>-		unlock_page(bh-&gt;b_page);</div><div class='add'>+		folio_unlock(bh-&gt;b_folio);</div><div class='ctx'> 		lock_buffer(bh);</div><div class='ctx'> 		gfs2_log_lock(sdp);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -267,13 +293,15 @@ void gfs2_trans_add_meta(struct gfs2_glock *gl, struct buffer_head *bh)</div><div class='ctx'> 		       (unsigned long long)bd-&gt;bd_bh-&gt;b_blocknr);</div><div class='ctx'> 		BUG();</div><div class='ctx'> 	}</div><div class='del'>-	if (unlikely(state == SFS_FROZEN)) {</div><div class='del'>-		fs_info(sdp, "GFS2:adding buf while frozen\n");</div><div class='del'>-		gfs2_assert_withdraw(sdp, 0);</div><div class='del'>-	}</div><div class='del'>-	if (unlikely(gfs2_withdrawn(sdp))) {</div><div class='add'>+	if (gfs2_withdrawn(sdp)) {</div><div class='ctx'> 		fs_info(sdp, "GFS2:adding buf while withdrawn! 0x%llx\n",</div><div class='ctx'> 			(unsigned long long)bd-&gt;bd_bh-&gt;b_blocknr);</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	}</div><div class='add'>+	if (unlikely(sb-&gt;s_writers.frozen == SB_FREEZE_COMPLETE)) {</div><div class='add'>+		fs_info(sdp, "GFS2:adding buf while frozen\n");</div><div class='add'>+		gfs2_withdraw(sdp);</div><div class='add'>+		goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> 	gfs2_pin(sdp, bd-&gt;bd_bh);</div><div class='ctx'> 	mh-&gt;__pad0 = cpu_to_be64(0);</div><div class='head'>diff --git a/fs/gfs2/trans.h b/fs/gfs2/trans.h<br/>index c76ad9a4c75a..790c55f59e61 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/trans.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/trans.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/trans.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/trans.h</a></div><div class='hunk'>@@ -34,17 +34,19 @@ static inline unsigned int gfs2_rg_blocks(const struct gfs2_inode *ip, unsigned</div><div class='ctx'> 	return rgd-&gt;rd_length;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-extern int __gfs2_trans_begin(struct gfs2_trans *tr, struct gfs2_sbd *sdp,</div><div class='del'>-			      unsigned int blocks, unsigned int revokes,</div><div class='del'>-			      unsigned long ip);</div><div class='del'>-extern int gfs2_trans_begin(struct gfs2_sbd *sdp, unsigned int blocks,</div><div class='del'>-			    unsigned int revokes);</div><div class='del'>-</div><div class='del'>-extern void gfs2_trans_end(struct gfs2_sbd *sdp);</div><div class='del'>-extern void gfs2_trans_add_data(struct gfs2_glock *gl, struct buffer_head *bh);</div><div class='del'>-extern void gfs2_trans_add_meta(struct gfs2_glock *gl, struct buffer_head *bh);</div><div class='del'>-extern void gfs2_trans_add_revoke(struct gfs2_sbd *sdp, struct gfs2_bufdata *bd);</div><div class='del'>-extern void gfs2_trans_remove_revoke(struct gfs2_sbd *sdp, u64 blkno, unsigned int len);</div><div class='del'>-extern void gfs2_trans_free(struct gfs2_sbd *sdp, struct gfs2_trans *tr);</div><div class='add'>+int __gfs2_trans_begin(struct gfs2_trans *tr, struct gfs2_sbd *sdp,</div><div class='add'>+		       unsigned int blocks, unsigned int revokes,</div><div class='add'>+		       unsigned long ip);</div><div class='add'>+int gfs2_trans_begin(struct gfs2_sbd *sdp, unsigned int blocks,</div><div class='add'>+		     unsigned int revokes);</div><div class='add'>+</div><div class='add'>+void gfs2_trans_end(struct gfs2_sbd *sdp);</div><div class='add'>+void gfs2_trans_add_data(struct gfs2_glock *gl, struct buffer_head *bh);</div><div class='add'>+void gfs2_trans_add_databufs(struct gfs2_glock *gl, struct folio *folio,</div><div class='add'>+			     size_t from, size_t len);</div><div class='add'>+void gfs2_trans_add_meta(struct gfs2_glock *gl, struct buffer_head *bh);</div><div class='add'>+void gfs2_trans_add_revoke(struct gfs2_sbd *sdp, struct gfs2_bufdata *bd);</div><div class='add'>+void gfs2_trans_remove_revoke(struct gfs2_sbd *sdp, u64 blkno, unsigned int len);</div><div class='add'>+void gfs2_trans_free(struct gfs2_sbd *sdp, struct gfs2_trans *tr);</div><div class='ctx'> </div><div class='ctx'> #endif /* __TRANS_DOT_H__ */</div><div class='head'>diff --git a/fs/gfs2/util.c b/fs/gfs2/util.c<br/>index 8241029a2a5d..02603200846d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/util.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/util.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/util.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/util.c</a></div><div class='hunk'>@@ -9,6 +9,7 @@</div><div class='ctx'> #include &lt;linux/spinlock.h&gt;</div><div class='ctx'> #include &lt;linux/completion.h&gt;</div><div class='ctx'> #include &lt;linux/buffer_head.h&gt;</div><div class='add'>+#include &lt;linux/kthread.h&gt;</div><div class='ctx'> #include &lt;linux/crc32.h&gt;</div><div class='ctx'> #include &lt;linux/gfs2_ondisk.h&gt;</div><div class='ctx'> #include &lt;linux/delay.h&gt;</div><div class='hunk'>@@ -57,7 +58,7 @@ int check_journal_clean(struct gfs2_sbd *sdp, struct gfs2_jdesc *jd,</div><div class='ctx'> 	struct gfs2_inode *ip;</div><div class='ctx'> </div><div class='ctx'> 	ip = GFS2_I(jd-&gt;jd_inode);</div><div class='del'>-	error = gfs2_glock_nq_init(ip-&gt;i_gl, LM_ST_SHARED, LM_FLAG_NOEXP |</div><div class='add'>+	error = gfs2_glock_nq_init(ip-&gt;i_gl, LM_ST_SHARED, LM_FLAG_RECOVER |</div><div class='ctx'> 				   GL_EXACT | GL_NOCACHE, &amp;j_gh);</div><div class='ctx'> 	if (error) {</div><div class='ctx'> 		if (verbose)</div><div class='hunk'>@@ -72,7 +73,7 @@ int check_journal_clean(struct gfs2_sbd *sdp, struct gfs2_jdesc *jd,</div><div class='ctx'> 			       "mount.\n");</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	}</div><div class='del'>-	error = gfs2_find_jhead(jd, &amp;head, false);</div><div class='add'>+	error = gfs2_find_jhead(jd, &amp;head);</div><div class='ctx'> 	if (error) {</div><div class='ctx'> 		if (verbose)</div><div class='ctx'> 			fs_err(sdp, "Error parsing journal for spectator "</div><div class='hunk'>@@ -93,214 +94,53 @@ out_unlock:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * gfs2_freeze_lock - hold the freeze glock</div><div class='add'>+ * gfs2_freeze_lock_shared - hold the freeze glock</div><div class='ctx'>  * @sdp: the superblock</div><div class='del'>- * @freeze_gh: pointer to the requested holder</div><div class='del'>- * @caller_flags: any additional flags needed by the caller</div><div class='ctx'>  */</div><div class='del'>-int gfs2_freeze_lock(struct gfs2_sbd *sdp, struct gfs2_holder *freeze_gh,</div><div class='del'>-		     int caller_flags)</div><div class='add'>+int gfs2_freeze_lock_shared(struct gfs2_sbd *sdp)</div><div class='ctx'> {</div><div class='del'>-	int flags = LM_FLAG_NOEXP | GL_EXACT | caller_flags;</div><div class='add'>+	int flags = LM_FLAG_RECOVER | GL_EXACT;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='ctx'> 	error = gfs2_glock_nq_init(sdp-&gt;sd_freeze_gl, LM_ST_SHARED, flags,</div><div class='del'>-				   freeze_gh);</div><div class='add'>+				   &amp;sdp-&gt;sd_freeze_gh);</div><div class='ctx'> 	if (error &amp;&amp; error != GLR_TRYFAILED)</div><div class='del'>-		fs_err(sdp, "can't lock the freeze lock: %d\n", error);</div><div class='add'>+		fs_err(sdp, "can't lock the freeze glock: %d\n", error);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void gfs2_freeze_unlock(struct gfs2_holder *freeze_gh)</div><div class='add'>+void gfs2_freeze_unlock(struct gfs2_sbd *sdp)</div><div class='ctx'> {</div><div class='del'>-	if (gfs2_holder_initialized(freeze_gh))</div><div class='del'>-		gfs2_glock_dq_uninit(freeze_gh);</div><div class='add'>+	if (gfs2_holder_initialized(&amp;sdp-&gt;sd_freeze_gh))</div><div class='add'>+		gfs2_glock_dq_uninit(&amp;sdp-&gt;sd_freeze_gh);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void signal_our_withdraw(struct gfs2_sbd *sdp)</div><div class='add'>+static void do_withdraw(struct gfs2_sbd *sdp)</div><div class='ctx'> {</div><div class='del'>-	struct gfs2_glock *live_gl = sdp-&gt;sd_live_gh.gh_gl;</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	struct gfs2_inode *ip;</div><div class='del'>-	struct gfs2_glock *i_gl;</div><div class='del'>-	u64 no_formal_ino;</div><div class='del'>-	int log_write_allowed = test_bit(SDF_JOURNAL_LIVE, &amp;sdp-&gt;sd_flags);</div><div class='del'>-	int ret = 0;</div><div class='del'>-	int tries;</div><div class='del'>-</div><div class='del'>-	if (test_bit(SDF_NORECOVERY, &amp;sdp-&gt;sd_flags) || !sdp-&gt;sd_jdesc)</div><div class='add'>+	down_write(&amp;sdp-&gt;sd_log_flush_lock);</div><div class='add'>+	if (!test_bit(SDF_JOURNAL_LIVE, &amp;sdp-&gt;sd_flags)) {</div><div class='add'>+		up_write(&amp;sdp-&gt;sd_log_flush_lock);</div><div class='ctx'> 		return;</div><div class='del'>-</div><div class='del'>-	gfs2_ail_drain(sdp); /* frees all transactions */</div><div class='del'>-	inode = sdp-&gt;sd_jdesc-&gt;jd_inode;</div><div class='del'>-	ip = GFS2_I(inode);</div><div class='del'>-	i_gl = ip-&gt;i_gl;</div><div class='del'>-	no_formal_ino = ip-&gt;i_no_formal_ino;</div><div class='del'>-</div><div class='del'>-	/* Prevent any glock dq until withdraw recovery is complete */</div><div class='del'>-	set_bit(SDF_WITHDRAW_RECOVERY, &amp;sdp-&gt;sd_flags);</div><div class='del'>-	/*</div><div class='del'>-	 * Don't tell dlm we're bailing until we have no more buffers in the</div><div class='del'>-	 * wind. If journal had an IO error, the log code should just purge</div><div class='del'>-	 * the outstanding buffers rather than submitting new IO. Making the</div><div class='del'>-	 * file system read-only will flush the journal, etc.</div><div class='del'>-	 *</div><div class='del'>-	 * During a normal unmount, gfs2_make_fs_ro calls gfs2_log_shutdown</div><div class='del'>-	 * which clears SDF_JOURNAL_LIVE. In a withdraw, we must not write</div><div class='del'>-	 * any UNMOUNT log header, so we can't call gfs2_log_shutdown, and</div><div class='del'>-	 * therefore we need to clear SDF_JOURNAL_LIVE manually.</div><div class='del'>-	 */</div><div class='del'>-	clear_bit(SDF_JOURNAL_LIVE, &amp;sdp-&gt;sd_flags);</div><div class='del'>-	if (!sb_rdonly(sdp-&gt;sd_vfs)) {</div><div class='del'>-		struct gfs2_holder freeze_gh;</div><div class='del'>-</div><div class='del'>-		gfs2_holder_mark_uninitialized(&amp;freeze_gh);</div><div class='del'>-		if (sdp-&gt;sd_freeze_gl &amp;&amp;</div><div class='del'>-		    !gfs2_glock_is_locked_by_me(sdp-&gt;sd_freeze_gl)) {</div><div class='del'>-			ret = gfs2_freeze_lock(sdp, &amp;freeze_gh,</div><div class='del'>-				       log_write_allowed ? 0 : LM_FLAG_TRY);</div><div class='del'>-			if (ret == GLR_TRYFAILED)</div><div class='del'>-				ret = 0;</div><div class='del'>-		}</div><div class='del'>-		if (!ret)</div><div class='del'>-			gfs2_make_fs_ro(sdp);</div><div class='del'>-		gfs2_freeze_unlock(&amp;freeze_gh);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (sdp-&gt;sd_lockstruct.ls_ops-&gt;lm_lock == NULL) { /* lock_nolock */</div><div class='del'>-		if (!ret)</div><div class='del'>-			ret = -EIO;</div><div class='del'>-		clear_bit(SDF_WITHDRAW_RECOVERY, &amp;sdp-&gt;sd_flags);</div><div class='del'>-		goto skip_recovery;</div><div class='del'>-	}</div><div class='del'>-	/*</div><div class='del'>-	 * Drop the glock for our journal so another node can recover it.</div><div class='del'>-	 */</div><div class='del'>-	if (gfs2_holder_initialized(&amp;sdp-&gt;sd_journal_gh)) {</div><div class='del'>-		gfs2_glock_dq_wait(&amp;sdp-&gt;sd_journal_gh);</div><div class='del'>-		gfs2_holder_uninit(&amp;sdp-&gt;sd_journal_gh);</div><div class='del'>-	}</div><div class='del'>-	sdp-&gt;sd_jinode_gh.gh_flags |= GL_NOCACHE;</div><div class='del'>-	gfs2_glock_dq(&amp;sdp-&gt;sd_jinode_gh);</div><div class='del'>-	if (test_bit(SDF_FS_FROZEN, &amp;sdp-&gt;sd_flags)) {</div><div class='del'>-		/* Make sure gfs2_unfreeze works if partially-frozen */</div><div class='del'>-		flush_work(&amp;sdp-&gt;sd_freeze_work);</div><div class='del'>-		atomic_set(&amp;sdp-&gt;sd_freeze_state, SFS_FROZEN);</div><div class='del'>-		thaw_super(sdp-&gt;sd_vfs);</div><div class='del'>-	} else {</div><div class='del'>-		wait_on_bit(&amp;i_gl-&gt;gl_flags, GLF_DEMOTE,</div><div class='del'>-			    TASK_UNINTERRUPTIBLE);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * holder_uninit to force glock_put, to force dlm to let go</div><div class='del'>-	 */</div><div class='del'>-	gfs2_holder_uninit(&amp;sdp-&gt;sd_jinode_gh);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Note: We need to be careful here:</div><div class='del'>-	 * Our iput of jd_inode will evict it. The evict will dequeue its</div><div class='del'>-	 * glock, but the glock dq will wait for the withdraw unless we have</div><div class='del'>-	 * exception code in glock_dq.</div><div class='del'>-	 */</div><div class='del'>-	iput(inode);</div><div class='del'>-	/*</div><div class='del'>-	 * Wait until the journal inode's glock is freed. This allows try locks</div><div class='del'>-	 * on other nodes to be successful, otherwise we remain the owner of</div><div class='del'>-	 * the glock as far as dlm is concerned.</div><div class='del'>-	 */</div><div class='del'>-	if (i_gl-&gt;gl_ops-&gt;go_free) {</div><div class='del'>-		set_bit(GLF_FREEING, &amp;i_gl-&gt;gl_flags);</div><div class='del'>-		wait_on_bit(&amp;i_gl-&gt;gl_flags, GLF_FREEING, TASK_UNINTERRUPTIBLE);</div><div class='ctx'> 	}</div><div class='add'>+	clear_bit(SDF_JOURNAL_LIVE, &amp;sdp-&gt;sd_flags);</div><div class='add'>+	up_write(&amp;sdp-&gt;sd_log_flush_lock);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Dequeue the "live" glock, but keep a reference so it's never freed.</div><div class='del'>-	 */</div><div class='del'>-	gfs2_glock_hold(live_gl);</div><div class='del'>-	gfs2_glock_dq_wait(&amp;sdp-&gt;sd_live_gh);</div><div class='del'>-	/*</div><div class='del'>-	 * We enqueue the "live" glock in EX so that all other nodes</div><div class='del'>-	 * get a demote request and act on it. We don't really want the</div><div class='del'>-	 * lock in EX, so we send a "try" lock with 1CB to produce a callback.</div><div class='del'>-	 */</div><div class='del'>-	fs_warn(sdp, "Requesting recovery of jid %d.\n",</div><div class='del'>-		sdp-&gt;sd_lockstruct.ls_jid);</div><div class='del'>-	gfs2_holder_reinit(LM_ST_EXCLUSIVE, LM_FLAG_TRY_1CB | LM_FLAG_NOEXP,</div><div class='del'>-			   &amp;sdp-&gt;sd_live_gh);</div><div class='del'>-	msleep(GL_GLOCK_MAX_HOLD);</div><div class='del'>-	/*</div><div class='del'>-	 * This will likely fail in a cluster, but succeed standalone:</div><div class='del'>-	 */</div><div class='del'>-	ret = gfs2_glock_nq(&amp;sdp-&gt;sd_live_gh);</div><div class='add'>+	gfs2_ail_drain(sdp); /* frees all transactions */</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * If we actually got the "live" lock in EX mode, there are no other</div><div class='del'>-	 * nodes available to replay our journal. So we try to replay it</div><div class='del'>-	 * ourselves. We hold the "live" glock to prevent other mounters</div><div class='del'>-	 * during recovery, then just dequeue it and reacquire it in our</div><div class='del'>-	 * normal SH mode. Just in case the problem that caused us to</div><div class='del'>-	 * withdraw prevents us from recovering our journal (e.g. io errors</div><div class='del'>-	 * and such) we still check if the journal is clean before proceeding</div><div class='del'>-	 * but we may wait forever until another mounter does the recovery.</div><div class='del'>-	 */</div><div class='del'>-	if (ret == 0) {</div><div class='del'>-		fs_warn(sdp, "No other mounters found. Trying to recover our "</div><div class='del'>-			"own journal jid %d.\n", sdp-&gt;sd_lockstruct.ls_jid);</div><div class='del'>-		if (gfs2_recover_journal(sdp-&gt;sd_jdesc, 1))</div><div class='del'>-			fs_warn(sdp, "Unable to recover our journal jid %d.\n",</div><div class='del'>-				sdp-&gt;sd_lockstruct.ls_jid);</div><div class='del'>-		gfs2_glock_dq_wait(&amp;sdp-&gt;sd_live_gh);</div><div class='del'>-		gfs2_holder_reinit(LM_ST_SHARED, LM_FLAG_NOEXP | GL_EXACT,</div><div class='del'>-				   &amp;sdp-&gt;sd_live_gh);</div><div class='del'>-		gfs2_glock_nq(&amp;sdp-&gt;sd_live_gh);</div><div class='del'>-	}</div><div class='add'>+	wake_up(&amp;sdp-&gt;sd_logd_waitq);</div><div class='add'>+	wake_up(&amp;sdp-&gt;sd_quota_wait);</div><div class='ctx'> </div><div class='del'>-	gfs2_glock_queue_put(live_gl); /* drop extra reference we acquired */</div><div class='del'>-	clear_bit(SDF_WITHDRAW_RECOVERY, &amp;sdp-&gt;sd_flags);</div><div class='add'>+	wait_event_timeout(sdp-&gt;sd_log_waitq,</div><div class='add'>+			   gfs2_log_is_empty(sdp),</div><div class='add'>+			   HZ * 5);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * At this point our journal is evicted, so we need to get a new inode</div><div class='del'>-	 * for it. Once done, we need to call gfs2_find_jhead which</div><div class='del'>-	 * calls gfs2_map_journal_extents to map it for us again.</div><div class='del'>-	 *</div><div class='del'>-	 * Note that we don't really want it to look up a FREE block. The</div><div class='del'>-	 * GFS2_BLKST_FREE simply overrides a block check in gfs2_inode_lookup</div><div class='del'>-	 * which would otherwise fail because it requires grabbing an rgrp</div><div class='del'>-	 * glock, which would fail with -EIO because we're withdrawing.</div><div class='del'>-	 */</div><div class='del'>-	inode = gfs2_inode_lookup(sdp-&gt;sd_vfs, DT_UNKNOWN,</div><div class='del'>-				  sdp-&gt;sd_jdesc-&gt;jd_no_addr, no_formal_ino,</div><div class='del'>-				  GFS2_BLKST_FREE);</div><div class='del'>-	if (IS_ERR(inode)) {</div><div class='del'>-		fs_warn(sdp, "Reprocessing of jid %d failed with %ld.\n",</div><div class='del'>-			sdp-&gt;sd_lockstruct.ls_jid, PTR_ERR(inode));</div><div class='del'>-		goto skip_recovery;</div><div class='del'>-	}</div><div class='del'>-	sdp-&gt;sd_jdesc-&gt;jd_inode = inode;</div><div class='del'>-	d_mark_dontcache(inode);</div><div class='add'>+	sdp-&gt;sd_vfs-&gt;s_flags |= SB_RDONLY;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Now wait until recovery is complete.</div><div class='add'>+	 * Dequeue any pending non-system glock holders that can no</div><div class='add'>+	 * longer be granted because the file system is withdrawn.</div><div class='ctx'> 	 */</div><div class='del'>-	for (tries = 0; tries &lt; 10; tries++) {</div><div class='del'>-		ret = check_journal_clean(sdp, sdp-&gt;sd_jdesc, false);</div><div class='del'>-		if (!ret)</div><div class='del'>-			break;</div><div class='del'>-		msleep(HZ);</div><div class='del'>-		fs_warn(sdp, "Waiting for journal recovery jid %d.\n",</div><div class='del'>-			sdp-&gt;sd_lockstruct.ls_jid);</div><div class='del'>-	}</div><div class='del'>-skip_recovery:</div><div class='del'>-	if (!ret)</div><div class='del'>-		fs_warn(sdp, "Journal recovery complete for jid %d.\n",</div><div class='del'>-			sdp-&gt;sd_lockstruct.ls_jid);</div><div class='del'>-	else</div><div class='del'>-		fs_warn(sdp, "Journal recovery skipped for jid %d until next "</div><div class='del'>-			"mount.\n", sdp-&gt;sd_lockstruct.ls_jid);</div><div class='del'>-	fs_warn(sdp, "Glock dequeues delayed: %lu\n", sdp-&gt;sd_glock_dqs_held);</div><div class='del'>-	sdp-&gt;sd_glock_dqs_held = 0;</div><div class='del'>-	wake_up_bit(&amp;sdp-&gt;sd_flags, SDF_WITHDRAW_RECOVERY);</div><div class='add'>+	gfs2_withdraw_glocks(sdp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void gfs2_lm(struct gfs2_sbd *sdp, const char *fmt, ...)</div><div class='hunk'>@@ -319,50 +159,108 @@ void gfs2_lm(struct gfs2_sbd *sdp, const char *fmt, ...)</div><div class='ctx'> 	va_end(args);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int gfs2_withdraw(struct gfs2_sbd *sdp)</div><div class='add'>+/**</div><div class='add'>+ * gfs2_offline_uevent - run gfs2_withdraw_helper</div><div class='add'>+ * @sdp: The GFS2 superblock</div><div class='add'>+ */</div><div class='add'>+static bool gfs2_offline_uevent(struct gfs2_sbd *sdp)</div><div class='ctx'> {</div><div class='ctx'> 	struct lm_lockstruct *ls = &amp;sdp-&gt;sd_lockstruct;</div><div class='del'>-	const struct lm_lockops *lm = ls-&gt;ls_ops;</div><div class='add'>+	long timeout;</div><div class='ctx'> </div><div class='del'>-	if (sdp-&gt;sd_args.ar_errors == GFS2_ERRORS_WITHDRAW &amp;&amp;</div><div class='del'>-	    test_and_set_bit(SDF_WITHDRAWN, &amp;sdp-&gt;sd_flags)) {</div><div class='del'>-		if (!test_bit(SDF_WITHDRAW_IN_PROG, &amp;sdp-&gt;sd_flags))</div><div class='del'>-			return -1;</div><div class='add'>+	/* Skip protocol "lock_nolock" which doesn't require shared storage. */</div><div class='add'>+	if (!ls-&gt;ls_ops-&gt;lm_lock)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The gfs2_withdraw_helper replies by writing one of the following</div><div class='add'>+	 * status codes to "/sys$DEVPATH/lock_module/withdraw":</div><div class='add'>+	 *</div><div class='add'>+	 * 0 - The shared block device has been marked inactive.  Future write</div><div class='add'>+	 *     operations will fail.</div><div class='add'>+	 *</div><div class='add'>+	 * 1 - The shared block device may still be active and carry out</div><div class='add'>+	 *     write operations.</div><div class='add'>+	 *</div><div class='add'>+	 * If the "offline" uevent isn't reacted upon in time, the event</div><div class='add'>+	 * handler is assumed to have failed.</div><div class='add'>+	 */</div><div class='ctx'> </div><div class='del'>-		wait_on_bit(&amp;sdp-&gt;sd_flags, SDF_WITHDRAW_IN_PROG,</div><div class='del'>-			    TASK_UNINTERRUPTIBLE);</div><div class='del'>-		return -1;</div><div class='add'>+	sdp-&gt;sd_withdraw_helper_status = -1;</div><div class='add'>+	kobject_uevent(&amp;sdp-&gt;sd_kobj, KOBJ_OFFLINE);</div><div class='add'>+	timeout = gfs2_tune_get(sdp, gt_withdraw_helper_timeout) * HZ;</div><div class='add'>+	wait_for_completion_timeout(&amp;sdp-&gt;sd_withdraw_helper, timeout);</div><div class='add'>+	if (sdp-&gt;sd_withdraw_helper_status == -1) {</div><div class='add'>+		fs_err(sdp, "%s timed out\n", "gfs2_withdraw_helper");</div><div class='add'>+	} else {</div><div class='add'>+		fs_err(sdp, "%s %s with status %d\n",</div><div class='add'>+		       "gfs2_withdraw_helper",</div><div class='add'>+		       sdp-&gt;sd_withdraw_helper_status == 0 ?</div><div class='add'>+		       "succeeded" : "failed",</div><div class='add'>+		       sdp-&gt;sd_withdraw_helper_status);</div><div class='ctx'> 	}</div><div class='add'>+	return sdp-&gt;sd_withdraw_helper_status == 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	set_bit(SDF_WITHDRAW_IN_PROG, &amp;sdp-&gt;sd_flags);</div><div class='add'>+void gfs2_withdraw_func(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct gfs2_sbd *sdp = container_of(work, struct gfs2_sbd, sd_withdraw_work);</div><div class='add'>+	struct lm_lockstruct *ls = &amp;sdp-&gt;sd_lockstruct;</div><div class='add'>+	const struct lm_lockops *lm = ls-&gt;ls_ops;</div><div class='add'>+	bool device_inactive;</div><div class='ctx'> </div><div class='del'>-	if (sdp-&gt;sd_args.ar_errors == GFS2_ERRORS_WITHDRAW) {</div><div class='del'>-		fs_err(sdp, "about to withdraw this file system\n");</div><div class='del'>-		BUG_ON(sdp-&gt;sd_args.ar_debug);</div><div class='add'>+	if (test_bit(SDF_KILL, &amp;sdp-&gt;sd_flags))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-		signal_our_withdraw(sdp);</div><div class='add'>+	BUG_ON(sdp-&gt;sd_args.ar_debug);</div><div class='ctx'> </div><div class='del'>-		kobject_uevent(&amp;sdp-&gt;sd_kobj, KOBJ_OFFLINE);</div><div class='add'>+	/*</div><div class='add'>+	 * Try to deactivate the shared block device so that no more I/O will</div><div class='add'>+	 * go through.  If successful, we can immediately trigger remote</div><div class='add'>+	 * recovery.  Otherwise, we must first empty out all our local caches.</div><div class='add'>+	 */</div><div class='ctx'> </div><div class='del'>-		if (!strcmp(sdp-&gt;sd_lockstruct.ls_ops-&gt;lm_proto_name, "lock_dlm"))</div><div class='del'>-			wait_for_completion(&amp;sdp-&gt;sd_wdack);</div><div class='add'>+	device_inactive = gfs2_offline_uevent(sdp);</div><div class='ctx'> </div><div class='del'>-		if (lm-&gt;lm_unmount) {</div><div class='del'>-			fs_err(sdp, "telling LM to unmount\n");</div><div class='del'>-			lm-&gt;lm_unmount(sdp);</div><div class='add'>+	if (sdp-&gt;sd_args.ar_errors == GFS2_ERRORS_DEACTIVATE &amp;&amp; !device_inactive)</div><div class='add'>+		panic("GFS2: fsid=%s: panic requested\n", sdp-&gt;sd_fsname);</div><div class='add'>+</div><div class='add'>+	if (lm-&gt;lm_unmount) {</div><div class='add'>+		if (device_inactive) {</div><div class='add'>+			lm-&gt;lm_unmount(sdp, false);</div><div class='add'>+			do_withdraw(sdp);</div><div class='add'>+		} else {</div><div class='add'>+			do_withdraw(sdp);</div><div class='add'>+			lm-&gt;lm_unmount(sdp, false);</div><div class='ctx'> 		}</div><div class='del'>-		set_bit(SDF_SKIP_DLM_UNLOCK, &amp;sdp-&gt;sd_flags);</div><div class='del'>-		fs_err(sdp, "File system withdrawn\n");</div><div class='add'>+	} else {</div><div class='add'>+		do_withdraw(sdp);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	fs_err(sdp, "file system withdrawn\n");</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void gfs2_withdraw(struct gfs2_sbd *sdp)</div><div class='add'>+{</div><div class='add'>+	if (sdp-&gt;sd_args.ar_errors == GFS2_ERRORS_WITHDRAW ||</div><div class='add'>+	    sdp-&gt;sd_args.ar_errors == GFS2_ERRORS_DEACTIVATE) {</div><div class='add'>+		if (test_and_set_bit(SDF_WITHDRAWN, &amp;sdp-&gt;sd_flags))</div><div class='add'>+			return;</div><div class='add'>+</div><div class='ctx'> 		dump_stack();</div><div class='del'>-		clear_bit(SDF_WITHDRAW_IN_PROG, &amp;sdp-&gt;sd_flags);</div><div class='del'>-		smp_mb__after_atomic();</div><div class='del'>-		wake_up_bit(&amp;sdp-&gt;sd_flags, SDF_WITHDRAW_IN_PROG);</div><div class='add'>+		/*</div><div class='add'>+		 * There is no need to withdraw when the superblock hasn't been</div><div class='add'>+		 * fully initialized, yet.</div><div class='add'>+		 */</div><div class='add'>+		if (!(sdp-&gt;sd_vfs-&gt;s_flags &amp; SB_BORN))</div><div class='add'>+			return;</div><div class='add'>+		fs_err(sdp, "about to withdraw this file system\n");</div><div class='add'>+		schedule_work(&amp;sdp-&gt;sd_withdraw_work);</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (sdp-&gt;sd_args.ar_errors == GFS2_ERRORS_PANIC)</div><div class='ctx'> 		panic("GFS2: fsid=%s: panic requested\n", sdp-&gt;sd_fsname);</div><div class='del'>-</div><div class='del'>-	return -1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -370,28 +268,17 @@ int gfs2_withdraw(struct gfs2_sbd *sdp)</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> void gfs2_assert_withdraw_i(struct gfs2_sbd *sdp, char *assertion,</div><div class='del'>-			    const char *function, char *file, unsigned int line,</div><div class='del'>-			    bool delayed)</div><div class='add'>+			    const char *function, char *file, unsigned int line)</div><div class='ctx'> {</div><div class='ctx'> 	if (gfs2_withdrawn(sdp))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	fs_err(sdp,</div><div class='del'>-	       "fatal: assertion \"%s\" failed\n"</div><div class='del'>-	       "   function = %s, file = %s, line = %u\n",</div><div class='add'>+	       "fatal: assertion \"%s\" failed - "</div><div class='add'>+	       "function = %s, file = %s, line = %u\n",</div><div class='ctx'> 	       assertion, function, file, line);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * If errors=panic was specified on mount, it won't help to delay the</div><div class='del'>-	 * withdraw.</div><div class='del'>-	 */</div><div class='del'>-	if (sdp-&gt;sd_args.ar_errors == GFS2_ERRORS_PANIC)</div><div class='del'>-		delayed = false;</div><div class='del'>-</div><div class='del'>-	if (delayed)</div><div class='del'>-		gfs2_withdraw_delayed(sdp);</div><div class='del'>-	else</div><div class='del'>-		gfs2_withdraw(sdp);</div><div class='add'>+	gfs2_withdraw(sdp);</div><div class='ctx'> 	dump_stack();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -408,7 +295,8 @@ void gfs2_assert_warn_i(struct gfs2_sbd *sdp, char *assertion,</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	if (sdp-&gt;sd_args.ar_errors == GFS2_ERRORS_WITHDRAW)</div><div class='del'>-		fs_warn(sdp, "warning: assertion \"%s\" failed at function = %s, file = %s, line = %u\n",</div><div class='add'>+		fs_warn(sdp, "warning: assertion \"%s\" failed - "</div><div class='add'>+			"function = %s, file = %s, line = %u\n",</div><div class='ctx'> 			assertion, function, file, line);</div><div class='ctx'> </div><div class='ctx'> 	if (sdp-&gt;sd_args.ar_debug)</div><div class='hunk'>@@ -417,10 +305,10 @@ void gfs2_assert_warn_i(struct gfs2_sbd *sdp, char *assertion,</div><div class='ctx'> 		dump_stack();</div><div class='ctx'> </div><div class='ctx'> 	if (sdp-&gt;sd_args.ar_errors == GFS2_ERRORS_PANIC)</div><div class='del'>-		panic("GFS2: fsid=%s: warning: assertion \"%s\" failed\n"</div><div class='del'>-		      "GFS2: fsid=%s:   function = %s, file = %s, line = %u\n",</div><div class='add'>+		panic("GFS2: fsid=%s: warning: assertion \"%s\" failed - "</div><div class='add'>+		      "function = %s, file = %s, line = %u\n",</div><div class='ctx'> 		      sdp-&gt;sd_fsname, assertion,</div><div class='del'>-		      sdp-&gt;sd_fsname, function, file, line);</div><div class='add'>+		      function, file, line);</div><div class='ctx'> </div><div class='ctx'> 	sdp-&gt;sd_last_warning = jiffies;</div><div class='ctx'> }</div><div class='hunk'>@@ -433,7 +321,8 @@ void gfs2_consist_i(struct gfs2_sbd *sdp, const char *function,</div><div class='ctx'> 		    char *file, unsigned int line)</div><div class='ctx'> {</div><div class='ctx'> 	gfs2_lm(sdp,</div><div class='del'>-		"fatal: filesystem consistency error - function = %s, file = %s, line = %u\n",</div><div class='add'>+		"fatal: filesystem consistency error - "</div><div class='add'>+		"function = %s, file = %s, line = %u\n",</div><div class='ctx'> 		function, file, line);</div><div class='ctx'> 	gfs2_withdraw(sdp);</div><div class='ctx'> }</div><div class='hunk'>@@ -448,9 +337,9 @@ void gfs2_consist_inode_i(struct gfs2_inode *ip,</div><div class='ctx'> 	struct gfs2_sbd *sdp = GFS2_SB(&amp;ip-&gt;i_inode);</div><div class='ctx'> </div><div class='ctx'> 	gfs2_lm(sdp,</div><div class='del'>-		"fatal: filesystem consistency error\n"</div><div class='del'>-		"  inode = %llu %llu\n"</div><div class='del'>-		"  function = %s, file = %s, line = %u\n",</div><div class='add'>+		"fatal: filesystem consistency error - "</div><div class='add'>+		"inode = %llu %llu, "</div><div class='add'>+		"function = %s, file = %s, line = %u\n",</div><div class='ctx'> 		(unsigned long long)ip-&gt;i_no_formal_ino,</div><div class='ctx'> 		(unsigned long long)ip-&gt;i_no_addr,</div><div class='ctx'> 		function, file, line);</div><div class='hunk'>@@ -471,9 +360,9 @@ void gfs2_consist_rgrpd_i(struct gfs2_rgrpd *rgd,</div><div class='ctx'> 	sprintf(fs_id_buf, "fsid=%s: ", sdp-&gt;sd_fsname);</div><div class='ctx'> 	gfs2_rgrp_dump(NULL, rgd, fs_id_buf);</div><div class='ctx'> 	gfs2_lm(sdp,</div><div class='del'>-		"fatal: filesystem consistency error\n"</div><div class='del'>-		"  RG = %llu\n"</div><div class='del'>-		"  function = %s, file = %s, line = %u\n",</div><div class='add'>+		"fatal: filesystem consistency error - "</div><div class='add'>+		"RG = %llu, "</div><div class='add'>+		"function = %s, file = %s, line = %u\n",</div><div class='ctx'> 		(unsigned long long)rgd-&gt;rd_addr,</div><div class='ctx'> 		function, file, line);</div><div class='ctx'> 	gfs2_dump_glock(NULL, rgd-&gt;rd_gl, 1);</div><div class='hunk'>@@ -482,46 +371,36 @@ void gfs2_consist_rgrpd_i(struct gfs2_rgrpd *rgd,</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * gfs2_meta_check_ii - Flag a magic number consistency error and withdraw</div><div class='del'>- * Returns: -1 if this call withdrew the machine,</div><div class='del'>- *          -2 if it was already withdrawn</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-int gfs2_meta_check_ii(struct gfs2_sbd *sdp, struct buffer_head *bh,</div><div class='del'>-		       const char *type, const char *function, char *file,</div><div class='del'>-		       unsigned int line)</div><div class='add'>+void gfs2_meta_check_ii(struct gfs2_sbd *sdp, struct buffer_head *bh,</div><div class='add'>+			const char *function, char *file,</div><div class='add'>+			unsigned int line)</div><div class='ctx'> {</div><div class='del'>-	int me;</div><div class='del'>-</div><div class='ctx'> 	gfs2_lm(sdp,</div><div class='del'>-		"fatal: invalid metadata block\n"</div><div class='del'>-		"  bh = %llu (%s)\n"</div><div class='del'>-		"  function = %s, file = %s, line = %u\n",</div><div class='del'>-		(unsigned long long)bh-&gt;b_blocknr, type,</div><div class='add'>+		"fatal: invalid metadata block - "</div><div class='add'>+		"bh = %llu (bad magic number), "</div><div class='add'>+		"function = %s, file = %s, line = %u\n",</div><div class='add'>+		(unsigned long long)bh-&gt;b_blocknr,</div><div class='ctx'> 		function, file, line);</div><div class='del'>-	me = gfs2_withdraw(sdp);</div><div class='del'>-	return (me) ? -1 : -2;</div><div class='add'>+	gfs2_withdraw(sdp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * gfs2_metatype_check_ii - Flag a metadata type consistency error and withdraw</div><div class='del'>- * Returns: -1 if this call withdrew the machine,</div><div class='del'>- *          -2 if it was already withdrawn</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-int gfs2_metatype_check_ii(struct gfs2_sbd *sdp, struct buffer_head *bh,</div><div class='del'>-			   u16 type, u16 t, const char *function,</div><div class='del'>-			   char *file, unsigned int line)</div><div class='add'>+void gfs2_metatype_check_ii(struct gfs2_sbd *sdp, struct buffer_head *bh,</div><div class='add'>+			    u16 type, u16 t, const char *function,</div><div class='add'>+			    char *file, unsigned int line)</div><div class='ctx'> {</div><div class='del'>-	int me;</div><div class='del'>-</div><div class='ctx'> 	gfs2_lm(sdp,</div><div class='del'>-		"fatal: invalid metadata block\n"</div><div class='del'>-		"  bh = %llu (type: exp=%u, found=%u)\n"</div><div class='del'>-		"  function = %s, file = %s, line = %u\n",</div><div class='add'>+		"fatal: invalid metadata block - "</div><div class='add'>+		"bh = %llu (type: exp=%u, found=%u), "</div><div class='add'>+		"function = %s, file = %s, line = %u\n",</div><div class='ctx'> 		(unsigned long long)bh-&gt;b_blocknr, type, t,</div><div class='ctx'> 		function, file, line);</div><div class='del'>-	me = gfs2_withdraw(sdp);</div><div class='del'>-	return (me) ? -1 : -2;</div><div class='add'>+	gfs2_withdraw(sdp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -530,33 +409,29 @@ int gfs2_metatype_check_ii(struct gfs2_sbd *sdp, struct buffer_head *bh,</div><div class='ctx'>  *          0 if it was already withdrawn</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-int gfs2_io_error_i(struct gfs2_sbd *sdp, const char *function, char *file,</div><div class='del'>-		    unsigned int line)</div><div class='add'>+void gfs2_io_error_i(struct gfs2_sbd *sdp, const char *function, char *file,</div><div class='add'>+		     unsigned int line)</div><div class='ctx'> {</div><div class='ctx'> 	gfs2_lm(sdp,</div><div class='del'>-		"fatal: I/O error\n"</div><div class='del'>-		"  function = %s, file = %s, line = %u\n",</div><div class='add'>+		"fatal: I/O error - "</div><div class='add'>+		"function = %s, file = %s, line = %u\n",</div><div class='ctx'> 		function, file, line);</div><div class='del'>-	return gfs2_withdraw(sdp);</div><div class='add'>+	gfs2_withdraw(sdp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * gfs2_io_error_bh_i - Flag a buffer I/O error</div><div class='del'>- * @withdraw: withdraw the filesystem</div><div class='add'>+ * gfs2_io_error_bh_i - Flag a buffer I/O error and withdraw</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> void gfs2_io_error_bh_i(struct gfs2_sbd *sdp, struct buffer_head *bh,</div><div class='del'>-			const char *function, char *file, unsigned int line,</div><div class='del'>-			bool withdraw)</div><div class='add'>+			const char *function, char *file, unsigned int line)</div><div class='ctx'> {</div><div class='ctx'> 	if (gfs2_withdrawn(sdp))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	fs_err(sdp, "fatal: I/O error\n"</div><div class='del'>-	       "  block = %llu\n"</div><div class='del'>-	       "  function = %s, file = %s, line = %u\n",</div><div class='add'>+	fs_err(sdp, "fatal: I/O error - "</div><div class='add'>+	       "block = %llu, "</div><div class='add'>+	       "function = %s, file = %s, line = %u\n",</div><div class='ctx'> 	       (unsigned long long)bh-&gt;b_blocknr, function, file, line);</div><div class='del'>-	if (withdraw)</div><div class='del'>-		gfs2_withdraw(sdp);</div><div class='add'>+	gfs2_withdraw(sdp);</div><div class='ctx'> }</div><div class='del'>-</div><div class='head'>diff --git a/fs/gfs2/util.h b/fs/gfs2/util.h<br/>index 78ec190f4155..ffcc47d6b0b4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/util.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/util.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/util.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/util.h</a></div><div class='hunk'>@@ -37,24 +37,14 @@ do { \</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> void gfs2_assert_withdraw_i(struct gfs2_sbd *sdp, char *assertion,</div><div class='del'>-			    const char *function, char *file, unsigned int line,</div><div class='del'>-			    bool delayed);</div><div class='add'>+			    const char *function, char *file, unsigned int line);</div><div class='ctx'> </div><div class='ctx'> #define gfs2_assert_withdraw(sdp, assertion) \</div><div class='ctx'> 	({ \</div><div class='ctx'> 		bool _bool = (assertion); \</div><div class='ctx'> 		if (unlikely(!_bool)) \</div><div class='ctx'> 			gfs2_assert_withdraw_i((sdp), #assertion, \</div><div class='del'>-					__func__, __FILE__, __LINE__, false); \</div><div class='del'>-		!_bool; \</div><div class='del'>-	})</div><div class='del'>-</div><div class='del'>-#define gfs2_assert_withdraw_delayed(sdp, assertion) \</div><div class='del'>-	({ \</div><div class='del'>-		bool _bool = (assertion); \</div><div class='del'>-		if (unlikely(!_bool)) \</div><div class='del'>-			gfs2_assert_withdraw_i((sdp), #assertion, \</div><div class='del'>-					__func__, __FILE__, __LINE__, true); \</div><div class='add'>+					__func__, __FILE__, __LINE__); \</div><div class='ctx'> 		!_bool; \</div><div class='ctx'> 	})</div><div class='ctx'> </div><div class='hunk'>@@ -91,9 +81,9 @@ void gfs2_consist_rgrpd_i(struct gfs2_rgrpd *rgd,</div><div class='ctx'> gfs2_consist_rgrpd_i((rgd), __func__, __FILE__, __LINE__)</div><div class='ctx'> </div><div class='ctx'> </div><div class='del'>-int gfs2_meta_check_ii(struct gfs2_sbd *sdp, struct buffer_head *bh,</div><div class='del'>-		       const char *type, const char *function,</div><div class='del'>-		       char *file, unsigned int line);</div><div class='add'>+void gfs2_meta_check_ii(struct gfs2_sbd *sdp, struct buffer_head *bh,</div><div class='add'>+			const char *function,</div><div class='add'>+			char *file, unsigned int line);</div><div class='ctx'> </div><div class='ctx'> static inline int gfs2_meta_check(struct gfs2_sbd *sdp,</div><div class='ctx'> 				    struct buffer_head *bh)</div><div class='hunk'>@@ -108,10 +98,10 @@ static inline int gfs2_meta_check(struct gfs2_sbd *sdp,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int gfs2_metatype_check_ii(struct gfs2_sbd *sdp, struct buffer_head *bh,</div><div class='del'>-			   u16 type, u16 t,</div><div class='del'>-			   const char *function,</div><div class='del'>-			   char *file, unsigned int line);</div><div class='add'>+void gfs2_metatype_check_ii(struct gfs2_sbd *sdp, struct buffer_head *bh,</div><div class='add'>+			    u16 type, u16 t,</div><div class='add'>+			    const char *function,</div><div class='add'>+			    char *file, unsigned int line);</div><div class='ctx'> </div><div class='ctx'> static inline int gfs2_metatype_check_i(struct gfs2_sbd *sdp,</div><div class='ctx'> 					struct buffer_head *bh,</div><div class='hunk'>@@ -122,12 +112,16 @@ static inline int gfs2_metatype_check_i(struct gfs2_sbd *sdp,</div><div class='ctx'> 	struct gfs2_meta_header *mh = (struct gfs2_meta_header *)bh-&gt;b_data;</div><div class='ctx'> 	u32 magic = be32_to_cpu(mh-&gt;mh_magic);</div><div class='ctx'> 	u16 t = be32_to_cpu(mh-&gt;mh_type);</div><div class='del'>-	if (unlikely(magic != GFS2_MAGIC))</div><div class='del'>-		return gfs2_meta_check_ii(sdp, bh, "magic number", function,</div><div class='del'>-					  file, line);</div><div class='del'>-        if (unlikely(t != type))</div><div class='del'>-		return gfs2_metatype_check_ii(sdp, bh, type, t, function,</div><div class='del'>-					      file, line);</div><div class='add'>+	if (unlikely(magic != GFS2_MAGIC)) {</div><div class='add'>+		gfs2_meta_check_ii(sdp, bh, function,</div><div class='add'>+				   file, line);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+        if (unlikely(t != type)) {</div><div class='add'>+		gfs2_metatype_check_ii(sdp, bh, type, t, function,</div><div class='add'>+				       file, line);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -144,28 +138,23 @@ static inline void gfs2_metatype_set(struct buffer_head *bh, u16 type,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> </div><div class='del'>-int gfs2_io_error_i(struct gfs2_sbd *sdp, const char *function,</div><div class='del'>-		    char *file, unsigned int line);</div><div class='add'>+void gfs2_io_error_i(struct gfs2_sbd *sdp, const char *function,</div><div class='add'>+		     char *file, unsigned int line);</div><div class='ctx'> </div><div class='del'>-extern int check_journal_clean(struct gfs2_sbd *sdp, struct gfs2_jdesc *jd,</div><div class='del'>-			       bool verbose);</div><div class='del'>-extern int gfs2_freeze_lock(struct gfs2_sbd *sdp,</div><div class='del'>-			    struct gfs2_holder *freeze_gh, int caller_flags);</div><div class='del'>-extern void gfs2_freeze_unlock(struct gfs2_holder *freeze_gh);</div><div class='add'>+int check_journal_clean(struct gfs2_sbd *sdp, struct gfs2_jdesc *jd,</div><div class='add'>+		        bool verbose);</div><div class='add'>+int gfs2_freeze_lock_shared(struct gfs2_sbd *sdp);</div><div class='add'>+void gfs2_freeze_unlock(struct gfs2_sbd *sdp);</div><div class='ctx'> </div><div class='ctx'> #define gfs2_io_error(sdp) \</div><div class='ctx'> gfs2_io_error_i((sdp), __func__, __FILE__, __LINE__)</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> void gfs2_io_error_bh_i(struct gfs2_sbd *sdp, struct buffer_head *bh,</div><div class='del'>-			const char *function, char *file, unsigned int line,</div><div class='del'>-			bool withdraw);</div><div class='del'>-</div><div class='del'>-#define gfs2_io_error_bh_wd(sdp, bh) \</div><div class='del'>-gfs2_io_error_bh_i((sdp), (bh), __func__, __FILE__, __LINE__, true)</div><div class='add'>+			const char *function, char *file, unsigned int line);</div><div class='ctx'> </div><div class='ctx'> #define gfs2_io_error_bh(sdp, bh) \</div><div class='del'>-gfs2_io_error_bh_i((sdp), (bh), __func__, __FILE__, __LINE__, false)</div><div class='add'>+gfs2_io_error_bh_i((sdp), (bh), __func__, __FILE__, __LINE__)</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> extern struct kmem_cache *gfs2_glock_cachep;</div><div class='hunk'>@@ -190,37 +179,12 @@ static inline unsigned int gfs2_tune_get_i(struct gfs2_tune *gt,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * gfs2_withdraw_delayed - withdraw as soon as possible without deadlocks</div><div class='del'>- * @sdp: the superblock</div><div class='del'>- */</div><div class='del'>-static inline void gfs2_withdraw_delayed(struct gfs2_sbd *sdp)</div><div class='del'>-{</div><div class='del'>-	set_bit(SDF_WITHDRAWING, &amp;sdp-&gt;sd_flags);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * gfs2_withdrawn - test whether the file system is withdrawing or withdrawn</div><div class='add'>+ * gfs2_withdrawn - test whether the file system is withdrawn</div><div class='ctx'>  * @sdp: the superblock</div><div class='ctx'>  */</div><div class='ctx'> static inline bool gfs2_withdrawn(struct gfs2_sbd *sdp)</div><div class='ctx'> {</div><div class='del'>-	return test_bit(SDF_WITHDRAWN, &amp;sdp-&gt;sd_flags) ||</div><div class='del'>-		test_bit(SDF_WITHDRAWING, &amp;sdp-&gt;sd_flags);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * gfs2_withdrawing - check if a withdraw is pending</div><div class='del'>- * @sdp: the superblock</div><div class='del'>- */</div><div class='del'>-static inline bool gfs2_withdrawing(struct gfs2_sbd *sdp)</div><div class='del'>-{</div><div class='del'>-	return test_bit(SDF_WITHDRAWING, &amp;sdp-&gt;sd_flags) &amp;&amp;</div><div class='del'>-	       !test_bit(SDF_WITHDRAWN, &amp;sdp-&gt;sd_flags);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline bool gfs2_withdraw_in_prog(struct gfs2_sbd *sdp)</div><div class='del'>-{</div><div class='del'>-	return test_bit(SDF_WITHDRAW_IN_PROG, &amp;sdp-&gt;sd_flags);</div><div class='add'>+	return unlikely(test_bit(SDF_WITHDRAWN, &amp;sdp-&gt;sd_flags));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #define gfs2_tune_get(sdp, field) \</div><div class='hunk'>@@ -228,6 +192,8 @@ gfs2_tune_get_i(&amp;(sdp)-&gt;sd_tune, &amp;(sdp)-&gt;sd_tune.field)</div><div class='ctx'> </div><div class='ctx'> __printf(2, 3)</div><div class='ctx'> void gfs2_lm(struct gfs2_sbd *sdp, const char *fmt, ...);</div><div class='del'>-int gfs2_withdraw(struct gfs2_sbd *sdp);</div><div class='add'>+</div><div class='add'>+void gfs2_withdraw_func(struct work_struct *work);</div><div class='add'>+void gfs2_withdraw(struct gfs2_sbd *sdp);</div><div class='ctx'> </div><div class='ctx'> #endif /* __UTIL_DOT_H__ */</div><div class='head'>diff --git a/fs/gfs2/xattr.c b/fs/gfs2/xattr.c<br/>index 0c5650fe1fd1..df9c93de94c7 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/xattr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/xattr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/xattr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/xattr.c</a></div><div class='hunk'>@@ -96,30 +96,34 @@ static int ea_foreach_i(struct gfs2_inode *ip, struct buffer_head *bh,</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> </div><div class='ctx'> 	for (ea = GFS2_EA_BH2FIRST(bh);; prev = ea, ea = GFS2_EA2NEXT(ea)) {</div><div class='del'>-		if (!GFS2_EA_REC_LEN(ea))</div><div class='del'>-			goto fail;</div><div class='add'>+		if (!GFS2_EA_REC_LEN(ea)) {</div><div class='add'>+			gfs2_consist_inode(ip);</div><div class='add'>+			return -EIO;</div><div class='add'>+		}</div><div class='ctx'> 		if (!(bh-&gt;b_data &lt;= (char *)ea &amp;&amp; (char *)GFS2_EA2NEXT(ea) &lt;=</div><div class='del'>-						  bh-&gt;b_data + bh-&gt;b_size))</div><div class='del'>-			goto fail;</div><div class='del'>-		if (!gfs2_eatype_valid(sdp, ea-&gt;ea_type))</div><div class='del'>-			goto fail;</div><div class='add'>+						  bh-&gt;b_data + bh-&gt;b_size)) {</div><div class='add'>+			gfs2_consist_inode(ip);</div><div class='add'>+			return -EIO;</div><div class='add'>+		}</div><div class='add'>+		if (!gfs2_eatype_valid(sdp, ea-&gt;ea_type)) {</div><div class='add'>+			gfs2_consist_inode(ip);</div><div class='add'>+			return -EIO;</div><div class='add'>+		}</div><div class='ctx'> 		error = ea_call(ip, bh, ea, prev, data);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			return error;</div><div class='ctx'> </div><div class='ctx'> 		if (GFS2_EA_IS_LAST(ea)) {</div><div class='ctx'> 			if ((char *)GFS2_EA2NEXT(ea) !=</div><div class='del'>-			    bh-&gt;b_data + bh-&gt;b_size)</div><div class='del'>-				goto fail;</div><div class='add'>+			    bh-&gt;b_data + bh-&gt;b_size) {</div><div class='add'>+				gfs2_consist_inode(ip);</div><div class='add'>+				return -EIO;</div><div class='add'>+			}</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return error;</div><div class='del'>-</div><div class='del'>-fail:</div><div class='del'>-	gfs2_consist_inode(ip);</div><div class='del'>-	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ea_foreach(struct gfs2_inode *ip, ea_call_t ea_call, void *data)</div><div class='hunk'>@@ -311,7 +315,7 @@ static int ea_dealloc_unstuffed(struct gfs2_inode *ip, struct buffer_head *bh,</div><div class='ctx'> 		ea-&gt;ea_num_ptrs = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ip-&gt;i_inode.i_ctime = current_time(&amp;ip-&gt;i_inode);</div><div class='add'>+	inode_set_ctime_current(&amp;ip-&gt;i_inode);</div><div class='ctx'> 	__mark_inode_dirty(&amp;ip-&gt;i_inode, I_DIRTY_DATASYNC);</div><div class='ctx'> </div><div class='ctx'> 	gfs2_trans_end(sdp);</div><div class='hunk'>@@ -639,7 +643,7 @@ static int ea_alloc_blk(struct gfs2_inode *ip, struct buffer_head **bhp)</div><div class='ctx'> 	u64 block;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	error = gfs2_alloc_blocks(ip, &amp;block, &amp;n, 0, NULL);</div><div class='add'>+	error = gfs2_alloc_blocks(ip, &amp;block, &amp;n, 0);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> 	gfs2_trans_remove_revoke(sdp, block, 1);</div><div class='hunk'>@@ -701,7 +705,7 @@ static int ea_write(struct gfs2_inode *ip, struct gfs2_ea_header *ea,</div><div class='ctx'> 			int mh_size = sizeof(struct gfs2_meta_header);</div><div class='ctx'> 			unsigned int n = 1;</div><div class='ctx'> </div><div class='del'>-			error = gfs2_alloc_blocks(ip, &amp;block, &amp;n, 0, NULL);</div><div class='add'>+			error = gfs2_alloc_blocks(ip, &amp;block, &amp;n, 0);</div><div class='ctx'> 			if (error)</div><div class='ctx'> 				return error;</div><div class='ctx'> 			gfs2_trans_remove_revoke(sdp, block, 1);</div><div class='hunk'>@@ -763,7 +767,7 @@ static int ea_alloc_skeleton(struct gfs2_inode *ip, struct gfs2_ea_request *er,</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out_end_trans;</div><div class='ctx'> </div><div class='del'>-	ip-&gt;i_inode.i_ctime = current_time(&amp;ip-&gt;i_inode);</div><div class='add'>+	inode_set_ctime_current(&amp;ip-&gt;i_inode);</div><div class='ctx'> 	__mark_inode_dirty(&amp;ip-&gt;i_inode, I_DIRTY_DATASYNC);</div><div class='ctx'> </div><div class='ctx'> out_end_trans:</div><div class='hunk'>@@ -888,7 +892,7 @@ static int ea_set_simple_noalloc(struct gfs2_inode *ip, struct buffer_head *bh,</div><div class='ctx'> 	if (es-&gt;es_el)</div><div class='ctx'> 		ea_set_remove_stuffed(ip, es-&gt;es_el);</div><div class='ctx'> </div><div class='del'>-	ip-&gt;i_inode.i_ctime = current_time(&amp;ip-&gt;i_inode);</div><div class='add'>+	inode_set_ctime_current(&amp;ip-&gt;i_inode);</div><div class='ctx'> 	__mark_inode_dirty(&amp;ip-&gt;i_inode, I_DIRTY_DATASYNC);</div><div class='ctx'> </div><div class='ctx'> 	gfs2_trans_end(GFS2_SB(&amp;ip-&gt;i_inode));</div><div class='hunk'>@@ -1002,7 +1006,7 @@ static int ea_set_block(struct gfs2_inode *ip, struct gfs2_ea_request *er,</div><div class='ctx'> 	} else {</div><div class='ctx'> 		u64 blk;</div><div class='ctx'> 		unsigned int n = 1;</div><div class='del'>-		error = gfs2_alloc_blocks(ip, &amp;blk, &amp;n, 0, NULL);</div><div class='add'>+		error = gfs2_alloc_blocks(ip, &amp;blk, &amp;n, 0);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			return error;</div><div class='ctx'> 		gfs2_trans_remove_revoke(sdp, blk, 1);</div><div class='hunk'>@@ -1106,7 +1110,7 @@ static int ea_remove_stuffed(struct gfs2_inode *ip, struct gfs2_ea_location *el)</div><div class='ctx'> 		ea-&gt;ea_type = GFS2_EATYPE_UNUSED;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ip-&gt;i_inode.i_ctime = current_time(&amp;ip-&gt;i_inode);</div><div class='add'>+	inode_set_ctime_current(&amp;ip-&gt;i_inode);</div><div class='ctx'> 	__mark_inode_dirty(&amp;ip-&gt;i_inode, I_DIRTY_DATASYNC);</div><div class='ctx'> </div><div class='ctx'> 	gfs2_trans_end(GFS2_SB(&amp;ip-&gt;i_inode));</div><div class='hunk'>@@ -1225,7 +1229,7 @@ int __gfs2_xattr_set(struct inode *inode, const char *name,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int gfs2_xattr_set(const struct xattr_handler *handler,</div><div class='del'>-			  struct user_namespace *mnt_userns,</div><div class='add'>+			  struct mnt_idmap *idmap,</div><div class='ctx'> 			  struct dentry *unused, struct inode *inode,</div><div class='ctx'> 			  const char *name, const void *value,</div><div class='ctx'> 			  size_t size, int flags)</div><div class='hunk'>@@ -1313,7 +1317,7 @@ static int ea_dealloc_indirect(struct gfs2_inode *ip)</div><div class='ctx'> 	else</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	gfs2_rlist_alloc(&amp;rlist);</div><div class='add'>+	gfs2_rlist_alloc(&amp;rlist, LM_ST_EXCLUSIVE, LM_FLAG_NODE_SCOPE);</div><div class='ctx'> </div><div class='ctx'> 	for (x = 0; x &lt; rlist.rl_rgrps; x++) {</div><div class='ctx'> 		rgd = gfs2_glock2rgrp(rlist.rl_ghs[x].gh_gl);</div><div class='hunk'>@@ -1379,7 +1383,7 @@ out:</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ea_dealloc_block(struct gfs2_inode *ip)</div><div class='add'>+static int ea_dealloc_block(struct gfs2_inode *ip, bool initialized)</div><div class='ctx'> {</div><div class='ctx'> 	struct gfs2_sbd *sdp = GFS2_SB(&amp;ip-&gt;i_inode);</div><div class='ctx'> 	struct gfs2_rgrpd *rgd;</div><div class='hunk'>@@ -1412,11 +1416,13 @@ static int ea_dealloc_block(struct gfs2_inode *ip)</div><div class='ctx'> 	ip-&gt;i_eattr = 0;</div><div class='ctx'> 	gfs2_add_inode_blocks(&amp;ip-&gt;i_inode, -1);</div><div class='ctx'> </div><div class='del'>-	error = gfs2_meta_inode_buffer(ip, &amp;dibh);</div><div class='del'>-	if (!error) {</div><div class='del'>-		gfs2_trans_add_meta(ip-&gt;i_gl, dibh);</div><div class='del'>-		gfs2_dinode_out(ip, dibh-&gt;b_data);</div><div class='del'>-		brelse(dibh);</div><div class='add'>+	if (initialized) {</div><div class='add'>+		error = gfs2_meta_inode_buffer(ip, &amp;dibh);</div><div class='add'>+		if (!error) {</div><div class='add'>+			gfs2_trans_add_meta(ip-&gt;i_gl, dibh);</div><div class='add'>+			gfs2_dinode_out(ip, dibh-&gt;b_data);</div><div class='add'>+			brelse(dibh);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	gfs2_trans_end(sdp);</div><div class='hunk'>@@ -1429,11 +1435,12 @@ out_gunlock:</div><div class='ctx'> /**</div><div class='ctx'>  * gfs2_ea_dealloc - deallocate the extended attribute fork</div><div class='ctx'>  * @ip: the inode</div><div class='add'>+ * @initialized: xattrs have been initialized</div><div class='ctx'>  *</div><div class='ctx'>  * Returns: errno</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-int gfs2_ea_dealloc(struct gfs2_inode *ip)</div><div class='add'>+int gfs2_ea_dealloc(struct gfs2_inode *ip, bool initialized)</div><div class='ctx'> {</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='hunk'>@@ -1445,17 +1452,19 @@ int gfs2_ea_dealloc(struct gfs2_inode *ip)</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='del'>-	error = ea_foreach(ip, ea_dealloc_unstuffed, NULL);</div><div class='del'>-	if (error)</div><div class='del'>-		goto out_quota;</div><div class='del'>-</div><div class='del'>-	if (ip-&gt;i_diskflags &amp; GFS2_DIF_EA_INDIRECT) {</div><div class='del'>-		error = ea_dealloc_indirect(ip);</div><div class='add'>+	if (initialized) {</div><div class='add'>+		error = ea_foreach(ip, ea_dealloc_unstuffed, NULL);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			goto out_quota;</div><div class='add'>+</div><div class='add'>+		if (ip-&gt;i_diskflags &amp; GFS2_DIF_EA_INDIRECT) {</div><div class='add'>+			error = ea_dealloc_indirect(ip);</div><div class='add'>+			if (error)</div><div class='add'>+				goto out_quota;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	error = ea_dealloc_block(ip);</div><div class='add'>+	error = ea_dealloc_block(ip, initialized);</div><div class='ctx'> </div><div class='ctx'> out_quota:</div><div class='ctx'> 	gfs2_quota_unhold(ip);</div><div class='hunk'>@@ -1490,16 +1499,14 @@ static const struct xattr_handler gfs2_xattr_trusted_handler = {</div><div class='ctx'> 	.set    = gfs2_xattr_set,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-const struct xattr_handler *gfs2_xattr_handlers_max[] = {</div><div class='add'>+const struct xattr_handler * const gfs2_xattr_handlers_max[] = {</div><div class='ctx'> 	/* GFS2_FS_FORMAT_MAX */</div><div class='ctx'> 	&amp;gfs2_xattr_trusted_handler,</div><div class='ctx'> </div><div class='ctx'> 	/* GFS2_FS_FORMAT_MIN */</div><div class='ctx'> 	&amp;gfs2_xattr_user_handler,</div><div class='ctx'> 	&amp;gfs2_xattr_security_handler,</div><div class='del'>-	&amp;posix_acl_access_xattr_handler,</div><div class='del'>-	&amp;posix_acl_default_xattr_handler,</div><div class='ctx'> 	NULL,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-const struct xattr_handler **gfs2_xattr_handlers_min = gfs2_xattr_handlers_max + 1;</div><div class='add'>+const struct xattr_handler * const *gfs2_xattr_handlers_min = gfs2_xattr_handlers_max + 1;</div><div class='head'>diff --git a/fs/gfs2/xattr.h b/fs/gfs2/xattr.h<br/>index 2aed9d7d483d..3c9788e0e137 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/gfs2/xattr.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/gfs2/xattr.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/gfs2/xattr.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/gfs2/xattr.h</a></div><div class='hunk'>@@ -50,14 +50,14 @@ struct gfs2_ea_location {</div><div class='ctx'> 	struct gfs2_ea_header *el_prev;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-extern int __gfs2_xattr_set(struct inode *inode, const char *name,</div><div class='del'>-			    const void *value, size_t size,</div><div class='del'>-			    int flags, int type);</div><div class='del'>-extern ssize_t gfs2_listxattr(struct dentry *dentry, char *buffer, size_t size);</div><div class='del'>-extern int gfs2_ea_dealloc(struct gfs2_inode *ip);</div><div class='add'>+int __gfs2_xattr_set(struct inode *inode, const char *name,</div><div class='add'>+		     const void *value, size_t size,</div><div class='add'>+		     int flags, int type);</div><div class='add'>+ssize_t gfs2_listxattr(struct dentry *dentry, char *buffer, size_t size);</div><div class='add'>+int gfs2_ea_dealloc(struct gfs2_inode *ip, bool initialized);</div><div class='ctx'> </div><div class='ctx'> /* Exported to acl.c */</div><div class='ctx'> </div><div class='del'>-extern int gfs2_xattr_acl_get(struct gfs2_inode *ip, const char *name, char **data);</div><div class='add'>+int gfs2_xattr_acl_get(struct gfs2_inode *ip, const char *name, char **data);</div><div class='ctx'> </div><div class='ctx'> #endif /* __EATTR_DOT_H__ */</div><div class='head'>diff --git a/fs/hfs/.kunitconfig b/fs/hfs/.kunitconfig<br/>new file mode 100644<br/>index 000000000000..5caa9af1e3bb<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfs/.kunitconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfs/.kunitconfig</a></div><div class='hunk'>@@ -0,0 +1,7 @@</div><div class='add'>+CONFIG_KUNIT=y</div><div class='add'>+CONFIG_HFS_FS=y</div><div class='add'>+CONFIG_HFS_KUNIT_TEST=y</div><div class='add'>+CONFIG_BLOCK=y</div><div class='add'>+CONFIG_BUFFER_HEAD=y</div><div class='add'>+CONFIG_NLS=y</div><div class='add'>+CONFIG_LEGACY_DIRECT_IO=y</div><div class='head'>diff --git a/fs/hfs/Kconfig b/fs/hfs/Kconfig<br/>index 129926b5142d..7f3cbe43b4b7 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfs/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfs/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfs/Kconfig</a></div><div class='hunk'>@@ -2,7 +2,9 @@</div><div class='ctx'> config HFS_FS</div><div class='ctx'> 	tristate "Apple Macintosh file system support"</div><div class='ctx'> 	depends on BLOCK</div><div class='add'>+	select BUFFER_HEAD</div><div class='ctx'> 	select NLS</div><div class='add'>+	select LEGACY_DIRECT_IO</div><div class='ctx'> 	help</div><div class='ctx'> 	  If you say Y here, you will be able to mount Macintosh-formatted</div><div class='ctx'> 	  floppy disks and hard drive partitions with full read-write access.</div><div class='hunk'>@@ -11,3 +13,18 @@ config HFS_FS</div><div class='ctx'> </div><div class='ctx'> 	  To compile this file system support as a module, choose M here: the</div><div class='ctx'> 	  module will be called hfs.</div><div class='add'>+</div><div class='add'>+config HFS_KUNIT_TEST</div><div class='add'>+	tristate "KUnit tests for HFS filesystem" if !KUNIT_ALL_TESTS</div><div class='add'>+	depends on HFS_FS &amp;&amp; KUNIT</div><div class='add'>+	default KUNIT_ALL_TESTS</div><div class='add'>+	help</div><div class='add'>+	  This builds KUnit tests for the HFS filesystem.</div><div class='add'>+</div><div class='add'>+	  KUnit tests run during boot and output the results to the debug</div><div class='add'>+	  log in TAP format (https://testanything.org/). Only useful for</div><div class='add'>+	  kernel devs running KUnit test harness and are not for inclusion</div><div class='add'>+	  into a production build.</div><div class='add'>+</div><div class='add'>+	  For more information on KUnit and unit tests in general please</div><div class='add'>+	  refer to the KUnit documentation in Documentation/dev-tools/kunit/.</div><div class='head'>diff --git a/fs/hfs/Makefile b/fs/hfs/Makefile<br/>index b65459bf3dc4..a7c9ce6b4609 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfs/Makefile?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/Makefile</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfs/Makefile?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfs/Makefile</a></div><div class='hunk'>@@ -9,3 +9,5 @@ hfs-objs := bitmap.o bfind.o bnode.o brec.o btree.o \</div><div class='ctx'> 	    catalog.o dir.o extent.o inode.o attr.o mdb.o \</div><div class='ctx'>             part_tbl.o string.o super.o sysdep.o trans.o</div><div class='ctx'> </div><div class='add'>+# KUnit tests</div><div class='add'>+obj-$(CONFIG_HFS_KUNIT_TEST) += string_test.o</div><div class='head'>diff --git a/fs/hfs/attr.c b/fs/hfs/attr.c<br/>index 2bd54efaf416..f8395cdd1adf 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfs/attr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/attr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfs/attr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfs/attr.c</a></div><div class='hunk'>@@ -121,7 +121,7 @@ static int hfs_xattr_get(const struct xattr_handler *handler,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int hfs_xattr_set(const struct xattr_handler *handler,</div><div class='del'>-			 struct user_namespace *mnt_userns,</div><div class='add'>+			 struct mnt_idmap *idmap,</div><div class='ctx'> 			 struct dentry *unused, struct inode *inode,</div><div class='ctx'> 			 const char *name, const void *value, size_t size,</div><div class='ctx'> 			 int flags)</div><div class='hunk'>@@ -146,7 +146,7 @@ static const struct xattr_handler hfs_type_handler = {</div><div class='ctx'> 	.set = hfs_xattr_set,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-const struct xattr_handler *hfs_xattr_handlers[] = {</div><div class='add'>+const struct xattr_handler * const hfs_xattr_handlers[] = {</div><div class='ctx'> 	&amp;hfs_creator_handler,</div><div class='ctx'> 	&amp;hfs_type_handler,</div><div class='ctx'> 	NULL</div><div class='head'>diff --git a/fs/hfs/bfind.c b/fs/hfs/bfind.c<br/>index ef9498a6e88a..d56e47bdc517 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfs/bfind.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/bfind.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfs/bfind.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfs/bfind.c</a></div><div class='hunk'>@@ -16,14 +16,17 @@ int hfs_find_init(struct hfs_btree *tree, struct hfs_find_data *fd)</div><div class='ctx'> {</div><div class='ctx'> 	void *ptr;</div><div class='ctx'> </div><div class='add'>+	if (!tree || !fd)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='ctx'> 	fd-&gt;tree = tree;</div><div class='ctx'> 	fd-&gt;bnode = NULL;</div><div class='del'>-	ptr = kmalloc(tree-&gt;max_key_len * 2 + 4, GFP_KERNEL);</div><div class='add'>+	ptr = kzalloc(tree-&gt;max_key_len * 2 + 4, GFP_KERNEL);</div><div class='ctx'> 	if (!ptr)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	fd-&gt;search_key = ptr;</div><div class='ctx'> 	fd-&gt;key = ptr + tree-&gt;max_key_len + 2;</div><div class='del'>-	hfs_dbg(BNODE_REFS, "find_init: %d (%p)\n",</div><div class='add'>+	hfs_dbg("cnid %d, caller %ps\n",</div><div class='ctx'> 		tree-&gt;cnid, __builtin_return_address(0));</div><div class='ctx'> 	switch (tree-&gt;cnid) {</div><div class='ctx'> 	case HFS_CAT_CNID:</div><div class='hunk'>@@ -45,7 +48,7 @@ void hfs_find_exit(struct hfs_find_data *fd)</div><div class='ctx'> {</div><div class='ctx'> 	hfs_bnode_put(fd-&gt;bnode);</div><div class='ctx'> 	kfree(fd-&gt;search_key);</div><div class='del'>-	hfs_dbg(BNODE_REFS, "find_exit: %d (%p)\n",</div><div class='add'>+	hfs_dbg("cnid %d, caller %ps\n",</div><div class='ctx'> 		fd-&gt;tree-&gt;cnid, __builtin_return_address(0));</div><div class='ctx'> 	mutex_unlock(&amp;fd-&gt;tree-&gt;tree_lock);</div><div class='ctx'> 	fd-&gt;tree = NULL;</div><div class='hunk'>@@ -112,6 +115,12 @@ int hfs_brec_find(struct hfs_find_data *fd)</div><div class='ctx'> 	__be32 data;</div><div class='ctx'> 	int height, res;</div><div class='ctx'> </div><div class='add'>+	fd-&gt;record = -1;</div><div class='add'>+	fd-&gt;keyoffset = -1;</div><div class='add'>+	fd-&gt;keylength = -1;</div><div class='add'>+	fd-&gt;entryoffset = -1;</div><div class='add'>+	fd-&gt;entrylength = -1;</div><div class='add'>+</div><div class='ctx'> 	tree = fd-&gt;tree;</div><div class='ctx'> 	if (fd-&gt;bnode)</div><div class='ctx'> 		hfs_bnode_put(fd-&gt;bnode);</div><div class='hunk'>@@ -158,7 +167,7 @@ release:</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int hfs_brec_read(struct hfs_find_data *fd, void *rec, int rec_len)</div><div class='add'>+int hfs_brec_read(struct hfs_find_data *fd, void *rec, u32 rec_len)</div><div class='ctx'> {</div><div class='ctx'> 	int res;</div><div class='ctx'> </div><div class='head'>diff --git a/fs/hfs/bitmap.c b/fs/hfs/bitmap.c<br/>index 28307bc9ec1e..5e84833a4743 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfs/bitmap.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/bitmap.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfs/bitmap.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfs/bitmap.c</a></div><div class='hunk'>@@ -158,7 +158,7 @@ u32 hfs_vbm_search_free(struct super_block *sb, u32 goal, u32 *num_bits)</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(BITMAP, "alloc_bits: %u,%u\n", pos, *num_bits);</div><div class='add'>+	hfs_dbg("pos %u, num_bits %u\n", pos, *num_bits);</div><div class='ctx'> 	HFS_SB(sb)-&gt;free_ablocks -= *num_bits;</div><div class='ctx'> 	hfs_bitmap_dirty(sb);</div><div class='ctx'> out:</div><div class='hunk'>@@ -200,7 +200,7 @@ int hfs_clear_vbm_bits(struct super_block *sb, u16 start, u16 count)</div><div class='ctx'> 	if (!count)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(BITMAP, "clear_bits: %u,%u\n", start, count);</div><div class='add'>+	hfs_dbg("start %u, count %u\n", start, count);</div><div class='ctx'> 	/* are all of the bits in range? */</div><div class='ctx'> 	if ((start + count) &gt; HFS_SB(sb)-&gt;fs_ablocks)</div><div class='ctx'> 		return -2;</div><div class='head'>diff --git a/fs/hfs/bnode.c b/fs/hfs/bnode.c<br/>index c0a73a6ffb28..13d58c51fc46 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfs/bnode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/bnode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfs/bnode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfs/bnode.c</a></div><div class='hunk'>@@ -15,13 +15,68 @@</div><div class='ctx'> </div><div class='ctx'> #include "btree.h"</div><div class='ctx'> </div><div class='del'>-void hfs_bnode_read(struct hfs_bnode *node, void *buf, int off, int len)</div><div class='add'>+static inline</div><div class='add'>+bool is_bnode_offset_valid(struct hfs_bnode *node, u32 off)</div><div class='add'>+{</div><div class='add'>+	bool is_valid = off &lt; node-&gt;tree-&gt;node_size;</div><div class='add'>+</div><div class='add'>+	if (!is_valid) {</div><div class='add'>+		pr_err("requested invalid offset: "</div><div class='add'>+		       "NODE: id %u, type %#x, height %u, "</div><div class='add'>+		       "node_size %u, offset %u\n",</div><div class='add'>+		       node-&gt;this, node-&gt;type, node-&gt;height,</div><div class='add'>+		       node-&gt;tree-&gt;node_size, off);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return is_valid;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline</div><div class='add'>+u32 check_and_correct_requested_length(struct hfs_bnode *node, u32 off, u32 len)</div><div class='add'>+{</div><div class='add'>+	unsigned int node_size;</div><div class='add'>+</div><div class='add'>+	if (!is_bnode_offset_valid(node, off))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	node_size = node-&gt;tree-&gt;node_size;</div><div class='add'>+</div><div class='add'>+	if ((off + len) &gt; node_size) {</div><div class='add'>+		u32 new_len = node_size - off;</div><div class='add'>+</div><div class='add'>+		pr_err("requested length has been corrected: "</div><div class='add'>+		       "NODE: id %u, type %#x, height %u, "</div><div class='add'>+		       "node_size %u, offset %u, "</div><div class='add'>+		       "requested_len %u, corrected_len %u\n",</div><div class='add'>+		       node-&gt;this, node-&gt;type, node-&gt;height,</div><div class='add'>+		       node-&gt;tree-&gt;node_size, off, len, new_len);</div><div class='add'>+</div><div class='add'>+		return new_len;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return len;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void hfs_bnode_read(struct hfs_bnode *node, void *buf, u32 off, u32 len)</div><div class='ctx'> {</div><div class='ctx'> 	struct page *page;</div><div class='del'>-	int pagenum;</div><div class='del'>-	int bytes_read;</div><div class='del'>-	int bytes_to_read;</div><div class='del'>-	void *vaddr;</div><div class='add'>+	u32 pagenum;</div><div class='add'>+	u32 bytes_read;</div><div class='add'>+	u32 bytes_to_read;</div><div class='add'>+</div><div class='add'>+	if (!is_bnode_offset_valid(node, off))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (len == 0) {</div><div class='add'>+		pr_err("requested zero length: "</div><div class='add'>+		       "NODE: id %u, type %#x, height %u, "</div><div class='add'>+		       "node_size %u, offset %u, len %u\n",</div><div class='add'>+		       node-&gt;this, node-&gt;type, node-&gt;height,</div><div class='add'>+		       node-&gt;tree-&gt;node_size, off, len);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	len = check_and_correct_requested_length(node, off, len);</div><div class='ctx'> </div><div class='ctx'> 	off += node-&gt;page_offset;</div><div class='ctx'> 	pagenum = off &gt;&gt; PAGE_SHIFT;</div><div class='hunk'>@@ -31,18 +86,16 @@ void hfs_bnode_read(struct hfs_bnode *node, void *buf, int off, int len)</div><div class='ctx'> 		if (pagenum &gt;= node-&gt;tree-&gt;pages_per_bnode)</div><div class='ctx'> 			break;</div><div class='ctx'> 		page = node-&gt;page[pagenum];</div><div class='del'>-		bytes_to_read = min_t(int, len - bytes_read, PAGE_SIZE - off);</div><div class='add'>+		bytes_to_read = min_t(u32, len - bytes_read, PAGE_SIZE - off);</div><div class='ctx'> </div><div class='del'>-		vaddr = kmap_atomic(page);</div><div class='del'>-		memcpy(buf + bytes_read, vaddr + off, bytes_to_read);</div><div class='del'>-		kunmap_atomic(vaddr);</div><div class='add'>+		memcpy_from_page(buf + bytes_read, page, off, bytes_to_read);</div><div class='ctx'> </div><div class='ctx'> 		pagenum++;</div><div class='ctx'> 		off = 0; /* page offset only applies to the first page */</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-u16 hfs_bnode_read_u16(struct hfs_bnode *node, int off)</div><div class='add'>+u16 hfs_bnode_read_u16(struct hfs_bnode *node, u32 off)</div><div class='ctx'> {</div><div class='ctx'> 	__be16 data;</div><div class='ctx'> 	// optimize later...</div><div class='hunk'>@@ -50,7 +103,7 @@ u16 hfs_bnode_read_u16(struct hfs_bnode *node, int off)</div><div class='ctx'> 	return be16_to_cpu(data);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-u8 hfs_bnode_read_u8(struct hfs_bnode *node, int off)</div><div class='add'>+u8 hfs_bnode_read_u8(struct hfs_bnode *node, u32 off)</div><div class='ctx'> {</div><div class='ctx'> 	u8 data;</div><div class='ctx'> 	// optimize later...</div><div class='hunk'>@@ -58,10 +111,10 @@ u8 hfs_bnode_read_u8(struct hfs_bnode *node, int off)</div><div class='ctx'> 	return data;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void hfs_bnode_read_key(struct hfs_bnode *node, void *key, int off)</div><div class='add'>+void hfs_bnode_read_key(struct hfs_bnode *node, void *key, u32 off)</div><div class='ctx'> {</div><div class='ctx'> 	struct hfs_btree *tree;</div><div class='del'>-	int key_len;</div><div class='add'>+	u32 key_len;</div><div class='ctx'> </div><div class='ctx'> 	tree = node-&gt;tree;</div><div class='ctx'> 	if (node-&gt;type == HFS_NODE_LEAF ||</div><div class='hunk'>@@ -70,79 +123,117 @@ void hfs_bnode_read_key(struct hfs_bnode *node, void *key, int off)</div><div class='ctx'> 	else</div><div class='ctx'> 		key_len = tree-&gt;max_key_len + 1;</div><div class='ctx'> </div><div class='add'>+	if (key_len &gt; sizeof(hfs_btree_key) || key_len &lt; 1) {</div><div class='add'>+		memset(key, 0, sizeof(hfs_btree_key));</div><div class='add'>+		pr_err("hfs: Invalid key length: %u\n", key_len);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	hfs_bnode_read(node, key, off, key_len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void hfs_bnode_write(struct hfs_bnode *node, void *buf, int off, int len)</div><div class='add'>+void hfs_bnode_write(struct hfs_bnode *node, void *buf, u32 off, u32 len)</div><div class='ctx'> {</div><div class='ctx'> 	struct page *page;</div><div class='ctx'> </div><div class='add'>+	if (!is_bnode_offset_valid(node, off))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (len == 0) {</div><div class='add'>+		pr_err("requested zero length: "</div><div class='add'>+		       "NODE: id %u, type %#x, height %u, "</div><div class='add'>+		       "node_size %u, offset %u, len %u\n",</div><div class='add'>+		       node-&gt;this, node-&gt;type, node-&gt;height,</div><div class='add'>+		       node-&gt;tree-&gt;node_size, off, len);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	len = check_and_correct_requested_length(node, off, len);</div><div class='add'>+</div><div class='ctx'> 	off += node-&gt;page_offset;</div><div class='ctx'> 	page = node-&gt;page[0];</div><div class='ctx'> </div><div class='del'>-	memcpy(kmap(page) + off, buf, len);</div><div class='del'>-	kunmap(page);</div><div class='add'>+	memcpy_to_page(page, off, buf, len);</div><div class='ctx'> 	set_page_dirty(page);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void hfs_bnode_write_u16(struct hfs_bnode *node, int off, u16 data)</div><div class='add'>+void hfs_bnode_write_u16(struct hfs_bnode *node, u32 off, u16 data)</div><div class='ctx'> {</div><div class='ctx'> 	__be16 v = cpu_to_be16(data);</div><div class='ctx'> 	// optimize later...</div><div class='ctx'> 	hfs_bnode_write(node, &amp;v, off, 2);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void hfs_bnode_write_u8(struct hfs_bnode *node, int off, u8 data)</div><div class='add'>+void hfs_bnode_write_u8(struct hfs_bnode *node, u32 off, u8 data)</div><div class='ctx'> {</div><div class='ctx'> 	// optimize later...</div><div class='ctx'> 	hfs_bnode_write(node, &amp;data, off, 1);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void hfs_bnode_clear(struct hfs_bnode *node, int off, int len)</div><div class='add'>+void hfs_bnode_clear(struct hfs_bnode *node, u32 off, u32 len)</div><div class='ctx'> {</div><div class='ctx'> 	struct page *page;</div><div class='ctx'> </div><div class='add'>+	if (!is_bnode_offset_valid(node, off))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (len == 0) {</div><div class='add'>+		pr_err("requested zero length: "</div><div class='add'>+		       "NODE: id %u, type %#x, height %u, "</div><div class='add'>+		       "node_size %u, offset %u, len %u\n",</div><div class='add'>+		       node-&gt;this, node-&gt;type, node-&gt;height,</div><div class='add'>+		       node-&gt;tree-&gt;node_size, off, len);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	len = check_and_correct_requested_length(node, off, len);</div><div class='add'>+</div><div class='ctx'> 	off += node-&gt;page_offset;</div><div class='ctx'> 	page = node-&gt;page[0];</div><div class='ctx'> </div><div class='del'>-	memset(kmap(page) + off, 0, len);</div><div class='del'>-	kunmap(page);</div><div class='add'>+	memzero_page(page, off, len);</div><div class='ctx'> 	set_page_dirty(page);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void hfs_bnode_copy(struct hfs_bnode *dst_node, int dst,</div><div class='del'>-		struct hfs_bnode *src_node, int src, int len)</div><div class='add'>+void hfs_bnode_copy(struct hfs_bnode *dst_node, u32 dst,</div><div class='add'>+		    struct hfs_bnode *src_node, u32 src, u32 len)</div><div class='ctx'> {</div><div class='ctx'> 	struct page *src_page, *dst_page;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(BNODE_MOD, "copybytes: %u,%u,%u\n", dst, src, len);</div><div class='add'>+	hfs_dbg("dst %u, src %u, len %u\n", dst, src, len);</div><div class='ctx'> 	if (!len)</div><div class='ctx'> 		return;</div><div class='add'>+</div><div class='add'>+	len = check_and_correct_requested_length(src_node, src, len);</div><div class='add'>+	len = check_and_correct_requested_length(dst_node, dst, len);</div><div class='add'>+</div><div class='ctx'> 	src += src_node-&gt;page_offset;</div><div class='ctx'> 	dst += dst_node-&gt;page_offset;</div><div class='ctx'> 	src_page = src_node-&gt;page[0];</div><div class='ctx'> 	dst_page = dst_node-&gt;page[0];</div><div class='ctx'> </div><div class='del'>-	memcpy(kmap(dst_page) + dst, kmap(src_page) + src, len);</div><div class='del'>-	kunmap(src_page);</div><div class='del'>-	kunmap(dst_page);</div><div class='add'>+	memcpy_page(dst_page, dst, src_page, src, len);</div><div class='ctx'> 	set_page_dirty(dst_page);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void hfs_bnode_move(struct hfs_bnode *node, int dst, int src, int len)</div><div class='add'>+void hfs_bnode_move(struct hfs_bnode *node, u32 dst, u32 src, u32 len)</div><div class='ctx'> {</div><div class='ctx'> 	struct page *page;</div><div class='ctx'> 	void *ptr;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(BNODE_MOD, "movebytes: %u,%u,%u\n", dst, src, len);</div><div class='add'>+	hfs_dbg("dst %u, src %u, len %u\n", dst, src, len);</div><div class='ctx'> 	if (!len)</div><div class='ctx'> 		return;</div><div class='add'>+</div><div class='add'>+	len = check_and_correct_requested_length(node, src, len);</div><div class='add'>+	len = check_and_correct_requested_length(node, dst, len);</div><div class='add'>+</div><div class='ctx'> 	src += node-&gt;page_offset;</div><div class='ctx'> 	dst += node-&gt;page_offset;</div><div class='ctx'> 	page = node-&gt;page[0];</div><div class='del'>-	ptr = kmap(page);</div><div class='add'>+	ptr = kmap_local_page(page);</div><div class='ctx'> 	memmove(ptr + dst, ptr + src, len);</div><div class='del'>-	kunmap(page);</div><div class='add'>+	kunmap_local(ptr);</div><div class='ctx'> 	set_page_dirty(page);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -152,16 +243,16 @@ void hfs_bnode_dump(struct hfs_bnode *node)</div><div class='ctx'> 	__be32 cnid;</div><div class='ctx'> 	int i, off, key_off;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(BNODE_MOD, "bnode: %d\n", node-&gt;this);</div><div class='add'>+	hfs_dbg("node %d\n", node-&gt;this);</div><div class='ctx'> 	hfs_bnode_read(node, &amp;desc, 0, sizeof(desc));</div><div class='del'>-	hfs_dbg(BNODE_MOD, "%d, %d, %d, %d, %d\n",</div><div class='add'>+	hfs_dbg("next %d, prev %d, type %d, height %d, num_recs %d\n",</div><div class='ctx'> 		be32_to_cpu(desc.next), be32_to_cpu(desc.prev),</div><div class='ctx'> 		desc.type, desc.height, be16_to_cpu(desc.num_recs));</div><div class='ctx'> </div><div class='ctx'> 	off = node-&gt;tree-&gt;node_size - 2;</div><div class='ctx'> 	for (i = be16_to_cpu(desc.num_recs); i &gt;= 0; off -= 2, i--) {</div><div class='ctx'> 		key_off = hfs_bnode_read_u16(node, off);</div><div class='del'>-		hfs_dbg_cont(BNODE_MOD, " %d", key_off);</div><div class='add'>+		hfs_dbg(" key_off %d", key_off);</div><div class='ctx'> 		if (i &amp;&amp; node-&gt;type == HFS_NODE_INDEX) {</div><div class='ctx'> 			int tmp;</div><div class='ctx'> </div><div class='hunk'>@@ -169,18 +260,18 @@ void hfs_bnode_dump(struct hfs_bnode *node)</div><div class='ctx'> 				tmp = (hfs_bnode_read_u8(node, key_off) | 1) + 1;</div><div class='ctx'> 			else</div><div class='ctx'> 				tmp = node-&gt;tree-&gt;max_key_len + 1;</div><div class='del'>-			hfs_dbg_cont(BNODE_MOD, " (%d,%d",</div><div class='del'>-				     tmp, hfs_bnode_read_u8(node, key_off));</div><div class='add'>+			hfs_dbg(" (%d,%d",</div><div class='add'>+				tmp, hfs_bnode_read_u8(node, key_off));</div><div class='ctx'> 			hfs_bnode_read(node, &amp;cnid, key_off + tmp, 4);</div><div class='del'>-			hfs_dbg_cont(BNODE_MOD, ",%d)", be32_to_cpu(cnid));</div><div class='add'>+			hfs_dbg(", cnid %d)", be32_to_cpu(cnid));</div><div class='ctx'> 		} else if (i &amp;&amp; node-&gt;type == HFS_NODE_LEAF) {</div><div class='ctx'> 			int tmp;</div><div class='ctx'> </div><div class='ctx'> 			tmp = hfs_bnode_read_u8(node, key_off);</div><div class='del'>-			hfs_dbg_cont(BNODE_MOD, " (%d)", tmp);</div><div class='add'>+			hfs_dbg(" (%d)", tmp);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	hfs_dbg_cont(BNODE_MOD, "\n");</div><div class='add'>+	hfs_dbg("\n");</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void hfs_bnode_unlink(struct hfs_bnode *node)</div><div class='hunk'>@@ -270,7 +361,7 @@ static struct hfs_bnode *__hfs_bnode_create(struct hfs_btree *tree, u32 cnid)</div><div class='ctx'> 	node-&gt;this = cnid;</div><div class='ctx'> 	set_bit(HFS_BNODE_NEW, &amp;node-&gt;flags);</div><div class='ctx'> 	atomic_set(&amp;node-&gt;refcnt, 1);</div><div class='del'>-	hfs_dbg(BNODE_REFS, "new_node(%d:%d): 1\n",</div><div class='add'>+	hfs_dbg("cnid %d, node %d, refcnt 1\n",</div><div class='ctx'> 		node-&gt;tree-&gt;cnid, node-&gt;this);</div><div class='ctx'> 	init_waitqueue_head(&amp;node-&gt;lock_wq);</div><div class='ctx'> 	spin_lock(&amp;tree-&gt;hash_lock);</div><div class='hunk'>@@ -281,6 +372,7 @@ static struct hfs_bnode *__hfs_bnode_create(struct hfs_btree *tree, u32 cnid)</div><div class='ctx'> 		tree-&gt;node_hash[hash] = node;</div><div class='ctx'> 		tree-&gt;node_hash_cnt++;</div><div class='ctx'> 	} else {</div><div class='add'>+		hfs_bnode_get(node2);</div><div class='ctx'> 		spin_unlock(&amp;tree-&gt;hash_lock);</div><div class='ctx'> 		kfree(node);</div><div class='ctx'> 		wait_event(node2-&gt;lock_wq, !test_bit(HFS_BNODE_NEW, &amp;node2-&gt;flags));</div><div class='hunk'>@@ -296,10 +388,6 @@ static struct hfs_bnode *__hfs_bnode_create(struct hfs_btree *tree, u32 cnid)</div><div class='ctx'> 		page = read_mapping_page(mapping, block++, NULL);</div><div class='ctx'> 		if (IS_ERR(page))</div><div class='ctx'> 			goto fail;</div><div class='del'>-		if (PageError(page)) {</div><div class='del'>-			put_page(page);</div><div class='del'>-			goto fail;</div><div class='del'>-		}</div><div class='ctx'> 		node-&gt;page[i] = page;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -313,7 +401,7 @@ void hfs_bnode_unhash(struct hfs_bnode *node)</div><div class='ctx'> {</div><div class='ctx'> 	struct hfs_bnode **p;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(BNODE_REFS, "remove_node(%d:%d): %d\n",</div><div class='add'>+	hfs_dbg("cnid %d, node %d, refcnt %d\n",</div><div class='ctx'> 		node-&gt;tree-&gt;cnid, node-&gt;this, atomic_read(&amp;node-&gt;refcnt));</div><div class='ctx'> 	for (p = &amp;node-&gt;tree-&gt;node_hash[hfs_bnode_hash(node-&gt;this)];</div><div class='ctx'> 	     *p &amp;&amp; *p != node; p = &amp;(*p)-&gt;next_hash)</div><div class='hunk'>@@ -350,13 +438,14 @@ struct hfs_bnode *hfs_bnode_find(struct hfs_btree *tree, u32 num)</div><div class='ctx'> 	if (!test_bit(HFS_BNODE_NEW, &amp;node-&gt;flags))</div><div class='ctx'> 		return node;</div><div class='ctx'> </div><div class='del'>-	desc = (struct hfs_bnode_desc *)(kmap(node-&gt;page[0]) + node-&gt;page_offset);</div><div class='add'>+	desc = (struct hfs_bnode_desc *)(kmap_local_page(node-&gt;page[0]) +</div><div class='add'>+					 node-&gt;page_offset);</div><div class='ctx'> 	node-&gt;prev = be32_to_cpu(desc-&gt;prev);</div><div class='ctx'> 	node-&gt;next = be32_to_cpu(desc-&gt;next);</div><div class='ctx'> 	node-&gt;num_recs = be16_to_cpu(desc-&gt;num_recs);</div><div class='ctx'> 	node-&gt;type = desc-&gt;type;</div><div class='ctx'> 	node-&gt;height = desc-&gt;height;</div><div class='del'>-	kunmap(node-&gt;page[0]);</div><div class='add'>+	kunmap_local(desc);</div><div class='ctx'> </div><div class='ctx'> 	switch (node-&gt;type) {</div><div class='ctx'> 	case HFS_NODE_HEADER:</div><div class='hunk'>@@ -440,14 +529,12 @@ struct hfs_bnode *hfs_bnode_create(struct hfs_btree *tree, u32 num)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	pagep = node-&gt;page;</div><div class='del'>-	memset(kmap(*pagep) + node-&gt;page_offset, 0,</div><div class='del'>-	       min((int)PAGE_SIZE, (int)tree-&gt;node_size));</div><div class='add'>+	memzero_page(*pagep, node-&gt;page_offset,</div><div class='add'>+		     min((int)PAGE_SIZE, (int)tree-&gt;node_size));</div><div class='ctx'> 	set_page_dirty(*pagep);</div><div class='del'>-	kunmap(*pagep);</div><div class='ctx'> 	for (i = 1; i &lt; tree-&gt;pages_per_bnode; i++) {</div><div class='del'>-		memset(kmap(*++pagep), 0, PAGE_SIZE);</div><div class='add'>+		memzero_page(*++pagep, 0, PAGE_SIZE);</div><div class='ctx'> 		set_page_dirty(*pagep);</div><div class='del'>-		kunmap(*pagep);</div><div class='ctx'> 	}</div><div class='ctx'> 	clear_bit(HFS_BNODE_NEW, &amp;node-&gt;flags);</div><div class='ctx'> 	wake_up(&amp;node-&gt;lock_wq);</div><div class='hunk'>@@ -459,7 +546,7 @@ void hfs_bnode_get(struct hfs_bnode *node)</div><div class='ctx'> {</div><div class='ctx'> 	if (node) {</div><div class='ctx'> 		atomic_inc(&amp;node-&gt;refcnt);</div><div class='del'>-		hfs_dbg(BNODE_REFS, "get_node(%d:%d): %d\n",</div><div class='add'>+		hfs_dbg("cnid %d, node %d, refcnt %d\n",</div><div class='ctx'> 			node-&gt;tree-&gt;cnid, node-&gt;this,</div><div class='ctx'> 			atomic_read(&amp;node-&gt;refcnt));</div><div class='ctx'> 	}</div><div class='hunk'>@@ -472,7 +559,7 @@ void hfs_bnode_put(struct hfs_bnode *node)</div><div class='ctx'> 		struct hfs_btree *tree = node-&gt;tree;</div><div class='ctx'> 		int i;</div><div class='ctx'> </div><div class='del'>-		hfs_dbg(BNODE_REFS, "put_node(%d:%d): %d\n",</div><div class='add'>+		hfs_dbg("cnid %d, node %d, refcnt %d\n",</div><div class='ctx'> 			node-&gt;tree-&gt;cnid, node-&gt;this,</div><div class='ctx'> 			atomic_read(&amp;node-&gt;refcnt));</div><div class='ctx'> 		BUG_ON(!atomic_read(&amp;node-&gt;refcnt));</div><div class='hunk'>@@ -487,6 +574,7 @@ void hfs_bnode_put(struct hfs_bnode *node)</div><div class='ctx'> 		if (test_bit(HFS_BNODE_DELETED, &amp;node-&gt;flags)) {</div><div class='ctx'> 			hfs_bnode_unhash(node);</div><div class='ctx'> 			spin_unlock(&amp;tree-&gt;hash_lock);</div><div class='add'>+			hfs_bnode_clear(node, 0, tree-&gt;node_size);</div><div class='ctx'> 			hfs_bmap_free(node);</div><div class='ctx'> 			hfs_bnode_free(node);</div><div class='ctx'> 			return;</div><div class='head'>diff --git a/fs/hfs/brec.c b/fs/hfs/brec.c<br/>index 896396554bcc..5a2f740ddefd 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfs/brec.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/brec.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfs/brec.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfs/brec.c</a></div><div class='hunk'>@@ -62,7 +62,7 @@ u16 hfs_brec_keylen(struct hfs_bnode *node, u16 rec)</div><div class='ctx'> 	return retval;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int hfs_brec_insert(struct hfs_find_data *fd, void *entry, int entry_len)</div><div class='add'>+int hfs_brec_insert(struct hfs_find_data *fd, void *entry, u32 entry_len)</div><div class='ctx'> {</div><div class='ctx'> 	struct hfs_btree *tree;</div><div class='ctx'> 	struct hfs_bnode *node, *new_node;</div><div class='hunk'>@@ -94,7 +94,7 @@ again:</div><div class='ctx'> 	end_rec_off = tree-&gt;node_size - (node-&gt;num_recs + 1) * 2;</div><div class='ctx'> 	end_off = hfs_bnode_read_u16(node, end_rec_off);</div><div class='ctx'> 	end_rec_off -= 2;</div><div class='del'>-	hfs_dbg(BNODE_MOD, "insert_rec: %d, %d, %d, %d\n",</div><div class='add'>+	hfs_dbg("rec %d, size %d, end_off %d, end_rec_off %d\n",</div><div class='ctx'> 		rec, size, end_off, end_rec_off);</div><div class='ctx'> 	if (size &gt; end_rec_off - end_off) {</div><div class='ctx'> 		if (new_node)</div><div class='hunk'>@@ -179,6 +179,7 @@ int hfs_brec_remove(struct hfs_find_data *fd)</div><div class='ctx'> 	struct hfs_btree *tree;</div><div class='ctx'> 	struct hfs_bnode *node, *parent;</div><div class='ctx'> 	int end_off, rec_off, data_off, size;</div><div class='add'>+	int src, dst, len;</div><div class='ctx'> </div><div class='ctx'> 	tree = fd-&gt;tree;</div><div class='ctx'> 	node = fd-&gt;bnode;</div><div class='hunk'>@@ -191,7 +192,7 @@ again:</div><div class='ctx'> 		mark_inode_dirty(tree-&gt;inode);</div><div class='ctx'> 	}</div><div class='ctx'> 	hfs_bnode_dump(node);</div><div class='del'>-	hfs_dbg(BNODE_MOD, "remove_rec: %d, %d\n",</div><div class='add'>+	hfs_dbg("rec %d, len %d\n",</div><div class='ctx'> 		fd-&gt;record, fd-&gt;keylength + fd-&gt;entrylength);</div><div class='ctx'> 	if (!--node-&gt;num_recs) {</div><div class='ctx'> 		hfs_bnode_unlink(node);</div><div class='hunk'>@@ -208,10 +209,14 @@ again:</div><div class='ctx'> 	}</div><div class='ctx'> 	hfs_bnode_write_u16(node, offsetof(struct hfs_bnode_desc, num_recs), node-&gt;num_recs);</div><div class='ctx'> </div><div class='del'>-	if (rec_off == end_off)</div><div class='del'>-		goto skip;</div><div class='ctx'> 	size = fd-&gt;keylength + fd-&gt;entrylength;</div><div class='ctx'> </div><div class='add'>+	if (rec_off == end_off) {</div><div class='add'>+		src = fd-&gt;keyoffset;</div><div class='add'>+		hfs_bnode_clear(node, src, size);</div><div class='add'>+		goto skip;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	do {</div><div class='ctx'> 		data_off = hfs_bnode_read_u16(node, rec_off);</div><div class='ctx'> 		hfs_bnode_write_u16(node, rec_off + 2, data_off - size);</div><div class='hunk'>@@ -219,9 +224,23 @@ again:</div><div class='ctx'> 	} while (rec_off &gt;= end_off);</div><div class='ctx'> </div><div class='ctx'> 	/* fill hole */</div><div class='del'>-	hfs_bnode_move(node, fd-&gt;keyoffset, fd-&gt;keyoffset + size,</div><div class='del'>-		       data_off - fd-&gt;keyoffset - size);</div><div class='add'>+	dst = fd-&gt;keyoffset;</div><div class='add'>+	src = fd-&gt;keyoffset + size;</div><div class='add'>+	len = data_off - src;</div><div class='add'>+</div><div class='add'>+	hfs_bnode_move(node, dst, src, len);</div><div class='add'>+</div><div class='add'>+	src = dst + len;</div><div class='add'>+	len = data_off - src;</div><div class='add'>+</div><div class='add'>+	hfs_bnode_clear(node, src, len);</div><div class='add'>+</div><div class='ctx'> skip:</div><div class='add'>+	/*</div><div class='add'>+	 * Remove the obsolete offset to free space.</div><div class='add'>+	 */</div><div class='add'>+	hfs_bnode_write_u16(node, end_off, 0);</div><div class='add'>+</div><div class='ctx'> 	hfs_bnode_dump(node);</div><div class='ctx'> 	if (!fd-&gt;record)</div><div class='ctx'> 		hfs_brec_update_parent(fd);</div><div class='hunk'>@@ -242,7 +261,7 @@ static struct hfs_bnode *hfs_bnode_split(struct hfs_find_data *fd)</div><div class='ctx'> 	if (IS_ERR(new_node))</div><div class='ctx'> 		return new_node;</div><div class='ctx'> 	hfs_bnode_get(node);</div><div class='del'>-	hfs_dbg(BNODE_MOD, "split_nodes: %d - %d - %d\n",</div><div class='add'>+	hfs_dbg("this %d, new %d, next %d\n",</div><div class='ctx'> 		node-&gt;this, new_node-&gt;this, node-&gt;next);</div><div class='ctx'> 	new_node-&gt;next = node-&gt;next;</div><div class='ctx'> 	new_node-&gt;prev = node-&gt;this;</div><div class='hunk'>@@ -378,7 +397,7 @@ again:</div><div class='ctx'> 		newkeylen = (hfs_bnode_read_u8(node, 14) | 1) + 1;</div><div class='ctx'> 	else</div><div class='ctx'> 		fd-&gt;keylength = newkeylen = tree-&gt;max_key_len + 1;</div><div class='del'>-	hfs_dbg(BNODE_MOD, "update_rec: %d, %d, %d\n",</div><div class='add'>+	hfs_dbg("rec %d, keylength %d, newkeylen %d\n",</div><div class='ctx'> 		rec, fd-&gt;keylength, newkeylen);</div><div class='ctx'> </div><div class='ctx'> 	rec_off = tree-&gt;node_size - (rec + 2) * 2;</div><div class='head'>diff --git a/fs/hfs/btree.c b/fs/hfs/btree.c<br/>index 19017d296173..7bc425283d49 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfs/btree.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/btree.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfs/btree.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfs/btree.c</a></div><div class='hunk'>@@ -21,8 +21,12 @@ struct hfs_btree *hfs_btree_open(struct super_block *sb, u32 id, btree_keycmp ke</div><div class='ctx'> 	struct hfs_btree *tree;</div><div class='ctx'> 	struct hfs_btree_header_rec *head;</div><div class='ctx'> 	struct address_space *mapping;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	struct buffer_head *bh;</div><div class='ctx'> 	unsigned int size;</div><div class='add'>+	u16 dblock;</div><div class='add'>+	sector_t start_block;</div><div class='add'>+	loff_t offset;</div><div class='ctx'> </div><div class='ctx'> 	tree = kzalloc(sizeof(*tree), GFP_KERNEL);</div><div class='ctx'> 	if (!tree)</div><div class='hunk'>@@ -38,7 +42,7 @@ struct hfs_btree *hfs_btree_open(struct super_block *sb, u32 id, btree_keycmp ke</div><div class='ctx'> 	tree-&gt;inode = iget_locked(sb, id);</div><div class='ctx'> 	if (!tree-&gt;inode)</div><div class='ctx'> 		goto free_tree;</div><div class='del'>-	BUG_ON(!(tree-&gt;inode-&gt;i_state &amp; I_NEW));</div><div class='add'>+	BUG_ON(!(inode_state_read_once(tree-&gt;inode) &amp; I_NEW));</div><div class='ctx'> 	{</div><div class='ctx'> 	struct hfs_mdb *mdb = HFS_SB(sb)-&gt;mdb;</div><div class='ctx'> 	HFS_I(tree-&gt;inode)-&gt;flags = 0;</div><div class='hunk'>@@ -75,12 +79,41 @@ struct hfs_btree *hfs_btree_open(struct super_block *sb, u32 id, btree_keycmp ke</div><div class='ctx'> 	unlock_new_inode(tree-&gt;inode);</div><div class='ctx'> </div><div class='ctx'> 	mapping = tree-&gt;inode-&gt;i_mapping;</div><div class='del'>-	page = read_mapping_page(mapping, 0, NULL);</div><div class='del'>-	if (IS_ERR(page))</div><div class='add'>+	folio = filemap_grab_folio(mapping, 0);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='ctx'> 		goto free_inode;</div><div class='ctx'> </div><div class='add'>+	folio_zero_range(folio, 0, folio_size(folio));</div><div class='add'>+</div><div class='add'>+	dblock = hfs_ext_find_block(HFS_I(tree-&gt;inode)-&gt;first_extents, 0);</div><div class='add'>+	start_block = HFS_SB(sb)-&gt;fs_start + (dblock * HFS_SB(sb)-&gt;fs_div);</div><div class='add'>+</div><div class='add'>+	size = folio_size(folio);</div><div class='add'>+	offset = 0;</div><div class='add'>+	while (size &gt; 0) {</div><div class='add'>+		size_t len;</div><div class='add'>+</div><div class='add'>+		bh = sb_bread(sb, start_block);</div><div class='add'>+		if (!bh) {</div><div class='add'>+			pr_err("unable to read tree header\n");</div><div class='add'>+			goto put_folio;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		len = min_t(size_t, folio_size(folio), sb-&gt;s_blocksize);</div><div class='add'>+		memcpy_to_folio(folio, offset, bh-&gt;b_data, sb-&gt;s_blocksize);</div><div class='add'>+</div><div class='add'>+		brelse(bh);</div><div class='add'>+</div><div class='add'>+		start_block++;</div><div class='add'>+		offset += len;</div><div class='add'>+		size -= len;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	folio_mark_uptodate(folio);</div><div class='add'>+</div><div class='ctx'> 	/* Load the header */</div><div class='del'>-	head = (struct hfs_btree_header_rec *)(kmap(page) + sizeof(struct hfs_bnode_desc));</div><div class='add'>+	head = (struct hfs_btree_header_rec *)(kmap_local_folio(folio, 0) +</div><div class='add'>+					       sizeof(struct hfs_bnode_desc));</div><div class='ctx'> 	tree-&gt;root = be32_to_cpu(head-&gt;root);</div><div class='ctx'> 	tree-&gt;leaf_count = be32_to_cpu(head-&gt;leaf_count);</div><div class='ctx'> 	tree-&gt;leaf_head = be32_to_cpu(head-&gt;leaf_head);</div><div class='hunk'>@@ -94,22 +127,22 @@ struct hfs_btree *hfs_btree_open(struct super_block *sb, u32 id, btree_keycmp ke</div><div class='ctx'> </div><div class='ctx'> 	size = tree-&gt;node_size;</div><div class='ctx'> 	if (!is_power_of_2(size))</div><div class='del'>-		goto fail_page;</div><div class='add'>+		goto fail_folio;</div><div class='ctx'> 	if (!tree-&gt;node_count)</div><div class='del'>-		goto fail_page;</div><div class='add'>+		goto fail_folio;</div><div class='ctx'> 	switch (id) {</div><div class='ctx'> 	case HFS_EXT_CNID:</div><div class='ctx'> 		if (tree-&gt;max_key_len != HFS_MAX_EXT_KEYLEN) {</div><div class='ctx'> 			pr_err("invalid extent max_key_len %d\n",</div><div class='ctx'> 			       tree-&gt;max_key_len);</div><div class='del'>-			goto fail_page;</div><div class='add'>+			goto fail_folio;</div><div class='ctx'> 		}</div><div class='ctx'> 		break;</div><div class='ctx'> 	case HFS_CAT_CNID:</div><div class='ctx'> 		if (tree-&gt;max_key_len != HFS_MAX_CAT_KEYLEN) {</div><div class='ctx'> 			pr_err("invalid catalog max_key_len %d\n",</div><div class='ctx'> 			       tree-&gt;max_key_len);</div><div class='del'>-			goto fail_page;</div><div class='add'>+			goto fail_folio;</div><div class='ctx'> 		}</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='hunk'>@@ -119,12 +152,16 @@ struct hfs_btree *hfs_btree_open(struct super_block *sb, u32 id, btree_keycmp ke</div><div class='ctx'> 	tree-&gt;node_size_shift = ffs(size) - 1;</div><div class='ctx'> 	tree-&gt;pages_per_bnode = (tree-&gt;node_size + PAGE_SIZE - 1) &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> </div><div class='del'>-	kunmap(page);</div><div class='del'>-	put_page(page);</div><div class='add'>+	kunmap_local(head);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> 	return tree;</div><div class='ctx'> </div><div class='del'>-fail_page:</div><div class='del'>-	put_page(page);</div><div class='add'>+fail_folio:</div><div class='add'>+	kunmap_local(head);</div><div class='add'>+put_folio:</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> free_inode:</div><div class='ctx'> 	tree-&gt;inode-&gt;i_mapping-&gt;a_ops = &amp;hfs_aops;</div><div class='ctx'> 	iput(tree-&gt;inode);</div><div class='hunk'>@@ -169,7 +206,8 @@ void hfs_btree_write(struct hfs_btree *tree)</div><div class='ctx'> 		return;</div><div class='ctx'> 	/* Load the header */</div><div class='ctx'> 	page = node-&gt;page[0];</div><div class='del'>-	head = (struct hfs_btree_header_rec *)(kmap(page) + sizeof(struct hfs_bnode_desc));</div><div class='add'>+	head = (struct hfs_btree_header_rec *)(kmap_local_page(page) +</div><div class='add'>+					       sizeof(struct hfs_bnode_desc));</div><div class='ctx'> </div><div class='ctx'> 	head-&gt;root = cpu_to_be32(tree-&gt;root);</div><div class='ctx'> 	head-&gt;leaf_count = cpu_to_be32(tree-&gt;leaf_count);</div><div class='hunk'>@@ -180,7 +218,7 @@ void hfs_btree_write(struct hfs_btree *tree)</div><div class='ctx'> 	head-&gt;attributes = cpu_to_be32(tree-&gt;attributes);</div><div class='ctx'> 	head-&gt;depth = cpu_to_be16(tree-&gt;depth);</div><div class='ctx'> </div><div class='del'>-	kunmap(page);</div><div class='add'>+	kunmap_local(head);</div><div class='ctx'> 	set_page_dirty(page);</div><div class='ctx'> 	hfs_bnode_put(node);</div><div class='ctx'> }</div><div class='hunk'>@@ -221,7 +259,7 @@ static struct hfs_bnode *hfs_bmap_new_bmap(struct hfs_bnode *prev, u32 idx)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Make sure @tree has enough space for the @rsvd_nodes */</div><div class='del'>-int hfs_bmap_reserve(struct hfs_btree *tree, int rsvd_nodes)</div><div class='add'>+int hfs_bmap_reserve(struct hfs_btree *tree, u32 rsvd_nodes)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = tree-&gt;inode;</div><div class='ctx'> 	u32 count;</div><div class='hunk'>@@ -268,7 +306,7 @@ struct hfs_bnode *hfs_bmap_alloc(struct hfs_btree *tree)</div><div class='ctx'> </div><div class='ctx'> 	off += node-&gt;page_offset;</div><div class='ctx'> 	pagep = node-&gt;page + (off &gt;&gt; PAGE_SHIFT);</div><div class='del'>-	data = kmap(*pagep);</div><div class='add'>+	data = kmap_local_page(*pagep);</div><div class='ctx'> 	off &amp;= ~PAGE_MASK;</div><div class='ctx'> 	idx = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -281,7 +319,7 @@ struct hfs_bnode *hfs_bmap_alloc(struct hfs_btree *tree)</div><div class='ctx'> 						idx += i;</div><div class='ctx'> 						data[off] |= m;</div><div class='ctx'> 						set_page_dirty(*pagep);</div><div class='del'>-						kunmap(*pagep);</div><div class='add'>+						kunmap_local(data);</div><div class='ctx'> 						tree-&gt;free_nodes--;</div><div class='ctx'> 						mark_inode_dirty(tree-&gt;inode);</div><div class='ctx'> 						hfs_bnode_put(node);</div><div class='hunk'>@@ -290,14 +328,14 @@ struct hfs_bnode *hfs_bmap_alloc(struct hfs_btree *tree)</div><div class='ctx'> 				}</div><div class='ctx'> 			}</div><div class='ctx'> 			if (++off &gt;= PAGE_SIZE) {</div><div class='del'>-				kunmap(*pagep);</div><div class='del'>-				data = kmap(*++pagep);</div><div class='add'>+				kunmap_local(data);</div><div class='add'>+				data = kmap_local_page(*++pagep);</div><div class='ctx'> 				off = 0;</div><div class='ctx'> 			}</div><div class='ctx'> 			idx += 8;</div><div class='ctx'> 			len--;</div><div class='ctx'> 		}</div><div class='del'>-		kunmap(*pagep);</div><div class='add'>+		kunmap_local(data);</div><div class='ctx'> 		nidx = node-&gt;next;</div><div class='ctx'> 		if (!nidx) {</div><div class='ctx'> 			printk(KERN_DEBUG "create new bmap node...\n");</div><div class='hunk'>@@ -313,7 +351,7 @@ struct hfs_bnode *hfs_bmap_alloc(struct hfs_btree *tree)</div><div class='ctx'> 		off = off16;</div><div class='ctx'> 		off += node-&gt;page_offset;</div><div class='ctx'> 		pagep = node-&gt;page + (off &gt;&gt; PAGE_SHIFT);</div><div class='del'>-		data = kmap(*pagep);</div><div class='add'>+		data = kmap_local_page(*pagep);</div><div class='ctx'> 		off &amp;= ~PAGE_MASK;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -326,7 +364,7 @@ void hfs_bmap_free(struct hfs_bnode *node)</div><div class='ctx'> 	u32 nidx;</div><div class='ctx'> 	u8 *data, byte, m;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(BNODE_MOD, "btree_free_node: %u\n", node-&gt;this);</div><div class='add'>+	hfs_dbg("node %u\n", node-&gt;this);</div><div class='ctx'> 	tree = node-&gt;tree;</div><div class='ctx'> 	nidx = node-&gt;this;</div><div class='ctx'> 	node = hfs_bnode_find(tree, 0);</div><div class='hunk'>@@ -360,20 +398,20 @@ void hfs_bmap_free(struct hfs_bnode *node)</div><div class='ctx'> 	}</div><div class='ctx'> 	off += node-&gt;page_offset + nidx / 8;</div><div class='ctx'> 	page = node-&gt;page[off &gt;&gt; PAGE_SHIFT];</div><div class='del'>-	data = kmap(page);</div><div class='add'>+	data = kmap_local_page(page);</div><div class='ctx'> 	off &amp;= ~PAGE_MASK;</div><div class='ctx'> 	m = 1 &lt;&lt; (~nidx &amp; 7);</div><div class='ctx'> 	byte = data[off];</div><div class='ctx'> 	if (!(byte &amp; m)) {</div><div class='ctx'> 		pr_crit("trying to free free bnode %u(%d)\n",</div><div class='ctx'> 			node-&gt;this, node-&gt;type);</div><div class='del'>-		kunmap(page);</div><div class='add'>+		kunmap_local(data);</div><div class='ctx'> 		hfs_bnode_put(node);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> 	data[off] = byte &amp; ~m;</div><div class='ctx'> 	set_page_dirty(page);</div><div class='del'>-	kunmap(page);</div><div class='add'>+	kunmap_local(data);</div><div class='ctx'> 	hfs_bnode_put(node);</div><div class='ctx'> 	tree-&gt;free_nodes++;</div><div class='ctx'> 	mark_inode_dirty(tree-&gt;inode);</div><div class='head'>diff --git a/fs/hfs/btree.h b/fs/hfs/btree.h<br/>index 0e6baee93245..99be858b2446 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfs/btree.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/btree.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfs/btree.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfs/btree.h</a></div><div class='hunk'>@@ -86,87 +86,46 @@ struct hfs_find_data {</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> /* btree.c */</div><div class='del'>-extern struct hfs_btree *hfs_btree_open(struct super_block *, u32, btree_keycmp);</div><div class='del'>-extern void hfs_btree_close(struct hfs_btree *);</div><div class='del'>-extern void hfs_btree_write(struct hfs_btree *);</div><div class='del'>-extern int hfs_bmap_reserve(struct hfs_btree *, int);</div><div class='del'>-extern struct hfs_bnode * hfs_bmap_alloc(struct hfs_btree *);</div><div class='add'>+extern struct hfs_btree *hfs_btree_open(struct super_block *sb, u32 id,</div><div class='add'>+					btree_keycmp keycmp);</div><div class='add'>+extern void hfs_btree_close(struct hfs_btree *tree);</div><div class='add'>+extern void hfs_btree_write(struct hfs_btree *tree);</div><div class='add'>+extern int hfs_bmap_reserve(struct hfs_btree *tree, u32 rsvd_nodes);</div><div class='add'>+extern struct hfs_bnode *hfs_bmap_alloc(struct hfs_btree *tree);</div><div class='ctx'> extern void hfs_bmap_free(struct hfs_bnode *node);</div><div class='ctx'> </div><div class='ctx'> /* bnode.c */</div><div class='del'>-extern void hfs_bnode_read(struct hfs_bnode *, void *, int, int);</div><div class='del'>-extern u16 hfs_bnode_read_u16(struct hfs_bnode *, int);</div><div class='del'>-extern u8 hfs_bnode_read_u8(struct hfs_bnode *, int);</div><div class='del'>-extern void hfs_bnode_read_key(struct hfs_bnode *, void *, int);</div><div class='del'>-extern void hfs_bnode_write(struct hfs_bnode *, void *, int, int);</div><div class='del'>-extern void hfs_bnode_write_u16(struct hfs_bnode *, int, u16);</div><div class='del'>-extern void hfs_bnode_write_u8(struct hfs_bnode *, int, u8);</div><div class='del'>-extern void hfs_bnode_clear(struct hfs_bnode *, int, int);</div><div class='del'>-extern void hfs_bnode_copy(struct hfs_bnode *, int,</div><div class='del'>-			   struct hfs_bnode *, int, int);</div><div class='del'>-extern void hfs_bnode_move(struct hfs_bnode *, int, int, int);</div><div class='del'>-extern void hfs_bnode_dump(struct hfs_bnode *);</div><div class='del'>-extern void hfs_bnode_unlink(struct hfs_bnode *);</div><div class='del'>-extern struct hfs_bnode *hfs_bnode_findhash(struct hfs_btree *, u32);</div><div class='del'>-extern struct hfs_bnode *hfs_bnode_find(struct hfs_btree *, u32);</div><div class='del'>-extern void hfs_bnode_unhash(struct hfs_bnode *);</div><div class='del'>-extern void hfs_bnode_free(struct hfs_bnode *);</div><div class='del'>-extern struct hfs_bnode *hfs_bnode_create(struct hfs_btree *, u32);</div><div class='del'>-extern void hfs_bnode_get(struct hfs_bnode *);</div><div class='del'>-extern void hfs_bnode_put(struct hfs_bnode *);</div><div class='add'>+extern void hfs_bnode_read(struct hfs_bnode *node, void *buf, u32 off, u32 len);</div><div class='add'>+extern u16 hfs_bnode_read_u16(struct hfs_bnode *node, u32 off);</div><div class='add'>+extern u8 hfs_bnode_read_u8(struct hfs_bnode *node, u32 off);</div><div class='add'>+extern void hfs_bnode_read_key(struct hfs_bnode *node, void *key, u32 off);</div><div class='add'>+extern void hfs_bnode_write(struct hfs_bnode *node, void *buf, u32 off, u32 len);</div><div class='add'>+extern void hfs_bnode_write_u16(struct hfs_bnode *node, u32 off, u16 data);</div><div class='add'>+extern void hfs_bnode_write_u8(struct hfs_bnode *node, u32 off, u8 data);</div><div class='add'>+extern void hfs_bnode_clear(struct hfs_bnode *node, u32 off, u32 len);</div><div class='add'>+extern void hfs_bnode_copy(struct hfs_bnode *dst_node, u32 dst,</div><div class='add'>+			   struct hfs_bnode *src_node, u32 src, u32 len);</div><div class='add'>+extern void hfs_bnode_move(struct hfs_bnode *node, u32 dst, u32 src, u32 len);</div><div class='add'>+extern void hfs_bnode_dump(struct hfs_bnode *node);</div><div class='add'>+extern void hfs_bnode_unlink(struct hfs_bnode *node);</div><div class='add'>+extern struct hfs_bnode *hfs_bnode_findhash(struct hfs_btree *tree, u32 cnid);</div><div class='add'>+extern struct hfs_bnode *hfs_bnode_find(struct hfs_btree *tree, u32 num);</div><div class='add'>+extern void hfs_bnode_unhash(struct hfs_bnode *node);</div><div class='add'>+extern void hfs_bnode_free(struct hfs_bnode *node);</div><div class='add'>+extern struct hfs_bnode *hfs_bnode_create(struct hfs_btree *tree, u32 num);</div><div class='add'>+extern void hfs_bnode_get(struct hfs_bnode *node);</div><div class='add'>+extern void hfs_bnode_put(struct hfs_bnode *node);</div><div class='ctx'> </div><div class='ctx'> /* brec.c */</div><div class='del'>-extern u16 hfs_brec_lenoff(struct hfs_bnode *, u16, u16 *);</div><div class='del'>-extern u16 hfs_brec_keylen(struct hfs_bnode *, u16);</div><div class='del'>-extern int hfs_brec_insert(struct hfs_find_data *, void *, int);</div><div class='del'>-extern int hfs_brec_remove(struct hfs_find_data *);</div><div class='add'>+extern u16 hfs_brec_lenoff(struct hfs_bnode *node, u16 rec, u16 *off);</div><div class='add'>+extern u16 hfs_brec_keylen(struct hfs_bnode *node, u16 rec);</div><div class='add'>+extern int hfs_brec_insert(struct hfs_find_data *fd, void *entry, u32 entry_len);</div><div class='add'>+extern int hfs_brec_remove(struct hfs_find_data *fd);</div><div class='ctx'> </div><div class='ctx'> /* bfind.c */</div><div class='del'>-extern int hfs_find_init(struct hfs_btree *, struct hfs_find_data *);</div><div class='del'>-extern void hfs_find_exit(struct hfs_find_data *);</div><div class='del'>-extern int __hfs_brec_find(struct hfs_bnode *, struct hfs_find_data *);</div><div class='del'>-extern int hfs_brec_find(struct hfs_find_data *);</div><div class='del'>-extern int hfs_brec_read(struct hfs_find_data *, void *, int);</div><div class='del'>-extern int hfs_brec_goto(struct hfs_find_data *, int);</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-struct hfs_bnode_desc {</div><div class='del'>-	__be32 next;		/* (V) Number of the next node at this level */</div><div class='del'>-	__be32 prev;		/* (V) Number of the prev node at this level */</div><div class='del'>-	u8 type;		/* (F) The type of node */</div><div class='del'>-	u8 height;		/* (F) The level of this node (leaves=1) */</div><div class='del'>-	__be16 num_recs;	/* (V) The number of records in this node */</div><div class='del'>-	u16 reserved;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define HFS_NODE_INDEX	0x00	/* An internal (index) node */</div><div class='del'>-#define HFS_NODE_HEADER	0x01	/* The tree header node (node 0) */</div><div class='del'>-#define HFS_NODE_MAP	0x02	/* Holds part of the bitmap of used nodes */</div><div class='del'>-#define HFS_NODE_LEAF	0xFF	/* A leaf (ndNHeight==1) node */</div><div class='del'>-</div><div class='del'>-struct hfs_btree_header_rec {</div><div class='del'>-	__be16 depth;		/* (V) The number of levels in this B-tree */</div><div class='del'>-	__be32 root;		/* (V) The node number of the root node */</div><div class='del'>-	__be32 leaf_count;	/* (V) The number of leaf records */</div><div class='del'>-	__be32 leaf_head;	/* (V) The number of the first leaf node */</div><div class='del'>-	__be32 leaf_tail;	/* (V) The number of the last leaf node */</div><div class='del'>-	__be16 node_size;	/* (F) The number of bytes in a node (=512) */</div><div class='del'>-	__be16 max_key_len;	/* (F) The length of a key in an index node */</div><div class='del'>-	__be32 node_count;	/* (V) The total number of nodes */</div><div class='del'>-	__be32 free_nodes;	/* (V) The number of unused nodes */</div><div class='del'>-	u16 reserved1;</div><div class='del'>-	__be32 clump_size;	/* (F) clump size. not usually used. */</div><div class='del'>-	u8 btree_type;		/* (F) BTree type */</div><div class='del'>-	u8 reserved2;</div><div class='del'>-	__be32 attributes;	/* (F) attributes */</div><div class='del'>-	u32 reserved3[16];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define BTREE_ATTR_BADCLOSE	0x00000001	/* b-tree not closed properly. not</div><div class='del'>-						   used by hfsplus. */</div><div class='del'>-#define HFS_TREE_BIGKEYS	0x00000002	/* key length is u16 instead of u8.</div><div class='del'>-						   used by hfsplus. */</div><div class='del'>-#define HFS_TREE_VARIDXKEYS	0x00000004	/* variable key length instead of</div><div class='del'>-						   max key length. use din catalog</div><div class='del'>-						   b-tree but not in extents</div><div class='del'>-						   b-tree (hfsplus). */</div><div class='add'>+extern int hfs_find_init(struct hfs_btree *tree, struct hfs_find_data *fd);</div><div class='add'>+extern void hfs_find_exit(struct hfs_find_data *fd);</div><div class='add'>+extern int __hfs_brec_find(struct hfs_bnode *bnode, struct hfs_find_data *fd);</div><div class='add'>+extern int hfs_brec_find(struct hfs_find_data *fd);</div><div class='add'>+extern int hfs_brec_read(struct hfs_find_data *fd, void *rec, u32 rec_len);</div><div class='add'>+extern int hfs_brec_goto(struct hfs_find_data *fd, int cnt);</div><div class='head'>diff --git a/fs/hfs/catalog.c b/fs/hfs/catalog.c<br/>index d365bf0b8c77..b80ba40e3877 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfs/catalog.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/catalog.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfs/catalog.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfs/catalog.c</a></div><div class='hunk'>@@ -87,7 +87,7 @@ int hfs_cat_create(u32 cnid, struct inode *dir, const struct qstr *str, struct i</div><div class='ctx'> 	int entry_size;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(CAT_MOD, "create_cat: %s,%u(%d)\n",</div><div class='add'>+	hfs_dbg("name %s, cnid %u, i_nlink %d\n",</div><div class='ctx'> 		str-&gt;name, cnid, inode-&gt;i_nlink);</div><div class='ctx'> 	if (dir-&gt;i_size &gt;= HFS_MAX_VALENCE)</div><div class='ctx'> 		return -ENOSPC;</div><div class='hunk'>@@ -133,7 +133,7 @@ int hfs_cat_create(u32 cnid, struct inode *dir, const struct qstr *str, struct i</div><div class='ctx'> 		goto err1;</div><div class='ctx'> </div><div class='ctx'> 	dir-&gt;i_size++;</div><div class='del'>-	dir-&gt;i_mtime = dir-&gt;i_ctime = current_time(dir);</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='ctx'> 	mark_inode_dirty(dir);</div><div class='ctx'> 	hfs_find_exit(&amp;fd);</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -211,6 +211,124 @@ int hfs_cat_find_brec(struct super_block *sb, u32 cnid,</div><div class='ctx'> 	return hfs_brec_find(fd);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline</div><div class='add'>+void hfs_set_next_unused_CNID(struct super_block *sb,</div><div class='add'>+				u32 deleted_cnid, u32 found_cnid)</div><div class='add'>+{</div><div class='add'>+	if (found_cnid &lt; HFS_FIRSTUSER_CNID) {</div><div class='add'>+		atomic64_cmpxchg(&amp;HFS_SB(sb)-&gt;next_id,</div><div class='add'>+				 deleted_cnid + 1, HFS_FIRSTUSER_CNID);</div><div class='add'>+	} else {</div><div class='add'>+		atomic64_cmpxchg(&amp;HFS_SB(sb)-&gt;next_id,</div><div class='add'>+				 deleted_cnid + 1, found_cnid + 1);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * hfs_correct_next_unused_CNID()</div><div class='add'>+ *</div><div class='add'>+ * Correct the next unused CNID of Catalog Tree.</div><div class='add'>+ */</div><div class='add'>+static</div><div class='add'>+int hfs_correct_next_unused_CNID(struct super_block *sb, u32 cnid)</div><div class='add'>+{</div><div class='add'>+	struct hfs_btree *cat_tree;</div><div class='add'>+	struct hfs_bnode *node;</div><div class='add'>+	s64 leaf_head;</div><div class='add'>+	s64 leaf_tail;</div><div class='add'>+	s64 node_id;</div><div class='add'>+</div><div class='add'>+	hfs_dbg("cnid %u, next_id %lld\n",</div><div class='add'>+		cnid, atomic64_read(&amp;HFS_SB(sb)-&gt;next_id));</div><div class='add'>+</div><div class='add'>+	if ((cnid + 1) &lt; atomic64_read(&amp;HFS_SB(sb)-&gt;next_id)) {</div><div class='add'>+		/* next ID should be unchanged */</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	cat_tree = HFS_SB(sb)-&gt;cat_tree;</div><div class='add'>+	leaf_head = cat_tree-&gt;leaf_head;</div><div class='add'>+	leaf_tail = cat_tree-&gt;leaf_tail;</div><div class='add'>+</div><div class='add'>+	if (leaf_head &gt; leaf_tail) {</div><div class='add'>+		pr_err("node is corrupted: leaf_head %lld, leaf_tail %lld\n",</div><div class='add'>+			leaf_head, leaf_tail);</div><div class='add'>+		return -ERANGE;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	node = hfs_bnode_find(cat_tree, leaf_tail);</div><div class='add'>+	if (IS_ERR(node)) {</div><div class='add'>+		pr_err("fail to find leaf node: node ID %lld\n",</div><div class='add'>+			leaf_tail);</div><div class='add'>+		return -ENOENT;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	node_id = leaf_tail;</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		int i;</div><div class='add'>+</div><div class='add'>+		if (node_id != leaf_tail) {</div><div class='add'>+			node = hfs_bnode_find(cat_tree, node_id);</div><div class='add'>+			if (IS_ERR(node))</div><div class='add'>+				return -ENOENT;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		hfs_dbg("node %lld, leaf_tail %lld, leaf_head %lld\n",</div><div class='add'>+			node_id, leaf_tail, leaf_head);</div><div class='add'>+</div><div class='add'>+		hfs_bnode_dump(node);</div><div class='add'>+</div><div class='add'>+		for (i = node-&gt;num_recs - 1; i &gt;= 0; i--) {</div><div class='add'>+			hfs_cat_rec rec;</div><div class='add'>+			u16 off, len, keylen;</div><div class='add'>+			int entryoffset;</div><div class='add'>+			int entrylength;</div><div class='add'>+			u32 found_cnid;</div><div class='add'>+</div><div class='add'>+			len = hfs_brec_lenoff(node, i, &amp;off);</div><div class='add'>+			keylen = hfs_brec_keylen(node, i);</div><div class='add'>+			if (keylen == 0) {</div><div class='add'>+				pr_err("fail to get the keylen: "</div><div class='add'>+					"node_id %lld, record index %d\n",</div><div class='add'>+					node_id, i);</div><div class='add'>+				return -EINVAL;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			entryoffset = off + keylen;</div><div class='add'>+			entrylength = len - keylen;</div><div class='add'>+</div><div class='add'>+			if (entrylength &gt; sizeof(rec)) {</div><div class='add'>+				pr_err("unexpected record length: "</div><div class='add'>+					"entrylength %d\n",</div><div class='add'>+					entrylength);</div><div class='add'>+				return -EINVAL;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			hfs_bnode_read(node, &amp;rec, entryoffset, entrylength);</div><div class='add'>+</div><div class='add'>+			if (rec.type == HFS_CDR_DIR) {</div><div class='add'>+				found_cnid = be32_to_cpu(rec.dir.DirID);</div><div class='add'>+				hfs_dbg("found_cnid %u\n", found_cnid);</div><div class='add'>+				hfs_set_next_unused_CNID(sb, cnid, found_cnid);</div><div class='add'>+				hfs_bnode_put(node);</div><div class='add'>+				return 0;</div><div class='add'>+			} else if (rec.type == HFS_CDR_FIL) {</div><div class='add'>+				found_cnid = be32_to_cpu(rec.file.FlNum);</div><div class='add'>+				hfs_dbg("found_cnid %u\n", found_cnid);</div><div class='add'>+				hfs_set_next_unused_CNID(sb, cnid, found_cnid);</div><div class='add'>+				hfs_bnode_put(node);</div><div class='add'>+				return 0;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		node_id = node-&gt;prev;</div><div class='add'>+		hfs_bnode_put(node);</div><div class='add'>+</div><div class='add'>+	} while (node_id &gt;= leaf_head);</div><div class='add'>+</div><div class='add'>+	return -ENOENT;</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * hfs_cat_delete()</div><div class='hunk'>@@ -225,7 +343,7 @@ int hfs_cat_delete(u32 cnid, struct inode *dir, const struct qstr *str)</div><div class='ctx'> 	struct hfs_readdir_data *rd;</div><div class='ctx'> 	int res, type;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(CAT_MOD, "delete_cat: %s,%u\n", str ? str-&gt;name : NULL, cnid);</div><div class='add'>+	hfs_dbg("name %s, cnid %u\n", str ? str-&gt;name : NULL, cnid);</div><div class='ctx'> 	sb = dir-&gt;i_sb;</div><div class='ctx'> 	res = hfs_find_init(HFS_SB(sb)-&gt;cat_tree, &amp;fd);</div><div class='ctx'> 	if (res)</div><div class='hunk'>@@ -269,8 +387,13 @@ int hfs_cat_delete(u32 cnid, struct inode *dir, const struct qstr *str)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	dir-&gt;i_size--;</div><div class='del'>-	dir-&gt;i_mtime = dir-&gt;i_ctime = current_time(dir);</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='ctx'> 	mark_inode_dirty(dir);</div><div class='add'>+</div><div class='add'>+	res = hfs_correct_next_unused_CNID(sb, cnid);</div><div class='add'>+	if (res)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='ctx'> 	res = 0;</div><div class='ctx'> out:</div><div class='ctx'> 	hfs_find_exit(&amp;fd);</div><div class='hunk'>@@ -294,7 +417,7 @@ int hfs_cat_move(u32 cnid, struct inode *src_dir, const struct qstr *src_name,</div><div class='ctx'> 	int entry_size, type;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(CAT_MOD, "rename_cat: %u - %lu,%s - %lu,%s\n",</div><div class='add'>+	hfs_dbg("cnid %u - (ino %lu, name %s) - (ino %lu, name %s)\n",</div><div class='ctx'> 		cnid, src_dir-&gt;i_ino, src_name-&gt;name,</div><div class='ctx'> 		dst_dir-&gt;i_ino, dst_name-&gt;name);</div><div class='ctx'> 	sb = src_dir-&gt;i_sb;</div><div class='hunk'>@@ -337,7 +460,7 @@ int hfs_cat_move(u32 cnid, struct inode *src_dir, const struct qstr *src_name,</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	dst_dir-&gt;i_size++;</div><div class='del'>-	dst_dir-&gt;i_mtime = dst_dir-&gt;i_ctime = current_time(dst_dir);</div><div class='add'>+	inode_set_mtime_to_ts(dst_dir, inode_set_ctime_current(dst_dir));</div><div class='ctx'> 	mark_inode_dirty(dst_dir);</div><div class='ctx'> </div><div class='ctx'> 	/* finally remove the old entry */</div><div class='hunk'>@@ -349,7 +472,7 @@ int hfs_cat_move(u32 cnid, struct inode *src_dir, const struct qstr *src_name,</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	src_dir-&gt;i_size--;</div><div class='del'>-	src_dir-&gt;i_mtime = src_dir-&gt;i_ctime = current_time(src_dir);</div><div class='add'>+	inode_set_mtime_to_ts(src_dir, inode_set_ctime_current(src_dir));</div><div class='ctx'> 	mark_inode_dirty(src_dir);</div><div class='ctx'> </div><div class='ctx'> 	type = entry.type;</div><div class='head'>diff --git a/fs/hfs/dir.c b/fs/hfs/dir.c<br/>index 527f6e46cbe8..86a6b317b474 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfs/dir.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/dir.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfs/dir.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfs/dir.c</a></div><div class='hunk'>@@ -189,7 +189,7 @@ static int hfs_dir_release(struct inode *inode, struct file *file)</div><div class='ctx'>  * a directory and return a corresponding inode, given the inode for</div><div class='ctx'>  * the directory and the name (and its length) of the new file.</div><div class='ctx'>  */</div><div class='del'>-static int hfs_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int hfs_create(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		      struct dentry *dentry, umode_t mode, bool excl)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='hunk'>@@ -219,26 +219,26 @@ static int hfs_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'>  * in a directory, given the inode for the parent directory and the</div><div class='ctx'>  * name (and its length) of the new directory.</div><div class='ctx'>  */</div><div class='del'>-static int hfs_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-		     struct dentry *dentry, umode_t mode)</div><div class='add'>+static struct dentry *hfs_mkdir(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+				struct dentry *dentry, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	int res;</div><div class='ctx'> </div><div class='ctx'> 	inode = hfs_new_inode(dir, &amp;dentry-&gt;d_name, S_IFDIR | mode);</div><div class='ctx'> 	if (!inode)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='ctx'> 	res = hfs_cat_create(inode-&gt;i_ino, dir, &amp;dentry-&gt;d_name, inode);</div><div class='ctx'> 	if (res) {</div><div class='ctx'> 		clear_nlink(inode);</div><div class='ctx'> 		hfs_delete_inode(inode);</div><div class='ctx'> 		iput(inode);</div><div class='del'>-		return res;</div><div class='add'>+		return ERR_PTR(res);</div><div class='ctx'> 	}</div><div class='ctx'> 	d_instantiate(dentry, inode);</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='del'>-	return 0;</div><div class='add'>+	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -263,7 +263,7 @@ static int hfs_remove(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	if (res)</div><div class='ctx'> 		return res;</div><div class='ctx'> 	clear_nlink(inode);</div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> 	hfs_delete_inode(inode);</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -280,7 +280,7 @@ static int hfs_remove(struct inode *dir, struct dentry *dentry)</div><div class='ctx'>  * new file/directory.</div><div class='ctx'>  * XXX: how do you handle must_be dir?</div><div class='ctx'>  */</div><div class='del'>-static int hfs_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='add'>+static int hfs_rename(struct mnt_idmap *idmap, struct inode *old_dir,</div><div class='ctx'> 		      struct dentry *old_dentry, struct inode *new_dir,</div><div class='ctx'> 		      struct dentry *new_dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='head'>diff --git a/fs/hfs/extent.c b/fs/hfs/extent.c<br/>index 263d5028d9d1..a097908b269d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfs/extent.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/extent.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfs/extent.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfs/extent.c</a></div><div class='hunk'>@@ -71,7 +71,7 @@ int hfs_ext_keycmp(const btree_key *key1, const btree_key *key2)</div><div class='ctx'>  *</div><div class='ctx'>  * Find a block within an extent record</div><div class='ctx'>  */</div><div class='del'>-static u16 hfs_ext_find_block(struct hfs_extent *ext, u16 off)</div><div class='add'>+u16 hfs_ext_find_block(struct hfs_extent *ext, u16 off)</div><div class='ctx'> {</div><div class='ctx'> 	int i;</div><div class='ctx'> 	u16 count;</div><div class='hunk'>@@ -209,12 +209,12 @@ static void hfs_dump_extent(struct hfs_extent *extent)</div><div class='ctx'> {</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(EXTENT, "   ");</div><div class='add'>+	hfs_dbg("extent:   ");</div><div class='ctx'> 	for (i = 0; i &lt; 3; i++)</div><div class='del'>-		hfs_dbg_cont(EXTENT, " %u:%u",</div><div class='del'>-			     be16_to_cpu(extent[i].block),</div><div class='del'>-			     be16_to_cpu(extent[i].count));</div><div class='del'>-	hfs_dbg_cont(EXTENT, "\n");</div><div class='add'>+		hfs_dbg(" block %u, count %u",</div><div class='add'>+			be16_to_cpu(extent[i].block),</div><div class='add'>+			be16_to_cpu(extent[i].count));</div><div class='add'>+	hfs_dbg("\n");</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int hfs_add_extent(struct hfs_extent *extent, u16 offset,</div><div class='hunk'>@@ -411,10 +411,11 @@ int hfs_extend_file(struct inode *inode)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(EXTENT, "extend %lu: %u,%u\n", inode-&gt;i_ino, start, len);</div><div class='add'>+	hfs_dbg("ino %lu, start %u, len %u\n", inode-&gt;i_ino, start, len);</div><div class='ctx'> 	if (HFS_I(inode)-&gt;alloc_blocks == HFS_I(inode)-&gt;first_blocks) {</div><div class='ctx'> 		if (!HFS_I(inode)-&gt;first_blocks) {</div><div class='del'>-			hfs_dbg(EXTENT, "first extents\n");</div><div class='add'>+			hfs_dbg("first_extent: start %u, len %u\n",</div><div class='add'>+				start, len);</div><div class='ctx'> 			/* no extents yet */</div><div class='ctx'> 			HFS_I(inode)-&gt;first_extents[0].block = cpu_to_be16(start);</div><div class='ctx'> 			HFS_I(inode)-&gt;first_extents[0].count = cpu_to_be16(len);</div><div class='hunk'>@@ -456,7 +457,7 @@ out:</div><div class='ctx'> 	return res;</div><div class='ctx'> </div><div class='ctx'> insert_extent:</div><div class='del'>-	hfs_dbg(EXTENT, "insert new extent\n");</div><div class='add'>+	hfs_dbg("insert new extent\n");</div><div class='ctx'> 	res = hfs_ext_write_extent(inode);</div><div class='ctx'> 	if (res)</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -481,21 +482,21 @@ void hfs_file_truncate(struct inode *inode)</div><div class='ctx'> 	u32 size;</div><div class='ctx'> 	int res;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(INODE, "truncate: %lu, %Lu -&gt; %Lu\n",</div><div class='add'>+	hfs_dbg("ino %lu, phys_size %llu -&gt; i_size %llu\n",</div><div class='ctx'> 		inode-&gt;i_ino, (long long)HFS_I(inode)-&gt;phys_size,</div><div class='ctx'> 		inode-&gt;i_size);</div><div class='ctx'> 	if (inode-&gt;i_size &gt; HFS_I(inode)-&gt;phys_size) {</div><div class='ctx'> 		struct address_space *mapping = inode-&gt;i_mapping;</div><div class='del'>-		void *fsdata;</div><div class='del'>-		struct page *page;</div><div class='add'>+		void *fsdata = NULL;</div><div class='add'>+		struct folio *folio;</div><div class='ctx'> </div><div class='ctx'> 		/* XXX: Can use generic_cont_expand? */</div><div class='ctx'> 		size = inode-&gt;i_size - 1;</div><div class='del'>-		res = pagecache_write_begin(NULL, mapping, size+1, 0, 0,</div><div class='del'>-					    &amp;page, &amp;fsdata);</div><div class='add'>+		res = hfs_write_begin(NULL, mapping, size + 1, 0, &amp;folio,</div><div class='add'>+				&amp;fsdata);</div><div class='ctx'> 		if (!res) {</div><div class='del'>-			res = pagecache_write_end(NULL, mapping, size+1, 0, 0,</div><div class='del'>-					page, fsdata);</div><div class='add'>+			res = generic_write_end(NULL, mapping, size + 1, 0, 0,</div><div class='add'>+					folio, fsdata);</div><div class='ctx'> 		}</div><div class='ctx'> 		if (res)</div><div class='ctx'> 			inode-&gt;i_size = HFS_I(inode)-&gt;phys_size;</div><div class='head'>diff --git a/fs/hfs/hfs.h b/fs/hfs/hfs.h<br/>index 6f194d0768b6..3f2293ff6fdd 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfs/hfs.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/hfs.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfs/hfs.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfs/hfs.h</a></div><div class='hunk'>@@ -9,274 +9,7 @@</div><div class='ctx'> #ifndef _HFS_H</div><div class='ctx'> #define _HFS_H</div><div class='ctx'> </div><div class='del'>-/* offsets to various blocks */</div><div class='del'>-#define HFS_DD_BLK		0 /* Driver Descriptor block */</div><div class='del'>-#define HFS_PMAP_BLK		1 /* First block of partition map */</div><div class='del'>-#define HFS_MDB_BLK		2 /* Block (w/i partition) of MDB */</div><div class='del'>-</div><div class='del'>-/* magic numbers for various disk blocks */</div><div class='del'>-#define HFS_DRVR_DESC_MAGIC	0x4552 /* "ER": driver descriptor map */</div><div class='del'>-#define HFS_OLD_PMAP_MAGIC	0x5453 /* "TS": old-type partition map */</div><div class='del'>-#define HFS_NEW_PMAP_MAGIC	0x504D /* "PM": new-type partition map */</div><div class='del'>-#define HFS_SUPER_MAGIC		0x4244 /* "BD": HFS MDB (super block) */</div><div class='del'>-#define HFS_MFS_SUPER_MAGIC	0xD2D7 /* MFS MDB (super block) */</div><div class='del'>-</div><div class='del'>-/* various FIXED size parameters */</div><div class='del'>-#define HFS_SECTOR_SIZE		512    /* size of an HFS sector */</div><div class='del'>-#define HFS_SECTOR_SIZE_BITS	9      /* log_2(HFS_SECTOR_SIZE) */</div><div class='del'>-#define HFS_NAMELEN		31     /* maximum length of an HFS filename */</div><div class='del'>-#define HFS_MAX_NAMELEN		128</div><div class='del'>-#define HFS_MAX_VALENCE		32767U</div><div class='del'>-</div><div class='del'>-/* Meanings of the drAtrb field of the MDB,</div><div class='del'>- * Reference: _Inside Macintosh: Files_ p. 2-61</div><div class='del'>- */</div><div class='del'>-#define HFS_SB_ATTRIB_HLOCK	(1 &lt;&lt; 7)</div><div class='del'>-#define HFS_SB_ATTRIB_UNMNT	(1 &lt;&lt; 8)</div><div class='del'>-#define HFS_SB_ATTRIB_SPARED	(1 &lt;&lt; 9)</div><div class='del'>-#define HFS_SB_ATTRIB_INCNSTNT	(1 &lt;&lt; 11)</div><div class='del'>-#define HFS_SB_ATTRIB_SLOCK	(1 &lt;&lt; 15)</div><div class='del'>-</div><div class='del'>-/* Some special File ID numbers */</div><div class='del'>-#define HFS_POR_CNID		1	/* Parent Of the Root */</div><div class='del'>-#define HFS_ROOT_CNID		2	/* ROOT directory */</div><div class='del'>-#define HFS_EXT_CNID		3	/* EXTents B-tree */</div><div class='del'>-#define HFS_CAT_CNID		4	/* CATalog B-tree */</div><div class='del'>-#define HFS_BAD_CNID		5	/* BAD blocks file */</div><div class='del'>-#define HFS_ALLOC_CNID		6	/* ALLOCation file (HFS+) */</div><div class='del'>-#define HFS_START_CNID		7	/* STARTup file (HFS+) */</div><div class='del'>-#define HFS_ATTR_CNID		8	/* ATTRibutes file (HFS+) */</div><div class='del'>-#define HFS_EXCH_CNID		15	/* ExchangeFiles temp id */</div><div class='del'>-#define HFS_FIRSTUSER_CNID	16</div><div class='del'>-</div><div class='del'>-/* values for hfs_cat_rec.cdrType */</div><div class='del'>-#define HFS_CDR_DIR    0x01    /* folder (directory) */</div><div class='del'>-#define HFS_CDR_FIL    0x02    /* file */</div><div class='del'>-#define HFS_CDR_THD    0x03    /* folder (directory) thread */</div><div class='del'>-#define HFS_CDR_FTH    0x04    /* file thread */</div><div class='del'>-</div><div class='del'>-/* legal values for hfs_ext_key.FkType and hfs_file.fork */</div><div class='del'>-#define HFS_FK_DATA	0x00</div><div class='del'>-#define HFS_FK_RSRC	0xFF</div><div class='del'>-</div><div class='del'>-/* bits in hfs_fil_entry.Flags */</div><div class='del'>-#define HFS_FIL_LOCK	0x01  /* locked */</div><div class='del'>-#define HFS_FIL_THD	0x02  /* file thread */</div><div class='del'>-#define HFS_FIL_DOPEN   0x04  /* data fork open */</div><div class='del'>-#define HFS_FIL_ROPEN   0x08  /* resource fork open */</div><div class='del'>-#define HFS_FIL_DIR     0x10  /* directory (always clear) */</div><div class='del'>-#define HFS_FIL_NOCOPY  0x40  /* copy-protected file */</div><div class='del'>-#define HFS_FIL_USED	0x80  /* open */</div><div class='del'>-</div><div class='del'>-/* bits in hfs_dir_entry.Flags. dirflags is 16 bits. */</div><div class='del'>-#define HFS_DIR_LOCK        0x01  /* locked */</div><div class='del'>-#define HFS_DIR_THD         0x02  /* directory thread */</div><div class='del'>-#define HFS_DIR_INEXPFOLDER 0x04  /* in a shared area */</div><div class='del'>-#define HFS_DIR_MOUNTED     0x08  /* mounted */</div><div class='del'>-#define HFS_DIR_DIR         0x10  /* directory (always set) */</div><div class='del'>-#define HFS_DIR_EXPFOLDER   0x20  /* share point */</div><div class='del'>-</div><div class='del'>-/* bits hfs_finfo.fdFlags */</div><div class='del'>-#define HFS_FLG_INITED		0x0100</div><div class='del'>-#define HFS_FLG_LOCKED		0x1000</div><div class='del'>-#define HFS_FLG_INVISIBLE	0x4000</div><div class='del'>-</div><div class='del'>-/*======== HFS structures as they appear on the disk ========*/</div><div class='del'>-</div><div class='del'>-/* Pascal-style string of up to 31 characters */</div><div class='del'>-struct hfs_name {</div><div class='del'>-	u8 len;</div><div class='del'>-	u8 name[HFS_NAMELEN];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct hfs_point {</div><div class='del'>-	__be16 v;</div><div class='del'>-	__be16 h;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct hfs_rect {</div><div class='del'>-	__be16 top;</div><div class='del'>-	__be16 left;</div><div class='del'>-	__be16 bottom;</div><div class='del'>-	__be16 right;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct hfs_finfo {</div><div class='del'>-	__be32 fdType;</div><div class='del'>-	__be32 fdCreator;</div><div class='del'>-	__be16 fdFlags;</div><div class='del'>-	struct hfs_point fdLocation;</div><div class='del'>-	__be16 fdFldr;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct hfs_fxinfo {</div><div class='del'>-	__be16 fdIconID;</div><div class='del'>-	u8 fdUnused[8];</div><div class='del'>-	__be16 fdComment;</div><div class='del'>-	__be32 fdPutAway;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct hfs_dinfo {</div><div class='del'>-	struct hfs_rect frRect;</div><div class='del'>-	__be16 frFlags;</div><div class='del'>-	struct hfs_point frLocation;</div><div class='del'>-	__be16 frView;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct hfs_dxinfo {</div><div class='del'>-	struct hfs_point frScroll;</div><div class='del'>-	__be32 frOpenChain;</div><div class='del'>-	__be16 frUnused;</div><div class='del'>-	__be16 frComment;</div><div class='del'>-	__be32 frPutAway;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-union hfs_finder_info {</div><div class='del'>-	struct {</div><div class='del'>-		struct hfs_finfo finfo;</div><div class='del'>-		struct hfs_fxinfo fxinfo;</div><div class='del'>-	} file;</div><div class='del'>-	struct {</div><div class='del'>-		struct hfs_dinfo dinfo;</div><div class='del'>-		struct hfs_dxinfo dxinfo;</div><div class='del'>-	} dir;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* Cast to a pointer to a generic bkey */</div><div class='del'>-#define	HFS_BKEY(X)	(((void)((X)-&gt;KeyLen)), ((struct hfs_bkey *)(X)))</div><div class='del'>-</div><div class='del'>-/* The key used in the catalog b-tree: */</div><div class='del'>-struct hfs_cat_key {</div><div class='del'>-	u8 key_len;		/* number of bytes in the key */</div><div class='del'>-	u8 reserved;		/* padding */</div><div class='del'>-	__be32 ParID;		/* CNID of the parent dir */</div><div class='del'>-	struct hfs_name	CName;	/* The filename of the entry */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* The key used in the extents b-tree: */</div><div class='del'>-struct hfs_ext_key {</div><div class='del'>-	u8 key_len;		/* number of bytes in the key */</div><div class='del'>-	u8 FkType;		/* HFS_FK_{DATA,RSRC} */</div><div class='del'>-	__be32 FNum;		/* The File ID of the file */</div><div class='del'>-	__be16 FABN;		/* allocation blocks number*/</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-typedef union hfs_btree_key {</div><div class='del'>-	u8 key_len;			/* number of bytes in the key */</div><div class='del'>-	struct hfs_cat_key cat;</div><div class='del'>-	struct hfs_ext_key ext;</div><div class='del'>-} hfs_btree_key;</div><div class='del'>-</div><div class='del'>-#define HFS_MAX_CAT_KEYLEN	(sizeof(struct hfs_cat_key) - sizeof(u8))</div><div class='del'>-#define HFS_MAX_EXT_KEYLEN	(sizeof(struct hfs_ext_key) - sizeof(u8))</div><div class='del'>-</div><div class='del'>-typedef union hfs_btree_key btree_key;</div><div class='del'>-</div><div class='del'>-struct hfs_extent {</div><div class='del'>-	__be16 block;</div><div class='del'>-	__be16 count;</div><div class='del'>-};</div><div class='del'>-typedef struct hfs_extent hfs_extent_rec[3];</div><div class='del'>-</div><div class='del'>-/* The catalog record for a file */</div><div class='del'>-struct hfs_cat_file {</div><div class='del'>-	s8 type;			/* The type of entry */</div><div class='del'>-	u8 reserved;</div><div class='del'>-	u8 Flags;			/* Flags such as read-only */</div><div class='del'>-	s8 Typ;				/* file version number = 0 */</div><div class='del'>-	struct hfs_finfo UsrWds;	/* data used by the Finder */</div><div class='del'>-	__be32 FlNum;			/* The CNID */</div><div class='del'>-	__be16 StBlk;			/* obsolete */</div><div class='del'>-	__be32 LgLen;			/* The logical EOF of the data fork*/</div><div class='del'>-	__be32 PyLen;			/* The physical EOF of the data fork */</div><div class='del'>-	__be16 RStBlk;			/* obsolete */</div><div class='del'>-	__be32 RLgLen;			/* The logical EOF of the rsrc fork */</div><div class='del'>-	__be32 RPyLen;			/* The physical EOF of the rsrc fork */</div><div class='del'>-	__be32 CrDat;			/* The creation date */</div><div class='del'>-	__be32 MdDat;			/* The modified date */</div><div class='del'>-	__be32 BkDat;			/* The last backup date */</div><div class='del'>-	struct hfs_fxinfo FndrInfo;	/* more data for the Finder */</div><div class='del'>-	__be16 ClpSize;			/* number of bytes to allocate</div><div class='del'>-					   when extending files */</div><div class='del'>-	hfs_extent_rec ExtRec;		/* first extent record</div><div class='del'>-					   for the data fork */</div><div class='del'>-	hfs_extent_rec RExtRec;		/* first extent record</div><div class='del'>-					   for the resource fork */</div><div class='del'>-	u32 Resrv;			/* reserved by Apple */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* the catalog record for a directory */</div><div class='del'>-struct hfs_cat_dir {</div><div class='del'>-	s8 type;			/* The type of entry */</div><div class='del'>-	u8 reserved;</div><div class='del'>-	__be16 Flags;			/* flags */</div><div class='del'>-	__be16 Val;			/* Valence: number of files and</div><div class='del'>-					   dirs in the directory */</div><div class='del'>-	__be32 DirID;			/* The CNID */</div><div class='del'>-	__be32 CrDat;			/* The creation date */</div><div class='del'>-	__be32 MdDat;			/* The modification date */</div><div class='del'>-	__be32 BkDat;			/* The last backup date */</div><div class='del'>-	struct hfs_dinfo UsrInfo;	/* data used by the Finder */</div><div class='del'>-	struct hfs_dxinfo FndrInfo;	/* more data used by Finder */</div><div class='del'>-	u8 Resrv[16];			/* reserved by Apple */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* the catalog record for a thread */</div><div class='del'>-struct hfs_cat_thread {</div><div class='del'>-	s8 type;			/* The type of entry */</div><div class='del'>-	u8 reserved[9];			/* reserved by Apple */</div><div class='del'>-	__be32 ParID;			/* CNID of parent directory */</div><div class='del'>-	struct hfs_name CName;		/* The name of this entry */</div><div class='del'>-}  __packed;</div><div class='del'>-</div><div class='del'>-/* A catalog tree record */</div><div class='del'>-typedef union hfs_cat_rec {</div><div class='del'>-	s8 type;			/* The type of entry */</div><div class='del'>-	struct hfs_cat_file file;</div><div class='del'>-	struct hfs_cat_dir dir;</div><div class='del'>-	struct hfs_cat_thread thread;</div><div class='del'>-} hfs_cat_rec;</div><div class='del'>-</div><div class='del'>-struct hfs_mdb {</div><div class='del'>-	__be16 drSigWord;		/* Signature word indicating fs type */</div><div class='del'>-	__be32 drCrDate;		/* fs creation date/time */</div><div class='del'>-	__be32 drLsMod;			/* fs modification date/time */</div><div class='del'>-	__be16 drAtrb;			/* fs attributes */</div><div class='del'>-	__be16 drNmFls;			/* number of files in root directory */</div><div class='del'>-	__be16 drVBMSt;			/* location (in 512-byte blocks)</div><div class='del'>-					   of the volume bitmap */</div><div class='del'>-	__be16 drAllocPtr;		/* location (in allocation blocks)</div><div class='del'>-					   to begin next allocation search */</div><div class='del'>-	__be16 drNmAlBlks;		/* number of allocation blocks */</div><div class='del'>-	__be32 drAlBlkSiz;		/* bytes in an allocation block */</div><div class='del'>-	__be32 drClpSiz;		/* clumpsize, the number of bytes to</div><div class='del'>-					   allocate when extending a file */</div><div class='del'>-	__be16 drAlBlSt;		/* location (in 512-byte blocks)</div><div class='del'>-					   of the first allocation block */</div><div class='del'>-	__be32 drNxtCNID;		/* CNID to assign to the next</div><div class='del'>-					   file or directory created */</div><div class='del'>-	__be16 drFreeBks;		/* number of free allocation blocks */</div><div class='del'>-	u8 drVN[28];			/* the volume label */</div><div class='del'>-	__be32 drVolBkUp;		/* fs backup date/time */</div><div class='del'>-	__be16 drVSeqNum;		/* backup sequence number */</div><div class='del'>-	__be32 drWrCnt;			/* fs write count */</div><div class='del'>-	__be32 drXTClpSiz;		/* clumpsize for the extents B-tree */</div><div class='del'>-	__be32 drCTClpSiz;		/* clumpsize for the catalog B-tree */</div><div class='del'>-	__be16 drNmRtDirs;		/* number of directories in</div><div class='del'>-					   the root directory */</div><div class='del'>-	__be32 drFilCnt;		/* number of files in the fs */</div><div class='del'>-	__be32 drDirCnt;		/* number of directories in the fs */</div><div class='del'>-	u8 drFndrInfo[32];		/* data used by the Finder */</div><div class='del'>-	__be16 drEmbedSigWord;		/* embedded volume signature */</div><div class='del'>-	__be32 drEmbedExtent;		/* starting block number (xdrStABN)</div><div class='del'>-					   and number of allocation blocks</div><div class='del'>-					   (xdrNumABlks) occupied by embedded</div><div class='del'>-					   volume */</div><div class='del'>-	__be32 drXTFlSize;		/* bytes in the extents B-tree */</div><div class='del'>-	hfs_extent_rec drXTExtRec;	/* extents B-tree's first 3 extents */</div><div class='del'>-	__be32 drCTFlSize;		/* bytes in the catalog B-tree */</div><div class='del'>-	hfs_extent_rec drCTExtRec;	/* catalog B-tree's first 3 extents */</div><div class='del'>-} __packed;</div><div class='add'>+#include &lt;linux/hfs_common.h&gt;</div><div class='ctx'> </div><div class='ctx'> /*======== Data structures kept in memory ========*/</div><div class='ctx'> </div><div class='head'>diff --git a/fs/hfs/hfs_fs.h b/fs/hfs/hfs_fs.h<br/>index b8eb0322a3e5..e94dbc04a1e4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfs/hfs_fs.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/hfs_fs.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfs/hfs_fs.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfs/hfs_fs.h</a></div><div class='hunk'>@@ -9,12 +9,6 @@</div><div class='ctx'> #ifndef _LINUX_HFS_FS_H</div><div class='ctx'> #define _LINUX_HFS_FS_H</div><div class='ctx'> </div><div class='del'>-#ifdef pr_fmt</div><div class='del'>-#undef pr_fmt</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-#define pr_fmt(fmt) KBUILD_MODNAME ": " fmt</div><div class='del'>-</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/types.h&gt;</div><div class='ctx'> #include &lt;linux/mutex.h&gt;</div><div class='hunk'>@@ -27,32 +21,6 @@</div><div class='ctx'> </div><div class='ctx'> #include "hfs.h"</div><div class='ctx'> </div><div class='del'>-#define DBG_BNODE_REFS	0x00000001</div><div class='del'>-#define DBG_BNODE_MOD	0x00000002</div><div class='del'>-#define DBG_CAT_MOD	0x00000004</div><div class='del'>-#define DBG_INODE	0x00000008</div><div class='del'>-#define DBG_SUPER	0x00000010</div><div class='del'>-#define DBG_EXTENT	0x00000020</div><div class='del'>-#define DBG_BITMAP	0x00000040</div><div class='del'>-</div><div class='del'>-//#define DBG_MASK	(DBG_EXTENT|DBG_INODE|DBG_BNODE_MOD|DBG_CAT_MOD|DBG_BITMAP)</div><div class='del'>-//#define DBG_MASK	(DBG_BNODE_MOD|DBG_CAT_MOD|DBG_INODE)</div><div class='del'>-//#define DBG_MASK	(DBG_CAT_MOD|DBG_BNODE_REFS|DBG_INODE|DBG_EXTENT)</div><div class='del'>-#define DBG_MASK	(0)</div><div class='del'>-</div><div class='del'>-#define hfs_dbg(flg, fmt, ...)					\</div><div class='del'>-do {								\</div><div class='del'>-	if (DBG_##flg &amp; DBG_MASK)				\</div><div class='del'>-		printk(KERN_DEBUG pr_fmt(fmt), ##__VA_ARGS__);	\</div><div class='del'>-} while (0)</div><div class='del'>-</div><div class='del'>-#define hfs_dbg_cont(flg, fmt, ...)				\</div><div class='del'>-do {								\</div><div class='del'>-	if (DBG_##flg &amp; DBG_MASK)				\</div><div class='del'>-		pr_cont(fmt, ##__VA_ARGS__);			\</div><div class='del'>-} while (0)</div><div class='del'>-</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * struct hfs_inode_info</div><div class='ctx'>  *</div><div class='hunk'>@@ -112,13 +80,13 @@ struct hfs_sb_info {</div><div class='ctx'> 						   the extents b-tree */</div><div class='ctx'> 	struct hfs_btree *cat_tree;			/* Information about</div><div class='ctx'> 						   the catalog b-tree */</div><div class='del'>-	u32 file_count;				/* The number of</div><div class='add'>+	atomic64_t file_count;			/* The number of</div><div class='ctx'> 						   regular files in</div><div class='ctx'> 						   the filesystem */</div><div class='del'>-	u32 folder_count;			/* The number of</div><div class='add'>+	atomic64_t folder_count;		/* The number of</div><div class='ctx'> 						   directories in the</div><div class='ctx'> 						   filesystem */</div><div class='del'>-	u32 next_id;				/* The next available</div><div class='add'>+	atomic64_t next_id;			/* The next available</div><div class='ctx'> 						   file id number */</div><div class='ctx'> 	u32 clumpablks;				/* The number of allocation</div><div class='ctx'> 						   blocks to try to add when</div><div class='hunk'>@@ -171,71 +139,90 @@ struct hfs_sb_info {</div><div class='ctx'> #define HFS_FLG_ALT_MDB_DIRTY	2</div><div class='ctx'> </div><div class='ctx'> /* bitmap.c */</div><div class='del'>-extern u32 hfs_vbm_search_free(struct super_block *, u32, u32 *);</div><div class='del'>-extern int hfs_clear_vbm_bits(struct super_block *, u16, u16);</div><div class='add'>+extern u32 hfs_vbm_search_free(struct super_block *sb, u32 goal, u32 *num_bits);</div><div class='add'>+extern int hfs_clear_vbm_bits(struct super_block *sb, u16 start, u16 count);</div><div class='ctx'> </div><div class='ctx'> /* catalog.c */</div><div class='del'>-extern int hfs_cat_keycmp(const btree_key *, const btree_key *);</div><div class='add'>+extern int hfs_cat_keycmp(const btree_key *key1, const btree_key *key2);</div><div class='ctx'> struct hfs_find_data;</div><div class='del'>-extern int hfs_cat_find_brec(struct super_block *, u32, struct hfs_find_data *);</div><div class='del'>-extern int hfs_cat_create(u32, struct inode *, const struct qstr *, struct inode *);</div><div class='del'>-extern int hfs_cat_delete(u32, struct inode *, const struct qstr *);</div><div class='del'>-extern int hfs_cat_move(u32, struct inode *, const struct qstr *,</div><div class='del'>-			struct inode *, const struct qstr *);</div><div class='del'>-extern void hfs_cat_build_key(struct super_block *, btree_key *, u32, const struct qstr *);</div><div class='add'>+extern int hfs_cat_find_brec(struct super_block *sb, u32 cnid,</div><div class='add'>+			     struct hfs_find_data *fd);</div><div class='add'>+extern int hfs_cat_create(u32 cnid, struct inode *dir,</div><div class='add'>+			  const struct qstr *str, struct inode *inode);</div><div class='add'>+extern int hfs_cat_delete(u32 cnid, struct inode *dir, const struct qstr *str);</div><div class='add'>+extern int hfs_cat_move(u32 cnid, struct inode *src_dir,</div><div class='add'>+			const struct qstr *src_name,</div><div class='add'>+			struct inode *dst_dir,</div><div class='add'>+			const struct qstr *dst_name);</div><div class='add'>+extern void hfs_cat_build_key(struct super_block *sb, btree_key *key,</div><div class='add'>+			      u32 parent, const struct qstr *name);</div><div class='ctx'> </div><div class='ctx'> /* dir.c */</div><div class='ctx'> extern const struct file_operations hfs_dir_operations;</div><div class='ctx'> extern const struct inode_operations hfs_dir_inode_operations;</div><div class='ctx'> </div><div class='ctx'> /* extent.c */</div><div class='del'>-extern int hfs_ext_keycmp(const btree_key *, const btree_key *);</div><div class='del'>-extern int hfs_free_fork(struct super_block *, struct hfs_cat_file *, int);</div><div class='del'>-extern int hfs_ext_write_extent(struct inode *);</div><div class='del'>-extern int hfs_extend_file(struct inode *);</div><div class='del'>-extern void hfs_file_truncate(struct inode *);</div><div class='add'>+extern int hfs_ext_keycmp(const btree_key *key1, const btree_key *key2);</div><div class='add'>+extern u16 hfs_ext_find_block(struct hfs_extent *ext, u16 off);</div><div class='add'>+extern int hfs_free_fork(struct super_block *sb,</div><div class='add'>+			 struct hfs_cat_file *file, int type);</div><div class='add'>+extern int hfs_ext_write_extent(struct inode *inode);</div><div class='add'>+extern int hfs_extend_file(struct inode *inode);</div><div class='add'>+extern void hfs_file_truncate(struct inode *inode);</div><div class='ctx'> </div><div class='del'>-extern int hfs_get_block(struct inode *, sector_t, struct buffer_head *, int);</div><div class='add'>+extern int hfs_get_block(struct inode *inode, sector_t block,</div><div class='add'>+			 struct buffer_head *bh_result, int create);</div><div class='ctx'> </div><div class='ctx'> /* inode.c */</div><div class='ctx'> extern const struct address_space_operations hfs_aops;</div><div class='ctx'> extern const struct address_space_operations hfs_btree_aops;</div><div class='ctx'> </div><div class='del'>-extern struct inode *hfs_new_inode(struct inode *, const struct qstr *, umode_t);</div><div class='del'>-extern void hfs_inode_write_fork(struct inode *, struct hfs_extent *, __be32 *, __be32 *);</div><div class='del'>-extern int hfs_write_inode(struct inode *, struct writeback_control *);</div><div class='del'>-extern int hfs_inode_setattr(struct user_namespace *, struct dentry *,</div><div class='del'>-			     struct iattr *);</div><div class='add'>+int hfs_write_begin(const struct kiocb *iocb, struct address_space *mapping,</div><div class='add'>+		    loff_t pos, unsigned int len, struct folio **foliop,</div><div class='add'>+		    void **fsdata);</div><div class='add'>+extern struct inode *hfs_new_inode(struct inode *dir, const struct qstr *name,</div><div class='add'>+				   umode_t mode);</div><div class='add'>+extern void hfs_inode_write_fork(struct inode *inode, struct hfs_extent *ext,</div><div class='add'>+				 __be32 *log_size, __be32 *phys_size);</div><div class='add'>+extern int hfs_write_inode(struct inode *inode, struct writeback_control *wbc);</div><div class='add'>+extern int hfs_inode_setattr(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='add'>+			     struct iattr *attr);</div><div class='ctx'> extern void hfs_inode_read_fork(struct inode *inode, struct hfs_extent *ext,</div><div class='del'>-			__be32 log_size, __be32 phys_size, u32 clump_size);</div><div class='del'>-extern struct inode *hfs_iget(struct super_block *, struct hfs_cat_key *, hfs_cat_rec *);</div><div class='del'>-extern void hfs_evict_inode(struct inode *);</div><div class='del'>-extern void hfs_delete_inode(struct inode *);</div><div class='add'>+				__be32 __log_size, __be32 phys_size,</div><div class='add'>+				u32 clump_size);</div><div class='add'>+extern struct inode *hfs_iget(struct super_block *sb, struct hfs_cat_key *key,</div><div class='add'>+				hfs_cat_rec *rec);</div><div class='add'>+extern void hfs_evict_inode(struct inode *inode);</div><div class='add'>+extern void hfs_delete_inode(struct inode *inode);</div><div class='ctx'> </div><div class='ctx'> /* attr.c */</div><div class='del'>-extern const struct xattr_handler *hfs_xattr_handlers[];</div><div class='add'>+extern const struct xattr_handler * const hfs_xattr_handlers[];</div><div class='ctx'> </div><div class='ctx'> /* mdb.c */</div><div class='del'>-extern int hfs_mdb_get(struct super_block *);</div><div class='del'>-extern void hfs_mdb_commit(struct super_block *);</div><div class='del'>-extern void hfs_mdb_close(struct super_block *);</div><div class='del'>-extern void hfs_mdb_put(struct super_block *);</div><div class='add'>+extern int hfs_mdb_get(struct super_block *sb);</div><div class='add'>+extern void hfs_mdb_commit(struct super_block *sb);</div><div class='add'>+extern void hfs_mdb_close(struct super_block *sb);</div><div class='add'>+extern void hfs_mdb_put(struct super_block *sb);</div><div class='ctx'> </div><div class='ctx'> /* part_tbl.c */</div><div class='del'>-extern int hfs_part_find(struct super_block *, sector_t *, sector_t *);</div><div class='add'>+extern int hfs_part_find(struct super_block *sb,</div><div class='add'>+			 sector_t *part_start, sector_t *part_size);</div><div class='ctx'> </div><div class='ctx'> /* string.c */</div><div class='ctx'> extern const struct dentry_operations hfs_dentry_operations;</div><div class='ctx'> </div><div class='del'>-extern int hfs_hash_dentry(const struct dentry *, struct qstr *);</div><div class='del'>-extern int hfs_strcmp(const unsigned char *, unsigned int,</div><div class='del'>-		      const unsigned char *, unsigned int);</div><div class='add'>+extern int hfs_hash_dentry(const struct dentry *dentry, struct qstr *this);</div><div class='add'>+extern int hfs_strcmp(const unsigned char *s1, unsigned int len1,</div><div class='add'>+		      const unsigned char *s2, unsigned int len2);</div><div class='ctx'> extern int hfs_compare_dentry(const struct dentry *dentry,</div><div class='del'>-		unsigned int len, const char *str, const struct qstr *name);</div><div class='add'>+				unsigned int len, const char *str,</div><div class='add'>+				const struct qstr *name);</div><div class='ctx'> </div><div class='ctx'> /* trans.c */</div><div class='del'>-extern void hfs_asc2mac(struct super_block *, struct hfs_name *, const struct qstr *);</div><div class='del'>-extern int hfs_mac2asc(struct super_block *, char *, const struct hfs_name *);</div><div class='add'>+extern void hfs_asc2mac(struct super_block *sb,</div><div class='add'>+			struct hfs_name *out, const struct qstr *in);</div><div class='add'>+extern int hfs_mac2asc(struct super_block *sb,</div><div class='add'>+			char *out, const struct hfs_name *in);</div><div class='ctx'> </div><div class='ctx'> /* super.c */</div><div class='ctx'> extern void hfs_mark_mdb_dirty(struct super_block *sb);</div><div class='head'>diff --git a/fs/hfs/inode.c b/fs/hfs/inode.c<br/>index 2a5143246282..524db1389737 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfs/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfs/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfs/inode.c</a></div><div class='hunk'>@@ -29,14 +29,9 @@ static const struct inode_operations hfs_file_inode_operations;</div><div class='ctx'> </div><div class='ctx'> #define HFS_VALID_MODE_BITS  (S_IFREG | S_IFDIR | S_IRWXUGO)</div><div class='ctx'> </div><div class='del'>-static int hfs_writepage(struct page *page, struct writeback_control *wbc)</div><div class='add'>+static int hfs_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	return block_write_full_page(page, hfs_get_block, wbc);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int hfs_readpage(struct file *file, struct page *page)</div><div class='del'>-{</div><div class='del'>-	return block_read_full_page(page, hfs_get_block);</div><div class='add'>+	return block_read_full_folio(folio, hfs_get_block);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void hfs_write_failed(struct address_space *mapping, loff_t to)</div><div class='hunk'>@@ -49,14 +44,13 @@ static void hfs_write_failed(struct address_space *mapping, loff_t to)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hfs_write_begin(struct file *file, struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned flags,</div><div class='del'>-			struct page **pagep, void **fsdata)</div><div class='add'>+int hfs_write_begin(const struct kiocb *iocb, struct address_space *mapping,</div><div class='add'>+		    loff_t pos, unsigned int len, struct folio **foliop,</div><div class='add'>+		    void **fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	*pagep = NULL;</div><div class='del'>-	ret = cont_write_begin(file, mapping, pos, len, flags, pagep, fsdata,</div><div class='add'>+	ret = cont_write_begin(iocb, mapping, pos, len, foliop, fsdata,</div><div class='ctx'> 				hfs_get_block,</div><div class='ctx'> 				&amp;HFS_I(mapping-&gt;host)-&gt;phys_size);</div><div class='ctx'> 	if (unlikely(ret))</div><div class='hunk'>@@ -70,14 +64,15 @@ static sector_t hfs_bmap(struct address_space *mapping, sector_t block)</div><div class='ctx'> 	return generic_block_bmap(mapping, block, hfs_get_block);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hfs_releasepage(struct page *page, gfp_t mask)</div><div class='add'>+static bool hfs_release_folio(struct folio *folio, gfp_t mask)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	struct hfs_btree *tree;</div><div class='ctx'> 	struct hfs_bnode *node;</div><div class='ctx'> 	u32 nidx;</div><div class='del'>-	int i, res = 1;</div><div class='add'>+	int i;</div><div class='add'>+	bool res = true;</div><div class='ctx'> </div><div class='ctx'> 	switch (inode-&gt;i_ino) {</div><div class='ctx'> 	case HFS_EXT_CNID:</div><div class='hunk'>@@ -88,27 +83,27 @@ static int hfs_releasepage(struct page *page, gfp_t mask)</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		BUG();</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!tree)</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	if (tree-&gt;node_size &gt;= PAGE_SIZE) {</div><div class='del'>-		nidx = page-&gt;index &gt;&gt; (tree-&gt;node_size_shift - PAGE_SHIFT);</div><div class='add'>+		nidx = folio-&gt;index &gt;&gt; (tree-&gt;node_size_shift - PAGE_SHIFT);</div><div class='ctx'> 		spin_lock(&amp;tree-&gt;hash_lock);</div><div class='ctx'> 		node = hfs_bnode_findhash(tree, nidx);</div><div class='ctx'> 		if (!node)</div><div class='ctx'> 			;</div><div class='ctx'> 		else if (atomic_read(&amp;node-&gt;refcnt))</div><div class='del'>-			res = 0;</div><div class='add'>+			res = false;</div><div class='ctx'> 		if (res &amp;&amp; node) {</div><div class='ctx'> 			hfs_bnode_unhash(node);</div><div class='ctx'> 			hfs_bnode_free(node);</div><div class='ctx'> 		}</div><div class='ctx'> 		spin_unlock(&amp;tree-&gt;hash_lock);</div><div class='ctx'> 	} else {</div><div class='del'>-		nidx = page-&gt;index &lt;&lt; (PAGE_SHIFT - tree-&gt;node_size_shift);</div><div class='add'>+		nidx = folio-&gt;index &lt;&lt; (PAGE_SHIFT - tree-&gt;node_size_shift);</div><div class='ctx'> 		i = 1 &lt;&lt; (PAGE_SHIFT - tree-&gt;node_size_shift);</div><div class='ctx'> 		spin_lock(&amp;tree-&gt;hash_lock);</div><div class='ctx'> 		do {</div><div class='hunk'>@@ -116,7 +111,7 @@ static int hfs_releasepage(struct page *page, gfp_t mask)</div><div class='ctx'> 			if (!node)</div><div class='ctx'> 				continue;</div><div class='ctx'> 			if (atomic_read(&amp;node-&gt;refcnt)) {</div><div class='del'>-				res = 0;</div><div class='add'>+				res = false;</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> 			hfs_bnode_unhash(node);</div><div class='hunk'>@@ -124,7 +119,7 @@ static int hfs_releasepage(struct page *page, gfp_t mask)</div><div class='ctx'> 		} while (--i &amp;&amp; nidx &lt; tree-&gt;node_count);</div><div class='ctx'> 		spin_unlock(&amp;tree-&gt;hash_lock);</div><div class='ctx'> 	}</div><div class='del'>-	return res ? try_to_free_buffers(page) : 0;</div><div class='add'>+	return res ? try_to_free_buffers(folio) : false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t hfs_direct_IO(struct kiocb *iocb, struct iov_iter *iter)</div><div class='hunk'>@@ -159,24 +154,27 @@ static int hfs_writepages(struct address_space *mapping,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations hfs_btree_aops = {</div><div class='del'>-	.set_page_dirty	= __set_page_dirty_buffers,</div><div class='del'>-	.readpage	= hfs_readpage,</div><div class='del'>-	.writepage	= hfs_writepage,</div><div class='add'>+	.dirty_folio	= block_dirty_folio,</div><div class='add'>+	.invalidate_folio = block_invalidate_folio,</div><div class='add'>+	.read_folio	= hfs_read_folio,</div><div class='add'>+	.writepages	= hfs_writepages,</div><div class='ctx'> 	.write_begin	= hfs_write_begin,</div><div class='ctx'> 	.write_end	= generic_write_end,</div><div class='add'>+	.migrate_folio	= buffer_migrate_folio,</div><div class='ctx'> 	.bmap		= hfs_bmap,</div><div class='del'>-	.releasepage	= hfs_releasepage,</div><div class='add'>+	.release_folio	= hfs_release_folio,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations hfs_aops = {</div><div class='del'>-	.set_page_dirty	= __set_page_dirty_buffers,</div><div class='del'>-	.readpage	= hfs_readpage,</div><div class='del'>-	.writepage	= hfs_writepage,</div><div class='add'>+	.dirty_folio	= block_dirty_folio,</div><div class='add'>+	.invalidate_folio = block_invalidate_folio,</div><div class='add'>+	.read_folio	= hfs_read_folio,</div><div class='ctx'> 	.write_begin	= hfs_write_begin,</div><div class='ctx'> 	.write_end	= generic_write_end,</div><div class='ctx'> 	.bmap		= hfs_bmap,</div><div class='ctx'> 	.direct_IO	= hfs_direct_IO,</div><div class='ctx'> 	.writepages	= hfs_writepages,</div><div class='add'>+	.migrate_folio	= buffer_migrate_folio,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -186,6 +184,10 @@ struct inode *hfs_new_inode(struct inode *dir, const struct qstr *name, umode_t</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = dir-&gt;i_sb;</div><div class='ctx'> 	struct inode *inode = new_inode(sb);</div><div class='add'>+	s64 next_id;</div><div class='add'>+	s64 file_count;</div><div class='add'>+	s64 folder_count;</div><div class='add'>+</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='hunk'>@@ -193,18 +195,22 @@ struct inode *hfs_new_inode(struct inode *dir, const struct qstr *name, umode_t</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;HFS_I(inode)-&gt;open_dir_list);</div><div class='ctx'> 	spin_lock_init(&amp;HFS_I(inode)-&gt;open_dir_lock);</div><div class='ctx'> 	hfs_cat_build_key(sb, (btree_key *)&amp;HFS_I(inode)-&gt;cat_key, dir-&gt;i_ino, name);</div><div class='del'>-	inode-&gt;i_ino = HFS_SB(sb)-&gt;next_id++;</div><div class='add'>+	next_id = atomic64_inc_return(&amp;HFS_SB(sb)-&gt;next_id);</div><div class='add'>+	BUG_ON(next_id &gt; U32_MAX);</div><div class='add'>+	inode-&gt;i_ino = (u32)next_id;</div><div class='ctx'> 	inode-&gt;i_mode = mode;</div><div class='ctx'> 	inode-&gt;i_uid = current_fsuid();</div><div class='ctx'> 	inode-&gt;i_gid = current_fsgid();</div><div class='ctx'> 	set_nlink(inode, 1);</div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_atime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	simple_inode_init_ts(inode);</div><div class='ctx'> 	HFS_I(inode)-&gt;flags = 0;</div><div class='ctx'> 	HFS_I(inode)-&gt;rsrc_inode = NULL;</div><div class='ctx'> 	HFS_I(inode)-&gt;fs_blocks = 0;</div><div class='add'>+	HFS_I(inode)-&gt;tz_secondswest = sys_tz.tz_minuteswest * 60;</div><div class='ctx'> 	if (S_ISDIR(mode)) {</div><div class='ctx'> 		inode-&gt;i_size = 2;</div><div class='del'>-		HFS_SB(sb)-&gt;folder_count++;</div><div class='add'>+		folder_count = atomic64_inc_return(&amp;HFS_SB(sb)-&gt;folder_count);</div><div class='add'>+		BUG_ON(folder_count &gt; U32_MAX);</div><div class='ctx'> 		if (dir-&gt;i_ino == HFS_ROOT_CNID)</div><div class='ctx'> 			HFS_SB(sb)-&gt;root_dirs++;</div><div class='ctx'> 		inode-&gt;i_op = &amp;hfs_dir_inode_operations;</div><div class='hunk'>@@ -213,7 +219,8 @@ struct inode *hfs_new_inode(struct inode *dir, const struct qstr *name, umode_t</div><div class='ctx'> 		inode-&gt;i_mode &amp;= ~HFS_SB(inode-&gt;i_sb)-&gt;s_dir_umask;</div><div class='ctx'> 	} else if (S_ISREG(mode)) {</div><div class='ctx'> 		HFS_I(inode)-&gt;clump_blocks = HFS_SB(sb)-&gt;clumpablks;</div><div class='del'>-		HFS_SB(sb)-&gt;file_count++;</div><div class='add'>+		file_count = atomic64_inc_return(&amp;HFS_SB(sb)-&gt;file_count);</div><div class='add'>+		BUG_ON(file_count &gt; U32_MAX);</div><div class='ctx'> 		if (dir-&gt;i_ino == HFS_ROOT_CNID)</div><div class='ctx'> 			HFS_SB(sb)-&gt;root_files++;</div><div class='ctx'> 		inode-&gt;i_op = &amp;hfs_file_inode_operations;</div><div class='hunk'>@@ -243,16 +250,19 @@ void hfs_delete_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(INODE, "delete_inode: %lu\n", inode-&gt;i_ino);</div><div class='add'>+	hfs_dbg("ino %lu\n", inode-&gt;i_ino);</div><div class='ctx'> 	if (S_ISDIR(inode-&gt;i_mode)) {</div><div class='del'>-		HFS_SB(sb)-&gt;folder_count--;</div><div class='add'>+		BUG_ON(atomic64_read(&amp;HFS_SB(sb)-&gt;folder_count) &gt; U32_MAX);</div><div class='add'>+		atomic64_dec(&amp;HFS_SB(sb)-&gt;folder_count);</div><div class='ctx'> 		if (HFS_I(inode)-&gt;cat_key.ParID == cpu_to_be32(HFS_ROOT_CNID))</div><div class='ctx'> 			HFS_SB(sb)-&gt;root_dirs--;</div><div class='ctx'> 		set_bit(HFS_FLG_MDB_DIRTY, &amp;HFS_SB(sb)-&gt;flags);</div><div class='ctx'> 		hfs_mark_mdb_dirty(sb);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='del'>-	HFS_SB(sb)-&gt;file_count--;</div><div class='add'>+</div><div class='add'>+	BUG_ON(atomic64_read(&amp;HFS_SB(sb)-&gt;file_count) &gt; U32_MAX);</div><div class='add'>+	atomic64_dec(&amp;HFS_SB(sb)-&gt;file_count);</div><div class='ctx'> 	if (HFS_I(inode)-&gt;cat_key.ParID == cpu_to_be32(HFS_ROOT_CNID))</div><div class='ctx'> 		HFS_SB(sb)-&gt;root_files--;</div><div class='ctx'> 	if (S_ISREG(inode-&gt;i_mode)) {</div><div class='hunk'>@@ -277,6 +287,8 @@ void hfs_inode_read_fork(struct inode *inode, struct hfs_extent *ext,</div><div class='ctx'> 	for (count = 0, i = 0; i &lt; 3; i++)</div><div class='ctx'> 		count += be16_to_cpu(ext[i].count);</div><div class='ctx'> 	HFS_I(inode)-&gt;first_blocks = count;</div><div class='add'>+	HFS_I(inode)-&gt;cached_start = 0;</div><div class='add'>+	HFS_I(inode)-&gt;cached_blocks = 0;</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_size = HFS_I(inode)-&gt;phys_size = log_size;</div><div class='ctx'> 	HFS_I(inode)-&gt;fs_blocks = (log_size + sb-&gt;s_blocksize - 1) &gt;&gt; sb-&gt;s_blocksize_bits;</div><div class='hunk'>@@ -353,8 +365,8 @@ static int hfs_read_inode(struct inode *inode, void *data)</div><div class='ctx'> 			inode-&gt;i_mode |= S_IWUGO;</div><div class='ctx'> 		inode-&gt;i_mode &amp;= ~hsb-&gt;s_file_umask;</div><div class='ctx'> 		inode-&gt;i_mode |= S_IFREG;</div><div class='del'>-		inode-&gt;i_ctime = inode-&gt;i_atime = inode-&gt;i_mtime =</div><div class='del'>-				hfs_m_to_utime(rec-&gt;file.MdDat);</div><div class='add'>+		inode_set_mtime_to_ts(inode,</div><div class='add'>+				      inode_set_atime_to_ts(inode, inode_set_ctime_to_ts(inode, hfs_m_to_utime(rec-&gt;file.MdDat))));</div><div class='ctx'> 		inode-&gt;i_op = &amp;hfs_file_inode_operations;</div><div class='ctx'> 		inode-&gt;i_fop = &amp;hfs_file_operations;</div><div class='ctx'> 		inode-&gt;i_mapping-&gt;a_ops = &amp;hfs_aops;</div><div class='hunk'>@@ -364,8 +376,8 @@ static int hfs_read_inode(struct inode *inode, void *data)</div><div class='ctx'> 		inode-&gt;i_size = be16_to_cpu(rec-&gt;dir.Val) + 2;</div><div class='ctx'> 		HFS_I(inode)-&gt;fs_blocks = 0;</div><div class='ctx'> 		inode-&gt;i_mode = S_IFDIR | (S_IRWXUGO &amp; ~hsb-&gt;s_dir_umask);</div><div class='del'>-		inode-&gt;i_ctime = inode-&gt;i_atime = inode-&gt;i_mtime =</div><div class='del'>-				hfs_m_to_utime(rec-&gt;dir.MdDat);</div><div class='add'>+		inode_set_mtime_to_ts(inode,</div><div class='add'>+				      inode_set_atime_to_ts(inode, inode_set_ctime_to_ts(inode, hfs_m_to_utime(rec-&gt;dir.MdDat))));</div><div class='ctx'> 		inode-&gt;i_op = &amp;hfs_dir_inode_operations;</div><div class='ctx'> 		inode-&gt;i_fop = &amp;hfs_dir_operations;</div><div class='ctx'> 		break;</div><div class='hunk'>@@ -401,7 +413,7 @@ struct inode *hfs_iget(struct super_block *sb, struct hfs_cat_key *key, hfs_cat_</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	}</div><div class='ctx'> 	inode = iget5_locked(sb, cnid, hfs_test_inode, hfs_read_inode, &amp;data);</div><div class='del'>-	if (inode &amp;&amp; (inode-&gt;i_state &amp; I_NEW))</div><div class='add'>+	if (inode &amp;&amp; (inode_state_read_once(inode) &amp; I_NEW))</div><div class='ctx'> 		unlock_new_inode(inode);</div><div class='ctx'> 	return inode;</div><div class='ctx'> }</div><div class='hunk'>@@ -425,7 +437,7 @@ int hfs_write_inode(struct inode *inode, struct writeback_control *wbc)</div><div class='ctx'> 	hfs_cat_rec rec;</div><div class='ctx'> 	int res;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(INODE, "hfs_write_inode: %lu\n", inode-&gt;i_ino);</div><div class='add'>+	hfs_dbg("ino %lu\n", inode-&gt;i_ino);</div><div class='ctx'> 	res = hfs_ext_write_extent(inode);</div><div class='ctx'> 	if (res)</div><div class='ctx'> 		return res;</div><div class='hunk'>@@ -456,25 +468,30 @@ int hfs_write_inode(struct inode *inode, struct writeback_control *wbc)</div><div class='ctx'> 		/* panic? */</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> </div><div class='add'>+	res = -EIO;</div><div class='add'>+	if (HFS_I(main_inode)-&gt;cat_key.CName.len &gt; HFS_NAMELEN)</div><div class='add'>+		goto out;</div><div class='ctx'> 	fd.search_key-&gt;cat = HFS_I(main_inode)-&gt;cat_key;</div><div class='ctx'> 	if (hfs_brec_find(&amp;fd))</div><div class='del'>-		/* panic? */</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	if (S_ISDIR(main_inode-&gt;i_mode)) {</div><div class='del'>-		WARN_ON(fd.entrylength &lt; sizeof(struct hfs_cat_dir));</div><div class='add'>+		if (fd.entrylength &lt; sizeof(struct hfs_cat_dir))</div><div class='add'>+			goto out;</div><div class='ctx'> 		hfs_bnode_read(fd.bnode, &amp;rec, fd.entryoffset,</div><div class='ctx'> 			   sizeof(struct hfs_cat_dir));</div><div class='ctx'> 		if (rec.type != HFS_CDR_DIR ||</div><div class='ctx'> 		    be32_to_cpu(rec.dir.DirID) != inode-&gt;i_ino) {</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		rec.dir.MdDat = hfs_u_to_mtime(inode-&gt;i_mtime);</div><div class='add'>+		rec.dir.MdDat = hfs_u_to_mtime(inode_get_mtime(inode));</div><div class='ctx'> 		rec.dir.Val = cpu_to_be16(inode-&gt;i_size - 2);</div><div class='ctx'> </div><div class='ctx'> 		hfs_bnode_write(fd.bnode, &amp;rec, fd.entryoffset,</div><div class='ctx'> 			    sizeof(struct hfs_cat_dir));</div><div class='ctx'> 	} else if (HFS_IS_RSRC(inode)) {</div><div class='add'>+		if (fd.entrylength &lt; sizeof(struct hfs_cat_file))</div><div class='add'>+			goto out;</div><div class='ctx'> 		hfs_bnode_read(fd.bnode, &amp;rec, fd.entryoffset,</div><div class='ctx'> 			       sizeof(struct hfs_cat_file));</div><div class='ctx'> 		hfs_inode_write_fork(inode, rec.file.RExtRec,</div><div class='hunk'>@@ -482,7 +499,8 @@ int hfs_write_inode(struct inode *inode, struct writeback_control *wbc)</div><div class='ctx'> 		hfs_bnode_write(fd.bnode, &amp;rec, fd.entryoffset,</div><div class='ctx'> 				sizeof(struct hfs_cat_file));</div><div class='ctx'> 	} else {</div><div class='del'>-		WARN_ON(fd.entrylength &lt; sizeof(struct hfs_cat_file));</div><div class='add'>+		if (fd.entrylength &lt; sizeof(struct hfs_cat_file))</div><div class='add'>+			goto out;</div><div class='ctx'> 		hfs_bnode_read(fd.bnode, &amp;rec, fd.entryoffset,</div><div class='ctx'> 			   sizeof(struct hfs_cat_file));</div><div class='ctx'> 		if (rec.type != HFS_CDR_FIL ||</div><div class='hunk'>@@ -494,14 +512,15 @@ int hfs_write_inode(struct inode *inode, struct writeback_control *wbc)</div><div class='ctx'> 		else</div><div class='ctx'> 			rec.file.Flags |= HFS_FIL_LOCK;</div><div class='ctx'> 		hfs_inode_write_fork(inode, rec.file.ExtRec, &amp;rec.file.LgLen, &amp;rec.file.PyLen);</div><div class='del'>-		rec.file.MdDat = hfs_u_to_mtime(inode-&gt;i_mtime);</div><div class='add'>+		rec.file.MdDat = hfs_u_to_mtime(inode_get_mtime(inode));</div><div class='ctx'> </div><div class='ctx'> 		hfs_bnode_write(fd.bnode, &amp;rec, fd.entryoffset,</div><div class='ctx'> 			    sizeof(struct hfs_cat_file));</div><div class='ctx'> 	}</div><div class='add'>+	res = 0;</div><div class='ctx'> out:</div><div class='ctx'> 	hfs_find_exit(&amp;fd);</div><div class='del'>-	return 0;</div><div class='add'>+	return res;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct dentry *hfs_file_lookup(struct inode *dir, struct dentry *dentry,</div><div class='hunk'>@@ -602,14 +621,14 @@ static int hfs_file_release(struct inode *inode, struct file *file)</div><div class='ctx'>  *     correspond to the same HFS file.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-int hfs_inode_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='add'>+int hfs_inode_setattr(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		      struct iattr *attr)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	struct hfs_sb_info *hsb = HFS_SB(inode-&gt;i_sb);</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	error = setattr_prepare(&amp;init_user_ns, dentry,</div><div class='add'>+	error = setattr_prepare(&amp;nop_mnt_idmap, dentry,</div><div class='ctx'> 				attr); /* basic permission checks */</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='hunk'>@@ -645,11 +664,10 @@ int hfs_inode_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> </div><div class='ctx'> 		truncate_setsize(inode, attr-&gt;ia_size);</div><div class='ctx'> 		hfs_file_truncate(inode);</div><div class='del'>-		inode-&gt;i_atime = inode-&gt;i_mtime = inode-&gt;i_ctime =</div><div class='del'>-						  current_time(inode);</div><div class='add'>+		simple_inode_init_ts(inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	setattr_copy(&amp;init_user_ns, inode, attr);</div><div class='add'>+	setattr_copy(&amp;nop_mnt_idmap, inode, attr);</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -684,8 +702,9 @@ static const struct file_operations hfs_file_operations = {</div><div class='ctx'> 	.llseek		= generic_file_llseek,</div><div class='ctx'> 	.read_iter	= generic_file_read_iter,</div><div class='ctx'> 	.write_iter	= generic_file_write_iter,</div><div class='del'>-	.mmap		= generic_file_mmap,</div><div class='del'>-	.splice_read	= generic_file_splice_read,</div><div class='add'>+	.mmap_prepare	= generic_file_mmap_prepare,</div><div class='add'>+	.splice_read	= filemap_splice_read,</div><div class='add'>+	.splice_write	= iter_file_splice_write,</div><div class='ctx'> 	.fsync		= hfs_file_fsync,</div><div class='ctx'> 	.open		= hfs_file_open,</div><div class='ctx'> 	.release	= hfs_file_release,</div><div class='head'>diff --git a/fs/hfs/mdb.c b/fs/hfs/mdb.c<br/>index 5beb82652435..53f3fae60217 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfs/mdb.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/mdb.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfs/mdb.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfs/mdb.c</a></div><div class='hunk'>@@ -9,7 +9,7 @@</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/cdrom.h&gt;</div><div class='del'>-#include &lt;linux/genhd.h&gt;</div><div class='add'>+#include &lt;linux/blkdev.h&gt;</div><div class='ctx'> #include &lt;linux/nls.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> </div><div class='hunk'>@@ -150,11 +150,11 @@ int hfs_mdb_get(struct super_block *sb)</div><div class='ctx'> </div><div class='ctx'> 	/* These parameters are read from and written to the MDB */</div><div class='ctx'> 	HFS_SB(sb)-&gt;free_ablocks = be16_to_cpu(mdb-&gt;drFreeBks);</div><div class='del'>-	HFS_SB(sb)-&gt;next_id = be32_to_cpu(mdb-&gt;drNxtCNID);</div><div class='add'>+	atomic64_set(&amp;HFS_SB(sb)-&gt;next_id, be32_to_cpu(mdb-&gt;drNxtCNID));</div><div class='ctx'> 	HFS_SB(sb)-&gt;root_files = be16_to_cpu(mdb-&gt;drNmFls);</div><div class='ctx'> 	HFS_SB(sb)-&gt;root_dirs = be16_to_cpu(mdb-&gt;drNmRtDirs);</div><div class='del'>-	HFS_SB(sb)-&gt;file_count = be32_to_cpu(mdb-&gt;drFilCnt);</div><div class='del'>-	HFS_SB(sb)-&gt;folder_count = be32_to_cpu(mdb-&gt;drDirCnt);</div><div class='add'>+	atomic64_set(&amp;HFS_SB(sb)-&gt;file_count, be32_to_cpu(mdb-&gt;drFilCnt));</div><div class='add'>+	atomic64_set(&amp;HFS_SB(sb)-&gt;folder_count, be32_to_cpu(mdb-&gt;drDirCnt));</div><div class='ctx'> </div><div class='ctx'> 	/* TRY to get the alternate (backup) MDB. */</div><div class='ctx'> 	sect = part_start + part_size - 2;</div><div class='hunk'>@@ -172,7 +172,7 @@ int hfs_mdb_get(struct super_block *sb)</div><div class='ctx'> 		pr_warn("continuing without an alternate MDB\n");</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	HFS_SB(sb)-&gt;bitmap = kmalloc(8192, GFP_KERNEL);</div><div class='add'>+	HFS_SB(sb)-&gt;bitmap = kzalloc(8192, GFP_KERNEL);</div><div class='ctx'> 	if (!HFS_SB(sb)-&gt;bitmap)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -273,11 +273,17 @@ void hfs_mdb_commit(struct super_block *sb)</div><div class='ctx'> 		/* These parameters may have been modified, so write them back */</div><div class='ctx'> 		mdb-&gt;drLsMod = hfs_mtime();</div><div class='ctx'> 		mdb-&gt;drFreeBks = cpu_to_be16(HFS_SB(sb)-&gt;free_ablocks);</div><div class='del'>-		mdb-&gt;drNxtCNID = cpu_to_be32(HFS_SB(sb)-&gt;next_id);</div><div class='add'>+		BUG_ON(atomic64_read(&amp;HFS_SB(sb)-&gt;next_id) &gt; U32_MAX);</div><div class='add'>+		mdb-&gt;drNxtCNID =</div><div class='add'>+			cpu_to_be32((u32)atomic64_read(&amp;HFS_SB(sb)-&gt;next_id));</div><div class='ctx'> 		mdb-&gt;drNmFls = cpu_to_be16(HFS_SB(sb)-&gt;root_files);</div><div class='ctx'> 		mdb-&gt;drNmRtDirs = cpu_to_be16(HFS_SB(sb)-&gt;root_dirs);</div><div class='del'>-		mdb-&gt;drFilCnt = cpu_to_be32(HFS_SB(sb)-&gt;file_count);</div><div class='del'>-		mdb-&gt;drDirCnt = cpu_to_be32(HFS_SB(sb)-&gt;folder_count);</div><div class='add'>+		BUG_ON(atomic64_read(&amp;HFS_SB(sb)-&gt;file_count) &gt; U32_MAX);</div><div class='add'>+		mdb-&gt;drFilCnt =</div><div class='add'>+			cpu_to_be32((u32)atomic64_read(&amp;HFS_SB(sb)-&gt;file_count));</div><div class='add'>+		BUG_ON(atomic64_read(&amp;HFS_SB(sb)-&gt;folder_count) &gt; U32_MAX);</div><div class='add'>+		mdb-&gt;drDirCnt =</div><div class='add'>+			cpu_to_be32((u32)atomic64_read(&amp;HFS_SB(sb)-&gt;folder_count));</div><div class='ctx'> </div><div class='ctx'> 		/* write MDB to disk */</div><div class='ctx'> 		mark_buffer_dirty(HFS_SB(sb)-&gt;mdb_bh);</div><div class='head'>diff --git a/fs/hfs/string.c b/fs/hfs/string.c<br/>index 3912209153a8..0cfa35e82abc 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfs/string.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/string.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfs/string.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfs/string.c</a></div><div class='hunk'>@@ -16,6 +16,8 @@</div><div class='ctx'> #include "hfs_fs.h"</div><div class='ctx'> #include &lt;linux/dcache.h&gt;</div><div class='ctx'> </div><div class='add'>+#include &lt;kunit/visibility.h&gt;</div><div class='add'>+</div><div class='ctx'> /*================ File-local variables ================*/</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -65,6 +67,7 @@ int hfs_hash_dentry(const struct dentry *dentry, struct qstr *this)</div><div class='ctx'> 	this-&gt;hash = end_name_hash(hash);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL_IF_KUNIT(hfs_hash_dentry);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Compare two strings in the HFS filename character ordering</div><div class='hunk'>@@ -87,6 +90,7 @@ int hfs_strcmp(const unsigned char *s1, unsigned int len1,</div><div class='ctx'> 	}</div><div class='ctx'> 	return len1 - len2;</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL_IF_KUNIT(hfs_strcmp);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Test for equality of two strings in the HFS filename character ordering.</div><div class='hunk'>@@ -112,3 +116,4 @@ int hfs_compare_dentry(const struct dentry *dentry,</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL_IF_KUNIT(hfs_compare_dentry);</div><div class='head'>diff --git a/fs/hfs/string_test.c b/fs/hfs/string_test.c<br/>new file mode 100644<br/>index 000000000000..e1bf6f954312<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfs/string_test.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfs/string_test.c</a></div><div class='hunk'>@@ -0,0 +1,133 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+/*</div><div class='add'>+ * KUnit tests for HFS string operations</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2025 Viacheslav Dubeyko &lt;slava@dubeyko.com&gt;</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;kunit/test.h&gt;</div><div class='add'>+#include &lt;linux/dcache.h&gt;</div><div class='add'>+#include "hfs_fs.h"</div><div class='add'>+</div><div class='add'>+/* Test hfs_strcmp function */</div><div class='add'>+static void hfs_strcmp_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	/* Test equal strings */</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfs_strcmp("hello", 5, "hello", 5));</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfs_strcmp("test", 4, "test", 4));</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfs_strcmp("", 0, "", 0));</div><div class='add'>+</div><div class='add'>+	/* Test unequal strings */</div><div class='add'>+	KUNIT_EXPECT_NE(test, 0, hfs_strcmp("hello", 5, "world", 5));</div><div class='add'>+	KUNIT_EXPECT_NE(test, 0, hfs_strcmp("test", 4, "testing", 7));</div><div class='add'>+</div><div class='add'>+	/* Test different lengths */</div><div class='add'>+	KUNIT_EXPECT_LT(test, hfs_strcmp("test", 4, "testing", 7), 0);</div><div class='add'>+	KUNIT_EXPECT_GT(test, hfs_strcmp("testing", 7, "test", 4), 0);</div><div class='add'>+</div><div class='add'>+	/* Test case insensitive comparison (HFS should handle case) */</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfs_strcmp("Test", 4, "TEST", 4));</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfs_strcmp("hello", 5, "HELLO", 5));</div><div class='add'>+</div><div class='add'>+	/* Test with special characters */</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfs_strcmp("file.txt", 8, "file.txt", 8));</div><div class='add'>+	KUNIT_EXPECT_NE(test, 0, hfs_strcmp("file.txt", 8, "file.dat", 8));</div><div class='add'>+</div><div class='add'>+	/* Test boundary cases */</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfs_strcmp("a", 1, "a", 1));</div><div class='add'>+	KUNIT_EXPECT_NE(test, 0, hfs_strcmp("a", 1, "b", 1));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test hfs_hash_dentry function */</div><div class='add'>+static void hfs_hash_dentry_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct qstr test_name1, test_name2, test_name3;</div><div class='add'>+	struct dentry dentry = {};</div><div class='add'>+	char name1[] = "testfile";</div><div class='add'>+	char name2[] = "TestFile";</div><div class='add'>+	char name3[] = "different";</div><div class='add'>+</div><div class='add'>+	/* Initialize test strings */</div><div class='add'>+	test_name1.name = name1;</div><div class='add'>+	test_name1.len = strlen(name1);</div><div class='add'>+	test_name1.hash = 0;</div><div class='add'>+</div><div class='add'>+	test_name2.name = name2;</div><div class='add'>+	test_name2.len = strlen(name2);</div><div class='add'>+	test_name2.hash = 0;</div><div class='add'>+</div><div class='add'>+	test_name3.name = name3;</div><div class='add'>+	test_name3.len = strlen(name3);</div><div class='add'>+	test_name3.hash = 0;</div><div class='add'>+</div><div class='add'>+	/* Test hashing */</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfs_hash_dentry(&amp;dentry, &amp;test_name1));</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfs_hash_dentry(&amp;dentry, &amp;test_name2));</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfs_hash_dentry(&amp;dentry, &amp;test_name3));</div><div class='add'>+</div><div class='add'>+	/* Case insensitive names should hash the same */</div><div class='add'>+	KUNIT_EXPECT_EQ(test, test_name1.hash, test_name2.hash);</div><div class='add'>+</div><div class='add'>+	/* Different names should have different hashes */</div><div class='add'>+	KUNIT_EXPECT_NE(test, test_name1.hash, test_name3.hash);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test hfs_compare_dentry function */</div><div class='add'>+static void hfs_compare_dentry_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct qstr test_name;</div><div class='add'>+	struct dentry dentry = {};</div><div class='add'>+	char name[] = "TestFile";</div><div class='add'>+</div><div class='add'>+	test_name.name = name;</div><div class='add'>+	test_name.len = strlen(name);</div><div class='add'>+</div><div class='add'>+	/* Test exact match */</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfs_compare_dentry(&amp;dentry, 8,</div><div class='add'>+						    "TestFile", &amp;test_name));</div><div class='add'>+</div><div class='add'>+	/* Test case insensitive match */</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfs_compare_dentry(&amp;dentry, 8,</div><div class='add'>+						    "testfile", &amp;test_name));</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfs_compare_dentry(&amp;dentry, 8,</div><div class='add'>+						    "TESTFILE", &amp;test_name));</div><div class='add'>+</div><div class='add'>+	/* Test different names */</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 1, hfs_compare_dentry(&amp;dentry, 8,</div><div class='add'>+						    "DiffFile", &amp;test_name));</div><div class='add'>+</div><div class='add'>+	/* Test different lengths */</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 1, hfs_compare_dentry(&amp;dentry, 7,</div><div class='add'>+						    "TestFil", &amp;test_name));</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 1, hfs_compare_dentry(&amp;dentry, 9,</div><div class='add'>+						    "TestFiles", &amp;test_name));</div><div class='add'>+</div><div class='add'>+	/* Test empty string */</div><div class='add'>+	test_name.name = "";</div><div class='add'>+	test_name.len = 0;</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfs_compare_dentry(&amp;dentry, 0, "", &amp;test_name));</div><div class='add'>+</div><div class='add'>+	/* Test HFS_NAMELEN boundary */</div><div class='add'>+	test_name.name = "This_is_a_very_long_filename_that_exceeds_normal_limits";</div><div class='add'>+	test_name.len = strlen(test_name.name);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfs_compare_dentry(&amp;dentry, HFS_NAMELEN,</div><div class='add'>+			"This_is_a_very_long_filename_th", &amp;test_name));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct kunit_case hfs_string_test_cases[] = {</div><div class='add'>+	KUNIT_CASE(hfs_strcmp_test),</div><div class='add'>+	KUNIT_CASE(hfs_hash_dentry_test),</div><div class='add'>+	KUNIT_CASE(hfs_compare_dentry_test),</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static struct kunit_suite hfs_string_test_suite = {</div><div class='add'>+	.name = "hfs_string",</div><div class='add'>+	.test_cases = hfs_string_test_cases,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+kunit_test_suite(hfs_string_test_suite);</div><div class='add'>+</div><div class='add'>+MODULE_DESCRIPTION("KUnit tests for HFS string operations");</div><div class='add'>+MODULE_LICENSE("GPL");</div><div class='add'>+MODULE_IMPORT_NS("EXPORTED_FOR_KUNIT_TESTING");</div><div class='head'>diff --git a/fs/hfs/super.c b/fs/hfs/super.c<br/>index 12d9bae39363..47f50fa555a4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfs/super.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/super.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfs/super.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfs/super.c</a></div><div class='hunk'>@@ -15,10 +15,11 @@</div><div class='ctx'> #include &lt;linux/module.h&gt;</div><div class='ctx'> #include &lt;linux/blkdev.h&gt;</div><div class='ctx'> #include &lt;linux/backing-dev.h&gt;</div><div class='add'>+#include &lt;linux/fs_context.h&gt;</div><div class='add'>+#include &lt;linux/fs_parser.h&gt;</div><div class='ctx'> #include &lt;linux/mount.h&gt;</div><div class='ctx'> #include &lt;linux/init.h&gt;</div><div class='ctx'> #include &lt;linux/nls.h&gt;</div><div class='del'>-#include &lt;linux/parser.h&gt;</div><div class='ctx'> #include &lt;linux/seq_file.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/vfs.h&gt;</div><div class='hunk'>@@ -28,6 +29,7 @@</div><div class='ctx'> </div><div class='ctx'> static struct kmem_cache *hfs_inode_cachep;</div><div class='ctx'> </div><div class='add'>+MODULE_DESCRIPTION("Apple Macintosh file system support");</div><div class='ctx'> MODULE_LICENSE("GPL");</div><div class='ctx'> </div><div class='ctx'> static int hfs_sync_fs(struct super_block *sb, int wait)</div><div class='hunk'>@@ -110,21 +112,24 @@ static int hfs_statfs(struct dentry *dentry, struct kstatfs *buf)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hfs_remount(struct super_block *sb, int *flags, char *data)</div><div class='add'>+static int hfs_reconfigure(struct fs_context *fc)</div><div class='ctx'> {</div><div class='add'>+	struct super_block *sb = fc-&gt;root-&gt;d_sb;</div><div class='add'>+</div><div class='ctx'> 	sync_filesystem(sb);</div><div class='del'>-	*flags |= SB_NODIRATIME;</div><div class='del'>-	if ((bool)(*flags &amp; SB_RDONLY) == sb_rdonly(sb))</div><div class='add'>+	fc-&gt;sb_flags |= SB_NODIRATIME;</div><div class='add'>+	if ((bool)(fc-&gt;sb_flags &amp; SB_RDONLY) == sb_rdonly(sb))</div><div class='ctx'> 		return 0;</div><div class='del'>-	if (!(*flags &amp; SB_RDONLY)) {</div><div class='add'>+</div><div class='add'>+	if (!(fc-&gt;sb_flags &amp; SB_RDONLY)) {</div><div class='ctx'> 		if (!(HFS_SB(sb)-&gt;mdb-&gt;drAtrb &amp; cpu_to_be16(HFS_SB_ATTRIB_UNMNT))) {</div><div class='ctx'> 			pr_warn("filesystem was not cleanly unmounted, running fsck.hfs is recommended.  leaving read-only.\n");</div><div class='ctx'> 			sb-&gt;s_flags |= SB_RDONLY;</div><div class='del'>-			*flags |= SB_RDONLY;</div><div class='add'>+			fc-&gt;sb_flags |= SB_RDONLY;</div><div class='ctx'> 		} else if (HFS_SB(sb)-&gt;mdb-&gt;drAtrb &amp; cpu_to_be16(HFS_SB_ATTRIB_SLOCK)) {</div><div class='ctx'> 			pr_warn("filesystem is marked locked, leaving read-only.\n");</div><div class='ctx'> 			sb-&gt;s_flags |= SB_RDONLY;</div><div class='del'>-			*flags |= SB_RDONLY;</div><div class='add'>+			fc-&gt;sb_flags |= SB_RDONLY;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -162,7 +167,7 @@ static struct inode *hfs_alloc_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct hfs_inode_info *i;</div><div class='ctx'> </div><div class='del'>-	i = kmem_cache_alloc(hfs_inode_cachep, GFP_KERNEL);</div><div class='add'>+	i = alloc_inode_sb(sb, hfs_inode_cachep, GFP_KERNEL);</div><div class='ctx'> 	return i ? &amp;i-&gt;vfs_inode : NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -179,7 +184,6 @@ static const struct super_operations hfs_super_operations = {</div><div class='ctx'> 	.put_super	= hfs_put_super,</div><div class='ctx'> 	.sync_fs	= hfs_sync_fs,</div><div class='ctx'> 	.statfs		= hfs_statfs,</div><div class='del'>-	.remount_fs     = hfs_remount,</div><div class='ctx'> 	.show_options	= hfs_show_options,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -187,181 +191,112 @@ enum {</div><div class='ctx'> 	opt_uid, opt_gid, opt_umask, opt_file_umask, opt_dir_umask,</div><div class='ctx'> 	opt_part, opt_session, opt_type, opt_creator, opt_quiet,</div><div class='ctx'> 	opt_codepage, opt_iocharset,</div><div class='del'>-	opt_err</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static const match_table_t tokens = {</div><div class='del'>-	{ opt_uid, "uid=%u" },</div><div class='del'>-	{ opt_gid, "gid=%u" },</div><div class='del'>-	{ opt_umask, "umask=%o" },</div><div class='del'>-	{ opt_file_umask, "file_umask=%o" },</div><div class='del'>-	{ opt_dir_umask, "dir_umask=%o" },</div><div class='del'>-	{ opt_part, "part=%u" },</div><div class='del'>-	{ opt_session, "session=%u" },</div><div class='del'>-	{ opt_type, "type=%s" },</div><div class='del'>-	{ opt_creator, "creator=%s" },</div><div class='del'>-	{ opt_quiet, "quiet" },</div><div class='del'>-	{ opt_codepage, "codepage=%s" },</div><div class='del'>-	{ opt_iocharset, "iocharset=%s" },</div><div class='del'>-	{ opt_err, NULL }</div><div class='add'>+static const struct fs_parameter_spec hfs_param_spec[] = {</div><div class='add'>+	fsparam_u32	("uid",		opt_uid),</div><div class='add'>+	fsparam_u32	("gid",		opt_gid),</div><div class='add'>+	fsparam_u32oct	("umask",	opt_umask),</div><div class='add'>+	fsparam_u32oct	("file_umask",	opt_file_umask),</div><div class='add'>+	fsparam_u32oct	("dir_umask",	opt_dir_umask),</div><div class='add'>+	fsparam_u32	("part",	opt_part),</div><div class='add'>+	fsparam_u32	("session",	opt_session),</div><div class='add'>+	fsparam_string	("type",	opt_type),</div><div class='add'>+	fsparam_string	("creator",	opt_creator),</div><div class='add'>+	fsparam_flag	("quiet",	opt_quiet),</div><div class='add'>+	fsparam_string	("codepage",	opt_codepage),</div><div class='add'>+	fsparam_string	("iocharset",	opt_iocharset),</div><div class='add'>+	{}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static inline int match_fourchar(substring_t *arg, u32 *result)</div><div class='del'>-{</div><div class='del'>-	if (arg-&gt;to - arg-&gt;from != 4)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	memcpy(result, arg-&gt;from, 4);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='del'>- * parse_options()</div><div class='add'>+ * hfs_parse_param()</div><div class='ctx'>  *</div><div class='del'>- * adapted from linux/fs/msdos/inode.c written 1992,93 by Werner Almesberger</div><div class='del'>- * This function is called by hfs_read_super() to parse the mount options.</div><div class='add'>+ * This function is called by the vfs to parse the mount options.</div><div class='ctx'>  */</div><div class='del'>-static int parse_options(char *options, struct hfs_sb_info *hsb)</div><div class='add'>+static int hfs_parse_param(struct fs_context *fc, struct fs_parameter *param)</div><div class='ctx'> {</div><div class='del'>-	char *p;</div><div class='del'>-	substring_t args[MAX_OPT_ARGS];</div><div class='del'>-	int tmp, token;</div><div class='del'>-</div><div class='del'>-	/* initialize the sb with defaults */</div><div class='del'>-	hsb-&gt;s_uid = current_uid();</div><div class='del'>-	hsb-&gt;s_gid = current_gid();</div><div class='del'>-	hsb-&gt;s_file_umask = 0133;</div><div class='del'>-	hsb-&gt;s_dir_umask = 0022;</div><div class='del'>-	hsb-&gt;s_type = hsb-&gt;s_creator = cpu_to_be32(0x3f3f3f3f);	/* == '????' */</div><div class='del'>-	hsb-&gt;s_quiet = 0;</div><div class='del'>-	hsb-&gt;part = -1;</div><div class='del'>-	hsb-&gt;session = -1;</div><div class='del'>-</div><div class='del'>-	if (!options)</div><div class='del'>-		return 1;</div><div class='del'>-</div><div class='del'>-	while ((p = strsep(&amp;options, ",")) != NULL) {</div><div class='del'>-		if (!*p)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		token = match_token(p, tokens, args);</div><div class='del'>-		switch (token) {</div><div class='del'>-		case opt_uid:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;tmp)) {</div><div class='del'>-				pr_err("uid requires an argument\n");</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			hsb-&gt;s_uid = make_kuid(current_user_ns(), (uid_t)tmp);</div><div class='del'>-			if (!uid_valid(hsb-&gt;s_uid)) {</div><div class='del'>-				pr_err("invalid uid %d\n", tmp);</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		case opt_gid:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;tmp)) {</div><div class='del'>-				pr_err("gid requires an argument\n");</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			hsb-&gt;s_gid = make_kgid(current_user_ns(), (gid_t)tmp);</div><div class='del'>-			if (!gid_valid(hsb-&gt;s_gid)) {</div><div class='del'>-				pr_err("invalid gid %d\n", tmp);</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		case opt_umask:</div><div class='del'>-			if (match_octal(&amp;args[0], &amp;tmp)) {</div><div class='del'>-				pr_err("umask requires a value\n");</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			hsb-&gt;s_file_umask = (umode_t)tmp;</div><div class='del'>-			hsb-&gt;s_dir_umask = (umode_t)tmp;</div><div class='del'>-			break;</div><div class='del'>-		case opt_file_umask:</div><div class='del'>-			if (match_octal(&amp;args[0], &amp;tmp)) {</div><div class='del'>-				pr_err("file_umask requires a value\n");</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			hsb-&gt;s_file_umask = (umode_t)tmp;</div><div class='del'>-			break;</div><div class='del'>-		case opt_dir_umask:</div><div class='del'>-			if (match_octal(&amp;args[0], &amp;tmp)) {</div><div class='del'>-				pr_err("dir_umask requires a value\n");</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			hsb-&gt;s_dir_umask = (umode_t)tmp;</div><div class='del'>-			break;</div><div class='del'>-		case opt_part:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;hsb-&gt;part)) {</div><div class='del'>-				pr_err("part requires an argument\n");</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		case opt_session:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;hsb-&gt;session)) {</div><div class='del'>-				pr_err("session requires an argument\n");</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		case opt_type:</div><div class='del'>-			if (match_fourchar(&amp;args[0], &amp;hsb-&gt;s_type)) {</div><div class='del'>-				pr_err("type requires a 4 character value\n");</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		case opt_creator:</div><div class='del'>-			if (match_fourchar(&amp;args[0], &amp;hsb-&gt;s_creator)) {</div><div class='del'>-				pr_err("creator requires a 4 character value\n");</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		case opt_quiet:</div><div class='del'>-			hsb-&gt;s_quiet = 1;</div><div class='del'>-			break;</div><div class='del'>-		case opt_codepage:</div><div class='del'>-			if (hsb-&gt;nls_disk) {</div><div class='del'>-				pr_err("unable to change codepage\n");</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			p = match_strdup(&amp;args[0]);</div><div class='del'>-			if (p)</div><div class='del'>-				hsb-&gt;nls_disk = load_nls(p);</div><div class='del'>-			if (!hsb-&gt;nls_disk) {</div><div class='del'>-				pr_err("unable to load codepage \"%s\"\n", p);</div><div class='del'>-				kfree(p);</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			kfree(p);</div><div class='del'>-			break;</div><div class='del'>-		case opt_iocharset:</div><div class='del'>-			if (hsb-&gt;nls_io) {</div><div class='del'>-				pr_err("unable to change iocharset\n");</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			p = match_strdup(&amp;args[0]);</div><div class='del'>-			if (p)</div><div class='del'>-				hsb-&gt;nls_io = load_nls(p);</div><div class='del'>-			if (!hsb-&gt;nls_io) {</div><div class='del'>-				pr_err("unable to load iocharset \"%s\"\n", p);</div><div class='del'>-				kfree(p);</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			kfree(p);</div><div class='del'>-			break;</div><div class='del'>-		default:</div><div class='del'>-			return 0;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	struct hfs_sb_info *hsb = fc-&gt;s_fs_info;</div><div class='add'>+	struct fs_parse_result result;</div><div class='add'>+	int opt;</div><div class='add'>+</div><div class='add'>+	/* hfs does not honor any fs-specific options on remount */</div><div class='add'>+	if (fc-&gt;purpose == FS_CONTEXT_FOR_RECONFIGURE)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	if (hsb-&gt;nls_disk &amp;&amp; !hsb-&gt;nls_io) {</div><div class='del'>-		hsb-&gt;nls_io = load_nls_default();</div><div class='add'>+	opt = fs_parse(fc, hfs_param_spec, param, &amp;result);</div><div class='add'>+	if (opt &lt; 0)</div><div class='add'>+		return opt;</div><div class='add'>+</div><div class='add'>+	switch (opt) {</div><div class='add'>+	case opt_uid:</div><div class='add'>+		hsb-&gt;s_uid = result.uid;</div><div class='add'>+		break;</div><div class='add'>+	case opt_gid:</div><div class='add'>+		hsb-&gt;s_gid = result.gid;</div><div class='add'>+		break;</div><div class='add'>+	case opt_umask:</div><div class='add'>+		hsb-&gt;s_file_umask = (umode_t)result.uint_32;</div><div class='add'>+		hsb-&gt;s_dir_umask = (umode_t)result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case opt_file_umask:</div><div class='add'>+		hsb-&gt;s_file_umask = (umode_t)result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case opt_dir_umask:</div><div class='add'>+		hsb-&gt;s_dir_umask = (umode_t)result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case opt_part:</div><div class='add'>+		hsb-&gt;part = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case opt_session:</div><div class='add'>+		hsb-&gt;session = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case opt_type:</div><div class='add'>+		if (strlen(param-&gt;string) != 4) {</div><div class='add'>+			pr_err("type requires a 4 character value\n");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		memcpy(&amp;hsb-&gt;s_type, param-&gt;string, 4);</div><div class='add'>+		break;</div><div class='add'>+	case opt_creator:</div><div class='add'>+		if (strlen(param-&gt;string) != 4) {</div><div class='add'>+			pr_err("creator requires a 4 character value\n");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		memcpy(&amp;hsb-&gt;s_creator, param-&gt;string, 4);</div><div class='add'>+		break;</div><div class='add'>+	case opt_quiet:</div><div class='add'>+		hsb-&gt;s_quiet = 1;</div><div class='add'>+		break;</div><div class='add'>+	case opt_codepage:</div><div class='add'>+		if (hsb-&gt;nls_disk) {</div><div class='add'>+			pr_err("unable to change codepage\n");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		hsb-&gt;nls_disk = load_nls(param-&gt;string);</div><div class='add'>+		if (!hsb-&gt;nls_disk) {</div><div class='add'>+			pr_err("unable to load codepage \"%s\"\n",</div><div class='add'>+					param-&gt;string);</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='add'>+	case opt_iocharset:</div><div class='add'>+		if (hsb-&gt;nls_io) {</div><div class='add'>+			pr_err("unable to change iocharset\n");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		hsb-&gt;nls_io = load_nls(param-&gt;string);</div><div class='ctx'> 		if (!hsb-&gt;nls_io) {</div><div class='del'>-			pr_err("unable to load default iocharset\n");</div><div class='del'>-			return 0;</div><div class='add'>+			pr_err("unable to load iocharset \"%s\"\n",</div><div class='add'>+					param-&gt;string);</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 		}</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-	hsb-&gt;s_dir_umask &amp;= 0777;</div><div class='del'>-	hsb-&gt;s_file_umask &amp;= 0577;</div><div class='ctx'> </div><div class='del'>-	return 1;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -375,29 +310,29 @@ static int parse_options(char *options, struct hfs_sb_info *hsb)</div><div class='ctx'>  * hfs_btree_init() to get the necessary data about the extents and</div><div class='ctx'>  * catalog B-trees and, finally, reading the root inode into memory.</div><div class='ctx'>  */</div><div class='del'>-static int hfs_fill_super(struct super_block *sb, void *data, int silent)</div><div class='add'>+static int hfs_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	struct hfs_sb_info *sbi;</div><div class='add'>+	struct hfs_sb_info *sbi = HFS_SB(sb);</div><div class='ctx'> 	struct hfs_find_data fd;</div><div class='ctx'> 	hfs_cat_rec rec;</div><div class='ctx'> 	struct inode *root_inode;</div><div class='add'>+	int silent = fc-&gt;sb_flags &amp; SB_SILENT;</div><div class='ctx'> 	int res;</div><div class='ctx'> </div><div class='del'>-	sbi = kzalloc(sizeof(struct hfs_sb_info), GFP_KERNEL);</div><div class='del'>-	if (!sbi)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	atomic64_set(&amp;sbi-&gt;file_count, 0);</div><div class='add'>+	atomic64_set(&amp;sbi-&gt;folder_count, 0);</div><div class='add'>+	atomic64_set(&amp;sbi-&gt;next_id, 0);</div><div class='add'>+</div><div class='add'>+	/* load_nls_default does not fail */</div><div class='add'>+	if (sbi-&gt;nls_disk &amp;&amp; !sbi-&gt;nls_io)</div><div class='add'>+		sbi-&gt;nls_io = load_nls_default();</div><div class='add'>+	sbi-&gt;s_dir_umask &amp;= 0777;</div><div class='add'>+	sbi-&gt;s_file_umask &amp;= 0577;</div><div class='ctx'> </div><div class='del'>-	sbi-&gt;sb = sb;</div><div class='del'>-	sb-&gt;s_fs_info = sbi;</div><div class='ctx'> 	spin_lock_init(&amp;sbi-&gt;work_lock);</div><div class='ctx'> 	INIT_DELAYED_WORK(&amp;sbi-&gt;mdb_work, flush_mdb);</div><div class='ctx'> </div><div class='del'>-	res = -EINVAL;</div><div class='del'>-	if (!parse_options((char *)data, sbi)) {</div><div class='del'>-		pr_err("unable to parse mount options\n");</div><div class='del'>-		goto bail;</div><div class='del'>-	}</div><div class='del'>-</div><div class='add'>+	sbi-&gt;sb = sb;</div><div class='ctx'> 	sb-&gt;s_op = &amp;hfs_super_operations;</div><div class='ctx'> 	sb-&gt;s_xattr = hfs_xattr_handlers;</div><div class='ctx'> 	sb-&gt;s_flags |= SB_NODIRATIME;</div><div class='hunk'>@@ -418,11 +353,13 @@ static int hfs_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 		goto bail_no_root;</div><div class='ctx'> 	res = hfs_cat_find_brec(sb, HFS_ROOT_CNID, &amp;fd);</div><div class='ctx'> 	if (!res) {</div><div class='del'>-		if (fd.entrylength &gt; sizeof(rec) || fd.entrylength &lt; 0) {</div><div class='add'>+		if (fd.entrylength != sizeof(rec.dir)) {</div><div class='ctx'> 			res =  -EIO;</div><div class='ctx'> 			goto bail_hfs_find;</div><div class='ctx'> 		}</div><div class='ctx'> 		hfs_bnode_read(fd.bnode, &amp;rec, fd.entryoffset, fd.entrylength);</div><div class='add'>+		if (rec.type != HFS_CDR_DIR)</div><div class='add'>+			res = -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (res)</div><div class='ctx'> 		goto bail_hfs_find;</div><div class='hunk'>@@ -432,7 +369,7 @@ static int hfs_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 	if (!root_inode)</div><div class='ctx'> 		goto bail_no_root;</div><div class='ctx'> </div><div class='del'>-	sb-&gt;s_d_op = &amp;hfs_dentry_operations;</div><div class='add'>+	set_default_d_op(sb, &amp;hfs_dentry_operations);</div><div class='ctx'> 	res = -ENOMEM;</div><div class='ctx'> 	sb-&gt;s_root = d_make_root(root_inode);</div><div class='ctx'> 	if (!sb-&gt;s_root)</div><div class='hunk'>@@ -450,18 +387,56 @@ bail:</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct dentry *hfs_mount(struct file_system_type *fs_type,</div><div class='del'>-		      int flags, const char *dev_name, void *data)</div><div class='add'>+static int hfs_get_tree(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	return mount_bdev(fs_type, flags, dev_name, data, hfs_fill_super);</div><div class='add'>+	return get_tree_bdev(fc, hfs_fill_super);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void hfs_free_fc(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	kfree(fc-&gt;s_fs_info);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct fs_context_operations hfs_context_ops = {</div><div class='add'>+	.parse_param	= hfs_parse_param,</div><div class='add'>+	.get_tree	= hfs_get_tree,</div><div class='add'>+	.reconfigure	= hfs_reconfigure,</div><div class='add'>+	.free		= hfs_free_fc,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int hfs_init_fs_context(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct hfs_sb_info *hsb;</div><div class='add'>+</div><div class='add'>+	hsb = kzalloc(sizeof(struct hfs_sb_info), GFP_KERNEL);</div><div class='add'>+	if (!hsb)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	fc-&gt;s_fs_info = hsb;</div><div class='add'>+	fc-&gt;ops = &amp;hfs_context_ops;</div><div class='add'>+</div><div class='add'>+	if (fc-&gt;purpose != FS_CONTEXT_FOR_RECONFIGURE) {</div><div class='add'>+		/* initialize options with defaults */</div><div class='add'>+		hsb-&gt;s_uid = current_uid();</div><div class='add'>+		hsb-&gt;s_gid = current_gid();</div><div class='add'>+		hsb-&gt;s_file_umask = 0133;</div><div class='add'>+		hsb-&gt;s_dir_umask = 0022;</div><div class='add'>+		hsb-&gt;s_type = cpu_to_be32(0x3f3f3f3f); /* == '????' */</div><div class='add'>+		hsb-&gt;s_creator = cpu_to_be32(0x3f3f3f3f); /* == '????' */</div><div class='add'>+		hsb-&gt;s_quiet = 0;</div><div class='add'>+		hsb-&gt;part = -1;</div><div class='add'>+		hsb-&gt;session = -1;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct file_system_type hfs_fs_type = {</div><div class='ctx'> 	.owner		= THIS_MODULE,</div><div class='ctx'> 	.name		= "hfs",</div><div class='del'>-	.mount		= hfs_mount,</div><div class='ctx'> 	.kill_sb	= kill_block_super,</div><div class='ctx'> 	.fs_flags	= FS_REQUIRES_DEV,</div><div class='add'>+	.init_fs_context = hfs_init_fs_context,</div><div class='ctx'> };</div><div class='ctx'> MODULE_ALIAS_FS("hfs");</div><div class='ctx'> </div><div class='head'>diff --git a/fs/hfs/sysdep.c b/fs/hfs/sysdep.c<br/>index 2875961fdc10..ef54fc8093cf 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfs/sysdep.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/sysdep.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfs/sysdep.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfs/sysdep.c</a></div><div class='hunk'>@@ -13,7 +13,8 @@</div><div class='ctx'> </div><div class='ctx'> /* dentry case-handling: just lowercase everything */</div><div class='ctx'> </div><div class='del'>-static int hfs_revalidate_dentry(struct dentry *dentry, unsigned int flags)</div><div class='add'>+static int hfs_revalidate_dentry(struct inode *dir, const struct qstr *name,</div><div class='add'>+				 struct dentry *dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	int diff;</div><div class='hunk'>@@ -28,9 +29,13 @@ static int hfs_revalidate_dentry(struct dentry *dentry, unsigned int flags)</div><div class='ctx'> 	/* fix up inode on a timezone change */</div><div class='ctx'> 	diff = sys_tz.tz_minuteswest * 60 - HFS_I(inode)-&gt;tz_secondswest;</div><div class='ctx'> 	if (diff) {</div><div class='del'>-		inode-&gt;i_ctime.tv_sec += diff;</div><div class='del'>-		inode-&gt;i_atime.tv_sec += diff;</div><div class='del'>-		inode-&gt;i_mtime.tv_sec += diff;</div><div class='add'>+		struct timespec64 ts = inode_get_ctime(inode);</div><div class='add'>+</div><div class='add'>+		inode_set_ctime(inode, ts.tv_sec + diff, ts.tv_nsec);</div><div class='add'>+		ts = inode_get_atime(inode);</div><div class='add'>+		inode_set_atime(inode, ts.tv_sec + diff, ts.tv_nsec);</div><div class='add'>+		ts = inode_get_mtime(inode);</div><div class='add'>+		inode_set_mtime(inode, ts.tv_sec + diff, ts.tv_nsec);</div><div class='ctx'> 		HFS_I(inode)-&gt;tz_secondswest += diff;</div><div class='ctx'> 	}</div><div class='ctx'> 	return 1;</div><div class='head'>diff --git a/fs/hfs/trans.c b/fs/hfs/trans.c<br/>index 39f5e343bf4d..fdb0edb8a607 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfs/trans.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfs/trans.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfs/trans.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfs/trans.c</a></div><div class='hunk'>@@ -109,7 +109,7 @@ void hfs_asc2mac(struct super_block *sb, struct hfs_name *out, const struct qstr</div><div class='ctx'> 	if (nls_io) {</div><div class='ctx'> 		wchar_t ch;</div><div class='ctx'> </div><div class='del'>-		while (srclen &gt; 0) {</div><div class='add'>+		while (srclen &gt; 0 &amp;&amp; dstlen &gt; 0) {</div><div class='ctx'> 			size = nls_io-&gt;char2uni(src, srclen, &amp;ch);</div><div class='ctx'> 			if (size &lt; 0) {</div><div class='ctx'> 				ch = '?';</div><div class='head'>diff --git a/fs/hfsplus/.kunitconfig b/fs/hfsplus/.kunitconfig<br/>new file mode 100644<br/>index 000000000000..6c96dc7e872c<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/.kunitconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfsplus/.kunitconfig</a></div><div class='hunk'>@@ -0,0 +1,8 @@</div><div class='add'>+CONFIG_KUNIT=y</div><div class='add'>+CONFIG_HFSPLUS_FS=y</div><div class='add'>+CONFIG_HFSPLUS_KUNIT_TEST=y</div><div class='add'>+CONFIG_BLOCK=y</div><div class='add'>+CONFIG_BUFFER_HEAD=y</div><div class='add'>+CONFIG_NLS=y</div><div class='add'>+CONFIG_NLS_UTF8=y</div><div class='add'>+CONFIG_LEGACY_DIRECT_IO=y</div><div class='head'>diff --git a/fs/hfsplus/Kconfig b/fs/hfsplus/Kconfig<br/>index 7d4229aecec0..ca8401cb6954 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfsplus/Kconfig</a></div><div class='hunk'>@@ -2,8 +2,10 @@</div><div class='ctx'> config HFSPLUS_FS</div><div class='ctx'> 	tristate "Apple Extended HFS file system support"</div><div class='ctx'> 	depends on BLOCK</div><div class='add'>+	select BUFFER_HEAD</div><div class='ctx'> 	select NLS</div><div class='ctx'> 	select NLS_UTF8</div><div class='add'>+	select LEGACY_DIRECT_IO</div><div class='ctx'> 	help</div><div class='ctx'> 	  If you say Y here, you will be able to mount extended format</div><div class='ctx'> 	  Macintosh-formatted hard drive partitions with full read-write access.</div><div class='hunk'>@@ -12,3 +14,18 @@ config HFSPLUS_FS</div><div class='ctx'> 	  MacOS 8. It includes all Mac specific filesystem data such as</div><div class='ctx'> 	  data forks and creator codes, but it also has several UNIX</div><div class='ctx'> 	  style features such as file ownership and permissions.</div><div class='add'>+</div><div class='add'>+config HFSPLUS_KUNIT_TEST</div><div class='add'>+	tristate "KUnit tests for HFS+ filesystem" if !KUNIT_ALL_TESTS</div><div class='add'>+	depends on HFSPLUS_FS &amp;&amp; KUNIT</div><div class='add'>+	default KUNIT_ALL_TESTS</div><div class='add'>+	help</div><div class='add'>+	  This builds KUnit tests for the HFS+ filesystem.</div><div class='add'>+</div><div class='add'>+	  KUnit tests run during boot and output the results to the debug</div><div class='add'>+	  log in TAP format (https://testanything.org/). Only useful for</div><div class='add'>+	  kernel devs running KUnit test harness and are not for inclusion</div><div class='add'>+	  into a production build.</div><div class='add'>+</div><div class='add'>+	  For more information on KUnit and unit tests in general please</div><div class='add'>+	  refer to the KUnit documentation in Documentation/dev-tools/kunit/.</div><div class='head'>diff --git a/fs/hfsplus/Makefile b/fs/hfsplus/Makefile<br/>index 9ed20e64b983..f2a9ae697e81 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/Makefile?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/Makefile</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/Makefile?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfsplus/Makefile</a></div><div class='hunk'>@@ -8,3 +8,6 @@ obj-$(CONFIG_HFSPLUS_FS) += hfsplus.o</div><div class='ctx'> hfsplus-objs := super.o options.o inode.o ioctl.o extents.o catalog.o dir.o btree.o \</div><div class='ctx'> 		bnode.o brec.o bfind.o tables.o unicode.o wrapper.o bitmap.o part_tbl.o \</div><div class='ctx'> 		attributes.o xattr.o xattr_user.o xattr_security.o xattr_trusted.o</div><div class='add'>+</div><div class='add'>+# KUnit tests</div><div class='add'>+obj-$(CONFIG_HFSPLUS_KUNIT_TEST) += unicode_test.o</div><div class='head'>diff --git a/fs/hfsplus/attributes.c b/fs/hfsplus/attributes.c<br/>index eeebe80c6be4..ba26980cc503 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/attributes.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/attributes.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/attributes.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfsplus/attributes.c</a></div><div class='hunk'>@@ -139,7 +139,7 @@ int hfsplus_find_attr(struct super_block *sb, u32 cnid,</div><div class='ctx'> {</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(ATTR_MOD, "find_attr: %s,%d\n", name ? name : NULL, cnid);</div><div class='add'>+	hfs_dbg("name %s, cnid %d\n", name ? name : NULL, cnid);</div><div class='ctx'> </div><div class='ctx'> 	if (!HFSPLUS_SB(sb)-&gt;attr_tree) {</div><div class='ctx'> 		pr_err("attributes file doesn't exist\n");</div><div class='hunk'>@@ -201,7 +201,7 @@ int hfsplus_create_attr(struct inode *inode,</div><div class='ctx'> 	int entry_size;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(ATTR_MOD, "create_attr: %s,%ld\n",</div><div class='add'>+	hfs_dbg("name %s, ino %ld\n",</div><div class='ctx'> 		name ? name : NULL, inode-&gt;i_ino);</div><div class='ctx'> </div><div class='ctx'> 	if (!HFSPLUS_SB(sb)-&gt;attr_tree) {</div><div class='hunk'>@@ -310,7 +310,7 @@ int hfsplus_delete_attr(struct inode *inode, const char *name)</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	struct hfs_find_data fd;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(ATTR_MOD, "delete_attr: %s,%ld\n",</div><div class='add'>+	hfs_dbg("name %s, ino %ld\n",</div><div class='ctx'> 		name ? name : NULL, inode-&gt;i_ino);</div><div class='ctx'> </div><div class='ctx'> 	if (!HFSPLUS_SB(sb)-&gt;attr_tree) {</div><div class='hunk'>@@ -356,7 +356,7 @@ int hfsplus_delete_all_attrs(struct inode *dir, u32 cnid)</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> 	struct hfs_find_data fd;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(ATTR_MOD, "delete_all_attrs: %d\n", cnid);</div><div class='add'>+	hfs_dbg("cnid %d\n", cnid);</div><div class='ctx'> </div><div class='ctx'> 	if (!HFSPLUS_SB(dir-&gt;i_sb)-&gt;attr_tree) {</div><div class='ctx'> 		pr_err("attributes file doesn't exist\n");</div><div class='head'>diff --git a/fs/hfsplus/bfind.c b/fs/hfsplus/bfind.c<br/>index ca2ba8c9f82e..336d654861c5 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/bfind.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/bfind.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/bfind.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfsplus/bfind.c</a></div><div class='hunk'>@@ -18,26 +18,15 @@ int hfs_find_init(struct hfs_btree *tree, struct hfs_find_data *fd)</div><div class='ctx'> </div><div class='ctx'> 	fd-&gt;tree = tree;</div><div class='ctx'> 	fd-&gt;bnode = NULL;</div><div class='del'>-	ptr = kmalloc(tree-&gt;max_key_len * 2 + 4, GFP_KERNEL);</div><div class='add'>+	ptr = kzalloc(tree-&gt;max_key_len * 2 + 4, GFP_KERNEL);</div><div class='ctx'> 	if (!ptr)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	fd-&gt;search_key = ptr;</div><div class='ctx'> 	fd-&gt;key = ptr + tree-&gt;max_key_len + 2;</div><div class='del'>-	hfs_dbg(BNODE_REFS, "find_init: %d (%p)\n",</div><div class='add'>+	hfs_dbg("cnid %d, caller %ps\n",</div><div class='ctx'> 		tree-&gt;cnid, __builtin_return_address(0));</div><div class='del'>-	switch (tree-&gt;cnid) {</div><div class='del'>-	case HFSPLUS_CAT_CNID:</div><div class='del'>-		mutex_lock_nested(&amp;tree-&gt;tree_lock, CATALOG_BTREE_MUTEX);</div><div class='del'>-		break;</div><div class='del'>-	case HFSPLUS_EXT_CNID:</div><div class='del'>-		mutex_lock_nested(&amp;tree-&gt;tree_lock, EXTENTS_BTREE_MUTEX);</div><div class='del'>-		break;</div><div class='del'>-	case HFSPLUS_ATTR_CNID:</div><div class='del'>-		mutex_lock_nested(&amp;tree-&gt;tree_lock, ATTR_BTREE_MUTEX);</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		BUG();</div><div class='del'>-	}</div><div class='add'>+	mutex_lock_nested(&amp;tree-&gt;tree_lock,</div><div class='add'>+			hfsplus_btree_lock_class(tree));</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -45,7 +34,7 @@ void hfs_find_exit(struct hfs_find_data *fd)</div><div class='ctx'> {</div><div class='ctx'> 	hfs_bnode_put(fd-&gt;bnode);</div><div class='ctx'> 	kfree(fd-&gt;search_key);</div><div class='del'>-	hfs_dbg(BNODE_REFS, "find_exit: %d (%p)\n",</div><div class='add'>+	hfs_dbg("cnid %d, caller %ps\n",</div><div class='ctx'> 		fd-&gt;tree-&gt;cnid, __builtin_return_address(0));</div><div class='ctx'> 	mutex_unlock(&amp;fd-&gt;tree-&gt;tree_lock);</div><div class='ctx'> 	fd-&gt;tree = NULL;</div><div class='hunk'>@@ -169,6 +158,12 @@ int hfs_brec_find(struct hfs_find_data *fd, search_strategy_t do_key_compare)</div><div class='ctx'> 	__be32 data;</div><div class='ctx'> 	int height, res;</div><div class='ctx'> </div><div class='add'>+	fd-&gt;record = -1;</div><div class='add'>+	fd-&gt;keyoffset = -1;</div><div class='add'>+	fd-&gt;keylength = -1;</div><div class='add'>+	fd-&gt;entryoffset = -1;</div><div class='add'>+	fd-&gt;entrylength = -1;</div><div class='add'>+</div><div class='ctx'> 	tree = fd-&gt;tree;</div><div class='ctx'> 	if (fd-&gt;bnode)</div><div class='ctx'> 		hfs_bnode_put(fd-&gt;bnode);</div><div class='hunk'>@@ -215,7 +210,7 @@ release:</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int hfs_brec_read(struct hfs_find_data *fd, void *rec, int rec_len)</div><div class='add'>+int hfs_brec_read(struct hfs_find_data *fd, void *rec, u32 rec_len)</div><div class='ctx'> {</div><div class='ctx'> 	int res;</div><div class='ctx'> </div><div class='head'>diff --git a/fs/hfsplus/bitmap.c b/fs/hfsplus/bitmap.c<br/>index cebce0cfe340..1b3af8c87cad 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/bitmap.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/bitmap.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/bitmap.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfsplus/bitmap.c</a></div><div class='hunk'>@@ -31,7 +31,7 @@ int hfsplus_block_allocate(struct super_block *sb, u32 size,</div><div class='ctx'> 	if (!len)</div><div class='ctx'> 		return size;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(BITMAP, "block_allocate: %u,%u,%u\n", size, offset, len);</div><div class='add'>+	hfs_dbg("size %u, offset %u, len %u\n", size, offset, len);</div><div class='ctx'> 	mutex_lock(&amp;sbi-&gt;alloc_mutex);</div><div class='ctx'> 	mapping = sbi-&gt;alloc_file-&gt;i_mapping;</div><div class='ctx'> 	page = read_mapping_page(mapping, offset / PAGE_CACHE_BITS, NULL);</div><div class='hunk'>@@ -39,7 +39,7 @@ int hfsplus_block_allocate(struct super_block *sb, u32 size,</div><div class='ctx'> 		start = size;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	pptr = kmap(page);</div><div class='add'>+	pptr = kmap_local_page(page);</div><div class='ctx'> 	curr = pptr + (offset &amp; (PAGE_CACHE_BITS - 1)) / 32;</div><div class='ctx'> 	i = offset % 32;</div><div class='ctx'> 	offset &amp;= ~(PAGE_CACHE_BITS - 1);</div><div class='hunk'>@@ -74,7 +74,7 @@ int hfsplus_block_allocate(struct super_block *sb, u32 size,</div><div class='ctx'> 			}</div><div class='ctx'> 			curr++;</div><div class='ctx'> 		}</div><div class='del'>-		kunmap(page);</div><div class='add'>+		kunmap_local(pptr);</div><div class='ctx'> 		offset += PAGE_CACHE_BITS;</div><div class='ctx'> 		if (offset &gt;= size)</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -84,20 +84,20 @@ int hfsplus_block_allocate(struct super_block *sb, u32 size,</div><div class='ctx'> 			start = size;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='del'>-		curr = pptr = kmap(page);</div><div class='add'>+		curr = pptr = kmap_local_page(page);</div><div class='ctx'> 		if ((size ^ offset) / PAGE_CACHE_BITS)</div><div class='ctx'> 			end = pptr + PAGE_CACHE_BITS / 32;</div><div class='ctx'> 		else</div><div class='ctx'> 			end = pptr + ((size + 31) &amp; (PAGE_CACHE_BITS - 1)) / 32;</div><div class='ctx'> 	}</div><div class='del'>-	hfs_dbg(BITMAP, "bitmap full\n");</div><div class='add'>+	hfs_dbg("bitmap full\n");</div><div class='ctx'> 	start = size;</div><div class='ctx'> 	goto out;</div><div class='ctx'> </div><div class='ctx'> found:</div><div class='ctx'> 	start = offset + (curr - pptr) * 32 + i;</div><div class='ctx'> 	if (start &gt;= size) {</div><div class='del'>-		hfs_dbg(BITMAP, "bitmap full\n");</div><div class='add'>+		hfs_dbg("bitmap full\n");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	/* do any partial u32 at the start */</div><div class='hunk'>@@ -127,7 +127,7 @@ found:</div><div class='ctx'> 			len -= 32;</div><div class='ctx'> 		}</div><div class='ctx'> 		set_page_dirty(page);</div><div class='del'>-		kunmap(page);</div><div class='add'>+		kunmap_local(pptr);</div><div class='ctx'> 		offset += PAGE_CACHE_BITS;</div><div class='ctx'> 		page = read_mapping_page(mapping, offset / PAGE_CACHE_BITS,</div><div class='ctx'> 					 NULL);</div><div class='hunk'>@@ -135,7 +135,7 @@ found:</div><div class='ctx'> 			start = size;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='del'>-		pptr = kmap(page);</div><div class='add'>+		pptr = kmap_local_page(page);</div><div class='ctx'> 		curr = pptr;</div><div class='ctx'> 		end = pptr + PAGE_CACHE_BITS / 32;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -151,11 +151,11 @@ last:</div><div class='ctx'> done:</div><div class='ctx'> 	*curr = cpu_to_be32(n);</div><div class='ctx'> 	set_page_dirty(page);</div><div class='del'>-	kunmap(page);</div><div class='add'>+	kunmap_local(pptr);</div><div class='ctx'> 	*max = offset + (curr - pptr) * 32 + i - start;</div><div class='ctx'> 	sbi-&gt;free_blocks -= *max;</div><div class='ctx'> 	hfsplus_mark_mdb_dirty(sb);</div><div class='del'>-	hfs_dbg(BITMAP, "-&gt; %u,%u\n", start, *max);</div><div class='add'>+	hfs_dbg("start %u, max %u\n", start, *max);</div><div class='ctx'> out:</div><div class='ctx'> 	mutex_unlock(&amp;sbi-&gt;alloc_mutex);</div><div class='ctx'> 	return start;</div><div class='hunk'>@@ -174,7 +174,7 @@ int hfsplus_block_free(struct super_block *sb, u32 offset, u32 count)</div><div class='ctx'> 	if (!count)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(BITMAP, "block_free: %u,%u\n", offset, count);</div><div class='add'>+	hfs_dbg("offset %u, count %u\n", offset, count);</div><div class='ctx'> 	/* are all of the bits in range? */</div><div class='ctx'> 	if ((offset + count) &gt; sbi-&gt;total_blocks)</div><div class='ctx'> 		return -ENOENT;</div><div class='hunk'>@@ -185,7 +185,7 @@ int hfsplus_block_free(struct super_block *sb, u32 offset, u32 count)</div><div class='ctx'> 	page = read_mapping_page(mapping, pnr, NULL);</div><div class='ctx'> 	if (IS_ERR(page))</div><div class='ctx'> 		goto kaboom;</div><div class='del'>-	pptr = kmap(page);</div><div class='add'>+	pptr = kmap_local_page(page);</div><div class='ctx'> 	curr = pptr + (offset &amp; (PAGE_CACHE_BITS - 1)) / 32;</div><div class='ctx'> 	end = pptr + PAGE_CACHE_BITS / 32;</div><div class='ctx'> 	len = count;</div><div class='hunk'>@@ -215,11 +215,11 @@ int hfsplus_block_free(struct super_block *sb, u32 offset, u32 count)</div><div class='ctx'> 		if (!count)</div><div class='ctx'> 			break;</div><div class='ctx'> 		set_page_dirty(page);</div><div class='del'>-		kunmap(page);</div><div class='add'>+		kunmap_local(pptr);</div><div class='ctx'> 		page = read_mapping_page(mapping, ++pnr, NULL);</div><div class='ctx'> 		if (IS_ERR(page))</div><div class='ctx'> 			goto kaboom;</div><div class='del'>-		pptr = kmap(page);</div><div class='add'>+		pptr = kmap_local_page(page);</div><div class='ctx'> 		curr = pptr;</div><div class='ctx'> 		end = pptr + PAGE_CACHE_BITS / 32;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -231,7 +231,7 @@ done:</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='ctx'> 	set_page_dirty(page);</div><div class='del'>-	kunmap(page);</div><div class='add'>+	kunmap_local(pptr);</div><div class='ctx'> 	sbi-&gt;free_blocks += len;</div><div class='ctx'> 	hfsplus_mark_mdb_dirty(sb);</div><div class='ctx'> 	mutex_unlock(&amp;sbi-&gt;alloc_mutex);</div><div class='head'>diff --git a/fs/hfsplus/bnode.c b/fs/hfsplus/bnode.c<br/>index 177fae4e6581..191661af9677 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/bnode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/bnode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/bnode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfsplus/bnode.c</a></div><div class='hunk'>@@ -18,29 +18,42 @@</div><div class='ctx'> #include "hfsplus_fs.h"</div><div class='ctx'> #include "hfsplus_raw.h"</div><div class='ctx'> </div><div class='add'>+</div><div class='ctx'> /* Copy a specified range of bytes from the raw data of a node */</div><div class='del'>-void hfs_bnode_read(struct hfs_bnode *node, void *buf, int off, int len)</div><div class='add'>+void hfs_bnode_read(struct hfs_bnode *node, void *buf, u32 off, u32 len)</div><div class='ctx'> {</div><div class='ctx'> 	struct page **pagep;</div><div class='del'>-	int l;</div><div class='add'>+	u32 l;</div><div class='add'>+</div><div class='add'>+	if (!is_bnode_offset_valid(node, off))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (len == 0) {</div><div class='add'>+		pr_err("requested zero length: "</div><div class='add'>+		       "NODE: id %u, type %#x, height %u, "</div><div class='add'>+		       "node_size %u, offset %u, len %u\n",</div><div class='add'>+		       node-&gt;this, node-&gt;type, node-&gt;height,</div><div class='add'>+		       node-&gt;tree-&gt;node_size, off, len);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	len = check_and_correct_requested_length(node, off, len);</div><div class='ctx'> </div><div class='ctx'> 	off += node-&gt;page_offset;</div><div class='ctx'> 	pagep = node-&gt;page + (off &gt;&gt; PAGE_SHIFT);</div><div class='ctx'> 	off &amp;= ~PAGE_MASK;</div><div class='ctx'> </div><div class='del'>-	l = min_t(int, len, PAGE_SIZE - off);</div><div class='del'>-	memcpy(buf, kmap(*pagep) + off, l);</div><div class='del'>-	kunmap(*pagep);</div><div class='add'>+	l = min_t(u32, len, PAGE_SIZE - off);</div><div class='add'>+	memcpy_from_page(buf, *pagep, off, l);</div><div class='ctx'> </div><div class='ctx'> 	while ((len -= l) != 0) {</div><div class='ctx'> 		buf += l;</div><div class='del'>-		l = min_t(int, len, PAGE_SIZE);</div><div class='del'>-		memcpy(buf, kmap(*++pagep), l);</div><div class='del'>-		kunmap(*pagep);</div><div class='add'>+		l = min_t(u32, len, PAGE_SIZE);</div><div class='add'>+		memcpy_from_page(buf, *++pagep, 0, l);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-u16 hfs_bnode_read_u16(struct hfs_bnode *node, int off)</div><div class='add'>+u16 hfs_bnode_read_u16(struct hfs_bnode *node, u32 off)</div><div class='ctx'> {</div><div class='ctx'> 	__be16 data;</div><div class='ctx'> 	/* TODO: optimize later... */</div><div class='hunk'>@@ -48,7 +61,7 @@ u16 hfs_bnode_read_u16(struct hfs_bnode *node, int off)</div><div class='ctx'> 	return be16_to_cpu(data);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-u8 hfs_bnode_read_u8(struct hfs_bnode *node, int off)</div><div class='add'>+u8 hfs_bnode_read_u8(struct hfs_bnode *node, u32 off)</div><div class='ctx'> {</div><div class='ctx'> 	u8 data;</div><div class='ctx'> 	/* TODO: optimize later... */</div><div class='hunk'>@@ -56,10 +69,10 @@ u8 hfs_bnode_read_u8(struct hfs_bnode *node, int off)</div><div class='ctx'> 	return data;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void hfs_bnode_read_key(struct hfs_bnode *node, void *key, int off)</div><div class='add'>+void hfs_bnode_read_key(struct hfs_bnode *node, void *key, u32 off)</div><div class='ctx'> {</div><div class='ctx'> 	struct hfs_btree *tree;</div><div class='del'>-	int key_len;</div><div class='add'>+	u32 key_len;</div><div class='ctx'> </div><div class='ctx'> 	tree = node-&gt;tree;</div><div class='ctx'> 	if (node-&gt;type == HFS_NODE_LEAF ||</div><div class='hunk'>@@ -69,70 +82,104 @@ void hfs_bnode_read_key(struct hfs_bnode *node, void *key, int off)</div><div class='ctx'> 	else</div><div class='ctx'> 		key_len = tree-&gt;max_key_len + 2;</div><div class='ctx'> </div><div class='add'>+	if (key_len &gt; sizeof(hfsplus_btree_key) || key_len &lt; 1) {</div><div class='add'>+		memset(key, 0, sizeof(hfsplus_btree_key));</div><div class='add'>+		pr_err("hfsplus: Invalid key length: %u\n", key_len);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	hfs_bnode_read(node, key, off, key_len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void hfs_bnode_write(struct hfs_bnode *node, void *buf, int off, int len)</div><div class='add'>+void hfs_bnode_write(struct hfs_bnode *node, void *buf, u32 off, u32 len)</div><div class='ctx'> {</div><div class='ctx'> 	struct page **pagep;</div><div class='del'>-	int l;</div><div class='add'>+	u32 l;</div><div class='add'>+</div><div class='add'>+	if (!is_bnode_offset_valid(node, off))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (len == 0) {</div><div class='add'>+		pr_err("requested zero length: "</div><div class='add'>+		       "NODE: id %u, type %#x, height %u, "</div><div class='add'>+		       "node_size %u, offset %u, len %u\n",</div><div class='add'>+		       node-&gt;this, node-&gt;type, node-&gt;height,</div><div class='add'>+		       node-&gt;tree-&gt;node_size, off, len);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	len = check_and_correct_requested_length(node, off, len);</div><div class='ctx'> </div><div class='ctx'> 	off += node-&gt;page_offset;</div><div class='ctx'> 	pagep = node-&gt;page + (off &gt;&gt; PAGE_SHIFT);</div><div class='ctx'> 	off &amp;= ~PAGE_MASK;</div><div class='ctx'> </div><div class='del'>-	l = min_t(int, len, PAGE_SIZE - off);</div><div class='del'>-	memcpy(kmap(*pagep) + off, buf, l);</div><div class='add'>+	l = min_t(u32, len, PAGE_SIZE - off);</div><div class='add'>+	memcpy_to_page(*pagep, off, buf, l);</div><div class='ctx'> 	set_page_dirty(*pagep);</div><div class='del'>-	kunmap(*pagep);</div><div class='ctx'> </div><div class='ctx'> 	while ((len -= l) != 0) {</div><div class='ctx'> 		buf += l;</div><div class='del'>-		l = min_t(int, len, PAGE_SIZE);</div><div class='del'>-		memcpy(kmap(*++pagep), buf, l);</div><div class='add'>+		l = min_t(u32, len, PAGE_SIZE);</div><div class='add'>+		memcpy_to_page(*++pagep, 0, buf, l);</div><div class='ctx'> 		set_page_dirty(*pagep);</div><div class='del'>-		kunmap(*pagep);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void hfs_bnode_write_u16(struct hfs_bnode *node, int off, u16 data)</div><div class='add'>+void hfs_bnode_write_u16(struct hfs_bnode *node, u32 off, u16 data)</div><div class='ctx'> {</div><div class='ctx'> 	__be16 v = cpu_to_be16(data);</div><div class='ctx'> 	/* TODO: optimize later... */</div><div class='ctx'> 	hfs_bnode_write(node, &amp;v, off, 2);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void hfs_bnode_clear(struct hfs_bnode *node, int off, int len)</div><div class='add'>+void hfs_bnode_clear(struct hfs_bnode *node, u32 off, u32 len)</div><div class='ctx'> {</div><div class='ctx'> 	struct page **pagep;</div><div class='del'>-	int l;</div><div class='add'>+	u32 l;</div><div class='add'>+</div><div class='add'>+	if (!is_bnode_offset_valid(node, off))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (len == 0) {</div><div class='add'>+		pr_err("requested zero length: "</div><div class='add'>+		       "NODE: id %u, type %#x, height %u, "</div><div class='add'>+		       "node_size %u, offset %u, len %u\n",</div><div class='add'>+		       node-&gt;this, node-&gt;type, node-&gt;height,</div><div class='add'>+		       node-&gt;tree-&gt;node_size, off, len);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	len = check_and_correct_requested_length(node, off, len);</div><div class='ctx'> </div><div class='ctx'> 	off += node-&gt;page_offset;</div><div class='ctx'> 	pagep = node-&gt;page + (off &gt;&gt; PAGE_SHIFT);</div><div class='ctx'> 	off &amp;= ~PAGE_MASK;</div><div class='ctx'> </div><div class='del'>-	l = min_t(int, len, PAGE_SIZE - off);</div><div class='del'>-	memset(kmap(*pagep) + off, 0, l);</div><div class='add'>+	l = min_t(u32, len, PAGE_SIZE - off);</div><div class='add'>+	memzero_page(*pagep, off, l);</div><div class='ctx'> 	set_page_dirty(*pagep);</div><div class='del'>-	kunmap(*pagep);</div><div class='ctx'> </div><div class='ctx'> 	while ((len -= l) != 0) {</div><div class='del'>-		l = min_t(int, len, PAGE_SIZE);</div><div class='del'>-		memset(kmap(*++pagep), 0, l);</div><div class='add'>+		l = min_t(u32, len, PAGE_SIZE);</div><div class='add'>+		memzero_page(*++pagep, 0, l);</div><div class='ctx'> 		set_page_dirty(*pagep);</div><div class='del'>-		kunmap(*pagep);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void hfs_bnode_copy(struct hfs_bnode *dst_node, int dst,</div><div class='del'>-		    struct hfs_bnode *src_node, int src, int len)</div><div class='add'>+void hfs_bnode_copy(struct hfs_bnode *dst_node, u32 dst,</div><div class='add'>+		    struct hfs_bnode *src_node, u32 src, u32 len)</div><div class='ctx'> {</div><div class='ctx'> 	struct page **src_page, **dst_page;</div><div class='del'>-	int l;</div><div class='add'>+	u32 l;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(BNODE_MOD, "copybytes: %u,%u,%u\n", dst, src, len);</div><div class='add'>+	hfs_dbg("dst %u, src %u, len %u\n", dst, src, len);</div><div class='ctx'> 	if (!len)</div><div class='ctx'> 		return;</div><div class='add'>+</div><div class='add'>+	len = check_and_correct_requested_length(src_node, src, len);</div><div class='add'>+	len = check_and_correct_requested_length(dst_node, dst, len);</div><div class='add'>+</div><div class='ctx'> 	src += src_node-&gt;page_offset;</div><div class='ctx'> 	dst += dst_node-&gt;page_offset;</div><div class='ctx'> 	src_page = src_node-&gt;page + (src &gt;&gt; PAGE_SHIFT);</div><div class='hunk'>@@ -141,25 +188,21 @@ void hfs_bnode_copy(struct hfs_bnode *dst_node, int dst,</div><div class='ctx'> 	dst &amp;= ~PAGE_MASK;</div><div class='ctx'> </div><div class='ctx'> 	if (src == dst) {</div><div class='del'>-		l = min_t(int, len, PAGE_SIZE - src);</div><div class='del'>-		memcpy(kmap(*dst_page) + src, kmap(*src_page) + src, l);</div><div class='del'>-		kunmap(*src_page);</div><div class='add'>+		l = min_t(u32, len, PAGE_SIZE - src);</div><div class='add'>+		memcpy_page(*dst_page, src, *src_page, src, l);</div><div class='ctx'> 		set_page_dirty(*dst_page);</div><div class='del'>-		kunmap(*dst_page);</div><div class='ctx'> </div><div class='ctx'> 		while ((len -= l) != 0) {</div><div class='del'>-			l = min_t(int, len, PAGE_SIZE);</div><div class='del'>-			memcpy(kmap(*++dst_page), kmap(*++src_page), l);</div><div class='del'>-			kunmap(*src_page);</div><div class='add'>+			l = min_t(u32, len, PAGE_SIZE);</div><div class='add'>+			memcpy_page(*++dst_page, 0, *++src_page, 0, l);</div><div class='ctx'> 			set_page_dirty(*dst_page);</div><div class='del'>-			kunmap(*dst_page);</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='ctx'> 		void *src_ptr, *dst_ptr;</div><div class='ctx'> </div><div class='ctx'> 		do {</div><div class='del'>-			src_ptr = kmap(*src_page) + src;</div><div class='del'>-			dst_ptr = kmap(*dst_page) + dst;</div><div class='add'>+			dst_ptr = kmap_local_page(*dst_page) + dst;</div><div class='add'>+			src_ptr = kmap_local_page(*src_page) + src;</div><div class='ctx'> 			if (PAGE_SIZE - src &lt; PAGE_SIZE - dst) {</div><div class='ctx'> 				l = PAGE_SIZE - src;</div><div class='ctx'> 				src = 0;</div><div class='hunk'>@@ -171,9 +214,9 @@ void hfs_bnode_copy(struct hfs_bnode *dst_node, int dst,</div><div class='ctx'> 			}</div><div class='ctx'> 			l = min(len, l);</div><div class='ctx'> 			memcpy(dst_ptr, src_ptr, l);</div><div class='del'>-			kunmap(*src_page);</div><div class='add'>+			kunmap_local(src_ptr);</div><div class='ctx'> 			set_page_dirty(*dst_page);</div><div class='del'>-			kunmap(*dst_page);</div><div class='add'>+			kunmap_local(dst_ptr);</div><div class='ctx'> 			if (!dst)</div><div class='ctx'> 				dst_page++;</div><div class='ctx'> 			else</div><div class='hunk'>@@ -182,14 +225,19 @@ void hfs_bnode_copy(struct hfs_bnode *dst_node, int dst,</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void hfs_bnode_move(struct hfs_bnode *node, int dst, int src, int len)</div><div class='add'>+void hfs_bnode_move(struct hfs_bnode *node, u32 dst, u32 src, u32 len)</div><div class='ctx'> {</div><div class='ctx'> 	struct page **src_page, **dst_page;</div><div class='del'>-	int l;</div><div class='add'>+	void *src_ptr, *dst_ptr;</div><div class='add'>+	u32 l;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(BNODE_MOD, "movebytes: %u,%u,%u\n", dst, src, len);</div><div class='add'>+	hfs_dbg("dst %u, src %u, len %u\n", dst, src, len);</div><div class='ctx'> 	if (!len)</div><div class='ctx'> 		return;</div><div class='add'>+</div><div class='add'>+	len = check_and_correct_requested_length(node, src, len);</div><div class='add'>+	len = check_and_correct_requested_length(node, dst, len);</div><div class='add'>+</div><div class='ctx'> 	src += node-&gt;page_offset;</div><div class='ctx'> 	dst += node-&gt;page_offset;</div><div class='ctx'> 	if (dst &gt; src) {</div><div class='hunk'>@@ -202,27 +250,28 @@ void hfs_bnode_move(struct hfs_bnode *node, int dst, int src, int len)</div><div class='ctx'> </div><div class='ctx'> 		if (src == dst) {</div><div class='ctx'> 			while (src &lt; len) {</div><div class='del'>-				memmove(kmap(*dst_page), kmap(*src_page), src);</div><div class='del'>-				kunmap(*src_page);</div><div class='add'>+				dst_ptr = kmap_local_page(*dst_page);</div><div class='add'>+				src_ptr = kmap_local_page(*src_page);</div><div class='add'>+				memmove(dst_ptr, src_ptr, src);</div><div class='add'>+				kunmap_local(src_ptr);</div><div class='ctx'> 				set_page_dirty(*dst_page);</div><div class='del'>-				kunmap(*dst_page);</div><div class='add'>+				kunmap_local(dst_ptr);</div><div class='ctx'> 				len -= src;</div><div class='ctx'> 				src = PAGE_SIZE;</div><div class='ctx'> 				src_page--;</div><div class='ctx'> 				dst_page--;</div><div class='ctx'> 			}</div><div class='ctx'> 			src -= len;</div><div class='del'>-			memmove(kmap(*dst_page) + src,</div><div class='del'>-				kmap(*src_page) + src, len);</div><div class='del'>-			kunmap(*src_page);</div><div class='add'>+			dst_ptr = kmap_local_page(*dst_page);</div><div class='add'>+			src_ptr = kmap_local_page(*src_page);</div><div class='add'>+			memmove(dst_ptr + src, src_ptr + src, len);</div><div class='add'>+			kunmap_local(src_ptr);</div><div class='ctx'> 			set_page_dirty(*dst_page);</div><div class='del'>-			kunmap(*dst_page);</div><div class='add'>+			kunmap_local(dst_ptr);</div><div class='ctx'> 		} else {</div><div class='del'>-			void *src_ptr, *dst_ptr;</div><div class='del'>-</div><div class='ctx'> 			do {</div><div class='del'>-				src_ptr = kmap(*src_page) + src;</div><div class='del'>-				dst_ptr = kmap(*dst_page) + dst;</div><div class='add'>+				dst_ptr = kmap_local_page(*dst_page) + dst;</div><div class='add'>+				src_ptr = kmap_local_page(*src_page) + src;</div><div class='ctx'> 				if (src &lt; dst) {</div><div class='ctx'> 					l = src;</div><div class='ctx'> 					src = PAGE_SIZE;</div><div class='hunk'>@@ -234,9 +283,9 @@ void hfs_bnode_move(struct hfs_bnode *node, int dst, int src, int len)</div><div class='ctx'> 				}</div><div class='ctx'> 				l = min(len, l);</div><div class='ctx'> 				memmove(dst_ptr - l, src_ptr - l, l);</div><div class='del'>-				kunmap(*src_page);</div><div class='add'>+				kunmap_local(src_ptr);</div><div class='ctx'> 				set_page_dirty(*dst_page);</div><div class='del'>-				kunmap(*dst_page);</div><div class='add'>+				kunmap_local(dst_ptr);</div><div class='ctx'> 				if (dst == PAGE_SIZE)</div><div class='ctx'> 					dst_page--;</div><div class='ctx'> 				else</div><div class='hunk'>@@ -250,27 +299,28 @@ void hfs_bnode_move(struct hfs_bnode *node, int dst, int src, int len)</div><div class='ctx'> 		dst &amp;= ~PAGE_MASK;</div><div class='ctx'> </div><div class='ctx'> 		if (src == dst) {</div><div class='del'>-			l = min_t(int, len, PAGE_SIZE - src);</div><div class='del'>-			memmove(kmap(*dst_page) + src,</div><div class='del'>-				kmap(*src_page) + src, l);</div><div class='del'>-			kunmap(*src_page);</div><div class='add'>+			l = min_t(u32, len, PAGE_SIZE - src);</div><div class='add'>+</div><div class='add'>+			dst_ptr = kmap_local_page(*dst_page) + src;</div><div class='add'>+			src_ptr = kmap_local_page(*src_page) + src;</div><div class='add'>+			memmove(dst_ptr, src_ptr, l);</div><div class='add'>+			kunmap_local(src_ptr);</div><div class='ctx'> 			set_page_dirty(*dst_page);</div><div class='del'>-			kunmap(*dst_page);</div><div class='add'>+			kunmap_local(dst_ptr);</div><div class='ctx'> </div><div class='ctx'> 			while ((len -= l) != 0) {</div><div class='del'>-				l = min_t(int, len, PAGE_SIZE);</div><div class='del'>-				memmove(kmap(*++dst_page),</div><div class='del'>-					kmap(*++src_page), l);</div><div class='del'>-				kunmap(*src_page);</div><div class='add'>+				l = min_t(u32, len, PAGE_SIZE);</div><div class='add'>+				dst_ptr = kmap_local_page(*++dst_page);</div><div class='add'>+				src_ptr = kmap_local_page(*++src_page);</div><div class='add'>+				memmove(dst_ptr, src_ptr, l);</div><div class='add'>+				kunmap_local(src_ptr);</div><div class='ctx'> 				set_page_dirty(*dst_page);</div><div class='del'>-				kunmap(*dst_page);</div><div class='add'>+				kunmap_local(dst_ptr);</div><div class='ctx'> 			}</div><div class='ctx'> 		} else {</div><div class='del'>-			void *src_ptr, *dst_ptr;</div><div class='del'>-</div><div class='ctx'> 			do {</div><div class='del'>-				src_ptr = kmap(*src_page) + src;</div><div class='del'>-				dst_ptr = kmap(*dst_page) + dst;</div><div class='add'>+				dst_ptr = kmap_local_page(*dst_page) + dst;</div><div class='add'>+				src_ptr = kmap_local_page(*src_page) + src;</div><div class='ctx'> 				if (PAGE_SIZE - src &lt;</div><div class='ctx'> 						PAGE_SIZE - dst) {</div><div class='ctx'> 					l = PAGE_SIZE - src;</div><div class='hunk'>@@ -283,9 +333,9 @@ void hfs_bnode_move(struct hfs_bnode *node, int dst, int src, int len)</div><div class='ctx'> 				}</div><div class='ctx'> 				l = min(len, l);</div><div class='ctx'> 				memmove(dst_ptr, src_ptr, l);</div><div class='del'>-				kunmap(*src_page);</div><div class='add'>+				kunmap_local(src_ptr);</div><div class='ctx'> 				set_page_dirty(*dst_page);</div><div class='del'>-				kunmap(*dst_page);</div><div class='add'>+				kunmap_local(dst_ptr);</div><div class='ctx'> 				if (!dst)</div><div class='ctx'> 					dst_page++;</div><div class='ctx'> 				else</div><div class='hunk'>@@ -301,16 +351,16 @@ void hfs_bnode_dump(struct hfs_bnode *node)</div><div class='ctx'> 	__be32 cnid;</div><div class='ctx'> 	int i, off, key_off;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(BNODE_MOD, "bnode: %d\n", node-&gt;this);</div><div class='add'>+	hfs_dbg("node %d\n", node-&gt;this);</div><div class='ctx'> 	hfs_bnode_read(node, &amp;desc, 0, sizeof(desc));</div><div class='del'>-	hfs_dbg(BNODE_MOD, "%d, %d, %d, %d, %d\n",</div><div class='add'>+	hfs_dbg("next %d, prev %d, type %d, height %d, num_recs %d\n",</div><div class='ctx'> 		be32_to_cpu(desc.next), be32_to_cpu(desc.prev),</div><div class='ctx'> 		desc.type, desc.height, be16_to_cpu(desc.num_recs));</div><div class='ctx'> </div><div class='ctx'> 	off = node-&gt;tree-&gt;node_size - 2;</div><div class='ctx'> 	for (i = be16_to_cpu(desc.num_recs); i &gt;= 0; off -= 2, i--) {</div><div class='ctx'> 		key_off = hfs_bnode_read_u16(node, off);</div><div class='del'>-		hfs_dbg(BNODE_MOD, " %d", key_off);</div><div class='add'>+		hfs_dbg(" key_off %d", key_off);</div><div class='ctx'> 		if (i &amp;&amp; node-&gt;type == HFS_NODE_INDEX) {</div><div class='ctx'> 			int tmp;</div><div class='ctx'> </div><div class='hunk'>@@ -319,17 +369,17 @@ void hfs_bnode_dump(struct hfs_bnode *node)</div><div class='ctx'> 				tmp = hfs_bnode_read_u16(node, key_off) + 2;</div><div class='ctx'> 			else</div><div class='ctx'> 				tmp = node-&gt;tree-&gt;max_key_len + 2;</div><div class='del'>-			hfs_dbg_cont(BNODE_MOD, " (%d", tmp);</div><div class='add'>+			hfs_dbg(" (%d", tmp);</div><div class='ctx'> 			hfs_bnode_read(node, &amp;cnid, key_off + tmp, 4);</div><div class='del'>-			hfs_dbg_cont(BNODE_MOD, ",%d)", be32_to_cpu(cnid));</div><div class='add'>+			hfs_dbg(", cnid %d)", be32_to_cpu(cnid));</div><div class='ctx'> 		} else if (i &amp;&amp; node-&gt;type == HFS_NODE_LEAF) {</div><div class='ctx'> 			int tmp;</div><div class='ctx'> </div><div class='ctx'> 			tmp = hfs_bnode_read_u16(node, key_off);</div><div class='del'>-			hfs_dbg_cont(BNODE_MOD, " (%d)", tmp);</div><div class='add'>+			hfs_dbg(" (%d)", tmp);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	hfs_dbg_cont(BNODE_MOD, "\n");</div><div class='add'>+	hfs_dbg("\n");</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void hfs_bnode_unlink(struct hfs_bnode *node)</div><div class='hunk'>@@ -365,7 +415,7 @@ void hfs_bnode_unlink(struct hfs_bnode *node)</div><div class='ctx'> </div><div class='ctx'> 	/* move down? */</div><div class='ctx'> 	if (!node-&gt;prev &amp;&amp; !node-&gt;next)</div><div class='del'>-		hfs_dbg(BNODE_MOD, "hfs_btree_del_level\n");</div><div class='add'>+		hfs_dbg("btree delete level\n");</div><div class='ctx'> 	if (!node-&gt;parent) {</div><div class='ctx'> 		tree-&gt;root = 0;</div><div class='ctx'> 		tree-&gt;depth = 0;</div><div class='hunk'>@@ -420,7 +470,7 @@ static struct hfs_bnode *__hfs_bnode_create(struct hfs_btree *tree, u32 cnid)</div><div class='ctx'> 	node-&gt;this = cnid;</div><div class='ctx'> 	set_bit(HFS_BNODE_NEW, &amp;node-&gt;flags);</div><div class='ctx'> 	atomic_set(&amp;node-&gt;refcnt, 1);</div><div class='del'>-	hfs_dbg(BNODE_REFS, "new_node(%d:%d): 1\n",</div><div class='add'>+	hfs_dbg("cnid %d, node %d, refcnt 1\n",</div><div class='ctx'> 		node-&gt;tree-&gt;cnid, node-&gt;this);</div><div class='ctx'> 	init_waitqueue_head(&amp;node-&gt;lock_wq);</div><div class='ctx'> 	spin_lock(&amp;tree-&gt;hash_lock);</div><div class='hunk'>@@ -431,6 +481,7 @@ static struct hfs_bnode *__hfs_bnode_create(struct hfs_btree *tree, u32 cnid)</div><div class='ctx'> 		tree-&gt;node_hash[hash] = node;</div><div class='ctx'> 		tree-&gt;node_hash_cnt++;</div><div class='ctx'> 	} else {</div><div class='add'>+		hfs_bnode_get(node2);</div><div class='ctx'> 		spin_unlock(&amp;tree-&gt;hash_lock);</div><div class='ctx'> 		kfree(node);</div><div class='ctx'> 		wait_event(node2-&gt;lock_wq,</div><div class='hunk'>@@ -447,10 +498,6 @@ static struct hfs_bnode *__hfs_bnode_create(struct hfs_btree *tree, u32 cnid)</div><div class='ctx'> 		page = read_mapping_page(mapping, block, NULL);</div><div class='ctx'> 		if (IS_ERR(page))</div><div class='ctx'> 			goto fail;</div><div class='del'>-		if (PageError(page)) {</div><div class='del'>-			put_page(page);</div><div class='del'>-			goto fail;</div><div class='del'>-		}</div><div class='ctx'> 		node-&gt;page[i] = page;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -464,7 +511,7 @@ void hfs_bnode_unhash(struct hfs_bnode *node)</div><div class='ctx'> {</div><div class='ctx'> 	struct hfs_bnode **p;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(BNODE_REFS, "remove_node(%d:%d): %d\n",</div><div class='add'>+	hfs_dbg("cnid %d, node %d, refcnt %d\n",</div><div class='ctx'> 		node-&gt;tree-&gt;cnid, node-&gt;this, atomic_read(&amp;node-&gt;refcnt));</div><div class='ctx'> 	for (p = &amp;node-&gt;tree-&gt;node_hash[hfs_bnode_hash(node-&gt;this)];</div><div class='ctx'> 	     *p &amp;&amp; *p != node; p = &amp;(*p)-&gt;next_hash)</div><div class='hunk'>@@ -502,14 +549,14 @@ struct hfs_bnode *hfs_bnode_find(struct hfs_btree *tree, u32 num)</div><div class='ctx'> 	if (!test_bit(HFS_BNODE_NEW, &amp;node-&gt;flags))</div><div class='ctx'> 		return node;</div><div class='ctx'> </div><div class='del'>-	desc = (struct hfs_bnode_desc *)(kmap(node-&gt;page[0]) +</div><div class='del'>-			node-&gt;page_offset);</div><div class='add'>+	desc = (struct hfs_bnode_desc *)(kmap_local_page(node-&gt;page[0]) +</div><div class='add'>+							 node-&gt;page_offset);</div><div class='ctx'> 	node-&gt;prev = be32_to_cpu(desc-&gt;prev);</div><div class='ctx'> 	node-&gt;next = be32_to_cpu(desc-&gt;next);</div><div class='ctx'> 	node-&gt;num_recs = be16_to_cpu(desc-&gt;num_recs);</div><div class='ctx'> 	node-&gt;type = desc-&gt;type;</div><div class='ctx'> 	node-&gt;height = desc-&gt;height;</div><div class='del'>-	kunmap(node-&gt;page[0]);</div><div class='add'>+	kunmap_local(desc);</div><div class='ctx'> </div><div class='ctx'> 	switch (node-&gt;type) {</div><div class='ctx'> 	case HFS_NODE_HEADER:</div><div class='hunk'>@@ -593,14 +640,12 @@ struct hfs_bnode *hfs_bnode_create(struct hfs_btree *tree, u32 num)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	pagep = node-&gt;page;</div><div class='del'>-	memset(kmap(*pagep) + node-&gt;page_offset, 0,</div><div class='del'>-	       min_t(int, PAGE_SIZE, tree-&gt;node_size));</div><div class='add'>+	memzero_page(*pagep, node-&gt;page_offset,</div><div class='add'>+		     min_t(int, PAGE_SIZE, tree-&gt;node_size));</div><div class='ctx'> 	set_page_dirty(*pagep);</div><div class='del'>-	kunmap(*pagep);</div><div class='ctx'> 	for (i = 1; i &lt; tree-&gt;pages_per_bnode; i++) {</div><div class='del'>-		memset(kmap(*++pagep), 0, PAGE_SIZE);</div><div class='add'>+		memzero_page(*++pagep, 0, PAGE_SIZE);</div><div class='ctx'> 		set_page_dirty(*pagep);</div><div class='del'>-		kunmap(*pagep);</div><div class='ctx'> 	}</div><div class='ctx'> 	clear_bit(HFS_BNODE_NEW, &amp;node-&gt;flags);</div><div class='ctx'> 	wake_up(&amp;node-&gt;lock_wq);</div><div class='hunk'>@@ -612,7 +657,7 @@ void hfs_bnode_get(struct hfs_bnode *node)</div><div class='ctx'> {</div><div class='ctx'> 	if (node) {</div><div class='ctx'> 		atomic_inc(&amp;node-&gt;refcnt);</div><div class='del'>-		hfs_dbg(BNODE_REFS, "get_node(%d:%d): %d\n",</div><div class='add'>+		hfs_dbg("cnid %d, node %d, refcnt %d\n",</div><div class='ctx'> 			node-&gt;tree-&gt;cnid, node-&gt;this,</div><div class='ctx'> 			atomic_read(&amp;node-&gt;refcnt));</div><div class='ctx'> 	}</div><div class='hunk'>@@ -625,7 +670,7 @@ void hfs_bnode_put(struct hfs_bnode *node)</div><div class='ctx'> 		struct hfs_btree *tree = node-&gt;tree;</div><div class='ctx'> 		int i;</div><div class='ctx'> </div><div class='del'>-		hfs_dbg(BNODE_REFS, "put_node(%d:%d): %d\n",</div><div class='add'>+		hfs_dbg("cnid %d, node %d, refcnt %d\n",</div><div class='ctx'> 			node-&gt;tree-&gt;cnid, node-&gt;this,</div><div class='ctx'> 			atomic_read(&amp;node-&gt;refcnt));</div><div class='ctx'> 		BUG_ON(!atomic_read(&amp;node-&gt;refcnt));</div><div class='hunk'>@@ -660,6 +705,5 @@ bool hfs_bnode_need_zeroout(struct hfs_btree *tree)</div><div class='ctx'> 	struct hfsplus_sb_info *sbi = HFSPLUS_SB(sb);</div><div class='ctx'> 	const u32 volume_attr = be32_to_cpu(sbi-&gt;s_vhdr-&gt;attributes);</div><div class='ctx'> </div><div class='del'>-	return tree-&gt;cnid == HFSPLUS_CAT_CNID &amp;&amp;</div><div class='del'>-		volume_attr &amp; HFSPLUS_VOL_UNUSED_NODE_FIX;</div><div class='add'>+	return volume_attr &amp; HFSPLUS_VOL_UNUSED_NODE_FIX;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/hfsplus/brec.c b/fs/hfsplus/brec.c<br/>index 1918544a7871..6796c1a80e99 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/brec.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/brec.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/brec.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfsplus/brec.c</a></div><div class='hunk'>@@ -60,7 +60,7 @@ u16 hfs_brec_keylen(struct hfs_bnode *node, u16 rec)</div><div class='ctx'> 	return retval;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int hfs_brec_insert(struct hfs_find_data *fd, void *entry, int entry_len)</div><div class='add'>+int hfs_brec_insert(struct hfs_find_data *fd, void *entry, u32 entry_len)</div><div class='ctx'> {</div><div class='ctx'> 	struct hfs_btree *tree;</div><div class='ctx'> 	struct hfs_bnode *node, *new_node;</div><div class='hunk'>@@ -92,7 +92,7 @@ again:</div><div class='ctx'> 	end_rec_off = tree-&gt;node_size - (node-&gt;num_recs + 1) * 2;</div><div class='ctx'> 	end_off = hfs_bnode_read_u16(node, end_rec_off);</div><div class='ctx'> 	end_rec_off -= 2;</div><div class='del'>-	hfs_dbg(BNODE_MOD, "insert_rec: %d, %d, %d, %d\n",</div><div class='add'>+	hfs_dbg("rec %d, size %d, end_off %d, end_rec_off %d\n",</div><div class='ctx'> 		rec, size, end_off, end_rec_off);</div><div class='ctx'> 	if (size &gt; end_rec_off - end_off) {</div><div class='ctx'> 		if (new_node)</div><div class='hunk'>@@ -193,7 +193,7 @@ again:</div><div class='ctx'> 		mark_inode_dirty(tree-&gt;inode);</div><div class='ctx'> 	}</div><div class='ctx'> 	hfs_bnode_dump(node);</div><div class='del'>-	hfs_dbg(BNODE_MOD, "remove_rec: %d, %d\n",</div><div class='add'>+	hfs_dbg("rec %d, len %d\n",</div><div class='ctx'> 		fd-&gt;record, fd-&gt;keylength + fd-&gt;entrylength);</div><div class='ctx'> 	if (!--node-&gt;num_recs) {</div><div class='ctx'> 		hfs_bnode_unlink(node);</div><div class='hunk'>@@ -246,7 +246,7 @@ static struct hfs_bnode *hfs_bnode_split(struct hfs_find_data *fd)</div><div class='ctx'> 	if (IS_ERR(new_node))</div><div class='ctx'> 		return new_node;</div><div class='ctx'> 	hfs_bnode_get(node);</div><div class='del'>-	hfs_dbg(BNODE_MOD, "split_nodes: %d - %d - %d\n",</div><div class='add'>+	hfs_dbg("this %d - new %d - next %d\n",</div><div class='ctx'> 		node-&gt;this, new_node-&gt;this, node-&gt;next);</div><div class='ctx'> 	new_node-&gt;next = node-&gt;next;</div><div class='ctx'> 	new_node-&gt;prev = node-&gt;this;</div><div class='hunk'>@@ -383,7 +383,7 @@ again:</div><div class='ctx'> 		newkeylen = hfs_bnode_read_u16(node, 14) + 2;</div><div class='ctx'> 	else</div><div class='ctx'> 		fd-&gt;keylength = newkeylen = tree-&gt;max_key_len + 2;</div><div class='del'>-	hfs_dbg(BNODE_MOD, "update_rec: %d, %d, %d\n",</div><div class='add'>+	hfs_dbg("rec %d, keylength %d, newkeylen %d\n",</div><div class='ctx'> 		rec, fd-&gt;keylength, newkeylen);</div><div class='ctx'> </div><div class='ctx'> 	rec_off = tree-&gt;node_size - (rec + 2) * 2;</div><div class='hunk'>@@ -395,7 +395,7 @@ again:</div><div class='ctx'> 		end_off = hfs_bnode_read_u16(parent, end_rec_off);</div><div class='ctx'> 		if (end_rec_off - end_off &lt; diff) {</div><div class='ctx'> </div><div class='del'>-			hfs_dbg(BNODE_MOD, "splitting index node\n");</div><div class='add'>+			hfs_dbg("splitting index node\n");</div><div class='ctx'> 			fd-&gt;bnode = parent;</div><div class='ctx'> 			new_node = hfs_bnode_split(fd);</div><div class='ctx'> 			if (IS_ERR(new_node))</div><div class='head'>diff --git a/fs/hfsplus/btree.c b/fs/hfsplus/btree.c<br/>index 66774f4cb4fd..229f25dc7c49 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/btree.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/btree.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/btree.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfsplus/btree.c</a></div><div class='hunk'>@@ -163,7 +163,7 @@ struct hfs_btree *hfs_btree_open(struct super_block *sb, u32 id)</div><div class='ctx'> 		goto free_inode;</div><div class='ctx'> </div><div class='ctx'> 	/* Load the header */</div><div class='del'>-	head = (struct hfs_btree_header_rec *)(kmap(page) +</div><div class='add'>+	head = (struct hfs_btree_header_rec *)(kmap_local_page(page) +</div><div class='ctx'> 		sizeof(struct hfs_bnode_desc));</div><div class='ctx'> 	tree-&gt;root = be32_to_cpu(head-&gt;root);</div><div class='ctx'> 	tree-&gt;leaf_count = be32_to_cpu(head-&gt;leaf_count);</div><div class='hunk'>@@ -240,11 +240,12 @@ struct hfs_btree *hfs_btree_open(struct super_block *sb, u32 id)</div><div class='ctx'> 		(tree-&gt;node_size + PAGE_SIZE - 1) &gt;&gt;</div><div class='ctx'> 		PAGE_SHIFT;</div><div class='ctx'> </div><div class='del'>-	kunmap(page);</div><div class='add'>+	kunmap_local(head);</div><div class='ctx'> 	put_page(page);</div><div class='ctx'> 	return tree;</div><div class='ctx'> </div><div class='ctx'>  fail_page:</div><div class='add'>+	kunmap_local(head);</div><div class='ctx'> 	put_page(page);</div><div class='ctx'>  free_inode:</div><div class='ctx'> 	tree-&gt;inode-&gt;i_mapping-&gt;a_ops = &amp;hfsplus_aops;</div><div class='hunk'>@@ -291,7 +292,7 @@ int hfs_btree_write(struct hfs_btree *tree)</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	/* Load the header */</div><div class='ctx'> 	page = node-&gt;page[0];</div><div class='del'>-	head = (struct hfs_btree_header_rec *)(kmap(page) +</div><div class='add'>+	head = (struct hfs_btree_header_rec *)(kmap_local_page(page) +</div><div class='ctx'> 		sizeof(struct hfs_bnode_desc));</div><div class='ctx'> </div><div class='ctx'> 	head-&gt;root = cpu_to_be32(tree-&gt;root);</div><div class='hunk'>@@ -303,7 +304,7 @@ int hfs_btree_write(struct hfs_btree *tree)</div><div class='ctx'> 	head-&gt;attributes = cpu_to_be32(tree-&gt;attributes);</div><div class='ctx'> 	head-&gt;depth = cpu_to_be16(tree-&gt;depth);</div><div class='ctx'> </div><div class='del'>-	kunmap(page);</div><div class='add'>+	kunmap_local(head);</div><div class='ctx'> 	set_page_dirty(page);</div><div class='ctx'> 	hfs_bnode_put(node);</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -343,7 +344,7 @@ static struct hfs_bnode *hfs_bmap_new_bmap(struct hfs_bnode *prev, u32 idx)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Make sure @tree has enough space for the @rsvd_nodes */</div><div class='del'>-int hfs_bmap_reserve(struct hfs_btree *tree, int rsvd_nodes)</div><div class='add'>+int hfs_bmap_reserve(struct hfs_btree *tree, u32 rsvd_nodes)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = tree-&gt;inode;</div><div class='ctx'> 	struct hfsplus_inode_info *hip = HFSPLUS_I(inode);</div><div class='hunk'>@@ -392,9 +393,15 @@ struct hfs_bnode *hfs_bmap_alloc(struct hfs_btree *tree)</div><div class='ctx'> 	len = hfs_brec_lenoff(node, 2, &amp;off16);</div><div class='ctx'> 	off = off16;</div><div class='ctx'> </div><div class='add'>+	if (!is_bnode_offset_valid(node, off)) {</div><div class='add'>+		hfs_bnode_put(node);</div><div class='add'>+		return ERR_PTR(-EIO);</div><div class='add'>+	}</div><div class='add'>+	len = check_and_correct_requested_length(node, off, len);</div><div class='add'>+</div><div class='ctx'> 	off += node-&gt;page_offset;</div><div class='ctx'> 	pagep = node-&gt;page + (off &gt;&gt; PAGE_SHIFT);</div><div class='del'>-	data = kmap(*pagep);</div><div class='add'>+	data = kmap_local_page(*pagep);</div><div class='ctx'> 	off &amp;= ~PAGE_MASK;</div><div class='ctx'> 	idx = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -407,7 +414,7 @@ struct hfs_bnode *hfs_bmap_alloc(struct hfs_btree *tree)</div><div class='ctx'> 						idx += i;</div><div class='ctx'> 						data[off] |= m;</div><div class='ctx'> 						set_page_dirty(*pagep);</div><div class='del'>-						kunmap(*pagep);</div><div class='add'>+						kunmap_local(data);</div><div class='ctx'> 						tree-&gt;free_nodes--;</div><div class='ctx'> 						mark_inode_dirty(tree-&gt;inode);</div><div class='ctx'> 						hfs_bnode_put(node);</div><div class='hunk'>@@ -417,17 +424,17 @@ struct hfs_bnode *hfs_bmap_alloc(struct hfs_btree *tree)</div><div class='ctx'> 				}</div><div class='ctx'> 			}</div><div class='ctx'> 			if (++off &gt;= PAGE_SIZE) {</div><div class='del'>-				kunmap(*pagep);</div><div class='del'>-				data = kmap(*++pagep);</div><div class='add'>+				kunmap_local(data);</div><div class='add'>+				data = kmap_local_page(*++pagep);</div><div class='ctx'> 				off = 0;</div><div class='ctx'> 			}</div><div class='ctx'> 			idx += 8;</div><div class='ctx'> 			len--;</div><div class='ctx'> 		}</div><div class='del'>-		kunmap(*pagep);</div><div class='add'>+		kunmap_local(data);</div><div class='ctx'> 		nidx = node-&gt;next;</div><div class='ctx'> 		if (!nidx) {</div><div class='del'>-			hfs_dbg(BNODE_MOD, "create new bmap node\n");</div><div class='add'>+			hfs_dbg("create new bmap node\n");</div><div class='ctx'> 			next_node = hfs_bmap_new_bmap(node, idx);</div><div class='ctx'> 		} else</div><div class='ctx'> 			next_node = hfs_bnode_find(tree, nidx);</div><div class='hunk'>@@ -440,7 +447,7 @@ struct hfs_bnode *hfs_bmap_alloc(struct hfs_btree *tree)</div><div class='ctx'> 		off = off16;</div><div class='ctx'> 		off += node-&gt;page_offset;</div><div class='ctx'> 		pagep = node-&gt;page + (off &gt;&gt; PAGE_SHIFT);</div><div class='del'>-		data = kmap(*pagep);</div><div class='add'>+		data = kmap_local_page(*pagep);</div><div class='ctx'> 		off &amp;= ~PAGE_MASK;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -453,7 +460,7 @@ void hfs_bmap_free(struct hfs_bnode *node)</div><div class='ctx'> 	u32 nidx;</div><div class='ctx'> 	u8 *data, byte, m;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(BNODE_MOD, "btree_free_node: %u\n", node-&gt;this);</div><div class='add'>+	hfs_dbg("node %u\n", node-&gt;this);</div><div class='ctx'> 	BUG_ON(!node-&gt;this);</div><div class='ctx'> 	tree = node-&gt;tree;</div><div class='ctx'> 	nidx = node-&gt;this;</div><div class='hunk'>@@ -490,7 +497,7 @@ void hfs_bmap_free(struct hfs_bnode *node)</div><div class='ctx'> 	}</div><div class='ctx'> 	off += node-&gt;page_offset + nidx / 8;</div><div class='ctx'> 	page = node-&gt;page[off &gt;&gt; PAGE_SHIFT];</div><div class='del'>-	data = kmap(page);</div><div class='add'>+	data = kmap_local_page(page);</div><div class='ctx'> 	off &amp;= ~PAGE_MASK;</div><div class='ctx'> 	m = 1 &lt;&lt; (~nidx &amp; 7);</div><div class='ctx'> 	byte = data[off];</div><div class='hunk'>@@ -498,13 +505,13 @@ void hfs_bmap_free(struct hfs_bnode *node)</div><div class='ctx'> 		pr_crit("trying to free free bnode "</div><div class='ctx'> 				"%u(%d)\n",</div><div class='ctx'> 			node-&gt;this, node-&gt;type);</div><div class='del'>-		kunmap(page);</div><div class='add'>+		kunmap_local(data);</div><div class='ctx'> 		hfs_bnode_put(node);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> 	data[off] = byte &amp; ~m;</div><div class='ctx'> 	set_page_dirty(page);</div><div class='del'>-	kunmap(page);</div><div class='add'>+	kunmap_local(data);</div><div class='ctx'> 	hfs_bnode_put(node);</div><div class='ctx'> 	tree-&gt;free_nodes++;</div><div class='ctx'> 	mark_inode_dirty(tree-&gt;inode);</div><div class='head'>diff --git a/fs/hfsplus/catalog.c b/fs/hfsplus/catalog.c<br/>index 35472cba750e..02c1eee4a4b8 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/catalog.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/catalog.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/catalog.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfsplus/catalog.c</a></div><div class='hunk'>@@ -259,7 +259,7 @@ int hfsplus_create_cat(u32 cnid, struct inode *dir,</div><div class='ctx'> 	int entry_size;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(CAT_MOD, "create_cat: %s,%u(%d)\n",</div><div class='add'>+	hfs_dbg("name %s, cnid %u, i_nlink %d\n",</div><div class='ctx'> 		str-&gt;name, cnid, inode-&gt;i_nlink);</div><div class='ctx'> 	err = hfs_find_init(HFSPLUS_SB(sb)-&gt;cat_tree, &amp;fd);</div><div class='ctx'> 	if (err)</div><div class='hunk'>@@ -312,7 +312,7 @@ int hfsplus_create_cat(u32 cnid, struct inode *dir,</div><div class='ctx'> 	dir-&gt;i_size++;</div><div class='ctx'> 	if (S_ISDIR(inode-&gt;i_mode))</div><div class='ctx'> 		hfsplus_subfolders_inc(dir);</div><div class='del'>-	dir-&gt;i_mtime = dir-&gt;i_ctime = current_time(dir);</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='ctx'> 	hfsplus_mark_inode_dirty(dir, HFSPLUS_I_CAT_DIRTY);</div><div class='ctx'> </div><div class='ctx'> 	hfs_find_exit(&amp;fd);</div><div class='hunk'>@@ -336,7 +336,7 @@ int hfsplus_delete_cat(u32 cnid, struct inode *dir, const struct qstr *str)</div><div class='ctx'> 	int err, off;</div><div class='ctx'> 	u16 type;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(CAT_MOD, "delete_cat: %s,%u\n", str ? str-&gt;name : NULL, cnid);</div><div class='add'>+	hfs_dbg("name %s, cnid %u\n", str ? str-&gt;name : NULL, cnid);</div><div class='ctx'> 	err = hfs_find_init(HFSPLUS_SB(sb)-&gt;cat_tree, &amp;fd);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='hunk'>@@ -417,7 +417,7 @@ int hfsplus_delete_cat(u32 cnid, struct inode *dir, const struct qstr *str)</div><div class='ctx'> 	dir-&gt;i_size--;</div><div class='ctx'> 	if (type == HFSPLUS_FOLDER)</div><div class='ctx'> 		hfsplus_subfolders_dec(dir);</div><div class='del'>-	dir-&gt;i_mtime = dir-&gt;i_ctime = current_time(dir);</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='ctx'> 	hfsplus_mark_inode_dirty(dir, HFSPLUS_I_CAT_DIRTY);</div><div class='ctx'> </div><div class='ctx'> 	if (type == HFSPLUS_FILE || type == HFSPLUS_FOLDER) {</div><div class='hunk'>@@ -441,7 +441,7 @@ int hfsplus_rename_cat(u32 cnid,</div><div class='ctx'> 	int entry_size, type;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(CAT_MOD, "rename_cat: %u - %lu,%s - %lu,%s\n",</div><div class='add'>+	hfs_dbg("cnid %u - ino %lu, name %s - ino %lu, name %s\n",</div><div class='ctx'> 		cnid, src_dir-&gt;i_ino, src_name-&gt;name,</div><div class='ctx'> 		dst_dir-&gt;i_ino, dst_name-&gt;name);</div><div class='ctx'> 	err = hfs_find_init(HFSPLUS_SB(sb)-&gt;cat_tree, &amp;src_fd);</div><div class='hunk'>@@ -494,7 +494,7 @@ int hfsplus_rename_cat(u32 cnid,</div><div class='ctx'> 	dst_dir-&gt;i_size++;</div><div class='ctx'> 	if (type == HFSPLUS_FOLDER)</div><div class='ctx'> 		hfsplus_subfolders_inc(dst_dir);</div><div class='del'>-	dst_dir-&gt;i_mtime = dst_dir-&gt;i_ctime = current_time(dst_dir);</div><div class='add'>+	inode_set_mtime_to_ts(dst_dir, inode_set_ctime_current(dst_dir));</div><div class='ctx'> </div><div class='ctx'> 	/* finally remove the old entry */</div><div class='ctx'> 	err = hfsplus_cat_build_key(sb, src_fd.search_key,</div><div class='hunk'>@@ -511,7 +511,7 @@ int hfsplus_rename_cat(u32 cnid,</div><div class='ctx'> 	src_dir-&gt;i_size--;</div><div class='ctx'> 	if (type == HFSPLUS_FOLDER)</div><div class='ctx'> 		hfsplus_subfolders_dec(src_dir);</div><div class='del'>-	src_dir-&gt;i_mtime = src_dir-&gt;i_ctime = current_time(src_dir);</div><div class='add'>+	inode_set_mtime_to_ts(src_dir, inode_set_ctime_current(src_dir));</div><div class='ctx'> </div><div class='ctx'> 	/* remove old thread entry */</div><div class='ctx'> 	hfsplus_cat_build_key_with_cnid(sb, src_fd.search_key, cnid);</div><div class='head'>diff --git a/fs/hfsplus/dir.c b/fs/hfsplus/dir.c<br/>index 84714bbccc12..cadf0b5f9342 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/dir.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/dir.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/dir.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfsplus/dir.c</a></div><div class='hunk'>@@ -204,7 +204,7 @@ static int hfsplus_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 			fd.entrylength);</div><div class='ctx'> 		type = be16_to_cpu(entry.type);</div><div class='ctx'> 		len = NLS_MAX_CHARSET_SIZE * HFSPLUS_MAX_STRLEN;</div><div class='del'>-		err = hfsplus_uni2asc(sb, &amp;fd.key-&gt;cat.name, strbuf, &amp;len);</div><div class='add'>+		err = hfsplus_uni2asc_str(sb, &amp;fd.key-&gt;cat.name, strbuf, &amp;len);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		if (type == HFSPLUS_FOLDER) {</div><div class='hunk'>@@ -346,7 +346,7 @@ static int hfsplus_link(struct dentry *src_dentry, struct inode *dst_dir,</div><div class='ctx'> 	inc_nlink(inode);</div><div class='ctx'> 	hfsplus_instantiate(dst_dentry, inode, cnid);</div><div class='ctx'> 	ihold(inode);</div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='ctx'> 	sbi-&gt;file_count++;</div><div class='ctx'> 	hfsplus_mark_mdb_dirty(dst_dir-&gt;i_sb);</div><div class='hunk'>@@ -405,7 +405,7 @@ static int hfsplus_unlink(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 			hfsplus_delete_inode(inode);</div><div class='ctx'> 	} else</div><div class='ctx'> 		sbi-&gt;file_count--;</div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='ctx'> out:</div><div class='ctx'> 	mutex_unlock(&amp;sbi-&gt;vh_mutex);</div><div class='hunk'>@@ -426,7 +426,7 @@ static int hfsplus_rmdir(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	if (res)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	clear_nlink(inode);</div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> 	hfsplus_delete_inode(inode);</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='ctx'> out:</div><div class='hunk'>@@ -434,7 +434,7 @@ out:</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hfsplus_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int hfsplus_symlink(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 			   struct dentry *dentry, const char *symname)</div><div class='ctx'> {</div><div class='ctx'> 	struct hfsplus_sb_info *sbi = HFSPLUS_SB(dir-&gt;i_sb);</div><div class='hunk'>@@ -476,7 +476,7 @@ out:</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hfsplus_mknod(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int hfsplus_mknod(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 			 struct dentry *dentry, umode_t mode, dev_t rdev)</div><div class='ctx'> {</div><div class='ctx'> 	struct hfsplus_sb_info *sbi = HFSPLUS_SB(dir-&gt;i_sb);</div><div class='hunk'>@@ -517,19 +517,19 @@ out:</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hfsplus_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int hfsplus_create(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 			  struct dentry *dentry, umode_t mode, bool excl)</div><div class='ctx'> {</div><div class='del'>-	return hfsplus_mknod(&amp;init_user_ns, dir, dentry, mode, 0);</div><div class='add'>+	return hfsplus_mknod(&amp;nop_mnt_idmap, dir, dentry, mode, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hfsplus_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-			 struct dentry *dentry, umode_t mode)</div><div class='add'>+static struct dentry *hfsplus_mkdir(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+				    struct dentry *dentry, umode_t mode)</div><div class='ctx'> {</div><div class='del'>-	return hfsplus_mknod(&amp;init_user_ns, dir, dentry, mode | S_IFDIR, 0);</div><div class='add'>+	return ERR_PTR(hfsplus_mknod(&amp;nop_mnt_idmap, dir, dentry, mode | S_IFDIR, 0));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hfsplus_rename(struct user_namespace *mnt_userns,</div><div class='add'>+static int hfsplus_rename(struct mnt_idmap *idmap,</div><div class='ctx'> 			  struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> 			  struct inode *new_dir, struct dentry *new_dentry,</div><div class='ctx'> 			  unsigned int flags)</div><div class='hunk'>@@ -552,8 +552,13 @@ static int hfsplus_rename(struct user_namespace *mnt_userns,</div><div class='ctx'> 	res = hfsplus_rename_cat((u32)(unsigned long)old_dentry-&gt;d_fsdata,</div><div class='ctx'> 				 old_dir, &amp;old_dentry-&gt;d_name,</div><div class='ctx'> 				 new_dir, &amp;new_dentry-&gt;d_name);</div><div class='del'>-	if (!res)</div><div class='add'>+	if (!res) {</div><div class='ctx'> 		new_dentry-&gt;d_fsdata = old_dentry-&gt;d_fsdata;</div><div class='add'>+</div><div class='add'>+		res = hfsplus_cat_write_inode(old_dir);</div><div class='add'>+		if (!res)</div><div class='add'>+			res = hfsplus_cat_write_inode(new_dir);</div><div class='add'>+	}</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/hfsplus/extents.c b/fs/hfsplus/extents.c<br/>index 7054a542689f..8e886514d27f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/extents.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/extents.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/extents.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfsplus/extents.c</a></div><div class='hunk'>@@ -275,7 +275,7 @@ int hfsplus_get_block(struct inode *inode, sector_t iblock,</div><div class='ctx'> 	mutex_unlock(&amp;hip-&gt;extents_lock);</div><div class='ctx'> </div><div class='ctx'> done:</div><div class='del'>-	hfs_dbg(EXTENT, "get_block(%lu): %llu - %u\n",</div><div class='add'>+	hfs_dbg("ino %lu, iblock %llu - dblock %u\n",</div><div class='ctx'> 		inode-&gt;i_ino, (long long)iblock, dblock);</div><div class='ctx'> </div><div class='ctx'> 	mask = (1 &lt;&lt; sbi-&gt;fs_shift) - 1;</div><div class='hunk'>@@ -298,12 +298,12 @@ static void hfsplus_dump_extent(struct hfsplus_extent *extent)</div><div class='ctx'> {</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(EXTENT, "   ");</div><div class='add'>+	hfs_dbg("extent   ");</div><div class='ctx'> 	for (i = 0; i &lt; 8; i++)</div><div class='del'>-		hfs_dbg_cont(EXTENT, " %u:%u",</div><div class='del'>-			     be32_to_cpu(extent[i].start_block),</div><div class='del'>-			     be32_to_cpu(extent[i].block_count));</div><div class='del'>-	hfs_dbg_cont(EXTENT, "\n");</div><div class='add'>+		hfs_dbg(" start_block %u, block_count %u",</div><div class='add'>+			be32_to_cpu(extent[i].start_block),</div><div class='add'>+			be32_to_cpu(extent[i].block_count));</div><div class='add'>+	hfs_dbg("\n");</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int hfsplus_add_extent(struct hfsplus_extent *extent, u32 offset,</div><div class='hunk'>@@ -342,9 +342,6 @@ static int hfsplus_free_extents(struct super_block *sb,</div><div class='ctx'> 	int i;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='del'>-	/* Mapping the allocation file may lock the extent tree */</div><div class='del'>-	WARN_ON(mutex_is_locked(&amp;HFSPLUS_SB(sb)-&gt;ext_tree-&gt;tree_lock));</div><div class='del'>-</div><div class='ctx'> 	hfsplus_dump_extent(extent);</div><div class='ctx'> 	for (i = 0; i &lt; 8; extent++, i++) {</div><div class='ctx'> 		count = be32_to_cpu(extent-&gt;block_count);</div><div class='hunk'>@@ -362,8 +359,7 @@ found:</div><div class='ctx'> 		if (count &lt;= block_nr) {</div><div class='ctx'> 			err = hfsplus_block_free(sb, start, count);</div><div class='ctx'> 			if (err) {</div><div class='del'>-				pr_err("can't free extent\n");</div><div class='del'>-				hfs_dbg(EXTENT, " start: %u count: %u\n",</div><div class='add'>+				pr_err("can't free extent: start %u, count %u\n",</div><div class='ctx'> 					start, count);</div><div class='ctx'> 			}</div><div class='ctx'> 			extent-&gt;block_count = 0;</div><div class='hunk'>@@ -373,8 +369,7 @@ found:</div><div class='ctx'> 			count -= block_nr;</div><div class='ctx'> 			err = hfsplus_block_free(sb, start + count, block_nr);</div><div class='ctx'> 			if (err) {</div><div class='del'>-				pr_err("can't free extent\n");</div><div class='del'>-				hfs_dbg(EXTENT, " start: %u count: %u\n",</div><div class='add'>+				pr_err("can't free extent: start %u, count %u\n",</div><div class='ctx'> 					start, count);</div><div class='ctx'> 			}</div><div class='ctx'> 			extent-&gt;block_count = cpu_to_be32(count);</div><div class='hunk'>@@ -430,7 +425,8 @@ int hfsplus_free_fork(struct super_block *sb, u32 cnid,</div><div class='ctx'> 		hfsplus_free_extents(sb, ext_entry, total_blocks - start,</div><div class='ctx'> 				     total_blocks);</div><div class='ctx'> 		total_blocks = start;</div><div class='del'>-		mutex_lock(&amp;fd.tree-&gt;tree_lock);</div><div class='add'>+		mutex_lock_nested(&amp;fd.tree-&gt;tree_lock,</div><div class='add'>+			hfsplus_btree_lock_class(fd.tree));</div><div class='ctx'> 	} while (total_blocks &gt; blocks);</div><div class='ctx'> 	hfs_find_exit(&amp;fd);</div><div class='ctx'> </div><div class='hunk'>@@ -448,9 +444,9 @@ int hfsplus_file_extend(struct inode *inode, bool zeroout)</div><div class='ctx'> 	if (sbi-&gt;alloc_file-&gt;i_size * 8 &lt;</div><div class='ctx'> 	    sbi-&gt;total_blocks - sbi-&gt;free_blocks + 8) {</div><div class='ctx'> 		/* extend alloc file */</div><div class='del'>-		pr_err("extend alloc file! (%llu,%u,%u)\n",</div><div class='del'>-		       sbi-&gt;alloc_file-&gt;i_size * 8,</div><div class='del'>-		       sbi-&gt;total_blocks, sbi-&gt;free_blocks);</div><div class='add'>+		pr_err_ratelimited("extend alloc file! (%llu,%u,%u)\n",</div><div class='add'>+				   sbi-&gt;alloc_file-&gt;i_size * 8,</div><div class='add'>+				   sbi-&gt;total_blocks, sbi-&gt;free_blocks);</div><div class='ctx'> 		return -ENOSPC;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -480,11 +476,12 @@ int hfsplus_file_extend(struct inode *inode, bool zeroout)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(EXTENT, "extend %lu: %u,%u\n", inode-&gt;i_ino, start, len);</div><div class='add'>+	hfs_dbg("ino %lu, start %u, len %u\n", inode-&gt;i_ino, start, len);</div><div class='ctx'> </div><div class='ctx'> 	if (hip-&gt;alloc_blocks &lt;= hip-&gt;first_blocks) {</div><div class='ctx'> 		if (!hip-&gt;first_blocks) {</div><div class='del'>-			hfs_dbg(EXTENT, "first extents\n");</div><div class='add'>+			hfs_dbg("first_extent: start %u, len %u\n",</div><div class='add'>+				start, len);</div><div class='ctx'> 			/* no extents yet */</div><div class='ctx'> 			hip-&gt;first_extents[0].start_block = cpu_to_be32(start);</div><div class='ctx'> 			hip-&gt;first_extents[0].block_count = cpu_to_be32(len);</div><div class='hunk'>@@ -523,7 +520,7 @@ out:</div><div class='ctx'> 	return res;</div><div class='ctx'> </div><div class='ctx'> insert_extent:</div><div class='del'>-	hfs_dbg(EXTENT, "insert new extent\n");</div><div class='add'>+	hfs_dbg("insert new extent\n");</div><div class='ctx'> 	res = hfsplus_ext_write_extent_locked(inode);</div><div class='ctx'> 	if (res)</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -548,21 +545,21 @@ void hfsplus_file_truncate(struct inode *inode)</div><div class='ctx'> 	u32 alloc_cnt, blk_cnt, start;</div><div class='ctx'> 	int res;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(INODE, "truncate: %lu, %llu -&gt; %llu\n",</div><div class='add'>+	hfs_dbg("ino %lu, phys_size %llu -&gt; i_size %llu\n",</div><div class='ctx'> 		inode-&gt;i_ino, (long long)hip-&gt;phys_size, inode-&gt;i_size);</div><div class='ctx'> </div><div class='ctx'> 	if (inode-&gt;i_size &gt; hip-&gt;phys_size) {</div><div class='ctx'> 		struct address_space *mapping = inode-&gt;i_mapping;</div><div class='del'>-		struct page *page;</div><div class='del'>-		void *fsdata;</div><div class='add'>+		struct folio *folio;</div><div class='add'>+		void *fsdata = NULL;</div><div class='ctx'> 		loff_t size = inode-&gt;i_size;</div><div class='ctx'> </div><div class='del'>-		res = pagecache_write_begin(NULL, mapping, size, 0, 0,</div><div class='del'>-					    &amp;page, &amp;fsdata);</div><div class='add'>+		res = hfsplus_write_begin(NULL, mapping, size, 0,</div><div class='add'>+					  &amp;folio, &amp;fsdata);</div><div class='ctx'> 		if (res)</div><div class='ctx'> 			return;</div><div class='del'>-		res = pagecache_write_end(NULL, mapping, size,</div><div class='del'>-			0, 0, page, fsdata);</div><div class='add'>+		res = generic_write_end(NULL, mapping, size, 0, 0,</div><div class='add'>+					folio, fsdata);</div><div class='ctx'> 		if (res &lt; 0)</div><div class='ctx'> 			return;</div><div class='ctx'> 		mark_inode_dirty(inode);</div><div class='hunk'>@@ -592,7 +589,8 @@ void hfsplus_file_truncate(struct inode *inode)</div><div class='ctx'> 					     alloc_cnt, alloc_cnt - blk_cnt);</div><div class='ctx'> 			hfsplus_dump_extent(hip-&gt;first_extents);</div><div class='ctx'> 			hip-&gt;first_blocks = blk_cnt;</div><div class='del'>-			mutex_lock(&amp;fd.tree-&gt;tree_lock);</div><div class='add'>+			mutex_lock_nested(&amp;fd.tree-&gt;tree_lock,</div><div class='add'>+				hfsplus_btree_lock_class(fd.tree));</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 		res = __hfsplus_ext_cache_extent(&amp;fd, inode, alloc_cnt);</div><div class='hunk'>@@ -606,7 +604,8 @@ void hfsplus_file_truncate(struct inode *inode)</div><div class='ctx'> 		hfsplus_free_extents(sb, hip-&gt;cached_extents,</div><div class='ctx'> 				     alloc_cnt - start, alloc_cnt - blk_cnt);</div><div class='ctx'> 		hfsplus_dump_extent(hip-&gt;cached_extents);</div><div class='del'>-		mutex_lock(&amp;fd.tree-&gt;tree_lock);</div><div class='add'>+		mutex_lock_nested(&amp;fd.tree-&gt;tree_lock,</div><div class='add'>+				hfsplus_btree_lock_class(fd.tree));</div><div class='ctx'> 		if (blk_cnt &gt; start) {</div><div class='ctx'> 			hip-&gt;extent_state |= HFSPLUS_EXT_DIRTY;</div><div class='ctx'> 			break;</div><div class='head'>diff --git a/fs/hfsplus/hfsplus_fs.h b/fs/hfsplus/hfsplus_fs.h<br/>index 1798949f269b..45fe3a12ecba 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/hfsplus_fs.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/hfsplus_fs.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/hfsplus_fs.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfsplus/hfsplus_fs.h</a></div><div class='hunk'>@@ -11,46 +11,13 @@</div><div class='ctx'> #ifndef _LINUX_HFSPLUS_FS_H</div><div class='ctx'> #define _LINUX_HFSPLUS_FS_H</div><div class='ctx'> </div><div class='del'>-#ifdef pr_fmt</div><div class='del'>-#undef pr_fmt</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-#define pr_fmt(fmt) KBUILD_MODNAME ": " fmt</div><div class='del'>-</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/mutex.h&gt;</div><div class='ctx'> #include &lt;linux/buffer_head.h&gt;</div><div class='ctx'> #include &lt;linux/blkdev.h&gt;</div><div class='add'>+#include &lt;linux/fs_context.h&gt;</div><div class='ctx'> #include "hfsplus_raw.h"</div><div class='ctx'> </div><div class='del'>-#define DBG_BNODE_REFS	0x00000001</div><div class='del'>-#define DBG_BNODE_MOD	0x00000002</div><div class='del'>-#define DBG_CAT_MOD	0x00000004</div><div class='del'>-#define DBG_INODE	0x00000008</div><div class='del'>-#define DBG_SUPER	0x00000010</div><div class='del'>-#define DBG_EXTENT	0x00000020</div><div class='del'>-#define DBG_BITMAP	0x00000040</div><div class='del'>-#define DBG_ATTR_MOD	0x00000080</div><div class='del'>-</div><div class='del'>-#if 0</div><div class='del'>-#define DBG_MASK	(DBG_EXTENT|DBG_INODE|DBG_BNODE_MOD)</div><div class='del'>-#define DBG_MASK	(DBG_BNODE_MOD|DBG_CAT_MOD|DBG_INODE)</div><div class='del'>-#define DBG_MASK	(DBG_CAT_MOD|DBG_BNODE_REFS|DBG_INODE|DBG_EXTENT)</div><div class='del'>-#endif</div><div class='del'>-#define DBG_MASK	(0)</div><div class='del'>-</div><div class='del'>-#define hfs_dbg(flg, fmt, ...)					\</div><div class='del'>-do {								\</div><div class='del'>-	if (DBG_##flg &amp; DBG_MASK)				\</div><div class='del'>-		printk(KERN_DEBUG pr_fmt(fmt), ##__VA_ARGS__);	\</div><div class='del'>-} while (0)</div><div class='del'>-</div><div class='del'>-#define hfs_dbg_cont(flg, fmt, ...)				\</div><div class='del'>-do {								\</div><div class='del'>-	if (DBG_##flg &amp; DBG_MASK)				\</div><div class='del'>-		pr_cont(fmt, ##__VA_ARGS__);			\</div><div class='del'>-} while (0)</div><div class='del'>-</div><div class='ctx'> /* Runtime config options */</div><div class='ctx'> #define HFSPLUS_DEF_CR_TYPE    0x3F3F3F3F  /* '????' */</div><div class='ctx'> </div><div class='hunk'>@@ -156,6 +123,7 @@ struct hfsplus_sb_info {</div><div class='ctx'> </div><div class='ctx'> 	/* Runtime variables */</div><div class='ctx'> 	u32 blockoffset;</div><div class='add'>+	u32 min_io_size;</div><div class='ctx'> 	sector_t part_start;</div><div class='ctx'> 	sector_t sect_count;</div><div class='ctx'> 	int fs_shift;</div><div class='hunk'>@@ -190,6 +158,7 @@ struct hfsplus_sb_info {</div><div class='ctx'> 	int work_queued;               /* non-zero delayed work is queued */</div><div class='ctx'> 	struct delayed_work sync_work; /* FS sync delayed work */</div><div class='ctx'> 	spinlock_t work_lock;          /* protects sync_work and work_queued */</div><div class='add'>+	struct rcu_head rcu;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> #define HFSPLUS_SB_WRITEBACKUP	0</div><div class='hunk'>@@ -198,6 +167,8 @@ struct hfsplus_sb_info {</div><div class='ctx'> #define HFSPLUS_SB_HFSX		3</div><div class='ctx'> #define HFSPLUS_SB_CASEFOLD	4</div><div class='ctx'> #define HFSPLUS_SB_NOBARRIER	5</div><div class='add'>+#define HFSPLUS_SB_UID		6</div><div class='add'>+#define HFSPLUS_SB_GID		7</div><div class='ctx'> </div><div class='ctx'> static inline struct hfsplus_sb_info *HFSPLUS_SB(struct super_block *sb)</div><div class='ctx'> {</div><div class='hunk'>@@ -304,7 +275,7 @@ struct hfsplus_readdir_data {</div><div class='ctx'>  */</div><div class='ctx'> static inline unsigned short hfsplus_min_io_size(struct super_block *sb)</div><div class='ctx'> {</div><div class='del'>-	return max_t(unsigned short, bdev_logical_block_size(sb-&gt;s_bdev),</div><div class='add'>+	return max_t(unsigned short, HFSPLUS_SB(sb)-&gt;min_io_size,</div><div class='ctx'> 		     HFSPLUS_SECTOR_SIZE);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -385,21 +356,21 @@ u32 hfsplus_calc_btree_clump_size(u32 block_size, u32 node_size, u64 sectors,</div><div class='ctx'> struct hfs_btree *hfs_btree_open(struct super_block *sb, u32 id);</div><div class='ctx'> void hfs_btree_close(struct hfs_btree *tree);</div><div class='ctx'> int hfs_btree_write(struct hfs_btree *tree);</div><div class='del'>-int hfs_bmap_reserve(struct hfs_btree *tree, int rsvd_nodes);</div><div class='add'>+int hfs_bmap_reserve(struct hfs_btree *tree, u32 rsvd_nodes);</div><div class='ctx'> struct hfs_bnode *hfs_bmap_alloc(struct hfs_btree *tree);</div><div class='ctx'> void hfs_bmap_free(struct hfs_bnode *node);</div><div class='ctx'> </div><div class='ctx'> /* bnode.c */</div><div class='del'>-void hfs_bnode_read(struct hfs_bnode *node, void *buf, int off, int len);</div><div class='del'>-u16 hfs_bnode_read_u16(struct hfs_bnode *node, int off);</div><div class='del'>-u8 hfs_bnode_read_u8(struct hfs_bnode *node, int off);</div><div class='del'>-void hfs_bnode_read_key(struct hfs_bnode *node, void *key, int off);</div><div class='del'>-void hfs_bnode_write(struct hfs_bnode *node, void *buf, int off, int len);</div><div class='del'>-void hfs_bnode_write_u16(struct hfs_bnode *node, int off, u16 data);</div><div class='del'>-void hfs_bnode_clear(struct hfs_bnode *node, int off, int len);</div><div class='del'>-void hfs_bnode_copy(struct hfs_bnode *dst_node, int dst,</div><div class='del'>-		    struct hfs_bnode *src_node, int src, int len);</div><div class='del'>-void hfs_bnode_move(struct hfs_bnode *node, int dst, int src, int len);</div><div class='add'>+void hfs_bnode_read(struct hfs_bnode *node, void *buf, u32 off, u32 len);</div><div class='add'>+u16 hfs_bnode_read_u16(struct hfs_bnode *node, u32 off);</div><div class='add'>+u8 hfs_bnode_read_u8(struct hfs_bnode *node, u32 off);</div><div class='add'>+void hfs_bnode_read_key(struct hfs_bnode *node, void *key, u32 off);</div><div class='add'>+void hfs_bnode_write(struct hfs_bnode *node, void *buf, u32 off, u32 len);</div><div class='add'>+void hfs_bnode_write_u16(struct hfs_bnode *node, u32 off, u16 data);</div><div class='add'>+void hfs_bnode_clear(struct hfs_bnode *node, u32 off, u32 len);</div><div class='add'>+void hfs_bnode_copy(struct hfs_bnode *dst_node, u32 dst,</div><div class='add'>+		    struct hfs_bnode *src_node, u32 src, u32 len);</div><div class='add'>+void hfs_bnode_move(struct hfs_bnode *node, u32 dst, u32 src, u32 len);</div><div class='ctx'> void hfs_bnode_dump(struct hfs_bnode *node);</div><div class='ctx'> void hfs_bnode_unlink(struct hfs_bnode *node);</div><div class='ctx'> struct hfs_bnode *hfs_bnode_findhash(struct hfs_btree *tree, u32 cnid);</div><div class='hunk'>@@ -414,7 +385,7 @@ bool hfs_bnode_need_zeroout(struct hfs_btree *tree);</div><div class='ctx'> /* brec.c */</div><div class='ctx'> u16 hfs_brec_lenoff(struct hfs_bnode *node, u16 rec, u16 *off);</div><div class='ctx'> u16 hfs_brec_keylen(struct hfs_bnode *node, u16 rec);</div><div class='del'>-int hfs_brec_insert(struct hfs_find_data *fd, void *entry, int entry_len);</div><div class='add'>+int hfs_brec_insert(struct hfs_find_data *fd, void *entry, u32 entry_len);</div><div class='ctx'> int hfs_brec_remove(struct hfs_find_data *fd);</div><div class='ctx'> </div><div class='ctx'> /* bfind.c */</div><div class='hunk'>@@ -427,7 +398,7 @@ int hfs_find_rec_by_key(struct hfs_bnode *bnode, struct hfs_find_data *fd,</div><div class='ctx'> int __hfs_brec_find(struct hfs_bnode *bnode, struct hfs_find_data *fd,</div><div class='ctx'> 		    search_strategy_t rec_found);</div><div class='ctx'> int hfs_brec_find(struct hfs_find_data *fd, search_strategy_t do_key_compare);</div><div class='del'>-int hfs_brec_read(struct hfs_find_data *fd, void *rec, int rec_len);</div><div class='add'>+int hfs_brec_read(struct hfs_find_data *fd, void *rec, u32 rec_len);</div><div class='ctx'> int hfs_brec_goto(struct hfs_find_data *fd, int cnt);</div><div class='ctx'> </div><div class='ctx'> /* catalog.c */</div><div class='hunk'>@@ -468,6 +439,10 @@ extern const struct address_space_operations hfsplus_aops;</div><div class='ctx'> extern const struct address_space_operations hfsplus_btree_aops;</div><div class='ctx'> extern const struct dentry_operations hfsplus_dentry_operations;</div><div class='ctx'> </div><div class='add'>+int hfsplus_write_begin(const struct kiocb *iocb,</div><div class='add'>+			struct address_space *mapping,</div><div class='add'>+			loff_t pos, unsigned len, struct folio **foliop,</div><div class='add'>+			void **fsdata);</div><div class='ctx'> struct inode *hfsplus_new_inode(struct super_block *sb, struct inode *dir,</div><div class='ctx'> 				umode_t mode);</div><div class='ctx'> void hfsplus_delete_inode(struct inode *inode);</div><div class='hunk'>@@ -477,22 +452,21 @@ void hfsplus_inode_write_fork(struct inode *inode,</div><div class='ctx'> 			      struct hfsplus_fork_raw *fork);</div><div class='ctx'> int hfsplus_cat_read_inode(struct inode *inode, struct hfs_find_data *fd);</div><div class='ctx'> int hfsplus_cat_write_inode(struct inode *inode);</div><div class='del'>-int hfsplus_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='add'>+int hfsplus_getattr(struct mnt_idmap *idmap, const struct path *path,</div><div class='ctx'> 		    struct kstat *stat, u32 request_mask,</div><div class='ctx'> 		    unsigned int query_flags);</div><div class='ctx'> int hfsplus_file_fsync(struct file *file, loff_t start, loff_t end,</div><div class='ctx'> 		       int datasync);</div><div class='del'>-int hfsplus_fileattr_get(struct dentry *dentry, struct fileattr *fa);</div><div class='del'>-int hfsplus_fileattr_set(struct user_namespace *mnt_userns,</div><div class='del'>-			 struct dentry *dentry, struct fileattr *fa);</div><div class='add'>+int hfsplus_fileattr_get(struct dentry *dentry, struct file_kattr *fa);</div><div class='add'>+int hfsplus_fileattr_set(struct mnt_idmap *idmap,</div><div class='add'>+			 struct dentry *dentry, struct file_kattr *fa);</div><div class='ctx'> </div><div class='ctx'> /* ioctl.c */</div><div class='ctx'> long hfsplus_ioctl(struct file *filp, unsigned int cmd, unsigned long arg);</div><div class='ctx'> </div><div class='ctx'> /* options.c */</div><div class='ctx'> void hfsplus_fill_defaults(struct hfsplus_sb_info *opts);</div><div class='del'>-int hfsplus_parse_options_remount(char *input, int *force);</div><div class='del'>-int hfsplus_parse_options(char *input, struct hfsplus_sb_info *sbi);</div><div class='add'>+int hfsplus_parse_param(struct fs_context *fc, struct fs_parameter *param);</div><div class='ctx'> int hfsplus_show_options(struct seq_file *seq, struct dentry *root);</div><div class='ctx'> </div><div class='ctx'> /* part_tbl.c */</div><div class='hunk'>@@ -502,6 +476,8 @@ int hfs_part_find(struct super_block *sb, sector_t *part_start,</div><div class='ctx'> /* super.c */</div><div class='ctx'> struct inode *hfsplus_iget(struct super_block *sb, unsigned long ino);</div><div class='ctx'> void hfsplus_mark_mdb_dirty(struct super_block *sb);</div><div class='add'>+void hfsplus_prepare_volume_header_for_commit(struct hfsplus_vh *vhdr);</div><div class='add'>+int hfsplus_commit_superblock(struct super_block *sb);</div><div class='ctx'> </div><div class='ctx'> /* tables.c */</div><div class='ctx'> extern u16 hfsplus_case_fold_table[];</div><div class='hunk'>@@ -513,8 +489,12 @@ int hfsplus_strcasecmp(const struct hfsplus_unistr *s1,</div><div class='ctx'> 		       const struct hfsplus_unistr *s2);</div><div class='ctx'> int hfsplus_strcmp(const struct hfsplus_unistr *s1,</div><div class='ctx'> 		   const struct hfsplus_unistr *s2);</div><div class='del'>-int hfsplus_uni2asc(struct super_block *sb, const struct hfsplus_unistr *ustr,</div><div class='del'>-		    char *astr, int *len_p);</div><div class='add'>+int hfsplus_uni2asc_str(struct super_block *sb,</div><div class='add'>+			const struct hfsplus_unistr *ustr, char *astr,</div><div class='add'>+			int *len_p);</div><div class='add'>+int hfsplus_uni2asc_xattr_str(struct super_block *sb,</div><div class='add'>+			      const struct hfsplus_attr_unistr *ustr,</div><div class='add'>+			      char *astr, int *len_p);</div><div class='ctx'> int hfsplus_asc2uni(struct super_block *sb, struct hfsplus_unistr *ustr,</div><div class='ctx'> 		    int max_unistr_len, const char *astr, int len);</div><div class='ctx'> int hfsplus_hash_dentry(const struct dentry *dentry, struct qstr *str);</div><div class='hunk'>@@ -523,7 +503,7 @@ int hfsplus_compare_dentry(const struct dentry *dentry, unsigned int len,</div><div class='ctx'> </div><div class='ctx'> /* wrapper.c */</div><div class='ctx'> int hfsplus_submit_bio(struct super_block *sb, sector_t sector, void *buf,</div><div class='del'>-		       void **data, int op, int op_flags);</div><div class='add'>+		       void **data, blk_opf_t opf);</div><div class='ctx'> int hfsplus_read_wrapper(struct super_block *sb);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -548,6 +528,69 @@ static inline __be32 __hfsp_ut2mt(time64_t ut)</div><div class='ctx'> 	return cpu_to_be32(lower_32_bits(ut) + HFSPLUS_UTC_OFFSET);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline enum hfsplus_btree_mutex_classes</div><div class='add'>+hfsplus_btree_lock_class(struct hfs_btree *tree)</div><div class='add'>+{</div><div class='add'>+	enum hfsplus_btree_mutex_classes class;</div><div class='add'>+</div><div class='add'>+	switch (tree-&gt;cnid) {</div><div class='add'>+	case HFSPLUS_CAT_CNID:</div><div class='add'>+		class = CATALOG_BTREE_MUTEX;</div><div class='add'>+		break;</div><div class='add'>+	case HFSPLUS_EXT_CNID:</div><div class='add'>+		class = EXTENTS_BTREE_MUTEX;</div><div class='add'>+		break;</div><div class='add'>+	case HFSPLUS_ATTR_CNID:</div><div class='add'>+		class = ATTR_BTREE_MUTEX;</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		BUG();</div><div class='add'>+	}</div><div class='add'>+	return class;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline</div><div class='add'>+bool is_bnode_offset_valid(struct hfs_bnode *node, u32 off)</div><div class='add'>+{</div><div class='add'>+	bool is_valid = off &lt; node-&gt;tree-&gt;node_size;</div><div class='add'>+</div><div class='add'>+	if (!is_valid) {</div><div class='add'>+		pr_err("requested invalid offset: "</div><div class='add'>+		       "NODE: id %u, type %#x, height %u, "</div><div class='add'>+		       "node_size %u, offset %u\n",</div><div class='add'>+		       node-&gt;this, node-&gt;type, node-&gt;height,</div><div class='add'>+		       node-&gt;tree-&gt;node_size, off);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return is_valid;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline</div><div class='add'>+u32 check_and_correct_requested_length(struct hfs_bnode *node, u32 off, u32 len)</div><div class='add'>+{</div><div class='add'>+	unsigned int node_size;</div><div class='add'>+</div><div class='add'>+	if (!is_bnode_offset_valid(node, off))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	node_size = node-&gt;tree-&gt;node_size;</div><div class='add'>+</div><div class='add'>+	if ((off + len) &gt; node_size) {</div><div class='add'>+		u32 new_len = node_size - off;</div><div class='add'>+</div><div class='add'>+		pr_err("requested length has been corrected: "</div><div class='add'>+		       "NODE: id %u, type %#x, height %u, "</div><div class='add'>+		       "node_size %u, offset %u, "</div><div class='add'>+		       "requested_len %u, corrected_len %u\n",</div><div class='add'>+		       node-&gt;this, node-&gt;type, node-&gt;height,</div><div class='add'>+		       node-&gt;tree-&gt;node_size, off, len, new_len);</div><div class='add'>+</div><div class='add'>+		return new_len;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return len;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /* compatibility */</div><div class='ctx'> #define hfsp_mt2ut(t)		(struct timespec64){ .tv_sec = __hfsp_mt2ut(t) }</div><div class='ctx'> #define hfsp_ut2mt(t)		__hfsp_ut2mt((t).tv_sec)</div><div class='head'>diff --git a/fs/hfsplus/hfsplus_raw.h b/fs/hfsplus/hfsplus_raw.h<br/>index 456e87aec7fd..83b5dbde924b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/hfsplus_raw.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/hfsplus_raw.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/hfsplus_raw.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfsplus/hfsplus_raw.h</a></div><div class='hunk'>@@ -15,394 +15,6 @@</div><div class='ctx'> #define _LINUX_HFSPLUS_RAW_H</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/types.h&gt;</div><div class='del'>-</div><div class='del'>-/* Some constants */</div><div class='del'>-#define HFSPLUS_SECTOR_SIZE        512</div><div class='del'>-#define HFSPLUS_SECTOR_SHIFT         9</div><div class='del'>-#define HFSPLUS_VOLHEAD_SECTOR       2</div><div class='del'>-#define HFSPLUS_VOLHEAD_SIG     0x482b</div><div class='del'>-#define HFSPLUS_VOLHEAD_SIGX    0x4858</div><div class='del'>-#define HFSPLUS_SUPER_MAGIC     0x482b</div><div class='del'>-#define HFSPLUS_MIN_VERSION          4</div><div class='del'>-#define HFSPLUS_CURRENT_VERSION      5</div><div class='del'>-</div><div class='del'>-#define HFSP_WRAP_MAGIC         0x4244</div><div class='del'>-#define HFSP_WRAP_ATTRIB_SLOCK  0x8000</div><div class='del'>-#define HFSP_WRAP_ATTRIB_SPARED 0x0200</div><div class='del'>-</div><div class='del'>-#define HFSP_WRAPOFF_SIG          0x00</div><div class='del'>-#define HFSP_WRAPOFF_ATTRIB       0x0A</div><div class='del'>-#define HFSP_WRAPOFF_ABLKSIZE     0x14</div><div class='del'>-#define HFSP_WRAPOFF_ABLKSTART    0x1C</div><div class='del'>-#define HFSP_WRAPOFF_EMBEDSIG     0x7C</div><div class='del'>-#define HFSP_WRAPOFF_EMBEDEXT     0x7E</div><div class='del'>-</div><div class='del'>-#define HFSP_HIDDENDIR_NAME \</div><div class='del'>-	"\xe2\x90\x80\xe2\x90\x80\xe2\x90\x80\xe2\x90\x80HFS+ Private Data"</div><div class='del'>-</div><div class='del'>-#define HFSP_HARDLINK_TYPE	0x686c6e6b	/* 'hlnk' */</div><div class='del'>-#define HFSP_HFSPLUS_CREATOR	0x6866732b	/* 'hfs+' */</div><div class='del'>-</div><div class='del'>-#define HFSP_SYMLINK_TYPE	0x736c6e6b	/* 'slnk' */</div><div class='del'>-#define HFSP_SYMLINK_CREATOR	0x72686170	/* 'rhap' */</div><div class='del'>-</div><div class='del'>-#define HFSP_MOUNT_VERSION	0x482b4c78	/* 'H+Lx' */</div><div class='del'>-</div><div class='del'>-/* Structures used on disk */</div><div class='del'>-</div><div class='del'>-typedef __be32 hfsplus_cnid;</div><div class='del'>-typedef __be16 hfsplus_unichr;</div><div class='del'>-</div><div class='del'>-#define HFSPLUS_MAX_STRLEN 255</div><div class='del'>-#define HFSPLUS_ATTR_MAX_STRLEN 127</div><div class='del'>-</div><div class='del'>-/* A "string" as used in filenames, etc. */</div><div class='del'>-struct hfsplus_unistr {</div><div class='del'>-	__be16 length;</div><div class='del'>-	hfsplus_unichr unicode[HFSPLUS_MAX_STRLEN];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * A "string" is used in attributes file</div><div class='del'>- * for name of extended attribute</div><div class='del'>- */</div><div class='del'>-struct hfsplus_attr_unistr {</div><div class='del'>-	__be16 length;</div><div class='del'>-	hfsplus_unichr unicode[HFSPLUS_ATTR_MAX_STRLEN];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* POSIX permissions */</div><div class='del'>-struct hfsplus_perm {</div><div class='del'>-	__be32 owner;</div><div class='del'>-	__be32 group;</div><div class='del'>-	u8  rootflags;</div><div class='del'>-	u8  userflags;</div><div class='del'>-	__be16 mode;</div><div class='del'>-	__be32 dev;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define HFSPLUS_FLG_NODUMP	0x01</div><div class='del'>-#define HFSPLUS_FLG_IMMUTABLE	0x02</div><div class='del'>-#define HFSPLUS_FLG_APPEND	0x04</div><div class='del'>-</div><div class='del'>-/* A single contiguous area of a file */</div><div class='del'>-struct hfsplus_extent {</div><div class='del'>-	__be32 start_block;</div><div class='del'>-	__be32 block_count;</div><div class='del'>-} __packed;</div><div class='del'>-typedef struct hfsplus_extent hfsplus_extent_rec[8];</div><div class='del'>-</div><div class='del'>-/* Information for a "Fork" in a file */</div><div class='del'>-struct hfsplus_fork_raw {</div><div class='del'>-	__be64 total_size;</div><div class='del'>-	__be32 clump_size;</div><div class='del'>-	__be32 total_blocks;</div><div class='del'>-	hfsplus_extent_rec extents;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* HFS+ Volume Header */</div><div class='del'>-struct hfsplus_vh {</div><div class='del'>-	__be16 signature;</div><div class='del'>-	__be16 version;</div><div class='del'>-	__be32 attributes;</div><div class='del'>-	__be32 last_mount_vers;</div><div class='del'>-	u32 reserved;</div><div class='del'>-</div><div class='del'>-	__be32 create_date;</div><div class='del'>-	__be32 modify_date;</div><div class='del'>-	__be32 backup_date;</div><div class='del'>-	__be32 checked_date;</div><div class='del'>-</div><div class='del'>-	__be32 file_count;</div><div class='del'>-	__be32 folder_count;</div><div class='del'>-</div><div class='del'>-	__be32 blocksize;</div><div class='del'>-	__be32 total_blocks;</div><div class='del'>-	__be32 free_blocks;</div><div class='del'>-</div><div class='del'>-	__be32 next_alloc;</div><div class='del'>-	__be32 rsrc_clump_sz;</div><div class='del'>-	__be32 data_clump_sz;</div><div class='del'>-	hfsplus_cnid next_cnid;</div><div class='del'>-</div><div class='del'>-	__be32 write_count;</div><div class='del'>-	__be64 encodings_bmp;</div><div class='del'>-</div><div class='del'>-	u32 finder_info[8];</div><div class='del'>-</div><div class='del'>-	struct hfsplus_fork_raw alloc_file;</div><div class='del'>-	struct hfsplus_fork_raw ext_file;</div><div class='del'>-	struct hfsplus_fork_raw cat_file;</div><div class='del'>-	struct hfsplus_fork_raw attr_file;</div><div class='del'>-	struct hfsplus_fork_raw start_file;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* HFS+ volume attributes */</div><div class='del'>-#define HFSPLUS_VOL_UNMNT		(1 &lt;&lt; 8)</div><div class='del'>-#define HFSPLUS_VOL_SPARE_BLK		(1 &lt;&lt; 9)</div><div class='del'>-#define HFSPLUS_VOL_NOCACHE		(1 &lt;&lt; 10)</div><div class='del'>-#define HFSPLUS_VOL_INCNSTNT		(1 &lt;&lt; 11)</div><div class='del'>-#define HFSPLUS_VOL_NODEID_REUSED	(1 &lt;&lt; 12)</div><div class='del'>-#define HFSPLUS_VOL_JOURNALED		(1 &lt;&lt; 13)</div><div class='del'>-#define HFSPLUS_VOL_SOFTLOCK		(1 &lt;&lt; 15)</div><div class='del'>-#define HFSPLUS_VOL_UNUSED_NODE_FIX	(1 &lt;&lt; 31)</div><div class='del'>-</div><div class='del'>-/* HFS+ BTree node descriptor */</div><div class='del'>-struct hfs_bnode_desc {</div><div class='del'>-	__be32 next;</div><div class='del'>-	__be32 prev;</div><div class='del'>-	s8 type;</div><div class='del'>-	u8 height;</div><div class='del'>-	__be16 num_recs;</div><div class='del'>-	u16 reserved;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* HFS+ BTree node types */</div><div class='del'>-#define HFS_NODE_INDEX	0x00	/* An internal (index) node */</div><div class='del'>-#define HFS_NODE_HEADER	0x01	/* The tree header node (node 0) */</div><div class='del'>-#define HFS_NODE_MAP	0x02	/* Holds part of the bitmap of used nodes */</div><div class='del'>-#define HFS_NODE_LEAF	0xFF	/* A leaf (ndNHeight==1) node */</div><div class='del'>-</div><div class='del'>-/* HFS+ BTree header */</div><div class='del'>-struct hfs_btree_header_rec {</div><div class='del'>-	__be16 depth;</div><div class='del'>-	__be32 root;</div><div class='del'>-	__be32 leaf_count;</div><div class='del'>-	__be32 leaf_head;</div><div class='del'>-	__be32 leaf_tail;</div><div class='del'>-	__be16 node_size;</div><div class='del'>-	__be16 max_key_len;</div><div class='del'>-	__be32 node_count;</div><div class='del'>-	__be32 free_nodes;</div><div class='del'>-	u16 reserved1;</div><div class='del'>-	__be32 clump_size;</div><div class='del'>-	u8 btree_type;</div><div class='del'>-	u8 key_type;</div><div class='del'>-	__be32 attributes;</div><div class='del'>-	u32 reserved3[16];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* BTree attributes */</div><div class='del'>-#define HFS_TREE_BIGKEYS	2</div><div class='del'>-#define HFS_TREE_VARIDXKEYS	4</div><div class='del'>-</div><div class='del'>-/* HFS+ BTree misc info */</div><div class='del'>-#define HFSPLUS_TREE_HEAD 0</div><div class='del'>-#define HFSPLUS_NODE_MXSZ 32768</div><div class='del'>-#define HFSPLUS_ATTR_TREE_NODE_SIZE		8192</div><div class='del'>-#define HFSPLUS_BTREE_HDR_NODE_RECS_COUNT	3</div><div class='del'>-#define HFSPLUS_BTREE_HDR_USER_BYTES		128</div><div class='del'>-</div><div class='del'>-/* Some special File ID numbers (stolen from hfs.h) */</div><div class='del'>-#define HFSPLUS_POR_CNID		1	/* Parent Of the Root */</div><div class='del'>-#define HFSPLUS_ROOT_CNID		2	/* ROOT directory */</div><div class='del'>-#define HFSPLUS_EXT_CNID		3	/* EXTents B-tree */</div><div class='del'>-#define HFSPLUS_CAT_CNID		4	/* CATalog B-tree */</div><div class='del'>-#define HFSPLUS_BAD_CNID		5	/* BAD blocks file */</div><div class='del'>-#define HFSPLUS_ALLOC_CNID		6	/* ALLOCation file */</div><div class='del'>-#define HFSPLUS_START_CNID		7	/* STARTup file */</div><div class='del'>-#define HFSPLUS_ATTR_CNID		8	/* ATTRibutes file */</div><div class='del'>-#define HFSPLUS_EXCH_CNID		15	/* ExchangeFiles temp id */</div><div class='del'>-#define HFSPLUS_FIRSTUSER_CNID		16	/* first available user id */</div><div class='del'>-</div><div class='del'>-/* btree key type */</div><div class='del'>-#define HFSPLUS_KEY_CASEFOLDING		0xCF	/* case-insensitive */</div><div class='del'>-#define HFSPLUS_KEY_BINARY		0xBC	/* case-sensitive */</div><div class='del'>-</div><div class='del'>-/* HFS+ catalog entry key */</div><div class='del'>-struct hfsplus_cat_key {</div><div class='del'>-	__be16 key_len;</div><div class='del'>-	hfsplus_cnid parent;</div><div class='del'>-	struct hfsplus_unistr name;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define HFSPLUS_CAT_KEYLEN	(sizeof(struct hfsplus_cat_key))</div><div class='del'>-</div><div class='del'>-/* Structs from hfs.h */</div><div class='del'>-struct hfsp_point {</div><div class='del'>-	__be16 v;</div><div class='del'>-	__be16 h;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct hfsp_rect {</div><div class='del'>-	__be16 top;</div><div class='del'>-	__be16 left;</div><div class='del'>-	__be16 bottom;</div><div class='del'>-	__be16 right;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-/* HFS directory info (stolen from hfs.h */</div><div class='del'>-struct DInfo {</div><div class='del'>-	struct hfsp_rect frRect;</div><div class='del'>-	__be16 frFlags;</div><div class='del'>-	struct hfsp_point frLocation;</div><div class='del'>-	__be16 frView;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct DXInfo {</div><div class='del'>-	struct hfsp_point frScroll;</div><div class='del'>-	__be32 frOpenChain;</div><div class='del'>-	__be16 frUnused;</div><div class='del'>-	__be16 frComment;</div><div class='del'>-	__be32 frPutAway;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* HFS+ folder data (part of an hfsplus_cat_entry) */</div><div class='del'>-struct hfsplus_cat_folder {</div><div class='del'>-	__be16 type;</div><div class='del'>-	__be16 flags;</div><div class='del'>-	__be32 valence;</div><div class='del'>-	hfsplus_cnid id;</div><div class='del'>-	__be32 create_date;</div><div class='del'>-	__be32 content_mod_date;</div><div class='del'>-	__be32 attribute_mod_date;</div><div class='del'>-	__be32 access_date;</div><div class='del'>-	__be32 backup_date;</div><div class='del'>-	struct hfsplus_perm permissions;</div><div class='del'>-	struct DInfo user_info;</div><div class='del'>-	struct DXInfo finder_info;</div><div class='del'>-	__be32 text_encoding;</div><div class='del'>-	__be32 subfolders;	/* Subfolder count in HFSX. Reserved in HFS+. */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* HFS file info (stolen from hfs.h) */</div><div class='del'>-struct FInfo {</div><div class='del'>-	__be32 fdType;</div><div class='del'>-	__be32 fdCreator;</div><div class='del'>-	__be16 fdFlags;</div><div class='del'>-	struct hfsp_point fdLocation;</div><div class='del'>-	__be16 fdFldr;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct FXInfo {</div><div class='del'>-	__be16 fdIconID;</div><div class='del'>-	u8 fdUnused[8];</div><div class='del'>-	__be16 fdComment;</div><div class='del'>-	__be32 fdPutAway;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* HFS+ file data (part of a cat_entry) */</div><div class='del'>-struct hfsplus_cat_file {</div><div class='del'>-	__be16 type;</div><div class='del'>-	__be16 flags;</div><div class='del'>-	u32 reserved1;</div><div class='del'>-	hfsplus_cnid id;</div><div class='del'>-	__be32 create_date;</div><div class='del'>-	__be32 content_mod_date;</div><div class='del'>-	__be32 attribute_mod_date;</div><div class='del'>-	__be32 access_date;</div><div class='del'>-	__be32 backup_date;</div><div class='del'>-	struct hfsplus_perm permissions;</div><div class='del'>-	struct FInfo user_info;</div><div class='del'>-	struct FXInfo finder_info;</div><div class='del'>-	__be32 text_encoding;</div><div class='del'>-	u32 reserved2;</div><div class='del'>-</div><div class='del'>-	struct hfsplus_fork_raw data_fork;</div><div class='del'>-	struct hfsplus_fork_raw rsrc_fork;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* File and folder flag bits */</div><div class='del'>-#define HFSPLUS_FILE_LOCKED		0x0001</div><div class='del'>-#define HFSPLUS_FILE_THREAD_EXISTS	0x0002</div><div class='del'>-#define HFSPLUS_XATTR_EXISTS		0x0004</div><div class='del'>-#define HFSPLUS_ACL_EXISTS		0x0008</div><div class='del'>-#define HFSPLUS_HAS_FOLDER_COUNT	0x0010	/* Folder has subfolder count</div><div class='del'>-						 * (HFSX only) */</div><div class='del'>-</div><div class='del'>-/* HFS+ catalog thread (part of a cat_entry) */</div><div class='del'>-struct hfsplus_cat_thread {</div><div class='del'>-	__be16 type;</div><div class='del'>-	s16 reserved;</div><div class='del'>-	hfsplus_cnid parentID;</div><div class='del'>-	struct hfsplus_unistr nodeName;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define HFSPLUS_MIN_THREAD_SZ 10</div><div class='del'>-</div><div class='del'>-/* A data record in the catalog tree */</div><div class='del'>-typedef union {</div><div class='del'>-	__be16 type;</div><div class='del'>-	struct hfsplus_cat_folder folder;</div><div class='del'>-	struct hfsplus_cat_file file;</div><div class='del'>-	struct hfsplus_cat_thread thread;</div><div class='del'>-} __packed hfsplus_cat_entry;</div><div class='del'>-</div><div class='del'>-/* HFS+ catalog entry type */</div><div class='del'>-#define HFSPLUS_FOLDER         0x0001</div><div class='del'>-#define HFSPLUS_FILE           0x0002</div><div class='del'>-#define HFSPLUS_FOLDER_THREAD  0x0003</div><div class='del'>-#define HFSPLUS_FILE_THREAD    0x0004</div><div class='del'>-</div><div class='del'>-/* HFS+ extents tree key */</div><div class='del'>-struct hfsplus_ext_key {</div><div class='del'>-	__be16 key_len;</div><div class='del'>-	u8 fork_type;</div><div class='del'>-	u8 pad;</div><div class='del'>-	hfsplus_cnid cnid;</div><div class='del'>-	__be32 start_block;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define HFSPLUS_EXT_KEYLEN	sizeof(struct hfsplus_ext_key)</div><div class='del'>-</div><div class='del'>-#define HFSPLUS_XATTR_FINDER_INFO_NAME "com.apple.FinderInfo"</div><div class='del'>-#define HFSPLUS_XATTR_ACL_NAME "com.apple.system.Security"</div><div class='del'>-</div><div class='del'>-#define HFSPLUS_ATTR_INLINE_DATA 0x10</div><div class='del'>-#define HFSPLUS_ATTR_FORK_DATA   0x20</div><div class='del'>-#define HFSPLUS_ATTR_EXTENTS     0x30</div><div class='del'>-</div><div class='del'>-/* HFS+ attributes tree key */</div><div class='del'>-struct hfsplus_attr_key {</div><div class='del'>-	__be16 key_len;</div><div class='del'>-	__be16 pad;</div><div class='del'>-	hfsplus_cnid cnid;</div><div class='del'>-	__be32 start_block;</div><div class='del'>-	struct hfsplus_attr_unistr key_name;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define HFSPLUS_ATTR_KEYLEN	sizeof(struct hfsplus_attr_key)</div><div class='del'>-</div><div class='del'>-/* HFS+ fork data attribute */</div><div class='del'>-struct hfsplus_attr_fork_data {</div><div class='del'>-	__be32 record_type;</div><div class='del'>-	__be32 reserved;</div><div class='del'>-	struct hfsplus_fork_raw the_fork;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* HFS+ extension attribute */</div><div class='del'>-struct hfsplus_attr_extents {</div><div class='del'>-	__be32 record_type;</div><div class='del'>-	__be32 reserved;</div><div class='del'>-	struct hfsplus_extent extents;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define HFSPLUS_MAX_INLINE_DATA_SIZE 3802</div><div class='del'>-</div><div class='del'>-/* HFS+ attribute inline data */</div><div class='del'>-struct hfsplus_attr_inline_data {</div><div class='del'>-	__be32 record_type;</div><div class='del'>-	__be32 reserved1;</div><div class='del'>-	u8 reserved2[6];</div><div class='del'>-	__be16 length;</div><div class='del'>-	u8 raw_bytes[HFSPLUS_MAX_INLINE_DATA_SIZE];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* A data record in the attributes tree */</div><div class='del'>-typedef union {</div><div class='del'>-	__be32 record_type;</div><div class='del'>-	struct hfsplus_attr_fork_data fork_data;</div><div class='del'>-	struct hfsplus_attr_extents extents;</div><div class='del'>-	struct hfsplus_attr_inline_data inline_data;</div><div class='del'>-} __packed hfsplus_attr_entry;</div><div class='del'>-</div><div class='del'>-/* HFS+ generic BTree key */</div><div class='del'>-typedef union {</div><div class='del'>-	__be16 key_len;</div><div class='del'>-	struct hfsplus_cat_key cat;</div><div class='del'>-	struct hfsplus_ext_key ext;</div><div class='del'>-	struct hfsplus_attr_key attr;</div><div class='del'>-} __packed hfsplus_btree_key;</div><div class='add'>+#include &lt;linux/hfs_common.h&gt;</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/hfsplus/inode.c b/fs/hfsplus/inode.c<br/>index d08a8d1d40a4..7ae6745ca7ae 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfsplus/inode.c</a></div><div class='hunk'>@@ -23,14 +23,9 @@</div><div class='ctx'> #include "hfsplus_raw.h"</div><div class='ctx'> #include "xattr.h"</div><div class='ctx'> </div><div class='del'>-static int hfsplus_readpage(struct file *file, struct page *page)</div><div class='add'>+static int hfsplus_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	return block_read_full_page(page, hfsplus_get_block);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int hfsplus_writepage(struct page *page, struct writeback_control *wbc)</div><div class='del'>-{</div><div class='del'>-	return block_write_full_page(page, hfsplus_get_block, wbc);</div><div class='add'>+	return block_read_full_folio(folio, hfsplus_get_block);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void hfsplus_write_failed(struct address_space *mapping, loff_t to)</div><div class='hunk'>@@ -43,14 +38,14 @@ static void hfsplus_write_failed(struct address_space *mapping, loff_t to)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hfsplus_write_begin(struct file *file, struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned flags,</div><div class='del'>-			struct page **pagep, void **fsdata)</div><div class='add'>+int hfsplus_write_begin(const struct kiocb *iocb,</div><div class='add'>+			struct address_space *mapping, loff_t pos,</div><div class='add'>+			unsigned len, struct folio **foliop,</div><div class='add'>+			void **fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	*pagep = NULL;</div><div class='del'>-	ret = cont_write_begin(file, mapping, pos, len, flags, pagep, fsdata,</div><div class='add'>+	ret = cont_write_begin(iocb, mapping, pos, len, foliop, fsdata,</div><div class='ctx'> 				hfsplus_get_block,</div><div class='ctx'> 				&amp;HFSPLUS_I(mapping-&gt;host)-&gt;phys_size);</div><div class='ctx'> 	if (unlikely(ret))</div><div class='hunk'>@@ -64,14 +59,15 @@ static sector_t hfsplus_bmap(struct address_space *mapping, sector_t block)</div><div class='ctx'> 	return generic_block_bmap(mapping, block, hfsplus_get_block);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hfsplus_releasepage(struct page *page, gfp_t mask)</div><div class='add'>+static bool hfsplus_release_folio(struct folio *folio, gfp_t mask)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	struct hfs_btree *tree;</div><div class='ctx'> 	struct hfs_bnode *node;</div><div class='ctx'> 	u32 nidx;</div><div class='del'>-	int i, res = 1;</div><div class='add'>+	int i;</div><div class='add'>+	bool res = true;</div><div class='ctx'> </div><div class='ctx'> 	switch (inode-&gt;i_ino) {</div><div class='ctx'> 	case HFSPLUS_EXT_CNID:</div><div class='hunk'>@@ -85,26 +81,26 @@ static int hfsplus_releasepage(struct page *page, gfp_t mask)</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		BUG();</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!tree)</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> 	if (tree-&gt;node_size &gt;= PAGE_SIZE) {</div><div class='del'>-		nidx = page-&gt;index &gt;&gt;</div><div class='add'>+		nidx = folio-&gt;index &gt;&gt;</div><div class='ctx'> 			(tree-&gt;node_size_shift - PAGE_SHIFT);</div><div class='ctx'> 		spin_lock(&amp;tree-&gt;hash_lock);</div><div class='ctx'> 		node = hfs_bnode_findhash(tree, nidx);</div><div class='ctx'> 		if (!node)</div><div class='ctx'> 			;</div><div class='ctx'> 		else if (atomic_read(&amp;node-&gt;refcnt))</div><div class='del'>-			res = 0;</div><div class='add'>+			res = false;</div><div class='ctx'> 		if (res &amp;&amp; node) {</div><div class='ctx'> 			hfs_bnode_unhash(node);</div><div class='ctx'> 			hfs_bnode_free(node);</div><div class='ctx'> 		}</div><div class='ctx'> 		spin_unlock(&amp;tree-&gt;hash_lock);</div><div class='ctx'> 	} else {</div><div class='del'>-		nidx = page-&gt;index &lt;&lt;</div><div class='add'>+		nidx = folio-&gt;index &lt;&lt;</div><div class='ctx'> 			(PAGE_SHIFT - tree-&gt;node_size_shift);</div><div class='ctx'> 		i = 1 &lt;&lt; (PAGE_SHIFT - tree-&gt;node_size_shift);</div><div class='ctx'> 		spin_lock(&amp;tree-&gt;hash_lock);</div><div class='hunk'>@@ -113,7 +109,7 @@ static int hfsplus_releasepage(struct page *page, gfp_t mask)</div><div class='ctx'> 			if (!node)</div><div class='ctx'> 				continue;</div><div class='ctx'> 			if (atomic_read(&amp;node-&gt;refcnt)) {</div><div class='del'>-				res = 0;</div><div class='add'>+				res = false;</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> 			hfs_bnode_unhash(node);</div><div class='hunk'>@@ -121,7 +117,7 @@ static int hfsplus_releasepage(struct page *page, gfp_t mask)</div><div class='ctx'> 		} while (--i &amp;&amp; nidx &lt; tree-&gt;node_count);</div><div class='ctx'> 		spin_unlock(&amp;tree-&gt;hash_lock);</div><div class='ctx'> 	}</div><div class='del'>-	return res ? try_to_free_buffers(page) : 0;</div><div class='add'>+	return res ? try_to_free_buffers(folio) : false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t hfsplus_direct_IO(struct kiocb *iocb, struct iov_iter *iter)</div><div class='hunk'>@@ -156,24 +152,27 @@ static int hfsplus_writepages(struct address_space *mapping,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations hfsplus_btree_aops = {</div><div class='del'>-	.set_page_dirty	= __set_page_dirty_buffers,</div><div class='del'>-	.readpage	= hfsplus_readpage,</div><div class='del'>-	.writepage	= hfsplus_writepage,</div><div class='add'>+	.dirty_folio	= block_dirty_folio,</div><div class='add'>+	.invalidate_folio = block_invalidate_folio,</div><div class='add'>+	.read_folio	= hfsplus_read_folio,</div><div class='add'>+	.writepages	= hfsplus_writepages,</div><div class='ctx'> 	.write_begin	= hfsplus_write_begin,</div><div class='ctx'> 	.write_end	= generic_write_end,</div><div class='add'>+	.migrate_folio	= buffer_migrate_folio,</div><div class='ctx'> 	.bmap		= hfsplus_bmap,</div><div class='del'>-	.releasepage	= hfsplus_releasepage,</div><div class='add'>+	.release_folio	= hfsplus_release_folio,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations hfsplus_aops = {</div><div class='del'>-	.set_page_dirty	= __set_page_dirty_buffers,</div><div class='del'>-	.readpage	= hfsplus_readpage,</div><div class='del'>-	.writepage	= hfsplus_writepage,</div><div class='add'>+	.dirty_folio	= block_dirty_folio,</div><div class='add'>+	.invalidate_folio = block_invalidate_folio,</div><div class='add'>+	.read_folio	= hfsplus_read_folio,</div><div class='ctx'> 	.write_begin	= hfsplus_write_begin,</div><div class='ctx'> 	.write_end	= generic_write_end,</div><div class='ctx'> 	.bmap		= hfsplus_bmap,</div><div class='ctx'> 	.direct_IO	= hfsplus_direct_IO,</div><div class='ctx'> 	.writepages	= hfsplus_writepages,</div><div class='add'>+	.migrate_folio	= buffer_migrate_folio,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct dentry_operations hfsplus_dentry_operations = {</div><div class='hunk'>@@ -181,20 +180,36 @@ const struct dentry_operations hfsplus_dentry_operations = {</div><div class='ctx'> 	.d_compare    = hfsplus_compare_dentry,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static void hfsplus_get_perms(struct inode *inode,</div><div class='del'>-		struct hfsplus_perm *perms, int dir)</div><div class='add'>+static int hfsplus_get_perms(struct inode *inode,</div><div class='add'>+			     struct hfsplus_perm *perms, int dir)</div><div class='ctx'> {</div><div class='ctx'> 	struct hfsplus_sb_info *sbi = HFSPLUS_SB(inode-&gt;i_sb);</div><div class='ctx'> 	u16 mode;</div><div class='ctx'> </div><div class='ctx'> 	mode = be16_to_cpu(perms-&gt;mode);</div><div class='add'>+	if (dir) {</div><div class='add'>+		if (mode &amp;&amp; !S_ISDIR(mode))</div><div class='add'>+			goto bad_type;</div><div class='add'>+	} else if (mode) {</div><div class='add'>+		switch (mode &amp; S_IFMT) {</div><div class='add'>+		case S_IFREG:</div><div class='add'>+		case S_IFLNK:</div><div class='add'>+		case S_IFCHR:</div><div class='add'>+		case S_IFBLK:</div><div class='add'>+		case S_IFIFO:</div><div class='add'>+		case S_IFSOCK:</div><div class='add'>+			break;</div><div class='add'>+		default:</div><div class='add'>+			goto bad_type;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	i_uid_write(inode, be32_to_cpu(perms-&gt;owner));</div><div class='del'>-	if (!i_uid_read(inode) &amp;&amp; !mode)</div><div class='add'>+	if ((test_bit(HFSPLUS_SB_UID, &amp;sbi-&gt;flags)) || (!i_uid_read(inode) &amp;&amp; !mode))</div><div class='ctx'> 		inode-&gt;i_uid = sbi-&gt;uid;</div><div class='ctx'> </div><div class='ctx'> 	i_gid_write(inode, be32_to_cpu(perms-&gt;group));</div><div class='del'>-	if (!i_gid_read(inode) &amp;&amp; !mode)</div><div class='add'>+	if ((test_bit(HFSPLUS_SB_GID, &amp;sbi-&gt;flags)) || (!i_gid_read(inode) &amp;&amp; !mode))</div><div class='ctx'> 		inode-&gt;i_gid = sbi-&gt;gid;</div><div class='ctx'> </div><div class='ctx'> 	if (dir) {</div><div class='hunk'>@@ -213,6 +228,10 @@ static void hfsplus_get_perms(struct inode *inode,</div><div class='ctx'> 		inode-&gt;i_flags |= S_APPEND;</div><div class='ctx'> 	else</div><div class='ctx'> 		inode-&gt;i_flags &amp;= ~S_APPEND;</div><div class='add'>+	return 0;</div><div class='add'>+bad_type:</div><div class='add'>+	pr_err("invalid file type 0%04o for inode %lu\n", mode, inode-&gt;i_ino);</div><div class='add'>+	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int hfsplus_file_open(struct inode *inode, struct file *file)</div><div class='hunk'>@@ -244,13 +263,13 @@ static int hfsplus_file_release(struct inode *inode, struct file *file)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hfsplus_setattr(struct user_namespace *mnt_userns,</div><div class='add'>+static int hfsplus_setattr(struct mnt_idmap *idmap,</div><div class='ctx'> 			   struct dentry *dentry, struct iattr *attr)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	error = setattr_prepare(&amp;init_user_ns, dentry, attr);</div><div class='add'>+	error = setattr_prepare(&amp;nop_mnt_idmap, dentry, attr);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='hunk'>@@ -265,16 +284,16 @@ static int hfsplus_setattr(struct user_namespace *mnt_userns,</div><div class='ctx'> 		}</div><div class='ctx'> 		truncate_setsize(inode, attr-&gt;ia_size);</div><div class='ctx'> 		hfsplus_file_truncate(inode);</div><div class='del'>-		inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+		inode_set_mtime_to_ts(inode, inode_set_ctime_current(inode));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	setattr_copy(&amp;init_user_ns, inode, attr);</div><div class='add'>+	setattr_copy(&amp;nop_mnt_idmap, inode, attr);</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int hfsplus_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='add'>+int hfsplus_getattr(struct mnt_idmap *idmap, const struct path *path,</div><div class='ctx'> 		    struct kstat *stat, u32 request_mask,</div><div class='ctx'> 		    unsigned int query_flags)</div><div class='ctx'> {</div><div class='hunk'>@@ -296,7 +315,7 @@ int hfsplus_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='ctx'> 	stat-&gt;attributes_mask |= STATX_ATTR_APPEND | STATX_ATTR_IMMUTABLE |</div><div class='ctx'> 				 STATX_ATTR_NODUMP;</div><div class='ctx'> </div><div class='del'>-	generic_fillattr(&amp;init_user_ns, inode, stat);</div><div class='add'>+	generic_fillattr(&amp;nop_mnt_idmap, request_mask, inode, stat);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -306,6 +325,7 @@ int hfsplus_file_fsync(struct file *file, loff_t start, loff_t end,</div><div class='ctx'> 	struct inode *inode = file-&gt;f_mapping-&gt;host;</div><div class='ctx'> 	struct hfsplus_inode_info *hip = HFSPLUS_I(inode);</div><div class='ctx'> 	struct hfsplus_sb_info *sbi = HFSPLUS_SB(inode-&gt;i_sb);</div><div class='add'>+	struct hfsplus_vh *vhdr = sbi-&gt;s_vhdr;</div><div class='ctx'> 	int error = 0, error2;</div><div class='ctx'> </div><div class='ctx'> 	error = file_write_and_wait_range(file, start, end);</div><div class='hunk'>@@ -349,6 +369,14 @@ int hfsplus_file_fsync(struct file *file, loff_t start, loff_t end,</div><div class='ctx'> 			error = error2;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	mutex_lock(&amp;sbi-&gt;vh_mutex);</div><div class='add'>+	hfsplus_prepare_volume_header_for_commit(vhdr);</div><div class='add'>+	mutex_unlock(&amp;sbi-&gt;vh_mutex);</div><div class='add'>+</div><div class='add'>+	error2 = hfsplus_commit_superblock(inode-&gt;i_sb);</div><div class='add'>+	if (!error)</div><div class='add'>+		error = error2;</div><div class='add'>+</div><div class='ctx'> 	if (!test_bit(HFSPLUS_SB_NOBARRIER, &amp;sbi-&gt;flags))</div><div class='ctx'> 		blkdev_issue_flush(inode-&gt;i_sb-&gt;s_bdev);</div><div class='ctx'> </div><div class='hunk'>@@ -369,8 +397,9 @@ static const struct file_operations hfsplus_file_operations = {</div><div class='ctx'> 	.llseek		= generic_file_llseek,</div><div class='ctx'> 	.read_iter	= generic_file_read_iter,</div><div class='ctx'> 	.write_iter	= generic_file_write_iter,</div><div class='del'>-	.mmap		= generic_file_mmap,</div><div class='del'>-	.splice_read	= generic_file_splice_read,</div><div class='add'>+	.mmap_prepare	= generic_file_mmap_prepare,</div><div class='add'>+	.splice_read	= filemap_splice_read,</div><div class='add'>+	.splice_write	= iter_file_splice_write,</div><div class='ctx'> 	.fsync		= hfsplus_file_fsync,</div><div class='ctx'> 	.open		= hfsplus_file_open,</div><div class='ctx'> 	.release	= hfsplus_file_release,</div><div class='hunk'>@@ -388,9 +417,9 @@ struct inode *hfsplus_new_inode(struct super_block *sb, struct inode *dir,</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_ino = sbi-&gt;next_cnid++;</div><div class='del'>-	inode_init_owner(&amp;init_user_ns, inode, dir, mode);</div><div class='add'>+	inode_init_owner(&amp;nop_mnt_idmap, inode, dir, mode);</div><div class='ctx'> 	set_nlink(inode, 1);</div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_atime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	simple_inode_init_ts(inode);</div><div class='ctx'> </div><div class='ctx'> 	hip = HFSPLUS_I(inode);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;hip-&gt;open_dir_list);</div><div class='hunk'>@@ -509,15 +538,23 @@ int hfsplus_cat_read_inode(struct inode *inode, struct hfs_find_data *fd)</div><div class='ctx'> 	if (type == HFSPLUS_FOLDER) {</div><div class='ctx'> 		struct hfsplus_cat_folder *folder = &amp;entry.folder;</div><div class='ctx'> </div><div class='del'>-		WARN_ON(fd-&gt;entrylength &lt; sizeof(struct hfsplus_cat_folder));</div><div class='add'>+		if (fd-&gt;entrylength &lt; sizeof(struct hfsplus_cat_folder)) {</div><div class='add'>+			pr_err("bad catalog folder entry\n");</div><div class='add'>+			res = -EIO;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> 		hfs_bnode_read(fd-&gt;bnode, &amp;entry, fd-&gt;entryoffset,</div><div class='ctx'> 					sizeof(struct hfsplus_cat_folder));</div><div class='del'>-		hfsplus_get_perms(inode, &amp;folder-&gt;permissions, 1);</div><div class='add'>+		res = hfsplus_get_perms(inode, &amp;folder-&gt;permissions, 1);</div><div class='add'>+		if (res)</div><div class='add'>+			goto out;</div><div class='ctx'> 		set_nlink(inode, 1);</div><div class='ctx'> 		inode-&gt;i_size = 2 + be32_to_cpu(folder-&gt;valence);</div><div class='del'>-		inode-&gt;i_atime = hfsp_mt2ut(folder-&gt;access_date);</div><div class='del'>-		inode-&gt;i_mtime = hfsp_mt2ut(folder-&gt;content_mod_date);</div><div class='del'>-		inode-&gt;i_ctime = hfsp_mt2ut(folder-&gt;attribute_mod_date);</div><div class='add'>+		inode_set_atime_to_ts(inode, hfsp_mt2ut(folder-&gt;access_date));</div><div class='add'>+		inode_set_mtime_to_ts(inode,</div><div class='add'>+				      hfsp_mt2ut(folder-&gt;content_mod_date));</div><div class='add'>+		inode_set_ctime_to_ts(inode,</div><div class='add'>+				      hfsp_mt2ut(folder-&gt;attribute_mod_date));</div><div class='ctx'> 		HFSPLUS_I(inode)-&gt;create_date = folder-&gt;create_date;</div><div class='ctx'> 		HFSPLUS_I(inode)-&gt;fs_blocks = 0;</div><div class='ctx'> 		if (folder-&gt;flags &amp; cpu_to_be16(HFSPLUS_HAS_FOLDER_COUNT)) {</div><div class='hunk'>@@ -529,13 +566,19 @@ int hfsplus_cat_read_inode(struct inode *inode, struct hfs_find_data *fd)</div><div class='ctx'> 	} else if (type == HFSPLUS_FILE) {</div><div class='ctx'> 		struct hfsplus_cat_file *file = &amp;entry.file;</div><div class='ctx'> </div><div class='del'>-		WARN_ON(fd-&gt;entrylength &lt; sizeof(struct hfsplus_cat_file));</div><div class='add'>+		if (fd-&gt;entrylength &lt; sizeof(struct hfsplus_cat_file)) {</div><div class='add'>+			pr_err("bad catalog file entry\n");</div><div class='add'>+			res = -EIO;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> 		hfs_bnode_read(fd-&gt;bnode, &amp;entry, fd-&gt;entryoffset,</div><div class='ctx'> 					sizeof(struct hfsplus_cat_file));</div><div class='ctx'> </div><div class='ctx'> 		hfsplus_inode_read_fork(inode, HFSPLUS_IS_RSRC(inode) ?</div><div class='ctx'> 					&amp;file-&gt;rsrc_fork : &amp;file-&gt;data_fork);</div><div class='del'>-		hfsplus_get_perms(inode, &amp;file-&gt;permissions, 0);</div><div class='add'>+		res = hfsplus_get_perms(inode, &amp;file-&gt;permissions, 0);</div><div class='add'>+		if (res)</div><div class='add'>+			goto out;</div><div class='ctx'> 		set_nlink(inode, 1);</div><div class='ctx'> 		if (S_ISREG(inode-&gt;i_mode)) {</div><div class='ctx'> 			if (file-&gt;permissions.dev)</div><div class='hunk'>@@ -552,14 +595,17 @@ int hfsplus_cat_read_inode(struct inode *inode, struct hfs_find_data *fd)</div><div class='ctx'> 			init_special_inode(inode, inode-&gt;i_mode,</div><div class='ctx'> 					   be32_to_cpu(file-&gt;permissions.dev));</div><div class='ctx'> 		}</div><div class='del'>-		inode-&gt;i_atime = hfsp_mt2ut(file-&gt;access_date);</div><div class='del'>-		inode-&gt;i_mtime = hfsp_mt2ut(file-&gt;content_mod_date);</div><div class='del'>-		inode-&gt;i_ctime = hfsp_mt2ut(file-&gt;attribute_mod_date);</div><div class='add'>+		inode_set_atime_to_ts(inode, hfsp_mt2ut(file-&gt;access_date));</div><div class='add'>+		inode_set_mtime_to_ts(inode,</div><div class='add'>+				      hfsp_mt2ut(file-&gt;content_mod_date));</div><div class='add'>+		inode_set_ctime_to_ts(inode,</div><div class='add'>+				      hfsp_mt2ut(file-&gt;attribute_mod_date));</div><div class='ctx'> 		HFSPLUS_I(inode)-&gt;create_date = file-&gt;create_date;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		pr_err("bad catalog entry used to create inode\n");</div><div class='ctx'> 		res = -EIO;</div><div class='ctx'> 	}</div><div class='add'>+out:</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -568,6 +614,7 @@ int hfsplus_cat_write_inode(struct inode *inode)</div><div class='ctx'> 	struct inode *main_inode = inode;</div><div class='ctx'> 	struct hfs_find_data fd;</div><div class='ctx'> 	hfsplus_cat_entry entry;</div><div class='add'>+	int res = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (HFSPLUS_IS_RSRC(inode))</div><div class='ctx'> 		main_inode = HFSPLUS_I(inode)-&gt;rsrc_inode;</div><div class='hunk'>@@ -586,14 +633,18 @@ int hfsplus_cat_write_inode(struct inode *inode)</div><div class='ctx'> 	if (S_ISDIR(main_inode-&gt;i_mode)) {</div><div class='ctx'> 		struct hfsplus_cat_folder *folder = &amp;entry.folder;</div><div class='ctx'> </div><div class='del'>-		WARN_ON(fd.entrylength &lt; sizeof(struct hfsplus_cat_folder));</div><div class='add'>+		if (fd.entrylength &lt; sizeof(struct hfsplus_cat_folder)) {</div><div class='add'>+			pr_err("bad catalog folder entry\n");</div><div class='add'>+			res = -EIO;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> 		hfs_bnode_read(fd.bnode, &amp;entry, fd.entryoffset,</div><div class='ctx'> 					sizeof(struct hfsplus_cat_folder));</div><div class='ctx'> 		/* simple node checks? */</div><div class='ctx'> 		hfsplus_cat_set_perms(inode, &amp;folder-&gt;permissions);</div><div class='del'>-		folder-&gt;access_date = hfsp_ut2mt(inode-&gt;i_atime);</div><div class='del'>-		folder-&gt;content_mod_date = hfsp_ut2mt(inode-&gt;i_mtime);</div><div class='del'>-		folder-&gt;attribute_mod_date = hfsp_ut2mt(inode-&gt;i_ctime);</div><div class='add'>+		folder-&gt;access_date = hfsp_ut2mt(inode_get_atime(inode));</div><div class='add'>+		folder-&gt;content_mod_date = hfsp_ut2mt(inode_get_mtime(inode));</div><div class='add'>+		folder-&gt;attribute_mod_date = hfsp_ut2mt(inode_get_ctime(inode));</div><div class='ctx'> 		folder-&gt;valence = cpu_to_be32(inode-&gt;i_size - 2);</div><div class='ctx'> 		if (folder-&gt;flags &amp; cpu_to_be16(HFSPLUS_HAS_FOLDER_COUNT)) {</div><div class='ctx'> 			folder-&gt;subfolders =</div><div class='hunk'>@@ -611,7 +662,11 @@ int hfsplus_cat_write_inode(struct inode *inode)</div><div class='ctx'> 	} else {</div><div class='ctx'> 		struct hfsplus_cat_file *file = &amp;entry.file;</div><div class='ctx'> </div><div class='del'>-		WARN_ON(fd.entrylength &lt; sizeof(struct hfsplus_cat_file));</div><div class='add'>+		if (fd.entrylength &lt; sizeof(struct hfsplus_cat_file)) {</div><div class='add'>+			pr_err("bad catalog file entry\n");</div><div class='add'>+			res = -EIO;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> 		hfs_bnode_read(fd.bnode, &amp;entry, fd.entryoffset,</div><div class='ctx'> 					sizeof(struct hfsplus_cat_file));</div><div class='ctx'> 		hfsplus_inode_write_fork(inode, &amp;file-&gt;data_fork);</div><div class='hunk'>@@ -622,9 +677,9 @@ int hfsplus_cat_write_inode(struct inode *inode)</div><div class='ctx'> 			file-&gt;flags |= cpu_to_be16(HFSPLUS_FILE_LOCKED);</div><div class='ctx'> 		else</div><div class='ctx'> 			file-&gt;flags &amp;= cpu_to_be16(~HFSPLUS_FILE_LOCKED);</div><div class='del'>-		file-&gt;access_date = hfsp_ut2mt(inode-&gt;i_atime);</div><div class='del'>-		file-&gt;content_mod_date = hfsp_ut2mt(inode-&gt;i_mtime);</div><div class='del'>-		file-&gt;attribute_mod_date = hfsp_ut2mt(inode-&gt;i_ctime);</div><div class='add'>+		file-&gt;access_date = hfsp_ut2mt(inode_get_atime(inode));</div><div class='add'>+		file-&gt;content_mod_date = hfsp_ut2mt(inode_get_mtime(inode));</div><div class='add'>+		file-&gt;attribute_mod_date = hfsp_ut2mt(inode_get_ctime(inode));</div><div class='ctx'> 		hfs_bnode_write(fd.bnode, &amp;entry, fd.entryoffset,</div><div class='ctx'> 					 sizeof(struct hfsplus_cat_file));</div><div class='ctx'> 	}</div><div class='hunk'>@@ -632,10 +687,10 @@ int hfsplus_cat_write_inode(struct inode *inode)</div><div class='ctx'> 	set_bit(HFSPLUS_I_CAT_DIRTY, &amp;HFSPLUS_I(inode)-&gt;flags);</div><div class='ctx'> out:</div><div class='ctx'> 	hfs_find_exit(&amp;fd);</div><div class='del'>-	return 0;</div><div class='add'>+	return res;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int hfsplus_fileattr_get(struct dentry *dentry, struct fileattr *fa)</div><div class='add'>+int hfsplus_fileattr_get(struct dentry *dentry, struct file_kattr *fa)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	struct hfsplus_inode_info *hip = HFSPLUS_I(inode);</div><div class='hunk'>@@ -653,8 +708,8 @@ int hfsplus_fileattr_get(struct dentry *dentry, struct fileattr *fa)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int hfsplus_fileattr_set(struct user_namespace *mnt_userns,</div><div class='del'>-			 struct dentry *dentry, struct fileattr *fa)</div><div class='add'>+int hfsplus_fileattr_set(struct mnt_idmap *idmap,</div><div class='add'>+			 struct dentry *dentry, struct file_kattr *fa)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	struct hfsplus_inode_info *hip = HFSPLUS_I(inode);</div><div class='hunk'>@@ -680,7 +735,7 @@ int hfsplus_fileattr_set(struct user_namespace *mnt_userns,</div><div class='ctx'> 	else</div><div class='ctx'> 		hip-&gt;userflags &amp;= ~HFSPLUS_FLG_NODUMP;</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='head'>diff --git a/fs/hfsplus/ioctl.c b/fs/hfsplus/ioctl.c<br/>index 5661a2e24d03..40d04dba13ac 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/ioctl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/ioctl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/ioctl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfsplus/ioctl.c</a></div><div class='hunk'>@@ -40,7 +40,7 @@ static int hfsplus_ioctl_bless(struct file *file, int __user *user_flags)</div><div class='ctx'> </div><div class='ctx'> 	/* Directory containing the bootable system */</div><div class='ctx'> 	vh-&gt;finder_info[0] = bvh-&gt;finder_info[0] =</div><div class='del'>-		cpu_to_be32(parent_ino(dentry));</div><div class='add'>+		cpu_to_be32(d_parent_ino(dentry));</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Bootloader. Just using the inode here breaks in the case of</div><div class='hunk'>@@ -51,7 +51,7 @@ static int hfsplus_ioctl_bless(struct file *file, int __user *user_flags)</div><div class='ctx'> </div><div class='ctx'> 	/* Per spec, the OS X system folder - same as finder_info[0] here */</div><div class='ctx'> 	vh-&gt;finder_info[5] = bvh-&gt;finder_info[5] =</div><div class='del'>-		cpu_to_be32(parent_ino(dentry));</div><div class='add'>+		cpu_to_be32(d_parent_ino(dentry));</div><div class='ctx'> </div><div class='ctx'> 	mutex_unlock(&amp;sbi-&gt;vh_mutex);</div><div class='ctx'> 	return 0;</div><div class='head'>diff --git a/fs/hfsplus/options.c b/fs/hfsplus/options.c<br/>index 047e05c57560..9b377481f397 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/options.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/options.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/options.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfsplus/options.c</a></div><div class='hunk'>@@ -12,7 +12,9 @@</div><div class='ctx'> #include &lt;linux/string.h&gt;</div><div class='ctx'> #include &lt;linux/kernel.h&gt;</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='del'>-#include &lt;linux/parser.h&gt;</div><div class='add'>+#include &lt;linux/fs_struct.h&gt;</div><div class='add'>+#include &lt;linux/fs_context.h&gt;</div><div class='add'>+#include &lt;linux/fs_parser.h&gt;</div><div class='ctx'> #include &lt;linux/nls.h&gt;</div><div class='ctx'> #include &lt;linux/mount.h&gt;</div><div class='ctx'> #include &lt;linux/seq_file.h&gt;</div><div class='hunk'>@@ -23,26 +25,23 @@ enum {</div><div class='ctx'> 	opt_creator, opt_type,</div><div class='ctx'> 	opt_umask, opt_uid, opt_gid,</div><div class='ctx'> 	opt_part, opt_session, opt_nls,</div><div class='del'>-	opt_nodecompose, opt_decompose,</div><div class='del'>-	opt_barrier, opt_nobarrier,</div><div class='del'>-	opt_force, opt_err</div><div class='add'>+	opt_decompose, opt_barrier,</div><div class='add'>+	opt_force,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static const match_table_t tokens = {</div><div class='del'>-	{ opt_creator, "creator=%s" },</div><div class='del'>-	{ opt_type, "type=%s" },</div><div class='del'>-	{ opt_umask, "umask=%o" },</div><div class='del'>-	{ opt_uid, "uid=%u" },</div><div class='del'>-	{ opt_gid, "gid=%u" },</div><div class='del'>-	{ opt_part, "part=%u" },</div><div class='del'>-	{ opt_session, "session=%u" },</div><div class='del'>-	{ opt_nls, "nls=%s" },</div><div class='del'>-	{ opt_decompose, "decompose" },</div><div class='del'>-	{ opt_nodecompose, "nodecompose" },</div><div class='del'>-	{ opt_barrier, "barrier" },</div><div class='del'>-	{ opt_nobarrier, "nobarrier" },</div><div class='del'>-	{ opt_force, "force" },</div><div class='del'>-	{ opt_err, NULL }</div><div class='add'>+static const struct fs_parameter_spec hfs_param_spec[] = {</div><div class='add'>+	fsparam_string	("creator",	opt_creator),</div><div class='add'>+	fsparam_string	("type",	opt_type),</div><div class='add'>+	fsparam_u32oct	("umask",	opt_umask),</div><div class='add'>+	fsparam_u32	("uid",		opt_uid),</div><div class='add'>+	fsparam_u32	("gid",		opt_gid),</div><div class='add'>+	fsparam_u32	("part",	opt_part),</div><div class='add'>+	fsparam_u32	("session",	opt_session),</div><div class='add'>+	fsparam_string	("nls",		opt_nls),</div><div class='add'>+	fsparam_flag_no	("decompose",	opt_decompose),</div><div class='add'>+	fsparam_flag_no	("barrier",	opt_barrier),</div><div class='add'>+	fsparam_flag	("force",	opt_force),</div><div class='add'>+	{}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /* Initialize an options object to reasonable defaults */</div><div class='hunk'>@@ -60,158 +59,89 @@ void hfsplus_fill_defaults(struct hfsplus_sb_info *opts)</div><div class='ctx'> 	opts-&gt;session = -1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* convert a "four byte character" to a 32 bit int with error checks */</div><div class='del'>-static inline int match_fourchar(substring_t *arg, u32 *result)</div><div class='add'>+/* Parse options from mount. Returns nonzero errno on failure */</div><div class='add'>+int hfsplus_parse_param(struct fs_context *fc, struct fs_parameter *param)</div><div class='ctx'> {</div><div class='del'>-	if (arg-&gt;to - arg-&gt;from != 4)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	memcpy(result, arg-&gt;from, 4);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int hfsplus_parse_options_remount(char *input, int *force)</div><div class='del'>-{</div><div class='del'>-	char *p;</div><div class='del'>-	substring_t args[MAX_OPT_ARGS];</div><div class='del'>-	int token;</div><div class='del'>-</div><div class='del'>-	if (!input)</div><div class='del'>-		return 1;</div><div class='del'>-</div><div class='del'>-	while ((p = strsep(&amp;input, ",")) != NULL) {</div><div class='del'>-		if (!*p)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		token = match_token(p, tokens, args);</div><div class='del'>-		switch (token) {</div><div class='del'>-		case opt_force:</div><div class='del'>-			*force = 1;</div><div class='del'>-			break;</div><div class='del'>-		default:</div><div class='del'>-			break;</div><div class='add'>+	struct hfsplus_sb_info *sbi = fc-&gt;s_fs_info;</div><div class='add'>+	struct fs_parse_result result;</div><div class='add'>+	int opt;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Only the force option is examined during remount, all others</div><div class='add'>+	 * are ignored.</div><div class='add'>+	 */</div><div class='add'>+	if (fc-&gt;purpose == FS_CONTEXT_FOR_RECONFIGURE &amp;&amp;</div><div class='add'>+	    strncmp(param-&gt;key, "force", 5))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	opt = fs_parse(fc, hfs_param_spec, param, &amp;result);</div><div class='add'>+	if (opt &lt; 0)</div><div class='add'>+		return opt;</div><div class='add'>+</div><div class='add'>+	switch (opt) {</div><div class='add'>+	case opt_creator:</div><div class='add'>+		if (strlen(param-&gt;string) != 4) {</div><div class='add'>+			pr_err("creator requires a 4 character value\n");</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return 1;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* Parse options from mount. Returns 0 on failure */</div><div class='del'>-/* input is the options passed to mount() as a string */</div><div class='del'>-int hfsplus_parse_options(char *input, struct hfsplus_sb_info *sbi)</div><div class='del'>-{</div><div class='del'>-	char *p;</div><div class='del'>-	substring_t args[MAX_OPT_ARGS];</div><div class='del'>-	int tmp, token;</div><div class='del'>-</div><div class='del'>-	if (!input)</div><div class='del'>-		goto done;</div><div class='del'>-</div><div class='del'>-	while ((p = strsep(&amp;input, ",")) != NULL) {</div><div class='del'>-		if (!*p)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		token = match_token(p, tokens, args);</div><div class='del'>-		switch (token) {</div><div class='del'>-		case opt_creator:</div><div class='del'>-			if (match_fourchar(&amp;args[0], &amp;sbi-&gt;creator)) {</div><div class='del'>-				pr_err("creator requires a 4 character value\n");</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		case opt_type:</div><div class='del'>-			if (match_fourchar(&amp;args[0], &amp;sbi-&gt;type)) {</div><div class='del'>-				pr_err("type requires a 4 character value\n");</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		case opt_umask:</div><div class='del'>-			if (match_octal(&amp;args[0], &amp;tmp)) {</div><div class='del'>-				pr_err("umask requires a value\n");</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			sbi-&gt;umask = (umode_t)tmp;</div><div class='del'>-			break;</div><div class='del'>-		case opt_uid:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;tmp)) {</div><div class='del'>-				pr_err("uid requires an argument\n");</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			sbi-&gt;uid = make_kuid(current_user_ns(), (uid_t)tmp);</div><div class='del'>-			if (!uid_valid(sbi-&gt;uid)) {</div><div class='del'>-				pr_err("invalid uid specified\n");</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		case opt_gid:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;tmp)) {</div><div class='del'>-				pr_err("gid requires an argument\n");</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			sbi-&gt;gid = make_kgid(current_user_ns(), (gid_t)tmp);</div><div class='del'>-			if (!gid_valid(sbi-&gt;gid)) {</div><div class='del'>-				pr_err("invalid gid specified\n");</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		case opt_part:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;sbi-&gt;part)) {</div><div class='del'>-				pr_err("part requires an argument\n");</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		case opt_session:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;sbi-&gt;session)) {</div><div class='del'>-				pr_err("session requires an argument\n");</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		case opt_nls:</div><div class='del'>-			if (sbi-&gt;nls) {</div><div class='del'>-				pr_err("unable to change nls mapping\n");</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			p = match_strdup(&amp;args[0]);</div><div class='del'>-			if (p)</div><div class='del'>-				sbi-&gt;nls = load_nls(p);</div><div class='del'>-			if (!sbi-&gt;nls) {</div><div class='del'>-				pr_err("unable to load nls mapping \"%s\"\n",</div><div class='del'>-				       p);</div><div class='del'>-				kfree(p);</div><div class='del'>-				return 0;</div><div class='del'>-			}</div><div class='del'>-			kfree(p);</div><div class='del'>-			break;</div><div class='del'>-		case opt_decompose:</div><div class='del'>-			clear_bit(HFSPLUS_SB_NODECOMPOSE, &amp;sbi-&gt;flags);</div><div class='del'>-			break;</div><div class='del'>-		case opt_nodecompose:</div><div class='add'>+		memcpy(&amp;sbi-&gt;creator, param-&gt;string, 4);</div><div class='add'>+		break;</div><div class='add'>+	case opt_type:</div><div class='add'>+		if (strlen(param-&gt;string) != 4) {</div><div class='add'>+			pr_err("type requires a 4 character value\n");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		memcpy(&amp;sbi-&gt;type, param-&gt;string, 4);</div><div class='add'>+		break;</div><div class='add'>+	case opt_umask:</div><div class='add'>+		sbi-&gt;umask = (umode_t)result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case opt_uid:</div><div class='add'>+		sbi-&gt;uid = result.uid;</div><div class='add'>+		set_bit(HFSPLUS_SB_UID, &amp;sbi-&gt;flags);</div><div class='add'>+		break;</div><div class='add'>+	case opt_gid:</div><div class='add'>+		sbi-&gt;gid = result.gid;</div><div class='add'>+		set_bit(HFSPLUS_SB_GID, &amp;sbi-&gt;flags);</div><div class='add'>+		break;</div><div class='add'>+	case opt_part:</div><div class='add'>+		sbi-&gt;part = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case opt_session:</div><div class='add'>+		sbi-&gt;session = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case opt_nls:</div><div class='add'>+		if (sbi-&gt;nls) {</div><div class='add'>+			pr_err("unable to change nls mapping\n");</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		sbi-&gt;nls = load_nls(param-&gt;string);</div><div class='add'>+		if (!sbi-&gt;nls) {</div><div class='add'>+			pr_err("unable to load nls mapping \"%s\"\n",</div><div class='add'>+			       param-&gt;string);</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='add'>+	case opt_decompose:</div><div class='add'>+		if (result.negated)</div><div class='ctx'> 			set_bit(HFSPLUS_SB_NODECOMPOSE, &amp;sbi-&gt;flags);</div><div class='del'>-			break;</div><div class='del'>-		case opt_barrier:</div><div class='del'>-			clear_bit(HFSPLUS_SB_NOBARRIER, &amp;sbi-&gt;flags);</div><div class='del'>-			break;</div><div class='del'>-		case opt_nobarrier:</div><div class='add'>+		else</div><div class='add'>+			clear_bit(HFSPLUS_SB_NODECOMPOSE, &amp;sbi-&gt;flags);</div><div class='add'>+		break;</div><div class='add'>+	case opt_barrier:</div><div class='add'>+		if (result.negated)</div><div class='ctx'> 			set_bit(HFSPLUS_SB_NOBARRIER, &amp;sbi-&gt;flags);</div><div class='del'>-			break;</div><div class='del'>-		case opt_force:</div><div class='del'>-			set_bit(HFSPLUS_SB_FORCE, &amp;sbi-&gt;flags);</div><div class='del'>-			break;</div><div class='del'>-		default:</div><div class='del'>-			return 0;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-done:</div><div class='del'>-	if (!sbi-&gt;nls) {</div><div class='del'>-		/* try utf8 first, as this is the old default behaviour */</div><div class='del'>-		sbi-&gt;nls = load_nls("utf8");</div><div class='del'>-		if (!sbi-&gt;nls)</div><div class='del'>-			sbi-&gt;nls = load_nls_default();</div><div class='del'>-		if (!sbi-&gt;nls)</div><div class='del'>-			return 0;</div><div class='add'>+		else</div><div class='add'>+			clear_bit(HFSPLUS_SB_NOBARRIER, &amp;sbi-&gt;flags);</div><div class='add'>+		break;</div><div class='add'>+	case opt_force:</div><div class='add'>+		set_bit(HFSPLUS_SB_FORCE, &amp;sbi-&gt;flags);</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return 1;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int hfsplus_show_options(struct seq_file *seq, struct dentry *root)</div><div class='head'>diff --git a/fs/hfsplus/part_tbl.c b/fs/hfsplus/part_tbl.c<br/>index 63164ebc52fa..9ec21664eda6 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/part_tbl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/part_tbl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/part_tbl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfsplus/part_tbl.c</a></div><div class='hunk'>@@ -112,8 +112,7 @@ static int hfs_parse_new_pmap(struct super_block *sb, void *buf,</div><div class='ctx'> 		if ((u8 *)pm - (u8 *)buf &gt;= buf_size) {</div><div class='ctx'> 			res = hfsplus_submit_bio(sb,</div><div class='ctx'> 						 *part_start + HFS_PMAP_BLK + i,</div><div class='del'>-						 buf, (void **)&amp;pm, REQ_OP_READ,</div><div class='del'>-						 0);</div><div class='add'>+						 buf, (void **)&amp;pm, REQ_OP_READ);</div><div class='ctx'> 			if (res)</div><div class='ctx'> 				return res;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -137,7 +136,7 @@ int hfs_part_find(struct super_block *sb,</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	res = hfsplus_submit_bio(sb, *part_start + HFS_PMAP_BLK,</div><div class='del'>-				 buf, &amp;data, REQ_OP_READ, 0);</div><div class='add'>+				 buf, &amp;data, REQ_OP_READ);</div><div class='ctx'> 	if (res)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='head'>diff --git a/fs/hfsplus/super.c b/fs/hfsplus/super.c<br/>index b9e3db3f855f..aaffa9e060a0 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/super.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/super.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/super.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfsplus/super.c</a></div><div class='hunk'>@@ -14,6 +14,7 @@</div><div class='ctx'> #include &lt;linux/blkdev.h&gt;</div><div class='ctx'> #include &lt;linux/backing-dev.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/fs_context.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/vfs.h&gt;</div><div class='ctx'> #include &lt;linux/nls.h&gt;</div><div class='hunk'>@@ -64,16 +65,29 @@ struct inode *hfsplus_iget(struct super_block *sb, unsigned long ino)</div><div class='ctx'> 	inode = iget_locked(sb, ino);</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='del'>-	if (!(inode-&gt;i_state &amp; I_NEW))</div><div class='add'>+	if (!(inode_state_read_once(inode) &amp; I_NEW))</div><div class='ctx'> 		return inode;</div><div class='ctx'> </div><div class='del'>-	INIT_LIST_HEAD(&amp;HFSPLUS_I(inode)-&gt;open_dir_list);</div><div class='del'>-	spin_lock_init(&amp;HFSPLUS_I(inode)-&gt;open_dir_lock);</div><div class='del'>-	mutex_init(&amp;HFSPLUS_I(inode)-&gt;extents_lock);</div><div class='del'>-	HFSPLUS_I(inode)-&gt;flags = 0;</div><div class='add'>+	atomic_set(&amp;HFSPLUS_I(inode)-&gt;opencnt, 0);</div><div class='add'>+	HFSPLUS_I(inode)-&gt;first_blocks = 0;</div><div class='add'>+	HFSPLUS_I(inode)-&gt;clump_blocks = 0;</div><div class='add'>+	HFSPLUS_I(inode)-&gt;alloc_blocks = 0;</div><div class='add'>+	HFSPLUS_I(inode)-&gt;cached_start = U32_MAX;</div><div class='add'>+	HFSPLUS_I(inode)-&gt;cached_blocks = 0;</div><div class='add'>+	memset(HFSPLUS_I(inode)-&gt;first_extents, 0, sizeof(hfsplus_extent_rec));</div><div class='add'>+	memset(HFSPLUS_I(inode)-&gt;cached_extents, 0, sizeof(hfsplus_extent_rec));</div><div class='ctx'> 	HFSPLUS_I(inode)-&gt;extent_state = 0;</div><div class='add'>+	mutex_init(&amp;HFSPLUS_I(inode)-&gt;extents_lock);</div><div class='ctx'> 	HFSPLUS_I(inode)-&gt;rsrc_inode = NULL;</div><div class='del'>-	atomic_set(&amp;HFSPLUS_I(inode)-&gt;opencnt, 0);</div><div class='add'>+	HFSPLUS_I(inode)-&gt;create_date = 0;</div><div class='add'>+	HFSPLUS_I(inode)-&gt;linkid = 0;</div><div class='add'>+	HFSPLUS_I(inode)-&gt;flags = 0;</div><div class='add'>+	HFSPLUS_I(inode)-&gt;fs_blocks = 0;</div><div class='add'>+	HFSPLUS_I(inode)-&gt;userflags = 0;</div><div class='add'>+	HFSPLUS_I(inode)-&gt;subfolders = 0;</div><div class='add'>+	INIT_LIST_HEAD(&amp;HFSPLUS_I(inode)-&gt;open_dir_list);</div><div class='add'>+	spin_lock_init(&amp;HFSPLUS_I(inode)-&gt;open_dir_lock);</div><div class='add'>+	HFSPLUS_I(inode)-&gt;phys_size = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (inode-&gt;i_ino &gt;= HFSPLUS_FIRSTUSER_CNID ||</div><div class='ctx'> 	    inode-&gt;i_ino == HFSPLUS_ROOT_CNID) {</div><div class='hunk'>@@ -149,7 +163,7 @@ static int hfsplus_write_inode(struct inode *inode,</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(INODE, "hfsplus_write_inode: %lu\n", inode-&gt;i_ino);</div><div class='add'>+	hfs_dbg("ino %lu\n", inode-&gt;i_ino);</div><div class='ctx'> </div><div class='ctx'> 	err = hfsplus_ext_write_extent(inode);</div><div class='ctx'> 	if (err)</div><div class='hunk'>@@ -164,7 +178,7 @@ static int hfsplus_write_inode(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> static void hfsplus_evict_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	hfs_dbg(INODE, "hfsplus_evict_inode: %lu\n", inode-&gt;i_ino);</div><div class='add'>+	hfs_dbg("ino %lu\n", inode-&gt;i_ino);</div><div class='ctx'> 	truncate_inode_pages_final(&amp;inode-&gt;i_data);</div><div class='ctx'> 	clear_inode(inode);</div><div class='ctx'> 	if (HFSPLUS_IS_RSRC(inode)) {</div><div class='hunk'>@@ -173,17 +187,62 @@ static void hfsplus_evict_inode(struct inode *inode)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hfsplus_sync_fs(struct super_block *sb, int wait)</div><div class='add'>+int hfsplus_commit_superblock(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct hfsplus_sb_info *sbi = HFSPLUS_SB(sb);</div><div class='ctx'> 	struct hfsplus_vh *vhdr = sbi-&gt;s_vhdr;</div><div class='ctx'> 	int write_backup = 0;</div><div class='add'>+	int error = 0, error2;</div><div class='add'>+</div><div class='add'>+	hfs_dbg("starting...\n");</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;sbi-&gt;vh_mutex);</div><div class='add'>+	mutex_lock(&amp;sbi-&gt;alloc_mutex);</div><div class='add'>+	vhdr-&gt;free_blocks = cpu_to_be32(sbi-&gt;free_blocks);</div><div class='add'>+	vhdr-&gt;next_cnid = cpu_to_be32(sbi-&gt;next_cnid);</div><div class='add'>+	vhdr-&gt;folder_count = cpu_to_be32(sbi-&gt;folder_count);</div><div class='add'>+	vhdr-&gt;file_count = cpu_to_be32(sbi-&gt;file_count);</div><div class='add'>+</div><div class='add'>+	hfs_dbg("free_blocks %u, next_cnid %u, folder_count %u, file_count %u\n",</div><div class='add'>+		sbi-&gt;free_blocks, sbi-&gt;next_cnid,</div><div class='add'>+		sbi-&gt;folder_count, sbi-&gt;file_count);</div><div class='add'>+</div><div class='add'>+	if (test_and_clear_bit(HFSPLUS_SB_WRITEBACKUP, &amp;sbi-&gt;flags)) {</div><div class='add'>+		memcpy(sbi-&gt;s_backup_vhdr, sbi-&gt;s_vhdr, sizeof(*sbi-&gt;s_vhdr));</div><div class='add'>+		write_backup = 1;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	error2 = hfsplus_submit_bio(sb,</div><div class='add'>+				   sbi-&gt;part_start + HFSPLUS_VOLHEAD_SECTOR,</div><div class='add'>+				   sbi-&gt;s_vhdr_buf, NULL, REQ_OP_WRITE);</div><div class='add'>+	if (!error)</div><div class='add'>+		error = error2;</div><div class='add'>+	if (!write_backup)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	error2 = hfsplus_submit_bio(sb,</div><div class='add'>+				  sbi-&gt;part_start + sbi-&gt;sect_count - 2,</div><div class='add'>+				  sbi-&gt;s_backup_vhdr_buf, NULL, REQ_OP_WRITE);</div><div class='add'>+	if (!error)</div><div class='add'>+		error = error2;</div><div class='add'>+out:</div><div class='add'>+	mutex_unlock(&amp;sbi-&gt;alloc_mutex);</div><div class='add'>+	mutex_unlock(&amp;sbi-&gt;vh_mutex);</div><div class='add'>+</div><div class='add'>+	hfs_dbg("finished: err %d\n", error);</div><div class='add'>+</div><div class='add'>+	return error;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int hfsplus_sync_fs(struct super_block *sb, int wait)</div><div class='add'>+{</div><div class='add'>+	struct hfsplus_sb_info *sbi = HFSPLUS_SB(sb);</div><div class='ctx'> 	int error, error2;</div><div class='ctx'> </div><div class='ctx'> 	if (!wait)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(SUPER, "hfsplus_sync_fs\n");</div><div class='add'>+	hfs_dbg("starting...\n");</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Explicitly write out the special metadata inodes.</div><div class='hunk'>@@ -207,40 +266,15 @@ static int hfsplus_sync_fs(struct super_block *sb, int wait)</div><div class='ctx'> 	if (!error)</div><div class='ctx'> 		error = error2;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;sbi-&gt;vh_mutex);</div><div class='del'>-	mutex_lock(&amp;sbi-&gt;alloc_mutex);</div><div class='del'>-	vhdr-&gt;free_blocks = cpu_to_be32(sbi-&gt;free_blocks);</div><div class='del'>-	vhdr-&gt;next_cnid = cpu_to_be32(sbi-&gt;next_cnid);</div><div class='del'>-	vhdr-&gt;folder_count = cpu_to_be32(sbi-&gt;folder_count);</div><div class='del'>-	vhdr-&gt;file_count = cpu_to_be32(sbi-&gt;file_count);</div><div class='del'>-</div><div class='del'>-	if (test_and_clear_bit(HFSPLUS_SB_WRITEBACKUP, &amp;sbi-&gt;flags)) {</div><div class='del'>-		memcpy(sbi-&gt;s_backup_vhdr, sbi-&gt;s_vhdr, sizeof(*sbi-&gt;s_vhdr));</div><div class='del'>-		write_backup = 1;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	error2 = hfsplus_submit_bio(sb,</div><div class='del'>-				   sbi-&gt;part_start + HFSPLUS_VOLHEAD_SECTOR,</div><div class='del'>-				   sbi-&gt;s_vhdr_buf, NULL, REQ_OP_WRITE,</div><div class='del'>-				   REQ_SYNC);</div><div class='add'>+	error2 = hfsplus_commit_superblock(sb);</div><div class='ctx'> 	if (!error)</div><div class='ctx'> 		error = error2;</div><div class='del'>-	if (!write_backup)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	error2 = hfsplus_submit_bio(sb,</div><div class='del'>-				  sbi-&gt;part_start + sbi-&gt;sect_count - 2,</div><div class='del'>-				  sbi-&gt;s_backup_vhdr_buf, NULL, REQ_OP_WRITE,</div><div class='del'>-				  REQ_SYNC);</div><div class='del'>-	if (!error)</div><div class='del'>-		error2 = error;</div><div class='del'>-out:</div><div class='del'>-	mutex_unlock(&amp;sbi-&gt;alloc_mutex);</div><div class='del'>-	mutex_unlock(&amp;sbi-&gt;vh_mutex);</div><div class='ctx'> </div><div class='ctx'> 	if (!test_bit(HFSPLUS_SB_NOBARRIER, &amp;sbi-&gt;flags))</div><div class='ctx'> 		blkdev_issue_flush(sb-&gt;s_bdev);</div><div class='ctx'> </div><div class='add'>+	hfs_dbg("finished: err %d\n", error);</div><div class='add'>+</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -277,11 +311,19 @@ void hfsplus_mark_mdb_dirty(struct super_block *sb)</div><div class='ctx'> 	spin_unlock(&amp;sbi-&gt;work_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void delayed_free(struct rcu_head *p)</div><div class='add'>+{</div><div class='add'>+	struct hfsplus_sb_info *sbi = container_of(p, struct hfsplus_sb_info, rcu);</div><div class='add'>+</div><div class='add'>+	unload_nls(sbi-&gt;nls);</div><div class='add'>+	kfree(sbi);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void hfsplus_put_super(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct hfsplus_sb_info *sbi = HFSPLUS_SB(sb);</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(SUPER, "hfsplus_put_super\n");</div><div class='add'>+	hfs_dbg("starting...\n");</div><div class='ctx'> </div><div class='ctx'> 	cancel_delayed_work_sync(&amp;sbi-&gt;sync_work);</div><div class='ctx'> </div><div class='hunk'>@@ -295,16 +337,16 @@ static void hfsplus_put_super(struct super_block *sb)</div><div class='ctx'> 		hfsplus_sync_fs(sb, 1);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	iput(sbi-&gt;alloc_file);</div><div class='add'>+	iput(sbi-&gt;hidden_dir);</div><div class='ctx'> 	hfs_btree_close(sbi-&gt;attr_tree);</div><div class='ctx'> 	hfs_btree_close(sbi-&gt;cat_tree);</div><div class='ctx'> 	hfs_btree_close(sbi-&gt;ext_tree);</div><div class='del'>-	iput(sbi-&gt;alloc_file);</div><div class='del'>-	iput(sbi-&gt;hidden_dir);</div><div class='ctx'> 	kfree(sbi-&gt;s_vhdr_buf);</div><div class='ctx'> 	kfree(sbi-&gt;s_backup_vhdr_buf);</div><div class='del'>-	unload_nls(sbi-&gt;nls);</div><div class='del'>-	kfree(sb-&gt;s_fs_info);</div><div class='del'>-	sb-&gt;s_fs_info = NULL;</div><div class='add'>+	call_rcu(&amp;sbi-&gt;rcu, delayed_free);</div><div class='add'>+</div><div class='add'>+	hfs_dbg("finished\n");</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int hfsplus_statfs(struct dentry *dentry, struct kstatfs *buf)</div><div class='hunk'>@@ -326,34 +368,33 @@ static int hfsplus_statfs(struct dentry *dentry, struct kstatfs *buf)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hfsplus_remount(struct super_block *sb, int *flags, char *data)</div><div class='add'>+static int hfsplus_reconfigure(struct fs_context *fc)</div><div class='ctx'> {</div><div class='add'>+	struct super_block *sb = fc-&gt;root-&gt;d_sb;</div><div class='add'>+</div><div class='ctx'> 	sync_filesystem(sb);</div><div class='del'>-	if ((bool)(*flags &amp; SB_RDONLY) == sb_rdonly(sb))</div><div class='add'>+	if ((bool)(fc-&gt;sb_flags &amp; SB_RDONLY) == sb_rdonly(sb))</div><div class='ctx'> 		return 0;</div><div class='del'>-	if (!(*flags &amp; SB_RDONLY)) {</div><div class='del'>-		struct hfsplus_vh *vhdr = HFSPLUS_SB(sb)-&gt;s_vhdr;</div><div class='del'>-		int force = 0;</div><div class='del'>-</div><div class='del'>-		if (!hfsplus_parse_options_remount(data, &amp;force))</div><div class='del'>-			return -EINVAL;</div><div class='add'>+	if (!(fc-&gt;sb_flags &amp; SB_RDONLY)) {</div><div class='add'>+		struct hfsplus_sb_info *sbi = HFSPLUS_SB(sb);</div><div class='add'>+		struct hfsplus_vh *vhdr = sbi-&gt;s_vhdr;</div><div class='ctx'> </div><div class='ctx'> 		if (!(vhdr-&gt;attributes &amp; cpu_to_be32(HFSPLUS_VOL_UNMNT))) {</div><div class='ctx'> 			pr_warn("filesystem was not cleanly unmounted, running fsck.hfsplus is recommended.  leaving read-only.\n");</div><div class='ctx'> 			sb-&gt;s_flags |= SB_RDONLY;</div><div class='del'>-			*flags |= SB_RDONLY;</div><div class='del'>-		} else if (force) {</div><div class='add'>+			fc-&gt;sb_flags |= SB_RDONLY;</div><div class='add'>+		} else if (test_bit(HFSPLUS_SB_FORCE, &amp;sbi-&gt;flags)) {</div><div class='ctx'> 			/* nothing */</div><div class='ctx'> 		} else if (vhdr-&gt;attributes &amp;</div><div class='ctx'> 				cpu_to_be32(HFSPLUS_VOL_SOFTLOCK)) {</div><div class='ctx'> 			pr_warn("filesystem is marked locked, leaving read-only.\n");</div><div class='ctx'> 			sb-&gt;s_flags |= SB_RDONLY;</div><div class='del'>-			*flags |= SB_RDONLY;</div><div class='add'>+			fc-&gt;sb_flags |= SB_RDONLY;</div><div class='ctx'> 		} else if (vhdr-&gt;attributes &amp;</div><div class='ctx'> 				cpu_to_be32(HFSPLUS_VOL_JOURNALED)) {</div><div class='ctx'> 			pr_warn("filesystem is marked journaled, leaving read-only.\n");</div><div class='ctx'> 			sb-&gt;s_flags |= SB_RDONLY;</div><div class='del'>-			*flags |= SB_RDONLY;</div><div class='add'>+			fc-&gt;sb_flags |= SB_RDONLY;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -367,38 +408,42 @@ static const struct super_operations hfsplus_sops = {</div><div class='ctx'> 	.put_super	= hfsplus_put_super,</div><div class='ctx'> 	.sync_fs	= hfsplus_sync_fs,</div><div class='ctx'> 	.statfs		= hfsplus_statfs,</div><div class='del'>-	.remount_fs	= hfsplus_remount,</div><div class='ctx'> 	.show_options	= hfsplus_show_options,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int hfsplus_fill_super(struct super_block *sb, void *data, int silent)</div><div class='add'>+void hfsplus_prepare_volume_header_for_commit(struct hfsplus_vh *vhdr)</div><div class='add'>+{</div><div class='add'>+	vhdr-&gt;last_mount_vers = cpu_to_be32(HFSP_MOUNT_VERSION);</div><div class='add'>+	vhdr-&gt;modify_date = hfsp_now2mt();</div><div class='add'>+	be32_add_cpu(&amp;vhdr-&gt;write_count, 1);</div><div class='add'>+	vhdr-&gt;attributes &amp;= cpu_to_be32(~HFSPLUS_VOL_UNMNT);</div><div class='add'>+	vhdr-&gt;attributes |= cpu_to_be32(HFSPLUS_VOL_INCNSTNT);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int hfsplus_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> {</div><div class='ctx'> 	struct hfsplus_vh *vhdr;</div><div class='del'>-	struct hfsplus_sb_info *sbi;</div><div class='add'>+	struct hfsplus_sb_info *sbi = HFSPLUS_SB(sb);</div><div class='ctx'> 	hfsplus_cat_entry entry;</div><div class='ctx'> 	struct hfs_find_data fd;</div><div class='ctx'> 	struct inode *root, *inode;</div><div class='ctx'> 	struct qstr str;</div><div class='del'>-	struct nls_table *nls = NULL;</div><div class='add'>+	struct nls_table *nls;</div><div class='ctx'> 	u64 last_fs_block, last_fs_page;</div><div class='add'>+	int silent = fc-&gt;sb_flags &amp; SB_SILENT;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	err = -ENOMEM;</div><div class='del'>-	sbi = kzalloc(sizeof(*sbi), GFP_KERNEL);</div><div class='del'>-	if (!sbi)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	sb-&gt;s_fs_info = sbi;</div><div class='ctx'> 	mutex_init(&amp;sbi-&gt;alloc_mutex);</div><div class='ctx'> 	mutex_init(&amp;sbi-&gt;vh_mutex);</div><div class='ctx'> 	spin_lock_init(&amp;sbi-&gt;work_lock);</div><div class='ctx'> 	INIT_DELAYED_WORK(&amp;sbi-&gt;sync_work, delayed_sync_fs);</div><div class='del'>-	hfsplus_fill_defaults(sbi);</div><div class='ctx'> </div><div class='ctx'> 	err = -EINVAL;</div><div class='del'>-	if (!hfsplus_parse_options(data, sbi)) {</div><div class='del'>-		pr_err("unable to parse mount options\n");</div><div class='del'>-		goto out_unload_nls;</div><div class='add'>+	if (!sbi-&gt;nls) {</div><div class='add'>+		/* try utf8 first, as this is the old default behaviour */</div><div class='add'>+		sbi-&gt;nls = load_nls("utf8");</div><div class='add'>+		if (!sbi-&gt;nls)</div><div class='add'>+			sbi-&gt;nls = load_nls_default();</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* temporarily use utf8 to correctly find the hidden dir below */</div><div class='hunk'>@@ -507,7 +552,7 @@ static int hfsplus_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 		goto out_put_alloc_file;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	sb-&gt;s_d_op = &amp;hfsplus_dentry_operations;</div><div class='add'>+	set_default_d_op(sb, &amp;hfsplus_dentry_operations);</div><div class='ctx'> 	sb-&gt;s_root = d_make_root(root);</div><div class='ctx'> 	if (!sb-&gt;s_root) {</div><div class='ctx'> 		err = -ENOMEM;</div><div class='hunk'>@@ -525,7 +570,7 @@ static int hfsplus_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 	if (!hfs_brec_read(&amp;fd, &amp;entry, sizeof(entry))) {</div><div class='ctx'> 		hfs_find_exit(&amp;fd);</div><div class='ctx'> 		if (entry.type != cpu_to_be16(HFSPLUS_FOLDER)) {</div><div class='del'>-			err = -EINVAL;</div><div class='add'>+			err = -EIO;</div><div class='ctx'> 			goto out_put_root;</div><div class='ctx'> 		}</div><div class='ctx'> 		inode = hfsplus_iget(sb, be32_to_cpu(entry.folder.id));</div><div class='hunk'>@@ -542,11 +587,7 @@ static int hfsplus_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 		 * H+LX == hfsplusutils, H+Lx == this driver, H+lx is unused</div><div class='ctx'> 		 * all three are registered with Apple for our use</div><div class='ctx'> 		 */</div><div class='del'>-		vhdr-&gt;last_mount_vers = cpu_to_be32(HFSP_MOUNT_VERSION);</div><div class='del'>-		vhdr-&gt;modify_date = hfsp_now2mt();</div><div class='del'>-		be32_add_cpu(&amp;vhdr-&gt;write_count, 1);</div><div class='del'>-		vhdr-&gt;attributes &amp;= cpu_to_be32(~HFSPLUS_VOL_UNMNT);</div><div class='del'>-		vhdr-&gt;attributes |= cpu_to_be32(HFSPLUS_VOL_INCNSTNT);</div><div class='add'>+		hfsplus_prepare_volume_header_for_commit(vhdr);</div><div class='ctx'> 		hfsplus_sync_fs(sb, 1);</div><div class='ctx'> </div><div class='ctx'> 		if (!sbi-&gt;hidden_dir) {</div><div class='hunk'>@@ -610,7 +651,6 @@ out_unload_nls:</div><div class='ctx'> 	unload_nls(sbi-&gt;nls);</div><div class='ctx'> 	unload_nls(nls);</div><div class='ctx'> 	kfree(sbi);</div><div class='del'>-out:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -624,7 +664,7 @@ static struct inode *hfsplus_alloc_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct hfsplus_inode_info *i;</div><div class='ctx'> </div><div class='del'>-	i = kmem_cache_alloc(hfsplus_inode_cachep, GFP_KERNEL);</div><div class='add'>+	i = alloc_inode_sb(sb, hfsplus_inode_cachep, GFP_KERNEL);</div><div class='ctx'> 	return i ? &amp;i-&gt;vfs_inode : NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -635,18 +675,46 @@ static void hfsplus_free_inode(struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> #define HFSPLUS_INODE_SIZE	sizeof(struct hfsplus_inode_info)</div><div class='ctx'> </div><div class='del'>-static struct dentry *hfsplus_mount(struct file_system_type *fs_type,</div><div class='del'>-			  int flags, const char *dev_name, void *data)</div><div class='add'>+static int hfsplus_get_tree(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	return get_tree_bdev(fc, hfsplus_fill_super);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void hfsplus_free_fc(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	return mount_bdev(fs_type, flags, dev_name, data, hfsplus_fill_super);</div><div class='add'>+	kfree(fc-&gt;s_fs_info);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct fs_context_operations hfsplus_context_ops = {</div><div class='add'>+	.parse_param	= hfsplus_parse_param,</div><div class='add'>+	.get_tree	= hfsplus_get_tree,</div><div class='add'>+	.reconfigure	= hfsplus_reconfigure,</div><div class='add'>+	.free		= hfsplus_free_fc,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int hfsplus_init_fs_context(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct hfsplus_sb_info *sbi;</div><div class='add'>+</div><div class='add'>+	sbi = kzalloc(sizeof(struct hfsplus_sb_info), GFP_KERNEL);</div><div class='add'>+	if (!sbi)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	if (fc-&gt;purpose != FS_CONTEXT_FOR_RECONFIGURE)</div><div class='add'>+		hfsplus_fill_defaults(sbi);</div><div class='add'>+</div><div class='add'>+	fc-&gt;s_fs_info = sbi;</div><div class='add'>+	fc-&gt;ops = &amp;hfsplus_context_ops;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct file_system_type hfsplus_fs_type = {</div><div class='ctx'> 	.owner		= THIS_MODULE,</div><div class='ctx'> 	.name		= "hfsplus",</div><div class='del'>-	.mount		= hfsplus_mount,</div><div class='ctx'> 	.kill_sb	= kill_block_super,</div><div class='ctx'> 	.fs_flags	= FS_REQUIRES_DEV,</div><div class='add'>+	.init_fs_context = hfsplus_init_fs_context,</div><div class='ctx'> };</div><div class='ctx'> MODULE_ALIAS_FS("hfsplus");</div><div class='ctx'> </div><div class='head'>diff --git a/fs/hfsplus/unicode.c b/fs/hfsplus/unicode.c<br/>index 73342c925a4b..d3a142f4518b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/unicode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/unicode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/unicode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfsplus/unicode.c</a></div><div class='hunk'>@@ -11,6 +11,9 @@</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/types.h&gt;</div><div class='ctx'> #include &lt;linux/nls.h&gt;</div><div class='add'>+</div><div class='add'>+#include &lt;kunit/visibility.h&gt;</div><div class='add'>+</div><div class='ctx'> #include "hfsplus_fs.h"</div><div class='ctx'> #include "hfsplus_raw.h"</div><div class='ctx'> </div><div class='hunk'>@@ -40,6 +43,18 @@ int hfsplus_strcasecmp(const struct hfsplus_unistr *s1,</div><div class='ctx'> 	p1 = s1-&gt;unicode;</div><div class='ctx'> 	p2 = s2-&gt;unicode;</div><div class='ctx'> </div><div class='add'>+	if (len1 &gt; HFSPLUS_MAX_STRLEN) {</div><div class='add'>+		len1 = HFSPLUS_MAX_STRLEN;</div><div class='add'>+		pr_err("invalid length %u has been corrected to %d\n",</div><div class='add'>+			be16_to_cpu(s1-&gt;length), len1);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (len2 &gt; HFSPLUS_MAX_STRLEN) {</div><div class='add'>+		len2 = HFSPLUS_MAX_STRLEN;</div><div class='add'>+		pr_err("invalid length %u has been corrected to %d\n",</div><div class='add'>+			be16_to_cpu(s2-&gt;length), len2);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		c1 = c2 = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -60,6 +75,7 @@ int hfsplus_strcasecmp(const struct hfsplus_unistr *s1,</div><div class='ctx'> 			return 0;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL_IF_KUNIT(hfsplus_strcasecmp);</div><div class='ctx'> </div><div class='ctx'> /* Compare names as a sequence of 16-bit unsigned integers */</div><div class='ctx'> int hfsplus_strcmp(const struct hfsplus_unistr *s1,</div><div class='hunk'>@@ -74,6 +90,18 @@ int hfsplus_strcmp(const struct hfsplus_unistr *s1,</div><div class='ctx'> 	p1 = s1-&gt;unicode;</div><div class='ctx'> 	p2 = s2-&gt;unicode;</div><div class='ctx'> </div><div class='add'>+	if (len1 &gt; HFSPLUS_MAX_STRLEN) {</div><div class='add'>+		len1 = HFSPLUS_MAX_STRLEN;</div><div class='add'>+		pr_err("invalid length %u has been corrected to %d\n",</div><div class='add'>+			be16_to_cpu(s1-&gt;length), len1);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (len2 &gt; HFSPLUS_MAX_STRLEN) {</div><div class='add'>+		len2 = HFSPLUS_MAX_STRLEN;</div><div class='add'>+		pr_err("invalid length %u has been corrected to %d\n",</div><div class='add'>+			be16_to_cpu(s2-&gt;length), len2);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	for (len = min(len1, len2); len &gt; 0; len--) {</div><div class='ctx'> 		c1 = be16_to_cpu(*p1);</div><div class='ctx'> 		c2 = be16_to_cpu(*p2);</div><div class='hunk'>@@ -86,7 +114,7 @@ int hfsplus_strcmp(const struct hfsplus_unistr *s1,</div><div class='ctx'> 	return len1 &lt; len2 ? -1 :</div><div class='ctx'> 	       len1 &gt; len2 ? 1 : 0;</div><div class='ctx'> }</div><div class='del'>-</div><div class='add'>+EXPORT_SYMBOL_IF_KUNIT(hfsplus_strcmp);</div><div class='ctx'> </div><div class='ctx'> #define Hangul_SBase	0xac00</div><div class='ctx'> #define Hangul_LBase	0x1100</div><div class='hunk'>@@ -119,9 +147,9 @@ static u16 *hfsplus_compose_lookup(u16 *p, u16 cc)</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int hfsplus_uni2asc(struct super_block *sb,</div><div class='del'>-		const struct hfsplus_unistr *ustr,</div><div class='del'>-		char *astr, int *len_p)</div><div class='add'>+static int hfsplus_uni2asc(struct super_block *sb,</div><div class='add'>+			   const struct hfsplus_unistr *ustr,</div><div class='add'>+			   int max_len, char *astr, int *len_p)</div><div class='ctx'> {</div><div class='ctx'> 	const hfsplus_unichr *ip;</div><div class='ctx'> 	struct nls_table *nls = HFSPLUS_SB(sb)-&gt;nls;</div><div class='hunk'>@@ -132,7 +160,14 @@ int hfsplus_uni2asc(struct super_block *sb,</div><div class='ctx'> </div><div class='ctx'> 	op = astr;</div><div class='ctx'> 	ip = ustr-&gt;unicode;</div><div class='add'>+</div><div class='ctx'> 	ustrlen = be16_to_cpu(ustr-&gt;length);</div><div class='add'>+	if (ustrlen &gt; max_len) {</div><div class='add'>+		ustrlen = max_len;</div><div class='add'>+		pr_err("invalid length %u has been corrected to %d\n",</div><div class='add'>+			be16_to_cpu(ustr-&gt;length), ustrlen);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	len = *len_p;</div><div class='ctx'> 	ce1 = NULL;</div><div class='ctx'> 	compose = !test_bit(HFSPLUS_SB_NODECOMPOSE, &amp;HFSPLUS_SB(sb)-&gt;flags);</div><div class='hunk'>@@ -249,6 +284,23 @@ out:</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+inline int hfsplus_uni2asc_str(struct super_block *sb,</div><div class='add'>+			       const struct hfsplus_unistr *ustr, char *astr,</div><div class='add'>+			       int *len_p)</div><div class='add'>+{</div><div class='add'>+	return hfsplus_uni2asc(sb, ustr, HFSPLUS_MAX_STRLEN, astr, len_p);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_IF_KUNIT(hfsplus_uni2asc_str);</div><div class='add'>+</div><div class='add'>+inline int hfsplus_uni2asc_xattr_str(struct super_block *sb,</div><div class='add'>+				     const struct hfsplus_attr_unistr *ustr,</div><div class='add'>+				     char *astr, int *len_p)</div><div class='add'>+{</div><div class='add'>+	return hfsplus_uni2asc(sb, (const struct hfsplus_unistr *)ustr,</div><div class='add'>+			       HFSPLUS_ATTR_MAX_STRLEN, astr, len_p);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_IF_KUNIT(hfsplus_uni2asc_xattr_str);</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Convert one or more ASCII characters into a single unicode character.</div><div class='ctx'>  * Returns the number of ASCII characters corresponding to the unicode char.</div><div class='hunk'>@@ -375,6 +427,7 @@ int hfsplus_asc2uni(struct super_block *sb,</div><div class='ctx'> 		return -ENAMETOOLONG;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL_IF_KUNIT(hfsplus_asc2uni);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Hash a string to an integer as appropriate for the HFS+ filesystem.</div><div class='hunk'>@@ -427,6 +480,7 @@ int hfsplus_hash_dentry(const struct dentry *dentry, struct qstr *str)</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL_IF_KUNIT(hfsplus_hash_dentry);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Compare strings with HFS+ filename ordering.</div><div class='hunk'>@@ -518,3 +572,4 @@ int hfsplus_compare_dentry(const struct dentry *dentry,</div><div class='ctx'> 		return 1;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL_IF_KUNIT(hfsplus_compare_dentry);</div><div class='head'>diff --git a/fs/hfsplus/unicode_test.c b/fs/hfsplus/unicode_test.c<br/>new file mode 100644<br/>index 000000000000..5a7a6859efe3<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/unicode_test.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfsplus/unicode_test.c</a></div><div class='hunk'>@@ -0,0 +1,1579 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+/*</div><div class='add'>+ * KUnit tests for HFS+ Unicode string operations</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2025 Viacheslav Dubeyko &lt;slava@dubeyko.com&gt;</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;kunit/test.h&gt;</div><div class='add'>+#include &lt;linux/nls.h&gt;</div><div class='add'>+#include &lt;linux/dcache.h&gt;</div><div class='add'>+#include &lt;linux/stringhash.h&gt;</div><div class='add'>+#include "hfsplus_fs.h"</div><div class='add'>+</div><div class='add'>+struct test_mock_string_env {</div><div class='add'>+	struct hfsplus_unistr str1;</div><div class='add'>+	struct hfsplus_unistr str2;</div><div class='add'>+	char *buf;</div><div class='add'>+	u32 buf_size;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static struct test_mock_string_env *setup_mock_str_env(u32 buf_size)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_string_env *env;</div><div class='add'>+</div><div class='add'>+	env = kzalloc(sizeof(struct test_mock_string_env), GFP_KERNEL);</div><div class='add'>+	if (!env)</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	env-&gt;buf = kzalloc(buf_size, GFP_KERNEL);</div><div class='add'>+	if (!env-&gt;buf) {</div><div class='add'>+		kfree(env);</div><div class='add'>+		return NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	env-&gt;buf_size = buf_size;</div><div class='add'>+</div><div class='add'>+	return env;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void free_mock_str_env(struct test_mock_string_env *env)</div><div class='add'>+{</div><div class='add'>+	if (env-&gt;buf)</div><div class='add'>+		kfree(env-&gt;buf);</div><div class='add'>+	kfree(env);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Helper function to create hfsplus_unistr */</div><div class='add'>+static void create_unistr(struct hfsplus_unistr *ustr, const char *ascii_str)</div><div class='add'>+{</div><div class='add'>+	int len = strlen(ascii_str);</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	memset(ustr-&gt;unicode, 0, sizeof(ustr-&gt;unicode));</div><div class='add'>+</div><div class='add'>+	ustr-&gt;length = cpu_to_be16(len);</div><div class='add'>+	for (i = 0; i &lt; len &amp;&amp; i &lt; HFSPLUS_MAX_STRLEN; i++)</div><div class='add'>+		ustr-&gt;unicode[i] = cpu_to_be16((u16)ascii_str[i]);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void corrupt_unistr(struct hfsplus_unistr *ustr)</div><div class='add'>+{</div><div class='add'>+	ustr-&gt;length = cpu_to_be16(U16_MAX);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test hfsplus_strcasecmp function */</div><div class='add'>+static void hfsplus_strcasecmp_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_string_env *mock_env;</div><div class='add'>+</div><div class='add'>+	mock_env = setup_mock_str_env(HFSPLUS_MAX_STRLEN + 1);</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_env);</div><div class='add'>+</div><div class='add'>+	/* Test identical strings */</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "hello");</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "hello");</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfsplus_strcasecmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						    &amp;mock_env-&gt;str2));</div><div class='add'>+</div><div class='add'>+	/* Test case insensitive comparison */</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "Hello");</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "hello");</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfsplus_strcasecmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						    &amp;mock_env-&gt;str2));</div><div class='add'>+</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "HELLO");</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "hello");</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfsplus_strcasecmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						    &amp;mock_env-&gt;str2));</div><div class='add'>+</div><div class='add'>+	/* Test different strings */</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "apple");</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "banana");</div><div class='add'>+	KUNIT_EXPECT_LT(test, hfsplus_strcasecmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						 &amp;mock_env-&gt;str2), 0);</div><div class='add'>+</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "zebra");</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "apple");</div><div class='add'>+	KUNIT_EXPECT_GT(test, hfsplus_strcasecmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						 &amp;mock_env-&gt;str2), 0);</div><div class='add'>+</div><div class='add'>+	/* Test different lengths */</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "test");</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "testing");</div><div class='add'>+	KUNIT_EXPECT_LT(test, hfsplus_strcasecmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						 &amp;mock_env-&gt;str2), 0);</div><div class='add'>+</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "testing");</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "test");</div><div class='add'>+	KUNIT_EXPECT_GT(test, hfsplus_strcasecmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						 &amp;mock_env-&gt;str2), 0);</div><div class='add'>+</div><div class='add'>+	/* Test empty strings */</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "");</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "");</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfsplus_strcasecmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						    &amp;mock_env-&gt;str2));</div><div class='add'>+</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "");</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "test");</div><div class='add'>+	KUNIT_EXPECT_LT(test, hfsplus_strcasecmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						 &amp;mock_env-&gt;str2), 0);</div><div class='add'>+</div><div class='add'>+	/* Test single characters */</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "A");</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "a");</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfsplus_strcasecmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						    &amp;mock_env-&gt;str2));</div><div class='add'>+</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "A");</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "B");</div><div class='add'>+	KUNIT_EXPECT_LT(test, hfsplus_strcasecmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						 &amp;mock_env-&gt;str2), 0);</div><div class='add'>+</div><div class='add'>+	/* Test maximum length strings */</div><div class='add'>+	memset(mock_env-&gt;buf, 'a', HFSPLUS_MAX_STRLEN);</div><div class='add'>+	mock_env-&gt;buf[HFSPLUS_MAX_STRLEN] = '\0';</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, mock_env-&gt;buf);</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, mock_env-&gt;buf);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfsplus_strcasecmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						    &amp;mock_env-&gt;str2));</div><div class='add'>+</div><div class='add'>+	/* Change one character in the middle */</div><div class='add'>+	mock_env-&gt;buf[HFSPLUS_MAX_STRLEN / 2] = 'b';</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, mock_env-&gt;buf);</div><div class='add'>+	KUNIT_EXPECT_LT(test, hfsplus_strcasecmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						 &amp;mock_env-&gt;str2), 0);</div><div class='add'>+</div><div class='add'>+	/* Test corrupted strings */</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "");</div><div class='add'>+	corrupt_unistr(&amp;mock_env-&gt;str1);</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "");</div><div class='add'>+	KUNIT_EXPECT_NE(test, 0, hfsplus_strcasecmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						    &amp;mock_env-&gt;str2));</div><div class='add'>+</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "");</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "");</div><div class='add'>+	corrupt_unistr(&amp;mock_env-&gt;str2);</div><div class='add'>+	KUNIT_EXPECT_NE(test, 0, hfsplus_strcasecmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						    &amp;mock_env-&gt;str2));</div><div class='add'>+</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "test");</div><div class='add'>+	corrupt_unistr(&amp;mock_env-&gt;str1);</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "testing");</div><div class='add'>+	KUNIT_EXPECT_GT(test, hfsplus_strcasecmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						 &amp;mock_env-&gt;str2), 0);</div><div class='add'>+</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "test");</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "testing");</div><div class='add'>+	corrupt_unistr(&amp;mock_env-&gt;str2);</div><div class='add'>+	KUNIT_EXPECT_LT(test, hfsplus_strcasecmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						 &amp;mock_env-&gt;str2), 0);</div><div class='add'>+</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "testing");</div><div class='add'>+	corrupt_unistr(&amp;mock_env-&gt;str1);</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "test");</div><div class='add'>+	KUNIT_EXPECT_GT(test, hfsplus_strcasecmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						 &amp;mock_env-&gt;str2), 0);</div><div class='add'>+</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "testing");</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "test");</div><div class='add'>+	corrupt_unistr(&amp;mock_env-&gt;str2);</div><div class='add'>+	KUNIT_EXPECT_LT(test, hfsplus_strcasecmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						 &amp;mock_env-&gt;str2), 0);</div><div class='add'>+</div><div class='add'>+	free_mock_str_env(mock_env);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test hfsplus_strcmp function (case-sensitive) */</div><div class='add'>+static void hfsplus_strcmp_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_string_env *mock_env;</div><div class='add'>+</div><div class='add'>+	mock_env = setup_mock_str_env(HFSPLUS_MAX_STRLEN + 1);</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_env);</div><div class='add'>+</div><div class='add'>+	/* Test identical strings */</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "hello");</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "hello");</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfsplus_strcmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						&amp;mock_env-&gt;str2));</div><div class='add'>+</div><div class='add'>+	/* Test case sensitive comparison - should NOT be equal */</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "Hello");</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "hello");</div><div class='add'>+	KUNIT_EXPECT_NE(test, 0, hfsplus_strcmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						&amp;mock_env-&gt;str2));</div><div class='add'>+	 /* 'H' &lt; 'h' in Unicode */</div><div class='add'>+	KUNIT_EXPECT_LT(test, hfsplus_strcmp(&amp;mock_env-&gt;str1,</div><div class='add'>+					     &amp;mock_env-&gt;str2), 0);</div><div class='add'>+</div><div class='add'>+	/* Test lexicographic ordering */</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "apple");</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "banana");</div><div class='add'>+	KUNIT_EXPECT_LT(test, hfsplus_strcmp(&amp;mock_env-&gt;str1,</div><div class='add'>+					     &amp;mock_env-&gt;str2), 0);</div><div class='add'>+</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "zebra");</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "apple");</div><div class='add'>+	KUNIT_EXPECT_GT(test, hfsplus_strcmp(&amp;mock_env-&gt;str1,</div><div class='add'>+					     &amp;mock_env-&gt;str2), 0);</div><div class='add'>+</div><div class='add'>+	/* Test different lengths with common prefix */</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "test");</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "testing");</div><div class='add'>+	KUNIT_EXPECT_LT(test, hfsplus_strcmp(&amp;mock_env-&gt;str1,</div><div class='add'>+					     &amp;mock_env-&gt;str2), 0);</div><div class='add'>+</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "testing");</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "test");</div><div class='add'>+	KUNIT_EXPECT_GT(test, hfsplus_strcmp(&amp;mock_env-&gt;str1,</div><div class='add'>+					     &amp;mock_env-&gt;str2), 0);</div><div class='add'>+</div><div class='add'>+	/* Test empty strings */</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "");</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "");</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfsplus_strcmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						&amp;mock_env-&gt;str2));</div><div class='add'>+</div><div class='add'>+	/* Test maximum length strings */</div><div class='add'>+	memset(mock_env-&gt;buf, 'a', HFSPLUS_MAX_STRLEN);</div><div class='add'>+	mock_env-&gt;buf[HFSPLUS_MAX_STRLEN] = '\0';</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, mock_env-&gt;buf);</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, mock_env-&gt;buf);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfsplus_strcmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						&amp;mock_env-&gt;str2));</div><div class='add'>+</div><div class='add'>+	/* Change one character in the middle */</div><div class='add'>+	mock_env-&gt;buf[HFSPLUS_MAX_STRLEN / 2] = 'b';</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, mock_env-&gt;buf);</div><div class='add'>+	KUNIT_EXPECT_LT(test, hfsplus_strcmp(&amp;mock_env-&gt;str1,</div><div class='add'>+					     &amp;mock_env-&gt;str2), 0);</div><div class='add'>+</div><div class='add'>+	/* Test corrupted strings */</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "");</div><div class='add'>+	corrupt_unistr(&amp;mock_env-&gt;str1);</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "");</div><div class='add'>+	KUNIT_EXPECT_NE(test, 0, hfsplus_strcmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						&amp;mock_env-&gt;str2));</div><div class='add'>+</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "");</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "");</div><div class='add'>+	corrupt_unistr(&amp;mock_env-&gt;str2);</div><div class='add'>+	KUNIT_EXPECT_NE(test, 0, hfsplus_strcmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						&amp;mock_env-&gt;str2));</div><div class='add'>+</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "test");</div><div class='add'>+	corrupt_unistr(&amp;mock_env-&gt;str1);</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "testing");</div><div class='add'>+	KUNIT_EXPECT_LT(test, hfsplus_strcmp(&amp;mock_env-&gt;str1,</div><div class='add'>+					     &amp;mock_env-&gt;str2), 0);</div><div class='add'>+</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "test");</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "testing");</div><div class='add'>+	corrupt_unistr(&amp;mock_env-&gt;str2);</div><div class='add'>+	KUNIT_EXPECT_LT(test, hfsplus_strcmp(&amp;mock_env-&gt;str1,</div><div class='add'>+					     &amp;mock_env-&gt;str2), 0);</div><div class='add'>+</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "testing");</div><div class='add'>+	corrupt_unistr(&amp;mock_env-&gt;str1);</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "test");</div><div class='add'>+	KUNIT_EXPECT_GT(test, hfsplus_strcmp(&amp;mock_env-&gt;str1,</div><div class='add'>+					     &amp;mock_env-&gt;str2), 0);</div><div class='add'>+</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "testing");</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str2, "test");</div><div class='add'>+	corrupt_unistr(&amp;mock_env-&gt;str2);</div><div class='add'>+	KUNIT_EXPECT_GT(test, hfsplus_strcmp(&amp;mock_env-&gt;str1,</div><div class='add'>+					     &amp;mock_env-&gt;str2), 0);</div><div class='add'>+</div><div class='add'>+	free_mock_str_env(mock_env);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test Unicode edge cases */</div><div class='add'>+static void hfsplus_unicode_edge_cases_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_string_env *mock_env;</div><div class='add'>+</div><div class='add'>+	mock_env = setup_mock_str_env(HFSPLUS_MAX_STRLEN + 1);</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_env);</div><div class='add'>+</div><div class='add'>+	/* Test with special characters */</div><div class='add'>+	mock_env-&gt;str1.length = cpu_to_be16(3);</div><div class='add'>+	mock_env-&gt;str1.unicode[0] = cpu_to_be16(0x00E9); /* é */</div><div class='add'>+	mock_env-&gt;str1.unicode[1] = cpu_to_be16(0x00F1); /* ñ */</div><div class='add'>+	mock_env-&gt;str1.unicode[2] = cpu_to_be16(0x00FC); /* ü */</div><div class='add'>+</div><div class='add'>+	mock_env-&gt;str2.length = cpu_to_be16(3);</div><div class='add'>+	mock_env-&gt;str2.unicode[0] = cpu_to_be16(0x00E9); /* é */</div><div class='add'>+	mock_env-&gt;str2.unicode[1] = cpu_to_be16(0x00F1); /* ñ */</div><div class='add'>+	mock_env-&gt;str2.unicode[2] = cpu_to_be16(0x00FC); /* ü */</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfsplus_strcmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						&amp;mock_env-&gt;str2));</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfsplus_strcasecmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						    &amp;mock_env-&gt;str2));</div><div class='add'>+</div><div class='add'>+	/* Test with different special characters */</div><div class='add'>+	mock_env-&gt;str2.unicode[1] = cpu_to_be16(0x00F2); /* ò */</div><div class='add'>+	KUNIT_EXPECT_NE(test, 0, hfsplus_strcmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						&amp;mock_env-&gt;str2));</div><div class='add'>+</div><div class='add'>+	/* Test null characters within string (should be handled correctly) */</div><div class='add'>+	mock_env-&gt;str1.length = cpu_to_be16(3);</div><div class='add'>+	mock_env-&gt;str1.unicode[0] = cpu_to_be16('a');</div><div class='add'>+	mock_env-&gt;str1.unicode[1] = cpu_to_be16(0x0000); /* null */</div><div class='add'>+	mock_env-&gt;str1.unicode[2] = cpu_to_be16('b');</div><div class='add'>+</div><div class='add'>+	mock_env-&gt;str2.length = cpu_to_be16(3);</div><div class='add'>+	mock_env-&gt;str2.unicode[0] = cpu_to_be16('a');</div><div class='add'>+	mock_env-&gt;str2.unicode[1] = cpu_to_be16(0x0000); /* null */</div><div class='add'>+	mock_env-&gt;str2.unicode[2] = cpu_to_be16('b');</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfsplus_strcmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						&amp;mock_env-&gt;str2));</div><div class='add'>+</div><div class='add'>+	free_mock_str_env(mock_env);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test boundary conditions */</div><div class='add'>+static void hfsplus_unicode_boundary_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_string_env *mock_env;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	mock_env = setup_mock_str_env(HFSPLUS_MAX_STRLEN + 1);</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_env);</div><div class='add'>+</div><div class='add'>+	/* Test maximum length boundary */</div><div class='add'>+	mock_env-&gt;str1.length = cpu_to_be16(HFSPLUS_MAX_STRLEN);</div><div class='add'>+	mock_env-&gt;str2.length = cpu_to_be16(HFSPLUS_MAX_STRLEN);</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; HFSPLUS_MAX_STRLEN; i++) {</div><div class='add'>+		mock_env-&gt;str1.unicode[i] = cpu_to_be16('A');</div><div class='add'>+		mock_env-&gt;str2.unicode[i] = cpu_to_be16('A');</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfsplus_strcmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						&amp;mock_env-&gt;str2));</div><div class='add'>+</div><div class='add'>+	/* Change last character */</div><div class='add'>+	mock_env-&gt;str2.unicode[HFSPLUS_MAX_STRLEN - 1] = cpu_to_be16('B');</div><div class='add'>+	KUNIT_EXPECT_LT(test, hfsplus_strcmp(&amp;mock_env-&gt;str1,</div><div class='add'>+					     &amp;mock_env-&gt;str2), 0);</div><div class='add'>+</div><div class='add'>+	/* Test zero length strings */</div><div class='add'>+	mock_env-&gt;str1.length = cpu_to_be16(0);</div><div class='add'>+	mock_env-&gt;str2.length = cpu_to_be16(0);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfsplus_strcmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						&amp;mock_env-&gt;str2));</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, hfsplus_strcasecmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						    &amp;mock_env-&gt;str2));</div><div class='add'>+</div><div class='add'>+	/* Test one character vs empty */</div><div class='add'>+	mock_env-&gt;str1.length = cpu_to_be16(1);</div><div class='add'>+	mock_env-&gt;str1.unicode[0] = cpu_to_be16('A');</div><div class='add'>+	mock_env-&gt;str2.length = cpu_to_be16(0);</div><div class='add'>+	KUNIT_EXPECT_GT(test, hfsplus_strcmp(&amp;mock_env-&gt;str1,</div><div class='add'>+					     &amp;mock_env-&gt;str2), 0);</div><div class='add'>+	KUNIT_EXPECT_GT(test, hfsplus_strcasecmp(&amp;mock_env-&gt;str1,</div><div class='add'>+						 &amp;mock_env-&gt;str2), 0);</div><div class='add'>+</div><div class='add'>+	free_mock_str_env(mock_env);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Mock superblock and NLS table for testing hfsplus_uni2asc */</div><div class='add'>+struct test_mock_sb {</div><div class='add'>+	struct nls_table nls;</div><div class='add'>+	struct hfsplus_sb_info sb_info;</div><div class='add'>+	struct super_block sb;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static struct test_mock_sb *setup_mock_sb(void)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_sb *ptr;</div><div class='add'>+</div><div class='add'>+	ptr = kzalloc(sizeof(struct test_mock_sb), GFP_KERNEL);</div><div class='add'>+	if (!ptr)</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	ptr-&gt;nls.charset = "utf8";</div><div class='add'>+	ptr-&gt;nls.uni2char = NULL; /* Will use default behavior */</div><div class='add'>+	ptr-&gt;sb_info.nls = &amp;ptr-&gt;nls;</div><div class='add'>+	ptr-&gt;sb.s_fs_info = &amp;ptr-&gt;sb_info;</div><div class='add'>+</div><div class='add'>+	/* Set default flags - no decomposition, no case folding */</div><div class='add'>+	clear_bit(HFSPLUS_SB_NODECOMPOSE, &amp;ptr-&gt;sb_info.flags);</div><div class='add'>+	clear_bit(HFSPLUS_SB_CASEFOLD, &amp;ptr-&gt;sb_info.flags);</div><div class='add'>+</div><div class='add'>+	return ptr;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void free_mock_sb(struct test_mock_sb *ptr)</div><div class='add'>+{</div><div class='add'>+	kfree(ptr);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Simple uni2char implementation for testing */</div><div class='add'>+static int test_uni2char(wchar_t uni, unsigned char *out, int boundlen)</div><div class='add'>+{</div><div class='add'>+	if (boundlen &lt;= 0)</div><div class='add'>+		return -ENAMETOOLONG;</div><div class='add'>+</div><div class='add'>+	if (uni &lt; 0x80) {</div><div class='add'>+		*out = (unsigned char)uni;</div><div class='add'>+		return 1;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* For non-ASCII, just use '?' as fallback */</div><div class='add'>+	*out = '?';</div><div class='add'>+	return 1;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test hfsplus_uni2asc basic functionality */</div><div class='add'>+static void hfsplus_uni2asc_basic_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_sb *mock_sb;</div><div class='add'>+	struct test_mock_string_env *mock_env;</div><div class='add'>+	int len, result;</div><div class='add'>+</div><div class='add'>+	mock_env = setup_mock_str_env(HFSPLUS_MAX_STRLEN + 1);</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_env);</div><div class='add'>+</div><div class='add'>+	mock_sb = setup_mock_sb();</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_sb);</div><div class='add'>+</div><div class='add'>+	mock_sb-&gt;nls.uni2char = test_uni2char;</div><div class='add'>+</div><div class='add'>+	/* Test simple ASCII string conversion */</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "hello");</div><div class='add'>+	len = mock_env-&gt;buf_size;</div><div class='add'>+	result = hfsplus_uni2asc_str(&amp;mock_sb-&gt;sb, &amp;mock_env-&gt;str1,</div><div class='add'>+				     mock_env-&gt;buf, &amp;len);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 5, len);</div><div class='add'>+	KUNIT_EXPECT_STREQ(test, "hello", mock_env-&gt;buf);</div><div class='add'>+</div><div class='add'>+	/* Test empty string */</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "");</div><div class='add'>+	len = mock_env-&gt;buf_size;</div><div class='add'>+	result = hfsplus_uni2asc_str(&amp;mock_sb-&gt;sb, &amp;mock_env-&gt;str1,</div><div class='add'>+				     mock_env-&gt;buf, &amp;len);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, len);</div><div class='add'>+</div><div class='add'>+	/* Test single character */</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "A");</div><div class='add'>+	len = mock_env-&gt;buf_size;</div><div class='add'>+	result = hfsplus_uni2asc_str(&amp;mock_sb-&gt;sb, &amp;mock_env-&gt;str1,</div><div class='add'>+				     mock_env-&gt;buf, &amp;len);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 1, len);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 'A', mock_env-&gt;buf[0]);</div><div class='add'>+</div><div class='add'>+	free_mock_str_env(mock_env);</div><div class='add'>+	free_mock_sb(mock_sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test special character handling */</div><div class='add'>+static void hfsplus_uni2asc_special_chars_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_sb *mock_sb;</div><div class='add'>+	struct test_mock_string_env *mock_env;</div><div class='add'>+	int len, result;</div><div class='add'>+</div><div class='add'>+	mock_env = setup_mock_str_env(HFSPLUS_MAX_STRLEN + 1);</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_env);</div><div class='add'>+</div><div class='add'>+	mock_sb = setup_mock_sb();</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_sb);</div><div class='add'>+</div><div class='add'>+	mock_sb-&gt;nls.uni2char = test_uni2char;</div><div class='add'>+</div><div class='add'>+	/* Test null character conversion (should become 0x2400) */</div><div class='add'>+	mock_env-&gt;str1.length = cpu_to_be16(1);</div><div class='add'>+	mock_env-&gt;str1.unicode[0] = cpu_to_be16(0x0000);</div><div class='add'>+	len = mock_env-&gt;buf_size;</div><div class='add'>+	result = hfsplus_uni2asc_str(&amp;mock_sb-&gt;sb, &amp;mock_env-&gt;str1,</div><div class='add'>+				     mock_env-&gt;buf, &amp;len);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 1, len);</div><div class='add'>+	/* Our test implementation returns '?' for non-ASCII */</div><div class='add'>+	KUNIT_EXPECT_EQ(test, '?', mock_env-&gt;buf[0]);</div><div class='add'>+</div><div class='add'>+	/* Test forward slash conversion (should become colon) */</div><div class='add'>+	mock_env-&gt;str1.length = cpu_to_be16(1);</div><div class='add'>+	mock_env-&gt;str1.unicode[0] = cpu_to_be16('/');</div><div class='add'>+	len = mock_env-&gt;buf_size;</div><div class='add'>+	result = hfsplus_uni2asc_str(&amp;mock_sb-&gt;sb, &amp;mock_env-&gt;str1,</div><div class='add'>+				     mock_env-&gt;buf, &amp;len);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 1, len);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, ':', mock_env-&gt;buf[0]);</div><div class='add'>+</div><div class='add'>+	/* Test string with mixed special characters */</div><div class='add'>+	mock_env-&gt;str1.length = cpu_to_be16(3);</div><div class='add'>+	mock_env-&gt;str1.unicode[0] = cpu_to_be16('a');</div><div class='add'>+	mock_env-&gt;str1.unicode[1] = cpu_to_be16('/');</div><div class='add'>+	mock_env-&gt;str1.unicode[2] = cpu_to_be16('b');</div><div class='add'>+	len = mock_env-&gt;buf_size;</div><div class='add'>+	result = hfsplus_uni2asc_str(&amp;mock_sb-&gt;sb, &amp;mock_env-&gt;str1,</div><div class='add'>+				     mock_env-&gt;buf, &amp;len);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 3, len);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 'a', mock_env-&gt;buf[0]);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, ':', mock_env-&gt;buf[1]);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 'b', mock_env-&gt;buf[2]);</div><div class='add'>+</div><div class='add'>+	free_mock_str_env(mock_env);</div><div class='add'>+	free_mock_sb(mock_sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test buffer length handling */</div><div class='add'>+static void hfsplus_uni2asc_buffer_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_sb *mock_sb;</div><div class='add'>+	struct test_mock_string_env *mock_env;</div><div class='add'>+	int len, result;</div><div class='add'>+</div><div class='add'>+	mock_env = setup_mock_str_env(10);</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_env);</div><div class='add'>+</div><div class='add'>+	mock_sb = setup_mock_sb();</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_sb);</div><div class='add'>+</div><div class='add'>+	mock_sb-&gt;nls.uni2char = test_uni2char;</div><div class='add'>+</div><div class='add'>+	/* Test insufficient buffer space */</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "toolongstring");</div><div class='add'>+	len = 5; /* Buffer too small */</div><div class='add'>+	result = hfsplus_uni2asc_str(&amp;mock_sb-&gt;sb, &amp;mock_env-&gt;str1,</div><div class='add'>+				     mock_env-&gt;buf, &amp;len);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, -ENAMETOOLONG, result);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 5, len); /* Should be set to consumed length */</div><div class='add'>+</div><div class='add'>+	/* Test exact buffer size */</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "exact");</div><div class='add'>+	len = 5;</div><div class='add'>+	result = hfsplus_uni2asc_str(&amp;mock_sb-&gt;sb, &amp;mock_env-&gt;str1,</div><div class='add'>+				     mock_env-&gt;buf, &amp;len);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 5, len);</div><div class='add'>+</div><div class='add'>+	/* Test zero length buffer */</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "test");</div><div class='add'>+	len = 0;</div><div class='add'>+	result = hfsplus_uni2asc_str(&amp;mock_sb-&gt;sb, &amp;mock_env-&gt;str1,</div><div class='add'>+				     mock_env-&gt;buf, &amp;len);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, -ENAMETOOLONG, result);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, len);</div><div class='add'>+</div><div class='add'>+	free_mock_str_env(mock_env);</div><div class='add'>+	free_mock_sb(mock_sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test corrupted unicode string handling */</div><div class='add'>+static void hfsplus_uni2asc_corrupted_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_sb *mock_sb;</div><div class='add'>+	struct test_mock_string_env *mock_env;</div><div class='add'>+	int len, result;</div><div class='add'>+</div><div class='add'>+	mock_env = setup_mock_str_env(HFSPLUS_MAX_STRLEN + 1);</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_env);</div><div class='add'>+</div><div class='add'>+	mock_sb = setup_mock_sb();</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_sb);</div><div class='add'>+</div><div class='add'>+	mock_sb-&gt;nls.uni2char = test_uni2char;</div><div class='add'>+</div><div class='add'>+	/* Test corrupted length (too large) */</div><div class='add'>+	create_unistr(&amp;mock_env-&gt;str1, "test");</div><div class='add'>+	corrupt_unistr(&amp;mock_env-&gt;str1); /* Sets length to U16_MAX */</div><div class='add'>+	len = mock_env-&gt;buf_size;</div><div class='add'>+</div><div class='add'>+	result = hfsplus_uni2asc_str(&amp;mock_sb-&gt;sb, &amp;mock_env-&gt;str1,</div><div class='add'>+				     mock_env-&gt;buf, &amp;len);</div><div class='add'>+</div><div class='add'>+	/* Should still work but with corrected length */</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	/*</div><div class='add'>+	 * Length should be corrected to HFSPLUS_MAX_STRLEN</div><div class='add'>+	 * and processed accordingly</div><div class='add'>+	 */</div><div class='add'>+	KUNIT_EXPECT_GT(test, len, 0);</div><div class='add'>+</div><div class='add'>+	free_mock_str_env(mock_env);</div><div class='add'>+	free_mock_sb(mock_sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test edge cases and boundary conditions */</div><div class='add'>+static void hfsplus_uni2asc_edge_cases_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_sb *mock_sb;</div><div class='add'>+	struct test_mock_string_env *mock_env;</div><div class='add'>+	int len, result;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	mock_env = setup_mock_str_env(HFSPLUS_MAX_STRLEN * 2);</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_env);</div><div class='add'>+</div><div class='add'>+	mock_sb = setup_mock_sb();</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_sb);</div><div class='add'>+</div><div class='add'>+	mock_sb-&gt;nls.uni2char = test_uni2char;</div><div class='add'>+</div><div class='add'>+	/* Test maximum length string */</div><div class='add'>+	mock_env-&gt;str1.length = cpu_to_be16(HFSPLUS_MAX_STRLEN);</div><div class='add'>+	for (i = 0; i &lt; HFSPLUS_MAX_STRLEN; i++)</div><div class='add'>+		mock_env-&gt;str1.unicode[i] = cpu_to_be16('a');</div><div class='add'>+</div><div class='add'>+	len = mock_env-&gt;buf_size;</div><div class='add'>+	result = hfsplus_uni2asc_str(&amp;mock_sb-&gt;sb, &amp;mock_env-&gt;str1,</div><div class='add'>+				     mock_env-&gt;buf, &amp;len);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, HFSPLUS_MAX_STRLEN, len);</div><div class='add'>+</div><div class='add'>+	/* Verify all characters are 'a' */</div><div class='add'>+	for (i = 0; i &lt; HFSPLUS_MAX_STRLEN; i++)</div><div class='add'>+		KUNIT_EXPECT_EQ(test, 'a', mock_env-&gt;buf[i]);</div><div class='add'>+</div><div class='add'>+	/* Test string with high Unicode values (non-ASCII) */</div><div class='add'>+	mock_env-&gt;str1.length = cpu_to_be16(3);</div><div class='add'>+	mock_env-&gt;str1.unicode[0] = cpu_to_be16(0x00E9); /* é */</div><div class='add'>+	mock_env-&gt;str1.unicode[1] = cpu_to_be16(0x00F1); /* ñ */</div><div class='add'>+	mock_env-&gt;str1.unicode[2] = cpu_to_be16(0x00FC); /* ü */</div><div class='add'>+	len = mock_env-&gt;buf_size;</div><div class='add'>+	result = hfsplus_uni2asc_str(&amp;mock_sb-&gt;sb, &amp;mock_env-&gt;str1,</div><div class='add'>+				     mock_env-&gt;buf, &amp;len);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 3, len);</div><div class='add'>+	/* Our test implementation converts non-ASCII to '?' */</div><div class='add'>+	KUNIT_EXPECT_EQ(test, '?', mock_env-&gt;buf[0]);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, '?', mock_env-&gt;buf[1]);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, '?', mock_env-&gt;buf[2]);</div><div class='add'>+</div><div class='add'>+	free_mock_str_env(mock_env);</div><div class='add'>+	free_mock_sb(mock_sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Simple char2uni implementation for testing */</div><div class='add'>+static int test_char2uni(const unsigned char *rawstring,</div><div class='add'>+			 int boundlen, wchar_t *uni)</div><div class='add'>+{</div><div class='add'>+	if (boundlen &lt;= 0)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	*uni = (wchar_t)*rawstring;</div><div class='add'>+	return 1;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Helper function to check unicode string contents */</div><div class='add'>+static void check_unistr_content(struct kunit *test,</div><div class='add'>+				 struct hfsplus_unistr *ustr,</div><div class='add'>+				 const char *expected_ascii)</div><div class='add'>+{</div><div class='add'>+	int expected_len = strlen(expected_ascii);</div><div class='add'>+	int actual_len = be16_to_cpu(ustr-&gt;length);</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, expected_len, actual_len);</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; expected_len &amp;&amp; i &lt; actual_len; i++) {</div><div class='add'>+		u16 expected_char = (u16)expected_ascii[i];</div><div class='add'>+		u16 actual_char = be16_to_cpu(ustr-&gt;unicode[i]);</div><div class='add'>+</div><div class='add'>+		KUNIT_EXPECT_EQ(test, expected_char, actual_char);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test hfsplus_asc2uni basic functionality */</div><div class='add'>+static void hfsplus_asc2uni_basic_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_sb *mock_sb;</div><div class='add'>+	struct test_mock_string_env *mock_env;</div><div class='add'>+	int result;</div><div class='add'>+</div><div class='add'>+	mock_env = setup_mock_str_env(HFSPLUS_MAX_STRLEN + 1);</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_env);</div><div class='add'>+</div><div class='add'>+	mock_sb = setup_mock_sb();</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_sb);</div><div class='add'>+</div><div class='add'>+	mock_sb-&gt;nls.char2uni = test_char2uni;</div><div class='add'>+</div><div class='add'>+	/* Test simple ASCII string conversion */</div><div class='add'>+	result = hfsplus_asc2uni(&amp;mock_sb-&gt;sb, &amp;mock_env-&gt;str1,</div><div class='add'>+				 HFSPLUS_MAX_STRLEN, "hello", 5);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	check_unistr_content(test, &amp;mock_env-&gt;str1, "hello");</div><div class='add'>+</div><div class='add'>+	/* Test empty string */</div><div class='add'>+	result = hfsplus_asc2uni(&amp;mock_sb-&gt;sb, &amp;mock_env-&gt;str1,</div><div class='add'>+				 HFSPLUS_MAX_STRLEN, "", 0);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, be16_to_cpu(mock_env-&gt;str1.length));</div><div class='add'>+</div><div class='add'>+	/* Test single character */</div><div class='add'>+	result = hfsplus_asc2uni(&amp;mock_sb-&gt;sb, &amp;mock_env-&gt;str1,</div><div class='add'>+				 HFSPLUS_MAX_STRLEN, "A", 1);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	check_unistr_content(test, &amp;mock_env-&gt;str1, "A");</div><div class='add'>+</div><div class='add'>+	/* Test null-terminated string with explicit length */</div><div class='add'>+	result = hfsplus_asc2uni(&amp;mock_sb-&gt;sb, &amp;mock_env-&gt;str1,</div><div class='add'>+				 HFSPLUS_MAX_STRLEN, "test\0extra", 4);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	check_unistr_content(test, &amp;mock_env-&gt;str1, "test");</div><div class='add'>+</div><div class='add'>+	free_mock_str_env(mock_env);</div><div class='add'>+	free_mock_sb(mock_sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test special character handling in asc2uni */</div><div class='add'>+static void hfsplus_asc2uni_special_chars_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_sb *mock_sb;</div><div class='add'>+	struct test_mock_string_env *mock_env;</div><div class='add'>+	int result;</div><div class='add'>+</div><div class='add'>+	mock_env = setup_mock_str_env(HFSPLUS_MAX_STRLEN + 1);</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_env);</div><div class='add'>+</div><div class='add'>+	mock_sb = setup_mock_sb();</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_sb);</div><div class='add'>+</div><div class='add'>+	mock_sb-&gt;nls.char2uni = test_char2uni;</div><div class='add'>+</div><div class='add'>+	/* Test colon conversion (should become forward slash) */</div><div class='add'>+	result = hfsplus_asc2uni(&amp;mock_sb-&gt;sb, &amp;mock_env-&gt;str1,</div><div class='add'>+				 HFSPLUS_MAX_STRLEN, ":", 1);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 1, be16_to_cpu(mock_env-&gt;str1.length));</div><div class='add'>+	KUNIT_EXPECT_EQ(test, '/', be16_to_cpu(mock_env-&gt;str1.unicode[0]));</div><div class='add'>+</div><div class='add'>+	/* Test string with mixed special characters */</div><div class='add'>+	result = hfsplus_asc2uni(&amp;mock_sb-&gt;sb, &amp;mock_env-&gt;str1,</div><div class='add'>+				 HFSPLUS_MAX_STRLEN, "a:b", 3);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 3, be16_to_cpu(mock_env-&gt;str1.length));</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 'a', be16_to_cpu(mock_env-&gt;str1.unicode[0]));</div><div class='add'>+	KUNIT_EXPECT_EQ(test, '/', be16_to_cpu(mock_env-&gt;str1.unicode[1]));</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 'b', be16_to_cpu(mock_env-&gt;str1.unicode[2]));</div><div class='add'>+</div><div class='add'>+	/* Test multiple special characters */</div><div class='add'>+	result = hfsplus_asc2uni(&amp;mock_sb-&gt;sb, &amp;mock_env-&gt;str1,</div><div class='add'>+				 HFSPLUS_MAX_STRLEN, ":::", 3);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 3, be16_to_cpu(mock_env-&gt;str1.length));</div><div class='add'>+	KUNIT_EXPECT_EQ(test, '/', be16_to_cpu(mock_env-&gt;str1.unicode[0]));</div><div class='add'>+	KUNIT_EXPECT_EQ(test, '/', be16_to_cpu(mock_env-&gt;str1.unicode[1]));</div><div class='add'>+	KUNIT_EXPECT_EQ(test, '/', be16_to_cpu(mock_env-&gt;str1.unicode[2]));</div><div class='add'>+</div><div class='add'>+	free_mock_str_env(mock_env);</div><div class='add'>+	free_mock_sb(mock_sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test buffer length limits */</div><div class='add'>+static void hfsplus_asc2uni_buffer_limits_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_sb *mock_sb;</div><div class='add'>+	struct test_mock_string_env *mock_env;</div><div class='add'>+	int result;</div><div class='add'>+</div><div class='add'>+	mock_env = setup_mock_str_env(HFSPLUS_MAX_STRLEN + 10);</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_env);</div><div class='add'>+</div><div class='add'>+	mock_sb = setup_mock_sb();</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_sb);</div><div class='add'>+</div><div class='add'>+	mock_sb-&gt;nls.char2uni = test_char2uni;</div><div class='add'>+</div><div class='add'>+	/* Test exact maximum length */</div><div class='add'>+	memset(mock_env-&gt;buf, 'a', HFSPLUS_MAX_STRLEN);</div><div class='add'>+	result = hfsplus_asc2uni(&amp;mock_sb-&gt;sb,</div><div class='add'>+				 &amp;mock_env-&gt;str1, HFSPLUS_MAX_STRLEN,</div><div class='add'>+				 mock_env-&gt;buf, HFSPLUS_MAX_STRLEN);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, HFSPLUS_MAX_STRLEN,</div><div class='add'>+			be16_to_cpu(mock_env-&gt;str1.length));</div><div class='add'>+</div><div class='add'>+	/* Test exceeding maximum length */</div><div class='add'>+	memset(mock_env-&gt;buf, 'a', HFSPLUS_MAX_STRLEN + 5);</div><div class='add'>+	result = hfsplus_asc2uni(&amp;mock_sb-&gt;sb,</div><div class='add'>+				 &amp;mock_env-&gt;str1, HFSPLUS_MAX_STRLEN,</div><div class='add'>+				 mock_env-&gt;buf, HFSPLUS_MAX_STRLEN + 5);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, -ENAMETOOLONG, result);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, HFSPLUS_MAX_STRLEN,</div><div class='add'>+			be16_to_cpu(mock_env-&gt;str1.length));</div><div class='add'>+</div><div class='add'>+	/* Test with smaller max_unistr_len */</div><div class='add'>+	result = hfsplus_asc2uni(&amp;mock_sb-&gt;sb,</div><div class='add'>+				 &amp;mock_env-&gt;str1, 5, "toolongstring", 13);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, -ENAMETOOLONG, result);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 5, be16_to_cpu(mock_env-&gt;str1.length));</div><div class='add'>+</div><div class='add'>+	/* Test zero max length */</div><div class='add'>+	result = hfsplus_asc2uni(&amp;mock_sb-&gt;sb, &amp;mock_env-&gt;str1, 0, "test", 4);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, -ENAMETOOLONG, result);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, be16_to_cpu(mock_env-&gt;str1.length));</div><div class='add'>+</div><div class='add'>+	free_mock_str_env(mock_env);</div><div class='add'>+	free_mock_sb(mock_sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test error handling and edge cases */</div><div class='add'>+static void hfsplus_asc2uni_edge_cases_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_sb *mock_sb;</div><div class='add'>+	struct hfsplus_unistr ustr;</div><div class='add'>+	char test_str[] = {'a', '\0', 'b'};</div><div class='add'>+	int result;</div><div class='add'>+</div><div class='add'>+	mock_sb = setup_mock_sb();</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_sb);</div><div class='add'>+</div><div class='add'>+	mock_sb-&gt;nls.char2uni = test_char2uni;</div><div class='add'>+</div><div class='add'>+	/* Test zero length input */</div><div class='add'>+	result = hfsplus_asc2uni(&amp;mock_sb-&gt;sb,</div><div class='add'>+				 &amp;ustr, HFSPLUS_MAX_STRLEN, "test", 0);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, be16_to_cpu(ustr.length));</div><div class='add'>+</div><div class='add'>+	/* Test input with length mismatch */</div><div class='add'>+	result = hfsplus_asc2uni(&amp;mock_sb-&gt;sb,</div><div class='add'>+				 &amp;ustr, HFSPLUS_MAX_STRLEN, "hello", 3);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	check_unistr_content(test, &amp;ustr, "hel");</div><div class='add'>+</div><div class='add'>+	/* Test with various printable ASCII characters */</div><div class='add'>+	result = hfsplus_asc2uni(&amp;mock_sb-&gt;sb,</div><div class='add'>+				 &amp;ustr, HFSPLUS_MAX_STRLEN, "ABC123!@#", 9);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	check_unistr_content(test, &amp;ustr, "ABC123!@#");</div><div class='add'>+</div><div class='add'>+	/* Test null character in the middle */</div><div class='add'>+	result = hfsplus_asc2uni(&amp;mock_sb-&gt;sb,</div><div class='add'>+				 &amp;ustr, HFSPLUS_MAX_STRLEN, test_str, 3);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 3, be16_to_cpu(ustr.length));</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 'a', be16_to_cpu(ustr.unicode[0]));</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, be16_to_cpu(ustr.unicode[1]));</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 'b', be16_to_cpu(ustr.unicode[2]));</div><div class='add'>+</div><div class='add'>+	free_mock_sb(mock_sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test decomposition flag behavior */</div><div class='add'>+static void hfsplus_asc2uni_decompose_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_sb *mock_sb;</div><div class='add'>+	struct test_mock_string_env *mock_env;</div><div class='add'>+	int result;</div><div class='add'>+</div><div class='add'>+	mock_env = setup_mock_str_env(HFSPLUS_MAX_STRLEN + 1);</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_env);</div><div class='add'>+</div><div class='add'>+	mock_sb = setup_mock_sb();</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_sb);</div><div class='add'>+</div><div class='add'>+	mock_sb-&gt;nls.char2uni = test_char2uni;</div><div class='add'>+</div><div class='add'>+	/* Test with decomposition disabled (default) */</div><div class='add'>+	clear_bit(HFSPLUS_SB_NODECOMPOSE, &amp;mock_sb-&gt;sb_info.flags);</div><div class='add'>+	result = hfsplus_asc2uni(&amp;mock_sb-&gt;sb, &amp;mock_env-&gt;str1,</div><div class='add'>+				 HFSPLUS_MAX_STRLEN, "test", 4);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	check_unistr_content(test, &amp;mock_env-&gt;str1, "test");</div><div class='add'>+</div><div class='add'>+	/* Test with decomposition enabled */</div><div class='add'>+	set_bit(HFSPLUS_SB_NODECOMPOSE, &amp;mock_sb-&gt;sb_info.flags);</div><div class='add'>+	result = hfsplus_asc2uni(&amp;mock_sb-&gt;sb, &amp;mock_env-&gt;str2,</div><div class='add'>+				 HFSPLUS_MAX_STRLEN, "test", 4);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	check_unistr_content(test, &amp;mock_env-&gt;str2, "test");</div><div class='add'>+</div><div class='add'>+	/* For simple ASCII, both should produce the same result */</div><div class='add'>+	KUNIT_EXPECT_EQ(test,</div><div class='add'>+			be16_to_cpu(mock_env-&gt;str1.length),</div><div class='add'>+			be16_to_cpu(mock_env-&gt;str2.length));</div><div class='add'>+</div><div class='add'>+	free_mock_str_env(mock_env);</div><div class='add'>+	free_mock_sb(mock_sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Mock dentry for testing hfsplus_hash_dentry */</div><div class='add'>+static struct dentry test_dentry;</div><div class='add'>+</div><div class='add'>+static void setup_mock_dentry(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	memset(&amp;test_dentry, 0, sizeof(test_dentry));</div><div class='add'>+	test_dentry.d_sb = sb;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Helper function to create qstr */</div><div class='add'>+static void create_qstr(struct qstr *str, const char *name)</div><div class='add'>+{</div><div class='add'>+	str-&gt;name = name;</div><div class='add'>+	str-&gt;len = strlen(name);</div><div class='add'>+	str-&gt;hash = 0; /* Will be set by hash function */</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test hfsplus_hash_dentry basic functionality */</div><div class='add'>+static void hfsplus_hash_dentry_basic_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_sb *mock_sb;</div><div class='add'>+	struct qstr str1, str2;</div><div class='add'>+	int result;</div><div class='add'>+</div><div class='add'>+	mock_sb = setup_mock_sb();</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_sb);</div><div class='add'>+</div><div class='add'>+	setup_mock_dentry(&amp;mock_sb-&gt;sb);</div><div class='add'>+	mock_sb-&gt;nls.char2uni = test_char2uni;</div><div class='add'>+</div><div class='add'>+	/* Test basic string hashing */</div><div class='add'>+	create_qstr(&amp;str1, "hello");</div><div class='add'>+	result = hfsplus_hash_dentry(&amp;test_dentry, &amp;str1);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	KUNIT_EXPECT_NE(test, 0, str1.hash);</div><div class='add'>+</div><div class='add'>+	/* Test that identical strings produce identical hashes */</div><div class='add'>+	create_qstr(&amp;str2, "hello");</div><div class='add'>+	result = hfsplus_hash_dentry(&amp;test_dentry, &amp;str2);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, str1.hash, str2.hash);</div><div class='add'>+</div><div class='add'>+	/* Test empty string */</div><div class='add'>+	create_qstr(&amp;str1, "");</div><div class='add'>+	result = hfsplus_hash_dentry(&amp;test_dentry, &amp;str1);</div><div class='add'>+</div><div class='add'>+	/* Empty string should still produce a hash */</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	/* Test single character */</div><div class='add'>+	create_qstr(&amp;str1, "A");</div><div class='add'>+	result = hfsplus_hash_dentry(&amp;test_dentry, &amp;str1);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	KUNIT_EXPECT_NE(test, 0, str1.hash);</div><div class='add'>+</div><div class='add'>+	free_mock_sb(mock_sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test case folding behavior in hash */</div><div class='add'>+static void hfsplus_hash_dentry_casefold_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_sb *mock_sb;</div><div class='add'>+	struct qstr str1, str2;</div><div class='add'>+	int result;</div><div class='add'>+</div><div class='add'>+	mock_sb = setup_mock_sb();</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_sb);</div><div class='add'>+</div><div class='add'>+	setup_mock_dentry(&amp;mock_sb-&gt;sb);</div><div class='add'>+	mock_sb-&gt;nls.char2uni = test_char2uni;</div><div class='add'>+</div><div class='add'>+	/* Test with case folding disabled (default) */</div><div class='add'>+	clear_bit(HFSPLUS_SB_CASEFOLD, &amp;mock_sb-&gt;sb_info.flags);</div><div class='add'>+</div><div class='add'>+	create_qstr(&amp;str1, "Hello");</div><div class='add'>+	result = hfsplus_hash_dentry(&amp;test_dentry, &amp;str1);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	create_qstr(&amp;str2, "hello");</div><div class='add'>+	result = hfsplus_hash_dentry(&amp;test_dentry, &amp;str2);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Without case folding, different cases</div><div class='add'>+	 * should produce different hashes</div><div class='add'>+	 */</div><div class='add'>+	KUNIT_EXPECT_NE(test, str1.hash, str2.hash);</div><div class='add'>+</div><div class='add'>+	/* Test with case folding enabled */</div><div class='add'>+	set_bit(HFSPLUS_SB_CASEFOLD, &amp;mock_sb-&gt;sb_info.flags);</div><div class='add'>+</div><div class='add'>+	create_qstr(&amp;str1, "Hello");</div><div class='add'>+	result = hfsplus_hash_dentry(&amp;test_dentry, &amp;str1);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	create_qstr(&amp;str2, "hello");</div><div class='add'>+	result = hfsplus_hash_dentry(&amp;test_dentry, &amp;str2);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	/* With case folding, different cases should produce same hash */</div><div class='add'>+	KUNIT_EXPECT_EQ(test, str1.hash, str2.hash);</div><div class='add'>+</div><div class='add'>+	/* Test mixed case */</div><div class='add'>+	create_qstr(&amp;str1, "HeLLo");</div><div class='add'>+	result = hfsplus_hash_dentry(&amp;test_dentry, &amp;str1);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, str1.hash, str2.hash);</div><div class='add'>+</div><div class='add'>+	free_mock_sb(mock_sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test special character handling in hash */</div><div class='add'>+static void hfsplus_hash_dentry_special_chars_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_sb *mock_sb;</div><div class='add'>+	struct qstr str1, str2;</div><div class='add'>+	int result;</div><div class='add'>+</div><div class='add'>+	mock_sb = setup_mock_sb();</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_sb);</div><div class='add'>+</div><div class='add'>+	setup_mock_dentry(&amp;mock_sb-&gt;sb);</div><div class='add'>+	mock_sb-&gt;nls.char2uni = test_char2uni;</div><div class='add'>+</div><div class='add'>+	/* Test colon conversion (: becomes /) */</div><div class='add'>+	create_qstr(&amp;str1, "file:name");</div><div class='add'>+	result = hfsplus_hash_dentry(&amp;test_dentry, &amp;str1);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	create_qstr(&amp;str2, "file/name");</div><div class='add'>+	result = hfsplus_hash_dentry(&amp;test_dentry, &amp;str2);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	/* After conversion, these should produce the same hash */</div><div class='add'>+	KUNIT_EXPECT_EQ(test, str1.hash, str2.hash);</div><div class='add'>+</div><div class='add'>+	/* Test multiple special characters */</div><div class='add'>+	create_qstr(&amp;str1, ":::");</div><div class='add'>+	result = hfsplus_hash_dentry(&amp;test_dentry, &amp;str1);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	create_qstr(&amp;str2, "///");</div><div class='add'>+	result = hfsplus_hash_dentry(&amp;test_dentry, &amp;str2);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, str1.hash, str2.hash);</div><div class='add'>+</div><div class='add'>+	free_mock_sb(mock_sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test decomposition flag behavior in hash */</div><div class='add'>+static void hfsplus_hash_dentry_decompose_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_sb *mock_sb;</div><div class='add'>+	struct qstr str1, str2;</div><div class='add'>+	int result;</div><div class='add'>+</div><div class='add'>+	mock_sb = setup_mock_sb();</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_sb);</div><div class='add'>+</div><div class='add'>+	setup_mock_dentry(&amp;mock_sb-&gt;sb);</div><div class='add'>+	mock_sb-&gt;nls.char2uni = test_char2uni;</div><div class='add'>+</div><div class='add'>+	/* Test with decomposition disabled (default) */</div><div class='add'>+	clear_bit(HFSPLUS_SB_NODECOMPOSE, &amp;mock_sb-&gt;sb_info.flags);</div><div class='add'>+</div><div class='add'>+	create_qstr(&amp;str1, "test");</div><div class='add'>+	result = hfsplus_hash_dentry(&amp;test_dentry, &amp;str1);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	/* Test with decomposition enabled */</div><div class='add'>+	set_bit(HFSPLUS_SB_NODECOMPOSE, &amp;mock_sb-&gt;sb_info.flags);</div><div class='add'>+</div><div class='add'>+	create_qstr(&amp;str2, "test");</div><div class='add'>+	result = hfsplus_hash_dentry(&amp;test_dentry, &amp;str2);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * For simple ASCII, decomposition shouldn't change</div><div class='add'>+	 * the hash much but the function should still work correctly</div><div class='add'>+	 */</div><div class='add'>+	KUNIT_EXPECT_NE(test, 0, str2.hash);</div><div class='add'>+</div><div class='add'>+	free_mock_sb(mock_sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test hash consistency and distribution */</div><div class='add'>+static void hfsplus_hash_dentry_consistency_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_sb *mock_sb;</div><div class='add'>+	struct qstr str1, str2, str3;</div><div class='add'>+	unsigned long hash1;</div><div class='add'>+	int result;</div><div class='add'>+</div><div class='add'>+	mock_sb = setup_mock_sb();</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_sb);</div><div class='add'>+</div><div class='add'>+	setup_mock_dentry(&amp;mock_sb-&gt;sb);</div><div class='add'>+	mock_sb-&gt;nls.char2uni = test_char2uni;</div><div class='add'>+</div><div class='add'>+	/* Test that same string always produces same hash */</div><div class='add'>+	create_qstr(&amp;str1, "consistent");</div><div class='add'>+	result = hfsplus_hash_dentry(&amp;test_dentry, &amp;str1);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	hash1 = str1.hash;</div><div class='add'>+</div><div class='add'>+	create_qstr(&amp;str2, "consistent");</div><div class='add'>+	result = hfsplus_hash_dentry(&amp;test_dentry, &amp;str2);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, hash1, str2.hash);</div><div class='add'>+</div><div class='add'>+	/* Test that different strings produce different hashes */</div><div class='add'>+	create_qstr(&amp;str3, "different");</div><div class='add'>+	result = hfsplus_hash_dentry(&amp;test_dentry, &amp;str3);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_NE(test, str1.hash, str3.hash);</div><div class='add'>+</div><div class='add'>+	/* Test similar strings should have different hashes */</div><div class='add'>+	create_qstr(&amp;str1, "file1");</div><div class='add'>+	result = hfsplus_hash_dentry(&amp;test_dentry, &amp;str1);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	create_qstr(&amp;str2, "file2");</div><div class='add'>+	result = hfsplus_hash_dentry(&amp;test_dentry, &amp;str2);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_NE(test, str1.hash, str2.hash);</div><div class='add'>+</div><div class='add'>+	free_mock_sb(mock_sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test edge cases and boundary conditions */</div><div class='add'>+static void hfsplus_hash_dentry_edge_cases_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_sb *mock_sb;</div><div class='add'>+	struct test_mock_string_env *mock_env;</div><div class='add'>+	struct qstr str;</div><div class='add'>+	int result;</div><div class='add'>+</div><div class='add'>+	mock_env = setup_mock_str_env(HFSPLUS_MAX_STRLEN + 1);</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_env);</div><div class='add'>+</div><div class='add'>+	mock_sb = setup_mock_sb();</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_sb);</div><div class='add'>+</div><div class='add'>+	setup_mock_dentry(&amp;mock_sb-&gt;sb);</div><div class='add'>+	mock_sb-&gt;nls.char2uni = test_char2uni;</div><div class='add'>+</div><div class='add'>+	/* Test very long filename */</div><div class='add'>+	memset(mock_env-&gt;buf, 'a', mock_env-&gt;buf_size - 1);</div><div class='add'>+	mock_env-&gt;buf[mock_env-&gt;buf_size - 1] = '\0';</div><div class='add'>+</div><div class='add'>+	create_qstr(&amp;str, mock_env-&gt;buf);</div><div class='add'>+	result = hfsplus_hash_dentry(&amp;test_dentry, &amp;str);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	KUNIT_EXPECT_NE(test, 0, str.hash);</div><div class='add'>+</div><div class='add'>+	/* Test filename with all printable ASCII characters */</div><div class='add'>+	create_qstr(&amp;str, "!@#$%^&amp;*()_+-=[]{}|;':\",./&lt;&gt;?");</div><div class='add'>+	result = hfsplus_hash_dentry(&amp;test_dentry, &amp;str);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	KUNIT_EXPECT_NE(test, 0, str.hash);</div><div class='add'>+</div><div class='add'>+	/* Test with embedded null (though not typical for filenames) */</div><div class='add'>+	str.name = "file\0hidden";</div><div class='add'>+	str.len = 11; /* Include the null and text after it */</div><div class='add'>+	str.hash = 0;</div><div class='add'>+	result = hfsplus_hash_dentry(&amp;test_dentry, &amp;str);</div><div class='add'>+</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+	KUNIT_EXPECT_NE(test, 0, str.hash);</div><div class='add'>+</div><div class='add'>+	free_mock_str_env(mock_env);</div><div class='add'>+	free_mock_sb(mock_sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test hfsplus_compare_dentry basic functionality */</div><div class='add'>+static void hfsplus_compare_dentry_basic_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_sb *mock_sb;</div><div class='add'>+	struct qstr name;</div><div class='add'>+	int result;</div><div class='add'>+</div><div class='add'>+	mock_sb = setup_mock_sb();</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_sb);</div><div class='add'>+</div><div class='add'>+	setup_mock_dentry(&amp;mock_sb-&gt;sb);</div><div class='add'>+	mock_sb-&gt;nls.char2uni = test_char2uni;</div><div class='add'>+</div><div class='add'>+	/* Test identical strings */</div><div class='add'>+	create_qstr(&amp;name, "hello");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 5, "hello", &amp;name);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	/* Test different strings - lexicographic order */</div><div class='add'>+	create_qstr(&amp;name, "world");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 5, "hello", &amp;name);</div><div class='add'>+	KUNIT_EXPECT_LT(test, result, 0); /* "hello" &lt; "world" */</div><div class='add'>+</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 5, "world", &amp;name);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	create_qstr(&amp;name, "hello");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 5, "world", &amp;name);</div><div class='add'>+	KUNIT_EXPECT_GT(test, result, 0); /* "world" &gt; "hello" */</div><div class='add'>+</div><div class='add'>+	/* Test empty strings */</div><div class='add'>+	create_qstr(&amp;name, "");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 0, "", &amp;name);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	/* Test one empty, one non-empty */</div><div class='add'>+	create_qstr(&amp;name, "test");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 0, "", &amp;name);</div><div class='add'>+	KUNIT_EXPECT_LT(test, result, 0); /* "" &lt; "test" */</div><div class='add'>+</div><div class='add'>+	create_qstr(&amp;name, "");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 4, "test", &amp;name);</div><div class='add'>+	KUNIT_EXPECT_GT(test, result, 0); /* "test" &gt; "" */</div><div class='add'>+</div><div class='add'>+	free_mock_sb(mock_sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test case folding behavior in comparison */</div><div class='add'>+static void hfsplus_compare_dentry_casefold_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_sb *mock_sb;</div><div class='add'>+	struct qstr name;</div><div class='add'>+	int result;</div><div class='add'>+</div><div class='add'>+	mock_sb = setup_mock_sb();</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_sb);</div><div class='add'>+</div><div class='add'>+	setup_mock_dentry(&amp;mock_sb-&gt;sb);</div><div class='add'>+	mock_sb-&gt;nls.char2uni = test_char2uni;</div><div class='add'>+</div><div class='add'>+	/* Test with case folding disabled (default) */</div><div class='add'>+	clear_bit(HFSPLUS_SB_CASEFOLD, &amp;mock_sb-&gt;sb_info.flags);</div><div class='add'>+</div><div class='add'>+	create_qstr(&amp;name, "hello");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 5, "Hello", &amp;name);</div><div class='add'>+	/* Case sensitive: "Hello" != "hello" */</div><div class='add'>+	KUNIT_EXPECT_NE(test, 0, result);</div><div class='add'>+</div><div class='add'>+	create_qstr(&amp;name, "Hello");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 5, "hello", &amp;name);</div><div class='add'>+	/* Case sensitive: "hello" != "Hello" */</div><div class='add'>+	KUNIT_EXPECT_NE(test, 0, result);</div><div class='add'>+</div><div class='add'>+	/* Test with case folding enabled */</div><div class='add'>+	set_bit(HFSPLUS_SB_CASEFOLD, &amp;mock_sb-&gt;sb_info.flags);</div><div class='add'>+</div><div class='add'>+	create_qstr(&amp;name, "hello");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 5, "Hello", &amp;name);</div><div class='add'>+	/* Case insensitive: "Hello" == "hello" */</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	create_qstr(&amp;name, "Hello");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 5, "hello", &amp;name);</div><div class='add'>+	/* Case insensitive: "hello" == "Hello" */</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	/* Test mixed case */</div><div class='add'>+	create_qstr(&amp;name, "TeSt");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 4, "test", &amp;name);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	create_qstr(&amp;name, "test");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 4, "TEST", &amp;name);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	free_mock_sb(mock_sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test special character handling in comparison */</div><div class='add'>+static void hfsplus_compare_dentry_special_chars_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_sb *mock_sb;</div><div class='add'>+	struct qstr name;</div><div class='add'>+	int result;</div><div class='add'>+</div><div class='add'>+	mock_sb = setup_mock_sb();</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_sb);</div><div class='add'>+</div><div class='add'>+	setup_mock_dentry(&amp;mock_sb-&gt;sb);</div><div class='add'>+	mock_sb-&gt;nls.char2uni = test_char2uni;</div><div class='add'>+</div><div class='add'>+	/* Test colon conversion (: becomes /) */</div><div class='add'>+	create_qstr(&amp;name, "file/name");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 9, "file:name", &amp;name);</div><div class='add'>+	/* "file:name" == "file/name" after conversion */</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	create_qstr(&amp;name, "file:name");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 9, "file/name", &amp;name);</div><div class='add'>+	/* "file/name" == "file:name" after conversion */</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	/* Test multiple special characters */</div><div class='add'>+	create_qstr(&amp;name, "///");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 3, ":::", &amp;name);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	/* Test mixed special and regular characters */</div><div class='add'>+	create_qstr(&amp;name, "a/b:c");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 5, "a:b/c", &amp;name);</div><div class='add'>+	/* Both become "a/b/c" after conversion */</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	free_mock_sb(mock_sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test length differences */</div><div class='add'>+static void hfsplus_compare_dentry_length_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_sb *mock_sb;</div><div class='add'>+	struct qstr name;</div><div class='add'>+	int result;</div><div class='add'>+</div><div class='add'>+	mock_sb = setup_mock_sb();</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_sb);</div><div class='add'>+</div><div class='add'>+	setup_mock_dentry(&amp;mock_sb-&gt;sb);</div><div class='add'>+	mock_sb-&gt;nls.char2uni = test_char2uni;</div><div class='add'>+</div><div class='add'>+	/* Test different lengths with common prefix */</div><div class='add'>+	create_qstr(&amp;name, "testing");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 4, "test", &amp;name);</div><div class='add'>+	KUNIT_EXPECT_LT(test, result, 0); /* "test" &lt; "testing" */</div><div class='add'>+</div><div class='add'>+	create_qstr(&amp;name, "test");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 7, "testing", &amp;name);</div><div class='add'>+	KUNIT_EXPECT_GT(test, result, 0); /* "testing" &gt; "test" */</div><div class='add'>+</div><div class='add'>+	/* Test exact length match */</div><div class='add'>+	create_qstr(&amp;name, "exact");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 5, "exact", &amp;name);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	/* Test length parameter vs actual string content */</div><div class='add'>+	create_qstr(&amp;name, "hello");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 3, "hel", &amp;name);</div><div class='add'>+	KUNIT_EXPECT_LT(test, result, 0); /* "hel" &lt; "hello" */</div><div class='add'>+</div><div class='add'>+	/* Test longer first string but shorter length parameter */</div><div class='add'>+	create_qstr(&amp;name, "hi");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 2, "hello", &amp;name);</div><div class='add'>+	/* "he" &lt; "hi" (only first 2 chars compared) */</div><div class='add'>+	KUNIT_EXPECT_LT(test, result, 0);</div><div class='add'>+</div><div class='add'>+	free_mock_sb(mock_sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test decomposition flag behavior */</div><div class='add'>+static void hfsplus_compare_dentry_decompose_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_sb *mock_sb;</div><div class='add'>+	struct qstr name;</div><div class='add'>+	int result;</div><div class='add'>+</div><div class='add'>+	mock_sb = setup_mock_sb();</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_sb);</div><div class='add'>+</div><div class='add'>+	setup_mock_dentry(&amp;mock_sb-&gt;sb);</div><div class='add'>+	mock_sb-&gt;nls.char2uni = test_char2uni;</div><div class='add'>+</div><div class='add'>+	/* Test with decomposition disabled (default) */</div><div class='add'>+	clear_bit(HFSPLUS_SB_NODECOMPOSE, &amp;mock_sb-&gt;sb_info.flags);</div><div class='add'>+</div><div class='add'>+	create_qstr(&amp;name, "test");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 4, "test", &amp;name);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	/* Test with decomposition enabled */</div><div class='add'>+	set_bit(HFSPLUS_SB_NODECOMPOSE, &amp;mock_sb-&gt;sb_info.flags);</div><div class='add'>+</div><div class='add'>+	create_qstr(&amp;name, "test");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 4, "test", &amp;name);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	/* For simple ASCII, decomposition shouldn't affect the result */</div><div class='add'>+	create_qstr(&amp;name, "different");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 4, "test", &amp;name);</div><div class='add'>+	KUNIT_EXPECT_NE(test, 0, result);</div><div class='add'>+</div><div class='add'>+	free_mock_sb(mock_sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test edge cases and boundary conditions */</div><div class='add'>+static void hfsplus_compare_dentry_edge_cases_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_sb *mock_sb;</div><div class='add'>+	struct qstr name;</div><div class='add'>+	char *long_str;</div><div class='add'>+	char *long_str2;</div><div class='add'>+	u32 str_size = HFSPLUS_MAX_STRLEN + 1;</div><div class='add'>+	struct qstr null_name = {</div><div class='add'>+		.name = "a\0b",</div><div class='add'>+		.len = 3,</div><div class='add'>+		.hash = 0</div><div class='add'>+	};</div><div class='add'>+	int result;</div><div class='add'>+</div><div class='add'>+	mock_sb = setup_mock_sb();</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_sb);</div><div class='add'>+</div><div class='add'>+	setup_mock_dentry(&amp;mock_sb-&gt;sb);</div><div class='add'>+	mock_sb-&gt;nls.char2uni = test_char2uni;</div><div class='add'>+</div><div class='add'>+	long_str = kzalloc(str_size, GFP_KERNEL);</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, long_str);</div><div class='add'>+</div><div class='add'>+	long_str2 = kzalloc(str_size, GFP_KERNEL);</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, long_str2);</div><div class='add'>+</div><div class='add'>+	/* Test very long strings */</div><div class='add'>+	memset(long_str, 'a', str_size - 1);</div><div class='add'>+	long_str[str_size - 1] = '\0';</div><div class='add'>+</div><div class='add'>+	create_qstr(&amp;name, long_str);</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, str_size - 1,</div><div class='add'>+					long_str, &amp;name);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	/* Test with difference at the end of long strings */</div><div class='add'>+	memset(long_str2, 'a', str_size - 1);</div><div class='add'>+	long_str2[str_size - 1] = '\0';</div><div class='add'>+	long_str2[str_size - 2] = 'b';</div><div class='add'>+	create_qstr(&amp;name, long_str2);</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, str_size - 1,</div><div class='add'>+					long_str, &amp;name);</div><div class='add'>+	KUNIT_EXPECT_LT(test, result, 0); /* 'a' &lt; 'b' */</div><div class='add'>+</div><div class='add'>+	/* Test single character differences */</div><div class='add'>+	create_qstr(&amp;name, "b");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 1, "a", &amp;name);</div><div class='add'>+	KUNIT_EXPECT_LT(test, result, 0); /* 'a' &lt; 'b' */</div><div class='add'>+</div><div class='add'>+	create_qstr(&amp;name, "a");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 1, "b", &amp;name);</div><div class='add'>+	KUNIT_EXPECT_GT(test, result, 0); /* 'b' &gt; 'a' */</div><div class='add'>+</div><div class='add'>+	/* Test with null characters in the middle */</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 3, "a\0b", &amp;null_name);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	/* Test all printable ASCII characters */</div><div class='add'>+	create_qstr(&amp;name, "!@#$%^&amp;*()");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 10, "!@#$%^&amp;*()", &amp;name);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	kfree(long_str);</div><div class='add'>+	kfree(long_str2);</div><div class='add'>+	free_mock_sb(mock_sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Test combined flag behaviors */</div><div class='add'>+static void hfsplus_compare_dentry_combined_flags_test(struct kunit *test)</div><div class='add'>+{</div><div class='add'>+	struct test_mock_sb *mock_sb;</div><div class='add'>+	struct qstr name;</div><div class='add'>+	int result;</div><div class='add'>+</div><div class='add'>+	mock_sb = setup_mock_sb();</div><div class='add'>+	KUNIT_ASSERT_NOT_NULL(test, mock_sb);</div><div class='add'>+</div><div class='add'>+	setup_mock_dentry(&amp;mock_sb-&gt;sb);</div><div class='add'>+	mock_sb-&gt;nls.char2uni = test_char2uni;</div><div class='add'>+</div><div class='add'>+	/* Test with both casefold and decompose enabled */</div><div class='add'>+	set_bit(HFSPLUS_SB_CASEFOLD, &amp;mock_sb-&gt;sb_info.flags);</div><div class='add'>+	set_bit(HFSPLUS_SB_NODECOMPOSE, &amp;mock_sb-&gt;sb_info.flags);</div><div class='add'>+</div><div class='add'>+	create_qstr(&amp;name, "hello");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 5, "HELLO", &amp;name);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	/* Test special chars with case folding */</div><div class='add'>+	create_qstr(&amp;name, "File/Name");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 9, "file:name", &amp;name);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	/* Test with both flags disabled */</div><div class='add'>+	clear_bit(HFSPLUS_SB_CASEFOLD, &amp;mock_sb-&gt;sb_info.flags);</div><div class='add'>+	clear_bit(HFSPLUS_SB_NODECOMPOSE, &amp;mock_sb-&gt;sb_info.flags);</div><div class='add'>+</div><div class='add'>+	create_qstr(&amp;name, "hello");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 5, "HELLO", &amp;name);</div><div class='add'>+	KUNIT_EXPECT_NE(test, 0, result); /* Case sensitive */</div><div class='add'>+</div><div class='add'>+	/* But special chars should still be converted */</div><div class='add'>+	create_qstr(&amp;name, "file/name");</div><div class='add'>+	result = hfsplus_compare_dentry(&amp;test_dentry, 9, "file:name", &amp;name);</div><div class='add'>+	KUNIT_EXPECT_EQ(test, 0, result);</div><div class='add'>+</div><div class='add'>+	free_mock_sb(mock_sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct kunit_case hfsplus_unicode_test_cases[] = {</div><div class='add'>+	KUNIT_CASE(hfsplus_strcasecmp_test),</div><div class='add'>+	KUNIT_CASE(hfsplus_strcmp_test),</div><div class='add'>+	KUNIT_CASE(hfsplus_unicode_edge_cases_test),</div><div class='add'>+	KUNIT_CASE(hfsplus_unicode_boundary_test),</div><div class='add'>+	KUNIT_CASE(hfsplus_uni2asc_basic_test),</div><div class='add'>+	KUNIT_CASE(hfsplus_uni2asc_special_chars_test),</div><div class='add'>+	KUNIT_CASE(hfsplus_uni2asc_buffer_test),</div><div class='add'>+	KUNIT_CASE(hfsplus_uni2asc_corrupted_test),</div><div class='add'>+	KUNIT_CASE(hfsplus_uni2asc_edge_cases_test),</div><div class='add'>+	KUNIT_CASE(hfsplus_asc2uni_basic_test),</div><div class='add'>+	KUNIT_CASE(hfsplus_asc2uni_special_chars_test),</div><div class='add'>+	KUNIT_CASE(hfsplus_asc2uni_buffer_limits_test),</div><div class='add'>+	KUNIT_CASE(hfsplus_asc2uni_edge_cases_test),</div><div class='add'>+	KUNIT_CASE(hfsplus_asc2uni_decompose_test),</div><div class='add'>+	KUNIT_CASE(hfsplus_hash_dentry_basic_test),</div><div class='add'>+	KUNIT_CASE(hfsplus_hash_dentry_casefold_test),</div><div class='add'>+	KUNIT_CASE(hfsplus_hash_dentry_special_chars_test),</div><div class='add'>+	KUNIT_CASE(hfsplus_hash_dentry_decompose_test),</div><div class='add'>+	KUNIT_CASE(hfsplus_hash_dentry_consistency_test),</div><div class='add'>+	KUNIT_CASE(hfsplus_hash_dentry_edge_cases_test),</div><div class='add'>+	KUNIT_CASE(hfsplus_compare_dentry_basic_test),</div><div class='add'>+	KUNIT_CASE(hfsplus_compare_dentry_casefold_test),</div><div class='add'>+	KUNIT_CASE(hfsplus_compare_dentry_special_chars_test),</div><div class='add'>+	KUNIT_CASE(hfsplus_compare_dentry_length_test),</div><div class='add'>+	KUNIT_CASE(hfsplus_compare_dentry_decompose_test),</div><div class='add'>+	KUNIT_CASE(hfsplus_compare_dentry_edge_cases_test),</div><div class='add'>+	KUNIT_CASE(hfsplus_compare_dentry_combined_flags_test),</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static struct kunit_suite hfsplus_unicode_test_suite = {</div><div class='add'>+	.name = "hfsplus_unicode",</div><div class='add'>+	.test_cases = hfsplus_unicode_test_cases,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+kunit_test_suite(hfsplus_unicode_test_suite);</div><div class='add'>+</div><div class='add'>+MODULE_DESCRIPTION("KUnit tests for HFS+ Unicode string operations");</div><div class='add'>+MODULE_LICENSE("GPL");</div><div class='add'>+MODULE_IMPORT_NS("EXPORTED_FOR_KUNIT_TESTING");</div><div class='head'>diff --git a/fs/hfsplus/wrapper.c b/fs/hfsplus/wrapper.c<br/>index 51ae6f1eb4a5..30cf4fe78b3d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/wrapper.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/wrapper.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/wrapper.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfsplus/wrapper.c</a></div><div class='hunk'>@@ -12,8 +12,7 @@</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/blkdev.h&gt;</div><div class='ctx'> #include &lt;linux/cdrom.h&gt;</div><div class='del'>-#include &lt;linux/genhd.h&gt;</div><div class='del'>-#include &lt;asm/unaligned.h&gt;</div><div class='add'>+#include &lt;linux/unaligned.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "hfsplus_fs.h"</div><div class='ctx'> #include "hfsplus_raw.h"</div><div class='hunk'>@@ -31,8 +30,7 @@ struct hfsplus_wd {</div><div class='ctx'>  * @sector: block to read or write, for blocks of HFSPLUS_SECTOR_SIZE bytes</div><div class='ctx'>  * @buf: buffer for I/O</div><div class='ctx'>  * @data: output pointer for location of requested data</div><div class='del'>- * @op: direction of I/O</div><div class='del'>- * @op_flags: request op flags</div><div class='add'>+ * @opf: I/O operation type and flags</div><div class='ctx'>  *</div><div class='ctx'>  * The unit of I/O is hfsplus_min_io_size(sb), which may be bigger than</div><div class='ctx'>  * HFSPLUS_SECTOR_SIZE, and @buf must be sized accordingly. On reads</div><div class='hunk'>@@ -44,52 +42,25 @@ struct hfsplus_wd {</div><div class='ctx'>  * that starts at the rounded-down address. As long as the data was</div><div class='ctx'>  * read using hfsplus_submit_bio() and the same buffer is used things</div><div class='ctx'>  * will work correctly.</div><div class='add'>+ *</div><div class='add'>+ * Returns: %0 on success else -errno code</div><div class='ctx'>  */</div><div class='ctx'> int hfsplus_submit_bio(struct super_block *sb, sector_t sector,</div><div class='del'>-		       void *buf, void **data, int op, int op_flags)</div><div class='add'>+		       void *buf, void **data, blk_opf_t opf)</div><div class='ctx'> {</div><div class='del'>-	struct bio *bio;</div><div class='del'>-	int ret = 0;</div><div class='del'>-	u64 io_size;</div><div class='del'>-	loff_t start;</div><div class='del'>-	int offset;</div><div class='add'>+	u64 io_size = hfsplus_min_io_size(sb);</div><div class='add'>+	loff_t start = (loff_t)sector &lt;&lt; HFSPLUS_SECTOR_SHIFT;</div><div class='add'>+	int offset = start &amp; (io_size - 1);</div><div class='add'>+</div><div class='add'>+	if ((opf &amp; REQ_OP_MASK) != REQ_OP_WRITE &amp;&amp; data)</div><div class='add'>+		*data = (u8 *)buf + offset;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Align sector to hardware sector size and find offset. We</div><div class='del'>-	 * assume that io_size is a power of two, which _should_</div><div class='del'>-	 * be true.</div><div class='add'>+	 * Align sector to hardware sector size and find offset. We assume that</div><div class='add'>+	 * io_size is a power of two, which _should_ be true.</div><div class='ctx'> 	 */</div><div class='del'>-	io_size = hfsplus_min_io_size(sb);</div><div class='del'>-	start = (loff_t)sector &lt;&lt; HFSPLUS_SECTOR_SHIFT;</div><div class='del'>-	offset = start &amp; (io_size - 1);</div><div class='ctx'> 	sector &amp;= ~((io_size &gt;&gt; HFSPLUS_SECTOR_SHIFT) - 1);</div><div class='del'>-</div><div class='del'>-	bio = bio_alloc(GFP_NOIO, 1);</div><div class='del'>-	bio-&gt;bi_iter.bi_sector = sector;</div><div class='del'>-	bio_set_dev(bio, sb-&gt;s_bdev);</div><div class='del'>-	bio_set_op_attrs(bio, op, op_flags);</div><div class='del'>-</div><div class='del'>-	if (op != WRITE &amp;&amp; data)</div><div class='del'>-		*data = (u8 *)buf + offset;</div><div class='del'>-</div><div class='del'>-	while (io_size &gt; 0) {</div><div class='del'>-		unsigned int page_offset = offset_in_page(buf);</div><div class='del'>-		unsigned int len = min_t(unsigned int, PAGE_SIZE - page_offset,</div><div class='del'>-					 io_size);</div><div class='del'>-</div><div class='del'>-		ret = bio_add_page(bio, virt_to_page(buf), len, page_offset);</div><div class='del'>-		if (ret != len) {</div><div class='del'>-			ret = -EIO;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		io_size -= len;</div><div class='del'>-		buf = (u8 *)buf + len;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = submit_bio_wait(bio);</div><div class='del'>-out:</div><div class='del'>-	bio_put(bio);</div><div class='del'>-	return ret &lt; 0 ? ret : 0;</div><div class='add'>+	return bdev_rw_virt(sb-&gt;s_bdev, sector, buf, io_size, opf);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int hfsplus_read_mdb(void *bufptr, struct hfsplus_wd *wd)</div><div class='hunk'>@@ -173,6 +144,8 @@ int hfsplus_read_wrapper(struct super_block *sb)</div><div class='ctx'> 	if (!blocksize)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='add'>+	sbi-&gt;min_io_size = blocksize;</div><div class='add'>+</div><div class='ctx'> 	if (hfsplus_get_last_session(sb, &amp;part_start, &amp;part_size))</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -187,7 +160,7 @@ int hfsplus_read_wrapper(struct super_block *sb)</div><div class='ctx'> reread:</div><div class='ctx'> 	error = hfsplus_submit_bio(sb, part_start + HFSPLUS_VOLHEAD_SECTOR,</div><div class='ctx'> 				   sbi-&gt;s_vhdr_buf, (void **)&amp;sbi-&gt;s_vhdr,</div><div class='del'>-				   REQ_OP_READ, 0);</div><div class='add'>+				   REQ_OP_READ);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out_free_backup_vhdr;</div><div class='ctx'> </div><div class='hunk'>@@ -219,8 +192,7 @@ reread:</div><div class='ctx'> </div><div class='ctx'> 	error = hfsplus_submit_bio(sb, part_start + part_size - 2,</div><div class='ctx'> 				   sbi-&gt;s_backup_vhdr_buf,</div><div class='del'>-				   (void **)&amp;sbi-&gt;s_backup_vhdr, REQ_OP_READ,</div><div class='del'>-				   0);</div><div class='add'>+				   (void **)&amp;sbi-&gt;s_backup_vhdr, REQ_OP_READ);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out_free_backup_vhdr;</div><div class='ctx'> </div><div class='head'>diff --git a/fs/hfsplus/xattr.c b/fs/hfsplus/xattr.c<br/>index e2855ceefd39..da95a9de9a65 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/xattr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/xattr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/xattr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfsplus/xattr.c</a></div><div class='hunk'>@@ -13,7 +13,7 @@</div><div class='ctx'> </div><div class='ctx'> static int hfsplus_removexattr(struct inode *inode, const char *name);</div><div class='ctx'> </div><div class='del'>-const struct xattr_handler *hfsplus_xattr_handlers[] = {</div><div class='add'>+const struct xattr_handler * const hfsplus_xattr_handlers[] = {</div><div class='ctx'> 	&amp;hfsplus_xattr_osx_handler,</div><div class='ctx'> 	&amp;hfsplus_xattr_user_handler,</div><div class='ctx'> 	&amp;hfsplus_xattr_trusted_handler,</div><div class='hunk'>@@ -64,7 +64,7 @@ static void hfsplus_init_header_node(struct inode *attr_file,</div><div class='ctx'> 	u32 used_bmp_bytes;</div><div class='ctx'> 	u64 tmp;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(ATTR_MOD, "init_hdr_attr_file: clump %u, node_size %u\n",</div><div class='add'>+	hfs_dbg("clump %u, node_size %u\n",</div><div class='ctx'> 		clump_size, node_size);</div><div class='ctx'> </div><div class='ctx'> 	/* The end of the node contains list of record offsets */</div><div class='hunk'>@@ -132,7 +132,7 @@ static int hfsplus_create_attributes_file(struct super_block *sb)</div><div class='ctx'> 	struct page *page;</div><div class='ctx'> 	int old_state = HFSPLUS_EMPTY_ATTR_TREE;</div><div class='ctx'> </div><div class='del'>-	hfs_dbg(ATTR_MOD, "create_attr_file: ino %d\n", HFSPLUS_ATTR_CNID);</div><div class='add'>+	hfs_dbg("ino %d\n", HFSPLUS_ATTR_CNID);</div><div class='ctx'> </div><div class='ctx'> check_attr_tree_state_again:</div><div class='ctx'> 	switch (atomic_read(&amp;sbi-&gt;attr_tree_state)) {</div><div class='hunk'>@@ -172,7 +172,11 @@ check_attr_tree_state_again:</div><div class='ctx'> 		return PTR_ERR(attr_file);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	BUG_ON(i_size_read(attr_file) != 0);</div><div class='add'>+	if (i_size_read(attr_file) != 0) {</div><div class='add'>+		err = -EIO;</div><div class='add'>+		pr_err("detected inconsistent attributes file, running fsck.hfsplus is recommended.\n");</div><div class='add'>+		goto end_attr_file_creation;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	hip = HFSPLUS_I(attr_file);</div><div class='ctx'> </div><div class='hunk'>@@ -257,14 +261,12 @@ end_attr_file_creation:</div><div class='ctx'> int __hfsplus_setxattr(struct inode *inode, const char *name,</div><div class='ctx'> 			const void *value, size_t size, int flags)</div><div class='ctx'> {</div><div class='del'>-	int err = 0;</div><div class='add'>+	int err;</div><div class='ctx'> 	struct hfs_find_data cat_fd;</div><div class='ctx'> 	hfsplus_cat_entry entry;</div><div class='ctx'> 	u16 cat_entry_flags, cat_entry_type;</div><div class='del'>-	u16 folder_finderinfo_len = sizeof(struct DInfo) +</div><div class='del'>-					sizeof(struct DXInfo);</div><div class='del'>-	u16 file_finderinfo_len = sizeof(struct FInfo) +</div><div class='del'>-					sizeof(struct FXInfo);</div><div class='add'>+	u16 folder_finderinfo_len = sizeof(DInfo) + sizeof(DXInfo);</div><div class='add'>+	u16 file_finderinfo_len = sizeof(FInfo) + sizeof(FXInfo);</div><div class='ctx'> </div><div class='ctx'> 	if ((!S_ISREG(inode-&gt;i_mode) &amp;&amp;</div><div class='ctx'> 			!S_ISDIR(inode-&gt;i_mode)) ||</div><div class='hunk'>@@ -296,7 +298,7 @@ int __hfsplus_setxattr(struct inode *inode, const char *name,</div><div class='ctx'> 					sizeof(hfsplus_cat_entry));</div><div class='ctx'> 		if (be16_to_cpu(entry.type) == HFSPLUS_FOLDER) {</div><div class='ctx'> 			if (size == folder_finderinfo_len) {</div><div class='del'>-				memcpy(&amp;entry.folder.user_info, value,</div><div class='add'>+				memcpy(&amp;entry.folder.info, value,</div><div class='ctx'> 						folder_finderinfo_len);</div><div class='ctx'> 				hfs_bnode_write(cat_fd.bnode, &amp;entry,</div><div class='ctx'> 					cat_fd.entryoffset,</div><div class='hunk'>@@ -309,7 +311,7 @@ int __hfsplus_setxattr(struct inode *inode, const char *name,</div><div class='ctx'> 			}</div><div class='ctx'> 		} else if (be16_to_cpu(entry.type) == HFSPLUS_FILE) {</div><div class='ctx'> 			if (size == file_finderinfo_len) {</div><div class='del'>-				memcpy(&amp;entry.file.user_info, value,</div><div class='add'>+				memcpy(&amp;entry.file.info, value,</div><div class='ctx'> 						file_finderinfo_len);</div><div class='ctx'> 				hfs_bnode_write(cat_fd.bnode, &amp;entry,</div><div class='ctx'> 					cat_fd.entryoffset,</div><div class='hunk'>@@ -400,21 +402,19 @@ static int name_len(const char *xattr_name, int xattr_name_len)</div><div class='ctx'> 	return len;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int copy_name(char *buffer, const char *xattr_name, int name_len)</div><div class='add'>+static ssize_t copy_name(char *buffer, const char *xattr_name, int name_len)</div><div class='ctx'> {</div><div class='del'>-	int len = name_len;</div><div class='del'>-	int offset = 0;</div><div class='del'>-</div><div class='del'>-	if (!is_known_namespace(xattr_name)) {</div><div class='del'>-		memcpy(buffer, XATTR_MAC_OSX_PREFIX, XATTR_MAC_OSX_PREFIX_LEN);</div><div class='del'>-		offset += XATTR_MAC_OSX_PREFIX_LEN;</div><div class='del'>-		len += XATTR_MAC_OSX_PREFIX_LEN;</div><div class='del'>-	}</div><div class='add'>+	ssize_t len;</div><div class='ctx'> </div><div class='del'>-	strncpy(buffer + offset, xattr_name, name_len);</div><div class='del'>-	memset(buffer + offset + name_len, 0, 1);</div><div class='del'>-	len += 1;</div><div class='add'>+	if (!is_known_namespace(xattr_name))</div><div class='add'>+		len = scnprintf(buffer, name_len + XATTR_MAC_OSX_PREFIX_LEN,</div><div class='add'>+				 "%s%s", XATTR_MAC_OSX_PREFIX, xattr_name);</div><div class='add'>+	else</div><div class='add'>+		len = strscpy(buffer, xattr_name, name_len + 1);</div><div class='ctx'> </div><div class='add'>+	/* include NUL-byte in length for non-empty name */</div><div class='add'>+	if (len &gt;= 0)</div><div class='add'>+		len++;</div><div class='ctx'> 	return len;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -442,11 +442,11 @@ static ssize_t hfsplus_getxattr_finder_info(struct inode *inode,</div><div class='ctx'> 	ssize_t res = 0;</div><div class='ctx'> 	struct hfs_find_data fd;</div><div class='ctx'> 	u16 entry_type;</div><div class='del'>-	u16 folder_rec_len = sizeof(struct DInfo) + sizeof(struct DXInfo);</div><div class='del'>-	u16 file_rec_len = sizeof(struct FInfo) + sizeof(struct FXInfo);</div><div class='add'>+	u16 folder_rec_len = sizeof(DInfo) + sizeof(DXInfo);</div><div class='add'>+	u16 file_rec_len = sizeof(FInfo) + sizeof(FXInfo);</div><div class='ctx'> 	u16 record_len = max(folder_rec_len, file_rec_len);</div><div class='del'>-	u8 folder_finder_info[sizeof(struct DInfo) + sizeof(struct DXInfo)];</div><div class='del'>-	u8 file_finder_info[sizeof(struct FInfo) + sizeof(struct FXInfo)];</div><div class='add'>+	u8 folder_finder_info[sizeof(DInfo) + sizeof(DXInfo)];</div><div class='add'>+	u8 file_finder_info[sizeof(FInfo) + sizeof(FXInfo)];</div><div class='ctx'> </div><div class='ctx'> 	if (size &gt;= record_len) {</div><div class='ctx'> 		res = hfs_find_init(HFSPLUS_SB(inode-&gt;i_sb)-&gt;cat_tree, &amp;fd);</div><div class='hunk'>@@ -494,7 +494,7 @@ ssize_t __hfsplus_getxattr(struct inode *inode, const char *name,</div><div class='ctx'> 	__be32 xattr_record_type;</div><div class='ctx'> 	u32 record_type;</div><div class='ctx'> 	u16 record_length = 0;</div><div class='del'>-	ssize_t res = 0;</div><div class='add'>+	ssize_t res;</div><div class='ctx'> </div><div class='ctx'> 	if ((!S_ISREG(inode-&gt;i_mode) &amp;&amp;</div><div class='ctx'> 			!S_ISDIR(inode-&gt;i_mode)) ||</div><div class='hunk'>@@ -606,12 +606,12 @@ static inline int can_list(const char *xattr_name)</div><div class='ctx'> static ssize_t hfsplus_listxattr_finder_info(struct dentry *dentry,</div><div class='ctx'> 						char *buffer, size_t size)</div><div class='ctx'> {</div><div class='del'>-	ssize_t res = 0;</div><div class='add'>+	ssize_t res;</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	struct hfs_find_data fd;</div><div class='ctx'> 	u16 entry_type;</div><div class='del'>-	u8 folder_finder_info[sizeof(struct DInfo) + sizeof(struct DXInfo)];</div><div class='del'>-	u8 file_finder_info[sizeof(struct FInfo) + sizeof(struct FXInfo)];</div><div class='add'>+	u8 folder_finder_info[sizeof(DInfo) + sizeof(DXInfo)];</div><div class='add'>+	u8 file_finder_info[sizeof(FInfo) + sizeof(FXInfo)];</div><div class='ctx'> 	unsigned long len, found_bit;</div><div class='ctx'> 	int xattr_name_len, symbols_count;</div><div class='ctx'> </div><div class='hunk'>@@ -627,14 +627,14 @@ static ssize_t hfsplus_listxattr_finder_info(struct dentry *dentry,</div><div class='ctx'> </div><div class='ctx'> 	entry_type = hfs_bnode_read_u16(fd.bnode, fd.entryoffset);</div><div class='ctx'> 	if (entry_type == HFSPLUS_FOLDER) {</div><div class='del'>-		len = sizeof(struct DInfo) + sizeof(struct DXInfo);</div><div class='add'>+		len = sizeof(DInfo) + sizeof(DXInfo);</div><div class='ctx'> 		hfs_bnode_read(fd.bnode, folder_finder_info,</div><div class='ctx'> 				fd.entryoffset +</div><div class='ctx'> 				offsetof(struct hfsplus_cat_folder, user_info),</div><div class='ctx'> 				len);</div><div class='ctx'> 		found_bit = find_first_bit((void *)folder_finder_info, len*8);</div><div class='ctx'> 	} else if (entry_type == HFSPLUS_FILE) {</div><div class='del'>-		len = sizeof(struct FInfo) + sizeof(struct FXInfo);</div><div class='add'>+		len = sizeof(FInfo) + sizeof(FXInfo);</div><div class='ctx'> 		hfs_bnode_read(fd.bnode, file_finder_info,</div><div class='ctx'> 				fd.entryoffset +</div><div class='ctx'> 				offsetof(struct hfsplus_cat_file, user_info),</div><div class='hunk'>@@ -674,10 +674,9 @@ end_listxattr_finder_info:</div><div class='ctx'> ssize_t hfsplus_listxattr(struct dentry *dentry, char *buffer, size_t size)</div><div class='ctx'> {</div><div class='ctx'> 	ssize_t err;</div><div class='del'>-	ssize_t res = 0;</div><div class='add'>+	ssize_t res;</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	struct hfs_find_data fd;</div><div class='del'>-	u16 key_len = 0;</div><div class='ctx'> 	struct hfsplus_attr_key attr_key;</div><div class='ctx'> 	char *strbuf;</div><div class='ctx'> 	int xattr_name_len;</div><div class='hunk'>@@ -699,7 +698,7 @@ ssize_t hfsplus_listxattr(struct dentry *dentry, char *buffer, size_t size)</div><div class='ctx'> 		return err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	strbuf = kmalloc(NLS_MAX_CHARSET_SIZE * HFSPLUS_ATTR_MAX_STRLEN +</div><div class='add'>+	strbuf = kzalloc(NLS_MAX_CHARSET_SIZE * HFSPLUS_ATTR_MAX_STRLEN +</div><div class='ctx'> 			XATTR_MAC_OSX_PREFIX_LEN + 1, GFP_KERNEL);</div><div class='ctx'> 	if (!strbuf) {</div><div class='ctx'> 		res = -ENOMEM;</div><div class='hunk'>@@ -719,7 +718,8 @@ ssize_t hfsplus_listxattr(struct dentry *dentry, char *buffer, size_t size)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	for (;;) {</div><div class='del'>-		key_len = hfs_bnode_read_u16(fd.bnode, fd.keyoffset);</div><div class='add'>+		u16 key_len = hfs_bnode_read_u16(fd.bnode, fd.keyoffset);</div><div class='add'>+</div><div class='ctx'> 		if (key_len == 0 || key_len &gt; fd.tree-&gt;max_key_len) {</div><div class='ctx'> 			pr_err("invalid xattr key length: %d\n", key_len);</div><div class='ctx'> 			res = -EIO;</div><div class='hunk'>@@ -733,9 +733,9 @@ ssize_t hfsplus_listxattr(struct dentry *dentry, char *buffer, size_t size)</div><div class='ctx'> 			goto end_listxattr;</div><div class='ctx'> </div><div class='ctx'> 		xattr_name_len = NLS_MAX_CHARSET_SIZE * HFSPLUS_ATTR_MAX_STRLEN;</div><div class='del'>-		if (hfsplus_uni2asc(inode-&gt;i_sb,</div><div class='del'>-			(const struct hfsplus_unistr *)&amp;fd.key-&gt;attr.key_name,</div><div class='del'>-					strbuf, &amp;xattr_name_len)) {</div><div class='add'>+		if (hfsplus_uni2asc_xattr_str(inode-&gt;i_sb,</div><div class='add'>+					      &amp;fd.key-&gt;attr.key_name, strbuf,</div><div class='add'>+					      &amp;xattr_name_len)) {</div><div class='ctx'> 			pr_err("unicode conversion failed\n");</div><div class='ctx'> 			res = -EIO;</div><div class='ctx'> 			goto end_listxattr;</div><div class='hunk'>@@ -766,12 +766,12 @@ out:</div><div class='ctx'> </div><div class='ctx'> static int hfsplus_removexattr(struct inode *inode, const char *name)</div><div class='ctx'> {</div><div class='del'>-	int err = 0;</div><div class='add'>+	int err;</div><div class='ctx'> 	struct hfs_find_data cat_fd;</div><div class='ctx'> 	u16 flags;</div><div class='ctx'> 	u16 cat_entry_type;</div><div class='del'>-	int is_xattr_acl_deleted = 0;</div><div class='del'>-	int is_all_xattrs_deleted = 0;</div><div class='add'>+	int is_xattr_acl_deleted;</div><div class='add'>+	int is_all_xattrs_deleted;</div><div class='ctx'> </div><div class='ctx'> 	if (!HFSPLUS_SB(inode-&gt;i_sb)-&gt;attr_tree)</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='hunk'>@@ -857,7 +857,7 @@ static int hfsplus_osx_getxattr(const struct xattr_handler *handler,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int hfsplus_osx_setxattr(const struct xattr_handler *handler,</div><div class='del'>-				struct user_namespace *mnt_userns,</div><div class='add'>+				struct mnt_idmap *idmap,</div><div class='ctx'> 				struct dentry *unused, struct inode *inode,</div><div class='ctx'> 				const char *name, const void *buffer,</div><div class='ctx'> 				size_t size, int flags)</div><div class='head'>diff --git a/fs/hfsplus/xattr.h b/fs/hfsplus/xattr.h<br/>index d14e362b3eba..15cc55e41410 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/xattr.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/xattr.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/xattr.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfsplus/xattr.h</a></div><div class='hunk'>@@ -17,7 +17,7 @@ extern const struct xattr_handler hfsplus_xattr_user_handler;</div><div class='ctx'> extern const struct xattr_handler hfsplus_xattr_trusted_handler;</div><div class='ctx'> extern const struct xattr_handler hfsplus_xattr_security_handler;</div><div class='ctx'> </div><div class='del'>-extern const struct xattr_handler *hfsplus_xattr_handlers[];</div><div class='add'>+extern const struct xattr_handler * const hfsplus_xattr_handlers[];</div><div class='ctx'> </div><div class='ctx'> int __hfsplus_setxattr(struct inode *inode, const char *name,</div><div class='ctx'> 			const void *value, size_t size, int flags);</div><div class='head'>diff --git a/fs/hfsplus/xattr_security.c b/fs/hfsplus/xattr_security.c<br/>index c1c7a16cbf21..90f68ec119cd 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/xattr_security.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/xattr_security.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/xattr_security.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfsplus/xattr_security.c</a></div><div class='hunk'>@@ -23,7 +23,7 @@ static int hfsplus_security_getxattr(const struct xattr_handler *handler,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int hfsplus_security_setxattr(const struct xattr_handler *handler,</div><div class='del'>-				     struct user_namespace *mnt_userns,</div><div class='add'>+				     struct mnt_idmap *idmap,</div><div class='ctx'> 				     struct dentry *unused, struct inode *inode,</div><div class='ctx'> 				     const char *name, const void *buffer,</div><div class='ctx'> 				     size_t size, int flags)</div><div class='head'>diff --git a/fs/hfsplus/xattr_trusted.c b/fs/hfsplus/xattr_trusted.c<br/>index e150372ec564..fdbaebc1c49a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/xattr_trusted.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/xattr_trusted.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/xattr_trusted.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfsplus/xattr_trusted.c</a></div><div class='hunk'>@@ -22,7 +22,7 @@ static int hfsplus_trusted_getxattr(const struct xattr_handler *handler,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int hfsplus_trusted_setxattr(const struct xattr_handler *handler,</div><div class='del'>-				    struct user_namespace *mnt_userns,</div><div class='add'>+				    struct mnt_idmap *idmap,</div><div class='ctx'> 				    struct dentry *unused, struct inode *inode,</div><div class='ctx'> 				    const char *name, const void *buffer,</div><div class='ctx'> 				    size_t size, int flags)</div><div class='head'>diff --git a/fs/hfsplus/xattr_user.c b/fs/hfsplus/xattr_user.c<br/>index a6b60b153916..6464b6c3d58d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/xattr_user.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hfsplus/xattr_user.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hfsplus/xattr_user.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hfsplus/xattr_user.c</a></div><div class='hunk'>@@ -22,7 +22,7 @@ static int hfsplus_user_getxattr(const struct xattr_handler *handler,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int hfsplus_user_setxattr(const struct xattr_handler *handler,</div><div class='del'>-				 struct user_namespace *mnt_userns,</div><div class='add'>+				 struct mnt_idmap *idmap,</div><div class='ctx'> 				 struct dentry *unused, struct inode *inode,</div><div class='ctx'> 				 const char *name, const void *buffer,</div><div class='ctx'> 				 size_t size, int flags)</div><div class='head'>diff --git a/fs/hostfs/Makefile b/fs/hostfs/Makefile<br/>index d5beaffad43b..16be592e8085 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hostfs/Makefile?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hostfs/Makefile</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hostfs/Makefile?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hostfs/Makefile</a></div><div class='hunk'>@@ -3,9 +3,11 @@</div><div class='ctx'> # Licensed under the GPL</div><div class='ctx'> #</div><div class='ctx'> </div><div class='del'>-hostfs-objs := hostfs_kern.o hostfs_user.o</div><div class='add'>+hostfs-objs := hostfs_kern.o</div><div class='ctx'> </div><div class='del'>-obj-y :=</div><div class='add'>+hostfs-builtin-$(CONFIG_HOSTFS) += hostfs_user.o hostfs_user_exp.o</div><div class='add'>+</div><div class='add'>+obj-y := $(hostfs-builtin-y) $(hostfs-builtin-m)</div><div class='ctx'> obj-$(CONFIG_HOSTFS) += hostfs.o</div><div class='ctx'> </div><div class='del'>-include arch/um/scripts/Makefile.rules</div><div class='add'>+include $(srctree)/arch/um/scripts/Makefile.rules</div><div class='head'>diff --git a/fs/hostfs/hostfs.h b/fs/hostfs/hostfs.h<br/>index 69cb796f6270..aa02599b770f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hostfs/hostfs.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hostfs/hostfs.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hostfs/hostfs.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hostfs/hostfs.h</a></div><div class='hunk'>@@ -3,40 +3,8 @@</div><div class='ctx'> #define __UM_FS_HOSTFS</div><div class='ctx'> </div><div class='ctx'> #include &lt;os.h&gt;</div><div class='add'>+#include &lt;generated/asm-offsets.h&gt;</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * These are exactly the same definitions as in fs.h, but the names are</div><div class='del'>- * changed so that this file can be included in both kernel and user files.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#define HOSTFS_ATTR_MODE	1</div><div class='del'>-#define HOSTFS_ATTR_UID 	2</div><div class='del'>-#define HOSTFS_ATTR_GID 	4</div><div class='del'>-#define HOSTFS_ATTR_SIZE	8</div><div class='del'>-#define HOSTFS_ATTR_ATIME	16</div><div class='del'>-#define HOSTFS_ATTR_MTIME	32</div><div class='del'>-#define HOSTFS_ATTR_CTIME	64</div><div class='del'>-#define HOSTFS_ATTR_ATIME_SET	128</div><div class='del'>-#define HOSTFS_ATTR_MTIME_SET	256</div><div class='del'>-</div><div class='del'>-/* This one is unused by hostfs. */</div><div class='del'>-#define HOSTFS_ATTR_FORCE	512	/* Not a change, but a change it */</div><div class='del'>-#define HOSTFS_ATTR_ATTR_FLAG	1024</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * If you are very careful, you'll notice that these two are missing:</div><div class='del'>- *</div><div class='del'>- * #define ATTR_KILL_SUID	2048</div><div class='del'>- * #define ATTR_KILL_SGID	4096</div><div class='del'>- *</div><div class='del'>- * and this is because they were added in 2.5 development.</div><div class='del'>- * Actually, they are not needed by most -&gt;setattr() methods - they are set by</div><div class='del'>- * callers of notify_change() to notify that the setuid/setgid bits must be</div><div class='del'>- * dropped.</div><div class='del'>- * notify_change() will delete those flags, make sure attr-&gt;ia_valid &amp; ATTR_MODE</div><div class='del'>- * is on, and remove the appropriate bits from attr-&gt;ia_mode (attr is a</div><div class='del'>- * "struct iattr *"). -BlaisorBlade</div><div class='del'>- */</div><div class='ctx'> struct hostfs_timespec {</div><div class='ctx'> 	long long tv_sec;</div><div class='ctx'> 	long long tv_nsec;</div><div class='hunk'>@@ -60,11 +28,13 @@ struct hostfs_stat {</div><div class='ctx'> 	unsigned int uid;</div><div class='ctx'> 	unsigned int gid;</div><div class='ctx'> 	unsigned long long size;</div><div class='del'>-	struct hostfs_timespec atime, mtime, ctime;</div><div class='add'>+	struct hostfs_timespec atime, mtime, ctime, btime;</div><div class='ctx'> 	unsigned int blksize;</div><div class='ctx'> 	unsigned long long blocks;</div><div class='del'>-	unsigned int maj;</div><div class='del'>-	unsigned int min;</div><div class='add'>+	struct {</div><div class='add'>+		unsigned int maj;</div><div class='add'>+		unsigned int min;</div><div class='add'>+	} rdev, dev;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> extern int stat_file(const char *path, struct hostfs_stat *p, int fd);</div><div class='head'>diff --git a/fs/hostfs/hostfs_kern.c b/fs/hostfs/hostfs_kern.c<br/>index d5c9d886cd9f..51d26aa2b93e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hostfs/hostfs_kern.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hostfs/hostfs_kern.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hostfs/hostfs_kern.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hostfs/hostfs_kern.c</a></div><div class='hunk'>@@ -14,17 +14,26 @@</div><div class='ctx'> #include &lt;linux/statfs.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/seq_file.h&gt;</div><div class='add'>+#include &lt;linux/writeback.h&gt;</div><div class='ctx'> #include &lt;linux/mount.h&gt;</div><div class='add'>+#include &lt;linux/fs_context.h&gt;</div><div class='add'>+#include &lt;linux/fs_parser.h&gt;</div><div class='ctx'> #include &lt;linux/namei.h&gt;</div><div class='ctx'> #include "hostfs.h"</div><div class='ctx'> #include &lt;init.h&gt;</div><div class='ctx'> #include &lt;kern.h&gt;</div><div class='ctx'> </div><div class='add'>+struct hostfs_fs_info {</div><div class='add'>+	char *host_root_path;</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> struct hostfs_inode_info {</div><div class='ctx'> 	int fd;</div><div class='ctx'> 	fmode_t mode;</div><div class='ctx'> 	struct inode vfs_inode;</div><div class='ctx'> 	struct mutex open_mutex;</div><div class='add'>+	dev_t dev;</div><div class='add'>+	struct hostfs_timespec btime;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static inline struct hostfs_inode_info *HOSTFS_I(struct inode *inode)</div><div class='hunk'>@@ -49,6 +58,7 @@ static int __init hostfs_args(char *options, int *add)</div><div class='ctx'> {</div><div class='ctx'> 	char *ptr;</div><div class='ctx'> </div><div class='add'>+	*add = 0;</div><div class='ctx'> 	ptr = strchr(options, ',');</div><div class='ctx'> 	if (ptr != NULL)</div><div class='ctx'> 		*ptr++ = '\0';</div><div class='hunk'>@@ -86,30 +96,17 @@ __uml_setup("hostfs=", hostfs_args,</div><div class='ctx'> static char *__dentry_name(struct dentry *dentry, char *name)</div><div class='ctx'> {</div><div class='ctx'> 	char *p = dentry_path_raw(dentry, name, PATH_MAX);</div><div class='del'>-	char *root;</div><div class='del'>-	size_t len;</div><div class='del'>-</div><div class='del'>-	root = dentry-&gt;d_sb-&gt;s_fs_info;</div><div class='del'>-	len = strlen(root);</div><div class='del'>-	if (IS_ERR(p)) {</div><div class='del'>-		__putname(name);</div><div class='del'>-		return NULL;</div><div class='del'>-	}</div><div class='add'>+	struct hostfs_fs_info *fsi = dentry-&gt;d_sb-&gt;s_fs_info;</div><div class='add'>+	char *root = fsi-&gt;host_root_path;</div><div class='add'>+	size_t len = strlen(root);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * This function relies on the fact that dentry_path_raw() will place</div><div class='del'>-	 * the path name at the end of the provided buffer.</div><div class='del'>-	 */</div><div class='del'>-	BUG_ON(p + strlen(p) + 1 != name + PATH_MAX);</div><div class='del'>-</div><div class='del'>-	strlcpy(name, root, PATH_MAX);</div><div class='del'>-	if (len &gt; p - name) {</div><div class='add'>+	if (IS_ERR(p) || len &gt; p - name) {</div><div class='ctx'> 		__putname(name);</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (p &gt; name + len)</div><div class='del'>-		strcpy(name + len, p);</div><div class='add'>+	memcpy(name, root, len);</div><div class='add'>+	memmove(name + len, p, name + PATH_MAX - p);</div><div class='ctx'> </div><div class='ctx'> 	return name;</div><div class='ctx'> }</div><div class='hunk'>@@ -181,14 +178,6 @@ static char *follow_link(char *link)</div><div class='ctx'> 	return ERR_PTR(n);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct inode *hostfs_iget(struct super_block *sb)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = new_inode(sb);</div><div class='del'>-	if (!inode)</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='del'>-	return inode;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int hostfs_statfs(struct dentry *dentry, struct kstatfs *sf)</div><div class='ctx'> {</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -202,8 +191,10 @@ static int hostfs_statfs(struct dentry *dentry, struct kstatfs *sf)</div><div class='ctx'> 	long long f_bavail;</div><div class='ctx'> 	long long f_files;</div><div class='ctx'> 	long long f_ffree;</div><div class='add'>+	struct hostfs_fs_info *fsi;</div><div class='ctx'> </div><div class='del'>-	err = do_statfs(dentry-&gt;d_sb-&gt;s_fs_info,</div><div class='add'>+	fsi = dentry-&gt;d_sb-&gt;s_fs_info;</div><div class='add'>+	err = do_statfs(fsi-&gt;host_root_path,</div><div class='ctx'> 			&amp;sf-&gt;f_bsize, &amp;f_blocks, &amp;f_bfree, &amp;f_bavail, &amp;f_files,</div><div class='ctx'> 			&amp;f_ffree, &amp;sf-&gt;f_fsid, sizeof(sf-&gt;f_fsid),</div><div class='ctx'> 			&amp;sf-&gt;f_namelen);</div><div class='hunk'>@@ -222,11 +213,12 @@ static struct inode *hostfs_alloc_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct hostfs_inode_info *hi;</div><div class='ctx'> </div><div class='del'>-	hi = kmem_cache_alloc(hostfs_inode_cache, GFP_KERNEL_ACCOUNT);</div><div class='add'>+	hi = alloc_inode_sb(sb, hostfs_inode_cache, GFP_KERNEL_ACCOUNT);</div><div class='ctx'> 	if (hi == NULL)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	hi-&gt;fd = -1;</div><div class='ctx'> 	hi-&gt;mode = 0;</div><div class='add'>+	hi-&gt;dev = 0;</div><div class='ctx'> 	inode_init_once(&amp;hi-&gt;vfs_inode);</div><div class='ctx'> 	mutex_init(&amp;hi-&gt;open_mutex);</div><div class='ctx'> 	return &amp;hi-&gt;vfs_inode;</div><div class='hunk'>@@ -239,6 +231,7 @@ static void hostfs_evict_inode(struct inode *inode)</div><div class='ctx'> 	if (HOSTFS_I(inode)-&gt;fd != -1) {</div><div class='ctx'> 		close_file(&amp;HOSTFS_I(inode)-&gt;fd);</div><div class='ctx'> 		HOSTFS_I(inode)-&gt;fd = -1;</div><div class='add'>+		HOSTFS_I(inode)-&gt;dev = 0;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -249,7 +242,11 @@ static void hostfs_free_inode(struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> static int hostfs_show_options(struct seq_file *seq, struct dentry *root)</div><div class='ctx'> {</div><div class='del'>-	const char *root_path = root-&gt;d_sb-&gt;s_fs_info;</div><div class='add'>+	struct hostfs_fs_info *fsi;</div><div class='add'>+	const char *root_path;</div><div class='add'>+</div><div class='add'>+	fsi = root-&gt;d_sb-&gt;s_fs_info;</div><div class='add'>+	root_path = fsi-&gt;host_root_path;</div><div class='ctx'> 	size_t offset = strlen(root_ino) + 1;</div><div class='ctx'> </div><div class='ctx'> 	if (strlen(root_path) &gt; offset)</div><div class='hunk'>@@ -264,6 +261,7 @@ static int hostfs_show_options(struct seq_file *seq, struct dentry *root)</div><div class='ctx'> static const struct super_operations hostfs_sbops = {</div><div class='ctx'> 	.alloc_inode	= hostfs_alloc_inode,</div><div class='ctx'> 	.free_inode	= hostfs_free_inode,</div><div class='add'>+	.drop_inode	= inode_just_drop,</div><div class='ctx'> 	.evict_inode	= hostfs_evict_inode,</div><div class='ctx'> 	.statfs		= hostfs_statfs,</div><div class='ctx'> 	.show_options	= hostfs_show_options,</div><div class='hunk'>@@ -380,11 +378,11 @@ static int hostfs_fsync(struct file *file, loff_t start, loff_t end,</div><div class='ctx'> </div><div class='ctx'> static const struct file_operations hostfs_file_fops = {</div><div class='ctx'> 	.llseek		= generic_file_llseek,</div><div class='del'>-	.splice_read	= generic_file_splice_read,</div><div class='add'>+	.splice_read	= filemap_splice_read,</div><div class='ctx'> 	.splice_write	= iter_file_splice_write,</div><div class='ctx'> 	.read_iter	= generic_file_read_iter,</div><div class='ctx'> 	.write_iter	= generic_file_write_iter,</div><div class='del'>-	.mmap		= generic_file_mmap,</div><div class='add'>+	.mmap_prepare	= generic_file_mmap_prepare,</div><div class='ctx'> 	.open		= hostfs_open,</div><div class='ctx'> 	.release	= hostfs_file_release,</div><div class='ctx'> 	.fsync		= hostfs_fsync,</div><div class='hunk'>@@ -398,96 +396,85 @@ static const struct file_operations hostfs_dir_fops = {</div><div class='ctx'> 	.fsync		= hostfs_fsync,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int hostfs_writepage(struct page *page, struct writeback_control *wbc)</div><div class='add'>+static int hostfs_writepages(struct address_space *mapping,</div><div class='add'>+		struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *mapping = page-&gt;mapping;</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='del'>-	char *buffer;</div><div class='del'>-	loff_t base = page_offset(page);</div><div class='del'>-	int count = PAGE_SIZE;</div><div class='del'>-	int end_index = inode-&gt;i_size &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	int err;</div><div class='del'>-</div><div class='del'>-	if (page-&gt;index &gt;= end_index)</div><div class='del'>-		count = inode-&gt;i_size &amp; (PAGE_SIZE-1);</div><div class='del'>-</div><div class='del'>-	buffer = kmap(page);</div><div class='del'>-</div><div class='del'>-	err = write_file(HOSTFS_I(inode)-&gt;fd, &amp;base, buffer, count);</div><div class='del'>-	if (err != count) {</div><div class='del'>-		ClearPageUptodate(page);</div><div class='del'>-		goto out;</div><div class='add'>+	struct folio *folio = NULL;</div><div class='add'>+	loff_t i_size = i_size_read(inode);</div><div class='add'>+	int err = 0;</div><div class='add'>+</div><div class='add'>+	while ((folio = writeback_iter(mapping, wbc, folio, &amp;err))) {</div><div class='add'>+		loff_t pos = folio_pos(folio);</div><div class='add'>+		size_t count = folio_size(folio);</div><div class='add'>+		char *buffer;</div><div class='add'>+		int ret;</div><div class='add'>+</div><div class='add'>+		if (count &gt; i_size - pos)</div><div class='add'>+			count = i_size - pos;</div><div class='add'>+</div><div class='add'>+		buffer = kmap_local_folio(folio, 0);</div><div class='add'>+		ret = write_file(HOSTFS_I(inode)-&gt;fd, &amp;pos, buffer, count);</div><div class='add'>+		kunmap_local(buffer);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		if (ret != count) {</div><div class='add'>+			err = ret &lt; 0 ? ret : -EIO;</div><div class='add'>+			mapping_set_error(mapping, err);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (base &gt; inode-&gt;i_size)</div><div class='del'>-		inode-&gt;i_size = base;</div><div class='del'>-</div><div class='del'>-	if (PageError(page))</div><div class='del'>-		ClearPageError(page);</div><div class='del'>-	err = 0;</div><div class='del'>-</div><div class='del'>- out:</div><div class='del'>-	kunmap(page);</div><div class='del'>-</div><div class='del'>-	unlock_page(page);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hostfs_readpage(struct file *file, struct page *page)</div><div class='add'>+static int hostfs_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	char *buffer;</div><div class='del'>-	loff_t start = page_offset(page);</div><div class='add'>+	loff_t start = folio_pos(folio);</div><div class='ctx'> 	int bytes_read, ret = 0;</div><div class='ctx'> </div><div class='del'>-	buffer = kmap(page);</div><div class='add'>+	buffer = kmap_local_folio(folio, 0);</div><div class='ctx'> 	bytes_read = read_file(FILE_HOSTFS_I(file)-&gt;fd, &amp;start, buffer,</div><div class='ctx'> 			PAGE_SIZE);</div><div class='del'>-	if (bytes_read &lt; 0) {</div><div class='del'>-		ClearPageUptodate(page);</div><div class='del'>-		SetPageError(page);</div><div class='add'>+	if (bytes_read &lt; 0)</div><div class='ctx'> 		ret = bytes_read;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	memset(buffer + bytes_read, 0, PAGE_SIZE - bytes_read);</div><div class='del'>-</div><div class='del'>-	ClearPageError(page);</div><div class='del'>-	SetPageUptodate(page);</div><div class='add'>+	else</div><div class='add'>+		buffer = folio_zero_tail(folio, bytes_read, buffer + bytes_read);</div><div class='add'>+	kunmap_local(buffer);</div><div class='ctx'> </div><div class='del'>- out:</div><div class='del'>-	flush_dcache_page(page);</div><div class='del'>-	kunmap(page);</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	folio_end_read(folio, ret == 0);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hostfs_write_begin(struct file *file, struct address_space *mapping,</div><div class='del'>-			      loff_t pos, unsigned len, unsigned flags,</div><div class='del'>-			      struct page **pagep, void **fsdata)</div><div class='add'>+static int hostfs_write_begin(const struct kiocb *iocb,</div><div class='add'>+			      struct address_space *mapping,</div><div class='add'>+			      loff_t pos, unsigned len,</div><div class='add'>+			      struct folio **foliop, void **fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	pgoff_t index = pos &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> </div><div class='del'>-	*pagep = grab_cache_page_write_begin(mapping, index, flags);</div><div class='del'>-	if (!*pagep)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	*foliop = __filemap_get_folio(mapping, index, FGP_WRITEBEGIN,</div><div class='add'>+			mapping_gfp_mask(mapping));</div><div class='add'>+	if (IS_ERR(*foliop))</div><div class='add'>+		return PTR_ERR(*foliop);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hostfs_write_end(struct file *file, struct address_space *mapping,</div><div class='add'>+static int hostfs_write_end(const struct kiocb *iocb,</div><div class='add'>+			    struct address_space *mapping,</div><div class='ctx'> 			    loff_t pos, unsigned len, unsigned copied,</div><div class='del'>-			    struct page *page, void *fsdata)</div><div class='add'>+			    struct folio *folio, void *fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='ctx'> 	void *buffer;</div><div class='del'>-	unsigned from = pos &amp; (PAGE_SIZE - 1);</div><div class='add'>+	size_t from = offset_in_folio(folio, pos);</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	buffer = kmap(page);</div><div class='del'>-	err = write_file(FILE_HOSTFS_I(file)-&gt;fd, &amp;pos, buffer + from, copied);</div><div class='del'>-	kunmap(page);</div><div class='add'>+	buffer = kmap_local_folio(folio, from);</div><div class='add'>+	err = write_file(FILE_HOSTFS_I(iocb-&gt;ki_filp)-&gt;fd, &amp;pos, buffer, copied);</div><div class='add'>+	kunmap_local(buffer);</div><div class='ctx'> </div><div class='del'>-	if (!PageUptodate(page) &amp;&amp; err == PAGE_SIZE)</div><div class='del'>-		SetPageUptodate(page);</div><div class='add'>+	if (!folio_test_uptodate(folio) &amp;&amp; err == folio_size(folio))</div><div class='add'>+		folio_mark_uptodate(folio);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If err &gt; 0, write_file has added err to pos, so we are comparing</div><div class='hunk'>@@ -495,32 +482,50 @@ static int hostfs_write_end(struct file *file, struct address_space *mapping,</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (err &gt; 0 &amp;&amp; (pos &gt; inode-&gt;i_size))</div><div class='ctx'> 		inode-&gt;i_size = pos;</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct address_space_operations hostfs_aops = {</div><div class='del'>-	.writepage 	= hostfs_writepage,</div><div class='del'>-	.readpage	= hostfs_readpage,</div><div class='del'>-	.set_page_dirty = __set_page_dirty_nobuffers,</div><div class='add'>+	.writepages 	= hostfs_writepages,</div><div class='add'>+	.read_folio	= hostfs_read_folio,</div><div class='add'>+	.dirty_folio	= filemap_dirty_folio,</div><div class='ctx'> 	.write_begin	= hostfs_write_begin,</div><div class='ctx'> 	.write_end	= hostfs_write_end,</div><div class='add'>+	.migrate_folio	= filemap_migrate_folio,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int read_name(struct inode *ino, char *name)</div><div class='add'>+static int hostfs_inode_update(struct inode *ino, const struct hostfs_stat *st)</div><div class='ctx'> {</div><div class='del'>-	dev_t rdev;</div><div class='del'>-	struct hostfs_stat st;</div><div class='del'>-	int err = stat_file(name, &amp;st, -1);</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='add'>+	set_nlink(ino, st-&gt;nlink);</div><div class='add'>+	i_uid_write(ino, st-&gt;uid);</div><div class='add'>+	i_gid_write(ino, st-&gt;gid);</div><div class='add'>+	inode_set_atime_to_ts(ino, (struct timespec64){</div><div class='add'>+			st-&gt;atime.tv_sec,</div><div class='add'>+			st-&gt;atime.tv_nsec,</div><div class='add'>+		});</div><div class='add'>+	inode_set_mtime_to_ts(ino, (struct timespec64){</div><div class='add'>+			st-&gt;mtime.tv_sec,</div><div class='add'>+			st-&gt;mtime.tv_nsec,</div><div class='add'>+		});</div><div class='add'>+	inode_set_ctime(ino, st-&gt;ctime.tv_sec, st-&gt;ctime.tv_nsec);</div><div class='add'>+	ino-&gt;i_size = st-&gt;size;</div><div class='add'>+	ino-&gt;i_blocks = st-&gt;blocks;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int hostfs_inode_set(struct inode *ino, void *data)</div><div class='add'>+{</div><div class='add'>+	struct hostfs_stat *st = data;</div><div class='add'>+	dev_t dev, rdev;</div><div class='ctx'> </div><div class='ctx'> 	/* Reencode maj and min with the kernel encoding.*/</div><div class='del'>-	rdev = MKDEV(st.maj, st.min);</div><div class='add'>+	rdev = MKDEV(st-&gt;rdev.maj, st-&gt;rdev.min);</div><div class='add'>+	dev = MKDEV(st-&gt;dev.maj, st-&gt;dev.min);</div><div class='ctx'> </div><div class='del'>-	switch (st.mode &amp; S_IFMT) {</div><div class='add'>+	switch (st-&gt;mode &amp; S_IFMT) {</div><div class='ctx'> 	case S_IFLNK:</div><div class='ctx'> 		ino-&gt;i_op = &amp;hostfs_link_iops;</div><div class='ctx'> 		break;</div><div class='hunk'>@@ -532,7 +537,7 @@ static int read_name(struct inode *ino, char *name)</div><div class='ctx'> 	case S_IFBLK:</div><div class='ctx'> 	case S_IFIFO:</div><div class='ctx'> 	case S_IFSOCK:</div><div class='del'>-		init_special_inode(ino, st.mode &amp; S_IFMT, rdev);</div><div class='add'>+		init_special_inode(ino, st-&gt;mode &amp; S_IFMT, rdev);</div><div class='ctx'> 		ino-&gt;i_op = &amp;hostfs_iops;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case S_IFREG:</div><div class='hunk'>@@ -544,80 +549,92 @@ static int read_name(struct inode *ino, char *name)</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ino-&gt;i_ino = st.ino;</div><div class='del'>-	ino-&gt;i_mode = st.mode;</div><div class='del'>-	set_nlink(ino, st.nlink);</div><div class='del'>-	i_uid_write(ino, st.uid);</div><div class='del'>-	i_gid_write(ino, st.gid);</div><div class='del'>-	ino-&gt;i_atime = (struct timespec64){ st.atime.tv_sec, st.atime.tv_nsec };</div><div class='del'>-	ino-&gt;i_mtime = (struct timespec64){ st.mtime.tv_sec, st.mtime.tv_nsec };</div><div class='del'>-	ino-&gt;i_ctime = (struct timespec64){ st.ctime.tv_sec, st.ctime.tv_nsec };</div><div class='del'>-	ino-&gt;i_size = st.size;</div><div class='del'>-	ino-&gt;i_blocks = st.blocks;</div><div class='del'>-	return 0;</div><div class='add'>+	HOSTFS_I(ino)-&gt;dev = dev;</div><div class='add'>+	HOSTFS_I(ino)-&gt;btime = st-&gt;btime;</div><div class='add'>+	ino-&gt;i_ino = st-&gt;ino;</div><div class='add'>+	ino-&gt;i_mode = st-&gt;mode;</div><div class='add'>+	return hostfs_inode_update(ino, st);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hostfs_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-			 struct dentry *dentry, umode_t mode, bool excl)</div><div class='add'>+static int hostfs_inode_test(struct inode *inode, void *data)</div><div class='add'>+{</div><div class='add'>+	const struct hostfs_stat *st = data;</div><div class='add'>+	dev_t dev = MKDEV(st-&gt;dev.maj, st-&gt;dev.min);</div><div class='add'>+</div><div class='add'>+	return inode-&gt;i_ino == st-&gt;ino &amp;&amp; HOSTFS_I(inode)-&gt;dev == dev &amp;&amp;</div><div class='add'>+	       (inode-&gt;i_mode &amp; S_IFMT) == (st-&gt;mode &amp; S_IFMT) &amp;&amp;</div><div class='add'>+	       HOSTFS_I(inode)-&gt;btime.tv_sec == st-&gt;btime.tv_sec &amp;&amp;</div><div class='add'>+	       HOSTFS_I(inode)-&gt;btime.tv_nsec == st-&gt;btime.tv_nsec;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct inode *hostfs_iget(struct super_block *sb, char *name)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='del'>-	char *name;</div><div class='del'>-	int error, fd;</div><div class='add'>+	struct hostfs_stat st;</div><div class='add'>+	int err = stat_file(name, &amp;st, -1);</div><div class='ctx'> </div><div class='del'>-	inode = hostfs_iget(dir-&gt;i_sb);</div><div class='del'>-	if (IS_ERR(inode)) {</div><div class='del'>-		error = PTR_ERR(inode);</div><div class='del'>-		goto out;</div><div class='add'>+	if (err)</div><div class='add'>+		return ERR_PTR(err);</div><div class='add'>+</div><div class='add'>+	inode = iget5_locked(sb, st.ino, hostfs_inode_test, hostfs_inode_set,</div><div class='add'>+			     &amp;st);</div><div class='add'>+	if (!inode)</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+</div><div class='add'>+	if (inode_state_read_once(inode) &amp; I_NEW) {</div><div class='add'>+		unlock_new_inode(inode);</div><div class='add'>+	} else {</div><div class='add'>+		spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+		hostfs_inode_update(inode, &amp;st);</div><div class='add'>+		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	error = -ENOMEM;</div><div class='add'>+	return inode;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int hostfs_create(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+			 struct dentry *dentry, umode_t mode, bool excl)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode;</div><div class='add'>+	char *name;</div><div class='add'>+	int fd;</div><div class='add'>+</div><div class='ctx'> 	name = dentry_name(dentry);</div><div class='ctx'> 	if (name == NULL)</div><div class='del'>-		goto out_put;</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	fd = file_create(name, mode &amp; 0777);</div><div class='del'>-	if (fd &lt; 0)</div><div class='del'>-		error = fd;</div><div class='del'>-	else</div><div class='del'>-		error = read_name(inode, name);</div><div class='add'>+	if (fd &lt; 0) {</div><div class='add'>+		__putname(name);</div><div class='add'>+		return fd;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='add'>+	inode = hostfs_iget(dir-&gt;i_sb, name);</div><div class='ctx'> 	__putname(name);</div><div class='del'>-	if (error)</div><div class='del'>-		goto out_put;</div><div class='add'>+	if (IS_ERR(inode))</div><div class='add'>+		return PTR_ERR(inode);</div><div class='ctx'> </div><div class='ctx'> 	HOSTFS_I(inode)-&gt;fd = fd;</div><div class='ctx'> 	HOSTFS_I(inode)-&gt;mode = FMODE_READ | FMODE_WRITE;</div><div class='ctx'> 	d_instantiate(dentry, inode);</div><div class='ctx'> 	return 0;</div><div class='del'>-</div><div class='del'>- out_put:</div><div class='del'>-	iput(inode);</div><div class='del'>- out:</div><div class='del'>-	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct dentry *hostfs_lookup(struct inode *ino, struct dentry *dentry,</div><div class='ctx'> 				    unsigned int flags)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode;</div><div class='add'>+	struct inode *inode = NULL;</div><div class='ctx'> 	char *name;</div><div class='del'>-	int err;</div><div class='ctx'> </div><div class='del'>-	inode = hostfs_iget(ino-&gt;i_sb);</div><div class='del'>-	if (IS_ERR(inode))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	err = -ENOMEM;</div><div class='ctx'> 	name = dentry_name(dentry);</div><div class='del'>-	if (name) {</div><div class='del'>-		err = read_name(inode, name);</div><div class='del'>-		__putname(name);</div><div class='del'>-	}</div><div class='del'>-	if (err) {</div><div class='del'>-		iput(inode);</div><div class='del'>-		inode = (err == -ENOENT) ? NULL : ERR_PTR(err);</div><div class='del'>-	}</div><div class='del'>- out:</div><div class='add'>+	if (name == NULL)</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+</div><div class='add'>+	inode = hostfs_iget(ino-&gt;i_sb, name);</div><div class='add'>+	__putname(name);</div><div class='add'>+	if (inode == ERR_PTR(-ENOENT))</div><div class='add'>+		inode = NULL;</div><div class='add'>+</div><div class='ctx'> 	return d_splice_alias(inode, dentry);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -656,7 +673,7 @@ static int hostfs_unlink(struct inode *ino, struct dentry *dentry)</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hostfs_symlink(struct user_namespace *mnt_userns, struct inode *ino,</div><div class='add'>+static int hostfs_symlink(struct mnt_idmap *idmap, struct inode *ino,</div><div class='ctx'> 			  struct dentry *dentry, const char *to)</div><div class='ctx'> {</div><div class='ctx'> 	char *file;</div><div class='hunk'>@@ -669,17 +686,25 @@ static int hostfs_symlink(struct user_namespace *mnt_userns, struct inode *ino,</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hostfs_mkdir(struct user_namespace *mnt_userns, struct inode *ino,</div><div class='del'>-			struct dentry *dentry, umode_t mode)</div><div class='add'>+static struct dentry *hostfs_mkdir(struct mnt_idmap *idmap, struct inode *ino,</div><div class='add'>+				   struct dentry *dentry, umode_t mode)</div><div class='ctx'> {</div><div class='add'>+	struct inode *inode;</div><div class='ctx'> 	char *file;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if ((file = dentry_name(dentry)) == NULL)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='ctx'> 	err = do_mkdir(file, mode);</div><div class='add'>+	if (err) {</div><div class='add'>+		dentry = ERR_PTR(err);</div><div class='add'>+	} else {</div><div class='add'>+		inode = hostfs_iget(dentry-&gt;d_sb, file);</div><div class='add'>+		d_drop(dentry);</div><div class='add'>+		dentry = d_splice_alias(inode, dentry);</div><div class='add'>+	}</div><div class='ctx'> 	__putname(file);</div><div class='del'>-	return err;</div><div class='add'>+	return dentry;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int hostfs_rmdir(struct inode *ino, struct dentry *dentry)</div><div class='hunk'>@@ -694,45 +719,33 @@ static int hostfs_rmdir(struct inode *ino, struct dentry *dentry)</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hostfs_mknod(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int hostfs_mknod(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 			struct dentry *dentry, umode_t mode, dev_t dev)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	char *name;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	inode = hostfs_iget(dir-&gt;i_sb);</div><div class='del'>-	if (IS_ERR(inode)) {</div><div class='del'>-		err = PTR_ERR(inode);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	err = -ENOMEM;</div><div class='ctx'> 	name = dentry_name(dentry);</div><div class='ctx'> 	if (name == NULL)</div><div class='del'>-		goto out_put;</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	err = do_mknod(name, mode, MAJOR(dev), MINOR(dev));</div><div class='del'>-	if (err)</div><div class='del'>-		goto out_free;</div><div class='add'>+	if (err) {</div><div class='add'>+		__putname(name);</div><div class='add'>+		return err;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	err = read_name(inode, name);</div><div class='add'>+	inode = hostfs_iget(dir-&gt;i_sb, name);</div><div class='ctx'> 	__putname(name);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out_put;</div><div class='add'>+	if (IS_ERR(inode))</div><div class='add'>+		return PTR_ERR(inode);</div><div class='ctx'> </div><div class='ctx'> 	d_instantiate(dentry, inode);</div><div class='ctx'> 	return 0;</div><div class='del'>-</div><div class='del'>- out_free:</div><div class='del'>-	__putname(name);</div><div class='del'>- out_put:</div><div class='del'>-	iput(inode);</div><div class='del'>- out:</div><div class='del'>-	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hostfs_rename2(struct user_namespace *mnt_userns,</div><div class='add'>+static int hostfs_rename2(struct mnt_idmap *idmap,</div><div class='ctx'> 			  struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> 			  struct inode *new_dir, struct dentry *new_dentry,</div><div class='ctx'> 			  unsigned int flags)</div><div class='hunk'>@@ -761,7 +774,7 @@ static int hostfs_rename2(struct user_namespace *mnt_userns,</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hostfs_permission(struct user_namespace *mnt_userns,</div><div class='add'>+static int hostfs_permission(struct mnt_idmap *idmap,</div><div class='ctx'> 			     struct inode *ino, int desired)</div><div class='ctx'> {</div><div class='ctx'> 	char *name;</div><div class='hunk'>@@ -784,11 +797,11 @@ static int hostfs_permission(struct user_namespace *mnt_userns,</div><div class='ctx'> 		err = access_file(name, r, w, x);</div><div class='ctx'> 	__putname(name);</div><div class='ctx'> 	if (!err)</div><div class='del'>-		err = generic_permission(&amp;init_user_ns, ino, desired);</div><div class='add'>+		err = generic_permission(&amp;nop_mnt_idmap, ino, desired);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hostfs_setattr(struct user_namespace *mnt_userns,</div><div class='add'>+static int hostfs_setattr(struct mnt_idmap *idmap,</div><div class='ctx'> 			  struct dentry *dentry, struct iattr *attr)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='hunk'>@@ -798,7 +811,7 @@ static int hostfs_setattr(struct user_namespace *mnt_userns,</div><div class='ctx'> </div><div class='ctx'> 	int fd = HOSTFS_I(inode)-&gt;fd;</div><div class='ctx'> </div><div class='del'>-	err = setattr_prepare(&amp;init_user_ns, dentry, attr);</div><div class='add'>+	err = setattr_prepare(&amp;nop_mnt_idmap, dentry, attr);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='hunk'>@@ -855,7 +868,7 @@ static int hostfs_setattr(struct user_namespace *mnt_userns,</div><div class='ctx'> 	    attr-&gt;ia_size != i_size_read(inode))</div><div class='ctx'> 		truncate_setsize(inode, attr-&gt;ia_size);</div><div class='ctx'> </div><div class='del'>-	setattr_copy(&amp;init_user_ns, inode, attr);</div><div class='add'>+	setattr_copy(&amp;nop_mnt_idmap, inode, attr);</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -912,67 +925,140 @@ static const struct inode_operations hostfs_link_iops = {</div><div class='ctx'> 	.get_link	= hostfs_get_link,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int hostfs_fill_sb_common(struct super_block *sb, void *d, int silent)</div><div class='add'>+static int hostfs_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> {</div><div class='add'>+	struct hostfs_fs_info *fsi = sb-&gt;s_fs_info;</div><div class='ctx'> 	struct inode *root_inode;</div><div class='del'>-	char *host_root_path, *req_root = d;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	sb-&gt;s_blocksize = 1024;</div><div class='ctx'> 	sb-&gt;s_blocksize_bits = 10;</div><div class='ctx'> 	sb-&gt;s_magic = HOSTFS_SUPER_MAGIC;</div><div class='ctx'> 	sb-&gt;s_op = &amp;hostfs_sbops;</div><div class='del'>-	sb-&gt;s_d_op = &amp;simple_dentry_operations;</div><div class='add'>+	sb-&gt;s_d_flags = DCACHE_DONTCACHE;</div><div class='ctx'> 	sb-&gt;s_maxbytes = MAX_LFS_FILESIZE;</div><div class='add'>+	err = super_setup_bdi(sb);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='del'>-	/* NULL is printed as '(null)' by printf(): avoid that. */</div><div class='del'>-	if (req_root == NULL)</div><div class='del'>-		req_root = "";</div><div class='add'>+	root_inode = hostfs_iget(sb, fsi-&gt;host_root_path);</div><div class='add'>+	if (IS_ERR(root_inode))</div><div class='add'>+		return PTR_ERR(root_inode);</div><div class='ctx'> </div><div class='del'>-	err = -ENOMEM;</div><div class='del'>-	sb-&gt;s_fs_info = host_root_path =</div><div class='del'>-		kasprintf(GFP_KERNEL, "%s/%s", root_ino, req_root);</div><div class='del'>-	if (host_root_path == NULL)</div><div class='del'>-		goto out;</div><div class='add'>+	if (S_ISLNK(root_inode-&gt;i_mode)) {</div><div class='add'>+		char *name;</div><div class='ctx'> </div><div class='del'>-	root_inode = new_inode(sb);</div><div class='del'>-	if (!root_inode)</div><div class='del'>-		goto out;</div><div class='add'>+		iput(root_inode);</div><div class='add'>+		name = follow_link(fsi-&gt;host_root_path);</div><div class='add'>+		if (IS_ERR(name))</div><div class='add'>+			return PTR_ERR(name);</div><div class='ctx'> </div><div class='del'>-	err = read_name(root_inode, host_root_path);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out_put;</div><div class='del'>-</div><div class='del'>-	if (S_ISLNK(root_inode-&gt;i_mode)) {</div><div class='del'>-		char *name = follow_link(host_root_path);</div><div class='del'>-		if (IS_ERR(name)) {</div><div class='del'>-			err = PTR_ERR(name);</div><div class='del'>-			goto out_put;</div><div class='del'>-		}</div><div class='del'>-		err = read_name(root_inode, name);</div><div class='add'>+		root_inode = hostfs_iget(sb, name);</div><div class='ctx'> 		kfree(name);</div><div class='del'>-		if (err)</div><div class='del'>-			goto out_put;</div><div class='add'>+		if (IS_ERR(root_inode))</div><div class='add'>+			return PTR_ERR(root_inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = -ENOMEM;</div><div class='ctx'> 	sb-&gt;s_root = d_make_root(root_inode);</div><div class='ctx'> 	if (sb-&gt;s_root == NULL)</div><div class='del'>-		goto out;</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-out_put:</div><div class='del'>-	iput(root_inode);</div><div class='del'>-out:</div><div class='del'>-	return err;</div><div class='add'>+enum hostfs_parma {</div><div class='add'>+	Opt_hostfs,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct fs_parameter_spec hostfs_param_specs[] = {</div><div class='add'>+	fsparam_string_empty("hostfs",		Opt_hostfs),</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int hostfs_parse_param(struct fs_context *fc, struct fs_parameter *param)</div><div class='add'>+{</div><div class='add'>+	struct hostfs_fs_info *fsi = fc-&gt;s_fs_info;</div><div class='add'>+	struct fs_parse_result result;</div><div class='add'>+	char *host_root, *tmp_root;</div><div class='add'>+	int opt;</div><div class='add'>+</div><div class='add'>+	opt = fs_parse(fc, hostfs_param_specs, param, &amp;result);</div><div class='add'>+	if (opt &lt; 0)</div><div class='add'>+		return opt;</div><div class='add'>+</div><div class='add'>+	switch (opt) {</div><div class='add'>+	case Opt_hostfs:</div><div class='add'>+		host_root = param-&gt;string;</div><div class='add'>+		if (!*host_root)</div><div class='add'>+			break;</div><div class='add'>+		tmp_root = kasprintf(GFP_KERNEL, "%s%s",</div><div class='add'>+				     fsi-&gt;host_root_path, host_root);</div><div class='add'>+		if (!tmp_root)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+		kfree(fsi-&gt;host_root_path);</div><div class='add'>+		fsi-&gt;host_root_path = tmp_root;</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct dentry *hostfs_read_sb(struct file_system_type *type,</div><div class='del'>-			  int flags, const char *dev_name,</div><div class='del'>-			  void *data)</div><div class='add'>+static int hostfs_parse_monolithic(struct fs_context *fc, void *data)</div><div class='ctx'> {</div><div class='del'>-	return mount_nodev(type, flags, data, hostfs_fill_sb_common);</div><div class='add'>+	struct hostfs_fs_info *fsi = fc-&gt;s_fs_info;</div><div class='add'>+	char *tmp_root, *host_root = (char *)data;</div><div class='add'>+</div><div class='add'>+	/* NULL is printed as '(null)' by printf(): avoid that. */</div><div class='add'>+	if (host_root == NULL)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	tmp_root = kasprintf(GFP_KERNEL, "%s%s", fsi-&gt;host_root_path, host_root);</div><div class='add'>+	if (!tmp_root)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	kfree(fsi-&gt;host_root_path);</div><div class='add'>+	fsi-&gt;host_root_path = tmp_root;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int hostfs_fc_get_tree(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	return get_tree_nodev(fc, hostfs_fill_super);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void hostfs_fc_free(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct hostfs_fs_info *fsi = fc-&gt;s_fs_info;</div><div class='add'>+</div><div class='add'>+	if (!fsi)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	kfree(fsi-&gt;host_root_path);</div><div class='add'>+	kfree(fsi);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct fs_context_operations hostfs_context_ops = {</div><div class='add'>+	.parse_monolithic = hostfs_parse_monolithic,</div><div class='add'>+	.parse_param	= hostfs_parse_param,</div><div class='add'>+	.get_tree	= hostfs_fc_get_tree,</div><div class='add'>+	.free		= hostfs_fc_free,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int hostfs_init_fs_context(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct hostfs_fs_info *fsi;</div><div class='add'>+</div><div class='add'>+	fsi = kzalloc(sizeof(*fsi), GFP_KERNEL);</div><div class='add'>+	if (!fsi)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	fsi-&gt;host_root_path = kasprintf(GFP_KERNEL, "%s/", root_ino);</div><div class='add'>+	if (!fsi-&gt;host_root_path) {</div><div class='add'>+		kfree(fsi);</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+	fc-&gt;s_fs_info = fsi;</div><div class='add'>+	fc-&gt;ops = &amp;hostfs_context_ops;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void hostfs_kill_sb(struct super_block *s)</div><div class='hunk'>@@ -982,11 +1068,11 @@ static void hostfs_kill_sb(struct super_block *s)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct file_system_type hostfs_type = {</div><div class='del'>-	.owner 		= THIS_MODULE,</div><div class='del'>-	.name 		= "hostfs",</div><div class='del'>-	.mount	 	= hostfs_read_sb,</div><div class='del'>-	.kill_sb	= hostfs_kill_sb,</div><div class='del'>-	.fs_flags 	= 0,</div><div class='add'>+	.owner			= THIS_MODULE,</div><div class='add'>+	.name			= "hostfs",</div><div class='add'>+	.init_fs_context	= hostfs_init_fs_context,</div><div class='add'>+	.kill_sb		= hostfs_kill_sb,</div><div class='add'>+	.fs_flags		= 0,</div><div class='ctx'> };</div><div class='ctx'> MODULE_ALIAS_FS("hostfs");</div><div class='ctx'> </div><div class='hunk'>@@ -1006,4 +1092,5 @@ static void __exit exit_hostfs(void)</div><div class='ctx'> </div><div class='ctx'> module_init(init_hostfs)</div><div class='ctx'> module_exit(exit_hostfs)</div><div class='add'>+MODULE_DESCRIPTION("User-Mode Linux Host filesystem");</div><div class='ctx'> MODULE_LICENSE("GPL");</div><div class='head'>diff --git a/fs/hostfs/hostfs_user.c b/fs/hostfs/hostfs_user.c<br/>index 5ecc4706172b..3bcd9f35e70b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hostfs/hostfs_user.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hostfs/hostfs_user.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hostfs/hostfs_user.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hostfs/hostfs_user.c</a></div><div class='hunk'>@@ -18,37 +18,48 @@</div><div class='ctx'> #include "hostfs.h"</div><div class='ctx'> #include &lt;utime.h&gt;</div><div class='ctx'> </div><div class='del'>-static void stat64_to_hostfs(const struct stat64 *buf, struct hostfs_stat *p)</div><div class='add'>+static void statx_to_hostfs(const struct statx *buf, struct hostfs_stat *p)</div><div class='ctx'> {</div><div class='del'>-	p-&gt;ino = buf-&gt;st_ino;</div><div class='del'>-	p-&gt;mode = buf-&gt;st_mode;</div><div class='del'>-	p-&gt;nlink = buf-&gt;st_nlink;</div><div class='del'>-	p-&gt;uid = buf-&gt;st_uid;</div><div class='del'>-	p-&gt;gid = buf-&gt;st_gid;</div><div class='del'>-	p-&gt;size = buf-&gt;st_size;</div><div class='del'>-	p-&gt;atime.tv_sec = buf-&gt;st_atime;</div><div class='del'>-	p-&gt;atime.tv_nsec = 0;</div><div class='del'>-	p-&gt;ctime.tv_sec = buf-&gt;st_ctime;</div><div class='del'>-	p-&gt;ctime.tv_nsec = 0;</div><div class='del'>-	p-&gt;mtime.tv_sec = buf-&gt;st_mtime;</div><div class='del'>-	p-&gt;mtime.tv_nsec = 0;</div><div class='del'>-	p-&gt;blksize = buf-&gt;st_blksize;</div><div class='del'>-	p-&gt;blocks = buf-&gt;st_blocks;</div><div class='del'>-	p-&gt;maj = os_major(buf-&gt;st_rdev);</div><div class='del'>-	p-&gt;min = os_minor(buf-&gt;st_rdev);</div><div class='add'>+	p-&gt;ino = buf-&gt;stx_ino;</div><div class='add'>+	p-&gt;mode = buf-&gt;stx_mode;</div><div class='add'>+	p-&gt;nlink = buf-&gt;stx_nlink;</div><div class='add'>+	p-&gt;uid = buf-&gt;stx_uid;</div><div class='add'>+	p-&gt;gid = buf-&gt;stx_gid;</div><div class='add'>+	p-&gt;size = buf-&gt;stx_size;</div><div class='add'>+	p-&gt;atime.tv_sec = buf-&gt;stx_atime.tv_sec;</div><div class='add'>+	p-&gt;atime.tv_nsec = buf-&gt;stx_atime.tv_nsec;</div><div class='add'>+	p-&gt;ctime.tv_sec = buf-&gt;stx_ctime.tv_sec;</div><div class='add'>+	p-&gt;ctime.tv_nsec = buf-&gt;stx_ctime.tv_nsec;</div><div class='add'>+	p-&gt;mtime.tv_sec = buf-&gt;stx_mtime.tv_sec;</div><div class='add'>+	p-&gt;mtime.tv_nsec = buf-&gt;stx_mtime.tv_nsec;</div><div class='add'>+	if (buf-&gt;stx_mask &amp; STATX_BTIME) {</div><div class='add'>+		p-&gt;btime.tv_sec = buf-&gt;stx_btime.tv_sec;</div><div class='add'>+		p-&gt;btime.tv_nsec = buf-&gt;stx_btime.tv_nsec;</div><div class='add'>+	} else {</div><div class='add'>+		memset(&amp;p-&gt;btime, 0, sizeof(p-&gt;btime));</div><div class='add'>+	}</div><div class='add'>+	p-&gt;blksize = buf-&gt;stx_blksize;</div><div class='add'>+	p-&gt;blocks = buf-&gt;stx_blocks;</div><div class='add'>+	p-&gt;rdev.maj = buf-&gt;stx_rdev_major;</div><div class='add'>+	p-&gt;rdev.min = buf-&gt;stx_rdev_minor;</div><div class='add'>+	p-&gt;dev.maj = buf-&gt;stx_dev_major;</div><div class='add'>+	p-&gt;dev.min = buf-&gt;stx_dev_minor;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int stat_file(const char *path, struct hostfs_stat *p, int fd)</div><div class='ctx'> {</div><div class='del'>-	struct stat64 buf;</div><div class='add'>+	struct statx buf;</div><div class='add'>+	int flags = AT_SYMLINK_NOFOLLOW;</div><div class='ctx'> </div><div class='ctx'> 	if (fd &gt;= 0) {</div><div class='del'>-		if (fstat64(fd, &amp;buf) &lt; 0)</div><div class='del'>-			return -errno;</div><div class='del'>-	} else if (lstat64(path, &amp;buf) &lt; 0) {</div><div class='del'>-		return -errno;</div><div class='add'>+		flags |= AT_EMPTY_PATH;</div><div class='add'>+		path = "";</div><div class='ctx'> 	}</div><div class='del'>-	stat64_to_hostfs(&amp;buf, p);</div><div class='add'>+</div><div class='add'>+	if ((statx(fd, path, flags, STATX_BASIC_STATS | STATX_BTIME, &amp;buf)) &lt; 0)</div><div class='add'>+		return -errno;</div><div class='add'>+</div><div class='add'>+	statx_to_hostfs(&amp;buf, p);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/hostfs/hostfs_user_exp.c b/fs/hostfs/hostfs_user_exp.c<br/>new file mode 100644<br/>index 000000000000..250c91c55c46<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hostfs/hostfs_user_exp.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hostfs/hostfs_user_exp.c</a></div><div class='hunk'>@@ -0,0 +1,28 @@</div><div class='add'>+#include &lt;linux/module.h&gt;</div><div class='add'>+#include "hostfs.h"</div><div class='add'>+</div><div class='add'>+EXPORT_SYMBOL_GPL(stat_file);</div><div class='add'>+EXPORT_SYMBOL_GPL(access_file);</div><div class='add'>+EXPORT_SYMBOL_GPL(open_file);</div><div class='add'>+EXPORT_SYMBOL_GPL(open_dir);</div><div class='add'>+EXPORT_SYMBOL_GPL(seek_dir);</div><div class='add'>+EXPORT_SYMBOL_GPL(read_dir);</div><div class='add'>+EXPORT_SYMBOL_GPL(read_file);</div><div class='add'>+EXPORT_SYMBOL_GPL(write_file);</div><div class='add'>+EXPORT_SYMBOL_GPL(lseek_file);</div><div class='add'>+EXPORT_SYMBOL_GPL(fsync_file);</div><div class='add'>+EXPORT_SYMBOL_GPL(replace_file);</div><div class='add'>+EXPORT_SYMBOL_GPL(close_file);</div><div class='add'>+EXPORT_SYMBOL_GPL(close_dir);</div><div class='add'>+EXPORT_SYMBOL_GPL(file_create);</div><div class='add'>+EXPORT_SYMBOL_GPL(set_attr);</div><div class='add'>+EXPORT_SYMBOL_GPL(make_symlink);</div><div class='add'>+EXPORT_SYMBOL_GPL(unlink_file);</div><div class='add'>+EXPORT_SYMBOL_GPL(do_mkdir);</div><div class='add'>+EXPORT_SYMBOL_GPL(hostfs_do_rmdir);</div><div class='add'>+EXPORT_SYMBOL_GPL(do_mknod);</div><div class='add'>+EXPORT_SYMBOL_GPL(link_file);</div><div class='add'>+EXPORT_SYMBOL_GPL(hostfs_do_readlink);</div><div class='add'>+EXPORT_SYMBOL_GPL(rename_file);</div><div class='add'>+EXPORT_SYMBOL_GPL(rename2_file);</div><div class='add'>+EXPORT_SYMBOL_GPL(do_statfs);</div><div class='head'>diff --git a/fs/hpfs/Kconfig b/fs/hpfs/Kconfig<br/>index ec975f466877..ac1e9318e65a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hpfs/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hpfs/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hpfs/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hpfs/Kconfig</a></div><div class='hunk'>@@ -2,6 +2,7 @@</div><div class='ctx'> config HPFS_FS</div><div class='ctx'> 	tristate "OS/2 HPFS file system support"</div><div class='ctx'> 	depends on BLOCK</div><div class='add'>+	select BUFFER_HEAD</div><div class='ctx'> 	select FS_IOMAP</div><div class='ctx'> 	help</div><div class='ctx'> 	  OS/2 is IBM's operating system for PC's, the same as Warp, and HPFS</div><div class='head'>diff --git a/fs/hpfs/anode.c b/fs/hpfs/anode.c<br/>index c14c9a035ee0..a4f5321eafae 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hpfs/anode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hpfs/anode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hpfs/anode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hpfs/anode.c</a></div><div class='hunk'>@@ -27,7 +27,7 @@ secno hpfs_bplus_lookup(struct super_block *s, struct inode *inode,</div><div class='ctx'> 				a = le32_to_cpu(btree-&gt;u.internal[i].down);</div><div class='ctx'> 				brelse(bh);</div><div class='ctx'> 				if (!(anode = hpfs_map_anode(s, a, &amp;bh))) return -1;</div><div class='del'>-				btree = &amp;anode-&gt;btree;</div><div class='add'>+				btree = GET_BTREE_PTR(&amp;anode-&gt;btree);</div><div class='ctx'> 				goto go_down;</div><div class='ctx'> 			}</div><div class='ctx'> 		hpfs_error(s, "sector %08x not found in internal anode %08x", sec, a);</div><div class='hunk'>@@ -69,12 +69,13 @@ secno hpfs_add_sector_to_btree(struct super_block *s, secno node, int fnod, unsi</div><div class='ctx'> 	int n;</div><div class='ctx'> 	unsigned fs;</div><div class='ctx'> 	int c1, c2 = 0;</div><div class='add'>+</div><div class='ctx'> 	if (fnod) {</div><div class='ctx'> 		if (!(fnode = hpfs_map_fnode(s, node, &amp;bh))) return -1;</div><div class='del'>-		btree = &amp;fnode-&gt;btree;</div><div class='add'>+		btree = GET_BTREE_PTR(&amp;fnode-&gt;btree);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		if (!(anode = hpfs_map_anode(s, node, &amp;bh))) return -1;</div><div class='del'>-		btree = &amp;anode-&gt;btree;</div><div class='add'>+		btree = GET_BTREE_PTR(&amp;anode-&gt;btree);</div><div class='ctx'> 	}</div><div class='ctx'> 	a = node;</div><div class='ctx'> 	go_down:</div><div class='hunk'>@@ -91,7 +92,7 @@ secno hpfs_add_sector_to_btree(struct super_block *s, secno node, int fnod, unsi</div><div class='ctx'> 		if (hpfs_sb(s)-&gt;sb_chk)</div><div class='ctx'> 			if (hpfs_stop_cycles(s, a, &amp;c1, &amp;c2, "hpfs_add_sector_to_btree #1")) return -1;</div><div class='ctx'> 		if (!(anode = hpfs_map_anode(s, a, &amp;bh))) return -1;</div><div class='del'>-		btree = &amp;anode-&gt;btree;</div><div class='add'>+		btree = GET_BTREE_PTR(&amp;anode-&gt;btree);</div><div class='ctx'> 		goto go_down;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (n &gt;= 0) {</div><div class='hunk'>@@ -151,7 +152,7 @@ secno hpfs_add_sector_to_btree(struct super_block *s, secno node, int fnod, unsi</div><div class='ctx'> 		}</div><div class='ctx'> 		brelse(bh);</div><div class='ctx'> 		bh = bh1;</div><div class='del'>-		btree = &amp;anode-&gt;btree;</div><div class='add'>+		btree = GET_BTREE_PTR(&amp;anode-&gt;btree);</div><div class='ctx'> 	}</div><div class='ctx'> 	btree-&gt;n_free_nodes--; n = btree-&gt;n_used_nodes++;</div><div class='ctx'> 	le16_add_cpu(&amp;btree-&gt;first_free, 12);</div><div class='hunk'>@@ -168,10 +169,10 @@ secno hpfs_add_sector_to_btree(struct super_block *s, secno node, int fnod, unsi</div><div class='ctx'> 			if (hpfs_stop_cycles(s, up, &amp;c1, &amp;c2, "hpfs_add_sector_to_btree #2")) return -1;</div><div class='ctx'> 		if (up != node || !fnod) {</div><div class='ctx'> 			if (!(anode = hpfs_map_anode(s, up, &amp;bh))) return -1;</div><div class='del'>-			btree = &amp;anode-&gt;btree;</div><div class='add'>+			btree = GET_BTREE_PTR(&amp;anode-&gt;btree);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			if (!(fnode = hpfs_map_fnode(s, up, &amp;bh))) return -1;</div><div class='del'>-			btree = &amp;fnode-&gt;btree;</div><div class='add'>+			btree = GET_BTREE_PTR(&amp;fnode-&gt;btree);</div><div class='ctx'> 		}</div><div class='ctx'> 		if (btree-&gt;n_free_nodes) {</div><div class='ctx'> 			btree-&gt;n_free_nodes--; n = btree-&gt;n_used_nodes++;</div><div class='hunk'>@@ -206,8 +207,8 @@ secno hpfs_add_sector_to_btree(struct super_block *s, secno node, int fnod, unsi</div><div class='ctx'> 			anode-&gt;btree.n_used_nodes = 1;</div><div class='ctx'> 			anode-&gt;btree.n_free_nodes = 59;</div><div class='ctx'> 			anode-&gt;btree.first_free = cpu_to_le16(16);</div><div class='del'>-			anode-&gt;btree.u.internal[0].down = cpu_to_le32(a);</div><div class='del'>-			anode-&gt;btree.u.internal[0].file_secno = cpu_to_le32(-1);</div><div class='add'>+			GET_BTREE_PTR(&amp;anode-&gt;btree)-&gt;u.internal[0].down = cpu_to_le32(a);</div><div class='add'>+			GET_BTREE_PTR(&amp;anode-&gt;btree)-&gt;u.internal[0].file_secno = cpu_to_le32(-1);</div><div class='ctx'> 			mark_buffer_dirty(bh);</div><div class='ctx'> 			brelse(bh);</div><div class='ctx'> 			if ((anode = hpfs_map_anode(s, a, &amp;bh))) {</div><div class='hunk'>@@ -229,20 +230,20 @@ secno hpfs_add_sector_to_btree(struct super_block *s, secno node, int fnod, unsi</div><div class='ctx'> 			brelse(bh2);</div><div class='ctx'> 			return -1;</div><div class='ctx'> 		}</div><div class='del'>-		btree = &amp;anode-&gt;btree;</div><div class='add'>+		btree = GET_BTREE_PTR(&amp;anode-&gt;btree);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		if (!(fnode = hpfs_map_fnode(s, node, &amp;bh))) {</div><div class='ctx'> 			brelse(bh2);</div><div class='ctx'> 			return -1;</div><div class='ctx'> 		}</div><div class='del'>-		btree = &amp;fnode-&gt;btree;</div><div class='add'>+		btree = GET_BTREE_PTR(&amp;fnode-&gt;btree);</div><div class='ctx'> 	}</div><div class='ctx'> 	ranode-&gt;up = cpu_to_le32(node);</div><div class='ctx'> 	memcpy(&amp;ranode-&gt;btree, btree, le16_to_cpu(btree-&gt;first_free));</div><div class='ctx'> 	if (fnod)</div><div class='ctx'> 		ranode-&gt;btree.flags |= BP_fnode_parent;</div><div class='del'>-	ranode-&gt;btree.n_free_nodes = (bp_internal(&amp;ranode-&gt;btree) ? 60 : 40) - ranode-&gt;btree.n_used_nodes;</div><div class='del'>-	if (bp_internal(&amp;ranode-&gt;btree)) for (n = 0; n &lt; ranode-&gt;btree.n_used_nodes; n++) {</div><div class='add'>+	GET_BTREE_PTR(&amp;ranode-&gt;btree)-&gt;n_free_nodes = (bp_internal(GET_BTREE_PTR(&amp;ranode-&gt;btree)) ? 60 : 40) - GET_BTREE_PTR(&amp;ranode-&gt;btree)-&gt;n_used_nodes;</div><div class='add'>+	if (bp_internal(GET_BTREE_PTR(&amp;ranode-&gt;btree))) for (n = 0; n &lt; GET_BTREE_PTR(&amp;ranode-&gt;btree)-&gt;n_used_nodes; n++) {</div><div class='ctx'> 		struct anode *unode;</div><div class='ctx'> 		if ((unode = hpfs_map_anode(s, le32_to_cpu(ranode-&gt;u.internal[n].down), &amp;bh1))) {</div><div class='ctx'> 			unode-&gt;up = cpu_to_le32(ra);</div><div class='hunk'>@@ -291,7 +292,7 @@ void hpfs_remove_btree(struct super_block *s, struct bplus_header *btree)</div><div class='ctx'> 			if (hpfs_stop_cycles(s, ano, &amp;d1, &amp;d2, "hpfs_remove_btree #1"))</div><div class='ctx'> 				return;</div><div class='ctx'> 		if (!(anode = hpfs_map_anode(s, ano, &amp;bh))) return;</div><div class='del'>-		btree1 = &amp;anode-&gt;btree;</div><div class='add'>+		btree1 = GET_BTREE_PTR(&amp;anode-&gt;btree);</div><div class='ctx'> 		level++;</div><div class='ctx'> 		pos = 0;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -307,7 +308,7 @@ void hpfs_remove_btree(struct super_block *s, struct bplus_header *btree)</div><div class='ctx'> 	ano = le32_to_cpu(anode-&gt;up);</div><div class='ctx'> 	if (--level) {</div><div class='ctx'> 		if (!(anode = hpfs_map_anode(s, ano, &amp;bh))) return;</div><div class='del'>-		btree1 = &amp;anode-&gt;btree;</div><div class='add'>+		btree1 = GET_BTREE_PTR(&amp;anode-&gt;btree);</div><div class='ctx'> 	} else btree1 = btree;</div><div class='ctx'> 	for (i = 0; i &lt; btree1-&gt;n_used_nodes; i++) {</div><div class='ctx'> 		if (le32_to_cpu(btree1-&gt;u.internal[i].down) == oano) {</div><div class='hunk'>@@ -332,7 +333,7 @@ static secno anode_lookup(struct super_block *s, anode_secno a, unsigned sec)</div><div class='ctx'> 	struct anode *anode;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> 	if (!(anode = hpfs_map_anode(s, a, &amp;bh))) return -1;</div><div class='del'>-	return hpfs_bplus_lookup(s, NULL, &amp;anode-&gt;btree, sec, bh);</div><div class='add'>+	return hpfs_bplus_lookup(s, NULL, GET_BTREE_PTR(&amp;anode-&gt;btree), sec, bh);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int hpfs_ea_read(struct super_block *s, secno a, int ano, unsigned pos,</div><div class='hunk'>@@ -388,7 +389,7 @@ void hpfs_ea_remove(struct super_block *s, secno a, int ano, unsigned len)</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> 	if (ano) {</div><div class='ctx'> 		if (!(anode = hpfs_map_anode(s, a, &amp;bh))) return;</div><div class='del'>-		hpfs_remove_btree(s, &amp;anode-&gt;btree);</div><div class='add'>+		hpfs_remove_btree(s, GET_BTREE_PTR(&amp;anode-&gt;btree));</div><div class='ctx'> 		brelse(bh);</div><div class='ctx'> 		hpfs_free_sectors(s, a, 1);</div><div class='ctx'> 	} else hpfs_free_sectors(s, a, (len + 511) &gt;&gt; 9);</div><div class='hunk'>@@ -407,10 +408,10 @@ void hpfs_truncate_btree(struct super_block *s, secno f, int fno, unsigned secs)</div><div class='ctx'> 	int c1, c2 = 0;</div><div class='ctx'> 	if (fno) {</div><div class='ctx'> 		if (!(fnode = hpfs_map_fnode(s, f, &amp;bh))) return;</div><div class='del'>-		btree = &amp;fnode-&gt;btree;</div><div class='add'>+		btree = GET_BTREE_PTR(&amp;fnode-&gt;btree);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		if (!(anode = hpfs_map_anode(s, f, &amp;bh))) return;</div><div class='del'>-		btree = &amp;anode-&gt;btree;</div><div class='add'>+		btree = GET_BTREE_PTR(&amp;anode-&gt;btree);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!secs) {</div><div class='ctx'> 		hpfs_remove_btree(s, btree);</div><div class='hunk'>@@ -448,7 +449,7 @@ void hpfs_truncate_btree(struct super_block *s, secno f, int fno, unsigned secs)</div><div class='ctx'> 			if (hpfs_stop_cycles(s, node, &amp;c1, &amp;c2, "hpfs_truncate_btree"))</div><div class='ctx'> 				return;</div><div class='ctx'> 		if (!(anode = hpfs_map_anode(s, node, &amp;bh))) return;</div><div class='del'>-		btree = &amp;anode-&gt;btree;</div><div class='add'>+		btree = GET_BTREE_PTR(&amp;anode-&gt;btree);</div><div class='ctx'> 	}	</div><div class='ctx'> 	nodes = btree-&gt;n_used_nodes + btree-&gt;n_free_nodes;</div><div class='ctx'> 	for (i = 0; i &lt; btree-&gt;n_used_nodes; i++)</div><div class='hunk'>@@ -485,7 +486,7 @@ void hpfs_remove_fnode(struct super_block *s, fnode_secno fno)</div><div class='ctx'> 	struct extended_attribute *ea;</div><div class='ctx'> 	struct extended_attribute *ea_end;</div><div class='ctx'> 	if (!(fnode = hpfs_map_fnode(s, fno, &amp;bh))) return;</div><div class='del'>-	if (!fnode_is_dir(fnode)) hpfs_remove_btree(s, &amp;fnode-&gt;btree);</div><div class='add'>+	if (!fnode_is_dir(fnode)) hpfs_remove_btree(s, GET_BTREE_PTR(&amp;fnode-&gt;btree));</div><div class='ctx'> 	else hpfs_remove_dtree(s, le32_to_cpu(fnode-&gt;u.external[0].disk_secno));</div><div class='ctx'> 	ea_end = fnode_end_ea(fnode);</div><div class='ctx'> 	for (ea = fnode_ea(fnode); ea &lt; ea_end; ea = next_ea(ea))</div><div class='head'>diff --git a/fs/hpfs/dir.c b/fs/hpfs/dir.c<br/>index f32f15669996..ceb50b2dc91a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hpfs/dir.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hpfs/dir.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hpfs/dir.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hpfs/dir.c</a></div><div class='hunk'>@@ -247,7 +247,7 @@ struct dentry *hpfs_lookup(struct inode *dir, struct dentry *dentry, unsigned in</div><div class='ctx'> 		result = ERR_PTR(-ENOMEM);</div><div class='ctx'> 		goto bail1;</div><div class='ctx'> 	}</div><div class='del'>-	if (result-&gt;i_state &amp; I_NEW) {</div><div class='add'>+	if (inode_state_read_once(result) &amp; I_NEW) {</div><div class='ctx'> 		hpfs_init_inode(result);</div><div class='ctx'> 		if (de-&gt;directory)</div><div class='ctx'> 			hpfs_read_inode(result);</div><div class='hunk'>@@ -277,14 +277,16 @@ struct dentry *hpfs_lookup(struct inode *dir, struct dentry *dentry, unsigned in</div><div class='ctx'> 	 * inode.</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='del'>-	if (!result-&gt;i_ctime.tv_sec) {</div><div class='del'>-		if (!(result-&gt;i_ctime.tv_sec = local_to_gmt(dir-&gt;i_sb, le32_to_cpu(de-&gt;creation_date))))</div><div class='del'>-			result-&gt;i_ctime.tv_sec = 1;</div><div class='del'>-		result-&gt;i_ctime.tv_nsec = 0;</div><div class='del'>-		result-&gt;i_mtime.tv_sec = local_to_gmt(dir-&gt;i_sb, le32_to_cpu(de-&gt;write_date));</div><div class='del'>-		result-&gt;i_mtime.tv_nsec = 0;</div><div class='del'>-		result-&gt;i_atime.tv_sec = local_to_gmt(dir-&gt;i_sb, le32_to_cpu(de-&gt;read_date));</div><div class='del'>-		result-&gt;i_atime.tv_nsec = 0;</div><div class='add'>+	if (!inode_get_ctime_sec(result)) {</div><div class='add'>+		time64_t csec = local_to_gmt(dir-&gt;i_sb, le32_to_cpu(de-&gt;creation_date));</div><div class='add'>+</div><div class='add'>+		inode_set_ctime(result, csec ? csec : 1, 0);</div><div class='add'>+		inode_set_mtime(result,</div><div class='add'>+				local_to_gmt(dir-&gt;i_sb, le32_to_cpu(de-&gt;write_date)),</div><div class='add'>+				0);</div><div class='add'>+		inode_set_atime(result,</div><div class='add'>+				local_to_gmt(dir-&gt;i_sb, le32_to_cpu(de-&gt;read_date)),</div><div class='add'>+				0);</div><div class='ctx'> 		hpfs_result-&gt;i_ea_size = le32_to_cpu(de-&gt;ea_size);</div><div class='ctx'> 		if (!hpfs_result-&gt;i_ea_mode &amp;&amp; de-&gt;read_only)</div><div class='ctx'> 			result-&gt;i_mode &amp;= ~0222;</div><div class='head'>diff --git a/fs/hpfs/ea.c b/fs/hpfs/ea.c<br/>index 102ba18e561f..2149d3ca530b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hpfs/ea.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hpfs/ea.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hpfs/ea.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hpfs/ea.c</a></div><div class='hunk'>@@ -41,7 +41,7 @@ void hpfs_ea_ext_remove(struct super_block *s, secno a, int ano, unsigned len)</div><div class='ctx'> 		struct buffer_head *bh;</div><div class='ctx'> 		struct anode *anode;</div><div class='ctx'> 		if ((anode = hpfs_map_anode(s, a, &amp;bh))) {</div><div class='del'>-			hpfs_remove_btree(s, &amp;anode-&gt;btree);</div><div class='add'>+			hpfs_remove_btree(s, GET_BTREE_PTR(&amp;anode-&gt;btree));</div><div class='ctx'> 			brelse(bh);</div><div class='ctx'> 			hpfs_free_sectors(s, a, 1);</div><div class='ctx'> 		}</div><div class='head'>diff --git a/fs/hpfs/file.c b/fs/hpfs/file.c<br/>index fb37f57130aa..29e876705369 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hpfs/file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hpfs/file.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hpfs/file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hpfs/file.c</a></div><div class='hunk'>@@ -51,7 +51,9 @@ static secno hpfs_bmap(struct inode *inode, unsigned file_secno, unsigned *n_sec</div><div class='ctx'> 		return hpfs_inode-&gt;i_disk_sec + n;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!(fnode = hpfs_map_fnode(inode-&gt;i_sb, inode-&gt;i_ino, &amp;bh))) return 0;</div><div class='del'>-	disk_secno = hpfs_bplus_lookup(inode-&gt;i_sb, inode, &amp;fnode-&gt;btree, file_secno, bh);</div><div class='add'>+	disk_secno = hpfs_bplus_lookup(inode-&gt;i_sb, inode,</div><div class='add'>+				       GET_BTREE_PTR(&amp;fnode-&gt;btree),</div><div class='add'>+				       file_secno, bh);</div><div class='ctx'> 	if (disk_secno == -1) return 0;</div><div class='ctx'> 	if (hpfs_chk_sectors(inode-&gt;i_sb, disk_secno, 1, "bmap")) return 0;</div><div class='ctx'> 	n = file_secno - hpfs_inode-&gt;i_file_sec;</div><div class='hunk'>@@ -158,14 +160,9 @@ static const struct iomap_ops hpfs_iomap_ops = {</div><div class='ctx'> 	.iomap_begin		= hpfs_iomap_begin,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int hpfs_readpage(struct file *file, struct page *page)</div><div class='add'>+static int hpfs_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	return mpage_readpage(page, hpfs_get_block);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int hpfs_writepage(struct page *page, struct writeback_control *wbc)</div><div class='del'>-{</div><div class='del'>-	return block_write_full_page(page, hpfs_get_block, wbc);</div><div class='add'>+	return mpage_read_folio(folio, hpfs_get_block);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void hpfs_readahead(struct readahead_control *rac)</div><div class='hunk'>@@ -193,14 +190,14 @@ static void hpfs_write_failed(struct address_space *mapping, loff_t to)</div><div class='ctx'> 	hpfs_unlock(inode-&gt;i_sb);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hpfs_write_begin(struct file *file, struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned flags,</div><div class='del'>-			struct page **pagep, void **fsdata)</div><div class='add'>+static int hpfs_write_begin(const struct kiocb *iocb,</div><div class='add'>+			    struct address_space *mapping,</div><div class='add'>+			    loff_t pos, unsigned len,</div><div class='add'>+			    struct folio **foliop, void **fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	*pagep = NULL;</div><div class='del'>-	ret = cont_write_begin(file, mapping, pos, len, flags, pagep, fsdata,</div><div class='add'>+	ret = cont_write_begin(iocb, mapping, pos, len, foliop, fsdata,</div><div class='ctx'> 				hpfs_get_block,</div><div class='ctx'> 				&amp;hpfs_i(mapping-&gt;host)-&gt;mmu_private);</div><div class='ctx'> 	if (unlikely(ret))</div><div class='hunk'>@@ -209,13 +206,14 @@ static int hpfs_write_begin(struct file *file, struct address_space *mapping,</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hpfs_write_end(struct file *file, struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned copied,</div><div class='del'>-			struct page *pagep, void *fsdata)</div><div class='add'>+static int hpfs_write_end(const struct kiocb *iocb,</div><div class='add'>+			  struct address_space *mapping,</div><div class='add'>+			  loff_t pos, unsigned len, unsigned copied,</div><div class='add'>+			  struct folio *folio, void *fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='ctx'> 	int err;</div><div class='del'>-	err = generic_write_end(file, mapping, pos, len, copied, pagep, fsdata);</div><div class='add'>+	err = generic_write_end(iocb, mapping, pos, len, copied, folio, fsdata);</div><div class='ctx'> 	if (err &lt; len)</div><div class='ctx'> 		hpfs_write_failed(mapping, pos + len);</div><div class='ctx'> 	if (!(err &lt; 0)) {</div><div class='hunk'>@@ -245,14 +243,15 @@ static int hpfs_fiemap(struct inode *inode, struct fiemap_extent_info *fieinfo,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations hpfs_aops = {</div><div class='del'>-	.set_page_dirty	= __set_page_dirty_buffers,</div><div class='del'>-	.readpage = hpfs_readpage,</div><div class='del'>-	.writepage = hpfs_writepage,</div><div class='add'>+	.dirty_folio	= block_dirty_folio,</div><div class='add'>+	.invalidate_folio = block_invalidate_folio,</div><div class='add'>+	.read_folio = hpfs_read_folio,</div><div class='ctx'> 	.readahead = hpfs_readahead,</div><div class='ctx'> 	.writepages = hpfs_writepages,</div><div class='ctx'> 	.write_begin = hpfs_write_begin,</div><div class='ctx'> 	.write_end = hpfs_write_end,</div><div class='del'>-	.bmap = _hpfs_bmap</div><div class='add'>+	.bmap = _hpfs_bmap,</div><div class='add'>+	.migrate_folio = buffer_migrate_folio,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct file_operations hpfs_file_ops =</div><div class='hunk'>@@ -260,10 +259,10 @@ const struct file_operations hpfs_file_ops =</div><div class='ctx'> 	.llseek		= generic_file_llseek,</div><div class='ctx'> 	.read_iter	= generic_file_read_iter,</div><div class='ctx'> 	.write_iter	= generic_file_write_iter,</div><div class='del'>-	.mmap		= generic_file_mmap,</div><div class='add'>+	.mmap_prepare	= generic_file_mmap_prepare,</div><div class='ctx'> 	.release	= hpfs_file_release,</div><div class='ctx'> 	.fsync		= hpfs_file_fsync,</div><div class='del'>-	.splice_read	= generic_file_splice_read,</div><div class='add'>+	.splice_read	= filemap_splice_read,</div><div class='ctx'> 	.unlocked_ioctl	= hpfs_ioctl,</div><div class='ctx'> 	.compat_ioctl	= compat_ptr_ioctl,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/hpfs/hpfs.h b/fs/hpfs/hpfs.h<br/>index 281dec8f636b..353f73c914d9 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hpfs/hpfs.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hpfs/hpfs.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hpfs/hpfs.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hpfs/hpfs.h</a></div><div class='hunk'>@@ -394,27 +394,45 @@ enum {</div><div class='ctx'> 	BP_binary_search = 0x40,</div><div class='ctx'> 	BP_internal = 0x80</div><div class='ctx'> };</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * GET_BTREE_PTR() - Get a pointer to struct bplus_header</div><div class='add'>+ *</div><div class='add'>+ * Wrapper around container_of() to retrieve a pointer to struct</div><div class='add'>+ * bplus_header from a pointer to struct bplus_header_fixed.</div><div class='add'>+ *</div><div class='add'>+ * @ptr: Pointer to struct bplus_header_fixed.</div><div class='add'>+ *</div><div class='add'>+ */</div><div class='add'>+#define GET_BTREE_PTR(ptr) \</div><div class='add'>+	container_of(ptr, struct bplus_header, __hdr)</div><div class='add'>+</div><div class='ctx'> struct bplus_header</div><div class='ctx'> {</div><div class='del'>-  u8 flags;				/* bit 0 - high bit of first free entry offset</div><div class='add'>+	/* New members MUST be added within the struct_group() macro below. */</div><div class='add'>+	struct_group_tagged(bplus_header_fixed, __hdr,</div><div class='add'>+		u8 flags;		/* bit 0 - high bit of first free entry offset</div><div class='ctx'> 					   bit 5 - we're pointed to by an fnode,</div><div class='ctx'> 					   the data btree or some ea or the</div><div class='ctx'> 					   main ea bootage pointer ea_secno</div><div class='ctx'> 					   bit 6 - suggest binary search (unused)</div><div class='ctx'> 					   bit 7 - 1 -&gt; (internal) tree of anodes</div><div class='ctx'> 						   0 -&gt; (leaf) list of extents */</div><div class='del'>-  u8 fill[3];</div><div class='del'>-  u8 n_free_nodes;			/* free nodes in following array */</div><div class='del'>-  u8 n_used_nodes;			/* used nodes in following array */</div><div class='del'>-  __le16 first_free;			/* offset from start of header to</div><div class='add'>+		u8 fill[3];</div><div class='add'>+		u8 n_free_nodes;	/* free nodes in following array */</div><div class='add'>+		u8 n_used_nodes;	/* used nodes in following array */</div><div class='add'>+		__le16 first_free;	/* offset from start of header to</div><div class='ctx'> 					   first free node in array */</div><div class='del'>-  union {</div><div class='del'>-	/* (internal) 2-word entries giving subtree pointers */</div><div class='del'>-	DECLARE_FLEX_ARRAY(struct bplus_internal_node, internal);</div><div class='del'>-	/* (external) 3-word entries giving sector runs */</div><div class='del'>-	DECLARE_FLEX_ARRAY(struct bplus_leaf_node, external);</div><div class='del'>-  } u;</div><div class='add'>+	);</div><div class='add'>+	union {</div><div class='add'>+		/* (internal) 2-word entries giving subtree pointers */</div><div class='add'>+		DECLARE_FLEX_ARRAY(struct bplus_internal_node, internal);</div><div class='add'>+		/* (external) 3-word entries giving sector runs */</div><div class='add'>+		DECLARE_FLEX_ARRAY(struct bplus_leaf_node, external);</div><div class='add'>+	} u;</div><div class='ctx'> };</div><div class='add'>+static_assert(offsetof(struct bplus_header, u.internal) == sizeof(struct bplus_header_fixed),</div><div class='add'>+	      "struct member likely outside of struct_group_tagged()");</div><div class='ctx'> </div><div class='ctx'> static inline bool bp_internal(struct bplus_header *bp)</div><div class='ctx'> {</div><div class='hunk'>@@ -453,7 +471,7 @@ struct fnode</div><div class='ctx'>   __le16 flags;				/* bit 1 set -&gt; ea_secno is an anode */</div><div class='ctx'> 					/* bit 8 set -&gt; directory.  first &amp; only extent</div><div class='ctx'> 					   points to dnode. */</div><div class='del'>-  struct bplus_header btree;		/* b+ tree, 8 extents or 12 subtrees */</div><div class='add'>+  struct bplus_header_fixed btree;	/* b+ tree, 8 extents or 12 subtrees */</div><div class='ctx'>   union {</div><div class='ctx'>     struct bplus_leaf_node external[8];</div><div class='ctx'>     struct bplus_internal_node internal[12];</div><div class='hunk'>@@ -495,7 +513,7 @@ struct anode</div><div class='ctx'>   __le32 self;				/* pointer to this anode */</div><div class='ctx'>   __le32 up;				/* parent anode or fnode */</div><div class='ctx'> </div><div class='del'>-  struct bplus_header btree;		/* b+tree, 40 extents or 60 subtrees */</div><div class='add'>+  struct bplus_header_fixed btree;	/* b+tree, 40 extents or 60 subtrees */</div><div class='ctx'>   union {</div><div class='ctx'>     struct bplus_leaf_node external[40];</div><div class='ctx'>     struct bplus_internal_node internal[60];</div><div class='head'>diff --git a/fs/hpfs/hpfs_fn.h b/fs/hpfs/hpfs_fn.h<br/>index 167ec6884642..237c1c23e855 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hpfs/hpfs_fn.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hpfs/hpfs_fn.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hpfs/hpfs_fn.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hpfs/hpfs_fn.h</a></div><div class='hunk'>@@ -21,7 +21,7 @@</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/sched/signal.h&gt;</div><div class='ctx'> #include &lt;linux/blkdev.h&gt;</div><div class='del'>-#include &lt;asm/unaligned.h&gt;</div><div class='add'>+#include &lt;linux/unaligned.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "hpfs.h"</div><div class='ctx'> </div><div class='hunk'>@@ -280,7 +280,7 @@ void hpfs_init_inode(struct inode *);</div><div class='ctx'> void hpfs_read_inode(struct inode *);</div><div class='ctx'> void hpfs_write_inode(struct inode *);</div><div class='ctx'> void hpfs_write_inode_nolock(struct inode *);</div><div class='del'>-int hpfs_setattr(struct user_namespace *, struct dentry *, struct iattr *);</div><div class='add'>+int hpfs_setattr(struct mnt_idmap *, struct dentry *, struct iattr *);</div><div class='ctx'> void hpfs_write_if_changed(struct inode *);</div><div class='ctx'> void hpfs_evict_inode(struct inode *);</div><div class='ctx'> </div><div class='head'>diff --git a/fs/hpfs/inode.c b/fs/hpfs/inode.c<br/>index 82208cc28ebd..93d528f4f4f2 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hpfs/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hpfs/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hpfs/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hpfs/inode.c</a></div><div class='hunk'>@@ -36,9 +36,9 @@ void hpfs_init_inode(struct inode *i)</div><div class='ctx'> 	hpfs_inode-&gt;i_rddir_off = NULL;</div><div class='ctx'> 	hpfs_inode-&gt;i_dirty = 0;</div><div class='ctx'> </div><div class='del'>-	i-&gt;i_ctime.tv_sec = i-&gt;i_ctime.tv_nsec = 0;</div><div class='del'>-	i-&gt;i_mtime.tv_sec = i-&gt;i_mtime.tv_nsec = 0;</div><div class='del'>-	i-&gt;i_atime.tv_sec = i-&gt;i_atime.tv_nsec = 0;</div><div class='add'>+	inode_set_ctime(i, 0, 0);</div><div class='add'>+	inode_set_mtime(i, 0, 0);</div><div class='add'>+	inode_set_atime(i, 0, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void hpfs_read_inode(struct inode *i)</div><div class='hunk'>@@ -184,7 +184,7 @@ void hpfs_write_inode(struct inode *i)</div><div class='ctx'> 	struct hpfs_inode_info *hpfs_inode = hpfs_i(i);</div><div class='ctx'> 	struct inode *parent;</div><div class='ctx'> 	if (i-&gt;i_ino == hpfs_sb(i-&gt;i_sb)-&gt;sb_root) return;</div><div class='del'>-	if (hpfs_inode-&gt;i_rddir_off &amp;&amp; !atomic_read(&amp;i-&gt;i_count)) {</div><div class='add'>+	if (hpfs_inode-&gt;i_rddir_off &amp;&amp; !icount_read(i)) {</div><div class='ctx'> 		if (*hpfs_inode-&gt;i_rddir_off)</div><div class='ctx'> 			pr_err("write_inode: some position still there\n");</div><div class='ctx'> 		kfree(hpfs_inode-&gt;i_rddir_off);</div><div class='hunk'>@@ -196,7 +196,7 @@ void hpfs_write_inode(struct inode *i)</div><div class='ctx'> 	parent = iget_locked(i-&gt;i_sb, hpfs_inode-&gt;i_parent_dir);</div><div class='ctx'> 	if (parent) {</div><div class='ctx'> 		hpfs_inode-&gt;i_dirty = 0;</div><div class='del'>-		if (parent-&gt;i_state &amp; I_NEW) {</div><div class='add'>+		if (inode_state_read_once(parent) &amp; I_NEW) {</div><div class='ctx'> 			hpfs_init_inode(parent);</div><div class='ctx'> 			hpfs_read_inode(parent);</div><div class='ctx'> 			unlock_new_inode(parent);</div><div class='hunk'>@@ -230,9 +230,9 @@ void hpfs_write_inode_nolock(struct inode *i)</div><div class='ctx'> 	}</div><div class='ctx'> 	hpfs_write_inode_ea(i, fnode);</div><div class='ctx'> 	if (de) {</div><div class='del'>-		de-&gt;write_date = cpu_to_le32(gmt_to_local(i-&gt;i_sb, i-&gt;i_mtime.tv_sec));</div><div class='del'>-		de-&gt;read_date = cpu_to_le32(gmt_to_local(i-&gt;i_sb, i-&gt;i_atime.tv_sec));</div><div class='del'>-		de-&gt;creation_date = cpu_to_le32(gmt_to_local(i-&gt;i_sb, i-&gt;i_ctime.tv_sec));</div><div class='add'>+		de-&gt;write_date = cpu_to_le32(gmt_to_local(i-&gt;i_sb, inode_get_mtime_sec(i)));</div><div class='add'>+		de-&gt;read_date = cpu_to_le32(gmt_to_local(i-&gt;i_sb, inode_get_atime_sec(i)));</div><div class='add'>+		de-&gt;creation_date = cpu_to_le32(gmt_to_local(i-&gt;i_sb, inode_get_ctime_sec(i)));</div><div class='ctx'> 		de-&gt;read_only = !(i-&gt;i_mode &amp; 0222);</div><div class='ctx'> 		de-&gt;ea_size = cpu_to_le32(hpfs_inode-&gt;i_ea_size);</div><div class='ctx'> 		hpfs_mark_4buffers_dirty(&amp;qbh);</div><div class='hunk'>@@ -240,9 +240,9 @@ void hpfs_write_inode_nolock(struct inode *i)</div><div class='ctx'> 	}</div><div class='ctx'> 	if (S_ISDIR(i-&gt;i_mode)) {</div><div class='ctx'> 		if ((de = map_dirent(i, hpfs_inode-&gt;i_dno, "\001\001", 2, NULL, &amp;qbh))) {</div><div class='del'>-			de-&gt;write_date = cpu_to_le32(gmt_to_local(i-&gt;i_sb, i-&gt;i_mtime.tv_sec));</div><div class='del'>-			de-&gt;read_date = cpu_to_le32(gmt_to_local(i-&gt;i_sb, i-&gt;i_atime.tv_sec));</div><div class='del'>-			de-&gt;creation_date = cpu_to_le32(gmt_to_local(i-&gt;i_sb, i-&gt;i_ctime.tv_sec));</div><div class='add'>+			de-&gt;write_date = cpu_to_le32(gmt_to_local(i-&gt;i_sb, inode_get_mtime_sec(i)));</div><div class='add'>+			de-&gt;read_date = cpu_to_le32(gmt_to_local(i-&gt;i_sb, inode_get_atime_sec(i)));</div><div class='add'>+			de-&gt;creation_date = cpu_to_le32(gmt_to_local(i-&gt;i_sb, inode_get_ctime_sec(i)));</div><div class='ctx'> 			de-&gt;read_only = !(i-&gt;i_mode &amp; 0222);</div><div class='ctx'> 			de-&gt;ea_size = cpu_to_le32(/*hpfs_inode-&gt;i_ea_size*/0);</div><div class='ctx'> 			de-&gt;file_size = cpu_to_le32(0);</div><div class='hunk'>@@ -257,7 +257,7 @@ void hpfs_write_inode_nolock(struct inode *i)</div><div class='ctx'> 	brelse(bh);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int hpfs_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='add'>+int hpfs_setattr(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		 struct iattr *attr)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='hunk'>@@ -275,7 +275,7 @@ int hpfs_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 	if ((attr-&gt;ia_valid &amp; ATTR_SIZE) &amp;&amp; attr-&gt;ia_size &gt; inode-&gt;i_size)</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='del'>-	error = setattr_prepare(&amp;init_user_ns, dentry, attr);</div><div class='add'>+	error = setattr_prepare(&amp;nop_mnt_idmap, dentry, attr);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='hunk'>@@ -289,7 +289,7 @@ int hpfs_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 		hpfs_truncate(inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	setattr_copy(&amp;init_user_ns, inode, attr);</div><div class='add'>+	setattr_copy(&amp;nop_mnt_idmap, inode, attr);</div><div class='ctx'> </div><div class='ctx'> 	hpfs_write_inode(inode);</div><div class='ctx'> </div><div class='head'>diff --git a/fs/hpfs/map.c b/fs/hpfs/map.c<br/>index ecd9fccd1663..be73233502f8 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hpfs/map.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hpfs/map.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hpfs/map.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hpfs/map.c</a></div><div class='hunk'>@@ -178,14 +178,14 @@ struct fnode *hpfs_map_fnode(struct super_block *s, ino_t ino, struct buffer_hea</div><div class='ctx'> 			}</div><div class='ctx'> 			if (!fnode_is_dir(fnode)) {</div><div class='ctx'> 				if ((unsigned)fnode-&gt;btree.n_used_nodes + (unsigned)fnode-&gt;btree.n_free_nodes !=</div><div class='del'>-				    (bp_internal(&amp;fnode-&gt;btree) ? 12 : 8)) {</div><div class='add'>+				    (bp_internal(GET_BTREE_PTR(&amp;fnode-&gt;btree)) ? 12 : 8)) {</div><div class='ctx'> 					hpfs_error(s,</div><div class='ctx'> 					   "bad number of nodes in fnode %08lx",</div><div class='ctx'> 					    (unsigned long)ino);</div><div class='ctx'> 					goto bail;</div><div class='ctx'> 				}</div><div class='ctx'> 				if (le16_to_cpu(fnode-&gt;btree.first_free) !=</div><div class='del'>-				    8 + fnode-&gt;btree.n_used_nodes * (bp_internal(&amp;fnode-&gt;btree) ? 8 : 12)) {</div><div class='add'>+				    8 + fnode-&gt;btree.n_used_nodes * (bp_internal(GET_BTREE_PTR(&amp;fnode-&gt;btree)) ? 8 : 12)) {</div><div class='ctx'> 					hpfs_error(s,</div><div class='ctx'> 					    "bad first_free pointer in fnode %08lx",</div><div class='ctx'> 					    (unsigned long)ino);</div><div class='hunk'>@@ -233,12 +233,12 @@ struct anode *hpfs_map_anode(struct super_block *s, anode_secno ano, struct buff</div><div class='ctx'> 				goto bail;</div><div class='ctx'> 			}</div><div class='ctx'> 			if ((unsigned)anode-&gt;btree.n_used_nodes + (unsigned)anode-&gt;btree.n_free_nodes !=</div><div class='del'>-			    (bp_internal(&amp;anode-&gt;btree) ? 60 : 40)) {</div><div class='add'>+			    (bp_internal(GET_BTREE_PTR(&amp;anode-&gt;btree)) ? 60 : 40)) {</div><div class='ctx'> 				hpfs_error(s, "bad number of nodes in anode %08x", ano);</div><div class='ctx'> 				goto bail;</div><div class='ctx'> 			}</div><div class='ctx'> 			if (le16_to_cpu(anode-&gt;btree.first_free) !=</div><div class='del'>-			    8 + anode-&gt;btree.n_used_nodes * (bp_internal(&amp;anode-&gt;btree) ? 8 : 12)) {</div><div class='add'>+			    8 + anode-&gt;btree.n_used_nodes * (bp_internal(GET_BTREE_PTR(&amp;anode-&gt;btree)) ? 8 : 12)) {</div><div class='ctx'> 				hpfs_error(s, "bad first_free pointer in anode %08x", ano);</div><div class='ctx'> 				goto bail;</div><div class='ctx'> 			}</div><div class='head'>diff --git a/fs/hpfs/namei.c b/fs/hpfs/namei.c<br/>index d73f8a67168e..353e13a615f5 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hpfs/namei.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hpfs/namei.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hpfs/namei.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hpfs/namei.c</a></div><div class='hunk'>@@ -12,16 +12,15 @@</div><div class='ctx'> static void hpfs_update_directory_times(struct inode *dir)</div><div class='ctx'> {</div><div class='ctx'> 	time64_t t = local_to_gmt(dir-&gt;i_sb, local_get_seconds(dir-&gt;i_sb));</div><div class='del'>-	if (t == dir-&gt;i_mtime.tv_sec &amp;&amp;</div><div class='del'>-	    t == dir-&gt;i_ctime.tv_sec)</div><div class='add'>+	if (t == inode_get_mtime_sec(dir) &amp;&amp;</div><div class='add'>+	    t == inode_get_ctime_sec(dir))</div><div class='ctx'> 		return;</div><div class='del'>-	dir-&gt;i_mtime.tv_sec = dir-&gt;i_ctime.tv_sec = t;</div><div class='del'>-	dir-&gt;i_mtime.tv_nsec = dir-&gt;i_ctime.tv_nsec = 0;</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime(dir, t, 0));</div><div class='ctx'> 	hpfs_write_inode_nolock(dir);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hpfs_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-		      struct dentry *dentry, umode_t mode)</div><div class='add'>+static struct dentry *hpfs_mkdir(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+				 struct dentry *dentry, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	const unsigned char *name = dentry-&gt;d_name.name;</div><div class='ctx'> 	unsigned len = dentry-&gt;d_name.len;</div><div class='hunk'>@@ -36,7 +35,7 @@ static int hpfs_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	int r;</div><div class='ctx'> 	struct hpfs_dirent dee;</div><div class='ctx'> 	int err;</div><div class='del'>-	if ((err = hpfs_chk_name(name, &amp;len))) return err==-ENOENT ? -EINVAL : err;</div><div class='add'>+	if ((err = hpfs_chk_name(name, &amp;len))) return ERR_PTR(err==-ENOENT ? -EINVAL : err);</div><div class='ctx'> 	hpfs_lock(dir-&gt;i_sb);</div><div class='ctx'> 	err = -ENOSPC;</div><div class='ctx'> 	fnode = hpfs_alloc_fnode(dir-&gt;i_sb, hpfs_i(dir)-&gt;i_dno, &amp;fno, &amp;bh);</div><div class='hunk'>@@ -53,16 +52,16 @@ static int hpfs_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	dee.fnode = cpu_to_le32(fno);</div><div class='ctx'> 	dee.creation_date = dee.write_date = dee.read_date = cpu_to_le32(local_get_seconds(dir-&gt;i_sb));</div><div class='ctx'> 	result = new_inode(dir-&gt;i_sb);</div><div class='del'>-	if (!result)</div><div class='add'>+	if (!result) {</div><div class='add'>+		err = -ENOMEM;</div><div class='ctx'> 		goto bail2;</div><div class='add'>+	}</div><div class='ctx'> 	hpfs_init_inode(result);</div><div class='ctx'> 	result-&gt;i_ino = fno;</div><div class='ctx'> 	hpfs_i(result)-&gt;i_parent_dir = dir-&gt;i_ino;</div><div class='ctx'> 	hpfs_i(result)-&gt;i_dno = dno;</div><div class='del'>-	result-&gt;i_ctime.tv_sec = result-&gt;i_mtime.tv_sec = result-&gt;i_atime.tv_sec = local_to_gmt(dir-&gt;i_sb, le32_to_cpu(dee.creation_date));</div><div class='del'>-	result-&gt;i_ctime.tv_nsec = 0; </div><div class='del'>-	result-&gt;i_mtime.tv_nsec = 0; </div><div class='del'>-	result-&gt;i_atime.tv_nsec = 0; </div><div class='add'>+	inode_set_mtime_to_ts(result,</div><div class='add'>+			      inode_set_atime_to_ts(result, inode_set_ctime(result, local_to_gmt(dir-&gt;i_sb, le32_to_cpu(dee.creation_date)), 0)));</div><div class='ctx'> 	hpfs_i(result)-&gt;i_ea_size = 0;</div><div class='ctx'> 	result-&gt;i_mode |= S_IFDIR;</div><div class='ctx'> 	result-&gt;i_op = &amp;hpfs_dir_iops;</div><div class='hunk'>@@ -115,7 +114,7 @@ static int hpfs_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	hpfs_update_directory_times(dir);</div><div class='ctx'> 	d_instantiate(dentry, result);</div><div class='ctx'> 	hpfs_unlock(dir-&gt;i_sb);</div><div class='del'>-	return 0;</div><div class='add'>+	return NULL;</div><div class='ctx'> bail3:</div><div class='ctx'> 	iput(result);</div><div class='ctx'> bail2:</div><div class='hunk'>@@ -126,10 +125,10 @@ bail1:</div><div class='ctx'> 	hpfs_free_sectors(dir-&gt;i_sb, fno, 1);</div><div class='ctx'> bail:</div><div class='ctx'> 	hpfs_unlock(dir-&gt;i_sb);</div><div class='del'>-	return err;</div><div class='add'>+	return ERR_PTR(err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hpfs_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int hpfs_create(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		       struct dentry *dentry, umode_t mode, bool excl)</div><div class='ctx'> {</div><div class='ctx'> 	const unsigned char *name = dentry-&gt;d_name.name;</div><div class='hunk'>@@ -156,9 +155,10 @@ static int hpfs_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	dee.creation_date = dee.write_date = dee.read_date = cpu_to_le32(local_get_seconds(dir-&gt;i_sb));</div><div class='ctx'> </div><div class='ctx'> 	result = new_inode(dir-&gt;i_sb);</div><div class='del'>-	if (!result)</div><div class='add'>+	if (!result) {</div><div class='add'>+		err = -ENOMEM;</div><div class='ctx'> 		goto bail1;</div><div class='del'>-	</div><div class='add'>+	}</div><div class='ctx'> 	hpfs_init_inode(result);</div><div class='ctx'> 	result-&gt;i_ino = fno;</div><div class='ctx'> 	result-&gt;i_mode |= S_IFREG;</div><div class='hunk'>@@ -167,10 +167,8 @@ static int hpfs_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	result-&gt;i_fop = &amp;hpfs_file_ops;</div><div class='ctx'> 	set_nlink(result, 1);</div><div class='ctx'> 	hpfs_i(result)-&gt;i_parent_dir = dir-&gt;i_ino;</div><div class='del'>-	result-&gt;i_ctime.tv_sec = result-&gt;i_mtime.tv_sec = result-&gt;i_atime.tv_sec = local_to_gmt(dir-&gt;i_sb, le32_to_cpu(dee.creation_date));</div><div class='del'>-	result-&gt;i_ctime.tv_nsec = 0;</div><div class='del'>-	result-&gt;i_mtime.tv_nsec = 0;</div><div class='del'>-	result-&gt;i_atime.tv_nsec = 0;</div><div class='add'>+	inode_set_mtime_to_ts(result,</div><div class='add'>+			      inode_set_atime_to_ts(result, inode_set_ctime(result, local_to_gmt(dir-&gt;i_sb, le32_to_cpu(dee.creation_date)), 0)));</div><div class='ctx'> 	hpfs_i(result)-&gt;i_ea_size = 0;</div><div class='ctx'> 	if (dee.read_only)</div><div class='ctx'> 		result-&gt;i_mode &amp;= ~0222;</div><div class='hunk'>@@ -217,7 +215,7 @@ bail:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hpfs_mknod(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int hpfs_mknod(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		      struct dentry *dentry, umode_t mode, dev_t rdev)</div><div class='ctx'> {</div><div class='ctx'> 	const unsigned char *name = dentry-&gt;d_name.name;</div><div class='hunk'>@@ -244,16 +242,15 @@ static int hpfs_mknod(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	dee.creation_date = dee.write_date = dee.read_date = cpu_to_le32(local_get_seconds(dir-&gt;i_sb));</div><div class='ctx'> </div><div class='ctx'> 	result = new_inode(dir-&gt;i_sb);</div><div class='del'>-	if (!result)</div><div class='add'>+	if (!result) {</div><div class='add'>+		err = -ENOMEM;</div><div class='ctx'> 		goto bail1;</div><div class='del'>-</div><div class='add'>+	}</div><div class='ctx'> 	hpfs_init_inode(result);</div><div class='ctx'> 	result-&gt;i_ino = fno;</div><div class='ctx'> 	hpfs_i(result)-&gt;i_parent_dir = dir-&gt;i_ino;</div><div class='del'>-	result-&gt;i_ctime.tv_sec = result-&gt;i_mtime.tv_sec = result-&gt;i_atime.tv_sec = local_to_gmt(dir-&gt;i_sb, le32_to_cpu(dee.creation_date));</div><div class='del'>-	result-&gt;i_ctime.tv_nsec = 0;</div><div class='del'>-	result-&gt;i_mtime.tv_nsec = 0;</div><div class='del'>-	result-&gt;i_atime.tv_nsec = 0;</div><div class='add'>+	inode_set_mtime_to_ts(result,</div><div class='add'>+			      inode_set_atime_to_ts(result, inode_set_ctime(result, local_to_gmt(dir-&gt;i_sb, le32_to_cpu(dee.creation_date)), 0)));</div><div class='ctx'> 	hpfs_i(result)-&gt;i_ea_size = 0;</div><div class='ctx'> 	result-&gt;i_uid = current_fsuid();</div><div class='ctx'> 	result-&gt;i_gid = current_fsgid();</div><div class='hunk'>@@ -292,7 +289,7 @@ bail:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hpfs_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int hpfs_symlink(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 			struct dentry *dentry, const char *symlink)</div><div class='ctx'> {</div><div class='ctx'> 	const unsigned char *name = dentry-&gt;d_name.name;</div><div class='hunk'>@@ -321,15 +318,15 @@ static int hpfs_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	dee.creation_date = dee.write_date = dee.read_date = cpu_to_le32(local_get_seconds(dir-&gt;i_sb));</div><div class='ctx'> </div><div class='ctx'> 	result = new_inode(dir-&gt;i_sb);</div><div class='del'>-	if (!result)</div><div class='add'>+	if (!result) {</div><div class='add'>+		err = -ENOMEM;</div><div class='ctx'> 		goto bail1;</div><div class='add'>+	}</div><div class='ctx'> 	result-&gt;i_ino = fno;</div><div class='ctx'> 	hpfs_init_inode(result);</div><div class='ctx'> 	hpfs_i(result)-&gt;i_parent_dir = dir-&gt;i_ino;</div><div class='del'>-	result-&gt;i_ctime.tv_sec = result-&gt;i_mtime.tv_sec = result-&gt;i_atime.tv_sec = local_to_gmt(dir-&gt;i_sb, le32_to_cpu(dee.creation_date));</div><div class='del'>-	result-&gt;i_ctime.tv_nsec = 0;</div><div class='del'>-	result-&gt;i_mtime.tv_nsec = 0;</div><div class='del'>-	result-&gt;i_atime.tv_nsec = 0;</div><div class='add'>+	inode_set_mtime_to_ts(result,</div><div class='add'>+			      inode_set_atime_to_ts(result, inode_set_ctime(result, local_to_gmt(dir-&gt;i_sb, le32_to_cpu(dee.creation_date)), 0)));</div><div class='ctx'> 	hpfs_i(result)-&gt;i_ea_size = 0;</div><div class='ctx'> 	result-&gt;i_mode = S_IFLNK | 0777;</div><div class='ctx'> 	result-&gt;i_uid = current_fsuid();</div><div class='hunk'>@@ -479,10 +476,10 @@ out:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hpfs_symlink_readpage(struct file *file, struct page *page)</div><div class='add'>+static int hpfs_symlink_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	char *link = page_address(page);</div><div class='del'>-	struct inode *i = page-&gt;mapping-&gt;host;</div><div class='add'>+	char *link = folio_address(folio);</div><div class='add'>+	struct inode *i = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	struct fnode *fnode;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> 	int err;</div><div class='hunk'>@@ -493,25 +490,17 @@ static int hpfs_symlink_readpage(struct file *file, struct page *page)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	err = hpfs_read_ea(i-&gt;i_sb, fnode, "SYMLINK", link, PAGE_SIZE);</div><div class='ctx'> 	brelse(bh);</div><div class='del'>-	if (err)</div><div class='del'>-		goto fail;</div><div class='del'>-	hpfs_unlock(i-&gt;i_sb);</div><div class='del'>-	SetPageUptodate(page);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='ctx'> fail:</div><div class='ctx'> 	hpfs_unlock(i-&gt;i_sb);</div><div class='del'>-	SetPageError(page);</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	folio_end_read(folio, err == 0);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations hpfs_symlink_aops = {</div><div class='del'>-	.readpage	= hpfs_symlink_readpage</div><div class='add'>+	.read_folio	= hpfs_symlink_read_folio</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int hpfs_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='add'>+static int hpfs_rename(struct mnt_idmap *idmap, struct inode *old_dir,</div><div class='ctx'> 		       struct dentry *old_dentry, struct inode *new_dir,</div><div class='ctx'> 		       struct dentry *new_dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='head'>diff --git a/fs/hpfs/super.c b/fs/hpfs/super.c<br/>index a7dbfc892022..371aa6de8075 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hpfs/super.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hpfs/super.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hpfs/super.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hpfs/super.c</a></div><div class='hunk'>@@ -9,7 +9,9 @@</div><div class='ctx'> </div><div class='ctx'> #include "hpfs_fn.h"</div><div class='ctx'> #include &lt;linux/module.h&gt;</div><div class='del'>-#include &lt;linux/parser.h&gt;</div><div class='add'>+#include &lt;linux/fs_struct.h&gt;</div><div class='add'>+#include &lt;linux/fs_context.h&gt;</div><div class='add'>+#include &lt;linux/fs_parser.h&gt;</div><div class='ctx'> #include &lt;linux/init.h&gt;</div><div class='ctx'> #include &lt;linux/statfs.h&gt;</div><div class='ctx'> #include &lt;linux/magic.h&gt;</div><div class='hunk'>@@ -90,7 +92,7 @@ void hpfs_error(struct super_block *s, const char *fmt, ...)</div><div class='ctx'> 	hpfs_sb(s)-&gt;sb_was_error = 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* </div><div class='add'>+/*</div><div class='ctx'>  * A little trick to detect cycles in many hpfs structures and don't let the</div><div class='ctx'>  * kernel crash on corrupted filesystem. When first called, set c2 to 0.</div><div class='ctx'>  *</div><div class='hunk'>@@ -232,7 +234,7 @@ static struct kmem_cache * hpfs_inode_cachep;</div><div class='ctx'> static struct inode *hpfs_alloc_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct hpfs_inode_info *ei;</div><div class='del'>-	ei = kmem_cache_alloc(hpfs_inode_cachep, GFP_NOFS);</div><div class='add'>+	ei = alloc_inode_sb(sb, hpfs_inode_cachep, GFP_NOFS);</div><div class='ctx'> 	if (!ei)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	return &amp;ei-&gt;vfs_inode;</div><div class='hunk'>@@ -255,7 +257,7 @@ static int init_inodecache(void)</div><div class='ctx'> 	hpfs_inode_cachep = kmem_cache_create("hpfs_inode_cache",</div><div class='ctx'> 					     sizeof(struct hpfs_inode_info),</div><div class='ctx'> 					     0, (SLAB_RECLAIM_ACCOUNT|</div><div class='del'>-						SLAB_MEM_SPREAD|SLAB_ACCOUNT),</div><div class='add'>+						SLAB_ACCOUNT),</div><div class='ctx'> 					     init_once);</div><div class='ctx'> 	if (hpfs_inode_cachep == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='hunk'>@@ -272,146 +274,70 @@ static void destroy_inodecache(void)</div><div class='ctx'> 	kmem_cache_destroy(hpfs_inode_cachep);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * A tiny parser for option strings, stolen from dosfs.</div><div class='del'>- * Stolen again from read-only hpfs.</div><div class='del'>- * And updated for table-driven option parsing.</div><div class='del'>- */</div><div class='del'>-</div><div class='ctx'> enum {</div><div class='del'>-	Opt_help, Opt_uid, Opt_gid, Opt_umask, Opt_case_lower, Opt_case_asis,</div><div class='del'>-	Opt_check_none, Opt_check_normal, Opt_check_strict,</div><div class='del'>-	Opt_err_cont, Opt_err_ro, Opt_err_panic,</div><div class='del'>-	Opt_eas_no, Opt_eas_ro, Opt_eas_rw,</div><div class='del'>-	Opt_chkdsk_no, Opt_chkdsk_errors, Opt_chkdsk_always,</div><div class='del'>-	Opt_timeshift, Opt_err,</div><div class='add'>+	Opt_help, Opt_uid, Opt_gid, Opt_umask, Opt_case,</div><div class='add'>+	Opt_check, Opt_err, Opt_eas, Opt_chkdsk, Opt_timeshift,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static const match_table_t tokens = {</div><div class='del'>-	{Opt_help, "help"},</div><div class='del'>-	{Opt_uid, "uid=%u"},</div><div class='del'>-	{Opt_gid, "gid=%u"},</div><div class='del'>-	{Opt_umask, "umask=%o"},</div><div class='del'>-	{Opt_case_lower, "case=lower"},</div><div class='del'>-	{Opt_case_asis, "case=asis"},</div><div class='del'>-	{Opt_check_none, "check=none"},</div><div class='del'>-	{Opt_check_normal, "check=normal"},</div><div class='del'>-	{Opt_check_strict, "check=strict"},</div><div class='del'>-	{Opt_err_cont, "errors=continue"},</div><div class='del'>-	{Opt_err_ro, "errors=remount-ro"},</div><div class='del'>-	{Opt_err_panic, "errors=panic"},</div><div class='del'>-	{Opt_eas_no, "eas=no"},</div><div class='del'>-	{Opt_eas_ro, "eas=ro"},</div><div class='del'>-	{Opt_eas_rw, "eas=rw"},</div><div class='del'>-	{Opt_chkdsk_no, "chkdsk=no"},</div><div class='del'>-	{Opt_chkdsk_errors, "chkdsk=errors"},</div><div class='del'>-	{Opt_chkdsk_always, "chkdsk=always"},</div><div class='del'>-	{Opt_timeshift, "timeshift=%d"},</div><div class='del'>-	{Opt_err, NULL},</div><div class='add'>+static const struct constant_table hpfs_param_case[] = {</div><div class='add'>+	{"asis",	0},</div><div class='add'>+	{"lower",	1},</div><div class='add'>+	{}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int parse_opts(char *opts, kuid_t *uid, kgid_t *gid, umode_t *umask,</div><div class='del'>-		      int *lowercase, int *eas, int *chk, int *errs,</div><div class='del'>-		      int *chkdsk, int *timeshift)</div><div class='del'>-{</div><div class='del'>-	char *p;</div><div class='del'>-	int option;</div><div class='add'>+static const struct constant_table hpfs_param_check[] = {</div><div class='add'>+	{"none",	0},</div><div class='add'>+	{"normal",	1},</div><div class='add'>+	{"strict",	2},</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-	if (!opts)</div><div class='del'>-		return 1;</div><div class='add'>+static const struct constant_table hpfs_param_err[] = {</div><div class='add'>+	{"continue",	0},</div><div class='add'>+	{"remount-ro",	1},</div><div class='add'>+	{"panic",	2},</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-	/*pr_info("Parsing opts: '%s'\n",opts);*/</div><div class='del'>-</div><div class='del'>-	while ((p = strsep(&amp;opts, ",")) != NULL) {</div><div class='del'>-		substring_t args[MAX_OPT_ARGS];</div><div class='del'>-		int token;</div><div class='del'>-		if (!*p)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		token = match_token(p, tokens, args);</div><div class='del'>-		switch (token) {</div><div class='del'>-		case Opt_help:</div><div class='del'>-			return 2;</div><div class='del'>-		case Opt_uid:</div><div class='del'>-			if (match_int(args, &amp;option))</div><div class='del'>-				return 0;</div><div class='del'>-			*uid = make_kuid(current_user_ns(), option);</div><div class='del'>-			if (!uid_valid(*uid))</div><div class='del'>-				return 0;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_gid:</div><div class='del'>-			if (match_int(args, &amp;option))</div><div class='del'>-				return 0;</div><div class='del'>-			*gid = make_kgid(current_user_ns(), option);</div><div class='del'>-			if (!gid_valid(*gid))</div><div class='del'>-				return 0;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_umask:</div><div class='del'>-			if (match_octal(args, &amp;option))</div><div class='del'>-				return 0;</div><div class='del'>-			*umask = option;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_case_lower:</div><div class='del'>-			*lowercase = 1;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_case_asis:</div><div class='del'>-			*lowercase = 0;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_check_none:</div><div class='del'>-			*chk = 0;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_check_normal:</div><div class='del'>-			*chk = 1;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_check_strict:</div><div class='del'>-			*chk = 2;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_err_cont:</div><div class='del'>-			*errs = 0;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_err_ro:</div><div class='del'>-			*errs = 1;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_err_panic:</div><div class='del'>-			*errs = 2;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_eas_no:</div><div class='del'>-			*eas = 0;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_eas_ro:</div><div class='del'>-			*eas = 1;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_eas_rw:</div><div class='del'>-			*eas = 2;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_chkdsk_no:</div><div class='del'>-			*chkdsk = 0;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_chkdsk_errors:</div><div class='del'>-			*chkdsk = 1;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_chkdsk_always:</div><div class='del'>-			*chkdsk = 2;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_timeshift:</div><div class='del'>-		{</div><div class='del'>-			int m = 1;</div><div class='del'>-			char *rhs = args[0].from;</div><div class='del'>-			if (!rhs || !*rhs)</div><div class='del'>-				return 0;</div><div class='del'>-			if (*rhs == '-') m = -1;</div><div class='del'>-			if (*rhs == '+' || *rhs == '-') rhs++;</div><div class='del'>-			*timeshift = simple_strtoul(rhs, &amp;rhs, 0) * m;</div><div class='del'>-			if (*rhs)</div><div class='del'>-				return 0;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		default:</div><div class='del'>-			return 0;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	return 1;</div><div class='del'>-}</div><div class='add'>+static const struct constant_table hpfs_param_eas[] = {</div><div class='add'>+	{"no",		0},</div><div class='add'>+	{"ro",		1},</div><div class='add'>+	{"rw",		2},</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct constant_table hpfs_param_chkdsk[] = {</div><div class='add'>+	{"no",		0},</div><div class='add'>+	{"errors",	1},</div><div class='add'>+	{"always",	2},</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct fs_parameter_spec hpfs_param_spec[] = {</div><div class='add'>+	fsparam_flag	("help",	Opt_help),</div><div class='add'>+	fsparam_uid	("uid",		Opt_uid),</div><div class='add'>+	fsparam_gid	("gid",		Opt_gid),</div><div class='add'>+	fsparam_u32oct	("umask",	Opt_umask),</div><div class='add'>+	fsparam_enum	("case",	Opt_case,	hpfs_param_case),</div><div class='add'>+	fsparam_enum	("check",	Opt_check,	hpfs_param_check),</div><div class='add'>+	fsparam_enum	("errors",	Opt_err,	hpfs_param_err),</div><div class='add'>+	fsparam_enum	("eas",		Opt_eas,	hpfs_param_eas),</div><div class='add'>+	fsparam_enum	("chkdsk",	Opt_chkdsk,	hpfs_param_chkdsk),</div><div class='add'>+	fsparam_s32	("timeshift",	Opt_timeshift),</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct hpfs_fc_context {</div><div class='add'>+	kuid_t uid;</div><div class='add'>+	kgid_t gid;</div><div class='add'>+	umode_t umask;</div><div class='add'>+	int lowercase;</div><div class='add'>+	int eas;</div><div class='add'>+	int chk;</div><div class='add'>+	int errs;</div><div class='add'>+	int chkdsk;</div><div class='add'>+	int timeshift;</div><div class='add'>+};</div><div class='ctx'> </div><div class='ctx'> static inline void hpfs_help(void)</div><div class='ctx'> {</div><div class='hunk'>@@ -439,49 +365,88 @@ HPFS filesystem options:\n\</div><div class='ctx'> \n");</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hpfs_remount_fs(struct super_block *s, int *flags, char *data)</div><div class='add'>+static int hpfs_parse_param(struct fs_context *fc, struct fs_parameter *param)</div><div class='ctx'> {</div><div class='del'>-	kuid_t uid;</div><div class='del'>-	kgid_t gid;</div><div class='del'>-	umode_t umask;</div><div class='del'>-	int lowercase, eas, chk, errs, chkdsk, timeshift;</div><div class='del'>-	int o;</div><div class='add'>+	struct hpfs_fc_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct fs_parse_result result;</div><div class='add'>+	int opt;</div><div class='add'>+</div><div class='add'>+	opt = fs_parse(fc, hpfs_param_spec, param, &amp;result);</div><div class='add'>+	if (opt &lt; 0)</div><div class='add'>+		return opt;</div><div class='add'>+</div><div class='add'>+	switch (opt) {</div><div class='add'>+	case Opt_help:</div><div class='add'>+		hpfs_help();</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	case Opt_uid:</div><div class='add'>+		ctx-&gt;uid = result.uid;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_gid:</div><div class='add'>+		ctx-&gt;gid = result.gid;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_umask:</div><div class='add'>+		ctx-&gt;umask = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_case:</div><div class='add'>+		ctx-&gt;lowercase = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_check:</div><div class='add'>+		ctx-&gt;chk = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_err:</div><div class='add'>+		ctx-&gt;errs = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_eas:</div><div class='add'>+		ctx-&gt;eas = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_chkdsk:</div><div class='add'>+		ctx-&gt;chkdsk = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_timeshift:</div><div class='add'>+		{</div><div class='add'>+			char *rhs = param-&gt;string;</div><div class='add'>+			int timeshift;</div><div class='add'>+</div><div class='add'>+			if (kstrtoint(rhs, 0, &amp;timeshift))</div><div class='add'>+				return -EINVAL;</div><div class='add'>+			ctx-&gt;timeshift = timeshift;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+	default:</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int hpfs_reconfigure(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct hpfs_fc_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct super_block *s = fc-&gt;root-&gt;d_sb;</div><div class='ctx'> 	struct hpfs_sb_info *sbi = hpfs_sb(s);</div><div class='ctx'> </div><div class='ctx'> 	sync_filesystem(s);</div><div class='ctx'> </div><div class='del'>-	*flags |= SB_NOATIME;</div><div class='add'>+	fc-&gt;sb_flags |= SB_NOATIME;</div><div class='ctx'> </div><div class='ctx'> 	hpfs_lock(s);</div><div class='del'>-	uid = sbi-&gt;sb_uid; gid = sbi-&gt;sb_gid;</div><div class='del'>-	umask = 0777 &amp; ~sbi-&gt;sb_mode;</div><div class='del'>-	lowercase = sbi-&gt;sb_lowercase;</div><div class='del'>-	eas = sbi-&gt;sb_eas; chk = sbi-&gt;sb_chk; chkdsk = sbi-&gt;sb_chkdsk;</div><div class='del'>-	errs = sbi-&gt;sb_err; timeshift = sbi-&gt;sb_timeshift;</div><div class='del'>-</div><div class='del'>-	if (!(o = parse_opts(data, &amp;uid, &amp;gid, &amp;umask, &amp;lowercase,</div><div class='del'>-	    &amp;eas, &amp;chk, &amp;errs, &amp;chkdsk, &amp;timeshift))) {</div><div class='del'>-		pr_err("bad mount options.\n");</div><div class='del'>-		goto out_err;</div><div class='del'>-	}</div><div class='del'>-	if (o == 2) {</div><div class='del'>-		hpfs_help();</div><div class='del'>-		goto out_err;</div><div class='del'>-	}</div><div class='del'>-	if (timeshift != sbi-&gt;sb_timeshift) {</div><div class='add'>+</div><div class='add'>+	if (ctx-&gt;timeshift != sbi-&gt;sb_timeshift) {</div><div class='ctx'> 		pr_err("timeshift can't be changed using remount.\n");</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	unmark_dirty(s);</div><div class='ctx'> </div><div class='del'>-	sbi-&gt;sb_uid = uid; sbi-&gt;sb_gid = gid;</div><div class='del'>-	sbi-&gt;sb_mode = 0777 &amp; ~umask;</div><div class='del'>-	sbi-&gt;sb_lowercase = lowercase;</div><div class='del'>-	sbi-&gt;sb_eas = eas; sbi-&gt;sb_chk = chk; sbi-&gt;sb_chkdsk = chkdsk;</div><div class='del'>-	sbi-&gt;sb_err = errs; sbi-&gt;sb_timeshift = timeshift;</div><div class='add'>+	sbi-&gt;sb_uid = ctx-&gt;uid; sbi-&gt;sb_gid = ctx-&gt;gid;</div><div class='add'>+	sbi-&gt;sb_mode = 0777 &amp; ~ctx-&gt;umask;</div><div class='add'>+	sbi-&gt;sb_lowercase = ctx-&gt;lowercase;</div><div class='add'>+	sbi-&gt;sb_eas = ctx-&gt;eas; sbi-&gt;sb_chk = ctx-&gt;chk;</div><div class='add'>+	sbi-&gt;sb_chkdsk = ctx-&gt;chkdsk;</div><div class='add'>+	sbi-&gt;sb_err = ctx-&gt;errs; sbi-&gt;sb_timeshift = ctx-&gt;timeshift;</div><div class='ctx'> </div><div class='del'>-	if (!(*flags &amp; SB_RDONLY)) mark_dirty(s, 1);</div><div class='add'>+	if (!(fc-&gt;sb_flags &amp; SB_RDONLY)) mark_dirty(s, 1);</div><div class='ctx'> </div><div class='ctx'> 	hpfs_unlock(s);</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -530,30 +495,24 @@ static const struct super_operations hpfs_sops =</div><div class='ctx'> 	.evict_inode	= hpfs_evict_inode,</div><div class='ctx'> 	.put_super	= hpfs_put_super,</div><div class='ctx'> 	.statfs		= hpfs_statfs,</div><div class='del'>-	.remount_fs	= hpfs_remount_fs,</div><div class='ctx'> 	.show_options	= hpfs_show_options,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int hpfs_fill_super(struct super_block *s, void *options, int silent)</div><div class='add'>+static int hpfs_fill_super(struct super_block *s, struct fs_context *fc)</div><div class='ctx'> {</div><div class='add'>+	struct hpfs_fc_context *ctx = fc-&gt;fs_private;</div><div class='ctx'> 	struct buffer_head *bh0, *bh1, *bh2;</div><div class='ctx'> 	struct hpfs_boot_block *bootblock;</div><div class='ctx'> 	struct hpfs_super_block *superblock;</div><div class='ctx'> 	struct hpfs_spare_block *spareblock;</div><div class='ctx'> 	struct hpfs_sb_info *sbi;</div><div class='ctx'> 	struct inode *root;</div><div class='del'>-</div><div class='del'>-	kuid_t uid;</div><div class='del'>-	kgid_t gid;</div><div class='del'>-	umode_t umask;</div><div class='del'>-	int lowercase, eas, chk, errs, chkdsk, timeshift;</div><div class='add'>+	int silent = fc-&gt;sb_flags &amp; SB_SILENT;</div><div class='ctx'> </div><div class='ctx'> 	dnode_secno root_dno;</div><div class='ctx'> 	struct hpfs_dirent *de = NULL;</div><div class='ctx'> 	struct quad_buffer_head qbh;</div><div class='ctx'> </div><div class='del'>-	int o;</div><div class='del'>-</div><div class='ctx'> 	sbi = kzalloc(sizeof(*sbi), GFP_KERNEL);</div><div class='ctx'> 	if (!sbi) {</div><div class='ctx'> 		return -ENOMEM;</div><div class='hunk'>@@ -563,26 +522,6 @@ static int hpfs_fill_super(struct super_block *s, void *options, int silent)</div><div class='ctx'> 	mutex_init(&amp;sbi-&gt;hpfs_mutex);</div><div class='ctx'> 	hpfs_lock(s);</div><div class='ctx'> </div><div class='del'>-	uid = current_uid();</div><div class='del'>-	gid = current_gid();</div><div class='del'>-	umask = current_umask();</div><div class='del'>-	lowercase = 0;</div><div class='del'>-	eas = 2;</div><div class='del'>-	chk = 1;</div><div class='del'>-	errs = 1;</div><div class='del'>-	chkdsk = 1;</div><div class='del'>-	timeshift = 0;</div><div class='del'>-</div><div class='del'>-	if (!(o = parse_opts(options, &amp;uid, &amp;gid, &amp;umask, &amp;lowercase,</div><div class='del'>-	    &amp;eas, &amp;chk, &amp;errs, &amp;chkdsk, &amp;timeshift))) {</div><div class='del'>-		pr_err("bad mount options.\n");</div><div class='del'>-		goto bail0;</div><div class='del'>-	}</div><div class='del'>-	if (o==2) {</div><div class='del'>-		hpfs_help();</div><div class='del'>-		goto bail0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	/*sbi-&gt;sb_mounting = 1;*/</div><div class='ctx'> 	sb_set_blocksize(s, 512);</div><div class='ctx'> 	sbi-&gt;sb_fs_size = -1;</div><div class='hunk'>@@ -612,7 +551,7 @@ static int hpfs_fill_super(struct super_block *s, void *options, int silent)</div><div class='ctx'> 	/* Fill superblock stuff */</div><div class='ctx'> 	s-&gt;s_magic = HPFS_SUPER_MAGIC;</div><div class='ctx'> 	s-&gt;s_op = &amp;hpfs_sops;</div><div class='del'>-	s-&gt;s_d_op = &amp;hpfs_dentry_operations;</div><div class='add'>+	set_default_d_op(s, &amp;hpfs_dentry_operations);</div><div class='ctx'> 	s-&gt;s_time_min =  local_to_gmt(s, 0);</div><div class='ctx'> 	s-&gt;s_time_max =  local_to_gmt(s, U32_MAX);</div><div class='ctx'> </div><div class='hunk'>@@ -622,17 +561,17 @@ static int hpfs_fill_super(struct super_block *s, void *options, int silent)</div><div class='ctx'> 	sbi-&gt;sb_dirband_start = le32_to_cpu(superblock-&gt;dir_band_start);</div><div class='ctx'> 	sbi-&gt;sb_dirband_size = le32_to_cpu(superblock-&gt;n_dir_band);</div><div class='ctx'> 	sbi-&gt;sb_dmap = le32_to_cpu(superblock-&gt;dir_band_bitmap);</div><div class='del'>-	sbi-&gt;sb_uid = uid;</div><div class='del'>-	sbi-&gt;sb_gid = gid;</div><div class='del'>-	sbi-&gt;sb_mode = 0777 &amp; ~umask;</div><div class='add'>+	sbi-&gt;sb_uid = ctx-&gt;uid;</div><div class='add'>+	sbi-&gt;sb_gid = ctx-&gt;gid;</div><div class='add'>+	sbi-&gt;sb_mode = 0777 &amp; ~ctx-&gt;umask;</div><div class='ctx'> 	sbi-&gt;sb_n_free = -1;</div><div class='ctx'> 	sbi-&gt;sb_n_free_dnodes = -1;</div><div class='del'>-	sbi-&gt;sb_lowercase = lowercase;</div><div class='del'>-	sbi-&gt;sb_eas = eas;</div><div class='del'>-	sbi-&gt;sb_chk = chk;</div><div class='del'>-	sbi-&gt;sb_chkdsk = chkdsk;</div><div class='del'>-	sbi-&gt;sb_err = errs;</div><div class='del'>-	sbi-&gt;sb_timeshift = timeshift;</div><div class='add'>+	sbi-&gt;sb_lowercase = ctx-&gt;lowercase;</div><div class='add'>+	sbi-&gt;sb_eas = ctx-&gt;eas;</div><div class='add'>+	sbi-&gt;sb_chk = ctx-&gt;chk;</div><div class='add'>+	sbi-&gt;sb_chkdsk = ctx-&gt;chkdsk;</div><div class='add'>+	sbi-&gt;sb_err = ctx-&gt;errs;</div><div class='add'>+	sbi-&gt;sb_timeshift = ctx-&gt;timeshift;</div><div class='ctx'> 	sbi-&gt;sb_was_error = 0;</div><div class='ctx'> 	sbi-&gt;sb_cp_table = NULL;</div><div class='ctx'> 	sbi-&gt;sb_c_bitmap = -1;</div><div class='hunk'>@@ -653,7 +592,7 @@ static int hpfs_fill_super(struct super_block *s, void *options, int silent)</div><div class='ctx'> 	</div><div class='ctx'> 	/* Check for general fs errors*/</div><div class='ctx'> 	if (spareblock-&gt;dirty &amp;&amp; !spareblock-&gt;old_wrote) {</div><div class='del'>-		if (errs == 2) {</div><div class='add'>+		if (sbi-&gt;sb_err == 2) {</div><div class='ctx'> 			pr_err("Improperly stopped, not mounted\n");</div><div class='ctx'> 			goto bail4;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -667,16 +606,16 @@ static int hpfs_fill_super(struct super_block *s, void *options, int silent)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (le32_to_cpu(spareblock-&gt;n_dnode_spares) != le32_to_cpu(spareblock-&gt;n_dnode_spares_free)) {</div><div class='del'>-		if (errs &gt;= 2) {</div><div class='add'>+		if (sbi-&gt;sb_err &gt;= 2) {</div><div class='ctx'> 			pr_err("Spare dnodes used, try chkdsk\n");</div><div class='ctx'> 			mark_dirty(s, 0);</div><div class='ctx'> 			goto bail4;</div><div class='ctx'> 		}</div><div class='ctx'> 		hpfs_error(s, "warning: spare dnodes used, try chkdsk");</div><div class='del'>-		if (errs == 0)</div><div class='add'>+		if (sbi-&gt;sb_err == 0)</div><div class='ctx'> 			pr_err("Proceeding, but your filesystem could be corrupted if you delete files or directories\n");</div><div class='ctx'> 	}</div><div class='del'>-	if (chk) {</div><div class='add'>+	if (sbi-&gt;sb_chk) {</div><div class='ctx'> 		unsigned a;</div><div class='ctx'> 		if (le32_to_cpu(superblock-&gt;dir_band_end) - le32_to_cpu(superblock-&gt;dir_band_start) + 1 != le32_to_cpu(superblock-&gt;n_dir_band) ||</div><div class='ctx'> 		    le32_to_cpu(superblock-&gt;dir_band_end) &lt; le32_to_cpu(superblock-&gt;dir_band_start) || le32_to_cpu(superblock-&gt;n_dir_band) &gt; 0x4000) {</div><div class='hunk'>@@ -725,12 +664,15 @@ static int hpfs_fill_super(struct super_block *s, void *options, int silent)</div><div class='ctx'> 	if (!de)</div><div class='ctx'> 		hpfs_error(s, "unable to find root dir");</div><div class='ctx'> 	else {</div><div class='del'>-		root-&gt;i_atime.tv_sec = local_to_gmt(s, le32_to_cpu(de-&gt;read_date));</div><div class='del'>-		root-&gt;i_atime.tv_nsec = 0;</div><div class='del'>-		root-&gt;i_mtime.tv_sec = local_to_gmt(s, le32_to_cpu(de-&gt;write_date));</div><div class='del'>-		root-&gt;i_mtime.tv_nsec = 0;</div><div class='del'>-		root-&gt;i_ctime.tv_sec = local_to_gmt(s, le32_to_cpu(de-&gt;creation_date));</div><div class='del'>-		root-&gt;i_ctime.tv_nsec = 0;</div><div class='add'>+		inode_set_atime(root,</div><div class='add'>+				local_to_gmt(s, le32_to_cpu(de-&gt;read_date)),</div><div class='add'>+				0);</div><div class='add'>+		inode_set_mtime(root,</div><div class='add'>+				local_to_gmt(s, le32_to_cpu(de-&gt;write_date)),</div><div class='add'>+				0);</div><div class='add'>+		inode_set_ctime(root,</div><div class='add'>+				local_to_gmt(s, le32_to_cpu(de-&gt;creation_date)),</div><div class='add'>+				0);</div><div class='ctx'> 		hpfs_i(root)-&gt;i_ea_size = le32_to_cpu(de-&gt;ea_size);</div><div class='ctx'> 		hpfs_i(root)-&gt;i_parent_dir = root-&gt;i_ino;</div><div class='ctx'> 		if (root-&gt;i_size == -1)</div><div class='hunk'>@@ -752,18 +694,70 @@ bail0:</div><div class='ctx'> 	return -EINVAL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct dentry *hpfs_mount(struct file_system_type *fs_type,</div><div class='del'>-	int flags, const char *dev_name, void *data)</div><div class='add'>+static int hpfs_get_tree(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	return mount_bdev(fs_type, flags, dev_name, data, hpfs_fill_super);</div><div class='add'>+	return get_tree_bdev(fc, hpfs_fill_super);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void hpfs_free_fc(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	kfree(fc-&gt;fs_private);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct fs_context_operations hpfs_fc_context_ops = {</div><div class='add'>+	.parse_param	= hpfs_parse_param,</div><div class='add'>+	.get_tree	= hpfs_get_tree,</div><div class='add'>+	.reconfigure	= hpfs_reconfigure,</div><div class='add'>+	.free		= hpfs_free_fc,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int hpfs_init_fs_context(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct hpfs_fc_context *ctx;</div><div class='add'>+</div><div class='add'>+	ctx = kzalloc(sizeof(struct hpfs_fc_context), GFP_KERNEL);</div><div class='add'>+	if (!ctx)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	if (fc-&gt;purpose == FS_CONTEXT_FOR_RECONFIGURE) {</div><div class='add'>+		struct super_block *sb = fc-&gt;root-&gt;d_sb;</div><div class='add'>+		struct hpfs_sb_info *sbi = hpfs_sb(sb);</div><div class='add'>+</div><div class='add'>+		ctx-&gt;uid = sbi-&gt;sb_uid;</div><div class='add'>+		ctx-&gt;gid = sbi-&gt;sb_gid;</div><div class='add'>+		ctx-&gt;umask = 0777 &amp; ~sbi-&gt;sb_mode;</div><div class='add'>+		ctx-&gt;lowercase = sbi-&gt;sb_lowercase;</div><div class='add'>+		ctx-&gt;eas = sbi-&gt;sb_eas;</div><div class='add'>+		ctx-&gt;chk = sbi-&gt;sb_chk;</div><div class='add'>+		ctx-&gt;chkdsk = sbi-&gt;sb_chkdsk;</div><div class='add'>+		ctx-&gt;errs = sbi-&gt;sb_err;</div><div class='add'>+		ctx-&gt;timeshift = sbi-&gt;sb_timeshift;</div><div class='add'>+</div><div class='add'>+	} else {</div><div class='add'>+		ctx-&gt;uid = current_uid();</div><div class='add'>+		ctx-&gt;gid = current_gid();</div><div class='add'>+		ctx-&gt;umask = current_umask();</div><div class='add'>+		ctx-&gt;lowercase = 0;</div><div class='add'>+		ctx-&gt;eas = 2;</div><div class='add'>+		ctx-&gt;chk = 1;</div><div class='add'>+		ctx-&gt;errs = 1;</div><div class='add'>+		ctx-&gt;chkdsk = 1;</div><div class='add'>+		ctx-&gt;timeshift = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	fc-&gt;fs_private = ctx;</div><div class='add'>+	fc-&gt;ops = &amp;hpfs_fc_context_ops;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> static struct file_system_type hpfs_fs_type = {</div><div class='ctx'> 	.owner		= THIS_MODULE,</div><div class='ctx'> 	.name		= "hpfs",</div><div class='del'>-	.mount		= hpfs_mount,</div><div class='ctx'> 	.kill_sb	= kill_block_super,</div><div class='ctx'> 	.fs_flags	= FS_REQUIRES_DEV,</div><div class='add'>+	.init_fs_context = hpfs_init_fs_context,</div><div class='add'>+	.parameters	= hpfs_param_spec,</div><div class='ctx'> };</div><div class='ctx'> MODULE_ALIAS_FS("hpfs");</div><div class='ctx'> </div><div class='hunk'>@@ -790,4 +784,5 @@ static void __exit exit_hpfs_fs(void)</div><div class='ctx'> </div><div class='ctx'> module_init(init_hpfs_fs)</div><div class='ctx'> module_exit(exit_hpfs_fs)</div><div class='add'>+MODULE_DESCRIPTION("OS/2 HPFS file system support");</div><div class='ctx'> MODULE_LICENSE("GPL");</div><div class='head'>diff --git a/fs/hugetlbfs/inode.c b/fs/hugetlbfs/inode.c<br/>index 49d2e686be74..3b4c152c5c73 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/hugetlbfs/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/hugetlbfs/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/hugetlbfs/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/hugetlbfs/inode.c</a></div><div class='hunk'>@@ -11,7 +11,6 @@</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/thread_info.h&gt;</div><div class='ctx'> #include &lt;asm/current.h&gt;</div><div class='del'>-#include &lt;linux/sched/signal.h&gt;		/* remove ASAP */</div><div class='ctx'> #include &lt;linux/falloc.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/mount.h&gt;</div><div class='hunk'>@@ -40,9 +39,11 @@</div><div class='ctx'> #include &lt;linux/uaccess.h&gt;</div><div class='ctx'> #include &lt;linux/sched/mm.h&gt;</div><div class='ctx'> </div><div class='del'>-static const struct super_operations hugetlbfs_ops;</div><div class='add'>+#define CREATE_TRACE_POINTS</div><div class='add'>+#include &lt;trace/events/hugetlbfs.h&gt;</div><div class='add'>+</div><div class='ctx'> static const struct address_space_operations hugetlbfs_aops;</div><div class='del'>-const struct file_operations hugetlbfs_file_operations;</div><div class='add'>+static const struct file_operations hugetlbfs_file_operations;</div><div class='ctx'> static const struct inode_operations hugetlbfs_dir_inode_operations;</div><div class='ctx'> static const struct inode_operations hugetlbfs_inode_operations;</div><div class='ctx'> </div><div class='hunk'>@@ -75,49 +76,16 @@ enum hugetlb_param {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct fs_parameter_spec hugetlb_fs_parameters[] = {</div><div class='del'>-	fsparam_u32   ("gid",		Opt_gid),</div><div class='add'>+	fsparam_gid   ("gid",		Opt_gid),</div><div class='ctx'> 	fsparam_string("min_size",	Opt_min_size),</div><div class='ctx'> 	fsparam_u32oct("mode",		Opt_mode),</div><div class='ctx'> 	fsparam_string("nr_inodes",	Opt_nr_inodes),</div><div class='ctx'> 	fsparam_string("pagesize",	Opt_pagesize),</div><div class='ctx'> 	fsparam_string("size",		Opt_size),</div><div class='del'>-	fsparam_u32   ("uid",		Opt_uid),</div><div class='add'>+	fsparam_uid   ("uid",		Opt_uid),</div><div class='ctx'> 	{}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_NUMA</div><div class='del'>-static inline void hugetlb_set_vma_policy(struct vm_area_struct *vma,</div><div class='del'>-					struct inode *inode, pgoff_t index)</div><div class='del'>-{</div><div class='del'>-	vma-&gt;vm_policy = mpol_shared_policy_lookup(&amp;HUGETLBFS_I(inode)-&gt;policy,</div><div class='del'>-							index);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void hugetlb_drop_vma_policy(struct vm_area_struct *vma)</div><div class='del'>-{</div><div class='del'>-	mpol_cond_put(vma-&gt;vm_policy);</div><div class='del'>-}</div><div class='del'>-#else</div><div class='del'>-static inline void hugetlb_set_vma_policy(struct vm_area_struct *vma,</div><div class='del'>-					struct inode *inode, pgoff_t index)</div><div class='del'>-{</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void hugetlb_drop_vma_policy(struct vm_area_struct *vma)</div><div class='del'>-{</div><div class='del'>-}</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-static void huge_pagevec_release(struct pagevec *pvec)</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; pagevec_count(pvec); ++i)</div><div class='del'>-		put_page(pvec-&gt;pages[i]);</div><div class='del'>-</div><div class='del'>-	pagevec_reinit(pvec);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Mask used when checking the page offset value passed in via system</div><div class='ctx'>  * calls.  This value will be converted to a loff_t which is signed.</div><div class='hunk'>@@ -128,13 +96,20 @@ static void huge_pagevec_release(struct pagevec *pvec)</div><div class='ctx'> #define PGOFF_LOFFT_MAX \</div><div class='ctx'> 	(((1UL &lt;&lt; (PAGE_SHIFT + 1)) - 1) &lt;&lt;  (BITS_PER_LONG - (PAGE_SHIFT + 1)))</div><div class='ctx'> </div><div class='del'>-static int hugetlbfs_file_mmap(struct file *file, struct vm_area_struct *vma)</div><div class='add'>+static int hugetlb_file_mmap_prepare_success(const struct vm_area_struct *vma)</div><div class='add'>+{</div><div class='add'>+	/* Unfortunate we have to reassign vma-&gt;vm_private_data. */</div><div class='add'>+	return hugetlb_vma_lock_alloc((struct vm_area_struct *)vma);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int hugetlbfs_file_mmap_prepare(struct vm_area_desc *desc)</div><div class='ctx'> {</div><div class='add'>+	struct file *file = desc-&gt;file;</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='del'>-	struct hugetlbfs_inode_info *info = HUGETLBFS_I(inode);</div><div class='ctx'> 	loff_t len, vma_len;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct hstate *h = hstate_file(file);</div><div class='add'>+	vm_flags_t vm_flags;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * vma address alignment (but not the pgoff alignment) has</div><div class='hunk'>@@ -144,12 +119,8 @@ static int hugetlbfs_file_mmap(struct file *file, struct vm_area_struct *vma)</div><div class='ctx'> 	 * way when do_mmap unwinds (may be important on powerpc</div><div class='ctx'> 	 * and ia64).</div><div class='ctx'> 	 */</div><div class='del'>-	vma-&gt;vm_flags |= VM_HUGETLB | VM_DONTEXPAND;</div><div class='del'>-	vma-&gt;vm_ops = &amp;hugetlb_vm_ops;</div><div class='del'>-</div><div class='del'>-	ret = seal_check_future_write(info-&gt;seals, vma);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='add'>+	desc-&gt;vm_flags |= VM_HUGETLB | VM_DONTEXPAND;</div><div class='add'>+	desc-&gt;vm_ops = &amp;hugetlb_vm_ops;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * page based offset in vm_pgoff could be sufficiently large to</div><div class='hunk'>@@ -158,16 +129,16 @@ static int hugetlbfs_file_mmap(struct file *file, struct vm_area_struct *vma)</div><div class='ctx'> 	 * sizeof(unsigned long).  So, only check in those instances.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (sizeof(unsigned long) == sizeof(loff_t)) {</div><div class='del'>-		if (vma-&gt;vm_pgoff &amp; PGOFF_LOFFT_MAX)</div><div class='add'>+		if (desc-&gt;pgoff &amp; PGOFF_LOFFT_MAX)</div><div class='ctx'> 			return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* must be huge page aligned */</div><div class='del'>-	if (vma-&gt;vm_pgoff &amp; (~huge_page_mask(h) &gt;&gt; PAGE_SHIFT))</div><div class='add'>+	if (desc-&gt;pgoff &amp; (~huge_page_mask(h) &gt;&gt; PAGE_SHIFT))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	vma_len = (loff_t)(vma-&gt;vm_end - vma-&gt;vm_start);</div><div class='del'>-	len = vma_len + ((loff_t)vma-&gt;vm_pgoff &lt;&lt; PAGE_SHIFT);</div><div class='add'>+	vma_len = (loff_t)vma_desc_size(desc);</div><div class='add'>+	len = vma_len + ((loff_t)desc-&gt;pgoff &lt;&lt; PAGE_SHIFT);</div><div class='ctx'> 	/* check for overflow */</div><div class='ctx'> 	if (len &lt; vma_len)</div><div class='ctx'> 		return -EINVAL;</div><div class='hunk'>@@ -176,18 +147,41 @@ static int hugetlbfs_file_mmap(struct file *file, struct vm_area_struct *vma)</div><div class='ctx'> 	file_accessed(file);</div><div class='ctx'> </div><div class='ctx'> 	ret = -ENOMEM;</div><div class='del'>-	if (!hugetlb_reserve_pages(inode,</div><div class='del'>-				vma-&gt;vm_pgoff &gt;&gt; huge_page_order(h),</div><div class='del'>-				len &gt;&gt; huge_page_shift(h), vma,</div><div class='del'>-				vma-&gt;vm_flags))</div><div class='add'>+</div><div class='add'>+	vm_flags = desc-&gt;vm_flags;</div><div class='add'>+	/*</div><div class='add'>+	 * for SHM_HUGETLB, the pages are reserved in the shmget() call so skip</div><div class='add'>+	 * reserving here. Note: only for SHM hugetlbfs file, the inode</div><div class='add'>+	 * flag S_PRIVATE is set.</div><div class='add'>+	 */</div><div class='add'>+	if (inode-&gt;i_flags &amp; S_PRIVATE)</div><div class='add'>+		vm_flags |= VM_NORESERVE;</div><div class='add'>+</div><div class='add'>+	if (hugetlb_reserve_pages(inode,</div><div class='add'>+			desc-&gt;pgoff &gt;&gt; huge_page_order(h),</div><div class='add'>+			len &gt;&gt; huge_page_shift(h), desc,</div><div class='add'>+			vm_flags) &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	ret = 0;</div><div class='del'>-	if (vma-&gt;vm_flags &amp; VM_WRITE &amp;&amp; inode-&gt;i_size &lt; len)</div><div class='add'>+	if ((desc-&gt;vm_flags &amp; VM_WRITE) &amp;&amp; inode-&gt;i_size &lt; len)</div><div class='ctx'> 		i_size_write(inode, len);</div><div class='ctx'> out:</div><div class='ctx'> 	inode_unlock(inode);</div><div class='ctx'> </div><div class='add'>+	if (!ret) {</div><div class='add'>+		/* Allocate the VMA lock after we set it up. */</div><div class='add'>+		desc-&gt;action.success_hook = hugetlb_file_mmap_prepare_success;</div><div class='add'>+		/*</div><div class='add'>+		 * We cannot permit the rmap finding this VMA in the time</div><div class='add'>+		 * between the VMA being inserted into the VMA tree and the</div><div class='add'>+		 * completion/success hook being invoked.</div><div class='add'>+		 *</div><div class='add'>+		 * This is because we establish a per-VMA hugetlb lock which can</div><div class='add'>+		 * be raced by rmap.</div><div class='add'>+		 */</div><div class='add'>+		desc-&gt;action.hide_from_rmap_until_complete = true;</div><div class='add'>+	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -195,128 +189,52 @@ out:</div><div class='ctx'>  * Called under mmap_write_lock(mm).</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-#ifndef HAVE_ARCH_HUGETLB_UNMAPPED_AREA</div><div class='del'>-static unsigned long</div><div class='del'>-hugetlb_get_unmapped_area_bottomup(struct file *file, unsigned long addr,</div><div class='del'>-		unsigned long len, unsigned long pgoff, unsigned long flags)</div><div class='del'>-{</div><div class='del'>-	struct hstate *h = hstate_file(file);</div><div class='del'>-	struct vm_unmapped_area_info info;</div><div class='del'>-</div><div class='del'>-	info.flags = 0;</div><div class='del'>-	info.length = len;</div><div class='del'>-	info.low_limit = current-&gt;mm-&gt;mmap_base;</div><div class='del'>-	info.high_limit = TASK_SIZE;</div><div class='del'>-	info.align_mask = PAGE_MASK &amp; ~huge_page_mask(h);</div><div class='del'>-	info.align_offset = 0;</div><div class='del'>-	return vm_unmapped_area(&amp;info);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static unsigned long</div><div class='del'>-hugetlb_get_unmapped_area_topdown(struct file *file, unsigned long addr,</div><div class='del'>-		unsigned long len, unsigned long pgoff, unsigned long flags)</div><div class='del'>-{</div><div class='del'>-	struct hstate *h = hstate_file(file);</div><div class='del'>-	struct vm_unmapped_area_info info;</div><div class='del'>-</div><div class='del'>-	info.flags = VM_UNMAPPED_AREA_TOPDOWN;</div><div class='del'>-	info.length = len;</div><div class='del'>-	info.low_limit = max(PAGE_SIZE, mmap_min_addr);</div><div class='del'>-	info.high_limit = current-&gt;mm-&gt;mmap_base;</div><div class='del'>-	info.align_mask = PAGE_MASK &amp; ~huge_page_mask(h);</div><div class='del'>-	info.align_offset = 0;</div><div class='del'>-	addr = vm_unmapped_area(&amp;info);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * A failed mmap() very likely causes application failure,</div><div class='del'>-	 * so fall back to the bottom-up function here. This scenario</div><div class='del'>-	 * can happen with large stack limits and large mmap()</div><div class='del'>-	 * allocations.</div><div class='del'>-	 */</div><div class='del'>-	if (unlikely(offset_in_page(addr))) {</div><div class='del'>-		VM_BUG_ON(addr != -ENOMEM);</div><div class='del'>-		info.flags = 0;</div><div class='del'>-		info.low_limit = current-&gt;mm-&gt;mmap_base;</div><div class='del'>-		info.high_limit = TASK_SIZE;</div><div class='del'>-		addr = vm_unmapped_area(&amp;info);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return addr;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static unsigned long</div><div class='add'>+unsigned long</div><div class='ctx'> hugetlb_get_unmapped_area(struct file *file, unsigned long addr,</div><div class='del'>-		unsigned long len, unsigned long pgoff, unsigned long flags)</div><div class='add'>+			    unsigned long len, unsigned long pgoff,</div><div class='add'>+			    unsigned long flags)</div><div class='ctx'> {</div><div class='del'>-	struct mm_struct *mm = current-&gt;mm;</div><div class='del'>-	struct vm_area_struct *vma;</div><div class='add'>+	unsigned long addr0 = 0;</div><div class='ctx'> 	struct hstate *h = hstate_file(file);</div><div class='ctx'> </div><div class='ctx'> 	if (len &amp; ~huge_page_mask(h))</div><div class='ctx'> 		return -EINVAL;</div><div class='del'>-	if (len &gt; TASK_SIZE)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	if (flags &amp; MAP_FIXED) {</div><div class='del'>-		if (prepare_hugepage_range(file, addr, len))</div><div class='del'>-			return -EINVAL;</div><div class='del'>-		return addr;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (addr) {</div><div class='del'>-		addr = ALIGN(addr, huge_page_size(h));</div><div class='del'>-		vma = find_vma(mm, addr);</div><div class='del'>-		if (TASK_SIZE - len &gt;= addr &amp;&amp;</div><div class='del'>-		    (!vma || addr + len &lt;= vm_start_gap(vma)))</div><div class='del'>-			return addr;</div><div class='del'>-	}</div><div class='add'>+	if ((flags &amp; MAP_FIXED) &amp;&amp; (addr &amp; ~huge_page_mask(h)))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	if (addr)</div><div class='add'>+		addr0 = ALIGN(addr, huge_page_size(h));</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Use mm-&gt;get_unmapped_area value as a hint to use topdown routine.</div><div class='del'>-	 * If architectures have special needs, they should define their own</div><div class='del'>-	 * version of hugetlb_get_unmapped_area.</div><div class='del'>-	 */</div><div class='del'>-	if (mm-&gt;get_unmapped_area == arch_get_unmapped_area_topdown)</div><div class='del'>-		return hugetlb_get_unmapped_area_topdown(file, addr, len,</div><div class='del'>-				pgoff, flags);</div><div class='del'>-	return hugetlb_get_unmapped_area_bottomup(file, addr, len,</div><div class='del'>-			pgoff, flags);</div><div class='add'>+	return mm_get_unmapped_area_vmflags(file, addr0, len, pgoff, flags, 0);</div><div class='ctx'> }</div><div class='del'>-#endif</div><div class='ctx'> </div><div class='del'>-static size_t</div><div class='del'>-hugetlbfs_read_actor(struct page *page, unsigned long offset,</div><div class='del'>-			struct iov_iter *to, unsigned long size)</div><div class='add'>+/*</div><div class='add'>+ * Someone wants to read @bytes from a HWPOISON hugetlb @folio from @offset.</div><div class='add'>+ * Returns the maximum number of bytes one can read without touching the 1st raw</div><div class='add'>+ * HWPOISON page.</div><div class='add'>+ */</div><div class='add'>+static size_t adjust_range_hwpoison(struct folio *folio, size_t offset,</div><div class='add'>+		size_t bytes)</div><div class='ctx'> {</div><div class='del'>-	size_t copied = 0;</div><div class='del'>-	int i, chunksize;</div><div class='del'>-</div><div class='del'>-	/* Find which 4k chunk and offset with in that chunk */</div><div class='del'>-	i = offset &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	offset = offset &amp; ~PAGE_MASK;</div><div class='del'>-</div><div class='del'>-	while (size) {</div><div class='del'>-		size_t n;</div><div class='del'>-		chunksize = PAGE_SIZE;</div><div class='del'>-		if (offset)</div><div class='del'>-			chunksize -= offset;</div><div class='del'>-		if (chunksize &gt; size)</div><div class='del'>-			chunksize = size;</div><div class='del'>-		n = copy_page_to_iter(&amp;page[i], offset, chunksize, to);</div><div class='del'>-		copied += n;</div><div class='del'>-		if (n != chunksize)</div><div class='del'>-			return copied;</div><div class='del'>-		offset = 0;</div><div class='del'>-		size -= chunksize;</div><div class='del'>-		i++;</div><div class='del'>-	}</div><div class='del'>-	return copied;</div><div class='add'>+	struct page *page = folio_page(folio, offset / PAGE_SIZE);</div><div class='add'>+	size_t safe_bytes;</div><div class='add'>+</div><div class='add'>+	if (is_raw_hwpoison_page_in_hugepage(page))</div><div class='add'>+		return 0;</div><div class='add'>+	/* Safe to read the remaining bytes in this page. */</div><div class='add'>+	safe_bytes = PAGE_SIZE - (offset % PAGE_SIZE);</div><div class='add'>+	page++;</div><div class='add'>+</div><div class='add'>+	/* Check each remaining page as long as we are not done yet. */</div><div class='add'>+	for (; safe_bytes &lt; bytes; safe_bytes += PAGE_SIZE, page++)</div><div class='add'>+		if (is_raw_hwpoison_page_in_hugepage(page))</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+	return min(safe_bytes, bytes);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Support for read() - Find the page attached to f_mapping and copy out the</div><div class='del'>- * data. Its *very* similar to generic_file_buffered_read(), we can't use that</div><div class='del'>- * since it has PAGE_SIZE assumptions.</div><div class='add'>+ * data. This provides functionality similar to filemap_read().</div><div class='ctx'>  */</div><div class='ctx'> static ssize_t hugetlbfs_read_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='ctx'> {</div><div class='hunk'>@@ -331,8 +249,8 @@ static ssize_t hugetlbfs_read_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='ctx'> 	ssize_t retval = 0;</div><div class='ctx'> </div><div class='ctx'> 	while (iov_iter_count(to)) {</div><div class='del'>-		struct page *page;</div><div class='del'>-		size_t nr, copied;</div><div class='add'>+		struct folio *folio;</div><div class='add'>+		size_t nr, copied, want;</div><div class='ctx'> </div><div class='ctx'> 		/* nr is the maximum number of bytes to copy from this page */</div><div class='ctx'> 		nr = huge_page_size(h);</div><div class='hunk'>@@ -349,22 +267,38 @@ static ssize_t hugetlbfs_read_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='ctx'> 		}</div><div class='ctx'> 		nr = nr - offset;</div><div class='ctx'> </div><div class='del'>-		/* Find the page */</div><div class='del'>-		page = find_lock_page(mapping, index);</div><div class='del'>-		if (unlikely(page == NULL)) {</div><div class='add'>+		/* Find the folio */</div><div class='add'>+		folio = filemap_lock_hugetlb_folio(h, mapping, index);</div><div class='add'>+		if (IS_ERR(folio)) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * We have a HOLE, zero out the user-buffer for the</div><div class='ctx'> 			 * length of the hole or request.</div><div class='ctx'> 			 */</div><div class='ctx'> 			copied = iov_iter_zero(nr, to);</div><div class='ctx'> 		} else {</div><div class='del'>-			unlock_page(page);</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+</div><div class='add'>+			if (!folio_test_hwpoison(folio))</div><div class='add'>+				want = nr;</div><div class='add'>+			else {</div><div class='add'>+				/*</div><div class='add'>+				 * Adjust how many bytes safe to read without</div><div class='add'>+				 * touching the 1st raw HWPOISON page after</div><div class='add'>+				 * offset.</div><div class='add'>+				 */</div><div class='add'>+				want = adjust_range_hwpoison(folio, offset, nr);</div><div class='add'>+				if (want == 0) {</div><div class='add'>+					folio_put(folio);</div><div class='add'>+					retval = -EIO;</div><div class='add'>+					break;</div><div class='add'>+				}</div><div class='add'>+			}</div><div class='ctx'> </div><div class='ctx'> 			/*</div><div class='del'>-			 * We have the page, copy it to user space buffer.</div><div class='add'>+			 * We have the folio, copy it to user space buffer.</div><div class='ctx'> 			 */</div><div class='del'>-			copied = hugetlbfs_read_actor(page, offset, to, nr);</div><div class='del'>-			put_page(page);</div><div class='add'>+			copied = copy_folio_to_iter(folio, offset, want, to);</div><div class='add'>+			folio_put(folio);</div><div class='ctx'> 		}</div><div class='ctx'> 		offset += copied;</div><div class='ctx'> 		retval += copied;</div><div class='hunk'>@@ -380,65 +314,244 @@ static ssize_t hugetlbfs_read_iter(struct kiocb *iocb, struct iov_iter *to)</div><div class='ctx'> 	return retval;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hugetlbfs_write_begin(struct file *file,</div><div class='add'>+static int hugetlbfs_write_begin(const struct kiocb *iocb,</div><div class='ctx'> 			struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned flags,</div><div class='del'>-			struct page **pagep, void **fsdata)</div><div class='add'>+			loff_t pos, unsigned len,</div><div class='add'>+			struct folio **foliop, void **fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	return -EINVAL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hugetlbfs_write_end(struct file *file, struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned copied,</div><div class='del'>-			struct page *page, void *fsdata)</div><div class='add'>+static int hugetlbfs_write_end(const struct kiocb *iocb,</div><div class='add'>+			       struct address_space *mapping,</div><div class='add'>+			       loff_t pos, unsigned len, unsigned copied,</div><div class='add'>+			       struct folio *folio, void *fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	BUG();</div><div class='ctx'> 	return -EINVAL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void remove_huge_page(struct page *page)</div><div class='add'>+static void hugetlb_delete_from_page_cache(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	ClearPageDirty(page);</div><div class='del'>-	ClearPageUptodate(page);</div><div class='del'>-	delete_from_page_cache(page);</div><div class='add'>+	folio_clear_dirty(folio);</div><div class='add'>+	folio_clear_uptodate(folio);</div><div class='add'>+	filemap_remove_folio(folio);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Called with i_mmap_rwsem held for inode based vma maps.  This makes</div><div class='add'>+ * sure vma (and vm_mm) will not go away.  We also hold the hugetlb fault</div><div class='add'>+ * mutex for the page in the mapping.  So, we can not race with page being</div><div class='add'>+ * faulted into the vma.</div><div class='add'>+ */</div><div class='add'>+static bool hugetlb_vma_maps_pfn(struct vm_area_struct *vma,</div><div class='add'>+				unsigned long addr, unsigned long pfn)</div><div class='add'>+{</div><div class='add'>+	pte_t *ptep, pte;</div><div class='add'>+</div><div class='add'>+	ptep = hugetlb_walk(vma, addr, huge_page_size(hstate_vma(vma)));</div><div class='add'>+	if (!ptep)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	pte = huge_ptep_get(vma-&gt;vm_mm, addr, ptep);</div><div class='add'>+	if (huge_pte_none(pte) || !pte_present(pte))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	if (pte_pfn(pte) == pfn)</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Can vma_offset_start/vma_offset_end overflow on 32-bit arches?</div><div class='add'>+ * No, because the interval tree returns us only those vmas</div><div class='add'>+ * which overlap the truncated area starting at pgoff,</div><div class='add'>+ * and no vma on a 32-bit arch can span beyond the 4GB.</div><div class='add'>+ */</div><div class='add'>+static unsigned long vma_offset_start(struct vm_area_struct *vma, pgoff_t start)</div><div class='add'>+{</div><div class='add'>+	unsigned long offset = 0;</div><div class='add'>+</div><div class='add'>+	if (vma-&gt;vm_pgoff &lt; start)</div><div class='add'>+		offset = (start - vma-&gt;vm_pgoff) &lt;&lt; PAGE_SHIFT;</div><div class='add'>+</div><div class='add'>+	return vma-&gt;vm_start + offset;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static unsigned long vma_offset_end(struct vm_area_struct *vma, pgoff_t end)</div><div class='add'>+{</div><div class='add'>+	unsigned long t_end;</div><div class='add'>+</div><div class='add'>+	if (!end)</div><div class='add'>+		return vma-&gt;vm_end;</div><div class='add'>+</div><div class='add'>+	t_end = ((end - vma-&gt;vm_pgoff) &lt;&lt; PAGE_SHIFT) + vma-&gt;vm_start;</div><div class='add'>+	if (t_end &gt; vma-&gt;vm_end)</div><div class='add'>+		t_end = vma-&gt;vm_end;</div><div class='add'>+	return t_end;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Called with hugetlb fault mutex held.  Therefore, no more mappings to</div><div class='add'>+ * this folio can be created while executing the routine.</div><div class='add'>+ */</div><div class='add'>+static void hugetlb_unmap_file_folio(struct hstate *h,</div><div class='add'>+					struct address_space *mapping,</div><div class='add'>+					struct folio *folio, pgoff_t index)</div><div class='add'>+{</div><div class='add'>+	struct rb_root_cached *root = &amp;mapping-&gt;i_mmap;</div><div class='add'>+	struct hugetlb_vma_lock *vma_lock;</div><div class='add'>+	unsigned long pfn = folio_pfn(folio);</div><div class='add'>+	struct vm_area_struct *vma;</div><div class='add'>+	unsigned long v_start;</div><div class='add'>+	unsigned long v_end;</div><div class='add'>+	pgoff_t start, end;</div><div class='add'>+</div><div class='add'>+	start = index * pages_per_huge_page(h);</div><div class='add'>+	end = (index + 1) * pages_per_huge_page(h);</div><div class='add'>+</div><div class='add'>+	i_mmap_lock_write(mapping);</div><div class='add'>+retry:</div><div class='add'>+	vma_lock = NULL;</div><div class='add'>+	vma_interval_tree_foreach(vma, root, start, end - 1) {</div><div class='add'>+		v_start = vma_offset_start(vma, start);</div><div class='add'>+		v_end = vma_offset_end(vma, end);</div><div class='add'>+</div><div class='add'>+		if (!hugetlb_vma_maps_pfn(vma, v_start, pfn))</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		if (!hugetlb_vma_trylock_write(vma)) {</div><div class='add'>+			vma_lock = vma-&gt;vm_private_data;</div><div class='add'>+			/*</div><div class='add'>+			 * If we can not get vma lock, we need to drop</div><div class='add'>+			 * immap_sema and take locks in order.  First,</div><div class='add'>+			 * take a ref on the vma_lock structure so that</div><div class='add'>+			 * we can be guaranteed it will not go away when</div><div class='add'>+			 * dropping immap_sema.</div><div class='add'>+			 */</div><div class='add'>+			kref_get(&amp;vma_lock-&gt;refs);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		unmap_hugepage_range(vma, v_start, v_end, NULL,</div><div class='add'>+				     ZAP_FLAG_DROP_MARKER);</div><div class='add'>+		hugetlb_vma_unlock_write(vma);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	i_mmap_unlock_write(mapping);</div><div class='add'>+</div><div class='add'>+	if (vma_lock) {</div><div class='add'>+		/*</div><div class='add'>+		 * Wait on vma_lock.  We know it is still valid as we have</div><div class='add'>+		 * a reference.  We must 'open code' vma locking as we do</div><div class='add'>+		 * not know if vma_lock is still attached to vma.</div><div class='add'>+		 */</div><div class='add'>+		down_write(&amp;vma_lock-&gt;rw_sema);</div><div class='add'>+		i_mmap_lock_write(mapping);</div><div class='add'>+</div><div class='add'>+		vma = vma_lock-&gt;vma;</div><div class='add'>+		if (!vma) {</div><div class='add'>+			/*</div><div class='add'>+			 * If lock is no longer attached to vma, then just</div><div class='add'>+			 * unlock, drop our reference and retry looking for</div><div class='add'>+			 * other vmas.</div><div class='add'>+			 */</div><div class='add'>+			up_write(&amp;vma_lock-&gt;rw_sema);</div><div class='add'>+			kref_put(&amp;vma_lock-&gt;refs, hugetlb_vma_lock_release);</div><div class='add'>+			goto retry;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * vma_lock is still attached to vma.  Check to see if vma</div><div class='add'>+		 * still maps page and if so, unmap.</div><div class='add'>+		 */</div><div class='add'>+		v_start = vma_offset_start(vma, start);</div><div class='add'>+		v_end = vma_offset_end(vma, end);</div><div class='add'>+		if (hugetlb_vma_maps_pfn(vma, v_start, pfn))</div><div class='add'>+			unmap_hugepage_range(vma, v_start, v_end, NULL,</div><div class='add'>+					     ZAP_FLAG_DROP_MARKER);</div><div class='add'>+</div><div class='add'>+		kref_put(&amp;vma_lock-&gt;refs, hugetlb_vma_lock_release);</div><div class='add'>+		hugetlb_vma_unlock_write(vma);</div><div class='add'>+</div><div class='add'>+		goto retry;</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='del'>-hugetlb_vmdelete_list(struct rb_root_cached *root, pgoff_t start, pgoff_t end)</div><div class='add'>+hugetlb_vmdelete_list(struct rb_root_cached *root, pgoff_t start, pgoff_t end,</div><div class='add'>+		      zap_flags_t zap_flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct vm_area_struct *vma;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * end == 0 indicates that the entire range after</div><div class='del'>-	 * start should be unmapped.</div><div class='add'>+	 * end == 0 indicates that the entire range after start should be</div><div class='add'>+	 * unmapped.  Note, end is exclusive, whereas the interval tree takes</div><div class='add'>+	 * an inclusive "last".</div><div class='ctx'> 	 */</div><div class='del'>-	vma_interval_tree_foreach(vma, root, start, end ? end : ULONG_MAX) {</div><div class='del'>-		unsigned long v_offset;</div><div class='add'>+	vma_interval_tree_foreach(vma, root, start, end ? end - 1 : ULONG_MAX) {</div><div class='add'>+		unsigned long v_start;</div><div class='ctx'> 		unsigned long v_end;</div><div class='ctx'> </div><div class='add'>+		if (!hugetlb_vma_trylock_write(vma))</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		v_start = vma_offset_start(vma, start);</div><div class='add'>+		v_end = vma_offset_end(vma, end);</div><div class='add'>+</div><div class='add'>+		unmap_hugepage_range(vma, v_start, v_end, NULL, zap_flags);</div><div class='add'>+</div><div class='ctx'> 		/*</div><div class='del'>-		 * Can the expression below overflow on 32-bit arches?</div><div class='del'>-		 * No, because the interval tree returns us only those vmas</div><div class='del'>-		 * which overlap the truncated area starting at pgoff,</div><div class='del'>-		 * and no vma on a 32-bit arch can span beyond the 4GB.</div><div class='add'>+		 * Note that vma lock only exists for shared/non-private</div><div class='add'>+		 * vmas.  Therefore, lock is not held when calling</div><div class='add'>+		 * unmap_hugepage_range for private vmas.</div><div class='ctx'> 		 */</div><div class='del'>-		if (vma-&gt;vm_pgoff &lt; start)</div><div class='del'>-			v_offset = (start - vma-&gt;vm_pgoff) &lt;&lt; PAGE_SHIFT;</div><div class='del'>-		else</div><div class='del'>-			v_offset = 0;</div><div class='del'>-</div><div class='del'>-		if (!end)</div><div class='del'>-			v_end = vma-&gt;vm_end;</div><div class='del'>-		else {</div><div class='del'>-			v_end = ((end - vma-&gt;vm_pgoff) &lt;&lt; PAGE_SHIFT)</div><div class='del'>-							+ vma-&gt;vm_start;</div><div class='del'>-			if (v_end &gt; vma-&gt;vm_end)</div><div class='del'>-				v_end = vma-&gt;vm_end;</div><div class='del'>-		}</div><div class='add'>+		hugetlb_vma_unlock_write(vma);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Called with hugetlb fault mutex held.</div><div class='add'>+ * Returns true if page was actually removed, false otherwise.</div><div class='add'>+ */</div><div class='add'>+static bool remove_inode_single_folio(struct hstate *h, struct inode *inode,</div><div class='add'>+					struct address_space *mapping,</div><div class='add'>+					struct folio *folio, pgoff_t index,</div><div class='add'>+					bool truncate_op)</div><div class='add'>+{</div><div class='add'>+	bool ret = false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If folio is mapped, it was faulted in after being</div><div class='add'>+	 * unmapped in caller or hugetlb_vmdelete_list() skips</div><div class='add'>+	 * unmapping it due to fail to grab lock.  Unmap (again)</div><div class='add'>+	 * while holding the fault mutex.  The mutex will prevent</div><div class='add'>+	 * faults until we finish removing the folio.  Hold folio</div><div class='add'>+	 * lock to guarantee no concurrent migration.</div><div class='add'>+	 */</div><div class='add'>+	folio_lock(folio);</div><div class='add'>+	if (unlikely(folio_mapped(folio)))</div><div class='add'>+		hugetlb_unmap_file_folio(h, mapping, folio, index);</div><div class='ctx'> </div><div class='del'>-		unmap_hugepage_range(vma, vma-&gt;vm_start + v_offset, v_end,</div><div class='del'>-									NULL);</div><div class='add'>+	/*</div><div class='add'>+	 * We must remove the folio from page cache before removing</div><div class='add'>+	 * the region/ reserve map (hugetlb_unreserve_pages).  In</div><div class='add'>+	 * rare out of memory conditions, removal of the region/reserve</div><div class='add'>+	 * map could fail.  Correspondingly, the subpool and global</div><div class='add'>+	 * reserve usage count can need to be adjusted.</div><div class='add'>+	 */</div><div class='add'>+	VM_BUG_ON_FOLIO(folio_test_hugetlb_restore_reserve(folio), folio);</div><div class='add'>+	hugetlb_delete_from_page_cache(folio);</div><div class='add'>+	ret = true;</div><div class='add'>+	if (!truncate_op) {</div><div class='add'>+		if (unlikely(hugetlb_unreserve_pages(inode, index,</div><div class='add'>+							index + 1, 1)))</div><div class='add'>+			hugetlb_fix_reserve_counts(inode);</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -448,10 +561,10 @@ hugetlb_vmdelete_list(struct rb_root_cached *root, pgoff_t start, pgoff_t end)</div><div class='ctx'>  * truncation is indicated by end of range being LLONG_MAX</div><div class='ctx'>  *	In this case, we first scan the range and release found pages.</div><div class='ctx'>  *	After releasing pages, hugetlb_unreserve_pages cleans up region/reserve</div><div class='del'>- *	maps and global counts.  Page faults can not race with truncation</div><div class='del'>- *	in this routine.  hugetlb_no_page() holds i_mmap_rwsem and prevents</div><div class='del'>- *	page faults in the truncated range by checking i_size.  i_size is</div><div class='del'>- *	modified while holding i_mmap_rwsem.</div><div class='add'>+ *	maps and global counts.  Page faults can race with truncation.</div><div class='add'>+ *	During faults, hugetlb_no_page() checks i_size before page allocation,</div><div class='add'>+ *	and again after obtaining page table lock.  It will 'back out'</div><div class='add'>+ *	allocations in the truncated range.</div><div class='ctx'>  * hole punch is indicated if end is not LLONG_MAX</div><div class='ctx'>  *	In the hole punch case we scan the range and release found pages.</div><div class='ctx'>  *	Only when releasing a page is the associated region/reserve map</div><div class='hunk'>@@ -466,94 +579,47 @@ static void remove_inode_hugepages(struct inode *inode, loff_t lstart,</div><div class='ctx'> {</div><div class='ctx'> 	struct hstate *h = hstate_inode(inode);</div><div class='ctx'> 	struct address_space *mapping = &amp;inode-&gt;i_data;</div><div class='del'>-	const pgoff_t start = lstart &gt;&gt; huge_page_shift(h);</div><div class='del'>-	const pgoff_t end = lend &gt;&gt; huge_page_shift(h);</div><div class='del'>-	struct pagevec pvec;</div><div class='add'>+	const pgoff_t end = lend &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	struct folio_batch fbatch;</div><div class='ctx'> 	pgoff_t next, index;</div><div class='ctx'> 	int i, freed = 0;</div><div class='ctx'> 	bool truncate_op = (lend == LLONG_MAX);</div><div class='ctx'> </div><div class='del'>-	pagevec_init(&amp;pvec);</div><div class='del'>-	next = start;</div><div class='del'>-	while (next &lt; end) {</div><div class='del'>-		/*</div><div class='del'>-		 * When no more pages are found, we are done.</div><div class='del'>-		 */</div><div class='del'>-		if (!pagevec_lookup_range(&amp;pvec, mapping, &amp;next, end - 1))</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		for (i = 0; i &lt; pagevec_count(&amp;pvec); ++i) {</div><div class='del'>-			struct page *page = pvec.pages[i];</div><div class='add'>+	folio_batch_init(&amp;fbatch);</div><div class='add'>+	next = lstart &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	while (filemap_get_folios(mapping, &amp;next, end - 1, &amp;fbatch)) {</div><div class='add'>+		for (i = 0; i &lt; folio_batch_count(&amp;fbatch); ++i) {</div><div class='add'>+			struct folio *folio = fbatch.folios[i];</div><div class='ctx'> 			u32 hash = 0;</div><div class='ctx'> </div><div class='del'>-			index = page-&gt;index;</div><div class='del'>-			if (!truncate_op) {</div><div class='del'>-				/*</div><div class='del'>-				 * Only need to hold the fault mutex in the</div><div class='del'>-				 * hole punch case.  This prevents races with</div><div class='del'>-				 * page faults.  Races are not possible in the</div><div class='del'>-				 * case of truncation.</div><div class='del'>-				 */</div><div class='del'>-				hash = hugetlb_fault_mutex_hash(mapping, index);</div><div class='del'>-				mutex_lock(&amp;hugetlb_fault_mutex_table[hash]);</div><div class='del'>-			}</div><div class='add'>+			index = folio-&gt;index &gt;&gt; huge_page_order(h);</div><div class='add'>+			hash = hugetlb_fault_mutex_hash(mapping, index);</div><div class='add'>+			mutex_lock(&amp;hugetlb_fault_mutex_table[hash]);</div><div class='ctx'> </div><div class='ctx'> 			/*</div><div class='del'>-			 * If page is mapped, it was faulted in after being</div><div class='del'>-			 * unmapped in caller.  Unmap (again) now after taking</div><div class='del'>-			 * the fault mutex.  The mutex will prevent faults</div><div class='del'>-			 * until we finish removing the page.</div><div class='del'>-			 *</div><div class='del'>-			 * This race can only happen in the hole punch case.</div><div class='del'>-			 * Getting here in a truncate operation is a bug.</div><div class='add'>+			 * Remove folio that was part of folio_batch.</div><div class='ctx'> 			 */</div><div class='del'>-			if (unlikely(page_mapped(page))) {</div><div class='del'>-				BUG_ON(truncate_op);</div><div class='del'>-</div><div class='del'>-				mutex_unlock(&amp;hugetlb_fault_mutex_table[hash]);</div><div class='del'>-				i_mmap_lock_write(mapping);</div><div class='del'>-				mutex_lock(&amp;hugetlb_fault_mutex_table[hash]);</div><div class='del'>-				hugetlb_vmdelete_list(&amp;mapping-&gt;i_mmap,</div><div class='del'>-					index * pages_per_huge_page(h),</div><div class='del'>-					(index + 1) * pages_per_huge_page(h));</div><div class='del'>-				i_mmap_unlock_write(mapping);</div><div class='del'>-			}</div><div class='add'>+			if (remove_inode_single_folio(h, inode, mapping, folio,</div><div class='add'>+							index, truncate_op))</div><div class='add'>+				freed++;</div><div class='ctx'> </div><div class='del'>-			lock_page(page);</div><div class='del'>-			/*</div><div class='del'>-			 * We must free the huge page and remove from page</div><div class='del'>-			 * cache (remove_huge_page) BEFORE removing the</div><div class='del'>-			 * region/reserve map (hugetlb_unreserve_pages).  In</div><div class='del'>-			 * rare out of memory conditions, removal of the</div><div class='del'>-			 * region/reserve map could fail. Correspondingly,</div><div class='del'>-			 * the subpool and global reserve usage count can need</div><div class='del'>-			 * to be adjusted.</div><div class='del'>-			 */</div><div class='del'>-			VM_BUG_ON(HPageRestoreReserve(page));</div><div class='del'>-			remove_huge_page(page);</div><div class='del'>-			freed++;</div><div class='del'>-			if (!truncate_op) {</div><div class='del'>-				if (unlikely(hugetlb_unreserve_pages(inode,</div><div class='del'>-							index, index + 1, 1)))</div><div class='del'>-					hugetlb_fix_reserve_counts(inode);</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			if (!truncate_op)</div><div class='del'>-				mutex_unlock(&amp;hugetlb_fault_mutex_table[hash]);</div><div class='add'>+			mutex_unlock(&amp;hugetlb_fault_mutex_table[hash]);</div><div class='ctx'> 		}</div><div class='del'>-		huge_pagevec_release(&amp;pvec);</div><div class='add'>+		folio_batch_release(&amp;fbatch);</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (truncate_op)</div><div class='del'>-		(void)hugetlb_unreserve_pages(inode, start, LONG_MAX, freed);</div><div class='add'>+		(void)hugetlb_unreserve_pages(inode,</div><div class='add'>+				lstart &gt;&gt; huge_page_shift(h),</div><div class='add'>+				LONG_MAX, freed);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void hugetlbfs_evict_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct resv_map *resv_map;</div><div class='ctx'> </div><div class='add'>+	trace_hugetlbfs_evict_inode(inode);</div><div class='ctx'> 	remove_inode_hugepages(inode, 0, LLONG_MAX);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -562,7 +628,7 @@ static void hugetlbfs_evict_inode(struct inode *inode)</div><div class='ctx'> 	 * at inode creation time.  If this is a device special inode,</div><div class='ctx'> 	 * i_mapping may not point to the original address space.</div><div class='ctx'> 	 */</div><div class='del'>-	resv_map = (struct resv_map *)(&amp;inode-&gt;i_data)-&gt;private_data;</div><div class='add'>+	resv_map = (struct resv_map *)(&amp;inode-&gt;i_data)-&gt;i_private_data;</div><div class='ctx'> 	/* Only regular and link inodes have associated reserve maps */</div><div class='ctx'> 	if (resv_map)</div><div class='ctx'> 		resv_map_release(&amp;resv_map-&gt;refs);</div><div class='hunk'>@@ -578,49 +644,88 @@ static void hugetlb_vmtruncate(struct inode *inode, loff_t offset)</div><div class='ctx'> 	BUG_ON(offset &amp; ~huge_page_mask(h));</div><div class='ctx'> 	pgoff = offset &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> </div><div class='del'>-	i_mmap_lock_write(mapping);</div><div class='ctx'> 	i_size_write(inode, offset);</div><div class='add'>+	i_mmap_lock_write(mapping);</div><div class='ctx'> 	if (!RB_EMPTY_ROOT(&amp;mapping-&gt;i_mmap.rb_root))</div><div class='del'>-		hugetlb_vmdelete_list(&amp;mapping-&gt;i_mmap, pgoff, 0);</div><div class='add'>+		hugetlb_vmdelete_list(&amp;mapping-&gt;i_mmap, pgoff, 0,</div><div class='add'>+				      ZAP_FLAG_DROP_MARKER);</div><div class='ctx'> 	i_mmap_unlock_write(mapping);</div><div class='ctx'> 	remove_inode_hugepages(inode, offset, LLONG_MAX);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void hugetlbfs_zero_partial_page(struct hstate *h,</div><div class='add'>+					struct address_space *mapping,</div><div class='add'>+					loff_t start,</div><div class='add'>+					loff_t end)</div><div class='add'>+{</div><div class='add'>+	pgoff_t idx = start &gt;&gt; huge_page_shift(h);</div><div class='add'>+	struct folio *folio;</div><div class='add'>+</div><div class='add'>+	folio = filemap_lock_hugetlb_folio(h, mapping, idx);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	start = start &amp; ~huge_page_mask(h);</div><div class='add'>+	end = end &amp; ~huge_page_mask(h);</div><div class='add'>+	if (!end)</div><div class='add'>+		end = huge_page_size(h);</div><div class='add'>+</div><div class='add'>+	folio_zero_segment(folio, (size_t)start, (size_t)end);</div><div class='add'>+</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static long hugetlbfs_punch_hole(struct inode *inode, loff_t offset, loff_t len)</div><div class='ctx'> {</div><div class='add'>+	struct hugetlbfs_inode_info *info = HUGETLBFS_I(inode);</div><div class='add'>+	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='ctx'> 	struct hstate *h = hstate_inode(inode);</div><div class='ctx'> 	loff_t hpage_size = huge_page_size(h);</div><div class='ctx'> 	loff_t hole_start, hole_end;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * For hole punch round up the beginning offset of the hole and</div><div class='del'>-	 * round down the end.</div><div class='add'>+	 * hole_start and hole_end indicate the full pages within the hole.</div><div class='ctx'> 	 */</div><div class='ctx'> 	hole_start = round_up(offset, hpage_size);</div><div class='ctx'> 	hole_end = round_down(offset + len, hpage_size);</div><div class='ctx'> </div><div class='del'>-	if (hole_end &gt; hole_start) {</div><div class='del'>-		struct address_space *mapping = inode-&gt;i_mapping;</div><div class='del'>-		struct hugetlbfs_inode_info *info = HUGETLBFS_I(inode);</div><div class='add'>+	inode_lock(inode);</div><div class='ctx'> </div><div class='del'>-		inode_lock(inode);</div><div class='add'>+	/* protected by i_rwsem */</div><div class='add'>+	if (info-&gt;seals &amp; (F_SEAL_WRITE | F_SEAL_FUTURE_WRITE)) {</div><div class='add'>+		inode_unlock(inode);</div><div class='add'>+		return -EPERM;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		/* protected by i_rwsem */</div><div class='del'>-		if (info-&gt;seals &amp; (F_SEAL_WRITE | F_SEAL_FUTURE_WRITE)) {</div><div class='del'>-			inode_unlock(inode);</div><div class='del'>-			return -EPERM;</div><div class='del'>-		}</div><div class='add'>+	i_mmap_lock_write(mapping);</div><div class='ctx'> </div><div class='del'>-		i_mmap_lock_write(mapping);</div><div class='add'>+	/* If range starts before first full page, zero partial page. */</div><div class='add'>+	if (offset &lt; hole_start)</div><div class='add'>+		hugetlbfs_zero_partial_page(h, mapping,</div><div class='add'>+				offset, min(offset + len, hole_start));</div><div class='add'>+</div><div class='add'>+	/* Unmap users of full pages in the hole. */</div><div class='add'>+	if (hole_end &gt; hole_start) {</div><div class='ctx'> 		if (!RB_EMPTY_ROOT(&amp;mapping-&gt;i_mmap.rb_root))</div><div class='ctx'> 			hugetlb_vmdelete_list(&amp;mapping-&gt;i_mmap,</div><div class='del'>-						hole_start &gt;&gt; PAGE_SHIFT,</div><div class='del'>-						hole_end  &gt;&gt; PAGE_SHIFT);</div><div class='del'>-		i_mmap_unlock_write(mapping);</div><div class='del'>-		remove_inode_hugepages(inode, hole_start, hole_end);</div><div class='del'>-		inode_unlock(inode);</div><div class='add'>+					      hole_start &gt;&gt; PAGE_SHIFT,</div><div class='add'>+					      hole_end &gt;&gt; PAGE_SHIFT, 0);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/* If range extends beyond last full page, zero partial page. */</div><div class='add'>+	if ((offset + len) &gt; hole_end &amp;&amp; (offset + len) &gt; hole_start)</div><div class='add'>+		hugetlbfs_zero_partial_page(h, mapping,</div><div class='add'>+				hole_end, offset + len);</div><div class='add'>+</div><div class='add'>+	i_mmap_unlock_write(mapping);</div><div class='add'>+</div><div class='add'>+	/* Remove full pages from the file. */</div><div class='add'>+	if (hole_end &gt; hole_start)</div><div class='add'>+		remove_inode_hugepages(inode, hole_start, hole_end);</div><div class='add'>+</div><div class='add'>+	inode_unlock(inode);</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -642,8 +747,10 @@ static long hugetlbfs_fallocate(struct file *file, int mode, loff_t offset,</div><div class='ctx'> 	if (mode &amp; ~(FALLOC_FL_KEEP_SIZE | FALLOC_FL_PUNCH_HOLE))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='del'>-	if (mode &amp; FALLOC_FL_PUNCH_HOLE)</div><div class='del'>-		return hugetlbfs_punch_hole(inode, offset, len);</div><div class='add'>+	if (mode &amp; FALLOC_FL_PUNCH_HOLE) {</div><div class='add'>+		error = hugetlbfs_punch_hole(inode, offset, len);</div><div class='add'>+		goto out_nolock;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Default preallocate case.</div><div class='hunk'>@@ -667,11 +774,10 @@ static long hugetlbfs_fallocate(struct file *file, int mode, loff_t offset,</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Initialize a pseudo vma as this is required by the huge page</div><div class='del'>-	 * allocation routines.  If NUMA is configured, use page index</div><div class='del'>-	 * as input to create an allocation policy.</div><div class='add'>+	 * allocation routines.</div><div class='ctx'> 	 */</div><div class='ctx'> 	vma_init(&amp;pseudo_vma, mm);</div><div class='del'>-	pseudo_vma.vm_flags = (VM_HUGETLB | VM_MAYSHARE | VM_SHARED);</div><div class='add'>+	vm_flags_init(&amp;pseudo_vma, VM_HUGETLB | VM_MAYSHARE | VM_SHARED);</div><div class='ctx'> 	pseudo_vma.vm_file = file;</div><div class='ctx'> </div><div class='ctx'> 	for (index = start; index &lt; end; index++) {</div><div class='hunk'>@@ -679,7 +785,7 @@ static long hugetlbfs_fallocate(struct file *file, int mode, loff_t offset,</div><div class='ctx'> 		 * This is supposed to be the vaddr where the page is being</div><div class='ctx'> 		 * faulted in, but we have no vaddr here.</div><div class='ctx'> 		 */</div><div class='del'>-		struct page *page;</div><div class='add'>+		struct folio *folio;</div><div class='ctx'> 		unsigned long addr;</div><div class='ctx'> </div><div class='ctx'> 		cond_resched();</div><div class='hunk'>@@ -693,74 +799,68 @@ static long hugetlbfs_fallocate(struct file *file, int mode, loff_t offset,</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		/* Set numa allocation policy based on index */</div><div class='del'>-		hugetlb_set_vma_policy(&amp;pseudo_vma, inode, index);</div><div class='del'>-</div><div class='ctx'> 		/* addr is the offset within the file (zero based) */</div><div class='ctx'> 		addr = index * hpage_size;</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * fault mutex taken here, protects against fault path</div><div class='del'>-		 * and hole punch.  inode_lock previously taken protects</div><div class='del'>-		 * against truncation.</div><div class='del'>-		 */</div><div class='add'>+		/* mutex taken here, fault path and hole punch */</div><div class='ctx'> 		hash = hugetlb_fault_mutex_hash(mapping, index);</div><div class='ctx'> 		mutex_lock(&amp;hugetlb_fault_mutex_table[hash]);</div><div class='ctx'> </div><div class='ctx'> 		/* See if already present in mapping to avoid alloc/free */</div><div class='del'>-		page = find_get_page(mapping, index);</div><div class='del'>-		if (page) {</div><div class='del'>-			put_page(page);</div><div class='add'>+		folio = filemap_get_folio(mapping, index &lt;&lt; huge_page_order(h));</div><div class='add'>+		if (!IS_ERR(folio)) {</div><div class='add'>+			folio_put(folio);</div><div class='ctx'> 			mutex_unlock(&amp;hugetlb_fault_mutex_table[hash]);</div><div class='del'>-			hugetlb_drop_vma_policy(&amp;pseudo_vma);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * Allocate page without setting the avoid_reserve argument.</div><div class='add'>+		 * Allocate folio without setting the avoid_reserve argument.</div><div class='ctx'> 		 * There certainly are no reserves associated with the</div><div class='ctx'> 		 * pseudo_vma.  However, there could be shared mappings with</div><div class='ctx'> 		 * reserves for the file at the inode level.  If we fallocate</div><div class='del'>-		 * pages in these areas, we need to consume the reserves</div><div class='add'>+		 * folios in these areas, we need to consume the reserves</div><div class='ctx'> 		 * to keep reservation accounting consistent.</div><div class='ctx'> 		 */</div><div class='del'>-		page = alloc_huge_page(&amp;pseudo_vma, addr, 0);</div><div class='del'>-		hugetlb_drop_vma_policy(&amp;pseudo_vma);</div><div class='del'>-		if (IS_ERR(page)) {</div><div class='add'>+		folio = alloc_hugetlb_folio(&amp;pseudo_vma, addr, false);</div><div class='add'>+		if (IS_ERR(folio)) {</div><div class='ctx'> 			mutex_unlock(&amp;hugetlb_fault_mutex_table[hash]);</div><div class='del'>-			error = PTR_ERR(page);</div><div class='add'>+			error = PTR_ERR(folio);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='del'>-		clear_huge_page(page, addr, pages_per_huge_page(h));</div><div class='del'>-		__SetPageUptodate(page);</div><div class='del'>-		error = huge_add_to_page_cache(page, mapping, index);</div><div class='add'>+		folio_zero_user(folio, addr);</div><div class='add'>+		__folio_mark_uptodate(folio);</div><div class='add'>+		error = hugetlb_add_to_page_cache(folio, mapping, index);</div><div class='ctx'> 		if (unlikely(error)) {</div><div class='del'>-			restore_reserve_on_error(h, &amp;pseudo_vma, addr, page);</div><div class='del'>-			put_page(page);</div><div class='add'>+			restore_reserve_on_error(h, &amp;pseudo_vma, addr, folio);</div><div class='add'>+			folio_put(folio);</div><div class='ctx'> 			mutex_unlock(&amp;hugetlb_fault_mutex_table[hash]);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		mutex_unlock(&amp;hugetlb_fault_mutex_table[hash]);</div><div class='ctx'> </div><div class='del'>-		SetHPageMigratable(page);</div><div class='add'>+		folio_set_hugetlb_migratable(folio);</div><div class='ctx'> 		/*</div><div class='del'>-		 * unlock_page because locked by add_to_page_cache()</div><div class='del'>-		 * put_page() due to reference from alloc_huge_page()</div><div class='add'>+		 * folio_unlock because locked by hugetlb_add_to_page_cache()</div><div class='add'>+		 * folio_put() due to reference from alloc_hugetlb_folio()</div><div class='ctx'> 		 */</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		put_page(page);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (!(mode &amp; FALLOC_FL_KEEP_SIZE) &amp;&amp; offset + len &gt; inode-&gt;i_size)</div><div class='ctx'> 		i_size_write(inode, offset + len);</div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> out:</div><div class='ctx'> 	inode_unlock(inode);</div><div class='add'>+</div><div class='add'>+out_nolock:</div><div class='add'>+	trace_hugetlbfs_fallocate(inode, mode, offset, len, error);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hugetlbfs_setattr(struct user_namespace *mnt_userns,</div><div class='add'>+static int hugetlbfs_setattr(struct mnt_idmap *idmap,</div><div class='ctx'> 			     struct dentry *dentry, struct iattr *attr)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='hunk'>@@ -769,10 +869,12 @@ static int hugetlbfs_setattr(struct user_namespace *mnt_userns,</div><div class='ctx'> 	unsigned int ia_valid = attr-&gt;ia_valid;</div><div class='ctx'> 	struct hugetlbfs_inode_info *info = HUGETLBFS_I(inode);</div><div class='ctx'> </div><div class='del'>-	error = setattr_prepare(&amp;init_user_ns, dentry, attr);</div><div class='add'>+	error = setattr_prepare(idmap, dentry, attr);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='add'>+	trace_hugetlbfs_setattr(inode, dentry, attr);</div><div class='add'>+</div><div class='ctx'> 	if (ia_valid &amp; ATTR_SIZE) {</div><div class='ctx'> 		loff_t oldsize = inode-&gt;i_size;</div><div class='ctx'> 		loff_t newsize = attr-&gt;ia_size;</div><div class='hunk'>@@ -786,7 +888,7 @@ static int hugetlbfs_setattr(struct user_namespace *mnt_userns,</div><div class='ctx'> 		hugetlb_vmtruncate(inode, newsize);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	setattr_copy(&amp;init_user_ns, inode, attr);</div><div class='add'>+	setattr_copy(idmap, inode, attr);</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -802,7 +904,7 @@ static struct inode *hugetlbfs_get_root(struct super_block *sb,</div><div class='ctx'> 		inode-&gt;i_mode = S_IFDIR | ctx-&gt;mode;</div><div class='ctx'> 		inode-&gt;i_uid = ctx-&gt;uid;</div><div class='ctx'> 		inode-&gt;i_gid = ctx-&gt;gid;</div><div class='del'>-		inode-&gt;i_atime = inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+		simple_inode_init_ts(inode);</div><div class='ctx'> 		inode-&gt;i_op = &amp;hugetlbfs_dir_inode_operations;</div><div class='ctx'> 		inode-&gt;i_fop = &amp;simple_dir_operations;</div><div class='ctx'> 		/* directory inodes start off with i_nlink == 2 (for "." entry) */</div><div class='hunk'>@@ -821,6 +923,7 @@ static struct inode *hugetlbfs_get_root(struct super_block *sb,</div><div class='ctx'> static struct lock_class_key hugetlbfs_i_mmap_rwsem_key;</div><div class='ctx'> </div><div class='ctx'> static struct inode *hugetlbfs_get_inode(struct super_block *sb,</div><div class='add'>+					struct mnt_idmap *idmap,</div><div class='ctx'> 					struct inode *dir,</div><div class='ctx'> 					umode_t mode, dev_t dev)</div><div class='ctx'> {</div><div class='hunk'>@@ -842,12 +945,12 @@ static struct inode *hugetlbfs_get_inode(struct super_block *sb,</div><div class='ctx'> 		struct hugetlbfs_inode_info *info = HUGETLBFS_I(inode);</div><div class='ctx'> </div><div class='ctx'> 		inode-&gt;i_ino = get_next_ino();</div><div class='del'>-		inode_init_owner(&amp;init_user_ns, inode, dir, mode);</div><div class='add'>+		inode_init_owner(idmap, inode, dir, mode);</div><div class='ctx'> 		lockdep_set_class(&amp;inode-&gt;i_mapping-&gt;i_mmap_rwsem,</div><div class='ctx'> 				&amp;hugetlbfs_i_mmap_rwsem_key);</div><div class='ctx'> 		inode-&gt;i_mapping-&gt;a_ops = &amp;hugetlbfs_aops;</div><div class='del'>-		inode-&gt;i_atime = inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='del'>-		inode-&gt;i_mapping-&gt;private_data = resv_map;</div><div class='add'>+		simple_inode_init_ts(inode);</div><div class='add'>+		inode-&gt;i_mapping-&gt;i_private_data = resv_map;</div><div class='ctx'> 		info-&gt;seals = F_SEAL_SEAL;</div><div class='ctx'> 		switch (mode &amp; S_IFMT) {</div><div class='ctx'> 		default:</div><div class='hunk'>@@ -870,6 +973,7 @@ static struct inode *hugetlbfs_get_inode(struct super_block *sb,</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 		lockdep_annotate_inode_mutex_key(inode);</div><div class='add'>+		trace_hugetlbfs_alloc_inode(inode, dir, mode);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		if (resv_map)</div><div class='ctx'> 			kref_put(&amp;resv_map-&gt;refs, resv_map_release);</div><div class='hunk'>@@ -881,114 +985,100 @@ static struct inode *hugetlbfs_get_inode(struct super_block *sb,</div><div class='ctx'> /*</div><div class='ctx'>  * File creation. Allocate an inode, and we're done..</div><div class='ctx'>  */</div><div class='del'>-static int do_hugetlbfs_mknod(struct inode *dir,</div><div class='del'>-			struct dentry *dentry,</div><div class='del'>-			umode_t mode,</div><div class='del'>-			dev_t dev,</div><div class='del'>-			bool tmpfile)</div><div class='add'>+static int hugetlbfs_mknod(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+			   struct dentry *dentry, umode_t mode, dev_t dev)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='del'>-	int error = -ENOSPC;</div><div class='ctx'> </div><div class='del'>-	inode = hugetlbfs_get_inode(dir-&gt;i_sb, dir, mode, dev);</div><div class='del'>-	if (inode) {</div><div class='del'>-		dir-&gt;i_ctime = dir-&gt;i_mtime = current_time(dir);</div><div class='del'>-		if (tmpfile) {</div><div class='del'>-			d_tmpfile(dentry, inode);</div><div class='del'>-		} else {</div><div class='del'>-			d_instantiate(dentry, inode);</div><div class='del'>-			dget(dentry);/* Extra count - pin the dentry in core */</div><div class='del'>-		}</div><div class='del'>-		error = 0;</div><div class='del'>-	}</div><div class='del'>-	return error;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int hugetlbfs_mknod(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-			   struct dentry *dentry, umode_t mode, dev_t dev)</div><div class='del'>-{</div><div class='del'>-	return do_hugetlbfs_mknod(dir, dentry, mode, dev, false);</div><div class='add'>+	inode = hugetlbfs_get_inode(dir-&gt;i_sb, idmap, dir, mode, dev);</div><div class='add'>+	if (!inode)</div><div class='add'>+		return -ENOSPC;</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='add'>+	d_make_persistent(dentry, inode);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hugetlbfs_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-			   struct dentry *dentry, umode_t mode)</div><div class='add'>+static struct dentry *hugetlbfs_mkdir(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+				      struct dentry *dentry, umode_t mode)</div><div class='ctx'> {</div><div class='del'>-	int retval = hugetlbfs_mknod(&amp;init_user_ns, dir, dentry,</div><div class='add'>+	int retval = hugetlbfs_mknod(idmap, dir, dentry,</div><div class='ctx'> 				     mode | S_IFDIR, 0);</div><div class='ctx'> 	if (!retval)</div><div class='ctx'> 		inc_nlink(dir);</div><div class='del'>-	return retval;</div><div class='add'>+	return ERR_PTR(retval);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hugetlbfs_create(struct user_namespace *mnt_userns,</div><div class='add'>+static int hugetlbfs_create(struct mnt_idmap *idmap,</div><div class='ctx'> 			    struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 			    umode_t mode, bool excl)</div><div class='ctx'> {</div><div class='del'>-	return hugetlbfs_mknod(&amp;init_user_ns, dir, dentry, mode | S_IFREG, 0);</div><div class='add'>+	return hugetlbfs_mknod(idmap, dir, dentry, mode | S_IFREG, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hugetlbfs_tmpfile(struct user_namespace *mnt_userns,</div><div class='del'>-			     struct inode *dir, struct dentry *dentry,</div><div class='add'>+static int hugetlbfs_tmpfile(struct mnt_idmap *idmap,</div><div class='add'>+			     struct inode *dir, struct file *file,</div><div class='ctx'> 			     umode_t mode)</div><div class='ctx'> {</div><div class='del'>-	return do_hugetlbfs_mknod(dir, dentry, mode | S_IFREG, 0, true);</div><div class='add'>+	struct inode *inode;</div><div class='add'>+</div><div class='add'>+	inode = hugetlbfs_get_inode(dir-&gt;i_sb, idmap, dir, mode | S_IFREG, 0);</div><div class='add'>+	if (!inode)</div><div class='add'>+		return -ENOSPC;</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='add'>+	d_tmpfile(file, inode);</div><div class='add'>+	return finish_open_simple(file, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hugetlbfs_symlink(struct user_namespace *mnt_userns,</div><div class='add'>+static int hugetlbfs_symlink(struct mnt_idmap *idmap,</div><div class='ctx'> 			     struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 			     const char *symname)</div><div class='ctx'> {</div><div class='add'>+	const umode_t mode = S_IFLNK|S_IRWXUGO;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	int error = -ENOSPC;</div><div class='ctx'> </div><div class='del'>-	inode = hugetlbfs_get_inode(dir-&gt;i_sb, dir, S_IFLNK|S_IRWXUGO, 0);</div><div class='add'>+	inode = hugetlbfs_get_inode(dir-&gt;i_sb, idmap, dir, mode, 0);</div><div class='ctx'> 	if (inode) {</div><div class='ctx'> 		int l = strlen(symname)+1;</div><div class='ctx'> 		error = page_symlink(inode, symname, l);</div><div class='del'>-		if (!error) {</div><div class='del'>-			d_instantiate(dentry, inode);</div><div class='del'>-			dget(dentry);</div><div class='del'>-		} else</div><div class='add'>+		if (!error)</div><div class='add'>+			d_make_persistent(dentry, inode);</div><div class='add'>+		else</div><div class='ctx'> 			iput(inode);</div><div class='ctx'> 	}</div><div class='del'>-	dir-&gt;i_ctime = dir-&gt;i_mtime = current_time(dir);</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='ctx'> </div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int hugetlbfs_migrate_page(struct address_space *mapping,</div><div class='del'>-				struct page *newpage, struct page *page,</div><div class='add'>+#ifdef CONFIG_MIGRATION</div><div class='add'>+static int hugetlbfs_migrate_folio(struct address_space *mapping,</div><div class='add'>+				struct folio *dst, struct folio *src,</div><div class='ctx'> 				enum migrate_mode mode)</div><div class='ctx'> {</div><div class='ctx'> 	int rc;</div><div class='ctx'> </div><div class='del'>-	rc = migrate_huge_page_move_mapping(mapping, newpage, page);</div><div class='del'>-	if (rc != MIGRATEPAGE_SUCCESS)</div><div class='add'>+	rc = migrate_huge_page_move_mapping(mapping, dst, src);</div><div class='add'>+	if (rc)</div><div class='ctx'> 		return rc;</div><div class='ctx'> </div><div class='del'>-	if (hugetlb_page_subpool(page)) {</div><div class='del'>-		hugetlb_set_page_subpool(newpage, hugetlb_page_subpool(page));</div><div class='del'>-		hugetlb_set_page_subpool(page, NULL);</div><div class='add'>+	if (hugetlb_folio_subpool(src)) {</div><div class='add'>+		hugetlb_set_folio_subpool(dst,</div><div class='add'>+					hugetlb_folio_subpool(src));</div><div class='add'>+		hugetlb_set_folio_subpool(src, NULL);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (mode != MIGRATE_SYNC_NO_COPY)</div><div class='del'>-		migrate_page_copy(newpage, page);</div><div class='del'>-	else</div><div class='del'>-		migrate_page_states(newpage, page);</div><div class='add'>+	folio_migrate_flags(dst, src);</div><div class='ctx'> </div><div class='del'>-	return MIGRATEPAGE_SUCCESS;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='add'>+#else</div><div class='add'>+#define hugetlbfs_migrate_folio NULL</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='del'>-static int hugetlbfs_error_remove_page(struct address_space *mapping,</div><div class='del'>-				struct page *page)</div><div class='add'>+static int hugetlbfs_error_remove_folio(struct address_space *mapping,</div><div class='add'>+				struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = mapping-&gt;host;</div><div class='del'>-	pgoff_t index = page-&gt;index;</div><div class='del'>-</div><div class='del'>-	remove_huge_page(page);</div><div class='del'>-	if (unlikely(hugetlb_unreserve_pages(inode, index, index + 1, 1)))</div><div class='del'>-		hugetlb_fix_reserve_counts(inode);</div><div class='del'>-</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1036,22 +1126,24 @@ static int hugetlbfs_statfs(struct dentry *dentry, struct kstatfs *buf)</div><div class='ctx'> {</div><div class='ctx'> 	struct hugetlbfs_sb_info *sbinfo = HUGETLBFS_SB(dentry-&gt;d_sb);</div><div class='ctx'> 	struct hstate *h = hstate_inode(d_inode(dentry));</div><div class='add'>+	u64 id = huge_encode_dev(dentry-&gt;d_sb-&gt;s_dev);</div><div class='ctx'> </div><div class='add'>+	buf-&gt;f_fsid = u64_to_fsid(id);</div><div class='ctx'> 	buf-&gt;f_type = HUGETLBFS_MAGIC;</div><div class='ctx'> 	buf-&gt;f_bsize = huge_page_size(h);</div><div class='ctx'> 	if (sbinfo) {</div><div class='ctx'> 		spin_lock(&amp;sbinfo-&gt;stat_lock);</div><div class='del'>-		/* If no limits set, just report 0 for max/free/used</div><div class='add'>+		/* If no limits set, just report 0 or -1 for max/free/used</div><div class='ctx'> 		 * blocks, like simple_statfs() */</div><div class='ctx'> 		if (sbinfo-&gt;spool) {</div><div class='ctx'> 			long free_pages;</div><div class='ctx'> </div><div class='del'>-			spin_lock(&amp;sbinfo-&gt;spool-&gt;lock);</div><div class='add'>+			spin_lock_irq(&amp;sbinfo-&gt;spool-&gt;lock);</div><div class='ctx'> 			buf-&gt;f_blocks = sbinfo-&gt;spool-&gt;max_hpages;</div><div class='ctx'> 			free_pages = sbinfo-&gt;spool-&gt;max_hpages</div><div class='ctx'> 				- sbinfo-&gt;spool-&gt;used_hpages;</div><div class='ctx'> 			buf-&gt;f_bavail = buf-&gt;f_bfree = free_pages;</div><div class='del'>-			spin_unlock(&amp;sbinfo-&gt;spool-&gt;lock);</div><div class='add'>+			spin_unlock_irq(&amp;sbinfo-&gt;spool-&gt;lock);</div><div class='ctx'> 			buf-&gt;f_files = sbinfo-&gt;max_inodes;</div><div class='ctx'> 			buf-&gt;f_ffree = sbinfo-&gt;free_inodes;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1109,60 +1201,49 @@ static struct inode *hugetlbfs_alloc_inode(struct super_block *sb)</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(!hugetlbfs_dec_free_inodes(sbinfo)))</div><div class='ctx'> 		return NULL;</div><div class='del'>-	p = kmem_cache_alloc(hugetlbfs_inode_cachep, GFP_KERNEL);</div><div class='add'>+	p = alloc_inode_sb(sb, hugetlbfs_inode_cachep, GFP_KERNEL);</div><div class='ctx'> 	if (unlikely(!p)) {</div><div class='ctx'> 		hugetlbfs_inc_free_inodes(sbinfo);</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Any time after allocation, hugetlbfs_destroy_inode can be called</div><div class='del'>-	 * for the inode.  mpol_free_shared_policy is unconditionally called</div><div class='del'>-	 * as part of hugetlbfs_destroy_inode.  So, initialize policy here</div><div class='del'>-	 * in case of a quick call to destroy.</div><div class='del'>-	 *</div><div class='del'>-	 * Note that the policy is initialized even if we are creating a</div><div class='del'>-	 * private inode.  This simplifies hugetlbfs_destroy_inode.</div><div class='del'>-	 */</div><div class='del'>-	mpol_shared_policy_init(&amp;p-&gt;policy, NULL);</div><div class='del'>-</div><div class='ctx'> 	return &amp;p-&gt;vfs_inode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void hugetlbfs_free_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='add'>+	trace_hugetlbfs_free_inode(inode);</div><div class='ctx'> 	kmem_cache_free(hugetlbfs_inode_cachep, HUGETLBFS_I(inode));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void hugetlbfs_destroy_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	hugetlbfs_inc_free_inodes(HUGETLBFS_SB(inode-&gt;i_sb));</div><div class='del'>-	mpol_free_shared_policy(&amp;HUGETLBFS_I(inode)-&gt;policy);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct address_space_operations hugetlbfs_aops = {</div><div class='ctx'> 	.write_begin	= hugetlbfs_write_begin,</div><div class='ctx'> 	.write_end	= hugetlbfs_write_end,</div><div class='del'>-	.set_page_dirty	=  __set_page_dirty_no_writeback,</div><div class='del'>-	.migratepage    = hugetlbfs_migrate_page,</div><div class='del'>-	.error_remove_page	= hugetlbfs_error_remove_page,</div><div class='add'>+	.dirty_folio	= noop_dirty_folio,</div><div class='add'>+	.migrate_folio  = hugetlbfs_migrate_folio,</div><div class='add'>+	.error_remove_folio	= hugetlbfs_error_remove_folio,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> static void init_once(void *foo)</div><div class='ctx'> {</div><div class='del'>-	struct hugetlbfs_inode_info *ei = (struct hugetlbfs_inode_info *)foo;</div><div class='add'>+	struct hugetlbfs_inode_info *ei = foo;</div><div class='ctx'> </div><div class='ctx'> 	inode_init_once(&amp;ei-&gt;vfs_inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-const struct file_operations hugetlbfs_file_operations = {</div><div class='add'>+static const struct file_operations hugetlbfs_file_operations = {</div><div class='ctx'> 	.read_iter		= hugetlbfs_read_iter,</div><div class='del'>-	.mmap			= hugetlbfs_file_mmap,</div><div class='add'>+	.mmap_prepare		= hugetlbfs_file_mmap_prepare,</div><div class='ctx'> 	.fsync			= noop_fsync,</div><div class='ctx'> 	.get_unmapped_area	= hugetlb_get_unmapped_area,</div><div class='ctx'> 	.llseek			= default_llseek,</div><div class='ctx'> 	.fallocate		= hugetlbfs_fallocate,</div><div class='add'>+	.fop_flags		= FOP_HUGE_PAGES,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct inode_operations hugetlbfs_dir_inode_operations = {</div><div class='hunk'>@@ -1222,6 +1303,7 @@ static int hugetlbfs_parse_param(struct fs_context *fc, struct fs_parameter *par</div><div class='ctx'> {</div><div class='ctx'> 	struct hugetlbfs_fs_context *ctx = fc-&gt;fs_private;</div><div class='ctx'> 	struct fs_parse_result result;</div><div class='add'>+	struct hstate *h;</div><div class='ctx'> 	char *rest;</div><div class='ctx'> 	unsigned long ps;</div><div class='ctx'> 	int opt;</div><div class='hunk'>@@ -1232,15 +1314,11 @@ static int hugetlbfs_parse_param(struct fs_context *fc, struct fs_parameter *par</div><div class='ctx'> </div><div class='ctx'> 	switch (opt) {</div><div class='ctx'> 	case Opt_uid:</div><div class='del'>-		ctx-&gt;uid = make_kuid(current_user_ns(), result.uint_32);</div><div class='del'>-		if (!uid_valid(ctx-&gt;uid))</div><div class='del'>-			goto bad_val;</div><div class='add'>+		ctx-&gt;uid = result.uid;</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	case Opt_gid:</div><div class='del'>-		ctx-&gt;gid = make_kgid(current_user_ns(), result.uint_32);</div><div class='del'>-		if (!gid_valid(ctx-&gt;gid))</div><div class='del'>-			goto bad_val;</div><div class='add'>+		ctx-&gt;gid = result.gid;</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	case Opt_mode:</div><div class='hunk'>@@ -1249,7 +1327,7 @@ static int hugetlbfs_parse_param(struct fs_context *fc, struct fs_parameter *par</div><div class='ctx'> </div><div class='ctx'> 	case Opt_size:</div><div class='ctx'> 		/* memparse() will accept a K/M/G without a digit */</div><div class='del'>-		if (!isdigit(param-&gt;string[0]))</div><div class='add'>+		if (!param-&gt;string || !isdigit(param-&gt;string[0]))</div><div class='ctx'> 			goto bad_val;</div><div class='ctx'> 		ctx-&gt;max_size_opt = memparse(param-&gt;string, &amp;rest);</div><div class='ctx'> 		ctx-&gt;max_val_type = SIZE_STD;</div><div class='hunk'>@@ -1259,23 +1337,24 @@ static int hugetlbfs_parse_param(struct fs_context *fc, struct fs_parameter *par</div><div class='ctx'> </div><div class='ctx'> 	case Opt_nr_inodes:</div><div class='ctx'> 		/* memparse() will accept a K/M/G without a digit */</div><div class='del'>-		if (!isdigit(param-&gt;string[0]))</div><div class='add'>+		if (!param-&gt;string || !isdigit(param-&gt;string[0]))</div><div class='ctx'> 			goto bad_val;</div><div class='ctx'> 		ctx-&gt;nr_inodes = memparse(param-&gt;string, &amp;rest);</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	case Opt_pagesize:</div><div class='ctx'> 		ps = memparse(param-&gt;string, &amp;rest);</div><div class='del'>-		ctx-&gt;hstate = size_to_hstate(ps);</div><div class='del'>-		if (!ctx-&gt;hstate) {</div><div class='del'>-			pr_err("Unsupported page size %lu MB\n", ps &gt;&gt; 20);</div><div class='add'>+		h = size_to_hstate(ps);</div><div class='add'>+		if (!h) {</div><div class='add'>+			pr_err("Unsupported page size %lu MB\n", ps / SZ_1M);</div><div class='ctx'> 			return -EINVAL;</div><div class='ctx'> 		}</div><div class='add'>+		ctx-&gt;hstate = h;</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	case Opt_min_size:</div><div class='ctx'> 		/* memparse() will accept a K/M/G without a digit */</div><div class='del'>-		if (!isdigit(param-&gt;string[0]))</div><div class='add'>+		if (!param-&gt;string || !isdigit(param-&gt;string[0]))</div><div class='ctx'> 			goto bad_val;</div><div class='ctx'> 		ctx-&gt;min_size_opt = memparse(param-&gt;string, &amp;rest);</div><div class='ctx'> 		ctx-&gt;min_val_type = SIZE_STD;</div><div class='hunk'>@@ -1344,7 +1423,7 @@ hugetlbfs_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Allocate and initialize subpool if maximum or minimum size is</div><div class='ctx'> 	 * specified.  Any needed reservations (for minimum size) are taken</div><div class='del'>-	 * taken when the subpool is created.</div><div class='add'>+	 * when the subpool is created.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (ctx-&gt;max_hpages != -1 || ctx-&gt;min_hpages != -1) {</div><div class='ctx'> 		sbinfo-&gt;spool = hugepage_new_subpool(ctx-&gt;hstate,</div><div class='hunk'>@@ -1358,6 +1437,7 @@ hugetlbfs_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> 	sb-&gt;s_blocksize_bits = huge_page_shift(ctx-&gt;hstate);</div><div class='ctx'> 	sb-&gt;s_magic = HUGETLBFS_MAGIC;</div><div class='ctx'> 	sb-&gt;s_op = &amp;hugetlbfs_ops;</div><div class='add'>+	sb-&gt;s_d_flags = DCACHE_DONTCACHE;</div><div class='ctx'> 	sb-&gt;s_time_gran = 1;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1420,7 +1500,8 @@ static struct file_system_type hugetlbfs_fs_type = {</div><div class='ctx'> 	.name			= "hugetlbfs",</div><div class='ctx'> 	.init_fs_context	= hugetlbfs_init_fs_context,</div><div class='ctx'> 	.parameters		= hugetlb_fs_parameters,</div><div class='del'>-	.kill_sb		= kill_litter_super,</div><div class='add'>+	.kill_sb		= kill_anon_super,</div><div class='add'>+	.fs_flags               = FS_ALLOW_IDMAP,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static struct vfsmount *hugetlbfs_vfsmount[HUGE_MAX_HSTATE];</div><div class='hunk'>@@ -1474,7 +1555,9 @@ struct file *hugetlb_file_setup(const char *name, size_t size,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	file = ERR_PTR(-ENOSPC);</div><div class='del'>-	inode = hugetlbfs_get_inode(mnt-&gt;mnt_sb, NULL, S_IFREG | S_IRWXUGO, 0);</div><div class='add'>+	/* hugetlbfs_vfsmount[] mounts do not use idmapped mounts.  */</div><div class='add'>+	inode = hugetlbfs_get_inode(mnt-&gt;mnt_sb, &amp;nop_mnt_idmap, NULL,</div><div class='add'>+				    S_IFREG | S_IRWXUGO, 0);</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	if (creat_flags == HUGETLB_SHMFS_INODE)</div><div class='hunk'>@@ -1483,9 +1566,9 @@ struct file *hugetlb_file_setup(const char *name, size_t size,</div><div class='ctx'> 	inode-&gt;i_size = size;</div><div class='ctx'> 	clear_nlink(inode);</div><div class='ctx'> </div><div class='del'>-	if (!hugetlb_reserve_pages(inode, 0,</div><div class='add'>+	if (hugetlb_reserve_pages(inode, 0,</div><div class='ctx'> 			size &gt;&gt; huge_page_shift(hstate_inode(inode)), NULL,</div><div class='del'>-			acctflag))</div><div class='add'>+			acctflag) &lt; 0)</div><div class='ctx'> 		file = ERR_PTR(-ENOMEM);</div><div class='ctx'> 	else</div><div class='ctx'> 		file = alloc_file_pseudo(inode, mnt, name, O_RDWR,</div><div class='hunk'>@@ -1509,12 +1592,12 @@ static struct vfsmount *__init mount_one_hugetlbfs(struct hstate *h)</div><div class='ctx'> 	} else {</div><div class='ctx'> 		struct hugetlbfs_fs_context *ctx = fc-&gt;fs_private;</div><div class='ctx'> 		ctx-&gt;hstate = h;</div><div class='del'>-		mnt = fc_mount(fc);</div><div class='add'>+		mnt = fc_mount_longterm(fc);</div><div class='ctx'> 		put_fs_context(fc);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (IS_ERR(mnt))</div><div class='ctx'> 		pr_err("Cannot mount internal hugetlbfs for page size %luK",</div><div class='del'>-		       huge_page_size(h) &gt;&gt; 10);</div><div class='add'>+		       huge_page_size(h) / SZ_1K);</div><div class='ctx'> 	return mnt;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/init.c b/fs/init.c<br/>index 5c36adaa9b44..e0f5429c0a49 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/init.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/init.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/init.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/init.c</a></div><div class='hunk'>@@ -149,17 +149,16 @@ int __init init_mknod(const char *filename, umode_t mode, unsigned int dev)</div><div class='ctx'> 	else if (!(S_ISBLK(mode) || S_ISCHR(mode)))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	dentry = kern_path_create(AT_FDCWD, filename, &amp;path, 0);</div><div class='add'>+	dentry = start_creating_path(AT_FDCWD, filename, &amp;path, 0);</div><div class='ctx'> 	if (IS_ERR(dentry))</div><div class='ctx'> 		return PTR_ERR(dentry);</div><div class='ctx'> </div><div class='del'>-	if (!IS_POSIXACL(path.dentry-&gt;d_inode))</div><div class='del'>-		mode &amp;= ~current_umask();</div><div class='add'>+	mode = mode_strip_umask(d_inode(path.dentry), mode);</div><div class='ctx'> 	error = security_path_mknod(&amp;path, dentry, mode, dev);</div><div class='ctx'> 	if (!error)</div><div class='del'>-		error = vfs_mknod(mnt_user_ns(path.mnt), path.dentry-&gt;d_inode,</div><div class='del'>-				  dentry, mode, new_decode_dev(dev));</div><div class='del'>-	done_path_create(&amp;path, dentry);</div><div class='add'>+		error = vfs_mknod(mnt_idmap(path.mnt), path.dentry-&gt;d_inode,</div><div class='add'>+				  dentry, mode, new_decode_dev(dev), NULL);</div><div class='add'>+	end_creating_path(&amp;path, dentry);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -167,14 +166,14 @@ int __init init_link(const char *oldname, const char *newname)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *new_dentry;</div><div class='ctx'> 	struct path old_path, new_path;</div><div class='del'>-	struct user_namespace *mnt_userns;</div><div class='add'>+	struct mnt_idmap *idmap;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='ctx'> 	error = kern_path(oldname, 0, &amp;old_path);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='del'>-	new_dentry = kern_path_create(AT_FDCWD, newname, &amp;new_path, 0);</div><div class='add'>+	new_dentry = start_creating_path(AT_FDCWD, newname, &amp;new_path, 0);</div><div class='ctx'> 	error = PTR_ERR(new_dentry);</div><div class='ctx'> 	if (IS_ERR(new_dentry))</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -182,17 +181,17 @@ int __init init_link(const char *oldname, const char *newname)</div><div class='ctx'> 	error = -EXDEV;</div><div class='ctx'> 	if (old_path.mnt != new_path.mnt)</div><div class='ctx'> 		goto out_dput;</div><div class='del'>-	mnt_userns = mnt_user_ns(new_path.mnt);</div><div class='del'>-	error = may_linkat(mnt_userns, &amp;old_path);</div><div class='add'>+	idmap = mnt_idmap(new_path.mnt);</div><div class='add'>+	error = may_linkat(idmap, &amp;old_path);</div><div class='ctx'> 	if (unlikely(error))</div><div class='ctx'> 		goto out_dput;</div><div class='ctx'> 	error = security_path_link(old_path.dentry, &amp;new_path, new_dentry);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out_dput;</div><div class='del'>-	error = vfs_link(old_path.dentry, mnt_userns, new_path.dentry-&gt;d_inode,</div><div class='add'>+	error = vfs_link(old_path.dentry, idmap, new_path.dentry-&gt;d_inode,</div><div class='ctx'> 			 new_dentry, NULL);</div><div class='ctx'> out_dput:</div><div class='del'>-	done_path_create(&amp;new_path, new_dentry);</div><div class='add'>+	end_creating_path(&amp;new_path, new_dentry);</div><div class='ctx'> out:</div><div class='ctx'> 	path_put(&amp;old_path);</div><div class='ctx'> 	return error;</div><div class='hunk'>@@ -204,14 +203,14 @@ int __init init_symlink(const char *oldname, const char *newname)</div><div class='ctx'> 	struct path path;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	dentry = kern_path_create(AT_FDCWD, newname, &amp;path, 0);</div><div class='add'>+	dentry = start_creating_path(AT_FDCWD, newname, &amp;path, 0);</div><div class='ctx'> 	if (IS_ERR(dentry))</div><div class='ctx'> 		return PTR_ERR(dentry);</div><div class='ctx'> 	error = security_path_symlink(&amp;path, dentry, oldname);</div><div class='ctx'> 	if (!error)</div><div class='del'>-		error = vfs_symlink(mnt_user_ns(path.mnt), path.dentry-&gt;d_inode,</div><div class='del'>-				    dentry, oldname);</div><div class='del'>-	done_path_create(&amp;path, dentry);</div><div class='add'>+		error = vfs_symlink(mnt_idmap(path.mnt), path.dentry-&gt;d_inode,</div><div class='add'>+				    dentry, oldname, NULL);</div><div class='add'>+	end_creating_path(&amp;path, dentry);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -226,16 +225,19 @@ int __init init_mkdir(const char *pathname, umode_t mode)</div><div class='ctx'> 	struct path path;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	dentry = kern_path_create(AT_FDCWD, pathname, &amp;path, LOOKUP_DIRECTORY);</div><div class='add'>+	dentry = start_creating_path(AT_FDCWD, pathname, &amp;path,</div><div class='add'>+				     LOOKUP_DIRECTORY);</div><div class='ctx'> 	if (IS_ERR(dentry))</div><div class='ctx'> 		return PTR_ERR(dentry);</div><div class='del'>-	if (!IS_POSIXACL(path.dentry-&gt;d_inode))</div><div class='del'>-		mode &amp;= ~current_umask();</div><div class='add'>+	mode = mode_strip_umask(d_inode(path.dentry), mode);</div><div class='ctx'> 	error = security_path_mkdir(&amp;path, dentry, mode);</div><div class='del'>-	if (!error)</div><div class='del'>-		error = vfs_mkdir(mnt_user_ns(path.mnt), path.dentry-&gt;d_inode,</div><div class='del'>-				  dentry, mode);</div><div class='del'>-	done_path_create(&amp;path, dentry);</div><div class='add'>+	if (!error) {</div><div class='add'>+		dentry = vfs_mkdir(mnt_idmap(path.mnt), path.dentry-&gt;d_inode,</div><div class='add'>+				  dentry, mode, NULL);</div><div class='add'>+		if (IS_ERR(dentry))</div><div class='add'>+			error = PTR_ERR(dentry);</div><div class='add'>+	}</div><div class='add'>+	end_creating_path(&amp;path, dentry);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/inode.c b/fs/inode.c<br/>index 3eba0940ffcf..521383223d8a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/inode.c</a></div><div class='hunk'>@@ -5,6 +5,7 @@</div><div class='ctx'>  */</div><div class='ctx'> #include &lt;linux/export.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/filelock.h&gt;</div><div class='ctx'> #include &lt;linux/mm.h&gt;</div><div class='ctx'> #include &lt;linux/backing-dev.h&gt;</div><div class='ctx'> #include &lt;linux/hash.h&gt;</div><div class='hunk'>@@ -15,19 +16,24 @@</div><div class='ctx'> #include &lt;linux/fsnotify.h&gt;</div><div class='ctx'> #include &lt;linux/mount.h&gt;</div><div class='ctx'> #include &lt;linux/posix_acl.h&gt;</div><div class='del'>-#include &lt;linux/prefetch.h&gt;</div><div class='ctx'> #include &lt;linux/buffer_head.h&gt; /* for inode_has_buffers */</div><div class='ctx'> #include &lt;linux/ratelimit.h&gt;</div><div class='ctx'> #include &lt;linux/list_lru.h&gt;</div><div class='ctx'> #include &lt;linux/iversion.h&gt;</div><div class='add'>+#include &lt;linux/rw_hint.h&gt;</div><div class='add'>+#include &lt;linux/seq_file.h&gt;</div><div class='add'>+#include &lt;linux/debugfs.h&gt;</div><div class='ctx'> #include &lt;trace/events/writeback.h&gt;</div><div class='add'>+#define CREATE_TRACE_POINTS</div><div class='add'>+#include &lt;trace/events/timestamp.h&gt;</div><div class='add'>+</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Inode locking rules:</div><div class='ctx'>  *</div><div class='ctx'>  * inode-&gt;i_lock protects:</div><div class='del'>- *   inode-&gt;i_state, inode-&gt;i_hash, __iget()</div><div class='add'>+ *   inode-&gt;i_state, inode-&gt;i_hash, __iget(), inode-&gt;i_io_list</div><div class='ctx'>  * Inode LRU list locks protect:</div><div class='ctx'>  *   inode-&gt;i_sb-&gt;s_inode_lru, inode-&gt;i_lru</div><div class='ctx'>  * inode-&gt;i_sb-&gt;s_inode_list_lock protects:</div><div class='hunk'>@@ -54,9 +60,9 @@</div><div class='ctx'>  *   inode_hash_lock</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static unsigned int i_hash_mask __read_mostly;</div><div class='del'>-static unsigned int i_hash_shift __read_mostly;</div><div class='del'>-static struct hlist_head *inode_hashtable __read_mostly;</div><div class='add'>+static unsigned int i_hash_mask __ro_after_init;</div><div class='add'>+static unsigned int i_hash_shift __ro_after_init;</div><div class='add'>+static struct hlist_head *inode_hashtable __ro_after_init;</div><div class='ctx'> static __cacheline_aligned_in_smp DEFINE_SPINLOCK(inode_hash_lock);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -67,15 +73,10 @@ const struct address_space_operations empty_aops = {</div><div class='ctx'> };</div><div class='ctx'> EXPORT_SYMBOL(empty_aops);</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Statistics gathering..</div><div class='del'>- */</div><div class='del'>-struct inodes_stat_t inodes_stat;</div><div class='del'>-</div><div class='ctx'> static DEFINE_PER_CPU(unsigned long, nr_inodes);</div><div class='ctx'> static DEFINE_PER_CPU(unsigned long, nr_unused);</div><div class='ctx'> </div><div class='del'>-static struct kmem_cache *inode_cachep __read_mostly;</div><div class='add'>+static struct kmem_cache *inode_cachep __ro_after_init;</div><div class='ctx'> </div><div class='ctx'> static long get_nr_inodes(void)</div><div class='ctx'> {</div><div class='hunk'>@@ -102,17 +103,110 @@ long get_nr_dirty_inodes(void)</div><div class='ctx'> 	return nr_dirty &gt; 0 ? nr_dirty : 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_DEBUG_FS</div><div class='add'>+static DEFINE_PER_CPU(long, mg_ctime_updates);</div><div class='add'>+static DEFINE_PER_CPU(long, mg_fine_stamps);</div><div class='add'>+static DEFINE_PER_CPU(long, mg_ctime_swaps);</div><div class='add'>+</div><div class='add'>+static unsigned long get_mg_ctime_updates(void)</div><div class='add'>+{</div><div class='add'>+	unsigned long sum = 0;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	for_each_possible_cpu(i)</div><div class='add'>+		sum += data_race(per_cpu(mg_ctime_updates, i));</div><div class='add'>+	return sum;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static unsigned long get_mg_fine_stamps(void)</div><div class='add'>+{</div><div class='add'>+	unsigned long sum = 0;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	for_each_possible_cpu(i)</div><div class='add'>+		sum += data_race(per_cpu(mg_fine_stamps, i));</div><div class='add'>+	return sum;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static unsigned long get_mg_ctime_swaps(void)</div><div class='add'>+{</div><div class='add'>+	unsigned long sum = 0;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	for_each_possible_cpu(i)</div><div class='add'>+		sum += data_race(per_cpu(mg_ctime_swaps, i));</div><div class='add'>+	return sum;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define mgtime_counter_inc(__var)	this_cpu_inc(__var)</div><div class='add'>+</div><div class='add'>+static int mgts_show(struct seq_file *s, void *p)</div><div class='add'>+{</div><div class='add'>+	unsigned long ctime_updates = get_mg_ctime_updates();</div><div class='add'>+	unsigned long ctime_swaps = get_mg_ctime_swaps();</div><div class='add'>+	unsigned long fine_stamps = get_mg_fine_stamps();</div><div class='add'>+	unsigned long floor_swaps = timekeeping_get_mg_floor_swaps();</div><div class='add'>+</div><div class='add'>+	seq_printf(s, "%lu %lu %lu %lu\n",</div><div class='add'>+		   ctime_updates, ctime_swaps, fine_stamps, floor_swaps);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+DEFINE_SHOW_ATTRIBUTE(mgts);</div><div class='add'>+</div><div class='add'>+static int __init mg_debugfs_init(void)</div><div class='add'>+{</div><div class='add'>+	debugfs_create_file("multigrain_timestamps", S_IFREG | S_IRUGO, NULL, NULL, &amp;mgts_fops);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+late_initcall(mg_debugfs_init);</div><div class='add'>+</div><div class='add'>+#else /* ! CONFIG_DEBUG_FS */</div><div class='add'>+</div><div class='add'>+#define mgtime_counter_inc(__var)	do { } while (0)</div><div class='add'>+</div><div class='add'>+#endif /* CONFIG_DEBUG_FS */</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Handle nr_inode sysctl</div><div class='ctx'>  */</div><div class='ctx'> #ifdef CONFIG_SYSCTL</div><div class='del'>-int proc_nr_inodes(struct ctl_table *table, int write,</div><div class='del'>-		   void *buffer, size_t *lenp, loff_t *ppos)</div><div class='add'>+/*</div><div class='add'>+ * Statistics gathering..</div><div class='add'>+ */</div><div class='add'>+static struct inodes_stat_t inodes_stat;</div><div class='add'>+</div><div class='add'>+static int proc_nr_inodes(const struct ctl_table *table, int write, void *buffer,</div><div class='add'>+			  size_t *lenp, loff_t *ppos)</div><div class='ctx'> {</div><div class='ctx'> 	inodes_stat.nr_inodes = get_nr_inodes();</div><div class='ctx'> 	inodes_stat.nr_unused = get_nr_inodes_unused();</div><div class='ctx'> 	return proc_doulongvec_minmax(table, write, buffer, lenp, ppos);</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+static const struct ctl_table inodes_sysctls[] = {</div><div class='add'>+	{</div><div class='add'>+		.procname	= "inode-nr",</div><div class='add'>+		.data		= &amp;inodes_stat,</div><div class='add'>+		.maxlen		= 2*sizeof(long),</div><div class='add'>+		.mode		= 0444,</div><div class='add'>+		.proc_handler	= proc_nr_inodes,</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+		.procname	= "inode-state",</div><div class='add'>+		.data		= &amp;inodes_stat,</div><div class='add'>+		.maxlen		= 7*sizeof(long),</div><div class='add'>+		.mode		= 0444,</div><div class='add'>+		.proc_handler	= proc_nr_inodes,</div><div class='add'>+	},</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int __init init_fs_inode_sysctls(void)</div><div class='add'>+{</div><div class='add'>+	register_sysctl_init("fs", inodes_sysctls);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+early_initcall(init_fs_inode_sysctls);</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> static int no_open(struct inode *inode, struct file *file)</div><div class='hunk'>@@ -121,14 +215,16 @@ static int no_open(struct inode *inode, struct file *file)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * inode_init_always - perform inode structure initialisation</div><div class='add'>+ * inode_init_always_gfp - perform inode structure initialisation</div><div class='ctx'>  * @sb: superblock inode belongs to</div><div class='ctx'>  * @inode: inode to initialise</div><div class='add'>+ * @gfp: allocation flags</div><div class='ctx'>  *</div><div class='ctx'>  * These are initializations that need to be done on every inode</div><div class='ctx'>  * allocation as the fields are not initialised by slab allocation.</div><div class='add'>+ * If there are additional allocations required @gfp is used.</div><div class='ctx'>  */</div><div class='del'>-int inode_init_always(struct super_block *sb, struct inode *inode)</div><div class='add'>+int inode_init_always_gfp(struct super_block *sb, struct inode *inode, gfp_t gfp)</div><div class='ctx'> {</div><div class='ctx'> 	static const struct inode_operations empty_iops;</div><div class='ctx'> 	static const struct file_operations no_open_fops = {.open = no_open};</div><div class='hunk'>@@ -137,6 +233,7 @@ int inode_init_always(struct super_block *sb, struct inode *inode)</div><div class='ctx'> 	inode-&gt;i_sb = sb;</div><div class='ctx'> 	inode-&gt;i_blkbits = sb-&gt;s_blocksize_bits;</div><div class='ctx'> 	inode-&gt;i_flags = 0;</div><div class='add'>+	inode_state_assign_raw(inode, 0);</div><div class='ctx'> 	atomic64_set(&amp;inode-&gt;i_sequence, 0);</div><div class='ctx'> 	atomic_set(&amp;inode-&gt;i_count, 1);</div><div class='ctx'> 	inode-&gt;i_op = &amp;empty_iops;</div><div class='hunk'>@@ -146,6 +243,8 @@ int inode_init_always(struct super_block *sb, struct inode *inode)</div><div class='ctx'> 	inode-&gt;i_opflags = 0;</div><div class='ctx'> 	if (sb-&gt;s_xattr)</div><div class='ctx'> 		inode-&gt;i_opflags |= IOP_XATTR;</div><div class='add'>+	if (sb-&gt;s_type-&gt;fs_flags &amp; FS_MGTIME)</div><div class='add'>+		inode-&gt;i_opflags |= IOP_MGTIME;</div><div class='ctx'> 	i_uid_write(inode, 0);</div><div class='ctx'> 	i_gid_write(inode, 0);</div><div class='ctx'> 	atomic_set(&amp;inode-&gt;i_writecount, 0);</div><div class='hunk'>@@ -167,8 +266,6 @@ int inode_init_always(struct super_block *sb, struct inode *inode)</div><div class='ctx'> 	inode-&gt;i_wb_frn_history = 0;</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-	if (security_inode_alloc(inode))</div><div class='del'>-		goto out;</div><div class='ctx'> 	spin_lock_init(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	lockdep_set_class(&amp;inode-&gt;i_lock, &amp;sb-&gt;s_type-&gt;i_lock_key);</div><div class='ctx'> </div><div class='hunk'>@@ -180,20 +277,20 @@ int inode_init_always(struct super_block *sb, struct inode *inode)</div><div class='ctx'> 	mapping-&gt;a_ops = &amp;empty_aops;</div><div class='ctx'> 	mapping-&gt;host = inode;</div><div class='ctx'> 	mapping-&gt;flags = 0;</div><div class='del'>-	if (sb-&gt;s_type-&gt;fs_flags &amp; FS_THP_SUPPORT)</div><div class='del'>-		__set_bit(AS_THP_SUPPORT, &amp;mapping-&gt;flags);</div><div class='ctx'> 	mapping-&gt;wb_err = 0;</div><div class='ctx'> 	atomic_set(&amp;mapping-&gt;i_mmap_writable, 0);</div><div class='ctx'> #ifdef CONFIG_READ_ONLY_THP_FOR_FS</div><div class='ctx'> 	atomic_set(&amp;mapping-&gt;nr_thps, 0);</div><div class='ctx'> #endif</div><div class='ctx'> 	mapping_set_gfp_mask(mapping, GFP_HIGHUSER_MOVABLE);</div><div class='del'>-	mapping-&gt;private_data = NULL;</div><div class='add'>+	mapping-&gt;i_private_data = NULL;</div><div class='ctx'> 	mapping-&gt;writeback_index = 0;</div><div class='ctx'> 	init_rwsem(&amp;mapping-&gt;invalidate_lock);</div><div class='ctx'> 	lockdep_set_class_and_name(&amp;mapping-&gt;invalidate_lock,</div><div class='ctx'> 				   &amp;sb-&gt;s_type-&gt;invalidate_lock_key,</div><div class='ctx'> 				   "mapping.invalidate_lock");</div><div class='add'>+	if (sb-&gt;s_iflags &amp; SB_I_STABLE_WRITES)</div><div class='add'>+		mapping_set_stable_writes(mapping);</div><div class='ctx'> 	inode-&gt;i_private = NULL;</div><div class='ctx'> 	inode-&gt;i_mapping = mapping;</div><div class='ctx'> 	INIT_HLIST_HEAD(&amp;inode-&gt;i_dentry);	/* buggered by rcu freeing */</div><div class='hunk'>@@ -205,13 +302,15 @@ int inode_init_always(struct super_block *sb, struct inode *inode)</div><div class='ctx'> 	inode-&gt;i_fsnotify_mask = 0;</div><div class='ctx'> #endif</div><div class='ctx'> 	inode-&gt;i_flctx = NULL;</div><div class='add'>+</div><div class='add'>+	if (unlikely(security_inode_alloc(inode, gfp)))</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='ctx'> 	this_cpu_inc(nr_inodes);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='del'>-out:</div><div class='del'>-	return -ENOMEM;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(inode_init_always);</div><div class='add'>+EXPORT_SYMBOL(inode_init_always_gfp);</div><div class='ctx'> </div><div class='ctx'> void free_inode_nonrcu(struct inode *inode)</div><div class='ctx'> {</div><div class='hunk'>@@ -228,7 +327,17 @@ static void i_callback(struct rcu_head *head)</div><div class='ctx'> 		free_inode_nonrcu(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct inode *alloc_inode(struct super_block *sb)</div><div class='add'>+/**</div><div class='add'>+ *	alloc_inode 	- obtain an inode</div><div class='add'>+ *	@sb: superblock</div><div class='add'>+ *</div><div class='add'>+ *	Allocates a new inode for given superblock.</div><div class='add'>+ *	Inode wont be chained in superblock s_inodes list</div><div class='add'>+ *	This means :</div><div class='add'>+ *	- fs can't be unmount</div><div class='add'>+ *	- quotas, fsnotify, writeback can't work</div><div class='add'>+ */</div><div class='add'>+struct inode *alloc_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	const struct super_operations *ops = sb-&gt;s_op;</div><div class='ctx'> 	struct inode *inode;</div><div class='hunk'>@@ -236,7 +345,7 @@ static struct inode *alloc_inode(struct super_block *sb)</div><div class='ctx'> 	if (ops-&gt;alloc_inode)</div><div class='ctx'> 		inode = ops-&gt;alloc_inode(sb);</div><div class='ctx'> 	else</div><div class='del'>-		inode = kmem_cache_alloc(inode_cachep, GFP_KERNEL);</div><div class='add'>+		inode = alloc_inode_sb(sb, inode_cachep, GFP_KERNEL);</div><div class='ctx'> </div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		return NULL;</div><div class='hunk'>@@ -362,7 +471,7 @@ EXPORT_SYMBOL(set_nlink);</div><div class='ctx'> void inc_nlink(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	if (unlikely(inode-&gt;i_nlink == 0)) {</div><div class='del'>-		WARN_ON(!(inode-&gt;i_state &amp; I_LINKABLE));</div><div class='add'>+		WARN_ON(!(inode_state_read_once(inode) &amp; I_LINKABLE));</div><div class='ctx'> 		atomic_long_dec(&amp;inode-&gt;i_sb-&gt;s_remove_count);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -374,8 +483,8 @@ static void __address_space_init_once(struct address_space *mapping)</div><div class='ctx'> {</div><div class='ctx'> 	xa_init_flags(&amp;mapping-&gt;i_pages, XA_FLAGS_LOCK_IRQ | XA_FLAGS_ACCOUNT);</div><div class='ctx'> 	init_rwsem(&amp;mapping-&gt;i_mmap_rwsem);</div><div class='del'>-	INIT_LIST_HEAD(&amp;mapping-&gt;private_list);</div><div class='del'>-	spin_lock_init(&amp;mapping-&gt;private_lock);</div><div class='add'>+	INIT_LIST_HEAD(&amp;mapping-&gt;i_private_list);</div><div class='add'>+	spin_lock_init(&amp;mapping-&gt;i_private_lock);</div><div class='ctx'> 	mapping-&gt;i_mmap = RB_ROOT_CACHED;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -399,6 +508,7 @@ void inode_init_once(struct inode *inode)</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;inode-&gt;i_io_list);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;inode-&gt;i_wb_list);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;inode-&gt;i_lru);</div><div class='add'>+	INIT_LIST_HEAD(&amp;inode-&gt;i_sb_list);</div><div class='ctx'> 	__address_space_init_once(&amp;inode-&gt;i_data);</div><div class='ctx'> 	i_size_ordered_init(inode);</div><div class='ctx'> }</div><div class='hunk'>@@ -412,14 +522,6 @@ static void init_once(void *foo)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * inode-&gt;i_lock must be held</div><div class='del'>- */</div><div class='del'>-void __iget(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	atomic_inc(&amp;inode-&gt;i_count);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * get additional reference to inode; caller must already hold one.</div><div class='ctx'>  */</div><div class='ctx'> void ihold(struct inode *inode)</div><div class='hunk'>@@ -428,57 +530,144 @@ void ihold(struct inode *inode)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(ihold);</div><div class='ctx'> </div><div class='del'>-static void __inode_add_lru(struct inode *inode, bool rotate)</div><div class='add'>+struct wait_queue_head *inode_bit_waitqueue(struct wait_bit_queue_entry *wqe,</div><div class='add'>+					    struct inode *inode, u32 bit)</div><div class='ctx'> {</div><div class='del'>-	if (inode-&gt;i_state &amp; (I_DIRTY_ALL | I_SYNC | I_FREEING | I_WILL_FREE))</div><div class='add'>+	void *bit_address;</div><div class='add'>+</div><div class='add'>+	bit_address = inode_state_wait_address(inode, bit);</div><div class='add'>+	init_wait_var_entry(wqe, bit_address, 0);</div><div class='add'>+	return __var_waitqueue(bit_address);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(inode_bit_waitqueue);</div><div class='add'>+</div><div class='add'>+void wait_on_new_inode(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct wait_bit_queue_entry wqe;</div><div class='add'>+	struct wait_queue_head *wq_head;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+	if (!(inode_state_read(inode) &amp; I_NEW)) {</div><div class='add'>+		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	wq_head = inode_bit_waitqueue(&amp;wqe, inode, __I_NEW);</div><div class='add'>+	for (;;) {</div><div class='add'>+		prepare_to_wait_event(wq_head, &amp;wqe.wq_entry, TASK_UNINTERRUPTIBLE);</div><div class='add'>+		if (!(inode_state_read(inode) &amp; I_NEW))</div><div class='add'>+			break;</div><div class='add'>+		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+		schedule();</div><div class='add'>+		spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+	}</div><div class='add'>+	finish_wait(wq_head, &amp;wqe.wq_entry);</div><div class='add'>+	WARN_ON(inode_state_read(inode) &amp; I_NEW);</div><div class='add'>+	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(wait_on_new_inode);</div><div class='add'>+</div><div class='add'>+static void __inode_lru_list_add(struct inode *inode, bool rotate)</div><div class='add'>+{</div><div class='add'>+	lockdep_assert_held(&amp;inode-&gt;i_lock);</div><div class='add'>+</div><div class='add'>+	if (inode_state_read(inode) &amp; (I_DIRTY_ALL | I_SYNC | I_FREEING | I_WILL_FREE))</div><div class='ctx'> 		return;</div><div class='del'>-	if (atomic_read(&amp;inode-&gt;i_count))</div><div class='add'>+	if (icount_read(inode))</div><div class='ctx'> 		return;</div><div class='ctx'> 	if (!(inode-&gt;i_sb-&gt;s_flags &amp; SB_ACTIVE))</div><div class='ctx'> 		return;</div><div class='ctx'> 	if (!mapping_shrinkable(&amp;inode-&gt;i_data))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	if (list_lru_add(&amp;inode-&gt;i_sb-&gt;s_inode_lru, &amp;inode-&gt;i_lru))</div><div class='add'>+	if (list_lru_add_obj(&amp;inode-&gt;i_sb-&gt;s_inode_lru, &amp;inode-&gt;i_lru))</div><div class='ctx'> 		this_cpu_inc(nr_unused);</div><div class='ctx'> 	else if (rotate)</div><div class='del'>-		inode-&gt;i_state |= I_REFERENCED;</div><div class='add'>+		inode_state_set(inode, I_REFERENCED);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Add inode to LRU if needed (inode is unused and clean).</div><div class='del'>- *</div><div class='del'>- * Needs inode-&gt;i_lock held.</div><div class='ctx'>  */</div><div class='del'>-void inode_add_lru(struct inode *inode)</div><div class='add'>+void inode_lru_list_add(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	__inode_add_lru(inode, false);</div><div class='add'>+	__inode_lru_list_add(inode, false);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void inode_lru_list_del(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	if (list_lru_del(&amp;inode-&gt;i_sb-&gt;s_inode_lru, &amp;inode-&gt;i_lru))</div><div class='add'>+	if (list_empty(&amp;inode-&gt;i_lru))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (list_lru_del_obj(&amp;inode-&gt;i_sb-&gt;s_inode_lru, &amp;inode-&gt;i_lru))</div><div class='ctx'> 		this_cpu_dec(nr_unused);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void inode_pin_lru_isolating(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	lockdep_assert_held(&amp;inode-&gt;i_lock);</div><div class='add'>+	WARN_ON(inode_state_read(inode) &amp; (I_LRU_ISOLATING | I_FREEING | I_WILL_FREE));</div><div class='add'>+	inode_state_set(inode, I_LRU_ISOLATING);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void inode_unpin_lru_isolating(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+	WARN_ON(!(inode_state_read(inode) &amp; I_LRU_ISOLATING));</div><div class='add'>+	inode_state_clear(inode, I_LRU_ISOLATING);</div><div class='add'>+	/* Called with inode-&gt;i_lock which ensures memory ordering. */</div><div class='add'>+	inode_wake_up_bit(inode, __I_LRU_ISOLATING);</div><div class='add'>+	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void inode_wait_for_lru_isolating(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct wait_bit_queue_entry wqe;</div><div class='add'>+	struct wait_queue_head *wq_head;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held(&amp;inode-&gt;i_lock);</div><div class='add'>+	if (!(inode_state_read(inode) &amp; I_LRU_ISOLATING))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	wq_head = inode_bit_waitqueue(&amp;wqe, inode, __I_LRU_ISOLATING);</div><div class='add'>+	for (;;) {</div><div class='add'>+		prepare_to_wait_event(wq_head, &amp;wqe.wq_entry, TASK_UNINTERRUPTIBLE);</div><div class='add'>+		/*</div><div class='add'>+		 * Checking I_LRU_ISOLATING with inode-&gt;i_lock guarantees</div><div class='add'>+		 * memory ordering.</div><div class='add'>+		 */</div><div class='add'>+		if (!(inode_state_read(inode) &amp; I_LRU_ISOLATING))</div><div class='add'>+			break;</div><div class='add'>+		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+		schedule();</div><div class='add'>+		spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+	}</div><div class='add'>+	finish_wait(wq_head, &amp;wqe.wq_entry);</div><div class='add'>+	WARN_ON(inode_state_read(inode) &amp; I_LRU_ISOLATING);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /**</div><div class='ctx'>  * inode_sb_list_add - add inode to the superblock list of inodes</div><div class='ctx'>  * @inode: inode to add</div><div class='ctx'>  */</div><div class='ctx'> void inode_sb_list_add(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	spin_lock(&amp;inode-&gt;i_sb-&gt;s_inode_list_lock);</div><div class='del'>-	list_add(&amp;inode-&gt;i_sb_list, &amp;inode-&gt;i_sb-&gt;s_inodes);</div><div class='del'>-	spin_unlock(&amp;inode-&gt;i_sb-&gt;s_inode_list_lock);</div><div class='add'>+	struct super_block *sb = inode-&gt;i_sb;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;sb-&gt;s_inode_list_lock);</div><div class='add'>+	list_add(&amp;inode-&gt;i_sb_list, &amp;sb-&gt;s_inodes);</div><div class='add'>+	spin_unlock(&amp;sb-&gt;s_inode_list_lock);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(inode_sb_list_add);</div><div class='ctx'> </div><div class='ctx'> static inline void inode_sb_list_del(struct inode *inode)</div><div class='ctx'> {</div><div class='add'>+	struct super_block *sb = inode-&gt;i_sb;</div><div class='add'>+</div><div class='ctx'> 	if (!list_empty(&amp;inode-&gt;i_sb_list)) {</div><div class='del'>-		spin_lock(&amp;inode-&gt;i_sb-&gt;s_inode_list_lock);</div><div class='add'>+		spin_lock(&amp;sb-&gt;s_inode_list_lock);</div><div class='ctx'> 		list_del_init(&amp;inode-&gt;i_sb_list);</div><div class='del'>-		spin_unlock(&amp;inode-&gt;i_sb-&gt;s_inode_list_lock);</div><div class='add'>+		spin_unlock(&amp;sb-&gt;s_inode_list_lock);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -528,11 +717,65 @@ void __remove_inode_hash(struct inode *inode)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(__remove_inode_hash);</div><div class='ctx'> </div><div class='add'>+void dump_mapping(const struct address_space *mapping)</div><div class='add'>+{</div><div class='add'>+	struct inode *host;</div><div class='add'>+	const struct address_space_operations *a_ops;</div><div class='add'>+	struct hlist_node *dentry_first;</div><div class='add'>+	struct dentry *dentry_ptr;</div><div class='add'>+	struct dentry dentry;</div><div class='add'>+	char fname[64] = {};</div><div class='add'>+	unsigned long ino;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If mapping is an invalid pointer, we don't want to crash</div><div class='add'>+	 * accessing it, so probe everything depending on it carefully.</div><div class='add'>+	 */</div><div class='add'>+	if (get_kernel_nofault(host, &amp;mapping-&gt;host) ||</div><div class='add'>+	    get_kernel_nofault(a_ops, &amp;mapping-&gt;a_ops)) {</div><div class='add'>+		pr_warn("invalid mapping:%px\n", mapping);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!host) {</div><div class='add'>+		pr_warn("aops:%ps\n", a_ops);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (get_kernel_nofault(dentry_first, &amp;host-&gt;i_dentry.first) ||</div><div class='add'>+	    get_kernel_nofault(ino, &amp;host-&gt;i_ino)) {</div><div class='add'>+		pr_warn("aops:%ps invalid inode:%px\n", a_ops, host);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!dentry_first) {</div><div class='add'>+		pr_warn("aops:%ps ino:%lx\n", a_ops, ino);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	dentry_ptr = container_of(dentry_first, struct dentry, d_u.d_alias);</div><div class='add'>+	if (get_kernel_nofault(dentry, dentry_ptr) ||</div><div class='add'>+	    !dentry.d_parent || !dentry.d_name.name) {</div><div class='add'>+		pr_warn("aops:%ps ino:%lx invalid dentry:%px\n",</div><div class='add'>+				a_ops, ino, dentry_ptr);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (strncpy_from_kernel_nofault(fname, dentry.d_name.name, 63) &lt; 0)</div><div class='add'>+		strscpy(fname, "&lt;invalid&gt;");</div><div class='add'>+	/*</div><div class='add'>+	 * Even if strncpy_from_kernel_nofault() succeeded,</div><div class='add'>+	 * the fname could be unreliable</div><div class='add'>+	 */</div><div class='add'>+	pr_warn("aops:%ps ino:%lx dentry name(?):\"%s\"\n",</div><div class='add'>+		a_ops, ino, fname);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> void clear_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We have to cycle the i_pages lock here because reclaim can be in the</div><div class='del'>-	 * process of removing the last page (in __delete_from_page_cache())</div><div class='add'>+	 * process of removing the last page (in __filemap_remove_folio())</div><div class='ctx'> 	 * and we must not free the mapping under it.</div><div class='ctx'> 	 */</div><div class='ctx'> 	xa_lock_irq(&amp;inode-&gt;i_data.i_pages);</div><div class='hunk'>@@ -546,12 +789,12 @@ void clear_inode(struct inode *inode)</div><div class='ctx'> 	 * nor even WARN_ON(!mapping_empty).</div><div class='ctx'> 	 */</div><div class='ctx'> 	xa_unlock_irq(&amp;inode-&gt;i_data.i_pages);</div><div class='del'>-	BUG_ON(!list_empty(&amp;inode-&gt;i_data.private_list));</div><div class='del'>-	BUG_ON(!(inode-&gt;i_state &amp; I_FREEING));</div><div class='del'>-	BUG_ON(inode-&gt;i_state &amp; I_CLEAR);</div><div class='add'>+	BUG_ON(!list_empty(&amp;inode-&gt;i_data.i_private_list));</div><div class='add'>+	BUG_ON(!(inode_state_read_once(inode) &amp; I_FREEING));</div><div class='add'>+	BUG_ON(inode_state_read_once(inode) &amp; I_CLEAR);</div><div class='ctx'> 	BUG_ON(!list_empty(&amp;inode-&gt;i_wb_list));</div><div class='ctx'> 	/* don't need i_lock here, no concurrent mods to i_state */</div><div class='del'>-	inode-&gt;i_state = I_FREEING | I_CLEAR;</div><div class='add'>+	inode_state_assign_raw(inode, I_FREEING | I_CLEAR);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(clear_inode);</div><div class='ctx'> </div><div class='hunk'>@@ -572,14 +815,15 @@ static void evict(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	const struct super_operations *op = inode-&gt;i_sb-&gt;s_op;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(!(inode-&gt;i_state &amp; I_FREEING));</div><div class='add'>+	BUG_ON(!(inode_state_read_once(inode) &amp; I_FREEING));</div><div class='ctx'> 	BUG_ON(!list_empty(&amp;inode-&gt;i_lru));</div><div class='ctx'> </div><div class='del'>-	if (!list_empty(&amp;inode-&gt;i_io_list))</div><div class='del'>-		inode_io_list_del(inode);</div><div class='del'>-</div><div class='add'>+	inode_io_list_del(inode);</div><div class='ctx'> 	inode_sb_list_del(inode);</div><div class='ctx'> </div><div class='add'>+	spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+	inode_wait_for_lru_isolating(inode);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Wait for flusher thread to be done with the inode so that filesystem</div><div class='ctx'> 	 * does not start destroying it while writeback is still running. Since</div><div class='hunk'>@@ -587,6 +831,7 @@ static void evict(struct inode *inode)</div><div class='ctx'> 	 * the inode.  We just have to wait for running writeback to finish.</div><div class='ctx'> 	 */</div><div class='ctx'> 	inode_wait_for_writeback(inode);</div><div class='add'>+	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (op-&gt;evict_inode) {</div><div class='ctx'> 		op-&gt;evict_inode(inode);</div><div class='hunk'>@@ -599,10 +844,19 @@ static void evict(struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> 	remove_inode_hash(inode);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-	wake_up_bit(&amp;inode-&gt;i_state, __I_NEW);</div><div class='del'>-	BUG_ON(inode-&gt;i_state != (I_FREEING | I_CLEAR));</div><div class='del'>-	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+	/*</div><div class='add'>+	 * Wake up waiters in __wait_on_freeing_inode().</div><div class='add'>+	 *</div><div class='add'>+	 * It is an invariant that any thread we need to wake up is already</div><div class='add'>+	 * accounted for before remove_inode_hash() acquires -&gt;i_lock -- both</div><div class='add'>+	 * sides take the lock and sleep is aborted if the inode is found</div><div class='add'>+	 * unhashed. Thus either the sleeper wins and goes off CPU, or removal</div><div class='add'>+	 * wins and the sleeper aborts after testing with the lock.</div><div class='add'>+	 *</div><div class='add'>+	 * This also means we don't need any fences for the call below.</div><div class='add'>+	 */</div><div class='add'>+	inode_wake_up_bit(inode, __I_NEW);</div><div class='add'>+	BUG_ON(inode_state_read_once(inode) != (I_FREEING | I_CLEAR));</div><div class='ctx'> </div><div class='ctx'> 	destroy_inode(inode);</div><div class='ctx'> }</div><div class='hunk'>@@ -638,22 +892,26 @@ static void dispose_list(struct list_head *head)</div><div class='ctx'>  */</div><div class='ctx'> void evict_inodes(struct super_block *sb)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode, *next;</div><div class='add'>+	struct inode *inode;</div><div class='ctx'> 	LIST_HEAD(dispose);</div><div class='ctx'> </div><div class='ctx'> again:</div><div class='ctx'> 	spin_lock(&amp;sb-&gt;s_inode_list_lock);</div><div class='del'>-	list_for_each_entry_safe(inode, next, &amp;sb-&gt;s_inodes, i_sb_list) {</div><div class='del'>-		if (atomic_read(&amp;inode-&gt;i_count))</div><div class='add'>+	list_for_each_entry(inode, &amp;sb-&gt;s_inodes, i_sb_list) {</div><div class='add'>+		if (icount_read(inode))</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-		if (inode-&gt;i_state &amp; (I_NEW | I_FREEING | I_WILL_FREE)) {</div><div class='add'>+		if (icount_read(inode)) {</div><div class='add'>+			spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+		if (inode_state_read(inode) &amp; (I_NEW | I_FREEING | I_WILL_FREE)) {</div><div class='ctx'> 			spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		inode-&gt;i_state |= I_FREEING;</div><div class='add'>+		inode_state_set(inode, I_FREEING);</div><div class='ctx'> 		inode_lru_list_del(inode);</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 		list_add(&amp;inode-&gt;i_lru, &amp;dispose);</div><div class='hunk'>@@ -676,59 +934,6 @@ again:</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(evict_inodes);</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * invalidate_inodes	- attempt to free all inodes on a superblock</div><div class='del'>- * @sb:		superblock to operate on</div><div class='del'>- * @kill_dirty: flag to guide handling of dirty inodes</div><div class='del'>- *</div><div class='del'>- * Attempts to free all inodes for a given superblock.  If there were any</div><div class='del'>- * busy inodes return a non-zero value, else zero.</div><div class='del'>- * If @kill_dirty is set, discard dirty inodes too, otherwise treat</div><div class='del'>- * them as busy.</div><div class='del'>- */</div><div class='del'>-int invalidate_inodes(struct super_block *sb, bool kill_dirty)</div><div class='del'>-{</div><div class='del'>-	int busy = 0;</div><div class='del'>-	struct inode *inode, *next;</div><div class='del'>-	LIST_HEAD(dispose);</div><div class='del'>-</div><div class='del'>-again:</div><div class='del'>-	spin_lock(&amp;sb-&gt;s_inode_list_lock);</div><div class='del'>-	list_for_each_entry_safe(inode, next, &amp;sb-&gt;s_inodes, i_sb_list) {</div><div class='del'>-		spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-		if (inode-&gt;i_state &amp; (I_NEW | I_FREEING | I_WILL_FREE)) {</div><div class='del'>-			spin_unlock(&amp;inode-&gt;i_lock);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-		if (inode-&gt;i_state &amp; I_DIRTY_ALL &amp;&amp; !kill_dirty) {</div><div class='del'>-			spin_unlock(&amp;inode-&gt;i_lock);</div><div class='del'>-			busy = 1;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-		if (atomic_read(&amp;inode-&gt;i_count)) {</div><div class='del'>-			spin_unlock(&amp;inode-&gt;i_lock);</div><div class='del'>-			busy = 1;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		inode-&gt;i_state |= I_FREEING;</div><div class='del'>-		inode_lru_list_del(inode);</div><div class='del'>-		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='del'>-		list_add(&amp;inode-&gt;i_lru, &amp;dispose);</div><div class='del'>-		if (need_resched()) {</div><div class='del'>-			spin_unlock(&amp;sb-&gt;s_inode_list_lock);</div><div class='del'>-			cond_resched();</div><div class='del'>-			dispose_list(&amp;dispose);</div><div class='del'>-			goto again;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;sb-&gt;s_inode_list_lock);</div><div class='del'>-</div><div class='del'>-	dispose_list(&amp;dispose);</div><div class='del'>-</div><div class='del'>-	return busy;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Isolate the inode from the LRU in preparation for freeing it.</div><div class='ctx'>  *</div><div class='hunk'>@@ -741,7 +946,7 @@ again:</div><div class='ctx'>  * with this flag set because they are the inodes that are out of order.</div><div class='ctx'>  */</div><div class='ctx'> static enum lru_status inode_lru_isolate(struct list_head *item,</div><div class='del'>-		struct list_lru_one *lru, spinlock_t *lru_lock, void *arg)</div><div class='add'>+		struct list_lru_one *lru, void *arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct list_head *freeable = arg;</div><div class='ctx'> 	struct inode	*inode = container_of(item, struct inode, i_lru);</div><div class='hunk'>@@ -759,8 +964,8 @@ static enum lru_status inode_lru_isolate(struct list_head *item,</div><div class='ctx'> 	 * unreclaimable for a while. Remove them lazily here; iput,</div><div class='ctx'> 	 * sync, or the last page cache deletion will requeue them.</div><div class='ctx'> 	 */</div><div class='del'>-	if (atomic_read(&amp;inode-&gt;i_count) ||</div><div class='del'>-	    (inode-&gt;i_state &amp; ~I_REFERENCED) ||</div><div class='add'>+	if (icount_read(inode) ||</div><div class='add'>+	    (inode_state_read(inode) &amp; ~I_REFERENCED) ||</div><div class='ctx'> 	    !mapping_shrinkable(&amp;inode-&gt;i_data)) {</div><div class='ctx'> 		list_lru_isolate(lru, &amp;inode-&gt;i_lru);</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='hunk'>@@ -769,8 +974,8 @@ static enum lru_status inode_lru_isolate(struct list_head *item,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Recently referenced inodes get one more pass */</div><div class='del'>-	if (inode-&gt;i_state &amp; I_REFERENCED) {</div><div class='del'>-		inode-&gt;i_state &amp;= ~I_REFERENCED;</div><div class='add'>+	if (inode_state_read(inode) &amp; I_REFERENCED) {</div><div class='add'>+		inode_state_clear(inode, I_REFERENCED);</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 		return LRU_ROTATE;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -781,9 +986,9 @@ static enum lru_status inode_lru_isolate(struct list_head *item,</div><div class='ctx'> 	 * be under pressure before the cache inside the highmem zone.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (inode_has_buffers(inode) || !mapping_empty(&amp;inode-&gt;i_data)) {</div><div class='del'>-		__iget(inode);</div><div class='add'>+		inode_pin_lru_isolating(inode);</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='del'>-		spin_unlock(lru_lock);</div><div class='add'>+		spin_unlock(&amp;lru-&gt;lock);</div><div class='ctx'> 		if (remove_inode_buffers(inode)) {</div><div class='ctx'> 			unsigned long reap;</div><div class='ctx'> 			reap = invalidate_mapping_pages(&amp;inode-&gt;i_data, 0, -1);</div><div class='hunk'>@@ -791,16 +996,14 @@ static enum lru_status inode_lru_isolate(struct list_head *item,</div><div class='ctx'> 				__count_vm_events(KSWAPD_INODESTEAL, reap);</div><div class='ctx'> 			else</div><div class='ctx'> 				__count_vm_events(PGINODESTEAL, reap);</div><div class='del'>-			if (current-&gt;reclaim_state)</div><div class='del'>-				current-&gt;reclaim_state-&gt;reclaimed_slab += reap;</div><div class='add'>+			mm_account_reclaimed_pages(reap);</div><div class='ctx'> 		}</div><div class='del'>-		iput(inode);</div><div class='del'>-		spin_lock(lru_lock);</div><div class='add'>+		inode_unpin_lru_isolating(inode);</div><div class='ctx'> 		return LRU_RETRY;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	WARN_ON(inode-&gt;i_state &amp; I_NEW);</div><div class='del'>-	inode-&gt;i_state |= I_FREEING;</div><div class='add'>+	WARN_ON(inode_state_read(inode) &amp; I_NEW);</div><div class='add'>+	inode_state_set(inode, I_FREEING);</div><div class='ctx'> 	list_lru_isolate_move(lru, &amp;inode-&gt;i_lru, freeable);</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> </div><div class='hunk'>@@ -825,36 +1028,47 @@ long prune_icache_sb(struct super_block *sb, struct shrink_control *sc)</div><div class='ctx'> 	return freed;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void __wait_on_freeing_inode(struct inode *inode);</div><div class='add'>+static void __wait_on_freeing_inode(struct inode *inode, bool is_inode_hash_locked);</div><div class='ctx'> /*</div><div class='ctx'>  * Called with the inode lock held.</div><div class='ctx'>  */</div><div class='ctx'> static struct inode *find_inode(struct super_block *sb,</div><div class='ctx'> 				struct hlist_head *head,</div><div class='ctx'> 				int (*test)(struct inode *, void *),</div><div class='del'>-				void *data)</div><div class='add'>+				void *data, bool is_inode_hash_locked,</div><div class='add'>+				bool *isnew)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = NULL;</div><div class='ctx'> </div><div class='add'>+	if (is_inode_hash_locked)</div><div class='add'>+		lockdep_assert_held(&amp;inode_hash_lock);</div><div class='add'>+	else</div><div class='add'>+		lockdep_assert_not_held(&amp;inode_hash_lock);</div><div class='add'>+</div><div class='add'>+	rcu_read_lock();</div><div class='ctx'> repeat:</div><div class='del'>-	hlist_for_each_entry(inode, head, i_hash) {</div><div class='add'>+	hlist_for_each_entry_rcu(inode, head, i_hash) {</div><div class='ctx'> 		if (inode-&gt;i_sb != sb)</div><div class='ctx'> 			continue;</div><div class='ctx'> 		if (!test(inode, data))</div><div class='ctx'> 			continue;</div><div class='ctx'> 		spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-		if (inode-&gt;i_state &amp; (I_FREEING|I_WILL_FREE)) {</div><div class='del'>-			__wait_on_freeing_inode(inode);</div><div class='add'>+		if (inode_state_read(inode) &amp; (I_FREEING | I_WILL_FREE)) {</div><div class='add'>+			__wait_on_freeing_inode(inode, is_inode_hash_locked);</div><div class='ctx'> 			goto repeat;</div><div class='ctx'> 		}</div><div class='del'>-		if (unlikely(inode-&gt;i_state &amp; I_CREATING)) {</div><div class='add'>+		if (unlikely(inode_state_read(inode) &amp; I_CREATING)) {</div><div class='ctx'> 			spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+			rcu_read_unlock();</div><div class='ctx'> 			return ERR_PTR(-ESTALE);</div><div class='ctx'> 		}</div><div class='ctx'> 		__iget(inode);</div><div class='add'>+		*isnew = !!(inode_state_read(inode) &amp; I_NEW);</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+		rcu_read_unlock();</div><div class='ctx'> 		return inode;</div><div class='ctx'> 	}</div><div class='add'>+	rcu_read_unlock();</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -863,29 +1077,40 @@ repeat:</div><div class='ctx'>  * iget_locked for details.</div><div class='ctx'>  */</div><div class='ctx'> static struct inode *find_inode_fast(struct super_block *sb,</div><div class='del'>-				struct hlist_head *head, unsigned long ino)</div><div class='add'>+				struct hlist_head *head, unsigned long ino,</div><div class='add'>+				bool is_inode_hash_locked, bool *isnew)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = NULL;</div><div class='ctx'> </div><div class='add'>+	if (is_inode_hash_locked)</div><div class='add'>+		lockdep_assert_held(&amp;inode_hash_lock);</div><div class='add'>+	else</div><div class='add'>+		lockdep_assert_not_held(&amp;inode_hash_lock);</div><div class='add'>+</div><div class='add'>+	rcu_read_lock();</div><div class='ctx'> repeat:</div><div class='del'>-	hlist_for_each_entry(inode, head, i_hash) {</div><div class='add'>+	hlist_for_each_entry_rcu(inode, head, i_hash) {</div><div class='ctx'> 		if (inode-&gt;i_ino != ino)</div><div class='ctx'> 			continue;</div><div class='ctx'> 		if (inode-&gt;i_sb != sb)</div><div class='ctx'> 			continue;</div><div class='ctx'> 		spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-		if (inode-&gt;i_state &amp; (I_FREEING|I_WILL_FREE)) {</div><div class='del'>-			__wait_on_freeing_inode(inode);</div><div class='add'>+		if (inode_state_read(inode) &amp; (I_FREEING | I_WILL_FREE)) {</div><div class='add'>+			__wait_on_freeing_inode(inode, is_inode_hash_locked);</div><div class='ctx'> 			goto repeat;</div><div class='ctx'> 		}</div><div class='del'>-		if (unlikely(inode-&gt;i_state &amp; I_CREATING)) {</div><div class='add'>+		if (unlikely(inode_state_read(inode) &amp; I_CREATING)) {</div><div class='ctx'> 			spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+			rcu_read_unlock();</div><div class='ctx'> 			return ERR_PTR(-ESTALE);</div><div class='ctx'> 		}</div><div class='ctx'> 		__iget(inode);</div><div class='add'>+		*isnew = !!(inode_state_read(inode) &amp; I_NEW);</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+		rcu_read_unlock();</div><div class='ctx'> 		return inode;</div><div class='ctx'> 	}</div><div class='add'>+	rcu_read_unlock();</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -932,29 +1157,6 @@ unsigned int get_next_ino(void)</div><div class='ctx'> EXPORT_SYMBOL(get_next_ino);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- *	new_inode_pseudo 	- obtain an inode</div><div class='del'>- *	@sb: superblock</div><div class='del'>- *</div><div class='del'>- *	Allocates a new inode for given superblock.</div><div class='del'>- *	Inode wont be chained in superblock s_inodes list</div><div class='del'>- *	This means :</div><div class='del'>- *	- fs can't be unmount</div><div class='del'>- *	- quotas, fsnotify, writeback can't work</div><div class='del'>- */</div><div class='del'>-struct inode *new_inode_pseudo(struct super_block *sb)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = alloc_inode(sb);</div><div class='del'>-</div><div class='del'>-	if (inode) {</div><div class='del'>-		spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-		inode-&gt;i_state = 0;</div><div class='del'>-		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='del'>-		INIT_LIST_HEAD(&amp;inode-&gt;i_sb_list);</div><div class='del'>-	}</div><div class='del'>-	return inode;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='ctx'>  *	new_inode 	- obtain an inode</div><div class='ctx'>  *	@sb: superblock</div><div class='ctx'>  *</div><div class='hunk'>@@ -970,9 +1172,7 @@ struct inode *new_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> </div><div class='del'>-	spin_lock_prefetch(&amp;sb-&gt;s_inode_list_lock);</div><div class='del'>-</div><div class='del'>-	inode = new_inode_pseudo(sb);</div><div class='add'>+	inode = alloc_inode(sb);</div><div class='ctx'> 	if (inode)</div><div class='ctx'> 		inode_sb_list_add(inode);</div><div class='ctx'> 	return inode;</div><div class='hunk'>@@ -988,9 +1188,8 @@ void lockdep_annotate_inode_mutex_key(struct inode *inode)</div><div class='ctx'> 		/* Set new key only if filesystem hasn't already changed it */</div><div class='ctx'> 		if (lockdep_match_class(&amp;inode-&gt;i_rwsem, &amp;type-&gt;i_mutex_key)) {</div><div class='ctx'> 			/*</div><div class='del'>-			 * ensure nobody is actually holding i_mutex</div><div class='add'>+			 * ensure nobody is actually holding i_rwsem</div><div class='ctx'> 			 */</div><div class='del'>-			// mutex_destroy(&amp;inode-&gt;i_mutex);</div><div class='ctx'> 			init_rwsem(&amp;inode-&gt;i_rwsem);</div><div class='ctx'> 			lockdep_set_class(&amp;inode-&gt;i_rwsem,</div><div class='ctx'> 					  &amp;type-&gt;i_mutex_dir_key);</div><div class='hunk'>@@ -1011,10 +1210,9 @@ void unlock_new_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	lockdep_annotate_inode_mutex_key(inode);</div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-	WARN_ON(!(inode-&gt;i_state &amp; I_NEW));</div><div class='del'>-	inode-&gt;i_state &amp;= ~I_NEW &amp; ~I_CREATING;</div><div class='del'>-	smp_mb();</div><div class='del'>-	wake_up_bit(&amp;inode-&gt;i_state, __I_NEW);</div><div class='add'>+	WARN_ON(!(inode_state_read(inode) &amp; I_NEW));</div><div class='add'>+	inode_state_clear(inode, I_NEW | I_CREATING);</div><div class='add'>+	inode_wake_up_bit(inode, __I_NEW);</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(unlock_new_inode);</div><div class='hunk'>@@ -1023,10 +1221,9 @@ void discard_new_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	lockdep_annotate_inode_mutex_key(inode);</div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-	WARN_ON(!(inode-&gt;i_state &amp; I_NEW));</div><div class='del'>-	inode-&gt;i_state &amp;= ~I_NEW;</div><div class='del'>-	smp_mb();</div><div class='del'>-	wake_up_bit(&amp;inode-&gt;i_state, __I_NEW);</div><div class='add'>+	WARN_ON(!(inode_state_read(inode) &amp; I_NEW));</div><div class='add'>+	inode_state_clear(inode, I_NEW);</div><div class='add'>+	inode_wake_up_bit(inode, __I_NEW);</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	iput(inode);</div><div class='ctx'> }</div><div class='hunk'>@@ -1035,7 +1232,7 @@ EXPORT_SYMBOL(discard_new_inode);</div><div class='ctx'> /**</div><div class='ctx'>  * lock_two_nondirectories - take two i_mutexes on non-directory objects</div><div class='ctx'>  *</div><div class='del'>- * Lock any non-NULL argument that is not a directory.</div><div class='add'>+ * Lock any non-NULL argument. Passed objects must not be directories.</div><div class='ctx'>  * Zero, one or two objects may be locked by this function.</div><div class='ctx'>  *</div><div class='ctx'>  * @inode1: first inode to lock</div><div class='hunk'>@@ -1043,12 +1240,15 @@ EXPORT_SYMBOL(discard_new_inode);</div><div class='ctx'>  */</div><div class='ctx'> void lock_two_nondirectories(struct inode *inode1, struct inode *inode2)</div><div class='ctx'> {</div><div class='add'>+	if (inode1)</div><div class='add'>+		WARN_ON_ONCE(S_ISDIR(inode1-&gt;i_mode));</div><div class='add'>+	if (inode2)</div><div class='add'>+		WARN_ON_ONCE(S_ISDIR(inode2-&gt;i_mode));</div><div class='ctx'> 	if (inode1 &gt; inode2)</div><div class='ctx'> 		swap(inode1, inode2);</div><div class='del'>-</div><div class='del'>-	if (inode1 &amp;&amp; !S_ISDIR(inode1-&gt;i_mode))</div><div class='add'>+	if (inode1)</div><div class='ctx'> 		inode_lock(inode1);</div><div class='del'>-	if (inode2 &amp;&amp; !S_ISDIR(inode2-&gt;i_mode) &amp;&amp; inode2 != inode1)</div><div class='add'>+	if (inode2 &amp;&amp; inode2 != inode1)</div><div class='ctx'> 		inode_lock_nested(inode2, I_MUTEX_NONDIR2);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(lock_two_nondirectories);</div><div class='hunk'>@@ -1060,10 +1260,14 @@ EXPORT_SYMBOL(lock_two_nondirectories);</div><div class='ctx'>  */</div><div class='ctx'> void unlock_two_nondirectories(struct inode *inode1, struct inode *inode2)</div><div class='ctx'> {</div><div class='del'>-	if (inode1 &amp;&amp; !S_ISDIR(inode1-&gt;i_mode))</div><div class='add'>+	if (inode1) {</div><div class='add'>+		WARN_ON_ONCE(S_ISDIR(inode1-&gt;i_mode));</div><div class='ctx'> 		inode_unlock(inode1);</div><div class='del'>-	if (inode2 &amp;&amp; !S_ISDIR(inode2-&gt;i_mode) &amp;&amp; inode2 != inode1)</div><div class='add'>+	}</div><div class='add'>+	if (inode2 &amp;&amp; inode2 != inode1) {</div><div class='add'>+		WARN_ON_ONCE(S_ISDIR(inode2-&gt;i_mode));</div><div class='ctx'> 		inode_unlock(inode2);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(unlock_two_nondirectories);</div><div class='ctx'> </div><div class='hunk'>@@ -1074,18 +1278,18 @@ EXPORT_SYMBOL(unlock_two_nondirectories);</div><div class='ctx'>  * @test:	callback used for comparisons between inodes</div><div class='ctx'>  * @set:	callback used to initialize a new struct inode</div><div class='ctx'>  * @data:	opaque data pointer to pass to @test and @set</div><div class='add'>+ * @isnew:	pointer to a bool which will indicate whether I_NEW is set</div><div class='ctx'>  *</div><div class='ctx'>  * Search for the inode specified by @hashval and @data in the inode cache,</div><div class='del'>- * and if present it is return it with an increased reference count. This is</div><div class='del'>- * a variant of iget5_locked() for callers that don't want to fail on memory</div><div class='del'>- * allocation of inode.</div><div class='add'>+ * and if present return it with an increased reference count. This is a</div><div class='add'>+ * variant of iget5_locked() that doesn't allocate an inode.</div><div class='ctx'>  *</div><div class='del'>- * If the inode is not in cache, insert the pre-allocated inode to cache and</div><div class='add'>+ * If the inode is not present in the cache, insert the pre-allocated inode and</div><div class='ctx'>  * return it locked, hashed, and with the I_NEW flag set. The file system gets</div><div class='ctx'>  * to fill it in before unlocking it via unlock_new_inode().</div><div class='ctx'>  *</div><div class='del'>- * Note both @test and @set are called with the inode_hash_lock held, so can't</div><div class='del'>- * sleep.</div><div class='add'>+ * Note that both @test and @set are called with the inode_hash_lock held, so</div><div class='add'>+ * they can't sleep.</div><div class='ctx'>  */</div><div class='ctx'> struct inode *inode_insert5(struct inode *inode, unsigned long hashval,</div><div class='ctx'> 			    int (*test)(struct inode *, void *),</div><div class='hunk'>@@ -1093,11 +1297,13 @@ struct inode *inode_insert5(struct inode *inode, unsigned long hashval,</div><div class='ctx'> {</div><div class='ctx'> 	struct hlist_head *head = inode_hashtable + hash(inode-&gt;i_sb, hashval);</div><div class='ctx'> 	struct inode *old;</div><div class='del'>-	bool creating = inode-&gt;i_state &amp; I_CREATING;</div><div class='add'>+	bool isnew;</div><div class='add'>+</div><div class='add'>+	might_sleep();</div><div class='ctx'> </div><div class='ctx'> again:</div><div class='ctx'> 	spin_lock(&amp;inode_hash_lock);</div><div class='del'>-	old = find_inode(inode-&gt;i_sb, head, test, data);</div><div class='add'>+	old = find_inode(inode-&gt;i_sb, head, test, data, true, &amp;isnew);</div><div class='ctx'> 	if (unlikely(old)) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Uhhuh, somebody else created the same inode under us.</div><div class='hunk'>@@ -1106,7 +1312,8 @@ again:</div><div class='ctx'> 		spin_unlock(&amp;inode_hash_lock);</div><div class='ctx'> 		if (IS_ERR(old))</div><div class='ctx'> 			return NULL;</div><div class='del'>-		wait_on_inode(old);</div><div class='add'>+		if (unlikely(isnew))</div><div class='add'>+			wait_on_new_inode(old);</div><div class='ctx'> 		if (unlikely(inode_unhashed(old))) {</div><div class='ctx'> 			iput(old);</div><div class='ctx'> 			goto again;</div><div class='hunk'>@@ -1115,8 +1322,8 @@ again:</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (set &amp;&amp; unlikely(set(inode, data))) {</div><div class='del'>-		inode = NULL;</div><div class='del'>-		goto unlock;</div><div class='add'>+		spin_unlock(&amp;inode_hash_lock);</div><div class='add'>+		return NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1124,14 +1331,19 @@ again:</div><div class='ctx'> 	 * caller is responsible for filling in the contents</div><div class='ctx'> 	 */</div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-	inode-&gt;i_state |= I_NEW;</div><div class='add'>+	inode_state_set(inode, I_NEW);</div><div class='ctx'> 	hlist_add_head_rcu(&amp;inode-&gt;i_hash, head);</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='del'>-	if (!creating)</div><div class='del'>-		inode_sb_list_add(inode);</div><div class='del'>-unlock:</div><div class='add'>+</div><div class='ctx'> 	spin_unlock(&amp;inode_hash_lock);</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Add inode to the sb list if it's not already. It has I_NEW at this</div><div class='add'>+	 * point, so it should be safe to test i_sb_list locklessly.</div><div class='add'>+	 */</div><div class='add'>+	if (list_empty(&amp;inode-&gt;i_sb_list))</div><div class='add'>+		inode_sb_list_add(inode);</div><div class='add'>+</div><div class='ctx'> 	return inode;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(inode_insert5);</div><div class='hunk'>@@ -1145,16 +1357,16 @@ EXPORT_SYMBOL(inode_insert5);</div><div class='ctx'>  * @data:	opaque data pointer to pass to @test and @set</div><div class='ctx'>  *</div><div class='ctx'>  * Search for the inode specified by @hashval and @data in the inode cache,</div><div class='del'>- * and if present it is return it with an increased reference count. This is</div><div class='del'>- * a generalized version of iget_locked() for file systems where the inode</div><div class='add'>+ * and if present return it with an increased reference count. This is a</div><div class='add'>+ * generalized version of iget_locked() for file systems where the inode</div><div class='ctx'>  * number is not sufficient for unique identification of an inode.</div><div class='ctx'>  *</div><div class='del'>- * If the inode is not in cache, allocate a new inode and return it locked,</div><div class='del'>- * hashed, and with the I_NEW flag set. The file system gets to fill it in</div><div class='del'>- * before unlocking it via unlock_new_inode().</div><div class='add'>+ * If the inode is not present in the cache, allocate and insert a new inode</div><div class='add'>+ * and return it locked, hashed, and with the I_NEW flag set. The file system</div><div class='add'>+ * gets to fill it in before unlocking it via unlock_new_inode().</div><div class='ctx'>  *</div><div class='del'>- * Note both @test and @set are called with the inode_hash_lock held, so can't</div><div class='del'>- * sleep.</div><div class='add'>+ * Note that both @test and @set are called with the inode_hash_lock held, so</div><div class='add'>+ * they can't sleep.</div><div class='ctx'>  */</div><div class='ctx'> struct inode *iget5_locked(struct super_block *sb, unsigned long hashval,</div><div class='ctx'> 		int (*test)(struct inode *, void *),</div><div class='hunk'>@@ -1166,7 +1378,6 @@ struct inode *iget5_locked(struct super_block *sb, unsigned long hashval,</div><div class='ctx'> 		struct inode *new = alloc_inode(sb);</div><div class='ctx'> </div><div class='ctx'> 		if (new) {</div><div class='del'>-			new-&gt;i_state = 0;</div><div class='ctx'> 			inode = inode_insert5(new, hashval, test, set, data);</div><div class='ctx'> 			if (unlikely(inode != new))</div><div class='ctx'> 				destroy_inode(new);</div><div class='hunk'>@@ -1177,6 +1388,51 @@ struct inode *iget5_locked(struct super_block *sb, unsigned long hashval,</div><div class='ctx'> EXPORT_SYMBOL(iget5_locked);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='add'>+ * iget5_locked_rcu - obtain an inode from a mounted file system</div><div class='add'>+ * @sb:		super block of file system</div><div class='add'>+ * @hashval:	hash value (usually inode number) to get</div><div class='add'>+ * @test:	callback used for comparisons between inodes</div><div class='add'>+ * @set:	callback used to initialize a new struct inode</div><div class='add'>+ * @data:	opaque data pointer to pass to @test and @set</div><div class='add'>+ *</div><div class='add'>+ * This is equivalent to iget5_locked, except the @test callback must</div><div class='add'>+ * tolerate the inode not being stable, including being mid-teardown.</div><div class='add'>+ */</div><div class='add'>+struct inode *iget5_locked_rcu(struct super_block *sb, unsigned long hashval,</div><div class='add'>+		int (*test)(struct inode *, void *),</div><div class='add'>+		int (*set)(struct inode *, void *), void *data)</div><div class='add'>+{</div><div class='add'>+	struct hlist_head *head = inode_hashtable + hash(sb, hashval);</div><div class='add'>+	struct inode *inode, *new;</div><div class='add'>+	bool isnew;</div><div class='add'>+</div><div class='add'>+	might_sleep();</div><div class='add'>+</div><div class='add'>+again:</div><div class='add'>+	inode = find_inode(sb, head, test, data, false, &amp;isnew);</div><div class='add'>+	if (inode) {</div><div class='add'>+		if (IS_ERR(inode))</div><div class='add'>+			return NULL;</div><div class='add'>+		if (unlikely(isnew))</div><div class='add'>+			wait_on_new_inode(inode);</div><div class='add'>+		if (unlikely(inode_unhashed(inode))) {</div><div class='add'>+			iput(inode);</div><div class='add'>+			goto again;</div><div class='add'>+		}</div><div class='add'>+		return inode;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	new = alloc_inode(sb);</div><div class='add'>+	if (new) {</div><div class='add'>+		inode = inode_insert5(new, hashval, test, set, data);</div><div class='add'>+		if (unlikely(inode != new))</div><div class='add'>+			destroy_inode(new);</div><div class='add'>+	}</div><div class='add'>+	return inode;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(iget5_locked_rcu);</div><div class='add'>+</div><div class='add'>+/**</div><div class='ctx'>  * iget_locked - obtain an inode from a mounted file system</div><div class='ctx'>  * @sb:		super block of file system</div><div class='ctx'>  * @ino:	inode number to get</div><div class='hunk'>@@ -1193,14 +1449,17 @@ struct inode *iget_locked(struct super_block *sb, unsigned long ino)</div><div class='ctx'> {</div><div class='ctx'> 	struct hlist_head *head = inode_hashtable + hash(sb, ino);</div><div class='ctx'> 	struct inode *inode;</div><div class='add'>+	bool isnew;</div><div class='add'>+</div><div class='add'>+	might_sleep();</div><div class='add'>+</div><div class='ctx'> again:</div><div class='del'>-	spin_lock(&amp;inode_hash_lock);</div><div class='del'>-	inode = find_inode_fast(sb, head, ino);</div><div class='del'>-	spin_unlock(&amp;inode_hash_lock);</div><div class='add'>+	inode = find_inode_fast(sb, head, ino, false, &amp;isnew);</div><div class='ctx'> 	if (inode) {</div><div class='ctx'> 		if (IS_ERR(inode))</div><div class='ctx'> 			return NULL;</div><div class='del'>-		wait_on_inode(inode);</div><div class='add'>+		if (unlikely(isnew))</div><div class='add'>+			wait_on_new_inode(inode);</div><div class='ctx'> 		if (unlikely(inode_unhashed(inode))) {</div><div class='ctx'> 			iput(inode);</div><div class='ctx'> 			goto again;</div><div class='hunk'>@@ -1214,15 +1473,15 @@ again:</div><div class='ctx'> </div><div class='ctx'> 		spin_lock(&amp;inode_hash_lock);</div><div class='ctx'> 		/* We released the lock, so.. */</div><div class='del'>-		old = find_inode_fast(sb, head, ino);</div><div class='add'>+		old = find_inode_fast(sb, head, ino, true, &amp;isnew);</div><div class='ctx'> 		if (!old) {</div><div class='ctx'> 			inode-&gt;i_ino = ino;</div><div class='ctx'> 			spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-			inode-&gt;i_state = I_NEW;</div><div class='add'>+			inode_state_assign(inode, I_NEW);</div><div class='ctx'> 			hlist_add_head_rcu(&amp;inode-&gt;i_hash, head);</div><div class='ctx'> 			spin_unlock(&amp;inode-&gt;i_lock);</div><div class='del'>-			inode_sb_list_add(inode);</div><div class='ctx'> 			spin_unlock(&amp;inode_hash_lock);</div><div class='add'>+			inode_sb_list_add(inode);</div><div class='ctx'> </div><div class='ctx'> 			/* Return the locked inode with I_NEW set, the</div><div class='ctx'> 			 * caller is responsible for filling in the contents</div><div class='hunk'>@@ -1240,7 +1499,8 @@ again:</div><div class='ctx'> 		if (IS_ERR(old))</div><div class='ctx'> 			return NULL;</div><div class='ctx'> 		inode = old;</div><div class='del'>-		wait_on_inode(inode);</div><div class='add'>+		if (unlikely(isnew))</div><div class='add'>+			wait_on_new_inode(inode);</div><div class='ctx'> 		if (unlikely(inode_unhashed(inode))) {</div><div class='ctx'> 			iput(inode);</div><div class='ctx'> 			goto again;</div><div class='hunk'>@@ -1311,7 +1571,7 @@ EXPORT_SYMBOL(iunique);</div><div class='ctx'> struct inode *igrab(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-	if (!(inode-&gt;i_state &amp; (I_FREEING|I_WILL_FREE))) {</div><div class='add'>+	if (!(inode_state_read(inode) &amp; (I_FREEING | I_WILL_FREE))) {</div><div class='ctx'> 		__iget(inode);</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -1344,13 +1604,13 @@ EXPORT_SYMBOL(igrab);</div><div class='ctx'>  * Note2: @test is called with the inode_hash_lock held, so can't sleep.</div><div class='ctx'>  */</div><div class='ctx'> struct inode *ilookup5_nowait(struct super_block *sb, unsigned long hashval,</div><div class='del'>-		int (*test)(struct inode *, void *), void *data)</div><div class='add'>+		int (*test)(struct inode *, void *), void *data, bool *isnew)</div><div class='ctx'> {</div><div class='ctx'> 	struct hlist_head *head = inode_hashtable + hash(sb, hashval);</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;inode_hash_lock);</div><div class='del'>-	inode = find_inode(sb, head, test, data);</div><div class='add'>+	inode = find_inode(sb, head, test, data, true, isnew);</div><div class='ctx'> 	spin_unlock(&amp;inode_hash_lock);</div><div class='ctx'> </div><div class='ctx'> 	return IS_ERR(inode) ? NULL : inode;</div><div class='hunk'>@@ -1378,10 +1638,15 @@ struct inode *ilookup5(struct super_block *sb, unsigned long hashval,</div><div class='ctx'> 		int (*test)(struct inode *, void *), void *data)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='add'>+	bool isnew;</div><div class='add'>+</div><div class='add'>+	might_sleep();</div><div class='add'>+</div><div class='ctx'> again:</div><div class='del'>-	inode = ilookup5_nowait(sb, hashval, test, data);</div><div class='add'>+	inode = ilookup5_nowait(sb, hashval, test, data, &amp;isnew);</div><div class='ctx'> 	if (inode) {</div><div class='del'>-		wait_on_inode(inode);</div><div class='add'>+		if (unlikely(isnew))</div><div class='add'>+			wait_on_new_inode(inode);</div><div class='ctx'> 		if (unlikely(inode_unhashed(inode))) {</div><div class='ctx'> 			iput(inode);</div><div class='ctx'> 			goto again;</div><div class='hunk'>@@ -1403,15 +1668,18 @@ struct inode *ilookup(struct super_block *sb, unsigned long ino)</div><div class='ctx'> {</div><div class='ctx'> 	struct hlist_head *head = inode_hashtable + hash(sb, ino);</div><div class='ctx'> 	struct inode *inode;</div><div class='add'>+	bool isnew;</div><div class='add'>+</div><div class='add'>+	might_sleep();</div><div class='add'>+</div><div class='ctx'> again:</div><div class='del'>-	spin_lock(&amp;inode_hash_lock);</div><div class='del'>-	inode = find_inode_fast(sb, head, ino);</div><div class='del'>-	spin_unlock(&amp;inode_hash_lock);</div><div class='add'>+	inode = find_inode_fast(sb, head, ino, false, &amp;isnew);</div><div class='ctx'> </div><div class='ctx'> 	if (inode) {</div><div class='ctx'> 		if (IS_ERR(inode))</div><div class='ctx'> 			return NULL;</div><div class='del'>-		wait_on_inode(inode);</div><div class='add'>+		if (unlikely(isnew))</div><div class='add'>+			wait_on_new_inode(inode);</div><div class='ctx'> 		if (unlikely(inode_unhashed(inode))) {</div><div class='ctx'> 			iput(inode);</div><div class='ctx'> 			goto again;</div><div class='hunk'>@@ -1503,7 +1771,7 @@ struct inode *find_inode_rcu(struct super_block *sb, unsigned long hashval,</div><div class='ctx'> </div><div class='ctx'> 	hlist_for_each_entry_rcu(inode, head, i_hash) {</div><div class='ctx'> 		if (inode-&gt;i_sb == sb &amp;&amp;</div><div class='del'>-		    !(READ_ONCE(inode-&gt;i_state) &amp; (I_FREEING | I_WILL_FREE)) &amp;&amp;</div><div class='add'>+		    !(inode_state_read_once(inode) &amp; (I_FREEING | I_WILL_FREE)) &amp;&amp;</div><div class='ctx'> 		    test(inode, data))</div><div class='ctx'> 			return inode;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1542,7 +1810,7 @@ struct inode *find_inode_by_ino_rcu(struct super_block *sb,</div><div class='ctx'> 	hlist_for_each_entry_rcu(inode, head, i_hash) {</div><div class='ctx'> 		if (inode-&gt;i_ino == ino &amp;&amp;</div><div class='ctx'> 		    inode-&gt;i_sb == sb &amp;&amp;</div><div class='del'>-		    !(READ_ONCE(inode-&gt;i_state) &amp; (I_FREEING | I_WILL_FREE)))</div><div class='add'>+		    !(inode_state_read_once(inode) &amp; (I_FREEING | I_WILL_FREE)))</div><div class='ctx'> 		    return inode;</div><div class='ctx'> 	}</div><div class='ctx'> 	return NULL;</div><div class='hunk'>@@ -1554,6 +1822,9 @@ int insert_inode_locked(struct inode *inode)</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	ino_t ino = inode-&gt;i_ino;</div><div class='ctx'> 	struct hlist_head *head = inode_hashtable + hash(sb, ino);</div><div class='add'>+	bool isnew;</div><div class='add'>+</div><div class='add'>+	might_sleep();</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='ctx'> 		struct inode *old = NULL;</div><div class='hunk'>@@ -1564,7 +1835,7 @@ int insert_inode_locked(struct inode *inode)</div><div class='ctx'> 			if (old-&gt;i_sb != sb)</div><div class='ctx'> 				continue;</div><div class='ctx'> 			spin_lock(&amp;old-&gt;i_lock);</div><div class='del'>-			if (old-&gt;i_state &amp; (I_FREEING|I_WILL_FREE)) {</div><div class='add'>+			if (inode_state_read(old) &amp; (I_FREEING | I_WILL_FREE)) {</div><div class='ctx'> 				spin_unlock(&amp;old-&gt;i_lock);</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -1572,21 +1843,23 @@ int insert_inode_locked(struct inode *inode)</div><div class='ctx'> 		}</div><div class='ctx'> 		if (likely(!old)) {</div><div class='ctx'> 			spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-			inode-&gt;i_state |= I_NEW | I_CREATING;</div><div class='add'>+			inode_state_set(inode, I_NEW | I_CREATING);</div><div class='ctx'> 			hlist_add_head_rcu(&amp;inode-&gt;i_hash, head);</div><div class='ctx'> 			spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 			spin_unlock(&amp;inode_hash_lock);</div><div class='ctx'> 			return 0;</div><div class='ctx'> 		}</div><div class='del'>-		if (unlikely(old-&gt;i_state &amp; I_CREATING)) {</div><div class='add'>+		if (unlikely(inode_state_read(old) &amp; I_CREATING)) {</div><div class='ctx'> 			spin_unlock(&amp;old-&gt;i_lock);</div><div class='ctx'> 			spin_unlock(&amp;inode_hash_lock);</div><div class='ctx'> 			return -EBUSY;</div><div class='ctx'> 		}</div><div class='ctx'> 		__iget(old);</div><div class='add'>+		isnew = !!(inode_state_read(old) &amp; I_NEW);</div><div class='ctx'> 		spin_unlock(&amp;old-&gt;i_lock);</div><div class='ctx'> 		spin_unlock(&amp;inode_hash_lock);</div><div class='del'>-		wait_on_inode(old);</div><div class='add'>+		if (isnew)</div><div class='add'>+			wait_on_new_inode(old);</div><div class='ctx'> 		if (unlikely(!inode_unhashed(old))) {</div><div class='ctx'> 			iput(old);</div><div class='ctx'> 			return -EBUSY;</div><div class='hunk'>@@ -1601,7 +1874,9 @@ int insert_inode_locked4(struct inode *inode, unsigned long hashval,</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *old;</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_state |= I_CREATING;</div><div class='add'>+	might_sleep();</div><div class='add'>+</div><div class='add'>+	inode_state_set_raw(inode, I_CREATING);</div><div class='ctx'> 	old = inode_insert5(inode, hashval, test, NULL, data);</div><div class='ctx'> </div><div class='ctx'> 	if (old != inode) {</div><div class='hunk'>@@ -1613,11 +1888,11 @@ int insert_inode_locked4(struct inode *inode, unsigned long hashval,</div><div class='ctx'> EXPORT_SYMBOL(insert_inode_locked4);</div><div class='ctx'> </div><div class='ctx'> </div><div class='del'>-int generic_delete_inode(struct inode *inode)</div><div class='add'>+int inode_just_drop(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	return 1;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(generic_delete_inode);</div><div class='add'>+EXPORT_SYMBOL(inode_just_drop);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Called when we're dropping the last reference</div><div class='hunk'>@@ -1633,40 +1908,44 @@ static void iput_final(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='ctx'> 	const struct super_operations *op = inode-&gt;i_sb-&gt;s_op;</div><div class='del'>-	unsigned long state;</div><div class='ctx'> 	int drop;</div><div class='ctx'> </div><div class='del'>-	WARN_ON(inode-&gt;i_state &amp; I_NEW);</div><div class='add'>+	WARN_ON(inode_state_read(inode) &amp; I_NEW);</div><div class='add'>+	VFS_BUG_ON_INODE(atomic_read(&amp;inode-&gt;i_count) != 0, inode);</div><div class='ctx'> </div><div class='ctx'> 	if (op-&gt;drop_inode)</div><div class='ctx'> 		drop = op-&gt;drop_inode(inode);</div><div class='ctx'> 	else</div><div class='del'>-		drop = generic_drop_inode(inode);</div><div class='add'>+		drop = inode_generic_drop(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (!drop &amp;&amp;</div><div class='del'>-	    !(inode-&gt;i_state &amp; I_DONTCACHE) &amp;&amp;</div><div class='add'>+	    !(inode_state_read(inode) &amp; I_DONTCACHE) &amp;&amp;</div><div class='ctx'> 	    (sb-&gt;s_flags &amp; SB_ACTIVE)) {</div><div class='del'>-		__inode_add_lru(inode, true);</div><div class='add'>+		__inode_lru_list_add(inode, true);</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	state = inode-&gt;i_state;</div><div class='del'>-	if (!drop) {</div><div class='del'>-		WRITE_ONCE(inode-&gt;i_state, state | I_WILL_FREE);</div><div class='add'>+	/*</div><div class='add'>+	 * Re-check -&gt;i_count in case the -&gt;drop_inode() hooks played games.</div><div class='add'>+	 * Note we only execute this if the verdict was to drop the inode.</div><div class='add'>+	 */</div><div class='add'>+	VFS_BUG_ON_INODE(atomic_read(&amp;inode-&gt;i_count) != 0, inode);</div><div class='add'>+</div><div class='add'>+	if (drop) {</div><div class='add'>+		inode_state_set(inode, I_FREEING);</div><div class='add'>+	} else {</div><div class='add'>+		inode_state_set(inode, I_WILL_FREE);</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> </div><div class='ctx'> 		write_inode_now(inode, 1);</div><div class='ctx'> </div><div class='ctx'> 		spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-		state = inode-&gt;i_state;</div><div class='del'>-		WARN_ON(state &amp; I_NEW);</div><div class='del'>-		state &amp;= ~I_WILL_FREE;</div><div class='add'>+		WARN_ON(inode_state_read(inode) &amp; I_NEW);</div><div class='add'>+		inode_state_replace(inode, I_WILL_FREE, I_FREEING);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	WRITE_ONCE(inode-&gt;i_state, state | I_FREEING);</div><div class='del'>-	if (!list_empty(&amp;inode-&gt;i_lru))</div><div class='del'>-		inode_lru_list_del(inode);</div><div class='add'>+	inode_lru_list_del(inode);</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> </div><div class='ctx'> 	evict(inode);</div><div class='hunk'>@@ -1683,23 +1962,61 @@ static void iput_final(struct inode *inode)</div><div class='ctx'>  */</div><div class='ctx'> void iput(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	if (!inode)</div><div class='add'>+	might_sleep();</div><div class='add'>+	if (unlikely(!inode))</div><div class='ctx'> 		return;</div><div class='del'>-	BUG_ON(inode-&gt;i_state &amp; I_CLEAR);</div><div class='add'>+</div><div class='ctx'> retry:</div><div class='del'>-	if (atomic_dec_and_lock(&amp;inode-&gt;i_count, &amp;inode-&gt;i_lock)) {</div><div class='del'>-		if (inode-&gt;i_nlink &amp;&amp; (inode-&gt;i_state &amp; I_DIRTY_TIME)) {</div><div class='del'>-			atomic_inc(&amp;inode-&gt;i_count);</div><div class='del'>-			spin_unlock(&amp;inode-&gt;i_lock);</div><div class='del'>-			trace_writeback_lazytime_iput(inode);</div><div class='del'>-			mark_inode_dirty_sync(inode);</div><div class='del'>-			goto retry;</div><div class='del'>-		}</div><div class='del'>-		iput_final(inode);</div><div class='add'>+	lockdep_assert_not_held(&amp;inode-&gt;i_lock);</div><div class='add'>+	VFS_BUG_ON_INODE(inode_state_read_once(inode) &amp; (I_FREEING | I_CLEAR), inode);</div><div class='add'>+	/*</div><div class='add'>+	 * Note this assert is technically racy as if the count is bogusly</div><div class='add'>+	 * equal to one, then two CPUs racing to further drop it can both</div><div class='add'>+	 * conclude it's fine.</div><div class='add'>+	 */</div><div class='add'>+	VFS_BUG_ON_INODE(atomic_read(&amp;inode-&gt;i_count) &lt; 1, inode);</div><div class='add'>+</div><div class='add'>+	if (atomic_add_unless(&amp;inode-&gt;i_count, -1, 1))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if ((inode_state_read_once(inode) &amp; I_DIRTY_TIME) &amp;&amp; inode-&gt;i_nlink) {</div><div class='add'>+		trace_writeback_lazytime_iput(inode);</div><div class='add'>+		mark_inode_dirty_sync(inode);</div><div class='add'>+		goto retry;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+	if (unlikely((inode_state_read(inode) &amp; I_DIRTY_TIME) &amp;&amp; inode-&gt;i_nlink)) {</div><div class='add'>+		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+		goto retry;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!atomic_dec_and_test(&amp;inode-&gt;i_count)) {</div><div class='add'>+		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * iput_final() drops -&gt;i_lock, we can't assert on it as the inode may</div><div class='add'>+	 * be deallocated by the time the call returns.</div><div class='add'>+	 */</div><div class='add'>+	iput_final(inode);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(iput);</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ *	iput_not_last	- put an inode assuming this is not the last reference</div><div class='add'>+ *	@inode: inode to put</div><div class='add'>+ */</div><div class='add'>+void iput_not_last(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	VFS_BUG_ON_INODE(inode_state_read_once(inode) &amp; (I_FREEING | I_CLEAR), inode);</div><div class='add'>+	VFS_BUG_ON_INODE(atomic_read(&amp;inode-&gt;i_count) &lt; 2, inode);</div><div class='add'>+</div><div class='add'>+	WARN_ON(atomic_sub_return(1, &amp;inode-&gt;i_count) == 0);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(iput_not_last);</div><div class='add'>+</div><div class='ctx'> #ifdef CONFIG_BLOCK</div><div class='ctx'> /**</div><div class='ctx'>  *	bmap	- find a block number in a file</div><div class='hunk'>@@ -1728,61 +2045,115 @@ EXPORT_SYMBOL(bmap);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * With relative atime, only update atime if the previous atime is</div><div class='del'>- * earlier than either the ctime or mtime or if at least a day has</div><div class='del'>- * passed since the last atime update.</div><div class='add'>+ * earlier than or equal to either the ctime or mtime,</div><div class='add'>+ * or if at least a day has passed since the last atime update.</div><div class='ctx'>  */</div><div class='del'>-static int relatime_need_update(struct vfsmount *mnt, struct inode *inode,</div><div class='add'>+static bool relatime_need_update(struct vfsmount *mnt, struct inode *inode,</div><div class='ctx'> 			     struct timespec64 now)</div><div class='ctx'> {</div><div class='add'>+	struct timespec64 atime, mtime, ctime;</div><div class='ctx'> </div><div class='ctx'> 	if (!(mnt-&gt;mnt_flags &amp; MNT_RELATIME))</div><div class='del'>-		return 1;</div><div class='add'>+		return true;</div><div class='ctx'> 	/*</div><div class='del'>-	 * Is mtime younger than atime? If yes, update atime:</div><div class='add'>+	 * Is mtime younger than or equal to atime? If yes, update atime:</div><div class='ctx'> 	 */</div><div class='del'>-	if (timespec64_compare(&amp;inode-&gt;i_mtime, &amp;inode-&gt;i_atime) &gt;= 0)</div><div class='del'>-		return 1;</div><div class='add'>+	atime = inode_get_atime(inode);</div><div class='add'>+	mtime = inode_get_mtime(inode);</div><div class='add'>+	if (timespec64_compare(&amp;mtime, &amp;atime) &gt;= 0)</div><div class='add'>+		return true;</div><div class='ctx'> 	/*</div><div class='del'>-	 * Is ctime younger than atime? If yes, update atime:</div><div class='add'>+	 * Is ctime younger than or equal to atime? If yes, update atime:</div><div class='ctx'> 	 */</div><div class='del'>-	if (timespec64_compare(&amp;inode-&gt;i_ctime, &amp;inode-&gt;i_atime) &gt;= 0)</div><div class='del'>-		return 1;</div><div class='add'>+	ctime = inode_get_ctime(inode);</div><div class='add'>+	if (timespec64_compare(&amp;ctime, &amp;atime) &gt;= 0)</div><div class='add'>+		return true;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Is the previous atime value older than a day? If yes,</div><div class='ctx'> 	 * update atime:</div><div class='ctx'> 	 */</div><div class='del'>-	if ((long)(now.tv_sec - inode-&gt;i_atime.tv_sec) &gt;= 24*60*60)</div><div class='del'>-		return 1;</div><div class='add'>+	if ((long)(now.tv_sec - atime.tv_sec) &gt;= 24*60*60)</div><div class='add'>+		return true;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Good, we can skip the atime update:</div><div class='ctx'> 	 */</div><div class='del'>-	return 0;</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int generic_update_time(struct inode *inode, struct timespec64 *time, int flags)</div><div class='add'>+/**</div><div class='add'>+ * inode_update_timestamps - update the timestamps on the inode</div><div class='add'>+ * @inode: inode to be updated</div><div class='add'>+ * @flags: S_* flags that needed to be updated</div><div class='add'>+ *</div><div class='add'>+ * The update_time function is called when an inode's timestamps need to be</div><div class='add'>+ * updated for a read or write operation. This function handles updating the</div><div class='add'>+ * actual timestamps. It's up to the caller to ensure that the inode is marked</div><div class='add'>+ * dirty appropriately.</div><div class='add'>+ *</div><div class='add'>+ * In the case where any of S_MTIME, S_CTIME, or S_VERSION need to be updated,</div><div class='add'>+ * attempt to update all three of them. S_ATIME updates can be handled</div><div class='add'>+ * independently of the rest.</div><div class='add'>+ *</div><div class='add'>+ * Returns a set of S_* flags indicating which values changed.</div><div class='add'>+ */</div><div class='add'>+int inode_update_timestamps(struct inode *inode, int flags)</div><div class='ctx'> {</div><div class='del'>-	int dirty_flags = 0;</div><div class='add'>+	int updated = 0;</div><div class='add'>+	struct timespec64 now;</div><div class='ctx'> </div><div class='del'>-	if (flags &amp; (S_ATIME | S_CTIME | S_MTIME)) {</div><div class='del'>-		if (flags &amp; S_ATIME)</div><div class='del'>-			inode-&gt;i_atime = *time;</div><div class='del'>-		if (flags &amp; S_CTIME)</div><div class='del'>-			inode-&gt;i_ctime = *time;</div><div class='del'>-		if (flags &amp; S_MTIME)</div><div class='del'>-			inode-&gt;i_mtime = *time;</div><div class='del'>-</div><div class='del'>-		if (inode-&gt;i_sb-&gt;s_flags &amp; SB_LAZYTIME)</div><div class='del'>-			dirty_flags |= I_DIRTY_TIME;</div><div class='del'>-		else</div><div class='del'>-			dirty_flags |= I_DIRTY_SYNC;</div><div class='add'>+	if (flags &amp; (S_MTIME|S_CTIME|S_VERSION)) {</div><div class='add'>+		struct timespec64 ctime = inode_get_ctime(inode);</div><div class='add'>+		struct timespec64 mtime = inode_get_mtime(inode);</div><div class='add'>+</div><div class='add'>+		now = inode_set_ctime_current(inode);</div><div class='add'>+		if (!timespec64_equal(&amp;now, &amp;ctime))</div><div class='add'>+			updated |= S_CTIME;</div><div class='add'>+		if (!timespec64_equal(&amp;now, &amp;mtime)) {</div><div class='add'>+			inode_set_mtime_to_ts(inode, now);</div><div class='add'>+			updated |= S_MTIME;</div><div class='add'>+		}</div><div class='add'>+		if (IS_I_VERSION(inode) &amp;&amp; inode_maybe_inc_iversion(inode, updated))</div><div class='add'>+			updated |= S_VERSION;</div><div class='add'>+	} else {</div><div class='add'>+		now = current_time(inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if ((flags &amp; S_VERSION) &amp;&amp; inode_maybe_inc_iversion(inode, false))</div><div class='del'>-		dirty_flags |= I_DIRTY_SYNC;</div><div class='add'>+	if (flags &amp; S_ATIME) {</div><div class='add'>+		struct timespec64 atime = inode_get_atime(inode);</div><div class='add'>+</div><div class='add'>+		if (!timespec64_equal(&amp;now, &amp;atime)) {</div><div class='add'>+			inode_set_atime_to_ts(inode, now);</div><div class='add'>+			updated |= S_ATIME;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	return updated;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(inode_update_timestamps);</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * generic_update_time - update the timestamps on the inode</div><div class='add'>+ * @inode: inode to be updated</div><div class='add'>+ * @flags: S_* flags that needed to be updated</div><div class='add'>+ *</div><div class='add'>+ * The update_time function is called when an inode's timestamps need to be</div><div class='add'>+ * updated for a read or write operation. In the case where any of S_MTIME, S_CTIME,</div><div class='add'>+ * or S_VERSION need to be updated we attempt to update all three of them. S_ATIME</div><div class='add'>+ * updates can be handled done independently of the rest.</div><div class='add'>+ *</div><div class='add'>+ * Returns a S_* mask indicating which fields were updated.</div><div class='add'>+ */</div><div class='add'>+int generic_update_time(struct inode *inode, int flags)</div><div class='add'>+{</div><div class='add'>+	int updated = inode_update_timestamps(inode, flags);</div><div class='add'>+	int dirty_flags = 0;</div><div class='add'>+</div><div class='add'>+	if (updated &amp; (S_ATIME|S_MTIME|S_CTIME))</div><div class='add'>+		dirty_flags = inode-&gt;i_sb-&gt;s_flags &amp; SB_LAZYTIME ? I_DIRTY_TIME : I_DIRTY_SYNC;</div><div class='add'>+	if (updated &amp; S_VERSION)</div><div class='add'>+		dirty_flags |= I_DIRTY_SYNC;</div><div class='ctx'> 	__mark_inode_dirty(inode, dirty_flags);</div><div class='del'>-	return 0;</div><div class='add'>+	return updated;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(generic_update_time);</div><div class='ctx'> </div><div class='hunk'>@@ -1790,11 +2161,12 @@ EXPORT_SYMBOL(generic_update_time);</div><div class='ctx'>  * This does the actual work of updating an inodes time or version.  Must have</div><div class='ctx'>  * had called mnt_want_write() before calling this.</div><div class='ctx'>  */</div><div class='del'>-int inode_update_time(struct inode *inode, struct timespec64 *time, int flags)</div><div class='add'>+int inode_update_time(struct inode *inode, int flags)</div><div class='ctx'> {</div><div class='ctx'> 	if (inode-&gt;i_op-&gt;update_time)</div><div class='del'>-		return inode-&gt;i_op-&gt;update_time(inode, time, flags);</div><div class='del'>-	return generic_update_time(inode, time, flags);</div><div class='add'>+		return inode-&gt;i_op-&gt;update_time(inode, flags);</div><div class='add'>+	generic_update_time(inode, flags);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(inode_update_time);</div><div class='ctx'> </div><div class='hunk'>@@ -1810,7 +2182,7 @@ EXPORT_SYMBOL(inode_update_time);</div><div class='ctx'> bool atime_needs_update(const struct path *path, struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct vfsmount *mnt = path-&gt;mnt;</div><div class='del'>-	struct timespec64 now;</div><div class='add'>+	struct timespec64 now, atime;</div><div class='ctx'> </div><div class='ctx'> 	if (inode-&gt;i_flags &amp; S_NOATIME)</div><div class='ctx'> 		return false;</div><div class='hunk'>@@ -1818,7 +2190,7 @@ bool atime_needs_update(const struct path *path, struct inode *inode)</div><div class='ctx'> 	/* Atime updates will likely cause i_uid and i_gid to be written</div><div class='ctx'> 	 * back improprely if their true value is unknown to the vfs.</div><div class='ctx'> 	 */</div><div class='del'>-	if (HAS_UNMAPPED_ID(mnt_user_ns(mnt), inode))</div><div class='add'>+	if (HAS_UNMAPPED_ID(mnt_idmap(mnt), inode))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='ctx'> 	if (IS_NOATIME(inode))</div><div class='hunk'>@@ -1836,7 +2208,8 @@ bool atime_needs_update(const struct path *path, struct inode *inode)</div><div class='ctx'> 	if (!relatime_need_update(mnt, inode, now))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	if (timespec64_equal(&amp;inode-&gt;i_atime, &amp;now))</div><div class='add'>+	atime = inode_get_atime(inode);</div><div class='add'>+	if (timespec64_equal(&amp;atime, &amp;now))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='ctx'> 	return true;</div><div class='hunk'>@@ -1846,7 +2219,6 @@ void touch_atime(const struct path *path)</div><div class='ctx'> {</div><div class='ctx'> 	struct vfsmount *mnt = path-&gt;mnt;</div><div class='ctx'> 	struct inode *inode = d_inode(path-&gt;dentry);</div><div class='del'>-	struct timespec64 now;</div><div class='ctx'> </div><div class='ctx'> 	if (!atime_needs_update(path, inode))</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -1854,7 +2226,7 @@ void touch_atime(const struct path *path)</div><div class='ctx'> 	if (!sb_start_write_trylock(inode-&gt;i_sb))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	if (__mnt_want_write(mnt) != 0)</div><div class='add'>+	if (mnt_get_write_access(mnt) != 0)</div><div class='ctx'> 		goto skip_update;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * File systems can error out when updating inodes if they need to</div><div class='hunk'>@@ -1865,49 +2237,20 @@ void touch_atime(const struct path *path)</div><div class='ctx'> 	 * We may also fail on filesystems that have the ability to make parts</div><div class='ctx'> 	 * of the fs read only, e.g. subvolumes in Btrfs.</div><div class='ctx'> 	 */</div><div class='del'>-	now = current_time(inode);</div><div class='del'>-	inode_update_time(inode, &amp;now, S_ATIME);</div><div class='del'>-	__mnt_drop_write(mnt);</div><div class='add'>+	inode_update_time(inode, S_ATIME);</div><div class='add'>+	mnt_put_write_access(mnt);</div><div class='ctx'> skip_update:</div><div class='ctx'> 	sb_end_write(inode-&gt;i_sb);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(touch_atime);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * The logic we want is</div><div class='del'>- *</div><div class='del'>- *	if suid or (sgid and xgrp)</div><div class='del'>- *		remove privs</div><div class='del'>- */</div><div class='del'>-int should_remove_suid(struct dentry *dentry)</div><div class='del'>-{</div><div class='del'>-	umode_t mode = d_inode(dentry)-&gt;i_mode;</div><div class='del'>-	int kill = 0;</div><div class='del'>-</div><div class='del'>-	/* suid always must be killed */</div><div class='del'>-	if (unlikely(mode &amp; S_ISUID))</div><div class='del'>-		kill = ATTR_KILL_SUID;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * sgid without any exec bits is just a mandatory locking mark; leave</div><div class='del'>-	 * it alone.  If some exec bits are set, it's a real sgid; kill it.</div><div class='del'>-	 */</div><div class='del'>-	if (unlikely((mode &amp; S_ISGID) &amp;&amp; (mode &amp; S_IXGRP)))</div><div class='del'>-		kill |= ATTR_KILL_SGID;</div><div class='del'>-</div><div class='del'>-	if (unlikely(kill &amp;&amp; !capable(CAP_FSETID) &amp;&amp; S_ISREG(mode)))</div><div class='del'>-		return kill;</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(should_remove_suid);</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * Return mask of changes for notify_change() that need to be done as a</div><div class='ctx'>  * response to write or truncate. Return 0 if nothing has to be changed.</div><div class='ctx'>  * Negative value on error (change should be denied).</div><div class='ctx'>  */</div><div class='del'>-int dentry_needs_remove_privs(struct dentry *dentry)</div><div class='add'>+int dentry_needs_remove_privs(struct mnt_idmap *idmap,</div><div class='add'>+			      struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	int mask = 0;</div><div class='hunk'>@@ -1916,7 +2259,7 @@ int dentry_needs_remove_privs(struct dentry *dentry)</div><div class='ctx'> 	if (IS_NOSEC(inode))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	mask = should_remove_suid(dentry);</div><div class='add'>+	mask = setattr_should_drop_suidgid(idmap, inode);</div><div class='ctx'> 	ret = security_inode_need_killpriv(dentry);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -1925,7 +2268,7 @@ int dentry_needs_remove_privs(struct dentry *dentry)</div><div class='ctx'> 	return mask;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __remove_privs(struct user_namespace *mnt_userns,</div><div class='add'>+static int __remove_privs(struct mnt_idmap *idmap,</div><div class='ctx'> 			  struct dentry *dentry, int kill)</div><div class='ctx'> {</div><div class='ctx'> 	struct iattr newattrs;</div><div class='hunk'>@@ -1935,109 +2278,208 @@ static int __remove_privs(struct user_namespace *mnt_userns,</div><div class='ctx'> 	 * Note we call this on write, so notify_change will not</div><div class='ctx'> 	 * encounter any conflicting delegations:</div><div class='ctx'> 	 */</div><div class='del'>-	return notify_change(mnt_userns, dentry, &amp;newattrs, NULL);</div><div class='add'>+	return notify_change(idmap, dentry, &amp;newattrs, NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Remove special file priviledges (suid, capabilities) when file is written</div><div class='del'>- * to or truncated.</div><div class='del'>- */</div><div class='del'>-int file_remove_privs(struct file *file)</div><div class='add'>+static int file_remove_privs_flags(struct file *file, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dentry = file_dentry(file);</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='del'>-	int kill;</div><div class='ctx'> 	int error = 0;</div><div class='add'>+	int kill;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Fast path for nothing security related.</div><div class='del'>-	 * As well for non-regular files, e.g. blkdev inodes.</div><div class='del'>-	 * For example, blkdev_write_iter() might get here</div><div class='del'>-	 * trying to remove privs which it is not allowed to.</div><div class='del'>-	 */</div><div class='ctx'> 	if (IS_NOSEC(inode) || !S_ISREG(inode-&gt;i_mode))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	kill = dentry_needs_remove_privs(dentry);</div><div class='add'>+	kill = dentry_needs_remove_privs(file_mnt_idmap(file), dentry);</div><div class='ctx'> 	if (kill &lt; 0)</div><div class='ctx'> 		return kill;</div><div class='del'>-	if (kill)</div><div class='del'>-		error = __remove_privs(file_mnt_user_ns(file), dentry, kill);</div><div class='add'>+</div><div class='add'>+	if (kill) {</div><div class='add'>+		if (flags &amp; IOCB_NOWAIT)</div><div class='add'>+			return -EAGAIN;</div><div class='add'>+</div><div class='add'>+		error = __remove_privs(file_mnt_idmap(file), dentry, kill);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (!error)</div><div class='ctx'> 		inode_has_no_xattr(inode);</div><div class='del'>-</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * file_remove_privs - remove special file privileges (suid, capabilities)</div><div class='add'>+ * @file: file to remove privileges from</div><div class='add'>+ *</div><div class='add'>+ * When file is modified by a write or truncation ensure that special</div><div class='add'>+ * file privileges are removed.</div><div class='add'>+ *</div><div class='add'>+ * Return: 0 on success, negative errno on failure.</div><div class='add'>+ */</div><div class='add'>+int file_remove_privs(struct file *file)</div><div class='add'>+{</div><div class='add'>+	return file_remove_privs_flags(file, 0);</div><div class='add'>+}</div><div class='ctx'> EXPORT_SYMBOL(file_remove_privs);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- *	file_update_time	-	update mtime and ctime time</div><div class='del'>- *	@file: file accessed</div><div class='add'>+ * current_time - Return FS time (possibly fine-grained)</div><div class='add'>+ * @inode: inode.</div><div class='add'>+ *</div><div class='add'>+ * Return the current time truncated to the time granularity supported by</div><div class='add'>+ * the fs, as suitable for a ctime/mtime change. If the ctime is flagged</div><div class='add'>+ * as having been QUERIED, get a fine-grained timestamp, but don't update</div><div class='add'>+ * the floor.</div><div class='ctx'>  *</div><div class='del'>- *	Update the mtime and ctime members of an inode and mark the inode</div><div class='del'>- *	for writeback.  Note that this function is meant exclusively for</div><div class='del'>- *	usage in the file write path of filesystems, and filesystems may</div><div class='del'>- *	choose to explicitly ignore update via this function with the</div><div class='del'>- *	S_NOCMTIME inode flag, e.g. for network filesystem where these</div><div class='del'>- *	timestamps are handled by the server.  This can return an error for</div><div class='del'>- *	file systems who need to allocate space in order to update an inode.</div><div class='add'>+ * For a multigrain inode, this is effectively an estimate of the timestamp</div><div class='add'>+ * that a file would receive. An actual update must go through</div><div class='add'>+ * inode_set_ctime_current().</div><div class='ctx'>  */</div><div class='add'>+struct timespec64 current_time(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct timespec64 now;</div><div class='add'>+	u32 cns;</div><div class='ctx'> </div><div class='del'>-int file_update_time(struct file *file)</div><div class='add'>+	ktime_get_coarse_real_ts64_mg(&amp;now);</div><div class='add'>+</div><div class='add'>+	if (!is_mgtime(inode))</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	/* If nothing has queried it, then coarse time is fine */</div><div class='add'>+	cns = smp_load_acquire(&amp;inode-&gt;i_ctime_nsec);</div><div class='add'>+	if (cns &amp; I_CTIME_QUERIED) {</div><div class='add'>+		/*</div><div class='add'>+		 * If there is no apparent change, then get a fine-grained</div><div class='add'>+		 * timestamp.</div><div class='add'>+		 */</div><div class='add'>+		if (now.tv_nsec == (cns &amp; ~I_CTIME_QUERIED))</div><div class='add'>+			ktime_get_real_ts64(&amp;now);</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='add'>+	return timestamp_truncate(now, inode);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(current_time);</div><div class='add'>+</div><div class='add'>+static int file_update_time_flags(struct file *file, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='del'>-	struct timespec64 now;</div><div class='del'>-	int sync_it = 0;</div><div class='del'>-	int ret;</div><div class='add'>+	struct timespec64 now, ts;</div><div class='add'>+	int sync_mode = 0;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	/* First try to exhaust all avenues to not sync */</div><div class='ctx'> 	if (IS_NOCMTIME(inode))</div><div class='ctx'> 		return 0;</div><div class='add'>+	if (unlikely(file-&gt;f_mode &amp; FMODE_NOCMTIME))</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> 	now = current_time(inode);</div><div class='del'>-	if (!timespec64_equal(&amp;inode-&gt;i_mtime, &amp;now))</div><div class='del'>-		sync_it = S_MTIME;</div><div class='del'>-</div><div class='del'>-	if (!timespec64_equal(&amp;inode-&gt;i_ctime, &amp;now))</div><div class='del'>-		sync_it |= S_CTIME;</div><div class='ctx'> </div><div class='add'>+	ts = inode_get_mtime(inode);</div><div class='add'>+	if (!timespec64_equal(&amp;ts, &amp;now))</div><div class='add'>+		sync_mode |= S_MTIME;</div><div class='add'>+	ts = inode_get_ctime(inode);</div><div class='add'>+	if (!timespec64_equal(&amp;ts, &amp;now))</div><div class='add'>+		sync_mode |= S_CTIME;</div><div class='ctx'> 	if (IS_I_VERSION(inode) &amp;&amp; inode_iversion_need_inc(inode))</div><div class='del'>-		sync_it |= S_VERSION;</div><div class='del'>-</div><div class='del'>-	if (!sync_it)</div><div class='del'>-		return 0;</div><div class='add'>+		sync_mode |= S_VERSION;</div><div class='ctx'> </div><div class='del'>-	/* Finally allowed to write? Takes lock. */</div><div class='del'>-	if (__mnt_want_write_file(file))</div><div class='add'>+	if (!sync_mode)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	ret = inode_update_time(inode, &amp;now, sync_it);</div><div class='del'>-	__mnt_drop_write_file(file);</div><div class='add'>+	if (flags &amp; IOCB_NOWAIT)</div><div class='add'>+		return -EAGAIN;</div><div class='ctx'> </div><div class='add'>+	if (mnt_get_write_access_file(file))</div><div class='add'>+		return 0;</div><div class='add'>+	ret = inode_update_time(inode, sync_mode);</div><div class='add'>+	mnt_put_write_access_file(file);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * file_update_time - update mtime and ctime time</div><div class='add'>+ * @file: file accessed</div><div class='add'>+ *</div><div class='add'>+ * Update the mtime and ctime members of an inode and mark the inode for</div><div class='add'>+ * writeback. Note that this function is meant exclusively for usage in</div><div class='add'>+ * the file write path of filesystems, and filesystems may choose to</div><div class='add'>+ * explicitly ignore updates via this function with the _NOCMTIME inode</div><div class='add'>+ * flag, e.g. for network filesystem where these imestamps are handled</div><div class='add'>+ * by the server. This can return an error for file systems who need to</div><div class='add'>+ * allocate space in order to update an inode.</div><div class='add'>+ *</div><div class='add'>+ * Return: 0 on success, negative errno on failure.</div><div class='add'>+ */</div><div class='add'>+int file_update_time(struct file *file)</div><div class='add'>+{</div><div class='add'>+	return file_update_time_flags(file, 0);</div><div class='add'>+}</div><div class='ctx'> EXPORT_SYMBOL(file_update_time);</div><div class='ctx'> </div><div class='del'>-/* Caller must hold the file's inode lock */</div><div class='del'>-int file_modified(struct file *file)</div><div class='add'>+/**</div><div class='add'>+ * file_modified_flags - handle mandated vfs changes when modifying a file</div><div class='add'>+ * @file: file that was modified</div><div class='add'>+ * @flags: kiocb flags</div><div class='add'>+ *</div><div class='add'>+ * When file has been modified ensure that special</div><div class='add'>+ * file privileges are removed and time settings are updated.</div><div class='add'>+ *</div><div class='add'>+ * If IOCB_NOWAIT is set, special file privileges will not be removed and</div><div class='add'>+ * time settings will not be updated. It will return -EAGAIN.</div><div class='add'>+ *</div><div class='add'>+ * Context: Caller must hold the file's inode lock.</div><div class='add'>+ *</div><div class='add'>+ * Return: 0 on success, negative errno on failure.</div><div class='add'>+ */</div><div class='add'>+static int file_modified_flags(struct file *file, int flags)</div><div class='ctx'> {</div><div class='del'>-	int err;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Clear the security bits if the process is not being run by root.</div><div class='ctx'> 	 * This keeps people from modifying setuid and setgid binaries.</div><div class='ctx'> 	 */</div><div class='del'>-	err = file_remove_privs(file);</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='del'>-</div><div class='del'>-	if (unlikely(file-&gt;f_mode &amp; FMODE_NOCMTIME))</div><div class='del'>-		return 0;</div><div class='add'>+	ret = file_remove_privs_flags(file, flags);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+	return file_update_time_flags(file, flags);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	return file_update_time(file);</div><div class='add'>+/**</div><div class='add'>+ * file_modified - handle mandated vfs changes when modifying a file</div><div class='add'>+ * @file: file that was modified</div><div class='add'>+ *</div><div class='add'>+ * When file has been modified ensure that special</div><div class='add'>+ * file privileges are removed and time settings are updated.</div><div class='add'>+ *</div><div class='add'>+ * Context: Caller must hold the file's inode lock.</div><div class='add'>+ *</div><div class='add'>+ * Return: 0 on success, negative errno on failure.</div><div class='add'>+ */</div><div class='add'>+int file_modified(struct file *file)</div><div class='add'>+{</div><div class='add'>+	return file_modified_flags(file, 0);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(file_modified);</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * kiocb_modified - handle mandated vfs changes when modifying a file</div><div class='add'>+ * @iocb: iocb that was modified</div><div class='add'>+ *</div><div class='add'>+ * When file has been modified ensure that special</div><div class='add'>+ * file privileges are removed and time settings are updated.</div><div class='add'>+ *</div><div class='add'>+ * Context: Caller must hold the file's inode lock.</div><div class='add'>+ *</div><div class='add'>+ * Return: 0 on success, negative errno on failure.</div><div class='add'>+ */</div><div class='add'>+int kiocb_modified(struct kiocb *iocb)</div><div class='add'>+{</div><div class='add'>+	return file_modified_flags(iocb-&gt;ki_filp, iocb-&gt;ki_flags);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(kiocb_modified);</div><div class='add'>+</div><div class='ctx'> int inode_needs_sync(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	if (IS_SYNC(inode))</div><div class='hunk'>@@ -2059,17 +2501,31 @@ EXPORT_SYMBOL(inode_needs_sync);</div><div class='ctx'>  * wake_up_bit(&amp;inode-&gt;i_state, __I_NEW) after removing from the hash list</div><div class='ctx'>  * will DTRT.</div><div class='ctx'>  */</div><div class='del'>-static void __wait_on_freeing_inode(struct inode *inode)</div><div class='add'>+static void __wait_on_freeing_inode(struct inode *inode, bool is_inode_hash_locked)</div><div class='ctx'> {</div><div class='del'>-	wait_queue_head_t *wq;</div><div class='del'>-	DEFINE_WAIT_BIT(wait, &amp;inode-&gt;i_state, __I_NEW);</div><div class='del'>-	wq = bit_waitqueue(&amp;inode-&gt;i_state, __I_NEW);</div><div class='del'>-	prepare_to_wait(wq, &amp;wait.wq_entry, TASK_UNINTERRUPTIBLE);</div><div class='add'>+	struct wait_bit_queue_entry wqe;</div><div class='add'>+	struct wait_queue_head *wq_head;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Handle racing against evict(), see that routine for more details.</div><div class='add'>+	 */</div><div class='add'>+	if (unlikely(inode_unhashed(inode))) {</div><div class='add'>+		WARN_ON(is_inode_hash_locked);</div><div class='add'>+		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	wq_head = inode_bit_waitqueue(&amp;wqe, inode, __I_NEW);</div><div class='add'>+	prepare_to_wait_event(wq_head, &amp;wqe.wq_entry, TASK_UNINTERRUPTIBLE);</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='del'>-	spin_unlock(&amp;inode_hash_lock);</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+	if (is_inode_hash_locked)</div><div class='add'>+		spin_unlock(&amp;inode_hash_lock);</div><div class='ctx'> 	schedule();</div><div class='del'>-	finish_wait(wq, &amp;wait.wq_entry);</div><div class='del'>-	spin_lock(&amp;inode_hash_lock);</div><div class='add'>+	finish_wait(wq_head, &amp;wqe.wq_entry);</div><div class='add'>+	if (is_inode_hash_locked)</div><div class='add'>+		spin_lock(&amp;inode_hash_lock);</div><div class='add'>+	rcu_read_lock();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __initdata unsigned long ihash_entries;</div><div class='hunk'>@@ -2112,7 +2568,7 @@ void __init inode_init(void)</div><div class='ctx'> 					 sizeof(struct inode),</div><div class='ctx'> 					 0,</div><div class='ctx'> 					 (SLAB_RECLAIM_ACCOUNT|SLAB_PANIC|</div><div class='del'>-					 SLAB_MEM_SPREAD|SLAB_ACCOUNT),</div><div class='add'>+					 SLAB_ACCOUNT),</div><div class='ctx'> 					 init_once);</div><div class='ctx'> </div><div class='ctx'> 	/* Hash may have been set up in inode_init_early */</div><div class='hunk'>@@ -2134,82 +2590,86 @@ void __init inode_init(void)</div><div class='ctx'> void init_special_inode(struct inode *inode, umode_t mode, dev_t rdev)</div><div class='ctx'> {</div><div class='ctx'> 	inode-&gt;i_mode = mode;</div><div class='del'>-	if (S_ISCHR(mode)) {</div><div class='add'>+	switch (inode-&gt;i_mode &amp; S_IFMT) {</div><div class='add'>+	case S_IFCHR:</div><div class='ctx'> 		inode-&gt;i_fop = &amp;def_chr_fops;</div><div class='ctx'> 		inode-&gt;i_rdev = rdev;</div><div class='del'>-	} else if (S_ISBLK(mode)) {</div><div class='del'>-		inode-&gt;i_fop = &amp;def_blk_fops;</div><div class='add'>+		break;</div><div class='add'>+	case S_IFBLK:</div><div class='add'>+		if (IS_ENABLED(CONFIG_BLOCK))</div><div class='add'>+			inode-&gt;i_fop = &amp;def_blk_fops;</div><div class='ctx'> 		inode-&gt;i_rdev = rdev;</div><div class='del'>-	} else if (S_ISFIFO(mode))</div><div class='add'>+		break;</div><div class='add'>+	case S_IFIFO:</div><div class='ctx'> 		inode-&gt;i_fop = &amp;pipefifo_fops;</div><div class='del'>-	else if (S_ISSOCK(mode))</div><div class='del'>-		;	/* leave it no_open_fops */</div><div class='del'>-	else</div><div class='add'>+		break;</div><div class='add'>+	case S_IFSOCK:</div><div class='add'>+		/* leave it no_open_fops */</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='ctx'> 		printk(KERN_DEBUG "init_special_inode: bogus i_mode (%o) for"</div><div class='ctx'> 				  " inode %s:%lu\n", mode, inode-&gt;i_sb-&gt;s_id,</div><div class='ctx'> 				  inode-&gt;i_ino);</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(init_special_inode);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * inode_init_owner - Init uid,gid,mode for new inode according to posix standards</div><div class='del'>- * @mnt_userns:	User namespace of the mount the inode was created from</div><div class='add'>+ * @idmap: idmap of the mount the inode was created from</div><div class='ctx'>  * @inode: New inode</div><div class='ctx'>  * @dir: Directory inode</div><div class='ctx'>  * @mode: mode of the new inode</div><div class='ctx'>  *</div><div class='del'>- * If the inode has been created through an idmapped mount the user namespace of</div><div class='del'>- * the vfsmount must be passed through @mnt_userns. This function will then take</div><div class='del'>- * care to map the inode according to @mnt_userns before checking permissions</div><div class='add'>+ * If the inode has been created through an idmapped mount the idmap of</div><div class='add'>+ * the vfsmount must be passed through @idmap. This function will then take</div><div class='add'>+ * care to map the inode according to @idmap before checking permissions</div><div class='ctx'>  * and initializing i_uid and i_gid. On non-idmapped mounts or if permission</div><div class='del'>- * checking is to be performed on the raw inode simply passs init_user_ns.</div><div class='add'>+ * checking is to be performed on the raw inode simply pass @nop_mnt_idmap.</div><div class='ctx'>  */</div><div class='del'>-void inode_init_owner(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='add'>+void inode_init_owner(struct mnt_idmap *idmap, struct inode *inode,</div><div class='ctx'> 		      const struct inode *dir, umode_t mode)</div><div class='ctx'> {</div><div class='del'>-	inode_fsuid_set(inode, mnt_userns);</div><div class='add'>+	inode_fsuid_set(inode, idmap);</div><div class='ctx'> 	if (dir &amp;&amp; dir-&gt;i_mode &amp; S_ISGID) {</div><div class='ctx'> 		inode-&gt;i_gid = dir-&gt;i_gid;</div><div class='ctx'> </div><div class='ctx'> 		/* Directories are special, and always inherit S_ISGID */</div><div class='ctx'> 		if (S_ISDIR(mode))</div><div class='ctx'> 			mode |= S_ISGID;</div><div class='del'>-		else if ((mode &amp; (S_ISGID | S_IXGRP)) == (S_ISGID | S_IXGRP) &amp;&amp;</div><div class='del'>-			 !in_group_p(i_gid_into_mnt(mnt_userns, dir)) &amp;&amp;</div><div class='del'>-			 !capable_wrt_inode_uidgid(mnt_userns, dir, CAP_FSETID))</div><div class='del'>-			mode &amp;= ~S_ISGID;</div><div class='ctx'> 	} else</div><div class='del'>-		inode_fsgid_set(inode, mnt_userns);</div><div class='add'>+		inode_fsgid_set(inode, idmap);</div><div class='ctx'> 	inode-&gt;i_mode = mode;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(inode_init_owner);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * inode_owner_or_capable - check current task permissions to inode</div><div class='del'>- * @mnt_userns:	user namespace of the mount the inode was found from</div><div class='add'>+ * @idmap: idmap of the mount the inode was found from</div><div class='ctx'>  * @inode: inode being checked</div><div class='ctx'>  *</div><div class='ctx'>  * Return true if current either has CAP_FOWNER in a namespace with the</div><div class='ctx'>  * inode owner uid mapped, or owns the file.</div><div class='ctx'>  *</div><div class='del'>- * If the inode has been found through an idmapped mount the user namespace of</div><div class='del'>- * the vfsmount must be passed through @mnt_userns. This function will then take</div><div class='del'>- * care to map the inode according to @mnt_userns before checking permissions.</div><div class='add'>+ * If the inode has been found through an idmapped mount the idmap of</div><div class='add'>+ * the vfsmount must be passed through @idmap. This function will then take</div><div class='add'>+ * care to map the inode according to @idmap before checking permissions.</div><div class='ctx'>  * On non-idmapped mounts or if permission checking is to be performed on the</div><div class='del'>- * raw inode simply passs init_user_ns.</div><div class='add'>+ * raw inode simply pass @nop_mnt_idmap.</div><div class='ctx'>  */</div><div class='del'>-bool inode_owner_or_capable(struct user_namespace *mnt_userns,</div><div class='add'>+bool inode_owner_or_capable(struct mnt_idmap *idmap,</div><div class='ctx'> 			    const struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	kuid_t i_uid;</div><div class='add'>+	vfsuid_t vfsuid;</div><div class='ctx'> 	struct user_namespace *ns;</div><div class='ctx'> </div><div class='del'>-	i_uid = i_uid_into_mnt(mnt_userns, inode);</div><div class='del'>-	if (uid_eq(current_fsuid(), i_uid))</div><div class='add'>+	vfsuid = i_uid_into_vfsuid(idmap, inode);</div><div class='add'>+	if (vfsuid_eq_kuid(vfsuid, current_fsuid()))</div><div class='ctx'> 		return true;</div><div class='ctx'> </div><div class='ctx'> 	ns = current_user_ns();</div><div class='del'>-	if (kuid_has_mapping(ns, i_uid) &amp;&amp; ns_capable(ns, CAP_FOWNER))</div><div class='add'>+	if (vfsuid_has_mapping(ns, vfsuid) &amp;&amp; ns_capable(ns, CAP_FOWNER))</div><div class='ctx'> 		return true;</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='hunk'>@@ -2218,18 +2678,11 @@ EXPORT_SYMBOL(inode_owner_or_capable);</div><div class='ctx'> /*</div><div class='ctx'>  * Direct i/o helper functions</div><div class='ctx'>  */</div><div class='del'>-static void __inode_dio_wait(struct inode *inode)</div><div class='add'>+bool inode_dio_finished(const struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	wait_queue_head_t *wq = bit_waitqueue(&amp;inode-&gt;i_state, __I_DIO_WAKEUP);</div><div class='del'>-	DEFINE_WAIT_BIT(q, &amp;inode-&gt;i_state, __I_DIO_WAKEUP);</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		prepare_to_wait(wq, &amp;q.wq_entry, TASK_UNINTERRUPTIBLE);</div><div class='del'>-		if (atomic_read(&amp;inode-&gt;i_dio_count))</div><div class='del'>-			schedule();</div><div class='del'>-	} while (atomic_read(&amp;inode-&gt;i_dio_count));</div><div class='del'>-	finish_wait(wq, &amp;q.wq_entry);</div><div class='add'>+	return atomic_read(&amp;inode-&gt;i_dio_count) == 0;</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL(inode_dio_finished);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * inode_dio_wait - wait for outstanding DIO requests to finish</div><div class='hunk'>@@ -2239,19 +2692,25 @@ static void __inode_dio_wait(struct inode *inode)</div><div class='ctx'>  * proceed with a truncate or equivalent operation.</div><div class='ctx'>  *</div><div class='ctx'>  * Must be called under a lock that serializes taking new references</div><div class='del'>- * to i_dio_count, usually by inode-&gt;i_mutex.</div><div class='add'>+ * to i_dio_count, usually by inode-&gt;i_rwsem.</div><div class='ctx'>  */</div><div class='ctx'> void inode_dio_wait(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	if (atomic_read(&amp;inode-&gt;i_dio_count))</div><div class='del'>-		__inode_dio_wait(inode);</div><div class='add'>+	wait_var_event(&amp;inode-&gt;i_dio_count, inode_dio_finished(inode));</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(inode_dio_wait);</div><div class='ctx'> </div><div class='add'>+void inode_dio_wait_interruptible(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	wait_var_event_interruptible(&amp;inode-&gt;i_dio_count,</div><div class='add'>+				     inode_dio_finished(inode));</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(inode_dio_wait_interruptible);</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * inode_set_flags - atomically set some inode flags</div><div class='ctx'>  *</div><div class='del'>- * Note: the caller should be holding i_mutex, or else be sure that</div><div class='add'>+ * Note: the caller should be holding i_rwsem exclusively, or else be sure that</div><div class='ctx'>  * they have exclusive access to the inode structure (i.e., while the</div><div class='ctx'>  * inode is being instantiated).  The reason for the cmpxchg() loop</div><div class='ctx'>  * --- which wouldn't be necessary if all code paths which modify</div><div class='hunk'>@@ -2259,7 +2718,7 @@ EXPORT_SYMBOL(inode_dio_wait);</div><div class='ctx'>  * code path which doesn't today so we use cmpxchg() out of an abundance</div><div class='ctx'>  * of caution.</div><div class='ctx'>  *</div><div class='del'>- * In the long run, i_mutex is overkill, and we should probably look</div><div class='add'>+ * In the long run, i_rwsem is overkill, and we should probably look</div><div class='ctx'>  * at using the i_lock spinlock to protect i_flags, and then make sure</div><div class='ctx'>  * it is so documented in include/linux/fs.h and that all code follows</div><div class='ctx'>  * the locking convention!!</div><div class='hunk'>@@ -2278,6 +2737,16 @@ void inode_nohighmem(struct inode *inode)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(inode_nohighmem);</div><div class='ctx'> </div><div class='add'>+struct timespec64 inode_set_ctime_to_ts(struct inode *inode, struct timespec64 ts)</div><div class='add'>+{</div><div class='add'>+	trace_inode_set_ctime_to_ts(inode, &amp;ts);</div><div class='add'>+	set_normalized_timespec64(&amp;ts, ts.tv_sec, ts.tv_nsec);</div><div class='add'>+	inode-&gt;i_ctime_sec = ts.tv_sec;</div><div class='add'>+	inode-&gt;i_ctime_nsec = ts.tv_nsec;</div><div class='add'>+	return ts;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(inode_set_ctime_to_ts);</div><div class='add'>+</div><div class='ctx'> /**</div><div class='ctx'>  * timestamp_truncate - Truncate timespec to a granularity</div><div class='ctx'>  * @t: Timespec</div><div class='hunk'>@@ -2310,26 +2779,229 @@ struct timespec64 timestamp_truncate(struct timespec64 t, struct inode *inode)</div><div class='ctx'> EXPORT_SYMBOL(timestamp_truncate);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * current_time - Return FS time</div><div class='del'>- * @inode: inode.</div><div class='add'>+ * inode_set_ctime_current - set the ctime to current_time</div><div class='add'>+ * @inode: inode</div><div class='ctx'>  *</div><div class='del'>- * Return the current time truncated to the time granularity supported by</div><div class='del'>- * the fs.</div><div class='add'>+ * Set the inode's ctime to the current value for the inode. Returns the</div><div class='add'>+ * current value that was assigned. If this is not a multigrain inode, then we</div><div class='add'>+ * set it to the later of the coarse time and floor value.</div><div class='add'>+ *</div><div class='add'>+ * If it is multigrain, then we first see if the coarse-grained timestamp is</div><div class='add'>+ * distinct from what is already there. If so, then use that. Otherwise, get a</div><div class='add'>+ * fine-grained timestamp.</div><div class='ctx'>  *</div><div class='del'>- * Note that inode and inode-&gt;sb cannot be NULL.</div><div class='del'>- * Otherwise, the function warns and returns time without truncation.</div><div class='add'>+ * After that, try to swap the new value into i_ctime_nsec. Accept the</div><div class='add'>+ * resulting ctime, regardless of the outcome of the swap. If it has</div><div class='add'>+ * already been replaced, then that timestamp is later than the earlier</div><div class='add'>+ * unacceptable one, and is thus acceptable.</div><div class='ctx'>  */</div><div class='del'>-struct timespec64 current_time(struct inode *inode)</div><div class='add'>+struct timespec64 inode_set_ctime_current(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct timespec64 now;</div><div class='add'>+	u32 cns, cur;</div><div class='ctx'> </div><div class='del'>-	ktime_get_coarse_real_ts64(&amp;now);</div><div class='add'>+	ktime_get_coarse_real_ts64_mg(&amp;now);</div><div class='add'>+	now = timestamp_truncate(now, inode);</div><div class='ctx'> </div><div class='del'>-	if (unlikely(!inode-&gt;i_sb)) {</div><div class='del'>-		WARN(1, "current_time() called with uninitialized super_block in the inode");</div><div class='del'>-		return now;</div><div class='add'>+	/* Just return that if this is not a multigrain fs */</div><div class='add'>+	if (!is_mgtime(inode)) {</div><div class='add'>+		inode_set_ctime_to_ts(inode, now);</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return timestamp_truncate(now, inode);</div><div class='add'>+	/*</div><div class='add'>+	 * A fine-grained time is only needed if someone has queried</div><div class='add'>+	 * for timestamps, and the current coarse grained time isn't</div><div class='add'>+	 * later than what's already there.</div><div class='add'>+	 */</div><div class='add'>+	cns = smp_load_acquire(&amp;inode-&gt;i_ctime_nsec);</div><div class='add'>+	if (cns &amp; I_CTIME_QUERIED) {</div><div class='add'>+		struct timespec64 ctime = { .tv_sec = inode-&gt;i_ctime_sec,</div><div class='add'>+					    .tv_nsec = cns &amp; ~I_CTIME_QUERIED };</div><div class='add'>+</div><div class='add'>+		if (timespec64_compare(&amp;now, &amp;ctime) &lt;= 0) {</div><div class='add'>+			ktime_get_real_ts64_mg(&amp;now);</div><div class='add'>+			now = timestamp_truncate(now, inode);</div><div class='add'>+			mgtime_counter_inc(mg_fine_stamps);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	mgtime_counter_inc(mg_ctime_updates);</div><div class='add'>+</div><div class='add'>+	/* No need to cmpxchg if it's exactly the same */</div><div class='add'>+	if (cns == now.tv_nsec &amp;&amp; inode-&gt;i_ctime_sec == now.tv_sec) {</div><div class='add'>+		trace_ctime_xchg_skip(inode, &amp;now);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	cur = cns;</div><div class='add'>+retry:</div><div class='add'>+	/* Try to swap the nsec value into place. */</div><div class='add'>+	if (try_cmpxchg(&amp;inode-&gt;i_ctime_nsec, &amp;cur, now.tv_nsec)) {</div><div class='add'>+		/* If swap occurred, then we're (mostly) done */</div><div class='add'>+		inode-&gt;i_ctime_sec = now.tv_sec;</div><div class='add'>+		trace_ctime_ns_xchg(inode, cns, now.tv_nsec, cur);</div><div class='add'>+		mgtime_counter_inc(mg_ctime_swaps);</div><div class='add'>+	} else {</div><div class='add'>+		/*</div><div class='add'>+		 * Was the change due to someone marking the old ctime QUERIED?</div><div class='add'>+		 * If so then retry the swap. This can only happen once since</div><div class='add'>+		 * the only way to clear I_CTIME_QUERIED is to stamp the inode</div><div class='add'>+		 * with a new ctime.</div><div class='add'>+		 */</div><div class='add'>+		if (!(cns &amp; I_CTIME_QUERIED) &amp;&amp; (cns | I_CTIME_QUERIED) == cur) {</div><div class='add'>+			cns = cur;</div><div class='add'>+			goto retry;</div><div class='add'>+		}</div><div class='add'>+		/* Otherwise, keep the existing ctime */</div><div class='add'>+		now.tv_sec = inode-&gt;i_ctime_sec;</div><div class='add'>+		now.tv_nsec = cur &amp; ~I_CTIME_QUERIED;</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='add'>+	return now;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(current_time);</div><div class='add'>+EXPORT_SYMBOL(inode_set_ctime_current);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * inode_set_ctime_deleg - try to update the ctime on a delegated inode</div><div class='add'>+ * @inode: inode to update</div><div class='add'>+ * @update: timespec64 to set the ctime</div><div class='add'>+ *</div><div class='add'>+ * Attempt to atomically update the ctime on behalf of a delegation holder.</div><div class='add'>+ *</div><div class='add'>+ * The nfs server can call back the holder of a delegation to get updated</div><div class='add'>+ * inode attributes, including the mtime. When updating the mtime, update</div><div class='add'>+ * the ctime to a value at least equal to that.</div><div class='add'>+ *</div><div class='add'>+ * This can race with concurrent updates to the inode, in which</div><div class='add'>+ * case the update is skipped.</div><div class='add'>+ *</div><div class='add'>+ * Note that this works even when multigrain timestamps are not enabled,</div><div class='add'>+ * so it is used in either case.</div><div class='add'>+ */</div><div class='add'>+struct timespec64 inode_set_ctime_deleg(struct inode *inode, struct timespec64 update)</div><div class='add'>+{</div><div class='add'>+	struct timespec64 now, cur_ts;</div><div class='add'>+	u32 cur, old;</div><div class='add'>+</div><div class='add'>+	/* pairs with try_cmpxchg below */</div><div class='add'>+	cur = smp_load_acquire(&amp;inode-&gt;i_ctime_nsec);</div><div class='add'>+	cur_ts.tv_nsec = cur &amp; ~I_CTIME_QUERIED;</div><div class='add'>+	cur_ts.tv_sec = inode-&gt;i_ctime_sec;</div><div class='add'>+</div><div class='add'>+	/* If the update is older than the existing value, skip it. */</div><div class='add'>+	if (timespec64_compare(&amp;update, &amp;cur_ts) &lt;= 0)</div><div class='add'>+		return cur_ts;</div><div class='add'>+</div><div class='add'>+	ktime_get_coarse_real_ts64_mg(&amp;now);</div><div class='add'>+</div><div class='add'>+	/* Clamp the update to "now" if it's in the future */</div><div class='add'>+	if (timespec64_compare(&amp;update, &amp;now) &gt; 0)</div><div class='add'>+		update = now;</div><div class='add'>+</div><div class='add'>+	update = timestamp_truncate(update, inode);</div><div class='add'>+</div><div class='add'>+	/* No need to update if the values are already the same */</div><div class='add'>+	if (timespec64_equal(&amp;update, &amp;cur_ts))</div><div class='add'>+		return cur_ts;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Try to swap the nsec value into place. If it fails, that means</div><div class='add'>+	 * it raced with an update due to a write or similar activity. That</div><div class='add'>+	 * stamp takes precedence, so just skip the update.</div><div class='add'>+	 */</div><div class='add'>+retry:</div><div class='add'>+	old = cur;</div><div class='add'>+	if (try_cmpxchg(&amp;inode-&gt;i_ctime_nsec, &amp;cur, update.tv_nsec)) {</div><div class='add'>+		inode-&gt;i_ctime_sec = update.tv_sec;</div><div class='add'>+		mgtime_counter_inc(mg_ctime_swaps);</div><div class='add'>+		return update;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Was the change due to another task marking the old ctime QUERIED?</div><div class='add'>+	 *</div><div class='add'>+	 * If so, then retry the swap. This can only happen once since</div><div class='add'>+	 * the only way to clear I_CTIME_QUERIED is to stamp the inode</div><div class='add'>+	 * with a new ctime.</div><div class='add'>+	 */</div><div class='add'>+	if (!(old &amp; I_CTIME_QUERIED) &amp;&amp; (cur == (old | I_CTIME_QUERIED)))</div><div class='add'>+		goto retry;</div><div class='add'>+</div><div class='add'>+	/* Otherwise, it was a new timestamp. */</div><div class='add'>+	cur_ts.tv_sec = inode-&gt;i_ctime_sec;</div><div class='add'>+	cur_ts.tv_nsec = cur &amp; ~I_CTIME_QUERIED;</div><div class='add'>+	return cur_ts;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(inode_set_ctime_deleg);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * in_group_or_capable - check whether caller is CAP_FSETID privileged</div><div class='add'>+ * @idmap:	idmap of the mount @inode was found from</div><div class='add'>+ * @inode:	inode to check</div><div class='add'>+ * @vfsgid:	the new/current vfsgid of @inode</div><div class='add'>+ *</div><div class='add'>+ * Check whether @vfsgid is in the caller's group list or if the caller is</div><div class='add'>+ * privileged with CAP_FSETID over @inode. This can be used to determine</div><div class='add'>+ * whether the setgid bit can be kept or must be dropped.</div><div class='add'>+ *</div><div class='add'>+ * Return: true if the caller is sufficiently privileged, false if not.</div><div class='add'>+ */</div><div class='add'>+bool in_group_or_capable(struct mnt_idmap *idmap,</div><div class='add'>+			 const struct inode *inode, vfsgid_t vfsgid)</div><div class='add'>+{</div><div class='add'>+	if (vfsgid_in_group_p(vfsgid))</div><div class='add'>+		return true;</div><div class='add'>+	if (capable_wrt_inode_uidgid(idmap, inode, CAP_FSETID))</div><div class='add'>+		return true;</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(in_group_or_capable);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * mode_strip_sgid - handle the sgid bit for non-directories</div><div class='add'>+ * @idmap: idmap of the mount the inode was created from</div><div class='add'>+ * @dir: parent directory inode</div><div class='add'>+ * @mode: mode of the file to be created in @dir</div><div class='add'>+ *</div><div class='add'>+ * If the @mode of the new file has both the S_ISGID and S_IXGRP bit</div><div class='add'>+ * raised and @dir has the S_ISGID bit raised ensure that the caller is</div><div class='add'>+ * either in the group of the parent directory or they have CAP_FSETID</div><div class='add'>+ * in their user namespace and are privileged over the parent directory.</div><div class='add'>+ * In all other cases, strip the S_ISGID bit from @mode.</div><div class='add'>+ *</div><div class='add'>+ * Return: the new mode to use for the file</div><div class='add'>+ */</div><div class='add'>+umode_t mode_strip_sgid(struct mnt_idmap *idmap,</div><div class='add'>+			const struct inode *dir, umode_t mode)</div><div class='add'>+{</div><div class='add'>+	if ((mode &amp; (S_ISGID | S_IXGRP)) != (S_ISGID | S_IXGRP))</div><div class='add'>+		return mode;</div><div class='add'>+	if (S_ISDIR(mode) || !dir || !(dir-&gt;i_mode &amp; S_ISGID))</div><div class='add'>+		return mode;</div><div class='add'>+	if (in_group_or_capable(idmap, dir, i_gid_into_vfsgid(idmap, dir)))</div><div class='add'>+		return mode;</div><div class='add'>+	return mode &amp; ~S_ISGID;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(mode_strip_sgid);</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_DEBUG_VFS</div><div class='add'>+/*</div><div class='add'>+ * Dump an inode.</div><div class='add'>+ *</div><div class='add'>+ * TODO: add a proper inode dumping routine, this is a stub to get debug off the</div><div class='add'>+ * ground.</div><div class='add'>+ *</div><div class='add'>+ * TODO: handle getting to fs type with get_kernel_nofault()?</div><div class='add'>+ * See dump_mapping() above.</div><div class='add'>+ */</div><div class='add'>+void dump_inode(struct inode *inode, const char *reason)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = inode-&gt;i_sb;</div><div class='add'>+</div><div class='add'>+	pr_warn("%s encountered for inode %px\n"</div><div class='add'>+		"fs %s mode %ho opflags 0x%hx flags 0x%x state 0x%x count %d\n",</div><div class='add'>+		reason, inode, sb-&gt;s_type-&gt;name, inode-&gt;i_mode, inode-&gt;i_opflags,</div><div class='add'>+		inode-&gt;i_flags, inode_state_read_once(inode), atomic_read(&amp;inode-&gt;i_count));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+EXPORT_SYMBOL(dump_inode);</div><div class='add'>+#endif</div><div class='head'>diff --git a/fs/internal.h b/fs/internal.h<br/>index 7979ff8d168c..ab638d41ab81 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/internal.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/internal.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/internal.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/internal.h</a></div><div class='hunk'>@@ -14,30 +14,26 @@ struct path;</div><div class='ctx'> struct mount;</div><div class='ctx'> struct shrink_control;</div><div class='ctx'> struct fs_context;</div><div class='del'>-struct user_namespace;</div><div class='ctx'> struct pipe_inode_info;</div><div class='add'>+struct iov_iter;</div><div class='add'>+struct mnt_idmap;</div><div class='add'>+struct ns_common;</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * block/bdev.c</div><div class='ctx'>  */</div><div class='ctx'> #ifdef CONFIG_BLOCK</div><div class='ctx'> extern void __init bdev_cache_init(void);</div><div class='del'>-</div><div class='del'>-void emergency_thaw_bdev(struct super_block *sb);</div><div class='ctx'> #else</div><div class='ctx'> static inline void bdev_cache_init(void)</div><div class='ctx'> {</div><div class='ctx'> }</div><div class='del'>-static inline int emergency_thaw_bdev(struct super_block *sb)</div><div class='del'>-{</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='ctx'> #endif /* CONFIG_BLOCK */</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * buffer.c</div><div class='ctx'>  */</div><div class='del'>-int __block_write_begin_int(struct page *page, loff_t pos, unsigned len,</div><div class='add'>+int __block_write_begin_int(struct folio *folio, loff_t pos, unsigned len,</div><div class='ctx'> 		get_block_t *get_block, const struct iomap *iomap);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -57,37 +53,45 @@ extern int finish_clean_context(struct fs_context *fc);</div><div class='ctx'>  * namei.c</div><div class='ctx'>  */</div><div class='ctx'> extern int filename_lookup(int dfd, struct filename *name, unsigned flags,</div><div class='del'>-			   struct path *path, struct path *root);</div><div class='del'>-extern int vfs_path_lookup(struct dentry *, struct vfsmount *,</div><div class='del'>-			   const char *, unsigned int, struct path *);</div><div class='add'>+			   struct path *path, const struct path *root);</div><div class='ctx'> int do_rmdir(int dfd, struct filename *name);</div><div class='ctx'> int do_unlinkat(int dfd, struct filename *name);</div><div class='del'>-int may_linkat(struct user_namespace *mnt_userns, struct path *link);</div><div class='add'>+int may_linkat(struct mnt_idmap *idmap, const struct path *link);</div><div class='ctx'> int do_renameat2(int olddfd, struct filename *oldname, int newdfd,</div><div class='ctx'> 		 struct filename *newname, unsigned int flags);</div><div class='ctx'> int do_mkdirat(int dfd, struct filename *name, umode_t mode);</div><div class='ctx'> int do_symlinkat(struct filename *from, int newdfd, struct filename *to);</div><div class='ctx'> int do_linkat(int olddfd, struct filename *old, int newdfd,</div><div class='ctx'> 			struct filename *new, int flags);</div><div class='add'>+int vfs_tmpfile(struct mnt_idmap *idmap,</div><div class='add'>+		const struct path *parentpath,</div><div class='add'>+		struct file *file, umode_t mode);</div><div class='add'>+struct dentry *d_hash_and_lookup(struct dentry *, struct qstr *);</div><div class='add'>+struct dentry *start_dirop(struct dentry *parent, struct qstr *name,</div><div class='add'>+			   unsigned int lookup_flags);</div><div class='add'>+int lookup_noperm_common(struct qstr *qname, struct dentry *base);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * namespace.c</div><div class='ctx'>  */</div><div class='ctx'> extern struct vfsmount *lookup_mnt(const struct path *);</div><div class='del'>-extern int finish_automount(struct vfsmount *, struct path *);</div><div class='add'>+extern int finish_automount(struct vfsmount *, const struct path *);</div><div class='ctx'> </div><div class='ctx'> extern int sb_prepare_remount_readonly(struct super_block *);</div><div class='ctx'> </div><div class='ctx'> extern void __init mnt_init(void);</div><div class='ctx'> </div><div class='del'>-extern int __mnt_want_write_file(struct file *);</div><div class='del'>-extern void __mnt_drop_write_file(struct file *);</div><div class='add'>+int mnt_get_write_access_file(struct file *file);</div><div class='add'>+void mnt_put_write_access_file(struct file *file);</div><div class='ctx'> </div><div class='ctx'> extern void dissolve_on_fput(struct vfsmount *);</div><div class='add'>+extern bool may_mount(void);</div><div class='ctx'> </div><div class='del'>-int path_mount(const char *dev_name, struct path *path,</div><div class='add'>+int path_mount(const char *dev_name, const struct path *path,</div><div class='ctx'> 		const char *type_page, unsigned long flags, void *data_page);</div><div class='del'>-int path_umount(struct path *path, int flags);</div><div class='add'>+int path_umount(const struct path *path, int flags);</div><div class='add'>+</div><div class='add'>+int show_path(struct seq_file *m, struct dentry *root);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * fs_struct.c</div><div class='hunk'>@@ -97,17 +101,81 @@ extern void chroot_fs_refs(const struct path *, const struct path *);</div><div class='ctx'> /*</div><div class='ctx'>  * file_table.c</div><div class='ctx'>  */</div><div class='del'>-extern struct file *alloc_empty_file(int, const struct cred *);</div><div class='del'>-extern struct file *alloc_empty_file_noaccount(int, const struct cred *);</div><div class='add'>+struct file *alloc_empty_file(int flags, const struct cred *cred);</div><div class='add'>+struct file *alloc_empty_file_noaccount(int flags, const struct cred *cred);</div><div class='add'>+struct file *alloc_empty_backing_file(int flags, const struct cred *cred);</div><div class='add'>+void backing_file_set_user_path(struct file *f, const struct path *path);</div><div class='add'>+</div><div class='add'>+static inline void file_put_write_access(struct file *file)</div><div class='add'>+{</div><div class='add'>+	put_write_access(file-&gt;f_inode);</div><div class='add'>+	mnt_put_write_access(file-&gt;f_path.mnt);</div><div class='add'>+	if (unlikely(file-&gt;f_mode &amp; FMODE_BACKING))</div><div class='add'>+		mnt_put_write_access(backing_file_user_path(file)-&gt;mnt);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void put_file_access(struct file *file)</div><div class='add'>+{</div><div class='add'>+	if ((file-&gt;f_mode &amp; (FMODE_READ | FMODE_WRITE)) == FMODE_READ) {</div><div class='add'>+		i_readcount_dec(file-&gt;f_inode);</div><div class='add'>+	} else if (file-&gt;f_mode &amp; FMODE_WRITER) {</div><div class='add'>+		file_put_write_access(file);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void fput_close_sync(struct file *);</div><div class='add'>+void fput_close(struct file *);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * super.c</div><div class='ctx'>  */</div><div class='ctx'> extern int reconfigure_super(struct fs_context *);</div><div class='del'>-extern bool trylock_super(struct super_block *sb);</div><div class='add'>+extern bool super_trylock_shared(struct super_block *sb);</div><div class='ctx'> struct super_block *user_get_super(dev_t, bool excl);</div><div class='ctx'> void put_super(struct super_block *sb);</div><div class='ctx'> extern bool mount_capable(struct fs_context *);</div><div class='add'>+int sb_init_dio_done_wq(struct super_block *sb);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Prepare superblock for changing its read-only state (i.e., either remount</div><div class='add'>+ * read-write superblock read-only or vice versa). After this function returns</div><div class='add'>+ * mnt_is_readonly() will return true for any mount of the superblock if its</div><div class='add'>+ * caller is able to observe any changes done by the remount. This holds until</div><div class='add'>+ * sb_end_ro_state_change() is called.</div><div class='add'>+ */</div><div class='add'>+static inline void sb_start_ro_state_change(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	WRITE_ONCE(sb-&gt;s_readonly_remount, 1);</div><div class='add'>+	/*</div><div class='add'>+	 * For RO-&gt;RW transition, the barrier pairs with the barrier in</div><div class='add'>+	 * mnt_is_readonly() making sure if mnt_is_readonly() sees SB_RDONLY</div><div class='add'>+	 * cleared, it will see s_readonly_remount set.</div><div class='add'>+	 * For RW-&gt;RO transition, the barrier pairs with the barrier in</div><div class='add'>+	 * mnt_get_write_access() before the mnt_is_readonly() check.</div><div class='add'>+	 * The barrier makes sure if mnt_get_write_access() sees MNT_WRITE_HOLD</div><div class='add'>+	 * already cleared, it will see s_readonly_remount set.</div><div class='add'>+	 */</div><div class='add'>+	smp_wmb();</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Ends section changing read-only state of the superblock. After this function</div><div class='add'>+ * returns if mnt_is_readonly() returns false, the caller will be able to</div><div class='add'>+ * observe all the changes remount did to the superblock.</div><div class='add'>+ */</div><div class='add'>+static inline void sb_end_ro_state_change(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	/*</div><div class='add'>+	 * This barrier provides release semantics that pairs with</div><div class='add'>+	 * the smp_rmb() acquire semantics in mnt_is_readonly().</div><div class='add'>+	 * This barrier pair ensure that when mnt_is_readonly() sees</div><div class='add'>+	 * 0 for sb-&gt;s_readonly_remount, it will also see all the</div><div class='add'>+	 * preceding flag changes that were made during the RO state</div><div class='add'>+	 * change.</div><div class='add'>+	 */</div><div class='add'>+	smp_wmb();</div><div class='add'>+	WRITE_ONCE(sb-&gt;s_readonly_remount, 0);</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * open.c</div><div class='hunk'>@@ -125,9 +193,10 @@ extern struct file *do_file_open_root(const struct path *,</div><div class='ctx'> 		const char *, const struct open_flags *);</div><div class='ctx'> extern struct open_how build_open_how(int flags, umode_t mode);</div><div class='ctx'> extern int build_open_flags(const struct open_how *how, struct open_flags *op);</div><div class='del'>-extern int __close_fd_get_file(unsigned int fd, struct file **res);</div><div class='add'>+struct file *file_close_fd_locked(struct files_struct *files, unsigned fd);</div><div class='ctx'> </div><div class='del'>-long do_sys_ftruncate(unsigned int fd, loff_t length, int small);</div><div class='add'>+int do_ftruncate(struct file *file, loff_t length, int small);</div><div class='add'>+int do_sys_ftruncate(unsigned int fd, loff_t length, int small);</div><div class='ctx'> int chmod_common(const struct path *path, umode_t mode);</div><div class='ctx'> int do_fchownat(int dfd, const char __user *filename, uid_t user, gid_t group,</div><div class='ctx'> 		int flag);</div><div class='hunk'>@@ -138,13 +207,14 @@ extern int vfs_open(const struct path *, struct file *);</div><div class='ctx'>  * inode.c</div><div class='ctx'>  */</div><div class='ctx'> extern long prune_icache_sb(struct super_block *sb, struct shrink_control *sc);</div><div class='del'>-extern int dentry_needs_remove_privs(struct dentry *dentry);</div><div class='add'>+int dentry_needs_remove_privs(struct mnt_idmap *, struct dentry *dentry);</div><div class='add'>+bool in_group_or_capable(struct mnt_idmap *idmap,</div><div class='add'>+			 const struct inode *inode, vfsgid_t vfsgid);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * fs-writeback.c</div><div class='ctx'>  */</div><div class='ctx'> extern long get_nr_dirty_inodes(void);</div><div class='del'>-extern int invalidate_inodes(struct super_block *, bool);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * dcache.c</div><div class='hunk'>@@ -156,11 +226,10 @@ extern struct dentry * d_alloc_pseudo(struct super_block *, const struct qstr *)</div><div class='ctx'> extern char *simple_dname(struct dentry *, char *, int);</div><div class='ctx'> extern void dput_to_list(struct dentry *, struct list_head *);</div><div class='ctx'> extern void shrink_dentry_list(struct list_head *);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * read_write.c</div><div class='del'>- */</div><div class='del'>-extern int rw_verify_area(int, struct file *, const loff_t *, size_t);</div><div class='add'>+extern void shrink_dcache_for_umount(struct super_block *);</div><div class='add'>+extern struct dentry *__d_lookup(const struct dentry *, const struct qstr *);</div><div class='add'>+extern struct dentry *__d_lookup_rcu(const struct dentry *parent,</div><div class='add'>+				const struct qstr *name, unsigned *seq);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * pipe.c</div><div class='hunk'>@@ -177,20 +246,115 @@ extern void mnt_pin_kill(struct mount *m);</div><div class='ctx'>  * fs/nsfs.c</div><div class='ctx'>  */</div><div class='ctx'> extern const struct dentry_operations ns_dentry_operations;</div><div class='del'>-</div><div class='del'>-/* direct-io.c: */</div><div class='del'>-int sb_init_dio_done_wq(struct super_block *sb);</div><div class='add'>+int open_namespace(struct ns_common *ns);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * fs/stat.c:</div><div class='ctx'>  */</div><div class='del'>-int do_statx(int dfd, const char __user *filename, unsigned flags,</div><div class='add'>+</div><div class='add'>+int do_statx(int dfd, struct filename *filename, unsigned int flags,</div><div class='ctx'> 	     unsigned int mask, struct statx __user *buffer);</div><div class='add'>+int do_statx_fd(int fd, unsigned int flags, unsigned int mask,</div><div class='add'>+		struct statx __user *buffer);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * fs/splice.c:</div><div class='ctx'>  */</div><div class='del'>-long splice_file_to_pipe(struct file *in,</div><div class='del'>-			 struct pipe_inode_info *opipe,</div><div class='del'>-			 loff_t *offset,</div><div class='del'>-			 size_t len, unsigned int flags);</div><div class='add'>+ssize_t splice_file_to_pipe(struct file *in,</div><div class='add'>+			    struct pipe_inode_info *opipe,</div><div class='add'>+			    loff_t *offset,</div><div class='add'>+			    size_t len, unsigned int flags);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * fs/xattr.c:</div><div class='add'>+ */</div><div class='add'>+struct xattr_name {</div><div class='add'>+	char name[XATTR_NAME_MAX + 1];</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct kernel_xattr_ctx {</div><div class='add'>+	/* Value of attribute */</div><div class='add'>+	union {</div><div class='add'>+		const void __user *cvalue;</div><div class='add'>+		void __user *value;</div><div class='add'>+	};</div><div class='add'>+	void *kvalue;</div><div class='add'>+	size_t size;</div><div class='add'>+	/* Attribute name */</div><div class='add'>+	struct xattr_name *kname;</div><div class='add'>+	unsigned int flags;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+ssize_t file_getxattr(struct file *file, struct kernel_xattr_ctx *ctx);</div><div class='add'>+ssize_t filename_getxattr(int dfd, struct filename *filename,</div><div class='add'>+			  unsigned int lookup_flags, struct kernel_xattr_ctx *ctx);</div><div class='add'>+int file_setxattr(struct file *file, struct kernel_xattr_ctx *ctx);</div><div class='add'>+int filename_setxattr(int dfd, struct filename *filename,</div><div class='add'>+		      unsigned int lookup_flags, struct kernel_xattr_ctx *ctx);</div><div class='add'>+int setxattr_copy(const char __user *name, struct kernel_xattr_ctx *ctx);</div><div class='add'>+int import_xattr_name(struct xattr_name *kname, const char __user *name);</div><div class='add'>+</div><div class='add'>+int may_write_xattr(struct mnt_idmap *idmap, struct inode *inode);</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_FS_POSIX_ACL</div><div class='add'>+int do_set_acl(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='add'>+	       const char *acl_name, const void *kvalue, size_t size);</div><div class='add'>+ssize_t do_get_acl(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='add'>+		   const char *acl_name, void *kvalue, size_t size);</div><div class='add'>+#else</div><div class='add'>+static inline int do_set_acl(struct mnt_idmap *idmap,</div><div class='add'>+			     struct dentry *dentry, const char *acl_name,</div><div class='add'>+			     const void *kvalue, size_t size)</div><div class='add'>+{</div><div class='add'>+	return -EOPNOTSUPP;</div><div class='add'>+}</div><div class='add'>+static inline ssize_t do_get_acl(struct mnt_idmap *idmap,</div><div class='add'>+				 struct dentry *dentry, const char *acl_name,</div><div class='add'>+				 void *kvalue, size_t size)</div><div class='add'>+{</div><div class='add'>+	return -EOPNOTSUPP;</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+ssize_t __kernel_write_iter(struct file *file, struct iov_iter *from, loff_t *pos);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * fs/attr.c</div><div class='add'>+ */</div><div class='add'>+struct mnt_idmap *alloc_mnt_idmap(struct user_namespace *mnt_userns);</div><div class='add'>+struct mnt_idmap *mnt_idmap_get(struct mnt_idmap *idmap);</div><div class='add'>+void mnt_idmap_put(struct mnt_idmap *idmap);</div><div class='add'>+struct stashed_operations {</div><div class='add'>+	struct dentry *(*stash_dentry)(struct dentry **stashed,</div><div class='add'>+				       struct dentry *dentry);</div><div class='add'>+	void (*put_data)(void *data);</div><div class='add'>+	int (*init_inode)(struct inode *inode, void *data);</div><div class='add'>+};</div><div class='add'>+int path_from_stashed(struct dentry **stashed, struct vfsmount *mnt, void *data,</div><div class='add'>+		      struct path *path);</div><div class='add'>+void stashed_dentry_prune(struct dentry *dentry);</div><div class='add'>+struct dentry *stash_dentry(struct dentry **stashed, struct dentry *dentry);</div><div class='add'>+struct dentry *stashed_dentry_get(struct dentry **stashed);</div><div class='add'>+/**</div><div class='add'>+ * path_mounted - check whether path is mounted</div><div class='add'>+ * @path: path to check</div><div class='add'>+ *</div><div class='add'>+ * Determine whether @path refers to the root of a mount.</div><div class='add'>+ *</div><div class='add'>+ * Return: true if @path is the root of a mount, false if not.</div><div class='add'>+ */</div><div class='add'>+static inline bool path_mounted(const struct path *path)</div><div class='add'>+{</div><div class='add'>+	return path-&gt;mnt-&gt;mnt_root == path-&gt;dentry;</div><div class='add'>+}</div><div class='add'>+void file_f_owner_release(struct file *file);</div><div class='add'>+bool file_seek_cur_needs_f_lock(struct file *file);</div><div class='add'>+int statmount_mnt_idmap(struct mnt_idmap *idmap, struct seq_file *seq, bool uid_map);</div><div class='add'>+struct dentry *find_next_child(struct dentry *parent, struct dentry *prev);</div><div class='add'>+int anon_inode_getattr(struct mnt_idmap *idmap, const struct path *path,</div><div class='add'>+		       struct kstat *stat, u32 request_mask,</div><div class='add'>+		       unsigned int query_flags);</div><div class='add'>+int anon_inode_setattr(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='add'>+		       struct iattr *attr);</div><div class='add'>+void pidfs_get_root(struct path *path);</div><div class='add'>+void nsfs_get_root(struct path *path);</div><div class='head'>diff --git a/fs/io-wq.c b/fs/io-wq.c<br/>deleted file mode 100644<br/>index afd955d53db9..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/io-wq.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/io-wq.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,1362 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0</div><div class='del'>-/*</div><div class='del'>- * Basic worker thread pool for io_uring</div><div class='del'>- *</div><div class='del'>- * Copyright (C) 2019 Jens Axboe</div><div class='del'>- *</div><div class='del'>- */</div><div class='del'>-#include &lt;linux/kernel.h&gt;</div><div class='del'>-#include &lt;linux/init.h&gt;</div><div class='del'>-#include &lt;linux/errno.h&gt;</div><div class='del'>-#include &lt;linux/sched/signal.h&gt;</div><div class='del'>-#include &lt;linux/percpu.h&gt;</div><div class='del'>-#include &lt;linux/slab.h&gt;</div><div class='del'>-#include &lt;linux/rculist_nulls.h&gt;</div><div class='del'>-#include &lt;linux/cpu.h&gt;</div><div class='del'>-#include &lt;linux/tracehook.h&gt;</div><div class='del'>-#include &lt;linux/audit.h&gt;</div><div class='del'>-#include &lt;uapi/linux/io_uring.h&gt;</div><div class='del'>-</div><div class='del'>-#include "io-wq.h"</div><div class='del'>-</div><div class='del'>-#define WORKER_IDLE_TIMEOUT	(5 * HZ)</div><div class='del'>-</div><div class='del'>-enum {</div><div class='del'>-	IO_WORKER_F_UP		= 1,	/* up and active */</div><div class='del'>-	IO_WORKER_F_RUNNING	= 2,	/* account as running */</div><div class='del'>-	IO_WORKER_F_FREE	= 4,	/* worker on free list */</div><div class='del'>-	IO_WORKER_F_BOUND	= 8,	/* is doing bounded work */</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-enum {</div><div class='del'>-	IO_WQ_BIT_EXIT		= 0,	/* wq exiting */</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-enum {</div><div class='del'>-	IO_ACCT_STALLED_BIT	= 0,	/* stalled on hash */</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * One for each thread in a wqe pool</div><div class='del'>- */</div><div class='del'>-struct io_worker {</div><div class='del'>-	refcount_t ref;</div><div class='del'>-	unsigned flags;</div><div class='del'>-	struct hlist_nulls_node nulls_node;</div><div class='del'>-	struct list_head all_list;</div><div class='del'>-	struct task_struct *task;</div><div class='del'>-	struct io_wqe *wqe;</div><div class='del'>-</div><div class='del'>-	struct io_wq_work *cur_work;</div><div class='del'>-	spinlock_t lock;</div><div class='del'>-</div><div class='del'>-	struct completion ref_done;</div><div class='del'>-</div><div class='del'>-	unsigned long create_state;</div><div class='del'>-	struct callback_head create_work;</div><div class='del'>-	int create_index;</div><div class='del'>-</div><div class='del'>-	union {</div><div class='del'>-		struct rcu_head rcu;</div><div class='del'>-		struct work_struct work;</div><div class='del'>-	};</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-#if BITS_PER_LONG == 64</div><div class='del'>-#define IO_WQ_HASH_ORDER	6</div><div class='del'>-#else</div><div class='del'>-#define IO_WQ_HASH_ORDER	5</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-#define IO_WQ_NR_HASH_BUCKETS	(1u &lt;&lt; IO_WQ_HASH_ORDER)</div><div class='del'>-</div><div class='del'>-struct io_wqe_acct {</div><div class='del'>-	unsigned nr_workers;</div><div class='del'>-	unsigned max_workers;</div><div class='del'>-	int index;</div><div class='del'>-	atomic_t nr_running;</div><div class='del'>-	struct io_wq_work_list work_list;</div><div class='del'>-	unsigned long flags;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-enum {</div><div class='del'>-	IO_WQ_ACCT_BOUND,</div><div class='del'>-	IO_WQ_ACCT_UNBOUND,</div><div class='del'>-	IO_WQ_ACCT_NR,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Per-node worker thread pool</div><div class='del'>- */</div><div class='del'>-struct io_wqe {</div><div class='del'>-	raw_spinlock_t lock;</div><div class='del'>-	struct io_wqe_acct acct[2];</div><div class='del'>-</div><div class='del'>-	int node;</div><div class='del'>-</div><div class='del'>-	struct hlist_nulls_head free_list;</div><div class='del'>-	struct list_head all_list;</div><div class='del'>-</div><div class='del'>-	struct wait_queue_entry wait;</div><div class='del'>-</div><div class='del'>-	struct io_wq *wq;</div><div class='del'>-	struct io_wq_work *hash_tail[IO_WQ_NR_HASH_BUCKETS];</div><div class='del'>-</div><div class='del'>-	cpumask_var_t cpu_mask;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Per io_wq state</div><div class='del'>-  */</div><div class='del'>-struct io_wq {</div><div class='del'>-	unsigned long state;</div><div class='del'>-</div><div class='del'>-	free_work_fn *free_work;</div><div class='del'>-	io_wq_work_fn *do_work;</div><div class='del'>-</div><div class='del'>-	struct io_wq_hash *hash;</div><div class='del'>-</div><div class='del'>-	atomic_t worker_refs;</div><div class='del'>-	struct completion worker_done;</div><div class='del'>-</div><div class='del'>-	struct hlist_node cpuhp_node;</div><div class='del'>-</div><div class='del'>-	struct task_struct *task;</div><div class='del'>-</div><div class='del'>-	struct io_wqe *wqes[];</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static enum cpuhp_state io_wq_online;</div><div class='del'>-</div><div class='del'>-struct io_cb_cancel_data {</div><div class='del'>-	work_cancel_fn *fn;</div><div class='del'>-	void *data;</div><div class='del'>-	int nr_running;</div><div class='del'>-	int nr_pending;</div><div class='del'>-	bool cancel_all;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static bool create_io_worker(struct io_wq *wq, struct io_wqe *wqe, int index);</div><div class='del'>-static void io_wqe_dec_running(struct io_worker *worker);</div><div class='del'>-static bool io_acct_cancel_pending_work(struct io_wqe *wqe,</div><div class='del'>-					struct io_wqe_acct *acct,</div><div class='del'>-					struct io_cb_cancel_data *match);</div><div class='del'>-static void create_worker_cb(struct callback_head *cb);</div><div class='del'>-</div><div class='del'>-static bool io_worker_get(struct io_worker *worker)</div><div class='del'>-{</div><div class='del'>-	return refcount_inc_not_zero(&amp;worker-&gt;ref);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_worker_release(struct io_worker *worker)</div><div class='del'>-{</div><div class='del'>-	if (refcount_dec_and_test(&amp;worker-&gt;ref))</div><div class='del'>-		complete(&amp;worker-&gt;ref_done);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline struct io_wqe_acct *io_get_acct(struct io_wqe *wqe, bool bound)</div><div class='del'>-{</div><div class='del'>-	return &amp;wqe-&gt;acct[bound ? IO_WQ_ACCT_BOUND : IO_WQ_ACCT_UNBOUND];</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline struct io_wqe_acct *io_work_get_acct(struct io_wqe *wqe,</div><div class='del'>-						   struct io_wq_work *work)</div><div class='del'>-{</div><div class='del'>-	return io_get_acct(wqe, !(work-&gt;flags &amp; IO_WQ_WORK_UNBOUND));</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline struct io_wqe_acct *io_wqe_get_acct(struct io_worker *worker)</div><div class='del'>-{</div><div class='del'>-	return io_get_acct(worker-&gt;wqe, worker-&gt;flags &amp; IO_WORKER_F_BOUND);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_worker_ref_put(struct io_wq *wq)</div><div class='del'>-{</div><div class='del'>-	if (atomic_dec_and_test(&amp;wq-&gt;worker_refs))</div><div class='del'>-		complete(&amp;wq-&gt;worker_done);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_worker_cancel_cb(struct io_worker *worker)</div><div class='del'>-{</div><div class='del'>-	struct io_wqe_acct *acct = io_wqe_get_acct(worker);</div><div class='del'>-	struct io_wqe *wqe = worker-&gt;wqe;</div><div class='del'>-	struct io_wq *wq = wqe-&gt;wq;</div><div class='del'>-</div><div class='del'>-	atomic_dec(&amp;acct-&gt;nr_running);</div><div class='del'>-	raw_spin_lock(&amp;worker-&gt;wqe-&gt;lock);</div><div class='del'>-	acct-&gt;nr_workers--;</div><div class='del'>-	raw_spin_unlock(&amp;worker-&gt;wqe-&gt;lock);</div><div class='del'>-	io_worker_ref_put(wq);</div><div class='del'>-	clear_bit_unlock(0, &amp;worker-&gt;create_state);</div><div class='del'>-	io_worker_release(worker);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool io_task_worker_match(struct callback_head *cb, void *data)</div><div class='del'>-{</div><div class='del'>-	struct io_worker *worker;</div><div class='del'>-</div><div class='del'>-	if (cb-&gt;func != create_worker_cb)</div><div class='del'>-		return false;</div><div class='del'>-	worker = container_of(cb, struct io_worker, create_work);</div><div class='del'>-	return worker == data;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_worker_exit(struct io_worker *worker)</div><div class='del'>-{</div><div class='del'>-	struct io_wqe *wqe = worker-&gt;wqe;</div><div class='del'>-	struct io_wq *wq = wqe-&gt;wq;</div><div class='del'>-</div><div class='del'>-	while (1) {</div><div class='del'>-		struct callback_head *cb = task_work_cancel_match(wq-&gt;task,</div><div class='del'>-						io_task_worker_match, worker);</div><div class='del'>-</div><div class='del'>-		if (!cb)</div><div class='del'>-			break;</div><div class='del'>-		io_worker_cancel_cb(worker);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	io_worker_release(worker);</div><div class='del'>-	wait_for_completion(&amp;worker-&gt;ref_done);</div><div class='del'>-</div><div class='del'>-	raw_spin_lock(&amp;wqe-&gt;lock);</div><div class='del'>-	if (worker-&gt;flags &amp; IO_WORKER_F_FREE)</div><div class='del'>-		hlist_nulls_del_rcu(&amp;worker-&gt;nulls_node);</div><div class='del'>-	list_del_rcu(&amp;worker-&gt;all_list);</div><div class='del'>-	preempt_disable();</div><div class='del'>-	io_wqe_dec_running(worker);</div><div class='del'>-	worker-&gt;flags = 0;</div><div class='del'>-	current-&gt;flags &amp;= ~PF_IO_WORKER;</div><div class='del'>-	preempt_enable();</div><div class='del'>-	raw_spin_unlock(&amp;wqe-&gt;lock);</div><div class='del'>-</div><div class='del'>-	kfree_rcu(worker, rcu);</div><div class='del'>-	io_worker_ref_put(wqe-&gt;wq);</div><div class='del'>-	do_exit(0);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline bool io_acct_run_queue(struct io_wqe_acct *acct)</div><div class='del'>-{</div><div class='del'>-	if (!wq_list_empty(&amp;acct-&gt;work_list) &amp;&amp;</div><div class='del'>-	    !test_bit(IO_ACCT_STALLED_BIT, &amp;acct-&gt;flags))</div><div class='del'>-		return true;</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Check head of free list for an available worker. If one isn't available,</div><div class='del'>- * caller must create one.</div><div class='del'>- */</div><div class='del'>-static bool io_wqe_activate_free_worker(struct io_wqe *wqe,</div><div class='del'>-					struct io_wqe_acct *acct)</div><div class='del'>-	__must_hold(RCU)</div><div class='del'>-{</div><div class='del'>-	struct hlist_nulls_node *n;</div><div class='del'>-	struct io_worker *worker;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Iterate free_list and see if we can find an idle worker to</div><div class='del'>-	 * activate. If a given worker is on the free_list but in the process</div><div class='del'>-	 * of exiting, keep trying.</div><div class='del'>-	 */</div><div class='del'>-	hlist_nulls_for_each_entry_rcu(worker, n, &amp;wqe-&gt;free_list, nulls_node) {</div><div class='del'>-		if (!io_worker_get(worker))</div><div class='del'>-			continue;</div><div class='del'>-		if (io_wqe_get_acct(worker) != acct) {</div><div class='del'>-			io_worker_release(worker);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-		if (wake_up_process(worker-&gt;task)) {</div><div class='del'>-			io_worker_release(worker);</div><div class='del'>-			return true;</div><div class='del'>-		}</div><div class='del'>-		io_worker_release(worker);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * We need a worker. If we find a free one, we're good. If not, and we're</div><div class='del'>- * below the max number of workers, create one.</div><div class='del'>- */</div><div class='del'>-static bool io_wqe_create_worker(struct io_wqe *wqe, struct io_wqe_acct *acct)</div><div class='del'>-{</div><div class='del'>-	/*</div><div class='del'>-	 * Most likely an attempt to queue unbounded work on an io_wq that</div><div class='del'>-	 * wasn't setup with any unbounded workers.</div><div class='del'>-	 */</div><div class='del'>-	if (unlikely(!acct-&gt;max_workers))</div><div class='del'>-		pr_warn_once("io-wq is not configured for unbound workers");</div><div class='del'>-</div><div class='del'>-	raw_spin_lock(&amp;wqe-&gt;lock);</div><div class='del'>-	if (acct-&gt;nr_workers &gt;= acct-&gt;max_workers) {</div><div class='del'>-		raw_spin_unlock(&amp;wqe-&gt;lock);</div><div class='del'>-		return true;</div><div class='del'>-	}</div><div class='del'>-	acct-&gt;nr_workers++;</div><div class='del'>-	raw_spin_unlock(&amp;wqe-&gt;lock);</div><div class='del'>-	atomic_inc(&amp;acct-&gt;nr_running);</div><div class='del'>-	atomic_inc(&amp;wqe-&gt;wq-&gt;worker_refs);</div><div class='del'>-	return create_io_worker(wqe-&gt;wq, wqe, acct-&gt;index);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_wqe_inc_running(struct io_worker *worker)</div><div class='del'>-{</div><div class='del'>-	struct io_wqe_acct *acct = io_wqe_get_acct(worker);</div><div class='del'>-</div><div class='del'>-	atomic_inc(&amp;acct-&gt;nr_running);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void create_worker_cb(struct callback_head *cb)</div><div class='del'>-{</div><div class='del'>-	struct io_worker *worker;</div><div class='del'>-	struct io_wq *wq;</div><div class='del'>-	struct io_wqe *wqe;</div><div class='del'>-	struct io_wqe_acct *acct;</div><div class='del'>-	bool do_create = false;</div><div class='del'>-</div><div class='del'>-	worker = container_of(cb, struct io_worker, create_work);</div><div class='del'>-	wqe = worker-&gt;wqe;</div><div class='del'>-	wq = wqe-&gt;wq;</div><div class='del'>-	acct = &amp;wqe-&gt;acct[worker-&gt;create_index];</div><div class='del'>-	raw_spin_lock(&amp;wqe-&gt;lock);</div><div class='del'>-	if (acct-&gt;nr_workers &lt; acct-&gt;max_workers) {</div><div class='del'>-		acct-&gt;nr_workers++;</div><div class='del'>-		do_create = true;</div><div class='del'>-	}</div><div class='del'>-	raw_spin_unlock(&amp;wqe-&gt;lock);</div><div class='del'>-	if (do_create) {</div><div class='del'>-		create_io_worker(wq, wqe, worker-&gt;create_index);</div><div class='del'>-	} else {</div><div class='del'>-		atomic_dec(&amp;acct-&gt;nr_running);</div><div class='del'>-		io_worker_ref_put(wq);</div><div class='del'>-	}</div><div class='del'>-	clear_bit_unlock(0, &amp;worker-&gt;create_state);</div><div class='del'>-	io_worker_release(worker);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool io_queue_worker_create(struct io_worker *worker,</div><div class='del'>-				   struct io_wqe_acct *acct,</div><div class='del'>-				   task_work_func_t func)</div><div class='del'>-{</div><div class='del'>-	struct io_wqe *wqe = worker-&gt;wqe;</div><div class='del'>-	struct io_wq *wq = wqe-&gt;wq;</div><div class='del'>-</div><div class='del'>-	/* raced with exit, just ignore create call */</div><div class='del'>-	if (test_bit(IO_WQ_BIT_EXIT, &amp;wq-&gt;state))</div><div class='del'>-		goto fail;</div><div class='del'>-	if (!io_worker_get(worker))</div><div class='del'>-		goto fail;</div><div class='del'>-	/*</div><div class='del'>-	 * create_state manages ownership of create_work/index. We should</div><div class='del'>-	 * only need one entry per worker, as the worker going to sleep</div><div class='del'>-	 * will trigger the condition, and waking will clear it once it</div><div class='del'>-	 * runs the task_work.</div><div class='del'>-	 */</div><div class='del'>-	if (test_bit(0, &amp;worker-&gt;create_state) ||</div><div class='del'>-	    test_and_set_bit_lock(0, &amp;worker-&gt;create_state))</div><div class='del'>-		goto fail_release;</div><div class='del'>-</div><div class='del'>-	init_task_work(&amp;worker-&gt;create_work, func);</div><div class='del'>-	worker-&gt;create_index = acct-&gt;index;</div><div class='del'>-	if (!task_work_add(wq-&gt;task, &amp;worker-&gt;create_work, TWA_SIGNAL)) {</div><div class='del'>-		clear_bit_unlock(0, &amp;worker-&gt;create_state);</div><div class='del'>-		return true;</div><div class='del'>-	}</div><div class='del'>-	clear_bit_unlock(0, &amp;worker-&gt;create_state);</div><div class='del'>-fail_release:</div><div class='del'>-	io_worker_release(worker);</div><div class='del'>-fail:</div><div class='del'>-	atomic_dec(&amp;acct-&gt;nr_running);</div><div class='del'>-	io_worker_ref_put(wq);</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_wqe_dec_running(struct io_worker *worker)</div><div class='del'>-	__must_hold(wqe-&gt;lock)</div><div class='del'>-{</div><div class='del'>-	struct io_wqe_acct *acct = io_wqe_get_acct(worker);</div><div class='del'>-	struct io_wqe *wqe = worker-&gt;wqe;</div><div class='del'>-</div><div class='del'>-	if (!(worker-&gt;flags &amp; IO_WORKER_F_UP))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	if (atomic_dec_and_test(&amp;acct-&gt;nr_running) &amp;&amp; io_acct_run_queue(acct)) {</div><div class='del'>-		atomic_inc(&amp;acct-&gt;nr_running);</div><div class='del'>-		atomic_inc(&amp;wqe-&gt;wq-&gt;worker_refs);</div><div class='del'>-		io_queue_worker_create(worker, acct, create_worker_cb);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Worker will start processing some work. Move it to the busy list, if</div><div class='del'>- * it's currently on the freelist</div><div class='del'>- */</div><div class='del'>-static void __io_worker_busy(struct io_wqe *wqe, struct io_worker *worker,</div><div class='del'>-			     struct io_wq_work *work)</div><div class='del'>-	__must_hold(wqe-&gt;lock)</div><div class='del'>-{</div><div class='del'>-	if (worker-&gt;flags &amp; IO_WORKER_F_FREE) {</div><div class='del'>-		worker-&gt;flags &amp;= ~IO_WORKER_F_FREE;</div><div class='del'>-		hlist_nulls_del_init_rcu(&amp;worker-&gt;nulls_node);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * No work, worker going to sleep. Move to freelist, and unuse mm if we</div><div class='del'>- * have one attached. Dropping the mm may potentially sleep, so we drop</div><div class='del'>- * the lock in that case and return success. Since the caller has to</div><div class='del'>- * retry the loop in that case (we changed task state), we don't regrab</div><div class='del'>- * the lock if we return success.</div><div class='del'>- */</div><div class='del'>-static void __io_worker_idle(struct io_wqe *wqe, struct io_worker *worker)</div><div class='del'>-	__must_hold(wqe-&gt;lock)</div><div class='del'>-{</div><div class='del'>-	if (!(worker-&gt;flags &amp; IO_WORKER_F_FREE)) {</div><div class='del'>-		worker-&gt;flags |= IO_WORKER_F_FREE;</div><div class='del'>-		hlist_nulls_add_head_rcu(&amp;worker-&gt;nulls_node, &amp;wqe-&gt;free_list);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline unsigned int io_get_work_hash(struct io_wq_work *work)</div><div class='del'>-{</div><div class='del'>-	return work-&gt;flags &gt;&gt; IO_WQ_HASH_SHIFT;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_wait_on_hash(struct io_wqe *wqe, unsigned int hash)</div><div class='del'>-{</div><div class='del'>-	struct io_wq *wq = wqe-&gt;wq;</div><div class='del'>-</div><div class='del'>-	spin_lock_irq(&amp;wq-&gt;hash-&gt;wait.lock);</div><div class='del'>-	if (list_empty(&amp;wqe-&gt;wait.entry)) {</div><div class='del'>-		__add_wait_queue(&amp;wq-&gt;hash-&gt;wait, &amp;wqe-&gt;wait);</div><div class='del'>-		if (!test_bit(hash, &amp;wq-&gt;hash-&gt;map)) {</div><div class='del'>-			__set_current_state(TASK_RUNNING);</div><div class='del'>-			list_del_init(&amp;wqe-&gt;wait.entry);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	spin_unlock_irq(&amp;wq-&gt;hash-&gt;wait.lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct io_wq_work *io_get_next_work(struct io_wqe_acct *acct,</div><div class='del'>-					   struct io_worker *worker)</div><div class='del'>-	__must_hold(wqe-&gt;lock)</div><div class='del'>-{</div><div class='del'>-	struct io_wq_work_node *node, *prev;</div><div class='del'>-	struct io_wq_work *work, *tail;</div><div class='del'>-	unsigned int stall_hash = -1U;</div><div class='del'>-	struct io_wqe *wqe = worker-&gt;wqe;</div><div class='del'>-</div><div class='del'>-	wq_list_for_each(node, prev, &amp;acct-&gt;work_list) {</div><div class='del'>-		unsigned int hash;</div><div class='del'>-</div><div class='del'>-		work = container_of(node, struct io_wq_work, list);</div><div class='del'>-</div><div class='del'>-		/* not hashed, can run anytime */</div><div class='del'>-		if (!io_wq_is_hashed(work)) {</div><div class='del'>-			wq_list_del(&amp;acct-&gt;work_list, node, prev);</div><div class='del'>-			return work;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		hash = io_get_work_hash(work);</div><div class='del'>-		/* all items with this hash lie in [work, tail] */</div><div class='del'>-		tail = wqe-&gt;hash_tail[hash];</div><div class='del'>-</div><div class='del'>-		/* hashed, can run if not already running */</div><div class='del'>-		if (!test_and_set_bit(hash, &amp;wqe-&gt;wq-&gt;hash-&gt;map)) {</div><div class='del'>-			wqe-&gt;hash_tail[hash] = NULL;</div><div class='del'>-			wq_list_cut(&amp;acct-&gt;work_list, &amp;tail-&gt;list, prev);</div><div class='del'>-			return work;</div><div class='del'>-		}</div><div class='del'>-		if (stall_hash == -1U)</div><div class='del'>-			stall_hash = hash;</div><div class='del'>-		/* fast forward to a next hash, for-each will fix up @prev */</div><div class='del'>-		node = &amp;tail-&gt;list;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (stall_hash != -1U) {</div><div class='del'>-		/*</div><div class='del'>-		 * Set this before dropping the lock to avoid racing with new</div><div class='del'>-		 * work being added and clearing the stalled bit.</div><div class='del'>-		 */</div><div class='del'>-		set_bit(IO_ACCT_STALLED_BIT, &amp;acct-&gt;flags);</div><div class='del'>-		raw_spin_unlock(&amp;wqe-&gt;lock);</div><div class='del'>-		io_wait_on_hash(wqe, stall_hash);</div><div class='del'>-		raw_spin_lock(&amp;wqe-&gt;lock);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool io_flush_signals(void)</div><div class='del'>-{</div><div class='del'>-	if (unlikely(test_thread_flag(TIF_NOTIFY_SIGNAL))) {</div><div class='del'>-		__set_current_state(TASK_RUNNING);</div><div class='del'>-		tracehook_notify_signal();</div><div class='del'>-		return true;</div><div class='del'>-	}</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_assign_current_work(struct io_worker *worker,</div><div class='del'>-				   struct io_wq_work *work)</div><div class='del'>-{</div><div class='del'>-	if (work) {</div><div class='del'>-		io_flush_signals();</div><div class='del'>-		cond_resched();</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;worker-&gt;lock);</div><div class='del'>-	worker-&gt;cur_work = work;</div><div class='del'>-	spin_unlock(&amp;worker-&gt;lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_wqe_enqueue(struct io_wqe *wqe, struct io_wq_work *work);</div><div class='del'>-</div><div class='del'>-static void io_worker_handle_work(struct io_worker *worker)</div><div class='del'>-	__releases(wqe-&gt;lock)</div><div class='del'>-{</div><div class='del'>-	struct io_wqe_acct *acct = io_wqe_get_acct(worker);</div><div class='del'>-	struct io_wqe *wqe = worker-&gt;wqe;</div><div class='del'>-	struct io_wq *wq = wqe-&gt;wq;</div><div class='del'>-	bool do_kill = test_bit(IO_WQ_BIT_EXIT, &amp;wq-&gt;state);</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		struct io_wq_work *work;</div><div class='del'>-get_next:</div><div class='del'>-		/*</div><div class='del'>-		 * If we got some work, mark us as busy. If we didn't, but</div><div class='del'>-		 * the list isn't empty, it means we stalled on hashed work.</div><div class='del'>-		 * Mark us stalled so we don't keep looking for work when we</div><div class='del'>-		 * can't make progress, any work completion or insertion will</div><div class='del'>-		 * clear the stalled flag.</div><div class='del'>-		 */</div><div class='del'>-		work = io_get_next_work(acct, worker);</div><div class='del'>-		if (work)</div><div class='del'>-			__io_worker_busy(wqe, worker, work);</div><div class='del'>-</div><div class='del'>-		raw_spin_unlock(&amp;wqe-&gt;lock);</div><div class='del'>-		if (!work)</div><div class='del'>-			break;</div><div class='del'>-		io_assign_current_work(worker, work);</div><div class='del'>-		__set_current_state(TASK_RUNNING);</div><div class='del'>-</div><div class='del'>-		/* handle a whole dependent link */</div><div class='del'>-		do {</div><div class='del'>-			struct io_wq_work *next_hashed, *linked;</div><div class='del'>-			unsigned int hash = io_get_work_hash(work);</div><div class='del'>-</div><div class='del'>-			next_hashed = wq_next_work(work);</div><div class='del'>-</div><div class='del'>-			if (unlikely(do_kill) &amp;&amp; (work-&gt;flags &amp; IO_WQ_WORK_UNBOUND))</div><div class='del'>-				work-&gt;flags |= IO_WQ_WORK_CANCEL;</div><div class='del'>-			wq-&gt;do_work(work);</div><div class='del'>-			io_assign_current_work(worker, NULL);</div><div class='del'>-</div><div class='del'>-			linked = wq-&gt;free_work(work);</div><div class='del'>-			work = next_hashed;</div><div class='del'>-			if (!work &amp;&amp; linked &amp;&amp; !io_wq_is_hashed(linked)) {</div><div class='del'>-				work = linked;</div><div class='del'>-				linked = NULL;</div><div class='del'>-			}</div><div class='del'>-			io_assign_current_work(worker, work);</div><div class='del'>-			if (linked)</div><div class='del'>-				io_wqe_enqueue(wqe, linked);</div><div class='del'>-</div><div class='del'>-			if (hash != -1U &amp;&amp; !next_hashed) {</div><div class='del'>-				clear_bit(hash, &amp;wq-&gt;hash-&gt;map);</div><div class='del'>-				clear_bit(IO_ACCT_STALLED_BIT, &amp;acct-&gt;flags);</div><div class='del'>-				if (wq_has_sleeper(&amp;wq-&gt;hash-&gt;wait))</div><div class='del'>-					wake_up(&amp;wq-&gt;hash-&gt;wait);</div><div class='del'>-				raw_spin_lock(&amp;wqe-&gt;lock);</div><div class='del'>-				/* skip unnecessary unlock-lock wqe-&gt;lock */</div><div class='del'>-				if (!work)</div><div class='del'>-					goto get_next;</div><div class='del'>-				raw_spin_unlock(&amp;wqe-&gt;lock);</div><div class='del'>-			}</div><div class='del'>-		} while (work);</div><div class='del'>-</div><div class='del'>-		raw_spin_lock(&amp;wqe-&gt;lock);</div><div class='del'>-	} while (1);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_wqe_worker(void *data)</div><div class='del'>-{</div><div class='del'>-	struct io_worker *worker = data;</div><div class='del'>-	struct io_wqe_acct *acct = io_wqe_get_acct(worker);</div><div class='del'>-	struct io_wqe *wqe = worker-&gt;wqe;</div><div class='del'>-	struct io_wq *wq = wqe-&gt;wq;</div><div class='del'>-	bool last_timeout = false;</div><div class='del'>-	char buf[TASK_COMM_LEN];</div><div class='del'>-</div><div class='del'>-	worker-&gt;flags |= (IO_WORKER_F_UP | IO_WORKER_F_RUNNING);</div><div class='del'>-</div><div class='del'>-	snprintf(buf, sizeof(buf), "iou-wrk-%d", wq-&gt;task-&gt;pid);</div><div class='del'>-	set_task_comm(current, buf);</div><div class='del'>-</div><div class='del'>-	audit_alloc_kernel(current);</div><div class='del'>-</div><div class='del'>-	while (!test_bit(IO_WQ_BIT_EXIT, &amp;wq-&gt;state)) {</div><div class='del'>-		long ret;</div><div class='del'>-</div><div class='del'>-		set_current_state(TASK_INTERRUPTIBLE);</div><div class='del'>-loop:</div><div class='del'>-		raw_spin_lock(&amp;wqe-&gt;lock);</div><div class='del'>-		if (io_acct_run_queue(acct)) {</div><div class='del'>-			io_worker_handle_work(worker);</div><div class='del'>-			goto loop;</div><div class='del'>-		}</div><div class='del'>-		/* timed out, exit unless we're the last worker */</div><div class='del'>-		if (last_timeout &amp;&amp; acct-&gt;nr_workers &gt; 1) {</div><div class='del'>-			acct-&gt;nr_workers--;</div><div class='del'>-			raw_spin_unlock(&amp;wqe-&gt;lock);</div><div class='del'>-			__set_current_state(TASK_RUNNING);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		last_timeout = false;</div><div class='del'>-		__io_worker_idle(wqe, worker);</div><div class='del'>-		raw_spin_unlock(&amp;wqe-&gt;lock);</div><div class='del'>-		if (io_flush_signals())</div><div class='del'>-			continue;</div><div class='del'>-		ret = schedule_timeout(WORKER_IDLE_TIMEOUT);</div><div class='del'>-		if (signal_pending(current)) {</div><div class='del'>-			struct ksignal ksig;</div><div class='del'>-</div><div class='del'>-			if (!get_signal(&amp;ksig))</div><div class='del'>-				continue;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		last_timeout = !ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (test_bit(IO_WQ_BIT_EXIT, &amp;wq-&gt;state)) {</div><div class='del'>-		raw_spin_lock(&amp;wqe-&gt;lock);</div><div class='del'>-		io_worker_handle_work(worker);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	audit_free(current);</div><div class='del'>-	io_worker_exit(worker);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Called when a worker is scheduled in. Mark us as currently running.</div><div class='del'>- */</div><div class='del'>-void io_wq_worker_running(struct task_struct *tsk)</div><div class='del'>-{</div><div class='del'>-	struct io_worker *worker = tsk-&gt;pf_io_worker;</div><div class='del'>-</div><div class='del'>-	if (!worker)</div><div class='del'>-		return;</div><div class='del'>-	if (!(worker-&gt;flags &amp; IO_WORKER_F_UP))</div><div class='del'>-		return;</div><div class='del'>-	if (worker-&gt;flags &amp; IO_WORKER_F_RUNNING)</div><div class='del'>-		return;</div><div class='del'>-	worker-&gt;flags |= IO_WORKER_F_RUNNING;</div><div class='del'>-	io_wqe_inc_running(worker);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Called when worker is going to sleep. If there are no workers currently</div><div class='del'>- * running and we have work pending, wake up a free one or create a new one.</div><div class='del'>- */</div><div class='del'>-void io_wq_worker_sleeping(struct task_struct *tsk)</div><div class='del'>-{</div><div class='del'>-	struct io_worker *worker = tsk-&gt;pf_io_worker;</div><div class='del'>-</div><div class='del'>-	if (!worker)</div><div class='del'>-		return;</div><div class='del'>-	if (!(worker-&gt;flags &amp; IO_WORKER_F_UP))</div><div class='del'>-		return;</div><div class='del'>-	if (!(worker-&gt;flags &amp; IO_WORKER_F_RUNNING))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	worker-&gt;flags &amp;= ~IO_WORKER_F_RUNNING;</div><div class='del'>-</div><div class='del'>-	raw_spin_lock(&amp;worker-&gt;wqe-&gt;lock);</div><div class='del'>-	io_wqe_dec_running(worker);</div><div class='del'>-	raw_spin_unlock(&amp;worker-&gt;wqe-&gt;lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_init_new_worker(struct io_wqe *wqe, struct io_worker *worker,</div><div class='del'>-			       struct task_struct *tsk)</div><div class='del'>-{</div><div class='del'>-	tsk-&gt;pf_io_worker = worker;</div><div class='del'>-	worker-&gt;task = tsk;</div><div class='del'>-	set_cpus_allowed_ptr(tsk, wqe-&gt;cpu_mask);</div><div class='del'>-	tsk-&gt;flags |= PF_NO_SETAFFINITY;</div><div class='del'>-</div><div class='del'>-	raw_spin_lock(&amp;wqe-&gt;lock);</div><div class='del'>-	hlist_nulls_add_head_rcu(&amp;worker-&gt;nulls_node, &amp;wqe-&gt;free_list);</div><div class='del'>-	list_add_tail_rcu(&amp;worker-&gt;all_list, &amp;wqe-&gt;all_list);</div><div class='del'>-	worker-&gt;flags |= IO_WORKER_F_FREE;</div><div class='del'>-	raw_spin_unlock(&amp;wqe-&gt;lock);</div><div class='del'>-	wake_up_new_task(tsk);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool io_wq_work_match_all(struct io_wq_work *work, void *data)</div><div class='del'>-{</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline bool io_should_retry_thread(long err)</div><div class='del'>-{</div><div class='del'>-	switch (err) {</div><div class='del'>-	case -EAGAIN:</div><div class='del'>-	case -ERESTARTSYS:</div><div class='del'>-	case -ERESTARTNOINTR:</div><div class='del'>-	case -ERESTARTNOHAND:</div><div class='del'>-		return true;</div><div class='del'>-	default:</div><div class='del'>-		return false;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void create_worker_cont(struct callback_head *cb)</div><div class='del'>-{</div><div class='del'>-	struct io_worker *worker;</div><div class='del'>-	struct task_struct *tsk;</div><div class='del'>-	struct io_wqe *wqe;</div><div class='del'>-</div><div class='del'>-	worker = container_of(cb, struct io_worker, create_work);</div><div class='del'>-	clear_bit_unlock(0, &amp;worker-&gt;create_state);</div><div class='del'>-	wqe = worker-&gt;wqe;</div><div class='del'>-	tsk = create_io_thread(io_wqe_worker, worker, wqe-&gt;node);</div><div class='del'>-	if (!IS_ERR(tsk)) {</div><div class='del'>-		io_init_new_worker(wqe, worker, tsk);</div><div class='del'>-		io_worker_release(worker);</div><div class='del'>-		return;</div><div class='del'>-	} else if (!io_should_retry_thread(PTR_ERR(tsk))) {</div><div class='del'>-		struct io_wqe_acct *acct = io_wqe_get_acct(worker);</div><div class='del'>-</div><div class='del'>-		atomic_dec(&amp;acct-&gt;nr_running);</div><div class='del'>-		raw_spin_lock(&amp;wqe-&gt;lock);</div><div class='del'>-		acct-&gt;nr_workers--;</div><div class='del'>-		if (!acct-&gt;nr_workers) {</div><div class='del'>-			struct io_cb_cancel_data match = {</div><div class='del'>-				.fn		= io_wq_work_match_all,</div><div class='del'>-				.cancel_all	= true,</div><div class='del'>-			};</div><div class='del'>-</div><div class='del'>-			while (io_acct_cancel_pending_work(wqe, acct, &amp;match))</div><div class='del'>-				raw_spin_lock(&amp;wqe-&gt;lock);</div><div class='del'>-		}</div><div class='del'>-		raw_spin_unlock(&amp;wqe-&gt;lock);</div><div class='del'>-		io_worker_ref_put(wqe-&gt;wq);</div><div class='del'>-		kfree(worker);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* re-create attempts grab a new worker ref, drop the existing one */</div><div class='del'>-	io_worker_release(worker);</div><div class='del'>-	schedule_work(&amp;worker-&gt;work);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_workqueue_create(struct work_struct *work)</div><div class='del'>-{</div><div class='del'>-	struct io_worker *worker = container_of(work, struct io_worker, work);</div><div class='del'>-	struct io_wqe_acct *acct = io_wqe_get_acct(worker);</div><div class='del'>-</div><div class='del'>-	if (!io_queue_worker_create(worker, acct, create_worker_cont))</div><div class='del'>-		kfree(worker);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool create_io_worker(struct io_wq *wq, struct io_wqe *wqe, int index)</div><div class='del'>-{</div><div class='del'>-	struct io_wqe_acct *acct = &amp;wqe-&gt;acct[index];</div><div class='del'>-	struct io_worker *worker;</div><div class='del'>-	struct task_struct *tsk;</div><div class='del'>-</div><div class='del'>-	__set_current_state(TASK_RUNNING);</div><div class='del'>-</div><div class='del'>-	worker = kzalloc_node(sizeof(*worker), GFP_KERNEL, wqe-&gt;node);</div><div class='del'>-	if (!worker) {</div><div class='del'>-fail:</div><div class='del'>-		atomic_dec(&amp;acct-&gt;nr_running);</div><div class='del'>-		raw_spin_lock(&amp;wqe-&gt;lock);</div><div class='del'>-		acct-&gt;nr_workers--;</div><div class='del'>-		raw_spin_unlock(&amp;wqe-&gt;lock);</div><div class='del'>-		io_worker_ref_put(wq);</div><div class='del'>-		return false;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	refcount_set(&amp;worker-&gt;ref, 1);</div><div class='del'>-	worker-&gt;wqe = wqe;</div><div class='del'>-	spin_lock_init(&amp;worker-&gt;lock);</div><div class='del'>-	init_completion(&amp;worker-&gt;ref_done);</div><div class='del'>-</div><div class='del'>-	if (index == IO_WQ_ACCT_BOUND)</div><div class='del'>-		worker-&gt;flags |= IO_WORKER_F_BOUND;</div><div class='del'>-</div><div class='del'>-	tsk = create_io_thread(io_wqe_worker, worker, wqe-&gt;node);</div><div class='del'>-	if (!IS_ERR(tsk)) {</div><div class='del'>-		io_init_new_worker(wqe, worker, tsk);</div><div class='del'>-	} else if (!io_should_retry_thread(PTR_ERR(tsk))) {</div><div class='del'>-		kfree(worker);</div><div class='del'>-		goto fail;</div><div class='del'>-	} else {</div><div class='del'>-		INIT_WORK(&amp;worker-&gt;work, io_workqueue_create);</div><div class='del'>-		schedule_work(&amp;worker-&gt;work);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Iterate the passed in list and call the specific function for each</div><div class='del'>- * worker that isn't exiting</div><div class='del'>- */</div><div class='del'>-static bool io_wq_for_each_worker(struct io_wqe *wqe,</div><div class='del'>-				  bool (*func)(struct io_worker *, void *),</div><div class='del'>-				  void *data)</div><div class='del'>-{</div><div class='del'>-	struct io_worker *worker;</div><div class='del'>-	bool ret = false;</div><div class='del'>-</div><div class='del'>-	list_for_each_entry_rcu(worker, &amp;wqe-&gt;all_list, all_list) {</div><div class='del'>-		if (io_worker_get(worker)) {</div><div class='del'>-			/* no task if node is/was offline */</div><div class='del'>-			if (worker-&gt;task)</div><div class='del'>-				ret = func(worker, data);</div><div class='del'>-			io_worker_release(worker);</div><div class='del'>-			if (ret)</div><div class='del'>-				break;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool io_wq_worker_wake(struct io_worker *worker, void *data)</div><div class='del'>-{</div><div class='del'>-	set_notify_signal(worker-&gt;task);</div><div class='del'>-	wake_up_process(worker-&gt;task);</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_run_cancel(struct io_wq_work *work, struct io_wqe *wqe)</div><div class='del'>-{</div><div class='del'>-	struct io_wq *wq = wqe-&gt;wq;</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		work-&gt;flags |= IO_WQ_WORK_CANCEL;</div><div class='del'>-		wq-&gt;do_work(work);</div><div class='del'>-		work = wq-&gt;free_work(work);</div><div class='del'>-	} while (work);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_wqe_insert_work(struct io_wqe *wqe, struct io_wq_work *work)</div><div class='del'>-{</div><div class='del'>-	struct io_wqe_acct *acct = io_work_get_acct(wqe, work);</div><div class='del'>-	unsigned int hash;</div><div class='del'>-	struct io_wq_work *tail;</div><div class='del'>-</div><div class='del'>-	if (!io_wq_is_hashed(work)) {</div><div class='del'>-append:</div><div class='del'>-		wq_list_add_tail(&amp;work-&gt;list, &amp;acct-&gt;work_list);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	hash = io_get_work_hash(work);</div><div class='del'>-	tail = wqe-&gt;hash_tail[hash];</div><div class='del'>-	wqe-&gt;hash_tail[hash] = work;</div><div class='del'>-	if (!tail)</div><div class='del'>-		goto append;</div><div class='del'>-</div><div class='del'>-	wq_list_add_after(&amp;work-&gt;list, &amp;tail-&gt;list, &amp;acct-&gt;work_list);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool io_wq_work_match_item(struct io_wq_work *work, void *data)</div><div class='del'>-{</div><div class='del'>-	return work == data;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_wqe_enqueue(struct io_wqe *wqe, struct io_wq_work *work)</div><div class='del'>-{</div><div class='del'>-	struct io_wqe_acct *acct = io_work_get_acct(wqe, work);</div><div class='del'>-	unsigned work_flags = work-&gt;flags;</div><div class='del'>-	bool do_create;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If io-wq is exiting for this task, or if the request has explicitly</div><div class='del'>-	 * been marked as one that should not get executed, cancel it here.</div><div class='del'>-	 */</div><div class='del'>-	if (test_bit(IO_WQ_BIT_EXIT, &amp;wqe-&gt;wq-&gt;state) ||</div><div class='del'>-	    (work-&gt;flags &amp; IO_WQ_WORK_CANCEL)) {</div><div class='del'>-		io_run_cancel(work, wqe);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	raw_spin_lock(&amp;wqe-&gt;lock);</div><div class='del'>-	io_wqe_insert_work(wqe, work);</div><div class='del'>-	clear_bit(IO_ACCT_STALLED_BIT, &amp;acct-&gt;flags);</div><div class='del'>-</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	do_create = !io_wqe_activate_free_worker(wqe, acct);</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-</div><div class='del'>-	raw_spin_unlock(&amp;wqe-&gt;lock);</div><div class='del'>-</div><div class='del'>-	if (do_create &amp;&amp; ((work_flags &amp; IO_WQ_WORK_CONCURRENT) ||</div><div class='del'>-	    !atomic_read(&amp;acct-&gt;nr_running))) {</div><div class='del'>-		bool did_create;</div><div class='del'>-</div><div class='del'>-		did_create = io_wqe_create_worker(wqe, acct);</div><div class='del'>-		if (likely(did_create))</div><div class='del'>-			return;</div><div class='del'>-</div><div class='del'>-		raw_spin_lock(&amp;wqe-&gt;lock);</div><div class='del'>-		/* fatal condition, failed to create the first worker */</div><div class='del'>-		if (!acct-&gt;nr_workers) {</div><div class='del'>-			struct io_cb_cancel_data match = {</div><div class='del'>-				.fn		= io_wq_work_match_item,</div><div class='del'>-				.data		= work,</div><div class='del'>-				.cancel_all	= false,</div><div class='del'>-			};</div><div class='del'>-</div><div class='del'>-			if (io_acct_cancel_pending_work(wqe, acct, &amp;match))</div><div class='del'>-				raw_spin_lock(&amp;wqe-&gt;lock);</div><div class='del'>-		}</div><div class='del'>-		raw_spin_unlock(&amp;wqe-&gt;lock);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void io_wq_enqueue(struct io_wq *wq, struct io_wq_work *work)</div><div class='del'>-{</div><div class='del'>-	struct io_wqe *wqe = wq-&gt;wqes[numa_node_id()];</div><div class='del'>-</div><div class='del'>-	io_wqe_enqueue(wqe, work);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Work items that hash to the same value will not be done in parallel.</div><div class='del'>- * Used to limit concurrent writes, generally hashed by inode.</div><div class='del'>- */</div><div class='del'>-void io_wq_hash_work(struct io_wq_work *work, void *val)</div><div class='del'>-{</div><div class='del'>-	unsigned int bit;</div><div class='del'>-</div><div class='del'>-	bit = hash_ptr(val, IO_WQ_HASH_ORDER);</div><div class='del'>-	work-&gt;flags |= (IO_WQ_WORK_HASHED | (bit &lt;&lt; IO_WQ_HASH_SHIFT));</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool io_wq_worker_cancel(struct io_worker *worker, void *data)</div><div class='del'>-{</div><div class='del'>-	struct io_cb_cancel_data *match = data;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Hold the lock to avoid -&gt;cur_work going out of scope, caller</div><div class='del'>-	 * may dereference the passed in work.</div><div class='del'>-	 */</div><div class='del'>-	spin_lock(&amp;worker-&gt;lock);</div><div class='del'>-	if (worker-&gt;cur_work &amp;&amp;</div><div class='del'>-	    match-&gt;fn(worker-&gt;cur_work, match-&gt;data)) {</div><div class='del'>-		set_notify_signal(worker-&gt;task);</div><div class='del'>-		match-&gt;nr_running++;</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;worker-&gt;lock);</div><div class='del'>-</div><div class='del'>-	return match-&gt;nr_running &amp;&amp; !match-&gt;cancel_all;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void io_wqe_remove_pending(struct io_wqe *wqe,</div><div class='del'>-					 struct io_wq_work *work,</div><div class='del'>-					 struct io_wq_work_node *prev)</div><div class='del'>-{</div><div class='del'>-	struct io_wqe_acct *acct = io_work_get_acct(wqe, work);</div><div class='del'>-	unsigned int hash = io_get_work_hash(work);</div><div class='del'>-	struct io_wq_work *prev_work = NULL;</div><div class='del'>-</div><div class='del'>-	if (io_wq_is_hashed(work) &amp;&amp; work == wqe-&gt;hash_tail[hash]) {</div><div class='del'>-		if (prev)</div><div class='del'>-			prev_work = container_of(prev, struct io_wq_work, list);</div><div class='del'>-		if (prev_work &amp;&amp; io_get_work_hash(prev_work) == hash)</div><div class='del'>-			wqe-&gt;hash_tail[hash] = prev_work;</div><div class='del'>-		else</div><div class='del'>-			wqe-&gt;hash_tail[hash] = NULL;</div><div class='del'>-	}</div><div class='del'>-	wq_list_del(&amp;acct-&gt;work_list, &amp;work-&gt;list, prev);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool io_acct_cancel_pending_work(struct io_wqe *wqe,</div><div class='del'>-					struct io_wqe_acct *acct,</div><div class='del'>-					struct io_cb_cancel_data *match)</div><div class='del'>-	__releases(wqe-&gt;lock)</div><div class='del'>-{</div><div class='del'>-	struct io_wq_work_node *node, *prev;</div><div class='del'>-	struct io_wq_work *work;</div><div class='del'>-</div><div class='del'>-	wq_list_for_each(node, prev, &amp;acct-&gt;work_list) {</div><div class='del'>-		work = container_of(node, struct io_wq_work, list);</div><div class='del'>-		if (!match-&gt;fn(work, match-&gt;data))</div><div class='del'>-			continue;</div><div class='del'>-		io_wqe_remove_pending(wqe, work, prev);</div><div class='del'>-		raw_spin_unlock(&amp;wqe-&gt;lock);</div><div class='del'>-		io_run_cancel(work, wqe);</div><div class='del'>-		match-&gt;nr_pending++;</div><div class='del'>-		/* not safe to continue after unlock */</div><div class='del'>-		return true;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_wqe_cancel_pending_work(struct io_wqe *wqe,</div><div class='del'>-				       struct io_cb_cancel_data *match)</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-retry:</div><div class='del'>-	raw_spin_lock(&amp;wqe-&gt;lock);</div><div class='del'>-	for (i = 0; i &lt; IO_WQ_ACCT_NR; i++) {</div><div class='del'>-		struct io_wqe_acct *acct = io_get_acct(wqe, i == 0);</div><div class='del'>-</div><div class='del'>-		if (io_acct_cancel_pending_work(wqe, acct, match)) {</div><div class='del'>-			if (match-&gt;cancel_all)</div><div class='del'>-				goto retry;</div><div class='del'>-			return;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	raw_spin_unlock(&amp;wqe-&gt;lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_wqe_cancel_running_work(struct io_wqe *wqe,</div><div class='del'>-				       struct io_cb_cancel_data *match)</div><div class='del'>-{</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	io_wq_for_each_worker(wqe, io_wq_worker_cancel, match);</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-enum io_wq_cancel io_wq_cancel_cb(struct io_wq *wq, work_cancel_fn *cancel,</div><div class='del'>-				  void *data, bool cancel_all)</div><div class='del'>-{</div><div class='del'>-	struct io_cb_cancel_data match = {</div><div class='del'>-		.fn		= cancel,</div><div class='del'>-		.data		= data,</div><div class='del'>-		.cancel_all	= cancel_all,</div><div class='del'>-	};</div><div class='del'>-	int node;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * First check pending list, if we're lucky we can just remove it</div><div class='del'>-	 * from there. CANCEL_OK means that the work is returned as-new,</div><div class='del'>-	 * no completion will be posted for it.</div><div class='del'>-	 */</div><div class='del'>-	for_each_node(node) {</div><div class='del'>-		struct io_wqe *wqe = wq-&gt;wqes[node];</div><div class='del'>-</div><div class='del'>-		io_wqe_cancel_pending_work(wqe, &amp;match);</div><div class='del'>-		if (match.nr_pending &amp;&amp; !match.cancel_all)</div><div class='del'>-			return IO_WQ_CANCEL_OK;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Now check if a free (going busy) or busy worker has the work</div><div class='del'>-	 * currently running. If we find it there, we'll return CANCEL_RUNNING</div><div class='del'>-	 * as an indication that we attempt to signal cancellation. The</div><div class='del'>-	 * completion will run normally in this case.</div><div class='del'>-	 */</div><div class='del'>-	for_each_node(node) {</div><div class='del'>-		struct io_wqe *wqe = wq-&gt;wqes[node];</div><div class='del'>-</div><div class='del'>-		io_wqe_cancel_running_work(wqe, &amp;match);</div><div class='del'>-		if (match.nr_running &amp;&amp; !match.cancel_all)</div><div class='del'>-			return IO_WQ_CANCEL_RUNNING;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (match.nr_running)</div><div class='del'>-		return IO_WQ_CANCEL_RUNNING;</div><div class='del'>-	if (match.nr_pending)</div><div class='del'>-		return IO_WQ_CANCEL_OK;</div><div class='del'>-	return IO_WQ_CANCEL_NOTFOUND;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_wqe_hash_wake(struct wait_queue_entry *wait, unsigned mode,</div><div class='del'>-			    int sync, void *key)</div><div class='del'>-{</div><div class='del'>-	struct io_wqe *wqe = container_of(wait, struct io_wqe, wait);</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	list_del_init(&amp;wait-&gt;entry);</div><div class='del'>-</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	for (i = 0; i &lt; IO_WQ_ACCT_NR; i++) {</div><div class='del'>-		struct io_wqe_acct *acct = &amp;wqe-&gt;acct[i];</div><div class='del'>-</div><div class='del'>-		if (test_and_clear_bit(IO_ACCT_STALLED_BIT, &amp;acct-&gt;flags))</div><div class='del'>-			io_wqe_activate_free_worker(wqe, acct);</div><div class='del'>-	}</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-	return 1;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct io_wq *io_wq_create(unsigned bounded, struct io_wq_data *data)</div><div class='del'>-{</div><div class='del'>-	int ret, node, i;</div><div class='del'>-	struct io_wq *wq;</div><div class='del'>-</div><div class='del'>-	if (WARN_ON_ONCE(!data-&gt;free_work || !data-&gt;do_work))</div><div class='del'>-		return ERR_PTR(-EINVAL);</div><div class='del'>-	if (WARN_ON_ONCE(!bounded))</div><div class='del'>-		return ERR_PTR(-EINVAL);</div><div class='del'>-</div><div class='del'>-	wq = kzalloc(struct_size(wq, wqes, nr_node_ids), GFP_KERNEL);</div><div class='del'>-	if (!wq)</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='del'>-	ret = cpuhp_state_add_instance_nocalls(io_wq_online, &amp;wq-&gt;cpuhp_node);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto err_wq;</div><div class='del'>-</div><div class='del'>-	refcount_inc(&amp;data-&gt;hash-&gt;refs);</div><div class='del'>-	wq-&gt;hash = data-&gt;hash;</div><div class='del'>-	wq-&gt;free_work = data-&gt;free_work;</div><div class='del'>-	wq-&gt;do_work = data-&gt;do_work;</div><div class='del'>-</div><div class='del'>-	ret = -ENOMEM;</div><div class='del'>-	for_each_node(node) {</div><div class='del'>-		struct io_wqe *wqe;</div><div class='del'>-		int alloc_node = node;</div><div class='del'>-</div><div class='del'>-		if (!node_online(alloc_node))</div><div class='del'>-			alloc_node = NUMA_NO_NODE;</div><div class='del'>-		wqe = kzalloc_node(sizeof(struct io_wqe), GFP_KERNEL, alloc_node);</div><div class='del'>-		if (!wqe)</div><div class='del'>-			goto err;</div><div class='del'>-		if (!alloc_cpumask_var(&amp;wqe-&gt;cpu_mask, GFP_KERNEL))</div><div class='del'>-			goto err;</div><div class='del'>-		cpumask_copy(wqe-&gt;cpu_mask, cpumask_of_node(node));</div><div class='del'>-		wq-&gt;wqes[node] = wqe;</div><div class='del'>-		wqe-&gt;node = alloc_node;</div><div class='del'>-		wqe-&gt;acct[IO_WQ_ACCT_BOUND].max_workers = bounded;</div><div class='del'>-		wqe-&gt;acct[IO_WQ_ACCT_UNBOUND].max_workers =</div><div class='del'>-					task_rlimit(current, RLIMIT_NPROC);</div><div class='del'>-		INIT_LIST_HEAD(&amp;wqe-&gt;wait.entry);</div><div class='del'>-		wqe-&gt;wait.func = io_wqe_hash_wake;</div><div class='del'>-		for (i = 0; i &lt; IO_WQ_ACCT_NR; i++) {</div><div class='del'>-			struct io_wqe_acct *acct = &amp;wqe-&gt;acct[i];</div><div class='del'>-</div><div class='del'>-			acct-&gt;index = i;</div><div class='del'>-			atomic_set(&amp;acct-&gt;nr_running, 0);</div><div class='del'>-			INIT_WQ_LIST(&amp;acct-&gt;work_list);</div><div class='del'>-		}</div><div class='del'>-		wqe-&gt;wq = wq;</div><div class='del'>-		raw_spin_lock_init(&amp;wqe-&gt;lock);</div><div class='del'>-		INIT_HLIST_NULLS_HEAD(&amp;wqe-&gt;free_list, 0);</div><div class='del'>-		INIT_LIST_HEAD(&amp;wqe-&gt;all_list);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	wq-&gt;task = get_task_struct(data-&gt;task);</div><div class='del'>-	atomic_set(&amp;wq-&gt;worker_refs, 1);</div><div class='del'>-	init_completion(&amp;wq-&gt;worker_done);</div><div class='del'>-	return wq;</div><div class='del'>-err:</div><div class='del'>-	io_wq_put_hash(data-&gt;hash);</div><div class='del'>-	cpuhp_state_remove_instance_nocalls(io_wq_online, &amp;wq-&gt;cpuhp_node);</div><div class='del'>-	for_each_node(node) {</div><div class='del'>-		if (!wq-&gt;wqes[node])</div><div class='del'>-			continue;</div><div class='del'>-		free_cpumask_var(wq-&gt;wqes[node]-&gt;cpu_mask);</div><div class='del'>-		kfree(wq-&gt;wqes[node]);</div><div class='del'>-	}</div><div class='del'>-err_wq:</div><div class='del'>-	kfree(wq);</div><div class='del'>-	return ERR_PTR(ret);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool io_task_work_match(struct callback_head *cb, void *data)</div><div class='del'>-{</div><div class='del'>-	struct io_worker *worker;</div><div class='del'>-</div><div class='del'>-	if (cb-&gt;func != create_worker_cb &amp;&amp; cb-&gt;func != create_worker_cont)</div><div class='del'>-		return false;</div><div class='del'>-	worker = container_of(cb, struct io_worker, create_work);</div><div class='del'>-	return worker-&gt;wqe-&gt;wq == data;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void io_wq_exit_start(struct io_wq *wq)</div><div class='del'>-{</div><div class='del'>-	set_bit(IO_WQ_BIT_EXIT, &amp;wq-&gt;state);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_wq_exit_workers(struct io_wq *wq)</div><div class='del'>-{</div><div class='del'>-	struct callback_head *cb;</div><div class='del'>-	int node;</div><div class='del'>-</div><div class='del'>-	if (!wq-&gt;task)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	while ((cb = task_work_cancel_match(wq-&gt;task, io_task_work_match, wq)) != NULL) {</div><div class='del'>-		struct io_worker *worker;</div><div class='del'>-</div><div class='del'>-		worker = container_of(cb, struct io_worker, create_work);</div><div class='del'>-		io_worker_cancel_cb(worker);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	for_each_node(node) {</div><div class='del'>-		struct io_wqe *wqe = wq-&gt;wqes[node];</div><div class='del'>-</div><div class='del'>-		io_wq_for_each_worker(wqe, io_wq_worker_wake, NULL);</div><div class='del'>-	}</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-	io_worker_ref_put(wq);</div><div class='del'>-	wait_for_completion(&amp;wq-&gt;worker_done);</div><div class='del'>-</div><div class='del'>-	for_each_node(node) {</div><div class='del'>-		spin_lock_irq(&amp;wq-&gt;hash-&gt;wait.lock);</div><div class='del'>-		list_del_init(&amp;wq-&gt;wqes[node]-&gt;wait.entry);</div><div class='del'>-		spin_unlock_irq(&amp;wq-&gt;hash-&gt;wait.lock);</div><div class='del'>-	}</div><div class='del'>-	put_task_struct(wq-&gt;task);</div><div class='del'>-	wq-&gt;task = NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_wq_destroy(struct io_wq *wq)</div><div class='del'>-{</div><div class='del'>-	int node;</div><div class='del'>-</div><div class='del'>-	cpuhp_state_remove_instance_nocalls(io_wq_online, &amp;wq-&gt;cpuhp_node);</div><div class='del'>-</div><div class='del'>-	for_each_node(node) {</div><div class='del'>-		struct io_wqe *wqe = wq-&gt;wqes[node];</div><div class='del'>-		struct io_cb_cancel_data match = {</div><div class='del'>-			.fn		= io_wq_work_match_all,</div><div class='del'>-			.cancel_all	= true,</div><div class='del'>-		};</div><div class='del'>-		io_wqe_cancel_pending_work(wqe, &amp;match);</div><div class='del'>-		free_cpumask_var(wqe-&gt;cpu_mask);</div><div class='del'>-		kfree(wqe);</div><div class='del'>-	}</div><div class='del'>-	io_wq_put_hash(wq-&gt;hash);</div><div class='del'>-	kfree(wq);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void io_wq_put_and_exit(struct io_wq *wq)</div><div class='del'>-{</div><div class='del'>-	WARN_ON_ONCE(!test_bit(IO_WQ_BIT_EXIT, &amp;wq-&gt;state));</div><div class='del'>-</div><div class='del'>-	io_wq_exit_workers(wq);</div><div class='del'>-	io_wq_destroy(wq);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct online_data {</div><div class='del'>-	unsigned int cpu;</div><div class='del'>-	bool online;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static bool io_wq_worker_affinity(struct io_worker *worker, void *data)</div><div class='del'>-{</div><div class='del'>-	struct online_data *od = data;</div><div class='del'>-</div><div class='del'>-	if (od-&gt;online)</div><div class='del'>-		cpumask_set_cpu(od-&gt;cpu, worker-&gt;wqe-&gt;cpu_mask);</div><div class='del'>-	else</div><div class='del'>-		cpumask_clear_cpu(od-&gt;cpu, worker-&gt;wqe-&gt;cpu_mask);</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int __io_wq_cpu_online(struct io_wq *wq, unsigned int cpu, bool online)</div><div class='del'>-{</div><div class='del'>-	struct online_data od = {</div><div class='del'>-		.cpu = cpu,</div><div class='del'>-		.online = online</div><div class='del'>-	};</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	for_each_node(i)</div><div class='del'>-		io_wq_for_each_worker(wq-&gt;wqes[i], io_wq_worker_affinity, &amp;od);</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_wq_cpu_online(unsigned int cpu, struct hlist_node *node)</div><div class='del'>-{</div><div class='del'>-	struct io_wq *wq = hlist_entry_safe(node, struct io_wq, cpuhp_node);</div><div class='del'>-</div><div class='del'>-	return __io_wq_cpu_online(wq, cpu, true);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_wq_cpu_offline(unsigned int cpu, struct hlist_node *node)</div><div class='del'>-{</div><div class='del'>-	struct io_wq *wq = hlist_entry_safe(node, struct io_wq, cpuhp_node);</div><div class='del'>-</div><div class='del'>-	return __io_wq_cpu_online(wq, cpu, false);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int io_wq_cpu_affinity(struct io_wq *wq, cpumask_var_t mask)</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	for_each_node(i) {</div><div class='del'>-		struct io_wqe *wqe = wq-&gt;wqes[i];</div><div class='del'>-</div><div class='del'>-		if (mask)</div><div class='del'>-			cpumask_copy(wqe-&gt;cpu_mask, mask);</div><div class='del'>-		else</div><div class='del'>-			cpumask_copy(wqe-&gt;cpu_mask, cpumask_of_node(i));</div><div class='del'>-	}</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Set max number of unbounded workers, returns old value. If new_count is 0,</div><div class='del'>- * then just return the old value.</div><div class='del'>- */</div><div class='del'>-int io_wq_max_workers(struct io_wq *wq, int *new_count)</div><div class='del'>-{</div><div class='del'>-	int prev[IO_WQ_ACCT_NR];</div><div class='del'>-	bool first_node = true;</div><div class='del'>-	int i, node;</div><div class='del'>-</div><div class='del'>-	BUILD_BUG_ON((int) IO_WQ_ACCT_BOUND   != (int) IO_WQ_BOUND);</div><div class='del'>-	BUILD_BUG_ON((int) IO_WQ_ACCT_UNBOUND != (int) IO_WQ_UNBOUND);</div><div class='del'>-	BUILD_BUG_ON((int) IO_WQ_ACCT_NR      != 2);</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; 2; i++) {</div><div class='del'>-		if (new_count[i] &gt; task_rlimit(current, RLIMIT_NPROC))</div><div class='del'>-			new_count[i] = task_rlimit(current, RLIMIT_NPROC);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; IO_WQ_ACCT_NR; i++)</div><div class='del'>-		prev[i] = 0;</div><div class='del'>-</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	for_each_node(node) {</div><div class='del'>-		struct io_wqe *wqe = wq-&gt;wqes[node];</div><div class='del'>-		struct io_wqe_acct *acct;</div><div class='del'>-</div><div class='del'>-		raw_spin_lock(&amp;wqe-&gt;lock);</div><div class='del'>-		for (i = 0; i &lt; IO_WQ_ACCT_NR; i++) {</div><div class='del'>-			acct = &amp;wqe-&gt;acct[i];</div><div class='del'>-			if (first_node)</div><div class='del'>-				prev[i] = max_t(int, acct-&gt;max_workers, prev[i]);</div><div class='del'>-			if (new_count[i])</div><div class='del'>-				acct-&gt;max_workers = new_count[i];</div><div class='del'>-		}</div><div class='del'>-		raw_spin_unlock(&amp;wqe-&gt;lock);</div><div class='del'>-		first_node = false;</div><div class='del'>-	}</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; IO_WQ_ACCT_NR; i++)</div><div class='del'>-		new_count[i] = prev[i];</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __init int io_wq_init(void)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ret = cpuhp_setup_state_multi(CPUHP_AP_ONLINE_DYN, "io-wq/online",</div><div class='del'>-					io_wq_cpu_online, io_wq_cpu_offline);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		return ret;</div><div class='del'>-	io_wq_online = ret;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-subsys_initcall(io_wq_init);</div><div class='head'>diff --git a/fs/io-wq.h b/fs/io-wq.h<br/>deleted file mode 100644<br/>index 41bf37674a49..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/io-wq.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/io-wq.h</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,205 +0,0 @@</div><div class='del'>-#ifndef INTERNAL_IO_WQ_H</div><div class='del'>-#define INTERNAL_IO_WQ_H</div><div class='del'>-</div><div class='del'>-#include &lt;linux/refcount.h&gt;</div><div class='del'>-</div><div class='del'>-struct io_wq;</div><div class='del'>-</div><div class='del'>-enum {</div><div class='del'>-	IO_WQ_WORK_CANCEL	= 1,</div><div class='del'>-	IO_WQ_WORK_HASHED	= 2,</div><div class='del'>-	IO_WQ_WORK_UNBOUND	= 4,</div><div class='del'>-	IO_WQ_WORK_CONCURRENT	= 16,</div><div class='del'>-</div><div class='del'>-	IO_WQ_HASH_SHIFT	= 24,	/* upper 8 bits are used for hash key */</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-enum io_wq_cancel {</div><div class='del'>-	IO_WQ_CANCEL_OK,	/* cancelled before started */</div><div class='del'>-	IO_WQ_CANCEL_RUNNING,	/* found, running, and attempted cancelled */</div><div class='del'>-	IO_WQ_CANCEL_NOTFOUND,	/* work not found */</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_wq_work_node {</div><div class='del'>-	struct io_wq_work_node *next;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_wq_work_list {</div><div class='del'>-	struct io_wq_work_node *first;</div><div class='del'>-	struct io_wq_work_node *last;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-#define wq_list_for_each(pos, prv, head)			\</div><div class='del'>-	for (pos = (head)-&gt;first, prv = NULL; pos; prv = pos, pos = (pos)-&gt;next)</div><div class='del'>-</div><div class='del'>-#define wq_list_for_each_resume(pos, prv)			\</div><div class='del'>-	for (; pos; prv = pos, pos = (pos)-&gt;next)</div><div class='del'>-</div><div class='del'>-#define wq_list_empty(list)	(READ_ONCE((list)-&gt;first) == NULL)</div><div class='del'>-#define INIT_WQ_LIST(list)	do {				\</div><div class='del'>-	(list)-&gt;first = NULL;					\</div><div class='del'>-} while (0)</div><div class='del'>-</div><div class='del'>-static inline void wq_list_add_after(struct io_wq_work_node *node,</div><div class='del'>-				     struct io_wq_work_node *pos,</div><div class='del'>-				     struct io_wq_work_list *list)</div><div class='del'>-{</div><div class='del'>-	struct io_wq_work_node *next = pos-&gt;next;</div><div class='del'>-</div><div class='del'>-	pos-&gt;next = node;</div><div class='del'>-	node-&gt;next = next;</div><div class='del'>-	if (!next)</div><div class='del'>-		list-&gt;last = node;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void wq_list_add_tail(struct io_wq_work_node *node,</div><div class='del'>-				    struct io_wq_work_list *list)</div><div class='del'>-{</div><div class='del'>-	node-&gt;next = NULL;</div><div class='del'>-	if (!list-&gt;first) {</div><div class='del'>-		list-&gt;last = node;</div><div class='del'>-		WRITE_ONCE(list-&gt;first, node);</div><div class='del'>-	} else {</div><div class='del'>-		list-&gt;last-&gt;next = node;</div><div class='del'>-		list-&gt;last = node;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void wq_list_add_head(struct io_wq_work_node *node,</div><div class='del'>-				    struct io_wq_work_list *list)</div><div class='del'>-{</div><div class='del'>-	node-&gt;next = list-&gt;first;</div><div class='del'>-	if (!node-&gt;next)</div><div class='del'>-		list-&gt;last = node;</div><div class='del'>-	WRITE_ONCE(list-&gt;first, node);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void wq_list_cut(struct io_wq_work_list *list,</div><div class='del'>-			       struct io_wq_work_node *last,</div><div class='del'>-			       struct io_wq_work_node *prev)</div><div class='del'>-{</div><div class='del'>-	/* first in the list, if prev==NULL */</div><div class='del'>-	if (!prev)</div><div class='del'>-		WRITE_ONCE(list-&gt;first, last-&gt;next);</div><div class='del'>-	else</div><div class='del'>-		prev-&gt;next = last-&gt;next;</div><div class='del'>-</div><div class='del'>-	if (last == list-&gt;last)</div><div class='del'>-		list-&gt;last = prev;</div><div class='del'>-	last-&gt;next = NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void __wq_list_splice(struct io_wq_work_list *list,</div><div class='del'>-				    struct io_wq_work_node *to)</div><div class='del'>-{</div><div class='del'>-	list-&gt;last-&gt;next = to-&gt;next;</div><div class='del'>-	to-&gt;next = list-&gt;first;</div><div class='del'>-	INIT_WQ_LIST(list);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline bool wq_list_splice(struct io_wq_work_list *list,</div><div class='del'>-				  struct io_wq_work_node *to)</div><div class='del'>-{</div><div class='del'>-	if (!wq_list_empty(list)) {</div><div class='del'>-		__wq_list_splice(list, to);</div><div class='del'>-		return true;</div><div class='del'>-	}</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void wq_stack_add_head(struct io_wq_work_node *node,</div><div class='del'>-				     struct io_wq_work_node *stack)</div><div class='del'>-{</div><div class='del'>-	node-&gt;next = stack-&gt;next;</div><div class='del'>-	stack-&gt;next = node;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void wq_list_del(struct io_wq_work_list *list,</div><div class='del'>-			       struct io_wq_work_node *node,</div><div class='del'>-			       struct io_wq_work_node *prev)</div><div class='del'>-{</div><div class='del'>-	wq_list_cut(list, node, prev);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline</div><div class='del'>-struct io_wq_work_node *wq_stack_extract(struct io_wq_work_node *stack)</div><div class='del'>-{</div><div class='del'>-	struct io_wq_work_node *node = stack-&gt;next;</div><div class='del'>-</div><div class='del'>-	stack-&gt;next = node-&gt;next;</div><div class='del'>-	return node;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct io_wq_work {</div><div class='del'>-	struct io_wq_work_node list;</div><div class='del'>-	unsigned flags;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static inline struct io_wq_work *wq_next_work(struct io_wq_work *work)</div><div class='del'>-{</div><div class='del'>-	if (!work-&gt;list.next)</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	return container_of(work-&gt;list.next, struct io_wq_work, list);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-typedef struct io_wq_work *(free_work_fn)(struct io_wq_work *);</div><div class='del'>-typedef void (io_wq_work_fn)(struct io_wq_work *);</div><div class='del'>-</div><div class='del'>-struct io_wq_hash {</div><div class='del'>-	refcount_t refs;</div><div class='del'>-	unsigned long map;</div><div class='del'>-	struct wait_queue_head wait;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static inline void io_wq_put_hash(struct io_wq_hash *hash)</div><div class='del'>-{</div><div class='del'>-	if (refcount_dec_and_test(&amp;hash-&gt;refs))</div><div class='del'>-		kfree(hash);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct io_wq_data {</div><div class='del'>-	struct io_wq_hash *hash;</div><div class='del'>-	struct task_struct *task;</div><div class='del'>-	io_wq_work_fn *do_work;</div><div class='del'>-	free_work_fn *free_work;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_wq *io_wq_create(unsigned bounded, struct io_wq_data *data);</div><div class='del'>-void io_wq_exit_start(struct io_wq *wq);</div><div class='del'>-void io_wq_put_and_exit(struct io_wq *wq);</div><div class='del'>-</div><div class='del'>-void io_wq_enqueue(struct io_wq *wq, struct io_wq_work *work);</div><div class='del'>-void io_wq_hash_work(struct io_wq_work *work, void *val);</div><div class='del'>-</div><div class='del'>-int io_wq_cpu_affinity(struct io_wq *wq, cpumask_var_t mask);</div><div class='del'>-int io_wq_max_workers(struct io_wq *wq, int *new_count);</div><div class='del'>-</div><div class='del'>-static inline bool io_wq_is_hashed(struct io_wq_work *work)</div><div class='del'>-{</div><div class='del'>-	return work-&gt;flags &amp; IO_WQ_WORK_HASHED;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-typedef bool (work_cancel_fn)(struct io_wq_work *, void *);</div><div class='del'>-</div><div class='del'>-enum io_wq_cancel io_wq_cancel_cb(struct io_wq *wq, work_cancel_fn *cancel,</div><div class='del'>-					void *data, bool cancel_all);</div><div class='del'>-</div><div class='del'>-#if defined(CONFIG_IO_WQ)</div><div class='del'>-extern void io_wq_worker_sleeping(struct task_struct *);</div><div class='del'>-extern void io_wq_worker_running(struct task_struct *);</div><div class='del'>-#else</div><div class='del'>-static inline void io_wq_worker_sleeping(struct task_struct *tsk)</div><div class='del'>-{</div><div class='del'>-}</div><div class='del'>-static inline void io_wq_worker_running(struct task_struct *tsk)</div><div class='del'>-{</div><div class='del'>-}</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-static inline bool io_wq_current_is_worker(void)</div><div class='del'>-{</div><div class='del'>-	return in_task() &amp;&amp; (current-&gt;flags &amp; PF_IO_WORKER) &amp;&amp;</div><div class='del'>-		current-&gt;pf_io_worker;</div><div class='del'>-}</div><div class='del'>-#endif</div><div class='head'>diff --git a/fs/io_uring.c b/fs/io_uring.c<br/>deleted file mode 100644<br/>index b07196b4511c..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/io_uring.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/io_uring.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,11127 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0</div><div class='del'>-/*</div><div class='del'>- * Shared application/kernel submission and completion ring pairs, for</div><div class='del'>- * supporting fast/efficient IO.</div><div class='del'>- *</div><div class='del'>- * A note on the read/write ordering memory barriers that are matched between</div><div class='del'>- * the application and kernel side.</div><div class='del'>- *</div><div class='del'>- * After the application reads the CQ ring tail, it must use an</div><div class='del'>- * appropriate smp_rmb() to pair with the smp_wmb() the kernel uses</div><div class='del'>- * before writing the tail (using smp_load_acquire to read the tail will</div><div class='del'>- * do). It also needs a smp_mb() before updating CQ head (ordering the</div><div class='del'>- * entry load(s) with the head store), pairing with an implicit barrier</div><div class='del'>- * through a control-dependency in io_get_cqe (smp_store_release to</div><div class='del'>- * store head will do). Failure to do so could lead to reading invalid</div><div class='del'>- * CQ entries.</div><div class='del'>- *</div><div class='del'>- * Likewise, the application must use an appropriate smp_wmb() before</div><div class='del'>- * writing the SQ tail (ordering SQ entry stores with the tail store),</div><div class='del'>- * which pairs with smp_load_acquire in io_get_sqring (smp_store_release</div><div class='del'>- * to store the tail will do). And it needs a barrier ordering the SQ</div><div class='del'>- * head load before writing new SQ entries (smp_load_acquire to read</div><div class='del'>- * head will do).</div><div class='del'>- *</div><div class='del'>- * When using the SQ poll thread (IORING_SETUP_SQPOLL), the application</div><div class='del'>- * needs to check the SQ flags for IORING_SQ_NEED_WAKEUP *after*</div><div class='del'>- * updating the SQ tail; a full memory barrier smp_mb() is needed</div><div class='del'>- * between.</div><div class='del'>- *</div><div class='del'>- * Also see the examples in the liburing library:</div><div class='del'>- *</div><div class='del'>- *	git://git.kernel.dk/liburing</div><div class='del'>- *</div><div class='del'>- * io_uring also uses READ/WRITE_ONCE() for _any_ store or load that happens</div><div class='del'>- * from data shared between the kernel and application. This is done both</div><div class='del'>- * for ordering purposes, but also to ensure that once a value is loaded from</div><div class='del'>- * data that the application could potentially modify, it remains stable.</div><div class='del'>- *</div><div class='del'>- * Copyright (C) 2018-2019 Jens Axboe</div><div class='del'>- * Copyright (c) 2018-2019 Christoph Hellwig</div><div class='del'>- */</div><div class='del'>-#include &lt;linux/kernel.h&gt;</div><div class='del'>-#include &lt;linux/init.h&gt;</div><div class='del'>-#include &lt;linux/errno.h&gt;</div><div class='del'>-#include &lt;linux/syscalls.h&gt;</div><div class='del'>-#include &lt;linux/compat.h&gt;</div><div class='del'>-#include &lt;net/compat.h&gt;</div><div class='del'>-#include &lt;linux/refcount.h&gt;</div><div class='del'>-#include &lt;linux/uio.h&gt;</div><div class='del'>-#include &lt;linux/bits.h&gt;</div><div class='del'>-</div><div class='del'>-#include &lt;linux/sched/signal.h&gt;</div><div class='del'>-#include &lt;linux/fs.h&gt;</div><div class='del'>-#include &lt;linux/file.h&gt;</div><div class='del'>-#include &lt;linux/fdtable.h&gt;</div><div class='del'>-#include &lt;linux/mm.h&gt;</div><div class='del'>-#include &lt;linux/mman.h&gt;</div><div class='del'>-#include &lt;linux/percpu.h&gt;</div><div class='del'>-#include &lt;linux/slab.h&gt;</div><div class='del'>-#include &lt;linux/blkdev.h&gt;</div><div class='del'>-#include &lt;linux/bvec.h&gt;</div><div class='del'>-#include &lt;linux/net.h&gt;</div><div class='del'>-#include &lt;net/sock.h&gt;</div><div class='del'>-#include &lt;net/af_unix.h&gt;</div><div class='del'>-#include &lt;net/scm.h&gt;</div><div class='del'>-#include &lt;linux/anon_inodes.h&gt;</div><div class='del'>-#include &lt;linux/sched/mm.h&gt;</div><div class='del'>-#include &lt;linux/uaccess.h&gt;</div><div class='del'>-#include &lt;linux/nospec.h&gt;</div><div class='del'>-#include &lt;linux/sizes.h&gt;</div><div class='del'>-#include &lt;linux/hugetlb.h&gt;</div><div class='del'>-#include &lt;linux/highmem.h&gt;</div><div class='del'>-#include &lt;linux/namei.h&gt;</div><div class='del'>-#include &lt;linux/fsnotify.h&gt;</div><div class='del'>-#include &lt;linux/fadvise.h&gt;</div><div class='del'>-#include &lt;linux/eventpoll.h&gt;</div><div class='del'>-#include &lt;linux/splice.h&gt;</div><div class='del'>-#include &lt;linux/task_work.h&gt;</div><div class='del'>-#include &lt;linux/pagemap.h&gt;</div><div class='del'>-#include &lt;linux/io_uring.h&gt;</div><div class='del'>-#include &lt;linux/tracehook.h&gt;</div><div class='del'>-#include &lt;linux/audit.h&gt;</div><div class='del'>-#include &lt;linux/security.h&gt;</div><div class='del'>-</div><div class='del'>-#define CREATE_TRACE_POINTS</div><div class='del'>-#include &lt;trace/events/io_uring.h&gt;</div><div class='del'>-</div><div class='del'>-#include &lt;uapi/linux/io_uring.h&gt;</div><div class='del'>-</div><div class='del'>-#include "internal.h"</div><div class='del'>-#include "io-wq.h"</div><div class='del'>-</div><div class='del'>-#define IORING_MAX_ENTRIES	32768</div><div class='del'>-#define IORING_MAX_CQ_ENTRIES	(2 * IORING_MAX_ENTRIES)</div><div class='del'>-#define IORING_SQPOLL_CAP_ENTRIES_VALUE 8</div><div class='del'>-</div><div class='del'>-/* only define max */</div><div class='del'>-#define IORING_MAX_FIXED_FILES	(1U &lt;&lt; 15)</div><div class='del'>-#define IORING_MAX_RESTRICTIONS	(IORING_RESTRICTION_LAST + \</div><div class='del'>-				 IORING_REGISTER_LAST + IORING_OP_LAST)</div><div class='del'>-</div><div class='del'>-#define IO_RSRC_TAG_TABLE_SHIFT	(PAGE_SHIFT - 3)</div><div class='del'>-#define IO_RSRC_TAG_TABLE_MAX	(1U &lt;&lt; IO_RSRC_TAG_TABLE_SHIFT)</div><div class='del'>-#define IO_RSRC_TAG_TABLE_MASK	(IO_RSRC_TAG_TABLE_MAX - 1)</div><div class='del'>-</div><div class='del'>-#define IORING_MAX_REG_BUFFERS	(1U &lt;&lt; 14)</div><div class='del'>-</div><div class='del'>-#define SQE_COMMON_FLAGS (IOSQE_FIXED_FILE | IOSQE_IO_LINK | \</div><div class='del'>-			  IOSQE_IO_HARDLINK | IOSQE_ASYNC)</div><div class='del'>-</div><div class='del'>-#define SQE_VALID_FLAGS	(SQE_COMMON_FLAGS|IOSQE_BUFFER_SELECT|IOSQE_IO_DRAIN)</div><div class='del'>-</div><div class='del'>-#define IO_REQ_CLEAN_FLAGS (REQ_F_BUFFER_SELECTED | REQ_F_NEED_CLEANUP | \</div><div class='del'>-				REQ_F_POLLED | REQ_F_INFLIGHT | REQ_F_CREDS | \</div><div class='del'>-				REQ_F_ASYNC_DATA)</div><div class='del'>-</div><div class='del'>-#define IO_TCTX_REFS_CACHE_NR	(1U &lt;&lt; 10)</div><div class='del'>-</div><div class='del'>-struct io_uring {</div><div class='del'>-	u32 head ____cacheline_aligned_in_smp;</div><div class='del'>-	u32 tail ____cacheline_aligned_in_smp;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * This data is shared with the application through the mmap at offsets</div><div class='del'>- * IORING_OFF_SQ_RING and IORING_OFF_CQ_RING.</div><div class='del'>- *</div><div class='del'>- * The offsets to the member fields are published through struct</div><div class='del'>- * io_sqring_offsets when calling io_uring_setup.</div><div class='del'>- */</div><div class='del'>-struct io_rings {</div><div class='del'>-	/*</div><div class='del'>-	 * Head and tail offsets into the ring; the offsets need to be</div><div class='del'>-	 * masked to get valid indices.</div><div class='del'>-	 *</div><div class='del'>-	 * The kernel controls head of the sq ring and the tail of the cq ring,</div><div class='del'>-	 * and the application controls tail of the sq ring and the head of the</div><div class='del'>-	 * cq ring.</div><div class='del'>-	 */</div><div class='del'>-	struct io_uring		sq, cq;</div><div class='del'>-	/*</div><div class='del'>-	 * Bitmasks to apply to head and tail offsets (constant, equals</div><div class='del'>-	 * ring_entries - 1)</div><div class='del'>-	 */</div><div class='del'>-	u32			sq_ring_mask, cq_ring_mask;</div><div class='del'>-	/* Ring sizes (constant, power of 2) */</div><div class='del'>-	u32			sq_ring_entries, cq_ring_entries;</div><div class='del'>-	/*</div><div class='del'>-	 * Number of invalid entries dropped by the kernel due to</div><div class='del'>-	 * invalid index stored in array</div><div class='del'>-	 *</div><div class='del'>-	 * Written by the kernel, shouldn't be modified by the</div><div class='del'>-	 * application (i.e. get number of "new events" by comparing to</div><div class='del'>-	 * cached value).</div><div class='del'>-	 *</div><div class='del'>-	 * After a new SQ head value was read by the application this</div><div class='del'>-	 * counter includes all submissions that were dropped reaching</div><div class='del'>-	 * the new SQ head (and possibly more).</div><div class='del'>-	 */</div><div class='del'>-	u32			sq_dropped;</div><div class='del'>-	/*</div><div class='del'>-	 * Runtime SQ flags</div><div class='del'>-	 *</div><div class='del'>-	 * Written by the kernel, shouldn't be modified by the</div><div class='del'>-	 * application.</div><div class='del'>-	 *</div><div class='del'>-	 * The application needs a full memory barrier before checking</div><div class='del'>-	 * for IORING_SQ_NEED_WAKEUP after updating the sq tail.</div><div class='del'>-	 */</div><div class='del'>-	u32			sq_flags;</div><div class='del'>-	/*</div><div class='del'>-	 * Runtime CQ flags</div><div class='del'>-	 *</div><div class='del'>-	 * Written by the application, shouldn't be modified by the</div><div class='del'>-	 * kernel.</div><div class='del'>-	 */</div><div class='del'>-	u32			cq_flags;</div><div class='del'>-	/*</div><div class='del'>-	 * Number of completion events lost because the queue was full;</div><div class='del'>-	 * this should be avoided by the application by making sure</div><div class='del'>-	 * there are not more requests pending than there is space in</div><div class='del'>-	 * the completion queue.</div><div class='del'>-	 *</div><div class='del'>-	 * Written by the kernel, shouldn't be modified by the</div><div class='del'>-	 * application (i.e. get number of "new events" by comparing to</div><div class='del'>-	 * cached value).</div><div class='del'>-	 *</div><div class='del'>-	 * As completion events come in out of order this counter is not</div><div class='del'>-	 * ordered with any other data.</div><div class='del'>-	 */</div><div class='del'>-	u32			cq_overflow;</div><div class='del'>-	/*</div><div class='del'>-	 * Ring buffer of completion events.</div><div class='del'>-	 *</div><div class='del'>-	 * The kernel writes completion events fresh every time they are</div><div class='del'>-	 * produced, so the application is allowed to modify pending</div><div class='del'>-	 * entries.</div><div class='del'>-	 */</div><div class='del'>-	struct io_uring_cqe	cqes[] ____cacheline_aligned_in_smp;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-enum io_uring_cmd_flags {</div><div class='del'>-	IO_URING_F_COMPLETE_DEFER	= 1,</div><div class='del'>-	IO_URING_F_UNLOCKED		= 2,</div><div class='del'>-	/* int's last bit, sign checks are usually faster than a bit test */</div><div class='del'>-	IO_URING_F_NONBLOCK		= INT_MIN,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_mapped_ubuf {</div><div class='del'>-	u64		ubuf;</div><div class='del'>-	u64		ubuf_end;</div><div class='del'>-	unsigned int	nr_bvecs;</div><div class='del'>-	unsigned long	acct_pages;</div><div class='del'>-	struct bio_vec	bvec[];</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_ring_ctx;</div><div class='del'>-</div><div class='del'>-struct io_overflow_cqe {</div><div class='del'>-	struct io_uring_cqe cqe;</div><div class='del'>-	struct list_head list;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_fixed_file {</div><div class='del'>-	/* file * with additional FFS_* flags */</div><div class='del'>-	unsigned long file_ptr;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_rsrc_put {</div><div class='del'>-	struct list_head list;</div><div class='del'>-	u64 tag;</div><div class='del'>-	union {</div><div class='del'>-		void *rsrc;</div><div class='del'>-		struct file *file;</div><div class='del'>-		struct io_mapped_ubuf *buf;</div><div class='del'>-	};</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_file_table {</div><div class='del'>-	struct io_fixed_file *files;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_rsrc_node {</div><div class='del'>-	struct percpu_ref		refs;</div><div class='del'>-	struct list_head		node;</div><div class='del'>-	struct list_head		rsrc_list;</div><div class='del'>-	struct io_rsrc_data		*rsrc_data;</div><div class='del'>-	struct llist_node		llist;</div><div class='del'>-	bool				done;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-typedef void (rsrc_put_fn)(struct io_ring_ctx *ctx, struct io_rsrc_put *prsrc);</div><div class='del'>-</div><div class='del'>-struct io_rsrc_data {</div><div class='del'>-	struct io_ring_ctx		*ctx;</div><div class='del'>-</div><div class='del'>-	u64				**tags;</div><div class='del'>-	unsigned int			nr;</div><div class='del'>-	rsrc_put_fn			*do_put;</div><div class='del'>-	atomic_t			refs;</div><div class='del'>-	struct completion		done;</div><div class='del'>-	bool				quiesce;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_buffer {</div><div class='del'>-	struct list_head list;</div><div class='del'>-	__u64 addr;</div><div class='del'>-	__u32 len;</div><div class='del'>-	__u16 bid;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_restriction {</div><div class='del'>-	DECLARE_BITMAP(register_op, IORING_REGISTER_LAST);</div><div class='del'>-	DECLARE_BITMAP(sqe_op, IORING_OP_LAST);</div><div class='del'>-	u8 sqe_flags_allowed;</div><div class='del'>-	u8 sqe_flags_required;</div><div class='del'>-	bool registered;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-enum {</div><div class='del'>-	IO_SQ_THREAD_SHOULD_STOP = 0,</div><div class='del'>-	IO_SQ_THREAD_SHOULD_PARK,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_sq_data {</div><div class='del'>-	refcount_t		refs;</div><div class='del'>-	atomic_t		park_pending;</div><div class='del'>-	struct mutex		lock;</div><div class='del'>-</div><div class='del'>-	/* ctx's that are using this sqd */</div><div class='del'>-	struct list_head	ctx_list;</div><div class='del'>-</div><div class='del'>-	struct task_struct	*thread;</div><div class='del'>-	struct wait_queue_head	wait;</div><div class='del'>-</div><div class='del'>-	unsigned		sq_thread_idle;</div><div class='del'>-	int			sq_cpu;</div><div class='del'>-	pid_t			task_pid;</div><div class='del'>-	pid_t			task_tgid;</div><div class='del'>-</div><div class='del'>-	unsigned long		state;</div><div class='del'>-	struct completion	exited;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-#define IO_COMPL_BATCH			32</div><div class='del'>-#define IO_REQ_CACHE_SIZE		32</div><div class='del'>-#define IO_REQ_ALLOC_BATCH		8</div><div class='del'>-</div><div class='del'>-struct io_submit_link {</div><div class='del'>-	struct io_kiocb		*head;</div><div class='del'>-	struct io_kiocb		*last;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_submit_state {</div><div class='del'>-	/* inline/task_work completion list, under -&gt;uring_lock */</div><div class='del'>-	struct io_wq_work_node	free_list;</div><div class='del'>-	/* batch completion logic */</div><div class='del'>-	struct io_wq_work_list	compl_reqs;</div><div class='del'>-	struct io_submit_link	link;</div><div class='del'>-</div><div class='del'>-	bool			plug_started;</div><div class='del'>-	bool			need_plug;</div><div class='del'>-	unsigned short		submit_nr;</div><div class='del'>-	struct blk_plug		plug;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_ring_ctx {</div><div class='del'>-	/* const or read-mostly hot data */</div><div class='del'>-	struct {</div><div class='del'>-		struct percpu_ref	refs;</div><div class='del'>-</div><div class='del'>-		struct io_rings		*rings;</div><div class='del'>-		unsigned int		flags;</div><div class='del'>-		unsigned int		compat: 1;</div><div class='del'>-		unsigned int		drain_next: 1;</div><div class='del'>-		unsigned int		eventfd_async: 1;</div><div class='del'>-		unsigned int		restricted: 1;</div><div class='del'>-		unsigned int		off_timeout_used: 1;</div><div class='del'>-		unsigned int		drain_active: 1;</div><div class='del'>-	} ____cacheline_aligned_in_smp;</div><div class='del'>-</div><div class='del'>-	/* submission data */</div><div class='del'>-	struct {</div><div class='del'>-		struct mutex		uring_lock;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Ring buffer of indices into array of io_uring_sqe, which is</div><div class='del'>-		 * mmapped by the application using the IORING_OFF_SQES offset.</div><div class='del'>-		 *</div><div class='del'>-		 * This indirection could e.g. be used to assign fixed</div><div class='del'>-		 * io_uring_sqe entries to operations and only submit them to</div><div class='del'>-		 * the queue when needed.</div><div class='del'>-		 *</div><div class='del'>-		 * The kernel modifies neither the indices array nor the entries</div><div class='del'>-		 * array.</div><div class='del'>-		 */</div><div class='del'>-		u32			*sq_array;</div><div class='del'>-		struct io_uring_sqe	*sq_sqes;</div><div class='del'>-		unsigned		cached_sq_head;</div><div class='del'>-		unsigned		sq_entries;</div><div class='del'>-		struct list_head	defer_list;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Fixed resources fast path, should be accessed only under</div><div class='del'>-		 * uring_lock, and updated through io_uring_register(2)</div><div class='del'>-		 */</div><div class='del'>-		struct io_rsrc_node	*rsrc_node;</div><div class='del'>-		int			rsrc_cached_refs;</div><div class='del'>-		struct io_file_table	file_table;</div><div class='del'>-		unsigned		nr_user_files;</div><div class='del'>-		unsigned		nr_user_bufs;</div><div class='del'>-		struct io_mapped_ubuf	**user_bufs;</div><div class='del'>-</div><div class='del'>-		struct io_submit_state	submit_state;</div><div class='del'>-		struct list_head	timeout_list;</div><div class='del'>-		struct list_head	ltimeout_list;</div><div class='del'>-		struct list_head	cq_overflow_list;</div><div class='del'>-		struct xarray		io_buffers;</div><div class='del'>-		struct xarray		personalities;</div><div class='del'>-		u32			pers_next;</div><div class='del'>-		unsigned		sq_thread_idle;</div><div class='del'>-	} ____cacheline_aligned_in_smp;</div><div class='del'>-</div><div class='del'>-	/* IRQ completion list, under -&gt;completion_lock */</div><div class='del'>-	struct io_wq_work_list	locked_free_list;</div><div class='del'>-	unsigned int		locked_free_nr;</div><div class='del'>-</div><div class='del'>-	const struct cred	*sq_creds;	/* cred used for __io_sq_thread() */</div><div class='del'>-	struct io_sq_data	*sq_data;	/* if using sq thread polling */</div><div class='del'>-</div><div class='del'>-	struct wait_queue_head	sqo_sq_wait;</div><div class='del'>-	struct list_head	sqd_list;</div><div class='del'>-</div><div class='del'>-	unsigned long		check_cq_overflow;</div><div class='del'>-</div><div class='del'>-	struct {</div><div class='del'>-		unsigned		cached_cq_tail;</div><div class='del'>-		unsigned		cq_entries;</div><div class='del'>-		struct eventfd_ctx	*cq_ev_fd;</div><div class='del'>-		struct wait_queue_head	cq_wait;</div><div class='del'>-		unsigned		cq_extra;</div><div class='del'>-		atomic_t		cq_timeouts;</div><div class='del'>-		unsigned		cq_last_tm_flush;</div><div class='del'>-	} ____cacheline_aligned_in_smp;</div><div class='del'>-</div><div class='del'>-	struct {</div><div class='del'>-		spinlock_t		completion_lock;</div><div class='del'>-</div><div class='del'>-		spinlock_t		timeout_lock;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * -&gt;iopoll_list is protected by the ctx-&gt;uring_lock for</div><div class='del'>-		 * io_uring instances that don't use IORING_SETUP_SQPOLL.</div><div class='del'>-		 * For SQPOLL, only the single threaded io_sq_thread() will</div><div class='del'>-		 * manipulate the list, hence no extra locking is needed there.</div><div class='del'>-		 */</div><div class='del'>-		struct io_wq_work_list	iopoll_list;</div><div class='del'>-		struct hlist_head	*cancel_hash;</div><div class='del'>-		unsigned		cancel_hash_bits;</div><div class='del'>-		bool			poll_multi_queue;</div><div class='del'>-	} ____cacheline_aligned_in_smp;</div><div class='del'>-</div><div class='del'>-	struct io_restriction		restrictions;</div><div class='del'>-</div><div class='del'>-	/* slow path rsrc auxilary data, used by update/register */</div><div class='del'>-	struct {</div><div class='del'>-		struct io_rsrc_node		*rsrc_backup_node;</div><div class='del'>-		struct io_mapped_ubuf		*dummy_ubuf;</div><div class='del'>-		struct io_rsrc_data		*file_data;</div><div class='del'>-		struct io_rsrc_data		*buf_data;</div><div class='del'>-</div><div class='del'>-		struct delayed_work		rsrc_put_work;</div><div class='del'>-		struct llist_head		rsrc_put_llist;</div><div class='del'>-		struct list_head		rsrc_ref_list;</div><div class='del'>-		spinlock_t			rsrc_ref_lock;</div><div class='del'>-	};</div><div class='del'>-</div><div class='del'>-	/* Keep this last, we don't need it for the fast path */</div><div class='del'>-	struct {</div><div class='del'>-		#if defined(CONFIG_UNIX)</div><div class='del'>-			struct socket		*ring_sock;</div><div class='del'>-		#endif</div><div class='del'>-		/* hashed buffered write serialization */</div><div class='del'>-		struct io_wq_hash		*hash_map;</div><div class='del'>-</div><div class='del'>-		/* Only used for accounting purposes */</div><div class='del'>-		struct user_struct		*user;</div><div class='del'>-		struct mm_struct		*mm_account;</div><div class='del'>-</div><div class='del'>-		/* ctx exit and cancelation */</div><div class='del'>-		struct llist_head		fallback_llist;</div><div class='del'>-		struct delayed_work		fallback_work;</div><div class='del'>-		struct work_struct		exit_work;</div><div class='del'>-		struct list_head		tctx_list;</div><div class='del'>-		struct completion		ref_comp;</div><div class='del'>-		u32				iowq_limits[2];</div><div class='del'>-		bool				iowq_limits_set;</div><div class='del'>-	};</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_uring_task {</div><div class='del'>-	/* submission side */</div><div class='del'>-	int			cached_refs;</div><div class='del'>-	struct xarray		xa;</div><div class='del'>-	struct wait_queue_head	wait;</div><div class='del'>-	const struct io_ring_ctx *last;</div><div class='del'>-	struct io_wq		*io_wq;</div><div class='del'>-	struct percpu_counter	inflight;</div><div class='del'>-	atomic_t		inflight_tracked;</div><div class='del'>-	atomic_t		in_idle;</div><div class='del'>-</div><div class='del'>-	spinlock_t		task_lock;</div><div class='del'>-	struct io_wq_work_list	task_list;</div><div class='del'>-	struct callback_head	task_work;</div><div class='del'>-	bool			task_running;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * First field must be the file pointer in all the</div><div class='del'>- * iocb unions! See also 'struct kiocb' in &lt;linux/fs.h&gt;</div><div class='del'>- */</div><div class='del'>-struct io_poll_iocb {</div><div class='del'>-	struct file			*file;</div><div class='del'>-	struct wait_queue_head		*head;</div><div class='del'>-	__poll_t			events;</div><div class='del'>-	bool				done;</div><div class='del'>-	bool				canceled;</div><div class='del'>-	struct wait_queue_entry		wait;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_poll_update {</div><div class='del'>-	struct file			*file;</div><div class='del'>-	u64				old_user_data;</div><div class='del'>-	u64				new_user_data;</div><div class='del'>-	__poll_t			events;</div><div class='del'>-	bool				update_events;</div><div class='del'>-	bool				update_user_data;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_close {</div><div class='del'>-	struct file			*file;</div><div class='del'>-	int				fd;</div><div class='del'>-	u32				file_slot;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_timeout_data {</div><div class='del'>-	struct io_kiocb			*req;</div><div class='del'>-	struct hrtimer			timer;</div><div class='del'>-	struct timespec64		ts;</div><div class='del'>-	enum hrtimer_mode		mode;</div><div class='del'>-	u32				flags;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_accept {</div><div class='del'>-	struct file			*file;</div><div class='del'>-	struct sockaddr __user		*addr;</div><div class='del'>-	int __user			*addr_len;</div><div class='del'>-	int				flags;</div><div class='del'>-	u32				file_slot;</div><div class='del'>-	unsigned long			nofile;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_sync {</div><div class='del'>-	struct file			*file;</div><div class='del'>-	loff_t				len;</div><div class='del'>-	loff_t				off;</div><div class='del'>-	int				flags;</div><div class='del'>-	int				mode;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_cancel {</div><div class='del'>-	struct file			*file;</div><div class='del'>-	u64				addr;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_timeout {</div><div class='del'>-	struct file			*file;</div><div class='del'>-	u32				off;</div><div class='del'>-	u32				target_seq;</div><div class='del'>-	struct list_head		list;</div><div class='del'>-	/* head of the link, used by linked timeouts only */</div><div class='del'>-	struct io_kiocb			*head;</div><div class='del'>-	/* for linked completions */</div><div class='del'>-	struct io_kiocb			*prev;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_timeout_rem {</div><div class='del'>-	struct file			*file;</div><div class='del'>-	u64				addr;</div><div class='del'>-</div><div class='del'>-	/* timeout update */</div><div class='del'>-	struct timespec64		ts;</div><div class='del'>-	u32				flags;</div><div class='del'>-	bool				ltimeout;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_rw {</div><div class='del'>-	/* NOTE: kiocb has the file as the first member, so don't do it here */</div><div class='del'>-	struct kiocb			kiocb;</div><div class='del'>-	u64				addr;</div><div class='del'>-	u64				len;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_connect {</div><div class='del'>-	struct file			*file;</div><div class='del'>-	struct sockaddr __user		*addr;</div><div class='del'>-	int				addr_len;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_sr_msg {</div><div class='del'>-	struct file			*file;</div><div class='del'>-	union {</div><div class='del'>-		struct compat_msghdr __user	*umsg_compat;</div><div class='del'>-		struct user_msghdr __user	*umsg;</div><div class='del'>-		void __user			*buf;</div><div class='del'>-	};</div><div class='del'>-	int				msg_flags;</div><div class='del'>-	int				bgid;</div><div class='del'>-	size_t				len;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_open {</div><div class='del'>-	struct file			*file;</div><div class='del'>-	int				dfd;</div><div class='del'>-	u32				file_slot;</div><div class='del'>-	struct filename			*filename;</div><div class='del'>-	struct open_how			how;</div><div class='del'>-	unsigned long			nofile;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_rsrc_update {</div><div class='del'>-	struct file			*file;</div><div class='del'>-	u64				arg;</div><div class='del'>-	u32				nr_args;</div><div class='del'>-	u32				offset;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_fadvise {</div><div class='del'>-	struct file			*file;</div><div class='del'>-	u64				offset;</div><div class='del'>-	u32				len;</div><div class='del'>-	u32				advice;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_madvise {</div><div class='del'>-	struct file			*file;</div><div class='del'>-	u64				addr;</div><div class='del'>-	u32				len;</div><div class='del'>-	u32				advice;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_epoll {</div><div class='del'>-	struct file			*file;</div><div class='del'>-	int				epfd;</div><div class='del'>-	int				op;</div><div class='del'>-	int				fd;</div><div class='del'>-	struct epoll_event		event;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_splice {</div><div class='del'>-	struct file			*file_out;</div><div class='del'>-	struct file			*file_in;</div><div class='del'>-	loff_t				off_out;</div><div class='del'>-	loff_t				off_in;</div><div class='del'>-	u64				len;</div><div class='del'>-	unsigned int			flags;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_provide_buf {</div><div class='del'>-	struct file			*file;</div><div class='del'>-	__u64				addr;</div><div class='del'>-	__u32				len;</div><div class='del'>-	__u32				bgid;</div><div class='del'>-	__u16				nbufs;</div><div class='del'>-	__u16				bid;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_statx {</div><div class='del'>-	struct file			*file;</div><div class='del'>-	int				dfd;</div><div class='del'>-	unsigned int			mask;</div><div class='del'>-	unsigned int			flags;</div><div class='del'>-	const char __user		*filename;</div><div class='del'>-	struct statx __user		*buffer;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_shutdown {</div><div class='del'>-	struct file			*file;</div><div class='del'>-	int				how;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_rename {</div><div class='del'>-	struct file			*file;</div><div class='del'>-	int				old_dfd;</div><div class='del'>-	int				new_dfd;</div><div class='del'>-	struct filename			*oldpath;</div><div class='del'>-	struct filename			*newpath;</div><div class='del'>-	int				flags;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_unlink {</div><div class='del'>-	struct file			*file;</div><div class='del'>-	int				dfd;</div><div class='del'>-	int				flags;</div><div class='del'>-	struct filename			*filename;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_mkdir {</div><div class='del'>-	struct file			*file;</div><div class='del'>-	int				dfd;</div><div class='del'>-	umode_t				mode;</div><div class='del'>-	struct filename			*filename;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_symlink {</div><div class='del'>-	struct file			*file;</div><div class='del'>-	int				new_dfd;</div><div class='del'>-	struct filename			*oldpath;</div><div class='del'>-	struct filename			*newpath;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_hardlink {</div><div class='del'>-	struct file			*file;</div><div class='del'>-	int				old_dfd;</div><div class='del'>-	int				new_dfd;</div><div class='del'>-	struct filename			*oldpath;</div><div class='del'>-	struct filename			*newpath;</div><div class='del'>-	int				flags;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_async_connect {</div><div class='del'>-	struct sockaddr_storage		address;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_async_msghdr {</div><div class='del'>-	struct iovec			fast_iov[UIO_FASTIOV];</div><div class='del'>-	/* points to an allocated iov, if NULL we use fast_iov instead */</div><div class='del'>-	struct iovec			*free_iov;</div><div class='del'>-	struct sockaddr __user		*uaddr;</div><div class='del'>-	struct msghdr			msg;</div><div class='del'>-	struct sockaddr_storage		addr;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_rw_state {</div><div class='del'>-	struct iov_iter			iter;</div><div class='del'>-	struct iov_iter_state		iter_state;</div><div class='del'>-	struct iovec			fast_iov[UIO_FASTIOV];</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_async_rw {</div><div class='del'>-	struct io_rw_state		s;</div><div class='del'>-	const struct iovec		*free_iovec;</div><div class='del'>-	size_t				bytes_done;</div><div class='del'>-	struct wait_page_queue		wpq;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-enum {</div><div class='del'>-	REQ_F_FIXED_FILE_BIT	= IOSQE_FIXED_FILE_BIT,</div><div class='del'>-	REQ_F_IO_DRAIN_BIT	= IOSQE_IO_DRAIN_BIT,</div><div class='del'>-	REQ_F_LINK_BIT		= IOSQE_IO_LINK_BIT,</div><div class='del'>-	REQ_F_HARDLINK_BIT	= IOSQE_IO_HARDLINK_BIT,</div><div class='del'>-	REQ_F_FORCE_ASYNC_BIT	= IOSQE_ASYNC_BIT,</div><div class='del'>-	REQ_F_BUFFER_SELECT_BIT	= IOSQE_BUFFER_SELECT_BIT,</div><div class='del'>-</div><div class='del'>-	/* first byte is taken by user flags, shift it to not overlap */</div><div class='del'>-	REQ_F_FAIL_BIT		= 8,</div><div class='del'>-	REQ_F_INFLIGHT_BIT,</div><div class='del'>-	REQ_F_CUR_POS_BIT,</div><div class='del'>-	REQ_F_NOWAIT_BIT,</div><div class='del'>-	REQ_F_LINK_TIMEOUT_BIT,</div><div class='del'>-	REQ_F_NEED_CLEANUP_BIT,</div><div class='del'>-	REQ_F_POLLED_BIT,</div><div class='del'>-	REQ_F_BUFFER_SELECTED_BIT,</div><div class='del'>-	REQ_F_COMPLETE_INLINE_BIT,</div><div class='del'>-	REQ_F_REISSUE_BIT,</div><div class='del'>-	REQ_F_CREDS_BIT,</div><div class='del'>-	REQ_F_REFCOUNT_BIT,</div><div class='del'>-	REQ_F_ARM_LTIMEOUT_BIT,</div><div class='del'>-	REQ_F_ASYNC_DATA_BIT,</div><div class='del'>-	/* keep async read/write and isreg together and in order */</div><div class='del'>-	REQ_F_SUPPORT_NOWAIT_BIT,</div><div class='del'>-	REQ_F_ISREG_BIT,</div><div class='del'>-</div><div class='del'>-	/* not a real bit, just to check we're not overflowing the space */</div><div class='del'>-	__REQ_F_LAST_BIT,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-enum {</div><div class='del'>-	/* ctx owns file */</div><div class='del'>-	REQ_F_FIXED_FILE	= BIT(REQ_F_FIXED_FILE_BIT),</div><div class='del'>-	/* drain existing IO first */</div><div class='del'>-	REQ_F_IO_DRAIN		= BIT(REQ_F_IO_DRAIN_BIT),</div><div class='del'>-	/* linked sqes */</div><div class='del'>-	REQ_F_LINK		= BIT(REQ_F_LINK_BIT),</div><div class='del'>-	/* doesn't sever on completion &lt; 0 */</div><div class='del'>-	REQ_F_HARDLINK		= BIT(REQ_F_HARDLINK_BIT),</div><div class='del'>-	/* IOSQE_ASYNC */</div><div class='del'>-	REQ_F_FORCE_ASYNC	= BIT(REQ_F_FORCE_ASYNC_BIT),</div><div class='del'>-	/* IOSQE_BUFFER_SELECT */</div><div class='del'>-	REQ_F_BUFFER_SELECT	= BIT(REQ_F_BUFFER_SELECT_BIT),</div><div class='del'>-</div><div class='del'>-	/* fail rest of links */</div><div class='del'>-	REQ_F_FAIL		= BIT(REQ_F_FAIL_BIT),</div><div class='del'>-	/* on inflight list, should be cancelled and waited on exit reliably */</div><div class='del'>-	REQ_F_INFLIGHT		= BIT(REQ_F_INFLIGHT_BIT),</div><div class='del'>-	/* read/write uses file position */</div><div class='del'>-	REQ_F_CUR_POS		= BIT(REQ_F_CUR_POS_BIT),</div><div class='del'>-	/* must not punt to workers */</div><div class='del'>-	REQ_F_NOWAIT		= BIT(REQ_F_NOWAIT_BIT),</div><div class='del'>-	/* has or had linked timeout */</div><div class='del'>-	REQ_F_LINK_TIMEOUT	= BIT(REQ_F_LINK_TIMEOUT_BIT),</div><div class='del'>-	/* needs cleanup */</div><div class='del'>-	REQ_F_NEED_CLEANUP	= BIT(REQ_F_NEED_CLEANUP_BIT),</div><div class='del'>-	/* already went through poll handler */</div><div class='del'>-	REQ_F_POLLED		= BIT(REQ_F_POLLED_BIT),</div><div class='del'>-	/* buffer already selected */</div><div class='del'>-	REQ_F_BUFFER_SELECTED	= BIT(REQ_F_BUFFER_SELECTED_BIT),</div><div class='del'>-	/* completion is deferred through io_comp_state */</div><div class='del'>-	REQ_F_COMPLETE_INLINE	= BIT(REQ_F_COMPLETE_INLINE_BIT),</div><div class='del'>-	/* caller should reissue async */</div><div class='del'>-	REQ_F_REISSUE		= BIT(REQ_F_REISSUE_BIT),</div><div class='del'>-	/* supports async reads/writes */</div><div class='del'>-	REQ_F_SUPPORT_NOWAIT	= BIT(REQ_F_SUPPORT_NOWAIT_BIT),</div><div class='del'>-	/* regular file */</div><div class='del'>-	REQ_F_ISREG		= BIT(REQ_F_ISREG_BIT),</div><div class='del'>-	/* has creds assigned */</div><div class='del'>-	REQ_F_CREDS		= BIT(REQ_F_CREDS_BIT),</div><div class='del'>-	/* skip refcounting if not set */</div><div class='del'>-	REQ_F_REFCOUNT		= BIT(REQ_F_REFCOUNT_BIT),</div><div class='del'>-	/* there is a linked timeout that has to be armed */</div><div class='del'>-	REQ_F_ARM_LTIMEOUT	= BIT(REQ_F_ARM_LTIMEOUT_BIT),</div><div class='del'>-	/* -&gt;async_data allocated */</div><div class='del'>-	REQ_F_ASYNC_DATA	= BIT(REQ_F_ASYNC_DATA_BIT),</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct async_poll {</div><div class='del'>-	struct io_poll_iocb	poll;</div><div class='del'>-	struct io_poll_iocb	*double_poll;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-typedef void (*io_req_tw_func_t)(struct io_kiocb *req, bool *locked);</div><div class='del'>-</div><div class='del'>-struct io_task_work {</div><div class='del'>-	union {</div><div class='del'>-		struct io_wq_work_node	node;</div><div class='del'>-		struct llist_node	fallback_node;</div><div class='del'>-	};</div><div class='del'>-	io_req_tw_func_t		func;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-enum {</div><div class='del'>-	IORING_RSRC_FILE		= 0,</div><div class='del'>-	IORING_RSRC_BUFFER		= 1,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * NOTE! Each of the iocb union members has the file pointer</div><div class='del'>- * as the first entry in their struct definition. So you can</div><div class='del'>- * access the file pointer through any of the sub-structs,</div><div class='del'>- * or directly as just 'ki_filp' in this struct.</div><div class='del'>- */</div><div class='del'>-struct io_kiocb {</div><div class='del'>-	union {</div><div class='del'>-		struct file		*file;</div><div class='del'>-		struct io_rw		rw;</div><div class='del'>-		struct io_poll_iocb	poll;</div><div class='del'>-		struct io_poll_update	poll_update;</div><div class='del'>-		struct io_accept	accept;</div><div class='del'>-		struct io_sync		sync;</div><div class='del'>-		struct io_cancel	cancel;</div><div class='del'>-		struct io_timeout	timeout;</div><div class='del'>-		struct io_timeout_rem	timeout_rem;</div><div class='del'>-		struct io_connect	connect;</div><div class='del'>-		struct io_sr_msg	sr_msg;</div><div class='del'>-		struct io_open		open;</div><div class='del'>-		struct io_close		close;</div><div class='del'>-		struct io_rsrc_update	rsrc_update;</div><div class='del'>-		struct io_fadvise	fadvise;</div><div class='del'>-		struct io_madvise	madvise;</div><div class='del'>-		struct io_epoll		epoll;</div><div class='del'>-		struct io_splice	splice;</div><div class='del'>-		struct io_provide_buf	pbuf;</div><div class='del'>-		struct io_statx		statx;</div><div class='del'>-		struct io_shutdown	shutdown;</div><div class='del'>-		struct io_rename	rename;</div><div class='del'>-		struct io_unlink	unlink;</div><div class='del'>-		struct io_mkdir		mkdir;</div><div class='del'>-		struct io_symlink	symlink;</div><div class='del'>-		struct io_hardlink	hardlink;</div><div class='del'>-	};</div><div class='del'>-</div><div class='del'>-	u8				opcode;</div><div class='del'>-	/* polled IO has completed */</div><div class='del'>-	u8				iopoll_completed;</div><div class='del'>-	u16				buf_index;</div><div class='del'>-	unsigned int			flags;</div><div class='del'>-</div><div class='del'>-	u64				user_data;</div><div class='del'>-	u32				result;</div><div class='del'>-	u32				cflags;</div><div class='del'>-</div><div class='del'>-	struct io_ring_ctx		*ctx;</div><div class='del'>-	struct task_struct		*task;</div><div class='del'>-</div><div class='del'>-	struct percpu_ref		*fixed_rsrc_refs;</div><div class='del'>-	/* store used ubuf, so we can prevent reloading */</div><div class='del'>-	struct io_mapped_ubuf		*imu;</div><div class='del'>-</div><div class='del'>-	/* used by request caches, completion batching and iopoll */</div><div class='del'>-	struct io_wq_work_node		comp_list;</div><div class='del'>-	atomic_t			refs;</div><div class='del'>-	struct io_kiocb			*link;</div><div class='del'>-	struct io_task_work		io_task_work;</div><div class='del'>-	/* for polled requests, i.e. IORING_OP_POLL_ADD and async armed poll */</div><div class='del'>-	struct hlist_node		hash_node;</div><div class='del'>-	/* internal polling, see IORING_FEAT_FAST_POLL */</div><div class='del'>-	struct async_poll		*apoll;</div><div class='del'>-	/* opcode allocated if it needs to store data for async defer */</div><div class='del'>-	void				*async_data;</div><div class='del'>-	struct io_wq_work		work;</div><div class='del'>-	/* custom credentials, valid IFF REQ_F_CREDS is set */</div><div class='del'>-	const struct cred		*creds;</div><div class='del'>-	/* stores selected buf, valid IFF REQ_F_BUFFER_SELECTED is set */</div><div class='del'>-	struct io_buffer		*kbuf;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_tctx_node {</div><div class='del'>-	struct list_head	ctx_node;</div><div class='del'>-	struct task_struct	*task;</div><div class='del'>-	struct io_ring_ctx	*ctx;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_defer_entry {</div><div class='del'>-	struct list_head	list;</div><div class='del'>-	struct io_kiocb		*req;</div><div class='del'>-	u32			seq;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct io_op_def {</div><div class='del'>-	/* needs req-&gt;file assigned */</div><div class='del'>-	unsigned		needs_file : 1;</div><div class='del'>-	/* should block plug */</div><div class='del'>-	unsigned		plug : 1;</div><div class='del'>-	/* hash wq insertion if file is a regular file */</div><div class='del'>-	unsigned		hash_reg_file : 1;</div><div class='del'>-	/* unbound wq insertion if file is a non-regular file */</div><div class='del'>-	unsigned		unbound_nonreg_file : 1;</div><div class='del'>-	/* set if opcode supports polled "wait" */</div><div class='del'>-	unsigned		pollin : 1;</div><div class='del'>-	unsigned		pollout : 1;</div><div class='del'>-	/* op supports buffer selection */</div><div class='del'>-	unsigned		buffer_select : 1;</div><div class='del'>-	/* do prep async if is going to be punted */</div><div class='del'>-	unsigned		needs_async_setup : 1;</div><div class='del'>-	/* opcode is not supported by this kernel */</div><div class='del'>-	unsigned		not_supported : 1;</div><div class='del'>-	/* skip auditing */</div><div class='del'>-	unsigned		audit_skip : 1;</div><div class='del'>-	/* size of async data needed, if any */</div><div class='del'>-	unsigned short		async_size;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static const struct io_op_def io_op_defs[] = {</div><div class='del'>-	[IORING_OP_NOP] = {},</div><div class='del'>-	[IORING_OP_READV] = {</div><div class='del'>-		.needs_file		= 1,</div><div class='del'>-		.unbound_nonreg_file	= 1,</div><div class='del'>-		.pollin			= 1,</div><div class='del'>-		.buffer_select		= 1,</div><div class='del'>-		.needs_async_setup	= 1,</div><div class='del'>-		.plug			= 1,</div><div class='del'>-		.audit_skip		= 1,</div><div class='del'>-		.async_size		= sizeof(struct io_async_rw),</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_WRITEV] = {</div><div class='del'>-		.needs_file		= 1,</div><div class='del'>-		.hash_reg_file		= 1,</div><div class='del'>-		.unbound_nonreg_file	= 1,</div><div class='del'>-		.pollout		= 1,</div><div class='del'>-		.needs_async_setup	= 1,</div><div class='del'>-		.plug			= 1,</div><div class='del'>-		.audit_skip		= 1,</div><div class='del'>-		.async_size		= sizeof(struct io_async_rw),</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_FSYNC] = {</div><div class='del'>-		.needs_file		= 1,</div><div class='del'>-		.audit_skip		= 1,</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_READ_FIXED] = {</div><div class='del'>-		.needs_file		= 1,</div><div class='del'>-		.unbound_nonreg_file	= 1,</div><div class='del'>-		.pollin			= 1,</div><div class='del'>-		.plug			= 1,</div><div class='del'>-		.audit_skip		= 1,</div><div class='del'>-		.async_size		= sizeof(struct io_async_rw),</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_WRITE_FIXED] = {</div><div class='del'>-		.needs_file		= 1,</div><div class='del'>-		.hash_reg_file		= 1,</div><div class='del'>-		.unbound_nonreg_file	= 1,</div><div class='del'>-		.pollout		= 1,</div><div class='del'>-		.plug			= 1,</div><div class='del'>-		.audit_skip		= 1,</div><div class='del'>-		.async_size		= sizeof(struct io_async_rw),</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_POLL_ADD] = {</div><div class='del'>-		.needs_file		= 1,</div><div class='del'>-		.unbound_nonreg_file	= 1,</div><div class='del'>-		.audit_skip		= 1,</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_POLL_REMOVE] = {</div><div class='del'>-		.audit_skip		= 1,</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_SYNC_FILE_RANGE] = {</div><div class='del'>-		.needs_file		= 1,</div><div class='del'>-		.audit_skip		= 1,</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_SENDMSG] = {</div><div class='del'>-		.needs_file		= 1,</div><div class='del'>-		.unbound_nonreg_file	= 1,</div><div class='del'>-		.pollout		= 1,</div><div class='del'>-		.needs_async_setup	= 1,</div><div class='del'>-		.async_size		= sizeof(struct io_async_msghdr),</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_RECVMSG] = {</div><div class='del'>-		.needs_file		= 1,</div><div class='del'>-		.unbound_nonreg_file	= 1,</div><div class='del'>-		.pollin			= 1,</div><div class='del'>-		.buffer_select		= 1,</div><div class='del'>-		.needs_async_setup	= 1,</div><div class='del'>-		.async_size		= sizeof(struct io_async_msghdr),</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_TIMEOUT] = {</div><div class='del'>-		.audit_skip		= 1,</div><div class='del'>-		.async_size		= sizeof(struct io_timeout_data),</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_TIMEOUT_REMOVE] = {</div><div class='del'>-		/* used by timeout updates' prep() */</div><div class='del'>-		.audit_skip		= 1,</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_ACCEPT] = {</div><div class='del'>-		.needs_file		= 1,</div><div class='del'>-		.unbound_nonreg_file	= 1,</div><div class='del'>-		.pollin			= 1,</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_ASYNC_CANCEL] = {</div><div class='del'>-		.audit_skip		= 1,</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_LINK_TIMEOUT] = {</div><div class='del'>-		.audit_skip		= 1,</div><div class='del'>-		.async_size		= sizeof(struct io_timeout_data),</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_CONNECT] = {</div><div class='del'>-		.needs_file		= 1,</div><div class='del'>-		.unbound_nonreg_file	= 1,</div><div class='del'>-		.pollout		= 1,</div><div class='del'>-		.needs_async_setup	= 1,</div><div class='del'>-		.async_size		= sizeof(struct io_async_connect),</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_FALLOCATE] = {</div><div class='del'>-		.needs_file		= 1,</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_OPENAT] = {},</div><div class='del'>-	[IORING_OP_CLOSE] = {},</div><div class='del'>-	[IORING_OP_FILES_UPDATE] = {</div><div class='del'>-		.audit_skip		= 1,</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_STATX] = {</div><div class='del'>-		.audit_skip		= 1,</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_READ] = {</div><div class='del'>-		.needs_file		= 1,</div><div class='del'>-		.unbound_nonreg_file	= 1,</div><div class='del'>-		.pollin			= 1,</div><div class='del'>-		.buffer_select		= 1,</div><div class='del'>-		.plug			= 1,</div><div class='del'>-		.audit_skip		= 1,</div><div class='del'>-		.async_size		= sizeof(struct io_async_rw),</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_WRITE] = {</div><div class='del'>-		.needs_file		= 1,</div><div class='del'>-		.hash_reg_file		= 1,</div><div class='del'>-		.unbound_nonreg_file	= 1,</div><div class='del'>-		.pollout		= 1,</div><div class='del'>-		.plug			= 1,</div><div class='del'>-		.audit_skip		= 1,</div><div class='del'>-		.async_size		= sizeof(struct io_async_rw),</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_FADVISE] = {</div><div class='del'>-		.needs_file		= 1,</div><div class='del'>-		.audit_skip		= 1,</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_MADVISE] = {},</div><div class='del'>-	[IORING_OP_SEND] = {</div><div class='del'>-		.needs_file		= 1,</div><div class='del'>-		.unbound_nonreg_file	= 1,</div><div class='del'>-		.pollout		= 1,</div><div class='del'>-		.audit_skip		= 1,</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_RECV] = {</div><div class='del'>-		.needs_file		= 1,</div><div class='del'>-		.unbound_nonreg_file	= 1,</div><div class='del'>-		.pollin			= 1,</div><div class='del'>-		.buffer_select		= 1,</div><div class='del'>-		.audit_skip		= 1,</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_OPENAT2] = {</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_EPOLL_CTL] = {</div><div class='del'>-		.unbound_nonreg_file	= 1,</div><div class='del'>-		.audit_skip		= 1,</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_SPLICE] = {</div><div class='del'>-		.needs_file		= 1,</div><div class='del'>-		.hash_reg_file		= 1,</div><div class='del'>-		.unbound_nonreg_file	= 1,</div><div class='del'>-		.audit_skip		= 1,</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_PROVIDE_BUFFERS] = {</div><div class='del'>-		.audit_skip		= 1,</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_REMOVE_BUFFERS] = {</div><div class='del'>-		.audit_skip		= 1,</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_TEE] = {</div><div class='del'>-		.needs_file		= 1,</div><div class='del'>-		.hash_reg_file		= 1,</div><div class='del'>-		.unbound_nonreg_file	= 1,</div><div class='del'>-		.audit_skip		= 1,</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_SHUTDOWN] = {</div><div class='del'>-		.needs_file		= 1,</div><div class='del'>-	},</div><div class='del'>-	[IORING_OP_RENAMEAT] = {},</div><div class='del'>-	[IORING_OP_UNLINKAT] = {},</div><div class='del'>-	[IORING_OP_MKDIRAT] = {},</div><div class='del'>-	[IORING_OP_SYMLINKAT] = {},</div><div class='del'>-	[IORING_OP_LINKAT] = {},</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/* requests with any of those set should undergo io_disarm_next() */</div><div class='del'>-#define IO_DISARM_MASK (REQ_F_ARM_LTIMEOUT | REQ_F_LINK_TIMEOUT | REQ_F_FAIL)</div><div class='del'>-</div><div class='del'>-static bool io_disarm_next(struct io_kiocb *req);</div><div class='del'>-static void io_uring_del_tctx_node(unsigned long index);</div><div class='del'>-static void io_uring_try_cancel_requests(struct io_ring_ctx *ctx,</div><div class='del'>-					 struct task_struct *task,</div><div class='del'>-					 bool cancel_all);</div><div class='del'>-static void io_uring_cancel_generic(bool cancel_all, struct io_sq_data *sqd);</div><div class='del'>-</div><div class='del'>-static bool io_cqring_fill_event(struct io_ring_ctx *ctx, u64 user_data,</div><div class='del'>-				 s32 res, u32 cflags);</div><div class='del'>-static void io_put_req(struct io_kiocb *req);</div><div class='del'>-static void io_put_req_deferred(struct io_kiocb *req);</div><div class='del'>-static void io_dismantle_req(struct io_kiocb *req);</div><div class='del'>-static void io_queue_linked_timeout(struct io_kiocb *req);</div><div class='del'>-static int __io_register_rsrc_update(struct io_ring_ctx *ctx, unsigned type,</div><div class='del'>-				     struct io_uring_rsrc_update2 *up,</div><div class='del'>-				     unsigned nr_args);</div><div class='del'>-static void io_clean_op(struct io_kiocb *req);</div><div class='del'>-static struct file *io_file_get(struct io_ring_ctx *ctx,</div><div class='del'>-				struct io_kiocb *req, int fd, bool fixed);</div><div class='del'>-static void __io_queue_sqe(struct io_kiocb *req);</div><div class='del'>-static void io_rsrc_put_work(struct work_struct *work);</div><div class='del'>-</div><div class='del'>-static void io_req_task_queue(struct io_kiocb *req);</div><div class='del'>-static void __io_submit_flush_completions(struct io_ring_ctx *ctx);</div><div class='del'>-static int io_req_prep_async(struct io_kiocb *req);</div><div class='del'>-</div><div class='del'>-static int io_install_fixed_file(struct io_kiocb *req, struct file *file,</div><div class='del'>-				 unsigned int issue_flags, u32 slot_index);</div><div class='del'>-static int io_close_fixed(struct io_kiocb *req, unsigned int issue_flags);</div><div class='del'>-</div><div class='del'>-static enum hrtimer_restart io_link_timeout_fn(struct hrtimer *timer);</div><div class='del'>-</div><div class='del'>-static struct kmem_cache *req_cachep;</div><div class='del'>-</div><div class='del'>-static const struct file_operations io_uring_fops;</div><div class='del'>-</div><div class='del'>-struct sock *io_uring_get_socket(struct file *file)</div><div class='del'>-{</div><div class='del'>-#if defined(CONFIG_UNIX)</div><div class='del'>-	if (file-&gt;f_op == &amp;io_uring_fops) {</div><div class='del'>-		struct io_ring_ctx *ctx = file-&gt;private_data;</div><div class='del'>-</div><div class='del'>-		return ctx-&gt;ring_sock-&gt;sk;</div><div class='del'>-	}</div><div class='del'>-#endif</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(io_uring_get_socket);</div><div class='del'>-</div><div class='del'>-static inline void io_tw_lock(struct io_ring_ctx *ctx, bool *locked)</div><div class='del'>-{</div><div class='del'>-	if (!*locked) {</div><div class='del'>-		mutex_lock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-		*locked = true;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#define io_for_each_link(pos, head) \</div><div class='del'>-	for (pos = (head); pos; pos = pos-&gt;link)</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Shamelessly stolen from the mm implementation of page reference checking,</div><div class='del'>- * see commit f958d7b528b1 for details.</div><div class='del'>- */</div><div class='del'>-#define req_ref_zero_or_close_to_overflow(req)	\</div><div class='del'>-	((unsigned int) atomic_read(&amp;(req-&gt;refs)) + 127u &lt;= 127u)</div><div class='del'>-</div><div class='del'>-static inline bool req_ref_inc_not_zero(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	WARN_ON_ONCE(!(req-&gt;flags &amp; REQ_F_REFCOUNT));</div><div class='del'>-	return atomic_inc_not_zero(&amp;req-&gt;refs);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline bool req_ref_put_and_test(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	if (likely(!(req-&gt;flags &amp; REQ_F_REFCOUNT)))</div><div class='del'>-		return true;</div><div class='del'>-</div><div class='del'>-	WARN_ON_ONCE(req_ref_zero_or_close_to_overflow(req));</div><div class='del'>-	return atomic_dec_and_test(&amp;req-&gt;refs);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void req_ref_put(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	WARN_ON_ONCE(!(req-&gt;flags &amp; REQ_F_REFCOUNT));</div><div class='del'>-	WARN_ON_ONCE(req_ref_put_and_test(req));</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void req_ref_get(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	WARN_ON_ONCE(!(req-&gt;flags &amp; REQ_F_REFCOUNT));</div><div class='del'>-	WARN_ON_ONCE(req_ref_zero_or_close_to_overflow(req));</div><div class='del'>-	atomic_inc(&amp;req-&gt;refs);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void io_submit_flush_completions(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	if (!wq_list_empty(&amp;ctx-&gt;submit_state.compl_reqs))</div><div class='del'>-		__io_submit_flush_completions(ctx);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void __io_req_set_refcount(struct io_kiocb *req, int nr)</div><div class='del'>-{</div><div class='del'>-	if (!(req-&gt;flags &amp; REQ_F_REFCOUNT)) {</div><div class='del'>-		req-&gt;flags |= REQ_F_REFCOUNT;</div><div class='del'>-		atomic_set(&amp;req-&gt;refs, nr);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void io_req_set_refcount(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	__io_req_set_refcount(req, 1);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#define IO_RSRC_REF_BATCH	100</div><div class='del'>-</div><div class='del'>-static inline void io_req_put_rsrc_locked(struct io_kiocb *req,</div><div class='del'>-					  struct io_ring_ctx *ctx)</div><div class='del'>-	__must_hold(&amp;ctx-&gt;uring_lock)</div><div class='del'>-{</div><div class='del'>-	struct percpu_ref *ref = req-&gt;fixed_rsrc_refs;</div><div class='del'>-</div><div class='del'>-	if (ref) {</div><div class='del'>-		if (ref == &amp;ctx-&gt;rsrc_node-&gt;refs)</div><div class='del'>-			ctx-&gt;rsrc_cached_refs++;</div><div class='del'>-		else</div><div class='del'>-			percpu_ref_put(ref);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void io_req_put_rsrc(struct io_kiocb *req, struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	if (req-&gt;fixed_rsrc_refs)</div><div class='del'>-		percpu_ref_put(req-&gt;fixed_rsrc_refs);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold void io_rsrc_refs_drop(struct io_ring_ctx *ctx)</div><div class='del'>-	__must_hold(&amp;ctx-&gt;uring_lock)</div><div class='del'>-{</div><div class='del'>-	if (ctx-&gt;rsrc_cached_refs) {</div><div class='del'>-		percpu_ref_put_many(&amp;ctx-&gt;rsrc_node-&gt;refs, ctx-&gt;rsrc_cached_refs);</div><div class='del'>-		ctx-&gt;rsrc_cached_refs = 0;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_rsrc_refs_refill(struct io_ring_ctx *ctx)</div><div class='del'>-	__must_hold(&amp;ctx-&gt;uring_lock)</div><div class='del'>-{</div><div class='del'>-	ctx-&gt;rsrc_cached_refs += IO_RSRC_REF_BATCH;</div><div class='del'>-	percpu_ref_get_many(&amp;ctx-&gt;rsrc_node-&gt;refs, IO_RSRC_REF_BATCH);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void io_req_set_rsrc_node(struct io_kiocb *req,</div><div class='del'>-					struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	if (!req-&gt;fixed_rsrc_refs) {</div><div class='del'>-		req-&gt;fixed_rsrc_refs = &amp;ctx-&gt;rsrc_node-&gt;refs;</div><div class='del'>-		ctx-&gt;rsrc_cached_refs--;</div><div class='del'>-		if (unlikely(ctx-&gt;rsrc_cached_refs &lt; 0))</div><div class='del'>-			io_rsrc_refs_refill(ctx);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_refs_resurrect(struct percpu_ref *ref, struct completion *compl)</div><div class='del'>-{</div><div class='del'>-	bool got = percpu_ref_tryget(ref);</div><div class='del'>-</div><div class='del'>-	/* already at zero, wait for -&gt;release() */</div><div class='del'>-	if (!got)</div><div class='del'>-		wait_for_completion(compl);</div><div class='del'>-	percpu_ref_resurrect(ref);</div><div class='del'>-	if (got)</div><div class='del'>-		percpu_ref_put(ref);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool io_match_task(struct io_kiocb *head, struct task_struct *task,</div><div class='del'>-			  bool cancel_all)</div><div class='del'>-{</div><div class='del'>-	struct io_kiocb *req;</div><div class='del'>-</div><div class='del'>-	if (task &amp;&amp; head-&gt;task != task)</div><div class='del'>-		return false;</div><div class='del'>-	if (cancel_all)</div><div class='del'>-		return true;</div><div class='del'>-</div><div class='del'>-	io_for_each_link(req, head) {</div><div class='del'>-		if (req-&gt;flags &amp; REQ_F_INFLIGHT)</div><div class='del'>-			return true;</div><div class='del'>-	}</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline bool req_has_async_data(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	return req-&gt;flags &amp; REQ_F_ASYNC_DATA;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void req_set_fail(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	req-&gt;flags |= REQ_F_FAIL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void req_fail_link_node(struct io_kiocb *req, int res)</div><div class='del'>-{</div><div class='del'>-	req_set_fail(req);</div><div class='del'>-	req-&gt;result = res;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold void io_ring_ctx_ref_free(struct percpu_ref *ref)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = container_of(ref, struct io_ring_ctx, refs);</div><div class='del'>-</div><div class='del'>-	complete(&amp;ctx-&gt;ref_comp);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline bool io_is_timeout_noseq(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	return !req-&gt;timeout.off;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold void io_fallback_req_func(struct work_struct *work)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = container_of(work, struct io_ring_ctx,</div><div class='del'>-						fallback_work.work);</div><div class='del'>-	struct llist_node *node = llist_del_all(&amp;ctx-&gt;fallback_llist);</div><div class='del'>-	struct io_kiocb *req, *tmp;</div><div class='del'>-	bool locked = false;</div><div class='del'>-</div><div class='del'>-	percpu_ref_get(&amp;ctx-&gt;refs);</div><div class='del'>-	llist_for_each_entry_safe(req, tmp, node, io_task_work.fallback_node)</div><div class='del'>-		req-&gt;io_task_work.func(req, &amp;locked);</div><div class='del'>-</div><div class='del'>-	if (locked) {</div><div class='del'>-		io_submit_flush_completions(ctx);</div><div class='del'>-		mutex_unlock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-	}</div><div class='del'>-	percpu_ref_put(&amp;ctx-&gt;refs);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold struct io_ring_ctx *io_ring_ctx_alloc(struct io_uring_params *p)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx;</div><div class='del'>-	int hash_bits;</div><div class='del'>-</div><div class='del'>-	ctx = kzalloc(sizeof(*ctx), GFP_KERNEL);</div><div class='del'>-	if (!ctx)</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Use 5 bits less than the max cq entries, that should give us around</div><div class='del'>-	 * 32 entries per hash list if totally full and uniformly spread.</div><div class='del'>-	 */</div><div class='del'>-	hash_bits = ilog2(p-&gt;cq_entries);</div><div class='del'>-	hash_bits -= 5;</div><div class='del'>-	if (hash_bits &lt;= 0)</div><div class='del'>-		hash_bits = 1;</div><div class='del'>-	ctx-&gt;cancel_hash_bits = hash_bits;</div><div class='del'>-	ctx-&gt;cancel_hash = kmalloc((1U &lt;&lt; hash_bits) * sizeof(struct hlist_head),</div><div class='del'>-					GFP_KERNEL);</div><div class='del'>-	if (!ctx-&gt;cancel_hash)</div><div class='del'>-		goto err;</div><div class='del'>-	__hash_init(ctx-&gt;cancel_hash, 1U &lt;&lt; hash_bits);</div><div class='del'>-</div><div class='del'>-	ctx-&gt;dummy_ubuf = kzalloc(sizeof(*ctx-&gt;dummy_ubuf), GFP_KERNEL);</div><div class='del'>-	if (!ctx-&gt;dummy_ubuf)</div><div class='del'>-		goto err;</div><div class='del'>-	/* set invalid range, so io_import_fixed() fails meeting it */</div><div class='del'>-	ctx-&gt;dummy_ubuf-&gt;ubuf = -1UL;</div><div class='del'>-</div><div class='del'>-	if (percpu_ref_init(&amp;ctx-&gt;refs, io_ring_ctx_ref_free,</div><div class='del'>-			    PERCPU_REF_ALLOW_REINIT, GFP_KERNEL))</div><div class='del'>-		goto err;</div><div class='del'>-</div><div class='del'>-	ctx-&gt;flags = p-&gt;flags;</div><div class='del'>-	init_waitqueue_head(&amp;ctx-&gt;sqo_sq_wait);</div><div class='del'>-	INIT_LIST_HEAD(&amp;ctx-&gt;sqd_list);</div><div class='del'>-	INIT_LIST_HEAD(&amp;ctx-&gt;cq_overflow_list);</div><div class='del'>-	init_completion(&amp;ctx-&gt;ref_comp);</div><div class='del'>-	xa_init_flags(&amp;ctx-&gt;io_buffers, XA_FLAGS_ALLOC1);</div><div class='del'>-	xa_init_flags(&amp;ctx-&gt;personalities, XA_FLAGS_ALLOC1);</div><div class='del'>-	mutex_init(&amp;ctx-&gt;uring_lock);</div><div class='del'>-	init_waitqueue_head(&amp;ctx-&gt;cq_wait);</div><div class='del'>-	spin_lock_init(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	spin_lock_init(&amp;ctx-&gt;timeout_lock);</div><div class='del'>-	INIT_WQ_LIST(&amp;ctx-&gt;iopoll_list);</div><div class='del'>-	INIT_LIST_HEAD(&amp;ctx-&gt;defer_list);</div><div class='del'>-	INIT_LIST_HEAD(&amp;ctx-&gt;timeout_list);</div><div class='del'>-	INIT_LIST_HEAD(&amp;ctx-&gt;ltimeout_list);</div><div class='del'>-	spin_lock_init(&amp;ctx-&gt;rsrc_ref_lock);</div><div class='del'>-	INIT_LIST_HEAD(&amp;ctx-&gt;rsrc_ref_list);</div><div class='del'>-	INIT_DELAYED_WORK(&amp;ctx-&gt;rsrc_put_work, io_rsrc_put_work);</div><div class='del'>-	init_llist_head(&amp;ctx-&gt;rsrc_put_llist);</div><div class='del'>-	INIT_LIST_HEAD(&amp;ctx-&gt;tctx_list);</div><div class='del'>-	ctx-&gt;submit_state.free_list.next = NULL;</div><div class='del'>-	INIT_WQ_LIST(&amp;ctx-&gt;locked_free_list);</div><div class='del'>-	INIT_DELAYED_WORK(&amp;ctx-&gt;fallback_work, io_fallback_req_func);</div><div class='del'>-	INIT_WQ_LIST(&amp;ctx-&gt;submit_state.compl_reqs);</div><div class='del'>-	return ctx;</div><div class='del'>-err:</div><div class='del'>-	kfree(ctx-&gt;dummy_ubuf);</div><div class='del'>-	kfree(ctx-&gt;cancel_hash);</div><div class='del'>-	kfree(ctx);</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_account_cq_overflow(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	struct io_rings *r = ctx-&gt;rings;</div><div class='del'>-</div><div class='del'>-	WRITE_ONCE(r-&gt;cq_overflow, READ_ONCE(r-&gt;cq_overflow) + 1);</div><div class='del'>-	ctx-&gt;cq_extra--;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool req_need_defer(struct io_kiocb *req, u32 seq)</div><div class='del'>-{</div><div class='del'>-	if (unlikely(req-&gt;flags &amp; REQ_F_IO_DRAIN)) {</div><div class='del'>-		struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-</div><div class='del'>-		return seq + READ_ONCE(ctx-&gt;cq_extra) != ctx-&gt;cached_cq_tail;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#define FFS_NOWAIT		0x1UL</div><div class='del'>-#define FFS_ISREG		0x2UL</div><div class='del'>-#define FFS_MASK		~(FFS_NOWAIT|FFS_ISREG)</div><div class='del'>-</div><div class='del'>-static inline bool io_req_ffs_set(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	return req-&gt;flags &amp; REQ_F_FIXED_FILE;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void io_req_track_inflight(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	if (!(req-&gt;flags &amp; REQ_F_INFLIGHT)) {</div><div class='del'>-		req-&gt;flags |= REQ_F_INFLIGHT;</div><div class='del'>-		atomic_inc(&amp;current-&gt;io_uring-&gt;inflight_tracked);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct io_kiocb *__io_prep_linked_timeout(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	if (WARN_ON_ONCE(!req-&gt;link))</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	req-&gt;flags &amp;= ~REQ_F_ARM_LTIMEOUT;</div><div class='del'>-	req-&gt;flags |= REQ_F_LINK_TIMEOUT;</div><div class='del'>-</div><div class='del'>-	/* linked timeouts should have two refs once prep'ed */</div><div class='del'>-	io_req_set_refcount(req);</div><div class='del'>-	__io_req_set_refcount(req-&gt;link, 2);</div><div class='del'>-	return req-&gt;link;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline struct io_kiocb *io_prep_linked_timeout(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	if (likely(!(req-&gt;flags &amp; REQ_F_ARM_LTIMEOUT)))</div><div class='del'>-		return NULL;</div><div class='del'>-	return __io_prep_linked_timeout(req);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_prep_async_work(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	const struct io_op_def *def = &amp;io_op_defs[req-&gt;opcode];</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-</div><div class='del'>-	if (!(req-&gt;flags &amp; REQ_F_CREDS)) {</div><div class='del'>-		req-&gt;flags |= REQ_F_CREDS;</div><div class='del'>-		req-&gt;creds = get_current_cred();</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	req-&gt;work.list.next = NULL;</div><div class='del'>-	req-&gt;work.flags = 0;</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_FORCE_ASYNC)</div><div class='del'>-		req-&gt;work.flags |= IO_WQ_WORK_CONCURRENT;</div><div class='del'>-</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_ISREG) {</div><div class='del'>-		if (def-&gt;hash_reg_file || (ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-			io_wq_hash_work(&amp;req-&gt;work, file_inode(req-&gt;file));</div><div class='del'>-	} else if (!req-&gt;file || !S_ISBLK(file_inode(req-&gt;file)-&gt;i_mode)) {</div><div class='del'>-		if (def-&gt;unbound_nonreg_file)</div><div class='del'>-			req-&gt;work.flags |= IO_WQ_WORK_UNBOUND;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	switch (req-&gt;opcode) {</div><div class='del'>-	case IORING_OP_SPLICE:</div><div class='del'>-	case IORING_OP_TEE:</div><div class='del'>-		if (!S_ISREG(file_inode(req-&gt;splice.file_in)-&gt;i_mode))</div><div class='del'>-			req-&gt;work.flags |= IO_WQ_WORK_UNBOUND;</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_prep_async_link(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	struct io_kiocb *cur;</div><div class='del'>-</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_LINK_TIMEOUT) {</div><div class='del'>-		struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-</div><div class='del'>-		spin_lock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-		io_for_each_link(cur, req)</div><div class='del'>-			io_prep_async_work(cur);</div><div class='del'>-		spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	} else {</div><div class='del'>-		io_for_each_link(cur, req)</div><div class='del'>-			io_prep_async_work(cur);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void io_req_add_compl_list(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	struct io_submit_state *state = &amp;req-&gt;ctx-&gt;submit_state;</div><div class='del'>-</div><div class='del'>-	wq_list_add_tail(&amp;req-&gt;comp_list, &amp;state-&gt;compl_reqs);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_queue_async_work(struct io_kiocb *req, bool *dont_use)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-	struct io_kiocb *link = io_prep_linked_timeout(req);</div><div class='del'>-	struct io_uring_task *tctx = req-&gt;task-&gt;io_uring;</div><div class='del'>-</div><div class='del'>-	BUG_ON(!tctx);</div><div class='del'>-	BUG_ON(!tctx-&gt;io_wq);</div><div class='del'>-</div><div class='del'>-	/* init -&gt;work of the whole link before punting */</div><div class='del'>-	io_prep_async_link(req);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Not expected to happen, but if we do have a bug where this _can_</div><div class='del'>-	 * happen, catch it here and ensure the request is marked as</div><div class='del'>-	 * canceled. That will make io-wq go through the usual work cancel</div><div class='del'>-	 * procedure rather than attempt to run this request (or create a new</div><div class='del'>-	 * worker for it).</div><div class='del'>-	 */</div><div class='del'>-	if (WARN_ON_ONCE(!same_thread_group(req-&gt;task, current)))</div><div class='del'>-		req-&gt;work.flags |= IO_WQ_WORK_CANCEL;</div><div class='del'>-</div><div class='del'>-	trace_io_uring_queue_async_work(ctx, io_wq_is_hashed(&amp;req-&gt;work), req,</div><div class='del'>-					&amp;req-&gt;work, req-&gt;flags);</div><div class='del'>-	io_wq_enqueue(tctx-&gt;io_wq, &amp;req-&gt;work);</div><div class='del'>-	if (link)</div><div class='del'>-		io_queue_linked_timeout(link);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_kill_timeout(struct io_kiocb *req, int status)</div><div class='del'>-	__must_hold(&amp;req-&gt;ctx-&gt;completion_lock)</div><div class='del'>-	__must_hold(&amp;req-&gt;ctx-&gt;timeout_lock)</div><div class='del'>-{</div><div class='del'>-	struct io_timeout_data *io = req-&gt;async_data;</div><div class='del'>-</div><div class='del'>-	if (hrtimer_try_to_cancel(&amp;io-&gt;timer) != -1) {</div><div class='del'>-		if (status)</div><div class='del'>-			req_set_fail(req);</div><div class='del'>-		atomic_set(&amp;req-&gt;ctx-&gt;cq_timeouts,</div><div class='del'>-			atomic_read(&amp;req-&gt;ctx-&gt;cq_timeouts) + 1);</div><div class='del'>-		list_del_init(&amp;req-&gt;timeout.list);</div><div class='del'>-		io_cqring_fill_event(req-&gt;ctx, req-&gt;user_data, status, 0);</div><div class='del'>-		io_put_req_deferred(req);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold void io_queue_deferred(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	while (!list_empty(&amp;ctx-&gt;defer_list)) {</div><div class='del'>-		struct io_defer_entry *de = list_first_entry(&amp;ctx-&gt;defer_list,</div><div class='del'>-						struct io_defer_entry, list);</div><div class='del'>-</div><div class='del'>-		if (req_need_defer(de-&gt;req, de-&gt;seq))</div><div class='del'>-			break;</div><div class='del'>-		list_del_init(&amp;de-&gt;list);</div><div class='del'>-		io_req_task_queue(de-&gt;req);</div><div class='del'>-		kfree(de);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold void io_flush_timeouts(struct io_ring_ctx *ctx)</div><div class='del'>-	__must_hold(&amp;ctx-&gt;completion_lock)</div><div class='del'>-{</div><div class='del'>-	u32 seq = ctx-&gt;cached_cq_tail - atomic_read(&amp;ctx-&gt;cq_timeouts);</div><div class='del'>-</div><div class='del'>-	spin_lock_irq(&amp;ctx-&gt;timeout_lock);</div><div class='del'>-	while (!list_empty(&amp;ctx-&gt;timeout_list)) {</div><div class='del'>-		u32 events_needed, events_got;</div><div class='del'>-		struct io_kiocb *req = list_first_entry(&amp;ctx-&gt;timeout_list,</div><div class='del'>-						struct io_kiocb, timeout.list);</div><div class='del'>-</div><div class='del'>-		if (io_is_timeout_noseq(req))</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Since seq can easily wrap around over time, subtract</div><div class='del'>-		 * the last seq at which timeouts were flushed before comparing.</div><div class='del'>-		 * Assuming not more than 2^31-1 events have happened since,</div><div class='del'>-		 * these subtractions won't have wrapped, so we can check if</div><div class='del'>-		 * target is in [last_seq, current_seq] by comparing the two.</div><div class='del'>-		 */</div><div class='del'>-		events_needed = req-&gt;timeout.target_seq - ctx-&gt;cq_last_tm_flush;</div><div class='del'>-		events_got = seq - ctx-&gt;cq_last_tm_flush;</div><div class='del'>-		if (events_got &lt; events_needed)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		list_del_init(&amp;req-&gt;timeout.list);</div><div class='del'>-		io_kill_timeout(req, 0);</div><div class='del'>-	}</div><div class='del'>-	ctx-&gt;cq_last_tm_flush = seq;</div><div class='del'>-	spin_unlock_irq(&amp;ctx-&gt;timeout_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold void __io_commit_cqring_flush(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	if (ctx-&gt;off_timeout_used)</div><div class='del'>-		io_flush_timeouts(ctx);</div><div class='del'>-	if (ctx-&gt;drain_active)</div><div class='del'>-		io_queue_deferred(ctx);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void io_commit_cqring(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	if (unlikely(ctx-&gt;off_timeout_used || ctx-&gt;drain_active))</div><div class='del'>-		__io_commit_cqring_flush(ctx);</div><div class='del'>-	/* order cqe stores with ring update */</div><div class='del'>-	smp_store_release(&amp;ctx-&gt;rings-&gt;cq.tail, ctx-&gt;cached_cq_tail);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline bool io_sqring_full(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	struct io_rings *r = ctx-&gt;rings;</div><div class='del'>-</div><div class='del'>-	return READ_ONCE(r-&gt;sq.tail) - ctx-&gt;cached_sq_head == ctx-&gt;sq_entries;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline unsigned int __io_cqring_events(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	return ctx-&gt;cached_cq_tail - READ_ONCE(ctx-&gt;rings-&gt;cq.head);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline struct io_uring_cqe *io_get_cqe(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	struct io_rings *rings = ctx-&gt;rings;</div><div class='del'>-	unsigned tail, mask = ctx-&gt;cq_entries - 1;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * writes to the cq entry need to come after reading head; the</div><div class='del'>-	 * control dependency is enough as we're using WRITE_ONCE to</div><div class='del'>-	 * fill the cq entry</div><div class='del'>-	 */</div><div class='del'>-	if (__io_cqring_events(ctx) == ctx-&gt;cq_entries)</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	tail = ctx-&gt;cached_cq_tail++;</div><div class='del'>-	return &amp;rings-&gt;cqes[tail &amp; mask];</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline bool io_should_trigger_evfd(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	if (likely(!ctx-&gt;cq_ev_fd))</div><div class='del'>-		return false;</div><div class='del'>-	if (READ_ONCE(ctx-&gt;rings-&gt;cq_flags) &amp; IORING_CQ_EVENTFD_DISABLED)</div><div class='del'>-		return false;</div><div class='del'>-	return !ctx-&gt;eventfd_async || io_wq_current_is_worker();</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * This should only get called when at least one event has been posted.</div><div class='del'>- * Some applications rely on the eventfd notification count only changing</div><div class='del'>- * IFF a new CQE has been added to the CQ ring. There's no depedency on</div><div class='del'>- * 1:1 relationship between how many times this function is called (and</div><div class='del'>- * hence the eventfd count) and number of CQEs posted to the CQ ring.</div><div class='del'>- */</div><div class='del'>-static void io_cqring_ev_posted(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	/*</div><div class='del'>-	 * wake_up_all() may seem excessive, but io_wake_function() and</div><div class='del'>-	 * io_should_wake() handle the termination of the loop and only</div><div class='del'>-	 * wake as many waiters as we need to.</div><div class='del'>-	 */</div><div class='del'>-	if (wq_has_sleeper(&amp;ctx-&gt;cq_wait))</div><div class='del'>-		wake_up_all(&amp;ctx-&gt;cq_wait);</div><div class='del'>-	if (io_should_trigger_evfd(ctx))</div><div class='del'>-		eventfd_signal(ctx-&gt;cq_ev_fd, 1);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_cqring_ev_posted_iopoll(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	/* see waitqueue_active() comment */</div><div class='del'>-	smp_mb();</div><div class='del'>-</div><div class='del'>-	if (ctx-&gt;flags &amp; IORING_SETUP_SQPOLL) {</div><div class='del'>-		if (waitqueue_active(&amp;ctx-&gt;cq_wait))</div><div class='del'>-			wake_up_all(&amp;ctx-&gt;cq_wait);</div><div class='del'>-	}</div><div class='del'>-	if (io_should_trigger_evfd(ctx))</div><div class='del'>-		eventfd_signal(ctx-&gt;cq_ev_fd, 1);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* Returns true if there are no backlogged entries after the flush */</div><div class='del'>-static bool __io_cqring_overflow_flush(struct io_ring_ctx *ctx, bool force)</div><div class='del'>-{</div><div class='del'>-	bool all_flushed, posted;</div><div class='del'>-</div><div class='del'>-	if (!force &amp;&amp; __io_cqring_events(ctx) == ctx-&gt;cq_entries)</div><div class='del'>-		return false;</div><div class='del'>-</div><div class='del'>-	posted = false;</div><div class='del'>-	spin_lock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	while (!list_empty(&amp;ctx-&gt;cq_overflow_list)) {</div><div class='del'>-		struct io_uring_cqe *cqe = io_get_cqe(ctx);</div><div class='del'>-		struct io_overflow_cqe *ocqe;</div><div class='del'>-</div><div class='del'>-		if (!cqe &amp;&amp; !force)</div><div class='del'>-			break;</div><div class='del'>-		ocqe = list_first_entry(&amp;ctx-&gt;cq_overflow_list,</div><div class='del'>-					struct io_overflow_cqe, list);</div><div class='del'>-		if (cqe)</div><div class='del'>-			memcpy(cqe, &amp;ocqe-&gt;cqe, sizeof(*cqe));</div><div class='del'>-		else</div><div class='del'>-			io_account_cq_overflow(ctx);</div><div class='del'>-</div><div class='del'>-		posted = true;</div><div class='del'>-		list_del(&amp;ocqe-&gt;list);</div><div class='del'>-		kfree(ocqe);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	all_flushed = list_empty(&amp;ctx-&gt;cq_overflow_list);</div><div class='del'>-	if (all_flushed) {</div><div class='del'>-		clear_bit(0, &amp;ctx-&gt;check_cq_overflow);</div><div class='del'>-		WRITE_ONCE(ctx-&gt;rings-&gt;sq_flags,</div><div class='del'>-			   ctx-&gt;rings-&gt;sq_flags &amp; ~IORING_SQ_CQ_OVERFLOW);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (posted)</div><div class='del'>-		io_commit_cqring(ctx);</div><div class='del'>-	spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	if (posted)</div><div class='del'>-		io_cqring_ev_posted(ctx);</div><div class='del'>-	return all_flushed;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool io_cqring_overflow_flush(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	bool ret = true;</div><div class='del'>-</div><div class='del'>-	if (test_bit(0, &amp;ctx-&gt;check_cq_overflow)) {</div><div class='del'>-		/* iopoll syncs against uring_lock, not completion_lock */</div><div class='del'>-		if (ctx-&gt;flags &amp; IORING_SETUP_IOPOLL)</div><div class='del'>-			mutex_lock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-		ret = __io_cqring_overflow_flush(ctx, false);</div><div class='del'>-		if (ctx-&gt;flags &amp; IORING_SETUP_IOPOLL)</div><div class='del'>-			mutex_unlock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* must to be called somewhat shortly after putting a request */</div><div class='del'>-static inline void io_put_task(struct task_struct *task, int nr)</div><div class='del'>-{</div><div class='del'>-	struct io_uring_task *tctx = task-&gt;io_uring;</div><div class='del'>-</div><div class='del'>-	if (likely(task == current)) {</div><div class='del'>-		tctx-&gt;cached_refs += nr;</div><div class='del'>-	} else {</div><div class='del'>-		percpu_counter_sub(&amp;tctx-&gt;inflight, nr);</div><div class='del'>-		if (unlikely(atomic_read(&amp;tctx-&gt;in_idle)))</div><div class='del'>-			wake_up(&amp;tctx-&gt;wait);</div><div class='del'>-		put_task_struct_many(task, nr);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_task_refs_refill(struct io_uring_task *tctx)</div><div class='del'>-{</div><div class='del'>-	unsigned int refill = -tctx-&gt;cached_refs + IO_TCTX_REFS_CACHE_NR;</div><div class='del'>-</div><div class='del'>-	percpu_counter_add(&amp;tctx-&gt;inflight, refill);</div><div class='del'>-	refcount_add(refill, &amp;current-&gt;usage);</div><div class='del'>-	tctx-&gt;cached_refs += refill;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void io_get_task_refs(int nr)</div><div class='del'>-{</div><div class='del'>-	struct io_uring_task *tctx = current-&gt;io_uring;</div><div class='del'>-</div><div class='del'>-	tctx-&gt;cached_refs -= nr;</div><div class='del'>-	if (unlikely(tctx-&gt;cached_refs &lt; 0))</div><div class='del'>-		io_task_refs_refill(tctx);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool io_cqring_event_overflow(struct io_ring_ctx *ctx, u64 user_data,</div><div class='del'>-				     s32 res, u32 cflags)</div><div class='del'>-{</div><div class='del'>-	struct io_overflow_cqe *ocqe;</div><div class='del'>-</div><div class='del'>-	ocqe = kmalloc(sizeof(*ocqe), GFP_ATOMIC | __GFP_ACCOUNT);</div><div class='del'>-	if (!ocqe) {</div><div class='del'>-		/*</div><div class='del'>-		 * If we're in ring overflow flush mode, or in task cancel mode,</div><div class='del'>-		 * or cannot allocate an overflow entry, then we need to drop it</div><div class='del'>-		 * on the floor.</div><div class='del'>-		 */</div><div class='del'>-		io_account_cq_overflow(ctx);</div><div class='del'>-		return false;</div><div class='del'>-	}</div><div class='del'>-	if (list_empty(&amp;ctx-&gt;cq_overflow_list)) {</div><div class='del'>-		set_bit(0, &amp;ctx-&gt;check_cq_overflow);</div><div class='del'>-		WRITE_ONCE(ctx-&gt;rings-&gt;sq_flags,</div><div class='del'>-			   ctx-&gt;rings-&gt;sq_flags | IORING_SQ_CQ_OVERFLOW);</div><div class='del'>-</div><div class='del'>-	}</div><div class='del'>-	ocqe-&gt;cqe.user_data = user_data;</div><div class='del'>-	ocqe-&gt;cqe.res = res;</div><div class='del'>-	ocqe-&gt;cqe.flags = cflags;</div><div class='del'>-	list_add_tail(&amp;ocqe-&gt;list, &amp;ctx-&gt;cq_overflow_list);</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline bool __io_cqring_fill_event(struct io_ring_ctx *ctx, u64 user_data,</div><div class='del'>-					  s32 res, u32 cflags)</div><div class='del'>-{</div><div class='del'>-	struct io_uring_cqe *cqe;</div><div class='del'>-</div><div class='del'>-	trace_io_uring_complete(ctx, user_data, res, cflags);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If we can't get a cq entry, userspace overflowed the</div><div class='del'>-	 * submission (by quite a lot). Increment the overflow count in</div><div class='del'>-	 * the ring.</div><div class='del'>-	 */</div><div class='del'>-	cqe = io_get_cqe(ctx);</div><div class='del'>-	if (likely(cqe)) {</div><div class='del'>-		WRITE_ONCE(cqe-&gt;user_data, user_data);</div><div class='del'>-		WRITE_ONCE(cqe-&gt;res, res);</div><div class='del'>-		WRITE_ONCE(cqe-&gt;flags, cflags);</div><div class='del'>-		return true;</div><div class='del'>-	}</div><div class='del'>-	return io_cqring_event_overflow(ctx, user_data, res, cflags);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* not as hot to bloat with inlining */</div><div class='del'>-static noinline bool io_cqring_fill_event(struct io_ring_ctx *ctx, u64 user_data,</div><div class='del'>-					  s32 res, u32 cflags)</div><div class='del'>-{</div><div class='del'>-	return __io_cqring_fill_event(ctx, user_data, res, cflags);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_req_complete_post(struct io_kiocb *req, s32 res,</div><div class='del'>-				 u32 cflags)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	__io_cqring_fill_event(ctx, req-&gt;user_data, res, cflags);</div><div class='del'>-	/*</div><div class='del'>-	 * If we're the last reference to this request, add to our locked</div><div class='del'>-	 * free_list cache.</div><div class='del'>-	 */</div><div class='del'>-	if (req_ref_put_and_test(req)) {</div><div class='del'>-		if (req-&gt;flags &amp; (REQ_F_LINK | REQ_F_HARDLINK)) {</div><div class='del'>-			if (req-&gt;flags &amp; IO_DISARM_MASK)</div><div class='del'>-				io_disarm_next(req);</div><div class='del'>-			if (req-&gt;link) {</div><div class='del'>-				io_req_task_queue(req-&gt;link);</div><div class='del'>-				req-&gt;link = NULL;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-		io_req_put_rsrc(req, ctx);</div><div class='del'>-		io_dismantle_req(req);</div><div class='del'>-		io_put_task(req-&gt;task, 1);</div><div class='del'>-		wq_list_add_head(&amp;req-&gt;comp_list, &amp;ctx-&gt;locked_free_list);</div><div class='del'>-		ctx-&gt;locked_free_nr++;</div><div class='del'>-	}</div><div class='del'>-	io_commit_cqring(ctx);</div><div class='del'>-	spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	io_cqring_ev_posted(ctx);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void io_req_complete_state(struct io_kiocb *req, s32 res,</div><div class='del'>-					 u32 cflags)</div><div class='del'>-{</div><div class='del'>-	req-&gt;result = res;</div><div class='del'>-	req-&gt;cflags = cflags;</div><div class='del'>-	req-&gt;flags |= REQ_F_COMPLETE_INLINE;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void __io_req_complete(struct io_kiocb *req, unsigned issue_flags,</div><div class='del'>-				     s32 res, u32 cflags)</div><div class='del'>-{</div><div class='del'>-	if (issue_flags &amp; IO_URING_F_COMPLETE_DEFER)</div><div class='del'>-		io_req_complete_state(req, res, cflags);</div><div class='del'>-	else</div><div class='del'>-		io_req_complete_post(req, res, cflags);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void io_req_complete(struct io_kiocb *req, s32 res)</div><div class='del'>-{</div><div class='del'>-	__io_req_complete(req, 0, res, 0);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_req_complete_failed(struct io_kiocb *req, s32 res)</div><div class='del'>-{</div><div class='del'>-	req_set_fail(req);</div><div class='del'>-	io_req_complete_post(req, res, 0);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_req_complete_fail_submit(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	/*</div><div class='del'>-	 * We don't submit, fail them all, for that replace hardlinks with</div><div class='del'>-	 * normal links. Extra REQ_F_LINK is tolerated.</div><div class='del'>-	 */</div><div class='del'>-	req-&gt;flags &amp;= ~REQ_F_HARDLINK;</div><div class='del'>-	req-&gt;flags |= REQ_F_LINK;</div><div class='del'>-	io_req_complete_failed(req, req-&gt;result);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Don't initialise the fields below on every allocation, but do that in</div><div class='del'>- * advance and keep them valid across allocations.</div><div class='del'>- */</div><div class='del'>-static void io_preinit_req(struct io_kiocb *req, struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	req-&gt;ctx = ctx;</div><div class='del'>-	req-&gt;link = NULL;</div><div class='del'>-	req-&gt;async_data = NULL;</div><div class='del'>-	/* not necessary, but safer to zero */</div><div class='del'>-	req-&gt;result = 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_flush_cached_locked_reqs(struct io_ring_ctx *ctx,</div><div class='del'>-					struct io_submit_state *state)</div><div class='del'>-{</div><div class='del'>-	spin_lock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	wq_list_splice(&amp;ctx-&gt;locked_free_list, &amp;state-&gt;free_list);</div><div class='del'>-	ctx-&gt;locked_free_nr = 0;</div><div class='del'>-	spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* Returns true IFF there are requests in the cache */</div><div class='del'>-static bool io_flush_cached_reqs(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	struct io_submit_state *state = &amp;ctx-&gt;submit_state;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If we have more than a batch's worth of requests in our IRQ side</div><div class='del'>-	 * locked cache, grab the lock and move them over to our submission</div><div class='del'>-	 * side cache.</div><div class='del'>-	 */</div><div class='del'>-	if (READ_ONCE(ctx-&gt;locked_free_nr) &gt; IO_COMPL_BATCH)</div><div class='del'>-		io_flush_cached_locked_reqs(ctx, state);</div><div class='del'>-	return !!state-&gt;free_list.next;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * A request might get retired back into the request caches even before opcode</div><div class='del'>- * handlers and io_issue_sqe() are done with it, e.g. inline completion path.</div><div class='del'>- * Because of that, io_alloc_req() should be called only under -&gt;uring_lock</div><div class='del'>- * and with extra caution to not get a request that is still worked on.</div><div class='del'>- */</div><div class='del'>-static __cold bool __io_alloc_req_refill(struct io_ring_ctx *ctx)</div><div class='del'>-	__must_hold(&amp;ctx-&gt;uring_lock)</div><div class='del'>-{</div><div class='del'>-	struct io_submit_state *state = &amp;ctx-&gt;submit_state;</div><div class='del'>-	gfp_t gfp = GFP_KERNEL | __GFP_NOWARN;</div><div class='del'>-	void *reqs[IO_REQ_ALLOC_BATCH];</div><div class='del'>-	struct io_kiocb *req;</div><div class='del'>-	int ret, i;</div><div class='del'>-</div><div class='del'>-	if (likely(state-&gt;free_list.next || io_flush_cached_reqs(ctx)))</div><div class='del'>-		return true;</div><div class='del'>-</div><div class='del'>-	ret = kmem_cache_alloc_bulk(req_cachep, gfp, ARRAY_SIZE(reqs), reqs);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Bulk alloc is all-or-nothing. If we fail to get a batch,</div><div class='del'>-	 * retry single alloc to be on the safe side.</div><div class='del'>-	 */</div><div class='del'>-	if (unlikely(ret &lt;= 0)) {</div><div class='del'>-		reqs[0] = kmem_cache_alloc(req_cachep, gfp);</div><div class='del'>-		if (!reqs[0])</div><div class='del'>-			return false;</div><div class='del'>-		ret = 1;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	percpu_ref_get_many(&amp;ctx-&gt;refs, ret);</div><div class='del'>-	for (i = 0; i &lt; ret; i++) {</div><div class='del'>-		req = reqs[i];</div><div class='del'>-</div><div class='del'>-		io_preinit_req(req, ctx);</div><div class='del'>-		wq_stack_add_head(&amp;req-&gt;comp_list, &amp;state-&gt;free_list);</div><div class='del'>-	}</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline bool io_alloc_req_refill(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	if (unlikely(!ctx-&gt;submit_state.free_list.next))</div><div class='del'>-		return __io_alloc_req_refill(ctx);</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline struct io_kiocb *io_alloc_req(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	struct io_wq_work_node *node;</div><div class='del'>-</div><div class='del'>-	node = wq_stack_extract(&amp;ctx-&gt;submit_state.free_list);</div><div class='del'>-	return container_of(node, struct io_kiocb, comp_list);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void io_put_file(struct file *file)</div><div class='del'>-{</div><div class='del'>-	if (file)</div><div class='del'>-		fput(file);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void io_dismantle_req(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	unsigned int flags = req-&gt;flags;</div><div class='del'>-</div><div class='del'>-	if (unlikely(flags &amp; IO_REQ_CLEAN_FLAGS))</div><div class='del'>-		io_clean_op(req);</div><div class='del'>-	if (!(flags &amp; REQ_F_FIXED_FILE))</div><div class='del'>-		io_put_file(req-&gt;file);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold void __io_free_req(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-</div><div class='del'>-	io_req_put_rsrc(req, ctx);</div><div class='del'>-	io_dismantle_req(req);</div><div class='del'>-	io_put_task(req-&gt;task, 1);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	wq_list_add_head(&amp;req-&gt;comp_list, &amp;ctx-&gt;locked_free_list);</div><div class='del'>-	ctx-&gt;locked_free_nr++;</div><div class='del'>-	spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void io_remove_next_linked(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	struct io_kiocb *nxt = req-&gt;link;</div><div class='del'>-</div><div class='del'>-	req-&gt;link = nxt-&gt;link;</div><div class='del'>-	nxt-&gt;link = NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool io_kill_linked_timeout(struct io_kiocb *req)</div><div class='del'>-	__must_hold(&amp;req-&gt;ctx-&gt;completion_lock)</div><div class='del'>-	__must_hold(&amp;req-&gt;ctx-&gt;timeout_lock)</div><div class='del'>-{</div><div class='del'>-	struct io_kiocb *link = req-&gt;link;</div><div class='del'>-</div><div class='del'>-	if (link &amp;&amp; link-&gt;opcode == IORING_OP_LINK_TIMEOUT) {</div><div class='del'>-		struct io_timeout_data *io = link-&gt;async_data;</div><div class='del'>-</div><div class='del'>-		io_remove_next_linked(req);</div><div class='del'>-		link-&gt;timeout.head = NULL;</div><div class='del'>-		if (hrtimer_try_to_cancel(&amp;io-&gt;timer) != -1) {</div><div class='del'>-			list_del(&amp;link-&gt;timeout.list);</div><div class='del'>-			io_cqring_fill_event(link-&gt;ctx, link-&gt;user_data,</div><div class='del'>-					     -ECANCELED, 0);</div><div class='del'>-			io_put_req_deferred(link);</div><div class='del'>-			return true;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_fail_links(struct io_kiocb *req)</div><div class='del'>-	__must_hold(&amp;req-&gt;ctx-&gt;completion_lock)</div><div class='del'>-{</div><div class='del'>-	struct io_kiocb *nxt, *link = req-&gt;link;</div><div class='del'>-</div><div class='del'>-	req-&gt;link = NULL;</div><div class='del'>-	while (link) {</div><div class='del'>-		long res = -ECANCELED;</div><div class='del'>-</div><div class='del'>-		if (link-&gt;flags &amp; REQ_F_FAIL)</div><div class='del'>-			res = link-&gt;result;</div><div class='del'>-</div><div class='del'>-		nxt = link-&gt;link;</div><div class='del'>-		link-&gt;link = NULL;</div><div class='del'>-</div><div class='del'>-		trace_io_uring_fail_link(req, link);</div><div class='del'>-		io_cqring_fill_event(link-&gt;ctx, link-&gt;user_data, res, 0);</div><div class='del'>-		io_put_req_deferred(link);</div><div class='del'>-		link = nxt;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool io_disarm_next(struct io_kiocb *req)</div><div class='del'>-	__must_hold(&amp;req-&gt;ctx-&gt;completion_lock)</div><div class='del'>-{</div><div class='del'>-	bool posted = false;</div><div class='del'>-</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_ARM_LTIMEOUT) {</div><div class='del'>-		struct io_kiocb *link = req-&gt;link;</div><div class='del'>-</div><div class='del'>-		req-&gt;flags &amp;= ~REQ_F_ARM_LTIMEOUT;</div><div class='del'>-		if (link &amp;&amp; link-&gt;opcode == IORING_OP_LINK_TIMEOUT) {</div><div class='del'>-			io_remove_next_linked(req);</div><div class='del'>-			io_cqring_fill_event(link-&gt;ctx, link-&gt;user_data,</div><div class='del'>-					     -ECANCELED, 0);</div><div class='del'>-			io_put_req_deferred(link);</div><div class='del'>-			posted = true;</div><div class='del'>-		}</div><div class='del'>-	} else if (req-&gt;flags &amp; REQ_F_LINK_TIMEOUT) {</div><div class='del'>-		struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-</div><div class='del'>-		spin_lock_irq(&amp;ctx-&gt;timeout_lock);</div><div class='del'>-		posted = io_kill_linked_timeout(req);</div><div class='del'>-		spin_unlock_irq(&amp;ctx-&gt;timeout_lock);</div><div class='del'>-	}</div><div class='del'>-	if (unlikely((req-&gt;flags &amp; REQ_F_FAIL) &amp;&amp;</div><div class='del'>-		     !(req-&gt;flags &amp; REQ_F_HARDLINK))) {</div><div class='del'>-		posted |= (req-&gt;link != NULL);</div><div class='del'>-		io_fail_links(req);</div><div class='del'>-	}</div><div class='del'>-	return posted;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void __io_req_find_next_prep(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-	bool posted;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	posted = io_disarm_next(req);</div><div class='del'>-	if (posted)</div><div class='del'>-		io_commit_cqring(req-&gt;ctx);</div><div class='del'>-	spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	if (posted)</div><div class='del'>-		io_cqring_ev_posted(ctx);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline struct io_kiocb *io_req_find_next(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	struct io_kiocb *nxt;</div><div class='del'>-</div><div class='del'>-	if (likely(!(req-&gt;flags &amp; (REQ_F_LINK|REQ_F_HARDLINK))))</div><div class='del'>-		return NULL;</div><div class='del'>-	/*</div><div class='del'>-	 * If LINK is set, we have dependent requests in this chain. If we</div><div class='del'>-	 * didn't fail this request, queue the first one up, moving any other</div><div class='del'>-	 * dependencies to the next request. In case of failure, fail the rest</div><div class='del'>-	 * of the chain.</div><div class='del'>-	 */</div><div class='del'>-	if (unlikely(req-&gt;flags &amp; IO_DISARM_MASK))</div><div class='del'>-		__io_req_find_next_prep(req);</div><div class='del'>-	nxt = req-&gt;link;</div><div class='del'>-	req-&gt;link = NULL;</div><div class='del'>-	return nxt;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void ctx_flush_and_put(struct io_ring_ctx *ctx, bool *locked)</div><div class='del'>-{</div><div class='del'>-	if (!ctx)</div><div class='del'>-		return;</div><div class='del'>-	if (*locked) {</div><div class='del'>-		io_submit_flush_completions(ctx);</div><div class='del'>-		mutex_unlock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-		*locked = false;</div><div class='del'>-	}</div><div class='del'>-	percpu_ref_put(&amp;ctx-&gt;refs);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void tctx_task_work(struct callback_head *cb)</div><div class='del'>-{</div><div class='del'>-	bool locked = false;</div><div class='del'>-	struct io_ring_ctx *ctx = NULL;</div><div class='del'>-	struct io_uring_task *tctx = container_of(cb, struct io_uring_task,</div><div class='del'>-						  task_work);</div><div class='del'>-</div><div class='del'>-	while (1) {</div><div class='del'>-		struct io_wq_work_node *node;</div><div class='del'>-</div><div class='del'>-		if (!tctx-&gt;task_list.first &amp;&amp; locked)</div><div class='del'>-			io_submit_flush_completions(ctx);</div><div class='del'>-</div><div class='del'>-		spin_lock_irq(&amp;tctx-&gt;task_lock);</div><div class='del'>-		node = tctx-&gt;task_list.first;</div><div class='del'>-		INIT_WQ_LIST(&amp;tctx-&gt;task_list);</div><div class='del'>-		if (!node)</div><div class='del'>-			tctx-&gt;task_running = false;</div><div class='del'>-		spin_unlock_irq(&amp;tctx-&gt;task_lock);</div><div class='del'>-		if (!node)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		do {</div><div class='del'>-			struct io_wq_work_node *next = node-&gt;next;</div><div class='del'>-			struct io_kiocb *req = container_of(node, struct io_kiocb,</div><div class='del'>-							    io_task_work.node);</div><div class='del'>-</div><div class='del'>-			if (req-&gt;ctx != ctx) {</div><div class='del'>-				ctx_flush_and_put(ctx, &amp;locked);</div><div class='del'>-				ctx = req-&gt;ctx;</div><div class='del'>-				/* if not contended, grab and improve batching */</div><div class='del'>-				locked = mutex_trylock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-				percpu_ref_get(&amp;ctx-&gt;refs);</div><div class='del'>-			}</div><div class='del'>-			req-&gt;io_task_work.func(req, &amp;locked);</div><div class='del'>-			node = next;</div><div class='del'>-		} while (node);</div><div class='del'>-</div><div class='del'>-		cond_resched();</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ctx_flush_and_put(ctx, &amp;locked);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_req_task_work_add(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	struct task_struct *tsk = req-&gt;task;</div><div class='del'>-	struct io_uring_task *tctx = tsk-&gt;io_uring;</div><div class='del'>-	enum task_work_notify_mode notify;</div><div class='del'>-	struct io_wq_work_node *node;</div><div class='del'>-	unsigned long flags;</div><div class='del'>-	bool running;</div><div class='del'>-</div><div class='del'>-	WARN_ON_ONCE(!tctx);</div><div class='del'>-</div><div class='del'>-	spin_lock_irqsave(&amp;tctx-&gt;task_lock, flags);</div><div class='del'>-	wq_list_add_tail(&amp;req-&gt;io_task_work.node, &amp;tctx-&gt;task_list);</div><div class='del'>-	running = tctx-&gt;task_running;</div><div class='del'>-	if (!running)</div><div class='del'>-		tctx-&gt;task_running = true;</div><div class='del'>-	spin_unlock_irqrestore(&amp;tctx-&gt;task_lock, flags);</div><div class='del'>-</div><div class='del'>-	/* task_work already pending, we're done */</div><div class='del'>-	if (running)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * SQPOLL kernel thread doesn't need notification, just a wakeup. For</div><div class='del'>-	 * all other cases, use TWA_SIGNAL unconditionally to ensure we're</div><div class='del'>-	 * processing task_work. There's no reliable way to tell if TWA_RESUME</div><div class='del'>-	 * will do the job.</div><div class='del'>-	 */</div><div class='del'>-	notify = (req-&gt;ctx-&gt;flags &amp; IORING_SETUP_SQPOLL) ? TWA_NONE : TWA_SIGNAL;</div><div class='del'>-	if (likely(!task_work_add(tsk, &amp;tctx-&gt;task_work, notify))) {</div><div class='del'>-		if (notify == TWA_NONE)</div><div class='del'>-			wake_up_process(tsk);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_lock_irqsave(&amp;tctx-&gt;task_lock, flags);</div><div class='del'>-	tctx-&gt;task_running = false;</div><div class='del'>-	node = tctx-&gt;task_list.first;</div><div class='del'>-	INIT_WQ_LIST(&amp;tctx-&gt;task_list);</div><div class='del'>-	spin_unlock_irqrestore(&amp;tctx-&gt;task_lock, flags);</div><div class='del'>-</div><div class='del'>-	while (node) {</div><div class='del'>-		req = container_of(node, struct io_kiocb, io_task_work.node);</div><div class='del'>-		node = node-&gt;next;</div><div class='del'>-		if (llist_add(&amp;req-&gt;io_task_work.fallback_node,</div><div class='del'>-			      &amp;req-&gt;ctx-&gt;fallback_llist))</div><div class='del'>-			schedule_delayed_work(&amp;req-&gt;ctx-&gt;fallback_work, 1);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_req_task_cancel(struct io_kiocb *req, bool *locked)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-</div><div class='del'>-	/* not needed for normal modes, but SQPOLL depends on it */</div><div class='del'>-	io_tw_lock(ctx, locked);</div><div class='del'>-	io_req_complete_failed(req, req-&gt;result);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_req_task_submit(struct io_kiocb *req, bool *locked)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-</div><div class='del'>-	io_tw_lock(ctx, locked);</div><div class='del'>-	/* req-&gt;task == current here, checking PF_EXITING is safe */</div><div class='del'>-	if (likely(!(req-&gt;task-&gt;flags &amp; PF_EXITING)))</div><div class='del'>-		__io_queue_sqe(req);</div><div class='del'>-	else</div><div class='del'>-		io_req_complete_failed(req, -EFAULT);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_req_task_queue_fail(struct io_kiocb *req, int ret)</div><div class='del'>-{</div><div class='del'>-	req-&gt;result = ret;</div><div class='del'>-	req-&gt;io_task_work.func = io_req_task_cancel;</div><div class='del'>-	io_req_task_work_add(req);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_req_task_queue(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	req-&gt;io_task_work.func = io_req_task_submit;</div><div class='del'>-	io_req_task_work_add(req);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_req_task_queue_reissue(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	req-&gt;io_task_work.func = io_queue_async_work;</div><div class='del'>-	io_req_task_work_add(req);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void io_queue_next(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	struct io_kiocb *nxt = io_req_find_next(req);</div><div class='del'>-</div><div class='del'>-	if (nxt)</div><div class='del'>-		io_req_task_queue(nxt);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_free_req(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	io_queue_next(req);</div><div class='del'>-	__io_free_req(req);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_free_req_work(struct io_kiocb *req, bool *locked)</div><div class='del'>-{</div><div class='del'>-	io_free_req(req);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_free_batch_list(struct io_ring_ctx *ctx,</div><div class='del'>-				struct io_wq_work_node *node)</div><div class='del'>-	__must_hold(&amp;ctx-&gt;uring_lock)</div><div class='del'>-{</div><div class='del'>-	struct task_struct *task = NULL;</div><div class='del'>-	int task_refs = 0;</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		struct io_kiocb *req = container_of(node, struct io_kiocb,</div><div class='del'>-						    comp_list);</div><div class='del'>-</div><div class='del'>-		if (unlikely(req-&gt;flags &amp; REQ_F_REFCOUNT)) {</div><div class='del'>-			node = req-&gt;comp_list.next;</div><div class='del'>-			if (!req_ref_put_and_test(req))</div><div class='del'>-				continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		io_req_put_rsrc_locked(req, ctx);</div><div class='del'>-		io_queue_next(req);</div><div class='del'>-		io_dismantle_req(req);</div><div class='del'>-</div><div class='del'>-		if (req-&gt;task != task) {</div><div class='del'>-			if (task)</div><div class='del'>-				io_put_task(task, task_refs);</div><div class='del'>-			task = req-&gt;task;</div><div class='del'>-			task_refs = 0;</div><div class='del'>-		}</div><div class='del'>-		task_refs++;</div><div class='del'>-		node = req-&gt;comp_list.next;</div><div class='del'>-		wq_stack_add_head(&amp;req-&gt;comp_list, &amp;ctx-&gt;submit_state.free_list);</div><div class='del'>-	} while (node);</div><div class='del'>-</div><div class='del'>-	if (task)</div><div class='del'>-		io_put_task(task, task_refs);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void __io_submit_flush_completions(struct io_ring_ctx *ctx)</div><div class='del'>-	__must_hold(&amp;ctx-&gt;uring_lock)</div><div class='del'>-{</div><div class='del'>-	struct io_wq_work_node *node, *prev;</div><div class='del'>-	struct io_submit_state *state = &amp;ctx-&gt;submit_state;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	wq_list_for_each(node, prev, &amp;state-&gt;compl_reqs) {</div><div class='del'>-		struct io_kiocb *req = container_of(node, struct io_kiocb,</div><div class='del'>-						    comp_list);</div><div class='del'>-</div><div class='del'>-		__io_cqring_fill_event(ctx, req-&gt;user_data, req-&gt;result,</div><div class='del'>-					req-&gt;cflags);</div><div class='del'>-	}</div><div class='del'>-	io_commit_cqring(ctx);</div><div class='del'>-	spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	io_cqring_ev_posted(ctx);</div><div class='del'>-</div><div class='del'>-	io_free_batch_list(ctx, state-&gt;compl_reqs.first);</div><div class='del'>-	INIT_WQ_LIST(&amp;state-&gt;compl_reqs);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Drop reference to request, return next in chain (if there is one) if this</div><div class='del'>- * was the last reference to this request.</div><div class='del'>- */</div><div class='del'>-static inline struct io_kiocb *io_put_req_find_next(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	struct io_kiocb *nxt = NULL;</div><div class='del'>-</div><div class='del'>-	if (req_ref_put_and_test(req)) {</div><div class='del'>-		nxt = io_req_find_next(req);</div><div class='del'>-		__io_free_req(req);</div><div class='del'>-	}</div><div class='del'>-	return nxt;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void io_put_req(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	if (req_ref_put_and_test(req))</div><div class='del'>-		io_free_req(req);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void io_put_req_deferred(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	if (req_ref_put_and_test(req)) {</div><div class='del'>-		req-&gt;io_task_work.func = io_free_req_work;</div><div class='del'>-		io_req_task_work_add(req);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static unsigned io_cqring_events(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	/* See comment at the top of this file */</div><div class='del'>-	smp_rmb();</div><div class='del'>-	return __io_cqring_events(ctx);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline unsigned int io_sqring_entries(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	struct io_rings *rings = ctx-&gt;rings;</div><div class='del'>-</div><div class='del'>-	/* make sure SQ entry isn't read before tail */</div><div class='del'>-	return smp_load_acquire(&amp;rings-&gt;sq.tail) - ctx-&gt;cached_sq_head;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static unsigned int io_put_kbuf(struct io_kiocb *req, struct io_buffer *kbuf)</div><div class='del'>-{</div><div class='del'>-	unsigned int cflags;</div><div class='del'>-</div><div class='del'>-	cflags = kbuf-&gt;bid &lt;&lt; IORING_CQE_BUFFER_SHIFT;</div><div class='del'>-	cflags |= IORING_CQE_F_BUFFER;</div><div class='del'>-	req-&gt;flags &amp;= ~REQ_F_BUFFER_SELECTED;</div><div class='del'>-	kfree(kbuf);</div><div class='del'>-	return cflags;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline unsigned int io_put_rw_kbuf(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	if (likely(!(req-&gt;flags &amp; REQ_F_BUFFER_SELECTED)))</div><div class='del'>-		return 0;</div><div class='del'>-	return io_put_kbuf(req, req-&gt;kbuf);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline bool io_run_task_work(void)</div><div class='del'>-{</div><div class='del'>-	if (test_thread_flag(TIF_NOTIFY_SIGNAL) || current-&gt;task_works) {</div><div class='del'>-		__set_current_state(TASK_RUNNING);</div><div class='del'>-		tracehook_notify_signal();</div><div class='del'>-		return true;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_do_iopoll(struct io_ring_ctx *ctx, bool force_nonspin)</div><div class='del'>-{</div><div class='del'>-	struct io_wq_work_node *pos, *start, *prev;</div><div class='del'>-	unsigned int poll_flags = BLK_POLL_NOSLEEP;</div><div class='del'>-	DEFINE_IO_COMP_BATCH(iob);</div><div class='del'>-	int nr_events = 0;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Only spin for completions if we don't have multiple devices hanging</div><div class='del'>-	 * off our complete list.</div><div class='del'>-	 */</div><div class='del'>-	if (ctx-&gt;poll_multi_queue || force_nonspin)</div><div class='del'>-		poll_flags |= BLK_POLL_ONESHOT;</div><div class='del'>-</div><div class='del'>-	wq_list_for_each(pos, start, &amp;ctx-&gt;iopoll_list) {</div><div class='del'>-		struct io_kiocb *req = container_of(pos, struct io_kiocb, comp_list);</div><div class='del'>-		struct kiocb *kiocb = &amp;req-&gt;rw.kiocb;</div><div class='del'>-		int ret;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Move completed and retryable entries to our local lists.</div><div class='del'>-		 * If we find a request that requires polling, break out</div><div class='del'>-		 * and complete those lists first, if we have entries there.</div><div class='del'>-		 */</div><div class='del'>-		if (READ_ONCE(req-&gt;iopoll_completed))</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		ret = kiocb-&gt;ki_filp-&gt;f_op-&gt;iopoll(kiocb, &amp;iob, poll_flags);</div><div class='del'>-		if (unlikely(ret &lt; 0))</div><div class='del'>-			return ret;</div><div class='del'>-		else if (ret)</div><div class='del'>-			poll_flags |= BLK_POLL_ONESHOT;</div><div class='del'>-</div><div class='del'>-		/* iopoll may have completed current req */</div><div class='del'>-		if (!rq_list_empty(iob.req_list) ||</div><div class='del'>-		    READ_ONCE(req-&gt;iopoll_completed))</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!rq_list_empty(iob.req_list))</div><div class='del'>-		iob.complete(&amp;iob);</div><div class='del'>-	else if (!pos)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	prev = start;</div><div class='del'>-	wq_list_for_each_resume(pos, prev) {</div><div class='del'>-		struct io_kiocb *req = container_of(pos, struct io_kiocb, comp_list);</div><div class='del'>-</div><div class='del'>-		/* order with io_complete_rw_iopoll(), e.g. -&gt;result updates */</div><div class='del'>-		if (!smp_load_acquire(&amp;req-&gt;iopoll_completed))</div><div class='del'>-			break;</div><div class='del'>-		__io_cqring_fill_event(ctx, req-&gt;user_data, req-&gt;result,</div><div class='del'>-					io_put_rw_kbuf(req));</div><div class='del'>-		nr_events++;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (unlikely(!nr_events))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	io_commit_cqring(ctx);</div><div class='del'>-	io_cqring_ev_posted_iopoll(ctx);</div><div class='del'>-	pos = start ? start-&gt;next : ctx-&gt;iopoll_list.first;</div><div class='del'>-	wq_list_cut(&amp;ctx-&gt;iopoll_list, prev, start);</div><div class='del'>-	io_free_batch_list(ctx, pos);</div><div class='del'>-	return nr_events;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * We can't just wait for polled events to come to us, we have to actively</div><div class='del'>- * find and complete them.</div><div class='del'>- */</div><div class='del'>-static __cold void io_iopoll_try_reap_events(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	if (!(ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-	while (!wq_list_empty(&amp;ctx-&gt;iopoll_list)) {</div><div class='del'>-		/* let it sleep and repeat later if can't complete a request */</div><div class='del'>-		if (io_do_iopoll(ctx, true) == 0)</div><div class='del'>-			break;</div><div class='del'>-		/*</div><div class='del'>-		 * Ensure we allow local-to-the-cpu processing to take place,</div><div class='del'>-		 * in this case we need to ensure that we reap all events.</div><div class='del'>-		 * Also let task_work, etc. to progress by releasing the mutex</div><div class='del'>-		 */</div><div class='del'>-		if (need_resched()) {</div><div class='del'>-			mutex_unlock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-			cond_resched();</div><div class='del'>-			mutex_lock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	mutex_unlock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_iopoll_check(struct io_ring_ctx *ctx, long min)</div><div class='del'>-{</div><div class='del'>-	unsigned int nr_events = 0;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * We disallow the app entering submit/complete with polling, but we</div><div class='del'>-	 * still need to lock the ring to prevent racing with polled issue</div><div class='del'>-	 * that got punted to a workqueue.</div><div class='del'>-	 */</div><div class='del'>-	mutex_lock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-	/*</div><div class='del'>-	 * Don't enter poll loop if we already have events pending.</div><div class='del'>-	 * If we do, we can potentially be spinning for commands that</div><div class='del'>-	 * already triggered a CQE (eg in error).</div><div class='del'>-	 */</div><div class='del'>-	if (test_bit(0, &amp;ctx-&gt;check_cq_overflow))</div><div class='del'>-		__io_cqring_overflow_flush(ctx, false);</div><div class='del'>-	if (io_cqring_events(ctx))</div><div class='del'>-		goto out;</div><div class='del'>-	do {</div><div class='del'>-		/*</div><div class='del'>-		 * If a submit got punted to a workqueue, we can have the</div><div class='del'>-		 * application entering polling for a command before it gets</div><div class='del'>-		 * issued. That app will hold the uring_lock for the duration</div><div class='del'>-		 * of the poll right here, so we need to take a breather every</div><div class='del'>-		 * now and then to ensure that the issue has a chance to add</div><div class='del'>-		 * the poll to the issued list. Otherwise we can spin here</div><div class='del'>-		 * forever, while the workqueue is stuck trying to acquire the</div><div class='del'>-		 * very same mutex.</div><div class='del'>-		 */</div><div class='del'>-		if (wq_list_empty(&amp;ctx-&gt;iopoll_list)) {</div><div class='del'>-			u32 tail = ctx-&gt;cached_cq_tail;</div><div class='del'>-</div><div class='del'>-			mutex_unlock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-			io_run_task_work();</div><div class='del'>-			mutex_lock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-</div><div class='del'>-			/* some requests don't go through iopoll_list */</div><div class='del'>-			if (tail != ctx-&gt;cached_cq_tail ||</div><div class='del'>-			    wq_list_empty(&amp;ctx-&gt;iopoll_list))</div><div class='del'>-				break;</div><div class='del'>-		}</div><div class='del'>-		ret = io_do_iopoll(ctx, !min);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			break;</div><div class='del'>-		nr_events += ret;</div><div class='del'>-		ret = 0;</div><div class='del'>-	} while (nr_events &lt; min &amp;&amp; !need_resched());</div><div class='del'>-out:</div><div class='del'>-	mutex_unlock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void kiocb_end_write(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	/*</div><div class='del'>-	 * Tell lockdep we inherited freeze protection from submission</div><div class='del'>-	 * thread.</div><div class='del'>-	 */</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_ISREG) {</div><div class='del'>-		struct super_block *sb = file_inode(req-&gt;file)-&gt;i_sb;</div><div class='del'>-</div><div class='del'>-		__sb_writers_acquired(sb, SB_FREEZE_WRITE);</div><div class='del'>-		sb_end_write(sb);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_BLOCK</div><div class='del'>-static bool io_resubmit_prep(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	struct io_async_rw *rw = req-&gt;async_data;</div><div class='del'>-</div><div class='del'>-	if (!req_has_async_data(req))</div><div class='del'>-		return !io_req_prep_async(req);</div><div class='del'>-	iov_iter_restore(&amp;rw-&gt;s.iter, &amp;rw-&gt;s.iter_state);</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool io_rw_should_reissue(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	umode_t mode = file_inode(req-&gt;file)-&gt;i_mode;</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-</div><div class='del'>-	if (!S_ISBLK(mode) &amp;&amp; !S_ISREG(mode))</div><div class='del'>-		return false;</div><div class='del'>-	if ((req-&gt;flags &amp; REQ_F_NOWAIT) || (io_wq_current_is_worker() &amp;&amp;</div><div class='del'>-	    !(ctx-&gt;flags &amp; IORING_SETUP_IOPOLL)))</div><div class='del'>-		return false;</div><div class='del'>-	/*</div><div class='del'>-	 * If ref is dying, we might be running poll reap from the exit work.</div><div class='del'>-	 * Don't attempt to reissue from that path, just let it fail with</div><div class='del'>-	 * -EAGAIN.</div><div class='del'>-	 */</div><div class='del'>-	if (percpu_ref_is_dying(&amp;ctx-&gt;refs))</div><div class='del'>-		return false;</div><div class='del'>-	/*</div><div class='del'>-	 * Play it safe and assume not safe to re-import and reissue if we're</div><div class='del'>-	 * not in the original thread group (or in task context).</div><div class='del'>-	 */</div><div class='del'>-	if (!same_thread_group(req-&gt;task, current) || !in_task())</div><div class='del'>-		return false;</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-#else</div><div class='del'>-static bool io_resubmit_prep(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='del'>-static bool io_rw_should_reissue(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-static bool __io_complete_rw_common(struct io_kiocb *req, long res)</div><div class='del'>-{</div><div class='del'>-	if (req-&gt;rw.kiocb.ki_flags &amp; IOCB_WRITE)</div><div class='del'>-		kiocb_end_write(req);</div><div class='del'>-	if (unlikely(res != req-&gt;result)) {</div><div class='del'>-		if ((res == -EAGAIN || res == -EOPNOTSUPP) &amp;&amp;</div><div class='del'>-		    io_rw_should_reissue(req)) {</div><div class='del'>-			req-&gt;flags |= REQ_F_REISSUE;</div><div class='del'>-			return true;</div><div class='del'>-		}</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-		req-&gt;result = res;</div><div class='del'>-	}</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_req_task_complete(struct io_kiocb *req, bool *locked)</div><div class='del'>-{</div><div class='del'>-	unsigned int cflags = io_put_rw_kbuf(req);</div><div class='del'>-	int res = req-&gt;result;</div><div class='del'>-</div><div class='del'>-	if (*locked) {</div><div class='del'>-		io_req_complete_state(req, res, cflags);</div><div class='del'>-		io_req_add_compl_list(req);</div><div class='del'>-	} else {</div><div class='del'>-		io_req_complete_post(req, res, cflags);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void __io_complete_rw(struct io_kiocb *req, long res, long res2,</div><div class='del'>-			     unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	if (__io_complete_rw_common(req, res))</div><div class='del'>-		return;</div><div class='del'>-	__io_req_complete(req, issue_flags, req-&gt;result, io_put_rw_kbuf(req));</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_complete_rw(struct kiocb *kiocb, long res)</div><div class='del'>-{</div><div class='del'>-	struct io_kiocb *req = container_of(kiocb, struct io_kiocb, rw.kiocb);</div><div class='del'>-</div><div class='del'>-	if (__io_complete_rw_common(req, res))</div><div class='del'>-		return;</div><div class='del'>-	req-&gt;result = res;</div><div class='del'>-	req-&gt;io_task_work.func = io_req_task_complete;</div><div class='del'>-	io_req_task_work_add(req);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_complete_rw_iopoll(struct kiocb *kiocb, long res)</div><div class='del'>-{</div><div class='del'>-	struct io_kiocb *req = container_of(kiocb, struct io_kiocb, rw.kiocb);</div><div class='del'>-</div><div class='del'>-	if (kiocb-&gt;ki_flags &amp; IOCB_WRITE)</div><div class='del'>-		kiocb_end_write(req);</div><div class='del'>-	if (unlikely(res != req-&gt;result)) {</div><div class='del'>-		if (res == -EAGAIN &amp;&amp; io_rw_should_reissue(req)) {</div><div class='del'>-			req-&gt;flags |= REQ_F_REISSUE;</div><div class='del'>-			return;</div><div class='del'>-		}</div><div class='del'>-		req-&gt;result = res;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* order with io_iopoll_complete() checking -&gt;iopoll_completed */</div><div class='del'>-	smp_store_release(&amp;req-&gt;iopoll_completed, 1);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * After the iocb has been issued, it's safe to be found on the poll list.</div><div class='del'>- * Adding the kiocb to the list AFTER submission ensures that we don't</div><div class='del'>- * find it from a io_do_iopoll() thread before the issuer is done</div><div class='del'>- * accessing the kiocb cookie.</div><div class='del'>- */</div><div class='del'>-static void io_iopoll_req_issued(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-	const bool needs_lock = issue_flags &amp; IO_URING_F_UNLOCKED;</div><div class='del'>-</div><div class='del'>-	/* workqueue context doesn't hold uring_lock, grab it now */</div><div class='del'>-	if (unlikely(needs_lock))</div><div class='del'>-		mutex_lock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Track whether we have multiple files in our lists. This will impact</div><div class='del'>-	 * how we do polling eventually, not spinning if we're on potentially</div><div class='del'>-	 * different devices.</div><div class='del'>-	 */</div><div class='del'>-	if (wq_list_empty(&amp;ctx-&gt;iopoll_list)) {</div><div class='del'>-		ctx-&gt;poll_multi_queue = false;</div><div class='del'>-	} else if (!ctx-&gt;poll_multi_queue) {</div><div class='del'>-		struct io_kiocb *list_req;</div><div class='del'>-</div><div class='del'>-		list_req = container_of(ctx-&gt;iopoll_list.first, struct io_kiocb,</div><div class='del'>-					comp_list);</div><div class='del'>-		if (list_req-&gt;file != req-&gt;file)</div><div class='del'>-			ctx-&gt;poll_multi_queue = true;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * For fast devices, IO may have already completed. If it has, add</div><div class='del'>-	 * it to the front so we find it first.</div><div class='del'>-	 */</div><div class='del'>-	if (READ_ONCE(req-&gt;iopoll_completed))</div><div class='del'>-		wq_list_add_head(&amp;req-&gt;comp_list, &amp;ctx-&gt;iopoll_list);</div><div class='del'>-	else</div><div class='del'>-		wq_list_add_tail(&amp;req-&gt;comp_list, &amp;ctx-&gt;iopoll_list);</div><div class='del'>-</div><div class='del'>-	if (unlikely(needs_lock)) {</div><div class='del'>-		/*</div><div class='del'>-		 * If IORING_SETUP_SQPOLL is enabled, sqes are either handle</div><div class='del'>-		 * in sq thread task context or in io worker task context. If</div><div class='del'>-		 * current task context is sq thread, we don't need to check</div><div class='del'>-		 * whether should wake up sq thread.</div><div class='del'>-		 */</div><div class='del'>-		if ((ctx-&gt;flags &amp; IORING_SETUP_SQPOLL) &amp;&amp;</div><div class='del'>-		    wq_has_sleeper(&amp;ctx-&gt;sq_data-&gt;wait))</div><div class='del'>-			wake_up(&amp;ctx-&gt;sq_data-&gt;wait);</div><div class='del'>-</div><div class='del'>-		mutex_unlock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool io_bdev_nowait(struct block_device *bdev)</div><div class='del'>-{</div><div class='del'>-	return !bdev || blk_queue_nowait(bdev_get_queue(bdev));</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * If we tracked the file through the SCM inflight mechanism, we could support</div><div class='del'>- * any file. For now, just ensure that anything potentially problematic is done</div><div class='del'>- * inline.</div><div class='del'>- */</div><div class='del'>-static bool __io_file_supports_nowait(struct file *file, umode_t mode)</div><div class='del'>-{</div><div class='del'>-	if (S_ISBLK(mode)) {</div><div class='del'>-		if (IS_ENABLED(CONFIG_BLOCK) &amp;&amp;</div><div class='del'>-		    io_bdev_nowait(I_BDEV(file-&gt;f_mapping-&gt;host)))</div><div class='del'>-			return true;</div><div class='del'>-		return false;</div><div class='del'>-	}</div><div class='del'>-	if (S_ISSOCK(mode))</div><div class='del'>-		return true;</div><div class='del'>-	if (S_ISREG(mode)) {</div><div class='del'>-		if (IS_ENABLED(CONFIG_BLOCK) &amp;&amp;</div><div class='del'>-		    io_bdev_nowait(file-&gt;f_inode-&gt;i_sb-&gt;s_bdev) &amp;&amp;</div><div class='del'>-		    file-&gt;f_op != &amp;io_uring_fops)</div><div class='del'>-			return true;</div><div class='del'>-		return false;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* any -&gt;read/write should understand O_NONBLOCK */</div><div class='del'>-	if (file-&gt;f_flags &amp; O_NONBLOCK)</div><div class='del'>-		return true;</div><div class='del'>-	return file-&gt;f_mode &amp; FMODE_NOWAIT;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * If we tracked the file through the SCM inflight mechanism, we could support</div><div class='del'>- * any file. For now, just ensure that anything potentially problematic is done</div><div class='del'>- * inline.</div><div class='del'>- */</div><div class='del'>-static unsigned int io_file_get_flags(struct file *file)</div><div class='del'>-{</div><div class='del'>-	umode_t mode = file_inode(file)-&gt;i_mode;</div><div class='del'>-	unsigned int res = 0;</div><div class='del'>-</div><div class='del'>-	if (S_ISREG(mode))</div><div class='del'>-		res |= FFS_ISREG;</div><div class='del'>-	if (__io_file_supports_nowait(file, mode))</div><div class='del'>-		res |= FFS_NOWAIT;</div><div class='del'>-	return res;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline bool io_file_supports_nowait(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	return req-&gt;flags &amp; REQ_F_SUPPORT_NOWAIT;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_prep_rw(struct io_kiocb *req, const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-	struct kiocb *kiocb = &amp;req-&gt;rw.kiocb;</div><div class='del'>-	struct file *file = req-&gt;file;</div><div class='del'>-	unsigned ioprio;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (!io_req_ffs_set(req))</div><div class='del'>-		req-&gt;flags |= io_file_get_flags(file) &lt;&lt; REQ_F_SUPPORT_NOWAIT_BIT;</div><div class='del'>-</div><div class='del'>-	kiocb-&gt;ki_pos = READ_ONCE(sqe-&gt;off);</div><div class='del'>-	if (kiocb-&gt;ki_pos == -1 &amp;&amp; !(file-&gt;f_mode &amp; FMODE_STREAM)) {</div><div class='del'>-		req-&gt;flags |= REQ_F_CUR_POS;</div><div class='del'>-		kiocb-&gt;ki_pos = file-&gt;f_pos;</div><div class='del'>-	}</div><div class='del'>-	kiocb-&gt;ki_flags = iocb_flags(file);</div><div class='del'>-	ret = kiocb_set_rw_flags(kiocb, READ_ONCE(sqe-&gt;rw_flags));</div><div class='del'>-	if (unlikely(ret))</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If the file is marked O_NONBLOCK, still allow retry for it if it</div><div class='del'>-	 * supports async. Otherwise it's impossible to use O_NONBLOCK files</div><div class='del'>-	 * reliably. If not, or it IOCB_NOWAIT is set, don't retry.</div><div class='del'>-	 */</div><div class='del'>-	if ((kiocb-&gt;ki_flags &amp; IOCB_NOWAIT) ||</div><div class='del'>-	    ((file-&gt;f_flags &amp; O_NONBLOCK) &amp;&amp; !io_file_supports_nowait(req)))</div><div class='del'>-		req-&gt;flags |= REQ_F_NOWAIT;</div><div class='del'>-</div><div class='del'>-	if (ctx-&gt;flags &amp; IORING_SETUP_IOPOLL) {</div><div class='del'>-		if (!(kiocb-&gt;ki_flags &amp; IOCB_DIRECT) || !file-&gt;f_op-&gt;iopoll)</div><div class='del'>-			return -EOPNOTSUPP;</div><div class='del'>-</div><div class='del'>-		kiocb-&gt;ki_flags |= IOCB_HIPRI | IOCB_ALLOC_CACHE;</div><div class='del'>-		kiocb-&gt;ki_complete = io_complete_rw_iopoll;</div><div class='del'>-		req-&gt;iopoll_completed = 0;</div><div class='del'>-	} else {</div><div class='del'>-		if (kiocb-&gt;ki_flags &amp; IOCB_HIPRI)</div><div class='del'>-			return -EINVAL;</div><div class='del'>-		kiocb-&gt;ki_complete = io_complete_rw;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ioprio = READ_ONCE(sqe-&gt;ioprio);</div><div class='del'>-	if (ioprio) {</div><div class='del'>-		ret = ioprio_check_cap(ioprio);</div><div class='del'>-		if (ret)</div><div class='del'>-			return ret;</div><div class='del'>-</div><div class='del'>-		kiocb-&gt;ki_ioprio = ioprio;</div><div class='del'>-	} else {</div><div class='del'>-		kiocb-&gt;ki_ioprio = get_current_ioprio();</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	req-&gt;imu = NULL;</div><div class='del'>-	req-&gt;rw.addr = READ_ONCE(sqe-&gt;addr);</div><div class='del'>-	req-&gt;rw.len = READ_ONCE(sqe-&gt;len);</div><div class='del'>-	req-&gt;buf_index = READ_ONCE(sqe-&gt;buf_index);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void io_rw_done(struct kiocb *kiocb, ssize_t ret)</div><div class='del'>-{</div><div class='del'>-	switch (ret) {</div><div class='del'>-	case -EIOCBQUEUED:</div><div class='del'>-		break;</div><div class='del'>-	case -ERESTARTSYS:</div><div class='del'>-	case -ERESTARTNOINTR:</div><div class='del'>-	case -ERESTARTNOHAND:</div><div class='del'>-	case -ERESTART_RESTARTBLOCK:</div><div class='del'>-		/*</div><div class='del'>-		 * We can't just restart the syscall, since previously</div><div class='del'>-		 * submitted sqes may already be in progress. Just fail this</div><div class='del'>-		 * IO with EINTR.</div><div class='del'>-		 */</div><div class='del'>-		ret = -EINTR;</div><div class='del'>-		fallthrough;</div><div class='del'>-	default:</div><div class='del'>-		kiocb-&gt;ki_complete(kiocb, ret);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void kiocb_done(struct kiocb *kiocb, ssize_t ret,</div><div class='del'>-		       unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_kiocb *req = container_of(kiocb, struct io_kiocb, rw.kiocb);</div><div class='del'>-	struct io_async_rw *io = req-&gt;async_data;</div><div class='del'>-</div><div class='del'>-	/* add previously done IO, if any */</div><div class='del'>-	if (req_has_async_data(req) &amp;&amp; io-&gt;bytes_done &gt; 0) {</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			ret = io-&gt;bytes_done;</div><div class='del'>-		else</div><div class='del'>-			ret += io-&gt;bytes_done;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_CUR_POS)</div><div class='del'>-		req-&gt;file-&gt;f_pos = kiocb-&gt;ki_pos;</div><div class='del'>-	if (ret &gt;= 0 &amp;&amp; (kiocb-&gt;ki_complete == io_complete_rw))</div><div class='del'>-		__io_complete_rw(req, ret, 0, issue_flags);</div><div class='del'>-	else</div><div class='del'>-		io_rw_done(kiocb, ret);</div><div class='del'>-</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_REISSUE) {</div><div class='del'>-		req-&gt;flags &amp;= ~REQ_F_REISSUE;</div><div class='del'>-		if (io_resubmit_prep(req)) {</div><div class='del'>-			io_req_task_queue_reissue(req);</div><div class='del'>-		} else {</div><div class='del'>-			unsigned int cflags = io_put_rw_kbuf(req);</div><div class='del'>-			struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-</div><div class='del'>-			req_set_fail(req);</div><div class='del'>-			if (issue_flags &amp; IO_URING_F_UNLOCKED) {</div><div class='del'>-				mutex_lock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-				__io_req_complete(req, issue_flags, ret, cflags);</div><div class='del'>-				mutex_unlock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-			} else {</div><div class='del'>-				__io_req_complete(req, issue_flags, ret, cflags);</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int __io_import_fixed(struct io_kiocb *req, int rw, struct iov_iter *iter,</div><div class='del'>-			     struct io_mapped_ubuf *imu)</div><div class='del'>-{</div><div class='del'>-	size_t len = req-&gt;rw.len;</div><div class='del'>-	u64 buf_end, buf_addr = req-&gt;rw.addr;</div><div class='del'>-	size_t offset;</div><div class='del'>-</div><div class='del'>-	if (unlikely(check_add_overflow(buf_addr, (u64)len, &amp;buf_end)))</div><div class='del'>-		return -EFAULT;</div><div class='del'>-	/* not inside the mapped region */</div><div class='del'>-	if (unlikely(buf_addr &lt; imu-&gt;ubuf || buf_end &gt; imu-&gt;ubuf_end))</div><div class='del'>-		return -EFAULT;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * May not be a start of buffer, set size appropriately</div><div class='del'>-	 * and advance us to the beginning.</div><div class='del'>-	 */</div><div class='del'>-	offset = buf_addr - imu-&gt;ubuf;</div><div class='del'>-	iov_iter_bvec(iter, rw, imu-&gt;bvec, imu-&gt;nr_bvecs, offset + len);</div><div class='del'>-</div><div class='del'>-	if (offset) {</div><div class='del'>-		/*</div><div class='del'>-		 * Don't use iov_iter_advance() here, as it's really slow for</div><div class='del'>-		 * using the latter parts of a big fixed buffer - it iterates</div><div class='del'>-		 * over each segment manually. We can cheat a bit here, because</div><div class='del'>-		 * we know that:</div><div class='del'>-		 *</div><div class='del'>-		 * 1) it's a BVEC iter, we set it up</div><div class='del'>-		 * 2) all bvecs are PAGE_SIZE in size, except potentially the</div><div class='del'>-		 *    first and last bvec</div><div class='del'>-		 *</div><div class='del'>-		 * So just find our index, and adjust the iterator afterwards.</div><div class='del'>-		 * If the offset is within the first bvec (or the whole first</div><div class='del'>-		 * bvec, just use iov_iter_advance(). This makes it easier</div><div class='del'>-		 * since we can just skip the first segment, which may not</div><div class='del'>-		 * be PAGE_SIZE aligned.</div><div class='del'>-		 */</div><div class='del'>-		const struct bio_vec *bvec = imu-&gt;bvec;</div><div class='del'>-</div><div class='del'>-		if (offset &lt;= bvec-&gt;bv_len) {</div><div class='del'>-			iov_iter_advance(iter, offset);</div><div class='del'>-		} else {</div><div class='del'>-			unsigned long seg_skip;</div><div class='del'>-</div><div class='del'>-			/* skip first vec */</div><div class='del'>-			offset -= bvec-&gt;bv_len;</div><div class='del'>-			seg_skip = 1 + (offset &gt;&gt; PAGE_SHIFT);</div><div class='del'>-</div><div class='del'>-			iter-&gt;bvec = bvec + seg_skip;</div><div class='del'>-			iter-&gt;nr_segs -= seg_skip;</div><div class='del'>-			iter-&gt;count -= bvec-&gt;bv_len + offset;</div><div class='del'>-			iter-&gt;iov_offset = offset &amp; ~PAGE_MASK;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_import_fixed(struct io_kiocb *req, int rw, struct iov_iter *iter)</div><div class='del'>-{</div><div class='del'>-	struct io_mapped_ubuf *imu = req-&gt;imu;</div><div class='del'>-	u16 index, buf_index = req-&gt;buf_index;</div><div class='del'>-</div><div class='del'>-	if (likely(!imu)) {</div><div class='del'>-		struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-</div><div class='del'>-		if (unlikely(buf_index &gt;= ctx-&gt;nr_user_bufs))</div><div class='del'>-			return -EFAULT;</div><div class='del'>-		io_req_set_rsrc_node(req, ctx);</div><div class='del'>-		index = array_index_nospec(buf_index, ctx-&gt;nr_user_bufs);</div><div class='del'>-		imu = READ_ONCE(ctx-&gt;user_bufs[index]);</div><div class='del'>-		req-&gt;imu = imu;</div><div class='del'>-	}</div><div class='del'>-	return __io_import_fixed(req, rw, iter, imu);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_ring_submit_unlock(struct io_ring_ctx *ctx, bool needs_lock)</div><div class='del'>-{</div><div class='del'>-	if (needs_lock)</div><div class='del'>-		mutex_unlock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_ring_submit_lock(struct io_ring_ctx *ctx, bool needs_lock)</div><div class='del'>-{</div><div class='del'>-	/*</div><div class='del'>-	 * "Normal" inline submissions always hold the uring_lock, since we</div><div class='del'>-	 * grab it from the system call. Same is true for the SQPOLL offload.</div><div class='del'>-	 * The only exception is when we've detached the request and issue it</div><div class='del'>-	 * from an async worker thread, grab the lock for that case.</div><div class='del'>-	 */</div><div class='del'>-	if (needs_lock)</div><div class='del'>-		mutex_lock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct io_buffer *io_buffer_select(struct io_kiocb *req, size_t *len,</div><div class='del'>-					  int bgid, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_buffer *kbuf = req-&gt;kbuf;</div><div class='del'>-	struct io_buffer *head;</div><div class='del'>-	bool needs_lock = issue_flags &amp; IO_URING_F_UNLOCKED;</div><div class='del'>-</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_BUFFER_SELECTED)</div><div class='del'>-		return kbuf;</div><div class='del'>-</div><div class='del'>-	io_ring_submit_lock(req-&gt;ctx, needs_lock);</div><div class='del'>-</div><div class='del'>-	lockdep_assert_held(&amp;req-&gt;ctx-&gt;uring_lock);</div><div class='del'>-</div><div class='del'>-	head = xa_load(&amp;req-&gt;ctx-&gt;io_buffers, bgid);</div><div class='del'>-	if (head) {</div><div class='del'>-		if (!list_empty(&amp;head-&gt;list)) {</div><div class='del'>-			kbuf = list_last_entry(&amp;head-&gt;list, struct io_buffer,</div><div class='del'>-							list);</div><div class='del'>-			list_del(&amp;kbuf-&gt;list);</div><div class='del'>-		} else {</div><div class='del'>-			kbuf = head;</div><div class='del'>-			xa_erase(&amp;req-&gt;ctx-&gt;io_buffers, bgid);</div><div class='del'>-		}</div><div class='del'>-		if (*len &gt; kbuf-&gt;len)</div><div class='del'>-			*len = kbuf-&gt;len;</div><div class='del'>-		req-&gt;flags |= REQ_F_BUFFER_SELECTED;</div><div class='del'>-		req-&gt;kbuf = kbuf;</div><div class='del'>-	} else {</div><div class='del'>-		kbuf = ERR_PTR(-ENOBUFS);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	io_ring_submit_unlock(req-&gt;ctx, needs_lock);</div><div class='del'>-	return kbuf;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void __user *io_rw_buffer_select(struct io_kiocb *req, size_t *len,</div><div class='del'>-					unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_buffer *kbuf;</div><div class='del'>-	u16 bgid;</div><div class='del'>-</div><div class='del'>-	bgid = req-&gt;buf_index;</div><div class='del'>-	kbuf = io_buffer_select(req, len, bgid, issue_flags);</div><div class='del'>-	if (IS_ERR(kbuf))</div><div class='del'>-		return kbuf;</div><div class='del'>-	return u64_to_user_ptr(kbuf-&gt;addr);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_COMPAT</div><div class='del'>-static ssize_t io_compat_import(struct io_kiocb *req, struct iovec *iov,</div><div class='del'>-				unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct compat_iovec __user *uiov;</div><div class='del'>-	compat_ssize_t clen;</div><div class='del'>-	void __user *buf;</div><div class='del'>-	ssize_t len;</div><div class='del'>-</div><div class='del'>-	uiov = u64_to_user_ptr(req-&gt;rw.addr);</div><div class='del'>-	if (!access_ok(uiov, sizeof(*uiov)))</div><div class='del'>-		return -EFAULT;</div><div class='del'>-	if (__get_user(clen, &amp;uiov-&gt;iov_len))</div><div class='del'>-		return -EFAULT;</div><div class='del'>-	if (clen &lt; 0)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	len = clen;</div><div class='del'>-	buf = io_rw_buffer_select(req, &amp;len, issue_flags);</div><div class='del'>-	if (IS_ERR(buf))</div><div class='del'>-		return PTR_ERR(buf);</div><div class='del'>-	iov[0].iov_base = buf;</div><div class='del'>-	iov[0].iov_len = (compat_size_t) len;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-static ssize_t __io_iov_buffer_select(struct io_kiocb *req, struct iovec *iov,</div><div class='del'>-				      unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct iovec __user *uiov = u64_to_user_ptr(req-&gt;rw.addr);</div><div class='del'>-	void __user *buf;</div><div class='del'>-	ssize_t len;</div><div class='del'>-</div><div class='del'>-	if (copy_from_user(iov, uiov, sizeof(*uiov)))</div><div class='del'>-		return -EFAULT;</div><div class='del'>-</div><div class='del'>-	len = iov[0].iov_len;</div><div class='del'>-	if (len &lt; 0)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	buf = io_rw_buffer_select(req, &amp;len, issue_flags);</div><div class='del'>-	if (IS_ERR(buf))</div><div class='del'>-		return PTR_ERR(buf);</div><div class='del'>-	iov[0].iov_base = buf;</div><div class='del'>-	iov[0].iov_len = len;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static ssize_t io_iov_buffer_select(struct io_kiocb *req, struct iovec *iov,</div><div class='del'>-				    unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_BUFFER_SELECTED) {</div><div class='del'>-		struct io_buffer *kbuf = req-&gt;kbuf;</div><div class='del'>-</div><div class='del'>-		iov[0].iov_base = u64_to_user_ptr(kbuf-&gt;addr);</div><div class='del'>-		iov[0].iov_len = kbuf-&gt;len;</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-	if (req-&gt;rw.len != 1)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_COMPAT</div><div class='del'>-	if (req-&gt;ctx-&gt;compat)</div><div class='del'>-		return io_compat_import(req, iov, issue_flags);</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-	return __io_iov_buffer_select(req, iov, issue_flags);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct iovec *__io_import_iovec(int rw, struct io_kiocb *req,</div><div class='del'>-				       struct io_rw_state *s,</div><div class='del'>-				       unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct iov_iter *iter = &amp;s-&gt;iter;</div><div class='del'>-	u8 opcode = req-&gt;opcode;</div><div class='del'>-	struct iovec *iovec;</div><div class='del'>-	void __user *buf;</div><div class='del'>-	size_t sqe_len;</div><div class='del'>-	ssize_t ret;</div><div class='del'>-</div><div class='del'>-	BUILD_BUG_ON(ERR_PTR(0) != NULL);</div><div class='del'>-</div><div class='del'>-	if (opcode == IORING_OP_READ_FIXED || opcode == IORING_OP_WRITE_FIXED)</div><div class='del'>-		return ERR_PTR(io_import_fixed(req, rw, iter));</div><div class='del'>-</div><div class='del'>-	/* buffer index only valid with fixed read/write, or buffer select  */</div><div class='del'>-	if (unlikely(req-&gt;buf_index &amp;&amp; !(req-&gt;flags &amp; REQ_F_BUFFER_SELECT)))</div><div class='del'>-		return ERR_PTR(-EINVAL);</div><div class='del'>-</div><div class='del'>-	buf = u64_to_user_ptr(req-&gt;rw.addr);</div><div class='del'>-	sqe_len = req-&gt;rw.len;</div><div class='del'>-</div><div class='del'>-	if (opcode == IORING_OP_READ || opcode == IORING_OP_WRITE) {</div><div class='del'>-		if (req-&gt;flags &amp; REQ_F_BUFFER_SELECT) {</div><div class='del'>-			buf = io_rw_buffer_select(req, &amp;sqe_len, issue_flags);</div><div class='del'>-			if (IS_ERR(buf))</div><div class='del'>-				return ERR_CAST(buf);</div><div class='del'>-			req-&gt;rw.len = sqe_len;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		ret = import_single_range(rw, buf, sqe_len, s-&gt;fast_iov, iter);</div><div class='del'>-		return ERR_PTR(ret);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	iovec = s-&gt;fast_iov;</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_BUFFER_SELECT) {</div><div class='del'>-		ret = io_iov_buffer_select(req, iovec, issue_flags);</div><div class='del'>-		if (!ret)</div><div class='del'>-			iov_iter_init(iter, rw, iovec, 1, iovec-&gt;iov_len);</div><div class='del'>-		return ERR_PTR(ret);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = __import_iovec(rw, buf, sqe_len, UIO_FASTIOV, &amp;iovec, iter,</div><div class='del'>-			      req-&gt;ctx-&gt;compat);</div><div class='del'>-	if (unlikely(ret &lt; 0))</div><div class='del'>-		return ERR_PTR(ret);</div><div class='del'>-	return iovec;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline int io_import_iovec(int rw, struct io_kiocb *req,</div><div class='del'>-				  struct iovec **iovec, struct io_rw_state *s,</div><div class='del'>-				  unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	*iovec = __io_import_iovec(rw, req, s, issue_flags);</div><div class='del'>-	if (unlikely(IS_ERR(*iovec)))</div><div class='del'>-		return PTR_ERR(*iovec);</div><div class='del'>-</div><div class='del'>-	iov_iter_save_state(&amp;s-&gt;iter, &amp;s-&gt;iter_state);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline loff_t *io_kiocb_ppos(struct kiocb *kiocb)</div><div class='del'>-{</div><div class='del'>-	return (kiocb-&gt;ki_filp-&gt;f_mode &amp; FMODE_STREAM) ? NULL : &amp;kiocb-&gt;ki_pos;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * For files that don't have -&gt;read_iter() and -&gt;write_iter(), handle them</div><div class='del'>- * by looping over -&gt;read() or -&gt;write() manually.</div><div class='del'>- */</div><div class='del'>-static ssize_t loop_rw_iter(int rw, struct io_kiocb *req, struct iov_iter *iter)</div><div class='del'>-{</div><div class='del'>-	struct kiocb *kiocb = &amp;req-&gt;rw.kiocb;</div><div class='del'>-	struct file *file = req-&gt;file;</div><div class='del'>-	ssize_t ret = 0;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Don't support polled IO through this interface, and we can't</div><div class='del'>-	 * support non-blocking either. For the latter, this just causes</div><div class='del'>-	 * the kiocb to be handled from an async context.</div><div class='del'>-	 */</div><div class='del'>-	if (kiocb-&gt;ki_flags &amp; IOCB_HIPRI)</div><div class='del'>-		return -EOPNOTSUPP;</div><div class='del'>-	if ((kiocb-&gt;ki_flags &amp; IOCB_NOWAIT) &amp;&amp;</div><div class='del'>-	    !(kiocb-&gt;ki_filp-&gt;f_flags &amp; O_NONBLOCK))</div><div class='del'>-		return -EAGAIN;</div><div class='del'>-</div><div class='del'>-	while (iov_iter_count(iter)) {</div><div class='del'>-		struct iovec iovec;</div><div class='del'>-		ssize_t nr;</div><div class='del'>-</div><div class='del'>-		if (!iov_iter_is_bvec(iter)) {</div><div class='del'>-			iovec = iov_iter_iovec(iter);</div><div class='del'>-		} else {</div><div class='del'>-			iovec.iov_base = u64_to_user_ptr(req-&gt;rw.addr);</div><div class='del'>-			iovec.iov_len = req-&gt;rw.len;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (rw == READ) {</div><div class='del'>-			nr = file-&gt;f_op-&gt;read(file, iovec.iov_base,</div><div class='del'>-					      iovec.iov_len, io_kiocb_ppos(kiocb));</div><div class='del'>-		} else {</div><div class='del'>-			nr = file-&gt;f_op-&gt;write(file, iovec.iov_base,</div><div class='del'>-					       iovec.iov_len, io_kiocb_ppos(kiocb));</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (nr &lt; 0) {</div><div class='del'>-			if (!ret)</div><div class='del'>-				ret = nr;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		if (!iov_iter_is_bvec(iter)) {</div><div class='del'>-			iov_iter_advance(iter, nr);</div><div class='del'>-		} else {</div><div class='del'>-			req-&gt;rw.len -= nr;</div><div class='del'>-			req-&gt;rw.addr += nr;</div><div class='del'>-		}</div><div class='del'>-		ret += nr;</div><div class='del'>-		if (nr != iovec.iov_len)</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_req_map_rw(struct io_kiocb *req, const struct iovec *iovec,</div><div class='del'>-			  const struct iovec *fast_iov, struct iov_iter *iter)</div><div class='del'>-{</div><div class='del'>-	struct io_async_rw *rw = req-&gt;async_data;</div><div class='del'>-</div><div class='del'>-	memcpy(&amp;rw-&gt;s.iter, iter, sizeof(*iter));</div><div class='del'>-	rw-&gt;free_iovec = iovec;</div><div class='del'>-	rw-&gt;bytes_done = 0;</div><div class='del'>-	/* can only be fixed buffers, no need to do anything */</div><div class='del'>-	if (iov_iter_is_bvec(iter))</div><div class='del'>-		return;</div><div class='del'>-	if (!iovec) {</div><div class='del'>-		unsigned iov_off = 0;</div><div class='del'>-</div><div class='del'>-		rw-&gt;s.iter.iov = rw-&gt;s.fast_iov;</div><div class='del'>-		if (iter-&gt;iov != fast_iov) {</div><div class='del'>-			iov_off = iter-&gt;iov - fast_iov;</div><div class='del'>-			rw-&gt;s.iter.iov += iov_off;</div><div class='del'>-		}</div><div class='del'>-		if (rw-&gt;s.fast_iov != fast_iov)</div><div class='del'>-			memcpy(rw-&gt;s.fast_iov + iov_off, fast_iov + iov_off,</div><div class='del'>-			       sizeof(struct iovec) * iter-&gt;nr_segs);</div><div class='del'>-	} else {</div><div class='del'>-		req-&gt;flags |= REQ_F_NEED_CLEANUP;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline bool io_alloc_async_data(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	WARN_ON_ONCE(!io_op_defs[req-&gt;opcode].async_size);</div><div class='del'>-	req-&gt;async_data = kmalloc(io_op_defs[req-&gt;opcode].async_size, GFP_KERNEL);</div><div class='del'>-	if (req-&gt;async_data) {</div><div class='del'>-		req-&gt;flags |= REQ_F_ASYNC_DATA;</div><div class='del'>-		return false;</div><div class='del'>-	}</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_setup_async_rw(struct io_kiocb *req, const struct iovec *iovec,</div><div class='del'>-			     struct io_rw_state *s, bool force)</div><div class='del'>-{</div><div class='del'>-	if (!force &amp;&amp; !io_op_defs[req-&gt;opcode].needs_async_setup)</div><div class='del'>-		return 0;</div><div class='del'>-	if (!req_has_async_data(req)) {</div><div class='del'>-		struct io_async_rw *iorw;</div><div class='del'>-</div><div class='del'>-		if (io_alloc_async_data(req)) {</div><div class='del'>-			kfree(iovec);</div><div class='del'>-			return -ENOMEM;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		io_req_map_rw(req, iovec, s-&gt;fast_iov, &amp;s-&gt;iter);</div><div class='del'>-		iorw = req-&gt;async_data;</div><div class='del'>-		/* we've copied and mapped the iter, ensure state is saved */</div><div class='del'>-		iov_iter_save_state(&amp;iorw-&gt;s.iter, &amp;iorw-&gt;s.iter_state);</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline int io_rw_prep_async(struct io_kiocb *req, int rw)</div><div class='del'>-{</div><div class='del'>-	struct io_async_rw *iorw = req-&gt;async_data;</div><div class='del'>-	struct iovec *iov;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	/* submission path, -&gt;uring_lock should already be taken */</div><div class='del'>-	ret = io_import_iovec(rw, req, &amp;iov, &amp;iorw-&gt;s, 0);</div><div class='del'>-	if (unlikely(ret &lt; 0))</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	iorw-&gt;bytes_done = 0;</div><div class='del'>-	iorw-&gt;free_iovec = iov;</div><div class='del'>-	if (iov)</div><div class='del'>-		req-&gt;flags |= REQ_F_NEED_CLEANUP;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_read_prep(struct io_kiocb *req, const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	if (unlikely(!(req-&gt;file-&gt;f_mode &amp; FMODE_READ)))</div><div class='del'>-		return -EBADF;</div><div class='del'>-	return io_prep_rw(req, sqe);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * This is our waitqueue callback handler, registered through __folio_lock_async()</div><div class='del'>- * when we initially tried to do the IO with the iocb armed our waitqueue.</div><div class='del'>- * This gets called when the page is unlocked, and we generally expect that to</div><div class='del'>- * happen when the page IO is completed and the page is now uptodate. This will</div><div class='del'>- * queue a task_work based retry of the operation, attempting to copy the data</div><div class='del'>- * again. If the latter fails because the page was NOT uptodate, then we will</div><div class='del'>- * do a thread based blocking retry of the operation. That's the unexpected</div><div class='del'>- * slow path.</div><div class='del'>- */</div><div class='del'>-static int io_async_buf_func(struct wait_queue_entry *wait, unsigned mode,</div><div class='del'>-			     int sync, void *arg)</div><div class='del'>-{</div><div class='del'>-	struct wait_page_queue *wpq;</div><div class='del'>-	struct io_kiocb *req = wait-&gt;private;</div><div class='del'>-	struct wait_page_key *key = arg;</div><div class='del'>-</div><div class='del'>-	wpq = container_of(wait, struct wait_page_queue, wait);</div><div class='del'>-</div><div class='del'>-	if (!wake_page_match(wpq, key))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	req-&gt;rw.kiocb.ki_flags &amp;= ~IOCB_WAITQ;</div><div class='del'>-	list_del_init(&amp;wait-&gt;entry);</div><div class='del'>-	io_req_task_queue(req);</div><div class='del'>-	return 1;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * This controls whether a given IO request should be armed for async page</div><div class='del'>- * based retry. If we return false here, the request is handed to the async</div><div class='del'>- * worker threads for retry. If we're doing buffered reads on a regular file,</div><div class='del'>- * we prepare a private wait_page_queue entry and retry the operation. This</div><div class='del'>- * will either succeed because the page is now uptodate and unlocked, or it</div><div class='del'>- * will register a callback when the page is unlocked at IO completion. Through</div><div class='del'>- * that callback, io_uring uses task_work to setup a retry of the operation.</div><div class='del'>- * That retry will attempt the buffered read again. The retry will generally</div><div class='del'>- * succeed, or in rare cases where it fails, we then fall back to using the</div><div class='del'>- * async worker threads for a blocking retry.</div><div class='del'>- */</div><div class='del'>-static bool io_rw_should_retry(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	struct io_async_rw *rw = req-&gt;async_data;</div><div class='del'>-	struct wait_page_queue *wait = &amp;rw-&gt;wpq;</div><div class='del'>-	struct kiocb *kiocb = &amp;req-&gt;rw.kiocb;</div><div class='del'>-</div><div class='del'>-	/* never retry for NOWAIT, we just complete with -EAGAIN */</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_NOWAIT)</div><div class='del'>-		return false;</div><div class='del'>-</div><div class='del'>-	/* Only for buffered IO */</div><div class='del'>-	if (kiocb-&gt;ki_flags &amp; (IOCB_DIRECT | IOCB_HIPRI))</div><div class='del'>-		return false;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * just use poll if we can, and don't attempt if the fs doesn't</div><div class='del'>-	 * support callback based unlocks</div><div class='del'>-	 */</div><div class='del'>-	if (file_can_poll(req-&gt;file) || !(req-&gt;file-&gt;f_mode &amp; FMODE_BUF_RASYNC))</div><div class='del'>-		return false;</div><div class='del'>-</div><div class='del'>-	wait-&gt;wait.func = io_async_buf_func;</div><div class='del'>-	wait-&gt;wait.private = req;</div><div class='del'>-	wait-&gt;wait.flags = 0;</div><div class='del'>-	INIT_LIST_HEAD(&amp;wait-&gt;wait.entry);</div><div class='del'>-	kiocb-&gt;ki_flags |= IOCB_WAITQ;</div><div class='del'>-	kiocb-&gt;ki_flags &amp;= ~IOCB_NOWAIT;</div><div class='del'>-	kiocb-&gt;ki_waitq = wait;</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline int io_iter_do_read(struct io_kiocb *req, struct iov_iter *iter)</div><div class='del'>-{</div><div class='del'>-	if (likely(req-&gt;file-&gt;f_op-&gt;read_iter))</div><div class='del'>-		return call_read_iter(req-&gt;file, &amp;req-&gt;rw.kiocb, iter);</div><div class='del'>-	else if (req-&gt;file-&gt;f_op-&gt;read)</div><div class='del'>-		return loop_rw_iter(READ, req, iter);</div><div class='del'>-	else</div><div class='del'>-		return -EINVAL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool need_read_all(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	return req-&gt;flags &amp; REQ_F_ISREG ||</div><div class='del'>-		S_ISBLK(file_inode(req-&gt;file)-&gt;i_mode);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_read(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_rw_state __s, *s = &amp;__s;</div><div class='del'>-	struct iovec *iovec;</div><div class='del'>-	struct kiocb *kiocb = &amp;req-&gt;rw.kiocb;</div><div class='del'>-	bool force_nonblock = issue_flags &amp; IO_URING_F_NONBLOCK;</div><div class='del'>-	struct io_async_rw *rw;</div><div class='del'>-	ssize_t ret, ret2;</div><div class='del'>-</div><div class='del'>-	if (!req_has_async_data(req)) {</div><div class='del'>-		ret = io_import_iovec(READ, req, &amp;iovec, s, issue_flags);</div><div class='del'>-		if (unlikely(ret &lt; 0))</div><div class='del'>-			return ret;</div><div class='del'>-	} else {</div><div class='del'>-		rw = req-&gt;async_data;</div><div class='del'>-		s = &amp;rw-&gt;s;</div><div class='del'>-		/*</div><div class='del'>-		 * We come here from an earlier attempt, restore our state to</div><div class='del'>-		 * match in case it doesn't. It's cheap enough that we don't</div><div class='del'>-		 * need to make this conditional.</div><div class='del'>-		 */</div><div class='del'>-		iov_iter_restore(&amp;s-&gt;iter, &amp;s-&gt;iter_state);</div><div class='del'>-		iovec = NULL;</div><div class='del'>-	}</div><div class='del'>-	req-&gt;result = iov_iter_count(&amp;s-&gt;iter);</div><div class='del'>-</div><div class='del'>-	if (force_nonblock) {</div><div class='del'>-		/* If the file doesn't support async, just async punt */</div><div class='del'>-		if (unlikely(!io_file_supports_nowait(req))) {</div><div class='del'>-			ret = io_setup_async_rw(req, iovec, s, true);</div><div class='del'>-			return ret ?: -EAGAIN;</div><div class='del'>-		}</div><div class='del'>-		kiocb-&gt;ki_flags |= IOCB_NOWAIT;</div><div class='del'>-	} else {</div><div class='del'>-		/* Ensure we clear previously set non-block flag */</div><div class='del'>-		kiocb-&gt;ki_flags &amp;= ~IOCB_NOWAIT;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = rw_verify_area(READ, req-&gt;file, io_kiocb_ppos(kiocb), req-&gt;result);</div><div class='del'>-	if (unlikely(ret)) {</div><div class='del'>-		kfree(iovec);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = io_iter_do_read(req, &amp;s-&gt;iter);</div><div class='del'>-</div><div class='del'>-	if (ret == -EAGAIN || (req-&gt;flags &amp; REQ_F_REISSUE)) {</div><div class='del'>-		req-&gt;flags &amp;= ~REQ_F_REISSUE;</div><div class='del'>-		/* IOPOLL retry should happen for io-wq threads */</div><div class='del'>-		if (!force_nonblock &amp;&amp; !(req-&gt;ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-			goto done;</div><div class='del'>-		/* no retry on NONBLOCK nor RWF_NOWAIT */</div><div class='del'>-		if (req-&gt;flags &amp; REQ_F_NOWAIT)</div><div class='del'>-			goto done;</div><div class='del'>-		ret = 0;</div><div class='del'>-	} else if (ret == -EIOCBQUEUED) {</div><div class='del'>-		goto out_free;</div><div class='del'>-	} else if (ret == req-&gt;result || ret &lt;= 0 || !force_nonblock ||</div><div class='del'>-		   (req-&gt;flags &amp; REQ_F_NOWAIT) || !need_read_all(req)) {</div><div class='del'>-		/* read all, failed, already did sync or don't want to retry */</div><div class='del'>-		goto done;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Don't depend on the iter state matching what was consumed, or being</div><div class='del'>-	 * untouched in case of error. Restore it and we'll advance it</div><div class='del'>-	 * manually if we need to.</div><div class='del'>-	 */</div><div class='del'>-	iov_iter_restore(&amp;s-&gt;iter, &amp;s-&gt;iter_state);</div><div class='del'>-</div><div class='del'>-	ret2 = io_setup_async_rw(req, iovec, s, true);</div><div class='del'>-	if (ret2)</div><div class='del'>-		return ret2;</div><div class='del'>-</div><div class='del'>-	iovec = NULL;</div><div class='del'>-	rw = req-&gt;async_data;</div><div class='del'>-	s = &amp;rw-&gt;s;</div><div class='del'>-	/*</div><div class='del'>-	 * Now use our persistent iterator and state, if we aren't already.</div><div class='del'>-	 * We've restored and mapped the iter to match.</div><div class='del'>-	 */</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		/*</div><div class='del'>-		 * We end up here because of a partial read, either from</div><div class='del'>-		 * above or inside this loop. Advance the iter by the bytes</div><div class='del'>-		 * that were consumed.</div><div class='del'>-		 */</div><div class='del'>-		iov_iter_advance(&amp;s-&gt;iter, ret);</div><div class='del'>-		if (!iov_iter_count(&amp;s-&gt;iter))</div><div class='del'>-			break;</div><div class='del'>-		rw-&gt;bytes_done += ret;</div><div class='del'>-		iov_iter_save_state(&amp;s-&gt;iter, &amp;s-&gt;iter_state);</div><div class='del'>-</div><div class='del'>-		/* if we can retry, do so with the callbacks armed */</div><div class='del'>-		if (!io_rw_should_retry(req)) {</div><div class='del'>-			kiocb-&gt;ki_flags &amp;= ~IOCB_WAITQ;</div><div class='del'>-			return -EAGAIN;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Now retry read with the IOCB_WAITQ parts set in the iocb. If</div><div class='del'>-		 * we get -EIOCBQUEUED, then we'll get a notification when the</div><div class='del'>-		 * desired page gets unlocked. We can also get a partial read</div><div class='del'>-		 * here, and if we do, then just retry at the new offset.</div><div class='del'>-		 */</div><div class='del'>-		ret = io_iter_do_read(req, &amp;s-&gt;iter);</div><div class='del'>-		if (ret == -EIOCBQUEUED)</div><div class='del'>-			return 0;</div><div class='del'>-		/* we got some bytes, but not all. retry. */</div><div class='del'>-		kiocb-&gt;ki_flags &amp;= ~IOCB_WAITQ;</div><div class='del'>-		iov_iter_restore(&amp;s-&gt;iter, &amp;s-&gt;iter_state);</div><div class='del'>-	} while (ret &gt; 0);</div><div class='del'>-done:</div><div class='del'>-	kiocb_done(kiocb, ret, issue_flags);</div><div class='del'>-out_free:</div><div class='del'>-	/* it's faster to check here then delegate to kfree */</div><div class='del'>-	if (iovec)</div><div class='del'>-		kfree(iovec);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_write_prep(struct io_kiocb *req, const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	if (unlikely(!(req-&gt;file-&gt;f_mode &amp; FMODE_WRITE)))</div><div class='del'>-		return -EBADF;</div><div class='del'>-	req-&gt;rw.kiocb.ki_hint = ki_hint_validate(file_write_hint(req-&gt;file));</div><div class='del'>-	return io_prep_rw(req, sqe);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_write(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_rw_state __s, *s = &amp;__s;</div><div class='del'>-	struct iovec *iovec;</div><div class='del'>-	struct kiocb *kiocb = &amp;req-&gt;rw.kiocb;</div><div class='del'>-	bool force_nonblock = issue_flags &amp; IO_URING_F_NONBLOCK;</div><div class='del'>-	ssize_t ret, ret2;</div><div class='del'>-</div><div class='del'>-	if (!req_has_async_data(req)) {</div><div class='del'>-		ret = io_import_iovec(WRITE, req, &amp;iovec, s, issue_flags);</div><div class='del'>-		if (unlikely(ret &lt; 0))</div><div class='del'>-			return ret;</div><div class='del'>-	} else {</div><div class='del'>-		struct io_async_rw *rw = req-&gt;async_data;</div><div class='del'>-</div><div class='del'>-		s = &amp;rw-&gt;s;</div><div class='del'>-		iov_iter_restore(&amp;s-&gt;iter, &amp;s-&gt;iter_state);</div><div class='del'>-		iovec = NULL;</div><div class='del'>-	}</div><div class='del'>-	req-&gt;result = iov_iter_count(&amp;s-&gt;iter);</div><div class='del'>-</div><div class='del'>-	if (force_nonblock) {</div><div class='del'>-		/* If the file doesn't support async, just async punt */</div><div class='del'>-		if (unlikely(!io_file_supports_nowait(req)))</div><div class='del'>-			goto copy_iov;</div><div class='del'>-</div><div class='del'>-		/* file path doesn't support NOWAIT for non-direct_IO */</div><div class='del'>-		if (force_nonblock &amp;&amp; !(kiocb-&gt;ki_flags &amp; IOCB_DIRECT) &amp;&amp;</div><div class='del'>-		    (req-&gt;flags &amp; REQ_F_ISREG))</div><div class='del'>-			goto copy_iov;</div><div class='del'>-</div><div class='del'>-		kiocb-&gt;ki_flags |= IOCB_NOWAIT;</div><div class='del'>-	} else {</div><div class='del'>-		/* Ensure we clear previously set non-block flag */</div><div class='del'>-		kiocb-&gt;ki_flags &amp;= ~IOCB_NOWAIT;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = rw_verify_area(WRITE, req-&gt;file, io_kiocb_ppos(kiocb), req-&gt;result);</div><div class='del'>-	if (unlikely(ret))</div><div class='del'>-		goto out_free;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Open-code file_start_write here to grab freeze protection,</div><div class='del'>-	 * which will be released by another thread in</div><div class='del'>-	 * io_complete_rw().  Fool lockdep by telling it the lock got</div><div class='del'>-	 * released so that it doesn't complain about the held lock when</div><div class='del'>-	 * we return to userspace.</div><div class='del'>-	 */</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_ISREG) {</div><div class='del'>-		sb_start_write(file_inode(req-&gt;file)-&gt;i_sb);</div><div class='del'>-		__sb_writers_release(file_inode(req-&gt;file)-&gt;i_sb,</div><div class='del'>-					SB_FREEZE_WRITE);</div><div class='del'>-	}</div><div class='del'>-	kiocb-&gt;ki_flags |= IOCB_WRITE;</div><div class='del'>-</div><div class='del'>-	if (likely(req-&gt;file-&gt;f_op-&gt;write_iter))</div><div class='del'>-		ret2 = call_write_iter(req-&gt;file, kiocb, &amp;s-&gt;iter);</div><div class='del'>-	else if (req-&gt;file-&gt;f_op-&gt;write)</div><div class='del'>-		ret2 = loop_rw_iter(WRITE, req, &amp;s-&gt;iter);</div><div class='del'>-	else</div><div class='del'>-		ret2 = -EINVAL;</div><div class='del'>-</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_REISSUE) {</div><div class='del'>-		req-&gt;flags &amp;= ~REQ_F_REISSUE;</div><div class='del'>-		ret2 = -EAGAIN;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Raw bdev writes will return -EOPNOTSUPP for IOCB_NOWAIT. Just</div><div class='del'>-	 * retry them without IOCB_NOWAIT.</div><div class='del'>-	 */</div><div class='del'>-	if (ret2 == -EOPNOTSUPP &amp;&amp; (kiocb-&gt;ki_flags &amp; IOCB_NOWAIT))</div><div class='del'>-		ret2 = -EAGAIN;</div><div class='del'>-	/* no retry on NONBLOCK nor RWF_NOWAIT */</div><div class='del'>-	if (ret2 == -EAGAIN &amp;&amp; (req-&gt;flags &amp; REQ_F_NOWAIT))</div><div class='del'>-		goto done;</div><div class='del'>-	if (!force_nonblock || ret2 != -EAGAIN) {</div><div class='del'>-		/* IOPOLL retry should happen for io-wq threads */</div><div class='del'>-		if (ret2 == -EAGAIN &amp;&amp; (req-&gt;ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-			goto copy_iov;</div><div class='del'>-done:</div><div class='del'>-		kiocb_done(kiocb, ret2, issue_flags);</div><div class='del'>-	} else {</div><div class='del'>-copy_iov:</div><div class='del'>-		iov_iter_restore(&amp;s-&gt;iter, &amp;s-&gt;iter_state);</div><div class='del'>-		ret = io_setup_async_rw(req, iovec, s, false);</div><div class='del'>-		return ret ?: -EAGAIN;</div><div class='del'>-	}</div><div class='del'>-out_free:</div><div class='del'>-	/* it's reportedly faster than delegating the null check to kfree() */</div><div class='del'>-	if (iovec)</div><div class='del'>-		kfree(iovec);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_renameat_prep(struct io_kiocb *req,</div><div class='del'>-			    const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	struct io_rename *ren = &amp;req-&gt;rename;</div><div class='del'>-	const char __user *oldf, *newf;</div><div class='del'>-</div><div class='del'>-	if (unlikely(req-&gt;ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (sqe-&gt;ioprio || sqe-&gt;buf_index || sqe-&gt;splice_fd_in)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (unlikely(req-&gt;flags &amp; REQ_F_FIXED_FILE))</div><div class='del'>-		return -EBADF;</div><div class='del'>-</div><div class='del'>-	ren-&gt;old_dfd = READ_ONCE(sqe-&gt;fd);</div><div class='del'>-	oldf = u64_to_user_ptr(READ_ONCE(sqe-&gt;addr));</div><div class='del'>-	newf = u64_to_user_ptr(READ_ONCE(sqe-&gt;addr2));</div><div class='del'>-	ren-&gt;new_dfd = READ_ONCE(sqe-&gt;len);</div><div class='del'>-	ren-&gt;flags = READ_ONCE(sqe-&gt;rename_flags);</div><div class='del'>-</div><div class='del'>-	ren-&gt;oldpath = getname(oldf);</div><div class='del'>-	if (IS_ERR(ren-&gt;oldpath))</div><div class='del'>-		return PTR_ERR(ren-&gt;oldpath);</div><div class='del'>-</div><div class='del'>-	ren-&gt;newpath = getname(newf);</div><div class='del'>-	if (IS_ERR(ren-&gt;newpath)) {</div><div class='del'>-		putname(ren-&gt;oldpath);</div><div class='del'>-		return PTR_ERR(ren-&gt;newpath);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	req-&gt;flags |= REQ_F_NEED_CLEANUP;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_renameat(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_rename *ren = &amp;req-&gt;rename;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (issue_flags &amp; IO_URING_F_NONBLOCK)</div><div class='del'>-		return -EAGAIN;</div><div class='del'>-</div><div class='del'>-	ret = do_renameat2(ren-&gt;old_dfd, ren-&gt;oldpath, ren-&gt;new_dfd,</div><div class='del'>-				ren-&gt;newpath, ren-&gt;flags);</div><div class='del'>-</div><div class='del'>-	req-&gt;flags &amp;= ~REQ_F_NEED_CLEANUP;</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-	io_req_complete(req, ret);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_unlinkat_prep(struct io_kiocb *req,</div><div class='del'>-			    const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	struct io_unlink *un = &amp;req-&gt;unlink;</div><div class='del'>-	const char __user *fname;</div><div class='del'>-</div><div class='del'>-	if (unlikely(req-&gt;ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (sqe-&gt;ioprio || sqe-&gt;off || sqe-&gt;len || sqe-&gt;buf_index ||</div><div class='del'>-	    sqe-&gt;splice_fd_in)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (unlikely(req-&gt;flags &amp; REQ_F_FIXED_FILE))</div><div class='del'>-		return -EBADF;</div><div class='del'>-</div><div class='del'>-	un-&gt;dfd = READ_ONCE(sqe-&gt;fd);</div><div class='del'>-</div><div class='del'>-	un-&gt;flags = READ_ONCE(sqe-&gt;unlink_flags);</div><div class='del'>-	if (un-&gt;flags &amp; ~AT_REMOVEDIR)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	fname = u64_to_user_ptr(READ_ONCE(sqe-&gt;addr));</div><div class='del'>-	un-&gt;filename = getname(fname);</div><div class='del'>-	if (IS_ERR(un-&gt;filename))</div><div class='del'>-		return PTR_ERR(un-&gt;filename);</div><div class='del'>-</div><div class='del'>-	req-&gt;flags |= REQ_F_NEED_CLEANUP;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_unlinkat(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_unlink *un = &amp;req-&gt;unlink;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (issue_flags &amp; IO_URING_F_NONBLOCK)</div><div class='del'>-		return -EAGAIN;</div><div class='del'>-</div><div class='del'>-	if (un-&gt;flags &amp; AT_REMOVEDIR)</div><div class='del'>-		ret = do_rmdir(un-&gt;dfd, un-&gt;filename);</div><div class='del'>-	else</div><div class='del'>-		ret = do_unlinkat(un-&gt;dfd, un-&gt;filename);</div><div class='del'>-</div><div class='del'>-	req-&gt;flags &amp;= ~REQ_F_NEED_CLEANUP;</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-	io_req_complete(req, ret);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_mkdirat_prep(struct io_kiocb *req,</div><div class='del'>-			    const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	struct io_mkdir *mkd = &amp;req-&gt;mkdir;</div><div class='del'>-	const char __user *fname;</div><div class='del'>-</div><div class='del'>-	if (unlikely(req-&gt;ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (sqe-&gt;ioprio || sqe-&gt;off || sqe-&gt;rw_flags || sqe-&gt;buf_index ||</div><div class='del'>-	    sqe-&gt;splice_fd_in)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (unlikely(req-&gt;flags &amp; REQ_F_FIXED_FILE))</div><div class='del'>-		return -EBADF;</div><div class='del'>-</div><div class='del'>-	mkd-&gt;dfd = READ_ONCE(sqe-&gt;fd);</div><div class='del'>-	mkd-&gt;mode = READ_ONCE(sqe-&gt;len);</div><div class='del'>-</div><div class='del'>-	fname = u64_to_user_ptr(READ_ONCE(sqe-&gt;addr));</div><div class='del'>-	mkd-&gt;filename = getname(fname);</div><div class='del'>-	if (IS_ERR(mkd-&gt;filename))</div><div class='del'>-		return PTR_ERR(mkd-&gt;filename);</div><div class='del'>-</div><div class='del'>-	req-&gt;flags |= REQ_F_NEED_CLEANUP;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_mkdirat(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_mkdir *mkd = &amp;req-&gt;mkdir;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (issue_flags &amp; IO_URING_F_NONBLOCK)</div><div class='del'>-		return -EAGAIN;</div><div class='del'>-</div><div class='del'>-	ret = do_mkdirat(mkd-&gt;dfd, mkd-&gt;filename, mkd-&gt;mode);</div><div class='del'>-</div><div class='del'>-	req-&gt;flags &amp;= ~REQ_F_NEED_CLEANUP;</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-	io_req_complete(req, ret);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_symlinkat_prep(struct io_kiocb *req,</div><div class='del'>-			    const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	struct io_symlink *sl = &amp;req-&gt;symlink;</div><div class='del'>-	const char __user *oldpath, *newpath;</div><div class='del'>-</div><div class='del'>-	if (unlikely(req-&gt;ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (sqe-&gt;ioprio || sqe-&gt;len || sqe-&gt;rw_flags || sqe-&gt;buf_index ||</div><div class='del'>-	    sqe-&gt;splice_fd_in)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (unlikely(req-&gt;flags &amp; REQ_F_FIXED_FILE))</div><div class='del'>-		return -EBADF;</div><div class='del'>-</div><div class='del'>-	sl-&gt;new_dfd = READ_ONCE(sqe-&gt;fd);</div><div class='del'>-	oldpath = u64_to_user_ptr(READ_ONCE(sqe-&gt;addr));</div><div class='del'>-	newpath = u64_to_user_ptr(READ_ONCE(sqe-&gt;addr2));</div><div class='del'>-</div><div class='del'>-	sl-&gt;oldpath = getname(oldpath);</div><div class='del'>-	if (IS_ERR(sl-&gt;oldpath))</div><div class='del'>-		return PTR_ERR(sl-&gt;oldpath);</div><div class='del'>-</div><div class='del'>-	sl-&gt;newpath = getname(newpath);</div><div class='del'>-	if (IS_ERR(sl-&gt;newpath)) {</div><div class='del'>-		putname(sl-&gt;oldpath);</div><div class='del'>-		return PTR_ERR(sl-&gt;newpath);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	req-&gt;flags |= REQ_F_NEED_CLEANUP;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_symlinkat(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_symlink *sl = &amp;req-&gt;symlink;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (issue_flags &amp; IO_URING_F_NONBLOCK)</div><div class='del'>-		return -EAGAIN;</div><div class='del'>-</div><div class='del'>-	ret = do_symlinkat(sl-&gt;oldpath, sl-&gt;new_dfd, sl-&gt;newpath);</div><div class='del'>-</div><div class='del'>-	req-&gt;flags &amp;= ~REQ_F_NEED_CLEANUP;</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-	io_req_complete(req, ret);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_linkat_prep(struct io_kiocb *req,</div><div class='del'>-			    const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	struct io_hardlink *lnk = &amp;req-&gt;hardlink;</div><div class='del'>-	const char __user *oldf, *newf;</div><div class='del'>-</div><div class='del'>-	if (unlikely(req-&gt;ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (sqe-&gt;ioprio || sqe-&gt;rw_flags || sqe-&gt;buf_index || sqe-&gt;splice_fd_in)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (unlikely(req-&gt;flags &amp; REQ_F_FIXED_FILE))</div><div class='del'>-		return -EBADF;</div><div class='del'>-</div><div class='del'>-	lnk-&gt;old_dfd = READ_ONCE(sqe-&gt;fd);</div><div class='del'>-	lnk-&gt;new_dfd = READ_ONCE(sqe-&gt;len);</div><div class='del'>-	oldf = u64_to_user_ptr(READ_ONCE(sqe-&gt;addr));</div><div class='del'>-	newf = u64_to_user_ptr(READ_ONCE(sqe-&gt;addr2));</div><div class='del'>-	lnk-&gt;flags = READ_ONCE(sqe-&gt;hardlink_flags);</div><div class='del'>-</div><div class='del'>-	lnk-&gt;oldpath = getname(oldf);</div><div class='del'>-	if (IS_ERR(lnk-&gt;oldpath))</div><div class='del'>-		return PTR_ERR(lnk-&gt;oldpath);</div><div class='del'>-</div><div class='del'>-	lnk-&gt;newpath = getname(newf);</div><div class='del'>-	if (IS_ERR(lnk-&gt;newpath)) {</div><div class='del'>-		putname(lnk-&gt;oldpath);</div><div class='del'>-		return PTR_ERR(lnk-&gt;newpath);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	req-&gt;flags |= REQ_F_NEED_CLEANUP;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_linkat(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_hardlink *lnk = &amp;req-&gt;hardlink;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (issue_flags &amp; IO_URING_F_NONBLOCK)</div><div class='del'>-		return -EAGAIN;</div><div class='del'>-</div><div class='del'>-	ret = do_linkat(lnk-&gt;old_dfd, lnk-&gt;oldpath, lnk-&gt;new_dfd,</div><div class='del'>-				lnk-&gt;newpath, lnk-&gt;flags);</div><div class='del'>-</div><div class='del'>-	req-&gt;flags &amp;= ~REQ_F_NEED_CLEANUP;</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-	io_req_complete(req, ret);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_shutdown_prep(struct io_kiocb *req,</div><div class='del'>-			    const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-#if defined(CONFIG_NET)</div><div class='del'>-	if (unlikely(req-&gt;ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (unlikely(sqe-&gt;ioprio || sqe-&gt;off || sqe-&gt;addr || sqe-&gt;rw_flags ||</div><div class='del'>-		     sqe-&gt;buf_index || sqe-&gt;splice_fd_in))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	req-&gt;shutdown.how = READ_ONCE(sqe-&gt;len);</div><div class='del'>-	return 0;</div><div class='del'>-#else</div><div class='del'>-	return -EOPNOTSUPP;</div><div class='del'>-#endif</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_shutdown(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-#if defined(CONFIG_NET)</div><div class='del'>-	struct socket *sock;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (issue_flags &amp; IO_URING_F_NONBLOCK)</div><div class='del'>-		return -EAGAIN;</div><div class='del'>-</div><div class='del'>-	sock = sock_from_file(req-&gt;file);</div><div class='del'>-	if (unlikely(!sock))</div><div class='del'>-		return -ENOTSOCK;</div><div class='del'>-</div><div class='del'>-	ret = __sys_shutdown_sock(sock, req-&gt;shutdown.how);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-	io_req_complete(req, ret);</div><div class='del'>-	return 0;</div><div class='del'>-#else</div><div class='del'>-	return -EOPNOTSUPP;</div><div class='del'>-#endif</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int __io_splice_prep(struct io_kiocb *req,</div><div class='del'>-			    const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	struct io_splice *sp = &amp;req-&gt;splice;</div><div class='del'>-	unsigned int valid_flags = SPLICE_F_FD_IN_FIXED | SPLICE_F_ALL;</div><div class='del'>-</div><div class='del'>-	if (unlikely(req-&gt;ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	sp-&gt;file_in = NULL;</div><div class='del'>-	sp-&gt;len = READ_ONCE(sqe-&gt;len);</div><div class='del'>-	sp-&gt;flags = READ_ONCE(sqe-&gt;splice_flags);</div><div class='del'>-</div><div class='del'>-	if (unlikely(sp-&gt;flags &amp; ~valid_flags))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	sp-&gt;file_in = io_file_get(req-&gt;ctx, req, READ_ONCE(sqe-&gt;splice_fd_in),</div><div class='del'>-				  (sp-&gt;flags &amp; SPLICE_F_FD_IN_FIXED));</div><div class='del'>-	if (!sp-&gt;file_in)</div><div class='del'>-		return -EBADF;</div><div class='del'>-	req-&gt;flags |= REQ_F_NEED_CLEANUP;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_tee_prep(struct io_kiocb *req,</div><div class='del'>-		       const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	if (READ_ONCE(sqe-&gt;splice_off_in) || READ_ONCE(sqe-&gt;off))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	return __io_splice_prep(req, sqe);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_tee(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_splice *sp = &amp;req-&gt;splice;</div><div class='del'>-	struct file *in = sp-&gt;file_in;</div><div class='del'>-	struct file *out = sp-&gt;file_out;</div><div class='del'>-	unsigned int flags = sp-&gt;flags &amp; ~SPLICE_F_FD_IN_FIXED;</div><div class='del'>-	long ret = 0;</div><div class='del'>-</div><div class='del'>-	if (issue_flags &amp; IO_URING_F_NONBLOCK)</div><div class='del'>-		return -EAGAIN;</div><div class='del'>-	if (sp-&gt;len)</div><div class='del'>-		ret = do_tee(in, out, sp-&gt;len, flags);</div><div class='del'>-</div><div class='del'>-	if (!(sp-&gt;flags &amp; SPLICE_F_FD_IN_FIXED))</div><div class='del'>-		io_put_file(in);</div><div class='del'>-	req-&gt;flags &amp;= ~REQ_F_NEED_CLEANUP;</div><div class='del'>-</div><div class='del'>-	if (ret != sp-&gt;len)</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-	io_req_complete(req, ret);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_splice_prep(struct io_kiocb *req, const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	struct io_splice *sp = &amp;req-&gt;splice;</div><div class='del'>-</div><div class='del'>-	sp-&gt;off_in = READ_ONCE(sqe-&gt;splice_off_in);</div><div class='del'>-	sp-&gt;off_out = READ_ONCE(sqe-&gt;off);</div><div class='del'>-	return __io_splice_prep(req, sqe);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_splice(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_splice *sp = &amp;req-&gt;splice;</div><div class='del'>-	struct file *in = sp-&gt;file_in;</div><div class='del'>-	struct file *out = sp-&gt;file_out;</div><div class='del'>-	unsigned int flags = sp-&gt;flags &amp; ~SPLICE_F_FD_IN_FIXED;</div><div class='del'>-	loff_t *poff_in, *poff_out;</div><div class='del'>-	long ret = 0;</div><div class='del'>-</div><div class='del'>-	if (issue_flags &amp; IO_URING_F_NONBLOCK)</div><div class='del'>-		return -EAGAIN;</div><div class='del'>-</div><div class='del'>-	poff_in = (sp-&gt;off_in == -1) ? NULL : &amp;sp-&gt;off_in;</div><div class='del'>-	poff_out = (sp-&gt;off_out == -1) ? NULL : &amp;sp-&gt;off_out;</div><div class='del'>-</div><div class='del'>-	if (sp-&gt;len)</div><div class='del'>-		ret = do_splice(in, poff_in, out, poff_out, sp-&gt;len, flags);</div><div class='del'>-</div><div class='del'>-	if (!(sp-&gt;flags &amp; SPLICE_F_FD_IN_FIXED))</div><div class='del'>-		io_put_file(in);</div><div class='del'>-	req-&gt;flags &amp;= ~REQ_F_NEED_CLEANUP;</div><div class='del'>-</div><div class='del'>-	if (ret != sp-&gt;len)</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-	io_req_complete(req, ret);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * IORING_OP_NOP just posts a completion event, nothing else.</div><div class='del'>- */</div><div class='del'>-static int io_nop(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-</div><div class='del'>-	if (unlikely(ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	__io_req_complete(req, issue_flags, 0, 0);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_fsync_prep(struct io_kiocb *req, const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-</div><div class='del'>-	if (!req-&gt;file)</div><div class='del'>-		return -EBADF;</div><div class='del'>-</div><div class='del'>-	if (unlikely(ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (unlikely(sqe-&gt;addr || sqe-&gt;ioprio || sqe-&gt;buf_index ||</div><div class='del'>-		     sqe-&gt;splice_fd_in))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	req-&gt;sync.flags = READ_ONCE(sqe-&gt;fsync_flags);</div><div class='del'>-	if (unlikely(req-&gt;sync.flags &amp; ~IORING_FSYNC_DATASYNC))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	req-&gt;sync.off = READ_ONCE(sqe-&gt;off);</div><div class='del'>-	req-&gt;sync.len = READ_ONCE(sqe-&gt;len);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_fsync(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	loff_t end = req-&gt;sync.off + req-&gt;sync.len;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	/* fsync always requires a blocking context */</div><div class='del'>-	if (issue_flags &amp; IO_URING_F_NONBLOCK)</div><div class='del'>-		return -EAGAIN;</div><div class='del'>-</div><div class='del'>-	ret = vfs_fsync_range(req-&gt;file, req-&gt;sync.off,</div><div class='del'>-				end &gt; 0 ? end : LLONG_MAX,</div><div class='del'>-				req-&gt;sync.flags &amp; IORING_FSYNC_DATASYNC);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-	io_req_complete(req, ret);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_fallocate_prep(struct io_kiocb *req,</div><div class='del'>-			     const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	if (sqe-&gt;ioprio || sqe-&gt;buf_index || sqe-&gt;rw_flags ||</div><div class='del'>-	    sqe-&gt;splice_fd_in)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (unlikely(req-&gt;ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	req-&gt;sync.off = READ_ONCE(sqe-&gt;off);</div><div class='del'>-	req-&gt;sync.len = READ_ONCE(sqe-&gt;addr);</div><div class='del'>-	req-&gt;sync.mode = READ_ONCE(sqe-&gt;len);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_fallocate(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	/* fallocate always requiring blocking context */</div><div class='del'>-	if (issue_flags &amp; IO_URING_F_NONBLOCK)</div><div class='del'>-		return -EAGAIN;</div><div class='del'>-	ret = vfs_fallocate(req-&gt;file, req-&gt;sync.mode, req-&gt;sync.off,</div><div class='del'>-				req-&gt;sync.len);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-	io_req_complete(req, ret);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int __io_openat_prep(struct io_kiocb *req, const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	const char __user *fname;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (unlikely(req-&gt;ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (unlikely(sqe-&gt;ioprio || sqe-&gt;buf_index))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (unlikely(req-&gt;flags &amp; REQ_F_FIXED_FILE))</div><div class='del'>-		return -EBADF;</div><div class='del'>-</div><div class='del'>-	/* open.how should be already initialised */</div><div class='del'>-	if (!(req-&gt;open.how.flags &amp; O_PATH) &amp;&amp; force_o_largefile())</div><div class='del'>-		req-&gt;open.how.flags |= O_LARGEFILE;</div><div class='del'>-</div><div class='del'>-	req-&gt;open.dfd = READ_ONCE(sqe-&gt;fd);</div><div class='del'>-	fname = u64_to_user_ptr(READ_ONCE(sqe-&gt;addr));</div><div class='del'>-	req-&gt;open.filename = getname(fname);</div><div class='del'>-	if (IS_ERR(req-&gt;open.filename)) {</div><div class='del'>-		ret = PTR_ERR(req-&gt;open.filename);</div><div class='del'>-		req-&gt;open.filename = NULL;</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	req-&gt;open.file_slot = READ_ONCE(sqe-&gt;file_index);</div><div class='del'>-	if (req-&gt;open.file_slot &amp;&amp; (req-&gt;open.how.flags &amp; O_CLOEXEC))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	req-&gt;open.nofile = rlimit(RLIMIT_NOFILE);</div><div class='del'>-	req-&gt;flags |= REQ_F_NEED_CLEANUP;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_openat_prep(struct io_kiocb *req, const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	u64 mode = READ_ONCE(sqe-&gt;len);</div><div class='del'>-	u64 flags = READ_ONCE(sqe-&gt;open_flags);</div><div class='del'>-</div><div class='del'>-	req-&gt;open.how = build_open_how(flags, mode);</div><div class='del'>-	return __io_openat_prep(req, sqe);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_openat2_prep(struct io_kiocb *req, const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	struct open_how __user *how;</div><div class='del'>-	size_t len;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	how = u64_to_user_ptr(READ_ONCE(sqe-&gt;addr2));</div><div class='del'>-	len = READ_ONCE(sqe-&gt;len);</div><div class='del'>-	if (len &lt; OPEN_HOW_SIZE_VER0)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	ret = copy_struct_from_user(&amp;req-&gt;open.how, sizeof(req-&gt;open.how), how,</div><div class='del'>-					len);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	return __io_openat_prep(req, sqe);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_openat2(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct open_flags op;</div><div class='del'>-	struct file *file;</div><div class='del'>-	bool resolve_nonblock, nonblock_set;</div><div class='del'>-	bool fixed = !!req-&gt;open.file_slot;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ret = build_open_flags(&amp;req-&gt;open.how, &amp;op);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto err;</div><div class='del'>-	nonblock_set = op.open_flag &amp; O_NONBLOCK;</div><div class='del'>-	resolve_nonblock = req-&gt;open.how.resolve &amp; RESOLVE_CACHED;</div><div class='del'>-	if (issue_flags &amp; IO_URING_F_NONBLOCK) {</div><div class='del'>-		/*</div><div class='del'>-		 * Don't bother trying for O_TRUNC, O_CREAT, or O_TMPFILE open,</div><div class='del'>-		 * it'll always -EAGAIN</div><div class='del'>-		 */</div><div class='del'>-		if (req-&gt;open.how.flags &amp; (O_TRUNC | O_CREAT | O_TMPFILE))</div><div class='del'>-			return -EAGAIN;</div><div class='del'>-		op.lookup_flags |= LOOKUP_CACHED;</div><div class='del'>-		op.open_flag |= O_NONBLOCK;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!fixed) {</div><div class='del'>-		ret = __get_unused_fd_flags(req-&gt;open.how.flags, req-&gt;open.nofile);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			goto err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	file = do_filp_open(req-&gt;open.dfd, req-&gt;open.filename, &amp;op);</div><div class='del'>-	if (IS_ERR(file)) {</div><div class='del'>-		/*</div><div class='del'>-		 * We could hang on to this 'fd' on retrying, but seems like</div><div class='del'>-		 * marginal gain for something that is now known to be a slower</div><div class='del'>-		 * path. So just put it, and we'll get a new one when we retry.</div><div class='del'>-		 */</div><div class='del'>-		if (!fixed)</div><div class='del'>-			put_unused_fd(ret);</div><div class='del'>-</div><div class='del'>-		ret = PTR_ERR(file);</div><div class='del'>-		/* only retry if RESOLVE_CACHED wasn't already set by application */</div><div class='del'>-		if (ret == -EAGAIN &amp;&amp;</div><div class='del'>-		    (!resolve_nonblock &amp;&amp; (issue_flags &amp; IO_URING_F_NONBLOCK)))</div><div class='del'>-			return -EAGAIN;</div><div class='del'>-		goto err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if ((issue_flags &amp; IO_URING_F_NONBLOCK) &amp;&amp; !nonblock_set)</div><div class='del'>-		file-&gt;f_flags &amp;= ~O_NONBLOCK;</div><div class='del'>-	fsnotify_open(file);</div><div class='del'>-</div><div class='del'>-	if (!fixed)</div><div class='del'>-		fd_install(ret, file);</div><div class='del'>-	else</div><div class='del'>-		ret = io_install_fixed_file(req, file, issue_flags,</div><div class='del'>-					    req-&gt;open.file_slot - 1);</div><div class='del'>-err:</div><div class='del'>-	putname(req-&gt;open.filename);</div><div class='del'>-	req-&gt;flags &amp;= ~REQ_F_NEED_CLEANUP;</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-	__io_req_complete(req, issue_flags, ret, 0);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_openat(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	return io_openat2(req, issue_flags);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_remove_buffers_prep(struct io_kiocb *req,</div><div class='del'>-				  const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	struct io_provide_buf *p = &amp;req-&gt;pbuf;</div><div class='del'>-	u64 tmp;</div><div class='del'>-</div><div class='del'>-	if (sqe-&gt;ioprio || sqe-&gt;rw_flags || sqe-&gt;addr || sqe-&gt;len || sqe-&gt;off ||</div><div class='del'>-	    sqe-&gt;splice_fd_in)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	tmp = READ_ONCE(sqe-&gt;fd);</div><div class='del'>-	if (!tmp || tmp &gt; USHRT_MAX)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	memset(p, 0, sizeof(*p));</div><div class='del'>-	p-&gt;nbufs = tmp;</div><div class='del'>-	p-&gt;bgid = READ_ONCE(sqe-&gt;buf_group);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int __io_remove_buffers(struct io_ring_ctx *ctx, struct io_buffer *buf,</div><div class='del'>-			       int bgid, unsigned nbufs)</div><div class='del'>-{</div><div class='del'>-	unsigned i = 0;</div><div class='del'>-</div><div class='del'>-	/* shouldn't happen */</div><div class='del'>-	if (!nbufs)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	/* the head kbuf is the list itself */</div><div class='del'>-	while (!list_empty(&amp;buf-&gt;list)) {</div><div class='del'>-		struct io_buffer *nxt;</div><div class='del'>-</div><div class='del'>-		nxt = list_first_entry(&amp;buf-&gt;list, struct io_buffer, list);</div><div class='del'>-		list_del(&amp;nxt-&gt;list);</div><div class='del'>-		kfree(nxt);</div><div class='del'>-		if (++i == nbufs)</div><div class='del'>-			return i;</div><div class='del'>-	}</div><div class='del'>-	i++;</div><div class='del'>-	kfree(buf);</div><div class='del'>-	xa_erase(&amp;ctx-&gt;io_buffers, bgid);</div><div class='del'>-</div><div class='del'>-	return i;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_remove_buffers(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_provide_buf *p = &amp;req-&gt;pbuf;</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-	struct io_buffer *head;</div><div class='del'>-	int ret = 0;</div><div class='del'>-	bool needs_lock = issue_flags &amp; IO_URING_F_UNLOCKED;</div><div class='del'>-</div><div class='del'>-	io_ring_submit_lock(ctx, needs_lock);</div><div class='del'>-</div><div class='del'>-	lockdep_assert_held(&amp;ctx-&gt;uring_lock);</div><div class='del'>-</div><div class='del'>-	ret = -ENOENT;</div><div class='del'>-	head = xa_load(&amp;ctx-&gt;io_buffers, p-&gt;bgid);</div><div class='del'>-	if (head)</div><div class='del'>-		ret = __io_remove_buffers(ctx, head, p-&gt;bgid, p-&gt;nbufs);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-</div><div class='del'>-	/* complete before unlock, IOPOLL may need the lock */</div><div class='del'>-	__io_req_complete(req, issue_flags, ret, 0);</div><div class='del'>-	io_ring_submit_unlock(ctx, needs_lock);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_provide_buffers_prep(struct io_kiocb *req,</div><div class='del'>-				   const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	unsigned long size, tmp_check;</div><div class='del'>-	struct io_provide_buf *p = &amp;req-&gt;pbuf;</div><div class='del'>-	u64 tmp;</div><div class='del'>-</div><div class='del'>-	if (sqe-&gt;ioprio || sqe-&gt;rw_flags || sqe-&gt;splice_fd_in)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	tmp = READ_ONCE(sqe-&gt;fd);</div><div class='del'>-	if (!tmp || tmp &gt; USHRT_MAX)</div><div class='del'>-		return -E2BIG;</div><div class='del'>-	p-&gt;nbufs = tmp;</div><div class='del'>-	p-&gt;addr = READ_ONCE(sqe-&gt;addr);</div><div class='del'>-	p-&gt;len = READ_ONCE(sqe-&gt;len);</div><div class='del'>-</div><div class='del'>-	if (check_mul_overflow((unsigned long)p-&gt;len, (unsigned long)p-&gt;nbufs,</div><div class='del'>-				&amp;size))</div><div class='del'>-		return -EOVERFLOW;</div><div class='del'>-	if (check_add_overflow((unsigned long)p-&gt;addr, size, &amp;tmp_check))</div><div class='del'>-		return -EOVERFLOW;</div><div class='del'>-</div><div class='del'>-	size = (unsigned long)p-&gt;len * p-&gt;nbufs;</div><div class='del'>-	if (!access_ok(u64_to_user_ptr(p-&gt;addr), size))</div><div class='del'>-		return -EFAULT;</div><div class='del'>-</div><div class='del'>-	p-&gt;bgid = READ_ONCE(sqe-&gt;buf_group);</div><div class='del'>-	tmp = READ_ONCE(sqe-&gt;off);</div><div class='del'>-	if (tmp &gt; USHRT_MAX)</div><div class='del'>-		return -E2BIG;</div><div class='del'>-	p-&gt;bid = tmp;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_add_buffers(struct io_provide_buf *pbuf, struct io_buffer **head)</div><div class='del'>-{</div><div class='del'>-	struct io_buffer *buf;</div><div class='del'>-	u64 addr = pbuf-&gt;addr;</div><div class='del'>-	int i, bid = pbuf-&gt;bid;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; pbuf-&gt;nbufs; i++) {</div><div class='del'>-		buf = kmalloc(sizeof(*buf), GFP_KERNEL_ACCOUNT);</div><div class='del'>-		if (!buf)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		buf-&gt;addr = addr;</div><div class='del'>-		buf-&gt;len = min_t(__u32, pbuf-&gt;len, MAX_RW_COUNT);</div><div class='del'>-		buf-&gt;bid = bid;</div><div class='del'>-		addr += pbuf-&gt;len;</div><div class='del'>-		bid++;</div><div class='del'>-		if (!*head) {</div><div class='del'>-			INIT_LIST_HEAD(&amp;buf-&gt;list);</div><div class='del'>-			*head = buf;</div><div class='del'>-		} else {</div><div class='del'>-			list_add_tail(&amp;buf-&gt;list, &amp;(*head)-&gt;list);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return i ? i : -ENOMEM;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_provide_buffers(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_provide_buf *p = &amp;req-&gt;pbuf;</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-	struct io_buffer *head, *list;</div><div class='del'>-	int ret = 0;</div><div class='del'>-	bool needs_lock = issue_flags &amp; IO_URING_F_UNLOCKED;</div><div class='del'>-</div><div class='del'>-	io_ring_submit_lock(ctx, needs_lock);</div><div class='del'>-</div><div class='del'>-	lockdep_assert_held(&amp;ctx-&gt;uring_lock);</div><div class='del'>-</div><div class='del'>-	list = head = xa_load(&amp;ctx-&gt;io_buffers, p-&gt;bgid);</div><div class='del'>-</div><div class='del'>-	ret = io_add_buffers(p, &amp;head);</div><div class='del'>-	if (ret &gt;= 0 &amp;&amp; !list) {</div><div class='del'>-		ret = xa_insert(&amp;ctx-&gt;io_buffers, p-&gt;bgid, head, GFP_KERNEL);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			__io_remove_buffers(ctx, head, p-&gt;bgid, -1U);</div><div class='del'>-	}</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-	/* complete before unlock, IOPOLL may need the lock */</div><div class='del'>-	__io_req_complete(req, issue_flags, ret, 0);</div><div class='del'>-	io_ring_submit_unlock(ctx, needs_lock);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_epoll_ctl_prep(struct io_kiocb *req,</div><div class='del'>-			     const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-#if defined(CONFIG_EPOLL)</div><div class='del'>-	if (sqe-&gt;ioprio || sqe-&gt;buf_index || sqe-&gt;splice_fd_in)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (unlikely(req-&gt;ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	req-&gt;epoll.epfd = READ_ONCE(sqe-&gt;fd);</div><div class='del'>-	req-&gt;epoll.op = READ_ONCE(sqe-&gt;len);</div><div class='del'>-	req-&gt;epoll.fd = READ_ONCE(sqe-&gt;off);</div><div class='del'>-</div><div class='del'>-	if (ep_op_has_event(req-&gt;epoll.op)) {</div><div class='del'>-		struct epoll_event __user *ev;</div><div class='del'>-</div><div class='del'>-		ev = u64_to_user_ptr(READ_ONCE(sqe-&gt;addr));</div><div class='del'>-		if (copy_from_user(&amp;req-&gt;epoll.event, ev, sizeof(*ev)))</div><div class='del'>-			return -EFAULT;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-#else</div><div class='del'>-	return -EOPNOTSUPP;</div><div class='del'>-#endif</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_epoll_ctl(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-#if defined(CONFIG_EPOLL)</div><div class='del'>-	struct io_epoll *ie = &amp;req-&gt;epoll;</div><div class='del'>-	int ret;</div><div class='del'>-	bool force_nonblock = issue_flags &amp; IO_URING_F_NONBLOCK;</div><div class='del'>-</div><div class='del'>-	ret = do_epoll_ctl(ie-&gt;epfd, ie-&gt;op, ie-&gt;fd, &amp;ie-&gt;event, force_nonblock);</div><div class='del'>-	if (force_nonblock &amp;&amp; ret == -EAGAIN)</div><div class='del'>-		return -EAGAIN;</div><div class='del'>-</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-	__io_req_complete(req, issue_flags, ret, 0);</div><div class='del'>-	return 0;</div><div class='del'>-#else</div><div class='del'>-	return -EOPNOTSUPP;</div><div class='del'>-#endif</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_madvise_prep(struct io_kiocb *req, const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-#if defined(CONFIG_ADVISE_SYSCALLS) &amp;&amp; defined(CONFIG_MMU)</div><div class='del'>-	if (sqe-&gt;ioprio || sqe-&gt;buf_index || sqe-&gt;off || sqe-&gt;splice_fd_in)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (unlikely(req-&gt;ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	req-&gt;madvise.addr = READ_ONCE(sqe-&gt;addr);</div><div class='del'>-	req-&gt;madvise.len = READ_ONCE(sqe-&gt;len);</div><div class='del'>-	req-&gt;madvise.advice = READ_ONCE(sqe-&gt;fadvise_advice);</div><div class='del'>-	return 0;</div><div class='del'>-#else</div><div class='del'>-	return -EOPNOTSUPP;</div><div class='del'>-#endif</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_madvise(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-#if defined(CONFIG_ADVISE_SYSCALLS) &amp;&amp; defined(CONFIG_MMU)</div><div class='del'>-	struct io_madvise *ma = &amp;req-&gt;madvise;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (issue_flags &amp; IO_URING_F_NONBLOCK)</div><div class='del'>-		return -EAGAIN;</div><div class='del'>-</div><div class='del'>-	ret = do_madvise(current-&gt;mm, ma-&gt;addr, ma-&gt;len, ma-&gt;advice);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-	io_req_complete(req, ret);</div><div class='del'>-	return 0;</div><div class='del'>-#else</div><div class='del'>-	return -EOPNOTSUPP;</div><div class='del'>-#endif</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_fadvise_prep(struct io_kiocb *req, const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	if (sqe-&gt;ioprio || sqe-&gt;buf_index || sqe-&gt;addr || sqe-&gt;splice_fd_in)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (unlikely(req-&gt;ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	req-&gt;fadvise.offset = READ_ONCE(sqe-&gt;off);</div><div class='del'>-	req-&gt;fadvise.len = READ_ONCE(sqe-&gt;len);</div><div class='del'>-	req-&gt;fadvise.advice = READ_ONCE(sqe-&gt;fadvise_advice);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_fadvise(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_fadvise *fa = &amp;req-&gt;fadvise;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (issue_flags &amp; IO_URING_F_NONBLOCK) {</div><div class='del'>-		switch (fa-&gt;advice) {</div><div class='del'>-		case POSIX_FADV_NORMAL:</div><div class='del'>-		case POSIX_FADV_RANDOM:</div><div class='del'>-		case POSIX_FADV_SEQUENTIAL:</div><div class='del'>-			break;</div><div class='del'>-		default:</div><div class='del'>-			return -EAGAIN;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = vfs_fadvise(req-&gt;file, fa-&gt;offset, fa-&gt;len, fa-&gt;advice);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-	__io_req_complete(req, issue_flags, ret, 0);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_statx_prep(struct io_kiocb *req, const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	if (unlikely(req-&gt;ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (sqe-&gt;ioprio || sqe-&gt;buf_index || sqe-&gt;splice_fd_in)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_FIXED_FILE)</div><div class='del'>-		return -EBADF;</div><div class='del'>-</div><div class='del'>-	req-&gt;statx.dfd = READ_ONCE(sqe-&gt;fd);</div><div class='del'>-	req-&gt;statx.mask = READ_ONCE(sqe-&gt;len);</div><div class='del'>-	req-&gt;statx.filename = u64_to_user_ptr(READ_ONCE(sqe-&gt;addr));</div><div class='del'>-	req-&gt;statx.buffer = u64_to_user_ptr(READ_ONCE(sqe-&gt;addr2));</div><div class='del'>-	req-&gt;statx.flags = READ_ONCE(sqe-&gt;statx_flags);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_statx(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_statx *ctx = &amp;req-&gt;statx;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (issue_flags &amp; IO_URING_F_NONBLOCK)</div><div class='del'>-		return -EAGAIN;</div><div class='del'>-</div><div class='del'>-	ret = do_statx(ctx-&gt;dfd, ctx-&gt;filename, ctx-&gt;flags, ctx-&gt;mask,</div><div class='del'>-		       ctx-&gt;buffer);</div><div class='del'>-</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-	io_req_complete(req, ret);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_close_prep(struct io_kiocb *req, const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	if (unlikely(req-&gt;ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (sqe-&gt;ioprio || sqe-&gt;off || sqe-&gt;addr || sqe-&gt;len ||</div><div class='del'>-	    sqe-&gt;rw_flags || sqe-&gt;buf_index)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_FIXED_FILE)</div><div class='del'>-		return -EBADF;</div><div class='del'>-</div><div class='del'>-	req-&gt;close.fd = READ_ONCE(sqe-&gt;fd);</div><div class='del'>-	req-&gt;close.file_slot = READ_ONCE(sqe-&gt;file_index);</div><div class='del'>-	if (req-&gt;close.file_slot &amp;&amp; req-&gt;close.fd)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_close(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct files_struct *files = current-&gt;files;</div><div class='del'>-	struct io_close *close = &amp;req-&gt;close;</div><div class='del'>-	struct fdtable *fdt;</div><div class='del'>-	struct file *file = NULL;</div><div class='del'>-	int ret = -EBADF;</div><div class='del'>-</div><div class='del'>-	if (req-&gt;close.file_slot) {</div><div class='del'>-		ret = io_close_fixed(req, issue_flags);</div><div class='del'>-		goto err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;files-&gt;file_lock);</div><div class='del'>-	fdt = files_fdtable(files);</div><div class='del'>-	if (close-&gt;fd &gt;= fdt-&gt;max_fds) {</div><div class='del'>-		spin_unlock(&amp;files-&gt;file_lock);</div><div class='del'>-		goto err;</div><div class='del'>-	}</div><div class='del'>-	file = fdt-&gt;fd[close-&gt;fd];</div><div class='del'>-	if (!file || file-&gt;f_op == &amp;io_uring_fops) {</div><div class='del'>-		spin_unlock(&amp;files-&gt;file_lock);</div><div class='del'>-		file = NULL;</div><div class='del'>-		goto err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* if the file has a flush method, be safe and punt to async */</div><div class='del'>-	if (file-&gt;f_op-&gt;flush &amp;&amp; (issue_flags &amp; IO_URING_F_NONBLOCK)) {</div><div class='del'>-		spin_unlock(&amp;files-&gt;file_lock);</div><div class='del'>-		return -EAGAIN;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = __close_fd_get_file(close-&gt;fd, &amp;file);</div><div class='del'>-	spin_unlock(&amp;files-&gt;file_lock);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		if (ret == -ENOENT)</div><div class='del'>-			ret = -EBADF;</div><div class='del'>-		goto err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* No -&gt;flush() or already async, safely close from here */</div><div class='del'>-	ret = filp_close(file, current-&gt;files);</div><div class='del'>-err:</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-	if (file)</div><div class='del'>-		fput(file);</div><div class='del'>-	__io_req_complete(req, issue_flags, ret, 0);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_sfr_prep(struct io_kiocb *req, const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-</div><div class='del'>-	if (unlikely(ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (unlikely(sqe-&gt;addr || sqe-&gt;ioprio || sqe-&gt;buf_index ||</div><div class='del'>-		     sqe-&gt;splice_fd_in))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	req-&gt;sync.off = READ_ONCE(sqe-&gt;off);</div><div class='del'>-	req-&gt;sync.len = READ_ONCE(sqe-&gt;len);</div><div class='del'>-	req-&gt;sync.flags = READ_ONCE(sqe-&gt;sync_range_flags);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_sync_file_range(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	/* sync_file_range always requires a blocking context */</div><div class='del'>-	if (issue_flags &amp; IO_URING_F_NONBLOCK)</div><div class='del'>-		return -EAGAIN;</div><div class='del'>-</div><div class='del'>-	ret = sync_file_range(req-&gt;file, req-&gt;sync.off, req-&gt;sync.len,</div><div class='del'>-				req-&gt;sync.flags);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-	io_req_complete(req, ret);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#if defined(CONFIG_NET)</div><div class='del'>-static int io_setup_async_msg(struct io_kiocb *req,</div><div class='del'>-			      struct io_async_msghdr *kmsg)</div><div class='del'>-{</div><div class='del'>-	struct io_async_msghdr *async_msg = req-&gt;async_data;</div><div class='del'>-</div><div class='del'>-	if (async_msg)</div><div class='del'>-		return -EAGAIN;</div><div class='del'>-	if (io_alloc_async_data(req)) {</div><div class='del'>-		kfree(kmsg-&gt;free_iov);</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	}</div><div class='del'>-	async_msg = req-&gt;async_data;</div><div class='del'>-	req-&gt;flags |= REQ_F_NEED_CLEANUP;</div><div class='del'>-	memcpy(async_msg, kmsg, sizeof(*kmsg));</div><div class='del'>-	async_msg-&gt;msg.msg_name = &amp;async_msg-&gt;addr;</div><div class='del'>-	/* if were using fast_iov, set it to the new one */</div><div class='del'>-	if (!async_msg-&gt;free_iov)</div><div class='del'>-		async_msg-&gt;msg.msg_iter.iov = async_msg-&gt;fast_iov;</div><div class='del'>-</div><div class='del'>-	return -EAGAIN;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_sendmsg_copy_hdr(struct io_kiocb *req,</div><div class='del'>-			       struct io_async_msghdr *iomsg)</div><div class='del'>-{</div><div class='del'>-	iomsg-&gt;msg.msg_name = &amp;iomsg-&gt;addr;</div><div class='del'>-	iomsg-&gt;free_iov = iomsg-&gt;fast_iov;</div><div class='del'>-	return sendmsg_copy_msghdr(&amp;iomsg-&gt;msg, req-&gt;sr_msg.umsg,</div><div class='del'>-				   req-&gt;sr_msg.msg_flags, &amp;iomsg-&gt;free_iov);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_sendmsg_prep_async(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ret = io_sendmsg_copy_hdr(req, req-&gt;async_data);</div><div class='del'>-	if (!ret)</div><div class='del'>-		req-&gt;flags |= REQ_F_NEED_CLEANUP;</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_sendmsg_prep(struct io_kiocb *req, const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	struct io_sr_msg *sr = &amp;req-&gt;sr_msg;</div><div class='del'>-</div><div class='del'>-	if (unlikely(req-&gt;ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	sr-&gt;umsg = u64_to_user_ptr(READ_ONCE(sqe-&gt;addr));</div><div class='del'>-	sr-&gt;len = READ_ONCE(sqe-&gt;len);</div><div class='del'>-	sr-&gt;msg_flags = READ_ONCE(sqe-&gt;msg_flags) | MSG_NOSIGNAL;</div><div class='del'>-	if (sr-&gt;msg_flags &amp; MSG_DONTWAIT)</div><div class='del'>-		req-&gt;flags |= REQ_F_NOWAIT;</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_COMPAT</div><div class='del'>-	if (req-&gt;ctx-&gt;compat)</div><div class='del'>-		sr-&gt;msg_flags |= MSG_CMSG_COMPAT;</div><div class='del'>-#endif</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_sendmsg(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_async_msghdr iomsg, *kmsg;</div><div class='del'>-	struct socket *sock;</div><div class='del'>-	unsigned flags;</div><div class='del'>-	int min_ret = 0;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	sock = sock_from_file(req-&gt;file);</div><div class='del'>-	if (unlikely(!sock))</div><div class='del'>-		return -ENOTSOCK;</div><div class='del'>-</div><div class='del'>-	if (req_has_async_data(req)) {</div><div class='del'>-		kmsg = req-&gt;async_data;</div><div class='del'>-	} else {</div><div class='del'>-		ret = io_sendmsg_copy_hdr(req, &amp;iomsg);</div><div class='del'>-		if (ret)</div><div class='del'>-			return ret;</div><div class='del'>-		kmsg = &amp;iomsg;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	flags = req-&gt;sr_msg.msg_flags;</div><div class='del'>-	if (issue_flags &amp; IO_URING_F_NONBLOCK)</div><div class='del'>-		flags |= MSG_DONTWAIT;</div><div class='del'>-	if (flags &amp; MSG_WAITALL)</div><div class='del'>-		min_ret = iov_iter_count(&amp;kmsg-&gt;msg.msg_iter);</div><div class='del'>-</div><div class='del'>-	ret = __sys_sendmsg_sock(sock, &amp;kmsg-&gt;msg, flags);</div><div class='del'>-	if ((issue_flags &amp; IO_URING_F_NONBLOCK) &amp;&amp; ret == -EAGAIN)</div><div class='del'>-		return io_setup_async_msg(req, kmsg);</div><div class='del'>-	if (ret == -ERESTARTSYS)</div><div class='del'>-		ret = -EINTR;</div><div class='del'>-</div><div class='del'>-	/* fast path, check for non-NULL to avoid function call */</div><div class='del'>-	if (kmsg-&gt;free_iov)</div><div class='del'>-		kfree(kmsg-&gt;free_iov);</div><div class='del'>-	req-&gt;flags &amp;= ~REQ_F_NEED_CLEANUP;</div><div class='del'>-	if (ret &lt; min_ret)</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-	__io_req_complete(req, issue_flags, ret, 0);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_send(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_sr_msg *sr = &amp;req-&gt;sr_msg;</div><div class='del'>-	struct msghdr msg;</div><div class='del'>-	struct iovec iov;</div><div class='del'>-	struct socket *sock;</div><div class='del'>-	unsigned flags;</div><div class='del'>-	int min_ret = 0;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	sock = sock_from_file(req-&gt;file);</div><div class='del'>-	if (unlikely(!sock))</div><div class='del'>-		return -ENOTSOCK;</div><div class='del'>-</div><div class='del'>-	ret = import_single_range(WRITE, sr-&gt;buf, sr-&gt;len, &amp;iov, &amp;msg.msg_iter);</div><div class='del'>-	if (unlikely(ret))</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	msg.msg_name = NULL;</div><div class='del'>-	msg.msg_control = NULL;</div><div class='del'>-	msg.msg_controllen = 0;</div><div class='del'>-	msg.msg_namelen = 0;</div><div class='del'>-</div><div class='del'>-	flags = req-&gt;sr_msg.msg_flags;</div><div class='del'>-	if (issue_flags &amp; IO_URING_F_NONBLOCK)</div><div class='del'>-		flags |= MSG_DONTWAIT;</div><div class='del'>-	if (flags &amp; MSG_WAITALL)</div><div class='del'>-		min_ret = iov_iter_count(&amp;msg.msg_iter);</div><div class='del'>-</div><div class='del'>-	msg.msg_flags = flags;</div><div class='del'>-	ret = sock_sendmsg(sock, &amp;msg);</div><div class='del'>-	if ((issue_flags &amp; IO_URING_F_NONBLOCK) &amp;&amp; ret == -EAGAIN)</div><div class='del'>-		return -EAGAIN;</div><div class='del'>-	if (ret == -ERESTARTSYS)</div><div class='del'>-		ret = -EINTR;</div><div class='del'>-</div><div class='del'>-	if (ret &lt; min_ret)</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-	__io_req_complete(req, issue_flags, ret, 0);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int __io_recvmsg_copy_hdr(struct io_kiocb *req,</div><div class='del'>-				 struct io_async_msghdr *iomsg)</div><div class='del'>-{</div><div class='del'>-	struct io_sr_msg *sr = &amp;req-&gt;sr_msg;</div><div class='del'>-	struct iovec __user *uiov;</div><div class='del'>-	size_t iov_len;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ret = __copy_msghdr_from_user(&amp;iomsg-&gt;msg, sr-&gt;umsg,</div><div class='del'>-					&amp;iomsg-&gt;uaddr, &amp;uiov, &amp;iov_len);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_BUFFER_SELECT) {</div><div class='del'>-		if (iov_len &gt; 1)</div><div class='del'>-			return -EINVAL;</div><div class='del'>-		if (copy_from_user(iomsg-&gt;fast_iov, uiov, sizeof(*uiov)))</div><div class='del'>-			return -EFAULT;</div><div class='del'>-		sr-&gt;len = iomsg-&gt;fast_iov[0].iov_len;</div><div class='del'>-		iomsg-&gt;free_iov = NULL;</div><div class='del'>-	} else {</div><div class='del'>-		iomsg-&gt;free_iov = iomsg-&gt;fast_iov;</div><div class='del'>-		ret = __import_iovec(READ, uiov, iov_len, UIO_FASTIOV,</div><div class='del'>-				     &amp;iomsg-&gt;free_iov, &amp;iomsg-&gt;msg.msg_iter,</div><div class='del'>-				     false);</div><div class='del'>-		if (ret &gt; 0)</div><div class='del'>-			ret = 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_COMPAT</div><div class='del'>-static int __io_compat_recvmsg_copy_hdr(struct io_kiocb *req,</div><div class='del'>-					struct io_async_msghdr *iomsg)</div><div class='del'>-{</div><div class='del'>-	struct io_sr_msg *sr = &amp;req-&gt;sr_msg;</div><div class='del'>-	struct compat_iovec __user *uiov;</div><div class='del'>-	compat_uptr_t ptr;</div><div class='del'>-	compat_size_t len;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ret = __get_compat_msghdr(&amp;iomsg-&gt;msg, sr-&gt;umsg_compat, &amp;iomsg-&gt;uaddr,</div><div class='del'>-				  &amp;ptr, &amp;len);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	uiov = compat_ptr(ptr);</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_BUFFER_SELECT) {</div><div class='del'>-		compat_ssize_t clen;</div><div class='del'>-</div><div class='del'>-		if (len &gt; 1)</div><div class='del'>-			return -EINVAL;</div><div class='del'>-		if (!access_ok(uiov, sizeof(*uiov)))</div><div class='del'>-			return -EFAULT;</div><div class='del'>-		if (__get_user(clen, &amp;uiov-&gt;iov_len))</div><div class='del'>-			return -EFAULT;</div><div class='del'>-		if (clen &lt; 0)</div><div class='del'>-			return -EINVAL;</div><div class='del'>-		sr-&gt;len = clen;</div><div class='del'>-		iomsg-&gt;free_iov = NULL;</div><div class='del'>-	} else {</div><div class='del'>-		iomsg-&gt;free_iov = iomsg-&gt;fast_iov;</div><div class='del'>-		ret = __import_iovec(READ, (struct iovec __user *)uiov, len,</div><div class='del'>-				   UIO_FASTIOV, &amp;iomsg-&gt;free_iov,</div><div class='del'>-				   &amp;iomsg-&gt;msg.msg_iter, true);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-static int io_recvmsg_copy_hdr(struct io_kiocb *req,</div><div class='del'>-			       struct io_async_msghdr *iomsg)</div><div class='del'>-{</div><div class='del'>-	iomsg-&gt;msg.msg_name = &amp;iomsg-&gt;addr;</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_COMPAT</div><div class='del'>-	if (req-&gt;ctx-&gt;compat)</div><div class='del'>-		return __io_compat_recvmsg_copy_hdr(req, iomsg);</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-	return __io_recvmsg_copy_hdr(req, iomsg);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct io_buffer *io_recv_buffer_select(struct io_kiocb *req,</div><div class='del'>-					       unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_sr_msg *sr = &amp;req-&gt;sr_msg;</div><div class='del'>-</div><div class='del'>-	return io_buffer_select(req, &amp;sr-&gt;len, sr-&gt;bgid, issue_flags);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline unsigned int io_put_recv_kbuf(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	return io_put_kbuf(req, req-&gt;kbuf);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_recvmsg_prep_async(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ret = io_recvmsg_copy_hdr(req, req-&gt;async_data);</div><div class='del'>-	if (!ret)</div><div class='del'>-		req-&gt;flags |= REQ_F_NEED_CLEANUP;</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_recvmsg_prep(struct io_kiocb *req, const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	struct io_sr_msg *sr = &amp;req-&gt;sr_msg;</div><div class='del'>-</div><div class='del'>-	if (unlikely(req-&gt;ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	sr-&gt;umsg = u64_to_user_ptr(READ_ONCE(sqe-&gt;addr));</div><div class='del'>-	sr-&gt;len = READ_ONCE(sqe-&gt;len);</div><div class='del'>-	sr-&gt;bgid = READ_ONCE(sqe-&gt;buf_group);</div><div class='del'>-	sr-&gt;msg_flags = READ_ONCE(sqe-&gt;msg_flags) | MSG_NOSIGNAL;</div><div class='del'>-	if (sr-&gt;msg_flags &amp; MSG_DONTWAIT)</div><div class='del'>-		req-&gt;flags |= REQ_F_NOWAIT;</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_COMPAT</div><div class='del'>-	if (req-&gt;ctx-&gt;compat)</div><div class='del'>-		sr-&gt;msg_flags |= MSG_CMSG_COMPAT;</div><div class='del'>-#endif</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_recvmsg(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_async_msghdr iomsg, *kmsg;</div><div class='del'>-	struct socket *sock;</div><div class='del'>-	struct io_buffer *kbuf;</div><div class='del'>-	unsigned flags;</div><div class='del'>-	int min_ret = 0;</div><div class='del'>-	int ret, cflags = 0;</div><div class='del'>-	bool force_nonblock = issue_flags &amp; IO_URING_F_NONBLOCK;</div><div class='del'>-</div><div class='del'>-	sock = sock_from_file(req-&gt;file);</div><div class='del'>-	if (unlikely(!sock))</div><div class='del'>-		return -ENOTSOCK;</div><div class='del'>-</div><div class='del'>-	if (req_has_async_data(req)) {</div><div class='del'>-		kmsg = req-&gt;async_data;</div><div class='del'>-	} else {</div><div class='del'>-		ret = io_recvmsg_copy_hdr(req, &amp;iomsg);</div><div class='del'>-		if (ret)</div><div class='del'>-			return ret;</div><div class='del'>-		kmsg = &amp;iomsg;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_BUFFER_SELECT) {</div><div class='del'>-		kbuf = io_recv_buffer_select(req, issue_flags);</div><div class='del'>-		if (IS_ERR(kbuf))</div><div class='del'>-			return PTR_ERR(kbuf);</div><div class='del'>-		kmsg-&gt;fast_iov[0].iov_base = u64_to_user_ptr(kbuf-&gt;addr);</div><div class='del'>-		kmsg-&gt;fast_iov[0].iov_len = req-&gt;sr_msg.len;</div><div class='del'>-		iov_iter_init(&amp;kmsg-&gt;msg.msg_iter, READ, kmsg-&gt;fast_iov,</div><div class='del'>-				1, req-&gt;sr_msg.len);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	flags = req-&gt;sr_msg.msg_flags;</div><div class='del'>-	if (force_nonblock)</div><div class='del'>-		flags |= MSG_DONTWAIT;</div><div class='del'>-	if (flags &amp; MSG_WAITALL)</div><div class='del'>-		min_ret = iov_iter_count(&amp;kmsg-&gt;msg.msg_iter);</div><div class='del'>-</div><div class='del'>-	ret = __sys_recvmsg_sock(sock, &amp;kmsg-&gt;msg, req-&gt;sr_msg.umsg,</div><div class='del'>-					kmsg-&gt;uaddr, flags);</div><div class='del'>-	if (force_nonblock &amp;&amp; ret == -EAGAIN)</div><div class='del'>-		return io_setup_async_msg(req, kmsg);</div><div class='del'>-	if (ret == -ERESTARTSYS)</div><div class='del'>-		ret = -EINTR;</div><div class='del'>-</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_BUFFER_SELECTED)</div><div class='del'>-		cflags = io_put_recv_kbuf(req);</div><div class='del'>-	/* fast path, check for non-NULL to avoid function call */</div><div class='del'>-	if (kmsg-&gt;free_iov)</div><div class='del'>-		kfree(kmsg-&gt;free_iov);</div><div class='del'>-	req-&gt;flags &amp;= ~REQ_F_NEED_CLEANUP;</div><div class='del'>-	if (ret &lt; min_ret || ((flags &amp; MSG_WAITALL) &amp;&amp; (kmsg-&gt;msg.msg_flags &amp; (MSG_TRUNC | MSG_CTRUNC))))</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-	__io_req_complete(req, issue_flags, ret, cflags);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_recv(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_buffer *kbuf;</div><div class='del'>-	struct io_sr_msg *sr = &amp;req-&gt;sr_msg;</div><div class='del'>-	struct msghdr msg;</div><div class='del'>-	void __user *buf = sr-&gt;buf;</div><div class='del'>-	struct socket *sock;</div><div class='del'>-	struct iovec iov;</div><div class='del'>-	unsigned flags;</div><div class='del'>-	int min_ret = 0;</div><div class='del'>-	int ret, cflags = 0;</div><div class='del'>-	bool force_nonblock = issue_flags &amp; IO_URING_F_NONBLOCK;</div><div class='del'>-</div><div class='del'>-	sock = sock_from_file(req-&gt;file);</div><div class='del'>-	if (unlikely(!sock))</div><div class='del'>-		return -ENOTSOCK;</div><div class='del'>-</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_BUFFER_SELECT) {</div><div class='del'>-		kbuf = io_recv_buffer_select(req, issue_flags);</div><div class='del'>-		if (IS_ERR(kbuf))</div><div class='del'>-			return PTR_ERR(kbuf);</div><div class='del'>-		buf = u64_to_user_ptr(kbuf-&gt;addr);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = import_single_range(READ, buf, sr-&gt;len, &amp;iov, &amp;msg.msg_iter);</div><div class='del'>-	if (unlikely(ret))</div><div class='del'>-		goto out_free;</div><div class='del'>-</div><div class='del'>-	msg.msg_name = NULL;</div><div class='del'>-	msg.msg_control = NULL;</div><div class='del'>-	msg.msg_controllen = 0;</div><div class='del'>-	msg.msg_namelen = 0;</div><div class='del'>-	msg.msg_iocb = NULL;</div><div class='del'>-	msg.msg_flags = 0;</div><div class='del'>-</div><div class='del'>-	flags = req-&gt;sr_msg.msg_flags;</div><div class='del'>-	if (force_nonblock)</div><div class='del'>-		flags |= MSG_DONTWAIT;</div><div class='del'>-	if (flags &amp; MSG_WAITALL)</div><div class='del'>-		min_ret = iov_iter_count(&amp;msg.msg_iter);</div><div class='del'>-</div><div class='del'>-	ret = sock_recvmsg(sock, &amp;msg, flags);</div><div class='del'>-	if (force_nonblock &amp;&amp; ret == -EAGAIN)</div><div class='del'>-		return -EAGAIN;</div><div class='del'>-	if (ret == -ERESTARTSYS)</div><div class='del'>-		ret = -EINTR;</div><div class='del'>-out_free:</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_BUFFER_SELECTED)</div><div class='del'>-		cflags = io_put_recv_kbuf(req);</div><div class='del'>-	if (ret &lt; min_ret || ((flags &amp; MSG_WAITALL) &amp;&amp; (msg.msg_flags &amp; (MSG_TRUNC | MSG_CTRUNC))))</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-	__io_req_complete(req, issue_flags, ret, cflags);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_accept_prep(struct io_kiocb *req, const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	struct io_accept *accept = &amp;req-&gt;accept;</div><div class='del'>-</div><div class='del'>-	if (unlikely(req-&gt;ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (sqe-&gt;ioprio || sqe-&gt;len || sqe-&gt;buf_index)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	accept-&gt;addr = u64_to_user_ptr(READ_ONCE(sqe-&gt;addr));</div><div class='del'>-	accept-&gt;addr_len = u64_to_user_ptr(READ_ONCE(sqe-&gt;addr2));</div><div class='del'>-	accept-&gt;flags = READ_ONCE(sqe-&gt;accept_flags);</div><div class='del'>-	accept-&gt;nofile = rlimit(RLIMIT_NOFILE);</div><div class='del'>-</div><div class='del'>-	accept-&gt;file_slot = READ_ONCE(sqe-&gt;file_index);</div><div class='del'>-	if (accept-&gt;file_slot &amp;&amp; ((req-&gt;open.how.flags &amp; O_CLOEXEC) ||</div><div class='del'>-				  (accept-&gt;flags &amp; SOCK_CLOEXEC)))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (accept-&gt;flags &amp; ~(SOCK_CLOEXEC | SOCK_NONBLOCK))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (SOCK_NONBLOCK != O_NONBLOCK &amp;&amp; (accept-&gt;flags &amp; SOCK_NONBLOCK))</div><div class='del'>-		accept-&gt;flags = (accept-&gt;flags &amp; ~SOCK_NONBLOCK) | O_NONBLOCK;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_accept(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_accept *accept = &amp;req-&gt;accept;</div><div class='del'>-	bool force_nonblock = issue_flags &amp; IO_URING_F_NONBLOCK;</div><div class='del'>-	unsigned int file_flags = force_nonblock ? O_NONBLOCK : 0;</div><div class='del'>-	bool fixed = !!accept-&gt;file_slot;</div><div class='del'>-	struct file *file;</div><div class='del'>-	int ret, fd;</div><div class='del'>-</div><div class='del'>-	if (req-&gt;file-&gt;f_flags &amp; O_NONBLOCK)</div><div class='del'>-		req-&gt;flags |= REQ_F_NOWAIT;</div><div class='del'>-</div><div class='del'>-	if (!fixed) {</div><div class='del'>-		fd = __get_unused_fd_flags(accept-&gt;flags, accept-&gt;nofile);</div><div class='del'>-		if (unlikely(fd &lt; 0))</div><div class='del'>-			return fd;</div><div class='del'>-	}</div><div class='del'>-	file = do_accept(req-&gt;file, file_flags, accept-&gt;addr, accept-&gt;addr_len,</div><div class='del'>-			 accept-&gt;flags);</div><div class='del'>-	if (IS_ERR(file)) {</div><div class='del'>-		if (!fixed)</div><div class='del'>-			put_unused_fd(fd);</div><div class='del'>-		ret = PTR_ERR(file);</div><div class='del'>-		if (ret == -EAGAIN &amp;&amp; force_nonblock)</div><div class='del'>-			return -EAGAIN;</div><div class='del'>-		if (ret == -ERESTARTSYS)</div><div class='del'>-			ret = -EINTR;</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-	} else if (!fixed) {</div><div class='del'>-		fd_install(fd, file);</div><div class='del'>-		ret = fd;</div><div class='del'>-	} else {</div><div class='del'>-		ret = io_install_fixed_file(req, file, issue_flags,</div><div class='del'>-					    accept-&gt;file_slot - 1);</div><div class='del'>-	}</div><div class='del'>-	__io_req_complete(req, issue_flags, ret, 0);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_connect_prep_async(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	struct io_async_connect *io = req-&gt;async_data;</div><div class='del'>-	struct io_connect *conn = &amp;req-&gt;connect;</div><div class='del'>-</div><div class='del'>-	return move_addr_to_kernel(conn-&gt;addr, conn-&gt;addr_len, &amp;io-&gt;address);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_connect_prep(struct io_kiocb *req, const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	struct io_connect *conn = &amp;req-&gt;connect;</div><div class='del'>-</div><div class='del'>-	if (unlikely(req-&gt;ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (sqe-&gt;ioprio || sqe-&gt;len || sqe-&gt;buf_index || sqe-&gt;rw_flags ||</div><div class='del'>-	    sqe-&gt;splice_fd_in)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	conn-&gt;addr = u64_to_user_ptr(READ_ONCE(sqe-&gt;addr));</div><div class='del'>-	conn-&gt;addr_len =  READ_ONCE(sqe-&gt;addr2);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_connect(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_async_connect __io, *io;</div><div class='del'>-	unsigned file_flags;</div><div class='del'>-	int ret;</div><div class='del'>-	bool force_nonblock = issue_flags &amp; IO_URING_F_NONBLOCK;</div><div class='del'>-</div><div class='del'>-	if (req_has_async_data(req)) {</div><div class='del'>-		io = req-&gt;async_data;</div><div class='del'>-	} else {</div><div class='del'>-		ret = move_addr_to_kernel(req-&gt;connect.addr,</div><div class='del'>-						req-&gt;connect.addr_len,</div><div class='del'>-						&amp;__io.address);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto out;</div><div class='del'>-		io = &amp;__io;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	file_flags = force_nonblock ? O_NONBLOCK : 0;</div><div class='del'>-</div><div class='del'>-	ret = __sys_connect_file(req-&gt;file, &amp;io-&gt;address,</div><div class='del'>-					req-&gt;connect.addr_len, file_flags);</div><div class='del'>-	if ((ret == -EAGAIN || ret == -EINPROGRESS) &amp;&amp; force_nonblock) {</div><div class='del'>-		if (req_has_async_data(req))</div><div class='del'>-			return -EAGAIN;</div><div class='del'>-		if (io_alloc_async_data(req)) {</div><div class='del'>-			ret = -ENOMEM;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		memcpy(req-&gt;async_data, &amp;__io, sizeof(__io));</div><div class='del'>-		return -EAGAIN;</div><div class='del'>-	}</div><div class='del'>-	if (ret == -ERESTARTSYS)</div><div class='del'>-		ret = -EINTR;</div><div class='del'>-out:</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-	__io_req_complete(req, issue_flags, ret, 0);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-#else /* !CONFIG_NET */</div><div class='del'>-#define IO_NETOP_FN(op)							\</div><div class='del'>-static int io_##op(struct io_kiocb *req, unsigned int issue_flags)	\</div><div class='del'>-{									\</div><div class='del'>-	return -EOPNOTSUPP;						\</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#define IO_NETOP_PREP(op)						\</div><div class='del'>-IO_NETOP_FN(op)								\</div><div class='del'>-static int io_##op##_prep(struct io_kiocb *req, const struct io_uring_sqe *sqe) \</div><div class='del'>-{									\</div><div class='del'>-	return -EOPNOTSUPP;						\</div><div class='del'>-}									\</div><div class='del'>-</div><div class='del'>-#define IO_NETOP_PREP_ASYNC(op)						\</div><div class='del'>-IO_NETOP_PREP(op)							\</div><div class='del'>-static int io_##op##_prep_async(struct io_kiocb *req)			\</div><div class='del'>-{									\</div><div class='del'>-	return -EOPNOTSUPP;						\</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-IO_NETOP_PREP_ASYNC(sendmsg);</div><div class='del'>-IO_NETOP_PREP_ASYNC(recvmsg);</div><div class='del'>-IO_NETOP_PREP_ASYNC(connect);</div><div class='del'>-IO_NETOP_PREP(accept);</div><div class='del'>-IO_NETOP_FN(send);</div><div class='del'>-IO_NETOP_FN(recv);</div><div class='del'>-#endif /* CONFIG_NET */</div><div class='del'>-</div><div class='del'>-struct io_poll_table {</div><div class='del'>-	struct poll_table_struct pt;</div><div class='del'>-	struct io_kiocb *req;</div><div class='del'>-	int nr_entries;</div><div class='del'>-	int error;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static int __io_async_wake(struct io_kiocb *req, struct io_poll_iocb *poll,</div><div class='del'>-			   __poll_t mask, io_req_tw_func_t func)</div><div class='del'>-{</div><div class='del'>-	/* for instances that support it check for an event match first: */</div><div class='del'>-	if (mask &amp;&amp; !(mask &amp; poll-&gt;events))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	trace_io_uring_task_add(req-&gt;ctx, req-&gt;opcode, req-&gt;user_data, mask);</div><div class='del'>-</div><div class='del'>-	list_del_init(&amp;poll-&gt;wait.entry);</div><div class='del'>-</div><div class='del'>-	req-&gt;result = mask;</div><div class='del'>-	req-&gt;io_task_work.func = func;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If this fails, then the task is exiting. When a task exits, the</div><div class='del'>-	 * work gets canceled, so just cancel this request as well instead</div><div class='del'>-	 * of executing it. We can't safely execute it anyway, as we may not</div><div class='del'>-	 * have the needed state needed for it anyway.</div><div class='del'>-	 */</div><div class='del'>-	io_req_task_work_add(req);</div><div class='del'>-	return 1;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool io_poll_rewait(struct io_kiocb *req, struct io_poll_iocb *poll)</div><div class='del'>-	__acquires(&amp;req-&gt;ctx-&gt;completion_lock)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-</div><div class='del'>-	/* req-&gt;task == current here, checking PF_EXITING is safe */</div><div class='del'>-	if (unlikely(req-&gt;task-&gt;flags &amp; PF_EXITING))</div><div class='del'>-		WRITE_ONCE(poll-&gt;canceled, true);</div><div class='del'>-</div><div class='del'>-	if (!req-&gt;result &amp;&amp; !READ_ONCE(poll-&gt;canceled)) {</div><div class='del'>-		struct poll_table_struct pt = { ._key = poll-&gt;events };</div><div class='del'>-</div><div class='del'>-		req-&gt;result = vfs_poll(req-&gt;file, &amp;pt) &amp; poll-&gt;events;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	if (!req-&gt;result &amp;&amp; !READ_ONCE(poll-&gt;canceled)) {</div><div class='del'>-		add_wait_queue(poll-&gt;head, &amp;poll-&gt;wait);</div><div class='del'>-		return true;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct io_poll_iocb *io_poll_get_double(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	/* pure poll stashes this in -&gt;async_data, poll driven retry elsewhere */</div><div class='del'>-	if (req-&gt;opcode == IORING_OP_POLL_ADD)</div><div class='del'>-		return req-&gt;async_data;</div><div class='del'>-	return req-&gt;apoll-&gt;double_poll;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct io_poll_iocb *io_poll_get_single(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	if (req-&gt;opcode == IORING_OP_POLL_ADD)</div><div class='del'>-		return &amp;req-&gt;poll;</div><div class='del'>-	return &amp;req-&gt;apoll-&gt;poll;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_poll_remove_double(struct io_kiocb *req)</div><div class='del'>-	__must_hold(&amp;req-&gt;ctx-&gt;completion_lock)</div><div class='del'>-{</div><div class='del'>-	struct io_poll_iocb *poll = io_poll_get_double(req);</div><div class='del'>-</div><div class='del'>-	lockdep_assert_held(&amp;req-&gt;ctx-&gt;completion_lock);</div><div class='del'>-</div><div class='del'>-	if (poll &amp;&amp; poll-&gt;head) {</div><div class='del'>-		struct wait_queue_head *head = poll-&gt;head;</div><div class='del'>-</div><div class='del'>-		spin_lock_irq(&amp;head-&gt;lock);</div><div class='del'>-		list_del_init(&amp;poll-&gt;wait.entry);</div><div class='del'>-		if (poll-&gt;wait.private)</div><div class='del'>-			req_ref_put(req);</div><div class='del'>-		poll-&gt;head = NULL;</div><div class='del'>-		spin_unlock_irq(&amp;head-&gt;lock);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool __io_poll_complete(struct io_kiocb *req, __poll_t mask)</div><div class='del'>-	__must_hold(&amp;req-&gt;ctx-&gt;completion_lock)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-	unsigned flags = IORING_CQE_F_MORE;</div><div class='del'>-	int error;</div><div class='del'>-</div><div class='del'>-	if (READ_ONCE(req-&gt;poll.canceled)) {</div><div class='del'>-		error = -ECANCELED;</div><div class='del'>-		req-&gt;poll.events |= EPOLLONESHOT;</div><div class='del'>-	} else {</div><div class='del'>-		error = mangle_poll(mask);</div><div class='del'>-	}</div><div class='del'>-	if (req-&gt;poll.events &amp; EPOLLONESHOT)</div><div class='del'>-		flags = 0;</div><div class='del'>-	if (!io_cqring_fill_event(ctx, req-&gt;user_data, error, flags)) {</div><div class='del'>-		req-&gt;poll.events |= EPOLLONESHOT;</div><div class='del'>-		flags = 0;</div><div class='del'>-	}</div><div class='del'>-	if (flags &amp; IORING_CQE_F_MORE)</div><div class='del'>-		ctx-&gt;cq_extra++;</div><div class='del'>-</div><div class='del'>-	return !(flags &amp; IORING_CQE_F_MORE);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_poll_task_func(struct io_kiocb *req, bool *locked)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-	struct io_kiocb *nxt;</div><div class='del'>-</div><div class='del'>-	if (io_poll_rewait(req, &amp;req-&gt;poll)) {</div><div class='del'>-		spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	} else {</div><div class='del'>-		bool done;</div><div class='del'>-</div><div class='del'>-		if (req-&gt;poll.done) {</div><div class='del'>-			spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-			return;</div><div class='del'>-		}</div><div class='del'>-		done = __io_poll_complete(req, req-&gt;result);</div><div class='del'>-		if (done) {</div><div class='del'>-			io_poll_remove_double(req);</div><div class='del'>-			hash_del(&amp;req-&gt;hash_node);</div><div class='del'>-			req-&gt;poll.done = true;</div><div class='del'>-		} else {</div><div class='del'>-			req-&gt;result = 0;</div><div class='del'>-			add_wait_queue(req-&gt;poll.head, &amp;req-&gt;poll.wait);</div><div class='del'>-		}</div><div class='del'>-		io_commit_cqring(ctx);</div><div class='del'>-		spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-		io_cqring_ev_posted(ctx);</div><div class='del'>-</div><div class='del'>-		if (done) {</div><div class='del'>-			nxt = io_put_req_find_next(req);</div><div class='del'>-			if (nxt)</div><div class='del'>-				io_req_task_submit(nxt, locked);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_poll_double_wake(struct wait_queue_entry *wait, unsigned mode,</div><div class='del'>-			       int sync, void *key)</div><div class='del'>-{</div><div class='del'>-	struct io_kiocb *req = wait-&gt;private;</div><div class='del'>-	struct io_poll_iocb *poll = io_poll_get_single(req);</div><div class='del'>-	__poll_t mask = key_to_poll(key);</div><div class='del'>-	unsigned long flags;</div><div class='del'>-</div><div class='del'>-	/* for instances that support it check for an event match first: */</div><div class='del'>-	if (mask &amp;&amp; !(mask &amp; poll-&gt;events))</div><div class='del'>-		return 0;</div><div class='del'>-	if (!(poll-&gt;events &amp; EPOLLONESHOT))</div><div class='del'>-		return poll-&gt;wait.func(&amp;poll-&gt;wait, mode, sync, key);</div><div class='del'>-</div><div class='del'>-	list_del_init(&amp;wait-&gt;entry);</div><div class='del'>-</div><div class='del'>-	if (poll-&gt;head) {</div><div class='del'>-		bool done;</div><div class='del'>-</div><div class='del'>-		spin_lock_irqsave(&amp;poll-&gt;head-&gt;lock, flags);</div><div class='del'>-		done = list_empty(&amp;poll-&gt;wait.entry);</div><div class='del'>-		if (!done)</div><div class='del'>-			list_del_init(&amp;poll-&gt;wait.entry);</div><div class='del'>-		/* make sure double remove sees this as being gone */</div><div class='del'>-		wait-&gt;private = NULL;</div><div class='del'>-		spin_unlock_irqrestore(&amp;poll-&gt;head-&gt;lock, flags);</div><div class='del'>-		if (!done) {</div><div class='del'>-			/* use wait func handler, so it matches the rq type */</div><div class='del'>-			poll-&gt;wait.func(&amp;poll-&gt;wait, mode, sync, key);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	req_ref_put(req);</div><div class='del'>-	return 1;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_init_poll_iocb(struct io_poll_iocb *poll, __poll_t events,</div><div class='del'>-			      wait_queue_func_t wake_func)</div><div class='del'>-{</div><div class='del'>-	poll-&gt;head = NULL;</div><div class='del'>-	poll-&gt;done = false;</div><div class='del'>-	poll-&gt;canceled = false;</div><div class='del'>-#define IO_POLL_UNMASK	(EPOLLERR|EPOLLHUP|EPOLLNVAL|EPOLLRDHUP)</div><div class='del'>-	/* mask in events that we always want/need */</div><div class='del'>-	poll-&gt;events = events | IO_POLL_UNMASK;</div><div class='del'>-	INIT_LIST_HEAD(&amp;poll-&gt;wait.entry);</div><div class='del'>-	init_waitqueue_func_entry(&amp;poll-&gt;wait, wake_func);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void __io_queue_proc(struct io_poll_iocb *poll, struct io_poll_table *pt,</div><div class='del'>-			    struct wait_queue_head *head,</div><div class='del'>-			    struct io_poll_iocb **poll_ptr)</div><div class='del'>-{</div><div class='del'>-	struct io_kiocb *req = pt-&gt;req;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * The file being polled uses multiple waitqueues for poll handling</div><div class='del'>-	 * (e.g. one for read, one for write). Setup a separate io_poll_iocb</div><div class='del'>-	 * if this happens.</div><div class='del'>-	 */</div><div class='del'>-	if (unlikely(pt-&gt;nr_entries)) {</div><div class='del'>-		struct io_poll_iocb *poll_one = poll;</div><div class='del'>-</div><div class='del'>-		/* double add on the same waitqueue head, ignore */</div><div class='del'>-		if (poll_one-&gt;head == head)</div><div class='del'>-			return;</div><div class='del'>-		/* already have a 2nd entry, fail a third attempt */</div><div class='del'>-		if (*poll_ptr) {</div><div class='del'>-			if ((*poll_ptr)-&gt;head == head)</div><div class='del'>-				return;</div><div class='del'>-			pt-&gt;error = -EINVAL;</div><div class='del'>-			return;</div><div class='del'>-		}</div><div class='del'>-		/*</div><div class='del'>-		 * Can't handle multishot for double wait for now, turn it</div><div class='del'>-		 * into one-shot mode.</div><div class='del'>-		 */</div><div class='del'>-		if (!(poll_one-&gt;events &amp; EPOLLONESHOT))</div><div class='del'>-			poll_one-&gt;events |= EPOLLONESHOT;</div><div class='del'>-		poll = kmalloc(sizeof(*poll), GFP_ATOMIC);</div><div class='del'>-		if (!poll) {</div><div class='del'>-			pt-&gt;error = -ENOMEM;</div><div class='del'>-			return;</div><div class='del'>-		}</div><div class='del'>-		io_init_poll_iocb(poll, poll_one-&gt;events, io_poll_double_wake);</div><div class='del'>-		req_ref_get(req);</div><div class='del'>-		poll-&gt;wait.private = req;</div><div class='del'>-</div><div class='del'>-		*poll_ptr = poll;</div><div class='del'>-		if (req-&gt;opcode == IORING_OP_POLL_ADD)</div><div class='del'>-			req-&gt;flags |= REQ_F_ASYNC_DATA;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	pt-&gt;nr_entries++;</div><div class='del'>-	poll-&gt;head = head;</div><div class='del'>-</div><div class='del'>-	if (poll-&gt;events &amp; EPOLLEXCLUSIVE)</div><div class='del'>-		add_wait_queue_exclusive(head, &amp;poll-&gt;wait);</div><div class='del'>-	else</div><div class='del'>-		add_wait_queue(head, &amp;poll-&gt;wait);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_async_queue_proc(struct file *file, struct wait_queue_head *head,</div><div class='del'>-			       struct poll_table_struct *p)</div><div class='del'>-{</div><div class='del'>-	struct io_poll_table *pt = container_of(p, struct io_poll_table, pt);</div><div class='del'>-	struct async_poll *apoll = pt-&gt;req-&gt;apoll;</div><div class='del'>-</div><div class='del'>-	__io_queue_proc(&amp;apoll-&gt;poll, pt, head, &amp;apoll-&gt;double_poll);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_async_task_func(struct io_kiocb *req, bool *locked)</div><div class='del'>-{</div><div class='del'>-	struct async_poll *apoll = req-&gt;apoll;</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-</div><div class='del'>-	trace_io_uring_task_run(req-&gt;ctx, req, req-&gt;opcode, req-&gt;user_data);</div><div class='del'>-</div><div class='del'>-	if (io_poll_rewait(req, &amp;apoll-&gt;poll)) {</div><div class='del'>-		spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	hash_del(&amp;req-&gt;hash_node);</div><div class='del'>-	io_poll_remove_double(req);</div><div class='del'>-	apoll-&gt;poll.done = true;</div><div class='del'>-	spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-</div><div class='del'>-	if (!READ_ONCE(apoll-&gt;poll.canceled))</div><div class='del'>-		io_req_task_submit(req, locked);</div><div class='del'>-	else</div><div class='del'>-		io_req_complete_failed(req, -ECANCELED);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_async_wake(struct wait_queue_entry *wait, unsigned mode, int sync,</div><div class='del'>-			void *key)</div><div class='del'>-{</div><div class='del'>-	struct io_kiocb *req = wait-&gt;private;</div><div class='del'>-	struct io_poll_iocb *poll = &amp;req-&gt;apoll-&gt;poll;</div><div class='del'>-</div><div class='del'>-	trace_io_uring_poll_wake(req-&gt;ctx, req-&gt;opcode, req-&gt;user_data,</div><div class='del'>-					key_to_poll(key));</div><div class='del'>-</div><div class='del'>-	return __io_async_wake(req, poll, key_to_poll(key), io_async_task_func);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_poll_req_insert(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-	struct hlist_head *list;</div><div class='del'>-</div><div class='del'>-	list = &amp;ctx-&gt;cancel_hash[hash_long(req-&gt;user_data, ctx-&gt;cancel_hash_bits)];</div><div class='del'>-	hlist_add_head(&amp;req-&gt;hash_node, list);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __poll_t __io_arm_poll_handler(struct io_kiocb *req,</div><div class='del'>-				      struct io_poll_iocb *poll,</div><div class='del'>-				      struct io_poll_table *ipt, __poll_t mask,</div><div class='del'>-				      wait_queue_func_t wake_func)</div><div class='del'>-	__acquires(&amp;ctx-&gt;completion_lock)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-	bool cancel = false;</div><div class='del'>-</div><div class='del'>-	INIT_HLIST_NODE(&amp;req-&gt;hash_node);</div><div class='del'>-	io_init_poll_iocb(poll, mask, wake_func);</div><div class='del'>-	poll-&gt;file = req-&gt;file;</div><div class='del'>-	poll-&gt;wait.private = req;</div><div class='del'>-</div><div class='del'>-	ipt-&gt;pt._key = mask;</div><div class='del'>-	ipt-&gt;req = req;</div><div class='del'>-	ipt-&gt;error = 0;</div><div class='del'>-	ipt-&gt;nr_entries = 0;</div><div class='del'>-</div><div class='del'>-	mask = vfs_poll(req-&gt;file, &amp;ipt-&gt;pt) &amp; poll-&gt;events;</div><div class='del'>-	if (unlikely(!ipt-&gt;nr_entries) &amp;&amp; !ipt-&gt;error)</div><div class='del'>-		ipt-&gt;error = -EINVAL;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	if (ipt-&gt;error || (mask &amp;&amp; (poll-&gt;events &amp; EPOLLONESHOT)))</div><div class='del'>-		io_poll_remove_double(req);</div><div class='del'>-	if (likely(poll-&gt;head)) {</div><div class='del'>-		spin_lock_irq(&amp;poll-&gt;head-&gt;lock);</div><div class='del'>-		if (unlikely(list_empty(&amp;poll-&gt;wait.entry))) {</div><div class='del'>-			if (ipt-&gt;error)</div><div class='del'>-				cancel = true;</div><div class='del'>-			ipt-&gt;error = 0;</div><div class='del'>-			mask = 0;</div><div class='del'>-		}</div><div class='del'>-		if ((mask &amp;&amp; (poll-&gt;events &amp; EPOLLONESHOT)) || ipt-&gt;error)</div><div class='del'>-			list_del_init(&amp;poll-&gt;wait.entry);</div><div class='del'>-		else if (cancel)</div><div class='del'>-			WRITE_ONCE(poll-&gt;canceled, true);</div><div class='del'>-		else if (!poll-&gt;done) /* actually waiting for an event */</div><div class='del'>-			io_poll_req_insert(req);</div><div class='del'>-		spin_unlock_irq(&amp;poll-&gt;head-&gt;lock);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return mask;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-enum {</div><div class='del'>-	IO_APOLL_OK,</div><div class='del'>-	IO_APOLL_ABORTED,</div><div class='del'>-	IO_APOLL_READY</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static int io_arm_poll_handler(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	const struct io_op_def *def = &amp;io_op_defs[req-&gt;opcode];</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-	struct async_poll *apoll;</div><div class='del'>-	struct io_poll_table ipt;</div><div class='del'>-	__poll_t ret, mask = EPOLLONESHOT | POLLERR | POLLPRI;</div><div class='del'>-</div><div class='del'>-	if (!def-&gt;pollin &amp;&amp; !def-&gt;pollout)</div><div class='del'>-		return IO_APOLL_ABORTED;</div><div class='del'>-	if (!file_can_poll(req-&gt;file) || (req-&gt;flags &amp; REQ_F_POLLED))</div><div class='del'>-		return IO_APOLL_ABORTED;</div><div class='del'>-</div><div class='del'>-	if (def-&gt;pollin) {</div><div class='del'>-		mask |= POLLIN | POLLRDNORM;</div><div class='del'>-</div><div class='del'>-		/* If reading from MSG_ERRQUEUE using recvmsg, ignore POLLIN */</div><div class='del'>-		if ((req-&gt;opcode == IORING_OP_RECVMSG) &amp;&amp;</div><div class='del'>-		    (req-&gt;sr_msg.msg_flags &amp; MSG_ERRQUEUE))</div><div class='del'>-			mask &amp;= ~POLLIN;</div><div class='del'>-	} else {</div><div class='del'>-		mask |= POLLOUT | POLLWRNORM;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	apoll = kmalloc(sizeof(*apoll), GFP_ATOMIC);</div><div class='del'>-	if (unlikely(!apoll))</div><div class='del'>-		return IO_APOLL_ABORTED;</div><div class='del'>-	apoll-&gt;double_poll = NULL;</div><div class='del'>-	req-&gt;apoll = apoll;</div><div class='del'>-	req-&gt;flags |= REQ_F_POLLED;</div><div class='del'>-	ipt.pt._qproc = io_async_queue_proc;</div><div class='del'>-	io_req_set_refcount(req);</div><div class='del'>-</div><div class='del'>-	ret = __io_arm_poll_handler(req, &amp;apoll-&gt;poll, &amp;ipt, mask,</div><div class='del'>-					io_async_wake);</div><div class='del'>-	spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	if (ret || ipt.error)</div><div class='del'>-		return ret ? IO_APOLL_READY : IO_APOLL_ABORTED;</div><div class='del'>-</div><div class='del'>-	trace_io_uring_poll_arm(ctx, req, req-&gt;opcode, req-&gt;user_data,</div><div class='del'>-				mask, apoll-&gt;poll.events);</div><div class='del'>-	return IO_APOLL_OK;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool __io_poll_remove_one(struct io_kiocb *req,</div><div class='del'>-				 struct io_poll_iocb *poll, bool do_cancel)</div><div class='del'>-	__must_hold(&amp;req-&gt;ctx-&gt;completion_lock)</div><div class='del'>-{</div><div class='del'>-	bool do_complete = false;</div><div class='del'>-</div><div class='del'>-	if (!poll-&gt;head)</div><div class='del'>-		return false;</div><div class='del'>-	spin_lock_irq(&amp;poll-&gt;head-&gt;lock);</div><div class='del'>-	if (do_cancel)</div><div class='del'>-		WRITE_ONCE(poll-&gt;canceled, true);</div><div class='del'>-	if (!list_empty(&amp;poll-&gt;wait.entry)) {</div><div class='del'>-		list_del_init(&amp;poll-&gt;wait.entry);</div><div class='del'>-		do_complete = true;</div><div class='del'>-	}</div><div class='del'>-	spin_unlock_irq(&amp;poll-&gt;head-&gt;lock);</div><div class='del'>-	hash_del(&amp;req-&gt;hash_node);</div><div class='del'>-	return do_complete;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool io_poll_remove_one(struct io_kiocb *req)</div><div class='del'>-	__must_hold(&amp;req-&gt;ctx-&gt;completion_lock)</div><div class='del'>-{</div><div class='del'>-	bool do_complete;</div><div class='del'>-</div><div class='del'>-	io_poll_remove_double(req);</div><div class='del'>-	do_complete = __io_poll_remove_one(req, io_poll_get_single(req), true);</div><div class='del'>-</div><div class='del'>-	if (do_complete) {</div><div class='del'>-		io_cqring_fill_event(req-&gt;ctx, req-&gt;user_data, -ECANCELED, 0);</div><div class='del'>-		io_commit_cqring(req-&gt;ctx);</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-		io_put_req_deferred(req);</div><div class='del'>-	}</div><div class='del'>-	return do_complete;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Returns true if we found and killed one or more poll requests</div><div class='del'>- */</div><div class='del'>-static __cold bool io_poll_remove_all(struct io_ring_ctx *ctx,</div><div class='del'>-				      struct task_struct *tsk, bool cancel_all)</div><div class='del'>-{</div><div class='del'>-	struct hlist_node *tmp;</div><div class='del'>-	struct io_kiocb *req;</div><div class='del'>-	int posted = 0, i;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	for (i = 0; i &lt; (1U &lt;&lt; ctx-&gt;cancel_hash_bits); i++) {</div><div class='del'>-		struct hlist_head *list;</div><div class='del'>-</div><div class='del'>-		list = &amp;ctx-&gt;cancel_hash[i];</div><div class='del'>-		hlist_for_each_entry_safe(req, tmp, list, hash_node) {</div><div class='del'>-			if (io_match_task(req, tsk, cancel_all))</div><div class='del'>-				posted += io_poll_remove_one(req);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-</div><div class='del'>-	if (posted)</div><div class='del'>-		io_cqring_ev_posted(ctx);</div><div class='del'>-</div><div class='del'>-	return posted != 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct io_kiocb *io_poll_find(struct io_ring_ctx *ctx, __u64 sqe_addr,</div><div class='del'>-				     bool poll_only)</div><div class='del'>-	__must_hold(&amp;ctx-&gt;completion_lock)</div><div class='del'>-{</div><div class='del'>-	struct hlist_head *list;</div><div class='del'>-	struct io_kiocb *req;</div><div class='del'>-</div><div class='del'>-	list = &amp;ctx-&gt;cancel_hash[hash_long(sqe_addr, ctx-&gt;cancel_hash_bits)];</div><div class='del'>-	hlist_for_each_entry(req, list, hash_node) {</div><div class='del'>-		if (sqe_addr != req-&gt;user_data)</div><div class='del'>-			continue;</div><div class='del'>-		if (poll_only &amp;&amp; req-&gt;opcode != IORING_OP_POLL_ADD)</div><div class='del'>-			continue;</div><div class='del'>-		return req;</div><div class='del'>-	}</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_poll_cancel(struct io_ring_ctx *ctx, __u64 sqe_addr,</div><div class='del'>-			  bool poll_only)</div><div class='del'>-	__must_hold(&amp;ctx-&gt;completion_lock)</div><div class='del'>-{</div><div class='del'>-	struct io_kiocb *req;</div><div class='del'>-</div><div class='del'>-	req = io_poll_find(ctx, sqe_addr, poll_only);</div><div class='del'>-	if (!req)</div><div class='del'>-		return -ENOENT;</div><div class='del'>-	if (io_poll_remove_one(req))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	return -EALREADY;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __poll_t io_poll_parse_events(const struct io_uring_sqe *sqe,</div><div class='del'>-				     unsigned int flags)</div><div class='del'>-{</div><div class='del'>-	u32 events;</div><div class='del'>-</div><div class='del'>-	events = READ_ONCE(sqe-&gt;poll32_events);</div><div class='del'>-#ifdef __BIG_ENDIAN</div><div class='del'>-	events = swahw32(events);</div><div class='del'>-#endif</div><div class='del'>-	if (!(flags &amp; IORING_POLL_ADD_MULTI))</div><div class='del'>-		events |= EPOLLONESHOT;</div><div class='del'>-	return demangle_poll(events) | (events &amp; (EPOLLEXCLUSIVE|EPOLLONESHOT));</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_poll_update_prep(struct io_kiocb *req,</div><div class='del'>-			       const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	struct io_poll_update *upd = &amp;req-&gt;poll_update;</div><div class='del'>-	u32 flags;</div><div class='del'>-</div><div class='del'>-	if (unlikely(req-&gt;ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (sqe-&gt;ioprio || sqe-&gt;buf_index || sqe-&gt;splice_fd_in)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	flags = READ_ONCE(sqe-&gt;len);</div><div class='del'>-	if (flags &amp; ~(IORING_POLL_UPDATE_EVENTS | IORING_POLL_UPDATE_USER_DATA |</div><div class='del'>-		      IORING_POLL_ADD_MULTI))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	/* meaningless without update */</div><div class='del'>-	if (flags == IORING_POLL_ADD_MULTI)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	upd-&gt;old_user_data = READ_ONCE(sqe-&gt;addr);</div><div class='del'>-	upd-&gt;update_events = flags &amp; IORING_POLL_UPDATE_EVENTS;</div><div class='del'>-	upd-&gt;update_user_data = flags &amp; IORING_POLL_UPDATE_USER_DATA;</div><div class='del'>-</div><div class='del'>-	upd-&gt;new_user_data = READ_ONCE(sqe-&gt;off);</div><div class='del'>-	if (!upd-&gt;update_user_data &amp;&amp; upd-&gt;new_user_data)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (upd-&gt;update_events)</div><div class='del'>-		upd-&gt;events = io_poll_parse_events(sqe, flags);</div><div class='del'>-	else if (sqe-&gt;poll32_events)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_poll_wake(struct wait_queue_entry *wait, unsigned mode, int sync,</div><div class='del'>-			void *key)</div><div class='del'>-{</div><div class='del'>-	struct io_kiocb *req = wait-&gt;private;</div><div class='del'>-	struct io_poll_iocb *poll = &amp;req-&gt;poll;</div><div class='del'>-</div><div class='del'>-	return __io_async_wake(req, poll, key_to_poll(key), io_poll_task_func);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_poll_queue_proc(struct file *file, struct wait_queue_head *head,</div><div class='del'>-			       struct poll_table_struct *p)</div><div class='del'>-{</div><div class='del'>-	struct io_poll_table *pt = container_of(p, struct io_poll_table, pt);</div><div class='del'>-</div><div class='del'>-	__io_queue_proc(&amp;pt-&gt;req-&gt;poll, pt, head, (struct io_poll_iocb **) &amp;pt-&gt;req-&gt;async_data);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_poll_add_prep(struct io_kiocb *req, const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	struct io_poll_iocb *poll = &amp;req-&gt;poll;</div><div class='del'>-	u32 flags;</div><div class='del'>-</div><div class='del'>-	if (unlikely(req-&gt;ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (sqe-&gt;ioprio || sqe-&gt;buf_index || sqe-&gt;off || sqe-&gt;addr)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	flags = READ_ONCE(sqe-&gt;len);</div><div class='del'>-	if (flags &amp; ~IORING_POLL_ADD_MULTI)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	io_req_set_refcount(req);</div><div class='del'>-	poll-&gt;events = io_poll_parse_events(sqe, flags);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_poll_add(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_poll_iocb *poll = &amp;req-&gt;poll;</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-	struct io_poll_table ipt;</div><div class='del'>-	__poll_t mask;</div><div class='del'>-	bool done;</div><div class='del'>-</div><div class='del'>-	ipt.pt._qproc = io_poll_queue_proc;</div><div class='del'>-</div><div class='del'>-	mask = __io_arm_poll_handler(req, &amp;req-&gt;poll, &amp;ipt, poll-&gt;events,</div><div class='del'>-					io_poll_wake);</div><div class='del'>-</div><div class='del'>-	if (mask) { /* no async, we'd stolen it */</div><div class='del'>-		ipt.error = 0;</div><div class='del'>-		done = __io_poll_complete(req, mask);</div><div class='del'>-		io_commit_cqring(req-&gt;ctx);</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-</div><div class='del'>-	if (mask) {</div><div class='del'>-		io_cqring_ev_posted(ctx);</div><div class='del'>-		if (done)</div><div class='del'>-			io_put_req(req);</div><div class='del'>-	}</div><div class='del'>-	return ipt.error;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_poll_update(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-	struct io_kiocb *preq;</div><div class='del'>-	bool completing;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	preq = io_poll_find(ctx, req-&gt;poll_update.old_user_data, true);</div><div class='del'>-	if (!preq) {</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-		goto err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!req-&gt;poll_update.update_events &amp;&amp; !req-&gt;poll_update.update_user_data) {</div><div class='del'>-		completing = true;</div><div class='del'>-		ret = io_poll_remove_one(preq) ? 0 : -EALREADY;</div><div class='del'>-		goto err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Don't allow racy completion with singleshot, as we cannot safely</div><div class='del'>-	 * update those. For multishot, if we're racing with completion, just</div><div class='del'>-	 * let completion re-add it.</div><div class='del'>-	 */</div><div class='del'>-	completing = !__io_poll_remove_one(preq, &amp;preq-&gt;poll, false);</div><div class='del'>-	if (completing &amp;&amp; (preq-&gt;poll.events &amp; EPOLLONESHOT)) {</div><div class='del'>-		ret = -EALREADY;</div><div class='del'>-		goto err;</div><div class='del'>-	}</div><div class='del'>-	/* we now have a detached poll request. reissue. */</div><div class='del'>-	ret = 0;</div><div class='del'>-err:</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-		io_req_complete(req, ret);</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-	/* only mask one event flags, keep behavior flags */</div><div class='del'>-	if (req-&gt;poll_update.update_events) {</div><div class='del'>-		preq-&gt;poll.events &amp;= ~0xffff;</div><div class='del'>-		preq-&gt;poll.events |= req-&gt;poll_update.events &amp; 0xffff;</div><div class='del'>-		preq-&gt;poll.events |= IO_POLL_UNMASK;</div><div class='del'>-	}</div><div class='del'>-	if (req-&gt;poll_update.update_user_data)</div><div class='del'>-		preq-&gt;user_data = req-&gt;poll_update.new_user_data;</div><div class='del'>-	spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-</div><div class='del'>-	/* complete update request, we're done with it */</div><div class='del'>-	io_req_complete(req, ret);</div><div class='del'>-</div><div class='del'>-	if (!completing) {</div><div class='del'>-		ret = io_poll_add(preq, issue_flags);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			req_set_fail(preq);</div><div class='del'>-			io_req_complete(preq, ret);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_req_task_timeout(struct io_kiocb *req, bool *locked)</div><div class='del'>-{</div><div class='del'>-	struct io_timeout_data *data = req-&gt;async_data;</div><div class='del'>-</div><div class='del'>-	if (!(data-&gt;flags &amp; IORING_TIMEOUT_ETIME_SUCCESS))</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-	io_req_complete_post(req, -ETIME, 0);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static enum hrtimer_restart io_timeout_fn(struct hrtimer *timer)</div><div class='del'>-{</div><div class='del'>-	struct io_timeout_data *data = container_of(timer,</div><div class='del'>-						struct io_timeout_data, timer);</div><div class='del'>-	struct io_kiocb *req = data-&gt;req;</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-	unsigned long flags;</div><div class='del'>-</div><div class='del'>-	spin_lock_irqsave(&amp;ctx-&gt;timeout_lock, flags);</div><div class='del'>-	list_del_init(&amp;req-&gt;timeout.list);</div><div class='del'>-	atomic_set(&amp;req-&gt;ctx-&gt;cq_timeouts,</div><div class='del'>-		atomic_read(&amp;req-&gt;ctx-&gt;cq_timeouts) + 1);</div><div class='del'>-	spin_unlock_irqrestore(&amp;ctx-&gt;timeout_lock, flags);</div><div class='del'>-</div><div class='del'>-	req-&gt;io_task_work.func = io_req_task_timeout;</div><div class='del'>-	io_req_task_work_add(req);</div><div class='del'>-	return HRTIMER_NORESTART;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct io_kiocb *io_timeout_extract(struct io_ring_ctx *ctx,</div><div class='del'>-					   __u64 user_data)</div><div class='del'>-	__must_hold(&amp;ctx-&gt;timeout_lock)</div><div class='del'>-{</div><div class='del'>-	struct io_timeout_data *io;</div><div class='del'>-	struct io_kiocb *req;</div><div class='del'>-	bool found = false;</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(req, &amp;ctx-&gt;timeout_list, timeout.list) {</div><div class='del'>-		found = user_data == req-&gt;user_data;</div><div class='del'>-		if (found)</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-	if (!found)</div><div class='del'>-		return ERR_PTR(-ENOENT);</div><div class='del'>-</div><div class='del'>-	io = req-&gt;async_data;</div><div class='del'>-	if (hrtimer_try_to_cancel(&amp;io-&gt;timer) == -1)</div><div class='del'>-		return ERR_PTR(-EALREADY);</div><div class='del'>-	list_del_init(&amp;req-&gt;timeout.list);</div><div class='del'>-	return req;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_timeout_cancel(struct io_ring_ctx *ctx, __u64 user_data)</div><div class='del'>-	__must_hold(&amp;ctx-&gt;completion_lock)</div><div class='del'>-	__must_hold(&amp;ctx-&gt;timeout_lock)</div><div class='del'>-{</div><div class='del'>-	struct io_kiocb *req = io_timeout_extract(ctx, user_data);</div><div class='del'>-</div><div class='del'>-	if (IS_ERR(req))</div><div class='del'>-		return PTR_ERR(req);</div><div class='del'>-</div><div class='del'>-	req_set_fail(req);</div><div class='del'>-	io_cqring_fill_event(ctx, req-&gt;user_data, -ECANCELED, 0);</div><div class='del'>-	io_put_req_deferred(req);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static clockid_t io_timeout_get_clock(struct io_timeout_data *data)</div><div class='del'>-{</div><div class='del'>-	switch (data-&gt;flags &amp; IORING_TIMEOUT_CLOCK_MASK) {</div><div class='del'>-	case IORING_TIMEOUT_BOOTTIME:</div><div class='del'>-		return CLOCK_BOOTTIME;</div><div class='del'>-	case IORING_TIMEOUT_REALTIME:</div><div class='del'>-		return CLOCK_REALTIME;</div><div class='del'>-	default:</div><div class='del'>-		/* can't happen, vetted at prep time */</div><div class='del'>-		WARN_ON_ONCE(1);</div><div class='del'>-		fallthrough;</div><div class='del'>-	case 0:</div><div class='del'>-		return CLOCK_MONOTONIC;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_linked_timeout_update(struct io_ring_ctx *ctx, __u64 user_data,</div><div class='del'>-				    struct timespec64 *ts, enum hrtimer_mode mode)</div><div class='del'>-	__must_hold(&amp;ctx-&gt;timeout_lock)</div><div class='del'>-{</div><div class='del'>-	struct io_timeout_data *io;</div><div class='del'>-	struct io_kiocb *req;</div><div class='del'>-	bool found = false;</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(req, &amp;ctx-&gt;ltimeout_list, timeout.list) {</div><div class='del'>-		found = user_data == req-&gt;user_data;</div><div class='del'>-		if (found)</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-	if (!found)</div><div class='del'>-		return -ENOENT;</div><div class='del'>-</div><div class='del'>-	io = req-&gt;async_data;</div><div class='del'>-	if (hrtimer_try_to_cancel(&amp;io-&gt;timer) == -1)</div><div class='del'>-		return -EALREADY;</div><div class='del'>-	hrtimer_init(&amp;io-&gt;timer, io_timeout_get_clock(io), mode);</div><div class='del'>-	io-&gt;timer.function = io_link_timeout_fn;</div><div class='del'>-	hrtimer_start(&amp;io-&gt;timer, timespec64_to_ktime(*ts), mode);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_timeout_update(struct io_ring_ctx *ctx, __u64 user_data,</div><div class='del'>-			     struct timespec64 *ts, enum hrtimer_mode mode)</div><div class='del'>-	__must_hold(&amp;ctx-&gt;timeout_lock)</div><div class='del'>-{</div><div class='del'>-	struct io_kiocb *req = io_timeout_extract(ctx, user_data);</div><div class='del'>-	struct io_timeout_data *data;</div><div class='del'>-</div><div class='del'>-	if (IS_ERR(req))</div><div class='del'>-		return PTR_ERR(req);</div><div class='del'>-</div><div class='del'>-	req-&gt;timeout.off = 0; /* noseq */</div><div class='del'>-	data = req-&gt;async_data;</div><div class='del'>-	list_add_tail(&amp;req-&gt;timeout.list, &amp;ctx-&gt;timeout_list);</div><div class='del'>-	hrtimer_init(&amp;data-&gt;timer, io_timeout_get_clock(data), mode);</div><div class='del'>-	data-&gt;timer.function = io_timeout_fn;</div><div class='del'>-	hrtimer_start(&amp;data-&gt;timer, timespec64_to_ktime(*ts), mode);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_timeout_remove_prep(struct io_kiocb *req,</div><div class='del'>-				  const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	struct io_timeout_rem *tr = &amp;req-&gt;timeout_rem;</div><div class='del'>-</div><div class='del'>-	if (unlikely(req-&gt;ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (unlikely(req-&gt;flags &amp; (REQ_F_FIXED_FILE | REQ_F_BUFFER_SELECT)))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (sqe-&gt;ioprio || sqe-&gt;buf_index || sqe-&gt;len || sqe-&gt;splice_fd_in)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	tr-&gt;ltimeout = false;</div><div class='del'>-	tr-&gt;addr = READ_ONCE(sqe-&gt;addr);</div><div class='del'>-	tr-&gt;flags = READ_ONCE(sqe-&gt;timeout_flags);</div><div class='del'>-	if (tr-&gt;flags &amp; IORING_TIMEOUT_UPDATE_MASK) {</div><div class='del'>-		if (hweight32(tr-&gt;flags &amp; IORING_TIMEOUT_CLOCK_MASK) &gt; 1)</div><div class='del'>-			return -EINVAL;</div><div class='del'>-		if (tr-&gt;flags &amp; IORING_LINK_TIMEOUT_UPDATE)</div><div class='del'>-			tr-&gt;ltimeout = true;</div><div class='del'>-		if (tr-&gt;flags &amp; ~(IORING_TIMEOUT_UPDATE_MASK|IORING_TIMEOUT_ABS))</div><div class='del'>-			return -EINVAL;</div><div class='del'>-		if (get_timespec64(&amp;tr-&gt;ts, u64_to_user_ptr(sqe-&gt;addr2)))</div><div class='del'>-			return -EFAULT;</div><div class='del'>-	} else if (tr-&gt;flags) {</div><div class='del'>-		/* timeout removal doesn't support flags */</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline enum hrtimer_mode io_translate_timeout_mode(unsigned int flags)</div><div class='del'>-{</div><div class='del'>-	return (flags &amp; IORING_TIMEOUT_ABS) ? HRTIMER_MODE_ABS</div><div class='del'>-					    : HRTIMER_MODE_REL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Remove or update an existing timeout command</div><div class='del'>- */</div><div class='del'>-static int io_timeout_remove(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_timeout_rem *tr = &amp;req-&gt;timeout_rem;</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (!(req-&gt;timeout_rem.flags &amp; IORING_TIMEOUT_UPDATE)) {</div><div class='del'>-		spin_lock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-		spin_lock_irq(&amp;ctx-&gt;timeout_lock);</div><div class='del'>-		ret = io_timeout_cancel(ctx, tr-&gt;addr);</div><div class='del'>-		spin_unlock_irq(&amp;ctx-&gt;timeout_lock);</div><div class='del'>-		spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	} else {</div><div class='del'>-		enum hrtimer_mode mode = io_translate_timeout_mode(tr-&gt;flags);</div><div class='del'>-</div><div class='del'>-		spin_lock_irq(&amp;ctx-&gt;timeout_lock);</div><div class='del'>-		if (tr-&gt;ltimeout)</div><div class='del'>-			ret = io_linked_timeout_update(ctx, tr-&gt;addr, &amp;tr-&gt;ts, mode);</div><div class='del'>-		else</div><div class='del'>-			ret = io_timeout_update(ctx, tr-&gt;addr, &amp;tr-&gt;ts, mode);</div><div class='del'>-		spin_unlock_irq(&amp;ctx-&gt;timeout_lock);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-	io_req_complete_post(req, ret, 0);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_timeout_prep(struct io_kiocb *req, const struct io_uring_sqe *sqe,</div><div class='del'>-			   bool is_timeout_link)</div><div class='del'>-{</div><div class='del'>-	struct io_timeout_data *data;</div><div class='del'>-	unsigned flags;</div><div class='del'>-	u32 off = READ_ONCE(sqe-&gt;off);</div><div class='del'>-</div><div class='del'>-	if (unlikely(req-&gt;ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (sqe-&gt;ioprio || sqe-&gt;buf_index || sqe-&gt;len != 1 ||</div><div class='del'>-	    sqe-&gt;splice_fd_in)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (off &amp;&amp; is_timeout_link)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	flags = READ_ONCE(sqe-&gt;timeout_flags);</div><div class='del'>-	if (flags &amp; ~(IORING_TIMEOUT_ABS | IORING_TIMEOUT_CLOCK_MASK |</div><div class='del'>-		      IORING_TIMEOUT_ETIME_SUCCESS))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	/* more than one clock specified is invalid, obviously */</div><div class='del'>-	if (hweight32(flags &amp; IORING_TIMEOUT_CLOCK_MASK) &gt; 1)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	INIT_LIST_HEAD(&amp;req-&gt;timeout.list);</div><div class='del'>-	req-&gt;timeout.off = off;</div><div class='del'>-	if (unlikely(off &amp;&amp; !req-&gt;ctx-&gt;off_timeout_used))</div><div class='del'>-		req-&gt;ctx-&gt;off_timeout_used = true;</div><div class='del'>-</div><div class='del'>-	if (WARN_ON_ONCE(req_has_async_data(req)))</div><div class='del'>-		return -EFAULT;</div><div class='del'>-	if (io_alloc_async_data(req))</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	data = req-&gt;async_data;</div><div class='del'>-	data-&gt;req = req;</div><div class='del'>-	data-&gt;flags = flags;</div><div class='del'>-</div><div class='del'>-	if (get_timespec64(&amp;data-&gt;ts, u64_to_user_ptr(sqe-&gt;addr)))</div><div class='del'>-		return -EFAULT;</div><div class='del'>-</div><div class='del'>-	data-&gt;mode = io_translate_timeout_mode(flags);</div><div class='del'>-	hrtimer_init(&amp;data-&gt;timer, io_timeout_get_clock(data), data-&gt;mode);</div><div class='del'>-</div><div class='del'>-	if (is_timeout_link) {</div><div class='del'>-		struct io_submit_link *link = &amp;req-&gt;ctx-&gt;submit_state.link;</div><div class='del'>-</div><div class='del'>-		if (!link-&gt;head)</div><div class='del'>-			return -EINVAL;</div><div class='del'>-		if (link-&gt;last-&gt;opcode == IORING_OP_LINK_TIMEOUT)</div><div class='del'>-			return -EINVAL;</div><div class='del'>-		req-&gt;timeout.head = link-&gt;last;</div><div class='del'>-		link-&gt;last-&gt;flags |= REQ_F_ARM_LTIMEOUT;</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_timeout(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-	struct io_timeout_data *data = req-&gt;async_data;</div><div class='del'>-	struct list_head *entry;</div><div class='del'>-	u32 tail, off = req-&gt;timeout.off;</div><div class='del'>-</div><div class='del'>-	spin_lock_irq(&amp;ctx-&gt;timeout_lock);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * sqe-&gt;off holds how many events that need to occur for this</div><div class='del'>-	 * timeout event to be satisfied. If it isn't set, then this is</div><div class='del'>-	 * a pure timeout request, sequence isn't used.</div><div class='del'>-	 */</div><div class='del'>-	if (io_is_timeout_noseq(req)) {</div><div class='del'>-		entry = ctx-&gt;timeout_list.prev;</div><div class='del'>-		goto add;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	tail = ctx-&gt;cached_cq_tail - atomic_read(&amp;ctx-&gt;cq_timeouts);</div><div class='del'>-	req-&gt;timeout.target_seq = tail + off;</div><div class='del'>-</div><div class='del'>-	/* Update the last seq here in case io_flush_timeouts() hasn't.</div><div class='del'>-	 * This is safe because -&gt;completion_lock is held, and submissions</div><div class='del'>-	 * and completions are never mixed in the same -&gt;completion_lock section.</div><div class='del'>-	 */</div><div class='del'>-	ctx-&gt;cq_last_tm_flush = tail;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Insertion sort, ensuring the first entry in the list is always</div><div class='del'>-	 * the one we need first.</div><div class='del'>-	 */</div><div class='del'>-	list_for_each_prev(entry, &amp;ctx-&gt;timeout_list) {</div><div class='del'>-		struct io_kiocb *nxt = list_entry(entry, struct io_kiocb,</div><div class='del'>-						  timeout.list);</div><div class='del'>-</div><div class='del'>-		if (io_is_timeout_noseq(nxt))</div><div class='del'>-			continue;</div><div class='del'>-		/* nxt.seq is behind @tail, otherwise would've been completed */</div><div class='del'>-		if (off &gt;= nxt-&gt;timeout.target_seq - tail)</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-add:</div><div class='del'>-	list_add(&amp;req-&gt;timeout.list, entry);</div><div class='del'>-	data-&gt;timer.function = io_timeout_fn;</div><div class='del'>-	hrtimer_start(&amp;data-&gt;timer, timespec64_to_ktime(data-&gt;ts), data-&gt;mode);</div><div class='del'>-	spin_unlock_irq(&amp;ctx-&gt;timeout_lock);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct io_cancel_data {</div><div class='del'>-	struct io_ring_ctx *ctx;</div><div class='del'>-	u64 user_data;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static bool io_cancel_cb(struct io_wq_work *work, void *data)</div><div class='del'>-{</div><div class='del'>-	struct io_kiocb *req = container_of(work, struct io_kiocb, work);</div><div class='del'>-	struct io_cancel_data *cd = data;</div><div class='del'>-</div><div class='del'>-	return req-&gt;ctx == cd-&gt;ctx &amp;&amp; req-&gt;user_data == cd-&gt;user_data;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_async_cancel_one(struct io_uring_task *tctx, u64 user_data,</div><div class='del'>-			       struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	struct io_cancel_data data = { .ctx = ctx, .user_data = user_data, };</div><div class='del'>-	enum io_wq_cancel cancel_ret;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	if (!tctx || !tctx-&gt;io_wq)</div><div class='del'>-		return -ENOENT;</div><div class='del'>-</div><div class='del'>-	cancel_ret = io_wq_cancel_cb(tctx-&gt;io_wq, io_cancel_cb, &amp;data, false);</div><div class='del'>-	switch (cancel_ret) {</div><div class='del'>-	case IO_WQ_CANCEL_OK:</div><div class='del'>-		ret = 0;</div><div class='del'>-		break;</div><div class='del'>-	case IO_WQ_CANCEL_RUNNING:</div><div class='del'>-		ret = -EALREADY;</div><div class='del'>-		break;</div><div class='del'>-	case IO_WQ_CANCEL_NOTFOUND:</div><div class='del'>-		ret = -ENOENT;</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_try_cancel_userdata(struct io_kiocb *req, u64 sqe_addr)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	WARN_ON_ONCE(!io_wq_current_is_worker() &amp;&amp; req-&gt;task != current);</div><div class='del'>-</div><div class='del'>-	ret = io_async_cancel_one(req-&gt;task-&gt;io_uring, sqe_addr, ctx);</div><div class='del'>-	if (ret != -ENOENT)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	spin_lock_irq(&amp;ctx-&gt;timeout_lock);</div><div class='del'>-	ret = io_timeout_cancel(ctx, sqe_addr);</div><div class='del'>-	spin_unlock_irq(&amp;ctx-&gt;timeout_lock);</div><div class='del'>-	if (ret != -ENOENT)</div><div class='del'>-		goto out;</div><div class='del'>-	ret = io_poll_cancel(ctx, sqe_addr, false);</div><div class='del'>-out:</div><div class='del'>-	spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_async_cancel_prep(struct io_kiocb *req,</div><div class='del'>-				const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	if (unlikely(req-&gt;ctx-&gt;flags &amp; IORING_SETUP_IOPOLL))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (unlikely(req-&gt;flags &amp; (REQ_F_FIXED_FILE | REQ_F_BUFFER_SELECT)))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (sqe-&gt;ioprio || sqe-&gt;off || sqe-&gt;len || sqe-&gt;cancel_flags ||</div><div class='del'>-	    sqe-&gt;splice_fd_in)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	req-&gt;cancel.addr = READ_ONCE(sqe-&gt;addr);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_async_cancel(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-	u64 sqe_addr = req-&gt;cancel.addr;</div><div class='del'>-	bool needs_lock = issue_flags &amp; IO_URING_F_UNLOCKED;</div><div class='del'>-	struct io_tctx_node *node;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ret = io_try_cancel_userdata(req, sqe_addr);</div><div class='del'>-	if (ret != -ENOENT)</div><div class='del'>-		goto done;</div><div class='del'>-</div><div class='del'>-	/* slow path, try all io-wq's */</div><div class='del'>-	io_ring_submit_lock(ctx, needs_lock);</div><div class='del'>-	ret = -ENOENT;</div><div class='del'>-	list_for_each_entry(node, &amp;ctx-&gt;tctx_list, ctx_node) {</div><div class='del'>-		struct io_uring_task *tctx = node-&gt;task-&gt;io_uring;</div><div class='del'>-</div><div class='del'>-		ret = io_async_cancel_one(tctx, req-&gt;cancel.addr, ctx);</div><div class='del'>-		if (ret != -ENOENT)</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-	io_ring_submit_unlock(ctx, needs_lock);</div><div class='del'>-done:</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-	io_req_complete_post(req, ret, 0);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_rsrc_update_prep(struct io_kiocb *req,</div><div class='del'>-				const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	if (unlikely(req-&gt;flags &amp; (REQ_F_FIXED_FILE | REQ_F_BUFFER_SELECT)))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (sqe-&gt;ioprio || sqe-&gt;rw_flags || sqe-&gt;splice_fd_in)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	req-&gt;rsrc_update.offset = READ_ONCE(sqe-&gt;off);</div><div class='del'>-	req-&gt;rsrc_update.nr_args = READ_ONCE(sqe-&gt;len);</div><div class='del'>-	if (!req-&gt;rsrc_update.nr_args)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	req-&gt;rsrc_update.arg = READ_ONCE(sqe-&gt;addr);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_files_update(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-	bool needs_lock = issue_flags &amp; IO_URING_F_UNLOCKED;</div><div class='del'>-	struct io_uring_rsrc_update2 up;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	up.offset = req-&gt;rsrc_update.offset;</div><div class='del'>-	up.data = req-&gt;rsrc_update.arg;</div><div class='del'>-	up.nr = 0;</div><div class='del'>-	up.tags = 0;</div><div class='del'>-	up.resv = 0;</div><div class='del'>-</div><div class='del'>-	io_ring_submit_lock(ctx, needs_lock);</div><div class='del'>-	ret = __io_register_rsrc_update(ctx, IORING_RSRC_FILE,</div><div class='del'>-					&amp;up, req-&gt;rsrc_update.nr_args);</div><div class='del'>-	io_ring_submit_unlock(ctx, needs_lock);</div><div class='del'>-</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		req_set_fail(req);</div><div class='del'>-	__io_req_complete(req, issue_flags, ret, 0);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_req_prep(struct io_kiocb *req, const struct io_uring_sqe *sqe)</div><div class='del'>-{</div><div class='del'>-	switch (req-&gt;opcode) {</div><div class='del'>-	case IORING_OP_NOP:</div><div class='del'>-		return 0;</div><div class='del'>-	case IORING_OP_READV:</div><div class='del'>-	case IORING_OP_READ_FIXED:</div><div class='del'>-	case IORING_OP_READ:</div><div class='del'>-		return io_read_prep(req, sqe);</div><div class='del'>-	case IORING_OP_WRITEV:</div><div class='del'>-	case IORING_OP_WRITE_FIXED:</div><div class='del'>-	case IORING_OP_WRITE:</div><div class='del'>-		return io_write_prep(req, sqe);</div><div class='del'>-	case IORING_OP_POLL_ADD:</div><div class='del'>-		return io_poll_add_prep(req, sqe);</div><div class='del'>-	case IORING_OP_POLL_REMOVE:</div><div class='del'>-		return io_poll_update_prep(req, sqe);</div><div class='del'>-	case IORING_OP_FSYNC:</div><div class='del'>-		return io_fsync_prep(req, sqe);</div><div class='del'>-	case IORING_OP_SYNC_FILE_RANGE:</div><div class='del'>-		return io_sfr_prep(req, sqe);</div><div class='del'>-	case IORING_OP_SENDMSG:</div><div class='del'>-	case IORING_OP_SEND:</div><div class='del'>-		return io_sendmsg_prep(req, sqe);</div><div class='del'>-	case IORING_OP_RECVMSG:</div><div class='del'>-	case IORING_OP_RECV:</div><div class='del'>-		return io_recvmsg_prep(req, sqe);</div><div class='del'>-	case IORING_OP_CONNECT:</div><div class='del'>-		return io_connect_prep(req, sqe);</div><div class='del'>-	case IORING_OP_TIMEOUT:</div><div class='del'>-		return io_timeout_prep(req, sqe, false);</div><div class='del'>-	case IORING_OP_TIMEOUT_REMOVE:</div><div class='del'>-		return io_timeout_remove_prep(req, sqe);</div><div class='del'>-	case IORING_OP_ASYNC_CANCEL:</div><div class='del'>-		return io_async_cancel_prep(req, sqe);</div><div class='del'>-	case IORING_OP_LINK_TIMEOUT:</div><div class='del'>-		return io_timeout_prep(req, sqe, true);</div><div class='del'>-	case IORING_OP_ACCEPT:</div><div class='del'>-		return io_accept_prep(req, sqe);</div><div class='del'>-	case IORING_OP_FALLOCATE:</div><div class='del'>-		return io_fallocate_prep(req, sqe);</div><div class='del'>-	case IORING_OP_OPENAT:</div><div class='del'>-		return io_openat_prep(req, sqe);</div><div class='del'>-	case IORING_OP_CLOSE:</div><div class='del'>-		return io_close_prep(req, sqe);</div><div class='del'>-	case IORING_OP_FILES_UPDATE:</div><div class='del'>-		return io_rsrc_update_prep(req, sqe);</div><div class='del'>-	case IORING_OP_STATX:</div><div class='del'>-		return io_statx_prep(req, sqe);</div><div class='del'>-	case IORING_OP_FADVISE:</div><div class='del'>-		return io_fadvise_prep(req, sqe);</div><div class='del'>-	case IORING_OP_MADVISE:</div><div class='del'>-		return io_madvise_prep(req, sqe);</div><div class='del'>-	case IORING_OP_OPENAT2:</div><div class='del'>-		return io_openat2_prep(req, sqe);</div><div class='del'>-	case IORING_OP_EPOLL_CTL:</div><div class='del'>-		return io_epoll_ctl_prep(req, sqe);</div><div class='del'>-	case IORING_OP_SPLICE:</div><div class='del'>-		return io_splice_prep(req, sqe);</div><div class='del'>-	case IORING_OP_PROVIDE_BUFFERS:</div><div class='del'>-		return io_provide_buffers_prep(req, sqe);</div><div class='del'>-	case IORING_OP_REMOVE_BUFFERS:</div><div class='del'>-		return io_remove_buffers_prep(req, sqe);</div><div class='del'>-	case IORING_OP_TEE:</div><div class='del'>-		return io_tee_prep(req, sqe);</div><div class='del'>-	case IORING_OP_SHUTDOWN:</div><div class='del'>-		return io_shutdown_prep(req, sqe);</div><div class='del'>-	case IORING_OP_RENAMEAT:</div><div class='del'>-		return io_renameat_prep(req, sqe);</div><div class='del'>-	case IORING_OP_UNLINKAT:</div><div class='del'>-		return io_unlinkat_prep(req, sqe);</div><div class='del'>-	case IORING_OP_MKDIRAT:</div><div class='del'>-		return io_mkdirat_prep(req, sqe);</div><div class='del'>-	case IORING_OP_SYMLINKAT:</div><div class='del'>-		return io_symlinkat_prep(req, sqe);</div><div class='del'>-	case IORING_OP_LINKAT:</div><div class='del'>-		return io_linkat_prep(req, sqe);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	printk_once(KERN_WARNING "io_uring: unhandled opcode %d\n",</div><div class='del'>-			req-&gt;opcode);</div><div class='del'>-	return -EINVAL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_req_prep_async(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	if (!io_op_defs[req-&gt;opcode].needs_async_setup)</div><div class='del'>-		return 0;</div><div class='del'>-	if (WARN_ON_ONCE(req_has_async_data(req)))</div><div class='del'>-		return -EFAULT;</div><div class='del'>-	if (io_alloc_async_data(req))</div><div class='del'>-		return -EAGAIN;</div><div class='del'>-</div><div class='del'>-	switch (req-&gt;opcode) {</div><div class='del'>-	case IORING_OP_READV:</div><div class='del'>-		return io_rw_prep_async(req, READ);</div><div class='del'>-	case IORING_OP_WRITEV:</div><div class='del'>-		return io_rw_prep_async(req, WRITE);</div><div class='del'>-	case IORING_OP_SENDMSG:</div><div class='del'>-		return io_sendmsg_prep_async(req);</div><div class='del'>-	case IORING_OP_RECVMSG:</div><div class='del'>-		return io_recvmsg_prep_async(req);</div><div class='del'>-	case IORING_OP_CONNECT:</div><div class='del'>-		return io_connect_prep_async(req);</div><div class='del'>-	}</div><div class='del'>-	printk_once(KERN_WARNING "io_uring: prep_async() bad opcode %d\n",</div><div class='del'>-		    req-&gt;opcode);</div><div class='del'>-	return -EFAULT;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static u32 io_get_sequence(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	u32 seq = req-&gt;ctx-&gt;cached_sq_head;</div><div class='del'>-</div><div class='del'>-	/* need original cached_sq_head, but it was increased for each req */</div><div class='del'>-	io_for_each_link(req, req)</div><div class='del'>-		seq--;</div><div class='del'>-	return seq;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold void io_drain_req(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-	struct io_defer_entry *de;</div><div class='del'>-	int ret;</div><div class='del'>-	u32 seq = io_get_sequence(req);</div><div class='del'>-</div><div class='del'>-	/* Still need defer if there is pending req in defer list. */</div><div class='del'>-	if (!req_need_defer(req, seq) &amp;&amp; list_empty_careful(&amp;ctx-&gt;defer_list)) {</div><div class='del'>-queue:</div><div class='del'>-		ctx-&gt;drain_active = false;</div><div class='del'>-		io_req_task_queue(req);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = io_req_prep_async(req);</div><div class='del'>-	if (ret) {</div><div class='del'>-fail:</div><div class='del'>-		io_req_complete_failed(req, ret);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-	io_prep_async_link(req);</div><div class='del'>-	de = kmalloc(sizeof(*de), GFP_KERNEL);</div><div class='del'>-	if (!de) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto fail;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	if (!req_need_defer(req, seq) &amp;&amp; list_empty(&amp;ctx-&gt;defer_list)) {</div><div class='del'>-		spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-		kfree(de);</div><div class='del'>-		goto queue;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	trace_io_uring_defer(ctx, req, req-&gt;user_data);</div><div class='del'>-	de-&gt;req = req;</div><div class='del'>-	de-&gt;seq = seq;</div><div class='del'>-	list_add_tail(&amp;de-&gt;list, &amp;ctx-&gt;defer_list);</div><div class='del'>-	spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_clean_op(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_BUFFER_SELECTED) {</div><div class='del'>-		kfree(req-&gt;kbuf);</div><div class='del'>-		req-&gt;kbuf = NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_NEED_CLEANUP) {</div><div class='del'>-		switch (req-&gt;opcode) {</div><div class='del'>-		case IORING_OP_READV:</div><div class='del'>-		case IORING_OP_READ_FIXED:</div><div class='del'>-		case IORING_OP_READ:</div><div class='del'>-		case IORING_OP_WRITEV:</div><div class='del'>-		case IORING_OP_WRITE_FIXED:</div><div class='del'>-		case IORING_OP_WRITE: {</div><div class='del'>-			struct io_async_rw *io = req-&gt;async_data;</div><div class='del'>-</div><div class='del'>-			kfree(io-&gt;free_iovec);</div><div class='del'>-			break;</div><div class='del'>-			}</div><div class='del'>-		case IORING_OP_RECVMSG:</div><div class='del'>-		case IORING_OP_SENDMSG: {</div><div class='del'>-			struct io_async_msghdr *io = req-&gt;async_data;</div><div class='del'>-</div><div class='del'>-			kfree(io-&gt;free_iov);</div><div class='del'>-			break;</div><div class='del'>-			}</div><div class='del'>-		case IORING_OP_SPLICE:</div><div class='del'>-		case IORING_OP_TEE:</div><div class='del'>-			if (!(req-&gt;splice.flags &amp; SPLICE_F_FD_IN_FIXED))</div><div class='del'>-				io_put_file(req-&gt;splice.file_in);</div><div class='del'>-			break;</div><div class='del'>-		case IORING_OP_OPENAT:</div><div class='del'>-		case IORING_OP_OPENAT2:</div><div class='del'>-			if (req-&gt;open.filename)</div><div class='del'>-				putname(req-&gt;open.filename);</div><div class='del'>-			break;</div><div class='del'>-		case IORING_OP_RENAMEAT:</div><div class='del'>-			putname(req-&gt;rename.oldpath);</div><div class='del'>-			putname(req-&gt;rename.newpath);</div><div class='del'>-			break;</div><div class='del'>-		case IORING_OP_UNLINKAT:</div><div class='del'>-			putname(req-&gt;unlink.filename);</div><div class='del'>-			break;</div><div class='del'>-		case IORING_OP_MKDIRAT:</div><div class='del'>-			putname(req-&gt;mkdir.filename);</div><div class='del'>-			break;</div><div class='del'>-		case IORING_OP_SYMLINKAT:</div><div class='del'>-			putname(req-&gt;symlink.oldpath);</div><div class='del'>-			putname(req-&gt;symlink.newpath);</div><div class='del'>-			break;</div><div class='del'>-		case IORING_OP_LINKAT:</div><div class='del'>-			putname(req-&gt;hardlink.oldpath);</div><div class='del'>-			putname(req-&gt;hardlink.newpath);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	if ((req-&gt;flags &amp; REQ_F_POLLED) &amp;&amp; req-&gt;apoll) {</div><div class='del'>-		kfree(req-&gt;apoll-&gt;double_poll);</div><div class='del'>-		kfree(req-&gt;apoll);</div><div class='del'>-		req-&gt;apoll = NULL;</div><div class='del'>-	}</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_INFLIGHT) {</div><div class='del'>-		struct io_uring_task *tctx = req-&gt;task-&gt;io_uring;</div><div class='del'>-</div><div class='del'>-		atomic_dec(&amp;tctx-&gt;inflight_tracked);</div><div class='del'>-	}</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_CREDS)</div><div class='del'>-		put_cred(req-&gt;creds);</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_ASYNC_DATA) {</div><div class='del'>-		kfree(req-&gt;async_data);</div><div class='del'>-		req-&gt;async_data = NULL;</div><div class='del'>-	}</div><div class='del'>-	req-&gt;flags &amp;= ~IO_REQ_CLEAN_FLAGS;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_issue_sqe(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	const struct cred *creds = NULL;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (unlikely((req-&gt;flags &amp; REQ_F_CREDS) &amp;&amp; req-&gt;creds != current_cred()))</div><div class='del'>-		creds = override_creds(req-&gt;creds);</div><div class='del'>-</div><div class='del'>-	if (!io_op_defs[req-&gt;opcode].audit_skip)</div><div class='del'>-		audit_uring_entry(req-&gt;opcode);</div><div class='del'>-</div><div class='del'>-	switch (req-&gt;opcode) {</div><div class='del'>-	case IORING_OP_NOP:</div><div class='del'>-		ret = io_nop(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_READV:</div><div class='del'>-	case IORING_OP_READ_FIXED:</div><div class='del'>-	case IORING_OP_READ:</div><div class='del'>-		ret = io_read(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_WRITEV:</div><div class='del'>-	case IORING_OP_WRITE_FIXED:</div><div class='del'>-	case IORING_OP_WRITE:</div><div class='del'>-		ret = io_write(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_FSYNC:</div><div class='del'>-		ret = io_fsync(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_POLL_ADD:</div><div class='del'>-		ret = io_poll_add(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_POLL_REMOVE:</div><div class='del'>-		ret = io_poll_update(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_SYNC_FILE_RANGE:</div><div class='del'>-		ret = io_sync_file_range(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_SENDMSG:</div><div class='del'>-		ret = io_sendmsg(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_SEND:</div><div class='del'>-		ret = io_send(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_RECVMSG:</div><div class='del'>-		ret = io_recvmsg(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_RECV:</div><div class='del'>-		ret = io_recv(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_TIMEOUT:</div><div class='del'>-		ret = io_timeout(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_TIMEOUT_REMOVE:</div><div class='del'>-		ret = io_timeout_remove(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_ACCEPT:</div><div class='del'>-		ret = io_accept(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_CONNECT:</div><div class='del'>-		ret = io_connect(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_ASYNC_CANCEL:</div><div class='del'>-		ret = io_async_cancel(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_FALLOCATE:</div><div class='del'>-		ret = io_fallocate(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_OPENAT:</div><div class='del'>-		ret = io_openat(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_CLOSE:</div><div class='del'>-		ret = io_close(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_FILES_UPDATE:</div><div class='del'>-		ret = io_files_update(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_STATX:</div><div class='del'>-		ret = io_statx(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_FADVISE:</div><div class='del'>-		ret = io_fadvise(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_MADVISE:</div><div class='del'>-		ret = io_madvise(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_OPENAT2:</div><div class='del'>-		ret = io_openat2(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_EPOLL_CTL:</div><div class='del'>-		ret = io_epoll_ctl(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_SPLICE:</div><div class='del'>-		ret = io_splice(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_PROVIDE_BUFFERS:</div><div class='del'>-		ret = io_provide_buffers(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_REMOVE_BUFFERS:</div><div class='del'>-		ret = io_remove_buffers(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_TEE:</div><div class='del'>-		ret = io_tee(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_SHUTDOWN:</div><div class='del'>-		ret = io_shutdown(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_RENAMEAT:</div><div class='del'>-		ret = io_renameat(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_UNLINKAT:</div><div class='del'>-		ret = io_unlinkat(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_MKDIRAT:</div><div class='del'>-		ret = io_mkdirat(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_SYMLINKAT:</div><div class='del'>-		ret = io_symlinkat(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OP_LINKAT:</div><div class='del'>-		ret = io_linkat(req, issue_flags);</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!io_op_defs[req-&gt;opcode].audit_skip)</div><div class='del'>-		audit_uring_exit(!ret, ret);</div><div class='del'>-</div><div class='del'>-	if (creds)</div><div class='del'>-		revert_creds(creds);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-	/* If the op doesn't have a file, we're not polling for it */</div><div class='del'>-	if ((req-&gt;ctx-&gt;flags &amp; IORING_SETUP_IOPOLL) &amp;&amp; req-&gt;file)</div><div class='del'>-		io_iopoll_req_issued(req, issue_flags);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct io_wq_work *io_wq_free_work(struct io_wq_work *work)</div><div class='del'>-{</div><div class='del'>-	struct io_kiocb *req = container_of(work, struct io_kiocb, work);</div><div class='del'>-</div><div class='del'>-	req = io_put_req_find_next(req);</div><div class='del'>-	return req ? &amp;req-&gt;work : NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_wq_submit_work(struct io_wq_work *work)</div><div class='del'>-{</div><div class='del'>-	struct io_kiocb *req = container_of(work, struct io_kiocb, work);</div><div class='del'>-	unsigned int issue_flags = IO_URING_F_UNLOCKED;</div><div class='del'>-	bool needs_poll = false;</div><div class='del'>-	struct io_kiocb *timeout;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	/* one will be dropped by -&gt;io_free_work() after returning to io-wq */</div><div class='del'>-	if (!(req-&gt;flags &amp; REQ_F_REFCOUNT))</div><div class='del'>-		__io_req_set_refcount(req, 2);</div><div class='del'>-	else</div><div class='del'>-		req_ref_get(req);</div><div class='del'>-</div><div class='del'>-	timeout = io_prep_linked_timeout(req);</div><div class='del'>-	if (timeout)</div><div class='del'>-		io_queue_linked_timeout(timeout);</div><div class='del'>-</div><div class='del'>-	/* either cancelled or io-wq is dying, so don't touch tctx-&gt;iowq */</div><div class='del'>-	if (work-&gt;flags &amp; IO_WQ_WORK_CANCEL) {</div><div class='del'>-		io_req_task_queue_fail(req, -ECANCELED);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_FORCE_ASYNC) {</div><div class='del'>-		const struct io_op_def *def = &amp;io_op_defs[req-&gt;opcode];</div><div class='del'>-		bool opcode_poll = def-&gt;pollin || def-&gt;pollout;</div><div class='del'>-</div><div class='del'>-		if (opcode_poll &amp;&amp; file_can_poll(req-&gt;file)) {</div><div class='del'>-			needs_poll = true;</div><div class='del'>-			issue_flags |= IO_URING_F_NONBLOCK;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		ret = io_issue_sqe(req, issue_flags);</div><div class='del'>-		if (ret != -EAGAIN)</div><div class='del'>-			break;</div><div class='del'>-		/*</div><div class='del'>-		 * We can get EAGAIN for iopolled IO even though we're</div><div class='del'>-		 * forcing a sync submission from here, since we can't</div><div class='del'>-		 * wait for request slots on the block side.</div><div class='del'>-		 */</div><div class='del'>-		if (!needs_poll) {</div><div class='del'>-			cond_resched();</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (io_arm_poll_handler(req) == IO_APOLL_OK)</div><div class='del'>-			return;</div><div class='del'>-		/* aborted or ready, in either case retry blocking */</div><div class='del'>-		needs_poll = false;</div><div class='del'>-		issue_flags &amp;= ~IO_URING_F_NONBLOCK;</div><div class='del'>-	} while (1);</div><div class='del'>-</div><div class='del'>-	/* avoid locking problems by failing it from a clean context */</div><div class='del'>-	if (ret)</div><div class='del'>-		io_req_task_queue_fail(req, ret);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline struct io_fixed_file *io_fixed_file_slot(struct io_file_table *table,</div><div class='del'>-						       unsigned i)</div><div class='del'>-{</div><div class='del'>-	return &amp;table-&gt;files[i];</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline struct file *io_file_from_index(struct io_ring_ctx *ctx,</div><div class='del'>-					      int index)</div><div class='del'>-{</div><div class='del'>-	struct io_fixed_file *slot = io_fixed_file_slot(&amp;ctx-&gt;file_table, index);</div><div class='del'>-</div><div class='del'>-	return (struct file *) (slot-&gt;file_ptr &amp; FFS_MASK);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_fixed_file_set(struct io_fixed_file *file_slot, struct file *file)</div><div class='del'>-{</div><div class='del'>-	unsigned long file_ptr = (unsigned long) file;</div><div class='del'>-</div><div class='del'>-	file_ptr |= io_file_get_flags(file);</div><div class='del'>-	file_slot-&gt;file_ptr = file_ptr;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline struct file *io_file_get_fixed(struct io_ring_ctx *ctx,</div><div class='del'>-					     struct io_kiocb *req, int fd)</div><div class='del'>-{</div><div class='del'>-	struct file *file;</div><div class='del'>-	unsigned long file_ptr;</div><div class='del'>-</div><div class='del'>-	if (unlikely((unsigned int)fd &gt;= ctx-&gt;nr_user_files))</div><div class='del'>-		return NULL;</div><div class='del'>-	fd = array_index_nospec(fd, ctx-&gt;nr_user_files);</div><div class='del'>-	file_ptr = io_fixed_file_slot(&amp;ctx-&gt;file_table, fd)-&gt;file_ptr;</div><div class='del'>-	file = (struct file *) (file_ptr &amp; FFS_MASK);</div><div class='del'>-	file_ptr &amp;= ~FFS_MASK;</div><div class='del'>-	/* mask in overlapping REQ_F and FFS bits */</div><div class='del'>-	req-&gt;flags |= (file_ptr &lt;&lt; REQ_F_SUPPORT_NOWAIT_BIT);</div><div class='del'>-	io_req_set_rsrc_node(req, ctx);</div><div class='del'>-	return file;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct file *io_file_get_normal(struct io_ring_ctx *ctx,</div><div class='del'>-				       struct io_kiocb *req, int fd)</div><div class='del'>-{</div><div class='del'>-	struct file *file = fget(fd);</div><div class='del'>-</div><div class='del'>-	trace_io_uring_file_get(ctx, fd);</div><div class='del'>-</div><div class='del'>-	/* we don't allow fixed io_uring files */</div><div class='del'>-	if (file &amp;&amp; unlikely(file-&gt;f_op == &amp;io_uring_fops))</div><div class='del'>-		io_req_track_inflight(req);</div><div class='del'>-	return file;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline struct file *io_file_get(struct io_ring_ctx *ctx,</div><div class='del'>-				       struct io_kiocb *req, int fd, bool fixed)</div><div class='del'>-{</div><div class='del'>-	if (fixed)</div><div class='del'>-		return io_file_get_fixed(ctx, req, fd);</div><div class='del'>-	else</div><div class='del'>-		return io_file_get_normal(ctx, req, fd);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_req_task_link_timeout(struct io_kiocb *req, bool *locked)</div><div class='del'>-{</div><div class='del'>-	struct io_kiocb *prev = req-&gt;timeout.prev;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (prev) {</div><div class='del'>-		ret = io_try_cancel_userdata(req, prev-&gt;user_data);</div><div class='del'>-		io_req_complete_post(req, ret ?: -ETIME, 0);</div><div class='del'>-		io_put_req(prev);</div><div class='del'>-	} else {</div><div class='del'>-		io_req_complete_post(req, -ETIME, 0);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static enum hrtimer_restart io_link_timeout_fn(struct hrtimer *timer)</div><div class='del'>-{</div><div class='del'>-	struct io_timeout_data *data = container_of(timer,</div><div class='del'>-						struct io_timeout_data, timer);</div><div class='del'>-	struct io_kiocb *prev, *req = data-&gt;req;</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-	unsigned long flags;</div><div class='del'>-</div><div class='del'>-	spin_lock_irqsave(&amp;ctx-&gt;timeout_lock, flags);</div><div class='del'>-	prev = req-&gt;timeout.head;</div><div class='del'>-	req-&gt;timeout.head = NULL;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * We don't expect the list to be empty, that will only happen if we</div><div class='del'>-	 * race with the completion of the linked work.</div><div class='del'>-	 */</div><div class='del'>-	if (prev) {</div><div class='del'>-		io_remove_next_linked(prev);</div><div class='del'>-		if (!req_ref_inc_not_zero(prev))</div><div class='del'>-			prev = NULL;</div><div class='del'>-	}</div><div class='del'>-	list_del(&amp;req-&gt;timeout.list);</div><div class='del'>-	req-&gt;timeout.prev = prev;</div><div class='del'>-	spin_unlock_irqrestore(&amp;ctx-&gt;timeout_lock, flags);</div><div class='del'>-</div><div class='del'>-	req-&gt;io_task_work.func = io_req_task_link_timeout;</div><div class='del'>-	io_req_task_work_add(req);</div><div class='del'>-	return HRTIMER_NORESTART;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_queue_linked_timeout(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-</div><div class='del'>-	spin_lock_irq(&amp;ctx-&gt;timeout_lock);</div><div class='del'>-	/*</div><div class='del'>-	 * If the back reference is NULL, then our linked request finished</div><div class='del'>-	 * before we got a chance to setup the timer</div><div class='del'>-	 */</div><div class='del'>-	if (req-&gt;timeout.head) {</div><div class='del'>-		struct io_timeout_data *data = req-&gt;async_data;</div><div class='del'>-</div><div class='del'>-		data-&gt;timer.function = io_link_timeout_fn;</div><div class='del'>-		hrtimer_start(&amp;data-&gt;timer, timespec64_to_ktime(data-&gt;ts),</div><div class='del'>-				data-&gt;mode);</div><div class='del'>-		list_add_tail(&amp;req-&gt;timeout.list, &amp;ctx-&gt;ltimeout_list);</div><div class='del'>-	}</div><div class='del'>-	spin_unlock_irq(&amp;ctx-&gt;timeout_lock);</div><div class='del'>-	/* drop submission reference */</div><div class='del'>-	io_put_req(req);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_queue_sqe_arm_apoll(struct io_kiocb *req)</div><div class='del'>-	__must_hold(&amp;req-&gt;ctx-&gt;uring_lock)</div><div class='del'>-{</div><div class='del'>-	struct io_kiocb *linked_timeout = io_prep_linked_timeout(req);</div><div class='del'>-</div><div class='del'>-	switch (io_arm_poll_handler(req)) {</div><div class='del'>-	case IO_APOLL_READY:</div><div class='del'>-		io_req_task_queue(req);</div><div class='del'>-		break;</div><div class='del'>-	case IO_APOLL_ABORTED:</div><div class='del'>-		/*</div><div class='del'>-		 * Queued up for async execution, worker will release</div><div class='del'>-		 * submit reference when the iocb is actually submitted.</div><div class='del'>-		 */</div><div class='del'>-		io_queue_async_work(req, NULL);</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (linked_timeout)</div><div class='del'>-		io_queue_linked_timeout(linked_timeout);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void __io_queue_sqe(struct io_kiocb *req)</div><div class='del'>-	__must_hold(&amp;req-&gt;ctx-&gt;uring_lock)</div><div class='del'>-{</div><div class='del'>-	struct io_kiocb *linked_timeout;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ret = io_issue_sqe(req, IO_URING_F_NONBLOCK|IO_URING_F_COMPLETE_DEFER);</div><div class='del'>-</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_COMPLETE_INLINE) {</div><div class='del'>-		io_req_add_compl_list(req);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-	/*</div><div class='del'>-	 * We async punt it if the file wasn't marked NOWAIT, or if the file</div><div class='del'>-	 * doesn't support non-blocking read/write attempts</div><div class='del'>-	 */</div><div class='del'>-	if (likely(!ret)) {</div><div class='del'>-		linked_timeout = io_prep_linked_timeout(req);</div><div class='del'>-		if (linked_timeout)</div><div class='del'>-			io_queue_linked_timeout(linked_timeout);</div><div class='del'>-	} else if (ret == -EAGAIN &amp;&amp; !(req-&gt;flags &amp; REQ_F_NOWAIT)) {</div><div class='del'>-		io_queue_sqe_arm_apoll(req);</div><div class='del'>-	} else {</div><div class='del'>-		io_req_complete_failed(req, ret);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_queue_sqe_fallback(struct io_kiocb *req)</div><div class='del'>-	__must_hold(&amp;req-&gt;ctx-&gt;uring_lock)</div><div class='del'>-{</div><div class='del'>-	if (req-&gt;flags &amp; REQ_F_FAIL) {</div><div class='del'>-		io_req_complete_fail_submit(req);</div><div class='del'>-	} else if (unlikely(req-&gt;ctx-&gt;drain_active)) {</div><div class='del'>-		io_drain_req(req);</div><div class='del'>-	} else {</div><div class='del'>-		int ret = io_req_prep_async(req);</div><div class='del'>-</div><div class='del'>-		if (unlikely(ret))</div><div class='del'>-			io_req_complete_failed(req, ret);</div><div class='del'>-		else</div><div class='del'>-			io_queue_async_work(req, NULL);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void io_queue_sqe(struct io_kiocb *req)</div><div class='del'>-	__must_hold(&amp;req-&gt;ctx-&gt;uring_lock)</div><div class='del'>-{</div><div class='del'>-	if (likely(!(req-&gt;flags &amp; (REQ_F_FORCE_ASYNC | REQ_F_FAIL))))</div><div class='del'>-		__io_queue_sqe(req);</div><div class='del'>-	else</div><div class='del'>-		io_queue_sqe_fallback(req);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Check SQE restrictions (opcode and flags).</div><div class='del'>- *</div><div class='del'>- * Returns 'true' if SQE is allowed, 'false' otherwise.</div><div class='del'>- */</div><div class='del'>-static inline bool io_check_restriction(struct io_ring_ctx *ctx,</div><div class='del'>-					struct io_kiocb *req,</div><div class='del'>-					unsigned int sqe_flags)</div><div class='del'>-{</div><div class='del'>-	if (!test_bit(req-&gt;opcode, ctx-&gt;restrictions.sqe_op))</div><div class='del'>-		return false;</div><div class='del'>-</div><div class='del'>-	if ((sqe_flags &amp; ctx-&gt;restrictions.sqe_flags_required) !=</div><div class='del'>-	    ctx-&gt;restrictions.sqe_flags_required)</div><div class='del'>-		return false;</div><div class='del'>-</div><div class='del'>-	if (sqe_flags &amp; ~(ctx-&gt;restrictions.sqe_flags_allowed |</div><div class='del'>-			  ctx-&gt;restrictions.sqe_flags_required))</div><div class='del'>-		return false;</div><div class='del'>-</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_init_req_drain(struct io_kiocb *req)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-	struct io_kiocb *head = ctx-&gt;submit_state.link.head;</div><div class='del'>-</div><div class='del'>-	ctx-&gt;drain_active = true;</div><div class='del'>-	if (head) {</div><div class='del'>-		/*</div><div class='del'>-		 * If we need to drain a request in the middle of a link, drain</div><div class='del'>-		 * the head request and the next request/link after the current</div><div class='del'>-		 * link. Considering sequential execution of links,</div><div class='del'>-		 * IOSQE_IO_DRAIN will be maintained for every request of our</div><div class='del'>-		 * link.</div><div class='del'>-		 */</div><div class='del'>-		head-&gt;flags |= IOSQE_IO_DRAIN | REQ_F_FORCE_ASYNC;</div><div class='del'>-		ctx-&gt;drain_next = true;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_init_req(struct io_ring_ctx *ctx, struct io_kiocb *req,</div><div class='del'>-		       const struct io_uring_sqe *sqe)</div><div class='del'>-	__must_hold(&amp;ctx-&gt;uring_lock)</div><div class='del'>-{</div><div class='del'>-	unsigned int sqe_flags;</div><div class='del'>-	int personality;</div><div class='del'>-	u8 opcode;</div><div class='del'>-</div><div class='del'>-	/* req is partially pre-initialised, see io_preinit_req() */</div><div class='del'>-	req-&gt;opcode = opcode = READ_ONCE(sqe-&gt;opcode);</div><div class='del'>-	/* same numerical values with corresponding REQ_F_*, safe to copy */</div><div class='del'>-	req-&gt;flags = sqe_flags = READ_ONCE(sqe-&gt;flags);</div><div class='del'>-	req-&gt;user_data = READ_ONCE(sqe-&gt;user_data);</div><div class='del'>-	req-&gt;file = NULL;</div><div class='del'>-	req-&gt;fixed_rsrc_refs = NULL;</div><div class='del'>-	req-&gt;task = current;</div><div class='del'>-</div><div class='del'>-	if (unlikely(opcode &gt;= IORING_OP_LAST)) {</div><div class='del'>-		req-&gt;opcode = 0;</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-	if (unlikely(sqe_flags &amp; ~SQE_COMMON_FLAGS)) {</div><div class='del'>-		/* enforce forwards compatibility on users */</div><div class='del'>-		if (sqe_flags &amp; ~SQE_VALID_FLAGS)</div><div class='del'>-			return -EINVAL;</div><div class='del'>-		if ((sqe_flags &amp; IOSQE_BUFFER_SELECT) &amp;&amp;</div><div class='del'>-		    !io_op_defs[opcode].buffer_select)</div><div class='del'>-			return -EOPNOTSUPP;</div><div class='del'>-		if (sqe_flags &amp; IOSQE_IO_DRAIN)</div><div class='del'>-			io_init_req_drain(req);</div><div class='del'>-	}</div><div class='del'>-	if (unlikely(ctx-&gt;restricted || ctx-&gt;drain_active || ctx-&gt;drain_next)) {</div><div class='del'>-		if (ctx-&gt;restricted &amp;&amp; !io_check_restriction(ctx, req, sqe_flags))</div><div class='del'>-			return -EACCES;</div><div class='del'>-		/* knock it to the slow queue path, will be drained there */</div><div class='del'>-		if (ctx-&gt;drain_active)</div><div class='del'>-			req-&gt;flags |= REQ_F_FORCE_ASYNC;</div><div class='del'>-		/* if there is no link, we're at "next" request and need to drain */</div><div class='del'>-		if (unlikely(ctx-&gt;drain_next) &amp;&amp; !ctx-&gt;submit_state.link.head) {</div><div class='del'>-			ctx-&gt;drain_next = false;</div><div class='del'>-			ctx-&gt;drain_active = true;</div><div class='del'>-			req-&gt;flags |= IOSQE_IO_DRAIN | REQ_F_FORCE_ASYNC;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (io_op_defs[opcode].needs_file) {</div><div class='del'>-		struct io_submit_state *state = &amp;ctx-&gt;submit_state;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Plug now if we have more than 2 IO left after this, and the</div><div class='del'>-		 * target is potentially a read/write to block based storage.</div><div class='del'>-		 */</div><div class='del'>-		if (state-&gt;need_plug &amp;&amp; io_op_defs[opcode].plug) {</div><div class='del'>-			state-&gt;plug_started = true;</div><div class='del'>-			state-&gt;need_plug = false;</div><div class='del'>-			blk_start_plug_nr_ios(&amp;state-&gt;plug, state-&gt;submit_nr);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		req-&gt;file = io_file_get(ctx, req, READ_ONCE(sqe-&gt;fd),</div><div class='del'>-					(sqe_flags &amp; IOSQE_FIXED_FILE));</div><div class='del'>-		if (unlikely(!req-&gt;file))</div><div class='del'>-			return -EBADF;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	personality = READ_ONCE(sqe-&gt;personality);</div><div class='del'>-	if (personality) {</div><div class='del'>-		int ret;</div><div class='del'>-</div><div class='del'>-		req-&gt;creds = xa_load(&amp;ctx-&gt;personalities, personality);</div><div class='del'>-		if (!req-&gt;creds)</div><div class='del'>-			return -EINVAL;</div><div class='del'>-		get_cred(req-&gt;creds);</div><div class='del'>-		ret = security_uring_override_creds(req-&gt;creds);</div><div class='del'>-		if (ret) {</div><div class='del'>-			put_cred(req-&gt;creds);</div><div class='del'>-			return ret;</div><div class='del'>-		}</div><div class='del'>-		req-&gt;flags |= REQ_F_CREDS;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return io_req_prep(req, sqe);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_submit_sqe(struct io_ring_ctx *ctx, struct io_kiocb *req,</div><div class='del'>-			 const struct io_uring_sqe *sqe)</div><div class='del'>-	__must_hold(&amp;ctx-&gt;uring_lock)</div><div class='del'>-{</div><div class='del'>-	struct io_submit_link *link = &amp;ctx-&gt;submit_state.link;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ret = io_init_req(ctx, req, sqe);</div><div class='del'>-	if (unlikely(ret)) {</div><div class='del'>-		trace_io_uring_req_failed(sqe, ret);</div><div class='del'>-</div><div class='del'>-		/* fail even hard links since we don't submit */</div><div class='del'>-		if (link-&gt;head) {</div><div class='del'>-			/*</div><div class='del'>-			 * we can judge a link req is failed or cancelled by if</div><div class='del'>-			 * REQ_F_FAIL is set, but the head is an exception since</div><div class='del'>-			 * it may be set REQ_F_FAIL because of other req's failure</div><div class='del'>-			 * so let's leverage req-&gt;result to distinguish if a head</div><div class='del'>-			 * is set REQ_F_FAIL because of its failure or other req's</div><div class='del'>-			 * failure so that we can set the correct ret code for it.</div><div class='del'>-			 * init result here to avoid affecting the normal path.</div><div class='del'>-			 */</div><div class='del'>-			if (!(link-&gt;head-&gt;flags &amp; REQ_F_FAIL))</div><div class='del'>-				req_fail_link_node(link-&gt;head, -ECANCELED);</div><div class='del'>-		} else if (!(req-&gt;flags &amp; (REQ_F_LINK | REQ_F_HARDLINK))) {</div><div class='del'>-			/*</div><div class='del'>-			 * the current req is a normal req, we should return</div><div class='del'>-			 * error and thus break the submittion loop.</div><div class='del'>-			 */</div><div class='del'>-			io_req_complete_failed(req, ret);</div><div class='del'>-			return ret;</div><div class='del'>-		}</div><div class='del'>-		req_fail_link_node(req, ret);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* don't need @sqe from now on */</div><div class='del'>-	trace_io_uring_submit_sqe(ctx, req, req-&gt;opcode, req-&gt;user_data,</div><div class='del'>-				  req-&gt;flags, true,</div><div class='del'>-				  ctx-&gt;flags &amp; IORING_SETUP_SQPOLL);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If we already have a head request, queue this one for async</div><div class='del'>-	 * submittal once the head completes. If we don't have a head but</div><div class='del'>-	 * IOSQE_IO_LINK is set in the sqe, start a new head. This one will be</div><div class='del'>-	 * submitted sync once the chain is complete. If none of those</div><div class='del'>-	 * conditions are true (normal request), then just queue it.</div><div class='del'>-	 */</div><div class='del'>-	if (link-&gt;head) {</div><div class='del'>-		struct io_kiocb *head = link-&gt;head;</div><div class='del'>-</div><div class='del'>-		if (!(req-&gt;flags &amp; REQ_F_FAIL)) {</div><div class='del'>-			ret = io_req_prep_async(req);</div><div class='del'>-			if (unlikely(ret)) {</div><div class='del'>-				req_fail_link_node(req, ret);</div><div class='del'>-				if (!(head-&gt;flags &amp; REQ_F_FAIL))</div><div class='del'>-					req_fail_link_node(head, -ECANCELED);</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-		trace_io_uring_link(ctx, req, head);</div><div class='del'>-		link-&gt;last-&gt;link = req;</div><div class='del'>-		link-&gt;last = req;</div><div class='del'>-</div><div class='del'>-		if (req-&gt;flags &amp; (REQ_F_LINK | REQ_F_HARDLINK))</div><div class='del'>-			return 0;</div><div class='del'>-		/* last request of a link, enqueue the link */</div><div class='del'>-		link-&gt;head = NULL;</div><div class='del'>-		req = head;</div><div class='del'>-	} else if (req-&gt;flags &amp; (REQ_F_LINK | REQ_F_HARDLINK)) {</div><div class='del'>-		link-&gt;head = req;</div><div class='del'>-		link-&gt;last = req;</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	io_queue_sqe(req);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Batched submission is done, ensure local IO is flushed out.</div><div class='del'>- */</div><div class='del'>-static void io_submit_state_end(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	struct io_submit_state *state = &amp;ctx-&gt;submit_state;</div><div class='del'>-</div><div class='del'>-	if (state-&gt;link.head)</div><div class='del'>-		io_queue_sqe(state-&gt;link.head);</div><div class='del'>-	/* flush only after queuing links as they can generate completions */</div><div class='del'>-	io_submit_flush_completions(ctx);</div><div class='del'>-	if (state-&gt;plug_started)</div><div class='del'>-		blk_finish_plug(&amp;state-&gt;plug);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Start submission side cache.</div><div class='del'>- */</div><div class='del'>-static void io_submit_state_start(struct io_submit_state *state,</div><div class='del'>-				  unsigned int max_ios)</div><div class='del'>-{</div><div class='del'>-	state-&gt;plug_started = false;</div><div class='del'>-	state-&gt;need_plug = max_ios &gt; 2;</div><div class='del'>-	state-&gt;submit_nr = max_ios;</div><div class='del'>-	/* set only head, no need to init link_last in advance */</div><div class='del'>-	state-&gt;link.head = NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_commit_sqring(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	struct io_rings *rings = ctx-&gt;rings;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Ensure any loads from the SQEs are done at this point,</div><div class='del'>-	 * since once we write the new head, the application could</div><div class='del'>-	 * write new data to them.</div><div class='del'>-	 */</div><div class='del'>-	smp_store_release(&amp;rings-&gt;sq.head, ctx-&gt;cached_sq_head);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Fetch an sqe, if one is available. Note this returns a pointer to memory</div><div class='del'>- * that is mapped by userspace. This means that care needs to be taken to</div><div class='del'>- * ensure that reads are stable, as we cannot rely on userspace always</div><div class='del'>- * being a good citizen. If members of the sqe are validated and then later</div><div class='del'>- * used, it's important that those reads are done through READ_ONCE() to</div><div class='del'>- * prevent a re-load down the line.</div><div class='del'>- */</div><div class='del'>-static const struct io_uring_sqe *io_get_sqe(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	unsigned head, mask = ctx-&gt;sq_entries - 1;</div><div class='del'>-	unsigned sq_idx = ctx-&gt;cached_sq_head++ &amp; mask;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * The cached sq head (or cq tail) serves two purposes:</div><div class='del'>-	 *</div><div class='del'>-	 * 1) allows us to batch the cost of updating the user visible</div><div class='del'>-	 *    head updates.</div><div class='del'>-	 * 2) allows the kernel side to track the head on its own, even</div><div class='del'>-	 *    though the application is the one updating it.</div><div class='del'>-	 */</div><div class='del'>-	head = READ_ONCE(ctx-&gt;sq_array[sq_idx]);</div><div class='del'>-	if (likely(head &lt; ctx-&gt;sq_entries))</div><div class='del'>-		return &amp;ctx-&gt;sq_sqes[head];</div><div class='del'>-</div><div class='del'>-	/* drop invalid entries */</div><div class='del'>-	ctx-&gt;cq_extra--;</div><div class='del'>-	WRITE_ONCE(ctx-&gt;rings-&gt;sq_dropped,</div><div class='del'>-		   READ_ONCE(ctx-&gt;rings-&gt;sq_dropped) + 1);</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_submit_sqes(struct io_ring_ctx *ctx, unsigned int nr)</div><div class='del'>-	__must_hold(&amp;ctx-&gt;uring_lock)</div><div class='del'>-{</div><div class='del'>-	unsigned int entries = io_sqring_entries(ctx);</div><div class='del'>-	int submitted = 0;</div><div class='del'>-</div><div class='del'>-	if (unlikely(!entries))</div><div class='del'>-		return 0;</div><div class='del'>-	/* make sure SQ entry isn't read before tail */</div><div class='del'>-	nr = min3(nr, ctx-&gt;sq_entries, entries);</div><div class='del'>-	io_get_task_refs(nr);</div><div class='del'>-</div><div class='del'>-	io_submit_state_start(&amp;ctx-&gt;submit_state, nr);</div><div class='del'>-	do {</div><div class='del'>-		const struct io_uring_sqe *sqe;</div><div class='del'>-		struct io_kiocb *req;</div><div class='del'>-</div><div class='del'>-		if (unlikely(!io_alloc_req_refill(ctx))) {</div><div class='del'>-			if (!submitted)</div><div class='del'>-				submitted = -EAGAIN;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		req = io_alloc_req(ctx);</div><div class='del'>-		sqe = io_get_sqe(ctx);</div><div class='del'>-		if (unlikely(!sqe)) {</div><div class='del'>-			wq_stack_add_head(&amp;req-&gt;comp_list, &amp;ctx-&gt;submit_state.free_list);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		/* will complete beyond this point, count as submitted */</div><div class='del'>-		submitted++;</div><div class='del'>-		if (io_submit_sqe(ctx, req, sqe))</div><div class='del'>-			break;</div><div class='del'>-	} while (submitted &lt; nr);</div><div class='del'>-</div><div class='del'>-	if (unlikely(submitted != nr)) {</div><div class='del'>-		int ref_used = (submitted == -EAGAIN) ? 0 : submitted;</div><div class='del'>-		int unused = nr - ref_used;</div><div class='del'>-</div><div class='del'>-		current-&gt;io_uring-&gt;cached_refs += unused;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	io_submit_state_end(ctx);</div><div class='del'>-	 /* Commit SQ ring head once we've consumed and submitted all SQEs */</div><div class='del'>-	io_commit_sqring(ctx);</div><div class='del'>-</div><div class='del'>-	return submitted;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline bool io_sqd_events_pending(struct io_sq_data *sqd)</div><div class='del'>-{</div><div class='del'>-	return READ_ONCE(sqd-&gt;state);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void io_ring_set_wakeup_flag(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	/* Tell userspace we may need a wakeup call */</div><div class='del'>-	spin_lock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	WRITE_ONCE(ctx-&gt;rings-&gt;sq_flags,</div><div class='del'>-		   ctx-&gt;rings-&gt;sq_flags | IORING_SQ_NEED_WAKEUP);</div><div class='del'>-	spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void io_ring_clear_wakeup_flag(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	spin_lock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	WRITE_ONCE(ctx-&gt;rings-&gt;sq_flags,</div><div class='del'>-		   ctx-&gt;rings-&gt;sq_flags &amp; ~IORING_SQ_NEED_WAKEUP);</div><div class='del'>-	spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int __io_sq_thread(struct io_ring_ctx *ctx, bool cap_entries)</div><div class='del'>-{</div><div class='del'>-	unsigned int to_submit;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	to_submit = io_sqring_entries(ctx);</div><div class='del'>-	/* if we're handling multiple rings, cap submit size for fairness */</div><div class='del'>-	if (cap_entries &amp;&amp; to_submit &gt; IORING_SQPOLL_CAP_ENTRIES_VALUE)</div><div class='del'>-		to_submit = IORING_SQPOLL_CAP_ENTRIES_VALUE;</div><div class='del'>-</div><div class='del'>-	if (!wq_list_empty(&amp;ctx-&gt;iopoll_list) || to_submit) {</div><div class='del'>-		const struct cred *creds = NULL;</div><div class='del'>-</div><div class='del'>-		if (ctx-&gt;sq_creds != current_cred())</div><div class='del'>-			creds = override_creds(ctx-&gt;sq_creds);</div><div class='del'>-</div><div class='del'>-		mutex_lock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-		if (!wq_list_empty(&amp;ctx-&gt;iopoll_list))</div><div class='del'>-			io_do_iopoll(ctx, true);</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Don't submit if refs are dying, good for io_uring_register(),</div><div class='del'>-		 * but also it is relied upon by io_ring_exit_work()</div><div class='del'>-		 */</div><div class='del'>-		if (to_submit &amp;&amp; likely(!percpu_ref_is_dying(&amp;ctx-&gt;refs)) &amp;&amp;</div><div class='del'>-		    !(ctx-&gt;flags &amp; IORING_SETUP_R_DISABLED))</div><div class='del'>-			ret = io_submit_sqes(ctx, to_submit);</div><div class='del'>-		mutex_unlock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-</div><div class='del'>-		if (to_submit &amp;&amp; wq_has_sleeper(&amp;ctx-&gt;sqo_sq_wait))</div><div class='del'>-			wake_up(&amp;ctx-&gt;sqo_sq_wait);</div><div class='del'>-		if (creds)</div><div class='del'>-			revert_creds(creds);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold void io_sqd_update_thread_idle(struct io_sq_data *sqd)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx;</div><div class='del'>-	unsigned sq_thread_idle = 0;</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(ctx, &amp;sqd-&gt;ctx_list, sqd_list)</div><div class='del'>-		sq_thread_idle = max(sq_thread_idle, ctx-&gt;sq_thread_idle);</div><div class='del'>-	sqd-&gt;sq_thread_idle = sq_thread_idle;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool io_sqd_handle_event(struct io_sq_data *sqd)</div><div class='del'>-{</div><div class='del'>-	bool did_sig = false;</div><div class='del'>-	struct ksignal ksig;</div><div class='del'>-</div><div class='del'>-	if (test_bit(IO_SQ_THREAD_SHOULD_PARK, &amp;sqd-&gt;state) ||</div><div class='del'>-	    signal_pending(current)) {</div><div class='del'>-		mutex_unlock(&amp;sqd-&gt;lock);</div><div class='del'>-		if (signal_pending(current))</div><div class='del'>-			did_sig = get_signal(&amp;ksig);</div><div class='del'>-		cond_resched();</div><div class='del'>-		mutex_lock(&amp;sqd-&gt;lock);</div><div class='del'>-	}</div><div class='del'>-	return did_sig || test_bit(IO_SQ_THREAD_SHOULD_STOP, &amp;sqd-&gt;state);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_sq_thread(void *data)</div><div class='del'>-{</div><div class='del'>-	struct io_sq_data *sqd = data;</div><div class='del'>-	struct io_ring_ctx *ctx;</div><div class='del'>-	unsigned long timeout = 0;</div><div class='del'>-	char buf[TASK_COMM_LEN];</div><div class='del'>-	DEFINE_WAIT(wait);</div><div class='del'>-</div><div class='del'>-	snprintf(buf, sizeof(buf), "iou-sqp-%d", sqd-&gt;task_pid);</div><div class='del'>-	set_task_comm(current, buf);</div><div class='del'>-</div><div class='del'>-	if (sqd-&gt;sq_cpu != -1)</div><div class='del'>-		set_cpus_allowed_ptr(current, cpumask_of(sqd-&gt;sq_cpu));</div><div class='del'>-	else</div><div class='del'>-		set_cpus_allowed_ptr(current, cpu_online_mask);</div><div class='del'>-	current-&gt;flags |= PF_NO_SETAFFINITY;</div><div class='del'>-</div><div class='del'>-	audit_alloc_kernel(current);</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;sqd-&gt;lock);</div><div class='del'>-	while (1) {</div><div class='del'>-		bool cap_entries, sqt_spin = false;</div><div class='del'>-</div><div class='del'>-		if (io_sqd_events_pending(sqd) || signal_pending(current)) {</div><div class='del'>-			if (io_sqd_handle_event(sqd))</div><div class='del'>-				break;</div><div class='del'>-			timeout = jiffies + sqd-&gt;sq_thread_idle;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		cap_entries = !list_is_singular(&amp;sqd-&gt;ctx_list);</div><div class='del'>-		list_for_each_entry(ctx, &amp;sqd-&gt;ctx_list, sqd_list) {</div><div class='del'>-			int ret = __io_sq_thread(ctx, cap_entries);</div><div class='del'>-</div><div class='del'>-			if (!sqt_spin &amp;&amp; (ret &gt; 0 || !wq_list_empty(&amp;ctx-&gt;iopoll_list)))</div><div class='del'>-				sqt_spin = true;</div><div class='del'>-		}</div><div class='del'>-		if (io_run_task_work())</div><div class='del'>-			sqt_spin = true;</div><div class='del'>-</div><div class='del'>-		if (sqt_spin || !time_after(jiffies, timeout)) {</div><div class='del'>-			cond_resched();</div><div class='del'>-			if (sqt_spin)</div><div class='del'>-				timeout = jiffies + sqd-&gt;sq_thread_idle;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		prepare_to_wait(&amp;sqd-&gt;wait, &amp;wait, TASK_INTERRUPTIBLE);</div><div class='del'>-		if (!io_sqd_events_pending(sqd) &amp;&amp; !current-&gt;task_works) {</div><div class='del'>-			bool needs_sched = true;</div><div class='del'>-</div><div class='del'>-			list_for_each_entry(ctx, &amp;sqd-&gt;ctx_list, sqd_list) {</div><div class='del'>-				io_ring_set_wakeup_flag(ctx);</div><div class='del'>-</div><div class='del'>-				if ((ctx-&gt;flags &amp; IORING_SETUP_IOPOLL) &amp;&amp;</div><div class='del'>-				    !wq_list_empty(&amp;ctx-&gt;iopoll_list)) {</div><div class='del'>-					needs_sched = false;</div><div class='del'>-					break;</div><div class='del'>-				}</div><div class='del'>-				if (io_sqring_entries(ctx)) {</div><div class='del'>-					needs_sched = false;</div><div class='del'>-					break;</div><div class='del'>-				}</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			if (needs_sched) {</div><div class='del'>-				mutex_unlock(&amp;sqd-&gt;lock);</div><div class='del'>-				schedule();</div><div class='del'>-				mutex_lock(&amp;sqd-&gt;lock);</div><div class='del'>-			}</div><div class='del'>-			list_for_each_entry(ctx, &amp;sqd-&gt;ctx_list, sqd_list)</div><div class='del'>-				io_ring_clear_wakeup_flag(ctx);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		finish_wait(&amp;sqd-&gt;wait, &amp;wait);</div><div class='del'>-		timeout = jiffies + sqd-&gt;sq_thread_idle;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	io_uring_cancel_generic(true, sqd);</div><div class='del'>-	sqd-&gt;thread = NULL;</div><div class='del'>-	list_for_each_entry(ctx, &amp;sqd-&gt;ctx_list, sqd_list)</div><div class='del'>-		io_ring_set_wakeup_flag(ctx);</div><div class='del'>-	io_run_task_work();</div><div class='del'>-	mutex_unlock(&amp;sqd-&gt;lock);</div><div class='del'>-</div><div class='del'>-	audit_free(current);</div><div class='del'>-</div><div class='del'>-	complete(&amp;sqd-&gt;exited);</div><div class='del'>-	do_exit(0);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct io_wait_queue {</div><div class='del'>-	struct wait_queue_entry wq;</div><div class='del'>-	struct io_ring_ctx *ctx;</div><div class='del'>-	unsigned cq_tail;</div><div class='del'>-	unsigned nr_timeouts;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static inline bool io_should_wake(struct io_wait_queue *iowq)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = iowq-&gt;ctx;</div><div class='del'>-	int dist = ctx-&gt;cached_cq_tail - (int) iowq-&gt;cq_tail;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Wake up if we have enough events, or if a timeout occurred since we</div><div class='del'>-	 * started waiting. For timeouts, we always want to return to userspace,</div><div class='del'>-	 * regardless of event count.</div><div class='del'>-	 */</div><div class='del'>-	return dist &gt;= 0 || atomic_read(&amp;ctx-&gt;cq_timeouts) != iowq-&gt;nr_timeouts;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_wake_function(struct wait_queue_entry *curr, unsigned int mode,</div><div class='del'>-			    int wake_flags, void *key)</div><div class='del'>-{</div><div class='del'>-	struct io_wait_queue *iowq = container_of(curr, struct io_wait_queue,</div><div class='del'>-							wq);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Cannot safely flush overflowed CQEs from here, ensure we wake up</div><div class='del'>-	 * the task, and the next invocation will do it.</div><div class='del'>-	 */</div><div class='del'>-	if (io_should_wake(iowq) || test_bit(0, &amp;iowq-&gt;ctx-&gt;check_cq_overflow))</div><div class='del'>-		return autoremove_wake_function(curr, mode, wake_flags, key);</div><div class='del'>-	return -1;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_run_task_work_sig(void)</div><div class='del'>-{</div><div class='del'>-	if (io_run_task_work())</div><div class='del'>-		return 1;</div><div class='del'>-	if (!signal_pending(current))</div><div class='del'>-		return 0;</div><div class='del'>-	if (test_thread_flag(TIF_NOTIFY_SIGNAL))</div><div class='del'>-		return -ERESTARTSYS;</div><div class='del'>-	return -EINTR;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* when returns &gt;0, the caller should retry */</div><div class='del'>-static inline int io_cqring_wait_schedule(struct io_ring_ctx *ctx,</div><div class='del'>-					  struct io_wait_queue *iowq,</div><div class='del'>-					  signed long *timeout)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	/* make sure we run task_work before checking for signals */</div><div class='del'>-	ret = io_run_task_work_sig();</div><div class='del'>-	if (ret || io_should_wake(iowq))</div><div class='del'>-		return ret;</div><div class='del'>-	/* let the caller flush overflows, retry */</div><div class='del'>-	if (test_bit(0, &amp;ctx-&gt;check_cq_overflow))</div><div class='del'>-		return 1;</div><div class='del'>-</div><div class='del'>-	*timeout = schedule_timeout(*timeout);</div><div class='del'>-	return !*timeout ? -ETIME : 1;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Wait until events become available, if we don't already have some. The</div><div class='del'>- * application must reap them itself, as they reside on the shared cq ring.</div><div class='del'>- */</div><div class='del'>-static int io_cqring_wait(struct io_ring_ctx *ctx, int min_events,</div><div class='del'>-			  const sigset_t __user *sig, size_t sigsz,</div><div class='del'>-			  struct __kernel_timespec __user *uts)</div><div class='del'>-{</div><div class='del'>-	struct io_wait_queue iowq;</div><div class='del'>-	struct io_rings *rings = ctx-&gt;rings;</div><div class='del'>-	signed long timeout = MAX_SCHEDULE_TIMEOUT;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		io_cqring_overflow_flush(ctx);</div><div class='del'>-		if (io_cqring_events(ctx) &gt;= min_events)</div><div class='del'>-			return 0;</div><div class='del'>-		if (!io_run_task_work())</div><div class='del'>-			break;</div><div class='del'>-	} while (1);</div><div class='del'>-</div><div class='del'>-	if (uts) {</div><div class='del'>-		struct timespec64 ts;</div><div class='del'>-</div><div class='del'>-		if (get_timespec64(&amp;ts, uts))</div><div class='del'>-			return -EFAULT;</div><div class='del'>-		timeout = timespec64_to_jiffies(&amp;ts);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (sig) {</div><div class='del'>-#ifdef CONFIG_COMPAT</div><div class='del'>-		if (in_compat_syscall())</div><div class='del'>-			ret = set_compat_user_sigmask((const compat_sigset_t __user *)sig,</div><div class='del'>-						      sigsz);</div><div class='del'>-		else</div><div class='del'>-#endif</div><div class='del'>-			ret = set_user_sigmask(sig, sigsz);</div><div class='del'>-</div><div class='del'>-		if (ret)</div><div class='del'>-			return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	init_waitqueue_func_entry(&amp;iowq.wq, io_wake_function);</div><div class='del'>-	iowq.wq.private = current;</div><div class='del'>-	INIT_LIST_HEAD(&amp;iowq.wq.entry);</div><div class='del'>-	iowq.ctx = ctx;</div><div class='del'>-	iowq.nr_timeouts = atomic_read(&amp;ctx-&gt;cq_timeouts);</div><div class='del'>-	iowq.cq_tail = READ_ONCE(ctx-&gt;rings-&gt;cq.head) + min_events;</div><div class='del'>-</div><div class='del'>-	trace_io_uring_cqring_wait(ctx, min_events);</div><div class='del'>-	do {</div><div class='del'>-		/* if we can't even flush overflow, don't wait for more */</div><div class='del'>-		if (!io_cqring_overflow_flush(ctx)) {</div><div class='del'>-			ret = -EBUSY;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		prepare_to_wait_exclusive(&amp;ctx-&gt;cq_wait, &amp;iowq.wq,</div><div class='del'>-						TASK_INTERRUPTIBLE);</div><div class='del'>-		ret = io_cqring_wait_schedule(ctx, &amp;iowq, &amp;timeout);</div><div class='del'>-		finish_wait(&amp;ctx-&gt;cq_wait, &amp;iowq.wq);</div><div class='del'>-		cond_resched();</div><div class='del'>-	} while (ret &gt; 0);</div><div class='del'>-</div><div class='del'>-	restore_saved_sigmask_unless(ret == -EINTR);</div><div class='del'>-</div><div class='del'>-	return READ_ONCE(rings-&gt;cq.head) == READ_ONCE(rings-&gt;cq.tail) ? ret : 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_free_page_table(void **table, size_t size)</div><div class='del'>-{</div><div class='del'>-	unsigned i, nr_tables = DIV_ROUND_UP(size, PAGE_SIZE);</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; nr_tables; i++)</div><div class='del'>-		kfree(table[i]);</div><div class='del'>-	kfree(table);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold void **io_alloc_page_table(size_t size)</div><div class='del'>-{</div><div class='del'>-	unsigned i, nr_tables = DIV_ROUND_UP(size, PAGE_SIZE);</div><div class='del'>-	size_t init_size = size;</div><div class='del'>-	void **table;</div><div class='del'>-</div><div class='del'>-	table = kcalloc(nr_tables, sizeof(*table), GFP_KERNEL_ACCOUNT);</div><div class='del'>-	if (!table)</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; nr_tables; i++) {</div><div class='del'>-		unsigned int this_size = min_t(size_t, size, PAGE_SIZE);</div><div class='del'>-</div><div class='del'>-		table[i] = kzalloc(this_size, GFP_KERNEL_ACCOUNT);</div><div class='del'>-		if (!table[i]) {</div><div class='del'>-			io_free_page_table(table, init_size);</div><div class='del'>-			return NULL;</div><div class='del'>-		}</div><div class='del'>-		size -= this_size;</div><div class='del'>-	}</div><div class='del'>-	return table;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_rsrc_node_destroy(struct io_rsrc_node *ref_node)</div><div class='del'>-{</div><div class='del'>-	percpu_ref_exit(&amp;ref_node-&gt;refs);</div><div class='del'>-	kfree(ref_node);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold void io_rsrc_node_ref_zero(struct percpu_ref *ref)</div><div class='del'>-{</div><div class='del'>-	struct io_rsrc_node *node = container_of(ref, struct io_rsrc_node, refs);</div><div class='del'>-	struct io_ring_ctx *ctx = node-&gt;rsrc_data-&gt;ctx;</div><div class='del'>-	unsigned long flags;</div><div class='del'>-	bool first_add = false;</div><div class='del'>-</div><div class='del'>-	spin_lock_irqsave(&amp;ctx-&gt;rsrc_ref_lock, flags);</div><div class='del'>-	node-&gt;done = true;</div><div class='del'>-</div><div class='del'>-	while (!list_empty(&amp;ctx-&gt;rsrc_ref_list)) {</div><div class='del'>-		node = list_first_entry(&amp;ctx-&gt;rsrc_ref_list,</div><div class='del'>-					    struct io_rsrc_node, node);</div><div class='del'>-		/* recycle ref nodes in order */</div><div class='del'>-		if (!node-&gt;done)</div><div class='del'>-			break;</div><div class='del'>-		list_del(&amp;node-&gt;node);</div><div class='del'>-		first_add |= llist_add(&amp;node-&gt;llist, &amp;ctx-&gt;rsrc_put_llist);</div><div class='del'>-	}</div><div class='del'>-	spin_unlock_irqrestore(&amp;ctx-&gt;rsrc_ref_lock, flags);</div><div class='del'>-</div><div class='del'>-	if (first_add)</div><div class='del'>-		mod_delayed_work(system_wq, &amp;ctx-&gt;rsrc_put_work, HZ);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct io_rsrc_node *io_rsrc_node_alloc(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	struct io_rsrc_node *ref_node;</div><div class='del'>-</div><div class='del'>-	ref_node = kzalloc(sizeof(*ref_node), GFP_KERNEL);</div><div class='del'>-	if (!ref_node)</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	if (percpu_ref_init(&amp;ref_node-&gt;refs, io_rsrc_node_ref_zero,</div><div class='del'>-			    0, GFP_KERNEL)) {</div><div class='del'>-		kfree(ref_node);</div><div class='del'>-		return NULL;</div><div class='del'>-	}</div><div class='del'>-	INIT_LIST_HEAD(&amp;ref_node-&gt;node);</div><div class='del'>-	INIT_LIST_HEAD(&amp;ref_node-&gt;rsrc_list);</div><div class='del'>-	ref_node-&gt;done = false;</div><div class='del'>-	return ref_node;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_rsrc_node_switch(struct io_ring_ctx *ctx,</div><div class='del'>-				struct io_rsrc_data *data_to_kill)</div><div class='del'>-	__must_hold(&amp;ctx-&gt;uring_lock)</div><div class='del'>-{</div><div class='del'>-	WARN_ON_ONCE(!ctx-&gt;rsrc_backup_node);</div><div class='del'>-	WARN_ON_ONCE(data_to_kill &amp;&amp; !ctx-&gt;rsrc_node);</div><div class='del'>-</div><div class='del'>-	io_rsrc_refs_drop(ctx);</div><div class='del'>-</div><div class='del'>-	if (data_to_kill) {</div><div class='del'>-		struct io_rsrc_node *rsrc_node = ctx-&gt;rsrc_node;</div><div class='del'>-</div><div class='del'>-		rsrc_node-&gt;rsrc_data = data_to_kill;</div><div class='del'>-		spin_lock_irq(&amp;ctx-&gt;rsrc_ref_lock);</div><div class='del'>-		list_add_tail(&amp;rsrc_node-&gt;node, &amp;ctx-&gt;rsrc_ref_list);</div><div class='del'>-		spin_unlock_irq(&amp;ctx-&gt;rsrc_ref_lock);</div><div class='del'>-</div><div class='del'>-		atomic_inc(&amp;data_to_kill-&gt;refs);</div><div class='del'>-		percpu_ref_kill(&amp;rsrc_node-&gt;refs);</div><div class='del'>-		ctx-&gt;rsrc_node = NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!ctx-&gt;rsrc_node) {</div><div class='del'>-		ctx-&gt;rsrc_node = ctx-&gt;rsrc_backup_node;</div><div class='del'>-		ctx-&gt;rsrc_backup_node = NULL;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_rsrc_node_switch_start(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	if (ctx-&gt;rsrc_backup_node)</div><div class='del'>-		return 0;</div><div class='del'>-	ctx-&gt;rsrc_backup_node = io_rsrc_node_alloc(ctx);</div><div class='del'>-	return ctx-&gt;rsrc_backup_node ? 0 : -ENOMEM;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold int io_rsrc_ref_quiesce(struct io_rsrc_data *data,</div><div class='del'>-				      struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	/* As we may drop -&gt;uring_lock, other task may have started quiesce */</div><div class='del'>-	if (data-&gt;quiesce)</div><div class='del'>-		return -ENXIO;</div><div class='del'>-</div><div class='del'>-	data-&gt;quiesce = true;</div><div class='del'>-	do {</div><div class='del'>-		ret = io_rsrc_node_switch_start(ctx);</div><div class='del'>-		if (ret)</div><div class='del'>-			break;</div><div class='del'>-		io_rsrc_node_switch(ctx, data);</div><div class='del'>-</div><div class='del'>-		/* kill initial ref, already quiesced if zero */</div><div class='del'>-		if (atomic_dec_and_test(&amp;data-&gt;refs))</div><div class='del'>-			break;</div><div class='del'>-		mutex_unlock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-		flush_delayed_work(&amp;ctx-&gt;rsrc_put_work);</div><div class='del'>-		ret = wait_for_completion_interruptible(&amp;data-&gt;done);</div><div class='del'>-		if (!ret) {</div><div class='del'>-			mutex_lock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		atomic_inc(&amp;data-&gt;refs);</div><div class='del'>-		/* wait for all works potentially completing data-&gt;done */</div><div class='del'>-		flush_delayed_work(&amp;ctx-&gt;rsrc_put_work);</div><div class='del'>-		reinit_completion(&amp;data-&gt;done);</div><div class='del'>-</div><div class='del'>-		ret = io_run_task_work_sig();</div><div class='del'>-		mutex_lock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-	} while (ret &gt;= 0);</div><div class='del'>-	data-&gt;quiesce = false;</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static u64 *io_get_tag_slot(struct io_rsrc_data *data, unsigned int idx)</div><div class='del'>-{</div><div class='del'>-	unsigned int off = idx &amp; IO_RSRC_TAG_TABLE_MASK;</div><div class='del'>-	unsigned int table_idx = idx &gt;&gt; IO_RSRC_TAG_TABLE_SHIFT;</div><div class='del'>-</div><div class='del'>-	return &amp;data-&gt;tags[table_idx][off];</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_rsrc_data_free(struct io_rsrc_data *data)</div><div class='del'>-{</div><div class='del'>-	size_t size = data-&gt;nr * sizeof(data-&gt;tags[0][0]);</div><div class='del'>-</div><div class='del'>-	if (data-&gt;tags)</div><div class='del'>-		io_free_page_table((void **)data-&gt;tags, size);</div><div class='del'>-	kfree(data);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold int io_rsrc_data_alloc(struct io_ring_ctx *ctx, rsrc_put_fn *do_put,</div><div class='del'>-				     u64 __user *utags, unsigned nr,</div><div class='del'>-				     struct io_rsrc_data **pdata)</div><div class='del'>-{</div><div class='del'>-	struct io_rsrc_data *data;</div><div class='del'>-	int ret = -ENOMEM;</div><div class='del'>-	unsigned i;</div><div class='del'>-</div><div class='del'>-	data = kzalloc(sizeof(*data), GFP_KERNEL);</div><div class='del'>-	if (!data)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	data-&gt;tags = (u64 **)io_alloc_page_table(nr * sizeof(data-&gt;tags[0][0]));</div><div class='del'>-	if (!data-&gt;tags) {</div><div class='del'>-		kfree(data);</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	data-&gt;nr = nr;</div><div class='del'>-	data-&gt;ctx = ctx;</div><div class='del'>-	data-&gt;do_put = do_put;</div><div class='del'>-	if (utags) {</div><div class='del'>-		ret = -EFAULT;</div><div class='del'>-		for (i = 0; i &lt; nr; i++) {</div><div class='del'>-			u64 *tag_slot = io_get_tag_slot(data, i);</div><div class='del'>-</div><div class='del'>-			if (copy_from_user(tag_slot, &amp;utags[i],</div><div class='del'>-					   sizeof(*tag_slot)))</div><div class='del'>-				goto fail;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	atomic_set(&amp;data-&gt;refs, 1);</div><div class='del'>-	init_completion(&amp;data-&gt;done);</div><div class='del'>-	*pdata = data;</div><div class='del'>-	return 0;</div><div class='del'>-fail:</div><div class='del'>-	io_rsrc_data_free(data);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool io_alloc_file_tables(struct io_file_table *table, unsigned nr_files)</div><div class='del'>-{</div><div class='del'>-	table-&gt;files = kvcalloc(nr_files, sizeof(table-&gt;files[0]),</div><div class='del'>-				GFP_KERNEL_ACCOUNT);</div><div class='del'>-	return !!table-&gt;files;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_free_file_tables(struct io_file_table *table)</div><div class='del'>-{</div><div class='del'>-	kvfree(table-&gt;files);</div><div class='del'>-	table-&gt;files = NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void __io_sqe_files_unregister(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-#if defined(CONFIG_UNIX)</div><div class='del'>-	if (ctx-&gt;ring_sock) {</div><div class='del'>-		struct sock *sock = ctx-&gt;ring_sock-&gt;sk;</div><div class='del'>-		struct sk_buff *skb;</div><div class='del'>-</div><div class='del'>-		while ((skb = skb_dequeue(&amp;sock-&gt;sk_receive_queue)) != NULL)</div><div class='del'>-			kfree_skb(skb);</div><div class='del'>-	}</div><div class='del'>-#else</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; ctx-&gt;nr_user_files; i++) {</div><div class='del'>-		struct file *file;</div><div class='del'>-</div><div class='del'>-		file = io_file_from_index(ctx, i);</div><div class='del'>-		if (file)</div><div class='del'>-			fput(file);</div><div class='del'>-	}</div><div class='del'>-#endif</div><div class='del'>-	io_free_file_tables(&amp;ctx-&gt;file_table);</div><div class='del'>-	io_rsrc_data_free(ctx-&gt;file_data);</div><div class='del'>-	ctx-&gt;file_data = NULL;</div><div class='del'>-	ctx-&gt;nr_user_files = 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_sqe_files_unregister(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (!ctx-&gt;file_data)</div><div class='del'>-		return -ENXIO;</div><div class='del'>-	ret = io_rsrc_ref_quiesce(ctx-&gt;file_data, ctx);</div><div class='del'>-	if (!ret)</div><div class='del'>-		__io_sqe_files_unregister(ctx);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_sq_thread_unpark(struct io_sq_data *sqd)</div><div class='del'>-	__releases(&amp;sqd-&gt;lock)</div><div class='del'>-{</div><div class='del'>-	WARN_ON_ONCE(sqd-&gt;thread == current);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Do the dance but not conditional clear_bit() because it'd race with</div><div class='del'>-	 * other threads incrementing park_pending and setting the bit.</div><div class='del'>-	 */</div><div class='del'>-	clear_bit(IO_SQ_THREAD_SHOULD_PARK, &amp;sqd-&gt;state);</div><div class='del'>-	if (atomic_dec_return(&amp;sqd-&gt;park_pending))</div><div class='del'>-		set_bit(IO_SQ_THREAD_SHOULD_PARK, &amp;sqd-&gt;state);</div><div class='del'>-	mutex_unlock(&amp;sqd-&gt;lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_sq_thread_park(struct io_sq_data *sqd)</div><div class='del'>-	__acquires(&amp;sqd-&gt;lock)</div><div class='del'>-{</div><div class='del'>-	WARN_ON_ONCE(sqd-&gt;thread == current);</div><div class='del'>-</div><div class='del'>-	atomic_inc(&amp;sqd-&gt;park_pending);</div><div class='del'>-	set_bit(IO_SQ_THREAD_SHOULD_PARK, &amp;sqd-&gt;state);</div><div class='del'>-	mutex_lock(&amp;sqd-&gt;lock);</div><div class='del'>-	if (sqd-&gt;thread)</div><div class='del'>-		wake_up_process(sqd-&gt;thread);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_sq_thread_stop(struct io_sq_data *sqd)</div><div class='del'>-{</div><div class='del'>-	WARN_ON_ONCE(sqd-&gt;thread == current);</div><div class='del'>-	WARN_ON_ONCE(test_bit(IO_SQ_THREAD_SHOULD_STOP, &amp;sqd-&gt;state));</div><div class='del'>-</div><div class='del'>-	set_bit(IO_SQ_THREAD_SHOULD_STOP, &amp;sqd-&gt;state);</div><div class='del'>-	mutex_lock(&amp;sqd-&gt;lock);</div><div class='del'>-	if (sqd-&gt;thread)</div><div class='del'>-		wake_up_process(sqd-&gt;thread);</div><div class='del'>-	mutex_unlock(&amp;sqd-&gt;lock);</div><div class='del'>-	wait_for_completion(&amp;sqd-&gt;exited);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_put_sq_data(struct io_sq_data *sqd)</div><div class='del'>-{</div><div class='del'>-	if (refcount_dec_and_test(&amp;sqd-&gt;refs)) {</div><div class='del'>-		WARN_ON_ONCE(atomic_read(&amp;sqd-&gt;park_pending));</div><div class='del'>-</div><div class='del'>-		io_sq_thread_stop(sqd);</div><div class='del'>-		kfree(sqd);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_sq_thread_finish(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	struct io_sq_data *sqd = ctx-&gt;sq_data;</div><div class='del'>-</div><div class='del'>-	if (sqd) {</div><div class='del'>-		io_sq_thread_park(sqd);</div><div class='del'>-		list_del_init(&amp;ctx-&gt;sqd_list);</div><div class='del'>-		io_sqd_update_thread_idle(sqd);</div><div class='del'>-		io_sq_thread_unpark(sqd);</div><div class='del'>-</div><div class='del'>-		io_put_sq_data(sqd);</div><div class='del'>-		ctx-&gt;sq_data = NULL;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct io_sq_data *io_attach_sq_data(struct io_uring_params *p)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx_attach;</div><div class='del'>-	struct io_sq_data *sqd;</div><div class='del'>-	struct fd f;</div><div class='del'>-</div><div class='del'>-	f = fdget(p-&gt;wq_fd);</div><div class='del'>-	if (!f.file)</div><div class='del'>-		return ERR_PTR(-ENXIO);</div><div class='del'>-	if (f.file-&gt;f_op != &amp;io_uring_fops) {</div><div class='del'>-		fdput(f);</div><div class='del'>-		return ERR_PTR(-EINVAL);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ctx_attach = f.file-&gt;private_data;</div><div class='del'>-	sqd = ctx_attach-&gt;sq_data;</div><div class='del'>-	if (!sqd) {</div><div class='del'>-		fdput(f);</div><div class='del'>-		return ERR_PTR(-EINVAL);</div><div class='del'>-	}</div><div class='del'>-	if (sqd-&gt;task_tgid != current-&gt;tgid) {</div><div class='del'>-		fdput(f);</div><div class='del'>-		return ERR_PTR(-EPERM);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	refcount_inc(&amp;sqd-&gt;refs);</div><div class='del'>-	fdput(f);</div><div class='del'>-	return sqd;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct io_sq_data *io_get_sq_data(struct io_uring_params *p,</div><div class='del'>-					 bool *attached)</div><div class='del'>-{</div><div class='del'>-	struct io_sq_data *sqd;</div><div class='del'>-</div><div class='del'>-	*attached = false;</div><div class='del'>-	if (p-&gt;flags &amp; IORING_SETUP_ATTACH_WQ) {</div><div class='del'>-		sqd = io_attach_sq_data(p);</div><div class='del'>-		if (!IS_ERR(sqd)) {</div><div class='del'>-			*attached = true;</div><div class='del'>-			return sqd;</div><div class='del'>-		}</div><div class='del'>-		/* fall through for EPERM case, setup new sqd/task */</div><div class='del'>-		if (PTR_ERR(sqd) != -EPERM)</div><div class='del'>-			return sqd;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	sqd = kzalloc(sizeof(*sqd), GFP_KERNEL);</div><div class='del'>-	if (!sqd)</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='del'>-</div><div class='del'>-	atomic_set(&amp;sqd-&gt;park_pending, 0);</div><div class='del'>-	refcount_set(&amp;sqd-&gt;refs, 1);</div><div class='del'>-	INIT_LIST_HEAD(&amp;sqd-&gt;ctx_list);</div><div class='del'>-	mutex_init(&amp;sqd-&gt;lock);</div><div class='del'>-	init_waitqueue_head(&amp;sqd-&gt;wait);</div><div class='del'>-	init_completion(&amp;sqd-&gt;exited);</div><div class='del'>-	return sqd;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#if defined(CONFIG_UNIX)</div><div class='del'>-/*</div><div class='del'>- * Ensure the UNIX gc is aware of our file set, so we are certain that</div><div class='del'>- * the io_uring can be safely unregistered on process exit, even if we have</div><div class='del'>- * loops in the file referencing.</div><div class='del'>- */</div><div class='del'>-static int __io_sqe_files_scm(struct io_ring_ctx *ctx, int nr, int offset)</div><div class='del'>-{</div><div class='del'>-	struct sock *sk = ctx-&gt;ring_sock-&gt;sk;</div><div class='del'>-	struct scm_fp_list *fpl;</div><div class='del'>-	struct sk_buff *skb;</div><div class='del'>-	int i, nr_files;</div><div class='del'>-</div><div class='del'>-	fpl = kzalloc(sizeof(*fpl), GFP_KERNEL);</div><div class='del'>-	if (!fpl)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	skb = alloc_skb(0, GFP_KERNEL);</div><div class='del'>-	if (!skb) {</div><div class='del'>-		kfree(fpl);</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	skb-&gt;sk = sk;</div><div class='del'>-</div><div class='del'>-	nr_files = 0;</div><div class='del'>-	fpl-&gt;user = get_uid(current_user());</div><div class='del'>-	for (i = 0; i &lt; nr; i++) {</div><div class='del'>-		struct file *file = io_file_from_index(ctx, i + offset);</div><div class='del'>-</div><div class='del'>-		if (!file)</div><div class='del'>-			continue;</div><div class='del'>-		fpl-&gt;fp[nr_files] = get_file(file);</div><div class='del'>-		unix_inflight(fpl-&gt;user, fpl-&gt;fp[nr_files]);</div><div class='del'>-		nr_files++;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (nr_files) {</div><div class='del'>-		fpl-&gt;max = SCM_MAX_FD;</div><div class='del'>-		fpl-&gt;count = nr_files;</div><div class='del'>-		UNIXCB(skb).fp = fpl;</div><div class='del'>-		skb-&gt;destructor = unix_destruct_scm;</div><div class='del'>-		refcount_add(skb-&gt;truesize, &amp;sk-&gt;sk_wmem_alloc);</div><div class='del'>-		skb_queue_head(&amp;sk-&gt;sk_receive_queue, skb);</div><div class='del'>-</div><div class='del'>-		for (i = 0; i &lt; nr_files; i++)</div><div class='del'>-			fput(fpl-&gt;fp[i]);</div><div class='del'>-	} else {</div><div class='del'>-		kfree_skb(skb);</div><div class='del'>-		kfree(fpl);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * If UNIX sockets are enabled, fd passing can cause a reference cycle which</div><div class='del'>- * causes regular reference counting to break down. We rely on the UNIX</div><div class='del'>- * garbage collection to take care of this problem for us.</div><div class='del'>- */</div><div class='del'>-static int io_sqe_files_scm(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	unsigned left, total;</div><div class='del'>-	int ret = 0;</div><div class='del'>-</div><div class='del'>-	total = 0;</div><div class='del'>-	left = ctx-&gt;nr_user_files;</div><div class='del'>-	while (left) {</div><div class='del'>-		unsigned this_files = min_t(unsigned, left, SCM_MAX_FD);</div><div class='del'>-</div><div class='del'>-		ret = __io_sqe_files_scm(ctx, this_files, total);</div><div class='del'>-		if (ret)</div><div class='del'>-			break;</div><div class='del'>-		left -= this_files;</div><div class='del'>-		total += this_files;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!ret)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	while (total &lt; ctx-&gt;nr_user_files) {</div><div class='del'>-		struct file *file = io_file_from_index(ctx, total);</div><div class='del'>-</div><div class='del'>-		if (file)</div><div class='del'>-			fput(file);</div><div class='del'>-		total++;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-#else</div><div class='del'>-static int io_sqe_files_scm(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-static void io_rsrc_file_put(struct io_ring_ctx *ctx, struct io_rsrc_put *prsrc)</div><div class='del'>-{</div><div class='del'>-	struct file *file = prsrc-&gt;file;</div><div class='del'>-#if defined(CONFIG_UNIX)</div><div class='del'>-	struct sock *sock = ctx-&gt;ring_sock-&gt;sk;</div><div class='del'>-	struct sk_buff_head list, *head = &amp;sock-&gt;sk_receive_queue;</div><div class='del'>-	struct sk_buff *skb;</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	__skb_queue_head_init(&amp;list);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Find the skb that holds this file in its SCM_RIGHTS. When found,</div><div class='del'>-	 * remove this entry and rearrange the file array.</div><div class='del'>-	 */</div><div class='del'>-	skb = skb_dequeue(head);</div><div class='del'>-	while (skb) {</div><div class='del'>-		struct scm_fp_list *fp;</div><div class='del'>-</div><div class='del'>-		fp = UNIXCB(skb).fp;</div><div class='del'>-		for (i = 0; i &lt; fp-&gt;count; i++) {</div><div class='del'>-			int left;</div><div class='del'>-</div><div class='del'>-			if (fp-&gt;fp[i] != file)</div><div class='del'>-				continue;</div><div class='del'>-</div><div class='del'>-			unix_notinflight(fp-&gt;user, fp-&gt;fp[i]);</div><div class='del'>-			left = fp-&gt;count - 1 - i;</div><div class='del'>-			if (left) {</div><div class='del'>-				memmove(&amp;fp-&gt;fp[i], &amp;fp-&gt;fp[i + 1],</div><div class='del'>-						left * sizeof(struct file *));</div><div class='del'>-			}</div><div class='del'>-			fp-&gt;count--;</div><div class='del'>-			if (!fp-&gt;count) {</div><div class='del'>-				kfree_skb(skb);</div><div class='del'>-				skb = NULL;</div><div class='del'>-			} else {</div><div class='del'>-				__skb_queue_tail(&amp;list, skb);</div><div class='del'>-			}</div><div class='del'>-			fput(file);</div><div class='del'>-			file = NULL;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (!file)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		__skb_queue_tail(&amp;list, skb);</div><div class='del'>-</div><div class='del'>-		skb = skb_dequeue(head);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (skb_peek(&amp;list)) {</div><div class='del'>-		spin_lock_irq(&amp;head-&gt;lock);</div><div class='del'>-		while ((skb = __skb_dequeue(&amp;list)) != NULL)</div><div class='del'>-			__skb_queue_tail(head, skb);</div><div class='del'>-		spin_unlock_irq(&amp;head-&gt;lock);</div><div class='del'>-	}</div><div class='del'>-#else</div><div class='del'>-	fput(file);</div><div class='del'>-#endif</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void __io_rsrc_put_work(struct io_rsrc_node *ref_node)</div><div class='del'>-{</div><div class='del'>-	struct io_rsrc_data *rsrc_data = ref_node-&gt;rsrc_data;</div><div class='del'>-	struct io_ring_ctx *ctx = rsrc_data-&gt;ctx;</div><div class='del'>-	struct io_rsrc_put *prsrc, *tmp;</div><div class='del'>-</div><div class='del'>-	list_for_each_entry_safe(prsrc, tmp, &amp;ref_node-&gt;rsrc_list, list) {</div><div class='del'>-		list_del(&amp;prsrc-&gt;list);</div><div class='del'>-</div><div class='del'>-		if (prsrc-&gt;tag) {</div><div class='del'>-			bool lock_ring = ctx-&gt;flags &amp; IORING_SETUP_IOPOLL;</div><div class='del'>-</div><div class='del'>-			io_ring_submit_lock(ctx, lock_ring);</div><div class='del'>-			spin_lock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-			io_cqring_fill_event(ctx, prsrc-&gt;tag, 0, 0);</div><div class='del'>-			ctx-&gt;cq_extra++;</div><div class='del'>-			io_commit_cqring(ctx);</div><div class='del'>-			spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-			io_cqring_ev_posted(ctx);</div><div class='del'>-			io_ring_submit_unlock(ctx, lock_ring);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		rsrc_data-&gt;do_put(ctx, prsrc);</div><div class='del'>-		kfree(prsrc);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	io_rsrc_node_destroy(ref_node);</div><div class='del'>-	if (atomic_dec_and_test(&amp;rsrc_data-&gt;refs))</div><div class='del'>-		complete(&amp;rsrc_data-&gt;done);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_rsrc_put_work(struct work_struct *work)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx;</div><div class='del'>-	struct llist_node *node;</div><div class='del'>-</div><div class='del'>-	ctx = container_of(work, struct io_ring_ctx, rsrc_put_work.work);</div><div class='del'>-	node = llist_del_all(&amp;ctx-&gt;rsrc_put_llist);</div><div class='del'>-</div><div class='del'>-	while (node) {</div><div class='del'>-		struct io_rsrc_node *ref_node;</div><div class='del'>-		struct llist_node *next = node-&gt;next;</div><div class='del'>-</div><div class='del'>-		ref_node = llist_entry(node, struct io_rsrc_node, llist);</div><div class='del'>-		__io_rsrc_put_work(ref_node);</div><div class='del'>-		node = next;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_sqe_files_register(struct io_ring_ctx *ctx, void __user *arg,</div><div class='del'>-				 unsigned nr_args, u64 __user *tags)</div><div class='del'>-{</div><div class='del'>-	__s32 __user *fds = (__s32 __user *) arg;</div><div class='del'>-	struct file *file;</div><div class='del'>-	int fd, ret;</div><div class='del'>-	unsigned i;</div><div class='del'>-</div><div class='del'>-	if (ctx-&gt;file_data)</div><div class='del'>-		return -EBUSY;</div><div class='del'>-	if (!nr_args)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (nr_args &gt; IORING_MAX_FIXED_FILES)</div><div class='del'>-		return -EMFILE;</div><div class='del'>-	if (nr_args &gt; rlimit(RLIMIT_NOFILE))</div><div class='del'>-		return -EMFILE;</div><div class='del'>-	ret = io_rsrc_node_switch_start(ctx);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-	ret = io_rsrc_data_alloc(ctx, io_rsrc_file_put, tags, nr_args,</div><div class='del'>-				 &amp;ctx-&gt;file_data);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	ret = -ENOMEM;</div><div class='del'>-	if (!io_alloc_file_tables(&amp;ctx-&gt;file_table, nr_args))</div><div class='del'>-		goto out_free;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; nr_args; i++, ctx-&gt;nr_user_files++) {</div><div class='del'>-		if (copy_from_user(&amp;fd, &amp;fds[i], sizeof(fd))) {</div><div class='del'>-			ret = -EFAULT;</div><div class='del'>-			goto out_fput;</div><div class='del'>-		}</div><div class='del'>-		/* allow sparse sets */</div><div class='del'>-		if (fd == -1) {</div><div class='del'>-			ret = -EINVAL;</div><div class='del'>-			if (unlikely(*io_get_tag_slot(ctx-&gt;file_data, i)))</div><div class='del'>-				goto out_fput;</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		file = fget(fd);</div><div class='del'>-		ret = -EBADF;</div><div class='del'>-		if (unlikely(!file))</div><div class='del'>-			goto out_fput;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Don't allow io_uring instances to be registered. If UNIX</div><div class='del'>-		 * isn't enabled, then this causes a reference cycle and this</div><div class='del'>-		 * instance can never get freed. If UNIX is enabled we'll</div><div class='del'>-		 * handle it just fine, but there's still no point in allowing</div><div class='del'>-		 * a ring fd as it doesn't support regular read/write anyway.</div><div class='del'>-		 */</div><div class='del'>-		if (file-&gt;f_op == &amp;io_uring_fops) {</div><div class='del'>-			fput(file);</div><div class='del'>-			goto out_fput;</div><div class='del'>-		}</div><div class='del'>-		io_fixed_file_set(io_fixed_file_slot(&amp;ctx-&gt;file_table, i), file);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = io_sqe_files_scm(ctx);</div><div class='del'>-	if (ret) {</div><div class='del'>-		__io_sqe_files_unregister(ctx);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	io_rsrc_node_switch(ctx, NULL);</div><div class='del'>-	return ret;</div><div class='del'>-out_fput:</div><div class='del'>-	for (i = 0; i &lt; ctx-&gt;nr_user_files; i++) {</div><div class='del'>-		file = io_file_from_index(ctx, i);</div><div class='del'>-		if (file)</div><div class='del'>-			fput(file);</div><div class='del'>-	}</div><div class='del'>-	io_free_file_tables(&amp;ctx-&gt;file_table);</div><div class='del'>-	ctx-&gt;nr_user_files = 0;</div><div class='del'>-out_free:</div><div class='del'>-	io_rsrc_data_free(ctx-&gt;file_data);</div><div class='del'>-	ctx-&gt;file_data = NULL;</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_sqe_file_register(struct io_ring_ctx *ctx, struct file *file,</div><div class='del'>-				int index)</div><div class='del'>-{</div><div class='del'>-#if defined(CONFIG_UNIX)</div><div class='del'>-	struct sock *sock = ctx-&gt;ring_sock-&gt;sk;</div><div class='del'>-	struct sk_buff_head *head = &amp;sock-&gt;sk_receive_queue;</div><div class='del'>-	struct sk_buff *skb;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * See if we can merge this file into an existing skb SCM_RIGHTS</div><div class='del'>-	 * file set. If there's no room, fall back to allocating a new skb</div><div class='del'>-	 * and filling it in.</div><div class='del'>-	 */</div><div class='del'>-	spin_lock_irq(&amp;head-&gt;lock);</div><div class='del'>-	skb = skb_peek(head);</div><div class='del'>-	if (skb) {</div><div class='del'>-		struct scm_fp_list *fpl = UNIXCB(skb).fp;</div><div class='del'>-</div><div class='del'>-		if (fpl-&gt;count &lt; SCM_MAX_FD) {</div><div class='del'>-			__skb_unlink(skb, head);</div><div class='del'>-			spin_unlock_irq(&amp;head-&gt;lock);</div><div class='del'>-			fpl-&gt;fp[fpl-&gt;count] = get_file(file);</div><div class='del'>-			unix_inflight(fpl-&gt;user, fpl-&gt;fp[fpl-&gt;count]);</div><div class='del'>-			fpl-&gt;count++;</div><div class='del'>-			spin_lock_irq(&amp;head-&gt;lock);</div><div class='del'>-			__skb_queue_head(head, skb);</div><div class='del'>-		} else {</div><div class='del'>-			skb = NULL;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	spin_unlock_irq(&amp;head-&gt;lock);</div><div class='del'>-</div><div class='del'>-	if (skb) {</div><div class='del'>-		fput(file);</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return __io_sqe_files_scm(ctx, 1, index);</div><div class='del'>-#else</div><div class='del'>-	return 0;</div><div class='del'>-#endif</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_queue_rsrc_removal(struct io_rsrc_data *data, unsigned idx,</div><div class='del'>-				 struct io_rsrc_node *node, void *rsrc)</div><div class='del'>-{</div><div class='del'>-	struct io_rsrc_put *prsrc;</div><div class='del'>-</div><div class='del'>-	prsrc = kzalloc(sizeof(*prsrc), GFP_KERNEL);</div><div class='del'>-	if (!prsrc)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	prsrc-&gt;tag = *io_get_tag_slot(data, idx);</div><div class='del'>-	prsrc-&gt;rsrc = rsrc;</div><div class='del'>-	list_add(&amp;prsrc-&gt;list, &amp;node-&gt;rsrc_list);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_install_fixed_file(struct io_kiocb *req, struct file *file,</div><div class='del'>-				 unsigned int issue_flags, u32 slot_index)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-	bool needs_lock = issue_flags &amp; IO_URING_F_UNLOCKED;</div><div class='del'>-	bool needs_switch = false;</div><div class='del'>-	struct io_fixed_file *file_slot;</div><div class='del'>-	int ret = -EBADF;</div><div class='del'>-</div><div class='del'>-	io_ring_submit_lock(ctx, needs_lock);</div><div class='del'>-	if (file-&gt;f_op == &amp;io_uring_fops)</div><div class='del'>-		goto err;</div><div class='del'>-	ret = -ENXIO;</div><div class='del'>-	if (!ctx-&gt;file_data)</div><div class='del'>-		goto err;</div><div class='del'>-	ret = -EINVAL;</div><div class='del'>-	if (slot_index &gt;= ctx-&gt;nr_user_files)</div><div class='del'>-		goto err;</div><div class='del'>-</div><div class='del'>-	slot_index = array_index_nospec(slot_index, ctx-&gt;nr_user_files);</div><div class='del'>-	file_slot = io_fixed_file_slot(&amp;ctx-&gt;file_table, slot_index);</div><div class='del'>-</div><div class='del'>-	if (file_slot-&gt;file_ptr) {</div><div class='del'>-		struct file *old_file;</div><div class='del'>-</div><div class='del'>-		ret = io_rsrc_node_switch_start(ctx);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto err;</div><div class='del'>-</div><div class='del'>-		old_file = (struct file *)(file_slot-&gt;file_ptr &amp; FFS_MASK);</div><div class='del'>-		ret = io_queue_rsrc_removal(ctx-&gt;file_data, slot_index,</div><div class='del'>-					    ctx-&gt;rsrc_node, old_file);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto err;</div><div class='del'>-		file_slot-&gt;file_ptr = 0;</div><div class='del'>-		needs_switch = true;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	*io_get_tag_slot(ctx-&gt;file_data, slot_index) = 0;</div><div class='del'>-	io_fixed_file_set(file_slot, file);</div><div class='del'>-	ret = io_sqe_file_register(ctx, file, slot_index);</div><div class='del'>-	if (ret) {</div><div class='del'>-		file_slot-&gt;file_ptr = 0;</div><div class='del'>-		goto err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = 0;</div><div class='del'>-err:</div><div class='del'>-	if (needs_switch)</div><div class='del'>-		io_rsrc_node_switch(ctx, ctx-&gt;file_data);</div><div class='del'>-	io_ring_submit_unlock(ctx, needs_lock);</div><div class='del'>-	if (ret)</div><div class='del'>-		fput(file);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_close_fixed(struct io_kiocb *req, unsigned int issue_flags)</div><div class='del'>-{</div><div class='del'>-	unsigned int offset = req-&gt;close.file_slot - 1;</div><div class='del'>-	struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-	bool needs_lock = issue_flags &amp; IO_URING_F_UNLOCKED;</div><div class='del'>-	struct io_fixed_file *file_slot;</div><div class='del'>-	struct file *file;</div><div class='del'>-	int ret, i;</div><div class='del'>-</div><div class='del'>-	io_ring_submit_lock(ctx, needs_lock);</div><div class='del'>-	ret = -ENXIO;</div><div class='del'>-	if (unlikely(!ctx-&gt;file_data))</div><div class='del'>-		goto out;</div><div class='del'>-	ret = -EINVAL;</div><div class='del'>-	if (offset &gt;= ctx-&gt;nr_user_files)</div><div class='del'>-		goto out;</div><div class='del'>-	ret = io_rsrc_node_switch_start(ctx);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	i = array_index_nospec(offset, ctx-&gt;nr_user_files);</div><div class='del'>-	file_slot = io_fixed_file_slot(&amp;ctx-&gt;file_table, i);</div><div class='del'>-	ret = -EBADF;</div><div class='del'>-	if (!file_slot-&gt;file_ptr)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	file = (struct file *)(file_slot-&gt;file_ptr &amp; FFS_MASK);</div><div class='del'>-	ret = io_queue_rsrc_removal(ctx-&gt;file_data, offset, ctx-&gt;rsrc_node, file);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	file_slot-&gt;file_ptr = 0;</div><div class='del'>-	io_rsrc_node_switch(ctx, ctx-&gt;file_data);</div><div class='del'>-	ret = 0;</div><div class='del'>-out:</div><div class='del'>-	io_ring_submit_unlock(ctx, needs_lock);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int __io_sqe_files_update(struct io_ring_ctx *ctx,</div><div class='del'>-				 struct io_uring_rsrc_update2 *up,</div><div class='del'>-				 unsigned nr_args)</div><div class='del'>-{</div><div class='del'>-	u64 __user *tags = u64_to_user_ptr(up-&gt;tags);</div><div class='del'>-	__s32 __user *fds = u64_to_user_ptr(up-&gt;data);</div><div class='del'>-	struct io_rsrc_data *data = ctx-&gt;file_data;</div><div class='del'>-	struct io_fixed_file *file_slot;</div><div class='del'>-	struct file *file;</div><div class='del'>-	int fd, i, err = 0;</div><div class='del'>-	unsigned int done;</div><div class='del'>-	bool needs_switch = false;</div><div class='del'>-</div><div class='del'>-	if (!ctx-&gt;file_data)</div><div class='del'>-		return -ENXIO;</div><div class='del'>-	if (up-&gt;offset + nr_args &gt; ctx-&gt;nr_user_files)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	for (done = 0; done &lt; nr_args; done++) {</div><div class='del'>-		u64 tag = 0;</div><div class='del'>-</div><div class='del'>-		if ((tags &amp;&amp; copy_from_user(&amp;tag, &amp;tags[done], sizeof(tag))) ||</div><div class='del'>-		    copy_from_user(&amp;fd, &amp;fds[done], sizeof(fd))) {</div><div class='del'>-			err = -EFAULT;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		if ((fd == IORING_REGISTER_FILES_SKIP || fd == -1) &amp;&amp; tag) {</div><div class='del'>-			err = -EINVAL;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		if (fd == IORING_REGISTER_FILES_SKIP)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		i = array_index_nospec(up-&gt;offset + done, ctx-&gt;nr_user_files);</div><div class='del'>-		file_slot = io_fixed_file_slot(&amp;ctx-&gt;file_table, i);</div><div class='del'>-</div><div class='del'>-		if (file_slot-&gt;file_ptr) {</div><div class='del'>-			file = (struct file *)(file_slot-&gt;file_ptr &amp; FFS_MASK);</div><div class='del'>-			err = io_queue_rsrc_removal(data, up-&gt;offset + done,</div><div class='del'>-						    ctx-&gt;rsrc_node, file);</div><div class='del'>-			if (err)</div><div class='del'>-				break;</div><div class='del'>-			file_slot-&gt;file_ptr = 0;</div><div class='del'>-			needs_switch = true;</div><div class='del'>-		}</div><div class='del'>-		if (fd != -1) {</div><div class='del'>-			file = fget(fd);</div><div class='del'>-			if (!file) {</div><div class='del'>-				err = -EBADF;</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			/*</div><div class='del'>-			 * Don't allow io_uring instances to be registered. If</div><div class='del'>-			 * UNIX isn't enabled, then this causes a reference</div><div class='del'>-			 * cycle and this instance can never get freed. If UNIX</div><div class='del'>-			 * is enabled we'll handle it just fine, but there's</div><div class='del'>-			 * still no point in allowing a ring fd as it doesn't</div><div class='del'>-			 * support regular read/write anyway.</div><div class='del'>-			 */</div><div class='del'>-			if (file-&gt;f_op == &amp;io_uring_fops) {</div><div class='del'>-				fput(file);</div><div class='del'>-				err = -EBADF;</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			*io_get_tag_slot(data, up-&gt;offset + done) = tag;</div><div class='del'>-			io_fixed_file_set(file_slot, file);</div><div class='del'>-			err = io_sqe_file_register(ctx, file, i);</div><div class='del'>-			if (err) {</div><div class='del'>-				file_slot-&gt;file_ptr = 0;</div><div class='del'>-				fput(file);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (needs_switch)</div><div class='del'>-		io_rsrc_node_switch(ctx, data);</div><div class='del'>-	return done ? done : err;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct io_wq *io_init_wq_offload(struct io_ring_ctx *ctx,</div><div class='del'>-					struct task_struct *task)</div><div class='del'>-{</div><div class='del'>-	struct io_wq_hash *hash;</div><div class='del'>-	struct io_wq_data data;</div><div class='del'>-	unsigned int concurrency;</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-	hash = ctx-&gt;hash_map;</div><div class='del'>-	if (!hash) {</div><div class='del'>-		hash = kzalloc(sizeof(*hash), GFP_KERNEL);</div><div class='del'>-		if (!hash) {</div><div class='del'>-			mutex_unlock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-			return ERR_PTR(-ENOMEM);</div><div class='del'>-		}</div><div class='del'>-		refcount_set(&amp;hash-&gt;refs, 1);</div><div class='del'>-		init_waitqueue_head(&amp;hash-&gt;wait);</div><div class='del'>-		ctx-&gt;hash_map = hash;</div><div class='del'>-	}</div><div class='del'>-	mutex_unlock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-</div><div class='del'>-	data.hash = hash;</div><div class='del'>-	data.task = task;</div><div class='del'>-	data.free_work = io_wq_free_work;</div><div class='del'>-	data.do_work = io_wq_submit_work;</div><div class='del'>-</div><div class='del'>-	/* Do QD, or 4 * CPUS, whatever is smallest */</div><div class='del'>-	concurrency = min(ctx-&gt;sq_entries, 4 * num_online_cpus());</div><div class='del'>-</div><div class='del'>-	return io_wq_create(concurrency, &amp;data);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold int io_uring_alloc_task_context(struct task_struct *task,</div><div class='del'>-					      struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	struct io_uring_task *tctx;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	tctx = kzalloc(sizeof(*tctx), GFP_KERNEL);</div><div class='del'>-	if (unlikely(!tctx))</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	ret = percpu_counter_init(&amp;tctx-&gt;inflight, 0, GFP_KERNEL);</div><div class='del'>-	if (unlikely(ret)) {</div><div class='del'>-		kfree(tctx);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	tctx-&gt;io_wq = io_init_wq_offload(ctx, task);</div><div class='del'>-	if (IS_ERR(tctx-&gt;io_wq)) {</div><div class='del'>-		ret = PTR_ERR(tctx-&gt;io_wq);</div><div class='del'>-		percpu_counter_destroy(&amp;tctx-&gt;inflight);</div><div class='del'>-		kfree(tctx);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	xa_init(&amp;tctx-&gt;xa);</div><div class='del'>-	init_waitqueue_head(&amp;tctx-&gt;wait);</div><div class='del'>-	atomic_set(&amp;tctx-&gt;in_idle, 0);</div><div class='del'>-	atomic_set(&amp;tctx-&gt;inflight_tracked, 0);</div><div class='del'>-	task-&gt;io_uring = tctx;</div><div class='del'>-	spin_lock_init(&amp;tctx-&gt;task_lock);</div><div class='del'>-	INIT_WQ_LIST(&amp;tctx-&gt;task_list);</div><div class='del'>-	init_task_work(&amp;tctx-&gt;task_work, tctx_task_work);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void __io_uring_free(struct task_struct *tsk)</div><div class='del'>-{</div><div class='del'>-	struct io_uring_task *tctx = tsk-&gt;io_uring;</div><div class='del'>-</div><div class='del'>-	WARN_ON_ONCE(!xa_empty(&amp;tctx-&gt;xa));</div><div class='del'>-	WARN_ON_ONCE(tctx-&gt;io_wq);</div><div class='del'>-	WARN_ON_ONCE(tctx-&gt;cached_refs);</div><div class='del'>-</div><div class='del'>-	percpu_counter_destroy(&amp;tctx-&gt;inflight);</div><div class='del'>-	kfree(tctx);</div><div class='del'>-	tsk-&gt;io_uring = NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold int io_sq_offload_create(struct io_ring_ctx *ctx,</div><div class='del'>-				       struct io_uring_params *p)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	/* Retain compatibility with failing for an invalid attach attempt */</div><div class='del'>-	if ((ctx-&gt;flags &amp; (IORING_SETUP_ATTACH_WQ | IORING_SETUP_SQPOLL)) ==</div><div class='del'>-				IORING_SETUP_ATTACH_WQ) {</div><div class='del'>-		struct fd f;</div><div class='del'>-</div><div class='del'>-		f = fdget(p-&gt;wq_fd);</div><div class='del'>-		if (!f.file)</div><div class='del'>-			return -ENXIO;</div><div class='del'>-		if (f.file-&gt;f_op != &amp;io_uring_fops) {</div><div class='del'>-			fdput(f);</div><div class='del'>-			return -EINVAL;</div><div class='del'>-		}</div><div class='del'>-		fdput(f);</div><div class='del'>-	}</div><div class='del'>-	if (ctx-&gt;flags &amp; IORING_SETUP_SQPOLL) {</div><div class='del'>-		struct task_struct *tsk;</div><div class='del'>-		struct io_sq_data *sqd;</div><div class='del'>-		bool attached;</div><div class='del'>-</div><div class='del'>-		ret = security_uring_sqpoll();</div><div class='del'>-		if (ret)</div><div class='del'>-			return ret;</div><div class='del'>-</div><div class='del'>-		sqd = io_get_sq_data(p, &amp;attached);</div><div class='del'>-		if (IS_ERR(sqd)) {</div><div class='del'>-			ret = PTR_ERR(sqd);</div><div class='del'>-			goto err;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		ctx-&gt;sq_creds = get_current_cred();</div><div class='del'>-		ctx-&gt;sq_data = sqd;</div><div class='del'>-		ctx-&gt;sq_thread_idle = msecs_to_jiffies(p-&gt;sq_thread_idle);</div><div class='del'>-		if (!ctx-&gt;sq_thread_idle)</div><div class='del'>-			ctx-&gt;sq_thread_idle = HZ;</div><div class='del'>-</div><div class='del'>-		io_sq_thread_park(sqd);</div><div class='del'>-		list_add(&amp;ctx-&gt;sqd_list, &amp;sqd-&gt;ctx_list);</div><div class='del'>-		io_sqd_update_thread_idle(sqd);</div><div class='del'>-		/* don't attach to a dying SQPOLL thread, would be racy */</div><div class='del'>-		ret = (attached &amp;&amp; !sqd-&gt;thread) ? -ENXIO : 0;</div><div class='del'>-		io_sq_thread_unpark(sqd);</div><div class='del'>-</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			goto err;</div><div class='del'>-		if (attached)</div><div class='del'>-			return 0;</div><div class='del'>-</div><div class='del'>-		if (p-&gt;flags &amp; IORING_SETUP_SQ_AFF) {</div><div class='del'>-			int cpu = p-&gt;sq_thread_cpu;</div><div class='del'>-</div><div class='del'>-			ret = -EINVAL;</div><div class='del'>-			if (cpu &gt;= nr_cpu_ids || !cpu_online(cpu))</div><div class='del'>-				goto err_sqpoll;</div><div class='del'>-			sqd-&gt;sq_cpu = cpu;</div><div class='del'>-		} else {</div><div class='del'>-			sqd-&gt;sq_cpu = -1;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		sqd-&gt;task_pid = current-&gt;pid;</div><div class='del'>-		sqd-&gt;task_tgid = current-&gt;tgid;</div><div class='del'>-		tsk = create_io_thread(io_sq_thread, sqd, NUMA_NO_NODE);</div><div class='del'>-		if (IS_ERR(tsk)) {</div><div class='del'>-			ret = PTR_ERR(tsk);</div><div class='del'>-			goto err_sqpoll;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		sqd-&gt;thread = tsk;</div><div class='del'>-		ret = io_uring_alloc_task_context(tsk, ctx);</div><div class='del'>-		wake_up_new_task(tsk);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto err;</div><div class='del'>-	} else if (p-&gt;flags &amp; IORING_SETUP_SQ_AFF) {</div><div class='del'>-		/* Can't have SQ_AFF without SQPOLL */</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		goto err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-err_sqpoll:</div><div class='del'>-	complete(&amp;ctx-&gt;sq_data-&gt;exited);</div><div class='del'>-err:</div><div class='del'>-	io_sq_thread_finish(ctx);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void __io_unaccount_mem(struct user_struct *user,</div><div class='del'>-				      unsigned long nr_pages)</div><div class='del'>-{</div><div class='del'>-	atomic_long_sub(nr_pages, &amp;user-&gt;locked_vm);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline int __io_account_mem(struct user_struct *user,</div><div class='del'>-				   unsigned long nr_pages)</div><div class='del'>-{</div><div class='del'>-	unsigned long page_limit, cur_pages, new_pages;</div><div class='del'>-</div><div class='del'>-	/* Don't allow more pages than we can safely lock */</div><div class='del'>-	page_limit = rlimit(RLIMIT_MEMLOCK) &gt;&gt; PAGE_SHIFT;</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		cur_pages = atomic_long_read(&amp;user-&gt;locked_vm);</div><div class='del'>-		new_pages = cur_pages + nr_pages;</div><div class='del'>-		if (new_pages &gt; page_limit)</div><div class='del'>-			return -ENOMEM;</div><div class='del'>-	} while (atomic_long_cmpxchg(&amp;user-&gt;locked_vm, cur_pages,</div><div class='del'>-					new_pages) != cur_pages);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_unaccount_mem(struct io_ring_ctx *ctx, unsigned long nr_pages)</div><div class='del'>-{</div><div class='del'>-	if (ctx-&gt;user)</div><div class='del'>-		__io_unaccount_mem(ctx-&gt;user, nr_pages);</div><div class='del'>-</div><div class='del'>-	if (ctx-&gt;mm_account)</div><div class='del'>-		atomic64_sub(nr_pages, &amp;ctx-&gt;mm_account-&gt;pinned_vm);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_account_mem(struct io_ring_ctx *ctx, unsigned long nr_pages)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (ctx-&gt;user) {</div><div class='del'>-		ret = __io_account_mem(ctx-&gt;user, nr_pages);</div><div class='del'>-		if (ret)</div><div class='del'>-			return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (ctx-&gt;mm_account)</div><div class='del'>-		atomic64_add(nr_pages, &amp;ctx-&gt;mm_account-&gt;pinned_vm);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_mem_free(void *ptr)</div><div class='del'>-{</div><div class='del'>-	struct page *page;</div><div class='del'>-</div><div class='del'>-	if (!ptr)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	page = virt_to_head_page(ptr);</div><div class='del'>-	if (put_page_testzero(page))</div><div class='del'>-		free_compound_page(page);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void *io_mem_alloc(size_t size)</div><div class='del'>-{</div><div class='del'>-	gfp_t gfp_flags = GFP_KERNEL | __GFP_ZERO | __GFP_NOWARN | __GFP_COMP |</div><div class='del'>-				__GFP_NORETRY | __GFP_ACCOUNT;</div><div class='del'>-</div><div class='del'>-	return (void *) __get_free_pages(gfp_flags, get_order(size));</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static unsigned long rings_size(unsigned sq_entries, unsigned cq_entries,</div><div class='del'>-				size_t *sq_offset)</div><div class='del'>-{</div><div class='del'>-	struct io_rings *rings;</div><div class='del'>-	size_t off, sq_array_size;</div><div class='del'>-</div><div class='del'>-	off = struct_size(rings, cqes, cq_entries);</div><div class='del'>-	if (off == SIZE_MAX)</div><div class='del'>-		return SIZE_MAX;</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_SMP</div><div class='del'>-	off = ALIGN(off, SMP_CACHE_BYTES);</div><div class='del'>-	if (off == 0)</div><div class='del'>-		return SIZE_MAX;</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-	if (sq_offset)</div><div class='del'>-		*sq_offset = off;</div><div class='del'>-</div><div class='del'>-	sq_array_size = array_size(sizeof(u32), sq_entries);</div><div class='del'>-	if (sq_array_size == SIZE_MAX)</div><div class='del'>-		return SIZE_MAX;</div><div class='del'>-</div><div class='del'>-	if (check_add_overflow(off, sq_array_size, &amp;off))</div><div class='del'>-		return SIZE_MAX;</div><div class='del'>-</div><div class='del'>-	return off;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_buffer_unmap(struct io_ring_ctx *ctx, struct io_mapped_ubuf **slot)</div><div class='del'>-{</div><div class='del'>-	struct io_mapped_ubuf *imu = *slot;</div><div class='del'>-	unsigned int i;</div><div class='del'>-</div><div class='del'>-	if (imu != ctx-&gt;dummy_ubuf) {</div><div class='del'>-		for (i = 0; i &lt; imu-&gt;nr_bvecs; i++)</div><div class='del'>-			unpin_user_page(imu-&gt;bvec[i].bv_page);</div><div class='del'>-		if (imu-&gt;acct_pages)</div><div class='del'>-			io_unaccount_mem(ctx, imu-&gt;acct_pages);</div><div class='del'>-		kvfree(imu);</div><div class='del'>-	}</div><div class='del'>-	*slot = NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_rsrc_buf_put(struct io_ring_ctx *ctx, struct io_rsrc_put *prsrc)</div><div class='del'>-{</div><div class='del'>-	io_buffer_unmap(ctx, &amp;prsrc-&gt;buf);</div><div class='del'>-	prsrc-&gt;buf = NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void __io_sqe_buffers_unregister(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	unsigned int i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; ctx-&gt;nr_user_bufs; i++)</div><div class='del'>-		io_buffer_unmap(ctx, &amp;ctx-&gt;user_bufs[i]);</div><div class='del'>-	kfree(ctx-&gt;user_bufs);</div><div class='del'>-	io_rsrc_data_free(ctx-&gt;buf_data);</div><div class='del'>-	ctx-&gt;user_bufs = NULL;</div><div class='del'>-	ctx-&gt;buf_data = NULL;</div><div class='del'>-	ctx-&gt;nr_user_bufs = 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_sqe_buffers_unregister(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (!ctx-&gt;buf_data)</div><div class='del'>-		return -ENXIO;</div><div class='del'>-</div><div class='del'>-	ret = io_rsrc_ref_quiesce(ctx-&gt;buf_data, ctx);</div><div class='del'>-	if (!ret)</div><div class='del'>-		__io_sqe_buffers_unregister(ctx);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_copy_iov(struct io_ring_ctx *ctx, struct iovec *dst,</div><div class='del'>-		       void __user *arg, unsigned index)</div><div class='del'>-{</div><div class='del'>-	struct iovec __user *src;</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_COMPAT</div><div class='del'>-	if (ctx-&gt;compat) {</div><div class='del'>-		struct compat_iovec __user *ciovs;</div><div class='del'>-		struct compat_iovec ciov;</div><div class='del'>-</div><div class='del'>-		ciovs = (struct compat_iovec __user *) arg;</div><div class='del'>-		if (copy_from_user(&amp;ciov, &amp;ciovs[index], sizeof(ciov)))</div><div class='del'>-			return -EFAULT;</div><div class='del'>-</div><div class='del'>-		dst-&gt;iov_base = u64_to_user_ptr((u64)ciov.iov_base);</div><div class='del'>-		dst-&gt;iov_len = ciov.iov_len;</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-#endif</div><div class='del'>-	src = (struct iovec __user *) arg;</div><div class='del'>-	if (copy_from_user(dst, &amp;src[index], sizeof(*dst)))</div><div class='del'>-		return -EFAULT;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Not super efficient, but this is just a registration time. And we do cache</div><div class='del'>- * the last compound head, so generally we'll only do a full search if we don't</div><div class='del'>- * match that one.</div><div class='del'>- *</div><div class='del'>- * We check if the given compound head page has already been accounted, to</div><div class='del'>- * avoid double accounting it. This allows us to account the full size of the</div><div class='del'>- * page, not just the constituent pages of a huge page.</div><div class='del'>- */</div><div class='del'>-static bool headpage_already_acct(struct io_ring_ctx *ctx, struct page **pages,</div><div class='del'>-				  int nr_pages, struct page *hpage)</div><div class='del'>-{</div><div class='del'>-	int i, j;</div><div class='del'>-</div><div class='del'>-	/* check current page array */</div><div class='del'>-	for (i = 0; i &lt; nr_pages; i++) {</div><div class='del'>-		if (!PageCompound(pages[i]))</div><div class='del'>-			continue;</div><div class='del'>-		if (compound_head(pages[i]) == hpage)</div><div class='del'>-			return true;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* check previously registered pages */</div><div class='del'>-	for (i = 0; i &lt; ctx-&gt;nr_user_bufs; i++) {</div><div class='del'>-		struct io_mapped_ubuf *imu = ctx-&gt;user_bufs[i];</div><div class='del'>-</div><div class='del'>-		for (j = 0; j &lt; imu-&gt;nr_bvecs; j++) {</div><div class='del'>-			if (!PageCompound(imu-&gt;bvec[j].bv_page))</div><div class='del'>-				continue;</div><div class='del'>-			if (compound_head(imu-&gt;bvec[j].bv_page) == hpage)</div><div class='del'>-				return true;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_buffer_account_pin(struct io_ring_ctx *ctx, struct page **pages,</div><div class='del'>-				 int nr_pages, struct io_mapped_ubuf *imu,</div><div class='del'>-				 struct page **last_hpage)</div><div class='del'>-{</div><div class='del'>-	int i, ret;</div><div class='del'>-</div><div class='del'>-	imu-&gt;acct_pages = 0;</div><div class='del'>-	for (i = 0; i &lt; nr_pages; i++) {</div><div class='del'>-		if (!PageCompound(pages[i])) {</div><div class='del'>-			imu-&gt;acct_pages++;</div><div class='del'>-		} else {</div><div class='del'>-			struct page *hpage;</div><div class='del'>-</div><div class='del'>-			hpage = compound_head(pages[i]);</div><div class='del'>-			if (hpage == *last_hpage)</div><div class='del'>-				continue;</div><div class='del'>-			*last_hpage = hpage;</div><div class='del'>-			if (headpage_already_acct(ctx, pages, i, hpage))</div><div class='del'>-				continue;</div><div class='del'>-			imu-&gt;acct_pages += page_size(hpage) &gt;&gt; PAGE_SHIFT;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!imu-&gt;acct_pages)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	ret = io_account_mem(ctx, imu-&gt;acct_pages);</div><div class='del'>-	if (ret)</div><div class='del'>-		imu-&gt;acct_pages = 0;</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_sqe_buffer_register(struct io_ring_ctx *ctx, struct iovec *iov,</div><div class='del'>-				  struct io_mapped_ubuf **pimu,</div><div class='del'>-				  struct page **last_hpage)</div><div class='del'>-{</div><div class='del'>-	struct io_mapped_ubuf *imu = NULL;</div><div class='del'>-	struct vm_area_struct **vmas = NULL;</div><div class='del'>-	struct page **pages = NULL;</div><div class='del'>-	unsigned long off, start, end, ubuf;</div><div class='del'>-	size_t size;</div><div class='del'>-	int ret, pret, nr_pages, i;</div><div class='del'>-</div><div class='del'>-	if (!iov-&gt;iov_base) {</div><div class='del'>-		*pimu = ctx-&gt;dummy_ubuf;</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ubuf = (unsigned long) iov-&gt;iov_base;</div><div class='del'>-	end = (ubuf + iov-&gt;iov_len + PAGE_SIZE - 1) &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	start = ubuf &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	nr_pages = end - start;</div><div class='del'>-</div><div class='del'>-	*pimu = NULL;</div><div class='del'>-	ret = -ENOMEM;</div><div class='del'>-</div><div class='del'>-	pages = kvmalloc_array(nr_pages, sizeof(struct page *), GFP_KERNEL);</div><div class='del'>-	if (!pages)</div><div class='del'>-		goto done;</div><div class='del'>-</div><div class='del'>-	vmas = kvmalloc_array(nr_pages, sizeof(struct vm_area_struct *),</div><div class='del'>-			      GFP_KERNEL);</div><div class='del'>-	if (!vmas)</div><div class='del'>-		goto done;</div><div class='del'>-</div><div class='del'>-	imu = kvmalloc(struct_size(imu, bvec, nr_pages), GFP_KERNEL);</div><div class='del'>-	if (!imu)</div><div class='del'>-		goto done;</div><div class='del'>-</div><div class='del'>-	ret = 0;</div><div class='del'>-	mmap_read_lock(current-&gt;mm);</div><div class='del'>-	pret = pin_user_pages(ubuf, nr_pages, FOLL_WRITE | FOLL_LONGTERM,</div><div class='del'>-			      pages, vmas);</div><div class='del'>-	if (pret == nr_pages) {</div><div class='del'>-		/* don't support file backed memory */</div><div class='del'>-		for (i = 0; i &lt; nr_pages; i++) {</div><div class='del'>-			struct vm_area_struct *vma = vmas[i];</div><div class='del'>-</div><div class='del'>-			if (vma_is_shmem(vma))</div><div class='del'>-				continue;</div><div class='del'>-			if (vma-&gt;vm_file &amp;&amp;</div><div class='del'>-			    !is_file_hugepages(vma-&gt;vm_file)) {</div><div class='del'>-				ret = -EOPNOTSUPP;</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-		ret = pret &lt; 0 ? pret : -EFAULT;</div><div class='del'>-	}</div><div class='del'>-	mmap_read_unlock(current-&gt;mm);</div><div class='del'>-	if (ret) {</div><div class='del'>-		/*</div><div class='del'>-		 * if we did partial map, or found file backed vmas,</div><div class='del'>-		 * release any pages we did get</div><div class='del'>-		 */</div><div class='del'>-		if (pret &gt; 0)</div><div class='del'>-			unpin_user_pages(pages, pret);</div><div class='del'>-		goto done;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = io_buffer_account_pin(ctx, pages, pret, imu, last_hpage);</div><div class='del'>-	if (ret) {</div><div class='del'>-		unpin_user_pages(pages, pret);</div><div class='del'>-		goto done;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	off = ubuf &amp; ~PAGE_MASK;</div><div class='del'>-	size = iov-&gt;iov_len;</div><div class='del'>-	for (i = 0; i &lt; nr_pages; i++) {</div><div class='del'>-		size_t vec_len;</div><div class='del'>-</div><div class='del'>-		vec_len = min_t(size_t, size, PAGE_SIZE - off);</div><div class='del'>-		imu-&gt;bvec[i].bv_page = pages[i];</div><div class='del'>-		imu-&gt;bvec[i].bv_len = vec_len;</div><div class='del'>-		imu-&gt;bvec[i].bv_offset = off;</div><div class='del'>-		off = 0;</div><div class='del'>-		size -= vec_len;</div><div class='del'>-	}</div><div class='del'>-	/* store original address for later verification */</div><div class='del'>-	imu-&gt;ubuf = ubuf;</div><div class='del'>-	imu-&gt;ubuf_end = ubuf + iov-&gt;iov_len;</div><div class='del'>-	imu-&gt;nr_bvecs = nr_pages;</div><div class='del'>-	*pimu = imu;</div><div class='del'>-	ret = 0;</div><div class='del'>-done:</div><div class='del'>-	if (ret)</div><div class='del'>-		kvfree(imu);</div><div class='del'>-	kvfree(pages);</div><div class='del'>-	kvfree(vmas);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_buffers_map_alloc(struct io_ring_ctx *ctx, unsigned int nr_args)</div><div class='del'>-{</div><div class='del'>-	ctx-&gt;user_bufs = kcalloc(nr_args, sizeof(*ctx-&gt;user_bufs), GFP_KERNEL);</div><div class='del'>-	return ctx-&gt;user_bufs ? 0 : -ENOMEM;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_buffer_validate(struct iovec *iov)</div><div class='del'>-{</div><div class='del'>-	unsigned long tmp, acct_len = iov-&gt;iov_len + (PAGE_SIZE - 1);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Don't impose further limits on the size and buffer</div><div class='del'>-	 * constraints here, we'll -EINVAL later when IO is</div><div class='del'>-	 * submitted if they are wrong.</div><div class='del'>-	 */</div><div class='del'>-	if (!iov-&gt;iov_base)</div><div class='del'>-		return iov-&gt;iov_len ? -EFAULT : 0;</div><div class='del'>-	if (!iov-&gt;iov_len)</div><div class='del'>-		return -EFAULT;</div><div class='del'>-</div><div class='del'>-	/* arbitrary limit, but we need something */</div><div class='del'>-	if (iov-&gt;iov_len &gt; SZ_1G)</div><div class='del'>-		return -EFAULT;</div><div class='del'>-</div><div class='del'>-	if (check_add_overflow((unsigned long)iov-&gt;iov_base, acct_len, &amp;tmp))</div><div class='del'>-		return -EOVERFLOW;</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_sqe_buffers_register(struct io_ring_ctx *ctx, void __user *arg,</div><div class='del'>-				   unsigned int nr_args, u64 __user *tags)</div><div class='del'>-{</div><div class='del'>-	struct page *last_hpage = NULL;</div><div class='del'>-	struct io_rsrc_data *data;</div><div class='del'>-	int i, ret;</div><div class='del'>-	struct iovec iov;</div><div class='del'>-</div><div class='del'>-	if (ctx-&gt;user_bufs)</div><div class='del'>-		return -EBUSY;</div><div class='del'>-	if (!nr_args || nr_args &gt; IORING_MAX_REG_BUFFERS)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	ret = io_rsrc_node_switch_start(ctx);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-	ret = io_rsrc_data_alloc(ctx, io_rsrc_buf_put, tags, nr_args, &amp;data);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-	ret = io_buffers_map_alloc(ctx, nr_args);</div><div class='del'>-	if (ret) {</div><div class='del'>-		io_rsrc_data_free(data);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; nr_args; i++, ctx-&gt;nr_user_bufs++) {</div><div class='del'>-		ret = io_copy_iov(ctx, &amp;iov, arg, i);</div><div class='del'>-		if (ret)</div><div class='del'>-			break;</div><div class='del'>-		ret = io_buffer_validate(&amp;iov);</div><div class='del'>-		if (ret)</div><div class='del'>-			break;</div><div class='del'>-		if (!iov.iov_base &amp;&amp; *io_get_tag_slot(data, i)) {</div><div class='del'>-			ret = -EINVAL;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		ret = io_sqe_buffer_register(ctx, &amp;iov, &amp;ctx-&gt;user_bufs[i],</div><div class='del'>-					     &amp;last_hpage);</div><div class='del'>-		if (ret)</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	WARN_ON_ONCE(ctx-&gt;buf_data);</div><div class='del'>-</div><div class='del'>-	ctx-&gt;buf_data = data;</div><div class='del'>-	if (ret)</div><div class='del'>-		__io_sqe_buffers_unregister(ctx);</div><div class='del'>-	else</div><div class='del'>-		io_rsrc_node_switch(ctx, NULL);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int __io_sqe_buffers_update(struct io_ring_ctx *ctx,</div><div class='del'>-				   struct io_uring_rsrc_update2 *up,</div><div class='del'>-				   unsigned int nr_args)</div><div class='del'>-{</div><div class='del'>-	u64 __user *tags = u64_to_user_ptr(up-&gt;tags);</div><div class='del'>-	struct iovec iov, __user *iovs = u64_to_user_ptr(up-&gt;data);</div><div class='del'>-	struct page *last_hpage = NULL;</div><div class='del'>-	bool needs_switch = false;</div><div class='del'>-	__u32 done;</div><div class='del'>-	int i, err;</div><div class='del'>-</div><div class='del'>-	if (!ctx-&gt;buf_data)</div><div class='del'>-		return -ENXIO;</div><div class='del'>-	if (up-&gt;offset + nr_args &gt; ctx-&gt;nr_user_bufs)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	for (done = 0; done &lt; nr_args; done++) {</div><div class='del'>-		struct io_mapped_ubuf *imu;</div><div class='del'>-		int offset = up-&gt;offset + done;</div><div class='del'>-		u64 tag = 0;</div><div class='del'>-</div><div class='del'>-		err = io_copy_iov(ctx, &amp;iov, iovs, done);</div><div class='del'>-		if (err)</div><div class='del'>-			break;</div><div class='del'>-		if (tags &amp;&amp; copy_from_user(&amp;tag, &amp;tags[done], sizeof(tag))) {</div><div class='del'>-			err = -EFAULT;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		err = io_buffer_validate(&amp;iov);</div><div class='del'>-		if (err)</div><div class='del'>-			break;</div><div class='del'>-		if (!iov.iov_base &amp;&amp; tag) {</div><div class='del'>-			err = -EINVAL;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		err = io_sqe_buffer_register(ctx, &amp;iov, &amp;imu, &amp;last_hpage);</div><div class='del'>-		if (err)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		i = array_index_nospec(offset, ctx-&gt;nr_user_bufs);</div><div class='del'>-		if (ctx-&gt;user_bufs[i] != ctx-&gt;dummy_ubuf) {</div><div class='del'>-			err = io_queue_rsrc_removal(ctx-&gt;buf_data, offset,</div><div class='del'>-						    ctx-&gt;rsrc_node, ctx-&gt;user_bufs[i]);</div><div class='del'>-			if (unlikely(err)) {</div><div class='del'>-				io_buffer_unmap(ctx, &amp;imu);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			ctx-&gt;user_bufs[i] = NULL;</div><div class='del'>-			needs_switch = true;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		ctx-&gt;user_bufs[i] = imu;</div><div class='del'>-		*io_get_tag_slot(ctx-&gt;buf_data, offset) = tag;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (needs_switch)</div><div class='del'>-		io_rsrc_node_switch(ctx, ctx-&gt;buf_data);</div><div class='del'>-	return done ? done : err;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_eventfd_register(struct io_ring_ctx *ctx, void __user *arg)</div><div class='del'>-{</div><div class='del'>-	__s32 __user *fds = arg;</div><div class='del'>-	int fd;</div><div class='del'>-</div><div class='del'>-	if (ctx-&gt;cq_ev_fd)</div><div class='del'>-		return -EBUSY;</div><div class='del'>-</div><div class='del'>-	if (copy_from_user(&amp;fd, fds, sizeof(*fds)))</div><div class='del'>-		return -EFAULT;</div><div class='del'>-</div><div class='del'>-	ctx-&gt;cq_ev_fd = eventfd_ctx_fdget(fd);</div><div class='del'>-	if (IS_ERR(ctx-&gt;cq_ev_fd)) {</div><div class='del'>-		int ret = PTR_ERR(ctx-&gt;cq_ev_fd);</div><div class='del'>-</div><div class='del'>-		ctx-&gt;cq_ev_fd = NULL;</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_eventfd_unregister(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	if (ctx-&gt;cq_ev_fd) {</div><div class='del'>-		eventfd_ctx_put(ctx-&gt;cq_ev_fd);</div><div class='del'>-		ctx-&gt;cq_ev_fd = NULL;</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return -ENXIO;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_destroy_buffers(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	struct io_buffer *buf;</div><div class='del'>-	unsigned long index;</div><div class='del'>-</div><div class='del'>-	xa_for_each(&amp;ctx-&gt;io_buffers, index, buf) {</div><div class='del'>-		__io_remove_buffers(ctx, buf, index, -1U);</div><div class='del'>-		cond_resched();</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_req_caches_free(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	struct io_submit_state *state = &amp;ctx-&gt;submit_state;</div><div class='del'>-	int nr = 0;</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-	io_flush_cached_locked_reqs(ctx, state);</div><div class='del'>-</div><div class='del'>-	while (state-&gt;free_list.next) {</div><div class='del'>-		struct io_wq_work_node *node;</div><div class='del'>-		struct io_kiocb *req;</div><div class='del'>-</div><div class='del'>-		node = wq_stack_extract(&amp;state-&gt;free_list);</div><div class='del'>-		req = container_of(node, struct io_kiocb, comp_list);</div><div class='del'>-		kmem_cache_free(req_cachep, req);</div><div class='del'>-		nr++;</div><div class='del'>-	}</div><div class='del'>-	if (nr)</div><div class='del'>-		percpu_ref_put_many(&amp;ctx-&gt;refs, nr);</div><div class='del'>-	mutex_unlock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void io_wait_rsrc_data(struct io_rsrc_data *data)</div><div class='del'>-{</div><div class='del'>-	if (data &amp;&amp; !atomic_dec_and_test(&amp;data-&gt;refs))</div><div class='del'>-		wait_for_completion(&amp;data-&gt;done);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold void io_ring_ctx_free(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	io_sq_thread_finish(ctx);</div><div class='del'>-</div><div class='del'>-	if (ctx-&gt;mm_account) {</div><div class='del'>-		mmdrop(ctx-&gt;mm_account);</div><div class='del'>-		ctx-&gt;mm_account = NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	io_rsrc_refs_drop(ctx);</div><div class='del'>-	/* __io_rsrc_put_work() may need uring_lock to progress, wait w/o it */</div><div class='del'>-	io_wait_rsrc_data(ctx-&gt;buf_data);</div><div class='del'>-	io_wait_rsrc_data(ctx-&gt;file_data);</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-	if (ctx-&gt;buf_data)</div><div class='del'>-		__io_sqe_buffers_unregister(ctx);</div><div class='del'>-	if (ctx-&gt;file_data)</div><div class='del'>-		__io_sqe_files_unregister(ctx);</div><div class='del'>-	if (ctx-&gt;rings)</div><div class='del'>-		__io_cqring_overflow_flush(ctx, true);</div><div class='del'>-	mutex_unlock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-	io_eventfd_unregister(ctx);</div><div class='del'>-	io_destroy_buffers(ctx);</div><div class='del'>-	if (ctx-&gt;sq_creds)</div><div class='del'>-		put_cred(ctx-&gt;sq_creds);</div><div class='del'>-</div><div class='del'>-	/* there are no registered resources left, nobody uses it */</div><div class='del'>-	if (ctx-&gt;rsrc_node)</div><div class='del'>-		io_rsrc_node_destroy(ctx-&gt;rsrc_node);</div><div class='del'>-	if (ctx-&gt;rsrc_backup_node)</div><div class='del'>-		io_rsrc_node_destroy(ctx-&gt;rsrc_backup_node);</div><div class='del'>-	flush_delayed_work(&amp;ctx-&gt;rsrc_put_work);</div><div class='del'>-	flush_delayed_work(&amp;ctx-&gt;fallback_work);</div><div class='del'>-</div><div class='del'>-	WARN_ON_ONCE(!list_empty(&amp;ctx-&gt;rsrc_ref_list));</div><div class='del'>-	WARN_ON_ONCE(!llist_empty(&amp;ctx-&gt;rsrc_put_llist));</div><div class='del'>-</div><div class='del'>-#if defined(CONFIG_UNIX)</div><div class='del'>-	if (ctx-&gt;ring_sock) {</div><div class='del'>-		ctx-&gt;ring_sock-&gt;file = NULL; /* so that iput() is called */</div><div class='del'>-		sock_release(ctx-&gt;ring_sock);</div><div class='del'>-	}</div><div class='del'>-#endif</div><div class='del'>-	WARN_ON_ONCE(!list_empty(&amp;ctx-&gt;ltimeout_list));</div><div class='del'>-</div><div class='del'>-	io_mem_free(ctx-&gt;rings);</div><div class='del'>-	io_mem_free(ctx-&gt;sq_sqes);</div><div class='del'>-</div><div class='del'>-	percpu_ref_exit(&amp;ctx-&gt;refs);</div><div class='del'>-	free_uid(ctx-&gt;user);</div><div class='del'>-	io_req_caches_free(ctx);</div><div class='del'>-	if (ctx-&gt;hash_map)</div><div class='del'>-		io_wq_put_hash(ctx-&gt;hash_map);</div><div class='del'>-	kfree(ctx-&gt;cancel_hash);</div><div class='del'>-	kfree(ctx-&gt;dummy_ubuf);</div><div class='del'>-	kfree(ctx);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __poll_t io_uring_poll(struct file *file, poll_table *wait)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = file-&gt;private_data;</div><div class='del'>-	__poll_t mask = 0;</div><div class='del'>-</div><div class='del'>-	poll_wait(file, &amp;ctx-&gt;cq_wait, wait);</div><div class='del'>-	/*</div><div class='del'>-	 * synchronizes with barrier from wq_has_sleeper call in</div><div class='del'>-	 * io_commit_cqring</div><div class='del'>-	 */</div><div class='del'>-	smp_rmb();</div><div class='del'>-	if (!io_sqring_full(ctx))</div><div class='del'>-		mask |= EPOLLOUT | EPOLLWRNORM;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Don't flush cqring overflow list here, just do a simple check.</div><div class='del'>-	 * Otherwise there could possible be ABBA deadlock:</div><div class='del'>-	 *      CPU0                    CPU1</div><div class='del'>-	 *      ----                    ----</div><div class='del'>-	 * lock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-	 *                              lock(&amp;ep-&gt;mtx);</div><div class='del'>-	 *                              lock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-	 * lock(&amp;ep-&gt;mtx);</div><div class='del'>-	 *</div><div class='del'>-	 * Users may get EPOLLIN meanwhile seeing nothing in cqring, this</div><div class='del'>-	 * pushs them to do the flush.</div><div class='del'>-	 */</div><div class='del'>-	if (io_cqring_events(ctx) || test_bit(0, &amp;ctx-&gt;check_cq_overflow))</div><div class='del'>-		mask |= EPOLLIN | EPOLLRDNORM;</div><div class='del'>-</div><div class='del'>-	return mask;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_unregister_personality(struct io_ring_ctx *ctx, unsigned id)</div><div class='del'>-{</div><div class='del'>-	const struct cred *creds;</div><div class='del'>-</div><div class='del'>-	creds = xa_erase(&amp;ctx-&gt;personalities, id);</div><div class='del'>-	if (creds) {</div><div class='del'>-		put_cred(creds);</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return -EINVAL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct io_tctx_exit {</div><div class='del'>-	struct callback_head		task_work;</div><div class='del'>-	struct completion		completion;</div><div class='del'>-	struct io_ring_ctx		*ctx;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static __cold void io_tctx_exit_cb(struct callback_head *cb)</div><div class='del'>-{</div><div class='del'>-	struct io_uring_task *tctx = current-&gt;io_uring;</div><div class='del'>-	struct io_tctx_exit *work;</div><div class='del'>-</div><div class='del'>-	work = container_of(cb, struct io_tctx_exit, task_work);</div><div class='del'>-	/*</div><div class='del'>-	 * When @in_idle, we're in cancellation and it's racy to remove the</div><div class='del'>-	 * node. It'll be removed by the end of cancellation, just ignore it.</div><div class='del'>-	 */</div><div class='del'>-	if (!atomic_read(&amp;tctx-&gt;in_idle))</div><div class='del'>-		io_uring_del_tctx_node((unsigned long)work-&gt;ctx);</div><div class='del'>-	complete(&amp;work-&gt;completion);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold bool io_cancel_ctx_cb(struct io_wq_work *work, void *data)</div><div class='del'>-{</div><div class='del'>-	struct io_kiocb *req = container_of(work, struct io_kiocb, work);</div><div class='del'>-</div><div class='del'>-	return req-&gt;ctx == data;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold void io_ring_exit_work(struct work_struct *work)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = container_of(work, struct io_ring_ctx, exit_work);</div><div class='del'>-	unsigned long timeout = jiffies + HZ * 60 * 5;</div><div class='del'>-	unsigned long interval = HZ / 20;</div><div class='del'>-	struct io_tctx_exit exit;</div><div class='del'>-	struct io_tctx_node *node;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If we're doing polled IO and end up having requests being</div><div class='del'>-	 * submitted async (out-of-line), then completions can come in while</div><div class='del'>-	 * we're waiting for refs to drop. We need to reap these manually,</div><div class='del'>-	 * as nobody else will be looking for them.</div><div class='del'>-	 */</div><div class='del'>-	do {</div><div class='del'>-		io_uring_try_cancel_requests(ctx, NULL, true);</div><div class='del'>-		if (ctx-&gt;sq_data) {</div><div class='del'>-			struct io_sq_data *sqd = ctx-&gt;sq_data;</div><div class='del'>-			struct task_struct *tsk;</div><div class='del'>-</div><div class='del'>-			io_sq_thread_park(sqd);</div><div class='del'>-			tsk = sqd-&gt;thread;</div><div class='del'>-			if (tsk &amp;&amp; tsk-&gt;io_uring &amp;&amp; tsk-&gt;io_uring-&gt;io_wq)</div><div class='del'>-				io_wq_cancel_cb(tsk-&gt;io_uring-&gt;io_wq,</div><div class='del'>-						io_cancel_ctx_cb, ctx, true);</div><div class='del'>-			io_sq_thread_unpark(sqd);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		io_req_caches_free(ctx);</div><div class='del'>-</div><div class='del'>-		if (WARN_ON_ONCE(time_after(jiffies, timeout))) {</div><div class='del'>-			/* there is little hope left, don't run it too often */</div><div class='del'>-			interval = HZ * 60;</div><div class='del'>-		}</div><div class='del'>-	} while (!wait_for_completion_timeout(&amp;ctx-&gt;ref_comp, interval));</div><div class='del'>-</div><div class='del'>-	init_completion(&amp;exit.completion);</div><div class='del'>-	init_task_work(&amp;exit.task_work, io_tctx_exit_cb);</div><div class='del'>-	exit.ctx = ctx;</div><div class='del'>-	/*</div><div class='del'>-	 * Some may use context even when all refs and requests have been put,</div><div class='del'>-	 * and they are free to do so while still holding uring_lock or</div><div class='del'>-	 * completion_lock, see io_req_task_submit(). Apart from other work,</div><div class='del'>-	 * this lock/unlock section also waits them to finish.</div><div class='del'>-	 */</div><div class='del'>-	mutex_lock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-	while (!list_empty(&amp;ctx-&gt;tctx_list)) {</div><div class='del'>-		WARN_ON_ONCE(time_after(jiffies, timeout));</div><div class='del'>-</div><div class='del'>-		node = list_first_entry(&amp;ctx-&gt;tctx_list, struct io_tctx_node,</div><div class='del'>-					ctx_node);</div><div class='del'>-		/* don't spin on a single task if cancellation failed */</div><div class='del'>-		list_rotate_left(&amp;ctx-&gt;tctx_list);</div><div class='del'>-		ret = task_work_add(node-&gt;task, &amp;exit.task_work, TWA_SIGNAL);</div><div class='del'>-		if (WARN_ON_ONCE(ret))</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		mutex_unlock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-		wait_for_completion(&amp;exit.completion);</div><div class='del'>-		mutex_lock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-	}</div><div class='del'>-	mutex_unlock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-	spin_lock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-</div><div class='del'>-	io_ring_ctx_free(ctx);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* Returns true if we found and killed one or more timeouts */</div><div class='del'>-static __cold bool io_kill_timeouts(struct io_ring_ctx *ctx,</div><div class='del'>-				    struct task_struct *tsk, bool cancel_all)</div><div class='del'>-{</div><div class='del'>-	struct io_kiocb *req, *tmp;</div><div class='del'>-	int canceled = 0;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	spin_lock_irq(&amp;ctx-&gt;timeout_lock);</div><div class='del'>-	list_for_each_entry_safe(req, tmp, &amp;ctx-&gt;timeout_list, timeout.list) {</div><div class='del'>-		if (io_match_task(req, tsk, cancel_all)) {</div><div class='del'>-			io_kill_timeout(req, -ECANCELED);</div><div class='del'>-			canceled++;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	spin_unlock_irq(&amp;ctx-&gt;timeout_lock);</div><div class='del'>-	if (canceled != 0)</div><div class='del'>-		io_commit_cqring(ctx);</div><div class='del'>-	spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	if (canceled != 0)</div><div class='del'>-		io_cqring_ev_posted(ctx);</div><div class='del'>-	return canceled != 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold void io_ring_ctx_wait_and_kill(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	unsigned long index;</div><div class='del'>-	struct creds *creds;</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-	percpu_ref_kill(&amp;ctx-&gt;refs);</div><div class='del'>-	if (ctx-&gt;rings)</div><div class='del'>-		__io_cqring_overflow_flush(ctx, true);</div><div class='del'>-	xa_for_each(&amp;ctx-&gt;personalities, index, creds)</div><div class='del'>-		io_unregister_personality(ctx, index);</div><div class='del'>-	mutex_unlock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-</div><div class='del'>-	io_kill_timeouts(ctx, NULL, true);</div><div class='del'>-	io_poll_remove_all(ctx, NULL, true);</div><div class='del'>-</div><div class='del'>-	/* if we failed setting up the ctx, we might not have any rings */</div><div class='del'>-	io_iopoll_try_reap_events(ctx);</div><div class='del'>-</div><div class='del'>-	INIT_WORK(&amp;ctx-&gt;exit_work, io_ring_exit_work);</div><div class='del'>-	/*</div><div class='del'>-	 * Use system_unbound_wq to avoid spawning tons of event kworkers</div><div class='del'>-	 * if we're exiting a ton of rings at the same time. It just adds</div><div class='del'>-	 * noise and overhead, there's no discernable change in runtime</div><div class='del'>-	 * over using system_wq.</div><div class='del'>-	 */</div><div class='del'>-	queue_work(system_unbound_wq, &amp;ctx-&gt;exit_work);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_uring_release(struct inode *inode, struct file *file)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = file-&gt;private_data;</div><div class='del'>-</div><div class='del'>-	file-&gt;private_data = NULL;</div><div class='del'>-	io_ring_ctx_wait_and_kill(ctx);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct io_task_cancel {</div><div class='del'>-	struct task_struct *task;</div><div class='del'>-	bool all;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static bool io_cancel_task_cb(struct io_wq_work *work, void *data)</div><div class='del'>-{</div><div class='del'>-	struct io_kiocb *req = container_of(work, struct io_kiocb, work);</div><div class='del'>-	struct io_task_cancel *cancel = data;</div><div class='del'>-	bool ret;</div><div class='del'>-</div><div class='del'>-	if (!cancel-&gt;all &amp;&amp; (req-&gt;flags &amp; REQ_F_LINK_TIMEOUT)) {</div><div class='del'>-		struct io_ring_ctx *ctx = req-&gt;ctx;</div><div class='del'>-</div><div class='del'>-		/* protect against races with linked timeouts */</div><div class='del'>-		spin_lock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-		ret = io_match_task(req, cancel-&gt;task, cancel-&gt;all);</div><div class='del'>-		spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	} else {</div><div class='del'>-		ret = io_match_task(req, cancel-&gt;task, cancel-&gt;all);</div><div class='del'>-	}</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold bool io_cancel_defer_files(struct io_ring_ctx *ctx,</div><div class='del'>-					 struct task_struct *task,</div><div class='del'>-					 bool cancel_all)</div><div class='del'>-{</div><div class='del'>-	struct io_defer_entry *de;</div><div class='del'>-	LIST_HEAD(list);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	list_for_each_entry_reverse(de, &amp;ctx-&gt;defer_list, list) {</div><div class='del'>-		if (io_match_task(de-&gt;req, task, cancel_all)) {</div><div class='del'>-			list_cut_position(&amp;list, &amp;ctx-&gt;defer_list, &amp;de-&gt;list);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	if (list_empty(&amp;list))</div><div class='del'>-		return false;</div><div class='del'>-</div><div class='del'>-	while (!list_empty(&amp;list)) {</div><div class='del'>-		de = list_first_entry(&amp;list, struct io_defer_entry, list);</div><div class='del'>-		list_del_init(&amp;de-&gt;list);</div><div class='del'>-		io_req_complete_failed(de-&gt;req, -ECANCELED);</div><div class='del'>-		kfree(de);</div><div class='del'>-	}</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold bool io_uring_try_cancel_iowq(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	struct io_tctx_node *node;</div><div class='del'>-	enum io_wq_cancel cret;</div><div class='del'>-	bool ret = false;</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-	list_for_each_entry(node, &amp;ctx-&gt;tctx_list, ctx_node) {</div><div class='del'>-		struct io_uring_task *tctx = node-&gt;task-&gt;io_uring;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * io_wq will stay alive while we hold uring_lock, because it's</div><div class='del'>-		 * killed after ctx nodes, which requires to take the lock.</div><div class='del'>-		 */</div><div class='del'>-		if (!tctx || !tctx-&gt;io_wq)</div><div class='del'>-			continue;</div><div class='del'>-		cret = io_wq_cancel_cb(tctx-&gt;io_wq, io_cancel_ctx_cb, ctx, true);</div><div class='del'>-		ret |= (cret != IO_WQ_CANCEL_NOTFOUND);</div><div class='del'>-	}</div><div class='del'>-	mutex_unlock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold void io_uring_try_cancel_requests(struct io_ring_ctx *ctx,</div><div class='del'>-						struct task_struct *task,</div><div class='del'>-						bool cancel_all)</div><div class='del'>-{</div><div class='del'>-	struct io_task_cancel cancel = { .task = task, .all = cancel_all, };</div><div class='del'>-	struct io_uring_task *tctx = task ? task-&gt;io_uring : NULL;</div><div class='del'>-</div><div class='del'>-	while (1) {</div><div class='del'>-		enum io_wq_cancel cret;</div><div class='del'>-		bool ret = false;</div><div class='del'>-</div><div class='del'>-		if (!task) {</div><div class='del'>-			ret |= io_uring_try_cancel_iowq(ctx);</div><div class='del'>-		} else if (tctx &amp;&amp; tctx-&gt;io_wq) {</div><div class='del'>-			/*</div><div class='del'>-			 * Cancels requests of all rings, not only @ctx, but</div><div class='del'>-			 * it's fine as the task is in exit/exec.</div><div class='del'>-			 */</div><div class='del'>-			cret = io_wq_cancel_cb(tctx-&gt;io_wq, io_cancel_task_cb,</div><div class='del'>-					       &amp;cancel, true);</div><div class='del'>-			ret |= (cret != IO_WQ_CANCEL_NOTFOUND);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/* SQPOLL thread does its own polling */</div><div class='del'>-		if ((!(ctx-&gt;flags &amp; IORING_SETUP_SQPOLL) &amp;&amp; cancel_all) ||</div><div class='del'>-		    (ctx-&gt;sq_data &amp;&amp; ctx-&gt;sq_data-&gt;thread == current)) {</div><div class='del'>-			while (!wq_list_empty(&amp;ctx-&gt;iopoll_list)) {</div><div class='del'>-				io_iopoll_try_reap_events(ctx);</div><div class='del'>-				ret = true;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		ret |= io_cancel_defer_files(ctx, task, cancel_all);</div><div class='del'>-		ret |= io_poll_remove_all(ctx, task, cancel_all);</div><div class='del'>-		ret |= io_kill_timeouts(ctx, task, cancel_all);</div><div class='del'>-		if (task)</div><div class='del'>-			ret |= io_run_task_work();</div><div class='del'>-		if (!ret)</div><div class='del'>-			break;</div><div class='del'>-		cond_resched();</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int __io_uring_add_tctx_node(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	struct io_uring_task *tctx = current-&gt;io_uring;</div><div class='del'>-	struct io_tctx_node *node;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (unlikely(!tctx)) {</div><div class='del'>-		ret = io_uring_alloc_task_context(current, ctx);</div><div class='del'>-		if (unlikely(ret))</div><div class='del'>-			return ret;</div><div class='del'>-</div><div class='del'>-		tctx = current-&gt;io_uring;</div><div class='del'>-		if (ctx-&gt;iowq_limits_set) {</div><div class='del'>-			unsigned int limits[2] = { ctx-&gt;iowq_limits[0],</div><div class='del'>-						   ctx-&gt;iowq_limits[1], };</div><div class='del'>-</div><div class='del'>-			ret = io_wq_max_workers(tctx-&gt;io_wq, limits);</div><div class='del'>-			if (ret)</div><div class='del'>-				return ret;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	if (!xa_load(&amp;tctx-&gt;xa, (unsigned long)ctx)) {</div><div class='del'>-		node = kmalloc(sizeof(*node), GFP_KERNEL);</div><div class='del'>-		if (!node)</div><div class='del'>-			return -ENOMEM;</div><div class='del'>-		node-&gt;ctx = ctx;</div><div class='del'>-		node-&gt;task = current;</div><div class='del'>-</div><div class='del'>-		ret = xa_err(xa_store(&amp;tctx-&gt;xa, (unsigned long)ctx,</div><div class='del'>-					node, GFP_KERNEL));</div><div class='del'>-		if (ret) {</div><div class='del'>-			kfree(node);</div><div class='del'>-			return ret;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		mutex_lock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-		list_add(&amp;node-&gt;ctx_node, &amp;ctx-&gt;tctx_list);</div><div class='del'>-		mutex_unlock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-	}</div><div class='del'>-	tctx-&gt;last = ctx;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Note that this task has used io_uring. We use it for cancelation purposes.</div><div class='del'>- */</div><div class='del'>-static inline int io_uring_add_tctx_node(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	struct io_uring_task *tctx = current-&gt;io_uring;</div><div class='del'>-</div><div class='del'>-	if (likely(tctx &amp;&amp; tctx-&gt;last == ctx))</div><div class='del'>-		return 0;</div><div class='del'>-	return __io_uring_add_tctx_node(ctx);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Remove this io_uring_file -&gt; task mapping.</div><div class='del'>- */</div><div class='del'>-static __cold void io_uring_del_tctx_node(unsigned long index)</div><div class='del'>-{</div><div class='del'>-	struct io_uring_task *tctx = current-&gt;io_uring;</div><div class='del'>-	struct io_tctx_node *node;</div><div class='del'>-</div><div class='del'>-	if (!tctx)</div><div class='del'>-		return;</div><div class='del'>-	node = xa_erase(&amp;tctx-&gt;xa, index);</div><div class='del'>-	if (!node)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	WARN_ON_ONCE(current != node-&gt;task);</div><div class='del'>-	WARN_ON_ONCE(list_empty(&amp;node-&gt;ctx_node));</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;node-&gt;ctx-&gt;uring_lock);</div><div class='del'>-	list_del(&amp;node-&gt;ctx_node);</div><div class='del'>-	mutex_unlock(&amp;node-&gt;ctx-&gt;uring_lock);</div><div class='del'>-</div><div class='del'>-	if (tctx-&gt;last == node-&gt;ctx)</div><div class='del'>-		tctx-&gt;last = NULL;</div><div class='del'>-	kfree(node);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold void io_uring_clean_tctx(struct io_uring_task *tctx)</div><div class='del'>-{</div><div class='del'>-	struct io_wq *wq = tctx-&gt;io_wq;</div><div class='del'>-	struct io_tctx_node *node;</div><div class='del'>-	unsigned long index;</div><div class='del'>-</div><div class='del'>-	xa_for_each(&amp;tctx-&gt;xa, index, node) {</div><div class='del'>-		io_uring_del_tctx_node(index);</div><div class='del'>-		cond_resched();</div><div class='del'>-	}</div><div class='del'>-	if (wq) {</div><div class='del'>-		/*</div><div class='del'>-		 * Must be after io_uring_del_task_file() (removes nodes under</div><div class='del'>-		 * uring_lock) to avoid race with io_uring_try_cancel_iowq().</div><div class='del'>-		 */</div><div class='del'>-		io_wq_put_and_exit(wq);</div><div class='del'>-		tctx-&gt;io_wq = NULL;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static s64 tctx_inflight(struct io_uring_task *tctx, bool tracked)</div><div class='del'>-{</div><div class='del'>-	if (tracked)</div><div class='del'>-		return atomic_read(&amp;tctx-&gt;inflight_tracked);</div><div class='del'>-	return percpu_counter_sum(&amp;tctx-&gt;inflight);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold void io_uring_drop_tctx_refs(struct task_struct *task)</div><div class='del'>-{</div><div class='del'>-	struct io_uring_task *tctx = task-&gt;io_uring;</div><div class='del'>-	unsigned int refs = tctx-&gt;cached_refs;</div><div class='del'>-</div><div class='del'>-	if (refs) {</div><div class='del'>-		tctx-&gt;cached_refs = 0;</div><div class='del'>-		percpu_counter_sub(&amp;tctx-&gt;inflight, refs);</div><div class='del'>-		put_task_struct_many(task, refs);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Find any io_uring ctx that this task has registered or done IO on, and cancel</div><div class='del'>- * requests. @sqd should be not-null IIF it's an SQPOLL thread cancellation.</div><div class='del'>- */</div><div class='del'>-static __cold void io_uring_cancel_generic(bool cancel_all,</div><div class='del'>-					   struct io_sq_data *sqd)</div><div class='del'>-{</div><div class='del'>-	struct io_uring_task *tctx = current-&gt;io_uring;</div><div class='del'>-	struct io_ring_ctx *ctx;</div><div class='del'>-	s64 inflight;</div><div class='del'>-	DEFINE_WAIT(wait);</div><div class='del'>-</div><div class='del'>-	WARN_ON_ONCE(sqd &amp;&amp; sqd-&gt;thread != current);</div><div class='del'>-</div><div class='del'>-	if (!current-&gt;io_uring)</div><div class='del'>-		return;</div><div class='del'>-	if (tctx-&gt;io_wq)</div><div class='del'>-		io_wq_exit_start(tctx-&gt;io_wq);</div><div class='del'>-</div><div class='del'>-	atomic_inc(&amp;tctx-&gt;in_idle);</div><div class='del'>-	do {</div><div class='del'>-		io_uring_drop_tctx_refs(current);</div><div class='del'>-		/* read completions before cancelations */</div><div class='del'>-		inflight = tctx_inflight(tctx, !cancel_all);</div><div class='del'>-		if (!inflight)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		if (!sqd) {</div><div class='del'>-			struct io_tctx_node *node;</div><div class='del'>-			unsigned long index;</div><div class='del'>-</div><div class='del'>-			xa_for_each(&amp;tctx-&gt;xa, index, node) {</div><div class='del'>-				/* sqpoll task will cancel all its requests */</div><div class='del'>-				if (node-&gt;ctx-&gt;sq_data)</div><div class='del'>-					continue;</div><div class='del'>-				io_uring_try_cancel_requests(node-&gt;ctx, current,</div><div class='del'>-							     cancel_all);</div><div class='del'>-			}</div><div class='del'>-		} else {</div><div class='del'>-			list_for_each_entry(ctx, &amp;sqd-&gt;ctx_list, sqd_list)</div><div class='del'>-				io_uring_try_cancel_requests(ctx, current,</div><div class='del'>-							     cancel_all);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		prepare_to_wait(&amp;tctx-&gt;wait, &amp;wait, TASK_UNINTERRUPTIBLE);</div><div class='del'>-		io_uring_drop_tctx_refs(current);</div><div class='del'>-		/*</div><div class='del'>-		 * If we've seen completions, retry without waiting. This</div><div class='del'>-		 * avoids a race where a completion comes in before we did</div><div class='del'>-		 * prepare_to_wait().</div><div class='del'>-		 */</div><div class='del'>-		if (inflight == tctx_inflight(tctx, !cancel_all))</div><div class='del'>-			schedule();</div><div class='del'>-		finish_wait(&amp;tctx-&gt;wait, &amp;wait);</div><div class='del'>-	} while (1);</div><div class='del'>-	atomic_dec(&amp;tctx-&gt;in_idle);</div><div class='del'>-</div><div class='del'>-	io_uring_clean_tctx(tctx);</div><div class='del'>-	if (cancel_all) {</div><div class='del'>-		/* for exec all current's requests should be gone, kill tctx */</div><div class='del'>-		__io_uring_free(current);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void __io_uring_cancel(bool cancel_all)</div><div class='del'>-{</div><div class='del'>-	io_uring_cancel_generic(cancel_all, NULL);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void *io_uring_validate_mmap_request(struct file *file,</div><div class='del'>-					    loff_t pgoff, size_t sz)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = file-&gt;private_data;</div><div class='del'>-	loff_t offset = pgoff &lt;&lt; PAGE_SHIFT;</div><div class='del'>-	struct page *page;</div><div class='del'>-	void *ptr;</div><div class='del'>-</div><div class='del'>-	switch (offset) {</div><div class='del'>-	case IORING_OFF_SQ_RING:</div><div class='del'>-	case IORING_OFF_CQ_RING:</div><div class='del'>-		ptr = ctx-&gt;rings;</div><div class='del'>-		break;</div><div class='del'>-	case IORING_OFF_SQES:</div><div class='del'>-		ptr = ctx-&gt;sq_sqes;</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		return ERR_PTR(-EINVAL);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	page = virt_to_head_page(ptr);</div><div class='del'>-	if (sz &gt; page_size(page))</div><div class='del'>-		return ERR_PTR(-EINVAL);</div><div class='del'>-</div><div class='del'>-	return ptr;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_MMU</div><div class='del'>-</div><div class='del'>-static __cold int io_uring_mmap(struct file *file, struct vm_area_struct *vma)</div><div class='del'>-{</div><div class='del'>-	size_t sz = vma-&gt;vm_end - vma-&gt;vm_start;</div><div class='del'>-	unsigned long pfn;</div><div class='del'>-	void *ptr;</div><div class='del'>-</div><div class='del'>-	ptr = io_uring_validate_mmap_request(file, vma-&gt;vm_pgoff, sz);</div><div class='del'>-	if (IS_ERR(ptr))</div><div class='del'>-		return PTR_ERR(ptr);</div><div class='del'>-</div><div class='del'>-	pfn = virt_to_phys(ptr) &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	return remap_pfn_range(vma, vma-&gt;vm_start, pfn, sz, vma-&gt;vm_page_prot);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#else /* !CONFIG_MMU */</div><div class='del'>-</div><div class='del'>-static int io_uring_mmap(struct file *file, struct vm_area_struct *vma)</div><div class='del'>-{</div><div class='del'>-	return vma-&gt;vm_flags &amp; (VM_SHARED | VM_MAYSHARE) ? 0 : -EINVAL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static unsigned int io_uring_nommu_mmap_capabilities(struct file *file)</div><div class='del'>-{</div><div class='del'>-	return NOMMU_MAP_DIRECT | NOMMU_MAP_READ | NOMMU_MAP_WRITE;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static unsigned long io_uring_nommu_get_unmapped_area(struct file *file,</div><div class='del'>-	unsigned long addr, unsigned long len,</div><div class='del'>-	unsigned long pgoff, unsigned long flags)</div><div class='del'>-{</div><div class='del'>-	void *ptr;</div><div class='del'>-</div><div class='del'>-	ptr = io_uring_validate_mmap_request(file, pgoff, len);</div><div class='del'>-	if (IS_ERR(ptr))</div><div class='del'>-		return PTR_ERR(ptr);</div><div class='del'>-</div><div class='del'>-	return (unsigned long) ptr;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#endif /* !CONFIG_MMU */</div><div class='del'>-</div><div class='del'>-static int io_sqpoll_wait_sq(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	DEFINE_WAIT(wait);</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		if (!io_sqring_full(ctx))</div><div class='del'>-			break;</div><div class='del'>-		prepare_to_wait(&amp;ctx-&gt;sqo_sq_wait, &amp;wait, TASK_INTERRUPTIBLE);</div><div class='del'>-</div><div class='del'>-		if (!io_sqring_full(ctx))</div><div class='del'>-			break;</div><div class='del'>-		schedule();</div><div class='del'>-	} while (!signal_pending(current));</div><div class='del'>-</div><div class='del'>-	finish_wait(&amp;ctx-&gt;sqo_sq_wait, &amp;wait);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_get_ext_arg(unsigned flags, const void __user *argp, size_t *argsz,</div><div class='del'>-			  struct __kernel_timespec __user **ts,</div><div class='del'>-			  const sigset_t __user **sig)</div><div class='del'>-{</div><div class='del'>-	struct io_uring_getevents_arg arg;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * If EXT_ARG isn't set, then we have no timespec and the argp pointer</div><div class='del'>-	 * is just a pointer to the sigset_t.</div><div class='del'>-	 */</div><div class='del'>-	if (!(flags &amp; IORING_ENTER_EXT_ARG)) {</div><div class='del'>-		*sig = (const sigset_t __user *) argp;</div><div class='del'>-		*ts = NULL;</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * EXT_ARG is set - ensure we agree on the size of it and copy in our</div><div class='del'>-	 * timespec and sigset_t pointers if good.</div><div class='del'>-	 */</div><div class='del'>-	if (*argsz != sizeof(arg))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (copy_from_user(&amp;arg, argp, sizeof(arg)))</div><div class='del'>-		return -EFAULT;</div><div class='del'>-	*sig = u64_to_user_ptr(arg.sigmask);</div><div class='del'>-	*argsz = arg.sigmask_sz;</div><div class='del'>-	*ts = u64_to_user_ptr(arg.ts);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-SYSCALL_DEFINE6(io_uring_enter, unsigned int, fd, u32, to_submit,</div><div class='del'>-		u32, min_complete, u32, flags, const void __user *, argp,</div><div class='del'>-		size_t, argsz)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx;</div><div class='del'>-	int submitted = 0;</div><div class='del'>-	struct fd f;</div><div class='del'>-	long ret;</div><div class='del'>-</div><div class='del'>-	io_run_task_work();</div><div class='del'>-</div><div class='del'>-	if (unlikely(flags &amp; ~(IORING_ENTER_GETEVENTS | IORING_ENTER_SQ_WAKEUP |</div><div class='del'>-			       IORING_ENTER_SQ_WAIT | IORING_ENTER_EXT_ARG)))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	f = fdget(fd);</div><div class='del'>-	if (unlikely(!f.file))</div><div class='del'>-		return -EBADF;</div><div class='del'>-</div><div class='del'>-	ret = -EOPNOTSUPP;</div><div class='del'>-	if (unlikely(f.file-&gt;f_op != &amp;io_uring_fops))</div><div class='del'>-		goto out_fput;</div><div class='del'>-</div><div class='del'>-	ret = -ENXIO;</div><div class='del'>-	ctx = f.file-&gt;private_data;</div><div class='del'>-	if (unlikely(!percpu_ref_tryget(&amp;ctx-&gt;refs)))</div><div class='del'>-		goto out_fput;</div><div class='del'>-</div><div class='del'>-	ret = -EBADFD;</div><div class='del'>-	if (unlikely(ctx-&gt;flags &amp; IORING_SETUP_R_DISABLED))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * For SQ polling, the thread will do all submissions and completions.</div><div class='del'>-	 * Just return the requested submit count, and wake the thread if</div><div class='del'>-	 * we were asked to.</div><div class='del'>-	 */</div><div class='del'>-	ret = 0;</div><div class='del'>-	if (ctx-&gt;flags &amp; IORING_SETUP_SQPOLL) {</div><div class='del'>-		io_cqring_overflow_flush(ctx);</div><div class='del'>-</div><div class='del'>-		if (unlikely(ctx-&gt;sq_data-&gt;thread == NULL)) {</div><div class='del'>-			ret = -EOWNERDEAD;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		if (flags &amp; IORING_ENTER_SQ_WAKEUP)</div><div class='del'>-			wake_up(&amp;ctx-&gt;sq_data-&gt;wait);</div><div class='del'>-		if (flags &amp; IORING_ENTER_SQ_WAIT) {</div><div class='del'>-			ret = io_sqpoll_wait_sq(ctx);</div><div class='del'>-			if (ret)</div><div class='del'>-				goto out;</div><div class='del'>-		}</div><div class='del'>-		submitted = to_submit;</div><div class='del'>-	} else if (to_submit) {</div><div class='del'>-		ret = io_uring_add_tctx_node(ctx);</div><div class='del'>-		if (unlikely(ret))</div><div class='del'>-			goto out;</div><div class='del'>-		mutex_lock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-		submitted = io_submit_sqes(ctx, to_submit);</div><div class='del'>-		mutex_unlock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-</div><div class='del'>-		if (submitted != to_submit)</div><div class='del'>-			goto out;</div><div class='del'>-	}</div><div class='del'>-	if (flags &amp; IORING_ENTER_GETEVENTS) {</div><div class='del'>-		const sigset_t __user *sig;</div><div class='del'>-		struct __kernel_timespec __user *ts;</div><div class='del'>-</div><div class='del'>-		ret = io_get_ext_arg(flags, argp, &amp;argsz, &amp;ts, &amp;sig);</div><div class='del'>-		if (unlikely(ret))</div><div class='del'>-			goto out;</div><div class='del'>-</div><div class='del'>-		min_complete = min(min_complete, ctx-&gt;cq_entries);</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * When SETUP_IOPOLL and SETUP_SQPOLL are both enabled, user</div><div class='del'>-		 * space applications don't need to do io completion events</div><div class='del'>-		 * polling again, they can rely on io_sq_thread to do polling</div><div class='del'>-		 * work, which can reduce cpu usage and uring_lock contention.</div><div class='del'>-		 */</div><div class='del'>-		if (ctx-&gt;flags &amp; IORING_SETUP_IOPOLL &amp;&amp;</div><div class='del'>-		    !(ctx-&gt;flags &amp; IORING_SETUP_SQPOLL)) {</div><div class='del'>-			ret = io_iopoll_check(ctx, min_complete);</div><div class='del'>-		} else {</div><div class='del'>-			ret = io_cqring_wait(ctx, min_complete, sig, argsz, ts);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	percpu_ref_put(&amp;ctx-&gt;refs);</div><div class='del'>-out_fput:</div><div class='del'>-	fdput(f);</div><div class='del'>-	return submitted ? submitted : ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_PROC_FS</div><div class='del'>-static __cold int io_uring_show_cred(struct seq_file *m, unsigned int id,</div><div class='del'>-		const struct cred *cred)</div><div class='del'>-{</div><div class='del'>-	struct user_namespace *uns = seq_user_ns(m);</div><div class='del'>-	struct group_info *gi;</div><div class='del'>-	kernel_cap_t cap;</div><div class='del'>-	unsigned __capi;</div><div class='del'>-	int g;</div><div class='del'>-</div><div class='del'>-	seq_printf(m, "%5d\n", id);</div><div class='del'>-	seq_put_decimal_ull(m, "\tUid:\t", from_kuid_munged(uns, cred-&gt;uid));</div><div class='del'>-	seq_put_decimal_ull(m, "\t\t", from_kuid_munged(uns, cred-&gt;euid));</div><div class='del'>-	seq_put_decimal_ull(m, "\t\t", from_kuid_munged(uns, cred-&gt;suid));</div><div class='del'>-	seq_put_decimal_ull(m, "\t\t", from_kuid_munged(uns, cred-&gt;fsuid));</div><div class='del'>-	seq_put_decimal_ull(m, "\n\tGid:\t", from_kgid_munged(uns, cred-&gt;gid));</div><div class='del'>-	seq_put_decimal_ull(m, "\t\t", from_kgid_munged(uns, cred-&gt;egid));</div><div class='del'>-	seq_put_decimal_ull(m, "\t\t", from_kgid_munged(uns, cred-&gt;sgid));</div><div class='del'>-	seq_put_decimal_ull(m, "\t\t", from_kgid_munged(uns, cred-&gt;fsgid));</div><div class='del'>-	seq_puts(m, "\n\tGroups:\t");</div><div class='del'>-	gi = cred-&gt;group_info;</div><div class='del'>-	for (g = 0; g &lt; gi-&gt;ngroups; g++) {</div><div class='del'>-		seq_put_decimal_ull(m, g ? " " : "",</div><div class='del'>-					from_kgid_munged(uns, gi-&gt;gid[g]));</div><div class='del'>-	}</div><div class='del'>-	seq_puts(m, "\n\tCapEff:\t");</div><div class='del'>-	cap = cred-&gt;cap_effective;</div><div class='del'>-	CAP_FOR_EACH_U32(__capi)</div><div class='del'>-		seq_put_hex_ll(m, NULL, cap.cap[CAP_LAST_U32 - __capi], 8);</div><div class='del'>-	seq_putc(m, '\n');</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold void __io_uring_show_fdinfo(struct io_ring_ctx *ctx,</div><div class='del'>-					  struct seq_file *m)</div><div class='del'>-{</div><div class='del'>-	struct io_sq_data *sq = NULL;</div><div class='del'>-	struct io_overflow_cqe *ocqe;</div><div class='del'>-	struct io_rings *r = ctx-&gt;rings;</div><div class='del'>-	unsigned int sq_mask = ctx-&gt;sq_entries - 1, cq_mask = ctx-&gt;cq_entries - 1;</div><div class='del'>-	unsigned int sq_head = READ_ONCE(r-&gt;sq.head);</div><div class='del'>-	unsigned int sq_tail = READ_ONCE(r-&gt;sq.tail);</div><div class='del'>-	unsigned int cq_head = READ_ONCE(r-&gt;cq.head);</div><div class='del'>-	unsigned int cq_tail = READ_ONCE(r-&gt;cq.tail);</div><div class='del'>-	unsigned int sq_entries, cq_entries;</div><div class='del'>-	bool has_lock;</div><div class='del'>-	unsigned int i;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * we may get imprecise sqe and cqe info if uring is actively running</div><div class='del'>-	 * since we get cached_sq_head and cached_cq_tail without uring_lock</div><div class='del'>-	 * and sq_tail and cq_head are changed by userspace. But it's ok since</div><div class='del'>-	 * we usually use these info when it is stuck.</div><div class='del'>-	 */</div><div class='del'>-	seq_printf(m, "SqMask:\t\t0x%x\n", sq_mask);</div><div class='del'>-	seq_printf(m, "SqHead:\t%u\n", sq_head);</div><div class='del'>-	seq_printf(m, "SqTail:\t%u\n", sq_tail);</div><div class='del'>-	seq_printf(m, "CachedSqHead:\t%u\n", ctx-&gt;cached_sq_head);</div><div class='del'>-	seq_printf(m, "CqMask:\t0x%x\n", cq_mask);</div><div class='del'>-	seq_printf(m, "CqHead:\t%u\n", cq_head);</div><div class='del'>-	seq_printf(m, "CqTail:\t%u\n", cq_tail);</div><div class='del'>-	seq_printf(m, "CachedCqTail:\t%u\n", ctx-&gt;cached_cq_tail);</div><div class='del'>-	seq_printf(m, "SQEs:\t%u\n", sq_tail - ctx-&gt;cached_sq_head);</div><div class='del'>-	sq_entries = min(sq_tail - sq_head, ctx-&gt;sq_entries);</div><div class='del'>-	for (i = 0; i &lt; sq_entries; i++) {</div><div class='del'>-		unsigned int entry = i + sq_head;</div><div class='del'>-		unsigned int sq_idx = READ_ONCE(ctx-&gt;sq_array[entry &amp; sq_mask]);</div><div class='del'>-		struct io_uring_sqe *sqe;</div><div class='del'>-</div><div class='del'>-		if (sq_idx &gt; sq_mask)</div><div class='del'>-			continue;</div><div class='del'>-		sqe = &amp;ctx-&gt;sq_sqes[sq_idx];</div><div class='del'>-		seq_printf(m, "%5u: opcode:%d, fd:%d, flags:%x, user_data:%llu\n",</div><div class='del'>-			   sq_idx, sqe-&gt;opcode, sqe-&gt;fd, sqe-&gt;flags,</div><div class='del'>-			   sqe-&gt;user_data);</div><div class='del'>-	}</div><div class='del'>-	seq_printf(m, "CQEs:\t%u\n", cq_tail - cq_head);</div><div class='del'>-	cq_entries = min(cq_tail - cq_head, ctx-&gt;cq_entries);</div><div class='del'>-	for (i = 0; i &lt; cq_entries; i++) {</div><div class='del'>-		unsigned int entry = i + cq_head;</div><div class='del'>-		struct io_uring_cqe *cqe = &amp;r-&gt;cqes[entry &amp; cq_mask];</div><div class='del'>-</div><div class='del'>-		seq_printf(m, "%5u: user_data:%llu, res:%d, flag:%x\n",</div><div class='del'>-			   entry &amp; cq_mask, cqe-&gt;user_data, cqe-&gt;res,</div><div class='del'>-			   cqe-&gt;flags);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Avoid ABBA deadlock between the seq lock and the io_uring mutex,</div><div class='del'>-	 * since fdinfo case grabs it in the opposite direction of normal use</div><div class='del'>-	 * cases. If we fail to get the lock, we just don't iterate any</div><div class='del'>-	 * structures that could be going away outside the io_uring mutex.</div><div class='del'>-	 */</div><div class='del'>-	has_lock = mutex_trylock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-</div><div class='del'>-	if (has_lock &amp;&amp; (ctx-&gt;flags &amp; IORING_SETUP_SQPOLL)) {</div><div class='del'>-		sq = ctx-&gt;sq_data;</div><div class='del'>-		if (!sq-&gt;thread)</div><div class='del'>-			sq = NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	seq_printf(m, "SqThread:\t%d\n", sq ? task_pid_nr(sq-&gt;thread) : -1);</div><div class='del'>-	seq_printf(m, "SqThreadCpu:\t%d\n", sq ? task_cpu(sq-&gt;thread) : -1);</div><div class='del'>-	seq_printf(m, "UserFiles:\t%u\n", ctx-&gt;nr_user_files);</div><div class='del'>-	for (i = 0; has_lock &amp;&amp; i &lt; ctx-&gt;nr_user_files; i++) {</div><div class='del'>-		struct file *f = io_file_from_index(ctx, i);</div><div class='del'>-</div><div class='del'>-		if (f)</div><div class='del'>-			seq_printf(m, "%5u: %s\n", i, file_dentry(f)-&gt;d_iname);</div><div class='del'>-		else</div><div class='del'>-			seq_printf(m, "%5u: &lt;none&gt;\n", i);</div><div class='del'>-	}</div><div class='del'>-	seq_printf(m, "UserBufs:\t%u\n", ctx-&gt;nr_user_bufs);</div><div class='del'>-	for (i = 0; has_lock &amp;&amp; i &lt; ctx-&gt;nr_user_bufs; i++) {</div><div class='del'>-		struct io_mapped_ubuf *buf = ctx-&gt;user_bufs[i];</div><div class='del'>-		unsigned int len = buf-&gt;ubuf_end - buf-&gt;ubuf;</div><div class='del'>-</div><div class='del'>-		seq_printf(m, "%5u: 0x%llx/%u\n", i, buf-&gt;ubuf, len);</div><div class='del'>-	}</div><div class='del'>-	if (has_lock &amp;&amp; !xa_empty(&amp;ctx-&gt;personalities)) {</div><div class='del'>-		unsigned long index;</div><div class='del'>-		const struct cred *cred;</div><div class='del'>-</div><div class='del'>-		seq_printf(m, "Personalities:\n");</div><div class='del'>-		xa_for_each(&amp;ctx-&gt;personalities, index, cred)</div><div class='del'>-			io_uring_show_cred(m, index, cred);</div><div class='del'>-	}</div><div class='del'>-	if (has_lock)</div><div class='del'>-		mutex_unlock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-</div><div class='del'>-	seq_puts(m, "PollList:\n");</div><div class='del'>-	spin_lock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-	for (i = 0; i &lt; (1U &lt;&lt; ctx-&gt;cancel_hash_bits); i++) {</div><div class='del'>-		struct hlist_head *list = &amp;ctx-&gt;cancel_hash[i];</div><div class='del'>-		struct io_kiocb *req;</div><div class='del'>-</div><div class='del'>-		hlist_for_each_entry(req, list, hash_node)</div><div class='del'>-			seq_printf(m, "  op=%d, task_works=%d\n", req-&gt;opcode,</div><div class='del'>-					req-&gt;task-&gt;task_works != NULL);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	seq_puts(m, "CqOverflowList:\n");</div><div class='del'>-	list_for_each_entry(ocqe, &amp;ctx-&gt;cq_overflow_list, list) {</div><div class='del'>-		struct io_uring_cqe *cqe = &amp;ocqe-&gt;cqe;</div><div class='del'>-</div><div class='del'>-		seq_printf(m, "  user_data=%llu, res=%d, flags=%x\n",</div><div class='del'>-			   cqe-&gt;user_data, cqe-&gt;res, cqe-&gt;flags);</div><div class='del'>-</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_unlock(&amp;ctx-&gt;completion_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold void io_uring_show_fdinfo(struct seq_file *m, struct file *f)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx = f-&gt;private_data;</div><div class='del'>-</div><div class='del'>-	if (percpu_ref_tryget(&amp;ctx-&gt;refs)) {</div><div class='del'>-		__io_uring_show_fdinfo(ctx, m);</div><div class='del'>-		percpu_ref_put(&amp;ctx-&gt;refs);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-static const struct file_operations io_uring_fops = {</div><div class='del'>-	.release	= io_uring_release,</div><div class='del'>-	.mmap		= io_uring_mmap,</div><div class='del'>-#ifndef CONFIG_MMU</div><div class='del'>-	.get_unmapped_area = io_uring_nommu_get_unmapped_area,</div><div class='del'>-	.mmap_capabilities = io_uring_nommu_mmap_capabilities,</div><div class='del'>-#endif</div><div class='del'>-	.poll		= io_uring_poll,</div><div class='del'>-#ifdef CONFIG_PROC_FS</div><div class='del'>-	.show_fdinfo	= io_uring_show_fdinfo,</div><div class='del'>-#endif</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static __cold int io_allocate_scq_urings(struct io_ring_ctx *ctx,</div><div class='del'>-					 struct io_uring_params *p)</div><div class='del'>-{</div><div class='del'>-	struct io_rings *rings;</div><div class='del'>-	size_t size, sq_array_offset;</div><div class='del'>-</div><div class='del'>-	/* make sure these are sane, as we already accounted them */</div><div class='del'>-	ctx-&gt;sq_entries = p-&gt;sq_entries;</div><div class='del'>-	ctx-&gt;cq_entries = p-&gt;cq_entries;</div><div class='del'>-</div><div class='del'>-	size = rings_size(p-&gt;sq_entries, p-&gt;cq_entries, &amp;sq_array_offset);</div><div class='del'>-	if (size == SIZE_MAX)</div><div class='del'>-		return -EOVERFLOW;</div><div class='del'>-</div><div class='del'>-	rings = io_mem_alloc(size);</div><div class='del'>-	if (!rings)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	ctx-&gt;rings = rings;</div><div class='del'>-	ctx-&gt;sq_array = (u32 *)((char *)rings + sq_array_offset);</div><div class='del'>-	rings-&gt;sq_ring_mask = p-&gt;sq_entries - 1;</div><div class='del'>-	rings-&gt;cq_ring_mask = p-&gt;cq_entries - 1;</div><div class='del'>-	rings-&gt;sq_ring_entries = p-&gt;sq_entries;</div><div class='del'>-	rings-&gt;cq_ring_entries = p-&gt;cq_entries;</div><div class='del'>-</div><div class='del'>-	size = array_size(sizeof(struct io_uring_sqe), p-&gt;sq_entries);</div><div class='del'>-	if (size == SIZE_MAX) {</div><div class='del'>-		io_mem_free(ctx-&gt;rings);</div><div class='del'>-		ctx-&gt;rings = NULL;</div><div class='del'>-		return -EOVERFLOW;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ctx-&gt;sq_sqes = io_mem_alloc(size);</div><div class='del'>-	if (!ctx-&gt;sq_sqes) {</div><div class='del'>-		io_mem_free(ctx-&gt;rings);</div><div class='del'>-		ctx-&gt;rings = NULL;</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_uring_install_fd(struct io_ring_ctx *ctx, struct file *file)</div><div class='del'>-{</div><div class='del'>-	int ret, fd;</div><div class='del'>-</div><div class='del'>-	fd = get_unused_fd_flags(O_RDWR | O_CLOEXEC);</div><div class='del'>-	if (fd &lt; 0)</div><div class='del'>-		return fd;</div><div class='del'>-</div><div class='del'>-	ret = io_uring_add_tctx_node(ctx);</div><div class='del'>-	if (ret) {</div><div class='del'>-		put_unused_fd(fd);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-	fd_install(fd, file);</div><div class='del'>-	return fd;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Allocate an anonymous fd, this is what constitutes the application</div><div class='del'>- * visible backing of an io_uring instance. The application mmaps this</div><div class='del'>- * fd to gain access to the SQ/CQ ring details. If UNIX sockets are enabled,</div><div class='del'>- * we have to tie this fd to a socket for file garbage collection purposes.</div><div class='del'>- */</div><div class='del'>-static struct file *io_uring_get_file(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	struct file *file;</div><div class='del'>-#if defined(CONFIG_UNIX)</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ret = sock_create_kern(&amp;init_net, PF_UNIX, SOCK_RAW, IPPROTO_IP,</div><div class='del'>-				&amp;ctx-&gt;ring_sock);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ERR_PTR(ret);</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-	file = anon_inode_getfile_secure("[io_uring]", &amp;io_uring_fops, ctx,</div><div class='del'>-					 O_RDWR | O_CLOEXEC, NULL);</div><div class='del'>-#if defined(CONFIG_UNIX)</div><div class='del'>-	if (IS_ERR(file)) {</div><div class='del'>-		sock_release(ctx-&gt;ring_sock);</div><div class='del'>-		ctx-&gt;ring_sock = NULL;</div><div class='del'>-	} else {</div><div class='del'>-		ctx-&gt;ring_sock-&gt;file = file;</div><div class='del'>-	}</div><div class='del'>-#endif</div><div class='del'>-	return file;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold int io_uring_create(unsigned entries, struct io_uring_params *p,</div><div class='del'>-				  struct io_uring_params __user *params)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx;</div><div class='del'>-	struct file *file;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (!entries)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (entries &gt; IORING_MAX_ENTRIES) {</div><div class='del'>-		if (!(p-&gt;flags &amp; IORING_SETUP_CLAMP))</div><div class='del'>-			return -EINVAL;</div><div class='del'>-		entries = IORING_MAX_ENTRIES;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Use twice as many entries for the CQ ring. It's possible for the</div><div class='del'>-	 * application to drive a higher depth than the size of the SQ ring,</div><div class='del'>-	 * since the sqes are only used at submission time. This allows for</div><div class='del'>-	 * some flexibility in overcommitting a bit. If the application has</div><div class='del'>-	 * set IORING_SETUP_CQSIZE, it will have passed in the desired number</div><div class='del'>-	 * of CQ ring entries manually.</div><div class='del'>-	 */</div><div class='del'>-	p-&gt;sq_entries = roundup_pow_of_two(entries);</div><div class='del'>-	if (p-&gt;flags &amp; IORING_SETUP_CQSIZE) {</div><div class='del'>-		/*</div><div class='del'>-		 * If IORING_SETUP_CQSIZE is set, we do the same roundup</div><div class='del'>-		 * to a power-of-two, if it isn't already. We do NOT impose</div><div class='del'>-		 * any cq vs sq ring sizing.</div><div class='del'>-		 */</div><div class='del'>-		if (!p-&gt;cq_entries)</div><div class='del'>-			return -EINVAL;</div><div class='del'>-		if (p-&gt;cq_entries &gt; IORING_MAX_CQ_ENTRIES) {</div><div class='del'>-			if (!(p-&gt;flags &amp; IORING_SETUP_CLAMP))</div><div class='del'>-				return -EINVAL;</div><div class='del'>-			p-&gt;cq_entries = IORING_MAX_CQ_ENTRIES;</div><div class='del'>-		}</div><div class='del'>-		p-&gt;cq_entries = roundup_pow_of_two(p-&gt;cq_entries);</div><div class='del'>-		if (p-&gt;cq_entries &lt; p-&gt;sq_entries)</div><div class='del'>-			return -EINVAL;</div><div class='del'>-	} else {</div><div class='del'>-		p-&gt;cq_entries = 2 * p-&gt;sq_entries;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ctx = io_ring_ctx_alloc(p);</div><div class='del'>-	if (!ctx)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	ctx-&gt;compat = in_compat_syscall();</div><div class='del'>-	if (!capable(CAP_IPC_LOCK))</div><div class='del'>-		ctx-&gt;user = get_uid(current_user());</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * This is just grabbed for accounting purposes. When a process exits,</div><div class='del'>-	 * the mm is exited and dropped before the files, hence we need to hang</div><div class='del'>-	 * on to this mm purely for the purposes of being able to unaccount</div><div class='del'>-	 * memory (locked/pinned vm). It's not used for anything else.</div><div class='del'>-	 */</div><div class='del'>-	mmgrab(current-&gt;mm);</div><div class='del'>-	ctx-&gt;mm_account = current-&gt;mm;</div><div class='del'>-</div><div class='del'>-	ret = io_allocate_scq_urings(ctx, p);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto err;</div><div class='del'>-</div><div class='del'>-	ret = io_sq_offload_create(ctx, p);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto err;</div><div class='del'>-	/* always set a rsrc node */</div><div class='del'>-	ret = io_rsrc_node_switch_start(ctx);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto err;</div><div class='del'>-	io_rsrc_node_switch(ctx, NULL);</div><div class='del'>-</div><div class='del'>-	memset(&amp;p-&gt;sq_off, 0, sizeof(p-&gt;sq_off));</div><div class='del'>-	p-&gt;sq_off.head = offsetof(struct io_rings, sq.head);</div><div class='del'>-	p-&gt;sq_off.tail = offsetof(struct io_rings, sq.tail);</div><div class='del'>-	p-&gt;sq_off.ring_mask = offsetof(struct io_rings, sq_ring_mask);</div><div class='del'>-	p-&gt;sq_off.ring_entries = offsetof(struct io_rings, sq_ring_entries);</div><div class='del'>-	p-&gt;sq_off.flags = offsetof(struct io_rings, sq_flags);</div><div class='del'>-	p-&gt;sq_off.dropped = offsetof(struct io_rings, sq_dropped);</div><div class='del'>-	p-&gt;sq_off.array = (char *)ctx-&gt;sq_array - (char *)ctx-&gt;rings;</div><div class='del'>-</div><div class='del'>-	memset(&amp;p-&gt;cq_off, 0, sizeof(p-&gt;cq_off));</div><div class='del'>-	p-&gt;cq_off.head = offsetof(struct io_rings, cq.head);</div><div class='del'>-	p-&gt;cq_off.tail = offsetof(struct io_rings, cq.tail);</div><div class='del'>-	p-&gt;cq_off.ring_mask = offsetof(struct io_rings, cq_ring_mask);</div><div class='del'>-	p-&gt;cq_off.ring_entries = offsetof(struct io_rings, cq_ring_entries);</div><div class='del'>-	p-&gt;cq_off.overflow = offsetof(struct io_rings, cq_overflow);</div><div class='del'>-	p-&gt;cq_off.cqes = offsetof(struct io_rings, cqes);</div><div class='del'>-	p-&gt;cq_off.flags = offsetof(struct io_rings, cq_flags);</div><div class='del'>-</div><div class='del'>-	p-&gt;features = IORING_FEAT_SINGLE_MMAP | IORING_FEAT_NODROP |</div><div class='del'>-			IORING_FEAT_SUBMIT_STABLE | IORING_FEAT_RW_CUR_POS |</div><div class='del'>-			IORING_FEAT_CUR_PERSONALITY | IORING_FEAT_FAST_POLL |</div><div class='del'>-			IORING_FEAT_POLL_32BITS | IORING_FEAT_SQPOLL_NONFIXED |</div><div class='del'>-			IORING_FEAT_EXT_ARG | IORING_FEAT_NATIVE_WORKERS |</div><div class='del'>-			IORING_FEAT_RSRC_TAGS;</div><div class='del'>-</div><div class='del'>-	if (copy_to_user(params, p, sizeof(*p))) {</div><div class='del'>-		ret = -EFAULT;</div><div class='del'>-		goto err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	file = io_uring_get_file(ctx);</div><div class='del'>-	if (IS_ERR(file)) {</div><div class='del'>-		ret = PTR_ERR(file);</div><div class='del'>-		goto err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Install ring fd as the very last thing, so we don't risk someone</div><div class='del'>-	 * having closed it before we finish setup</div><div class='del'>-	 */</div><div class='del'>-	ret = io_uring_install_fd(ctx, file);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		/* fput will clean it up */</div><div class='del'>-		fput(file);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	trace_io_uring_create(ret, ctx, p-&gt;sq_entries, p-&gt;cq_entries, p-&gt;flags);</div><div class='del'>-	return ret;</div><div class='del'>-err:</div><div class='del'>-	io_ring_ctx_wait_and_kill(ctx);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Sets up an aio uring context, and returns the fd. Applications asks for a</div><div class='del'>- * ring size, we return the actual sq/cq ring sizes (among other things) in the</div><div class='del'>- * params structure passed in.</div><div class='del'>- */</div><div class='del'>-static long io_uring_setup(u32 entries, struct io_uring_params __user *params)</div><div class='del'>-{</div><div class='del'>-	struct io_uring_params p;</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	if (copy_from_user(&amp;p, params, sizeof(p)))</div><div class='del'>-		return -EFAULT;</div><div class='del'>-	for (i = 0; i &lt; ARRAY_SIZE(p.resv); i++) {</div><div class='del'>-		if (p.resv[i])</div><div class='del'>-			return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (p.flags &amp; ~(IORING_SETUP_IOPOLL | IORING_SETUP_SQPOLL |</div><div class='del'>-			IORING_SETUP_SQ_AFF | IORING_SETUP_CQSIZE |</div><div class='del'>-			IORING_SETUP_CLAMP | IORING_SETUP_ATTACH_WQ |</div><div class='del'>-			IORING_SETUP_R_DISABLED))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	return  io_uring_create(entries, &amp;p, params);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-SYSCALL_DEFINE2(io_uring_setup, u32, entries,</div><div class='del'>-		struct io_uring_params __user *, params)</div><div class='del'>-{</div><div class='del'>-	return io_uring_setup(entries, params);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold int io_probe(struct io_ring_ctx *ctx, void __user *arg,</div><div class='del'>-			   unsigned nr_args)</div><div class='del'>-{</div><div class='del'>-	struct io_uring_probe *p;</div><div class='del'>-	size_t size;</div><div class='del'>-	int i, ret;</div><div class='del'>-</div><div class='del'>-	size = struct_size(p, ops, nr_args);</div><div class='del'>-	if (size == SIZE_MAX)</div><div class='del'>-		return -EOVERFLOW;</div><div class='del'>-	p = kzalloc(size, GFP_KERNEL);</div><div class='del'>-	if (!p)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	ret = -EFAULT;</div><div class='del'>-	if (copy_from_user(p, arg, size))</div><div class='del'>-		goto out;</div><div class='del'>-	ret = -EINVAL;</div><div class='del'>-	if (memchr_inv(p, 0, size))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	p-&gt;last_op = IORING_OP_LAST - 1;</div><div class='del'>-	if (nr_args &gt; IORING_OP_LAST)</div><div class='del'>-		nr_args = IORING_OP_LAST;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; nr_args; i++) {</div><div class='del'>-		p-&gt;ops[i].op = i;</div><div class='del'>-		if (!io_op_defs[i].not_supported)</div><div class='del'>-			p-&gt;ops[i].flags = IO_URING_OP_SUPPORTED;</div><div class='del'>-	}</div><div class='del'>-	p-&gt;ops_len = i;</div><div class='del'>-</div><div class='del'>-	ret = 0;</div><div class='del'>-	if (copy_to_user(arg, p, size))</div><div class='del'>-		ret = -EFAULT;</div><div class='del'>-out:</div><div class='del'>-	kfree(p);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_register_personality(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	const struct cred *creds;</div><div class='del'>-	u32 id;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	creds = get_current_cred();</div><div class='del'>-</div><div class='del'>-	ret = xa_alloc_cyclic(&amp;ctx-&gt;personalities, &amp;id, (void *)creds,</div><div class='del'>-			XA_LIMIT(0, USHRT_MAX), &amp;ctx-&gt;pers_next, GFP_KERNEL);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		put_cred(creds);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-	return id;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold int io_register_restrictions(struct io_ring_ctx *ctx,</div><div class='del'>-					   void __user *arg, unsigned int nr_args)</div><div class='del'>-{</div><div class='del'>-	struct io_uring_restriction *res;</div><div class='del'>-	size_t size;</div><div class='del'>-	int i, ret;</div><div class='del'>-</div><div class='del'>-	/* Restrictions allowed only if rings started disabled */</div><div class='del'>-	if (!(ctx-&gt;flags &amp; IORING_SETUP_R_DISABLED))</div><div class='del'>-		return -EBADFD;</div><div class='del'>-</div><div class='del'>-	/* We allow only a single restrictions registration */</div><div class='del'>-	if (ctx-&gt;restrictions.registered)</div><div class='del'>-		return -EBUSY;</div><div class='del'>-</div><div class='del'>-	if (!arg || nr_args &gt; IORING_MAX_RESTRICTIONS)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	size = array_size(nr_args, sizeof(*res));</div><div class='del'>-	if (size == SIZE_MAX)</div><div class='del'>-		return -EOVERFLOW;</div><div class='del'>-</div><div class='del'>-	res = memdup_user(arg, size);</div><div class='del'>-	if (IS_ERR(res))</div><div class='del'>-		return PTR_ERR(res);</div><div class='del'>-</div><div class='del'>-	ret = 0;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; nr_args; i++) {</div><div class='del'>-		switch (res[i].opcode) {</div><div class='del'>-		case IORING_RESTRICTION_REGISTER_OP:</div><div class='del'>-			if (res[i].register_op &gt;= IORING_REGISTER_LAST) {</div><div class='del'>-				ret = -EINVAL;</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			__set_bit(res[i].register_op,</div><div class='del'>-				  ctx-&gt;restrictions.register_op);</div><div class='del'>-			break;</div><div class='del'>-		case IORING_RESTRICTION_SQE_OP:</div><div class='del'>-			if (res[i].sqe_op &gt;= IORING_OP_LAST) {</div><div class='del'>-				ret = -EINVAL;</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			__set_bit(res[i].sqe_op, ctx-&gt;restrictions.sqe_op);</div><div class='del'>-			break;</div><div class='del'>-		case IORING_RESTRICTION_SQE_FLAGS_ALLOWED:</div><div class='del'>-			ctx-&gt;restrictions.sqe_flags_allowed = res[i].sqe_flags;</div><div class='del'>-			break;</div><div class='del'>-		case IORING_RESTRICTION_SQE_FLAGS_REQUIRED:</div><div class='del'>-			ctx-&gt;restrictions.sqe_flags_required = res[i].sqe_flags;</div><div class='del'>-			break;</div><div class='del'>-		default:</div><div class='del'>-			ret = -EINVAL;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	/* Reset all restrictions if an error happened */</div><div class='del'>-	if (ret != 0)</div><div class='del'>-		memset(&amp;ctx-&gt;restrictions, 0, sizeof(ctx-&gt;restrictions));</div><div class='del'>-	else</div><div class='del'>-		ctx-&gt;restrictions.registered = true;</div><div class='del'>-</div><div class='del'>-	kfree(res);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_register_enable_rings(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	if (!(ctx-&gt;flags &amp; IORING_SETUP_R_DISABLED))</div><div class='del'>-		return -EBADFD;</div><div class='del'>-</div><div class='del'>-	if (ctx-&gt;restrictions.registered)</div><div class='del'>-		ctx-&gt;restricted = 1;</div><div class='del'>-</div><div class='del'>-	ctx-&gt;flags &amp;= ~IORING_SETUP_R_DISABLED;</div><div class='del'>-	if (ctx-&gt;sq_data &amp;&amp; wq_has_sleeper(&amp;ctx-&gt;sq_data-&gt;wait))</div><div class='del'>-		wake_up(&amp;ctx-&gt;sq_data-&gt;wait);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int __io_register_rsrc_update(struct io_ring_ctx *ctx, unsigned type,</div><div class='del'>-				     struct io_uring_rsrc_update2 *up,</div><div class='del'>-				     unsigned nr_args)</div><div class='del'>-{</div><div class='del'>-	__u32 tmp;</div><div class='del'>-	int err;</div><div class='del'>-</div><div class='del'>-	if (up-&gt;resv)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (check_add_overflow(up-&gt;offset, nr_args, &amp;tmp))</div><div class='del'>-		return -EOVERFLOW;</div><div class='del'>-	err = io_rsrc_node_switch_start(ctx);</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='del'>-</div><div class='del'>-	switch (type) {</div><div class='del'>-	case IORING_RSRC_FILE:</div><div class='del'>-		return __io_sqe_files_update(ctx, up, nr_args);</div><div class='del'>-	case IORING_RSRC_BUFFER:</div><div class='del'>-		return __io_sqe_buffers_update(ctx, up, nr_args);</div><div class='del'>-	}</div><div class='del'>-	return -EINVAL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_register_files_update(struct io_ring_ctx *ctx, void __user *arg,</div><div class='del'>-				    unsigned nr_args)</div><div class='del'>-{</div><div class='del'>-	struct io_uring_rsrc_update2 up;</div><div class='del'>-</div><div class='del'>-	if (!nr_args)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	memset(&amp;up, 0, sizeof(up));</div><div class='del'>-	if (copy_from_user(&amp;up, arg, sizeof(struct io_uring_rsrc_update)))</div><div class='del'>-		return -EFAULT;</div><div class='del'>-	return __io_register_rsrc_update(ctx, IORING_RSRC_FILE, &amp;up, nr_args);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int io_register_rsrc_update(struct io_ring_ctx *ctx, void __user *arg,</div><div class='del'>-				   unsigned size, unsigned type)</div><div class='del'>-{</div><div class='del'>-	struct io_uring_rsrc_update2 up;</div><div class='del'>-</div><div class='del'>-	if (size != sizeof(up))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	if (copy_from_user(&amp;up, arg, sizeof(up)))</div><div class='del'>-		return -EFAULT;</div><div class='del'>-	if (!up.nr || up.resv)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	return __io_register_rsrc_update(ctx, type, &amp;up, up.nr);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold int io_register_rsrc(struct io_ring_ctx *ctx, void __user *arg,</div><div class='del'>-			    unsigned int size, unsigned int type)</div><div class='del'>-{</div><div class='del'>-	struct io_uring_rsrc_register rr;</div><div class='del'>-</div><div class='del'>-	/* keep it extendible */</div><div class='del'>-	if (size != sizeof(rr))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	memset(&amp;rr, 0, sizeof(rr));</div><div class='del'>-	if (copy_from_user(&amp;rr, arg, size))</div><div class='del'>-		return -EFAULT;</div><div class='del'>-	if (!rr.nr || rr.resv || rr.resv2)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	switch (type) {</div><div class='del'>-	case IORING_RSRC_FILE:</div><div class='del'>-		return io_sqe_files_register(ctx, u64_to_user_ptr(rr.data),</div><div class='del'>-					     rr.nr, u64_to_user_ptr(rr.tags));</div><div class='del'>-	case IORING_RSRC_BUFFER:</div><div class='del'>-		return io_sqe_buffers_register(ctx, u64_to_user_ptr(rr.data),</div><div class='del'>-					       rr.nr, u64_to_user_ptr(rr.tags));</div><div class='del'>-	}</div><div class='del'>-	return -EINVAL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold int io_register_iowq_aff(struct io_ring_ctx *ctx,</div><div class='del'>-				       void __user *arg, unsigned len)</div><div class='del'>-{</div><div class='del'>-	struct io_uring_task *tctx = current-&gt;io_uring;</div><div class='del'>-	cpumask_var_t new_mask;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (!tctx || !tctx-&gt;io_wq)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	if (!alloc_cpumask_var(&amp;new_mask, GFP_KERNEL))</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	cpumask_clear(new_mask);</div><div class='del'>-	if (len &gt; cpumask_size())</div><div class='del'>-		len = cpumask_size();</div><div class='del'>-</div><div class='del'>-	if (copy_from_user(new_mask, arg, len)) {</div><div class='del'>-		free_cpumask_var(new_mask);</div><div class='del'>-		return -EFAULT;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = io_wq_cpu_affinity(tctx-&gt;io_wq, new_mask);</div><div class='del'>-	free_cpumask_var(new_mask);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold int io_unregister_iowq_aff(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	struct io_uring_task *tctx = current-&gt;io_uring;</div><div class='del'>-</div><div class='del'>-	if (!tctx || !tctx-&gt;io_wq)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	return io_wq_cpu_affinity(tctx-&gt;io_wq, NULL);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold int io_register_iowq_max_workers(struct io_ring_ctx *ctx,</div><div class='del'>-					       void __user *arg)</div><div class='del'>-	__must_hold(&amp;ctx-&gt;uring_lock)</div><div class='del'>-{</div><div class='del'>-	struct io_tctx_node *node;</div><div class='del'>-	struct io_uring_task *tctx = NULL;</div><div class='del'>-	struct io_sq_data *sqd = NULL;</div><div class='del'>-	__u32 new_count[2];</div><div class='del'>-	int i, ret;</div><div class='del'>-</div><div class='del'>-	if (copy_from_user(new_count, arg, sizeof(new_count)))</div><div class='del'>-		return -EFAULT;</div><div class='del'>-	for (i = 0; i &lt; ARRAY_SIZE(new_count); i++)</div><div class='del'>-		if (new_count[i] &gt; INT_MAX)</div><div class='del'>-			return -EINVAL;</div><div class='del'>-</div><div class='del'>-	if (ctx-&gt;flags &amp; IORING_SETUP_SQPOLL) {</div><div class='del'>-		sqd = ctx-&gt;sq_data;</div><div class='del'>-		if (sqd) {</div><div class='del'>-			/*</div><div class='del'>-			 * Observe the correct sqd-&gt;lock -&gt; ctx-&gt;uring_lock</div><div class='del'>-			 * ordering. Fine to drop uring_lock here, we hold</div><div class='del'>-			 * a ref to the ctx.</div><div class='del'>-			 */</div><div class='del'>-			refcount_inc(&amp;sqd-&gt;refs);</div><div class='del'>-			mutex_unlock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-			mutex_lock(&amp;sqd-&gt;lock);</div><div class='del'>-			mutex_lock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-			if (sqd-&gt;thread)</div><div class='del'>-				tctx = sqd-&gt;thread-&gt;io_uring;</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-		tctx = current-&gt;io_uring;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	BUILD_BUG_ON(sizeof(new_count) != sizeof(ctx-&gt;iowq_limits));</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; ARRAY_SIZE(new_count); i++)</div><div class='del'>-		if (new_count[i])</div><div class='del'>-			ctx-&gt;iowq_limits[i] = new_count[i];</div><div class='del'>-	ctx-&gt;iowq_limits_set = true;</div><div class='del'>-</div><div class='del'>-	if (tctx &amp;&amp; tctx-&gt;io_wq) {</div><div class='del'>-		ret = io_wq_max_workers(tctx-&gt;io_wq, new_count);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto err;</div><div class='del'>-	} else {</div><div class='del'>-		memset(new_count, 0, sizeof(new_count));</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (sqd) {</div><div class='del'>-		mutex_unlock(&amp;sqd-&gt;lock);</div><div class='del'>-		io_put_sq_data(sqd);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (copy_to_user(arg, new_count, sizeof(new_count)))</div><div class='del'>-		return -EFAULT;</div><div class='del'>-</div><div class='del'>-	/* that's it for SQPOLL, only the SQPOLL task creates requests */</div><div class='del'>-	if (sqd)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	/* now propagate the restriction to all registered users */</div><div class='del'>-	list_for_each_entry(node, &amp;ctx-&gt;tctx_list, ctx_node) {</div><div class='del'>-		struct io_uring_task *tctx = node-&gt;task-&gt;io_uring;</div><div class='del'>-</div><div class='del'>-		if (WARN_ON_ONCE(!tctx-&gt;io_wq))</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		for (i = 0; i &lt; ARRAY_SIZE(new_count); i++)</div><div class='del'>-			new_count[i] = ctx-&gt;iowq_limits[i];</div><div class='del'>-		/* ignore errors, it always returns zero anyway */</div><div class='del'>-		(void)io_wq_max_workers(tctx-&gt;io_wq, new_count);</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='del'>-err:</div><div class='del'>-	if (sqd) {</div><div class='del'>-		mutex_unlock(&amp;sqd-&gt;lock);</div><div class='del'>-		io_put_sq_data(sqd);</div><div class='del'>-	}</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool io_register_op_must_quiesce(int op)</div><div class='del'>-{</div><div class='del'>-	switch (op) {</div><div class='del'>-	case IORING_REGISTER_BUFFERS:</div><div class='del'>-	case IORING_UNREGISTER_BUFFERS:</div><div class='del'>-	case IORING_REGISTER_FILES:</div><div class='del'>-	case IORING_UNREGISTER_FILES:</div><div class='del'>-	case IORING_REGISTER_FILES_UPDATE:</div><div class='del'>-	case IORING_REGISTER_PROBE:</div><div class='del'>-	case IORING_REGISTER_PERSONALITY:</div><div class='del'>-	case IORING_UNREGISTER_PERSONALITY:</div><div class='del'>-	case IORING_REGISTER_FILES2:</div><div class='del'>-	case IORING_REGISTER_FILES_UPDATE2:</div><div class='del'>-	case IORING_REGISTER_BUFFERS2:</div><div class='del'>-	case IORING_REGISTER_BUFFERS_UPDATE:</div><div class='del'>-	case IORING_REGISTER_IOWQ_AFF:</div><div class='del'>-	case IORING_UNREGISTER_IOWQ_AFF:</div><div class='del'>-	case IORING_REGISTER_IOWQ_MAX_WORKERS:</div><div class='del'>-		return false;</div><div class='del'>-	default:</div><div class='del'>-		return true;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __cold int io_ctx_quiesce(struct io_ring_ctx *ctx)</div><div class='del'>-{</div><div class='del'>-	long ret;</div><div class='del'>-</div><div class='del'>-	percpu_ref_kill(&amp;ctx-&gt;refs);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Drop uring mutex before waiting for references to exit. If another</div><div class='del'>-	 * thread is currently inside io_uring_enter() it might need to grab the</div><div class='del'>-	 * uring_lock to make progress. If we hold it here across the drain</div><div class='del'>-	 * wait, then we can deadlock. It's safe to drop the mutex here, since</div><div class='del'>-	 * no new references will come in after we've killed the percpu ref.</div><div class='del'>-	 */</div><div class='del'>-	mutex_unlock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-	do {</div><div class='del'>-		ret = wait_for_completion_interruptible_timeout(&amp;ctx-&gt;ref_comp, HZ);</div><div class='del'>-		if (ret) {</div><div class='del'>-			ret = min(0L, ret);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		ret = io_run_task_work_sig();</div><div class='del'>-		io_req_caches_free(ctx);</div><div class='del'>-	} while (ret &gt;= 0);</div><div class='del'>-	mutex_lock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-</div><div class='del'>-	if (ret)</div><div class='del'>-		io_refs_resurrect(&amp;ctx-&gt;refs, &amp;ctx-&gt;ref_comp);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int __io_uring_register(struct io_ring_ctx *ctx, unsigned opcode,</div><div class='del'>-			       void __user *arg, unsigned nr_args)</div><div class='del'>-	__releases(ctx-&gt;uring_lock)</div><div class='del'>-	__acquires(ctx-&gt;uring_lock)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * We're inside the ring mutex, if the ref is already dying, then</div><div class='del'>-	 * someone else killed the ctx or is already going through</div><div class='del'>-	 * io_uring_register().</div><div class='del'>-	 */</div><div class='del'>-	if (percpu_ref_is_dying(&amp;ctx-&gt;refs))</div><div class='del'>-		return -ENXIO;</div><div class='del'>-</div><div class='del'>-	if (ctx-&gt;restricted) {</div><div class='del'>-		if (opcode &gt;= IORING_REGISTER_LAST)</div><div class='del'>-			return -EINVAL;</div><div class='del'>-		opcode = array_index_nospec(opcode, IORING_REGISTER_LAST);</div><div class='del'>-		if (!test_bit(opcode, ctx-&gt;restrictions.register_op))</div><div class='del'>-			return -EACCES;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (io_register_op_must_quiesce(opcode)) {</div><div class='del'>-		ret = io_ctx_quiesce(ctx);</div><div class='del'>-		if (ret)</div><div class='del'>-			return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	switch (opcode) {</div><div class='del'>-	case IORING_REGISTER_BUFFERS:</div><div class='del'>-		ret = io_sqe_buffers_register(ctx, arg, nr_args, NULL);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_UNREGISTER_BUFFERS:</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		if (arg || nr_args)</div><div class='del'>-			break;</div><div class='del'>-		ret = io_sqe_buffers_unregister(ctx);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_REGISTER_FILES:</div><div class='del'>-		ret = io_sqe_files_register(ctx, arg, nr_args, NULL);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_UNREGISTER_FILES:</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		if (arg || nr_args)</div><div class='del'>-			break;</div><div class='del'>-		ret = io_sqe_files_unregister(ctx);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_REGISTER_FILES_UPDATE:</div><div class='del'>-		ret = io_register_files_update(ctx, arg, nr_args);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_REGISTER_EVENTFD:</div><div class='del'>-	case IORING_REGISTER_EVENTFD_ASYNC:</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		if (nr_args != 1)</div><div class='del'>-			break;</div><div class='del'>-		ret = io_eventfd_register(ctx, arg);</div><div class='del'>-		if (ret)</div><div class='del'>-			break;</div><div class='del'>-		if (opcode == IORING_REGISTER_EVENTFD_ASYNC)</div><div class='del'>-			ctx-&gt;eventfd_async = 1;</div><div class='del'>-		else</div><div class='del'>-			ctx-&gt;eventfd_async = 0;</div><div class='del'>-		break;</div><div class='del'>-	case IORING_UNREGISTER_EVENTFD:</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		if (arg || nr_args)</div><div class='del'>-			break;</div><div class='del'>-		ret = io_eventfd_unregister(ctx);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_REGISTER_PROBE:</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		if (!arg || nr_args &gt; 256)</div><div class='del'>-			break;</div><div class='del'>-		ret = io_probe(ctx, arg, nr_args);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_REGISTER_PERSONALITY:</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		if (arg || nr_args)</div><div class='del'>-			break;</div><div class='del'>-		ret = io_register_personality(ctx);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_UNREGISTER_PERSONALITY:</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		if (arg)</div><div class='del'>-			break;</div><div class='del'>-		ret = io_unregister_personality(ctx, nr_args);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_REGISTER_ENABLE_RINGS:</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		if (arg || nr_args)</div><div class='del'>-			break;</div><div class='del'>-		ret = io_register_enable_rings(ctx);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_REGISTER_RESTRICTIONS:</div><div class='del'>-		ret = io_register_restrictions(ctx, arg, nr_args);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_REGISTER_FILES2:</div><div class='del'>-		ret = io_register_rsrc(ctx, arg, nr_args, IORING_RSRC_FILE);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_REGISTER_FILES_UPDATE2:</div><div class='del'>-		ret = io_register_rsrc_update(ctx, arg, nr_args,</div><div class='del'>-					      IORING_RSRC_FILE);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_REGISTER_BUFFERS2:</div><div class='del'>-		ret = io_register_rsrc(ctx, arg, nr_args, IORING_RSRC_BUFFER);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_REGISTER_BUFFERS_UPDATE:</div><div class='del'>-		ret = io_register_rsrc_update(ctx, arg, nr_args,</div><div class='del'>-					      IORING_RSRC_BUFFER);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_REGISTER_IOWQ_AFF:</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		if (!arg || !nr_args)</div><div class='del'>-			break;</div><div class='del'>-		ret = io_register_iowq_aff(ctx, arg, nr_args);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_UNREGISTER_IOWQ_AFF:</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		if (arg || nr_args)</div><div class='del'>-			break;</div><div class='del'>-		ret = io_unregister_iowq_aff(ctx);</div><div class='del'>-		break;</div><div class='del'>-	case IORING_REGISTER_IOWQ_MAX_WORKERS:</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		if (!arg || nr_args != 2)</div><div class='del'>-			break;</div><div class='del'>-		ret = io_register_iowq_max_workers(ctx, arg);</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (io_register_op_must_quiesce(opcode)) {</div><div class='del'>-		/* bring the ctx back to life */</div><div class='del'>-		percpu_ref_reinit(&amp;ctx-&gt;refs);</div><div class='del'>-		reinit_completion(&amp;ctx-&gt;ref_comp);</div><div class='del'>-	}</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-SYSCALL_DEFINE4(io_uring_register, unsigned int, fd, unsigned int, opcode,</div><div class='del'>-		void __user *, arg, unsigned int, nr_args)</div><div class='del'>-{</div><div class='del'>-	struct io_ring_ctx *ctx;</div><div class='del'>-	long ret = -EBADF;</div><div class='del'>-	struct fd f;</div><div class='del'>-</div><div class='del'>-	f = fdget(fd);</div><div class='del'>-	if (!f.file)</div><div class='del'>-		return -EBADF;</div><div class='del'>-</div><div class='del'>-	ret = -EOPNOTSUPP;</div><div class='del'>-	if (f.file-&gt;f_op != &amp;io_uring_fops)</div><div class='del'>-		goto out_fput;</div><div class='del'>-</div><div class='del'>-	ctx = f.file-&gt;private_data;</div><div class='del'>-</div><div class='del'>-	io_run_task_work();</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-	ret = __io_uring_register(ctx, opcode, arg, nr_args);</div><div class='del'>-	mutex_unlock(&amp;ctx-&gt;uring_lock);</div><div class='del'>-	trace_io_uring_register(ctx, opcode, ctx-&gt;nr_user_files, ctx-&gt;nr_user_bufs,</div><div class='del'>-							ctx-&gt;cq_ev_fd != NULL, ret);</div><div class='del'>-out_fput:</div><div class='del'>-	fdput(f);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int __init io_uring_init(void)</div><div class='del'>-{</div><div class='del'>-#define __BUILD_BUG_VERIFY_ELEMENT(stype, eoffset, etype, ename) do { \</div><div class='del'>-	BUILD_BUG_ON(offsetof(stype, ename) != eoffset); \</div><div class='del'>-	BUILD_BUG_ON(sizeof(etype) != sizeof_field(stype, ename)); \</div><div class='del'>-} while (0)</div><div class='del'>-</div><div class='del'>-#define BUILD_BUG_SQE_ELEM(eoffset, etype, ename) \</div><div class='del'>-	__BUILD_BUG_VERIFY_ELEMENT(struct io_uring_sqe, eoffset, etype, ename)</div><div class='del'>-	BUILD_BUG_ON(sizeof(struct io_uring_sqe) != 64);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(0,  __u8,   opcode);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(1,  __u8,   flags);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(2,  __u16,  ioprio);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(4,  __s32,  fd);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(8,  __u64,  off);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(8,  __u64,  addr2);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(16, __u64,  addr);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(16, __u64,  splice_off_in);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(24, __u32,  len);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(28,     __kernel_rwf_t, rw_flags);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(28, /* compat */   int, rw_flags);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(28, /* compat */ __u32, rw_flags);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(28, __u32,  fsync_flags);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(28, /* compat */ __u16,  poll_events);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(28, __u32,  poll32_events);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(28, __u32,  sync_range_flags);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(28, __u32,  msg_flags);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(28, __u32,  timeout_flags);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(28, __u32,  accept_flags);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(28, __u32,  cancel_flags);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(28, __u32,  open_flags);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(28, __u32,  statx_flags);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(28, __u32,  fadvise_advice);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(28, __u32,  splice_flags);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(32, __u64,  user_data);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(40, __u16,  buf_index);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(40, __u16,  buf_group);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(42, __u16,  personality);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(44, __s32,  splice_fd_in);</div><div class='del'>-	BUILD_BUG_SQE_ELEM(44, __u32,  file_index);</div><div class='del'>-</div><div class='del'>-	BUILD_BUG_ON(sizeof(struct io_uring_files_update) !=</div><div class='del'>-		     sizeof(struct io_uring_rsrc_update));</div><div class='del'>-	BUILD_BUG_ON(sizeof(struct io_uring_rsrc_update) &gt;</div><div class='del'>-		     sizeof(struct io_uring_rsrc_update2));</div><div class='del'>-</div><div class='del'>-	/* -&gt;buf_index is u16 */</div><div class='del'>-	BUILD_BUG_ON(IORING_MAX_REG_BUFFERS &gt;= (1u &lt;&lt; 16));</div><div class='del'>-</div><div class='del'>-	/* should fit into one byte */</div><div class='del'>-	BUILD_BUG_ON(SQE_VALID_FLAGS &gt;= (1 &lt;&lt; 8));</div><div class='del'>-	BUILD_BUG_ON(SQE_COMMON_FLAGS &gt;= (1 &lt;&lt; 8));</div><div class='del'>-	BUILD_BUG_ON((SQE_VALID_FLAGS | SQE_COMMON_FLAGS) != SQE_VALID_FLAGS);</div><div class='del'>-</div><div class='del'>-	BUILD_BUG_ON(ARRAY_SIZE(io_op_defs) != IORING_OP_LAST);</div><div class='del'>-	BUILD_BUG_ON(__REQ_F_LAST_BIT &gt; 8 * sizeof(int));</div><div class='del'>-</div><div class='del'>-	req_cachep = KMEM_CACHE(io_kiocb, SLAB_HWCACHE_ALIGN | SLAB_PANIC |</div><div class='del'>-				SLAB_ACCOUNT);</div><div class='del'>-	return 0;</div><div class='del'>-};</div><div class='del'>-__initcall(io_uring_init);</div><div class='head'>diff --git a/fs/ioctl.c b/fs/ioctl.c<br/>index 504e69578112..1c152c2b1b67 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ioctl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ioctl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/ioctl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/ioctl.c</a></div><div class='hunk'>@@ -41,7 +41,7 @@</div><div class='ctx'>  *</div><div class='ctx'>  * Returns 0 on success, -errno on error.</div><div class='ctx'>  */</div><div class='del'>-long vfs_ioctl(struct file *filp, unsigned int cmd, unsigned long arg)</div><div class='add'>+static int vfs_ioctl(struct file *filp, unsigned int cmd, unsigned long arg)</div><div class='ctx'> {</div><div class='ctx'> 	int error = -ENOTTY;</div><div class='ctx'> </div><div class='hunk'>@@ -54,7 +54,6 @@ long vfs_ioctl(struct file *filp, unsigned int cmd, unsigned long arg)</div><div class='ctx'>  out:</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(vfs_ioctl);</div><div class='ctx'> </div><div class='ctx'> static int ioctl_fibmap(struct file *filp, int __user *p)</div><div class='ctx'> {</div><div class='hunk'>@@ -109,9 +108,6 @@ static int ioctl_fibmap(struct file *filp, int __user *p)</div><div class='ctx'>  * Returns 0 on success, -errno on error, 1 if this was the last</div><div class='ctx'>  * extent that will fit in user array.</div><div class='ctx'>  */</div><div class='del'>-#define SET_UNKNOWN_FLAGS	(FIEMAP_EXTENT_DELALLOC)</div><div class='del'>-#define SET_NO_UNMOUNTED_IO_FLAGS	(FIEMAP_EXTENT_DATA_ENCRYPTED)</div><div class='del'>-#define SET_NOT_ALIGNED_FLAGS	(FIEMAP_EXTENT_DATA_TAIL|FIEMAP_EXTENT_DATA_INLINE)</div><div class='ctx'> int fiemap_fill_next_extent(struct fiemap_extent_info *fieinfo, u64 logical,</div><div class='ctx'> 			    u64 phys, u64 len, u32 flags)</div><div class='ctx'> {</div><div class='hunk'>@@ -127,6 +123,10 @@ int fiemap_fill_next_extent(struct fiemap_extent_info *fieinfo, u64 logical,</div><div class='ctx'> 	if (fieinfo-&gt;fi_extents_mapped &gt;= fieinfo-&gt;fi_extents_max)</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='add'>+#define SET_UNKNOWN_FLAGS	(FIEMAP_EXTENT_DELALLOC)</div><div class='add'>+#define SET_NO_UNMOUNTED_IO_FLAGS	(FIEMAP_EXTENT_DATA_ENCRYPTED)</div><div class='add'>+#define SET_NOT_ALIGNED_FLAGS	(FIEMAP_EXTENT_DATA_TAIL|FIEMAP_EXTENT_DATA_INLINE)</div><div class='add'>+</div><div class='ctx'> 	if (flags &amp; SET_UNKNOWN_FLAGS)</div><div class='ctx'> 		flags |= FIEMAP_EXTENT_UNKNOWN;</div><div class='ctx'> 	if (flags &amp; SET_NO_UNMOUNTED_IO_FLAGS)</div><div class='hunk'>@@ -173,7 +173,7 @@ int fiemap_prep(struct inode *inode, struct fiemap_extent_info *fieinfo,</div><div class='ctx'> </div><div class='ctx'> 	if (*len == 0)</div><div class='ctx'> 		return -EINVAL;</div><div class='del'>-	if (start &gt; maxbytes)</div><div class='add'>+	if (start &gt;= maxbytes)</div><div class='ctx'> 		return -EFBIG;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -227,19 +227,16 @@ static int ioctl_fiemap(struct file *filp, struct fiemap __user *ufiemap)</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static long ioctl_file_clone(struct file *dst_file, unsigned long srcfd,</div><div class='del'>-			     u64 off, u64 olen, u64 destoff)</div><div class='add'>+static int ioctl_file_clone(struct file *dst_file, unsigned long srcfd,</div><div class='add'>+			    u64 off, u64 olen, u64 destoff)</div><div class='ctx'> {</div><div class='del'>-	struct fd src_file = fdget(srcfd);</div><div class='add'>+	CLASS(fd, src_file)(srcfd);</div><div class='ctx'> 	loff_t cloned;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (!src_file.file)</div><div class='add'>+	if (fd_empty(src_file))</div><div class='ctx'> 		return -EBADF;</div><div class='del'>-	ret = -EXDEV;</div><div class='del'>-	if (src_file.file-&gt;f_path.mnt != dst_file-&gt;f_path.mnt)</div><div class='del'>-		goto fdput;</div><div class='del'>-	cloned = vfs_clone_file_range(src_file.file, off, dst_file, destoff,</div><div class='add'>+	cloned = vfs_clone_file_range(fd_file(src_file), off, dst_file, destoff,</div><div class='ctx'> 				      olen, 0);</div><div class='ctx'> 	if (cloned &lt; 0)</div><div class='ctx'> 		ret = cloned;</div><div class='hunk'>@@ -247,13 +244,11 @@ static long ioctl_file_clone(struct file *dst_file, unsigned long srcfd,</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 	else</div><div class='ctx'> 		ret = 0;</div><div class='del'>-fdput:</div><div class='del'>-	fdput(src_file);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static long ioctl_file_clone_range(struct file *file,</div><div class='del'>-				   struct file_clone_range __user *argp)</div><div class='add'>+static int ioctl_file_clone_range(struct file *file,</div><div class='add'>+				  struct file_clone_range __user *argp)</div><div class='ctx'> {</div><div class='ctx'> 	struct file_clone_range args;</div><div class='ctx'> </div><div class='hunk'>@@ -400,8 +395,8 @@ static int ioctl_fsfreeze(struct file *filp)</div><div class='ctx'> </div><div class='ctx'> 	/* Freeze */</div><div class='ctx'> 	if (sb-&gt;s_op-&gt;freeze_super)</div><div class='del'>-		return sb-&gt;s_op-&gt;freeze_super(sb);</div><div class='del'>-	return freeze_super(sb);</div><div class='add'>+		return sb-&gt;s_op-&gt;freeze_super(sb, FREEZE_HOLDER_USERSPACE, NULL);</div><div class='add'>+	return freeze_super(sb, FREEZE_HOLDER_USERSPACE, NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ioctl_fsthaw(struct file *filp)</div><div class='hunk'>@@ -413,8 +408,8 @@ static int ioctl_fsthaw(struct file *filp)</div><div class='ctx'> </div><div class='ctx'> 	/* Thaw */</div><div class='ctx'> 	if (sb-&gt;s_op-&gt;thaw_super)</div><div class='del'>-		return sb-&gt;s_op-&gt;thaw_super(sb);</div><div class='del'>-	return thaw_super(sb);</div><div class='add'>+		return sb-&gt;s_op-&gt;thaw_super(sb, FREEZE_HOLDER_USERSPACE, NULL);</div><div class='add'>+	return thaw_super(sb, FREEZE_HOLDER_USERSPACE, NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ioctl_file_dedupe_range(struct file *file,</div><div class='hunk'>@@ -430,7 +425,7 @@ static int ioctl_file_dedupe_range(struct file *file,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	size = offsetof(struct file_dedupe_range __user, info[count]);</div><div class='add'>+	size = struct_size(same, info, count);</div><div class='ctx'> 	if (size &gt; PAGE_SIZE) {</div><div class='ctx'> 		ret = -ENOMEM;</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -457,313 +452,31 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * fileattr_fill_xflags - initialize fileattr with xflags</div><div class='del'>- * @fa:		fileattr pointer</div><div class='del'>- * @xflags:	FS_XFLAG_* flags</div><div class='del'>- *</div><div class='del'>- * Set -&gt;fsx_xflags, -&gt;fsx_valid and -&gt;flags (translated xflags).  All</div><div class='del'>- * other fields are zeroed.</div><div class='del'>- */</div><div class='del'>-void fileattr_fill_xflags(struct fileattr *fa, u32 xflags)</div><div class='del'>-{</div><div class='del'>-	memset(fa, 0, sizeof(*fa));</div><div class='del'>-	fa-&gt;fsx_valid = true;</div><div class='del'>-	fa-&gt;fsx_xflags = xflags;</div><div class='del'>-	if (fa-&gt;fsx_xflags &amp; FS_XFLAG_IMMUTABLE)</div><div class='del'>-		fa-&gt;flags |= FS_IMMUTABLE_FL;</div><div class='del'>-	if (fa-&gt;fsx_xflags &amp; FS_XFLAG_APPEND)</div><div class='del'>-		fa-&gt;flags |= FS_APPEND_FL;</div><div class='del'>-	if (fa-&gt;fsx_xflags &amp; FS_XFLAG_SYNC)</div><div class='del'>-		fa-&gt;flags |= FS_SYNC_FL;</div><div class='del'>-	if (fa-&gt;fsx_xflags &amp; FS_XFLAG_NOATIME)</div><div class='del'>-		fa-&gt;flags |= FS_NOATIME_FL;</div><div class='del'>-	if (fa-&gt;fsx_xflags &amp; FS_XFLAG_NODUMP)</div><div class='del'>-		fa-&gt;flags |= FS_NODUMP_FL;</div><div class='del'>-	if (fa-&gt;fsx_xflags &amp; FS_XFLAG_DAX)</div><div class='del'>-		fa-&gt;flags |= FS_DAX_FL;</div><div class='del'>-	if (fa-&gt;fsx_xflags &amp; FS_XFLAG_PROJINHERIT)</div><div class='del'>-		fa-&gt;flags |= FS_PROJINHERIT_FL;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(fileattr_fill_xflags);</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * fileattr_fill_flags - initialize fileattr with flags</div><div class='del'>- * @fa:		fileattr pointer</div><div class='del'>- * @flags:	FS_*_FL flags</div><div class='del'>- *</div><div class='del'>- * Set -&gt;flags, -&gt;flags_valid and -&gt;fsx_xflags (translated flags).</div><div class='del'>- * All other fields are zeroed.</div><div class='del'>- */</div><div class='del'>-void fileattr_fill_flags(struct fileattr *fa, u32 flags)</div><div class='del'>-{</div><div class='del'>-	memset(fa, 0, sizeof(*fa));</div><div class='del'>-	fa-&gt;flags_valid = true;</div><div class='del'>-	fa-&gt;flags = flags;</div><div class='del'>-	if (fa-&gt;flags &amp; FS_SYNC_FL)</div><div class='del'>-		fa-&gt;fsx_xflags |= FS_XFLAG_SYNC;</div><div class='del'>-	if (fa-&gt;flags &amp; FS_IMMUTABLE_FL)</div><div class='del'>-		fa-&gt;fsx_xflags |= FS_XFLAG_IMMUTABLE;</div><div class='del'>-	if (fa-&gt;flags &amp; FS_APPEND_FL)</div><div class='del'>-		fa-&gt;fsx_xflags |= FS_XFLAG_APPEND;</div><div class='del'>-	if (fa-&gt;flags &amp; FS_NODUMP_FL)</div><div class='del'>-		fa-&gt;fsx_xflags |= FS_XFLAG_NODUMP;</div><div class='del'>-	if (fa-&gt;flags &amp; FS_NOATIME_FL)</div><div class='del'>-		fa-&gt;fsx_xflags |= FS_XFLAG_NOATIME;</div><div class='del'>-	if (fa-&gt;flags &amp; FS_DAX_FL)</div><div class='del'>-		fa-&gt;fsx_xflags |= FS_XFLAG_DAX;</div><div class='del'>-	if (fa-&gt;flags &amp; FS_PROJINHERIT_FL)</div><div class='del'>-		fa-&gt;fsx_xflags |= FS_XFLAG_PROJINHERIT;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(fileattr_fill_flags);</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * vfs_fileattr_get - retrieve miscellaneous file attributes</div><div class='del'>- * @dentry:	the object to retrieve from</div><div class='del'>- * @fa:		fileattr pointer</div><div class='del'>- *</div><div class='del'>- * Call i_op-&gt;fileattr_get() callback, if exists.</div><div class='del'>- *</div><div class='del'>- * Return: 0 on success, or a negative error on failure.</div><div class='del'>- */</div><div class='del'>-int vfs_fileattr_get(struct dentry *dentry, struct fileattr *fa)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = d_inode(dentry);</div><div class='del'>-</div><div class='del'>-	if (!inode-&gt;i_op-&gt;fileattr_get)</div><div class='del'>-		return -ENOIOCTLCMD;</div><div class='del'>-</div><div class='del'>-	return inode-&gt;i_op-&gt;fileattr_get(dentry, fa);</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(vfs_fileattr_get);</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * copy_fsxattr_to_user - copy fsxattr to userspace.</div><div class='del'>- * @fa:		fileattr pointer</div><div class='del'>- * @ufa:	fsxattr user pointer</div><div class='del'>- *</div><div class='del'>- * Return: 0 on success, or -EFAULT on failure.</div><div class='del'>- */</div><div class='del'>-int copy_fsxattr_to_user(const struct fileattr *fa, struct fsxattr __user *ufa)</div><div class='del'>-{</div><div class='del'>-	struct fsxattr xfa;</div><div class='del'>-</div><div class='del'>-	memset(&amp;xfa, 0, sizeof(xfa));</div><div class='del'>-	xfa.fsx_xflags = fa-&gt;fsx_xflags;</div><div class='del'>-	xfa.fsx_extsize = fa-&gt;fsx_extsize;</div><div class='del'>-	xfa.fsx_nextents = fa-&gt;fsx_nextents;</div><div class='del'>-	xfa.fsx_projid = fa-&gt;fsx_projid;</div><div class='del'>-	xfa.fsx_cowextsize = fa-&gt;fsx_cowextsize;</div><div class='del'>-</div><div class='del'>-	if (copy_to_user(ufa, &amp;xfa, sizeof(xfa)))</div><div class='del'>-		return -EFAULT;</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(copy_fsxattr_to_user);</div><div class='del'>-</div><div class='del'>-static int copy_fsxattr_from_user(struct fileattr *fa,</div><div class='del'>-				  struct fsxattr __user *ufa)</div><div class='del'>-{</div><div class='del'>-	struct fsxattr xfa;</div><div class='del'>-</div><div class='del'>-	if (copy_from_user(&amp;xfa, ufa, sizeof(xfa)))</div><div class='del'>-		return -EFAULT;</div><div class='del'>-</div><div class='del'>-	fileattr_fill_xflags(fa, xfa.fsx_xflags);</div><div class='del'>-	fa-&gt;fsx_extsize = xfa.fsx_extsize;</div><div class='del'>-	fa-&gt;fsx_nextents = xfa.fsx_nextents;</div><div class='del'>-	fa-&gt;fsx_projid = xfa.fsx_projid;</div><div class='del'>-	fa-&gt;fsx_cowextsize = xfa.fsx_cowextsize;</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Generic function to check FS_IOC_FSSETXATTR/FS_IOC_SETFLAGS values and reject</div><div class='del'>- * any invalid configurations.</div><div class='del'>- *</div><div class='del'>- * Note: must be called with inode lock held.</div><div class='del'>- */</div><div class='del'>-static int fileattr_set_prepare(struct inode *inode,</div><div class='del'>-			      const struct fileattr *old_ma,</div><div class='del'>-			      struct fileattr *fa)</div><div class='add'>+static int ioctl_getfsuuid(struct file *file, void __user *argp)</div><div class='ctx'> {</div><div class='del'>-	int err;</div><div class='add'>+	struct super_block *sb = file_inode(file)-&gt;i_sb;</div><div class='add'>+	struct fsuuid2 u = { .len = sb-&gt;s_uuid_len, };</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * The IMMUTABLE and APPEND_ONLY flags can only be changed by</div><div class='del'>-	 * the relevant capability.</div><div class='del'>-	 */</div><div class='del'>-	if ((fa-&gt;flags ^ old_ma-&gt;flags) &amp; (FS_APPEND_FL | FS_IMMUTABLE_FL) &amp;&amp;</div><div class='del'>-	    !capable(CAP_LINUX_IMMUTABLE))</div><div class='del'>-		return -EPERM;</div><div class='del'>-</div><div class='del'>-	err = fscrypt_prepare_setflags(inode, old_ma-&gt;flags, fa-&gt;flags);</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Project Quota ID state is only allowed to change from within the init</div><div class='del'>-	 * namespace. Enforce that restriction only if we are trying to change</div><div class='del'>-	 * the quota ID state. Everything else is allowed in user namespaces.</div><div class='del'>-	 */</div><div class='del'>-	if (current_user_ns() != &amp;init_user_ns) {</div><div class='del'>-		if (old_ma-&gt;fsx_projid != fa-&gt;fsx_projid)</div><div class='del'>-			return -EINVAL;</div><div class='del'>-		if ((old_ma-&gt;fsx_xflags ^ fa-&gt;fsx_xflags) &amp;</div><div class='del'>-				FS_XFLAG_PROJINHERIT)</div><div class='del'>-			return -EINVAL;</div><div class='del'>-	} else {</div><div class='del'>-		/*</div><div class='del'>-		 * Caller is allowed to change the project ID. If it is being</div><div class='del'>-		 * changed, make sure that the new value is valid.</div><div class='del'>-		 */</div><div class='del'>-		if (old_ma-&gt;fsx_projid != fa-&gt;fsx_projid &amp;&amp;</div><div class='del'>-		    !projid_valid(make_kprojid(&amp;init_user_ns, fa-&gt;fsx_projid)))</div><div class='del'>-			return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Check extent size hints. */</div><div class='del'>-	if ((fa-&gt;fsx_xflags &amp; FS_XFLAG_EXTSIZE) &amp;&amp; !S_ISREG(inode-&gt;i_mode))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	if ((fa-&gt;fsx_xflags &amp; FS_XFLAG_EXTSZINHERIT) &amp;&amp;</div><div class='del'>-			!S_ISDIR(inode-&gt;i_mode))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	if ((fa-&gt;fsx_xflags &amp; FS_XFLAG_COWEXTSIZE) &amp;&amp;</div><div class='del'>-	    !S_ISREG(inode-&gt;i_mode) &amp;&amp; !S_ISDIR(inode-&gt;i_mode))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * It is only valid to set the DAX flag on regular files and</div><div class='del'>-	 * directories on filesystems.</div><div class='del'>-	 */</div><div class='del'>-	if ((fa-&gt;fsx_xflags &amp; FS_XFLAG_DAX) &amp;&amp;</div><div class='del'>-	    !(S_ISREG(inode-&gt;i_mode) || S_ISDIR(inode-&gt;i_mode)))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	/* Extent size hints of zero turn off the flags. */</div><div class='del'>-	if (fa-&gt;fsx_extsize == 0)</div><div class='del'>-		fa-&gt;fsx_xflags &amp;= ~(FS_XFLAG_EXTSIZE | FS_XFLAG_EXTSZINHERIT);</div><div class='del'>-	if (fa-&gt;fsx_cowextsize == 0)</div><div class='del'>-		fa-&gt;fsx_xflags &amp;= ~FS_XFLAG_COWEXTSIZE;</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * vfs_fileattr_set - change miscellaneous file attributes</div><div class='del'>- * @mnt_userns:	user namespace of the mount</div><div class='del'>- * @dentry:	the object to change</div><div class='del'>- * @fa:		fileattr pointer</div><div class='del'>- *</div><div class='del'>- * After verifying permissions, call i_op-&gt;fileattr_set() callback, if</div><div class='del'>- * exists.</div><div class='del'>- *</div><div class='del'>- * Verifying attributes involves retrieving current attributes with</div><div class='del'>- * i_op-&gt;fileattr_get(), this also allows initializing attributes that have</div><div class='del'>- * not been set by the caller to current values.  Inode lock is held</div><div class='del'>- * thoughout to prevent racing with another instance.</div><div class='del'>- *</div><div class='del'>- * Return: 0 on success, or a negative error on failure.</div><div class='del'>- */</div><div class='del'>-int vfs_fileattr_set(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='del'>-		     struct fileattr *fa)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = d_inode(dentry);</div><div class='del'>-	struct fileattr old_ma = {};</div><div class='del'>-	int err;</div><div class='del'>-</div><div class='del'>-	if (!inode-&gt;i_op-&gt;fileattr_set)</div><div class='del'>-		return -ENOIOCTLCMD;</div><div class='del'>-</div><div class='del'>-	if (!inode_owner_or_capable(mnt_userns, inode))</div><div class='del'>-		return -EPERM;</div><div class='add'>+	if (!sb-&gt;s_uuid_len)</div><div class='add'>+		return -ENOTTY;</div><div class='ctx'> </div><div class='del'>-	inode_lock(inode);</div><div class='del'>-	err = vfs_fileattr_get(dentry, &amp;old_ma);</div><div class='del'>-	if (!err) {</div><div class='del'>-		/* initialize missing bits from old_ma */</div><div class='del'>-		if (fa-&gt;flags_valid) {</div><div class='del'>-			fa-&gt;fsx_xflags |= old_ma.fsx_xflags &amp; ~FS_XFLAG_COMMON;</div><div class='del'>-			fa-&gt;fsx_extsize = old_ma.fsx_extsize;</div><div class='del'>-			fa-&gt;fsx_nextents = old_ma.fsx_nextents;</div><div class='del'>-			fa-&gt;fsx_projid = old_ma.fsx_projid;</div><div class='del'>-			fa-&gt;fsx_cowextsize = old_ma.fsx_cowextsize;</div><div class='del'>-		} else {</div><div class='del'>-			fa-&gt;flags |= old_ma.flags &amp; ~FS_COMMON_FL;</div><div class='del'>-		}</div><div class='del'>-		err = fileattr_set_prepare(inode, &amp;old_ma, fa);</div><div class='del'>-		if (!err)</div><div class='del'>-			err = inode-&gt;i_op-&gt;fileattr_set(mnt_userns, dentry, fa);</div><div class='del'>-	}</div><div class='del'>-	inode_unlock(inode);</div><div class='add'>+	memcpy(&amp;u.uuid[0], &amp;sb-&gt;s_uuid, sb-&gt;s_uuid_len);</div><div class='ctx'> </div><div class='del'>-	return err;</div><div class='add'>+	return copy_to_user(argp, &amp;u, sizeof(u)) ? -EFAULT : 0;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(vfs_fileattr_set);</div><div class='ctx'> </div><div class='del'>-static int ioctl_getflags(struct file *file, unsigned int __user *argp)</div><div class='add'>+static int ioctl_get_fs_sysfs_path(struct file *file, void __user *argp)</div><div class='ctx'> {</div><div class='del'>-	struct fileattr fa = { .flags_valid = true }; /* hint only */</div><div class='del'>-	int err;</div><div class='add'>+	struct super_block *sb = file_inode(file)-&gt;i_sb;</div><div class='ctx'> </div><div class='del'>-	err = vfs_fileattr_get(file-&gt;f_path.dentry, &amp;fa);</div><div class='del'>-	if (!err)</div><div class='del'>-		err = put_user(fa.flags, argp);</div><div class='del'>-	return err;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int ioctl_setflags(struct file *file, unsigned int __user *argp)</div><div class='del'>-{</div><div class='del'>-	struct user_namespace *mnt_userns = file_mnt_user_ns(file);</div><div class='del'>-	struct dentry *dentry = file-&gt;f_path.dentry;</div><div class='del'>-	struct fileattr fa;</div><div class='del'>-	unsigned int flags;</div><div class='del'>-	int err;</div><div class='del'>-</div><div class='del'>-	err = get_user(flags, argp);</div><div class='del'>-	if (!err) {</div><div class='del'>-		err = mnt_want_write_file(file);</div><div class='del'>-		if (!err) {</div><div class='del'>-			fileattr_fill_flags(&amp;fa, flags);</div><div class='del'>-			err = vfs_fileattr_set(mnt_userns, dentry, &amp;fa);</div><div class='del'>-			mnt_drop_write_file(file);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	return err;</div><div class='del'>-}</div><div class='add'>+	if (!strlen(sb-&gt;s_sysfs_name))</div><div class='add'>+		return -ENOTTY;</div><div class='ctx'> </div><div class='del'>-static int ioctl_fsgetxattr(struct file *file, void __user *argp)</div><div class='del'>-{</div><div class='del'>-	struct fileattr fa = { .fsx_valid = true }; /* hint only */</div><div class='del'>-	int err;</div><div class='add'>+	struct fs_sysfs_path u = {};</div><div class='ctx'> </div><div class='del'>-	err = vfs_fileattr_get(file-&gt;f_path.dentry, &amp;fa);</div><div class='del'>-	if (!err)</div><div class='del'>-		err = copy_fsxattr_to_user(&amp;fa, argp);</div><div class='add'>+	u.len = scnprintf(u.name, sizeof(u.name), "%s/%s", sb-&gt;s_type-&gt;name, sb-&gt;s_sysfs_name);</div><div class='ctx'> </div><div class='del'>-	return err;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int ioctl_fssetxattr(struct file *file, void __user *argp)</div><div class='del'>-{</div><div class='del'>-	struct user_namespace *mnt_userns = file_mnt_user_ns(file);</div><div class='del'>-	struct dentry *dentry = file-&gt;f_path.dentry;</div><div class='del'>-	struct fileattr fa;</div><div class='del'>-	int err;</div><div class='del'>-</div><div class='del'>-	err = copy_fsxattr_from_user(&amp;fa, argp);</div><div class='del'>-	if (!err) {</div><div class='del'>-		err = mnt_want_write_file(file);</div><div class='del'>-		if (!err) {</div><div class='del'>-			err = vfs_fileattr_set(mnt_userns, dentry, &amp;fa);</div><div class='del'>-			mnt_drop_write_file(file);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	return err;</div><div class='add'>+	return copy_to_user(argp, &amp;u, sizeof(u)) ? -EFAULT : 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -772,6 +485,9 @@ static int ioctl_fssetxattr(struct file *file, void __user *argp)</div><div class='ctx'>  *</div><div class='ctx'>  * When you add any new common ioctls to the switches above and below,</div><div class='ctx'>  * please ensure they have compatible arguments in compat mode.</div><div class='add'>+ *</div><div class='add'>+ * The LSM mailing list should also be notified of any command additions or</div><div class='add'>+ * changes, as specific LSMs may be affected.</div><div class='ctx'>  */</div><div class='ctx'> static int do_vfs_ioctl(struct file *filp, unsigned int fd,</div><div class='ctx'> 			unsigned int cmd, unsigned long arg)</div><div class='hunk'>@@ -795,7 +511,8 @@ static int do_vfs_ioctl(struct file *filp, unsigned int fd,</div><div class='ctx'> 		return ioctl_fioasync(fd, filp, argp);</div><div class='ctx'> </div><div class='ctx'> 	case FIOQSIZE:</div><div class='del'>-		if (S_ISDIR(inode-&gt;i_mode) || S_ISREG(inode-&gt;i_mode) ||</div><div class='add'>+		if (S_ISDIR(inode-&gt;i_mode) ||</div><div class='add'>+		    (S_ISREG(inode-&gt;i_mode) &amp;&amp; !IS_ANON_FILE(inode)) ||</div><div class='ctx'> 		    S_ISLNK(inode-&gt;i_mode)) {</div><div class='ctx'> 			loff_t res = inode_get_bytes(inode);</div><div class='ctx'> 			return copy_to_user(argp, &amp;res, sizeof(res)) ?</div><div class='hunk'>@@ -830,7 +547,7 @@ static int do_vfs_ioctl(struct file *filp, unsigned int fd,</div><div class='ctx'> 		return ioctl_file_dedupe_range(filp, argp);</div><div class='ctx'> </div><div class='ctx'> 	case FIONREAD:</div><div class='del'>-		if (!S_ISREG(inode-&gt;i_mode))</div><div class='add'>+		if (!S_ISREG(inode-&gt;i_mode) || IS_ANON_FILE(inode))</div><div class='ctx'> 			return vfs_ioctl(filp, cmd, arg);</div><div class='ctx'> </div><div class='ctx'> 		return put_user(i_size_read(inode) - filp-&gt;f_pos,</div><div class='hunk'>@@ -848,8 +565,14 @@ static int do_vfs_ioctl(struct file *filp, unsigned int fd,</div><div class='ctx'> 	case FS_IOC_FSSETXATTR:</div><div class='ctx'> 		return ioctl_fssetxattr(filp, argp);</div><div class='ctx'> </div><div class='add'>+	case FS_IOC_GETFSUUID:</div><div class='add'>+		return ioctl_getfsuuid(filp, argp);</div><div class='add'>+</div><div class='add'>+	case FS_IOC_GETFSSYSFSPATH:</div><div class='add'>+		return ioctl_get_fs_sysfs_path(filp, argp);</div><div class='add'>+</div><div class='ctx'> 	default:</div><div class='del'>-		if (S_ISREG(inode-&gt;i_mode))</div><div class='add'>+		if (S_ISREG(inode-&gt;i_mode) &amp;&amp; !IS_ANON_FILE(inode))</div><div class='ctx'> 			return file_ioctl(filp, cmd, argp);</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -859,28 +582,29 @@ static int do_vfs_ioctl(struct file *filp, unsigned int fd,</div><div class='ctx'> </div><div class='ctx'> SYSCALL_DEFINE3(ioctl, unsigned int, fd, unsigned int, cmd, unsigned long, arg)</div><div class='ctx'> {</div><div class='del'>-	struct fd f = fdget(fd);</div><div class='add'>+	CLASS(fd, f)(fd);</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	if (!f.file)</div><div class='add'>+	if (fd_empty(f))</div><div class='ctx'> 		return -EBADF;</div><div class='ctx'> </div><div class='del'>-	error = security_file_ioctl(f.file, cmd, arg);</div><div class='add'>+	error = security_file_ioctl(fd_file(f), cmd, arg);</div><div class='ctx'> 	if (error)</div><div class='del'>-		goto out;</div><div class='add'>+		return error;</div><div class='ctx'> </div><div class='del'>-	error = do_vfs_ioctl(f.file, fd, cmd, arg);</div><div class='add'>+	error = do_vfs_ioctl(fd_file(f), fd, cmd, arg);</div><div class='ctx'> 	if (error == -ENOIOCTLCMD)</div><div class='del'>-		error = vfs_ioctl(f.file, cmd, arg);</div><div class='add'>+		error = vfs_ioctl(fd_file(f), cmd, arg);</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	fdput(f);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_COMPAT</div><div class='ctx'> /**</div><div class='ctx'>  * compat_ptr_ioctl - generic implementation of .compat_ioctl file operation</div><div class='add'>+ * @file: The file to operate on.</div><div class='add'>+ * @cmd: The ioctl command number.</div><div class='add'>+ * @arg: The argument to the ioctl.</div><div class='ctx'>  *</div><div class='ctx'>  * This is not normally called as a function, but instead set in struct</div><div class='ctx'>  * file_operations as</div><div class='hunk'>@@ -914,36 +638,35 @@ EXPORT_SYMBOL(compat_ptr_ioctl);</div><div class='ctx'> COMPAT_SYSCALL_DEFINE3(ioctl, unsigned int, fd, unsigned int, cmd,</div><div class='ctx'> 		       compat_ulong_t, arg)</div><div class='ctx'> {</div><div class='del'>-	struct fd f = fdget(fd);</div><div class='add'>+	CLASS(fd, f)(fd);</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	if (!f.file)</div><div class='add'>+	if (fd_empty(f))</div><div class='ctx'> 		return -EBADF;</div><div class='ctx'> </div><div class='del'>-	/* RED-PEN how should LSM module know it's handling 32bit? */</div><div class='del'>-	error = security_file_ioctl(f.file, cmd, arg);</div><div class='add'>+	error = security_file_ioctl_compat(fd_file(f), cmd, arg);</div><div class='ctx'> 	if (error)</div><div class='del'>-		goto out;</div><div class='add'>+		return error;</div><div class='ctx'> </div><div class='ctx'> 	switch (cmd) {</div><div class='ctx'> 	/* FICLONE takes an int argument, so don't use compat_ptr() */</div><div class='ctx'> 	case FICLONE:</div><div class='del'>-		error = ioctl_file_clone(f.file, arg, 0, 0, 0);</div><div class='add'>+		error = ioctl_file_clone(fd_file(f), arg, 0, 0, 0);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> #if defined(CONFIG_X86_64)</div><div class='ctx'> 	/* these get messy on amd64 due to alignment differences */</div><div class='ctx'> 	case FS_IOC_RESVSP_32:</div><div class='ctx'> 	case FS_IOC_RESVSP64_32:</div><div class='del'>-		error = compat_ioctl_preallocate(f.file, 0, compat_ptr(arg));</div><div class='add'>+		error = compat_ioctl_preallocate(fd_file(f), 0, compat_ptr(arg));</div><div class='ctx'> 		break;</div><div class='ctx'> 	case FS_IOC_UNRESVSP_32:</div><div class='ctx'> 	case FS_IOC_UNRESVSP64_32:</div><div class='del'>-		error = compat_ioctl_preallocate(f.file, FALLOC_FL_PUNCH_HOLE,</div><div class='add'>+		error = compat_ioctl_preallocate(fd_file(f), FALLOC_FL_PUNCH_HOLE,</div><div class='ctx'> 				compat_ptr(arg));</div><div class='ctx'> 		break;</div><div class='ctx'> 	case FS_IOC_ZERO_RANGE_32:</div><div class='del'>-		error = compat_ioctl_preallocate(f.file, FALLOC_FL_ZERO_RANGE,</div><div class='add'>+		error = compat_ioctl_preallocate(fd_file(f), FALLOC_FL_ZERO_RANGE,</div><div class='ctx'> 				compat_ptr(arg));</div><div class='ctx'> 		break;</div><div class='ctx'> #endif</div><div class='hunk'>@@ -963,21 +686,17 @@ COMPAT_SYSCALL_DEFINE3(ioctl, unsigned int, fd, unsigned int, cmd,</div><div class='ctx'> 	 * argument.</div><div class='ctx'> 	 */</div><div class='ctx'> 	default:</div><div class='del'>-		error = do_vfs_ioctl(f.file, fd, cmd,</div><div class='add'>+		error = do_vfs_ioctl(fd_file(f), fd, cmd,</div><div class='ctx'> 				     (unsigned long)compat_ptr(arg));</div><div class='ctx'> 		if (error != -ENOIOCTLCMD)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		if (f.file-&gt;f_op-&gt;compat_ioctl)</div><div class='del'>-			error = f.file-&gt;f_op-&gt;compat_ioctl(f.file, cmd, arg);</div><div class='add'>+		if (fd_file(f)-&gt;f_op-&gt;compat_ioctl)</div><div class='add'>+			error = fd_file(f)-&gt;f_op-&gt;compat_ioctl(fd_file(f), cmd, arg);</div><div class='ctx'> 		if (error == -ENOIOCTLCMD)</div><div class='ctx'> 			error = -ENOTTY;</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>- out:</div><div class='del'>-	fdput(f);</div><div class='del'>-</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/iomap/Makefile b/fs/iomap/Makefile<br/>index 4143a3ff89db..a572b8808524 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/iomap/Makefile?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/iomap/Makefile</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/iomap/Makefile?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/iomap/Makefile</a></div><div class='hunk'>@@ -4,14 +4,16 @@</div><div class='ctx'> # All Rights Reserved.</div><div class='ctx'> #</div><div class='ctx'> </div><div class='del'>-ccflags-y += -I $(srctree)/$(src)		# needed for trace events</div><div class='add'>+ccflags-y += -I $(src)		# needed for trace events</div><div class='ctx'> </div><div class='ctx'> obj-$(CONFIG_FS_IOMAP)		+= iomap.o</div><div class='ctx'> </div><div class='ctx'> iomap-y				+= trace.o \</div><div class='del'>-				   buffered-io.o \</div><div class='del'>-				   direct-io.o \</div><div class='del'>-				   fiemap.o \</div><div class='ctx'> 				   iter.o \</div><div class='del'>-				   seek.o</div><div class='add'>+				   buffered-io.o</div><div class='add'>+iomap-$(CONFIG_BLOCK)		+= direct-io.o \</div><div class='add'>+				   ioend.o \</div><div class='add'>+				   fiemap.o \</div><div class='add'>+				   seek.o \</div><div class='add'>+				   bio.o</div><div class='ctx'> iomap-$(CONFIG_SWAP)		+= swapfile.o</div><div class='head'>diff --git a/fs/iomap/bio.c b/fs/iomap/bio.c<br/>new file mode 100644<br/>index 000000000000..fc045f2e4c45<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/iomap/bio.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/iomap/bio.c</a></div><div class='hunk'>@@ -0,0 +1,88 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+/*</div><div class='add'>+ * Copyright (C) 2010 Red Hat, Inc.</div><div class='add'>+ * Copyright (C) 2016-2023 Christoph Hellwig.</div><div class='add'>+ */</div><div class='add'>+#include &lt;linux/iomap.h&gt;</div><div class='add'>+#include &lt;linux/pagemap.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+#include "trace.h"</div><div class='add'>+</div><div class='add'>+static void iomap_read_end_io(struct bio *bio)</div><div class='add'>+{</div><div class='add'>+	int error = blk_status_to_errno(bio-&gt;bi_status);</div><div class='add'>+	struct folio_iter fi;</div><div class='add'>+</div><div class='add'>+	bio_for_each_folio_all(fi, bio)</div><div class='add'>+		iomap_finish_folio_read(fi.folio, fi.offset, fi.length, error);</div><div class='add'>+	bio_put(bio);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void iomap_bio_submit_read(struct iomap_read_folio_ctx *ctx)</div><div class='add'>+{</div><div class='add'>+	struct bio *bio = ctx-&gt;read_ctx;</div><div class='add'>+</div><div class='add'>+	if (bio)</div><div class='add'>+		submit_bio(bio);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int iomap_bio_read_folio_range(const struct iomap_iter *iter,</div><div class='add'>+		struct iomap_read_folio_ctx *ctx, size_t plen)</div><div class='add'>+{</div><div class='add'>+	struct folio *folio = ctx-&gt;cur_folio;</div><div class='add'>+	const struct iomap *iomap = &amp;iter-&gt;iomap;</div><div class='add'>+	loff_t pos = iter-&gt;pos;</div><div class='add'>+	size_t poff = offset_in_folio(folio, pos);</div><div class='add'>+	loff_t length = iomap_length(iter);</div><div class='add'>+	sector_t sector;</div><div class='add'>+	struct bio *bio = ctx-&gt;read_ctx;</div><div class='add'>+</div><div class='add'>+	sector = iomap_sector(iomap, pos);</div><div class='add'>+	if (!bio || bio_end_sector(bio) != sector ||</div><div class='add'>+	    !bio_add_folio(bio, folio, plen, poff)) {</div><div class='add'>+		gfp_t gfp = mapping_gfp_constraint(folio-&gt;mapping, GFP_KERNEL);</div><div class='add'>+		gfp_t orig_gfp = gfp;</div><div class='add'>+		unsigned int nr_vecs = DIV_ROUND_UP(length, PAGE_SIZE);</div><div class='add'>+</div><div class='add'>+		if (bio)</div><div class='add'>+			submit_bio(bio);</div><div class='add'>+</div><div class='add'>+		if (ctx-&gt;rac) /* same as readahead_gfp_mask */</div><div class='add'>+			gfp |= __GFP_NORETRY | __GFP_NOWARN;</div><div class='add'>+		bio = bio_alloc(iomap-&gt;bdev, bio_max_segs(nr_vecs), REQ_OP_READ,</div><div class='add'>+				     gfp);</div><div class='add'>+		/*</div><div class='add'>+		 * If the bio_alloc fails, try it again for a single page to</div><div class='add'>+		 * avoid having to deal with partial page reads.  This emulates</div><div class='add'>+		 * what do_mpage_read_folio does.</div><div class='add'>+		 */</div><div class='add'>+		if (!bio)</div><div class='add'>+			bio = bio_alloc(iomap-&gt;bdev, 1, REQ_OP_READ, orig_gfp);</div><div class='add'>+		if (ctx-&gt;rac)</div><div class='add'>+			bio-&gt;bi_opf |= REQ_RAHEAD;</div><div class='add'>+		bio-&gt;bi_iter.bi_sector = sector;</div><div class='add'>+		bio-&gt;bi_end_io = iomap_read_end_io;</div><div class='add'>+		bio_add_folio_nofail(bio, folio, plen, poff);</div><div class='add'>+		ctx-&gt;read_ctx = bio;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+const struct iomap_read_ops iomap_bio_read_ops = {</div><div class='add'>+	.read_folio_range = iomap_bio_read_folio_range,</div><div class='add'>+	.submit_read = iomap_bio_submit_read,</div><div class='add'>+};</div><div class='add'>+EXPORT_SYMBOL_GPL(iomap_bio_read_ops);</div><div class='add'>+</div><div class='add'>+int iomap_bio_read_folio_range_sync(const struct iomap_iter *iter,</div><div class='add'>+		struct folio *folio, loff_t pos, size_t len)</div><div class='add'>+{</div><div class='add'>+	const struct iomap *srcmap = iomap_iter_srcmap(iter);</div><div class='add'>+	struct bio_vec bvec;</div><div class='add'>+	struct bio bio;</div><div class='add'>+</div><div class='add'>+	bio_init(&amp;bio, srcmap-&gt;bdev, &amp;bvec, 1, REQ_OP_READ);</div><div class='add'>+	bio.bi_iter.bi_sector = iomap_sector(srcmap, pos);</div><div class='add'>+	bio_add_folio_nofail(&amp;bio, folio, len, offset_in_folio(folio, pos));</div><div class='add'>+	return submit_bio_wait(&amp;bio);</div><div class='add'>+}</div><div class='head'>diff --git a/fs/iomap/buffered-io.c b/fs/iomap/buffered-io.c<br/>index 1753c26c8e76..e5c1ca440d93 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/iomap/buffered-io.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/iomap/buffered-io.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/iomap/buffered-io.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/iomap/buffered-io.c</a></div><div class='hunk'>@@ -1,99 +1,291 @@</div><div class='ctx'> // SPDX-License-Identifier: GPL-2.0</div><div class='ctx'> /*</div><div class='ctx'>  * Copyright (C) 2010 Red Hat, Inc.</div><div class='del'>- * Copyright (C) 2016-2019 Christoph Hellwig.</div><div class='add'>+ * Copyright (C) 2016-2023 Christoph Hellwig.</div><div class='ctx'>  */</div><div class='del'>-#include &lt;linux/module.h&gt;</div><div class='del'>-#include &lt;linux/compiler.h&gt;</div><div class='del'>-#include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/iomap.h&gt;</div><div class='del'>-#include &lt;linux/pagemap.h&gt;</div><div class='del'>-#include &lt;linux/uio.h&gt;</div><div class='ctx'> #include &lt;linux/buffer_head.h&gt;</div><div class='del'>-#include &lt;linux/dax.h&gt;</div><div class='ctx'> #include &lt;linux/writeback.h&gt;</div><div class='del'>-#include &lt;linux/list_sort.h&gt;</div><div class='ctx'> #include &lt;linux/swap.h&gt;</div><div class='del'>-#include &lt;linux/bio.h&gt;</div><div class='del'>-#include &lt;linux/sched/signal.h&gt;</div><div class='ctx'> #include &lt;linux/migrate.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='ctx'> #include "trace.h"</div><div class='ctx'> </div><div class='ctx'> #include "../internal.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Structure allocated for each page or THP when block size &lt; page size</div><div class='del'>- * to track sub-page uptodate status and I/O completions.</div><div class='add'>+ * Structure allocated for each folio to track per-block uptodate, dirty state</div><div class='add'>+ * and I/O completions.</div><div class='ctx'>  */</div><div class='del'>-struct iomap_page {</div><div class='del'>-	atomic_t		read_bytes_pending;</div><div class='add'>+struct iomap_folio_state {</div><div class='add'>+	spinlock_t		state_lock;</div><div class='add'>+	unsigned int		read_bytes_pending;</div><div class='ctx'> 	atomic_t		write_bytes_pending;</div><div class='del'>-	spinlock_t		uptodate_lock;</div><div class='del'>-	unsigned long		uptodate[];</div><div class='del'>-};</div><div class='ctx'> </div><div class='del'>-static inline struct iomap_page *to_iomap_page(struct page *page)</div><div class='del'>-{</div><div class='ctx'> 	/*</div><div class='del'>-	 * per-block data is stored in the head page.  Callers should</div><div class='del'>-	 * not be dealing with tail pages, and if they are, they can</div><div class='del'>-	 * call thp_head() first.</div><div class='add'>+	 * Each block has two bits in this bitmap:</div><div class='add'>+	 * Bits [0..blocks_per_folio) has the uptodate status.</div><div class='add'>+	 * Bits [b_p_f...(2*b_p_f))   has the dirty status.</div><div class='ctx'> 	 */</div><div class='del'>-	VM_BUG_ON_PGFLAGS(PageTail(page), page);</div><div class='add'>+	unsigned long		state[];</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static inline bool ifs_is_fully_uptodate(struct folio *folio,</div><div class='add'>+		struct iomap_folio_state *ifs)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> </div><div class='del'>-	if (page_has_private(page))</div><div class='del'>-		return (struct iomap_page *)page_private(page);</div><div class='del'>-	return NULL;</div><div class='add'>+	return bitmap_full(ifs-&gt;state, i_blocks_per_folio(inode, folio));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct bio_set iomap_ioend_bioset;</div><div class='add'>+/*</div><div class='add'>+ * Find the next uptodate block in the folio. end_blk is inclusive.</div><div class='add'>+ * If no uptodate block is found, this will return end_blk + 1.</div><div class='add'>+ */</div><div class='add'>+static unsigned ifs_next_uptodate_block(struct folio *folio,</div><div class='add'>+		unsigned start_blk, unsigned end_blk)</div><div class='add'>+{</div><div class='add'>+	struct iomap_folio_state *ifs = folio-&gt;private;</div><div class='add'>+</div><div class='add'>+	return find_next_bit(ifs-&gt;state, end_blk + 1, start_blk);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-static struct iomap_page *</div><div class='del'>-iomap_page_create(struct inode *inode, struct page *page)</div><div class='add'>+/*</div><div class='add'>+ * Find the next non-uptodate block in the folio. end_blk is inclusive.</div><div class='add'>+ * If no non-uptodate block is found, this will return end_blk + 1.</div><div class='add'>+ */</div><div class='add'>+static unsigned ifs_next_nonuptodate_block(struct folio *folio,</div><div class='add'>+		unsigned start_blk, unsigned end_blk)</div><div class='ctx'> {</div><div class='del'>-	struct iomap_page *iop = to_iomap_page(page);</div><div class='del'>-	unsigned int nr_blocks = i_blocks_per_page(inode, page);</div><div class='del'>-</div><div class='del'>-	if (iop || nr_blocks &lt;= 1)</div><div class='del'>-		return iop;</div><div class='del'>-</div><div class='del'>-	iop = kzalloc(struct_size(iop, uptodate, BITS_TO_LONGS(nr_blocks)),</div><div class='del'>-			GFP_NOFS | __GFP_NOFAIL);</div><div class='del'>-	spin_lock_init(&amp;iop-&gt;uptodate_lock);</div><div class='del'>-	if (PageUptodate(page))</div><div class='del'>-		bitmap_fill(iop-&gt;uptodate, nr_blocks);</div><div class='del'>-	attach_page_private(page, iop);</div><div class='del'>-	return iop;</div><div class='add'>+	struct iomap_folio_state *ifs = folio-&gt;private;</div><div class='add'>+</div><div class='add'>+	return find_next_zero_bit(ifs-&gt;state, end_blk + 1, start_blk);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void</div><div class='del'>-iomap_page_release(struct page *page)</div><div class='add'>+static bool ifs_set_range_uptodate(struct folio *folio,</div><div class='add'>+		struct iomap_folio_state *ifs, size_t off, size_t len)</div><div class='ctx'> {</div><div class='del'>-	struct iomap_page *iop = detach_page_private(page);</div><div class='del'>-	unsigned int nr_blocks = i_blocks_per_page(page-&gt;mapping-&gt;host, page);</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+	unsigned int first_blk = off &gt;&gt; inode-&gt;i_blkbits;</div><div class='add'>+	unsigned int last_blk = (off + len - 1) &gt;&gt; inode-&gt;i_blkbits;</div><div class='add'>+	unsigned int nr_blks = last_blk - first_blk + 1;</div><div class='add'>+</div><div class='add'>+	bitmap_set(ifs-&gt;state, first_blk, nr_blks);</div><div class='add'>+	return ifs_is_fully_uptodate(folio, ifs);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void iomap_set_range_uptodate(struct folio *folio, size_t off,</div><div class='add'>+		size_t len)</div><div class='add'>+{</div><div class='add'>+	struct iomap_folio_state *ifs = folio-&gt;private;</div><div class='add'>+	unsigned long flags;</div><div class='add'>+	bool uptodate = true;</div><div class='ctx'> </div><div class='del'>-	if (!iop)</div><div class='add'>+	if (folio_test_uptodate(folio))</div><div class='ctx'> 		return;</div><div class='del'>-	WARN_ON_ONCE(atomic_read(&amp;iop-&gt;read_bytes_pending));</div><div class='del'>-	WARN_ON_ONCE(atomic_read(&amp;iop-&gt;write_bytes_pending));</div><div class='del'>-	WARN_ON_ONCE(bitmap_full(iop-&gt;uptodate, nr_blocks) !=</div><div class='del'>-			PageUptodate(page));</div><div class='del'>-	kfree(iop);</div><div class='add'>+</div><div class='add'>+	if (ifs) {</div><div class='add'>+		spin_lock_irqsave(&amp;ifs-&gt;state_lock, flags);</div><div class='add'>+		uptodate = ifs_set_range_uptodate(folio, ifs, off, len);</div><div class='add'>+		spin_unlock_irqrestore(&amp;ifs-&gt;state_lock, flags);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (uptodate)</div><div class='add'>+		folio_mark_uptodate(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Calculate the range inside the page that we actually need to read.</div><div class='add'>+ * Find the next dirty block in the folio. end_blk is inclusive.</div><div class='add'>+ * If no dirty block is found, this will return end_blk + 1.</div><div class='ctx'>  */</div><div class='del'>-static void</div><div class='del'>-iomap_adjust_read_range(struct inode *inode, struct iomap_page *iop,</div><div class='del'>-		loff_t *pos, loff_t length, unsigned *offp, unsigned *lenp)</div><div class='add'>+static unsigned ifs_next_dirty_block(struct folio *folio,</div><div class='add'>+		unsigned start_blk, unsigned end_blk)</div><div class='add'>+{</div><div class='add'>+	struct iomap_folio_state *ifs = folio-&gt;private;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+	unsigned int blks = i_blocks_per_folio(inode, folio);</div><div class='add'>+</div><div class='add'>+	return find_next_bit(ifs-&gt;state, blks + end_blk + 1,</div><div class='add'>+			blks + start_blk) - blks;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Find the next clean block in the folio. end_blk is inclusive.</div><div class='add'>+ * If no clean block is found, this will return end_blk + 1.</div><div class='add'>+ */</div><div class='add'>+static unsigned ifs_next_clean_block(struct folio *folio,</div><div class='add'>+		unsigned start_blk, unsigned end_blk)</div><div class='ctx'> {</div><div class='add'>+	struct iomap_folio_state *ifs = folio-&gt;private;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+	unsigned int blks = i_blocks_per_folio(inode, folio);</div><div class='add'>+</div><div class='add'>+	return find_next_zero_bit(ifs-&gt;state, blks + end_blk + 1,</div><div class='add'>+			blks + start_blk) - blks;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static unsigned ifs_find_dirty_range(struct folio *folio,</div><div class='add'>+		struct iomap_folio_state *ifs, u64 *range_start, u64 range_end)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+	unsigned start_blk =</div><div class='add'>+		offset_in_folio(folio, *range_start) &gt;&gt; inode-&gt;i_blkbits;</div><div class='add'>+	unsigned end_blk = min_not_zero(</div><div class='add'>+		offset_in_folio(folio, range_end) &gt;&gt; inode-&gt;i_blkbits,</div><div class='add'>+		i_blocks_per_folio(inode, folio)) - 1;</div><div class='add'>+	unsigned nblks;</div><div class='add'>+</div><div class='add'>+	start_blk = ifs_next_dirty_block(folio, start_blk, end_blk);</div><div class='add'>+	if (start_blk &gt; end_blk)</div><div class='add'>+		return 0;</div><div class='add'>+	if (start_blk == end_blk)</div><div class='add'>+		nblks = 1;</div><div class='add'>+	else</div><div class='add'>+		nblks = ifs_next_clean_block(folio, start_blk + 1, end_blk) -</div><div class='add'>+				start_blk;</div><div class='add'>+</div><div class='add'>+	*range_start = folio_pos(folio) + (start_blk &lt;&lt; inode-&gt;i_blkbits);</div><div class='add'>+	return nblks &lt;&lt; inode-&gt;i_blkbits;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static unsigned iomap_find_dirty_range(struct folio *folio, u64 *range_start,</div><div class='add'>+		u64 range_end)</div><div class='add'>+{</div><div class='add'>+	struct iomap_folio_state *ifs = folio-&gt;private;</div><div class='add'>+</div><div class='add'>+	if (*range_start &gt;= range_end)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if (ifs)</div><div class='add'>+		return ifs_find_dirty_range(folio, ifs, range_start, range_end);</div><div class='add'>+	return range_end - *range_start;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void ifs_clear_range_dirty(struct folio *folio,</div><div class='add'>+		struct iomap_folio_state *ifs, size_t off, size_t len)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+	unsigned int blks_per_folio = i_blocks_per_folio(inode, folio);</div><div class='add'>+	unsigned int first_blk = (off &gt;&gt; inode-&gt;i_blkbits);</div><div class='add'>+	unsigned int last_blk = (off + len - 1) &gt;&gt; inode-&gt;i_blkbits;</div><div class='add'>+	unsigned int nr_blks = last_blk - first_blk + 1;</div><div class='add'>+	unsigned long flags;</div><div class='add'>+</div><div class='add'>+	spin_lock_irqsave(&amp;ifs-&gt;state_lock, flags);</div><div class='add'>+	bitmap_clear(ifs-&gt;state, first_blk + blks_per_folio, nr_blks);</div><div class='add'>+	spin_unlock_irqrestore(&amp;ifs-&gt;state_lock, flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void iomap_clear_range_dirty(struct folio *folio, size_t off, size_t len)</div><div class='add'>+{</div><div class='add'>+	struct iomap_folio_state *ifs = folio-&gt;private;</div><div class='add'>+</div><div class='add'>+	if (ifs)</div><div class='add'>+		ifs_clear_range_dirty(folio, ifs, off, len);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void ifs_set_range_dirty(struct folio *folio,</div><div class='add'>+		struct iomap_folio_state *ifs, size_t off, size_t len)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+	unsigned int blks_per_folio = i_blocks_per_folio(inode, folio);</div><div class='add'>+	unsigned int first_blk = (off &gt;&gt; inode-&gt;i_blkbits);</div><div class='add'>+	unsigned int last_blk = (off + len - 1) &gt;&gt; inode-&gt;i_blkbits;</div><div class='add'>+	unsigned int nr_blks = last_blk - first_blk + 1;</div><div class='add'>+	unsigned long flags;</div><div class='add'>+</div><div class='add'>+	spin_lock_irqsave(&amp;ifs-&gt;state_lock, flags);</div><div class='add'>+	bitmap_set(ifs-&gt;state, first_blk + blks_per_folio, nr_blks);</div><div class='add'>+	spin_unlock_irqrestore(&amp;ifs-&gt;state_lock, flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void iomap_set_range_dirty(struct folio *folio, size_t off, size_t len)</div><div class='add'>+{</div><div class='add'>+	struct iomap_folio_state *ifs = folio-&gt;private;</div><div class='add'>+</div><div class='add'>+	if (ifs)</div><div class='add'>+		ifs_set_range_dirty(folio, ifs, off, len);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct iomap_folio_state *ifs_alloc(struct inode *inode,</div><div class='add'>+		struct folio *folio, unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	struct iomap_folio_state *ifs = folio-&gt;private;</div><div class='add'>+	unsigned int nr_blocks = i_blocks_per_folio(inode, folio);</div><div class='add'>+	gfp_t gfp;</div><div class='add'>+</div><div class='add'>+	if (ifs || nr_blocks &lt;= 1)</div><div class='add'>+		return ifs;</div><div class='add'>+</div><div class='add'>+	if (flags &amp; IOMAP_NOWAIT)</div><div class='add'>+		gfp = GFP_NOWAIT;</div><div class='add'>+	else</div><div class='add'>+		gfp = GFP_NOFS | __GFP_NOFAIL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * ifs-&gt;state tracks two sets of state flags when the</div><div class='add'>+	 * filesystem block size is smaller than the folio size.</div><div class='add'>+	 * The first state tracks per-block uptodate and the</div><div class='add'>+	 * second tracks per-block dirty state.</div><div class='add'>+	 */</div><div class='add'>+	ifs = kzalloc(struct_size(ifs, state,</div><div class='add'>+		      BITS_TO_LONGS(2 * nr_blocks)), gfp);</div><div class='add'>+	if (!ifs)</div><div class='add'>+		return ifs;</div><div class='add'>+</div><div class='add'>+	spin_lock_init(&amp;ifs-&gt;state_lock);</div><div class='add'>+	if (folio_test_uptodate(folio))</div><div class='add'>+		bitmap_set(ifs-&gt;state, 0, nr_blocks);</div><div class='add'>+	if (folio_test_dirty(folio))</div><div class='add'>+		bitmap_set(ifs-&gt;state, nr_blocks, nr_blocks);</div><div class='add'>+	folio_attach_private(folio, ifs);</div><div class='add'>+</div><div class='add'>+	return ifs;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void ifs_free(struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	struct iomap_folio_state *ifs = folio_detach_private(folio);</div><div class='add'>+</div><div class='add'>+	if (!ifs)</div><div class='add'>+		return;</div><div class='add'>+	WARN_ON_ONCE(ifs-&gt;read_bytes_pending != 0);</div><div class='add'>+	WARN_ON_ONCE(atomic_read(&amp;ifs-&gt;write_bytes_pending));</div><div class='add'>+	WARN_ON_ONCE(ifs_is_fully_uptodate(folio, ifs) !=</div><div class='add'>+			folio_test_uptodate(folio));</div><div class='add'>+	kfree(ifs);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Calculate how many bytes to truncate based off the number of blocks to</div><div class='add'>+ * truncate and the end position to start truncating from.</div><div class='add'>+ */</div><div class='add'>+static size_t iomap_bytes_to_truncate(loff_t end_pos, unsigned block_bits,</div><div class='add'>+		unsigned blocks_truncated)</div><div class='add'>+{</div><div class='add'>+	unsigned block_size = 1 &lt;&lt; block_bits;</div><div class='add'>+	unsigned block_offset = end_pos &amp; (block_size - 1);</div><div class='add'>+</div><div class='add'>+	if (!block_offset)</div><div class='add'>+		return blocks_truncated &lt;&lt; block_bits;</div><div class='add'>+</div><div class='add'>+	return ((blocks_truncated - 1) &lt;&lt; block_bits) + block_offset;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Calculate the range inside the folio that we actually need to read.</div><div class='add'>+ */</div><div class='add'>+static void iomap_adjust_read_range(struct inode *inode, struct folio *folio,</div><div class='add'>+		loff_t *pos, loff_t length, size_t *offp, size_t *lenp)</div><div class='add'>+{</div><div class='add'>+	struct iomap_folio_state *ifs = folio-&gt;private;</div><div class='ctx'> 	loff_t orig_pos = *pos;</div><div class='ctx'> 	loff_t isize = i_size_read(inode);</div><div class='ctx'> 	unsigned block_bits = inode-&gt;i_blkbits;</div><div class='ctx'> 	unsigned block_size = (1 &lt;&lt; block_bits);</div><div class='del'>-	unsigned poff = offset_in_page(*pos);</div><div class='del'>-	unsigned plen = min_t(loff_t, PAGE_SIZE - poff, length);</div><div class='add'>+	size_t poff = offset_in_folio(folio, *pos);</div><div class='add'>+	size_t plen = min_t(loff_t, folio_size(folio) - poff, length);</div><div class='add'>+	size_t orig_plen = plen;</div><div class='ctx'> 	unsigned first = poff &gt;&gt; block_bits;</div><div class='ctx'> 	unsigned last = (poff + plen - 1) &gt;&gt; block_bits;</div><div class='ctx'> </div><div class='hunk'>@@ -102,25 +294,30 @@ iomap_adjust_read_range(struct inode *inode, struct iomap_page *iop,</div><div class='ctx'> 	 * per-block uptodate status and adjust the offset and length if needed</div><div class='ctx'> 	 * to avoid reading in already uptodate ranges.</div><div class='ctx'> 	 */</div><div class='del'>-	if (iop) {</div><div class='del'>-		unsigned int i;</div><div class='del'>-</div><div class='del'>-		/* move forward for each leading block marked uptodate */</div><div class='del'>-		for (i = first; i &lt;= last; i++) {</div><div class='del'>-			if (!test_bit(i, iop-&gt;uptodate))</div><div class='del'>-				break;</div><div class='del'>-			*pos += block_size;</div><div class='del'>-			poff += block_size;</div><div class='del'>-			plen -= block_size;</div><div class='del'>-			first++;</div><div class='add'>+	if (ifs) {</div><div class='add'>+		unsigned int next, blocks_skipped;</div><div class='add'>+</div><div class='add'>+		next = ifs_next_nonuptodate_block(folio, first, last);</div><div class='add'>+		blocks_skipped = next - first;</div><div class='add'>+</div><div class='add'>+		if (blocks_skipped) {</div><div class='add'>+			unsigned long block_offset = *pos &amp; (block_size - 1);</div><div class='add'>+			unsigned bytes_skipped =</div><div class='add'>+				(blocks_skipped &lt;&lt; block_bits) - block_offset;</div><div class='add'>+</div><div class='add'>+			*pos += bytes_skipped;</div><div class='add'>+			poff += bytes_skipped;</div><div class='add'>+			plen -= bytes_skipped;</div><div class='ctx'> 		}</div><div class='add'>+		first = next;</div><div class='ctx'> </div><div class='ctx'> 		/* truncate len if we find any trailing uptodate block(s) */</div><div class='del'>-		for ( ; i &lt;= last; i++) {</div><div class='del'>-			if (test_bit(i, iop-&gt;uptodate)) {</div><div class='del'>-				plen -= (last - i + 1) * block_size;</div><div class='del'>-				last = i - 1;</div><div class='del'>-				break;</div><div class='add'>+		if (++next &lt;= last) {</div><div class='add'>+			next = ifs_next_uptodate_block(folio, next, last);</div><div class='add'>+			if (next &lt;= last) {</div><div class='add'>+				plen -= iomap_bytes_to_truncate(*pos + plen,</div><div class='add'>+						block_bits, last - next + 1);</div><div class='add'>+				last = next - 1;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -130,255 +327,287 @@ iomap_adjust_read_range(struct inode *inode, struct iomap_page *iop,</div><div class='ctx'> 	 * handle both halves separately so that we properly zero data in the</div><div class='ctx'> 	 * page cache for blocks that are entirely outside of i_size.</div><div class='ctx'> 	 */</div><div class='del'>-	if (orig_pos &lt;= isize &amp;&amp; orig_pos + length &gt; isize) {</div><div class='del'>-		unsigned end = offset_in_page(isize - 1) &gt;&gt; block_bits;</div><div class='add'>+	if (orig_pos &lt;= isize &amp;&amp; orig_pos + orig_plen &gt; isize) {</div><div class='add'>+		unsigned end = offset_in_folio(folio, isize - 1) &gt;&gt; block_bits;</div><div class='ctx'> </div><div class='ctx'> 		if (first &lt;= end &amp;&amp; last &gt; end)</div><div class='del'>-			plen -= (last - end) * block_size;</div><div class='add'>+			plen -= iomap_bytes_to_truncate(*pos + plen, block_bits,</div><div class='add'>+					last - end);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	*offp = poff;</div><div class='ctx'> 	*lenp = plen;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void</div><div class='del'>-iomap_iop_set_range_uptodate(struct page *page, unsigned off, unsigned len)</div><div class='add'>+static inline bool iomap_block_needs_zeroing(const struct iomap_iter *iter,</div><div class='add'>+		loff_t pos)</div><div class='ctx'> {</div><div class='del'>-	struct iomap_page *iop = to_iomap_page(page);</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-	unsigned first = off &gt;&gt; inode-&gt;i_blkbits;</div><div class='del'>-	unsigned last = (off + len - 1) &gt;&gt; inode-&gt;i_blkbits;</div><div class='del'>-	unsigned long flags;</div><div class='add'>+	const struct iomap *srcmap = iomap_iter_srcmap(iter);</div><div class='ctx'> </div><div class='del'>-	spin_lock_irqsave(&amp;iop-&gt;uptodate_lock, flags);</div><div class='del'>-	bitmap_set(iop-&gt;uptodate, first, last - first + 1);</div><div class='del'>-	if (bitmap_full(iop-&gt;uptodate, i_blocks_per_page(inode, page)))</div><div class='del'>-		SetPageUptodate(page);</div><div class='del'>-	spin_unlock_irqrestore(&amp;iop-&gt;uptodate_lock, flags);</div><div class='add'>+	return srcmap-&gt;type != IOMAP_MAPPED ||</div><div class='add'>+		(srcmap-&gt;flags &amp; IOMAP_F_NEW) ||</div><div class='add'>+		pos &gt;= i_size_read(iter-&gt;inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void</div><div class='del'>-iomap_set_range_uptodate(struct page *page, unsigned off, unsigned len)</div><div class='add'>+/**</div><div class='add'>+ * iomap_read_inline_data - copy inline data into the page cache</div><div class='add'>+ * @iter: iteration structure</div><div class='add'>+ * @folio: folio to copy to</div><div class='add'>+ *</div><div class='add'>+ * Copy the inline data in @iter into @folio and zero out the rest of the folio.</div><div class='add'>+ * Only a single IOMAP_INLINE extent is allowed at the end of each file.</div><div class='add'>+ * Returns zero for success to complete the read, or the usual negative errno.</div><div class='add'>+ */</div><div class='add'>+static int iomap_read_inline_data(const struct iomap_iter *iter,</div><div class='add'>+		struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	if (PageError(page))</div><div class='del'>-		return;</div><div class='add'>+	const struct iomap *iomap = iomap_iter_srcmap(iter);</div><div class='add'>+	size_t size = i_size_read(iter-&gt;inode) - iomap-&gt;offset;</div><div class='add'>+	size_t offset = offset_in_folio(folio, iomap-&gt;offset);</div><div class='ctx'> </div><div class='del'>-	if (page_has_private(page))</div><div class='del'>-		iomap_iop_set_range_uptodate(page, off, len);</div><div class='del'>-	else</div><div class='del'>-		SetPageUptodate(page);</div><div class='del'>-}</div><div class='add'>+	if (WARN_ON_ONCE(!iomap-&gt;inline_data))</div><div class='add'>+		return -EIO;</div><div class='ctx'> </div><div class='del'>-static void</div><div class='del'>-iomap_read_page_end_io(struct bio_vec *bvec, int error)</div><div class='del'>-{</div><div class='del'>-	struct page *page = bvec-&gt;bv_page;</div><div class='del'>-	struct iomap_page *iop = to_iomap_page(page);</div><div class='add'>+	if (folio_test_uptodate(folio))</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(error)) {</div><div class='del'>-		ClearPageUptodate(page);</div><div class='del'>-		SetPageError(page);</div><div class='del'>-	} else {</div><div class='del'>-		iomap_set_range_uptodate(page, bvec-&gt;bv_offset, bvec-&gt;bv_len);</div><div class='del'>-	}</div><div class='add'>+	if (WARN_ON_ONCE(size &gt; iomap-&gt;length))</div><div class='add'>+		return -EIO;</div><div class='add'>+	if (offset &gt; 0)</div><div class='add'>+		ifs_alloc(iter-&gt;inode, folio, iter-&gt;flags);</div><div class='ctx'> </div><div class='del'>-	if (!iop || atomic_sub_and_test(bvec-&gt;bv_len, &amp;iop-&gt;read_bytes_pending))</div><div class='del'>-		unlock_page(page);</div><div class='add'>+	folio_fill_tail(folio, offset, iomap-&gt;inline_data, size);</div><div class='add'>+	iomap_set_range_uptodate(folio, offset, folio_size(folio) - offset);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void</div><div class='del'>-iomap_read_end_io(struct bio *bio)</div><div class='add'>+void iomap_finish_folio_read(struct folio *folio, size_t off, size_t len,</div><div class='add'>+		int error)</div><div class='ctx'> {</div><div class='del'>-	int error = blk_status_to_errno(bio-&gt;bi_status);</div><div class='del'>-	struct bio_vec *bvec;</div><div class='del'>-	struct bvec_iter_all iter_all;</div><div class='add'>+	struct iomap_folio_state *ifs = folio-&gt;private;</div><div class='add'>+	bool uptodate = !error;</div><div class='add'>+	bool finished = true;</div><div class='add'>+</div><div class='add'>+	if (ifs) {</div><div class='add'>+		unsigned long flags;</div><div class='add'>+</div><div class='add'>+		spin_lock_irqsave(&amp;ifs-&gt;state_lock, flags);</div><div class='add'>+		if (!error)</div><div class='add'>+			uptodate = ifs_set_range_uptodate(folio, ifs, off, len);</div><div class='add'>+		ifs-&gt;read_bytes_pending -= len;</div><div class='add'>+		finished = !ifs-&gt;read_bytes_pending;</div><div class='add'>+		spin_unlock_irqrestore(&amp;ifs-&gt;state_lock, flags);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	bio_for_each_segment_all(bvec, bio, iter_all)</div><div class='del'>-		iomap_read_page_end_io(bvec, error);</div><div class='del'>-	bio_put(bio);</div><div class='add'>+	if (finished)</div><div class='add'>+		folio_end_read(folio, uptodate);</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL_GPL(iomap_finish_folio_read);</div><div class='ctx'> </div><div class='del'>-struct iomap_readpage_ctx {</div><div class='del'>-	struct page		*cur_page;</div><div class='del'>-	bool			cur_page_in_bio;</div><div class='del'>-	struct bio		*bio;</div><div class='del'>-	struct readahead_control *rac;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static loff_t iomap_read_inline_data(const struct iomap_iter *iter,</div><div class='del'>-		struct page *page)</div><div class='add'>+static void iomap_read_init(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	const struct iomap *iomap = iomap_iter_srcmap(iter);</div><div class='del'>-	size_t size = i_size_read(iter-&gt;inode) - iomap-&gt;offset;</div><div class='del'>-	size_t poff = offset_in_page(iomap-&gt;offset);</div><div class='del'>-	void *addr;</div><div class='add'>+	struct iomap_folio_state *ifs = folio-&gt;private;</div><div class='ctx'> </div><div class='del'>-	if (PageUptodate(page))</div><div class='del'>-		return PAGE_SIZE - poff;</div><div class='add'>+	if (ifs) {</div><div class='add'>+		size_t len = folio_size(folio);</div><div class='ctx'> </div><div class='del'>-	if (WARN_ON_ONCE(size &gt; PAGE_SIZE - poff))</div><div class='del'>-		return -EIO;</div><div class='del'>-	if (WARN_ON_ONCE(size &gt; PAGE_SIZE -</div><div class='del'>-			 offset_in_page(iomap-&gt;inline_data)))</div><div class='del'>-		return -EIO;</div><div class='del'>-	if (WARN_ON_ONCE(size &gt; iomap-&gt;length))</div><div class='del'>-		return -EIO;</div><div class='del'>-	if (poff &gt; 0)</div><div class='del'>-		iomap_page_create(iter-&gt;inode, page);</div><div class='del'>-</div><div class='del'>-	addr = kmap_local_page(page) + poff;</div><div class='del'>-	memcpy(addr, iomap-&gt;inline_data, size);</div><div class='del'>-	memset(addr + size, 0, PAGE_SIZE - poff - size);</div><div class='del'>-	kunmap_local(addr);</div><div class='del'>-	iomap_set_range_uptodate(page, poff, PAGE_SIZE - poff);</div><div class='del'>-	return PAGE_SIZE - poff;</div><div class='add'>+		/*</div><div class='add'>+		 * ifs-&gt;read_bytes_pending is used to track how many bytes are</div><div class='add'>+		 * read in asynchronously by the IO helper. We need to track</div><div class='add'>+		 * this so that we can know when the IO helper has finished</div><div class='add'>+		 * reading in all the necessary ranges of the folio and can end</div><div class='add'>+		 * the read.</div><div class='add'>+		 *</div><div class='add'>+		 * Increase -&gt;read_bytes_pending by the folio size to start, and</div><div class='add'>+		 * add a +1 bias. We'll subtract the bias and any uptodate /</div><div class='add'>+		 * zeroed ranges that did not require IO in iomap_read_end()</div><div class='add'>+		 * after we're done processing the folio.</div><div class='add'>+		 *</div><div class='add'>+		 * We do this because otherwise, we would have to increment</div><div class='add'>+		 * ifs-&gt;read_bytes_pending every time a range in the folio needs</div><div class='add'>+		 * to be read in, which can get expensive since the spinlock</div><div class='add'>+		 * needs to be held whenever modifying ifs-&gt;read_bytes_pending.</div><div class='add'>+		 *</div><div class='add'>+		 * We add the bias to ensure the read has not been ended on the</div><div class='add'>+		 * folio when iomap_read_end() is called, even if the IO helper</div><div class='add'>+		 * has already finished reading in the entire folio.</div><div class='add'>+		 */</div><div class='add'>+		spin_lock_irq(&amp;ifs-&gt;state_lock);</div><div class='add'>+		WARN_ON_ONCE(ifs-&gt;read_bytes_pending != 0);</div><div class='add'>+		ifs-&gt;read_bytes_pending = len + 1;</div><div class='add'>+		spin_unlock_irq(&amp;ifs-&gt;state_lock);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline bool iomap_block_needs_zeroing(const struct iomap_iter *iter,</div><div class='del'>-		loff_t pos)</div><div class='add'>+/*</div><div class='add'>+ * This ends IO if no bytes were submitted to an IO helper.</div><div class='add'>+ *</div><div class='add'>+ * Otherwise, this calibrates ifs-&gt;read_bytes_pending to represent only the</div><div class='add'>+ * submitted bytes (see comment in iomap_read_init()). If all bytes submitted</div><div class='add'>+ * have already been completed by the IO helper, then this will end the read.</div><div class='add'>+ * Else the IO helper will end the read after all submitted ranges have been</div><div class='add'>+ * read.</div><div class='add'>+ */</div><div class='add'>+static void iomap_read_end(struct folio *folio, size_t bytes_submitted)</div><div class='ctx'> {</div><div class='del'>-	const struct iomap *srcmap = iomap_iter_srcmap(iter);</div><div class='add'>+	struct iomap_folio_state *ifs = folio-&gt;private;</div><div class='ctx'> </div><div class='del'>-	return srcmap-&gt;type != IOMAP_MAPPED ||</div><div class='del'>-		(srcmap-&gt;flags &amp; IOMAP_F_NEW) ||</div><div class='del'>-		pos &gt;= i_size_read(iter-&gt;inode);</div><div class='add'>+	if (ifs) {</div><div class='add'>+		bool end_read, uptodate;</div><div class='add'>+</div><div class='add'>+		spin_lock_irq(&amp;ifs-&gt;state_lock);</div><div class='add'>+		if (!ifs-&gt;read_bytes_pending) {</div><div class='add'>+			WARN_ON_ONCE(bytes_submitted);</div><div class='add'>+			spin_unlock_irq(&amp;ifs-&gt;state_lock);</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Subtract any bytes that were initially accounted to</div><div class='add'>+		 * read_bytes_pending but skipped for IO. The +1 accounts for</div><div class='add'>+		 * the bias we added in iomap_read_init().</div><div class='add'>+		 */</div><div class='add'>+		ifs-&gt;read_bytes_pending -=</div><div class='add'>+			(folio_size(folio) + 1 - bytes_submitted);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * If !ifs-&gt;read_bytes_pending, this means all pending reads by</div><div class='add'>+		 * the IO helper have already completed, which means we need to</div><div class='add'>+		 * end the folio read here. If ifs-&gt;read_bytes_pending != 0,</div><div class='add'>+		 * the IO helper will end the folio read.</div><div class='add'>+		 */</div><div class='add'>+		end_read = !ifs-&gt;read_bytes_pending;</div><div class='add'>+		if (end_read)</div><div class='add'>+			uptodate = ifs_is_fully_uptodate(folio, ifs);</div><div class='add'>+		spin_unlock_irq(&amp;ifs-&gt;state_lock);</div><div class='add'>+		if (end_read)</div><div class='add'>+			folio_end_read(folio, uptodate);</div><div class='add'>+	} else if (!bytes_submitted) {</div><div class='add'>+		/*</div><div class='add'>+		 * If there were no bytes submitted, this means we are</div><div class='add'>+		 * responsible for unlocking the folio here, since no IO helper</div><div class='add'>+		 * has taken ownership of it. If there were bytes submitted,</div><div class='add'>+		 * then the IO helper will end the read via</div><div class='add'>+		 * iomap_finish_folio_read().</div><div class='add'>+		 */</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static loff_t iomap_readpage_iter(const struct iomap_iter *iter,</div><div class='del'>-		struct iomap_readpage_ctx *ctx, loff_t offset)</div><div class='add'>+static int iomap_read_folio_iter(struct iomap_iter *iter,</div><div class='add'>+		struct iomap_read_folio_ctx *ctx, size_t *bytes_submitted)</div><div class='ctx'> {</div><div class='ctx'> 	const struct iomap *iomap = &amp;iter-&gt;iomap;</div><div class='del'>-	loff_t pos = iter-&gt;pos + offset;</div><div class='del'>-	loff_t length = iomap_length(iter) - offset;</div><div class='del'>-	struct page *page = ctx-&gt;cur_page;</div><div class='del'>-	struct iomap_page *iop;</div><div class='del'>-	loff_t orig_pos = pos;</div><div class='del'>-	unsigned poff, plen;</div><div class='del'>-	sector_t sector;</div><div class='del'>-</div><div class='del'>-	if (iomap-&gt;type == IOMAP_INLINE)</div><div class='del'>-		return min(iomap_read_inline_data(iter, page), length);</div><div class='del'>-</div><div class='del'>-	/* zero post-eof blocks as the page may be mapped */</div><div class='del'>-	iop = iomap_page_create(iter-&gt;inode, page);</div><div class='del'>-	iomap_adjust_read_range(iter-&gt;inode, iop, &amp;pos, length, &amp;poff, &amp;plen);</div><div class='del'>-	if (plen == 0)</div><div class='del'>-		goto done;</div><div class='del'>-</div><div class='del'>-	if (iomap_block_needs_zeroing(iter, pos)) {</div><div class='del'>-		zero_user(page, poff, plen);</div><div class='del'>-		iomap_set_range_uptodate(page, poff, plen);</div><div class='del'>-		goto done;</div><div class='add'>+	loff_t pos = iter-&gt;pos;</div><div class='add'>+	loff_t length = iomap_length(iter);</div><div class='add'>+	struct folio *folio = ctx-&gt;cur_folio;</div><div class='add'>+	size_t poff, plen;</div><div class='add'>+	loff_t pos_diff;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (iomap-&gt;type == IOMAP_INLINE) {</div><div class='add'>+		ret = iomap_read_inline_data(iter, folio);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		return iomap_iter_advance(iter, length);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ctx-&gt;cur_page_in_bio = true;</div><div class='del'>-	if (iop)</div><div class='del'>-		atomic_add(plen, &amp;iop-&gt;read_bytes_pending);</div><div class='add'>+	ifs_alloc(iter-&gt;inode, folio, iter-&gt;flags);</div><div class='ctx'> </div><div class='del'>-	sector = iomap_sector(iomap, pos);</div><div class='del'>-	if (!ctx-&gt;bio ||</div><div class='del'>-	    bio_end_sector(ctx-&gt;bio) != sector ||</div><div class='del'>-	    bio_add_page(ctx-&gt;bio, page, plen, poff) != plen) {</div><div class='del'>-		gfp_t gfp = mapping_gfp_constraint(page-&gt;mapping, GFP_KERNEL);</div><div class='del'>-		gfp_t orig_gfp = gfp;</div><div class='del'>-		unsigned int nr_vecs = DIV_ROUND_UP(length, PAGE_SIZE);</div><div class='add'>+	length = min_t(loff_t, length,</div><div class='add'>+			folio_size(folio) - offset_in_folio(folio, pos));</div><div class='add'>+	while (length) {</div><div class='add'>+		iomap_adjust_read_range(iter-&gt;inode, folio, &amp;pos, length, &amp;poff,</div><div class='add'>+				&amp;plen);</div><div class='ctx'> </div><div class='del'>-		if (ctx-&gt;bio)</div><div class='del'>-			submit_bio(ctx-&gt;bio);</div><div class='add'>+		pos_diff = pos - iter-&gt;pos;</div><div class='add'>+		if (WARN_ON_ONCE(pos_diff + plen &gt; length))</div><div class='add'>+			return -EIO;</div><div class='ctx'> </div><div class='del'>-		if (ctx-&gt;rac) /* same as readahead_gfp_mask */</div><div class='del'>-			gfp |= __GFP_NORETRY | __GFP_NOWARN;</div><div class='del'>-		ctx-&gt;bio = bio_alloc(gfp, bio_max_segs(nr_vecs));</div><div class='del'>-		/*</div><div class='del'>-		 * If the bio_alloc fails, try it again for a single page to</div><div class='del'>-		 * avoid having to deal with partial page reads.  This emulates</div><div class='del'>-		 * what do_mpage_readpage does.</div><div class='del'>-		 */</div><div class='del'>-		if (!ctx-&gt;bio)</div><div class='del'>-			ctx-&gt;bio = bio_alloc(orig_gfp, 1);</div><div class='del'>-		ctx-&gt;bio-&gt;bi_opf = REQ_OP_READ;</div><div class='del'>-		if (ctx-&gt;rac)</div><div class='del'>-			ctx-&gt;bio-&gt;bi_opf |= REQ_RAHEAD;</div><div class='del'>-		ctx-&gt;bio-&gt;bi_iter.bi_sector = sector;</div><div class='del'>-		bio_set_dev(ctx-&gt;bio, iomap-&gt;bdev);</div><div class='del'>-		ctx-&gt;bio-&gt;bi_end_io = iomap_read_end_io;</div><div class='del'>-		__bio_add_page(ctx-&gt;bio, page, plen, poff);</div><div class='add'>+		ret = iomap_iter_advance(iter, pos_diff);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+</div><div class='add'>+		if (plen == 0)</div><div class='add'>+			return 0;</div><div class='add'>+</div><div class='add'>+		/* zero post-eof blocks as the page may be mapped */</div><div class='add'>+		if (iomap_block_needs_zeroing(iter, pos)) {</div><div class='add'>+			folio_zero_range(folio, poff, plen);</div><div class='add'>+			iomap_set_range_uptodate(folio, poff, plen);</div><div class='add'>+		} else {</div><div class='add'>+			if (!*bytes_submitted)</div><div class='add'>+				iomap_read_init(folio);</div><div class='add'>+			ret = ctx-&gt;ops-&gt;read_folio_range(iter, ctx, plen);</div><div class='add'>+			if (ret)</div><div class='add'>+				return ret;</div><div class='add'>+			*bytes_submitted += plen;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		ret = iomap_iter_advance(iter, plen);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+		length -= pos_diff + plen;</div><div class='add'>+		pos = iter-&gt;pos;</div><div class='ctx'> 	}</div><div class='del'>-done:</div><div class='del'>-	/*</div><div class='del'>-	 * Move the caller beyond our range so that it keeps making progress.</div><div class='del'>-	 * For that, we have to include any leading non-uptodate ranges, but</div><div class='del'>-	 * we can skip trailing ones as they will be handled in the next</div><div class='del'>-	 * iteration.</div><div class='del'>-	 */</div><div class='del'>-	return pos - orig_pos + plen;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int</div><div class='del'>-iomap_readpage(struct page *page, const struct iomap_ops *ops)</div><div class='add'>+void iomap_read_folio(const struct iomap_ops *ops,</div><div class='add'>+		struct iomap_read_folio_ctx *ctx)</div><div class='ctx'> {</div><div class='add'>+	struct folio *folio = ctx-&gt;cur_folio;</div><div class='ctx'> 	struct iomap_iter iter = {</div><div class='del'>-		.inode		= page-&gt;mapping-&gt;host,</div><div class='del'>-		.pos		= page_offset(page),</div><div class='del'>-		.len		= PAGE_SIZE,</div><div class='del'>-	};</div><div class='del'>-	struct iomap_readpage_ctx ctx = {</div><div class='del'>-		.cur_page	= page,</div><div class='add'>+		.inode		= folio-&gt;mapping-&gt;host,</div><div class='add'>+		.pos		= folio_pos(folio),</div><div class='add'>+		.len		= folio_size(folio),</div><div class='ctx'> 	};</div><div class='add'>+	size_t bytes_submitted = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	trace_iomap_readpage(page-&gt;mapping-&gt;host, 1);</div><div class='add'>+	trace_iomap_readpage(iter.inode, 1);</div><div class='ctx'> </div><div class='ctx'> 	while ((ret = iomap_iter(&amp;iter, ops)) &gt; 0)</div><div class='del'>-		iter.processed = iomap_readpage_iter(&amp;iter, &amp;ctx, 0);</div><div class='add'>+		iter.status = iomap_read_folio_iter(&amp;iter, ctx,</div><div class='add'>+				&amp;bytes_submitted);</div><div class='ctx'> </div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		SetPageError(page);</div><div class='add'>+	if (ctx-&gt;ops-&gt;submit_read)</div><div class='add'>+		ctx-&gt;ops-&gt;submit_read(ctx);</div><div class='ctx'> </div><div class='del'>-	if (ctx.bio) {</div><div class='del'>-		submit_bio(ctx.bio);</div><div class='del'>-		WARN_ON_ONCE(!ctx.cur_page_in_bio);</div><div class='del'>-	} else {</div><div class='del'>-		WARN_ON_ONCE(ctx.cur_page_in_bio);</div><div class='del'>-		unlock_page(page);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Just like mpage_readahead and block_read_full_page, we always</div><div class='del'>-	 * return 0 and just mark the page as PageError on errors.  This</div><div class='del'>-	 * should be cleaned up throughout the stack eventually.</div><div class='del'>-	 */</div><div class='del'>-	return 0;</div><div class='add'>+	iomap_read_end(folio, bytes_submitted);</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL_GPL(iomap_readpage);</div><div class='add'>+EXPORT_SYMBOL_GPL(iomap_read_folio);</div><div class='ctx'> </div><div class='del'>-static loff_t iomap_readahead_iter(const struct iomap_iter *iter,</div><div class='del'>-		struct iomap_readpage_ctx *ctx)</div><div class='add'>+static int iomap_readahead_iter(struct iomap_iter *iter,</div><div class='add'>+		struct iomap_read_folio_ctx *ctx, size_t *cur_bytes_submitted)</div><div class='ctx'> {</div><div class='del'>-	loff_t length = iomap_length(iter);</div><div class='del'>-	loff_t done, ret;</div><div class='del'>-</div><div class='del'>-	for (done = 0; done &lt; length; done += ret) {</div><div class='del'>-		if (ctx-&gt;cur_page &amp;&amp; offset_in_page(iter-&gt;pos + done) == 0) {</div><div class='del'>-			if (!ctx-&gt;cur_page_in_bio)</div><div class='del'>-				unlock_page(ctx-&gt;cur_page);</div><div class='del'>-			put_page(ctx-&gt;cur_page);</div><div class='del'>-			ctx-&gt;cur_page = NULL;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	while (iomap_length(iter)) {</div><div class='add'>+		if (ctx-&gt;cur_folio &amp;&amp;</div><div class='add'>+		    offset_in_folio(ctx-&gt;cur_folio, iter-&gt;pos) == 0) {</div><div class='add'>+			iomap_read_end(ctx-&gt;cur_folio, *cur_bytes_submitted);</div><div class='add'>+			ctx-&gt;cur_folio = NULL;</div><div class='ctx'> 		}</div><div class='del'>-		if (!ctx-&gt;cur_page) {</div><div class='del'>-			ctx-&gt;cur_page = readahead_page(ctx-&gt;rac);</div><div class='del'>-			ctx-&gt;cur_page_in_bio = false;</div><div class='add'>+		if (!ctx-&gt;cur_folio) {</div><div class='add'>+			ctx-&gt;cur_folio = readahead_folio(ctx-&gt;rac);</div><div class='add'>+			if (WARN_ON_ONCE(!ctx-&gt;cur_folio))</div><div class='add'>+				return -EINVAL;</div><div class='add'>+			*cur_bytes_submitted = 0;</div><div class='ctx'> 		}</div><div class='del'>-		ret = iomap_readpage_iter(iter, ctx, done);</div><div class='add'>+		ret = iomap_read_folio_iter(iter, ctx, cur_bytes_submitted);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return done;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * iomap_readahead - Attempt to read pages from a file.</div><div class='del'>- * @rac: Describes the pages to be read.</div><div class='ctx'>  * @ops: The operations vector for the filesystem.</div><div class='add'>+ * @ctx: The ctx used for issuing readahead.</div><div class='ctx'>  *</div><div class='ctx'>  * This function is for filesystems to call to implement their readahead</div><div class='ctx'>  * address_space operation.</div><div class='hunk'>@@ -390,123 +619,126 @@ static loff_t iomap_readahead_iter(const struct iomap_iter *iter,</div><div class='ctx'>  * function is called with memalloc_nofs set, so allocations will not cause</div><div class='ctx'>  * the filesystem to be reentered.</div><div class='ctx'>  */</div><div class='del'>-void iomap_readahead(struct readahead_control *rac, const struct iomap_ops *ops)</div><div class='add'>+void iomap_readahead(const struct iomap_ops *ops,</div><div class='add'>+		struct iomap_read_folio_ctx *ctx)</div><div class='ctx'> {</div><div class='add'>+	struct readahead_control *rac = ctx-&gt;rac;</div><div class='ctx'> 	struct iomap_iter iter = {</div><div class='ctx'> 		.inode	= rac-&gt;mapping-&gt;host,</div><div class='ctx'> 		.pos	= readahead_pos(rac),</div><div class='ctx'> 		.len	= readahead_length(rac),</div><div class='ctx'> 	};</div><div class='del'>-	struct iomap_readpage_ctx ctx = {</div><div class='del'>-		.rac	= rac,</div><div class='del'>-	};</div><div class='add'>+	size_t cur_bytes_submitted;</div><div class='ctx'> </div><div class='ctx'> 	trace_iomap_readahead(rac-&gt;mapping-&gt;host, readahead_count(rac));</div><div class='ctx'> </div><div class='ctx'> 	while (iomap_iter(&amp;iter, ops) &gt; 0)</div><div class='del'>-		iter.processed = iomap_readahead_iter(&amp;iter, &amp;ctx);</div><div class='del'>-</div><div class='del'>-	if (ctx.bio)</div><div class='del'>-		submit_bio(ctx.bio);</div><div class='del'>-	if (ctx.cur_page) {</div><div class='del'>-		if (!ctx.cur_page_in_bio)</div><div class='del'>-			unlock_page(ctx.cur_page);</div><div class='del'>-		put_page(ctx.cur_page);</div><div class='del'>-	}</div><div class='add'>+		iter.status = iomap_readahead_iter(&amp;iter, ctx,</div><div class='add'>+					&amp;cur_bytes_submitted);</div><div class='add'>+</div><div class='add'>+	if (ctx-&gt;ops-&gt;submit_read)</div><div class='add'>+		ctx-&gt;ops-&gt;submit_read(ctx);</div><div class='add'>+</div><div class='add'>+	if (ctx-&gt;cur_folio)</div><div class='add'>+		iomap_read_end(ctx-&gt;cur_folio, cur_bytes_submitted);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(iomap_readahead);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * iomap_is_partially_uptodate checks whether blocks within a page are</div><div class='add'>+ * iomap_is_partially_uptodate checks whether blocks within a folio are</div><div class='ctx'>  * uptodate or not.</div><div class='ctx'>  *</div><div class='del'>- * Returns true if all blocks which correspond to a file portion</div><div class='del'>- * we want to read within the page are uptodate.</div><div class='add'>+ * Returns true if all blocks which correspond to the specified part</div><div class='add'>+ * of the folio are uptodate.</div><div class='ctx'>  */</div><div class='del'>-int</div><div class='del'>-iomap_is_partially_uptodate(struct page *page, unsigned long from,</div><div class='del'>-		unsigned long count)</div><div class='add'>+bool iomap_is_partially_uptodate(struct folio *folio, size_t from, size_t count)</div><div class='ctx'> {</div><div class='del'>-	struct iomap_page *iop = to_iomap_page(page);</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-	unsigned len, first, last;</div><div class='del'>-	unsigned i;</div><div class='add'>+	struct iomap_folio_state *ifs = folio-&gt;private;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+	unsigned first, last;</div><div class='ctx'> </div><div class='del'>-	/* Limit range to one page */</div><div class='del'>-	len = min_t(unsigned, PAGE_SIZE - from, count);</div><div class='add'>+	if (!ifs)</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-	/* First and last blocks in range within page */</div><div class='del'>-	first = from &gt;&gt; inode-&gt;i_blkbits;</div><div class='del'>-	last = (from + len - 1) &gt;&gt; inode-&gt;i_blkbits;</div><div class='add'>+	/* Caller's range may extend past the end of this folio */</div><div class='add'>+	count = min(folio_size(folio) - from, count);</div><div class='ctx'> </div><div class='del'>-	if (iop) {</div><div class='del'>-		for (i = first; i &lt;= last; i++)</div><div class='del'>-			if (!test_bit(i, iop-&gt;uptodate))</div><div class='del'>-				return 0;</div><div class='del'>-		return 1;</div><div class='del'>-	}</div><div class='add'>+	/* First and last blocks in range within folio */</div><div class='add'>+	first = from &gt;&gt; inode-&gt;i_blkbits;</div><div class='add'>+	last = (from + count - 1) &gt;&gt; inode-&gt;i_blkbits;</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+	return ifs_next_nonuptodate_block(folio, first, last) &gt; last;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(iomap_is_partially_uptodate);</div><div class='ctx'> </div><div class='del'>-int</div><div class='del'>-iomap_releasepage(struct page *page, gfp_t gfp_mask)</div><div class='add'>+/**</div><div class='add'>+ * iomap_get_folio - get a folio reference for writing</div><div class='add'>+ * @iter: iteration structure</div><div class='add'>+ * @pos: start offset of write</div><div class='add'>+ * @len: Suggested size of folio to create.</div><div class='add'>+ *</div><div class='add'>+ * Returns a locked reference to the folio at @pos, or an error pointer if the</div><div class='add'>+ * folio could not be obtained.</div><div class='add'>+ */</div><div class='add'>+struct folio *iomap_get_folio(struct iomap_iter *iter, loff_t pos, size_t len)</div><div class='ctx'> {</div><div class='del'>-	trace_iomap_releasepage(page-&gt;mapping-&gt;host, page_offset(page),</div><div class='del'>-			PAGE_SIZE);</div><div class='add'>+	fgf_t fgp = FGP_WRITEBEGIN | FGP_NOFS;</div><div class='add'>+</div><div class='add'>+	if (iter-&gt;flags &amp; IOMAP_NOWAIT)</div><div class='add'>+		fgp |= FGP_NOWAIT;</div><div class='add'>+	if (iter-&gt;flags &amp; IOMAP_DONTCACHE)</div><div class='add'>+		fgp |= FGP_DONTCACHE;</div><div class='add'>+	fgp |= fgf_set_order(len);</div><div class='add'>+</div><div class='add'>+	return __filemap_get_folio(iter-&gt;inode-&gt;i_mapping, pos &gt;&gt; PAGE_SHIFT,</div><div class='add'>+			fgp, mapping_gfp_mask(iter-&gt;inode-&gt;i_mapping));</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(iomap_get_folio);</div><div class='add'>+</div><div class='add'>+bool iomap_release_folio(struct folio *folio, gfp_t gfp_flags)</div><div class='add'>+{</div><div class='add'>+	trace_iomap_release_folio(folio-&gt;mapping-&gt;host, folio_pos(folio),</div><div class='add'>+			folio_size(folio));</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * mm accommodates an old ext3 case where clean pages might not have had</div><div class='del'>-	 * the dirty bit cleared. Thus, it can send actual dirty pages to</div><div class='del'>-	 * -&gt;releasepage() via shrink_active_list(); skip those here.</div><div class='add'>+	 * If the folio is dirty, we refuse to release our metadata because</div><div class='add'>+	 * it may be partially dirty.  Once we track per-block dirty state,</div><div class='add'>+	 * we can release the metadata if every block is dirty.</div><div class='ctx'> 	 */</div><div class='del'>-	if (PageDirty(page) || PageWriteback(page))</div><div class='del'>-		return 0;</div><div class='del'>-	iomap_page_release(page);</div><div class='del'>-	return 1;</div><div class='add'>+	if (folio_test_dirty(folio))</div><div class='add'>+		return false;</div><div class='add'>+	ifs_free(folio);</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL_GPL(iomap_releasepage);</div><div class='add'>+EXPORT_SYMBOL_GPL(iomap_release_folio);</div><div class='ctx'> </div><div class='del'>-void</div><div class='del'>-iomap_invalidatepage(struct page *page, unsigned int offset, unsigned int len)</div><div class='add'>+void iomap_invalidate_folio(struct folio *folio, size_t offset, size_t len)</div><div class='ctx'> {</div><div class='del'>-	trace_iomap_invalidatepage(page-&gt;mapping-&gt;host, offset, len);</div><div class='add'>+	trace_iomap_invalidate_folio(folio-&gt;mapping-&gt;host,</div><div class='add'>+					folio_pos(folio) + offset, len);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * If we're invalidating the entire page, clear the dirty state from it</div><div class='del'>-	 * and release it to avoid unnecessary buildup of the LRU.</div><div class='add'>+	 * If we're invalidating the entire folio, clear the dirty state</div><div class='add'>+	 * from it and release it to avoid unnecessary buildup of the LRU.</div><div class='ctx'> 	 */</div><div class='del'>-	if (offset == 0 &amp;&amp; len == PAGE_SIZE) {</div><div class='del'>-		WARN_ON_ONCE(PageWriteback(page));</div><div class='del'>-		cancel_dirty_page(page);</div><div class='del'>-		iomap_page_release(page);</div><div class='add'>+	if (offset == 0 &amp;&amp; len == folio_size(folio)) {</div><div class='add'>+		WARN_ON_ONCE(folio_test_writeback(folio));</div><div class='add'>+		folio_cancel_dirty(folio);</div><div class='add'>+		ifs_free(folio);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL_GPL(iomap_invalidatepage);</div><div class='add'>+EXPORT_SYMBOL_GPL(iomap_invalidate_folio);</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_MIGRATION</div><div class='del'>-int</div><div class='del'>-iomap_migrate_page(struct address_space *mapping, struct page *newpage,</div><div class='del'>-		struct page *page, enum migrate_mode mode)</div><div class='add'>+bool iomap_dirty_folio(struct address_space *mapping, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ret = migrate_page_move_mapping(mapping, newpage, page, 0);</div><div class='del'>-	if (ret != MIGRATEPAGE_SUCCESS)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	if (page_has_private(page))</div><div class='del'>-		attach_page_private(newpage, detach_page_private(page));</div><div class='add'>+	struct inode *inode = mapping-&gt;host;</div><div class='add'>+	size_t len = folio_size(folio);</div><div class='ctx'> </div><div class='del'>-	if (mode != MIGRATE_SYNC_NO_COPY)</div><div class='del'>-		migrate_page_copy(newpage, page);</div><div class='del'>-	else</div><div class='del'>-		migrate_page_states(newpage, page);</div><div class='del'>-	return MIGRATEPAGE_SUCCESS;</div><div class='add'>+	ifs_alloc(inode, folio, 0);</div><div class='add'>+	iomap_set_range_dirty(folio, 0, len);</div><div class='add'>+	return filemap_dirty_folio(mapping, folio);</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL_GPL(iomap_migrate_page);</div><div class='del'>-#endif /* CONFIG_MIGRATION */</div><div class='add'>+EXPORT_SYMBOL_GPL(iomap_dirty_folio);</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='ctx'> iomap_write_failed(struct inode *inode, loff_t pos, unsigned len)</div><div class='hunk'>@@ -518,428 +750,875 @@ iomap_write_failed(struct inode *inode, loff_t pos, unsigned len)</div><div class='ctx'> 	 * write started inside the existing inode size.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (pos + len &gt; i_size)</div><div class='del'>-		truncate_pagecache_range(inode, max(pos, i_size), pos + len);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-iomap_read_page_sync(loff_t block_start, struct page *page, unsigned poff,</div><div class='del'>-		unsigned plen, const struct iomap *iomap)</div><div class='del'>-{</div><div class='del'>-	struct bio_vec bvec;</div><div class='del'>-	struct bio bio;</div><div class='del'>-</div><div class='del'>-	bio_init(&amp;bio, &amp;bvec, 1);</div><div class='del'>-	bio.bi_opf = REQ_OP_READ;</div><div class='del'>-	bio.bi_iter.bi_sector = iomap_sector(iomap, block_start);</div><div class='del'>-	bio_set_dev(&amp;bio, iomap-&gt;bdev);</div><div class='del'>-	__bio_add_page(&amp;bio, page, plen, poff);</div><div class='del'>-	return submit_bio_wait(&amp;bio);</div><div class='add'>+		truncate_pagecache_range(inode, max(pos, i_size),</div><div class='add'>+					 pos + len - 1);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __iomap_write_begin(const struct iomap_iter *iter, loff_t pos,</div><div class='del'>-		unsigned len, struct page *page)</div><div class='add'>+static int __iomap_write_begin(const struct iomap_iter *iter,</div><div class='add'>+		const struct iomap_write_ops *write_ops, size_t len,</div><div class='add'>+		struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	const struct iomap *srcmap = iomap_iter_srcmap(iter);</div><div class='del'>-	struct iomap_page *iop = iomap_page_create(iter-&gt;inode, page);</div><div class='add'>+	struct iomap_folio_state *ifs;</div><div class='add'>+	loff_t pos = iter-&gt;pos;</div><div class='ctx'> 	loff_t block_size = i_blocksize(iter-&gt;inode);</div><div class='ctx'> 	loff_t block_start = round_down(pos, block_size);</div><div class='ctx'> 	loff_t block_end = round_up(pos + len, block_size);</div><div class='del'>-	unsigned from = offset_in_page(pos), to = from + len, poff, plen;</div><div class='add'>+	unsigned int nr_blocks = i_blocks_per_folio(iter-&gt;inode, folio);</div><div class='add'>+	size_t from = offset_in_folio(folio, pos), to = from + len;</div><div class='add'>+	size_t poff, plen;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If the write or zeroing completely overlaps the current folio, then</div><div class='add'>+	 * entire folio will be dirtied so there is no need for</div><div class='add'>+	 * per-block state tracking structures to be attached to this folio.</div><div class='add'>+	 * For the unshare case, we must read in the ondisk contents because we</div><div class='add'>+	 * are not changing pagecache contents.</div><div class='add'>+	 */</div><div class='add'>+	if (!(iter-&gt;flags &amp; IOMAP_UNSHARE) &amp;&amp; pos &lt;= folio_pos(folio) &amp;&amp;</div><div class='add'>+	    pos + len &gt;= folio_next_pos(folio))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	ifs = ifs_alloc(iter-&gt;inode, folio, iter-&gt;flags);</div><div class='add'>+	if ((iter-&gt;flags &amp; IOMAP_NOWAIT) &amp;&amp; !ifs &amp;&amp; nr_blocks &gt; 1)</div><div class='add'>+		return -EAGAIN;</div><div class='ctx'> </div><div class='del'>-	if (PageUptodate(page))</div><div class='add'>+	if (folio_test_uptodate(folio))</div><div class='ctx'> 		return 0;</div><div class='del'>-	ClearPageError(page);</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='del'>-		iomap_adjust_read_range(iter-&gt;inode, iop, &amp;block_start,</div><div class='add'>+		iomap_adjust_read_range(iter-&gt;inode, folio, &amp;block_start,</div><div class='ctx'> 				block_end - block_start, &amp;poff, &amp;plen);</div><div class='ctx'> 		if (plen == 0)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		if (!(iter-&gt;flags &amp; IOMAP_UNSHARE) &amp;&amp;</div><div class='del'>-		    (from &lt;= poff || from &gt;= poff + plen) &amp;&amp;</div><div class='del'>-		    (to &lt;= poff || to &gt;= poff + plen))</div><div class='add'>+		/*</div><div class='add'>+		 * If the read range will be entirely overwritten by the write,</div><div class='add'>+		 * we can skip having to zero/read it in.</div><div class='add'>+		 */</div><div class='add'>+		if (!(iter-&gt;flags &amp; IOMAP_UNSHARE) &amp;&amp; from &lt;= poff &amp;&amp;</div><div class='add'>+		    to &gt;= poff + plen)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		if (iomap_block_needs_zeroing(iter, block_start)) {</div><div class='ctx'> 			if (WARN_ON_ONCE(iter-&gt;flags &amp; IOMAP_UNSHARE))</div><div class='ctx'> 				return -EIO;</div><div class='del'>-			zero_user_segments(page, poff, from, to, poff + plen);</div><div class='add'>+			folio_zero_segments(folio, poff, from, to, poff + plen);</div><div class='ctx'> 		} else {</div><div class='del'>-			int status = iomap_read_page_sync(block_start, page,</div><div class='del'>-					poff, plen, srcmap);</div><div class='add'>+			int status;</div><div class='add'>+</div><div class='add'>+			if (iter-&gt;flags &amp; IOMAP_NOWAIT)</div><div class='add'>+				return -EAGAIN;</div><div class='add'>+</div><div class='add'>+			if (write_ops &amp;&amp; write_ops-&gt;read_folio_range)</div><div class='add'>+				status = write_ops-&gt;read_folio_range(iter,</div><div class='add'>+						folio, block_start, plen);</div><div class='add'>+			else</div><div class='add'>+				status = iomap_bio_read_folio_range_sync(iter,</div><div class='add'>+						folio, block_start, plen);</div><div class='ctx'> 			if (status)</div><div class='ctx'> 				return status;</div><div class='ctx'> 		}</div><div class='del'>-		iomap_set_range_uptodate(page, poff, plen);</div><div class='add'>+		iomap_set_range_uptodate(folio, poff, plen);</div><div class='ctx'> 	} while ((block_start += plen) &lt; block_end);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int iomap_write_begin_inline(const struct iomap_iter *iter,</div><div class='del'>-		struct page *page)</div><div class='add'>+static struct folio *__iomap_get_folio(struct iomap_iter *iter,</div><div class='add'>+		const struct iomap_write_ops *write_ops, size_t len)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='add'>+	loff_t pos = iter-&gt;pos;</div><div class='add'>+</div><div class='add'>+	if (!mapping_large_folio_support(iter-&gt;inode-&gt;i_mapping))</div><div class='add'>+		len = min_t(size_t, len, PAGE_SIZE - offset_in_page(pos));</div><div class='add'>+</div><div class='add'>+	if (iter-&gt;fbatch) {</div><div class='add'>+		struct folio *folio = folio_batch_next(iter-&gt;fbatch);</div><div class='add'>+</div><div class='add'>+		if (!folio)</div><div class='add'>+			return NULL;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * The folio mapping generally shouldn't have changed based on</div><div class='add'>+		 * fs locks, but be consistent with filemap lookup and retry</div><div class='add'>+		 * the iter if it does.</div><div class='add'>+		 */</div><div class='add'>+		folio_lock(folio);</div><div class='add'>+		if (unlikely(folio-&gt;mapping != iter-&gt;inode-&gt;i_mapping)) {</div><div class='add'>+			iter-&gt;iomap.flags |= IOMAP_F_STALE;</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+			return NULL;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		folio_get(folio);</div><div class='add'>+		return folio;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (write_ops &amp;&amp; write_ops-&gt;get_folio)</div><div class='add'>+		return write_ops-&gt;get_folio(iter, pos, len);</div><div class='add'>+	return iomap_get_folio(iter, pos, len);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void __iomap_put_folio(struct iomap_iter *iter,</div><div class='add'>+		const struct iomap_write_ops *write_ops, size_t ret,</div><div class='add'>+		struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	loff_t pos = iter-&gt;pos;</div><div class='add'>+</div><div class='add'>+	if (write_ops &amp;&amp; write_ops-&gt;put_folio) {</div><div class='add'>+		write_ops-&gt;put_folio(iter-&gt;inode, pos, ret, folio);</div><div class='add'>+	} else {</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* trim pos and bytes to within a given folio */</div><div class='add'>+static loff_t iomap_trim_folio_range(struct iomap_iter *iter,</div><div class='add'>+		struct folio *folio, size_t *offset, u64 *bytes)</div><div class='add'>+{</div><div class='add'>+	loff_t pos = iter-&gt;pos;</div><div class='add'>+	size_t fsize = folio_size(folio);</div><div class='add'>+</div><div class='add'>+	WARN_ON_ONCE(pos &lt; folio_pos(folio));</div><div class='add'>+	WARN_ON_ONCE(pos &gt;= folio_pos(folio) + fsize);</div><div class='add'>+</div><div class='add'>+	*offset = offset_in_folio(folio, pos);</div><div class='add'>+	*bytes = min(*bytes, fsize - *offset);</div><div class='ctx'> </div><div class='add'>+	return pos;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int iomap_write_begin_inline(const struct iomap_iter *iter,</div><div class='add'>+		struct folio *folio)</div><div class='add'>+{</div><div class='ctx'> 	/* needs more work for the tailpacking case; disable for now */</div><div class='ctx'> 	if (WARN_ON_ONCE(iomap_iter_srcmap(iter)-&gt;offset != 0))</div><div class='ctx'> 		return -EIO;</div><div class='del'>-	ret = iomap_read_inline_data(iter, page);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		return ret;</div><div class='del'>-	return 0;</div><div class='add'>+	return iomap_read_inline_data(iter, folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int iomap_write_begin(const struct iomap_iter *iter, loff_t pos,</div><div class='del'>-		unsigned len, struct page **pagep)</div><div class='add'>+/*</div><div class='add'>+ * Grab and prepare a folio for write based on iter state. Returns the folio,</div><div class='add'>+ * offset, and length. Callers can optionally pass a max length *plen,</div><div class='add'>+ * otherwise init to zero.</div><div class='add'>+ */</div><div class='add'>+static int iomap_write_begin(struct iomap_iter *iter,</div><div class='add'>+		const struct iomap_write_ops *write_ops, struct folio **foliop,</div><div class='add'>+		size_t *poffset, u64 *plen)</div><div class='ctx'> {</div><div class='del'>-	const struct iomap_page_ops *page_ops = iter-&gt;iomap.page_ops;</div><div class='ctx'> 	const struct iomap *srcmap = iomap_iter_srcmap(iter);</div><div class='del'>-	struct page *page;</div><div class='add'>+	loff_t pos;</div><div class='add'>+	u64 len = min_t(u64, SIZE_MAX, iomap_length(iter));</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	int status = 0;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(pos + len &gt; iter-&gt;iomap.offset + iter-&gt;iomap.length);</div><div class='del'>-	if (srcmap != &amp;iter-&gt;iomap)</div><div class='del'>-		BUG_ON(pos + len &gt; srcmap-&gt;offset + srcmap-&gt;length);</div><div class='add'>+	len = min_not_zero(len, *plen);</div><div class='add'>+	*foliop = NULL;</div><div class='add'>+	*plen = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (fatal_signal_pending(current))</div><div class='ctx'> 		return -EINTR;</div><div class='ctx'> </div><div class='del'>-	if (page_ops &amp;&amp; page_ops-&gt;page_prepare) {</div><div class='del'>-		status = page_ops-&gt;page_prepare(iter-&gt;inode, pos, len);</div><div class='del'>-		if (status)</div><div class='del'>-			return status;</div><div class='add'>+	folio = __iomap_get_folio(iter, write_ops, len);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * No folio means we're done with a batch. We still have range to</div><div class='add'>+	 * process so return and let the caller iterate and refill the batch.</div><div class='add'>+	 */</div><div class='add'>+	if (!folio) {</div><div class='add'>+		WARN_ON_ONCE(!iter-&gt;fbatch);</div><div class='add'>+		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	page = grab_cache_page_write_begin(iter-&gt;inode-&gt;i_mapping,</div><div class='del'>-				pos &gt;&gt; PAGE_SHIFT, AOP_FLAG_NOFS);</div><div class='del'>-	if (!page) {</div><div class='del'>-		status = -ENOMEM;</div><div class='del'>-		goto out_no_page;</div><div class='add'>+	/*</div><div class='add'>+	 * Now we have a locked folio, before we do anything with it we need to</div><div class='add'>+	 * check that the iomap we have cached is not stale. The inode extent</div><div class='add'>+	 * mapping can change due to concurrent IO in flight (e.g.</div><div class='add'>+	 * IOMAP_UNWRITTEN state can change and memory reclaim could have</div><div class='add'>+	 * reclaimed a previously partially written page at this index after IO</div><div class='add'>+	 * completion before this write reaches this file offset) and hence we</div><div class='add'>+	 * could do the wrong thing here (zero a page range incorrectly or fail</div><div class='add'>+	 * to zero) and corrupt data.</div><div class='add'>+	 */</div><div class='add'>+	if (write_ops &amp;&amp; write_ops-&gt;iomap_valid) {</div><div class='add'>+		bool iomap_valid = write_ops-&gt;iomap_valid(iter-&gt;inode,</div><div class='add'>+							 &amp;iter-&gt;iomap);</div><div class='add'>+		if (!iomap_valid) {</div><div class='add'>+			iter-&gt;iomap.flags |= IOMAP_F_STALE;</div><div class='add'>+			status = 0;</div><div class='add'>+			goto out_unlock;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * The folios in a batch may not be contiguous. If we've skipped</div><div class='add'>+	 * forward, advance the iter to the pos of the current folio. If the</div><div class='add'>+	 * folio starts beyond the end of the mapping, it may have been trimmed</div><div class='add'>+	 * since the lookup for whatever reason. Return a NULL folio to</div><div class='add'>+	 * terminate the op.</div><div class='add'>+	 */</div><div class='add'>+	if (folio_pos(folio) &gt; iter-&gt;pos) {</div><div class='add'>+		len = min_t(u64, folio_pos(folio) - iter-&gt;pos,</div><div class='add'>+				 iomap_length(iter));</div><div class='add'>+		status = iomap_iter_advance(iter, len);</div><div class='add'>+		len = iomap_length(iter);</div><div class='add'>+		if (status || !len)</div><div class='add'>+			goto out_unlock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	pos = iomap_trim_folio_range(iter, folio, poffset, &amp;len);</div><div class='add'>+</div><div class='ctx'> 	if (srcmap-&gt;type == IOMAP_INLINE)</div><div class='del'>-		status = iomap_write_begin_inline(iter, page);</div><div class='add'>+		status = iomap_write_begin_inline(iter, folio);</div><div class='ctx'> 	else if (srcmap-&gt;flags &amp; IOMAP_F_BUFFER_HEAD)</div><div class='del'>-		status = __block_write_begin_int(page, pos, len, NULL, srcmap);</div><div class='add'>+		status = __block_write_begin_int(folio, pos, len, NULL, srcmap);</div><div class='ctx'> 	else</div><div class='del'>-		status = __iomap_write_begin(iter, pos, len, page);</div><div class='add'>+		status = __iomap_write_begin(iter, write_ops, len, folio);</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(status))</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='del'>-	*pagep = page;</div><div class='add'>+	*foliop = folio;</div><div class='add'>+	*plen = len;</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> out_unlock:</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='del'>-	iomap_write_failed(iter-&gt;inode, pos, len);</div><div class='del'>-</div><div class='del'>-out_no_page:</div><div class='del'>-	if (page_ops &amp;&amp; page_ops-&gt;page_done)</div><div class='del'>-		page_ops-&gt;page_done(iter-&gt;inode, pos, 0, NULL);</div><div class='add'>+	__iomap_put_folio(iter, write_ops, 0, folio);</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static size_t __iomap_write_end(struct inode *inode, loff_t pos, size_t len,</div><div class='del'>-		size_t copied, struct page *page)</div><div class='add'>+static bool __iomap_write_end(struct inode *inode, loff_t pos, size_t len,</div><div class='add'>+		size_t copied, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	flush_dcache_page(page);</div><div class='add'>+	flush_dcache_folio(folio);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The blocks that were entirely written will now be uptodate, so we</div><div class='del'>-	 * don't have to worry about a readpage reading them and overwriting a</div><div class='add'>+	 * don't have to worry about a read_folio reading them and overwriting a</div><div class='ctx'> 	 * partial write.  However, if we've encountered a short write and only</div><div class='ctx'> 	 * partially written into a block, it will not be marked uptodate, so a</div><div class='del'>-	 * readpage might come in and destroy our partial write.</div><div class='add'>+	 * read_folio might come in and destroy our partial write.</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * Do the simplest thing and just treat any short write to a</div><div class='ctx'> 	 * non-uptodate page as a zero-length write, and force the caller to</div><div class='ctx'> 	 * redo the whole thing.</div><div class='ctx'> 	 */</div><div class='del'>-	if (unlikely(copied &lt; len &amp;&amp; !PageUptodate(page)))</div><div class='del'>-		return 0;</div><div class='del'>-	iomap_set_range_uptodate(page, offset_in_page(pos), len);</div><div class='del'>-	__set_page_dirty_nobuffers(page);</div><div class='del'>-	return copied;</div><div class='add'>+	if (unlikely(copied &lt; len &amp;&amp; !folio_test_uptodate(folio)))</div><div class='add'>+		return false;</div><div class='add'>+	iomap_set_range_uptodate(folio, offset_in_folio(folio, pos), len);</div><div class='add'>+	iomap_set_range_dirty(folio, offset_in_folio(folio, pos), copied);</div><div class='add'>+	filemap_dirty_folio(inode-&gt;i_mapping, folio);</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static size_t iomap_write_end_inline(const struct iomap_iter *iter,</div><div class='del'>-		struct page *page, loff_t pos, size_t copied)</div><div class='add'>+static bool iomap_write_end_inline(const struct iomap_iter *iter,</div><div class='add'>+		struct folio *folio, loff_t pos, size_t copied)</div><div class='ctx'> {</div><div class='ctx'> 	const struct iomap *iomap = &amp;iter-&gt;iomap;</div><div class='ctx'> 	void *addr;</div><div class='ctx'> </div><div class='del'>-	WARN_ON_ONCE(!PageUptodate(page));</div><div class='add'>+	WARN_ON_ONCE(!folio_test_uptodate(folio));</div><div class='ctx'> 	BUG_ON(!iomap_inline_data_valid(iomap));</div><div class='ctx'> </div><div class='del'>-	flush_dcache_page(page);</div><div class='del'>-	addr = kmap_local_page(page) + pos;</div><div class='add'>+	if (WARN_ON_ONCE(!iomap-&gt;inline_data))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	flush_dcache_folio(folio);</div><div class='add'>+	addr = kmap_local_folio(folio, pos);</div><div class='ctx'> 	memcpy(iomap_inline_data(iomap, pos), addr, copied);</div><div class='ctx'> 	kunmap_local(addr);</div><div class='ctx'> </div><div class='ctx'> 	mark_inode_dirty(iter-&gt;inode);</div><div class='del'>-	return copied;</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Returns the number of bytes copied.  May be 0.  Cannot be an errno. */</div><div class='del'>-static size_t iomap_write_end(struct iomap_iter *iter, loff_t pos, size_t len,</div><div class='del'>-		size_t copied, struct page *page)</div><div class='add'>+/*</div><div class='add'>+ * Returns true if all copied bytes have been written to the pagecache,</div><div class='add'>+ * otherwise return false.</div><div class='add'>+ */</div><div class='add'>+static bool iomap_write_end(struct iomap_iter *iter, size_t len, size_t copied,</div><div class='add'>+		struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	const struct iomap_page_ops *page_ops = iter-&gt;iomap.page_ops;</div><div class='ctx'> 	const struct iomap *srcmap = iomap_iter_srcmap(iter);</div><div class='del'>-	loff_t old_size = iter-&gt;inode-&gt;i_size;</div><div class='del'>-	size_t ret;</div><div class='del'>-</div><div class='del'>-	if (srcmap-&gt;type == IOMAP_INLINE) {</div><div class='del'>-		ret = iomap_write_end_inline(iter, page, pos, copied);</div><div class='del'>-	} else if (srcmap-&gt;flags &amp; IOMAP_F_BUFFER_HEAD) {</div><div class='del'>-		ret = block_write_end(NULL, iter-&gt;inode-&gt;i_mapping, pos, len,</div><div class='del'>-				copied, page, NULL);</div><div class='del'>-	} else {</div><div class='del'>-		ret = __iomap_write_end(iter-&gt;inode, pos, len, copied, page);</div><div class='del'>-	}</div><div class='add'>+	loff_t pos = iter-&gt;pos;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Update the in-memory inode size after copying the data into the page</div><div class='del'>-	 * cache.  It's up to the file system to write the updated size to disk,</div><div class='del'>-	 * preferably after I/O completion so that no stale data is exposed.</div><div class='del'>-	 */</div><div class='del'>-	if (pos + ret &gt; old_size) {</div><div class='del'>-		i_size_write(iter-&gt;inode, pos + ret);</div><div class='del'>-		iter-&gt;iomap.flags |= IOMAP_F_SIZE_CHANGED;</div><div class='del'>-	}</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	if (srcmap-&gt;type == IOMAP_INLINE)</div><div class='add'>+		return iomap_write_end_inline(iter, folio, pos, copied);</div><div class='ctx'> </div><div class='del'>-	if (old_size &lt; pos)</div><div class='del'>-		pagecache_isize_extended(iter-&gt;inode, old_size, pos);</div><div class='del'>-	if (page_ops &amp;&amp; page_ops-&gt;page_done)</div><div class='del'>-		page_ops-&gt;page_done(iter-&gt;inode, pos, ret, page);</div><div class='del'>-	put_page(page);</div><div class='add'>+	if (srcmap-&gt;flags &amp; IOMAP_F_BUFFER_HEAD) {</div><div class='add'>+		size_t bh_written;</div><div class='ctx'> </div><div class='del'>-	if (ret &lt; len)</div><div class='del'>-		iomap_write_failed(iter-&gt;inode, pos, len);</div><div class='del'>-	return ret;</div><div class='add'>+		bh_written = block_write_end(pos, len, copied, folio);</div><div class='add'>+		WARN_ON_ONCE(bh_written != copied &amp;&amp; bh_written != 0);</div><div class='add'>+		return bh_written == copied;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return __iomap_write_end(iter-&gt;inode, pos, len, copied, folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static loff_t iomap_write_iter(struct iomap_iter *iter, struct iov_iter *i)</div><div class='add'>+static int iomap_write_iter(struct iomap_iter *iter, struct iov_iter *i,</div><div class='add'>+		const struct iomap_write_ops *write_ops)</div><div class='ctx'> {</div><div class='del'>-	loff_t length = iomap_length(iter);</div><div class='del'>-	loff_t pos = iter-&gt;pos;</div><div class='del'>-	ssize_t written = 0;</div><div class='del'>-	long status = 0;</div><div class='add'>+	ssize_t total_written = 0;</div><div class='add'>+	int status = 0;</div><div class='add'>+	struct address_space *mapping = iter-&gt;inode-&gt;i_mapping;</div><div class='add'>+	size_t chunk = mapping_max_folio_size(mapping);</div><div class='add'>+	unsigned int bdp_flags = (iter-&gt;flags &amp; IOMAP_NOWAIT) ? BDP_ASYNC : 0;</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='del'>-		struct page *page;</div><div class='del'>-		unsigned long offset;	/* Offset into pagecache page */</div><div class='del'>-		unsigned long bytes;	/* Bytes to write to page */</div><div class='add'>+		struct folio *folio;</div><div class='add'>+		loff_t old_size;</div><div class='add'>+		size_t offset;		/* Offset into folio */</div><div class='add'>+		u64 bytes;		/* Bytes to write to folio */</div><div class='ctx'> 		size_t copied;		/* Bytes copied from user */</div><div class='add'>+		u64 written;		/* Bytes have been written */</div><div class='add'>+		loff_t pos;</div><div class='add'>+</div><div class='add'>+		bytes = iov_iter_count(i);</div><div class='add'>+retry:</div><div class='add'>+		offset = iter-&gt;pos &amp; (chunk - 1);</div><div class='add'>+		bytes = min(chunk - offset, bytes);</div><div class='add'>+		status = balance_dirty_pages_ratelimited_flags(mapping,</div><div class='add'>+							       bdp_flags);</div><div class='add'>+		if (unlikely(status))</div><div class='add'>+			break;</div><div class='ctx'> </div><div class='del'>-		offset = offset_in_page(pos);</div><div class='del'>-		bytes = min_t(unsigned long, PAGE_SIZE - offset,</div><div class='del'>-						iov_iter_count(i));</div><div class='del'>-again:</div><div class='del'>-		if (bytes &gt; length)</div><div class='del'>-			bytes = length;</div><div class='add'>+		if (bytes &gt; iomap_length(iter))</div><div class='add'>+			bytes = iomap_length(iter);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Bring in the user page that we'll copy from _first_.</div><div class='ctx'> 		 * Otherwise there's a nasty deadlock on copying from the</div><div class='ctx'> 		 * same page as we're writing to, without it being marked</div><div class='ctx'> 		 * up-to-date.</div><div class='add'>+		 *</div><div class='add'>+		 * For async buffered writes the assumption is that the user</div><div class='add'>+		 * page has already been faulted in. This can be optimized by</div><div class='add'>+		 * faulting the user page.</div><div class='ctx'> 		 */</div><div class='del'>-		if (unlikely(fault_in_iov_iter_readable(i, bytes))) {</div><div class='add'>+		if (unlikely(fault_in_iov_iter_readable(i, bytes) == bytes)) {</div><div class='ctx'> 			status = -EFAULT;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		status = iomap_write_begin(iter, pos, bytes, &amp;page);</div><div class='del'>-		if (unlikely(status))</div><div class='add'>+		status = iomap_write_begin(iter, write_ops, &amp;folio, &amp;offset,</div><div class='add'>+				&amp;bytes);</div><div class='add'>+		if (unlikely(status)) {</div><div class='add'>+			iomap_write_failed(iter-&gt;inode, iter-&gt;pos, bytes);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		if (iter-&gt;iomap.flags &amp; IOMAP_F_STALE)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		if (mapping_writably_mapped(iter-&gt;inode-&gt;i_mapping))</div><div class='del'>-			flush_dcache_page(page);</div><div class='add'>+		pos = iter-&gt;pos;</div><div class='ctx'> </div><div class='del'>-		copied = copy_page_from_iter_atomic(page, offset, bytes, i);</div><div class='add'>+		if (mapping_writably_mapped(mapping))</div><div class='add'>+			flush_dcache_folio(folio);</div><div class='ctx'> </div><div class='del'>-		status = iomap_write_end(iter, pos, bytes, copied, page);</div><div class='add'>+		copied = copy_folio_from_iter_atomic(folio, offset, bytes, i);</div><div class='add'>+		written = iomap_write_end(iter, bytes, copied, folio) ?</div><div class='add'>+			  copied : 0;</div><div class='ctx'> </div><div class='del'>-		if (unlikely(copied != status))</div><div class='del'>-			iov_iter_revert(i, copied - status);</div><div class='add'>+		/*</div><div class='add'>+		 * Update the in-memory inode size after copying the data into</div><div class='add'>+		 * the page cache.  It's up to the file system to write the</div><div class='add'>+		 * updated size to disk, preferably after I/O completion so that</div><div class='add'>+		 * no stale data is exposed.  Only once that's done can we</div><div class='add'>+		 * unlock and release the folio.</div><div class='add'>+		 */</div><div class='add'>+		old_size = iter-&gt;inode-&gt;i_size;</div><div class='add'>+		if (pos + written &gt; old_size) {</div><div class='add'>+			i_size_write(iter-&gt;inode, pos + written);</div><div class='add'>+			iter-&gt;iomap.flags |= IOMAP_F_SIZE_CHANGED;</div><div class='add'>+		}</div><div class='add'>+		__iomap_put_folio(iter, write_ops, written, folio);</div><div class='add'>+</div><div class='add'>+		if (old_size &lt; pos)</div><div class='add'>+			pagecache_isize_extended(iter-&gt;inode, old_size, pos);</div><div class='ctx'> </div><div class='ctx'> 		cond_resched();</div><div class='del'>-		if (unlikely(status == 0)) {</div><div class='add'>+		if (unlikely(written == 0)) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * A short copy made iomap_write_end() reject the</div><div class='ctx'> 			 * thing entirely.  Might be memory poisoning</div><div class='ctx'> 			 * halfway through, might be a race with munmap,</div><div class='ctx'> 			 * might be severe memory pressure.</div><div class='ctx'> 			 */</div><div class='del'>-			if (copied)</div><div class='add'>+			iomap_write_failed(iter-&gt;inode, pos, bytes);</div><div class='add'>+			iov_iter_revert(i, copied);</div><div class='add'>+</div><div class='add'>+			if (chunk &gt; PAGE_SIZE)</div><div class='add'>+				chunk /= 2;</div><div class='add'>+			if (copied) {</div><div class='ctx'> 				bytes = copied;</div><div class='del'>-			goto again;</div><div class='add'>+				goto retry;</div><div class='add'>+			}</div><div class='add'>+		} else {</div><div class='add'>+			total_written += written;</div><div class='add'>+			iomap_iter_advance(iter, written);</div><div class='ctx'> 		}</div><div class='del'>-		pos += status;</div><div class='del'>-		written += status;</div><div class='del'>-		length -= status;</div><div class='add'>+	} while (iov_iter_count(i) &amp;&amp; iomap_length(iter));</div><div class='ctx'> </div><div class='del'>-		balance_dirty_pages_ratelimited(iter-&gt;inode-&gt;i_mapping);</div><div class='del'>-	} while (iov_iter_count(i) &amp;&amp; length);</div><div class='del'>-</div><div class='del'>-	return written ? written : status;</div><div class='add'>+	return total_written ? 0 : status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> ssize_t</div><div class='ctx'> iomap_file_buffered_write(struct kiocb *iocb, struct iov_iter *i,</div><div class='del'>-		const struct iomap_ops *ops)</div><div class='add'>+		const struct iomap_ops *ops,</div><div class='add'>+		const struct iomap_write_ops *write_ops, void *private)</div><div class='ctx'> {</div><div class='ctx'> 	struct iomap_iter iter = {</div><div class='ctx'> 		.inode		= iocb-&gt;ki_filp-&gt;f_mapping-&gt;host,</div><div class='ctx'> 		.pos		= iocb-&gt;ki_pos,</div><div class='ctx'> 		.len		= iov_iter_count(i),</div><div class='ctx'> 		.flags		= IOMAP_WRITE,</div><div class='add'>+		.private	= private,</div><div class='ctx'> 	};</div><div class='del'>-	int ret;</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	if (iocb-&gt;ki_flags &amp; IOCB_NOWAIT)</div><div class='add'>+		iter.flags |= IOMAP_NOWAIT;</div><div class='add'>+	if (iocb-&gt;ki_flags &amp; IOCB_DONTCACHE)</div><div class='add'>+		iter.flags |= IOMAP_DONTCACHE;</div><div class='ctx'> </div><div class='ctx'> 	while ((ret = iomap_iter(&amp;iter, ops)) &gt; 0)</div><div class='del'>-		iter.processed = iomap_write_iter(&amp;iter, i);</div><div class='del'>-	if (iter.pos == iocb-&gt;ki_pos)</div><div class='add'>+		iter.status = iomap_write_iter(&amp;iter, i, write_ops);</div><div class='add'>+</div><div class='add'>+	if (unlikely(iter.pos == iocb-&gt;ki_pos))</div><div class='ctx'> 		return ret;</div><div class='del'>-	return iter.pos - iocb-&gt;ki_pos;</div><div class='add'>+	ret = iter.pos - iocb-&gt;ki_pos;</div><div class='add'>+	iocb-&gt;ki_pos = iter.pos;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(iomap_file_buffered_write);</div><div class='ctx'> </div><div class='del'>-static loff_t iomap_unshare_iter(struct iomap_iter *iter)</div><div class='add'>+static void iomap_write_delalloc_ifs_punch(struct inode *inode,</div><div class='add'>+		struct folio *folio, loff_t start_byte, loff_t end_byte,</div><div class='add'>+		struct iomap *iomap, iomap_punch_t punch)</div><div class='add'>+{</div><div class='add'>+	unsigned int first_blk, last_blk;</div><div class='add'>+	loff_t last_byte;</div><div class='add'>+	u8 blkbits = inode-&gt;i_blkbits;</div><div class='add'>+	struct iomap_folio_state *ifs;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * When we have per-block dirty tracking, there can be</div><div class='add'>+	 * blocks within a folio which are marked uptodate</div><div class='add'>+	 * but not dirty. In that case it is necessary to punch</div><div class='add'>+	 * out such blocks to avoid leaking any delalloc blocks.</div><div class='add'>+	 */</div><div class='add'>+	ifs = folio-&gt;private;</div><div class='add'>+	if (!ifs)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	last_byte = min_t(loff_t, end_byte - 1, folio_next_pos(folio) - 1);</div><div class='add'>+	first_blk = offset_in_folio(folio, start_byte) &gt;&gt; blkbits;</div><div class='add'>+	last_blk = offset_in_folio(folio, last_byte) &gt;&gt; blkbits;</div><div class='add'>+	while ((first_blk = ifs_next_clean_block(folio, first_blk, last_blk))</div><div class='add'>+		       &lt;= last_blk) {</div><div class='add'>+		punch(inode, folio_pos(folio) + (first_blk &lt;&lt; blkbits),</div><div class='add'>+				1 &lt;&lt; blkbits, iomap);</div><div class='add'>+		first_blk++;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void iomap_write_delalloc_punch(struct inode *inode, struct folio *folio,</div><div class='add'>+		loff_t *punch_start_byte, loff_t start_byte, loff_t end_byte,</div><div class='add'>+		struct iomap *iomap, iomap_punch_t punch)</div><div class='add'>+{</div><div class='add'>+	if (!folio_test_dirty(folio))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/* if dirty, punch up to offset */</div><div class='add'>+	if (start_byte &gt; *punch_start_byte) {</div><div class='add'>+		punch(inode, *punch_start_byte, start_byte - *punch_start_byte,</div><div class='add'>+				iomap);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Punch non-dirty blocks within folio */</div><div class='add'>+	iomap_write_delalloc_ifs_punch(inode, folio, start_byte, end_byte,</div><div class='add'>+			iomap, punch);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Make sure the next punch start is correctly bound to</div><div class='add'>+	 * the end of this data range, not the end of the folio.</div><div class='add'>+	 */</div><div class='add'>+	*punch_start_byte = min_t(loff_t, end_byte, folio_next_pos(folio));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Scan the data range passed to us for dirty page cache folios. If we find a</div><div class='add'>+ * dirty folio, punch out the preceding range and update the offset from which</div><div class='add'>+ * the next punch will start from.</div><div class='add'>+ *</div><div class='add'>+ * We can punch out storage reservations under clean pages because they either</div><div class='add'>+ * contain data that has been written back - in which case the delalloc punch</div><div class='add'>+ * over that range is a no-op - or they have been read faults in which case they</div><div class='add'>+ * contain zeroes and we can remove the delalloc backing range and any new</div><div class='add'>+ * writes to those pages will do the normal hole filling operation...</div><div class='add'>+ *</div><div class='add'>+ * This makes the logic simple: we only need to keep the delalloc extents only</div><div class='add'>+ * over the dirty ranges of the page cache.</div><div class='add'>+ *</div><div class='add'>+ * This function uses [start_byte, end_byte) intervals (i.e. open ended) to</div><div class='add'>+ * simplify range iterations.</div><div class='add'>+ */</div><div class='add'>+static void iomap_write_delalloc_scan(struct inode *inode,</div><div class='add'>+		loff_t *punch_start_byte, loff_t start_byte, loff_t end_byte,</div><div class='add'>+		struct iomap *iomap, iomap_punch_t punch)</div><div class='add'>+{</div><div class='add'>+	while (start_byte &lt; end_byte) {</div><div class='add'>+		struct folio	*folio;</div><div class='add'>+</div><div class='add'>+		/* grab locked page */</div><div class='add'>+		folio = filemap_lock_folio(inode-&gt;i_mapping,</div><div class='add'>+				start_byte &gt;&gt; PAGE_SHIFT);</div><div class='add'>+		if (IS_ERR(folio)) {</div><div class='add'>+			start_byte = ALIGN_DOWN(start_byte, PAGE_SIZE) +</div><div class='add'>+					PAGE_SIZE;</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		iomap_write_delalloc_punch(inode, folio, punch_start_byte,</div><div class='add'>+				start_byte, end_byte, iomap, punch);</div><div class='add'>+</div><div class='add'>+		/* move offset to start of next folio in range */</div><div class='add'>+		start_byte = folio_next_pos(folio);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * When a short write occurs, the filesystem might need to use -&gt;iomap_end</div><div class='add'>+ * to remove space reservations created in -&gt;iomap_begin.</div><div class='add'>+ *</div><div class='add'>+ * For filesystems that use delayed allocation, there can be dirty pages over</div><div class='add'>+ * the delalloc extent outside the range of a short write but still within the</div><div class='add'>+ * delalloc extent allocated for this iomap if the write raced with page</div><div class='add'>+ * faults.</div><div class='add'>+ *</div><div class='add'>+ * Punch out all the delalloc blocks in the range given except for those that</div><div class='add'>+ * have dirty data still pending in the page cache - those are going to be</div><div class='add'>+ * written and so must still retain the delalloc backing for writeback.</div><div class='add'>+ *</div><div class='add'>+ * The punch() callback *must* only punch delalloc extents in the range passed</div><div class='add'>+ * to it. It must skip over all other types of extents in the range and leave</div><div class='add'>+ * them completely unchanged. It must do this punch atomically with respect to</div><div class='add'>+ * other extent modifications.</div><div class='add'>+ *</div><div class='add'>+ * The punch() callback may be called with a folio locked to prevent writeback</div><div class='add'>+ * extent allocation racing at the edge of the range we are currently punching.</div><div class='add'>+ * The locked folio may or may not cover the range being punched, so it is not</div><div class='add'>+ * safe for the punch() callback to lock folios itself.</div><div class='add'>+ *</div><div class='add'>+ * Lock order is:</div><div class='add'>+ *</div><div class='add'>+ * inode-&gt;i_rwsem (shared or exclusive)</div><div class='add'>+ *   inode-&gt;i_mapping-&gt;invalidate_lock (exclusive)</div><div class='add'>+ *     folio_lock()</div><div class='add'>+ *       -&gt;punch</div><div class='add'>+ *         internal filesystem allocation lock</div><div class='add'>+ *</div><div class='add'>+ * As we are scanning the page cache for data, we don't need to reimplement the</div><div class='add'>+ * wheel - mapping_seek_hole_data() does exactly what we need to identify the</div><div class='add'>+ * start and end of data ranges correctly even for sub-folio block sizes. This</div><div class='add'>+ * byte range based iteration is especially convenient because it means we</div><div class='add'>+ * don't have to care about variable size folios, nor where the start or end of</div><div class='add'>+ * the data range lies within a folio, if they lie within the same folio or even</div><div class='add'>+ * if there are multiple discontiguous data ranges within the folio.</div><div class='add'>+ *</div><div class='add'>+ * It should be noted that mapping_seek_hole_data() is not aware of EOF, and so</div><div class='add'>+ * can return data ranges that exist in the cache beyond EOF. e.g. a page fault</div><div class='add'>+ * spanning EOF will initialise the post-EOF data to zeroes and mark it up to</div><div class='add'>+ * date. A write page fault can then mark it dirty. If we then fail a write()</div><div class='add'>+ * beyond EOF into that up to date cached range, we allocate a delalloc block</div><div class='add'>+ * beyond EOF and then have to punch it out. Because the range is up to date,</div><div class='add'>+ * mapping_seek_hole_data() will return it, and we will skip the punch because</div><div class='add'>+ * the folio is dirty. THis is incorrect - we always need to punch out delalloc</div><div class='add'>+ * beyond EOF in this case as writeback will never write back and covert that</div><div class='add'>+ * delalloc block beyond EOF. Hence we limit the cached data scan range to EOF,</div><div class='add'>+ * resulting in always punching out the range from the EOF to the end of the</div><div class='add'>+ * range the iomap spans.</div><div class='add'>+ *</div><div class='add'>+ * Intervals are of the form [start_byte, end_byte) (i.e. open ended) because it</div><div class='add'>+ * matches the intervals returned by mapping_seek_hole_data(). i.e. SEEK_DATA</div><div class='add'>+ * returns the start of a data range (start_byte), and SEEK_HOLE(start_byte)</div><div class='add'>+ * returns the end of the data range (data_end). Using closed intervals would</div><div class='add'>+ * require sprinkling this code with magic "+ 1" and "- 1" arithmetic and expose</div><div class='add'>+ * the code to subtle off-by-one bugs....</div><div class='add'>+ */</div><div class='add'>+void iomap_write_delalloc_release(struct inode *inode, loff_t start_byte,</div><div class='add'>+		loff_t end_byte, unsigned flags, struct iomap *iomap,</div><div class='add'>+		iomap_punch_t punch)</div><div class='add'>+{</div><div class='add'>+	loff_t punch_start_byte = start_byte;</div><div class='add'>+	loff_t scan_end_byte = min(i_size_read(inode), end_byte);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The caller must hold invalidate_lock to avoid races with page faults</div><div class='add'>+	 * re-instantiating folios and dirtying them via -&gt;page_mkwrite whilst</div><div class='add'>+	 * we walk the cache and perform delalloc extent removal.  Failing to do</div><div class='add'>+	 * this can leave dirty pages with no space reservation in the cache.</div><div class='add'>+	 */</div><div class='add'>+	lockdep_assert_held_write(&amp;inode-&gt;i_mapping-&gt;invalidate_lock);</div><div class='add'>+</div><div class='add'>+	while (start_byte &lt; scan_end_byte) {</div><div class='add'>+		loff_t		data_end;</div><div class='add'>+</div><div class='add'>+		start_byte = mapping_seek_hole_data(inode-&gt;i_mapping,</div><div class='add'>+				start_byte, scan_end_byte, SEEK_DATA);</div><div class='add'>+		/*</div><div class='add'>+		 * If there is no more data to scan, all that is left is to</div><div class='add'>+		 * punch out the remaining range.</div><div class='add'>+		 *</div><div class='add'>+		 * Note that mapping_seek_hole_data is only supposed to return</div><div class='add'>+		 * either an offset or -ENXIO, so WARN on any other error as</div><div class='add'>+		 * that would be an API change without updating the callers.</div><div class='add'>+		 */</div><div class='add'>+		if (start_byte == -ENXIO || start_byte == scan_end_byte)</div><div class='add'>+			break;</div><div class='add'>+		if (WARN_ON_ONCE(start_byte &lt; 0))</div><div class='add'>+			return;</div><div class='add'>+		WARN_ON_ONCE(start_byte &lt; punch_start_byte);</div><div class='add'>+		WARN_ON_ONCE(start_byte &gt; scan_end_byte);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * We find the end of this contiguous cached data range by</div><div class='add'>+		 * seeking from start_byte to the beginning of the next hole.</div><div class='add'>+		 */</div><div class='add'>+		data_end = mapping_seek_hole_data(inode-&gt;i_mapping, start_byte,</div><div class='add'>+				scan_end_byte, SEEK_HOLE);</div><div class='add'>+		if (WARN_ON_ONCE(data_end &lt; 0))</div><div class='add'>+			return;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * If we race with post-direct I/O invalidation of the page cache,</div><div class='add'>+		 * there might be no data left at start_byte.</div><div class='add'>+		 */</div><div class='add'>+		if (data_end == start_byte)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		WARN_ON_ONCE(data_end &lt; start_byte);</div><div class='add'>+		WARN_ON_ONCE(data_end &gt; scan_end_byte);</div><div class='add'>+</div><div class='add'>+		iomap_write_delalloc_scan(inode, &amp;punch_start_byte, start_byte,</div><div class='add'>+				data_end, iomap, punch);</div><div class='add'>+</div><div class='add'>+		/* The next data search starts at the end of this one. */</div><div class='add'>+		start_byte = data_end;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (punch_start_byte &lt; end_byte)</div><div class='add'>+		punch(inode, punch_start_byte, end_byte - punch_start_byte,</div><div class='add'>+				iomap);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(iomap_write_delalloc_release);</div><div class='add'>+</div><div class='add'>+static int iomap_unshare_iter(struct iomap_iter *iter,</div><div class='add'>+		const struct iomap_write_ops *write_ops)</div><div class='ctx'> {</div><div class='ctx'> 	struct iomap *iomap = &amp;iter-&gt;iomap;</div><div class='del'>-	const struct iomap *srcmap = iomap_iter_srcmap(iter);</div><div class='del'>-	loff_t pos = iter-&gt;pos;</div><div class='del'>-	loff_t length = iomap_length(iter);</div><div class='del'>-	long status = 0;</div><div class='del'>-	loff_t written = 0;</div><div class='add'>+	u64 bytes = iomap_length(iter);</div><div class='add'>+	int status;</div><div class='ctx'> </div><div class='del'>-	/* don't bother with blocks that are not shared to start with */</div><div class='del'>-	if (!(iomap-&gt;flags &amp; IOMAP_F_SHARED))</div><div class='del'>-		return length;</div><div class='del'>-	/* don't bother with holes or unwritten extents */</div><div class='del'>-	if (srcmap-&gt;type == IOMAP_HOLE || srcmap-&gt;type == IOMAP_UNWRITTEN)</div><div class='del'>-		return length;</div><div class='add'>+	if (!iomap_want_unshare_iter(iter))</div><div class='add'>+		return iomap_iter_advance(iter, bytes);</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='del'>-		unsigned long offset = offset_in_page(pos);</div><div class='del'>-		unsigned long bytes = min_t(loff_t, PAGE_SIZE - offset, length);</div><div class='del'>-		struct page *page;</div><div class='add'>+		struct folio *folio;</div><div class='add'>+		size_t offset;</div><div class='add'>+		bool ret;</div><div class='ctx'> </div><div class='del'>-		status = iomap_write_begin(iter, pos, bytes, &amp;page);</div><div class='add'>+		bytes = min_t(u64, SIZE_MAX, bytes);</div><div class='add'>+		status = iomap_write_begin(iter, write_ops, &amp;folio, &amp;offset,</div><div class='add'>+				&amp;bytes);</div><div class='ctx'> 		if (unlikely(status))</div><div class='ctx'> 			return status;</div><div class='add'>+		if (iomap-&gt;flags &amp; IOMAP_F_STALE)</div><div class='add'>+			break;</div><div class='ctx'> </div><div class='del'>-		status = iomap_write_end(iter, pos, bytes, bytes, page);</div><div class='del'>-		if (WARN_ON_ONCE(status == 0))</div><div class='add'>+		ret = iomap_write_end(iter, bytes, bytes, folio);</div><div class='add'>+		__iomap_put_folio(iter, write_ops, bytes, folio);</div><div class='add'>+		if (WARN_ON_ONCE(!ret))</div><div class='ctx'> 			return -EIO;</div><div class='ctx'> </div><div class='ctx'> 		cond_resched();</div><div class='ctx'> </div><div class='del'>-		pos += status;</div><div class='del'>-		written += status;</div><div class='del'>-		length -= status;</div><div class='del'>-</div><div class='ctx'> 		balance_dirty_pages_ratelimited(iter-&gt;inode-&gt;i_mapping);</div><div class='del'>-	} while (length);</div><div class='ctx'> </div><div class='del'>-	return written;</div><div class='add'>+		status = iomap_iter_advance(iter, bytes);</div><div class='add'>+		if (status)</div><div class='add'>+			break;</div><div class='add'>+	} while ((bytes = iomap_length(iter)) &gt; 0);</div><div class='add'>+</div><div class='add'>+	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int</div><div class='ctx'> iomap_file_unshare(struct inode *inode, loff_t pos, loff_t len,</div><div class='del'>-		const struct iomap_ops *ops)</div><div class='add'>+		const struct iomap_ops *ops,</div><div class='add'>+		const struct iomap_write_ops *write_ops)</div><div class='ctx'> {</div><div class='ctx'> 	struct iomap_iter iter = {</div><div class='ctx'> 		.inode		= inode,</div><div class='ctx'> 		.pos		= pos,</div><div class='del'>-		.len		= len,</div><div class='ctx'> 		.flags		= IOMAP_WRITE | IOMAP_UNSHARE,</div><div class='ctx'> 	};</div><div class='add'>+	loff_t size = i_size_read(inode);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='add'>+	if (pos &lt; 0 || pos &gt;= size)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	iter.len = min(len, size - pos);</div><div class='ctx'> 	while ((ret = iomap_iter(&amp;iter, ops)) &gt; 0)</div><div class='del'>-		iter.processed = iomap_unshare_iter(&amp;iter);</div><div class='add'>+		iter.status = iomap_unshare_iter(&amp;iter, write_ops);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(iomap_file_unshare);</div><div class='ctx'> </div><div class='del'>-static s64 __iomap_zero_iter(struct iomap_iter *iter, loff_t pos, u64 length)</div><div class='add'>+/*</div><div class='add'>+ * Flush the remaining range of the iter and mark the current mapping stale.</div><div class='add'>+ * This is used when zero range sees an unwritten mapping that may have had</div><div class='add'>+ * dirty pagecache over it.</div><div class='add'>+ */</div><div class='add'>+static inline int iomap_zero_iter_flush_and_stale(struct iomap_iter *i)</div><div class='add'>+{</div><div class='add'>+	struct address_space *mapping = i-&gt;inode-&gt;i_mapping;</div><div class='add'>+	loff_t end = i-&gt;pos + i-&gt;len - 1;</div><div class='add'>+</div><div class='add'>+	i-&gt;iomap.flags |= IOMAP_F_STALE;</div><div class='add'>+	return filemap_write_and_wait_range(mapping, i-&gt;pos, end);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int iomap_zero_iter(struct iomap_iter *iter, bool *did_zero,</div><div class='add'>+		const struct iomap_write_ops *write_ops)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='add'>+	u64 bytes = iomap_length(iter);</div><div class='ctx'> 	int status;</div><div class='del'>-	unsigned offset = offset_in_page(pos);</div><div class='del'>-	unsigned bytes = min_t(u64, PAGE_SIZE - offset, length);</div><div class='ctx'> </div><div class='del'>-	status = iomap_write_begin(iter, pos, bytes, &amp;page);</div><div class='del'>-	if (status)</div><div class='del'>-		return status;</div><div class='add'>+	do {</div><div class='add'>+		struct folio *folio;</div><div class='add'>+		size_t offset;</div><div class='add'>+		bool ret;</div><div class='add'>+</div><div class='add'>+		bytes = min_t(u64, SIZE_MAX, bytes);</div><div class='add'>+		status = iomap_write_begin(iter, write_ops, &amp;folio, &amp;offset,</div><div class='add'>+				&amp;bytes);</div><div class='add'>+		if (status)</div><div class='add'>+			return status;</div><div class='add'>+		if (iter-&gt;iomap.flags &amp; IOMAP_F_STALE)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		/* a NULL folio means we're done with a folio batch */</div><div class='add'>+		if (!folio) {</div><div class='add'>+			status = iomap_iter_advance_full(iter);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	zero_user(page, offset, bytes);</div><div class='del'>-	mark_page_accessed(page);</div><div class='add'>+		/* warn about zeroing folios beyond eof that won't write back */</div><div class='add'>+		WARN_ON_ONCE(folio_pos(folio) &gt; iter-&gt;inode-&gt;i_size);</div><div class='ctx'> </div><div class='del'>-	return iomap_write_end(iter, pos, bytes, bytes, page);</div><div class='add'>+		trace_iomap_zero_iter(iter-&gt;inode, folio_pos(folio) + offset,</div><div class='add'>+				bytes);</div><div class='add'>+</div><div class='add'>+		folio_zero_range(folio, offset, bytes);</div><div class='add'>+		folio_mark_accessed(folio);</div><div class='add'>+</div><div class='add'>+		ret = iomap_write_end(iter, bytes, bytes, folio);</div><div class='add'>+		__iomap_put_folio(iter, write_ops, bytes, folio);</div><div class='add'>+		if (WARN_ON_ONCE(!ret))</div><div class='add'>+			return -EIO;</div><div class='add'>+</div><div class='add'>+		status = iomap_iter_advance(iter, bytes);</div><div class='add'>+		if (status)</div><div class='add'>+			break;</div><div class='add'>+	} while ((bytes = iomap_length(iter)) &gt; 0);</div><div class='add'>+</div><div class='add'>+	if (did_zero)</div><div class='add'>+		*did_zero = true;</div><div class='add'>+	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static loff_t iomap_zero_iter(struct iomap_iter *iter, bool *did_zero)</div><div class='add'>+loff_t</div><div class='add'>+iomap_fill_dirty_folios(</div><div class='add'>+	struct iomap_iter	*iter,</div><div class='add'>+	loff_t			offset,</div><div class='add'>+	loff_t			length)</div><div class='ctx'> {</div><div class='del'>-	struct iomap *iomap = &amp;iter-&gt;iomap;</div><div class='del'>-	const struct iomap *srcmap = iomap_iter_srcmap(iter);</div><div class='del'>-	loff_t pos = iter-&gt;pos;</div><div class='del'>-	loff_t length = iomap_length(iter);</div><div class='del'>-	loff_t written = 0;</div><div class='add'>+	struct address_space	*mapping = iter-&gt;inode-&gt;i_mapping;</div><div class='add'>+	pgoff_t			start = offset &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	pgoff_t			end = (offset + length - 1) &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> </div><div class='del'>-	/* already zeroed?  we're done. */</div><div class='del'>-	if (srcmap-&gt;type == IOMAP_HOLE || srcmap-&gt;type == IOMAP_UNWRITTEN)</div><div class='del'>-		return length;</div><div class='add'>+	iter-&gt;fbatch = kmalloc(sizeof(struct folio_batch), GFP_KERNEL);</div><div class='add'>+	if (!iter-&gt;fbatch)</div><div class='add'>+		return offset + length;</div><div class='add'>+	folio_batch_init(iter-&gt;fbatch);</div><div class='ctx'> </div><div class='del'>-	do {</div><div class='del'>-		s64 bytes;</div><div class='del'>-</div><div class='del'>-		if (IS_DAX(iter-&gt;inode))</div><div class='del'>-			bytes = dax_iomap_zero(pos, length, iomap);</div><div class='del'>-		else</div><div class='del'>-			bytes = __iomap_zero_iter(iter, pos, length);</div><div class='del'>-		if (bytes &lt; 0)</div><div class='del'>-			return bytes;</div><div class='del'>-</div><div class='del'>-		pos += bytes;</div><div class='del'>-		length -= bytes;</div><div class='del'>-		written += bytes;</div><div class='del'>-		if (did_zero)</div><div class='del'>-			*did_zero = true;</div><div class='del'>-	} while (length &gt; 0);</div><div class='del'>-</div><div class='del'>-	return written;</div><div class='add'>+	filemap_get_folios_dirty(mapping, &amp;start, end, iter-&gt;fbatch);</div><div class='add'>+	return (start &lt;&lt; PAGE_SHIFT);</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL_GPL(iomap_fill_dirty_folios);</div><div class='ctx'> </div><div class='ctx'> int</div><div class='ctx'> iomap_zero_range(struct inode *inode, loff_t pos, loff_t len, bool *did_zero,</div><div class='del'>-		const struct iomap_ops *ops)</div><div class='add'>+		const struct iomap_ops *ops,</div><div class='add'>+		const struct iomap_write_ops *write_ops, void *private)</div><div class='ctx'> {</div><div class='ctx'> 	struct iomap_iter iter = {</div><div class='ctx'> 		.inode		= inode,</div><div class='ctx'> 		.pos		= pos,</div><div class='ctx'> 		.len		= len,</div><div class='ctx'> 		.flags		= IOMAP_ZERO,</div><div class='add'>+		.private	= private,</div><div class='ctx'> 	};</div><div class='add'>+	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='ctx'> 	int ret;</div><div class='add'>+	bool range_dirty;</div><div class='ctx'> </div><div class='del'>-	while ((ret = iomap_iter(&amp;iter, ops)) &gt; 0)</div><div class='del'>-		iter.processed = iomap_zero_iter(&amp;iter, did_zero);</div><div class='add'>+	/*</div><div class='add'>+	 * To avoid an unconditional flush, check pagecache state and only flush</div><div class='add'>+	 * if dirty and the fs returns a mapping that might convert on</div><div class='add'>+	 * writeback.</div><div class='add'>+	 */</div><div class='add'>+	range_dirty = filemap_range_needs_writeback(mapping, iter.pos,</div><div class='add'>+					iter.pos + iter.len - 1);</div><div class='add'>+	while ((ret = iomap_iter(&amp;iter, ops)) &gt; 0) {</div><div class='add'>+		const struct iomap *srcmap = iomap_iter_srcmap(&amp;iter);</div><div class='add'>+</div><div class='add'>+		if (WARN_ON_ONCE(iter.fbatch &amp;&amp;</div><div class='add'>+				 srcmap-&gt;type != IOMAP_UNWRITTEN))</div><div class='add'>+			return -EIO;</div><div class='add'>+</div><div class='add'>+		if (!iter.fbatch &amp;&amp;</div><div class='add'>+		    (srcmap-&gt;type == IOMAP_HOLE ||</div><div class='add'>+		     srcmap-&gt;type == IOMAP_UNWRITTEN)) {</div><div class='add'>+			s64 status;</div><div class='add'>+</div><div class='add'>+			if (range_dirty) {</div><div class='add'>+				range_dirty = false;</div><div class='add'>+				status = iomap_zero_iter_flush_and_stale(&amp;iter);</div><div class='add'>+			} else {</div><div class='add'>+				status = iomap_iter_advance_full(&amp;iter);</div><div class='add'>+			}</div><div class='add'>+			iter.status = status;</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		iter.status = iomap_zero_iter(&amp;iter, did_zero, write_ops);</div><div class='add'>+	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(iomap_zero_range);</div><div class='ctx'> </div><div class='ctx'> int</div><div class='ctx'> iomap_truncate_page(struct inode *inode, loff_t pos, bool *did_zero,</div><div class='del'>-		const struct iomap_ops *ops)</div><div class='add'>+		const struct iomap_ops *ops,</div><div class='add'>+		const struct iomap_write_ops *write_ops, void *private)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int blocksize = i_blocksize(inode);</div><div class='ctx'> 	unsigned int off = pos &amp; (blocksize - 1);</div><div class='hunk'>@@ -947,575 +1626,294 @@ iomap_truncate_page(struct inode *inode, loff_t pos, bool *did_zero,</div><div class='ctx'> 	/* Block boundary? Nothing to do */</div><div class='ctx'> 	if (!off)</div><div class='ctx'> 		return 0;</div><div class='del'>-	return iomap_zero_range(inode, pos, blocksize - off, did_zero, ops);</div><div class='add'>+	return iomap_zero_range(inode, pos, blocksize - off, did_zero, ops,</div><div class='add'>+			write_ops, private);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(iomap_truncate_page);</div><div class='ctx'> </div><div class='del'>-static loff_t iomap_page_mkwrite_iter(struct iomap_iter *iter,</div><div class='del'>-		struct page *page)</div><div class='add'>+static int iomap_folio_mkwrite_iter(struct iomap_iter *iter,</div><div class='add'>+		struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	loff_t length = iomap_length(iter);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (iter-&gt;iomap.flags &amp; IOMAP_F_BUFFER_HEAD) {</div><div class='del'>-		ret = __block_write_begin_int(page, iter-&gt;pos, length, NULL,</div><div class='add'>+		ret = __block_write_begin_int(folio, iter-&gt;pos, length, NULL,</div><div class='ctx'> 					      &amp;iter-&gt;iomap);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			return ret;</div><div class='del'>-		block_commit_write(page, 0, length);</div><div class='add'>+		block_commit_write(folio, 0, length);</div><div class='ctx'> 	} else {</div><div class='del'>-		WARN_ON_ONCE(!PageUptodate(page));</div><div class='del'>-		set_page_dirty(page);</div><div class='add'>+		WARN_ON_ONCE(!folio_test_uptodate(folio));</div><div class='add'>+		folio_mark_dirty(folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return length;</div><div class='add'>+	return iomap_iter_advance(iter, length);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-vm_fault_t iomap_page_mkwrite(struct vm_fault *vmf, const struct iomap_ops *ops)</div><div class='add'>+vm_fault_t iomap_page_mkwrite(struct vm_fault *vmf, const struct iomap_ops *ops,</div><div class='add'>+		void *private)</div><div class='ctx'> {</div><div class='ctx'> 	struct iomap_iter iter = {</div><div class='ctx'> 		.inode		= file_inode(vmf-&gt;vma-&gt;vm_file),</div><div class='ctx'> 		.flags		= IOMAP_WRITE | IOMAP_FAULT,</div><div class='add'>+		.private	= private,</div><div class='ctx'> 	};</div><div class='del'>-	struct page *page = vmf-&gt;page;</div><div class='add'>+	struct folio *folio = page_folio(vmf-&gt;page);</div><div class='ctx'> 	ssize_t ret;</div><div class='ctx'> </div><div class='del'>-	lock_page(page);</div><div class='del'>-	ret = page_mkwrite_check_truncate(page, iter.inode);</div><div class='add'>+	folio_lock(folio);</div><div class='add'>+	ret = folio_mkwrite_check_truncate(folio, iter.inode);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out_unlock;</div><div class='del'>-	iter.pos = page_offset(page);</div><div class='add'>+	iter.pos = folio_pos(folio);</div><div class='ctx'> 	iter.len = ret;</div><div class='ctx'> 	while ((ret = iomap_iter(&amp;iter, ops)) &gt; 0)</div><div class='del'>-		iter.processed = iomap_page_mkwrite_iter(&amp;iter, page);</div><div class='add'>+		iter.status = iomap_folio_mkwrite_iter(&amp;iter, folio);</div><div class='ctx'> </div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto out_unlock;</div><div class='del'>-	wait_for_stable_page(page);</div><div class='add'>+	folio_wait_stable(folio);</div><div class='ctx'> 	return VM_FAULT_LOCKED;</div><div class='ctx'> out_unlock:</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	return block_page_mkwrite_return(ret);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	return vmf_fs_error(ret);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(iomap_page_mkwrite);</div><div class='ctx'> </div><div class='del'>-static void</div><div class='del'>-iomap_finish_page_writeback(struct inode *inode, struct page *page,</div><div class='del'>-		int error, unsigned int len)</div><div class='add'>+static void iomap_writeback_init(struct inode *inode, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct iomap_page *iop = to_iomap_page(page);</div><div class='del'>-</div><div class='del'>-	if (error) {</div><div class='del'>-		SetPageError(page);</div><div class='del'>-		mapping_set_error(inode-&gt;i_mapping, error);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	WARN_ON_ONCE(i_blocks_per_page(inode, page) &gt; 1 &amp;&amp; !iop);</div><div class='del'>-	WARN_ON_ONCE(iop &amp;&amp; atomic_read(&amp;iop-&gt;write_bytes_pending) &lt;= 0);</div><div class='del'>-</div><div class='del'>-	if (!iop || atomic_sub_and_test(len, &amp;iop-&gt;write_bytes_pending))</div><div class='del'>-		end_page_writeback(page);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * We're now finished for good with this ioend structure.  Update the page</div><div class='del'>- * state, release holds on bios, and finally free up memory.  Do not use the</div><div class='del'>- * ioend after this.</div><div class='del'>- */</div><div class='del'>-static void</div><div class='del'>-iomap_finish_ioend(struct iomap_ioend *ioend, int error)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = ioend-&gt;io_inode;</div><div class='del'>-	struct bio *bio = &amp;ioend-&gt;io_inline_bio;</div><div class='del'>-	struct bio *last = ioend-&gt;io_bio, *next;</div><div class='del'>-	u64 start = bio-&gt;bi_iter.bi_sector;</div><div class='del'>-	loff_t offset = ioend-&gt;io_offset;</div><div class='del'>-	bool quiet = bio_flagged(bio, BIO_QUIET);</div><div class='del'>-</div><div class='del'>-	for (bio = &amp;ioend-&gt;io_inline_bio; bio; bio = next) {</div><div class='del'>-		struct bio_vec *bv;</div><div class='del'>-		struct bvec_iter_all iter_all;</div><div class='add'>+	struct iomap_folio_state *ifs = folio-&gt;private;</div><div class='ctx'> </div><div class='add'>+	WARN_ON_ONCE(i_blocks_per_folio(inode, folio) &gt; 1 &amp;&amp; !ifs);</div><div class='add'>+	if (ifs) {</div><div class='add'>+		WARN_ON_ONCE(atomic_read(&amp;ifs-&gt;write_bytes_pending) != 0);</div><div class='ctx'> 		/*</div><div class='del'>-		 * For the last bio, bi_private points to the ioend, so we</div><div class='del'>-		 * need to explicitly end the iteration here.</div><div class='add'>+		 * Set this to the folio size. After processing the folio for</div><div class='add'>+		 * writeback in iomap_writeback_folio(), we'll subtract any</div><div class='add'>+		 * ranges not written back.</div><div class='add'>+		 *</div><div class='add'>+		 * We do this because otherwise, we would have to atomically</div><div class='add'>+		 * increment ifs-&gt;write_bytes_pending every time a range in the</div><div class='add'>+		 * folio needs to be written back.</div><div class='ctx'> 		 */</div><div class='del'>-		if (bio == last)</div><div class='del'>-			next = NULL;</div><div class='del'>-		else</div><div class='del'>-			next = bio-&gt;bi_private;</div><div class='del'>-</div><div class='del'>-		/* walk each page on bio, ending page IO on them */</div><div class='del'>-		bio_for_each_segment_all(bv, bio, iter_all)</div><div class='del'>-			iomap_finish_page_writeback(inode, bv-&gt;bv_page, error,</div><div class='del'>-					bv-&gt;bv_len);</div><div class='del'>-		bio_put(bio);</div><div class='del'>-	}</div><div class='del'>-	/* The ioend has been freed by bio_put() */</div><div class='del'>-</div><div class='del'>-	if (unlikely(error &amp;&amp; !quiet)) {</div><div class='del'>-		printk_ratelimited(KERN_ERR</div><div class='del'>-"%s: writeback error on inode %lu, offset %lld, sector %llu",</div><div class='del'>-			inode-&gt;i_sb-&gt;s_id, inode-&gt;i_ino, offset, start);</div><div class='add'>+		atomic_set(&amp;ifs-&gt;write_bytes_pending, folio_size(folio));</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void</div><div class='del'>-iomap_finish_ioends(struct iomap_ioend *ioend, int error)</div><div class='add'>+void iomap_finish_folio_write(struct inode *inode, struct folio *folio,</div><div class='add'>+		size_t len)</div><div class='ctx'> {</div><div class='del'>-	struct list_head tmp;</div><div class='add'>+	struct iomap_folio_state *ifs = folio-&gt;private;</div><div class='ctx'> </div><div class='del'>-	list_replace_init(&amp;ioend-&gt;io_list, &amp;tmp);</div><div class='del'>-	iomap_finish_ioend(ioend, error);</div><div class='del'>-</div><div class='del'>-	while (!list_empty(&amp;tmp)) {</div><div class='del'>-		ioend = list_first_entry(&amp;tmp, struct iomap_ioend, io_list);</div><div class='del'>-		list_del_init(&amp;ioend-&gt;io_list);</div><div class='del'>-		iomap_finish_ioend(ioend, error);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL_GPL(iomap_finish_ioends);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * We can merge two adjacent ioends if they have the same set of work to do.</div><div class='del'>- */</div><div class='del'>-static bool</div><div class='del'>-iomap_ioend_can_merge(struct iomap_ioend *ioend, struct iomap_ioend *next)</div><div class='del'>-{</div><div class='del'>-	if (ioend-&gt;io_bio-&gt;bi_status != next-&gt;io_bio-&gt;bi_status)</div><div class='del'>-		return false;</div><div class='del'>-	if ((ioend-&gt;io_flags &amp; IOMAP_F_SHARED) ^</div><div class='del'>-	    (next-&gt;io_flags &amp; IOMAP_F_SHARED))</div><div class='del'>-		return false;</div><div class='del'>-	if ((ioend-&gt;io_type == IOMAP_UNWRITTEN) ^</div><div class='del'>-	    (next-&gt;io_type == IOMAP_UNWRITTEN))</div><div class='del'>-		return false;</div><div class='del'>-	if (ioend-&gt;io_offset + ioend-&gt;io_size != next-&gt;io_offset)</div><div class='del'>-		return false;</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void</div><div class='del'>-iomap_ioend_try_merge(struct iomap_ioend *ioend, struct list_head *more_ioends)</div><div class='del'>-{</div><div class='del'>-	struct iomap_ioend *next;</div><div class='del'>-</div><div class='del'>-	INIT_LIST_HEAD(&amp;ioend-&gt;io_list);</div><div class='del'>-</div><div class='del'>-	while ((next = list_first_entry_or_null(more_ioends, struct iomap_ioend,</div><div class='del'>-			io_list))) {</div><div class='del'>-		if (!iomap_ioend_can_merge(ioend, next))</div><div class='del'>-			break;</div><div class='del'>-		list_move_tail(&amp;next-&gt;io_list, &amp;ioend-&gt;io_list);</div><div class='del'>-		ioend-&gt;io_size += next-&gt;io_size;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL_GPL(iomap_ioend_try_merge);</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-iomap_ioend_compare(void *priv, const struct list_head *a,</div><div class='del'>-		const struct list_head *b)</div><div class='del'>-{</div><div class='del'>-	struct iomap_ioend *ia = container_of(a, struct iomap_ioend, io_list);</div><div class='del'>-	struct iomap_ioend *ib = container_of(b, struct iomap_ioend, io_list);</div><div class='del'>-</div><div class='del'>-	if (ia-&gt;io_offset &lt; ib-&gt;io_offset)</div><div class='del'>-		return -1;</div><div class='del'>-	if (ia-&gt;io_offset &gt; ib-&gt;io_offset)</div><div class='del'>-		return 1;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='add'>+	WARN_ON_ONCE(i_blocks_per_folio(inode, folio) &gt; 1 &amp;&amp; !ifs);</div><div class='add'>+	WARN_ON_ONCE(ifs &amp;&amp; atomic_read(&amp;ifs-&gt;write_bytes_pending) &lt;= 0);</div><div class='ctx'> </div><div class='del'>-void</div><div class='del'>-iomap_sort_ioends(struct list_head *ioend_list)</div><div class='del'>-{</div><div class='del'>-	list_sort(NULL, ioend_list, iomap_ioend_compare);</div><div class='add'>+	if (!ifs || atomic_sub_and_test(len, &amp;ifs-&gt;write_bytes_pending))</div><div class='add'>+		folio_end_writeback(folio);</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL_GPL(iomap_sort_ioends);</div><div class='add'>+EXPORT_SYMBOL_GPL(iomap_finish_folio_write);</div><div class='ctx'> </div><div class='del'>-static void iomap_writepage_end_bio(struct bio *bio)</div><div class='add'>+static int iomap_writeback_range(struct iomap_writepage_ctx *wpc,</div><div class='add'>+		struct folio *folio, u64 pos, u32 rlen, u64 end_pos,</div><div class='add'>+		size_t *bytes_submitted)</div><div class='ctx'> {</div><div class='del'>-	struct iomap_ioend *ioend = bio-&gt;bi_private;</div><div class='del'>-</div><div class='del'>-	iomap_finish_ioend(ioend, blk_status_to_errno(bio-&gt;bi_status));</div><div class='del'>-}</div><div class='add'>+	do {</div><div class='add'>+		ssize_t ret;</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Submit the final bio for an ioend.</div><div class='del'>- *</div><div class='del'>- * If @error is non-zero, it means that we have a situation where some part of</div><div class='del'>- * the submission process has failed after we've marked pages for writeback</div><div class='del'>- * and unlocked them.  In this situation, we need to fail the bio instead of</div><div class='del'>- * submitting it.  This typically only happens on a filesystem shutdown.</div><div class='del'>- */</div><div class='del'>-static int</div><div class='del'>-iomap_submit_ioend(struct iomap_writepage_ctx *wpc, struct iomap_ioend *ioend,</div><div class='del'>-		int error)</div><div class='del'>-{</div><div class='del'>-	ioend-&gt;io_bio-&gt;bi_private = ioend;</div><div class='del'>-	ioend-&gt;io_bio-&gt;bi_end_io = iomap_writepage_end_bio;</div><div class='add'>+		ret = wpc-&gt;ops-&gt;writeback_range(wpc, folio, pos, rlen, end_pos);</div><div class='add'>+		if (WARN_ON_ONCE(ret == 0 || ret &gt; rlen))</div><div class='add'>+			return -EIO;</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='add'>+		rlen -= ret;</div><div class='add'>+		pos += ret;</div><div class='ctx'> </div><div class='del'>-	if (wpc-&gt;ops-&gt;prepare_ioend)</div><div class='del'>-		error = wpc-&gt;ops-&gt;prepare_ioend(ioend, error);</div><div class='del'>-	if (error) {</div><div class='ctx'> 		/*</div><div class='del'>-		 * If we're failing the IO now, just mark the ioend with an</div><div class='del'>-		 * error and finish it.  This will run IO completion immediately</div><div class='del'>-		 * as there is only one reference to the ioend at this point in</div><div class='del'>-		 * time.</div><div class='add'>+		 * Holes are not written back by -&gt;writeback_range, so track</div><div class='add'>+		 * if we did handle anything that is not a hole here.</div><div class='ctx'> 		 */</div><div class='del'>-		ioend-&gt;io_bio-&gt;bi_status = errno_to_blk_status(error);</div><div class='del'>-		bio_endio(ioend-&gt;io_bio);</div><div class='del'>-		return error;</div><div class='del'>-	}</div><div class='add'>+		if (wpc-&gt;iomap.type != IOMAP_HOLE)</div><div class='add'>+			*bytes_submitted += ret;</div><div class='add'>+	} while (rlen);</div><div class='ctx'> </div><div class='del'>-	submit_bio(ioend-&gt;io_bio);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct iomap_ioend *</div><div class='del'>-iomap_alloc_ioend(struct inode *inode, struct iomap_writepage_ctx *wpc,</div><div class='del'>-		loff_t offset, sector_t sector, struct writeback_control *wbc)</div><div class='del'>-{</div><div class='del'>-	struct iomap_ioend *ioend;</div><div class='del'>-	struct bio *bio;</div><div class='del'>-</div><div class='del'>-	bio = bio_alloc_bioset(GFP_NOFS, BIO_MAX_VECS, &amp;iomap_ioend_bioset);</div><div class='del'>-	bio_set_dev(bio, wpc-&gt;iomap.bdev);</div><div class='del'>-	bio-&gt;bi_iter.bi_sector = sector;</div><div class='del'>-	bio-&gt;bi_opf = REQ_OP_WRITE | wbc_to_write_flags(wbc);</div><div class='del'>-	bio-&gt;bi_write_hint = inode-&gt;i_write_hint;</div><div class='del'>-	wbc_init_bio(wbc, bio);</div><div class='del'>-</div><div class='del'>-	ioend = container_of(bio, struct iomap_ioend, io_inline_bio);</div><div class='del'>-	INIT_LIST_HEAD(&amp;ioend-&gt;io_list);</div><div class='del'>-	ioend-&gt;io_type = wpc-&gt;iomap.type;</div><div class='del'>-	ioend-&gt;io_flags = wpc-&gt;iomap.flags;</div><div class='del'>-	ioend-&gt;io_inode = inode;</div><div class='del'>-	ioend-&gt;io_size = 0;</div><div class='del'>-	ioend-&gt;io_offset = offset;</div><div class='del'>-	ioend-&gt;io_bio = bio;</div><div class='del'>-	return ioend;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='del'>- * Allocate a new bio, and chain the old bio to the new one.</div><div class='add'>+ * Check interaction of the folio with the file end.</div><div class='ctx'>  *</div><div class='del'>- * Note that we have to perform the chaining in this unintuitive order</div><div class='del'>- * so that the bi_private linkage is set up in the right direction for the</div><div class='del'>- * traversal in iomap_finish_ioend().</div><div class='add'>+ * If the folio is entirely beyond i_size, return false.  If it straddles</div><div class='add'>+ * i_size, adjust end_pos and zero all data beyond i_size.</div><div class='ctx'>  */</div><div class='del'>-static struct bio *</div><div class='del'>-iomap_chain_bio(struct bio *prev)</div><div class='add'>+static bool iomap_writeback_handle_eof(struct folio *folio, struct inode *inode,</div><div class='add'>+		u64 *end_pos)</div><div class='ctx'> {</div><div class='del'>-	struct bio *new;</div><div class='del'>-</div><div class='del'>-	new = bio_alloc(GFP_NOFS, BIO_MAX_VECS);</div><div class='del'>-	bio_copy_dev(new, prev);/* also copies over blkcg information */</div><div class='del'>-	new-&gt;bi_iter.bi_sector = bio_end_sector(prev);</div><div class='del'>-	new-&gt;bi_opf = prev-&gt;bi_opf;</div><div class='del'>-	new-&gt;bi_write_hint = prev-&gt;bi_write_hint;</div><div class='del'>-</div><div class='del'>-	bio_chain(prev, new);</div><div class='del'>-	bio_get(prev);		/* for iomap_finish_ioend */</div><div class='del'>-	submit_bio(prev);</div><div class='del'>-	return new;</div><div class='del'>-}</div><div class='add'>+	u64 isize = i_size_read(inode);</div><div class='ctx'> </div><div class='del'>-static bool</div><div class='del'>-iomap_can_add_to_ioend(struct iomap_writepage_ctx *wpc, loff_t offset,</div><div class='del'>-		sector_t sector)</div><div class='del'>-{</div><div class='del'>-	if ((wpc-&gt;iomap.flags &amp; IOMAP_F_SHARED) !=</div><div class='del'>-	    (wpc-&gt;ioend-&gt;io_flags &amp; IOMAP_F_SHARED))</div><div class='del'>-		return false;</div><div class='del'>-	if (wpc-&gt;iomap.type != wpc-&gt;ioend-&gt;io_type)</div><div class='del'>-		return false;</div><div class='del'>-	if (offset != wpc-&gt;ioend-&gt;io_offset + wpc-&gt;ioend-&gt;io_size)</div><div class='del'>-		return false;</div><div class='del'>-	if (sector != bio_end_sector(wpc-&gt;ioend-&gt;io_bio))</div><div class='del'>-		return false;</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='add'>+	if (*end_pos &gt; isize) {</div><div class='add'>+		size_t poff = offset_in_folio(folio, isize);</div><div class='add'>+		pgoff_t end_index = isize &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Test to see if we have an existing ioend structure that we could append to</div><div class='del'>- * first; otherwise finish off the current ioend and start another.</div><div class='del'>- */</div><div class='del'>-static void</div><div class='del'>-iomap_add_to_ioend(struct inode *inode, loff_t offset, struct page *page,</div><div class='del'>-		struct iomap_page *iop, struct iomap_writepage_ctx *wpc,</div><div class='del'>-		struct writeback_control *wbc, struct list_head *iolist)</div><div class='del'>-{</div><div class='del'>-	sector_t sector = iomap_sector(&amp;wpc-&gt;iomap, offset);</div><div class='del'>-	unsigned len = i_blocksize(inode);</div><div class='del'>-	unsigned poff = offset &amp; (PAGE_SIZE - 1);</div><div class='del'>-</div><div class='del'>-	if (!wpc-&gt;ioend || !iomap_can_add_to_ioend(wpc, offset, sector)) {</div><div class='del'>-		if (wpc-&gt;ioend)</div><div class='del'>-			list_add(&amp;wpc-&gt;ioend-&gt;io_list, iolist);</div><div class='del'>-		wpc-&gt;ioend = iomap_alloc_ioend(inode, wpc, offset, sector, wbc);</div><div class='del'>-	}</div><div class='add'>+		/*</div><div class='add'>+		 * If the folio is entirely ouside of i_size, skip it.</div><div class='add'>+		 *</div><div class='add'>+		 * This can happen due to a truncate operation that is in</div><div class='add'>+		 * progress and in that case truncate will finish it off once</div><div class='add'>+		 * we've dropped the folio lock.</div><div class='add'>+		 *</div><div class='add'>+		 * Note that the pgoff_t used for end_index is an unsigned long.</div><div class='add'>+		 * If the given offset is greater than 16TB on a 32-bit system,</div><div class='add'>+		 * then if we checked if the folio is fully outside i_size with</div><div class='add'>+		 * "if (folio-&gt;index &gt;= end_index + 1)", "end_index + 1" would</div><div class='add'>+		 * overflow and evaluate to 0.  Hence this folio would be</div><div class='add'>+		 * redirtied and written out repeatedly, which would result in</div><div class='add'>+		 * an infinite loop; the user program performing this operation</div><div class='add'>+		 * would hang.  Instead, we can detect this situation by</div><div class='add'>+		 * checking if the folio is totally beyond i_size or if its</div><div class='add'>+		 * offset is just equal to the EOF.</div><div class='add'>+		 */</div><div class='add'>+		if (folio-&gt;index &gt; end_index ||</div><div class='add'>+		    (folio-&gt;index == end_index &amp;&amp; poff == 0))</div><div class='add'>+			return false;</div><div class='ctx'> </div><div class='del'>-	if (bio_add_page(wpc-&gt;ioend-&gt;io_bio, page, len, poff) != len) {</div><div class='del'>-		wpc-&gt;ioend-&gt;io_bio = iomap_chain_bio(wpc-&gt;ioend-&gt;io_bio);</div><div class='del'>-		__bio_add_page(wpc-&gt;ioend-&gt;io_bio, page, len, poff);</div><div class='add'>+		/*</div><div class='add'>+		 * The folio straddles i_size.</div><div class='add'>+		 *</div><div class='add'>+		 * It must be zeroed out on each and every writepage invocation</div><div class='add'>+		 * because it may be mmapped:</div><div class='add'>+		 *</div><div class='add'>+		 *    A file is mapped in multiples of the page size.  For a</div><div class='add'>+		 *    file that is not a multiple of the page size, the</div><div class='add'>+		 *    remaining memory is zeroed when mapped, and writes to that</div><div class='add'>+		 *    region are not written out to the file.</div><div class='add'>+		 *</div><div class='add'>+		 * Also adjust the end_pos to the end of file and skip writeback</div><div class='add'>+		 * for all blocks entirely beyond i_size.</div><div class='add'>+		 */</div><div class='add'>+		folio_zero_segment(folio, poff, folio_size(folio));</div><div class='add'>+		*end_pos = isize;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (iop)</div><div class='del'>-		atomic_add(len, &amp;iop-&gt;write_bytes_pending);</div><div class='del'>-	wpc-&gt;ioend-&gt;io_size += len;</div><div class='del'>-	wbc_account_cgroup_owner(wbc, page, len);</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * We implement an immediate ioend submission policy here to avoid needing to</div><div class='del'>- * chain multiple ioends and hence nest mempool allocations which can violate</div><div class='del'>- * the forward progress guarantees we need to provide. The current ioend we're</div><div class='del'>- * adding blocks to is cached in the writepage context, and if the new block</div><div class='del'>- * doesn't append to the cached ioend, it will create a new ioend and cache that</div><div class='del'>- * instead.</div><div class='del'>- *</div><div class='del'>- * If a new ioend is created and cached, the old ioend is returned and queued</div><div class='del'>- * locally for submission once the entire page is processed or an error has been</div><div class='del'>- * detected.  While ioends are submitted immediately after they are completed,</div><div class='del'>- * batching optimisations are provided by higher level block plugging.</div><div class='del'>- *</div><div class='del'>- * At the end of a writeback pass, there will be a cached ioend remaining on the</div><div class='del'>- * writepage context that the caller will need to submit.</div><div class='del'>- */</div><div class='del'>-static int</div><div class='del'>-iomap_writepage_map(struct iomap_writepage_ctx *wpc,</div><div class='del'>-		struct writeback_control *wbc, struct inode *inode,</div><div class='del'>-		struct page *page, u64 end_offset)</div><div class='add'>+int iomap_writeback_folio(struct iomap_writepage_ctx *wpc, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct iomap_page *iop = iomap_page_create(inode, page);</div><div class='del'>-	struct iomap_ioend *ioend, *next;</div><div class='del'>-	unsigned len = i_blocksize(inode);</div><div class='del'>-	u64 file_offset; /* file offset of page */</div><div class='del'>-	int error = 0, count = 0, i;</div><div class='del'>-	LIST_HEAD(submit_list);</div><div class='add'>+	struct iomap_folio_state *ifs = folio-&gt;private;</div><div class='add'>+	struct inode *inode = wpc-&gt;inode;</div><div class='add'>+	u64 pos = folio_pos(folio);</div><div class='add'>+	u64 end_pos = pos + folio_size(folio);</div><div class='add'>+	u64 end_aligned = 0;</div><div class='add'>+	size_t bytes_submitted = 0;</div><div class='add'>+	int error = 0;</div><div class='add'>+	u32 rlen;</div><div class='add'>+</div><div class='add'>+	WARN_ON_ONCE(!folio_test_locked(folio));</div><div class='add'>+	WARN_ON_ONCE(folio_test_dirty(folio));</div><div class='add'>+	WARN_ON_ONCE(folio_test_writeback(folio));</div><div class='add'>+</div><div class='add'>+	trace_iomap_writeback_folio(inode, pos, folio_size(folio));</div><div class='add'>+</div><div class='add'>+	if (!iomap_writeback_handle_eof(folio, inode, &amp;end_pos))</div><div class='add'>+		return 0;</div><div class='add'>+	WARN_ON_ONCE(end_pos &lt;= pos);</div><div class='ctx'> </div><div class='del'>-	WARN_ON_ONCE(iop &amp;&amp; atomic_read(&amp;iop-&gt;write_bytes_pending) != 0);</div><div class='add'>+	if (i_blocks_per_folio(inode, folio) &gt; 1) {</div><div class='add'>+		if (!ifs) {</div><div class='add'>+			ifs = ifs_alloc(inode, folio, 0);</div><div class='add'>+			iomap_set_range_dirty(folio, 0, end_pos - pos);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		iomap_writeback_init(inode, folio);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Walk through the page to find areas to write back. If we run off the</div><div class='del'>-	 * end of the current map or find the current map invalid, grab a new</div><div class='del'>-	 * one.</div><div class='add'>+	 * Set the writeback bit ASAP, as the I/O completion for the single</div><div class='add'>+	 * block per folio case happen hit as soon as we're submitting the bio.</div><div class='ctx'> 	 */</div><div class='del'>-	for (i = 0, file_offset = page_offset(page);</div><div class='del'>-	     i &lt; (PAGE_SIZE &gt;&gt; inode-&gt;i_blkbits) &amp;&amp; file_offset &lt; end_offset;</div><div class='del'>-	     i++, file_offset += len) {</div><div class='del'>-		if (iop &amp;&amp; !test_bit(i, iop-&gt;uptodate))</div><div class='del'>-			continue;</div><div class='add'>+	folio_start_writeback(folio);</div><div class='ctx'> </div><div class='del'>-		error = wpc-&gt;ops-&gt;map_blocks(wpc, inode, file_offset);</div><div class='add'>+	/*</div><div class='add'>+	 * Walk through the folio to find dirty areas to write back.</div><div class='add'>+	 */</div><div class='add'>+	end_aligned = round_up(end_pos, i_blocksize(inode));</div><div class='add'>+	while ((rlen = iomap_find_dirty_range(folio, &amp;pos, end_aligned))) {</div><div class='add'>+		error = iomap_writeback_range(wpc, folio, pos, rlen, end_pos,</div><div class='add'>+				&amp;bytes_submitted);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			break;</div><div class='del'>-		if (WARN_ON_ONCE(wpc-&gt;iomap.type == IOMAP_INLINE))</div><div class='del'>-			continue;</div><div class='del'>-		if (wpc-&gt;iomap.type == IOMAP_HOLE)</div><div class='del'>-			continue;</div><div class='del'>-		iomap_add_to_ioend(inode, file_offset, page, iop, wpc, wbc,</div><div class='del'>-				 &amp;submit_list);</div><div class='del'>-		count++;</div><div class='add'>+		pos += rlen;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	WARN_ON_ONCE(!wpc-&gt;ioend &amp;&amp; !list_empty(&amp;submit_list));</div><div class='del'>-	WARN_ON_ONCE(!PageLocked(page));</div><div class='del'>-	WARN_ON_ONCE(PageWriteback(page));</div><div class='del'>-	WARN_ON_ONCE(PageDirty(page));</div><div class='add'>+	if (bytes_submitted)</div><div class='add'>+		wpc-&gt;nr_folios++;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * We cannot cancel the ioend directly here on error.  We may have</div><div class='del'>-	 * already set other pages under writeback and hence we have to run I/O</div><div class='del'>-	 * completion to mark the error state of the pages under writeback</div><div class='del'>-	 * appropriately.</div><div class='add'>+	 * We can have dirty bits set past end of file in page_mkwrite path</div><div class='add'>+	 * while mapping the last partial folio. Hence it's better to clear</div><div class='add'>+	 * all the dirty bits in the folio here.</div><div class='ctx'> 	 */</div><div class='del'>-	if (unlikely(error)) {</div><div class='del'>-		/*</div><div class='del'>-		 * Let the filesystem know what portion of the current page</div><div class='del'>-		 * failed to map. If the page hasn't been added to ioend, it</div><div class='del'>-		 * won't be affected by I/O completion and we must unlock it</div><div class='del'>-		 * now.</div><div class='del'>-		 */</div><div class='del'>-		if (wpc-&gt;ops-&gt;discard_page)</div><div class='del'>-			wpc-&gt;ops-&gt;discard_page(page, file_offset);</div><div class='del'>-		if (!count) {</div><div class='del'>-			ClearPageUptodate(page);</div><div class='del'>-			unlock_page(page);</div><div class='del'>-			goto done;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	set_page_writeback(page);</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	iomap_clear_range_dirty(folio, 0, folio_size(folio));</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Preserve the original error if there was one; catch</div><div class='del'>-	 * submission errors here and propagate into subsequent ioend</div><div class='del'>-	 * submissions.</div><div class='add'>+	 * Usually the writeback bit is cleared by the I/O completion handler.</div><div class='add'>+	 * But we may end up either not actually writing any blocks, or (when</div><div class='add'>+	 * there are multiple blocks in a folio) all I/O might have finished</div><div class='add'>+	 * already at this point.  In that case we need to clear the writeback</div><div class='add'>+	 * bit ourselves right after unlocking the page.</div><div class='ctx'> 	 */</div><div class='del'>-	list_for_each_entry_safe(ioend, next, &amp;submit_list, io_list) {</div><div class='del'>-		int error2;</div><div class='del'>-</div><div class='del'>-		list_del_init(&amp;ioend-&gt;io_list);</div><div class='del'>-		error2 = iomap_submit_ioend(wpc, ioend, error);</div><div class='del'>-		if (error2 &amp;&amp; !error)</div><div class='del'>-			error = error2;</div><div class='add'>+	if (ifs) {</div><div class='add'>+		/*</div><div class='add'>+		 * Subtract any bytes that were initially accounted to</div><div class='add'>+		 * write_bytes_pending but skipped for writeback.</div><div class='add'>+		 */</div><div class='add'>+		size_t bytes_not_submitted = folio_size(folio) -</div><div class='add'>+				bytes_submitted;</div><div class='add'>+</div><div class='add'>+		if (bytes_not_submitted)</div><div class='add'>+			iomap_finish_folio_write(inode, folio,</div><div class='add'>+					bytes_not_submitted);</div><div class='add'>+	} else if (!bytes_submitted) {</div><div class='add'>+		folio_end_writeback(folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * We can end up here with no error and nothing to write only if we race</div><div class='del'>-	 * with a partial page truncate on a sub-page block sized filesystem.</div><div class='del'>-	 */</div><div class='del'>-	if (!count)</div><div class='del'>-		end_page_writeback(page);</div><div class='del'>-done:</div><div class='del'>-	mapping_set_error(page-&gt;mapping, error);</div><div class='add'>+	mapping_set_error(inode-&gt;i_mapping, error);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL_GPL(iomap_writeback_folio);</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Write out a dirty page.</div><div class='del'>- *</div><div class='del'>- * For delalloc space on the page, we need to allocate space and flush it.</div><div class='del'>- * For unwritten space on the page, we need to start the conversion to</div><div class='del'>- * regular allocated space.</div><div class='del'>- */</div><div class='del'>-static int</div><div class='del'>-iomap_do_writepage(struct page *page, struct writeback_control *wbc, void *data)</div><div class='add'>+int</div><div class='add'>+iomap_writepages(struct iomap_writepage_ctx *wpc)</div><div class='ctx'> {</div><div class='del'>-	struct iomap_writepage_ctx *wpc = data;</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-	pgoff_t end_index;</div><div class='del'>-	u64 end_offset;</div><div class='del'>-	loff_t offset;</div><div class='del'>-</div><div class='del'>-	trace_iomap_writepage(inode, page_offset(page), PAGE_SIZE);</div><div class='add'>+	struct address_space *mapping = wpc-&gt;inode-&gt;i_mapping;</div><div class='add'>+	struct folio *folio = NULL;</div><div class='add'>+	int error;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Refuse to write the page out if we're called from reclaim context.</div><div class='del'>-	 *</div><div class='del'>-	 * This avoids stack overflows when called from deeply used stacks in</div><div class='del'>-	 * random callers for direct reclaim or memcg reclaim.  We explicitly</div><div class='del'>-	 * allow reclaim from kswapd as the stack usage there is relatively low.</div><div class='del'>-	 *</div><div class='del'>-	 * This should never happen except in the case of a VM regression so</div><div class='del'>-	 * warn about it.</div><div class='add'>+	 * Writeback from reclaim context should never happen except in the case</div><div class='add'>+	 * of a VM regression so warn about it and refuse to write the data.</div><div class='ctx'> 	 */</div><div class='del'>-	if (WARN_ON_ONCE((current-&gt;flags &amp; (PF_MEMALLOC|PF_KSWAPD)) ==</div><div class='add'>+	if (WARN_ON_ONCE((current-&gt;flags &amp; (PF_MEMALLOC | PF_KSWAPD)) ==</div><div class='ctx'> 			PF_MEMALLOC))</div><div class='del'>-		goto redirty;</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	while ((folio = writeback_iter(mapping, wpc-&gt;wbc, folio, &amp;error))) {</div><div class='add'>+		error = iomap_writeback_folio(wpc, folio);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Is this page beyond the end of the file?</div><div class='add'>+	 * If @error is non-zero, it means that we have a situation where some</div><div class='add'>+	 * part of the submission process has failed after we've marked pages</div><div class='add'>+	 * for writeback.</div><div class='ctx'> 	 *</div><div class='del'>-	 * The page index is less than the end_index, adjust the end_offset</div><div class='del'>-	 * to the highest offset that this page should represent.</div><div class='del'>-	 * -----------------------------------------------------</div><div class='del'>-	 * |			file mapping	       | &lt;EOF&gt; |</div><div class='del'>-	 * -----------------------------------------------------</div><div class='del'>-	 * | Page ... | Page N-2 | Page N-1 |  Page N  |       |</div><div class='del'>-	 * ^--------------------------------^----------|--------</div><div class='del'>-	 * |     desired writeback range    |      see else    |</div><div class='del'>-	 * ---------------------------------^------------------|</div><div class='add'>+	 * We cannot cancel the writeback directly in that case, so always call</div><div class='add'>+	 * -&gt;writeback_submit to run the I/O completion handler to clear the</div><div class='add'>+	 * writeback bit and let the file system proess the errors.</div><div class='ctx'> 	 */</div><div class='del'>-	offset = i_size_read(inode);</div><div class='del'>-	end_index = offset &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	if (page-&gt;index &lt; end_index)</div><div class='del'>-		end_offset = (loff_t)(page-&gt;index + 1) &lt;&lt; PAGE_SHIFT;</div><div class='del'>-	else {</div><div class='del'>-		/*</div><div class='del'>-		 * Check whether the page to write out is beyond or straddles</div><div class='del'>-		 * i_size or not.</div><div class='del'>-		 * -------------------------------------------------------</div><div class='del'>-		 * |		file mapping		        | &lt;EOF&gt;  |</div><div class='del'>-		 * -------------------------------------------------------</div><div class='del'>-		 * | Page ... | Page N-2 | Page N-1 |  Page N   | Beyond |</div><div class='del'>-		 * ^--------------------------------^-----------|---------</div><div class='del'>-		 * |				    |      Straddles     |</div><div class='del'>-		 * ---------------------------------^-----------|--------|</div><div class='del'>-		 */</div><div class='del'>-		unsigned offset_into_page = offset &amp; (PAGE_SIZE - 1);</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Skip the page if it's fully outside i_size, e.g. due to a</div><div class='del'>-		 * truncate operation that's in progress. We must redirty the</div><div class='del'>-		 * page so that reclaim stops reclaiming it. Otherwise</div><div class='del'>-		 * iomap_vm_releasepage() is called on it and gets confused.</div><div class='del'>-		 *</div><div class='del'>-		 * Note that the end_index is unsigned long.  If the given</div><div class='del'>-		 * offset is greater than 16TB on a 32-bit system then if we</div><div class='del'>-		 * checked if the page is fully outside i_size with</div><div class='del'>-		 * "if (page-&gt;index &gt;= end_index + 1)", "end_index + 1" would</div><div class='del'>-		 * overflow and evaluate to 0.  Hence this page would be</div><div class='del'>-		 * redirtied and written out repeatedly, which would result in</div><div class='del'>-		 * an infinite loop; the user program performing this operation</div><div class='del'>-		 * would hang.  Instead, we can detect this situation by</div><div class='del'>-		 * checking if the page is totally beyond i_size or if its</div><div class='del'>-		 * offset is just equal to the EOF.</div><div class='del'>-		 */</div><div class='del'>-		if (page-&gt;index &gt; end_index ||</div><div class='del'>-		    (page-&gt;index == end_index &amp;&amp; offset_into_page == 0))</div><div class='del'>-			goto redirty;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * The page straddles i_size.  It must be zeroed out on each</div><div class='del'>-		 * and every writepage invocation because it may be mmapped.</div><div class='del'>-		 * "A file is mapped in multiples of the page size.  For a file</div><div class='del'>-		 * that is not a multiple of the page size, the remaining</div><div class='del'>-		 * memory is zeroed when mapped, and writes to that region are</div><div class='del'>-		 * not written out to the file."</div><div class='del'>-		 */</div><div class='del'>-		zero_user_segment(page, offset_into_page, PAGE_SIZE);</div><div class='del'>-</div><div class='del'>-		/* Adjust the end_offset to the end of file */</div><div class='del'>-		end_offset = offset;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return iomap_writepage_map(wpc, wbc, inode, page, end_offset);</div><div class='del'>-</div><div class='del'>-redirty:</div><div class='del'>-	redirty_page_for_writepage(wbc, page);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int</div><div class='del'>-iomap_writepage(struct page *page, struct writeback_control *wbc,</div><div class='del'>-		struct iomap_writepage_ctx *wpc,</div><div class='del'>-		const struct iomap_writeback_ops *ops)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	wpc-&gt;ops = ops;</div><div class='del'>-	ret = iomap_do_writepage(page, wbc, wpc);</div><div class='del'>-	if (!wpc-&gt;ioend)</div><div class='del'>-		return ret;</div><div class='del'>-	return iomap_submit_ioend(wpc, wpc-&gt;ioend, ret);</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL_GPL(iomap_writepage);</div><div class='del'>-</div><div class='del'>-int</div><div class='del'>-iomap_writepages(struct address_space *mapping, struct writeback_control *wbc,</div><div class='del'>-		struct iomap_writepage_ctx *wpc,</div><div class='del'>-		const struct iomap_writeback_ops *ops)</div><div class='del'>-{</div><div class='del'>-	int			ret;</div><div class='del'>-</div><div class='del'>-	wpc-&gt;ops = ops;</div><div class='del'>-	ret = write_cache_pages(mapping, wbc, iomap_do_writepage, wpc);</div><div class='del'>-	if (!wpc-&gt;ioend)</div><div class='del'>-		return ret;</div><div class='del'>-	return iomap_submit_ioend(wpc, wpc-&gt;ioend, ret);</div><div class='add'>+	if (wpc-&gt;wb_ctx)</div><div class='add'>+		return wpc-&gt;ops-&gt;writeback_submit(wpc, error);</div><div class='add'>+	return error;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(iomap_writepages);</div><div class='del'>-</div><div class='del'>-static int __init iomap_init(void)</div><div class='del'>-{</div><div class='del'>-	return bioset_init(&amp;iomap_ioend_bioset, 4 * (PAGE_SIZE / SECTOR_SIZE),</div><div class='del'>-			   offsetof(struct iomap_ioend, io_inline_bio),</div><div class='del'>-			   BIOSET_NEED_BVECS);</div><div class='del'>-}</div><div class='del'>-fs_initcall(iomap_init);</div><div class='head'>diff --git a/fs/iomap/direct-io.c b/fs/iomap/direct-io.c<br/>index b4dc51063d36..8e273408453a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/iomap/direct-io.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/iomap/direct-io.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/iomap/direct-io.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/iomap/direct-io.c</a></div><div class='hunk'>@@ -1,15 +1,13 @@</div><div class='ctx'> // SPDX-License-Identifier: GPL-2.0</div><div class='ctx'> /*</div><div class='ctx'>  * Copyright (C) 2010 Red Hat, Inc.</div><div class='del'>- * Copyright (c) 2016-2021 Christoph Hellwig.</div><div class='add'>+ * Copyright (c) 2016-2025 Christoph Hellwig.</div><div class='ctx'>  */</div><div class='del'>-#include &lt;linux/module.h&gt;</div><div class='del'>-#include &lt;linux/compiler.h&gt;</div><div class='del'>-#include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/fscrypt.h&gt;</div><div class='add'>+#include &lt;linux/pagemap.h&gt;</div><div class='ctx'> #include &lt;linux/iomap.h&gt;</div><div class='del'>-#include &lt;linux/backing-dev.h&gt;</div><div class='del'>-#include &lt;linux/uio.h&gt;</div><div class='ctx'> #include &lt;linux/task_io_accounting_ops.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='ctx'> #include "trace.h"</div><div class='ctx'> </div><div class='ctx'> #include "../internal.h"</div><div class='hunk'>@@ -18,10 +16,12 @@</div><div class='ctx'>  * Private flags for iomap_dio, must not overlap with the public ones in</div><div class='ctx'>  * iomap.h:</div><div class='ctx'>  */</div><div class='del'>-#define IOMAP_DIO_WRITE_FUA	(1 &lt;&lt; 28)</div><div class='del'>-#define IOMAP_DIO_NEED_SYNC	(1 &lt;&lt; 29)</div><div class='del'>-#define IOMAP_DIO_WRITE		(1 &lt;&lt; 30)</div><div class='del'>-#define IOMAP_DIO_DIRTY		(1 &lt;&lt; 31)</div><div class='add'>+#define IOMAP_DIO_NO_INVALIDATE	(1U &lt;&lt; 26)</div><div class='add'>+#define IOMAP_DIO_COMP_WORK	(1U &lt;&lt; 27)</div><div class='add'>+#define IOMAP_DIO_WRITE_THROUGH	(1U &lt;&lt; 28)</div><div class='add'>+#define IOMAP_DIO_NEED_SYNC	(1U &lt;&lt; 29)</div><div class='add'>+#define IOMAP_DIO_WRITE		(1U &lt;&lt; 30)</div><div class='add'>+#define IOMAP_DIO_DIRTY		(1U &lt;&lt; 31)</div><div class='ctx'> </div><div class='ctx'> struct iomap_dio {</div><div class='ctx'> 	struct kiocb		*iocb;</div><div class='hunk'>@@ -39,7 +39,6 @@ struct iomap_dio {</div><div class='ctx'> 		struct {</div><div class='ctx'> 			struct iov_iter		*iter;</div><div class='ctx'> 			struct task_struct	*waiter;</div><div class='del'>-			struct bio		*poll_bio;</div><div class='ctx'> 		} submit;</div><div class='ctx'> </div><div class='ctx'> 		/* used for aio completion: */</div><div class='hunk'>@@ -49,27 +48,40 @@ struct iomap_dio {</div><div class='ctx'> 	};</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+static struct bio *iomap_dio_alloc_bio(const struct iomap_iter *iter,</div><div class='add'>+		struct iomap_dio *dio, unsigned short nr_vecs, blk_opf_t opf)</div><div class='add'>+{</div><div class='add'>+	if (dio-&gt;dops &amp;&amp; dio-&gt;dops-&gt;bio_set)</div><div class='add'>+		return bio_alloc_bioset(iter-&gt;iomap.bdev, nr_vecs, opf,</div><div class='add'>+					GFP_KERNEL, dio-&gt;dops-&gt;bio_set);</div><div class='add'>+	return bio_alloc(iter-&gt;iomap.bdev, nr_vecs, opf, GFP_KERNEL);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void iomap_dio_submit_bio(const struct iomap_iter *iter,</div><div class='ctx'> 		struct iomap_dio *dio, struct bio *bio, loff_t pos)</div><div class='ctx'> {</div><div class='add'>+	struct kiocb *iocb = dio-&gt;iocb;</div><div class='add'>+</div><div class='ctx'> 	atomic_inc(&amp;dio-&gt;ref);</div><div class='ctx'> </div><div class='del'>-	if (dio-&gt;iocb-&gt;ki_flags &amp; IOCB_HIPRI) {</div><div class='del'>-		bio_set_polled(bio, dio-&gt;iocb);</div><div class='del'>-		dio-&gt;submit.poll_bio = bio;</div><div class='add'>+	/* Sync dio can't be polled reliably */</div><div class='add'>+	if ((iocb-&gt;ki_flags &amp; IOCB_HIPRI) &amp;&amp; !is_sync_kiocb(iocb)) {</div><div class='add'>+		bio_set_polled(bio, iocb);</div><div class='add'>+		WRITE_ONCE(iocb-&gt;private, bio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (dio-&gt;dops &amp;&amp; dio-&gt;dops-&gt;submit_io)</div><div class='add'>+	if (dio-&gt;dops &amp;&amp; dio-&gt;dops-&gt;submit_io) {</div><div class='ctx'> 		dio-&gt;dops-&gt;submit_io(iter, bio, pos);</div><div class='del'>-	else</div><div class='add'>+	} else {</div><div class='add'>+		WARN_ON_ONCE(iter-&gt;iomap.flags &amp; IOMAP_F_ANON_WRITE);</div><div class='ctx'> 		submit_bio(bio);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> ssize_t iomap_dio_complete(struct iomap_dio *dio)</div><div class='ctx'> {</div><div class='ctx'> 	const struct iomap_dio_ops *dops = dio-&gt;dops;</div><div class='ctx'> 	struct kiocb *iocb = dio-&gt;iocb;</div><div class='del'>-	struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='ctx'> 	loff_t offset = iocb-&gt;ki_pos;</div><div class='ctx'> 	ssize_t ret = dio-&gt;error;</div><div class='ctx'> </div><div class='hunk'>@@ -82,7 +94,6 @@ ssize_t iomap_dio_complete(struct iomap_dio *dio)</div><div class='ctx'> 		if (offset + ret &gt; dio-&gt;i_size &amp;&amp;</div><div class='ctx'> 		    !(dio-&gt;flags &amp; IOMAP_DIO_WRITE))</div><div class='ctx'> 			ret = dio-&gt;i_size - offset;</div><div class='del'>-		iocb-&gt;ki_pos += ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -97,29 +108,26 @@ ssize_t iomap_dio_complete(struct iomap_dio *dio)</div><div class='ctx'> 	 * -&gt;end_io() when necessary, otherwise a racing buffer read would cache</div><div class='ctx'> 	 * zeros from unwritten extents.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!dio-&gt;error &amp;&amp; dio-&gt;size &amp;&amp;</div><div class='del'>-	    (dio-&gt;flags &amp; IOMAP_DIO_WRITE) &amp;&amp; inode-&gt;i_mapping-&gt;nrpages) {</div><div class='del'>-		int err;</div><div class='del'>-		err = invalidate_inode_pages2_range(inode-&gt;i_mapping,</div><div class='del'>-				offset &gt;&gt; PAGE_SHIFT,</div><div class='del'>-				(offset + dio-&gt;size - 1) &gt;&gt; PAGE_SHIFT);</div><div class='del'>-		if (err)</div><div class='del'>-			dio_warn_stale_pagecache(iocb-&gt;ki_filp);</div><div class='del'>-	}</div><div class='add'>+	if (!dio-&gt;error &amp;&amp; dio-&gt;size &amp;&amp; (dio-&gt;flags &amp; IOMAP_DIO_WRITE) &amp;&amp;</div><div class='add'>+	    !(dio-&gt;flags &amp; IOMAP_DIO_NO_INVALIDATE))</div><div class='add'>+		kiocb_invalidate_post_direct_write(iocb, dio-&gt;size);</div><div class='ctx'> </div><div class='ctx'> 	inode_dio_end(file_inode(iocb-&gt;ki_filp));</div><div class='del'>-	/*</div><div class='del'>-	 * If this is a DSYNC write, make sure we push it to stable storage now</div><div class='del'>-	 * that we've written data.</div><div class='del'>-	 */</div><div class='del'>-	if (ret &gt; 0 &amp;&amp; (dio-&gt;flags &amp; IOMAP_DIO_NEED_SYNC))</div><div class='del'>-		ret = generic_write_sync(iocb, ret);</div><div class='ctx'> </div><div class='del'>-	if (ret &gt; 0)</div><div class='del'>-		ret += dio-&gt;done_before;</div><div class='add'>+	if (ret &gt; 0) {</div><div class='add'>+		iocb-&gt;ki_pos += ret;</div><div class='ctx'> </div><div class='add'>+		/*</div><div class='add'>+		 * If this is a DSYNC write, make sure we push it to stable</div><div class='add'>+		 * storage now that we've written data.</div><div class='add'>+		 */</div><div class='add'>+		if (dio-&gt;flags &amp; IOMAP_DIO_NEED_SYNC)</div><div class='add'>+			ret = generic_write_sync(iocb, ret);</div><div class='add'>+		if (ret &gt; 0)</div><div class='add'>+			ret += dio-&gt;done_before;</div><div class='add'>+	}</div><div class='add'>+	trace_iomap_dio_complete(iocb, dio-&gt;error, ret);</div><div class='ctx'> 	kfree(dio);</div><div class='del'>-</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(iomap_dio_complete);</div><div class='hunk'>@@ -142,7 +150,67 @@ static inline void iomap_dio_set_error(struct iomap_dio *dio, int ret)</div><div class='ctx'> 	cmpxchg(&amp;dio-&gt;error, 0, ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void iomap_dio_bio_end_io(struct bio *bio)</div><div class='add'>+/*</div><div class='add'>+ * Called when dio-&gt;ref reaches zero from an I/O completion.</div><div class='add'>+ */</div><div class='add'>+static void iomap_dio_done(struct iomap_dio *dio)</div><div class='add'>+{</div><div class='add'>+	struct kiocb *iocb = dio-&gt;iocb;</div><div class='add'>+</div><div class='add'>+	if (dio-&gt;wait_for_completion) {</div><div class='add'>+		/*</div><div class='add'>+		 * Synchronous I/O, task itself will handle any completion work</div><div class='add'>+		 * that needs after IO. All we need to do is wake the task.</div><div class='add'>+		 */</div><div class='add'>+		struct task_struct *waiter = dio-&gt;submit.waiter;</div><div class='add'>+</div><div class='add'>+		WRITE_ONCE(dio-&gt;submit.waiter, NULL);</div><div class='add'>+		blk_wake_io_task(waiter);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Always run error completions in user context.  These are not</div><div class='add'>+	 * performance critical and some code relies on taking sleeping locks</div><div class='add'>+	 * for error handling.</div><div class='add'>+	 */</div><div class='add'>+	if (dio-&gt;error)</div><div class='add'>+		dio-&gt;flags |= IOMAP_DIO_COMP_WORK;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Never invalidate pages from this context to avoid deadlocks with</div><div class='add'>+	 * buffered I/O completions when called from the ioend workqueue,</div><div class='add'>+	 * or avoid sleeping when called directly from -&gt;bi_end_io.</div><div class='add'>+	 * Tough luck if you hit the tiny race with someone dirtying the range</div><div class='add'>+	 * right between this check and the actual completion.</div><div class='add'>+	 */</div><div class='add'>+	if ((dio-&gt;flags &amp; IOMAP_DIO_WRITE) &amp;&amp;</div><div class='add'>+	    !(dio-&gt;flags &amp; IOMAP_DIO_COMP_WORK)) {</div><div class='add'>+		if (dio-&gt;iocb-&gt;ki_filp-&gt;f_mapping-&gt;nrpages)</div><div class='add'>+			dio-&gt;flags |= IOMAP_DIO_COMP_WORK;</div><div class='add'>+		else</div><div class='add'>+			dio-&gt;flags |= IOMAP_DIO_NO_INVALIDATE;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (dio-&gt;flags &amp; IOMAP_DIO_COMP_WORK) {</div><div class='add'>+		struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Async DIO completion that requires filesystem level</div><div class='add'>+		 * completion work gets punted to a work queue to complete as</div><div class='add'>+		 * the operation may require more IO to be issued to finalise</div><div class='add'>+		 * filesystem metadata changes or guarantee data integrity.</div><div class='add'>+		 */</div><div class='add'>+		INIT_WORK(&amp;dio-&gt;aio.work, iomap_dio_complete_work);</div><div class='add'>+		queue_work(inode-&gt;i_sb-&gt;s_dio_done_wq, &amp;dio-&gt;aio.work);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	WRITE_ONCE(iocb-&gt;private, NULL);</div><div class='add'>+	iomap_dio_complete_work(&amp;dio-&gt;aio.work);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void iomap_dio_bio_end_io(struct bio *bio)</div><div class='ctx'> {</div><div class='ctx'> 	struct iomap_dio *dio = bio-&gt;bi_private;</div><div class='ctx'> 	bool should_dirty = (dio-&gt;flags &amp; IOMAP_DIO_DIRTY);</div><div class='hunk'>@@ -150,22 +218,8 @@ static void iomap_dio_bio_end_io(struct bio *bio)</div><div class='ctx'> 	if (bio-&gt;bi_status)</div><div class='ctx'> 		iomap_dio_set_error(dio, blk_status_to_errno(bio-&gt;bi_status));</div><div class='ctx'> </div><div class='del'>-	if (atomic_dec_and_test(&amp;dio-&gt;ref)) {</div><div class='del'>-		if (dio-&gt;wait_for_completion) {</div><div class='del'>-			struct task_struct *waiter = dio-&gt;submit.waiter;</div><div class='del'>-			WRITE_ONCE(dio-&gt;submit.waiter, NULL);</div><div class='del'>-			blk_wake_io_task(waiter);</div><div class='del'>-		} else if (dio-&gt;flags &amp; IOMAP_DIO_WRITE) {</div><div class='del'>-			struct inode *inode = file_inode(dio-&gt;iocb-&gt;ki_filp);</div><div class='del'>-</div><div class='del'>-			WRITE_ONCE(dio-&gt;iocb-&gt;private, NULL);</div><div class='del'>-			INIT_WORK(&amp;dio-&gt;aio.work, iomap_dio_complete_work);</div><div class='del'>-			queue_work(inode-&gt;i_sb-&gt;s_dio_done_wq, &amp;dio-&gt;aio.work);</div><div class='del'>-		} else {</div><div class='del'>-			WRITE_ONCE(dio-&gt;iocb-&gt;private, NULL);</div><div class='del'>-			iomap_dio_complete_work(&amp;dio-&gt;aio.work);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	if (atomic_dec_and_test(&amp;dio-&gt;ref))</div><div class='add'>+		iomap_dio_done(dio);</div><div class='ctx'> </div><div class='ctx'> 	if (should_dirty) {</div><div class='ctx'> 		bio_check_pages_dirty(bio);</div><div class='hunk'>@@ -174,97 +228,187 @@ static void iomap_dio_bio_end_io(struct bio *bio)</div><div class='ctx'> 		bio_put(bio);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL_GPL(iomap_dio_bio_end_io);</div><div class='ctx'> </div><div class='del'>-static void iomap_dio_zero(const struct iomap_iter *iter, struct iomap_dio *dio,</div><div class='add'>+u32 iomap_finish_ioend_direct(struct iomap_ioend *ioend)</div><div class='add'>+{</div><div class='add'>+	struct iomap_dio *dio = ioend-&gt;io_bio.bi_private;</div><div class='add'>+	bool should_dirty = (dio-&gt;flags &amp; IOMAP_DIO_DIRTY);</div><div class='add'>+	u32 vec_count = ioend-&gt;io_bio.bi_vcnt;</div><div class='add'>+</div><div class='add'>+	if (ioend-&gt;io_error)</div><div class='add'>+		iomap_dio_set_error(dio, ioend-&gt;io_error);</div><div class='add'>+</div><div class='add'>+	if (atomic_dec_and_test(&amp;dio-&gt;ref)) {</div><div class='add'>+		/*</div><div class='add'>+		 * Try to avoid another context switch for the completion given</div><div class='add'>+		 * that we are already called from the ioend completion</div><div class='add'>+		 * workqueue.</div><div class='add'>+		 */</div><div class='add'>+		dio-&gt;flags &amp;= ~IOMAP_DIO_COMP_WORK;</div><div class='add'>+		iomap_dio_done(dio);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (should_dirty) {</div><div class='add'>+		bio_check_pages_dirty(&amp;ioend-&gt;io_bio);</div><div class='add'>+	} else {</div><div class='add'>+		bio_release_pages(&amp;ioend-&gt;io_bio, false);</div><div class='add'>+		bio_put(&amp;ioend-&gt;io_bio);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Return the number of bvecs completed as even direct I/O completions</div><div class='add'>+	 * do significant per-folio work and we'll still want to give up the</div><div class='add'>+	 * CPU after a lot of completions.</div><div class='add'>+	 */</div><div class='add'>+	return vec_count;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int iomap_dio_zero(const struct iomap_iter *iter, struct iomap_dio *dio,</div><div class='ctx'> 		loff_t pos, unsigned len)</div><div class='ctx'> {</div><div class='del'>-	struct page *page = ZERO_PAGE(0);</div><div class='del'>-	int flags = REQ_SYNC | REQ_IDLE;</div><div class='add'>+	struct inode *inode = file_inode(dio-&gt;iocb-&gt;ki_filp);</div><div class='ctx'> 	struct bio *bio;</div><div class='add'>+	struct folio *zero_folio = largest_zero_folio();</div><div class='add'>+	int nr_vecs = max(1, i_blocksize(inode) / folio_size(zero_folio));</div><div class='add'>+</div><div class='add'>+	if (!len)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * This limit shall never be reached as most filesystems have a</div><div class='add'>+	 * maximum blocksize of 64k.</div><div class='add'>+	 */</div><div class='add'>+	if (WARN_ON_ONCE(nr_vecs &gt; BIO_MAX_VECS))</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	bio = bio_alloc(GFP_KERNEL, 1);</div><div class='del'>-	bio_set_dev(bio, iter-&gt;iomap.bdev);</div><div class='add'>+	bio = iomap_dio_alloc_bio(iter, dio, nr_vecs,</div><div class='add'>+				  REQ_OP_WRITE | REQ_SYNC | REQ_IDLE);</div><div class='add'>+	fscrypt_set_bio_crypt_ctx(bio, inode, pos &gt;&gt; inode-&gt;i_blkbits,</div><div class='add'>+				  GFP_KERNEL);</div><div class='ctx'> 	bio-&gt;bi_iter.bi_sector = iomap_sector(&amp;iter-&gt;iomap, pos);</div><div class='ctx'> 	bio-&gt;bi_private = dio;</div><div class='ctx'> 	bio-&gt;bi_end_io = iomap_dio_bio_end_io;</div><div class='ctx'> </div><div class='del'>-	get_page(page);</div><div class='del'>-	__bio_add_page(bio, page, len, 0);</div><div class='del'>-	bio_set_op_attrs(bio, REQ_OP_WRITE, flags);</div><div class='del'>-	iomap_dio_submit_bio(iter, dio, bio, pos);</div><div class='del'>-}</div><div class='add'>+	while (len &gt; 0) {</div><div class='add'>+		unsigned int io_len = min(len, folio_size(zero_folio));</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Figure out the bio's operation flags from the dio request, the</div><div class='del'>- * mapping, and whether or not we want FUA.  Note that we can end up</div><div class='del'>- * clearing the WRITE_FUA flag in the dio request.</div><div class='del'>- */</div><div class='del'>-static inline unsigned int iomap_dio_bio_opflags(struct iomap_dio *dio,</div><div class='del'>-		const struct iomap *iomap, bool use_fua)</div><div class='del'>-{</div><div class='del'>-	unsigned int opflags = REQ_SYNC | REQ_IDLE;</div><div class='del'>-</div><div class='del'>-	if (!(dio-&gt;flags &amp; IOMAP_DIO_WRITE)) {</div><div class='del'>-		WARN_ON_ONCE(iomap-&gt;flags &amp; IOMAP_F_ZONE_APPEND);</div><div class='del'>-		return REQ_OP_READ;</div><div class='add'>+		bio_add_folio_nofail(bio, zero_folio, io_len, 0);</div><div class='add'>+		len -= io_len;</div><div class='ctx'> 	}</div><div class='add'>+	iomap_dio_submit_bio(iter, dio, bio, pos);</div><div class='ctx'> </div><div class='del'>-	if (iomap-&gt;flags &amp; IOMAP_F_ZONE_APPEND)</div><div class='del'>-		opflags |= REQ_OP_ZONE_APPEND;</div><div class='del'>-	else</div><div class='del'>-		opflags |= REQ_OP_WRITE;</div><div class='del'>-</div><div class='del'>-	if (use_fua)</div><div class='del'>-		opflags |= REQ_FUA;</div><div class='del'>-	else</div><div class='del'>-		dio-&gt;flags &amp;= ~IOMAP_DIO_WRITE_FUA;</div><div class='del'>-</div><div class='del'>-	return opflags;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static loff_t iomap_dio_bio_iter(const struct iomap_iter *iter,</div><div class='del'>-		struct iomap_dio *dio)</div><div class='add'>+static int iomap_dio_bio_iter(struct iomap_iter *iter, struct iomap_dio *dio)</div><div class='ctx'> {</div><div class='ctx'> 	const struct iomap *iomap = &amp;iter-&gt;iomap;</div><div class='ctx'> 	struct inode *inode = iter-&gt;inode;</div><div class='del'>-	unsigned int blkbits = blksize_bits(bdev_logical_block_size(iomap-&gt;bdev));</div><div class='ctx'> 	unsigned int fs_block_size = i_blocksize(inode), pad;</div><div class='del'>-	unsigned int align = iov_iter_alignment(dio-&gt;submit.iter);</div><div class='del'>-	loff_t length = iomap_length(iter);</div><div class='add'>+	const loff_t length = iomap_length(iter);</div><div class='ctx'> 	loff_t pos = iter-&gt;pos;</div><div class='del'>-	unsigned int bio_opf;</div><div class='add'>+	blk_opf_t bio_opf = REQ_SYNC | REQ_IDLE;</div><div class='ctx'> 	struct bio *bio;</div><div class='ctx'> 	bool need_zeroout = false;</div><div class='del'>-	bool use_fua = false;</div><div class='ctx'> 	int nr_pages, ret = 0;</div><div class='del'>-	size_t copied = 0;</div><div class='add'>+	u64 copied = 0;</div><div class='ctx'> 	size_t orig_count;</div><div class='add'>+	unsigned int alignment;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * File systems that write out of place and always allocate new blocks</div><div class='add'>+	 * need each bio to be block aligned as that's the unit of allocation.</div><div class='add'>+	 */</div><div class='add'>+	if (dio-&gt;flags &amp; IOMAP_DIO_FSBLOCK_ALIGNED)</div><div class='add'>+		alignment = fs_block_size;</div><div class='add'>+	else</div><div class='add'>+		alignment = bdev_logical_block_size(iomap-&gt;bdev);</div><div class='ctx'> </div><div class='del'>-	if ((pos | length | align) &amp; ((1 &lt;&lt; blkbits) - 1))</div><div class='add'>+	if ((pos | length) &amp; (alignment - 1))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	if (iomap-&gt;type == IOMAP_UNWRITTEN) {</div><div class='del'>-		dio-&gt;flags |= IOMAP_DIO_UNWRITTEN;</div><div class='del'>-		need_zeroout = true;</div><div class='del'>-	}</div><div class='add'>+	if (dio-&gt;flags &amp; IOMAP_DIO_WRITE) {</div><div class='add'>+		bool need_completion_work = true;</div><div class='ctx'> </div><div class='del'>-	if (iomap-&gt;flags &amp; IOMAP_F_SHARED)</div><div class='del'>-		dio-&gt;flags |= IOMAP_DIO_COW;</div><div class='add'>+		switch (iomap-&gt;type) {</div><div class='add'>+		case IOMAP_MAPPED:</div><div class='add'>+			/*</div><div class='add'>+			 * Directly mapped I/O does not inherently need to do</div><div class='add'>+			 * work at I/O completion time.  But there are various</div><div class='add'>+			 * cases below where this will get set again.</div><div class='add'>+			 */</div><div class='add'>+			need_completion_work = false;</div><div class='add'>+			break;</div><div class='add'>+		case IOMAP_UNWRITTEN:</div><div class='add'>+			dio-&gt;flags |= IOMAP_DIO_UNWRITTEN;</div><div class='add'>+			need_zeroout = true;</div><div class='add'>+			break;</div><div class='add'>+		default:</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (iomap-&gt;flags &amp; IOMAP_F_ATOMIC_BIO) {</div><div class='add'>+			/*</div><div class='add'>+			 * Ensure that the mapping covers the full write</div><div class='add'>+			 * length, otherwise it won't be submitted as a single</div><div class='add'>+			 * bio, which is required to use hardware atomics.</div><div class='add'>+			 */</div><div class='add'>+			if (length != iter-&gt;len)</div><div class='add'>+				return -EINVAL;</div><div class='add'>+			bio_opf |= REQ_ATOMIC;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (iomap-&gt;flags &amp; IOMAP_F_SHARED) {</div><div class='add'>+			/*</div><div class='add'>+			 * Unsharing of needs to update metadata at I/O</div><div class='add'>+			 * completion time.</div><div class='add'>+			 */</div><div class='add'>+			need_completion_work = true;</div><div class='add'>+			dio-&gt;flags |= IOMAP_DIO_COW;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (iomap-&gt;flags &amp; IOMAP_F_NEW) {</div><div class='add'>+			/*</div><div class='add'>+			 * Newly allocated blocks might need recording in</div><div class='add'>+			 * metadata at I/O completion time.</div><div class='add'>+			 */</div><div class='add'>+			need_completion_work = true;</div><div class='add'>+			need_zeroout = true;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Use a FUA write if we need datasync semantics and this is a</div><div class='add'>+		 * pure overwrite that doesn't require any metadata updates.</div><div class='add'>+		 *</div><div class='add'>+		 * This allows us to avoid cache flushes on I/O completion.</div><div class='add'>+		 */</div><div class='add'>+		if (dio-&gt;flags &amp; IOMAP_DIO_WRITE_THROUGH) {</div><div class='add'>+			if (!need_completion_work &amp;&amp;</div><div class='add'>+			    !(iomap-&gt;flags &amp; IOMAP_F_DIRTY) &amp;&amp;</div><div class='add'>+			    (!bdev_write_cache(iomap-&gt;bdev) ||</div><div class='add'>+			     bdev_fua(iomap-&gt;bdev)))</div><div class='add'>+				bio_opf |= REQ_FUA;</div><div class='add'>+			else</div><div class='add'>+				dio-&gt;flags &amp;= ~IOMAP_DIO_WRITE_THROUGH;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	if (iomap-&gt;flags &amp; IOMAP_F_NEW) {</div><div class='del'>-		need_zeroout = true;</div><div class='del'>-	} else if (iomap-&gt;type == IOMAP_MAPPED) {</div><div class='ctx'> 		/*</div><div class='del'>-		 * Use a FUA write if we need datasync semantics, this is a pure</div><div class='del'>-		 * data IO that doesn't require any metadata updates (including</div><div class='del'>-		 * after IO completion such as unwritten extent conversion) and</div><div class='del'>-		 * the underlying device supports FUA. This allows us to avoid</div><div class='del'>-		 * cache flushes on IO completion.</div><div class='add'>+		 * We can only do inline completion for pure overwrites that</div><div class='add'>+		 * don't require additional I/O at completion time.</div><div class='add'>+		 *</div><div class='add'>+		 * This rules out writes that need zeroing or metdata updates to</div><div class='add'>+		 * convert unwritten or shared extents.</div><div class='add'>+		 *</div><div class='add'>+		 * Writes that extend i_size are also not supported, but this is</div><div class='add'>+		 * handled in __iomap_dio_rw().</div><div class='ctx'> 		 */</div><div class='del'>-		if (!(iomap-&gt;flags &amp; (IOMAP_F_SHARED|IOMAP_F_DIRTY)) &amp;&amp;</div><div class='del'>-		    (dio-&gt;flags &amp; IOMAP_DIO_WRITE_FUA) &amp;&amp;</div><div class='del'>-		    blk_queue_fua(bdev_get_queue(iomap-&gt;bdev)))</div><div class='del'>-			use_fua = true;</div><div class='add'>+		if (need_completion_work)</div><div class='add'>+			dio-&gt;flags |= IOMAP_DIO_COMP_WORK;</div><div class='add'>+</div><div class='add'>+		bio_opf |= REQ_OP_WRITE;</div><div class='add'>+	} else {</div><div class='add'>+		bio_opf |= REQ_OP_READ;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -279,25 +423,21 @@ static loff_t iomap_dio_bio_iter(const struct iomap_iter *iter,</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * We can only poll for single bio I/Os.</div><div class='add'>+	 * The rules for polled IO completions follow the guidelines as the</div><div class='add'>+	 * ones we set for inline and deferred completions. If none of those</div><div class='add'>+	 * are available for this IO, clear the polled flag.</div><div class='ctx'> 	 */</div><div class='del'>-	if (need_zeroout ||</div><div class='del'>-	    ((dio-&gt;flags &amp; IOMAP_DIO_WRITE) &amp;&amp; pos &gt;= i_size_read(inode)))</div><div class='add'>+	if (dio-&gt;flags &amp; IOMAP_DIO_COMP_WORK)</div><div class='ctx'> 		dio-&gt;iocb-&gt;ki_flags &amp;= ~IOCB_HIPRI;</div><div class='ctx'> </div><div class='ctx'> 	if (need_zeroout) {</div><div class='ctx'> 		/* zero out from the start of the block to the write offset */</div><div class='ctx'> 		pad = pos &amp; (fs_block_size - 1);</div><div class='del'>-		if (pad)</div><div class='del'>-			iomap_dio_zero(iter, dio, pos - pad, pad);</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Set the operation flags early so that bio_iov_iter_get_pages</div><div class='del'>-	 * can set up the page vector appropriately for a ZONE_APPEND</div><div class='del'>-	 * operation.</div><div class='del'>-	 */</div><div class='del'>-	bio_opf = iomap_dio_bio_opflags(dio, iomap, use_fua);</div><div class='add'>+		ret = iomap_dio_zero(iter, dio, pos - pad, pad);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	nr_pages = bio_iov_vecs_to_alloc(dio-&gt;submit.iter, BIO_MAX_VECS);</div><div class='ctx'> 	do {</div><div class='hunk'>@@ -308,16 +448,17 @@ static loff_t iomap_dio_bio_iter(const struct iomap_iter *iter,</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		bio = bio_alloc(GFP_KERNEL, nr_pages);</div><div class='del'>-		bio_set_dev(bio, iomap-&gt;bdev);</div><div class='add'>+		bio = iomap_dio_alloc_bio(iter, dio, nr_pages, bio_opf);</div><div class='add'>+		fscrypt_set_bio_crypt_ctx(bio, inode, pos &gt;&gt; inode-&gt;i_blkbits,</div><div class='add'>+					  GFP_KERNEL);</div><div class='ctx'> 		bio-&gt;bi_iter.bi_sector = iomap_sector(iomap, pos);</div><div class='del'>-		bio-&gt;bi_write_hint = dio-&gt;iocb-&gt;ki_hint;</div><div class='add'>+		bio-&gt;bi_write_hint = inode-&gt;i_write_hint;</div><div class='ctx'> 		bio-&gt;bi_ioprio = dio-&gt;iocb-&gt;ki_ioprio;</div><div class='ctx'> 		bio-&gt;bi_private = dio;</div><div class='ctx'> 		bio-&gt;bi_end_io = iomap_dio_bio_end_io;</div><div class='del'>-		bio-&gt;bi_opf = bio_opf;</div><div class='ctx'> </div><div class='del'>-		ret = bio_iov_iter_get_pages(bio, dio-&gt;submit.iter);</div><div class='add'>+		ret = bio_iov_iter_get_pages(bio, dio-&gt;submit.iter,</div><div class='add'>+					     alignment - 1);</div><div class='ctx'> 		if (unlikely(ret)) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * We have to stop part way through an IO. We must fall</div><div class='hunk'>@@ -330,12 +471,21 @@ static loff_t iomap_dio_bio_iter(const struct iomap_iter *iter,</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		n = bio-&gt;bi_iter.bi_size;</div><div class='del'>-		if (dio-&gt;flags &amp; IOMAP_DIO_WRITE) {</div><div class='del'>-			task_io_account_write(n);</div><div class='del'>-		} else {</div><div class='del'>-			if (dio-&gt;flags &amp; IOMAP_DIO_DIRTY)</div><div class='del'>-				bio_set_pages_dirty(bio);</div><div class='add'>+		if (WARN_ON_ONCE((bio_opf &amp; REQ_ATOMIC) &amp;&amp; n != length)) {</div><div class='add'>+			/*</div><div class='add'>+			 * An atomic write bio must cover the complete length,</div><div class='add'>+			 * which it doesn't, so error. We may need to zero out</div><div class='add'>+			 * the tail (complete FS block), similar to when</div><div class='add'>+			 * bio_iov_iter_get_pages() returns an error, above.</div><div class='add'>+			 */</div><div class='add'>+			ret = -EINVAL;</div><div class='add'>+			bio_put(bio);</div><div class='add'>+			goto zero_tail;</div><div class='ctx'> 		}</div><div class='add'>+		if (dio-&gt;flags &amp; IOMAP_DIO_WRITE)</div><div class='add'>+			task_io_account_write(n);</div><div class='add'>+		else if (dio-&gt;flags &amp; IOMAP_DIO_DIRTY)</div><div class='add'>+			bio_set_pages_dirty(bio);</div><div class='ctx'> </div><div class='ctx'> 		dio-&gt;size += n;</div><div class='ctx'> 		copied += n;</div><div class='hunk'>@@ -363,36 +513,38 @@ zero_tail:</div><div class='ctx'> 		/* zero out from the end of the write to the end of the block */</div><div class='ctx'> 		pad = pos &amp; (fs_block_size - 1);</div><div class='ctx'> 		if (pad)</div><div class='del'>-			iomap_dio_zero(iter, dio, pos, fs_block_size - pad);</div><div class='add'>+			ret = iomap_dio_zero(iter, dio, pos,</div><div class='add'>+					     fs_block_size - pad);</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='ctx'> 	/* Undo iter limitation to current extent */</div><div class='ctx'> 	iov_iter_reexpand(dio-&gt;submit.iter, orig_count - copied);</div><div class='ctx'> 	if (copied)</div><div class='del'>-		return copied;</div><div class='add'>+		return iomap_iter_advance(iter, copied);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static loff_t iomap_dio_hole_iter(const struct iomap_iter *iter,</div><div class='del'>-		struct iomap_dio *dio)</div><div class='add'>+static int iomap_dio_hole_iter(struct iomap_iter *iter, struct iomap_dio *dio)</div><div class='ctx'> {</div><div class='ctx'> 	loff_t length = iov_iter_zero(iomap_length(iter), dio-&gt;submit.iter);</div><div class='ctx'> </div><div class='ctx'> 	dio-&gt;size += length;</div><div class='ctx'> 	if (!length)</div><div class='ctx'> 		return -EFAULT;</div><div class='del'>-	return length;</div><div class='add'>+	return iomap_iter_advance(iter, length);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static loff_t iomap_dio_inline_iter(const struct iomap_iter *iomi,</div><div class='del'>-		struct iomap_dio *dio)</div><div class='add'>+static int iomap_dio_inline_iter(struct iomap_iter *iomi, struct iomap_dio *dio)</div><div class='ctx'> {</div><div class='ctx'> 	const struct iomap *iomap = &amp;iomi-&gt;iomap;</div><div class='ctx'> 	struct iov_iter *iter = dio-&gt;submit.iter;</div><div class='ctx'> 	void *inline_data = iomap_inline_data(iomap, iomi-&gt;pos);</div><div class='ctx'> 	loff_t length = iomap_length(iomi);</div><div class='ctx'> 	loff_t pos = iomi-&gt;pos;</div><div class='del'>-	size_t copied;</div><div class='add'>+	u64 copied;</div><div class='add'>+</div><div class='add'>+	if (WARN_ON_ONCE(!inline_data))</div><div class='add'>+		return -EIO;</div><div class='ctx'> </div><div class='ctx'> 	if (WARN_ON_ONCE(!iomap_inline_data_valid(iomap)))</div><div class='ctx'> 		return -EIO;</div><div class='hunk'>@@ -414,11 +566,10 @@ static loff_t iomap_dio_inline_iter(const struct iomap_iter *iomi,</div><div class='ctx'> 	dio-&gt;size += copied;</div><div class='ctx'> 	if (!copied)</div><div class='ctx'> 		return -EFAULT;</div><div class='del'>-	return copied;</div><div class='add'>+	return iomap_iter_advance(iomi, copied);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static loff_t iomap_dio_iter(const struct iomap_iter *iter,</div><div class='del'>-		struct iomap_dio *dio)</div><div class='add'>+static int iomap_dio_iter(struct iomap_iter *iter, struct iomap_dio *dio)</div><div class='ctx'> {</div><div class='ctx'> 	switch (iter-&gt;iomap.type) {</div><div class='ctx'> 	case IOMAP_HOLE:</div><div class='hunk'>@@ -472,21 +623,23 @@ static loff_t iomap_dio_iter(const struct iomap_iter *iter,</div><div class='ctx'> struct iomap_dio *</div><div class='ctx'> __iomap_dio_rw(struct kiocb *iocb, struct iov_iter *iter,</div><div class='ctx'> 		const struct iomap_ops *ops, const struct iomap_dio_ops *dops,</div><div class='del'>-		unsigned int dio_flags, size_t done_before)</div><div class='add'>+		unsigned int dio_flags, void *private, size_t done_before)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *mapping = iocb-&gt;ki_filp-&gt;f_mapping;</div><div class='ctx'> 	struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='ctx'> 	struct iomap_iter iomi = {</div><div class='ctx'> 		.inode		= inode,</div><div class='ctx'> 		.pos		= iocb-&gt;ki_pos,</div><div class='ctx'> 		.len		= iov_iter_count(iter),</div><div class='ctx'> 		.flags		= IOMAP_DIRECT,</div><div class='add'>+		.private	= private,</div><div class='ctx'> 	};</div><div class='del'>-	loff_t end = iomi.pos + iomi.len - 1, ret = 0;</div><div class='ctx'> 	bool wait_for_completion =</div><div class='ctx'> 		is_sync_kiocb(iocb) || (dio_flags &amp; IOMAP_DIO_FORCE_WAIT);</div><div class='ctx'> 	struct blk_plug plug;</div><div class='ctx'> 	struct iomap_dio *dio;</div><div class='add'>+	loff_t ret = 0;</div><div class='add'>+</div><div class='add'>+	trace_iomap_dio_rw_begin(iocb, iter, dio_flags, done_before);</div><div class='ctx'> </div><div class='ctx'> 	if (!iomi.len)</div><div class='ctx'> 		return NULL;</div><div class='hunk'>@@ -506,87 +659,98 @@ __iomap_dio_rw(struct kiocb *iocb, struct iov_iter *iter,</div><div class='ctx'> </div><div class='ctx'> 	dio-&gt;submit.iter = iter;</div><div class='ctx'> 	dio-&gt;submit.waiter = current;</div><div class='del'>-	dio-&gt;submit.poll_bio = NULL;</div><div class='add'>+</div><div class='add'>+	if (iocb-&gt;ki_flags &amp; IOCB_NOWAIT)</div><div class='add'>+		iomi.flags |= IOMAP_NOWAIT;</div><div class='add'>+</div><div class='add'>+	if (dio_flags &amp; IOMAP_DIO_FSBLOCK_ALIGNED)</div><div class='add'>+		dio-&gt;flags |= IOMAP_DIO_FSBLOCK_ALIGNED;</div><div class='ctx'> </div><div class='ctx'> 	if (iov_iter_rw(iter) == READ) {</div><div class='ctx'> 		if (iomi.pos &gt;= dio-&gt;i_size)</div><div class='ctx'> 			goto out_free_dio;</div><div class='ctx'> </div><div class='del'>-		if (iocb-&gt;ki_flags &amp; IOCB_NOWAIT) {</div><div class='del'>-			if (filemap_range_needs_writeback(mapping, iomi.pos,</div><div class='del'>-					end)) {</div><div class='del'>-				ret = -EAGAIN;</div><div class='del'>-				goto out_free_dio;</div><div class='del'>-			}</div><div class='del'>-			iomi.flags |= IOMAP_NOWAIT;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (iter_is_iovec(iter))</div><div class='add'>+		if (user_backed_iter(iter))</div><div class='ctx'> 			dio-&gt;flags |= IOMAP_DIO_DIRTY;</div><div class='add'>+</div><div class='add'>+		ret = kiocb_write_and_wait(iocb, iomi.len);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out_free_dio;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		iomi.flags |= IOMAP_WRITE;</div><div class='ctx'> 		dio-&gt;flags |= IOMAP_DIO_WRITE;</div><div class='ctx'> </div><div class='del'>-		if (iocb-&gt;ki_flags &amp; IOCB_NOWAIT) {</div><div class='del'>-			if (filemap_range_has_page(mapping, iomi.pos, end)) {</div><div class='del'>-				ret = -EAGAIN;</div><div class='add'>+		if (dio_flags &amp; IOMAP_DIO_OVERWRITE_ONLY) {</div><div class='add'>+			ret = -EAGAIN;</div><div class='add'>+			if (iomi.pos &gt;= dio-&gt;i_size ||</div><div class='add'>+			    iomi.pos + iomi.len &gt; dio-&gt;i_size)</div><div class='ctx'> 				goto out_free_dio;</div><div class='del'>-			}</div><div class='del'>-			iomi.flags |= IOMAP_NOWAIT;</div><div class='add'>+			iomi.flags |= IOMAP_OVERWRITE_ONLY;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		if (iocb-&gt;ki_flags &amp; IOCB_ATOMIC)</div><div class='add'>+			iomi.flags |= IOMAP_ATOMIC;</div><div class='add'>+</div><div class='ctx'> 		/* for data sync or sync, we need sync completion processing */</div><div class='del'>-		if (iocb-&gt;ki_flags &amp; IOCB_DSYNC)</div><div class='add'>+		if (iocb_is_dsync(iocb)) {</div><div class='ctx'> 			dio-&gt;flags |= IOMAP_DIO_NEED_SYNC;</div><div class='ctx'> </div><div class='add'>+		       /*</div><div class='add'>+			* For datasync only writes, we optimistically try using</div><div class='add'>+			* WRITE_THROUGH for this IO. This flag requires either</div><div class='add'>+			* FUA writes through the device's write cache, or a</div><div class='add'>+			* normal write to a device without a volatile write</div><div class='add'>+			* cache. For the former, Any non-FUA write that occurs</div><div class='add'>+			* will clear this flag, hence we know before completion</div><div class='add'>+			* whether a cache flush is necessary.</div><div class='add'>+			*/</div><div class='add'>+			if (!(iocb-&gt;ki_flags &amp; IOCB_SYNC))</div><div class='add'>+				dio-&gt;flags |= IOMAP_DIO_WRITE_THROUGH;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		/*</div><div class='del'>-		 * For datasync only writes, we optimistically try using FUA for</div><div class='del'>-		 * this IO.  Any non-FUA write that occurs will clear this flag,</div><div class='del'>-		 * hence we know before completion whether a cache flush is</div><div class='del'>-		 * necessary.</div><div class='add'>+		 * i_size updates must to happen from process context.</div><div class='ctx'> 		 */</div><div class='del'>-		if ((iocb-&gt;ki_flags &amp; (IOCB_DSYNC | IOCB_SYNC)) == IOCB_DSYNC)</div><div class='del'>-			dio-&gt;flags |= IOMAP_DIO_WRITE_FUA;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (dio_flags &amp; IOMAP_DIO_OVERWRITE_ONLY) {</div><div class='del'>-		ret = -EAGAIN;</div><div class='del'>-		if (iomi.pos &gt;= dio-&gt;i_size ||</div><div class='del'>-		    iomi.pos + iomi.len &gt; dio-&gt;i_size)</div><div class='del'>-			goto out_free_dio;</div><div class='del'>-		iomi.flags |= IOMAP_OVERWRITE_ONLY;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = filemap_write_and_wait_range(mapping, iomi.pos, end);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto out_free_dio;</div><div class='add'>+		if (iomi.pos + iomi.len &gt; dio-&gt;i_size)</div><div class='add'>+			dio-&gt;flags |= IOMAP_DIO_COMP_WORK;</div><div class='ctx'> </div><div class='del'>-	if (iov_iter_rw(iter) == WRITE) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Try to invalidate cache pages for the range we are writing.</div><div class='ctx'> 		 * If this invalidation fails, let the caller fall back to</div><div class='ctx'> 		 * buffered I/O.</div><div class='ctx'> 		 */</div><div class='del'>-		if (invalidate_inode_pages2_range(mapping,</div><div class='del'>-				iomi.pos &gt;&gt; PAGE_SHIFT, end &gt;&gt; PAGE_SHIFT)) {</div><div class='del'>-			trace_iomap_dio_invalidate_fail(inode, iomi.pos,</div><div class='del'>-							iomi.len);</div><div class='del'>-			ret = -ENOTBLK;</div><div class='add'>+		ret = kiocb_invalidate_pages(iocb, iomi.len);</div><div class='add'>+		if (ret) {</div><div class='add'>+			if (ret != -EAGAIN) {</div><div class='add'>+				trace_iomap_dio_invalidate_fail(inode, iomi.pos,</div><div class='add'>+								iomi.len);</div><div class='add'>+				if (iocb-&gt;ki_flags &amp; IOCB_ATOMIC) {</div><div class='add'>+					/*</div><div class='add'>+					 * folio invalidation failed, maybe</div><div class='add'>+					 * this is transient, unlock and see if</div><div class='add'>+					 * the caller tries again.</div><div class='add'>+					 */</div><div class='add'>+					ret = -EAGAIN;</div><div class='add'>+				} else {</div><div class='add'>+					/* fall back to buffered write */</div><div class='add'>+					ret = -ENOTBLK;</div><div class='add'>+				}</div><div class='add'>+			}</div><div class='ctx'> 			goto out_free_dio;</div><div class='ctx'> 		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-		if (!wait_for_completion &amp;&amp; !inode-&gt;i_sb-&gt;s_dio_done_wq) {</div><div class='del'>-			ret = sb_init_dio_done_wq(inode-&gt;i_sb);</div><div class='del'>-			if (ret &lt; 0)</div><div class='del'>-				goto out_free_dio;</div><div class='del'>-		}</div><div class='add'>+	if (!wait_for_completion &amp;&amp; !inode-&gt;i_sb-&gt;s_dio_done_wq) {</div><div class='add'>+		ret = sb_init_dio_done_wq(inode-&gt;i_sb);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out_free_dio;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	inode_dio_begin(inode);</div><div class='ctx'> </div><div class='ctx'> 	blk_start_plug(&amp;plug);</div><div class='ctx'> 	while ((ret = iomap_iter(&amp;iomi, ops)) &gt; 0) {</div><div class='del'>-		iomi.processed = iomap_dio_iter(&amp;iomi, dio);</div><div class='add'>+		iomi.status = iomap_dio_iter(&amp;iomi, dio);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We can only poll for single bio I/Os.</div><div class='hunk'>@@ -619,13 +783,17 @@ __iomap_dio_rw(struct kiocb *iocb, struct iov_iter *iter,</div><div class='ctx'> 		iomap_dio_set_error(dio, ret);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * If all the writes we issued were FUA, we don't need to flush the</div><div class='del'>-	 * cache on IO completion. Clear the sync flag for this case.</div><div class='add'>+	 * If all the writes we issued were already written through to the</div><div class='add'>+	 * media, we don't need to flush the cache on IO completion. Clear the</div><div class='add'>+	 * sync flag for this case.</div><div class='add'>+	 *</div><div class='add'>+	 * Otherwise clear the inline completion flag if any sync work is</div><div class='add'>+	 * needed, as that needs to be performed from process context.</div><div class='ctx'> 	 */</div><div class='del'>-	if (dio-&gt;flags &amp; IOMAP_DIO_WRITE_FUA)</div><div class='add'>+	if (dio-&gt;flags &amp; IOMAP_DIO_WRITE_THROUGH)</div><div class='ctx'> 		dio-&gt;flags &amp;= ~IOMAP_DIO_NEED_SYNC;</div><div class='del'>-</div><div class='del'>-	WRITE_ONCE(iocb-&gt;private, dio-&gt;submit.poll_bio);</div><div class='add'>+	else if (dio-&gt;flags &amp; IOMAP_DIO_NEED_SYNC)</div><div class='add'>+		dio-&gt;flags |= IOMAP_DIO_COMP_WORK;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We are about to drop our additional submission reference, which</div><div class='hunk'>@@ -644,17 +812,17 @@ __iomap_dio_rw(struct kiocb *iocb, struct iov_iter *iter,</div><div class='ctx'> 	 */</div><div class='ctx'> 	dio-&gt;wait_for_completion = wait_for_completion;</div><div class='ctx'> 	if (!atomic_dec_and_test(&amp;dio-&gt;ref)) {</div><div class='del'>-		if (!wait_for_completion)</div><div class='add'>+		if (!wait_for_completion) {</div><div class='add'>+			trace_iomap_dio_rw_queued(inode, iomi.pos, iomi.len);</div><div class='ctx'> 			return ERR_PTR(-EIOCBQUEUED);</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		for (;;) {</div><div class='ctx'> 			set_current_state(TASK_UNINTERRUPTIBLE);</div><div class='ctx'> 			if (!READ_ONCE(dio-&gt;submit.waiter))</div><div class='ctx'> 				break;</div><div class='ctx'> </div><div class='del'>-			if (!dio-&gt;submit.poll_bio ||</div><div class='del'>-			    !bio_poll(dio-&gt;submit.poll_bio, NULL, 0))</div><div class='del'>-				blk_io_schedule();</div><div class='add'>+			blk_io_schedule();</div><div class='ctx'> 		}</div><div class='ctx'> 		__set_current_state(TASK_RUNNING);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -672,11 +840,12 @@ EXPORT_SYMBOL_GPL(__iomap_dio_rw);</div><div class='ctx'> ssize_t</div><div class='ctx'> iomap_dio_rw(struct kiocb *iocb, struct iov_iter *iter,</div><div class='ctx'> 		const struct iomap_ops *ops, const struct iomap_dio_ops *dops,</div><div class='del'>-		unsigned int dio_flags, size_t done_before)</div><div class='add'>+		unsigned int dio_flags, void *private, size_t done_before)</div><div class='ctx'> {</div><div class='ctx'> 	struct iomap_dio *dio;</div><div class='ctx'> </div><div class='del'>-	dio = __iomap_dio_rw(iocb, iter, ops, dops, dio_flags, done_before);</div><div class='add'>+	dio = __iomap_dio_rw(iocb, iter, ops, dops, dio_flags, private,</div><div class='add'>+			     done_before);</div><div class='ctx'> 	if (IS_ERR_OR_NULL(dio))</div><div class='ctx'> 		return PTR_ERR_OR_ZERO(dio);</div><div class='ctx'> 	return iomap_dio_complete(dio);</div><div class='head'>diff --git a/fs/iomap/fiemap.c b/fs/iomap/fiemap.c<br/>index 66cf267c68ae..d11dadff8286 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/iomap/fiemap.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/iomap/fiemap.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/iomap/fiemap.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/iomap/fiemap.c</a></div><div class='hunk'>@@ -2,11 +2,9 @@</div><div class='ctx'> /*</div><div class='ctx'>  * Copyright (c) 2016-2021 Christoph Hellwig.</div><div class='ctx'>  */</div><div class='del'>-#include &lt;linux/module.h&gt;</div><div class='del'>-#include &lt;linux/compiler.h&gt;</div><div class='del'>-#include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/iomap.h&gt;</div><div class='ctx'> #include &lt;linux/fiemap.h&gt;</div><div class='add'>+#include &lt;linux/pagemap.h&gt;</div><div class='ctx'> </div><div class='ctx'> static int iomap_to_fiemap(struct fiemap_extent_info *fi,</div><div class='ctx'> 		const struct iomap *iomap, u32 flags)</div><div class='hunk'>@@ -38,24 +36,23 @@ static int iomap_to_fiemap(struct fiemap_extent_info *fi,</div><div class='ctx'> 			iomap-&gt;length, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static loff_t iomap_fiemap_iter(const struct iomap_iter *iter,</div><div class='add'>+static int iomap_fiemap_iter(struct iomap_iter *iter,</div><div class='ctx'> 		struct fiemap_extent_info *fi, struct iomap *prev)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (iter-&gt;iomap.type == IOMAP_HOLE)</div><div class='del'>-		return iomap_length(iter);</div><div class='add'>+		goto advance;</div><div class='ctx'> </div><div class='ctx'> 	ret = iomap_to_fiemap(fi, prev, 0);</div><div class='ctx'> 	*prev = iter-&gt;iomap;</div><div class='del'>-	switch (ret) {</div><div class='del'>-	case 0:		/* success */</div><div class='del'>-		return iomap_length(iter);</div><div class='del'>-	case 1:		/* extent array full */</div><div class='del'>-		return 0;</div><div class='del'>-	default:	/* error */</div><div class='add'>+	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='del'>-	}</div><div class='add'>+	if (ret == 1)	/* extent array full */</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+advance:</div><div class='add'>+	return iomap_iter_advance_full(iter);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int iomap_fiemap(struct inode *inode, struct fiemap_extent_info *fi,</div><div class='hunk'>@@ -77,7 +74,7 @@ int iomap_fiemap(struct inode *inode, struct fiemap_extent_info *fi,</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='ctx'> 	while ((ret = iomap_iter(&amp;iter, ops)) &gt; 0)</div><div class='del'>-		iter.processed = iomap_fiemap_iter(&amp;iter, fi, &amp;prev);</div><div class='add'>+		iter.status = iomap_fiemap_iter(&amp;iter, fi, &amp;prev);</div><div class='ctx'> </div><div class='ctx'> 	if (prev.type != IOMAP_HOLE) {</div><div class='ctx'> 		ret = iomap_to_fiemap(fi, &amp;prev, FIEMAP_EXTENT_LAST);</div><div class='hunk'>@@ -113,7 +110,7 @@ iomap_bmap(struct address_space *mapping, sector_t bno,</div><div class='ctx'> 	while ((ret = iomap_iter(&amp;iter, ops)) &gt; 0) {</div><div class='ctx'> 		if (iter.iomap.type == IOMAP_MAPPED)</div><div class='ctx'> 			bno = iomap_sector(&amp;iter.iomap, iter.pos) &gt;&gt; blkshift;</div><div class='del'>-		/* leave iter.processed unset to abort loop */</div><div class='add'>+		/* leave iter.status unset to abort loop */</div><div class='ctx'> 	}</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return 0;</div><div class='head'>diff --git a/fs/iomap/internal.h b/fs/iomap/internal.h<br/>new file mode 100644<br/>index 000000000000..3a4e4aad2bd1<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/iomap/internal.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/iomap/internal.h</a></div><div class='hunk'>@@ -0,0 +1,21 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+#ifndef _IOMAP_INTERNAL_H</div><div class='add'>+#define _IOMAP_INTERNAL_H 1</div><div class='add'>+</div><div class='add'>+#define IOEND_BATCH_SIZE	4096</div><div class='add'>+</div><div class='add'>+u32 iomap_finish_ioend_direct(struct iomap_ioend *ioend);</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_BLOCK</div><div class='add'>+int iomap_bio_read_folio_range_sync(const struct iomap_iter *iter,</div><div class='add'>+		struct folio *folio, loff_t pos, size_t len);</div><div class='add'>+#else</div><div class='add'>+static inline int iomap_bio_read_folio_range_sync(const struct iomap_iter *iter,</div><div class='add'>+		struct folio *folio, loff_t pos, size_t len)</div><div class='add'>+{</div><div class='add'>+	WARN_ON_ONCE(1);</div><div class='add'>+	return -EIO;</div><div class='add'>+}</div><div class='add'>+#endif /* CONFIG_BLOCK */</div><div class='add'>+</div><div class='add'>+#endif /* _IOMAP_INTERNAL_H */</div><div class='head'>diff --git a/fs/iomap/ioend.c b/fs/iomap/ioend.c<br/>new file mode 100644<br/>index 000000000000..86f44922ed3b<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/iomap/ioend.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/iomap/ioend.c</a></div><div class='hunk'>@@ -0,0 +1,432 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+/*</div><div class='add'>+ * Copyright (c) 2016-2025 Christoph Hellwig.</div><div class='add'>+ */</div><div class='add'>+#include &lt;linux/iomap.h&gt;</div><div class='add'>+#include &lt;linux/list_sort.h&gt;</div><div class='add'>+#include &lt;linux/pagemap.h&gt;</div><div class='add'>+#include &lt;linux/writeback.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+#include "trace.h"</div><div class='add'>+</div><div class='add'>+struct bio_set iomap_ioend_bioset;</div><div class='add'>+EXPORT_SYMBOL_GPL(iomap_ioend_bioset);</div><div class='add'>+</div><div class='add'>+struct iomap_ioend *iomap_init_ioend(struct inode *inode,</div><div class='add'>+		struct bio *bio, loff_t file_offset, u16 ioend_flags)</div><div class='add'>+{</div><div class='add'>+	struct iomap_ioend *ioend = iomap_ioend_from_bio(bio);</div><div class='add'>+</div><div class='add'>+	atomic_set(&amp;ioend-&gt;io_remaining, 1);</div><div class='add'>+	ioend-&gt;io_error = 0;</div><div class='add'>+	ioend-&gt;io_parent = NULL;</div><div class='add'>+	INIT_LIST_HEAD(&amp;ioend-&gt;io_list);</div><div class='add'>+	ioend-&gt;io_flags = ioend_flags;</div><div class='add'>+	ioend-&gt;io_inode = inode;</div><div class='add'>+	ioend-&gt;io_offset = file_offset;</div><div class='add'>+	ioend-&gt;io_size = bio-&gt;bi_iter.bi_size;</div><div class='add'>+	ioend-&gt;io_sector = bio-&gt;bi_iter.bi_sector;</div><div class='add'>+	ioend-&gt;io_private = NULL;</div><div class='add'>+	return ioend;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(iomap_init_ioend);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * We're now finished for good with this ioend structure.  Update the folio</div><div class='add'>+ * state, release holds on bios, and finally free up memory.  Do not use the</div><div class='add'>+ * ioend after this.</div><div class='add'>+ */</div><div class='add'>+static u32 iomap_finish_ioend_buffered(struct iomap_ioend *ioend)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = ioend-&gt;io_inode;</div><div class='add'>+	struct bio *bio = &amp;ioend-&gt;io_bio;</div><div class='add'>+	struct folio_iter fi;</div><div class='add'>+	u32 folio_count = 0;</div><div class='add'>+</div><div class='add'>+	if (ioend-&gt;io_error) {</div><div class='add'>+		mapping_set_error(inode-&gt;i_mapping, ioend-&gt;io_error);</div><div class='add'>+		if (!bio_flagged(bio, BIO_QUIET)) {</div><div class='add'>+			pr_err_ratelimited(</div><div class='add'>+"%s: writeback error on inode %lu, offset %lld, sector %llu",</div><div class='add'>+				inode-&gt;i_sb-&gt;s_id, inode-&gt;i_ino,</div><div class='add'>+				ioend-&gt;io_offset, ioend-&gt;io_sector);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* walk all folios in bio, ending page IO on them */</div><div class='add'>+	bio_for_each_folio_all(fi, bio) {</div><div class='add'>+		iomap_finish_folio_write(inode, fi.folio, fi.length);</div><div class='add'>+		folio_count++;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	bio_put(bio);	/* frees the ioend */</div><div class='add'>+	return folio_count;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void ioend_writeback_end_bio(struct bio *bio)</div><div class='add'>+{</div><div class='add'>+	struct iomap_ioend *ioend = iomap_ioend_from_bio(bio);</div><div class='add'>+</div><div class='add'>+	ioend-&gt;io_error = blk_status_to_errno(bio-&gt;bi_status);</div><div class='add'>+	iomap_finish_ioend_buffered(ioend);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * We cannot cancel the ioend directly in case of an error, so call the bio end</div><div class='add'>+ * I/O handler with the error status here to run the normal I/O completion</div><div class='add'>+ * handler.</div><div class='add'>+ */</div><div class='add'>+int iomap_ioend_writeback_submit(struct iomap_writepage_ctx *wpc, int error)</div><div class='add'>+{</div><div class='add'>+	struct iomap_ioend *ioend = wpc-&gt;wb_ctx;</div><div class='add'>+</div><div class='add'>+	if (!ioend-&gt;io_bio.bi_end_io)</div><div class='add'>+		ioend-&gt;io_bio.bi_end_io = ioend_writeback_end_bio;</div><div class='add'>+</div><div class='add'>+	if (WARN_ON_ONCE(wpc-&gt;iomap.flags &amp; IOMAP_F_ANON_WRITE))</div><div class='add'>+		error = -EIO;</div><div class='add'>+</div><div class='add'>+	if (error) {</div><div class='add'>+		ioend-&gt;io_bio.bi_status = errno_to_blk_status(error);</div><div class='add'>+		bio_endio(&amp;ioend-&gt;io_bio);</div><div class='add'>+		return error;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	submit_bio(&amp;ioend-&gt;io_bio);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(iomap_ioend_writeback_submit);</div><div class='add'>+</div><div class='add'>+static struct iomap_ioend *iomap_alloc_ioend(struct iomap_writepage_ctx *wpc,</div><div class='add'>+		loff_t pos, u16 ioend_flags)</div><div class='add'>+{</div><div class='add'>+	struct bio *bio;</div><div class='add'>+</div><div class='add'>+	bio = bio_alloc_bioset(wpc-&gt;iomap.bdev, BIO_MAX_VECS,</div><div class='add'>+			       REQ_OP_WRITE | wbc_to_write_flags(wpc-&gt;wbc),</div><div class='add'>+			       GFP_NOFS, &amp;iomap_ioend_bioset);</div><div class='add'>+	bio-&gt;bi_iter.bi_sector = iomap_sector(&amp;wpc-&gt;iomap, pos);</div><div class='add'>+	bio-&gt;bi_write_hint = wpc-&gt;inode-&gt;i_write_hint;</div><div class='add'>+	wbc_init_bio(wpc-&gt;wbc, bio);</div><div class='add'>+	wpc-&gt;nr_folios = 0;</div><div class='add'>+	return iomap_init_ioend(wpc-&gt;inode, bio, pos, ioend_flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool iomap_can_add_to_ioend(struct iomap_writepage_ctx *wpc, loff_t pos,</div><div class='add'>+		u16 ioend_flags)</div><div class='add'>+{</div><div class='add'>+	struct iomap_ioend *ioend = wpc-&gt;wb_ctx;</div><div class='add'>+</div><div class='add'>+	if (ioend_flags &amp; IOMAP_IOEND_BOUNDARY)</div><div class='add'>+		return false;</div><div class='add'>+	if ((ioend_flags &amp; IOMAP_IOEND_NOMERGE_FLAGS) !=</div><div class='add'>+	    (ioend-&gt;io_flags &amp; IOMAP_IOEND_NOMERGE_FLAGS))</div><div class='add'>+		return false;</div><div class='add'>+	if (pos != ioend-&gt;io_offset + ioend-&gt;io_size)</div><div class='add'>+		return false;</div><div class='add'>+	if (!(wpc-&gt;iomap.flags &amp; IOMAP_F_ANON_WRITE) &amp;&amp;</div><div class='add'>+	    iomap_sector(&amp;wpc-&gt;iomap, pos) != bio_end_sector(&amp;ioend-&gt;io_bio))</div><div class='add'>+		return false;</div><div class='add'>+	/*</div><div class='add'>+	 * Limit ioend bio chain lengths to minimise IO completion latency. This</div><div class='add'>+	 * also prevents long tight loops ending page writeback on all the</div><div class='add'>+	 * folios in the ioend.</div><div class='add'>+	 */</div><div class='add'>+	if (wpc-&gt;nr_folios &gt;= IOEND_BATCH_SIZE)</div><div class='add'>+		return false;</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Test to see if we have an existing ioend structure that we could append to</div><div class='add'>+ * first; otherwise finish off the current ioend and start another.</div><div class='add'>+ *</div><div class='add'>+ * If a new ioend is created and cached, the old ioend is submitted to the block</div><div class='add'>+ * layer instantly.  Batching optimisations are provided by higher level block</div><div class='add'>+ * plugging.</div><div class='add'>+ *</div><div class='add'>+ * At the end of a writeback pass, there will be a cached ioend remaining on the</div><div class='add'>+ * writepage context that the caller will need to submit.</div><div class='add'>+ */</div><div class='add'>+ssize_t iomap_add_to_ioend(struct iomap_writepage_ctx *wpc, struct folio *folio,</div><div class='add'>+		loff_t pos, loff_t end_pos, unsigned int dirty_len)</div><div class='add'>+{</div><div class='add'>+	struct iomap_ioend *ioend = wpc-&gt;wb_ctx;</div><div class='add'>+	size_t poff = offset_in_folio(folio, pos);</div><div class='add'>+	unsigned int ioend_flags = 0;</div><div class='add'>+	unsigned int map_len = min_t(u64, dirty_len,</div><div class='add'>+		wpc-&gt;iomap.offset + wpc-&gt;iomap.length - pos);</div><div class='add'>+	int error;</div><div class='add'>+</div><div class='add'>+	trace_iomap_add_to_ioend(wpc-&gt;inode, pos, dirty_len, &amp;wpc-&gt;iomap);</div><div class='add'>+</div><div class='add'>+	WARN_ON_ONCE(!folio-&gt;private &amp;&amp; map_len &lt; dirty_len);</div><div class='add'>+</div><div class='add'>+	switch (wpc-&gt;iomap.type) {</div><div class='add'>+	case IOMAP_INLINE:</div><div class='add'>+		WARN_ON_ONCE(1);</div><div class='add'>+		return -EIO;</div><div class='add'>+	case IOMAP_HOLE:</div><div class='add'>+		return map_len;</div><div class='add'>+	default:</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (wpc-&gt;iomap.type == IOMAP_UNWRITTEN)</div><div class='add'>+		ioend_flags |= IOMAP_IOEND_UNWRITTEN;</div><div class='add'>+	if (wpc-&gt;iomap.flags &amp; IOMAP_F_SHARED)</div><div class='add'>+		ioend_flags |= IOMAP_IOEND_SHARED;</div><div class='add'>+	if (folio_test_dropbehind(folio))</div><div class='add'>+		ioend_flags |= IOMAP_IOEND_DONTCACHE;</div><div class='add'>+	if (pos == wpc-&gt;iomap.offset &amp;&amp; (wpc-&gt;iomap.flags &amp; IOMAP_F_BOUNDARY))</div><div class='add'>+		ioend_flags |= IOMAP_IOEND_BOUNDARY;</div><div class='add'>+</div><div class='add'>+	if (!ioend || !iomap_can_add_to_ioend(wpc, pos, ioend_flags)) {</div><div class='add'>+new_ioend:</div><div class='add'>+		if (ioend) {</div><div class='add'>+			error = wpc-&gt;ops-&gt;writeback_submit(wpc, 0);</div><div class='add'>+			if (error)</div><div class='add'>+				return error;</div><div class='add'>+		}</div><div class='add'>+		wpc-&gt;wb_ctx = ioend = iomap_alloc_ioend(wpc, pos, ioend_flags);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!bio_add_folio(&amp;ioend-&gt;io_bio, folio, map_len, poff))</div><div class='add'>+		goto new_ioend;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Clamp io_offset and io_size to the incore EOF so that ondisk</div><div class='add'>+	 * file size updates in the ioend completion are byte-accurate.</div><div class='add'>+	 * This avoids recovering files with zeroed tail regions when</div><div class='add'>+	 * writeback races with appending writes:</div><div class='add'>+	 *</div><div class='add'>+	 *    Thread 1:                  Thread 2:</div><div class='add'>+	 *    ------------               -----------</div><div class='add'>+	 *    write [A, A+B]</div><div class='add'>+	 *    update inode size to A+B</div><div class='add'>+	 *    submit I/O [A, A+BS]</div><div class='add'>+	 *                               write [A+B, A+B+C]</div><div class='add'>+	 *                               update inode size to A+B+C</div><div class='add'>+	 *    &lt;I/O completes, updates disk size to min(A+B+C, A+BS)&gt;</div><div class='add'>+	 *    &lt;power failure&gt;</div><div class='add'>+	 *</div><div class='add'>+	 *  After reboot:</div><div class='add'>+	 *    1) with A+B+C &lt; A+BS, the file has zero padding in range</div><div class='add'>+	 *       [A+B, A+B+C]</div><div class='add'>+	 *</div><div class='add'>+	 *    |&lt;     Block Size (BS)   &gt;|</div><div class='add'>+	 *    |DDDDDDDDDDDD0000000000000|</div><div class='add'>+	 *    ^           ^        ^</div><div class='add'>+	 *    A          A+B     A+B+C</div><div class='add'>+	 *                       (EOF)</div><div class='add'>+	 *</div><div class='add'>+	 *    2) with A+B+C &gt; A+BS, the file has zero padding in range</div><div class='add'>+	 *       [A+B, A+BS]</div><div class='add'>+	 *</div><div class='add'>+	 *    |&lt;     Block Size (BS)   &gt;|&lt;     Block Size (BS)    &gt;|</div><div class='add'>+	 *    |DDDDDDDDDDDD0000000000000|00000000000000000000000000|</div><div class='add'>+	 *    ^           ^             ^           ^</div><div class='add'>+	 *    A          A+B           A+BS       A+B+C</div><div class='add'>+	 *                             (EOF)</div><div class='add'>+	 *</div><div class='add'>+	 *    D = Valid Data</div><div class='add'>+	 *    0 = Zero Padding</div><div class='add'>+	 *</div><div class='add'>+	 * Note that this defeats the ability to chain the ioends of</div><div class='add'>+	 * appending writes.</div><div class='add'>+	 */</div><div class='add'>+	ioend-&gt;io_size += map_len;</div><div class='add'>+	if (ioend-&gt;io_offset + ioend-&gt;io_size &gt; end_pos)</div><div class='add'>+		ioend-&gt;io_size = end_pos - ioend-&gt;io_offset;</div><div class='add'>+</div><div class='add'>+	wbc_account_cgroup_owner(wpc-&gt;wbc, folio, map_len);</div><div class='add'>+	return map_len;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(iomap_add_to_ioend);</div><div class='add'>+</div><div class='add'>+static u32 iomap_finish_ioend(struct iomap_ioend *ioend, int error)</div><div class='add'>+{</div><div class='add'>+	if (ioend-&gt;io_parent) {</div><div class='add'>+		struct bio *bio = &amp;ioend-&gt;io_bio;</div><div class='add'>+</div><div class='add'>+		ioend = ioend-&gt;io_parent;</div><div class='add'>+		bio_put(bio);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (error)</div><div class='add'>+		cmpxchg(&amp;ioend-&gt;io_error, 0, error);</div><div class='add'>+</div><div class='add'>+	if (!atomic_dec_and_test(&amp;ioend-&gt;io_remaining))</div><div class='add'>+		return 0;</div><div class='add'>+	if (ioend-&gt;io_flags &amp; IOMAP_IOEND_DIRECT)</div><div class='add'>+		return iomap_finish_ioend_direct(ioend);</div><div class='add'>+	return iomap_finish_ioend_buffered(ioend);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Ioend completion routine for merged bios. This can only be called from task</div><div class='add'>+ * contexts as merged ioends can be of unbound length. Hence we have to break up</div><div class='add'>+ * the writeback completions into manageable chunks to avoid long scheduler</div><div class='add'>+ * holdoffs. We aim to keep scheduler holdoffs down below 10ms so that we get</div><div class='add'>+ * good batch processing throughput without creating adverse scheduler latency</div><div class='add'>+ * conditions.</div><div class='add'>+ */</div><div class='add'>+void iomap_finish_ioends(struct iomap_ioend *ioend, int error)</div><div class='add'>+{</div><div class='add'>+	struct list_head tmp;</div><div class='add'>+	u32 completions;</div><div class='add'>+</div><div class='add'>+	might_sleep();</div><div class='add'>+</div><div class='add'>+	list_replace_init(&amp;ioend-&gt;io_list, &amp;tmp);</div><div class='add'>+	completions = iomap_finish_ioend(ioend, error);</div><div class='add'>+</div><div class='add'>+	while (!list_empty(&amp;tmp)) {</div><div class='add'>+		if (completions &gt; IOEND_BATCH_SIZE * 8) {</div><div class='add'>+			cond_resched();</div><div class='add'>+			completions = 0;</div><div class='add'>+		}</div><div class='add'>+		ioend = list_first_entry(&amp;tmp, struct iomap_ioend, io_list);</div><div class='add'>+		list_del_init(&amp;ioend-&gt;io_list);</div><div class='add'>+		completions += iomap_finish_ioend(ioend, error);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(iomap_finish_ioends);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * We can merge two adjacent ioends if they have the same set of work to do.</div><div class='add'>+ */</div><div class='add'>+static bool iomap_ioend_can_merge(struct iomap_ioend *ioend,</div><div class='add'>+		struct iomap_ioend *next)</div><div class='add'>+{</div><div class='add'>+	if (ioend-&gt;io_bio.bi_status != next-&gt;io_bio.bi_status)</div><div class='add'>+		return false;</div><div class='add'>+	if (next-&gt;io_flags &amp; IOMAP_IOEND_BOUNDARY)</div><div class='add'>+		return false;</div><div class='add'>+	if ((ioend-&gt;io_flags &amp; IOMAP_IOEND_NOMERGE_FLAGS) !=</div><div class='add'>+	    (next-&gt;io_flags &amp; IOMAP_IOEND_NOMERGE_FLAGS))</div><div class='add'>+		return false;</div><div class='add'>+	if (ioend-&gt;io_offset + ioend-&gt;io_size != next-&gt;io_offset)</div><div class='add'>+		return false;</div><div class='add'>+	/*</div><div class='add'>+	 * Do not merge physically discontiguous ioends. The filesystem</div><div class='add'>+	 * completion functions will have to iterate the physical</div><div class='add'>+	 * discontiguities even if we merge the ioends at a logical level, so</div><div class='add'>+	 * we don't gain anything by merging physical discontiguities here.</div><div class='add'>+	 *</div><div class='add'>+	 * We cannot use bio-&gt;bi_iter.bi_sector here as it is modified during</div><div class='add'>+	 * submission so does not point to the start sector of the bio at</div><div class='add'>+	 * completion.</div><div class='add'>+	 */</div><div class='add'>+	if (ioend-&gt;io_sector + (ioend-&gt;io_size &gt;&gt; SECTOR_SHIFT) !=</div><div class='add'>+	    next-&gt;io_sector)</div><div class='add'>+		return false;</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void iomap_ioend_try_merge(struct iomap_ioend *ioend,</div><div class='add'>+		struct list_head *more_ioends)</div><div class='add'>+{</div><div class='add'>+	struct iomap_ioend *next;</div><div class='add'>+</div><div class='add'>+	INIT_LIST_HEAD(&amp;ioend-&gt;io_list);</div><div class='add'>+</div><div class='add'>+	while ((next = list_first_entry_or_null(more_ioends, struct iomap_ioend,</div><div class='add'>+			io_list))) {</div><div class='add'>+		if (!iomap_ioend_can_merge(ioend, next))</div><div class='add'>+			break;</div><div class='add'>+		list_move_tail(&amp;next-&gt;io_list, &amp;ioend-&gt;io_list);</div><div class='add'>+		ioend-&gt;io_size += next-&gt;io_size;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(iomap_ioend_try_merge);</div><div class='add'>+</div><div class='add'>+static int iomap_ioend_compare(void *priv, const struct list_head *a,</div><div class='add'>+		const struct list_head *b)</div><div class='add'>+{</div><div class='add'>+	struct iomap_ioend *ia = container_of(a, struct iomap_ioend, io_list);</div><div class='add'>+	struct iomap_ioend *ib = container_of(b, struct iomap_ioend, io_list);</div><div class='add'>+</div><div class='add'>+	if (ia-&gt;io_offset &lt; ib-&gt;io_offset)</div><div class='add'>+		return -1;</div><div class='add'>+	if (ia-&gt;io_offset &gt; ib-&gt;io_offset)</div><div class='add'>+		return 1;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void iomap_sort_ioends(struct list_head *ioend_list)</div><div class='add'>+{</div><div class='add'>+	list_sort(NULL, ioend_list, iomap_ioend_compare);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(iomap_sort_ioends);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Split up to the first @max_len bytes from @ioend if the ioend covers more</div><div class='add'>+ * than @max_len bytes.</div><div class='add'>+ *</div><div class='add'>+ * If @is_append is set, the split will be based on the hardware limits for</div><div class='add'>+ * REQ_OP_ZONE_APPEND commands and can be less than @max_len if the hardware</div><div class='add'>+ * limits don't allow the entire @max_len length.</div><div class='add'>+ *</div><div class='add'>+ * The bio embedded into @ioend must be a REQ_OP_WRITE because the block layer</div><div class='add'>+ * does not allow splitting REQ_OP_ZONE_APPEND bios.  The file systems has to</div><div class='add'>+ * switch the operation after this call, but before submitting the bio.</div><div class='add'>+ */</div><div class='add'>+struct iomap_ioend *iomap_split_ioend(struct iomap_ioend *ioend,</div><div class='add'>+		unsigned int max_len, bool is_append)</div><div class='add'>+{</div><div class='add'>+	struct bio *bio = &amp;ioend-&gt;io_bio;</div><div class='add'>+	struct iomap_ioend *split_ioend;</div><div class='add'>+	unsigned int nr_segs;</div><div class='add'>+	int sector_offset;</div><div class='add'>+	struct bio *split;</div><div class='add'>+</div><div class='add'>+	if (is_append) {</div><div class='add'>+		struct queue_limits *lim = bdev_limits(bio-&gt;bi_bdev);</div><div class='add'>+</div><div class='add'>+		max_len = min(max_len,</div><div class='add'>+			      lim-&gt;max_zone_append_sectors &lt;&lt; SECTOR_SHIFT);</div><div class='add'>+</div><div class='add'>+		sector_offset = bio_split_rw_at(bio, lim, &amp;nr_segs, max_len);</div><div class='add'>+		if (unlikely(sector_offset &lt; 0))</div><div class='add'>+			return ERR_PTR(sector_offset);</div><div class='add'>+		if (!sector_offset)</div><div class='add'>+			return NULL;</div><div class='add'>+	} else {</div><div class='add'>+		if (bio-&gt;bi_iter.bi_size &lt;= max_len)</div><div class='add'>+			return NULL;</div><div class='add'>+		sector_offset = max_len &gt;&gt; SECTOR_SHIFT;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* ensure the split ioend is still block size aligned */</div><div class='add'>+	sector_offset = ALIGN_DOWN(sector_offset &lt;&lt; SECTOR_SHIFT,</div><div class='add'>+			i_blocksize(ioend-&gt;io_inode)) &gt;&gt; SECTOR_SHIFT;</div><div class='add'>+</div><div class='add'>+	split = bio_split(bio, sector_offset, GFP_NOFS, &amp;iomap_ioend_bioset);</div><div class='add'>+	if (IS_ERR(split))</div><div class='add'>+		return ERR_CAST(split);</div><div class='add'>+	split-&gt;bi_private = bio-&gt;bi_private;</div><div class='add'>+	split-&gt;bi_end_io = bio-&gt;bi_end_io;</div><div class='add'>+</div><div class='add'>+	split_ioend = iomap_init_ioend(ioend-&gt;io_inode, split, ioend-&gt;io_offset,</div><div class='add'>+			ioend-&gt;io_flags);</div><div class='add'>+	split_ioend-&gt;io_parent = ioend;</div><div class='add'>+</div><div class='add'>+	atomic_inc(&amp;ioend-&gt;io_remaining);</div><div class='add'>+	ioend-&gt;io_offset += split_ioend-&gt;io_size;</div><div class='add'>+	ioend-&gt;io_size -= split_ioend-&gt;io_size;</div><div class='add'>+</div><div class='add'>+	split_ioend-&gt;io_sector = ioend-&gt;io_sector;</div><div class='add'>+	if (!is_append)</div><div class='add'>+		ioend-&gt;io_sector += (split_ioend-&gt;io_size &gt;&gt; SECTOR_SHIFT);</div><div class='add'>+	return split_ioend;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(iomap_split_ioend);</div><div class='add'>+</div><div class='add'>+static int __init iomap_ioend_init(void)</div><div class='add'>+{</div><div class='add'>+	return bioset_init(&amp;iomap_ioend_bioset, 4 * (PAGE_SIZE / SECTOR_SIZE),</div><div class='add'>+			   offsetof(struct iomap_ioend, io_bio),</div><div class='add'>+			   BIOSET_NEED_BVECS);</div><div class='add'>+}</div><div class='add'>+fs_initcall(iomap_ioend_init);</div><div class='head'>diff --git a/fs/iomap/iter.c b/fs/iomap/iter.c<br/>index a1c7592d2ade..8692e5e41c6d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/iomap/iter.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/iomap/iter.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/iomap/iter.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/iomap/iter.c</a></div><div class='hunk'>@@ -3,29 +3,30 @@</div><div class='ctx'>  * Copyright (C) 2010 Red Hat, Inc.</div><div class='ctx'>  * Copyright (c) 2016-2021 Christoph Hellwig.</div><div class='ctx'>  */</div><div class='del'>-#include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/iomap.h&gt;</div><div class='ctx'> #include "trace.h"</div><div class='ctx'> </div><div class='del'>-static inline int iomap_iter_advance(struct iomap_iter *iter)</div><div class='add'>+static inline void iomap_iter_reset_iomap(struct iomap_iter *iter)</div><div class='ctx'> {</div><div class='del'>-	/* handle the previous iteration (if any) */</div><div class='del'>-	if (iter-&gt;iomap.length) {</div><div class='del'>-		if (iter-&gt;processed &lt;= 0)</div><div class='del'>-			return iter-&gt;processed;</div><div class='del'>-		if (WARN_ON_ONCE(iter-&gt;processed &gt; iomap_length(iter)))</div><div class='del'>-			return -EIO;</div><div class='del'>-		iter-&gt;pos += iter-&gt;processed;</div><div class='del'>-		iter-&gt;len -= iter-&gt;processed;</div><div class='del'>-		if (!iter-&gt;len)</div><div class='del'>-			return 0;</div><div class='add'>+	if (iter-&gt;fbatch) {</div><div class='add'>+		folio_batch_release(iter-&gt;fbatch);</div><div class='add'>+		kfree(iter-&gt;fbatch);</div><div class='add'>+		iter-&gt;fbatch = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* clear the state for the next iteration */</div><div class='del'>-	iter-&gt;processed = 0;</div><div class='add'>+	iter-&gt;status = 0;</div><div class='ctx'> 	memset(&amp;iter-&gt;iomap, 0, sizeof(iter-&gt;iomap));</div><div class='ctx'> 	memset(&amp;iter-&gt;srcmap, 0, sizeof(iter-&gt;srcmap));</div><div class='del'>-	return 1;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Advance the current iterator position and decrement the remaining length */</div><div class='add'>+int iomap_iter_advance(struct iomap_iter *iter, u64 count)</div><div class='add'>+{</div><div class='add'>+	if (WARN_ON_ONCE(count &gt; iomap_length(iter)))</div><div class='add'>+		return -EIO;</div><div class='add'>+	iter-&gt;pos += count;</div><div class='add'>+	iter-&gt;len -= count;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void iomap_iter_done(struct iomap_iter *iter)</div><div class='hunk'>@@ -33,6 +34,9 @@ static inline void iomap_iter_done(struct iomap_iter *iter)</div><div class='ctx'> 	WARN_ON_ONCE(iter-&gt;iomap.offset &gt; iter-&gt;pos);</div><div class='ctx'> 	WARN_ON_ONCE(iter-&gt;iomap.length == 0);</div><div class='ctx'> 	WARN_ON_ONCE(iter-&gt;iomap.offset + iter-&gt;iomap.length &lt;= iter-&gt;pos);</div><div class='add'>+	WARN_ON_ONCE(iter-&gt;iomap.flags &amp; IOMAP_F_STALE);</div><div class='add'>+</div><div class='add'>+	iter-&gt;iter_start_pos = iter-&gt;pos;</div><div class='ctx'> </div><div class='ctx'> 	trace_iomap_iter_dstmap(iter-&gt;inode, &amp;iter-&gt;iomap);</div><div class='ctx'> 	if (iter-&gt;srcmap.type != IOMAP_HOLE)</div><div class='hunk'>@@ -51,26 +55,58 @@ static inline void iomap_iter_done(struct iomap_iter *iter)</div><div class='ctx'>  * function must be called in a loop that continues as long it returns a</div><div class='ctx'>  * positive value.  If 0 or a negative value is returned, the caller must not</div><div class='ctx'>  * return to the loop body.  Within a loop body, there are two ways to break out</div><div class='del'>- * of the loop body:  leave @iter.processed unchanged, or set it to a negative</div><div class='add'>+ * of the loop body:  leave @iter.status unchanged, or set it to a negative</div><div class='ctx'>  * errno.</div><div class='ctx'>  */</div><div class='ctx'> int iomap_iter(struct iomap_iter *iter, const struct iomap_ops *ops)</div><div class='ctx'> {</div><div class='add'>+	bool stale = iter-&gt;iomap.flags &amp; IOMAP_F_STALE;</div><div class='add'>+	ssize_t advanced;</div><div class='add'>+	u64 olen;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (iter-&gt;iomap.length &amp;&amp; ops-&gt;iomap_end) {</div><div class='del'>-		ret = ops-&gt;iomap_end(iter-&gt;inode, iter-&gt;pos, iomap_length(iter),</div><div class='del'>-				iter-&gt;processed &gt; 0 ? iter-&gt;processed : 0,</div><div class='del'>-				iter-&gt;flags, &amp;iter-&gt;iomap);</div><div class='del'>-		if (ret &lt; 0 &amp;&amp; !iter-&gt;processed)</div><div class='add'>+	trace_iomap_iter(iter, ops, _RET_IP_);</div><div class='add'>+</div><div class='add'>+	if (!iter-&gt;iomap.length)</div><div class='add'>+		goto begin;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Calculate how far the iter was advanced and the original length bytes</div><div class='add'>+	 * for -&gt;iomap_end().</div><div class='add'>+	 */</div><div class='add'>+	advanced = iter-&gt;pos - iter-&gt;iter_start_pos;</div><div class='add'>+	olen = iter-&gt;len + advanced;</div><div class='add'>+</div><div class='add'>+	if (ops-&gt;iomap_end) {</div><div class='add'>+		ret = ops-&gt;iomap_end(iter-&gt;inode, iter-&gt;iter_start_pos,</div><div class='add'>+				iomap_length_trim(iter, iter-&gt;iter_start_pos,</div><div class='add'>+						  olen),</div><div class='add'>+				advanced, iter-&gt;flags, &amp;iter-&gt;iomap);</div><div class='add'>+		if (ret &lt; 0 &amp;&amp; !advanced)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	trace_iomap_iter(iter, ops, _RET_IP_);</div><div class='del'>-	ret = iomap_iter_advance(iter);</div><div class='add'>+	/* detect old return semantics where this would advance */</div><div class='add'>+	if (WARN_ON_ONCE(iter-&gt;status &gt; 0))</div><div class='add'>+		iter-&gt;status = -EIO;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Use iter-&gt;len to determine whether to continue onto the next mapping.</div><div class='add'>+	 * Explicitly terminate on error status or if the current iter has not</div><div class='add'>+	 * advanced at all (i.e. no work was done for some reason) unless the</div><div class='add'>+	 * mapping has been marked stale and needs to be reprocessed.</div><div class='add'>+	 */</div><div class='add'>+	if (iter-&gt;status &lt; 0)</div><div class='add'>+		ret = iter-&gt;status;</div><div class='add'>+	else if (iter-&gt;len == 0 || (!advanced &amp;&amp; !stale))</div><div class='add'>+		ret = 0;</div><div class='add'>+	else</div><div class='add'>+		ret = 1;</div><div class='add'>+	iomap_iter_reset_iomap(iter);</div><div class='ctx'> 	if (ret &lt;= 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='add'>+begin:</div><div class='ctx'> 	ret = ops-&gt;iomap_begin(iter-&gt;inode, iter-&gt;pos, iter-&gt;len, iter-&gt;flags,</div><div class='ctx'> 			       &amp;iter-&gt;iomap, &amp;iter-&gt;srcmap);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='head'>diff --git a/fs/iomap/seek.c b/fs/iomap/seek.c<br/>index a845c012b50c..6cbc587c93da 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/iomap/seek.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/iomap/seek.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/iomap/seek.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/iomap/seek.c</a></div><div class='hunk'>@@ -3,14 +3,10 @@</div><div class='ctx'>  * Copyright (C) 2017 Red Hat, Inc.</div><div class='ctx'>  * Copyright (c) 2018-2021 Christoph Hellwig.</div><div class='ctx'>  */</div><div class='del'>-#include &lt;linux/module.h&gt;</div><div class='del'>-#include &lt;linux/compiler.h&gt;</div><div class='del'>-#include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/iomap.h&gt;</div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='del'>-#include &lt;linux/pagevec.h&gt;</div><div class='ctx'> </div><div class='del'>-static loff_t iomap_seek_hole_iter(const struct iomap_iter *iter,</div><div class='add'>+static int iomap_seek_hole_iter(struct iomap_iter *iter,</div><div class='ctx'> 		loff_t *hole_pos)</div><div class='ctx'> {</div><div class='ctx'> 	loff_t length = iomap_length(iter);</div><div class='hunk'>@@ -20,13 +16,13 @@ static loff_t iomap_seek_hole_iter(const struct iomap_iter *iter,</div><div class='ctx'> 		*hole_pos = mapping_seek_hole_data(iter-&gt;inode-&gt;i_mapping,</div><div class='ctx'> 				iter-&gt;pos, iter-&gt;pos + length, SEEK_HOLE);</div><div class='ctx'> 		if (*hole_pos == iter-&gt;pos + length)</div><div class='del'>-			return length;</div><div class='add'>+			return iomap_iter_advance(iter, length);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	case IOMAP_HOLE:</div><div class='ctx'> 		*hole_pos = iter-&gt;pos;</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	default:</div><div class='del'>-		return length;</div><div class='add'>+		return iomap_iter_advance(iter, length);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -47,7 +43,7 @@ iomap_seek_hole(struct inode *inode, loff_t pos, const struct iomap_ops *ops)</div><div class='ctx'> </div><div class='ctx'> 	iter.len = size - pos;</div><div class='ctx'> 	while ((ret = iomap_iter(&amp;iter, ops)) &gt; 0)</div><div class='del'>-		iter.processed = iomap_seek_hole_iter(&amp;iter, &amp;pos);</div><div class='add'>+		iter.status = iomap_seek_hole_iter(&amp;iter, &amp;pos);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	if (iter.len) /* found hole before EOF */</div><div class='hunk'>@@ -56,19 +52,19 @@ iomap_seek_hole(struct inode *inode, loff_t pos, const struct iomap_ops *ops)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(iomap_seek_hole);</div><div class='ctx'> </div><div class='del'>-static loff_t iomap_seek_data_iter(const struct iomap_iter *iter,</div><div class='add'>+static int iomap_seek_data_iter(struct iomap_iter *iter,</div><div class='ctx'> 		loff_t *hole_pos)</div><div class='ctx'> {</div><div class='ctx'> 	loff_t length = iomap_length(iter);</div><div class='ctx'> </div><div class='ctx'> 	switch (iter-&gt;iomap.type) {</div><div class='ctx'> 	case IOMAP_HOLE:</div><div class='del'>-		return length;</div><div class='add'>+		return iomap_iter_advance(iter, length);</div><div class='ctx'> 	case IOMAP_UNWRITTEN:</div><div class='ctx'> 		*hole_pos = mapping_seek_hole_data(iter-&gt;inode-&gt;i_mapping,</div><div class='ctx'> 				iter-&gt;pos, iter-&gt;pos + length, SEEK_DATA);</div><div class='ctx'> 		if (*hole_pos &lt; 0)</div><div class='del'>-			return length;</div><div class='add'>+			return iomap_iter_advance(iter, length);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	default:</div><div class='ctx'> 		*hole_pos = iter-&gt;pos;</div><div class='hunk'>@@ -93,7 +89,7 @@ iomap_seek_data(struct inode *inode, loff_t pos, const struct iomap_ops *ops)</div><div class='ctx'> </div><div class='ctx'> 	iter.len = size - pos;</div><div class='ctx'> 	while ((ret = iomap_iter(&amp;iter, ops)) &gt; 0)</div><div class='del'>-		iter.processed = iomap_seek_data_iter(&amp;iter, &amp;pos);</div><div class='add'>+		iter.status = iomap_seek_data_iter(&amp;iter, &amp;pos);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	if (iter.len) /* found data before EOF */</div><div class='head'>diff --git a/fs/iomap/swapfile.c b/fs/iomap/swapfile.c<br/>index 5fc0ac36dee3..0db77c449467 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/iomap/swapfile.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/iomap/swapfile.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/iomap/swapfile.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/iomap/swapfile.c</a></div><div class='hunk'>@@ -3,9 +3,6 @@</div><div class='ctx'>  * Copyright (C) 2018 Oracle.  All Rights Reserved.</div><div class='ctx'>  * Author: Darrick J. Wong &lt;darrick.wong@oracle.com&gt;</div><div class='ctx'>  */</div><div class='del'>-#include &lt;linux/module.h&gt;</div><div class='del'>-#include &lt;linux/compiler.h&gt;</div><div class='del'>-#include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/iomap.h&gt;</div><div class='ctx'> #include &lt;linux/swap.h&gt;</div><div class='ctx'> </div><div class='hunk'>@@ -94,7 +91,7 @@ static int iomap_swapfile_fail(struct iomap_swapfile_info *isi, const char *str)</div><div class='ctx'>  * swap only cares about contiguous page-aligned physical extents and makes no</div><div class='ctx'>  * distinction between written and unwritten extents.</div><div class='ctx'>  */</div><div class='del'>-static loff_t iomap_swapfile_iter(const struct iomap_iter *iter,</div><div class='add'>+static int iomap_swapfile_iter(struct iomap_iter *iter,</div><div class='ctx'> 		struct iomap *iomap, struct iomap_swapfile_info *isi)</div><div class='ctx'> {</div><div class='ctx'> 	switch (iomap-&gt;type) {</div><div class='hunk'>@@ -132,7 +129,8 @@ static loff_t iomap_swapfile_iter(const struct iomap_iter *iter,</div><div class='ctx'> 			return error;</div><div class='ctx'> 		memcpy(&amp;isi-&gt;iomap, iomap, sizeof(isi-&gt;iomap));</div><div class='ctx'> 	}</div><div class='del'>-	return iomap_length(iter);</div><div class='add'>+</div><div class='add'>+	return iomap_iter_advance_full(iter);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -166,7 +164,7 @@ int iomap_swapfile_activate(struct swap_info_struct *sis,</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='ctx'> 	while ((ret = iomap_iter(&amp;iter, ops)) &gt; 0)</div><div class='del'>-		iter.processed = iomap_swapfile_iter(&amp;iter, &amp;iter.iomap, &amp;isi);</div><div class='add'>+		iter.status = iomap_swapfile_iter(&amp;iter, &amp;iter.iomap, &amp;isi);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='hunk'>@@ -189,7 +187,6 @@ int iomap_swapfile_activate(struct swap_info_struct *sis,</div><div class='ctx'> 	*pagespan = 1 + isi.highest_ppage - isi.lowest_ppage;</div><div class='ctx'> 	sis-&gt;max = isi.nr_pages;</div><div class='ctx'> 	sis-&gt;pages = isi.nr_pages - 1;</div><div class='del'>-	sis-&gt;highest_bit = isi.nr_pages - 1;</div><div class='ctx'> 	return isi.nr_extents;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(iomap_swapfile_activate);</div><div class='head'>diff --git a/fs/iomap/trace.h b/fs/iomap/trace.h<br/>index 65e39785c284..532787277b16 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/iomap/trace.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/iomap/trace.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/iomap/trace.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/iomap/trace.h</a></div><div class='hunk'>@@ -79,10 +79,12 @@ DECLARE_EVENT_CLASS(iomap_range_class,</div><div class='ctx'> DEFINE_EVENT(iomap_range_class, name,	\</div><div class='ctx'> 	TP_PROTO(struct inode *inode, loff_t off, u64 len),\</div><div class='ctx'> 	TP_ARGS(inode, off, len))</div><div class='del'>-DEFINE_RANGE_EVENT(iomap_writepage);</div><div class='del'>-DEFINE_RANGE_EVENT(iomap_releasepage);</div><div class='del'>-DEFINE_RANGE_EVENT(iomap_invalidatepage);</div><div class='add'>+DEFINE_RANGE_EVENT(iomap_writeback_folio);</div><div class='add'>+DEFINE_RANGE_EVENT(iomap_release_folio);</div><div class='add'>+DEFINE_RANGE_EVENT(iomap_invalidate_folio);</div><div class='ctx'> DEFINE_RANGE_EVENT(iomap_dio_invalidate_fail);</div><div class='add'>+DEFINE_RANGE_EVENT(iomap_dio_rw_queued);</div><div class='add'>+DEFINE_RANGE_EVENT(iomap_zero_iter);</div><div class='ctx'> </div><div class='ctx'> #define IOMAP_TYPE_STRINGS \</div><div class='ctx'> 	{ IOMAP_HOLE,		"HOLE" }, \</div><div class='hunk'>@@ -97,7 +99,12 @@ DEFINE_RANGE_EVENT(iomap_dio_invalidate_fail);</div><div class='ctx'> 	{ IOMAP_REPORT,		"REPORT" }, \</div><div class='ctx'> 	{ IOMAP_FAULT,		"FAULT" }, \</div><div class='ctx'> 	{ IOMAP_DIRECT,		"DIRECT" }, \</div><div class='del'>-	{ IOMAP_NOWAIT,		"NOWAIT" }</div><div class='add'>+	{ IOMAP_NOWAIT,		"NOWAIT" }, \</div><div class='add'>+	{ IOMAP_OVERWRITE_ONLY,	"OVERWRITE_ONLY" }, \</div><div class='add'>+	{ IOMAP_UNSHARE,	"UNSHARE" }, \</div><div class='add'>+	{ IOMAP_DAX,		"DAX" }, \</div><div class='add'>+	{ IOMAP_ATOMIC,		"ATOMIC" }, \</div><div class='add'>+	{ IOMAP_DONTCACHE,	"DONTCACHE" }</div><div class='ctx'> </div><div class='ctx'> #define IOMAP_F_FLAGS_STRINGS \</div><div class='ctx'> 	{ IOMAP_F_NEW,		"NEW" }, \</div><div class='hunk'>@@ -105,7 +112,20 @@ DEFINE_RANGE_EVENT(iomap_dio_invalidate_fail);</div><div class='ctx'> 	{ IOMAP_F_SHARED,	"SHARED" }, \</div><div class='ctx'> 	{ IOMAP_F_MERGED,	"MERGED" }, \</div><div class='ctx'> 	{ IOMAP_F_BUFFER_HEAD,	"BH" }, \</div><div class='del'>-	{ IOMAP_F_SIZE_CHANGED,	"SIZE_CHANGED" }</div><div class='add'>+	{ IOMAP_F_XATTR,	"XATTR" }, \</div><div class='add'>+	{ IOMAP_F_BOUNDARY,	"BOUNDARY" }, \</div><div class='add'>+	{ IOMAP_F_ANON_WRITE,	"ANON_WRITE" }, \</div><div class='add'>+	{ IOMAP_F_ATOMIC_BIO,	"ATOMIC_BIO" }, \</div><div class='add'>+	{ IOMAP_F_PRIVATE,	"PRIVATE" }, \</div><div class='add'>+	{ IOMAP_F_SIZE_CHANGED,	"SIZE_CHANGED" }, \</div><div class='add'>+	{ IOMAP_F_STALE,	"STALE" }</div><div class='add'>+</div><div class='add'>+</div><div class='add'>+#define IOMAP_DIO_STRINGS \</div><div class='add'>+	{IOMAP_DIO_FORCE_WAIT,		"DIO_FORCE_WAIT" }, \</div><div class='add'>+	{IOMAP_DIO_OVERWRITE_ONLY,	"DIO_OVERWRITE_ONLY" }, \</div><div class='add'>+	{IOMAP_DIO_PARTIAL,		"DIO_PARTIAL" }, \</div><div class='add'>+	{IOMAP_DIO_FSBLOCK_ALIGNED,	"DIO_FSBLOCK_ALIGNED" }</div><div class='ctx'> </div><div class='ctx'> DECLARE_EVENT_CLASS(iomap_class,</div><div class='ctx'> 	TP_PROTO(struct inode *inode, struct iomap *iomap),</div><div class='hunk'>@@ -131,7 +151,7 @@ DECLARE_EVENT_CLASS(iomap_class,</div><div class='ctx'> 		__entry-&gt;bdev = iomap-&gt;bdev ? iomap-&gt;bdev-&gt;bd_dev : 0;</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_printk("dev %d:%d ino 0x%llx bdev %d:%d addr 0x%llx offset 0x%llx "</div><div class='del'>-		  "length 0x%llx type %s flags %s",</div><div class='add'>+		  "length 0x%llx type %s (0x%x) flags %s (0x%x)",</div><div class='ctx'> 		  MAJOR(__entry-&gt;dev), MINOR(__entry-&gt;dev),</div><div class='ctx'> 		  __entry-&gt;ino,</div><div class='ctx'> 		  MAJOR(__entry-&gt;bdev), MINOR(__entry-&gt;bdev),</div><div class='hunk'>@@ -139,7 +159,9 @@ DECLARE_EVENT_CLASS(iomap_class,</div><div class='ctx'> 		  __entry-&gt;offset,</div><div class='ctx'> 		  __entry-&gt;length,</div><div class='ctx'> 		  __print_symbolic(__entry-&gt;type, IOMAP_TYPE_STRINGS),</div><div class='del'>-		  __print_flags(__entry-&gt;flags, "|", IOMAP_F_FLAGS_STRINGS))</div><div class='add'>+		  __entry-&gt;type,</div><div class='add'>+		  __print_flags(__entry-&gt;flags, "|", IOMAP_F_FLAGS_STRINGS),</div><div class='add'>+		  __entry-&gt;flags)</div><div class='ctx'> )</div><div class='ctx'> </div><div class='ctx'> #define DEFINE_IOMAP_EVENT(name)		\</div><div class='hunk'>@@ -149,6 +171,50 @@ DEFINE_EVENT(iomap_class, name,	\</div><div class='ctx'> DEFINE_IOMAP_EVENT(iomap_iter_dstmap);</div><div class='ctx'> DEFINE_IOMAP_EVENT(iomap_iter_srcmap);</div><div class='ctx'> </div><div class='add'>+TRACE_EVENT(iomap_add_to_ioend,</div><div class='add'>+	TP_PROTO(struct inode *inode, u64 pos, unsigned int dirty_len,</div><div class='add'>+		 struct iomap *iomap),</div><div class='add'>+	TP_ARGS(inode, pos, dirty_len, iomap),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(dev_t, dev)</div><div class='add'>+		__field(u64, ino)</div><div class='add'>+		__field(u64, pos)</div><div class='add'>+		__field(u64, dirty_len)</div><div class='add'>+		__field(u64, addr)</div><div class='add'>+		__field(loff_t, offset)</div><div class='add'>+		__field(u64, length)</div><div class='add'>+		__field(u16, type)</div><div class='add'>+		__field(u16, flags)</div><div class='add'>+		__field(dev_t, bdev)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;dev = inode-&gt;i_sb-&gt;s_dev;</div><div class='add'>+		__entry-&gt;ino = inode-&gt;i_ino;</div><div class='add'>+		__entry-&gt;pos = pos;</div><div class='add'>+		__entry-&gt;dirty_len = dirty_len;</div><div class='add'>+		__entry-&gt;addr = iomap-&gt;addr;</div><div class='add'>+		__entry-&gt;offset = iomap-&gt;offset;</div><div class='add'>+		__entry-&gt;length = iomap-&gt;length;</div><div class='add'>+		__entry-&gt;type = iomap-&gt;type;</div><div class='add'>+		__entry-&gt;flags = iomap-&gt;flags;</div><div class='add'>+		__entry-&gt;bdev = iomap-&gt;bdev ? iomap-&gt;bdev-&gt;bd_dev : 0;</div><div class='add'>+	),</div><div class='add'>+	TP_printk("dev %d:%d ino 0x%llx bdev %d:%d pos 0x%llx dirty len 0x%llx "</div><div class='add'>+		  "addr 0x%llx offset 0x%llx length 0x%llx type %s (0x%x) flags %s (0x%x)",</div><div class='add'>+		  MAJOR(__entry-&gt;dev), MINOR(__entry-&gt;dev),</div><div class='add'>+		  __entry-&gt;ino,</div><div class='add'>+		  MAJOR(__entry-&gt;bdev), MINOR(__entry-&gt;bdev),</div><div class='add'>+		  __entry-&gt;pos,</div><div class='add'>+		  __entry-&gt;dirty_len,</div><div class='add'>+		  __entry-&gt;addr,</div><div class='add'>+		  __entry-&gt;offset,</div><div class='add'>+		  __entry-&gt;length,</div><div class='add'>+		  __print_symbolic(__entry-&gt;type, IOMAP_TYPE_STRINGS),</div><div class='add'>+		  __entry-&gt;type,</div><div class='add'>+		  __print_flags(__entry-&gt;flags, "|", IOMAP_F_FLAGS_STRINGS),</div><div class='add'>+		  __entry-&gt;flags)</div><div class='add'>+);</div><div class='add'>+</div><div class='ctx'> TRACE_EVENT(iomap_iter,</div><div class='ctx'> 	TP_PROTO(struct iomap_iter *iter, const void *ops,</div><div class='ctx'> 		 unsigned long caller),</div><div class='hunk'>@@ -158,6 +224,7 @@ TRACE_EVENT(iomap_iter,</div><div class='ctx'> 		__field(u64, ino)</div><div class='ctx'> 		__field(loff_t, pos)</div><div class='ctx'> 		__field(u64, length)</div><div class='add'>+		__field(int, status)</div><div class='ctx'> 		__field(unsigned int, flags)</div><div class='ctx'> 		__field(const void *, ops)</div><div class='ctx'> 		__field(unsigned long, caller)</div><div class='hunk'>@@ -167,21 +234,95 @@ TRACE_EVENT(iomap_iter,</div><div class='ctx'> 		__entry-&gt;ino = iter-&gt;inode-&gt;i_ino;</div><div class='ctx'> 		__entry-&gt;pos = iter-&gt;pos;</div><div class='ctx'> 		__entry-&gt;length = iomap_length(iter);</div><div class='add'>+		__entry-&gt;status = iter-&gt;status;</div><div class='ctx'> 		__entry-&gt;flags = iter-&gt;flags;</div><div class='ctx'> 		__entry-&gt;ops = ops;</div><div class='ctx'> 		__entry-&gt;caller = caller;</div><div class='ctx'> 	),</div><div class='del'>-	TP_printk("dev %d:%d ino 0x%llx pos 0x%llx length 0x%llx flags %s (0x%x) ops %ps caller %pS",</div><div class='add'>+	TP_printk("dev %d:%d ino 0x%llx pos 0x%llx length 0x%llx status %d flags %s (0x%x) ops %ps caller %pS",</div><div class='ctx'> 		  MAJOR(__entry-&gt;dev), MINOR(__entry-&gt;dev),</div><div class='ctx'> 		   __entry-&gt;ino,</div><div class='ctx'> 		   __entry-&gt;pos,</div><div class='ctx'> 		   __entry-&gt;length,</div><div class='add'>+		   __entry-&gt;status,</div><div class='ctx'> 		   __print_flags(__entry-&gt;flags, "|", IOMAP_FLAGS_STRINGS),</div><div class='ctx'> 		   __entry-&gt;flags,</div><div class='ctx'> 		   __entry-&gt;ops,</div><div class='ctx'> 		   (void *)__entry-&gt;caller)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='add'>+TRACE_EVENT(iomap_dio_rw_begin,</div><div class='add'>+	TP_PROTO(struct kiocb *iocb, struct iov_iter *iter,</div><div class='add'>+		 unsigned int dio_flags, size_t done_before),</div><div class='add'>+	TP_ARGS(iocb, iter, dio_flags, done_before),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(dev_t,	dev)</div><div class='add'>+		__field(ino_t,	ino)</div><div class='add'>+		__field(loff_t, isize)</div><div class='add'>+		__field(loff_t, pos)</div><div class='add'>+		__field(size_t,	count)</div><div class='add'>+		__field(size_t,	done_before)</div><div class='add'>+		__field(int,	ki_flags)</div><div class='add'>+		__field(unsigned int,	dio_flags)</div><div class='add'>+		__field(bool,	aio)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;dev = file_inode(iocb-&gt;ki_filp)-&gt;i_sb-&gt;s_dev;</div><div class='add'>+		__entry-&gt;ino = file_inode(iocb-&gt;ki_filp)-&gt;i_ino;</div><div class='add'>+		__entry-&gt;isize = file_inode(iocb-&gt;ki_filp)-&gt;i_size;</div><div class='add'>+		__entry-&gt;pos = iocb-&gt;ki_pos;</div><div class='add'>+		__entry-&gt;count = iov_iter_count(iter);</div><div class='add'>+		__entry-&gt;done_before = done_before;</div><div class='add'>+		__entry-&gt;ki_flags = iocb-&gt;ki_flags;</div><div class='add'>+		__entry-&gt;dio_flags = dio_flags;</div><div class='add'>+		__entry-&gt;aio = !is_sync_kiocb(iocb);</div><div class='add'>+	),</div><div class='add'>+	TP_printk("dev %d:%d ino 0x%lx size 0x%llx offset 0x%llx length 0x%zx done_before 0x%zx flags %s dio_flags %s aio %d",</div><div class='add'>+		  MAJOR(__entry-&gt;dev), MINOR(__entry-&gt;dev),</div><div class='add'>+		  __entry-&gt;ino,</div><div class='add'>+		  __entry-&gt;isize,</div><div class='add'>+		  __entry-&gt;pos,</div><div class='add'>+		  __entry-&gt;count,</div><div class='add'>+		  __entry-&gt;done_before,</div><div class='add'>+		  __print_flags(__entry-&gt;ki_flags, "|", TRACE_IOCB_STRINGS),</div><div class='add'>+		  __print_flags(__entry-&gt;dio_flags, "|", IOMAP_DIO_STRINGS),</div><div class='add'>+		  __entry-&gt;aio)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+TRACE_EVENT(iomap_dio_complete,</div><div class='add'>+	TP_PROTO(struct kiocb *iocb, int error, ssize_t ret),</div><div class='add'>+	TP_ARGS(iocb, error, ret),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(dev_t,	dev)</div><div class='add'>+		__field(ino_t,	ino)</div><div class='add'>+		__field(loff_t, isize)</div><div class='add'>+		__field(loff_t, pos)</div><div class='add'>+		__field(int,	ki_flags)</div><div class='add'>+		__field(bool,	aio)</div><div class='add'>+		__field(int,	error)</div><div class='add'>+		__field(ssize_t, ret)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;dev = file_inode(iocb-&gt;ki_filp)-&gt;i_sb-&gt;s_dev;</div><div class='add'>+		__entry-&gt;ino = file_inode(iocb-&gt;ki_filp)-&gt;i_ino;</div><div class='add'>+		__entry-&gt;isize = file_inode(iocb-&gt;ki_filp)-&gt;i_size;</div><div class='add'>+		__entry-&gt;pos = iocb-&gt;ki_pos;</div><div class='add'>+		__entry-&gt;ki_flags = iocb-&gt;ki_flags;</div><div class='add'>+		__entry-&gt;aio = !is_sync_kiocb(iocb);</div><div class='add'>+		__entry-&gt;error = error;</div><div class='add'>+		__entry-&gt;ret = ret;</div><div class='add'>+	),</div><div class='add'>+	TP_printk("dev %d:%d ino 0x%lx size 0x%llx offset 0x%llx flags %s aio %d error %d ret %zd",</div><div class='add'>+		  MAJOR(__entry-&gt;dev), MINOR(__entry-&gt;dev),</div><div class='add'>+		  __entry-&gt;ino,</div><div class='add'>+		  __entry-&gt;isize,</div><div class='add'>+		  __entry-&gt;pos,</div><div class='add'>+		  __print_flags(__entry-&gt;ki_flags, "|", TRACE_IOCB_STRINGS),</div><div class='add'>+		  __entry-&gt;aio,</div><div class='add'>+		  __entry-&gt;error,</div><div class='add'>+		  __entry-&gt;ret)</div><div class='add'>+);</div><div class='add'>+</div><div class='ctx'> #endif /* _IOMAP_TRACE_H */</div><div class='ctx'> </div><div class='ctx'> #undef TRACE_INCLUDE_PATH</div><div class='head'>diff --git a/fs/isofs/Kconfig b/fs/isofs/Kconfig<br/>index 08ffd37b9bb8..51434f2a471b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/isofs/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/isofs/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/isofs/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/isofs/Kconfig</a></div><div class='hunk'>@@ -1,6 +1,7 @@</div><div class='ctx'> # SPDX-License-Identifier: GPL-2.0-only</div><div class='ctx'> config ISO9660_FS</div><div class='ctx'> 	tristate "ISO 9660 CDROM file system support"</div><div class='add'>+	select BUFFER_HEAD</div><div class='ctx'> 	help</div><div class='ctx'> 	  This is the standard file system used on CD-ROMs.  It was previously</div><div class='ctx'> 	  known as "High Sierra File System" and is called "hsfs" on other</div><div class='head'>diff --git a/fs/isofs/Makefile b/fs/isofs/Makefile<br/>index 6498fd2b0f60..b25bc542a22b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/isofs/Makefile?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/isofs/Makefile</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/isofs/Makefile?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/isofs/Makefile</a></div><div class='hunk'>@@ -5,7 +5,6 @@</div><div class='ctx'> </div><div class='ctx'> obj-$(CONFIG_ISO9660_FS) += isofs.o</div><div class='ctx'> </div><div class='del'>-isofs-objs-y 			:= namei.o inode.o dir.o util.o rock.o export.o</div><div class='del'>-isofs-objs-$(CONFIG_JOLIET)	+= joliet.o</div><div class='del'>-isofs-objs-$(CONFIG_ZISOFS)	+= compress.o</div><div class='del'>-isofs-objs			:= $(isofs-objs-y)</div><div class='add'>+isofs-y 		:= namei.o inode.o dir.o util.o rock.o export.o</div><div class='add'>+isofs-$(CONFIG_JOLIET)	+= joliet.o</div><div class='add'>+isofs-$(CONFIG_ZISOFS)	+= compress.o</div><div class='head'>diff --git a/fs/isofs/compress.c b/fs/isofs/compress.c<br/>index bc12ac7e2312..5f3b6da0e022 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/isofs/compress.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/isofs/compress.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/isofs/compress.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/isofs/compress.c</a></div><div class='hunk'>@@ -67,8 +67,7 @@ static loff_t zisofs_uncompress_block(struct inode *inode, loff_t block_start,</div><div class='ctx'> 		for ( i = 0 ; i &lt; pcount ; i++ ) {</div><div class='ctx'> 			if (!pages[i])</div><div class='ctx'> 				continue;</div><div class='del'>-			memset(page_address(pages[i]), 0, PAGE_SIZE);</div><div class='del'>-			flush_dcache_page(pages[i]);</div><div class='add'>+			memzero_page(pages[i], 0, PAGE_SIZE);</div><div class='ctx'> 			SetPageUptodate(pages[i]);</div><div class='ctx'> 		}</div><div class='ctx'> 		return ((loff_t)pcount) &lt;&lt; PAGE_SHIFT;</div><div class='hunk'>@@ -82,7 +81,7 @@ static loff_t zisofs_uncompress_block(struct inode *inode, loff_t block_start,</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> 	haveblocks = isofs_get_blocks(inode, blocknum, bhs, needblocks);</div><div class='del'>-	ll_rw_block(REQ_OP_READ, 0, haveblocks, bhs);</div><div class='add'>+	bh_read_batch(haveblocks, bhs);</div><div class='ctx'> </div><div class='ctx'> 	curbh = 0;</div><div class='ctx'> 	curpage = 0;</div><div class='hunk'>@@ -120,7 +119,7 @@ static loff_t zisofs_uncompress_block(struct inode *inode, loff_t block_start,</div><div class='ctx'> 	       zerr != Z_STREAM_END) {</div><div class='ctx'> 		if (!stream.avail_out) {</div><div class='ctx'> 			if (pages[curpage]) {</div><div class='del'>-				stream.next_out = page_address(pages[curpage])</div><div class='add'>+				stream.next_out = kmap_local_page(pages[curpage])</div><div class='ctx'> 						+ poffset;</div><div class='ctx'> 				stream.avail_out = PAGE_SIZE - poffset;</div><div class='ctx'> 				poffset = 0;</div><div class='hunk'>@@ -176,6 +175,10 @@ static loff_t zisofs_uncompress_block(struct inode *inode, loff_t block_start,</div><div class='ctx'> 				flush_dcache_page(pages[curpage]);</div><div class='ctx'> 				SetPageUptodate(pages[curpage]);</div><div class='ctx'> 			}</div><div class='add'>+			if (stream.next_out != (unsigned char *)zisofs_sink_page) {</div><div class='add'>+				kunmap_local(stream.next_out);</div><div class='add'>+				stream.next_out = NULL;</div><div class='add'>+			}</div><div class='ctx'> 			curpage++;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (!stream.avail_in)</div><div class='hunk'>@@ -183,6 +186,8 @@ static loff_t zisofs_uncompress_block(struct inode *inode, loff_t block_start,</div><div class='ctx'> 	}</div><div class='ctx'> inflate_out:</div><div class='ctx'> 	zlib_inflateEnd(&amp;stream);</div><div class='add'>+	if (stream.next_out &amp;&amp; stream.next_out != (unsigned char *)zisofs_sink_page)</div><div class='add'>+		kunmap_local(stream.next_out);</div><div class='ctx'> </div><div class='ctx'> z_eio:</div><div class='ctx'> 	mutex_unlock(&amp;zisofs_zlib_lock);</div><div class='hunk'>@@ -283,9 +288,7 @@ static int zisofs_fill_pages(struct inode *inode, int full_page, int pcount,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (poffset &amp;&amp; *pages) {</div><div class='del'>-		memset(page_address(*pages) + poffset, 0,</div><div class='del'>-		       PAGE_SIZE - poffset);</div><div class='del'>-		flush_dcache_page(*pages);</div><div class='add'>+		memzero_page(*pages, poffset, PAGE_SIZE - poffset);</div><div class='ctx'> 		SetPageUptodate(*pages);</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -296,7 +299,7 @@ static int zisofs_fill_pages(struct inode *inode, int full_page, int pcount,</div><div class='ctx'>  * per reference.  We inject the additional pages into the page</div><div class='ctx'>  * cache as a form of readahead.</div><div class='ctx'>  */</div><div class='del'>-static int zisofs_readpage(struct file *file, struct page *page)</div><div class='add'>+static int zisofs_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='ctx'> 	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='hunk'>@@ -307,16 +310,15 @@ static int zisofs_readpage(struct file *file, struct page *page)</div><div class='ctx'> 		PAGE_SHIFT &lt;= zisofs_block_shift ?</div><div class='ctx'> 		(1 &lt;&lt; (zisofs_block_shift - PAGE_SHIFT)) : 0;</div><div class='ctx'> 	struct page **pages;</div><div class='del'>-	pgoff_t index = page-&gt;index, end_index;</div><div class='add'>+	pgoff_t index = folio-&gt;index, end_index;</div><div class='ctx'> </div><div class='ctx'> 	end_index = (inode-&gt;i_size + PAGE_SIZE - 1) &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> 	/*</div><div class='del'>-	 * If this page is wholly outside i_size we just return zero;</div><div class='add'>+	 * If this folio is wholly outside i_size we just return zero;</div><div class='ctx'> 	 * do_generic_file_read() will handle this for us</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (index &gt;= end_index) {</div><div class='del'>-		SetPageUptodate(page);</div><div class='del'>-		unlock_page(page);</div><div class='add'>+		folio_end_read(folio, true);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -334,18 +336,14 @@ static int zisofs_readpage(struct file *file, struct page *page)</div><div class='ctx'> 	pages = kcalloc(max_t(unsigned int, zisofs_pages_per_cblock, 1),</div><div class='ctx'> 					sizeof(*pages), GFP_KERNEL);</div><div class='ctx'> 	if (!pages) {</div><div class='del'>-		unlock_page(page);</div><div class='add'>+		folio_unlock(folio);</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	}</div><div class='del'>-	pages[full_page] = page;</div><div class='add'>+	pages[full_page] = &amp;folio-&gt;page;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; pcount; i++, index++) {</div><div class='ctx'> 		if (i != full_page)</div><div class='ctx'> 			pages[i] = grab_cache_page_nowait(mapping, index);</div><div class='del'>-		if (pages[i]) {</div><div class='del'>-			ClearPageError(pages[i]);</div><div class='del'>-			kmap(pages[i]);</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	err = zisofs_fill_pages(inode, full_page, pcount, pages);</div><div class='hunk'>@@ -354,9 +352,6 @@ static int zisofs_readpage(struct file *file, struct page *page)</div><div class='ctx'> 	for (i = 0; i &lt; pcount; i++) {</div><div class='ctx'> 		if (pages[i]) {</div><div class='ctx'> 			flush_dcache_page(pages[i]);</div><div class='del'>-			if (i == full_page &amp;&amp; err)</div><div class='del'>-				SetPageError(pages[i]);</div><div class='del'>-			kunmap(pages[i]);</div><div class='ctx'> 			unlock_page(pages[i]);</div><div class='ctx'> 			if (i != full_page)</div><div class='ctx'> 				put_page(pages[i]);</div><div class='hunk'>@@ -369,7 +364,7 @@ static int zisofs_readpage(struct file *file, struct page *page)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations zisofs_aops = {</div><div class='del'>-	.readpage = zisofs_readpage,</div><div class='add'>+	.read_folio = zisofs_read_folio,</div><div class='ctx'> 	/* No bmap operation supported */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='head'>diff --git a/fs/isofs/dir.c b/fs/isofs/dir.c<br/>index eb2f8273e6f1..09df40b612fb 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/isofs/dir.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/isofs/dir.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/isofs/dir.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/isofs/dir.c</a></div><div class='hunk'>@@ -147,7 +147,8 @@ static int do_isofs_readdir(struct inode *inode, struct file *file,</div><div class='ctx'> 			de = tmpde;</div><div class='ctx'> 		}</div><div class='ctx'> 		/* Basic sanity check, whether name doesn't exceed dir entry */</div><div class='del'>-		if (de_len &lt; de-&gt;name_len[0] +</div><div class='add'>+		if (de_len &lt; sizeof(struct iso_directory_record) ||</div><div class='add'>+		    de_len &lt; de-&gt;name_len[0] +</div><div class='ctx'> 					sizeof(struct iso_directory_record)) {</div><div class='ctx'> 			printk(KERN_NOTICE "iso9660: Corrupted directory entry"</div><div class='ctx'> 			       " in block %lu of inode %lu\n", block,</div><div class='head'>diff --git a/fs/isofs/export.c b/fs/isofs/export.c<br/>index 35768a63fb1d..421d247fae52 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/isofs/export.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/isofs/export.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/isofs/export.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/isofs/export.c</a></div><div class='hunk'>@@ -180,7 +180,7 @@ static struct dentry *isofs_fh_to_parent(struct super_block *sb,</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='ctx'> 	return isofs_export_iget(sb,</div><div class='del'>-			fh_len &gt; 2 ? ifid-&gt;parent_block : 0,</div><div class='add'>+			fh_len &gt; 3 ? ifid-&gt;parent_block : 0,</div><div class='ctx'> 			ifid-&gt;parent_offset,</div><div class='ctx'> 			fh_len &gt; 4 ? ifid-&gt;parent_generation : 0);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/isofs/inode.c b/fs/isofs/inode.c<br/>index 0c6eacfcbeef..b7cbe126faf3 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/isofs/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/isofs/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/isofs/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/isofs/inode.c</a></div><div class='hunk'>@@ -21,11 +21,12 @@</div><div class='ctx'> #include &lt;linux/ctype.h&gt;</div><div class='ctx'> #include &lt;linux/statfs.h&gt;</div><div class='ctx'> #include &lt;linux/cdrom.h&gt;</div><div class='del'>-#include &lt;linux/parser.h&gt;</div><div class='ctx'> #include &lt;linux/mpage.h&gt;</div><div class='ctx'> #include &lt;linux/user_namespace.h&gt;</div><div class='ctx'> #include &lt;linux/seq_file.h&gt;</div><div class='ctx'> #include &lt;linux/blkdev.h&gt;</div><div class='add'>+#include &lt;linux/fs_context.h&gt;</div><div class='add'>+#include &lt;linux/fs_parser.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "isofs.h"</div><div class='ctx'> #include "zisofs.h"</div><div class='hunk'>@@ -70,7 +71,7 @@ static struct kmem_cache *isofs_inode_cachep;</div><div class='ctx'> static struct inode *isofs_alloc_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct iso_inode_info *ei;</div><div class='del'>-	ei = kmem_cache_alloc(isofs_inode_cachep, GFP_KERNEL);</div><div class='add'>+	ei = alloc_inode_sb(sb, isofs_inode_cachep, GFP_KERNEL);</div><div class='ctx'> 	if (!ei)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	return &amp;ei-&gt;vfs_inode;</div><div class='hunk'>@@ -93,7 +94,7 @@ static int __init init_inodecache(void)</div><div class='ctx'> 	isofs_inode_cachep = kmem_cache_create("isofs_inode_cache",</div><div class='ctx'> 					sizeof(struct iso_inode_info),</div><div class='ctx'> 					0, (SLAB_RECLAIM_ACCOUNT|</div><div class='del'>-					SLAB_MEM_SPREAD|SLAB_ACCOUNT),</div><div class='add'>+					SLAB_ACCOUNT),</div><div class='ctx'> 					init_once);</div><div class='ctx'> 	if (!isofs_inode_cachep)</div><div class='ctx'> 		return -ENOMEM;</div><div class='hunk'>@@ -110,10 +111,10 @@ static void destroy_inodecache(void)</div><div class='ctx'> 	kmem_cache_destroy(isofs_inode_cachep);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int isofs_remount(struct super_block *sb, int *flags, char *data)</div><div class='add'>+static int isofs_reconfigure(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	sync_filesystem(sb);</div><div class='del'>-	if (!(*flags &amp; SB_RDONLY))</div><div class='add'>+	sync_filesystem(fc-&gt;root-&gt;d_sb);</div><div class='add'>+	if (!(fc-&gt;sb_flags &amp; SB_RDONLY))</div><div class='ctx'> 		return -EROFS;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -123,7 +124,6 @@ static const struct super_operations isofs_sops = {</div><div class='ctx'> 	.free_inode	= isofs_free_inode,</div><div class='ctx'> 	.put_super	= isofs_put_super,</div><div class='ctx'> 	.statfs		= isofs_statfs,</div><div class='del'>-	.remount_fs	= isofs_remount,</div><div class='ctx'> 	.show_options	= isofs_show_options,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -145,7 +145,7 @@ static const struct dentry_operations isofs_dentry_ops[] = {</div><div class='ctx'> #endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-struct iso9660_options{</div><div class='add'>+struct isofs_options{</div><div class='ctx'> 	unsigned int rock:1;</div><div class='ctx'> 	unsigned int joliet:1;</div><div class='ctx'> 	unsigned int cruft:1;</div><div class='hunk'>@@ -289,197 +289,153 @@ isofs_dentry_cmpi_ms(const struct dentry *dentry,</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> enum {</div><div class='del'>-	Opt_block, Opt_check_r, Opt_check_s, Opt_cruft, Opt_gid, Opt_ignore,</div><div class='del'>-	Opt_iocharset, Opt_map_a, Opt_map_n, Opt_map_o, Opt_mode, Opt_nojoliet,</div><div class='del'>-	Opt_norock, Opt_sb, Opt_session, Opt_uid, Opt_unhide, Opt_utf8, Opt_err,</div><div class='del'>-	Opt_nocompress, Opt_hide, Opt_showassoc, Opt_dmode, Opt_overriderockperm,</div><div class='add'>+	Opt_block, Opt_check, Opt_cruft, Opt_gid, Opt_ignore, Opt_iocharset,</div><div class='add'>+	Opt_map, Opt_mode, Opt_nojoliet, Opt_norock, Opt_sb, Opt_session,</div><div class='add'>+	Opt_uid, Opt_unhide, Opt_utf8, Opt_err, Opt_nocompress, Opt_hide,</div><div class='add'>+	Opt_showassoc, Opt_dmode, Opt_overriderockperm,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static const match_table_t tokens = {</div><div class='del'>-	{Opt_norock, "norock"},</div><div class='del'>-	{Opt_nojoliet, "nojoliet"},</div><div class='del'>-	{Opt_unhide, "unhide"},</div><div class='del'>-	{Opt_hide, "hide"},</div><div class='del'>-	{Opt_showassoc, "showassoc"},</div><div class='del'>-	{Opt_cruft, "cruft"},</div><div class='del'>-	{Opt_utf8, "utf8"},</div><div class='del'>-	{Opt_iocharset, "iocharset=%s"},</div><div class='del'>-	{Opt_map_a, "map=acorn"},</div><div class='del'>-	{Opt_map_a, "map=a"},</div><div class='del'>-	{Opt_map_n, "map=normal"},</div><div class='del'>-	{Opt_map_n, "map=n"},</div><div class='del'>-	{Opt_map_o, "map=off"},</div><div class='del'>-	{Opt_map_o, "map=o"},</div><div class='del'>-	{Opt_session, "session=%u"},</div><div class='del'>-	{Opt_sb, "sbsector=%u"},</div><div class='del'>-	{Opt_check_r, "check=relaxed"},</div><div class='del'>-	{Opt_check_r, "check=r"},</div><div class='del'>-	{Opt_check_s, "check=strict"},</div><div class='del'>-	{Opt_check_s, "check=s"},</div><div class='del'>-	{Opt_uid, "uid=%u"},</div><div class='del'>-	{Opt_gid, "gid=%u"},</div><div class='del'>-	{Opt_mode, "mode=%u"},</div><div class='del'>-	{Opt_dmode, "dmode=%u"},</div><div class='del'>-	{Opt_overriderockperm, "overriderockperm"},</div><div class='del'>-	{Opt_block, "block=%u"},</div><div class='del'>-	{Opt_ignore, "conv=binary"},</div><div class='del'>-	{Opt_ignore, "conv=b"},</div><div class='del'>-	{Opt_ignore, "conv=text"},</div><div class='del'>-	{Opt_ignore, "conv=t"},</div><div class='del'>-	{Opt_ignore, "conv=mtext"},</div><div class='del'>-	{Opt_ignore, "conv=m"},</div><div class='del'>-	{Opt_ignore, "conv=auto"},</div><div class='del'>-	{Opt_ignore, "conv=a"},</div><div class='del'>-	{Opt_nocompress, "nocompress"},</div><div class='del'>-	{Opt_err, NULL}</div><div class='add'>+static const struct constant_table isofs_param_map[] = {</div><div class='add'>+	{"acorn",	'a'},</div><div class='add'>+	{"a",		'a'},</div><div class='add'>+	{"normal",	'n'},</div><div class='add'>+	{"n",		'n'},</div><div class='add'>+	{"off",		'o'},</div><div class='add'>+	{"o",		'o'},</div><div class='add'>+	{}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int parse_options(char *options, struct iso9660_options *popt)</div><div class='del'>-{</div><div class='del'>-	char *p;</div><div class='del'>-	int option;</div><div class='del'>-	unsigned int uv;</div><div class='del'>-</div><div class='del'>-	popt-&gt;map = 'n';</div><div class='del'>-	popt-&gt;rock = 1;</div><div class='del'>-	popt-&gt;joliet = 1;</div><div class='del'>-	popt-&gt;cruft = 0;</div><div class='del'>-	popt-&gt;hide = 0;</div><div class='del'>-	popt-&gt;showassoc = 0;</div><div class='del'>-	popt-&gt;check = 'u';		/* unset */</div><div class='del'>-	popt-&gt;nocompress = 0;</div><div class='del'>-	popt-&gt;blocksize = 1024;</div><div class='del'>-	popt-&gt;fmode = popt-&gt;dmode = ISOFS_INVALID_MODE;</div><div class='del'>-	popt-&gt;uid_set = 0;</div><div class='del'>-	popt-&gt;gid_set = 0;</div><div class='del'>-	popt-&gt;gid = GLOBAL_ROOT_GID;</div><div class='del'>-	popt-&gt;uid = GLOBAL_ROOT_UID;</div><div class='del'>-	popt-&gt;iocharset = NULL;</div><div class='del'>-	popt-&gt;overriderockperm = 0;</div><div class='del'>-	popt-&gt;session=-1;</div><div class='del'>-	popt-&gt;sbsector=-1;</div><div class='del'>-	if (!options)</div><div class='del'>-		return 1;</div><div class='del'>-</div><div class='del'>-	while ((p = strsep(&amp;options, ",")) != NULL) {</div><div class='del'>-		int token;</div><div class='del'>-		substring_t args[MAX_OPT_ARGS];</div><div class='del'>-		unsigned n;</div><div class='del'>-</div><div class='del'>-		if (!*p)</div><div class='del'>-			continue;</div><div class='add'>+static const struct constant_table isofs_param_check[] = {</div><div class='add'>+	{"relaxed",	'r'},</div><div class='add'>+	{"r",		'r'},</div><div class='add'>+	{"strict",	's'},</div><div class='add'>+	{"s",		's'},</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-		token = match_token(p, tokens, args);</div><div class='del'>-		switch (token) {</div><div class='del'>-		case Opt_norock:</div><div class='del'>-			popt-&gt;rock = 0;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_nojoliet:</div><div class='del'>-			popt-&gt;joliet = 0;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_hide:</div><div class='del'>-			popt-&gt;hide = 1;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_unhide:</div><div class='del'>-		case Opt_showassoc:</div><div class='del'>-			popt-&gt;showassoc = 1;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_cruft:</div><div class='del'>-			popt-&gt;cruft = 1;</div><div class='del'>-			break;</div><div class='add'>+static const struct fs_parameter_spec isofs_param_spec[] = {</div><div class='add'>+	fsparam_flag	("norock",		Opt_norock),</div><div class='add'>+	fsparam_flag	("nojoliet",		Opt_nojoliet),</div><div class='add'>+	fsparam_flag	("unhide",		Opt_unhide),</div><div class='add'>+	fsparam_flag	("hide",		Opt_hide),</div><div class='add'>+	fsparam_flag	("showassoc",		Opt_showassoc),</div><div class='add'>+	fsparam_flag	("cruft",		Opt_cruft),</div><div class='add'>+	fsparam_flag	("utf8",		Opt_utf8),</div><div class='add'>+	fsparam_string	("iocharset",		Opt_iocharset),</div><div class='add'>+	fsparam_enum	("map",			Opt_map, isofs_param_map),</div><div class='add'>+	fsparam_u32	("session",		Opt_session),</div><div class='add'>+	fsparam_u32	("sbsector",		Opt_sb),</div><div class='add'>+	fsparam_enum	("check",		Opt_check, isofs_param_check),</div><div class='add'>+	fsparam_uid	("uid",			Opt_uid),</div><div class='add'>+	fsparam_gid	("gid",			Opt_gid),</div><div class='add'>+	/* Note: mode/dmode historically accepted %u not strictly %o */</div><div class='add'>+	fsparam_u32	("mode",		Opt_mode),</div><div class='add'>+	fsparam_u32	("dmode",		Opt_dmode),</div><div class='add'>+	fsparam_flag	("overriderockperm",	Opt_overriderockperm),</div><div class='add'>+	fsparam_u32	("block",		Opt_block),</div><div class='add'>+	fsparam_string	("conv",		Opt_ignore),</div><div class='add'>+	fsparam_flag	("nocompress",		Opt_nocompress),</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int isofs_parse_param(struct fs_context *fc,</div><div class='add'>+			       struct fs_parameter *param)</div><div class='add'>+{</div><div class='add'>+	struct isofs_options *popt = fc-&gt;fs_private;</div><div class='add'>+	struct fs_parse_result result;</div><div class='add'>+	int opt;</div><div class='add'>+	unsigned int n;</div><div class='add'>+</div><div class='add'>+	/* There are no remountable options */</div><div class='add'>+	if (fc-&gt;purpose == FS_CONTEXT_FOR_RECONFIGURE)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	opt = fs_parse(fc, isofs_param_spec, param, &amp;result);</div><div class='add'>+	if (opt &lt; 0)</div><div class='add'>+		return opt;</div><div class='add'>+</div><div class='add'>+	switch (opt) {</div><div class='add'>+	case Opt_norock:</div><div class='add'>+		popt-&gt;rock = 0;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_nojoliet:</div><div class='add'>+		popt-&gt;joliet = 0;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_hide:</div><div class='add'>+		popt-&gt;hide = 1;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_unhide:</div><div class='add'>+	case Opt_showassoc:</div><div class='add'>+		popt-&gt;showassoc = 1;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_cruft:</div><div class='add'>+		popt-&gt;cruft = 1;</div><div class='add'>+		break;</div><div class='ctx'> #ifdef CONFIG_JOLIET</div><div class='del'>-		case Opt_utf8:</div><div class='del'>-			kfree(popt-&gt;iocharset);</div><div class='del'>-			popt-&gt;iocharset = kstrdup("utf8", GFP_KERNEL);</div><div class='del'>-			if (!popt-&gt;iocharset)</div><div class='del'>-				return 0;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_iocharset:</div><div class='del'>-			kfree(popt-&gt;iocharset);</div><div class='del'>-			popt-&gt;iocharset = match_strdup(&amp;args[0]);</div><div class='del'>-			if (!popt-&gt;iocharset)</div><div class='del'>-				return 0;</div><div class='del'>-			break;</div><div class='add'>+	case Opt_utf8:</div><div class='add'>+		kfree(popt-&gt;iocharset);</div><div class='add'>+		popt-&gt;iocharset = kstrdup("utf8", GFP_KERNEL);</div><div class='add'>+		if (!popt-&gt;iocharset)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_iocharset:</div><div class='add'>+		kfree(popt-&gt;iocharset);</div><div class='add'>+		popt-&gt;iocharset = kstrdup(param-&gt;string, GFP_KERNEL);</div><div class='add'>+		if (!popt-&gt;iocharset)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+		break;</div><div class='ctx'> #endif</div><div class='del'>-		case Opt_map_a:</div><div class='del'>-			popt-&gt;map = 'a';</div><div class='del'>-			break;</div><div class='del'>-		case Opt_map_o:</div><div class='del'>-			popt-&gt;map = 'o';</div><div class='del'>-			break;</div><div class='del'>-		case Opt_map_n:</div><div class='del'>-			popt-&gt;map = 'n';</div><div class='del'>-			break;</div><div class='del'>-		case Opt_session:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;option))</div><div class='del'>-				return 0;</div><div class='del'>-			n = option;</div><div class='del'>-			/*</div><div class='del'>-			 * Track numbers are supposed to be in range 1-99, the</div><div class='del'>-			 * mount option starts indexing at 0.</div><div class='del'>-			 */</div><div class='del'>-			if (n &gt;= 99)</div><div class='del'>-				return 0;</div><div class='del'>-			popt-&gt;session = n + 1;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_sb:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;option))</div><div class='del'>-				return 0;</div><div class='del'>-			popt-&gt;sbsector = option;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_check_r:</div><div class='del'>-			popt-&gt;check = 'r';</div><div class='del'>-			break;</div><div class='del'>-		case Opt_check_s:</div><div class='del'>-			popt-&gt;check = 's';</div><div class='del'>-			break;</div><div class='del'>-		case Opt_ignore:</div><div class='del'>-			break;</div><div class='del'>-		case Opt_uid:</div><div class='del'>-			if (match_uint(&amp;args[0], &amp;uv))</div><div class='del'>-				return 0;</div><div class='del'>-			popt-&gt;uid = make_kuid(current_user_ns(), uv);</div><div class='del'>-			if (!uid_valid(popt-&gt;uid))</div><div class='del'>-				return 0;</div><div class='del'>-			popt-&gt;uid_set = 1;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_gid:</div><div class='del'>-			if (match_uint(&amp;args[0], &amp;uv))</div><div class='del'>-				return 0;</div><div class='del'>-			popt-&gt;gid = make_kgid(current_user_ns(), uv);</div><div class='del'>-			if (!gid_valid(popt-&gt;gid))</div><div class='del'>-				return 0;</div><div class='del'>-			popt-&gt;gid_set = 1;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_mode:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;option))</div><div class='del'>-				return 0;</div><div class='del'>-			popt-&gt;fmode = option;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_dmode:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;option))</div><div class='del'>-				return 0;</div><div class='del'>-			popt-&gt;dmode = option;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_overriderockperm:</div><div class='del'>-			popt-&gt;overriderockperm = 1;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_block:</div><div class='del'>-			if (match_int(&amp;args[0], &amp;option))</div><div class='del'>-				return 0;</div><div class='del'>-			n = option;</div><div class='del'>-			if (n != 512 &amp;&amp; n != 1024 &amp;&amp; n != 2048)</div><div class='del'>-				return 0;</div><div class='del'>-			popt-&gt;blocksize = n;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_nocompress:</div><div class='del'>-			popt-&gt;nocompress = 1;</div><div class='del'>-			break;</div><div class='del'>-		default:</div><div class='del'>-			return 0;</div><div class='del'>-		}</div><div class='add'>+	case Opt_map:</div><div class='add'>+		popt-&gt;map = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_session:</div><div class='add'>+		n = result.uint_32;</div><div class='add'>+		/*</div><div class='add'>+		 * Track numbers are supposed to be in range 1-99, the</div><div class='add'>+		 * mount option starts indexing at 0.</div><div class='add'>+		 */</div><div class='add'>+		if (n &gt;= 99)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		popt-&gt;session = n + 1;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_sb:</div><div class='add'>+		popt-&gt;sbsector = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_check:</div><div class='add'>+		popt-&gt;check = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_ignore:</div><div class='add'>+		break;</div><div class='add'>+	case Opt_uid:</div><div class='add'>+		popt-&gt;uid = result.uid;</div><div class='add'>+		popt-&gt;uid_set = 1;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_gid:</div><div class='add'>+		popt-&gt;gid = result.gid;</div><div class='add'>+		popt-&gt;gid_set = 1;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_mode:</div><div class='add'>+		popt-&gt;fmode = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_dmode:</div><div class='add'>+		popt-&gt;dmode = result.uint_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_overriderockperm:</div><div class='add'>+		popt-&gt;overriderockperm = 1;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_block:</div><div class='add'>+		n = result.uint_32;</div><div class='add'>+		if (n != 512 &amp;&amp; n != 1024 &amp;&amp; n != 2048)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		popt-&gt;blocksize = n;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_nocompress:</div><div class='add'>+		popt-&gt;nocompress = 1;</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-	return 1;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -615,7 +571,7 @@ static bool rootdir_empty(struct super_block *sb, unsigned long block)</div><div class='ctx'> /*</div><div class='ctx'>  * Initialize the superblock and read the root inode.</div><div class='ctx'>  */</div><div class='del'>-static int isofs_fill_super(struct super_block *s, void *data, int silent)</div><div class='add'>+static int isofs_fill_super(struct super_block *s, struct fs_context *fc)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *bh = NULL, *pri_bh = NULL;</div><div class='ctx'> 	struct hs_primary_descriptor *h_pri = NULL;</div><div class='hunk'>@@ -623,7 +579,7 @@ static int isofs_fill_super(struct super_block *s, void *data, int silent)</div><div class='ctx'> 	struct iso_supplementary_descriptor *sec = NULL;</div><div class='ctx'> 	struct iso_directory_record *rootp;</div><div class='ctx'> 	struct inode *inode;</div><div class='del'>-	struct iso9660_options opt;</div><div class='add'>+	struct isofs_options *opt = fc-&gt;fs_private;</div><div class='ctx'> 	struct isofs_sb_info *sbi;</div><div class='ctx'> 	unsigned long first_data_zone;</div><div class='ctx'> 	int joliet_level = 0;</div><div class='hunk'>@@ -631,15 +587,13 @@ static int isofs_fill_super(struct super_block *s, void *data, int silent)</div><div class='ctx'> 	int orig_zonesize;</div><div class='ctx'> 	int table, error = -EINVAL;</div><div class='ctx'> 	unsigned int vol_desc_start;</div><div class='add'>+	int silent = fc-&gt;sb_flags &amp; SB_SILENT;</div><div class='ctx'> </div><div class='ctx'> 	sbi = kzalloc(sizeof(*sbi), GFP_KERNEL);</div><div class='ctx'> 	if (!sbi)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	s-&gt;s_fs_info = sbi;</div><div class='ctx'> </div><div class='del'>-	if (!parse_options((char *)data, &amp;opt))</div><div class='del'>-		goto out_freesbi;</div><div class='del'>-</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * First of all, get the hardware blocksize for this device.</div><div class='ctx'> 	 * If we don't know what it is, or the hardware blocksize is</div><div class='hunk'>@@ -655,14 +609,19 @@ static int isofs_fill_super(struct super_block *s, void *data, int silent)</div><div class='ctx'> 			bdev_logical_block_size(s-&gt;s_bdev));</div><div class='ctx'> 		goto out_freesbi;</div><div class='ctx'> 	}</div><div class='del'>-	opt.blocksize = sb_min_blocksize(s, opt.blocksize);</div><div class='add'>+	opt-&gt;blocksize = sb_min_blocksize(s, opt-&gt;blocksize);</div><div class='add'>+	if (!opt-&gt;blocksize) {</div><div class='add'>+		printk(KERN_ERR</div><div class='add'>+		       "ISOFS: unable to set blocksize\n");</div><div class='add'>+		goto out_freesbi;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	sbi-&gt;s_high_sierra = 0; /* default is iso9660 */</div><div class='del'>-	sbi-&gt;s_session = opt.session;</div><div class='del'>-	sbi-&gt;s_sbsector = opt.sbsector;</div><div class='add'>+	sbi-&gt;s_session = opt-&gt;session;</div><div class='add'>+	sbi-&gt;s_sbsector = opt-&gt;sbsector;</div><div class='ctx'> </div><div class='del'>-	vol_desc_start = (opt.sbsector != -1) ?</div><div class='del'>-		opt.sbsector : isofs_get_last_session(s,opt.session);</div><div class='add'>+	vol_desc_start = (opt-&gt;sbsector != -1) ?</div><div class='add'>+		opt-&gt;sbsector : isofs_get_last_session(s, opt-&gt;session);</div><div class='ctx'> </div><div class='ctx'> 	for (iso_blknum = vol_desc_start+16;</div><div class='ctx'> 		iso_blknum &lt; vol_desc_start+100; iso_blknum++) {</div><div class='hunk'>@@ -696,7 +655,7 @@ static int isofs_fill_super(struct super_block *s, void *data, int silent)</div><div class='ctx'> 			else if (isonum_711(vdp-&gt;type) == ISO_VD_SUPPLEMENTARY) {</div><div class='ctx'> 				sec = (struct iso_supplementary_descriptor *)vdp;</div><div class='ctx'> 				if (sec-&gt;escape[0] == 0x25 &amp;&amp; sec-&gt;escape[1] == 0x2f) {</div><div class='del'>-					if (opt.joliet) {</div><div class='add'>+					if (opt-&gt;joliet) {</div><div class='ctx'> 						if (sec-&gt;escape[2] == 0x40)</div><div class='ctx'> 							joliet_level = 1;</div><div class='ctx'> 						else if (sec-&gt;escape[2] == 0x43)</div><div class='hunk'>@@ -721,7 +680,7 @@ static int isofs_fill_super(struct super_block *s, void *data, int silent)</div><div class='ctx'> 					goto out_freebh;</div><div class='ctx'> </div><div class='ctx'> 				sbi-&gt;s_high_sierra = 1;</div><div class='del'>-				opt.rock = 0;</div><div class='add'>+				opt-&gt;rock = 0;</div><div class='ctx'> 				h_pri = (struct hs_primary_descriptor *)vdp;</div><div class='ctx'> 				goto root_found;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -749,7 +708,7 @@ root_found:</div><div class='ctx'> 		goto out_freebh;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (joliet_level &amp;&amp; (!pri || !opt.rock)) {</div><div class='add'>+	if (joliet_level &amp;&amp; (!pri || !opt-&gt;rock)) {</div><div class='ctx'> 		/* This is the case of Joliet with the norock mount flag.</div><div class='ctx'> 		 * A disc with both Joliet and Rock Ridge is handled later</div><div class='ctx'> 		 */</div><div class='hunk'>@@ -780,7 +739,7 @@ root_found:</div><div class='ctx'> 	 * blocks that were 512 bytes (which should only very rarely</div><div class='ctx'> 	 * happen.)</div><div class='ctx'> 	 */</div><div class='del'>-	if (orig_zonesize &lt; opt.blocksize)</div><div class='add'>+	if (orig_zonesize &lt; opt-&gt;blocksize)</div><div class='ctx'> 		goto out_bad_size;</div><div class='ctx'> </div><div class='ctx'> 	/* RDE: convert log zone size to bit shift */</div><div class='hunk'>@@ -865,10 +824,10 @@ root_found:</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_JOLIET</div><div class='ctx'> 	if (joliet_level) {</div><div class='del'>-		char *p = opt.iocharset ? opt.iocharset : CONFIG_NLS_DEFAULT;</div><div class='add'>+		char *p = opt-&gt;iocharset ? opt-&gt;iocharset : CONFIG_NLS_DEFAULT;</div><div class='ctx'> 		if (strcmp(p, "utf8") != 0) {</div><div class='del'>-			sbi-&gt;s_nls_iocharset = opt.iocharset ?</div><div class='del'>-				load_nls(opt.iocharset) : load_nls_default();</div><div class='add'>+			sbi-&gt;s_nls_iocharset = opt-&gt;iocharset ?</div><div class='add'>+				load_nls(opt-&gt;iocharset) : load_nls_default();</div><div class='ctx'> 			if (!sbi-&gt;s_nls_iocharset)</div><div class='ctx'> 				goto out_freesbi;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -876,29 +835,29 @@ root_found:</div><div class='ctx'> #endif</div><div class='ctx'> 	s-&gt;s_op = &amp;isofs_sops;</div><div class='ctx'> 	s-&gt;s_export_op = &amp;isofs_export_ops;</div><div class='del'>-	sbi-&gt;s_mapping = opt.map;</div><div class='del'>-	sbi-&gt;s_rock = (opt.rock ? 2 : 0);</div><div class='add'>+	sbi-&gt;s_mapping = opt-&gt;map;</div><div class='add'>+	sbi-&gt;s_rock = (opt-&gt;rock ? 2 : 0);</div><div class='ctx'> 	sbi-&gt;s_rock_offset = -1; /* initial offset, will guess until SP is found*/</div><div class='del'>-	sbi-&gt;s_cruft = opt.cruft;</div><div class='del'>-	sbi-&gt;s_hide = opt.hide;</div><div class='del'>-	sbi-&gt;s_showassoc = opt.showassoc;</div><div class='del'>-	sbi-&gt;s_uid = opt.uid;</div><div class='del'>-	sbi-&gt;s_gid = opt.gid;</div><div class='del'>-	sbi-&gt;s_uid_set = opt.uid_set;</div><div class='del'>-	sbi-&gt;s_gid_set = opt.gid_set;</div><div class='del'>-	sbi-&gt;s_nocompress = opt.nocompress;</div><div class='del'>-	sbi-&gt;s_overriderockperm = opt.overriderockperm;</div><div class='add'>+	sbi-&gt;s_cruft = opt-&gt;cruft;</div><div class='add'>+	sbi-&gt;s_hide = opt-&gt;hide;</div><div class='add'>+	sbi-&gt;s_showassoc = opt-&gt;showassoc;</div><div class='add'>+	sbi-&gt;s_uid = opt-&gt;uid;</div><div class='add'>+	sbi-&gt;s_gid = opt-&gt;gid;</div><div class='add'>+	sbi-&gt;s_uid_set = opt-&gt;uid_set;</div><div class='add'>+	sbi-&gt;s_gid_set = opt-&gt;gid_set;</div><div class='add'>+	sbi-&gt;s_nocompress = opt-&gt;nocompress;</div><div class='add'>+	sbi-&gt;s_overriderockperm = opt-&gt;overriderockperm;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * It would be incredibly stupid to allow people to mark every file</div><div class='ctx'> 	 * on the disk as suid, so we merely allow them to set the default</div><div class='ctx'> 	 * permissions.</div><div class='ctx'> 	 */</div><div class='del'>-	if (opt.fmode != ISOFS_INVALID_MODE)</div><div class='del'>-		sbi-&gt;s_fmode = opt.fmode &amp; 0777;</div><div class='add'>+	if (opt-&gt;fmode != ISOFS_INVALID_MODE)</div><div class='add'>+		sbi-&gt;s_fmode = opt-&gt;fmode &amp; 0777;</div><div class='ctx'> 	else</div><div class='ctx'> 		sbi-&gt;s_fmode = ISOFS_INVALID_MODE;</div><div class='del'>-	if (opt.dmode != ISOFS_INVALID_MODE)</div><div class='del'>-		sbi-&gt;s_dmode = opt.dmode &amp; 0777;</div><div class='add'>+	if (opt-&gt;dmode != ISOFS_INVALID_MODE)</div><div class='add'>+		sbi-&gt;s_dmode = opt-&gt;dmode &amp; 0777;</div><div class='ctx'> 	else</div><div class='ctx'> 		sbi-&gt;s_dmode = ISOFS_INVALID_MODE;</div><div class='ctx'> </div><div class='hunk'>@@ -908,8 +867,22 @@ root_found:</div><div class='ctx'> 	 * we then decide whether to use the Joliet descriptor.</div><div class='ctx'> 	 */</div><div class='ctx'> 	inode = isofs_iget(s, sbi-&gt;s_firstdatazone, 0);</div><div class='del'>-	if (IS_ERR(inode))</div><div class='del'>-		goto out_no_root;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Fix for broken CDs with a corrupt root inode but a correct Joliet</div><div class='add'>+	 * root directory.</div><div class='add'>+	 */</div><div class='add'>+	if (IS_ERR(inode)) {</div><div class='add'>+		if (joliet_level &amp;&amp; sbi-&gt;s_firstdatazone != first_data_zone) {</div><div class='add'>+			printk(KERN_NOTICE</div><div class='add'>+			       "ISOFS: root inode is unusable. "</div><div class='add'>+			       "Disabling Rock Ridge and switching to Joliet.");</div><div class='add'>+			sbi-&gt;s_rock = 0;</div><div class='add'>+			inode = NULL;</div><div class='add'>+		} else {</div><div class='add'>+			goto out_no_root;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Fix for broken CDs with Rock Ridge and empty ISO root directory but</div><div class='hunk'>@@ -946,12 +919,12 @@ root_found:</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (opt.check == 'u') {</div><div class='add'>+	if (opt-&gt;check == 'u') {</div><div class='ctx'> 		/* Only Joliet is case insensitive by default */</div><div class='ctx'> 		if (joliet_level)</div><div class='del'>-			opt.check = 'r';</div><div class='add'>+			opt-&gt;check = 'r';</div><div class='ctx'> 		else</div><div class='del'>-			opt.check = 's';</div><div class='add'>+			opt-&gt;check = 's';</div><div class='ctx'> 	}</div><div class='ctx'> 	sbi-&gt;s_joliet_level = joliet_level;</div><div class='ctx'> </div><div class='hunk'>@@ -966,12 +939,12 @@ root_found:</div><div class='ctx'> 	table = 0;</div><div class='ctx'> 	if (joliet_level)</div><div class='ctx'> 		table += 2;</div><div class='del'>-	if (opt.check == 'r')</div><div class='add'>+	if (opt-&gt;check == 'r')</div><div class='ctx'> 		table++;</div><div class='del'>-	sbi-&gt;s_check = opt.check;</div><div class='add'>+	sbi-&gt;s_check = opt-&gt;check;</div><div class='ctx'> </div><div class='ctx'> 	if (table)</div><div class='del'>-		s-&gt;s_d_op = &amp;isofs_dentry_ops[table - 1];</div><div class='add'>+		set_default_d_op(s, &amp;isofs_dentry_ops[table - 1]);</div><div class='ctx'> </div><div class='ctx'> 	/* get the root dentry */</div><div class='ctx'> 	s-&gt;s_root = d_make_root(inode);</div><div class='hunk'>@@ -980,8 +953,6 @@ root_found:</div><div class='ctx'> 		goto out_no_inode;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	kfree(opt.iocharset);</div><div class='del'>-</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1009,7 +980,7 @@ out_bad_zone_size:</div><div class='ctx'> 	goto out_freebh;</div><div class='ctx'> out_bad_size:</div><div class='ctx'> 	printk(KERN_WARNING "ISOFS: Logical zone size(%d) &lt; hardware blocksize(%u)\n",</div><div class='del'>-		orig_zonesize, opt.blocksize);</div><div class='add'>+		orig_zonesize, opt-&gt;blocksize);</div><div class='ctx'> 	goto out_freebh;</div><div class='ctx'> out_unknown_format:</div><div class='ctx'> 	if (!silent)</div><div class='hunk'>@@ -1019,7 +990,6 @@ out_freebh:</div><div class='ctx'> 	brelse(bh);</div><div class='ctx'> 	brelse(pri_bh);</div><div class='ctx'> out_freesbi:</div><div class='del'>-	kfree(opt.iocharset);</div><div class='ctx'> 	kfree(sbi);</div><div class='ctx'> 	s-&gt;s_fs_info = NULL;</div><div class='ctx'> 	return error;</div><div class='hunk'>@@ -1174,9 +1144,9 @@ struct buffer_head *isofs_bread(struct inode *inode, sector_t block)</div><div class='ctx'> 	return sb_bread(inode-&gt;i_sb, blknr);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int isofs_readpage(struct file *file, struct page *page)</div><div class='add'>+static int isofs_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	return mpage_readpage(page, isofs_get_block);</div><div class='add'>+	return mpage_read_folio(folio, isofs_get_block);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void isofs_readahead(struct readahead_control *rac)</div><div class='hunk'>@@ -1190,7 +1160,7 @@ static sector_t _isofs_bmap(struct address_space *mapping, sector_t block)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct address_space_operations isofs_aops = {</div><div class='del'>-	.readpage = isofs_readpage,</div><div class='add'>+	.read_folio = isofs_read_folio,</div><div class='ctx'> 	.readahead = isofs_readahead,</div><div class='ctx'> 	.bmap = _isofs_bmap</div><div class='ctx'> };</div><div class='hunk'>@@ -1277,13 +1247,11 @@ static int isofs_read_level3_size(struct inode *inode)</div><div class='ctx'> 	} while (more_entries);</div><div class='ctx'> out:</div><div class='ctx'> 	kfree(tmpde);</div><div class='del'>-	if (bh)</div><div class='del'>-		brelse(bh);</div><div class='add'>+	brelse(bh);</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> out_nomem:</div><div class='del'>-	if (bh)</div><div class='del'>-		brelse(bh);</div><div class='add'>+	brelse(bh);</div><div class='ctx'> 	return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> out_noread:</div><div class='hunk'>@@ -1312,6 +1280,7 @@ static int isofs_read_inode(struct inode *inode, int relocated)</div><div class='ctx'> 	unsigned long offset;</div><div class='ctx'> 	struct iso_inode_info *ei = ISOFS_I(inode);</div><div class='ctx'> 	int ret = -EIO;</div><div class='add'>+	struct timespec64 ts;</div><div class='ctx'> </div><div class='ctx'> 	block = ei-&gt;i_iget5_block;</div><div class='ctx'> 	bh = sb_bread(inode-&gt;i_sb, block);</div><div class='hunk'>@@ -1424,13 +1393,10 @@ static int isofs_read_inode(struct inode *inode, int relocated)</div><div class='ctx'> 			inode-&gt;i_ino, de-&gt;flags[-high_sierra]);</div><div class='ctx'> 	}</div><div class='ctx'> #endif</div><div class='del'>-</div><div class='del'>-	inode-&gt;i_mtime.tv_sec =</div><div class='del'>-	inode-&gt;i_atime.tv_sec =</div><div class='del'>-	inode-&gt;i_ctime.tv_sec = iso_date(de-&gt;date, high_sierra);</div><div class='del'>-	inode-&gt;i_mtime.tv_nsec =</div><div class='del'>-	inode-&gt;i_atime.tv_nsec =</div><div class='del'>-	inode-&gt;i_ctime.tv_nsec = 0;</div><div class='add'>+	ts = iso_date(de-&gt;date, high_sierra ? ISO_DATE_HIGH_SIERRA : 0);</div><div class='add'>+	inode_set_ctime_to_ts(inode, ts);</div><div class='add'>+	inode_set_atime_to_ts(inode, ts);</div><div class='add'>+	inode_set_mtime_to_ts(inode, ts);</div><div class='ctx'> </div><div class='ctx'> 	ei-&gt;i_first_extent = (isonum_733(de-&gt;extent) +</div><div class='ctx'> 			isonum_711(de-&gt;ext_attr_length));</div><div class='hunk'>@@ -1479,15 +1445,21 @@ static int isofs_read_inode(struct inode *inode, int relocated)</div><div class='ctx'> 		inode-&gt;i_op = &amp;page_symlink_inode_operations;</div><div class='ctx'> 		inode_nohighmem(inode);</div><div class='ctx'> 		inode-&gt;i_data.a_ops = &amp;isofs_symlink_aops;</div><div class='del'>-	} else</div><div class='add'>+	} else if (S_ISCHR(inode-&gt;i_mode) || S_ISBLK(inode-&gt;i_mode) ||</div><div class='add'>+		   S_ISFIFO(inode-&gt;i_mode) || S_ISSOCK(inode-&gt;i_mode)) {</div><div class='ctx'> 		/* XXX - parse_rock_ridge_inode() had already set i_rdev. */</div><div class='ctx'> 		init_special_inode(inode, inode-&gt;i_mode, inode-&gt;i_rdev);</div><div class='add'>+	} else {</div><div class='add'>+		printk(KERN_DEBUG "ISOFS: Invalid file type 0%04o for inode %lu.\n",</div><div class='add'>+			inode-&gt;i_mode, inode-&gt;i_ino);</div><div class='add'>+		ret = -EIO;</div><div class='add'>+		goto fail;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	ret = 0;</div><div class='ctx'> out:</div><div class='ctx'> 	kfree(tmpde);</div><div class='del'>-	if (bh)</div><div class='del'>-		brelse(bh);</div><div class='add'>+	brelse(bh);</div><div class='ctx'> 	return ret;</div><div class='ctx'> </div><div class='ctx'> out_badread:</div><div class='hunk'>@@ -1548,7 +1520,7 @@ struct inode *__isofs_iget(struct super_block *sb,</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='del'>-	if (inode-&gt;i_state &amp; I_NEW) {</div><div class='add'>+	if (inode_state_read_once(inode) &amp; I_NEW) {</div><div class='ctx'> 		ret = isofs_read_inode(inode, relocated);</div><div class='ctx'> 		if (ret &lt; 0) {</div><div class='ctx'> 			iget_failed(inode);</div><div class='hunk'>@@ -1561,18 +1533,66 @@ struct inode *__isofs_iget(struct super_block *sb,</div><div class='ctx'> 	return inode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct dentry *isofs_mount(struct file_system_type *fs_type,</div><div class='del'>-	int flags, const char *dev_name, void *data)</div><div class='add'>+static int isofs_get_tree(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	return mount_bdev(fs_type, flags, dev_name, data, isofs_fill_super);</div><div class='add'>+	return get_tree_bdev(fc, isofs_fill_super);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void isofs_free_fc(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct isofs_options *opt = fc-&gt;fs_private;</div><div class='add'>+</div><div class='add'>+	kfree(opt-&gt;iocharset);</div><div class='add'>+	kfree(opt);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct fs_context_operations isofs_context_ops = {</div><div class='add'>+	.parse_param	= isofs_parse_param,</div><div class='add'>+	.get_tree	= isofs_get_tree,</div><div class='add'>+	.reconfigure	= isofs_reconfigure,</div><div class='add'>+	.free		= isofs_free_fc,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int isofs_init_fs_context(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct isofs_options *opt;</div><div class='add'>+</div><div class='add'>+	opt = kzalloc(sizeof(*opt), GFP_KERNEL);</div><div class='add'>+	if (!opt)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	opt-&gt;map = 'n';</div><div class='add'>+	opt-&gt;rock = 1;</div><div class='add'>+	opt-&gt;joliet = 1;</div><div class='add'>+	opt-&gt;cruft = 0;</div><div class='add'>+	opt-&gt;hide = 0;</div><div class='add'>+	opt-&gt;showassoc = 0;</div><div class='add'>+	opt-&gt;check = 'u';		/* unset */</div><div class='add'>+	opt-&gt;nocompress = 0;</div><div class='add'>+	opt-&gt;blocksize = 1024;</div><div class='add'>+	opt-&gt;fmode = opt-&gt;dmode = ISOFS_INVALID_MODE;</div><div class='add'>+	opt-&gt;uid_set = 0;</div><div class='add'>+	opt-&gt;gid_set = 0;</div><div class='add'>+	opt-&gt;gid = GLOBAL_ROOT_GID;</div><div class='add'>+	opt-&gt;uid = GLOBAL_ROOT_UID;</div><div class='add'>+	opt-&gt;iocharset = NULL;</div><div class='add'>+	opt-&gt;overriderockperm = 0;</div><div class='add'>+	opt-&gt;session = -1;</div><div class='add'>+	opt-&gt;sbsector = -1;</div><div class='add'>+</div><div class='add'>+	fc-&gt;fs_private = opt;</div><div class='add'>+	fc-&gt;ops = &amp;isofs_context_ops;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct file_system_type iso9660_fs_type = {</div><div class='ctx'> 	.owner		= THIS_MODULE,</div><div class='ctx'> 	.name		= "iso9660",</div><div class='del'>-	.mount		= isofs_mount,</div><div class='ctx'> 	.kill_sb	= kill_block_super,</div><div class='ctx'> 	.fs_flags	= FS_REQUIRES_DEV,</div><div class='add'>+	.init_fs_context = isofs_init_fs_context,</div><div class='add'>+	.parameters	= isofs_param_spec,</div><div class='ctx'> };</div><div class='ctx'> MODULE_ALIAS_FS("iso9660");</div><div class='ctx'> MODULE_ALIAS("iso9660");</div><div class='hunk'>@@ -1612,4 +1632,5 @@ static void __exit exit_iso9660_fs(void)</div><div class='ctx'> </div><div class='ctx'> module_init(init_iso9660_fs)</div><div class='ctx'> module_exit(exit_iso9660_fs)</div><div class='add'>+MODULE_DESCRIPTION("ISO 9660 CDROM file system support");</div><div class='ctx'> MODULE_LICENSE("GPL");</div><div class='head'>diff --git a/fs/isofs/isofs.h b/fs/isofs/isofs.h<br/>index dcdc191ed183..506555837533 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/isofs/isofs.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/isofs/isofs.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/isofs/isofs.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/isofs/isofs.h</a></div><div class='hunk'>@@ -3,7 +3,7 @@</div><div class='ctx'> #include &lt;linux/buffer_head.h&gt;</div><div class='ctx'> #include &lt;linux/exportfs.h&gt;</div><div class='ctx'> #include &lt;linux/iso_fs.h&gt;</div><div class='del'>-#include &lt;asm/unaligned.h&gt;</div><div class='add'>+#include &lt;linux/unaligned.h&gt;</div><div class='ctx'> </div><div class='ctx'> enum isofs_file_format {</div><div class='ctx'> 	isofs_file_normal = 0,</div><div class='hunk'>@@ -106,7 +106,9 @@ static inline unsigned int isonum_733(u8 *p)</div><div class='ctx'> 	/* Ignore bigendian datum due to broken mastering programs */</div><div class='ctx'> 	return get_unaligned_le32(p);</div><div class='ctx'> }</div><div class='del'>-extern int iso_date(u8 *, int);</div><div class='add'>+#define ISO_DATE_HIGH_SIERRA (1 &lt;&lt; 0)</div><div class='add'>+#define ISO_DATE_LONG_FORM (1 &lt;&lt; 1)</div><div class='add'>+struct timespec64 iso_date(u8 *p, int flags);</div><div class='ctx'> </div><div class='ctx'> struct inode;		/* To make gcc happy */</div><div class='ctx'> </div><div class='head'>diff --git a/fs/isofs/rock.c b/fs/isofs/rock.c<br/>index 4880146babaf..576498245b9d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/isofs/rock.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/isofs/rock.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/isofs/rock.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/isofs/rock.c</a></div><div class='hunk'>@@ -412,7 +412,12 @@ repeat:</div><div class='ctx'> 				}</div><div class='ctx'> 			}</div><div class='ctx'> 			break;</div><div class='del'>-		case SIG('T', 'F'):</div><div class='add'>+		case SIG('T', 'F'): {</div><div class='add'>+			int flags, size, slen;</div><div class='add'>+</div><div class='add'>+			flags = rr-&gt;u.TF.flags &amp; TF_LONG_FORM ? ISO_DATE_LONG_FORM : 0;</div><div class='add'>+			size = rr-&gt;u.TF.flags &amp; TF_LONG_FORM ? 17 : 7;</div><div class='add'>+			slen = rr-&gt;len - 5;</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Some RRIP writers incorrectly place ctime in the</div><div class='ctx'> 			 * TF_CREATE field. Try to handle this correctly for</div><div class='hunk'>@@ -420,31 +425,28 @@ repeat:</div><div class='ctx'> 			 */</div><div class='ctx'> 			/* Rock ridge never appears on a High Sierra disk */</div><div class='ctx'> 			cnt = 0;</div><div class='del'>-			if (rr-&gt;u.TF.flags &amp; TF_CREATE) {</div><div class='del'>-				inode-&gt;i_ctime.tv_sec =</div><div class='del'>-				    iso_date(rr-&gt;u.TF.times[cnt++].time,</div><div class='del'>-					     0);</div><div class='del'>-				inode-&gt;i_ctime.tv_nsec = 0;</div><div class='add'>+			if ((rr-&gt;u.TF.flags &amp; TF_CREATE) &amp;&amp; size &lt;= slen) {</div><div class='add'>+				inode_set_ctime_to_ts(inode,</div><div class='add'>+						iso_date(rr-&gt;u.TF.data + size * cnt++, flags));</div><div class='add'>+				slen -= size;</div><div class='ctx'> 			}</div><div class='del'>-			if (rr-&gt;u.TF.flags &amp; TF_MODIFY) {</div><div class='del'>-				inode-&gt;i_mtime.tv_sec =</div><div class='del'>-				    iso_date(rr-&gt;u.TF.times[cnt++].time,</div><div class='del'>-					     0);</div><div class='del'>-				inode-&gt;i_mtime.tv_nsec = 0;</div><div class='add'>+			if ((rr-&gt;u.TF.flags &amp; TF_MODIFY) &amp;&amp; size &lt;= slen) {</div><div class='add'>+				inode_set_mtime_to_ts(inode,</div><div class='add'>+						iso_date(rr-&gt;u.TF.data + size * cnt++, flags));</div><div class='add'>+				slen -= size;</div><div class='ctx'> 			}</div><div class='del'>-			if (rr-&gt;u.TF.flags &amp; TF_ACCESS) {</div><div class='del'>-				inode-&gt;i_atime.tv_sec =</div><div class='del'>-				    iso_date(rr-&gt;u.TF.times[cnt++].time,</div><div class='del'>-					     0);</div><div class='del'>-				inode-&gt;i_atime.tv_nsec = 0;</div><div class='add'>+			if ((rr-&gt;u.TF.flags &amp; TF_ACCESS) &amp;&amp; size &lt;= slen) {</div><div class='add'>+				inode_set_atime_to_ts(inode,</div><div class='add'>+						iso_date(rr-&gt;u.TF.data + size * cnt++, flags));</div><div class='add'>+				slen -= size;</div><div class='ctx'> 			}</div><div class='del'>-			if (rr-&gt;u.TF.flags &amp; TF_ATTRIBUTES) {</div><div class='del'>-				inode-&gt;i_ctime.tv_sec =</div><div class='del'>-				    iso_date(rr-&gt;u.TF.times[cnt++].time,</div><div class='del'>-					     0);</div><div class='del'>-				inode-&gt;i_ctime.tv_nsec = 0;</div><div class='add'>+			if ((rr-&gt;u.TF.flags &amp; TF_ATTRIBUTES) &amp;&amp; size &lt;= slen) {</div><div class='add'>+				inode_set_ctime_to_ts(inode,</div><div class='add'>+						iso_date(rr-&gt;u.TF.data + size * cnt++, flags));</div><div class='add'>+				slen -= size;</div><div class='ctx'> 			}</div><div class='ctx'> 			break;</div><div class='add'>+		}</div><div class='ctx'> 		case SIG('S', 'L'):</div><div class='ctx'> 			{</div><div class='ctx'> 				int slen;</div><div class='hunk'>@@ -533,9 +535,9 @@ repeat:</div><div class='ctx'> 			inode-&gt;i_rdev = reloc-&gt;i_rdev;</div><div class='ctx'> 			inode-&gt;i_size = reloc-&gt;i_size;</div><div class='ctx'> 			inode-&gt;i_blocks = reloc-&gt;i_blocks;</div><div class='del'>-			inode-&gt;i_atime = reloc-&gt;i_atime;</div><div class='del'>-			inode-&gt;i_ctime = reloc-&gt;i_ctime;</div><div class='del'>-			inode-&gt;i_mtime = reloc-&gt;i_mtime;</div><div class='add'>+			inode_set_atime_to_ts(inode, inode_get_atime(reloc));</div><div class='add'>+			inode_set_ctime_to_ts(inode, inode_get_ctime(reloc));</div><div class='add'>+			inode_set_mtime_to_ts(inode, inode_get_mtime(reloc));</div><div class='ctx'> 			iput(reloc);</div><div class='ctx'> 			break;</div><div class='ctx'> #ifdef CONFIG_ZISOFS</div><div class='hunk'>@@ -687,15 +689,15 @@ int parse_rock_ridge_inode(struct iso_directory_record *de, struct inode *inode,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * readpage() for symlinks: reads symlink contents into the page and either</div><div class='add'>+ * read_folio() for symlinks: reads symlink contents into the folio and either</div><div class='ctx'>  * makes it uptodate and returns 0 or returns error (-EIO)</div><div class='ctx'>  */</div><div class='del'>-static int rock_ridge_symlink_readpage(struct file *file, struct page *page)</div><div class='add'>+static int rock_ridge_symlink_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	struct iso_inode_info *ei = ISOFS_I(inode);</div><div class='ctx'> 	struct isofs_sb_info *sbi = ISOFS_SB(inode-&gt;i_sb);</div><div class='del'>-	char *link = page_address(page);</div><div class='add'>+	char *link = folio_address(folio);</div><div class='ctx'> 	unsigned long bufsize = ISOFS_BUFFER_SIZE(inode);</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> 	char *rpnt = link;</div><div class='hunk'>@@ -782,9 +784,10 @@ repeat:</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	brelse(bh);</div><div class='ctx'> 	*rpnt = '\0';</div><div class='del'>-	SetPageUptodate(page);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	return 0;</div><div class='add'>+	ret = 0;</div><div class='add'>+end:</div><div class='add'>+	folio_end_read(folio, ret == 0);</div><div class='add'>+	return ret;</div><div class='ctx'> </div><div class='ctx'> 	/* error exit from macro */</div><div class='ctx'> out:</div><div class='hunk'>@@ -798,11 +801,10 @@ out_bad_span:</div><div class='ctx'> fail:</div><div class='ctx'> 	brelse(bh);</div><div class='ctx'> error:</div><div class='del'>-	SetPageError(page);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	return -EIO;</div><div class='add'>+	ret = -EIO;</div><div class='add'>+	goto end;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations isofs_symlink_aops = {</div><div class='del'>-	.readpage = rock_ridge_symlink_readpage</div><div class='add'>+	.read_folio = rock_ridge_symlink_read_folio</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/isofs/rock.h b/fs/isofs/rock.h<br/>index ee9660e9671c..c0856fa9bb6a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/isofs/rock.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/isofs/rock.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/isofs/rock.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/isofs/rock.h</a></div><div class='hunk'>@@ -44,7 +44,7 @@ struct RR_PN_s {</div><div class='ctx'> struct SL_component {</div><div class='ctx'> 	__u8 flags;</div><div class='ctx'> 	__u8 len;</div><div class='del'>-	__u8 text[];</div><div class='add'>+	__u8 text[] __counted_by(len);</div><div class='ctx'> } __attribute__ ((packed));</div><div class='ctx'> </div><div class='ctx'> struct RR_SL_s {</div><div class='hunk'>@@ -65,13 +65,9 @@ struct RR_PL_s {</div><div class='ctx'> 	__u8 location[8];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-struct stamp {</div><div class='del'>-	__u8 time[7];		/* actually 6 unsigned, 1 signed */</div><div class='del'>-} __attribute__ ((packed));</div><div class='del'>-</div><div class='ctx'> struct RR_TF_s {</div><div class='ctx'> 	__u8 flags;</div><div class='del'>-	struct stamp times[];	/* Variable number of these beasts */</div><div class='add'>+	__u8 data[];</div><div class='ctx'> } __attribute__ ((packed));</div><div class='ctx'> </div><div class='ctx'> /* Linux-specific extension for transparent decompression */</div><div class='head'>diff --git a/fs/isofs/util.c b/fs/isofs/util.c<br/>index e88dba721661..42f479da0b28 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/isofs/util.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/isofs/util.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/isofs/util.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/isofs/util.c</a></div><div class='hunk'>@@ -16,29 +16,44 @@</div><div class='ctx'>  * to GMT.  Thus  we should always be correct.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-int iso_date(u8 *p, int flag)</div><div class='add'>+struct timespec64 iso_date(u8 *p, int flags)</div><div class='ctx'> {</div><div class='ctx'> 	int year, month, day, hour, minute, second, tz;</div><div class='del'>-	int crtime;</div><div class='add'>+	struct timespec64 ts;</div><div class='add'>+</div><div class='add'>+	if (flags &amp; ISO_DATE_LONG_FORM) {</div><div class='add'>+		year = (p[0] - '0') * 1000 +</div><div class='add'>+		       (p[1] - '0') * 100 +</div><div class='add'>+		       (p[2] - '0') * 10 +</div><div class='add'>+		       (p[3] - '0') - 1900;</div><div class='add'>+		month = ((p[4] - '0') * 10 + (p[5] - '0'));</div><div class='add'>+		day = ((p[6] - '0') * 10 + (p[7] - '0'));</div><div class='add'>+		hour = ((p[8] - '0') * 10 + (p[9] - '0'));</div><div class='add'>+		minute = ((p[10] - '0') * 10 + (p[11] - '0'));</div><div class='add'>+		second = ((p[12] - '0') * 10 + (p[13] - '0'));</div><div class='add'>+		ts.tv_nsec = ((p[14] - '0') * 10 + (p[15] - '0')) * 10000000;</div><div class='add'>+		tz = p[16];</div><div class='add'>+	} else {</div><div class='add'>+		year = p[0];</div><div class='add'>+		month = p[1];</div><div class='add'>+		day = p[2];</div><div class='add'>+		hour = p[3];</div><div class='add'>+		minute = p[4];</div><div class='add'>+		second = p[5];</div><div class='add'>+		ts.tv_nsec = 0;</div><div class='add'>+		/* High sierra has no time zone */</div><div class='add'>+		tz = flags &amp; ISO_DATE_HIGH_SIERRA ? 0 : p[6];</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	year = p[0];</div><div class='del'>-	month = p[1];</div><div class='del'>-	day = p[2];</div><div class='del'>-	hour = p[3];</div><div class='del'>-	minute = p[4];</div><div class='del'>-	second = p[5];</div><div class='del'>-	if (flag == 0) tz = p[6]; /* High sierra has no time zone */</div><div class='del'>-	else tz = 0;</div><div class='del'>-	</div><div class='ctx'> 	if (year &lt; 0) {</div><div class='del'>-		crtime = 0;</div><div class='add'>+		ts.tv_sec = 0;</div><div class='ctx'> 	} else {</div><div class='del'>-		crtime = mktime64(year+1900, month, day, hour, minute, second);</div><div class='add'>+		ts.tv_sec = mktime64(year+1900, month, day, hour, minute, second);</div><div class='ctx'> </div><div class='ctx'> 		/* sign extend */</div><div class='ctx'> 		if (tz &amp; 0x80)</div><div class='ctx'> 			tz |= (-1 &lt;&lt; 8);</div><div class='del'>-		</div><div class='add'>+</div><div class='ctx'> 		/* </div><div class='ctx'> 		 * The timezone offset is unreliable on some disks,</div><div class='ctx'> 		 * so we make a sanity check.  In no case is it ever</div><div class='hunk'>@@ -65,7 +80,7 @@ int iso_date(u8 *p, int flag)</div><div class='ctx'> 		 * for pointing out the sign error.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (-52 &lt;= tz &amp;&amp; tz &lt;= 52)</div><div class='del'>-			crtime -= tz * 15 * 60;</div><div class='add'>+			ts.tv_sec -= tz * 15 * 60;</div><div class='ctx'> 	}</div><div class='del'>-	return crtime;</div><div class='del'>-}		</div><div class='add'>+	return ts;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/jbd2/Kconfig b/fs/jbd2/Kconfig<br/>index 4ad2c67f93f1..9c19e1512101 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jbd2/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jbd2/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jbd2/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jbd2/Kconfig</a></div><div class='hunk'>@@ -2,8 +2,6 @@</div><div class='ctx'> config JBD2</div><div class='ctx'> 	tristate</div><div class='ctx'> 	select CRC32</div><div class='del'>-	select CRYPTO</div><div class='del'>-	select CRYPTO_CRC32C</div><div class='ctx'> 	help</div><div class='ctx'> 	  This is a generic journaling layer for block devices that support</div><div class='ctx'> 	  both 32-bit and 64-bit block numbers.  It is currently used by</div><div class='head'>diff --git a/fs/jbd2/checkpoint.c b/fs/jbd2/checkpoint.c<br/>index 746132998c57..de89c5bef607 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jbd2/checkpoint.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jbd2/checkpoint.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jbd2/checkpoint.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jbd2/checkpoint.c</a></div><div class='hunk'>@@ -27,7 +27,7 @@</div><div class='ctx'>  *</div><div class='ctx'>  * Called with j_list_lock held.</div><div class='ctx'>  */</div><div class='del'>-static inline void __buffer_unlink_first(struct journal_head *jh)</div><div class='add'>+static inline void __buffer_unlink(struct journal_head *jh)</div><div class='ctx'> {</div><div class='ctx'> 	transaction_t *transaction = jh-&gt;b_cp_transaction;</div><div class='ctx'> </div><div class='hunk'>@@ -41,57 +41,6 @@ static inline void __buffer_unlink_first(struct journal_head *jh)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Unlink a buffer from a transaction checkpoint(io) list.</div><div class='del'>- *</div><div class='del'>- * Called with j_list_lock held.</div><div class='del'>- */</div><div class='del'>-static inline void __buffer_unlink(struct journal_head *jh)</div><div class='del'>-{</div><div class='del'>-	transaction_t *transaction = jh-&gt;b_cp_transaction;</div><div class='del'>-</div><div class='del'>-	__buffer_unlink_first(jh);</div><div class='del'>-	if (transaction-&gt;t_checkpoint_io_list == jh) {</div><div class='del'>-		transaction-&gt;t_checkpoint_io_list = jh-&gt;b_cpnext;</div><div class='del'>-		if (transaction-&gt;t_checkpoint_io_list == jh)</div><div class='del'>-			transaction-&gt;t_checkpoint_io_list = NULL;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Move a buffer from the checkpoint list to the checkpoint io list</div><div class='del'>- *</div><div class='del'>- * Called with j_list_lock held</div><div class='del'>- */</div><div class='del'>-static inline void __buffer_relink_io(struct journal_head *jh)</div><div class='del'>-{</div><div class='del'>-	transaction_t *transaction = jh-&gt;b_cp_transaction;</div><div class='del'>-</div><div class='del'>-	__buffer_unlink_first(jh);</div><div class='del'>-</div><div class='del'>-	if (!transaction-&gt;t_checkpoint_io_list) {</div><div class='del'>-		jh-&gt;b_cpnext = jh-&gt;b_cpprev = jh;</div><div class='del'>-	} else {</div><div class='del'>-		jh-&gt;b_cpnext = transaction-&gt;t_checkpoint_io_list;</div><div class='del'>-		jh-&gt;b_cpprev = transaction-&gt;t_checkpoint_io_list-&gt;b_cpprev;</div><div class='del'>-		jh-&gt;b_cpprev-&gt;b_cpnext = jh;</div><div class='del'>-		jh-&gt;b_cpnext-&gt;b_cpprev = jh;</div><div class='del'>-	}</div><div class='del'>-	transaction-&gt;t_checkpoint_io_list = jh;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Check a checkpoint buffer could be release or not.</div><div class='del'>- *</div><div class='del'>- * Requires j_list_lock</div><div class='del'>- */</div><div class='del'>-static inline bool __cp_buffer_busy(struct journal_head *jh)</div><div class='del'>-{</div><div class='del'>-	struct buffer_head *bh = jh2bh(jh);</div><div class='del'>-</div><div class='del'>-	return (jh-&gt;b_transaction || buffer_locked(bh) || buffer_dirty(bh));</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * __jbd2_log_wait_for_space: wait until there is space in the journal.</div><div class='ctx'>  *</div><div class='ctx'>  * Called under j-state_lock *only*.  It will be unlocked if we have to wait</div><div class='hunk'>@@ -130,17 +79,23 @@ __releases(&amp;journal-&gt;j_state_lock)</div><div class='ctx'> 		if (space_left &lt; nblocks) {</div><div class='ctx'> 			int chkpt = journal-&gt;j_checkpoint_transactions != NULL;</div><div class='ctx'> 			tid_t tid = 0;</div><div class='add'>+			bool has_transaction = false;</div><div class='ctx'> </div><div class='del'>-			if (journal-&gt;j_committing_transaction)</div><div class='add'>+			if (journal-&gt;j_committing_transaction) {</div><div class='ctx'> 				tid = journal-&gt;j_committing_transaction-&gt;t_tid;</div><div class='add'>+				has_transaction = true;</div><div class='add'>+			}</div><div class='ctx'> 			spin_unlock(&amp;journal-&gt;j_list_lock);</div><div class='ctx'> 			write_unlock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> 			if (chkpt) {</div><div class='ctx'> 				jbd2_log_do_checkpoint(journal);</div><div class='del'>-			} else if (jbd2_cleanup_journal_tail(journal) == 0) {</div><div class='del'>-				/* We were able to recover space; yay! */</div><div class='add'>+			} else if (jbd2_cleanup_journal_tail(journal) &lt;= 0) {</div><div class='add'>+				/*</div><div class='add'>+				 * We were able to recover space or the</div><div class='add'>+				 * journal was aborted due to an error.</div><div class='add'>+				 */</div><div class='ctx'> 				;</div><div class='del'>-			} else if (tid) {</div><div class='add'>+			} else if (has_transaction) {</div><div class='ctx'> 				/*</div><div class='ctx'> 				 * jbd2_journal_commit_transaction() may want</div><div class='ctx'> 				 * to take the checkpoint_mutex if JBD2_FLUSHED</div><div class='hunk'>@@ -158,7 +113,7 @@ __releases(&amp;journal-&gt;j_state_lock)</div><div class='ctx'> 				       "journal space in %s\n", __func__,</div><div class='ctx'> 				       journal-&gt;j_devname);</div><div class='ctx'> 				WARN_ON(1);</div><div class='del'>-				jbd2_journal_abort(journal, -EIO);</div><div class='add'>+				jbd2_journal_abort(journal, -ENOSPC);</div><div class='ctx'> 			}</div><div class='ctx'> 			write_lock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> 		} else {</div><div class='hunk'>@@ -176,13 +131,14 @@ __flush_batch(journal_t *journal, int *batch_count)</div><div class='ctx'> </div><div class='ctx'> 	blk_start_plug(&amp;plug);</div><div class='ctx'> 	for (i = 0; i &lt; *batch_count; i++)</div><div class='del'>-		write_dirty_buffer(journal-&gt;j_chkpt_bhs[i], REQ_SYNC);</div><div class='add'>+		write_dirty_buffer(journal-&gt;j_chkpt_bhs[i], JBD2_JOURNAL_REQ_FLAGS);</div><div class='ctx'> 	blk_finish_plug(&amp;plug);</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; *batch_count; i++) {</div><div class='ctx'> 		struct buffer_head *bh = journal-&gt;j_chkpt_bhs[i];</div><div class='ctx'> 		BUFFER_TRACE(bh, "brelse");</div><div class='ctx'> 		__brelse(bh);</div><div class='add'>+		journal-&gt;j_chkpt_bhs[i] = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> 	*batch_count = 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -203,7 +159,7 @@ int jbd2_log_do_checkpoint(journal_t *journal)</div><div class='ctx'> 	tid_t			this_tid;</div><div class='ctx'> 	int			result, batch_count = 0;</div><div class='ctx'> </div><div class='del'>-	jbd_debug(1, "Start checkpoint\n");</div><div class='add'>+	jbd2_debug(1, "Start checkpoint\n");</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * First thing: if there are any transactions in the log which</div><div class='hunk'>@@ -212,7 +168,7 @@ int jbd2_log_do_checkpoint(journal_t *journal)</div><div class='ctx'> 	 */</div><div class='ctx'> 	result = jbd2_cleanup_journal_tail(journal);</div><div class='ctx'> 	trace_jbd2_checkpoint(journal, result);</div><div class='del'>-	jbd_debug(1, "cleanup_journal_tail returned %d\n", result);</div><div class='add'>+	jbd2_debug(1, "cleanup_journal_tail returned %d\n", result);</div><div class='ctx'> 	if (result &lt;= 0)</div><div class='ctx'> 		return result;</div><div class='ctx'> </div><div class='hunk'>@@ -242,15 +198,6 @@ restart:</div><div class='ctx'> 		jh = transaction-&gt;t_checkpoint_list;</div><div class='ctx'> 		bh = jh2bh(jh);</div><div class='ctx'> </div><div class='del'>-		if (buffer_locked(bh)) {</div><div class='del'>-			get_bh(bh);</div><div class='del'>-			spin_unlock(&amp;journal-&gt;j_list_lock);</div><div class='del'>-			wait_on_buffer(bh);</div><div class='del'>-			/* the journal_head may have gone by now */</div><div class='del'>-			BUFFER_TRACE(bh, "brelse");</div><div class='del'>-			__brelse(bh);</div><div class='del'>-			goto retry;</div><div class='del'>-		}</div><div class='ctx'> 		if (jh-&gt;b_transaction != NULL) {</div><div class='ctx'> 			transaction_t *t = jh-&gt;b_transaction;</div><div class='ctx'> 			tid_t tid = t-&gt;t_tid;</div><div class='hunk'>@@ -285,30 +232,50 @@ restart:</div><div class='ctx'> 			spin_lock(&amp;journal-&gt;j_list_lock);</div><div class='ctx'> 			goto restart;</div><div class='ctx'> 		}</div><div class='del'>-		if (!buffer_dirty(bh)) {</div><div class='add'>+		if (!trylock_buffer(bh)) {</div><div class='add'>+			/*</div><div class='add'>+			 * The buffer is locked, it may be writing back, or</div><div class='add'>+			 * flushing out in the last couple of cycles, or</div><div class='add'>+			 * re-adding into a new transaction, need to check</div><div class='add'>+			 * it again until it's unlocked.</div><div class='add'>+			 */</div><div class='add'>+			get_bh(bh);</div><div class='add'>+			spin_unlock(&amp;journal-&gt;j_list_lock);</div><div class='add'>+			wait_on_buffer(bh);</div><div class='add'>+			/* the journal_head may have gone by now */</div><div class='add'>+			BUFFER_TRACE(bh, "brelse");</div><div class='add'>+			__brelse(bh);</div><div class='add'>+			goto retry;</div><div class='add'>+		} else if (!buffer_dirty(bh)) {</div><div class='add'>+			unlock_buffer(bh);</div><div class='ctx'> 			BUFFER_TRACE(bh, "remove from checkpoint");</div><div class='del'>-			if (__jbd2_journal_remove_checkpoint(jh))</div><div class='del'>-				/* The transaction was released; we're done */</div><div class='add'>+			/*</div><div class='add'>+			 * If the transaction was released or the checkpoint</div><div class='add'>+			 * list was empty, we're done.</div><div class='add'>+			 */</div><div class='add'>+			if (__jbd2_journal_remove_checkpoint(jh) ||</div><div class='add'>+			    !transaction-&gt;t_checkpoint_list)</div><div class='ctx'> 				goto out;</div><div class='del'>-			continue;</div><div class='add'>+		} else {</div><div class='add'>+			unlock_buffer(bh);</div><div class='add'>+			/*</div><div class='add'>+			 * We are about to write the buffer, it could be</div><div class='add'>+			 * raced by some other transaction shrink or buffer</div><div class='add'>+			 * re-log logic once we release the j_list_lock,</div><div class='add'>+			 * leave it on the checkpoint list and check status</div><div class='add'>+			 * again to make sure it's clean.</div><div class='add'>+			 */</div><div class='add'>+			BUFFER_TRACE(bh, "queue");</div><div class='add'>+			get_bh(bh);</div><div class='add'>+			J_ASSERT_BH(bh, !buffer_jwrite(bh));</div><div class='add'>+			journal-&gt;j_chkpt_bhs[batch_count++] = bh;</div><div class='add'>+			transaction-&gt;t_chp_stats.cs_written++;</div><div class='add'>+			transaction-&gt;t_checkpoint_list = jh-&gt;b_cpnext;</div><div class='ctx'> 		}</div><div class='del'>-		/*</div><div class='del'>-		 * Important: we are about to write the buffer, and</div><div class='del'>-		 * possibly block, while still holding the journal</div><div class='del'>-		 * lock.  We cannot afford to let the transaction</div><div class='del'>-		 * logic start messing around with this buffer before</div><div class='del'>-		 * we write it to disk, as that would break</div><div class='del'>-		 * recoverability.</div><div class='del'>-		 */</div><div class='del'>-		BUFFER_TRACE(bh, "queue");</div><div class='del'>-		get_bh(bh);</div><div class='del'>-		J_ASSERT_BH(bh, !buffer_jwrite(bh));</div><div class='del'>-		journal-&gt;j_chkpt_bhs[batch_count++] = bh;</div><div class='del'>-		__buffer_relink_io(jh);</div><div class='del'>-		transaction-&gt;t_chp_stats.cs_written++;</div><div class='add'>+</div><div class='ctx'> 		if ((batch_count == JBD2_NR_BATCH) ||</div><div class='del'>-		    need_resched() ||</div><div class='del'>-		    spin_needbreak(&amp;journal-&gt;j_list_lock))</div><div class='add'>+		    need_resched() || spin_needbreak(&amp;journal-&gt;j_list_lock) ||</div><div class='add'>+		    jh2bh(transaction-&gt;t_checkpoint_list) == journal-&gt;j_chkpt_bhs[0])</div><div class='ctx'> 			goto unlock_and_flush;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -318,42 +285,11 @@ restart:</div><div class='ctx'> 		retry:</div><div class='ctx'> 			if (batch_count)</div><div class='ctx'> 				__flush_batch(journal, &amp;batch_count);</div><div class='add'>+			cond_resched();</div><div class='ctx'> 			spin_lock(&amp;journal-&gt;j_list_lock);</div><div class='ctx'> 			goto restart;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Now we issued all of the transaction's buffers, let's deal</div><div class='del'>-	 * with the buffers that are out for I/O.</div><div class='del'>-	 */</div><div class='del'>-restart2:</div><div class='del'>-	/* Did somebody clean up the transaction in the meanwhile? */</div><div class='del'>-	if (journal-&gt;j_checkpoint_transactions != transaction ||</div><div class='del'>-	    transaction-&gt;t_tid != this_tid)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	while (transaction-&gt;t_checkpoint_io_list) {</div><div class='del'>-		jh = transaction-&gt;t_checkpoint_io_list;</div><div class='del'>-		bh = jh2bh(jh);</div><div class='del'>-		if (buffer_locked(bh)) {</div><div class='del'>-			get_bh(bh);</div><div class='del'>-			spin_unlock(&amp;journal-&gt;j_list_lock);</div><div class='del'>-			wait_on_buffer(bh);</div><div class='del'>-			/* the journal_head may have gone by now */</div><div class='del'>-			BUFFER_TRACE(bh, "brelse");</div><div class='del'>-			__brelse(bh);</div><div class='del'>-			spin_lock(&amp;journal-&gt;j_list_lock);</div><div class='del'>-			goto restart2;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Now in whatever state the buffer currently is, we</div><div class='del'>-		 * know that it has been written out and so we can</div><div class='del'>-		 * drop it from the list</div><div class='del'>-		 */</div><div class='del'>-		if (__jbd2_journal_remove_checkpoint(jh))</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='ctx'> out:</div><div class='ctx'> 	spin_unlock(&amp;journal-&gt;j_list_lock);</div><div class='ctx'> 	result = jbd2_cleanup_journal_tail(journal);</div><div class='hunk'>@@ -409,49 +345,9 @@ int jbd2_cleanup_journal_tail(journal_t *journal)</div><div class='ctx'> /* Checkpoint list management */</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * journal_clean_one_cp_list</div><div class='del'>- *</div><div class='del'>- * Find all the written-back checkpoint buffers in the given list and</div><div class='del'>- * release them. If 'destroy' is set, clean all buffers unconditionally.</div><div class='del'>- *</div><div class='del'>- * Called with j_list_lock held.</div><div class='del'>- * Returns 1 if we freed the transaction, 0 otherwise.</div><div class='del'>- */</div><div class='del'>-static int journal_clean_one_cp_list(struct journal_head *jh, bool destroy)</div><div class='del'>-{</div><div class='del'>-	struct journal_head *last_jh;</div><div class='del'>-	struct journal_head *next_jh = jh;</div><div class='del'>-</div><div class='del'>-	if (!jh)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	last_jh = jh-&gt;b_cpprev;</div><div class='del'>-	do {</div><div class='del'>-		jh = next_jh;</div><div class='del'>-		next_jh = jh-&gt;b_cpnext;</div><div class='del'>-</div><div class='del'>-		if (!destroy &amp;&amp; __cp_buffer_busy(jh))</div><div class='del'>-			return 0;</div><div class='del'>-</div><div class='del'>-		if (__jbd2_journal_remove_checkpoint(jh))</div><div class='del'>-			return 1;</div><div class='del'>-		/*</div><div class='del'>-		 * This function only frees up some memory</div><div class='del'>-		 * if possible so we dont have an obligation</div><div class='del'>-		 * to finish processing. Bail out if preemption</div><div class='del'>-		 * requested:</div><div class='del'>-		 */</div><div class='del'>-		if (need_resched())</div><div class='del'>-			return 0;</div><div class='del'>-	} while (jh != last_jh);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * journal_shrink_one_cp_list</div><div class='ctx'>  *</div><div class='del'>- * Find 'nr_to_scan' written-back checkpoint buffers in the given list</div><div class='add'>+ * Find all the written-back checkpoint buffers in the given list</div><div class='ctx'>  * and try to release them. If the whole transaction is released, set</div><div class='ctx'>  * the 'released' parameter. Return the number of released checkpointed</div><div class='ctx'>  * buffers.</div><div class='hunk'>@@ -459,7 +355,7 @@ static int journal_clean_one_cp_list(struct journal_head *jh, bool destroy)</div><div class='ctx'>  * Called with j_list_lock held.</div><div class='ctx'>  */</div><div class='ctx'> static unsigned long journal_shrink_one_cp_list(struct journal_head *jh,</div><div class='del'>-						unsigned long *nr_to_scan,</div><div class='add'>+						enum jbd2_shrink_type type,</div><div class='ctx'> 						bool *released)</div><div class='ctx'> {</div><div class='ctx'> 	struct journal_head *last_jh;</div><div class='hunk'>@@ -467,7 +363,8 @@ static unsigned long journal_shrink_one_cp_list(struct journal_head *jh,</div><div class='ctx'> 	unsigned long nr_freed = 0;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (!jh || *nr_to_scan == 0)</div><div class='add'>+	*released = false;</div><div class='add'>+	if (!jh)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	last_jh = jh-&gt;b_cpprev;</div><div class='hunk'>@@ -475,12 +372,18 @@ static unsigned long journal_shrink_one_cp_list(struct journal_head *jh,</div><div class='ctx'> 		jh = next_jh;</div><div class='ctx'> 		next_jh = jh-&gt;b_cpnext;</div><div class='ctx'> </div><div class='del'>-		(*nr_to_scan)--;</div><div class='del'>-		if (__cp_buffer_busy(jh))</div><div class='del'>-			continue;</div><div class='add'>+		if (type == JBD2_SHRINK_DESTROY) {</div><div class='add'>+			ret = __jbd2_journal_remove_checkpoint(jh);</div><div class='add'>+		} else {</div><div class='add'>+			ret = jbd2_journal_try_remove_checkpoint(jh);</div><div class='add'>+			if (ret &lt; 0) {</div><div class='add'>+				if (type == JBD2_SHRINK_BUSY_SKIP)</div><div class='add'>+					continue;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		nr_freed++;</div><div class='del'>-		ret = __jbd2_journal_remove_checkpoint(jh);</div><div class='ctx'> 		if (ret) {</div><div class='ctx'> 			*released = true;</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -488,7 +391,7 @@ static unsigned long journal_shrink_one_cp_list(struct journal_head *jh,</div><div class='ctx'> </div><div class='ctx'> 		if (need_resched())</div><div class='ctx'> 			break;</div><div class='del'>-	} while (jh != last_jh &amp;&amp; *nr_to_scan);</div><div class='add'>+	} while (jh != last_jh);</div><div class='ctx'> </div><div class='ctx'> 	return nr_freed;</div><div class='ctx'> }</div><div class='hunk'>@@ -506,11 +409,12 @@ unsigned long jbd2_journal_shrink_checkpoint_list(journal_t *journal,</div><div class='ctx'> 						  unsigned long *nr_to_scan)</div><div class='ctx'> {</div><div class='ctx'> 	transaction_t *transaction, *last_transaction, *next_transaction;</div><div class='del'>-	bool released;</div><div class='add'>+	bool __maybe_unused released;</div><div class='ctx'> 	tid_t first_tid = 0, last_tid = 0, next_tid = 0;</div><div class='ctx'> 	tid_t tid = 0;</div><div class='ctx'> 	unsigned long nr_freed = 0;</div><div class='del'>-	unsigned long nr_scanned = *nr_to_scan;</div><div class='add'>+	unsigned long freed;</div><div class='add'>+	bool first_set = false;</div><div class='ctx'> </div><div class='ctx'> again:</div><div class='ctx'> 	spin_lock(&amp;journal-&gt;j_list_lock);</div><div class='hunk'>@@ -530,8 +434,10 @@ again:</div><div class='ctx'> 	else</div><div class='ctx'> 		transaction = journal-&gt;j_checkpoint_transactions;</div><div class='ctx'> </div><div class='del'>-	if (!first_tid)</div><div class='add'>+	if (!first_set) {</div><div class='ctx'> 		first_tid = transaction-&gt;t_tid;</div><div class='add'>+		first_set = true;</div><div class='add'>+	}</div><div class='ctx'> 	last_transaction = journal-&gt;j_checkpoint_transactions-&gt;t_cpprev;</div><div class='ctx'> 	next_transaction = transaction;</div><div class='ctx'> 	last_tid = last_transaction-&gt;t_tid;</div><div class='hunk'>@@ -539,19 +445,11 @@ again:</div><div class='ctx'> 		transaction = next_transaction;</div><div class='ctx'> 		next_transaction = transaction-&gt;t_cpnext;</div><div class='ctx'> 		tid = transaction-&gt;t_tid;</div><div class='del'>-		released = false;</div><div class='del'>-</div><div class='del'>-		nr_freed += journal_shrink_one_cp_list(transaction-&gt;t_checkpoint_list,</div><div class='del'>-						       nr_to_scan, &amp;released);</div><div class='del'>-		if (*nr_to_scan == 0)</div><div class='del'>-			break;</div><div class='del'>-		if (need_resched() || spin_needbreak(&amp;journal-&gt;j_list_lock))</div><div class='del'>-			break;</div><div class='del'>-		if (released)</div><div class='del'>-			continue;</div><div class='ctx'> </div><div class='del'>-		nr_freed += journal_shrink_one_cp_list(transaction-&gt;t_checkpoint_io_list,</div><div class='del'>-						       nr_to_scan, &amp;released);</div><div class='add'>+		freed = journal_shrink_one_cp_list(transaction-&gt;t_checkpoint_list,</div><div class='add'>+						   JBD2_SHRINK_BUSY_SKIP, &amp;released);</div><div class='add'>+		nr_freed += freed;</div><div class='add'>+		(*nr_to_scan) -= min(*nr_to_scan, freed);</div><div class='ctx'> 		if (*nr_to_scan == 0)</div><div class='ctx'> 			break;</div><div class='ctx'> 		if (need_resched() || spin_needbreak(&amp;journal-&gt;j_list_lock))</div><div class='hunk'>@@ -569,12 +467,11 @@ again:</div><div class='ctx'> 	spin_unlock(&amp;journal-&gt;j_list_lock);</div><div class='ctx'> 	cond_resched();</div><div class='ctx'> </div><div class='del'>-	if (*nr_to_scan &amp;&amp; next_tid)</div><div class='add'>+	if (*nr_to_scan &amp;&amp; journal-&gt;j_shrink_transaction)</div><div class='ctx'> 		goto again;</div><div class='ctx'> out:</div><div class='del'>-	nr_scanned -= *nr_to_scan;</div><div class='ctx'> 	trace_jbd2_shrink_checkpoint_list(journal, first_tid, tid, last_tid,</div><div class='del'>-					  nr_freed, nr_scanned, next_tid);</div><div class='add'>+					  nr_freed, next_tid);</div><div class='ctx'> </div><div class='ctx'> 	return nr_freed;</div><div class='ctx'> }</div><div class='hunk'>@@ -583,14 +480,20 @@ out:</div><div class='ctx'>  * journal_clean_checkpoint_list</div><div class='ctx'>  *</div><div class='ctx'>  * Find all the written-back checkpoint buffers in the journal and release them.</div><div class='del'>- * If 'destroy' is set, release all buffers unconditionally.</div><div class='add'>+ * If 'type' is JBD2_SHRINK_DESTROY, release all buffers unconditionally. If</div><div class='add'>+ * 'type' is JBD2_SHRINK_BUSY_STOP, will stop release buffers if encounters a</div><div class='add'>+ * busy buffer. To avoid wasting CPU cycles scanning the buffer list in some</div><div class='add'>+ * cases, don't pass JBD2_SHRINK_BUSY_SKIP 'type' for this function.</div><div class='ctx'>  *</div><div class='ctx'>  * Called with j_list_lock held.</div><div class='ctx'>  */</div><div class='del'>-void __jbd2_journal_clean_checkpoint_list(journal_t *journal, bool destroy)</div><div class='add'>+void __jbd2_journal_clean_checkpoint_list(journal_t *journal,</div><div class='add'>+					  enum jbd2_shrink_type type)</div><div class='ctx'> {</div><div class='ctx'> 	transaction_t *transaction, *last_transaction, *next_transaction;</div><div class='del'>-	int ret;</div><div class='add'>+	bool released;</div><div class='add'>+</div><div class='add'>+	WARN_ON_ONCE(type == JBD2_SHRINK_BUSY_SKIP);</div><div class='ctx'> </div><div class='ctx'> 	transaction = journal-&gt;j_checkpoint_transactions;</div><div class='ctx'> 	if (!transaction)</div><div class='hunk'>@@ -601,8 +504,8 @@ void __jbd2_journal_clean_checkpoint_list(journal_t *journal, bool destroy)</div><div class='ctx'> 	do {</div><div class='ctx'> 		transaction = next_transaction;</div><div class='ctx'> 		next_transaction = transaction-&gt;t_cpnext;</div><div class='del'>-		ret = journal_clean_one_cp_list(transaction-&gt;t_checkpoint_list,</div><div class='del'>-						destroy);</div><div class='add'>+		journal_shrink_one_cp_list(transaction-&gt;t_checkpoint_list,</div><div class='add'>+					   type, &amp;released);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * This function only frees up some memory if possible so we</div><div class='ctx'> 		 * dont have an obligation to finish processing. Bail out if</div><div class='hunk'>@@ -610,23 +513,12 @@ void __jbd2_journal_clean_checkpoint_list(journal_t *journal, bool destroy)</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (need_resched())</div><div class='ctx'> 			return;</div><div class='del'>-		if (ret)</div><div class='del'>-			continue;</div><div class='del'>-		/*</div><div class='del'>-		 * It is essential that we are as careful as in the case of</div><div class='del'>-		 * t_checkpoint_list with removing the buffer from the list as</div><div class='del'>-		 * we can possibly see not yet submitted buffers on io_list</div><div class='del'>-		 */</div><div class='del'>-		ret = journal_clean_one_cp_list(transaction-&gt;</div><div class='del'>-				t_checkpoint_io_list, destroy);</div><div class='del'>-		if (need_resched())</div><div class='del'>-			return;</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Stop scanning if we couldn't free the transaction. This</div><div class='ctx'> 		 * avoids pointless scanning of transactions which still</div><div class='ctx'> 		 * weren't checkpointed.</div><div class='ctx'> 		 */</div><div class='del'>-		if (!ret)</div><div class='add'>+		if (!released)</div><div class='ctx'> 			return;</div><div class='ctx'> 	} while (transaction != last_transaction);</div><div class='ctx'> }</div><div class='hunk'>@@ -647,7 +539,7 @@ void jbd2_journal_destroy_checkpoint(journal_t *journal)</div><div class='ctx'> 			spin_unlock(&amp;journal-&gt;j_list_lock);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-		__jbd2_journal_clean_checkpoint_list(journal, true);</div><div class='add'>+		__jbd2_journal_clean_checkpoint_list(journal, JBD2_SHRINK_DESTROY);</div><div class='ctx'> 		spin_unlock(&amp;journal-&gt;j_list_lock);</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 	}</div><div class='hunk'>@@ -676,7 +568,6 @@ int __jbd2_journal_remove_checkpoint(struct journal_head *jh)</div><div class='ctx'> 	struct transaction_chp_stats_s *stats;</div><div class='ctx'> 	transaction_t *transaction;</div><div class='ctx'> 	journal_t *journal;</div><div class='del'>-	struct buffer_head *bh = jh2bh(jh);</div><div class='ctx'> </div><div class='ctx'> 	JBUFFER_TRACE(jh, "entry");</div><div class='ctx'> </div><div class='hunk'>@@ -689,23 +580,13 @@ int __jbd2_journal_remove_checkpoint(struct journal_head *jh)</div><div class='ctx'> </div><div class='ctx'> 	JBUFFER_TRACE(jh, "removing from transaction");</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * If we have failed to write the buffer out to disk, the filesystem</div><div class='del'>-	 * may become inconsistent. We cannot abort the journal here since</div><div class='del'>-	 * we hold j_list_lock and we have to be careful about races with</div><div class='del'>-	 * jbd2_journal_destroy(). So mark the writeback IO error in the</div><div class='del'>-	 * journal here and we abort the journal later from a better context.</div><div class='del'>-	 */</div><div class='del'>-	if (buffer_write_io_error(bh))</div><div class='del'>-		set_bit(JBD2_CHECKPOINT_IO_ERROR, &amp;journal-&gt;j_atomic_flags);</div><div class='del'>-</div><div class='ctx'> 	__buffer_unlink(jh);</div><div class='ctx'> 	jh-&gt;b_cp_transaction = NULL;</div><div class='ctx'> 	percpu_counter_dec(&amp;journal-&gt;j_checkpoint_jh_count);</div><div class='ctx'> 	jbd2_journal_put_journal_head(jh);</div><div class='ctx'> </div><div class='ctx'> 	/* Is this transaction empty? */</div><div class='del'>-	if (transaction-&gt;t_checkpoint_list || transaction-&gt;t_checkpoint_io_list)</div><div class='add'>+	if (transaction-&gt;t_checkpoint_list)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -737,6 +618,36 @@ int __jbd2_journal_remove_checkpoint(struct journal_head *jh)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * Check the checkpoint buffer and try to remove it from the checkpoint</div><div class='add'>+ * list if it's clean. Returns -EBUSY if it is not clean, returns 1 if</div><div class='add'>+ * it frees the transaction, 0 otherwise.</div><div class='add'>+ *</div><div class='add'>+ * This function is called with j_list_lock held.</div><div class='add'>+ */</div><div class='add'>+int jbd2_journal_try_remove_checkpoint(struct journal_head *jh)</div><div class='add'>+{</div><div class='add'>+	struct buffer_head *bh = jh2bh(jh);</div><div class='add'>+</div><div class='add'>+	if (jh-&gt;b_transaction)</div><div class='add'>+		return -EBUSY;</div><div class='add'>+	if (!trylock_buffer(bh))</div><div class='add'>+		return -EBUSY;</div><div class='add'>+	if (buffer_dirty(bh)) {</div><div class='add'>+		unlock_buffer(bh);</div><div class='add'>+		return -EBUSY;</div><div class='add'>+	}</div><div class='add'>+	unlock_buffer(bh);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Buffer is clean and the IO has finished (we held the buffer</div><div class='add'>+	 * lock) so the checkpoint is done. We can safely remove the</div><div class='add'>+	 * buffer from this transaction.</div><div class='add'>+	 */</div><div class='add'>+	JBUFFER_TRACE(jh, "remove from checkpoint list");</div><div class='add'>+	return __jbd2_journal_remove_checkpoint(jh);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * journal_insert_checkpoint: put a committed buffer onto a checkpoint</div><div class='ctx'>  * list so that we know when it is safe to clean the transaction out of</div><div class='ctx'>  * the log.</div><div class='hunk'>@@ -797,12 +708,11 @@ void __jbd2_journal_drop_transaction(journal_t *journal, transaction_t *transact</div><div class='ctx'> 	J_ASSERT(transaction-&gt;t_forget == NULL);</div><div class='ctx'> 	J_ASSERT(transaction-&gt;t_shadow_list == NULL);</div><div class='ctx'> 	J_ASSERT(transaction-&gt;t_checkpoint_list == NULL);</div><div class='del'>-	J_ASSERT(transaction-&gt;t_checkpoint_io_list == NULL);</div><div class='ctx'> 	J_ASSERT(atomic_read(&amp;transaction-&gt;t_updates) == 0);</div><div class='ctx'> 	J_ASSERT(journal-&gt;j_committing_transaction != transaction);</div><div class='ctx'> 	J_ASSERT(journal-&gt;j_running_transaction != transaction);</div><div class='ctx'> </div><div class='ctx'> 	trace_jbd2_drop_transaction(journal, transaction);</div><div class='ctx'> </div><div class='del'>-	jbd_debug(1, "Dropping transaction %d, all done\n", transaction-&gt;t_tid);</div><div class='add'>+	jbd2_debug(1, "Dropping transaction %d, all done\n", transaction-&gt;t_tid);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/jbd2/commit.c b/fs/jbd2/commit.c<br/>index 3cc4ab2ba7f4..7203d2d2624d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jbd2/commit.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jbd2/commit.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jbd2/commit.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jbd2/commit.c</a></div><div class='hunk'>@@ -57,32 +57,30 @@ static void journal_end_buffer_io_sync(struct buffer_head *bh, int uptodate)</div><div class='ctx'>  * So here, we have a buffer which has just come off the forget list.  Look to</div><div class='ctx'>  * see if we can strip all buffers from the backing page.</div><div class='ctx'>  *</div><div class='del'>- * Called under lock_journal(), and possibly under journal_datalist_lock.  The</div><div class='del'>- * caller provided us with a ref against the buffer, and we drop that here.</div><div class='add'>+ * Called under j_list_lock. The caller provided us with a ref against the</div><div class='add'>+ * buffer, and we drop that here.</div><div class='ctx'>  */</div><div class='ctx'> static void release_buffer_page(struct buffer_head *bh)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> </div><div class='ctx'> 	if (buffer_dirty(bh))</div><div class='ctx'> 		goto nope;</div><div class='ctx'> 	if (atomic_read(&amp;bh-&gt;b_count) != 1)</div><div class='ctx'> 		goto nope;</div><div class='del'>-	page = bh-&gt;b_page;</div><div class='del'>-	if (!page)</div><div class='del'>-		goto nope;</div><div class='del'>-	if (page-&gt;mapping)</div><div class='add'>+	folio = bh-&gt;b_folio;</div><div class='add'>+	if (folio-&gt;mapping)</div><div class='ctx'> 		goto nope;</div><div class='ctx'> </div><div class='ctx'> 	/* OK, it's a truncated page */</div><div class='del'>-	if (!trylock_page(page))</div><div class='add'>+	if (!folio_trylock(folio))</div><div class='ctx'> 		goto nope;</div><div class='ctx'> </div><div class='del'>-	get_page(page);</div><div class='add'>+	folio_get(folio);</div><div class='ctx'> 	__brelse(bh);</div><div class='del'>-	try_to_free_buffers(page);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='add'>+	try_to_free_buffers(folio);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> 	return;</div><div class='ctx'> </div><div class='ctx'> nope:</div><div class='hunk'>@@ -101,7 +99,7 @@ static void jbd2_commit_block_csum_set(journal_t *j, struct buffer_head *bh)</div><div class='ctx'> 	h-&gt;h_chksum_type = 0;</div><div class='ctx'> 	h-&gt;h_chksum_size = 0;</div><div class='ctx'> 	h-&gt;h_chksum[0] = 0;</div><div class='del'>-	csum = jbd2_chksum(j, j-&gt;j_csum_seed, bh-&gt;b_data, j-&gt;j_blocksize);</div><div class='add'>+	csum = jbd2_chksum(j-&gt;j_csum_seed, bh-&gt;b_data, j-&gt;j_blocksize);</div><div class='ctx'> 	h-&gt;h_chksum[0] = cpu_to_be32(csum);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -120,8 +118,8 @@ static int journal_submit_commit_record(journal_t *journal,</div><div class='ctx'> {</div><div class='ctx'> 	struct commit_header *tmp;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='del'>-	int ret;</div><div class='ctx'> 	struct timespec64 now;</div><div class='add'>+	blk_opf_t write_flags = REQ_OP_WRITE | JBD2_JOURNAL_REQ_FLAGS;</div><div class='ctx'> </div><div class='ctx'> 	*cbh = NULL;</div><div class='ctx'> </div><div class='hunk'>@@ -153,13 +151,11 @@ static int journal_submit_commit_record(journal_t *journal,</div><div class='ctx'> </div><div class='ctx'> 	if (journal-&gt;j_flags &amp; JBD2_BARRIER &amp;&amp;</div><div class='ctx'> 	    !jbd2_has_feature_async_commit(journal))</div><div class='del'>-		ret = submit_bh(REQ_OP_WRITE,</div><div class='del'>-			REQ_SYNC | REQ_PREFLUSH | REQ_FUA, bh);</div><div class='del'>-	else</div><div class='del'>-		ret = submit_bh(REQ_OP_WRITE, REQ_SYNC, bh);</div><div class='add'>+		write_flags |= REQ_PREFLUSH | REQ_FUA;</div><div class='ctx'> </div><div class='add'>+	submit_bh(write_flags, bh);</div><div class='ctx'> 	*cbh = bh;</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -181,40 +177,14 @@ static int journal_wait_on_commit_record(journal_t *journal,</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * write the filemap data using writepage() address_space_operations.</div><div class='del'>- * We don't do block allocation here even for delalloc. We don't</div><div class='del'>- * use writepages() because with delayed allocation we may be doing</div><div class='del'>- * block allocation in writepages().</div><div class='del'>- */</div><div class='del'>-int jbd2_journal_submit_inode_data_buffers(struct jbd2_inode *jinode)</div><div class='del'>-{</div><div class='del'>-	struct address_space *mapping = jinode-&gt;i_vfs_inode-&gt;i_mapping;</div><div class='del'>-	struct writeback_control wbc = {</div><div class='del'>-		.sync_mode =  WB_SYNC_ALL,</div><div class='del'>-		.nr_to_write = mapping-&gt;nrpages * 2,</div><div class='del'>-		.range_start = jinode-&gt;i_dirty_start,</div><div class='del'>-		.range_end = jinode-&gt;i_dirty_end,</div><div class='del'>-	};</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * submit the inode data buffers. We use writepage</div><div class='del'>-	 * instead of writepages. Because writepages can do</div><div class='del'>-	 * block allocation with delalloc. We need to write</div><div class='del'>-	 * only allocated blocks here.</div><div class='del'>-	 */</div><div class='del'>-	return generic_writepages(mapping, &amp;wbc);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /* Send all the data buffers related to an inode */</div><div class='del'>-int jbd2_submit_inode_data(struct jbd2_inode *jinode)</div><div class='add'>+int jbd2_submit_inode_data(journal_t *journal, struct jbd2_inode *jinode)</div><div class='ctx'> {</div><div class='del'>-</div><div class='ctx'> 	if (!jinode || !(jinode-&gt;i_flags &amp; JI_WRITE_DATA))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	trace_jbd2_submit_inode_data(jinode-&gt;i_vfs_inode);</div><div class='del'>-	return jbd2_journal_submit_inode_data_buffers(jinode);</div><div class='add'>+	return journal-&gt;j_submit_inode_data_buffers(jinode);</div><div class='ctx'> </div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(jbd2_submit_inode_data);</div><div class='hunk'>@@ -300,6 +270,7 @@ static int journal_finish_inode_data_buffers(journal_t *journal,</div><div class='ctx'> 			if (!ret)</div><div class='ctx'> 				ret = err;</div><div class='ctx'> 		}</div><div class='add'>+		cond_resched();</div><div class='ctx'> 		spin_lock(&amp;journal-&gt;j_list_lock);</div><div class='ctx'> 		jinode-&gt;i_flags &amp;= ~JI_COMMIT_RUNNING;</div><div class='ctx'> 		smp_mb();</div><div class='hunk'>@@ -328,14 +299,12 @@ static int journal_finish_inode_data_buffers(journal_t *journal,</div><div class='ctx'> </div><div class='ctx'> static __u32 jbd2_checksum_data(__u32 crc32_sum, struct buffer_head *bh)</div><div class='ctx'> {</div><div class='del'>-	struct page *page = bh-&gt;b_page;</div><div class='ctx'> 	char *addr;</div><div class='ctx'> 	__u32 checksum;</div><div class='ctx'> </div><div class='del'>-	addr = kmap_atomic(page);</div><div class='del'>-	checksum = crc32_be(crc32_sum,</div><div class='del'>-		(void *)(addr + offset_in_page(bh-&gt;b_data)), bh-&gt;b_size);</div><div class='del'>-	kunmap_atomic(addr);</div><div class='add'>+	addr = kmap_local_folio(bh-&gt;b_folio, bh_offset(bh));</div><div class='add'>+	checksum = crc32_be(crc32_sum, addr, bh-&gt;b_size);</div><div class='add'>+	kunmap_local(addr);</div><div class='ctx'> </div><div class='ctx'> 	return checksum;</div><div class='ctx'> }</div><div class='hunk'>@@ -352,7 +321,6 @@ static void jbd2_block_tag_csum_set(journal_t *j, journal_block_tag_t *tag,</div><div class='ctx'> 				    struct buffer_head *bh, __u32 sequence)</div><div class='ctx'> {</div><div class='ctx'> 	journal_block_tag3_t *tag3 = (journal_block_tag3_t *)tag;</div><div class='del'>-	struct page *page = bh-&gt;b_page;</div><div class='ctx'> 	__u8 *addr;</div><div class='ctx'> 	__u32 csum32;</div><div class='ctx'> 	__be32 seq;</div><div class='hunk'>@@ -361,11 +329,10 @@ static void jbd2_block_tag_csum_set(journal_t *j, journal_block_tag_t *tag,</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	seq = cpu_to_be32(sequence);</div><div class='del'>-	addr = kmap_atomic(page);</div><div class='del'>-	csum32 = jbd2_chksum(j, j-&gt;j_csum_seed, (__u8 *)&amp;seq, sizeof(seq));</div><div class='del'>-	csum32 = jbd2_chksum(j, csum32, addr + offset_in_page(bh-&gt;b_data),</div><div class='del'>-			     bh-&gt;b_size);</div><div class='del'>-	kunmap_atomic(addr);</div><div class='add'>+	addr = kmap_local_folio(bh-&gt;b_folio, bh_offset(bh));</div><div class='add'>+	csum32 = jbd2_chksum(j-&gt;j_csum_seed, (__u8 *)&amp;seq, sizeof(seq));</div><div class='add'>+	csum32 = jbd2_chksum(csum32, addr, bh-&gt;b_size);</div><div class='add'>+	kunmap_local(addr);</div><div class='ctx'> </div><div class='ctx'> 	if (jbd2_has_feature_csum3(j))</div><div class='ctx'> 		tag3-&gt;t_checksum = cpu_to_be32(csum32);</div><div class='hunk'>@@ -386,7 +353,7 @@ void jbd2_journal_commit_transaction(journal_t *journal)</div><div class='ctx'> 	struct buffer_head *descriptor;</div><div class='ctx'> 	struct buffer_head **wbuf = journal-&gt;j_wbuf;</div><div class='ctx'> 	int bufs;</div><div class='del'>-	int flags;</div><div class='add'>+	int escape;</div><div class='ctx'> 	int err;</div><div class='ctx'> 	unsigned long long blocknr;</div><div class='ctx'> 	ktime_t start_time;</div><div class='hunk'>@@ -419,7 +386,7 @@ void jbd2_journal_commit_transaction(journal_t *journal)</div><div class='ctx'> </div><div class='ctx'> 	/* Do we need to erase the effects of a prior jbd2_journal_flush? */</div><div class='ctx'> 	if (journal-&gt;j_flags &amp; JBD2_FLUSHED) {</div><div class='del'>-		jbd_debug(3, "super block updated\n");</div><div class='add'>+		jbd2_debug(3, "super block updated\n");</div><div class='ctx'> 		mutex_lock_io(&amp;journal-&gt;j_checkpoint_mutex);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We hold j_checkpoint_mutex so tail cannot change under us.</div><div class='hunk'>@@ -429,11 +396,10 @@ void jbd2_journal_commit_transaction(journal_t *journal)</div><div class='ctx'> 		 */</div><div class='ctx'> 		jbd2_journal_update_sb_log_tail(journal,</div><div class='ctx'> 						journal-&gt;j_tail_sequence,</div><div class='del'>-						journal-&gt;j_tail,</div><div class='del'>-						REQ_SYNC);</div><div class='add'>+						journal-&gt;j_tail, 0);</div><div class='ctx'> 		mutex_unlock(&amp;journal-&gt;j_checkpoint_mutex);</div><div class='ctx'> 	} else {</div><div class='del'>-		jbd_debug(3, "superblock not updated\n");</div><div class='add'>+		jbd2_debug(3, "superblock not updated\n");</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	J_ASSERT(journal-&gt;j_running_transaction != NULL);</div><div class='hunk'>@@ -465,7 +431,7 @@ void jbd2_journal_commit_transaction(journal_t *journal)</div><div class='ctx'> 	commit_transaction = journal-&gt;j_running_transaction;</div><div class='ctx'> </div><div class='ctx'> 	trace_jbd2_start_commit(journal, commit_transaction);</div><div class='del'>-	jbd_debug(1, "JBD2: starting commit of transaction %d\n",</div><div class='add'>+	jbd2_debug(1, "JBD2: starting commit of transaction %d\n",</div><div class='ctx'> 			commit_transaction-&gt;t_tid);</div><div class='ctx'> </div><div class='ctx'> 	write_lock(&amp;journal-&gt;j_state_lock);</div><div class='hunk'>@@ -484,24 +450,10 @@ void jbd2_journal_commit_transaction(journal_t *journal)</div><div class='ctx'> 	stats.run.rs_running = jbd2_time_diff(commit_transaction-&gt;t_start,</div><div class='ctx'> 					      stats.run.rs_locked);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;commit_transaction-&gt;t_handle_lock);</div><div class='del'>-	while (atomic_read(&amp;commit_transaction-&gt;t_updates)) {</div><div class='del'>-		DEFINE_WAIT(wait);</div><div class='add'>+	// waits for any t_updates to finish</div><div class='add'>+	jbd2_journal_wait_updates(journal);</div><div class='ctx'> </div><div class='del'>-		prepare_to_wait(&amp;journal-&gt;j_wait_updates, &amp;wait,</div><div class='del'>-					TASK_UNINTERRUPTIBLE);</div><div class='del'>-		if (atomic_read(&amp;commit_transaction-&gt;t_updates)) {</div><div class='del'>-			spin_unlock(&amp;commit_transaction-&gt;t_handle_lock);</div><div class='del'>-			write_unlock(&amp;journal-&gt;j_state_lock);</div><div class='del'>-			schedule();</div><div class='del'>-			write_lock(&amp;journal-&gt;j_state_lock);</div><div class='del'>-			spin_lock(&amp;commit_transaction-&gt;t_handle_lock);</div><div class='del'>-		}</div><div class='del'>-		finish_wait(&amp;journal-&gt;j_wait_updates, &amp;wait);</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;commit_transaction-&gt;t_handle_lock);</div><div class='ctx'> 	commit_transaction-&gt;t_state = T_SWITCH;</div><div class='del'>-	write_unlock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> </div><div class='ctx'> 	J_ASSERT (atomic_read(&amp;commit_transaction-&gt;t_outstanding_credits) &lt;=</div><div class='ctx'> 			journal-&gt;j_max_transaction_buffers);</div><div class='hunk'>@@ -521,6 +473,8 @@ void jbd2_journal_commit_transaction(journal_t *journal)</div><div class='ctx'> 	 * has reserved.  This is consistent with the existing behaviour</div><div class='ctx'> 	 * that multiple jbd2_journal_get_write_access() calls to the same</div><div class='ctx'> 	 * buffer are perfectly permissible.</div><div class='add'>+	 * We use journal-&gt;j_state_lock here to serialize processing of</div><div class='add'>+	 * t_reserved_list with eviction of buffers from journal_unmap_buffer().</div><div class='ctx'> 	 */</div><div class='ctx'> 	while (commit_transaction-&gt;t_reserved_list) {</div><div class='ctx'> 		jh = commit_transaction-&gt;t_reserved_list;</div><div class='hunk'>@@ -540,16 +494,17 @@ void jbd2_journal_commit_transaction(journal_t *journal)</div><div class='ctx'> 		jbd2_journal_refile_buffer(journal, jh);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	write_unlock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Now try to drop any written-back buffers from the journal's</div><div class='ctx'> 	 * checkpoint lists.  We do this *before* commit because it potentially</div><div class='ctx'> 	 * frees some memory</div><div class='ctx'> 	 */</div><div class='ctx'> 	spin_lock(&amp;journal-&gt;j_list_lock);</div><div class='del'>-	__jbd2_journal_clean_checkpoint_list(journal, false);</div><div class='add'>+	__jbd2_journal_clean_checkpoint_list(journal, JBD2_SHRINK_BUSY_STOP);</div><div class='ctx'> 	spin_unlock(&amp;journal-&gt;j_list_lock);</div><div class='ctx'> </div><div class='del'>-	jbd_debug(3, "JBD2: commit phase 1\n");</div><div class='add'>+	jbd2_debug(3, "JBD2: commit phase 1\n");</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Clear revoked flag to reflect there is no revoked buffers</div><div class='hunk'>@@ -562,13 +517,13 @@ void jbd2_journal_commit_transaction(journal_t *journal)</div><div class='ctx'> 	 */</div><div class='ctx'> 	jbd2_journal_switch_revoke_table(journal);</div><div class='ctx'> </div><div class='add'>+	write_lock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Reserved credits cannot be claimed anymore, free them</div><div class='ctx'> 	 */</div><div class='ctx'> 	atomic_sub(atomic_read(&amp;journal-&gt;j_reserved_credits),</div><div class='ctx'> 		   &amp;commit_transaction-&gt;t_outstanding_credits);</div><div class='ctx'> </div><div class='del'>-	write_lock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> 	trace_jbd2_commit_flushing(journal, commit_transaction);</div><div class='ctx'> 	stats.run.rs_flushing = jiffies;</div><div class='ctx'> 	stats.run.rs_locked = jbd2_time_diff(stats.run.rs_locked,</div><div class='hunk'>@@ -579,10 +534,10 @@ void jbd2_journal_commit_transaction(journal_t *journal)</div><div class='ctx'> 	journal-&gt;j_running_transaction = NULL;</div><div class='ctx'> 	start_time = ktime_get();</div><div class='ctx'> 	commit_transaction-&gt;t_log_start = journal-&gt;j_head;</div><div class='del'>-	wake_up(&amp;journal-&gt;j_wait_transaction_locked);</div><div class='add'>+	wake_up_all(&amp;journal-&gt;j_wait_transaction_locked);</div><div class='ctx'> 	write_unlock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> </div><div class='del'>-	jbd_debug(3, "JBD2: commit phase 2a\n");</div><div class='add'>+	jbd2_debug(3, "JBD2: commit phase 2a\n");</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Now start flushing things to disk, in the order they appear</div><div class='hunk'>@@ -595,7 +550,7 @@ void jbd2_journal_commit_transaction(journal_t *journal)</div><div class='ctx'> 	blk_start_plug(&amp;plug);</div><div class='ctx'> 	jbd2_journal_write_revoke_records(commit_transaction, &amp;log_bufs);</div><div class='ctx'> </div><div class='del'>-	jbd_debug(3, "JBD2: commit phase 2b\n");</div><div class='add'>+	jbd2_debug(3, "JBD2: commit phase 2b\n");</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Way to go: we have now written out all of the data for a</div><div class='hunk'>@@ -616,7 +571,6 @@ void jbd2_journal_commit_transaction(journal_t *journal)</div><div class='ctx'> 	J_ASSERT(commit_transaction-&gt;t_nr_buffers &lt;=</div><div class='ctx'> 		 atomic_read(&amp;commit_transaction-&gt;t_outstanding_credits));</div><div class='ctx'> </div><div class='del'>-	err = 0;</div><div class='ctx'> 	bufs = 0;</div><div class='ctx'> 	descriptor = NULL;</div><div class='ctx'> 	while (commit_transaction-&gt;t_buffers) {</div><div class='hunk'>@@ -651,7 +605,7 @@ void jbd2_journal_commit_transaction(journal_t *journal)</div><div class='ctx'> 		if (!descriptor) {</div><div class='ctx'> 			J_ASSERT (bufs == 0);</div><div class='ctx'> </div><div class='del'>-			jbd_debug(4, "JBD2: get descriptor\n");</div><div class='add'>+			jbd2_debug(4, "JBD2: get descriptor\n");</div><div class='ctx'> </div><div class='ctx'> 			descriptor = jbd2_journal_get_descriptor_buffer(</div><div class='ctx'> 							commit_transaction,</div><div class='hunk'>@@ -661,7 +615,7 @@ void jbd2_journal_commit_transaction(journal_t *journal)</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			jbd_debug(4, "JBD2: got buffer %llu (%p)\n",</div><div class='add'>+			jbd2_debug(4, "JBD2: got buffer %llu (%p)\n",</div><div class='ctx'> 				(unsigned long long)descriptor-&gt;b_blocknr,</div><div class='ctx'> 				descriptor-&gt;b_data);</div><div class='ctx'> 			tagp = &amp;descriptor-&gt;b_data[sizeof(journal_header_t)];</div><div class='hunk'>@@ -706,19 +660,15 @@ void jbd2_journal_commit_transaction(journal_t *journal)</div><div class='ctx'> 		 */</div><div class='ctx'> 		set_bit(BH_JWrite, &amp;jh2bh(jh)-&gt;b_state);</div><div class='ctx'> 		JBUFFER_TRACE(jh, "ph3: write metadata");</div><div class='del'>-		flags = jbd2_journal_write_metadata_buffer(commit_transaction,</div><div class='add'>+		escape = jbd2_journal_write_metadata_buffer(commit_transaction,</div><div class='ctx'> 						jh, &amp;wbuf[bufs], blocknr);</div><div class='del'>-		if (flags &lt; 0) {</div><div class='del'>-			jbd2_journal_abort(journal, flags);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='ctx'> 		jbd2_file_log_bh(&amp;io_bufs, wbuf[bufs]);</div><div class='ctx'> </div><div class='ctx'> 		/* Record the new block's tag in the current descriptor</div><div class='ctx'>                    buffer */</div><div class='ctx'> </div><div class='ctx'> 		tag_flag = 0;</div><div class='del'>-		if (flags &amp; 1)</div><div class='add'>+		if (escape)</div><div class='ctx'> 			tag_flag |= JBD2_FLAG_ESCAPE;</div><div class='ctx'> 		if (!first_tag)</div><div class='ctx'> 			tag_flag |= JBD2_FLAG_SAME_UUID;</div><div class='hunk'>@@ -746,7 +696,7 @@ void jbd2_journal_commit_transaction(journal_t *journal)</div><div class='ctx'> 		    commit_transaction-&gt;t_buffers == NULL ||</div><div class='ctx'> 		    space_left &lt; tag_bytes + 16 + csum_size) {</div><div class='ctx'> </div><div class='del'>-			jbd_debug(4, "JBD2: Submit %d IOs\n", bufs);</div><div class='add'>+			jbd2_debug(4, "JBD2: Submit %d IOs\n", bufs);</div><div class='ctx'> </div><div class='ctx'> 			/* Write an end-of-descriptor marker before</div><div class='ctx'>                            submitting the IOs.  "tag" still points to</div><div class='hunk'>@@ -760,6 +710,7 @@ start_journal_io:</div><div class='ctx'> </div><div class='ctx'> 			for (i = 0; i &lt; bufs; i++) {</div><div class='ctx'> 				struct buffer_head *bh = wbuf[i];</div><div class='add'>+</div><div class='ctx'> 				/*</div><div class='ctx'> 				 * Compute checksum.</div><div class='ctx'> 				 */</div><div class='hunk'>@@ -772,7 +723,8 @@ start_journal_io:</div><div class='ctx'> 				clear_buffer_dirty(bh);</div><div class='ctx'> 				set_buffer_uptodate(bh);</div><div class='ctx'> 				bh-&gt;b_end_io = journal_end_buffer_io_sync;</div><div class='del'>-				submit_bh(REQ_OP_WRITE, REQ_SYNC, bh);</div><div class='add'>+				submit_bh(REQ_OP_WRITE | JBD2_JOURNAL_REQ_FLAGS,</div><div class='add'>+					  bh);</div><div class='ctx'> 			}</div><div class='ctx'> 			cond_resched();</div><div class='ctx'> </div><div class='hunk'>@@ -786,10 +738,8 @@ start_journal_io:</div><div class='ctx'> 	err = journal_finish_inode_data_buffers(journal, commit_transaction);</div><div class='ctx'> 	if (err) {</div><div class='ctx'> 		printk(KERN_WARNING</div><div class='del'>-			"JBD2: Detected IO errors while flushing file data "</div><div class='del'>-		       "on %s\n", journal-&gt;j_devname);</div><div class='del'>-		if (journal-&gt;j_flags &amp; JBD2_ABORT_ON_SYNCDATA_ERR)</div><div class='del'>-			jbd2_journal_abort(journal, err);</div><div class='add'>+			"JBD2: Detected IO errors %d while flushing file data on %s\n",</div><div class='add'>+			err, journal-&gt;j_devname);</div><div class='ctx'> 		err = 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -810,19 +760,19 @@ start_journal_io:</div><div class='ctx'> 		if (first_block &lt; journal-&gt;j_tail)</div><div class='ctx'> 			freed += journal-&gt;j_last - journal-&gt;j_first;</div><div class='ctx'> 		/* Update tail only if we free significant amount of space */</div><div class='del'>-		if (freed &lt; jbd2_journal_get_max_txn_bufs(journal))</div><div class='add'>+		if (freed &lt; journal-&gt;j_max_transaction_buffers)</div><div class='ctx'> 			update_tail = 0;</div><div class='ctx'> 	}</div><div class='ctx'> 	J_ASSERT(commit_transaction-&gt;t_state == T_COMMIT);</div><div class='ctx'> 	commit_transaction-&gt;t_state = T_COMMIT_DFLUSH;</div><div class='ctx'> 	write_unlock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> </div><div class='del'>-	/* </div><div class='add'>+	/*</div><div class='ctx'> 	 * If the journal is not located on the file system device,</div><div class='ctx'> 	 * then we must flush the file system device before we issue</div><div class='del'>-	 * the commit record</div><div class='add'>+	 * the commit record and update the journal tail sequence.</div><div class='ctx'> 	 */</div><div class='del'>-	if (commit_transaction-&gt;t_need_data_flush &amp;&amp;</div><div class='add'>+	if ((commit_transaction-&gt;t_need_data_flush || update_tail) &amp;&amp;</div><div class='ctx'> 	    (journal-&gt;j_fs_dev != journal-&gt;j_dev) &amp;&amp;</div><div class='ctx'> 	    (journal-&gt;j_flags &amp; JBD2_BARRIER))</div><div class='ctx'> 		blkdev_issue_flush(journal-&gt;j_fs_dev);</div><div class='hunk'>@@ -848,7 +798,7 @@ start_journal_io:</div><div class='ctx'> 	   so we incur less scheduling load.</div><div class='ctx'> 	*/</div><div class='ctx'> </div><div class='del'>-	jbd_debug(3, "JBD2: commit phase 3\n");</div><div class='add'>+	jbd2_debug(3, "JBD2: commit phase 3\n");</div><div class='ctx'> </div><div class='ctx'> 	while (!list_empty(&amp;io_bufs)) {</div><div class='ctx'> 		struct buffer_head *bh = list_entry(io_bufs.prev,</div><div class='hunk'>@@ -891,7 +841,7 @@ start_journal_io:</div><div class='ctx'> </div><div class='ctx'> 	J_ASSERT (commit_transaction-&gt;t_shadow_list == NULL);</div><div class='ctx'> </div><div class='del'>-	jbd_debug(3, "JBD2: commit phase 4\n");</div><div class='add'>+	jbd2_debug(3, "JBD2: commit phase 4\n");</div><div class='ctx'> </div><div class='ctx'> 	/* Here we wait for the revoke record and descriptor record buffers */</div><div class='ctx'> 	while (!list_empty(&amp;log_bufs)) {</div><div class='hunk'>@@ -915,7 +865,7 @@ start_journal_io:</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		jbd2_journal_abort(journal, err);</div><div class='ctx'> </div><div class='del'>-	jbd_debug(3, "JBD2: commit phase 5\n");</div><div class='add'>+	jbd2_debug(3, "JBD2: commit phase 5\n");</div><div class='ctx'> 	write_lock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> 	J_ASSERT(commit_transaction-&gt;t_state == T_COMMIT_DFLUSH);</div><div class='ctx'> 	commit_transaction-&gt;t_state = T_COMMIT_JFLUSH;</div><div class='hunk'>@@ -954,7 +904,7 @@ start_journal_io:</div><div class='ctx'>            transaction can be removed from any checkpoint list it was on</div><div class='ctx'>            before. */</div><div class='ctx'> </div><div class='del'>-	jbd_debug(3, "JBD2: commit phase 6\n");</div><div class='add'>+	jbd2_debug(3, "JBD2: commit phase 6\n");</div><div class='ctx'> </div><div class='ctx'> 	J_ASSERT(list_empty(&amp;commit_transaction-&gt;t_inode_list));</div><div class='ctx'> 	J_ASSERT(commit_transaction-&gt;t_buffers == NULL);</div><div class='hunk'>@@ -1052,7 +1002,7 @@ restart_loop:</div><div class='ctx'> 			 * already detached from the mapping and buffers cannot</div><div class='ctx'> 			 * get reused.</div><div class='ctx'> 			 */</div><div class='del'>-			mapping = READ_ONCE(bh-&gt;b_page-&gt;mapping);</div><div class='add'>+			mapping = READ_ONCE(bh-&gt;b_folio-&gt;mapping);</div><div class='ctx'> 			if (mapping &amp;&amp; !sb_is_blkdev_sb(mapping-&gt;host-&gt;i_sb)) {</div><div class='ctx'> 				clear_buffer_mapped(bh);</div><div class='ctx'> 				clear_buffer_new(bh);</div><div class='hunk'>@@ -1131,7 +1081,7 @@ restart_loop:</div><div class='ctx'> </div><div class='ctx'> 	/* Done with this transaction! */</div><div class='ctx'> </div><div class='del'>-	jbd_debug(3, "JBD2: commit phase 7\n");</div><div class='add'>+	jbd2_debug(3, "JBD2: commit phase 7\n");</div><div class='ctx'> </div><div class='ctx'> 	J_ASSERT(commit_transaction-&gt;t_state == T_COMMIT_JFLUSH);</div><div class='ctx'> </div><div class='hunk'>@@ -1151,7 +1101,7 @@ restart_loop:</div><div class='ctx'> </div><div class='ctx'> 	commit_transaction-&gt;t_state = T_COMMIT_CALLBACK;</div><div class='ctx'> 	J_ASSERT(commit_transaction == journal-&gt;j_committing_transaction);</div><div class='del'>-	journal-&gt;j_commit_sequence = commit_transaction-&gt;t_tid;</div><div class='add'>+	WRITE_ONCE(journal-&gt;j_commit_sequence, commit_transaction-&gt;t_tid);</div><div class='ctx'> 	journal-&gt;j_committing_transaction = NULL;</div><div class='ctx'> 	commit_time = ktime_to_ns(ktime_sub(ktime_get(), start_time));</div><div class='ctx'> </div><div class='hunk'>@@ -1170,10 +1120,10 @@ restart_loop:</div><div class='ctx'> 	if (journal-&gt;j_commit_callback)</div><div class='ctx'> 		journal-&gt;j_commit_callback(journal, commit_transaction);</div><div class='ctx'> 	if (journal-&gt;j_fc_cleanup_callback)</div><div class='del'>-		journal-&gt;j_fc_cleanup_callback(journal, 1);</div><div class='add'>+		journal-&gt;j_fc_cleanup_callback(journal, 1, commit_transaction-&gt;t_tid);</div><div class='ctx'> </div><div class='ctx'> 	trace_jbd2_end_commit(journal, commit_transaction);</div><div class='del'>-	jbd_debug(1, "JBD2: commit %d complete, head %d\n",</div><div class='add'>+	jbd2_debug(1, "JBD2: commit %d complete, head %d\n",</div><div class='ctx'> 		  journal-&gt;j_commit_sequence, journal-&gt;j_tail_sequence);</div><div class='ctx'> </div><div class='ctx'> 	write_lock(&amp;journal-&gt;j_state_lock);</div><div class='hunk'>@@ -1182,8 +1132,7 @@ restart_loop:</div><div class='ctx'> 	spin_lock(&amp;journal-&gt;j_list_lock);</div><div class='ctx'> 	commit_transaction-&gt;t_state = T_FINISHED;</div><div class='ctx'> 	/* Check if the transaction can be dropped now that we are finished */</div><div class='del'>-	if (commit_transaction-&gt;t_checkpoint_list == NULL &amp;&amp;</div><div class='del'>-	    commit_transaction-&gt;t_checkpoint_io_list == NULL) {</div><div class='add'>+	if (commit_transaction-&gt;t_checkpoint_list == NULL) {</div><div class='ctx'> 		__jbd2_journal_drop_transaction(journal, commit_transaction);</div><div class='ctx'> 		jbd2_journal_free_transaction(commit_transaction);</div><div class='ctx'> 	}</div><div class='head'>diff --git a/fs/jbd2/journal.c b/fs/jbd2/journal.c<br/>index 35302bc192eb..c973162d5b31 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jbd2/journal.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jbd2/journal.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jbd2/journal.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jbd2/journal.c</a></div><div class='hunk'>@@ -49,8 +49,7 @@</div><div class='ctx'> #include &lt;asm/page.h&gt;</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_JBD2_DEBUG</div><div class='del'>-ushort jbd2_journal_enable_debug __read_mostly;</div><div class='del'>-EXPORT_SYMBOL(jbd2_journal_enable_debug);</div><div class='add'>+static ushort jbd2_journal_enable_debug __read_mostly;</div><div class='ctx'> </div><div class='ctx'> module_param_named(jbd2_debug, jbd2_journal_enable_debug, ushort, 0644);</div><div class='ctx'> MODULE_PARM_DESC(jbd2_debug, "Debugging level for jbd2");</div><div class='hunk'>@@ -81,17 +80,15 @@ EXPORT_SYMBOL(jbd2_journal_errno);</div><div class='ctx'> EXPORT_SYMBOL(jbd2_journal_ack_err);</div><div class='ctx'> EXPORT_SYMBOL(jbd2_journal_clear_err);</div><div class='ctx'> EXPORT_SYMBOL(jbd2_log_wait_commit);</div><div class='del'>-EXPORT_SYMBOL(jbd2_log_start_commit);</div><div class='ctx'> EXPORT_SYMBOL(jbd2_journal_start_commit);</div><div class='ctx'> EXPORT_SYMBOL(jbd2_journal_force_commit_nested);</div><div class='ctx'> EXPORT_SYMBOL(jbd2_journal_wipe);</div><div class='del'>-EXPORT_SYMBOL(jbd2_journal_blocks_per_page);</div><div class='del'>-EXPORT_SYMBOL(jbd2_journal_invalidatepage);</div><div class='add'>+EXPORT_SYMBOL(jbd2_journal_blocks_per_folio);</div><div class='add'>+EXPORT_SYMBOL(jbd2_journal_invalidate_folio);</div><div class='ctx'> EXPORT_SYMBOL(jbd2_journal_try_to_free_buffers);</div><div class='ctx'> EXPORT_SYMBOL(jbd2_journal_force_commit);</div><div class='ctx'> EXPORT_SYMBOL(jbd2_journal_inode_ranged_write);</div><div class='ctx'> EXPORT_SYMBOL(jbd2_journal_inode_ranged_wait);</div><div class='del'>-EXPORT_SYMBOL(jbd2_journal_submit_inode_data_buffers);</div><div class='ctx'> EXPORT_SYMBOL(jbd2_journal_finish_inode_data_buffers);</div><div class='ctx'> EXPORT_SYMBOL(jbd2_journal_init_jbd_inode);</div><div class='ctx'> EXPORT_SYMBOL(jbd2_journal_release_jbd_inode);</div><div class='hunk'>@@ -115,26 +112,17 @@ void __jbd2_debug(int level, const char *file, const char *func,</div><div class='ctx'> 	printk(KERN_DEBUG "%s: (%s, %u): %pV", file, func, line, &amp;vaf);</div><div class='ctx'> 	va_end(args);</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(__jbd2_debug);</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> /* Checksumming functions */</div><div class='del'>-static int jbd2_verify_csum_type(journal_t *j, journal_superblock_t *sb)</div><div class='del'>-{</div><div class='del'>-	if (!jbd2_journal_has_csum_v2or3_feature(j))</div><div class='del'>-		return 1;</div><div class='del'>-</div><div class='del'>-	return sb-&gt;s_checksum_type == JBD2_CRC32C_CHKSUM;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __be32 jbd2_superblock_csum(journal_t *j, journal_superblock_t *sb)</div><div class='add'>+static __be32 jbd2_superblock_csum(journal_superblock_t *sb)</div><div class='ctx'> {</div><div class='ctx'> 	__u32 csum;</div><div class='ctx'> 	__be32 old_csum;</div><div class='ctx'> </div><div class='ctx'> 	old_csum = sb-&gt;s_checksum;</div><div class='ctx'> 	sb-&gt;s_checksum = 0;</div><div class='del'>-	csum = jbd2_chksum(j, ~0, (char *)sb, sizeof(journal_superblock_t));</div><div class='add'>+	csum = jbd2_chksum(~0, (char *)sb, sizeof(journal_superblock_t));</div><div class='ctx'> 	sb-&gt;s_checksum = old_csum;</div><div class='ctx'> </div><div class='ctx'> 	return cpu_to_be32(csum);</div><div class='hunk'>@@ -146,7 +134,7 @@ static __be32 jbd2_superblock_csum(journal_t *j, journal_superblock_t *sb)</div><div class='ctx'> </div><div class='ctx'> static void commit_timeout(struct timer_list *t)</div><div class='ctx'> {</div><div class='del'>-	journal_t *journal = from_timer(journal, t, j_commit_timer);</div><div class='add'>+	journal_t *journal = timer_container_of(journal, t, j_commit_timer);</div><div class='ctx'> </div><div class='ctx'> 	wake_up_process(journal-&gt;j_task);</div><div class='ctx'> }</div><div class='hunk'>@@ -203,13 +191,13 @@ loop:</div><div class='ctx'> 	if (journal-&gt;j_flags &amp; JBD2_UNMOUNT)</div><div class='ctx'> 		goto end_loop;</div><div class='ctx'> </div><div class='del'>-	jbd_debug(1, "commit_sequence=%u, commit_request=%u\n",</div><div class='add'>+	jbd2_debug(1, "commit_sequence=%u, commit_request=%u\n",</div><div class='ctx'> 		journal-&gt;j_commit_sequence, journal-&gt;j_commit_request);</div><div class='ctx'> </div><div class='ctx'> 	if (journal-&gt;j_commit_sequence != journal-&gt;j_commit_request) {</div><div class='del'>-		jbd_debug(1, "OK, requests differ\n");</div><div class='add'>+		jbd2_debug(1, "OK, requests differ\n");</div><div class='ctx'> 		write_unlock(&amp;journal-&gt;j_state_lock);</div><div class='del'>-		del_timer_sync(&amp;journal-&gt;j_commit_timer);</div><div class='add'>+		timer_delete_sync(&amp;journal-&gt;j_commit_timer);</div><div class='ctx'> 		jbd2_journal_commit_transaction(journal);</div><div class='ctx'> 		write_lock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> 		goto loop;</div><div class='hunk'>@@ -222,7 +210,7 @@ loop:</div><div class='ctx'> 		 * good idea, because that depends on threads that may</div><div class='ctx'> 		 * be already stopped.</div><div class='ctx'> 		 */</div><div class='del'>-		jbd_debug(1, "Now suspending kjournald2\n");</div><div class='add'>+		jbd2_debug(1, "Now suspending kjournald2\n");</div><div class='ctx'> 		write_unlock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> 		try_to_freeze();</div><div class='ctx'> 		write_lock(&amp;journal-&gt;j_state_lock);</div><div class='hunk'>@@ -232,19 +220,12 @@ loop:</div><div class='ctx'> 		 * so we don't sleep</div><div class='ctx'> 		 */</div><div class='ctx'> 		DEFINE_WAIT(wait);</div><div class='del'>-		int should_sleep = 1;</div><div class='ctx'> </div><div class='ctx'> 		prepare_to_wait(&amp;journal-&gt;j_wait_commit, &amp;wait,</div><div class='ctx'> 				TASK_INTERRUPTIBLE);</div><div class='del'>-		if (journal-&gt;j_commit_sequence != journal-&gt;j_commit_request)</div><div class='del'>-			should_sleep = 0;</div><div class='ctx'> 		transaction = journal-&gt;j_running_transaction;</div><div class='del'>-		if (transaction &amp;&amp; time_after_eq(jiffies,</div><div class='del'>-						transaction-&gt;t_expires))</div><div class='del'>-			should_sleep = 0;</div><div class='del'>-		if (journal-&gt;j_flags &amp; JBD2_UNMOUNT)</div><div class='del'>-			should_sleep = 0;</div><div class='del'>-		if (should_sleep) {</div><div class='add'>+		if (transaction == NULL ||</div><div class='add'>+		    time_before(jiffies, transaction-&gt;t_expires)) {</div><div class='ctx'> 			write_unlock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> 			schedule();</div><div class='ctx'> 			write_lock(&amp;journal-&gt;j_state_lock);</div><div class='hunk'>@@ -252,7 +233,7 @@ loop:</div><div class='ctx'> 		finish_wait(&amp;journal-&gt;j_wait_commit, &amp;wait);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	jbd_debug(1, "kjournald2 wakes\n");</div><div class='add'>+	jbd2_debug(1, "kjournald2 wakes\n");</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Were we woken up by a commit wakeup event?</div><div class='hunk'>@@ -260,15 +241,15 @@ loop:</div><div class='ctx'> 	transaction = journal-&gt;j_running_transaction;</div><div class='ctx'> 	if (transaction &amp;&amp; time_after_eq(jiffies, transaction-&gt;t_expires)) {</div><div class='ctx'> 		journal-&gt;j_commit_request = transaction-&gt;t_tid;</div><div class='del'>-		jbd_debug(1, "woke because of timeout\n");</div><div class='add'>+		jbd2_debug(1, "woke because of timeout\n");</div><div class='ctx'> 	}</div><div class='ctx'> 	goto loop;</div><div class='ctx'> </div><div class='ctx'> end_loop:</div><div class='del'>-	del_timer_sync(&amp;journal-&gt;j_commit_timer);</div><div class='add'>+	timer_delete_sync(&amp;journal-&gt;j_commit_timer);</div><div class='ctx'> 	journal-&gt;j_task = NULL;</div><div class='ctx'> 	wake_up(&amp;journal-&gt;j_wait_done_commit);</div><div class='del'>-	jbd_debug(1, "Journal thread exiting.\n");</div><div class='add'>+	jbd2_debug(1, "Journal thread exiting.\n");</div><div class='ctx'> 	write_unlock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -300,6 +281,16 @@ static void journal_kill_thread(journal_t *journal)</div><div class='ctx'> 	write_unlock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline bool jbd2_data_needs_escaping(char *data)</div><div class='add'>+{</div><div class='add'>+	return *((__be32 *)data) == cpu_to_be32(JBD2_MAGIC_NUMBER);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void jbd2_data_do_escape(char *data)</div><div class='add'>+{</div><div class='add'>+	*((unsigned int *)data) = 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * jbd2_journal_write_metadata_buffer: write a metadata buffer to the journal.</div><div class='ctx'>  *</div><div class='hunk'>@@ -327,12 +318,8 @@ static void journal_kill_thread(journal_t *journal)</div><div class='ctx'>  *</div><div class='ctx'>  *</div><div class='ctx'>  * Return value:</div><div class='del'>- *  &lt;0: Error</div><div class='del'>- * &gt;=0: Finished OK</div><div class='del'>- *</div><div class='del'>- * On success:</div><div class='del'>- * Bit 0 set == escape performed on the data</div><div class='del'>- * Bit 1 set == buffer copy-out performed (kfree the data after IO)</div><div class='add'>+ *  =0: Finished OK without escape</div><div class='add'>+ *  =1: Finished OK with escape</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> int jbd2_journal_write_metadata_buffer(transaction_t *transaction,</div><div class='hunk'>@@ -340,12 +327,9 @@ int jbd2_journal_write_metadata_buffer(transaction_t *transaction,</div><div class='ctx'> 				  struct buffer_head **bh_out,</div><div class='ctx'> 				  sector_t blocknr)</div><div class='ctx'> {</div><div class='del'>-	int need_copy_out = 0;</div><div class='del'>-	int done_copy_out = 0;</div><div class='ctx'> 	int do_escape = 0;</div><div class='del'>-	char *mapped_data;</div><div class='ctx'> 	struct buffer_head *new_bh;</div><div class='del'>-	struct page *new_page;</div><div class='add'>+	struct folio *new_folio;</div><div class='ctx'> 	unsigned int new_offset;</div><div class='ctx'> 	struct buffer_head *bh_in = jh2bh(jh_in);</div><div class='ctx'> 	journal_t *journal = transaction-&gt;t_journal;</div><div class='hunk'>@@ -367,87 +351,64 @@ int jbd2_journal_write_metadata_buffer(transaction_t *transaction,</div><div class='ctx'> 	atomic_set(&amp;new_bh-&gt;b_count, 1);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;jh_in-&gt;b_state_lock);</div><div class='del'>-repeat:</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If a new transaction has already done a buffer copy-out, then</div><div class='ctx'> 	 * we use that version of the data for the commit.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (jh_in-&gt;b_frozen_data) {</div><div class='del'>-		done_copy_out = 1;</div><div class='del'>-		new_page = virt_to_page(jh_in-&gt;b_frozen_data);</div><div class='del'>-		new_offset = offset_in_page(jh_in-&gt;b_frozen_data);</div><div class='add'>+		new_folio = virt_to_folio(jh_in-&gt;b_frozen_data);</div><div class='add'>+		new_offset = offset_in_folio(new_folio, jh_in-&gt;b_frozen_data);</div><div class='add'>+		do_escape = jbd2_data_needs_escaping(jh_in-&gt;b_frozen_data);</div><div class='add'>+		if (do_escape)</div><div class='add'>+			jbd2_data_do_escape(jh_in-&gt;b_frozen_data);</div><div class='ctx'> 	} else {</div><div class='del'>-		new_page = jh2bh(jh_in)-&gt;b_page;</div><div class='del'>-		new_offset = offset_in_page(jh2bh(jh_in)-&gt;b_data);</div><div class='del'>-	}</div><div class='add'>+		char *tmp;</div><div class='add'>+		char *mapped_data;</div><div class='ctx'> </div><div class='del'>-	mapped_data = kmap_atomic(new_page);</div><div class='del'>-	/*</div><div class='del'>-	 * Fire data frozen trigger if data already wasn't frozen.  Do this</div><div class='del'>-	 * before checking for escaping, as the trigger may modify the magic</div><div class='del'>-	 * offset.  If a copy-out happens afterwards, it will have the correct</div><div class='del'>-	 * data in the buffer.</div><div class='del'>-	 */</div><div class='del'>-	if (!done_copy_out)</div><div class='del'>-		jbd2_buffer_frozen_trigger(jh_in, mapped_data + new_offset,</div><div class='add'>+		new_folio = bh_in-&gt;b_folio;</div><div class='add'>+		new_offset = offset_in_folio(new_folio, bh_in-&gt;b_data);</div><div class='add'>+		mapped_data = kmap_local_folio(new_folio, new_offset);</div><div class='add'>+		/*</div><div class='add'>+		 * Fire data frozen trigger if data already wasn't frozen. Do</div><div class='add'>+		 * this before checking for escaping, as the trigger may modify</div><div class='add'>+		 * the magic offset.  If a copy-out happens afterwards, it will</div><div class='add'>+		 * have the correct data in the buffer.</div><div class='add'>+		 */</div><div class='add'>+		jbd2_buffer_frozen_trigger(jh_in, mapped_data,</div><div class='ctx'> 					   jh_in-&gt;b_triggers);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Check for escaping</div><div class='del'>-	 */</div><div class='del'>-	if (*((__be32 *)(mapped_data + new_offset)) ==</div><div class='del'>-				cpu_to_be32(JBD2_MAGIC_NUMBER)) {</div><div class='del'>-		need_copy_out = 1;</div><div class='del'>-		do_escape = 1;</div><div class='del'>-	}</div><div class='del'>-	kunmap_atomic(mapped_data);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Do we need to do a data copy?</div><div class='del'>-	 */</div><div class='del'>-	if (need_copy_out &amp;&amp; !done_copy_out) {</div><div class='del'>-		char *tmp;</div><div class='add'>+		do_escape = jbd2_data_needs_escaping(mapped_data);</div><div class='add'>+		kunmap_local(mapped_data);</div><div class='add'>+		/*</div><div class='add'>+		 * Do we need to do a data copy?</div><div class='add'>+		 */</div><div class='add'>+		if (!do_escape)</div><div class='add'>+			goto escape_done;</div><div class='ctx'> </div><div class='ctx'> 		spin_unlock(&amp;jh_in-&gt;b_state_lock);</div><div class='del'>-		tmp = jbd2_alloc(bh_in-&gt;b_size, GFP_NOFS);</div><div class='del'>-		if (!tmp) {</div><div class='del'>-			brelse(new_bh);</div><div class='del'>-			return -ENOMEM;</div><div class='del'>-		}</div><div class='add'>+		tmp = jbd2_alloc(bh_in-&gt;b_size, GFP_NOFS | __GFP_NOFAIL);</div><div class='ctx'> 		spin_lock(&amp;jh_in-&gt;b_state_lock);</div><div class='ctx'> 		if (jh_in-&gt;b_frozen_data) {</div><div class='ctx'> 			jbd2_free(tmp, bh_in-&gt;b_size);</div><div class='del'>-			goto repeat;</div><div class='add'>+			goto copy_done;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		jh_in-&gt;b_frozen_data = tmp;</div><div class='del'>-		mapped_data = kmap_atomic(new_page);</div><div class='del'>-		memcpy(tmp, mapped_data + new_offset, bh_in-&gt;b_size);</div><div class='del'>-		kunmap_atomic(mapped_data);</div><div class='del'>-</div><div class='del'>-		new_page = virt_to_page(tmp);</div><div class='del'>-		new_offset = offset_in_page(tmp);</div><div class='del'>-		done_copy_out = 1;</div><div class='del'>-</div><div class='add'>+		memcpy_from_folio(tmp, new_folio, new_offset, bh_in-&gt;b_size);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * This isn't strictly necessary, as we're using frozen</div><div class='ctx'> 		 * data for the escaping, but it keeps consistency with</div><div class='ctx'> 		 * b_frozen_data usage.</div><div class='ctx'> 		 */</div><div class='ctx'> 		jh_in-&gt;b_frozen_triggers = jh_in-&gt;b_triggers;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Did we need to do an escaping?  Now we've done all the</div><div class='del'>-	 * copying, we can finally do so.</div><div class='del'>-	 */</div><div class='del'>-	if (do_escape) {</div><div class='del'>-		mapped_data = kmap_atomic(new_page);</div><div class='del'>-		*((unsigned int *)(mapped_data + new_offset)) = 0;</div><div class='del'>-		kunmap_atomic(mapped_data);</div><div class='add'>+copy_done:</div><div class='add'>+		new_folio = virt_to_folio(jh_in-&gt;b_frozen_data);</div><div class='add'>+		new_offset = offset_in_folio(new_folio, jh_in-&gt;b_frozen_data);</div><div class='add'>+		jbd2_data_do_escape(jh_in-&gt;b_frozen_data);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	set_bh_page(new_bh, new_page, new_offset);</div><div class='add'>+escape_done:</div><div class='add'>+	folio_set_bh(new_bh, new_folio, new_offset);</div><div class='ctx'> 	new_bh-&gt;b_size = bh_in-&gt;b_size;</div><div class='ctx'> 	new_bh-&gt;b_bdev = journal-&gt;j_dev;</div><div class='ctx'> 	new_bh-&gt;b_blocknr = blocknr;</div><div class='hunk'>@@ -469,7 +430,7 @@ repeat:</div><div class='ctx'> 	set_buffer_shadow(bh_in);</div><div class='ctx'> 	spin_unlock(&amp;jh_in-&gt;b_state_lock);</div><div class='ctx'> </div><div class='del'>-	return do_escape | (done_copy_out &lt;&lt; 1);</div><div class='add'>+	return do_escape;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -481,7 +442,7 @@ repeat:</div><div class='ctx'>  * Called with j_state_lock locked for writing.</div><div class='ctx'>  * Returns true if a transaction commit was started.</div><div class='ctx'>  */</div><div class='del'>-int __jbd2_log_start_commit(journal_t *journal, tid_t target)</div><div class='add'>+static int __jbd2_log_start_commit(journal_t *journal, tid_t target)</div><div class='ctx'> {</div><div class='ctx'> 	/* Return if the txn has already requested to be committed */</div><div class='ctx'> 	if (journal-&gt;j_commit_request == target)</div><div class='hunk'>@@ -500,7 +461,7 @@ int __jbd2_log_start_commit(journal_t *journal, tid_t target)</div><div class='ctx'> 		 */</div><div class='ctx'> </div><div class='ctx'> 		journal-&gt;j_commit_request = target;</div><div class='del'>-		jbd_debug(1, "JBD2: requesting commit %u/%u\n",</div><div class='add'>+		jbd2_debug(1, "JBD2: requesting commit %u/%u\n",</div><div class='ctx'> 			  journal-&gt;j_commit_request,</div><div class='ctx'> 			  journal-&gt;j_commit_sequence);</div><div class='ctx'> 		journal-&gt;j_running_transaction-&gt;t_requested = jiffies;</div><div class='hunk'>@@ -642,7 +603,7 @@ int jbd2_journal_start_commit(journal_t *journal, tid_t *ptid)</div><div class='ctx'> int jbd2_trans_will_send_data_barrier(journal_t *journal, tid_t tid)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	transaction_t *commit_trans;</div><div class='add'>+	transaction_t *commit_trans, *running_trans;</div><div class='ctx'> </div><div class='ctx'> 	if (!(journal-&gt;j_flags &amp; JBD2_BARRIER))</div><div class='ctx'> 		return 0;</div><div class='hunk'>@@ -652,6 +613,16 @@ int jbd2_trans_will_send_data_barrier(journal_t *journal, tid_t tid)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	commit_trans = journal-&gt;j_committing_transaction;</div><div class='ctx'> 	if (!commit_trans || commit_trans-&gt;t_tid != tid) {</div><div class='add'>+		running_trans = journal-&gt;j_running_transaction;</div><div class='add'>+		/*</div><div class='add'>+		 * The query transaction hasn't started committing,</div><div class='add'>+		 * it must still be running.</div><div class='add'>+		 */</div><div class='add'>+		if (WARN_ON_ONCE(!running_trans ||</div><div class='add'>+				 running_trans-&gt;t_tid != tid))</div><div class='add'>+			goto out;</div><div class='add'>+</div><div class='add'>+		running_trans-&gt;t_need_data_flush = 1;</div><div class='ctx'> 		ret = 1;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -705,7 +676,7 @@ int jbd2_log_wait_commit(journal_t *journal, tid_t tid)</div><div class='ctx'> 	}</div><div class='ctx'> #endif</div><div class='ctx'> 	while (tid_gt(tid, journal-&gt;j_commit_sequence)) {</div><div class='del'>-		jbd_debug(1, "JBD2: want %u, j_commit_sequence=%u\n",</div><div class='add'>+		jbd2_debug(1, "JBD2: want %u, j_commit_sequence=%u\n",</div><div class='ctx'> 				  tid, journal-&gt;j_commit_sequence);</div><div class='ctx'> 		read_unlock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> 		wake_up(&amp;journal-&gt;j_wait_commit);</div><div class='hunk'>@@ -739,7 +710,7 @@ int jbd2_fc_begin_commit(journal_t *journal, tid_t tid)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	write_lock(&amp;journal-&gt;j_state_lock);</div><div class='del'>-	if (tid &lt;= journal-&gt;j_commit_sequence) {</div><div class='add'>+	if (tid_geq(journal-&gt;j_commit_sequence, tid)) {</div><div class='ctx'> 		write_unlock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> 		return -EALREADY;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -769,7 +740,7 @@ EXPORT_SYMBOL(jbd2_fc_begin_commit);</div><div class='ctx'> static int __jbd2_fc_end_commit(journal_t *journal, tid_t tid, bool fallback)</div><div class='ctx'> {</div><div class='ctx'> 	if (journal-&gt;j_fc_cleanup_callback)</div><div class='del'>-		journal-&gt;j_fc_cleanup_callback(journal, 0);</div><div class='add'>+		journal-&gt;j_fc_cleanup_callback(journal, 0, tid);</div><div class='ctx'> 	write_lock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> 	journal-&gt;j_flags &amp;= ~JBD2_FAST_COMMIT_ONGOING;</div><div class='ctx'> 	if (fallback)</div><div class='hunk'>@@ -802,17 +773,7 @@ EXPORT_SYMBOL(jbd2_fc_end_commit_fallback);</div><div class='ctx'> /* Return 1 when transaction with given tid has already committed. */</div><div class='ctx'> int jbd2_transaction_committed(journal_t *journal, tid_t tid)</div><div class='ctx'> {</div><div class='del'>-	int ret = 1;</div><div class='del'>-</div><div class='del'>-	read_lock(&amp;journal-&gt;j_state_lock);</div><div class='del'>-	if (journal-&gt;j_running_transaction &amp;&amp;</div><div class='del'>-	    journal-&gt;j_running_transaction-&gt;t_tid == tid)</div><div class='del'>-		ret = 0;</div><div class='del'>-	if (journal-&gt;j_committing_transaction &amp;&amp;</div><div class='del'>-	    journal-&gt;j_committing_transaction-&gt;t_tid == tid)</div><div class='del'>-		ret = 0;</div><div class='del'>-	read_unlock(&amp;journal-&gt;j_state_lock);</div><div class='del'>-	return ret;</div><div class='add'>+	return tid_geq(READ_ONCE(journal-&gt;j_commit_sequence), tid);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(jbd2_transaction_committed);</div><div class='ctx'> </div><div class='hunk'>@@ -878,17 +839,12 @@ int jbd2_fc_get_buf(journal_t *journal, struct buffer_head **bh_out)</div><div class='ctx'> </div><div class='ctx'> 	*bh_out = NULL;</div><div class='ctx'> </div><div class='del'>-	if (journal-&gt;j_fc_off + journal-&gt;j_fc_first &lt; journal-&gt;j_fc_last) {</div><div class='del'>-		fc_off = journal-&gt;j_fc_off;</div><div class='del'>-		blocknr = journal-&gt;j_fc_first + fc_off;</div><div class='del'>-		journal-&gt;j_fc_off++;</div><div class='del'>-	} else {</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='add'>+	if (journal-&gt;j_fc_off + journal-&gt;j_fc_first &gt;= journal-&gt;j_fc_last)</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='add'>+	fc_off = journal-&gt;j_fc_off;</div><div class='add'>+	blocknr = journal-&gt;j_fc_first + fc_off;</div><div class='add'>+	journal-&gt;j_fc_off++;</div><div class='ctx'> 	ret = jbd2_journal_bmap(journal, blocknr, &amp;pblock);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -897,7 +853,6 @@ int jbd2_fc_get_buf(journal_t *journal, struct buffer_head **bh_out)</div><div class='ctx'> 	if (!bh)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-</div><div class='ctx'> 	journal-&gt;j_fc_wbuf[fc_off] = bh;</div><div class='ctx'> </div><div class='ctx'> 	*bh_out = bh;</div><div class='hunk'>@@ -924,17 +879,23 @@ int jbd2_fc_wait_bufs(journal_t *journal, int num_blks)</div><div class='ctx'> 	for (i = j_fc_off - 1; i &gt;= j_fc_off - num_blks; i--) {</div><div class='ctx'> 		bh = journal-&gt;j_fc_wbuf[i];</div><div class='ctx'> 		wait_on_buffer(bh);</div><div class='add'>+		/*</div><div class='add'>+		 * Update j_fc_off so jbd2_fc_release_bufs can release remain</div><div class='add'>+		 * buffer head.</div><div class='add'>+		 */</div><div class='add'>+		if (unlikely(!buffer_uptodate(bh))) {</div><div class='add'>+			journal-&gt;j_fc_off = i + 1;</div><div class='add'>+			return -EIO;</div><div class='add'>+		}</div><div class='ctx'> 		put_bh(bh);</div><div class='ctx'> 		journal-&gt;j_fc_wbuf[i] = NULL;</div><div class='del'>-		if (unlikely(!buffer_uptodate(bh)))</div><div class='del'>-			return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(jbd2_fc_wait_bufs);</div><div class='ctx'> </div><div class='del'>-int jbd2_fc_release_bufs(journal_t *journal)</div><div class='add'>+void jbd2_fc_release_bufs(journal_t *journal)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> 	int i, j_fc_off;</div><div class='hunk'>@@ -948,8 +909,6 @@ int jbd2_fc_release_bufs(journal_t *journal)</div><div class='ctx'> 		put_bh(bh);</div><div class='ctx'> 		journal-&gt;j_fc_wbuf[i] = NULL;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(jbd2_fc_release_bufs);</div><div class='ctx'> </div><div class='hunk'>@@ -965,18 +924,21 @@ int jbd2_journal_bmap(journal_t *journal, unsigned long blocknr,</div><div class='ctx'> {</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> 	unsigned long long ret;</div><div class='del'>-	sector_t block = 0;</div><div class='add'>+	sector_t block = blocknr;</div><div class='ctx'> </div><div class='del'>-	if (journal-&gt;j_inode) {</div><div class='del'>-		block = blocknr;</div><div class='add'>+	if (journal-&gt;j_bmap) {</div><div class='add'>+		err = journal-&gt;j_bmap(journal, &amp;block);</div><div class='add'>+		if (err == 0)</div><div class='add'>+			*retp = block;</div><div class='add'>+	} else if (journal-&gt;j_inode) {</div><div class='ctx'> 		ret = bmap(journal-&gt;j_inode, &amp;block);</div><div class='ctx'> </div><div class='ctx'> 		if (ret || !block) {</div><div class='ctx'> 			printk(KERN_ALERT "%s: journal block not found "</div><div class='ctx'> 					"at offset %lu on %s\n",</div><div class='ctx'> 			       __func__, blocknr, journal-&gt;j_devname);</div><div class='add'>+			jbd2_journal_abort(journal, ret ? ret : -EFSCORRUPTED);</div><div class='ctx'> 			err = -EIO;</div><div class='del'>-			jbd2_journal_abort(journal, err);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			*retp = block;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -993,7 +955,7 @@ int jbd2_journal_bmap(journal_t *journal, unsigned long blocknr,</div><div class='ctx'>  * descriptor blocks we do need to generate bona fide buffers.</div><div class='ctx'>  *</div><div class='ctx'>  * After the caller of jbd2_journal_get_descriptor_buffer() has finished modifying</div><div class='del'>- * the buffer's contents they really should run flush_dcache_page(bh-&gt;b_page).</div><div class='add'>+ * the buffer's contents they really should run flush_dcache_folio(bh-&gt;b_folio).</div><div class='ctx'>  * But we don't bother doing that, so there will be coherency problems with</div><div class='ctx'>  * mmaps of blockdevs which hold live JBD-controlled filesystems.</div><div class='ctx'>  */</div><div class='hunk'>@@ -1038,7 +1000,7 @@ void jbd2_descriptor_block_csum_set(journal_t *j, struct buffer_head *bh)</div><div class='ctx'> 	tail = (struct jbd2_journal_block_tail *)(bh-&gt;b_data + j-&gt;j_blocksize -</div><div class='ctx'> 			sizeof(struct jbd2_journal_block_tail));</div><div class='ctx'> 	tail-&gt;t_checksum = 0;</div><div class='del'>-	csum = jbd2_chksum(j, j-&gt;j_csum_seed, bh-&gt;b_data, j-&gt;j_blocksize);</div><div class='add'>+	csum = jbd2_chksum(j-&gt;j_csum_seed, bh-&gt;b_data, j-&gt;j_blocksize);</div><div class='ctx'> 	tail-&gt;t_checksum = cpu_to_be32(csum);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1104,8 +1066,7 @@ int __jbd2_update_log_tail(journal_t *journal, tid_t tid, unsigned long block)</div><div class='ctx'> 	 * space and if we lose sb update during power failure we'd replay</div><div class='ctx'> 	 * old transaction with possibly newly overwritten data.</div><div class='ctx'> 	 */</div><div class='del'>-	ret = jbd2_journal_update_sb_log_tail(journal, tid, block,</div><div class='del'>-					      REQ_SYNC | REQ_FUA);</div><div class='add'>+	ret = jbd2_journal_update_sb_log_tail(journal, tid, block, REQ_FUA);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -1115,7 +1076,7 @@ int __jbd2_update_log_tail(journal_t *journal, tid_t tid, unsigned long block)</div><div class='ctx'> 		freed += journal-&gt;j_last - journal-&gt;j_first;</div><div class='ctx'> </div><div class='ctx'> 	trace_jbd2_update_log_tail(journal, tid, block, freed);</div><div class='del'>-	jbd_debug(1,</div><div class='add'>+	jbd2_debug(1,</div><div class='ctx'> 		  "Cleaning journal tail from %u to %u (offset %lu), "</div><div class='ctx'> 		  "freeing %lu\n",</div><div class='ctx'> 		  journal-&gt;j_tail_sequence, tid, block, freed);</div><div class='hunk'>@@ -1210,7 +1171,7 @@ static const struct seq_operations jbd2_seq_info_ops = {</div><div class='ctx'> </div><div class='ctx'> static int jbd2_seq_info_open(struct inode *inode, struct file *file)</div><div class='ctx'> {</div><div class='del'>-	journal_t *journal = PDE_DATA(inode);</div><div class='add'>+	journal_t *journal = pde_data(inode);</div><div class='ctx'> 	struct jbd2_stats_proc_session *s;</div><div class='ctx'> 	int rc, size;</div><div class='ctx'> </div><div class='hunk'>@@ -1285,6 +1246,8 @@ static int jbd2_min_tag_size(void)</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * jbd2_journal_shrink_scan()</div><div class='add'>+ * @shrink: shrinker to work on</div><div class='add'>+ * @sc: reclaim request to process</div><div class='ctx'>  *</div><div class='ctx'>  * Scan the checkpointed buffer on the checkpoint list and release the</div><div class='ctx'>  * journal_head.</div><div class='hunk'>@@ -1292,7 +1255,7 @@ static int jbd2_min_tag_size(void)</div><div class='ctx'> static unsigned long jbd2_journal_shrink_scan(struct shrinker *shrink,</div><div class='ctx'> 					      struct shrink_control *sc)</div><div class='ctx'> {</div><div class='del'>-	journal_t *journal = container_of(shrink, journal_t, j_shrinker);</div><div class='add'>+	journal_t *journal = shrink-&gt;private_data;</div><div class='ctx'> 	unsigned long nr_to_scan = sc-&gt;nr_to_scan;</div><div class='ctx'> 	unsigned long nr_shrunk;</div><div class='ctx'> 	unsigned long count;</div><div class='hunk'>@@ -1310,13 +1273,15 @@ static unsigned long jbd2_journal_shrink_scan(struct shrinker *shrink,</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * jbd2_journal_shrink_count()</div><div class='add'>+ * @shrink: shrinker to work on</div><div class='add'>+ * @sc: reclaim request to process</div><div class='ctx'>  *</div><div class='ctx'>  * Count the number of checkpoint buffers on the checkpoint list.</div><div class='ctx'>  */</div><div class='ctx'> static unsigned long jbd2_journal_shrink_count(struct shrinker *shrink,</div><div class='ctx'> 					       struct shrink_control *sc)</div><div class='ctx'> {</div><div class='del'>-	journal_t *journal = container_of(shrink, journal_t, j_shrinker);</div><div class='add'>+	journal_t *journal = shrink-&gt;private_data;</div><div class='ctx'> 	unsigned long count;</div><div class='ctx'> </div><div class='ctx'> 	count = percpu_counter_read_positive(&amp;journal-&gt;j_checkpoint_jh_count);</div><div class='hunk'>@@ -1326,27 +1291,255 @@ static unsigned long jbd2_journal_shrink_count(struct shrinker *shrink,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * If the journal init or create aborts, we need to mark the journal</div><div class='add'>+ * superblock as being NULL to prevent the journal destroy from writing</div><div class='add'>+ * back a bogus superblock.</div><div class='add'>+ */</div><div class='add'>+static void journal_fail_superblock(journal_t *journal)</div><div class='add'>+{</div><div class='add'>+	struct buffer_head *bh = journal-&gt;j_sb_buffer;</div><div class='add'>+	brelse(bh);</div><div class='add'>+	journal-&gt;j_sb_buffer = NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Check the superblock for a given journal, performing initial</div><div class='add'>+ * validation of the format.</div><div class='add'>+ */</div><div class='add'>+static int journal_check_superblock(journal_t *journal)</div><div class='add'>+{</div><div class='add'>+	journal_superblock_t *sb = journal-&gt;j_superblock;</div><div class='add'>+	int num_fc_blks;</div><div class='add'>+	int err = -EINVAL;</div><div class='add'>+</div><div class='add'>+	if (sb-&gt;s_header.h_magic != cpu_to_be32(JBD2_MAGIC_NUMBER) ||</div><div class='add'>+	    sb-&gt;s_blocksize != cpu_to_be32(journal-&gt;j_blocksize)) {</div><div class='add'>+		printk(KERN_WARNING "JBD2: no valid journal superblock found\n");</div><div class='add'>+		return err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (be32_to_cpu(sb-&gt;s_header.h_blocktype) != JBD2_SUPERBLOCK_V1 &amp;&amp;</div><div class='add'>+	    be32_to_cpu(sb-&gt;s_header.h_blocktype) != JBD2_SUPERBLOCK_V2) {</div><div class='add'>+		printk(KERN_WARNING "JBD2: unrecognised superblock format ID\n");</div><div class='add'>+		return err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (be32_to_cpu(sb-&gt;s_maxlen) &gt; journal-&gt;j_total_len) {</div><div class='add'>+		printk(KERN_WARNING "JBD2: journal file too short\n");</div><div class='add'>+		return err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (be32_to_cpu(sb-&gt;s_first) == 0 ||</div><div class='add'>+	    be32_to_cpu(sb-&gt;s_first) &gt;= journal-&gt;j_total_len) {</div><div class='add'>+		printk(KERN_WARNING</div><div class='add'>+			"JBD2: Invalid start block of journal: %u\n",</div><div class='add'>+			be32_to_cpu(sb-&gt;s_first));</div><div class='add'>+		return err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If this is a V2 superblock, then we have to check the</div><div class='add'>+	 * features flags on it.</div><div class='add'>+	 */</div><div class='add'>+	if (!jbd2_format_support_feature(journal))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if ((sb-&gt;s_feature_ro_compat &amp;</div><div class='add'>+			~cpu_to_be32(JBD2_KNOWN_ROCOMPAT_FEATURES)) ||</div><div class='add'>+	    (sb-&gt;s_feature_incompat &amp;</div><div class='add'>+			~cpu_to_be32(JBD2_KNOWN_INCOMPAT_FEATURES))) {</div><div class='add'>+		printk(KERN_WARNING "JBD2: Unrecognised features on journal\n");</div><div class='add'>+		return err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	num_fc_blks = jbd2_has_feature_fast_commit(journal) ?</div><div class='add'>+				jbd2_journal_get_num_fc_blks(sb) : 0;</div><div class='add'>+	if (be32_to_cpu(sb-&gt;s_maxlen) &lt; JBD2_MIN_JOURNAL_BLOCKS ||</div><div class='add'>+	    be32_to_cpu(sb-&gt;s_maxlen) - JBD2_MIN_JOURNAL_BLOCKS &lt; num_fc_blks) {</div><div class='add'>+		printk(KERN_ERR "JBD2: journal file too short %u,%d\n",</div><div class='add'>+		       be32_to_cpu(sb-&gt;s_maxlen), num_fc_blks);</div><div class='add'>+		return err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (jbd2_has_feature_csum2(journal) &amp;&amp;</div><div class='add'>+	    jbd2_has_feature_csum3(journal)) {</div><div class='add'>+		/* Can't have checksum v2 and v3 at the same time! */</div><div class='add'>+		printk(KERN_ERR "JBD2: Can't enable checksumming v2 and v3 "</div><div class='add'>+		       "at the same time!\n");</div><div class='add'>+		return err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (jbd2_journal_has_csum_v2or3(journal) &amp;&amp;</div><div class='add'>+	    jbd2_has_feature_checksum(journal)) {</div><div class='add'>+		/* Can't have checksum v1 and v2 on at the same time! */</div><div class='add'>+		printk(KERN_ERR "JBD2: Can't enable checksumming v1 and v2/3 "</div><div class='add'>+		       "at the same time!\n");</div><div class='add'>+		return err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (jbd2_journal_has_csum_v2or3(journal)) {</div><div class='add'>+		if (sb-&gt;s_checksum_type != JBD2_CRC32C_CHKSUM) {</div><div class='add'>+			printk(KERN_ERR "JBD2: Unknown checksum type\n");</div><div class='add'>+			return err;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* Check superblock checksum */</div><div class='add'>+		if (sb-&gt;s_checksum != jbd2_superblock_csum(sb)) {</div><div class='add'>+			printk(KERN_ERR "JBD2: journal checksum error\n");</div><div class='add'>+			err = -EFSBADCRC;</div><div class='add'>+			return err;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int journal_revoke_records_per_block(journal_t *journal)</div><div class='add'>+{</div><div class='add'>+	int record_size;</div><div class='add'>+	int space = journal-&gt;j_blocksize - sizeof(jbd2_journal_revoke_header_t);</div><div class='add'>+</div><div class='add'>+	if (jbd2_has_feature_64bit(journal))</div><div class='add'>+		record_size = 8;</div><div class='add'>+	else</div><div class='add'>+		record_size = 4;</div><div class='add'>+</div><div class='add'>+	if (jbd2_journal_has_csum_v2or3(journal))</div><div class='add'>+		space -= sizeof(struct jbd2_journal_block_tail);</div><div class='add'>+	return space / record_size;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int jbd2_journal_get_max_txn_bufs(journal_t *journal)</div><div class='add'>+{</div><div class='add'>+	return (journal-&gt;j_total_len - journal-&gt;j_fc_wbufsize) / 3;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Base amount of descriptor blocks we reserve for each transaction.</div><div class='add'>+ */</div><div class='add'>+static int jbd2_descriptor_blocks_per_trans(journal_t *journal)</div><div class='add'>+{</div><div class='add'>+	int tag_space = journal-&gt;j_blocksize - sizeof(journal_header_t);</div><div class='add'>+	int tags_per_block;</div><div class='add'>+</div><div class='add'>+	/* Subtract UUID */</div><div class='add'>+	tag_space -= 16;</div><div class='add'>+	if (jbd2_journal_has_csum_v2or3(journal))</div><div class='add'>+		tag_space -= sizeof(struct jbd2_journal_block_tail);</div><div class='add'>+	/* Commit code leaves a slack space of 16 bytes at the end of block */</div><div class='add'>+	tags_per_block = (tag_space - 16) / journal_tag_bytes(journal);</div><div class='add'>+	/*</div><div class='add'>+	 * Revoke descriptors are accounted separately so we need to reserve</div><div class='add'>+	 * space for commit block and normal transaction descriptor blocks.</div><div class='add'>+	 */</div><div class='add'>+	return 1 + DIV_ROUND_UP(jbd2_journal_get_max_txn_bufs(journal),</div><div class='add'>+				tags_per_block);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Initialize number of blocks each transaction reserves for its bookkeeping</div><div class='add'>+ * and maximum number of blocks a transaction can use. This needs to be called</div><div class='add'>+ * after the journal size and the fastcommit area size are initialized.</div><div class='add'>+ */</div><div class='add'>+static void jbd2_journal_init_transaction_limits(journal_t *journal)</div><div class='add'>+{</div><div class='add'>+	journal-&gt;j_revoke_records_per_block =</div><div class='add'>+				journal_revoke_records_per_block(journal);</div><div class='add'>+	journal-&gt;j_transaction_overhead_buffers =</div><div class='add'>+				jbd2_descriptor_blocks_per_trans(journal);</div><div class='add'>+	journal-&gt;j_max_transaction_buffers =</div><div class='add'>+				jbd2_journal_get_max_txn_bufs(journal);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Load the on-disk journal superblock and read the key fields into the</div><div class='add'>+ * journal_t.</div><div class='add'>+ */</div><div class='add'>+static int journal_load_superblock(journal_t *journal)</div><div class='add'>+{</div><div class='add'>+	int err;</div><div class='add'>+	struct buffer_head *bh;</div><div class='add'>+	journal_superblock_t *sb;</div><div class='add'>+</div><div class='add'>+	bh = getblk_unmovable(journal-&gt;j_dev, journal-&gt;j_blk_offset,</div><div class='add'>+			      journal-&gt;j_blocksize);</div><div class='add'>+	if (bh)</div><div class='add'>+		err = bh_read(bh, 0);</div><div class='add'>+	if (!bh || err &lt; 0) {</div><div class='add'>+		pr_err("%s: Cannot read journal superblock\n", __func__);</div><div class='add'>+		brelse(bh);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	journal-&gt;j_sb_buffer = bh;</div><div class='add'>+	sb = (journal_superblock_t *)bh-&gt;b_data;</div><div class='add'>+	journal-&gt;j_superblock = sb;</div><div class='add'>+	err = journal_check_superblock(journal);</div><div class='add'>+	if (err) {</div><div class='add'>+		journal_fail_superblock(journal);</div><div class='add'>+		return err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	journal-&gt;j_tail_sequence = be32_to_cpu(sb-&gt;s_sequence);</div><div class='add'>+	journal-&gt;j_tail = be32_to_cpu(sb-&gt;s_start);</div><div class='add'>+	journal-&gt;j_first = be32_to_cpu(sb-&gt;s_first);</div><div class='add'>+	journal-&gt;j_errno = be32_to_cpu(sb-&gt;s_errno);</div><div class='add'>+	journal-&gt;j_last = be32_to_cpu(sb-&gt;s_maxlen);</div><div class='add'>+</div><div class='add'>+	if (be32_to_cpu(sb-&gt;s_maxlen) &lt; journal-&gt;j_total_len)</div><div class='add'>+		journal-&gt;j_total_len = be32_to_cpu(sb-&gt;s_maxlen);</div><div class='add'>+	/* Precompute checksum seed for all metadata */</div><div class='add'>+	if (jbd2_journal_has_csum_v2or3(journal))</div><div class='add'>+		journal-&gt;j_csum_seed = jbd2_chksum(~0, sb-&gt;s_uuid,</div><div class='add'>+						   sizeof(sb-&gt;s_uuid));</div><div class='add'>+	/* After journal features are set, we can compute transaction limits */</div><div class='add'>+	jbd2_journal_init_transaction_limits(journal);</div><div class='add'>+</div><div class='add'>+	if (jbd2_has_feature_fast_commit(journal)) {</div><div class='add'>+		journal-&gt;j_fc_last = be32_to_cpu(sb-&gt;s_maxlen);</div><div class='add'>+		journal-&gt;j_last = journal-&gt;j_fc_last -</div><div class='add'>+				  jbd2_journal_get_num_fc_blks(sb);</div><div class='add'>+		journal-&gt;j_fc_first = journal-&gt;j_last + 1;</div><div class='add'>+		journal-&gt;j_fc_off = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * Management for journal control blocks: functions to create and</div><div class='ctx'>  * destroy journal_t structures, and to initialise and read existing</div><div class='ctx'>  * journal blocks from disk.  */</div><div class='ctx'> </div><div class='del'>-/* First: create and setup a journal_t object in memory.  We initialise</div><div class='del'>- * very few fields yet: that has to wait until we have created the</div><div class='del'>- * journal structures from from scratch, or loaded them from disk. */</div><div class='add'>+/* The journal_init_common() function creates and fills a journal_t object</div><div class='add'>+ * in memory. It calls journal_load_superblock() to load the on-disk journal</div><div class='add'>+ * superblock and initialize the journal_t object.</div><div class='add'>+ */</div><div class='ctx'> </div><div class='ctx'> static journal_t *journal_init_common(struct block_device *bdev,</div><div class='ctx'> 			struct block_device *fs_dev,</div><div class='ctx'> 			unsigned long long start, int len, int blocksize)</div><div class='ctx'> {</div><div class='del'>-	static struct lock_class_key jbd2_trans_commit_key;</div><div class='ctx'> 	journal_t *journal;</div><div class='ctx'> 	int err;</div><div class='del'>-	struct buffer_head *bh;</div><div class='ctx'> 	int n;</div><div class='ctx'> </div><div class='ctx'> 	journal = kzalloc(sizeof(*journal), GFP_KERNEL);</div><div class='ctx'> 	if (!journal)</div><div class='del'>-		return NULL;</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+</div><div class='add'>+	lockdep_register_key(&amp;journal-&gt;jbd2_trans_commit_key);</div><div class='add'>+	journal-&gt;j_blocksize = blocksize;</div><div class='add'>+	journal-&gt;j_dev = bdev;</div><div class='add'>+	journal-&gt;j_fs_dev = fs_dev;</div><div class='add'>+	journal-&gt;j_blk_offset = start;</div><div class='add'>+	journal-&gt;j_total_len = len;</div><div class='add'>+	jbd2_init_fs_dev_write_error(journal);</div><div class='add'>+</div><div class='add'>+	err = journal_load_superblock(journal);</div><div class='add'>+	if (err)</div><div class='add'>+		goto err_cleanup;</div><div class='ctx'> </div><div class='ctx'> 	init_waitqueue_head(&amp;journal-&gt;j_wait_transaction_locked);</div><div class='ctx'> 	init_waitqueue_head(&amp;journal-&gt;j_wait_done_commit);</div><div class='hunk'>@@ -1359,12 +1552,15 @@ static journal_t *journal_init_common(struct block_device *bdev,</div><div class='ctx'> 	mutex_init(&amp;journal-&gt;j_checkpoint_mutex);</div><div class='ctx'> 	spin_lock_init(&amp;journal-&gt;j_revoke_lock);</div><div class='ctx'> 	spin_lock_init(&amp;journal-&gt;j_list_lock);</div><div class='add'>+	spin_lock_init(&amp;journal-&gt;j_history_lock);</div><div class='ctx'> 	rwlock_init(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> </div><div class='ctx'> 	journal-&gt;j_commit_interval = (HZ * JBD2_DEFAULT_MAX_COMMIT_AGE);</div><div class='ctx'> 	journal-&gt;j_min_batch_time = 0;</div><div class='ctx'> 	journal-&gt;j_max_batch_time = 15000; /* 15ms */</div><div class='ctx'> 	atomic_set(&amp;journal-&gt;j_reserved_credits, 0);</div><div class='add'>+	lockdep_init_map(&amp;journal-&gt;j_trans_commit_map, "jbd2_handle",</div><div class='add'>+			 &amp;journal-&gt;jbd2_trans_commit_key, 0);</div><div class='ctx'> </div><div class='ctx'> 	/* The journal is marked for error until we succeed with recovery! */</div><div class='ctx'> 	journal-&gt;j_flags = JBD2_ABORT;</div><div class='hunk'>@@ -1374,18 +1570,11 @@ static journal_t *journal_init_common(struct block_device *bdev,</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto err_cleanup;</div><div class='ctx'> </div><div class='del'>-	spin_lock_init(&amp;journal-&gt;j_history_lock);</div><div class='del'>-</div><div class='del'>-	lockdep_init_map(&amp;journal-&gt;j_trans_commit_map, "jbd2_handle",</div><div class='del'>-			 &amp;jbd2_trans_commit_key, 0);</div><div class='del'>-</div><div class='del'>-	/* journal descriptor can store up to n blocks -bzzz */</div><div class='del'>-	journal-&gt;j_blocksize = blocksize;</div><div class='del'>-	journal-&gt;j_dev = bdev;</div><div class='del'>-	journal-&gt;j_fs_dev = fs_dev;</div><div class='del'>-	journal-&gt;j_blk_offset = start;</div><div class='del'>-	journal-&gt;j_total_len = len;</div><div class='del'>-	/* We need enough buffers to write out full descriptor block. */</div><div class='add'>+	/*</div><div class='add'>+	 * journal descriptor can store up to n blocks, we need enough</div><div class='add'>+	 * buffers to write out full descriptor block.</div><div class='add'>+	 */</div><div class='add'>+	err = -ENOMEM;</div><div class='ctx'> 	n = journal-&gt;j_blocksize / jbd2_min_tag_size();</div><div class='ctx'> 	journal-&gt;j_wbufsize = n;</div><div class='ctx'> 	journal-&gt;j_fc_wbuf = NULL;</div><div class='hunk'>@@ -1394,36 +1583,37 @@ static journal_t *journal_init_common(struct block_device *bdev,</div><div class='ctx'> 	if (!journal-&gt;j_wbuf)</div><div class='ctx'> 		goto err_cleanup;</div><div class='ctx'> </div><div class='del'>-	bh = getblk_unmovable(journal-&gt;j_dev, start, journal-&gt;j_blocksize);</div><div class='del'>-	if (!bh) {</div><div class='del'>-		pr_err("%s: Cannot get buffer for journal superblock\n",</div><div class='del'>-			__func__);</div><div class='add'>+	err = percpu_counter_init(&amp;journal-&gt;j_checkpoint_jh_count, 0,</div><div class='add'>+				  GFP_KERNEL);</div><div class='add'>+	if (err)</div><div class='ctx'> 		goto err_cleanup;</div><div class='del'>-	}</div><div class='del'>-	journal-&gt;j_sb_buffer = bh;</div><div class='del'>-	journal-&gt;j_superblock = (journal_superblock_t *)bh-&gt;b_data;</div><div class='ctx'> </div><div class='ctx'> 	journal-&gt;j_shrink_transaction = NULL;</div><div class='del'>-	journal-&gt;j_shrinker.scan_objects = jbd2_journal_shrink_scan;</div><div class='del'>-	journal-&gt;j_shrinker.count_objects = jbd2_journal_shrink_count;</div><div class='del'>-	journal-&gt;j_shrinker.seeks = DEFAULT_SEEKS;</div><div class='del'>-	journal-&gt;j_shrinker.batch = journal-&gt;j_max_transaction_buffers;</div><div class='ctx'> </div><div class='del'>-	if (percpu_counter_init(&amp;journal-&gt;j_checkpoint_jh_count, 0, GFP_KERNEL))</div><div class='del'>-		goto err_cleanup;</div><div class='del'>-</div><div class='del'>-	if (register_shrinker(&amp;journal-&gt;j_shrinker)) {</div><div class='del'>-		percpu_counter_destroy(&amp;journal-&gt;j_checkpoint_jh_count);</div><div class='add'>+	journal-&gt;j_shrinker = shrinker_alloc(0, "jbd2-journal:(%u:%u)",</div><div class='add'>+					     MAJOR(bdev-&gt;bd_dev),</div><div class='add'>+					     MINOR(bdev-&gt;bd_dev));</div><div class='add'>+	if (!journal-&gt;j_shrinker) {</div><div class='add'>+		err = -ENOMEM;</div><div class='ctx'> 		goto err_cleanup;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	journal-&gt;j_shrinker-&gt;scan_objects = jbd2_journal_shrink_scan;</div><div class='add'>+	journal-&gt;j_shrinker-&gt;count_objects = jbd2_journal_shrink_count;</div><div class='add'>+	journal-&gt;j_shrinker-&gt;private_data = journal;</div><div class='add'>+</div><div class='add'>+	shrinker_register(journal-&gt;j_shrinker);</div><div class='add'>+</div><div class='ctx'> 	return journal;</div><div class='ctx'> </div><div class='ctx'> err_cleanup:</div><div class='del'>-	brelse(journal-&gt;j_sb_buffer);</div><div class='add'>+	percpu_counter_destroy(&amp;journal-&gt;j_checkpoint_jh_count);</div><div class='ctx'> 	kfree(journal-&gt;j_wbuf);</div><div class='ctx'> 	jbd2_journal_destroy_revoke(journal);</div><div class='add'>+	journal_fail_superblock(journal);</div><div class='add'>+	lockdep_unregister_key(&amp;journal-&gt;jbd2_trans_commit_key);</div><div class='ctx'> 	kfree(journal);</div><div class='del'>-	return NULL;</div><div class='add'>+	return ERR_PTR(err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* jbd2_journal_init_dev and jbd2_journal_init_inode:</div><div class='hunk'>@@ -1456,10 +1646,11 @@ journal_t *jbd2_journal_init_dev(struct block_device *bdev,</div><div class='ctx'> 	journal_t *journal;</div><div class='ctx'> </div><div class='ctx'> 	journal = journal_init_common(bdev, fs_dev, start, len, blocksize);</div><div class='del'>-	if (!journal)</div><div class='del'>-		return NULL;</div><div class='add'>+	if (IS_ERR(journal))</div><div class='add'>+		return ERR_CAST(journal);</div><div class='ctx'> </div><div class='del'>-	bdevname(journal-&gt;j_dev, journal-&gt;j_devname);</div><div class='add'>+	snprintf(journal-&gt;j_devname, sizeof(journal-&gt;j_devname),</div><div class='add'>+		 "%pg", journal-&gt;j_dev);</div><div class='ctx'> 	strreplace(journal-&gt;j_devname, '/', '!');</div><div class='ctx'> 	jbd2_stats_proc_init(journal);</div><div class='ctx'> </div><div class='hunk'>@@ -1478,50 +1669,35 @@ journal_t *jbd2_journal_init_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	journal_t *journal;</div><div class='ctx'> 	sector_t blocknr;</div><div class='del'>-	char *p;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='ctx'> 	blocknr = 0;</div><div class='ctx'> 	err = bmap(inode, &amp;blocknr);</div><div class='del'>-</div><div class='ctx'> 	if (err || !blocknr) {</div><div class='del'>-		pr_err("%s: Cannot locate journal superblock\n",</div><div class='del'>-			__func__);</div><div class='del'>-		return NULL;</div><div class='add'>+		pr_err("%s: Cannot locate journal superblock\n", __func__);</div><div class='add'>+		return err ? ERR_PTR(err) : ERR_PTR(-EINVAL);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	jbd_debug(1, "JBD2: inode %s/%ld, size %lld, bits %d, blksize %ld\n",</div><div class='add'>+	jbd2_debug(1, "JBD2: inode %s/%ld, size %lld, bits %d, blksize %ld\n",</div><div class='ctx'> 		  inode-&gt;i_sb-&gt;s_id, inode-&gt;i_ino, (long long) inode-&gt;i_size,</div><div class='ctx'> 		  inode-&gt;i_sb-&gt;s_blocksize_bits, inode-&gt;i_sb-&gt;s_blocksize);</div><div class='ctx'> </div><div class='ctx'> 	journal = journal_init_common(inode-&gt;i_sb-&gt;s_bdev, inode-&gt;i_sb-&gt;s_bdev,</div><div class='ctx'> 			blocknr, inode-&gt;i_size &gt;&gt; inode-&gt;i_sb-&gt;s_blocksize_bits,</div><div class='ctx'> 			inode-&gt;i_sb-&gt;s_blocksize);</div><div class='del'>-	if (!journal)</div><div class='del'>-		return NULL;</div><div class='add'>+	if (IS_ERR(journal))</div><div class='add'>+		return ERR_CAST(journal);</div><div class='ctx'> </div><div class='ctx'> 	journal-&gt;j_inode = inode;</div><div class='del'>-	bdevname(journal-&gt;j_dev, journal-&gt;j_devname);</div><div class='del'>-	p = strreplace(journal-&gt;j_devname, '/', '!');</div><div class='del'>-	sprintf(p, "-%lu", journal-&gt;j_inode-&gt;i_ino);</div><div class='add'>+	snprintf(journal-&gt;j_devname, sizeof(journal-&gt;j_devname),</div><div class='add'>+		 "%pg-%lu", journal-&gt;j_dev, journal-&gt;j_inode-&gt;i_ino);</div><div class='add'>+	strreplace(journal-&gt;j_devname, '/', '!');</div><div class='ctx'> 	jbd2_stats_proc_init(journal);</div><div class='ctx'> </div><div class='ctx'> 	return journal;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * If the journal init or create aborts, we need to mark the journal</div><div class='del'>- * superblock as being NULL to prevent the journal destroy from writing</div><div class='del'>- * back a bogus superblock.</div><div class='del'>- */</div><div class='del'>-static void journal_fail_superblock(journal_t *journal)</div><div class='del'>-{</div><div class='del'>-	struct buffer_head *bh = journal-&gt;j_sb_buffer;</div><div class='del'>-	brelse(bh);</div><div class='del'>-	journal-&gt;j_sb_buffer = NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * Given a journal_t structure, initialise the various fields for</div><div class='ctx'>  * startup of a new journaling session.  We use this both when creating</div><div class='ctx'>  * a journal, and after recovering an old journal to reset it for</div><div class='hunk'>@@ -1545,16 +1721,27 @@ static int journal_reset(journal_t *journal)</div><div class='ctx'> 	journal-&gt;j_first = first;</div><div class='ctx'> 	journal-&gt;j_last = last;</div><div class='ctx'> </div><div class='del'>-	journal-&gt;j_head = journal-&gt;j_first;</div><div class='del'>-	journal-&gt;j_tail = journal-&gt;j_first;</div><div class='add'>+	if (journal-&gt;j_head != 0 &amp;&amp; journal-&gt;j_flags &amp; JBD2_CYCLE_RECORD) {</div><div class='add'>+		/*</div><div class='add'>+		 * Disable the cycled recording mode if the journal head block</div><div class='add'>+		 * number is not correct.</div><div class='add'>+		 */</div><div class='add'>+		if (journal-&gt;j_head &lt; first || journal-&gt;j_head &gt;= last) {</div><div class='add'>+			printk(KERN_WARNING "JBD2: Incorrect Journal head block %lu, "</div><div class='add'>+			       "disable journal_cycle_record\n",</div><div class='add'>+			       journal-&gt;j_head);</div><div class='add'>+			journal-&gt;j_head = journal-&gt;j_first;</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		journal-&gt;j_head = journal-&gt;j_first;</div><div class='add'>+	}</div><div class='add'>+	journal-&gt;j_tail = journal-&gt;j_head;</div><div class='ctx'> 	journal-&gt;j_free = journal-&gt;j_last - journal-&gt;j_first;</div><div class='ctx'> </div><div class='ctx'> 	journal-&gt;j_tail_sequence = journal-&gt;j_transaction_sequence;</div><div class='ctx'> 	journal-&gt;j_commit_sequence = journal-&gt;j_transaction_sequence - 1;</div><div class='ctx'> 	journal-&gt;j_commit_request = journal-&gt;j_commit_sequence;</div><div class='ctx'> </div><div class='del'>-	journal-&gt;j_max_transaction_buffers = jbd2_journal_get_max_txn_bufs(journal);</div><div class='del'>-</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Now that journal recovery is done, turn fast commits off here. This</div><div class='ctx'> 	 * way, if fast commit was enabled before the crash but if now FS has</div><div class='hunk'>@@ -1569,7 +1756,7 @@ static int journal_reset(journal_t *journal)</div><div class='ctx'> 	 * attempting a write to a potential-readonly device.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (sb-&gt;s_start == 0) {</div><div class='del'>-		jbd_debug(1, "JBD2: Skipping superblock update on recovered sb "</div><div class='add'>+		jbd2_debug(1, "JBD2: Skipping superblock update on recovered sb "</div><div class='ctx'> 			"(start %ld, seq %u, errno %d)\n",</div><div class='ctx'> 			journal-&gt;j_tail, journal-&gt;j_tail_sequence,</div><div class='ctx'> 			journal-&gt;j_errno);</div><div class='hunk'>@@ -1585,8 +1772,7 @@ static int journal_reset(journal_t *journal)</div><div class='ctx'> 		 */</div><div class='ctx'> 		jbd2_journal_update_sb_log_tail(journal,</div><div class='ctx'> 						journal-&gt;j_tail_sequence,</div><div class='del'>-						journal-&gt;j_tail,</div><div class='del'>-						REQ_SYNC | REQ_FUA);</div><div class='add'>+						journal-&gt;j_tail, REQ_FUA);</div><div class='ctx'> 		mutex_unlock(&amp;journal-&gt;j_checkpoint_mutex);</div><div class='ctx'> 	}</div><div class='ctx'> 	return jbd2_journal_start_thread(journal);</div><div class='hunk'>@@ -1596,11 +1782,11 @@ static int journal_reset(journal_t *journal)</div><div class='ctx'>  * This function expects that the caller will have locked the journal</div><div class='ctx'>  * buffer head, and will return with it unlocked</div><div class='ctx'>  */</div><div class='del'>-static int jbd2_write_superblock(journal_t *journal, int write_flags)</div><div class='add'>+static int jbd2_write_superblock(journal_t *journal, blk_opf_t write_flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *bh = journal-&gt;j_sb_buffer;</div><div class='ctx'> 	journal_superblock_t *sb = journal-&gt;j_superblock;</div><div class='del'>-	int ret;</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	/* Buffer got discarded which means block device got invalidated */</div><div class='ctx'> 	if (!buffer_mapped(bh)) {</div><div class='hunk'>@@ -1608,9 +1794,16 @@ static int jbd2_write_superblock(journal_t *journal, int write_flags)</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	trace_jbd2_write_superblock(journal, write_flags);</div><div class='add'>+	/*</div><div class='add'>+	 * Always set high priority flags to exempt from block layer's</div><div class='add'>+	 * QOS policies, e.g. writeback throttle.</div><div class='add'>+	 */</div><div class='add'>+	write_flags |= JBD2_JOURNAL_REQ_FLAGS;</div><div class='ctx'> 	if (!(journal-&gt;j_flags &amp; JBD2_BARRIER))</div><div class='ctx'> 		write_flags &amp;= ~(REQ_FUA | REQ_PREFLUSH);</div><div class='add'>+</div><div class='add'>+	trace_jbd2_write_superblock(journal, write_flags);</div><div class='add'>+</div><div class='ctx'> 	if (buffer_write_io_error(bh)) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Oh, dear.  A previous attempt to write the journal</div><div class='hunk'>@@ -1627,10 +1820,10 @@ static int jbd2_write_superblock(journal_t *journal, int write_flags)</div><div class='ctx'> 		set_buffer_uptodate(bh);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (jbd2_journal_has_csum_v2or3(journal))</div><div class='del'>-		sb-&gt;s_checksum = jbd2_superblock_csum(journal, sb);</div><div class='add'>+		sb-&gt;s_checksum = jbd2_superblock_csum(sb);</div><div class='ctx'> 	get_bh(bh);</div><div class='ctx'> 	bh-&gt;b_end_io = end_buffer_write_sync;</div><div class='del'>-	ret = submit_bh(REQ_OP_WRITE, write_flags, bh);</div><div class='add'>+	submit_bh(REQ_OP_WRITE | write_flags, bh);</div><div class='ctx'> 	wait_on_buffer(bh);</div><div class='ctx'> 	if (buffer_write_io_error(bh)) {</div><div class='ctx'> 		clear_buffer_write_io_error(bh);</div><div class='hunk'>@@ -1638,9 +1831,8 @@ static int jbd2_write_superblock(journal_t *journal, int write_flags)</div><div class='ctx'> 		ret = -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		printk(KERN_ERR "JBD2: Error %d detected when updating "</div><div class='del'>-		       "journal superblock for %s.\n", ret,</div><div class='del'>-		       journal-&gt;j_devname);</div><div class='add'>+		printk(KERN_ERR "JBD2: I/O error when updating journal superblock for %s.\n",</div><div class='add'>+				journal-&gt;j_devname);</div><div class='ctx'> 		if (!is_journal_aborted(journal))</div><div class='ctx'> 			jbd2_journal_abort(journal, ret);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1653,39 +1845,40 @@ static int jbd2_write_superblock(journal_t *journal, int write_flags)</div><div class='ctx'>  * @journal: The journal to update.</div><div class='ctx'>  * @tail_tid: TID of the new transaction at the tail of the log</div><div class='ctx'>  * @tail_block: The first block of the transaction at the tail of the log</div><div class='del'>- * @write_op: With which operation should we write the journal sb</div><div class='add'>+ * @write_flags: Flags for the journal sb write operation</div><div class='ctx'>  *</div><div class='ctx'>  * Update a journal's superblock information about log tail and write it to</div><div class='ctx'>  * disk, waiting for the IO to complete.</div><div class='ctx'>  */</div><div class='ctx'> int jbd2_journal_update_sb_log_tail(journal_t *journal, tid_t tail_tid,</div><div class='del'>-				     unsigned long tail_block, int write_op)</div><div class='add'>+				    unsigned long tail_block,</div><div class='add'>+				    blk_opf_t write_flags)</div><div class='ctx'> {</div><div class='ctx'> 	journal_superblock_t *sb = journal-&gt;j_superblock;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (is_journal_aborted(journal))</div><div class='ctx'> 		return -EIO;</div><div class='del'>-	if (test_bit(JBD2_CHECKPOINT_IO_ERROR, &amp;journal-&gt;j_atomic_flags)) {</div><div class='del'>-		jbd2_journal_abort(journal, -EIO);</div><div class='add'>+	ret = jbd2_check_fs_dev_write_error(journal);</div><div class='add'>+	if (ret) {</div><div class='add'>+		jbd2_journal_abort(journal, ret);</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(!mutex_is_locked(&amp;journal-&gt;j_checkpoint_mutex));</div><div class='del'>-	jbd_debug(1, "JBD2: updating superblock (start %lu, seq %u)\n",</div><div class='add'>+	jbd2_debug(1, "JBD2: updating superblock (start %lu, seq %u)\n",</div><div class='ctx'> 		  tail_block, tail_tid);</div><div class='ctx'> </div><div class='ctx'> 	lock_buffer(journal-&gt;j_sb_buffer);</div><div class='ctx'> 	sb-&gt;s_sequence = cpu_to_be32(tail_tid);</div><div class='ctx'> 	sb-&gt;s_start    = cpu_to_be32(tail_block);</div><div class='ctx'> </div><div class='del'>-	ret = jbd2_write_superblock(journal, write_op);</div><div class='add'>+	ret = jbd2_write_superblock(journal, write_flags);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	/* Log is no longer empty */</div><div class='ctx'> 	write_lock(&amp;journal-&gt;j_state_lock);</div><div class='del'>-	WARN_ON(!sb-&gt;s_sequence);</div><div class='ctx'> 	journal-&gt;j_flags &amp;= ~JBD2_FLUSHED;</div><div class='ctx'> 	write_unlock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> </div><div class='hunk'>@@ -1696,12 +1889,12 @@ out:</div><div class='ctx'> /**</div><div class='ctx'>  * jbd2_mark_journal_empty() - Mark on disk journal as empty.</div><div class='ctx'>  * @journal: The journal to update.</div><div class='del'>- * @write_op: With which operation should we write the journal sb</div><div class='add'>+ * @write_flags: Flags for the journal sb write operation</div><div class='ctx'>  *</div><div class='ctx'>  * Update a journal's dynamic superblock fields to show that journal is empty.</div><div class='ctx'>  * Write updated superblock to disk waiting for IO to complete.</div><div class='ctx'>  */</div><div class='del'>-static void jbd2_mark_journal_empty(journal_t *journal, int write_op)</div><div class='add'>+static void jbd2_mark_journal_empty(journal_t *journal, blk_opf_t write_flags)</div><div class='ctx'> {</div><div class='ctx'> 	journal_superblock_t *sb = journal-&gt;j_superblock;</div><div class='ctx'> 	bool had_fast_commit = false;</div><div class='hunk'>@@ -1713,11 +1906,12 @@ static void jbd2_mark_journal_empty(journal_t *journal, int write_op)</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	jbd_debug(1, "JBD2: Marking journal as empty (seq %u)\n",</div><div class='add'>+	jbd2_debug(1, "JBD2: Marking journal as empty (seq %u)\n",</div><div class='ctx'> 		  journal-&gt;j_tail_sequence);</div><div class='ctx'> </div><div class='ctx'> 	sb-&gt;s_sequence = cpu_to_be32(journal-&gt;j_tail_sequence);</div><div class='ctx'> 	sb-&gt;s_start    = cpu_to_be32(0);</div><div class='add'>+	sb-&gt;s_head     = cpu_to_be32(journal-&gt;j_head);</div><div class='ctx'> 	if (jbd2_has_feature_fast_commit(journal)) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * When journal is clean, no need to commit fast commit flag and</div><div class='hunk'>@@ -1727,12 +1921,12 @@ static void jbd2_mark_journal_empty(journal_t *journal, int write_op)</div><div class='ctx'> 		had_fast_commit = true;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	jbd2_write_superblock(journal, write_op);</div><div class='add'>+	jbd2_write_superblock(journal, write_flags);</div><div class='ctx'> </div><div class='ctx'> 	if (had_fast_commit)</div><div class='ctx'> 		jbd2_set_feature_fast_commit(journal);</div><div class='ctx'> </div><div class='del'>-	/* Log is no longer empty */</div><div class='add'>+	/* Log is empty */</div><div class='ctx'> 	write_lock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> 	journal-&gt;j_flags |= JBD2_FLUSHED;</div><div class='ctx'> 	write_unlock(&amp;journal-&gt;j_state_lock);</div><div class='hunk'>@@ -1756,7 +1950,6 @@ static int __jbd2_journal_erase(journal_t *journal, unsigned int flags)</div><div class='ctx'> 	unsigned long block, log_offset; /* logical */</div><div class='ctx'> 	unsigned long long phys_block, block_start, block_stop; /* physical */</div><div class='ctx'> 	loff_t byte_start, byte_stop, byte_count;</div><div class='del'>-	struct request_queue *q = bdev_get_queue(journal-&gt;j_dev);</div><div class='ctx'> </div><div class='ctx'> 	/* flags must be set to either discard or zeroout */</div><div class='ctx'> 	if ((flags &amp; ~JBD2_JOURNAL_FLUSH_VALID) || !flags ||</div><div class='hunk'>@@ -1764,10 +1957,8 @@ static int __jbd2_journal_erase(journal_t *journal, unsigned int flags)</div><div class='ctx'> 			(flags &amp; JBD2_JOURNAL_FLUSH_ZEROOUT)))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	if (!q)</div><div class='del'>-		return -ENXIO;</div><div class='del'>-</div><div class='del'>-	if ((flags &amp; JBD2_JOURNAL_FLUSH_DISCARD) &amp;&amp; !blk_queue_discard(q))</div><div class='add'>+	if ((flags &amp; JBD2_JOURNAL_FLUSH_DISCARD) &amp;&amp;</div><div class='add'>+	    !bdev_max_discard_sectors(journal-&gt;j_dev))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1783,17 +1974,15 @@ static int __jbd2_journal_erase(journal_t *journal, unsigned int flags)</div><div class='ctx'> 			return err;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		if (block_start == ~0ULL) {</div><div class='del'>-			block_start = phys_block;</div><div class='del'>-			block_stop = block_start - 1;</div><div class='del'>-		}</div><div class='add'>+		if (block_start == ~0ULL)</div><div class='add'>+			block_stop = block_start = phys_block;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * last block not contiguous with current block,</div><div class='ctx'> 		 * process last contiguous region and return to this block on</div><div class='ctx'> 		 * next loop</div><div class='ctx'> 		 */</div><div class='del'>-		if (phys_block != block_stop + 1) {</div><div class='add'>+		if (phys_block != block_stop) {</div><div class='ctx'> 			block--;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			block_stop++;</div><div class='hunk'>@@ -1812,17 +2001,16 @@ static int __jbd2_journal_erase(journal_t *journal, unsigned int flags)</div><div class='ctx'> 		 */</div><div class='ctx'> 		byte_start = block_start * journal-&gt;j_blocksize;</div><div class='ctx'> 		byte_stop = block_stop * journal-&gt;j_blocksize;</div><div class='del'>-		byte_count = (block_stop - block_start + 1) *</div><div class='del'>-				journal-&gt;j_blocksize;</div><div class='add'>+		byte_count = (block_stop - block_start) * journal-&gt;j_blocksize;</div><div class='ctx'> </div><div class='del'>-		truncate_inode_pages_range(journal-&gt;j_dev-&gt;bd_inode-&gt;i_mapping,</div><div class='del'>-				byte_start, byte_stop);</div><div class='add'>+		truncate_inode_pages_range(journal-&gt;j_dev-&gt;bd_mapping,</div><div class='add'>+				byte_start, byte_stop - 1);</div><div class='ctx'> </div><div class='ctx'> 		if (flags &amp; JBD2_JOURNAL_FLUSH_DISCARD) {</div><div class='ctx'> 			err = blkdev_issue_discard(journal-&gt;j_dev,</div><div class='ctx'> 					byte_start &gt;&gt; SECTOR_SHIFT,</div><div class='ctx'> 					byte_count &gt;&gt; SECTOR_SHIFT,</div><div class='del'>-					GFP_NOFS, 0);</div><div class='add'>+					GFP_NOFS);</div><div class='ctx'> 		} else if (flags &amp; JBD2_JOURNAL_FLUSH_ZEROOUT) {</div><div class='ctx'> 			err = blkdev_issue_zeroout(journal-&gt;j_dev,</div><div class='ctx'> 					byte_start &gt;&gt; SECTOR_SHIFT,</div><div class='hunk'>@@ -1831,7 +2019,7 @@ static int __jbd2_journal_erase(journal_t *journal, unsigned int flags)</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (unlikely(err != 0)) {</div><div class='del'>-			pr_err("JBD2: (error %d) unable to wipe journal at physical blocks %llu - %llu",</div><div class='add'>+			pr_err("JBD2: (error %d) unable to wipe journal at physical blocks [%llu, %llu)",</div><div class='ctx'> 					err, block_start, block_stop);</div><div class='ctx'> 			return err;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1859,183 +2047,13 @@ void jbd2_journal_update_sb_errno(journal_t *journal)</div><div class='ctx'> 	errcode = journal-&gt;j_errno;</div><div class='ctx'> 	if (errcode == -ESHUTDOWN)</div><div class='ctx'> 		errcode = 0;</div><div class='del'>-	jbd_debug(1, "JBD2: updating superblock error (errno %d)\n", errcode);</div><div class='add'>+	jbd2_debug(1, "JBD2: updating superblock error (errno %d)\n", errcode);</div><div class='ctx'> 	sb-&gt;s_errno    = cpu_to_be32(errcode);</div><div class='ctx'> </div><div class='del'>-	jbd2_write_superblock(journal, REQ_SYNC | REQ_FUA);</div><div class='add'>+	jbd2_write_superblock(journal, REQ_FUA);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(jbd2_journal_update_sb_errno);</div><div class='ctx'> </div><div class='del'>-static int journal_revoke_records_per_block(journal_t *journal)</div><div class='del'>-{</div><div class='del'>-	int record_size;</div><div class='del'>-	int space = journal-&gt;j_blocksize - sizeof(jbd2_journal_revoke_header_t);</div><div class='del'>-</div><div class='del'>-	if (jbd2_has_feature_64bit(journal))</div><div class='del'>-		record_size = 8;</div><div class='del'>-	else</div><div class='del'>-		record_size = 4;</div><div class='del'>-</div><div class='del'>-	if (jbd2_journal_has_csum_v2or3(journal))</div><div class='del'>-		space -= sizeof(struct jbd2_journal_block_tail);</div><div class='del'>-	return space / record_size;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Read the superblock for a given journal, performing initial</div><div class='del'>- * validation of the format.</div><div class='del'>- */</div><div class='del'>-static int journal_get_superblock(journal_t *journal)</div><div class='del'>-{</div><div class='del'>-	struct buffer_head *bh;</div><div class='del'>-	journal_superblock_t *sb;</div><div class='del'>-	int err = -EIO;</div><div class='del'>-</div><div class='del'>-	bh = journal-&gt;j_sb_buffer;</div><div class='del'>-</div><div class='del'>-	J_ASSERT(bh != NULL);</div><div class='del'>-	if (!buffer_uptodate(bh)) {</div><div class='del'>-		ll_rw_block(REQ_OP_READ, 0, 1, &amp;bh);</div><div class='del'>-		wait_on_buffer(bh);</div><div class='del'>-		if (!buffer_uptodate(bh)) {</div><div class='del'>-			printk(KERN_ERR</div><div class='del'>-				"JBD2: IO error reading journal superblock\n");</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (buffer_verified(bh))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	sb = journal-&gt;j_superblock;</div><div class='del'>-</div><div class='del'>-	err = -EINVAL;</div><div class='del'>-</div><div class='del'>-	if (sb-&gt;s_header.h_magic != cpu_to_be32(JBD2_MAGIC_NUMBER) ||</div><div class='del'>-	    sb-&gt;s_blocksize != cpu_to_be32(journal-&gt;j_blocksize)) {</div><div class='del'>-		printk(KERN_WARNING "JBD2: no valid journal superblock found\n");</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	switch(be32_to_cpu(sb-&gt;s_header.h_blocktype)) {</div><div class='del'>-	case JBD2_SUPERBLOCK_V1:</div><div class='del'>-		journal-&gt;j_format_version = 1;</div><div class='del'>-		break;</div><div class='del'>-	case JBD2_SUPERBLOCK_V2:</div><div class='del'>-		journal-&gt;j_format_version = 2;</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		printk(KERN_WARNING "JBD2: unrecognised superblock format ID\n");</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (be32_to_cpu(sb-&gt;s_maxlen) &lt; journal-&gt;j_total_len)</div><div class='del'>-		journal-&gt;j_total_len = be32_to_cpu(sb-&gt;s_maxlen);</div><div class='del'>-	else if (be32_to_cpu(sb-&gt;s_maxlen) &gt; journal-&gt;j_total_len) {</div><div class='del'>-		printk(KERN_WARNING "JBD2: journal file too short\n");</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (be32_to_cpu(sb-&gt;s_first) == 0 ||</div><div class='del'>-	    be32_to_cpu(sb-&gt;s_first) &gt;= journal-&gt;j_total_len) {</div><div class='del'>-		printk(KERN_WARNING</div><div class='del'>-			"JBD2: Invalid start block of journal: %u\n",</div><div class='del'>-			be32_to_cpu(sb-&gt;s_first));</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (jbd2_has_feature_csum2(journal) &amp;&amp;</div><div class='del'>-	    jbd2_has_feature_csum3(journal)) {</div><div class='del'>-		/* Can't have checksum v2 and v3 at the same time! */</div><div class='del'>-		printk(KERN_ERR "JBD2: Can't enable checksumming v2 and v3 "</div><div class='del'>-		       "at the same time!\n");</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (jbd2_journal_has_csum_v2or3_feature(journal) &amp;&amp;</div><div class='del'>-	    jbd2_has_feature_checksum(journal)) {</div><div class='del'>-		/* Can't have checksum v1 and v2 on at the same time! */</div><div class='del'>-		printk(KERN_ERR "JBD2: Can't enable checksumming v1 and v2/3 "</div><div class='del'>-		       "at the same time!\n");</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!jbd2_verify_csum_type(journal, sb)) {</div><div class='del'>-		printk(KERN_ERR "JBD2: Unknown checksum type\n");</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Load the checksum driver */</div><div class='del'>-	if (jbd2_journal_has_csum_v2or3_feature(journal)) {</div><div class='del'>-		journal-&gt;j_chksum_driver = crypto_alloc_shash("crc32c", 0, 0);</div><div class='del'>-		if (IS_ERR(journal-&gt;j_chksum_driver)) {</div><div class='del'>-			printk(KERN_ERR "JBD2: Cannot load crc32c driver.\n");</div><div class='del'>-			err = PTR_ERR(journal-&gt;j_chksum_driver);</div><div class='del'>-			journal-&gt;j_chksum_driver = NULL;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (jbd2_journal_has_csum_v2or3(journal)) {</div><div class='del'>-		/* Check superblock checksum */</div><div class='del'>-		if (sb-&gt;s_checksum != jbd2_superblock_csum(journal, sb)) {</div><div class='del'>-			printk(KERN_ERR "JBD2: journal checksum error\n");</div><div class='del'>-			err = -EFSBADCRC;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/* Precompute checksum seed for all metadata */</div><div class='del'>-		journal-&gt;j_csum_seed = jbd2_chksum(journal, ~0, sb-&gt;s_uuid,</div><div class='del'>-						   sizeof(sb-&gt;s_uuid));</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	journal-&gt;j_revoke_records_per_block =</div><div class='del'>-				journal_revoke_records_per_block(journal);</div><div class='del'>-	set_buffer_verified(bh);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	journal_fail_superblock(journal);</div><div class='del'>-	return err;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Load the on-disk journal superblock and read the key fields into the</div><div class='del'>- * journal_t.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-static int load_superblock(journal_t *journal)</div><div class='del'>-{</div><div class='del'>-	int err;</div><div class='del'>-	journal_superblock_t *sb;</div><div class='del'>-	int num_fc_blocks;</div><div class='del'>-</div><div class='del'>-	err = journal_get_superblock(journal);</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='del'>-</div><div class='del'>-	sb = journal-&gt;j_superblock;</div><div class='del'>-</div><div class='del'>-	journal-&gt;j_tail_sequence = be32_to_cpu(sb-&gt;s_sequence);</div><div class='del'>-	journal-&gt;j_tail = be32_to_cpu(sb-&gt;s_start);</div><div class='del'>-	journal-&gt;j_first = be32_to_cpu(sb-&gt;s_first);</div><div class='del'>-	journal-&gt;j_errno = be32_to_cpu(sb-&gt;s_errno);</div><div class='del'>-	journal-&gt;j_last = be32_to_cpu(sb-&gt;s_maxlen);</div><div class='del'>-</div><div class='del'>-	if (jbd2_has_feature_fast_commit(journal)) {</div><div class='del'>-		journal-&gt;j_fc_last = be32_to_cpu(sb-&gt;s_maxlen);</div><div class='del'>-		num_fc_blocks = jbd2_journal_get_num_fc_blks(sb);</div><div class='del'>-		if (journal-&gt;j_last - num_fc_blocks &gt;= JBD2_MIN_JOURNAL_BLOCKS)</div><div class='del'>-			journal-&gt;j_last = journal-&gt;j_fc_last - num_fc_blocks;</div><div class='del'>-		journal-&gt;j_fc_first = journal-&gt;j_last + 1;</div><div class='del'>-		journal-&gt;j_fc_off = 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-</div><div class='ctx'> /**</div><div class='ctx'>  * jbd2_journal_load() - Read journal from disk.</div><div class='ctx'>  * @journal: Journal to act on.</div><div class='hunk'>@@ -2047,26 +2065,7 @@ static int load_superblock(journal_t *journal)</div><div class='ctx'> int jbd2_journal_load(journal_t *journal)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='del'>-	journal_superblock_t *sb;</div><div class='del'>-</div><div class='del'>-	err = load_superblock(journal);</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='del'>-</div><div class='del'>-	sb = journal-&gt;j_superblock;</div><div class='del'>-	/* If this is a V2 superblock, then we have to check the</div><div class='del'>-	 * features flags on it. */</div><div class='del'>-</div><div class='del'>-	if (journal-&gt;j_format_version &gt;= 2) {</div><div class='del'>-		if ((sb-&gt;s_feature_ro_compat &amp;</div><div class='del'>-		     ~cpu_to_be32(JBD2_KNOWN_ROCOMPAT_FEATURES)) ||</div><div class='del'>-		    (sb-&gt;s_feature_incompat &amp;</div><div class='del'>-		     ~cpu_to_be32(JBD2_KNOWN_INCOMPAT_FEATURES))) {</div><div class='del'>-			printk(KERN_WARNING</div><div class='del'>-				"JBD2: Unrecognised features on journal\n");</div><div class='del'>-			return -EINVAL;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	journal_superblock_t *sb = journal-&gt;j_superblock;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Create a slab for this blocksize</div><div class='hunk'>@@ -2077,8 +2076,11 @@ int jbd2_journal_load(journal_t *journal)</div><div class='ctx'> </div><div class='ctx'> 	/* Let the recovery code check whether it needs to recover any</div><div class='ctx'> 	 * data from the journal. */</div><div class='del'>-	if (jbd2_journal_recover(journal))</div><div class='del'>-		goto recovery_error;</div><div class='add'>+	err = jbd2_journal_recover(journal);</div><div class='add'>+	if (err) {</div><div class='add'>+		pr_warn("JBD2: journal recovery failed\n");</div><div class='add'>+		return err;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (journal-&gt;j_failed_commit) {</div><div class='ctx'> 		printk(KERN_ERR "JBD2: journal transaction %u on %s "</div><div class='hunk'>@@ -2095,15 +2097,14 @@ int jbd2_journal_load(journal_t *journal)</div><div class='ctx'> 	/* OK, we've finished with the dynamic journal bits:</div><div class='ctx'> 	 * reinitialise the dynamic contents of the superblock in memory</div><div class='ctx'> 	 * and reset them on disk. */</div><div class='del'>-	if (journal_reset(journal))</div><div class='del'>-		goto recovery_error;</div><div class='add'>+	err = journal_reset(journal);</div><div class='add'>+	if (err) {</div><div class='add'>+		pr_warn("JBD2: journal reset failed\n");</div><div class='add'>+		return err;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	journal-&gt;j_flags |= JBD2_LOADED;</div><div class='ctx'> 	return 0;</div><div class='del'>-</div><div class='del'>-recovery_error:</div><div class='del'>-	printk(KERN_WARNING "JBD2: recovery failed\n");</div><div class='del'>-	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -2153,13 +2154,15 @@ int jbd2_journal_destroy(journal_t *journal)</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * OK, all checkpoint transactions have been checked, now check the</div><div class='del'>-	 * write out io error flag and abort the journal if some buffer failed</div><div class='del'>-	 * to write back to the original location, otherwise the filesystem</div><div class='del'>-	 * may become inconsistent.</div><div class='add'>+	 * writeback errseq of fs dev and abort the journal if some buffer</div><div class='add'>+	 * failed to write back to the original location, otherwise the</div><div class='add'>+	 * filesystem may become inconsistent.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!is_journal_aborted(journal) &amp;&amp;</div><div class='del'>-	    test_bit(JBD2_CHECKPOINT_IO_ERROR, &amp;journal-&gt;j_atomic_flags))</div><div class='del'>-		jbd2_journal_abort(journal, -EIO);</div><div class='add'>+	if (!is_journal_aborted(journal)) {</div><div class='add'>+		int ret = jbd2_check_fs_dev_write_error(journal);</div><div class='add'>+		if (ret)</div><div class='add'>+			jbd2_journal_abort(journal, ret);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (journal-&gt;j_sb_buffer) {</div><div class='ctx'> 		if (!is_journal_aborted(journal)) {</div><div class='hunk'>@@ -2170,27 +2173,25 @@ int jbd2_journal_destroy(journal_t *journal)</div><div class='ctx'> 				++journal-&gt;j_transaction_sequence;</div><div class='ctx'> 			write_unlock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> </div><div class='del'>-			jbd2_mark_journal_empty(journal,</div><div class='del'>-					REQ_SYNC | REQ_PREFLUSH | REQ_FUA);</div><div class='add'>+			jbd2_mark_journal_empty(journal, REQ_PREFLUSH | REQ_FUA);</div><div class='ctx'> 			mutex_unlock(&amp;journal-&gt;j_checkpoint_mutex);</div><div class='ctx'> 		} else</div><div class='ctx'> 			err = -EIO;</div><div class='ctx'> 		brelse(journal-&gt;j_sb_buffer);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (journal-&gt;j_shrinker.flags &amp; SHRINKER_REGISTERED) {</div><div class='add'>+	if (journal-&gt;j_shrinker) {</div><div class='ctx'> 		percpu_counter_destroy(&amp;journal-&gt;j_checkpoint_jh_count);</div><div class='del'>-		unregister_shrinker(&amp;journal-&gt;j_shrinker);</div><div class='add'>+		shrinker_free(journal-&gt;j_shrinker);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (journal-&gt;j_proc_entry)</div><div class='ctx'> 		jbd2_stats_proc_exit(journal);</div><div class='ctx'> 	iput(journal-&gt;j_inode);</div><div class='ctx'> 	if (journal-&gt;j_revoke)</div><div class='ctx'> 		jbd2_journal_destroy_revoke(journal);</div><div class='del'>-	if (journal-&gt;j_chksum_driver)</div><div class='del'>-		crypto_free_shash(journal-&gt;j_chksum_driver);</div><div class='ctx'> 	kfree(journal-&gt;j_fc_wbuf);</div><div class='ctx'> 	kfree(journal-&gt;j_wbuf);</div><div class='add'>+	lockdep_unregister_key(&amp;journal-&gt;jbd2_trans_commit_key);</div><div class='ctx'> 	kfree(journal);</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='hunk'>@@ -2215,11 +2216,7 @@ int jbd2_journal_check_used_features(journal_t *journal, unsigned long compat,</div><div class='ctx'> </div><div class='ctx'> 	if (!compat &amp;&amp; !ro &amp;&amp; !incompat)</div><div class='ctx'> 		return 1;</div><div class='del'>-	/* Load journal superblock if it is not loaded yet. */</div><div class='del'>-	if (journal-&gt;j_format_version == 0 &amp;&amp;</div><div class='del'>-	    journal_get_superblock(journal) != 0)</div><div class='del'>-		return 0;</div><div class='del'>-	if (journal-&gt;j_format_version == 1)</div><div class='add'>+	if (!jbd2_format_support_feature(journal))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	sb = journal-&gt;j_superblock;</div><div class='hunk'>@@ -2249,11 +2246,7 @@ int jbd2_journal_check_available_features(journal_t *journal, unsigned long comp</div><div class='ctx'> 	if (!compat &amp;&amp; !ro &amp;&amp; !incompat)</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='del'>-	/* We can support any known requested features iff the</div><div class='del'>-	 * superblock is in version 2.  Otherwise we fail to support any</div><div class='del'>-	 * extended sb features. */</div><div class='del'>-</div><div class='del'>-	if (journal-&gt;j_format_version != 2)</div><div class='add'>+	if (!jbd2_format_support_feature(journal))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	if ((compat   &amp; JBD2_KNOWN_COMPAT_FEATURES) == compat &amp;&amp;</div><div class='hunk'>@@ -2287,8 +2280,6 @@ jbd2_journal_initialize_fast_commit(journal_t *journal)</div><div class='ctx'> 	journal-&gt;j_fc_first = journal-&gt;j_last + 1;</div><div class='ctx'> 	journal-&gt;j_fc_off = 0;</div><div class='ctx'> 	journal-&gt;j_free = journal-&gt;j_last - journal-&gt;j_first;</div><div class='del'>-	journal-&gt;j_max_transaction_buffers =</div><div class='del'>-		jbd2_journal_get_max_txn_bufs(journal);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -2331,7 +2322,7 @@ int jbd2_journal_set_features(journal_t *journal, unsigned long compat,</div><div class='ctx'> 	    compat &amp; JBD2_FEATURE_COMPAT_CHECKSUM)</div><div class='ctx'> 		compat &amp;= ~JBD2_FEATURE_COMPAT_CHECKSUM;</div><div class='ctx'> </div><div class='del'>-	jbd_debug(1, "Setting new features 0x%lx/0x%lx/0x%lx\n",</div><div class='add'>+	jbd2_debug(1, "Setting new features 0x%lx/0x%lx/0x%lx\n",</div><div class='ctx'> 		  compat, ro, incompat);</div><div class='ctx'> </div><div class='ctx'> 	sb = journal-&gt;j_superblock;</div><div class='hunk'>@@ -2343,27 +2334,15 @@ int jbd2_journal_set_features(journal_t *journal, unsigned long compat,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Load the checksum driver if necessary */</div><div class='del'>-	if ((journal-&gt;j_chksum_driver == NULL) &amp;&amp;</div><div class='del'>-	    INCOMPAT_FEATURE_ON(JBD2_FEATURE_INCOMPAT_CSUM_V3)) {</div><div class='del'>-		journal-&gt;j_chksum_driver = crypto_alloc_shash("crc32c", 0, 0);</div><div class='del'>-		if (IS_ERR(journal-&gt;j_chksum_driver)) {</div><div class='del'>-			printk(KERN_ERR "JBD2: Cannot load crc32c driver.\n");</div><div class='del'>-			journal-&gt;j_chksum_driver = NULL;</div><div class='del'>-			return 0;</div><div class='del'>-		}</div><div class='del'>-		/* Precompute checksum seed for all metadata */</div><div class='del'>-		journal-&gt;j_csum_seed = jbd2_chksum(journal, ~0, sb-&gt;s_uuid,</div><div class='del'>-						   sizeof(sb-&gt;s_uuid));</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	lock_buffer(journal-&gt;j_sb_buffer);</div><div class='ctx'> </div><div class='del'>-	/* If enabling v3 checksums, update superblock */</div><div class='add'>+	/* If enabling v3 checksums, update superblock and precompute seed */</div><div class='ctx'> 	if (INCOMPAT_FEATURE_ON(JBD2_FEATURE_INCOMPAT_CSUM_V3)) {</div><div class='ctx'> 		sb-&gt;s_checksum_type = JBD2_CRC32C_CHKSUM;</div><div class='ctx'> 		sb-&gt;s_feature_compat &amp;=</div><div class='ctx'> 			~cpu_to_be32(JBD2_FEATURE_COMPAT_CHECKSUM);</div><div class='add'>+		journal-&gt;j_csum_seed = jbd2_chksum(~0, sb-&gt;s_uuid,</div><div class='add'>+						   sizeof(sb-&gt;s_uuid));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* If enabling v1 checksums, downgrade superblock */</div><div class='hunk'>@@ -2375,9 +2354,14 @@ int jbd2_journal_set_features(journal_t *journal, unsigned long compat,</div><div class='ctx'> 	sb-&gt;s_feature_compat    |= cpu_to_be32(compat);</div><div class='ctx'> 	sb-&gt;s_feature_ro_compat |= cpu_to_be32(ro);</div><div class='ctx'> 	sb-&gt;s_feature_incompat  |= cpu_to_be32(incompat);</div><div class='add'>+	/*</div><div class='add'>+	 * Update the checksum now so that it is valid even for read-only</div><div class='add'>+	 * filesystems where jbd2_write_superblock() doesn't get called.</div><div class='add'>+	 */</div><div class='add'>+	if (jbd2_journal_has_csum_v2or3(journal))</div><div class='add'>+		sb-&gt;s_checksum = jbd2_superblock_csum(sb);</div><div class='ctx'> 	unlock_buffer(journal-&gt;j_sb_buffer);</div><div class='del'>-	journal-&gt;j_revoke_records_per_block =</div><div class='del'>-				journal_revoke_records_per_block(journal);</div><div class='add'>+	jbd2_journal_init_transaction_limits(journal);</div><div class='ctx'> </div><div class='ctx'> 	return 1;</div><div class='ctx'> #undef COMPAT_FEATURE_ON</div><div class='hunk'>@@ -2400,16 +2384,23 @@ void jbd2_journal_clear_features(journal_t *journal, unsigned long compat,</div><div class='ctx'> {</div><div class='ctx'> 	journal_superblock_t *sb;</div><div class='ctx'> </div><div class='del'>-	jbd_debug(1, "Clear features 0x%lx/0x%lx/0x%lx\n",</div><div class='add'>+	jbd2_debug(1, "Clear features 0x%lx/0x%lx/0x%lx\n",</div><div class='ctx'> 		  compat, ro, incompat);</div><div class='ctx'> </div><div class='ctx'> 	sb = journal-&gt;j_superblock;</div><div class='ctx'> </div><div class='add'>+	lock_buffer(journal-&gt;j_sb_buffer);</div><div class='ctx'> 	sb-&gt;s_feature_compat    &amp;= ~cpu_to_be32(compat);</div><div class='ctx'> 	sb-&gt;s_feature_ro_compat &amp;= ~cpu_to_be32(ro);</div><div class='ctx'> 	sb-&gt;s_feature_incompat  &amp;= ~cpu_to_be32(incompat);</div><div class='del'>-	journal-&gt;j_revoke_records_per_block =</div><div class='del'>-				journal_revoke_records_per_block(journal);</div><div class='add'>+	/*</div><div class='add'>+	 * Update the checksum now so that it is valid even for read-only</div><div class='add'>+	 * filesystems where jbd2_write_superblock() doesn't get called.</div><div class='add'>+	 */</div><div class='add'>+	if (jbd2_journal_has_csum_v2or3(journal))</div><div class='add'>+		sb-&gt;s_checksum = jbd2_superblock_csum(sb);</div><div class='add'>+	unlock_buffer(journal-&gt;j_sb_buffer);</div><div class='add'>+	jbd2_journal_init_transaction_limits(journal);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(jbd2_journal_clear_features);</div><div class='ctx'> </div><div class='hunk'>@@ -2480,7 +2471,7 @@ int jbd2_journal_flush(journal_t *journal, unsigned int flags)</div><div class='ctx'> 	 * the magic code for a fully-recovered superblock.  Any future</div><div class='ctx'> 	 * commits of data to the journal will restore the current</div><div class='ctx'> 	 * s_start value. */</div><div class='del'>-	jbd2_mark_journal_empty(journal, REQ_SYNC | REQ_FUA);</div><div class='add'>+	jbd2_mark_journal_empty(journal, REQ_FUA);</div><div class='ctx'> </div><div class='ctx'> 	if (flags)</div><div class='ctx'> 		err = __jbd2_journal_erase(journal, flags);</div><div class='hunk'>@@ -2512,16 +2503,12 @@ out:</div><div class='ctx'> </div><div class='ctx'> int jbd2_journal_wipe(journal_t *journal, int write)</div><div class='ctx'> {</div><div class='del'>-	int err = 0;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='ctx'> 	J_ASSERT (!(journal-&gt;j_flags &amp; JBD2_LOADED));</div><div class='ctx'> </div><div class='del'>-	err = load_superblock(journal);</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='del'>-</div><div class='ctx'> 	if (!journal-&gt;j_tail)</div><div class='del'>-		goto no_recovery;</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> 	printk(KERN_WARNING "JBD2: %s recovery information on journal\n",</div><div class='ctx'> 		write ? "Clearing" : "Ignoring");</div><div class='hunk'>@@ -2530,11 +2517,10 @@ int jbd2_journal_wipe(journal_t *journal, int write)</div><div class='ctx'> 	if (write) {</div><div class='ctx'> 		/* Lock to make assertions happy... */</div><div class='ctx'> 		mutex_lock_io(&amp;journal-&gt;j_checkpoint_mutex);</div><div class='del'>-		jbd2_mark_journal_empty(journal, REQ_SYNC | REQ_FUA);</div><div class='add'>+		jbd2_mark_journal_empty(journal, REQ_FUA);</div><div class='ctx'> 		mutex_unlock(&amp;journal-&gt;j_checkpoint_mutex);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>- no_recovery:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2688,9 +2674,10 @@ void jbd2_journal_ack_err(journal_t *journal)</div><div class='ctx'> 	write_unlock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int jbd2_journal_blocks_per_page(struct inode *inode)</div><div class='add'>+int jbd2_journal_blocks_per_folio(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	return 1 &lt;&lt; (PAGE_SHIFT - inode-&gt;i_sb-&gt;s_blocksize_bits);</div><div class='add'>+	return 1 &lt;&lt; (PAGE_SHIFT + mapping_max_folio_order(inode-&gt;i_mapping) -</div><div class='add'>+		     inode-&gt;i_sb-&gt;s_blocksize_bits);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2857,13 +2844,12 @@ static struct journal_head *journal_alloc_journal_head(void)</div><div class='ctx'> #endif</div><div class='ctx'> 	ret = kmem_cache_zalloc(jbd2_journal_head_cache, GFP_NOFS);</div><div class='ctx'> 	if (!ret) {</div><div class='del'>-		jbd_debug(1, "out of memory for journal_head\n");</div><div class='add'>+		jbd2_debug(1, "out of memory for journal_head\n");</div><div class='ctx'> 		pr_notice_ratelimited("ENOMEM in %s, retrying.\n", __func__);</div><div class='ctx'> 		ret = kmem_cache_zalloc(jbd2_journal_head_cache,</div><div class='ctx'> 				GFP_NOFS | __GFP_NOFAIL);</div><div class='ctx'> 	}</div><div class='del'>-	if (ret)</div><div class='del'>-		spin_lock_init(&amp;ret-&gt;b_state_lock);</div><div class='add'>+	spin_lock_init(&amp;ret-&gt;b_state_lock);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2932,7 +2918,7 @@ repeat:</div><div class='ctx'> 	} else {</div><div class='ctx'> 		J_ASSERT_BH(bh,</div><div class='ctx'> 			(atomic_read(&amp;bh-&gt;b_count) &gt; 0) ||</div><div class='del'>-			(bh-&gt;b_page &amp;&amp; bh-&gt;b_page-&gt;mapping));</div><div class='add'>+			(bh-&gt;b_folio &amp;&amp; bh-&gt;b_folio-&gt;mapping));</div><div class='ctx'> </div><div class='ctx'> 		if (!new_jh) {</div><div class='ctx'> 			jbd_unlock_bh_journal_head(bh);</div><div class='hunk'>@@ -2970,6 +2956,7 @@ struct journal_head *jbd2_journal_grab_journal_head(struct buffer_head *bh)</div><div class='ctx'> 	jbd_unlock_bh_journal_head(bh);</div><div class='ctx'> 	return jh;</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL(jbd2_journal_grab_journal_head);</div><div class='ctx'> </div><div class='ctx'> static void __journal_remove_journal_head(struct buffer_head *bh)</div><div class='ctx'> {</div><div class='hunk'>@@ -3022,6 +3009,7 @@ void jbd2_journal_put_journal_head(struct journal_head *jh)</div><div class='ctx'> 		jbd_unlock_bh_journal_head(bh);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL(jbd2_journal_put_journal_head);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Initialize jbd inode head</div><div class='hunk'>@@ -3186,6 +3174,7 @@ static void __exit journal_exit(void)</div><div class='ctx'> 	jbd2_journal_destroy_caches();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+MODULE_DESCRIPTION("Generic filesystem journal-writing module");</div><div class='ctx'> MODULE_LICENSE("GPL");</div><div class='ctx'> module_init(journal_init);</div><div class='ctx'> module_exit(journal_exit);</div><div class='head'>diff --git a/fs/jbd2/recovery.c b/fs/jbd2/recovery.c<br/>index 8ca3527189f8..cac8c2cd4a92 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jbd2/recovery.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jbd2/recovery.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jbd2/recovery.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jbd2/recovery.c</a></div><div class='hunk'>@@ -19,6 +19,7 @@</div><div class='ctx'> #include &lt;linux/errno.h&gt;</div><div class='ctx'> #include &lt;linux/crc32.h&gt;</div><div class='ctx'> #include &lt;linux/blkdev.h&gt;</div><div class='add'>+#include &lt;linux/string_choices.h&gt;</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -29,6 +30,7 @@ struct recovery_info</div><div class='ctx'> {</div><div class='ctx'> 	tid_t		start_transaction;</div><div class='ctx'> 	tid_t		end_transaction;</div><div class='add'>+	unsigned long	head_block;</div><div class='ctx'> </div><div class='ctx'> 	int		nr_replays;</div><div class='ctx'> 	int		nr_revokes;</div><div class='hunk'>@@ -37,7 +39,7 @@ struct recovery_info</div><div class='ctx'> </div><div class='ctx'> static int do_one_pass(journal_t *journal,</div><div class='ctx'> 				struct recovery_info *info, enum passtype pass);</div><div class='del'>-static int scan_revoke_records(journal_t *, struct buffer_head *,</div><div class='add'>+static int scan_revoke_records(journal_t *, enum passtype, struct buffer_head *,</div><div class='ctx'> 				tid_t, struct recovery_info *);</div><div class='ctx'> </div><div class='ctx'> #ifdef __KERNEL__</div><div class='hunk'>@@ -63,9 +65,8 @@ static void journal_brelse_array(struct buffer_head *b[], int n)</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> #define MAXBUF 8</div><div class='del'>-static int do_readahead(journal_t *journal, unsigned int start)</div><div class='add'>+static void do_readahead(journal_t *journal, unsigned int start)</div><div class='ctx'> {</div><div class='del'>-	int err;</div><div class='ctx'> 	unsigned int max, nbufs, next;</div><div class='ctx'> 	unsigned long long blocknr;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='hunk'>@@ -83,7 +84,7 @@ static int do_readahead(journal_t *journal, unsigned int start)</div><div class='ctx'> 	nbufs = 0;</div><div class='ctx'> </div><div class='ctx'> 	for (next = start; next &lt; max; next++) {</div><div class='del'>-		err = jbd2_journal_bmap(journal, next, &amp;blocknr);</div><div class='add'>+		int err = jbd2_journal_bmap(journal, next, &amp;blocknr);</div><div class='ctx'> </div><div class='ctx'> 		if (err) {</div><div class='ctx'> 			printk(KERN_ERR "JBD2: bad block at offset %u\n",</div><div class='hunk'>@@ -92,15 +93,13 @@ static int do_readahead(journal_t *journal, unsigned int start)</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		bh = __getblk(journal-&gt;j_dev, blocknr, journal-&gt;j_blocksize);</div><div class='del'>-		if (!bh) {</div><div class='del'>-			err = -ENOMEM;</div><div class='add'>+		if (!bh)</div><div class='ctx'> 			goto failed;</div><div class='del'>-		}</div><div class='ctx'> </div><div class='ctx'> 		if (!buffer_uptodate(bh) &amp;&amp; !buffer_locked(bh)) {</div><div class='ctx'> 			bufs[nbufs++] = bh;</div><div class='ctx'> 			if (nbufs == MAXBUF) {</div><div class='del'>-				ll_rw_block(REQ_OP_READ, 0, nbufs, bufs);</div><div class='add'>+				bh_readahead_batch(nbufs, bufs, 0);</div><div class='ctx'> 				journal_brelse_array(bufs, nbufs);</div><div class='ctx'> 				nbufs = 0;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -109,13 +108,11 @@ static int do_readahead(journal_t *journal, unsigned int start)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (nbufs)</div><div class='del'>-		ll_rw_block(REQ_OP_READ, 0, nbufs, bufs);</div><div class='del'>-	err = 0;</div><div class='add'>+		bh_readahead_batch(nbufs, bufs, 0);</div><div class='ctx'> </div><div class='ctx'> failed:</div><div class='ctx'> 	if (nbufs)</div><div class='ctx'> 		journal_brelse_array(bufs, nbufs);</div><div class='del'>-	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #endif /* __KERNEL__ */</div><div class='hunk'>@@ -152,9 +149,14 @@ static int jread(struct buffer_head **bhp, journal_t *journal,</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	if (!buffer_uptodate(bh)) {</div><div class='del'>-		/* If this is a brand new buffer, start readahead.</div><div class='del'>-                   Otherwise, we assume we are already reading it.  */</div><div class='del'>-		if (!buffer_req(bh))</div><div class='add'>+		/*</div><div class='add'>+		 * If this is a brand new buffer, start readahead.</div><div class='add'>+		 * Otherwise, we assume we are already reading it.</div><div class='add'>+		 */</div><div class='add'>+		bool need_readahead = !buffer_req(bh);</div><div class='add'>+</div><div class='add'>+		bh_read_nowait(bh, 0);</div><div class='add'>+		if (need_readahead)</div><div class='ctx'> 			do_readahead(journal, offset);</div><div class='ctx'> 		wait_on_buffer(bh);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -183,7 +185,7 @@ static int jbd2_descriptor_block_csum_verify(journal_t *j, void *buf)</div><div class='ctx'> 		j-&gt;j_blocksize - sizeof(struct jbd2_journal_block_tail));</div><div class='ctx'> 	provided = tail-&gt;t_checksum;</div><div class='ctx'> 	tail-&gt;t_checksum = 0;</div><div class='del'>-	calculated = jbd2_chksum(j, j-&gt;j_csum_seed, buf, j-&gt;j_blocksize);</div><div class='add'>+	calculated = jbd2_chksum(j-&gt;j_csum_seed, buf, j-&gt;j_blocksize);</div><div class='ctx'> 	tail-&gt;t_checksum = provided;</div><div class='ctx'> </div><div class='ctx'> 	return provided == cpu_to_be32(calculated);</div><div class='hunk'>@@ -224,12 +226,8 @@ static int count_tags(journal_t *journal, struct buffer_head *bh)</div><div class='ctx'> /* Make sure we wrap around the log correctly! */</div><div class='ctx'> #define wrap(journal, var)						\</div><div class='ctx'> do {									\</div><div class='del'>-	unsigned long _wrap_last =					\</div><div class='del'>-		jbd2_has_feature_fast_commit(journal) ?			\</div><div class='del'>-			(journal)-&gt;j_fc_last : (journal)-&gt;j_last;	\</div><div class='del'>-									\</div><div class='del'>-	if (var &gt;= _wrap_last)						\</div><div class='del'>-		var -= (_wrap_last - (journal)-&gt;j_first);		\</div><div class='add'>+	if (var &gt;= (journal)-&gt;j_last)					\</div><div class='add'>+		var -= ((journal)-&gt;j_last - (journal)-&gt;j_first);	\</div><div class='ctx'> } while (0)</div><div class='ctx'> </div><div class='ctx'> static int fc_do_one_pass(journal_t *journal,</div><div class='hunk'>@@ -245,17 +243,18 @@ static int fc_do_one_pass(journal_t *journal,</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	while (next_fc_block &lt;= journal-&gt;j_fc_last) {</div><div class='del'>-		jbd_debug(3, "Fast commit replay: next block %ld\n",</div><div class='add'>+		jbd2_debug(3, "Fast commit replay: next block %ld\n",</div><div class='ctx'> 			  next_fc_block);</div><div class='ctx'> 		err = jread(&amp;bh, journal, next_fc_block);</div><div class='ctx'> 		if (err) {</div><div class='del'>-			jbd_debug(3, "Fast commit replay: read error\n");</div><div class='add'>+			jbd2_debug(3, "Fast commit replay: read error\n");</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		err = journal-&gt;j_fc_replay_callback(journal, bh, pass,</div><div class='ctx'> 					next_fc_block - journal-&gt;j_fc_first,</div><div class='ctx'> 					expected_commit_id);</div><div class='add'>+		brelse(bh);</div><div class='ctx'> 		next_fc_block++;</div><div class='ctx'> 		if (err &lt; 0 || err == JBD2_FC_REPLAY_STOP)</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -263,7 +262,7 @@ static int fc_do_one_pass(journal_t *journal,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (err)</div><div class='del'>-		jbd_debug(3, "Fast commit replay failed, err = %d\n", err);</div><div class='add'>+		jbd2_debug(3, "Fast commit replay failed, err = %d\n", err);</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='hunk'>@@ -283,23 +282,24 @@ static int fc_do_one_pass(journal_t *journal,</div><div class='ctx'> int jbd2_journal_recover(journal_t *journal)</div><div class='ctx'> {</div><div class='ctx'> 	int			err, err2;</div><div class='del'>-	journal_superblock_t *	sb;</div><div class='del'>-</div><div class='ctx'> 	struct recovery_info	info;</div><div class='ctx'> </div><div class='ctx'> 	memset(&amp;info, 0, sizeof(info));</div><div class='del'>-	sb = journal-&gt;j_superblock;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The journal superblock's s_start field (the current log head)</div><div class='ctx'> 	 * is always zero if, and only if, the journal was cleanly</div><div class='del'>-	 * unmounted.</div><div class='add'>+	 * unmounted. We use its in-memory version j_tail here because</div><div class='add'>+	 * jbd2_journal_wipe() could have updated it without updating journal</div><div class='add'>+	 * superblock.</div><div class='ctx'> 	 */</div><div class='add'>+	if (!journal-&gt;j_tail) {</div><div class='add'>+		journal_superblock_t *sb = journal-&gt;j_superblock;</div><div class='ctx'> </div><div class='del'>-	if (!sb-&gt;s_start) {</div><div class='del'>-		jbd_debug(1, "No recovery required, last transaction %d\n",</div><div class='del'>-			  be32_to_cpu(sb-&gt;s_sequence));</div><div class='add'>+		jbd2_debug(1, "No recovery required, last transaction %d, head block %u\n",</div><div class='add'>+			  be32_to_cpu(sb-&gt;s_sequence), be32_to_cpu(sb-&gt;s_head));</div><div class='ctx'> 		journal-&gt;j_transaction_sequence = be32_to_cpu(sb-&gt;s_sequence) + 1;</div><div class='add'>+		journal-&gt;j_head = be32_to_cpu(sb-&gt;s_head);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -309,20 +309,32 @@ int jbd2_journal_recover(journal_t *journal)</div><div class='ctx'> 	if (!err)</div><div class='ctx'> 		err = do_one_pass(journal, &amp;info, PASS_REPLAY);</div><div class='ctx'> </div><div class='del'>-	jbd_debug(1, "JBD2: recovery, exit status %d, "</div><div class='add'>+	jbd2_debug(1, "JBD2: recovery, exit status %d, "</div><div class='ctx'> 		  "recovered transactions %u to %u\n",</div><div class='ctx'> 		  err, info.start_transaction, info.end_transaction);</div><div class='del'>-	jbd_debug(1, "JBD2: Replayed %d and revoked %d/%d blocks\n",</div><div class='add'>+	jbd2_debug(1, "JBD2: Replayed %d and revoked %d/%d blocks\n",</div><div class='ctx'> 		  info.nr_replays, info.nr_revoke_hits, info.nr_revokes);</div><div class='ctx'> </div><div class='ctx'> 	/* Restart the log at the next transaction ID, thus invalidating</div><div class='ctx'> 	 * any existing commit records in the log. */</div><div class='ctx'> 	journal-&gt;j_transaction_sequence = ++info.end_transaction;</div><div class='add'>+	journal-&gt;j_head = info.head_block;</div><div class='add'>+	jbd2_debug(1, "JBD2: last transaction %d, head block %lu\n",</div><div class='add'>+		  journal-&gt;j_transaction_sequence, journal-&gt;j_head);</div><div class='ctx'> </div><div class='ctx'> 	jbd2_journal_clear_revoke(journal);</div><div class='add'>+	/* Free revoke table allocated for replay */</div><div class='add'>+	if (journal-&gt;j_revoke != journal-&gt;j_revoke_table[0] &amp;&amp;</div><div class='add'>+	    journal-&gt;j_revoke != journal-&gt;j_revoke_table[1]) {</div><div class='add'>+		jbd2_journal_destroy_revoke_table(journal-&gt;j_revoke);</div><div class='add'>+		journal-&gt;j_revoke = journal-&gt;j_revoke_table[1];</div><div class='add'>+	}</div><div class='ctx'> 	err2 = sync_blockdev(journal-&gt;j_fs_dev);</div><div class='ctx'> 	if (!err)</div><div class='ctx'> 		err = err2;</div><div class='add'>+	err2 = jbd2_check_fs_dev_write_error(journal);</div><div class='add'>+	if (!err)</div><div class='add'>+		err = err2;</div><div class='ctx'> 	/* Make sure all replayed data is on permanent storage */</div><div class='ctx'> 	if (journal-&gt;j_flags &amp; JBD2_BARRIER) {</div><div class='ctx'> 		err2 = blkdev_issue_flush(journal-&gt;j_fs_dev);</div><div class='hunk'>@@ -358,15 +370,17 @@ int jbd2_journal_skip_recovery(journal_t *journal)</div><div class='ctx'> 	if (err) {</div><div class='ctx'> 		printk(KERN_ERR "JBD2: error %d scanning journal\n", err);</div><div class='ctx'> 		++journal-&gt;j_transaction_sequence;</div><div class='add'>+		journal-&gt;j_head = journal-&gt;j_first;</div><div class='ctx'> 	} else {</div><div class='ctx'> #ifdef CONFIG_JBD2_DEBUG</div><div class='ctx'> 		int dropped = info.end_transaction - </div><div class='ctx'> 			be32_to_cpu(journal-&gt;j_superblock-&gt;s_sequence);</div><div class='del'>-		jbd_debug(1,</div><div class='add'>+		jbd2_debug(1,</div><div class='ctx'> 			  "JBD2: ignoring %d transaction%s from the journal.\n",</div><div class='del'>-			  dropped, (dropped == 1) ? "" : "s");</div><div class='add'>+			  dropped, str_plural(dropped));</div><div class='ctx'> #endif</div><div class='ctx'> 		journal-&gt;j_transaction_sequence = ++info.end_transaction;</div><div class='add'>+		journal-&gt;j_head = info.head_block;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	journal-&gt;j_tail = 0;</div><div class='hunk'>@@ -426,12 +440,33 @@ static int jbd2_commit_block_csum_verify(journal_t *j, void *buf)</div><div class='ctx'> 	h = buf;</div><div class='ctx'> 	provided = h-&gt;h_chksum[0];</div><div class='ctx'> 	h-&gt;h_chksum[0] = 0;</div><div class='del'>-	calculated = jbd2_chksum(j, j-&gt;j_csum_seed, buf, j-&gt;j_blocksize);</div><div class='add'>+	calculated = jbd2_chksum(j-&gt;j_csum_seed, buf, j-&gt;j_blocksize);</div><div class='ctx'> 	h-&gt;h_chksum[0] = provided;</div><div class='ctx'> </div><div class='ctx'> 	return provided == cpu_to_be32(calculated);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool jbd2_commit_block_csum_verify_partial(journal_t *j, void *buf)</div><div class='add'>+{</div><div class='add'>+	struct commit_header *h;</div><div class='add'>+	__be32 provided;</div><div class='add'>+	__u32 calculated;</div><div class='add'>+	void *tmpbuf;</div><div class='add'>+</div><div class='add'>+	tmpbuf = kzalloc(j-&gt;j_blocksize, GFP_KERNEL);</div><div class='add'>+	if (!tmpbuf)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	memcpy(tmpbuf, buf, sizeof(struct commit_header));</div><div class='add'>+	h = tmpbuf;</div><div class='add'>+	provided = h-&gt;h_chksum[0];</div><div class='add'>+	h-&gt;h_chksum[0] = 0;</div><div class='add'>+	calculated = jbd2_chksum(j-&gt;j_csum_seed, tmpbuf, j-&gt;j_blocksize);</div><div class='add'>+	kfree(tmpbuf);</div><div class='add'>+</div><div class='add'>+	return provided == cpu_to_be32(calculated);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int jbd2_block_tag_csum_verify(journal_t *j, journal_block_tag_t *tag,</div><div class='ctx'> 				      journal_block_tag3_t *tag3,</div><div class='ctx'> 				      void *buf, __u32 sequence)</div><div class='hunk'>@@ -443,8 +478,8 @@ static int jbd2_block_tag_csum_verify(journal_t *j, journal_block_tag_t *tag,</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='ctx'> 	seq = cpu_to_be32(sequence);</div><div class='del'>-	csum32 = jbd2_chksum(j, j-&gt;j_csum_seed, (__u8 *)&amp;seq, sizeof(seq));</div><div class='del'>-	csum32 = jbd2_chksum(j, csum32, buf, j-&gt;j_blocksize);</div><div class='add'>+	csum32 = jbd2_chksum(j-&gt;j_csum_seed, (__u8 *)&amp;seq, sizeof(seq));</div><div class='add'>+	csum32 = jbd2_chksum(csum32, buf, j-&gt;j_blocksize);</div><div class='ctx'> </div><div class='ctx'> 	if (jbd2_has_feature_csum3(j))</div><div class='ctx'> 		return tag3-&gt;t_checksum == cpu_to_be32(csum32);</div><div class='hunk'>@@ -452,21 +487,116 @@ static int jbd2_block_tag_csum_verify(journal_t *j, journal_block_tag_t *tag,</div><div class='ctx'> 		return tag-&gt;t_checksum == cpu_to_be16(csum32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static __always_inline int jbd2_do_replay(journal_t *journal,</div><div class='add'>+					  struct recovery_info *info,</div><div class='add'>+					  struct buffer_head *bh,</div><div class='add'>+					  unsigned long *next_log_block,</div><div class='add'>+					  unsigned int next_commit_ID)</div><div class='add'>+{</div><div class='add'>+	char *tagp;</div><div class='add'>+	int flags;</div><div class='add'>+	int ret = 0;</div><div class='add'>+	int tag_bytes = journal_tag_bytes(journal);</div><div class='add'>+	int descr_csum_size = 0;</div><div class='add'>+	unsigned long io_block;</div><div class='add'>+	journal_block_tag_t tag;</div><div class='add'>+	struct buffer_head *obh;</div><div class='add'>+	struct buffer_head *nbh;</div><div class='add'>+</div><div class='add'>+	if (jbd2_journal_has_csum_v2or3(journal))</div><div class='add'>+		descr_csum_size = sizeof(struct jbd2_journal_block_tail);</div><div class='add'>+</div><div class='add'>+	tagp = &amp;bh-&gt;b_data[sizeof(journal_header_t)];</div><div class='add'>+	while (tagp - bh-&gt;b_data + tag_bytes &lt;=</div><div class='add'>+	       journal-&gt;j_blocksize - descr_csum_size) {</div><div class='add'>+		int err;</div><div class='add'>+</div><div class='add'>+		memcpy(&amp;tag, tagp, sizeof(tag));</div><div class='add'>+		flags = be16_to_cpu(tag.t_flags);</div><div class='add'>+</div><div class='add'>+		io_block = (*next_log_block)++;</div><div class='add'>+		wrap(journal, *next_log_block);</div><div class='add'>+		err = jread(&amp;obh, journal, io_block);</div><div class='add'>+		if (err) {</div><div class='add'>+			/* Recover what we can, but report failure at the end. */</div><div class='add'>+			ret = err;</div><div class='add'>+			pr_err("JBD2: IO error %d recovering block %lu in log\n",</div><div class='add'>+			      err, io_block);</div><div class='add'>+		} else {</div><div class='add'>+			unsigned long long blocknr;</div><div class='add'>+</div><div class='add'>+			J_ASSERT(obh != NULL);</div><div class='add'>+			blocknr = read_tag_block(journal, &amp;tag);</div><div class='add'>+</div><div class='add'>+			/* If the block has been revoked, then we're all done here. */</div><div class='add'>+			if (jbd2_journal_test_revoke(journal, blocknr,</div><div class='add'>+						     next_commit_ID)) {</div><div class='add'>+				brelse(obh);</div><div class='add'>+				++info-&gt;nr_revoke_hits;</div><div class='add'>+				goto skip_write;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			/* Look for block corruption */</div><div class='add'>+			if (!jbd2_block_tag_csum_verify(journal, &amp;tag,</div><div class='add'>+					(journal_block_tag3_t *)tagp,</div><div class='add'>+					obh-&gt;b_data, next_commit_ID)) {</div><div class='add'>+				brelse(obh);</div><div class='add'>+				ret = -EFSBADCRC;</div><div class='add'>+				pr_err("JBD2: Invalid checksum recovering data block %llu in journal block %lu\n",</div><div class='add'>+				      blocknr, io_block);</div><div class='add'>+				goto skip_write;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			/* Find a buffer for the new data being restored */</div><div class='add'>+			nbh = __getblk(journal-&gt;j_fs_dev, blocknr,</div><div class='add'>+				       journal-&gt;j_blocksize);</div><div class='add'>+			if (nbh == NULL) {</div><div class='add'>+				pr_err("JBD2: Out of memory during recovery.\n");</div><div class='add'>+				brelse(obh);</div><div class='add'>+				return -ENOMEM;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			lock_buffer(nbh);</div><div class='add'>+			memcpy(nbh-&gt;b_data, obh-&gt;b_data, journal-&gt;j_blocksize);</div><div class='add'>+			if (flags &amp; JBD2_FLAG_ESCAPE) {</div><div class='add'>+				*((__be32 *)nbh-&gt;b_data) =</div><div class='add'>+				cpu_to_be32(JBD2_MAGIC_NUMBER);</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			BUFFER_TRACE(nbh, "marking dirty");</div><div class='add'>+			set_buffer_uptodate(nbh);</div><div class='add'>+			mark_buffer_dirty(nbh);</div><div class='add'>+			BUFFER_TRACE(nbh, "marking uptodate");</div><div class='add'>+			++info-&gt;nr_replays;</div><div class='add'>+			unlock_buffer(nbh);</div><div class='add'>+			brelse(obh);</div><div class='add'>+			brelse(nbh);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+skip_write:</div><div class='add'>+		tagp += tag_bytes;</div><div class='add'>+		if (!(flags &amp; JBD2_FLAG_SAME_UUID))</div><div class='add'>+			tagp += 16;</div><div class='add'>+</div><div class='add'>+		if (flags &amp; JBD2_FLAG_LAST_TAG)</div><div class='add'>+			break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int do_one_pass(journal_t *journal,</div><div class='ctx'> 			struct recovery_info *info, enum passtype pass)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int		first_commit_ID, next_commit_ID;</div><div class='del'>-	unsigned long		next_log_block;</div><div class='add'>+	unsigned long		next_log_block, head_block;</div><div class='ctx'> 	int			err, success = 0;</div><div class='ctx'> 	journal_superblock_t *	sb;</div><div class='ctx'> 	journal_header_t *	tmp;</div><div class='del'>-	struct buffer_head *	bh;</div><div class='add'>+	struct buffer_head	*bh = NULL;</div><div class='ctx'> 	unsigned int		sequence;</div><div class='ctx'> 	int			blocktype;</div><div class='del'>-	int			tag_bytes = journal_tag_bytes(journal);</div><div class='ctx'> 	__u32			crc32_sum = ~0; /* Transactional Checksums */</div><div class='del'>-	int			descr_csum_size = 0;</div><div class='del'>-	int			block_error = 0;</div><div class='ctx'> 	bool			need_check_commit_time = false;</div><div class='ctx'> 	__u64			last_trans_commit_time = 0, commit_time;</div><div class='ctx'> </div><div class='hunk'>@@ -479,12 +609,38 @@ static int do_one_pass(journal_t *journal,</div><div class='ctx'> 	sb = journal-&gt;j_superblock;</div><div class='ctx'> 	next_commit_ID = be32_to_cpu(sb-&gt;s_sequence);</div><div class='ctx'> 	next_log_block = be32_to_cpu(sb-&gt;s_start);</div><div class='add'>+	head_block = next_log_block;</div><div class='ctx'> </div><div class='ctx'> 	first_commit_ID = next_commit_ID;</div><div class='ctx'> 	if (pass == PASS_SCAN)</div><div class='ctx'> 		info-&gt;start_transaction = first_commit_ID;</div><div class='add'>+	else if (pass == PASS_REVOKE) {</div><div class='add'>+		/*</div><div class='add'>+		 * Would the default revoke table have too long hash chains</div><div class='add'>+		 * during replay?</div><div class='add'>+		 */</div><div class='add'>+		if (info-&gt;nr_revokes &gt; JOURNAL_REVOKE_DEFAULT_HASH * 16) {</div><div class='add'>+			unsigned int hash_size;</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * Aim for average chain length of 8, limit at 1M</div><div class='add'>+			 * entries to avoid problems with malicious</div><div class='add'>+			 * filesystems.</div><div class='add'>+			 */</div><div class='add'>+			hash_size = min(roundup_pow_of_two(info-&gt;nr_revokes / 8),</div><div class='add'>+					1U &lt;&lt; 20);</div><div class='add'>+			journal-&gt;j_revoke =</div><div class='add'>+				jbd2_journal_init_revoke_table(hash_size);</div><div class='add'>+			if (!journal-&gt;j_revoke) {</div><div class='add'>+				printk(KERN_ERR</div><div class='add'>+				       "JBD2: failed to allocate revoke table for replay with %u entries. "</div><div class='add'>+				       "Journal replay may be slow.\n", hash_size);</div><div class='add'>+				journal-&gt;j_revoke = journal-&gt;j_revoke_table[1];</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	jbd_debug(1, "Starting recovery pass %d\n", pass);</div><div class='add'>+	jbd2_debug(1, "Starting recovery pass %d\n", pass);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Now we walk through the log, transaction by transaction,</div><div class='hunk'>@@ -494,12 +650,6 @@ static int do_one_pass(journal_t *journal,</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='ctx'> 	while (1) {</div><div class='del'>-		int			flags;</div><div class='del'>-		char *			tagp;</div><div class='del'>-		journal_block_tag_t	tag;</div><div class='del'>-		struct buffer_head *	obh;</div><div class='del'>-		struct buffer_head *	nbh;</div><div class='del'>-</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> </div><div class='ctx'> 		/* If we already know where to stop the log traversal,</div><div class='hunk'>@@ -510,16 +660,16 @@ static int do_one_pass(journal_t *journal,</div><div class='ctx'> 			if (tid_geq(next_commit_ID, info-&gt;end_transaction))</div><div class='ctx'> 				break;</div><div class='ctx'> </div><div class='del'>-		jbd_debug(2, "Scanning for sequence ID %u at %lu/%lu\n",</div><div class='del'>-			  next_commit_ID, next_log_block,</div><div class='del'>-			  jbd2_has_feature_fast_commit(journal) ?</div><div class='del'>-			  journal-&gt;j_fc_last : journal-&gt;j_last);</div><div class='add'>+		jbd2_debug(2, "Scanning for sequence ID %u at %lu/%lu\n",</div><div class='add'>+			  next_commit_ID, next_log_block, journal-&gt;j_last);</div><div class='ctx'> </div><div class='ctx'> 		/* Skip over each chunk of the transaction looking</div><div class='ctx'> 		 * either the next descriptor block or the final commit</div><div class='ctx'> 		 * record. */</div><div class='ctx'> </div><div class='del'>-		jbd_debug(3, "JBD2: checking block %ld\n", next_log_block);</div><div class='add'>+		jbd2_debug(3, "JBD2: checking block %ld\n", next_log_block);</div><div class='add'>+		brelse(bh);</div><div class='add'>+		bh = NULL;</div><div class='ctx'> 		err = jread(&amp;bh, journal, next_log_block);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto failed;</div><div class='hunk'>@@ -535,20 +685,16 @@ static int do_one_pass(journal_t *journal,</div><div class='ctx'> </div><div class='ctx'> 		tmp = (journal_header_t *)bh-&gt;b_data;</div><div class='ctx'> </div><div class='del'>-		if (tmp-&gt;h_magic != cpu_to_be32(JBD2_MAGIC_NUMBER)) {</div><div class='del'>-			brelse(bh);</div><div class='add'>+		if (tmp-&gt;h_magic != cpu_to_be32(JBD2_MAGIC_NUMBER))</div><div class='ctx'> 			break;</div><div class='del'>-		}</div><div class='ctx'> </div><div class='ctx'> 		blocktype = be32_to_cpu(tmp-&gt;h_blocktype);</div><div class='ctx'> 		sequence = be32_to_cpu(tmp-&gt;h_sequence);</div><div class='del'>-		jbd_debug(3, "Found magic %d, sequence %d\n",</div><div class='add'>+		jbd2_debug(3, "Found magic %d, sequence %d\n",</div><div class='ctx'> 			  blocktype, sequence);</div><div class='ctx'> </div><div class='del'>-		if (sequence != next_commit_ID) {</div><div class='del'>-			brelse(bh);</div><div class='add'>+		if (sequence != next_commit_ID)</div><div class='ctx'> 			break;</div><div class='del'>-		}</div><div class='ctx'> </div><div class='ctx'> 		/* OK, we have a valid descriptor block which matches</div><div class='ctx'> 		 * all of the sequence number checks.  What are we going</div><div class='hunk'>@@ -557,11 +703,7 @@ static int do_one_pass(journal_t *journal,</div><div class='ctx'> 		switch(blocktype) {</div><div class='ctx'> 		case JBD2_DESCRIPTOR_BLOCK:</div><div class='ctx'> 			/* Verify checksum first */</div><div class='del'>-			if (jbd2_journal_has_csum_v2or3(journal))</div><div class='del'>-				descr_csum_size =</div><div class='del'>-					sizeof(struct jbd2_journal_block_tail);</div><div class='del'>-			if (descr_csum_size &gt; 0 &amp;&amp;</div><div class='del'>-			    !jbd2_descriptor_block_csum_verify(journal,</div><div class='add'>+			if (!jbd2_descriptor_block_csum_verify(journal,</div><div class='ctx'> 							       bh-&gt;b_data)) {</div><div class='ctx'> 				/*</div><div class='ctx'> 				 * PASS_SCAN can see stale blocks due to lazy</div><div class='hunk'>@@ -571,11 +713,10 @@ static int do_one_pass(journal_t *journal,</div><div class='ctx'> 					pr_err("JBD2: Invalid checksum recovering block %lu in log\n",</div><div class='ctx'> 					       next_log_block);</div><div class='ctx'> 					err = -EFSBADCRC;</div><div class='del'>-					brelse(bh);</div><div class='ctx'> 					goto failed;</div><div class='ctx'> 				}</div><div class='ctx'> 				need_check_commit_time = true;</div><div class='del'>-				jbd_debug(1,</div><div class='add'>+				jbd2_debug(1,</div><div class='ctx'> 					"invalid descriptor block found in %lu\n",</div><div class='ctx'> 					next_log_block);</div><div class='ctx'> 			}</div><div class='hunk'>@@ -587,125 +728,39 @@ static int do_one_pass(journal_t *journal,</div><div class='ctx'> 			if (pass != PASS_REPLAY) {</div><div class='ctx'> 				if (pass == PASS_SCAN &amp;&amp;</div><div class='ctx'> 				    jbd2_has_feature_checksum(journal) &amp;&amp;</div><div class='del'>-				    !need_check_commit_time &amp;&amp;</div><div class='ctx'> 				    !info-&gt;end_transaction) {</div><div class='ctx'> 					if (calc_chksums(journal, bh,</div><div class='ctx'> 							&amp;next_log_block,</div><div class='del'>-							&amp;crc32_sum)) {</div><div class='del'>-						put_bh(bh);</div><div class='add'>+							&amp;crc32_sum))</div><div class='ctx'> 						break;</div><div class='del'>-					}</div><div class='del'>-					put_bh(bh);</div><div class='ctx'> 					continue;</div><div class='ctx'> 				}</div><div class='ctx'> 				next_log_block += count_tags(journal, bh);</div><div class='ctx'> 				wrap(journal, next_log_block);</div><div class='del'>-				put_bh(bh);</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			/* A descriptor block: we can now write all of</div><div class='del'>-			 * the data blocks.  Yay, useful work is finally</div><div class='del'>-			 * getting done here! */</div><div class='del'>-</div><div class='del'>-			tagp = &amp;bh-&gt;b_data[sizeof(journal_header_t)];</div><div class='del'>-			while ((tagp - bh-&gt;b_data + tag_bytes)</div><div class='del'>-			       &lt;= journal-&gt;j_blocksize - descr_csum_size) {</div><div class='del'>-				unsigned long io_block;</div><div class='del'>-</div><div class='del'>-				memcpy(&amp;tag, tagp, sizeof(tag));</div><div class='del'>-				flags = be16_to_cpu(tag.t_flags);</div><div class='del'>-</div><div class='del'>-				io_block = next_log_block++;</div><div class='del'>-				wrap(journal, next_log_block);</div><div class='del'>-				err = jread(&amp;obh, journal, io_block);</div><div class='del'>-				if (err) {</div><div class='del'>-					/* Recover what we can, but</div><div class='del'>-					 * report failure at the end. */</div><div class='del'>-					success = err;</div><div class='del'>-					printk(KERN_ERR</div><div class='del'>-						"JBD2: IO error %d recovering "</div><div class='del'>-						"block %ld in log\n",</div><div class='del'>-						err, io_block);</div><div class='del'>-				} else {</div><div class='del'>-					unsigned long long blocknr;</div><div class='del'>-</div><div class='del'>-					J_ASSERT(obh != NULL);</div><div class='del'>-					blocknr = read_tag_block(journal,</div><div class='del'>-								 &amp;tag);</div><div class='del'>-</div><div class='del'>-					/* If the block has been</div><div class='del'>-					 * revoked, then we're all done</div><div class='del'>-					 * here. */</div><div class='del'>-					if (jbd2_journal_test_revoke</div><div class='del'>-					    (journal, blocknr,</div><div class='del'>-					     next_commit_ID)) {</div><div class='del'>-						brelse(obh);</div><div class='del'>-						++info-&gt;nr_revoke_hits;</div><div class='del'>-						goto skip_write;</div><div class='del'>-					}</div><div class='del'>-</div><div class='del'>-					/* Look for block corruption */</div><div class='del'>-					if (!jbd2_block_tag_csum_verify(</div><div class='del'>-			journal, &amp;tag, (journal_block_tag3_t *)tagp,</div><div class='del'>-			obh-&gt;b_data, be32_to_cpu(tmp-&gt;h_sequence))) {</div><div class='del'>-						brelse(obh);</div><div class='del'>-						success = -EFSBADCRC;</div><div class='del'>-						printk(KERN_ERR "JBD2: Invalid "</div><div class='del'>-						       "checksum recovering "</div><div class='del'>-						       "data block %llu in "</div><div class='del'>-						       "log\n", blocknr);</div><div class='del'>-						block_error = 1;</div><div class='del'>-						goto skip_write;</div><div class='del'>-					}</div><div class='del'>-</div><div class='del'>-					/* Find a buffer for the new</div><div class='del'>-					 * data being restored */</div><div class='del'>-					nbh = __getblk(journal-&gt;j_fs_dev,</div><div class='del'>-							blocknr,</div><div class='del'>-							journal-&gt;j_blocksize);</div><div class='del'>-					if (nbh == NULL) {</div><div class='del'>-						printk(KERN_ERR</div><div class='del'>-						       "JBD2: Out of memory "</div><div class='del'>-						       "during recovery.\n");</div><div class='del'>-						err = -ENOMEM;</div><div class='del'>-						brelse(bh);</div><div class='del'>-						brelse(obh);</div><div class='del'>-						goto failed;</div><div class='del'>-					}</div><div class='del'>-</div><div class='del'>-					lock_buffer(nbh);</div><div class='del'>-					memcpy(nbh-&gt;b_data, obh-&gt;b_data,</div><div class='del'>-							journal-&gt;j_blocksize);</div><div class='del'>-					if (flags &amp; JBD2_FLAG_ESCAPE) {</div><div class='del'>-						*((__be32 *)nbh-&gt;b_data) =</div><div class='del'>-						cpu_to_be32(JBD2_MAGIC_NUMBER);</div><div class='del'>-					}</div><div class='del'>-</div><div class='del'>-					BUFFER_TRACE(nbh, "marking dirty");</div><div class='del'>-					set_buffer_uptodate(nbh);</div><div class='del'>-					mark_buffer_dirty(nbh);</div><div class='del'>-					BUFFER_TRACE(nbh, "marking uptodate");</div><div class='del'>-					++info-&gt;nr_replays;</div><div class='del'>-					/* ll_rw_block(WRITE, 1, &amp;nbh); */</div><div class='del'>-					unlock_buffer(nbh);</div><div class='del'>-					brelse(obh);</div><div class='del'>-					brelse(nbh);</div><div class='del'>-				}</div><div class='del'>-</div><div class='del'>-			skip_write:</div><div class='del'>-				tagp += tag_bytes;</div><div class='del'>-				if (!(flags &amp; JBD2_FLAG_SAME_UUID))</div><div class='del'>-					tagp += 16;</div><div class='del'>-</div><div class='del'>-				if (flags &amp; JBD2_FLAG_LAST_TAG)</div><div class='del'>-					break;</div><div class='add'>+			/*</div><div class='add'>+			 * A descriptor block: we can now write all of the</div><div class='add'>+			 * data blocks. Yay, useful work is finally getting</div><div class='add'>+			 * done here!</div><div class='add'>+			 */</div><div class='add'>+			err = jbd2_do_replay(journal, info, bh, &amp;next_log_block,</div><div class='add'>+					     next_commit_ID);</div><div class='add'>+			if (err) {</div><div class='add'>+				if (err == -ENOMEM)</div><div class='add'>+					goto failed;</div><div class='add'>+				success = err;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			brelse(bh);</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		case JBD2_COMMIT_BLOCK:</div><div class='add'>+			if (pass != PASS_SCAN) {</div><div class='add'>+				next_commit_ID++;</div><div class='add'>+				continue;</div><div class='add'>+			}</div><div class='add'>+</div><div class='ctx'> 			/*     How to differentiate between interrupted commit</div><div class='ctx'> 			 *               and journal corruption ?</div><div class='ctx'> 			 *</div><div class='hunk'>@@ -750,7 +805,6 @@ static int do_one_pass(journal_t *journal,</div><div class='ctx'> 					pr_err("JBD2: Invalid checksum found in transaction %u\n",</div><div class='ctx'> 					       next_commit_ID);</div><div class='ctx'> 					err = -EFSBADCRC;</div><div class='del'>-					brelse(bh);</div><div class='ctx'> 					goto failed;</div><div class='ctx'> 				}</div><div class='ctx'> 			ignore_crc_mismatch:</div><div class='hunk'>@@ -758,9 +812,8 @@ static int do_one_pass(journal_t *journal,</div><div class='ctx'> 				 * It likely does not belong to same journal,</div><div class='ctx'> 				 * just end this recovery with success.</div><div class='ctx'> 				 */</div><div class='del'>-				jbd_debug(1, "JBD2: Invalid checksum ignored in transaction %u, likely stale data\n",</div><div class='add'>+				jbd2_debug(1, "JBD2: Invalid checksum ignored in transaction %u, likely stale data\n",</div><div class='ctx'> 					  next_commit_ID);</div><div class='del'>-				brelse(bh);</div><div class='ctx'> 				goto done;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='hunk'>@@ -770,8 +823,7 @@ static int do_one_pass(journal_t *journal,</div><div class='ctx'> 			 * much to do other than move on to the next sequence</div><div class='ctx'> 			 * number.</div><div class='ctx'> 			 */</div><div class='del'>-			if (pass == PASS_SCAN &amp;&amp;</div><div class='del'>-			    jbd2_has_feature_checksum(journal)) {</div><div class='add'>+			if (jbd2_has_feature_checksum(journal)) {</div><div class='ctx'> 				struct commit_header *cbh =</div><div class='ctx'> 					(struct commit_header *)bh-&gt;b_data;</div><div class='ctx'> 				unsigned found_chksum =</div><div class='hunk'>@@ -780,7 +832,6 @@ static int do_one_pass(journal_t *journal,</div><div class='ctx'> 				if (info-&gt;end_transaction) {</div><div class='ctx'> 					journal-&gt;j_failed_commit =</div><div class='ctx'> 						info-&gt;end_transaction;</div><div class='del'>-					brelse(bh);</div><div class='ctx'> 					break;</div><div class='ctx'> 				}</div><div class='ctx'> </div><div class='hunk'>@@ -796,63 +847,71 @@ static int do_one_pass(journal_t *journal,</div><div class='ctx'> 					goto chksum_error;</div><div class='ctx'> </div><div class='ctx'> 				crc32_sum = ~0;</div><div class='add'>+				goto chksum_ok;</div><div class='ctx'> 			}</div><div class='del'>-			if (pass == PASS_SCAN &amp;&amp;</div><div class='del'>-			    !jbd2_commit_block_csum_verify(journal,</div><div class='del'>-							   bh-&gt;b_data)) {</div><div class='del'>-			chksum_error:</div><div class='del'>-				if (commit_time &lt; last_trans_commit_time)</div><div class='del'>-					goto ignore_crc_mismatch;</div><div class='del'>-				info-&gt;end_transaction = next_commit_ID;</div><div class='del'>-</div><div class='del'>-				if (!jbd2_has_feature_async_commit(journal)) {</div><div class='del'>-					journal-&gt;j_failed_commit =</div><div class='del'>-						next_commit_ID;</div><div class='del'>-					brelse(bh);</div><div class='del'>-					break;</div><div class='del'>-				}</div><div class='add'>+</div><div class='add'>+			if (jbd2_commit_block_csum_verify(journal, bh-&gt;b_data))</div><div class='add'>+				goto chksum_ok;</div><div class='add'>+</div><div class='add'>+			if (jbd2_commit_block_csum_verify_partial(journal,</div><div class='add'>+								  bh-&gt;b_data)) {</div><div class='add'>+				pr_notice("JBD2: Find incomplete commit block in transaction %u block %lu\n",</div><div class='add'>+					  next_commit_ID, next_log_block);</div><div class='add'>+				goto chksum_ok;</div><div class='ctx'> 			}</div><div class='del'>-			if (pass == PASS_SCAN)</div><div class='del'>-				last_trans_commit_time = commit_time;</div><div class='del'>-			brelse(bh);</div><div class='add'>+</div><div class='add'>+chksum_error:</div><div class='add'>+			if (commit_time &lt; last_trans_commit_time)</div><div class='add'>+				goto ignore_crc_mismatch;</div><div class='add'>+			info-&gt;end_transaction = next_commit_ID;</div><div class='add'>+			info-&gt;head_block = head_block;</div><div class='add'>+</div><div class='add'>+			if (!jbd2_has_feature_async_commit(journal)) {</div><div class='add'>+				journal-&gt;j_failed_commit = next_commit_ID;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+chksum_ok:</div><div class='add'>+			last_trans_commit_time = commit_time;</div><div class='add'>+			head_block = next_log_block;</div><div class='ctx'> 			next_commit_ID++;</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		case JBD2_REVOKE_BLOCK:</div><div class='ctx'> 			/*</div><div class='add'>+			 * If we aren't in the SCAN or REVOKE pass, then we can</div><div class='add'>+			 * just skip over this block.</div><div class='add'>+			 */</div><div class='add'>+			if (pass != PASS_REVOKE &amp;&amp; pass != PASS_SCAN)</div><div class='add'>+				continue;</div><div class='add'>+</div><div class='add'>+			/*</div><div class='ctx'> 			 * Check revoke block crc in pass_scan, if csum verify</div><div class='ctx'> 			 * failed, check commit block time later.</div><div class='ctx'> 			 */</div><div class='ctx'> 			if (pass == PASS_SCAN &amp;&amp;</div><div class='ctx'> 			    !jbd2_descriptor_block_csum_verify(journal,</div><div class='ctx'> 							       bh-&gt;b_data)) {</div><div class='del'>-				jbd_debug(1, "JBD2: invalid revoke block found in %lu\n",</div><div class='add'>+				jbd2_debug(1, "JBD2: invalid revoke block found in %lu\n",</div><div class='ctx'> 					  next_log_block);</div><div class='ctx'> 				need_check_commit_time = true;</div><div class='ctx'> 			}</div><div class='del'>-			/* If we aren't in the REVOKE pass, then we can</div><div class='del'>-			 * just skip over this block. */</div><div class='del'>-			if (pass != PASS_REVOKE) {</div><div class='del'>-				brelse(bh);</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='ctx'> </div><div class='del'>-			err = scan_revoke_records(journal, bh,</div><div class='add'>+			err = scan_revoke_records(journal, pass, bh,</div><div class='ctx'> 						  next_commit_ID, info);</div><div class='del'>-			brelse(bh);</div><div class='ctx'> 			if (err)</div><div class='ctx'> 				goto failed;</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		default:</div><div class='del'>-			jbd_debug(3, "Unrecognised magic %d, end of scan.\n",</div><div class='add'>+			jbd2_debug(3, "Unrecognised magic %d, end of scan.\n",</div><div class='ctx'> 				  blocktype);</div><div class='del'>-			brelse(bh);</div><div class='ctx'> 			goto done;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'>  done:</div><div class='add'>+	brelse(bh);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We broke out of the log scan loop: either we came to the</div><div class='ctx'> 	 * known end of the log or we found an unexpected block in the</div><div class='hunk'>@@ -863,6 +922,8 @@ static int do_one_pass(journal_t *journal,</div><div class='ctx'> 	if (pass == PASS_SCAN) {</div><div class='ctx'> 		if (!info-&gt;end_transaction)</div><div class='ctx'> 			info-&gt;end_transaction = next_commit_ID;</div><div class='add'>+		if (!info-&gt;head_block)</div><div class='add'>+			info-&gt;head_block = head_block;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		/* It's really bad news if different passes end up at</div><div class='ctx'> 		 * different places (but possible due to IO errors). */</div><div class='hunk'>@@ -881,18 +942,18 @@ static int do_one_pass(journal_t *journal,</div><div class='ctx'> 			success = err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (block_error &amp;&amp; success == 0)</div><div class='del'>-		success = -EIO;</div><div class='ctx'> 	return success;</div><div class='ctx'> </div><div class='ctx'>  failed:</div><div class='add'>+	brelse(bh);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Scan a revoke record, marking all blocks mentioned as revoked. */</div><div class='ctx'> </div><div class='del'>-static int scan_revoke_records(journal_t *journal, struct buffer_head *bh,</div><div class='del'>-			       tid_t sequence, struct recovery_info *info)</div><div class='add'>+static int scan_revoke_records(journal_t *journal, enum passtype pass,</div><div class='add'>+			       struct buffer_head *bh, tid_t sequence,</div><div class='add'>+			       struct recovery_info *info)</div><div class='ctx'> {</div><div class='ctx'> 	jbd2_journal_revoke_header_t *header;</div><div class='ctx'> 	int offset, max;</div><div class='hunk'>@@ -913,6 +974,11 @@ static int scan_revoke_records(journal_t *journal, struct buffer_head *bh,</div><div class='ctx'> 	if (jbd2_has_feature_64bit(journal))</div><div class='ctx'> 		record_len = 8;</div><div class='ctx'> </div><div class='add'>+	if (pass == PASS_SCAN) {</div><div class='add'>+		info-&gt;nr_revokes += (max - offset) / record_len;</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	while (offset + record_len &lt;= max) {</div><div class='ctx'> 		unsigned long long blocknr;</div><div class='ctx'> 		int err;</div><div class='hunk'>@@ -925,7 +991,6 @@ static int scan_revoke_records(journal_t *journal, struct buffer_head *bh,</div><div class='ctx'> 		err = jbd2_journal_set_revoke(journal, blocknr, sequence);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			return err;</div><div class='del'>-		++info-&gt;nr_revokes;</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/jbd2/revoke.c b/fs/jbd2/revoke.c<br/>index fa608788b93d..1467f6790747 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jbd2/revoke.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jbd2/revoke.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jbd2/revoke.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jbd2/revoke.c</a></div><div class='hunk'>@@ -215,7 +215,7 @@ int __init jbd2_journal_init_revoke_table_cache(void)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct jbd2_revoke_table_s *jbd2_journal_init_revoke_table(int hash_size)</div><div class='add'>+struct jbd2_revoke_table_s *jbd2_journal_init_revoke_table(int hash_size)</div><div class='ctx'> {</div><div class='ctx'> 	int shift = 0;</div><div class='ctx'> 	int tmp = hash_size;</div><div class='hunk'>@@ -231,7 +231,7 @@ static struct jbd2_revoke_table_s *jbd2_journal_init_revoke_table(int hash_size)</div><div class='ctx'> 	table-&gt;hash_size = hash_size;</div><div class='ctx'> 	table-&gt;hash_shift = shift;</div><div class='ctx'> 	table-&gt;hash_table =</div><div class='del'>-		kmalloc_array(hash_size, sizeof(struct list_head), GFP_KERNEL);</div><div class='add'>+		kvmalloc_array(hash_size, sizeof(struct list_head), GFP_KERNEL);</div><div class='ctx'> 	if (!table-&gt;hash_table) {</div><div class='ctx'> 		kmem_cache_free(jbd2_revoke_table_cache, table);</div><div class='ctx'> 		table = NULL;</div><div class='hunk'>@@ -245,7 +245,7 @@ out:</div><div class='ctx'> 	return table;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void jbd2_journal_destroy_revoke_table(struct jbd2_revoke_table_s *table)</div><div class='add'>+void jbd2_journal_destroy_revoke_table(struct jbd2_revoke_table_s *table)</div><div class='ctx'> {</div><div class='ctx'> 	int i;</div><div class='ctx'> 	struct list_head *hash_list;</div><div class='hunk'>@@ -255,7 +255,7 @@ static void jbd2_journal_destroy_revoke_table(struct jbd2_revoke_table_s *table)</div><div class='ctx'> 		J_ASSERT(list_empty(hash_list));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	kfree(table-&gt;hash_table);</div><div class='add'>+	kvfree(table-&gt;hash_table);</div><div class='ctx'> 	kmem_cache_free(jbd2_revoke_table_cache, table);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -345,7 +345,8 @@ int jbd2_journal_revoke(handle_t *handle, unsigned long long blocknr,</div><div class='ctx'> 	bh = bh_in;</div><div class='ctx'> </div><div class='ctx'> 	if (!bh) {</div><div class='del'>-		bh = __find_get_block(bdev, blocknr, journal-&gt;j_blocksize);</div><div class='add'>+		bh = __find_get_block_nonatomic(bdev, blocknr,</div><div class='add'>+						journal-&gt;j_blocksize);</div><div class='ctx'> 		if (bh)</div><div class='ctx'> 			BUFFER_TRACE(bh, "found on hash");</div><div class='ctx'> 	}</div><div class='hunk'>@@ -355,7 +356,8 @@ int jbd2_journal_revoke(handle_t *handle, unsigned long long blocknr,</div><div class='ctx'> </div><div class='ctx'> 		/* If there is a different buffer_head lying around in</div><div class='ctx'> 		 * memory anywhere... */</div><div class='del'>-		bh2 = __find_get_block(bdev, blocknr, journal-&gt;j_blocksize);</div><div class='add'>+		bh2 = __find_get_block_nonatomic(bdev, blocknr,</div><div class='add'>+						 journal-&gt;j_blocksize);</div><div class='ctx'> 		if (bh2) {</div><div class='ctx'> 			/* ... and it has RevokeValid status... */</div><div class='ctx'> 			if (bh2 != bh &amp;&amp; buffer_revokevalid(bh2))</div><div class='hunk'>@@ -398,7 +400,7 @@ int jbd2_journal_revoke(handle_t *handle, unsigned long long blocknr,</div><div class='ctx'> 	}</div><div class='ctx'> 	handle-&gt;h_revoke_credits--;</div><div class='ctx'> </div><div class='del'>-	jbd_debug(2, "insert revoke for block %llu, bh_in=%p\n",blocknr, bh_in);</div><div class='add'>+	jbd2_debug(2, "insert revoke for block %llu, bh_in=%p\n",blocknr, bh_in);</div><div class='ctx'> 	err = insert_revoke_hash(journal, blocknr,</div><div class='ctx'> 				handle-&gt;h_transaction-&gt;t_tid);</div><div class='ctx'> 	BUFFER_TRACE(bh_in, "exit");</div><div class='hunk'>@@ -420,15 +422,14 @@ int jbd2_journal_revoke(handle_t *handle, unsigned long long blocknr,</div><div class='ctx'>  * do not trust the Revoked bit on buffers unless RevokeValid is also</div><div class='ctx'>  * set.</div><div class='ctx'>  */</div><div class='del'>-int jbd2_journal_cancel_revoke(handle_t *handle, struct journal_head *jh)</div><div class='add'>+void jbd2_journal_cancel_revoke(handle_t *handle, struct journal_head *jh)</div><div class='ctx'> {</div><div class='ctx'> 	struct jbd2_revoke_record_s *record;</div><div class='ctx'> 	journal_t *journal = handle-&gt;h_transaction-&gt;t_journal;</div><div class='ctx'> 	int need_cancel;</div><div class='del'>-	int did_revoke = 0;	/* akpm: debug */</div><div class='ctx'> 	struct buffer_head *bh = jh2bh(jh);</div><div class='ctx'> </div><div class='del'>-	jbd_debug(4, "journal_head %p, cancelling revoke\n", jh);</div><div class='add'>+	jbd2_debug(4, "journal_head %p, cancelling revoke\n", jh);</div><div class='ctx'> </div><div class='ctx'> 	/* Is the existing Revoke bit valid?  If so, we trust it, and</div><div class='ctx'> 	 * only perform the full cancel if the revoke bit is set.  If</div><div class='hunk'>@@ -444,13 +445,12 @@ int jbd2_journal_cancel_revoke(handle_t *handle, struct journal_head *jh)</div><div class='ctx'> 	if (need_cancel) {</div><div class='ctx'> 		record = find_revoke_record(journal, bh-&gt;b_blocknr);</div><div class='ctx'> 		if (record) {</div><div class='del'>-			jbd_debug(4, "cancelled existing revoke on "</div><div class='add'>+			jbd2_debug(4, "cancelled existing revoke on "</div><div class='ctx'> 				  "blocknr %llu\n", (unsigned long long)bh-&gt;b_blocknr);</div><div class='ctx'> 			spin_lock(&amp;journal-&gt;j_revoke_lock);</div><div class='ctx'> 			list_del(&amp;record-&gt;hash);</div><div class='ctx'> 			spin_unlock(&amp;journal-&gt;j_revoke_lock);</div><div class='ctx'> 			kmem_cache_free(jbd2_revoke_record_cache, record);</div><div class='del'>-			did_revoke = 1;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -466,18 +466,18 @@ int jbd2_journal_cancel_revoke(handle_t *handle, struct journal_head *jh)</div><div class='ctx'> 	 * state machine will get very upset later on. */</div><div class='ctx'> 	if (need_cancel) {</div><div class='ctx'> 		struct buffer_head *bh2;</div><div class='del'>-		bh2 = __find_get_block(bh-&gt;b_bdev, bh-&gt;b_blocknr, bh-&gt;b_size);</div><div class='add'>+		bh2 = __find_get_block_nonatomic(bh-&gt;b_bdev, bh-&gt;b_blocknr,</div><div class='add'>+						 bh-&gt;b_size);</div><div class='ctx'> 		if (bh2) {</div><div class='ctx'> 			if (bh2 != bh)</div><div class='ctx'> 				clear_buffer_revoked(bh2);</div><div class='ctx'> 			__brelse(bh2);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	return did_revoke;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * journal_clear_revoked_flag clears revoked flag of buffers in</div><div class='add'>+ * jbd2_clear_buffer_revoked_flags clears revoked flag of buffers in</div><div class='ctx'>  * revoke table to reflect there is no revoked buffers in the next</div><div class='ctx'>  * transaction which is going to be started.</div><div class='ctx'>  */</div><div class='hunk'>@@ -495,9 +495,9 @@ void jbd2_clear_buffer_revoked_flags(journal_t *journal)</div><div class='ctx'> 			struct jbd2_revoke_record_s *record;</div><div class='ctx'> 			struct buffer_head *bh;</div><div class='ctx'> 			record = (struct jbd2_revoke_record_s *)list_entry;</div><div class='del'>-			bh = __find_get_block(journal-&gt;j_fs_dev,</div><div class='del'>-					      record-&gt;blocknr,</div><div class='del'>-					      journal-&gt;j_blocksize);</div><div class='add'>+			bh = __find_get_block_nonatomic(journal-&gt;j_fs_dev,</div><div class='add'>+							record-&gt;blocknr,</div><div class='add'>+							journal-&gt;j_blocksize);</div><div class='ctx'> 			if (bh) {</div><div class='ctx'> 				clear_buffer_revoked(bh);</div><div class='ctx'> 				__brelse(bh);</div><div class='hunk'>@@ -506,9 +506,9 @@ void jbd2_clear_buffer_revoked_flags(journal_t *journal)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* journal_switch_revoke table select j_revoke for next transaction</div><div class='del'>- * we do not want to suspend any processing until all revokes are</div><div class='del'>- * written -bzzz</div><div class='add'>+/* jbd2_journal_switch_revoke_table table select j_revoke for next</div><div class='add'>+ * transaction we do not want to suspend any processing until all</div><div class='add'>+ * revokes are written -bzzz</div><div class='ctx'>  */</div><div class='ctx'> void jbd2_journal_switch_revoke_table(journal_t *journal)</div><div class='ctx'> {</div><div class='hunk'>@@ -560,7 +560,7 @@ void jbd2_journal_write_revoke_records(transaction_t *transaction,</div><div class='ctx'> 	}</div><div class='ctx'> 	if (descriptor)</div><div class='ctx'> 		flush_descriptor(journal, descriptor, offset);</div><div class='del'>-	jbd_debug(1, "Wrote %d revoke records\n", count);</div><div class='add'>+	jbd2_debug(1, "Wrote %d revoke records\n", count);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -654,7 +654,7 @@ static void flush_descriptor(journal_t *journal,</div><div class='ctx'> 	set_buffer_jwrite(descriptor);</div><div class='ctx'> 	BUFFER_TRACE(descriptor, "write");</div><div class='ctx'> 	set_buffer_dirty(descriptor);</div><div class='del'>-	write_dirty_buffer(descriptor, REQ_SYNC);</div><div class='add'>+	write_dirty_buffer(descriptor, JBD2_JOURNAL_REQ_FLAGS);</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='head'>diff --git a/fs/jbd2/transaction.c b/fs/jbd2/transaction.c<br/>index 6a3caedd2285..dca4b5d8aaaa 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jbd2/transaction.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jbd2/transaction.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jbd2/transaction.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jbd2/transaction.c</a></div><div class='hunk'>@@ -63,28 +63,6 @@ void jbd2_journal_free_transaction(transaction_t *transaction)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Base amount of descriptor blocks we reserve for each transaction.</div><div class='del'>- */</div><div class='del'>-static int jbd2_descriptor_blocks_per_trans(journal_t *journal)</div><div class='del'>-{</div><div class='del'>-	int tag_space = journal-&gt;j_blocksize - sizeof(journal_header_t);</div><div class='del'>-	int tags_per_block;</div><div class='del'>-</div><div class='del'>-	/* Subtract UUID */</div><div class='del'>-	tag_space -= 16;</div><div class='del'>-	if (jbd2_journal_has_csum_v2or3(journal))</div><div class='del'>-		tag_space -= sizeof(struct jbd2_journal_block_tail);</div><div class='del'>-	/* Commit code leaves a slack space of 16 bytes at the end of block */</div><div class='del'>-	tags_per_block = (tag_space - 16) / journal_tag_bytes(journal);</div><div class='del'>-	/*</div><div class='del'>-	 * Revoke descriptors are accounted separately so we need to reserve</div><div class='del'>-	 * space for commit block and normal transaction descriptor blocks.</div><div class='del'>-	 */</div><div class='del'>-	return 1 + DIV_ROUND_UP(journal-&gt;j_max_transaction_buffers,</div><div class='del'>-				tags_per_block);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * jbd2_get_transaction: obtain a new transaction_t object.</div><div class='ctx'>  *</div><div class='ctx'>  * Simply initialise a new transaction. Initialize it in</div><div class='hunk'>@@ -107,15 +85,13 @@ static void jbd2_get_transaction(journal_t *journal,</div><div class='ctx'> 	transaction-&gt;t_start_time = ktime_get();</div><div class='ctx'> 	transaction-&gt;t_tid = journal-&gt;j_transaction_sequence++;</div><div class='ctx'> 	transaction-&gt;t_expires = jiffies + journal-&gt;j_commit_interval;</div><div class='del'>-	spin_lock_init(&amp;transaction-&gt;t_handle_lock);</div><div class='ctx'> 	atomic_set(&amp;transaction-&gt;t_updates, 0);</div><div class='ctx'> 	atomic_set(&amp;transaction-&gt;t_outstanding_credits,</div><div class='del'>-		   jbd2_descriptor_blocks_per_trans(journal) +</div><div class='add'>+		   journal-&gt;j_transaction_overhead_buffers +</div><div class='ctx'> 		   atomic_read(&amp;journal-&gt;j_reserved_credits));</div><div class='ctx'> 	atomic_set(&amp;transaction-&gt;t_outstanding_revokes, 0);</div><div class='ctx'> 	atomic_set(&amp;transaction-&gt;t_handle_count, 0);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;transaction-&gt;t_inode_list);</div><div class='del'>-	INIT_LIST_HEAD(&amp;transaction-&gt;t_private_list);</div><div class='ctx'> </div><div class='ctx'> 	/* Set up the commit timer for the new transaction. */</div><div class='ctx'> 	journal-&gt;j_commit_timer.expires = round_jiffies_up(transaction-&gt;t_expires);</div><div class='hunk'>@@ -137,28 +113,21 @@ static void jbd2_get_transaction(journal_t *journal,</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Update transaction's maximum wait time, if debugging is enabled.</div><div class='del'>- *</div><div class='del'>- * In order for t_max_wait to be reliable, it must be protected by a</div><div class='del'>- * lock.  But doing so will mean that start_this_handle() can not be</div><div class='del'>- * run in parallel on SMP systems, which limits our scalability.  So</div><div class='del'>- * unless debugging is enabled, we no longer update t_max_wait, which</div><div class='del'>- * means that maximum wait time reported by the jbd2_run_stats</div><div class='del'>- * tracepoint will always be zero.</div><div class='add'>+ * t_max_wait is carefully updated here with use of atomic compare exchange.</div><div class='add'>+ * Note that there could be multiplre threads trying to do this simultaneously</div><div class='add'>+ * hence using cmpxchg to avoid any use of locks in this case.</div><div class='ctx'>  */</div><div class='ctx'> static inline void update_t_max_wait(transaction_t *transaction,</div><div class='ctx'> 				     unsigned long ts)</div><div class='ctx'> {</div><div class='del'>-#ifdef CONFIG_JBD2_DEBUG</div><div class='del'>-	if (jbd2_journal_enable_debug &amp;&amp;</div><div class='del'>-	    time_after(transaction-&gt;t_start, ts)) {</div><div class='del'>-		ts = jbd2_time_diff(ts, transaction-&gt;t_start);</div><div class='del'>-		spin_lock(&amp;transaction-&gt;t_handle_lock);</div><div class='del'>-		if (ts &gt; transaction-&gt;t_max_wait)</div><div class='del'>-			transaction-&gt;t_max_wait = ts;</div><div class='del'>-		spin_unlock(&amp;transaction-&gt;t_handle_lock);</div><div class='add'>+	unsigned long oldts, newts;</div><div class='add'>+</div><div class='add'>+	if (time_after(transaction-&gt;t_start, ts)) {</div><div class='add'>+		newts = jbd2_time_diff(ts, transaction-&gt;t_start);</div><div class='add'>+		oldts = READ_ONCE(transaction-&gt;t_max_wait);</div><div class='add'>+		while (oldts &lt; newts)</div><div class='add'>+			oldts = cmpxchg(&amp;transaction-&gt;t_max_wait, oldts, newts);</div><div class='ctx'> 	}</div><div class='del'>-#endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -173,7 +142,7 @@ static void wait_transaction_locked(journal_t *journal)</div><div class='ctx'> 	int need_to_start;</div><div class='ctx'> 	tid_t tid = journal-&gt;j_running_transaction-&gt;t_tid;</div><div class='ctx'> </div><div class='del'>-	prepare_to_wait(&amp;journal-&gt;j_wait_transaction_locked, &amp;wait,</div><div class='add'>+	prepare_to_wait_exclusive(&amp;journal-&gt;j_wait_transaction_locked, &amp;wait,</div><div class='ctx'> 			TASK_UNINTERRUPTIBLE);</div><div class='ctx'> 	need_to_start = !tid_geq(journal-&gt;j_commit_request, tid);</div><div class='ctx'> 	read_unlock(&amp;journal-&gt;j_state_lock);</div><div class='hunk'>@@ -199,7 +168,7 @@ static void wait_transaction_switching(journal_t *journal)</div><div class='ctx'> 		read_unlock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='del'>-	prepare_to_wait(&amp;journal-&gt;j_wait_transaction_locked, &amp;wait,</div><div class='add'>+	prepare_to_wait_exclusive(&amp;journal-&gt;j_wait_transaction_locked, &amp;wait,</div><div class='ctx'> 			TASK_UNINTERRUPTIBLE);</div><div class='ctx'> 	read_unlock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -218,6 +187,13 @@ static void sub_reserved_credits(journal_t *journal, int blocks)</div><div class='ctx'> 	wake_up(&amp;journal-&gt;j_wait_reserved);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/* Maximum number of blocks for user transaction payload */</div><div class='add'>+static int jbd2_max_user_trans_buffers(journal_t *journal)</div><div class='add'>+{</div><div class='add'>+	return journal-&gt;j_max_transaction_buffers -</div><div class='add'>+				journal-&gt;j_transaction_overhead_buffers;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Wait until we can add credits for handle to the running transaction.  Called</div><div class='ctx'>  * with j_state_lock held for reading. Returns 0 if handle joined the running</div><div class='hunk'>@@ -267,12 +243,12 @@ __must_hold(&amp;journal-&gt;j_state_lock)</div><div class='ctx'> 		 * big to fit this handle? Wait until reserved credits are freed.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (atomic_read(&amp;journal-&gt;j_reserved_credits) + total &gt;</div><div class='del'>-		    journal-&gt;j_max_transaction_buffers) {</div><div class='add'>+		    jbd2_max_user_trans_buffers(journal)) {</div><div class='ctx'> 			read_unlock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> 			jbd2_might_wait_for_commit(journal);</div><div class='ctx'> 			wait_event(journal-&gt;j_wait_reserved,</div><div class='ctx'> 				   atomic_read(&amp;journal-&gt;j_reserved_credits) + total &lt;=</div><div class='del'>-				   journal-&gt;j_max_transaction_buffers);</div><div class='add'>+				   jbd2_max_user_trans_buffers(journal));</div><div class='ctx'> 			__acquire(&amp;journal-&gt;j_state_lock); /* fake out sparse */</div><div class='ctx'> 			return 1;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -312,14 +288,14 @@ __must_hold(&amp;journal-&gt;j_state_lock)</div><div class='ctx'> </div><div class='ctx'> 	needed = atomic_add_return(rsv_blocks, &amp;journal-&gt;j_reserved_credits);</div><div class='ctx'> 	/* We allow at most half of a transaction to be reserved */</div><div class='del'>-	if (needed &gt; journal-&gt;j_max_transaction_buffers / 2) {</div><div class='add'>+	if (needed &gt; jbd2_max_user_trans_buffers(journal) / 2) {</div><div class='ctx'> 		sub_reserved_credits(journal, rsv_blocks);</div><div class='ctx'> 		atomic_sub(total, &amp;t-&gt;t_outstanding_credits);</div><div class='ctx'> 		read_unlock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> 		jbd2_might_wait_for_commit(journal);</div><div class='ctx'> 		wait_event(journal-&gt;j_wait_reserved,</div><div class='ctx'> 			 atomic_read(&amp;journal-&gt;j_reserved_credits) + rsv_blocks</div><div class='del'>-			 &lt;= journal-&gt;j_max_transaction_buffers / 2);</div><div class='add'>+			 &lt;= jbd2_max_user_trans_buffers(journal) / 2);</div><div class='ctx'> 		__acquire(&amp;journal-&gt;j_state_lock); /* fake out sparse */</div><div class='ctx'> 		return 1;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -349,12 +325,12 @@ static int start_this_handle(journal_t *journal, handle_t *handle,</div><div class='ctx'> 	 * size and limit the number of total credits to not exceed maximum</div><div class='ctx'> 	 * transaction size per operation.</div><div class='ctx'> 	 */</div><div class='del'>-	if ((rsv_blocks &gt; journal-&gt;j_max_transaction_buffers / 2) ||</div><div class='del'>-	    (rsv_blocks + blocks &gt; journal-&gt;j_max_transaction_buffers)) {</div><div class='add'>+	if (rsv_blocks &gt; jbd2_max_user_trans_buffers(journal) / 2 ||</div><div class='add'>+	    rsv_blocks + blocks &gt; jbd2_max_user_trans_buffers(journal)) {</div><div class='ctx'> 		printk(KERN_ERR "JBD2: %s wants too many credits "</div><div class='ctx'> 		       "credits:%d rsv_credits:%d max:%d\n",</div><div class='ctx'> 		       current-&gt;comm, blocks, rsv_blocks,</div><div class='del'>-		       journal-&gt;j_max_transaction_buffers);</div><div class='add'>+		       jbd2_max_user_trans_buffers(journal));</div><div class='ctx'> 		WARN_ON(1);</div><div class='ctx'> 		return -ENOSPC;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -378,7 +354,7 @@ alloc_transaction:</div><div class='ctx'> 			return -ENOMEM;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	jbd_debug(3, "New handle %p going live.\n", handle);</div><div class='add'>+	jbd2_debug(3, "New handle %p going live.\n", handle);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We need to hold j_state_lock until t_updates has been incremented,</div><div class='hunk'>@@ -449,7 +425,7 @@ repeat:</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* OK, account for the buffers that this operation expects to</div><div class='del'>-	 * use and add the handle to the running transaction. </div><div class='add'>+	 * use and add the handle to the running transaction.</div><div class='ctx'> 	 */</div><div class='ctx'> 	update_t_max_wait(transaction, ts);</div><div class='ctx'> 	handle-&gt;h_transaction = transaction;</div><div class='hunk'>@@ -458,14 +434,14 @@ repeat:</div><div class='ctx'> 	handle-&gt;h_start_jiffies = jiffies;</div><div class='ctx'> 	atomic_inc(&amp;transaction-&gt;t_updates);</div><div class='ctx'> 	atomic_inc(&amp;transaction-&gt;t_handle_count);</div><div class='del'>-	jbd_debug(4, "Handle %p given %d credits (total %d, free %lu)\n",</div><div class='add'>+	jbd2_debug(4, "Handle %p given %d credits (total %d, free %lu)\n",</div><div class='ctx'> 		  handle, blocks,</div><div class='ctx'> 		  atomic_read(&amp;transaction-&gt;t_outstanding_credits),</div><div class='ctx'> 		  jbd2_log_space_left(journal));</div><div class='ctx'> 	read_unlock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> 	current-&gt;journal_info = handle;</div><div class='ctx'> </div><div class='del'>-	rwsem_acquire_read(&amp;journal-&gt;j_trans_commit_map, 0, 0, _THIS_IP_);</div><div class='add'>+	rwsem_acquire_read(&amp;journal-&gt;j_trans_commit_map, 0, 1, _THIS_IP_);</div><div class='ctx'> 	jbd2_journal_free_transaction(new_transaction);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Ensure that no allocations done while the transaction is open are</div><div class='hunk'>@@ -679,7 +655,7 @@ int jbd2_journal_extend(handle_t *handle, int nblocks, int revoke_records)</div><div class='ctx'> </div><div class='ctx'> 	/* Don't extend a locked-down transaction! */</div><div class='ctx'> 	if (transaction-&gt;t_state != T_RUNNING) {</div><div class='del'>-		jbd_debug(3, "denied handle %p %d blocks: "</div><div class='add'>+		jbd2_debug(3, "denied handle %p %d blocks: "</div><div class='ctx'> 			  "transaction not running\n", handle, nblocks);</div><div class='ctx'> 		goto error_out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -690,15 +666,14 @@ int jbd2_journal_extend(handle_t *handle, int nblocks, int revoke_records)</div><div class='ctx'> 		DIV_ROUND_UP(</div><div class='ctx'> 			handle-&gt;h_revoke_credits_requested,</div><div class='ctx'> 			journal-&gt;j_revoke_records_per_block);</div><div class='del'>-	spin_lock(&amp;transaction-&gt;t_handle_lock);</div><div class='ctx'> 	wanted = atomic_add_return(nblocks,</div><div class='ctx'> 				   &amp;transaction-&gt;t_outstanding_credits);</div><div class='ctx'> </div><div class='ctx'> 	if (wanted &gt; journal-&gt;j_max_transaction_buffers) {</div><div class='del'>-		jbd_debug(3, "denied handle %p %d blocks: "</div><div class='add'>+		jbd2_debug(3, "denied handle %p %d blocks: "</div><div class='ctx'> 			  "transaction too large\n", handle, nblocks);</div><div class='ctx'> 		atomic_sub(nblocks, &amp;transaction-&gt;t_outstanding_credits);</div><div class='del'>-		goto unlock;</div><div class='add'>+		goto error_out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	trace_jbd2_handle_extend(journal-&gt;j_fs_dev-&gt;bd_dev,</div><div class='hunk'>@@ -713,9 +688,7 @@ int jbd2_journal_extend(handle_t *handle, int nblocks, int revoke_records)</div><div class='ctx'> 	handle-&gt;h_revoke_credits_requested += revoke_records;</div><div class='ctx'> 	result = 0;</div><div class='ctx'> </div><div class='del'>-	jbd_debug(3, "extended handle %p by %d\n", handle, nblocks);</div><div class='del'>-unlock:</div><div class='del'>-	spin_unlock(&amp;transaction-&gt;t_handle_lock);</div><div class='add'>+	jbd2_debug(3, "extended handle %p by %d\n", handle, nblocks);</div><div class='ctx'> error_out:</div><div class='ctx'> 	read_unlock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> 	return result;</div><div class='hunk'>@@ -803,7 +776,7 @@ int jbd2__journal_restart(handle_t *handle, int nblocks, int revoke_records,</div><div class='ctx'> 	 * First unlink the handle from its current transaction, and start the</div><div class='ctx'> 	 * commit on that.</div><div class='ctx'> 	 */</div><div class='del'>-	jbd_debug(2, "restarting handle %p\n", handle);</div><div class='add'>+	jbd2_debug(2, "restarting handle %p\n", handle);</div><div class='ctx'> 	stop_this_handle(handle);</div><div class='ctx'> 	handle-&gt;h_transaction = NULL;</div><div class='ctx'> </div><div class='hunk'>@@ -836,6 +809,43 @@ int jbd2_journal_restart(handle_t *handle, int nblocks)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(jbd2_journal_restart);</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Waits for any outstanding t_updates to finish.</div><div class='add'>+ * This is called with write j_state_lock held.</div><div class='add'>+ */</div><div class='add'>+void jbd2_journal_wait_updates(journal_t *journal)</div><div class='add'>+{</div><div class='add'>+	DEFINE_WAIT(wait);</div><div class='add'>+</div><div class='add'>+	while (1) {</div><div class='add'>+		/*</div><div class='add'>+		 * Note that the running transaction can get freed under us if</div><div class='add'>+		 * this transaction is getting committed in</div><div class='add'>+		 * jbd2_journal_commit_transaction() -&gt;</div><div class='add'>+		 * jbd2_journal_free_transaction(). This can only happen when we</div><div class='add'>+		 * release j_state_lock -&gt; schedule() -&gt; acquire j_state_lock.</div><div class='add'>+		 * Hence we should everytime retrieve new j_running_transaction</div><div class='add'>+		 * value (after j_state_lock release acquire cycle), else it may</div><div class='add'>+		 * lead to use-after-free of old freed transaction.</div><div class='add'>+		 */</div><div class='add'>+		transaction_t *transaction = journal-&gt;j_running_transaction;</div><div class='add'>+</div><div class='add'>+		if (!transaction)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		prepare_to_wait(&amp;journal-&gt;j_wait_updates, &amp;wait,</div><div class='add'>+				TASK_UNINTERRUPTIBLE);</div><div class='add'>+		if (!atomic_read(&amp;transaction-&gt;t_updates)) {</div><div class='add'>+			finish_wait(&amp;journal-&gt;j_wait_updates, &amp;wait);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		write_unlock(&amp;journal-&gt;j_state_lock);</div><div class='add'>+		schedule();</div><div class='add'>+		finish_wait(&amp;journal-&gt;j_wait_updates, &amp;wait);</div><div class='add'>+		write_lock(&amp;journal-&gt;j_state_lock);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /**</div><div class='ctx'>  * jbd2_journal_lock_updates () - establish a transaction barrier.</div><div class='ctx'>  * @journal:  Journal to establish a barrier on.</div><div class='hunk'>@@ -848,8 +858,6 @@ EXPORT_SYMBOL(jbd2_journal_restart);</div><div class='ctx'>  */</div><div class='ctx'> void jbd2_journal_lock_updates(journal_t *journal)</div><div class='ctx'> {</div><div class='del'>-	DEFINE_WAIT(wait);</div><div class='del'>-</div><div class='ctx'> 	jbd2_might_wait_for_commit(journal);</div><div class='ctx'> </div><div class='ctx'> 	write_lock(&amp;journal-&gt;j_state_lock);</div><div class='hunk'>@@ -863,27 +871,9 @@ void jbd2_journal_lock_updates(journal_t *journal)</div><div class='ctx'> 		write_lock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Wait until there are no running updates */</div><div class='del'>-	while (1) {</div><div class='del'>-		transaction_t *transaction = journal-&gt;j_running_transaction;</div><div class='del'>-</div><div class='del'>-		if (!transaction)</div><div class='del'>-			break;</div><div class='add'>+	/* Wait until there are no running t_updates */</div><div class='add'>+	jbd2_journal_wait_updates(journal);</div><div class='ctx'> </div><div class='del'>-		spin_lock(&amp;transaction-&gt;t_handle_lock);</div><div class='del'>-		prepare_to_wait(&amp;journal-&gt;j_wait_updates, &amp;wait,</div><div class='del'>-				TASK_UNINTERRUPTIBLE);</div><div class='del'>-		if (!atomic_read(&amp;transaction-&gt;t_updates)) {</div><div class='del'>-			spin_unlock(&amp;transaction-&gt;t_handle_lock);</div><div class='del'>-			finish_wait(&amp;journal-&gt;j_wait_updates, &amp;wait);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		spin_unlock(&amp;transaction-&gt;t_handle_lock);</div><div class='del'>-		write_unlock(&amp;journal-&gt;j_state_lock);</div><div class='del'>-		schedule();</div><div class='del'>-		finish_wait(&amp;journal-&gt;j_wait_updates, &amp;wait);</div><div class='del'>-		write_lock(&amp;journal-&gt;j_state_lock);</div><div class='del'>-	}</div><div class='ctx'> 	write_unlock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -911,7 +901,7 @@ void jbd2_journal_unlock_updates (journal_t *journal)</div><div class='ctx'> 	write_lock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> 	--journal-&gt;j_barrier_count;</div><div class='ctx'> 	write_unlock(&amp;journal-&gt;j_state_lock);</div><div class='del'>-	wake_up(&amp;journal-&gt;j_wait_transaction_locked);</div><div class='add'>+	wake_up_all(&amp;journal-&gt;j_wait_transaction_locked);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void warn_dirty_buffer(struct buffer_head *bh)</div><div class='hunk'>@@ -926,19 +916,15 @@ static void warn_dirty_buffer(struct buffer_head *bh)</div><div class='ctx'> /* Call t_frozen trigger and copy buffer data into jh-&gt;b_frozen_data. */</div><div class='ctx'> static void jbd2_freeze_jh_data(struct journal_head *jh)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='del'>-	int offset;</div><div class='ctx'> 	char *source;</div><div class='ctx'> 	struct buffer_head *bh = jh2bh(jh);</div><div class='ctx'> </div><div class='ctx'> 	J_EXPECT_JH(jh, buffer_uptodate(bh), "Possible IO failure.\n");</div><div class='del'>-	page = bh-&gt;b_page;</div><div class='del'>-	offset = offset_in_page(bh-&gt;b_data);</div><div class='del'>-	source = kmap_atomic(page);</div><div class='add'>+	source = kmap_local_folio(bh-&gt;b_folio, bh_offset(bh));</div><div class='ctx'> 	/* Fire data frozen trigger just before we copy the data */</div><div class='del'>-	jbd2_buffer_frozen_trigger(jh, source + offset, jh-&gt;b_triggers);</div><div class='del'>-	memcpy(jh-&gt;b_frozen_data, source + offset, bh-&gt;b_size);</div><div class='del'>-	kunmap_atomic(source);</div><div class='add'>+	jbd2_buffer_frozen_trigger(jh, source, jh-&gt;b_triggers);</div><div class='add'>+	memcpy(jh-&gt;b_frozen_data, source, bh-&gt;b_size);</div><div class='add'>+	kunmap_local(source);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Now that the frozen data is saved off, we need to store any matching</div><div class='hunk'>@@ -970,7 +956,7 @@ do_get_write_access(handle_t *handle, struct journal_head *jh,</div><div class='ctx'> </div><div class='ctx'> 	journal = transaction-&gt;t_journal;</div><div class='ctx'> </div><div class='del'>-	jbd_debug(5, "journal_head %p, force_copy %d\n", jh, force_copy);</div><div class='add'>+	jbd2_debug(5, "journal_head %p, force_copy %d\n", jh, force_copy);</div><div class='ctx'> </div><div class='ctx'> 	JBUFFER_TRACE(jh, "entry");</div><div class='ctx'> repeat:</div><div class='hunk'>@@ -1001,36 +987,28 @@ repeat:</div><div class='ctx'> 	 * ie. locked but not dirty) or tune2fs (which may actually have</div><div class='ctx'> 	 * the buffer dirtied, ugh.)  */</div><div class='ctx'> </div><div class='del'>-	if (buffer_dirty(bh)) {</div><div class='del'>-		/*</div><div class='del'>-		 * First question: is this buffer already part of the current</div><div class='del'>-		 * transaction or the existing committing transaction?</div><div class='del'>-		 */</div><div class='del'>-		if (jh-&gt;b_transaction) {</div><div class='del'>-			J_ASSERT_JH(jh,</div><div class='del'>-				jh-&gt;b_transaction == transaction ||</div><div class='del'>-				jh-&gt;b_transaction ==</div><div class='del'>-					journal-&gt;j_committing_transaction);</div><div class='del'>-			if (jh-&gt;b_next_transaction)</div><div class='del'>-				J_ASSERT_JH(jh, jh-&gt;b_next_transaction ==</div><div class='del'>-							transaction);</div><div class='del'>-			warn_dirty_buffer(bh);</div><div class='del'>-		}</div><div class='add'>+	if (buffer_dirty(bh) &amp;&amp; jh-&gt;b_transaction) {</div><div class='add'>+		warn_dirty_buffer(bh);</div><div class='ctx'> 		/*</div><div class='del'>-		 * In any case we need to clean the dirty flag and we must</div><div class='del'>-		 * do it under the buffer lock to be sure we don't race</div><div class='del'>-		 * with running write-out.</div><div class='add'>+		 * We need to clean the dirty flag and we must do it under the</div><div class='add'>+		 * buffer lock to be sure we don't race with running write-out.</div><div class='ctx'> 		 */</div><div class='ctx'> 		JBUFFER_TRACE(jh, "Journalling dirty buffer");</div><div class='ctx'> 		clear_buffer_dirty(bh);</div><div class='add'>+		/*</div><div class='add'>+		 * The buffer is going to be added to BJ_Reserved list now and</div><div class='add'>+		 * nothing guarantees jbd2_journal_dirty_metadata() will be</div><div class='add'>+		 * ever called for it. So we need to set jbddirty bit here to</div><div class='add'>+		 * make sure the buffer is dirtied and written out when the</div><div class='add'>+		 * journaling machinery is done with it.</div><div class='add'>+		 */</div><div class='ctx'> 		set_buffer_jbddirty(bh);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	unlock_buffer(bh);</div><div class='del'>-</div><div class='ctx'> 	error = -EROFS;</div><div class='ctx'> 	if (is_handle_aborted(handle)) {</div><div class='ctx'> 		spin_unlock(&amp;jh-&gt;b_state_lock);</div><div class='add'>+		unlock_buffer(bh);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	error = 0;</div><div class='hunk'>@@ -1040,8 +1018,10 @@ repeat:</div><div class='ctx'> 	 * b_next_transaction points to it</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (jh-&gt;b_transaction == transaction ||</div><div class='del'>-	    jh-&gt;b_next_transaction == transaction)</div><div class='add'>+	    jh-&gt;b_next_transaction == transaction) {</div><div class='add'>+		unlock_buffer(bh);</div><div class='ctx'> 		goto done;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * this is the first time this transaction is touching this buffer,</div><div class='hunk'>@@ -1065,10 +1045,24 @@ repeat:</div><div class='ctx'> 		 */</div><div class='ctx'> 		smp_wmb();</div><div class='ctx'> 		spin_lock(&amp;journal-&gt;j_list_lock);</div><div class='add'>+		if (test_clear_buffer_dirty(bh)) {</div><div class='add'>+			/*</div><div class='add'>+			 * Execute buffer dirty clearing and jh-&gt;b_transaction</div><div class='add'>+			 * assignment under journal-&gt;j_list_lock locked to</div><div class='add'>+			 * prevent bh being removed from checkpoint list if</div><div class='add'>+			 * the buffer is in an intermediate state (not dirty</div><div class='add'>+			 * and jh-&gt;b_transaction is NULL).</div><div class='add'>+			 */</div><div class='add'>+			JBUFFER_TRACE(jh, "Journalling dirty buffer");</div><div class='add'>+			set_buffer_jbddirty(bh);</div><div class='add'>+		}</div><div class='ctx'> 		__jbd2_journal_file_buffer(jh, transaction, BJ_Reserved);</div><div class='ctx'> 		spin_unlock(&amp;journal-&gt;j_list_lock);</div><div class='add'>+		unlock_buffer(bh);</div><div class='ctx'> 		goto done;</div><div class='ctx'> 	}</div><div class='add'>+	unlock_buffer(bh);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If there is already a copy-out version of this buffer, then we don't</div><div class='ctx'> 	 * need to make another one</div><div class='hunk'>@@ -1218,11 +1212,26 @@ out:</div><div class='ctx'> int jbd2_journal_get_write_access(handle_t *handle, struct buffer_head *bh)</div><div class='ctx'> {</div><div class='ctx'> 	struct journal_head *jh;</div><div class='add'>+	journal_t *journal;</div><div class='ctx'> 	int rc;</div><div class='ctx'> </div><div class='ctx'> 	if (is_handle_aborted(handle))</div><div class='ctx'> 		return -EROFS;</div><div class='ctx'> </div><div class='add'>+	journal = handle-&gt;h_transaction-&gt;t_journal;</div><div class='add'>+	rc = jbd2_check_fs_dev_write_error(journal);</div><div class='add'>+	if (rc) {</div><div class='add'>+		/*</div><div class='add'>+		 * If the fs dev has writeback errors, it may have failed</div><div class='add'>+		 * to async write out metadata buffers in the background.</div><div class='add'>+		 * In this case, we could read old data from disk and write</div><div class='add'>+		 * it out again, which may lead to on-disk filesystem</div><div class='add'>+		 * inconsistency. Aborting journal can avoid it happen.</div><div class='add'>+		 */</div><div class='add'>+		jbd2_journal_abort(journal, rc);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (jbd2_write_access_granted(handle, bh, false))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='hunk'>@@ -1262,7 +1271,7 @@ int jbd2_journal_get_create_access(handle_t *handle, struct buffer_head *bh)</div><div class='ctx'> 	struct journal_head *jh = jbd2_journal_add_journal_head(bh);</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	jbd_debug(5, "journal_head %p\n", jh);</div><div class='add'>+	jbd2_debug(5, "journal_head %p\n", jh);</div><div class='ctx'> 	err = -EROFS;</div><div class='ctx'> 	if (is_handle_aborted(handle))</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -1276,14 +1285,23 @@ int jbd2_journal_get_create_access(handle_t *handle, struct buffer_head *bh)</div><div class='ctx'> 	 * committing transaction's lists, but it HAS to be in Forget state in</div><div class='ctx'> 	 * that case: the transaction must have deleted the buffer for it to be</div><div class='ctx'> 	 * reused here.</div><div class='add'>+	 * In the case of file system data inconsistency, for example, if the</div><div class='add'>+	 * block bitmap of a referenced block is not set, it can lead to the</div><div class='add'>+	 * situation where a block being committed is allocated and used again.</div><div class='add'>+	 * As a result, the following condition will not be satisfied, so here</div><div class='add'>+	 * we directly trigger a JBD abort instead of immediately invoking</div><div class='add'>+	 * bugon.</div><div class='ctx'> 	 */</div><div class='ctx'> 	spin_lock(&amp;jh-&gt;b_state_lock);</div><div class='del'>-	J_ASSERT_JH(jh, (jh-&gt;b_transaction == transaction ||</div><div class='del'>-		jh-&gt;b_transaction == NULL ||</div><div class='del'>-		(jh-&gt;b_transaction == journal-&gt;j_committing_transaction &amp;&amp;</div><div class='del'>-			  jh-&gt;b_jlist == BJ_Forget)));</div><div class='add'>+	if (!(jh-&gt;b_transaction == transaction || jh-&gt;b_transaction == NULL ||</div><div class='add'>+	      (jh-&gt;b_transaction == journal-&gt;j_committing_transaction &amp;&amp;</div><div class='add'>+	       jh-&gt;b_jlist == BJ_Forget)) || jh-&gt;b_next_transaction != NULL) {</div><div class='add'>+		err = -EROFS;</div><div class='add'>+		spin_unlock(&amp;jh-&gt;b_state_lock);</div><div class='add'>+		jbd2_journal_abort(journal, err);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	J_ASSERT_JH(jh, jh-&gt;b_next_transaction == NULL);</div><div class='ctx'> 	J_ASSERT_JH(jh, buffer_locked(jh2bh(jh)));</div><div class='ctx'> </div><div class='ctx'> 	if (jh-&gt;b_transaction == NULL) {</div><div class='hunk'>@@ -1477,8 +1495,6 @@ int jbd2_journal_dirty_metadata(handle_t *handle, struct buffer_head *bh)</div><div class='ctx'> 	struct journal_head *jh;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	if (is_handle_aborted(handle))</div><div class='del'>-		return -EROFS;</div><div class='ctx'> 	if (!buffer_jbd(bh))</div><div class='ctx'> 		return -EUCLEAN;</div><div class='ctx'> </div><div class='hunk'>@@ -1487,7 +1503,7 @@ int jbd2_journal_dirty_metadata(handle_t *handle, struct buffer_head *bh)</div><div class='ctx'> 	 * of the running transaction.</div><div class='ctx'> 	 */</div><div class='ctx'> 	jh = bh2jh(bh);</div><div class='del'>-	jbd_debug(5, "journal_head %p\n", jh);</div><div class='add'>+	jbd2_debug(5, "journal_head %p\n", jh);</div><div class='ctx'> 	JBUFFER_TRACE(jh, "entry");</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1503,7 +1519,7 @@ int jbd2_journal_dirty_metadata(handle_t *handle, struct buffer_head *bh)</div><div class='ctx'> 				jh-&gt;b_next_transaction == transaction);</div><div class='ctx'> 		spin_unlock(&amp;jh-&gt;b_state_lock);</div><div class='ctx'> 	}</div><div class='del'>-	if (jh-&gt;b_modified == 1) {</div><div class='add'>+	if (data_race(jh-&gt;b_modified == 1)) {</div><div class='ctx'> 		/* If it's in our transaction it must be in BJ_Metadata list. */</div><div class='ctx'> 		if (data_race(jh-&gt;b_transaction == transaction &amp;&amp;</div><div class='ctx'> 		    jh-&gt;b_jlist != BJ_Metadata)) {</div><div class='hunk'>@@ -1522,9 +1538,22 @@ int jbd2_journal_dirty_metadata(handle_t *handle, struct buffer_head *bh)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	journal = transaction-&gt;t_journal;</div><div class='ctx'> 	spin_lock(&amp;jh-&gt;b_state_lock);</div><div class='ctx'> </div><div class='add'>+	if (is_handle_aborted(handle)) {</div><div class='add'>+		/*</div><div class='add'>+		 * Check journal aborting with @jh-&gt;b_state_lock locked,</div><div class='add'>+		 * since 'jh-&gt;b_transaction' could be replaced with</div><div class='add'>+		 * 'jh-&gt;b_next_transaction' during old transaction</div><div class='add'>+		 * committing if journal aborted, which may fail</div><div class='add'>+		 * assertion on 'jh-&gt;b_frozen_data == NULL'.</div><div class='add'>+		 */</div><div class='add'>+		ret = -EROFS;</div><div class='add'>+		goto out_unlock_bh;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	journal = transaction-&gt;t_journal;</div><div class='add'>+</div><div class='ctx'> 	if (jh-&gt;b_modified == 0) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * This buffer's got modified and becoming part</div><div class='hunk'>@@ -1640,6 +1669,7 @@ int jbd2_journal_forget(handle_t *handle, struct buffer_head *bh)</div><div class='ctx'> 	int drop_reserve = 0;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> 	int was_modified = 0;</div><div class='add'>+	int wait_for_writeback = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (is_handle_aborted(handle))</div><div class='ctx'> 		return -EROFS;</div><div class='hunk'>@@ -1757,25 +1787,28 @@ int jbd2_journal_forget(handle_t *handle, struct buffer_head *bh)</div><div class='ctx'> 		 * Otherwise, if the buffer has been written to disk,</div><div class='ctx'> 		 * it is safe to remove the checkpoint and drop it.</div><div class='ctx'> 		 */</div><div class='del'>-		if (!buffer_dirty(bh)) {</div><div class='del'>-			__jbd2_journal_remove_checkpoint(jh);</div><div class='add'>+		if (jbd2_journal_try_remove_checkpoint(jh) &gt;= 0) {</div><div class='ctx'> 			spin_unlock(&amp;journal-&gt;j_list_lock);</div><div class='ctx'> 			goto drop;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * The buffer is still not written to disk, we should</div><div class='del'>-		 * attach this buffer to current transaction so that the</div><div class='del'>-		 * buffer can be checkpointed only after the current</div><div class='del'>-		 * transaction commits.</div><div class='add'>+		 * The buffer has not yet been written to disk. We should</div><div class='add'>+		 * either clear the buffer or ensure that the ongoing I/O</div><div class='add'>+		 * is completed, and attach this buffer to current</div><div class='add'>+		 * transaction so that the buffer can be checkpointed only</div><div class='add'>+		 * after the current transaction commits.</div><div class='ctx'> 		 */</div><div class='ctx'> 		clear_buffer_dirty(bh);</div><div class='add'>+		wait_for_writeback = 1;</div><div class='ctx'> 		__jbd2_journal_file_buffer(jh, transaction, BJ_Forget);</div><div class='ctx'> 		spin_unlock(&amp;journal-&gt;j_list_lock);</div><div class='ctx'> 	}</div><div class='ctx'> drop:</div><div class='ctx'> 	__brelse(bh);</div><div class='ctx'> 	spin_unlock(&amp;jh-&gt;b_state_lock);</div><div class='add'>+	if (wait_for_writeback)</div><div class='add'>+		wait_on_buffer(bh);</div><div class='ctx'> 	jbd2_journal_put_journal_head(jh);</div><div class='ctx'> 	if (drop_reserve) {</div><div class='ctx'> 		/* no need to reserve log space for this block -bzzz */</div><div class='hunk'>@@ -1809,7 +1842,7 @@ int jbd2_journal_stop(handle_t *handle)</div><div class='ctx'> 	pid_t pid;</div><div class='ctx'> </div><div class='ctx'> 	if (--handle-&gt;h_ref &gt; 0) {</div><div class='del'>-		jbd_debug(4, "h_ref %d -&gt; %d\n", handle-&gt;h_ref + 1,</div><div class='add'>+		jbd2_debug(4, "h_ref %d -&gt; %d\n", handle-&gt;h_ref + 1,</div><div class='ctx'> 						 handle-&gt;h_ref);</div><div class='ctx'> 		if (is_handle_aborted(handle))</div><div class='ctx'> 			return -EIO;</div><div class='hunk'>@@ -1829,7 +1862,7 @@ int jbd2_journal_stop(handle_t *handle)</div><div class='ctx'> 	if (is_handle_aborted(handle))</div><div class='ctx'> 		err = -EIO;</div><div class='ctx'> </div><div class='del'>-	jbd_debug(4, "Handle %p going down\n", handle);</div><div class='add'>+	jbd2_debug(4, "Handle %p going down\n", handle);</div><div class='ctx'> 	trace_jbd2_handle_stats(journal-&gt;j_fs_dev-&gt;bd_dev,</div><div class='ctx'> 				tid, handle-&gt;h_type, handle-&gt;h_line_no,</div><div class='ctx'> 				jiffies - handle-&gt;h_start_jiffies,</div><div class='hunk'>@@ -1907,7 +1940,7 @@ int jbd2_journal_stop(handle_t *handle)</div><div class='ctx'> 		 * completes the commit thread, it just doesn't write</div><div class='ctx'> 		 * anything to disk. */</div><div class='ctx'> </div><div class='del'>-		jbd_debug(2, "transaction too old, requesting commit for "</div><div class='add'>+		jbd2_debug(2, "transaction too old, requesting commit for "</div><div class='ctx'> 					"handle %p\n", handle);</div><div class='ctx'> 		/* This is non-blocking */</div><div class='ctx'> 		jbd2_log_start_commit(journal, tid);</div><div class='hunk'>@@ -2058,54 +2091,10 @@ static void __jbd2_journal_unfile_buffer(struct journal_head *jh)</div><div class='ctx'> 	jh-&gt;b_transaction = NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void jbd2_journal_unfile_buffer(journal_t *journal, struct journal_head *jh)</div><div class='del'>-{</div><div class='del'>-	struct buffer_head *bh = jh2bh(jh);</div><div class='del'>-</div><div class='del'>-	/* Get reference so that buffer cannot be freed before we unlock it */</div><div class='del'>-	get_bh(bh);</div><div class='del'>-	spin_lock(&amp;jh-&gt;b_state_lock);</div><div class='del'>-	spin_lock(&amp;journal-&gt;j_list_lock);</div><div class='del'>-	__jbd2_journal_unfile_buffer(jh);</div><div class='del'>-	spin_unlock(&amp;journal-&gt;j_list_lock);</div><div class='del'>-	spin_unlock(&amp;jh-&gt;b_state_lock);</div><div class='del'>-	jbd2_journal_put_journal_head(jh);</div><div class='del'>-	__brelse(bh);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Called from jbd2_journal_try_to_free_buffers().</div><div class='del'>- *</div><div class='del'>- * Called under jh-&gt;b_state_lock</div><div class='del'>- */</div><div class='del'>-static void</div><div class='del'>-__journal_try_to_free_buffer(journal_t *journal, struct buffer_head *bh)</div><div class='del'>-{</div><div class='del'>-	struct journal_head *jh;</div><div class='del'>-</div><div class='del'>-	jh = bh2jh(bh);</div><div class='del'>-</div><div class='del'>-	if (buffer_locked(bh) || buffer_dirty(bh))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	if (jh-&gt;b_next_transaction != NULL || jh-&gt;b_transaction != NULL)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;journal-&gt;j_list_lock);</div><div class='del'>-	if (jh-&gt;b_cp_transaction != NULL) {</div><div class='del'>-		/* written-back checkpointed metadata buffer */</div><div class='del'>-		JBUFFER_TRACE(jh, "remove from checkpoint list");</div><div class='del'>-		__jbd2_journal_remove_checkpoint(jh);</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;journal-&gt;j_list_lock);</div><div class='del'>-out:</div><div class='del'>-	return;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /**</div><div class='ctx'>  * jbd2_journal_try_to_free_buffers() - try to free page buffers.</div><div class='ctx'>  * @journal: journal for operation</div><div class='del'>- * @page: to try and free</div><div class='add'>+ * @folio: Folio to detach data from.</div><div class='ctx'>  *</div><div class='ctx'>  * For all the buffers on this page,</div><div class='ctx'>  * if they are fully written out ordered data, move them onto BUF_CLEAN</div><div class='hunk'>@@ -2134,17 +2123,17 @@ out:</div><div class='ctx'>  * cannot happen because we never reallocate freed data as metadata</div><div class='ctx'>  * while the data is part of a transaction.  Yes?</div><div class='ctx'>  *</div><div class='del'>- * Return 0 on failure, 1 on success</div><div class='add'>+ * Return false on failure, true on success</div><div class='ctx'>  */</div><div class='del'>-int jbd2_journal_try_to_free_buffers(journal_t *journal, struct page *page)</div><div class='add'>+bool jbd2_journal_try_to_free_buffers(journal_t *journal, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *head;</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='del'>-	int ret = 0;</div><div class='add'>+	bool ret = false;</div><div class='ctx'> </div><div class='del'>-	J_ASSERT(PageLocked(page));</div><div class='add'>+	J_ASSERT(folio_test_locked(folio));</div><div class='ctx'> </div><div class='del'>-	head = page_buffers(page);</div><div class='add'>+	head = folio_buffers(folio);</div><div class='ctx'> 	bh = head;</div><div class='ctx'> 	do {</div><div class='ctx'> 		struct journal_head *jh;</div><div class='hunk'>@@ -2159,14 +2148,20 @@ int jbd2_journal_try_to_free_buffers(journal_t *journal, struct page *page)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		spin_lock(&amp;jh-&gt;b_state_lock);</div><div class='del'>-		__journal_try_to_free_buffer(journal, bh);</div><div class='add'>+		if (!jh-&gt;b_transaction &amp;&amp; !jh-&gt;b_next_transaction) {</div><div class='add'>+			spin_lock(&amp;journal-&gt;j_list_lock);</div><div class='add'>+			/* Remove written-back checkpointed metadata buffer */</div><div class='add'>+			if (jh-&gt;b_cp_transaction != NULL)</div><div class='add'>+				jbd2_journal_try_remove_checkpoint(jh);</div><div class='add'>+			spin_unlock(&amp;journal-&gt;j_list_lock);</div><div class='add'>+		}</div><div class='ctx'> 		spin_unlock(&amp;jh-&gt;b_state_lock);</div><div class='ctx'> 		jbd2_journal_put_journal_head(jh);</div><div class='ctx'> 		if (buffer_jbd(bh))</div><div class='ctx'> 			goto busy;</div><div class='ctx'> 	} while ((bh = bh-&gt;b_this_page) != head);</div><div class='ctx'> </div><div class='del'>-	ret = try_to_free_buffers(page);</div><div class='add'>+	ret = try_to_free_buffers(folio);</div><div class='ctx'> busy:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -2194,7 +2189,7 @@ static int __dispose_buffer(struct journal_head *jh, transaction_t *transaction)</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We don't want to write the buffer anymore, clear the</div><div class='ctx'> 		 * bit so that we don't confuse checks in</div><div class='del'>-		 * __journal_file_buffer</div><div class='add'>+		 * __jbd2_journal_file_buffer</div><div class='ctx'> 		 */</div><div class='ctx'> 		clear_buffer_dirty(bh);</div><div class='ctx'> 		__jbd2_journal_file_buffer(jh, transaction, BJ_Forget);</div><div class='hunk'>@@ -2208,14 +2203,14 @@ static int __dispose_buffer(struct journal_head *jh, transaction_t *transaction)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * jbd2_journal_invalidatepage</div><div class='add'>+ * jbd2_journal_invalidate_folio</div><div class='ctx'>  *</div><div class='ctx'>  * This code is tricky.  It has a number of cases to deal with.</div><div class='ctx'>  *</div><div class='ctx'>  * There are two invariants which this code relies on:</div><div class='ctx'>  *</div><div class='del'>- * i_size must be updated on disk before we start calling invalidatepage on the</div><div class='del'>- * data.</div><div class='add'>+ * i_size must be updated on disk before we start calling invalidate_folio</div><div class='add'>+ * on the data.</div><div class='ctx'>  *</div><div class='ctx'>  *  This is done in ext3 by defining an ext3_setattr method which</div><div class='ctx'>  *  updates i_size before truncate gets going.  By maintaining this</div><div class='hunk'>@@ -2360,6 +2355,9 @@ static int journal_unmap_buffer(journal_t *journal, struct buffer_head *bh,</div><div class='ctx'> 			spin_unlock(&amp;jh-&gt;b_state_lock);</div><div class='ctx'> 			write_unlock(&amp;journal-&gt;j_state_lock);</div><div class='ctx'> 			jbd2_journal_put_journal_head(jh);</div><div class='add'>+			/* Already zapped buffer? Nothing to do... */</div><div class='add'>+			if (!bh-&gt;b_bdev)</div><div class='add'>+				return 0;</div><div class='ctx'> 			return -EBUSY;</div><div class='ctx'> 		}</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -2417,9 +2415,9 @@ zap_buffer_unlocked:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * jbd2_journal_invalidatepage()</div><div class='add'>+ * jbd2_journal_invalidate_folio()</div><div class='ctx'>  * @journal: journal to use for flush...</div><div class='del'>- * @page:    page to flush</div><div class='add'>+ * @folio:    folio to flush</div><div class='ctx'>  * @offset:  start of the range to invalidate</div><div class='ctx'>  * @length:  length of the range to invalidate</div><div class='ctx'>  *</div><div class='hunk'>@@ -2428,30 +2426,29 @@ zap_buffer_unlocked:</div><div class='ctx'>  * the page is straddling i_size. Caller then has to wait for current commit</div><div class='ctx'>  * and try again.</div><div class='ctx'>  */</div><div class='del'>-int jbd2_journal_invalidatepage(journal_t *journal,</div><div class='del'>-				struct page *page,</div><div class='del'>-				unsigned int offset,</div><div class='del'>-				unsigned int length)</div><div class='add'>+int jbd2_journal_invalidate_folio(journal_t *journal, struct folio *folio,</div><div class='add'>+				size_t offset, size_t length)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *head, *bh, *next;</div><div class='ctx'> 	unsigned int stop = offset + length;</div><div class='ctx'> 	unsigned int curr_off = 0;</div><div class='del'>-	int partial_page = (offset || length &lt; PAGE_SIZE);</div><div class='add'>+	int partial_page = (offset || length &lt; folio_size(folio));</div><div class='ctx'> 	int may_free = 1;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	if (!PageLocked(page))</div><div class='add'>+	if (!folio_test_locked(folio))</div><div class='ctx'> 		BUG();</div><div class='del'>-	if (!page_has_buffers(page))</div><div class='add'>+	head = folio_buffers(folio);</div><div class='add'>+	if (!head)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(stop &gt; PAGE_SIZE || stop &lt; length);</div><div class='add'>+	BUG_ON(stop &gt; folio_size(folio) || stop &lt; length);</div><div class='ctx'> </div><div class='ctx'> 	/* We will potentially be playing with lists other than just the</div><div class='ctx'> 	 * data lists (especially for journaled data mode), so be</div><div class='ctx'> 	 * cautious in our locking. */</div><div class='ctx'> </div><div class='del'>-	head = bh = page_buffers(page);</div><div class='add'>+	bh = head;</div><div class='ctx'> 	do {</div><div class='ctx'> 		unsigned int next_off = curr_off + bh-&gt;b_size;</div><div class='ctx'> 		next = bh-&gt;b_this_page;</div><div class='hunk'>@@ -2474,8 +2471,8 @@ int jbd2_journal_invalidatepage(journal_t *journal,</div><div class='ctx'> 	} while (bh != head);</div><div class='ctx'> </div><div class='ctx'> 	if (!partial_page) {</div><div class='del'>-		if (may_free &amp;&amp; try_to_free_buffers(page))</div><div class='del'>-			J_ASSERT(!page_has_buffers(page));</div><div class='add'>+		if (may_free &amp;&amp; try_to_free_buffers(folio))</div><div class='add'>+			J_ASSERT(!folio_buffers(folio));</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -2654,7 +2651,7 @@ static int jbd2_journal_file_inode(handle_t *handle, struct jbd2_inode *jinode,</div><div class='ctx'> 		return -EROFS;</div><div class='ctx'> 	journal = transaction-&gt;t_journal;</div><div class='ctx'> </div><div class='del'>-	jbd_debug(4, "Adding inode %lu, tid:%d\n", jinode-&gt;i_vfs_inode-&gt;i_ino,</div><div class='add'>+	jbd2_debug(4, "Adding inode %lu, tid:%d\n", jinode-&gt;i_vfs_inode-&gt;i_ino,</div><div class='ctx'> 			transaction-&gt;t_tid);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;journal-&gt;j_list_lock);</div><div class='head'>diff --git a/fs/jffs2/Kconfig b/fs/jffs2/Kconfig<br/>index 7c96bc107218..560187d61562 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/Kconfig</a></div><div class='hunk'>@@ -151,8 +151,9 @@ config JFFS2_RUBIN</div><div class='ctx'> 	  RUBINMIPS and DYNRUBIN compressors. Say 'N' if unsure.</div><div class='ctx'> </div><div class='ctx'> choice</div><div class='del'>-	prompt "JFFS2 default compression mode" if JFFS2_COMPRESSION_OPTIONS</div><div class='add'>+	prompt "JFFS2 default compression mode"</div><div class='ctx'> 	default JFFS2_CMODE_PRIORITY</div><div class='add'>+	depends on JFFS2_COMPRESSION_OPTIONS</div><div class='ctx'> 	depends on JFFS2_FS</div><div class='ctx'> 	help</div><div class='ctx'> 	  You can set here the default compression mode of JFFS2 from</div><div class='head'>diff --git a/fs/jffs2/acl.c b/fs/jffs2/acl.c<br/>index e945e3484788..888a7ceb6479 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/acl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/acl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/acl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/acl.c</a></div><div class='hunk'>@@ -229,10 +229,11 @@ static int __jffs2_set_acl(struct inode *inode, int xprefix, struct posix_acl *a</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int jffs2_set_acl(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='add'>+int jffs2_set_acl(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		  struct posix_acl *acl, int type)</div><div class='ctx'> {</div><div class='ctx'> 	int rc, xprefix;</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='ctx'> </div><div class='ctx'> 	switch (type) {</div><div class='ctx'> 	case ACL_TYPE_ACCESS:</div><div class='hunk'>@@ -240,7 +241,7 @@ int jffs2_set_acl(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='ctx'> 		if (acl) {</div><div class='ctx'> 			umode_t mode;</div><div class='ctx'> </div><div class='del'>-			rc = posix_acl_update_mode(&amp;init_user_ns, inode, &amp;mode,</div><div class='add'>+			rc = posix_acl_update_mode(&amp;nop_mnt_idmap, inode, &amp;mode,</div><div class='ctx'> 						   &amp;acl);</div><div class='ctx'> 			if (rc)</div><div class='ctx'> 				return rc;</div><div class='head'>diff --git a/fs/jffs2/acl.h b/fs/jffs2/acl.h<br/>index 9d9fb7cf093e..e976b8cb82cf 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/acl.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/acl.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/acl.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/acl.h</a></div><div class='hunk'>@@ -28,7 +28,7 @@ struct jffs2_acl_header {</div><div class='ctx'> #ifdef CONFIG_JFFS2_FS_POSIX_ACL</div><div class='ctx'> </div><div class='ctx'> struct posix_acl *jffs2_get_acl(struct inode *inode, int type, bool rcu);</div><div class='del'>-int jffs2_set_acl(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='add'>+int jffs2_set_acl(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		  struct posix_acl *acl, int type);</div><div class='ctx'> extern int jffs2_init_acl_pre(struct inode *, struct inode *, umode_t *);</div><div class='ctx'> extern int jffs2_init_acl_post(struct inode *);</div><div class='head'>diff --git a/fs/jffs2/background.c b/fs/jffs2/background.c<br/>index 2b4d5013dc5d..bb0ee1a59e71 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/background.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/background.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/background.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/background.c</a></div><div class='hunk'>@@ -44,8 +44,8 @@ int jffs2_start_garbage_collect_thread(struct jffs2_sb_info *c)</div><div class='ctx'> </div><div class='ctx'> 	tsk = kthread_run(jffs2_garbage_collect_thread, c, "jffs2_gcd_mtd%d", c-&gt;mtd-&gt;index);</div><div class='ctx'> 	if (IS_ERR(tsk)) {</div><div class='del'>-		pr_warn("fork failed for JFFS2 garbage collect thread: %ld\n",</div><div class='del'>-			-PTR_ERR(tsk));</div><div class='add'>+		pr_warn("fork failed for JFFS2 garbage collect thread: %pe\n",</div><div class='add'>+			tsk);</div><div class='ctx'> 		complete(&amp;c-&gt;gc_thread_exit);</div><div class='ctx'> 		ret = PTR_ERR(tsk);</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -161,5 +161,5 @@ static int jffs2_garbage_collect_thread(void *_c)</div><div class='ctx'> 	spin_lock(&amp;c-&gt;erase_completion_lock);</div><div class='ctx'> 	c-&gt;gc_task = NULL;</div><div class='ctx'> 	spin_unlock(&amp;c-&gt;erase_completion_lock);</div><div class='del'>-	complete_and_exit(&amp;c-&gt;gc_thread_exit, 0);</div><div class='add'>+	kthread_complete_and_exit(&amp;c-&gt;gc_thread_exit, 0);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/jffs2/build.c b/fs/jffs2/build.c<br/>index b288c8ae1236..6ae9d6fefb86 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/build.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/build.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/build.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/build.c</a></div><div class='hunk'>@@ -211,7 +211,10 @@ static int jffs2_build_filesystem(struct jffs2_sb_info *c)</div><div class='ctx'> 		ic-&gt;scan_dents = NULL;</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 	}</div><div class='del'>-	jffs2_build_xattr_subsystem(c);</div><div class='add'>+	ret = jffs2_build_xattr_subsystem(c);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto exit;</div><div class='add'>+</div><div class='ctx'> 	c-&gt;flags &amp;= ~JFFS2_SB_FLAG_BUILDING;</div><div class='ctx'> </div><div class='ctx'> 	dbg_fsbuild("FS build complete\n");</div><div class='hunk'>@@ -415,13 +418,15 @@ int jffs2_do_mount_fs(struct jffs2_sb_info *c)</div><div class='ctx'> 		jffs2_free_ino_caches(c);</div><div class='ctx'> 		jffs2_free_raw_node_refs(c);</div><div class='ctx'> 		ret = -EIO;</div><div class='del'>-		goto out_free;</div><div class='add'>+		goto out_sum_exit;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	jffs2_calc_trigger_levels(c);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='add'>+ out_sum_exit:</div><div class='add'>+	jffs2_sum_exit(c);</div><div class='ctx'>  out_free:</div><div class='ctx'> 	kvfree(c-&gt;blocks);</div><div class='ctx'> </div><div class='head'>diff --git a/fs/jffs2/compr.c b/fs/jffs2/compr.c<br/>index 4849a4c9a0e2..764f19dec3f0 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/compr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/compr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/compr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/compr.c</a></div><div class='hunk'>@@ -364,20 +364,25 @@ void jffs2_free_comprbuf(unsigned char *comprbuf, unsigned char *orig)</div><div class='ctx'> </div><div class='ctx'> int __init jffs2_compressors_init(void)</div><div class='ctx'> {</div><div class='add'>+	int ret = 0;</div><div class='ctx'> /* Registering compressors */</div><div class='del'>-#ifdef CONFIG_JFFS2_ZLIB</div><div class='del'>-	jffs2_zlib_init();</div><div class='del'>-#endif</div><div class='del'>-#ifdef CONFIG_JFFS2_RTIME</div><div class='del'>-	jffs2_rtime_init();</div><div class='del'>-#endif</div><div class='del'>-#ifdef CONFIG_JFFS2_RUBIN</div><div class='del'>-	jffs2_rubinmips_init();</div><div class='del'>-	jffs2_dynrubin_init();</div><div class='del'>-#endif</div><div class='del'>-#ifdef CONFIG_JFFS2_LZO</div><div class='del'>-	jffs2_lzo_init();</div><div class='del'>-#endif</div><div class='add'>+	ret = jffs2_zlib_init();</div><div class='add'>+	if (ret)</div><div class='add'>+		goto exit;</div><div class='add'>+	ret = jffs2_rtime_init();</div><div class='add'>+	if (ret)</div><div class='add'>+		goto exit_zlib;</div><div class='add'>+	ret = jffs2_rubinmips_init();</div><div class='add'>+	if (ret)</div><div class='add'>+		goto exit_rtime;</div><div class='add'>+	ret = jffs2_dynrubin_init();</div><div class='add'>+	if (ret)</div><div class='add'>+		goto exit_runinmips;</div><div class='add'>+	ret = jffs2_lzo_init();</div><div class='add'>+	if (ret)</div><div class='add'>+		goto exit_dynrubin;</div><div class='add'>+</div><div class='add'>+</div><div class='ctx'> /* Setting default compression mode */</div><div class='ctx'> #ifdef CONFIG_JFFS2_CMODE_NONE</div><div class='ctx'> 	jffs2_compression_mode = JFFS2_COMPR_MODE_NONE;</div><div class='hunk'>@@ -396,23 +401,26 @@ int __init jffs2_compressors_init(void)</div><div class='ctx'> #endif</div><div class='ctx'> #endif</div><div class='ctx'> 	return 0;</div><div class='add'>+</div><div class='add'>+exit_dynrubin:</div><div class='add'>+	jffs2_dynrubin_exit();</div><div class='add'>+exit_runinmips:</div><div class='add'>+	jffs2_rubinmips_exit();</div><div class='add'>+exit_rtime:</div><div class='add'>+	jffs2_rtime_exit();</div><div class='add'>+exit_zlib:</div><div class='add'>+	jffs2_zlib_exit();</div><div class='add'>+exit:</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int jffs2_compressors_exit(void)</div><div class='ctx'> {</div><div class='ctx'> /* Unregistering compressors */</div><div class='del'>-#ifdef CONFIG_JFFS2_LZO</div><div class='ctx'> 	jffs2_lzo_exit();</div><div class='del'>-#endif</div><div class='del'>-#ifdef CONFIG_JFFS2_RUBIN</div><div class='ctx'> 	jffs2_dynrubin_exit();</div><div class='ctx'> 	jffs2_rubinmips_exit();</div><div class='del'>-#endif</div><div class='del'>-#ifdef CONFIG_JFFS2_RTIME</div><div class='ctx'> 	jffs2_rtime_exit();</div><div class='del'>-#endif</div><div class='del'>-#ifdef CONFIG_JFFS2_ZLIB</div><div class='ctx'> 	jffs2_zlib_exit();</div><div class='del'>-#endif</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/jffs2/compr.h b/fs/jffs2/compr.h<br/>index 5e91d578f4ed..3716b6b7924c 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/compr.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/compr.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/compr.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/compr.h</a></div><div class='hunk'>@@ -88,18 +88,32 @@ int jffs2_rubinmips_init(void);</div><div class='ctx'> void jffs2_rubinmips_exit(void);</div><div class='ctx'> int jffs2_dynrubin_init(void);</div><div class='ctx'> void jffs2_dynrubin_exit(void);</div><div class='add'>+#else</div><div class='add'>+static inline int jffs2_rubinmips_init(void) { return 0; }</div><div class='add'>+static inline void jffs2_rubinmips_exit(void) {}</div><div class='add'>+static inline int jffs2_dynrubin_init(void) { return 0; }</div><div class='add'>+static inline void jffs2_dynrubin_exit(void) {}</div><div class='ctx'> #endif</div><div class='ctx'> #ifdef CONFIG_JFFS2_RTIME</div><div class='del'>-int jffs2_rtime_init(void);</div><div class='del'>-void jffs2_rtime_exit(void);</div><div class='add'>+extern int jffs2_rtime_init(void);</div><div class='add'>+extern void jffs2_rtime_exit(void);</div><div class='add'>+#else</div><div class='add'>+static inline int jffs2_rtime_init(void) { return 0; }</div><div class='add'>+static inline void jffs2_rtime_exit(void) {}</div><div class='ctx'> #endif</div><div class='ctx'> #ifdef CONFIG_JFFS2_ZLIB</div><div class='del'>-int jffs2_zlib_init(void);</div><div class='del'>-void jffs2_zlib_exit(void);</div><div class='add'>+extern int jffs2_zlib_init(void);</div><div class='add'>+extern void jffs2_zlib_exit(void);</div><div class='add'>+#else</div><div class='add'>+static inline int jffs2_zlib_init(void) { return 0; }</div><div class='add'>+static inline void jffs2_zlib_exit(void) {}</div><div class='ctx'> #endif</div><div class='ctx'> #ifdef CONFIG_JFFS2_LZO</div><div class='del'>-int jffs2_lzo_init(void);</div><div class='del'>-void jffs2_lzo_exit(void);</div><div class='add'>+extern int jffs2_lzo_init(void);</div><div class='add'>+extern void jffs2_lzo_exit(void);</div><div class='add'>+#else</div><div class='add'>+static inline int jffs2_lzo_init(void) { return 0; }</div><div class='add'>+static inline void jffs2_lzo_exit(void) {}</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> #endif /* __JFFS2_COMPR_H__ */</div><div class='head'>diff --git a/fs/jffs2/compr_rtime.c b/fs/jffs2/compr_rtime.c<br/>index 79e771ab624f..3bd9d2f3bece 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/compr_rtime.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/compr_rtime.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/compr_rtime.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/compr_rtime.c</a></div><div class='hunk'>@@ -95,6 +95,9 @@ static int jffs2_rtime_decompress(unsigned char *data_in,</div><div class='ctx'> </div><div class='ctx'> 		positions[value]=outpos;</div><div class='ctx'> 		if (repeat) {</div><div class='add'>+			if ((outpos + repeat) &gt; destlen) {</div><div class='add'>+				return 1;</div><div class='add'>+			}</div><div class='ctx'> 			if (backoffs + repeat &gt;= outpos) {</div><div class='ctx'> 				while(repeat) {</div><div class='ctx'> 					cpage_out[outpos++] = cpage_out[backoffs++];</div><div class='head'>diff --git a/fs/jffs2/compr_rubin.c b/fs/jffs2/compr_rubin.c<br/>index 556de100ebd5..9854253d0108 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/compr_rubin.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/compr_rubin.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/compr_rubin.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/compr_rubin.c</a></div><div class='hunk'>@@ -276,11 +276,6 @@ static int rubin_do_compress(int bit_divider, int *bits, unsigned char *data_in,</div><div class='ctx'> </div><div class='ctx'> 	end_rubin(&amp;rs);</div><div class='ctx'> </div><div class='del'>-	if (outpos &gt; pos) {</div><div class='del'>-		/* We failed */</div><div class='del'>-		return -1;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	/* Tell the caller how much we managed to compress,</div><div class='ctx'> 	 * and how much space it took */</div><div class='ctx'> </div><div class='head'>diff --git a/fs/jffs2/debug.c b/fs/jffs2/debug.c<br/>index 9d26b1b9fc01..0925caab23c4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/debug.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/debug.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/debug.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/debug.c</a></div><div class='hunk'>@@ -157,7 +157,7 @@ __jffs2_dbg_prewrite_paranoia_check(struct jffs2_sb_info *c,</div><div class='ctx'> 	kfree(buf);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void __jffs2_dbg_superblock_counts(struct jffs2_sb_info *c)</div><div class='add'>+static void __jffs2_dbg_superblock_counts(struct jffs2_sb_info *c)</div><div class='ctx'> {</div><div class='ctx'> 	struct jffs2_eraseblock *jeb;</div><div class='ctx'> 	uint32_t free = 0, dirty = 0, used = 0, wasted = 0,</div><div class='head'>diff --git a/fs/jffs2/dir.c b/fs/jffs2/dir.c<br/>index c0aabbcbfd58..dd91f725ded6 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/dir.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/dir.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/dir.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/dir.c</a></div><div class='hunk'>@@ -24,20 +24,20 @@</div><div class='ctx'> </div><div class='ctx'> static int jffs2_readdir (struct file *, struct dir_context *);</div><div class='ctx'> </div><div class='del'>-static int jffs2_create (struct user_namespace *, struct inode *,</div><div class='add'>+static int jffs2_create (struct mnt_idmap *, struct inode *,</div><div class='ctx'> 		         struct dentry *, umode_t, bool);</div><div class='ctx'> static struct dentry *jffs2_lookup (struct inode *,struct dentry *,</div><div class='ctx'> 				    unsigned int);</div><div class='ctx'> static int jffs2_link (struct dentry *,struct inode *,struct dentry *);</div><div class='ctx'> static int jffs2_unlink (struct inode *,struct dentry *);</div><div class='del'>-static int jffs2_symlink (struct user_namespace *, struct inode *,</div><div class='add'>+static int jffs2_symlink (struct mnt_idmap *, struct inode *,</div><div class='ctx'> 			  struct dentry *, const char *);</div><div class='del'>-static int jffs2_mkdir (struct user_namespace *, struct inode *,struct dentry *,</div><div class='del'>-			umode_t);</div><div class='add'>+static struct dentry *jffs2_mkdir (struct mnt_idmap *, struct inode *,struct dentry *,</div><div class='add'>+				   umode_t);</div><div class='ctx'> static int jffs2_rmdir (struct inode *,struct dentry *);</div><div class='del'>-static int jffs2_mknod (struct user_namespace *, struct inode *,struct dentry *,</div><div class='add'>+static int jffs2_mknod (struct mnt_idmap *, struct inode *,struct dentry *,</div><div class='ctx'> 			umode_t,dev_t);</div><div class='del'>-static int jffs2_rename (struct user_namespace *, struct inode *,</div><div class='add'>+static int jffs2_rename (struct mnt_idmap *, struct inode *,</div><div class='ctx'> 			 struct dentry *, struct inode *, struct dentry *,</div><div class='ctx'> 			 unsigned int);</div><div class='ctx'> </div><div class='hunk'>@@ -62,7 +62,7 @@ const struct inode_operations jffs2_dir_inode_operations =</div><div class='ctx'> 	.rmdir =	jffs2_rmdir,</div><div class='ctx'> 	.mknod =	jffs2_mknod,</div><div class='ctx'> 	.rename =	jffs2_rename,</div><div class='del'>-	.get_acl =	jffs2_get_acl,</div><div class='add'>+	.get_inode_acl =	jffs2_get_acl,</div><div class='ctx'> 	.set_acl =	jffs2_set_acl,</div><div class='ctx'> 	.setattr =	jffs2_setattr,</div><div class='ctx'> 	.listxattr =	jffs2_listxattr,</div><div class='hunk'>@@ -160,7 +160,7 @@ static int jffs2_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> /***********************************************************************/</div><div class='ctx'> </div><div class='ctx'> </div><div class='del'>-static int jffs2_create(struct user_namespace *mnt_userns, struct inode *dir_i,</div><div class='add'>+static int jffs2_create(struct mnt_idmap *idmap, struct inode *dir_i,</div><div class='ctx'> 			struct dentry *dentry, umode_t mode, bool excl)</div><div class='ctx'> {</div><div class='ctx'> 	struct jffs2_raw_inode *ri;</div><div class='hunk'>@@ -204,7 +204,8 @@ static int jffs2_create(struct user_namespace *mnt_userns, struct inode *dir_i,</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> </div><div class='del'>-	dir_i-&gt;i_mtime = dir_i-&gt;i_ctime = ITIME(je32_to_cpu(ri-&gt;ctime));</div><div class='add'>+	inode_set_mtime_to_ts(dir_i,</div><div class='add'>+			      inode_set_ctime_to_ts(dir_i, ITIME(je32_to_cpu(ri-&gt;ctime))));</div><div class='ctx'> </div><div class='ctx'> 	jffs2_free_raw_inode(ri);</div><div class='ctx'> </div><div class='hunk'>@@ -237,7 +238,8 @@ static int jffs2_unlink(struct inode *dir_i, struct dentry *dentry)</div><div class='ctx'> 	if (dead_f-&gt;inocache)</div><div class='ctx'> 		set_nlink(d_inode(dentry), dead_f-&gt;inocache-&gt;pino_nlink);</div><div class='ctx'> 	if (!ret)</div><div class='del'>-		dir_i-&gt;i_mtime = dir_i-&gt;i_ctime = ITIME(now);</div><div class='add'>+		inode_set_mtime_to_ts(dir_i,</div><div class='add'>+				      inode_set_ctime_to_ts(dir_i, ITIME(now)));</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> /***********************************************************************/</div><div class='hunk'>@@ -271,7 +273,8 @@ static int jffs2_link (struct dentry *old_dentry, struct inode *dir_i, struct de</div><div class='ctx'> 		set_nlink(d_inode(old_dentry), ++f-&gt;inocache-&gt;pino_nlink);</div><div class='ctx'> 		mutex_unlock(&amp;f-&gt;sem);</div><div class='ctx'> 		d_instantiate(dentry, d_inode(old_dentry));</div><div class='del'>-		dir_i-&gt;i_mtime = dir_i-&gt;i_ctime = ITIME(now);</div><div class='add'>+		inode_set_mtime_to_ts(dir_i,</div><div class='add'>+				      inode_set_ctime_to_ts(dir_i, ITIME(now)));</div><div class='ctx'> 		ihold(d_inode(old_dentry));</div><div class='ctx'> 	}</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -279,7 +282,7 @@ static int jffs2_link (struct dentry *old_dentry, struct inode *dir_i, struct de</div><div class='ctx'> </div><div class='ctx'> /***********************************************************************/</div><div class='ctx'> </div><div class='del'>-static int jffs2_symlink (struct user_namespace *mnt_userns, struct inode *dir_i,</div><div class='add'>+static int jffs2_symlink (struct mnt_idmap *idmap, struct inode *dir_i,</div><div class='ctx'> 			  struct dentry *dentry, const char *target)</div><div class='ctx'> {</div><div class='ctx'> 	struct jffs2_inode_info *f, *dir_f;</div><div class='hunk'>@@ -422,7 +425,8 @@ static int jffs2_symlink (struct user_namespace *mnt_userns, struct inode *dir_i</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dir_i-&gt;i_mtime = dir_i-&gt;i_ctime = ITIME(je32_to_cpu(rd-&gt;mctime));</div><div class='add'>+	inode_set_mtime_to_ts(dir_i,</div><div class='add'>+			      inode_set_ctime_to_ts(dir_i, ITIME(je32_to_cpu(rd-&gt;mctime))));</div><div class='ctx'> </div><div class='ctx'> 	jffs2_free_raw_dirent(rd);</div><div class='ctx'> </div><div class='hunk'>@@ -442,8 +446,8 @@ static int jffs2_symlink (struct user_namespace *mnt_userns, struct inode *dir_i</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> </div><div class='del'>-static int jffs2_mkdir (struct user_namespace *mnt_userns, struct inode *dir_i,</div><div class='del'>-		        struct dentry *dentry, umode_t mode)</div><div class='add'>+static struct dentry *jffs2_mkdir (struct mnt_idmap *idmap, struct inode *dir_i,</div><div class='add'>+				   struct dentry *dentry, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct jffs2_inode_info *f, *dir_f;</div><div class='ctx'> 	struct jffs2_sb_info *c;</div><div class='hunk'>@@ -460,7 +464,7 @@ static int jffs2_mkdir (struct user_namespace *mnt_userns, struct inode *dir_i,</div><div class='ctx'> </div><div class='ctx'> 	ri = jffs2_alloc_raw_inode();</div><div class='ctx'> 	if (!ri)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='ctx'> 	c = JFFS2_SB_INFO(dir_i-&gt;i_sb);</div><div class='ctx'> </div><div class='hunk'>@@ -473,7 +477,7 @@ static int jffs2_mkdir (struct user_namespace *mnt_userns, struct inode *dir_i,</div><div class='ctx'> </div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		jffs2_free_raw_inode(ri);</div><div class='del'>-		return ret;</div><div class='add'>+		return ERR_PTR(ret);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	inode = jffs2_new_inode(dir_i, mode, ri);</div><div class='hunk'>@@ -481,7 +485,7 @@ static int jffs2_mkdir (struct user_namespace *mnt_userns, struct inode *dir_i,</div><div class='ctx'> 	if (IS_ERR(inode)) {</div><div class='ctx'> 		jffs2_free_raw_inode(ri);</div><div class='ctx'> 		jffs2_complete_reservation(c);</div><div class='del'>-		return PTR_ERR(inode);</div><div class='add'>+		return ERR_CAST(inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_op = &amp;jffs2_dir_inode_operations;</div><div class='hunk'>@@ -566,7 +570,8 @@ static int jffs2_mkdir (struct user_namespace *mnt_userns, struct inode *dir_i,</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dir_i-&gt;i_mtime = dir_i-&gt;i_ctime = ITIME(je32_to_cpu(rd-&gt;mctime));</div><div class='add'>+	inode_set_mtime_to_ts(dir_i,</div><div class='add'>+			      inode_set_ctime_to_ts(dir_i, ITIME(je32_to_cpu(rd-&gt;mctime))));</div><div class='ctx'> 	inc_nlink(dir_i);</div><div class='ctx'> </div><div class='ctx'> 	jffs2_free_raw_dirent(rd);</div><div class='hunk'>@@ -579,11 +584,11 @@ static int jffs2_mkdir (struct user_namespace *mnt_userns, struct inode *dir_i,</div><div class='ctx'> 	jffs2_complete_reservation(c);</div><div class='ctx'> </div><div class='ctx'> 	d_instantiate_new(dentry, inode);</div><div class='del'>-	return 0;</div><div class='add'>+	return NULL;</div><div class='ctx'> </div><div class='ctx'>  fail:</div><div class='ctx'> 	iget_failed(inode);</div><div class='del'>-	return ret;</div><div class='add'>+	return ERR_PTR(ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int jffs2_rmdir (struct inode *dir_i, struct dentry *dentry)</div><div class='hunk'>@@ -607,14 +612,15 @@ static int jffs2_rmdir (struct inode *dir_i, struct dentry *dentry)</div><div class='ctx'> 	ret = jffs2_do_unlink(c, dir_f, dentry-&gt;d_name.name,</div><div class='ctx'> 			      dentry-&gt;d_name.len, f, now);</div><div class='ctx'> 	if (!ret) {</div><div class='del'>-		dir_i-&gt;i_mtime = dir_i-&gt;i_ctime = ITIME(now);</div><div class='add'>+		inode_set_mtime_to_ts(dir_i,</div><div class='add'>+				      inode_set_ctime_to_ts(dir_i, ITIME(now)));</div><div class='ctx'> 		clear_nlink(d_inode(dentry));</div><div class='ctx'> 		drop_nlink(dir_i);</div><div class='ctx'> 	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int jffs2_mknod (struct user_namespace *mnt_userns, struct inode *dir_i,</div><div class='add'>+static int jffs2_mknod (struct mnt_idmap *idmap, struct inode *dir_i,</div><div class='ctx'> 		        struct dentry *dentry, umode_t mode, dev_t rdev)</div><div class='ctx'> {</div><div class='ctx'> 	struct jffs2_inode_info *f, *dir_f;</div><div class='hunk'>@@ -743,7 +749,8 @@ static int jffs2_mknod (struct user_namespace *mnt_userns, struct inode *dir_i,</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dir_i-&gt;i_mtime = dir_i-&gt;i_ctime = ITIME(je32_to_cpu(rd-&gt;mctime));</div><div class='add'>+	inode_set_mtime_to_ts(dir_i,</div><div class='add'>+			      inode_set_ctime_to_ts(dir_i, ITIME(je32_to_cpu(rd-&gt;mctime))));</div><div class='ctx'> </div><div class='ctx'> 	jffs2_free_raw_dirent(rd);</div><div class='ctx'> </div><div class='hunk'>@@ -762,7 +769,7 @@ static int jffs2_mknod (struct user_namespace *mnt_userns, struct inode *dir_i,</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int jffs2_rename (struct user_namespace *mnt_userns,</div><div class='add'>+static int jffs2_rename (struct mnt_idmap *idmap,</div><div class='ctx'> 			 struct inode *old_dir_i, struct dentry *old_dentry,</div><div class='ctx'> 			 struct inode *new_dir_i, struct dentry *new_dentry,</div><div class='ctx'> 			 unsigned int flags)</div><div class='hunk'>@@ -864,14 +871,18 @@ static int jffs2_rename (struct user_namespace *mnt_userns,</div><div class='ctx'> 		 * caller won't do it on its own since we are returning an error.</div><div class='ctx'> 		 */</div><div class='ctx'> 		d_invalidate(new_dentry);</div><div class='del'>-		new_dir_i-&gt;i_mtime = new_dir_i-&gt;i_ctime = ITIME(now);</div><div class='add'>+		inode_set_mtime_to_ts(new_dir_i,</div><div class='add'>+				      inode_set_ctime_to_ts(new_dir_i, ITIME(now)));</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (d_is_dir(old_dentry))</div><div class='ctx'> 		drop_nlink(old_dir_i);</div><div class='ctx'> </div><div class='del'>-	new_dir_i-&gt;i_mtime = new_dir_i-&gt;i_ctime = old_dir_i-&gt;i_mtime = old_dir_i-&gt;i_ctime = ITIME(now);</div><div class='add'>+	inode_set_mtime_to_ts(old_dir_i,</div><div class='add'>+			      inode_set_ctime_to_ts(old_dir_i, ITIME(now)));</div><div class='add'>+	inode_set_mtime_to_ts(new_dir_i,</div><div class='add'>+			      inode_set_ctime_to_ts(new_dir_i, ITIME(now)));</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/jffs2/erase.c b/fs/jffs2/erase.c<br/>index 7e9abdb89712..fda9f4d6093f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/erase.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/erase.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/erase.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/erase.c</a></div><div class='hunk'>@@ -43,9 +43,9 @@ static void jffs2_erase_block(struct jffs2_sb_info *c,</div><div class='ctx'> 	jffs2_dbg(1, "%s(): erase block %#08x (range %#08x-%#08x)\n",</div><div class='ctx'> 		  __func__,</div><div class='ctx'> 		  jeb-&gt;offset, jeb-&gt;offset, jeb-&gt;offset + c-&gt;sector_size);</div><div class='del'>-	instr = kmalloc(sizeof(struct erase_info), GFP_KERNEL);</div><div class='add'>+	instr = kzalloc(sizeof(struct erase_info), GFP_KERNEL);</div><div class='ctx'> 	if (!instr) {</div><div class='del'>-		pr_warn("kmalloc for struct erase_info in jffs2_erase_block failed. Refiling block for later\n");</div><div class='add'>+		pr_warn("kzalloc for struct erase_info in jffs2_erase_block failed. Refiling block for later\n");</div><div class='ctx'> 		mutex_lock(&amp;c-&gt;erase_free_sem);</div><div class='ctx'> 		spin_lock(&amp;c-&gt;erase_completion_lock);</div><div class='ctx'> 		list_move(&amp;jeb-&gt;list, &amp;c-&gt;erase_pending_list);</div><div class='hunk'>@@ -57,8 +57,6 @@ static void jffs2_erase_block(struct jffs2_sb_info *c,</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	memset(instr, 0, sizeof(*instr));</div><div class='del'>-</div><div class='ctx'> 	instr-&gt;addr = jeb-&gt;offset;</div><div class='ctx'> 	instr-&gt;len = c-&gt;sector_size;</div><div class='ctx'> </div><div class='hunk'>@@ -340,10 +338,9 @@ static int jffs2_block_check_erase(struct jffs2_sb_info *c, struct jffs2_erasebl</div><div class='ctx'> 		} while(--retlen);</div><div class='ctx'> 		mtd_unpoint(c-&gt;mtd, jeb-&gt;offset, c-&gt;sector_size);</div><div class='ctx'> 		if (retlen) {</div><div class='del'>-			pr_warn("Newly-erased block contained word 0x%lx at offset 0x%08tx\n",</div><div class='del'>-				*wordebuf,</div><div class='del'>-				jeb-&gt;offset +</div><div class='del'>-				c-&gt;sector_size-retlen * sizeof(*wordebuf));</div><div class='add'>+			*bad_offset = jeb-&gt;offset + c-&gt;sector_size - retlen * sizeof(*wordebuf);</div><div class='add'>+			pr_warn("Newly-erased block contained word 0x%lx at offset 0x%08x\n",</div><div class='add'>+				*wordebuf, *bad_offset);</div><div class='ctx'> 			return -EIO;</div><div class='ctx'> 		}</div><div class='ctx'> 		return 0;</div><div class='hunk'>@@ -428,7 +425,9 @@ static void jffs2_mark_erased_block(struct jffs2_sb_info *c, struct jffs2_eraseb</div><div class='ctx'> 			.totlen =	cpu_to_je32(c-&gt;cleanmarker_size)</div><div class='ctx'> 		};</div><div class='ctx'> </div><div class='del'>-		jffs2_prealloc_raw_node_refs(c, jeb, 1);</div><div class='add'>+		ret = jffs2_prealloc_raw_node_refs(c, jeb, 1);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto filebad;</div><div class='ctx'> </div><div class='ctx'> 		marker.hdr_crc = cpu_to_je32(crc32(0, &amp;marker, sizeof(struct jffs2_unknown_node)-4));</div><div class='ctx'> </div><div class='head'>diff --git a/fs/jffs2/file.c b/fs/jffs2/file.c<br/>index 4fc8cd698d1a..b697f3c259ef 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/file.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/file.c</a></div><div class='hunk'>@@ -21,13 +21,15 @@</div><div class='ctx'> #include &lt;linux/jffs2.h&gt;</div><div class='ctx'> #include "nodelist.h"</div><div class='ctx'> </div><div class='del'>-static int jffs2_write_end(struct file *filp, struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned copied,</div><div class='del'>-			struct page *pg, void *fsdata);</div><div class='del'>-static int jffs2_write_begin(struct file *filp, struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned flags,</div><div class='del'>-			struct page **pagep, void **fsdata);</div><div class='del'>-static int jffs2_readpage (struct file *filp, struct page *pg);</div><div class='add'>+static int jffs2_write_end(const struct kiocb *iocb,</div><div class='add'>+			   struct address_space *mapping,</div><div class='add'>+			   loff_t pos, unsigned len, unsigned copied,</div><div class='add'>+			   struct folio *folio, void *fsdata);</div><div class='add'>+static int jffs2_write_begin(const struct kiocb *iocb,</div><div class='add'>+			     struct address_space *mapping,</div><div class='add'>+			     loff_t pos, unsigned len,</div><div class='add'>+			     struct folio **foliop, void **fsdata);</div><div class='add'>+static int jffs2_read_folio(struct file *filp, struct folio *folio);</div><div class='ctx'> </div><div class='ctx'> int jffs2_fsync(struct file *filp, loff_t start, loff_t end, int datasync)</div><div class='ctx'> {</div><div class='hunk'>@@ -54,9 +56,9 @@ const struct file_operations jffs2_file_operations =</div><div class='ctx'>  	.read_iter =	generic_file_read_iter,</div><div class='ctx'>  	.write_iter =	generic_file_write_iter,</div><div class='ctx'> 	.unlocked_ioctl=jffs2_ioctl,</div><div class='del'>-	.mmap =		generic_file_readonly_mmap,</div><div class='add'>+	.mmap_prepare =	generic_file_readonly_mmap_prepare,</div><div class='ctx'> 	.fsync =	jffs2_fsync,</div><div class='del'>-	.splice_read =	generic_file_splice_read,</div><div class='add'>+	.splice_read =	filemap_splice_read,</div><div class='ctx'> 	.splice_write = iter_file_splice_write,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -64,7 +66,7 @@ const struct file_operations jffs2_file_operations =</div><div class='ctx'> </div><div class='ctx'> const struct inode_operations jffs2_file_inode_operations =</div><div class='ctx'> {</div><div class='del'>-	.get_acl =	jffs2_get_acl,</div><div class='add'>+	.get_inode_acl =	jffs2_get_acl,</div><div class='ctx'> 	.set_acl =	jffs2_set_acl,</div><div class='ctx'> 	.setattr =	jffs2_setattr,</div><div class='ctx'> 	.listxattr =	jffs2_listxattr,</div><div class='hunk'>@@ -72,95 +74,82 @@ const struct inode_operations jffs2_file_inode_operations =</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations jffs2_file_address_operations =</div><div class='ctx'> {</div><div class='del'>-	.readpage =	jffs2_readpage,</div><div class='add'>+	.read_folio =	jffs2_read_folio,</div><div class='ctx'> 	.write_begin =	jffs2_write_begin,</div><div class='ctx'> 	.write_end =	jffs2_write_end,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int jffs2_do_readpage_nolock (struct inode *inode, struct page *pg)</div><div class='add'>+static int jffs2_do_readpage_nolock(struct inode *inode, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct jffs2_inode_info *f = JFFS2_INODE_INFO(inode);</div><div class='ctx'> 	struct jffs2_sb_info *c = JFFS2_SB_INFO(inode-&gt;i_sb);</div><div class='del'>-	unsigned char *pg_buf;</div><div class='add'>+	unsigned char *kaddr;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	jffs2_dbg(2, "%s(): ino #%lu, page at offset 0x%lx\n",</div><div class='del'>-		  __func__, inode-&gt;i_ino, pg-&gt;index &lt;&lt; PAGE_SHIFT);</div><div class='add'>+		  __func__, inode-&gt;i_ino, folio-&gt;index &lt;&lt; PAGE_SHIFT);</div><div class='ctx'> </div><div class='del'>-	BUG_ON(!PageLocked(pg));</div><div class='add'>+	BUG_ON(!folio_test_locked(folio));</div><div class='ctx'> </div><div class='del'>-	pg_buf = kmap(pg);</div><div class='del'>-	/* FIXME: Can kmap fail? */</div><div class='del'>-</div><div class='del'>-	ret = jffs2_read_inode_range(c, f, pg_buf, pg-&gt;index &lt;&lt; PAGE_SHIFT,</div><div class='add'>+	kaddr = kmap_local_folio(folio, 0);</div><div class='add'>+	ret = jffs2_read_inode_range(c, f, kaddr, folio-&gt;index &lt;&lt; PAGE_SHIFT,</div><div class='ctx'> 				     PAGE_SIZE);</div><div class='add'>+	kunmap_local(kaddr);</div><div class='ctx'> </div><div class='del'>-	if (ret) {</div><div class='del'>-		ClearPageUptodate(pg);</div><div class='del'>-		SetPageError(pg);</div><div class='del'>-	} else {</div><div class='del'>-		SetPageUptodate(pg);</div><div class='del'>-		ClearPageError(pg);</div><div class='del'>-	}</div><div class='add'>+	if (!ret)</div><div class='add'>+		folio_mark_uptodate(folio);</div><div class='ctx'> </div><div class='del'>-	flush_dcache_page(pg);</div><div class='del'>-	kunmap(pg);</div><div class='add'>+	flush_dcache_folio(folio);</div><div class='ctx'> </div><div class='ctx'> 	jffs2_dbg(2, "readpage finished\n");</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int jffs2_do_readpage_unlock(void *data, struct page *pg)</div><div class='add'>+int __jffs2_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	int ret = jffs2_do_readpage_nolock(data, pg);</div><div class='del'>-	unlock_page(pg);</div><div class='add'>+	int ret = jffs2_do_readpage_nolock(folio-&gt;mapping-&gt;host, folio);</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-</div><div class='del'>-static int jffs2_readpage (struct file *filp, struct page *pg)</div><div class='add'>+static int jffs2_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct jffs2_inode_info *f = JFFS2_INODE_INFO(pg-&gt;mapping-&gt;host);</div><div class='add'>+	struct jffs2_inode_info *f = JFFS2_INODE_INFO(folio-&gt;mapping-&gt;host);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;f-&gt;sem);</div><div class='del'>-	ret = jffs2_do_readpage_unlock(pg-&gt;mapping-&gt;host, pg);</div><div class='add'>+	ret = __jffs2_read_folio(file, folio);</div><div class='ctx'> 	mutex_unlock(&amp;f-&gt;sem);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int jffs2_write_begin(struct file *filp, struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned flags,</div><div class='del'>-			struct page **pagep, void **fsdata)</div><div class='add'>+static int jffs2_write_begin(const struct kiocb *iocb,</div><div class='add'>+			     struct address_space *mapping,</div><div class='add'>+			     loff_t pos, unsigned len,</div><div class='add'>+			     struct folio **foliop, void **fsdata)</div><div class='ctx'> {</div><div class='del'>-	struct page *pg;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	struct inode *inode = mapping-&gt;host;</div><div class='ctx'> 	struct jffs2_inode_info *f = JFFS2_INODE_INFO(inode);</div><div class='add'>+	struct jffs2_sb_info *c = JFFS2_SB_INFO(inode-&gt;i_sb);</div><div class='ctx'> 	pgoff_t index = pos &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	uint32_t pageofs = index &lt;&lt; PAGE_SHIFT;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	pg = grab_cache_page_write_begin(mapping, index, flags);</div><div class='del'>-	if (!pg)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	*pagep = pg;</div><div class='del'>-</div><div class='ctx'> 	jffs2_dbg(1, "%s()\n", __func__);</div><div class='ctx'> </div><div class='del'>-	if (pageofs &gt; inode-&gt;i_size) {</div><div class='del'>-		/* Make new hole frag from old EOF to new page */</div><div class='del'>-		struct jffs2_sb_info *c = JFFS2_SB_INFO(inode-&gt;i_sb);</div><div class='add'>+	if (pos &gt; inode-&gt;i_size) {</div><div class='add'>+		/* Make new hole frag from old EOF to new position */</div><div class='ctx'> 		struct jffs2_raw_inode ri;</div><div class='ctx'> 		struct jffs2_full_dnode *fn;</div><div class='ctx'> 		uint32_t alloc_len;</div><div class='ctx'> </div><div class='del'>-		jffs2_dbg(1, "Writing new hole frag 0x%x-0x%x between current EOF and new page\n",</div><div class='del'>-			  (unsigned int)inode-&gt;i_size, pageofs);</div><div class='add'>+		jffs2_dbg(1, "Writing new hole frag 0x%x-0x%x between current EOF and new position\n",</div><div class='add'>+			  (unsigned int)inode-&gt;i_size, (uint32_t)pos);</div><div class='ctx'> </div><div class='ctx'> 		ret = jffs2_reserve_space(c, sizeof(ri), &amp;alloc_len,</div><div class='ctx'> 					  ALLOC_NORMAL, JFFS2_SUMMARY_INODE_SIZE);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			goto out_page;</div><div class='add'>+			goto out_err;</div><div class='ctx'> </div><div class='ctx'> 		mutex_lock(&amp;f-&gt;sem);</div><div class='ctx'> 		memset(&amp;ri, 0, sizeof(ri));</div><div class='hunk'>@@ -175,10 +164,10 @@ static int jffs2_write_begin(struct file *filp, struct address_space *mapping,</div><div class='ctx'> 		ri.mode = cpu_to_jemode(inode-&gt;i_mode);</div><div class='ctx'> 		ri.uid = cpu_to_je16(i_uid_read(inode));</div><div class='ctx'> 		ri.gid = cpu_to_je16(i_gid_read(inode));</div><div class='del'>-		ri.isize = cpu_to_je32(max((uint32_t)inode-&gt;i_size, pageofs));</div><div class='add'>+		ri.isize = cpu_to_je32((uint32_t)pos);</div><div class='ctx'> 		ri.atime = ri.ctime = ri.mtime = cpu_to_je32(JFFS2_NOW());</div><div class='ctx'> 		ri.offset = cpu_to_je32(inode-&gt;i_size);</div><div class='del'>-		ri.dsize = cpu_to_je32(pageofs - inode-&gt;i_size);</div><div class='add'>+		ri.dsize = cpu_to_je32((uint32_t)pos - inode-&gt;i_size);</div><div class='ctx'> 		ri.csize = cpu_to_je32(0);</div><div class='ctx'> 		ri.compr = JFFS2_COMPR_ZERO;</div><div class='ctx'> 		ri.node_crc = cpu_to_je32(crc32(0, &amp;ri, sizeof(ri)-8));</div><div class='hunk'>@@ -190,7 +179,7 @@ static int jffs2_write_begin(struct file *filp, struct address_space *mapping,</div><div class='ctx'> 			ret = PTR_ERR(fn);</div><div class='ctx'> 			jffs2_complete_reservation(c);</div><div class='ctx'> 			mutex_unlock(&amp;f-&gt;sem);</div><div class='del'>-			goto out_page;</div><div class='add'>+			goto out_err;</div><div class='ctx'> 		}</div><div class='ctx'> 		ret = jffs2_add_full_dnode_to_inode(c, f, fn);</div><div class='ctx'> 		if (f-&gt;metadata) {</div><div class='hunk'>@@ -205,37 +194,54 @@ static int jffs2_write_begin(struct file *filp, struct address_space *mapping,</div><div class='ctx'> 			jffs2_free_full_dnode(fn);</div><div class='ctx'> 			jffs2_complete_reservation(c);</div><div class='ctx'> 			mutex_unlock(&amp;f-&gt;sem);</div><div class='del'>-			goto out_page;</div><div class='add'>+			goto out_err;</div><div class='ctx'> 		}</div><div class='ctx'> 		jffs2_complete_reservation(c);</div><div class='del'>-		inode-&gt;i_size = pageofs;</div><div class='add'>+		inode-&gt;i_size = pos;</div><div class='ctx'> 		mutex_unlock(&amp;f-&gt;sem);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Read in the page if it wasn't already present. Cannot optimize away</div><div class='del'>-	 * the whole page write case until jffs2_write_end can handle the</div><div class='add'>+	 * While getting a page and reading data in, lock c-&gt;alloc_sem until</div><div class='add'>+	 * the page is Uptodate. Otherwise GC task may attempt to read the same</div><div class='add'>+	 * page in read_cache_page(), which causes a deadlock.</div><div class='add'>+	 */</div><div class='add'>+	mutex_lock(&amp;c-&gt;alloc_sem);</div><div class='add'>+	folio = __filemap_get_folio(mapping, index, FGP_WRITEBEGIN,</div><div class='add'>+			mapping_gfp_mask(mapping));</div><div class='add'>+	if (IS_ERR(folio)) {</div><div class='add'>+		ret = PTR_ERR(folio);</div><div class='add'>+		goto release_sem;</div><div class='add'>+	}</div><div class='add'>+	*foliop = folio;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Read in the folio if it wasn't already present. Cannot optimize away</div><div class='add'>+	 * the whole folio write case until jffs2_write_end can handle the</div><div class='ctx'> 	 * case of a short-copy.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!PageUptodate(pg)) {</div><div class='add'>+	if (!folio_test_uptodate(folio)) {</div><div class='ctx'> 		mutex_lock(&amp;f-&gt;sem);</div><div class='del'>-		ret = jffs2_do_readpage_nolock(inode, pg);</div><div class='add'>+		ret = jffs2_do_readpage_nolock(inode, folio);</div><div class='ctx'> 		mutex_unlock(&amp;f-&gt;sem);</div><div class='del'>-		if (ret)</div><div class='del'>-			goto out_page;</div><div class='add'>+		if (ret) {</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+			folio_put(folio);</div><div class='add'>+			goto release_sem;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='del'>-	jffs2_dbg(1, "end write_begin(). pg-&gt;flags %lx\n", pg-&gt;flags);</div><div class='del'>-	return ret;</div><div class='add'>+	jffs2_dbg(1, "end write_begin(). folio-&gt;flags %lx\n", folio-&gt;flags.f);</div><div class='ctx'> </div><div class='del'>-out_page:</div><div class='del'>-	unlock_page(pg);</div><div class='del'>-	put_page(pg);</div><div class='add'>+release_sem:</div><div class='add'>+	mutex_unlock(&amp;c-&gt;alloc_sem);</div><div class='add'>+out_err:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int jffs2_write_end(struct file *filp, struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned copied,</div><div class='del'>-			struct page *pg, void *fsdata)</div><div class='add'>+static int jffs2_write_end(const struct kiocb *iocb,</div><div class='add'>+			   struct address_space *mapping,</div><div class='add'>+			   loff_t pos, unsigned len, unsigned copied,</div><div class='add'>+			   struct folio *folio, void *fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	/* Actually commit the write from the page cache page we're looking at.</div><div class='ctx'> 	 * For now, we write the full page out each time. It sucks, but it's simple</div><div class='hunk'>@@ -249,16 +255,17 @@ static int jffs2_write_end(struct file *filp, struct address_space *mapping,</div><div class='ctx'> 	unsigned aligned_start = start &amp; ~3;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	uint32_t writtenlen = 0;</div><div class='add'>+	void *buf;</div><div class='ctx'> </div><div class='del'>-	jffs2_dbg(1, "%s(): ino #%lu, page at 0x%lx, range %d-%d, flags %lx\n",</div><div class='del'>-		  __func__, inode-&gt;i_ino, pg-&gt;index &lt;&lt; PAGE_SHIFT,</div><div class='del'>-		  start, end, pg-&gt;flags);</div><div class='add'>+	jffs2_dbg(1, "%s(): ino #%lu, page at 0x%llx, range %d-%d, flags %lx\n",</div><div class='add'>+		  __func__, inode-&gt;i_ino, folio_pos(folio),</div><div class='add'>+		  start, end, folio-&gt;flags.f);</div><div class='ctx'> </div><div class='ctx'> 	/* We need to avoid deadlock with page_cache_read() in</div><div class='del'>-	   jffs2_garbage_collect_pass(). So the page must be</div><div class='add'>+	   jffs2_garbage_collect_pass(). So the folio must be</div><div class='ctx'> 	   up to date to prevent page_cache_read() from trying</div><div class='ctx'> 	   to re-lock it. */</div><div class='del'>-	BUG_ON(!PageUptodate(pg));</div><div class='add'>+	BUG_ON(!folio_test_uptodate(folio));</div><div class='ctx'> </div><div class='ctx'> 	if (end == PAGE_SIZE) {</div><div class='ctx'> 		/* When writing out the end of a page, write out the</div><div class='hunk'>@@ -273,8 +280,8 @@ static int jffs2_write_end(struct file *filp, struct address_space *mapping,</div><div class='ctx'> 	if (!ri) {</div><div class='ctx'> 		jffs2_dbg(1, "%s(): Allocation of raw inode failed\n",</div><div class='ctx'> 			  __func__);</div><div class='del'>-		unlock_page(pg);</div><div class='del'>-		put_page(pg);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -286,20 +293,14 @@ static int jffs2_write_end(struct file *filp, struct address_space *mapping,</div><div class='ctx'> 	ri-&gt;isize = cpu_to_je32((uint32_t)inode-&gt;i_size);</div><div class='ctx'> 	ri-&gt;atime = ri-&gt;ctime = ri-&gt;mtime = cpu_to_je32(JFFS2_NOW());</div><div class='ctx'> </div><div class='del'>-	/* In 2.4, it was already kmapped by generic_file_write(). Doesn't</div><div class='del'>-	   hurt to do it again. The alternative is ifdefs, which are ugly. */</div><div class='del'>-	kmap(pg);</div><div class='del'>-</div><div class='del'>-	ret = jffs2_write_inode_range(c, f, ri, page_address(pg) + aligned_start,</div><div class='del'>-				      (pg-&gt;index &lt;&lt; PAGE_SHIFT) + aligned_start,</div><div class='add'>+	buf = kmap_local_folio(folio, aligned_start);</div><div class='add'>+	ret = jffs2_write_inode_range(c, f, ri, buf,</div><div class='add'>+				      folio_pos(folio) + aligned_start,</div><div class='ctx'> 				      end - aligned_start, &amp;writtenlen);</div><div class='add'>+	kunmap_local(buf);</div><div class='ctx'> </div><div class='del'>-	kunmap(pg);</div><div class='del'>-</div><div class='del'>-	if (ret) {</div><div class='del'>-		/* There was an error writing. */</div><div class='del'>-		SetPageError(pg);</div><div class='del'>-	}</div><div class='add'>+	if (ret)</div><div class='add'>+		mapping_set_error(mapping, ret);</div><div class='ctx'> </div><div class='ctx'> 	/* Adjust writtenlen for the padding we did, so we don't confuse our caller */</div><div class='ctx'> 	writtenlen -= min(writtenlen, (start - aligned_start));</div><div class='hunk'>@@ -309,7 +310,8 @@ static int jffs2_write_end(struct file *filp, struct address_space *mapping,</div><div class='ctx'> 			inode-&gt;i_size = pos + writtenlen;</div><div class='ctx'> 			inode-&gt;i_blocks = (inode-&gt;i_size + 511) &gt;&gt; 9;</div><div class='ctx'> </div><div class='del'>-			inode-&gt;i_ctime = inode-&gt;i_mtime = ITIME(je32_to_cpu(ri-&gt;ctime));</div><div class='add'>+			inode_set_mtime_to_ts(inode,</div><div class='add'>+					      inode_set_ctime_to_ts(inode, ITIME(je32_to_cpu(ri-&gt;ctime))));</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -321,13 +323,12 @@ static int jffs2_write_end(struct file *filp, struct address_space *mapping,</div><div class='ctx'> 		   it gets reread */</div><div class='ctx'> 		jffs2_dbg(1, "%s(): Not all bytes written. Marking page !uptodate\n",</div><div class='ctx'> 			__func__);</div><div class='del'>-		SetPageError(pg);</div><div class='del'>-		ClearPageUptodate(pg);</div><div class='add'>+		folio_clear_uptodate(folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	jffs2_dbg(1, "%s() returning %d\n",</div><div class='ctx'> 		  __func__, writtenlen &gt; 0 ? writtenlen : ret);</div><div class='del'>-	unlock_page(pg);</div><div class='del'>-	put_page(pg);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> 	return writtenlen &gt; 0 ? writtenlen : ret;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/jffs2/fs.c b/fs/jffs2/fs.c<br/>index 2ac410477c4f..764bba8ba999 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/fs.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/fs.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/fs.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/fs.c</a></div><div class='hunk'>@@ -113,9 +113,9 @@ int jffs2_do_setattr (struct inode *inode, struct iattr *iattr)</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> 	ri-&gt;isize = cpu_to_je32((ivalid &amp; ATTR_SIZE)?iattr-&gt;ia_size:inode-&gt;i_size);</div><div class='del'>-	ri-&gt;atime = cpu_to_je32(I_SEC((ivalid &amp; ATTR_ATIME)?iattr-&gt;ia_atime:inode-&gt;i_atime));</div><div class='del'>-	ri-&gt;mtime = cpu_to_je32(I_SEC((ivalid &amp; ATTR_MTIME)?iattr-&gt;ia_mtime:inode-&gt;i_mtime));</div><div class='del'>-	ri-&gt;ctime = cpu_to_je32(I_SEC((ivalid &amp; ATTR_CTIME)?iattr-&gt;ia_ctime:inode-&gt;i_ctime));</div><div class='add'>+	ri-&gt;atime = cpu_to_je32(I_SEC((ivalid &amp; ATTR_ATIME)?iattr-&gt;ia_atime:inode_get_atime(inode)));</div><div class='add'>+	ri-&gt;mtime = cpu_to_je32(I_SEC((ivalid &amp; ATTR_MTIME)?iattr-&gt;ia_mtime:inode_get_mtime(inode)));</div><div class='add'>+	ri-&gt;ctime = cpu_to_je32(I_SEC((ivalid &amp; ATTR_CTIME)?iattr-&gt;ia_ctime:inode_get_ctime(inode)));</div><div class='ctx'> </div><div class='ctx'> 	ri-&gt;offset = cpu_to_je32(0);</div><div class='ctx'> 	ri-&gt;csize = ri-&gt;dsize = cpu_to_je32(mdatalen);</div><div class='hunk'>@@ -147,9 +147,9 @@ int jffs2_do_setattr (struct inode *inode, struct iattr *iattr)</div><div class='ctx'> 		return PTR_ERR(new_metadata);</div><div class='ctx'> 	}</div><div class='ctx'> 	/* It worked. Update the inode */</div><div class='del'>-	inode-&gt;i_atime = ITIME(je32_to_cpu(ri-&gt;atime));</div><div class='del'>-	inode-&gt;i_ctime = ITIME(je32_to_cpu(ri-&gt;ctime));</div><div class='del'>-	inode-&gt;i_mtime = ITIME(je32_to_cpu(ri-&gt;mtime));</div><div class='add'>+	inode_set_atime_to_ts(inode, ITIME(je32_to_cpu(ri-&gt;atime)));</div><div class='add'>+	inode_set_ctime_to_ts(inode, ITIME(je32_to_cpu(ri-&gt;ctime)));</div><div class='add'>+	inode_set_mtime_to_ts(inode, ITIME(je32_to_cpu(ri-&gt;mtime)));</div><div class='ctx'> 	inode-&gt;i_mode = jemode_to_cpu(ri-&gt;mode);</div><div class='ctx'> 	i_uid_write(inode, je16_to_cpu(ri-&gt;uid));</div><div class='ctx'> 	i_gid_write(inode, je16_to_cpu(ri-&gt;gid));</div><div class='hunk'>@@ -178,7 +178,7 @@ int jffs2_do_setattr (struct inode *inode, struct iattr *iattr)</div><div class='ctx'> 	jffs2_complete_reservation(c);</div><div class='ctx'> </div><div class='ctx'> 	/* We have to do the truncate_setsize() without f-&gt;sem held, since</div><div class='del'>-	   some pages may be locked and waiting for it in readpage().</div><div class='add'>+	   some pages may be locked and waiting for it in read_folio().</div><div class='ctx'> 	   We are protected from a simultaneous write() extending i_size</div><div class='ctx'> 	   back past iattr-&gt;ia_size, because do_truncate() holds the</div><div class='ctx'> 	   generic inode semaphore. */</div><div class='hunk'>@@ -190,19 +190,19 @@ int jffs2_do_setattr (struct inode *inode, struct iattr *iattr)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int jffs2_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='add'>+int jffs2_setattr(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		  struct iattr *iattr)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	int rc;</div><div class='ctx'> </div><div class='del'>-	rc = setattr_prepare(&amp;init_user_ns, dentry, iattr);</div><div class='add'>+	rc = setattr_prepare(&amp;nop_mnt_idmap, dentry, iattr);</div><div class='ctx'> 	if (rc)</div><div class='ctx'> 		return rc;</div><div class='ctx'> </div><div class='ctx'> 	rc = jffs2_do_setattr(inode, iattr);</div><div class='ctx'> 	if (!rc &amp;&amp; (iattr-&gt;ia_valid &amp; ATTR_MODE))</div><div class='del'>-		rc = posix_acl_chmod(&amp;init_user_ns, inode, inode-&gt;i_mode);</div><div class='add'>+		rc = posix_acl_chmod(&amp;nop_mnt_idmap, dentry, inode-&gt;i_mode);</div><div class='ctx'> </div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='hunk'>@@ -265,7 +265,7 @@ struct inode *jffs2_iget(struct super_block *sb, unsigned long ino)</div><div class='ctx'> 	inode = iget_locked(sb, ino);</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='del'>-	if (!(inode-&gt;i_state &amp; I_NEW))</div><div class='add'>+	if (!(inode_state_read_once(inode) &amp; I_NEW))</div><div class='ctx'> 		return inode;</div><div class='ctx'> </div><div class='ctx'> 	f = JFFS2_INODE_INFO(inode);</div><div class='hunk'>@@ -282,9 +282,9 @@ struct inode *jffs2_iget(struct super_block *sb, unsigned long ino)</div><div class='ctx'> 	i_uid_write(inode, je16_to_cpu(latest_node.uid));</div><div class='ctx'> 	i_gid_write(inode, je16_to_cpu(latest_node.gid));</div><div class='ctx'> 	inode-&gt;i_size = je32_to_cpu(latest_node.isize);</div><div class='del'>-	inode-&gt;i_atime = ITIME(je32_to_cpu(latest_node.atime));</div><div class='del'>-	inode-&gt;i_mtime = ITIME(je32_to_cpu(latest_node.mtime));</div><div class='del'>-	inode-&gt;i_ctime = ITIME(je32_to_cpu(latest_node.ctime));</div><div class='add'>+	inode_set_atime_to_ts(inode, ITIME(je32_to_cpu(latest_node.atime)));</div><div class='add'>+	inode_set_mtime_to_ts(inode, ITIME(je32_to_cpu(latest_node.mtime)));</div><div class='add'>+	inode_set_ctime_to_ts(inode, ITIME(je32_to_cpu(latest_node.ctime)));</div><div class='ctx'> </div><div class='ctx'> 	set_nlink(inode, f-&gt;inocache-&gt;pino_nlink);</div><div class='ctx'> </div><div class='hunk'>@@ -373,7 +373,7 @@ void jffs2_dirty_inode(struct inode *inode, int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct iattr iattr;</div><div class='ctx'> </div><div class='del'>-	if (!(inode-&gt;i_state &amp; I_DIRTY_DATASYNC)) {</div><div class='add'>+	if (!(inode_state_read_once(inode) &amp; I_DIRTY_DATASYNC)) {</div><div class='ctx'> 		jffs2_dbg(2, "%s(): not calling setattr() for ino #%lu\n",</div><div class='ctx'> 			  __func__, inode-&gt;i_ino);</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -386,9 +386,9 @@ void jffs2_dirty_inode(struct inode *inode, int flags)</div><div class='ctx'> 	iattr.ia_mode = inode-&gt;i_mode;</div><div class='ctx'> 	iattr.ia_uid = inode-&gt;i_uid;</div><div class='ctx'> 	iattr.ia_gid = inode-&gt;i_gid;</div><div class='del'>-	iattr.ia_atime = inode-&gt;i_atime;</div><div class='del'>-	iattr.ia_mtime = inode-&gt;i_mtime;</div><div class='del'>-	iattr.ia_ctime = inode-&gt;i_ctime;</div><div class='add'>+	iattr.ia_atime = inode_get_atime(inode);</div><div class='add'>+	iattr.ia_mtime = inode_get_mtime(inode);</div><div class='add'>+	iattr.ia_ctime = inode_get_ctime(inode);</div><div class='ctx'> </div><div class='ctx'> 	jffs2_do_setattr(inode, &amp;iattr);</div><div class='ctx'> }</div><div class='hunk'>@@ -403,7 +403,7 @@ int jffs2_do_remount_fs(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> 	/* We stop if it was running, then restart if it needs to.</div><div class='ctx'> 	   This also catches the case where it was stopped and this</div><div class='ctx'> 	   is just a remount to restart it.</div><div class='del'>-	   Flush the writebuffer, if neccecary, else we loose it */</div><div class='add'>+	   Flush the writebuffer, if necessary, else we loose it */</div><div class='ctx'> 	if (!sb_rdonly(sb)) {</div><div class='ctx'> 		jffs2_stop_garbage_collect_thread(c);</div><div class='ctx'> 		mutex_lock(&amp;c-&gt;alloc_sem);</div><div class='hunk'>@@ -475,8 +475,8 @@ struct inode *jffs2_new_inode (struct inode *dir_i, umode_t mode, struct jffs2_r</div><div class='ctx'> 	inode-&gt;i_mode = jemode_to_cpu(ri-&gt;mode);</div><div class='ctx'> 	i_gid_write(inode, je16_to_cpu(ri-&gt;gid));</div><div class='ctx'> 	i_uid_write(inode, je16_to_cpu(ri-&gt;uid));</div><div class='del'>-	inode-&gt;i_atime = inode-&gt;i_ctime = inode-&gt;i_mtime = current_time(inode);</div><div class='del'>-	ri-&gt;atime = ri-&gt;mtime = ri-&gt;ctime = cpu_to_je32(I_SEC(inode-&gt;i_mtime));</div><div class='add'>+	simple_inode_init_ts(inode);</div><div class='add'>+	ri-&gt;atime = ri-&gt;mtime = ri-&gt;ctime = cpu_to_je32(I_SEC(inode_get_mtime(inode)));</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_blocks = 0;</div><div class='ctx'> 	inode-&gt;i_size = 0;</div><div class='hunk'>@@ -603,8 +603,9 @@ out_root:</div><div class='ctx'> 	jffs2_free_ino_caches(c);</div><div class='ctx'> 	jffs2_free_raw_node_refs(c);</div><div class='ctx'> 	kvfree(c-&gt;blocks);</div><div class='del'>- out_inohash:</div><div class='ctx'> 	jffs2_clear_xattr_subsystem(c);</div><div class='add'>+	jffs2_sum_exit(c);</div><div class='add'>+ out_inohash:</div><div class='ctx'> 	kfree(c-&gt;inocache_list);</div><div class='ctx'>  out_wbuf:</div><div class='ctx'> 	jffs2_flash_cleanup(c);</div><div class='head'>diff --git a/fs/jffs2/gc.c b/fs/jffs2/gc.c<br/>index 373b3b7c9f44..1b833bbffcf5 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/gc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/gc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/gc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/gc.c</a></div><div class='hunk'>@@ -82,7 +82,7 @@ again:</div><div class='ctx'> </div><div class='ctx'> 		nextlist = &amp;c-&gt;erasable_list;</div><div class='ctx'> 	} else if (!list_empty(&amp;c-&gt;erasable_pending_wbuf_list)) {</div><div class='del'>-		/* There are blocks are wating for the wbuf sync */</div><div class='add'>+		/* There are blocks are waiting for the wbuf sync */</div><div class='ctx'> 		jffs2_dbg(1, "Synching wbuf in order to reuse erasable_pending_wbuf_list blocks\n");</div><div class='ctx'> 		spin_unlock(&amp;c-&gt;erase_completion_lock);</div><div class='ctx'> 		jffs2_flush_wbuf_pad(c);</div><div class='hunk'>@@ -1171,7 +1171,7 @@ static int jffs2_garbage_collect_dnode(struct jffs2_sb_info *c, struct jffs2_era</div><div class='ctx'> 	uint32_t alloclen, offset, orig_end, orig_start;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> 	unsigned char *comprbuf = NULL, *writebuf;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	unsigned char *pg_ptr;</div><div class='ctx'> </div><div class='ctx'> 	memset(&amp;ri, 0, sizeof(ri));</div><div class='hunk'>@@ -1317,25 +1317,25 @@ static int jffs2_garbage_collect_dnode(struct jffs2_sb_info *c, struct jffs2_era</div><div class='ctx'> 		BUG_ON(start &gt; orig_start);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* The rules state that we must obtain the page lock *before* f-&gt;sem, so</div><div class='add'>+	/* The rules state that we must obtain the folio lock *before* f-&gt;sem, so</div><div class='ctx'> 	 * drop f-&gt;sem temporarily. Since we also hold c-&gt;alloc_sem, nothing's</div><div class='ctx'> 	 * actually going to *change* so we're safe; we only allow reading.</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * It is important to note that jffs2_write_begin() will ensure that its</div><div class='del'>-	 * page is marked Uptodate before allocating space. That means that if we</div><div class='del'>-	 * end up here trying to GC the *same* page that jffs2_write_begin() is</div><div class='del'>-	 * trying to write out, read_cache_page() will not deadlock. */</div><div class='add'>+	 * folio is marked uptodate before allocating space. That means that if we</div><div class='add'>+	 * end up here trying to GC the *same* folio that jffs2_write_begin() is</div><div class='add'>+	 * trying to write out, read_cache_folio() will not deadlock. */</div><div class='ctx'> 	mutex_unlock(&amp;f-&gt;sem);</div><div class='del'>-	page = read_cache_page(inode-&gt;i_mapping, start &gt;&gt; PAGE_SHIFT,</div><div class='del'>-			       jffs2_do_readpage_unlock, inode);</div><div class='del'>-	if (IS_ERR(page)) {</div><div class='del'>-		pr_warn("read_cache_page() returned error: %ld\n",</div><div class='del'>-			PTR_ERR(page));</div><div class='add'>+	folio = read_cache_folio(inode-&gt;i_mapping, start &gt;&gt; PAGE_SHIFT,</div><div class='add'>+			       __jffs2_read_folio, NULL);</div><div class='add'>+	if (IS_ERR(folio)) {</div><div class='add'>+		pr_warn("read_cache_folio() returned error: %ld\n",</div><div class='add'>+			PTR_ERR(folio));</div><div class='ctx'> 		mutex_lock(&amp;f-&gt;sem);</div><div class='del'>-		return PTR_ERR(page);</div><div class='add'>+		return PTR_ERR(folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	pg_ptr = kmap(page);</div><div class='add'>+	pg_ptr = kmap_local_folio(folio, 0);</div><div class='ctx'> 	mutex_lock(&amp;f-&gt;sem);</div><div class='ctx'> </div><div class='ctx'> 	offset = start;</div><div class='hunk'>@@ -1400,7 +1400,6 @@ static int jffs2_garbage_collect_dnode(struct jffs2_sb_info *c, struct jffs2_era</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	kunmap(page);</div><div class='del'>-	put_page(page);</div><div class='add'>+	folio_release_kmap(folio, pg_ptr);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/jffs2/jffs2_fs_i.h b/fs/jffs2/jffs2_fs_i.h<br/>index 2e4a86763c07..93a2951538ce 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/jffs2_fs_i.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/jffs2_fs_i.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/jffs2_fs_i.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/jffs2_fs_i.h</a></div><div class='hunk'>@@ -18,11 +18,11 @@</div><div class='ctx'> #include &lt;linux/mutex.h&gt;</div><div class='ctx'> </div><div class='ctx'> struct jffs2_inode_info {</div><div class='del'>-	/* We need an internal mutex similar to inode-&gt;i_mutex.</div><div class='add'>+	/* We need an internal mutex similar to inode-&gt;i_rwsem.</div><div class='ctx'> 	   Unfortunately, we can't used the existing one, because</div><div class='ctx'> 	   either the GC would deadlock, or we'd have to release it</div><div class='ctx'> 	   before letting GC proceed. Or we'd have to put ugliness</div><div class='del'>-	   into the GC code so it didn't attempt to obtain the i_mutex</div><div class='add'>+	   into the GC code so it didn't attempt to obtain the i_rwsem</div><div class='ctx'> 	   for the inode(s) which are already locked */</div><div class='ctx'> 	struct mutex sem;</div><div class='ctx'> </div><div class='head'>diff --git a/fs/jffs2/malloc.c b/fs/jffs2/malloc.c<br/>index ce1189793288..411de8b361b2 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/malloc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/malloc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/malloc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/malloc.c</a></div><div class='hunk'>@@ -33,27 +33,19 @@ static struct kmem_cache *xattr_ref_cache;</div><div class='ctx'> </div><div class='ctx'> int __init jffs2_create_slab_caches(void)</div><div class='ctx'> {</div><div class='del'>-	full_dnode_slab = kmem_cache_create("jffs2_full_dnode",</div><div class='del'>-					    sizeof(struct jffs2_full_dnode),</div><div class='del'>-					    0, 0, NULL);</div><div class='add'>+	full_dnode_slab = KMEM_CACHE(jffs2_full_dnode, 0);</div><div class='ctx'> 	if (!full_dnode_slab)</div><div class='ctx'> 		goto err;</div><div class='ctx'> </div><div class='del'>-	raw_dirent_slab = kmem_cache_create("jffs2_raw_dirent",</div><div class='del'>-					    sizeof(struct jffs2_raw_dirent),</div><div class='del'>-					    0, SLAB_HWCACHE_ALIGN, NULL);</div><div class='add'>+	raw_dirent_slab = KMEM_CACHE(jffs2_raw_dirent, SLAB_HWCACHE_ALIGN);</div><div class='ctx'> 	if (!raw_dirent_slab)</div><div class='ctx'> 		goto err;</div><div class='ctx'> </div><div class='del'>-	raw_inode_slab = kmem_cache_create("jffs2_raw_inode",</div><div class='del'>-					   sizeof(struct jffs2_raw_inode),</div><div class='del'>-					   0, SLAB_HWCACHE_ALIGN, NULL);</div><div class='add'>+	raw_inode_slab = KMEM_CACHE(jffs2_raw_inode, SLAB_HWCACHE_ALIGN);</div><div class='ctx'> 	if (!raw_inode_slab)</div><div class='ctx'> 		goto err;</div><div class='ctx'> </div><div class='del'>-	tmp_dnode_info_slab = kmem_cache_create("jffs2_tmp_dnode",</div><div class='del'>-						sizeof(struct jffs2_tmp_dnode_info),</div><div class='del'>-						0, 0, NULL);</div><div class='add'>+	tmp_dnode_info_slab = KMEM_CACHE(jffs2_tmp_dnode_info, 0);</div><div class='ctx'> 	if (!tmp_dnode_info_slab)</div><div class='ctx'> 		goto err;</div><div class='ctx'> </div><div class='hunk'>@@ -63,28 +55,20 @@ int __init jffs2_create_slab_caches(void)</div><div class='ctx'> 	if (!raw_node_ref_slab)</div><div class='ctx'> 		goto err;</div><div class='ctx'> </div><div class='del'>-	node_frag_slab = kmem_cache_create("jffs2_node_frag",</div><div class='del'>-					   sizeof(struct jffs2_node_frag),</div><div class='del'>-					   0, 0, NULL);</div><div class='add'>+	node_frag_slab = KMEM_CACHE(jffs2_node_frag, 0);</div><div class='ctx'> 	if (!node_frag_slab)</div><div class='ctx'> 		goto err;</div><div class='ctx'> </div><div class='del'>-	inode_cache_slab = kmem_cache_create("jffs2_inode_cache",</div><div class='del'>-					     sizeof(struct jffs2_inode_cache),</div><div class='del'>-					     0, 0, NULL);</div><div class='add'>+	inode_cache_slab = KMEM_CACHE(jffs2_inode_cache, 0);</div><div class='ctx'> 	if (!inode_cache_slab)</div><div class='ctx'> 		goto err;</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_JFFS2_FS_XATTR</div><div class='del'>-	xattr_datum_cache = kmem_cache_create("jffs2_xattr_datum",</div><div class='del'>-					     sizeof(struct jffs2_xattr_datum),</div><div class='del'>-					     0, 0, NULL);</div><div class='add'>+	xattr_datum_cache = KMEM_CACHE(jffs2_xattr_datum, 0);</div><div class='ctx'> 	if (!xattr_datum_cache)</div><div class='ctx'> 		goto err;</div><div class='ctx'> </div><div class='del'>-	xattr_ref_cache = kmem_cache_create("jffs2_xattr_ref",</div><div class='del'>-					   sizeof(struct jffs2_xattr_ref),</div><div class='del'>-					   0, 0, NULL);</div><div class='add'>+	xattr_ref_cache = KMEM_CACHE(jffs2_xattr_ref, 0);</div><div class='ctx'> 	if (!xattr_ref_cache)</div><div class='ctx'> 		goto err;</div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/jffs2/nodemgmt.c b/fs/jffs2/nodemgmt.c<br/>index a7bbe879cfc3..3fb9f9807b66 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/nodemgmt.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/nodemgmt.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/nodemgmt.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/nodemgmt.c</a></div><div class='hunk'>@@ -15,6 +15,7 @@</div><div class='ctx'> #include &lt;linux/mtd/mtd.h&gt;</div><div class='ctx'> #include &lt;linux/compiler.h&gt;</div><div class='ctx'> #include &lt;linux/sched/signal.h&gt;</div><div class='add'>+#include &lt;linux/string_choices.h&gt;</div><div class='ctx'> #include "nodelist.h"</div><div class='ctx'> #include "debug.h"</div><div class='ctx'> </div><div class='hunk'>@@ -49,28 +50,31 @@ static int jffs2_rp_can_write(struct jffs2_sb_info *c)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int jffs2_do_reserve_space(struct jffs2_sb_info *c,  uint32_t minsize,</div><div class='add'>+				  uint32_t *len, uint32_t sumsize);</div><div class='add'>+</div><div class='ctx'> /**</div><div class='ctx'>  *	jffs2_reserve_space - request physical space to write nodes to flash</div><div class='ctx'>  *	@c: superblock info</div><div class='ctx'>  *	@minsize: Minimum acceptable size of allocation</div><div class='ctx'>  *	@len: Returned value of allocation length</div><div class='ctx'>  *	@prio: Allocation type - ALLOC_{NORMAL,DELETION}</div><div class='add'>+ *	@sumsize: summary size requested or JFFS2_SUMMARY_NOSUM_SIZE for no summary</div><div class='add'>+ *</div><div class='add'>+ *	Requests a block of physical space on the flash.</div><div class='ctx'>  *</div><div class='del'>- *	Requests a block of physical space on the flash. Returns zero for success</div><div class='del'>- *	and puts 'len' into the appropriate place, or returns -ENOSPC or other </div><div class='del'>- *	error if appropriate. Doesn't return len since that's </div><div class='add'>+ *	Returns: %0 for success	and puts 'len' into the appropriate place,</div><div class='add'>+ *	or returns -ENOSPC or other error if appropriate.</div><div class='add'>+ *	Doesn't return len since that's already returned in @len.</div><div class='ctx'>  *</div><div class='del'>- *	If it returns zero, jffs2_reserve_space() also downs the per-filesystem</div><div class='add'>+ *	If it returns %0, jffs2_reserve_space() also downs the per-filesystem</div><div class='ctx'>  *	allocation semaphore, to prevent more than one allocation from being</div><div class='del'>- *	active at any time. The semaphore is later released by jffs2_commit_allocation()</div><div class='add'>+ *	active at any time. The semaphore is later released by jffs2_commit_allocation().</div><div class='ctx'>  *</div><div class='ctx'>  *	jffs2_reserve_space() may trigger garbage collection in order to make room</div><div class='ctx'>  *	for the requested allocation.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static int jffs2_do_reserve_space(struct jffs2_sb_info *c,  uint32_t minsize,</div><div class='del'>-				  uint32_t *len, uint32_t sumsize);</div><div class='del'>-</div><div class='ctx'> int jffs2_reserve_space(struct jffs2_sb_info *c, uint32_t minsize,</div><div class='ctx'> 			uint32_t *len, int prio, uint32_t sumsize)</div><div class='ctx'> {</div><div class='hunk'>@@ -314,9 +318,9 @@ static int jffs2_find_nextblock(struct jffs2_sb_info *c)</div><div class='ctx'> 			   And there's no space left. At all. */</div><div class='ctx'> 			pr_crit("Argh. No free space left for GC. nr_erasing_blocks is %d. nr_free_blocks is %d. (erasableempty: %s, erasingempty: %s, erasependingempty: %s)\n",</div><div class='ctx'> 				c-&gt;nr_erasing_blocks, c-&gt;nr_free_blocks,</div><div class='del'>-				list_empty(&amp;c-&gt;erasable_list) ? "yes" : "no",</div><div class='del'>-				list_empty(&amp;c-&gt;erasing_list) ? "yes" : "no",</div><div class='del'>-				list_empty(&amp;c-&gt;erase_pending_list) ? "yes" : "no");</div><div class='add'>+				str_yes_no(list_empty(&amp;c-&gt;erasable_list)),</div><div class='add'>+				str_yes_no(list_empty(&amp;c-&gt;erasing_list)),</div><div class='add'>+				str_yes_no(list_empty(&amp;c-&gt;erase_pending_list)));</div><div class='ctx'> 			return -ENOSPC;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -488,13 +492,16 @@ static int jffs2_do_reserve_space(struct jffs2_sb_info *c, uint32_t minsize,</div><div class='ctx'> /**</div><div class='ctx'>  *	jffs2_add_physical_node_ref - add a physical node reference to the list</div><div class='ctx'>  *	@c: superblock info</div><div class='del'>- *	@new: new node reference to add</div><div class='add'>+ *	@ofs: offset in the block</div><div class='ctx'>  *	@len: length of this physical node</div><div class='add'>+ *	@ic: inode cache pointer</div><div class='ctx'>  *</div><div class='ctx'>  *	Should only be used to report nodes for which space has been allocated</div><div class='ctx'>  *	by jffs2_reserve_space.</div><div class='ctx'>  *</div><div class='ctx'>  *	Must be called with the alloc_sem held.</div><div class='add'>+ *</div><div class='add'>+ *	Returns: pointer to new node on success or -errno code on error</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> struct jffs2_raw_node_ref *jffs2_add_physical_node_ref(struct jffs2_sb_info *c,</div><div class='hunk'>@@ -624,8 +631,8 @@ void jffs2_mark_node_obsolete(struct jffs2_sb_info *c, struct jffs2_raw_node_ref</div><div class='ctx'> 					  ref-&gt;flash_offset, jeb-&gt;used_size);</div><div class='ctx'> 			BUG();</div><div class='ctx'> 		})</div><div class='del'>-			jffs2_dbg(1, "Obsoleting previously unchecked node at 0x%08x of len %x\n",</div><div class='del'>-				  ref_offset(ref), freed_len);</div><div class='add'>+		jffs2_dbg(1, "Obsoleting previously unchecked node at 0x%08x of len %x\n",</div><div class='add'>+				ref_offset(ref), freed_len);</div><div class='ctx'> 		jeb-&gt;unchecked_size -= freed_len;</div><div class='ctx'> 		c-&gt;unchecked_size -= freed_len;</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -635,8 +642,8 @@ void jffs2_mark_node_obsolete(struct jffs2_sb_info *c, struct jffs2_raw_node_ref</div><div class='ctx'> 					  ref-&gt;flash_offset, jeb-&gt;used_size);</div><div class='ctx'> 			BUG();</div><div class='ctx'> 		})</div><div class='del'>-			jffs2_dbg(1, "Obsoleting node at 0x%08x of len %#x: ",</div><div class='del'>-				  ref_offset(ref), freed_len);</div><div class='add'>+		jffs2_dbg(1, "Obsoleting node at 0x%08x of len %#x: ",</div><div class='add'>+				ref_offset(ref), freed_len);</div><div class='ctx'> 		jeb-&gt;used_size -= freed_len;</div><div class='ctx'> 		c-&gt;used_size -= freed_len;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -877,7 +884,7 @@ int jffs2_thread_should_wake(struct jffs2_sb_info *c)</div><div class='ctx'> </div><div class='ctx'> 	jffs2_dbg(1, "%s(): nr_free_blocks %d, nr_erasing_blocks %d, dirty_size 0x%x, vdirty_blocks %d: %s\n",</div><div class='ctx'> 		  __func__, c-&gt;nr_free_blocks, c-&gt;nr_erasing_blocks,</div><div class='del'>-		  c-&gt;dirty_size, nr_very_dirty, ret ? "yes" : "no");</div><div class='add'>+		  c-&gt;dirty_size, nr_very_dirty, str_yes_no(ret));</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/jffs2/os-linux.h b/fs/jffs2/os-linux.h<br/>index 173eccac691d..86ab014a349c 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/os-linux.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/os-linux.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/os-linux.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/os-linux.h</a></div><div class='hunk'>@@ -35,9 +35,9 @@ struct kvec;</div><div class='ctx'> #define ITIME(sec) ((struct timespec64){sec, 0})</div><div class='ctx'> #define JFFS2_NOW() JFFS2_CLAMP_TIME(ktime_get_real_seconds())</div><div class='ctx'> #define I_SEC(tv) JFFS2_CLAMP_TIME((tv).tv_sec)</div><div class='del'>-#define JFFS2_F_I_CTIME(f) I_SEC(OFNI_EDONI_2SFFJ(f)-&gt;i_ctime)</div><div class='del'>-#define JFFS2_F_I_MTIME(f) I_SEC(OFNI_EDONI_2SFFJ(f)-&gt;i_mtime)</div><div class='del'>-#define JFFS2_F_I_ATIME(f) I_SEC(OFNI_EDONI_2SFFJ(f)-&gt;i_atime)</div><div class='add'>+#define JFFS2_F_I_CTIME(f) I_SEC(inode_get_ctime(OFNI_EDONI_2SFFJ(f)))</div><div class='add'>+#define JFFS2_F_I_MTIME(f) I_SEC(inode_get_mtime(OFNI_EDONI_2SFFJ(f)))</div><div class='add'>+#define JFFS2_F_I_ATIME(f) I_SEC(inode_get_atime(OFNI_EDONI_2SFFJ(f)))</div><div class='ctx'> #define sleep_on_spinunlock(wq, s)				\</div><div class='ctx'> 	do {							\</div><div class='ctx'> 		DECLARE_WAITQUEUE(__wait, current);		\</div><div class='hunk'>@@ -155,7 +155,7 @@ extern const struct file_operations jffs2_file_operations;</div><div class='ctx'> extern const struct inode_operations jffs2_file_inode_operations;</div><div class='ctx'> extern const struct address_space_operations jffs2_file_address_operations;</div><div class='ctx'> int jffs2_fsync(struct file *, loff_t, loff_t, int);</div><div class='del'>-int jffs2_do_readpage_unlock(void *data, struct page *pg);</div><div class='add'>+int __jffs2_read_folio(struct file *file, struct folio *folio);</div><div class='ctx'> </div><div class='ctx'> /* ioctl.c */</div><div class='ctx'> long jffs2_ioctl(struct file *, unsigned int, unsigned long);</div><div class='hunk'>@@ -164,7 +164,7 @@ long jffs2_ioctl(struct file *, unsigned int, unsigned long);</div><div class='ctx'> extern const struct inode_operations jffs2_symlink_inode_operations;</div><div class='ctx'> </div><div class='ctx'> /* fs.c */</div><div class='del'>-int jffs2_setattr (struct user_namespace *, struct dentry *, struct iattr *);</div><div class='add'>+int jffs2_setattr (struct mnt_idmap *, struct dentry *, struct iattr *);</div><div class='ctx'> int jffs2_do_setattr (struct inode *, struct iattr *);</div><div class='ctx'> struct inode *jffs2_iget(struct super_block *, unsigned long);</div><div class='ctx'> void jffs2_evict_inode (struct inode *);</div><div class='head'>diff --git a/fs/jffs2/readinode.c b/fs/jffs2/readinode.c<br/>index 03b4f99614be..f987f78a894e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/readinode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/readinode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/readinode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/readinode.c</a></div><div class='hunk'>@@ -72,7 +72,7 @@ static int check_node_data(struct jffs2_sb_info *c, struct jffs2_tmp_dnode_info</div><div class='ctx'> 		if (err != -EOPNOTSUPP)</div><div class='ctx'> 			JFFS2_WARNING("MTD point failed: error code %d.\n", err);</div><div class='ctx'> 	} else</div><div class='del'>-		pointed = 1; /* succefully pointed to device */</div><div class='add'>+		pointed = 1; /* successfully pointed to device */</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> 	if (!pointed) {</div><div class='head'>diff --git a/fs/jffs2/scan.c b/fs/jffs2/scan.c<br/>index b676056826be..62879c218d4b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/scan.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/scan.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/scan.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/scan.c</a></div><div class='hunk'>@@ -136,7 +136,7 @@ int jffs2_scan_medium(struct jffs2_sb_info *c)</div><div class='ctx'> 		if (!s) {</div><div class='ctx'> 			JFFS2_WARNING("Can't allocate memory for summary\n");</div><div class='ctx'> 			ret = -ENOMEM;</div><div class='del'>-			goto out;</div><div class='add'>+			goto out_buf;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -256,7 +256,9 @@ int jffs2_scan_medium(struct jffs2_sb_info *c)</div><div class='ctx'> </div><div class='ctx'> 		jffs2_dbg(1, "%s(): Skipping %d bytes in nextblock to ensure page alignment\n",</div><div class='ctx'> 			  __func__, skip);</div><div class='del'>-		jffs2_prealloc_raw_node_refs(c, c-&gt;nextblock, 1);</div><div class='add'>+		ret = jffs2_prealloc_raw_node_refs(c, c-&gt;nextblock, 1);</div><div class='add'>+		if (ret)</div><div class='add'>+			goto out;</div><div class='ctx'> 		jffs2_scan_dirty_space(c, c-&gt;nextblock, skip);</div><div class='ctx'> 	}</div><div class='ctx'> #endif</div><div class='hunk'>@@ -275,13 +277,15 @@ int jffs2_scan_medium(struct jffs2_sb_info *c)</div><div class='ctx'> 	}</div><div class='ctx'> 	ret = 0;</div><div class='ctx'>  out:</div><div class='add'>+	jffs2_sum_reset_collected(s);</div><div class='add'>+	kfree(s);</div><div class='add'>+ out_buf:</div><div class='ctx'> 	if (buf_size)</div><div class='ctx'> 		kfree(flashbuf);</div><div class='ctx'> #ifndef __ECOS</div><div class='ctx'> 	else</div><div class='ctx'> 		mtd_unpoint(c-&gt;mtd, 0, c-&gt;mtd-&gt;size);</div><div class='ctx'> #endif</div><div class='del'>-	kfree(s);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/jffs2/security.c b/fs/jffs2/security.c<br/>index aef5522551db..437f3a2c1b54 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/security.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/security.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/security.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/security.c</a></div><div class='hunk'>@@ -57,7 +57,7 @@ static int jffs2_security_getxattr(const struct xattr_handler *handler,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int jffs2_security_setxattr(const struct xattr_handler *handler,</div><div class='del'>-				   struct user_namespace *mnt_userns,</div><div class='add'>+				   struct mnt_idmap *idmap,</div><div class='ctx'> 				   struct dentry *unused, struct inode *inode,</div><div class='ctx'> 				   const char *name, const void *buffer,</div><div class='ctx'> 				   size_t size, int flags)</div><div class='head'>diff --git a/fs/jffs2/summary.c b/fs/jffs2/summary.c<br/>index 4fe64519870f..d83372d3e1a0 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/summary.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/summary.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/summary.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/summary.c</a></div><div class='hunk'>@@ -858,7 +858,10 @@ int jffs2_sum_write_sumnode(struct jffs2_sb_info *c)</div><div class='ctx'> 	spin_unlock(&amp;c-&gt;erase_completion_lock);</div><div class='ctx'> </div><div class='ctx'> 	jeb = c-&gt;nextblock;</div><div class='del'>-	jffs2_prealloc_raw_node_refs(c, jeb, 1);</div><div class='add'>+	ret = jffs2_prealloc_raw_node_refs(c, jeb, 1);</div><div class='add'>+</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='ctx'> 	if (!c-&gt;summary-&gt;sum_num || !c-&gt;summary-&gt;sum_list_head) {</div><div class='ctx'> 		JFFS2_WARNING("Empty summary info!!!\n");</div><div class='hunk'>@@ -872,6 +875,8 @@ int jffs2_sum_write_sumnode(struct jffs2_sb_info *c)</div><div class='ctx'> 	datasize += padsize;</div><div class='ctx'> </div><div class='ctx'> 	ret = jffs2_sum_write_data(c, jeb, infosize, datasize, padsize);</div><div class='add'>+</div><div class='add'>+out:</div><div class='ctx'> 	spin_lock(&amp;c-&gt;erase_completion_lock);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/jffs2/super.c b/fs/jffs2/super.c<br/>index 81ca58c10b72..4545f885c41e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/super.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/super.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/super.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/super.c</a></div><div class='hunk'>@@ -39,7 +39,7 @@ static struct inode *jffs2_alloc_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct jffs2_inode_info *f;</div><div class='ctx'> </div><div class='del'>-	f = kmem_cache_alloc(jffs2_inode_cachep, GFP_KERNEL);</div><div class='add'>+	f = alloc_inode_sb(sb, jffs2_inode_cachep, GFP_KERNEL);</div><div class='ctx'> 	if (!f)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	return &amp;f-&gt;vfs_inode;</div><div class='hunk'>@@ -58,6 +58,7 @@ static void jffs2_i_init_once(void *foo)</div><div class='ctx'> 	struct jffs2_inode_info *f = foo;</div><div class='ctx'> </div><div class='ctx'> 	mutex_init(&amp;f-&gt;sem);</div><div class='add'>+	f-&gt;target = NULL;</div><div class='ctx'> 	inode_init_once(&amp;f-&gt;vfs_inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -150,6 +151,7 @@ static struct dentry *jffs2_get_parent(struct dentry *child)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct export_operations jffs2_export_ops = {</div><div class='add'>+	.encode_fh = generic_encode_ino32_fh,</div><div class='ctx'> 	.get_parent = jffs2_get_parent,</div><div class='ctx'> 	.fh_to_dentry = jffs2_fh_to_dentry,</div><div class='ctx'> 	.fh_to_parent = jffs2_fh_to_parent,</div><div class='hunk'>@@ -386,7 +388,7 @@ static int __init init_jffs2_fs(void)</div><div class='ctx'> 	jffs2_inode_cachep = kmem_cache_create("jffs2_i",</div><div class='ctx'> 					     sizeof(struct jffs2_inode_info),</div><div class='ctx'> 					     0, (SLAB_RECLAIM_ACCOUNT|</div><div class='del'>-						SLAB_MEM_SPREAD|SLAB_ACCOUNT),</div><div class='add'>+						SLAB_ACCOUNT),</div><div class='ctx'> 					     jffs2_i_init_once);</div><div class='ctx'> 	if (!jffs2_inode_cachep) {</div><div class='ctx'> 		pr_err("error: Failed to initialise inode cache\n");</div><div class='head'>diff --git a/fs/jffs2/wbuf.c b/fs/jffs2/wbuf.c<br/>index c6821a509481..bb815a002984 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/wbuf.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/wbuf.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/wbuf.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/wbuf.c</a></div><div class='hunk'>@@ -584,7 +584,7 @@ static int __jffs2_flush_wbuf(struct jffs2_sb_info *c, int pad)</div><div class='ctx'> 	size_t retlen;</div><div class='ctx'> </div><div class='ctx'> 	/* Nothing to do if not write-buffering the flash. In particular, we shouldn't</div><div class='del'>-	   del_timer() the timer we never initialised. */</div><div class='add'>+	   call timer_delete() on the timer we never initialised. */</div><div class='ctx'> 	if (!jffs2_is_writebuffered(c))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='hunk'>@@ -1035,7 +1035,7 @@ int jffs2_check_oob_empty(struct jffs2_sb_info *c,</div><div class='ctx'> {</div><div class='ctx'> 	int i, ret;</div><div class='ctx'> 	int cmlen = min_t(int, c-&gt;oobavail, OOB_CM_SIZE);</div><div class='del'>-	struct mtd_oob_ops ops;</div><div class='add'>+	struct mtd_oob_ops ops = { };</div><div class='ctx'> </div><div class='ctx'> 	ops.mode = MTD_OPS_AUTO_OOB;</div><div class='ctx'> 	ops.ooblen = NR_OOB_SCAN_PAGES * c-&gt;oobavail;</div><div class='hunk'>@@ -1076,7 +1076,7 @@ int jffs2_check_oob_empty(struct jffs2_sb_info *c,</div><div class='ctx'> int jffs2_check_nand_cleanmarker(struct jffs2_sb_info *c,</div><div class='ctx'> 				 struct jffs2_eraseblock *jeb)</div><div class='ctx'> {</div><div class='del'>-	struct mtd_oob_ops ops;</div><div class='add'>+	struct mtd_oob_ops ops = { };</div><div class='ctx'> 	int ret, cmlen = min_t(int, c-&gt;oobavail, OOB_CM_SIZE);</div><div class='ctx'> </div><div class='ctx'> 	ops.mode = MTD_OPS_AUTO_OOB;</div><div class='hunk'>@@ -1101,7 +1101,7 @@ int jffs2_write_nand_cleanmarker(struct jffs2_sb_info *c,</div><div class='ctx'> 				 struct jffs2_eraseblock *jeb)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='del'>-	struct mtd_oob_ops ops;</div><div class='add'>+	struct mtd_oob_ops ops = { };</div><div class='ctx'> 	int cmlen = min_t(int, c-&gt;oobavail, OOB_CM_SIZE);</div><div class='ctx'> </div><div class='ctx'> 	ops.mode = MTD_OPS_AUTO_OOB;</div><div class='head'>diff --git a/fs/jffs2/xattr.c b/fs/jffs2/xattr.c<br/>index da3e18503c65..defb4162c3d5 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/xattr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/xattr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/xattr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/xattr.c</a></div><div class='hunk'>@@ -772,10 +772,10 @@ void jffs2_clear_xattr_subsystem(struct jffs2_sb_info *c)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #define XREF_TMPHASH_SIZE	(128)</div><div class='del'>-void jffs2_build_xattr_subsystem(struct jffs2_sb_info *c)</div><div class='add'>+int jffs2_build_xattr_subsystem(struct jffs2_sb_info *c)</div><div class='ctx'> {</div><div class='ctx'> 	struct jffs2_xattr_ref *ref, *_ref;</div><div class='del'>-	struct jffs2_xattr_ref *xref_tmphash[XREF_TMPHASH_SIZE];</div><div class='add'>+	struct jffs2_xattr_ref **xref_tmphash;</div><div class='ctx'> 	struct jffs2_xattr_datum *xd, *_xd;</div><div class='ctx'> 	struct jffs2_inode_cache *ic;</div><div class='ctx'> 	struct jffs2_raw_node_ref *raw;</div><div class='hunk'>@@ -784,9 +784,12 @@ void jffs2_build_xattr_subsystem(struct jffs2_sb_info *c)</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(!(c-&gt;flags &amp; JFFS2_SB_FLAG_BUILDING));</div><div class='ctx'> </div><div class='add'>+	xref_tmphash = kcalloc(XREF_TMPHASH_SIZE,</div><div class='add'>+			       sizeof(struct jffs2_xattr_ref *), GFP_KERNEL);</div><div class='add'>+	if (!xref_tmphash)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='ctx'> 	/* Phase.1 : Merge same xref */</div><div class='del'>-	for (i=0; i &lt; XREF_TMPHASH_SIZE; i++)</div><div class='del'>-		xref_tmphash[i] = NULL;</div><div class='ctx'> 	for (ref=c-&gt;xref_temp; ref; ref=_ref) {</div><div class='ctx'> 		struct jffs2_xattr_ref *tmp;</div><div class='ctx'> </div><div class='hunk'>@@ -884,6 +887,8 @@ void jffs2_build_xattr_subsystem(struct jffs2_sb_info *c)</div><div class='ctx'> 		     "%u of xref (%u dead, %u orphan) found.\n",</div><div class='ctx'> 		     xdatum_count, xdatum_unchecked_count, xdatum_orphan_count,</div><div class='ctx'> 		     xref_count, xref_dead_count, xref_orphan_count);</div><div class='add'>+	kfree(xref_tmphash);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct jffs2_xattr_datum *jffs2_setup_xattr_datum(struct jffs2_sb_info *c,</div><div class='hunk'>@@ -915,21 +920,18 @@ struct jffs2_xattr_datum *jffs2_setup_xattr_datum(struct jffs2_sb_info *c,</div><div class='ctx'>  * do_jffs2_setxattr(inode, xprefix, xname, buffer, size, flags)</div><div class='ctx'>  *   is an implementation of setxattr handler on jffs2.</div><div class='ctx'>  * -------------------------------------------------- */</div><div class='del'>-const struct xattr_handler *jffs2_xattr_handlers[] = {</div><div class='add'>+const struct xattr_handler * const jffs2_xattr_handlers[] = {</div><div class='ctx'> 	&amp;jffs2_user_xattr_handler,</div><div class='ctx'> #ifdef CONFIG_JFFS2_FS_SECURITY</div><div class='ctx'> 	&amp;jffs2_security_xattr_handler,</div><div class='ctx'> #endif</div><div class='del'>-#ifdef CONFIG_JFFS2_FS_POSIX_ACL</div><div class='del'>-	&amp;posix_acl_access_xattr_handler,</div><div class='del'>-	&amp;posix_acl_default_xattr_handler,</div><div class='del'>-#endif</div><div class='ctx'> 	&amp;jffs2_trusted_xattr_handler,</div><div class='ctx'> 	NULL</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static const struct xattr_handler *xprefix_to_handler(int xprefix) {</div><div class='del'>-	const struct xattr_handler *ret;</div><div class='add'>+static const char *jffs2_xattr_prefix(int xprefix, struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	const struct xattr_handler *ret = NULL;</div><div class='ctx'> </div><div class='ctx'> 	switch (xprefix) {</div><div class='ctx'> 	case JFFS2_XPREFIX_USER:</div><div class='hunk'>@@ -942,20 +944,23 @@ static const struct xattr_handler *xprefix_to_handler(int xprefix) {</div><div class='ctx'> #endif</div><div class='ctx'> #ifdef CONFIG_JFFS2_FS_POSIX_ACL</div><div class='ctx'> 	case JFFS2_XPREFIX_ACL_ACCESS:</div><div class='del'>-		ret = &amp;posix_acl_access_xattr_handler;</div><div class='add'>+		ret = &amp;nop_posix_acl_access;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case JFFS2_XPREFIX_ACL_DEFAULT:</div><div class='del'>-		ret = &amp;posix_acl_default_xattr_handler;</div><div class='add'>+		ret = &amp;nop_posix_acl_default;</div><div class='ctx'> 		break;</div><div class='ctx'> #endif</div><div class='ctx'> 	case JFFS2_XPREFIX_TRUSTED:</div><div class='ctx'> 		ret = &amp;jffs2_trusted_xattr_handler;</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='del'>-		ret = NULL;</div><div class='del'>-		break;</div><div class='add'>+		return NULL;</div><div class='ctx'> 	}</div><div class='del'>-	return ret;</div><div class='add'>+</div><div class='add'>+	if (!xattr_handler_can_list(ret, dentry))</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	return xattr_prefix(ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> ssize_t jffs2_listxattr(struct dentry *dentry, char *buffer, size_t size)</div><div class='hunk'>@@ -966,7 +971,6 @@ ssize_t jffs2_listxattr(struct dentry *dentry, char *buffer, size_t size)</div><div class='ctx'> 	struct jffs2_inode_cache *ic = f-&gt;inocache;</div><div class='ctx'> 	struct jffs2_xattr_ref *ref, **pref;</div><div class='ctx'> 	struct jffs2_xattr_datum *xd;</div><div class='del'>-	const struct xattr_handler *xhandle;</div><div class='ctx'> 	const char *prefix;</div><div class='ctx'> 	ssize_t prefix_len, len, rc;</div><div class='ctx'> 	int retry = 0;</div><div class='hunk'>@@ -998,10 +1002,10 @@ ssize_t jffs2_listxattr(struct dentry *dentry, char *buffer, size_t size)</div><div class='ctx'> 					goto out;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		xhandle = xprefix_to_handler(xd-&gt;xprefix);</div><div class='del'>-		if (!xhandle || (xhandle-&gt;list &amp;&amp; !xhandle-&gt;list(dentry)))</div><div class='add'>+</div><div class='add'>+		prefix = jffs2_xattr_prefix(xd-&gt;xprefix, dentry);</div><div class='add'>+		if (!prefix)</div><div class='ctx'> 			continue;</div><div class='del'>-		prefix = xhandle-&gt;prefix ?: xhandle-&gt;name;</div><div class='ctx'> 		prefix_len = strlen(prefix);</div><div class='ctx'> 		rc = prefix_len + xd-&gt;name_len + 1;</div><div class='ctx'> </div><div class='hunk'>@@ -1106,6 +1110,9 @@ int do_jffs2_setxattr(struct inode *inode, int xprefix, const char *xname,</div><div class='ctx'> 		return rc;</div><div class='ctx'> </div><div class='ctx'> 	request = PAD(sizeof(struct jffs2_raw_xattr) + strlen(xname) + 1 + size);</div><div class='add'>+	if (request &gt; c-&gt;sector_size - c-&gt;cleanmarker_size)</div><div class='add'>+		return -ERANGE;</div><div class='add'>+</div><div class='ctx'> 	rc = jffs2_reserve_space(c, request, &amp;length,</div><div class='ctx'> 				 ALLOC_NORMAL, JFFS2_SUMMARY_XATTR_SIZE);</div><div class='ctx'> 	if (rc) {</div><div class='head'>diff --git a/fs/jffs2/xattr.h b/fs/jffs2/xattr.h<br/>index 720007b2fd65..7e7de093ec0a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/xattr.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/xattr.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/xattr.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/xattr.h</a></div><div class='hunk'>@@ -71,7 +71,7 @@ static inline int is_xattr_ref_dead(struct jffs2_xattr_ref *ref)</div><div class='ctx'> #ifdef CONFIG_JFFS2_FS_XATTR</div><div class='ctx'> </div><div class='ctx'> extern void jffs2_init_xattr_subsystem(struct jffs2_sb_info *c);</div><div class='del'>-extern void jffs2_build_xattr_subsystem(struct jffs2_sb_info *c);</div><div class='add'>+extern int jffs2_build_xattr_subsystem(struct jffs2_sb_info *c);</div><div class='ctx'> extern void jffs2_clear_xattr_subsystem(struct jffs2_sb_info *c);</div><div class='ctx'> </div><div class='ctx'> extern struct jffs2_xattr_datum *jffs2_setup_xattr_datum(struct jffs2_sb_info *c,</div><div class='hunk'>@@ -94,7 +94,7 @@ extern int do_jffs2_getxattr(struct inode *inode, int xprefix, const char *xname</div><div class='ctx'> extern int do_jffs2_setxattr(struct inode *inode, int xprefix, const char *xname,</div><div class='ctx'> 			     const char *buffer, size_t size, int flags);</div><div class='ctx'> </div><div class='del'>-extern const struct xattr_handler *jffs2_xattr_handlers[];</div><div class='add'>+extern const struct xattr_handler * const jffs2_xattr_handlers[];</div><div class='ctx'> extern const struct xattr_handler jffs2_user_xattr_handler;</div><div class='ctx'> extern const struct xattr_handler jffs2_trusted_xattr_handler;</div><div class='ctx'> </div><div class='hunk'>@@ -103,7 +103,7 @@ extern ssize_t jffs2_listxattr(struct dentry *, char *, size_t);</div><div class='ctx'> #else</div><div class='ctx'> </div><div class='ctx'> #define jffs2_init_xattr_subsystem(c)</div><div class='del'>-#define jffs2_build_xattr_subsystem(c)</div><div class='add'>+#define jffs2_build_xattr_subsystem(c)		(0)</div><div class='ctx'> #define jffs2_clear_xattr_subsystem(c)</div><div class='ctx'> </div><div class='ctx'> #define jffs2_xattr_do_crccheck_inode(c, ic)</div><div class='head'>diff --git a/fs/jffs2/xattr_trusted.c b/fs/jffs2/xattr_trusted.c<br/>index cc3f24883e7d..b7c5da2d89bd 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/xattr_trusted.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/xattr_trusted.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/xattr_trusted.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/xattr_trusted.c</a></div><div class='hunk'>@@ -25,7 +25,7 @@ static int jffs2_trusted_getxattr(const struct xattr_handler *handler,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int jffs2_trusted_setxattr(const struct xattr_handler *handler,</div><div class='del'>-				  struct user_namespace *mnt_userns,</div><div class='add'>+				  struct mnt_idmap *idmap,</div><div class='ctx'> 				  struct dentry *unused, struct inode *inode,</div><div class='ctx'> 				  const char *name, const void *buffer,</div><div class='ctx'> 				  size_t size, int flags)</div><div class='head'>diff --git a/fs/jffs2/xattr_user.c b/fs/jffs2/xattr_user.c<br/>index fb945977c013..f64edce4927b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jffs2/xattr_user.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jffs2/xattr_user.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jffs2/xattr_user.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jffs2/xattr_user.c</a></div><div class='hunk'>@@ -25,7 +25,7 @@ static int jffs2_user_getxattr(const struct xattr_handler *handler,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int jffs2_user_setxattr(const struct xattr_handler *handler,</div><div class='del'>-			       struct user_namespace *mnt_userns,</div><div class='add'>+			       struct mnt_idmap *idmap,</div><div class='ctx'> 			       struct dentry *unused, struct inode *inode,</div><div class='ctx'> 			       const char *name, const void *buffer,</div><div class='ctx'> 			       size_t size, int flags)</div><div class='head'>diff --git a/fs/jfs/Kconfig b/fs/jfs/Kconfig<br/>index 05cb0e8e4382..3728cf4d944d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/Kconfig</a></div><div class='hunk'>@@ -1,8 +1,11 @@</div><div class='ctx'> # SPDX-License-Identifier: GPL-2.0-only</div><div class='ctx'> config JFS_FS</div><div class='ctx'> 	tristate "JFS filesystem support"</div><div class='add'>+	select BUFFER_HEAD</div><div class='ctx'> 	select NLS</div><div class='add'>+	select NLS_UCS2_UTILS</div><div class='ctx'> 	select CRC32</div><div class='add'>+	select LEGACY_DIRECT_IO</div><div class='ctx'> 	help</div><div class='ctx'> 	  This is a port of IBM's Journaled Filesystem .  More information is</div><div class='ctx'> 	  available in the file &lt;file:Documentation/admin-guide/jfs.rst&gt;.</div><div class='head'>diff --git a/fs/jfs/Makefile b/fs/jfs/Makefile<br/>index 285ec189ed5c..b769bbf8bdc2 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/Makefile?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/Makefile</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/Makefile?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/Makefile</a></div><div class='hunk'>@@ -9,9 +9,7 @@ jfs-y    := super.o file.o inode.o namei.o jfs_mount.o jfs_umount.o \</div><div class='ctx'> 	    jfs_xtree.o jfs_imap.o jfs_debug.o jfs_dmap.o \</div><div class='ctx'> 	    jfs_unicode.o jfs_dtree.o jfs_inode.o jfs_discard.o \</div><div class='ctx'> 	    jfs_extent.o symlink.o jfs_metapage.o \</div><div class='del'>-	    jfs_logmgr.o jfs_txnmgr.o jfs_uniupr.o \</div><div class='add'>+	    jfs_logmgr.o jfs_txnmgr.o \</div><div class='ctx'> 	    resize.o xattr.o ioctl.o</div><div class='ctx'> </div><div class='ctx'> jfs-$(CONFIG_JFS_POSIX_ACL) += acl.o</div><div class='del'>-</div><div class='del'>-ccflags-y := -D_JFS_4K</div><div class='head'>diff --git a/fs/jfs/acl.c b/fs/jfs/acl.c<br/>index a653f34c6e26..1de3602c98de 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/acl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/acl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/acl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/acl.c</a></div><div class='hunk'>@@ -94,18 +94,19 @@ out:</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int jfs_set_acl(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='add'>+int jfs_set_acl(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		struct posix_acl *acl, int type)</div><div class='ctx'> {</div><div class='ctx'> 	int rc;</div><div class='ctx'> 	tid_t tid;</div><div class='ctx'> 	int update_mode = 0;</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	umode_t mode = inode-&gt;i_mode;</div><div class='ctx'> </div><div class='ctx'> 	tid = txBegin(inode-&gt;i_sb, 0);</div><div class='ctx'> 	mutex_lock(&amp;JFS_IP(inode)-&gt;commit_mutex);</div><div class='ctx'> 	if (type == ACL_TYPE_ACCESS &amp;&amp; acl) {</div><div class='del'>-		rc = posix_acl_update_mode(&amp;init_user_ns, inode, &amp;mode, &amp;acl);</div><div class='add'>+		rc = posix_acl_update_mode(&amp;nop_mnt_idmap, inode, &amp;mode, &amp;acl);</div><div class='ctx'> 		if (rc)</div><div class='ctx'> 			goto end_tx;</div><div class='ctx'> 		if (mode != inode-&gt;i_mode)</div><div class='hunk'>@@ -115,7 +116,7 @@ int jfs_set_acl(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='ctx'> 	if (!rc) {</div><div class='ctx'> 		if (update_mode) {</div><div class='ctx'> 			inode-&gt;i_mode = mode;</div><div class='del'>-			inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+			inode_set_ctime_current(inode);</div><div class='ctx'> 			mark_inode_dirty(inode);</div><div class='ctx'> 		}</div><div class='ctx'> 		rc = txCommit(tid, 1, &amp;inode, 0);</div><div class='head'>diff --git a/fs/jfs/file.c b/fs/jfs/file.c<br/>index 1d732fd223d4..87ad042221e7 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/file.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/file.c</a></div><div class='hunk'>@@ -26,8 +26,8 @@ int jfs_fsync(struct file *file, loff_t start, loff_t end, int datasync)</div><div class='ctx'> 		return rc;</div><div class='ctx'> </div><div class='ctx'> 	inode_lock(inode);</div><div class='del'>-	if (!(inode-&gt;i_state &amp; I_DIRTY_ALL) ||</div><div class='del'>-	    (datasync &amp;&amp; !(inode-&gt;i_state &amp; I_DIRTY_DATASYNC))) {</div><div class='add'>+	if (!(inode_state_read_once(inode) &amp; I_DIRTY_ALL) ||</div><div class='add'>+	    (datasync &amp;&amp; !(inode_state_read_once(inode) &amp; I_DIRTY_DATASYNC))) {</div><div class='ctx'> 		/* Make sure committed changes hit the disk */</div><div class='ctx'> 		jfs_flush_journal(JFS_SBI(inode-&gt;i_sb)-&gt;log, 1);</div><div class='ctx'> 		inode_unlock(inode);</div><div class='hunk'>@@ -44,6 +44,9 @@ static int jfs_open(struct inode *inode, struct file *file)</div><div class='ctx'> {</div><div class='ctx'> 	int rc;</div><div class='ctx'> </div><div class='add'>+	if (S_ISREG(inode-&gt;i_mode) &amp;&amp; inode-&gt;i_size &lt; 0)</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='ctx'> 	if ((rc = dquot_file_open(inode, file)))</div><div class='ctx'> 		return rc;</div><div class='ctx'> </div><div class='hunk'>@@ -85,24 +88,24 @@ static int jfs_release(struct inode *inode, struct file *file)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int jfs_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='add'>+int jfs_setattr(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		struct iattr *iattr)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	int rc;</div><div class='ctx'> </div><div class='del'>-	rc = setattr_prepare(&amp;init_user_ns, dentry, iattr);</div><div class='add'>+	rc = setattr_prepare(&amp;nop_mnt_idmap, dentry, iattr);</div><div class='ctx'> 	if (rc)</div><div class='ctx'> 		return rc;</div><div class='ctx'> </div><div class='del'>-	if (is_quota_modification(inode, iattr)) {</div><div class='add'>+	if (is_quota_modification(&amp;nop_mnt_idmap, inode, iattr)) {</div><div class='ctx'> 		rc = dquot_initialize(inode);</div><div class='ctx'> 		if (rc)</div><div class='ctx'> 			return rc;</div><div class='ctx'> 	}</div><div class='ctx'> 	if ((iattr-&gt;ia_valid &amp; ATTR_UID &amp;&amp; !uid_eq(iattr-&gt;ia_uid, inode-&gt;i_uid)) ||</div><div class='ctx'> 	    (iattr-&gt;ia_valid &amp; ATTR_GID &amp;&amp; !gid_eq(iattr-&gt;ia_gid, inode-&gt;i_gid))) {</div><div class='del'>-		rc = dquot_transfer(inode, iattr);</div><div class='add'>+		rc = dquot_transfer(&amp;nop_mnt_idmap, inode, iattr);</div><div class='ctx'> 		if (rc)</div><div class='ctx'> 			return rc;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -119,11 +122,11 @@ int jfs_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 		jfs_truncate(inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	setattr_copy(&amp;init_user_ns, inode, iattr);</div><div class='add'>+	setattr_copy(&amp;nop_mnt_idmap, inode, iattr);</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (iattr-&gt;ia_valid &amp; ATTR_MODE)</div><div class='del'>-		rc = posix_acl_chmod(&amp;init_user_ns, inode, inode-&gt;i_mode);</div><div class='add'>+		rc = posix_acl_chmod(&amp;nop_mnt_idmap, dentry, inode-&gt;i_mode);</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -133,7 +136,7 @@ const struct inode_operations jfs_file_inode_operations = {</div><div class='ctx'> 	.fileattr_get	= jfs_fileattr_get,</div><div class='ctx'> 	.fileattr_set	= jfs_fileattr_set,</div><div class='ctx'> #ifdef CONFIG_JFS_POSIX_ACL</div><div class='del'>-	.get_acl	= jfs_get_acl,</div><div class='add'>+	.get_inode_acl	= jfs_get_acl,</div><div class='ctx'> 	.set_acl	= jfs_set_acl,</div><div class='ctx'> #endif</div><div class='ctx'> };</div><div class='hunk'>@@ -143,8 +146,8 @@ const struct file_operations jfs_file_operations = {</div><div class='ctx'> 	.llseek		= generic_file_llseek,</div><div class='ctx'> 	.read_iter	= generic_file_read_iter,</div><div class='ctx'> 	.write_iter	= generic_file_write_iter,</div><div class='del'>-	.mmap		= generic_file_mmap,</div><div class='del'>-	.splice_read	= generic_file_splice_read,</div><div class='add'>+	.mmap_prepare	= generic_file_mmap_prepare,</div><div class='add'>+	.splice_read	= filemap_splice_read,</div><div class='ctx'> 	.splice_write	= iter_file_splice_write,</div><div class='ctx'> 	.fsync		= jfs_fsync,</div><div class='ctx'> 	.release	= jfs_release,</div><div class='head'>diff --git a/fs/jfs/inode.c b/fs/jfs/inode.c<br/>index 57ab424c05ff..4709762713ef 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/inode.c</a></div><div class='hunk'>@@ -29,7 +29,7 @@ struct inode *jfs_iget(struct super_block *sb, unsigned long ino)</div><div class='ctx'> 	inode = iget_locked(sb, ino);</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='del'>-	if (!(inode-&gt;i_state &amp; I_NEW))</div><div class='add'>+	if (!(inode_state_read_once(inode) &amp; I_NEW))</div><div class='ctx'> 		return inode;</div><div class='ctx'> </div><div class='ctx'> 	ret = diRead(inode);</div><div class='hunk'>@@ -59,9 +59,15 @@ struct inode *jfs_iget(struct super_block *sb, unsigned long ino)</div><div class='ctx'> 			 */</div><div class='ctx'> 			inode-&gt;i_link[inode-&gt;i_size] = '\0';</div><div class='ctx'> 		}</div><div class='del'>-	} else {</div><div class='add'>+	} else if (S_ISCHR(inode-&gt;i_mode) || S_ISBLK(inode-&gt;i_mode) ||</div><div class='add'>+		   S_ISFIFO(inode-&gt;i_mode) || S_ISSOCK(inode-&gt;i_mode)) {</div><div class='ctx'> 		inode-&gt;i_op = &amp;jfs_file_inode_operations;</div><div class='ctx'> 		init_special_inode(inode, inode-&gt;i_mode, inode-&gt;i_rdev);</div><div class='add'>+	} else {</div><div class='add'>+		printk(KERN_DEBUG "JFS: Invalid file type 0%04o for inode %lu.\n",</div><div class='add'>+		       inode-&gt;i_mode, inode-&gt;i_ino);</div><div class='add'>+		iget_failed(inode);</div><div class='add'>+		return ERR_PTR(-EIO);</div><div class='ctx'> 	}</div><div class='ctx'> 	unlock_new_inode(inode);</div><div class='ctx'> 	return inode;</div><div class='hunk'>@@ -145,13 +151,14 @@ void jfs_evict_inode(struct inode *inode)</div><div class='ctx'> 	if (!inode-&gt;i_nlink &amp;&amp; !is_bad_inode(inode)) {</div><div class='ctx'> 		dquot_initialize(inode);</div><div class='ctx'> </div><div class='add'>+		truncate_inode_pages_final(&amp;inode-&gt;i_data);</div><div class='ctx'> 		if (JFS_IP(inode)-&gt;fileset == FILESYSTEM_I) {</div><div class='del'>-			truncate_inode_pages_final(&amp;inode-&gt;i_data);</div><div class='add'>+			struct inode *ipimap = JFS_SBI(inode-&gt;i_sb)-&gt;ipimap;</div><div class='ctx'> </div><div class='ctx'> 			if (test_cflag(COMMIT_Freewmap, inode))</div><div class='ctx'> 				jfs_free_zero_link(inode);</div><div class='ctx'> </div><div class='del'>-			if (JFS_SBI(inode-&gt;i_sb)-&gt;ipimap)</div><div class='add'>+			if (ipimap &amp;&amp; JFS_IP(ipimap)-&gt;i_imap)</div><div class='ctx'> 				diFree(inode);</div><div class='ctx'> </div><div class='ctx'> 			/*</div><div class='hunk'>@@ -223,18 +230,9 @@ int jfs_get_block(struct inode *ip, sector_t lblock,</div><div class='ctx'> 				 * this as a hole</div><div class='ctx'> 				 */</div><div class='ctx'> 				goto unlock;</div><div class='del'>-#ifdef _JFS_4K</div><div class='ctx'> 			XADoffset(&amp;xad, lblock64);</div><div class='ctx'> 			XADlength(&amp;xad, xlen);</div><div class='ctx'> 			XADaddress(&amp;xad, xaddr);</div><div class='del'>-#else				/* _JFS_4K */</div><div class='del'>-			/*</div><div class='del'>-			 * As long as block size = 4K, this isn't a problem.</div><div class='del'>-			 * We should mark the whole page not ABNR, but how</div><div class='del'>-			 * will we know to mark the other blocks BH_New?</div><div class='del'>-			 */</div><div class='del'>-			BUG();</div><div class='del'>-#endif				/* _JFS_4K */</div><div class='ctx'> 			rc = extRecord(ip, &amp;xad);</div><div class='ctx'> 			if (rc)</div><div class='ctx'> 				goto unlock;</div><div class='hunk'>@@ -251,7 +249,6 @@ int jfs_get_block(struct inode *ip, sector_t lblock,</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Allocate a new block</div><div class='ctx'> 	 */</div><div class='del'>-#ifdef _JFS_4K</div><div class='ctx'> 	if ((rc = extHint(ip, lblock64 &lt;&lt; ip-&gt;i_sb-&gt;s_blocksize_bits, &amp;xad)))</div><div class='ctx'> 		goto unlock;</div><div class='ctx'> 	rc = extAlloc(ip, xlen, lblock64, &amp;xad, false);</div><div class='hunk'>@@ -262,14 +259,6 @@ int jfs_get_block(struct inode *ip, sector_t lblock,</div><div class='ctx'> 	map_bh(bh_result, ip-&gt;i_sb, addressXAD(&amp;xad));</div><div class='ctx'> 	bh_result-&gt;b_size = lengthXAD(&amp;xad) &lt;&lt; ip-&gt;i_blkbits;</div><div class='ctx'> </div><div class='del'>-#else				/* _JFS_4K */</div><div class='del'>-	/*</div><div class='del'>-	 * We need to do whatever it takes to keep all but the last buffers</div><div class='del'>-	 * in 4K pages - see jfs_write.c</div><div class='del'>-	 */</div><div class='del'>-	BUG();</div><div class='del'>-#endif				/* _JFS_4K */</div><div class='del'>-</div><div class='ctx'>       unlock:</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Release lock on inode</div><div class='hunk'>@@ -281,20 +270,15 @@ int jfs_get_block(struct inode *ip, sector_t lblock,</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int jfs_writepage(struct page *page, struct writeback_control *wbc)</div><div class='del'>-{</div><div class='del'>-	return block_write_full_page(page, jfs_get_block, wbc);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int jfs_writepages(struct address_space *mapping,</div><div class='ctx'> 			struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='ctx'> 	return mpage_writepages(mapping, wbc, jfs_get_block);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int jfs_readpage(struct file *file, struct page *page)</div><div class='add'>+static int jfs_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	return mpage_readpage(page, jfs_get_block);</div><div class='add'>+	return mpage_read_folio(folio, jfs_get_block);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void jfs_readahead(struct readahead_control *rac)</div><div class='hunk'>@@ -312,20 +296,33 @@ static void jfs_write_failed(struct address_space *mapping, loff_t to)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int jfs_write_begin(struct file *file, struct address_space *mapping,</div><div class='del'>-				loff_t pos, unsigned len, unsigned flags,</div><div class='del'>-				struct page **pagep, void **fsdata)</div><div class='add'>+static int jfs_write_begin(const struct kiocb *iocb,</div><div class='add'>+			   struct address_space *mapping,</div><div class='add'>+			   loff_t pos, unsigned len,</div><div class='add'>+			   struct folio **foliop, void **fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = nobh_write_begin(mapping, pos, len, flags, pagep, fsdata,</div><div class='del'>-				jfs_get_block);</div><div class='add'>+	ret = block_write_begin(mapping, pos, len, foliop, jfs_get_block);</div><div class='ctx'> 	if (unlikely(ret))</div><div class='ctx'> 		jfs_write_failed(mapping, pos + len);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int jfs_write_end(const struct kiocb *iocb,</div><div class='add'>+			 struct address_space *mapping,</div><div class='add'>+			 loff_t pos, unsigned len, unsigned copied,</div><div class='add'>+			 struct folio *folio, void *fsdata)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = generic_write_end(iocb, mapping, pos, len, copied, folio, fsdata);</div><div class='add'>+	if (ret &lt; len)</div><div class='add'>+		jfs_write_failed(mapping, pos + len);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static sector_t jfs_bmap(struct address_space *mapping, sector_t block)</div><div class='ctx'> {</div><div class='ctx'> 	return generic_block_bmap(mapping, block, jfs_get_block);</div><div class='hunk'>@@ -357,15 +354,16 @@ static ssize_t jfs_direct_IO(struct kiocb *iocb, struct iov_iter *iter)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations jfs_aops = {</div><div class='del'>-	.set_page_dirty	= __set_page_dirty_buffers,</div><div class='del'>-	.readpage	= jfs_readpage,</div><div class='add'>+	.dirty_folio	= block_dirty_folio,</div><div class='add'>+	.invalidate_folio = block_invalidate_folio,</div><div class='add'>+	.read_folio	= jfs_read_folio,</div><div class='ctx'> 	.readahead	= jfs_readahead,</div><div class='del'>-	.writepage	= jfs_writepage,</div><div class='ctx'> 	.writepages	= jfs_writepages,</div><div class='ctx'> 	.write_begin	= jfs_write_begin,</div><div class='del'>-	.write_end	= nobh_write_end,</div><div class='add'>+	.write_end	= jfs_write_end,</div><div class='ctx'> 	.bmap		= jfs_bmap,</div><div class='ctx'> 	.direct_IO	= jfs_direct_IO,</div><div class='add'>+	.migrate_folio	= buffer_migrate_folio,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -379,7 +377,7 @@ void jfs_truncate_nolock(struct inode *ip, loff_t length)</div><div class='ctx'> </div><div class='ctx'> 	ASSERT(length &gt;= 0);</div><div class='ctx'> </div><div class='del'>-	if (test_cflag(COMMIT_Nolink, ip)) {</div><div class='add'>+	if (test_cflag(COMMIT_Nolink, ip) || isReadOnly(ip)) {</div><div class='ctx'> 		xtTruncate(0, ip, length, COMMIT_WMAP);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -403,7 +401,7 @@ void jfs_truncate_nolock(struct inode *ip, loff_t length)</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		ip-&gt;i_mtime = ip-&gt;i_ctime = current_time(ip);</div><div class='add'>+		inode_set_mtime_to_ts(ip, inode_set_ctime_current(ip));</div><div class='ctx'> 		mark_inode_dirty(ip);</div><div class='ctx'> </div><div class='ctx'> 		txCommit(tid, 1, &amp;ip, 0);</div><div class='hunk'>@@ -416,7 +414,7 @@ void jfs_truncate(struct inode *ip)</div><div class='ctx'> {</div><div class='ctx'> 	jfs_info("jfs_truncate: size = 0x%lx", (ulong) ip-&gt;i_size);</div><div class='ctx'> </div><div class='del'>-	nobh_truncate_page(ip-&gt;i_mapping, ip-&gt;i_size, jfs_get_block);</div><div class='add'>+	block_truncate_page(ip-&gt;i_mapping, ip-&gt;i_size, jfs_get_block);</div><div class='ctx'> </div><div class='ctx'> 	IWRITE_LOCK(ip, RDWRLOCK_NORMAL);</div><div class='ctx'> 	jfs_truncate_nolock(ip, ip-&gt;i_size);</div><div class='head'>diff --git a/fs/jfs/ioctl.c b/fs/jfs/ioctl.c<br/>index 03a845ab4f00..563f148be8af 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/ioctl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/ioctl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/ioctl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/ioctl.c</a></div><div class='hunk'>@@ -57,7 +57,7 @@ static long jfs_map_ext2(unsigned long flags, int from)</div><div class='ctx'> 	return mapped;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int jfs_fileattr_get(struct dentry *dentry, struct fileattr *fa)</div><div class='add'>+int jfs_fileattr_get(struct dentry *dentry, struct file_kattr *fa)</div><div class='ctx'> {</div><div class='ctx'> 	struct jfs_inode_info *jfs_inode = JFS_IP(d_inode(dentry));</div><div class='ctx'> 	unsigned int flags = jfs_inode-&gt;mode2 &amp; JFS_FL_USER_VISIBLE;</div><div class='hunk'>@@ -70,8 +70,8 @@ int jfs_fileattr_get(struct dentry *dentry, struct fileattr *fa)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int jfs_fileattr_set(struct user_namespace *mnt_userns,</div><div class='del'>-		     struct dentry *dentry, struct fileattr *fa)</div><div class='add'>+int jfs_fileattr_set(struct mnt_idmap *idmap,</div><div class='add'>+		     struct dentry *dentry, struct file_kattr *fa)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	struct jfs_inode_info *jfs_inode = JFS_IP(inode);</div><div class='hunk'>@@ -96,7 +96,7 @@ int jfs_fileattr_set(struct user_namespace *mnt_userns,</div><div class='ctx'> 	jfs_inode-&gt;mode2 = flags;</div><div class='ctx'> </div><div class='ctx'> 	jfs_set_inode_flags(inode);</div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -110,14 +110,13 @@ long jfs_ioctl(struct file *filp, unsigned int cmd, unsigned long arg)</div><div class='ctx'> 	case FITRIM:</div><div class='ctx'> 	{</div><div class='ctx'> 		struct super_block *sb = inode-&gt;i_sb;</div><div class='del'>-		struct request_queue *q = bdev_get_queue(sb-&gt;s_bdev);</div><div class='ctx'> 		struct fstrim_range range;</div><div class='ctx'> 		s64 ret = 0;</div><div class='ctx'> </div><div class='ctx'> 		if (!capable(CAP_SYS_ADMIN))</div><div class='ctx'> 			return -EPERM;</div><div class='ctx'> </div><div class='del'>-		if (!blk_queue_discard(q)) {</div><div class='add'>+		if (!bdev_max_discard_sectors(sb-&gt;s_bdev)) {</div><div class='ctx'> 			jfs_warn("FITRIM not supported on device");</div><div class='ctx'> 			return -EOPNOTSUPP;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -127,7 +126,7 @@ long jfs_ioctl(struct file *filp, unsigned int cmd, unsigned long arg)</div><div class='ctx'> 			return -EFAULT;</div><div class='ctx'> </div><div class='ctx'> 		range.minlen = max_t(unsigned int, range.minlen,</div><div class='del'>-			q-&gt;limits.discard_granularity);</div><div class='add'>+				     bdev_discard_granularity(sb-&gt;s_bdev));</div><div class='ctx'> </div><div class='ctx'> 		ret = jfs_ioc_trim(inode, &amp;range);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='head'>diff --git a/fs/jfs/jfs_acl.h b/fs/jfs/jfs_acl.h<br/>index 3de40286d31f..f892e54d0fcd 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_acl.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_acl.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_acl.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/jfs_acl.h</a></div><div class='hunk'>@@ -8,7 +8,7 @@</div><div class='ctx'> #ifdef CONFIG_JFS_POSIX_ACL</div><div class='ctx'> </div><div class='ctx'> struct posix_acl *jfs_get_acl(struct inode *inode, int type, bool rcu);</div><div class='del'>-int jfs_set_acl(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='add'>+int jfs_set_acl(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		struct posix_acl *acl, int type);</div><div class='ctx'> int jfs_init_acl(tid_t, struct inode *, struct inode *);</div><div class='ctx'> </div><div class='head'>diff --git a/fs/jfs/jfs_dinode.h b/fs/jfs/jfs_dinode.h<br/>index 6b231d0d0071..603aae17a693 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_dinode.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_dinode.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_dinode.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/jfs_dinode.h</a></div><div class='hunk'>@@ -96,7 +96,7 @@ struct dinode {</div><div class='ctx'> #define di_gengen	u._file._u1._imap._gengen</div><div class='ctx'> </div><div class='ctx'> 			union {</div><div class='del'>-				xtpage_t _xtroot;</div><div class='add'>+				xtroot_t _xtroot;</div><div class='ctx'> 				struct {</div><div class='ctx'> 					u8 unused[16];	/* 16: */</div><div class='ctx'> 					dxd_t _dxd;	/* 16: */</div><div class='head'>diff --git a/fs/jfs/jfs_discard.c b/fs/jfs/jfs_discard.c<br/>index 575cb2ba74fc..4b660296caf3 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_discard.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_discard.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_discard.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/jfs_discard.c</a></div><div class='hunk'>@@ -65,7 +65,7 @@ void jfs_issue_discard(struct inode *ip, u64 blkno, u64 nblocks)</div><div class='ctx'> int jfs_ioc_trim(struct inode *ip, struct fstrim_range *range)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *ipbmap = JFS_SBI(ip-&gt;i_sb)-&gt;ipbmap;</div><div class='del'>-	struct bmap *bmp = JFS_SBI(ip-&gt;i_sb)-&gt;bmap;</div><div class='add'>+	struct bmap *bmp;</div><div class='ctx'> 	struct super_block *sb = ipbmap-&gt;i_sb;</div><div class='ctx'> 	int agno, agno_end;</div><div class='ctx'> 	u64 start, end, minlen;</div><div class='hunk'>@@ -83,10 +83,16 @@ int jfs_ioc_trim(struct inode *ip, struct fstrim_range *range)</div><div class='ctx'> 	if (minlen == 0)</div><div class='ctx'> 		minlen = 1;</div><div class='ctx'> </div><div class='del'>-	if (minlen &gt; bmp-&gt;db_agsize ||</div><div class='add'>+	down_read(&amp;sb-&gt;s_umount);</div><div class='add'>+	bmp = JFS_SBI(ip-&gt;i_sb)-&gt;bmap;</div><div class='add'>+</div><div class='add'>+	if (bmp == NULL ||</div><div class='add'>+	    minlen &gt; bmp-&gt;db_agsize ||</div><div class='ctx'> 	    start &gt;= bmp-&gt;db_mapsize ||</div><div class='del'>-	    range-&gt;len &lt; sb-&gt;s_blocksize)</div><div class='add'>+	    range-&gt;len &lt; sb-&gt;s_blocksize) {</div><div class='add'>+		up_read(&amp;sb-&gt;s_umount);</div><div class='ctx'> 		return -EINVAL;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (end &gt;= bmp-&gt;db_mapsize)</div><div class='ctx'> 		end = bmp-&gt;db_mapsize - 1;</div><div class='hunk'>@@ -100,6 +106,8 @@ int jfs_ioc_trim(struct inode *ip, struct fstrim_range *range)</div><div class='ctx'> 		trimmed += dbDiscardAG(ip, agno, minlen);</div><div class='ctx'> 		agno++;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	up_read(&amp;sb-&gt;s_umount);</div><div class='ctx'> 	range-&gt;len = trimmed &lt;&lt; sb-&gt;s_blocksize_bits;</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='head'>diff --git a/fs/jfs/jfs_dmap.c b/fs/jfs/jfs_dmap.c<br/>index 91f4ec93dab1..cdfa699cd7c8 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_dmap.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_dmap.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_dmap.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/jfs_dmap.c</a></div><div class='hunk'>@@ -63,10 +63,10 @@</div><div class='ctx'>  */</div><div class='ctx'> static void dbAllocBits(struct bmap * bmp, struct dmap * dp, s64 blkno,</div><div class='ctx'> 			int nblocks);</div><div class='del'>-static void dbSplit(dmtree_t * tp, int leafno, int splitsz, int newval);</div><div class='del'>-static int dbBackSplit(dmtree_t * tp, int leafno);</div><div class='del'>-static int dbJoin(dmtree_t * tp, int leafno, int newval);</div><div class='del'>-static void dbAdjTree(dmtree_t * tp, int leafno, int newval);</div><div class='add'>+static void dbSplit(dmtree_t *tp, int leafno, int splitsz, int newval, bool is_ctl);</div><div class='add'>+static int dbBackSplit(dmtree_t *tp, int leafno, bool is_ctl);</div><div class='add'>+static int dbJoin(dmtree_t *tp, int leafno, int newval, bool is_ctl);</div><div class='add'>+static void dbAdjTree(dmtree_t *tp, int leafno, int newval, bool is_ctl);</div><div class='ctx'> static int dbAdjCtl(struct bmap * bmp, s64 blkno, int newval, int alloc,</div><div class='ctx'> 		    int level);</div><div class='ctx'> static int dbAllocAny(struct bmap * bmp, s64 nblocks, int l2nb, s64 * results);</div><div class='hunk'>@@ -87,7 +87,7 @@ static int dbAllocCtl(struct bmap * bmp, s64 nblocks, int l2nb, s64 blkno,</div><div class='ctx'> static int dbExtend(struct inode *ip, s64 blkno, s64 nblocks, s64 addnblocks);</div><div class='ctx'> static int dbFindBits(u32 word, int l2nb);</div><div class='ctx'> static int dbFindCtl(struct bmap * bmp, int l2nb, int level, s64 * blkno);</div><div class='del'>-static int dbFindLeaf(dmtree_t * tp, int l2nb, int *leafidx);</div><div class='add'>+static int dbFindLeaf(dmtree_t *tp, int l2nb, int *leafidx, bool is_ctl);</div><div class='ctx'> static int dbFreeBits(struct bmap * bmp, struct dmap * dp, s64 blkno,</div><div class='ctx'> 		      int nblocks);</div><div class='ctx'> static int dbFreeDmap(struct bmap * bmp, struct dmap * dp, s64 blkno,</div><div class='hunk'>@@ -148,13 +148,14 @@ static const s8 budtab[256] = {</div><div class='ctx'>  *	0	- success</div><div class='ctx'>  *	-ENOMEM	- insufficient memory</div><div class='ctx'>  *	-EIO	- i/o error</div><div class='add'>+ *	-EINVAL - wrong bmap data</div><div class='ctx'>  */</div><div class='ctx'> int dbMount(struct inode *ipbmap)</div><div class='ctx'> {</div><div class='ctx'> 	struct bmap *bmp;</div><div class='ctx'> 	struct dbmap_disk *dbmp_le;</div><div class='ctx'> 	struct metapage *mp;</div><div class='del'>-	int i;</div><div class='add'>+	int i, err;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * allocate/initialize the in-memory bmap descriptor</div><div class='hunk'>@@ -169,8 +170,8 @@ int dbMount(struct inode *ipbmap)</div><div class='ctx'> 			   BMAPBLKNO &lt;&lt; JFS_SBI(ipbmap-&gt;i_sb)-&gt;l2nbperpage,</div><div class='ctx'> 			   PSIZE, 0);</div><div class='ctx'> 	if (mp == NULL) {</div><div class='del'>-		kfree(bmp);</div><div class='del'>-		return -EIO;</div><div class='add'>+		err = -EIO;</div><div class='add'>+		goto err_kfree_bmp;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* copy the on-disk bmap descriptor to its in-memory version. */</div><div class='hunk'>@@ -187,6 +188,24 @@ int dbMount(struct inode *ipbmap)</div><div class='ctx'> 	bmp-&gt;db_agwidth = le32_to_cpu(dbmp_le-&gt;dn_agwidth);</div><div class='ctx'> 	bmp-&gt;db_agstart = le32_to_cpu(dbmp_le-&gt;dn_agstart);</div><div class='ctx'> 	bmp-&gt;db_agl2size = le32_to_cpu(dbmp_le-&gt;dn_agl2size);</div><div class='add'>+</div><div class='add'>+	if ((bmp-&gt;db_l2nbperpage &gt; L2PSIZE - L2MINBLOCKSIZE) ||</div><div class='add'>+	    (bmp-&gt;db_l2nbperpage &lt; 0) ||</div><div class='add'>+	    !bmp-&gt;db_numag || (bmp-&gt;db_numag &gt; MAXAG) ||</div><div class='add'>+	    (bmp-&gt;db_maxag &gt;= MAXAG) || (bmp-&gt;db_maxag &lt; 0) ||</div><div class='add'>+	    (bmp-&gt;db_agpref &gt;= MAXAG) || (bmp-&gt;db_agpref &lt; 0) ||</div><div class='add'>+	    (bmp-&gt;db_agheight &lt; 0) || (bmp-&gt;db_agheight &gt; (L2LPERCTL &gt;&gt; 1)) ||</div><div class='add'>+	    (bmp-&gt;db_agwidth &lt; 1) || (bmp-&gt;db_agwidth &gt; (LPERCTL / MAXAG)) ||</div><div class='add'>+	    (bmp-&gt;db_agwidth &gt; (1 &lt;&lt; (L2LPERCTL - (bmp-&gt;db_agheight &lt;&lt; 1)))) ||</div><div class='add'>+	    (bmp-&gt;db_agstart &lt; 0) ||</div><div class='add'>+	    (bmp-&gt;db_agstart &gt; (CTLTREESIZE - 1 - bmp-&gt;db_agwidth * (MAXAG - 1))) ||</div><div class='add'>+	    (bmp-&gt;db_agl2size &gt; L2MAXL2SIZE - L2MAXAG) ||</div><div class='add'>+	    (bmp-&gt;db_agl2size &lt; 0) ||</div><div class='add'>+	    ((bmp-&gt;db_mapsize - 1) &gt;&gt; bmp-&gt;db_agl2size) &gt; MAXAG) {</div><div class='add'>+		err = -EINVAL;</div><div class='add'>+		goto err_release_metapage;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	for (i = 0; i &lt; MAXAG; i++)</div><div class='ctx'> 		bmp-&gt;db_agfree[i] = le64_to_cpu(dbmp_le-&gt;dn_agfree[i]);</div><div class='ctx'> 	bmp-&gt;db_agsize = le64_to_cpu(dbmp_le-&gt;dn_agsize);</div><div class='hunk'>@@ -207,6 +226,12 @@ int dbMount(struct inode *ipbmap)</div><div class='ctx'> 	BMAP_LOCK_INIT(bmp);</div><div class='ctx'> </div><div class='ctx'> 	return (0);</div><div class='add'>+</div><div class='add'>+err_release_metapage:</div><div class='add'>+	release_metapage(mp);</div><div class='add'>+err_kfree_bmp:</div><div class='add'>+	kfree(bmp);</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> </div><div class='hunk'>@@ -240,6 +265,7 @@ int dbUnmount(struct inode *ipbmap, int mounterror)</div><div class='ctx'> </div><div class='ctx'> 	/* free the memory for the in-memory bmap. */</div><div class='ctx'> 	kfree(bmp);</div><div class='add'>+	JFS_SBI(ipbmap-&gt;i_sb)-&gt;bmap = NULL;</div><div class='ctx'> </div><div class='ctx'> 	return (0);</div><div class='ctx'> }</div><div class='hunk'>@@ -378,7 +404,8 @@ int dbFree(struct inode *ip, s64 blkno, s64 nblocks)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* write the last buffer. */</div><div class='del'>-	write_metapage(mp);</div><div class='add'>+	if (mp)</div><div class='add'>+		write_metapage(mp);</div><div class='ctx'> </div><div class='ctx'> 	IREAD_UNLOCK(ipbmap);</div><div class='ctx'> </div><div class='hunk'>@@ -614,7 +641,7 @@ int dbNextAG(struct inode *ipbmap)</div><div class='ctx'> 	 * average free space.</div><div class='ctx'> 	 */</div><div class='ctx'> 	for (i = 0 ; i &lt; bmp-&gt;db_numag; i++, agpref++) {</div><div class='del'>-		if (agpref == bmp-&gt;db_numag)</div><div class='add'>+		if (agpref &gt;= bmp-&gt;db_numag)</div><div class='ctx'> 			agpref = 0;</div><div class='ctx'> </div><div class='ctx'> 		if (atomic_read(&amp;bmp-&gt;db_active[agpref]))</div><div class='hunk'>@@ -861,74 +888,6 @@ int dbAlloc(struct inode *ip, s64 hint, s64 nblocks, s64 * results)</div><div class='ctx'> 	return (rc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#ifdef _NOTYET</div><div class='del'>-/*</div><div class='del'>- * NAME:	dbAllocExact()</div><div class='del'>- *</div><div class='del'>- * FUNCTION:	try to allocate the requested extent;</div><div class='del'>- *</div><div class='del'>- * PARAMETERS:</div><div class='del'>- *	ip	- pointer to in-core inode;</div><div class='del'>- *	blkno	- extent address;</div><div class='del'>- *	nblocks	- extent length;</div><div class='del'>- *</div><div class='del'>- * RETURN VALUES:</div><div class='del'>- *	0	- success</div><div class='del'>- *	-ENOSPC	- insufficient disk resources</div><div class='del'>- *	-EIO	- i/o error</div><div class='del'>- */</div><div class='del'>-int dbAllocExact(struct inode *ip, s64 blkno, int nblocks)</div><div class='del'>-{</div><div class='del'>-	int rc;</div><div class='del'>-	struct inode *ipbmap = JFS_SBI(ip-&gt;i_sb)-&gt;ipbmap;</div><div class='del'>-	struct bmap *bmp = JFS_SBI(ip-&gt;i_sb)-&gt;bmap;</div><div class='del'>-	struct dmap *dp;</div><div class='del'>-	s64 lblkno;</div><div class='del'>-	struct metapage *mp;</div><div class='del'>-</div><div class='del'>-	IREAD_LOCK(ipbmap, RDWRLOCK_DMAP);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * validate extent request:</div><div class='del'>-	 *</div><div class='del'>-	 * note: defragfs policy:</div><div class='del'>-	 *  max 64 blocks will be moved.</div><div class='del'>-	 *  allocation request size must be satisfied from a single dmap.</div><div class='del'>-	 */</div><div class='del'>-	if (nblocks &lt;= 0 || nblocks &gt; BPERDMAP || blkno &gt;= bmp-&gt;db_mapsize) {</div><div class='del'>-		IREAD_UNLOCK(ipbmap);</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (nblocks &gt; ((s64) 1 &lt;&lt; bmp-&gt;db_maxfreebud)) {</div><div class='del'>-		/* the free space is no longer available */</div><div class='del'>-		IREAD_UNLOCK(ipbmap);</div><div class='del'>-		return -ENOSPC;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* read in the dmap covering the extent */</div><div class='del'>-	lblkno = BLKTODMAP(blkno, bmp-&gt;db_l2nbperpage);</div><div class='del'>-	mp = read_metapage(ipbmap, lblkno, PSIZE, 0);</div><div class='del'>-	if (mp == NULL) {</div><div class='del'>-		IREAD_UNLOCK(ipbmap);</div><div class='del'>-		return -EIO;</div><div class='del'>-	}</div><div class='del'>-	dp = (struct dmap *) mp-&gt;data;</div><div class='del'>-</div><div class='del'>-	/* try to allocate the requested extent */</div><div class='del'>-	rc = dbAllocNext(bmp, dp, blkno, nblocks);</div><div class='del'>-</div><div class='del'>-	IREAD_UNLOCK(ipbmap);</div><div class='del'>-</div><div class='del'>-	if (rc == 0)</div><div class='del'>-		mark_metapage_dirty(mp);</div><div class='del'>-</div><div class='del'>-	release_metapage(mp);</div><div class='del'>-</div><div class='del'>-	return (rc);</div><div class='del'>-}</div><div class='del'>-#endif /* _NOTYET */</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * NAME:	dbReAlloc()</div><div class='ctx'>  *</div><div class='hunk'>@@ -1430,6 +1389,12 @@ dbAllocAG(struct bmap * bmp, int agno, s64 nblocks, int l2nb, s64 * results)</div><div class='ctx'> 	    (1 &lt;&lt; (L2LPERCTL - (bmp-&gt;db_agheight &lt;&lt; 1))) / bmp-&gt;db_agwidth;</div><div class='ctx'> 	ti = bmp-&gt;db_agstart + bmp-&gt;db_agwidth * (agno &amp; (agperlev - 1));</div><div class='ctx'> </div><div class='add'>+	if (ti &lt; 0 || ti &gt;= le32_to_cpu(dcp-&gt;nleafs)) {</div><div class='add'>+		jfs_error(bmp-&gt;db_ipbmap-&gt;i_sb, "Corrupt dmapctl page\n");</div><div class='add'>+		release_metapage(mp);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/* dmap control page trees fan-out by 4 and a single allocation</div><div class='ctx'> 	 * group may be described by 1 or 2 subtrees within the ag level</div><div class='ctx'> 	 * dmap control page, depending upon the ag size. examine the ag's</div><div class='hunk'>@@ -1656,6 +1621,8 @@ s64 dbDiscardAG(struct inode *ip, int agno, s64 minlen)</div><div class='ctx'> 		} else if (rc == -ENOSPC) {</div><div class='ctx'> 			/* search for next smaller log2 block */</div><div class='ctx'> 			l2nb = BLKSTOL2(nblocks) - 1;</div><div class='add'>+			if (unlikely(l2nb &lt; 0))</div><div class='add'>+				break;</div><div class='ctx'> 			nblocks = 1LL &lt;&lt; l2nb;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			/* Trim any already allocated blocks */</div><div class='hunk'>@@ -1747,7 +1714,7 @@ static int dbFindCtl(struct bmap * bmp, int l2nb, int level, s64 * blkno)</div><div class='ctx'> 		 * dbFindLeaf() returns the index of the leaf at which</div><div class='ctx'> 		 * free space was found.</div><div class='ctx'> 		 */</div><div class='del'>-		rc = dbFindLeaf((dmtree_t *) dcp, l2nb, &amp;leafidx);</div><div class='add'>+		rc = dbFindLeaf((dmtree_t *) dcp, l2nb, &amp;leafidx, true);</div><div class='ctx'> </div><div class='ctx'> 		/* release the buffer.</div><div class='ctx'> 		 */</div><div class='hunk'>@@ -1848,6 +1815,11 @@ dbAllocCtl(struct bmap * bmp, s64 nblocks, int l2nb, s64 blkno, s64 * results)</div><div class='ctx'> 			return -EIO;</div><div class='ctx'> 		dp = (struct dmap *) mp-&gt;data;</div><div class='ctx'> </div><div class='add'>+		if (dp-&gt;tree.budmin &lt; 0) {</div><div class='add'>+			release_metapage(mp);</div><div class='add'>+			return -EIO;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		/* try to allocate the blocks.</div><div class='ctx'> 		 */</div><div class='ctx'> 		rc = dbAllocDmapLev(bmp, dp, (int) nblocks, l2nb, results);</div><div class='hunk'>@@ -1994,9 +1966,12 @@ dbAllocDmapLev(struct bmap * bmp,</div><div class='ctx'> 	 * free space.  if sufficient free space is found, dbFindLeaf()</div><div class='ctx'> 	 * returns the index of the leaf at which free space was found.</div><div class='ctx'> 	 */</div><div class='del'>-	if (dbFindLeaf((dmtree_t *) &amp; dp-&gt;tree, l2nb, &amp;leafidx))</div><div class='add'>+	if (dbFindLeaf((dmtree_t *) &amp;dp-&gt;tree, l2nb, &amp;leafidx, false))</div><div class='ctx'> 		return -ENOSPC;</div><div class='ctx'> </div><div class='add'>+	if (leafidx &lt; 0)</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='ctx'> 	/* determine the block number within the file system corresponding</div><div class='ctx'> 	 * to the leaf at which free space was found.</div><div class='ctx'> 	 */</div><div class='hunk'>@@ -2130,7 +2105,7 @@ static int dbFreeDmap(struct bmap * bmp, struct dmap * dp, s64 blkno,</div><div class='ctx'> 		 * system.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (dp-&gt;tree.stree[word] == NOFREE)</div><div class='del'>-			dbBackSplit((dmtree_t *) &amp; dp-&gt;tree, word);</div><div class='add'>+			dbBackSplit((dmtree_t *)&amp;dp-&gt;tree, word, false);</div><div class='ctx'> </div><div class='ctx'> 		dbAllocBits(bmp, dp, blkno, nblocks);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2216,7 +2191,7 @@ static void dbAllocBits(struct bmap * bmp, struct dmap * dp, s64 blkno,</div><div class='ctx'> 			 * the binary system of the leaves if need be.</div><div class='ctx'> 			 */</div><div class='ctx'> 			dbSplit(tp, word, BUDMIN,</div><div class='del'>-				dbMaxBud((u8 *) &amp; dp-&gt;wmap[word]));</div><div class='add'>+				dbMaxBud((u8 *)&amp;dp-&gt;wmap[word]), false);</div><div class='ctx'> </div><div class='ctx'> 			word += 1;</div><div class='ctx'> 		} else {</div><div class='hunk'>@@ -2256,7 +2231,7 @@ static void dbAllocBits(struct bmap * bmp, struct dmap * dp, s64 blkno,</div><div class='ctx'> 				 * system of the leaves to reflect the current</div><div class='ctx'> 				 * allocation (size).</div><div class='ctx'> 				 */</div><div class='del'>-				dbSplit(tp, word, size, NOFREE);</div><div class='add'>+				dbSplit(tp, word, size, NOFREE, false);</div><div class='ctx'> </div><div class='ctx'> 				/* get the number of dmap words handled */</div><div class='ctx'> 				nw = BUDSIZE(size, BUDMIN);</div><div class='hunk'>@@ -2363,7 +2338,7 @@ static int dbFreeBits(struct bmap * bmp, struct dmap * dp, s64 blkno,</div><div class='ctx'> 			/* update the leaf for this dmap word.</div><div class='ctx'> 			 */</div><div class='ctx'> 			rc = dbJoin(tp, word,</div><div class='del'>-				    dbMaxBud((u8 *) &amp; dp-&gt;wmap[word]));</div><div class='add'>+				    dbMaxBud((u8 *)&amp;dp-&gt;wmap[word]), false);</div><div class='ctx'> 			if (rc)</div><div class='ctx'> 				return rc;</div><div class='ctx'> </div><div class='hunk'>@@ -2396,7 +2371,7 @@ static int dbFreeBits(struct bmap * bmp, struct dmap * dp, s64 blkno,</div><div class='ctx'> </div><div class='ctx'> 				/* update the leaf.</div><div class='ctx'> 				 */</div><div class='del'>-				rc = dbJoin(tp, word, size);</div><div class='add'>+				rc = dbJoin(tp, word, size, false);</div><div class='ctx'> 				if (rc)</div><div class='ctx'> 					return rc;</div><div class='ctx'> </div><div class='hunk'>@@ -2548,16 +2523,16 @@ dbAdjCtl(struct bmap * bmp, s64 blkno, int newval, int alloc, int level)</div><div class='ctx'> 		 * that it is at the front of a binary buddy system.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (oldval == NOFREE) {</div><div class='del'>-			rc = dbBackSplit((dmtree_t *) dcp, leafno);</div><div class='add'>+			rc = dbBackSplit((dmtree_t *)dcp, leafno, true);</div><div class='ctx'> 			if (rc) {</div><div class='ctx'> 				release_metapage(mp);</div><div class='ctx'> 				return rc;</div><div class='ctx'> 			}</div><div class='ctx'> 			oldval = dcp-&gt;stree[ti];</div><div class='ctx'> 		}</div><div class='del'>-		dbSplit((dmtree_t *) dcp, leafno, dcp-&gt;budmin, newval);</div><div class='add'>+		dbSplit((dmtree_t *) dcp, leafno, dcp-&gt;budmin, newval, true);</div><div class='ctx'> 	} else {</div><div class='del'>-		rc = dbJoin((dmtree_t *) dcp, leafno, newval);</div><div class='add'>+		rc = dbJoin((dmtree_t *) dcp, leafno, newval, true);</div><div class='ctx'> 		if (rc) {</div><div class='ctx'> 			release_metapage(mp);</div><div class='ctx'> 			return rc;</div><div class='hunk'>@@ -2588,7 +2563,7 @@ dbAdjCtl(struct bmap * bmp, s64 blkno, int newval, int alloc, int level)</div><div class='ctx'> 				 */</div><div class='ctx'> 				if (alloc) {</div><div class='ctx'> 					dbJoin((dmtree_t *) dcp, leafno,</div><div class='del'>-					       oldval);</div><div class='add'>+					       oldval, true);</div><div class='ctx'> 				} else {</div><div class='ctx'> 					/* the dbJoin() above might have</div><div class='ctx'> 					 * caused a larger binary buddy system</div><div class='hunk'>@@ -2598,9 +2573,9 @@ dbAdjCtl(struct bmap * bmp, s64 blkno, int newval, int alloc, int level)</div><div class='ctx'> 					 */</div><div class='ctx'> 					if (dcp-&gt;stree[ti] == NOFREE)</div><div class='ctx'> 						dbBackSplit((dmtree_t *)</div><div class='del'>-							    dcp, leafno);</div><div class='add'>+							    dcp, leafno, true);</div><div class='ctx'> 					dbSplit((dmtree_t *) dcp, leafno,</div><div class='del'>-						dcp-&gt;budmin, oldval);</div><div class='add'>+						dcp-&gt;budmin, oldval, true);</div><div class='ctx'> 				}</div><div class='ctx'> </div><div class='ctx'> 				/* release the buffer and return the error.</div><div class='hunk'>@@ -2648,7 +2623,7 @@ dbAdjCtl(struct bmap * bmp, s64 blkno, int newval, int alloc, int level)</div><div class='ctx'>  *</div><div class='ctx'>  * serialization: IREAD_LOCK(ipbmap) or IWRITE_LOCK(ipbmap) held on entry/exit;</div><div class='ctx'>  */</div><div class='del'>-static void dbSplit(dmtree_t * tp, int leafno, int splitsz, int newval)</div><div class='add'>+static void dbSplit(dmtree_t *tp, int leafno, int splitsz, int newval, bool is_ctl)</div><div class='ctx'> {</div><div class='ctx'> 	int budsz;</div><div class='ctx'> 	int cursz;</div><div class='hunk'>@@ -2670,7 +2645,7 @@ static void dbSplit(dmtree_t * tp, int leafno, int splitsz, int newval)</div><div class='ctx'> 		while (cursz &gt;= splitsz) {</div><div class='ctx'> 			/* update the buddy's leaf with its new value.</div><div class='ctx'> 			 */</div><div class='del'>-			dbAdjTree(tp, leafno ^ budsz, cursz);</div><div class='add'>+			dbAdjTree(tp, leafno ^ budsz, cursz, is_ctl);</div><div class='ctx'> </div><div class='ctx'> 			/* on to the next size and buddy.</div><div class='ctx'> 			 */</div><div class='hunk'>@@ -2682,7 +2657,7 @@ static void dbSplit(dmtree_t * tp, int leafno, int splitsz, int newval)</div><div class='ctx'> 	/* adjust the dmap tree to reflect the specified leaf's new</div><div class='ctx'> 	 * value.</div><div class='ctx'> 	 */</div><div class='del'>-	dbAdjTree(tp, leafno, newval);</div><div class='add'>+	dbAdjTree(tp, leafno, newval, is_ctl);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> </div><div class='hunk'>@@ -2713,7 +2688,7 @@ static void dbSplit(dmtree_t * tp, int leafno, int splitsz, int newval)</div><div class='ctx'>  *</div><div class='ctx'>  * serialization: IREAD_LOCK(ipbmap) or IWRITE_LOCK(ipbmap) held on entry/exit;</div><div class='ctx'>  */</div><div class='del'>-static int dbBackSplit(dmtree_t * tp, int leafno)</div><div class='add'>+static int dbBackSplit(dmtree_t *tp, int leafno, bool is_ctl)</div><div class='ctx'> {</div><div class='ctx'> 	int budsz, bud, w, bsz, size;</div><div class='ctx'> 	int cursz;</div><div class='hunk'>@@ -2764,7 +2739,7 @@ static int dbBackSplit(dmtree_t * tp, int leafno)</div><div class='ctx'> 				 * system in two.</div><div class='ctx'> 				 */</div><div class='ctx'> 				cursz = leaf[bud] - 1;</div><div class='del'>-				dbSplit(tp, bud, cursz, cursz);</div><div class='add'>+				dbSplit(tp, bud, cursz, cursz, is_ctl);</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2792,7 +2767,7 @@ static int dbBackSplit(dmtree_t * tp, int leafno)</div><div class='ctx'>  *</div><div class='ctx'>  * RETURN VALUES: none</div><div class='ctx'>  */</div><div class='del'>-static int dbJoin(dmtree_t * tp, int leafno, int newval)</div><div class='add'>+static int dbJoin(dmtree_t *tp, int leafno, int newval, bool is_ctl)</div><div class='ctx'> {</div><div class='ctx'> 	int budsz, buddy;</div><div class='ctx'> 	s8 *leaf;</div><div class='hunk'>@@ -2847,12 +2822,12 @@ static int dbJoin(dmtree_t * tp, int leafno, int newval)</div><div class='ctx'> 			if (leafno &lt; buddy) {</div><div class='ctx'> 				/* leafno is the left buddy.</div><div class='ctx'> 				 */</div><div class='del'>-				dbAdjTree(tp, buddy, NOFREE);</div><div class='add'>+				dbAdjTree(tp, buddy, NOFREE, is_ctl);</div><div class='ctx'> 			} else {</div><div class='ctx'> 				/* buddy is the left buddy and becomes</div><div class='ctx'> 				 * leafno.</div><div class='ctx'> 				 */</div><div class='del'>-				dbAdjTree(tp, leafno, NOFREE);</div><div class='add'>+				dbAdjTree(tp, leafno, NOFREE, is_ctl);</div><div class='ctx'> 				leafno = buddy;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='hunk'>@@ -2865,7 +2840,7 @@ static int dbJoin(dmtree_t * tp, int leafno, int newval)</div><div class='ctx'> </div><div class='ctx'> 	/* update the leaf value.</div><div class='ctx'> 	 */</div><div class='del'>-	dbAdjTree(tp, leafno, newval);</div><div class='add'>+	dbAdjTree(tp, leafno, newval, is_ctl);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -2886,15 +2861,20 @@ static int dbJoin(dmtree_t * tp, int leafno, int newval)</div><div class='ctx'>  *</div><div class='ctx'>  * RETURN VALUES: none</div><div class='ctx'>  */</div><div class='del'>-static void dbAdjTree(dmtree_t * tp, int leafno, int newval)</div><div class='add'>+static void dbAdjTree(dmtree_t *tp, int leafno, int newval, bool is_ctl)</div><div class='ctx'> {</div><div class='ctx'> 	int lp, pp, k;</div><div class='del'>-	int max;</div><div class='add'>+	int max, size;</div><div class='add'>+</div><div class='add'>+	size = is_ctl ? CTLTREESIZE : TREESIZE;</div><div class='ctx'> </div><div class='ctx'> 	/* pick up the index of the leaf for this leafno.</div><div class='ctx'> 	 */</div><div class='ctx'> 	lp = leafno + le32_to_cpu(tp-&gt;dmt_leafidx);</div><div class='ctx'> </div><div class='add'>+	if (WARN_ON_ONCE(lp &gt;= size || lp &lt; 0))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='ctx'> 	/* is the current value the same as the old value ?  if so,</div><div class='ctx'> 	 * there is nothing to do.</div><div class='ctx'> 	 */</div><div class='hunk'>@@ -2908,6 +2888,9 @@ static void dbAdjTree(dmtree_t * tp, int leafno, int newval)</div><div class='ctx'> 	/* bubble the new value up the tree as required.</div><div class='ctx'> 	 */</div><div class='ctx'> 	for (k = 0; k &lt; le32_to_cpu(tp-&gt;dmt_height); k++) {</div><div class='add'>+		if (lp == 0)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='ctx'> 		/* get the index of the first leaf of the 4 leaf</div><div class='ctx'> 		 * group containing the specified leaf (leafno).</div><div class='ctx'> 		 */</div><div class='hunk'>@@ -2955,14 +2938,19 @@ static void dbAdjTree(dmtree_t * tp, int leafno, int newval)</div><div class='ctx'>  *	leafidx	- return pointer to be set to the index of the leaf</div><div class='ctx'>  *		  describing at least l2nb free blocks if sufficient</div><div class='ctx'>  *		  free blocks are found.</div><div class='add'>+ *	is_ctl	- determines if the tree is of type ctl</div><div class='ctx'>  *</div><div class='ctx'>  * RETURN VALUES:</div><div class='ctx'>  *	0	- success</div><div class='ctx'>  *	-ENOSPC	- insufficient free blocks.</div><div class='ctx'>  */</div><div class='del'>-static int dbFindLeaf(dmtree_t * tp, int l2nb, int *leafidx)</div><div class='add'>+static int dbFindLeaf(dmtree_t *tp, int l2nb, int *leafidx, bool is_ctl)</div><div class='ctx'> {</div><div class='ctx'> 	int ti, n = 0, k, x = 0;</div><div class='add'>+	int max_size, max_idx;</div><div class='add'>+</div><div class='add'>+	max_size = is_ctl ? CTLTREESIZE : TREESIZE;</div><div class='add'>+	max_idx = is_ctl ? LPERCTL : LPERDMAP;</div><div class='ctx'> </div><div class='ctx'> 	/* first check the root of the tree to see if there is</div><div class='ctx'> 	 * sufficient free space.</div><div class='hunk'>@@ -2983,6 +2971,8 @@ static int dbFindLeaf(dmtree_t * tp, int l2nb, int *leafidx)</div><div class='ctx'> 			/* sufficient free space found.  move to the next</div><div class='ctx'> 			 * level (or quit if this is the last level).</div><div class='ctx'> 			 */</div><div class='add'>+			if (x + n &gt; max_size)</div><div class='add'>+				return -ENOSPC;</div><div class='ctx'> 			if (l2nb &lt;= tp-&gt;dmt_stree[x + n])</div><div class='ctx'> 				break;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2992,6 +2982,8 @@ static int dbFindLeaf(dmtree_t * tp, int l2nb, int *leafidx)</div><div class='ctx'> 		 */</div><div class='ctx'> 		assert(n &lt; 4);</div><div class='ctx'> 	}</div><div class='add'>+	if (le32_to_cpu(tp-&gt;dmt_leafidx) &gt;= max_idx)</div><div class='add'>+		return -ENOSPC;</div><div class='ctx'> </div><div class='ctx'> 	/* set the return to the leftmost leaf describing sufficient</div><div class='ctx'> 	 * free space.</div><div class='hunk'>@@ -3036,7 +3028,7 @@ static int dbFindBits(u32 word, int l2nb)</div><div class='ctx'> </div><div class='ctx'> 	/* scan the word for nb free bits at nb alignments.</div><div class='ctx'> 	 */</div><div class='del'>-	for (bitno = 0; mask != 0; bitno += nb, mask &gt;&gt;= nb) {</div><div class='add'>+	for (bitno = 0; mask != 0; bitno += nb, mask = (mask &gt;&gt; nb)) {</div><div class='ctx'> 		if ((mask &amp; word) == mask)</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3408,7 +3400,7 @@ int dbExtendFS(struct inode *ipbmap, s64 blkno,	s64 nblocks)</div><div class='ctx'> 	oldl2agsize = bmp-&gt;db_agl2size;</div><div class='ctx'> </div><div class='ctx'> 	bmp-&gt;db_agl2size = l2agsize;</div><div class='del'>-	bmp-&gt;db_agsize = 1 &lt;&lt; l2agsize;</div><div class='add'>+	bmp-&gt;db_agsize = (s64)1 &lt;&lt; l2agsize;</div><div class='ctx'> </div><div class='ctx'> 	/* compute new number of AG */</div><div class='ctx'> 	agno = bmp-&gt;db_numag;</div><div class='hunk'>@@ -3671,8 +3663,8 @@ void dbFinalizeBmap(struct inode *ipbmap)</div><div class='ctx'> 	 * system size is not a multiple of the group size).</div><div class='ctx'> 	 */</div><div class='ctx'> 	inactfree = (inactags &amp;&amp; ag_rem) ?</div><div class='del'>-	    ((inactags - 1) &lt;&lt; bmp-&gt;db_agl2size) + ag_rem</div><div class='del'>-	    : inactags &lt;&lt; bmp-&gt;db_agl2size;</div><div class='add'>+	    (((s64)inactags - 1) &lt;&lt; bmp-&gt;db_agl2size) + ag_rem</div><div class='add'>+	    : ((s64)inactags &lt;&lt; bmp-&gt;db_agl2size);</div><div class='ctx'> </div><div class='ctx'> 	/* determine how many free blocks are in the active</div><div class='ctx'> 	 * allocation groups plus the average number of free blocks</div><div class='hunk'>@@ -3895,7 +3887,7 @@ static int dbInitTree(struct dmaptree * dtp)</div><div class='ctx'> 	l2max = le32_to_cpu(dtp-&gt;l2nleafs) + dtp-&gt;budmin;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * configure the leaf levevl into binary buddy system</div><div class='add'>+	 * configure the leaf level into binary buddy system</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * Try to combine buddies starting with a buddy size of 1</div><div class='ctx'> 	 * (i.e. two leaves). At a buddy size of 1 two buddy leaves</div><div class='head'>diff --git a/fs/jfs/jfs_dtree.c b/fs/jfs/jfs_dtree.c<br/>index 837d42f61464..0ab83bb7bbdf 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_dtree.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_dtree.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_dtree.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/jfs_dtree.c</a></div><div class='hunk'>@@ -117,7 +117,8 @@ do {									\</div><div class='ctx'> 	if (!(RC)) {							\</div><div class='ctx'> 		if (((P)-&gt;header.nextindex &gt;				\</div><div class='ctx'> 		     (((BN) == 0) ? DTROOTMAXSLOT : (P)-&gt;header.maxslot)) || \</div><div class='del'>-		    ((BN) &amp;&amp; ((P)-&gt;header.maxslot &gt; DTPAGEMAXSLOT))) {	\</div><div class='add'>+		    ((BN) &amp;&amp; (((P)-&gt;header.maxslot &gt; DTPAGEMAXSLOT) ||	\</div><div class='add'>+		    ((P)-&gt;header.stblindex &gt;= DTPAGEMAXSLOT)))) {	\</div><div class='ctx'> 			BT_PUTPAGE(MP);					\</div><div class='ctx'> 			jfs_error((IP)-&gt;i_sb,				\</div><div class='ctx'> 				  "DT_GETPAGE: dtree page corrupt\n");	\</div><div class='hunk'>@@ -633,6 +634,11 @@ int dtSearch(struct inode *ip, struct component_name * key, ino_t * data,</div><div class='ctx'> 		for (base = 0, lim = p-&gt;header.nextindex; lim; lim &gt;&gt;= 1) {</div><div class='ctx'> 			index = base + (lim &gt;&gt; 1);</div><div class='ctx'> </div><div class='add'>+			if (stbl[index] &lt; 0) {</div><div class='add'>+				rc = -EIO;</div><div class='add'>+				goto out;</div><div class='add'>+			}</div><div class='add'>+</div><div class='ctx'> 			if (p-&gt;header.flag &amp; BT_LEAF) {</div><div class='ctx'> 				/* uppercase leaf name to compare */</div><div class='ctx'> 				cmp =</div><div class='hunk'>@@ -829,6 +835,8 @@ int dtInsert(tid_t tid, struct inode *ip,</div><div class='ctx'> 	 * the full page.</div><div class='ctx'> 	 */</div><div class='ctx'> 	DT_GETSEARCH(ip, btstack-&gt;top, bn, mp, p, index);</div><div class='add'>+	if (p-&gt;header.freelist == 0)</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 *	insert entry for new key</div><div class='hunk'>@@ -1970,7 +1978,7 @@ static int dtSplitRoot(tid_t tid,</div><div class='ctx'> 		do {</div><div class='ctx'> 			f = &amp;rp-&gt;slot[fsi];</div><div class='ctx'> 			fsi = f-&gt;next;</div><div class='del'>-		} while (fsi != -1);</div><div class='add'>+		} while (fsi &gt;= 0);</div><div class='ctx'> </div><div class='ctx'> 		f-&gt;next = n;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2423,304 +2431,6 @@ static int dtDeleteUp(tid_t tid, struct inode *ip,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#ifdef _NOTYET</div><div class='del'>-/*</div><div class='del'>- * NAME:	dtRelocate()</div><div class='del'>- *</div><div class='del'>- * FUNCTION:	relocate dtpage (internal or leaf) of directory;</div><div class='del'>- *		This function is mainly used by defragfs utility.</div><div class='del'>- */</div><div class='del'>-int dtRelocate(tid_t tid, struct inode *ip, s64 lmxaddr, pxd_t * opxd,</div><div class='del'>-	       s64 nxaddr)</div><div class='del'>-{</div><div class='del'>-	int rc = 0;</div><div class='del'>-	struct metapage *mp, *pmp, *lmp, *rmp;</div><div class='del'>-	dtpage_t *p, *pp, *rp = 0, *lp= 0;</div><div class='del'>-	s64 bn;</div><div class='del'>-	int index;</div><div class='del'>-	struct btstack btstack;</div><div class='del'>-	pxd_t *pxd;</div><div class='del'>-	s64 oxaddr, nextbn, prevbn;</div><div class='del'>-	int xlen, xsize;</div><div class='del'>-	struct tlock *tlck;</div><div class='del'>-	struct dt_lock *dtlck;</div><div class='del'>-	struct pxd_lock *pxdlock;</div><div class='del'>-	s8 *stbl;</div><div class='del'>-	struct lv *lv;</div><div class='del'>-</div><div class='del'>-	oxaddr = addressPXD(opxd);</div><div class='del'>-	xlen = lengthPXD(opxd);</div><div class='del'>-</div><div class='del'>-	jfs_info("dtRelocate: lmxaddr:%Ld xaddr:%Ld:%Ld xlen:%d",</div><div class='del'>-		   (long long)lmxaddr, (long long)oxaddr, (long long)nxaddr,</div><div class='del'>-		   xlen);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 *	1. get the internal parent dtpage covering</div><div class='del'>-	 *	router entry for the tartget page to be relocated;</div><div class='del'>-	 */</div><div class='del'>-	rc = dtSearchNode(ip, lmxaddr, opxd, &amp;btstack);</div><div class='del'>-	if (rc)</div><div class='del'>-		return rc;</div><div class='del'>-</div><div class='del'>-	/* retrieve search result */</div><div class='del'>-	DT_GETSEARCH(ip, btstack.top, bn, pmp, pp, index);</div><div class='del'>-	jfs_info("dtRelocate: parent router entry validated.");</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 *	2. relocate the target dtpage</div><div class='del'>-	 */</div><div class='del'>-	/* read in the target page from src extent */</div><div class='del'>-	DT_GETPAGE(ip, oxaddr, mp, PSIZE, p, rc);</div><div class='del'>-	if (rc) {</div><div class='del'>-		/* release the pinned parent page */</div><div class='del'>-		DT_PUTPAGE(pmp);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * read in sibling pages if any to update sibling pointers;</div><div class='del'>-	 */</div><div class='del'>-	rmp = NULL;</div><div class='del'>-	if (p-&gt;header.next) {</div><div class='del'>-		nextbn = le64_to_cpu(p-&gt;header.next);</div><div class='del'>-		DT_GETPAGE(ip, nextbn, rmp, PSIZE, rp, rc);</div><div class='del'>-		if (rc) {</div><div class='del'>-			DT_PUTPAGE(mp);</div><div class='del'>-			DT_PUTPAGE(pmp);</div><div class='del'>-			return (rc);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	lmp = NULL;</div><div class='del'>-	if (p-&gt;header.prev) {</div><div class='del'>-		prevbn = le64_to_cpu(p-&gt;header.prev);</div><div class='del'>-		DT_GETPAGE(ip, prevbn, lmp, PSIZE, lp, rc);</div><div class='del'>-		if (rc) {</div><div class='del'>-			DT_PUTPAGE(mp);</div><div class='del'>-			DT_PUTPAGE(pmp);</div><div class='del'>-			if (rmp)</div><div class='del'>-				DT_PUTPAGE(rmp);</div><div class='del'>-			return (rc);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* at this point, all xtpages to be updated are in memory */</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * update sibling pointers of sibling dtpages if any;</div><div class='del'>-	 */</div><div class='del'>-	if (lmp) {</div><div class='del'>-		tlck = txLock(tid, ip, lmp, tlckDTREE | tlckRELINK);</div><div class='del'>-		dtlck = (struct dt_lock *) &amp; tlck-&gt;lock;</div><div class='del'>-		/* linelock header */</div><div class='del'>-		ASSERT(dtlck-&gt;index == 0);</div><div class='del'>-		lv = &amp; dtlck-&gt;lv[0];</div><div class='del'>-		lv-&gt;offset = 0;</div><div class='del'>-		lv-&gt;length = 1;</div><div class='del'>-		dtlck-&gt;index++;</div><div class='del'>-</div><div class='del'>-		lp-&gt;header.next = cpu_to_le64(nxaddr);</div><div class='del'>-		DT_PUTPAGE(lmp);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (rmp) {</div><div class='del'>-		tlck = txLock(tid, ip, rmp, tlckDTREE | tlckRELINK);</div><div class='del'>-		dtlck = (struct dt_lock *) &amp; tlck-&gt;lock;</div><div class='del'>-		/* linelock header */</div><div class='del'>-		ASSERT(dtlck-&gt;index == 0);</div><div class='del'>-		lv = &amp; dtlck-&gt;lv[0];</div><div class='del'>-		lv-&gt;offset = 0;</div><div class='del'>-		lv-&gt;length = 1;</div><div class='del'>-		dtlck-&gt;index++;</div><div class='del'>-</div><div class='del'>-		rp-&gt;header.prev = cpu_to_le64(nxaddr);</div><div class='del'>-		DT_PUTPAGE(rmp);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * update the target dtpage to be relocated</div><div class='del'>-	 *</div><div class='del'>-	 * write LOG_REDOPAGE of LOG_NEW type for dst page</div><div class='del'>-	 * for the whole target page (logredo() will apply</div><div class='del'>-	 * after image and update bmap for allocation of the</div><div class='del'>-	 * dst extent), and update bmap for allocation of</div><div class='del'>-	 * the dst extent;</div><div class='del'>-	 */</div><div class='del'>-	tlck = txLock(tid, ip, mp, tlckDTREE | tlckNEW);</div><div class='del'>-	dtlck = (struct dt_lock *) &amp; tlck-&gt;lock;</div><div class='del'>-	/* linelock header */</div><div class='del'>-	ASSERT(dtlck-&gt;index == 0);</div><div class='del'>-	lv = &amp; dtlck-&gt;lv[0];</div><div class='del'>-</div><div class='del'>-	/* update the self address in the dtpage header */</div><div class='del'>-	pxd = &amp;p-&gt;header.self;</div><div class='del'>-	PXDaddress(pxd, nxaddr);</div><div class='del'>-</div><div class='del'>-	/* the dst page is the same as the src page, i.e.,</div><div class='del'>-	 * linelock for afterimage of the whole page;</div><div class='del'>-	 */</div><div class='del'>-	lv-&gt;offset = 0;</div><div class='del'>-	lv-&gt;length = p-&gt;header.maxslot;</div><div class='del'>-	dtlck-&gt;index++;</div><div class='del'>-</div><div class='del'>-	/* update the buffer extent descriptor of the dtpage */</div><div class='del'>-	xsize = xlen &lt;&lt; JFS_SBI(ip-&gt;i_sb)-&gt;l2bsize;</div><div class='del'>-</div><div class='del'>-	/* unpin the relocated page */</div><div class='del'>-	DT_PUTPAGE(mp);</div><div class='del'>-	jfs_info("dtRelocate: target dtpage relocated.");</div><div class='del'>-</div><div class='del'>-	/* the moved extent is dtpage, then a LOG_NOREDOPAGE log rec</div><div class='del'>-	 * needs to be written (in logredo(), the LOG_NOREDOPAGE log rec</div><div class='del'>-	 * will also force a bmap update ).</div><div class='del'>-	 */</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 *	3. acquire maplock for the source extent to be freed;</div><div class='del'>-	 */</div><div class='del'>-	/* for dtpage relocation, write a LOG_NOREDOPAGE record</div><div class='del'>-	 * for the source dtpage (logredo() will init NoRedoPage</div><div class='del'>-	 * filter and will also update bmap for free of the source</div><div class='del'>-	 * dtpage), and upadte bmap for free of the source dtpage;</div><div class='del'>-	 */</div><div class='del'>-	tlck = txMaplock(tid, ip, tlckDTREE | tlckFREE);</div><div class='del'>-	pxdlock = (struct pxd_lock *) &amp; tlck-&gt;lock;</div><div class='del'>-	pxdlock-&gt;flag = mlckFREEPXD;</div><div class='del'>-	PXDaddress(&amp;pxdlock-&gt;pxd, oxaddr);</div><div class='del'>-	PXDlength(&amp;pxdlock-&gt;pxd, xlen);</div><div class='del'>-	pxdlock-&gt;index = 1;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 *	4. update the parent router entry for relocation;</div><div class='del'>-	 *</div><div class='del'>-	 * acquire tlck for the parent entry covering the target dtpage;</div><div class='del'>-	 * write LOG_REDOPAGE to apply after image only;</div><div class='del'>-	 */</div><div class='del'>-	jfs_info("dtRelocate: update parent router entry.");</div><div class='del'>-	tlck = txLock(tid, ip, pmp, tlckDTREE | tlckENTRY);</div><div class='del'>-	dtlck = (struct dt_lock *) &amp; tlck-&gt;lock;</div><div class='del'>-	lv = &amp; dtlck-&gt;lv[dtlck-&gt;index];</div><div class='del'>-</div><div class='del'>-	/* update the PXD with the new address */</div><div class='del'>-	stbl = DT_GETSTBL(pp);</div><div class='del'>-	pxd = (pxd_t *) &amp; pp-&gt;slot[stbl[index]];</div><div class='del'>-	PXDaddress(pxd, nxaddr);</div><div class='del'>-	lv-&gt;offset = stbl[index];</div><div class='del'>-	lv-&gt;length = 1;</div><div class='del'>-	dtlck-&gt;index++;</div><div class='del'>-</div><div class='del'>-	/* unpin the parent dtpage */</div><div class='del'>-	DT_PUTPAGE(pmp);</div><div class='del'>-</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * NAME:	dtSearchNode()</div><div class='del'>- *</div><div class='del'>- * FUNCTION:	Search for an dtpage containing a specified address</div><div class='del'>- *		This function is mainly used by defragfs utility.</div><div class='del'>- *</div><div class='del'>- * NOTE:	Search result on stack, the found page is pinned at exit.</div><div class='del'>- *		The result page must be an internal dtpage.</div><div class='del'>- *		lmxaddr give the address of the left most page of the</div><div class='del'>- *		dtree level, in which the required dtpage resides.</div><div class='del'>- */</div><div class='del'>-static int dtSearchNode(struct inode *ip, s64 lmxaddr, pxd_t * kpxd,</div><div class='del'>-			struct btstack * btstack)</div><div class='del'>-{</div><div class='del'>-	int rc = 0;</div><div class='del'>-	s64 bn;</div><div class='del'>-	struct metapage *mp;</div><div class='del'>-	dtpage_t *p;</div><div class='del'>-	int psize = 288;	/* initial in-line directory */</div><div class='del'>-	s8 *stbl;</div><div class='del'>-	int i;</div><div class='del'>-	pxd_t *pxd;</div><div class='del'>-	struct btframe *btsp;</div><div class='del'>-</div><div class='del'>-	BT_CLR(btstack);	/* reset stack */</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 *	descend tree to the level with specified leftmost page</div><div class='del'>-	 *</div><div class='del'>-	 *  by convention, root bn = 0.</div><div class='del'>-	 */</div><div class='del'>-	for (bn = 0;;) {</div><div class='del'>-		/* get/pin the page to search */</div><div class='del'>-		DT_GETPAGE(ip, bn, mp, psize, p, rc);</div><div class='del'>-		if (rc)</div><div class='del'>-			return rc;</div><div class='del'>-</div><div class='del'>-		/* does the xaddr of leftmost page of the levevl</div><div class='del'>-		 * matches levevl search key ?</div><div class='del'>-		 */</div><div class='del'>-		if (p-&gt;header.flag &amp; BT_ROOT) {</div><div class='del'>-			if (lmxaddr == 0)</div><div class='del'>-				break;</div><div class='del'>-		} else if (addressPXD(&amp;p-&gt;header.self) == lmxaddr)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * descend down to leftmost child page</div><div class='del'>-		 */</div><div class='del'>-		if (p-&gt;header.flag &amp; BT_LEAF) {</div><div class='del'>-			DT_PUTPAGE(mp);</div><div class='del'>-			return -ESTALE;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/* get the leftmost entry */</div><div class='del'>-		stbl = DT_GETSTBL(p);</div><div class='del'>-		pxd = (pxd_t *) &amp; p-&gt;slot[stbl[0]];</div><div class='del'>-</div><div class='del'>-		/* get the child page block address */</div><div class='del'>-		bn = addressPXD(pxd);</div><div class='del'>-		psize = lengthPXD(pxd) &lt;&lt; JFS_SBI(ip-&gt;i_sb)-&gt;l2bsize;</div><div class='del'>-		/* unpin the parent page */</div><div class='del'>-		DT_PUTPAGE(mp);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 *	search each page at the current levevl</div><div class='del'>-	 */</div><div class='del'>-      loop:</div><div class='del'>-	stbl = DT_GETSTBL(p);</div><div class='del'>-	for (i = 0; i &lt; p-&gt;header.nextindex; i++) {</div><div class='del'>-		pxd = (pxd_t *) &amp; p-&gt;slot[stbl[i]];</div><div class='del'>-</div><div class='del'>-		/* found the specified router entry */</div><div class='del'>-		if (addressPXD(pxd) == addressPXD(kpxd) &amp;&amp;</div><div class='del'>-		    lengthPXD(pxd) == lengthPXD(kpxd)) {</div><div class='del'>-			btsp = btstack-&gt;top;</div><div class='del'>-			btsp-&gt;bn = bn;</div><div class='del'>-			btsp-&gt;index = i;</div><div class='del'>-			btsp-&gt;mp = mp;</div><div class='del'>-</div><div class='del'>-			return 0;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* get the right sibling page if any */</div><div class='del'>-	if (p-&gt;header.next)</div><div class='del'>-		bn = le64_to_cpu(p-&gt;header.next);</div><div class='del'>-	else {</div><div class='del'>-		DT_PUTPAGE(mp);</div><div class='del'>-		return -ESTALE;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* unpin current page */</div><div class='del'>-	DT_PUTPAGE(mp);</div><div class='del'>-</div><div class='del'>-	/* get the right sibling page */</div><div class='del'>-	DT_GETPAGE(ip, bn, mp, PSIZE, p, rc);</div><div class='del'>-	if (rc)</div><div class='del'>-		return rc;</div><div class='del'>-</div><div class='del'>-	goto loop;</div><div class='del'>-}</div><div class='del'>-#endif /* _NOTYET */</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  *	dtRelink()</div><div class='ctx'>  *</div><div class='hunk'>@@ -2903,7 +2613,7 @@ void dtInitRoot(tid_t tid, struct inode *ip, u32 idotdot)</div><div class='ctx'>  *	     fsck.jfs should really fix this, but it currently does not.</div><div class='ctx'>  *	     Called from jfs_readdir when bad index is detected.</div><div class='ctx'>  */</div><div class='del'>-static void add_missing_indices(struct inode *inode, s64 bn)</div><div class='add'>+static int add_missing_indices(struct inode *inode, s64 bn)</div><div class='ctx'> {</div><div class='ctx'> 	struct ldtentry *d;</div><div class='ctx'> 	struct dt_lock *dtlck;</div><div class='hunk'>@@ -2912,7 +2622,7 @@ static void add_missing_indices(struct inode *inode, s64 bn)</div><div class='ctx'> 	struct lv *lv;</div><div class='ctx'> 	struct metapage *mp;</div><div class='ctx'> 	dtpage_t *p;</div><div class='del'>-	int rc;</div><div class='add'>+	int rc = 0;</div><div class='ctx'> 	s8 *stbl;</div><div class='ctx'> 	tid_t tid;</div><div class='ctx'> 	struct tlock *tlck;</div><div class='hunk'>@@ -2937,6 +2647,16 @@ static void add_missing_indices(struct inode *inode, s64 bn)</div><div class='ctx'> </div><div class='ctx'> 	stbl = DT_GETSTBL(p);</div><div class='ctx'> 	for (i = 0; i &lt; p-&gt;header.nextindex; i++) {</div><div class='add'>+		if (stbl[i] &lt; 0) {</div><div class='add'>+			jfs_err("jfs: add_missing_indices: Invalid stbl[%d] = %d for inode %ld, block = %lld",</div><div class='add'>+				i, stbl[i], (long)inode-&gt;i_ino, (long long)bn);</div><div class='add'>+			rc = -EIO;</div><div class='add'>+</div><div class='add'>+			DT_PUTPAGE(mp);</div><div class='add'>+			txAbort(tid, 0);</div><div class='add'>+			goto end;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		d = (struct ldtentry *) &amp;p-&gt;slot[stbl[i]];</div><div class='ctx'> 		index = le32_to_cpu(d-&gt;index);</div><div class='ctx'> 		if ((index &lt; 2) || (index &gt;= JFS_IP(inode)-&gt;next_index)) {</div><div class='hunk'>@@ -2954,6 +2674,7 @@ static void add_missing_indices(struct inode *inode, s64 bn)</div><div class='ctx'> 	(void) txCommit(tid, 1, &amp;inode, 0);</div><div class='ctx'> end:</div><div class='ctx'> 	txEnd(tid);</div><div class='add'>+	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -3182,6 +2903,14 @@ int jfs_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 		stbl = DT_GETSTBL(p);</div><div class='ctx'> </div><div class='ctx'> 		for (i = index; i &lt; p-&gt;header.nextindex; i++) {</div><div class='add'>+			if (stbl[i] &lt; 0 || stbl[i] &gt;= DTPAGEMAXSLOT) {</div><div class='add'>+				jfs_err("JFS: Invalid stbl[%d] = %d for inode %ld, block = %lld",</div><div class='add'>+					i, stbl[i], (long)ip-&gt;i_ino, (long long)bn);</div><div class='add'>+				free_page(dirent_buf);</div><div class='add'>+				DT_PUTPAGE(mp);</div><div class='add'>+				return -EIO;</div><div class='add'>+			}</div><div class='add'>+</div><div class='ctx'> 			d = (struct ldtentry *) &amp; p-&gt;slot[stbl[i]];</div><div class='ctx'> </div><div class='ctx'> 			if (((long) jfs_dirent + d-&gt;namlen + 1) &gt;</div><div class='hunk'>@@ -3299,7 +3028,8 @@ skip_one:</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (fix_page) {</div><div class='del'>-			add_missing_indices(ip, bn);</div><div class='add'>+			if ((rc = add_missing_indices(ip, bn)))</div><div class='add'>+				goto out;</div><div class='ctx'> 			page_fixed = 1;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -3377,6 +3107,13 @@ static int dtReadFirst(struct inode *ip, struct btstack * btstack)</div><div class='ctx'> </div><div class='ctx'> 		/* get the leftmost entry */</div><div class='ctx'> 		stbl = DT_GETSTBL(p);</div><div class='add'>+</div><div class='add'>+		if (stbl[0] &lt; 0 || stbl[0] &gt;= DTPAGEMAXSLOT) {</div><div class='add'>+			DT_PUTPAGE(mp);</div><div class='add'>+			jfs_error(ip-&gt;i_sb, "stbl[0] out of bound\n");</div><div class='add'>+			return -EIO;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		xd = (pxd_t *) &amp; p-&gt;slot[stbl[0]];</div><div class='ctx'> </div><div class='ctx'> 		/* get the child page block address */</div><div class='head'>diff --git a/fs/jfs/jfs_extent.c b/fs/jfs/jfs_extent.c<br/>index bb4a342a193d..46529bcc8297 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_extent.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_extent.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_extent.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/jfs_extent.c</a></div><div class='hunk'>@@ -16,9 +16,6 @@</div><div class='ctx'>  * forward references</div><div class='ctx'>  */</div><div class='ctx'> static int extBalloc(struct inode *, s64, s64 *, s64 *);</div><div class='del'>-#ifdef _NOTYET</div><div class='del'>-static int extBrealloc(struct inode *, s64, s64, s64 *, s64 *);</div><div class='del'>-#endif</div><div class='ctx'> static s64 extRoundDown(s64 nb);</div><div class='ctx'> </div><div class='ctx'> #define DPD(a)		(printk("(a): %d\n",(a)))</div><div class='hunk'>@@ -77,6 +74,11 @@ extAlloc(struct inode *ip, s64 xlen, s64 pno, xad_t * xp, bool abnr)</div><div class='ctx'> 	int rc;</div><div class='ctx'> 	int xflag;</div><div class='ctx'> </div><div class='add'>+	if (isReadOnly(ip)) {</div><div class='add'>+		jfs_error(ip-&gt;i_sb, "read-only filesystem\n");</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/* This blocks if we are low on resources */</div><div class='ctx'> 	txBeginAnon(ip-&gt;i_sb);</div><div class='ctx'> </div><div class='hunk'>@@ -169,7 +171,7 @@ extAlloc(struct inode *ip, s64 xlen, s64 pno, xad_t * xp, bool abnr)</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * COMMIT_SyncList flags an anonymous tlock on page that is on</div><div class='ctx'> 	 * sync list.</div><div class='del'>-	 * We need to commit the inode to get the page written disk.</div><div class='add'>+	 * We need to commit the inode to get the page written to the disk.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (test_and_clear_cflag(COMMIT_Synclist,ip))</div><div class='ctx'> 		jfs_commit_inode(ip, 0);</div><div class='hunk'>@@ -177,162 +179,6 @@ extAlloc(struct inode *ip, s64 xlen, s64 pno, xad_t * xp, bool abnr)</div><div class='ctx'> 	return (0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-</div><div class='del'>-#ifdef _NOTYET</div><div class='del'>-/*</div><div class='del'>- * NAME:	extRealloc()</div><div class='del'>- *</div><div class='del'>- * FUNCTION:	extend the allocation of a file extent containing a</div><div class='del'>- *		partial back last page.</div><div class='del'>- *</div><div class='del'>- * PARAMETERS:</div><div class='del'>- *	ip	- the inode of the file.</div><div class='del'>- *	cp	- cbuf for the partial backed last page.</div><div class='del'>- *	xlen	- request size of the resulting extent.</div><div class='del'>- *	xp	- pointer to an xad. on successful exit, the xad</div><div class='del'>- *		  describes the newly allocated extent.</div><div class='del'>- *	abnr	- bool indicating whether the newly allocated extent</div><div class='del'>- *		  should be marked as allocated but not recorded.</div><div class='del'>- *</div><div class='del'>- * RETURN VALUES:</div><div class='del'>- *	0	- success</div><div class='del'>- *	-EIO	- i/o error.</div><div class='del'>- *	-ENOSPC	- insufficient disk resources.</div><div class='del'>- */</div><div class='del'>-int extRealloc(struct inode *ip, s64 nxlen, xad_t * xp, bool abnr)</div><div class='del'>-{</div><div class='del'>-	struct super_block *sb = ip-&gt;i_sb;</div><div class='del'>-	s64 xaddr, xlen, nxaddr, delta, xoff;</div><div class='del'>-	s64 ntail, nextend, ninsert;</div><div class='del'>-	int rc, nbperpage = JFS_SBI(sb)-&gt;nbperpage;</div><div class='del'>-	int xflag;</div><div class='del'>-</div><div class='del'>-	/* This blocks if we are low on resources */</div><div class='del'>-	txBeginAnon(ip-&gt;i_sb);</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;JFS_IP(ip)-&gt;commit_mutex);</div><div class='del'>-	/* validate extent length */</div><div class='del'>-	if (nxlen &gt; MAXXLEN)</div><div class='del'>-		nxlen = MAXXLEN;</div><div class='del'>-</div><div class='del'>-	/* get the extend (partial) page's disk block address and</div><div class='del'>-	 * number of blocks.</div><div class='del'>-	 */</div><div class='del'>-	xaddr = addressXAD(xp);</div><div class='del'>-	xlen = lengthXAD(xp);</div><div class='del'>-	xoff = offsetXAD(xp);</div><div class='del'>-</div><div class='del'>-	/* if the extend page is abnr and if the request is for</div><div class='del'>-	 * the extent to be allocated and recorded,</div><div class='del'>-	 * make the page allocated and recorded.</div><div class='del'>-	 */</div><div class='del'>-	if ((xp-&gt;flag &amp; XAD_NOTRECORDED) &amp;&amp; !abnr) {</div><div class='del'>-		xp-&gt;flag = 0;</div><div class='del'>-		if ((rc = xtUpdate(0, ip, xp)))</div><div class='del'>-			goto exit;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* try to allocated the request number of blocks for the</div><div class='del'>-	 * extent.  dbRealloc() first tries to satisfy the request</div><div class='del'>-	 * by extending the allocation in place. otherwise, it will</div><div class='del'>-	 * try to allocate a new set of blocks large enough for the</div><div class='del'>-	 * request.  in satisfying a request, dbReAlloc() may allocate</div><div class='del'>-	 * less than what was request but will always allocate enough</div><div class='del'>-	 * space as to satisfy the extend page.</div><div class='del'>-	 */</div><div class='del'>-	if ((rc = extBrealloc(ip, xaddr, xlen, &amp;nxlen, &amp;nxaddr)))</div><div class='del'>-		goto exit;</div><div class='del'>-</div><div class='del'>-	/* Allocat blocks to quota. */</div><div class='del'>-	rc = dquot_alloc_block(ip, nxlen);</div><div class='del'>-	if (rc) {</div><div class='del'>-		dbFree(ip, nxaddr, (s64) nxlen);</div><div class='del'>-		mutex_unlock(&amp;JFS_IP(ip)-&gt;commit_mutex);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	delta = nxlen - xlen;</div><div class='del'>-</div><div class='del'>-	/* check if the extend page is not abnr but the request is abnr</div><div class='del'>-	 * and the allocated disk space is for more than one page.  if this</div><div class='del'>-	 * is the case, there is a miss match of abnr between the extend page</div><div class='del'>-	 * and the one or more pages following the extend page.  as a result,</div><div class='del'>-	 * two extents will have to be manipulated. the first will be that</div><div class='del'>-	 * of the extent of the extend page and will be manipulated thru</div><div class='del'>-	 * an xtExtend() or an xtTailgate(), depending upon whether the</div><div class='del'>-	 * disk allocation occurred as an inplace extension.  the second</div><div class='del'>-	 * extent will be manipulated (created) through an xtInsert() and</div><div class='del'>-	 * will be for the pages following the extend page.</div><div class='del'>-	 */</div><div class='del'>-	if (abnr &amp;&amp; (!(xp-&gt;flag &amp; XAD_NOTRECORDED)) &amp;&amp; (nxlen &gt; nbperpage)) {</div><div class='del'>-		ntail = nbperpage;</div><div class='del'>-		nextend = ntail - xlen;</div><div class='del'>-		ninsert = nxlen - nbperpage;</div><div class='del'>-</div><div class='del'>-		xflag = XAD_NOTRECORDED;</div><div class='del'>-	} else {</div><div class='del'>-		ntail = nxlen;</div><div class='del'>-		nextend = delta;</div><div class='del'>-		ninsert = 0;</div><div class='del'>-</div><div class='del'>-		xflag = xp-&gt;flag;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* if we were able to extend the disk allocation in place,</div><div class='del'>-	 * extend the extent.  otherwise, move the extent to a</div><div class='del'>-	 * new disk location.</div><div class='del'>-	 */</div><div class='del'>-	if (xaddr == nxaddr) {</div><div class='del'>-		/* extend the extent */</div><div class='del'>-		if ((rc = xtExtend(0, ip, xoff + xlen, (int) nextend, 0))) {</div><div class='del'>-			dbFree(ip, xaddr + xlen, delta);</div><div class='del'>-			dquot_free_block(ip, nxlen);</div><div class='del'>-			goto exit;</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-		/*</div><div class='del'>-		 * move the extent to a new location:</div><div class='del'>-		 *</div><div class='del'>-		 * xtTailgate() accounts for relocated tail extent;</div><div class='del'>-		 */</div><div class='del'>-		if ((rc = xtTailgate(0, ip, xoff, (int) ntail, nxaddr, 0))) {</div><div class='del'>-			dbFree(ip, nxaddr, nxlen);</div><div class='del'>-			dquot_free_block(ip, nxlen);</div><div class='del'>-			goto exit;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-	/* check if we need to also insert a new extent */</div><div class='del'>-	if (ninsert) {</div><div class='del'>-		/* perform the insert.  if it fails, free the blocks</div><div class='del'>-		 * to be inserted and make it appear that we only did</div><div class='del'>-		 * the xtExtend() or xtTailgate() above.</div><div class='del'>-		 */</div><div class='del'>-		xaddr = nxaddr + ntail;</div><div class='del'>-		if (xtInsert (0, ip, xflag, xoff + ntail, (int) ninsert,</div><div class='del'>-			      &amp;xaddr, 0)) {</div><div class='del'>-			dbFree(ip, xaddr, (s64) ninsert);</div><div class='del'>-			delta = nextend;</div><div class='del'>-			nxlen = ntail;</div><div class='del'>-			xflag = 0;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* set the return results */</div><div class='del'>-	XADaddress(xp, nxaddr);</div><div class='del'>-	XADlength(xp, nxlen);</div><div class='del'>-	XADoffset(xp, xoff);</div><div class='del'>-	xp-&gt;flag = xflag;</div><div class='del'>-</div><div class='del'>-	mark_inode_dirty(ip);</div><div class='del'>-exit:</div><div class='del'>-	mutex_unlock(&amp;JFS_IP(ip)-&gt;commit_mutex);</div><div class='del'>-	return (rc);</div><div class='del'>-}</div><div class='del'>-#endif			/* _NOTYET */</div><div class='del'>-</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * NAME:	extHint()</div><div class='ctx'>  *</div><div class='hunk'>@@ -412,6 +258,11 @@ int extRecord(struct inode *ip, xad_t * xp)</div><div class='ctx'> {</div><div class='ctx'> 	int rc;</div><div class='ctx'> </div><div class='add'>+	if (isReadOnly(ip)) {</div><div class='add'>+		jfs_error(ip-&gt;i_sb, "read-only filesystem\n");</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	txBeginAnon(ip-&gt;i_sb);</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;JFS_IP(ip)-&gt;commit_mutex);</div><div class='hunk'>@@ -423,44 +274,6 @@ int extRecord(struct inode *ip, xad_t * xp)</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-</div><div class='del'>-#ifdef _NOTYET</div><div class='del'>-/*</div><div class='del'>- * NAME:	extFill()</div><div class='del'>- *</div><div class='del'>- * FUNCTION:	allocate disk space for a file page that represents</div><div class='del'>- *		a file hole.</div><div class='del'>- *</div><div class='del'>- * PARAMETERS:</div><div class='del'>- *	ip	- the inode of the file.</div><div class='del'>- *	cp	- cbuf of the file page represent the hole.</div><div class='del'>- *</div><div class='del'>- * RETURN VALUES:</div><div class='del'>- *	0	- success</div><div class='del'>- *	-EIO	- i/o error.</div><div class='del'>- *	-ENOSPC	- insufficient disk resources.</div><div class='del'>- */</div><div class='del'>-int extFill(struct inode *ip, xad_t * xp)</div><div class='del'>-{</div><div class='del'>-	int rc, nbperpage = JFS_SBI(ip-&gt;i_sb)-&gt;nbperpage;</div><div class='del'>-	s64 blkno = offsetXAD(xp) &gt;&gt; ip-&gt;i_blkbits;</div><div class='del'>-</div><div class='del'>-//	assert(ISSPARSE(ip));</div><div class='del'>-</div><div class='del'>-	/* initialize the extent allocation hint */</div><div class='del'>-	XADaddress(xp, 0);</div><div class='del'>-</div><div class='del'>-	/* allocate an extent to fill the hole */</div><div class='del'>-	if ((rc = extAlloc(ip, nbperpage, blkno, xp, false)))</div><div class='del'>-		return (rc);</div><div class='del'>-</div><div class='del'>-	assert(lengthPXD(xp) == nbperpage);</div><div class='del'>-</div><div class='del'>-	return (0);</div><div class='del'>-}</div><div class='del'>-#endif			/* _NOTYET */</div><div class='del'>-</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * NAME:	extBalloc()</div><div class='ctx'>  *</div><div class='hunk'>@@ -508,6 +321,11 @@ extBalloc(struct inode *ip, s64 hint, s64 * nblocks, s64 * blkno)</div><div class='ctx'> 	 * blocks in the map. in that case, we'll start off with the</div><div class='ctx'> 	 * maximum free.</div><div class='ctx'> 	 */</div><div class='add'>+</div><div class='add'>+	/* give up if no space left */</div><div class='add'>+	if (bmp-&gt;db_maxfreebud == -1)</div><div class='add'>+		return -ENOSPC;</div><div class='add'>+</div><div class='ctx'> 	max = (s64) 1 &lt;&lt; bmp-&gt;db_maxfreebud;</div><div class='ctx'> 	if (*nblocks &gt;= max &amp;&amp; *nblocks &gt; nbperpage)</div><div class='ctx'> 		nb = nblks = (max &gt; nbperpage) ? max : nbperpage;</div><div class='hunk'>@@ -550,64 +368,6 @@ extBalloc(struct inode *ip, s64 hint, s64 * nblocks, s64 * blkno)</div><div class='ctx'> 	return (0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-</div><div class='del'>-#ifdef _NOTYET</div><div class='del'>-/*</div><div class='del'>- * NAME:	extBrealloc()</div><div class='del'>- *</div><div class='del'>- * FUNCTION:	attempt to extend an extent's allocation.</div><div class='del'>- *</div><div class='del'>- *		Initially, we will try to extend the extent's allocation</div><div class='del'>- *		in place.  If this fails, we'll try to move the extent</div><div class='del'>- *		to a new set of blocks.  If moving the extent, we initially</div><div class='del'>- *		will try to allocate disk blocks for the requested size</div><div class='del'>- *		(newnblks).  if this fails (new contiguous free blocks not</div><div class='del'>- *		available), we'll try to allocate a smaller number of</div><div class='del'>- *		blocks (producing a smaller extent), with this smaller</div><div class='del'>- *		number of blocks consisting of the requested number of</div><div class='del'>- *		blocks rounded down to the next smaller power of 2</div><div class='del'>- *		number (i.e. 16 -&gt; 8).  We'll continue to round down and</div><div class='del'>- *		retry the allocation until the number of blocks to allocate</div><div class='del'>- *		is smaller than the number of blocks per page.</div><div class='del'>- *</div><div class='del'>- * PARAMETERS:</div><div class='del'>- *	ip	 - the inode of the file.</div><div class='del'>- *	blkno	 - starting block number of the extents current allocation.</div><div class='del'>- *	nblks	 - number of blocks within the extents current allocation.</div><div class='del'>- *	newnblks - pointer to a s64 value.  on entry, this value is the</div><div class='del'>- *		   new desired extent size (number of blocks).  on</div><div class='del'>- *		   successful exit, this value is set to the extent's actual</div><div class='del'>- *		   new size (new number of blocks).</div><div class='del'>- *	newblkno - the starting block number of the extents new allocation.</div><div class='del'>- *</div><div class='del'>- * RETURN VALUES:</div><div class='del'>- *	0	- success</div><div class='del'>- *	-EIO	- i/o error.</div><div class='del'>- *	-ENOSPC	- insufficient disk resources.</div><div class='del'>- */</div><div class='del'>-static int</div><div class='del'>-extBrealloc(struct inode *ip,</div><div class='del'>-	    s64 blkno, s64 nblks, s64 * newnblks, s64 * newblkno)</div><div class='del'>-{</div><div class='del'>-	int rc;</div><div class='del'>-</div><div class='del'>-	/* try to extend in place */</div><div class='del'>-	if ((rc = dbExtend(ip, blkno, nblks, *newnblks - nblks)) == 0) {</div><div class='del'>-		*newblkno = blkno;</div><div class='del'>-		return (0);</div><div class='del'>-	} else {</div><div class='del'>-		if (rc != -ENOSPC)</div><div class='del'>-			return (rc);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* in place extension not possible.</div><div class='del'>-	 * try to move the extent to a new set of blocks.</div><div class='del'>-	 */</div><div class='del'>-	return (extBalloc(ip, blkno, newnblks, newblkno));</div><div class='del'>-}</div><div class='del'>-#endif			/* _NOTYET */</div><div class='del'>-</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * NAME:	extRoundDown()</div><div class='ctx'>  *</div><div class='head'>diff --git a/fs/jfs/jfs_extent.h b/fs/jfs/jfs_extent.h<br/>index 1c984214e95e..a0ee4ccea66e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_extent.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_extent.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_extent.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/jfs_extent.h</a></div><div class='hunk'>@@ -10,9 +10,7 @@</div><div class='ctx'> 	(addressPXD(&amp;(JFS_IP(ip)-&gt;ixpxd)) + lengthPXD(&amp;(JFS_IP(ip)-&gt;ixpxd)) - 1)</div><div class='ctx'> </div><div class='ctx'> extern int	extAlloc(struct inode *, s64, s64, xad_t *, bool);</div><div class='del'>-extern int	extFill(struct inode *, xad_t *);</div><div class='ctx'> extern int	extHint(struct inode *, s64, xad_t *);</div><div class='del'>-extern int	extRealloc(struct inode *, s64, xad_t *, bool);</div><div class='ctx'> extern int	extRecord(struct inode *, xad_t *);</div><div class='ctx'> </div><div class='ctx'> #endif	/* _H_JFS_EXTENT */</div><div class='head'>diff --git a/fs/jfs/jfs_filsys.h b/fs/jfs/jfs_filsys.h<br/>index b5d702df7111..8794281f8ffd 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_filsys.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_filsys.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_filsys.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/jfs_filsys.h</a></div><div class='hunk'>@@ -24,6 +24,7 @@</div><div class='ctx'> #define JFS_ERR_REMOUNT_RO 0x00000002	/* remount read-only */</div><div class='ctx'> #define JFS_ERR_CONTINUE   0x00000004	/* continue */</div><div class='ctx'> #define JFS_ERR_PANIC      0x00000008	/* panic */</div><div class='add'>+#define JFS_ERR_MASK	   (JFS_ERR_REMOUNT_RO|JFS_ERR_CONTINUE|JFS_ERR_PANIC)</div><div class='ctx'> </div><div class='ctx'> /* Quota support */</div><div class='ctx'> #define	JFS_USRQUOTA	0x00000010</div><div class='hunk'>@@ -122,7 +123,9 @@</div><div class='ctx'> #define NUM_INODE_PER_IAG	INOSPERIAG</div><div class='ctx'> </div><div class='ctx'> #define MINBLOCKSIZE		512</div><div class='add'>+#define L2MINBLOCKSIZE		9</div><div class='ctx'> #define MAXBLOCKSIZE		4096</div><div class='add'>+#define L2MAXBLOCKSIZE		12</div><div class='ctx'> #define	MAXFILESIZE		((s64)1 &lt;&lt; 52)</div><div class='ctx'> </div><div class='ctx'> #define JFS_LINK_MAX		0xffffffff</div><div class='head'>diff --git a/fs/jfs/jfs_imap.c b/fs/jfs/jfs_imap.c<br/>index 799d3837e7c2..ecb8e05b8b84 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_imap.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_imap.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_imap.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/jfs_imap.c</a></div><div class='hunk'>@@ -102,7 +102,7 @@ int diMount(struct inode *ipimap)</div><div class='ctx'> 	 * allocate/initialize the in-memory inode map control structure</div><div class='ctx'> 	 */</div><div class='ctx'> 	/* allocate the in-memory inode map control structure. */</div><div class='del'>-	imap = kmalloc(sizeof(struct inomap), GFP_KERNEL);</div><div class='add'>+	imap = kzalloc(sizeof(struct inomap), GFP_KERNEL);</div><div class='ctx'> 	if (imap == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='hunk'>@@ -193,6 +193,7 @@ int diUnmount(struct inode *ipimap, int mounterror)</div><div class='ctx'> 	 * free in-memory control structure</div><div class='ctx'> 	 */</div><div class='ctx'> 	kfree(imap);</div><div class='add'>+	JFS_IP(ipimap)-&gt;i_imap = NULL;</div><div class='ctx'> </div><div class='ctx'> 	return (0);</div><div class='ctx'> }</div><div class='hunk'>@@ -289,7 +290,7 @@ int diSync(struct inode *ipimap)</div><div class='ctx'> int diRead(struct inode *ip)</div><div class='ctx'> {</div><div class='ctx'> 	struct jfs_sb_info *sbi = JFS_SBI(ip-&gt;i_sb);</div><div class='del'>-	int iagno, ino, extno, rc;</div><div class='add'>+	int iagno, ino, extno, rc, agno;</div><div class='ctx'> 	struct inode *ipimap;</div><div class='ctx'> 	struct dinode *dp;</div><div class='ctx'> 	struct iag *iagp;</div><div class='hunk'>@@ -310,8 +311,8 @@ int diRead(struct inode *ip)</div><div class='ctx'> 	iagno = INOTOIAG(ip-&gt;i_ino);</div><div class='ctx'> </div><div class='ctx'> 	/* read the iag */</div><div class='del'>-	imap = JFS_IP(ipimap)-&gt;i_imap;</div><div class='ctx'> 	IREAD_LOCK(ipimap, RDWRLOCK_IMAP);</div><div class='add'>+	imap = JFS_IP(ipimap)-&gt;i_imap;</div><div class='ctx'> 	rc = diIAGRead(imap, iagno, &amp;mp);</div><div class='ctx'> 	IREAD_UNLOCK(ipimap);</div><div class='ctx'> 	if (rc) {</div><div class='hunk'>@@ -338,8 +339,11 @@ int diRead(struct inode *ip)</div><div class='ctx'> </div><div class='ctx'> 	/* get the ag for the iag */</div><div class='ctx'> 	agstart = le64_to_cpu(iagp-&gt;agstart);</div><div class='add'>+	agno = BLKTOAG(agstart, JFS_SBI(ip-&gt;i_sb));</div><div class='ctx'> </div><div class='ctx'> 	release_metapage(mp);</div><div class='add'>+	if (agno &gt;= MAXAG || agno &lt; 0)</div><div class='add'>+		return -EIO;</div><div class='ctx'> </div><div class='ctx'> 	rel_inode = (ino &amp; (INOSPERPAGE - 1));</div><div class='ctx'> 	pageno = blkno &gt;&gt; sbi-&gt;l2nbperpage;</div><div class='hunk'>@@ -452,7 +456,7 @@ struct inode *diReadSpecial(struct super_block *sb, ino_t inum, int secondary)</div><div class='ctx'> 	dp += inum % 8;		/* 8 inodes per 4K page */</div><div class='ctx'> </div><div class='ctx'> 	/* copy on-disk inode to in-memory inode */</div><div class='del'>-	if ((copy_from_dinode(dp, ip)) != 0) {</div><div class='add'>+	if ((copy_from_dinode(dp, ip) != 0) || (ip-&gt;i_nlink == 0)) {</div><div class='ctx'> 		/* handle bad return by returning NULL for ip */</div><div class='ctx'> 		set_nlink(ip, 1);	/* Don't want iput() deleting it */</div><div class='ctx'> 		iput(ip);</div><div class='hunk'>@@ -669,7 +673,7 @@ int diWrite(tid_t tid, struct inode *ip)</div><div class='ctx'> 		 * This is the special xtree inside the directory for storing</div><div class='ctx'> 		 * the directory table</div><div class='ctx'> 		 */</div><div class='del'>-		xtpage_t *p, *xp;</div><div class='add'>+		xtroot_t *p, *xp;</div><div class='ctx'> 		xad_t *xad;</div><div class='ctx'> </div><div class='ctx'> 		jfs_ip-&gt;xtlid = 0;</div><div class='hunk'>@@ -683,7 +687,7 @@ int diWrite(tid_t tid, struct inode *ip)</div><div class='ctx'> 		 * copy xtree root from inode to dinode:</div><div class='ctx'> 		 */</div><div class='ctx'> 		p = &amp;jfs_ip-&gt;i_xtroot;</div><div class='del'>-		xp = (xtpage_t *) &amp;dp-&gt;di_dirtable;</div><div class='add'>+		xp = (xtroot_t *) &amp;dp-&gt;di_dirtable;</div><div class='ctx'> 		lv = ilinelock-&gt;lv;</div><div class='ctx'> 		for (n = 0; n &lt; ilinelock-&gt;index; n++, lv++) {</div><div class='ctx'> 			memcpy(&amp;xp-&gt;xad[lv-&gt;offset], &amp;p-&gt;xad[lv-&gt;offset],</div><div class='hunk'>@@ -712,7 +716,7 @@ int diWrite(tid_t tid, struct inode *ip)</div><div class='ctx'> 	 *	regular file: 16 byte (XAD slot) granularity</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (type &amp; tlckXTREE) {</div><div class='del'>-		xtpage_t *p, *xp;</div><div class='add'>+		xtroot_t *p, *xp;</div><div class='ctx'> 		xad_t *xad;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='hunk'>@@ -1319,7 +1323,7 @@ diInitInode(struct inode *ip, int iagno, int ino, int extno, struct iag * iagp)</div><div class='ctx'> int diAlloc(struct inode *pip, bool dir, struct inode *ip)</div><div class='ctx'> {</div><div class='ctx'> 	int rc, ino, iagno, addext, extno, bitno, sword;</div><div class='del'>-	int nwords, rem, i, agno;</div><div class='add'>+	int nwords, rem, i, agno, dn_numag;</div><div class='ctx'> 	u32 mask, inosmap, extsmap;</div><div class='ctx'> 	struct inode *ipimap;</div><div class='ctx'> 	struct metapage *mp;</div><div class='hunk'>@@ -1355,6 +1359,9 @@ int diAlloc(struct inode *pip, bool dir, struct inode *ip)</div><div class='ctx'> </div><div class='ctx'> 	/* get the ag number of this iag */</div><div class='ctx'> 	agno = BLKTOAG(JFS_IP(pip)-&gt;agstart, JFS_SBI(pip-&gt;i_sb));</div><div class='add'>+	dn_numag = JFS_SBI(pip-&gt;i_sb)-&gt;bmap-&gt;db_numag;</div><div class='add'>+	if (agno &lt; 0 || agno &gt; dn_numag || agno &gt;= MAXAG)</div><div class='add'>+		return -EIO;</div><div class='ctx'> </div><div class='ctx'> 	if (atomic_read(&amp;JFS_SBI(pip-&gt;i_sb)-&gt;bmap-&gt;db_active[agno])) {</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -2175,6 +2182,9 @@ static int diNewExt(struct inomap * imap, struct iag * iagp, int extno)</div><div class='ctx'> 	/* get the ag and iag numbers for this iag.</div><div class='ctx'> 	 */</div><div class='ctx'> 	agno = BLKTOAG(le64_to_cpu(iagp-&gt;agstart), sbi);</div><div class='add'>+	if (agno &gt;= MAXAG || agno &lt; 0)</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='ctx'> 	iagno = le32_to_cpu(iagp-&gt;iagnum);</div><div class='ctx'> </div><div class='ctx'> 	/* check if this is the last free extent within the</div><div class='hunk'>@@ -3019,14 +3029,23 @@ static void duplicateIXtree(struct super_block *sb, s64 blkno,</div><div class='ctx'>  *</div><div class='ctx'>  * RETURN VALUES:</div><div class='ctx'>  *	0	- success</div><div class='del'>- *	-ENOMEM	- insufficient memory</div><div class='add'>+ *	-EINVAL	- unexpected inode type</div><div class='ctx'>  */</div><div class='ctx'> static int copy_from_dinode(struct dinode * dip, struct inode *ip)</div><div class='ctx'> {</div><div class='ctx'> 	struct jfs_inode_info *jfs_ip = JFS_IP(ip);</div><div class='ctx'> 	struct jfs_sb_info *sbi = JFS_SBI(ip-&gt;i_sb);</div><div class='add'>+	int fileset = le32_to_cpu(dip-&gt;di_fileset);</div><div class='add'>+</div><div class='add'>+	switch (fileset) {</div><div class='add'>+	case AGGR_RESERVED_I: case AGGREGATE_I: case BMAP_I:</div><div class='add'>+	case LOG_I: case BADBLOCK_I: case FILESYSTEM_I:</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	jfs_ip-&gt;fileset = le32_to_cpu(dip-&gt;di_fileset);</div><div class='add'>+	jfs_ip-&gt;fileset = fileset;</div><div class='ctx'> 	jfs_ip-&gt;mode2 = le32_to_cpu(dip-&gt;di_mode);</div><div class='ctx'> 	jfs_set_inode_flags(ip);</div><div class='ctx'> </div><div class='hunk'>@@ -3060,12 +3079,12 @@ static int copy_from_dinode(struct dinode * dip, struct inode *ip)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ip-&gt;i_size = le64_to_cpu(dip-&gt;di_size);</div><div class='del'>-	ip-&gt;i_atime.tv_sec = le32_to_cpu(dip-&gt;di_atime.tv_sec);</div><div class='del'>-	ip-&gt;i_atime.tv_nsec = le32_to_cpu(dip-&gt;di_atime.tv_nsec);</div><div class='del'>-	ip-&gt;i_mtime.tv_sec = le32_to_cpu(dip-&gt;di_mtime.tv_sec);</div><div class='del'>-	ip-&gt;i_mtime.tv_nsec = le32_to_cpu(dip-&gt;di_mtime.tv_nsec);</div><div class='del'>-	ip-&gt;i_ctime.tv_sec = le32_to_cpu(dip-&gt;di_ctime.tv_sec);</div><div class='del'>-	ip-&gt;i_ctime.tv_nsec = le32_to_cpu(dip-&gt;di_ctime.tv_nsec);</div><div class='add'>+	inode_set_atime(ip, le32_to_cpu(dip-&gt;di_atime.tv_sec),</div><div class='add'>+			le32_to_cpu(dip-&gt;di_atime.tv_nsec));</div><div class='add'>+	inode_set_mtime(ip, le32_to_cpu(dip-&gt;di_mtime.tv_sec),</div><div class='add'>+			le32_to_cpu(dip-&gt;di_mtime.tv_nsec));</div><div class='add'>+	inode_set_ctime(ip, le32_to_cpu(dip-&gt;di_ctime.tv_sec),</div><div class='add'>+			le32_to_cpu(dip-&gt;di_ctime.tv_nsec));</div><div class='ctx'> 	ip-&gt;i_blocks = LBLK2PBLK(ip-&gt;i_sb, le64_to_cpu(dip-&gt;di_nblocks));</div><div class='ctx'> 	ip-&gt;i_generation = le32_to_cpu(dip-&gt;di_gen);</div><div class='ctx'> </div><div class='hunk'>@@ -3137,12 +3156,12 @@ static void copy_to_dinode(struct dinode * dip, struct inode *ip)</div><div class='ctx'> 	else /* Leave the original permissions alone */</div><div class='ctx'> 		dip-&gt;di_mode = cpu_to_le32(jfs_ip-&gt;mode2);</div><div class='ctx'> </div><div class='del'>-	dip-&gt;di_atime.tv_sec = cpu_to_le32(ip-&gt;i_atime.tv_sec);</div><div class='del'>-	dip-&gt;di_atime.tv_nsec = cpu_to_le32(ip-&gt;i_atime.tv_nsec);</div><div class='del'>-	dip-&gt;di_ctime.tv_sec = cpu_to_le32(ip-&gt;i_ctime.tv_sec);</div><div class='del'>-	dip-&gt;di_ctime.tv_nsec = cpu_to_le32(ip-&gt;i_ctime.tv_nsec);</div><div class='del'>-	dip-&gt;di_mtime.tv_sec = cpu_to_le32(ip-&gt;i_mtime.tv_sec);</div><div class='del'>-	dip-&gt;di_mtime.tv_nsec = cpu_to_le32(ip-&gt;i_mtime.tv_nsec);</div><div class='add'>+	dip-&gt;di_atime.tv_sec = cpu_to_le32(inode_get_atime_sec(ip));</div><div class='add'>+	dip-&gt;di_atime.tv_nsec = cpu_to_le32(inode_get_atime_nsec(ip));</div><div class='add'>+	dip-&gt;di_ctime.tv_sec = cpu_to_le32(inode_get_ctime_sec(ip));</div><div class='add'>+	dip-&gt;di_ctime.tv_nsec = cpu_to_le32(inode_get_ctime_nsec(ip));</div><div class='add'>+	dip-&gt;di_mtime.tv_sec = cpu_to_le32(inode_get_mtime_sec(ip));</div><div class='add'>+	dip-&gt;di_mtime.tv_nsec = cpu_to_le32(inode_get_mtime_nsec(ip));</div><div class='ctx'> 	dip-&gt;di_ixpxd = jfs_ip-&gt;ixpxd;	/* in-memory pxd's are little-endian */</div><div class='ctx'> 	dip-&gt;di_acl = jfs_ip-&gt;acl;	/* as are dxd's */</div><div class='ctx'> 	dip-&gt;di_ea = jfs_ip-&gt;ea;</div><div class='head'>diff --git a/fs/jfs/jfs_incore.h b/fs/jfs/jfs_incore.h<br/>index 721def69e732..5aaafedb8fbc 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_incore.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_incore.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_incore.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/jfs_incore.h</a></div><div class='hunk'>@@ -66,7 +66,7 @@ struct jfs_inode_info {</div><div class='ctx'> 	lid_t	xtlid;		/* lid of xtree lock on directory */</div><div class='ctx'> 	union {</div><div class='ctx'> 		struct {</div><div class='del'>-			xtpage_t _xtroot;	/* 288: xtree root */</div><div class='add'>+			xtroot_t _xtroot;	/* 288: xtree root */</div><div class='ctx'> 			struct inomap *_imap;	/* 4: inode map header	*/</div><div class='ctx'> 		} file;</div><div class='ctx'> 		struct {</div><div class='hunk'>@@ -76,14 +76,14 @@ struct jfs_inode_info {</div><div class='ctx'> 		struct {</div><div class='ctx'> 			unchar _unused[16];	/* 16: */</div><div class='ctx'> 			dxd_t _dxd;		/* 16: */</div><div class='del'>-			/* _inline may overflow into _inline_ea when needed */</div><div class='add'>+			/* _inline_sym may overflow into _inline_ea when needed */</div><div class='ctx'> 			/* _inline_ea may overlay the last part of</div><div class='ctx'> 			 * file._xtroot if maxentry = XTROOTINITSLOT</div><div class='ctx'> 			 */</div><div class='ctx'> 			union {</div><div class='ctx'> 				struct {</div><div class='ctx'> 					/* 128: inline symlink */</div><div class='del'>-					unchar _inline[128];</div><div class='add'>+					unchar _inline_sym[128];</div><div class='ctx'> 					/* 128: inline extended attr */</div><div class='ctx'> 					unchar _inline_ea[128];</div><div class='ctx'> 				};</div><div class='hunk'>@@ -92,7 +92,7 @@ struct jfs_inode_info {</div><div class='ctx'> 		} link;</div><div class='ctx'> 	} u;</div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='del'>-	struct dquot *i_dquot[MAXQUOTAS];</div><div class='add'>+	struct dquot __rcu *i_dquot[MAXQUOTAS];</div><div class='ctx'> #endif</div><div class='ctx'> 	u32 dev;	/* will die when we get wide dev_t */</div><div class='ctx'> 	struct inode	vfs_inode;</div><div class='hunk'>@@ -101,7 +101,7 @@ struct jfs_inode_info {</div><div class='ctx'> #define i_imap u.file._imap</div><div class='ctx'> #define i_dirtable u.dir._table</div><div class='ctx'> #define i_dtroot u.dir._dtroot</div><div class='del'>-#define i_inline u.link._inline</div><div class='add'>+#define i_inline u.link._inline_sym</div><div class='ctx'> #define i_inline_ea u.link._inline_ea</div><div class='ctx'> #define i_inline_all u.link._inline_all</div><div class='ctx'> </div><div class='head'>diff --git a/fs/jfs/jfs_inode.c b/fs/jfs/jfs_inode.c<br/>index 59379089e939..f10f295d1502 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/jfs_inode.c</a></div><div class='hunk'>@@ -64,7 +64,7 @@ struct inode *ialloc(struct inode *parent, umode_t mode)</div><div class='ctx'> 		goto fail_put;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	inode_init_owner(&amp;init_user_ns, inode, parent, mode);</div><div class='add'>+	inode_init_owner(&amp;nop_mnt_idmap, inode, parent, mode);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * New inodes need to save sane values on disk when</div><div class='ctx'> 	 * uid &amp; gid mount options are used</div><div class='hunk'>@@ -97,8 +97,8 @@ struct inode *ialloc(struct inode *parent, umode_t mode)</div><div class='ctx'> 	jfs_inode-&gt;mode2 |= inode-&gt;i_mode;</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_blocks = 0;</div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_atime = inode-&gt;i_ctime = current_time(inode);</div><div class='del'>-	jfs_inode-&gt;otime = inode-&gt;i_ctime.tv_sec;</div><div class='add'>+	simple_inode_init_ts(inode);</div><div class='add'>+	jfs_inode-&gt;otime = inode_get_ctime_sec(inode);</div><div class='ctx'> 	inode-&gt;i_generation = JFS_SBI(sb)-&gt;gengen++;</div><div class='ctx'> </div><div class='ctx'> 	jfs_inode-&gt;cflag = 0;</div><div class='head'>diff --git a/fs/jfs/jfs_inode.h b/fs/jfs/jfs_inode.h<br/>index 7de961a81862..2c6c81c8cb9f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_inode.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_inode.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_inode.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/jfs_inode.h</a></div><div class='hunk'>@@ -9,9 +9,9 @@ struct fid;</div><div class='ctx'> </div><div class='ctx'> extern struct inode *ialloc(struct inode *, umode_t);</div><div class='ctx'> extern int jfs_fsync(struct file *, loff_t, loff_t, int);</div><div class='del'>-extern int jfs_fileattr_get(struct dentry *dentry, struct fileattr *fa);</div><div class='del'>-extern int jfs_fileattr_set(struct user_namespace *mnt_userns,</div><div class='del'>-			    struct dentry *dentry, struct fileattr *fa);</div><div class='add'>+extern int jfs_fileattr_get(struct dentry *dentry, struct file_kattr *fa);</div><div class='add'>+extern int jfs_fileattr_set(struct mnt_idmap *idmap,</div><div class='add'>+			    struct dentry *dentry, struct file_kattr *fa);</div><div class='ctx'> extern long jfs_ioctl(struct file *, unsigned int, unsigned long);</div><div class='ctx'> extern struct inode *jfs_iget(struct super_block *, unsigned long);</div><div class='ctx'> extern int jfs_commit_inode(struct inode *, int);</div><div class='hunk'>@@ -28,7 +28,7 @@ extern struct dentry *jfs_fh_to_parent(struct super_block *sb, struct fid *fid,</div><div class='ctx'> 	int fh_len, int fh_type);</div><div class='ctx'> extern void jfs_set_inode_flags(struct inode *);</div><div class='ctx'> extern int jfs_get_block(struct inode *, sector_t, struct buffer_head *, int);</div><div class='del'>-extern int jfs_setattr(struct user_namespace *, struct dentry *, struct iattr *);</div><div class='add'>+extern int jfs_setattr(struct mnt_idmap *, struct dentry *, struct iattr *);</div><div class='ctx'> </div><div class='ctx'> extern const struct address_space_operations jfs_aops;</div><div class='ctx'> extern const struct inode_operations jfs_dir_inode_operations;</div><div class='head'>diff --git a/fs/jfs/jfs_logmgr.c b/fs/jfs/jfs_logmgr.c<br/>index 78fd136ac13b..b343c5ea1159 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_logmgr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_logmgr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_logmgr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/jfs_logmgr.c</a></div><div class='hunk'>@@ -388,14 +388,6 @@ lmWriteRecord(struct jfs_log * log, struct tblock * tblk, struct lrd * lrd,</div><div class='ctx'> 			p = (caddr_t) &amp;JFS_IP(tlck-&gt;ip)-&gt;i_xtroot;</div><div class='ctx'> 		linelock = (struct linelock *) &amp; tlck-&gt;lock;</div><div class='ctx'> 	}</div><div class='del'>-#ifdef	_JFS_WIP</div><div class='del'>-	else if (tlck-&gt;flag &amp; tlckINLINELOCK) {</div><div class='del'>-</div><div class='del'>-		inlinelock = (struct inlinelock *) &amp; tlck;</div><div class='del'>-		p = (caddr_t) &amp; inlinelock-&gt;pxd;</div><div class='del'>-		linelock = (struct linelock *) &amp; tlck;</div><div class='del'>-	}</div><div class='del'>-#endif				/* _JFS_WIP */</div><div class='ctx'> 	else {</div><div class='ctx'> 		jfs_err("lmWriteRecord: UFO tlck:0x%p", tlck);</div><div class='ctx'> 		return 0;	/* Probably should trap */</div><div class='hunk'>@@ -1066,7 +1058,7 @@ void jfs_syncpt(struct jfs_log *log, int hard_sync)</div><div class='ctx'> int lmLogOpen(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	int rc;</div><div class='del'>-	struct block_device *bdev;</div><div class='add'>+	struct file *bdev_file;</div><div class='ctx'> 	struct jfs_log *log;</div><div class='ctx'> 	struct jfs_sb_info *sbi = JFS_SBI(sb);</div><div class='ctx'> </div><div class='hunk'>@@ -1078,7 +1070,7 @@ int lmLogOpen(struct super_block *sb)</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;jfs_log_mutex);</div><div class='ctx'> 	list_for_each_entry(log, &amp;jfs_external_logs, journal_list) {</div><div class='del'>-		if (log-&gt;bdev-&gt;bd_dev == sbi-&gt;logdev) {</div><div class='add'>+		if (file_bdev(log-&gt;bdev_file)-&gt;bd_dev == sbi-&gt;logdev) {</div><div class='ctx'> 			if (!uuid_equal(&amp;log-&gt;uuid, &amp;sbi-&gt;loguuid)) {</div><div class='ctx'> 				jfs_warn("wrong uuid on JFS journal");</div><div class='ctx'> 				mutex_unlock(&amp;jfs_log_mutex);</div><div class='hunk'>@@ -1108,14 +1100,14 @@ int lmLogOpen(struct super_block *sb)</div><div class='ctx'> 	 * file systems to log may have n-to-1 relationship;</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='del'>-	bdev = blkdev_get_by_dev(sbi-&gt;logdev, FMODE_READ|FMODE_WRITE|FMODE_EXCL,</div><div class='del'>-				 log);</div><div class='del'>-	if (IS_ERR(bdev)) {</div><div class='del'>-		rc = PTR_ERR(bdev);</div><div class='add'>+	bdev_file = bdev_file_open_by_dev(sbi-&gt;logdev,</div><div class='add'>+			BLK_OPEN_READ | BLK_OPEN_WRITE, log, NULL);</div><div class='add'>+	if (IS_ERR(bdev_file)) {</div><div class='add'>+		rc = PTR_ERR(bdev_file);</div><div class='ctx'> 		goto free;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	log-&gt;bdev = bdev;</div><div class='add'>+	log-&gt;bdev_file = bdev_file;</div><div class='ctx'> 	uuid_copy(&amp;log-&gt;uuid, &amp;sbi-&gt;loguuid);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1149,7 +1141,7 @@ journal_found:</div><div class='ctx'> 	lbmLogShutdown(log);</div><div class='ctx'> </div><div class='ctx'>       close:		/* close external log device */</div><div class='del'>-	blkdev_put(bdev, FMODE_READ|FMODE_WRITE|FMODE_EXCL);</div><div class='add'>+	bdev_fput(bdev_file);</div><div class='ctx'> </div><div class='ctx'>       free:		/* free log descriptor */</div><div class='ctx'> 	mutex_unlock(&amp;jfs_log_mutex);</div><div class='hunk'>@@ -1170,7 +1162,7 @@ static int open_inline_log(struct super_block *sb)</div><div class='ctx'> 	init_waitqueue_head(&amp;log-&gt;syncwait);</div><div class='ctx'> </div><div class='ctx'> 	set_bit(log_INLINELOG, &amp;log-&gt;flag);</div><div class='del'>-	log-&gt;bdev = sb-&gt;s_bdev;</div><div class='add'>+	log-&gt;bdev_file = sb-&gt;s_bdev_file;</div><div class='ctx'> 	log-&gt;base = addressPXD(&amp;JFS_SBI(sb)-&gt;logpxd);</div><div class='ctx'> 	log-&gt;size = lengthPXD(&amp;JFS_SBI(sb)-&gt;logpxd) &gt;&gt;</div><div class='ctx'> 	    (L2LOGPSIZE - sb-&gt;s_blocksize_bits);</div><div class='hunk'>@@ -1207,7 +1199,6 @@ static int open_dummy_log(struct super_block *sb)</div><div class='ctx'> 		init_waitqueue_head(&amp;dummy_log-&gt;syncwait);</div><div class='ctx'> 		dummy_log-&gt;no_integrity = 1;</div><div class='ctx'> 		/* Make up some stuff */</div><div class='del'>-		dummy_log-&gt;base = 0;</div><div class='ctx'> 		dummy_log-&gt;size = 1024;</div><div class='ctx'> 		rc = lmLogInit(dummy_log);</div><div class='ctx'> 		if (rc) {</div><div class='hunk'>@@ -1444,7 +1435,7 @@ int lmLogClose(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct jfs_sb_info *sbi = JFS_SBI(sb);</div><div class='ctx'> 	struct jfs_log *log = sbi-&gt;log;</div><div class='del'>-	struct block_device *bdev;</div><div class='add'>+	struct file *bdev_file;</div><div class='ctx'> 	int rc = 0;</div><div class='ctx'> </div><div class='ctx'> 	jfs_info("lmLogClose: log:0x%p", log);</div><div class='hunk'>@@ -1490,10 +1481,10 @@ int lmLogClose(struct super_block *sb)</div><div class='ctx'> 	 *	external log as separate logical volume</div><div class='ctx'> 	 */</div><div class='ctx'> 	list_del(&amp;log-&gt;journal_list);</div><div class='del'>-	bdev = log-&gt;bdev;</div><div class='add'>+	bdev_file = log-&gt;bdev_file;</div><div class='ctx'> 	rc = lmLogShutdown(log);</div><div class='ctx'> </div><div class='del'>-	blkdev_put(bdev, FMODE_READ|FMODE_WRITE|FMODE_EXCL);</div><div class='add'>+	bdev_fput(bdev_file);</div><div class='ctx'> </div><div class='ctx'> 	kfree(log);</div><div class='ctx'> </div><div class='hunk'>@@ -1608,7 +1599,7 @@ void jfs_flush_journal(struct jfs_log *log, int wait)</div><div class='ctx'> 					       mp, sizeof(struct metapage), 0);</div><div class='ctx'> 				print_hex_dump(KERN_ERR, "page: ",</div><div class='ctx'> 					       DUMP_PREFIX_ADDRESS, 16,</div><div class='del'>-					       sizeof(long), mp-&gt;page,</div><div class='add'>+					       sizeof(long), mp-&gt;folio,</div><div class='ctx'> 					       sizeof(struct page), 0);</div><div class='ctx'> 			} else</div><div class='ctx'> 				print_hex_dump(KERN_ERR, "tblock:",</div><div class='hunk'>@@ -1980,17 +1971,13 @@ static int lbmRead(struct jfs_log * log, int pn, struct lbuf ** bpp)</div><div class='ctx'> </div><div class='ctx'> 	bp-&gt;l_flag |= lbmREAD;</div><div class='ctx'> </div><div class='del'>-	bio = bio_alloc(GFP_NOFS, 1);</div><div class='del'>-</div><div class='add'>+	bio = bio_alloc(file_bdev(log-&gt;bdev_file), 1, REQ_OP_READ, GFP_NOFS);</div><div class='ctx'> 	bio-&gt;bi_iter.bi_sector = bp-&gt;l_blkno &lt;&lt; (log-&gt;l2bsize - 9);</div><div class='del'>-	bio_set_dev(bio, log-&gt;bdev);</div><div class='del'>-</div><div class='del'>-	bio_add_page(bio, bp-&gt;l_page, LOGPSIZE, bp-&gt;l_offset);</div><div class='add'>+	__bio_add_page(bio, bp-&gt;l_page, LOGPSIZE, bp-&gt;l_offset);</div><div class='ctx'> 	BUG_ON(bio-&gt;bi_iter.bi_size != LOGPSIZE);</div><div class='ctx'> </div><div class='ctx'> 	bio-&gt;bi_end_io = lbmIODone;</div><div class='ctx'> 	bio-&gt;bi_private = bp;</div><div class='del'>-	bio-&gt;bi_opf = REQ_OP_READ;</div><div class='ctx'> 	/*check if journaling to disk has been disabled*/</div><div class='ctx'> 	if (log-&gt;no_integrity) {</div><div class='ctx'> 		bio-&gt;bi_iter.bi_size = 0;</div><div class='hunk'>@@ -2122,19 +2109,21 @@ static void lbmStartIO(struct lbuf * bp)</div><div class='ctx'> {</div><div class='ctx'> 	struct bio *bio;</div><div class='ctx'> 	struct jfs_log *log = bp-&gt;l_log;</div><div class='add'>+	struct block_device *bdev = NULL;</div><div class='ctx'> </div><div class='ctx'> 	jfs_info("lbmStartIO");</div><div class='ctx'> </div><div class='del'>-	bio = bio_alloc(GFP_NOFS, 1);</div><div class='del'>-	bio-&gt;bi_iter.bi_sector = bp-&gt;l_blkno &lt;&lt; (log-&gt;l2bsize - 9);</div><div class='del'>-	bio_set_dev(bio, log-&gt;bdev);</div><div class='add'>+	if (!log-&gt;no_integrity)</div><div class='add'>+		bdev = file_bdev(log-&gt;bdev_file);</div><div class='ctx'> </div><div class='del'>-	bio_add_page(bio, bp-&gt;l_page, LOGPSIZE, bp-&gt;l_offset);</div><div class='add'>+	bio = bio_alloc(bdev, 1, REQ_OP_WRITE | REQ_SYNC,</div><div class='add'>+			GFP_NOFS);</div><div class='add'>+	bio-&gt;bi_iter.bi_sector = bp-&gt;l_blkno &lt;&lt; (log-&gt;l2bsize - 9);</div><div class='add'>+	__bio_add_page(bio, bp-&gt;l_page, LOGPSIZE, bp-&gt;l_offset);</div><div class='ctx'> 	BUG_ON(bio-&gt;bi_iter.bi_size != LOGPSIZE);</div><div class='ctx'> </div><div class='ctx'> 	bio-&gt;bi_end_io = lbmIODone;</div><div class='ctx'> 	bio-&gt;bi_private = bp;</div><div class='del'>-	bio-&gt;bi_opf = REQ_OP_WRITE | REQ_SYNC;</div><div class='ctx'> </div><div class='ctx'> 	/* check if journaling to disk has been disabled */</div><div class='ctx'> 	if (log-&gt;no_integrity) {</div><div class='head'>diff --git a/fs/jfs/jfs_logmgr.h b/fs/jfs/jfs_logmgr.h<br/>index 805877ce5020..8b8994e48cd0 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_logmgr.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_logmgr.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_logmgr.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/jfs_logmgr.h</a></div><div class='hunk'>@@ -356,7 +356,7 @@ struct jfs_log {</div><div class='ctx'> 				 *    before writing syncpt.</div><div class='ctx'> 				 */</div><div class='ctx'> 	struct list_head journal_list; /* Global list */</div><div class='del'>-	struct block_device *bdev; /* 4: log lv pointer */</div><div class='add'>+	struct file *bdev_file;	/* 4: log lv pointer */</div><div class='ctx'> 	int serial;		/* 4: log mount serial number */</div><div class='ctx'> </div><div class='ctx'> 	s64 base;		/* @8: log extent address (inline log ) */</div><div class='head'>diff --git a/fs/jfs/jfs_metapage.c b/fs/jfs/jfs_metapage.c<br/>index 104ae698443e..871cf4fb3636 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_metapage.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_metapage.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_metapage.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/jfs_metapage.c</a></div><div class='hunk'>@@ -4,6 +4,7 @@</div><div class='ctx'>  *   Portions Copyright (C) Christoph Hellwig, 2001-2002</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/blkdev.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/mm.h&gt;</div><div class='ctx'> #include &lt;linux/module.h&gt;</div><div class='hunk'>@@ -14,6 +15,7 @@</div><div class='ctx'> #include &lt;linux/mempool.h&gt;</div><div class='ctx'> #include &lt;linux/seq_file.h&gt;</div><div class='ctx'> #include &lt;linux/writeback.h&gt;</div><div class='add'>+#include &lt;linux/migrate.h&gt;</div><div class='ctx'> #include "jfs_incore.h"</div><div class='ctx'> #include "jfs_superblock.h"</div><div class='ctx'> #include "jfs_filsys.h"</div><div class='hunk'>@@ -46,9 +48,9 @@ static inline void __lock_metapage(struct metapage *mp)</div><div class='ctx'> 	do {</div><div class='ctx'> 		set_current_state(TASK_UNINTERRUPTIBLE);</div><div class='ctx'> 		if (metapage_locked(mp)) {</div><div class='del'>-			unlock_page(mp-&gt;page);</div><div class='add'>+			folio_unlock(mp-&gt;folio);</div><div class='ctx'> 			io_schedule();</div><div class='del'>-			lock_page(mp-&gt;page);</div><div class='add'>+			folio_lock(mp-&gt;folio);</div><div class='ctx'> 		}</div><div class='ctx'> 	} while (trylock_metapage(mp));</div><div class='ctx'> 	__set_current_state(TASK_RUNNING);</div><div class='hunk'>@@ -56,7 +58,7 @@ static inline void __lock_metapage(struct metapage *mp)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Must have mp-&gt;page locked</div><div class='add'>+ * Must have mp-&gt;folio locked</div><div class='ctx'>  */</div><div class='ctx'> static inline void lock_metapage(struct metapage *mp)</div><div class='ctx'> {</div><div class='hunk'>@@ -75,36 +77,36 @@ static mempool_t *metapage_mempool;</div><div class='ctx'> struct meta_anchor {</div><div class='ctx'> 	int mp_count;</div><div class='ctx'> 	atomic_t io_count;</div><div class='add'>+	blk_status_t status;</div><div class='ctx'> 	struct metapage *mp[MPS_PER_PAGE];</div><div class='ctx'> };</div><div class='del'>-#define mp_anchor(page) ((struct meta_anchor *)page_private(page))</div><div class='ctx'> </div><div class='del'>-static inline struct metapage *page_to_mp(struct page *page, int offset)</div><div class='add'>+static inline struct metapage *folio_to_mp(struct folio *folio, int offset)</div><div class='ctx'> {</div><div class='del'>-	if (!PagePrivate(page))</div><div class='add'>+	struct meta_anchor *anchor = folio-&gt;private;</div><div class='add'>+</div><div class='add'>+	if (!anchor)</div><div class='ctx'> 		return NULL;</div><div class='del'>-	return mp_anchor(page)-&gt;mp[offset &gt;&gt; L2PSIZE];</div><div class='add'>+	return anchor-&gt;mp[offset &gt;&gt; L2PSIZE];</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int insert_metapage(struct page *page, struct metapage *mp)</div><div class='add'>+static inline int insert_metapage(struct folio *folio, struct metapage *mp)</div><div class='ctx'> {</div><div class='ctx'> 	struct meta_anchor *a;</div><div class='ctx'> 	int index;</div><div class='ctx'> 	int l2mp_blocks;	/* log2 blocks per metapage */</div><div class='ctx'> </div><div class='del'>-	if (PagePrivate(page))</div><div class='del'>-		a = mp_anchor(page);</div><div class='del'>-	else {</div><div class='add'>+	a = folio-&gt;private;</div><div class='add'>+	if (!a) {</div><div class='ctx'> 		a = kzalloc(sizeof(struct meta_anchor), GFP_NOFS);</div><div class='ctx'> 		if (!a)</div><div class='ctx'> 			return -ENOMEM;</div><div class='del'>-		set_page_private(page, (unsigned long)a);</div><div class='del'>-		SetPagePrivate(page);</div><div class='del'>-		kmap(page);</div><div class='add'>+		folio_attach_private(folio, a);</div><div class='add'>+		kmap(&amp;folio-&gt;page);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (mp) {</div><div class='del'>-		l2mp_blocks = L2PSIZE - page-&gt;mapping-&gt;host-&gt;i_blkbits;</div><div class='add'>+		l2mp_blocks = L2PSIZE - folio-&gt;mapping-&gt;host-&gt;i_blkbits;</div><div class='ctx'> 		index = (mp-&gt;index &gt;&gt; l2mp_blocks) &amp; (MPS_PER_PAGE - 1);</div><div class='ctx'> 		a-&gt;mp_count++;</div><div class='ctx'> 		a-&gt;mp[index] = mp;</div><div class='hunk'>@@ -113,10 +115,10 @@ static inline int insert_metapage(struct page *page, struct metapage *mp)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void remove_metapage(struct page *page, struct metapage *mp)</div><div class='add'>+static inline void remove_metapage(struct folio *folio, struct metapage *mp)</div><div class='ctx'> {</div><div class='del'>-	struct meta_anchor *a = mp_anchor(page);</div><div class='del'>-	int l2mp_blocks = L2PSIZE - page-&gt;mapping-&gt;host-&gt;i_blkbits;</div><div class='add'>+	struct meta_anchor *a = folio-&gt;private;</div><div class='add'>+	int l2mp_blocks = L2PSIZE - folio-&gt;mapping-&gt;host-&gt;i_blkbits;</div><div class='ctx'> 	int index;</div><div class='ctx'> </div><div class='ctx'> 	index = (mp-&gt;index &gt;&gt; l2mp_blocks) &amp; (MPS_PER_PAGE - 1);</div><div class='hunk'>@@ -126,48 +128,134 @@ static inline void remove_metapage(struct page *page, struct metapage *mp)</div><div class='ctx'> 	a-&gt;mp[index] = NULL;</div><div class='ctx'> 	if (--a-&gt;mp_count == 0) {</div><div class='ctx'> 		kfree(a);</div><div class='del'>-		set_page_private(page, 0);</div><div class='del'>-		ClearPagePrivate(page);</div><div class='del'>-		kunmap(page);</div><div class='add'>+		folio_detach_private(folio);</div><div class='add'>+		kunmap(&amp;folio-&gt;page);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void inc_io(struct page *page)</div><div class='add'>+static inline void inc_io(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	atomic_inc(&amp;mp_anchor(page)-&gt;io_count);</div><div class='add'>+	struct meta_anchor *anchor = folio-&gt;private;</div><div class='add'>+</div><div class='add'>+	atomic_inc(&amp;anchor-&gt;io_count);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void dec_io(struct page *page, void (*handler) (struct page *))</div><div class='add'>+static inline void dec_io(struct folio *folio, blk_status_t status,</div><div class='add'>+		void (*handler)(struct folio *, blk_status_t))</div><div class='ctx'> {</div><div class='del'>-	if (atomic_dec_and_test(&amp;mp_anchor(page)-&gt;io_count))</div><div class='del'>-		handler(page);</div><div class='add'>+	struct meta_anchor *anchor = folio-&gt;private;</div><div class='add'>+</div><div class='add'>+	if (anchor-&gt;status == BLK_STS_OK)</div><div class='add'>+		anchor-&gt;status = status;</div><div class='add'>+</div><div class='add'>+	if (atomic_dec_and_test(&amp;anchor-&gt;io_count))</div><div class='add'>+		handler(folio, anchor-&gt;status);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_MIGRATION</div><div class='add'>+static int __metapage_migrate_folio(struct address_space *mapping,</div><div class='add'>+				    struct folio *dst, struct folio *src,</div><div class='add'>+				    enum migrate_mode mode)</div><div class='add'>+{</div><div class='add'>+	struct meta_anchor *src_anchor = src-&gt;private;</div><div class='add'>+	struct metapage *mps[MPS_PER_PAGE] = {0};</div><div class='add'>+	struct metapage *mp;</div><div class='add'>+	int i, rc;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; MPS_PER_PAGE; i++) {</div><div class='add'>+		mp = src_anchor-&gt;mp[i];</div><div class='add'>+		if (mp &amp;&amp; metapage_locked(mp))</div><div class='add'>+			return -EAGAIN;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	rc = filemap_migrate_folio(mapping, dst, src, mode);</div><div class='add'>+	if (rc)</div><div class='add'>+		return rc;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; MPS_PER_PAGE; i++) {</div><div class='add'>+		mp = src_anchor-&gt;mp[i];</div><div class='add'>+		if (!mp)</div><div class='add'>+			continue;</div><div class='add'>+		if (unlikely(insert_metapage(dst, mp))) {</div><div class='add'>+			/* If error, roll-back previosly inserted pages */</div><div class='add'>+			for (int j = 0 ; j &lt; i; j++) {</div><div class='add'>+				if (mps[j])</div><div class='add'>+					remove_metapage(dst, mps[j]);</div><div class='add'>+			}</div><div class='add'>+			return -EAGAIN;</div><div class='add'>+		}</div><div class='add'>+		mps[i] = mp;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Update the metapage and remove it from src */</div><div class='add'>+	for (i = 0; i &lt; MPS_PER_PAGE; i++) {</div><div class='add'>+		mp = mps[i];</div><div class='add'>+		if (mp) {</div><div class='add'>+			int page_offset = mp-&gt;data - folio_address(src);</div><div class='add'>+</div><div class='add'>+			mp-&gt;data = folio_address(dst) + page_offset;</div><div class='add'>+			mp-&gt;folio = dst;</div><div class='add'>+			remove_metapage(src, mp);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+#endif	/* CONFIG_MIGRATION */</div><div class='add'>+</div><div class='ctx'> #else</div><div class='del'>-static inline struct metapage *page_to_mp(struct page *page, int offset)</div><div class='add'>+</div><div class='add'>+static inline struct metapage *folio_to_mp(struct folio *folio, int offset)</div><div class='ctx'> {</div><div class='del'>-	return PagePrivate(page) ? (struct metapage *)page_private(page) : NULL;</div><div class='add'>+	return folio-&gt;private;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int insert_metapage(struct page *page, struct metapage *mp)</div><div class='add'>+static inline int insert_metapage(struct folio *folio, struct metapage *mp)</div><div class='ctx'> {</div><div class='ctx'> 	if (mp) {</div><div class='del'>-		set_page_private(page, (unsigned long)mp);</div><div class='del'>-		SetPagePrivate(page);</div><div class='del'>-		kmap(page);</div><div class='add'>+		folio_attach_private(folio, mp);</div><div class='add'>+		kmap(&amp;folio-&gt;page);</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void remove_metapage(struct page *page, struct metapage *mp)</div><div class='add'>+static inline void remove_metapage(struct folio *folio, struct metapage *mp)</div><div class='ctx'> {</div><div class='del'>-	set_page_private(page, 0);</div><div class='del'>-	ClearPagePrivate(page);</div><div class='del'>-	kunmap(page);</div><div class='add'>+	folio_detach_private(folio);</div><div class='add'>+	kunmap(&amp;folio-&gt;page);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#define inc_io(page) do {} while(0)</div><div class='del'>-#define dec_io(page, handler) handler(page)</div><div class='add'>+#define inc_io(folio) do {} while(0)</div><div class='add'>+#define dec_io(folio, status, handler) handler(folio, status)</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_MIGRATION</div><div class='add'>+static int __metapage_migrate_folio(struct address_space *mapping,</div><div class='add'>+				    struct folio *dst, struct folio *src,</div><div class='add'>+				    enum migrate_mode mode)</div><div class='add'>+{</div><div class='add'>+	struct metapage *mp;</div><div class='add'>+	int page_offset;</div><div class='add'>+	int rc;</div><div class='add'>+</div><div class='add'>+	mp = folio_to_mp(src, 0);</div><div class='add'>+	if (metapage_locked(mp))</div><div class='add'>+		return -EAGAIN;</div><div class='add'>+</div><div class='add'>+	rc = filemap_migrate_folio(mapping, dst, src, mode);</div><div class='add'>+	if (rc)</div><div class='add'>+		return rc;</div><div class='add'>+</div><div class='add'>+	if (unlikely(insert_metapage(dst, mp)))</div><div class='add'>+		return -EAGAIN;</div><div class='add'>+</div><div class='add'>+	page_offset = mp-&gt;data - folio_address(src);</div><div class='add'>+	mp-&gt;data = folio_address(dst) + page_offset;</div><div class='add'>+	mp-&gt;folio = dst;</div><div class='add'>+	remove_metapage(src, mp);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+#endif	/* CONFIG_MIGRATION */</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='hunk'>@@ -218,12 +306,12 @@ void metapage_exit(void)</div><div class='ctx'> 	kmem_cache_destroy(metapage_cache);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void drop_metapage(struct page *page, struct metapage *mp)</div><div class='add'>+static inline void drop_metapage(struct folio *folio, struct metapage *mp)</div><div class='ctx'> {</div><div class='ctx'> 	if (mp-&gt;count || mp-&gt;nohomeok || test_bit(META_dirty, &amp;mp-&gt;flag) ||</div><div class='ctx'> 	    test_bit(META_io, &amp;mp-&gt;flag))</div><div class='ctx'> 		return;</div><div class='del'>-	remove_metapage(page, mp);</div><div class='add'>+	remove_metapage(folio, mp);</div><div class='ctx'> 	INCREMENT(mpStat.pagefree);</div><div class='ctx'> 	free_metapage(mp);</div><div class='ctx'> }</div><div class='hunk'>@@ -257,23 +345,20 @@ static sector_t metapage_get_blocks(struct inode *inode, sector_t lblock,</div><div class='ctx'> 	return lblock;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void last_read_complete(struct page *page)</div><div class='add'>+static void last_read_complete(struct folio *folio, blk_status_t status)</div><div class='ctx'> {</div><div class='del'>-	if (!PageError(page))</div><div class='del'>-		SetPageUptodate(page);</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	if (status)</div><div class='add'>+		printk(KERN_ERR "Read error %d at %#llx\n", status,</div><div class='add'>+				folio_pos(folio));</div><div class='add'>+</div><div class='add'>+	folio_end_read(folio, status == 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void metapage_read_end_io(struct bio *bio)</div><div class='ctx'> {</div><div class='del'>-	struct page *page = bio-&gt;bi_private;</div><div class='del'>-</div><div class='del'>-	if (bio-&gt;bi_status) {</div><div class='del'>-		printk(KERN_ERR "metapage_read_end_io: I/O error\n");</div><div class='del'>-		SetPageError(page);</div><div class='del'>-	}</div><div class='add'>+	struct folio *folio = bio-&gt;bi_private;</div><div class='ctx'> </div><div class='del'>-	dec_io(page, last_read_complete);</div><div class='add'>+	dec_io(folio, bio-&gt;bi_status, last_read_complete);</div><div class='ctx'> 	bio_put(bio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -299,13 +384,19 @@ static void remove_from_logsync(struct metapage *mp)</div><div class='ctx'> 	LOGSYNC_UNLOCK(log, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void last_write_complete(struct page *page)</div><div class='add'>+static void last_write_complete(struct folio *folio, blk_status_t status)</div><div class='ctx'> {</div><div class='ctx'> 	struct metapage *mp;</div><div class='ctx'> 	unsigned int offset;</div><div class='ctx'> </div><div class='add'>+	if (status) {</div><div class='add'>+		int err = blk_status_to_errno(status);</div><div class='add'>+		printk(KERN_ERR "metapage_write_end_io: I/O error\n");</div><div class='add'>+		mapping_set_error(folio-&gt;mapping, err);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	for (offset = 0; offset &lt; PAGE_SIZE; offset += PSIZE) {</div><div class='del'>-		mp = page_to_mp(page, offset);</div><div class='add'>+		mp = folio_to_mp(folio, offset);</div><div class='ctx'> 		if (mp &amp;&amp; test_bit(META_io, &amp;mp-&gt;flag)) {</div><div class='ctx'> 			if (mp-&gt;lsn)</div><div class='ctx'> 				remove_from_logsync(mp);</div><div class='hunk'>@@ -316,28 +407,25 @@ static void last_write_complete(struct page *page)</div><div class='ctx'> 		 * safe unless I have the page locked</div><div class='ctx'> 		 */</div><div class='ctx'> 	}</div><div class='del'>-	end_page_writeback(page);</div><div class='add'>+	folio_end_writeback(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void metapage_write_end_io(struct bio *bio)</div><div class='ctx'> {</div><div class='del'>-	struct page *page = bio-&gt;bi_private;</div><div class='add'>+	struct folio *folio = bio-&gt;bi_private;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(!PagePrivate(page));</div><div class='add'>+	BUG_ON(!folio-&gt;private);</div><div class='ctx'> </div><div class='del'>-	if (bio-&gt;bi_status) {</div><div class='del'>-		printk(KERN_ERR "metapage_write_end_io: I/O error\n");</div><div class='del'>-		SetPageError(page);</div><div class='del'>-	}</div><div class='del'>-	dec_io(page, last_write_complete);</div><div class='add'>+	dec_io(folio, bio-&gt;bi_status, last_write_complete);</div><div class='ctx'> 	bio_put(bio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int metapage_writepage(struct page *page, struct writeback_control *wbc)</div><div class='add'>+static int metapage_write_folio(struct folio *folio,</div><div class='add'>+		struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='ctx'> 	struct bio *bio = NULL;</div><div class='ctx'> 	int block_offset;	/* block offset of mp within page */</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	int blocks_per_mp = JFS_SBI(inode-&gt;i_sb)-&gt;nbperpage;</div><div class='ctx'> 	int len;</div><div class='ctx'> 	int xlen;</div><div class='hunk'>@@ -353,14 +441,13 @@ static int metapage_writepage(struct page *page, struct writeback_control *wbc)</div><div class='ctx'> 	int offset;</div><div class='ctx'> 	int bad_blocks = 0;</div><div class='ctx'> </div><div class='del'>-	page_start = (sector_t)page-&gt;index &lt;&lt;</div><div class='del'>-		     (PAGE_SHIFT - inode-&gt;i_blkbits);</div><div class='del'>-	BUG_ON(!PageLocked(page));</div><div class='del'>-	BUG_ON(PageWriteback(page));</div><div class='del'>-	set_page_writeback(page);</div><div class='add'>+	page_start = folio_pos(folio) &gt;&gt; inode-&gt;i_blkbits;</div><div class='add'>+	BUG_ON(!folio_test_locked(folio));</div><div class='add'>+	BUG_ON(folio_test_writeback(folio));</div><div class='add'>+	folio_start_writeback(folio);</div><div class='ctx'> </div><div class='ctx'> 	for (offset = 0; offset &lt; PAGE_SIZE; offset += PSIZE) {</div><div class='del'>-		mp = page_to_mp(page, offset);</div><div class='add'>+		mp = folio_to_mp(folio, offset);</div><div class='ctx'> </div><div class='ctx'> 		if (!mp || !test_bit(META_dirty, &amp;mp-&gt;flag))</div><div class='ctx'> 			continue;</div><div class='hunk'>@@ -389,22 +476,20 @@ static int metapage_writepage(struct page *page, struct writeback_control *wbc)</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> 			/* Not contiguous */</div><div class='del'>-			if (bio_add_page(bio, page, bio_bytes, bio_offset) &lt;</div><div class='del'>-			    bio_bytes)</div><div class='del'>-				goto add_failed;</div><div class='add'>+			bio_add_folio_nofail(bio, folio, bio_bytes, bio_offset);</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Increment counter before submitting i/o to keep</div><div class='ctx'> 			 * count from hitting zero before we're through</div><div class='ctx'> 			 */</div><div class='del'>-			inc_io(page);</div><div class='add'>+			inc_io(folio);</div><div class='ctx'> 			if (!bio-&gt;bi_iter.bi_size)</div><div class='ctx'> 				goto dump_bio;</div><div class='ctx'> 			submit_bio(bio);</div><div class='ctx'> 			nr_underway++;</div><div class='ctx'> 			bio = NULL;</div><div class='ctx'> 		} else</div><div class='del'>-			inc_io(page);</div><div class='del'>-		xlen = (PAGE_SIZE - offset) &gt;&gt; inode-&gt;i_blkbits;</div><div class='add'>+			inc_io(folio);</div><div class='add'>+		xlen = (folio_size(folio) - offset) &gt;&gt; inode-&gt;i_blkbits;</div><div class='ctx'> 		pblock = metapage_get_blocks(inode, lblock, &amp;xlen);</div><div class='ctx'> 		if (!pblock) {</div><div class='ctx'> 			printk(KERN_ERR "JFS: metapage_get_blocks failed\n");</div><div class='hunk'>@@ -417,12 +502,10 @@ static int metapage_writepage(struct page *page, struct writeback_control *wbc)</div><div class='ctx'> 		}</div><div class='ctx'> 		len = min(xlen, (int)JFS_SBI(inode-&gt;i_sb)-&gt;nbperpage);</div><div class='ctx'> </div><div class='del'>-		bio = bio_alloc(GFP_NOFS, 1);</div><div class='del'>-		bio_set_dev(bio, inode-&gt;i_sb-&gt;s_bdev);</div><div class='add'>+		bio = bio_alloc(inode-&gt;i_sb-&gt;s_bdev, 1, REQ_OP_WRITE, GFP_NOFS);</div><div class='ctx'> 		bio-&gt;bi_iter.bi_sector = pblock &lt;&lt; (inode-&gt;i_blkbits - 9);</div><div class='ctx'> 		bio-&gt;bi_end_io = metapage_write_end_io;</div><div class='del'>-		bio-&gt;bi_private = page;</div><div class='del'>-		bio_set_op_attrs(bio, REQ_OP_WRITE, 0);</div><div class='add'>+		bio-&gt;bi_private = folio;</div><div class='ctx'> </div><div class='ctx'> 		/* Don't call bio_add_page yet, we may add to this vec */</div><div class='ctx'> 		bio_offset = offset;</div><div class='hunk'>@@ -432,8 +515,7 @@ static int metapage_writepage(struct page *page, struct writeback_control *wbc)</div><div class='ctx'> 		next_block = lblock + len;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (bio) {</div><div class='del'>-		if (bio_add_page(bio, page, bio_bytes, bio_offset) &lt; bio_bytes)</div><div class='del'>-				goto add_failed;</div><div class='add'>+		bio_add_folio_nofail(bio, folio, bio_bytes, bio_offset);</div><div class='ctx'> 		if (!bio-&gt;bi_iter.bi_size)</div><div class='ctx'> 			goto dump_bio;</div><div class='ctx'> </div><div class='hunk'>@@ -441,49 +523,58 @@ static int metapage_writepage(struct page *page, struct writeback_control *wbc)</div><div class='ctx'> 		nr_underway++;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (redirty)</div><div class='del'>-		redirty_page_for_writepage(wbc, page);</div><div class='add'>+		folio_redirty_for_writepage(wbc, folio);</div><div class='ctx'> </div><div class='del'>-	unlock_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> </div><div class='ctx'> 	if (bad_blocks)</div><div class='ctx'> 		goto err_out;</div><div class='ctx'> </div><div class='ctx'> 	if (nr_underway == 0)</div><div class='del'>-		end_page_writeback(page);</div><div class='add'>+		folio_end_writeback(folio);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='del'>-add_failed:</div><div class='del'>-	/* We should never reach here, since we're only adding one vec */</div><div class='del'>-	printk(KERN_ERR "JFS: bio_add_page failed unexpectedly\n");</div><div class='del'>-	goto skip;</div><div class='ctx'> dump_bio:</div><div class='ctx'> 	print_hex_dump(KERN_ERR, "JFS: dump of bio: ", DUMP_PREFIX_ADDRESS, 16,</div><div class='ctx'> 		       4, bio, sizeof(*bio), 0);</div><div class='del'>-skip:</div><div class='ctx'> 	bio_put(bio);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	dec_io(page, last_write_complete);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	dec_io(folio, BLK_STS_OK, last_write_complete);</div><div class='ctx'> err_out:</div><div class='ctx'> 	while (bad_blocks--)</div><div class='del'>-		dec_io(page, last_write_complete);</div><div class='add'>+		dec_io(folio, BLK_STS_OK, last_write_complete);</div><div class='ctx'> 	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int metapage_readpage(struct file *fp, struct page *page)</div><div class='add'>+static int metapage_writepages(struct address_space *mapping,</div><div class='add'>+		struct writeback_control *wbc)</div><div class='add'>+{</div><div class='add'>+	struct blk_plug plug;</div><div class='add'>+	struct folio *folio = NULL;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	blk_start_plug(&amp;plug);</div><div class='add'>+	while ((folio = writeback_iter(mapping, wbc, folio, &amp;err)))</div><div class='add'>+		err = metapage_write_folio(folio, wbc);</div><div class='add'>+	blk_finish_plug(&amp;plug);</div><div class='add'>+</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int metapage_read_folio(struct file *fp, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	struct bio *bio = NULL;</div><div class='ctx'> 	int block_offset;</div><div class='del'>-	int blocks_per_page = i_blocks_per_page(inode, page);</div><div class='add'>+	int blocks_per_page = i_blocks_per_folio(inode, folio);</div><div class='ctx'> 	sector_t page_start;	/* address of page in fs blocks */</div><div class='ctx'> 	sector_t pblock;</div><div class='ctx'> 	int xlen;</div><div class='ctx'> 	unsigned int len;</div><div class='ctx'> 	int offset;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(!PageLocked(page));</div><div class='del'>-	page_start = (sector_t)page-&gt;index &lt;&lt;</div><div class='del'>-		     (PAGE_SHIFT - inode-&gt;i_blkbits);</div><div class='add'>+	BUG_ON(!folio_test_locked(folio));</div><div class='add'>+	page_start = folio_pos(folio) &gt;&gt; inode-&gt;i_blkbits;</div><div class='ctx'> </div><div class='ctx'> 	block_offset = 0;</div><div class='ctx'> 	while (block_offset &lt; blocks_per_page) {</div><div class='hunk'>@@ -491,23 +582,21 @@ static int metapage_readpage(struct file *fp, struct page *page)</div><div class='ctx'> 		pblock = metapage_get_blocks(inode, page_start + block_offset,</div><div class='ctx'> 					     &amp;xlen);</div><div class='ctx'> 		if (pblock) {</div><div class='del'>-			if (!PagePrivate(page))</div><div class='del'>-				insert_metapage(page, NULL);</div><div class='del'>-			inc_io(page);</div><div class='add'>+			if (!folio-&gt;private)</div><div class='add'>+				insert_metapage(folio, NULL);</div><div class='add'>+			inc_io(folio);</div><div class='ctx'> 			if (bio)</div><div class='ctx'> 				submit_bio(bio);</div><div class='ctx'> </div><div class='del'>-			bio = bio_alloc(GFP_NOFS, 1);</div><div class='del'>-			bio_set_dev(bio, inode-&gt;i_sb-&gt;s_bdev);</div><div class='add'>+			bio = bio_alloc(inode-&gt;i_sb-&gt;s_bdev, 1, REQ_OP_READ,</div><div class='add'>+					GFP_NOFS);</div><div class='ctx'> 			bio-&gt;bi_iter.bi_sector =</div><div class='ctx'> 				pblock &lt;&lt; (inode-&gt;i_blkbits - 9);</div><div class='ctx'> 			bio-&gt;bi_end_io = metapage_read_end_io;</div><div class='del'>-			bio-&gt;bi_private = page;</div><div class='del'>-			bio_set_op_attrs(bio, REQ_OP_READ, 0);</div><div class='add'>+			bio-&gt;bi_private = folio;</div><div class='ctx'> 			len = xlen &lt;&lt; inode-&gt;i_blkbits;</div><div class='ctx'> 			offset = block_offset &lt;&lt; inode-&gt;i_blkbits;</div><div class='del'>-			if (bio_add_page(bio, page, len, offset) &lt; len)</div><div class='del'>-				goto add_failed;</div><div class='add'>+			bio_add_folio_nofail(bio, folio, len, offset);</div><div class='ctx'> 			block_offset += xlen;</div><div class='ctx'> 		} else</div><div class='ctx'> 			block_offset++;</div><div class='hunk'>@@ -515,62 +604,80 @@ static int metapage_readpage(struct file *fp, struct page *page)</div><div class='ctx'> 	if (bio)</div><div class='ctx'> 		submit_bio(bio);</div><div class='ctx'> 	else</div><div class='del'>-		unlock_page(page);</div><div class='add'>+		folio_unlock(folio);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='del'>-</div><div class='del'>-add_failed:</div><div class='del'>-	printk(KERN_ERR "JFS: bio_add_page failed unexpectedly\n");</div><div class='del'>-	bio_put(bio);</div><div class='del'>-	dec_io(page, last_read_complete);</div><div class='del'>-	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int metapage_releasepage(struct page *page, gfp_t gfp_mask)</div><div class='add'>+static bool metapage_release_folio(struct folio *folio, gfp_t gfp_mask)</div><div class='ctx'> {</div><div class='ctx'> 	struct metapage *mp;</div><div class='del'>-	int ret = 1;</div><div class='add'>+	bool ret = true;</div><div class='ctx'> 	int offset;</div><div class='ctx'> </div><div class='ctx'> 	for (offset = 0; offset &lt; PAGE_SIZE; offset += PSIZE) {</div><div class='del'>-		mp = page_to_mp(page, offset);</div><div class='add'>+		mp = folio_to_mp(folio, offset);</div><div class='ctx'> </div><div class='ctx'> 		if (!mp)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		jfs_info("metapage_releasepage: mp = 0x%p", mp);</div><div class='add'>+		jfs_info("metapage_release_folio: mp = 0x%p", mp);</div><div class='ctx'> 		if (mp-&gt;count || mp-&gt;nohomeok ||</div><div class='ctx'> 		    test_bit(META_dirty, &amp;mp-&gt;flag)) {</div><div class='ctx'> 			jfs_info("count = %ld, nohomeok = %d", mp-&gt;count,</div><div class='ctx'> 				 mp-&gt;nohomeok);</div><div class='del'>-			ret = 0;</div><div class='add'>+			ret = false;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (mp-&gt;lsn)</div><div class='ctx'> 			remove_from_logsync(mp);</div><div class='del'>-		remove_metapage(page, mp);</div><div class='add'>+		remove_metapage(folio, mp);</div><div class='ctx'> 		INCREMENT(mpStat.pagefree);</div><div class='ctx'> 		free_metapage(mp);</div><div class='ctx'> 	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void metapage_invalidatepage(struct page *page, unsigned int offset,</div><div class='del'>-				    unsigned int length)</div><div class='add'>+#ifdef CONFIG_MIGRATION</div><div class='add'>+/*</div><div class='add'>+ * metapage_migrate_folio - Migration function for JFS metapages</div><div class='add'>+ */</div><div class='add'>+static int metapage_migrate_folio(struct address_space *mapping,</div><div class='add'>+				  struct folio *dst, struct folio *src,</div><div class='add'>+				  enum migrate_mode mode)</div><div class='ctx'> {</div><div class='del'>-	BUG_ON(offset || length &lt; PAGE_SIZE);</div><div class='add'>+	int expected_count;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(PageWriteback(page));</div><div class='add'>+	if (!src-&gt;private)</div><div class='add'>+		return filemap_migrate_folio(mapping, dst, src, mode);</div><div class='ctx'> </div><div class='del'>-	metapage_releasepage(page, 0);</div><div class='add'>+	/* Check whether page does not have extra refs before we do more work */</div><div class='add'>+	expected_count = folio_expected_ref_count(src) + 1;</div><div class='add'>+	if (folio_ref_count(src) != expected_count)</div><div class='add'>+		return -EAGAIN;</div><div class='add'>+	return __metapage_migrate_folio(mapping, dst, src, mode);</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+#define metapage_migrate_folio NULL</div><div class='add'>+#endif	/* CONFIG_MIGRATION */</div><div class='add'>+</div><div class='add'>+static void metapage_invalidate_folio(struct folio *folio, size_t offset,</div><div class='add'>+				    size_t length)</div><div class='add'>+{</div><div class='add'>+	BUG_ON(offset || length &lt; folio_size(folio));</div><div class='add'>+</div><div class='add'>+	BUG_ON(folio_test_writeback(folio));</div><div class='add'>+</div><div class='add'>+	metapage_release_folio(folio, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations jfs_metapage_aops = {</div><div class='del'>-	.readpage	= metapage_readpage,</div><div class='del'>-	.writepage	= metapage_writepage,</div><div class='del'>-	.releasepage	= metapage_releasepage,</div><div class='del'>-	.invalidatepage	= metapage_invalidatepage,</div><div class='del'>-	.set_page_dirty	= __set_page_dirty_nobuffers,</div><div class='add'>+	.read_folio	= metapage_read_folio,</div><div class='add'>+	.writepages	= metapage_writepages,</div><div class='add'>+	.release_folio	= metapage_release_folio,</div><div class='add'>+	.invalidate_folio = metapage_invalidate_folio,</div><div class='add'>+	.dirty_folio	= filemap_dirty_folio,</div><div class='add'>+	.migrate_folio	= metapage_migrate_folio,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct metapage *__get_metapage(struct inode *inode, unsigned long lblock,</div><div class='hunk'>@@ -581,7 +688,7 @@ struct metapage *__get_metapage(struct inode *inode, unsigned long lblock,</div><div class='ctx'> 	int l2bsize;</div><div class='ctx'> 	struct address_space *mapping;</div><div class='ctx'> 	struct metapage *mp = NULL;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	unsigned long page_index;</div><div class='ctx'> 	unsigned long page_offset;</div><div class='ctx'> </div><div class='hunk'>@@ -612,22 +719,22 @@ struct metapage *__get_metapage(struct inode *inode, unsigned long lblock,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (new &amp;&amp; (PSIZE == PAGE_SIZE)) {</div><div class='del'>-		page = grab_cache_page(mapping, page_index);</div><div class='del'>-		if (!page) {</div><div class='del'>-			jfs_err("grab_cache_page failed!");</div><div class='add'>+		folio = filemap_grab_folio(mapping, page_index);</div><div class='add'>+		if (IS_ERR(folio)) {</div><div class='add'>+			jfs_err("filemap_grab_folio failed!");</div><div class='ctx'> 			return NULL;</div><div class='ctx'> 		}</div><div class='del'>-		SetPageUptodate(page);</div><div class='add'>+		folio_mark_uptodate(folio);</div><div class='ctx'> 	} else {</div><div class='del'>-		page = read_mapping_page(mapping, page_index, NULL);</div><div class='del'>-		if (IS_ERR(page) || !PageUptodate(page)) {</div><div class='add'>+		folio = read_mapping_folio(mapping, page_index, NULL);</div><div class='add'>+		if (IS_ERR(folio)) {</div><div class='ctx'> 			jfs_err("read_mapping_page failed!");</div><div class='ctx'> 			return NULL;</div><div class='ctx'> 		}</div><div class='del'>-		lock_page(page);</div><div class='add'>+		folio_lock(folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	mp = page_to_mp(page, page_offset);</div><div class='add'>+	mp = folio_to_mp(folio, page_offset);</div><div class='ctx'> 	if (mp) {</div><div class='ctx'> 		if (mp-&gt;logical_size != size) {</div><div class='ctx'> 			jfs_error(inode-&gt;i_sb,</div><div class='hunk'>@@ -653,16 +760,16 @@ struct metapage *__get_metapage(struct inode *inode, unsigned long lblock,</div><div class='ctx'> 		mp = alloc_metapage(GFP_NOFS);</div><div class='ctx'> 		if (!mp)</div><div class='ctx'> 			goto unlock;</div><div class='del'>-		mp-&gt;page = page;</div><div class='add'>+		mp-&gt;folio = folio;</div><div class='ctx'> 		mp-&gt;sb = inode-&gt;i_sb;</div><div class='ctx'> 		mp-&gt;flag = 0;</div><div class='ctx'> 		mp-&gt;xflag = COMMIT_PAGE;</div><div class='ctx'> 		mp-&gt;count = 1;</div><div class='ctx'> 		mp-&gt;nohomeok = 0;</div><div class='ctx'> 		mp-&gt;logical_size = size;</div><div class='del'>-		mp-&gt;data = page_address(page) + page_offset;</div><div class='add'>+		mp-&gt;data = folio_address(folio) + page_offset;</div><div class='ctx'> 		mp-&gt;index = lblock;</div><div class='del'>-		if (unlikely(insert_metapage(page, mp))) {</div><div class='add'>+		if (unlikely(insert_metapage(folio, mp))) {</div><div class='ctx'> 			free_metapage(mp);</div><div class='ctx'> 			goto unlock;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -674,92 +781,118 @@ struct metapage *__get_metapage(struct inode *inode, unsigned long lblock,</div><div class='ctx'> 		memset(mp-&gt;data, 0, PSIZE);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	unlock_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> 	jfs_info("__get_metapage: returning = 0x%p data = 0x%p", mp, mp-&gt;data);</div><div class='ctx'> 	return mp;</div><div class='ctx'> </div><div class='ctx'> unlock:</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void grab_metapage(struct metapage * mp)</div><div class='ctx'> {</div><div class='ctx'> 	jfs_info("grab_metapage: mp = 0x%p", mp);</div><div class='del'>-	get_page(mp-&gt;page);</div><div class='del'>-	lock_page(mp-&gt;page);</div><div class='add'>+	folio_get(mp-&gt;folio);</div><div class='add'>+	folio_lock(mp-&gt;folio);</div><div class='ctx'> 	mp-&gt;count++;</div><div class='ctx'> 	lock_metapage(mp);</div><div class='del'>-	unlock_page(mp-&gt;page);</div><div class='add'>+	folio_unlock(mp-&gt;folio);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int metapage_write_one(struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	struct address_space *mapping = folio-&gt;mapping;</div><div class='add'>+	struct writeback_control wbc = {</div><div class='add'>+		.sync_mode = WB_SYNC_ALL,</div><div class='add'>+		.nr_to_write = folio_nr_pages(folio),</div><div class='add'>+	};</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	BUG_ON(!folio_test_locked(folio));</div><div class='add'>+</div><div class='add'>+	folio_wait_writeback(folio);</div><div class='add'>+</div><div class='add'>+	if (folio_clear_dirty_for_io(folio)) {</div><div class='add'>+		folio_get(folio);</div><div class='add'>+		ret = metapage_write_folio(folio, &amp;wbc);</div><div class='add'>+		if (ret == 0)</div><div class='add'>+			folio_wait_writeback(folio);</div><div class='add'>+		folio_put(folio);</div><div class='add'>+	} else {</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!ret)</div><div class='add'>+		ret = filemap_check_errors(mapping);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void force_metapage(struct metapage *mp)</div><div class='ctx'> {</div><div class='del'>-	struct page *page = mp-&gt;page;</div><div class='add'>+	struct folio *folio = mp-&gt;folio;</div><div class='ctx'> 	jfs_info("force_metapage: mp = 0x%p", mp);</div><div class='ctx'> 	set_bit(META_forcewrite, &amp;mp-&gt;flag);</div><div class='ctx'> 	clear_bit(META_sync, &amp;mp-&gt;flag);</div><div class='del'>-	get_page(page);</div><div class='del'>-	lock_page(page);</div><div class='del'>-	set_page_dirty(page);</div><div class='del'>-	if (write_one_page(page))</div><div class='del'>-		jfs_error(mp-&gt;sb, "write_one_page() failed\n");</div><div class='add'>+	folio_get(folio);</div><div class='add'>+	folio_lock(folio);</div><div class='add'>+	folio_mark_dirty(folio);</div><div class='add'>+	if (metapage_write_one(folio))</div><div class='add'>+		jfs_error(mp-&gt;sb, "metapage_write_one() failed\n");</div><div class='ctx'> 	clear_bit(META_forcewrite, &amp;mp-&gt;flag);</div><div class='del'>-	put_page(page);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void hold_metapage(struct metapage *mp)</div><div class='ctx'> {</div><div class='del'>-	lock_page(mp-&gt;page);</div><div class='add'>+	folio_lock(mp-&gt;folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void put_metapage(struct metapage *mp)</div><div class='ctx'> {</div><div class='ctx'> 	if (mp-&gt;count || mp-&gt;nohomeok) {</div><div class='ctx'> 		/* Someone else will release this */</div><div class='del'>-		unlock_page(mp-&gt;page);</div><div class='add'>+		folio_unlock(mp-&gt;folio);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='del'>-	get_page(mp-&gt;page);</div><div class='add'>+	folio_get(mp-&gt;folio);</div><div class='ctx'> 	mp-&gt;count++;</div><div class='ctx'> 	lock_metapage(mp);</div><div class='del'>-	unlock_page(mp-&gt;page);</div><div class='add'>+	folio_unlock(mp-&gt;folio);</div><div class='ctx'> 	release_metapage(mp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void release_metapage(struct metapage * mp)</div><div class='ctx'> {</div><div class='del'>-	struct page *page = mp-&gt;page;</div><div class='add'>+	struct folio *folio = mp-&gt;folio;</div><div class='ctx'> 	jfs_info("release_metapage: mp = 0x%p, flag = 0x%lx", mp, mp-&gt;flag);</div><div class='ctx'> </div><div class='del'>-	BUG_ON(!page);</div><div class='del'>-</div><div class='del'>-	lock_page(page);</div><div class='add'>+	folio_lock(folio);</div><div class='ctx'> 	unlock_metapage(mp);</div><div class='ctx'> </div><div class='ctx'> 	assert(mp-&gt;count);</div><div class='ctx'> 	if (--mp-&gt;count || mp-&gt;nohomeok) {</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		put_page(page);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (test_bit(META_dirty, &amp;mp-&gt;flag)) {</div><div class='del'>-		set_page_dirty(page);</div><div class='add'>+		folio_mark_dirty(folio);</div><div class='ctx'> 		if (test_bit(META_sync, &amp;mp-&gt;flag)) {</div><div class='ctx'> 			clear_bit(META_sync, &amp;mp-&gt;flag);</div><div class='del'>-			if (write_one_page(page))</div><div class='del'>-				jfs_error(mp-&gt;sb, "write_one_page() failed\n");</div><div class='del'>-			lock_page(page); /* write_one_page unlocks the page */</div><div class='add'>+			if (metapage_write_one(folio))</div><div class='add'>+				jfs_error(mp-&gt;sb, "metapage_write_one() failed\n");</div><div class='add'>+			folio_lock(folio);</div><div class='ctx'> 		}</div><div class='ctx'> 	} else if (mp-&gt;lsn)	/* discard_metapage doesn't remove it */</div><div class='ctx'> 		remove_from_logsync(mp);</div><div class='ctx'> </div><div class='ctx'> 	/* Try to keep metapages from using up too much memory */</div><div class='del'>-	drop_metapage(page, mp);</div><div class='add'>+	drop_metapage(folio, mp);</div><div class='ctx'> </div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void __invalidate_metapages(struct inode *ip, s64 addr, int len)</div><div class='hunk'>@@ -771,7 +904,6 @@ void __invalidate_metapages(struct inode *ip, s64 addr, int len)</div><div class='ctx'> 	struct address_space *mapping =</div><div class='ctx'> 		JFS_SBI(ip-&gt;i_sb)-&gt;direct_inode-&gt;i_mapping;</div><div class='ctx'> 	struct metapage *mp;</div><div class='del'>-	struct page *page;</div><div class='ctx'> 	unsigned int offset;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -780,11 +912,12 @@ void __invalidate_metapages(struct inode *ip, s64 addr, int len)</div><div class='ctx'> 	 */</div><div class='ctx'> 	for (lblock = addr &amp; ~(BlocksPerPage - 1); lblock &lt; addr + len;</div><div class='ctx'> 	     lblock += BlocksPerPage) {</div><div class='del'>-		page = find_lock_page(mapping, lblock &gt;&gt; l2BlocksPerPage);</div><div class='del'>-		if (!page)</div><div class='add'>+		struct folio *folio = filemap_lock_folio(mapping,</div><div class='add'>+				lblock &gt;&gt; l2BlocksPerPage);</div><div class='add'>+		if (IS_ERR(folio))</div><div class='ctx'> 			continue;</div><div class='ctx'> 		for (offset = 0; offset &lt; PAGE_SIZE; offset += PSIZE) {</div><div class='del'>-			mp = page_to_mp(page, offset);</div><div class='add'>+			mp = folio_to_mp(folio, offset);</div><div class='ctx'> 			if (!mp)</div><div class='ctx'> 				continue;</div><div class='ctx'> 			if (mp-&gt;index &lt; addr)</div><div class='hunk'>@@ -797,8 +930,8 @@ void __invalidate_metapages(struct inode *ip, s64 addr, int len)</div><div class='ctx'> 			if (mp-&gt;lsn)</div><div class='ctx'> 				remove_from_logsync(mp);</div><div class='ctx'> 		}</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		put_page(page);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/jfs/jfs_metapage.h b/fs/jfs/jfs_metapage.h<br/>index 4179f9df4deb..2e5015c2705b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_metapage.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_metapage.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_metapage.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/jfs_metapage.h</a></div><div class='hunk'>@@ -24,7 +24,7 @@ struct metapage {</div><div class='ctx'> 	wait_queue_head_t wait;</div><div class='ctx'> </div><div class='ctx'> 	/* implementation */</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	struct super_block *sb;</div><div class='ctx'> 	unsigned int logical_size;</div><div class='ctx'> </div><div class='hunk'>@@ -90,14 +90,14 @@ static inline void discard_metapage(struct metapage *mp)</div><div class='ctx'> </div><div class='ctx'> static inline void metapage_nohomeok(struct metapage *mp)</div><div class='ctx'> {</div><div class='del'>-	struct page *page = mp-&gt;page;</div><div class='del'>-	lock_page(page);</div><div class='add'>+	struct folio *folio = mp-&gt;folio;</div><div class='add'>+	folio_lock(folio);</div><div class='ctx'> 	if (!mp-&gt;nohomeok++) {</div><div class='ctx'> 		mark_metapage_dirty(mp);</div><div class='del'>-		get_page(page);</div><div class='del'>-		wait_on_page_writeback(page);</div><div class='add'>+		folio_get(folio);</div><div class='add'>+		folio_wait_writeback(folio);</div><div class='ctx'> 	}</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -107,7 +107,7 @@ static inline void metapage_nohomeok(struct metapage *mp)</div><div class='ctx'> static inline void metapage_wait_for_io(struct metapage *mp)</div><div class='ctx'> {</div><div class='ctx'> 	if (test_bit(META_io, &amp;mp-&gt;flag))</div><div class='del'>-		wait_on_page_writeback(mp-&gt;page);</div><div class='add'>+		folio_wait_writeback(mp-&gt;folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -116,7 +116,7 @@ static inline void metapage_wait_for_io(struct metapage *mp)</div><div class='ctx'> static inline void _metapage_homeok(struct metapage *mp)</div><div class='ctx'> {</div><div class='ctx'> 	if (!--mp-&gt;nohomeok)</div><div class='del'>-		put_page(mp-&gt;page);</div><div class='add'>+		folio_put(mp-&gt;folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void metapage_homeok(struct metapage *mp)</div><div class='head'>diff --git a/fs/jfs/jfs_mount.c b/fs/jfs/jfs_mount.c<br/>index aa4ff7bcaff2..52e6b58c5dbd 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_mount.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_mount.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_mount.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/jfs_mount.c</a></div><div class='hunk'>@@ -172,15 +172,15 @@ int jfs_mount(struct super_block *sb)</div><div class='ctx'> 	}</div><div class='ctx'> 	jfs_info("jfs_mount: ipimap:0x%p", ipimap);</div><div class='ctx'> </div><div class='del'>-	/* map further access of per fileset inodes by the fileset inode */</div><div class='del'>-	sbi-&gt;ipimap = ipimap;</div><div class='del'>-</div><div class='ctx'> 	/* initialize fileset inode allocation map */</div><div class='ctx'> 	if ((rc = diMount(ipimap))) {</div><div class='ctx'> 		jfs_err("jfs_mount: diMount failed w/rc = %d", rc);</div><div class='ctx'> 		goto err_ipimap;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	/* map further access of per fileset inodes by the fileset inode */</div><div class='add'>+	sbi-&gt;ipimap = ipimap;</div><div class='add'>+</div><div class='ctx'> 	return rc;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -234,11 +234,15 @@ int jfs_mount_rw(struct super_block *sb, int remount)</div><div class='ctx'> </div><div class='ctx'> 		truncate_inode_pages(sbi-&gt;ipimap-&gt;i_mapping, 0);</div><div class='ctx'> 		truncate_inode_pages(sbi-&gt;ipbmap-&gt;i_mapping, 0);</div><div class='add'>+</div><div class='add'>+		IWRITE_LOCK(sbi-&gt;ipimap, RDWRLOCK_IMAP);</div><div class='ctx'> 		diUnmount(sbi-&gt;ipimap, 1);</div><div class='ctx'> 		if ((rc = diMount(sbi-&gt;ipimap))) {</div><div class='add'>+			IWRITE_UNLOCK(sbi-&gt;ipimap);</div><div class='ctx'> 			jfs_err("jfs_mount_rw: diMount failed!");</div><div class='ctx'> 			return rc;</div><div class='ctx'> 		}</div><div class='add'>+		IWRITE_UNLOCK(sbi-&gt;ipimap);</div><div class='ctx'> </div><div class='ctx'> 		dbUnmount(sbi-&gt;ipbmap, 1);</div><div class='ctx'> 		if ((rc = dbMount(sbi-&gt;ipbmap))) {</div><div class='hunk'>@@ -307,13 +311,11 @@ static int chkSuper(struct super_block *sb)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	bsize = le32_to_cpu(j_sb-&gt;s_bsize);</div><div class='del'>-#ifdef _JFS_4K</div><div class='ctx'> 	if (bsize != PSIZE) {</div><div class='del'>-		jfs_err("Currently only 4K block size supported!");</div><div class='add'>+		jfs_err("Only 4K block size supported!");</div><div class='ctx'> 		rc = -EINVAL;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-#endif				/* _JFS_4K */</div><div class='ctx'> </div><div class='ctx'> 	jfs_info("superblock: flag:0x%08x state:0x%08x size:0x%Lx",</div><div class='ctx'> 		 le32_to_cpu(j_sb-&gt;s_flag), le32_to_cpu(j_sb-&gt;s_state),</div><div class='hunk'>@@ -323,13 +325,13 @@ static int chkSuper(struct super_block *sb)</div><div class='ctx'> 	if ((j_sb-&gt;s_flag &amp; cpu_to_le32(JFS_BAD_SAIT)) !=</div><div class='ctx'> 	    cpu_to_le32(JFS_BAD_SAIT)) {</div><div class='ctx'> 		expected_AIM_bytesize = 2 * PSIZE;</div><div class='del'>-		AIM_bytesize = lengthPXD(&amp;(j_sb-&gt;s_aim2)) * bsize;</div><div class='add'>+		AIM_bytesize = lengthPXD(&amp;j_sb-&gt;s_aim2) * bsize;</div><div class='ctx'> 		expected_AIT_bytesize = 4 * PSIZE;</div><div class='del'>-		AIT_bytesize = lengthPXD(&amp;(j_sb-&gt;s_ait2)) * bsize;</div><div class='del'>-		AIM_byte_addr = addressPXD(&amp;(j_sb-&gt;s_aim2)) * bsize;</div><div class='del'>-		AIT_byte_addr = addressPXD(&amp;(j_sb-&gt;s_ait2)) * bsize;</div><div class='add'>+		AIT_bytesize = lengthPXD(&amp;j_sb-&gt;s_ait2) * bsize;</div><div class='add'>+		AIM_byte_addr = addressPXD(&amp;j_sb-&gt;s_aim2) * bsize;</div><div class='add'>+		AIT_byte_addr = addressPXD(&amp;j_sb-&gt;s_ait2) * bsize;</div><div class='ctx'> 		byte_addr_diff0 = AIT_byte_addr - AIM_byte_addr;</div><div class='del'>-		fsckwsp_addr = addressPXD(&amp;(j_sb-&gt;s_fsckpxd)) * bsize;</div><div class='add'>+		fsckwsp_addr = addressPXD(&amp;j_sb-&gt;s_fsckpxd) * bsize;</div><div class='ctx'> 		byte_addr_diff1 = fsckwsp_addr - AIT_byte_addr;</div><div class='ctx'> 		if ((AIM_bytesize != expected_AIM_bytesize) ||</div><div class='ctx'> 		    (AIT_bytesize != expected_AIT_bytesize) ||</div><div class='hunk'>@@ -428,7 +430,8 @@ int updateSuper(struct super_block *sb, uint state)</div><div class='ctx'> </div><div class='ctx'> 	if (state == FM_MOUNT) {</div><div class='ctx'> 		/* record log's dev_t and mount serial number */</div><div class='del'>-		j_sb-&gt;s_logdev = cpu_to_le32(new_encode_dev(sbi-&gt;log-&gt;bdev-&gt;bd_dev));</div><div class='add'>+		j_sb-&gt;s_logdev = cpu_to_le32(</div><div class='add'>+			new_encode_dev(file_bdev(sbi-&gt;log-&gt;bdev_file)-&gt;bd_dev));</div><div class='ctx'> 		j_sb-&gt;s_logserial = cpu_to_le32(sbi-&gt;log-&gt;serial);</div><div class='ctx'> 	} else if (state == FM_CLEAN) {</div><div class='ctx'> 		/*</div><div class='head'>diff --git a/fs/jfs/jfs_txnmgr.c b/fs/jfs/jfs_txnmgr.c<br/>index 042bbe6d8ac2..c16578af3a77 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_txnmgr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_txnmgr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_txnmgr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/jfs_txnmgr.c</a></div><div class='hunk'>@@ -272,14 +272,15 @@ int txInit(void)</div><div class='ctx'> 	if (TxBlock == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	for (k = 1; k &lt; nTxBlock - 1; k++) {</div><div class='del'>-		TxBlock[k].next = k + 1;</div><div class='add'>+	for (k = 0; k &lt; nTxBlock; k++) {</div><div class='ctx'> 		init_waitqueue_head(&amp;TxBlock[k].gcwait);</div><div class='ctx'> 		init_waitqueue_head(&amp;TxBlock[k].waitor);</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	for (k = 1; k &lt; nTxBlock - 1; k++) {</div><div class='add'>+		TxBlock[k].next = k + 1;</div><div class='add'>+	}</div><div class='ctx'> 	TxBlock[k].next = 0;</div><div class='del'>-	init_waitqueue_head(&amp;TxBlock[k].gcwait);</div><div class='del'>-	init_waitqueue_head(&amp;TxBlock[k].waitor);</div><div class='ctx'> </div><div class='ctx'> 	TxAnchor.freetid = 1;</div><div class='ctx'> 	init_waitqueue_head(&amp;TxAnchor.freewait);</div><div class='hunk'>@@ -354,6 +355,11 @@ tid_t txBegin(struct super_block *sb, int flag)</div><div class='ctx'> 	jfs_info("txBegin: flag = 0x%x", flag);</div><div class='ctx'> 	log = JFS_SBI(sb)-&gt;log;</div><div class='ctx'> </div><div class='add'>+	if (!log) {</div><div class='add'>+		jfs_error(sb, "read-only filesystem\n");</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	TXN_LOCK();</div><div class='ctx'> </div><div class='ctx'> 	INCREMENT(TxStat.txBegin);</div><div class='hunk'>@@ -778,7 +784,7 @@ struct tlock *txLock(tid_t tid, struct inode *ip, struct metapage * mp,</div><div class='ctx'> 			if (mp-&gt;xflag &amp; COMMIT_PAGE)</div><div class='ctx'> 				p = (xtpage_t *) mp-&gt;data;</div><div class='ctx'> 			else</div><div class='del'>-				p = &amp;jfs_ip-&gt;i_xtroot;</div><div class='add'>+				p = (xtpage_t *) &amp;jfs_ip-&gt;i_xtroot;</div><div class='ctx'> 			xtlck-&gt;lwm.offset =</div><div class='ctx'> 			    le16_to_cpu(p-&gt;header.nextindex);</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1281,7 +1287,7 @@ int txCommit(tid_t tid,		/* transaction identifier */</div><div class='ctx'> 		 * to verify this, only a trivial s/I_LOCK/I_SYNC/ was done.</div><div class='ctx'> 		 * Joern</div><div class='ctx'> 		 */</div><div class='del'>-		if (tblk-&gt;u.ip-&gt;i_state &amp; I_SYNC)</div><div class='add'>+		if (inode_state_read_once(tblk-&gt;u.ip) &amp; I_SYNC)</div><div class='ctx'> 			tblk-&gt;xflag &amp;= ~COMMIT_LAZY;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1490,40 +1496,6 @@ static void diLog(struct jfs_log *log, struct tblock *tblk, struct lrd *lrd,</div><div class='ctx'> 		tlck-&gt;flag |= tlckWRITEPAGE;</div><div class='ctx'> 	} else</div><div class='ctx'> 		jfs_err("diLog: UFO type tlck:0x%p", tlck);</div><div class='del'>-#ifdef  _JFS_WIP</div><div class='del'>-	/*</div><div class='del'>-	 *	alloc/free external EA extent</div><div class='del'>-	 *</div><div class='del'>-	 * a maplock for txUpdateMap() to update bPWMAP for alloc/free</div><div class='del'>-	 * of the extent has been formatted at txLock() time;</div><div class='del'>-	 */</div><div class='del'>-	else {</div><div class='del'>-		assert(tlck-&gt;type &amp; tlckEA);</div><div class='del'>-</div><div class='del'>-		/* log LOG_UPDATEMAP for logredo() to update bmap for</div><div class='del'>-		 * alloc of new (and free of old) external EA extent;</div><div class='del'>-		 */</div><div class='del'>-		lrd-&gt;type = cpu_to_le16(LOG_UPDATEMAP);</div><div class='del'>-		pxdlock = (struct pxd_lock *) &amp; tlck-&gt;lock;</div><div class='del'>-		nlock = pxdlock-&gt;index;</div><div class='del'>-		for (i = 0; i &lt; nlock; i++, pxdlock++) {</div><div class='del'>-			if (pxdlock-&gt;flag &amp; mlckALLOCPXD)</div><div class='del'>-				lrd-&gt;log.updatemap.type =</div><div class='del'>-				    cpu_to_le16(LOG_ALLOCPXD);</div><div class='del'>-			else</div><div class='del'>-				lrd-&gt;log.updatemap.type =</div><div class='del'>-				    cpu_to_le16(LOG_FREEPXD);</div><div class='del'>-			lrd-&gt;log.updatemap.nxd = cpu_to_le16(1);</div><div class='del'>-			lrd-&gt;log.updatemap.pxd = pxdlock-&gt;pxd;</div><div class='del'>-			lrd-&gt;backchain =</div><div class='del'>-			    cpu_to_le32(lmLog(log, tblk, lrd, NULL));</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/* update bmap */</div><div class='del'>-		tlck-&gt;flag |= tlckUPDATEMAP;</div><div class='del'>-	}</div><div class='del'>-#endif				/* _JFS_WIP */</div><div class='del'>-</div><div class='ctx'> 	return;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1705,7 +1677,7 @@ static void xtLog(struct jfs_log * log, struct tblock * tblk, struct lrd * lrd,</div><div class='ctx'> </div><div class='ctx'> 	if (tlck-&gt;type &amp; tlckBTROOT) {</div><div class='ctx'> 		lrd-&gt;log.redopage.type |= cpu_to_le16(LOG_BTROOT);</div><div class='del'>-		p = &amp;JFS_IP(ip)-&gt;i_xtroot;</div><div class='add'>+		p = (xtpage_t *) &amp;JFS_IP(ip)-&gt;i_xtroot;</div><div class='ctx'> 		if (S_ISDIR(ip-&gt;i_mode))</div><div class='ctx'> 			lrd-&gt;log.redopage.type |=</div><div class='ctx'> 			    cpu_to_le16(LOG_DIR_XTREE);</div><div class='hunk'>@@ -2731,6 +2703,7 @@ int jfs_lazycommit(void *arg)</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> 	struct jfs_sb_info *sbi;</div><div class='ctx'> </div><div class='add'>+	set_freezable();</div><div class='ctx'> 	do {</div><div class='ctx'> 		LAZY_LOCK(flags);</div><div class='ctx'> 		jfs_commit_thread_waking = 0;	/* OK to wake another thread */</div><div class='hunk'>@@ -2913,6 +2886,7 @@ int jfs_sync(void *arg)</div><div class='ctx'> 	struct jfs_inode_info *jfs_ip;</div><div class='ctx'> 	tid_t tid;</div><div class='ctx'> </div><div class='add'>+	set_freezable();</div><div class='ctx'> 	do {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * write each inode on the anonymous inode list</div><div class='head'>diff --git a/fs/jfs/jfs_umount.c b/fs/jfs/jfs_umount.c<br/>index 3e8b13e6aa01..8ec43f53f686 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_umount.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_umount.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_umount.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/jfs_umount.c</a></div><div class='hunk'>@@ -68,7 +68,6 @@ int jfs_umount(struct super_block *sb)</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * close secondary aggregate inode allocation map</div><div class='ctx'> 	 */</div><div class='del'>-	ipaimap2 = sbi-&gt;ipaimap2;</div><div class='ctx'> 	if (ipaimap2) {</div><div class='ctx'> 		diUnmount(ipaimap2, 0);</div><div class='ctx'> 		diFreeSpecial(ipaimap2);</div><div class='hunk'>@@ -78,7 +77,6 @@ int jfs_umount(struct super_block *sb)</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * close aggregate inode allocation map</div><div class='ctx'> 	 */</div><div class='del'>-	ipaimap = sbi-&gt;ipaimap;</div><div class='ctx'> 	diUnmount(ipaimap, 0);</div><div class='ctx'> 	diFreeSpecial(ipaimap);</div><div class='ctx'> 	sbi-&gt;ipaimap = NULL;</div><div class='hunk'>@@ -89,7 +87,7 @@ int jfs_umount(struct super_block *sb)</div><div class='ctx'> 	dbUnmount(ipbmap, 0);</div><div class='ctx'> </div><div class='ctx'> 	diFreeSpecial(ipbmap);</div><div class='del'>-	sbi-&gt;ipimap = NULL;</div><div class='add'>+	sbi-&gt;ipbmap = NULL;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Make sure all metadata makes it to disk before we mark</div><div class='head'>diff --git a/fs/jfs/jfs_unicode.h b/fs/jfs/jfs_unicode.h<br/>index 9db62d047daa..b6a78d4aef1b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_unicode.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_unicode.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_unicode.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/jfs_unicode.h</a></div><div class='hunk'>@@ -8,16 +8,9 @@</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;asm/byteorder.h&gt;</div><div class='add'>+#include "../nls/nls_ucs2_data.h"</div><div class='ctx'> #include "jfs_types.h"</div><div class='ctx'> </div><div class='del'>-typedef struct {</div><div class='del'>-	wchar_t start;</div><div class='del'>-	wchar_t end;</div><div class='del'>-	signed char *table;</div><div class='del'>-} UNICASERANGE;</div><div class='del'>-</div><div class='del'>-extern signed char UniUpperTable[512];</div><div class='del'>-extern UNICASERANGE UniUpperRange[];</div><div class='ctx'> extern int get_UCSname(struct component_name *, struct dentry *);</div><div class='ctx'> extern int jfs_strfromUCS_le(char *, const __le16 *, int, struct nls_table *);</div><div class='ctx'> </div><div class='hunk'>@@ -107,12 +100,12 @@ static inline wchar_t *UniStrncpy_from_le(wchar_t * ucs1, const __le16 * ucs2,</div><div class='ctx'>  */</div><div class='ctx'> static inline wchar_t UniToupper(wchar_t uc)</div><div class='ctx'> {</div><div class='del'>-	UNICASERANGE *rp;</div><div class='add'>+	const struct UniCaseRange *rp;</div><div class='ctx'> </div><div class='del'>-	if (uc &lt; sizeof(UniUpperTable)) {	/* Latin characters */</div><div class='del'>-		return uc + UniUpperTable[uc];	/* Use base tables */</div><div class='add'>+	if (uc &lt; sizeof(NlsUniUpperTable)) {	/* Latin characters */</div><div class='add'>+		return uc + NlsUniUpperTable[uc];	/* Use base tables */</div><div class='ctx'> 	} else {</div><div class='del'>-		rp = UniUpperRange;	/* Use range tables */</div><div class='add'>+		rp = NlsUniUpperRange;	/* Use range tables */</div><div class='ctx'> 		while (rp-&gt;start) {</div><div class='ctx'> 			if (uc &lt; rp-&gt;start)	/* Before start of range */</div><div class='ctx'> 				return uc;	/* Uppercase = input */</div><div class='head'>diff --git a/fs/jfs/jfs_uniupr.c b/fs/jfs/jfs_uniupr.c<br/>deleted file mode 100644<br/>index d0b18c7befb8..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_uniupr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_uniupr.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,121 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='del'>-/*</div><div class='del'>- *   Copyright (C) International Business Machines Corp., 2000-2002</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#include &lt;linux/fs.h&gt;</div><div class='del'>-#include "jfs_unicode.h"</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Latin upper case</div><div class='del'>- */</div><div class='del'>-signed char UniUpperTable[512] = {</div><div class='del'>-   0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0, /* 000-00f */</div><div class='del'>-   0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0, /* 010-01f */</div><div class='del'>-   0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0, /* 020-02f */</div><div class='del'>-   0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0, /* 030-03f */</div><div class='del'>-   0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0, /* 040-04f */</div><div class='del'>-   0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0, /* 050-05f */</div><div class='del'>-   0,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32, /* 060-06f */</div><div class='del'>- -32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,  0,  0,  0,  0,  0, /* 070-07f */</div><div class='del'>-   0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0, /* 080-08f */</div><div class='del'>-   0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0, /* 090-09f */</div><div class='del'>-   0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0, /* 0a0-0af */</div><div class='del'>-   0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0, /* 0b0-0bf */</div><div class='del'>-   0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0, /* 0c0-0cf */</div><div class='del'>-   0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0, /* 0d0-0df */</div><div class='del'>- -32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32, /* 0e0-0ef */</div><div class='del'>- -32,-32,-32,-32,-32,-32,-32,  0,-32,-32,-32,-32,-32,-32,-32,121, /* 0f0-0ff */</div><div class='del'>-   0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1, /* 100-10f */</div><div class='del'>-   0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1, /* 110-11f */</div><div class='del'>-   0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1, /* 120-12f */</div><div class='del'>-   0,  0,  0, -1,  0, -1,  0, -1,  0,  0, -1,  0, -1,  0, -1,  0, /* 130-13f */</div><div class='del'>-  -1,  0, -1,  0, -1,  0, -1,  0, -1,  0,  0, -1,  0, -1,  0, -1, /* 140-14f */</div><div class='del'>-   0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1, /* 150-15f */</div><div class='del'>-   0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1, /* 160-16f */</div><div class='del'>-   0, -1,  0, -1,  0, -1,  0, -1,  0,  0, -1,  0, -1,  0, -1,  0, /* 170-17f */</div><div class='del'>-   0,  0,  0, -1,  0, -1,  0,  0, -1,  0,  0,  0, -1,  0,  0,  0, /* 180-18f */</div><div class='del'>-   0,  0, -1,  0,  0,  0,  0,  0,  0, -1,  0,  0,  0,  0,  0,  0, /* 190-19f */</div><div class='del'>-   0, -1,  0, -1,  0, -1,  0,  0, -1,  0,  0,  0,  0, -1,  0,  0, /* 1a0-1af */</div><div class='del'>-  -1,  0,  0,  0, -1,  0, -1,  0,  0, -1,  0,  0,  0, -1,  0,  0, /* 1b0-1bf */</div><div class='del'>-   0,  0,  0,  0,  0, -1, -2,  0, -1, -2,  0, -1, -2,  0, -1,  0, /* 1c0-1cf */</div><div class='del'>-  -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,-79,  0, -1, /* 1d0-1df */</div><div class='del'>-   0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1, /* 1e0-1ef */</div><div class='del'>-   0,  0, -1, -2,  0, -1,  0,  0,  0, -1,  0, -1,  0, -1,  0, -1, /* 1f0-1ff */</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/* Upper case range - Greek */</div><div class='del'>-static signed char UniCaseRangeU03a0[47] = {</div><div class='del'>-   0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,-38,-37,-37,-37, /* 3a0-3af */</div><div class='del'>-   0,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32, /* 3b0-3bf */</div><div class='del'>- -32,-32,-31,-32,-32,-32,-32,-32,-32,-32,-32,-32,-64,-63,-63,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/* Upper case range - Cyrillic */</div><div class='del'>-static signed char UniCaseRangeU0430[48] = {</div><div class='del'>- -32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32, /* 430-43f */</div><div class='del'>- -32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32, /* 440-44f */</div><div class='del'>-   0,-80,-80,-80,-80,-80,-80,-80,-80,-80,-80,-80,-80,  0,-80,-80, /* 450-45f */</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/* Upper case range - Extended cyrillic */</div><div class='del'>-static signed char UniCaseRangeU0490[61] = {</div><div class='del'>-   0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1, /* 490-49f */</div><div class='del'>-   0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1, /* 4a0-4af */</div><div class='del'>-   0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1, /* 4b0-4bf */</div><div class='del'>-   0,  0, -1,  0, -1,  0,  0,  0, -1,  0,  0,  0, -1,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/* Upper case range - Extended latin and greek */</div><div class='del'>-static signed char UniCaseRangeU1e00[509] = {</div><div class='del'>-   0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1, /* 1e00-1e0f */</div><div class='del'>-   0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1, /* 1e10-1e1f */</div><div class='del'>-   0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1, /* 1e20-1e2f */</div><div class='del'>-   0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1, /* 1e30-1e3f */</div><div class='del'>-   0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1, /* 1e40-1e4f */</div><div class='del'>-   0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1, /* 1e50-1e5f */</div><div class='del'>-   0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1, /* 1e60-1e6f */</div><div class='del'>-   0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1, /* 1e70-1e7f */</div><div class='del'>-   0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1, /* 1e80-1e8f */</div><div class='del'>-   0, -1,  0, -1,  0, -1,  0,  0,  0,  0,  0,-59,  0, -1,  0, -1, /* 1e90-1e9f */</div><div class='del'>-   0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1, /* 1ea0-1eaf */</div><div class='del'>-   0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1, /* 1eb0-1ebf */</div><div class='del'>-   0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1, /* 1ec0-1ecf */</div><div class='del'>-   0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1, /* 1ed0-1edf */</div><div class='del'>-   0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0, -1, /* 1ee0-1eef */</div><div class='del'>-   0, -1,  0, -1,  0, -1,  0, -1,  0, -1,  0,  0,  0,  0,  0,  0, /* 1ef0-1eff */</div><div class='del'>-   8,  8,  8,  8,  8,  8,  8,  8,  0,  0,  0,  0,  0,  0,  0,  0, /* 1f00-1f0f */</div><div class='del'>-   8,  8,  8,  8,  8,  8,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0, /* 1f10-1f1f */</div><div class='del'>-   8,  8,  8,  8,  8,  8,  8,  8,  0,  0,  0,  0,  0,  0,  0,  0, /* 1f20-1f2f */</div><div class='del'>-   8,  8,  8,  8,  8,  8,  8,  8,  0,  0,  0,  0,  0,  0,  0,  0, /* 1f30-1f3f */</div><div class='del'>-   8,  8,  8,  8,  8,  8,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0, /* 1f40-1f4f */</div><div class='del'>-   0,  8,  0,  8,  0,  8,  0,  8,  0,  0,  0,  0,  0,  0,  0,  0, /* 1f50-1f5f */</div><div class='del'>-   8,  8,  8,  8,  8,  8,  8,  8,  0,  0,  0,  0,  0,  0,  0,  0, /* 1f60-1f6f */</div><div class='del'>-  74, 74, 86, 86, 86, 86,100,100,  0,  0,112,112,126,126,  0,  0, /* 1f70-1f7f */</div><div class='del'>-   8,  8,  8,  8,  8,  8,  8,  8,  0,  0,  0,  0,  0,  0,  0,  0, /* 1f80-1f8f */</div><div class='del'>-   8,  8,  8,  8,  8,  8,  8,  8,  0,  0,  0,  0,  0,  0,  0,  0, /* 1f90-1f9f */</div><div class='del'>-   8,  8,  8,  8,  8,  8,  8,  8,  0,  0,  0,  0,  0,  0,  0,  0, /* 1fa0-1faf */</div><div class='del'>-   8,  8,  0,  9,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0, /* 1fb0-1fbf */</div><div class='del'>-   0,  0,  0,  9,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0, /* 1fc0-1fcf */</div><div class='del'>-   8,  8,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0, /* 1fd0-1fdf */</div><div class='del'>-   8,  8,  0,  0,  0,  7,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0, /* 1fe0-1fef */</div><div class='del'>-   0,  0,  0,  9,  0,  0,  0,  0,  0,  0,  0,  0,  0,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/* Upper case range - Wide latin */</div><div class='del'>-static signed char UniCaseRangeUff40[27] = {</div><div class='del'>-   0,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32, /* ff40-ff4f */</div><div class='del'>- -32,-32,-32,-32,-32,-32,-32,-32,-32,-32,-32,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Upper Case Range</div><div class='del'>- */</div><div class='del'>-UNICASERANGE UniUpperRange[] = {</div><div class='del'>-    { 0x03a0,  0x03ce,  UniCaseRangeU03a0 },</div><div class='del'>-    { 0x0430,  0x045f,  UniCaseRangeU0430 },</div><div class='del'>-    { 0x0490,  0x04cc,  UniCaseRangeU0490 },</div><div class='del'>-    { 0x1e00,  0x1ffc,  UniCaseRangeU1e00 },</div><div class='del'>-    { 0xff40,  0xff5a,  UniCaseRangeUff40 },</div><div class='del'>-    { 0 }</div><div class='del'>-};</div><div class='head'>diff --git a/fs/jfs/jfs_xattr.h b/fs/jfs/jfs_xattr.h<br/>index c50167a7bc50..ec67d8554d2c 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_xattr.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_xattr.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_xattr.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/jfs_xattr.h</a></div><div class='hunk'>@@ -25,7 +25,7 @@ struct jfs_ea_list {</div><div class='ctx'> 	struct jfs_ea ea[];	/* Variable length list */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/* Macros for defining maxiumum number of bytes supported for EAs */</div><div class='add'>+/* Macros for defining maximum number of bytes supported for EAs */</div><div class='ctx'> #define MAXEASIZE	65535</div><div class='ctx'> #define MAXEALISTSIZE	MAXEASIZE</div><div class='ctx'> </div><div class='hunk'>@@ -46,7 +46,7 @@ extern int __jfs_setxattr(tid_t, struct inode *, const char *, const void *,</div><div class='ctx'> extern ssize_t __jfs_getxattr(struct inode *, const char *, void *, size_t);</div><div class='ctx'> extern ssize_t jfs_listxattr(struct dentry *, char *, size_t);</div><div class='ctx'> </div><div class='del'>-extern const struct xattr_handler *jfs_xattr_handlers[];</div><div class='add'>+extern const struct xattr_handler * const jfs_xattr_handlers[];</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_JFS_SECURITY</div><div class='ctx'> extern int jfs_init_security(tid_t, struct inode *, struct inode *,</div><div class='head'>diff --git a/fs/jfs/jfs_xtree.c b/fs/jfs/jfs_xtree.c<br/>index 3148e9b35f3b..28c3cf960c6f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_xtree.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_xtree.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_xtree.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/jfs_xtree.c</a></div><div class='hunk'>@@ -49,26 +49,6 @@</div><div class='ctx'> </div><div class='ctx'> #define XT_PAGE(IP, MP) BT_PAGE(IP, MP, xtpage_t, i_xtroot)</div><div class='ctx'> </div><div class='del'>-/* get page buffer for specified block address */</div><div class='del'>-/* ToDo: Replace this ugly macro with a function */</div><div class='del'>-#define XT_GETPAGE(IP, BN, MP, SIZE, P, RC)				\</div><div class='del'>-do {									\</div><div class='del'>-	BT_GETPAGE(IP, BN, MP, xtpage_t, SIZE, P, RC, i_xtroot);	\</div><div class='del'>-	if (!(RC)) {							\</div><div class='del'>-		if ((le16_to_cpu((P)-&gt;header.nextindex) &lt; XTENTRYSTART) || \</div><div class='del'>-		    (le16_to_cpu((P)-&gt;header.nextindex) &gt;		\</div><div class='del'>-		     le16_to_cpu((P)-&gt;header.maxentry)) ||		\</div><div class='del'>-		    (le16_to_cpu((P)-&gt;header.maxentry) &gt;		\</div><div class='del'>-		     (((BN) == 0) ? XTROOTMAXSLOT : PSIZE &gt;&gt; L2XTSLOTSIZE))) { \</div><div class='del'>-			jfs_error((IP)-&gt;i_sb,				\</div><div class='del'>-				  "XT_GETPAGE: xtree page corrupt\n");	\</div><div class='del'>-			BT_PUTPAGE(MP);					\</div><div class='del'>-			MP = NULL;					\</div><div class='del'>-			RC = -EIO;					\</div><div class='del'>-		}							\</div><div class='del'>-	}								\</div><div class='del'>-} while (0)</div><div class='del'>-</div><div class='ctx'> /* for consistency */</div><div class='ctx'> #define XT_PUTPAGE(MP) BT_PUTPAGE(MP)</div><div class='ctx'> </div><div class='hunk'>@@ -114,16 +94,41 @@ static int xtSplitPage(tid_t tid, struct inode *ip, struct xtsplit * split,</div><div class='ctx'> static int xtSplitRoot(tid_t tid, struct inode *ip,</div><div class='ctx'> 		       struct xtsplit * split, struct metapage ** rmpp);</div><div class='ctx'> </div><div class='del'>-#ifdef _STILL_TO_PORT</div><div class='del'>-static int xtDeleteUp(tid_t tid, struct inode *ip, struct metapage * fmp,</div><div class='del'>-		      xtpage_t * fp, struct btstack * btstack);</div><div class='add'>+/*</div><div class='add'>+ *	xt_getpage()</div><div class='add'>+ *</div><div class='add'>+ * function:	get the page buffer for a specified block address.</div><div class='add'>+ *</div><div class='add'>+ * parameters:</div><div class='add'>+ *	ip      - pointer to the inode</div><div class='add'>+ *	bn      - block number (s64) of the xtree page to be retrieved;</div><div class='add'>+ *	mp      - pointer to a metapage pointer where the page buffer is returned;</div><div class='add'>+ *</div><div class='add'>+ * returns:</div><div class='add'>+ *      A pointer to the xtree page (xtpage_t) on success, -EIO on error.</div><div class='add'>+ */</div><div class='ctx'> </div><div class='del'>-static int xtSearchNode(struct inode *ip,</div><div class='del'>-			xad_t * xad,</div><div class='del'>-			int *cmpp, struct btstack * btstack, int flag);</div><div class='add'>+static inline xtpage_t *xt_getpage(struct inode *ip, s64 bn, struct metapage **mp)</div><div class='add'>+{</div><div class='add'>+	xtpage_t *p;</div><div class='add'>+	int rc;</div><div class='ctx'> </div><div class='del'>-static int xtRelink(tid_t tid, struct inode *ip, xtpage_t * fp);</div><div class='del'>-#endif				/*  _STILL_TO_PORT */</div><div class='add'>+	BT_GETPAGE(ip, bn, *mp, xtpage_t, PSIZE, p, rc, i_xtroot);</div><div class='add'>+</div><div class='add'>+	if (rc)</div><div class='add'>+		return ERR_PTR(rc);</div><div class='add'>+	if ((le16_to_cpu(p-&gt;header.nextindex) &lt; XTENTRYSTART) ||</div><div class='add'>+		(le16_to_cpu(p-&gt;header.nextindex) &gt;</div><div class='add'>+			le16_to_cpu(p-&gt;header.maxentry)) ||</div><div class='add'>+		(le16_to_cpu(p-&gt;header.maxentry) &gt;</div><div class='add'>+			((bn == 0) ? XTROOTMAXSLOT : PSIZE &gt;&gt; L2XTSLOTSIZE))) {</div><div class='add'>+		jfs_error(ip-&gt;i_sb, "xt_getpage: xtree page corrupt\n");</div><div class='add'>+		BT_PUTPAGE(*mp);</div><div class='add'>+		*mp = NULL;</div><div class='add'>+		return ERR_PTR(-EIO);</div><div class='add'>+	}</div><div class='add'>+	return p;</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  *	xtLookup()</div><div class='hunk'>@@ -227,7 +232,6 @@ static int xtSearch(struct inode *ip, s64 xoff,	s64 *nextp,</div><div class='ctx'> 		    int *cmpp, struct btstack * btstack, int flag)</div><div class='ctx'> {</div><div class='ctx'> 	struct jfs_inode_info *jfs_ip = JFS_IP(ip);</div><div class='del'>-	int rc = 0;</div><div class='ctx'> 	int cmp = 1;		/* init for empty page */</div><div class='ctx'> 	s64 bn;			/* block number */</div><div class='ctx'> 	struct metapage *mp;	/* page buffer */</div><div class='hunk'>@@ -263,9 +267,9 @@ static int xtSearch(struct inode *ip, s64 xoff,	s64 *nextp,</div><div class='ctx'> 	 */</div><div class='ctx'> 	for (bn = 0;;) {</div><div class='ctx'> 		/* get/pin the page to search */</div><div class='del'>-		XT_GETPAGE(ip, bn, mp, PSIZE, p, rc);</div><div class='del'>-		if (rc)</div><div class='del'>-			return rc;</div><div class='add'>+		p = xt_getpage(ip, bn, &amp;mp);</div><div class='add'>+		if (IS_ERR(p))</div><div class='add'>+			return PTR_ERR(p);</div><div class='ctx'> </div><div class='ctx'> 		/* try sequential access heuristics with the previous</div><div class='ctx'> 		 * access entry in target leaf page:</div><div class='hunk'>@@ -818,10 +822,10 @@ xtSplitUp(tid_t tid,</div><div class='ctx'> 		 * insert router entry in parent for new right child page &lt;rp&gt;</div><div class='ctx'> 		 */</div><div class='ctx'> 		/* get/pin the parent page &lt;sp&gt; */</div><div class='del'>-		XT_GETPAGE(ip, parent-&gt;bn, smp, PSIZE, sp, rc);</div><div class='del'>-		if (rc) {</div><div class='add'>+		sp = xt_getpage(ip, parent-&gt;bn, &amp;smp);</div><div class='add'>+		if (IS_ERR(sp)) {</div><div class='ctx'> 			XT_PUTPAGE(rcmp);</div><div class='del'>-			return rc;</div><div class='add'>+			return PTR_ERR(sp);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='hunk'>@@ -1073,10 +1077,10 @@ xtSplitPage(tid_t tid, struct inode *ip,</div><div class='ctx'> 	 * update previous pointer of old next/right page of &lt;sp&gt;</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (nextbn != 0) {</div><div class='del'>-		XT_GETPAGE(ip, nextbn, mp, PSIZE, p, rc);</div><div class='del'>-		if (rc) {</div><div class='add'>+		p = xt_getpage(ip, nextbn, &amp;mp);</div><div class='add'>+		if (IS_ERR(p)) {</div><div class='ctx'> 			XT_PUTPAGE(rmp);</div><div class='del'>-			goto clean_up;</div><div class='add'>+			return PTR_ERR(p);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		BT_MARK_DIRTY(mp, ip);</div><div class='hunk'>@@ -1224,7 +1228,7 @@ xtSplitRoot(tid_t tid,</div><div class='ctx'> 	struct xtlock *xtlck;</div><div class='ctx'> 	int rc;</div><div class='ctx'> </div><div class='del'>-	sp = &amp;JFS_IP(ip)-&gt;i_xtroot;</div><div class='add'>+	sp = (xtpage_t *) &amp;JFS_IP(ip)-&gt;i_xtroot;</div><div class='ctx'> </div><div class='ctx'> 	INCREMENT(xtStat.split);</div><div class='ctx'> </div><div class='hunk'>@@ -1428,9 +1432,9 @@ int xtExtend(tid_t tid,		/* transaction id */</div><div class='ctx'> 			return rc;</div><div class='ctx'> </div><div class='ctx'> 		/* get back old page */</div><div class='del'>-		XT_GETPAGE(ip, bn, mp, PSIZE, p, rc);</div><div class='del'>-		if (rc)</div><div class='del'>-			return rc;</div><div class='add'>+		p = xt_getpage(ip, bn, &amp;mp);</div><div class='add'>+		if (IS_ERR(p))</div><div class='add'>+			return PTR_ERR(p);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * if leaf root has been split, original root has been</div><div class='ctx'> 		 * copied to new child page, i.e., original entry now</div><div class='hunk'>@@ -1444,9 +1448,9 @@ int xtExtend(tid_t tid,		/* transaction id */</div><div class='ctx'> 			XT_PUTPAGE(mp);</div><div class='ctx'> </div><div class='ctx'> 			/* get new child page */</div><div class='del'>-			XT_GETPAGE(ip, bn, mp, PSIZE, p, rc);</div><div class='del'>-			if (rc)</div><div class='del'>-				return rc;</div><div class='add'>+			p = xt_getpage(ip, bn, &amp;mp);</div><div class='add'>+			if (IS_ERR(p))</div><div class='add'>+				return PTR_ERR(p);</div><div class='ctx'> </div><div class='ctx'> 			BT_MARK_DIRTY(mp, ip);</div><div class='ctx'> 			if (!test_cflag(COMMIT_Nolink, ip)) {</div><div class='hunk'>@@ -1493,189 +1497,6 @@ int xtExtend(tid_t tid,		/* transaction id */</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#ifdef _NOTYET</div><div class='del'>-/*</div><div class='del'>- *	xtTailgate()</div><div class='del'>- *</div><div class='del'>- * function: split existing 'tail' extent</div><div class='del'>- *	(split offset &gt;= start offset of tail extent), and</div><div class='del'>- *	relocate and extend the split tail half;</div><div class='del'>- *</div><div class='del'>- * note: existing extent may or may not have been committed.</div><div class='del'>- * caller is responsible for pager buffer cache update, and</div><div class='del'>- * working block allocation map update;</div><div class='del'>- * update pmap: free old split tail extent, alloc new extent;</div><div class='del'>- */</div><div class='del'>-int xtTailgate(tid_t tid,		/* transaction id */</div><div class='del'>-	       struct inode *ip, s64 xoff,	/* split/new extent offset */</div><div class='del'>-	       s32 xlen,	/* new extent length */</div><div class='del'>-	       s64 xaddr,	/* new extent address */</div><div class='del'>-	       int flag)</div><div class='del'>-{</div><div class='del'>-	int rc = 0;</div><div class='del'>-	int cmp;</div><div class='del'>-	struct metapage *mp;	/* meta-page buffer */</div><div class='del'>-	xtpage_t *p;		/* base B+-tree index page */</div><div class='del'>-	s64 bn;</div><div class='del'>-	int index, nextindex, llen, rlen;</div><div class='del'>-	struct btstack btstack;	/* traverse stack */</div><div class='del'>-	struct xtsplit split;	/* split information */</div><div class='del'>-	xad_t *xad;</div><div class='del'>-	struct tlock *tlck;</div><div class='del'>-	struct xtlock *xtlck = 0;</div><div class='del'>-	struct tlock *mtlck;</div><div class='del'>-	struct maplock *pxdlock;</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>-printf("xtTailgate: nxoff:0x%lx nxlen:0x%x nxaddr:0x%lx\n",</div><div class='del'>-	(ulong)xoff, xlen, (ulong)xaddr);</div><div class='del'>-*/</div><div class='del'>-</div><div class='del'>-	/* there must exist extent to be tailgated */</div><div class='del'>-	if ((rc = xtSearch(ip, xoff, NULL, &amp;cmp, &amp;btstack, XT_INSERT)))</div><div class='del'>-		return rc;</div><div class='del'>-</div><div class='del'>-	/* retrieve search result */</div><div class='del'>-	XT_GETSEARCH(ip, btstack.top, bn, mp, p, index);</div><div class='del'>-</div><div class='del'>-	if (cmp != 0) {</div><div class='del'>-		XT_PUTPAGE(mp);</div><div class='del'>-		jfs_error(ip-&gt;i_sb, "couldn't find extent\n");</div><div class='del'>-		return -EIO;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* entry found must be last entry */</div><div class='del'>-	nextindex = le16_to_cpu(p-&gt;header.nextindex);</div><div class='del'>-	if (index != nextindex - 1) {</div><div class='del'>-		XT_PUTPAGE(mp);</div><div class='del'>-		jfs_error(ip-&gt;i_sb, "the entry found is not the last entry\n");</div><div class='del'>-		return -EIO;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	BT_MARK_DIRTY(mp, ip);</div><div class='del'>-	/*</div><div class='del'>-	 * acquire tlock of the leaf page containing original entry</div><div class='del'>-	 */</div><div class='del'>-	if (!test_cflag(COMMIT_Nolink, ip)) {</div><div class='del'>-		tlck = txLock(tid, ip, mp, tlckXTREE | tlckGROW);</div><div class='del'>-		xtlck = (struct xtlock *) &amp; tlck-&gt;lock;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* completely replace extent ? */</div><div class='del'>-	xad = &amp;p-&gt;xad[index];</div><div class='del'>-/*</div><div class='del'>-printf("xtTailgate: xoff:0x%lx xlen:0x%x xaddr:0x%lx\n",</div><div class='del'>-	(ulong)offsetXAD(xad), lengthXAD(xad), (ulong)addressXAD(xad));</div><div class='del'>-*/</div><div class='del'>-	if ((llen = xoff - offsetXAD(xad)) == 0)</div><div class='del'>-		goto updateOld;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 *	partially replace extent: insert entry for new extent</div><div class='del'>-	 */</div><div class='del'>-//insertNew:</div><div class='del'>-	/*</div><div class='del'>-	 *	if the leaf page is full, insert the new entry and</div><div class='del'>-	 *	propagate up the router entry for the new page from split</div><div class='del'>-	 *</div><div class='del'>-	 * The xtSplitUp() will insert the entry and unpin the leaf page.</div><div class='del'>-	 */</div><div class='del'>-	if (nextindex == le16_to_cpu(p-&gt;header.maxentry)) {</div><div class='del'>-		/* xtSpliUp() unpins leaf pages */</div><div class='del'>-		split.mp = mp;</div><div class='del'>-		split.index = index + 1;</div><div class='del'>-		split.flag = XAD_NEW;</div><div class='del'>-		split.off = xoff;	/* split offset */</div><div class='del'>-		split.len = xlen;</div><div class='del'>-		split.addr = xaddr;</div><div class='del'>-		split.pxdlist = NULL;</div><div class='del'>-		if ((rc = xtSplitUp(tid, ip, &amp;split, &amp;btstack)))</div><div class='del'>-			return rc;</div><div class='del'>-</div><div class='del'>-		/* get back old page */</div><div class='del'>-		XT_GETPAGE(ip, bn, mp, PSIZE, p, rc);</div><div class='del'>-		if (rc)</div><div class='del'>-			return rc;</div><div class='del'>-		/*</div><div class='del'>-		 * if leaf root has been split, original root has been</div><div class='del'>-		 * copied to new child page, i.e., original entry now</div><div class='del'>-		 * resides on the new child page;</div><div class='del'>-		 */</div><div class='del'>-		if (p-&gt;header.flag &amp; BT_INTERNAL) {</div><div class='del'>-			ASSERT(p-&gt;header.nextindex ==</div><div class='del'>-			       cpu_to_le16(XTENTRYSTART + 1));</div><div class='del'>-			xad = &amp;p-&gt;xad[XTENTRYSTART];</div><div class='del'>-			bn = addressXAD(xad);</div><div class='del'>-			XT_PUTPAGE(mp);</div><div class='del'>-</div><div class='del'>-			/* get new child page */</div><div class='del'>-			XT_GETPAGE(ip, bn, mp, PSIZE, p, rc);</div><div class='del'>-			if (rc)</div><div class='del'>-				return rc;</div><div class='del'>-</div><div class='del'>-			BT_MARK_DIRTY(mp, ip);</div><div class='del'>-			if (!test_cflag(COMMIT_Nolink, ip)) {</div><div class='del'>-				tlck = txLock(tid, ip, mp, tlckXTREE|tlckGROW);</div><div class='del'>-				xtlck = (struct xtlock *) &amp; tlck-&gt;lock;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	/*</div><div class='del'>-	 *	insert the new entry into the leaf page</div><div class='del'>-	 */</div><div class='del'>-	else {</div><div class='del'>-		/* insert the new entry: mark the entry NEW */</div><div class='del'>-		xad = &amp;p-&gt;xad[index + 1];</div><div class='del'>-		XT_PUTENTRY(xad, XAD_NEW, xoff, xlen, xaddr);</div><div class='del'>-</div><div class='del'>-		/* advance next available entry index */</div><div class='del'>-		le16_add_cpu(&amp;p-&gt;header.nextindex, 1);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* get back old XAD */</div><div class='del'>-	xad = &amp;p-&gt;xad[index];</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * truncate/relocate old extent at split offset</div><div class='del'>-	 */</div><div class='del'>-      updateOld:</div><div class='del'>-	/* update dmap for old/committed/truncated extent */</div><div class='del'>-	rlen = lengthXAD(xad) - llen;</div><div class='del'>-	if (!(xad-&gt;flag &amp; XAD_NEW)) {</div><div class='del'>-		/* free from PWMAP at commit */</div><div class='del'>-		if (!test_cflag(COMMIT_Nolink, ip)) {</div><div class='del'>-			mtlck = txMaplock(tid, ip, tlckMAP);</div><div class='del'>-			pxdlock = (struct maplock *) &amp; mtlck-&gt;lock;</div><div class='del'>-			pxdlock-&gt;flag = mlckFREEPXD;</div><div class='del'>-			PXDaddress(&amp;pxdlock-&gt;pxd, addressXAD(xad) + llen);</div><div class='del'>-			PXDlength(&amp;pxdlock-&gt;pxd, rlen);</div><div class='del'>-			pxdlock-&gt;index = 1;</div><div class='del'>-		}</div><div class='del'>-	} else</div><div class='del'>-		/* free from WMAP */</div><div class='del'>-		dbFree(ip, addressXAD(xad) + llen, (s64) rlen);</div><div class='del'>-</div><div class='del'>-	if (llen)</div><div class='del'>-		/* truncate */</div><div class='del'>-		XADlength(xad, llen);</div><div class='del'>-	else</div><div class='del'>-		/* replace */</div><div class='del'>-		XT_PUTENTRY(xad, XAD_NEW, xoff, xlen, xaddr);</div><div class='del'>-</div><div class='del'>-	if (!test_cflag(COMMIT_Nolink, ip)) {</div><div class='del'>-		xtlck-&gt;lwm.offset = (xtlck-&gt;lwm.offset) ?</div><div class='del'>-		    min(index, (int)xtlck-&gt;lwm.offset) : index;</div><div class='del'>-		xtlck-&gt;lwm.length = le16_to_cpu(p-&gt;header.nextindex) -</div><div class='del'>-		    xtlck-&gt;lwm.offset;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* unpin the leaf page */</div><div class='del'>-	XT_PUTPAGE(mp);</div><div class='del'>-</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-#endif /* _NOTYET */</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  *	xtUpdate()</div><div class='ctx'>  *</div><div class='hunk'>@@ -1753,32 +1574,12 @@ int xtUpdate(tid_t tid, struct inode *ip, xad_t * nxad)</div><div class='ctx'> 	newindex = index + 1;</div><div class='ctx'> 	nextindex = le16_to_cpu(p-&gt;header.nextindex);</div><div class='ctx'> </div><div class='del'>-#ifdef  _JFS_WIP_NOCOALESCE</div><div class='del'>-	if (xoff &lt; nxoff)</div><div class='del'>-		goto updateRight;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * replace XAD with nXAD</div><div class='del'>-	 */</div><div class='del'>-      replace:			/* (nxoff == xoff) */</div><div class='del'>-	if (nxlen == xlen) {</div><div class='del'>-		/* replace XAD with nXAD:recorded */</div><div class='del'>-		*xad = *nxad;</div><div class='del'>-		xad-&gt;flag = xflag &amp; ~XAD_NOTRECORDED;</div><div class='del'>-</div><div class='del'>-		goto out;</div><div class='del'>-	} else			/* (nxlen &lt; xlen) */</div><div class='del'>-		goto updateLeft;</div><div class='del'>-#endif				/* _JFS_WIP_NOCOALESCE */</div><div class='del'>-</div><div class='del'>-/* #ifdef _JFS_WIP_COALESCE */</div><div class='ctx'> 	if (xoff &lt; nxoff)</div><div class='ctx'> 		goto coalesceRight;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * coalesce with left XAD</div><div class='ctx'> 	 */</div><div class='del'>-//coalesceLeft: /* (xoff == nxoff) */</div><div class='ctx'> 	/* is XAD first entry of page ? */</div><div class='ctx'> 	if (index == XTENTRYSTART)</div><div class='ctx'> 		goto replace;</div><div class='hunk'>@@ -1897,7 +1698,6 @@ int xtUpdate(tid_t tid, struct inode *ip, xad_t * nxad)</div><div class='ctx'> 		jfs_error(ip-&gt;i_sb, "xoff &gt;= nxoff\n");</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='del'>-/* #endif _JFS_WIP_COALESCE */</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * split XAD into (lXAD, nXAD):</div><div class='hunk'>@@ -1926,9 +1726,9 @@ int xtUpdate(tid_t tid, struct inode *ip, xad_t * nxad)</div><div class='ctx'> 			return rc;</div><div class='ctx'> </div><div class='ctx'> 		/* get back old page */</div><div class='del'>-		XT_GETPAGE(ip, bn, mp, PSIZE, p, rc);</div><div class='del'>-		if (rc)</div><div class='del'>-			return rc;</div><div class='add'>+		p = xt_getpage(ip, bn, &amp;mp);</div><div class='add'>+		if (IS_ERR(p))</div><div class='add'>+			return PTR_ERR(p);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * if leaf root has been split, original root has been</div><div class='ctx'> 		 * copied to new child page, i.e., original entry now</div><div class='hunk'>@@ -1942,9 +1742,9 @@ int xtUpdate(tid_t tid, struct inode *ip, xad_t * nxad)</div><div class='ctx'> 			XT_PUTPAGE(mp);</div><div class='ctx'> </div><div class='ctx'> 			/* get new child page */</div><div class='del'>-			XT_GETPAGE(ip, bn, mp, PSIZE, p, rc);</div><div class='del'>-			if (rc)</div><div class='del'>-				return rc;</div><div class='add'>+			p = xt_getpage(ip, bn, &amp;mp);</div><div class='add'>+			if (IS_ERR(p))</div><div class='add'>+				return PTR_ERR(p);</div><div class='ctx'> </div><div class='ctx'> 			BT_MARK_DIRTY(mp, ip);</div><div class='ctx'> 			if (!test_cflag(COMMIT_Nolink, ip)) {</div><div class='hunk'>@@ -2003,9 +1803,9 @@ int xtUpdate(tid_t tid, struct inode *ip, xad_t * nxad)</div><div class='ctx'> 		XT_PUTPAGE(mp);</div><div class='ctx'> </div><div class='ctx'> 		/* get new right page */</div><div class='del'>-		XT_GETPAGE(ip, bn, mp, PSIZE, p, rc);</div><div class='del'>-		if (rc)</div><div class='del'>-			return rc;</div><div class='add'>+		p = xt_getpage(ip, bn, &amp;mp);</div><div class='add'>+		if (IS_ERR(p))</div><div class='add'>+			return PTR_ERR(p);</div><div class='ctx'> </div><div class='ctx'> 		BT_MARK_DIRTY(mp, ip);</div><div class='ctx'> 		if (!test_cflag(COMMIT_Nolink, ip)) {</div><div class='hunk'>@@ -2079,9 +1879,9 @@ printf("xtUpdate.updateLeft.split p:0x%p\n", p);</div><div class='ctx'> 			return rc;</div><div class='ctx'> </div><div class='ctx'> 		/* get back old page */</div><div class='del'>-		XT_GETPAGE(ip, bn, mp, PSIZE, p, rc);</div><div class='del'>-		if (rc)</div><div class='del'>-			return rc;</div><div class='add'>+		p = xt_getpage(ip, bn, &amp;mp);</div><div class='add'>+		if (IS_ERR(p))</div><div class='add'>+			return PTR_ERR(p);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='ctx'> 		 * if leaf root has been split, original root has been</div><div class='hunk'>@@ -2096,9 +1896,9 @@ printf("xtUpdate.updateLeft.split p:0x%p\n", p);</div><div class='ctx'> 			XT_PUTPAGE(mp);</div><div class='ctx'> </div><div class='ctx'> 			/* get new child page */</div><div class='del'>-			XT_GETPAGE(ip, bn, mp, PSIZE, p, rc);</div><div class='del'>-			if (rc)</div><div class='del'>-				return rc;</div><div class='add'>+			p = xt_getpage(ip, bn, &amp;mp);</div><div class='add'>+			if (IS_ERR(p))</div><div class='add'>+				return PTR_ERR(p);</div><div class='ctx'> </div><div class='ctx'> 			BT_MARK_DIRTY(mp, ip);</div><div class='ctx'> 			if (!test_cflag(COMMIT_Nolink, ip)) {</div><div class='hunk'>@@ -2305,752 +2105,6 @@ int xtAppend(tid_t tid,		/* transaction id */</div><div class='ctx'> </div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='del'>-#ifdef _STILL_TO_PORT</div><div class='del'>-</div><div class='del'>-/* - TBD for defragmentaion/reorganization -</div><div class='del'>- *</div><div class='del'>- *	xtDelete()</div><div class='del'>- *</div><div class='del'>- * function:</div><div class='del'>- *	delete the entry with the specified key.</div><div class='del'>- *</div><div class='del'>- *	N.B.: whole extent of the entry is assumed to be deleted.</div><div class='del'>- *</div><div class='del'>- * parameter:</div><div class='del'>- *</div><div class='del'>- * return:</div><div class='del'>- *	ENOENT: if the entry is not found.</div><div class='del'>- *</div><div class='del'>- * exception:</div><div class='del'>- */</div><div class='del'>-int xtDelete(tid_t tid, struct inode *ip, s64 xoff, s32 xlen, int flag)</div><div class='del'>-{</div><div class='del'>-	int rc = 0;</div><div class='del'>-	struct btstack btstack;</div><div class='del'>-	int cmp;</div><div class='del'>-	s64 bn;</div><div class='del'>-	struct metapage *mp;</div><div class='del'>-	xtpage_t *p;</div><div class='del'>-	int index, nextindex;</div><div class='del'>-	struct tlock *tlck;</div><div class='del'>-	struct xtlock *xtlck;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * find the matching entry; xtSearch() pins the page</div><div class='del'>-	 */</div><div class='del'>-	if ((rc = xtSearch(ip, xoff, NULL, &amp;cmp, &amp;btstack, 0)))</div><div class='del'>-		return rc;</div><div class='del'>-</div><div class='del'>-	XT_GETSEARCH(ip, btstack.top, bn, mp, p, index);</div><div class='del'>-	if (cmp) {</div><div class='del'>-		/* unpin the leaf page */</div><div class='del'>-		XT_PUTPAGE(mp);</div><div class='del'>-		return -ENOENT;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * delete the entry from the leaf page</div><div class='del'>-	 */</div><div class='del'>-	nextindex = le16_to_cpu(p-&gt;header.nextindex);</div><div class='del'>-	le16_add_cpu(&amp;p-&gt;header.nextindex, -1);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * if the leaf page bocome empty, free the page</div><div class='del'>-	 */</div><div class='del'>-	if (p-&gt;header.nextindex == cpu_to_le16(XTENTRYSTART))</div><div class='del'>-		return (xtDeleteUp(tid, ip, mp, p, &amp;btstack));</div><div class='del'>-</div><div class='del'>-	BT_MARK_DIRTY(mp, ip);</div><div class='del'>-	/*</div><div class='del'>-	 * acquire a transaction lock on the leaf page;</div><div class='del'>-	 *</div><div class='del'>-	 * action:xad deletion;</div><div class='del'>-	 */</div><div class='del'>-	tlck = txLock(tid, ip, mp, tlckXTREE);</div><div class='del'>-	xtlck = (struct xtlock *) &amp; tlck-&gt;lock;</div><div class='del'>-	xtlck-&gt;lwm.offset =</div><div class='del'>-	    (xtlck-&gt;lwm.offset) ? min(index, xtlck-&gt;lwm.offset) : index;</div><div class='del'>-</div><div class='del'>-	/* if delete from middle, shift left/compact the remaining entries */</div><div class='del'>-	if (index &lt; nextindex - 1)</div><div class='del'>-		memmove(&amp;p-&gt;xad[index], &amp;p-&gt;xad[index + 1],</div><div class='del'>-			(nextindex - index - 1) * sizeof(xad_t));</div><div class='del'>-</div><div class='del'>-	XT_PUTPAGE(mp);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-/* - TBD for defragmentaion/reorganization -</div><div class='del'>- *</div><div class='del'>- *	xtDeleteUp()</div><div class='del'>- *</div><div class='del'>- * function:</div><div class='del'>- *	free empty pages as propagating deletion up the tree</div><div class='del'>- *</div><div class='del'>- * parameter:</div><div class='del'>- *</div><div class='del'>- * return:</div><div class='del'>- */</div><div class='del'>-static int</div><div class='del'>-xtDeleteUp(tid_t tid, struct inode *ip,</div><div class='del'>-	   struct metapage * fmp, xtpage_t * fp, struct btstack * btstack)</div><div class='del'>-{</div><div class='del'>-	int rc = 0;</div><div class='del'>-	struct metapage *mp;</div><div class='del'>-	xtpage_t *p;</div><div class='del'>-	int index, nextindex;</div><div class='del'>-	s64 xaddr;</div><div class='del'>-	int xlen;</div><div class='del'>-	struct btframe *parent;</div><div class='del'>-	struct tlock *tlck;</div><div class='del'>-	struct xtlock *xtlck;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * keep root leaf page which has become empty</div><div class='del'>-	 */</div><div class='del'>-	if (fp-&gt;header.flag &amp; BT_ROOT) {</div><div class='del'>-		/* keep the root page */</div><div class='del'>-		fp-&gt;header.flag &amp;= ~BT_INTERNAL;</div><div class='del'>-		fp-&gt;header.flag |= BT_LEAF;</div><div class='del'>-		fp-&gt;header.nextindex = cpu_to_le16(XTENTRYSTART);</div><div class='del'>-</div><div class='del'>-		/* XT_PUTPAGE(fmp); */</div><div class='del'>-</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * free non-root leaf page</div><div class='del'>-	 */</div><div class='del'>-	if ((rc = xtRelink(tid, ip, fp))) {</div><div class='del'>-		XT_PUTPAGE(fmp);</div><div class='del'>-		return rc;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	xaddr = addressPXD(&amp;fp-&gt;header.self);</div><div class='del'>-	xlen = lengthPXD(&amp;fp-&gt;header.self);</div><div class='del'>-	/* free the page extent */</div><div class='del'>-	dbFree(ip, xaddr, (s64) xlen);</div><div class='del'>-</div><div class='del'>-	/* free the buffer page */</div><div class='del'>-	discard_metapage(fmp);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * propagate page deletion up the index tree</div><div class='del'>-	 *</div><div class='del'>-	 * If the delete from the parent page makes it empty,</div><div class='del'>-	 * continue all the way up the tree.</div><div class='del'>-	 * stop if the root page is reached (which is never deleted) or</div><div class='del'>-	 * if the entry deletion does not empty the page.</div><div class='del'>-	 */</div><div class='del'>-	while ((parent = BT_POP(btstack)) != NULL) {</div><div class='del'>-		/* get/pin the parent page &lt;sp&gt; */</div><div class='del'>-		XT_GETPAGE(ip, parent-&gt;bn, mp, PSIZE, p, rc);</div><div class='del'>-		if (rc)</div><div class='del'>-			return rc;</div><div class='del'>-</div><div class='del'>-		index = parent-&gt;index;</div><div class='del'>-</div><div class='del'>-		/* delete the entry for the freed child page from parent.</div><div class='del'>-		 */</div><div class='del'>-		nextindex = le16_to_cpu(p-&gt;header.nextindex);</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * the parent has the single entry being deleted:</div><div class='del'>-		 * free the parent page which has become empty.</div><div class='del'>-		 */</div><div class='del'>-		if (nextindex == 1) {</div><div class='del'>-			if (p-&gt;header.flag &amp; BT_ROOT) {</div><div class='del'>-				/* keep the root page */</div><div class='del'>-				p-&gt;header.flag &amp;= ~BT_INTERNAL;</div><div class='del'>-				p-&gt;header.flag |= BT_LEAF;</div><div class='del'>-				p-&gt;header.nextindex =</div><div class='del'>-				    cpu_to_le16(XTENTRYSTART);</div><div class='del'>-</div><div class='del'>-				/* XT_PUTPAGE(mp); */</div><div class='del'>-</div><div class='del'>-				break;</div><div class='del'>-			} else {</div><div class='del'>-				/* free the parent page */</div><div class='del'>-				if ((rc = xtRelink(tid, ip, p)))</div><div class='del'>-					return rc;</div><div class='del'>-</div><div class='del'>-				xaddr = addressPXD(&amp;p-&gt;header.self);</div><div class='del'>-				/* free the page extent */</div><div class='del'>-				dbFree(ip, xaddr,</div><div class='del'>-				       (s64) JFS_SBI(ip-&gt;i_sb)-&gt;nbperpage);</div><div class='del'>-</div><div class='del'>-				/* unpin/free the buffer page */</div><div class='del'>-				discard_metapage(mp);</div><div class='del'>-</div><div class='del'>-				/* propagate up */</div><div class='del'>-				continue;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-		/*</div><div class='del'>-		 * the parent has other entries remaining:</div><div class='del'>-		 * delete the router entry from the parent page.</div><div class='del'>-		 */</div><div class='del'>-		else {</div><div class='del'>-			BT_MARK_DIRTY(mp, ip);</div><div class='del'>-			/*</div><div class='del'>-			 * acquire a transaction lock on the leaf page;</div><div class='del'>-			 *</div><div class='del'>-			 * action:xad deletion;</div><div class='del'>-			 */</div><div class='del'>-			tlck = txLock(tid, ip, mp, tlckXTREE);</div><div class='del'>-			xtlck = (struct xtlock *) &amp; tlck-&gt;lock;</div><div class='del'>-			xtlck-&gt;lwm.offset =</div><div class='del'>-			    (xtlck-&gt;lwm.offset) ? min(index,</div><div class='del'>-						      xtlck-&gt;lwm.</div><div class='del'>-						      offset) : index;</div><div class='del'>-</div><div class='del'>-			/* if delete from middle,</div><div class='del'>-			 * shift left/compact the remaining entries in the page</div><div class='del'>-			 */</div><div class='del'>-			if (index &lt; nextindex - 1)</div><div class='del'>-				memmove(&amp;p-&gt;xad[index], &amp;p-&gt;xad[index + 1],</div><div class='del'>-					(nextindex - index -</div><div class='del'>-					 1) &lt;&lt; L2XTSLOTSIZE);</div><div class='del'>-</div><div class='del'>-			le16_add_cpu(&amp;p-&gt;header.nextindex, -1);</div><div class='del'>-			jfs_info("xtDeleteUp(entry): 0x%lx[%d]",</div><div class='del'>-				 (ulong) parent-&gt;bn, index);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/* unpin the parent page */</div><div class='del'>-		XT_PUTPAGE(mp);</div><div class='del'>-</div><div class='del'>-		/* exit propagation up */</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * NAME:	xtRelocate()</div><div class='del'>- *</div><div class='del'>- * FUNCTION:	relocate xtpage or data extent of regular file;</div><div class='del'>- *		This function is mainly used by defragfs utility.</div><div class='del'>- *</div><div class='del'>- * NOTE:	This routine does not have the logic to handle</div><div class='del'>- *		uncommitted allocated extent. The caller should call</div><div class='del'>- *		txCommit() to commit all the allocation before call</div><div class='del'>- *		this routine.</div><div class='del'>- */</div><div class='del'>-int</div><div class='del'>-xtRelocate(tid_t tid, struct inode * ip, xad_t * oxad,	/* old XAD */</div><div class='del'>-	   s64 nxaddr,		/* new xaddr */</div><div class='del'>-	   int xtype)</div><div class='del'>-{				/* extent type: XTPAGE or DATAEXT */</div><div class='del'>-	int rc = 0;</div><div class='del'>-	struct tblock *tblk;</div><div class='del'>-	struct tlock *tlck;</div><div class='del'>-	struct xtlock *xtlck;</div><div class='del'>-	struct metapage *mp, *pmp, *lmp, *rmp;	/* meta-page buffer */</div><div class='del'>-	xtpage_t *p, *pp, *rp, *lp;	/* base B+-tree index page */</div><div class='del'>-	xad_t *xad;</div><div class='del'>-	pxd_t *pxd;</div><div class='del'>-	s64 xoff, xsize;</div><div class='del'>-	int xlen;</div><div class='del'>-	s64 oxaddr, sxaddr, dxaddr, nextbn, prevbn;</div><div class='del'>-	cbuf_t *cp;</div><div class='del'>-	s64 offset, nbytes, nbrd, pno;</div><div class='del'>-	int nb, npages, nblks;</div><div class='del'>-	s64 bn;</div><div class='del'>-	int cmp;</div><div class='del'>-	int index;</div><div class='del'>-	struct pxd_lock *pxdlock;</div><div class='del'>-	struct btstack btstack;	/* traverse stack */</div><div class='del'>-</div><div class='del'>-	xtype = xtype &amp; EXTENT_TYPE;</div><div class='del'>-</div><div class='del'>-	xoff = offsetXAD(oxad);</div><div class='del'>-	oxaddr = addressXAD(oxad);</div><div class='del'>-	xlen = lengthXAD(oxad);</div><div class='del'>-</div><div class='del'>-	/* validate extent offset */</div><div class='del'>-	offset = xoff &lt;&lt; JFS_SBI(ip-&gt;i_sb)-&gt;l2bsize;</div><div class='del'>-	if (offset &gt;= ip-&gt;i_size)</div><div class='del'>-		return -ESTALE;	/* stale extent */</div><div class='del'>-</div><div class='del'>-	jfs_info("xtRelocate: xtype:%d xoff:0x%lx xlen:0x%x xaddr:0x%lx:0x%lx",</div><div class='del'>-		 xtype, (ulong) xoff, xlen, (ulong) oxaddr, (ulong) nxaddr);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 *	1. get and validate the parent xtpage/xad entry</div><div class='del'>-	 *	covering the source extent to be relocated;</div><div class='del'>-	 */</div><div class='del'>-	if (xtype == DATAEXT) {</div><div class='del'>-		/* search in leaf entry */</div><div class='del'>-		rc = xtSearch(ip, xoff, NULL, &amp;cmp, &amp;btstack, 0);</div><div class='del'>-		if (rc)</div><div class='del'>-			return rc;</div><div class='del'>-</div><div class='del'>-		/* retrieve search result */</div><div class='del'>-		XT_GETSEARCH(ip, btstack.top, bn, pmp, pp, index);</div><div class='del'>-</div><div class='del'>-		if (cmp) {</div><div class='del'>-			XT_PUTPAGE(pmp);</div><div class='del'>-			return -ESTALE;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/* validate for exact match with a single entry */</div><div class='del'>-		xad = &amp;pp-&gt;xad[index];</div><div class='del'>-		if (addressXAD(xad) != oxaddr || lengthXAD(xad) != xlen) {</div><div class='del'>-			XT_PUTPAGE(pmp);</div><div class='del'>-			return -ESTALE;</div><div class='del'>-		}</div><div class='del'>-	} else {		/* (xtype == XTPAGE) */</div><div class='del'>-</div><div class='del'>-		/* search in internal entry */</div><div class='del'>-		rc = xtSearchNode(ip, oxad, &amp;cmp, &amp;btstack, 0);</div><div class='del'>-		if (rc)</div><div class='del'>-			return rc;</div><div class='del'>-</div><div class='del'>-		/* retrieve search result */</div><div class='del'>-		XT_GETSEARCH(ip, btstack.top, bn, pmp, pp, index);</div><div class='del'>-</div><div class='del'>-		if (cmp) {</div><div class='del'>-			XT_PUTPAGE(pmp);</div><div class='del'>-			return -ESTALE;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/* xtSearchNode() validated for exact match with a single entry</div><div class='del'>-		 */</div><div class='del'>-		xad = &amp;pp-&gt;xad[index];</div><div class='del'>-	}</div><div class='del'>-	jfs_info("xtRelocate: parent xad entry validated.");</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 *	2. relocate the extent</div><div class='del'>-	 */</div><div class='del'>-	if (xtype == DATAEXT) {</div><div class='del'>-		/* if the extent is allocated-but-not-recorded</div><div class='del'>-		 * there is no real data to be moved in this extent,</div><div class='del'>-		 */</div><div class='del'>-		if (xad-&gt;flag &amp; XAD_NOTRECORDED)</div><div class='del'>-			goto out;</div><div class='del'>-		else</div><div class='del'>-			/* release xtpage for cmRead()/xtLookup() */</div><div class='del'>-			XT_PUTPAGE(pmp);</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 *	cmRelocate()</div><div class='del'>-		 *</div><div class='del'>-		 * copy target data pages to be relocated;</div><div class='del'>-		 *</div><div class='del'>-		 * data extent must start at page boundary and</div><div class='del'>-		 * multiple of page size (except the last data extent);</div><div class='del'>-		 * read in each page of the source data extent into cbuf,</div><div class='del'>-		 * update the cbuf extent descriptor of the page to be</div><div class='del'>-		 * homeward bound to new dst data extent</div><div class='del'>-		 * copy the data from the old extent to new extent.</div><div class='del'>-		 * copy is essential for compressed files to avoid problems</div><div class='del'>-		 * that can arise if there was a change in compression</div><div class='del'>-		 * algorithms.</div><div class='del'>-		 * it is a good strategy because it may disrupt cache</div><div class='del'>-		 * policy to keep the pages in memory afterwards.</div><div class='del'>-		 */</div><div class='del'>-		offset = xoff &lt;&lt; JFS_SBI(ip-&gt;i_sb)-&gt;l2bsize;</div><div class='del'>-		assert((offset &amp; CM_OFFSET) == 0);</div><div class='del'>-		nbytes = xlen &lt;&lt; JFS_SBI(ip-&gt;i_sb)-&gt;l2bsize;</div><div class='del'>-		pno = offset &gt;&gt; CM_L2BSIZE;</div><div class='del'>-		npages = (nbytes + (CM_BSIZE - 1)) &gt;&gt; CM_L2BSIZE;</div><div class='del'>-/*</div><div class='del'>-		npages = ((offset + nbytes - 1) &gt;&gt; CM_L2BSIZE) -</div><div class='del'>-			  (offset &gt;&gt; CM_L2BSIZE) + 1;</div><div class='del'>-*/</div><div class='del'>-		sxaddr = oxaddr;</div><div class='del'>-		dxaddr = nxaddr;</div><div class='del'>-</div><div class='del'>-		/* process the request one cache buffer at a time */</div><div class='del'>-		for (nbrd = 0; nbrd &lt; nbytes; nbrd += nb,</div><div class='del'>-		     offset += nb, pno++, npages--) {</div><div class='del'>-			/* compute page size */</div><div class='del'>-			nb = min(nbytes - nbrd, CM_BSIZE);</div><div class='del'>-</div><div class='del'>-			/* get the cache buffer of the page */</div><div class='del'>-			if (rc = cmRead(ip, offset, npages, &amp;cp))</div><div class='del'>-				break;</div><div class='del'>-</div><div class='del'>-			assert(addressPXD(&amp;cp-&gt;cm_pxd) == sxaddr);</div><div class='del'>-			assert(!cp-&gt;cm_modified);</div><div class='del'>-</div><div class='del'>-			/* bind buffer with the new extent address */</div><div class='del'>-			nblks = nb &gt;&gt; JFS_IP(ip-&gt;i_sb)-&gt;l2bsize;</div><div class='del'>-			cmSetXD(ip, cp, pno, dxaddr, nblks);</div><div class='del'>-</div><div class='del'>-			/* release the cbuf, mark it as modified */</div><div class='del'>-			cmPut(cp, true);</div><div class='del'>-</div><div class='del'>-			dxaddr += nblks;</div><div class='del'>-			sxaddr += nblks;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/* get back parent page */</div><div class='del'>-		if ((rc = xtSearch(ip, xoff, NULL, &amp;cmp, &amp;btstack, 0)))</div><div class='del'>-			return rc;</div><div class='del'>-</div><div class='del'>-		XT_GETSEARCH(ip, btstack.top, bn, pmp, pp, index);</div><div class='del'>-		jfs_info("xtRelocate: target data extent relocated.");</div><div class='del'>-	} else {		/* (xtype == XTPAGE) */</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * read in the target xtpage from the source extent;</div><div class='del'>-		 */</div><div class='del'>-		XT_GETPAGE(ip, oxaddr, mp, PSIZE, p, rc);</div><div class='del'>-		if (rc) {</div><div class='del'>-			XT_PUTPAGE(pmp);</div><div class='del'>-			return rc;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * read in sibling pages if any to update sibling pointers;</div><div class='del'>-		 */</div><div class='del'>-		rmp = NULL;</div><div class='del'>-		if (p-&gt;header.next) {</div><div class='del'>-			nextbn = le64_to_cpu(p-&gt;header.next);</div><div class='del'>-			XT_GETPAGE(ip, nextbn, rmp, PSIZE, rp, rc);</div><div class='del'>-			if (rc) {</div><div class='del'>-				XT_PUTPAGE(pmp);</div><div class='del'>-				XT_PUTPAGE(mp);</div><div class='del'>-				return (rc);</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		lmp = NULL;</div><div class='del'>-		if (p-&gt;header.prev) {</div><div class='del'>-			prevbn = le64_to_cpu(p-&gt;header.prev);</div><div class='del'>-			XT_GETPAGE(ip, prevbn, lmp, PSIZE, lp, rc);</div><div class='del'>-			if (rc) {</div><div class='del'>-				XT_PUTPAGE(pmp);</div><div class='del'>-				XT_PUTPAGE(mp);</div><div class='del'>-				if (rmp)</div><div class='del'>-					XT_PUTPAGE(rmp);</div><div class='del'>-				return (rc);</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/* at this point, all xtpages to be updated are in memory */</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * update sibling pointers of sibling xtpages if any;</div><div class='del'>-		 */</div><div class='del'>-		if (lmp) {</div><div class='del'>-			BT_MARK_DIRTY(lmp, ip);</div><div class='del'>-			tlck = txLock(tid, ip, lmp, tlckXTREE | tlckRELINK);</div><div class='del'>-			lp-&gt;header.next = cpu_to_le64(nxaddr);</div><div class='del'>-			XT_PUTPAGE(lmp);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (rmp) {</div><div class='del'>-			BT_MARK_DIRTY(rmp, ip);</div><div class='del'>-			tlck = txLock(tid, ip, rmp, tlckXTREE | tlckRELINK);</div><div class='del'>-			rp-&gt;header.prev = cpu_to_le64(nxaddr);</div><div class='del'>-			XT_PUTPAGE(rmp);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * update the target xtpage to be relocated</div><div class='del'>-		 *</div><div class='del'>-		 * update the self address of the target page</div><div class='del'>-		 * and write to destination extent;</div><div class='del'>-		 * redo image covers the whole xtpage since it is new page</div><div class='del'>-		 * to the destination extent;</div><div class='del'>-		 * update of bmap for the free of source extent</div><div class='del'>-		 * of the target xtpage itself:</div><div class='del'>-		 * update of bmap for the allocation of destination extent</div><div class='del'>-		 * of the target xtpage itself:</div><div class='del'>-		 * update of bmap for the extents covered by xad entries in</div><div class='del'>-		 * the target xtpage is not necessary since they are not</div><div class='del'>-		 * updated;</div><div class='del'>-		 * if not committed before this relocation,</div><div class='del'>-		 * target page may contain XAD_NEW entries which must</div><div class='del'>-		 * be scanned for bmap update (logredo() always</div><div class='del'>-		 * scan xtpage REDOPAGE image for bmap update);</div><div class='del'>-		 * if committed before this relocation (tlckRELOCATE),</div><div class='del'>-		 * scan may be skipped by commit() and logredo();</div><div class='del'>-		 */</div><div class='del'>-		BT_MARK_DIRTY(mp, ip);</div><div class='del'>-		/* tlckNEW init xtlck-&gt;lwm.offset = XTENTRYSTART; */</div><div class='del'>-		tlck = txLock(tid, ip, mp, tlckXTREE | tlckNEW);</div><div class='del'>-		xtlck = (struct xtlock *) &amp; tlck-&gt;lock;</div><div class='del'>-</div><div class='del'>-		/* update the self address in the xtpage header */</div><div class='del'>-		pxd = &amp;p-&gt;header.self;</div><div class='del'>-		PXDaddress(pxd, nxaddr);</div><div class='del'>-</div><div class='del'>-		/* linelock for the after image of the whole page */</div><div class='del'>-		xtlck-&gt;lwm.length =</div><div class='del'>-		    le16_to_cpu(p-&gt;header.nextindex) - xtlck-&gt;lwm.offset;</div><div class='del'>-</div><div class='del'>-		/* update the buffer extent descriptor of target xtpage */</div><div class='del'>-		xsize = xlen &lt;&lt; JFS_SBI(ip-&gt;i_sb)-&gt;l2bsize;</div><div class='del'>-		bmSetXD(mp, nxaddr, xsize);</div><div class='del'>-</div><div class='del'>-		/* unpin the target page to new homeward bound */</div><div class='del'>-		XT_PUTPAGE(mp);</div><div class='del'>-		jfs_info("xtRelocate: target xtpage relocated.");</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 *	3. acquire maplock for the source extent to be freed;</div><div class='del'>-	 *</div><div class='del'>-	 * acquire a maplock saving the src relocated extent address;</div><div class='del'>-	 * to free of the extent at commit time;</div><div class='del'>-	 */</div><div class='del'>-      out:</div><div class='del'>-	/* if DATAEXT relocation, write a LOG_UPDATEMAP record for</div><div class='del'>-	 * free PXD of the source data extent (logredo() will update</div><div class='del'>-	 * bmap for free of source data extent), and update bmap for</div><div class='del'>-	 * free of the source data extent;</div><div class='del'>-	 */</div><div class='del'>-	if (xtype == DATAEXT)</div><div class='del'>-		tlck = txMaplock(tid, ip, tlckMAP);</div><div class='del'>-	/* if XTPAGE relocation, write a LOG_NOREDOPAGE record</div><div class='del'>-	 * for the source xtpage (logredo() will init NoRedoPage</div><div class='del'>-	 * filter and will also update bmap for free of the source</div><div class='del'>-	 * xtpage), and update bmap for free of the source xtpage;</div><div class='del'>-	 * N.B. We use tlckMAP instead of tlkcXTREE because there</div><div class='del'>-	 *      is no buffer associated with this lock since the buffer</div><div class='del'>-	 *      has been redirected to the target location.</div><div class='del'>-	 */</div><div class='del'>-	else			/* (xtype == XTPAGE) */</div><div class='del'>-		tlck = txMaplock(tid, ip, tlckMAP | tlckRELOCATE);</div><div class='del'>-</div><div class='del'>-	pxdlock = (struct pxd_lock *) &amp; tlck-&gt;lock;</div><div class='del'>-	pxdlock-&gt;flag = mlckFREEPXD;</div><div class='del'>-	PXDaddress(&amp;pxdlock-&gt;pxd, oxaddr);</div><div class='del'>-	PXDlength(&amp;pxdlock-&gt;pxd, xlen);</div><div class='del'>-	pxdlock-&gt;index = 1;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 *	4. update the parent xad entry for relocation;</div><div class='del'>-	 *</div><div class='del'>-	 * acquire tlck for the parent entry with XAD_NEW as entry</div><div class='del'>-	 * update which will write LOG_REDOPAGE and update bmap for</div><div class='del'>-	 * allocation of XAD_NEW destination extent;</div><div class='del'>-	 */</div><div class='del'>-	jfs_info("xtRelocate: update parent xad entry.");</div><div class='del'>-	BT_MARK_DIRTY(pmp, ip);</div><div class='del'>-	tlck = txLock(tid, ip, pmp, tlckXTREE | tlckGROW);</div><div class='del'>-	xtlck = (struct xtlock *) &amp; tlck-&gt;lock;</div><div class='del'>-</div><div class='del'>-	/* update the XAD with the new destination extent; */</div><div class='del'>-	xad = &amp;pp-&gt;xad[index];</div><div class='del'>-	xad-&gt;flag |= XAD_NEW;</div><div class='del'>-	XADaddress(xad, nxaddr);</div><div class='del'>-</div><div class='del'>-	xtlck-&gt;lwm.offset = min(index, xtlck-&gt;lwm.offset);</div><div class='del'>-	xtlck-&gt;lwm.length = le16_to_cpu(pp-&gt;header.nextindex) -</div><div class='del'>-	    xtlck-&gt;lwm.offset;</div><div class='del'>-</div><div class='del'>-	/* unpin the parent xtpage */</div><div class='del'>-	XT_PUTPAGE(pmp);</div><div class='del'>-</div><div class='del'>-	return rc;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- *	xtSearchNode()</div><div class='del'>- *</div><div class='del'>- * function:	search for the internal xad entry covering specified extent.</div><div class='del'>- *		This function is mainly used by defragfs utility.</div><div class='del'>- *</div><div class='del'>- * parameters:</div><div class='del'>- *	ip	- file object;</div><div class='del'>- *	xad	- extent to find;</div><div class='del'>- *	cmpp	- comparison result:</div><div class='del'>- *	btstack - traverse stack;</div><div class='del'>- *	flag	- search process flag;</div><div class='del'>- *</div><div class='del'>- * returns:</div><div class='del'>- *	btstack contains (bn, index) of search path traversed to the entry.</div><div class='del'>- *	*cmpp is set to result of comparison with the entry returned.</div><div class='del'>- *	the page containing the entry is pinned at exit.</div><div class='del'>- */</div><div class='del'>-static int xtSearchNode(struct inode *ip, xad_t * xad,	/* required XAD entry */</div><div class='del'>-			int *cmpp, struct btstack * btstack, int flag)</div><div class='del'>-{</div><div class='del'>-	int rc = 0;</div><div class='del'>-	s64 xoff, xaddr;</div><div class='del'>-	int xlen;</div><div class='del'>-	int cmp = 1;		/* init for empty page */</div><div class='del'>-	s64 bn;			/* block number */</div><div class='del'>-	struct metapage *mp;	/* meta-page buffer */</div><div class='del'>-	xtpage_t *p;		/* page */</div><div class='del'>-	int base, index, lim;</div><div class='del'>-	struct btframe *btsp;</div><div class='del'>-	s64 t64;</div><div class='del'>-</div><div class='del'>-	BT_CLR(btstack);</div><div class='del'>-</div><div class='del'>-	xoff = offsetXAD(xad);</div><div class='del'>-	xlen = lengthXAD(xad);</div><div class='del'>-	xaddr = addressXAD(xad);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 *	search down tree from root:</div><div class='del'>-	 *</div><div class='del'>-	 * between two consecutive entries of &lt;Ki, Pi&gt; and &lt;Kj, Pj&gt; of</div><div class='del'>-	 * internal page, child page Pi contains entry with k, Ki &lt;= K &lt; Kj.</div><div class='del'>-	 *</div><div class='del'>-	 * if entry with search key K is not found</div><div class='del'>-	 * internal page search find the entry with largest key Ki</div><div class='del'>-	 * less than K which point to the child page to search;</div><div class='del'>-	 * leaf page search find the entry with smallest key Kj</div><div class='del'>-	 * greater than K so that the returned index is the position of</div><div class='del'>-	 * the entry to be shifted right for insertion of new entry.</div><div class='del'>-	 * for empty tree, search key is greater than any key of the tree.</div><div class='del'>-	 *</div><div class='del'>-	 * by convention, root bn = 0.</div><div class='del'>-	 */</div><div class='del'>-	for (bn = 0;;) {</div><div class='del'>-		/* get/pin the page to search */</div><div class='del'>-		XT_GETPAGE(ip, bn, mp, PSIZE, p, rc);</div><div class='del'>-		if (rc)</div><div class='del'>-			return rc;</div><div class='del'>-		if (p-&gt;header.flag &amp; BT_LEAF) {</div><div class='del'>-			XT_PUTPAGE(mp);</div><div class='del'>-			return -ESTALE;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		lim = le16_to_cpu(p-&gt;header.nextindex) - XTENTRYSTART;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * binary search with search key K on the current page</div><div class='del'>-		 */</div><div class='del'>-		for (base = XTENTRYSTART; lim; lim &gt;&gt;= 1) {</div><div class='del'>-			index = base + (lim &gt;&gt; 1);</div><div class='del'>-</div><div class='del'>-			XT_CMP(cmp, xoff, &amp;p-&gt;xad[index], t64);</div><div class='del'>-			if (cmp == 0) {</div><div class='del'>-				/*</div><div class='del'>-				 *	search hit</div><div class='del'>-				 *</div><div class='del'>-				 * verify for exact match;</div><div class='del'>-				 */</div><div class='del'>-				if (xaddr == addressXAD(&amp;p-&gt;xad[index]) &amp;&amp;</div><div class='del'>-				    xoff == offsetXAD(&amp;p-&gt;xad[index])) {</div><div class='del'>-					*cmpp = cmp;</div><div class='del'>-</div><div class='del'>-					/* save search result */</div><div class='del'>-					btsp = btstack-&gt;top;</div><div class='del'>-					btsp-&gt;bn = bn;</div><div class='del'>-					btsp-&gt;index = index;</div><div class='del'>-					btsp-&gt;mp = mp;</div><div class='del'>-</div><div class='del'>-					return 0;</div><div class='del'>-				}</div><div class='del'>-</div><div class='del'>-				/* descend/search its child page */</div><div class='del'>-				goto next;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			if (cmp &gt; 0) {</div><div class='del'>-				base = index + 1;</div><div class='del'>-				--lim;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 *	search miss - non-leaf page:</div><div class='del'>-		 *</div><div class='del'>-		 * base is the smallest index with key (Kj) greater than</div><div class='del'>-		 * search key (K) and may be zero or maxentry index.</div><div class='del'>-		 * if base is non-zero, decrement base by one to get the parent</div><div class='del'>-		 * entry of the child page to search.</div><div class='del'>-		 */</div><div class='del'>-		index = base ? base - 1 : base;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * go down to child page</div><div class='del'>-		 */</div><div class='del'>-	      next:</div><div class='del'>-		/* get the child page block number */</div><div class='del'>-		bn = addressXAD(&amp;p-&gt;xad[index]);</div><div class='del'>-</div><div class='del'>-		/* unpin the parent page */</div><div class='del'>-		XT_PUTPAGE(mp);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- *	xtRelink()</div><div class='del'>- *</div><div class='del'>- * function:</div><div class='del'>- *	link around a freed page.</div><div class='del'>- *</div><div class='del'>- * Parameter:</div><div class='del'>- *	int		tid,</div><div class='del'>- *	struct inode	*ip,</div><div class='del'>- *	xtpage_t	*p)</div><div class='del'>- *</div><div class='del'>- * returns:</div><div class='del'>- */</div><div class='del'>-static int xtRelink(tid_t tid, struct inode *ip, xtpage_t * p)</div><div class='del'>-{</div><div class='del'>-	int rc = 0;</div><div class='del'>-	struct metapage *mp;</div><div class='del'>-	s64 nextbn, prevbn;</div><div class='del'>-	struct tlock *tlck;</div><div class='del'>-</div><div class='del'>-	nextbn = le64_to_cpu(p-&gt;header.next);</div><div class='del'>-	prevbn = le64_to_cpu(p-&gt;header.prev);</div><div class='del'>-</div><div class='del'>-	/* update prev pointer of the next page */</div><div class='del'>-	if (nextbn != 0) {</div><div class='del'>-		XT_GETPAGE(ip, nextbn, mp, PSIZE, p, rc);</div><div class='del'>-		if (rc)</div><div class='del'>-			return rc;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * acquire a transaction lock on the page;</div><div class='del'>-		 *</div><div class='del'>-		 * action: update prev pointer;</div><div class='del'>-		 */</div><div class='del'>-		BT_MARK_DIRTY(mp, ip);</div><div class='del'>-		tlck = txLock(tid, ip, mp, tlckXTREE | tlckRELINK);</div><div class='del'>-</div><div class='del'>-		/* the page may already have been tlock'd */</div><div class='del'>-</div><div class='del'>-		p-&gt;header.prev = cpu_to_le64(prevbn);</div><div class='del'>-</div><div class='del'>-		XT_PUTPAGE(mp);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* update next pointer of the previous page */</div><div class='del'>-	if (prevbn != 0) {</div><div class='del'>-		XT_GETPAGE(ip, prevbn, mp, PSIZE, p, rc);</div><div class='del'>-		if (rc)</div><div class='del'>-			return rc;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * acquire a transaction lock on the page;</div><div class='del'>-		 *</div><div class='del'>-		 * action: update next pointer;</div><div class='del'>-		 */</div><div class='del'>-		BT_MARK_DIRTY(mp, ip);</div><div class='del'>-		tlck = txLock(tid, ip, mp, tlckXTREE | tlckRELINK);</div><div class='del'>-</div><div class='del'>-		/* the page may already have been tlock'd */</div><div class='del'>-</div><div class='del'>-		p-&gt;header.next = le64_to_cpu(nextbn);</div><div class='del'>-</div><div class='del'>-		XT_PUTPAGE(mp);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-#endif				/*  _STILL_TO_PORT */</div><div class='del'>-</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  *	xtInitRoot()</div><div class='hunk'>@@ -3059,7 +2113,7 @@ static int xtRelink(tid_t tid, struct inode *ip, xtpage_t * p)</div><div class='ctx'>  */</div><div class='ctx'> void xtInitRoot(tid_t tid, struct inode *ip)</div><div class='ctx'> {</div><div class='del'>-	xtpage_t *p;</div><div class='add'>+	xtroot_t *p;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * acquire a transaction lock on the root</div><div class='hunk'>@@ -3148,7 +2202,6 @@ void xtInitRoot(tid_t tid, struct inode *ip)</div><div class='ctx'>  */</div><div class='ctx'> s64 xtTruncate(tid_t tid, struct inode *ip, s64 newsize, int flag)</div><div class='ctx'> {</div><div class='del'>-	int rc = 0;</div><div class='ctx'> 	s64 teof;</div><div class='ctx'> 	struct metapage *mp;</div><div class='ctx'> 	xtpage_t *p;</div><div class='hunk'>@@ -3229,9 +2282,9 @@ s64 xtTruncate(tid_t tid, struct inode *ip, s64 newsize, int flag)</div><div class='ctx'> 	 * first access of each page:</div><div class='ctx'> 	 */</div><div class='ctx'>       getPage:</div><div class='del'>-	XT_GETPAGE(ip, bn, mp, PSIZE, p, rc);</div><div class='del'>-	if (rc)</div><div class='del'>-		return rc;</div><div class='add'>+	p = xt_getpage(ip, bn, &amp;mp);</div><div class='add'>+	if (IS_ERR(p))</div><div class='add'>+		return PTR_ERR(p);</div><div class='ctx'> </div><div class='ctx'> 	/* process entries backward from last index */</div><div class='ctx'> 	index = le16_to_cpu(p-&gt;header.nextindex) - 1;</div><div class='hunk'>@@ -3467,9 +2520,9 @@ s64 xtTruncate(tid_t tid, struct inode *ip, s64 newsize, int flag)</div><div class='ctx'> </div><div class='ctx'> 	/* get back the parent page */</div><div class='ctx'> 	bn = parent-&gt;bn;</div><div class='del'>-	XT_GETPAGE(ip, bn, mp, PSIZE, p, rc);</div><div class='del'>-	if (rc)</div><div class='del'>-		return rc;</div><div class='add'>+	p = xt_getpage(ip, bn, &amp;mp);</div><div class='add'>+	if (IS_ERR(p))</div><div class='add'>+		return PTR_ERR(p);</div><div class='ctx'> </div><div class='ctx'> 	index = parent-&gt;index;</div><div class='ctx'> </div><div class='hunk'>@@ -3752,9 +2805,9 @@ s64 xtTruncate_pmap(tid_t tid, struct inode *ip, s64 committed_size)</div><div class='ctx'> 		 * first access of each page:</div><div class='ctx'> 		 */</div><div class='ctx'>       getPage:</div><div class='del'>-		XT_GETPAGE(ip, bn, mp, PSIZE, p, rc);</div><div class='del'>-		if (rc)</div><div class='del'>-			return rc;</div><div class='add'>+		p = xt_getpage(ip, bn, &amp;mp);</div><div class='add'>+		if (IS_ERR(p))</div><div class='add'>+			return PTR_ERR(p);</div><div class='ctx'> </div><div class='ctx'> 		/* process entries backward from last index */</div><div class='ctx'> 		index = le16_to_cpu(p-&gt;header.nextindex) - 1;</div><div class='hunk'>@@ -3797,9 +2850,9 @@ s64 xtTruncate_pmap(tid_t tid, struct inode *ip, s64 committed_size)</div><div class='ctx'> </div><div class='ctx'> 	/* get back the parent page */</div><div class='ctx'> 	bn = parent-&gt;bn;</div><div class='del'>-	XT_GETPAGE(ip, bn, mp, PSIZE, p, rc);</div><div class='del'>-	if (rc)</div><div class='del'>-		return rc;</div><div class='add'>+	p = xt_getpage(ip, bn, &amp;mp);</div><div class='add'>+	if (IS_ERR(p))</div><div class='add'>+		return PTR_ERR(p);</div><div class='ctx'> </div><div class='ctx'> 	index = parent-&gt;index;</div><div class='ctx'> </div><div class='head'>diff --git a/fs/jfs/jfs_xtree.h b/fs/jfs/jfs_xtree.h<br/>index 5f51be8596b3..0f6cf5a1ce75 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_xtree.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/jfs_xtree.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/jfs_xtree.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/jfs_xtree.h</a></div><div class='hunk'>@@ -65,24 +65,33 @@ struct xadlist {</div><div class='ctx'> #define XTPAGEMAXSLOT	256</div><div class='ctx'> #define XTENTRYSTART	2</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- *	xtree page:</div><div class='del'>- */</div><div class='del'>-typedef union {</div><div class='del'>-	struct xtheader {</div><div class='del'>-		__le64 next;	/* 8: */</div><div class='del'>-		__le64 prev;	/* 8: */</div><div class='add'>+struct xtheader {</div><div class='add'>+	__le64 next;	/* 8: */</div><div class='add'>+	__le64 prev;	/* 8: */</div><div class='ctx'> </div><div class='del'>-		u8 flag;	/* 1: */</div><div class='del'>-		u8 rsrvd1;	/* 1: */</div><div class='del'>-		__le16 nextindex;	/* 2: next index = number of entries */</div><div class='del'>-		__le16 maxentry;	/* 2: max number of entries */</div><div class='del'>-		__le16 rsrvd2;	/* 2: */</div><div class='add'>+	u8 flag;	/* 1: */</div><div class='add'>+	u8 rsrvd1;	/* 1: */</div><div class='add'>+	__le16 nextindex;	/* 2: next index = number of entries */</div><div class='add'>+	__le16 maxentry;	/* 2: max number of entries */</div><div class='add'>+	__le16 rsrvd2;	/* 2: */</div><div class='ctx'> </div><div class='del'>-		pxd_t self;	/* 8: self */</div><div class='del'>-	} header;		/* (32) */</div><div class='add'>+	pxd_t self;	/* 8: self */</div><div class='add'>+};</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ *	xtree root (in inode):</div><div class='add'>+ */</div><div class='add'>+typedef union {</div><div class='add'>+	struct xtheader header;</div><div class='ctx'> 	xad_t xad[XTROOTMAXSLOT];	/* 16 * maxentry: xad array */</div><div class='add'>+} xtroot_t;</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ *	xtree page:</div><div class='add'>+ */</div><div class='add'>+typedef union {</div><div class='add'>+	struct xtheader header;</div><div class='add'>+	xad_t xad[XTPAGEMAXSLOT];	/* 16 * maxentry: xad array */</div><div class='ctx'> } xtpage_t;</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -95,17 +104,9 @@ extern int xtInsert(tid_t tid, struct inode *ip,</div><div class='ctx'> 		    int xflag, s64 xoff, int xlen, s64 * xaddrp, int flag);</div><div class='ctx'> extern int xtExtend(tid_t tid, struct inode *ip, s64 xoff, int xlen,</div><div class='ctx'> 		    int flag);</div><div class='del'>-#ifdef _NOTYET</div><div class='del'>-extern int xtTailgate(tid_t tid, struct inode *ip,</div><div class='del'>-		      s64 xoff, int xlen, s64 xaddr, int flag);</div><div class='del'>-#endif</div><div class='ctx'> extern int xtUpdate(tid_t tid, struct inode *ip, struct xad *nxad);</div><div class='del'>-extern int xtDelete(tid_t tid, struct inode *ip, s64 xoff, int xlen,</div><div class='del'>-		    int flag);</div><div class='ctx'> extern s64 xtTruncate(tid_t tid, struct inode *ip, s64 newsize, int type);</div><div class='ctx'> extern s64 xtTruncate_pmap(tid_t tid, struct inode *ip, s64 committed_size);</div><div class='del'>-extern int xtRelocate(tid_t tid, struct inode *ip,</div><div class='del'>-		      xad_t * oxad, s64 nxaddr, int xtype);</div><div class='ctx'> extern int xtAppend(tid_t tid,</div><div class='ctx'> 		    struct inode *ip, int xflag, s64 xoff, int maxblocks,</div><div class='ctx'> 		    int *xlenp, s64 * xaddrp, int flag);</div><div class='head'>diff --git a/fs/jfs/namei.c b/fs/jfs/namei.c<br/>index 9db4f5789c0e..65a218eba8fa 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/namei.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/namei.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/namei.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/namei.c</a></div><div class='hunk'>@@ -59,7 +59,7 @@ static inline void free_ea_wmap(struct inode *inode)</div><div class='ctx'>  * RETURN:	Errors from subroutines</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='del'>-static int jfs_create(struct user_namespace *mnt_userns, struct inode *dip,</div><div class='add'>+static int jfs_create(struct mnt_idmap *idmap, struct inode *dip,</div><div class='ctx'> 		      struct dentry *dentry, umode_t mode, bool excl)</div><div class='ctx'> {</div><div class='ctx'> 	int rc = 0;</div><div class='hunk'>@@ -149,7 +149,7 @@ static int jfs_create(struct user_namespace *mnt_userns, struct inode *dip,</div><div class='ctx'> </div><div class='ctx'> 	mark_inode_dirty(ip);</div><div class='ctx'> </div><div class='del'>-	dip-&gt;i_ctime = dip-&gt;i_mtime = current_time(dip);</div><div class='add'>+	inode_set_mtime_to_ts(dip, inode_set_ctime_current(dip));</div><div class='ctx'> </div><div class='ctx'> 	mark_inode_dirty(dip);</div><div class='ctx'> </div><div class='hunk'>@@ -187,13 +187,13 @@ static int jfs_create(struct user_namespace *mnt_userns, struct inode *dip,</div><div class='ctx'>  *		dentry	- dentry of child directory</div><div class='ctx'>  *		mode	- create mode (rwxrwxrwx).</div><div class='ctx'>  *</div><div class='del'>- * RETURN:	Errors from subroutines</div><div class='add'>+ * RETURN:	ERR_PTR() of errors from subroutines.</div><div class='ctx'>  *</div><div class='ctx'>  * note:</div><div class='ctx'>  * EACCES: user needs search+write permission on the parent directory</div><div class='ctx'>  */</div><div class='del'>-static int jfs_mkdir(struct user_namespace *mnt_userns, struct inode *dip,</div><div class='del'>-		     struct dentry *dentry, umode_t mode)</div><div class='add'>+static struct dentry *jfs_mkdir(struct mnt_idmap *idmap, struct inode *dip,</div><div class='add'>+				struct dentry *dentry, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	int rc = 0;</div><div class='ctx'> 	tid_t tid;		/* transaction id */</div><div class='hunk'>@@ -284,7 +284,7 @@ static int jfs_mkdir(struct user_namespace *mnt_userns, struct inode *dip,</div><div class='ctx'> </div><div class='ctx'> 	/* update parent directory inode */</div><div class='ctx'> 	inc_nlink(dip);		/* for '..' from child directory */</div><div class='del'>-	dip-&gt;i_ctime = dip-&gt;i_mtime = current_time(dip);</div><div class='add'>+	inode_set_mtime_to_ts(dip, inode_set_ctime_current(dip));</div><div class='ctx'> 	mark_inode_dirty(dip);</div><div class='ctx'> </div><div class='ctx'> 	rc = txCommit(tid, 2, &amp;iplist[0], 0);</div><div class='hunk'>@@ -308,7 +308,7 @@ static int jfs_mkdir(struct user_namespace *mnt_userns, struct inode *dip,</div><div class='ctx'>       out1:</div><div class='ctx'> </div><div class='ctx'> 	jfs_info("jfs_mkdir: rc:%d", rc);</div><div class='del'>-	return rc;</div><div class='add'>+	return ERR_PTR(rc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -390,7 +390,7 @@ static int jfs_rmdir(struct inode *dip, struct dentry *dentry)</div><div class='ctx'> 	/* update parent directory's link count corresponding</div><div class='ctx'> 	 * to ".." entry of the target directory deleted</div><div class='ctx'> 	 */</div><div class='del'>-	dip-&gt;i_ctime = dip-&gt;i_mtime = current_time(dip);</div><div class='add'>+	inode_set_mtime_to_ts(dip, inode_set_ctime_current(dip));</div><div class='ctx'> 	inode_dec_link_count(dip);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -512,7 +512,8 @@ static int jfs_unlink(struct inode *dip, struct dentry *dentry)</div><div class='ctx'> </div><div class='ctx'> 	ASSERT(ip-&gt;i_nlink);</div><div class='ctx'> </div><div class='del'>-	ip-&gt;i_ctime = dip-&gt;i_ctime = dip-&gt;i_mtime = current_time(ip);</div><div class='add'>+	inode_set_mtime_to_ts(dip,</div><div class='add'>+			      inode_set_ctime_to_ts(dip, inode_set_ctime_current(ip)));</div><div class='ctx'> 	mark_inode_dirty(dip);</div><div class='ctx'> </div><div class='ctx'> 	/* update target's inode */</div><div class='hunk'>@@ -799,6 +800,11 @@ static int jfs_link(struct dentry *old_dentry,</div><div class='ctx'> 	if (rc)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='add'>+	if (isReadOnly(ip)) {</div><div class='add'>+		jfs_error(ip-&gt;i_sb, "read-only filesystem\n");</div><div class='add'>+		return -EROFS;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	tid = txBegin(ip-&gt;i_sb, 0);</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock_nested(&amp;JFS_IP(dir)-&gt;commit_mutex, COMMIT_MUTEX_PARENT);</div><div class='hunk'>@@ -822,8 +828,8 @@ static int jfs_link(struct dentry *old_dentry,</div><div class='ctx'> </div><div class='ctx'> 	/* update object inode */</div><div class='ctx'> 	inc_nlink(ip);		/* for new link */</div><div class='del'>-	ip-&gt;i_ctime = current_time(ip);</div><div class='del'>-	dir-&gt;i_ctime = dir-&gt;i_mtime = current_time(dir);</div><div class='add'>+	inode_set_ctime_current(ip);</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='ctx'> 	mark_inode_dirty(dir);</div><div class='ctx'> 	ihold(ip);</div><div class='ctx'> </div><div class='hunk'>@@ -869,16 +875,16 @@ static int jfs_link(struct dentry *old_dentry,</div><div class='ctx'>  * an intermediate result whose length exceeds PATH_MAX [XPG4.2]</div><div class='ctx'> */</div><div class='ctx'> </div><div class='del'>-static int jfs_symlink(struct user_namespace *mnt_userns, struct inode *dip,</div><div class='add'>+static int jfs_symlink(struct mnt_idmap *idmap, struct inode *dip,</div><div class='ctx'> 		       struct dentry *dentry, const char *name)</div><div class='ctx'> {</div><div class='ctx'> 	int rc;</div><div class='ctx'> 	tid_t tid;</div><div class='ctx'> 	ino_t ino = 0;</div><div class='ctx'> 	struct component_name dname;</div><div class='del'>-	int ssize;		/* source pathname size */</div><div class='add'>+	u32 ssize;		/* source pathname size */</div><div class='ctx'> 	struct btstack btstack;</div><div class='del'>-	struct inode *ip = d_inode(dentry);</div><div class='add'>+	struct inode *ip;</div><div class='ctx'> 	s64 xlen = 0;</div><div class='ctx'> 	int bmask = 0, xsize;</div><div class='ctx'> 	s64 xaddr;</div><div class='hunk'>@@ -946,7 +952,7 @@ static int jfs_symlink(struct user_namespace *mnt_userns, struct inode *dip,</div><div class='ctx'> 	if (ssize &lt;= IDATASIZE) {</div><div class='ctx'> 		ip-&gt;i_op = &amp;jfs_fast_symlink_inode_operations;</div><div class='ctx'> </div><div class='del'>-		ip-&gt;i_link = JFS_IP(ip)-&gt;i_inline;</div><div class='add'>+		ip-&gt;i_link = JFS_IP(ip)-&gt;i_inline_all;</div><div class='ctx'> 		memcpy(ip-&gt;i_link, name, ssize);</div><div class='ctx'> 		ip-&gt;i_size = ssize - 1;</div><div class='ctx'> </div><div class='hunk'>@@ -957,7 +963,7 @@ static int jfs_symlink(struct user_namespace *mnt_userns, struct inode *dip,</div><div class='ctx'> 		if (ssize &gt; sizeof (JFS_IP(ip)-&gt;i_inline))</div><div class='ctx'> 			JFS_IP(ip)-&gt;mode2 &amp;= ~INLINEEA;</div><div class='ctx'> </div><div class='del'>-		jfs_info("jfs_symlink: fast symlink added  ssize:%d name:%s ",</div><div class='add'>+		jfs_info("jfs_symlink: fast symlink added  ssize:%u name:%s ",</div><div class='ctx'> 			 ssize, name);</div><div class='ctx'> 	}</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -987,7 +993,7 @@ static int jfs_symlink(struct user_namespace *mnt_userns, struct inode *dip,</div><div class='ctx'> 		ip-&gt;i_size = ssize - 1;</div><div class='ctx'> 		while (ssize) {</div><div class='ctx'> 			/* This is kind of silly since PATH_MAX == 4K */</div><div class='del'>-			int copy_size = min(ssize, PSIZE);</div><div class='add'>+			u32 copy_size = min_t(u32, ssize, PSIZE);</div><div class='ctx'> </div><div class='ctx'> 			mp = get_metapage(ip, xaddr, PSIZE, 1);</div><div class='ctx'> </div><div class='hunk'>@@ -1023,7 +1029,7 @@ static int jfs_symlink(struct user_namespace *mnt_userns, struct inode *dip,</div><div class='ctx'> </div><div class='ctx'> 	mark_inode_dirty(ip);</div><div class='ctx'> </div><div class='del'>-	dip-&gt;i_ctime = dip-&gt;i_mtime = current_time(dip);</div><div class='add'>+	inode_set_mtime_to_ts(dip, inode_set_ctime_current(dip));</div><div class='ctx'> 	mark_inode_dirty(dip);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * commit update of parent directory and link object</div><div class='hunk'>@@ -1059,7 +1065,7 @@ static int jfs_symlink(struct user_namespace *mnt_userns, struct inode *dip,</div><div class='ctx'>  *</div><div class='ctx'>  * FUNCTION:	rename a file or directory</div><div class='ctx'>  */</div><div class='del'>-static int jfs_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='add'>+static int jfs_rename(struct mnt_idmap *idmap, struct inode *old_dir,</div><div class='ctx'> 		      struct dentry *old_dentry, struct inode *new_dir,</div><div class='ctx'> 		      struct dentry *new_dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='hunk'>@@ -1200,7 +1206,7 @@ static int jfs_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> 			tblk-&gt;xflag |= COMMIT_DELETE;</div><div class='ctx'> 			tblk-&gt;u.ip = new_ip;</div><div class='ctx'> 		} else {</div><div class='del'>-			new_ip-&gt;i_ctime = current_time(new_ip);</div><div class='add'>+			inode_set_ctime_current(new_ip);</div><div class='ctx'> 			mark_inode_dirty(new_ip);</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -1263,10 +1269,10 @@ static int jfs_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Update ctime on changed/moved inodes &amp; mark dirty</div><div class='ctx'> 	 */</div><div class='del'>-	old_ip-&gt;i_ctime = current_time(old_ip);</div><div class='add'>+	inode_set_ctime_current(old_ip);</div><div class='ctx'> 	mark_inode_dirty(old_ip);</div><div class='ctx'> </div><div class='del'>-	new_dir-&gt;i_ctime = new_dir-&gt;i_mtime = current_time(new_dir);</div><div class='add'>+	inode_set_mtime_to_ts(new_dir, inode_set_ctime_current(new_dir));</div><div class='ctx'> 	mark_inode_dirty(new_dir);</div><div class='ctx'> </div><div class='ctx'> 	/* Build list of inodes modified by this transaction */</div><div class='hunk'>@@ -1278,7 +1284,8 @@ static int jfs_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> </div><div class='ctx'> 	if (old_dir != new_dir) {</div><div class='ctx'> 		iplist[ipcount++] = new_dir;</div><div class='del'>-		old_dir-&gt;i_ctime = old_dir-&gt;i_mtime = current_time(old_dir);</div><div class='add'>+		inode_set_mtime_to_ts(old_dir,</div><div class='add'>+				      inode_set_ctime_current(old_dir));</div><div class='ctx'> 		mark_inode_dirty(old_dir);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1345,7 +1352,7 @@ static int jfs_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'>  *</div><div class='ctx'>  * FUNCTION:	Create a special file (device)</div><div class='ctx'>  */</div><div class='del'>-static int jfs_mknod(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int jfs_mknod(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		     struct dentry *dentry, umode_t mode, dev_t rdev)</div><div class='ctx'> {</div><div class='ctx'> 	struct jfs_inode_info *jfs_ip;</div><div class='hunk'>@@ -1411,7 +1418,7 @@ static int jfs_mknod(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> </div><div class='ctx'> 	mark_inode_dirty(ip);</div><div class='ctx'> </div><div class='del'>-	dir-&gt;i_ctime = dir-&gt;i_mtime = current_time(dir);</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='ctx'> </div><div class='ctx'> 	mark_inode_dirty(dir);</div><div class='ctx'> </div><div class='hunk'>@@ -1525,14 +1532,15 @@ const struct inode_operations jfs_dir_inode_operations = {</div><div class='ctx'> 	.fileattr_get	= jfs_fileattr_get,</div><div class='ctx'> 	.fileattr_set	= jfs_fileattr_set,</div><div class='ctx'> #ifdef CONFIG_JFS_POSIX_ACL</div><div class='del'>-	.get_acl	= jfs_get_acl,</div><div class='add'>+	.get_inode_acl	= jfs_get_acl,</div><div class='ctx'> 	.set_acl	= jfs_set_acl,</div><div class='ctx'> #endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+WRAP_DIR_ITER(jfs_readdir) // FIXME!</div><div class='ctx'> const struct file_operations jfs_dir_operations = {</div><div class='ctx'> 	.read		= generic_read_dir,</div><div class='del'>-	.iterate	= jfs_readdir,</div><div class='add'>+	.iterate_shared	= shared_jfs_readdir,</div><div class='ctx'> 	.fsync		= jfs_fsync,</div><div class='ctx'> 	.unlocked_ioctl = jfs_ioctl,</div><div class='ctx'> 	.compat_ioctl	= compat_ptr_ioctl,</div><div class='hunk'>@@ -1568,7 +1576,8 @@ out:</div><div class='ctx'> 	return result;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int jfs_ci_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='add'>+static int jfs_ci_revalidate(struct inode *dir, const struct qstr *name,</div><div class='add'>+			     struct dentry *dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * This is not negative dentry. Always valid.</div><div class='head'>diff --git a/fs/jfs/super.c b/fs/jfs/super.c<br/>index 24cbc9946e01..3cfb86c5a36e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/super.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/super.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/super.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/super.c</a></div><div class='hunk'>@@ -6,11 +6,11 @@</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/module.h&gt;</div><div class='del'>-#include &lt;linux/parser.h&gt;</div><div class='ctx'> #include &lt;linux/completion.h&gt;</div><div class='ctx'> #include &lt;linux/vfs.h&gt;</div><div class='ctx'> #include &lt;linux/quotaops.h&gt;</div><div class='del'>-#include &lt;linux/mount.h&gt;</div><div class='add'>+#include &lt;linux/fs_context.h&gt;</div><div class='add'>+#include &lt;linux/fs_parser.h&gt;</div><div class='ctx'> #include &lt;linux/moduleparam.h&gt;</div><div class='ctx'> #include &lt;linux/kthread.h&gt;</div><div class='ctx'> #include &lt;linux/posix_acl.h&gt;</div><div class='hunk'>@@ -102,7 +102,7 @@ static struct inode *jfs_alloc_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct jfs_inode_info *jfs_inode;</div><div class='ctx'> </div><div class='del'>-	jfs_inode = kmem_cache_alloc(jfs_inode_cachep, GFP_NOFS);</div><div class='add'>+	jfs_inode = alloc_inode_sb(sb, jfs_inode_cachep, GFP_NOFS);</div><div class='ctx'> 	if (!jfs_inode)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='hunk'>@@ -210,244 +210,195 @@ enum {</div><div class='ctx'> 	Opt_discard, Opt_nodiscard, Opt_discard_minblk</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static const match_table_t tokens = {</div><div class='del'>-	{Opt_integrity, "integrity"},</div><div class='del'>-	{Opt_nointegrity, "nointegrity"},</div><div class='del'>-	{Opt_iocharset, "iocharset=%s"},</div><div class='del'>-	{Opt_resize, "resize=%u"},</div><div class='del'>-	{Opt_resize_nosize, "resize"},</div><div class='del'>-	{Opt_errors, "errors=%s"},</div><div class='del'>-	{Opt_ignore, "noquota"},</div><div class='del'>-	{Opt_quota, "quota"},</div><div class='del'>-	{Opt_usrquota, "usrquota"},</div><div class='del'>-	{Opt_grpquota, "grpquota"},</div><div class='del'>-	{Opt_uid, "uid=%u"},</div><div class='del'>-	{Opt_gid, "gid=%u"},</div><div class='del'>-	{Opt_umask, "umask=%u"},</div><div class='del'>-	{Opt_discard, "discard"},</div><div class='del'>-	{Opt_nodiscard, "nodiscard"},</div><div class='del'>-	{Opt_discard_minblk, "discard=%u"},</div><div class='del'>-	{Opt_err, NULL}</div><div class='add'>+static const struct constant_table jfs_param_errors[] = {</div><div class='add'>+	{"continue",	JFS_ERR_CONTINUE},</div><div class='add'>+	{"remount-ro",	JFS_ERR_REMOUNT_RO},</div><div class='add'>+	{"panic",	JFS_ERR_PANIC},</div><div class='add'>+	{}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int parse_options(char *options, struct super_block *sb, s64 *newLVSize,</div><div class='del'>-			 int *flag)</div><div class='del'>-{</div><div class='del'>-	void *nls_map = (void *)-1;	/* -1: no change;  NULL: none */</div><div class='del'>-	char *p;</div><div class='del'>-	struct jfs_sb_info *sbi = JFS_SBI(sb);</div><div class='add'>+static const struct fs_parameter_spec jfs_param_spec[] = {</div><div class='add'>+	fsparam_flag_no	("integrity",	Opt_integrity),</div><div class='add'>+	fsparam_string	("iocharset",	Opt_iocharset),</div><div class='add'>+	fsparam_u64	("resize",	Opt_resize),</div><div class='add'>+	fsparam_flag	("resize",	Opt_resize_nosize),</div><div class='add'>+	fsparam_enum	("errors",	Opt_errors,	jfs_param_errors),</div><div class='add'>+	fsparam_flag	("quota",	Opt_quota),</div><div class='add'>+	fsparam_flag	("noquota",	Opt_ignore),</div><div class='add'>+	fsparam_flag	("usrquota",	Opt_usrquota),</div><div class='add'>+	fsparam_flag	("grpquota",	Opt_grpquota),</div><div class='add'>+	fsparam_uid	("uid",		Opt_uid),</div><div class='add'>+	fsparam_gid	("gid",		Opt_gid),</div><div class='add'>+	fsparam_u32oct	("umask",	Opt_umask),</div><div class='add'>+	fsparam_flag	("discard",	Opt_discard),</div><div class='add'>+	fsparam_u32	("discard",	Opt_discard_minblk),</div><div class='add'>+	fsparam_flag	("nodiscard",	Opt_nodiscard),</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-	*newLVSize = 0;</div><div class='del'>-</div><div class='del'>-	if (!options)</div><div class='del'>-		return 1;</div><div class='del'>-</div><div class='del'>-	while ((p = strsep(&amp;options, ",")) != NULL) {</div><div class='del'>-		substring_t args[MAX_OPT_ARGS];</div><div class='del'>-		int token;</div><div class='del'>-		if (!*p)</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		token = match_token(p, tokens, args);</div><div class='del'>-		switch (token) {</div><div class='del'>-		case Opt_integrity:</div><div class='del'>-			*flag &amp;= ~JFS_NOINTEGRITY;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_nointegrity:</div><div class='del'>-			*flag |= JFS_NOINTEGRITY;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_ignore:</div><div class='del'>-			/* Silently ignore the quota options */</div><div class='del'>-			/* Don't do anything ;-) */</div><div class='del'>-			break;</div><div class='del'>-		case Opt_iocharset:</div><div class='del'>-			if (nls_map &amp;&amp; nls_map != (void *) -1)</div><div class='del'>-				unload_nls(nls_map);</div><div class='del'>-			if (!strcmp(args[0].from, "none"))</div><div class='del'>-				nls_map = NULL;</div><div class='del'>-			else {</div><div class='del'>-				nls_map = load_nls(args[0].from);</div><div class='del'>-				if (!nls_map) {</div><div class='del'>-					pr_err("JFS: charset not found\n");</div><div class='del'>-					goto cleanup;</div><div class='del'>-				}</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		case Opt_resize:</div><div class='del'>-		{</div><div class='del'>-			char *resize = args[0].from;</div><div class='del'>-			int rc = kstrtoll(resize, 0, newLVSize);</div><div class='add'>+struct jfs_context {</div><div class='add'>+	int	flag;</div><div class='add'>+	kuid_t	uid;</div><div class='add'>+	kgid_t	gid;</div><div class='add'>+	uint	umask;</div><div class='add'>+	uint	minblks_trim;</div><div class='add'>+	void	*nls_map;</div><div class='add'>+	bool	resize;</div><div class='add'>+	s64	newLVSize;</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-			if (rc)</div><div class='del'>-				goto cleanup;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		case Opt_resize_nosize:</div><div class='del'>-		{</div><div class='del'>-			*newLVSize = sb_bdev_nr_blocks(sb);</div><div class='del'>-			if (*newLVSize == 0)</div><div class='del'>-				pr_err("JFS: Cannot determine volume size\n");</div><div class='del'>-			break;</div><div class='add'>+static int jfs_parse_param(struct fs_context *fc, struct fs_parameter *param)</div><div class='add'>+{</div><div class='add'>+	struct jfs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	int reconfigure = (fc-&gt;purpose == FS_CONTEXT_FOR_RECONFIGURE);</div><div class='add'>+	struct fs_parse_result result;</div><div class='add'>+	struct nls_table *nls_map;</div><div class='add'>+	int opt;</div><div class='add'>+</div><div class='add'>+	opt = fs_parse(fc, jfs_param_spec, param, &amp;result);</div><div class='add'>+	if (opt &lt; 0)</div><div class='add'>+		return opt;</div><div class='add'>+</div><div class='add'>+	switch (opt) {</div><div class='add'>+	case Opt_integrity:</div><div class='add'>+		if (result.negated)</div><div class='add'>+			ctx-&gt;flag |= JFS_NOINTEGRITY;</div><div class='add'>+		else</div><div class='add'>+			ctx-&gt;flag &amp;= ~JFS_NOINTEGRITY;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_ignore:</div><div class='add'>+		/* Silently ignore the quota options */</div><div class='add'>+		/* Don't do anything ;-) */</div><div class='add'>+		break;</div><div class='add'>+	case Opt_iocharset:</div><div class='add'>+		if (ctx-&gt;nls_map &amp;&amp; ctx-&gt;nls_map != (void *) -1) {</div><div class='add'>+			unload_nls(ctx-&gt;nls_map);</div><div class='add'>+			ctx-&gt;nls_map = NULL;</div><div class='ctx'> 		}</div><div class='del'>-		case Opt_errors:</div><div class='del'>-		{</div><div class='del'>-			char *errors = args[0].from;</div><div class='del'>-			if (!errors || !*errors)</div><div class='del'>-				goto cleanup;</div><div class='del'>-			if (!strcmp(errors, "continue")) {</div><div class='del'>-				*flag &amp;= ~JFS_ERR_REMOUNT_RO;</div><div class='del'>-				*flag &amp;= ~JFS_ERR_PANIC;</div><div class='del'>-				*flag |= JFS_ERR_CONTINUE;</div><div class='del'>-			} else if (!strcmp(errors, "remount-ro")) {</div><div class='del'>-				*flag &amp;= ~JFS_ERR_CONTINUE;</div><div class='del'>-				*flag &amp;= ~JFS_ERR_PANIC;</div><div class='del'>-				*flag |= JFS_ERR_REMOUNT_RO;</div><div class='del'>-			} else if (!strcmp(errors, "panic")) {</div><div class='del'>-				*flag &amp;= ~JFS_ERR_CONTINUE;</div><div class='del'>-				*flag &amp;= ~JFS_ERR_REMOUNT_RO;</div><div class='del'>-				*flag |= JFS_ERR_PANIC;</div><div class='del'>-			} else {</div><div class='del'>-				pr_err("JFS: %s is an invalid error handler\n",</div><div class='del'>-				       errors);</div><div class='del'>-				goto cleanup;</div><div class='add'>+		if (!strcmp(param-&gt;string, "none"))</div><div class='add'>+			ctx-&gt;nls_map = NULL;</div><div class='add'>+		else {</div><div class='add'>+			nls_map = load_nls(param-&gt;string);</div><div class='add'>+			if (!nls_map) {</div><div class='add'>+				pr_err("JFS: charset not found\n");</div><div class='add'>+				return -EINVAL;</div><div class='ctx'> 			}</div><div class='del'>-			break;</div><div class='add'>+			ctx-&gt;nls_map = nls_map;</div><div class='ctx'> 		}</div><div class='add'>+		break;</div><div class='add'>+	case Opt_resize:</div><div class='add'>+		if (!reconfigure)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		ctx-&gt;resize = true;</div><div class='add'>+		ctx-&gt;newLVSize = result.uint_64;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_resize_nosize:</div><div class='add'>+		if (!reconfigure)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		ctx-&gt;resize = true;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_errors:</div><div class='add'>+		ctx-&gt;flag &amp;= ~JFS_ERR_MASK;</div><div class='add'>+		ctx-&gt;flag |= result.uint_32;</div><div class='add'>+		break;</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='del'>-		case Opt_quota:</div><div class='del'>-		case Opt_usrquota:</div><div class='del'>-			*flag |= JFS_USRQUOTA;</div><div class='del'>-			break;</div><div class='del'>-		case Opt_grpquota:</div><div class='del'>-			*flag |= JFS_GRPQUOTA;</div><div class='del'>-			break;</div><div class='add'>+	case Opt_quota:</div><div class='add'>+	case Opt_usrquota:</div><div class='add'>+		ctx-&gt;flag |= JFS_USRQUOTA;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_grpquota:</div><div class='add'>+		ctx-&gt;flag |= JFS_GRPQUOTA;</div><div class='add'>+		break;</div><div class='ctx'> #else</div><div class='del'>-		case Opt_usrquota:</div><div class='del'>-		case Opt_grpquota:</div><div class='del'>-		case Opt_quota:</div><div class='del'>-			pr_err("JFS: quota operations not supported\n");</div><div class='del'>-			break;</div><div class='add'>+	case Opt_usrquota:</div><div class='add'>+	case Opt_grpquota:</div><div class='add'>+	case Opt_quota:</div><div class='add'>+		pr_err("JFS: quota operations not supported\n");</div><div class='add'>+		break;</div><div class='ctx'> #endif</div><div class='del'>-		case Opt_uid:</div><div class='del'>-		{</div><div class='del'>-			char *uid = args[0].from;</div><div class='del'>-			uid_t val;</div><div class='del'>-			int rc = kstrtouint(uid, 0, &amp;val);</div><div class='del'>-</div><div class='del'>-			if (rc)</div><div class='del'>-				goto cleanup;</div><div class='del'>-			sbi-&gt;uid = make_kuid(current_user_ns(), val);</div><div class='del'>-			if (!uid_valid(sbi-&gt;uid))</div><div class='del'>-				goto cleanup;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		case Opt_gid:</div><div class='del'>-		{</div><div class='del'>-			char *gid = args[0].from;</div><div class='del'>-			gid_t val;</div><div class='del'>-			int rc = kstrtouint(gid, 0, &amp;val);</div><div class='del'>-</div><div class='del'>-			if (rc)</div><div class='del'>-				goto cleanup;</div><div class='del'>-			sbi-&gt;gid = make_kgid(current_user_ns(), val);</div><div class='del'>-			if (!gid_valid(sbi-&gt;gid))</div><div class='del'>-				goto cleanup;</div><div class='del'>-			break;</div><div class='add'>+	case Opt_uid:</div><div class='add'>+		ctx-&gt;uid = result.uid;</div><div class='add'>+		break;</div><div class='add'>+</div><div class='add'>+	case Opt_gid:</div><div class='add'>+		ctx-&gt;gid = result.gid;</div><div class='add'>+		break;</div><div class='add'>+</div><div class='add'>+	case Opt_umask:</div><div class='add'>+		if (result.uint_32 &amp; ~0777) {</div><div class='add'>+			pr_err("JFS: Invalid value of umask\n");</div><div class='add'>+			return -EINVAL;</div><div class='ctx'> 		}</div><div class='add'>+		ctx-&gt;umask = result.uint_32;</div><div class='add'>+		break;</div><div class='ctx'> </div><div class='del'>-		case Opt_umask:</div><div class='del'>-		{</div><div class='del'>-			char *umask = args[0].from;</div><div class='del'>-			int rc = kstrtouint(umask, 8, &amp;sbi-&gt;umask);</div><div class='del'>-</div><div class='del'>-			if (rc)</div><div class='del'>-				goto cleanup;</div><div class='del'>-			if (sbi-&gt;umask &amp; ~0777) {</div><div class='del'>-				pr_err("JFS: Invalid value of umask\n");</div><div class='del'>-				goto cleanup;</div><div class='del'>-			}</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		case Opt_discard:</div><div class='del'>-		{</div><div class='del'>-			struct request_queue *q = bdev_get_queue(sb-&gt;s_bdev);</div><div class='del'>-			/* if set to 1, even copying files will cause</div><div class='del'>-			 * trimming :O</div><div class='del'>-			 * -&gt; user has more control over the online trimming</div><div class='del'>-			 */</div><div class='del'>-			sbi-&gt;minblks_trim = 64;</div><div class='del'>-			if (blk_queue_discard(q))</div><div class='del'>-				*flag |= JFS_DISCARD;</div><div class='del'>-			else</div><div class='del'>-				pr_err("JFS: discard option not supported on device\n");</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='add'>+	case Opt_discard:</div><div class='add'>+		/* if set to 1, even copying files will cause</div><div class='add'>+		 * trimming :O</div><div class='add'>+		 * -&gt; user has more control over the online trimming</div><div class='add'>+		 */</div><div class='add'>+		ctx-&gt;minblks_trim = 64;</div><div class='add'>+		ctx-&gt;flag |= JFS_DISCARD;</div><div class='add'>+		break;</div><div class='ctx'> </div><div class='del'>-		case Opt_nodiscard:</div><div class='del'>-			*flag &amp;= ~JFS_DISCARD;</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		case Opt_discard_minblk:</div><div class='del'>-		{</div><div class='del'>-			struct request_queue *q = bdev_get_queue(sb-&gt;s_bdev);</div><div class='del'>-			char *minblks_trim = args[0].from;</div><div class='del'>-			int rc;</div><div class='del'>-			if (blk_queue_discard(q)) {</div><div class='del'>-				*flag |= JFS_DISCARD;</div><div class='del'>-				rc = kstrtouint(minblks_trim, 0,</div><div class='del'>-						&amp;sbi-&gt;minblks_trim);</div><div class='del'>-				if (rc)</div><div class='del'>-					goto cleanup;</div><div class='del'>-			} else</div><div class='del'>-				pr_err("JFS: discard option not supported on device\n");</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='add'>+	case Opt_nodiscard:</div><div class='add'>+		ctx-&gt;flag &amp;= ~JFS_DISCARD;</div><div class='add'>+		break;</div><div class='ctx'> </div><div class='del'>-		default:</div><div class='del'>-			printk("jfs: Unrecognized mount option \"%s\" or missing value\n",</div><div class='del'>-			       p);</div><div class='del'>-			goto cleanup;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	case Opt_discard_minblk:</div><div class='add'>+		ctx-&gt;minblks_trim = result.uint_32;</div><div class='add'>+		ctx-&gt;flag |= JFS_DISCARD;</div><div class='add'>+		break;</div><div class='ctx'> </div><div class='del'>-	if (nls_map != (void *) -1) {</div><div class='del'>-		/* Discard old (if remount) */</div><div class='del'>-		unload_nls(sbi-&gt;nls_tab);</div><div class='del'>-		sbi-&gt;nls_tab = nls_map;</div><div class='add'>+	default:</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-	return 1;</div><div class='ctx'> </div><div class='del'>-cleanup:</div><div class='del'>-	if (nls_map &amp;&amp; nls_map != (void *) -1)</div><div class='del'>-		unload_nls(nls_map);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int jfs_remount(struct super_block *sb, int *flags, char *data)</div><div class='add'>+static int jfs_reconfigure(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	s64 newLVSize = 0;</div><div class='add'>+	struct jfs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	struct super_block *sb = fc-&gt;root-&gt;d_sb;</div><div class='add'>+	int readonly = fc-&gt;sb_flags &amp; SB_RDONLY;</div><div class='ctx'> 	int rc = 0;</div><div class='del'>-	int flag = JFS_SBI(sb)-&gt;flag;</div><div class='add'>+	int flag = ctx-&gt;flag;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	sync_filesystem(sb);</div><div class='del'>-	if (!parse_options(data, sb, &amp;newLVSize, &amp;flag))</div><div class='del'>-		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	if (newLVSize) {</div><div class='add'>+	/* Transfer results of parsing to the sbi */</div><div class='add'>+	JFS_SBI(sb)-&gt;flag = ctx-&gt;flag;</div><div class='add'>+	JFS_SBI(sb)-&gt;uid = ctx-&gt;uid;</div><div class='add'>+	JFS_SBI(sb)-&gt;gid = ctx-&gt;gid;</div><div class='add'>+	JFS_SBI(sb)-&gt;umask = ctx-&gt;umask;</div><div class='add'>+	JFS_SBI(sb)-&gt;minblks_trim = ctx-&gt;minblks_trim;</div><div class='add'>+	if (ctx-&gt;nls_map != (void *) -1) {</div><div class='add'>+		unload_nls(JFS_SBI(sb)-&gt;nls_tab);</div><div class='add'>+		JFS_SBI(sb)-&gt;nls_tab = ctx-&gt;nls_map;</div><div class='add'>+	}</div><div class='add'>+	ctx-&gt;nls_map = NULL;</div><div class='add'>+</div><div class='add'>+	if (ctx-&gt;resize) {</div><div class='ctx'> 		if (sb_rdonly(sb)) {</div><div class='ctx'> 			pr_err("JFS: resize requires volume to be mounted read-write\n");</div><div class='ctx'> 			return -EROFS;</div><div class='ctx'> 		}</div><div class='del'>-		rc = jfs_extendfs(sb, newLVSize, 0);</div><div class='add'>+</div><div class='add'>+		if (!ctx-&gt;newLVSize) {</div><div class='add'>+			ctx-&gt;newLVSize = sb_bdev_nr_blocks(sb);</div><div class='add'>+			if (ctx-&gt;newLVSize == 0)</div><div class='add'>+				pr_err("JFS: Cannot determine volume size\n");</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		rc = jfs_extendfs(sb, ctx-&gt;newLVSize, 0);</div><div class='ctx'> 		if (rc)</div><div class='ctx'> 			return rc;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (sb_rdonly(sb) &amp;&amp; !(*flags &amp; SB_RDONLY)) {</div><div class='add'>+	if (sb_rdonly(sb) &amp;&amp; !readonly) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Invalidate any previously read metadata.  fsck may have</div><div class='ctx'> 		 * changed the on-disk data since we mounted r/o</div><div class='hunk'>@@ -463,7 +414,7 @@ static int jfs_remount(struct super_block *sb, int *flags, char *data)</div><div class='ctx'> 		dquot_resume(sb, -1);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='del'>-	if (!sb_rdonly(sb) &amp;&amp; (*flags &amp; SB_RDONLY)) {</div><div class='add'>+	if (!sb_rdonly(sb) &amp;&amp; readonly) {</div><div class='ctx'> 		rc = dquot_suspend(sb, -1);</div><div class='ctx'> 		if (rc &lt; 0)</div><div class='ctx'> 			return rc;</div><div class='hunk'>@@ -471,7 +422,7 @@ static int jfs_remount(struct super_block *sb, int *flags, char *data)</div><div class='ctx'> 		JFS_SBI(sb)-&gt;flag = flag;</div><div class='ctx'> 		return rc;</div><div class='ctx'> 	}</div><div class='del'>-	if ((JFS_SBI(sb)-&gt;flag &amp; JFS_NOINTEGRITY) != (flag &amp; JFS_NOINTEGRITY))</div><div class='add'>+	if ((JFS_SBI(sb)-&gt;flag &amp; JFS_NOINTEGRITY) != (flag &amp; JFS_NOINTEGRITY)) {</div><div class='ctx'> 		if (!sb_rdonly(sb)) {</div><div class='ctx'> 			rc = jfs_umount_rw(sb);</div><div class='ctx'> 			if (rc)</div><div class='hunk'>@@ -481,18 +432,20 @@ static int jfs_remount(struct super_block *sb, int *flags, char *data)</div><div class='ctx'> 			ret = jfs_mount_rw(sb, 1);</div><div class='ctx'> 			return ret;</div><div class='ctx'> 		}</div><div class='add'>+	}</div><div class='ctx'> 	JFS_SBI(sb)-&gt;flag = flag;</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int jfs_fill_super(struct super_block *sb, void *data, int silent)</div><div class='add'>+static int jfs_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> {</div><div class='add'>+	struct jfs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+	int silent = fc-&gt;sb_flags &amp; SB_SILENT;</div><div class='ctx'> 	struct jfs_sb_info *sbi;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	int rc;</div><div class='del'>-	s64 newLVSize = 0;</div><div class='del'>-	int flag, ret = -EINVAL;</div><div class='add'>+	int ret = -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	jfs_info("In jfs_read_super: s_flags=0x%lx", sb-&gt;s_flags);</div><div class='ctx'> </div><div class='hunk'>@@ -505,24 +458,34 @@ static int jfs_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 	sb-&gt;s_time_min = 0;</div><div class='ctx'> 	sb-&gt;s_time_max = U32_MAX;</div><div class='ctx'> 	sbi-&gt;sb = sb;</div><div class='del'>-	sbi-&gt;uid = INVALID_UID;</div><div class='del'>-	sbi-&gt;gid = INVALID_GID;</div><div class='del'>-	sbi-&gt;umask = -1;</div><div class='del'>-</div><div class='del'>-	/* initialize the mount flag and determine the default error handler */</div><div class='del'>-	flag = JFS_ERR_REMOUNT_RO;</div><div class='ctx'> </div><div class='del'>-	if (!parse_options((char *) data, sb, &amp;newLVSize, &amp;flag))</div><div class='del'>-		goto out_kfree;</div><div class='del'>-	sbi-&gt;flag = flag;</div><div class='add'>+	/* Transfer results of parsing to the sbi */</div><div class='add'>+	sbi-&gt;flag = ctx-&gt;flag;</div><div class='add'>+	sbi-&gt;uid = ctx-&gt;uid;</div><div class='add'>+	sbi-&gt;gid = ctx-&gt;gid;</div><div class='add'>+	sbi-&gt;umask = ctx-&gt;umask;</div><div class='add'>+	if (ctx-&gt;nls_map != (void *) -1) {</div><div class='add'>+		unload_nls(sbi-&gt;nls_tab);</div><div class='add'>+		sbi-&gt;nls_tab = ctx-&gt;nls_map;</div><div class='add'>+	}</div><div class='add'>+	ctx-&gt;nls_map = NULL;</div><div class='add'>+</div><div class='add'>+	if (sbi-&gt;flag &amp; JFS_DISCARD) {</div><div class='add'>+		if (!bdev_max_discard_sectors(sb-&gt;s_bdev)) {</div><div class='add'>+			pr_err("JFS: discard option not supported on device\n");</div><div class='add'>+			sbi-&gt;flag &amp;= ~JFS_DISCARD;</div><div class='add'>+		} else {</div><div class='add'>+			sbi-&gt;minblks_trim = ctx-&gt;minblks_trim;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_JFS_POSIX_ACL</div><div class='ctx'> 	sb-&gt;s_flags |= SB_POSIXACL;</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-	if (newLVSize) {</div><div class='add'>+	if (ctx-&gt;resize) {</div><div class='ctx'> 		pr_err("resize option for remount only\n");</div><div class='del'>-		goto out_kfree;</div><div class='add'>+		goto out_unload;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -579,7 +542,7 @@ static int jfs_fill_super(struct super_block *sb, void *data, int silent)</div><div class='ctx'> 	sb-&gt;s_magic = JFS_SUPER_MAGIC;</div><div class='ctx'> </div><div class='ctx'> 	if (sbi-&gt;mntflag &amp; JFS_OS2)</div><div class='del'>-		sb-&gt;s_d_op = &amp;jfs_ci_dentry_operations;</div><div class='add'>+		set_default_d_op(sb, &amp;jfs_ci_dentry_operations);</div><div class='ctx'> </div><div class='ctx'> 	inode = jfs_iget(sb, ROOT_I);</div><div class='ctx'> 	if (IS_ERR(inode)) {</div><div class='hunk'>@@ -612,7 +575,6 @@ out_mount_failed:</div><div class='ctx'> 	sbi-&gt;direct_inode = NULL;</div><div class='ctx'> out_unload:</div><div class='ctx'> 	unload_nls(sbi-&gt;nls_tab);</div><div class='del'>-out_kfree:</div><div class='ctx'> 	kfree(sbi);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -668,10 +630,9 @@ out:</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct dentry *jfs_do_mount(struct file_system_type *fs_type,</div><div class='del'>-	int flags, const char *dev_name, void *data)</div><div class='add'>+static int jfs_get_tree(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	return mount_bdev(fs_type, flags, dev_name, data, jfs_fill_super);</div><div class='add'>+	return get_tree_bdev(fc, jfs_fill_super);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int jfs_sync_fs(struct super_block *sb, int wait)</div><div class='hunk'>@@ -749,8 +710,7 @@ static ssize_t jfs_quota_read(struct super_block *sb, int type, char *data,</div><div class='ctx'> 		len = i_size-off;</div><div class='ctx'> 	toread = len;</div><div class='ctx'> 	while (toread &gt; 0) {</div><div class='del'>-		tocopy = sb-&gt;s_blocksize - offset &lt; toread ?</div><div class='del'>-				sb-&gt;s_blocksize - offset : toread;</div><div class='add'>+		tocopy = min_t(size_t, sb-&gt;s_blocksize - offset, toread);</div><div class='ctx'> </div><div class='ctx'> 		tmp_bh.b_state = 0;</div><div class='ctx'> 		tmp_bh.b_size = i_blocksize(inode);</div><div class='hunk'>@@ -789,8 +749,7 @@ static ssize_t jfs_quota_write(struct super_block *sb, int type,</div><div class='ctx'> </div><div class='ctx'> 	inode_lock(inode);</div><div class='ctx'> 	while (towrite &gt; 0) {</div><div class='del'>-		tocopy = sb-&gt;s_blocksize - offset &lt; towrite ?</div><div class='del'>-				sb-&gt;s_blocksize - offset : towrite;</div><div class='add'>+		tocopy = min_t(size_t, sb-&gt;s_blocksize - offset, towrite);</div><div class='ctx'> </div><div class='ctx'> 		tmp_bh.b_state = 0;</div><div class='ctx'> 		tmp_bh.b_size = i_blocksize(inode);</div><div class='hunk'>@@ -807,7 +766,7 @@ static ssize_t jfs_quota_write(struct super_block *sb, int type,</div><div class='ctx'> 		}</div><div class='ctx'> 		lock_buffer(bh);</div><div class='ctx'> 		memcpy(bh-&gt;b_data+offset, data, tocopy);</div><div class='del'>-		flush_dcache_page(bh-&gt;b_page);</div><div class='add'>+		flush_dcache_folio(bh-&gt;b_folio);</div><div class='ctx'> 		set_buffer_uptodate(bh);</div><div class='ctx'> 		mark_buffer_dirty(bh);</div><div class='ctx'> 		unlock_buffer(bh);</div><div class='hunk'>@@ -824,13 +783,13 @@ out:</div><div class='ctx'> 	}</div><div class='ctx'> 	if (inode-&gt;i_size &lt; off+len-towrite)</div><div class='ctx'> 		i_size_write(inode, off+len-towrite);</div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_mtime_to_ts(inode, inode_set_ctime_current(inode));</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='ctx'> 	inode_unlock(inode);</div><div class='ctx'> 	return len - towrite;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct dquot **jfs_get_dquots(struct inode *inode)</div><div class='add'>+static struct dquot __rcu **jfs_get_dquots(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	return JFS_IP(inode)-&gt;i_dquot;</div><div class='ctx'> }</div><div class='hunk'>@@ -892,7 +851,6 @@ static const struct super_operations jfs_super_operations = {</div><div class='ctx'> 	.freeze_fs	= jfs_freeze,</div><div class='ctx'> 	.unfreeze_fs	= jfs_unfreeze,</div><div class='ctx'> 	.statfs		= jfs_statfs,</div><div class='del'>-	.remount_fs	= jfs_remount,</div><div class='ctx'> 	.show_options	= jfs_show_options,</div><div class='ctx'> #ifdef CONFIG_QUOTA</div><div class='ctx'> 	.quota_read	= jfs_quota_read,</div><div class='hunk'>@@ -902,17 +860,77 @@ static const struct super_operations jfs_super_operations = {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct export_operations jfs_export_operations = {</div><div class='add'>+	.encode_fh	= generic_encode_ino32_fh,</div><div class='ctx'> 	.fh_to_dentry	= jfs_fh_to_dentry,</div><div class='ctx'> 	.fh_to_parent	= jfs_fh_to_parent,</div><div class='ctx'> 	.get_parent	= jfs_get_parent,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+static void jfs_init_options(struct fs_context *fc, struct jfs_context *ctx)</div><div class='add'>+{</div><div class='add'>+	if (fc-&gt;purpose == FS_CONTEXT_FOR_RECONFIGURE) {</div><div class='add'>+		struct super_block *sb = fc-&gt;root-&gt;d_sb;</div><div class='add'>+</div><div class='add'>+		/* Copy over current option values and mount flags */</div><div class='add'>+		ctx-&gt;uid = JFS_SBI(sb)-&gt;uid;</div><div class='add'>+		ctx-&gt;gid = JFS_SBI(sb)-&gt;gid;</div><div class='add'>+		ctx-&gt;umask = JFS_SBI(sb)-&gt;umask;</div><div class='add'>+		ctx-&gt;nls_map = (void *)-1;</div><div class='add'>+		ctx-&gt;minblks_trim = JFS_SBI(sb)-&gt;minblks_trim;</div><div class='add'>+		ctx-&gt;flag = JFS_SBI(sb)-&gt;flag;</div><div class='add'>+</div><div class='add'>+	} else {</div><div class='add'>+		/*</div><div class='add'>+		 * Initialize the mount flag and determine the default</div><div class='add'>+		 * error handler</div><div class='add'>+		 */</div><div class='add'>+		ctx-&gt;flag = JFS_ERR_REMOUNT_RO;</div><div class='add'>+		ctx-&gt;uid = INVALID_UID;</div><div class='add'>+		ctx-&gt;gid = INVALID_GID;</div><div class='add'>+		ctx-&gt;umask = -1;</div><div class='add'>+		ctx-&gt;nls_map = (void *)-1;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void jfs_free_fc(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct jfs_context *ctx = fc-&gt;fs_private;</div><div class='add'>+</div><div class='add'>+	if (ctx-&gt;nls_map != (void *) -1)</div><div class='add'>+		unload_nls(ctx-&gt;nls_map);</div><div class='add'>+	kfree(ctx);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct fs_context_operations jfs_context_ops = {</div><div class='add'>+	.parse_param	= jfs_parse_param,</div><div class='add'>+	.get_tree	= jfs_get_tree,</div><div class='add'>+	.reconfigure	= jfs_reconfigure,</div><div class='add'>+	.free		= jfs_free_fc,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int jfs_init_fs_context(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct jfs_context *ctx;</div><div class='add'>+</div><div class='add'>+	ctx = kzalloc(sizeof(*ctx), GFP_KERNEL);</div><div class='add'>+	if (!ctx)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	jfs_init_options(fc, ctx);</div><div class='add'>+</div><div class='add'>+	fc-&gt;fs_private = ctx;</div><div class='add'>+	fc-&gt;ops = &amp;jfs_context_ops;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static struct file_system_type jfs_fs_type = {</div><div class='ctx'> 	.owner		= THIS_MODULE,</div><div class='ctx'> 	.name		= "jfs",</div><div class='del'>-	.mount		= jfs_do_mount,</div><div class='ctx'> 	.kill_sb	= kill_block_super,</div><div class='ctx'> 	.fs_flags	= FS_REQUIRES_DEV,</div><div class='add'>+	.init_fs_context = jfs_init_fs_context,</div><div class='add'>+	.parameters	= jfs_param_spec,</div><div class='ctx'> };</div><div class='ctx'> MODULE_ALIAS_FS("jfs");</div><div class='ctx'> </div><div class='hunk'>@@ -937,7 +955,7 @@ static int __init init_jfs_fs(void)</div><div class='ctx'> </div><div class='ctx'> 	jfs_inode_cachep =</div><div class='ctx'> 	    kmem_cache_create_usercopy("jfs_ip", sizeof(struct jfs_inode_info),</div><div class='del'>-			0, SLAB_RECLAIM_ACCOUNT|SLAB_MEM_SPREAD|SLAB_ACCOUNT,</div><div class='add'>+			0, SLAB_RECLAIM_ACCOUNT|SLAB_ACCOUNT,</div><div class='ctx'> 			offsetof(struct jfs_inode_info, i_inline_all),</div><div class='ctx'> 			sizeof_field(struct jfs_inode_info, i_inline_all),</div><div class='ctx'> 			init_once);</div><div class='head'>diff --git a/fs/jfs/xattr.c b/fs/jfs/xattr.c<br/>index f9273f6901c8..11d7f74d207b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/jfs/xattr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/jfs/xattr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/jfs/xattr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/jfs/xattr.c</a></div><div class='hunk'>@@ -434,6 +434,8 @@ static int ea_get(struct inode *inode, struct ea_buffer *ea_buf, int min_size)</div><div class='ctx'> 	int rc;</div><div class='ctx'> 	int quota_allocation = 0;</div><div class='ctx'> </div><div class='add'>+	memset(&amp;ea_buf-&gt;new_ea, 0, sizeof(ea_buf-&gt;new_ea));</div><div class='add'>+</div><div class='ctx'> 	/* When fsck.jfs clears a bad ea, it doesn't clear the size */</div><div class='ctx'> 	if (ji-&gt;ea.flag == 0)</div><div class='ctx'> 		ea_size = 0;</div><div class='hunk'>@@ -557,9 +559,16 @@ static int ea_get(struct inode *inode, struct ea_buffer *ea_buf, int min_size)</div><div class='ctx'> </div><div class='ctx'>       size_check:</div><div class='ctx'> 	if (EALIST_SIZE(ea_buf-&gt;xattr) != ea_size) {</div><div class='del'>-		printk(KERN_ERR "ea_get: invalid extended attribute\n");</div><div class='del'>-		print_hex_dump(KERN_ERR, "", DUMP_PREFIX_ADDRESS, 16, 1,</div><div class='del'>-				     ea_buf-&gt;xattr, ea_size, 1);</div><div class='add'>+		if (unlikely(EALIST_SIZE(ea_buf-&gt;xattr) &gt; INT_MAX)) {</div><div class='add'>+			printk(KERN_ERR "ea_get: extended attribute size too large: %u &gt; INT_MAX\n",</div><div class='add'>+			       EALIST_SIZE(ea_buf-&gt;xattr));</div><div class='add'>+		} else {</div><div class='add'>+			int size = clamp_t(int, ea_size, 0, EALIST_SIZE(ea_buf-&gt;xattr));</div><div class='add'>+</div><div class='add'>+			printk(KERN_ERR "ea_get: invalid extended attribute\n");</div><div class='add'>+			print_hex_dump(KERN_ERR, "", DUMP_PREFIX_ADDRESS, 16, 1,</div><div class='add'>+				       ea_buf-&gt;xattr, size, 1);</div><div class='add'>+		}</div><div class='ctx'> 		ea_release(inode, ea_buf);</div><div class='ctx'> 		rc = -EIO;</div><div class='ctx'> 		goto clean_up;</div><div class='hunk'>@@ -647,7 +656,7 @@ static int ea_put(tid_t tid, struct inode *inode, struct ea_buffer *ea_buf,</div><div class='ctx'> 	if (old_blocks)</div><div class='ctx'> 		dquot_free_block(inode, old_blocks);</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -795,7 +804,7 @@ ssize_t __jfs_getxattr(struct inode *inode, const char *name, void *data,</div><div class='ctx'> 		       size_t buf_size)</div><div class='ctx'> {</div><div class='ctx'> 	struct jfs_ea_list *ealist;</div><div class='del'>-	struct jfs_ea *ea;</div><div class='add'>+	struct jfs_ea *ea, *ealist_end;</div><div class='ctx'> 	struct ea_buffer ea_buf;</div><div class='ctx'> 	int xattr_size;</div><div class='ctx'> 	ssize_t size;</div><div class='hunk'>@@ -815,9 +824,16 @@ ssize_t __jfs_getxattr(struct inode *inode, const char *name, void *data,</div><div class='ctx'> 		goto not_found;</div><div class='ctx'> </div><div class='ctx'> 	ealist = (struct jfs_ea_list *) ea_buf.xattr;</div><div class='add'>+	ealist_end = END_EALIST(ealist);</div><div class='ctx'> </div><div class='ctx'> 	/* Find the named attribute */</div><div class='del'>-	for (ea = FIRST_EA(ealist); ea &lt; END_EALIST(ealist); ea = NEXT_EA(ea))</div><div class='add'>+	for (ea = FIRST_EA(ealist); ea &lt; ealist_end; ea = NEXT_EA(ea)) {</div><div class='add'>+		if (unlikely(ea + 1 &gt; ealist_end) ||</div><div class='add'>+		    unlikely(NEXT_EA(ea) &gt; ealist_end)) {</div><div class='add'>+			size = -EUCLEAN;</div><div class='add'>+			goto release;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		if ((namelen == ea-&gt;namelen) &amp;&amp;</div><div class='ctx'> 		    memcmp(name, ea-&gt;name, namelen) == 0) {</div><div class='ctx'> 			/* Found it */</div><div class='hunk'>@@ -832,6 +848,7 @@ ssize_t __jfs_getxattr(struct inode *inode, const char *name, void *data,</div><div class='ctx'> 			memcpy(data, value, size);</div><div class='ctx'> 			goto release;</div><div class='ctx'> 		}</div><div class='add'>+	}</div><div class='ctx'>       not_found:</div><div class='ctx'> 	size = -ENODATA;</div><div class='ctx'>       release:</div><div class='hunk'>@@ -859,7 +876,7 @@ ssize_t jfs_listxattr(struct dentry * dentry, char *data, size_t buf_size)</div><div class='ctx'> 	ssize_t size = 0;</div><div class='ctx'> 	int xattr_size;</div><div class='ctx'> 	struct jfs_ea_list *ealist;</div><div class='del'>-	struct jfs_ea *ea;</div><div class='add'>+	struct jfs_ea *ea, *ealist_end;</div><div class='ctx'> 	struct ea_buffer ea_buf;</div><div class='ctx'> </div><div class='ctx'> 	down_read(&amp;JFS_IP(inode)-&gt;xattr_sem);</div><div class='hunk'>@@ -874,9 +891,16 @@ ssize_t jfs_listxattr(struct dentry * dentry, char *data, size_t buf_size)</div><div class='ctx'> 		goto release;</div><div class='ctx'> </div><div class='ctx'> 	ealist = (struct jfs_ea_list *) ea_buf.xattr;</div><div class='add'>+	ealist_end = END_EALIST(ealist);</div><div class='ctx'> </div><div class='ctx'> 	/* compute required size of list */</div><div class='del'>-	for (ea = FIRST_EA(ealist); ea &lt; END_EALIST(ealist); ea = NEXT_EA(ea)) {</div><div class='add'>+	for (ea = FIRST_EA(ealist); ea &lt; ealist_end; ea = NEXT_EA(ea)) {</div><div class='add'>+		if (unlikely(ea + 1 &gt; ealist_end) ||</div><div class='add'>+		    unlikely(NEXT_EA(ea) &gt; ealist_end)) {</div><div class='add'>+			size = -EUCLEAN;</div><div class='add'>+			goto release;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		if (can_list(ea))</div><div class='ctx'> 			size += name_size(ea) + 1;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -932,7 +956,7 @@ static int jfs_xattr_get(const struct xattr_handler *handler,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int jfs_xattr_set(const struct xattr_handler *handler,</div><div class='del'>-			 struct user_namespace *mnt_userns,</div><div class='add'>+			 struct mnt_idmap *idmap,</div><div class='ctx'> 			 struct dentry *unused, struct inode *inode,</div><div class='ctx'> 			 const char *name, const void *value,</div><div class='ctx'> 			 size_t size, int flags)</div><div class='hunk'>@@ -951,7 +975,7 @@ static int jfs_xattr_get_os2(const struct xattr_handler *handler,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int jfs_xattr_set_os2(const struct xattr_handler *handler,</div><div class='del'>-			     struct user_namespace *mnt_userns,</div><div class='add'>+			     struct mnt_idmap *idmap,</div><div class='ctx'> 			     struct dentry *unused, struct inode *inode,</div><div class='ctx'> 			     const char *name, const void *value,</div><div class='ctx'> 			     size_t size, int flags)</div><div class='hunk'>@@ -985,11 +1009,7 @@ static const struct xattr_handler jfs_trusted_xattr_handler = {</div><div class='ctx'> 	.set = jfs_xattr_set,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-const struct xattr_handler *jfs_xattr_handlers[] = {</div><div class='del'>-#ifdef CONFIG_JFS_POSIX_ACL</div><div class='del'>-	&amp;posix_acl_access_xattr_handler,</div><div class='del'>-	&amp;posix_acl_default_xattr_handler,</div><div class='del'>-#endif</div><div class='add'>+const struct xattr_handler * const jfs_xattr_handlers[] = {</div><div class='ctx'> 	&amp;jfs_os2_xattr_handler,</div><div class='ctx'> 	&amp;jfs_user_xattr_handler,</div><div class='ctx'> 	&amp;jfs_security_xattr_handler,</div><div class='head'>diff --git a/fs/kernel_read_file.c b/fs/kernel_read_file.c<br/>index 1b07550485b9..de32c95d823d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/kernel_read_file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/kernel_read_file.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/kernel_read_file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/kernel_read_file.c</a></div><div class='hunk'>@@ -8,16 +8,16 @@</div><div class='ctx'> /**</div><div class='ctx'>  * kernel_read_file() - read file contents into a kernel buffer</div><div class='ctx'>  *</div><div class='del'>- * @file	file to read from</div><div class='del'>- * @offset	where to start reading from (see below).</div><div class='del'>- * @buf		pointer to a "void *" buffer for reading into (if</div><div class='add'>+ * @file:	file to read from</div><div class='add'>+ * @offset:	where to start reading from (see below).</div><div class='add'>+ * @buf:	pointer to a "void *" buffer for reading into (if</div><div class='ctx'>  *		*@buf is NULL, a buffer will be allocated, and</div><div class='ctx'>  *		@buf_size will be ignored)</div><div class='del'>- * @buf_size	size of buf, if already allocated. If @buf not</div><div class='add'>+ * @buf_size:	size of buf, if already allocated. If @buf not</div><div class='ctx'>  *		allocated, this is the largest size to allocate.</div><div class='del'>- * @file_size	if non-NULL, the full size of @file will be</div><div class='add'>+ * @file_size:	if non-NULL, the full size of @file will be</div><div class='ctx'>  *		written here.</div><div class='del'>- * @id		the kernel_read_file_id identifying the type of</div><div class='add'>+ * @id:		the kernel_read_file_id identifying the type of</div><div class='ctx'>  *		file contents being read (for LSMs to examine)</div><div class='ctx'>  *</div><div class='ctx'>  * @offset must be 0 unless both @buf and @file_size are non-NULL</div><div class='hunk'>@@ -29,15 +29,15 @@</div><div class='ctx'>  * change between calls to kernel_read_file().</div><div class='ctx'>  *</div><div class='ctx'>  * Returns number of bytes read (no single read will be bigger</div><div class='del'>- * than INT_MAX), or negative on error.</div><div class='add'>+ * than SSIZE_MAX), or negative on error.</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='del'>-int kernel_read_file(struct file *file, loff_t offset, void **buf,</div><div class='del'>-		     size_t buf_size, size_t *file_size,</div><div class='del'>-		     enum kernel_read_file_id id)</div><div class='add'>+ssize_t kernel_read_file(struct file *file, loff_t offset, void **buf,</div><div class='add'>+			 size_t buf_size, size_t *file_size,</div><div class='add'>+			 enum kernel_read_file_id id)</div><div class='ctx'> {</div><div class='ctx'> 	loff_t i_size, pos;</div><div class='del'>-	size_t copied;</div><div class='add'>+	ssize_t copied;</div><div class='ctx'> 	void *allocated = NULL;</div><div class='ctx'> 	bool whole_file;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -58,7 +58,7 @@ int kernel_read_file(struct file *file, loff_t offset, void **buf,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	/* The file is too big for sane activities. */</div><div class='del'>-	if (i_size &gt; INT_MAX) {</div><div class='add'>+	if (i_size &gt; SSIZE_MAX) {</div><div class='ctx'> 		ret = -EFBIG;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -124,12 +124,12 @@ out:</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(kernel_read_file);</div><div class='ctx'> </div><div class='del'>-int kernel_read_file_from_path(const char *path, loff_t offset, void **buf,</div><div class='del'>-			       size_t buf_size, size_t *file_size,</div><div class='del'>-			       enum kernel_read_file_id id)</div><div class='add'>+ssize_t kernel_read_file_from_path(const char *path, loff_t offset, void **buf,</div><div class='add'>+				   size_t buf_size, size_t *file_size,</div><div class='add'>+				   enum kernel_read_file_id id)</div><div class='ctx'> {</div><div class='ctx'> 	struct file *file;</div><div class='del'>-	int ret;</div><div class='add'>+	ssize_t ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!path || !*path)</div><div class='ctx'> 		return -EINVAL;</div><div class='hunk'>@@ -144,14 +144,14 @@ int kernel_read_file_from_path(const char *path, loff_t offset, void **buf,</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(kernel_read_file_from_path);</div><div class='ctx'> </div><div class='del'>-int kernel_read_file_from_path_initns(const char *path, loff_t offset,</div><div class='del'>-				      void **buf, size_t buf_size,</div><div class='del'>-				      size_t *file_size,</div><div class='del'>-				      enum kernel_read_file_id id)</div><div class='add'>+ssize_t kernel_read_file_from_path_initns(const char *path, loff_t offset,</div><div class='add'>+					  void **buf, size_t buf_size,</div><div class='add'>+					  size_t *file_size,</div><div class='add'>+					  enum kernel_read_file_id id)</div><div class='ctx'> {</div><div class='ctx'> 	struct file *file;</div><div class='ctx'> 	struct path root;</div><div class='del'>-	int ret;</div><div class='add'>+	ssize_t ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!path || !*path)</div><div class='ctx'> 		return -EINVAL;</div><div class='hunk'>@@ -171,19 +171,15 @@ int kernel_read_file_from_path_initns(const char *path, loff_t offset,</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(kernel_read_file_from_path_initns);</div><div class='ctx'> </div><div class='del'>-int kernel_read_file_from_fd(int fd, loff_t offset, void **buf,</div><div class='del'>-			     size_t buf_size, size_t *file_size,</div><div class='del'>-			     enum kernel_read_file_id id)</div><div class='add'>+ssize_t kernel_read_file_from_fd(int fd, loff_t offset, void **buf,</div><div class='add'>+				 size_t buf_size, size_t *file_size,</div><div class='add'>+				 enum kernel_read_file_id id)</div><div class='ctx'> {</div><div class='del'>-	struct fd f = fdget(fd);</div><div class='del'>-	int ret = -EBADF;</div><div class='add'>+	CLASS(fd, f)(fd);</div><div class='ctx'> </div><div class='del'>-	if (!f.file || !(f.file-&gt;f_mode &amp; FMODE_READ))</div><div class='del'>-		goto out;</div><div class='add'>+	if (fd_empty(f) || !(fd_file(f)-&gt;f_mode &amp; FMODE_READ))</div><div class='add'>+		return -EBADF;</div><div class='ctx'> </div><div class='del'>-	ret = kernel_read_file(f.file, offset, buf, buf_size, file_size, id);</div><div class='del'>-out:</div><div class='del'>-	fdput(f);</div><div class='del'>-	return ret;</div><div class='add'>+	return kernel_read_file(fd_file(f), offset, buf, buf_size, file_size, id);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(kernel_read_file_from_fd);</div><div class='head'>diff --git a/fs/kernfs/dir.c b/fs/kernfs/dir.c<br/>index 8e0a1378a4b1..5c0efd6b239f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/kernfs/dir.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/kernfs/dir.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/kernfs/dir.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/kernfs/dir.c</a></div><div class='hunk'>@@ -17,19 +17,29 @@</div><div class='ctx'> </div><div class='ctx'> #include "kernfs-internal.h"</div><div class='ctx'> </div><div class='del'>-DECLARE_RWSEM(kernfs_rwsem);</div><div class='del'>-static DEFINE_SPINLOCK(kernfs_rename_lock);	/* kn-&gt;parent and -&gt;name */</div><div class='del'>-static char kernfs_pr_cont_buf[PATH_MAX];	/* protected by rename_lock */</div><div class='del'>-static DEFINE_SPINLOCK(kernfs_idr_lock);	/* root-&gt;ino_idr */</div><div class='add'>+/*</div><div class='add'>+ * Don't use rename_lock to piggy back on pr_cont_buf. We don't want to</div><div class='add'>+ * call pr_cont() while holding rename_lock. Because sometimes pr_cont()</div><div class='add'>+ * will perform wakeups when releasing console_sem. Holding rename_lock</div><div class='add'>+ * will introduce deadlock if the scheduler reads the kernfs_name in the</div><div class='add'>+ * wakeup path.</div><div class='add'>+ */</div><div class='add'>+static DEFINE_SPINLOCK(kernfs_pr_cont_lock);</div><div class='add'>+static char kernfs_pr_cont_buf[PATH_MAX];	/* protected by pr_cont_lock */</div><div class='ctx'> </div><div class='ctx'> #define rb_to_kn(X) rb_entry((X), struct kernfs_node, rb)</div><div class='ctx'> </div><div class='del'>-static bool kernfs_active(struct kernfs_node *kn)</div><div class='add'>+static bool __kernfs_active(struct kernfs_node *kn)</div><div class='ctx'> {</div><div class='del'>-	lockdep_assert_held(&amp;kernfs_rwsem);</div><div class='ctx'> 	return atomic_read(&amp;kn-&gt;active) &gt;= 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool kernfs_active(struct kernfs_node *kn)</div><div class='add'>+{</div><div class='add'>+	lockdep_assert_held(&amp;kernfs_root(kn)-&gt;kernfs_rwsem);</div><div class='add'>+	return __kernfs_active(kn);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static bool kernfs_lockdep(struct kernfs_node *kn)</div><div class='ctx'> {</div><div class='ctx'> #ifdef CONFIG_DEBUG_LOCK_ALLOC</div><div class='hunk'>@@ -39,22 +49,14 @@ static bool kernfs_lockdep(struct kernfs_node *kn)</div><div class='ctx'> #endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int kernfs_name_locked(struct kernfs_node *kn, char *buf, size_t buflen)</div><div class='del'>-{</div><div class='del'>-	if (!kn)</div><div class='del'>-		return strlcpy(buf, "(null)", buflen);</div><div class='del'>-</div><div class='del'>-	return strlcpy(buf, kn-&gt;parent ? kn-&gt;name : "/", buflen);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /* kernfs_node_depth - compute depth from @from to @to */</div><div class='ctx'> static size_t kernfs_depth(struct kernfs_node *from, struct kernfs_node *to)</div><div class='ctx'> {</div><div class='ctx'> 	size_t depth = 0;</div><div class='ctx'> </div><div class='del'>-	while (to-&gt;parent &amp;&amp; to != from) {</div><div class='add'>+	while (rcu_dereference(to-&gt;__parent) &amp;&amp; to != from) {</div><div class='ctx'> 		depth++;</div><div class='del'>-		to = to-&gt;parent;</div><div class='add'>+		to = rcu_dereference(to-&gt;__parent);</div><div class='ctx'> 	}</div><div class='ctx'> 	return depth;</div><div class='ctx'> }</div><div class='hunk'>@@ -72,18 +74,18 @@ static struct kernfs_node *kernfs_common_ancestor(struct kernfs_node *a,</div><div class='ctx'> 	db = kernfs_depth(rb-&gt;kn, b);</div><div class='ctx'> </div><div class='ctx'> 	while (da &gt; db) {</div><div class='del'>-		a = a-&gt;parent;</div><div class='add'>+		a = rcu_dereference(a-&gt;__parent);</div><div class='ctx'> 		da--;</div><div class='ctx'> 	}</div><div class='ctx'> 	while (db &gt; da) {</div><div class='del'>-		b = b-&gt;parent;</div><div class='add'>+		b = rcu_dereference(b-&gt;__parent);</div><div class='ctx'> 		db--;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* worst case b and a will be the same at root */</div><div class='ctx'> 	while (b != a) {</div><div class='del'>-		b = b-&gt;parent;</div><div class='del'>-		a = a-&gt;parent;</div><div class='add'>+		b = rcu_dereference(b-&gt;__parent);</div><div class='add'>+		a = rcu_dereference(a-&gt;__parent);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return a;</div><div class='hunk'>@@ -113,9 +115,9 @@ static struct kernfs_node *kernfs_common_ancestor(struct kernfs_node *a,</div><div class='ctx'>  * kn_to:   /n1/n2/n3         [depth=3]</div><div class='ctx'>  * result:  /../..</div><div class='ctx'>  *</div><div class='del'>- * [3] when @kn_to is NULL result will be "(null)"</div><div class='add'>+ * [3] when @kn_to is %NULL result will be "(null)"</div><div class='ctx'>  *</div><div class='del'>- * Returns the length of the full path.  If the full length is equal to or</div><div class='add'>+ * Return: the length of the constructed path.  If the path would have been</div><div class='ctx'>  * greater than @buflen, @buf contains the truncated path with the trailing</div><div class='ctx'>  * '\0'.  On error, -errno is returned.</div><div class='ctx'>  */</div><div class='hunk'>@@ -126,19 +128,17 @@ static int kernfs_path_from_node_locked(struct kernfs_node *kn_to,</div><div class='ctx'> 	struct kernfs_node *kn, *common;</div><div class='ctx'> 	const char parent_str[] = "/..";</div><div class='ctx'> 	size_t depth_from, depth_to, len = 0;</div><div class='add'>+	ssize_t copied;</div><div class='ctx'> 	int i, j;</div><div class='ctx'> </div><div class='ctx'> 	if (!kn_to)</div><div class='del'>-		return strlcpy(buf, "(null)", buflen);</div><div class='add'>+		return strscpy(buf, "(null)", buflen);</div><div class='ctx'> </div><div class='ctx'> 	if (!kn_from)</div><div class='ctx'> 		kn_from = kernfs_root(kn_to)-&gt;kn;</div><div class='ctx'> </div><div class='ctx'> 	if (kn_from == kn_to)</div><div class='del'>-		return strlcpy(buf, "/", buflen);</div><div class='del'>-</div><div class='del'>-	if (!buf)</div><div class='del'>-		return -EINVAL;</div><div class='add'>+		return strscpy(buf, "/", buflen);</div><div class='ctx'> </div><div class='ctx'> 	common = kernfs_common_ancestor(kn_from, kn_to);</div><div class='ctx'> 	if (WARN_ON(!common))</div><div class='hunk'>@@ -149,18 +149,22 @@ static int kernfs_path_from_node_locked(struct kernfs_node *kn_to,</div><div class='ctx'> </div><div class='ctx'> 	buf[0] = '\0';</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; depth_from; i++)</div><div class='del'>-		len += strlcpy(buf + len, parent_str,</div><div class='del'>-			       len &lt; buflen ? buflen - len : 0);</div><div class='add'>+	for (i = 0; i &lt; depth_from; i++) {</div><div class='add'>+		copied = strscpy(buf + len, parent_str, buflen - len);</div><div class='add'>+		if (copied &lt; 0)</div><div class='add'>+			return copied;</div><div class='add'>+		len += copied;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* Calculate how many bytes we need for the rest */</div><div class='ctx'> 	for (i = depth_to - 1; i &gt;= 0; i--) {</div><div class='add'>+		const char *name;</div><div class='add'>+</div><div class='ctx'> 		for (kn = kn_to, j = 0; j &lt; i; j++)</div><div class='del'>-			kn = kn-&gt;parent;</div><div class='del'>-		len += strlcpy(buf + len, "/",</div><div class='del'>-			       len &lt; buflen ? buflen - len : 0);</div><div class='del'>-		len += strlcpy(buf + len, kn-&gt;name,</div><div class='del'>-			       len &lt; buflen ? buflen - len : 0);</div><div class='add'>+			kn = rcu_dereference(kn-&gt;__parent);</div><div class='add'>+</div><div class='add'>+		name = rcu_dereference(kn-&gt;name);</div><div class='add'>+		len += scnprintf(buf + len, buflen - len, "/%s", name);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return len;</div><div class='hunk'>@@ -173,22 +177,29 @@ static int kernfs_path_from_node_locked(struct kernfs_node *kn_to,</div><div class='ctx'>  * @buflen: size of @buf</div><div class='ctx'>  *</div><div class='ctx'>  * Copies the name of @kn into @buf of @buflen bytes.  The behavior is</div><div class='del'>- * similar to strlcpy().  It returns the length of @kn's name and if @buf</div><div class='del'>- * isn't long enough, it's filled upto @buflen-1 and nul terminated.</div><div class='add'>+ * similar to strscpy().</div><div class='add'>+ *</div><div class='add'>+ * Fills buffer with "(null)" if @kn is %NULL.</div><div class='ctx'>  *</div><div class='del'>- * Fills buffer with "(null)" if @kn is NULL.</div><div class='add'>+ * Return: the resulting length of @buf. If @buf isn't long enough,</div><div class='add'>+ * it's filled up to @buflen-1 and nul terminated, and returns -E2BIG.</div><div class='ctx'>  *</div><div class='ctx'>  * This function can be called from any context.</div><div class='ctx'>  */</div><div class='ctx'> int kernfs_name(struct kernfs_node *kn, char *buf, size_t buflen)</div><div class='ctx'> {</div><div class='del'>-	unsigned long flags;</div><div class='del'>-	int ret;</div><div class='add'>+	struct kernfs_node *kn_parent;</div><div class='ctx'> </div><div class='del'>-	spin_lock_irqsave(&amp;kernfs_rename_lock, flags);</div><div class='del'>-	ret = kernfs_name_locked(kn, buf, buflen);</div><div class='del'>-	spin_unlock_irqrestore(&amp;kernfs_rename_lock, flags);</div><div class='del'>-	return ret;</div><div class='add'>+	if (!kn)</div><div class='add'>+		return strscpy(buf, "(null)", buflen);</div><div class='add'>+</div><div class='add'>+	guard(rcu)();</div><div class='add'>+	/*</div><div class='add'>+	 * KERNFS_ROOT_INVARIANT_PARENT is ignored here. The name is RCU freed and</div><div class='add'>+	 * the parent is either existing or not.</div><div class='add'>+	 */</div><div class='add'>+	kn_parent = rcu_dereference(kn-&gt;__parent);</div><div class='add'>+	return strscpy(buf, kn_parent ? rcu_dereference(kn-&gt;name) : "/", buflen);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -203,20 +214,24 @@ int kernfs_name(struct kernfs_node *kn, char *buf, size_t buflen)</div><div class='ctx'>  * path (which includes '..'s) as needed to reach from @from to @to is</div><div class='ctx'>  * returned.</div><div class='ctx'>  *</div><div class='del'>- * Returns the length of the full path.  If the full length is equal to or</div><div class='add'>+ * Return: the length of the constructed path.  If the path would have been</div><div class='ctx'>  * greater than @buflen, @buf contains the truncated path with the trailing</div><div class='ctx'>  * '\0'.  On error, -errno is returned.</div><div class='ctx'>  */</div><div class='ctx'> int kernfs_path_from_node(struct kernfs_node *to, struct kernfs_node *from,</div><div class='ctx'> 			  char *buf, size_t buflen)</div><div class='ctx'> {</div><div class='del'>-	unsigned long flags;</div><div class='del'>-	int ret;</div><div class='add'>+	struct kernfs_root *root;</div><div class='ctx'> </div><div class='del'>-	spin_lock_irqsave(&amp;kernfs_rename_lock, flags);</div><div class='del'>-	ret = kernfs_path_from_node_locked(to, from, buf, buflen);</div><div class='del'>-	spin_unlock_irqrestore(&amp;kernfs_rename_lock, flags);</div><div class='del'>-	return ret;</div><div class='add'>+	guard(rcu)();</div><div class='add'>+	if (to) {</div><div class='add'>+		root = kernfs_root(to);</div><div class='add'>+		if (!(root-&gt;flags &amp; KERNFS_ROOT_INVARIANT_PARENT)) {</div><div class='add'>+			guard(read_lock_irqsave)(&amp;root-&gt;kernfs_rename_lock);</div><div class='add'>+			return kernfs_path_from_node_locked(to, from, buf, buflen);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	return kernfs_path_from_node_locked(to, from, buf, buflen);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(kernfs_path_from_node);</div><div class='ctx'> </div><div class='hunk'>@@ -230,12 +245,12 @@ void pr_cont_kernfs_name(struct kernfs_node *kn)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> </div><div class='del'>-	spin_lock_irqsave(&amp;kernfs_rename_lock, flags);</div><div class='add'>+	spin_lock_irqsave(&amp;kernfs_pr_cont_lock, flags);</div><div class='ctx'> </div><div class='del'>-	kernfs_name_locked(kn, kernfs_pr_cont_buf, sizeof(kernfs_pr_cont_buf));</div><div class='add'>+	kernfs_name(kn, kernfs_pr_cont_buf, sizeof(kernfs_pr_cont_buf));</div><div class='ctx'> 	pr_cont("%s", kernfs_pr_cont_buf);</div><div class='ctx'> </div><div class='del'>-	spin_unlock_irqrestore(&amp;kernfs_rename_lock, flags);</div><div class='add'>+	spin_unlock_irqrestore(&amp;kernfs_pr_cont_lock, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -249,24 +264,22 @@ void pr_cont_kernfs_path(struct kernfs_node *kn)</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> 	int sz;</div><div class='ctx'> </div><div class='del'>-	spin_lock_irqsave(&amp;kernfs_rename_lock, flags);</div><div class='add'>+	spin_lock_irqsave(&amp;kernfs_pr_cont_lock, flags);</div><div class='ctx'> </div><div class='del'>-	sz = kernfs_path_from_node_locked(kn, NULL, kernfs_pr_cont_buf,</div><div class='del'>-					  sizeof(kernfs_pr_cont_buf));</div><div class='add'>+	sz = kernfs_path_from_node(kn, NULL, kernfs_pr_cont_buf,</div><div class='add'>+				   sizeof(kernfs_pr_cont_buf));</div><div class='ctx'> 	if (sz &lt; 0) {</div><div class='del'>-		pr_cont("(error)");</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (sz &gt;= sizeof(kernfs_pr_cont_buf)) {</div><div class='del'>-		pr_cont("(name too long)");</div><div class='add'>+		if (sz == -E2BIG)</div><div class='add'>+			pr_cont("(name too long)");</div><div class='add'>+		else</div><div class='add'>+			pr_cont("(error)");</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	pr_cont("%s", kernfs_pr_cont_buf);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	spin_unlock_irqrestore(&amp;kernfs_rename_lock, flags);</div><div class='add'>+	spin_unlock_irqrestore(&amp;kernfs_pr_cont_lock, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -275,26 +288,30 @@ out:</div><div class='ctx'>  *</div><div class='ctx'>  * Determines @kn's parent, pins and returns it.  This function can be</div><div class='ctx'>  * called from any context.</div><div class='add'>+ *</div><div class='add'>+ * Return: parent node of @kn</div><div class='ctx'>  */</div><div class='ctx'> struct kernfs_node *kernfs_get_parent(struct kernfs_node *kn)</div><div class='ctx'> {</div><div class='ctx'> 	struct kernfs_node *parent;</div><div class='add'>+	struct kernfs_root *root;</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> </div><div class='del'>-	spin_lock_irqsave(&amp;kernfs_rename_lock, flags);</div><div class='del'>-	parent = kn-&gt;parent;</div><div class='add'>+	root = kernfs_root(kn);</div><div class='add'>+	read_lock_irqsave(&amp;root-&gt;kernfs_rename_lock, flags);</div><div class='add'>+	parent = kernfs_parent(kn);</div><div class='ctx'> 	kernfs_get(parent);</div><div class='del'>-	spin_unlock_irqrestore(&amp;kernfs_rename_lock, flags);</div><div class='add'>+	read_unlock_irqrestore(&amp;root-&gt;kernfs_rename_lock, flags);</div><div class='ctx'> </div><div class='ctx'> 	return parent;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- *	kernfs_name_hash</div><div class='add'>+ *	kernfs_name_hash - calculate hash of @ns + @name</div><div class='ctx'>  *	@name: Null terminated string to hash</div><div class='ctx'>  *	@ns:   Namespace tag to hash</div><div class='ctx'>  *</div><div class='del'>- *	Returns 31 bit hash of ns + name (so it fits in an off_t )</div><div class='add'>+ *	Return: 31-bit hash of ns + name (so it fits in an off_t)</div><div class='ctx'>  */</div><div class='ctx'> static unsigned int kernfs_name_hash(const char *name, const void *ns)</div><div class='ctx'> {</div><div class='hunk'>@@ -323,13 +340,13 @@ static int kernfs_name_compare(unsigned int hash, const char *name,</div><div class='ctx'> 		return -1;</div><div class='ctx'> 	if (ns &gt; kn-&gt;ns)</div><div class='ctx'> 		return 1;</div><div class='del'>-	return strcmp(name, kn-&gt;name);</div><div class='add'>+	return strcmp(name, kernfs_rcu_name(kn));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int kernfs_sd_compare(const struct kernfs_node *left,</div><div class='ctx'> 			     const struct kernfs_node *right)</div><div class='ctx'> {</div><div class='del'>-	return kernfs_name_compare(left-&gt;hash, left-&gt;name, left-&gt;ns, right);</div><div class='add'>+	return kernfs_name_compare(left-&gt;hash, kernfs_rcu_name(left), left-&gt;ns, right);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -342,13 +359,17 @@ static int kernfs_sd_compare(const struct kernfs_node *left,</div><div class='ctx'>  *	Locking:</div><div class='ctx'>  *	kernfs_rwsem held exclusive</div><div class='ctx'>  *</div><div class='del'>- *	RETURNS:</div><div class='del'>- *	0 on susccess -EEXIST on failure.</div><div class='add'>+ *	Return:</div><div class='add'>+ *	%0 on success, -EEXIST on failure.</div><div class='ctx'>  */</div><div class='ctx'> static int kernfs_link_sibling(struct kernfs_node *kn)</div><div class='ctx'> {</div><div class='del'>-	struct rb_node **node = &amp;kn-&gt;parent-&gt;dir.children.rb_node;</div><div class='ctx'> 	struct rb_node *parent = NULL;</div><div class='add'>+	struct kernfs_node *kn_parent;</div><div class='add'>+	struct rb_node **node;</div><div class='add'>+</div><div class='add'>+	kn_parent = kernfs_parent(kn);</div><div class='add'>+	node = &amp;kn_parent-&gt;dir.children.rb_node;</div><div class='ctx'> </div><div class='ctx'> 	while (*node) {</div><div class='ctx'> 		struct kernfs_node *pos;</div><div class='hunk'>@@ -367,12 +388,14 @@ static int kernfs_link_sibling(struct kernfs_node *kn)</div><div class='ctx'> </div><div class='ctx'> 	/* add new node and rebalance the tree */</div><div class='ctx'> 	rb_link_node(&amp;kn-&gt;rb, parent, node);</div><div class='del'>-	rb_insert_color(&amp;kn-&gt;rb, &amp;kn-&gt;parent-&gt;dir.children);</div><div class='add'>+	rb_insert_color(&amp;kn-&gt;rb, &amp;kn_parent-&gt;dir.children);</div><div class='ctx'> </div><div class='ctx'> 	/* successfully added, account subdir number */</div><div class='add'>+	down_write(&amp;kernfs_root(kn)-&gt;kernfs_iattr_rwsem);</div><div class='ctx'> 	if (kernfs_type(kn) == KERNFS_DIR)</div><div class='del'>-		kn-&gt;parent-&gt;dir.subdirs++;</div><div class='del'>-	kernfs_inc_rev(kn-&gt;parent);</div><div class='add'>+		kn_parent-&gt;dir.subdirs++;</div><div class='add'>+	kernfs_inc_rev(kn_parent);</div><div class='add'>+	up_write(&amp;kernfs_root(kn)-&gt;kernfs_iattr_rwsem);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -382,22 +405,29 @@ static int kernfs_link_sibling(struct kernfs_node *kn)</div><div class='ctx'>  *	@kn: kernfs_node of interest</div><div class='ctx'>  *</div><div class='ctx'>  *	Try to unlink @kn from its sibling rbtree which starts from</div><div class='del'>- *	kn-&gt;parent-&gt;dir.children.  Returns %true if @kn was actually</div><div class='del'>- *	removed, %false if @kn wasn't on the rbtree.</div><div class='add'>+ *	kn-&gt;parent-&gt;dir.children.</div><div class='add'>+ *</div><div class='add'>+ *	Return: %true if @kn was actually removed,</div><div class='add'>+ *	%false if @kn wasn't on the rbtree.</div><div class='ctx'>  *</div><div class='ctx'>  *	Locking:</div><div class='ctx'>  *	kernfs_rwsem held exclusive</div><div class='ctx'>  */</div><div class='ctx'> static bool kernfs_unlink_sibling(struct kernfs_node *kn)</div><div class='ctx'> {</div><div class='add'>+	struct kernfs_node *kn_parent;</div><div class='add'>+</div><div class='ctx'> 	if (RB_EMPTY_NODE(&amp;kn-&gt;rb))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='add'>+	kn_parent = kernfs_parent(kn);</div><div class='add'>+	down_write(&amp;kernfs_root(kn)-&gt;kernfs_iattr_rwsem);</div><div class='ctx'> 	if (kernfs_type(kn) == KERNFS_DIR)</div><div class='del'>-		kn-&gt;parent-&gt;dir.subdirs--;</div><div class='del'>-	kernfs_inc_rev(kn-&gt;parent);</div><div class='add'>+		kn_parent-&gt;dir.subdirs--;</div><div class='add'>+	kernfs_inc_rev(kn_parent);</div><div class='add'>+	up_write(&amp;kernfs_root(kn)-&gt;kernfs_iattr_rwsem);</div><div class='ctx'> </div><div class='del'>-	rb_erase(&amp;kn-&gt;rb, &amp;kn-&gt;parent-&gt;dir.children);</div><div class='add'>+	rb_erase(&amp;kn-&gt;rb, &amp;kn_parent-&gt;dir.children);</div><div class='ctx'> 	RB_CLEAR_NODE(&amp;kn-&gt;rb);</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='hunk'>@@ -407,10 +437,10 @@ static bool kernfs_unlink_sibling(struct kernfs_node *kn)</div><div class='ctx'>  *	@kn: kernfs_node to get an active reference to</div><div class='ctx'>  *</div><div class='ctx'>  *	Get an active reference of @kn.  This function is noop if @kn</div><div class='del'>- *	is NULL.</div><div class='add'>+ *	is %NULL.</div><div class='ctx'>  *</div><div class='del'>- *	RETURNS:</div><div class='del'>- *	Pointer to @kn on success, NULL on failure.</div><div class='add'>+ *	Return:</div><div class='add'>+ *	Pointer to @kn on success, %NULL on failure.</div><div class='ctx'>  */</div><div class='ctx'> struct kernfs_node *kernfs_get_active(struct kernfs_node *kn)</div><div class='ctx'> {</div><div class='hunk'>@@ -430,7 +460,7 @@ struct kernfs_node *kernfs_get_active(struct kernfs_node *kn)</div><div class='ctx'>  *	@kn: kernfs_node to put an active reference to</div><div class='ctx'>  *</div><div class='ctx'>  *	Put an active reference to @kn.  This function is noop if @kn</div><div class='del'>- *	is NULL.</div><div class='add'>+ *	is %NULL.</div><div class='ctx'>  */</div><div class='ctx'> void kernfs_put_active(struct kernfs_node *kn)</div><div class='ctx'> {</div><div class='hunk'>@@ -452,19 +482,30 @@ void kernfs_put_active(struct kernfs_node *kn)</div><div class='ctx'>  * kernfs_drain - drain kernfs_node</div><div class='ctx'>  * @kn: kernfs_node to drain</div><div class='ctx'>  *</div><div class='del'>- * Drain existing usages and nuke all existing mmaps of @kn.  Mutiple</div><div class='add'>+ * Drain existing usages and nuke all existing mmaps of @kn.  Multiple</div><div class='ctx'>  * removers may invoke this function concurrently on @kn and all will</div><div class='ctx'>  * return after draining is complete.</div><div class='ctx'>  */</div><div class='ctx'> static void kernfs_drain(struct kernfs_node *kn)</div><div class='del'>-	__releases(&amp;kernfs_rwsem) __acquires(&amp;kernfs_rwsem)</div><div class='add'>+	__releases(&amp;kernfs_root(kn)-&gt;kernfs_rwsem)</div><div class='add'>+	__acquires(&amp;kernfs_root(kn)-&gt;kernfs_rwsem)</div><div class='ctx'> {</div><div class='ctx'> 	struct kernfs_root *root = kernfs_root(kn);</div><div class='ctx'> </div><div class='del'>-	lockdep_assert_held_write(&amp;kernfs_rwsem);</div><div class='add'>+	lockdep_assert_held_write(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> 	WARN_ON_ONCE(kernfs_active(kn));</div><div class='ctx'> </div><div class='del'>-	up_write(&amp;kernfs_rwsem);</div><div class='add'>+	/*</div><div class='add'>+	 * Skip draining if already fully drained. This avoids draining and its</div><div class='add'>+	 * lockdep annotations for nodes which have never been activated</div><div class='add'>+	 * allowing embedding kernfs_remove() in create error paths without</div><div class='add'>+	 * worrying about draining.</div><div class='add'>+	 */</div><div class='add'>+	if (atomic_read(&amp;kn-&gt;active) == KN_DEACTIVATED_BIAS &amp;&amp;</div><div class='add'>+	    !kernfs_should_drain_open_files(kn))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	up_write(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> </div><div class='ctx'> 	if (kernfs_lockdep(kn)) {</div><div class='ctx'> 		rwsem_acquire(&amp;kn-&gt;dep_map, 0, 0, _RET_IP_);</div><div class='hunk'>@@ -472,7 +513,6 @@ static void kernfs_drain(struct kernfs_node *kn)</div><div class='ctx'> 			lock_contended(&amp;kn-&gt;dep_map, _RET_IP_);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* but everyone should wait for draining */</div><div class='ctx'> 	wait_event(root-&gt;deactivate_waitq,</div><div class='ctx'> 		   atomic_read(&amp;kn-&gt;active) == KN_DEACTIVATED_BIAS);</div><div class='ctx'> </div><div class='hunk'>@@ -481,9 +521,10 @@ static void kernfs_drain(struct kernfs_node *kn)</div><div class='ctx'> 		rwsem_release(&amp;kn-&gt;dep_map, _RET_IP_);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	kernfs_drain_open_files(kn);</div><div class='add'>+	if (kernfs_should_drain_open_files(kn))</div><div class='add'>+		kernfs_drain_open_files(kn);</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;kernfs_rwsem);</div><div class='add'>+	down_write(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -499,6 +540,21 @@ void kernfs_get(struct kernfs_node *kn)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(kernfs_get);</div><div class='ctx'> </div><div class='add'>+static void kernfs_free_rcu(struct rcu_head *rcu)</div><div class='add'>+{</div><div class='add'>+	struct kernfs_node *kn = container_of(rcu, struct kernfs_node, rcu);</div><div class='add'>+</div><div class='add'>+	/* If the whole node goes away, then name can't be used outside */</div><div class='add'>+	kfree_const(rcu_access_pointer(kn-&gt;name));</div><div class='add'>+</div><div class='add'>+	if (kn-&gt;iattr) {</div><div class='add'>+		simple_xattrs_free(&amp;kn-&gt;iattr-&gt;xattrs, NULL);</div><div class='add'>+		kmem_cache_free(kernfs_iattrs_cache, kn-&gt;iattr);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	kmem_cache_free(kernfs_node_cache, kn);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /**</div><div class='ctx'>  * kernfs_put - put a reference count on a kernfs_node</div><div class='ctx'>  * @kn: the target kernfs_node</div><div class='hunk'>@@ -518,25 +574,21 @@ void kernfs_put(struct kernfs_node *kn)</div><div class='ctx'> 	 * Moving/renaming is always done while holding reference.</div><div class='ctx'> 	 * kn-&gt;parent won't change beneath us.</div><div class='ctx'> 	 */</div><div class='del'>-	parent = kn-&gt;parent;</div><div class='add'>+	parent = kernfs_parent(kn);</div><div class='ctx'> </div><div class='ctx'> 	WARN_ONCE(atomic_read(&amp;kn-&gt;active) != KN_DEACTIVATED_BIAS,</div><div class='ctx'> 		  "kernfs_put: %s/%s: released with incorrect active_ref %d\n",</div><div class='del'>-		  parent ? parent-&gt;name : "", kn-&gt;name, atomic_read(&amp;kn-&gt;active));</div><div class='add'>+		  parent ? rcu_dereference(parent-&gt;name) : "",</div><div class='add'>+		  rcu_dereference(kn-&gt;name), atomic_read(&amp;kn-&gt;active));</div><div class='ctx'> </div><div class='ctx'> 	if (kernfs_type(kn) == KERNFS_LINK)</div><div class='ctx'> 		kernfs_put(kn-&gt;symlink.target_kn);</div><div class='ctx'> </div><div class='del'>-	kfree_const(kn-&gt;name);</div><div class='del'>-</div><div class='del'>-	if (kn-&gt;iattr) {</div><div class='del'>-		simple_xattrs_free(&amp;kn-&gt;iattr-&gt;xattrs);</div><div class='del'>-		kmem_cache_free(kernfs_iattrs_cache, kn-&gt;iattr);</div><div class='del'>-	}</div><div class='del'>-	spin_lock(&amp;kernfs_idr_lock);</div><div class='add'>+	spin_lock(&amp;root-&gt;kernfs_idr_lock);</div><div class='ctx'> 	idr_remove(&amp;root-&gt;ino_idr, (u32)kernfs_ino(kn));</div><div class='del'>-	spin_unlock(&amp;kernfs_idr_lock);</div><div class='del'>-	kmem_cache_free(kernfs_node_cache, kn);</div><div class='add'>+	spin_unlock(&amp;root-&gt;kernfs_idr_lock);</div><div class='add'>+</div><div class='add'>+	call_rcu(&amp;kn-&gt;rcu, kernfs_free_rcu);</div><div class='ctx'> </div><div class='ctx'> 	kn = parent;</div><div class='ctx'> 	if (kn) {</div><div class='hunk'>@@ -545,7 +597,7 @@ void kernfs_put(struct kernfs_node *kn)</div><div class='ctx'> 	} else {</div><div class='ctx'> 		/* just released the root kn, free @root too */</div><div class='ctx'> 		idr_destroy(&amp;root-&gt;ino_idr);</div><div class='del'>-		kfree(root);</div><div class='add'>+		kfree_rcu(root, rcu);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(kernfs_put);</div><div class='hunk'>@@ -554,7 +606,7 @@ EXPORT_SYMBOL_GPL(kernfs_put);</div><div class='ctx'>  * kernfs_node_from_dentry - determine kernfs_node associated with a dentry</div><div class='ctx'>  * @dentry: the dentry in question</div><div class='ctx'>  *</div><div class='del'>- * Return the kernfs_node associated with @dentry.  If @dentry is not a</div><div class='add'>+ * Return: the kernfs_node associated with @dentry.  If @dentry is not a</div><div class='ctx'>  * kernfs one, %NULL is returned.</div><div class='ctx'>  *</div><div class='ctx'>  * While the returned kernfs_node will stay accessible as long as @dentry</div><div class='hunk'>@@ -587,13 +639,13 @@ static struct kernfs_node *__kernfs_new_node(struct kernfs_root *root,</div><div class='ctx'> 		goto err_out1;</div><div class='ctx'> </div><div class='ctx'> 	idr_preload(GFP_KERNEL);</div><div class='del'>-	spin_lock(&amp;kernfs_idr_lock);</div><div class='add'>+	spin_lock(&amp;root-&gt;kernfs_idr_lock);</div><div class='ctx'> 	ret = idr_alloc_cyclic(&amp;root-&gt;ino_idr, kn, 1, 0, GFP_ATOMIC);</div><div class='ctx'> 	if (ret &gt;= 0 &amp;&amp; ret &lt; root-&gt;last_id_lowbits)</div><div class='ctx'> 		root-&gt;id_highbits++;</div><div class='ctx'> 	id_highbits = root-&gt;id_highbits;</div><div class='ctx'> 	root-&gt;last_id_lowbits = ret;</div><div class='del'>-	spin_unlock(&amp;kernfs_idr_lock);</div><div class='add'>+	spin_unlock(&amp;root-&gt;kernfs_idr_lock);</div><div class='ctx'> 	idr_preload_end();</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto err_out2;</div><div class='hunk'>@@ -604,7 +656,7 @@ static struct kernfs_node *__kernfs_new_node(struct kernfs_root *root,</div><div class='ctx'> 	atomic_set(&amp;kn-&gt;active, KN_DEACTIVATED_BIAS);</div><div class='ctx'> 	RB_CLEAR_NODE(&amp;kn-&gt;rb);</div><div class='ctx'> </div><div class='del'>-	kn-&gt;name = name;</div><div class='add'>+	rcu_assign_pointer(kn-&gt;name, name);</div><div class='ctx'> 	kn-&gt;mode = mode;</div><div class='ctx'> 	kn-&gt;flags = flags;</div><div class='ctx'> </div><div class='hunk'>@@ -623,13 +675,18 @@ static struct kernfs_node *__kernfs_new_node(struct kernfs_root *root,</div><div class='ctx'> 	if (parent) {</div><div class='ctx'> 		ret = security_kernfs_init_security(parent, kn);</div><div class='ctx'> 		if (ret)</div><div class='del'>-			goto err_out3;</div><div class='add'>+			goto err_out4;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return kn;</div><div class='ctx'> </div><div class='add'>+ err_out4:</div><div class='add'>+	simple_xattrs_free(&amp;kn-&gt;iattr-&gt;xattrs, NULL);</div><div class='add'>+	kmem_cache_free(kernfs_iattrs_cache, kn-&gt;iattr);</div><div class='ctx'>  err_out3:</div><div class='add'>+	spin_lock(&amp;root-&gt;kernfs_idr_lock);</div><div class='ctx'> 	idr_remove(&amp;root-&gt;ino_idr, (u32)kernfs_ino(kn));</div><div class='add'>+	spin_unlock(&amp;root-&gt;kernfs_idr_lock);</div><div class='ctx'>  err_out2:</div><div class='ctx'> 	kmem_cache_free(kernfs_node_cache, kn);</div><div class='ctx'>  err_out1:</div><div class='hunk'>@@ -644,11 +701,23 @@ struct kernfs_node *kernfs_new_node(struct kernfs_node *parent,</div><div class='ctx'> {</div><div class='ctx'> 	struct kernfs_node *kn;</div><div class='ctx'> </div><div class='add'>+	if (parent-&gt;mode &amp; S_ISGID) {</div><div class='add'>+		/* this code block imitates inode_init_owner() for</div><div class='add'>+		 * kernfs</div><div class='add'>+		 */</div><div class='add'>+</div><div class='add'>+		if (parent-&gt;iattr)</div><div class='add'>+			gid = parent-&gt;iattr-&gt;ia_gid;</div><div class='add'>+</div><div class='add'>+		if (flags &amp; KERNFS_DIR)</div><div class='add'>+			mode |= S_ISGID;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	kn = __kernfs_new_node(kernfs_root(parent), parent,</div><div class='ctx'> 			       name, mode, uid, gid, flags);</div><div class='ctx'> 	if (kn) {</div><div class='ctx'> 		kernfs_get(parent);</div><div class='del'>-		kn-&gt;parent = parent;</div><div class='add'>+		rcu_assign_pointer(kn-&gt;__parent, parent);</div><div class='ctx'> 	}</div><div class='ctx'> 	return kn;</div><div class='ctx'> }</div><div class='hunk'>@@ -661,8 +730,8 @@ struct kernfs_node *kernfs_new_node(struct kernfs_node *parent,</div><div class='ctx'>  * @id's lower 32bits encode ino and upper gen.  If the gen portion is</div><div class='ctx'>  * zero, all generations are matched.</div><div class='ctx'>  *</div><div class='del'>- * RETURNS:</div><div class='del'>- * NULL on failure. Return a kernfs node with reference counter incremented</div><div class='add'>+ * Return: %NULL on failure,</div><div class='add'>+ * otherwise a kernfs node with reference counter incremented.</div><div class='ctx'>  */</div><div class='ctx'> struct kernfs_node *kernfs_find_and_get_node_by_id(struct kernfs_root *root,</div><div class='ctx'> 						   u64 id)</div><div class='hunk'>@@ -671,7 +740,7 @@ struct kernfs_node *kernfs_find_and_get_node_by_id(struct kernfs_root *root,</div><div class='ctx'> 	ino_t ino = kernfs_id_ino(id);</div><div class='ctx'> 	u32 gen = kernfs_id_gen(id);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;kernfs_idr_lock);</div><div class='add'>+	rcu_read_lock();</div><div class='ctx'> </div><div class='ctx'> 	kn = idr_find(&amp;root-&gt;ino_idr, (u32)ino);</div><div class='ctx'> 	if (!kn)</div><div class='hunk'>@@ -688,18 +757,17 @@ struct kernfs_node *kernfs_find_and_get_node_by_id(struct kernfs_root *root,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * ACTIVATED is protected with kernfs_mutex but it was clear when</div><div class='del'>-	 * @kn was added to idr and we just wanna see it set.  No need to</div><div class='del'>-	 * grab kernfs_mutex.</div><div class='add'>+	 * We should fail if @kn has never been activated and guarantee success</div><div class='add'>+	 * if the caller knows that @kn is active. Both can be achieved by</div><div class='add'>+	 * __kernfs_active() which tests @kn-&gt;active without kernfs_rwsem.</div><div class='ctx'> 	 */</div><div class='del'>-	if (unlikely(!(kn-&gt;flags &amp; KERNFS_ACTIVATED) ||</div><div class='del'>-		     !atomic_inc_not_zero(&amp;kn-&gt;count)))</div><div class='add'>+	if (unlikely(!__kernfs_active(kn) || !atomic_inc_not_zero(&amp;kn-&gt;count)))</div><div class='ctx'> 		goto err_unlock;</div><div class='ctx'> </div><div class='del'>-	spin_unlock(&amp;kernfs_idr_lock);</div><div class='add'>+	rcu_read_unlock();</div><div class='ctx'> 	return kn;</div><div class='ctx'> err_unlock:</div><div class='del'>-	spin_unlock(&amp;kernfs_idr_lock);</div><div class='add'>+	rcu_read_unlock();</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -711,49 +779,52 @@ err_unlock:</div><div class='ctx'>  *	function increments nlink of the parent's inode if @kn is a</div><div class='ctx'>  *	directory and link into the children list of the parent.</div><div class='ctx'>  *</div><div class='del'>- *	RETURNS:</div><div class='del'>- *	0 on success, -EEXIST if entry with the given name already</div><div class='add'>+ *	Return:</div><div class='add'>+ *	%0 on success, -EEXIST if entry with the given name already</div><div class='ctx'>  *	exists.</div><div class='ctx'>  */</div><div class='ctx'> int kernfs_add_one(struct kernfs_node *kn)</div><div class='ctx'> {</div><div class='del'>-	struct kernfs_node *parent = kn-&gt;parent;</div><div class='add'>+	struct kernfs_root *root = kernfs_root(kn);</div><div class='ctx'> 	struct kernfs_iattrs *ps_iattr;</div><div class='add'>+	struct kernfs_node *parent;</div><div class='ctx'> 	bool has_ns;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;kernfs_rwsem);</div><div class='add'>+	down_write(&amp;root-&gt;kernfs_rwsem);</div><div class='add'>+	parent = kernfs_parent(kn);</div><div class='ctx'> </div><div class='ctx'> 	ret = -EINVAL;</div><div class='ctx'> 	has_ns = kernfs_ns_enabled(parent);</div><div class='ctx'> 	if (WARN(has_ns != (bool)kn-&gt;ns, KERN_WARNING "kernfs: ns %s in '%s' for '%s'\n",</div><div class='del'>-		 has_ns ? "required" : "invalid", parent-&gt;name, kn-&gt;name))</div><div class='add'>+		 has_ns ? "required" : "invalid",</div><div class='add'>+		 kernfs_rcu_name(parent), kernfs_rcu_name(kn)))</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='ctx'> 	if (kernfs_type(parent) != KERNFS_DIR)</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='ctx'> 	ret = -ENOENT;</div><div class='del'>-	if (parent-&gt;flags &amp; KERNFS_EMPTY_DIR)</div><div class='del'>-		goto out_unlock;</div><div class='del'>-</div><div class='del'>-	if ((parent-&gt;flags &amp; KERNFS_ACTIVATED) &amp;&amp; !kernfs_active(parent))</div><div class='add'>+	if (parent-&gt;flags &amp; (KERNFS_REMOVING | KERNFS_EMPTY_DIR))</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='del'>-	kn-&gt;hash = kernfs_name_hash(kn-&gt;name, kn-&gt;ns);</div><div class='add'>+	kn-&gt;hash = kernfs_name_hash(kernfs_rcu_name(kn), kn-&gt;ns);</div><div class='ctx'> </div><div class='ctx'> 	ret = kernfs_link_sibling(kn);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='ctx'> 	/* Update timestamps on the parent */</div><div class='add'>+	down_write(&amp;root-&gt;kernfs_iattr_rwsem);</div><div class='add'>+</div><div class='ctx'> 	ps_iattr = parent-&gt;iattr;</div><div class='ctx'> 	if (ps_iattr) {</div><div class='ctx'> 		ktime_get_real_ts64(&amp;ps_iattr-&gt;ia_ctime);</div><div class='ctx'> 		ps_iattr-&gt;ia_mtime = ps_iattr-&gt;ia_ctime;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	up_write(&amp;kernfs_rwsem);</div><div class='add'>+	up_write(&amp;root-&gt;kernfs_iattr_rwsem);</div><div class='add'>+	up_write(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Activate the new node unless CREATE_DEACTIVATED is requested.</div><div class='hunk'>@@ -767,7 +838,7 @@ int kernfs_add_one(struct kernfs_node *kn)</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> out_unlock:</div><div class='del'>-	up_write(&amp;kernfs_rwsem);</div><div class='add'>+	up_write(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -777,8 +848,9 @@ out_unlock:</div><div class='ctx'>  * @name: name to look for</div><div class='ctx'>  * @ns: the namespace tag to use</div><div class='ctx'>  *</div><div class='del'>- * Look for kernfs_node with name @name under @parent.  Returns pointer to</div><div class='del'>- * the found kernfs_node on success, %NULL on failure.</div><div class='add'>+ * Look for kernfs_node with name @name under @parent.</div><div class='add'>+ *</div><div class='add'>+ * Return: pointer to the found kernfs_node on success, %NULL on failure.</div><div class='ctx'>  */</div><div class='ctx'> static struct kernfs_node *kernfs_find_ns(struct kernfs_node *parent,</div><div class='ctx'> 					  const unsigned char *name,</div><div class='hunk'>@@ -788,11 +860,11 @@ static struct kernfs_node *kernfs_find_ns(struct kernfs_node *parent,</div><div class='ctx'> 	bool has_ns = kernfs_ns_enabled(parent);</div><div class='ctx'> 	unsigned int hash;</div><div class='ctx'> </div><div class='del'>-	lockdep_assert_held(&amp;kernfs_rwsem);</div><div class='add'>+	lockdep_assert_held(&amp;kernfs_root(parent)-&gt;kernfs_rwsem);</div><div class='ctx'> </div><div class='ctx'> 	if (has_ns != (bool)ns) {</div><div class='ctx'> 		WARN(1, KERN_WARNING "kernfs: ns %s in '%s' for '%s'\n",</div><div class='del'>-		     has_ns ? "required" : "invalid", parent-&gt;name, name);</div><div class='add'>+		     has_ns ? "required" : "invalid", kernfs_rcu_name(parent), name);</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -817,18 +889,17 @@ static struct kernfs_node *kernfs_walk_ns(struct kernfs_node *parent,</div><div class='ctx'> 					  const unsigned char *path,</div><div class='ctx'> 					  const void *ns)</div><div class='ctx'> {</div><div class='del'>-	size_t len;</div><div class='add'>+	ssize_t len;</div><div class='ctx'> 	char *p, *name;</div><div class='ctx'> </div><div class='del'>-	lockdep_assert_held_read(&amp;kernfs_rwsem);</div><div class='add'>+	lockdep_assert_held_read(&amp;kernfs_root(parent)-&gt;kernfs_rwsem);</div><div class='ctx'> </div><div class='del'>-	/* grab kernfs_rename_lock to piggy back on kernfs_pr_cont_buf */</div><div class='del'>-	spin_lock_irq(&amp;kernfs_rename_lock);</div><div class='add'>+	spin_lock_irq(&amp;kernfs_pr_cont_lock);</div><div class='ctx'> </div><div class='del'>-	len = strlcpy(kernfs_pr_cont_buf, path, sizeof(kernfs_pr_cont_buf));</div><div class='add'>+	len = strscpy(kernfs_pr_cont_buf, path, sizeof(kernfs_pr_cont_buf));</div><div class='ctx'> </div><div class='del'>-	if (len &gt;= sizeof(kernfs_pr_cont_buf)) {</div><div class='del'>-		spin_unlock_irq(&amp;kernfs_rename_lock);</div><div class='add'>+	if (len &lt; 0) {</div><div class='add'>+		spin_unlock_irq(&amp;kernfs_pr_cont_lock);</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -840,7 +911,7 @@ static struct kernfs_node *kernfs_walk_ns(struct kernfs_node *parent,</div><div class='ctx'> 		parent = kernfs_find_ns(parent, name, ns);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	spin_unlock_irq(&amp;kernfs_rename_lock);</div><div class='add'>+	spin_unlock_irq(&amp;kernfs_pr_cont_lock);</div><div class='ctx'> </div><div class='ctx'> 	return parent;</div><div class='ctx'> }</div><div class='hunk'>@@ -852,18 +923,20 @@ static struct kernfs_node *kernfs_walk_ns(struct kernfs_node *parent,</div><div class='ctx'>  * @ns: the namespace tag to use</div><div class='ctx'>  *</div><div class='ctx'>  * Look for kernfs_node with name @name under @parent and get a reference</div><div class='del'>- * if found.  This function may sleep and returns pointer to the found</div><div class='del'>- * kernfs_node on success, %NULL on failure.</div><div class='add'>+ * if found.  This function may sleep.</div><div class='add'>+ *</div><div class='add'>+ * Return: pointer to the found kernfs_node on success, %NULL on failure.</div><div class='ctx'>  */</div><div class='ctx'> struct kernfs_node *kernfs_find_and_get_ns(struct kernfs_node *parent,</div><div class='ctx'> 					   const char *name, const void *ns)</div><div class='ctx'> {</div><div class='ctx'> 	struct kernfs_node *kn;</div><div class='add'>+	struct kernfs_root *root = kernfs_root(parent);</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;kernfs_rwsem);</div><div class='add'>+	down_read(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> 	kn = kernfs_find_ns(parent, name, ns);</div><div class='ctx'> 	kernfs_get(kn);</div><div class='del'>-	up_read(&amp;kernfs_rwsem);</div><div class='add'>+	up_read(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> </div><div class='ctx'> 	return kn;</div><div class='ctx'> }</div><div class='hunk'>@@ -876,29 +949,36 @@ EXPORT_SYMBOL_GPL(kernfs_find_and_get_ns);</div><div class='ctx'>  * @ns: the namespace tag to use</div><div class='ctx'>  *</div><div class='ctx'>  * Look for kernfs_node with path @path under @parent and get a reference</div><div class='del'>- * if found.  This function may sleep and returns pointer to the found</div><div class='del'>- * kernfs_node on success, %NULL on failure.</div><div class='add'>+ * if found.  This function may sleep.</div><div class='add'>+ *</div><div class='add'>+ * Return: pointer to the found kernfs_node on success, %NULL on failure.</div><div class='ctx'>  */</div><div class='ctx'> struct kernfs_node *kernfs_walk_and_get_ns(struct kernfs_node *parent,</div><div class='ctx'> 					   const char *path, const void *ns)</div><div class='ctx'> {</div><div class='ctx'> 	struct kernfs_node *kn;</div><div class='add'>+	struct kernfs_root *root = kernfs_root(parent);</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;kernfs_rwsem);</div><div class='add'>+	down_read(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> 	kn = kernfs_walk_ns(parent, path, ns);</div><div class='ctx'> 	kernfs_get(kn);</div><div class='del'>-	up_read(&amp;kernfs_rwsem);</div><div class='add'>+	up_read(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> </div><div class='ctx'> 	return kn;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+unsigned int kernfs_root_flags(struct kernfs_node *kn)</div><div class='add'>+{</div><div class='add'>+	return kernfs_root(kn)-&gt;flags;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /**</div><div class='ctx'>  * kernfs_create_root - create a new kernfs hierarchy</div><div class='ctx'>  * @scops: optional syscall operations for the hierarchy</div><div class='ctx'>  * @flags: KERNFS_ROOT_* flags</div><div class='ctx'>  * @priv: opaque data associated with the new directory</div><div class='ctx'>  *</div><div class='del'>- * Returns the root of the new hierarchy on success, ERR_PTR() value on</div><div class='add'>+ * Return: the root of the new hierarchy on success, ERR_PTR() value on</div><div class='ctx'>  * failure.</div><div class='ctx'>  */</div><div class='ctx'> struct kernfs_root *kernfs_create_root(struct kernfs_syscall_ops *scops,</div><div class='hunk'>@@ -912,7 +992,12 @@ struct kernfs_root *kernfs_create_root(struct kernfs_syscall_ops *scops,</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='ctx'> 	idr_init(&amp;root-&gt;ino_idr);</div><div class='add'>+	spin_lock_init(&amp;root-&gt;kernfs_idr_lock);</div><div class='add'>+	init_rwsem(&amp;root-&gt;kernfs_rwsem);</div><div class='add'>+	init_rwsem(&amp;root-&gt;kernfs_iattr_rwsem);</div><div class='add'>+	init_rwsem(&amp;root-&gt;kernfs_supers_rwsem);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;root-&gt;supers);</div><div class='add'>+	rwlock_init(&amp;root-&gt;kernfs_rename_lock);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * On 64bit ino setups, id is ino.  On 32bit, low 32bits are ino.</div><div class='hunk'>@@ -957,7 +1042,24 @@ struct kernfs_root *kernfs_create_root(struct kernfs_syscall_ops *scops,</div><div class='ctx'>  */</div><div class='ctx'> void kernfs_destroy_root(struct kernfs_root *root)</div><div class='ctx'> {</div><div class='del'>-	kernfs_remove(root-&gt;kn);	/* will also free @root */</div><div class='add'>+	/*</div><div class='add'>+	 *  kernfs_remove holds kernfs_rwsem from the root so the root</div><div class='add'>+	 *  shouldn't be freed during the operation.</div><div class='add'>+	 */</div><div class='add'>+	kernfs_get(root-&gt;kn);</div><div class='add'>+	kernfs_remove(root-&gt;kn);</div><div class='add'>+	kernfs_put(root-&gt;kn); /* will also free @root */</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * kernfs_root_to_node - return the kernfs_node associated with a kernfs_root</div><div class='add'>+ * @root: root to use to lookup</div><div class='add'>+ *</div><div class='add'>+ * Return: @root's kernfs_node</div><div class='add'>+ */</div><div class='add'>+struct kernfs_node *kernfs_root_to_node(struct kernfs_root *root)</div><div class='add'>+{</div><div class='add'>+	return root-&gt;kn;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -970,7 +1072,7 @@ void kernfs_destroy_root(struct kernfs_root *root)</div><div class='ctx'>  * @priv: opaque data associated with the new directory</div><div class='ctx'>  * @ns: optional namespace tag of the directory</div><div class='ctx'>  *</div><div class='del'>- * Returns the created node on success, ERR_PTR() value on failure.</div><div class='add'>+ * Return: the created node on success, ERR_PTR() value on failure.</div><div class='ctx'>  */</div><div class='ctx'> struct kernfs_node *kernfs_create_dir_ns(struct kernfs_node *parent,</div><div class='ctx'> 					 const char *name, umode_t mode,</div><div class='hunk'>@@ -1004,7 +1106,7 @@ struct kernfs_node *kernfs_create_dir_ns(struct kernfs_node *parent,</div><div class='ctx'>  * @parent: parent in which to create a new directory</div><div class='ctx'>  * @name: name of the new directory</div><div class='ctx'>  *</div><div class='del'>- * Returns the created node on success, ERR_PTR() value on failure.</div><div class='add'>+ * Return: the created node on success, ERR_PTR() value on failure.</div><div class='ctx'>  */</div><div class='ctx'> struct kernfs_node *kernfs_create_empty_dir(struct kernfs_node *parent,</div><div class='ctx'> 					    const char *name)</div><div class='hunk'>@@ -1032,32 +1134,43 @@ struct kernfs_node *kernfs_create_empty_dir(struct kernfs_node *parent,</div><div class='ctx'> 	return ERR_PTR(rc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int kernfs_dop_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='add'>+static int kernfs_dop_revalidate(struct inode *dir, const struct qstr *name,</div><div class='add'>+				 struct dentry *dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='del'>-	struct kernfs_node *kn;</div><div class='add'>+	struct kernfs_node *kn, *parent;</div><div class='add'>+	struct kernfs_root *root;</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; LOOKUP_RCU)</div><div class='ctx'> 		return -ECHILD;</div><div class='ctx'> </div><div class='ctx'> 	/* Negative hashed dentry? */</div><div class='ctx'> 	if (d_really_is_negative(dentry)) {</div><div class='del'>-		struct kernfs_node *parent;</div><div class='del'>-</div><div class='ctx'> 		/* If the kernfs parent node has changed discard and</div><div class='ctx'> 		 * proceed to -&gt;lookup.</div><div class='add'>+		 *</div><div class='add'>+		 * There's nothing special needed here when getting the</div><div class='add'>+		 * dentry parent, even if a concurrent rename is in</div><div class='add'>+		 * progress. That's because the dentry is negative so</div><div class='add'>+		 * it can only be the target of the rename and it will</div><div class='add'>+		 * be doing a d_move() not a replace. Consequently the</div><div class='add'>+		 * dentry d_parent won't change over the d_move().</div><div class='add'>+		 *</div><div class='add'>+		 * Also kernfs negative dentries transitioning from</div><div class='add'>+		 * negative to positive during revalidate won't happen</div><div class='add'>+		 * because they are invalidated on containing directory</div><div class='add'>+		 * changes and the lookup re-done so that a new positive</div><div class='add'>+		 * dentry can be properly created.</div><div class='ctx'> 		 */</div><div class='del'>-		down_read(&amp;kernfs_rwsem);</div><div class='del'>-		spin_lock(&amp;dentry-&gt;d_lock);</div><div class='add'>+		root = kernfs_root_from_sb(dentry-&gt;d_sb);</div><div class='add'>+		down_read(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> 		parent = kernfs_dentry_node(dentry-&gt;d_parent);</div><div class='ctx'> 		if (parent) {</div><div class='ctx'> 			if (kernfs_dir_changed(parent, dentry)) {</div><div class='del'>-				spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='del'>-				up_read(&amp;kernfs_rwsem);</div><div class='add'>+				up_read(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> 				return 0;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='del'>-		up_read(&amp;kernfs_rwsem);</div><div class='add'>+		up_read(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> </div><div class='ctx'> 		/* The kernfs parent node hasn't changed, leave the</div><div class='ctx'> 		 * dentry negative and return success.</div><div class='hunk'>@@ -1066,29 +1179,31 @@ static int kernfs_dop_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	kn = kernfs_dentry_node(dentry);</div><div class='del'>-	down_read(&amp;kernfs_rwsem);</div><div class='add'>+	root = kernfs_root(kn);</div><div class='add'>+	down_read(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> </div><div class='ctx'> 	/* The kernfs node has been deactivated */</div><div class='ctx'> 	if (!kernfs_active(kn))</div><div class='ctx'> 		goto out_bad;</div><div class='ctx'> </div><div class='add'>+	parent = kernfs_parent(kn);</div><div class='ctx'> 	/* The kernfs node has been moved? */</div><div class='del'>-	if (kernfs_dentry_node(dentry-&gt;d_parent) != kn-&gt;parent)</div><div class='add'>+	if (kernfs_dentry_node(dentry-&gt;d_parent) != parent)</div><div class='ctx'> 		goto out_bad;</div><div class='ctx'> </div><div class='ctx'> 	/* The kernfs node has been renamed */</div><div class='del'>-	if (strcmp(dentry-&gt;d_name.name, kn-&gt;name) != 0)</div><div class='add'>+	if (strcmp(dentry-&gt;d_name.name, kernfs_rcu_name(kn)) != 0)</div><div class='ctx'> 		goto out_bad;</div><div class='ctx'> </div><div class='ctx'> 	/* The kernfs node has been moved to a different namespace */</div><div class='del'>-	if (kn-&gt;parent &amp;&amp; kernfs_ns_enabled(kn-&gt;parent) &amp;&amp;</div><div class='add'>+	if (parent &amp;&amp; kernfs_ns_enabled(parent) &amp;&amp;</div><div class='ctx'> 	    kernfs_info(dentry-&gt;d_sb)-&gt;ns != kn-&gt;ns)</div><div class='ctx'> 		goto out_bad;</div><div class='ctx'> </div><div class='del'>-	up_read(&amp;kernfs_rwsem);</div><div class='add'>+	up_read(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> 	return 1;</div><div class='ctx'> out_bad:</div><div class='del'>-	up_read(&amp;kernfs_rwsem);</div><div class='add'>+	up_read(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1102,10 +1217,12 @@ static struct dentry *kernfs_iop_lookup(struct inode *dir,</div><div class='ctx'> {</div><div class='ctx'> 	struct kernfs_node *parent = dir-&gt;i_private;</div><div class='ctx'> 	struct kernfs_node *kn;</div><div class='add'>+	struct kernfs_root *root;</div><div class='ctx'> 	struct inode *inode = NULL;</div><div class='ctx'> 	const void *ns = NULL;</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;kernfs_rwsem);</div><div class='add'>+	root = kernfs_root(parent);</div><div class='add'>+	down_read(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> 	if (kernfs_ns_enabled(parent))</div><div class='ctx'> 		ns = kernfs_info(dir-&gt;i_sb)-&gt;ns;</div><div class='ctx'> </div><div class='hunk'>@@ -1116,7 +1233,7 @@ static struct dentry *kernfs_iop_lookup(struct inode *dir,</div><div class='ctx'> 		 * create a negative.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (!kernfs_active(kn)) {</div><div class='del'>-			up_read(&amp;kernfs_rwsem);</div><div class='add'>+			up_read(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> 			return NULL;</div><div class='ctx'> 		}</div><div class='ctx'> 		inode = kernfs_get_inode(dir-&gt;i_sb, kn);</div><div class='hunk'>@@ -1131,30 +1248,30 @@ static struct dentry *kernfs_iop_lookup(struct inode *dir,</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (!IS_ERR(inode))</div><div class='ctx'> 		kernfs_set_rev(parent, dentry);</div><div class='del'>-	up_read(&amp;kernfs_rwsem);</div><div class='add'>+	up_read(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> </div><div class='ctx'> 	/* instantiate and hash (possibly negative) dentry */</div><div class='ctx'> 	return d_splice_alias(inode, dentry);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int kernfs_iop_mkdir(struct user_namespace *mnt_userns,</div><div class='del'>-			    struct inode *dir, struct dentry *dentry,</div><div class='del'>-			    umode_t mode)</div><div class='add'>+static struct dentry *kernfs_iop_mkdir(struct mnt_idmap *idmap,</div><div class='add'>+				       struct inode *dir, struct dentry *dentry,</div><div class='add'>+				       umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct kernfs_node *parent = dir-&gt;i_private;</div><div class='ctx'> 	struct kernfs_syscall_ops *scops = kernfs_root(parent)-&gt;syscall_ops;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!scops || !scops-&gt;mkdir)</div><div class='del'>-		return -EPERM;</div><div class='add'>+		return ERR_PTR(-EPERM);</div><div class='ctx'> </div><div class='ctx'> 	if (!kernfs_get_active(parent))</div><div class='del'>-		return -ENODEV;</div><div class='add'>+		return ERR_PTR(-ENODEV);</div><div class='ctx'> </div><div class='ctx'> 	ret = scops-&gt;mkdir(parent, dentry-&gt;d_name.name, mode);</div><div class='ctx'> </div><div class='ctx'> 	kernfs_put_active(parent);</div><div class='del'>-	return ret;</div><div class='add'>+	return ERR_PTR(ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int kernfs_iop_rmdir(struct inode *dir, struct dentry *dentry)</div><div class='hunk'>@@ -1175,7 +1292,7 @@ static int kernfs_iop_rmdir(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int kernfs_iop_rename(struct user_namespace *mnt_userns,</div><div class='add'>+static int kernfs_iop_rename(struct mnt_idmap *idmap,</div><div class='ctx'> 			     struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> 			     struct inode *new_dir, struct dentry *new_dentry,</div><div class='ctx'> 			     unsigned int flags)</div><div class='hunk'>@@ -1248,13 +1365,15 @@ static struct kernfs_node *kernfs_leftmost_descendant(struct kernfs_node *pos)</div><div class='ctx'>  * Find the next descendant to visit for post-order traversal of @root's</div><div class='ctx'>  * descendants.  @root is included in the iteration and the last node to be</div><div class='ctx'>  * visited.</div><div class='add'>+ *</div><div class='add'>+ * Return: the next descendant to visit or %NULL when done.</div><div class='ctx'>  */</div><div class='ctx'> static struct kernfs_node *kernfs_next_descendant_post(struct kernfs_node *pos,</div><div class='ctx'> 						       struct kernfs_node *root)</div><div class='ctx'> {</div><div class='ctx'> 	struct rb_node *rbn;</div><div class='ctx'> </div><div class='del'>-	lockdep_assert_held_write(&amp;kernfs_rwsem);</div><div class='add'>+	lockdep_assert_held_write(&amp;kernfs_root(root)-&gt;kernfs_rwsem);</div><div class='ctx'> </div><div class='ctx'> 	/* if first iteration, visit leftmost descendant which may be root */</div><div class='ctx'> 	if (!pos)</div><div class='hunk'>@@ -1270,7 +1389,22 @@ static struct kernfs_node *kernfs_next_descendant_post(struct kernfs_node *pos,</div><div class='ctx'> 		return kernfs_leftmost_descendant(rb_to_kn(rbn));</div><div class='ctx'> </div><div class='ctx'> 	/* no sibling left, visit parent */</div><div class='del'>-	return pos-&gt;parent;</div><div class='add'>+	return kernfs_parent(pos);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void kernfs_activate_one(struct kernfs_node *kn)</div><div class='add'>+{</div><div class='add'>+	lockdep_assert_held_write(&amp;kernfs_root(kn)-&gt;kernfs_rwsem);</div><div class='add'>+</div><div class='add'>+	kn-&gt;flags |= KERNFS_ACTIVATED;</div><div class='add'>+</div><div class='add'>+	if (kernfs_active(kn) || (kn-&gt;flags &amp; (KERNFS_HIDDEN | KERNFS_REMOVING)))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	WARN_ON_ONCE(rcu_access_pointer(kn-&gt;__parent) &amp;&amp; RB_EMPTY_NODE(&amp;kn-&gt;rb));</div><div class='add'>+	WARN_ON_ONCE(atomic_read(&amp;kn-&gt;active) != KN_DEACTIVATED_BIAS);</div><div class='add'>+</div><div class='add'>+	atomic_sub(KN_DEACTIVATED_BIAS, &amp;kn-&gt;active);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -1289,83 +1423,110 @@ static struct kernfs_node *kernfs_next_descendant_post(struct kernfs_node *pos,</div><div class='ctx'> void kernfs_activate(struct kernfs_node *kn)</div><div class='ctx'> {</div><div class='ctx'> 	struct kernfs_node *pos;</div><div class='add'>+	struct kernfs_root *root = kernfs_root(kn);</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;kernfs_rwsem);</div><div class='add'>+	down_write(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> </div><div class='ctx'> 	pos = NULL;</div><div class='del'>-	while ((pos = kernfs_next_descendant_post(pos, kn))) {</div><div class='del'>-		if (pos-&gt;flags &amp; KERNFS_ACTIVATED)</div><div class='del'>-			continue;</div><div class='add'>+	while ((pos = kernfs_next_descendant_post(pos, kn)))</div><div class='add'>+		kernfs_activate_one(pos);</div><div class='add'>+</div><div class='add'>+	up_write(&amp;root-&gt;kernfs_rwsem);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * kernfs_show - show or hide a node</div><div class='add'>+ * @kn: kernfs_node to show or hide</div><div class='add'>+ * @show: whether to show or hide</div><div class='add'>+ *</div><div class='add'>+ * If @show is %false, @kn is marked hidden and deactivated. A hidden node is</div><div class='add'>+ * ignored in future activaitons. If %true, the mark is removed and activation</div><div class='add'>+ * state is restored. This function won't implicitly activate a new node in a</div><div class='add'>+ * %KERNFS_ROOT_CREATE_DEACTIVATED root which hasn't been activated yet.</div><div class='add'>+ *</div><div class='add'>+ * To avoid recursion complexities, directories aren't supported for now.</div><div class='add'>+ */</div><div class='add'>+void kernfs_show(struct kernfs_node *kn, bool show)</div><div class='add'>+{</div><div class='add'>+	struct kernfs_root *root = kernfs_root(kn);</div><div class='add'>+</div><div class='add'>+	if (WARN_ON_ONCE(kernfs_type(kn) == KERNFS_DIR))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-		WARN_ON_ONCE(pos-&gt;parent &amp;&amp; RB_EMPTY_NODE(&amp;pos-&gt;rb));</div><div class='del'>-		WARN_ON_ONCE(atomic_read(&amp;pos-&gt;active) != KN_DEACTIVATED_BIAS);</div><div class='add'>+	down_write(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> </div><div class='del'>-		atomic_sub(KN_DEACTIVATED_BIAS, &amp;pos-&gt;active);</div><div class='del'>-		pos-&gt;flags |= KERNFS_ACTIVATED;</div><div class='add'>+	if (show) {</div><div class='add'>+		kn-&gt;flags &amp;= ~KERNFS_HIDDEN;</div><div class='add'>+		if (kn-&gt;flags &amp; KERNFS_ACTIVATED)</div><div class='add'>+			kernfs_activate_one(kn);</div><div class='add'>+	} else {</div><div class='add'>+		kn-&gt;flags |= KERNFS_HIDDEN;</div><div class='add'>+		if (kernfs_active(kn))</div><div class='add'>+			atomic_add(KN_DEACTIVATED_BIAS, &amp;kn-&gt;active);</div><div class='add'>+		kernfs_drain(kn);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	up_write(&amp;kernfs_rwsem);</div><div class='add'>+	up_write(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void __kernfs_remove(struct kernfs_node *kn)</div><div class='ctx'> {</div><div class='del'>-	struct kernfs_node *pos;</div><div class='add'>+	struct kernfs_node *pos, *parent;</div><div class='ctx'> </div><div class='del'>-	lockdep_assert_held_write(&amp;kernfs_rwsem);</div><div class='add'>+	/* Short-circuit if non-root @kn has already finished removal. */</div><div class='add'>+	if (!kn)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held_write(&amp;kernfs_root(kn)-&gt;kernfs_rwsem);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Short-circuit if non-root @kn has already finished removal.</div><div class='ctx'> 	 * This is for kernfs_remove_self() which plays with active ref</div><div class='ctx'> 	 * after removal.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!kn || (kn-&gt;parent &amp;&amp; RB_EMPTY_NODE(&amp;kn-&gt;rb)))</div><div class='add'>+	if (kernfs_parent(kn) &amp;&amp; RB_EMPTY_NODE(&amp;kn-&gt;rb))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	pr_debug("kernfs %s: removing\n", kn-&gt;name);</div><div class='add'>+	pr_debug("kernfs %s: removing\n", kernfs_rcu_name(kn));</div><div class='ctx'> </div><div class='del'>-	/* prevent any new usage under @kn by deactivating all nodes */</div><div class='add'>+	/* prevent new usage by marking all nodes removing and deactivating */</div><div class='ctx'> 	pos = NULL;</div><div class='del'>-	while ((pos = kernfs_next_descendant_post(pos, kn)))</div><div class='add'>+	while ((pos = kernfs_next_descendant_post(pos, kn))) {</div><div class='add'>+		pos-&gt;flags |= KERNFS_REMOVING;</div><div class='ctx'> 		if (kernfs_active(pos))</div><div class='ctx'> 			atomic_add(KN_DEACTIVATED_BIAS, &amp;pos-&gt;active);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* deactivate and unlink the subtree node-by-node */</div><div class='ctx'> 	do {</div><div class='ctx'> 		pos = kernfs_leftmost_descendant(kn);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * kernfs_drain() drops kernfs_rwsem temporarily and @pos's</div><div class='add'>+		 * kernfs_drain() may drop kernfs_rwsem temporarily and @pos's</div><div class='ctx'> 		 * base ref could have been put by someone else by the time</div><div class='ctx'> 		 * the function returns.  Make sure it doesn't go away</div><div class='ctx'> 		 * underneath us.</div><div class='ctx'> 		 */</div><div class='ctx'> 		kernfs_get(pos);</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * Drain iff @kn was activated.  This avoids draining and</div><div class='del'>-		 * its lockdep annotations for nodes which have never been</div><div class='del'>-		 * activated and allows embedding kernfs_remove() in create</div><div class='del'>-		 * error paths without worrying about draining.</div><div class='del'>-		 */</div><div class='del'>-		if (kn-&gt;flags &amp; KERNFS_ACTIVATED)</div><div class='del'>-			kernfs_drain(pos);</div><div class='del'>-		else</div><div class='del'>-			WARN_ON_ONCE(atomic_read(&amp;kn-&gt;active) != KN_DEACTIVATED_BIAS);</div><div class='del'>-</div><div class='add'>+		kernfs_drain(pos);</div><div class='add'>+		parent = kernfs_parent(pos);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * kernfs_unlink_sibling() succeeds once per node.  Use it</div><div class='ctx'> 		 * to decide who's responsible for cleanups.</div><div class='ctx'> 		 */</div><div class='del'>-		if (!pos-&gt;parent || kernfs_unlink_sibling(pos)) {</div><div class='add'>+		if (!parent || kernfs_unlink_sibling(pos)) {</div><div class='ctx'> 			struct kernfs_iattrs *ps_iattr =</div><div class='del'>-				pos-&gt;parent ? pos-&gt;parent-&gt;iattr : NULL;</div><div class='add'>+				parent ? parent-&gt;iattr : NULL;</div><div class='ctx'> </div><div class='ctx'> 			/* update timestamps on the parent */</div><div class='add'>+			down_write(&amp;kernfs_root(kn)-&gt;kernfs_iattr_rwsem);</div><div class='add'>+</div><div class='ctx'> 			if (ps_iattr) {</div><div class='ctx'> 				ktime_get_real_ts64(&amp;ps_iattr-&gt;ia_ctime);</div><div class='ctx'> 				ps_iattr-&gt;ia_mtime = ps_iattr-&gt;ia_ctime;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='add'>+			up_write(&amp;kernfs_root(kn)-&gt;kernfs_iattr_rwsem);</div><div class='ctx'> 			kernfs_put(pos);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -1381,9 +1542,16 @@ static void __kernfs_remove(struct kernfs_node *kn)</div><div class='ctx'>  */</div><div class='ctx'> void kernfs_remove(struct kernfs_node *kn)</div><div class='ctx'> {</div><div class='del'>-	down_write(&amp;kernfs_rwsem);</div><div class='add'>+	struct kernfs_root *root;</div><div class='add'>+</div><div class='add'>+	if (!kn)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	root = kernfs_root(kn);</div><div class='add'>+</div><div class='add'>+	down_write(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> 	__kernfs_remove(kn);</div><div class='del'>-	up_write(&amp;kernfs_rwsem);</div><div class='add'>+	up_write(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -1417,8 +1585,9 @@ void kernfs_break_active_protection(struct kernfs_node *kn)</div><div class='ctx'>  * invoked before finishing the kernfs operation.  Note that while this</div><div class='ctx'>  * function restores the active reference, it doesn't and can't actually</div><div class='ctx'>  * restore the active protection - @kn may already or be in the process of</div><div class='del'>- * being removed.  Once kernfs_break_active_protection() is invoked, that</div><div class='del'>- * protection is irreversibly gone for the kernfs operation instance.</div><div class='add'>+ * being drained and removed.  Once kernfs_break_active_protection() is</div><div class='add'>+ * invoked, that protection is irreversibly gone for the kernfs operation</div><div class='add'>+ * instance.</div><div class='ctx'>  *</div><div class='ctx'>  * While this function may be called at any point after</div><div class='ctx'>  * kernfs_break_active_protection() is invoked, its most useful location</div><div class='hunk'>@@ -1465,12 +1634,15 @@ void kernfs_unbreak_active_protection(struct kernfs_node *kn)</div><div class='ctx'>  * the whole kernfs_ops which won the arbitration.  This can be used to</div><div class='ctx'>  * guarantee, for example, all concurrent writes to a "delete" file to</div><div class='ctx'>  * finish only after the whole operation is complete.</div><div class='add'>+ *</div><div class='add'>+ * Return: %true if @kn is removed by this call, otherwise %false.</div><div class='ctx'>  */</div><div class='ctx'> bool kernfs_remove_self(struct kernfs_node *kn)</div><div class='ctx'> {</div><div class='ctx'> 	bool ret;</div><div class='add'>+	struct kernfs_root *root = kernfs_root(kn);</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;kernfs_rwsem);</div><div class='add'>+	down_write(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> 	kernfs_break_active_protection(kn);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1498,9 +1670,9 @@ bool kernfs_remove_self(struct kernfs_node *kn)</div><div class='ctx'> 			    atomic_read(&amp;kn-&gt;active) == KN_DEACTIVATED_BIAS)</div><div class='ctx'> 				break;</div><div class='ctx'> </div><div class='del'>-			up_write(&amp;kernfs_rwsem);</div><div class='add'>+			up_write(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> 			schedule();</div><div class='del'>-			down_write(&amp;kernfs_rwsem);</div><div class='add'>+			down_write(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> 		}</div><div class='ctx'> 		finish_wait(waitq, &amp;wait);</div><div class='ctx'> 		WARN_ON_ONCE(!RB_EMPTY_NODE(&amp;kn-&gt;rb));</div><div class='hunk'>@@ -1513,7 +1685,7 @@ bool kernfs_remove_self(struct kernfs_node *kn)</div><div class='ctx'> 	 */</div><div class='ctx'> 	kernfs_unbreak_active_protection(kn);</div><div class='ctx'> </div><div class='del'>-	up_write(&amp;kernfs_rwsem);</div><div class='add'>+	up_write(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1524,12 +1696,14 @@ bool kernfs_remove_self(struct kernfs_node *kn)</div><div class='ctx'>  * @ns: namespace tag of the kernfs_node to remove</div><div class='ctx'>  *</div><div class='ctx'>  * Look for the kernfs_node with @name and @ns under @parent and remove it.</div><div class='del'>- * Returns 0 on success, -ENOENT if such entry doesn't exist.</div><div class='add'>+ *</div><div class='add'>+ * Return: %0 on success, -ENOENT if such entry doesn't exist.</div><div class='ctx'>  */</div><div class='ctx'> int kernfs_remove_by_name_ns(struct kernfs_node *parent, const char *name,</div><div class='ctx'> 			     const void *ns)</div><div class='ctx'> {</div><div class='ctx'> 	struct kernfs_node *kn;</div><div class='add'>+	struct kernfs_root *root;</div><div class='ctx'> </div><div class='ctx'> 	if (!parent) {</div><div class='ctx'> 		WARN(1, KERN_WARNING "kernfs: can not remove '%s', no directory\n",</div><div class='hunk'>@@ -1537,13 +1711,17 @@ int kernfs_remove_by_name_ns(struct kernfs_node *parent, const char *name,</div><div class='ctx'> 		return -ENOENT;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;kernfs_rwsem);</div><div class='add'>+	root = kernfs_root(parent);</div><div class='add'>+	down_write(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> </div><div class='ctx'> 	kn = kernfs_find_ns(parent, name, ns);</div><div class='del'>-	if (kn)</div><div class='add'>+	if (kn) {</div><div class='add'>+		kernfs_get(kn);</div><div class='ctx'> 		__kernfs_remove(kn);</div><div class='add'>+		kernfs_put(kn);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	up_write(&amp;kernfs_rwsem);</div><div class='add'>+	up_write(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> </div><div class='ctx'> 	if (kn)</div><div class='ctx'> 		return 0;</div><div class='hunk'>@@ -1557,28 +1735,42 @@ int kernfs_remove_by_name_ns(struct kernfs_node *parent, const char *name,</div><div class='ctx'>  * @new_parent: new parent to put @sd under</div><div class='ctx'>  * @new_name: new name</div><div class='ctx'>  * @new_ns: new namespace tag</div><div class='add'>+ *</div><div class='add'>+ * Return: %0 on success, -errno on failure.</div><div class='ctx'>  */</div><div class='ctx'> int kernfs_rename_ns(struct kernfs_node *kn, struct kernfs_node *new_parent,</div><div class='ctx'> 		     const char *new_name, const void *new_ns)</div><div class='ctx'> {</div><div class='ctx'> 	struct kernfs_node *old_parent;</div><div class='del'>-	const char *old_name = NULL;</div><div class='add'>+	struct kernfs_root *root;</div><div class='add'>+	const char *old_name;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='ctx'> 	/* can't move or rename root */</div><div class='del'>-	if (!kn-&gt;parent)</div><div class='add'>+	if (!rcu_access_pointer(kn-&gt;__parent))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;kernfs_rwsem);</div><div class='add'>+	root = kernfs_root(kn);</div><div class='add'>+	down_write(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> </div><div class='ctx'> 	error = -ENOENT;</div><div class='ctx'> 	if (!kernfs_active(kn) || !kernfs_active(new_parent) ||</div><div class='ctx'> 	    (new_parent-&gt;flags &amp; KERNFS_EMPTY_DIR))</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='add'>+	old_parent = kernfs_parent(kn);</div><div class='add'>+	if (root-&gt;flags &amp; KERNFS_ROOT_INVARIANT_PARENT) {</div><div class='add'>+		error = -EINVAL;</div><div class='add'>+		if (WARN_ON_ONCE(old_parent != new_parent))</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	error = 0;</div><div class='del'>-	if ((kn-&gt;parent == new_parent) &amp;&amp; (kn-&gt;ns == new_ns) &amp;&amp;</div><div class='del'>-	    (strcmp(kn-&gt;name, new_name) == 0))</div><div class='add'>+	old_name = kernfs_rcu_name(kn);</div><div class='add'>+	if (!new_name)</div><div class='add'>+		new_name = old_name;</div><div class='add'>+	if ((old_parent == new_parent) &amp;&amp; (kn-&gt;ns == new_ns) &amp;&amp;</div><div class='add'>+	    (strcmp(old_name, new_name) == 0))</div><div class='ctx'> 		goto out;	/* nothing to rename */</div><div class='ctx'> </div><div class='ctx'> 	error = -EEXIST;</div><div class='hunk'>@@ -1586,7 +1778,7 @@ int kernfs_rename_ns(struct kernfs_node *kn, struct kernfs_node *new_parent,</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	/* rename kernfs_node */</div><div class='del'>-	if (strcmp(kn-&gt;name, new_name) != 0) {</div><div class='add'>+	if (strcmp(old_name, new_name) != 0) {</div><div class='ctx'> 		error = -ENOMEM;</div><div class='ctx'> 		new_name = kstrdup_const(new_name, GFP_KERNEL);</div><div class='ctx'> 		if (!new_name)</div><div class='hunk'>@@ -1599,40 +1791,39 @@ int kernfs_rename_ns(struct kernfs_node *kn, struct kernfs_node *new_parent,</div><div class='ctx'> 	 * Move to the appropriate place in the appropriate directories rbtree.</div><div class='ctx'> 	 */</div><div class='ctx'> 	kernfs_unlink_sibling(kn);</div><div class='del'>-	kernfs_get(new_parent);</div><div class='ctx'> </div><div class='del'>-	/* rename_lock protects -&gt;parent and -&gt;name accessors */</div><div class='del'>-	spin_lock_irq(&amp;kernfs_rename_lock);</div><div class='add'>+	/* rename_lock protects -&gt;parent accessors */</div><div class='add'>+	if (old_parent != new_parent) {</div><div class='add'>+		kernfs_get(new_parent);</div><div class='add'>+		write_lock_irq(&amp;root-&gt;kernfs_rename_lock);</div><div class='ctx'> </div><div class='del'>-	old_parent = kn-&gt;parent;</div><div class='del'>-	kn-&gt;parent = new_parent;</div><div class='add'>+		rcu_assign_pointer(kn-&gt;__parent, new_parent);</div><div class='ctx'> </div><div class='del'>-	kn-&gt;ns = new_ns;</div><div class='del'>-	if (new_name) {</div><div class='del'>-		old_name = kn-&gt;name;</div><div class='del'>-		kn-&gt;name = new_name;</div><div class='del'>-	}</div><div class='add'>+		kn-&gt;ns = new_ns;</div><div class='add'>+		if (new_name)</div><div class='add'>+			rcu_assign_pointer(kn-&gt;name, new_name);</div><div class='ctx'> </div><div class='del'>-	spin_unlock_irq(&amp;kernfs_rename_lock);</div><div class='add'>+		write_unlock_irq(&amp;root-&gt;kernfs_rename_lock);</div><div class='add'>+		kernfs_put(old_parent);</div><div class='add'>+	} else {</div><div class='add'>+		/* name assignment is RCU protected, parent is the same */</div><div class='add'>+		kn-&gt;ns = new_ns;</div><div class='add'>+		if (new_name)</div><div class='add'>+			rcu_assign_pointer(kn-&gt;name, new_name);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	kn-&gt;hash = kernfs_name_hash(kn-&gt;name, kn-&gt;ns);</div><div class='add'>+	kn-&gt;hash = kernfs_name_hash(new_name ?: old_name, kn-&gt;ns);</div><div class='ctx'> 	kernfs_link_sibling(kn);</div><div class='ctx'> </div><div class='del'>-	kernfs_put(old_parent);</div><div class='del'>-	kfree_const(old_name);</div><div class='add'>+	if (new_name &amp;&amp; !is_kernel_rodata((unsigned long)old_name))</div><div class='add'>+		kfree_rcu_mightsleep(old_name);</div><div class='ctx'> </div><div class='ctx'> 	error = 0;</div><div class='ctx'>  out:</div><div class='del'>-	up_write(&amp;kernfs_rwsem);</div><div class='add'>+	up_write(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Relationship between mode and the DT_xxx types */</div><div class='del'>-static inline unsigned char dt_type(struct kernfs_node *kn)</div><div class='del'>-{</div><div class='del'>-	return (kn-&gt;mode &gt;&gt; 12) &amp; 15;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int kernfs_dir_fop_release(struct inode *inode, struct file *filp)</div><div class='ctx'> {</div><div class='ctx'> 	kernfs_put(filp-&gt;private_data);</div><div class='hunk'>@@ -1644,7 +1835,8 @@ static struct kernfs_node *kernfs_dir_pos(const void *ns,</div><div class='ctx'> {</div><div class='ctx'> 	if (pos) {</div><div class='ctx'> 		int valid = kernfs_active(pos) &amp;&amp;</div><div class='del'>-			pos-&gt;parent == parent &amp;&amp; hash == pos-&gt;hash;</div><div class='add'>+			rcu_access_pointer(pos-&gt;__parent) == parent &amp;&amp;</div><div class='add'>+			hash == pos-&gt;hash;</div><div class='ctx'> 		kernfs_put(pos);</div><div class='ctx'> 		if (!valid)</div><div class='ctx'> 			pos = NULL;</div><div class='hunk'>@@ -1694,11 +1886,14 @@ static int kernfs_fop_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 	struct dentry *dentry = file-&gt;f_path.dentry;</div><div class='ctx'> 	struct kernfs_node *parent = kernfs_dentry_node(dentry);</div><div class='ctx'> 	struct kernfs_node *pos = file-&gt;private_data;</div><div class='add'>+	struct kernfs_root *root;</div><div class='ctx'> 	const void *ns = NULL;</div><div class='ctx'> </div><div class='ctx'> 	if (!dir_emit_dots(file, ctx))</div><div class='ctx'> 		return 0;</div><div class='del'>-	down_read(&amp;kernfs_rwsem);</div><div class='add'>+</div><div class='add'>+	root = kernfs_root(parent);</div><div class='add'>+	down_read(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> </div><div class='ctx'> 	if (kernfs_ns_enabled(parent))</div><div class='ctx'> 		ns = kernfs_info(dentry-&gt;d_sb)-&gt;ns;</div><div class='hunk'>@@ -1706,8 +1901,8 @@ static int kernfs_fop_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 	for (pos = kernfs_dir_pos(ns, parent, ctx-&gt;pos, pos);</div><div class='ctx'> 	     pos;</div><div class='ctx'> 	     pos = kernfs_dir_next_pos(ns, parent, ctx-&gt;pos, pos)) {</div><div class='del'>-		const char *name = pos-&gt;name;</div><div class='del'>-		unsigned int type = dt_type(pos);</div><div class='add'>+		const char *name = kernfs_rcu_name(pos);</div><div class='add'>+		unsigned int type = fs_umode_to_dtype(pos-&gt;mode);</div><div class='ctx'> 		int len = strlen(name);</div><div class='ctx'> 		ino_t ino = kernfs_ino(pos);</div><div class='ctx'> </div><div class='hunk'>@@ -1715,12 +1910,12 @@ static int kernfs_fop_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 		file-&gt;private_data = pos;</div><div class='ctx'> 		kernfs_get(pos);</div><div class='ctx'> </div><div class='del'>-		up_read(&amp;kernfs_rwsem);</div><div class='del'>-		if (!dir_emit(ctx, name, len, ino, type))</div><div class='add'>+		if (!dir_emit(ctx, name, len, ino, type)) {</div><div class='add'>+			up_read(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> 			return 0;</div><div class='del'>-		down_read(&amp;kernfs_rwsem);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='del'>-	up_read(&amp;kernfs_rwsem);</div><div class='add'>+	up_read(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> 	file-&gt;private_data = NULL;</div><div class='ctx'> 	ctx-&gt;pos = INT_MAX;</div><div class='ctx'> 	return 0;</div><div class='head'>diff --git a/fs/kernfs/file.c b/fs/kernfs/file.c<br/>index 60e2a86c535e..9adf36e6364b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/kernfs/file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/kernfs/file.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/kernfs/file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/kernfs/file.c</a></div><div class='hunk'>@@ -18,25 +18,13 @@</div><div class='ctx'> </div><div class='ctx'> #include "kernfs-internal.h"</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * There's one kernfs_open_file for each open file and one kernfs_open_node</div><div class='del'>- * for each kernfs_node with one or more open files.</div><div class='del'>- *</div><div class='del'>- * kernfs_node-&gt;attr.open points to kernfs_open_node.  attr.open is</div><div class='del'>- * protected by kernfs_open_node_lock.</div><div class='del'>- *</div><div class='del'>- * filp-&gt;private_data points to seq_file whose -&gt;private points to</div><div class='del'>- * kernfs_open_file.  kernfs_open_files are chained at</div><div class='del'>- * kernfs_open_node-&gt;files, which is protected by kernfs_open_file_mutex.</div><div class='del'>- */</div><div class='del'>-static DEFINE_SPINLOCK(kernfs_open_node_lock);</div><div class='del'>-static DEFINE_MUTEX(kernfs_open_file_mutex);</div><div class='del'>-</div><div class='ctx'> struct kernfs_open_node {</div><div class='del'>-	atomic_t		refcnt;</div><div class='add'>+	struct rcu_head		rcu_head;</div><div class='ctx'> 	atomic_t		event;</div><div class='ctx'> 	wait_queue_head_t	poll;</div><div class='ctx'> 	struct list_head	files; /* goes through kernfs_open_file.list */</div><div class='add'>+	unsigned int		nr_mmapped;</div><div class='add'>+	unsigned int		nr_to_release;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -45,13 +33,85 @@ struct kernfs_open_node {</div><div class='ctx'>  * pending queue is implemented as a singly linked list of kernfs_nodes.</div><div class='ctx'>  * The list is terminated with the self pointer so that whether a</div><div class='ctx'>  * kernfs_node is on the list or not can be determined by testing the next</div><div class='del'>- * pointer for NULL.</div><div class='add'>+ * pointer for %NULL.</div><div class='ctx'>  */</div><div class='ctx'> #define KERNFS_NOTIFY_EOL			((void *)&amp;kernfs_notify_list)</div><div class='ctx'> </div><div class='ctx'> static DEFINE_SPINLOCK(kernfs_notify_lock);</div><div class='ctx'> static struct kernfs_node *kernfs_notify_list = KERNFS_NOTIFY_EOL;</div><div class='ctx'> </div><div class='add'>+static inline struct mutex *kernfs_open_file_mutex_ptr(struct kernfs_node *kn)</div><div class='add'>+{</div><div class='add'>+	int idx = hash_ptr(kn, NR_KERNFS_LOCK_BITS);</div><div class='add'>+</div><div class='add'>+	return &amp;kernfs_locks-&gt;open_file_mutex[idx];</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline struct mutex *kernfs_open_file_mutex_lock(struct kernfs_node *kn)</div><div class='add'>+{</div><div class='add'>+	struct mutex *lock;</div><div class='add'>+</div><div class='add'>+	lock = kernfs_open_file_mutex_ptr(kn);</div><div class='add'>+</div><div class='add'>+	mutex_lock(lock);</div><div class='add'>+</div><div class='add'>+	return lock;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * of_on - Get the kernfs_open_node of the specified kernfs_open_file</div><div class='add'>+ * @of: target kernfs_open_file</div><div class='add'>+ *</div><div class='add'>+ * Return: the kernfs_open_node of the kernfs_open_file</div><div class='add'>+ */</div><div class='add'>+static struct kernfs_open_node *of_on(struct kernfs_open_file *of)</div><div class='add'>+{</div><div class='add'>+	return rcu_dereference_protected(of-&gt;kn-&gt;attr.open,</div><div class='add'>+					 !list_empty(&amp;of-&gt;list));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Get active reference to kernfs node for an open file */</div><div class='add'>+static struct kernfs_open_file *kernfs_get_active_of(struct kernfs_open_file *of)</div><div class='add'>+{</div><div class='add'>+	/* Skip if file was already released */</div><div class='add'>+	if (unlikely(of-&gt;released))</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	if (!kernfs_get_active(of-&gt;kn))</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	return of;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void kernfs_put_active_of(struct kernfs_open_file *of)</div><div class='add'>+{</div><div class='add'>+	return kernfs_put_active(of-&gt;kn);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * kernfs_deref_open_node_locked - Get kernfs_open_node corresponding to @kn</div><div class='add'>+ *</div><div class='add'>+ * @kn: target kernfs_node.</div><div class='add'>+ *</div><div class='add'>+ * Fetch and return -&gt;attr.open of @kn when caller holds the</div><div class='add'>+ * kernfs_open_file_mutex_ptr(kn).</div><div class='add'>+ *</div><div class='add'>+ * Update of -&gt;attr.open happens under kernfs_open_file_mutex_ptr(kn). So when</div><div class='add'>+ * the caller guarantees that this mutex is being held, other updaters can't</div><div class='add'>+ * change -&gt;attr.open and this means that we can safely deref -&gt;attr.open</div><div class='add'>+ * outside RCU read-side critical section.</div><div class='add'>+ *</div><div class='add'>+ * The caller needs to make sure that kernfs_open_file_mutex is held.</div><div class='add'>+ *</div><div class='add'>+ * Return: @kn-&gt;attr.open when kernfs_open_file_mutex is held.</div><div class='add'>+ */</div><div class='add'>+static struct kernfs_open_node *</div><div class='add'>+kernfs_deref_open_node_locked(struct kernfs_node *kn)</div><div class='add'>+{</div><div class='add'>+	return rcu_dereference_protected(kn-&gt;attr.open,</div><div class='add'>+				lockdep_is_held(kernfs_open_file_mutex_ptr(kn)));</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static struct kernfs_open_file *kernfs_of(struct file *file)</div><div class='ctx'> {</div><div class='ctx'> 	return ((struct seq_file *)file-&gt;private_data)-&gt;private;</div><div class='hunk'>@@ -97,7 +157,7 @@ static void kernfs_seq_stop_active(struct seq_file *sf, void *v)</div><div class='ctx'> </div><div class='ctx'> 	if (ops-&gt;seq_stop)</div><div class='ctx'> 		ops-&gt;seq_stop(sf, v);</div><div class='del'>-	kernfs_put_active(of-&gt;kn);</div><div class='add'>+	kernfs_put_active_of(of);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void *kernfs_seq_start(struct seq_file *sf, loff_t *ppos)</div><div class='hunk'>@@ -110,7 +170,7 @@ static void *kernfs_seq_start(struct seq_file *sf, loff_t *ppos)</div><div class='ctx'> 	 * the ops aren't called concurrently for the same open file.</div><div class='ctx'> 	 */</div><div class='ctx'> 	mutex_lock(&amp;of-&gt;mutex);</div><div class='del'>-	if (!kernfs_get_active(of-&gt;kn))</div><div class='add'>+	if (!kernfs_get_active_of(of))</div><div class='ctx'> 		return ERR_PTR(-ENODEV);</div><div class='ctx'> </div><div class='ctx'> 	ops = kernfs_ops(of-&gt;kn);</div><div class='hunk'>@@ -120,13 +180,8 @@ static void *kernfs_seq_start(struct seq_file *sf, loff_t *ppos)</div><div class='ctx'> 		if (next == ERR_PTR(-ENODEV))</div><div class='ctx'> 			kernfs_seq_stop_active(sf, next);</div><div class='ctx'> 		return next;</div><div class='del'>-	} else {</div><div class='del'>-		/*</div><div class='del'>-		 * The same behavior and code as single_open().  Returns</div><div class='del'>-		 * !NULL if pos is at the beginning; otherwise, NULL.</div><div class='del'>-		 */</div><div class='del'>-		return NULL + !*ppos;</div><div class='ctx'> 	}</div><div class='add'>+	return single_start(sf, ppos);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void *kernfs_seq_next(struct seq_file *sf, void *v, loff_t *ppos)</div><div class='hunk'>@@ -163,7 +218,7 @@ static int kernfs_seq_show(struct seq_file *sf, void *v)</div><div class='ctx'> {</div><div class='ctx'> 	struct kernfs_open_file *of = sf-&gt;private;</div><div class='ctx'> </div><div class='del'>-	of-&gt;event = atomic_read(&amp;of-&gt;kn-&gt;attr.open-&gt;event);</div><div class='add'>+	of-&gt;event = atomic_read(&amp;of_on(of)-&gt;event);</div><div class='ctx'> </div><div class='ctx'> 	return of-&gt;kn-&gt;attr.ops-&gt;seq_show(sf, v);</div><div class='ctx'> }</div><div class='hunk'>@@ -201,20 +256,21 @@ static ssize_t kernfs_file_read_iter(struct kiocb *iocb, struct iov_iter *iter)</div><div class='ctx'> 	 * the ops aren't called concurrently for the same open file.</div><div class='ctx'> 	 */</div><div class='ctx'> 	mutex_lock(&amp;of-&gt;mutex);</div><div class='del'>-	if (!kernfs_get_active(of-&gt;kn)) {</div><div class='add'>+	if (!kernfs_get_active_of(of)) {</div><div class='ctx'> 		len = -ENODEV;</div><div class='ctx'> 		mutex_unlock(&amp;of-&gt;mutex);</div><div class='ctx'> 		goto out_free;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	of-&gt;event = atomic_read(&amp;of-&gt;kn-&gt;attr.open-&gt;event);</div><div class='add'>+	of-&gt;event = atomic_read(&amp;of_on(of)-&gt;event);</div><div class='add'>+</div><div class='ctx'> 	ops = kernfs_ops(of-&gt;kn);</div><div class='ctx'> 	if (ops-&gt;read)</div><div class='ctx'> 		len = ops-&gt;read(of, buf, len, iocb-&gt;ki_pos);</div><div class='ctx'> 	else</div><div class='ctx'> 		len = -EINVAL;</div><div class='ctx'> </div><div class='del'>-	kernfs_put_active(of-&gt;kn);</div><div class='add'>+	kernfs_put_active_of(of);</div><div class='ctx'> 	mutex_unlock(&amp;of-&gt;mutex);</div><div class='ctx'> </div><div class='ctx'> 	if (len &lt; 0)</div><div class='hunk'>@@ -249,7 +305,7 @@ static ssize_t kernfs_fop_read_iter(struct kiocb *iocb, struct iov_iter *iter)</div><div class='ctx'>  * There is no easy way for us to know if userspace is only doing a partial</div><div class='ctx'>  * write, so we don't support them. We expect the entire buffer to come on</div><div class='ctx'>  * the first write.  Hint: if you're writing a value, first read the file,</div><div class='del'>- * modify only the the value you're changing, then write entire buffer</div><div class='add'>+ * modify only the value you're changing, then write entire buffer</div><div class='ctx'>  * back.</div><div class='ctx'>  */</div><div class='ctx'> static ssize_t kernfs_fop_write_iter(struct kiocb *iocb, struct iov_iter *iter)</div><div class='hunk'>@@ -285,7 +341,7 @@ static ssize_t kernfs_fop_write_iter(struct kiocb *iocb, struct iov_iter *iter)</div><div class='ctx'> 	 * the ops aren't called concurrently for the same open file.</div><div class='ctx'> 	 */</div><div class='ctx'> 	mutex_lock(&amp;of-&gt;mutex);</div><div class='del'>-	if (!kernfs_get_active(of-&gt;kn)) {</div><div class='add'>+	if (!kernfs_get_active_of(of)) {</div><div class='ctx'> 		mutex_unlock(&amp;of-&gt;mutex);</div><div class='ctx'> 		len = -ENODEV;</div><div class='ctx'> 		goto out_free;</div><div class='hunk'>@@ -297,7 +353,7 @@ static ssize_t kernfs_fop_write_iter(struct kiocb *iocb, struct iov_iter *iter)</div><div class='ctx'> 	else</div><div class='ctx'> 		len = -EINVAL;</div><div class='ctx'> </div><div class='del'>-	kernfs_put_active(of-&gt;kn);</div><div class='add'>+	kernfs_put_active_of(of);</div><div class='ctx'> 	mutex_unlock(&amp;of-&gt;mutex);</div><div class='ctx'> </div><div class='ctx'> 	if (len &gt; 0)</div><div class='hunk'>@@ -319,13 +375,13 @@ static void kernfs_vma_open(struct vm_area_struct *vma)</div><div class='ctx'> 	if (!of-&gt;vm_ops)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	if (!kernfs_get_active(of-&gt;kn))</div><div class='add'>+	if (!kernfs_get_active_of(of))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	if (of-&gt;vm_ops-&gt;open)</div><div class='ctx'> 		of-&gt;vm_ops-&gt;open(vma);</div><div class='ctx'> </div><div class='del'>-	kernfs_put_active(of-&gt;kn);</div><div class='add'>+	kernfs_put_active_of(of);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static vm_fault_t kernfs_vma_fault(struct vm_fault *vmf)</div><div class='hunk'>@@ -337,14 +393,14 @@ static vm_fault_t kernfs_vma_fault(struct vm_fault *vmf)</div><div class='ctx'> 	if (!of-&gt;vm_ops)</div><div class='ctx'> 		return VM_FAULT_SIGBUS;</div><div class='ctx'> </div><div class='del'>-	if (!kernfs_get_active(of-&gt;kn))</div><div class='add'>+	if (!kernfs_get_active_of(of))</div><div class='ctx'> 		return VM_FAULT_SIGBUS;</div><div class='ctx'> </div><div class='ctx'> 	ret = VM_FAULT_SIGBUS;</div><div class='ctx'> 	if (of-&gt;vm_ops-&gt;fault)</div><div class='ctx'> 		ret = of-&gt;vm_ops-&gt;fault(vmf);</div><div class='ctx'> </div><div class='del'>-	kernfs_put_active(of-&gt;kn);</div><div class='add'>+	kernfs_put_active_of(of);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -357,7 +413,7 @@ static vm_fault_t kernfs_vma_page_mkwrite(struct vm_fault *vmf)</div><div class='ctx'> 	if (!of-&gt;vm_ops)</div><div class='ctx'> 		return VM_FAULT_SIGBUS;</div><div class='ctx'> </div><div class='del'>-	if (!kernfs_get_active(of-&gt;kn))</div><div class='add'>+	if (!kernfs_get_active_of(of))</div><div class='ctx'> 		return VM_FAULT_SIGBUS;</div><div class='ctx'> </div><div class='ctx'> 	ret = 0;</div><div class='hunk'>@@ -366,7 +422,7 @@ static vm_fault_t kernfs_vma_page_mkwrite(struct vm_fault *vmf)</div><div class='ctx'> 	else</div><div class='ctx'> 		file_update_time(file);</div><div class='ctx'> </div><div class='del'>-	kernfs_put_active(of-&gt;kn);</div><div class='add'>+	kernfs_put_active_of(of);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -380,71 +436,22 @@ static int kernfs_vma_access(struct vm_area_struct *vma, unsigned long addr,</div><div class='ctx'> 	if (!of-&gt;vm_ops)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	if (!kernfs_get_active(of-&gt;kn))</div><div class='add'>+	if (!kernfs_get_active_of(of))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	ret = -EINVAL;</div><div class='ctx'> 	if (of-&gt;vm_ops-&gt;access)</div><div class='ctx'> 		ret = of-&gt;vm_ops-&gt;access(vma, addr, buf, len, write);</div><div class='ctx'> </div><div class='del'>-	kernfs_put_active(of-&gt;kn);</div><div class='add'>+	kernfs_put_active_of(of);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_NUMA</div><div class='del'>-static int kernfs_vma_set_policy(struct vm_area_struct *vma,</div><div class='del'>-				 struct mempolicy *new)</div><div class='del'>-{</div><div class='del'>-	struct file *file = vma-&gt;vm_file;</div><div class='del'>-	struct kernfs_open_file *of = kernfs_of(file);</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (!of-&gt;vm_ops)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	if (!kernfs_get_active(of-&gt;kn))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	ret = 0;</div><div class='del'>-	if (of-&gt;vm_ops-&gt;set_policy)</div><div class='del'>-		ret = of-&gt;vm_ops-&gt;set_policy(vma, new);</div><div class='del'>-</div><div class='del'>-	kernfs_put_active(of-&gt;kn);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct mempolicy *kernfs_vma_get_policy(struct vm_area_struct *vma,</div><div class='del'>-					       unsigned long addr)</div><div class='del'>-{</div><div class='del'>-	struct file *file = vma-&gt;vm_file;</div><div class='del'>-	struct kernfs_open_file *of = kernfs_of(file);</div><div class='del'>-	struct mempolicy *pol;</div><div class='del'>-</div><div class='del'>-	if (!of-&gt;vm_ops)</div><div class='del'>-		return vma-&gt;vm_policy;</div><div class='del'>-</div><div class='del'>-	if (!kernfs_get_active(of-&gt;kn))</div><div class='del'>-		return vma-&gt;vm_policy;</div><div class='del'>-</div><div class='del'>-	pol = vma-&gt;vm_policy;</div><div class='del'>-	if (of-&gt;vm_ops-&gt;get_policy)</div><div class='del'>-		pol = of-&gt;vm_ops-&gt;get_policy(vma, addr);</div><div class='del'>-</div><div class='del'>-	kernfs_put_active(of-&gt;kn);</div><div class='del'>-	return pol;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#endif</div><div class='del'>-</div><div class='ctx'> static const struct vm_operations_struct kernfs_vm_ops = {</div><div class='ctx'> 	.open		= kernfs_vma_open,</div><div class='ctx'> 	.fault		= kernfs_vma_fault,</div><div class='ctx'> 	.page_mkwrite	= kernfs_vma_page_mkwrite,</div><div class='ctx'> 	.access		= kernfs_vma_access,</div><div class='del'>-#ifdef CONFIG_NUMA</div><div class='del'>-	.set_policy	= kernfs_vma_set_policy,</div><div class='del'>-	.get_policy	= kernfs_vma_get_policy,</div><div class='del'>-#endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static int kernfs_fop_mmap(struct file *file, struct vm_area_struct *vma)</div><div class='hunk'>@@ -458,7 +465,7 @@ static int kernfs_fop_mmap(struct file *file, struct vm_area_struct *vma)</div><div class='ctx'> 	 * warnings and we don't want to add spurious locking dependency</div><div class='ctx'> 	 * between the two.  Check whether mmap is actually implemented</div><div class='ctx'> 	 * without grabbing @of-&gt;mutex by testing HAS_MMAP flag.  See the</div><div class='del'>-	 * comment in kernfs_file_open() for more details.</div><div class='add'>+	 * comment in kernfs_fop_open() for more details.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (!(of-&gt;kn-&gt;flags &amp; KERNFS_HAS_MMAP))</div><div class='ctx'> 		return -ENODEV;</div><div class='hunk'>@@ -466,7 +473,7 @@ static int kernfs_fop_mmap(struct file *file, struct vm_area_struct *vma)</div><div class='ctx'> 	mutex_lock(&amp;of-&gt;mutex);</div><div class='ctx'> </div><div class='ctx'> 	rc = -ENODEV;</div><div class='del'>-	if (!kernfs_get_active(of-&gt;kn))</div><div class='add'>+	if (!kernfs_get_active_of(of))</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='ctx'> 	ops = kernfs_ops(of-&gt;kn);</div><div class='hunk'>@@ -490,16 +497,18 @@ static int kernfs_fop_mmap(struct file *file, struct vm_area_struct *vma)</div><div class='ctx'> 	 * It is not possible to successfully wrap close.</div><div class='ctx'> 	 * So error if someone is trying to use close.</div><div class='ctx'> 	 */</div><div class='del'>-	rc = -EINVAL;</div><div class='ctx'> 	if (vma-&gt;vm_ops &amp;&amp; vma-&gt;vm_ops-&gt;close)</div><div class='ctx'> 		goto out_put;</div><div class='ctx'> </div><div class='ctx'> 	rc = 0;</div><div class='del'>-	of-&gt;mmapped = true;</div><div class='del'>-	of-&gt;vm_ops = vma-&gt;vm_ops;</div><div class='add'>+	if (!of-&gt;mmapped) {</div><div class='add'>+		of-&gt;mmapped = true;</div><div class='add'>+		of_on(of)-&gt;nr_mmapped++;</div><div class='add'>+		of-&gt;vm_ops = vma-&gt;vm_ops;</div><div class='add'>+	}</div><div class='ctx'> 	vma-&gt;vm_ops = &amp;kernfs_vm_ops;</div><div class='ctx'> out_put:</div><div class='del'>-	kernfs_put_active(of-&gt;kn);</div><div class='add'>+	kernfs_put_active_of(of);</div><div class='ctx'> out_unlock:</div><div class='ctx'> 	mutex_unlock(&amp;of-&gt;mutex);</div><div class='ctx'> </div><div class='hunk'>@@ -514,84 +523,88 @@ out_unlock:</div><div class='ctx'>  *	If @kn-&gt;attr.open exists, increment its reference count; otherwise,</div><div class='ctx'>  *	create one.  @of is chained to the files list.</div><div class='ctx'>  *</div><div class='del'>- *	LOCKING:</div><div class='add'>+ *	Locking:</div><div class='ctx'>  *	Kernel thread context (may sleep).</div><div class='ctx'>  *</div><div class='del'>- *	RETURNS:</div><div class='del'>- *	0 on success, -errno on failure.</div><div class='add'>+ *	Return:</div><div class='add'>+ *	%0 on success, -errno on failure.</div><div class='ctx'>  */</div><div class='ctx'> static int kernfs_get_open_node(struct kernfs_node *kn,</div><div class='ctx'> 				struct kernfs_open_file *of)</div><div class='ctx'> {</div><div class='del'>-	struct kernfs_open_node *on, *new_on = NULL;</div><div class='del'>-</div><div class='del'>- retry:</div><div class='del'>-	mutex_lock(&amp;kernfs_open_file_mutex);</div><div class='del'>-	spin_lock_irq(&amp;kernfs_open_node_lock);</div><div class='add'>+	struct kernfs_open_node *on;</div><div class='add'>+	struct mutex *mutex;</div><div class='ctx'> </div><div class='del'>-	if (!kn-&gt;attr.open &amp;&amp; new_on) {</div><div class='del'>-		kn-&gt;attr.open = new_on;</div><div class='del'>-		new_on = NULL;</div><div class='del'>-	}</div><div class='add'>+	mutex = kernfs_open_file_mutex_lock(kn);</div><div class='add'>+	on = kernfs_deref_open_node_locked(kn);</div><div class='ctx'> </div><div class='del'>-	on = kn-&gt;attr.open;</div><div class='del'>-	if (on) {</div><div class='del'>-		atomic_inc(&amp;on-&gt;refcnt);</div><div class='del'>-		list_add_tail(&amp;of-&gt;list, &amp;on-&gt;files);</div><div class='add'>+	if (!on) {</div><div class='add'>+		/* not there, initialize a new one */</div><div class='add'>+		on = kzalloc(sizeof(*on), GFP_KERNEL);</div><div class='add'>+		if (!on) {</div><div class='add'>+			mutex_unlock(mutex);</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+		}</div><div class='add'>+		atomic_set(&amp;on-&gt;event, 1);</div><div class='add'>+		init_waitqueue_head(&amp;on-&gt;poll);</div><div class='add'>+		INIT_LIST_HEAD(&amp;on-&gt;files);</div><div class='add'>+		rcu_assign_pointer(kn-&gt;attr.open, on);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	spin_unlock_irq(&amp;kernfs_open_node_lock);</div><div class='del'>-	mutex_unlock(&amp;kernfs_open_file_mutex);</div><div class='add'>+	list_add_tail(&amp;of-&gt;list, &amp;on-&gt;files);</div><div class='add'>+	if (kn-&gt;flags &amp; KERNFS_HAS_RELEASE)</div><div class='add'>+		on-&gt;nr_to_release++;</div><div class='ctx'> </div><div class='del'>-	if (on) {</div><div class='del'>-		kfree(new_on);</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* not there, initialize a new one and retry */</div><div class='del'>-	new_on = kmalloc(sizeof(*new_on), GFP_KERNEL);</div><div class='del'>-	if (!new_on)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	atomic_set(&amp;new_on-&gt;refcnt, 0);</div><div class='del'>-	atomic_set(&amp;new_on-&gt;event, 1);</div><div class='del'>-	init_waitqueue_head(&amp;new_on-&gt;poll);</div><div class='del'>-	INIT_LIST_HEAD(&amp;new_on-&gt;files);</div><div class='del'>-	goto retry;</div><div class='add'>+	mutex_unlock(mutex);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- *	kernfs_put_open_node - put kernfs_open_node</div><div class='del'>- *	@kn: target kernfs_nodet</div><div class='add'>+ *	kernfs_unlink_open_file - Unlink @of from @kn.</div><div class='add'>+ *</div><div class='add'>+ *	@kn: target kernfs_node</div><div class='ctx'>  *	@of: associated kernfs_open_file</div><div class='add'>+ *	@open_failed: -&gt;open() failed, cancel -&gt;release()</div><div class='ctx'>  *</div><div class='del'>- *	Put @kn-&gt;attr.open and unlink @of from the files list.  If</div><div class='del'>- *	reference count reaches zero, disassociate and free it.</div><div class='add'>+ *	Unlink @of from list of @kn's associated open files. If list of</div><div class='add'>+ *	associated open files becomes empty, disassociate and free</div><div class='add'>+ *	kernfs_open_node.</div><div class='ctx'>  *</div><div class='ctx'>  *	LOCKING:</div><div class='ctx'>  *	None.</div><div class='ctx'>  */</div><div class='del'>-static void kernfs_put_open_node(struct kernfs_node *kn,</div><div class='del'>-				 struct kernfs_open_file *of)</div><div class='add'>+static void kernfs_unlink_open_file(struct kernfs_node *kn,</div><div class='add'>+				    struct kernfs_open_file *of,</div><div class='add'>+				    bool open_failed)</div><div class='ctx'> {</div><div class='del'>-	struct kernfs_open_node *on = kn-&gt;attr.open;</div><div class='del'>-	unsigned long flags;</div><div class='add'>+	struct kernfs_open_node *on;</div><div class='add'>+	struct mutex *mutex;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;kernfs_open_file_mutex);</div><div class='del'>-	spin_lock_irqsave(&amp;kernfs_open_node_lock, flags);</div><div class='add'>+	mutex = kernfs_open_file_mutex_lock(kn);</div><div class='ctx'> </div><div class='del'>-	if (of)</div><div class='del'>-		list_del(&amp;of-&gt;list);</div><div class='add'>+	on = kernfs_deref_open_node_locked(kn);</div><div class='add'>+	if (!on) {</div><div class='add'>+		mutex_unlock(mutex);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (atomic_dec_and_test(&amp;on-&gt;refcnt))</div><div class='del'>-		kn-&gt;attr.open = NULL;</div><div class='del'>-	else</div><div class='del'>-		on = NULL;</div><div class='add'>+	if (of) {</div><div class='add'>+		if (kn-&gt;flags &amp; KERNFS_HAS_RELEASE) {</div><div class='add'>+			WARN_ON_ONCE(of-&gt;released == open_failed);</div><div class='add'>+			if (open_failed)</div><div class='add'>+				on-&gt;nr_to_release--;</div><div class='add'>+		}</div><div class='add'>+		if (of-&gt;mmapped)</div><div class='add'>+			on-&gt;nr_mmapped--;</div><div class='add'>+		list_del(&amp;of-&gt;list);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	spin_unlock_irqrestore(&amp;kernfs_open_node_lock, flags);</div><div class='del'>-	mutex_unlock(&amp;kernfs_open_file_mutex);</div><div class='add'>+	if (list_empty(&amp;on-&gt;files)) {</div><div class='add'>+		rcu_assign_pointer(kn-&gt;attr.open, NULL);</div><div class='add'>+		kfree_rcu(on, rcu_head);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	kfree(on);</div><div class='add'>+	mutex_unlock(mutex);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int kernfs_fop_open(struct inode *inode, struct file *file)</div><div class='hunk'>@@ -641,11 +654,18 @@ static int kernfs_fop_open(struct inode *inode, struct file *file)</div><div class='ctx'> 	 * each file a separate locking class.  Let's differentiate on</div><div class='ctx'> 	 * whether the file has mmap or not for now.</div><div class='ctx'> 	 *</div><div class='del'>-	 * Both paths of the branch look the same.  They're supposed to</div><div class='add'>+	 * For similar reasons, writable and readonly files are given different</div><div class='add'>+	 * lockdep key, because the writable file /sys/power/resume may call vfs</div><div class='add'>+	 * lookup helpers for arbitrary paths and readonly files can be read by</div><div class='add'>+	 * overlayfs from vfs helpers when sysfs is a lower layer of overalyfs.</div><div class='add'>+	 *</div><div class='add'>+	 * All three cases look the same.  They're supposed to</div><div class='ctx'> 	 * look that way and give @of-&gt;mutex different static lockdep keys.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (has_mmap)</div><div class='ctx'> 		mutex_init(&amp;of-&gt;mutex);</div><div class='add'>+	else if (file-&gt;f_mode &amp; FMODE_WRITE)</div><div class='add'>+		mutex_init(&amp;of-&gt;mutex);</div><div class='ctx'> 	else</div><div class='ctx'> 		mutex_init(&amp;of-&gt;mutex);</div><div class='ctx'> </div><div class='hunk'>@@ -711,7 +731,7 @@ static int kernfs_fop_open(struct inode *inode, struct file *file)</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> err_put_node:</div><div class='del'>-	kernfs_put_open_node(kn, of);</div><div class='add'>+	kernfs_unlink_open_file(kn, of, true);</div><div class='ctx'> err_seq_release:</div><div class='ctx'> 	seq_release(inode, file);</div><div class='ctx'> err_free:</div><div class='hunk'>@@ -729,11 +749,11 @@ static void kernfs_release_file(struct kernfs_node *kn,</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * @of is guaranteed to have no other file operations in flight and</div><div class='ctx'> 	 * we just want to synchronize release and drain paths.</div><div class='del'>-	 * @kernfs_open_file_mutex is enough.  @of-&gt;mutex can't be used</div><div class='add'>+	 * @kernfs_open_file_mutex_ptr(kn) is enough. @of-&gt;mutex can't be used</div><div class='ctx'> 	 * here because drain path may be called from places which can</div><div class='ctx'> 	 * cause circular dependency.</div><div class='ctx'> 	 */</div><div class='del'>-	lockdep_assert_held(&amp;kernfs_open_file_mutex);</div><div class='add'>+	lockdep_assert_held(kernfs_open_file_mutex_ptr(kn));</div><div class='ctx'> </div><div class='ctx'> 	if (!of-&gt;released) {</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -743,6 +763,7 @@ static void kernfs_release_file(struct kernfs_node *kn,</div><div class='ctx'> 		 */</div><div class='ctx'> 		kn-&gt;attr.ops-&gt;release(of);</div><div class='ctx'> 		of-&gt;released = true;</div><div class='add'>+		of_on(of)-&gt;nr_to_release--;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -752,12 +773,14 @@ static int kernfs_fop_release(struct inode *inode, struct file *filp)</div><div class='ctx'> 	struct kernfs_open_file *of = kernfs_of(filp);</div><div class='ctx'> </div><div class='ctx'> 	if (kn-&gt;flags &amp; KERNFS_HAS_RELEASE) {</div><div class='del'>-		mutex_lock(&amp;kernfs_open_file_mutex);</div><div class='add'>+		struct mutex *mutex;</div><div class='add'>+</div><div class='add'>+		mutex = kernfs_open_file_mutex_lock(kn);</div><div class='ctx'> 		kernfs_release_file(kn, of);</div><div class='del'>-		mutex_unlock(&amp;kernfs_open_file_mutex);</div><div class='add'>+		mutex_unlock(mutex);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	kernfs_put_open_node(kn, of);</div><div class='add'>+	kernfs_unlink_open_file(kn, of, false);</div><div class='ctx'> 	seq_release(inode, filp);</div><div class='ctx'> 	kfree(of-&gt;prealloc_buf);</div><div class='ctx'> 	kfree(of);</div><div class='hunk'>@@ -765,37 +788,54 @@ static int kernfs_fop_release(struct inode *inode, struct file *filp)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+bool kernfs_should_drain_open_files(struct kernfs_node *kn)</div><div class='add'>+{</div><div class='add'>+	struct kernfs_open_node *on;</div><div class='add'>+	bool ret;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * @kn being deactivated guarantees that @kn-&gt;attr.open can't change</div><div class='add'>+	 * beneath us making the lockless test below safe.</div><div class='add'>+	 * Callers post kernfs_unbreak_active_protection may be counted in</div><div class='add'>+	 * kn-&gt;active by now, do not WARN_ON because of them.</div><div class='add'>+	 */</div><div class='add'>+</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	on = rcu_dereference(kn-&gt;attr.open);</div><div class='add'>+	ret = on &amp;&amp; (on-&gt;nr_mmapped || on-&gt;nr_to_release);</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> void kernfs_drain_open_files(struct kernfs_node *kn)</div><div class='ctx'> {</div><div class='ctx'> 	struct kernfs_open_node *on;</div><div class='ctx'> 	struct kernfs_open_file *of;</div><div class='add'>+	struct mutex *mutex;</div><div class='ctx'> </div><div class='del'>-	if (!(kn-&gt;flags &amp; (KERNFS_HAS_MMAP | KERNFS_HAS_RELEASE)))</div><div class='add'>+	mutex = kernfs_open_file_mutex_lock(kn);</div><div class='add'>+	on = kernfs_deref_open_node_locked(kn);</div><div class='add'>+	if (!on) {</div><div class='add'>+		mutex_unlock(mutex);</div><div class='ctx'> 		return;</div><div class='del'>-</div><div class='del'>-	spin_lock_irq(&amp;kernfs_open_node_lock);</div><div class='del'>-	on = kn-&gt;attr.open;</div><div class='del'>-	if (on)</div><div class='del'>-		atomic_inc(&amp;on-&gt;refcnt);</div><div class='del'>-	spin_unlock_irq(&amp;kernfs_open_node_lock);</div><div class='del'>-	if (!on)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;kernfs_open_file_mutex);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(of, &amp;on-&gt;files, list) {</div><div class='ctx'> 		struct inode *inode = file_inode(of-&gt;file);</div><div class='ctx'> </div><div class='del'>-		if (kn-&gt;flags &amp; KERNFS_HAS_MMAP)</div><div class='add'>+		if (of-&gt;mmapped) {</div><div class='ctx'> 			unmap_mapping_range(inode-&gt;i_mapping, 0, 0, 1);</div><div class='add'>+			of-&gt;mmapped = false;</div><div class='add'>+			on-&gt;nr_mmapped--;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		if (kn-&gt;flags &amp; KERNFS_HAS_RELEASE)</div><div class='ctx'> 			kernfs_release_file(kn, of);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	mutex_unlock(&amp;kernfs_open_file_mutex);</div><div class='del'>-</div><div class='del'>-	kernfs_put_open_node(kn, NULL);</div><div class='add'>+	WARN_ON_ONCE(on-&gt;nr_mmapped || on-&gt;nr_to_release);</div><div class='add'>+	mutex_unlock(mutex);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -814,8 +854,7 @@ void kernfs_drain_open_files(struct kernfs_node *kn)</div><div class='ctx'>  */</div><div class='ctx'> __poll_t kernfs_generic_poll(struct kernfs_open_file *of, poll_table *wait)</div><div class='ctx'> {</div><div class='del'>-	struct kernfs_node *kn = kernfs_dentry_node(of-&gt;file-&gt;f_path.dentry);</div><div class='del'>-	struct kernfs_open_node *on = kn-&gt;attr.open;</div><div class='add'>+	struct kernfs_open_node *on = of_on(of);</div><div class='ctx'> </div><div class='ctx'> 	poll_wait(of-&gt;file, &amp;on-&gt;poll, wait);</div><div class='ctx'> </div><div class='hunk'>@@ -831,7 +870,7 @@ static __poll_t kernfs_fop_poll(struct file *filp, poll_table *wait)</div><div class='ctx'> 	struct kernfs_node *kn = kernfs_dentry_node(filp-&gt;f_path.dentry);</div><div class='ctx'> 	__poll_t ret;</div><div class='ctx'> </div><div class='del'>-	if (!kernfs_get_active(kn))</div><div class='add'>+	if (!kernfs_get_active_of(of))</div><div class='ctx'> 		return DEFAULT_POLLMASK|EPOLLERR|EPOLLPRI;</div><div class='ctx'> </div><div class='ctx'> 	if (kn-&gt;attr.ops-&gt;poll)</div><div class='hunk'>@@ -839,7 +878,34 @@ static __poll_t kernfs_fop_poll(struct file *filp, poll_table *wait)</div><div class='ctx'> 	else</div><div class='ctx'> 		ret = kernfs_generic_poll(of, wait);</div><div class='ctx'> </div><div class='del'>-	kernfs_put_active(kn);</div><div class='add'>+	kernfs_put_active_of(of);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static loff_t kernfs_fop_llseek(struct file *file, loff_t offset, int whence)</div><div class='add'>+{</div><div class='add'>+	struct kernfs_open_file *of = kernfs_of(file);</div><div class='add'>+	const struct kernfs_ops *ops;</div><div class='add'>+	loff_t ret;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * @of-&gt;mutex nests outside active ref and is primarily to ensure that</div><div class='add'>+	 * the ops aren't called concurrently for the same open file.</div><div class='add'>+	 */</div><div class='add'>+	mutex_lock(&amp;of-&gt;mutex);</div><div class='add'>+	if (!kernfs_get_active_of(of)) {</div><div class='add'>+		mutex_unlock(&amp;of-&gt;mutex);</div><div class='add'>+		return -ENODEV;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ops = kernfs_ops(of-&gt;kn);</div><div class='add'>+	if (ops-&gt;llseek)</div><div class='add'>+		ret = ops-&gt;llseek(of, offset, whence);</div><div class='add'>+	else</div><div class='add'>+		ret = generic_file_llseek(file, offset, whence);</div><div class='add'>+</div><div class='add'>+	kernfs_put_active_of(of);</div><div class='add'>+	mutex_unlock(&amp;of-&gt;mutex);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -847,6 +913,7 @@ static void kernfs_notify_workfn(struct work_struct *work)</div><div class='ctx'> {</div><div class='ctx'> 	struct kernfs_node *kn;</div><div class='ctx'> 	struct kernfs_super_info *info;</div><div class='add'>+	struct kernfs_root *root;</div><div class='ctx'> repeat:</div><div class='ctx'> 	/* pop one off the notify_list */</div><div class='ctx'> 	spin_lock_irq(&amp;kernfs_notify_lock);</div><div class='hunk'>@@ -859,12 +926,15 @@ repeat:</div><div class='ctx'> 	kn-&gt;attr.notify_next = NULL;</div><div class='ctx'> 	spin_unlock_irq(&amp;kernfs_notify_lock);</div><div class='ctx'> </div><div class='add'>+	root = kernfs_root(kn);</div><div class='ctx'> 	/* kick fsnotify */</div><div class='del'>-	down_write(&amp;kernfs_rwsem);</div><div class='ctx'> </div><div class='add'>+	down_read(&amp;root-&gt;kernfs_supers_rwsem);</div><div class='add'>+	down_read(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> 	list_for_each_entry(info, &amp;kernfs_root(kn)-&gt;supers, node) {</div><div class='ctx'> 		struct kernfs_node *parent;</div><div class='ctx'> 		struct inode *p_inode = NULL;</div><div class='add'>+		const char *kn_name;</div><div class='ctx'> 		struct inode *inode;</div><div class='ctx'> 		struct qstr name;</div><div class='ctx'> </div><div class='hunk'>@@ -878,7 +948,8 @@ repeat:</div><div class='ctx'> 		if (!inode)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		name = (struct qstr)QSTR_INIT(kn-&gt;name, strlen(kn-&gt;name));</div><div class='add'>+		kn_name = kernfs_rcu_name(kn);</div><div class='add'>+		name = QSTR(kn_name);</div><div class='ctx'> 		parent = kernfs_get_parent(kn);</div><div class='ctx'> 		if (parent) {</div><div class='ctx'> 			p_inode = ilookup(info-&gt;sb, kernfs_ino(parent));</div><div class='hunk'>@@ -898,7 +969,8 @@ repeat:</div><div class='ctx'> 		iput(inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	up_write(&amp;kernfs_rwsem);</div><div class='add'>+	up_read(&amp;root-&gt;kernfs_rwsem);</div><div class='add'>+	up_read(&amp;root-&gt;kernfs_supers_rwsem);</div><div class='ctx'> 	kernfs_put(kn);</div><div class='ctx'> 	goto repeat;</div><div class='ctx'> }</div><div class='hunk'>@@ -920,13 +992,13 @@ void kernfs_notify(struct kernfs_node *kn)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	/* kick poll immediately */</div><div class='del'>-	spin_lock_irqsave(&amp;kernfs_open_node_lock, flags);</div><div class='del'>-	on = kn-&gt;attr.open;</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	on = rcu_dereference(kn-&gt;attr.open);</div><div class='ctx'> 	if (on) {</div><div class='ctx'> 		atomic_inc(&amp;on-&gt;event);</div><div class='ctx'> 		wake_up_interruptible(&amp;on-&gt;poll);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock_irqrestore(&amp;kernfs_open_node_lock, flags);</div><div class='add'>+	rcu_read_unlock();</div><div class='ctx'> </div><div class='ctx'> 	/* schedule work to kick fsnotify */</div><div class='ctx'> 	spin_lock_irqsave(&amp;kernfs_notify_lock, flags);</div><div class='hunk'>@@ -943,13 +1015,13 @@ EXPORT_SYMBOL_GPL(kernfs_notify);</div><div class='ctx'> const struct file_operations kernfs_file_fops = {</div><div class='ctx'> 	.read_iter	= kernfs_fop_read_iter,</div><div class='ctx'> 	.write_iter	= kernfs_fop_write_iter,</div><div class='del'>-	.llseek		= generic_file_llseek,</div><div class='add'>+	.llseek		= kernfs_fop_llseek,</div><div class='ctx'> 	.mmap		= kernfs_fop_mmap,</div><div class='ctx'> 	.open		= kernfs_fop_open,</div><div class='ctx'> 	.release	= kernfs_fop_release,</div><div class='ctx'> 	.poll		= kernfs_fop_poll,</div><div class='ctx'> 	.fsync		= noop_fsync,</div><div class='del'>-	.splice_read	= generic_file_splice_read,</div><div class='add'>+	.splice_read	= copy_splice_read,</div><div class='ctx'> 	.splice_write	= iter_file_splice_write,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -966,7 +1038,7 @@ const struct file_operations kernfs_file_fops = {</div><div class='ctx'>  * @ns: optional namespace tag of the file</div><div class='ctx'>  * @key: lockdep key for the file's active_ref, %NULL to disable lockdep</div><div class='ctx'>  *</div><div class='del'>- * Returns the created node on success, ERR_PTR() value on error.</div><div class='add'>+ * Return: the created node on success, ERR_PTR() value on error.</div><div class='ctx'>  */</div><div class='ctx'> struct kernfs_node *__kernfs_create_file(struct kernfs_node *parent,</div><div class='ctx'> 					 const char *name,</div><div class='hunk'>@@ -1000,7 +1072,7 @@ struct kernfs_node *__kernfs_create_file(struct kernfs_node *parent,</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * kn-&gt;attr.ops is accesible only while holding active ref.  We</div><div class='add'>+	 * kn-&gt;attr.ops is accessible only while holding active ref.  We</div><div class='ctx'> 	 * need to know whether some ops are implemented outside active</div><div class='ctx'> 	 * ref.  Cache their existence in flags.</div><div class='ctx'> 	 */</div><div class='head'>diff --git a/fs/kernfs/inode.c b/fs/kernfs/inode.c<br/>index c0eae1725435..a36aaee98dce 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/kernfs/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/kernfs/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/kernfs/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/kernfs/inode.c</a></div><div class='hunk'>@@ -24,45 +24,46 @@ static const struct inode_operations kernfs_iops = {</div><div class='ctx'> 	.listxattr	= kernfs_iop_listxattr,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static struct kernfs_iattrs *__kernfs_iattrs(struct kernfs_node *kn, int alloc)</div><div class='add'>+static struct kernfs_iattrs *__kernfs_iattrs(struct kernfs_node *kn, bool alloc)</div><div class='ctx'> {</div><div class='del'>-	static DEFINE_MUTEX(iattr_mutex);</div><div class='del'>-	struct kernfs_iattrs *ret;</div><div class='add'>+	struct kernfs_iattrs *ret __free(kfree) = NULL;</div><div class='add'>+	struct kernfs_iattrs *attr;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;iattr_mutex);</div><div class='add'>+	attr = READ_ONCE(kn-&gt;iattr);</div><div class='add'>+	if (attr || !alloc)</div><div class='add'>+		return attr;</div><div class='ctx'> </div><div class='del'>-	if (kn-&gt;iattr || !alloc)</div><div class='del'>-		goto out_unlock;</div><div class='del'>-</div><div class='del'>-	kn-&gt;iattr = kmem_cache_zalloc(kernfs_iattrs_cache, GFP_KERNEL);</div><div class='del'>-	if (!kn-&gt;iattr)</div><div class='del'>-		goto out_unlock;</div><div class='add'>+	ret = kmem_cache_zalloc(kernfs_iattrs_cache, GFP_KERNEL);</div><div class='add'>+	if (!ret)</div><div class='add'>+		return NULL;</div><div class='ctx'> </div><div class='ctx'> 	/* assign default attributes */</div><div class='del'>-	kn-&gt;iattr-&gt;ia_uid = GLOBAL_ROOT_UID;</div><div class='del'>-	kn-&gt;iattr-&gt;ia_gid = GLOBAL_ROOT_GID;</div><div class='del'>-</div><div class='del'>-	ktime_get_real_ts64(&amp;kn-&gt;iattr-&gt;ia_atime);</div><div class='del'>-	kn-&gt;iattr-&gt;ia_mtime = kn-&gt;iattr-&gt;ia_atime;</div><div class='del'>-	kn-&gt;iattr-&gt;ia_ctime = kn-&gt;iattr-&gt;ia_atime;</div><div class='del'>-</div><div class='del'>-	simple_xattrs_init(&amp;kn-&gt;iattr-&gt;xattrs);</div><div class='del'>-	atomic_set(&amp;kn-&gt;iattr-&gt;nr_user_xattrs, 0);</div><div class='del'>-	atomic_set(&amp;kn-&gt;iattr-&gt;user_xattr_size, 0);</div><div class='del'>-out_unlock:</div><div class='del'>-	ret = kn-&gt;iattr;</div><div class='del'>-	mutex_unlock(&amp;iattr_mutex);</div><div class='del'>-	return ret;</div><div class='add'>+	ret-&gt;ia_uid = GLOBAL_ROOT_UID;</div><div class='add'>+	ret-&gt;ia_gid = GLOBAL_ROOT_GID;</div><div class='add'>+</div><div class='add'>+	ktime_get_real_ts64(&amp;ret-&gt;ia_atime);</div><div class='add'>+	ret-&gt;ia_mtime = ret-&gt;ia_atime;</div><div class='add'>+	ret-&gt;ia_ctime = ret-&gt;ia_atime;</div><div class='add'>+</div><div class='add'>+	simple_xattrs_init(&amp;ret-&gt;xattrs);</div><div class='add'>+	atomic_set(&amp;ret-&gt;nr_user_xattrs, 0);</div><div class='add'>+	atomic_set(&amp;ret-&gt;user_xattr_size, 0);</div><div class='add'>+</div><div class='add'>+	/* If someone raced us, recognize it. */</div><div class='add'>+	if (!try_cmpxchg(&amp;kn-&gt;iattr, &amp;attr, ret))</div><div class='add'>+		return READ_ONCE(kn-&gt;iattr);</div><div class='add'>+</div><div class='add'>+	return no_free_ptr(ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct kernfs_iattrs *kernfs_iattrs(struct kernfs_node *kn)</div><div class='ctx'> {</div><div class='del'>-	return __kernfs_iattrs(kn, 1);</div><div class='add'>+	return __kernfs_iattrs(kn, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct kernfs_iattrs *kernfs_iattrs_noalloc(struct kernfs_node *kn)</div><div class='ctx'> {</div><div class='del'>-	return __kernfs_iattrs(kn, 0);</div><div class='add'>+	return __kernfs_iattrs(kn, false);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int __kernfs_setattr(struct kernfs_node *kn, const struct iattr *iattr)</div><div class='hunk'>@@ -94,30 +95,33 @@ int __kernfs_setattr(struct kernfs_node *kn, const struct iattr *iattr)</div><div class='ctx'>  * @kn: target node</div><div class='ctx'>  * @iattr: iattr to set</div><div class='ctx'>  *</div><div class='del'>- * Returns 0 on success, -errno on failure.</div><div class='add'>+ * Return: %0 on success, -errno on failure.</div><div class='ctx'>  */</div><div class='ctx'> int kernfs_setattr(struct kernfs_node *kn, const struct iattr *iattr)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='add'>+	struct kernfs_root *root = kernfs_root(kn);</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;kernfs_rwsem);</div><div class='add'>+	down_write(&amp;root-&gt;kernfs_iattr_rwsem);</div><div class='ctx'> 	ret = __kernfs_setattr(kn, iattr);</div><div class='del'>-	up_write(&amp;kernfs_rwsem);</div><div class='add'>+	up_write(&amp;root-&gt;kernfs_iattr_rwsem);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int kernfs_iop_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='add'>+int kernfs_iop_setattr(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		       struct iattr *iattr)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	struct kernfs_node *kn = inode-&gt;i_private;</div><div class='add'>+	struct kernfs_root *root;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='ctx'> 	if (!kn)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;kernfs_rwsem);</div><div class='del'>-	error = setattr_prepare(&amp;init_user_ns, dentry, iattr);</div><div class='add'>+	root = kernfs_root(kn);</div><div class='add'>+	down_write(&amp;root-&gt;kernfs_iattr_rwsem);</div><div class='add'>+	error = setattr_prepare(&amp;nop_mnt_idmap, dentry, iattr);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -126,10 +130,10 @@ int kernfs_iop_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	/* this ignores size changes */</div><div class='del'>-	setattr_copy(&amp;init_user_ns, inode, iattr);</div><div class='add'>+	setattr_copy(&amp;nop_mnt_idmap, inode, iattr);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	up_write(&amp;kernfs_rwsem);</div><div class='add'>+	up_write(&amp;root-&gt;kernfs_iattr_rwsem);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -148,8 +152,7 @@ ssize_t kernfs_iop_listxattr(struct dentry *dentry, char *buf, size_t size)</div><div class='ctx'> static inline void set_default_inode_attr(struct inode *inode, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	inode-&gt;i_mode = mode;</div><div class='del'>-	inode-&gt;i_atime = inode-&gt;i_mtime =</div><div class='del'>-		inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	simple_inode_init_ts(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void set_inode_attr(struct inode *inode,</div><div class='hunk'>@@ -157,16 +160,17 @@ static inline void set_inode_attr(struct inode *inode,</div><div class='ctx'> {</div><div class='ctx'> 	inode-&gt;i_uid = attrs-&gt;ia_uid;</div><div class='ctx'> 	inode-&gt;i_gid = attrs-&gt;ia_gid;</div><div class='del'>-	inode-&gt;i_atime = attrs-&gt;ia_atime;</div><div class='del'>-	inode-&gt;i_mtime = attrs-&gt;ia_mtime;</div><div class='del'>-	inode-&gt;i_ctime = attrs-&gt;ia_ctime;</div><div class='add'>+	inode_set_atime_to_ts(inode, attrs-&gt;ia_atime);</div><div class='add'>+	inode_set_mtime_to_ts(inode, attrs-&gt;ia_mtime);</div><div class='add'>+	inode_set_ctime_to_ts(inode, attrs-&gt;ia_ctime);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void kernfs_refresh_inode(struct kernfs_node *kn, struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct kernfs_iattrs *attrs = kn-&gt;iattr;</div><div class='add'>+	struct kernfs_iattrs *attrs;</div><div class='ctx'> </div><div class='ctx'> 	inode-&gt;i_mode = kn-&gt;mode;</div><div class='add'>+	attrs = kernfs_iattrs_noalloc(kn);</div><div class='ctx'> 	if (attrs)</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * kernfs_node has non-default attributes get them from</div><div class='hunk'>@@ -178,19 +182,18 @@ static void kernfs_refresh_inode(struct kernfs_node *kn, struct inode *inode)</div><div class='ctx'> 		set_nlink(inode, kn-&gt;dir.subdirs + 2);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int kernfs_iop_getattr(struct user_namespace *mnt_userns,</div><div class='add'>+int kernfs_iop_getattr(struct mnt_idmap *idmap,</div><div class='ctx'> 		       const struct path *path, struct kstat *stat,</div><div class='ctx'> 		       u32 request_mask, unsigned int query_flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(path-&gt;dentry);</div><div class='ctx'> 	struct kernfs_node *kn = inode-&gt;i_private;</div><div class='add'>+	struct kernfs_root *root = kernfs_root(kn);</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;kernfs_rwsem);</div><div class='del'>-	spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+	down_read(&amp;root-&gt;kernfs_iattr_rwsem);</div><div class='ctx'> 	kernfs_refresh_inode(kn, inode);</div><div class='del'>-	generic_fillattr(&amp;init_user_ns, inode, stat);</div><div class='del'>-	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='del'>-	up_read(&amp;kernfs_rwsem);</div><div class='add'>+	generic_fillattr(&amp;nop_mnt_idmap, request_mask, inode, stat);</div><div class='add'>+	up_read(&amp;root-&gt;kernfs_iattr_rwsem);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -237,18 +240,18 @@ static void kernfs_init_inode(struct kernfs_node *kn, struct inode *inode)</div><div class='ctx'>  *	allocated and basics are initialized.  New inode is returned</div><div class='ctx'>  *	locked.</div><div class='ctx'>  *</div><div class='del'>- *	LOCKING:</div><div class='add'>+ *	Locking:</div><div class='ctx'>  *	Kernel thread context (may sleep).</div><div class='ctx'>  *</div><div class='del'>- *	RETURNS:</div><div class='del'>- *	Pointer to allocated inode on success, NULL on failure.</div><div class='add'>+ *	Return:</div><div class='add'>+ *	Pointer to allocated inode on success, %NULL on failure.</div><div class='ctx'>  */</div><div class='ctx'> struct inode *kernfs_get_inode(struct super_block *sb, struct kernfs_node *kn)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> </div><div class='ctx'> 	inode = iget_locked(sb, kernfs_ino(kn));</div><div class='del'>-	if (inode &amp;&amp; (inode-&gt;i_state &amp; I_NEW))</div><div class='add'>+	if (inode &amp;&amp; (inode_state_read_once(inode) &amp; I_NEW))</div><div class='ctx'> 		kernfs_init_inode(kn, inode);</div><div class='ctx'> </div><div class='ctx'> 	return inode;</div><div class='hunk'>@@ -270,23 +273,23 @@ void kernfs_evict_inode(struct inode *inode)</div><div class='ctx'> 	kernfs_put(kn);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int kernfs_iop_permission(struct user_namespace *mnt_userns,</div><div class='add'>+int kernfs_iop_permission(struct mnt_idmap *idmap,</div><div class='ctx'> 			  struct inode *inode, int mask)</div><div class='ctx'> {</div><div class='ctx'> 	struct kernfs_node *kn;</div><div class='add'>+	struct kernfs_root *root;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (mask &amp; MAY_NOT_BLOCK)</div><div class='ctx'> 		return -ECHILD;</div><div class='ctx'> </div><div class='ctx'> 	kn = inode-&gt;i_private;</div><div class='add'>+	root = kernfs_root(kn);</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;kernfs_rwsem);</div><div class='del'>-	spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+	down_read(&amp;root-&gt;kernfs_iattr_rwsem);</div><div class='ctx'> 	kernfs_refresh_inode(kn, inode);</div><div class='del'>-	ret = generic_permission(&amp;init_user_ns, inode, mask);</div><div class='del'>-	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='del'>-	up_read(&amp;kernfs_rwsem);</div><div class='add'>+	ret = generic_permission(&amp;nop_mnt_idmap, inode, mask);</div><div class='add'>+	up_read(&amp;root-&gt;kernfs_iattr_rwsem);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -304,11 +307,19 @@ int kernfs_xattr_get(struct kernfs_node *kn, const char *name,</div><div class='ctx'> int kernfs_xattr_set(struct kernfs_node *kn, const char *name,</div><div class='ctx'> 		     const void *value, size_t size, int flags)</div><div class='ctx'> {</div><div class='del'>-	struct kernfs_iattrs *attrs = kernfs_iattrs(kn);</div><div class='add'>+	struct simple_xattr *old_xattr;</div><div class='add'>+	struct kernfs_iattrs *attrs;</div><div class='add'>+</div><div class='add'>+	attrs = kernfs_iattrs(kn);</div><div class='ctx'> 	if (!attrs)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	return simple_xattr_set(&amp;attrs-&gt;xattrs, name, value, size, flags, NULL);</div><div class='add'>+	old_xattr = simple_xattr_set(&amp;attrs-&gt;xattrs, name, value, size, flags);</div><div class='add'>+	if (IS_ERR(old_xattr))</div><div class='add'>+		return PTR_ERR(old_xattr);</div><div class='add'>+</div><div class='add'>+	simple_xattr_free(old_xattr);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int kernfs_vfs_xattr_get(const struct xattr_handler *handler,</div><div class='hunk'>@@ -322,7 +333,7 @@ static int kernfs_vfs_xattr_get(const struct xattr_handler *handler,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int kernfs_vfs_xattr_set(const struct xattr_handler *handler,</div><div class='del'>-				struct user_namespace *mnt_userns,</div><div class='add'>+				struct mnt_idmap *idmap,</div><div class='ctx'> 				struct dentry *unused, struct inode *inode,</div><div class='ctx'> 				const char *suffix, const void *value,</div><div class='ctx'> 				size_t size, int flags)</div><div class='hunk'>@@ -338,9 +349,10 @@ static int kernfs_vfs_user_xattr_add(struct kernfs_node *kn,</div><div class='ctx'> 				     struct simple_xattrs *xattrs,</div><div class='ctx'> 				     const void *value, size_t size, int flags)</div><div class='ctx'> {</div><div class='del'>-	atomic_t *sz = &amp;kn-&gt;iattr-&gt;user_xattr_size;</div><div class='del'>-	atomic_t *nr = &amp;kn-&gt;iattr-&gt;nr_user_xattrs;</div><div class='del'>-	ssize_t removed_size;</div><div class='add'>+	struct kernfs_iattrs *attr = kernfs_iattrs_noalloc(kn);</div><div class='add'>+	atomic_t *sz = &amp;attr-&gt;user_xattr_size;</div><div class='add'>+	atomic_t *nr = &amp;attr-&gt;nr_user_xattrs;</div><div class='add'>+	struct simple_xattr *old_xattr;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (atomic_inc_return(nr) &gt; KERNFS_MAX_USER_XATTRS) {</div><div class='hunk'>@@ -353,13 +365,18 @@ static int kernfs_vfs_user_xattr_add(struct kernfs_node *kn,</div><div class='ctx'> 		goto dec_size_out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = simple_xattr_set(xattrs, full_name, value, size, flags,</div><div class='del'>-			       &amp;removed_size);</div><div class='del'>-</div><div class='del'>-	if (!ret &amp;&amp; removed_size &gt;= 0)</div><div class='del'>-		size = removed_size;</div><div class='del'>-	else if (!ret)</div><div class='add'>+	old_xattr = simple_xattr_set(xattrs, full_name, value, size, flags);</div><div class='add'>+	if (!old_xattr)</div><div class='ctx'> 		return 0;</div><div class='add'>+</div><div class='add'>+	if (IS_ERR(old_xattr)) {</div><div class='add'>+		ret = PTR_ERR(old_xattr);</div><div class='add'>+		goto dec_size_out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = 0;</div><div class='add'>+	size = old_xattr-&gt;size;</div><div class='add'>+	simple_xattr_free(old_xattr);</div><div class='ctx'> dec_size_out:</div><div class='ctx'> 	atomic_sub(size, sz);</div><div class='ctx'> dec_count_out:</div><div class='hunk'>@@ -372,24 +389,26 @@ static int kernfs_vfs_user_xattr_rm(struct kernfs_node *kn,</div><div class='ctx'> 				    struct simple_xattrs *xattrs,</div><div class='ctx'> 				    const void *value, size_t size, int flags)</div><div class='ctx'> {</div><div class='del'>-	atomic_t *sz = &amp;kn-&gt;iattr-&gt;user_xattr_size;</div><div class='del'>-	atomic_t *nr = &amp;kn-&gt;iattr-&gt;nr_user_xattrs;</div><div class='del'>-	ssize_t removed_size;</div><div class='del'>-	int ret;</div><div class='add'>+	struct kernfs_iattrs *attr = kernfs_iattrs_noalloc(kn);</div><div class='add'>+	atomic_t *sz = &amp;attr-&gt;user_xattr_size;</div><div class='add'>+	atomic_t *nr = &amp;attr-&gt;nr_user_xattrs;</div><div class='add'>+	struct simple_xattr *old_xattr;</div><div class='ctx'> </div><div class='del'>-	ret = simple_xattr_set(xattrs, full_name, value, size, flags,</div><div class='del'>-			       &amp;removed_size);</div><div class='add'>+	old_xattr = simple_xattr_set(xattrs, full_name, value, size, flags);</div><div class='add'>+	if (!old_xattr)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	if (removed_size &gt;= 0) {</div><div class='del'>-		atomic_sub(removed_size, sz);</div><div class='del'>-		atomic_dec(nr);</div><div class='del'>-	}</div><div class='add'>+	if (IS_ERR(old_xattr))</div><div class='add'>+		return PTR_ERR(old_xattr);</div><div class='ctx'> </div><div class='del'>-	return ret;</div><div class='add'>+	atomic_sub(old_xattr-&gt;size, sz);</div><div class='add'>+	atomic_dec(nr);</div><div class='add'>+	simple_xattr_free(old_xattr);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int kernfs_vfs_user_xattr_set(const struct xattr_handler *handler,</div><div class='del'>-				     struct user_namespace *mnt_userns,</div><div class='add'>+				     struct mnt_idmap *idmap,</div><div class='ctx'> 				     struct dentry *unused, struct inode *inode,</div><div class='ctx'> 				     const char *suffix, const void *value,</div><div class='ctx'> 				     size_t size, int flags)</div><div class='hunk'>@@ -432,7 +451,7 @@ static const struct xattr_handler kernfs_user_xattr_handler = {</div><div class='ctx'> 	.set = kernfs_vfs_user_xattr_set,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-const struct xattr_handler *kernfs_xattr_handlers[] = {</div><div class='add'>+const struct xattr_handler * const kernfs_xattr_handlers[] = {</div><div class='ctx'> 	&amp;kernfs_trusted_xattr_handler,</div><div class='ctx'> 	&amp;kernfs_security_xattr_handler,</div><div class='ctx'> 	&amp;kernfs_user_xattr_handler,</div><div class='head'>diff --git a/fs/kernfs/kernfs-internal.h b/fs/kernfs/kernfs-internal.h<br/>index f9cc912c31e1..6061b6f70d2a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/kernfs/kernfs-internal.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/kernfs/kernfs-internal.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/kernfs/kernfs-internal.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/kernfs/kernfs-internal.h</a></div><div class='hunk'>@@ -31,6 +31,32 @@ struct kernfs_iattrs {</div><div class='ctx'> 	atomic_t		user_xattr_size;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+struct kernfs_root {</div><div class='add'>+	/* published fields */</div><div class='add'>+	struct kernfs_node	*kn;</div><div class='add'>+	unsigned int		flags;	/* KERNFS_ROOT_* flags */</div><div class='add'>+</div><div class='add'>+	/* private fields, do not use outside kernfs proper */</div><div class='add'>+	struct idr		ino_idr;</div><div class='add'>+	spinlock_t		kernfs_idr_lock;	/* root-&gt;ino_idr */</div><div class='add'>+	u32			last_id_lowbits;</div><div class='add'>+	u32			id_highbits;</div><div class='add'>+	struct kernfs_syscall_ops *syscall_ops;</div><div class='add'>+</div><div class='add'>+	/* list of kernfs_super_info of this root, protected by kernfs_rwsem */</div><div class='add'>+	struct list_head	supers;</div><div class='add'>+</div><div class='add'>+	wait_queue_head_t	deactivate_waitq;</div><div class='add'>+	struct rw_semaphore	kernfs_rwsem;</div><div class='add'>+	struct rw_semaphore	kernfs_iattr_rwsem;</div><div class='add'>+	struct rw_semaphore	kernfs_supers_rwsem;</div><div class='add'>+</div><div class='add'>+	/* kn-&gt;parent and kn-&gt;name */</div><div class='add'>+	rwlock_t		kernfs_rename_lock;</div><div class='add'>+</div><div class='add'>+	struct rcu_head		rcu;</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> /* +1 to avoid triggering overflow warning when negating it */</div><div class='ctx'> #define KN_DEACTIVATED_BIAS		(INT_MIN + 1)</div><div class='ctx'> </div><div class='hunk'>@@ -40,13 +66,16 @@ struct kernfs_iattrs {</div><div class='ctx'>  * kernfs_root - find out the kernfs_root a kernfs_node belongs to</div><div class='ctx'>  * @kn: kernfs_node of interest</div><div class='ctx'>  *</div><div class='del'>- * Return the kernfs_root @kn belongs to.</div><div class='add'>+ * Return: the kernfs_root @kn belongs to.</div><div class='ctx'>  */</div><div class='del'>-static inline struct kernfs_root *kernfs_root(struct kernfs_node *kn)</div><div class='add'>+static inline struct kernfs_root *kernfs_root(const struct kernfs_node *kn)</div><div class='ctx'> {</div><div class='add'>+	const struct kernfs_node *knp;</div><div class='ctx'> 	/* if parent exists, it's always a dir; otherwise, @sd is a dir */</div><div class='del'>-	if (kn-&gt;parent)</div><div class='del'>-		kn = kn-&gt;parent;</div><div class='add'>+	guard(rcu)();</div><div class='add'>+	knp = rcu_dereference(kn-&gt;__parent);</div><div class='add'>+	if (knp)</div><div class='add'>+		kn = knp;</div><div class='ctx'> 	return kn-&gt;dir.root;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -75,6 +104,38 @@ struct kernfs_super_info {</div><div class='ctx'> };</div><div class='ctx'> #define kernfs_info(SB) ((struct kernfs_super_info *)(SB-&gt;s_fs_info))</div><div class='ctx'> </div><div class='add'>+static inline bool kernfs_root_is_locked(const struct kernfs_node *kn)</div><div class='add'>+{</div><div class='add'>+	return lockdep_is_held(&amp;kernfs_root(kn)-&gt;kernfs_rwsem);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool kernfs_rename_is_locked(const struct kernfs_node *kn)</div><div class='add'>+{</div><div class='add'>+	return lockdep_is_held(&amp;kernfs_root(kn)-&gt;kernfs_rename_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline const char *kernfs_rcu_name(const struct kernfs_node *kn)</div><div class='add'>+{</div><div class='add'>+	return rcu_dereference_check(kn-&gt;name, kernfs_root_is_locked(kn));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline struct kernfs_node *kernfs_parent(const struct kernfs_node *kn)</div><div class='add'>+{</div><div class='add'>+	/*</div><div class='add'>+	 * The kernfs_node::__parent remains valid within a RCU section. The kn</div><div class='add'>+	 * can be reparented (and renamed) which changes the entry. This can be</div><div class='add'>+	 * avoided by locking kernfs_root::kernfs_rwsem or</div><div class='add'>+	 * kernfs_root::kernfs_rename_lock.</div><div class='add'>+	 * Both locks can be used to obtain a reference on __parent. Once the</div><div class='add'>+	 * reference count reaches 0 then the node is about to be freed</div><div class='add'>+	 * and can not be renamed (or become a different parent) anymore.</div><div class='add'>+	 */</div><div class='add'>+	return rcu_dereference_check(kn-&gt;__parent,</div><div class='add'>+				     kernfs_root_is_locked(kn) ||</div><div class='add'>+				     kernfs_rename_is_locked(kn) ||</div><div class='add'>+				     !atomic_read(&amp;kn-&gt;count));</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline struct kernfs_node *kernfs_dentry_node(struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	if (d_really_is_negative(dentry))</div><div class='hunk'>@@ -107,13 +168,13 @@ extern struct kmem_cache *kernfs_node_cache, *kernfs_iattrs_cache;</div><div class='ctx'> /*</div><div class='ctx'>  * inode.c</div><div class='ctx'>  */</div><div class='del'>-extern const struct xattr_handler *kernfs_xattr_handlers[];</div><div class='add'>+extern const struct xattr_handler * const kernfs_xattr_handlers[];</div><div class='ctx'> void kernfs_evict_inode(struct inode *inode);</div><div class='del'>-int kernfs_iop_permission(struct user_namespace *mnt_userns,</div><div class='add'>+int kernfs_iop_permission(struct mnt_idmap *idmap,</div><div class='ctx'> 			  struct inode *inode, int mask);</div><div class='del'>-int kernfs_iop_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='add'>+int kernfs_iop_setattr(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		       struct iattr *iattr);</div><div class='del'>-int kernfs_iop_getattr(struct user_namespace *mnt_userns,</div><div class='add'>+int kernfs_iop_getattr(struct mnt_idmap *idmap,</div><div class='ctx'> 		       const struct path *path, struct kstat *stat,</div><div class='ctx'> 		       u32 request_mask, unsigned int query_flags);</div><div class='ctx'> ssize_t kernfs_iop_listxattr(struct dentry *dentry, char *buf, size_t size);</div><div class='hunk'>@@ -122,7 +183,6 @@ int __kernfs_setattr(struct kernfs_node *kn, const struct iattr *iattr);</div><div class='ctx'> /*</div><div class='ctx'>  * dir.c</div><div class='ctx'>  */</div><div class='del'>-extern struct rw_semaphore kernfs_rwsem;</div><div class='ctx'> extern const struct dentry_operations kernfs_dops;</div><div class='ctx'> extern const struct file_operations kernfs_dir_fops;</div><div class='ctx'> extern const struct inode_operations kernfs_dir_iops;</div><div class='hunk'>@@ -140,6 +200,7 @@ struct kernfs_node *kernfs_new_node(struct kernfs_node *parent,</div><div class='ctx'>  */</div><div class='ctx'> extern const struct file_operations kernfs_file_fops;</div><div class='ctx'> </div><div class='add'>+bool kernfs_should_drain_open_files(struct kernfs_node *kn);</div><div class='ctx'> void kernfs_drain_open_files(struct kernfs_node *kn);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -147,4 +208,8 @@ void kernfs_drain_open_files(struct kernfs_node *kn);</div><div class='ctx'>  */</div><div class='ctx'> extern const struct inode_operations kernfs_symlink_iops;</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * kernfs locks</div><div class='add'>+ */</div><div class='add'>+extern struct kernfs_global_locks *kernfs_locks;</div><div class='ctx'> #endif	/* __KERNFS_INTERNAL_H */</div><div class='head'>diff --git a/fs/kernfs/mount.c b/fs/kernfs/mount.c<br/>index f2f909d09f52..3ac52e141766 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/kernfs/mount.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/kernfs/mount.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/kernfs/mount.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/kernfs/mount.c</a></div><div class='hunk'>@@ -16,10 +16,14 @@</div><div class='ctx'> #include &lt;linux/namei.h&gt;</div><div class='ctx'> #include &lt;linux/seq_file.h&gt;</div><div class='ctx'> #include &lt;linux/exportfs.h&gt;</div><div class='add'>+#include &lt;linux/uuid.h&gt;</div><div class='add'>+#include &lt;linux/statfs.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "kernfs-internal.h"</div><div class='ctx'> </div><div class='del'>-struct kmem_cache *kernfs_node_cache, *kernfs_iattrs_cache;</div><div class='add'>+struct kmem_cache *kernfs_node_cache __ro_after_init;</div><div class='add'>+struct kmem_cache *kernfs_iattrs_cache __ro_after_init;</div><div class='add'>+struct kernfs_global_locks *kernfs_locks __ro_after_init;</div><div class='ctx'> </div><div class='ctx'> static int kernfs_sop_show_options(struct seq_file *sf, struct dentry *dentry)</div><div class='ctx'> {</div><div class='hunk'>@@ -44,13 +48,35 @@ static int kernfs_sop_show_path(struct seq_file *sf, struct dentry *dentry)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int kernfs_statfs(struct dentry *dentry, struct kstatfs *buf)</div><div class='add'>+{</div><div class='add'>+	simple_statfs(dentry, buf);</div><div class='add'>+	buf-&gt;f_fsid = uuid_to_fsid(dentry-&gt;d_sb-&gt;s_uuid.b);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> const struct super_operations kernfs_sops = {</div><div class='del'>-	.statfs		= simple_statfs,</div><div class='del'>-	.drop_inode	= generic_delete_inode,</div><div class='add'>+	.statfs		= kernfs_statfs,</div><div class='add'>+	.drop_inode	= inode_just_drop,</div><div class='ctx'> 	.evict_inode	= kernfs_evict_inode,</div><div class='ctx'> </div><div class='ctx'> 	.show_options	= kernfs_sop_show_options,</div><div class='ctx'> 	.show_path	= kernfs_sop_show_path,</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * sysfs is built on top of kernfs and sysfs provides the power</div><div class='add'>+	 * management infrastructure to support suspend/hibernate by</div><div class='add'>+	 * writing to various files in /sys/power/. As filesystems may</div><div class='add'>+	 * be automatically frozen during suspend/hibernate implementing</div><div class='add'>+	 * freeze/thaw support for kernfs generically will cause</div><div class='add'>+	 * deadlocks as the suspending/hibernation initiating task will</div><div class='add'>+	 * hold a VFS lock that it will then wait upon to be released.</div><div class='add'>+	 * If freeze/thaw for kernfs is needed talk to the VFS.</div><div class='add'>+	 */</div><div class='add'>+	.freeze_fs	= NULL,</div><div class='add'>+	.unfreeze_fs	= NULL,</div><div class='add'>+	.freeze_super	= NULL,</div><div class='add'>+	.thaw_super	= NULL,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static int kernfs_encode_fh(struct inode *inode, __u32 *fh, int *max_len,</div><div class='hunk'>@@ -114,9 +140,6 @@ static struct dentry *__kernfs_fh_to_dentry(struct super_block *sb,</div><div class='ctx'> </div><div class='ctx'> 	inode = kernfs_get_inode(sb, kn);</div><div class='ctx'> 	kernfs_put(kn);</div><div class='del'>-	if (!inode)</div><div class='del'>-		return ERR_PTR(-ESTALE);</div><div class='del'>-</div><div class='ctx'> 	return d_obtain_alias(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -137,8 +160,10 @@ static struct dentry *kernfs_fh_to_parent(struct super_block *sb,</div><div class='ctx'> static struct dentry *kernfs_get_parent_dentry(struct dentry *child)</div><div class='ctx'> {</div><div class='ctx'> 	struct kernfs_node *kn = kernfs_dentry_node(child);</div><div class='add'>+	struct kernfs_root *root = kernfs_root(kn);</div><div class='ctx'> </div><div class='del'>-	return d_obtain_alias(kernfs_get_inode(child-&gt;d_sb, kn-&gt;parent));</div><div class='add'>+	guard(rwsem_read)(&amp;root-&gt;kernfs_rwsem);</div><div class='add'>+	return d_obtain_alias(kernfs_get_inode(child-&gt;d_sb, kernfs_parent(kn)));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct export_operations kernfs_export_ops = {</div><div class='hunk'>@@ -152,7 +177,7 @@ static const struct export_operations kernfs_export_ops = {</div><div class='ctx'>  * kernfs_root_from_sb - determine kernfs_root associated with a super_block</div><div class='ctx'>  * @sb: the super_block in question</div><div class='ctx'>  *</div><div class='del'>- * Return the kernfs_root associated with @sb.  If @sb is not a kernfs one,</div><div class='add'>+ * Return: the kernfs_root associated with @sb.  If @sb is not a kernfs one,</div><div class='ctx'>  * %NULL is returned.</div><div class='ctx'>  */</div><div class='ctx'> struct kernfs_root *kernfs_root_from_sb(struct super_block *sb)</div><div class='hunk'>@@ -166,7 +191,7 @@ struct kernfs_root *kernfs_root_from_sb(struct super_block *sb)</div><div class='ctx'>  * find the next ancestor in the path down to @child, where @parent was the</div><div class='ctx'>  * ancestor whose descendant we want to find.</div><div class='ctx'>  *</div><div class='del'>- * Say the path is /a/b/c/d.  @child is d, @parent is NULL.  We return the root</div><div class='add'>+ * Say the path is /a/b/c/d.  @child is d, @parent is %NULL.  We return the root</div><div class='ctx'>  * node.  If @parent is b, then we return the node for c.</div><div class='ctx'>  * Passing in d as @parent is not ok.</div><div class='ctx'>  */</div><div class='hunk'>@@ -178,10 +203,10 @@ static struct kernfs_node *find_next_ancestor(struct kernfs_node *child,</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	while (child-&gt;parent != parent) {</div><div class='del'>-		if (!child-&gt;parent)</div><div class='add'>+	while (kernfs_parent(child) != parent) {</div><div class='add'>+		child = kernfs_parent(child);</div><div class='add'>+		if (!child)</div><div class='ctx'> 			return NULL;</div><div class='del'>-		child = child-&gt;parent;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return child;</div><div class='hunk'>@@ -191,22 +216,35 @@ static struct kernfs_node *find_next_ancestor(struct kernfs_node *child,</div><div class='ctx'>  * kernfs_node_dentry - get a dentry for the given kernfs_node</div><div class='ctx'>  * @kn: kernfs_node for which a dentry is needed</div><div class='ctx'>  * @sb: the kernfs super_block</div><div class='add'>+ *</div><div class='add'>+ * Return: the dentry pointer</div><div class='ctx'>  */</div><div class='ctx'> struct dentry *kernfs_node_dentry(struct kernfs_node *kn,</div><div class='ctx'> 				  struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dentry;</div><div class='del'>-	struct kernfs_node *knparent = NULL;</div><div class='add'>+	struct kernfs_node *knparent;</div><div class='add'>+	struct kernfs_root *root;</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(sb-&gt;s_op != &amp;kernfs_sops);</div><div class='ctx'> </div><div class='ctx'> 	dentry = dget(sb-&gt;s_root);</div><div class='ctx'> </div><div class='ctx'> 	/* Check if this is the root kernfs_node */</div><div class='del'>-	if (!kn-&gt;parent)</div><div class='add'>+	if (!rcu_access_pointer(kn-&gt;__parent))</div><div class='ctx'> 		return dentry;</div><div class='ctx'> </div><div class='del'>-	knparent = find_next_ancestor(kn, NULL);</div><div class='add'>+	root = kernfs_root(kn);</div><div class='add'>+	/*</div><div class='add'>+	 * As long as kn is valid, its parent can not vanish. This is cgroup's</div><div class='add'>+	 * kn so it can't have its parent replaced. Therefore it is safe to use</div><div class='add'>+	 * the ancestor node outside of the RCU or locked section.</div><div class='add'>+	 */</div><div class='add'>+	if (WARN_ON_ONCE(!(root-&gt;flags &amp; KERNFS_ROOT_INVARIANT_PARENT)))</div><div class='add'>+		return ERR_PTR(-EINVAL);</div><div class='add'>+	scoped_guard(rcu) {</div><div class='add'>+		knparent = find_next_ancestor(kn, NULL);</div><div class='add'>+	}</div><div class='ctx'> 	if (WARN_ON(!knparent)) {</div><div class='ctx'> 		dput(dentry);</div><div class='ctx'> 		return ERR_PTR(-EINVAL);</div><div class='hunk'>@@ -215,17 +253,26 @@ struct dentry *kernfs_node_dentry(struct kernfs_node *kn,</div><div class='ctx'> 	do {</div><div class='ctx'> 		struct dentry *dtmp;</div><div class='ctx'> 		struct kernfs_node *kntmp;</div><div class='add'>+		const char *name;</div><div class='ctx'> </div><div class='ctx'> 		if (kn == knparent)</div><div class='ctx'> 			return dentry;</div><div class='del'>-		kntmp = find_next_ancestor(kn, knparent);</div><div class='del'>-		if (WARN_ON(!kntmp)) {</div><div class='add'>+</div><div class='add'>+		scoped_guard(rwsem_read, &amp;root-&gt;kernfs_rwsem) {</div><div class='add'>+			kntmp = find_next_ancestor(kn, knparent);</div><div class='add'>+			if (WARN_ON(!kntmp)) {</div><div class='add'>+				dput(dentry);</div><div class='add'>+				return ERR_PTR(-EINVAL);</div><div class='add'>+			}</div><div class='add'>+			name = kstrdup(kernfs_rcu_name(kntmp), GFP_KERNEL);</div><div class='add'>+		}</div><div class='add'>+		if (!name) {</div><div class='ctx'> 			dput(dentry);</div><div class='del'>-			return ERR_PTR(-EINVAL);</div><div class='add'>+			return ERR_PTR(-ENOMEM);</div><div class='ctx'> 		}</div><div class='del'>-		dtmp = lookup_positive_unlocked(kntmp-&gt;name, dentry,</div><div class='del'>-					       strlen(kntmp-&gt;name));</div><div class='add'>+		dtmp = lookup_noperm_positive_unlocked(&amp;QSTR(name), dentry);</div><div class='ctx'> 		dput(dentry);</div><div class='add'>+		kfree(name);</div><div class='ctx'> 		if (IS_ERR(dtmp))</div><div class='ctx'> 			return dtmp;</div><div class='ctx'> 		knparent = kntmp;</div><div class='hunk'>@@ -236,6 +283,7 @@ struct dentry *kernfs_node_dentry(struct kernfs_node *kn,</div><div class='ctx'> static int kernfs_fill_super(struct super_block *sb, struct kernfs_fs_context *kfc)</div><div class='ctx'> {</div><div class='ctx'> 	struct kernfs_super_info *info = kernfs_info(sb);</div><div class='add'>+	struct kernfs_root *kf_root = kfc-&gt;root;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct dentry *root;</div><div class='ctx'> </div><div class='hunk'>@@ -250,14 +298,15 @@ static int kernfs_fill_super(struct super_block *sb, struct kernfs_fs_context *k</div><div class='ctx'> 	if (info-&gt;root-&gt;flags &amp; KERNFS_ROOT_SUPPORT_EXPORTOP)</div><div class='ctx'> 		sb-&gt;s_export_op = &amp;kernfs_export_ops;</div><div class='ctx'> 	sb-&gt;s_time_gran = 1;</div><div class='add'>+	sb-&gt;s_maxbytes  = MAX_LFS_FILESIZE;</div><div class='ctx'> </div><div class='ctx'> 	/* sysfs dentries and inodes don't require IO to create */</div><div class='del'>-	sb-&gt;s_shrink.seeks = 0;</div><div class='add'>+	sb-&gt;s_shrink-&gt;seeks = 0;</div><div class='ctx'> </div><div class='ctx'> 	/* get root inode, initialize and unlock it */</div><div class='del'>-	down_read(&amp;kernfs_rwsem);</div><div class='add'>+	down_read(&amp;kf_root-&gt;kernfs_rwsem);</div><div class='ctx'> 	inode = kernfs_get_inode(sb, info-&gt;root-&gt;kn);</div><div class='del'>-	up_read(&amp;kernfs_rwsem);</div><div class='add'>+	up_read(&amp;kf_root-&gt;kernfs_rwsem);</div><div class='ctx'> 	if (!inode) {</div><div class='ctx'> 		pr_debug("kernfs: could not get root inode\n");</div><div class='ctx'> 		return -ENOMEM;</div><div class='hunk'>@@ -270,7 +319,7 @@ static int kernfs_fill_super(struct super_block *sb, struct kernfs_fs_context *k</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	}</div><div class='ctx'> 	sb-&gt;s_root = root;</div><div class='del'>-	sb-&gt;s_d_op = &amp;kernfs_dops;</div><div class='add'>+	set_default_d_op(sb, &amp;kernfs_dops);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -294,7 +343,7 @@ static int kernfs_set_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'>  * kernfs_super_ns - determine the namespace tag of a kernfs super_block</div><div class='ctx'>  * @sb: super_block of interest</div><div class='ctx'>  *</div><div class='del'>- * Return the namespace tag associated with kernfs super_block @sb.</div><div class='add'>+ * Return: the namespace tag associated with kernfs super_block @sb.</div><div class='ctx'>  */</div><div class='ctx'> const void *kernfs_super_ns(struct super_block *sb)</div><div class='ctx'> {</div><div class='hunk'>@@ -311,6 +360,8 @@ const void *kernfs_super_ns(struct super_block *sb)</div><div class='ctx'>  * implementation, which should set the specified -&gt;@fs_type and -&gt;@flags, and</div><div class='ctx'>  * specify the hierarchy and namespace tag to mount via -&gt;@root and -&gt;@ns,</div><div class='ctx'>  * respectively.</div><div class='add'>+ *</div><div class='add'>+ * Return: %0 on success, -errno on failure.</div><div class='ctx'>  */</div><div class='ctx'> int kernfs_get_tree(struct fs_context *fc)</div><div class='ctx'> {</div><div class='hunk'>@@ -334,6 +385,7 @@ int kernfs_get_tree(struct fs_context *fc)</div><div class='ctx'> </div><div class='ctx'> 	if (!sb-&gt;s_root) {</div><div class='ctx'> 		struct kernfs_super_info *info = kernfs_info(sb);</div><div class='add'>+		struct kernfs_root *root = kfc-&gt;root;</div><div class='ctx'> </div><div class='ctx'> 		kfc-&gt;new_sb_created = true;</div><div class='ctx'> </div><div class='hunk'>@@ -344,9 +396,13 @@ int kernfs_get_tree(struct fs_context *fc)</div><div class='ctx'> 		}</div><div class='ctx'> 		sb-&gt;s_flags |= SB_ACTIVE;</div><div class='ctx'> </div><div class='del'>-		down_write(&amp;kernfs_rwsem);</div><div class='add'>+		uuid_t uuid;</div><div class='add'>+		uuid_gen(&amp;uuid);</div><div class='add'>+		super_set_uuid(sb, uuid.b, sizeof(uuid));</div><div class='add'>+</div><div class='add'>+		down_write(&amp;root-&gt;kernfs_supers_rwsem);</div><div class='ctx'> 		list_add(&amp;info-&gt;node, &amp;info-&gt;root-&gt;supers);</div><div class='del'>-		up_write(&amp;kernfs_rwsem);</div><div class='add'>+		up_write(&amp;root-&gt;kernfs_supers_rwsem);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	fc-&gt;root = dget(sb-&gt;s_root);</div><div class='hunk'>@@ -371,10 +427,11 @@ void kernfs_free_fs_context(struct fs_context *fc)</div><div class='ctx'> void kernfs_kill_sb(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct kernfs_super_info *info = kernfs_info(sb);</div><div class='add'>+	struct kernfs_root *root = info-&gt;root;</div><div class='ctx'> </div><div class='del'>-	down_write(&amp;kernfs_rwsem);</div><div class='add'>+	down_write(&amp;root-&gt;kernfs_supers_rwsem);</div><div class='ctx'> 	list_del(&amp;info-&gt;node);</div><div class='del'>-	up_write(&amp;kernfs_rwsem);</div><div class='add'>+	up_write(&amp;root-&gt;kernfs_supers_rwsem);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Remove the superblock from fs_supers/s_instances</div><div class='hunk'>@@ -384,6 +441,22 @@ void kernfs_kill_sb(struct super_block *sb)</div><div class='ctx'> 	kfree(info);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void __init kernfs_mutex_init(void)</div><div class='add'>+{</div><div class='add'>+	int count;</div><div class='add'>+</div><div class='add'>+	for (count = 0; count &lt; NR_KERNFS_LOCKS; count++)</div><div class='add'>+		mutex_init(&amp;kernfs_locks-&gt;open_file_mutex[count]);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void __init kernfs_lock_init(void)</div><div class='add'>+{</div><div class='add'>+	kernfs_locks = kmalloc(sizeof(struct kernfs_global_locks), GFP_KERNEL);</div><div class='add'>+	WARN_ON(!kernfs_locks);</div><div class='add'>+</div><div class='add'>+	kernfs_mutex_init();</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> void __init kernfs_init(void)</div><div class='ctx'> {</div><div class='ctx'> 	kernfs_node_cache = kmem_cache_create("kernfs_node_cache",</div><div class='hunk'>@@ -394,4 +467,6 @@ void __init kernfs_init(void)</div><div class='ctx'> 	kernfs_iattrs_cache  = kmem_cache_create("kernfs_iattrs_cache",</div><div class='ctx'> 					      sizeof(struct kernfs_iattrs),</div><div class='ctx'> 					      0, SLAB_PANIC, NULL);</div><div class='add'>+</div><div class='add'>+	kernfs_lock_init();</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/kernfs/symlink.c b/fs/kernfs/symlink.c<br/>index 19a6c71c6ff5..0bd8a2143723 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/kernfs/symlink.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/kernfs/symlink.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/kernfs/symlink.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/kernfs/symlink.c</a></div><div class='hunk'>@@ -19,7 +19,7 @@</div><div class='ctx'>  * @name: name of the symlink</div><div class='ctx'>  * @target: target node for the symlink to point to</div><div class='ctx'>  *</div><div class='del'>- * Returns the created node on success, ERR_PTR() value on error.</div><div class='add'>+ * Return: the created node on success, ERR_PTR() value on error.</div><div class='ctx'>  * Ownership of the link matches ownership of the target.</div><div class='ctx'>  */</div><div class='ctx'> struct kernfs_node *kernfs_create_link(struct kernfs_node *parent,</div><div class='hunk'>@@ -62,10 +62,10 @@ static int kernfs_get_target_path(struct kernfs_node *parent,</div><div class='ctx'> </div><div class='ctx'> 	/* go up to the root, stop at the base */</div><div class='ctx'> 	base = parent;</div><div class='del'>-	while (base-&gt;parent) {</div><div class='del'>-		kn = target-&gt;parent;</div><div class='del'>-		while (kn-&gt;parent &amp;&amp; base != kn)</div><div class='del'>-			kn = kn-&gt;parent;</div><div class='add'>+	while (kernfs_parent(base)) {</div><div class='add'>+		kn = kernfs_parent(target);</div><div class='add'>+		while (kernfs_parent(kn) &amp;&amp; base != kn)</div><div class='add'>+			kn = kernfs_parent(kn);</div><div class='ctx'> </div><div class='ctx'> 		if (base == kn)</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -75,14 +75,14 @@ static int kernfs_get_target_path(struct kernfs_node *parent,</div><div class='ctx'> </div><div class='ctx'> 		strcpy(s, "../");</div><div class='ctx'> 		s += 3;</div><div class='del'>-		base = base-&gt;parent;</div><div class='add'>+		base = kernfs_parent(base);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* determine end of target string for reverse fillup */</div><div class='ctx'> 	kn = target;</div><div class='del'>-	while (kn-&gt;parent &amp;&amp; kn != base) {</div><div class='del'>-		len += strlen(kn-&gt;name) + 1;</div><div class='del'>-		kn = kn-&gt;parent;</div><div class='add'>+	while (kernfs_parent(kn) &amp;&amp; kn != base) {</div><div class='add'>+		len += strlen(kernfs_rcu_name(kn)) + 1;</div><div class='add'>+		kn = kernfs_parent(kn);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* check limits */</div><div class='hunk'>@@ -94,15 +94,16 @@ static int kernfs_get_target_path(struct kernfs_node *parent,</div><div class='ctx'> </div><div class='ctx'> 	/* reverse fillup of target string from target to base */</div><div class='ctx'> 	kn = target;</div><div class='del'>-	while (kn-&gt;parent &amp;&amp; kn != base) {</div><div class='del'>-		int slen = strlen(kn-&gt;name);</div><div class='add'>+	while (kernfs_parent(kn) &amp;&amp; kn != base) {</div><div class='add'>+		const char *name = kernfs_rcu_name(kn);</div><div class='add'>+		int slen = strlen(name);</div><div class='ctx'> </div><div class='ctx'> 		len -= slen;</div><div class='del'>-		memcpy(s + len, kn-&gt;name, slen);</div><div class='add'>+		memcpy(s + len, name, slen);</div><div class='ctx'> 		if (len)</div><div class='ctx'> 			s[--len] = '/';</div><div class='ctx'> </div><div class='del'>-		kn = kn-&gt;parent;</div><div class='add'>+		kn = kernfs_parent(kn);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -111,13 +112,15 @@ static int kernfs_get_target_path(struct kernfs_node *parent,</div><div class='ctx'> static int kernfs_getlink(struct inode *inode, char *path)</div><div class='ctx'> {</div><div class='ctx'> 	struct kernfs_node *kn = inode-&gt;i_private;</div><div class='del'>-	struct kernfs_node *parent = kn-&gt;parent;</div><div class='add'>+	struct kernfs_node *parent;</div><div class='ctx'> 	struct kernfs_node *target = kn-&gt;symlink.target_kn;</div><div class='add'>+	struct kernfs_root *root = kernfs_root(kn);</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;kernfs_rwsem);</div><div class='add'>+	down_read(&amp;root-&gt;kernfs_rwsem);</div><div class='add'>+	parent = kernfs_parent(kn);</div><div class='ctx'> 	error = kernfs_get_target_path(parent, target, path);</div><div class='del'>-	up_read(&amp;kernfs_rwsem);</div><div class='add'>+	up_read(&amp;root-&gt;kernfs_rwsem);</div><div class='ctx'> </div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/ksmbd/connection.h b/fs/ksmbd/connection.h<br/>deleted file mode 100644<br/>index e5403c587a58..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ksmbd/connection.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ksmbd/connection.h</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,213 +0,0 @@</div><div class='del'>-/* SPDX-License-Identifier: GPL-2.0-or-later */</div><div class='del'>-/*</div><div class='del'>- *   Copyright (C) 2018 Samsung Electronics Co., Ltd.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#ifndef __KSMBD_CONNECTION_H__</div><div class='del'>-#define __KSMBD_CONNECTION_H__</div><div class='del'>-</div><div class='del'>-#include &lt;linux/list.h&gt;</div><div class='del'>-#include &lt;linux/ip.h&gt;</div><div class='del'>-#include &lt;net/sock.h&gt;</div><div class='del'>-#include &lt;net/tcp.h&gt;</div><div class='del'>-#include &lt;net/inet_connection_sock.h&gt;</div><div class='del'>-#include &lt;net/request_sock.h&gt;</div><div class='del'>-#include &lt;linux/kthread.h&gt;</div><div class='del'>-#include &lt;linux/nls.h&gt;</div><div class='del'>-</div><div class='del'>-#include "smb_common.h"</div><div class='del'>-#include "ksmbd_work.h"</div><div class='del'>-</div><div class='del'>-#define KSMBD_SOCKET_BACKLOG		16</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * WARNING</div><div class='del'>- *</div><div class='del'>- * This is nothing but a HACK. Session status should move to channel</div><div class='del'>- * or to session. As of now we have 1 tcp_conn : 1 ksmbd_session, but</div><div class='del'>- * we need to change it to 1 tcp_conn : N ksmbd_sessions.</div><div class='del'>- */</div><div class='del'>-enum {</div><div class='del'>-	KSMBD_SESS_NEW = 0,</div><div class='del'>-	KSMBD_SESS_GOOD,</div><div class='del'>-	KSMBD_SESS_EXITING,</div><div class='del'>-	KSMBD_SESS_NEED_RECONNECT,</div><div class='del'>-	KSMBD_SESS_NEED_NEGOTIATE</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct ksmbd_stats {</div><div class='del'>-	atomic_t			open_files_count;</div><div class='del'>-	atomic64_t			request_served;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct ksmbd_transport;</div><div class='del'>-</div><div class='del'>-struct ksmbd_conn {</div><div class='del'>-	struct smb_version_values	*vals;</div><div class='del'>-	struct smb_version_ops		*ops;</div><div class='del'>-	struct smb_version_cmds		*cmds;</div><div class='del'>-	unsigned int			max_cmds;</div><div class='del'>-	struct mutex			srv_mutex;</div><div class='del'>-	int				status;</div><div class='del'>-	unsigned int			cli_cap;</div><div class='del'>-	char				*request_buf;</div><div class='del'>-	struct ksmbd_transport		*transport;</div><div class='del'>-	struct nls_table		*local_nls;</div><div class='del'>-	struct list_head		conns_list;</div><div class='del'>-	/* smb session 1 per user */</div><div class='del'>-	struct list_head		sessions;</div><div class='del'>-	unsigned long			last_active;</div><div class='del'>-	/* How many request are running currently */</div><div class='del'>-	atomic_t			req_running;</div><div class='del'>-	/* References which are made for this Server object*/</div><div class='del'>-	atomic_t			r_count;</div><div class='del'>-	unsigned short			total_credits;</div><div class='del'>-	unsigned short			max_credits;</div><div class='del'>-	spinlock_t			credits_lock;</div><div class='del'>-	wait_queue_head_t		req_running_q;</div><div class='del'>-	/* Lock to protect requests list*/</div><div class='del'>-	spinlock_t			request_lock;</div><div class='del'>-	struct list_head		requests;</div><div class='del'>-	struct list_head		async_requests;</div><div class='del'>-	int				connection_type;</div><div class='del'>-	struct ksmbd_stats		stats;</div><div class='del'>-	char				ClientGUID[SMB2_CLIENT_GUID_SIZE];</div><div class='del'>-	union {</div><div class='del'>-		/* pending trans request table */</div><div class='del'>-		struct trans_state	*recent_trans;</div><div class='del'>-		/* Used by ntlmssp */</div><div class='del'>-		char			*ntlmssp_cryptkey;</div><div class='del'>-	};</div><div class='del'>-</div><div class='del'>-	spinlock_t			llist_lock;</div><div class='del'>-	struct list_head		lock_list;</div><div class='del'>-</div><div class='del'>-	struct preauth_integrity_info	*preauth_info;</div><div class='del'>-</div><div class='del'>-	bool				need_neg;</div><div class='del'>-	unsigned int			auth_mechs;</div><div class='del'>-	unsigned int			preferred_auth_mech;</div><div class='del'>-	bool				sign;</div><div class='del'>-	bool				use_spnego:1;</div><div class='del'>-	__u16				cli_sec_mode;</div><div class='del'>-	__u16				srv_sec_mode;</div><div class='del'>-	/* dialect index that server chose */</div><div class='del'>-	__u16				dialect;</div><div class='del'>-</div><div class='del'>-	char				*mechToken;</div><div class='del'>-</div><div class='del'>-	struct ksmbd_conn_ops	*conn_ops;</div><div class='del'>-</div><div class='del'>-	/* Preauth Session Table */</div><div class='del'>-	struct list_head		preauth_sess_table;</div><div class='del'>-</div><div class='del'>-	struct sockaddr_storage		peer_addr;</div><div class='del'>-</div><div class='del'>-	/* Identifier for async message */</div><div class='del'>-	struct ida			async_ida;</div><div class='del'>-</div><div class='del'>-	__le16				cipher_type;</div><div class='del'>-	__le16				compress_algorithm;</div><div class='del'>-	bool				posix_ext_supported;</div><div class='del'>-	bool				signing_negotiated;</div><div class='del'>-	__le16				signing_algorithm;</div><div class='del'>-	bool				binding;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct ksmbd_conn_ops {</div><div class='del'>-	int	(*process_fn)(struct ksmbd_conn *conn);</div><div class='del'>-	int	(*terminate_fn)(struct ksmbd_conn *conn);</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct ksmbd_transport_ops {</div><div class='del'>-	int (*prepare)(struct ksmbd_transport *t);</div><div class='del'>-	void (*disconnect)(struct ksmbd_transport *t);</div><div class='del'>-	int (*read)(struct ksmbd_transport *t, char *buf, unsigned int size);</div><div class='del'>-	int (*writev)(struct ksmbd_transport *t, struct kvec *iovs, int niov,</div><div class='del'>-		      int size, bool need_invalidate_rkey,</div><div class='del'>-		      unsigned int remote_key);</div><div class='del'>-	int (*rdma_read)(struct ksmbd_transport *t, void *buf, unsigned int len,</div><div class='del'>-			 u32 remote_key, u64 remote_offset, u32 remote_len);</div><div class='del'>-	int (*rdma_write)(struct ksmbd_transport *t, void *buf,</div><div class='del'>-			  unsigned int len, u32 remote_key, u64 remote_offset,</div><div class='del'>-			  u32 remote_len);</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct ksmbd_transport {</div><div class='del'>-	struct ksmbd_conn		*conn;</div><div class='del'>-	struct ksmbd_transport_ops	*ops;</div><div class='del'>-	struct task_struct		*handler;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-#define KSMBD_TCP_RECV_TIMEOUT	(7 * HZ)</div><div class='del'>-#define KSMBD_TCP_SEND_TIMEOUT	(5 * HZ)</div><div class='del'>-#define KSMBD_TCP_PEER_SOCKADDR(c)	((struct sockaddr *)&amp;((c)-&gt;peer_addr))</div><div class='del'>-</div><div class='del'>-extern struct list_head conn_list;</div><div class='del'>-extern rwlock_t conn_list_lock;</div><div class='del'>-</div><div class='del'>-bool ksmbd_conn_alive(struct ksmbd_conn *conn);</div><div class='del'>-void ksmbd_conn_wait_idle(struct ksmbd_conn *conn);</div><div class='del'>-struct ksmbd_conn *ksmbd_conn_alloc(void);</div><div class='del'>-void ksmbd_conn_free(struct ksmbd_conn *conn);</div><div class='del'>-bool ksmbd_conn_lookup_dialect(struct ksmbd_conn *c);</div><div class='del'>-int ksmbd_conn_write(struct ksmbd_work *work);</div><div class='del'>-int ksmbd_conn_rdma_read(struct ksmbd_conn *conn, void *buf,</div><div class='del'>-			 unsigned int buflen, u32 remote_key, u64 remote_offset,</div><div class='del'>-			 u32 remote_len);</div><div class='del'>-int ksmbd_conn_rdma_write(struct ksmbd_conn *conn, void *buf,</div><div class='del'>-			  unsigned int buflen, u32 remote_key, u64 remote_offset,</div><div class='del'>-			  u32 remote_len);</div><div class='del'>-void ksmbd_conn_enqueue_request(struct ksmbd_work *work);</div><div class='del'>-int ksmbd_conn_try_dequeue_request(struct ksmbd_work *work);</div><div class='del'>-void ksmbd_conn_init_server_callbacks(struct ksmbd_conn_ops *ops);</div><div class='del'>-int ksmbd_conn_handler_loop(void *p);</div><div class='del'>-int ksmbd_conn_transport_init(void);</div><div class='del'>-void ksmbd_conn_transport_destroy(void);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * WARNING</div><div class='del'>- *</div><div class='del'>- * This is a hack. We will move status to a proper place once we land</div><div class='del'>- * a multi-sessions support.</div><div class='del'>- */</div><div class='del'>-static inline bool ksmbd_conn_good(struct ksmbd_work *work)</div><div class='del'>-{</div><div class='del'>-	return work-&gt;conn-&gt;status == KSMBD_SESS_GOOD;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline bool ksmbd_conn_need_negotiate(struct ksmbd_work *work)</div><div class='del'>-{</div><div class='del'>-	return work-&gt;conn-&gt;status == KSMBD_SESS_NEED_NEGOTIATE;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline bool ksmbd_conn_need_reconnect(struct ksmbd_work *work)</div><div class='del'>-{</div><div class='del'>-	return work-&gt;conn-&gt;status == KSMBD_SESS_NEED_RECONNECT;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline bool ksmbd_conn_exiting(struct ksmbd_work *work)</div><div class='del'>-{</div><div class='del'>-	return work-&gt;conn-&gt;status == KSMBD_SESS_EXITING;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void ksmbd_conn_set_good(struct ksmbd_work *work)</div><div class='del'>-{</div><div class='del'>-	work-&gt;conn-&gt;status = KSMBD_SESS_GOOD;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void ksmbd_conn_set_need_negotiate(struct ksmbd_work *work)</div><div class='del'>-{</div><div class='del'>-	work-&gt;conn-&gt;status = KSMBD_SESS_NEED_NEGOTIATE;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void ksmbd_conn_set_need_reconnect(struct ksmbd_work *work)</div><div class='del'>-{</div><div class='del'>-	work-&gt;conn-&gt;status = KSMBD_SESS_NEED_RECONNECT;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void ksmbd_conn_set_exiting(struct ksmbd_work *work)</div><div class='del'>-{</div><div class='del'>-	work-&gt;conn-&gt;status = KSMBD_SESS_EXITING;</div><div class='del'>-}</div><div class='del'>-#endif /* __CONNECTION_H__ */</div><div class='head'>diff --git a/fs/ksmbd/ksmbd_work.c b/fs/ksmbd/ksmbd_work.c<br/>deleted file mode 100644<br/>index fd58eb4809f6..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ksmbd/ksmbd_work.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ksmbd/ksmbd_work.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,80 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='del'>-/*</div><div class='del'>- *   Copyright (C) 2019 Samsung Electronics Co., Ltd.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#include &lt;linux/list.h&gt;</div><div class='del'>-#include &lt;linux/mm.h&gt;</div><div class='del'>-#include &lt;linux/slab.h&gt;</div><div class='del'>-#include &lt;linux/workqueue.h&gt;</div><div class='del'>-</div><div class='del'>-#include "server.h"</div><div class='del'>-#include "connection.h"</div><div class='del'>-#include "ksmbd_work.h"</div><div class='del'>-#include "mgmt/ksmbd_ida.h"</div><div class='del'>-</div><div class='del'>-static struct kmem_cache *work_cache;</div><div class='del'>-static struct workqueue_struct *ksmbd_wq;</div><div class='del'>-</div><div class='del'>-struct ksmbd_work *ksmbd_alloc_work_struct(void)</div><div class='del'>-{</div><div class='del'>-	struct ksmbd_work *work = kmem_cache_zalloc(work_cache, GFP_KERNEL);</div><div class='del'>-</div><div class='del'>-	if (work) {</div><div class='del'>-		work-&gt;compound_fid = KSMBD_NO_FID;</div><div class='del'>-		work-&gt;compound_pfid = KSMBD_NO_FID;</div><div class='del'>-		INIT_LIST_HEAD(&amp;work-&gt;request_entry);</div><div class='del'>-		INIT_LIST_HEAD(&amp;work-&gt;async_request_entry);</div><div class='del'>-		INIT_LIST_HEAD(&amp;work-&gt;fp_entry);</div><div class='del'>-		INIT_LIST_HEAD(&amp;work-&gt;interim_entry);</div><div class='del'>-	}</div><div class='del'>-	return work;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void ksmbd_free_work_struct(struct ksmbd_work *work)</div><div class='del'>-{</div><div class='del'>-	WARN_ON(work-&gt;saved_cred != NULL);</div><div class='del'>-</div><div class='del'>-	kvfree(work-&gt;response_buf);</div><div class='del'>-	kvfree(work-&gt;aux_payload_buf);</div><div class='del'>-	kfree(work-&gt;tr_buf);</div><div class='del'>-	kvfree(work-&gt;request_buf);</div><div class='del'>-	if (work-&gt;async_id)</div><div class='del'>-		ksmbd_release_id(&amp;work-&gt;conn-&gt;async_ida, work-&gt;async_id);</div><div class='del'>-	kmem_cache_free(work_cache, work);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void ksmbd_work_pool_destroy(void)</div><div class='del'>-{</div><div class='del'>-	kmem_cache_destroy(work_cache);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int ksmbd_work_pool_init(void)</div><div class='del'>-{</div><div class='del'>-	work_cache = kmem_cache_create("ksmbd_work_cache",</div><div class='del'>-				       sizeof(struct ksmbd_work), 0,</div><div class='del'>-				       SLAB_HWCACHE_ALIGN, NULL);</div><div class='del'>-	if (!work_cache)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int ksmbd_workqueue_init(void)</div><div class='del'>-{</div><div class='del'>-	ksmbd_wq = alloc_workqueue("ksmbd-io", 0, 0);</div><div class='del'>-	if (!ksmbd_wq)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void ksmbd_workqueue_destroy(void)</div><div class='del'>-{</div><div class='del'>-	flush_workqueue(ksmbd_wq);</div><div class='del'>-	destroy_workqueue(ksmbd_wq);</div><div class='del'>-	ksmbd_wq = NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-bool ksmbd_queue_work(struct ksmbd_work *work)</div><div class='del'>-{</div><div class='del'>-	return queue_work(ksmbd_wq, &amp;work-&gt;work);</div><div class='del'>-}</div><div class='head'>diff --git a/fs/ksmbd/mgmt/user_config.c b/fs/ksmbd/mgmt/user_config.c<br/>deleted file mode 100644<br/>index 1019d3677d55..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ksmbd/mgmt/user_config.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ksmbd/mgmt/user_config.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,69 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='del'>-/*</div><div class='del'>- *   Copyright (C) 2018 Samsung Electronics Co., Ltd.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#include &lt;linux/slab.h&gt;</div><div class='del'>-#include &lt;linux/mm.h&gt;</div><div class='del'>-</div><div class='del'>-#include "user_config.h"</div><div class='del'>-#include "../transport_ipc.h"</div><div class='del'>-</div><div class='del'>-struct ksmbd_user *ksmbd_login_user(const char *account)</div><div class='del'>-{</div><div class='del'>-	struct ksmbd_login_response *resp;</div><div class='del'>-	struct ksmbd_user *user = NULL;</div><div class='del'>-</div><div class='del'>-	resp = ksmbd_ipc_login_request(account);</div><div class='del'>-	if (!resp)</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	if (!(resp-&gt;status &amp; KSMBD_USER_FLAG_OK))</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	user = ksmbd_alloc_user(resp);</div><div class='del'>-out:</div><div class='del'>-	kvfree(resp);</div><div class='del'>-	return user;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct ksmbd_user *ksmbd_alloc_user(struct ksmbd_login_response *resp)</div><div class='del'>-{</div><div class='del'>-	struct ksmbd_user *user = NULL;</div><div class='del'>-</div><div class='del'>-	user = kmalloc(sizeof(struct ksmbd_user), GFP_KERNEL);</div><div class='del'>-	if (!user)</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	user-&gt;name = kstrdup(resp-&gt;account, GFP_KERNEL);</div><div class='del'>-	user-&gt;flags = resp-&gt;status;</div><div class='del'>-	user-&gt;gid = resp-&gt;gid;</div><div class='del'>-	user-&gt;uid = resp-&gt;uid;</div><div class='del'>-	user-&gt;passkey_sz = resp-&gt;hash_sz;</div><div class='del'>-	user-&gt;passkey = kmalloc(resp-&gt;hash_sz, GFP_KERNEL);</div><div class='del'>-	if (user-&gt;passkey)</div><div class='del'>-		memcpy(user-&gt;passkey, resp-&gt;hash, resp-&gt;hash_sz);</div><div class='del'>-</div><div class='del'>-	if (!user-&gt;name || !user-&gt;passkey) {</div><div class='del'>-		kfree(user-&gt;name);</div><div class='del'>-		kfree(user-&gt;passkey);</div><div class='del'>-		kfree(user);</div><div class='del'>-		user = NULL;</div><div class='del'>-	}</div><div class='del'>-	return user;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void ksmbd_free_user(struct ksmbd_user *user)</div><div class='del'>-{</div><div class='del'>-	ksmbd_ipc_logout_request(user-&gt;name, user-&gt;flags);</div><div class='del'>-	kfree(user-&gt;name);</div><div class='del'>-	kfree(user-&gt;passkey);</div><div class='del'>-	kfree(user);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int ksmbd_anonymous_user(struct ksmbd_user *user)</div><div class='del'>-{</div><div class='del'>-	if (user-&gt;name[0] == '\0')</div><div class='del'>-		return 1;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='head'>diff --git a/fs/ksmbd/mgmt/user_session.c b/fs/ksmbd/mgmt/user_session.c<br/>deleted file mode 100644<br/>index 8d8ffd8c6f19..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ksmbd/mgmt/user_session.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ksmbd/mgmt/user_session.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,369 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='del'>-/*</div><div class='del'>- *   Copyright (C) 2018 Samsung Electronics Co., Ltd.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#include &lt;linux/list.h&gt;</div><div class='del'>-#include &lt;linux/slab.h&gt;</div><div class='del'>-#include &lt;linux/rwsem.h&gt;</div><div class='del'>-#include &lt;linux/xarray.h&gt;</div><div class='del'>-</div><div class='del'>-#include "ksmbd_ida.h"</div><div class='del'>-#include "user_session.h"</div><div class='del'>-#include "user_config.h"</div><div class='del'>-#include "tree_connect.h"</div><div class='del'>-#include "../transport_ipc.h"</div><div class='del'>-#include "../connection.h"</div><div class='del'>-#include "../vfs_cache.h"</div><div class='del'>-</div><div class='del'>-static DEFINE_IDA(session_ida);</div><div class='del'>-</div><div class='del'>-#define SESSION_HASH_BITS		3</div><div class='del'>-static DEFINE_HASHTABLE(sessions_table, SESSION_HASH_BITS);</div><div class='del'>-static DECLARE_RWSEM(sessions_table_lock);</div><div class='del'>-</div><div class='del'>-struct ksmbd_session_rpc {</div><div class='del'>-	int			id;</div><div class='del'>-	unsigned int		method;</div><div class='del'>-	struct list_head	list;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static void free_channel_list(struct ksmbd_session *sess)</div><div class='del'>-{</div><div class='del'>-	struct channel *chann, *tmp;</div><div class='del'>-</div><div class='del'>-	list_for_each_entry_safe(chann, tmp, &amp;sess-&gt;ksmbd_chann_list,</div><div class='del'>-				 chann_list) {</div><div class='del'>-		list_del(&amp;chann-&gt;chann_list);</div><div class='del'>-		kfree(chann);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void __session_rpc_close(struct ksmbd_session *sess,</div><div class='del'>-				struct ksmbd_session_rpc *entry)</div><div class='del'>-{</div><div class='del'>-	struct ksmbd_rpc_command *resp;</div><div class='del'>-</div><div class='del'>-	resp = ksmbd_rpc_close(sess, entry-&gt;id);</div><div class='del'>-	if (!resp)</div><div class='del'>-		pr_err("Unable to close RPC pipe %d\n", entry-&gt;id);</div><div class='del'>-</div><div class='del'>-	kvfree(resp);</div><div class='del'>-	ksmbd_rpc_id_free(entry-&gt;id);</div><div class='del'>-	kfree(entry);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void ksmbd_session_rpc_clear_list(struct ksmbd_session *sess)</div><div class='del'>-{</div><div class='del'>-	struct ksmbd_session_rpc *entry;</div><div class='del'>-</div><div class='del'>-	while (!list_empty(&amp;sess-&gt;rpc_handle_list)) {</div><div class='del'>-		entry = list_entry(sess-&gt;rpc_handle_list.next,</div><div class='del'>-				   struct ksmbd_session_rpc,</div><div class='del'>-				   list);</div><div class='del'>-</div><div class='del'>-		list_del(&amp;entry-&gt;list);</div><div class='del'>-		__session_rpc_close(sess, entry);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int __rpc_method(char *rpc_name)</div><div class='del'>-{</div><div class='del'>-	if (!strcmp(rpc_name, "\\srvsvc") || !strcmp(rpc_name, "srvsvc"))</div><div class='del'>-		return KSMBD_RPC_SRVSVC_METHOD_INVOKE;</div><div class='del'>-</div><div class='del'>-	if (!strcmp(rpc_name, "\\wkssvc") || !strcmp(rpc_name, "wkssvc"))</div><div class='del'>-		return KSMBD_RPC_WKSSVC_METHOD_INVOKE;</div><div class='del'>-</div><div class='del'>-	if (!strcmp(rpc_name, "LANMAN") || !strcmp(rpc_name, "lanman"))</div><div class='del'>-		return KSMBD_RPC_RAP_METHOD;</div><div class='del'>-</div><div class='del'>-	if (!strcmp(rpc_name, "\\samr") || !strcmp(rpc_name, "samr"))</div><div class='del'>-		return KSMBD_RPC_SAMR_METHOD_INVOKE;</div><div class='del'>-</div><div class='del'>-	if (!strcmp(rpc_name, "\\lsarpc") || !strcmp(rpc_name, "lsarpc"))</div><div class='del'>-		return KSMBD_RPC_LSARPC_METHOD_INVOKE;</div><div class='del'>-</div><div class='del'>-	pr_err("Unsupported RPC: %s\n", rpc_name);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int ksmbd_session_rpc_open(struct ksmbd_session *sess, char *rpc_name)</div><div class='del'>-{</div><div class='del'>-	struct ksmbd_session_rpc *entry;</div><div class='del'>-	struct ksmbd_rpc_command *resp;</div><div class='del'>-	int method;</div><div class='del'>-</div><div class='del'>-	method = __rpc_method(rpc_name);</div><div class='del'>-	if (!method)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	entry = kzalloc(sizeof(struct ksmbd_session_rpc), GFP_KERNEL);</div><div class='del'>-	if (!entry)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	list_add(&amp;entry-&gt;list, &amp;sess-&gt;rpc_handle_list);</div><div class='del'>-	entry-&gt;method = method;</div><div class='del'>-	entry-&gt;id = ksmbd_ipc_id_alloc();</div><div class='del'>-	if (entry-&gt;id &lt; 0)</div><div class='del'>-		goto error;</div><div class='del'>-</div><div class='del'>-	resp = ksmbd_rpc_open(sess, entry-&gt;id);</div><div class='del'>-	if (!resp)</div><div class='del'>-		goto error;</div><div class='del'>-</div><div class='del'>-	kvfree(resp);</div><div class='del'>-	return entry-&gt;id;</div><div class='del'>-error:</div><div class='del'>-	list_del(&amp;entry-&gt;list);</div><div class='del'>-	kfree(entry);</div><div class='del'>-	return -EINVAL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void ksmbd_session_rpc_close(struct ksmbd_session *sess, int id)</div><div class='del'>-{</div><div class='del'>-	struct ksmbd_session_rpc *entry;</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(entry, &amp;sess-&gt;rpc_handle_list, list) {</div><div class='del'>-		if (entry-&gt;id == id) {</div><div class='del'>-			list_del(&amp;entry-&gt;list);</div><div class='del'>-			__session_rpc_close(sess, entry);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int ksmbd_session_rpc_method(struct ksmbd_session *sess, int id)</div><div class='del'>-{</div><div class='del'>-	struct ksmbd_session_rpc *entry;</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(entry, &amp;sess-&gt;rpc_handle_list, list) {</div><div class='del'>-		if (entry-&gt;id == id)</div><div class='del'>-			return entry-&gt;method;</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void ksmbd_session_destroy(struct ksmbd_session *sess)</div><div class='del'>-{</div><div class='del'>-	if (!sess)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	if (!atomic_dec_and_test(&amp;sess-&gt;refcnt))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	list_del(&amp;sess-&gt;sessions_entry);</div><div class='del'>-</div><div class='del'>-	down_write(&amp;sessions_table_lock);</div><div class='del'>-	hash_del(&amp;sess-&gt;hlist);</div><div class='del'>-	up_write(&amp;sessions_table_lock);</div><div class='del'>-</div><div class='del'>-	if (sess-&gt;user)</div><div class='del'>-		ksmbd_free_user(sess-&gt;user);</div><div class='del'>-</div><div class='del'>-	ksmbd_tree_conn_session_logoff(sess);</div><div class='del'>-	ksmbd_destroy_file_table(&amp;sess-&gt;file_table);</div><div class='del'>-	ksmbd_session_rpc_clear_list(sess);</div><div class='del'>-	free_channel_list(sess);</div><div class='del'>-	kfree(sess-&gt;Preauth_HashValue);</div><div class='del'>-	ksmbd_release_id(&amp;session_ida, sess-&gt;id);</div><div class='del'>-	kfree(sess);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct ksmbd_session *__session_lookup(unsigned long long id)</div><div class='del'>-{</div><div class='del'>-	struct ksmbd_session *sess;</div><div class='del'>-</div><div class='del'>-	hash_for_each_possible(sessions_table, sess, hlist, id) {</div><div class='del'>-		if (id == sess-&gt;id)</div><div class='del'>-			return sess;</div><div class='del'>-	}</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void ksmbd_session_register(struct ksmbd_conn *conn,</div><div class='del'>-			    struct ksmbd_session *sess)</div><div class='del'>-{</div><div class='del'>-	sess-&gt;conn = conn;</div><div class='del'>-	list_add(&amp;sess-&gt;sessions_entry, &amp;conn-&gt;sessions);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void ksmbd_sessions_deregister(struct ksmbd_conn *conn)</div><div class='del'>-{</div><div class='del'>-	struct ksmbd_session *sess;</div><div class='del'>-</div><div class='del'>-	while (!list_empty(&amp;conn-&gt;sessions)) {</div><div class='del'>-		sess = list_entry(conn-&gt;sessions.next,</div><div class='del'>-				  struct ksmbd_session,</div><div class='del'>-				  sessions_entry);</div><div class='del'>-</div><div class='del'>-		ksmbd_session_destroy(sess);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool ksmbd_session_id_match(struct ksmbd_session *sess,</div><div class='del'>-				   unsigned long long id)</div><div class='del'>-{</div><div class='del'>-	return sess-&gt;id == id;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct ksmbd_session *ksmbd_session_lookup(struct ksmbd_conn *conn,</div><div class='del'>-					   unsigned long long id)</div><div class='del'>-{</div><div class='del'>-	struct ksmbd_session *sess = NULL;</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(sess, &amp;conn-&gt;sessions, sessions_entry) {</div><div class='del'>-		if (ksmbd_session_id_match(sess, id))</div><div class='del'>-			return sess;</div><div class='del'>-	}</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int get_session(struct ksmbd_session *sess)</div><div class='del'>-{</div><div class='del'>-	return atomic_inc_not_zero(&amp;sess-&gt;refcnt);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void put_session(struct ksmbd_session *sess)</div><div class='del'>-{</div><div class='del'>-	if (atomic_dec_and_test(&amp;sess-&gt;refcnt))</div><div class='del'>-		pr_err("get/%s seems to be mismatched.", __func__);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct ksmbd_session *ksmbd_session_lookup_slowpath(unsigned long long id)</div><div class='del'>-{</div><div class='del'>-	struct ksmbd_session *sess;</div><div class='del'>-</div><div class='del'>-	down_read(&amp;sessions_table_lock);</div><div class='del'>-	sess = __session_lookup(id);</div><div class='del'>-	if (sess) {</div><div class='del'>-		if (!get_session(sess))</div><div class='del'>-			sess = NULL;</div><div class='del'>-	}</div><div class='del'>-	up_read(&amp;sessions_table_lock);</div><div class='del'>-</div><div class='del'>-	return sess;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct ksmbd_session *ksmbd_session_lookup_all(struct ksmbd_conn *conn,</div><div class='del'>-					       unsigned long long id)</div><div class='del'>-{</div><div class='del'>-	struct ksmbd_session *sess;</div><div class='del'>-</div><div class='del'>-	sess = ksmbd_session_lookup(conn, id);</div><div class='del'>-	if (!sess &amp;&amp; conn-&gt;binding)</div><div class='del'>-		sess = ksmbd_session_lookup_slowpath(id);</div><div class='del'>-	return sess;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct preauth_session *ksmbd_preauth_session_alloc(struct ksmbd_conn *conn,</div><div class='del'>-						    u64 sess_id)</div><div class='del'>-{</div><div class='del'>-	struct preauth_session *sess;</div><div class='del'>-</div><div class='del'>-	sess = kmalloc(sizeof(struct preauth_session), GFP_KERNEL);</div><div class='del'>-	if (!sess)</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	sess-&gt;id = sess_id;</div><div class='del'>-	memcpy(sess-&gt;Preauth_HashValue, conn-&gt;preauth_info-&gt;Preauth_HashValue,</div><div class='del'>-	       PREAUTH_HASHVALUE_SIZE);</div><div class='del'>-	list_add(&amp;sess-&gt;preauth_entry, &amp;conn-&gt;preauth_sess_table);</div><div class='del'>-</div><div class='del'>-	return sess;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool ksmbd_preauth_session_id_match(struct preauth_session *sess,</div><div class='del'>-					   unsigned long long id)</div><div class='del'>-{</div><div class='del'>-	return sess-&gt;id == id;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct preauth_session *ksmbd_preauth_session_lookup(struct ksmbd_conn *conn,</div><div class='del'>-						     unsigned long long id)</div><div class='del'>-{</div><div class='del'>-	struct preauth_session *sess = NULL;</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(sess, &amp;conn-&gt;preauth_sess_table, preauth_entry) {</div><div class='del'>-		if (ksmbd_preauth_session_id_match(sess, id))</div><div class='del'>-			return sess;</div><div class='del'>-	}</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int __init_smb2_session(struct ksmbd_session *sess)</div><div class='del'>-{</div><div class='del'>-	int id = ksmbd_acquire_smb2_uid(&amp;session_ida);</div><div class='del'>-</div><div class='del'>-	if (id &lt; 0)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	sess-&gt;id = id;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct ksmbd_session *__session_create(int protocol)</div><div class='del'>-{</div><div class='del'>-	struct ksmbd_session *sess;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	sess = kzalloc(sizeof(struct ksmbd_session), GFP_KERNEL);</div><div class='del'>-	if (!sess)</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	if (ksmbd_init_file_table(&amp;sess-&gt;file_table))</div><div class='del'>-		goto error;</div><div class='del'>-</div><div class='del'>-	set_session_flag(sess, protocol);</div><div class='del'>-	INIT_LIST_HEAD(&amp;sess-&gt;sessions_entry);</div><div class='del'>-	xa_init(&amp;sess-&gt;tree_conns);</div><div class='del'>-	INIT_LIST_HEAD(&amp;sess-&gt;ksmbd_chann_list);</div><div class='del'>-	INIT_LIST_HEAD(&amp;sess-&gt;rpc_handle_list);</div><div class='del'>-	sess-&gt;sequence_number = 1;</div><div class='del'>-	atomic_set(&amp;sess-&gt;refcnt, 1);</div><div class='del'>-</div><div class='del'>-	switch (protocol) {</div><div class='del'>-	case CIFDS_SESSION_FLAG_SMB2:</div><div class='del'>-		ret = __init_smb2_session(sess);</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		ret = -EINVAL;</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (ret)</div><div class='del'>-		goto error;</div><div class='del'>-</div><div class='del'>-	ida_init(&amp;sess-&gt;tree_conn_ida);</div><div class='del'>-</div><div class='del'>-	if (protocol == CIFDS_SESSION_FLAG_SMB2) {</div><div class='del'>-		down_write(&amp;sessions_table_lock);</div><div class='del'>-		hash_add(sessions_table, &amp;sess-&gt;hlist, sess-&gt;id);</div><div class='del'>-		up_write(&amp;sessions_table_lock);</div><div class='del'>-	}</div><div class='del'>-	return sess;</div><div class='del'>-</div><div class='del'>-error:</div><div class='del'>-	ksmbd_session_destroy(sess);</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-struct ksmbd_session *ksmbd_smb2_session_create(void)</div><div class='del'>-{</div><div class='del'>-	return __session_create(CIFDS_SESSION_FLAG_SMB2);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int ksmbd_acquire_tree_conn_id(struct ksmbd_session *sess)</div><div class='del'>-{</div><div class='del'>-	int id = -EINVAL;</div><div class='del'>-</div><div class='del'>-	if (test_session_flag(sess, CIFDS_SESSION_FLAG_SMB2))</div><div class='del'>-		id = ksmbd_acquire_smb2_tid(&amp;sess-&gt;tree_conn_ida);</div><div class='del'>-</div><div class='del'>-	return id;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void ksmbd_release_tree_conn_id(struct ksmbd_session *sess, int id)</div><div class='del'>-{</div><div class='del'>-	if (id &gt;= 0)</div><div class='del'>-		ksmbd_release_id(&amp;sess-&gt;tree_conn_ida, id);</div><div class='del'>-}</div><div class='head'>diff --git a/fs/ksmbd/smb2pdu.h b/fs/ksmbd/smb2pdu.h<br/>deleted file mode 100644<br/>index ff5a2f01d34a..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ksmbd/smb2pdu.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ksmbd/smb2pdu.h</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,1708 +0,0 @@</div><div class='del'>-/* SPDX-License-Identifier: GPL-2.0-or-later */</div><div class='del'>-/*</div><div class='del'>- *   Copyright (C) 2016 Namjae Jeon &lt;linkinjeon@kernel.org&gt;</div><div class='del'>- *   Copyright (C) 2018 Samsung Electronics Co., Ltd.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#ifndef _SMB2PDU_H</div><div class='del'>-#define _SMB2PDU_H</div><div class='del'>-</div><div class='del'>-#include "ntlmssp.h"</div><div class='del'>-#include "smbacl.h"</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Note that, due to trying to use names similar to the protocol specifications,</div><div class='del'>- * there are many mixed case field names in the structures below.  Although</div><div class='del'>- * this does not match typical Linux kernel style, it is necessary to be</div><div class='del'>- * able to match against the protocol specfication.</div><div class='del'>- *</div><div class='del'>- * SMB2 commands</div><div class='del'>- * Some commands have minimal (wct=0,bcc=0), or uninteresting, responses</div><div class='del'>- * (ie no useful data other than the SMB error code itself) and are marked such.</div><div class='del'>- * Knowing this helps avoid response buffer allocations and copy in some cases.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-/* List of commands in host endian */</div><div class='del'>-#define SMB2_NEGOTIATE_HE	0x0000</div><div class='del'>-#define SMB2_SESSION_SETUP_HE	0x0001</div><div class='del'>-#define SMB2_LOGOFF_HE		0x0002 /* trivial request/resp */</div><div class='del'>-#define SMB2_TREE_CONNECT_HE	0x0003</div><div class='del'>-#define SMB2_TREE_DISCONNECT_HE	0x0004 /* trivial req/resp */</div><div class='del'>-#define SMB2_CREATE_HE		0x0005</div><div class='del'>-#define SMB2_CLOSE_HE		0x0006</div><div class='del'>-#define SMB2_FLUSH_HE		0x0007 /* trivial resp */</div><div class='del'>-#define SMB2_READ_HE		0x0008</div><div class='del'>-#define SMB2_WRITE_HE		0x0009</div><div class='del'>-#define SMB2_LOCK_HE		0x000A</div><div class='del'>-#define SMB2_IOCTL_HE		0x000B</div><div class='del'>-#define SMB2_CANCEL_HE		0x000C</div><div class='del'>-#define SMB2_ECHO_HE		0x000D</div><div class='del'>-#define SMB2_QUERY_DIRECTORY_HE	0x000E</div><div class='del'>-#define SMB2_CHANGE_NOTIFY_HE	0x000F</div><div class='del'>-#define SMB2_QUERY_INFO_HE	0x0010</div><div class='del'>-#define SMB2_SET_INFO_HE	0x0011</div><div class='del'>-#define SMB2_OPLOCK_BREAK_HE	0x0012</div><div class='del'>-</div><div class='del'>-/* The same list in little endian */</div><div class='del'>-#define SMB2_NEGOTIATE		cpu_to_le16(SMB2_NEGOTIATE_HE)</div><div class='del'>-#define SMB2_SESSION_SETUP	cpu_to_le16(SMB2_SESSION_SETUP_HE)</div><div class='del'>-#define SMB2_LOGOFF		cpu_to_le16(SMB2_LOGOFF_HE)</div><div class='del'>-#define SMB2_TREE_CONNECT	cpu_to_le16(SMB2_TREE_CONNECT_HE)</div><div class='del'>-#define SMB2_TREE_DISCONNECT	cpu_to_le16(SMB2_TREE_DISCONNECT_HE)</div><div class='del'>-#define SMB2_CREATE		cpu_to_le16(SMB2_CREATE_HE)</div><div class='del'>-#define SMB2_CLOSE		cpu_to_le16(SMB2_CLOSE_HE)</div><div class='del'>-#define SMB2_FLUSH		cpu_to_le16(SMB2_FLUSH_HE)</div><div class='del'>-#define SMB2_READ		cpu_to_le16(SMB2_READ_HE)</div><div class='del'>-#define SMB2_WRITE		cpu_to_le16(SMB2_WRITE_HE)</div><div class='del'>-#define SMB2_LOCK		cpu_to_le16(SMB2_LOCK_HE)</div><div class='del'>-#define SMB2_IOCTL		cpu_to_le16(SMB2_IOCTL_HE)</div><div class='del'>-#define SMB2_CANCEL		cpu_to_le16(SMB2_CANCEL_HE)</div><div class='del'>-#define SMB2_ECHO		cpu_to_le16(SMB2_ECHO_HE)</div><div class='del'>-#define SMB2_QUERY_DIRECTORY	cpu_to_le16(SMB2_QUERY_DIRECTORY_HE)</div><div class='del'>-#define SMB2_CHANGE_NOTIFY	cpu_to_le16(SMB2_CHANGE_NOTIFY_HE)</div><div class='del'>-#define SMB2_QUERY_INFO		cpu_to_le16(SMB2_QUERY_INFO_HE)</div><div class='del'>-#define SMB2_SET_INFO		cpu_to_le16(SMB2_SET_INFO_HE)</div><div class='del'>-#define SMB2_OPLOCK_BREAK	cpu_to_le16(SMB2_OPLOCK_BREAK_HE)</div><div class='del'>-</div><div class='del'>-/*Create Action Flags*/</div><div class='del'>-#define FILE_SUPERSEDED                0x00000000</div><div class='del'>-#define FILE_OPENED            0x00000001</div><div class='del'>-#define FILE_CREATED           0x00000002</div><div class='del'>-#define FILE_OVERWRITTEN       0x00000003</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Size of the session key (crypto key encrypted with the password</div><div class='del'>- */</div><div class='del'>-#define SMB2_NTLMV2_SESSKEY_SIZE	16</div><div class='del'>-#define SMB2_SIGNATURE_SIZE		16</div><div class='del'>-#define SMB2_HMACSHA256_SIZE		32</div><div class='del'>-#define SMB2_CMACAES_SIZE		16</div><div class='del'>-#define SMB3_GCM128_CRYPTKEY_SIZE	16</div><div class='del'>-#define SMB3_GCM256_CRYPTKEY_SIZE	32</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Size of the smb3 encryption/decryption keys</div><div class='del'>- */</div><div class='del'>-#define SMB3_ENC_DEC_KEY_SIZE		32</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Size of the smb3 signing key</div><div class='del'>- */</div><div class='del'>-#define SMB3_SIGN_KEY_SIZE		16</div><div class='del'>-</div><div class='del'>-#define CIFS_CLIENT_CHALLENGE_SIZE	8</div><div class='del'>-#define SMB_SERVER_CHALLENGE_SIZE	8</div><div class='del'>-</div><div class='del'>-/* SMB2 Max Credits */</div><div class='del'>-#define SMB2_MAX_CREDITS		8192</div><div class='del'>-</div><div class='del'>-#define SMB2_CLIENT_GUID_SIZE		16</div><div class='del'>-#define SMB2_CREATE_GUID_SIZE		16</div><div class='del'>-</div><div class='del'>-/* Maximum buffer size value we can send with 1 credit */</div><div class='del'>-#define SMB2_MAX_BUFFER_SIZE 65536</div><div class='del'>-</div><div class='del'>-#define NUMBER_OF_SMB2_COMMANDS	0x0013</div><div class='del'>-</div><div class='del'>-/* BB FIXME - analyze following length BB */</div><div class='del'>-#define MAX_SMB2_HDR_SIZE 0x78 /* 4 len + 64 hdr + (2*24 wct) + 2 bct + 2 pad */</div><div class='del'>-</div><div class='del'>-#define SMB2_PROTO_NUMBER cpu_to_le32(0x424d53fe) /* 'B''M''S' */</div><div class='del'>-#define SMB2_TRANSFORM_PROTO_NUM cpu_to_le32(0x424d53fd)</div><div class='del'>-</div><div class='del'>-#define SMB21_DEFAULT_IOSIZE	(1024 * 1024)</div><div class='del'>-#define SMB3_DEFAULT_IOSIZE	(4 * 1024 * 1024)</div><div class='del'>-#define SMB3_DEFAULT_TRANS_SIZE	(1024 * 1024)</div><div class='del'>-#define SMB3_MIN_IOSIZE	(64 * 1024)</div><div class='del'>-#define SMB3_MAX_IOSIZE	(8 * 1024 * 1024)</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * SMB2 Header Definition</div><div class='del'>- *</div><div class='del'>- * "MBZ" :  Must be Zero</div><div class='del'>- * "BB"  :  BugBug, Something to check/review/analyze later</div><div class='del'>- * "PDU" :  "Protocol Data Unit" (ie a network "frame")</div><div class='del'>- *</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#define __SMB2_HEADER_STRUCTURE_SIZE	64</div><div class='del'>-#define SMB2_HEADER_STRUCTURE_SIZE				\</div><div class='del'>-	cpu_to_le16(__SMB2_HEADER_STRUCTURE_SIZE)</div><div class='del'>-</div><div class='del'>-struct smb2_hdr {</div><div class='del'>-	__be32 smb2_buf_length;	/* big endian on wire */</div><div class='del'>-				/*</div><div class='del'>-				 * length is only two or three bytes - with</div><div class='del'>-				 * one or two byte type preceding it that MBZ</div><div class='del'>-				 */</div><div class='del'>-	__le32 ProtocolId;	/* 0xFE 'S' 'M' 'B' */</div><div class='del'>-	__le16 StructureSize;	/* 64 */</div><div class='del'>-	__le16 CreditCharge;	/* MBZ */</div><div class='del'>-	__le32 Status;		/* Error from server */</div><div class='del'>-	__le16 Command;</div><div class='del'>-	__le16 CreditRequest;	/* CreditResponse */</div><div class='del'>-	__le32 Flags;</div><div class='del'>-	__le32 NextCommand;</div><div class='del'>-	__le64 MessageId;</div><div class='del'>-	union {</div><div class='del'>-		struct {</div><div class='del'>-			__le32 ProcessId;</div><div class='del'>-			__le32  TreeId;</div><div class='del'>-		} __packed SyncId;</div><div class='del'>-		__le64  AsyncId;</div><div class='del'>-	} __packed Id;</div><div class='del'>-	__le64  SessionId;</div><div class='del'>-	__u8   Signature[16];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_pdu {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize2; /* size of wct area (varies, request specific) */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define SMB3_AES_CCM_NONCE 11</div><div class='del'>-#define SMB3_AES_GCM_NONCE 12</div><div class='del'>-</div><div class='del'>-struct smb2_transform_hdr {</div><div class='del'>-	__be32 smb2_buf_length; /* big endian on wire */</div><div class='del'>-	/*</div><div class='del'>-	 * length is only two or three bytes - with</div><div class='del'>-	 * one or two byte type preceding it that MBZ</div><div class='del'>-	 */</div><div class='del'>-	__le32 ProtocolId;      /* 0xFD 'S' 'M' 'B' */</div><div class='del'>-	__u8   Signature[16];</div><div class='del'>-	__u8   Nonce[16];</div><div class='del'>-	__le32 OriginalMessageSize;</div><div class='del'>-	__u16  Reserved1;</div><div class='del'>-	__le16 Flags; /* EncryptionAlgorithm */</div><div class='del'>-	__le64  SessionId;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- *	SMB2 flag definitions</div><div class='del'>- */</div><div class='del'>-#define SMB2_FLAGS_SERVER_TO_REDIR	cpu_to_le32(0x00000001)</div><div class='del'>-#define SMB2_FLAGS_ASYNC_COMMAND	cpu_to_le32(0x00000002)</div><div class='del'>-#define SMB2_FLAGS_RELATED_OPERATIONS	cpu_to_le32(0x00000004)</div><div class='del'>-#define SMB2_FLAGS_SIGNED		cpu_to_le32(0x00000008)</div><div class='del'>-#define SMB2_FLAGS_DFS_OPERATIONS	cpu_to_le32(0x10000000)</div><div class='del'>-#define SMB2_FLAGS_REPLAY_OPERATIONS	cpu_to_le32(0x20000000)</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- *	Definitions for SMB2 Protocol Data Units (network frames)</div><div class='del'>- *</div><div class='del'>- *  See MS-SMB2.PDF specification for protocol details.</div><div class='del'>- *  The Naming convention is the lower case version of the SMB2</div><div class='del'>- *  command code name for the struct. Note that structures must be packed.</div><div class='del'>- *</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#define SMB2_ERROR_STRUCTURE_SIZE2	9</div><div class='del'>-#define SMB2_ERROR_STRUCTURE_SIZE2_LE	cpu_to_le16(SMB2_ERROR_STRUCTURE_SIZE2)</div><div class='del'>-</div><div class='del'>-struct smb2_err_rsp {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize;</div><div class='del'>-	__u8   ErrorContextCount;</div><div class='del'>-	__u8   Reserved;</div><div class='del'>-	__le32 ByteCount;  /* even if zero, at least one byte follows */</div><div class='del'>-	__u8   ErrorData[1];  /* variable length */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_negotiate_req {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 36 */</div><div class='del'>-	__le16 DialectCount;</div><div class='del'>-	__le16 SecurityMode;</div><div class='del'>-	__le16 Reserved;	/* MBZ */</div><div class='del'>-	__le32 Capabilities;</div><div class='del'>-	__u8   ClientGUID[SMB2_CLIENT_GUID_SIZE];</div><div class='del'>-	/* In SMB3.02 and earlier next three were MBZ le64 ClientStartTime */</div><div class='del'>-	__le32 NegotiateContextOffset; /* SMB3.1.1 only. MBZ earlier */</div><div class='del'>-	__le16 NegotiateContextCount;  /* SMB3.1.1 only. MBZ earlier */</div><div class='del'>-	__le16 Reserved2;</div><div class='del'>-	__le16 Dialects[1]; /* One dialect (vers=) at a time for now */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* SecurityMode flags */</div><div class='del'>-#define SMB2_NEGOTIATE_SIGNING_ENABLED_LE	cpu_to_le16(0x0001)</div><div class='del'>-#define SMB2_NEGOTIATE_SIGNING_REQUIRED		0x0002</div><div class='del'>-#define SMB2_NEGOTIATE_SIGNING_REQUIRED_LE	cpu_to_le16(0x0002)</div><div class='del'>-/* Capabilities flags */</div><div class='del'>-#define SMB2_GLOBAL_CAP_DFS		0x00000001</div><div class='del'>-#define SMB2_GLOBAL_CAP_LEASING		0x00000002 /* Resp only New to SMB2.1 */</div><div class='del'>-#define SMB2_GLOBAL_CAP_LARGE_MTU	0X00000004 /* Resp only New to SMB2.1 */</div><div class='del'>-#define SMB2_GLOBAL_CAP_MULTI_CHANNEL	0x00000008 /* New to SMB3 */</div><div class='del'>-#define SMB2_GLOBAL_CAP_PERSISTENT_HANDLES 0x00000010 /* New to SMB3 */</div><div class='del'>-#define SMB2_GLOBAL_CAP_DIRECTORY_LEASING  0x00000020 /* New to SMB3 */</div><div class='del'>-#define SMB2_GLOBAL_CAP_ENCRYPTION	0x00000040 /* New to SMB3 */</div><div class='del'>-/* Internal types */</div><div class='del'>-#define SMB2_NT_FIND			0x00100000</div><div class='del'>-#define SMB2_LARGE_FILES		0x00200000</div><div class='del'>-</div><div class='del'>-#define SMB311_SALT_SIZE			32</div><div class='del'>-/* Hash Algorithm Types */</div><div class='del'>-#define SMB2_PREAUTH_INTEGRITY_SHA512	cpu_to_le16(0x0001)</div><div class='del'>-</div><div class='del'>-#define PREAUTH_HASHVALUE_SIZE		64</div><div class='del'>-</div><div class='del'>-struct preauth_integrity_info {</div><div class='del'>-	/* PreAuth integrity Hash ID */</div><div class='del'>-	__le16			Preauth_HashId;</div><div class='del'>-	/* PreAuth integrity Hash Value */</div><div class='del'>-	__u8			Preauth_HashValue[PREAUTH_HASHVALUE_SIZE];</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/* offset is sizeof smb2_negotiate_rsp - 4 but rounded up to 8 bytes. */</div><div class='del'>-#ifdef CONFIG_SMB_SERVER_KERBEROS5</div><div class='del'>-/* sizeof(struct smb2_negotiate_rsp) - 4 =</div><div class='del'>- * header(64) + response(64) + GSS_LENGTH(96) + GSS_PADDING(0)</div><div class='del'>- */</div><div class='del'>-#define OFFSET_OF_NEG_CONTEXT	0xe0</div><div class='del'>-#else</div><div class='del'>-/* sizeof(struct smb2_negotiate_rsp) - 4 =</div><div class='del'>- * header(64) + response(64) + GSS_LENGTH(74) + GSS_PADDING(6)</div><div class='del'>- */</div><div class='del'>-#define OFFSET_OF_NEG_CONTEXT	0xd0</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-#define SMB2_PREAUTH_INTEGRITY_CAPABILITIES	cpu_to_le16(1)</div><div class='del'>-#define SMB2_ENCRYPTION_CAPABILITIES		cpu_to_le16(2)</div><div class='del'>-#define SMB2_COMPRESSION_CAPABILITIES		cpu_to_le16(3)</div><div class='del'>-#define SMB2_NETNAME_NEGOTIATE_CONTEXT_ID	cpu_to_le16(5)</div><div class='del'>-#define SMB2_SIGNING_CAPABILITIES		cpu_to_le16(8)</div><div class='del'>-#define SMB2_POSIX_EXTENSIONS_AVAILABLE		cpu_to_le16(0x100)</div><div class='del'>-</div><div class='del'>-struct smb2_neg_context {</div><div class='del'>-	__le16  ContextType;</div><div class='del'>-	__le16  DataLength;</div><div class='del'>-	__le32  Reserved;</div><div class='del'>-	/* Followed by array of data */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_preauth_neg_context {</div><div class='del'>-	__le16	ContextType; /* 1 */</div><div class='del'>-	__le16	DataLength;</div><div class='del'>-	__le32	Reserved;</div><div class='del'>-	__le16	HashAlgorithmCount; /* 1 */</div><div class='del'>-	__le16	SaltLength;</div><div class='del'>-	__le16	HashAlgorithms; /* HashAlgorithms[0] since only one defined */</div><div class='del'>-	__u8	Salt[SMB311_SALT_SIZE];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* Encryption Algorithms Ciphers */</div><div class='del'>-#define SMB2_ENCRYPTION_AES128_CCM	cpu_to_le16(0x0001)</div><div class='del'>-#define SMB2_ENCRYPTION_AES128_GCM	cpu_to_le16(0x0002)</div><div class='del'>-#define SMB2_ENCRYPTION_AES256_CCM	cpu_to_le16(0x0003)</div><div class='del'>-#define SMB2_ENCRYPTION_AES256_GCM	cpu_to_le16(0x0004)</div><div class='del'>-</div><div class='del'>-struct smb2_encryption_neg_context {</div><div class='del'>-	__le16	ContextType; /* 2 */</div><div class='del'>-	__le16	DataLength;</div><div class='del'>-	__le32	Reserved;</div><div class='del'>-	/* CipherCount usally 2, but can be 3 when AES256-GCM enabled */</div><div class='del'>-	__le16	CipherCount; /* AES-128-GCM and AES-128-CCM by default */</div><div class='del'>-	__le16	Ciphers[];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define SMB3_COMPRESS_NONE	cpu_to_le16(0x0000)</div><div class='del'>-#define SMB3_COMPRESS_LZNT1	cpu_to_le16(0x0001)</div><div class='del'>-#define SMB3_COMPRESS_LZ77	cpu_to_le16(0x0002)</div><div class='del'>-#define SMB3_COMPRESS_LZ77_HUFF	cpu_to_le16(0x0003)</div><div class='del'>-</div><div class='del'>-struct smb2_compression_ctx {</div><div class='del'>-	__le16	ContextType; /* 3 */</div><div class='del'>-	__le16  DataLength;</div><div class='del'>-	__le32	Reserved;</div><div class='del'>-	__le16	CompressionAlgorithmCount;</div><div class='del'>-	__u16	Padding;</div><div class='del'>-	__le32	Reserved1;</div><div class='del'>-	__le16	CompressionAlgorithms[];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define POSIX_CTXT_DATA_LEN     16</div><div class='del'>-struct smb2_posix_neg_context {</div><div class='del'>-	__le16	ContextType; /* 0x100 */</div><div class='del'>-	__le16	DataLength;</div><div class='del'>-	__le32	Reserved;</div><div class='del'>-	__u8	Name[16]; /* POSIX ctxt GUID 93AD25509CB411E7B42383DE968BCD7C */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_netname_neg_context {</div><div class='del'>-	__le16	ContextType; /* 0x100 */</div><div class='del'>-	__le16	DataLength;</div><div class='del'>-	__le32	Reserved;</div><div class='del'>-	__le16	NetName[]; /* hostname of target converted to UCS-2 */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* Signing algorithms */</div><div class='del'>-#define SIGNING_ALG_HMAC_SHA256		cpu_to_le16(0)</div><div class='del'>-#define SIGNING_ALG_AES_CMAC		cpu_to_le16(1)</div><div class='del'>-#define SIGNING_ALG_AES_GMAC		cpu_to_le16(2)</div><div class='del'>-</div><div class='del'>-struct smb2_signing_capabilities {</div><div class='del'>-	__le16	ContextType; /* 8 */</div><div class='del'>-	__le16	DataLength;</div><div class='del'>-	__le32	Reserved;</div><div class='del'>-	__le16	SigningAlgorithmCount;</div><div class='del'>-	__le16	SigningAlgorithms[];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_negotiate_rsp {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize;	/* Must be 65 */</div><div class='del'>-	__le16 SecurityMode;</div><div class='del'>-	__le16 DialectRevision;</div><div class='del'>-	__le16 NegotiateContextCount; /* Prior to SMB3.1.1 was Reserved &amp; MBZ */</div><div class='del'>-	__u8   ServerGUID[16];</div><div class='del'>-	__le32 Capabilities;</div><div class='del'>-	__le32 MaxTransactSize;</div><div class='del'>-	__le32 MaxReadSize;</div><div class='del'>-	__le32 MaxWriteSize;</div><div class='del'>-	__le64 SystemTime;	/* MBZ */</div><div class='del'>-	__le64 ServerStartTime;</div><div class='del'>-	__le16 SecurityBufferOffset;</div><div class='del'>-	__le16 SecurityBufferLength;</div><div class='del'>-	__le32 NegotiateContextOffset;	/* Pre:SMB3.1.1 was reserved/ignored */</div><div class='del'>-	__u8   Buffer[1];	/* variable length GSS security buffer */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* Flags */</div><div class='del'>-#define SMB2_SESSION_REQ_FLAG_BINDING		0x01</div><div class='del'>-#define SMB2_SESSION_REQ_FLAG_ENCRYPT_DATA	0x04</div><div class='del'>-</div><div class='del'>-#define SMB2_SESSION_EXPIRED		(0)</div><div class='del'>-#define SMB2_SESSION_IN_PROGRESS	BIT(0)</div><div class='del'>-#define SMB2_SESSION_VALID		BIT(1)</div><div class='del'>-</div><div class='del'>-/* Flags */</div><div class='del'>-#define SMB2_SESSION_REQ_FLAG_BINDING		0x01</div><div class='del'>-#define SMB2_SESSION_REQ_FLAG_ENCRYPT_DATA	0x04</div><div class='del'>-</div><div class='del'>-struct smb2_sess_setup_req {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 25 */</div><div class='del'>-	__u8   Flags;</div><div class='del'>-	__u8   SecurityMode;</div><div class='del'>-	__le32 Capabilities;</div><div class='del'>-	__le32 Channel;</div><div class='del'>-	__le16 SecurityBufferOffset;</div><div class='del'>-	__le16 SecurityBufferLength;</div><div class='del'>-	__le64 PreviousSessionId;</div><div class='del'>-	__u8   Buffer[1];	/* variable length GSS security buffer */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* Flags/Reserved for SMB3.1.1 */</div><div class='del'>-#define SMB2_SHAREFLAG_CLUSTER_RECONNECT	0x0001</div><div class='del'>-</div><div class='del'>-/* Currently defined SessionFlags */</div><div class='del'>-#define SMB2_SESSION_FLAG_IS_GUEST_LE		cpu_to_le16(0x0001)</div><div class='del'>-#define SMB2_SESSION_FLAG_IS_NULL_LE		cpu_to_le16(0x0002)</div><div class='del'>-#define SMB2_SESSION_FLAG_ENCRYPT_DATA_LE	cpu_to_le16(0x0004)</div><div class='del'>-struct smb2_sess_setup_rsp {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 9 */</div><div class='del'>-	__le16 SessionFlags;</div><div class='del'>-	__le16 SecurityBufferOffset;</div><div class='del'>-	__le16 SecurityBufferLength;</div><div class='del'>-	__u8   Buffer[1];	/* variable length GSS security buffer */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_logoff_req {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize;	/* Must be 4 */</div><div class='del'>-	__le16 Reserved;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_logoff_rsp {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize;	/* Must be 4 */</div><div class='del'>-	__le16 Reserved;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_tree_connect_req {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize;	/* Must be 9 */</div><div class='del'>-	__le16 Reserved;	/* Flags in SMB3.1.1 */</div><div class='del'>-	__le16 PathOffset;</div><div class='del'>-	__le16 PathLength;</div><div class='del'>-	__u8   Buffer[1];	/* variable length */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_tree_connect_rsp {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize;	/* Must be 16 */</div><div class='del'>-	__u8   ShareType;  /* see below */</div><div class='del'>-	__u8   Reserved;</div><div class='del'>-	__le32 ShareFlags; /* see below */</div><div class='del'>-	__le32 Capabilities; /* see below */</div><div class='del'>-	__le32 MaximalAccess;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* Possible ShareType values */</div><div class='del'>-#define SMB2_SHARE_TYPE_DISK	0x01</div><div class='del'>-#define SMB2_SHARE_TYPE_PIPE	0x02</div><div class='del'>-#define	SMB2_SHARE_TYPE_PRINT	0x03</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Possible ShareFlags - exactly one and only one of the first 4 caching flags</div><div class='del'>- * must be set (any of the remaining, SHI1005, flags may be set individually</div><div class='del'>- * or in combination.</div><div class='del'>- */</div><div class='del'>-#define SMB2_SHAREFLAG_MANUAL_CACHING			0x00000000</div><div class='del'>-#define SMB2_SHAREFLAG_AUTO_CACHING			0x00000010</div><div class='del'>-#define SMB2_SHAREFLAG_VDO_CACHING			0x00000020</div><div class='del'>-#define SMB2_SHAREFLAG_NO_CACHING			0x00000030</div><div class='del'>-#define SHI1005_FLAGS_DFS				0x00000001</div><div class='del'>-#define SHI1005_FLAGS_DFS_ROOT				0x00000002</div><div class='del'>-#define SHI1005_FLAGS_RESTRICT_EXCLUSIVE_OPENS		0x00000100</div><div class='del'>-#define SHI1005_FLAGS_FORCE_SHARED_DELETE		0x00000200</div><div class='del'>-#define SHI1005_FLAGS_ALLOW_NAMESPACE_CACHING		0x00000400</div><div class='del'>-#define SHI1005_FLAGS_ACCESS_BASED_DIRECTORY_ENUM	0x00000800</div><div class='del'>-#define SHI1005_FLAGS_FORCE_LEVELII_OPLOCK		0x00001000</div><div class='del'>-#define SHI1005_FLAGS_ENABLE_HASH			0x00002000</div><div class='del'>-</div><div class='del'>-/* Possible share capabilities */</div><div class='del'>-#define SMB2_SHARE_CAP_DFS	cpu_to_le32(0x00000008)</div><div class='del'>-</div><div class='del'>-struct smb2_tree_disconnect_req {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize;	/* Must be 4 */</div><div class='del'>-	__le16 Reserved;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_tree_disconnect_rsp {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize;	/* Must be 4 */</div><div class='del'>-	__le16 Reserved;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define ATTR_READONLY_LE	cpu_to_le32(ATTR_READONLY)</div><div class='del'>-#define ATTR_HIDDEN_LE		cpu_to_le32(ATTR_HIDDEN)</div><div class='del'>-#define ATTR_SYSTEM_LE		cpu_to_le32(ATTR_SYSTEM)</div><div class='del'>-#define ATTR_DIRECTORY_LE	cpu_to_le32(ATTR_DIRECTORY)</div><div class='del'>-#define ATTR_ARCHIVE_LE		cpu_to_le32(ATTR_ARCHIVE)</div><div class='del'>-#define ATTR_NORMAL_LE		cpu_to_le32(ATTR_NORMAL)</div><div class='del'>-#define ATTR_TEMPORARY_LE	cpu_to_le32(ATTR_TEMPORARY)</div><div class='del'>-#define ATTR_SPARSE_FILE_LE	cpu_to_le32(ATTR_SPARSE)</div><div class='del'>-#define ATTR_REPARSE_POINT_LE	cpu_to_le32(ATTR_REPARSE)</div><div class='del'>-#define ATTR_COMPRESSED_LE	cpu_to_le32(ATTR_COMPRESSED)</div><div class='del'>-#define ATTR_OFFLINE_LE		cpu_to_le32(ATTR_OFFLINE)</div><div class='del'>-#define ATTR_NOT_CONTENT_INDEXED_LE	cpu_to_le32(ATTR_NOT_CONTENT_INDEXED)</div><div class='del'>-#define ATTR_ENCRYPTED_LE	cpu_to_le32(ATTR_ENCRYPTED)</div><div class='del'>-#define ATTR_INTEGRITY_STREAML_LE	cpu_to_le32(0x00008000)</div><div class='del'>-#define ATTR_NO_SCRUB_DATA_LE	cpu_to_le32(0x00020000)</div><div class='del'>-#define ATTR_MASK_LE		cpu_to_le32(0x00007FB7)</div><div class='del'>-</div><div class='del'>-/* Oplock levels */</div><div class='del'>-#define SMB2_OPLOCK_LEVEL_NONE		0x00</div><div class='del'>-#define SMB2_OPLOCK_LEVEL_II		0x01</div><div class='del'>-#define SMB2_OPLOCK_LEVEL_EXCLUSIVE	0x08</div><div class='del'>-#define SMB2_OPLOCK_LEVEL_BATCH		0x09</div><div class='del'>-#define SMB2_OPLOCK_LEVEL_LEASE		0xFF</div><div class='del'>-/* Non-spec internal type */</div><div class='del'>-#define SMB2_OPLOCK_LEVEL_NOCHANGE	0x99</div><div class='del'>-</div><div class='del'>-/* Desired Access Flags */</div><div class='del'>-#define FILE_READ_DATA_LE		cpu_to_le32(0x00000001)</div><div class='del'>-#define FILE_LIST_DIRECTORY_LE		cpu_to_le32(0x00000001)</div><div class='del'>-#define FILE_WRITE_DATA_LE		cpu_to_le32(0x00000002)</div><div class='del'>-#define FILE_ADD_FILE_LE		cpu_to_le32(0x00000002)</div><div class='del'>-#define FILE_APPEND_DATA_LE		cpu_to_le32(0x00000004)</div><div class='del'>-#define FILE_ADD_SUBDIRECTORY_LE	cpu_to_le32(0x00000004)</div><div class='del'>-#define FILE_READ_EA_LE			cpu_to_le32(0x00000008)</div><div class='del'>-#define FILE_WRITE_EA_LE		cpu_to_le32(0x00000010)</div><div class='del'>-#define FILE_EXECUTE_LE			cpu_to_le32(0x00000020)</div><div class='del'>-#define FILE_TRAVERSE_LE		cpu_to_le32(0x00000020)</div><div class='del'>-#define FILE_DELETE_CHILD_LE		cpu_to_le32(0x00000040)</div><div class='del'>-#define FILE_READ_ATTRIBUTES_LE		cpu_to_le32(0x00000080)</div><div class='del'>-#define FILE_WRITE_ATTRIBUTES_LE	cpu_to_le32(0x00000100)</div><div class='del'>-#define FILE_DELETE_LE			cpu_to_le32(0x00010000)</div><div class='del'>-#define FILE_READ_CONTROL_LE		cpu_to_le32(0x00020000)</div><div class='del'>-#define FILE_WRITE_DAC_LE		cpu_to_le32(0x00040000)</div><div class='del'>-#define FILE_WRITE_OWNER_LE		cpu_to_le32(0x00080000)</div><div class='del'>-#define FILE_SYNCHRONIZE_LE		cpu_to_le32(0x00100000)</div><div class='del'>-#define FILE_ACCESS_SYSTEM_SECURITY_LE	cpu_to_le32(0x01000000)</div><div class='del'>-#define FILE_MAXIMAL_ACCESS_LE		cpu_to_le32(0x02000000)</div><div class='del'>-#define FILE_GENERIC_ALL_LE		cpu_to_le32(0x10000000)</div><div class='del'>-#define FILE_GENERIC_EXECUTE_LE		cpu_to_le32(0x20000000)</div><div class='del'>-#define FILE_GENERIC_WRITE_LE		cpu_to_le32(0x40000000)</div><div class='del'>-#define FILE_GENERIC_READ_LE		cpu_to_le32(0x80000000)</div><div class='del'>-#define DESIRED_ACCESS_MASK		cpu_to_le32(0xF21F01FF)</div><div class='del'>-</div><div class='del'>-/* ShareAccess Flags */</div><div class='del'>-#define FILE_SHARE_READ_LE		cpu_to_le32(0x00000001)</div><div class='del'>-#define FILE_SHARE_WRITE_LE		cpu_to_le32(0x00000002)</div><div class='del'>-#define FILE_SHARE_DELETE_LE		cpu_to_le32(0x00000004)</div><div class='del'>-#define FILE_SHARE_ALL_LE		cpu_to_le32(0x00000007)</div><div class='del'>-</div><div class='del'>-/* CreateDisposition Flags */</div><div class='del'>-#define FILE_SUPERSEDE_LE		cpu_to_le32(0x00000000)</div><div class='del'>-#define FILE_OPEN_LE			cpu_to_le32(0x00000001)</div><div class='del'>-#define FILE_CREATE_LE			cpu_to_le32(0x00000002)</div><div class='del'>-#define	FILE_OPEN_IF_LE			cpu_to_le32(0x00000003)</div><div class='del'>-#define FILE_OVERWRITE_LE		cpu_to_le32(0x00000004)</div><div class='del'>-#define FILE_OVERWRITE_IF_LE		cpu_to_le32(0x00000005)</div><div class='del'>-#define FILE_CREATE_MASK_LE		cpu_to_le32(0x00000007)</div><div class='del'>-</div><div class='del'>-#define FILE_READ_DESIRED_ACCESS_LE	(FILE_READ_DATA_LE |		\</div><div class='del'>-					FILE_READ_EA_LE |		\</div><div class='del'>-					FILE_GENERIC_READ_LE)</div><div class='del'>-#define FILE_WRITE_DESIRE_ACCESS_LE	(FILE_WRITE_DATA_LE |		\</div><div class='del'>-					FILE_APPEND_DATA_LE |		\</div><div class='del'>-					FILE_WRITE_EA_LE |		\</div><div class='del'>-					FILE_WRITE_ATTRIBUTES_LE |	\</div><div class='del'>-					FILE_GENERIC_WRITE_LE)</div><div class='del'>-</div><div class='del'>-/* Impersonation Levels */</div><div class='del'>-#define IL_ANONYMOUS_LE		cpu_to_le32(0x00000000)</div><div class='del'>-#define IL_IDENTIFICATION_LE	cpu_to_le32(0x00000001)</div><div class='del'>-#define IL_IMPERSONATION_LE	cpu_to_le32(0x00000002)</div><div class='del'>-#define IL_DELEGATE_LE		cpu_to_le32(0x00000003)</div><div class='del'>-</div><div class='del'>-/* Create Context Values */</div><div class='del'>-#define SMB2_CREATE_EA_BUFFER			"ExtA" /* extended attributes */</div><div class='del'>-#define SMB2_CREATE_SD_BUFFER			"SecD" /* security descriptor */</div><div class='del'>-#define SMB2_CREATE_DURABLE_HANDLE_REQUEST	"DHnQ"</div><div class='del'>-#define SMB2_CREATE_DURABLE_HANDLE_RECONNECT	"DHnC"</div><div class='del'>-#define SMB2_CREATE_ALLOCATION_SIZE		"AlSi"</div><div class='del'>-#define SMB2_CREATE_QUERY_MAXIMAL_ACCESS_REQUEST "MxAc"</div><div class='del'>-#define SMB2_CREATE_TIMEWARP_REQUEST		"TWrp"</div><div class='del'>-#define SMB2_CREATE_QUERY_ON_DISK_ID		"QFid"</div><div class='del'>-#define SMB2_CREATE_REQUEST_LEASE		"RqLs"</div><div class='del'>-#define SMB2_CREATE_DURABLE_HANDLE_REQUEST_V2   "DH2Q"</div><div class='del'>-#define SMB2_CREATE_DURABLE_HANDLE_RECONNECT_V2 "DH2C"</div><div class='del'>-#define SMB2_CREATE_APP_INSTANCE_ID     "\x45\xBC\xA6\x6A\xEF\xA7\xF7\x4A\x90\x08\xFA\x46\x2E\x14\x4D\x74"</div><div class='del'>- #define SMB2_CREATE_APP_INSTANCE_VERSION	"\xB9\x82\xD0\xB7\x3B\x56\x07\x4F\xA0\x7B\x52\x4A\x81\x16\xA0\x10"</div><div class='del'>-#define SVHDX_OPEN_DEVICE_CONTEXT       0x83CE6F1AD851E0986E34401CC9BCFCE9</div><div class='del'>-#define SMB2_CREATE_TAG_POSIX		"\x93\xAD\x25\x50\x9C\xB4\x11\xE7\xB4\x23\x83\xDE\x96\x8B\xCD\x7C"</div><div class='del'>-</div><div class='del'>-struct smb2_create_req {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize;	/* Must be 57 */</div><div class='del'>-	__u8   SecurityFlags;</div><div class='del'>-	__u8   RequestedOplockLevel;</div><div class='del'>-	__le32 ImpersonationLevel;</div><div class='del'>-	__le64 SmbCreateFlags;</div><div class='del'>-	__le64 Reserved;</div><div class='del'>-	__le32 DesiredAccess;</div><div class='del'>-	__le32 FileAttributes;</div><div class='del'>-	__le32 ShareAccess;</div><div class='del'>-	__le32 CreateDisposition;</div><div class='del'>-	__le32 CreateOptions;</div><div class='del'>-	__le16 NameOffset;</div><div class='del'>-	__le16 NameLength;</div><div class='del'>-	__le32 CreateContextsOffset;</div><div class='del'>-	__le32 CreateContextsLength;</div><div class='del'>-	__u8   Buffer[0];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_create_rsp {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize;	/* Must be 89 */</div><div class='del'>-	__u8   OplockLevel;</div><div class='del'>-	__u8   Reserved;</div><div class='del'>-	__le32 CreateAction;</div><div class='del'>-	__le64 CreationTime;</div><div class='del'>-	__le64 LastAccessTime;</div><div class='del'>-	__le64 LastWriteTime;</div><div class='del'>-	__le64 ChangeTime;</div><div class='del'>-	__le64 AllocationSize;</div><div class='del'>-	__le64 EndofFile;</div><div class='del'>-	__le32 FileAttributes;</div><div class='del'>-	__le32 Reserved2;</div><div class='del'>-	__le64  PersistentFileId;</div><div class='del'>-	__le64  VolatileFileId;</div><div class='del'>-	__le32 CreateContextsOffset;</div><div class='del'>-	__le32 CreateContextsLength;</div><div class='del'>-	__u8   Buffer[1];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct create_context {</div><div class='del'>-	__le32 Next;</div><div class='del'>-	__le16 NameOffset;</div><div class='del'>-	__le16 NameLength;</div><div class='del'>-	__le16 Reserved;</div><div class='del'>-	__le16 DataOffset;</div><div class='del'>-	__le32 DataLength;</div><div class='del'>-	__u8 Buffer[0];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct create_durable_req_v2 {</div><div class='del'>-	struct create_context ccontext;</div><div class='del'>-	__u8   Name[8];</div><div class='del'>-	__le32 Timeout;</div><div class='del'>-	__le32 Flags;</div><div class='del'>-	__u8 Reserved[8];</div><div class='del'>-	__u8 CreateGuid[16];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct create_durable_reconn_req {</div><div class='del'>-	struct create_context ccontext;</div><div class='del'>-	__u8   Name[8];</div><div class='del'>-	union {</div><div class='del'>-		__u8  Reserved[16];</div><div class='del'>-		struct {</div><div class='del'>-			__le64 PersistentFileId;</div><div class='del'>-			__le64 VolatileFileId;</div><div class='del'>-		} Fid;</div><div class='del'>-	} Data;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct create_durable_reconn_v2_req {</div><div class='del'>-	struct create_context ccontext;</div><div class='del'>-	__u8   Name[8];</div><div class='del'>-	struct {</div><div class='del'>-		__le64 PersistentFileId;</div><div class='del'>-		__le64 VolatileFileId;</div><div class='del'>-	} Fid;</div><div class='del'>-	__u8 CreateGuid[16];</div><div class='del'>-	__le32 Flags;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct create_app_inst_id {</div><div class='del'>-	struct create_context ccontext;</div><div class='del'>-	__u8 Name[8];</div><div class='del'>-	__u8 Reserved[8];</div><div class='del'>-	__u8 AppInstanceId[16];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct create_app_inst_id_vers {</div><div class='del'>-	struct create_context ccontext;</div><div class='del'>-	__u8 Name[8];</div><div class='del'>-	__u8 Reserved[2];</div><div class='del'>-	__u8 Padding[4];</div><div class='del'>-	__le64 AppInstanceVersionHigh;</div><div class='del'>-	__le64 AppInstanceVersionLow;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct create_mxac_req {</div><div class='del'>-	struct create_context ccontext;</div><div class='del'>-	__u8   Name[8];</div><div class='del'>-	__le64 Timestamp;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct create_alloc_size_req {</div><div class='del'>-	struct create_context ccontext;</div><div class='del'>-	__u8   Name[8];</div><div class='del'>-	__le64 AllocationSize;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct create_posix {</div><div class='del'>-	struct create_context ccontext;</div><div class='del'>-	__u8    Name[16];</div><div class='del'>-	__le32  Mode;</div><div class='del'>-	__u32   Reserved;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct create_durable_rsp {</div><div class='del'>-	struct create_context ccontext;</div><div class='del'>-	__u8   Name[8];</div><div class='del'>-	union {</div><div class='del'>-		__u8  Reserved[8];</div><div class='del'>-		__u64 data;</div><div class='del'>-	} Data;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct create_durable_v2_rsp {</div><div class='del'>-	struct create_context ccontext;</div><div class='del'>-	__u8   Name[8];</div><div class='del'>-	__le32 Timeout;</div><div class='del'>-	__le32 Flags;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct create_mxac_rsp {</div><div class='del'>-	struct create_context ccontext;</div><div class='del'>-	__u8   Name[8];</div><div class='del'>-	__le32 QueryStatus;</div><div class='del'>-	__le32 MaximalAccess;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct create_disk_id_rsp {</div><div class='del'>-	struct create_context ccontext;</div><div class='del'>-	__u8   Name[8];</div><div class='del'>-	__le64 DiskFileId;</div><div class='del'>-	__le64 VolumeId;</div><div class='del'>-	__u8  Reserved[16];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* equivalent of the contents of SMB3.1.1 POSIX open context response */</div><div class='del'>-struct create_posix_rsp {</div><div class='del'>-	struct create_context ccontext;</div><div class='del'>-	__u8    Name[16];</div><div class='del'>-	__le32 nlink;</div><div class='del'>-	__le32 reparse_tag;</div><div class='del'>-	__le32 mode;</div><div class='del'>-	u8 SidBuffer[40];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define SMB2_LEASE_NONE_LE			cpu_to_le32(0x00)</div><div class='del'>-#define SMB2_LEASE_READ_CACHING_LE		cpu_to_le32(0x01)</div><div class='del'>-#define SMB2_LEASE_HANDLE_CACHING_LE		cpu_to_le32(0x02)</div><div class='del'>-#define SMB2_LEASE_WRITE_CACHING_LE		cpu_to_le32(0x04)</div><div class='del'>-</div><div class='del'>-#define SMB2_LEASE_FLAG_BREAK_IN_PROGRESS_LE	cpu_to_le32(0x02)</div><div class='del'>-</div><div class='del'>-struct lease_context {</div><div class='del'>-	__le64 LeaseKeyLow;</div><div class='del'>-	__le64 LeaseKeyHigh;</div><div class='del'>-	__le32 LeaseState;</div><div class='del'>-	__le32 LeaseFlags;</div><div class='del'>-	__le64 LeaseDuration;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct lease_context_v2 {</div><div class='del'>-	__le64 LeaseKeyLow;</div><div class='del'>-	__le64 LeaseKeyHigh;</div><div class='del'>-	__le32 LeaseState;</div><div class='del'>-	__le32 LeaseFlags;</div><div class='del'>-	__le64 LeaseDuration;</div><div class='del'>-	__le64 ParentLeaseKeyLow;</div><div class='del'>-	__le64 ParentLeaseKeyHigh;</div><div class='del'>-	__le16 Epoch;</div><div class='del'>-	__le16 Reserved;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct create_lease {</div><div class='del'>-	struct create_context ccontext;</div><div class='del'>-	__u8   Name[8];</div><div class='del'>-	struct lease_context lcontext;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct create_lease_v2 {</div><div class='del'>-	struct create_context ccontext;</div><div class='del'>-	__u8   Name[8];</div><div class='del'>-	struct lease_context_v2 lcontext;</div><div class='del'>-	__u8   Pad[4];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* Currently defined values for close flags */</div><div class='del'>-#define SMB2_CLOSE_FLAG_POSTQUERY_ATTRIB	cpu_to_le16(0x0001)</div><div class='del'>-struct smb2_close_req {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize;	/* Must be 24 */</div><div class='del'>-	__le16 Flags;</div><div class='del'>-	__le32 Reserved;</div><div class='del'>-	__le64  PersistentFileId;</div><div class='del'>-	__le64  VolatileFileId;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_close_rsp {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* 60 */</div><div class='del'>-	__le16 Flags;</div><div class='del'>-	__le32 Reserved;</div><div class='del'>-	__le64 CreationTime;</div><div class='del'>-	__le64 LastAccessTime;</div><div class='del'>-	__le64 LastWriteTime;</div><div class='del'>-	__le64 ChangeTime;</div><div class='del'>-	__le64 AllocationSize;	/* Beginning of FILE_STANDARD_INFO equivalent */</div><div class='del'>-	__le64 EndOfFile;</div><div class='del'>-	__le32 Attributes;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_flush_req {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize;	/* Must be 24 */</div><div class='del'>-	__le16 Reserved1;</div><div class='del'>-	__le32 Reserved2;</div><div class='del'>-	__le64  PersistentFileId;</div><div class='del'>-	__le64  VolatileFileId;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_flush_rsp {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize;</div><div class='del'>-	__le16 Reserved;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_buffer_desc_v1 {</div><div class='del'>-	__le64 offset;</div><div class='del'>-	__le32 token;</div><div class='del'>-	__le32 length;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define SMB2_CHANNEL_NONE		cpu_to_le32(0x00000000)</div><div class='del'>-#define SMB2_CHANNEL_RDMA_V1		cpu_to_le32(0x00000001)</div><div class='del'>-#define SMB2_CHANNEL_RDMA_V1_INVALIDATE cpu_to_le32(0x00000002)</div><div class='del'>-</div><div class='del'>-struct smb2_read_req {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 49 */</div><div class='del'>-	__u8   Padding; /* offset from start of SMB2 header to place read */</div><div class='del'>-	__u8   Reserved;</div><div class='del'>-	__le32 Length;</div><div class='del'>-	__le64 Offset;</div><div class='del'>-	__le64  PersistentFileId;</div><div class='del'>-	__le64  VolatileFileId;</div><div class='del'>-	__le32 MinimumCount;</div><div class='del'>-	__le32 Channel; /* Reserved MBZ */</div><div class='del'>-	__le32 RemainingBytes;</div><div class='del'>-	__le16 ReadChannelInfoOffset; /* Reserved MBZ */</div><div class='del'>-	__le16 ReadChannelInfoLength; /* Reserved MBZ */</div><div class='del'>-	__u8   Buffer[1];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_read_rsp {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 17 */</div><div class='del'>-	__u8   DataOffset;</div><div class='del'>-	__u8   Reserved;</div><div class='del'>-	__le32 DataLength;</div><div class='del'>-	__le32 DataRemaining;</div><div class='del'>-	__u32  Reserved2;</div><div class='del'>-	__u8   Buffer[1];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* For write request Flags field below the following flag is defined: */</div><div class='del'>-#define SMB2_WRITEFLAG_WRITE_THROUGH 0x00000001</div><div class='del'>-</div><div class='del'>-struct smb2_write_req {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 49 */</div><div class='del'>-	__le16 DataOffset; /* offset from start of SMB2 header to write data */</div><div class='del'>-	__le32 Length;</div><div class='del'>-	__le64 Offset;</div><div class='del'>-	__le64  PersistentFileId;</div><div class='del'>-	__le64  VolatileFileId;</div><div class='del'>-	__le32 Channel; /* Reserved MBZ */</div><div class='del'>-	__le32 RemainingBytes;</div><div class='del'>-	__le16 WriteChannelInfoOffset; /* Reserved MBZ */</div><div class='del'>-	__le16 WriteChannelInfoLength; /* Reserved MBZ */</div><div class='del'>-	__le32 Flags;</div><div class='del'>-	__u8   Buffer[1];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_write_rsp {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 17 */</div><div class='del'>-	__u8   DataOffset;</div><div class='del'>-	__u8   Reserved;</div><div class='del'>-	__le32 DataLength;</div><div class='del'>-	__le32 DataRemaining;</div><div class='del'>-	__u32  Reserved2;</div><div class='del'>-	__u8   Buffer[1];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define SMB2_0_IOCTL_IS_FSCTL 0x00000001</div><div class='del'>-</div><div class='del'>-struct duplicate_extents_to_file {</div><div class='del'>-	__u64 PersistentFileHandle; /* source file handle, opaque endianness */</div><div class='del'>-	__u64 VolatileFileHandle;</div><div class='del'>-	__le64 SourceFileOffset;</div><div class='del'>-	__le64 TargetFileOffset;</div><div class='del'>-	__le64 ByteCount;  /* Bytes to be copied */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_ioctl_req {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 57 */</div><div class='del'>-	__le16 Reserved; /* offset from start of SMB2 header to write data */</div><div class='del'>-	__le32 CntCode;</div><div class='del'>-	__le64  PersistentFileId;</div><div class='del'>-	__le64  VolatileFileId;</div><div class='del'>-	__le32 InputOffset; /* Reserved MBZ */</div><div class='del'>-	__le32 InputCount;</div><div class='del'>-	__le32 MaxInputResponse;</div><div class='del'>-	__le32 OutputOffset;</div><div class='del'>-	__le32 OutputCount;</div><div class='del'>-	__le32 MaxOutputResponse;</div><div class='del'>-	__le32 Flags;</div><div class='del'>-	__le32 Reserved2;</div><div class='del'>-	__u8   Buffer[1];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_ioctl_rsp {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 49 */</div><div class='del'>-	__le16 Reserved; /* offset from start of SMB2 header to write data */</div><div class='del'>-	__le32 CntCode;</div><div class='del'>-	__le64  PersistentFileId;</div><div class='del'>-	__le64  VolatileFileId;</div><div class='del'>-	__le32 InputOffset; /* Reserved MBZ */</div><div class='del'>-	__le32 InputCount;</div><div class='del'>-	__le32 OutputOffset;</div><div class='del'>-	__le32 OutputCount;</div><div class='del'>-	__le32 Flags;</div><div class='del'>-	__le32 Reserved2;</div><div class='del'>-	__u8   Buffer[1];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct validate_negotiate_info_req {</div><div class='del'>-	__le32 Capabilities;</div><div class='del'>-	__u8   Guid[SMB2_CLIENT_GUID_SIZE];</div><div class='del'>-	__le16 SecurityMode;</div><div class='del'>-	__le16 DialectCount;</div><div class='del'>-	__le16 Dialects[1]; /* dialect (someday maybe list) client asked for */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct validate_negotiate_info_rsp {</div><div class='del'>-	__le32 Capabilities;</div><div class='del'>-	__u8   Guid[SMB2_CLIENT_GUID_SIZE];</div><div class='del'>-	__le16 SecurityMode;</div><div class='del'>-	__le16 Dialect; /* Dialect in use for the connection */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb_sockaddr_in {</div><div class='del'>-	__be16 Port;</div><div class='del'>-	__be32 IPv4address;</div><div class='del'>-	__u8 Reserved[8];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb_sockaddr_in6 {</div><div class='del'>-	__be16 Port;</div><div class='del'>-	__be32 FlowInfo;</div><div class='del'>-	__u8 IPv6address[16];</div><div class='del'>-	__be32 ScopeId;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define INTERNETWORK	0x0002</div><div class='del'>-#define INTERNETWORKV6	0x0017</div><div class='del'>-</div><div class='del'>-struct sockaddr_storage_rsp {</div><div class='del'>-	__le16 Family;</div><div class='del'>-	union {</div><div class='del'>-		struct smb_sockaddr_in addr4;</div><div class='del'>-		struct smb_sockaddr_in6 addr6;</div><div class='del'>-	};</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define RSS_CAPABLE	0x00000001</div><div class='del'>-#define RDMA_CAPABLE	0x00000002</div><div class='del'>-</div><div class='del'>-struct network_interface_info_ioctl_rsp {</div><div class='del'>-	__le32 Next; /* next interface. zero if this is last one */</div><div class='del'>-	__le32 IfIndex;</div><div class='del'>-	__le32 Capability; /* RSS or RDMA Capable */</div><div class='del'>-	__le32 Reserved;</div><div class='del'>-	__le64 LinkSpeed;</div><div class='del'>-	char	SockAddr_Storage[128];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct file_object_buf_type1_ioctl_rsp {</div><div class='del'>-	__u8 ObjectId[16];</div><div class='del'>-	__u8 BirthVolumeId[16];</div><div class='del'>-	__u8 BirthObjectId[16];</div><div class='del'>-	__u8 DomainId[16];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct resume_key_ioctl_rsp {</div><div class='del'>-	__le64 ResumeKey[3];</div><div class='del'>-	__le32 ContextLength;</div><div class='del'>-	__u8 Context[4]; /* ignored, Windows sets to 4 bytes of zero */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct copychunk_ioctl_req {</div><div class='del'>-	__le64 ResumeKey[3];</div><div class='del'>-	__le32 ChunkCount;</div><div class='del'>-	__le32 Reserved;</div><div class='del'>-	__u8 Chunks[1]; /* array of srv_copychunk */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct srv_copychunk {</div><div class='del'>-	__le64 SourceOffset;</div><div class='del'>-	__le64 TargetOffset;</div><div class='del'>-	__le32 Length;</div><div class='del'>-	__le32 Reserved;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct copychunk_ioctl_rsp {</div><div class='del'>-	__le32 ChunksWritten;</div><div class='del'>-	__le32 ChunkBytesWritten;</div><div class='del'>-	__le32 TotalBytesWritten;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct file_sparse {</div><div class='del'>-	__u8	SetSparse;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct file_zero_data_information {</div><div class='del'>-	__le64	FileOffset;</div><div class='del'>-	__le64	BeyondFinalZero;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct file_allocated_range_buffer {</div><div class='del'>-	__le64	file_offset;</div><div class='del'>-	__le64	length;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct reparse_data_buffer {</div><div class='del'>-	__le32	ReparseTag;</div><div class='del'>-	__le16	ReparseDataLength;</div><div class='del'>-	__u16	Reserved;</div><div class='del'>-	__u8	DataBuffer[]; /* Variable Length */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* Completion Filter flags for Notify */</div><div class='del'>-#define FILE_NOTIFY_CHANGE_FILE_NAME	0x00000001</div><div class='del'>-#define FILE_NOTIFY_CHANGE_DIR_NAME	0x00000002</div><div class='del'>-#define FILE_NOTIFY_CHANGE_NAME		0x00000003</div><div class='del'>-#define FILE_NOTIFY_CHANGE_ATTRIBUTES	0x00000004</div><div class='del'>-#define FILE_NOTIFY_CHANGE_SIZE		0x00000008</div><div class='del'>-#define FILE_NOTIFY_CHANGE_LAST_WRITE	0x00000010</div><div class='del'>-#define FILE_NOTIFY_CHANGE_LAST_ACCESS	0x00000020</div><div class='del'>-#define FILE_NOTIFY_CHANGE_CREATION	0x00000040</div><div class='del'>-#define FILE_NOTIFY_CHANGE_EA		0x00000080</div><div class='del'>-#define FILE_NOTIFY_CHANGE_SECURITY	0x00000100</div><div class='del'>-#define FILE_NOTIFY_CHANGE_STREAM_NAME	0x00000200</div><div class='del'>-#define FILE_NOTIFY_CHANGE_STREAM_SIZE	0x00000400</div><div class='del'>-#define FILE_NOTIFY_CHANGE_STREAM_WRITE	0x00000800</div><div class='del'>-</div><div class='del'>-/* Flags */</div><div class='del'>-#define SMB2_WATCH_TREE	0x0001</div><div class='del'>-</div><div class='del'>-struct smb2_notify_req {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 32 */</div><div class='del'>-	__le16 Flags;</div><div class='del'>-	__le32 OutputBufferLength;</div><div class='del'>-	__le64 PersistentFileId;</div><div class='del'>-	__le64 VolatileFileId;</div><div class='del'>-	__u32 CompletionFileter;</div><div class='del'>-	__u32 Reserved;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_notify_rsp {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 9 */</div><div class='del'>-	__le16 OutputBufferOffset;</div><div class='del'>-	__le32 OutputBufferLength;</div><div class='del'>-	__u8 Buffer[1];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* SMB2 Notify Action Flags */</div><div class='del'>-#define FILE_ACTION_ADDED		0x00000001</div><div class='del'>-#define FILE_ACTION_REMOVED		0x00000002</div><div class='del'>-#define FILE_ACTION_MODIFIED		0x00000003</div><div class='del'>-#define FILE_ACTION_RENAMED_OLD_NAME	0x00000004</div><div class='del'>-#define FILE_ACTION_RENAMED_NEW_NAME	0x00000005</div><div class='del'>-#define FILE_ACTION_ADDED_STREAM	0x00000006</div><div class='del'>-#define FILE_ACTION_REMOVED_STREAM	0x00000007</div><div class='del'>-#define FILE_ACTION_MODIFIED_STREAM	0x00000008</div><div class='del'>-#define FILE_ACTION_REMOVED_BY_DELETE	0x00000009</div><div class='del'>-</div><div class='del'>-#define SMB2_LOCKFLAG_SHARED		0x0001</div><div class='del'>-#define SMB2_LOCKFLAG_EXCLUSIVE		0x0002</div><div class='del'>-#define SMB2_LOCKFLAG_UNLOCK		0x0004</div><div class='del'>-#define SMB2_LOCKFLAG_FAIL_IMMEDIATELY	0x0010</div><div class='del'>-#define SMB2_LOCKFLAG_MASK		0x0007</div><div class='del'>-</div><div class='del'>-struct smb2_lock_element {</div><div class='del'>-	__le64 Offset;</div><div class='del'>-	__le64 Length;</div><div class='del'>-	__le32 Flags;</div><div class='del'>-	__le32 Reserved;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_lock_req {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 48 */</div><div class='del'>-	__le16 LockCount;</div><div class='del'>-	__le32 Reserved;</div><div class='del'>-	__le64  PersistentFileId;</div><div class='del'>-	__le64  VolatileFileId;</div><div class='del'>-	/* Followed by at least one */</div><div class='del'>-	struct smb2_lock_element locks[1];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_lock_rsp {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 4 */</div><div class='del'>-	__le16 Reserved;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_echo_req {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize;	/* Must be 4 */</div><div class='del'>-	__u16  Reserved;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_echo_rsp {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize;	/* Must be 4 */</div><div class='del'>-	__u16  Reserved;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* search (query_directory) Flags field */</div><div class='del'>-#define SMB2_RESTART_SCANS		0x01</div><div class='del'>-#define SMB2_RETURN_SINGLE_ENTRY	0x02</div><div class='del'>-#define SMB2_INDEX_SPECIFIED		0x04</div><div class='del'>-#define SMB2_REOPEN			0x10</div><div class='del'>-</div><div class='del'>-struct smb2_query_directory_req {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 33 */</div><div class='del'>-	__u8   FileInformationClass;</div><div class='del'>-	__u8   Flags;</div><div class='del'>-	__le32 FileIndex;</div><div class='del'>-	__le64  PersistentFileId;</div><div class='del'>-	__le64  VolatileFileId;</div><div class='del'>-	__le16 FileNameOffset;</div><div class='del'>-	__le16 FileNameLength;</div><div class='del'>-	__le32 OutputBufferLength;</div><div class='del'>-	__u8   Buffer[1];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_query_directory_rsp {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 9 */</div><div class='del'>-	__le16 OutputBufferOffset;</div><div class='del'>-	__le32 OutputBufferLength;</div><div class='del'>-	__u8   Buffer[1];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* Possible InfoType values */</div><div class='del'>-#define SMB2_O_INFO_FILE	0x01</div><div class='del'>-#define SMB2_O_INFO_FILESYSTEM	0x02</div><div class='del'>-#define SMB2_O_INFO_SECURITY	0x03</div><div class='del'>-#define SMB2_O_INFO_QUOTA	0x04</div><div class='del'>-</div><div class='del'>-/* Security info type additionalinfo flags. See MS-SMB2 (2.2.37) or MS-DTYP */</div><div class='del'>-#define OWNER_SECINFO   0x00000001</div><div class='del'>-#define GROUP_SECINFO   0x00000002</div><div class='del'>-#define DACL_SECINFO   0x00000004</div><div class='del'>-#define SACL_SECINFO   0x00000008</div><div class='del'>-#define LABEL_SECINFO   0x00000010</div><div class='del'>-#define ATTRIBUTE_SECINFO   0x00000020</div><div class='del'>-#define SCOPE_SECINFO   0x00000040</div><div class='del'>-#define BACKUP_SECINFO   0x00010000</div><div class='del'>-#define UNPROTECTED_SACL_SECINFO   0x10000000</div><div class='del'>-#define UNPROTECTED_DACL_SECINFO   0x20000000</div><div class='del'>-#define PROTECTED_SACL_SECINFO   0x40000000</div><div class='del'>-#define PROTECTED_DACL_SECINFO   0x80000000</div><div class='del'>-</div><div class='del'>-struct smb2_query_info_req {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 41 */</div><div class='del'>-	__u8   InfoType;</div><div class='del'>-	__u8   FileInfoClass;</div><div class='del'>-	__le32 OutputBufferLength;</div><div class='del'>-	__le16 InputBufferOffset;</div><div class='del'>-	__u16  Reserved;</div><div class='del'>-	__le32 InputBufferLength;</div><div class='del'>-	__le32 AdditionalInformation;</div><div class='del'>-	__le32 Flags;</div><div class='del'>-	__le64  PersistentFileId;</div><div class='del'>-	__le64  VolatileFileId;</div><div class='del'>-	__u8   Buffer[1];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_query_info_rsp {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 9 */</div><div class='del'>-	__le16 OutputBufferOffset;</div><div class='del'>-	__le32 OutputBufferLength;</div><div class='del'>-	__u8   Buffer[1];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_set_info_req {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 33 */</div><div class='del'>-	__u8   InfoType;</div><div class='del'>-	__u8   FileInfoClass;</div><div class='del'>-	__le32 BufferLength;</div><div class='del'>-	__le16 BufferOffset;</div><div class='del'>-	__u16  Reserved;</div><div class='del'>-	__le32 AdditionalInformation;</div><div class='del'>-	__le64  PersistentFileId;</div><div class='del'>-	__le64  VolatileFileId;</div><div class='del'>-	__u8   Buffer[1];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_set_info_rsp {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 2 */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* FILE Info response size */</div><div class='del'>-#define FILE_DIRECTORY_INFORMATION_SIZE       1</div><div class='del'>-#define FILE_FULL_DIRECTORY_INFORMATION_SIZE  2</div><div class='del'>-#define FILE_BOTH_DIRECTORY_INFORMATION_SIZE  3</div><div class='del'>-#define FILE_BASIC_INFORMATION_SIZE           40</div><div class='del'>-#define FILE_STANDARD_INFORMATION_SIZE        24</div><div class='del'>-#define FILE_INTERNAL_INFORMATION_SIZE        8</div><div class='del'>-#define FILE_EA_INFORMATION_SIZE              4</div><div class='del'>-#define FILE_ACCESS_INFORMATION_SIZE          4</div><div class='del'>-#define FILE_NAME_INFORMATION_SIZE            9</div><div class='del'>-#define FILE_RENAME_INFORMATION_SIZE          10</div><div class='del'>-#define FILE_LINK_INFORMATION_SIZE            11</div><div class='del'>-#define FILE_NAMES_INFORMATION_SIZE           12</div><div class='del'>-#define FILE_DISPOSITION_INFORMATION_SIZE     13</div><div class='del'>-#define FILE_POSITION_INFORMATION_SIZE        14</div><div class='del'>-#define FILE_FULL_EA_INFORMATION_SIZE         15</div><div class='del'>-#define FILE_MODE_INFORMATION_SIZE            4</div><div class='del'>-#define FILE_ALIGNMENT_INFORMATION_SIZE       4</div><div class='del'>-#define FILE_ALL_INFORMATION_SIZE             104</div><div class='del'>-#define FILE_ALLOCATION_INFORMATION_SIZE      19</div><div class='del'>-#define FILE_END_OF_FILE_INFORMATION_SIZE     20</div><div class='del'>-#define FILE_ALTERNATE_NAME_INFORMATION_SIZE  8</div><div class='del'>-#define FILE_STREAM_INFORMATION_SIZE          32</div><div class='del'>-#define FILE_PIPE_INFORMATION_SIZE            23</div><div class='del'>-#define FILE_PIPE_LOCAL_INFORMATION_SIZE      24</div><div class='del'>-#define FILE_PIPE_REMOTE_INFORMATION_SIZE     25</div><div class='del'>-#define FILE_MAILSLOT_QUERY_INFORMATION_SIZE  26</div><div class='del'>-#define FILE_MAILSLOT_SET_INFORMATION_SIZE    27</div><div class='del'>-#define FILE_COMPRESSION_INFORMATION_SIZE     16</div><div class='del'>-#define FILE_OBJECT_ID_INFORMATION_SIZE       29</div><div class='del'>-/* Number 30 not defined in documents */</div><div class='del'>-#define FILE_MOVE_CLUSTER_INFORMATION_SIZE    31</div><div class='del'>-#define FILE_QUOTA_INFORMATION_SIZE           32</div><div class='del'>-#define FILE_REPARSE_POINT_INFORMATION_SIZE   33</div><div class='del'>-#define FILE_NETWORK_OPEN_INFORMATION_SIZE    56</div><div class='del'>-#define FILE_ATTRIBUTE_TAG_INFORMATION_SIZE   8</div><div class='del'>-</div><div class='del'>-/* FS Info response  size */</div><div class='del'>-#define FS_DEVICE_INFORMATION_SIZE     8</div><div class='del'>-#define FS_ATTRIBUTE_INFORMATION_SIZE  16</div><div class='del'>-#define FS_VOLUME_INFORMATION_SIZE     24</div><div class='del'>-#define FS_SIZE_INFORMATION_SIZE       24</div><div class='del'>-#define FS_FULL_SIZE_INFORMATION_SIZE  32</div><div class='del'>-#define FS_SECTOR_SIZE_INFORMATION_SIZE 28</div><div class='del'>-#define FS_OBJECT_ID_INFORMATION_SIZE 64</div><div class='del'>-#define FS_CONTROL_INFORMATION_SIZE 48</div><div class='del'>-#define FS_POSIX_INFORMATION_SIZE 56</div><div class='del'>-</div><div class='del'>-/* FS_ATTRIBUTE_File_System_Name */</div><div class='del'>-#define FS_TYPE_SUPPORT_SIZE   44</div><div class='del'>-struct fs_type_info {</div><div class='del'>-	char		*fs_name;</div><div class='del'>-	long		magic_number;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_oplock_break {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 24 */</div><div class='del'>-	__u8   OplockLevel;</div><div class='del'>-	__u8   Reserved;</div><div class='del'>-	__le32 Reserved2;</div><div class='del'>-	__le64  PersistentFid;</div><div class='del'>-	__le64  VolatileFid;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define SMB2_NOTIFY_BREAK_LEASE_FLAG_ACK_REQUIRED cpu_to_le32(0x01)</div><div class='del'>-</div><div class='del'>-struct smb2_lease_break {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 44 */</div><div class='del'>-	__le16 Epoch;</div><div class='del'>-	__le32 Flags;</div><div class='del'>-	__u8   LeaseKey[16];</div><div class='del'>-	__le32 CurrentLeaseState;</div><div class='del'>-	__le32 NewLeaseState;</div><div class='del'>-	__le32 BreakReason;</div><div class='del'>-	__le32 AccessMaskHint;</div><div class='del'>-	__le32 ShareMaskHint;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_lease_ack {</div><div class='del'>-	struct smb2_hdr hdr;</div><div class='del'>-	__le16 StructureSize; /* Must be 36 */</div><div class='del'>-	__le16 Reserved;</div><div class='del'>-	__le32 Flags;</div><div class='del'>-	__u8   LeaseKey[16];</div><div class='del'>-	__le32 LeaseState;</div><div class='del'>-	__le64 LeaseDuration;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- *	PDU infolevel structure definitions</div><div class='del'>- *	BB consider moving to a different header</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-/* File System Information Classes */</div><div class='del'>-#define FS_VOLUME_INFORMATION		1 /* Query */</div><div class='del'>-#define FS_LABEL_INFORMATION		2 /* Set */</div><div class='del'>-#define FS_SIZE_INFORMATION		3 /* Query */</div><div class='del'>-#define FS_DEVICE_INFORMATION		4 /* Query */</div><div class='del'>-#define FS_ATTRIBUTE_INFORMATION	5 /* Query */</div><div class='del'>-#define FS_CONTROL_INFORMATION		6 /* Query, Set */</div><div class='del'>-#define FS_FULL_SIZE_INFORMATION	7 /* Query */</div><div class='del'>-#define FS_OBJECT_ID_INFORMATION	8 /* Query, Set */</div><div class='del'>-#define FS_DRIVER_PATH_INFORMATION	9 /* Query */</div><div class='del'>-#define FS_SECTOR_SIZE_INFORMATION	11 /* SMB3 or later. Query */</div><div class='del'>-#define FS_POSIX_INFORMATION		100 /* SMB3.1.1 POSIX. Query */</div><div class='del'>-</div><div class='del'>-struct smb2_fs_full_size_info {</div><div class='del'>-	__le64 TotalAllocationUnits;</div><div class='del'>-	__le64 CallerAvailableAllocationUnits;</div><div class='del'>-	__le64 ActualAvailableAllocationUnits;</div><div class='del'>-	__le32 SectorsPerAllocationUnit;</div><div class='del'>-	__le32 BytesPerSector;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define SSINFO_FLAGS_ALIGNED_DEVICE		0x00000001</div><div class='del'>-#define SSINFO_FLAGS_PARTITION_ALIGNED_ON_DEVICE 0x00000002</div><div class='del'>-#define SSINFO_FLAGS_NO_SEEK_PENALTY		0x00000004</div><div class='del'>-#define SSINFO_FLAGS_TRIM_ENABLED		0x00000008</div><div class='del'>-</div><div class='del'>-/* sector size info struct */</div><div class='del'>-struct smb3_fs_ss_info {</div><div class='del'>-	__le32 LogicalBytesPerSector;</div><div class='del'>-	__le32 PhysicalBytesPerSectorForAtomicity;</div><div class='del'>-	__le32 PhysicalBytesPerSectorForPerf;</div><div class='del'>-	__le32 FSEffPhysicalBytesPerSectorForAtomicity;</div><div class='del'>-	__le32 Flags;</div><div class='del'>-	__le32 ByteOffsetForSectorAlignment;</div><div class='del'>-	__le32 ByteOffsetForPartitionAlignment;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* File System Control Information */</div><div class='del'>-struct smb2_fs_control_info {</div><div class='del'>-	__le64 FreeSpaceStartFiltering;</div><div class='del'>-	__le64 FreeSpaceThreshold;</div><div class='del'>-	__le64 FreeSpaceStopFiltering;</div><div class='del'>-	__le64 DefaultQuotaThreshold;</div><div class='del'>-	__le64 DefaultQuotaLimit;</div><div class='del'>-	__le32 FileSystemControlFlags;</div><div class='del'>-	__le32 Padding;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* partial list of QUERY INFO levels */</div><div class='del'>-#define FILE_DIRECTORY_INFORMATION	1</div><div class='del'>-#define FILE_FULL_DIRECTORY_INFORMATION 2</div><div class='del'>-#define FILE_BOTH_DIRECTORY_INFORMATION 3</div><div class='del'>-#define FILE_BASIC_INFORMATION		4</div><div class='del'>-#define FILE_STANDARD_INFORMATION	5</div><div class='del'>-#define FILE_INTERNAL_INFORMATION	6</div><div class='del'>-#define FILE_EA_INFORMATION	        7</div><div class='del'>-#define FILE_ACCESS_INFORMATION		8</div><div class='del'>-#define FILE_NAME_INFORMATION		9</div><div class='del'>-#define FILE_RENAME_INFORMATION		10</div><div class='del'>-#define FILE_LINK_INFORMATION		11</div><div class='del'>-#define FILE_NAMES_INFORMATION		12</div><div class='del'>-#define FILE_DISPOSITION_INFORMATION	13</div><div class='del'>-#define FILE_POSITION_INFORMATION	14</div><div class='del'>-#define FILE_FULL_EA_INFORMATION	15</div><div class='del'>-#define FILE_MODE_INFORMATION		16</div><div class='del'>-#define FILE_ALIGNMENT_INFORMATION	17</div><div class='del'>-#define FILE_ALL_INFORMATION		18</div><div class='del'>-#define FILE_ALLOCATION_INFORMATION	19</div><div class='del'>-#define FILE_END_OF_FILE_INFORMATION	20</div><div class='del'>-#define FILE_ALTERNATE_NAME_INFORMATION 21</div><div class='del'>-#define FILE_STREAM_INFORMATION		22</div><div class='del'>-#define FILE_PIPE_INFORMATION		23</div><div class='del'>-#define FILE_PIPE_LOCAL_INFORMATION	24</div><div class='del'>-#define FILE_PIPE_REMOTE_INFORMATION	25</div><div class='del'>-#define FILE_MAILSLOT_QUERY_INFORMATION 26</div><div class='del'>-#define FILE_MAILSLOT_SET_INFORMATION	27</div><div class='del'>-#define FILE_COMPRESSION_INFORMATION	28</div><div class='del'>-#define FILE_OBJECT_ID_INFORMATION	29</div><div class='del'>-/* Number 30 not defined in documents */</div><div class='del'>-#define FILE_MOVE_CLUSTER_INFORMATION	31</div><div class='del'>-#define FILE_QUOTA_INFORMATION		32</div><div class='del'>-#define FILE_REPARSE_POINT_INFORMATION	33</div><div class='del'>-#define FILE_NETWORK_OPEN_INFORMATION	34</div><div class='del'>-#define FILE_ATTRIBUTE_TAG_INFORMATION	35</div><div class='del'>-#define FILE_TRACKING_INFORMATION	36</div><div class='del'>-#define FILEID_BOTH_DIRECTORY_INFORMATION 37</div><div class='del'>-#define FILEID_FULL_DIRECTORY_INFORMATION 38</div><div class='del'>-#define FILE_VALID_DATA_LENGTH_INFORMATION 39</div><div class='del'>-#define FILE_SHORT_NAME_INFORMATION	40</div><div class='del'>-#define FILE_SFIO_RESERVE_INFORMATION	44</div><div class='del'>-#define FILE_SFIO_VOLUME_INFORMATION	45</div><div class='del'>-#define FILE_HARD_LINK_INFORMATION	46</div><div class='del'>-#define FILE_NORMALIZED_NAME_INFORMATION 48</div><div class='del'>-#define FILEID_GLOBAL_TX_DIRECTORY_INFORMATION 50</div><div class='del'>-#define FILE_STANDARD_LINK_INFORMATION	54</div><div class='del'>-</div><div class='del'>-#define OP_BREAK_STRUCT_SIZE_20		24</div><div class='del'>-#define OP_BREAK_STRUCT_SIZE_21		36</div><div class='del'>-</div><div class='del'>-struct smb2_file_access_info {</div><div class='del'>-	__le32 AccessFlags;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_file_alignment_info {</div><div class='del'>-	__le32 AlignmentRequirement;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_file_internal_info {</div><div class='del'>-	__le64 IndexNumber;</div><div class='del'>-} __packed; /* level 6 Query */</div><div class='del'>-</div><div class='del'>-struct smb2_file_rename_info { /* encoding of request for level 10 */</div><div class='del'>-	__u8   ReplaceIfExists; /* 1 = replace existing target with new */</div><div class='del'>-				/* 0 = fail if target already exists */</div><div class='del'>-	__u8   Reserved[7];</div><div class='del'>-	__u64  RootDirectory;  /* MBZ for network operations (why says spec?) */</div><div class='del'>-	__le32 FileNameLength;</div><div class='del'>-	char   FileName[0];     /* New name to be assigned */</div><div class='del'>-} __packed; /* level 10 Set */</div><div class='del'>-</div><div class='del'>-struct smb2_file_link_info { /* encoding of request for level 11 */</div><div class='del'>-	__u8   ReplaceIfExists; /* 1 = replace existing link with new */</div><div class='del'>-				/* 0 = fail if link already exists */</div><div class='del'>-	__u8   Reserved[7];</div><div class='del'>-	__u64  RootDirectory;  /* MBZ for network operations (why says spec?) */</div><div class='del'>-	__le32 FileNameLength;</div><div class='del'>-	char   FileName[0];     /* Name to be assigned to new link */</div><div class='del'>-} __packed; /* level 11 Set */</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * This level 18, although with struct with same name is different from cifs</div><div class='del'>- * level 0x107. Level 0x107 has an extra u64 between AccessFlags and</div><div class='del'>- * CurrentByteOffset.</div><div class='del'>- */</div><div class='del'>-struct smb2_file_all_info { /* data block encoding of response to level 18 */</div><div class='del'>-	__le64 CreationTime;	/* Beginning of FILE_BASIC_INFO equivalent */</div><div class='del'>-	__le64 LastAccessTime;</div><div class='del'>-	__le64 LastWriteTime;</div><div class='del'>-	__le64 ChangeTime;</div><div class='del'>-	__le32 Attributes;</div><div class='del'>-	__u32  Pad1;		/* End of FILE_BASIC_INFO_INFO equivalent */</div><div class='del'>-	__le64 AllocationSize;	/* Beginning of FILE_STANDARD_INFO equivalent */</div><div class='del'>-	__le64 EndOfFile;	/* size ie offset to first free byte in file */</div><div class='del'>-	__le32 NumberOfLinks;	/* hard links */</div><div class='del'>-	__u8   DeletePending;</div><div class='del'>-	__u8   Directory;</div><div class='del'>-	__u16  Pad2;		/* End of FILE_STANDARD_INFO equivalent */</div><div class='del'>-	__le64 IndexNumber;</div><div class='del'>-	__le32 EASize;</div><div class='del'>-	__le32 AccessFlags;</div><div class='del'>-	__le64 CurrentByteOffset;</div><div class='del'>-	__le32 Mode;</div><div class='del'>-	__le32 AlignmentRequirement;</div><div class='del'>-	__le32 FileNameLength;</div><div class='del'>-	char   FileName[1];</div><div class='del'>-} __packed; /* level 18 Query */</div><div class='del'>-</div><div class='del'>-struct smb2_file_basic_info { /* data block encoding of response to level 18 */</div><div class='del'>-	__le64 CreationTime;	/* Beginning of FILE_BASIC_INFO equivalent */</div><div class='del'>-	__le64 LastAccessTime;</div><div class='del'>-	__le64 LastWriteTime;</div><div class='del'>-	__le64 ChangeTime;</div><div class='del'>-	__le32 Attributes;</div><div class='del'>-	__u32  Pad1;		/* End of FILE_BASIC_INFO_INFO equivalent */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_file_alt_name_info {</div><div class='del'>-	__le32 FileNameLength;</div><div class='del'>-	char FileName[0];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_file_stream_info {</div><div class='del'>-	__le32  NextEntryOffset;</div><div class='del'>-	__le32  StreamNameLength;</div><div class='del'>-	__le64 StreamSize;</div><div class='del'>-	__le64 StreamAllocationSize;</div><div class='del'>-	char   StreamName[0];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_file_eof_info { /* encoding of request for level 10 */</div><div class='del'>-	__le64 EndOfFile; /* new end of file value */</div><div class='del'>-} __packed; /* level 20 Set */</div><div class='del'>-</div><div class='del'>-struct smb2_file_ntwrk_info {</div><div class='del'>-	__le64 CreationTime;</div><div class='del'>-	__le64 LastAccessTime;</div><div class='del'>-	__le64 LastWriteTime;</div><div class='del'>-	__le64 ChangeTime;</div><div class='del'>-	__le64 AllocationSize;</div><div class='del'>-	__le64 EndOfFile;</div><div class='del'>-	__le32 Attributes;</div><div class='del'>-	__le32 Reserved;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_file_standard_info {</div><div class='del'>-	__le64 AllocationSize;</div><div class='del'>-	__le64 EndOfFile;</div><div class='del'>-	__le32 NumberOfLinks;	/* hard links */</div><div class='del'>-	__u8   DeletePending;</div><div class='del'>-	__u8   Directory;</div><div class='del'>-	__le16 Reserved;</div><div class='del'>-} __packed; /* level 18 Query */</div><div class='del'>-</div><div class='del'>-struct smb2_file_ea_info {</div><div class='del'>-	__le32 EASize;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_file_alloc_info {</div><div class='del'>-	__le64 AllocationSize;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_file_disposition_info {</div><div class='del'>-	__u8 DeletePending;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_file_pos_info {</div><div class='del'>-	__le64 CurrentByteOffset;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define FILE_MODE_INFO_MASK cpu_to_le32(0x0000103e)</div><div class='del'>-</div><div class='del'>-struct smb2_file_mode_info {</div><div class='del'>-	__le32 Mode;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define COMPRESSION_FORMAT_NONE 0x0000</div><div class='del'>-#define COMPRESSION_FORMAT_LZNT1 0x0002</div><div class='del'>-</div><div class='del'>-struct smb2_file_comp_info {</div><div class='del'>-	__le64 CompressedFileSize;</div><div class='del'>-	__le16 CompressionFormat;</div><div class='del'>-	__u8 CompressionUnitShift;</div><div class='del'>-	__u8 ChunkShift;</div><div class='del'>-	__u8 ClusterShift;</div><div class='del'>-	__u8 Reserved[3];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_file_attr_tag_info {</div><div class='del'>-	__le32 FileAttributes;</div><div class='del'>-	__le32 ReparseTag;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define SL_RESTART_SCAN	0x00000001</div><div class='del'>-#define SL_RETURN_SINGLE_ENTRY	0x00000002</div><div class='del'>-#define SL_INDEX_SPECIFIED	0x00000004</div><div class='del'>-</div><div class='del'>-struct smb2_ea_info_req {</div><div class='del'>-	__le32 NextEntryOffset;</div><div class='del'>-	__u8   EaNameLength;</div><div class='del'>-	char name[1];</div><div class='del'>-} __packed; /* level 15 Query */</div><div class='del'>-</div><div class='del'>-struct smb2_ea_info {</div><div class='del'>-	__le32 NextEntryOffset;</div><div class='del'>-	__u8   Flags;</div><div class='del'>-	__u8   EaNameLength;</div><div class='del'>-	__le16 EaValueLength;</div><div class='del'>-	char name[1];</div><div class='del'>-	/* optionally followed by value */</div><div class='del'>-} __packed; /* level 15 Query */</div><div class='del'>-</div><div class='del'>-struct create_ea_buf_req {</div><div class='del'>-	struct create_context ccontext;</div><div class='del'>-	__u8   Name[8];</div><div class='del'>-	struct smb2_ea_info ea;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct create_sd_buf_req {</div><div class='del'>-	struct create_context ccontext;</div><div class='del'>-	__u8   Name[8];</div><div class='del'>-	struct smb_ntsd ntsd;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* Find File infolevels */</div><div class='del'>-#define SMB_FIND_FILE_POSIX_INFO	0x064</div><div class='del'>-</div><div class='del'>-/* Level 100 query info */</div><div class='del'>-struct smb311_posix_qinfo {</div><div class='del'>-	__le64 CreationTime;</div><div class='del'>-	__le64 LastAccessTime;</div><div class='del'>-	__le64 LastWriteTime;</div><div class='del'>-	__le64 ChangeTime;</div><div class='del'>-	__le64 EndOfFile;</div><div class='del'>-	__le64 AllocationSize;</div><div class='del'>-	__le32 DosAttributes;</div><div class='del'>-	__le64 Inode;</div><div class='del'>-	__le32 DeviceId;</div><div class='del'>-	__le32 Zero;</div><div class='del'>-	/* beginning of POSIX Create Context Response */</div><div class='del'>-	__le32 HardLinks;</div><div class='del'>-	__le32 ReparseTag;</div><div class='del'>-	__le32 Mode;</div><div class='del'>-	u8     Sids[];</div><div class='del'>-	/*</div><div class='del'>-	 * var sized owner SID</div><div class='del'>-	 * var sized group SID</div><div class='del'>-	 * le32 filenamelength</div><div class='del'>-	 * u8  filename[]</div><div class='del'>-	 */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb2_posix_info {</div><div class='del'>-	__le32 NextEntryOffset;</div><div class='del'>-	__u32 Ignored;</div><div class='del'>-	__le64 CreationTime;</div><div class='del'>-	__le64 LastAccessTime;</div><div class='del'>-	__le64 LastWriteTime;</div><div class='del'>-	__le64 ChangeTime;</div><div class='del'>-	__le64 EndOfFile;</div><div class='del'>-	__le64 AllocationSize;</div><div class='del'>-	__le32 DosAttributes;</div><div class='del'>-	__le64 Inode;</div><div class='del'>-	__le32 DeviceId;</div><div class='del'>-	__le32 Zero;</div><div class='del'>-	/* beginning of POSIX Create Context Response */</div><div class='del'>-	__le32 HardLinks;</div><div class='del'>-	__le32 ReparseTag;</div><div class='del'>-	__le32 Mode;</div><div class='del'>-	u8 SidBuffer[40];</div><div class='del'>-	__le32 name_len;</div><div class='del'>-	u8 name[1];</div><div class='del'>-	/*</div><div class='del'>-	 * var sized owner SID</div><div class='del'>-	 * var sized group SID</div><div class='del'>-	 * le32 filenamelength</div><div class='del'>-	 * u8  filename[]</div><div class='del'>-	 */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* functions */</div><div class='del'>-void init_smb2_1_server(struct ksmbd_conn *conn);</div><div class='del'>-void init_smb3_0_server(struct ksmbd_conn *conn);</div><div class='del'>-void init_smb3_02_server(struct ksmbd_conn *conn);</div><div class='del'>-int init_smb3_11_server(struct ksmbd_conn *conn);</div><div class='del'>-</div><div class='del'>-void init_smb2_max_read_size(unsigned int sz);</div><div class='del'>-void init_smb2_max_write_size(unsigned int sz);</div><div class='del'>-void init_smb2_max_trans_size(unsigned int sz);</div><div class='del'>-</div><div class='del'>-bool is_smb2_neg_cmd(struct ksmbd_work *work);</div><div class='del'>-bool is_smb2_rsp(struct ksmbd_work *work);</div><div class='del'>-</div><div class='del'>-u16 get_smb2_cmd_val(struct ksmbd_work *work);</div><div class='del'>-void set_smb2_rsp_status(struct ksmbd_work *work, __le32 err);</div><div class='del'>-int init_smb2_rsp_hdr(struct ksmbd_work *work);</div><div class='del'>-int smb2_allocate_rsp_buf(struct ksmbd_work *work);</div><div class='del'>-bool is_chained_smb2_message(struct ksmbd_work *work);</div><div class='del'>-int init_smb2_neg_rsp(struct ksmbd_work *work);</div><div class='del'>-void smb2_set_err_rsp(struct ksmbd_work *work);</div><div class='del'>-int smb2_check_user_session(struct ksmbd_work *work);</div><div class='del'>-int smb2_get_ksmbd_tcon(struct ksmbd_work *work);</div><div class='del'>-bool smb2_is_sign_req(struct ksmbd_work *work, unsigned int command);</div><div class='del'>-int smb2_check_sign_req(struct ksmbd_work *work);</div><div class='del'>-void smb2_set_sign_rsp(struct ksmbd_work *work);</div><div class='del'>-int smb3_check_sign_req(struct ksmbd_work *work);</div><div class='del'>-void smb3_set_sign_rsp(struct ksmbd_work *work);</div><div class='del'>-int find_matching_smb2_dialect(int start_index, __le16 *cli_dialects,</div><div class='del'>-			       __le16 dialects_count);</div><div class='del'>-struct file_lock *smb_flock_init(struct file *f);</div><div class='del'>-int setup_async_work(struct ksmbd_work *work, void (*fn)(void **),</div><div class='del'>-		     void **arg);</div><div class='del'>-void smb2_send_interim_resp(struct ksmbd_work *work, __le32 status);</div><div class='del'>-struct channel *lookup_chann_list(struct ksmbd_session *sess,</div><div class='del'>-				  struct ksmbd_conn *conn);</div><div class='del'>-void smb3_preauth_hash_rsp(struct ksmbd_work *work);</div><div class='del'>-bool smb3_is_transform_hdr(void *buf);</div><div class='del'>-int smb3_decrypt_req(struct ksmbd_work *work);</div><div class='del'>-int smb3_encrypt_resp(struct ksmbd_work *work);</div><div class='del'>-bool smb3_11_final_sess_setup_resp(struct ksmbd_work *work);</div><div class='del'>-int smb2_set_rsp_credits(struct ksmbd_work *work);</div><div class='del'>-</div><div class='del'>-/* smb2 misc functions */</div><div class='del'>-int ksmbd_smb2_check_message(struct ksmbd_work *work);</div><div class='del'>-</div><div class='del'>-/* smb2 command handlers */</div><div class='del'>-int smb2_handle_negotiate(struct ksmbd_work *work);</div><div class='del'>-int smb2_negotiate_request(struct ksmbd_work *work);</div><div class='del'>-int smb2_sess_setup(struct ksmbd_work *work);</div><div class='del'>-int smb2_tree_connect(struct ksmbd_work *work);</div><div class='del'>-int smb2_tree_disconnect(struct ksmbd_work *work);</div><div class='del'>-int smb2_session_logoff(struct ksmbd_work *work);</div><div class='del'>-int smb2_open(struct ksmbd_work *work);</div><div class='del'>-int smb2_query_info(struct ksmbd_work *work);</div><div class='del'>-int smb2_query_dir(struct ksmbd_work *work);</div><div class='del'>-int smb2_close(struct ksmbd_work *work);</div><div class='del'>-int smb2_echo(struct ksmbd_work *work);</div><div class='del'>-int smb2_set_info(struct ksmbd_work *work);</div><div class='del'>-int smb2_read(struct ksmbd_work *work);</div><div class='del'>-int smb2_write(struct ksmbd_work *work);</div><div class='del'>-int smb2_flush(struct ksmbd_work *work);</div><div class='del'>-int smb2_cancel(struct ksmbd_work *work);</div><div class='del'>-int smb2_lock(struct ksmbd_work *work);</div><div class='del'>-int smb2_ioctl(struct ksmbd_work *work);</div><div class='del'>-int smb2_oplock_break(struct ksmbd_work *work);</div><div class='del'>-int smb2_notify(struct ksmbd_work *ksmbd_work);</div><div class='del'>-</div><div class='del'>-#endif	/* _SMB2PDU_H */</div><div class='head'>diff --git a/fs/ksmbd/smb_common.h b/fs/ksmbd/smb_common.h<br/>deleted file mode 100644<br/>index 6e79e7577f6b..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ksmbd/smb_common.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ksmbd/smb_common.h</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,534 +0,0 @@</div><div class='del'>-/* SPDX-License-Identifier: GPL-2.0-or-later */</div><div class='del'>-/*</div><div class='del'>- *   Copyright (C) 2018 Samsung Electronics Co., Ltd.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#ifndef __SMB_COMMON_H__</div><div class='del'>-#define __SMB_COMMON_H__</div><div class='del'>-</div><div class='del'>-#include &lt;linux/kernel.h&gt;</div><div class='del'>-</div><div class='del'>-#include "glob.h"</div><div class='del'>-#include "nterr.h"</div><div class='del'>-#include "smb2pdu.h"</div><div class='del'>-</div><div class='del'>-/* ksmbd's Specific ERRNO */</div><div class='del'>-#define ESHARE			50000</div><div class='del'>-</div><div class='del'>-#define SMB1_PROT		0</div><div class='del'>-#define SMB2_PROT		1</div><div class='del'>-#define SMB21_PROT		2</div><div class='del'>-/* multi-protocol negotiate request */</div><div class='del'>-#define SMB2X_PROT		3</div><div class='del'>-#define SMB30_PROT		4</div><div class='del'>-#define SMB302_PROT		5</div><div class='del'>-#define SMB311_PROT		6</div><div class='del'>-#define BAD_PROT		0xFFFF</div><div class='del'>-</div><div class='del'>-#define SMB1_VERSION_STRING	"1.0"</div><div class='del'>-#define SMB20_VERSION_STRING	"2.0"</div><div class='del'>-#define SMB21_VERSION_STRING	"2.1"</div><div class='del'>-#define SMB30_VERSION_STRING	"3.0"</div><div class='del'>-#define SMB302_VERSION_STRING	"3.02"</div><div class='del'>-#define SMB311_VERSION_STRING	"3.1.1"</div><div class='del'>-</div><div class='del'>-/* Dialects */</div><div class='del'>-#define SMB10_PROT_ID		0x00</div><div class='del'>-#define SMB20_PROT_ID		0x0202</div><div class='del'>-#define SMB21_PROT_ID		0x0210</div><div class='del'>-/* multi-protocol negotiate request */</div><div class='del'>-#define SMB2X_PROT_ID		0x02FF</div><div class='del'>-#define SMB30_PROT_ID		0x0300</div><div class='del'>-#define SMB302_PROT_ID		0x0302</div><div class='del'>-#define SMB311_PROT_ID		0x0311</div><div class='del'>-#define BAD_PROT_ID		0xFFFF</div><div class='del'>-</div><div class='del'>-#define SMB_ECHO_INTERVAL	(60 * HZ)</div><div class='del'>-</div><div class='del'>-#define CIFS_DEFAULT_IOSIZE	(64 * 1024)</div><div class='del'>-#define MAX_CIFS_SMALL_BUFFER_SIZE 448 /* big enough for most */</div><div class='del'>-</div><div class='del'>-#define MAX_STREAM_PROT_LEN	0x00FFFFFF</div><div class='del'>-</div><div class='del'>-/* Responses when opening a file. */</div><div class='del'>-#define F_SUPERSEDED	0</div><div class='del'>-#define F_OPENED	1</div><div class='del'>-#define F_CREATED	2</div><div class='del'>-#define F_OVERWRITTEN	3</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * File Attribute flags</div><div class='del'>- */</div><div class='del'>-#define ATTR_READONLY			0x0001</div><div class='del'>-#define ATTR_HIDDEN			0x0002</div><div class='del'>-#define ATTR_SYSTEM			0x0004</div><div class='del'>-#define ATTR_VOLUME			0x0008</div><div class='del'>-#define ATTR_DIRECTORY			0x0010</div><div class='del'>-#define ATTR_ARCHIVE			0x0020</div><div class='del'>-#define ATTR_DEVICE			0x0040</div><div class='del'>-#define ATTR_NORMAL			0x0080</div><div class='del'>-#define ATTR_TEMPORARY			0x0100</div><div class='del'>-#define ATTR_SPARSE			0x0200</div><div class='del'>-#define ATTR_REPARSE			0x0400</div><div class='del'>-#define ATTR_COMPRESSED			0x0800</div><div class='del'>-#define ATTR_OFFLINE			0x1000</div><div class='del'>-#define ATTR_NOT_CONTENT_INDEXED	0x2000</div><div class='del'>-#define ATTR_ENCRYPTED			0x4000</div><div class='del'>-#define ATTR_POSIX_SEMANTICS		0x01000000</div><div class='del'>-#define ATTR_BACKUP_SEMANTICS		0x02000000</div><div class='del'>-#define ATTR_DELETE_ON_CLOSE		0x04000000</div><div class='del'>-#define ATTR_SEQUENTIAL_SCAN		0x08000000</div><div class='del'>-#define ATTR_RANDOM_ACCESS		0x10000000</div><div class='del'>-#define ATTR_NO_BUFFERING		0x20000000</div><div class='del'>-#define ATTR_WRITE_THROUGH		0x80000000</div><div class='del'>-</div><div class='del'>-#define ATTR_READONLY_LE		cpu_to_le32(ATTR_READONLY)</div><div class='del'>-#define ATTR_HIDDEN_LE			cpu_to_le32(ATTR_HIDDEN)</div><div class='del'>-#define ATTR_SYSTEM_LE			cpu_to_le32(ATTR_SYSTEM)</div><div class='del'>-#define ATTR_DIRECTORY_LE		cpu_to_le32(ATTR_DIRECTORY)</div><div class='del'>-#define ATTR_ARCHIVE_LE			cpu_to_le32(ATTR_ARCHIVE)</div><div class='del'>-#define ATTR_NORMAL_LE			cpu_to_le32(ATTR_NORMAL)</div><div class='del'>-#define ATTR_TEMPORARY_LE		cpu_to_le32(ATTR_TEMPORARY)</div><div class='del'>-#define ATTR_SPARSE_FILE_LE		cpu_to_le32(ATTR_SPARSE)</div><div class='del'>-#define ATTR_REPARSE_POINT_LE		cpu_to_le32(ATTR_REPARSE)</div><div class='del'>-#define ATTR_COMPRESSED_LE		cpu_to_le32(ATTR_COMPRESSED)</div><div class='del'>-#define ATTR_OFFLINE_LE			cpu_to_le32(ATTR_OFFLINE)</div><div class='del'>-#define ATTR_NOT_CONTENT_INDEXED_LE	cpu_to_le32(ATTR_NOT_CONTENT_INDEXED)</div><div class='del'>-#define ATTR_ENCRYPTED_LE		cpu_to_le32(ATTR_ENCRYPTED)</div><div class='del'>-#define ATTR_INTEGRITY_STREAML_LE	cpu_to_le32(0x00008000)</div><div class='del'>-#define ATTR_NO_SCRUB_DATA_LE		cpu_to_le32(0x00020000)</div><div class='del'>-#define ATTR_MASK_LE			cpu_to_le32(0x00007FB7)</div><div class='del'>-</div><div class='del'>-/* List of FileSystemAttributes - see 2.5.1 of MS-FSCC */</div><div class='del'>-#define FILE_SUPPORTS_SPARSE_VDL	0x10000000 /* faster nonsparse extend */</div><div class='del'>-#define FILE_SUPPORTS_BLOCK_REFCOUNTING	0x08000000 /* allow ioctl dup extents */</div><div class='del'>-#define FILE_SUPPORT_INTEGRITY_STREAMS	0x04000000</div><div class='del'>-#define FILE_SUPPORTS_USN_JOURNAL	0x02000000</div><div class='del'>-#define FILE_SUPPORTS_OPEN_BY_FILE_ID	0x01000000</div><div class='del'>-#define FILE_SUPPORTS_EXTENDED_ATTRIBUTES 0x00800000</div><div class='del'>-#define FILE_SUPPORTS_HARD_LINKS	0x00400000</div><div class='del'>-#define FILE_SUPPORTS_TRANSACTIONS	0x00200000</div><div class='del'>-#define FILE_SEQUENTIAL_WRITE_ONCE	0x00100000</div><div class='del'>-#define FILE_READ_ONLY_VOLUME		0x00080000</div><div class='del'>-#define FILE_NAMED_STREAMS		0x00040000</div><div class='del'>-#define FILE_SUPPORTS_ENCRYPTION	0x00020000</div><div class='del'>-#define FILE_SUPPORTS_OBJECT_IDS	0x00010000</div><div class='del'>-#define FILE_VOLUME_IS_COMPRESSED	0x00008000</div><div class='del'>-#define FILE_SUPPORTS_REMOTE_STORAGE	0x00000100</div><div class='del'>-#define FILE_SUPPORTS_REPARSE_POINTS	0x00000080</div><div class='del'>-#define FILE_SUPPORTS_SPARSE_FILES	0x00000040</div><div class='del'>-#define FILE_VOLUME_QUOTAS		0x00000020</div><div class='del'>-#define FILE_FILE_COMPRESSION		0x00000010</div><div class='del'>-#define FILE_PERSISTENT_ACLS		0x00000008</div><div class='del'>-#define FILE_UNICODE_ON_DISK		0x00000004</div><div class='del'>-#define FILE_CASE_PRESERVED_NAMES	0x00000002</div><div class='del'>-#define FILE_CASE_SENSITIVE_SEARCH	0x00000001</div><div class='del'>-</div><div class='del'>-#define FILE_READ_DATA        0x00000001  /* Data can be read from the file   */</div><div class='del'>-#define FILE_WRITE_DATA       0x00000002  /* Data can be written to the file  */</div><div class='del'>-#define FILE_APPEND_DATA      0x00000004  /* Data can be appended to the file */</div><div class='del'>-#define FILE_READ_EA          0x00000008  /* Extended attributes associated   */</div><div class='del'>-/* with the file can be read        */</div><div class='del'>-#define FILE_WRITE_EA         0x00000010  /* Extended attributes associated   */</div><div class='del'>-/* with the file can be written     */</div><div class='del'>-#define FILE_EXECUTE          0x00000020  /*Data can be read into memory from */</div><div class='del'>-/* the file using system paging I/O */</div><div class='del'>-#define FILE_DELETE_CHILD     0x00000040</div><div class='del'>-#define FILE_READ_ATTRIBUTES  0x00000080  /* Attributes associated with the   */</div><div class='del'>-/* file can be read                 */</div><div class='del'>-#define FILE_WRITE_ATTRIBUTES 0x00000100  /* Attributes associated with the   */</div><div class='del'>-/* file can be written              */</div><div class='del'>-#define DELETE                0x00010000  /* The file can be deleted          */</div><div class='del'>-#define READ_CONTROL          0x00020000  /* The access control list and      */</div><div class='del'>-/* ownership associated with the    */</div><div class='del'>-/* file can be read                 */</div><div class='del'>-#define WRITE_DAC             0x00040000  /* The access control list and      */</div><div class='del'>-/* ownership associated with the    */</div><div class='del'>-/* file can be written.             */</div><div class='del'>-#define WRITE_OWNER           0x00080000  /* Ownership information associated */</div><div class='del'>-/* with the file can be written     */</div><div class='del'>-#define SYNCHRONIZE           0x00100000  /* The file handle can waited on to */</div><div class='del'>-/* synchronize with the completion  */</div><div class='del'>-/* of an input/output request       */</div><div class='del'>-#define GENERIC_ALL           0x10000000</div><div class='del'>-#define GENERIC_EXECUTE       0x20000000</div><div class='del'>-#define GENERIC_WRITE         0x40000000</div><div class='del'>-#define GENERIC_READ          0x80000000</div><div class='del'>-/* In summary - Relevant file       */</div><div class='del'>-/* access flags from CIFS are       */</div><div class='del'>-/* file_read_data, file_write_data  */</div><div class='del'>-/* file_execute, file_read_attributes*/</div><div class='del'>-/* write_dac, and delete.           */</div><div class='del'>-</div><div class='del'>-#define FILE_READ_RIGHTS (FILE_READ_DATA | FILE_READ_EA | FILE_READ_ATTRIBUTES)</div><div class='del'>-#define FILE_WRITE_RIGHTS (FILE_WRITE_DATA | FILE_APPEND_DATA \</div><div class='del'>-		| FILE_WRITE_EA | FILE_WRITE_ATTRIBUTES)</div><div class='del'>-#define FILE_EXEC_RIGHTS (FILE_EXECUTE)</div><div class='del'>-</div><div class='del'>-#define SET_FILE_READ_RIGHTS (FILE_READ_DATA | FILE_READ_EA \</div><div class='del'>-		| FILE_READ_ATTRIBUTES \</div><div class='del'>-		| DELETE | READ_CONTROL | WRITE_DAC \</div><div class='del'>-		| WRITE_OWNER | SYNCHRONIZE)</div><div class='del'>-#define SET_FILE_WRITE_RIGHTS (FILE_WRITE_DATA | FILE_APPEND_DATA \</div><div class='del'>-		| FILE_WRITE_EA \</div><div class='del'>-		| FILE_DELETE_CHILD \</div><div class='del'>-		| FILE_WRITE_ATTRIBUTES \</div><div class='del'>-		| DELETE | READ_CONTROL | WRITE_DAC \</div><div class='del'>-		| WRITE_OWNER | SYNCHRONIZE)</div><div class='del'>-#define SET_FILE_EXEC_RIGHTS (FILE_READ_EA | FILE_WRITE_EA | FILE_EXECUTE \</div><div class='del'>-		| FILE_READ_ATTRIBUTES \</div><div class='del'>-		| FILE_WRITE_ATTRIBUTES \</div><div class='del'>-		| DELETE | READ_CONTROL | WRITE_DAC \</div><div class='del'>-		| WRITE_OWNER | SYNCHRONIZE)</div><div class='del'>-</div><div class='del'>-#define SET_MINIMUM_RIGHTS (FILE_READ_EA | FILE_READ_ATTRIBUTES \</div><div class='del'>-		| READ_CONTROL | SYNCHRONIZE)</div><div class='del'>-</div><div class='del'>-/* generic flags for file open */</div><div class='del'>-#define GENERIC_READ_FLAGS	(READ_CONTROL | FILE_READ_DATA | \</div><div class='del'>-		FILE_READ_ATTRIBUTES | \</div><div class='del'>-		FILE_READ_EA | SYNCHRONIZE)</div><div class='del'>-</div><div class='del'>-#define GENERIC_WRITE_FLAGS	(READ_CONTROL | FILE_WRITE_DATA | \</div><div class='del'>-		FILE_WRITE_ATTRIBUTES | FILE_WRITE_EA | \</div><div class='del'>-		FILE_APPEND_DATA | SYNCHRONIZE)</div><div class='del'>-</div><div class='del'>-#define GENERIC_EXECUTE_FLAGS	(READ_CONTROL | FILE_EXECUTE | \</div><div class='del'>-		FILE_READ_ATTRIBUTES | SYNCHRONIZE)</div><div class='del'>-</div><div class='del'>-#define GENERIC_ALL_FLAGS	(DELETE | READ_CONTROL | WRITE_DAC | \</div><div class='del'>-		WRITE_OWNER | SYNCHRONIZE | FILE_READ_DATA | \</div><div class='del'>-		FILE_WRITE_DATA | FILE_APPEND_DATA | \</div><div class='del'>-		FILE_READ_EA | FILE_WRITE_EA | \</div><div class='del'>-		FILE_EXECUTE | FILE_DELETE_CHILD | \</div><div class='del'>-		FILE_READ_ATTRIBUTES | FILE_WRITE_ATTRIBUTES)</div><div class='del'>-</div><div class='del'>-#define SMB1_PROTO_NUMBER		cpu_to_le32(0x424d53ff)</div><div class='del'>-#define SMB_COM_NEGOTIATE		0x72</div><div class='del'>-</div><div class='del'>-#define SMB1_CLIENT_GUID_SIZE		(16)</div><div class='del'>-struct smb_hdr {</div><div class='del'>-	__be32 smb_buf_length;</div><div class='del'>-	__u8 Protocol[4];</div><div class='del'>-	__u8 Command;</div><div class='del'>-	union {</div><div class='del'>-		struct {</div><div class='del'>-			__u8 ErrorClass;</div><div class='del'>-			__u8 Reserved;</div><div class='del'>-			__le16 Error;</div><div class='del'>-		} __packed DosError;</div><div class='del'>-		__le32 CifsError;</div><div class='del'>-	} __packed Status;</div><div class='del'>-	__u8 Flags;</div><div class='del'>-	__le16 Flags2;          /* note: le */</div><div class='del'>-	__le16 PidHigh;</div><div class='del'>-	union {</div><div class='del'>-		struct {</div><div class='del'>-			__le32 SequenceNumber;  /* le */</div><div class='del'>-			__u32 Reserved; /* zero */</div><div class='del'>-		} __packed Sequence;</div><div class='del'>-		__u8 SecuritySignature[8];      /* le */</div><div class='del'>-	} __packed Signature;</div><div class='del'>-	__u8 pad[2];</div><div class='del'>-	__le16 Tid;</div><div class='del'>-	__le16 Pid;</div><div class='del'>-	__le16 Uid;</div><div class='del'>-	__le16 Mid;</div><div class='del'>-	__u8 WordCount;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb_negotiate_req {</div><div class='del'>-	struct smb_hdr hdr;     /* wct = 0 */</div><div class='del'>-	__le16 ByteCount;</div><div class='del'>-	unsigned char DialectsArray[1];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb_negotiate_rsp {</div><div class='del'>-	struct smb_hdr hdr;     /* wct = 17 */</div><div class='del'>-	__le16 DialectIndex; /* 0xFFFF = no dialect acceptable */</div><div class='del'>-	__u8 SecurityMode;</div><div class='del'>-	__le16 MaxMpxCount;</div><div class='del'>-	__le16 MaxNumberVcs;</div><div class='del'>-	__le32 MaxBufferSize;</div><div class='del'>-	__le32 MaxRawSize;</div><div class='del'>-	__le32 SessionKey;</div><div class='del'>-	__le32 Capabilities;    /* see below */</div><div class='del'>-	__le32 SystemTimeLow;</div><div class='del'>-	__le32 SystemTimeHigh;</div><div class='del'>-	__le16 ServerTimeZone;</div><div class='del'>-	__u8 EncryptionKeyLength;</div><div class='del'>-	__le16 ByteCount;</div><div class='del'>-	union {</div><div class='del'>-		unsigned char EncryptionKey[8]; /* cap extended security off */</div><div class='del'>-		/* followed by Domain name - if extended security is off */</div><div class='del'>-		/* followed by 16 bytes of server GUID */</div><div class='del'>-		/* then security blob if cap_extended_security negotiated */</div><div class='del'>-		struct {</div><div class='del'>-			unsigned char GUID[SMB1_CLIENT_GUID_SIZE];</div><div class='del'>-			unsigned char SecurityBlob[1];</div><div class='del'>-		} __packed extended_response;</div><div class='del'>-	} __packed u;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct filesystem_attribute_info {</div><div class='del'>-	__le32 Attributes;</div><div class='del'>-	__le32 MaxPathNameComponentLength;</div><div class='del'>-	__le32 FileSystemNameLen;</div><div class='del'>-	__le16 FileSystemName[1]; /* do not have to save this - get subset? */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct filesystem_device_info {</div><div class='del'>-	__le32 DeviceType;</div><div class='del'>-	__le32 DeviceCharacteristics;</div><div class='del'>-} __packed; /* device info level 0x104 */</div><div class='del'>-</div><div class='del'>-struct filesystem_vol_info {</div><div class='del'>-	__le64 VolumeCreationTime;</div><div class='del'>-	__le32 SerialNumber;</div><div class='del'>-	__le32 VolumeLabelSize;</div><div class='del'>-	__le16 Reserved;</div><div class='del'>-	__le16 VolumeLabel[1];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct filesystem_info {</div><div class='del'>-	__le64 TotalAllocationUnits;</div><div class='del'>-	__le64 FreeAllocationUnits;</div><div class='del'>-	__le32 SectorsPerAllocationUnit;</div><div class='del'>-	__le32 BytesPerSector;</div><div class='del'>-} __packed;     /* size info, level 0x103 */</div><div class='del'>-</div><div class='del'>-#define EXTENDED_INFO_MAGIC 0x43667364	/* Cfsd */</div><div class='del'>-#define STRING_LENGTH 28</div><div class='del'>-</div><div class='del'>-struct fs_extended_info {</div><div class='del'>-	__le32 magic;</div><div class='del'>-	__le32 version;</div><div class='del'>-	__le32 release;</div><div class='del'>-	__u64 rel_date;</div><div class='del'>-	char    version_string[STRING_LENGTH];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct object_id_info {</div><div class='del'>-	char objid[16];</div><div class='del'>-	struct fs_extended_info extended_info;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct file_directory_info {</div><div class='del'>-	__le32 NextEntryOffset;</div><div class='del'>-	__u32 FileIndex;</div><div class='del'>-	__le64 CreationTime;</div><div class='del'>-	__le64 LastAccessTime;</div><div class='del'>-	__le64 LastWriteTime;</div><div class='del'>-	__le64 ChangeTime;</div><div class='del'>-	__le64 EndOfFile;</div><div class='del'>-	__le64 AllocationSize;</div><div class='del'>-	__le32 ExtFileAttributes;</div><div class='del'>-	__le32 FileNameLength;</div><div class='del'>-	char FileName[1];</div><div class='del'>-} __packed;   /* level 0x101 FF resp data */</div><div class='del'>-</div><div class='del'>-struct file_names_info {</div><div class='del'>-	__le32 NextEntryOffset;</div><div class='del'>-	__u32 FileIndex;</div><div class='del'>-	__le32 FileNameLength;</div><div class='del'>-	char FileName[1];</div><div class='del'>-} __packed;   /* level 0xc FF resp data */</div><div class='del'>-</div><div class='del'>-struct file_full_directory_info {</div><div class='del'>-	__le32 NextEntryOffset;</div><div class='del'>-	__u32 FileIndex;</div><div class='del'>-	__le64 CreationTime;</div><div class='del'>-	__le64 LastAccessTime;</div><div class='del'>-	__le64 LastWriteTime;</div><div class='del'>-	__le64 ChangeTime;</div><div class='del'>-	__le64 EndOfFile;</div><div class='del'>-	__le64 AllocationSize;</div><div class='del'>-	__le32 ExtFileAttributes;</div><div class='del'>-	__le32 FileNameLength;</div><div class='del'>-	__le32 EaSize;</div><div class='del'>-	char FileName[1];</div><div class='del'>-} __packed; /* level 0x102 FF resp */</div><div class='del'>-</div><div class='del'>-struct file_both_directory_info {</div><div class='del'>-	__le32 NextEntryOffset;</div><div class='del'>-	__u32 FileIndex;</div><div class='del'>-	__le64 CreationTime;</div><div class='del'>-	__le64 LastAccessTime;</div><div class='del'>-	__le64 LastWriteTime;</div><div class='del'>-	__le64 ChangeTime;</div><div class='del'>-	__le64 EndOfFile;</div><div class='del'>-	__le64 AllocationSize;</div><div class='del'>-	__le32 ExtFileAttributes;</div><div class='del'>-	__le32 FileNameLength;</div><div class='del'>-	__le32 EaSize; /* length of the xattrs */</div><div class='del'>-	__u8   ShortNameLength;</div><div class='del'>-	__u8   Reserved;</div><div class='del'>-	__u8   ShortName[24];</div><div class='del'>-	char FileName[1];</div><div class='del'>-} __packed; /* level 0x104 FFrsp data */</div><div class='del'>-</div><div class='del'>-struct file_id_both_directory_info {</div><div class='del'>-	__le32 NextEntryOffset;</div><div class='del'>-	__u32 FileIndex;</div><div class='del'>-	__le64 CreationTime;</div><div class='del'>-	__le64 LastAccessTime;</div><div class='del'>-	__le64 LastWriteTime;</div><div class='del'>-	__le64 ChangeTime;</div><div class='del'>-	__le64 EndOfFile;</div><div class='del'>-	__le64 AllocationSize;</div><div class='del'>-	__le32 ExtFileAttributes;</div><div class='del'>-	__le32 FileNameLength;</div><div class='del'>-	__le32 EaSize; /* length of the xattrs */</div><div class='del'>-	__u8   ShortNameLength;</div><div class='del'>-	__u8   Reserved;</div><div class='del'>-	__u8   ShortName[24];</div><div class='del'>-	__le16 Reserved2;</div><div class='del'>-	__le64 UniqueId;</div><div class='del'>-	char FileName[1];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct file_id_full_dir_info {</div><div class='del'>-	__le32 NextEntryOffset;</div><div class='del'>-	__u32 FileIndex;</div><div class='del'>-	__le64 CreationTime;</div><div class='del'>-	__le64 LastAccessTime;</div><div class='del'>-	__le64 LastWriteTime;</div><div class='del'>-	__le64 ChangeTime;</div><div class='del'>-	__le64 EndOfFile;</div><div class='del'>-	__le64 AllocationSize;</div><div class='del'>-	__le32 ExtFileAttributes;</div><div class='del'>-	__le32 FileNameLength;</div><div class='del'>-	__le32 EaSize; /* EA size */</div><div class='del'>-	__le32 Reserved;</div><div class='del'>-	__le64 UniqueId; /* inode num - le since Samba puts ino in low 32 bit*/</div><div class='del'>-	char FileName[1];</div><div class='del'>-} __packed; /* level 0x105 FF rsp data */</div><div class='del'>-</div><div class='del'>-struct smb_version_values {</div><div class='del'>-	char		*version_string;</div><div class='del'>-	__u16		protocol_id;</div><div class='del'>-	__le16		lock_cmd;</div><div class='del'>-	__u32		capabilities;</div><div class='del'>-	__u32		max_read_size;</div><div class='del'>-	__u32		max_write_size;</div><div class='del'>-	__u32		max_trans_size;</div><div class='del'>-	__u32		large_lock_type;</div><div class='del'>-	__u32		exclusive_lock_type;</div><div class='del'>-	__u32		shared_lock_type;</div><div class='del'>-	__u32		unlock_lock_type;</div><div class='del'>-	size_t		header_size;</div><div class='del'>-	size_t		max_header_size;</div><div class='del'>-	size_t		read_rsp_size;</div><div class='del'>-	unsigned int	cap_unix;</div><div class='del'>-	unsigned int	cap_nt_find;</div><div class='del'>-	unsigned int	cap_large_files;</div><div class='del'>-	__u16		signing_enabled;</div><div class='del'>-	__u16		signing_required;</div><div class='del'>-	size_t		create_lease_size;</div><div class='del'>-	size_t		create_durable_size;</div><div class='del'>-	size_t		create_durable_v2_size;</div><div class='del'>-	size_t		create_mxac_size;</div><div class='del'>-	size_t		create_disk_id_size;</div><div class='del'>-	size_t		create_posix_size;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct filesystem_posix_info {</div><div class='del'>-	/* For undefined recommended transfer size return -1 in that field */</div><div class='del'>-	__le32 OptimalTransferSize;  /* bsize on some os, iosize on other os */</div><div class='del'>-	__le32 BlockSize;</div><div class='del'>-	/* The next three fields are in terms of the block size.</div><div class='del'>-	 * (above). If block size is unknown, 4096 would be a</div><div class='del'>-	 * reasonable block size for a server to report.</div><div class='del'>-	 * Note that returning the blocks/blocksavail removes need</div><div class='del'>-	 * to make a second call (to QFSInfo level 0x103 to get this info.</div><div class='del'>-	 * UserBlockAvail is typically less than or equal to BlocksAvail,</div><div class='del'>-	 * if no distinction is made return the same value in each</div><div class='del'>-	 */</div><div class='del'>-	__le64 TotalBlocks;</div><div class='del'>-	__le64 BlocksAvail;       /* bfree */</div><div class='del'>-	__le64 UserBlocksAvail;   /* bavail */</div><div class='del'>-	/* For undefined Node fields or FSID return -1 */</div><div class='del'>-	__le64 TotalFileNodes;</div><div class='del'>-	__le64 FreeFileNodes;</div><div class='del'>-	__le64 FileSysIdentifier;   /* fsid */</div><div class='del'>-	/* NB Namelen comes from FILE_SYSTEM_ATTRIBUTE_INFO call */</div><div class='del'>-	/* NB flags can come from FILE_SYSTEM_DEVICE_INFO call   */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb_version_ops {</div><div class='del'>-	u16 (*get_cmd_val)(struct ksmbd_work *swork);</div><div class='del'>-	int (*init_rsp_hdr)(struct ksmbd_work *swork);</div><div class='del'>-	void (*set_rsp_status)(struct ksmbd_work *swork, __le32 err);</div><div class='del'>-	int (*allocate_rsp_buf)(struct ksmbd_work *work);</div><div class='del'>-	int (*set_rsp_credits)(struct ksmbd_work *work);</div><div class='del'>-	int (*check_user_session)(struct ksmbd_work *work);</div><div class='del'>-	int (*get_ksmbd_tcon)(struct ksmbd_work *work);</div><div class='del'>-	bool (*is_sign_req)(struct ksmbd_work *work, unsigned int command);</div><div class='del'>-	int (*check_sign_req)(struct ksmbd_work *work);</div><div class='del'>-	void (*set_sign_rsp)(struct ksmbd_work *work);</div><div class='del'>-	int (*generate_signingkey)(struct ksmbd_session *sess, struct ksmbd_conn *conn);</div><div class='del'>-	int (*generate_encryptionkey)(struct ksmbd_session *sess);</div><div class='del'>-	bool (*is_transform_hdr)(void *buf);</div><div class='del'>-	int (*decrypt_req)(struct ksmbd_work *work);</div><div class='del'>-	int (*encrypt_resp)(struct ksmbd_work *work);</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct smb_version_cmds {</div><div class='del'>-	int (*proc)(struct ksmbd_work *swork);</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static inline size_t</div><div class='del'>-smb2_hdr_size_no_buflen(struct smb_version_values *vals)</div><div class='del'>-{</div><div class='del'>-	return vals-&gt;header_size - 4;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int ksmbd_min_protocol(void);</div><div class='del'>-int ksmbd_max_protocol(void);</div><div class='del'>-</div><div class='del'>-int ksmbd_lookup_protocol_idx(char *str);</div><div class='del'>-</div><div class='del'>-int ksmbd_verify_smb_message(struct ksmbd_work *work);</div><div class='del'>-bool ksmbd_smb_request(struct ksmbd_conn *conn);</div><div class='del'>-</div><div class='del'>-int ksmbd_lookup_dialect_by_id(__le16 *cli_dialects, __le16 dialects_count);</div><div class='del'>-</div><div class='del'>-int ksmbd_init_smb_server(struct ksmbd_work *work);</div><div class='del'>-</div><div class='del'>-struct ksmbd_kstat;</div><div class='del'>-int ksmbd_populate_dot_dotdot_entries(struct ksmbd_work *work,</div><div class='del'>-				      int info_level,</div><div class='del'>-				      struct ksmbd_file *dir,</div><div class='del'>-				      struct ksmbd_dir_info *d_info,</div><div class='del'>-				      char *search_pattern,</div><div class='del'>-				      int (*fn)(struct ksmbd_conn *,</div><div class='del'>-						int,</div><div class='del'>-						struct ksmbd_dir_info *,</div><div class='del'>-						struct ksmbd_kstat *));</div><div class='del'>-</div><div class='del'>-int ksmbd_extract_shortname(struct ksmbd_conn *conn,</div><div class='del'>-			    const char *longname,</div><div class='del'>-			    char *shortname);</div><div class='del'>-</div><div class='del'>-int ksmbd_smb_negotiate_common(struct ksmbd_work *work, unsigned int command);</div><div class='del'>-</div><div class='del'>-int ksmbd_smb_check_shared_mode(struct file *filp, struct ksmbd_file *curr_fp);</div><div class='del'>-int ksmbd_override_fsids(struct ksmbd_work *work);</div><div class='del'>-void ksmbd_revert_fsids(struct ksmbd_work *work);</div><div class='del'>-</div><div class='del'>-unsigned int ksmbd_server_side_copy_max_chunk_count(void);</div><div class='del'>-unsigned int ksmbd_server_side_copy_max_chunk_size(void);</div><div class='del'>-unsigned int ksmbd_server_side_copy_max_total_size(void);</div><div class='del'>-bool is_asterisk(char *p);</div><div class='del'>-__le32 smb_map_generic_desired_access(__le32 daccess);</div><div class='del'>-</div><div class='del'>-static inline unsigned int get_rfc1002_len(void *buf)</div><div class='del'>-{</div><div class='del'>-	return be32_to_cpu(*((__be32 *)buf)) &amp; 0xffffff;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void inc_rfc1001_len(void *buf, int count)</div><div class='del'>-{</div><div class='del'>-	be32_add_cpu((__be32 *)buf, count);</div><div class='del'>-}</div><div class='del'>-#endif /* __SMB_COMMON_H__ */</div><div class='head'>diff --git a/fs/ksmbd/smbacl.h b/fs/ksmbd/smbacl.h<br/>deleted file mode 100644<br/>index 73e08cad412b..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ksmbd/smbacl.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ksmbd/smbacl.h</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,237 +0,0 @@</div><div class='del'>-/* SPDX-License-Identifier: LGPL-2.1+ */</div><div class='del'>-/*</div><div class='del'>- *   Copyright (c) International Business Machines  Corp., 2007</div><div class='del'>- *   Author(s): Steve French (sfrench@us.ibm.com)</div><div class='del'>- *   Modified by Namjae Jeon (linkinjeon@kernel.org)</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#ifndef _SMBACL_H</div><div class='del'>-#define _SMBACL_H</div><div class='del'>-</div><div class='del'>-#include &lt;linux/fs.h&gt;</div><div class='del'>-#include &lt;linux/namei.h&gt;</div><div class='del'>-#include &lt;linux/posix_acl.h&gt;</div><div class='del'>-</div><div class='del'>-#include "mgmt/tree_connect.h"</div><div class='del'>-</div><div class='del'>-#define NUM_AUTHS (6)	/* number of authority fields */</div><div class='del'>-#define SID_MAX_SUB_AUTHORITIES (15) /* max number of sub authority fields */</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * ACE types - see MS-DTYP 2.4.4.1</div><div class='del'>- */</div><div class='del'>-enum {</div><div class='del'>-	ACCESS_ALLOWED,</div><div class='del'>-	ACCESS_DENIED,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Security ID types</div><div class='del'>- */</div><div class='del'>-enum {</div><div class='del'>-	SIDOWNER = 1,</div><div class='del'>-	SIDGROUP,</div><div class='del'>-	SIDCREATOR_OWNER,</div><div class='del'>-	SIDCREATOR_GROUP,</div><div class='del'>-	SIDUNIX_USER,</div><div class='del'>-	SIDUNIX_GROUP,</div><div class='del'>-	SIDNFS_USER,</div><div class='del'>-	SIDNFS_GROUP,</div><div class='del'>-	SIDNFS_MODE,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/* Revision for ACLs */</div><div class='del'>-#define SD_REVISION	1</div><div class='del'>-</div><div class='del'>-/* Control flags for Security Descriptor */</div><div class='del'>-#define OWNER_DEFAULTED		0x0001</div><div class='del'>-#define GROUP_DEFAULTED		0x0002</div><div class='del'>-#define DACL_PRESENT		0x0004</div><div class='del'>-#define DACL_DEFAULTED		0x0008</div><div class='del'>-#define SACL_PRESENT		0x0010</div><div class='del'>-#define SACL_DEFAULTED		0x0020</div><div class='del'>-#define DACL_TRUSTED		0x0040</div><div class='del'>-#define SERVER_SECURITY		0x0080</div><div class='del'>-#define DACL_AUTO_INHERIT_REQ	0x0100</div><div class='del'>-#define SACL_AUTO_INHERIT_REQ	0x0200</div><div class='del'>-#define DACL_AUTO_INHERITED	0x0400</div><div class='del'>-#define SACL_AUTO_INHERITED	0x0800</div><div class='del'>-#define DACL_PROTECTED		0x1000</div><div class='del'>-#define SACL_PROTECTED		0x2000</div><div class='del'>-#define RM_CONTROL_VALID	0x4000</div><div class='del'>-#define SELF_RELATIVE		0x8000</div><div class='del'>-</div><div class='del'>-/* ACE types - see MS-DTYP 2.4.4.1 */</div><div class='del'>-#define ACCESS_ALLOWED_ACE_TYPE 0x00</div><div class='del'>-#define ACCESS_DENIED_ACE_TYPE  0x01</div><div class='del'>-#define SYSTEM_AUDIT_ACE_TYPE   0x02</div><div class='del'>-#define SYSTEM_ALARM_ACE_TYPE   0x03</div><div class='del'>-#define ACCESS_ALLOWED_COMPOUND_ACE_TYPE 0x04</div><div class='del'>-#define ACCESS_ALLOWED_OBJECT_ACE_TYPE  0x05</div><div class='del'>-#define ACCESS_DENIED_OBJECT_ACE_TYPE   0x06</div><div class='del'>-#define SYSTEM_AUDIT_OBJECT_ACE_TYPE    0x07</div><div class='del'>-#define SYSTEM_ALARM_OBJECT_ACE_TYPE    0x08</div><div class='del'>-#define ACCESS_ALLOWED_CALLBACK_ACE_TYPE 0x09</div><div class='del'>-#define ACCESS_DENIED_CALLBACK_ACE_TYPE 0x0A</div><div class='del'>-#define ACCESS_ALLOWED_CALLBACK_OBJECT_ACE_TYPE 0x0B</div><div class='del'>-#define ACCESS_DENIED_CALLBACK_OBJECT_ACE_TYPE  0x0C</div><div class='del'>-#define SYSTEM_AUDIT_CALLBACK_ACE_TYPE  0x0D</div><div class='del'>-#define SYSTEM_ALARM_CALLBACK_ACE_TYPE  0x0E /* Reserved */</div><div class='del'>-#define SYSTEM_AUDIT_CALLBACK_OBJECT_ACE_TYPE 0x0F</div><div class='del'>-#define SYSTEM_ALARM_CALLBACK_OBJECT_ACE_TYPE 0x10 /* reserved */</div><div class='del'>-#define SYSTEM_MANDATORY_LABEL_ACE_TYPE 0x11</div><div class='del'>-#define SYSTEM_RESOURCE_ATTRIBUTE_ACE_TYPE 0x12</div><div class='del'>-#define SYSTEM_SCOPED_POLICY_ID_ACE_TYPE 0x13</div><div class='del'>-</div><div class='del'>-/* ACE flags */</div><div class='del'>-#define OBJECT_INHERIT_ACE		0x01</div><div class='del'>-#define CONTAINER_INHERIT_ACE		0x02</div><div class='del'>-#define NO_PROPAGATE_INHERIT_ACE	0x04</div><div class='del'>-#define INHERIT_ONLY_ACE		0x08</div><div class='del'>-#define INHERITED_ACE			0x10</div><div class='del'>-#define SUCCESSFUL_ACCESS_ACE_FLAG	0x40</div><div class='del'>-#define FAILED_ACCESS_ACE_FLAG		0x80</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Maximum size of a string representation of a SID:</div><div class='del'>- *</div><div class='del'>- * The fields are unsigned values in decimal. So:</div><div class='del'>- *</div><div class='del'>- * u8:  max 3 bytes in decimal</div><div class='del'>- * u32: max 10 bytes in decimal</div><div class='del'>- *</div><div class='del'>- * "S-" + 3 bytes for version field + 15 for authority field + NULL terminator</div><div class='del'>- *</div><div class='del'>- * For authority field, max is when all 6 values are non-zero and it must be</div><div class='del'>- * represented in hex. So "-0x" + 12 hex digits.</div><div class='del'>- *</div><div class='del'>- * Add 11 bytes for each subauthority field (10 bytes each + 1 for '-')</div><div class='del'>- */</div><div class='del'>-#define SID_STRING_BASE_SIZE (2 + 3 + 15 + 1)</div><div class='del'>-#define SID_STRING_SUBAUTH_SIZE (11) /* size of a single subauth string */</div><div class='del'>-</div><div class='del'>-#define DOMAIN_USER_RID_LE	cpu_to_le32(513)</div><div class='del'>-</div><div class='del'>-struct ksmbd_conn;</div><div class='del'>-</div><div class='del'>-struct smb_ntsd {</div><div class='del'>-	__le16 revision; /* revision level */</div><div class='del'>-	__le16 type;</div><div class='del'>-	__le32 osidoffset;</div><div class='del'>-	__le32 gsidoffset;</div><div class='del'>-	__le32 sacloffset;</div><div class='del'>-	__le32 dacloffset;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb_sid {</div><div class='del'>-	__u8 revision; /* revision level */</div><div class='del'>-	__u8 num_subauth;</div><div class='del'>-	__u8 authority[NUM_AUTHS];</div><div class='del'>-	__le32 sub_auth[SID_MAX_SUB_AUTHORITIES]; /* sub_auth[num_subauth] */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* size of a struct cifs_sid, sans sub_auth array */</div><div class='del'>-#define CIFS_SID_BASE_SIZE (1 + 1 + NUM_AUTHS)</div><div class='del'>-</div><div class='del'>-struct smb_acl {</div><div class='del'>-	__le16 revision; /* revision level */</div><div class='del'>-	__le16 size;</div><div class='del'>-	__le32 num_aces;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb_ace {</div><div class='del'>-	__u8 type;</div><div class='del'>-	__u8 flags;</div><div class='del'>-	__le16 size;</div><div class='del'>-	__le32 access_req;</div><div class='del'>-	struct smb_sid sid; /* ie UUID of user or group who gets these perms */</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-struct smb_fattr {</div><div class='del'>-	kuid_t	cf_uid;</div><div class='del'>-	kgid_t	cf_gid;</div><div class='del'>-	umode_t	cf_mode;</div><div class='del'>-	__le32 daccess;</div><div class='del'>-	struct posix_acl *cf_acls;</div><div class='del'>-	struct posix_acl *cf_dacls;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct posix_ace_state {</div><div class='del'>-	u32 allow;</div><div class='del'>-	u32 deny;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct posix_user_ace_state {</div><div class='del'>-	union {</div><div class='del'>-		kuid_t uid;</div><div class='del'>-		kgid_t gid;</div><div class='del'>-	};</div><div class='del'>-	struct posix_ace_state perms;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct posix_ace_state_array {</div><div class='del'>-	int n;</div><div class='del'>-	struct posix_user_ace_state aces[];</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * while processing the nfsv4 ace, this maintains the partial permissions</div><div class='del'>- * calculated so far:</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-struct posix_acl_state {</div><div class='del'>-	struct posix_ace_state owner;</div><div class='del'>-	struct posix_ace_state group;</div><div class='del'>-	struct posix_ace_state other;</div><div class='del'>-	struct posix_ace_state everyone;</div><div class='del'>-	struct posix_ace_state mask; /* deny unused in this case */</div><div class='del'>-	struct posix_ace_state_array *users;</div><div class='del'>-	struct posix_ace_state_array *groups;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-int parse_sec_desc(struct user_namespace *user_ns, struct smb_ntsd *pntsd,</div><div class='del'>-		   int acl_len, struct smb_fattr *fattr);</div><div class='del'>-int build_sec_desc(struct user_namespace *user_ns, struct smb_ntsd *pntsd,</div><div class='del'>-		   struct smb_ntsd *ppntsd, int addition_info,</div><div class='del'>-		   __u32 *secdesclen, struct smb_fattr *fattr);</div><div class='del'>-int init_acl_state(struct posix_acl_state *state, int cnt);</div><div class='del'>-void free_acl_state(struct posix_acl_state *state);</div><div class='del'>-void posix_state_to_acl(struct posix_acl_state *state,</div><div class='del'>-			struct posix_acl_entry *pace);</div><div class='del'>-int compare_sids(const struct smb_sid *ctsid, const struct smb_sid *cwsid);</div><div class='del'>-bool smb_inherit_flags(int flags, bool is_dir);</div><div class='del'>-int smb_inherit_dacl(struct ksmbd_conn *conn, struct path *path,</div><div class='del'>-		     unsigned int uid, unsigned int gid);</div><div class='del'>-int smb_check_perm_dacl(struct ksmbd_conn *conn, struct path *path,</div><div class='del'>-			__le32 *pdaccess, int uid);</div><div class='del'>-int set_info_sec(struct ksmbd_conn *conn, struct ksmbd_tree_connect *tcon,</div><div class='del'>-		 struct path *path, struct smb_ntsd *pntsd, int ntsd_len,</div><div class='del'>-		 bool type_check);</div><div class='del'>-void id_to_sid(unsigned int cid, uint sidtype, struct smb_sid *ssid);</div><div class='del'>-void ksmbd_init_domain(u32 *sub_auth);</div><div class='del'>-</div><div class='del'>-static inline uid_t posix_acl_uid_translate(struct user_namespace *mnt_userns,</div><div class='del'>-					    struct posix_acl_entry *pace)</div><div class='del'>-{</div><div class='del'>-	kuid_t kuid;</div><div class='del'>-</div><div class='del'>-	/* If this is an idmapped mount, apply the idmapping. */</div><div class='del'>-	kuid = kuid_into_mnt(mnt_userns, pace-&gt;e_uid);</div><div class='del'>-</div><div class='del'>-	/* Translate the kuid into a userspace id ksmbd would see. */</div><div class='del'>-	return from_kuid(&amp;init_user_ns, kuid);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline gid_t posix_acl_gid_translate(struct user_namespace *mnt_userns,</div><div class='del'>-					    struct posix_acl_entry *pace)</div><div class='del'>-{</div><div class='del'>-	kgid_t kgid;</div><div class='del'>-</div><div class='del'>-	/* If this is an idmapped mount, apply the idmapping. */</div><div class='del'>-	kgid = kgid_into_mnt(mnt_userns, pace-&gt;e_gid);</div><div class='del'>-</div><div class='del'>-	/* Translate the kgid into a userspace id ksmbd would see. */</div><div class='del'>-	return from_kgid(&amp;init_user_ns, kgid);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-#endif /* _SMBACL_H */</div><div class='head'>diff --git a/fs/ksmbd/smbstatus.h b/fs/ksmbd/smbstatus.h<br/>deleted file mode 100644<br/>index 108a8b6ed24a..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ksmbd/smbstatus.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ksmbd/smbstatus.h</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,1822 +0,0 @@</div><div class='del'>-/* SPDX-License-Identifier: LGPL-2.1+ */</div><div class='del'>-/*</div><div class='del'>- *   fs/cifs/smb2status.h</div><div class='del'>- *</div><div class='del'>- *   SMB2 Status code (network error) definitions</div><div class='del'>- *   Definitions are from MS-ERREF</div><div class='del'>- *</div><div class='del'>- *   Copyright (c) International Business Machines  Corp., 2009,2011</div><div class='del'>- *   Author(s): Steve French (sfrench@us.ibm.com)</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- *  0 1 2 3 4 5 6 7 8 9 0 A B C D E F 0 1 2 3 4 5 6 7 8 9 A B C D E F</div><div class='del'>- *  SEV C N &lt;-------Facility--------&gt; &lt;------Error Status Code------&gt;</div><div class='del'>- *</div><div class='del'>- *  C is set if "customer defined" error, N bit is reserved and MBZ</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#define STATUS_SEVERITY_SUCCESS cpu_to_le32(0x0000)</div><div class='del'>-#define STATUS_SEVERITY_INFORMATIONAL cpu_to_le32(0x0001)</div><div class='del'>-#define STATUS_SEVERITY_WARNING cpu_to_le32(0x0002)</div><div class='del'>-#define STATUS_SEVERITY_ERROR cpu_to_le32(0x0003)</div><div class='del'>-</div><div class='del'>-struct ntstatus {</div><div class='del'>-	/* Facility is the high 12 bits of the following field */</div><div class='del'>-	__le32 Facility; /* low 2 bits Severity, next is Customer, then rsrvd */</div><div class='del'>-	__le32 Code;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-#define STATUS_SUCCESS 0x00000000</div><div class='del'>-#define STATUS_WAIT_0 cpu_to_le32(0x00000000)</div><div class='del'>-#define STATUS_WAIT_1 cpu_to_le32(0x00000001)</div><div class='del'>-#define STATUS_WAIT_2 cpu_to_le32(0x00000002)</div><div class='del'>-#define STATUS_WAIT_3 cpu_to_le32(0x00000003)</div><div class='del'>-#define STATUS_WAIT_63 cpu_to_le32(0x0000003F)</div><div class='del'>-#define STATUS_ABANDONED cpu_to_le32(0x00000080)</div><div class='del'>-#define STATUS_ABANDONED_WAIT_0 cpu_to_le32(0x00000080)</div><div class='del'>-#define STATUS_ABANDONED_WAIT_63 cpu_to_le32(0x000000BF)</div><div class='del'>-#define STATUS_USER_APC cpu_to_le32(0x000000C0)</div><div class='del'>-#define STATUS_KERNEL_APC cpu_to_le32(0x00000100)</div><div class='del'>-#define STATUS_ALERTED cpu_to_le32(0x00000101)</div><div class='del'>-#define STATUS_TIMEOUT cpu_to_le32(0x00000102)</div><div class='del'>-#define STATUS_PENDING cpu_to_le32(0x00000103)</div><div class='del'>-#define STATUS_REPARSE cpu_to_le32(0x00000104)</div><div class='del'>-#define STATUS_MORE_ENTRIES cpu_to_le32(0x00000105)</div><div class='del'>-#define STATUS_NOT_ALL_ASSIGNED cpu_to_le32(0x00000106)</div><div class='del'>-#define STATUS_SOME_NOT_MAPPED cpu_to_le32(0x00000107)</div><div class='del'>-#define STATUS_OPLOCK_BREAK_IN_PROGRESS cpu_to_le32(0x00000108)</div><div class='del'>-#define STATUS_VOLUME_MOUNTED cpu_to_le32(0x00000109)</div><div class='del'>-#define STATUS_RXACT_COMMITTED cpu_to_le32(0x0000010A)</div><div class='del'>-#define STATUS_NOTIFY_CLEANUP cpu_to_le32(0x0000010B)</div><div class='del'>-#define STATUS_NOTIFY_ENUM_DIR cpu_to_le32(0x0000010C)</div><div class='del'>-#define STATUS_NO_QUOTAS_FOR_ACCOUNT cpu_to_le32(0x0000010D)</div><div class='del'>-#define STATUS_PRIMARY_TRANSPORT_CONNECT_FAILED cpu_to_le32(0x0000010E)</div><div class='del'>-#define STATUS_PAGE_FAULT_TRANSITION cpu_to_le32(0x00000110)</div><div class='del'>-#define STATUS_PAGE_FAULT_DEMAND_ZERO cpu_to_le32(0x00000111)</div><div class='del'>-#define STATUS_PAGE_FAULT_COPY_ON_WRITE cpu_to_le32(0x00000112)</div><div class='del'>-#define STATUS_PAGE_FAULT_GUARD_PAGE cpu_to_le32(0x00000113)</div><div class='del'>-#define STATUS_PAGE_FAULT_PAGING_FILE cpu_to_le32(0x00000114)</div><div class='del'>-#define STATUS_CACHE_PAGE_LOCKED cpu_to_le32(0x00000115)</div><div class='del'>-#define STATUS_CRASH_DUMP cpu_to_le32(0x00000116)</div><div class='del'>-#define STATUS_BUFFER_ALL_ZEROS cpu_to_le32(0x00000117)</div><div class='del'>-#define STATUS_REPARSE_OBJECT cpu_to_le32(0x00000118)</div><div class='del'>-#define STATUS_RESOURCE_REQUIREMENTS_CHANGED cpu_to_le32(0x00000119)</div><div class='del'>-#define STATUS_TRANSLATION_COMPLETE cpu_to_le32(0x00000120)</div><div class='del'>-#define STATUS_DS_MEMBERSHIP_EVALUATED_LOCALLY cpu_to_le32(0x00000121)</div><div class='del'>-#define STATUS_NOTHING_TO_TERMINATE cpu_to_le32(0x00000122)</div><div class='del'>-#define STATUS_PROCESS_NOT_IN_JOB cpu_to_le32(0x00000123)</div><div class='del'>-#define STATUS_PROCESS_IN_JOB cpu_to_le32(0x00000124)</div><div class='del'>-#define STATUS_VOLSNAP_HIBERNATE_READY cpu_to_le32(0x00000125)</div><div class='del'>-#define STATUS_FSFILTER_OP_COMPLETED_SUCCESSFULLY cpu_to_le32(0x00000126)</div><div class='del'>-#define STATUS_INTERRUPT_VECTOR_ALREADY_CONNECTED cpu_to_le32(0x00000127)</div><div class='del'>-#define STATUS_INTERRUPT_STILL_CONNECTED cpu_to_le32(0x00000128)</div><div class='del'>-#define STATUS_PROCESS_CLONED cpu_to_le32(0x00000129)</div><div class='del'>-#define STATUS_FILE_LOCKED_WITH_ONLY_READERS cpu_to_le32(0x0000012A)</div><div class='del'>-#define STATUS_FILE_LOCKED_WITH_WRITERS cpu_to_le32(0x0000012B)</div><div class='del'>-#define STATUS_RESOURCEMANAGER_READ_ONLY cpu_to_le32(0x00000202)</div><div class='del'>-#define STATUS_WAIT_FOR_OPLOCK cpu_to_le32(0x00000367)</div><div class='del'>-#define DBG_EXCEPTION_HANDLED cpu_to_le32(0x00010001)</div><div class='del'>-#define DBG_CONTINUE cpu_to_le32(0x00010002)</div><div class='del'>-#define STATUS_FLT_IO_COMPLETE cpu_to_le32(0x001C0001)</div><div class='del'>-#define STATUS_OBJECT_NAME_EXISTS cpu_to_le32(0x40000000)</div><div class='del'>-#define STATUS_THREAD_WAS_SUSPENDED cpu_to_le32(0x40000001)</div><div class='del'>-#define STATUS_WORKING_SET_LIMIT_RANGE cpu_to_le32(0x40000002)</div><div class='del'>-#define STATUS_IMAGE_NOT_AT_BASE cpu_to_le32(0x40000003)</div><div class='del'>-#define STATUS_RXACT_STATE_CREATED cpu_to_le32(0x40000004)</div><div class='del'>-#define STATUS_SEGMENT_NOTIFICATION cpu_to_le32(0x40000005)</div><div class='del'>-#define STATUS_LOCAL_USER_SESSION_KEY cpu_to_le32(0x40000006)</div><div class='del'>-#define STATUS_BAD_CURRENT_DIRECTORY cpu_to_le32(0x40000007)</div><div class='del'>-#define STATUS_SERIAL_MORE_WRITES cpu_to_le32(0x40000008)</div><div class='del'>-#define STATUS_REGISTRY_RECOVERED cpu_to_le32(0x40000009)</div><div class='del'>-#define STATUS_FT_READ_RECOVERY_FROM_BACKUP cpu_to_le32(0x4000000A)</div><div class='del'>-#define STATUS_FT_WRITE_RECOVERY cpu_to_le32(0x4000000B)</div><div class='del'>-#define STATUS_SERIAL_COUNTER_TIMEOUT cpu_to_le32(0x4000000C)</div><div class='del'>-#define STATUS_NULL_LM_PASSWORD cpu_to_le32(0x4000000D)</div><div class='del'>-#define STATUS_IMAGE_MACHINE_TYPE_MISMATCH cpu_to_le32(0x4000000E)</div><div class='del'>-#define STATUS_RECEIVE_PARTIAL cpu_to_le32(0x4000000F)</div><div class='del'>-#define STATUS_RECEIVE_EXPEDITED cpu_to_le32(0x40000010)</div><div class='del'>-#define STATUS_RECEIVE_PARTIAL_EXPEDITED cpu_to_le32(0x40000011)</div><div class='del'>-#define STATUS_EVENT_DONE cpu_to_le32(0x40000012)</div><div class='del'>-#define STATUS_EVENT_PENDING cpu_to_le32(0x40000013)</div><div class='del'>-#define STATUS_CHECKING_FILE_SYSTEM cpu_to_le32(0x40000014)</div><div class='del'>-#define STATUS_FATAL_APP_EXIT cpu_to_le32(0x40000015)</div><div class='del'>-#define STATUS_PREDEFINED_HANDLE cpu_to_le32(0x40000016)</div><div class='del'>-#define STATUS_WAS_UNLOCKED cpu_to_le32(0x40000017)</div><div class='del'>-#define STATUS_SERVICE_NOTIFICATION cpu_to_le32(0x40000018)</div><div class='del'>-#define STATUS_WAS_LOCKED cpu_to_le32(0x40000019)</div><div class='del'>-#define STATUS_LOG_HARD_ERROR cpu_to_le32(0x4000001A)</div><div class='del'>-#define STATUS_ALREADY_WIN32 cpu_to_le32(0x4000001B)</div><div class='del'>-#define STATUS_WX86_UNSIMULATE cpu_to_le32(0x4000001C)</div><div class='del'>-#define STATUS_WX86_CONTINUE cpu_to_le32(0x4000001D)</div><div class='del'>-#define STATUS_WX86_SINGLE_STEP cpu_to_le32(0x4000001E)</div><div class='del'>-#define STATUS_WX86_BREAKPOINT cpu_to_le32(0x4000001F)</div><div class='del'>-#define STATUS_WX86_EXCEPTION_CONTINUE cpu_to_le32(0x40000020)</div><div class='del'>-#define STATUS_WX86_EXCEPTION_LASTCHANCE cpu_to_le32(0x40000021)</div><div class='del'>-#define STATUS_WX86_EXCEPTION_CHAIN cpu_to_le32(0x40000022)</div><div class='del'>-#define STATUS_IMAGE_MACHINE_TYPE_MISMATCH_EXE cpu_to_le32(0x40000023)</div><div class='del'>-#define STATUS_NO_YIELD_PERFORMED cpu_to_le32(0x40000024)</div><div class='del'>-#define STATUS_TIMER_RESUME_IGNORED cpu_to_le32(0x40000025)</div><div class='del'>-#define STATUS_ARBITRATION_UNHANDLED cpu_to_le32(0x40000026)</div><div class='del'>-#define STATUS_CARDBUS_NOT_SUPPORTED cpu_to_le32(0x40000027)</div><div class='del'>-#define STATUS_WX86_CREATEWX86TIB cpu_to_le32(0x40000028)</div><div class='del'>-#define STATUS_MP_PROCESSOR_MISMATCH cpu_to_le32(0x40000029)</div><div class='del'>-#define STATUS_HIBERNATED cpu_to_le32(0x4000002A)</div><div class='del'>-#define STATUS_RESUME_HIBERNATION cpu_to_le32(0x4000002B)</div><div class='del'>-#define STATUS_FIRMWARE_UPDATED cpu_to_le32(0x4000002C)</div><div class='del'>-#define STATUS_DRIVERS_LEAKING_LOCKED_PAGES cpu_to_le32(0x4000002D)</div><div class='del'>-#define STATUS_MESSAGE_RETRIEVED cpu_to_le32(0x4000002E)</div><div class='del'>-#define STATUS_SYSTEM_POWERSTATE_TRANSITION cpu_to_le32(0x4000002F)</div><div class='del'>-#define STATUS_ALPC_CHECK_COMPLETION_LIST cpu_to_le32(0x40000030)</div><div class='del'>-#define STATUS_SYSTEM_POWERSTATE_COMPLEX_TRANSITION cpu_to_le32(0x40000031)</div><div class='del'>-#define STATUS_ACCESS_AUDIT_BY_POLICY cpu_to_le32(0x40000032)</div><div class='del'>-#define STATUS_ABANDON_HIBERFILE cpu_to_le32(0x40000033)</div><div class='del'>-#define STATUS_BIZRULES_NOT_ENABLED cpu_to_le32(0x40000034)</div><div class='del'>-#define STATUS_WAKE_SYSTEM cpu_to_le32(0x40000294)</div><div class='del'>-#define STATUS_DS_SHUTTING_DOWN cpu_to_le32(0x40000370)</div><div class='del'>-#define DBG_REPLY_LATER cpu_to_le32(0x40010001)</div><div class='del'>-#define DBG_UNABLE_TO_PROVIDE_HANDLE cpu_to_le32(0x40010002)</div><div class='del'>-#define DBG_TERMINATE_THREAD cpu_to_le32(0x40010003)</div><div class='del'>-#define DBG_TERMINATE_PROCESS cpu_to_le32(0x40010004)</div><div class='del'>-#define DBG_CONTROL_C cpu_to_le32(0x40010005)</div><div class='del'>-#define DBG_PRINTEXCEPTION_C cpu_to_le32(0x40010006)</div><div class='del'>-#define DBG_RIPEXCEPTION cpu_to_le32(0x40010007)</div><div class='del'>-#define DBG_CONTROL_BREAK cpu_to_le32(0x40010008)</div><div class='del'>-#define DBG_COMMAND_EXCEPTION cpu_to_le32(0x40010009)</div><div class='del'>-#define RPC_NT_UUID_LOCAL_ONLY cpu_to_le32(0x40020056)</div><div class='del'>-#define RPC_NT_SEND_INCOMPLETE cpu_to_le32(0x400200AF)</div><div class='del'>-#define STATUS_CTX_CDM_CONNECT cpu_to_le32(0x400A0004)</div><div class='del'>-#define STATUS_CTX_CDM_DISCONNECT cpu_to_le32(0x400A0005)</div><div class='del'>-#define STATUS_SXS_RELEASE_ACTIVATION_CONTEXT cpu_to_le32(0x4015000D)</div><div class='del'>-#define STATUS_RECOVERY_NOT_NEEDED cpu_to_le32(0x40190034)</div><div class='del'>-#define STATUS_RM_ALREADY_STARTED cpu_to_le32(0x40190035)</div><div class='del'>-#define STATUS_LOG_NO_RESTART cpu_to_le32(0x401A000C)</div><div class='del'>-#define STATUS_VIDEO_DRIVER_DEBUG_REPORT_REQUEST cpu_to_le32(0x401B00EC)</div><div class='del'>-#define STATUS_GRAPHICS_PARTIAL_DATA_POPULATED cpu_to_le32(0x401E000A)</div><div class='del'>-#define STATUS_GRAPHICS_DRIVER_MISMATCH cpu_to_le32(0x401E0117)</div><div class='del'>-#define STATUS_GRAPHICS_MODE_NOT_PINNED cpu_to_le32(0x401E0307)</div><div class='del'>-#define STATUS_GRAPHICS_NO_PREFERRED_MODE cpu_to_le32(0x401E031E)</div><div class='del'>-#define STATUS_GRAPHICS_DATASET_IS_EMPTY cpu_to_le32(0x401E034B)</div><div class='del'>-#define STATUS_GRAPHICS_NO_MORE_ELEMENTS_IN_DATASET cpu_to_le32(0x401E034C)</div><div class='del'>-#define STATUS_GRAPHICS_PATH_CONTENT_GEOMETRY_TRANSFORMATION_NOT_PINNED	\</div><div class='del'>-	cpu_to_le32(0x401E0351)</div><div class='del'>-#define STATUS_GRAPHICS_UNKNOWN_CHILD_STATUS cpu_to_le32(0x401E042F)</div><div class='del'>-#define STATUS_GRAPHICS_LEADLINK_START_DEFERRED cpu_to_le32(0x401E0437)</div><div class='del'>-#define STATUS_GRAPHICS_POLLING_TOO_FREQUENTLY cpu_to_le32(0x401E0439)</div><div class='del'>-#define STATUS_GRAPHICS_START_DEFERRED cpu_to_le32(0x401E043A)</div><div class='del'>-#define STATUS_NDIS_INDICATION_REQUIRED cpu_to_le32(0x40230001)</div><div class='del'>-#define STATUS_GUARD_PAGE_VIOLATION cpu_to_le32(0x80000001)</div><div class='del'>-#define STATUS_DATATYPE_MISALIGNMENT cpu_to_le32(0x80000002)</div><div class='del'>-#define STATUS_BREAKPOINT cpu_to_le32(0x80000003)</div><div class='del'>-#define STATUS_SINGLE_STEP cpu_to_le32(0x80000004)</div><div class='del'>-#define STATUS_BUFFER_OVERFLOW cpu_to_le32(0x80000005)</div><div class='del'>-#define STATUS_NO_MORE_FILES cpu_to_le32(0x80000006)</div><div class='del'>-#define STATUS_WAKE_SYSTEM_DEBUGGER cpu_to_le32(0x80000007)</div><div class='del'>-#define STATUS_HANDLES_CLOSED cpu_to_le32(0x8000000A)</div><div class='del'>-#define STATUS_NO_INHERITANCE cpu_to_le32(0x8000000B)</div><div class='del'>-#define STATUS_GUID_SUBSTITUTION_MADE cpu_to_le32(0x8000000C)</div><div class='del'>-#define STATUS_PARTIAL_COPY cpu_to_le32(0x8000000D)</div><div class='del'>-#define STATUS_DEVICE_PAPER_EMPTY cpu_to_le32(0x8000000E)</div><div class='del'>-#define STATUS_DEVICE_POWERED_OFF cpu_to_le32(0x8000000F)</div><div class='del'>-#define STATUS_DEVICE_OFF_LINE cpu_to_le32(0x80000010)</div><div class='del'>-#define STATUS_DEVICE_BUSY cpu_to_le32(0x80000011)</div><div class='del'>-#define STATUS_NO_MORE_EAS cpu_to_le32(0x80000012)</div><div class='del'>-#define STATUS_INVALID_EA_NAME cpu_to_le32(0x80000013)</div><div class='del'>-#define STATUS_EA_LIST_INCONSISTENT cpu_to_le32(0x80000014)</div><div class='del'>-#define STATUS_INVALID_EA_FLAG cpu_to_le32(0x80000015)</div><div class='del'>-#define STATUS_VERIFY_REQUIRED cpu_to_le32(0x80000016)</div><div class='del'>-#define STATUS_EXTRANEOUS_INFORMATION cpu_to_le32(0x80000017)</div><div class='del'>-#define STATUS_RXACT_COMMIT_NECESSARY cpu_to_le32(0x80000018)</div><div class='del'>-#define STATUS_NO_MORE_ENTRIES cpu_to_le32(0x8000001A)</div><div class='del'>-#define STATUS_FILEMARK_DETECTED cpu_to_le32(0x8000001B)</div><div class='del'>-#define STATUS_MEDIA_CHANGED cpu_to_le32(0x8000001C)</div><div class='del'>-#define STATUS_BUS_RESET cpu_to_le32(0x8000001D)</div><div class='del'>-#define STATUS_END_OF_MEDIA cpu_to_le32(0x8000001E)</div><div class='del'>-#define STATUS_BEGINNING_OF_MEDIA cpu_to_le32(0x8000001F)</div><div class='del'>-#define STATUS_MEDIA_CHECK cpu_to_le32(0x80000020)</div><div class='del'>-#define STATUS_SETMARK_DETECTED cpu_to_le32(0x80000021)</div><div class='del'>-#define STATUS_NO_DATA_DETECTED cpu_to_le32(0x80000022)</div><div class='del'>-#define STATUS_REDIRECTOR_HAS_OPEN_HANDLES cpu_to_le32(0x80000023)</div><div class='del'>-#define STATUS_SERVER_HAS_OPEN_HANDLES cpu_to_le32(0x80000024)</div><div class='del'>-#define STATUS_ALREADY_DISCONNECTED cpu_to_le32(0x80000025)</div><div class='del'>-#define STATUS_LONGJUMP cpu_to_le32(0x80000026)</div><div class='del'>-#define STATUS_CLEANER_CARTRIDGE_INSTALLED cpu_to_le32(0x80000027)</div><div class='del'>-#define STATUS_PLUGPLAY_QUERY_VETOED cpu_to_le32(0x80000028)</div><div class='del'>-#define STATUS_UNWIND_CONSOLIDATE cpu_to_le32(0x80000029)</div><div class='del'>-#define STATUS_REGISTRY_HIVE_RECOVERED cpu_to_le32(0x8000002A)</div><div class='del'>-#define STATUS_DLL_MIGHT_BE_INSECURE cpu_to_le32(0x8000002B)</div><div class='del'>-#define STATUS_DLL_MIGHT_BE_INCOMPATIBLE cpu_to_le32(0x8000002C)</div><div class='del'>-#define STATUS_STOPPED_ON_SYMLINK cpu_to_le32(0x8000002D)</div><div class='del'>-#define STATUS_DEVICE_REQUIRES_CLEANING cpu_to_le32(0x80000288)</div><div class='del'>-#define STATUS_DEVICE_DOOR_OPEN cpu_to_le32(0x80000289)</div><div class='del'>-#define STATUS_DATA_LOST_REPAIR cpu_to_le32(0x80000803)</div><div class='del'>-#define DBG_EXCEPTION_NOT_HANDLED cpu_to_le32(0x80010001)</div><div class='del'>-#define STATUS_CLUSTER_NODE_ALREADY_UP cpu_to_le32(0x80130001)</div><div class='del'>-#define STATUS_CLUSTER_NODE_ALREADY_DOWN cpu_to_le32(0x80130002)</div><div class='del'>-#define STATUS_CLUSTER_NETWORK_ALREADY_ONLINE cpu_to_le32(0x80130003)</div><div class='del'>-#define STATUS_CLUSTER_NETWORK_ALREADY_OFFLINE cpu_to_le32(0x80130004)</div><div class='del'>-#define STATUS_CLUSTER_NODE_ALREADY_MEMBER cpu_to_le32(0x80130005)</div><div class='del'>-#define STATUS_COULD_NOT_RESIZE_LOG cpu_to_le32(0x80190009)</div><div class='del'>-#define STATUS_NO_TXF_METADATA cpu_to_le32(0x80190029)</div><div class='del'>-#define STATUS_CANT_RECOVER_WITH_HANDLE_OPEN cpu_to_le32(0x80190031)</div><div class='del'>-#define STATUS_TXF_METADATA_ALREADY_PRESENT cpu_to_le32(0x80190041)</div><div class='del'>-#define STATUS_TRANSACTION_SCOPE_CALLBACKS_NOT_SET cpu_to_le32(0x80190042)</div><div class='del'>-#define STATUS_VIDEO_HUNG_DISPLAY_DRIVER_THREAD_RECOVERED	\</div><div class='del'>-	cpu_to_le32(0x801B00EB)</div><div class='del'>-#define STATUS_FLT_BUFFER_TOO_SMALL cpu_to_le32(0x801C0001)</div><div class='del'>-#define STATUS_FVE_PARTIAL_METADATA cpu_to_le32(0x80210001)</div><div class='del'>-#define STATUS_UNSUCCESSFUL cpu_to_le32(0xC0000001)</div><div class='del'>-#define STATUS_NOT_IMPLEMENTED cpu_to_le32(0xC0000002)</div><div class='del'>-#define STATUS_INVALID_INFO_CLASS cpu_to_le32(0xC0000003)</div><div class='del'>-#define STATUS_INFO_LENGTH_MISMATCH cpu_to_le32(0xC0000004)</div><div class='del'>-#define STATUS_ACCESS_VIOLATION cpu_to_le32(0xC0000005)</div><div class='del'>-#define STATUS_IN_PAGE_ERROR cpu_to_le32(0xC0000006)</div><div class='del'>-#define STATUS_PAGEFILE_QUOTA cpu_to_le32(0xC0000007)</div><div class='del'>-#define STATUS_INVALID_HANDLE cpu_to_le32(0xC0000008)</div><div class='del'>-#define STATUS_BAD_INITIAL_STACK cpu_to_le32(0xC0000009)</div><div class='del'>-#define STATUS_BAD_INITIAL_PC cpu_to_le32(0xC000000A)</div><div class='del'>-#define STATUS_INVALID_CID cpu_to_le32(0xC000000B)</div><div class='del'>-#define STATUS_TIMER_NOT_CANCELED cpu_to_le32(0xC000000C)</div><div class='del'>-#define STATUS_INVALID_PARAMETER cpu_to_le32(0xC000000D)</div><div class='del'>-#define STATUS_NO_SUCH_DEVICE cpu_to_le32(0xC000000E)</div><div class='del'>-#define STATUS_NO_SUCH_FILE cpu_to_le32(0xC000000F)</div><div class='del'>-#define STATUS_INVALID_DEVICE_REQUEST cpu_to_le32(0xC0000010)</div><div class='del'>-#define STATUS_END_OF_FILE cpu_to_le32(0xC0000011)</div><div class='del'>-#define STATUS_WRONG_VOLUME cpu_to_le32(0xC0000012)</div><div class='del'>-#define STATUS_NO_MEDIA_IN_DEVICE cpu_to_le32(0xC0000013)</div><div class='del'>-#define STATUS_UNRECOGNIZED_MEDIA cpu_to_le32(0xC0000014)</div><div class='del'>-#define STATUS_NONEXISTENT_SECTOR cpu_to_le32(0xC0000015)</div><div class='del'>-#define STATUS_MORE_PROCESSING_REQUIRED cpu_to_le32(0xC0000016)</div><div class='del'>-#define STATUS_NO_MEMORY cpu_to_le32(0xC0000017)</div><div class='del'>-#define STATUS_CONFLICTING_ADDRESSES cpu_to_le32(0xC0000018)</div><div class='del'>-#define STATUS_NOT_MAPPED_VIEW cpu_to_le32(0xC0000019)</div><div class='del'>-#define STATUS_UNABLE_TO_FREE_VM cpu_to_le32(0xC000001A)</div><div class='del'>-#define STATUS_UNABLE_TO_DELETE_SECTION cpu_to_le32(0xC000001B)</div><div class='del'>-#define STATUS_INVALID_SYSTEM_SERVICE cpu_to_le32(0xC000001C)</div><div class='del'>-#define STATUS_ILLEGAL_INSTRUCTION cpu_to_le32(0xC000001D)</div><div class='del'>-#define STATUS_INVALID_LOCK_SEQUENCE cpu_to_le32(0xC000001E)</div><div class='del'>-#define STATUS_INVALID_VIEW_SIZE cpu_to_le32(0xC000001F)</div><div class='del'>-#define STATUS_INVALID_FILE_FOR_SECTION cpu_to_le32(0xC0000020)</div><div class='del'>-#define STATUS_ALREADY_COMMITTED cpu_to_le32(0xC0000021)</div><div class='del'>-#define STATUS_ACCESS_DENIED cpu_to_le32(0xC0000022)</div><div class='del'>-#define STATUS_BUFFER_TOO_SMALL cpu_to_le32(0xC0000023)</div><div class='del'>-#define STATUS_OBJECT_TYPE_MISMATCH cpu_to_le32(0xC0000024)</div><div class='del'>-#define STATUS_NONCONTINUABLE_EXCEPTION cpu_to_le32(0xC0000025)</div><div class='del'>-#define STATUS_INVALID_DISPOSITION cpu_to_le32(0xC0000026)</div><div class='del'>-#define STATUS_UNWIND cpu_to_le32(0xC0000027)</div><div class='del'>-#define STATUS_BAD_STACK cpu_to_le32(0xC0000028)</div><div class='del'>-#define STATUS_INVALID_UNWIND_TARGET cpu_to_le32(0xC0000029)</div><div class='del'>-#define STATUS_NOT_LOCKED cpu_to_le32(0xC000002A)</div><div class='del'>-#define STATUS_PARITY_ERROR cpu_to_le32(0xC000002B)</div><div class='del'>-#define STATUS_UNABLE_TO_DECOMMIT_VM cpu_to_le32(0xC000002C)</div><div class='del'>-#define STATUS_NOT_COMMITTED cpu_to_le32(0xC000002D)</div><div class='del'>-#define STATUS_INVALID_PORT_ATTRIBUTES cpu_to_le32(0xC000002E)</div><div class='del'>-#define STATUS_PORT_MESSAGE_TOO_LONG cpu_to_le32(0xC000002F)</div><div class='del'>-#define STATUS_INVALID_PARAMETER_MIX cpu_to_le32(0xC0000030)</div><div class='del'>-#define STATUS_INVALID_QUOTA_LOWER cpu_to_le32(0xC0000031)</div><div class='del'>-#define STATUS_DISK_CORRUPT_ERROR cpu_to_le32(0xC0000032)</div><div class='del'>-#define STATUS_OBJECT_NAME_INVALID cpu_to_le32(0xC0000033)</div><div class='del'>-#define STATUS_OBJECT_NAME_NOT_FOUND cpu_to_le32(0xC0000034)</div><div class='del'>-#define STATUS_OBJECT_NAME_COLLISION cpu_to_le32(0xC0000035)</div><div class='del'>-#define STATUS_PORT_DISCONNECTED cpu_to_le32(0xC0000037)</div><div class='del'>-#define STATUS_DEVICE_ALREADY_ATTACHED cpu_to_le32(0xC0000038)</div><div class='del'>-#define STATUS_OBJECT_PATH_INVALID cpu_to_le32(0xC0000039)</div><div class='del'>-#define STATUS_OBJECT_PATH_NOT_FOUND cpu_to_le32(0xC000003A)</div><div class='del'>-#define STATUS_OBJECT_PATH_SYNTAX_BAD cpu_to_le32(0xC000003B)</div><div class='del'>-#define STATUS_DATA_OVERRUN cpu_to_le32(0xC000003C)</div><div class='del'>-#define STATUS_DATA_LATE_ERROR cpu_to_le32(0xC000003D)</div><div class='del'>-#define STATUS_DATA_ERROR cpu_to_le32(0xC000003E)</div><div class='del'>-#define STATUS_CRC_ERROR cpu_to_le32(0xC000003F)</div><div class='del'>-#define STATUS_SECTION_TOO_BIG cpu_to_le32(0xC0000040)</div><div class='del'>-#define STATUS_PORT_CONNECTION_REFUSED cpu_to_le32(0xC0000041)</div><div class='del'>-#define STATUS_INVALID_PORT_HANDLE cpu_to_le32(0xC0000042)</div><div class='del'>-#define STATUS_SHARING_VIOLATION cpu_to_le32(0xC0000043)</div><div class='del'>-#define STATUS_QUOTA_EXCEEDED cpu_to_le32(0xC0000044)</div><div class='del'>-#define STATUS_INVALID_PAGE_PROTECTION cpu_to_le32(0xC0000045)</div><div class='del'>-#define STATUS_MUTANT_NOT_OWNED cpu_to_le32(0xC0000046)</div><div class='del'>-#define STATUS_SEMAPHORE_LIMIT_EXCEEDED cpu_to_le32(0xC0000047)</div><div class='del'>-#define STATUS_PORT_ALREADY_SET cpu_to_le32(0xC0000048)</div><div class='del'>-#define STATUS_SECTION_NOT_IMAGE cpu_to_le32(0xC0000049)</div><div class='del'>-#define STATUS_SUSPEND_COUNT_EXCEEDED cpu_to_le32(0xC000004A)</div><div class='del'>-#define STATUS_THREAD_IS_TERMINATING cpu_to_le32(0xC000004B)</div><div class='del'>-#define STATUS_BAD_WORKING_SET_LIMIT cpu_to_le32(0xC000004C)</div><div class='del'>-#define STATUS_INCOMPATIBLE_FILE_MAP cpu_to_le32(0xC000004D)</div><div class='del'>-#define STATUS_SECTION_PROTECTION cpu_to_le32(0xC000004E)</div><div class='del'>-#define STATUS_EAS_NOT_SUPPORTED cpu_to_le32(0xC000004F)</div><div class='del'>-#define STATUS_EA_TOO_LARGE cpu_to_le32(0xC0000050)</div><div class='del'>-#define STATUS_NONEXISTENT_EA_ENTRY cpu_to_le32(0xC0000051)</div><div class='del'>-#define STATUS_NO_EAS_ON_FILE cpu_to_le32(0xC0000052)</div><div class='del'>-#define STATUS_EA_CORRUPT_ERROR cpu_to_le32(0xC0000053)</div><div class='del'>-#define STATUS_FILE_LOCK_CONFLICT cpu_to_le32(0xC0000054)</div><div class='del'>-#define STATUS_LOCK_NOT_GRANTED cpu_to_le32(0xC0000055)</div><div class='del'>-#define STATUS_DELETE_PENDING cpu_to_le32(0xC0000056)</div><div class='del'>-#define STATUS_CTL_FILE_NOT_SUPPORTED cpu_to_le32(0xC0000057)</div><div class='del'>-#define STATUS_UNKNOWN_REVISION cpu_to_le32(0xC0000058)</div><div class='del'>-#define STATUS_REVISION_MISMATCH cpu_to_le32(0xC0000059)</div><div class='del'>-#define STATUS_INVALID_OWNER cpu_to_le32(0xC000005A)</div><div class='del'>-#define STATUS_INVALID_PRIMARY_GROUP cpu_to_le32(0xC000005B)</div><div class='del'>-#define STATUS_NO_IMPERSONATION_TOKEN cpu_to_le32(0xC000005C)</div><div class='del'>-#define STATUS_CANT_DISABLE_MANDATORY cpu_to_le32(0xC000005D)</div><div class='del'>-#define STATUS_NO_LOGON_SERVERS cpu_to_le32(0xC000005E)</div><div class='del'>-#define STATUS_NO_SUCH_LOGON_SESSION cpu_to_le32(0xC000005F)</div><div class='del'>-#define STATUS_NO_SUCH_PRIVILEGE cpu_to_le32(0xC0000060)</div><div class='del'>-#define STATUS_PRIVILEGE_NOT_HELD cpu_to_le32(0xC0000061)</div><div class='del'>-#define STATUS_INVALID_ACCOUNT_NAME cpu_to_le32(0xC0000062)</div><div class='del'>-#define STATUS_USER_EXISTS cpu_to_le32(0xC0000063)</div><div class='del'>-#define STATUS_NO_SUCH_USER cpu_to_le32(0xC0000064)</div><div class='del'>-#define STATUS_GROUP_EXISTS cpu_to_le32(0xC0000065)</div><div class='del'>-#define STATUS_NO_SUCH_GROUP cpu_to_le32(0xC0000066)</div><div class='del'>-#define STATUS_MEMBER_IN_GROUP cpu_to_le32(0xC0000067)</div><div class='del'>-#define STATUS_MEMBER_NOT_IN_GROUP cpu_to_le32(0xC0000068)</div><div class='del'>-#define STATUS_LAST_ADMIN cpu_to_le32(0xC0000069)</div><div class='del'>-#define STATUS_WRONG_PASSWORD cpu_to_le32(0xC000006A)</div><div class='del'>-#define STATUS_ILL_FORMED_PASSWORD cpu_to_le32(0xC000006B)</div><div class='del'>-#define STATUS_PASSWORD_RESTRICTION cpu_to_le32(0xC000006C)</div><div class='del'>-#define STATUS_LOGON_FAILURE cpu_to_le32(0xC000006D)</div><div class='del'>-#define STATUS_ACCOUNT_RESTRICTION cpu_to_le32(0xC000006E)</div><div class='del'>-#define STATUS_INVALID_LOGON_HOURS cpu_to_le32(0xC000006F)</div><div class='del'>-#define STATUS_INVALID_WORKSTATION cpu_to_le32(0xC0000070)</div><div class='del'>-#define STATUS_PASSWORD_EXPIRED cpu_to_le32(0xC0000071)</div><div class='del'>-#define STATUS_ACCOUNT_DISABLED cpu_to_le32(0xC0000072)</div><div class='del'>-#define STATUS_NONE_MAPPED cpu_to_le32(0xC0000073)</div><div class='del'>-#define STATUS_TOO_MANY_LUIDS_REQUESTED cpu_to_le32(0xC0000074)</div><div class='del'>-#define STATUS_LUIDS_EXHAUSTED cpu_to_le32(0xC0000075)</div><div class='del'>-#define STATUS_INVALID_SUB_AUTHORITY cpu_to_le32(0xC0000076)</div><div class='del'>-#define STATUS_INVALID_ACL cpu_to_le32(0xC0000077)</div><div class='del'>-#define STATUS_INVALID_SID cpu_to_le32(0xC0000078)</div><div class='del'>-#define STATUS_INVALID_SECURITY_DESCR cpu_to_le32(0xC0000079)</div><div class='del'>-#define STATUS_PROCEDURE_NOT_FOUND cpu_to_le32(0xC000007A)</div><div class='del'>-#define STATUS_INVALID_IMAGE_FORMAT cpu_to_le32(0xC000007B)</div><div class='del'>-#define STATUS_NO_TOKEN cpu_to_le32(0xC000007C)</div><div class='del'>-#define STATUS_BAD_INHERITANCE_ACL cpu_to_le32(0xC000007D)</div><div class='del'>-#define STATUS_RANGE_NOT_LOCKED cpu_to_le32(0xC000007E)</div><div class='del'>-#define STATUS_DISK_FULL cpu_to_le32(0xC000007F)</div><div class='del'>-#define STATUS_SERVER_DISABLED cpu_to_le32(0xC0000080)</div><div class='del'>-#define STATUS_SERVER_NOT_DISABLED cpu_to_le32(0xC0000081)</div><div class='del'>-#define STATUS_TOO_MANY_GUIDS_REQUESTED cpu_to_le32(0xC0000082)</div><div class='del'>-#define STATUS_GUIDS_EXHAUSTED cpu_to_le32(0xC0000083)</div><div class='del'>-#define STATUS_INVALID_ID_AUTHORITY cpu_to_le32(0xC0000084)</div><div class='del'>-#define STATUS_AGENTS_EXHAUSTED cpu_to_le32(0xC0000085)</div><div class='del'>-#define STATUS_INVALID_VOLUME_LABEL cpu_to_le32(0xC0000086)</div><div class='del'>-#define STATUS_SECTION_NOT_EXTENDED cpu_to_le32(0xC0000087)</div><div class='del'>-#define STATUS_NOT_MAPPED_DATA cpu_to_le32(0xC0000088)</div><div class='del'>-#define STATUS_RESOURCE_DATA_NOT_FOUND cpu_to_le32(0xC0000089)</div><div class='del'>-#define STATUS_RESOURCE_TYPE_NOT_FOUND cpu_to_le32(0xC000008A)</div><div class='del'>-#define STATUS_RESOURCE_NAME_NOT_FOUND cpu_to_le32(0xC000008B)</div><div class='del'>-#define STATUS_ARRAY_BOUNDS_EXCEEDED cpu_to_le32(0xC000008C)</div><div class='del'>-#define STATUS_FLOAT_DENORMAL_OPERAND cpu_to_le32(0xC000008D)</div><div class='del'>-#define STATUS_FLOAT_DIVIDE_BY_ZERO cpu_to_le32(0xC000008E)</div><div class='del'>-#define STATUS_FLOAT_INEXACT_RESULT cpu_to_le32(0xC000008F)</div><div class='del'>-#define STATUS_FLOAT_INVALID_OPERATION cpu_to_le32(0xC0000090)</div><div class='del'>-#define STATUS_FLOAT_OVERFLOW cpu_to_le32(0xC0000091)</div><div class='del'>-#define STATUS_FLOAT_STACK_CHECK cpu_to_le32(0xC0000092)</div><div class='del'>-#define STATUS_FLOAT_UNDERFLOW cpu_to_le32(0xC0000093)</div><div class='del'>-#define STATUS_INTEGER_DIVIDE_BY_ZERO cpu_to_le32(0xC0000094)</div><div class='del'>-#define STATUS_INTEGER_OVERFLOW cpu_to_le32(0xC0000095)</div><div class='del'>-#define STATUS_PRIVILEGED_INSTRUCTION cpu_to_le32(0xC0000096)</div><div class='del'>-#define STATUS_TOO_MANY_PAGING_FILES cpu_to_le32(0xC0000097)</div><div class='del'>-#define STATUS_FILE_INVALID cpu_to_le32(0xC0000098)</div><div class='del'>-#define STATUS_ALLOTTED_SPACE_EXCEEDED cpu_to_le32(0xC0000099)</div><div class='del'>-#define STATUS_INSUFFICIENT_RESOURCES cpu_to_le32(0xC000009A)</div><div class='del'>-#define STATUS_DFS_EXIT_PATH_FOUND cpu_to_le32(0xC000009B)</div><div class='del'>-#define STATUS_DEVICE_DATA_ERROR cpu_to_le32(0xC000009C)</div><div class='del'>-#define STATUS_DEVICE_NOT_CONNECTED cpu_to_le32(0xC000009D)</div><div class='del'>-#define STATUS_DEVICE_POWER_FAILURE cpu_to_le32(0xC000009E)</div><div class='del'>-#define STATUS_FREE_VM_NOT_AT_BASE cpu_to_le32(0xC000009F)</div><div class='del'>-#define STATUS_MEMORY_NOT_ALLOCATED cpu_to_le32(0xC00000A0)</div><div class='del'>-#define STATUS_WORKING_SET_QUOTA cpu_to_le32(0xC00000A1)</div><div class='del'>-#define STATUS_MEDIA_WRITE_PROTECTED cpu_to_le32(0xC00000A2)</div><div class='del'>-#define STATUS_DEVICE_NOT_READY cpu_to_le32(0xC00000A3)</div><div class='del'>-#define STATUS_INVALID_GROUP_ATTRIBUTES cpu_to_le32(0xC00000A4)</div><div class='del'>-#define STATUS_BAD_IMPERSONATION_LEVEL cpu_to_le32(0xC00000A5)</div><div class='del'>-#define STATUS_CANT_OPEN_ANONYMOUS cpu_to_le32(0xC00000A6)</div><div class='del'>-#define STATUS_BAD_VALIDATION_CLASS cpu_to_le32(0xC00000A7)</div><div class='del'>-#define STATUS_BAD_TOKEN_TYPE cpu_to_le32(0xC00000A8)</div><div class='del'>-#define STATUS_BAD_MASTER_BOOT_RECORD cpu_to_le32(0xC00000A9)</div><div class='del'>-#define STATUS_INSTRUCTION_MISALIGNMENT cpu_to_le32(0xC00000AA)</div><div class='del'>-#define STATUS_INSTANCE_NOT_AVAILABLE cpu_to_le32(0xC00000AB)</div><div class='del'>-#define STATUS_PIPE_NOT_AVAILABLE cpu_to_le32(0xC00000AC)</div><div class='del'>-#define STATUS_INVALID_PIPE_STATE cpu_to_le32(0xC00000AD)</div><div class='del'>-#define STATUS_PIPE_BUSY cpu_to_le32(0xC00000AE)</div><div class='del'>-#define STATUS_ILLEGAL_FUNCTION cpu_to_le32(0xC00000AF)</div><div class='del'>-#define STATUS_PIPE_DISCONNECTED cpu_to_le32(0xC00000B0)</div><div class='del'>-#define STATUS_PIPE_CLOSING cpu_to_le32(0xC00000B1)</div><div class='del'>-#define STATUS_PIPE_CONNECTED cpu_to_le32(0xC00000B2)</div><div class='del'>-#define STATUS_PIPE_LISTENING cpu_to_le32(0xC00000B3)</div><div class='del'>-#define STATUS_INVALID_READ_MODE cpu_to_le32(0xC00000B4)</div><div class='del'>-#define STATUS_IO_TIMEOUT cpu_to_le32(0xC00000B5)</div><div class='del'>-#define STATUS_FILE_FORCED_CLOSED cpu_to_le32(0xC00000B6)</div><div class='del'>-#define STATUS_PROFILING_NOT_STARTED cpu_to_le32(0xC00000B7)</div><div class='del'>-#define STATUS_PROFILING_NOT_STOPPED cpu_to_le32(0xC00000B8)</div><div class='del'>-#define STATUS_COULD_NOT_INTERPRET cpu_to_le32(0xC00000B9)</div><div class='del'>-#define STATUS_FILE_IS_A_DIRECTORY cpu_to_le32(0xC00000BA)</div><div class='del'>-#define STATUS_NOT_SUPPORTED cpu_to_le32(0xC00000BB)</div><div class='del'>-#define STATUS_REMOTE_NOT_LISTENING cpu_to_le32(0xC00000BC)</div><div class='del'>-#define STATUS_DUPLICATE_NAME cpu_to_le32(0xC00000BD)</div><div class='del'>-#define STATUS_BAD_NETWORK_PATH cpu_to_le32(0xC00000BE)</div><div class='del'>-#define STATUS_NETWORK_BUSY cpu_to_le32(0xC00000BF)</div><div class='del'>-#define STATUS_DEVICE_DOES_NOT_EXIST cpu_to_le32(0xC00000C0)</div><div class='del'>-#define STATUS_TOO_MANY_COMMANDS cpu_to_le32(0xC00000C1)</div><div class='del'>-#define STATUS_ADAPTER_HARDWARE_ERROR cpu_to_le32(0xC00000C2)</div><div class='del'>-#define STATUS_INVALID_NETWORK_RESPONSE cpu_to_le32(0xC00000C3)</div><div class='del'>-#define STATUS_UNEXPECTED_NETWORK_ERROR cpu_to_le32(0xC00000C4)</div><div class='del'>-#define STATUS_BAD_REMOTE_ADAPTER cpu_to_le32(0xC00000C5)</div><div class='del'>-#define STATUS_PRINT_QUEUE_FULL cpu_to_le32(0xC00000C6)</div><div class='del'>-#define STATUS_NO_SPOOL_SPACE cpu_to_le32(0xC00000C7)</div><div class='del'>-#define STATUS_PRINT_CANCELLED cpu_to_le32(0xC00000C8)</div><div class='del'>-#define STATUS_NETWORK_NAME_DELETED cpu_to_le32(0xC00000C9)</div><div class='del'>-#define STATUS_NETWORK_ACCESS_DENIED cpu_to_le32(0xC00000CA)</div><div class='del'>-#define STATUS_BAD_DEVICE_TYPE cpu_to_le32(0xC00000CB)</div><div class='del'>-#define STATUS_BAD_NETWORK_NAME cpu_to_le32(0xC00000CC)</div><div class='del'>-#define STATUS_TOO_MANY_NAMES cpu_to_le32(0xC00000CD)</div><div class='del'>-#define STATUS_TOO_MANY_SESSIONS cpu_to_le32(0xC00000CE)</div><div class='del'>-#define STATUS_SHARING_PAUSED cpu_to_le32(0xC00000CF)</div><div class='del'>-#define STATUS_REQUEST_NOT_ACCEPTED cpu_to_le32(0xC00000D0)</div><div class='del'>-#define STATUS_REDIRECTOR_PAUSED cpu_to_le32(0xC00000D1)</div><div class='del'>-#define STATUS_NET_WRITE_FAULT cpu_to_le32(0xC00000D2)</div><div class='del'>-#define STATUS_PROFILING_AT_LIMIT cpu_to_le32(0xC00000D3)</div><div class='del'>-#define STATUS_NOT_SAME_DEVICE cpu_to_le32(0xC00000D4)</div><div class='del'>-#define STATUS_FILE_RENAMED cpu_to_le32(0xC00000D5)</div><div class='del'>-#define STATUS_VIRTUAL_CIRCUIT_CLOSED cpu_to_le32(0xC00000D6)</div><div class='del'>-#define STATUS_NO_SECURITY_ON_OBJECT cpu_to_le32(0xC00000D7)</div><div class='del'>-#define STATUS_CANT_WAIT cpu_to_le32(0xC00000D8)</div><div class='del'>-#define STATUS_PIPE_EMPTY cpu_to_le32(0xC00000D9)</div><div class='del'>-#define STATUS_CANT_ACCESS_DOMAIN_INFO cpu_to_le32(0xC00000DA)</div><div class='del'>-#define STATUS_CANT_TERMINATE_SELF cpu_to_le32(0xC00000DB)</div><div class='del'>-#define STATUS_INVALID_SERVER_STATE cpu_to_le32(0xC00000DC)</div><div class='del'>-#define STATUS_INVALID_DOMAIN_STATE cpu_to_le32(0xC00000DD)</div><div class='del'>-#define STATUS_INVALID_DOMAIN_ROLE cpu_to_le32(0xC00000DE)</div><div class='del'>-#define STATUS_NO_SUCH_DOMAIN cpu_to_le32(0xC00000DF)</div><div class='del'>-#define STATUS_DOMAIN_EXISTS cpu_to_le32(0xC00000E0)</div><div class='del'>-#define STATUS_DOMAIN_LIMIT_EXCEEDED cpu_to_le32(0xC00000E1)</div><div class='del'>-#define STATUS_OPLOCK_NOT_GRANTED cpu_to_le32(0xC00000E2)</div><div class='del'>-#define STATUS_INVALID_OPLOCK_PROTOCOL cpu_to_le32(0xC00000E3)</div><div class='del'>-#define STATUS_INTERNAL_DB_CORRUPTION cpu_to_le32(0xC00000E4)</div><div class='del'>-#define STATUS_INTERNAL_ERROR cpu_to_le32(0xC00000E5)</div><div class='del'>-#define STATUS_GENERIC_NOT_MAPPED cpu_to_le32(0xC00000E6)</div><div class='del'>-#define STATUS_BAD_DESCRIPTOR_FORMAT cpu_to_le32(0xC00000E7)</div><div class='del'>-#define STATUS_INVALID_USER_BUFFER cpu_to_le32(0xC00000E8)</div><div class='del'>-#define STATUS_UNEXPECTED_IO_ERROR cpu_to_le32(0xC00000E9)</div><div class='del'>-#define STATUS_UNEXPECTED_MM_CREATE_ERR cpu_to_le32(0xC00000EA)</div><div class='del'>-#define STATUS_UNEXPECTED_MM_MAP_ERROR cpu_to_le32(0xC00000EB)</div><div class='del'>-#define STATUS_UNEXPECTED_MM_EXTEND_ERR cpu_to_le32(0xC00000EC)</div><div class='del'>-#define STATUS_NOT_LOGON_PROCESS cpu_to_le32(0xC00000ED)</div><div class='del'>-#define STATUS_LOGON_SESSION_EXISTS cpu_to_le32(0xC00000EE)</div><div class='del'>-#define STATUS_INVALID_PARAMETER_1 cpu_to_le32(0xC00000EF)</div><div class='del'>-#define STATUS_INVALID_PARAMETER_2 cpu_to_le32(0xC00000F0)</div><div class='del'>-#define STATUS_INVALID_PARAMETER_3 cpu_to_le32(0xC00000F1)</div><div class='del'>-#define STATUS_INVALID_PARAMETER_4 cpu_to_le32(0xC00000F2)</div><div class='del'>-#define STATUS_INVALID_PARAMETER_5 cpu_to_le32(0xC00000F3)</div><div class='del'>-#define STATUS_INVALID_PARAMETER_6 cpu_to_le32(0xC00000F4)</div><div class='del'>-#define STATUS_INVALID_PARAMETER_7 cpu_to_le32(0xC00000F5)</div><div class='del'>-#define STATUS_INVALID_PARAMETER_8 cpu_to_le32(0xC00000F6)</div><div class='del'>-#define STATUS_INVALID_PARAMETER_9 cpu_to_le32(0xC00000F7)</div><div class='del'>-#define STATUS_INVALID_PARAMETER_10 cpu_to_le32(0xC00000F8)</div><div class='del'>-#define STATUS_INVALID_PARAMETER_11 cpu_to_le32(0xC00000F9)</div><div class='del'>-#define STATUS_INVALID_PARAMETER_12 cpu_to_le32(0xC00000FA)</div><div class='del'>-#define STATUS_REDIRECTOR_NOT_STARTED cpu_to_le32(0xC00000FB)</div><div class='del'>-#define STATUS_REDIRECTOR_STARTED cpu_to_le32(0xC00000FC)</div><div class='del'>-#define STATUS_STACK_OVERFLOW cpu_to_le32(0xC00000FD)</div><div class='del'>-#define STATUS_NO_SUCH_PACKAGE cpu_to_le32(0xC00000FE)</div><div class='del'>-#define STATUS_BAD_FUNCTION_TABLE cpu_to_le32(0xC00000FF)</div><div class='del'>-#define STATUS_VARIABLE_NOT_FOUND cpu_to_le32(0xC0000100)</div><div class='del'>-#define STATUS_DIRECTORY_NOT_EMPTY cpu_to_le32(0xC0000101)</div><div class='del'>-#define STATUS_FILE_CORRUPT_ERROR cpu_to_le32(0xC0000102)</div><div class='del'>-#define STATUS_NOT_A_DIRECTORY cpu_to_le32(0xC0000103)</div><div class='del'>-#define STATUS_BAD_LOGON_SESSION_STATE cpu_to_le32(0xC0000104)</div><div class='del'>-#define STATUS_LOGON_SESSION_COLLISION cpu_to_le32(0xC0000105)</div><div class='del'>-#define STATUS_NAME_TOO_LONG cpu_to_le32(0xC0000106)</div><div class='del'>-#define STATUS_FILES_OPEN cpu_to_le32(0xC0000107)</div><div class='del'>-#define STATUS_CONNECTION_IN_USE cpu_to_le32(0xC0000108)</div><div class='del'>-#define STATUS_MESSAGE_NOT_FOUND cpu_to_le32(0xC0000109)</div><div class='del'>-#define STATUS_PROCESS_IS_TERMINATING cpu_to_le32(0xC000010A)</div><div class='del'>-#define STATUS_INVALID_LOGON_TYPE cpu_to_le32(0xC000010B)</div><div class='del'>-#define STATUS_NO_GUID_TRANSLATION cpu_to_le32(0xC000010C)</div><div class='del'>-#define STATUS_CANNOT_IMPERSONATE cpu_to_le32(0xC000010D)</div><div class='del'>-#define STATUS_IMAGE_ALREADY_LOADED cpu_to_le32(0xC000010E)</div><div class='del'>-#define STATUS_ABIOS_NOT_PRESENT cpu_to_le32(0xC000010F)</div><div class='del'>-#define STATUS_ABIOS_LID_NOT_EXIST cpu_to_le32(0xC0000110)</div><div class='del'>-#define STATUS_ABIOS_LID_ALREADY_OWNED cpu_to_le32(0xC0000111)</div><div class='del'>-#define STATUS_ABIOS_NOT_LID_OWNER cpu_to_le32(0xC0000112)</div><div class='del'>-#define STATUS_ABIOS_INVALID_COMMAND cpu_to_le32(0xC0000113)</div><div class='del'>-#define STATUS_ABIOS_INVALID_LID cpu_to_le32(0xC0000114)</div><div class='del'>-#define STATUS_ABIOS_SELECTOR_NOT_AVAILABLE cpu_to_le32(0xC0000115)</div><div class='del'>-#define STATUS_ABIOS_INVALID_SELECTOR cpu_to_le32(0xC0000116)</div><div class='del'>-#define STATUS_NO_LDT cpu_to_le32(0xC0000117)</div><div class='del'>-#define STATUS_INVALID_LDT_SIZE cpu_to_le32(0xC0000118)</div><div class='del'>-#define STATUS_INVALID_LDT_OFFSET cpu_to_le32(0xC0000119)</div><div class='del'>-#define STATUS_INVALID_LDT_DESCRIPTOR cpu_to_le32(0xC000011A)</div><div class='del'>-#define STATUS_INVALID_IMAGE_NE_FORMAT cpu_to_le32(0xC000011B)</div><div class='del'>-#define STATUS_RXACT_INVALID_STATE cpu_to_le32(0xC000011C)</div><div class='del'>-#define STATUS_RXACT_COMMIT_FAILURE cpu_to_le32(0xC000011D)</div><div class='del'>-#define STATUS_MAPPED_FILE_SIZE_ZERO cpu_to_le32(0xC000011E)</div><div class='del'>-#define STATUS_TOO_MANY_OPENED_FILES cpu_to_le32(0xC000011F)</div><div class='del'>-#define STATUS_CANCELLED cpu_to_le32(0xC0000120)</div><div class='del'>-#define STATUS_CANNOT_DELETE cpu_to_le32(0xC0000121)</div><div class='del'>-#define STATUS_INVALID_COMPUTER_NAME cpu_to_le32(0xC0000122)</div><div class='del'>-#define STATUS_FILE_DELETED cpu_to_le32(0xC0000123)</div><div class='del'>-#define STATUS_SPECIAL_ACCOUNT cpu_to_le32(0xC0000124)</div><div class='del'>-#define STATUS_SPECIAL_GROUP cpu_to_le32(0xC0000125)</div><div class='del'>-#define STATUS_SPECIAL_USER cpu_to_le32(0xC0000126)</div><div class='del'>-#define STATUS_MEMBERS_PRIMARY_GROUP cpu_to_le32(0xC0000127)</div><div class='del'>-#define STATUS_FILE_CLOSED cpu_to_le32(0xC0000128)</div><div class='del'>-#define STATUS_TOO_MANY_THREADS cpu_to_le32(0xC0000129)</div><div class='del'>-#define STATUS_THREAD_NOT_IN_PROCESS cpu_to_le32(0xC000012A)</div><div class='del'>-#define STATUS_TOKEN_ALREADY_IN_USE cpu_to_le32(0xC000012B)</div><div class='del'>-#define STATUS_PAGEFILE_QUOTA_EXCEEDED cpu_to_le32(0xC000012C)</div><div class='del'>-#define STATUS_COMMITMENT_LIMIT cpu_to_le32(0xC000012D)</div><div class='del'>-#define STATUS_INVALID_IMAGE_LE_FORMAT cpu_to_le32(0xC000012E)</div><div class='del'>-#define STATUS_INVALID_IMAGE_NOT_MZ cpu_to_le32(0xC000012F)</div><div class='del'>-#define STATUS_INVALID_IMAGE_PROTECT cpu_to_le32(0xC0000130)</div><div class='del'>-#define STATUS_INVALID_IMAGE_WIN_16 cpu_to_le32(0xC0000131)</div><div class='del'>-#define STATUS_LOGON_SERVER_CONFLICT cpu_to_le32(0xC0000132)</div><div class='del'>-#define STATUS_TIME_DIFFERENCE_AT_DC cpu_to_le32(0xC0000133)</div><div class='del'>-#define STATUS_SYNCHRONIZATION_REQUIRED cpu_to_le32(0xC0000134)</div><div class='del'>-#define STATUS_DLL_NOT_FOUND cpu_to_le32(0xC0000135)</div><div class='del'>-#define STATUS_OPEN_FAILED cpu_to_le32(0xC0000136)</div><div class='del'>-#define STATUS_IO_PRIVILEGE_FAILED cpu_to_le32(0xC0000137)</div><div class='del'>-#define STATUS_ORDINAL_NOT_FOUND cpu_to_le32(0xC0000138)</div><div class='del'>-#define STATUS_ENTRYPOINT_NOT_FOUND cpu_to_le32(0xC0000139)</div><div class='del'>-#define STATUS_CONTROL_C_EXIT cpu_to_le32(0xC000013A)</div><div class='del'>-#define STATUS_LOCAL_DISCONNECT cpu_to_le32(0xC000013B)</div><div class='del'>-#define STATUS_REMOTE_DISCONNECT cpu_to_le32(0xC000013C)</div><div class='del'>-#define STATUS_REMOTE_RESOURCES cpu_to_le32(0xC000013D)</div><div class='del'>-#define STATUS_LINK_FAILED cpu_to_le32(0xC000013E)</div><div class='del'>-#define STATUS_LINK_TIMEOUT cpu_to_le32(0xC000013F)</div><div class='del'>-#define STATUS_INVALID_CONNECTION cpu_to_le32(0xC0000140)</div><div class='del'>-#define STATUS_INVALID_ADDRESS cpu_to_le32(0xC0000141)</div><div class='del'>-#define STATUS_DLL_INIT_FAILED cpu_to_le32(0xC0000142)</div><div class='del'>-#define STATUS_MISSING_SYSTEMFILE cpu_to_le32(0xC0000143)</div><div class='del'>-#define STATUS_UNHANDLED_EXCEPTION cpu_to_le32(0xC0000144)</div><div class='del'>-#define STATUS_APP_INIT_FAILURE cpu_to_le32(0xC0000145)</div><div class='del'>-#define STATUS_PAGEFILE_CREATE_FAILED cpu_to_le32(0xC0000146)</div><div class='del'>-#define STATUS_NO_PAGEFILE cpu_to_le32(0xC0000147)</div><div class='del'>-#define STATUS_INVALID_LEVEL cpu_to_le32(0xC0000148)</div><div class='del'>-#define STATUS_WRONG_PASSWORD_CORE cpu_to_le32(0xC0000149)</div><div class='del'>-#define STATUS_ILLEGAL_FLOAT_CONTEXT cpu_to_le32(0xC000014A)</div><div class='del'>-#define STATUS_PIPE_BROKEN cpu_to_le32(0xC000014B)</div><div class='del'>-#define STATUS_REGISTRY_CORRUPT cpu_to_le32(0xC000014C)</div><div class='del'>-#define STATUS_REGISTRY_IO_FAILED cpu_to_le32(0xC000014D)</div><div class='del'>-#define STATUS_NO_EVENT_PAIR cpu_to_le32(0xC000014E)</div><div class='del'>-#define STATUS_UNRECOGNIZED_VOLUME cpu_to_le32(0xC000014F)</div><div class='del'>-#define STATUS_SERIAL_NO_DEVICE_INITED cpu_to_le32(0xC0000150)</div><div class='del'>-#define STATUS_NO_SUCH_ALIAS cpu_to_le32(0xC0000151)</div><div class='del'>-#define STATUS_MEMBER_NOT_IN_ALIAS cpu_to_le32(0xC0000152)</div><div class='del'>-#define STATUS_MEMBER_IN_ALIAS cpu_to_le32(0xC0000153)</div><div class='del'>-#define STATUS_ALIAS_EXISTS cpu_to_le32(0xC0000154)</div><div class='del'>-#define STATUS_LOGON_NOT_GRANTED cpu_to_le32(0xC0000155)</div><div class='del'>-#define STATUS_TOO_MANY_SECRETS cpu_to_le32(0xC0000156)</div><div class='del'>-#define STATUS_SECRET_TOO_LONG cpu_to_le32(0xC0000157)</div><div class='del'>-#define STATUS_INTERNAL_DB_ERROR cpu_to_le32(0xC0000158)</div><div class='del'>-#define STATUS_FULLSCREEN_MODE cpu_to_le32(0xC0000159)</div><div class='del'>-#define STATUS_TOO_MANY_CONTEXT_IDS cpu_to_le32(0xC000015A)</div><div class='del'>-#define STATUS_LOGON_TYPE_NOT_GRANTED cpu_to_le32(0xC000015B)</div><div class='del'>-#define STATUS_NOT_REGISTRY_FILE cpu_to_le32(0xC000015C)</div><div class='del'>-#define STATUS_NT_CROSS_ENCRYPTION_REQUIRED cpu_to_le32(0xC000015D)</div><div class='del'>-#define STATUS_DOMAIN_CTRLR_CONFIG_ERROR cpu_to_le32(0xC000015E)</div><div class='del'>-#define STATUS_FT_MISSING_MEMBER cpu_to_le32(0xC000015F)</div><div class='del'>-#define STATUS_ILL_FORMED_SERVICE_ENTRY cpu_to_le32(0xC0000160)</div><div class='del'>-#define STATUS_ILLEGAL_CHARACTER cpu_to_le32(0xC0000161)</div><div class='del'>-#define STATUS_UNMAPPABLE_CHARACTER cpu_to_le32(0xC0000162)</div><div class='del'>-#define STATUS_UNDEFINED_CHARACTER cpu_to_le32(0xC0000163)</div><div class='del'>-#define STATUS_FLOPPY_VOLUME cpu_to_le32(0xC0000164)</div><div class='del'>-#define STATUS_FLOPPY_ID_MARK_NOT_FOUND cpu_to_le32(0xC0000165)</div><div class='del'>-#define STATUS_FLOPPY_WRONG_CYLINDER cpu_to_le32(0xC0000166)</div><div class='del'>-#define STATUS_FLOPPY_UNKNOWN_ERROR cpu_to_le32(0xC0000167)</div><div class='del'>-#define STATUS_FLOPPY_BAD_REGISTERS cpu_to_le32(0xC0000168)</div><div class='del'>-#define STATUS_DISK_RECALIBRATE_FAILED cpu_to_le32(0xC0000169)</div><div class='del'>-#define STATUS_DISK_OPERATION_FAILED cpu_to_le32(0xC000016A)</div><div class='del'>-#define STATUS_DISK_RESET_FAILED cpu_to_le32(0xC000016B)</div><div class='del'>-#define STATUS_SHARED_IRQ_BUSY cpu_to_le32(0xC000016C)</div><div class='del'>-#define STATUS_FT_ORPHANING cpu_to_le32(0xC000016D)</div><div class='del'>-#define STATUS_BIOS_FAILED_TO_CONNECT_INTERRUPT cpu_to_le32(0xC000016E)</div><div class='del'>-#define STATUS_PARTITION_FAILURE cpu_to_le32(0xC0000172)</div><div class='del'>-#define STATUS_INVALID_BLOCK_LENGTH cpu_to_le32(0xC0000173)</div><div class='del'>-#define STATUS_DEVICE_NOT_PARTITIONED cpu_to_le32(0xC0000174)</div><div class='del'>-#define STATUS_UNABLE_TO_LOCK_MEDIA cpu_to_le32(0xC0000175)</div><div class='del'>-#define STATUS_UNABLE_TO_UNLOAD_MEDIA cpu_to_le32(0xC0000176)</div><div class='del'>-#define STATUS_EOM_OVERFLOW cpu_to_le32(0xC0000177)</div><div class='del'>-#define STATUS_NO_MEDIA cpu_to_le32(0xC0000178)</div><div class='del'>-#define STATUS_NO_SUCH_MEMBER cpu_to_le32(0xC000017A)</div><div class='del'>-#define STATUS_INVALID_MEMBER cpu_to_le32(0xC000017B)</div><div class='del'>-#define STATUS_KEY_DELETED cpu_to_le32(0xC000017C)</div><div class='del'>-#define STATUS_NO_LOG_SPACE cpu_to_le32(0xC000017D)</div><div class='del'>-#define STATUS_TOO_MANY_SIDS cpu_to_le32(0xC000017E)</div><div class='del'>-#define STATUS_LM_CROSS_ENCRYPTION_REQUIRED cpu_to_le32(0xC000017F)</div><div class='del'>-#define STATUS_KEY_HAS_CHILDREN cpu_to_le32(0xC0000180)</div><div class='del'>-#define STATUS_CHILD_MUST_BE_VOLATILE cpu_to_le32(0xC0000181)</div><div class='del'>-#define STATUS_DEVICE_CONFIGURATION_ERROR cpu_to_le32(0xC0000182)</div><div class='del'>-#define STATUS_DRIVER_INTERNAL_ERROR cpu_to_le32(0xC0000183)</div><div class='del'>-#define STATUS_INVALID_DEVICE_STATE cpu_to_le32(0xC0000184)</div><div class='del'>-#define STATUS_IO_DEVICE_ERROR cpu_to_le32(0xC0000185)</div><div class='del'>-#define STATUS_DEVICE_PROTOCOL_ERROR cpu_to_le32(0xC0000186)</div><div class='del'>-#define STATUS_BACKUP_CONTROLLER cpu_to_le32(0xC0000187)</div><div class='del'>-#define STATUS_LOG_FILE_FULL cpu_to_le32(0xC0000188)</div><div class='del'>-#define STATUS_TOO_LATE cpu_to_le32(0xC0000189)</div><div class='del'>-#define STATUS_NO_TRUST_LSA_SECRET cpu_to_le32(0xC000018A)</div><div class='del'>-#define STATUS_NO_TRUST_SAM_ACCOUNT cpu_to_le32(0xC000018B)</div><div class='del'>-#define STATUS_TRUSTED_DOMAIN_FAILURE cpu_to_le32(0xC000018C)</div><div class='del'>-#define STATUS_TRUSTED_RELATIONSHIP_FAILURE cpu_to_le32(0xC000018D)</div><div class='del'>-#define STATUS_EVENTLOG_FILE_CORRUPT cpu_to_le32(0xC000018E)</div><div class='del'>-#define STATUS_EVENTLOG_CANT_START cpu_to_le32(0xC000018F)</div><div class='del'>-#define STATUS_TRUST_FAILURE cpu_to_le32(0xC0000190)</div><div class='del'>-#define STATUS_MUTANT_LIMIT_EXCEEDED cpu_to_le32(0xC0000191)</div><div class='del'>-#define STATUS_NETLOGON_NOT_STARTED cpu_to_le32(0xC0000192)</div><div class='del'>-#define STATUS_ACCOUNT_EXPIRED cpu_to_le32(0xC0000193)</div><div class='del'>-#define STATUS_POSSIBLE_DEADLOCK cpu_to_le32(0xC0000194)</div><div class='del'>-#define STATUS_NETWORK_CREDENTIAL_CONFLICT cpu_to_le32(0xC0000195)</div><div class='del'>-#define STATUS_REMOTE_SESSION_LIMIT cpu_to_le32(0xC0000196)</div><div class='del'>-#define STATUS_EVENTLOG_FILE_CHANGED cpu_to_le32(0xC0000197)</div><div class='del'>-#define STATUS_NOLOGON_INTERDOMAIN_TRUST_ACCOUNT cpu_to_le32(0xC0000198)</div><div class='del'>-#define STATUS_NOLOGON_WORKSTATION_TRUST_ACCOUNT cpu_to_le32(0xC0000199)</div><div class='del'>-#define STATUS_NOLOGON_SERVER_TRUST_ACCOUNT cpu_to_le32(0xC000019A)</div><div class='del'>-#define STATUS_DOMAIN_TRUST_INCONSISTENT cpu_to_le32(0xC000019B)</div><div class='del'>-#define STATUS_FS_DRIVER_REQUIRED cpu_to_le32(0xC000019C)</div><div class='del'>-#define STATUS_IMAGE_ALREADY_LOADED_AS_DLL cpu_to_le32(0xC000019D)</div><div class='del'>-#define STATUS_NETWORK_OPEN_RESTRICTION cpu_to_le32(0xC0000201)</div><div class='del'>-#define STATUS_NO_USER_SESSION_KEY cpu_to_le32(0xC0000202)</div><div class='del'>-#define STATUS_USER_SESSION_DELETED cpu_to_le32(0xC0000203)</div><div class='del'>-#define STATUS_RESOURCE_LANG_NOT_FOUND cpu_to_le32(0xC0000204)</div><div class='del'>-#define STATUS_INSUFF_SERVER_RESOURCES cpu_to_le32(0xC0000205)</div><div class='del'>-#define STATUS_INVALID_BUFFER_SIZE cpu_to_le32(0xC0000206)</div><div class='del'>-#define STATUS_INVALID_ADDRESS_COMPONENT cpu_to_le32(0xC0000207)</div><div class='del'>-#define STATUS_INVALID_ADDRESS_WILDCARD cpu_to_le32(0xC0000208)</div><div class='del'>-#define STATUS_TOO_MANY_ADDRESSES cpu_to_le32(0xC0000209)</div><div class='del'>-#define STATUS_ADDRESS_ALREADY_EXISTS cpu_to_le32(0xC000020A)</div><div class='del'>-#define STATUS_ADDRESS_CLOSED cpu_to_le32(0xC000020B)</div><div class='del'>-#define STATUS_CONNECTION_DISCONNECTED cpu_to_le32(0xC000020C)</div><div class='del'>-#define STATUS_CONNECTION_RESET cpu_to_le32(0xC000020D)</div><div class='del'>-#define STATUS_TOO_MANY_NODES cpu_to_le32(0xC000020E)</div><div class='del'>-#define STATUS_TRANSACTION_ABORTED cpu_to_le32(0xC000020F)</div><div class='del'>-#define STATUS_TRANSACTION_TIMED_OUT cpu_to_le32(0xC0000210)</div><div class='del'>-#define STATUS_TRANSACTION_NO_RELEASE cpu_to_le32(0xC0000211)</div><div class='del'>-#define STATUS_TRANSACTION_NO_MATCH cpu_to_le32(0xC0000212)</div><div class='del'>-#define STATUS_TRANSACTION_RESPONDED cpu_to_le32(0xC0000213)</div><div class='del'>-#define STATUS_TRANSACTION_INVALID_ID cpu_to_le32(0xC0000214)</div><div class='del'>-#define STATUS_TRANSACTION_INVALID_TYPE cpu_to_le32(0xC0000215)</div><div class='del'>-#define STATUS_NOT_SERVER_SESSION cpu_to_le32(0xC0000216)</div><div class='del'>-#define STATUS_NOT_CLIENT_SESSION cpu_to_le32(0xC0000217)</div><div class='del'>-#define STATUS_CANNOT_LOAD_REGISTRY_FILE cpu_to_le32(0xC0000218)</div><div class='del'>-#define STATUS_DEBUG_ATTACH_FAILED cpu_to_le32(0xC0000219)</div><div class='del'>-#define STATUS_SYSTEM_PROCESS_TERMINATED cpu_to_le32(0xC000021A)</div><div class='del'>-#define STATUS_DATA_NOT_ACCEPTED cpu_to_le32(0xC000021B)</div><div class='del'>-#define STATUS_NO_BROWSER_SERVERS_FOUND cpu_to_le32(0xC000021C)</div><div class='del'>-#define STATUS_VDM_HARD_ERROR cpu_to_le32(0xC000021D)</div><div class='del'>-#define STATUS_DRIVER_CANCEL_TIMEOUT cpu_to_le32(0xC000021E)</div><div class='del'>-#define STATUS_REPLY_MESSAGE_MISMATCH cpu_to_le32(0xC000021F)</div><div class='del'>-#define STATUS_MAPPED_ALIGNMENT cpu_to_le32(0xC0000220)</div><div class='del'>-#define STATUS_IMAGE_CHECKSUM_MISMATCH cpu_to_le32(0xC0000221)</div><div class='del'>-#define STATUS_LOST_WRITEBEHIND_DATA cpu_to_le32(0xC0000222)</div><div class='del'>-#define STATUS_CLIENT_SERVER_PARAMETERS_INVALID cpu_to_le32(0xC0000223)</div><div class='del'>-#define STATUS_PASSWORD_MUST_CHANGE cpu_to_le32(0xC0000224)</div><div class='del'>-#define STATUS_NOT_FOUND cpu_to_le32(0xC0000225)</div><div class='del'>-#define STATUS_NOT_TINY_STREAM cpu_to_le32(0xC0000226)</div><div class='del'>-#define STATUS_RECOVERY_FAILURE cpu_to_le32(0xC0000227)</div><div class='del'>-#define STATUS_STACK_OVERFLOW_READ cpu_to_le32(0xC0000228)</div><div class='del'>-#define STATUS_FAIL_CHECK cpu_to_le32(0xC0000229)</div><div class='del'>-#define STATUS_DUPLICATE_OBJECTID cpu_to_le32(0xC000022A)</div><div class='del'>-#define STATUS_OBJECTID_EXISTS cpu_to_le32(0xC000022B)</div><div class='del'>-#define STATUS_CONVERT_TO_LARGE cpu_to_le32(0xC000022C)</div><div class='del'>-#define STATUS_RETRY cpu_to_le32(0xC000022D)</div><div class='del'>-#define STATUS_FOUND_OUT_OF_SCOPE cpu_to_le32(0xC000022E)</div><div class='del'>-#define STATUS_ALLOCATE_BUCKET cpu_to_le32(0xC000022F)</div><div class='del'>-#define STATUS_PROPSET_NOT_FOUND cpu_to_le32(0xC0000230)</div><div class='del'>-#define STATUS_MARSHALL_OVERFLOW cpu_to_le32(0xC0000231)</div><div class='del'>-#define STATUS_INVALID_VARIANT cpu_to_le32(0xC0000232)</div><div class='del'>-#define STATUS_DOMAIN_CONTROLLER_NOT_FOUND cpu_to_le32(0xC0000233)</div><div class='del'>-#define STATUS_ACCOUNT_LOCKED_OUT cpu_to_le32(0xC0000234)</div><div class='del'>-#define STATUS_HANDLE_NOT_CLOSABLE cpu_to_le32(0xC0000235)</div><div class='del'>-#define STATUS_CONNECTION_REFUSED cpu_to_le32(0xC0000236)</div><div class='del'>-#define STATUS_GRACEFUL_DISCONNECT cpu_to_le32(0xC0000237)</div><div class='del'>-#define STATUS_ADDRESS_ALREADY_ASSOCIATED cpu_to_le32(0xC0000238)</div><div class='del'>-#define STATUS_ADDRESS_NOT_ASSOCIATED cpu_to_le32(0xC0000239)</div><div class='del'>-#define STATUS_CONNECTION_INVALID cpu_to_le32(0xC000023A)</div><div class='del'>-#define STATUS_CONNECTION_ACTIVE cpu_to_le32(0xC000023B)</div><div class='del'>-#define STATUS_NETWORK_UNREACHABLE cpu_to_le32(0xC000023C)</div><div class='del'>-#define STATUS_HOST_UNREACHABLE cpu_to_le32(0xC000023D)</div><div class='del'>-#define STATUS_PROTOCOL_UNREACHABLE cpu_to_le32(0xC000023E)</div><div class='del'>-#define STATUS_PORT_UNREACHABLE cpu_to_le32(0xC000023F)</div><div class='del'>-#define STATUS_REQUEST_ABORTED cpu_to_le32(0xC0000240)</div><div class='del'>-#define STATUS_CONNECTION_ABORTED cpu_to_le32(0xC0000241)</div><div class='del'>-#define STATUS_BAD_COMPRESSION_BUFFER cpu_to_le32(0xC0000242)</div><div class='del'>-#define STATUS_USER_MAPPED_FILE cpu_to_le32(0xC0000243)</div><div class='del'>-#define STATUS_AUDIT_FAILED cpu_to_le32(0xC0000244)</div><div class='del'>-#define STATUS_TIMER_RESOLUTION_NOT_SET cpu_to_le32(0xC0000245)</div><div class='del'>-#define STATUS_CONNECTION_COUNT_LIMIT cpu_to_le32(0xC0000246)</div><div class='del'>-#define STATUS_LOGIN_TIME_RESTRICTION cpu_to_le32(0xC0000247)</div><div class='del'>-#define STATUS_LOGIN_WKSTA_RESTRICTION cpu_to_le32(0xC0000248)</div><div class='del'>-#define STATUS_IMAGE_MP_UP_MISMATCH cpu_to_le32(0xC0000249)</div><div class='del'>-#define STATUS_INSUFFICIENT_LOGON_INFO cpu_to_le32(0xC0000250)</div><div class='del'>-#define STATUS_BAD_DLL_ENTRYPOINT cpu_to_le32(0xC0000251)</div><div class='del'>-#define STATUS_BAD_SERVICE_ENTRYPOINT cpu_to_le32(0xC0000252)</div><div class='del'>-#define STATUS_LPC_REPLY_LOST cpu_to_le32(0xC0000253)</div><div class='del'>-#define STATUS_IP_ADDRESS_CONFLICT1 cpu_to_le32(0xC0000254)</div><div class='del'>-#define STATUS_IP_ADDRESS_CONFLICT2 cpu_to_le32(0xC0000255)</div><div class='del'>-#define STATUS_REGISTRY_QUOTA_LIMIT cpu_to_le32(0xC0000256)</div><div class='del'>-#define STATUS_PATH_NOT_COVERED cpu_to_le32(0xC0000257)</div><div class='del'>-#define STATUS_NO_CALLBACK_ACTIVE cpu_to_le32(0xC0000258)</div><div class='del'>-#define STATUS_LICENSE_QUOTA_EXCEEDED cpu_to_le32(0xC0000259)</div><div class='del'>-#define STATUS_PWD_TOO_SHORT cpu_to_le32(0xC000025A)</div><div class='del'>-#define STATUS_PWD_TOO_RECENT cpu_to_le32(0xC000025B)</div><div class='del'>-#define STATUS_PWD_HISTORY_CONFLICT cpu_to_le32(0xC000025C)</div><div class='del'>-#define STATUS_PLUGPLAY_NO_DEVICE cpu_to_le32(0xC000025E)</div><div class='del'>-#define STATUS_UNSUPPORTED_COMPRESSION cpu_to_le32(0xC000025F)</div><div class='del'>-#define STATUS_INVALID_HW_PROFILE cpu_to_le32(0xC0000260)</div><div class='del'>-#define STATUS_INVALID_PLUGPLAY_DEVICE_PATH cpu_to_le32(0xC0000261)</div><div class='del'>-#define STATUS_DRIVER_ORDINAL_NOT_FOUND cpu_to_le32(0xC0000262)</div><div class='del'>-#define STATUS_DRIVER_ENTRYPOINT_NOT_FOUND cpu_to_le32(0xC0000263)</div><div class='del'>-#define STATUS_RESOURCE_NOT_OWNED cpu_to_le32(0xC0000264)</div><div class='del'>-#define STATUS_TOO_MANY_LINKS cpu_to_le32(0xC0000265)</div><div class='del'>-#define STATUS_QUOTA_LIST_INCONSISTENT cpu_to_le32(0xC0000266)</div><div class='del'>-#define STATUS_FILE_IS_OFFLINE cpu_to_le32(0xC0000267)</div><div class='del'>-#define STATUS_EVALUATION_EXPIRATION cpu_to_le32(0xC0000268)</div><div class='del'>-#define STATUS_ILLEGAL_DLL_RELOCATION cpu_to_le32(0xC0000269)</div><div class='del'>-#define STATUS_LICENSE_VIOLATION cpu_to_le32(0xC000026A)</div><div class='del'>-#define STATUS_DLL_INIT_FAILED_LOGOFF cpu_to_le32(0xC000026B)</div><div class='del'>-#define STATUS_DRIVER_UNABLE_TO_LOAD cpu_to_le32(0xC000026C)</div><div class='del'>-#define STATUS_DFS_UNAVAILABLE cpu_to_le32(0xC000026D)</div><div class='del'>-#define STATUS_VOLUME_DISMOUNTED cpu_to_le32(0xC000026E)</div><div class='del'>-#define STATUS_WX86_INTERNAL_ERROR cpu_to_le32(0xC000026F)</div><div class='del'>-#define STATUS_WX86_FLOAT_STACK_CHECK cpu_to_le32(0xC0000270)</div><div class='del'>-#define STATUS_VALIDATE_CONTINUE cpu_to_le32(0xC0000271)</div><div class='del'>-#define STATUS_NO_MATCH cpu_to_le32(0xC0000272)</div><div class='del'>-#define STATUS_NO_MORE_MATCHES cpu_to_le32(0xC0000273)</div><div class='del'>-#define STATUS_NOT_A_REPARSE_POINT cpu_to_le32(0xC0000275)</div><div class='del'>-#define STATUS_IO_REPARSE_TAG_INVALID cpu_to_le32(0xC0000276)</div><div class='del'>-#define STATUS_IO_REPARSE_TAG_MISMATCH cpu_to_le32(0xC0000277)</div><div class='del'>-#define STATUS_IO_REPARSE_DATA_INVALID cpu_to_le32(0xC0000278)</div><div class='del'>-#define STATUS_IO_REPARSE_TAG_NOT_HANDLED cpu_to_le32(0xC0000279)</div><div class='del'>-#define STATUS_REPARSE_POINT_NOT_RESOLVED cpu_to_le32(0xC0000280)</div><div class='del'>-#define STATUS_DIRECTORY_IS_A_REPARSE_POINT cpu_to_le32(0xC0000281)</div><div class='del'>-#define STATUS_RANGE_LIST_CONFLICT cpu_to_le32(0xC0000282)</div><div class='del'>-#define STATUS_SOURCE_ELEMENT_EMPTY cpu_to_le32(0xC0000283)</div><div class='del'>-#define STATUS_DESTINATION_ELEMENT_FULL cpu_to_le32(0xC0000284)</div><div class='del'>-#define STATUS_ILLEGAL_ELEMENT_ADDRESS cpu_to_le32(0xC0000285)</div><div class='del'>-#define STATUS_MAGAZINE_NOT_PRESENT cpu_to_le32(0xC0000286)</div><div class='del'>-#define STATUS_REINITIALIZATION_NEEDED cpu_to_le32(0xC0000287)</div><div class='del'>-#define STATUS_ENCRYPTION_FAILED cpu_to_le32(0xC000028A)</div><div class='del'>-#define STATUS_DECRYPTION_FAILED cpu_to_le32(0xC000028B)</div><div class='del'>-#define STATUS_RANGE_NOT_FOUND cpu_to_le32(0xC000028C)</div><div class='del'>-#define STATUS_NO_RECOVERY_POLICY cpu_to_le32(0xC000028D)</div><div class='del'>-#define STATUS_NO_EFS cpu_to_le32(0xC000028E)</div><div class='del'>-#define STATUS_WRONG_EFS cpu_to_le32(0xC000028F)</div><div class='del'>-#define STATUS_NO_USER_KEYS cpu_to_le32(0xC0000290)</div><div class='del'>-#define STATUS_FILE_NOT_ENCRYPTED cpu_to_le32(0xC0000291)</div><div class='del'>-#define STATUS_NOT_EXPORT_FORMAT cpu_to_le32(0xC0000292)</div><div class='del'>-#define STATUS_FILE_ENCRYPTED cpu_to_le32(0xC0000293)</div><div class='del'>-#define STATUS_WMI_GUID_NOT_FOUND cpu_to_le32(0xC0000295)</div><div class='del'>-#define STATUS_WMI_INSTANCE_NOT_FOUND cpu_to_le32(0xC0000296)</div><div class='del'>-#define STATUS_WMI_ITEMID_NOT_FOUND cpu_to_le32(0xC0000297)</div><div class='del'>-#define STATUS_WMI_TRY_AGAIN cpu_to_le32(0xC0000298)</div><div class='del'>-#define STATUS_SHARED_POLICY cpu_to_le32(0xC0000299)</div><div class='del'>-#define STATUS_POLICY_OBJECT_NOT_FOUND cpu_to_le32(0xC000029A)</div><div class='del'>-#define STATUS_POLICY_ONLY_IN_DS cpu_to_le32(0xC000029B)</div><div class='del'>-#define STATUS_VOLUME_NOT_UPGRADED cpu_to_le32(0xC000029C)</div><div class='del'>-#define STATUS_REMOTE_STORAGE_NOT_ACTIVE cpu_to_le32(0xC000029D)</div><div class='del'>-#define STATUS_REMOTE_STORAGE_MEDIA_ERROR cpu_to_le32(0xC000029E)</div><div class='del'>-#define STATUS_NO_TRACKING_SERVICE cpu_to_le32(0xC000029F)</div><div class='del'>-#define STATUS_SERVER_SID_MISMATCH cpu_to_le32(0xC00002A0)</div><div class='del'>-#define STATUS_DS_NO_ATTRIBUTE_OR_VALUE cpu_to_le32(0xC00002A1)</div><div class='del'>-#define STATUS_DS_INVALID_ATTRIBUTE_SYNTAX cpu_to_le32(0xC00002A2)</div><div class='del'>-#define STATUS_DS_ATTRIBUTE_TYPE_UNDEFINED cpu_to_le32(0xC00002A3)</div><div class='del'>-#define STATUS_DS_ATTRIBUTE_OR_VALUE_EXISTS cpu_to_le32(0xC00002A4)</div><div class='del'>-#define STATUS_DS_BUSY cpu_to_le32(0xC00002A5)</div><div class='del'>-#define STATUS_DS_UNAVAILABLE cpu_to_le32(0xC00002A6)</div><div class='del'>-#define STATUS_DS_NO_RIDS_ALLOCATED cpu_to_le32(0xC00002A7)</div><div class='del'>-#define STATUS_DS_NO_MORE_RIDS cpu_to_le32(0xC00002A8)</div><div class='del'>-#define STATUS_DS_INCORRECT_ROLE_OWNER cpu_to_le32(0xC00002A9)</div><div class='del'>-#define STATUS_DS_RIDMGR_INIT_ERROR cpu_to_le32(0xC00002AA)</div><div class='del'>-#define STATUS_DS_OBJ_CLASS_VIOLATION cpu_to_le32(0xC00002AB)</div><div class='del'>-#define STATUS_DS_CANT_ON_NON_LEAF cpu_to_le32(0xC00002AC)</div><div class='del'>-#define STATUS_DS_CANT_ON_RDN cpu_to_le32(0xC00002AD)</div><div class='del'>-#define STATUS_DS_CANT_MOD_OBJ_CLASS cpu_to_le32(0xC00002AE)</div><div class='del'>-#define STATUS_DS_CROSS_DOM_MOVE_FAILED cpu_to_le32(0xC00002AF)</div><div class='del'>-#define STATUS_DS_GC_NOT_AVAILABLE cpu_to_le32(0xC00002B0)</div><div class='del'>-#define STATUS_DIRECTORY_SERVICE_REQUIRED cpu_to_le32(0xC00002B1)</div><div class='del'>-#define STATUS_REPARSE_ATTRIBUTE_CONFLICT cpu_to_le32(0xC00002B2)</div><div class='del'>-#define STATUS_CANT_ENABLE_DENY_ONLY cpu_to_le32(0xC00002B3)</div><div class='del'>-#define STATUS_FLOAT_MULTIPLE_FAULTS cpu_to_le32(0xC00002B4)</div><div class='del'>-#define STATUS_FLOAT_MULTIPLE_TRAPS cpu_to_le32(0xC00002B5)</div><div class='del'>-#define STATUS_DEVICE_REMOVED cpu_to_le32(0xC00002B6)</div><div class='del'>-#define STATUS_JOURNAL_DELETE_IN_PROGRESS cpu_to_le32(0xC00002B7)</div><div class='del'>-#define STATUS_JOURNAL_NOT_ACTIVE cpu_to_le32(0xC00002B8)</div><div class='del'>-#define STATUS_NOINTERFACE cpu_to_le32(0xC00002B9)</div><div class='del'>-#define STATUS_DS_ADMIN_LIMIT_EXCEEDED cpu_to_le32(0xC00002C1)</div><div class='del'>-#define STATUS_DRIVER_FAILED_SLEEP cpu_to_le32(0xC00002C2)</div><div class='del'>-#define STATUS_MUTUAL_AUTHENTICATION_FAILED cpu_to_le32(0xC00002C3)</div><div class='del'>-#define STATUS_CORRUPT_SYSTEM_FILE cpu_to_le32(0xC00002C4)</div><div class='del'>-#define STATUS_DATATYPE_MISALIGNMENT_ERROR cpu_to_le32(0xC00002C5)</div><div class='del'>-#define STATUS_WMI_READ_ONLY cpu_to_le32(0xC00002C6)</div><div class='del'>-#define STATUS_WMI_SET_FAILURE cpu_to_le32(0xC00002C7)</div><div class='del'>-#define STATUS_COMMITMENT_MINIMUM cpu_to_le32(0xC00002C8)</div><div class='del'>-#define STATUS_REG_NAT_CONSUMPTION cpu_to_le32(0xC00002C9)</div><div class='del'>-#define STATUS_TRANSPORT_FULL cpu_to_le32(0xC00002CA)</div><div class='del'>-#define STATUS_DS_SAM_INIT_FAILURE cpu_to_le32(0xC00002CB)</div><div class='del'>-#define STATUS_ONLY_IF_CONNECTED cpu_to_le32(0xC00002CC)</div><div class='del'>-#define STATUS_DS_SENSITIVE_GROUP_VIOLATION cpu_to_le32(0xC00002CD)</div><div class='del'>-#define STATUS_PNP_RESTART_ENUMERATION cpu_to_le32(0xC00002CE)</div><div class='del'>-#define STATUS_JOURNAL_ENTRY_DELETED cpu_to_le32(0xC00002CF)</div><div class='del'>-#define STATUS_DS_CANT_MOD_PRIMARYGROUPID cpu_to_le32(0xC00002D0)</div><div class='del'>-#define STATUS_SYSTEM_IMAGE_BAD_SIGNATURE cpu_to_le32(0xC00002D1)</div><div class='del'>-#define STATUS_PNP_REBOOT_REQUIRED cpu_to_le32(0xC00002D2)</div><div class='del'>-#define STATUS_POWER_STATE_INVALID cpu_to_le32(0xC00002D3)</div><div class='del'>-#define STATUS_DS_INVALID_GROUP_TYPE cpu_to_le32(0xC00002D4)</div><div class='del'>-#define STATUS_DS_NO_NEST_GLOBALGROUP_IN_MIXEDDOMAIN cpu_to_le32(0xC00002D5)</div><div class='del'>-#define STATUS_DS_NO_NEST_LOCALGROUP_IN_MIXEDDOMAIN cpu_to_le32(0xC00002D6)</div><div class='del'>-#define STATUS_DS_GLOBAL_CANT_HAVE_LOCAL_MEMBER cpu_to_le32(0xC00002D7)</div><div class='del'>-#define STATUS_DS_GLOBAL_CANT_HAVE_UNIVERSAL_MEMBER cpu_to_le32(0xC00002D8)</div><div class='del'>-#define STATUS_DS_UNIVERSAL_CANT_HAVE_LOCAL_MEMBER cpu_to_le32(0xC00002D9)</div><div class='del'>-#define STATUS_DS_GLOBAL_CANT_HAVE_CROSSDOMAIN_MEMBER cpu_to_le32(0xC00002DA)</div><div class='del'>-#define STATUS_DS_LOCAL_CANT_HAVE_CROSSDOMAIN_LOCAL_MEMBER	\</div><div class='del'>-	cpu_to_le32(0xC00002DB)</div><div class='del'>-#define STATUS_DS_HAVE_PRIMARY_MEMBERS cpu_to_le32(0xC00002DC)</div><div class='del'>-#define STATUS_WMI_NOT_SUPPORTED cpu_to_le32(0xC00002DD)</div><div class='del'>-#define STATUS_INSUFFICIENT_POWER cpu_to_le32(0xC00002DE)</div><div class='del'>-#define STATUS_SAM_NEED_BOOTKEY_PASSWORD cpu_to_le32(0xC00002DF)</div><div class='del'>-#define STATUS_SAM_NEED_BOOTKEY_FLOPPY cpu_to_le32(0xC00002E0)</div><div class='del'>-#define STATUS_DS_CANT_START cpu_to_le32(0xC00002E1)</div><div class='del'>-#define STATUS_DS_INIT_FAILURE cpu_to_le32(0xC00002E2)</div><div class='del'>-#define STATUS_SAM_INIT_FAILURE cpu_to_le32(0xC00002E3)</div><div class='del'>-#define STATUS_DS_GC_REQUIRED cpu_to_le32(0xC00002E4)</div><div class='del'>-#define STATUS_DS_LOCAL_MEMBER_OF_LOCAL_ONLY cpu_to_le32(0xC00002E5)</div><div class='del'>-#define STATUS_DS_NO_FPO_IN_UNIVERSAL_GROUPS cpu_to_le32(0xC00002E6)</div><div class='del'>-#define STATUS_DS_MACHINE_ACCOUNT_QUOTA_EXCEEDED cpu_to_le32(0xC00002E7)</div><div class='del'>-#define STATUS_MULTIPLE_FAULT_VIOLATION cpu_to_le32(0xC00002E8)</div><div class='del'>-#define STATUS_CURRENT_DOMAIN_NOT_ALLOWED cpu_to_le32(0xC00002E9)</div><div class='del'>-#define STATUS_CANNOT_MAKE cpu_to_le32(0xC00002EA)</div><div class='del'>-#define STATUS_SYSTEM_SHUTDOWN cpu_to_le32(0xC00002EB)</div><div class='del'>-#define STATUS_DS_INIT_FAILURE_CONSOLE cpu_to_le32(0xC00002EC)</div><div class='del'>-#define STATUS_DS_SAM_INIT_FAILURE_CONSOLE cpu_to_le32(0xC00002ED)</div><div class='del'>-#define STATUS_UNFINISHED_CONTEXT_DELETED cpu_to_le32(0xC00002EE)</div><div class='del'>-#define STATUS_NO_TGT_REPLY cpu_to_le32(0xC00002EF)</div><div class='del'>-#define STATUS_OBJECTID_NOT_FOUND cpu_to_le32(0xC00002F0)</div><div class='del'>-#define STATUS_NO_IP_ADDRESSES cpu_to_le32(0xC00002F1)</div><div class='del'>-#define STATUS_WRONG_CREDENTIAL_HANDLE cpu_to_le32(0xC00002F2)</div><div class='del'>-#define STATUS_CRYPTO_SYSTEM_INVALID cpu_to_le32(0xC00002F3)</div><div class='del'>-#define STATUS_MAX_REFERRALS_EXCEEDED cpu_to_le32(0xC00002F4)</div><div class='del'>-#define STATUS_MUST_BE_KDC cpu_to_le32(0xC00002F5)</div><div class='del'>-#define STATUS_STRONG_CRYPTO_NOT_SUPPORTED cpu_to_le32(0xC00002F6)</div><div class='del'>-#define STATUS_TOO_MANY_PRINCIPALS cpu_to_le32(0xC00002F7)</div><div class='del'>-#define STATUS_NO_PA_DATA cpu_to_le32(0xC00002F8)</div><div class='del'>-#define STATUS_PKINIT_NAME_MISMATCH cpu_to_le32(0xC00002F9)</div><div class='del'>-#define STATUS_SMARTCARD_LOGON_REQUIRED cpu_to_le32(0xC00002FA)</div><div class='del'>-#define STATUS_KDC_INVALID_REQUEST cpu_to_le32(0xC00002FB)</div><div class='del'>-#define STATUS_KDC_UNABLE_TO_REFER cpu_to_le32(0xC00002FC)</div><div class='del'>-#define STATUS_KDC_UNKNOWN_ETYPE cpu_to_le32(0xC00002FD)</div><div class='del'>-#define STATUS_SHUTDOWN_IN_PROGRESS cpu_to_le32(0xC00002FE)</div><div class='del'>-#define STATUS_SERVER_SHUTDOWN_IN_PROGRESS cpu_to_le32(0xC00002FF)</div><div class='del'>-#define STATUS_NOT_SUPPORTED_ON_SBS cpu_to_le32(0xC0000300)</div><div class='del'>-#define STATUS_WMI_GUID_DISCONNECTED cpu_to_le32(0xC0000301)</div><div class='del'>-#define STATUS_WMI_ALREADY_DISABLED cpu_to_le32(0xC0000302)</div><div class='del'>-#define STATUS_WMI_ALREADY_ENABLED cpu_to_le32(0xC0000303)</div><div class='del'>-#define STATUS_MFT_TOO_FRAGMENTED cpu_to_le32(0xC0000304)</div><div class='del'>-#define STATUS_COPY_PROTECTION_FAILURE cpu_to_le32(0xC0000305)</div><div class='del'>-#define STATUS_CSS_AUTHENTICATION_FAILURE cpu_to_le32(0xC0000306)</div><div class='del'>-#define STATUS_CSS_KEY_NOT_PRESENT cpu_to_le32(0xC0000307)</div><div class='del'>-#define STATUS_CSS_KEY_NOT_ESTABLISHED cpu_to_le32(0xC0000308)</div><div class='del'>-#define STATUS_CSS_SCRAMBLED_SECTOR cpu_to_le32(0xC0000309)</div><div class='del'>-#define STATUS_CSS_REGION_MISMATCH cpu_to_le32(0xC000030A)</div><div class='del'>-#define STATUS_CSS_RESETS_EXHAUSTED cpu_to_le32(0xC000030B)</div><div class='del'>-#define STATUS_PKINIT_FAILURE cpu_to_le32(0xC0000320)</div><div class='del'>-#define STATUS_SMARTCARD_SUBSYSTEM_FAILURE cpu_to_le32(0xC0000321)</div><div class='del'>-#define STATUS_NO_KERB_KEY cpu_to_le32(0xC0000322)</div><div class='del'>-#define STATUS_HOST_DOWN cpu_to_le32(0xC0000350)</div><div class='del'>-#define STATUS_UNSUPPORTED_PREAUTH cpu_to_le32(0xC0000351)</div><div class='del'>-#define STATUS_EFS_ALG_BLOB_TOO_BIG cpu_to_le32(0xC0000352)</div><div class='del'>-#define STATUS_PORT_NOT_SET cpu_to_le32(0xC0000353)</div><div class='del'>-#define STATUS_DEBUGGER_INACTIVE cpu_to_le32(0xC0000354)</div><div class='del'>-#define STATUS_DS_VERSION_CHECK_FAILURE cpu_to_le32(0xC0000355)</div><div class='del'>-#define STATUS_AUDITING_DISABLED cpu_to_le32(0xC0000356)</div><div class='del'>-#define STATUS_PRENT4_MACHINE_ACCOUNT cpu_to_le32(0xC0000357)</div><div class='del'>-#define STATUS_DS_AG_CANT_HAVE_UNIVERSAL_MEMBER cpu_to_le32(0xC0000358)</div><div class='del'>-#define STATUS_INVALID_IMAGE_WIN_32 cpu_to_le32(0xC0000359)</div><div class='del'>-#define STATUS_INVALID_IMAGE_WIN_64 cpu_to_le32(0xC000035A)</div><div class='del'>-#define STATUS_BAD_BINDINGS cpu_to_le32(0xC000035B)</div><div class='del'>-#define STATUS_NETWORK_SESSION_EXPIRED cpu_to_le32(0xC000035C)</div><div class='del'>-#define STATUS_APPHELP_BLOCK cpu_to_le32(0xC000035D)</div><div class='del'>-#define STATUS_ALL_SIDS_FILTERED cpu_to_le32(0xC000035E)</div><div class='del'>-#define STATUS_NOT_SAFE_MODE_DRIVER cpu_to_le32(0xC000035F)</div><div class='del'>-#define STATUS_ACCESS_DISABLED_BY_POLICY_DEFAULT cpu_to_le32(0xC0000361)</div><div class='del'>-#define STATUS_ACCESS_DISABLED_BY_POLICY_PATH cpu_to_le32(0xC0000362)</div><div class='del'>-#define STATUS_ACCESS_DISABLED_BY_POLICY_PUBLISHER cpu_to_le32(0xC0000363)</div><div class='del'>-#define STATUS_ACCESS_DISABLED_BY_POLICY_OTHER cpu_to_le32(0xC0000364)</div><div class='del'>-#define STATUS_FAILED_DRIVER_ENTRY cpu_to_le32(0xC0000365)</div><div class='del'>-#define STATUS_DEVICE_ENUMERATION_ERROR cpu_to_le32(0xC0000366)</div><div class='del'>-#define STATUS_MOUNT_POINT_NOT_RESOLVED cpu_to_le32(0xC0000368)</div><div class='del'>-#define STATUS_INVALID_DEVICE_OBJECT_PARAMETER cpu_to_le32(0xC0000369)</div><div class='del'>-#define STATUS_MCA_OCCURRED cpu_to_le32(0xC000036A)</div><div class='del'>-#define STATUS_DRIVER_BLOCKED_CRITICAL cpu_to_le32(0xC000036B)</div><div class='del'>-#define STATUS_DRIVER_BLOCKED cpu_to_le32(0xC000036C)</div><div class='del'>-#define STATUS_DRIVER_DATABASE_ERROR cpu_to_le32(0xC000036D)</div><div class='del'>-#define STATUS_SYSTEM_HIVE_TOO_LARGE cpu_to_le32(0xC000036E)</div><div class='del'>-#define STATUS_INVALID_IMPORT_OF_NON_DLL cpu_to_le32(0xC000036F)</div><div class='del'>-#define STATUS_NO_SECRETS cpu_to_le32(0xC0000371)</div><div class='del'>-#define STATUS_ACCESS_DISABLED_NO_SAFER_UI_BY_POLICY cpu_to_le32(0xC0000372)</div><div class='del'>-#define STATUS_FAILED_STACK_SWITCH cpu_to_le32(0xC0000373)</div><div class='del'>-#define STATUS_HEAP_CORRUPTION cpu_to_le32(0xC0000374)</div><div class='del'>-#define STATUS_SMARTCARD_WRONG_PIN cpu_to_le32(0xC0000380)</div><div class='del'>-#define STATUS_SMARTCARD_CARD_BLOCKED cpu_to_le32(0xC0000381)</div><div class='del'>-#define STATUS_SMARTCARD_CARD_NOT_AUTHENTICATED cpu_to_le32(0xC0000382)</div><div class='del'>-#define STATUS_SMARTCARD_NO_CARD cpu_to_le32(0xC0000383)</div><div class='del'>-#define STATUS_SMARTCARD_NO_KEY_CONTAINER cpu_to_le32(0xC0000384)</div><div class='del'>-#define STATUS_SMARTCARD_NO_CERTIFICATE cpu_to_le32(0xC0000385)</div><div class='del'>-#define STATUS_SMARTCARD_NO_KEYSET cpu_to_le32(0xC0000386)</div><div class='del'>-#define STATUS_SMARTCARD_IO_ERROR cpu_to_le32(0xC0000387)</div><div class='del'>-#define STATUS_DOWNGRADE_DETECTED cpu_to_le32(0xC0000388)</div><div class='del'>-#define STATUS_SMARTCARD_CERT_REVOKED cpu_to_le32(0xC0000389)</div><div class='del'>-#define STATUS_ISSUING_CA_UNTRUSTED cpu_to_le32(0xC000038A)</div><div class='del'>-#define STATUS_REVOCATION_OFFLINE_C cpu_to_le32(0xC000038B)</div><div class='del'>-#define STATUS_PKINIT_CLIENT_FAILURE cpu_to_le32(0xC000038C)</div><div class='del'>-#define STATUS_SMARTCARD_CERT_EXPIRED cpu_to_le32(0xC000038D)</div><div class='del'>-#define STATUS_DRIVER_FAILED_PRIOR_UNLOAD cpu_to_le32(0xC000038E)</div><div class='del'>-#define STATUS_SMARTCARD_SILENT_CONTEXT cpu_to_le32(0xC000038F)</div><div class='del'>-#define STATUS_PER_USER_TRUST_QUOTA_EXCEEDED cpu_to_le32(0xC0000401)</div><div class='del'>-#define STATUS_ALL_USER_TRUST_QUOTA_EXCEEDED cpu_to_le32(0xC0000402)</div><div class='del'>-#define STATUS_USER_DELETE_TRUST_QUOTA_EXCEEDED cpu_to_le32(0xC0000403)</div><div class='del'>-#define STATUS_DS_NAME_NOT_UNIQUE cpu_to_le32(0xC0000404)</div><div class='del'>-#define STATUS_DS_DUPLICATE_ID_FOUND cpu_to_le32(0xC0000405)</div><div class='del'>-#define STATUS_DS_GROUP_CONVERSION_ERROR cpu_to_le32(0xC0000406)</div><div class='del'>-#define STATUS_VOLSNAP_PREPARE_HIBERNATE cpu_to_le32(0xC0000407)</div><div class='del'>-#define STATUS_USER2USER_REQUIRED cpu_to_le32(0xC0000408)</div><div class='del'>-#define STATUS_STACK_BUFFER_OVERRUN cpu_to_le32(0xC0000409)</div><div class='del'>-#define STATUS_NO_S4U_PROT_SUPPORT cpu_to_le32(0xC000040A)</div><div class='del'>-#define STATUS_CROSSREALM_DELEGATION_FAILURE cpu_to_le32(0xC000040B)</div><div class='del'>-#define STATUS_REVOCATION_OFFLINE_KDC cpu_to_le32(0xC000040C)</div><div class='del'>-#define STATUS_ISSUING_CA_UNTRUSTED_KDC cpu_to_le32(0xC000040D)</div><div class='del'>-#define STATUS_KDC_CERT_EXPIRED cpu_to_le32(0xC000040E)</div><div class='del'>-#define STATUS_KDC_CERT_REVOKED cpu_to_le32(0xC000040F)</div><div class='del'>-#define STATUS_PARAMETER_QUOTA_EXCEEDED cpu_to_le32(0xC0000410)</div><div class='del'>-#define STATUS_HIBERNATION_FAILURE cpu_to_le32(0xC0000411)</div><div class='del'>-#define STATUS_DELAY_LOAD_FAILED cpu_to_le32(0xC0000412)</div><div class='del'>-#define STATUS_AUTHENTICATION_FIREWALL_FAILED cpu_to_le32(0xC0000413)</div><div class='del'>-#define STATUS_VDM_DISALLOWED cpu_to_le32(0xC0000414)</div><div class='del'>-#define STATUS_HUNG_DISPLAY_DRIVER_THREAD cpu_to_le32(0xC0000415)</div><div class='del'>-#define STATUS_INSUFFICIENT_RESOURCE_FOR_SPECIFIED_SHARED_SECTION_SIZE	\</div><div class='del'>-	cpu_to_le32(0xC0000416)</div><div class='del'>-#define STATUS_INVALID_CRUNTIME_PARAMETER cpu_to_le32(0xC0000417)</div><div class='del'>-#define STATUS_NTLM_BLOCKED cpu_to_le32(0xC0000418)</div><div class='del'>-#define STATUS_ASSERTION_FAILURE cpu_to_le32(0xC0000420)</div><div class='del'>-#define STATUS_VERIFIER_STOP cpu_to_le32(0xC0000421)</div><div class='del'>-#define STATUS_CALLBACK_POP_STACK cpu_to_le32(0xC0000423)</div><div class='del'>-#define STATUS_INCOMPATIBLE_DRIVER_BLOCKED cpu_to_le32(0xC0000424)</div><div class='del'>-#define STATUS_HIVE_UNLOADED cpu_to_le32(0xC0000425)</div><div class='del'>-#define STATUS_COMPRESSION_DISABLED cpu_to_le32(0xC0000426)</div><div class='del'>-#define STATUS_FILE_SYSTEM_LIMITATION cpu_to_le32(0xC0000427)</div><div class='del'>-#define STATUS_INVALID_IMAGE_HASH cpu_to_le32(0xC0000428)</div><div class='del'>-#define STATUS_NOT_CAPABLE cpu_to_le32(0xC0000429)</div><div class='del'>-#define STATUS_REQUEST_OUT_OF_SEQUENCE cpu_to_le32(0xC000042A)</div><div class='del'>-#define STATUS_IMPLEMENTATION_LIMIT cpu_to_le32(0xC000042B)</div><div class='del'>-#define STATUS_ELEVATION_REQUIRED cpu_to_le32(0xC000042C)</div><div class='del'>-#define STATUS_BEYOND_VDL cpu_to_le32(0xC0000432)</div><div class='del'>-#define STATUS_ENCOUNTERED_WRITE_IN_PROGRESS cpu_to_le32(0xC0000433)</div><div class='del'>-#define STATUS_PTE_CHANGED cpu_to_le32(0xC0000434)</div><div class='del'>-#define STATUS_PURGE_FAILED cpu_to_le32(0xC0000435)</div><div class='del'>-#define STATUS_CRED_REQUIRES_CONFIRMATION cpu_to_le32(0xC0000440)</div><div class='del'>-#define STATUS_CS_ENCRYPTION_INVALID_SERVER_RESPONSE cpu_to_le32(0xC0000441)</div><div class='del'>-#define STATUS_CS_ENCRYPTION_UNSUPPORTED_SERVER cpu_to_le32(0xC0000442)</div><div class='del'>-#define STATUS_CS_ENCRYPTION_EXISTING_ENCRYPTED_FILE cpu_to_le32(0xC0000443)</div><div class='del'>-#define STATUS_CS_ENCRYPTION_NEW_ENCRYPTED_FILE cpu_to_le32(0xC0000444)</div><div class='del'>-#define STATUS_CS_ENCRYPTION_FILE_NOT_CSE cpu_to_le32(0xC0000445)</div><div class='del'>-#define STATUS_INVALID_LABEL cpu_to_le32(0xC0000446)</div><div class='del'>-#define STATUS_DRIVER_PROCESS_TERMINATED cpu_to_le32(0xC0000450)</div><div class='del'>-#define STATUS_AMBIGUOUS_SYSTEM_DEVICE cpu_to_le32(0xC0000451)</div><div class='del'>-#define STATUS_SYSTEM_DEVICE_NOT_FOUND cpu_to_le32(0xC0000452)</div><div class='del'>-#define STATUS_RESTART_BOOT_APPLICATION cpu_to_le32(0xC0000453)</div><div class='del'>-#define STATUS_INVALID_TASK_NAME cpu_to_le32(0xC0000500)</div><div class='del'>-#define STATUS_INVALID_TASK_INDEX cpu_to_le32(0xC0000501)</div><div class='del'>-#define STATUS_THREAD_ALREADY_IN_TASK cpu_to_le32(0xC0000502)</div><div class='del'>-#define STATUS_CALLBACK_BYPASS cpu_to_le32(0xC0000503)</div><div class='del'>-#define STATUS_PORT_CLOSED cpu_to_le32(0xC0000700)</div><div class='del'>-#define STATUS_MESSAGE_LOST cpu_to_le32(0xC0000701)</div><div class='del'>-#define STATUS_INVALID_MESSAGE cpu_to_le32(0xC0000702)</div><div class='del'>-#define STATUS_REQUEST_CANCELED cpu_to_le32(0xC0000703)</div><div class='del'>-#define STATUS_RECURSIVE_DISPATCH cpu_to_le32(0xC0000704)</div><div class='del'>-#define STATUS_LPC_RECEIVE_BUFFER_EXPECTED cpu_to_le32(0xC0000705)</div><div class='del'>-#define STATUS_LPC_INVALID_CONNECTION_USAGE cpu_to_le32(0xC0000706)</div><div class='del'>-#define STATUS_LPC_REQUESTS_NOT_ALLOWED cpu_to_le32(0xC0000707)</div><div class='del'>-#define STATUS_RESOURCE_IN_USE cpu_to_le32(0xC0000708)</div><div class='del'>-#define STATUS_HARDWARE_MEMORY_ERROR cpu_to_le32(0xC0000709)</div><div class='del'>-#define STATUS_THREADPOOL_HANDLE_EXCEPTION cpu_to_le32(0xC000070A)</div><div class='del'>-#define STATUS_THREADPOOL_SET_EVENT_ON_COMPLETION_FAILED cpu_to_le32(0xC000070B)</div><div class='del'>-#define STATUS_THREADPOOL_RELEASE_SEMAPHORE_ON_COMPLETION_FAILED	\</div><div class='del'>-	cpu_to_le32(0xC000070C)</div><div class='del'>-#define STATUS_THREADPOOL_RELEASE_MUTEX_ON_COMPLETION_FAILED	\</div><div class='del'>-	cpu_to_le32(0xC000070D)</div><div class='del'>-#define STATUS_THREADPOOL_FREE_LIBRARY_ON_COMPLETION_FAILED	\</div><div class='del'>-	cpu_to_le32(0xC000070E)</div><div class='del'>-#define STATUS_THREADPOOL_RELEASED_DURING_OPERATION cpu_to_le32(0xC000070F)</div><div class='del'>-#define STATUS_CALLBACK_RETURNED_WHILE_IMPERSONATING cpu_to_le32(0xC0000710)</div><div class='del'>-#define STATUS_APC_RETURNED_WHILE_IMPERSONATING cpu_to_le32(0xC0000711)</div><div class='del'>-#define STATUS_PROCESS_IS_PROTECTED cpu_to_le32(0xC0000712)</div><div class='del'>-#define STATUS_MCA_EXCEPTION cpu_to_le32(0xC0000713)</div><div class='del'>-#define STATUS_CERTIFICATE_MAPPING_NOT_UNIQUE cpu_to_le32(0xC0000714)</div><div class='del'>-#define STATUS_SYMLINK_CLASS_DISABLED cpu_to_le32(0xC0000715)</div><div class='del'>-#define STATUS_INVALID_IDN_NORMALIZATION cpu_to_le32(0xC0000716)</div><div class='del'>-#define STATUS_NO_UNICODE_TRANSLATION cpu_to_le32(0xC0000717)</div><div class='del'>-#define STATUS_ALREADY_REGISTERED cpu_to_le32(0xC0000718)</div><div class='del'>-#define STATUS_CONTEXT_MISMATCH cpu_to_le32(0xC0000719)</div><div class='del'>-#define STATUS_PORT_ALREADY_HAS_COMPLETION_LIST cpu_to_le32(0xC000071A)</div><div class='del'>-#define STATUS_CALLBACK_RETURNED_THREAD_PRIORITY cpu_to_le32(0xC000071B)</div><div class='del'>-#define STATUS_INVALID_THREAD cpu_to_le32(0xC000071C)</div><div class='del'>-#define STATUS_CALLBACK_RETURNED_TRANSACTION cpu_to_le32(0xC000071D)</div><div class='del'>-#define STATUS_CALLBACK_RETURNED_LDR_LOCK cpu_to_le32(0xC000071E)</div><div class='del'>-#define STATUS_CALLBACK_RETURNED_LANG cpu_to_le32(0xC000071F)</div><div class='del'>-#define STATUS_CALLBACK_RETURNED_PRI_BACK cpu_to_le32(0xC0000720)</div><div class='del'>-#define STATUS_CALLBACK_RETURNED_THREAD_AFFINITY cpu_to_le32(0xC0000721)</div><div class='del'>-#define STATUS_DISK_REPAIR_DISABLED cpu_to_le32(0xC0000800)</div><div class='del'>-#define STATUS_DS_DOMAIN_RENAME_IN_PROGRESS cpu_to_le32(0xC0000801)</div><div class='del'>-#define STATUS_DISK_QUOTA_EXCEEDED cpu_to_le32(0xC0000802)</div><div class='del'>-#define STATUS_CONTENT_BLOCKED cpu_to_le32(0xC0000804)</div><div class='del'>-#define STATUS_BAD_CLUSTERS cpu_to_le32(0xC0000805)</div><div class='del'>-#define STATUS_VOLUME_DIRTY cpu_to_le32(0xC0000806)</div><div class='del'>-#define STATUS_FILE_CHECKED_OUT cpu_to_le32(0xC0000901)</div><div class='del'>-#define STATUS_CHECKOUT_REQUIRED cpu_to_le32(0xC0000902)</div><div class='del'>-#define STATUS_BAD_FILE_TYPE cpu_to_le32(0xC0000903)</div><div class='del'>-#define STATUS_FILE_TOO_LARGE cpu_to_le32(0xC0000904)</div><div class='del'>-#define STATUS_FORMS_AUTH_REQUIRED cpu_to_le32(0xC0000905)</div><div class='del'>-#define STATUS_VIRUS_INFECTED cpu_to_le32(0xC0000906)</div><div class='del'>-#define STATUS_VIRUS_DELETED cpu_to_le32(0xC0000907)</div><div class='del'>-#define STATUS_BAD_MCFG_TABLE cpu_to_le32(0xC0000908)</div><div class='del'>-#define STATUS_WOW_ASSERTION cpu_to_le32(0xC0009898)</div><div class='del'>-#define STATUS_INVALID_SIGNATURE cpu_to_le32(0xC000A000)</div><div class='del'>-#define STATUS_HMAC_NOT_SUPPORTED cpu_to_le32(0xC000A001)</div><div class='del'>-#define STATUS_IPSEC_QUEUE_OVERFLOW cpu_to_le32(0xC000A010)</div><div class='del'>-#define STATUS_ND_QUEUE_OVERFLOW cpu_to_le32(0xC000A011)</div><div class='del'>-#define STATUS_HOPLIMIT_EXCEEDED cpu_to_le32(0xC000A012)</div><div class='del'>-#define STATUS_PROTOCOL_NOT_SUPPORTED cpu_to_le32(0xC000A013)</div><div class='del'>-#define STATUS_LOST_WRITEBEHIND_DATA_NETWORK_DISCONNECTED	\</div><div class='del'>-	cpu_to_le32(0xC000A080)</div><div class='del'>-#define STATUS_LOST_WRITEBEHIND_DATA_NETWORK_SERVER_ERROR	\</div><div class='del'>-	cpu_to_le32(0xC000A081)</div><div class='del'>-#define STATUS_LOST_WRITEBEHIND_DATA_LOCAL_DISK_ERROR cpu_to_le32(0xC000A082)</div><div class='del'>-#define STATUS_XML_PARSE_ERROR cpu_to_le32(0xC000A083)</div><div class='del'>-#define STATUS_XMLDSIG_ERROR cpu_to_le32(0xC000A084)</div><div class='del'>-#define STATUS_WRONG_COMPARTMENT cpu_to_le32(0xC000A085)</div><div class='del'>-#define STATUS_AUTHIP_FAILURE cpu_to_le32(0xC000A086)</div><div class='del'>-#define DBG_NO_STATE_CHANGE cpu_to_le32(0xC0010001)</div><div class='del'>-#define DBG_APP_NOT_IDLE cpu_to_le32(0xC0010002)</div><div class='del'>-#define RPC_NT_INVALID_STRING_BINDING cpu_to_le32(0xC0020001)</div><div class='del'>-#define RPC_NT_WRONG_KIND_OF_BINDING cpu_to_le32(0xC0020002)</div><div class='del'>-#define RPC_NT_INVALID_BINDING cpu_to_le32(0xC0020003)</div><div class='del'>-#define RPC_NT_PROTSEQ_NOT_SUPPORTED cpu_to_le32(0xC0020004)</div><div class='del'>-#define RPC_NT_INVALID_RPC_PROTSEQ cpu_to_le32(0xC0020005)</div><div class='del'>-#define RPC_NT_INVALID_STRING_UUID cpu_to_le32(0xC0020006)</div><div class='del'>-#define RPC_NT_INVALID_ENDPOINT_FORMAT cpu_to_le32(0xC0020007)</div><div class='del'>-#define RPC_NT_INVALID_NET_ADDR cpu_to_le32(0xC0020008)</div><div class='del'>-#define RPC_NT_NO_ENDPOINT_FOUND cpu_to_le32(0xC0020009)</div><div class='del'>-#define RPC_NT_INVALID_TIMEOUT cpu_to_le32(0xC002000A)</div><div class='del'>-#define RPC_NT_OBJECT_NOT_FOUND cpu_to_le32(0xC002000B)</div><div class='del'>-#define RPC_NT_ALREADY_REGISTERED cpu_to_le32(0xC002000C)</div><div class='del'>-#define RPC_NT_TYPE_ALREADY_REGISTERED cpu_to_le32(0xC002000D)</div><div class='del'>-#define RPC_NT_ALREADY_LISTENING cpu_to_le32(0xC002000E)</div><div class='del'>-#define RPC_NT_NO_PROTSEQS_REGISTERED cpu_to_le32(0xC002000F)</div><div class='del'>-#define RPC_NT_NOT_LISTENING cpu_to_le32(0xC0020010)</div><div class='del'>-#define RPC_NT_UNKNOWN_MGR_TYPE cpu_to_le32(0xC0020011)</div><div class='del'>-#define RPC_NT_UNKNOWN_IF cpu_to_le32(0xC0020012)</div><div class='del'>-#define RPC_NT_NO_BINDINGS cpu_to_le32(0xC0020013)</div><div class='del'>-#define RPC_NT_NO_PROTSEQS cpu_to_le32(0xC0020014)</div><div class='del'>-#define RPC_NT_CANT_CREATE_ENDPOINT cpu_to_le32(0xC0020015)</div><div class='del'>-#define RPC_NT_OUT_OF_RESOURCES cpu_to_le32(0xC0020016)</div><div class='del'>-#define RPC_NT_SERVER_UNAVAILABLE cpu_to_le32(0xC0020017)</div><div class='del'>-#define RPC_NT_SERVER_TOO_BUSY cpu_to_le32(0xC0020018)</div><div class='del'>-#define RPC_NT_INVALID_NETWORK_OPTIONS cpu_to_le32(0xC0020019)</div><div class='del'>-#define RPC_NT_NO_CALL_ACTIVE cpu_to_le32(0xC002001A)</div><div class='del'>-#define RPC_NT_CALL_FAILED cpu_to_le32(0xC002001B)</div><div class='del'>-#define RPC_NT_CALL_FAILED_DNE cpu_to_le32(0xC002001C)</div><div class='del'>-#define RPC_NT_PROTOCOL_ERROR cpu_to_le32(0xC002001D)</div><div class='del'>-#define RPC_NT_UNSUPPORTED_TRANS_SYN cpu_to_le32(0xC002001F)</div><div class='del'>-#define RPC_NT_UNSUPPORTED_TYPE cpu_to_le32(0xC0020021)</div><div class='del'>-#define RPC_NT_INVALID_TAG cpu_to_le32(0xC0020022)</div><div class='del'>-#define RPC_NT_INVALID_BOUND cpu_to_le32(0xC0020023)</div><div class='del'>-#define RPC_NT_NO_ENTRY_NAME cpu_to_le32(0xC0020024)</div><div class='del'>-#define RPC_NT_INVALID_NAME_SYNTAX cpu_to_le32(0xC0020025)</div><div class='del'>-#define RPC_NT_UNSUPPORTED_NAME_SYNTAX cpu_to_le32(0xC0020026)</div><div class='del'>-#define RPC_NT_UUID_NO_ADDRESS cpu_to_le32(0xC0020028)</div><div class='del'>-#define RPC_NT_DUPLICATE_ENDPOINT cpu_to_le32(0xC0020029)</div><div class='del'>-#define RPC_NT_UNKNOWN_AUTHN_TYPE cpu_to_le32(0xC002002A)</div><div class='del'>-#define RPC_NT_MAX_CALLS_TOO_SMALL cpu_to_le32(0xC002002B)</div><div class='del'>-#define RPC_NT_STRING_TOO_LONG cpu_to_le32(0xC002002C)</div><div class='del'>-#define RPC_NT_PROTSEQ_NOT_FOUND cpu_to_le32(0xC002002D)</div><div class='del'>-#define RPC_NT_PROCNUM_OUT_OF_RANGE cpu_to_le32(0xC002002E)</div><div class='del'>-#define RPC_NT_BINDING_HAS_NO_AUTH cpu_to_le32(0xC002002F)</div><div class='del'>-#define RPC_NT_UNKNOWN_AUTHN_SERVICE cpu_to_le32(0xC0020030)</div><div class='del'>-#define RPC_NT_UNKNOWN_AUTHN_LEVEL cpu_to_le32(0xC0020031)</div><div class='del'>-#define RPC_NT_INVALID_AUTH_IDENTITY cpu_to_le32(0xC0020032)</div><div class='del'>-#define RPC_NT_UNKNOWN_AUTHZ_SERVICE cpu_to_le32(0xC0020033)</div><div class='del'>-#define EPT_NT_INVALID_ENTRY cpu_to_le32(0xC0020034)</div><div class='del'>-#define EPT_NT_CANT_PERFORM_OP cpu_to_le32(0xC0020035)</div><div class='del'>-#define EPT_NT_NOT_REGISTERED cpu_to_le32(0xC0020036)</div><div class='del'>-#define RPC_NT_NOTHING_TO_EXPORT cpu_to_le32(0xC0020037)</div><div class='del'>-#define RPC_NT_INCOMPLETE_NAME cpu_to_le32(0xC0020038)</div><div class='del'>-#define RPC_NT_INVALID_VERS_OPTION cpu_to_le32(0xC0020039)</div><div class='del'>-#define RPC_NT_NO_MORE_MEMBERS cpu_to_le32(0xC002003A)</div><div class='del'>-#define RPC_NT_NOT_ALL_OBJS_UNEXPORTED cpu_to_le32(0xC002003B)</div><div class='del'>-#define RPC_NT_INTERFACE_NOT_FOUND cpu_to_le32(0xC002003C)</div><div class='del'>-#define RPC_NT_ENTRY_ALREADY_EXISTS cpu_to_le32(0xC002003D)</div><div class='del'>-#define RPC_NT_ENTRY_NOT_FOUND cpu_to_le32(0xC002003E)</div><div class='del'>-#define RPC_NT_NAME_SERVICE_UNAVAILABLE cpu_to_le32(0xC002003F)</div><div class='del'>-#define RPC_NT_INVALID_NAF_ID cpu_to_le32(0xC0020040)</div><div class='del'>-#define RPC_NT_CANNOT_SUPPORT cpu_to_le32(0xC0020041)</div><div class='del'>-#define RPC_NT_NO_CONTEXT_AVAILABLE cpu_to_le32(0xC0020042)</div><div class='del'>-#define RPC_NT_INTERNAL_ERROR cpu_to_le32(0xC0020043)</div><div class='del'>-#define RPC_NT_ZERO_DIVIDE cpu_to_le32(0xC0020044)</div><div class='del'>-#define RPC_NT_ADDRESS_ERROR cpu_to_le32(0xC0020045)</div><div class='del'>-#define RPC_NT_FP_DIV_ZERO cpu_to_le32(0xC0020046)</div><div class='del'>-#define RPC_NT_FP_UNDERFLOW cpu_to_le32(0xC0020047)</div><div class='del'>-#define RPC_NT_FP_OVERFLOW cpu_to_le32(0xC0020048)</div><div class='del'>-#define RPC_NT_CALL_IN_PROGRESS cpu_to_le32(0xC0020049)</div><div class='del'>-#define RPC_NT_NO_MORE_BINDINGS cpu_to_le32(0xC002004A)</div><div class='del'>-#define RPC_NT_GROUP_MEMBER_NOT_FOUND cpu_to_le32(0xC002004B)</div><div class='del'>-#define EPT_NT_CANT_CREATE cpu_to_le32(0xC002004C)</div><div class='del'>-#define RPC_NT_INVALID_OBJECT cpu_to_le32(0xC002004D)</div><div class='del'>-#define RPC_NT_NO_INTERFACES cpu_to_le32(0xC002004F)</div><div class='del'>-#define RPC_NT_CALL_CANCELLED cpu_to_le32(0xC0020050)</div><div class='del'>-#define RPC_NT_BINDING_INCOMPLETE cpu_to_le32(0xC0020051)</div><div class='del'>-#define RPC_NT_COMM_FAILURE cpu_to_le32(0xC0020052)</div><div class='del'>-#define RPC_NT_UNSUPPORTED_AUTHN_LEVEL cpu_to_le32(0xC0020053)</div><div class='del'>-#define RPC_NT_NO_PRINC_NAME cpu_to_le32(0xC0020054)</div><div class='del'>-#define RPC_NT_NOT_RPC_ERROR cpu_to_le32(0xC0020055)</div><div class='del'>-#define RPC_NT_SEC_PKG_ERROR cpu_to_le32(0xC0020057)</div><div class='del'>-#define RPC_NT_NOT_CANCELLED cpu_to_le32(0xC0020058)</div><div class='del'>-#define RPC_NT_INVALID_ASYNC_HANDLE cpu_to_le32(0xC0020062)</div><div class='del'>-#define RPC_NT_INVALID_ASYNC_CALL cpu_to_le32(0xC0020063)</div><div class='del'>-#define RPC_NT_PROXY_ACCESS_DENIED cpu_to_le32(0xC0020064)</div><div class='del'>-#define RPC_NT_NO_MORE_ENTRIES cpu_to_le32(0xC0030001)</div><div class='del'>-#define RPC_NT_SS_CHAR_TRANS_OPEN_FAIL cpu_to_le32(0xC0030002)</div><div class='del'>-#define RPC_NT_SS_CHAR_TRANS_SHORT_FILE cpu_to_le32(0xC0030003)</div><div class='del'>-#define RPC_NT_SS_IN_NULL_CONTEXT cpu_to_le32(0xC0030004)</div><div class='del'>-#define RPC_NT_SS_CONTEXT_MISMATCH cpu_to_le32(0xC0030005)</div><div class='del'>-#define RPC_NT_SS_CONTEXT_DAMAGED cpu_to_le32(0xC0030006)</div><div class='del'>-#define RPC_NT_SS_HANDLES_MISMATCH cpu_to_le32(0xC0030007)</div><div class='del'>-#define RPC_NT_SS_CANNOT_GET_CALL_HANDLE cpu_to_le32(0xC0030008)</div><div class='del'>-#define RPC_NT_NULL_REF_POINTER cpu_to_le32(0xC0030009)</div><div class='del'>-#define RPC_NT_ENUM_VALUE_OUT_OF_RANGE cpu_to_le32(0xC003000A)</div><div class='del'>-#define RPC_NT_BYTE_COUNT_TOO_SMALL cpu_to_le32(0xC003000B)</div><div class='del'>-#define RPC_NT_BAD_STUB_DATA cpu_to_le32(0xC003000C)</div><div class='del'>-#define RPC_NT_INVALID_ES_ACTION cpu_to_le32(0xC0030059)</div><div class='del'>-#define RPC_NT_WRONG_ES_VERSION cpu_to_le32(0xC003005A)</div><div class='del'>-#define RPC_NT_WRONG_STUB_VERSION cpu_to_le32(0xC003005B)</div><div class='del'>-#define RPC_NT_INVALID_PIPE_OBJECT cpu_to_le32(0xC003005C)</div><div class='del'>-#define RPC_NT_INVALID_PIPE_OPERATION cpu_to_le32(0xC003005D)</div><div class='del'>-#define RPC_NT_WRONG_PIPE_VERSION cpu_to_le32(0xC003005E)</div><div class='del'>-#define RPC_NT_PIPE_CLOSED cpu_to_le32(0xC003005F)</div><div class='del'>-#define RPC_NT_PIPE_DISCIPLINE_ERROR cpu_to_le32(0xC0030060)</div><div class='del'>-#define RPC_NT_PIPE_EMPTY cpu_to_le32(0xC0030061)</div><div class='del'>-#define STATUS_PNP_BAD_MPS_TABLE cpu_to_le32(0xC0040035)</div><div class='del'>-#define STATUS_PNP_TRANSLATION_FAILED cpu_to_le32(0xC0040036)</div><div class='del'>-#define STATUS_PNP_IRQ_TRANSLATION_FAILED cpu_to_le32(0xC0040037)</div><div class='del'>-#define STATUS_PNP_INVALID_ID cpu_to_le32(0xC0040038)</div><div class='del'>-#define STATUS_IO_REISSUE_AS_CACHED cpu_to_le32(0xC0040039)</div><div class='del'>-#define STATUS_CTX_WINSTATION_NAME_INVALID cpu_to_le32(0xC00A0001)</div><div class='del'>-#define STATUS_CTX_INVALID_PD cpu_to_le32(0xC00A0002)</div><div class='del'>-#define STATUS_CTX_PD_NOT_FOUND cpu_to_le32(0xC00A0003)</div><div class='del'>-#define STATUS_CTX_CLOSE_PENDING cpu_to_le32(0xC00A0006)</div><div class='del'>-#define STATUS_CTX_NO_OUTBUF cpu_to_le32(0xC00A0007)</div><div class='del'>-#define STATUS_CTX_MODEM_INF_NOT_FOUND cpu_to_le32(0xC00A0008)</div><div class='del'>-#define STATUS_CTX_INVALID_MODEMNAME cpu_to_le32(0xC00A0009)</div><div class='del'>-#define STATUS_CTX_RESPONSE_ERROR cpu_to_le32(0xC00A000A)</div><div class='del'>-#define STATUS_CTX_MODEM_RESPONSE_TIMEOUT cpu_to_le32(0xC00A000B)</div><div class='del'>-#define STATUS_CTX_MODEM_RESPONSE_NO_CARRIER cpu_to_le32(0xC00A000C)</div><div class='del'>-#define STATUS_CTX_MODEM_RESPONSE_NO_DIALTONE cpu_to_le32(0xC00A000D)</div><div class='del'>-#define STATUS_CTX_MODEM_RESPONSE_BUSY cpu_to_le32(0xC00A000E)</div><div class='del'>-#define STATUS_CTX_MODEM_RESPONSE_VOICE cpu_to_le32(0xC00A000F)</div><div class='del'>-#define STATUS_CTX_TD_ERROR cpu_to_le32(0xC00A0010)</div><div class='del'>-#define STATUS_CTX_LICENSE_CLIENT_INVALID cpu_to_le32(0xC00A0012)</div><div class='del'>-#define STATUS_CTX_LICENSE_NOT_AVAILABLE cpu_to_le32(0xC00A0013)</div><div class='del'>-#define STATUS_CTX_LICENSE_EXPIRED cpu_to_le32(0xC00A0014)</div><div class='del'>-#define STATUS_CTX_WINSTATION_NOT_FOUND cpu_to_le32(0xC00A0015)</div><div class='del'>-#define STATUS_CTX_WINSTATION_NAME_COLLISION cpu_to_le32(0xC00A0016)</div><div class='del'>-#define STATUS_CTX_WINSTATION_BUSY cpu_to_le32(0xC00A0017)</div><div class='del'>-#define STATUS_CTX_BAD_VIDEO_MODE cpu_to_le32(0xC00A0018)</div><div class='del'>-#define STATUS_CTX_GRAPHICS_INVALID cpu_to_le32(0xC00A0022)</div><div class='del'>-#define STATUS_CTX_NOT_CONSOLE cpu_to_le32(0xC00A0024)</div><div class='del'>-#define STATUS_CTX_CLIENT_QUERY_TIMEOUT cpu_to_le32(0xC00A0026)</div><div class='del'>-#define STATUS_CTX_CONSOLE_DISCONNECT cpu_to_le32(0xC00A0027)</div><div class='del'>-#define STATUS_CTX_CONSOLE_CONNECT cpu_to_le32(0xC00A0028)</div><div class='del'>-#define STATUS_CTX_SHADOW_DENIED cpu_to_le32(0xC00A002A)</div><div class='del'>-#define STATUS_CTX_WINSTATION_ACCESS_DENIED cpu_to_le32(0xC00A002B)</div><div class='del'>-#define STATUS_CTX_INVALID_WD cpu_to_le32(0xC00A002E)</div><div class='del'>-#define STATUS_CTX_WD_NOT_FOUND cpu_to_le32(0xC00A002F)</div><div class='del'>-#define STATUS_CTX_SHADOW_INVALID cpu_to_le32(0xC00A0030)</div><div class='del'>-#define STATUS_CTX_SHADOW_DISABLED cpu_to_le32(0xC00A0031)</div><div class='del'>-#define STATUS_RDP_PROTOCOL_ERROR cpu_to_le32(0xC00A0032)</div><div class='del'>-#define STATUS_CTX_CLIENT_LICENSE_NOT_SET cpu_to_le32(0xC00A0033)</div><div class='del'>-#define STATUS_CTX_CLIENT_LICENSE_IN_USE cpu_to_le32(0xC00A0034)</div><div class='del'>-#define STATUS_CTX_SHADOW_ENDED_BY_MODE_CHANGE cpu_to_le32(0xC00A0035)</div><div class='del'>-#define STATUS_CTX_SHADOW_NOT_RUNNING cpu_to_le32(0xC00A0036)</div><div class='del'>-#define STATUS_CTX_LOGON_DISABLED cpu_to_le32(0xC00A0037)</div><div class='del'>-#define STATUS_CTX_SECURITY_LAYER_ERROR cpu_to_le32(0xC00A0038)</div><div class='del'>-#define STATUS_TS_INCOMPATIBLE_SESSIONS cpu_to_le32(0xC00A0039)</div><div class='del'>-#define STATUS_MUI_FILE_NOT_FOUND cpu_to_le32(0xC00B0001)</div><div class='del'>-#define STATUS_MUI_INVALID_FILE cpu_to_le32(0xC00B0002)</div><div class='del'>-#define STATUS_MUI_INVALID_RC_CONFIG cpu_to_le32(0xC00B0003)</div><div class='del'>-#define STATUS_MUI_INVALID_LOCALE_NAME cpu_to_le32(0xC00B0004)</div><div class='del'>-#define STATUS_MUI_INVALID_ULTIMATEFALLBACK_NAME cpu_to_le32(0xC00B0005)</div><div class='del'>-#define STATUS_MUI_FILE_NOT_LOADED cpu_to_le32(0xC00B0006)</div><div class='del'>-#define STATUS_RESOURCE_ENUM_USER_STOP cpu_to_le32(0xC00B0007)</div><div class='del'>-#define STATUS_CLUSTER_INVALID_NODE cpu_to_le32(0xC0130001)</div><div class='del'>-#define STATUS_CLUSTER_NODE_EXISTS cpu_to_le32(0xC0130002)</div><div class='del'>-#define STATUS_CLUSTER_JOIN_IN_PROGRESS cpu_to_le32(0xC0130003)</div><div class='del'>-#define STATUS_CLUSTER_NODE_NOT_FOUND cpu_to_le32(0xC0130004)</div><div class='del'>-#define STATUS_CLUSTER_LOCAL_NODE_NOT_FOUND cpu_to_le32(0xC0130005)</div><div class='del'>-#define STATUS_CLUSTER_NETWORK_EXISTS cpu_to_le32(0xC0130006)</div><div class='del'>-#define STATUS_CLUSTER_NETWORK_NOT_FOUND cpu_to_le32(0xC0130007)</div><div class='del'>-#define STATUS_CLUSTER_NETINTERFACE_EXISTS cpu_to_le32(0xC0130008)</div><div class='del'>-#define STATUS_CLUSTER_NETINTERFACE_NOT_FOUND cpu_to_le32(0xC0130009)</div><div class='del'>-#define STATUS_CLUSTER_INVALID_REQUEST cpu_to_le32(0xC013000A)</div><div class='del'>-#define STATUS_CLUSTER_INVALID_NETWORK_PROVIDER cpu_to_le32(0xC013000B)</div><div class='del'>-#define STATUS_CLUSTER_NODE_DOWN cpu_to_le32(0xC013000C)</div><div class='del'>-#define STATUS_CLUSTER_NODE_UNREACHABLE cpu_to_le32(0xC013000D)</div><div class='del'>-#define STATUS_CLUSTER_NODE_NOT_MEMBER cpu_to_le32(0xC013000E)</div><div class='del'>-#define STATUS_CLUSTER_JOIN_NOT_IN_PROGRESS cpu_to_le32(0xC013000F)</div><div class='del'>-#define STATUS_CLUSTER_INVALID_NETWORK cpu_to_le32(0xC0130010)</div><div class='del'>-#define STATUS_CLUSTER_NO_NET_ADAPTERS cpu_to_le32(0xC0130011)</div><div class='del'>-#define STATUS_CLUSTER_NODE_UP cpu_to_le32(0xC0130012)</div><div class='del'>-#define STATUS_CLUSTER_NODE_PAUSED cpu_to_le32(0xC0130013)</div><div class='del'>-#define STATUS_CLUSTER_NODE_NOT_PAUSED cpu_to_le32(0xC0130014)</div><div class='del'>-#define STATUS_CLUSTER_NO_SECURITY_CONTEXT cpu_to_le32(0xC0130015)</div><div class='del'>-#define STATUS_CLUSTER_NETWORK_NOT_INTERNAL cpu_to_le32(0xC0130016)</div><div class='del'>-#define STATUS_CLUSTER_POISONED cpu_to_le32(0xC0130017)</div><div class='del'>-#define STATUS_ACPI_INVALID_OPCODE cpu_to_le32(0xC0140001)</div><div class='del'>-#define STATUS_ACPI_STACK_OVERFLOW cpu_to_le32(0xC0140002)</div><div class='del'>-#define STATUS_ACPI_ASSERT_FAILED cpu_to_le32(0xC0140003)</div><div class='del'>-#define STATUS_ACPI_INVALID_INDEX cpu_to_le32(0xC0140004)</div><div class='del'>-#define STATUS_ACPI_INVALID_ARGUMENT cpu_to_le32(0xC0140005)</div><div class='del'>-#define STATUS_ACPI_FATAL cpu_to_le32(0xC0140006)</div><div class='del'>-#define STATUS_ACPI_INVALID_SUPERNAME cpu_to_le32(0xC0140007)</div><div class='del'>-#define STATUS_ACPI_INVALID_ARGTYPE cpu_to_le32(0xC0140008)</div><div class='del'>-#define STATUS_ACPI_INVALID_OBJTYPE cpu_to_le32(0xC0140009)</div><div class='del'>-#define STATUS_ACPI_INVALID_TARGETTYPE cpu_to_le32(0xC014000A)</div><div class='del'>-#define STATUS_ACPI_INCORRECT_ARGUMENT_COUNT cpu_to_le32(0xC014000B)</div><div class='del'>-#define STATUS_ACPI_ADDRESS_NOT_MAPPED cpu_to_le32(0xC014000C)</div><div class='del'>-#define STATUS_ACPI_INVALID_EVENTTYPE cpu_to_le32(0xC014000D)</div><div class='del'>-#define STATUS_ACPI_HANDLER_COLLISION cpu_to_le32(0xC014000E)</div><div class='del'>-#define STATUS_ACPI_INVALID_DATA cpu_to_le32(0xC014000F)</div><div class='del'>-#define STATUS_ACPI_INVALID_REGION cpu_to_le32(0xC0140010)</div><div class='del'>-#define STATUS_ACPI_INVALID_ACCESS_SIZE cpu_to_le32(0xC0140011)</div><div class='del'>-#define STATUS_ACPI_ACQUIRE_GLOBAL_LOCK cpu_to_le32(0xC0140012)</div><div class='del'>-#define STATUS_ACPI_ALREADY_INITIALIZED cpu_to_le32(0xC0140013)</div><div class='del'>-#define STATUS_ACPI_NOT_INITIALIZED cpu_to_le32(0xC0140014)</div><div class='del'>-#define STATUS_ACPI_INVALID_MUTEX_LEVEL cpu_to_le32(0xC0140015)</div><div class='del'>-#define STATUS_ACPI_MUTEX_NOT_OWNED cpu_to_le32(0xC0140016)</div><div class='del'>-#define STATUS_ACPI_MUTEX_NOT_OWNER cpu_to_le32(0xC0140017)</div><div class='del'>-#define STATUS_ACPI_RS_ACCESS cpu_to_le32(0xC0140018)</div><div class='del'>-#define STATUS_ACPI_INVALID_TABLE cpu_to_le32(0xC0140019)</div><div class='del'>-#define STATUS_ACPI_REG_HANDLER_FAILED cpu_to_le32(0xC0140020)</div><div class='del'>-#define STATUS_ACPI_POWER_REQUEST_FAILED cpu_to_le32(0xC0140021)</div><div class='del'>-#define STATUS_SXS_SECTION_NOT_FOUND cpu_to_le32(0xC0150001)</div><div class='del'>-#define STATUS_SXS_CANT_GEN_ACTCTX cpu_to_le32(0xC0150002)</div><div class='del'>-#define STATUS_SXS_INVALID_ACTCTXDATA_FORMAT cpu_to_le32(0xC0150003)</div><div class='del'>-#define STATUS_SXS_ASSEMBLY_NOT_FOUND cpu_to_le32(0xC0150004)</div><div class='del'>-#define STATUS_SXS_MANIFEST_FORMAT_ERROR cpu_to_le32(0xC0150005)</div><div class='del'>-#define STATUS_SXS_MANIFEST_PARSE_ERROR cpu_to_le32(0xC0150006)</div><div class='del'>-#define STATUS_SXS_ACTIVATION_CONTEXT_DISABLED cpu_to_le32(0xC0150007)</div><div class='del'>-#define STATUS_SXS_KEY_NOT_FOUND cpu_to_le32(0xC0150008)</div><div class='del'>-#define STATUS_SXS_VERSION_CONFLICT cpu_to_le32(0xC0150009)</div><div class='del'>-#define STATUS_SXS_WRONG_SECTION_TYPE cpu_to_le32(0xC015000A)</div><div class='del'>-#define STATUS_SXS_THREAD_QUERIES_DISABLED cpu_to_le32(0xC015000B)</div><div class='del'>-#define STATUS_SXS_ASSEMBLY_MISSING cpu_to_le32(0xC015000C)</div><div class='del'>-#define STATUS_SXS_PROCESS_DEFAULT_ALREADY_SET cpu_to_le32(0xC015000E)</div><div class='del'>-#define STATUS_SXS_EARLY_DEACTIVATION cpu_to_le32(0xC015000F)</div><div class='del'>-#define STATUS_SXS_INVALID_DEACTIVATION cpu_to_le32(0xC0150010)</div><div class='del'>-#define STATUS_SXS_MULTIPLE_DEACTIVATION cpu_to_le32(0xC0150011)</div><div class='del'>-#define STATUS_SXS_SYSTEM_DEFAULT_ACTIVATION_CONTEXT_EMPTY	\</div><div class='del'>-	cpu_to_le32(0xC0150012)</div><div class='del'>-#define STATUS_SXS_PROCESS_TERMINATION_REQUESTED cpu_to_le32(0xC0150013)</div><div class='del'>-#define STATUS_SXS_CORRUPT_ACTIVATION_STACK cpu_to_le32(0xC0150014)</div><div class='del'>-#define STATUS_SXS_CORRUPTION cpu_to_le32(0xC0150015)</div><div class='del'>-#define STATUS_SXS_INVALID_IDENTITY_ATTRIBUTE_VALUE cpu_to_le32(0xC0150016)</div><div class='del'>-#define STATUS_SXS_INVALID_IDENTITY_ATTRIBUTE_NAME cpu_to_le32(0xC0150017)</div><div class='del'>-#define STATUS_SXS_IDENTITY_DUPLICATE_ATTRIBUTE cpu_to_le32(0xC0150018)</div><div class='del'>-#define STATUS_SXS_IDENTITY_PARSE_ERROR cpu_to_le32(0xC0150019)</div><div class='del'>-#define STATUS_SXS_COMPONENT_STORE_CORRUPT cpu_to_le32(0xC015001A)</div><div class='del'>-#define STATUS_SXS_FILE_HASH_MISMATCH cpu_to_le32(0xC015001B)</div><div class='del'>-#define STATUS_SXS_MANIFEST_IDENTITY_SAME_BUT_CONTENTS_DIFFERENT	\</div><div class='del'>-	cpu_to_le32(0xC015001C)</div><div class='del'>-#define STATUS_SXS_IDENTITIES_DIFFERENT cpu_to_le32(0xC015001D)</div><div class='del'>-#define STATUS_SXS_ASSEMBLY_IS_NOT_A_DEPLOYMENT cpu_to_le32(0xC015001E)</div><div class='del'>-#define STATUS_SXS_FILE_NOT_PART_OF_ASSEMBLY cpu_to_le32(0xC015001F)</div><div class='del'>-#define STATUS_ADVANCED_INSTALLER_FAILED cpu_to_le32(0xC0150020)</div><div class='del'>-#define STATUS_XML_ENCODING_MISMATCH cpu_to_le32(0xC0150021)</div><div class='del'>-#define STATUS_SXS_MANIFEST_TOO_BIG cpu_to_le32(0xC0150022)</div><div class='del'>-#define STATUS_SXS_SETTING_NOT_REGISTERED cpu_to_le32(0xC0150023)</div><div class='del'>-#define STATUS_SXS_TRANSACTION_CLOSURE_INCOMPLETE cpu_to_le32(0xC0150024)</div><div class='del'>-#define STATUS_SMI_PRIMITIVE_INSTALLER_FAILED cpu_to_le32(0xC0150025)</div><div class='del'>-#define STATUS_GENERIC_COMMAND_FAILED cpu_to_le32(0xC0150026)</div><div class='del'>-#define STATUS_SXS_FILE_HASH_MISSING cpu_to_le32(0xC0150027)</div><div class='del'>-#define STATUS_TRANSACTIONAL_CONFLICT cpu_to_le32(0xC0190001)</div><div class='del'>-#define STATUS_INVALID_TRANSACTION cpu_to_le32(0xC0190002)</div><div class='del'>-#define STATUS_TRANSACTION_NOT_ACTIVE cpu_to_le32(0xC0190003)</div><div class='del'>-#define STATUS_TM_INITIALIZATION_FAILED cpu_to_le32(0xC0190004)</div><div class='del'>-#define STATUS_RM_NOT_ACTIVE cpu_to_le32(0xC0190005)</div><div class='del'>-#define STATUS_RM_METADATA_CORRUPT cpu_to_le32(0xC0190006)</div><div class='del'>-#define STATUS_TRANSACTION_NOT_JOINED cpu_to_le32(0xC0190007)</div><div class='del'>-#define STATUS_DIRECTORY_NOT_RM cpu_to_le32(0xC0190008)</div><div class='del'>-#define STATUS_TRANSACTIONS_UNSUPPORTED_REMOTE cpu_to_le32(0xC019000A)</div><div class='del'>-#define STATUS_LOG_RESIZE_INVALID_SIZE cpu_to_le32(0xC019000B)</div><div class='del'>-#define STATUS_REMOTE_FILE_VERSION_MISMATCH cpu_to_le32(0xC019000C)</div><div class='del'>-#define STATUS_CRM_PROTOCOL_ALREADY_EXISTS cpu_to_le32(0xC019000F)</div><div class='del'>-#define STATUS_TRANSACTION_PROPAGATION_FAILED cpu_to_le32(0xC0190010)</div><div class='del'>-#define STATUS_CRM_PROTOCOL_NOT_FOUND cpu_to_le32(0xC0190011)</div><div class='del'>-#define STATUS_TRANSACTION_SUPERIOR_EXISTS cpu_to_le32(0xC0190012)</div><div class='del'>-#define STATUS_TRANSACTION_REQUEST_NOT_VALID cpu_to_le32(0xC0190013)</div><div class='del'>-#define STATUS_TRANSACTION_NOT_REQUESTED cpu_to_le32(0xC0190014)</div><div class='del'>-#define STATUS_TRANSACTION_ALREADY_ABORTED cpu_to_le32(0xC0190015)</div><div class='del'>-#define STATUS_TRANSACTION_ALREADY_COMMITTED cpu_to_le32(0xC0190016)</div><div class='del'>-#define STATUS_TRANSACTION_INVALID_MARSHALL_BUFFER cpu_to_le32(0xC0190017)</div><div class='del'>-#define STATUS_CURRENT_TRANSACTION_NOT_VALID cpu_to_le32(0xC0190018)</div><div class='del'>-#define STATUS_LOG_GROWTH_FAILED cpu_to_le32(0xC0190019)</div><div class='del'>-#define STATUS_OBJECT_NO_LONGER_EXISTS cpu_to_le32(0xC0190021)</div><div class='del'>-#define STATUS_STREAM_MINIVERSION_NOT_FOUND cpu_to_le32(0xC0190022)</div><div class='del'>-#define STATUS_STREAM_MINIVERSION_NOT_VALID cpu_to_le32(0xC0190023)</div><div class='del'>-#define STATUS_MINIVERSION_INACCESSIBLE_FROM_SPECIFIED_TRANSACTION	\</div><div class='del'>-	cpu_to_le32(0xC0190024)</div><div class='del'>-#define STATUS_CANT_OPEN_MINIVERSION_WITH_MODIFY_INTENT cpu_to_le32(0xC0190025)</div><div class='del'>-#define STATUS_CANT_CREATE_MORE_STREAM_MINIVERSIONS cpu_to_le32(0xC0190026)</div><div class='del'>-#define STATUS_HANDLE_NO_LONGER_VALID cpu_to_le32(0xC0190028)</div><div class='del'>-#define STATUS_LOG_CORRUPTION_DETECTED cpu_to_le32(0xC0190030)</div><div class='del'>-#define STATUS_RM_DISCONNECTED cpu_to_le32(0xC0190032)</div><div class='del'>-#define STATUS_ENLISTMENT_NOT_SUPERIOR cpu_to_le32(0xC0190033)</div><div class='del'>-#define STATUS_FILE_IDENTITY_NOT_PERSISTENT cpu_to_le32(0xC0190036)</div><div class='del'>-#define STATUS_CANT_BREAK_TRANSACTIONAL_DEPENDENCY cpu_to_le32(0xC0190037)</div><div class='del'>-#define STATUS_CANT_CROSS_RM_BOUNDARY cpu_to_le32(0xC0190038)</div><div class='del'>-#define STATUS_TXF_DIR_NOT_EMPTY cpu_to_le32(0xC0190039)</div><div class='del'>-#define STATUS_INDOUBT_TRANSACTIONS_EXIST cpu_to_le32(0xC019003A)</div><div class='del'>-#define STATUS_TM_VOLATILE cpu_to_le32(0xC019003B)</div><div class='del'>-#define STATUS_ROLLBACK_TIMER_EXPIRED cpu_to_le32(0xC019003C)</div><div class='del'>-#define STATUS_TXF_ATTRIBUTE_CORRUPT cpu_to_le32(0xC019003D)</div><div class='del'>-#define STATUS_EFS_NOT_ALLOWED_IN_TRANSACTION cpu_to_le32(0xC019003E)</div><div class='del'>-#define STATUS_TRANSACTIONAL_OPEN_NOT_ALLOWED cpu_to_le32(0xC019003F)</div><div class='del'>-#define STATUS_TRANSACTED_MAPPING_UNSUPPORTED_REMOTE cpu_to_le32(0xC0190040)</div><div class='del'>-#define STATUS_TRANSACTION_REQUIRED_PROMOTION cpu_to_le32(0xC0190043)</div><div class='del'>-#define STATUS_CANNOT_EXECUTE_FILE_IN_TRANSACTION cpu_to_le32(0xC0190044)</div><div class='del'>-#define STATUS_TRANSACTIONS_NOT_FROZEN cpu_to_le32(0xC0190045)</div><div class='del'>-#define STATUS_TRANSACTION_FREEZE_IN_PROGRESS cpu_to_le32(0xC0190046)</div><div class='del'>-#define STATUS_NOT_SNAPSHOT_VOLUME cpu_to_le32(0xC0190047)</div><div class='del'>-#define STATUS_NO_SAVEPOINT_WITH_OPEN_FILES cpu_to_le32(0xC0190048)</div><div class='del'>-#define STATUS_SPARSE_NOT_ALLOWED_IN_TRANSACTION cpu_to_le32(0xC0190049)</div><div class='del'>-#define STATUS_TM_IDENTITY_MISMATCH cpu_to_le32(0xC019004A)</div><div class='del'>-#define STATUS_FLOATED_SECTION cpu_to_le32(0xC019004B)</div><div class='del'>-#define STATUS_CANNOT_ACCEPT_TRANSACTED_WORK cpu_to_le32(0xC019004C)</div><div class='del'>-#define STATUS_CANNOT_ABORT_TRANSACTIONS cpu_to_le32(0xC019004D)</div><div class='del'>-#define STATUS_TRANSACTION_NOT_FOUND cpu_to_le32(0xC019004E)</div><div class='del'>-#define STATUS_RESOURCEMANAGER_NOT_FOUND cpu_to_le32(0xC019004F)</div><div class='del'>-#define STATUS_ENLISTMENT_NOT_FOUND cpu_to_le32(0xC0190050)</div><div class='del'>-#define STATUS_TRANSACTIONMANAGER_NOT_FOUND cpu_to_le32(0xC0190051)</div><div class='del'>-#define STATUS_TRANSACTIONMANAGER_NOT_ONLINE cpu_to_le32(0xC0190052)</div><div class='del'>-#define STATUS_TRANSACTIONMANAGER_RECOVERY_NAME_COLLISION	\</div><div class='del'>-	cpu_to_le32(0xC0190053)</div><div class='del'>-#define STATUS_TRANSACTION_NOT_ROOT cpu_to_le32(0xC0190054)</div><div class='del'>-#define STATUS_TRANSACTION_OBJECT_EXPIRED cpu_to_le32(0xC0190055)</div><div class='del'>-#define STATUS_COMPRESSION_NOT_ALLOWED_IN_TRANSACTION cpu_to_le32(0xC0190056)</div><div class='del'>-#define STATUS_TRANSACTION_RESPONSE_NOT_ENLISTED cpu_to_le32(0xC0190057)</div><div class='del'>-#define STATUS_TRANSACTION_RECORD_TOO_LONG cpu_to_le32(0xC0190058)</div><div class='del'>-#define STATUS_NO_LINK_TRACKING_IN_TRANSACTION cpu_to_le32(0xC0190059)</div><div class='del'>-#define STATUS_OPERATION_NOT_SUPPORTED_IN_TRANSACTION cpu_to_le32(0xC019005A)</div><div class='del'>-#define STATUS_TRANSACTION_INTEGRITY_VIOLATED cpu_to_le32(0xC019005B)</div><div class='del'>-#define STATUS_LOG_SECTOR_INVALID cpu_to_le32(0xC01A0001)</div><div class='del'>-#define STATUS_LOG_SECTOR_PARITY_INVALID cpu_to_le32(0xC01A0002)</div><div class='del'>-#define STATUS_LOG_SECTOR_REMAPPED cpu_to_le32(0xC01A0003)</div><div class='del'>-#define STATUS_LOG_BLOCK_INCOMPLETE cpu_to_le32(0xC01A0004)</div><div class='del'>-#define STATUS_LOG_INVALID_RANGE cpu_to_le32(0xC01A0005)</div><div class='del'>-#define STATUS_LOG_BLOCKS_EXHAUSTED cpu_to_le32(0xC01A0006)</div><div class='del'>-#define STATUS_LOG_READ_CONTEXT_INVALID cpu_to_le32(0xC01A0007)</div><div class='del'>-#define STATUS_LOG_RESTART_INVALID cpu_to_le32(0xC01A0008)</div><div class='del'>-#define STATUS_LOG_BLOCK_VERSION cpu_to_le32(0xC01A0009)</div><div class='del'>-#define STATUS_LOG_BLOCK_INVALID cpu_to_le32(0xC01A000A)</div><div class='del'>-#define STATUS_LOG_READ_MODE_INVALID cpu_to_le32(0xC01A000B)</div><div class='del'>-#define STATUS_LOG_METADATA_CORRUPT cpu_to_le32(0xC01A000D)</div><div class='del'>-#define STATUS_LOG_METADATA_INVALID cpu_to_le32(0xC01A000E)</div><div class='del'>-#define STATUS_LOG_METADATA_INCONSISTENT cpu_to_le32(0xC01A000F)</div><div class='del'>-#define STATUS_LOG_RESERVATION_INVALID cpu_to_le32(0xC01A0010)</div><div class='del'>-#define STATUS_LOG_CANT_DELETE cpu_to_le32(0xC01A0011)</div><div class='del'>-#define STATUS_LOG_CONTAINER_LIMIT_EXCEEDED cpu_to_le32(0xC01A0012)</div><div class='del'>-#define STATUS_LOG_START_OF_LOG cpu_to_le32(0xC01A0013)</div><div class='del'>-#define STATUS_LOG_POLICY_ALREADY_INSTALLED cpu_to_le32(0xC01A0014)</div><div class='del'>-#define STATUS_LOG_POLICY_NOT_INSTALLED cpu_to_le32(0xC01A0015)</div><div class='del'>-#define STATUS_LOG_POLICY_INVALID cpu_to_le32(0xC01A0016)</div><div class='del'>-#define STATUS_LOG_POLICY_CONFLICT cpu_to_le32(0xC01A0017)</div><div class='del'>-#define STATUS_LOG_PINNED_ARCHIVE_TAIL cpu_to_le32(0xC01A0018)</div><div class='del'>-#define STATUS_LOG_RECORD_NONEXISTENT cpu_to_le32(0xC01A0019)</div><div class='del'>-#define STATUS_LOG_RECORDS_RESERVED_INVALID cpu_to_le32(0xC01A001A)</div><div class='del'>-#define STATUS_LOG_SPACE_RESERVED_INVALID cpu_to_le32(0xC01A001B)</div><div class='del'>-#define STATUS_LOG_TAIL_INVALID cpu_to_le32(0xC01A001C)</div><div class='del'>-#define STATUS_LOG_FULL cpu_to_le32(0xC01A001D)</div><div class='del'>-#define STATUS_LOG_MULTIPLEXED cpu_to_le32(0xC01A001E)</div><div class='del'>-#define STATUS_LOG_DEDICATED cpu_to_le32(0xC01A001F)</div><div class='del'>-#define STATUS_LOG_ARCHIVE_NOT_IN_PROGRESS cpu_to_le32(0xC01A0020)</div><div class='del'>-#define STATUS_LOG_ARCHIVE_IN_PROGRESS cpu_to_le32(0xC01A0021)</div><div class='del'>-#define STATUS_LOG_EPHEMERAL cpu_to_le32(0xC01A0022)</div><div class='del'>-#define STATUS_LOG_NOT_ENOUGH_CONTAINERS cpu_to_le32(0xC01A0023)</div><div class='del'>-#define STATUS_LOG_CLIENT_ALREADY_REGISTERED cpu_to_le32(0xC01A0024)</div><div class='del'>-#define STATUS_LOG_CLIENT_NOT_REGISTERED cpu_to_le32(0xC01A0025)</div><div class='del'>-#define STATUS_LOG_FULL_HANDLER_IN_PROGRESS cpu_to_le32(0xC01A0026)</div><div class='del'>-#define STATUS_LOG_CONTAINER_READ_FAILED cpu_to_le32(0xC01A0027)</div><div class='del'>-#define STATUS_LOG_CONTAINER_WRITE_FAILED cpu_to_le32(0xC01A0028)</div><div class='del'>-#define STATUS_LOG_CONTAINER_OPEN_FAILED cpu_to_le32(0xC01A0029)</div><div class='del'>-#define STATUS_LOG_CONTAINER_STATE_INVALID cpu_to_le32(0xC01A002A)</div><div class='del'>-#define STATUS_LOG_STATE_INVALID cpu_to_le32(0xC01A002B)</div><div class='del'>-#define STATUS_LOG_PINNED cpu_to_le32(0xC01A002C)</div><div class='del'>-#define STATUS_LOG_METADATA_FLUSH_FAILED cpu_to_le32(0xC01A002D)</div><div class='del'>-#define STATUS_LOG_INCONSISTENT_SECURITY cpu_to_le32(0xC01A002E)</div><div class='del'>-#define STATUS_LOG_APPENDED_FLUSH_FAILED cpu_to_le32(0xC01A002F)</div><div class='del'>-#define STATUS_LOG_PINNED_RESERVATION cpu_to_le32(0xC01A0030)</div><div class='del'>-#define STATUS_VIDEO_HUNG_DISPLAY_DRIVER_THREAD cpu_to_le32(0xC01B00EA)</div><div class='del'>-#define STATUS_FLT_NO_HANDLER_DEFINED cpu_to_le32(0xC01C0001)</div><div class='del'>-#define STATUS_FLT_CONTEXT_ALREADY_DEFINED cpu_to_le32(0xC01C0002)</div><div class='del'>-#define STATUS_FLT_INVALID_ASYNCHRONOUS_REQUEST cpu_to_le32(0xC01C0003)</div><div class='del'>-#define STATUS_FLT_DISALLOW_FAST_IO cpu_to_le32(0xC01C0004)</div><div class='del'>-#define STATUS_FLT_INVALID_NAME_REQUEST cpu_to_le32(0xC01C0005)</div><div class='del'>-#define STATUS_FLT_NOT_SAFE_TO_POST_OPERATION cpu_to_le32(0xC01C0006)</div><div class='del'>-#define STATUS_FLT_NOT_INITIALIZED cpu_to_le32(0xC01C0007)</div><div class='del'>-#define STATUS_FLT_FILTER_NOT_READY cpu_to_le32(0xC01C0008)</div><div class='del'>-#define STATUS_FLT_POST_OPERATION_CLEANUP cpu_to_le32(0xC01C0009)</div><div class='del'>-#define STATUS_FLT_INTERNAL_ERROR cpu_to_le32(0xC01C000A)</div><div class='del'>-#define STATUS_FLT_DELETING_OBJECT cpu_to_le32(0xC01C000B)</div><div class='del'>-#define STATUS_FLT_MUST_BE_NONPAGED_POOL cpu_to_le32(0xC01C000C)</div><div class='del'>-#define STATUS_FLT_DUPLICATE_ENTRY cpu_to_le32(0xC01C000D)</div><div class='del'>-#define STATUS_FLT_CBDQ_DISABLED cpu_to_le32(0xC01C000E)</div><div class='del'>-#define STATUS_FLT_DO_NOT_ATTACH cpu_to_le32(0xC01C000F)</div><div class='del'>-#define STATUS_FLT_DO_NOT_DETACH cpu_to_le32(0xC01C0010)</div><div class='del'>-#define STATUS_FLT_INSTANCE_ALTITUDE_COLLISION cpu_to_le32(0xC01C0011)</div><div class='del'>-#define STATUS_FLT_INSTANCE_NAME_COLLISION cpu_to_le32(0xC01C0012)</div><div class='del'>-#define STATUS_FLT_FILTER_NOT_FOUND cpu_to_le32(0xC01C0013)</div><div class='del'>-#define STATUS_FLT_VOLUME_NOT_FOUND cpu_to_le32(0xC01C0014)</div><div class='del'>-#define STATUS_FLT_INSTANCE_NOT_FOUND cpu_to_le32(0xC01C0015)</div><div class='del'>-#define STATUS_FLT_CONTEXT_ALLOCATION_NOT_FOUND cpu_to_le32(0xC01C0016)</div><div class='del'>-#define STATUS_FLT_INVALID_CONTEXT_REGISTRATION cpu_to_le32(0xC01C0017)</div><div class='del'>-#define STATUS_FLT_NAME_CACHE_MISS cpu_to_le32(0xC01C0018)</div><div class='del'>-#define STATUS_FLT_NO_DEVICE_OBJECT cpu_to_le32(0xC01C0019)</div><div class='del'>-#define STATUS_FLT_VOLUME_ALREADY_MOUNTED cpu_to_le32(0xC01C001A)</div><div class='del'>-#define STATUS_FLT_ALREADY_ENLISTED cpu_to_le32(0xC01C001B)</div><div class='del'>-#define STATUS_FLT_CONTEXT_ALREADY_LINKED cpu_to_le32(0xC01C001C)</div><div class='del'>-#define STATUS_FLT_NO_WAITER_FOR_REPLY cpu_to_le32(0xC01C0020)</div><div class='del'>-#define STATUS_MONITOR_NO_DESCRIPTOR cpu_to_le32(0xC01D0001)</div><div class='del'>-#define STATUS_MONITOR_UNKNOWN_DESCRIPTOR_FORMAT cpu_to_le32(0xC01D0002)</div><div class='del'>-#define STATUS_MONITOR_INVALID_DESCRIPTOR_CHECKSUM cpu_to_le32(0xC01D0003)</div><div class='del'>-#define STATUS_MONITOR_INVALID_STANDARD_TIMING_BLOCK cpu_to_le32(0xC01D0004)</div><div class='del'>-#define STATUS_MONITOR_WMI_DATABLOCK_REGISTRATION_FAILED cpu_to_le32(0xC01D0005)</div><div class='del'>-#define STATUS_MONITOR_INVALID_SERIAL_NUMBER_MONDSC_BLOCK	\</div><div class='del'>-	cpu_to_le32(0xC01D0006)</div><div class='del'>-#define STATUS_MONITOR_INVALID_USER_FRIENDLY_MONDSC_BLOCK	\</div><div class='del'>-	cpu_to_le32(0xC01D0007)</div><div class='del'>-#define STATUS_MONITOR_NO_MORE_DESCRIPTOR_DATA cpu_to_le32(0xC01D0008)</div><div class='del'>-#define STATUS_MONITOR_INVALID_DETAILED_TIMING_BLOCK cpu_to_le32(0xC01D0009)</div><div class='del'>-#define STATUS_GRAPHICS_NOT_EXCLUSIVE_MODE_OWNER cpu_to_le32(0xC01E0000)</div><div class='del'>-#define STATUS_GRAPHICS_INSUFFICIENT_DMA_BUFFER cpu_to_le32(0xC01E0001)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_DISPLAY_ADAPTER cpu_to_le32(0xC01E0002)</div><div class='del'>-#define STATUS_GRAPHICS_ADAPTER_WAS_RESET cpu_to_le32(0xC01E0003)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_DRIVER_MODEL cpu_to_le32(0xC01E0004)</div><div class='del'>-#define STATUS_GRAPHICS_PRESENT_MODE_CHANGED cpu_to_le32(0xC01E0005)</div><div class='del'>-#define STATUS_GRAPHICS_PRESENT_OCCLUDED cpu_to_le32(0xC01E0006)</div><div class='del'>-#define STATUS_GRAPHICS_PRESENT_DENIED cpu_to_le32(0xC01E0007)</div><div class='del'>-#define STATUS_GRAPHICS_CANNOTCOLORCONVERT cpu_to_le32(0xC01E0008)</div><div class='del'>-#define STATUS_GRAPHICS_NO_VIDEO_MEMORY cpu_to_le32(0xC01E0100)</div><div class='del'>-#define STATUS_GRAPHICS_CANT_LOCK_MEMORY cpu_to_le32(0xC01E0101)</div><div class='del'>-#define STATUS_GRAPHICS_ALLOCATION_BUSY cpu_to_le32(0xC01E0102)</div><div class='del'>-#define STATUS_GRAPHICS_TOO_MANY_REFERENCES cpu_to_le32(0xC01E0103)</div><div class='del'>-#define STATUS_GRAPHICS_TRY_AGAIN_LATER cpu_to_le32(0xC01E0104)</div><div class='del'>-#define STATUS_GRAPHICS_TRY_AGAIN_NOW cpu_to_le32(0xC01E0105)</div><div class='del'>-#define STATUS_GRAPHICS_ALLOCATION_INVALID cpu_to_le32(0xC01E0106)</div><div class='del'>-#define STATUS_GRAPHICS_UNSWIZZLING_APERTURE_UNAVAILABLE cpu_to_le32(0xC01E0107)</div><div class='del'>-#define STATUS_GRAPHICS_UNSWIZZLING_APERTURE_UNSUPPORTED cpu_to_le32(0xC01E0108)</div><div class='del'>-#define STATUS_GRAPHICS_CANT_EVICT_PINNED_ALLOCATION cpu_to_le32(0xC01E0109)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_ALLOCATION_USAGE cpu_to_le32(0xC01E0110)</div><div class='del'>-#define STATUS_GRAPHICS_CANT_RENDER_LOCKED_ALLOCATION cpu_to_le32(0xC01E0111)</div><div class='del'>-#define STATUS_GRAPHICS_ALLOCATION_CLOSED cpu_to_le32(0xC01E0112)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_ALLOCATION_INSTANCE cpu_to_le32(0xC01E0113)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_ALLOCATION_HANDLE cpu_to_le32(0xC01E0114)</div><div class='del'>-#define STATUS_GRAPHICS_WRONG_ALLOCATION_DEVICE cpu_to_le32(0xC01E0115)</div><div class='del'>-#define STATUS_GRAPHICS_ALLOCATION_CONTENT_LOST cpu_to_le32(0xC01E0116)</div><div class='del'>-#define STATUS_GRAPHICS_GPU_EXCEPTION_ON_DEVICE cpu_to_le32(0xC01E0200)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_VIDPN_TOPOLOGY cpu_to_le32(0xC01E0300)</div><div class='del'>-#define STATUS_GRAPHICS_VIDPN_TOPOLOGY_NOT_SUPPORTED cpu_to_le32(0xC01E0301)</div><div class='del'>-#define STATUS_GRAPHICS_VIDPN_TOPOLOGY_CURRENTLY_NOT_SUPPORTED	\</div><div class='del'>-	cpu_to_le32(0xC01E0302)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_VIDPN cpu_to_le32(0xC01E0303)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_VIDEO_PRESENT_SOURCE cpu_to_le32(0xC01E0304)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_VIDEO_PRESENT_TARGET cpu_to_le32(0xC01E0305)</div><div class='del'>-#define STATUS_GRAPHICS_VIDPN_MODALITY_NOT_SUPPORTED cpu_to_le32(0xC01E0306)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_VIDPN_SOURCEMODESET cpu_to_le32(0xC01E0308)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_VIDPN_TARGETMODESET cpu_to_le32(0xC01E0309)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_FREQUENCY cpu_to_le32(0xC01E030A)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_ACTIVE_REGION cpu_to_le32(0xC01E030B)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_TOTAL_REGION cpu_to_le32(0xC01E030C)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_VIDEO_PRESENT_SOURCE_MODE	\</div><div class='del'>-	cpu_to_le32(0xC01E0310)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_VIDEO_PRESENT_TARGET_MODE	\</div><div class='del'>-	cpu_to_le32(0xC01E0311)</div><div class='del'>-#define STATUS_GRAPHICS_PINNED_MODE_MUST_REMAIN_IN_SET cpu_to_le32(0xC01E0312)</div><div class='del'>-#define STATUS_GRAPHICS_PATH_ALREADY_IN_TOPOLOGY cpu_to_le32(0xC01E0313)</div><div class='del'>-#define STATUS_GRAPHICS_MODE_ALREADY_IN_MODESET cpu_to_le32(0xC01E0314)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_VIDEOPRESENTSOURCESET cpu_to_le32(0xC01E0315)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_VIDEOPRESENTTARGETSET cpu_to_le32(0xC01E0316)</div><div class='del'>-#define STATUS_GRAPHICS_SOURCE_ALREADY_IN_SET cpu_to_le32(0xC01E0317)</div><div class='del'>-#define STATUS_GRAPHICS_TARGET_ALREADY_IN_SET cpu_to_le32(0xC01E0318)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_VIDPN_PRESENT_PATH cpu_to_le32(0xC01E0319)</div><div class='del'>-#define STATUS_GRAPHICS_NO_RECOMMENDED_VIDPN_TOPOLOGY cpu_to_le32(0xC01E031A)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_MONITOR_FREQUENCYRANGESET	\</div><div class='del'>-	cpu_to_le32(0xC01E031B)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_MONITOR_FREQUENCYRANGE cpu_to_le32(0xC01E031C)</div><div class='del'>-#define STATUS_GRAPHICS_FREQUENCYRANGE_NOT_IN_SET cpu_to_le32(0xC01E031D)</div><div class='del'>-#define STATUS_GRAPHICS_FREQUENCYRANGE_ALREADY_IN_SET cpu_to_le32(0xC01E031F)</div><div class='del'>-#define STATUS_GRAPHICS_STALE_MODESET cpu_to_le32(0xC01E0320)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_MONITOR_SOURCEMODESET cpu_to_le32(0xC01E0321)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_MONITOR_SOURCE_MODE cpu_to_le32(0xC01E0322)</div><div class='del'>-#define STATUS_GRAPHICS_NO_RECOMMENDED_FUNCTIONAL_VIDPN cpu_to_le32(0xC01E0323)</div><div class='del'>-#define STATUS_GRAPHICS_MODE_ID_MUST_BE_UNIQUE cpu_to_le32(0xC01E0324)</div><div class='del'>-#define STATUS_GRAPHICS_EMPTY_ADAPTER_MONITOR_MODE_SUPPORT_INTERSECTION	\</div><div class='del'>-	cpu_to_le32(0xC01E0325)</div><div class='del'>-#define STATUS_GRAPHICS_VIDEO_PRESENT_TARGETS_LESS_THAN_SOURCES	\</div><div class='del'>-	cpu_to_le32(0xC01E0326)</div><div class='del'>-#define STATUS_GRAPHICS_PATH_NOT_IN_TOPOLOGY cpu_to_le32(0xC01E0327)</div><div class='del'>-#define STATUS_GRAPHICS_ADAPTER_MUST_HAVE_AT_LEAST_ONE_SOURCE	\</div><div class='del'>-	cpu_to_le32(0xC01E0328)</div><div class='del'>-#define STATUS_GRAPHICS_ADAPTER_MUST_HAVE_AT_LEAST_ONE_TARGET	\</div><div class='del'>-	cpu_to_le32(0xC01E0329)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_MONITORDESCRIPTORSET cpu_to_le32(0xC01E032A)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_MONITORDESCRIPTOR cpu_to_le32(0xC01E032B)</div><div class='del'>-#define STATUS_GRAPHICS_MONITORDESCRIPTOR_NOT_IN_SET cpu_to_le32(0xC01E032C)</div><div class='del'>-#define STATUS_GRAPHICS_MONITORDESCRIPTOR_ALREADY_IN_SET cpu_to_le32(0xC01E032D)</div><div class='del'>-#define STATUS_GRAPHICS_MONITORDESCRIPTOR_ID_MUST_BE_UNIQUE	\</div><div class='del'>-	cpu_to_le32(0xC01E032E)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_VIDPN_TARGET_SUBSET_TYPE cpu_to_le32(0xC01E032F)</div><div class='del'>-#define STATUS_GRAPHICS_RESOURCES_NOT_RELATED cpu_to_le32(0xC01E0330)</div><div class='del'>-#define STATUS_GRAPHICS_SOURCE_ID_MUST_BE_UNIQUE cpu_to_le32(0xC01E0331)</div><div class='del'>-#define STATUS_GRAPHICS_TARGET_ID_MUST_BE_UNIQUE cpu_to_le32(0xC01E0332)</div><div class='del'>-#define STATUS_GRAPHICS_NO_AVAILABLE_VIDPN_TARGET cpu_to_le32(0xC01E0333)</div><div class='del'>-#define STATUS_GRAPHICS_MONITOR_COULD_NOT_BE_ASSOCIATED_WITH_ADAPTER	\</div><div class='del'>-	cpu_to_le32(0xC01E0334)</div><div class='del'>-#define STATUS_GRAPHICS_NO_VIDPNMGR cpu_to_le32(0xC01E0335)</div><div class='del'>-#define STATUS_GRAPHICS_NO_ACTIVE_VIDPN cpu_to_le32(0xC01E0336)</div><div class='del'>-#define STATUS_GRAPHICS_STALE_VIDPN_TOPOLOGY cpu_to_le32(0xC01E0337)</div><div class='del'>-#define STATUS_GRAPHICS_MONITOR_NOT_CONNECTED cpu_to_le32(0xC01E0338)</div><div class='del'>-#define STATUS_GRAPHICS_SOURCE_NOT_IN_TOPOLOGY cpu_to_le32(0xC01E0339)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_PRIMARYSURFACE_SIZE cpu_to_le32(0xC01E033A)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_VISIBLEREGION_SIZE cpu_to_le32(0xC01E033B)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_STRIDE cpu_to_le32(0xC01E033C)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_PIXELFORMAT cpu_to_le32(0xC01E033D)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_COLORBASIS cpu_to_le32(0xC01E033E)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_PIXELVALUEACCESSMODE cpu_to_le32(0xC01E033F)</div><div class='del'>-#define STATUS_GRAPHICS_TARGET_NOT_IN_TOPOLOGY cpu_to_le32(0xC01E0340)</div><div class='del'>-#define STATUS_GRAPHICS_NO_DISPLAY_MODE_MANAGEMENT_SUPPORT	\</div><div class='del'>-	cpu_to_le32(0xC01E0341)</div><div class='del'>-#define STATUS_GRAPHICS_VIDPN_SOURCE_IN_USE cpu_to_le32(0xC01E0342)</div><div class='del'>-#define STATUS_GRAPHICS_CANT_ACCESS_ACTIVE_VIDPN cpu_to_le32(0xC01E0343)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_PATH_IMPORTANCE_ORDINAL cpu_to_le32(0xC01E0344)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_PATH_CONTENT_GEOMETRY_TRANSFORMATION	\</div><div class='del'>-	cpu_to_le32(0xC01E0345)</div><div class='del'>-#define STATUS_GRAPHICS_PATH_CONTENT_GEOMETRY_TRANSFORMATION_NOT_SUPPORTED \</div><div class='del'>-	cpu_to_le32(0xC01E0346)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_GAMMA_RAMP cpu_to_le32(0xC01E0347)</div><div class='del'>-#define STATUS_GRAPHICS_GAMMA_RAMP_NOT_SUPPORTED cpu_to_le32(0xC01E0348)</div><div class='del'>-#define STATUS_GRAPHICS_MULTISAMPLING_NOT_SUPPORTED cpu_to_le32(0xC01E0349)</div><div class='del'>-#define STATUS_GRAPHICS_MODE_NOT_IN_MODESET cpu_to_le32(0xC01E034A)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_VIDPN_TOPOLOGY_RECOMMENDATION_REASON	\</div><div class='del'>-	cpu_to_le32(0xC01E034D)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_PATH_CONTENT_TYPE cpu_to_le32(0xC01E034E)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_COPYPROTECTION_TYPE cpu_to_le32(0xC01E034F)</div><div class='del'>-#define STATUS_GRAPHICS_UNASSIGNED_MODESET_ALREADY_EXISTS	\</div><div class='del'>-	cpu_to_le32(0xC01E0350)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_SCANLINE_ORDERING cpu_to_le32(0xC01E0352)</div><div class='del'>-#define STATUS_GRAPHICS_TOPOLOGY_CHANGES_NOT_ALLOWED cpu_to_le32(0xC01E0353)</div><div class='del'>-#define STATUS_GRAPHICS_NO_AVAILABLE_IMPORTANCE_ORDINALS cpu_to_le32(0xC01E0354)</div><div class='del'>-#define STATUS_GRAPHICS_INCOMPATIBLE_PRIVATE_FORMAT cpu_to_le32(0xC01E0355)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_MODE_PRUNING_ALGORITHM cpu_to_le32(0xC01E0356)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_MONITOR_CAPABILITY_ORIGIN	\</div><div class='del'>-	cpu_to_le32(0xC01E0357)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_MONITOR_FREQUENCYRANGE_CONSTRAINT	\</div><div class='del'>-	cpu_to_le32(0xC01E0358)</div><div class='del'>-#define STATUS_GRAPHICS_MAX_NUM_PATHS_REACHED cpu_to_le32(0xC01E0359)</div><div class='del'>-#define STATUS_GRAPHICS_CANCEL_VIDPN_TOPOLOGY_AUGMENTATION	\</div><div class='del'>-	cpu_to_le32(0xC01E035A)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_CLIENT_TYPE cpu_to_le32(0xC01E035B)</div><div class='del'>-#define STATUS_GRAPHICS_CLIENTVIDPN_NOT_SET cpu_to_le32(0xC01E035C)</div><div class='del'>-#define STATUS_GRAPHICS_SPECIFIED_CHILD_ALREADY_CONNECTED	\</div><div class='del'>-	cpu_to_le32(0xC01E0400)</div><div class='del'>-#define STATUS_GRAPHICS_CHILD_DESCRIPTOR_NOT_SUPPORTED cpu_to_le32(0xC01E0401)</div><div class='del'>-#define STATUS_GRAPHICS_NOT_A_LINKED_ADAPTER cpu_to_le32(0xC01E0430)</div><div class='del'>-#define STATUS_GRAPHICS_LEADLINK_NOT_ENUMERATED cpu_to_le32(0xC01E0431)</div><div class='del'>-#define STATUS_GRAPHICS_CHAINLINKS_NOT_ENUMERATED cpu_to_le32(0xC01E0432)</div><div class='del'>-#define STATUS_GRAPHICS_ADAPTER_CHAIN_NOT_READY cpu_to_le32(0xC01E0433)</div><div class='del'>-#define STATUS_GRAPHICS_CHAINLINKS_NOT_STARTED cpu_to_le32(0xC01E0434)</div><div class='del'>-#define STATUS_GRAPHICS_CHAINLINKS_NOT_POWERED_ON cpu_to_le32(0xC01E0435)</div><div class='del'>-#define STATUS_GRAPHICS_INCONSISTENT_DEVICE_LINK_STATE cpu_to_le32(0xC01E0436)</div><div class='del'>-#define STATUS_GRAPHICS_NOT_POST_DEVICE_DRIVER cpu_to_le32(0xC01E0438)</div><div class='del'>-#define STATUS_GRAPHICS_ADAPTER_ACCESS_NOT_EXCLUDED cpu_to_le32(0xC01E043B)</div><div class='del'>-#define STATUS_GRAPHICS_OPM_PROTECTED_OUTPUT_DOES_NOT_HAVE_COPP_SEMANTICS \</div><div class='del'>-	cpu_to_le32(0xC01E051C)</div><div class='del'>-#define STATUS_GRAPHICS_OPM_INVALID_INFORMATION_REQUEST cpu_to_le32(0xC01E051D)</div><div class='del'>-#define STATUS_GRAPHICS_OPM_DRIVER_INTERNAL_ERROR cpu_to_le32(0xC01E051E)</div><div class='del'>-#define STATUS_GRAPHICS_OPM_PROTECTED_OUTPUT_DOES_NOT_HAVE_OPM_SEMANTICS \</div><div class='del'>-	cpu_to_le32(0xC01E051F)</div><div class='del'>-#define STATUS_GRAPHICS_OPM_SIGNALING_NOT_SUPPORTED cpu_to_le32(0xC01E0520)</div><div class='del'>-#define STATUS_GRAPHICS_OPM_INVALID_CONFIGURATION_REQUEST	\</div><div class='del'>-	cpu_to_le32(0xC01E0521)</div><div class='del'>-#define STATUS_GRAPHICS_OPM_NOT_SUPPORTED cpu_to_le32(0xC01E0500)</div><div class='del'>-#define STATUS_GRAPHICS_COPP_NOT_SUPPORTED cpu_to_le32(0xC01E0501)</div><div class='del'>-#define STATUS_GRAPHICS_UAB_NOT_SUPPORTED cpu_to_le32(0xC01E0502)</div><div class='del'>-#define STATUS_GRAPHICS_OPM_INVALID_ENCRYPTED_PARAMETERS cpu_to_le32(0xC01E0503)</div><div class='del'>-#define STATUS_GRAPHICS_OPM_PARAMETER_ARRAY_TOO_SMALL cpu_to_le32(0xC01E0504)</div><div class='del'>-#define STATUS_GRAPHICS_OPM_NO_PROTECTED_OUTPUTS_EXIST cpu_to_le32(0xC01E0505)</div><div class='del'>-#define STATUS_GRAPHICS_PVP_NO_DISPLAY_DEVICE_CORRESPONDS_TO_NAME	\</div><div class='del'>-	cpu_to_le32(0xC01E0506)</div><div class='del'>-#define STATUS_GRAPHICS_PVP_DISPLAY_DEVICE_NOT_ATTACHED_TO_DESKTOP	\</div><div class='del'>-	cpu_to_le32(0xC01E0507)</div><div class='del'>-#define STATUS_GRAPHICS_PVP_MIRRORING_DEVICES_NOT_SUPPORTED	\</div><div class='del'>-	cpu_to_le32(0xC01E0508)</div><div class='del'>-#define STATUS_GRAPHICS_OPM_INVALID_POINTER cpu_to_le32(0xC01E050A)</div><div class='del'>-#define STATUS_GRAPHICS_OPM_INTERNAL_ERROR cpu_to_le32(0xC01E050B)</div><div class='del'>-#define STATUS_GRAPHICS_OPM_INVALID_HANDLE cpu_to_le32(0xC01E050C)</div><div class='del'>-#define STATUS_GRAPHICS_PVP_NO_MONITORS_CORRESPOND_TO_DISPLAY_DEVICE	\</div><div class='del'>-	cpu_to_le32(0xC01E050D)</div><div class='del'>-#define STATUS_GRAPHICS_PVP_INVALID_CERTIFICATE_LENGTH cpu_to_le32(0xC01E050E)</div><div class='del'>-#define STATUS_GRAPHICS_OPM_SPANNING_MODE_ENABLED cpu_to_le32(0xC01E050F)</div><div class='del'>-#define STATUS_GRAPHICS_OPM_THEATER_MODE_ENABLED cpu_to_le32(0xC01E0510)</div><div class='del'>-#define STATUS_GRAPHICS_PVP_HFS_FAILED cpu_to_le32(0xC01E0511)</div><div class='del'>-#define STATUS_GRAPHICS_OPM_INVALID_SRM cpu_to_le32(0xC01E0512)</div><div class='del'>-#define STATUS_GRAPHICS_OPM_OUTPUT_DOES_NOT_SUPPORT_HDCP cpu_to_le32(0xC01E0513)</div><div class='del'>-#define STATUS_GRAPHICS_OPM_OUTPUT_DOES_NOT_SUPPORT_ACP cpu_to_le32(0xC01E0514)</div><div class='del'>-#define STATUS_GRAPHICS_OPM_OUTPUT_DOES_NOT_SUPPORT_CGMSA	\</div><div class='del'>-	cpu_to_le32(0xC01E0515)</div><div class='del'>-#define STATUS_GRAPHICS_OPM_HDCP_SRM_NEVER_SET cpu_to_le32(0xC01E0516)</div><div class='del'>-#define STATUS_GRAPHICS_OPM_RESOLUTION_TOO_HIGH cpu_to_le32(0xC01E0517)</div><div class='del'>-#define STATUS_GRAPHICS_OPM_ALL_HDCP_HARDWARE_ALREADY_IN_USE	\</div><div class='del'>-	cpu_to_le32(0xC01E0518)</div><div class='del'>-#define STATUS_GRAPHICS_OPM_PROTECTED_OUTPUT_NO_LONGER_EXISTS	\</div><div class='del'>-	cpu_to_le32(0xC01E051A)</div><div class='del'>-#define STATUS_GRAPHICS_OPM_SESSION_TYPE_CHANGE_IN_PROGRESS	\</div><div class='del'>-	cpu_to_le32(0xC01E051B)</div><div class='del'>-#define STATUS_GRAPHICS_I2C_NOT_SUPPORTED cpu_to_le32(0xC01E0580)</div><div class='del'>-#define STATUS_GRAPHICS_I2C_DEVICE_DOES_NOT_EXIST cpu_to_le32(0xC01E0581)</div><div class='del'>-#define STATUS_GRAPHICS_I2C_ERROR_TRANSMITTING_DATA cpu_to_le32(0xC01E0582)</div><div class='del'>-#define STATUS_GRAPHICS_I2C_ERROR_RECEIVING_DATA cpu_to_le32(0xC01E0583)</div><div class='del'>-#define STATUS_GRAPHICS_DDCCI_VCP_NOT_SUPPORTED cpu_to_le32(0xC01E0584)</div><div class='del'>-#define STATUS_GRAPHICS_DDCCI_INVALID_DATA cpu_to_le32(0xC01E0585)</div><div class='del'>-#define STATUS_GRAPHICS_DDCCI_MONITOR_RETURNED_INVALID_TIMING_STATUS_BYTE \</div><div class='del'>-	cpu_to_le32(0xC01E0586)</div><div class='del'>-#define STATUS_GRAPHICS_DDCCI_INVALID_CAPABILITIES_STRING	\</div><div class='del'>-	cpu_to_le32(0xC01E0587)</div><div class='del'>-#define STATUS_GRAPHICS_MCA_INTERNAL_ERROR cpu_to_le32(0xC01E0588)</div><div class='del'>-#define STATUS_GRAPHICS_DDCCI_INVALID_MESSAGE_COMMAND cpu_to_le32(0xC01E0589)</div><div class='del'>-#define STATUS_GRAPHICS_DDCCI_INVALID_MESSAGE_LENGTH cpu_to_le32(0xC01E058A)</div><div class='del'>-#define STATUS_GRAPHICS_DDCCI_INVALID_MESSAGE_CHECKSUM cpu_to_le32(0xC01E058B)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_PHYSICAL_MONITOR_HANDLE cpu_to_le32(0xC01E058C)</div><div class='del'>-#define STATUS_GRAPHICS_MONITOR_NO_LONGER_EXISTS cpu_to_le32(0xC01E058D)</div><div class='del'>-#define STATUS_GRAPHICS_ONLY_CONSOLE_SESSION_SUPPORTED cpu_to_le32(0xC01E05E0)</div><div class='del'>-#define STATUS_GRAPHICS_NO_DISPLAY_DEVICE_CORRESPONDS_TO_NAME	\</div><div class='del'>-	cpu_to_le32(0xC01E05E1)</div><div class='del'>-#define STATUS_GRAPHICS_DISPLAY_DEVICE_NOT_ATTACHED_TO_DESKTOP	\</div><div class='del'>-	cpu_to_le32(0xC01E05E2)</div><div class='del'>-#define STATUS_GRAPHICS_MIRRORING_DEVICES_NOT_SUPPORTED cpu_to_le32(0xC01E05E3)</div><div class='del'>-#define STATUS_GRAPHICS_INVALID_POINTER cpu_to_le32(0xC01E05E4)</div><div class='del'>-#define STATUS_GRAPHICS_NO_MONITORS_CORRESPOND_TO_DISPLAY_DEVICE	\</div><div class='del'>-	cpu_to_le32(0xC01E05E5)</div><div class='del'>-#define STATUS_GRAPHICS_PARAMETER_ARRAY_TOO_SMALL cpu_to_le32(0xC01E05E6)</div><div class='del'>-#define STATUS_GRAPHICS_INTERNAL_ERROR cpu_to_le32(0xC01E05E7)</div><div class='del'>-#define STATUS_GRAPHICS_SESSION_TYPE_CHANGE_IN_PROGRESS cpu_to_le32(0xC01E05E8)</div><div class='del'>-#define STATUS_FVE_LOCKED_VOLUME cpu_to_le32(0xC0210000)</div><div class='del'>-#define STATUS_FVE_NOT_ENCRYPTED cpu_to_le32(0xC0210001)</div><div class='del'>-#define STATUS_FVE_BAD_INFORMATION cpu_to_le32(0xC0210002)</div><div class='del'>-#define STATUS_FVE_TOO_SMALL cpu_to_le32(0xC0210003)</div><div class='del'>-#define STATUS_FVE_FAILED_WRONG_FS cpu_to_le32(0xC0210004)</div><div class='del'>-#define STATUS_FVE_FAILED_BAD_FS cpu_to_le32(0xC0210005)</div><div class='del'>-#define STATUS_FVE_FS_NOT_EXTENDED cpu_to_le32(0xC0210006)</div><div class='del'>-#define STATUS_FVE_FS_MOUNTED cpu_to_le32(0xC0210007)</div><div class='del'>-#define STATUS_FVE_NO_LICENSE cpu_to_le32(0xC0210008)</div><div class='del'>-#define STATUS_FVE_ACTION_NOT_ALLOWED cpu_to_le32(0xC0210009)</div><div class='del'>-#define STATUS_FVE_BAD_DATA cpu_to_le32(0xC021000A)</div><div class='del'>-#define STATUS_FVE_VOLUME_NOT_BOUND cpu_to_le32(0xC021000B)</div><div class='del'>-#define STATUS_FVE_NOT_DATA_VOLUME cpu_to_le32(0xC021000C)</div><div class='del'>-#define STATUS_FVE_CONV_READ_ERROR cpu_to_le32(0xC021000D)</div><div class='del'>-#define STATUS_FVE_CONV_WRITE_ERROR cpu_to_le32(0xC021000E)</div><div class='del'>-#define STATUS_FVE_OVERLAPPED_UPDATE cpu_to_le32(0xC021000F)</div><div class='del'>-#define STATUS_FVE_FAILED_SECTOR_SIZE cpu_to_le32(0xC0210010)</div><div class='del'>-#define STATUS_FVE_FAILED_AUTHENTICATION cpu_to_le32(0xC0210011)</div><div class='del'>-#define STATUS_FVE_NOT_OS_VOLUME cpu_to_le32(0xC0210012)</div><div class='del'>-#define STATUS_FVE_KEYFILE_NOT_FOUND cpu_to_le32(0xC0210013)</div><div class='del'>-#define STATUS_FVE_KEYFILE_INVALID cpu_to_le32(0xC0210014)</div><div class='del'>-#define STATUS_FVE_KEYFILE_NO_VMK cpu_to_le32(0xC0210015)</div><div class='del'>-#define STATUS_FVE_TPM_DISABLED cpu_to_le32(0xC0210016)</div><div class='del'>-#define STATUS_FVE_TPM_SRK_AUTH_NOT_ZERO cpu_to_le32(0xC0210017)</div><div class='del'>-#define STATUS_FVE_TPM_INVALID_PCR cpu_to_le32(0xC0210018)</div><div class='del'>-#define STATUS_FVE_TPM_NO_VMK cpu_to_le32(0xC0210019)</div><div class='del'>-#define STATUS_FVE_PIN_INVALID cpu_to_le32(0xC021001A)</div><div class='del'>-#define STATUS_FVE_AUTH_INVALID_APPLICATION cpu_to_le32(0xC021001B)</div><div class='del'>-#define STATUS_FVE_AUTH_INVALID_CONFIG cpu_to_le32(0xC021001C)</div><div class='del'>-#define STATUS_FVE_DEBUGGER_ENABLED cpu_to_le32(0xC021001D)</div><div class='del'>-#define STATUS_FVE_DRY_RUN_FAILED cpu_to_le32(0xC021001E)</div><div class='del'>-#define STATUS_FVE_BAD_METADATA_POINTER cpu_to_le32(0xC021001F)</div><div class='del'>-#define STATUS_FVE_OLD_METADATA_COPY cpu_to_le32(0xC0210020)</div><div class='del'>-#define STATUS_FVE_REBOOT_REQUIRED cpu_to_le32(0xC0210021)</div><div class='del'>-#define STATUS_FVE_RAW_ACCESS cpu_to_le32(0xC0210022)</div><div class='del'>-#define STATUS_FVE_RAW_BLOCKED cpu_to_le32(0xC0210023)</div><div class='del'>-#define STATUS_FWP_CALLOUT_NOT_FOUND cpu_to_le32(0xC0220001)</div><div class='del'>-#define STATUS_FWP_CONDITION_NOT_FOUND cpu_to_le32(0xC0220002)</div><div class='del'>-#define STATUS_FWP_FILTER_NOT_FOUND cpu_to_le32(0xC0220003)</div><div class='del'>-#define STATUS_FWP_LAYER_NOT_FOUND cpu_to_le32(0xC0220004)</div><div class='del'>-#define STATUS_FWP_PROVIDER_NOT_FOUND cpu_to_le32(0xC0220005)</div><div class='del'>-#define STATUS_FWP_PROVIDER_CONTEXT_NOT_FOUND cpu_to_le32(0xC0220006)</div><div class='del'>-#define STATUS_FWP_SUBLAYER_NOT_FOUND cpu_to_le32(0xC0220007)</div><div class='del'>-#define STATUS_FWP_NOT_FOUND cpu_to_le32(0xC0220008)</div><div class='del'>-#define STATUS_FWP_ALREADY_EXISTS cpu_to_le32(0xC0220009)</div><div class='del'>-#define STATUS_FWP_IN_USE cpu_to_le32(0xC022000A)</div><div class='del'>-#define STATUS_FWP_DYNAMIC_SESSION_IN_PROGRESS cpu_to_le32(0xC022000B)</div><div class='del'>-#define STATUS_FWP_WRONG_SESSION cpu_to_le32(0xC022000C)</div><div class='del'>-#define STATUS_FWP_NO_TXN_IN_PROGRESS cpu_to_le32(0xC022000D)</div><div class='del'>-#define STATUS_FWP_TXN_IN_PROGRESS cpu_to_le32(0xC022000E)</div><div class='del'>-#define STATUS_FWP_TXN_ABORTED cpu_to_le32(0xC022000F)</div><div class='del'>-#define STATUS_FWP_SESSION_ABORTED cpu_to_le32(0xC0220010)</div><div class='del'>-#define STATUS_FWP_INCOMPATIBLE_TXN cpu_to_le32(0xC0220011)</div><div class='del'>-#define STATUS_FWP_TIMEOUT cpu_to_le32(0xC0220012)</div><div class='del'>-#define STATUS_FWP_NET_EVENTS_DISABLED cpu_to_le32(0xC0220013)</div><div class='del'>-#define STATUS_FWP_INCOMPATIBLE_LAYER cpu_to_le32(0xC0220014)</div><div class='del'>-#define STATUS_FWP_KM_CLIENTS_ONLY cpu_to_le32(0xC0220015)</div><div class='del'>-#define STATUS_FWP_LIFETIME_MISMATCH cpu_to_le32(0xC0220016)</div><div class='del'>-#define STATUS_FWP_BUILTIN_OBJECT cpu_to_le32(0xC0220017)</div><div class='del'>-#define STATUS_FWP_TOO_MANY_BOOTTIME_FILTERS cpu_to_le32(0xC0220018)</div><div class='del'>-#define STATUS_FWP_TOO_MANY_CALLOUTS cpu_to_le32(0xC0220018)</div><div class='del'>-#define STATUS_FWP_NOTIFICATION_DROPPED cpu_to_le32(0xC0220019)</div><div class='del'>-#define STATUS_FWP_TRAFFIC_MISMATCH cpu_to_le32(0xC022001A)</div><div class='del'>-#define STATUS_FWP_INCOMPATIBLE_SA_STATE cpu_to_le32(0xC022001B)</div><div class='del'>-#define STATUS_FWP_NULL_POINTER cpu_to_le32(0xC022001C)</div><div class='del'>-#define STATUS_FWP_INVALID_ENUMERATOR cpu_to_le32(0xC022001D)</div><div class='del'>-#define STATUS_FWP_INVALID_FLAGS cpu_to_le32(0xC022001E)</div><div class='del'>-#define STATUS_FWP_INVALID_NET_MASK cpu_to_le32(0xC022001F)</div><div class='del'>-#define STATUS_FWP_INVALID_RANGE cpu_to_le32(0xC0220020)</div><div class='del'>-#define STATUS_FWP_INVALID_INTERVAL cpu_to_le32(0xC0220021)</div><div class='del'>-#define STATUS_FWP_ZERO_LENGTH_ARRAY cpu_to_le32(0xC0220022)</div><div class='del'>-#define STATUS_FWP_NULL_DISPLAY_NAME cpu_to_le32(0xC0220023)</div><div class='del'>-#define STATUS_FWP_INVALID_ACTION_TYPE cpu_to_le32(0xC0220024)</div><div class='del'>-#define STATUS_FWP_INVALID_WEIGHT cpu_to_le32(0xC0220025)</div><div class='del'>-#define STATUS_FWP_MATCH_TYPE_MISMATCH cpu_to_le32(0xC0220026)</div><div class='del'>-#define STATUS_FWP_TYPE_MISMATCH cpu_to_le32(0xC0220027)</div><div class='del'>-#define STATUS_FWP_OUT_OF_BOUNDS cpu_to_le32(0xC0220028)</div><div class='del'>-#define STATUS_FWP_RESERVED cpu_to_le32(0xC0220029)</div><div class='del'>-#define STATUS_FWP_DUPLICATE_CONDITION cpu_to_le32(0xC022002A)</div><div class='del'>-#define STATUS_FWP_DUPLICATE_KEYMOD cpu_to_le32(0xC022002B)</div><div class='del'>-#define STATUS_FWP_ACTION_INCOMPATIBLE_WITH_LAYER cpu_to_le32(0xC022002C)</div><div class='del'>-#define STATUS_FWP_ACTION_INCOMPATIBLE_WITH_SUBLAYER cpu_to_le32(0xC022002D)</div><div class='del'>-#define STATUS_FWP_CONTEXT_INCOMPATIBLE_WITH_LAYER cpu_to_le32(0xC022002E)</div><div class='del'>-#define STATUS_FWP_CONTEXT_INCOMPATIBLE_WITH_CALLOUT cpu_to_le32(0xC022002F)</div><div class='del'>-#define STATUS_FWP_INCOMPATIBLE_AUTH_METHOD cpu_to_le32(0xC0220030)</div><div class='del'>-#define STATUS_FWP_INCOMPATIBLE_DH_GROUP cpu_to_le32(0xC0220031)</div><div class='del'>-#define STATUS_FWP_EM_NOT_SUPPORTED cpu_to_le32(0xC0220032)</div><div class='del'>-#define STATUS_FWP_NEVER_MATCH cpu_to_le32(0xC0220033)</div><div class='del'>-#define STATUS_FWP_PROVIDER_CONTEXT_MISMATCH cpu_to_le32(0xC0220034)</div><div class='del'>-#define STATUS_FWP_INVALID_PARAMETER cpu_to_le32(0xC0220035)</div><div class='del'>-#define STATUS_FWP_TOO_MANY_SUBLAYERS cpu_to_le32(0xC0220036)</div><div class='del'>-#define STATUS_FWP_CALLOUT_NOTIFICATION_FAILED cpu_to_le32(0xC0220037)</div><div class='del'>-#define STATUS_FWP_INCOMPATIBLE_AUTH_CONFIG cpu_to_le32(0xC0220038)</div><div class='del'>-#define STATUS_FWP_INCOMPATIBLE_CIPHER_CONFIG cpu_to_le32(0xC0220039)</div><div class='del'>-#define STATUS_FWP_TCPIP_NOT_READY cpu_to_le32(0xC0220100)</div><div class='del'>-#define STATUS_FWP_INJECT_HANDLE_CLOSING cpu_to_le32(0xC0220101)</div><div class='del'>-#define STATUS_FWP_INJECT_HANDLE_STALE cpu_to_le32(0xC0220102)</div><div class='del'>-#define STATUS_FWP_CANNOT_PEND cpu_to_le32(0xC0220103)</div><div class='del'>-#define STATUS_NDIS_CLOSING cpu_to_le32(0xC0230002)</div><div class='del'>-#define STATUS_NDIS_BAD_VERSION cpu_to_le32(0xC0230004)</div><div class='del'>-#define STATUS_NDIS_BAD_CHARACTERISTICS cpu_to_le32(0xC0230005)</div><div class='del'>-#define STATUS_NDIS_ADAPTER_NOT_FOUND cpu_to_le32(0xC0230006)</div><div class='del'>-#define STATUS_NDIS_OPEN_FAILED cpu_to_le32(0xC0230007)</div><div class='del'>-#define STATUS_NDIS_DEVICE_FAILED cpu_to_le32(0xC0230008)</div><div class='del'>-#define STATUS_NDIS_MULTICAST_FULL cpu_to_le32(0xC0230009)</div><div class='del'>-#define STATUS_NDIS_MULTICAST_EXISTS cpu_to_le32(0xC023000A)</div><div class='del'>-#define STATUS_NDIS_MULTICAST_NOT_FOUND cpu_to_le32(0xC023000B)</div><div class='del'>-#define STATUS_NDIS_REQUEST_ABORTED cpu_to_le32(0xC023000C)</div><div class='del'>-#define STATUS_NDIS_RESET_IN_PROGRESS cpu_to_le32(0xC023000D)</div><div class='del'>-#define STATUS_NDIS_INVALID_PACKET cpu_to_le32(0xC023000F)</div><div class='del'>-#define STATUS_NDIS_INVALID_DEVICE_REQUEST cpu_to_le32(0xC0230010)</div><div class='del'>-#define STATUS_NDIS_ADAPTER_NOT_READY cpu_to_le32(0xC0230011)</div><div class='del'>-#define STATUS_NDIS_INVALID_LENGTH cpu_to_le32(0xC0230014)</div><div class='del'>-#define STATUS_NDIS_INVALID_DATA cpu_to_le32(0xC0230015)</div><div class='del'>-#define STATUS_NDIS_BUFFER_TOO_SHORT cpu_to_le32(0xC0230016)</div><div class='del'>-#define STATUS_NDIS_INVALID_OID cpu_to_le32(0xC0230017)</div><div class='del'>-#define STATUS_NDIS_ADAPTER_REMOVED cpu_to_le32(0xC0230018)</div><div class='del'>-#define STATUS_NDIS_UNSUPPORTED_MEDIA cpu_to_le32(0xC0230019)</div><div class='del'>-#define STATUS_NDIS_GROUP_ADDRESS_IN_USE cpu_to_le32(0xC023001A)</div><div class='del'>-#define STATUS_NDIS_FILE_NOT_FOUND cpu_to_le32(0xC023001B)</div><div class='del'>-#define STATUS_NDIS_ERROR_READING_FILE cpu_to_le32(0xC023001C)</div><div class='del'>-#define STATUS_NDIS_ALREADY_MAPPED cpu_to_le32(0xC023001D)</div><div class='del'>-#define STATUS_NDIS_RESOURCE_CONFLICT cpu_to_le32(0xC023001E)</div><div class='del'>-#define STATUS_NDIS_MEDIA_DISCONNECTED cpu_to_le32(0xC023001F)</div><div class='del'>-#define STATUS_NDIS_INVALID_ADDRESS cpu_to_le32(0xC0230022)</div><div class='del'>-#define STATUS_NDIS_PAUSED cpu_to_le32(0xC023002A)</div><div class='del'>-#define STATUS_NDIS_INTERFACE_NOT_FOUND cpu_to_le32(0xC023002B)</div><div class='del'>-#define STATUS_NDIS_UNSUPPORTED_REVISION cpu_to_le32(0xC023002C)</div><div class='del'>-#define STATUS_NDIS_INVALID_PORT cpu_to_le32(0xC023002D)</div><div class='del'>-#define STATUS_NDIS_INVALID_PORT_STATE cpu_to_le32(0xC023002E)</div><div class='del'>-#define STATUS_NDIS_LOW_POWER_STATE cpu_to_le32(0xC023002F)</div><div class='del'>-#define STATUS_NDIS_NOT_SUPPORTED cpu_to_le32(0xC02300BB)</div><div class='del'>-#define STATUS_NDIS_DOT11_AUTO_CONFIG_ENABLED cpu_to_le32(0xC0232000)</div><div class='del'>-#define STATUS_NDIS_DOT11_MEDIA_IN_USE cpu_to_le32(0xC0232001)</div><div class='del'>-#define STATUS_NDIS_DOT11_POWER_STATE_INVALID cpu_to_le32(0xC0232002)</div><div class='del'>-#define STATUS_IPSEC_BAD_SPI cpu_to_le32(0xC0360001)</div><div class='del'>-#define STATUS_IPSEC_SA_LIFETIME_EXPIRED cpu_to_le32(0xC0360002)</div><div class='del'>-#define STATUS_IPSEC_WRONG_SA cpu_to_le32(0xC0360003)</div><div class='del'>-#define STATUS_IPSEC_REPLAY_CHECK_FAILED cpu_to_le32(0xC0360004)</div><div class='del'>-#define STATUS_IPSEC_INVALID_PACKET cpu_to_le32(0xC0360005)</div><div class='del'>-#define STATUS_IPSEC_INTEGRITY_CHECK_FAILED cpu_to_le32(0xC0360006)</div><div class='del'>-#define STATUS_IPSEC_CLEAR_TEXT_DROP cpu_to_le32(0xC0360007)</div><div class='del'>-</div><div class='del'>-#define STATUS_NO_PREAUTH_INTEGRITY_HASH_OVERLAP cpu_to_le32(0xC05D0000)</div><div class='del'>-#define STATUS_INVALID_LOCK_RANGE cpu_to_le32(0xC00001a1)</div><div class='head'>diff --git a/fs/ksmbd/transport_rdma.c b/fs/ksmbd/transport_rdma.c<br/>deleted file mode 100644<br/>index a2fd5a4d4cd5..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ksmbd/transport_rdma.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ksmbd/transport_rdma.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,2074 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='del'>-/*</div><div class='del'>- *   Copyright (C) 2017, Microsoft Corporation.</div><div class='del'>- *   Copyright (C) 2018, LG Electronics.</div><div class='del'>- *</div><div class='del'>- *   Author(s): Long Li &lt;longli@microsoft.com&gt;,</div><div class='del'>- *		Hyunchul Lee &lt;hyc.lee@gmail.com&gt;</div><div class='del'>- *</div><div class='del'>- *   This program is free software;  you can redistribute it and/or modify</div><div class='del'>- *   it under the terms of the GNU General Public License as published by</div><div class='del'>- *   the Free Software Foundation; either version 2 of the License, or</div><div class='del'>- *   (at your option) any later version.</div><div class='del'>- *</div><div class='del'>- *   This program is distributed in the hope that it will be useful,</div><div class='del'>- *   but WITHOUT ANY WARRANTY;  without even the implied warranty of</div><div class='del'>- *   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See</div><div class='del'>- *   the GNU General Public License for more details.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#define SUBMOD_NAME	"smb_direct"</div><div class='del'>-</div><div class='del'>-#include &lt;linux/kthread.h&gt;</div><div class='del'>-#include &lt;linux/list.h&gt;</div><div class='del'>-#include &lt;linux/mempool.h&gt;</div><div class='del'>-#include &lt;linux/highmem.h&gt;</div><div class='del'>-#include &lt;linux/scatterlist.h&gt;</div><div class='del'>-#include &lt;rdma/ib_verbs.h&gt;</div><div class='del'>-#include &lt;rdma/rdma_cm.h&gt;</div><div class='del'>-#include &lt;rdma/rw.h&gt;</div><div class='del'>-</div><div class='del'>-#include "glob.h"</div><div class='del'>-#include "connection.h"</div><div class='del'>-#include "smb_common.h"</div><div class='del'>-#include "smbstatus.h"</div><div class='del'>-#include "transport_rdma.h"</div><div class='del'>-</div><div class='del'>-#define SMB_DIRECT_PORT	5445</div><div class='del'>-</div><div class='del'>-#define SMB_DIRECT_VERSION_LE		cpu_to_le16(0x0100)</div><div class='del'>-</div><div class='del'>-/* SMB_DIRECT negotiation timeout in seconds */</div><div class='del'>-#define SMB_DIRECT_NEGOTIATE_TIMEOUT		120</div><div class='del'>-</div><div class='del'>-#define SMB_DIRECT_MAX_SEND_SGES		8</div><div class='del'>-#define SMB_DIRECT_MAX_RECV_SGES		1</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Default maximum number of RDMA read/write outstanding on this connection</div><div class='del'>- * This value is possibly decreased during QP creation on hardware limit</div><div class='del'>- */</div><div class='del'>-#define SMB_DIRECT_CM_INITIATOR_DEPTH		8</div><div class='del'>-</div><div class='del'>-/* Maximum number of retries on data transfer operations */</div><div class='del'>-#define SMB_DIRECT_CM_RETRY			6</div><div class='del'>-/* No need to retry on Receiver Not Ready since SMB_DIRECT manages credits */</div><div class='del'>-#define SMB_DIRECT_CM_RNR_RETRY		0</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * User configurable initial values per SMB_DIRECT transport connection</div><div class='del'>- * as defined in [MS-SMBD] 3.1.1.1</div><div class='del'>- * Those may change after a SMB_DIRECT negotiation</div><div class='del'>- */</div><div class='del'>-/* The local peer's maximum number of credits to grant to the peer */</div><div class='del'>-static int smb_direct_receive_credit_max = 255;</div><div class='del'>-</div><div class='del'>-/* The remote peer's credit request of local peer */</div><div class='del'>-static int smb_direct_send_credit_target = 255;</div><div class='del'>-</div><div class='del'>-/* The maximum single message size can be sent to remote peer */</div><div class='del'>-static int smb_direct_max_send_size = 8192;</div><div class='del'>-</div><div class='del'>-/*  The maximum fragmented upper-layer payload receive size supported */</div><div class='del'>-static int smb_direct_max_fragmented_recv_size = 1024 * 1024;</div><div class='del'>-</div><div class='del'>-/*  The maximum single-message size which can be received */</div><div class='del'>-static int smb_direct_max_receive_size = 8192;</div><div class='del'>-</div><div class='del'>-static int smb_direct_max_read_write_size = 1024 * 1024;</div><div class='del'>-</div><div class='del'>-static int smb_direct_max_outstanding_rw_ops = 8;</div><div class='del'>-</div><div class='del'>-static struct smb_direct_listener {</div><div class='del'>-	struct rdma_cm_id	*cm_id;</div><div class='del'>-} smb_direct_listener;</div><div class='del'>-</div><div class='del'>-static struct workqueue_struct *smb_direct_wq;</div><div class='del'>-</div><div class='del'>-enum smb_direct_status {</div><div class='del'>-	SMB_DIRECT_CS_NEW = 0,</div><div class='del'>-	SMB_DIRECT_CS_CONNECTED,</div><div class='del'>-	SMB_DIRECT_CS_DISCONNECTING,</div><div class='del'>-	SMB_DIRECT_CS_DISCONNECTED,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct smb_direct_transport {</div><div class='del'>-	struct ksmbd_transport	transport;</div><div class='del'>-</div><div class='del'>-	enum smb_direct_status	status;</div><div class='del'>-	bool			full_packet_received;</div><div class='del'>-	wait_queue_head_t	wait_status;</div><div class='del'>-</div><div class='del'>-	struct rdma_cm_id	*cm_id;</div><div class='del'>-	struct ib_cq		*send_cq;</div><div class='del'>-	struct ib_cq		*recv_cq;</div><div class='del'>-	struct ib_pd		*pd;</div><div class='del'>-	struct ib_qp		*qp;</div><div class='del'>-</div><div class='del'>-	int			max_send_size;</div><div class='del'>-	int			max_recv_size;</div><div class='del'>-	int			max_fragmented_send_size;</div><div class='del'>-	int			max_fragmented_recv_size;</div><div class='del'>-	int			max_rdma_rw_size;</div><div class='del'>-</div><div class='del'>-	spinlock_t		reassembly_queue_lock;</div><div class='del'>-	struct list_head	reassembly_queue;</div><div class='del'>-	int			reassembly_data_length;</div><div class='del'>-	int			reassembly_queue_length;</div><div class='del'>-	int			first_entry_offset;</div><div class='del'>-	wait_queue_head_t	wait_reassembly_queue;</div><div class='del'>-</div><div class='del'>-	spinlock_t		receive_credit_lock;</div><div class='del'>-	int			recv_credits;</div><div class='del'>-	int			count_avail_recvmsg;</div><div class='del'>-	int			recv_credit_max;</div><div class='del'>-	int			recv_credit_target;</div><div class='del'>-</div><div class='del'>-	spinlock_t		recvmsg_queue_lock;</div><div class='del'>-	struct list_head	recvmsg_queue;</div><div class='del'>-</div><div class='del'>-	spinlock_t		empty_recvmsg_queue_lock;</div><div class='del'>-	struct list_head	empty_recvmsg_queue;</div><div class='del'>-</div><div class='del'>-	int			send_credit_target;</div><div class='del'>-	atomic_t		send_credits;</div><div class='del'>-	spinlock_t		lock_new_recv_credits;</div><div class='del'>-	int			new_recv_credits;</div><div class='del'>-	atomic_t		rw_avail_ops;</div><div class='del'>-</div><div class='del'>-	wait_queue_head_t	wait_send_credits;</div><div class='del'>-	wait_queue_head_t	wait_rw_avail_ops;</div><div class='del'>-</div><div class='del'>-	mempool_t		*sendmsg_mempool;</div><div class='del'>-	struct kmem_cache	*sendmsg_cache;</div><div class='del'>-	mempool_t		*recvmsg_mempool;</div><div class='del'>-	struct kmem_cache	*recvmsg_cache;</div><div class='del'>-</div><div class='del'>-	wait_queue_head_t	wait_send_payload_pending;</div><div class='del'>-	atomic_t		send_payload_pending;</div><div class='del'>-	wait_queue_head_t	wait_send_pending;</div><div class='del'>-	atomic_t		send_pending;</div><div class='del'>-</div><div class='del'>-	struct delayed_work	post_recv_credits_work;</div><div class='del'>-	struct work_struct	send_immediate_work;</div><div class='del'>-	struct work_struct	disconnect_work;</div><div class='del'>-</div><div class='del'>-	bool			negotiation_requested;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-#define KSMBD_TRANS(t) ((struct ksmbd_transport *)&amp;((t)-&gt;transport))</div><div class='del'>-</div><div class='del'>-enum {</div><div class='del'>-	SMB_DIRECT_MSG_NEGOTIATE_REQ = 0,</div><div class='del'>-	SMB_DIRECT_MSG_DATA_TRANSFER</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static struct ksmbd_transport_ops ksmbd_smb_direct_transport_ops;</div><div class='del'>-</div><div class='del'>-struct smb_direct_send_ctx {</div><div class='del'>-	struct list_head	msg_list;</div><div class='del'>-	int			wr_cnt;</div><div class='del'>-	bool			need_invalidate_rkey;</div><div class='del'>-	unsigned int		remote_key;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct smb_direct_sendmsg {</div><div class='del'>-	struct smb_direct_transport	*transport;</div><div class='del'>-	struct ib_send_wr	wr;</div><div class='del'>-	struct list_head	list;</div><div class='del'>-	int			num_sge;</div><div class='del'>-	struct ib_sge		sge[SMB_DIRECT_MAX_SEND_SGES];</div><div class='del'>-	struct ib_cqe		cqe;</div><div class='del'>-	u8			packet[];</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct smb_direct_recvmsg {</div><div class='del'>-	struct smb_direct_transport	*transport;</div><div class='del'>-	struct list_head	list;</div><div class='del'>-	int			type;</div><div class='del'>-	struct ib_sge		sge;</div><div class='del'>-	struct ib_cqe		cqe;</div><div class='del'>-	bool			first_segment;</div><div class='del'>-	u8			packet[];</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct smb_direct_rdma_rw_msg {</div><div class='del'>-	struct smb_direct_transport	*t;</div><div class='del'>-	struct ib_cqe		cqe;</div><div class='del'>-	struct completion	*completion;</div><div class='del'>-	struct rdma_rw_ctx	rw_ctx;</div><div class='del'>-	struct sg_table		sgt;</div><div class='del'>-	struct scatterlist	sg_list[0];</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static inline int get_buf_page_count(void *buf, int size)</div><div class='del'>-{</div><div class='del'>-	return DIV_ROUND_UP((uintptr_t)buf + size, PAGE_SIZE) -</div><div class='del'>-		(uintptr_t)buf / PAGE_SIZE;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void smb_direct_destroy_pools(struct smb_direct_transport *transport);</div><div class='del'>-static void smb_direct_post_recv_credits(struct work_struct *work);</div><div class='del'>-static int smb_direct_post_send_data(struct smb_direct_transport *t,</div><div class='del'>-				     struct smb_direct_send_ctx *send_ctx,</div><div class='del'>-				     struct kvec *iov, int niov,</div><div class='del'>-				     int remaining_data_length);</div><div class='del'>-</div><div class='del'>-static inline struct smb_direct_transport *</div><div class='del'>-smb_trans_direct_transfort(struct ksmbd_transport *t)</div><div class='del'>-{</div><div class='del'>-	return container_of(t, struct smb_direct_transport, transport);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void</div><div class='del'>-*smb_direct_recvmsg_payload(struct smb_direct_recvmsg *recvmsg)</div><div class='del'>-{</div><div class='del'>-	return (void *)recvmsg-&gt;packet;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline bool is_receive_credit_post_required(int receive_credits,</div><div class='del'>-						   int avail_recvmsg_count)</div><div class='del'>-{</div><div class='del'>-	return receive_credits &lt;= (smb_direct_receive_credit_max &gt;&gt; 3) &amp;&amp;</div><div class='del'>-		avail_recvmsg_count &gt;= (receive_credits &gt;&gt; 2);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct</div><div class='del'>-smb_direct_recvmsg *get_free_recvmsg(struct smb_direct_transport *t)</div><div class='del'>-{</div><div class='del'>-	struct smb_direct_recvmsg *recvmsg = NULL;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;t-&gt;recvmsg_queue_lock);</div><div class='del'>-	if (!list_empty(&amp;t-&gt;recvmsg_queue)) {</div><div class='del'>-		recvmsg = list_first_entry(&amp;t-&gt;recvmsg_queue,</div><div class='del'>-					   struct smb_direct_recvmsg,</div><div class='del'>-					   list);</div><div class='del'>-		list_del(&amp;recvmsg-&gt;list);</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;t-&gt;recvmsg_queue_lock);</div><div class='del'>-	return recvmsg;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void put_recvmsg(struct smb_direct_transport *t,</div><div class='del'>-			struct smb_direct_recvmsg *recvmsg)</div><div class='del'>-{</div><div class='del'>-	ib_dma_unmap_single(t-&gt;cm_id-&gt;device, recvmsg-&gt;sge.addr,</div><div class='del'>-			    recvmsg-&gt;sge.length, DMA_FROM_DEVICE);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;t-&gt;recvmsg_queue_lock);</div><div class='del'>-	list_add(&amp;recvmsg-&gt;list, &amp;t-&gt;recvmsg_queue);</div><div class='del'>-	spin_unlock(&amp;t-&gt;recvmsg_queue_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct</div><div class='del'>-smb_direct_recvmsg *get_empty_recvmsg(struct smb_direct_transport *t)</div><div class='del'>-{</div><div class='del'>-	struct smb_direct_recvmsg *recvmsg = NULL;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;t-&gt;empty_recvmsg_queue_lock);</div><div class='del'>-	if (!list_empty(&amp;t-&gt;empty_recvmsg_queue)) {</div><div class='del'>-		recvmsg = list_first_entry(&amp;t-&gt;empty_recvmsg_queue,</div><div class='del'>-					   struct smb_direct_recvmsg, list);</div><div class='del'>-		list_del(&amp;recvmsg-&gt;list);</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;t-&gt;empty_recvmsg_queue_lock);</div><div class='del'>-	return recvmsg;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void put_empty_recvmsg(struct smb_direct_transport *t,</div><div class='del'>-			      struct smb_direct_recvmsg *recvmsg)</div><div class='del'>-{</div><div class='del'>-	ib_dma_unmap_single(t-&gt;cm_id-&gt;device, recvmsg-&gt;sge.addr,</div><div class='del'>-			    recvmsg-&gt;sge.length, DMA_FROM_DEVICE);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;t-&gt;empty_recvmsg_queue_lock);</div><div class='del'>-	list_add_tail(&amp;recvmsg-&gt;list, &amp;t-&gt;empty_recvmsg_queue);</div><div class='del'>-	spin_unlock(&amp;t-&gt;empty_recvmsg_queue_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void enqueue_reassembly(struct smb_direct_transport *t,</div><div class='del'>-			       struct smb_direct_recvmsg *recvmsg,</div><div class='del'>-			       int data_length)</div><div class='del'>-{</div><div class='del'>-	spin_lock(&amp;t-&gt;reassembly_queue_lock);</div><div class='del'>-	list_add_tail(&amp;recvmsg-&gt;list, &amp;t-&gt;reassembly_queue);</div><div class='del'>-	t-&gt;reassembly_queue_length++;</div><div class='del'>-	/*</div><div class='del'>-	 * Make sure reassembly_data_length is updated after list and</div><div class='del'>-	 * reassembly_queue_length are updated. On the dequeue side</div><div class='del'>-	 * reassembly_data_length is checked without a lock to determine</div><div class='del'>-	 * if reassembly_queue_length and list is up to date</div><div class='del'>-	 */</div><div class='del'>-	virt_wmb();</div><div class='del'>-	t-&gt;reassembly_data_length += data_length;</div><div class='del'>-	spin_unlock(&amp;t-&gt;reassembly_queue_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct smb_direct_recvmsg *get_first_reassembly(struct smb_direct_transport *t)</div><div class='del'>-{</div><div class='del'>-	if (!list_empty(&amp;t-&gt;reassembly_queue))</div><div class='del'>-		return list_first_entry(&amp;t-&gt;reassembly_queue,</div><div class='del'>-				struct smb_direct_recvmsg, list);</div><div class='del'>-	else</div><div class='del'>-		return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void smb_direct_disconnect_rdma_work(struct work_struct *work)</div><div class='del'>-{</div><div class='del'>-	struct smb_direct_transport *t =</div><div class='del'>-		container_of(work, struct smb_direct_transport,</div><div class='del'>-			     disconnect_work);</div><div class='del'>-</div><div class='del'>-	if (t-&gt;status == SMB_DIRECT_CS_CONNECTED) {</div><div class='del'>-		t-&gt;status = SMB_DIRECT_CS_DISCONNECTING;</div><div class='del'>-		rdma_disconnect(t-&gt;cm_id);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void</div><div class='del'>-smb_direct_disconnect_rdma_connection(struct smb_direct_transport *t)</div><div class='del'>-{</div><div class='del'>-	if (t-&gt;status == SMB_DIRECT_CS_CONNECTED)</div><div class='del'>-		queue_work(smb_direct_wq, &amp;t-&gt;disconnect_work);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void smb_direct_send_immediate_work(struct work_struct *work)</div><div class='del'>-{</div><div class='del'>-	struct smb_direct_transport *t = container_of(work,</div><div class='del'>-			struct smb_direct_transport, send_immediate_work);</div><div class='del'>-</div><div class='del'>-	if (t-&gt;status != SMB_DIRECT_CS_CONNECTED)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	smb_direct_post_send_data(t, NULL, NULL, 0, 0);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct smb_direct_transport *alloc_transport(struct rdma_cm_id *cm_id)</div><div class='del'>-{</div><div class='del'>-	struct smb_direct_transport *t;</div><div class='del'>-	struct ksmbd_conn *conn;</div><div class='del'>-</div><div class='del'>-	t = kzalloc(sizeof(*t), GFP_KERNEL);</div><div class='del'>-	if (!t)</div><div class='del'>-		return NULL;</div><div class='del'>-</div><div class='del'>-	t-&gt;cm_id = cm_id;</div><div class='del'>-	cm_id-&gt;context = t;</div><div class='del'>-</div><div class='del'>-	t-&gt;status = SMB_DIRECT_CS_NEW;</div><div class='del'>-	init_waitqueue_head(&amp;t-&gt;wait_status);</div><div class='del'>-</div><div class='del'>-	spin_lock_init(&amp;t-&gt;reassembly_queue_lock);</div><div class='del'>-	INIT_LIST_HEAD(&amp;t-&gt;reassembly_queue);</div><div class='del'>-	t-&gt;reassembly_data_length = 0;</div><div class='del'>-	t-&gt;reassembly_queue_length = 0;</div><div class='del'>-	init_waitqueue_head(&amp;t-&gt;wait_reassembly_queue);</div><div class='del'>-	init_waitqueue_head(&amp;t-&gt;wait_send_credits);</div><div class='del'>-	init_waitqueue_head(&amp;t-&gt;wait_rw_avail_ops);</div><div class='del'>-</div><div class='del'>-	spin_lock_init(&amp;t-&gt;receive_credit_lock);</div><div class='del'>-	spin_lock_init(&amp;t-&gt;recvmsg_queue_lock);</div><div class='del'>-	INIT_LIST_HEAD(&amp;t-&gt;recvmsg_queue);</div><div class='del'>-</div><div class='del'>-	spin_lock_init(&amp;t-&gt;empty_recvmsg_queue_lock);</div><div class='del'>-	INIT_LIST_HEAD(&amp;t-&gt;empty_recvmsg_queue);</div><div class='del'>-</div><div class='del'>-	init_waitqueue_head(&amp;t-&gt;wait_send_payload_pending);</div><div class='del'>-	atomic_set(&amp;t-&gt;send_payload_pending, 0);</div><div class='del'>-	init_waitqueue_head(&amp;t-&gt;wait_send_pending);</div><div class='del'>-	atomic_set(&amp;t-&gt;send_pending, 0);</div><div class='del'>-</div><div class='del'>-	spin_lock_init(&amp;t-&gt;lock_new_recv_credits);</div><div class='del'>-</div><div class='del'>-	INIT_DELAYED_WORK(&amp;t-&gt;post_recv_credits_work,</div><div class='del'>-			  smb_direct_post_recv_credits);</div><div class='del'>-	INIT_WORK(&amp;t-&gt;send_immediate_work, smb_direct_send_immediate_work);</div><div class='del'>-	INIT_WORK(&amp;t-&gt;disconnect_work, smb_direct_disconnect_rdma_work);</div><div class='del'>-</div><div class='del'>-	conn = ksmbd_conn_alloc();</div><div class='del'>-	if (!conn)</div><div class='del'>-		goto err;</div><div class='del'>-	conn-&gt;transport = KSMBD_TRANS(t);</div><div class='del'>-	KSMBD_TRANS(t)-&gt;conn = conn;</div><div class='del'>-	KSMBD_TRANS(t)-&gt;ops = &amp;ksmbd_smb_direct_transport_ops;</div><div class='del'>-	return t;</div><div class='del'>-err:</div><div class='del'>-	kfree(t);</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void free_transport(struct smb_direct_transport *t)</div><div class='del'>-{</div><div class='del'>-	struct smb_direct_recvmsg *recvmsg;</div><div class='del'>-</div><div class='del'>-	wake_up_interruptible(&amp;t-&gt;wait_send_credits);</div><div class='del'>-</div><div class='del'>-	ksmbd_debug(RDMA, "wait for all send posted to IB to finish\n");</div><div class='del'>-	wait_event(t-&gt;wait_send_payload_pending,</div><div class='del'>-		   atomic_read(&amp;t-&gt;send_payload_pending) == 0);</div><div class='del'>-	wait_event(t-&gt;wait_send_pending,</div><div class='del'>-		   atomic_read(&amp;t-&gt;send_pending) == 0);</div><div class='del'>-</div><div class='del'>-	cancel_work_sync(&amp;t-&gt;disconnect_work);</div><div class='del'>-	cancel_delayed_work_sync(&amp;t-&gt;post_recv_credits_work);</div><div class='del'>-	cancel_work_sync(&amp;t-&gt;send_immediate_work);</div><div class='del'>-</div><div class='del'>-	if (t-&gt;qp) {</div><div class='del'>-		ib_drain_qp(t-&gt;qp);</div><div class='del'>-		ib_destroy_qp(t-&gt;qp);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ksmbd_debug(RDMA, "drain the reassembly queue\n");</div><div class='del'>-	do {</div><div class='del'>-		spin_lock(&amp;t-&gt;reassembly_queue_lock);</div><div class='del'>-		recvmsg = get_first_reassembly(t);</div><div class='del'>-		if (recvmsg) {</div><div class='del'>-			list_del(&amp;recvmsg-&gt;list);</div><div class='del'>-			spin_unlock(&amp;t-&gt;reassembly_queue_lock);</div><div class='del'>-			put_recvmsg(t, recvmsg);</div><div class='del'>-		} else {</div><div class='del'>-			spin_unlock(&amp;t-&gt;reassembly_queue_lock);</div><div class='del'>-		}</div><div class='del'>-	} while (recvmsg);</div><div class='del'>-	t-&gt;reassembly_data_length = 0;</div><div class='del'>-</div><div class='del'>-	if (t-&gt;send_cq)</div><div class='del'>-		ib_free_cq(t-&gt;send_cq);</div><div class='del'>-	if (t-&gt;recv_cq)</div><div class='del'>-		ib_free_cq(t-&gt;recv_cq);</div><div class='del'>-	if (t-&gt;pd)</div><div class='del'>-		ib_dealloc_pd(t-&gt;pd);</div><div class='del'>-	if (t-&gt;cm_id)</div><div class='del'>-		rdma_destroy_id(t-&gt;cm_id);</div><div class='del'>-</div><div class='del'>-	smb_direct_destroy_pools(t);</div><div class='del'>-	ksmbd_conn_free(KSMBD_TRANS(t)-&gt;conn);</div><div class='del'>-	kfree(t);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct smb_direct_sendmsg</div><div class='del'>-*smb_direct_alloc_sendmsg(struct smb_direct_transport *t)</div><div class='del'>-{</div><div class='del'>-	struct smb_direct_sendmsg *msg;</div><div class='del'>-</div><div class='del'>-	msg = mempool_alloc(t-&gt;sendmsg_mempool, GFP_KERNEL);</div><div class='del'>-	if (!msg)</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='del'>-	msg-&gt;transport = t;</div><div class='del'>-	INIT_LIST_HEAD(&amp;msg-&gt;list);</div><div class='del'>-	msg-&gt;num_sge = 0;</div><div class='del'>-	return msg;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void smb_direct_free_sendmsg(struct smb_direct_transport *t,</div><div class='del'>-				    struct smb_direct_sendmsg *msg)</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	if (msg-&gt;num_sge &gt; 0) {</div><div class='del'>-		ib_dma_unmap_single(t-&gt;cm_id-&gt;device,</div><div class='del'>-				    msg-&gt;sge[0].addr, msg-&gt;sge[0].length,</div><div class='del'>-				    DMA_TO_DEVICE);</div><div class='del'>-		for (i = 1; i &lt; msg-&gt;num_sge; i++)</div><div class='del'>-			ib_dma_unmap_page(t-&gt;cm_id-&gt;device,</div><div class='del'>-					  msg-&gt;sge[i].addr, msg-&gt;sge[i].length,</div><div class='del'>-					  DMA_TO_DEVICE);</div><div class='del'>-	}</div><div class='del'>-	mempool_free(msg, t-&gt;sendmsg_mempool);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int smb_direct_check_recvmsg(struct smb_direct_recvmsg *recvmsg)</div><div class='del'>-{</div><div class='del'>-	switch (recvmsg-&gt;type) {</div><div class='del'>-	case SMB_DIRECT_MSG_DATA_TRANSFER: {</div><div class='del'>-		struct smb_direct_data_transfer *req =</div><div class='del'>-			(struct smb_direct_data_transfer *)recvmsg-&gt;packet;</div><div class='del'>-		struct smb2_hdr *hdr = (struct smb2_hdr *)(recvmsg-&gt;packet</div><div class='del'>-				+ le32_to_cpu(req-&gt;data_offset) - 4);</div><div class='del'>-		ksmbd_debug(RDMA,</div><div class='del'>-			    "CreditGranted: %u, CreditRequested: %u, DataLength: %u, RemainingDataLength: %u, SMB: %x, Command: %u\n",</div><div class='del'>-			    le16_to_cpu(req-&gt;credits_granted),</div><div class='del'>-			    le16_to_cpu(req-&gt;credits_requested),</div><div class='del'>-			    req-&gt;data_length, req-&gt;remaining_data_length,</div><div class='del'>-			    hdr-&gt;ProtocolId, hdr-&gt;Command);</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-	case SMB_DIRECT_MSG_NEGOTIATE_REQ: {</div><div class='del'>-		struct smb_direct_negotiate_req *req =</div><div class='del'>-			(struct smb_direct_negotiate_req *)recvmsg-&gt;packet;</div><div class='del'>-		ksmbd_debug(RDMA,</div><div class='del'>-			    "MinVersion: %u, MaxVersion: %u, CreditRequested: %u, MaxSendSize: %u, MaxRecvSize: %u, MaxFragmentedSize: %u\n",</div><div class='del'>-			    le16_to_cpu(req-&gt;min_version),</div><div class='del'>-			    le16_to_cpu(req-&gt;max_version),</div><div class='del'>-			    le16_to_cpu(req-&gt;credits_requested),</div><div class='del'>-			    le32_to_cpu(req-&gt;preferred_send_size),</div><div class='del'>-			    le32_to_cpu(req-&gt;max_receive_size),</div><div class='del'>-			    le32_to_cpu(req-&gt;max_fragmented_size));</div><div class='del'>-		if (le16_to_cpu(req-&gt;min_version) &gt; 0x0100 ||</div><div class='del'>-		    le16_to_cpu(req-&gt;max_version) &lt; 0x0100)</div><div class='del'>-			return -EOPNOTSUPP;</div><div class='del'>-		if (le16_to_cpu(req-&gt;credits_requested) &lt;= 0 ||</div><div class='del'>-		    le32_to_cpu(req-&gt;max_receive_size) &lt;= 128 ||</div><div class='del'>-		    le32_to_cpu(req-&gt;max_fragmented_size) &lt;=</div><div class='del'>-					128 * 1024)</div><div class='del'>-			return -ECONNABORTED;</div><div class='del'>-</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-	default:</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void recv_done(struct ib_cq *cq, struct ib_wc *wc)</div><div class='del'>-{</div><div class='del'>-	struct smb_direct_recvmsg *recvmsg;</div><div class='del'>-	struct smb_direct_transport *t;</div><div class='del'>-</div><div class='del'>-	recvmsg = container_of(wc-&gt;wr_cqe, struct smb_direct_recvmsg, cqe);</div><div class='del'>-	t = recvmsg-&gt;transport;</div><div class='del'>-</div><div class='del'>-	if (wc-&gt;status != IB_WC_SUCCESS || wc-&gt;opcode != IB_WC_RECV) {</div><div class='del'>-		if (wc-&gt;status != IB_WC_WR_FLUSH_ERR) {</div><div class='del'>-			pr_err("Recv error. status='%s (%d)' opcode=%d\n",</div><div class='del'>-			       ib_wc_status_msg(wc-&gt;status), wc-&gt;status,</div><div class='del'>-			       wc-&gt;opcode);</div><div class='del'>-			smb_direct_disconnect_rdma_connection(t);</div><div class='del'>-		}</div><div class='del'>-		put_empty_recvmsg(t, recvmsg);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ksmbd_debug(RDMA, "Recv completed. status='%s (%d)', opcode=%d\n",</div><div class='del'>-		    ib_wc_status_msg(wc-&gt;status), wc-&gt;status,</div><div class='del'>-		    wc-&gt;opcode);</div><div class='del'>-</div><div class='del'>-	ib_dma_sync_single_for_cpu(wc-&gt;qp-&gt;device, recvmsg-&gt;sge.addr,</div><div class='del'>-				   recvmsg-&gt;sge.length, DMA_FROM_DEVICE);</div><div class='del'>-</div><div class='del'>-	switch (recvmsg-&gt;type) {</div><div class='del'>-	case SMB_DIRECT_MSG_NEGOTIATE_REQ:</div><div class='del'>-		if (wc-&gt;byte_len &lt; sizeof(struct smb_direct_negotiate_req)) {</div><div class='del'>-			put_empty_recvmsg(t, recvmsg);</div><div class='del'>-			return;</div><div class='del'>-		}</div><div class='del'>-		t-&gt;negotiation_requested = true;</div><div class='del'>-		t-&gt;full_packet_received = true;</div><div class='del'>-		wake_up_interruptible(&amp;t-&gt;wait_status);</div><div class='del'>-		break;</div><div class='del'>-	case SMB_DIRECT_MSG_DATA_TRANSFER: {</div><div class='del'>-		struct smb_direct_data_transfer *data_transfer =</div><div class='del'>-			(struct smb_direct_data_transfer *)recvmsg-&gt;packet;</div><div class='del'>-		unsigned int data_length;</div><div class='del'>-		int avail_recvmsg_count, receive_credits;</div><div class='del'>-</div><div class='del'>-		if (wc-&gt;byte_len &lt;</div><div class='del'>-		    offsetof(struct smb_direct_data_transfer, padding)) {</div><div class='del'>-			put_empty_recvmsg(t, recvmsg);</div><div class='del'>-			return;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		data_length = le32_to_cpu(data_transfer-&gt;data_length);</div><div class='del'>-		if (data_length) {</div><div class='del'>-			if (wc-&gt;byte_len &lt; sizeof(struct smb_direct_data_transfer) +</div><div class='del'>-			    (u64)data_length) {</div><div class='del'>-				put_empty_recvmsg(t, recvmsg);</div><div class='del'>-				return;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			if (t-&gt;full_packet_received)</div><div class='del'>-				recvmsg-&gt;first_segment = true;</div><div class='del'>-</div><div class='del'>-			if (le32_to_cpu(data_transfer-&gt;remaining_data_length))</div><div class='del'>-				t-&gt;full_packet_received = false;</div><div class='del'>-			else</div><div class='del'>-				t-&gt;full_packet_received = true;</div><div class='del'>-</div><div class='del'>-			enqueue_reassembly(t, recvmsg, (int)data_length);</div><div class='del'>-			wake_up_interruptible(&amp;t-&gt;wait_reassembly_queue);</div><div class='del'>-</div><div class='del'>-			spin_lock(&amp;t-&gt;receive_credit_lock);</div><div class='del'>-			receive_credits = --(t-&gt;recv_credits);</div><div class='del'>-			avail_recvmsg_count = t-&gt;count_avail_recvmsg;</div><div class='del'>-			spin_unlock(&amp;t-&gt;receive_credit_lock);</div><div class='del'>-		} else {</div><div class='del'>-			put_empty_recvmsg(t, recvmsg);</div><div class='del'>-</div><div class='del'>-			spin_lock(&amp;t-&gt;receive_credit_lock);</div><div class='del'>-			receive_credits = --(t-&gt;recv_credits);</div><div class='del'>-			avail_recvmsg_count = ++(t-&gt;count_avail_recvmsg);</div><div class='del'>-			spin_unlock(&amp;t-&gt;receive_credit_lock);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		t-&gt;recv_credit_target =</div><div class='del'>-				le16_to_cpu(data_transfer-&gt;credits_requested);</div><div class='del'>-		atomic_add(le16_to_cpu(data_transfer-&gt;credits_granted),</div><div class='del'>-			   &amp;t-&gt;send_credits);</div><div class='del'>-</div><div class='del'>-		if (le16_to_cpu(data_transfer-&gt;flags) &amp;</div><div class='del'>-		    SMB_DIRECT_RESPONSE_REQUESTED)</div><div class='del'>-			queue_work(smb_direct_wq, &amp;t-&gt;send_immediate_work);</div><div class='del'>-</div><div class='del'>-		if (atomic_read(&amp;t-&gt;send_credits) &gt; 0)</div><div class='del'>-			wake_up_interruptible(&amp;t-&gt;wait_send_credits);</div><div class='del'>-</div><div class='del'>-		if (is_receive_credit_post_required(receive_credits, avail_recvmsg_count))</div><div class='del'>-			mod_delayed_work(smb_direct_wq,</div><div class='del'>-					 &amp;t-&gt;post_recv_credits_work, 0);</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-	default:</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int smb_direct_post_recv(struct smb_direct_transport *t,</div><div class='del'>-				struct smb_direct_recvmsg *recvmsg)</div><div class='del'>-{</div><div class='del'>-	struct ib_recv_wr wr;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	recvmsg-&gt;sge.addr = ib_dma_map_single(t-&gt;cm_id-&gt;device,</div><div class='del'>-					      recvmsg-&gt;packet, t-&gt;max_recv_size,</div><div class='del'>-					      DMA_FROM_DEVICE);</div><div class='del'>-	ret = ib_dma_mapping_error(t-&gt;cm_id-&gt;device, recvmsg-&gt;sge.addr);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-	recvmsg-&gt;sge.length = t-&gt;max_recv_size;</div><div class='del'>-	recvmsg-&gt;sge.lkey = t-&gt;pd-&gt;local_dma_lkey;</div><div class='del'>-	recvmsg-&gt;cqe.done = recv_done;</div><div class='del'>-</div><div class='del'>-	wr.wr_cqe = &amp;recvmsg-&gt;cqe;</div><div class='del'>-	wr.next = NULL;</div><div class='del'>-	wr.sg_list = &amp;recvmsg-&gt;sge;</div><div class='del'>-	wr.num_sge = 1;</div><div class='del'>-</div><div class='del'>-	ret = ib_post_recv(t-&gt;qp, &amp;wr, NULL);</div><div class='del'>-	if (ret) {</div><div class='del'>-		pr_err("Can't post recv: %d\n", ret);</div><div class='del'>-		ib_dma_unmap_single(t-&gt;cm_id-&gt;device,</div><div class='del'>-				    recvmsg-&gt;sge.addr, recvmsg-&gt;sge.length,</div><div class='del'>-				    DMA_FROM_DEVICE);</div><div class='del'>-		smb_direct_disconnect_rdma_connection(t);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int smb_direct_read(struct ksmbd_transport *t, char *buf,</div><div class='del'>-			   unsigned int size)</div><div class='del'>-{</div><div class='del'>-	struct smb_direct_recvmsg *recvmsg;</div><div class='del'>-	struct smb_direct_data_transfer *data_transfer;</div><div class='del'>-	int to_copy, to_read, data_read, offset;</div><div class='del'>-	u32 data_length, remaining_data_length, data_offset;</div><div class='del'>-	int rc;</div><div class='del'>-	struct smb_direct_transport *st = smb_trans_direct_transfort(t);</div><div class='del'>-</div><div class='del'>-again:</div><div class='del'>-	if (st-&gt;status != SMB_DIRECT_CS_CONNECTED) {</div><div class='del'>-		pr_err("disconnected\n");</div><div class='del'>-		return -ENOTCONN;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * No need to hold the reassembly queue lock all the time as we are</div><div class='del'>-	 * the only one reading from the front of the queue. The transport</div><div class='del'>-	 * may add more entries to the back of the queue at the same time</div><div class='del'>-	 */</div><div class='del'>-	if (st-&gt;reassembly_data_length &gt;= size) {</div><div class='del'>-		int queue_length;</div><div class='del'>-		int queue_removed = 0;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Need to make sure reassembly_data_length is read before</div><div class='del'>-		 * reading reassembly_queue_length and calling</div><div class='del'>-		 * get_first_reassembly. This call is lock free</div><div class='del'>-		 * as we never read at the end of the queue which are being</div><div class='del'>-		 * updated in SOFTIRQ as more data is received</div><div class='del'>-		 */</div><div class='del'>-		virt_rmb();</div><div class='del'>-		queue_length = st-&gt;reassembly_queue_length;</div><div class='del'>-		data_read = 0;</div><div class='del'>-		to_read = size;</div><div class='del'>-		offset = st-&gt;first_entry_offset;</div><div class='del'>-		while (data_read &lt; size) {</div><div class='del'>-			recvmsg = get_first_reassembly(st);</div><div class='del'>-			data_transfer = smb_direct_recvmsg_payload(recvmsg);</div><div class='del'>-			data_length = le32_to_cpu(data_transfer-&gt;data_length);</div><div class='del'>-			remaining_data_length =</div><div class='del'>-				le32_to_cpu(data_transfer-&gt;remaining_data_length);</div><div class='del'>-			data_offset = le32_to_cpu(data_transfer-&gt;data_offset);</div><div class='del'>-</div><div class='del'>-			/*</div><div class='del'>-			 * The upper layer expects RFC1002 length at the</div><div class='del'>-			 * beginning of the payload. Return it to indicate</div><div class='del'>-			 * the total length of the packet. This minimize the</div><div class='del'>-			 * change to upper layer packet processing logic. This</div><div class='del'>-			 * will be eventually remove when an intermediate</div><div class='del'>-			 * transport layer is added</div><div class='del'>-			 */</div><div class='del'>-			if (recvmsg-&gt;first_segment &amp;&amp; size == 4) {</div><div class='del'>-				unsigned int rfc1002_len =</div><div class='del'>-					data_length + remaining_data_length;</div><div class='del'>-				*((__be32 *)buf) = cpu_to_be32(rfc1002_len);</div><div class='del'>-				data_read = 4;</div><div class='del'>-				recvmsg-&gt;first_segment = false;</div><div class='del'>-				ksmbd_debug(RDMA,</div><div class='del'>-					    "returning rfc1002 length %d\n",</div><div class='del'>-					    rfc1002_len);</div><div class='del'>-				goto read_rfc1002_done;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			to_copy = min_t(int, data_length - offset, to_read);</div><div class='del'>-			memcpy(buf + data_read, (char *)data_transfer + data_offset + offset,</div><div class='del'>-			       to_copy);</div><div class='del'>-</div><div class='del'>-			/* move on to the next buffer? */</div><div class='del'>-			if (to_copy == data_length - offset) {</div><div class='del'>-				queue_length--;</div><div class='del'>-				/*</div><div class='del'>-				 * No need to lock if we are not at the</div><div class='del'>-				 * end of the queue</div><div class='del'>-				 */</div><div class='del'>-				if (queue_length) {</div><div class='del'>-					list_del(&amp;recvmsg-&gt;list);</div><div class='del'>-				} else {</div><div class='del'>-					spin_lock_irq(&amp;st-&gt;reassembly_queue_lock);</div><div class='del'>-					list_del(&amp;recvmsg-&gt;list);</div><div class='del'>-					spin_unlock_irq(&amp;st-&gt;reassembly_queue_lock);</div><div class='del'>-				}</div><div class='del'>-				queue_removed++;</div><div class='del'>-				put_recvmsg(st, recvmsg);</div><div class='del'>-				offset = 0;</div><div class='del'>-			} else {</div><div class='del'>-				offset += to_copy;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			to_read -= to_copy;</div><div class='del'>-			data_read += to_copy;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		spin_lock_irq(&amp;st-&gt;reassembly_queue_lock);</div><div class='del'>-		st-&gt;reassembly_data_length -= data_read;</div><div class='del'>-		st-&gt;reassembly_queue_length -= queue_removed;</div><div class='del'>-		spin_unlock_irq(&amp;st-&gt;reassembly_queue_lock);</div><div class='del'>-</div><div class='del'>-		spin_lock(&amp;st-&gt;receive_credit_lock);</div><div class='del'>-		st-&gt;count_avail_recvmsg += queue_removed;</div><div class='del'>-		if (is_receive_credit_post_required(st-&gt;recv_credits, st-&gt;count_avail_recvmsg)) {</div><div class='del'>-			spin_unlock(&amp;st-&gt;receive_credit_lock);</div><div class='del'>-			mod_delayed_work(smb_direct_wq,</div><div class='del'>-					 &amp;st-&gt;post_recv_credits_work, 0);</div><div class='del'>-		} else {</div><div class='del'>-			spin_unlock(&amp;st-&gt;receive_credit_lock);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		st-&gt;first_entry_offset = offset;</div><div class='del'>-		ksmbd_debug(RDMA,</div><div class='del'>-			    "returning to thread data_read=%d reassembly_data_length=%d first_entry_offset=%d\n",</div><div class='del'>-			    data_read, st-&gt;reassembly_data_length,</div><div class='del'>-			    st-&gt;first_entry_offset);</div><div class='del'>-read_rfc1002_done:</div><div class='del'>-		return data_read;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ksmbd_debug(RDMA, "wait_event on more data\n");</div><div class='del'>-	rc = wait_event_interruptible(st-&gt;wait_reassembly_queue,</div><div class='del'>-				      st-&gt;reassembly_data_length &gt;= size ||</div><div class='del'>-				       st-&gt;status != SMB_DIRECT_CS_CONNECTED);</div><div class='del'>-	if (rc)</div><div class='del'>-		return -EINTR;</div><div class='del'>-</div><div class='del'>-	goto again;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void smb_direct_post_recv_credits(struct work_struct *work)</div><div class='del'>-{</div><div class='del'>-	struct smb_direct_transport *t = container_of(work,</div><div class='del'>-		struct smb_direct_transport, post_recv_credits_work.work);</div><div class='del'>-	struct smb_direct_recvmsg *recvmsg;</div><div class='del'>-	int receive_credits, credits = 0;</div><div class='del'>-	int ret;</div><div class='del'>-	int use_free = 1;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;t-&gt;receive_credit_lock);</div><div class='del'>-	receive_credits = t-&gt;recv_credits;</div><div class='del'>-	spin_unlock(&amp;t-&gt;receive_credit_lock);</div><div class='del'>-</div><div class='del'>-	if (receive_credits &lt; t-&gt;recv_credit_target) {</div><div class='del'>-		while (true) {</div><div class='del'>-			if (use_free)</div><div class='del'>-				recvmsg = get_free_recvmsg(t);</div><div class='del'>-			else</div><div class='del'>-				recvmsg = get_empty_recvmsg(t);</div><div class='del'>-			if (!recvmsg) {</div><div class='del'>-				if (use_free) {</div><div class='del'>-					use_free = 0;</div><div class='del'>-					continue;</div><div class='del'>-				} else {</div><div class='del'>-					break;</div><div class='del'>-				}</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			recvmsg-&gt;type = SMB_DIRECT_MSG_DATA_TRANSFER;</div><div class='del'>-			recvmsg-&gt;first_segment = false;</div><div class='del'>-</div><div class='del'>-			ret = smb_direct_post_recv(t, recvmsg);</div><div class='del'>-			if (ret) {</div><div class='del'>-				pr_err("Can't post recv: %d\n", ret);</div><div class='del'>-				put_recvmsg(t, recvmsg);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			credits++;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;t-&gt;receive_credit_lock);</div><div class='del'>-	t-&gt;recv_credits += credits;</div><div class='del'>-	t-&gt;count_avail_recvmsg -= credits;</div><div class='del'>-	spin_unlock(&amp;t-&gt;receive_credit_lock);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;t-&gt;lock_new_recv_credits);</div><div class='del'>-	t-&gt;new_recv_credits += credits;</div><div class='del'>-	spin_unlock(&amp;t-&gt;lock_new_recv_credits);</div><div class='del'>-</div><div class='del'>-	if (credits)</div><div class='del'>-		queue_work(smb_direct_wq, &amp;t-&gt;send_immediate_work);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void send_done(struct ib_cq *cq, struct ib_wc *wc)</div><div class='del'>-{</div><div class='del'>-	struct smb_direct_sendmsg *sendmsg, *sibling;</div><div class='del'>-	struct smb_direct_transport *t;</div><div class='del'>-	struct list_head *pos, *prev, *end;</div><div class='del'>-</div><div class='del'>-	sendmsg = container_of(wc-&gt;wr_cqe, struct smb_direct_sendmsg, cqe);</div><div class='del'>-	t = sendmsg-&gt;transport;</div><div class='del'>-</div><div class='del'>-	ksmbd_debug(RDMA, "Send completed. status='%s (%d)', opcode=%d\n",</div><div class='del'>-		    ib_wc_status_msg(wc-&gt;status), wc-&gt;status,</div><div class='del'>-		    wc-&gt;opcode);</div><div class='del'>-</div><div class='del'>-	if (wc-&gt;status != IB_WC_SUCCESS || wc-&gt;opcode != IB_WC_SEND) {</div><div class='del'>-		pr_err("Send error. status='%s (%d)', opcode=%d\n",</div><div class='del'>-		       ib_wc_status_msg(wc-&gt;status), wc-&gt;status,</div><div class='del'>-		       wc-&gt;opcode);</div><div class='del'>-		smb_direct_disconnect_rdma_connection(t);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (sendmsg-&gt;num_sge &gt; 1) {</div><div class='del'>-		if (atomic_dec_and_test(&amp;t-&gt;send_payload_pending))</div><div class='del'>-			wake_up(&amp;t-&gt;wait_send_payload_pending);</div><div class='del'>-	} else {</div><div class='del'>-		if (atomic_dec_and_test(&amp;t-&gt;send_pending))</div><div class='del'>-			wake_up(&amp;t-&gt;wait_send_pending);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* iterate and free the list of messages in reverse. the list's head</div><div class='del'>-	 * is invalid.</div><div class='del'>-	 */</div><div class='del'>-	for (pos = &amp;sendmsg-&gt;list, prev = pos-&gt;prev, end = sendmsg-&gt;list.next;</div><div class='del'>-	     prev != end; pos = prev, prev = prev-&gt;prev) {</div><div class='del'>-		sibling = container_of(pos, struct smb_direct_sendmsg, list);</div><div class='del'>-		smb_direct_free_sendmsg(t, sibling);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	sibling = container_of(pos, struct smb_direct_sendmsg, list);</div><div class='del'>-	smb_direct_free_sendmsg(t, sibling);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int manage_credits_prior_sending(struct smb_direct_transport *t)</div><div class='del'>-{</div><div class='del'>-	int new_credits;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;t-&gt;lock_new_recv_credits);</div><div class='del'>-	new_credits = t-&gt;new_recv_credits;</div><div class='del'>-	t-&gt;new_recv_credits = 0;</div><div class='del'>-	spin_unlock(&amp;t-&gt;lock_new_recv_credits);</div><div class='del'>-</div><div class='del'>-	return new_credits;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int smb_direct_post_send(struct smb_direct_transport *t,</div><div class='del'>-				struct ib_send_wr *wr)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (wr-&gt;num_sge &gt; 1)</div><div class='del'>-		atomic_inc(&amp;t-&gt;send_payload_pending);</div><div class='del'>-	else</div><div class='del'>-		atomic_inc(&amp;t-&gt;send_pending);</div><div class='del'>-</div><div class='del'>-	ret = ib_post_send(t-&gt;qp, wr, NULL);</div><div class='del'>-	if (ret) {</div><div class='del'>-		pr_err("failed to post send: %d\n", ret);</div><div class='del'>-		if (wr-&gt;num_sge &gt; 1) {</div><div class='del'>-			if (atomic_dec_and_test(&amp;t-&gt;send_payload_pending))</div><div class='del'>-				wake_up(&amp;t-&gt;wait_send_payload_pending);</div><div class='del'>-		} else {</div><div class='del'>-			if (atomic_dec_and_test(&amp;t-&gt;send_pending))</div><div class='del'>-				wake_up(&amp;t-&gt;wait_send_pending);</div><div class='del'>-		}</div><div class='del'>-		smb_direct_disconnect_rdma_connection(t);</div><div class='del'>-	}</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void smb_direct_send_ctx_init(struct smb_direct_transport *t,</div><div class='del'>-				     struct smb_direct_send_ctx *send_ctx,</div><div class='del'>-				     bool need_invalidate_rkey,</div><div class='del'>-				     unsigned int remote_key)</div><div class='del'>-{</div><div class='del'>-	INIT_LIST_HEAD(&amp;send_ctx-&gt;msg_list);</div><div class='del'>-	send_ctx-&gt;wr_cnt = 0;</div><div class='del'>-	send_ctx-&gt;need_invalidate_rkey = need_invalidate_rkey;</div><div class='del'>-	send_ctx-&gt;remote_key = remote_key;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int smb_direct_flush_send_list(struct smb_direct_transport *t,</div><div class='del'>-				      struct smb_direct_send_ctx *send_ctx,</div><div class='del'>-				      bool is_last)</div><div class='del'>-{</div><div class='del'>-	struct smb_direct_sendmsg *first, *last;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (list_empty(&amp;send_ctx-&gt;msg_list))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	first = list_first_entry(&amp;send_ctx-&gt;msg_list,</div><div class='del'>-				 struct smb_direct_sendmsg,</div><div class='del'>-				 list);</div><div class='del'>-	last = list_last_entry(&amp;send_ctx-&gt;msg_list,</div><div class='del'>-			       struct smb_direct_sendmsg,</div><div class='del'>-			       list);</div><div class='del'>-</div><div class='del'>-	last-&gt;wr.send_flags = IB_SEND_SIGNALED;</div><div class='del'>-	last-&gt;wr.wr_cqe = &amp;last-&gt;cqe;</div><div class='del'>-	if (is_last &amp;&amp; send_ctx-&gt;need_invalidate_rkey) {</div><div class='del'>-		last-&gt;wr.opcode = IB_WR_SEND_WITH_INV;</div><div class='del'>-		last-&gt;wr.ex.invalidate_rkey = send_ctx-&gt;remote_key;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = smb_direct_post_send(t, &amp;first-&gt;wr);</div><div class='del'>-	if (!ret) {</div><div class='del'>-		smb_direct_send_ctx_init(t, send_ctx,</div><div class='del'>-					 send_ctx-&gt;need_invalidate_rkey,</div><div class='del'>-					 send_ctx-&gt;remote_key);</div><div class='del'>-	} else {</div><div class='del'>-		atomic_add(send_ctx-&gt;wr_cnt, &amp;t-&gt;send_credits);</div><div class='del'>-		wake_up(&amp;t-&gt;wait_send_credits);</div><div class='del'>-		list_for_each_entry_safe(first, last, &amp;send_ctx-&gt;msg_list,</div><div class='del'>-					 list) {</div><div class='del'>-			smb_direct_free_sendmsg(t, first);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int wait_for_credits(struct smb_direct_transport *t,</div><div class='del'>-			    wait_queue_head_t *waitq, atomic_t *credits)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	do {</div><div class='del'>-		if (atomic_dec_return(credits) &gt;= 0)</div><div class='del'>-			return 0;</div><div class='del'>-</div><div class='del'>-		atomic_inc(credits);</div><div class='del'>-		ret = wait_event_interruptible(*waitq,</div><div class='del'>-					       atomic_read(credits) &gt; 0 ||</div><div class='del'>-						t-&gt;status != SMB_DIRECT_CS_CONNECTED);</div><div class='del'>-</div><div class='del'>-		if (t-&gt;status != SMB_DIRECT_CS_CONNECTED)</div><div class='del'>-			return -ENOTCONN;</div><div class='del'>-		else if (ret &lt; 0)</div><div class='del'>-			return ret;</div><div class='del'>-	} while (true);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int wait_for_send_credits(struct smb_direct_transport *t,</div><div class='del'>-				 struct smb_direct_send_ctx *send_ctx)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (send_ctx &amp;&amp;</div><div class='del'>-	    (send_ctx-&gt;wr_cnt &gt;= 16 || atomic_read(&amp;t-&gt;send_credits) &lt;= 1)) {</div><div class='del'>-		ret = smb_direct_flush_send_list(t, send_ctx, false);</div><div class='del'>-		if (ret)</div><div class='del'>-			return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return wait_for_credits(t, &amp;t-&gt;wait_send_credits, &amp;t-&gt;send_credits);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int smb_direct_create_header(struct smb_direct_transport *t,</div><div class='del'>-				    int size, int remaining_data_length,</div><div class='del'>-				    struct smb_direct_sendmsg **sendmsg_out)</div><div class='del'>-{</div><div class='del'>-	struct smb_direct_sendmsg *sendmsg;</div><div class='del'>-	struct smb_direct_data_transfer *packet;</div><div class='del'>-	int header_length;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	sendmsg = smb_direct_alloc_sendmsg(t);</div><div class='del'>-	if (IS_ERR(sendmsg))</div><div class='del'>-		return PTR_ERR(sendmsg);</div><div class='del'>-</div><div class='del'>-	/* Fill in the packet header */</div><div class='del'>-	packet = (struct smb_direct_data_transfer *)sendmsg-&gt;packet;</div><div class='del'>-	packet-&gt;credits_requested = cpu_to_le16(t-&gt;send_credit_target);</div><div class='del'>-	packet-&gt;credits_granted = cpu_to_le16(manage_credits_prior_sending(t));</div><div class='del'>-</div><div class='del'>-	packet-&gt;flags = 0;</div><div class='del'>-	packet-&gt;reserved = 0;</div><div class='del'>-	if (!size)</div><div class='del'>-		packet-&gt;data_offset = 0;</div><div class='del'>-	else</div><div class='del'>-		packet-&gt;data_offset = cpu_to_le32(24);</div><div class='del'>-	packet-&gt;data_length = cpu_to_le32(size);</div><div class='del'>-	packet-&gt;remaining_data_length = cpu_to_le32(remaining_data_length);</div><div class='del'>-	packet-&gt;padding = 0;</div><div class='del'>-</div><div class='del'>-	ksmbd_debug(RDMA,</div><div class='del'>-		    "credits_requested=%d credits_granted=%d data_offset=%d data_length=%d remaining_data_length=%d\n",</div><div class='del'>-		    le16_to_cpu(packet-&gt;credits_requested),</div><div class='del'>-		    le16_to_cpu(packet-&gt;credits_granted),</div><div class='del'>-		    le32_to_cpu(packet-&gt;data_offset),</div><div class='del'>-		    le32_to_cpu(packet-&gt;data_length),</div><div class='del'>-		    le32_to_cpu(packet-&gt;remaining_data_length));</div><div class='del'>-</div><div class='del'>-	/* Map the packet to DMA */</div><div class='del'>-	header_length = sizeof(struct smb_direct_data_transfer);</div><div class='del'>-	/* If this is a packet without payload, don't send padding */</div><div class='del'>-	if (!size)</div><div class='del'>-		header_length =</div><div class='del'>-			offsetof(struct smb_direct_data_transfer, padding);</div><div class='del'>-</div><div class='del'>-	sendmsg-&gt;sge[0].addr = ib_dma_map_single(t-&gt;cm_id-&gt;device,</div><div class='del'>-						 (void *)packet,</div><div class='del'>-						 header_length,</div><div class='del'>-						 DMA_TO_DEVICE);</div><div class='del'>-	ret = ib_dma_mapping_error(t-&gt;cm_id-&gt;device, sendmsg-&gt;sge[0].addr);</div><div class='del'>-	if (ret) {</div><div class='del'>-		smb_direct_free_sendmsg(t, sendmsg);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	sendmsg-&gt;num_sge = 1;</div><div class='del'>-	sendmsg-&gt;sge[0].length = header_length;</div><div class='del'>-	sendmsg-&gt;sge[0].lkey = t-&gt;pd-&gt;local_dma_lkey;</div><div class='del'>-</div><div class='del'>-	*sendmsg_out = sendmsg;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int get_sg_list(void *buf, int size, struct scatterlist *sg_list, int nentries)</div><div class='del'>-{</div><div class='del'>-	bool high = is_vmalloc_addr(buf);</div><div class='del'>-	struct page *page;</div><div class='del'>-	int offset, len;</div><div class='del'>-	int i = 0;</div><div class='del'>-</div><div class='del'>-	if (nentries &lt; get_buf_page_count(buf, size))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	offset = offset_in_page(buf);</div><div class='del'>-	buf -= offset;</div><div class='del'>-	while (size &gt; 0) {</div><div class='del'>-		len = min_t(int, PAGE_SIZE - offset, size);</div><div class='del'>-		if (high)</div><div class='del'>-			page = vmalloc_to_page(buf);</div><div class='del'>-		else</div><div class='del'>-			page = kmap_to_page(buf);</div><div class='del'>-</div><div class='del'>-		if (!sg_list)</div><div class='del'>-			return -EINVAL;</div><div class='del'>-		sg_set_page(sg_list, page, len, offset);</div><div class='del'>-		sg_list = sg_next(sg_list);</div><div class='del'>-</div><div class='del'>-		buf += PAGE_SIZE;</div><div class='del'>-		size -= len;</div><div class='del'>-		offset = 0;</div><div class='del'>-		i++;</div><div class='del'>-	}</div><div class='del'>-	return i;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int get_mapped_sg_list(struct ib_device *device, void *buf, int size,</div><div class='del'>-			      struct scatterlist *sg_list, int nentries,</div><div class='del'>-			      enum dma_data_direction dir)</div><div class='del'>-{</div><div class='del'>-	int npages;</div><div class='del'>-</div><div class='del'>-	npages = get_sg_list(buf, size, sg_list, nentries);</div><div class='del'>-	if (npages &lt;= 0)</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	return ib_dma_map_sg(device, sg_list, npages, dir);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int post_sendmsg(struct smb_direct_transport *t,</div><div class='del'>-			struct smb_direct_send_ctx *send_ctx,</div><div class='del'>-			struct smb_direct_sendmsg *msg)</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; msg-&gt;num_sge; i++)</div><div class='del'>-		ib_dma_sync_single_for_device(t-&gt;cm_id-&gt;device,</div><div class='del'>-					      msg-&gt;sge[i].addr, msg-&gt;sge[i].length,</div><div class='del'>-					      DMA_TO_DEVICE);</div><div class='del'>-</div><div class='del'>-	msg-&gt;cqe.done = send_done;</div><div class='del'>-	msg-&gt;wr.opcode = IB_WR_SEND;</div><div class='del'>-	msg-&gt;wr.sg_list = &amp;msg-&gt;sge[0];</div><div class='del'>-	msg-&gt;wr.num_sge = msg-&gt;num_sge;</div><div class='del'>-	msg-&gt;wr.next = NULL;</div><div class='del'>-</div><div class='del'>-	if (send_ctx) {</div><div class='del'>-		msg-&gt;wr.wr_cqe = NULL;</div><div class='del'>-		msg-&gt;wr.send_flags = 0;</div><div class='del'>-		if (!list_empty(&amp;send_ctx-&gt;msg_list)) {</div><div class='del'>-			struct smb_direct_sendmsg *last;</div><div class='del'>-</div><div class='del'>-			last = list_last_entry(&amp;send_ctx-&gt;msg_list,</div><div class='del'>-					       struct smb_direct_sendmsg,</div><div class='del'>-					       list);</div><div class='del'>-			last-&gt;wr.next = &amp;msg-&gt;wr;</div><div class='del'>-		}</div><div class='del'>-		list_add_tail(&amp;msg-&gt;list, &amp;send_ctx-&gt;msg_list);</div><div class='del'>-		send_ctx-&gt;wr_cnt++;</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	msg-&gt;wr.wr_cqe = &amp;msg-&gt;cqe;</div><div class='del'>-	msg-&gt;wr.send_flags = IB_SEND_SIGNALED;</div><div class='del'>-	return smb_direct_post_send(t, &amp;msg-&gt;wr);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int smb_direct_post_send_data(struct smb_direct_transport *t,</div><div class='del'>-				     struct smb_direct_send_ctx *send_ctx,</div><div class='del'>-				     struct kvec *iov, int niov,</div><div class='del'>-				     int remaining_data_length)</div><div class='del'>-{</div><div class='del'>-	int i, j, ret;</div><div class='del'>-	struct smb_direct_sendmsg *msg;</div><div class='del'>-	int data_length;</div><div class='del'>-	struct scatterlist sg[SMB_DIRECT_MAX_SEND_SGES - 1];</div><div class='del'>-</div><div class='del'>-	ret = wait_for_send_credits(t, send_ctx);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	data_length = 0;</div><div class='del'>-	for (i = 0; i &lt; niov; i++)</div><div class='del'>-		data_length += iov[i].iov_len;</div><div class='del'>-</div><div class='del'>-	ret = smb_direct_create_header(t, data_length, remaining_data_length,</div><div class='del'>-				       &amp;msg);</div><div class='del'>-	if (ret) {</div><div class='del'>-		atomic_inc(&amp;t-&gt;send_credits);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; niov; i++) {</div><div class='del'>-		struct ib_sge *sge;</div><div class='del'>-		int sg_cnt;</div><div class='del'>-</div><div class='del'>-		sg_init_table(sg, SMB_DIRECT_MAX_SEND_SGES - 1);</div><div class='del'>-		sg_cnt = get_mapped_sg_list(t-&gt;cm_id-&gt;device,</div><div class='del'>-					    iov[i].iov_base, iov[i].iov_len,</div><div class='del'>-					    sg, SMB_DIRECT_MAX_SEND_SGES - 1,</div><div class='del'>-					    DMA_TO_DEVICE);</div><div class='del'>-		if (sg_cnt &lt;= 0) {</div><div class='del'>-			pr_err("failed to map buffer\n");</div><div class='del'>-			ret = -ENOMEM;</div><div class='del'>-			goto err;</div><div class='del'>-		} else if (sg_cnt + msg-&gt;num_sge &gt; SMB_DIRECT_MAX_SEND_SGES) {</div><div class='del'>-			pr_err("buffer not fitted into sges\n");</div><div class='del'>-			ret = -E2BIG;</div><div class='del'>-			ib_dma_unmap_sg(t-&gt;cm_id-&gt;device, sg, sg_cnt,</div><div class='del'>-					DMA_TO_DEVICE);</div><div class='del'>-			goto err;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		for (j = 0; j &lt; sg_cnt; j++) {</div><div class='del'>-			sge = &amp;msg-&gt;sge[msg-&gt;num_sge];</div><div class='del'>-			sge-&gt;addr = sg_dma_address(&amp;sg[j]);</div><div class='del'>-			sge-&gt;length = sg_dma_len(&amp;sg[j]);</div><div class='del'>-			sge-&gt;lkey  = t-&gt;pd-&gt;local_dma_lkey;</div><div class='del'>-			msg-&gt;num_sge++;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = post_sendmsg(t, send_ctx, msg);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto err;</div><div class='del'>-	return 0;</div><div class='del'>-err:</div><div class='del'>-	smb_direct_free_sendmsg(t, msg);</div><div class='del'>-	atomic_inc(&amp;t-&gt;send_credits);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int smb_direct_writev(struct ksmbd_transport *t,</div><div class='del'>-			     struct kvec *iov, int niovs, int buflen,</div><div class='del'>-			     bool need_invalidate, unsigned int remote_key)</div><div class='del'>-{</div><div class='del'>-	struct smb_direct_transport *st = smb_trans_direct_transfort(t);</div><div class='del'>-	int remaining_data_length;</div><div class='del'>-	int start, i, j;</div><div class='del'>-	int max_iov_size = st-&gt;max_send_size -</div><div class='del'>-			sizeof(struct smb_direct_data_transfer);</div><div class='del'>-	int ret;</div><div class='del'>-	struct kvec vec;</div><div class='del'>-	struct smb_direct_send_ctx send_ctx;</div><div class='del'>-</div><div class='del'>-	if (st-&gt;status != SMB_DIRECT_CS_CONNECTED)</div><div class='del'>-		return -ENOTCONN;</div><div class='del'>-</div><div class='del'>-	//FIXME: skip RFC1002 header..</div><div class='del'>-	buflen -= 4;</div><div class='del'>-	iov[0].iov_base += 4;</div><div class='del'>-	iov[0].iov_len -= 4;</div><div class='del'>-</div><div class='del'>-	remaining_data_length = buflen;</div><div class='del'>-	ksmbd_debug(RDMA, "Sending smb (RDMA): smb_len=%u\n", buflen);</div><div class='del'>-</div><div class='del'>-	smb_direct_send_ctx_init(st, &amp;send_ctx, need_invalidate, remote_key);</div><div class='del'>-	start = i = 0;</div><div class='del'>-	buflen = 0;</div><div class='del'>-	while (true) {</div><div class='del'>-		buflen += iov[i].iov_len;</div><div class='del'>-		if (buflen &gt; max_iov_size) {</div><div class='del'>-			if (i &gt; start) {</div><div class='del'>-				remaining_data_length -=</div><div class='del'>-					(buflen - iov[i].iov_len);</div><div class='del'>-				ret = smb_direct_post_send_data(st, &amp;send_ctx,</div><div class='del'>-								&amp;iov[start], i - start,</div><div class='del'>-								remaining_data_length);</div><div class='del'>-				if (ret)</div><div class='del'>-					goto done;</div><div class='del'>-			} else {</div><div class='del'>-				/* iov[start] is too big, break it */</div><div class='del'>-				int nvec  = (buflen + max_iov_size - 1) /</div><div class='del'>-						max_iov_size;</div><div class='del'>-</div><div class='del'>-				for (j = 0; j &lt; nvec; j++) {</div><div class='del'>-					vec.iov_base =</div><div class='del'>-						(char *)iov[start].iov_base +</div><div class='del'>-						j * max_iov_size;</div><div class='del'>-					vec.iov_len =</div><div class='del'>-						min_t(int, max_iov_size,</div><div class='del'>-						      buflen - max_iov_size * j);</div><div class='del'>-					remaining_data_length -= vec.iov_len;</div><div class='del'>-					ret = smb_direct_post_send_data(st, &amp;send_ctx, &amp;vec, 1,</div><div class='del'>-									remaining_data_length);</div><div class='del'>-					if (ret)</div><div class='del'>-						goto done;</div><div class='del'>-				}</div><div class='del'>-				i++;</div><div class='del'>-				if (i == niovs)</div><div class='del'>-					break;</div><div class='del'>-			}</div><div class='del'>-			start = i;</div><div class='del'>-			buflen = 0;</div><div class='del'>-		} else {</div><div class='del'>-			i++;</div><div class='del'>-			if (i == niovs) {</div><div class='del'>-				/* send out all remaining vecs */</div><div class='del'>-				remaining_data_length -= buflen;</div><div class='del'>-				ret = smb_direct_post_send_data(st, &amp;send_ctx,</div><div class='del'>-								&amp;iov[start], i - start,</div><div class='del'>-								remaining_data_length);</div><div class='del'>-				if (ret)</div><div class='del'>-					goto done;</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-done:</div><div class='del'>-	ret = smb_direct_flush_send_list(st, &amp;send_ctx, true);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * As an optimization, we don't wait for individual I/O to finish</div><div class='del'>-	 * before sending the next one.</div><div class='del'>-	 * Send them all and wait for pending send count to get to 0</div><div class='del'>-	 * that means all the I/Os have been out and we are good to return</div><div class='del'>-	 */</div><div class='del'>-</div><div class='del'>-	wait_event(st-&gt;wait_send_payload_pending,</div><div class='del'>-		   atomic_read(&amp;st-&gt;send_payload_pending) == 0);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void read_write_done(struct ib_cq *cq, struct ib_wc *wc,</div><div class='del'>-			    enum dma_data_direction dir)</div><div class='del'>-{</div><div class='del'>-	struct smb_direct_rdma_rw_msg *msg = container_of(wc-&gt;wr_cqe,</div><div class='del'>-							  struct smb_direct_rdma_rw_msg, cqe);</div><div class='del'>-	struct smb_direct_transport *t = msg-&gt;t;</div><div class='del'>-</div><div class='del'>-	if (wc-&gt;status != IB_WC_SUCCESS) {</div><div class='del'>-		pr_err("read/write error. opcode = %d, status = %s(%d)\n",</div><div class='del'>-		       wc-&gt;opcode, ib_wc_status_msg(wc-&gt;status), wc-&gt;status);</div><div class='del'>-		smb_direct_disconnect_rdma_connection(t);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (atomic_inc_return(&amp;t-&gt;rw_avail_ops) &gt; 0)</div><div class='del'>-		wake_up(&amp;t-&gt;wait_rw_avail_ops);</div><div class='del'>-</div><div class='del'>-	rdma_rw_ctx_destroy(&amp;msg-&gt;rw_ctx, t-&gt;qp, t-&gt;qp-&gt;port,</div><div class='del'>-			    msg-&gt;sg_list, msg-&gt;sgt.nents, dir);</div><div class='del'>-	sg_free_table_chained(&amp;msg-&gt;sgt, SG_CHUNK_SIZE);</div><div class='del'>-	complete(msg-&gt;completion);</div><div class='del'>-	kfree(msg);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void read_done(struct ib_cq *cq, struct ib_wc *wc)</div><div class='del'>-{</div><div class='del'>-	read_write_done(cq, wc, DMA_FROM_DEVICE);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void write_done(struct ib_cq *cq, struct ib_wc *wc)</div><div class='del'>-{</div><div class='del'>-	read_write_done(cq, wc, DMA_TO_DEVICE);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int smb_direct_rdma_xmit(struct smb_direct_transport *t, void *buf,</div><div class='del'>-				int buf_len, u32 remote_key, u64 remote_offset,</div><div class='del'>-				u32 remote_len, bool is_read)</div><div class='del'>-{</div><div class='del'>-	struct smb_direct_rdma_rw_msg *msg;</div><div class='del'>-	int ret;</div><div class='del'>-	DECLARE_COMPLETION_ONSTACK(completion);</div><div class='del'>-	struct ib_send_wr *first_wr = NULL;</div><div class='del'>-</div><div class='del'>-	ret = wait_for_credits(t, &amp;t-&gt;wait_rw_avail_ops, &amp;t-&gt;rw_avail_ops);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	/* TODO: mempool */</div><div class='del'>-	msg = kmalloc(offsetof(struct smb_direct_rdma_rw_msg, sg_list) +</div><div class='del'>-		      sizeof(struct scatterlist) * SG_CHUNK_SIZE, GFP_KERNEL);</div><div class='del'>-	if (!msg) {</div><div class='del'>-		atomic_inc(&amp;t-&gt;rw_avail_ops);</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	msg-&gt;sgt.sgl = &amp;msg-&gt;sg_list[0];</div><div class='del'>-	ret = sg_alloc_table_chained(&amp;msg-&gt;sgt,</div><div class='del'>-				     get_buf_page_count(buf, buf_len),</div><div class='del'>-				     msg-&gt;sg_list, SG_CHUNK_SIZE);</div><div class='del'>-	if (ret) {</div><div class='del'>-		atomic_inc(&amp;t-&gt;rw_avail_ops);</div><div class='del'>-		kfree(msg);</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = get_sg_list(buf, buf_len, msg-&gt;sgt.sgl, msg-&gt;sgt.orig_nents);</div><div class='del'>-	if (ret &lt;= 0) {</div><div class='del'>-		pr_err("failed to get pages\n");</div><div class='del'>-		goto err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = rdma_rw_ctx_init(&amp;msg-&gt;rw_ctx, t-&gt;qp, t-&gt;qp-&gt;port,</div><div class='del'>-			       msg-&gt;sg_list, get_buf_page_count(buf, buf_len),</div><div class='del'>-			       0, remote_offset, remote_key,</div><div class='del'>-			       is_read ? DMA_FROM_DEVICE : DMA_TO_DEVICE);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		pr_err("failed to init rdma_rw_ctx: %d\n", ret);</div><div class='del'>-		goto err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	msg-&gt;t = t;</div><div class='del'>-	msg-&gt;cqe.done = is_read ? read_done : write_done;</div><div class='del'>-	msg-&gt;completion = &amp;completion;</div><div class='del'>-	first_wr = rdma_rw_ctx_wrs(&amp;msg-&gt;rw_ctx, t-&gt;qp, t-&gt;qp-&gt;port,</div><div class='del'>-				   &amp;msg-&gt;cqe, NULL);</div><div class='del'>-</div><div class='del'>-	ret = ib_post_send(t-&gt;qp, first_wr, NULL);</div><div class='del'>-	if (ret) {</div><div class='del'>-		pr_err("failed to post send wr: %d\n", ret);</div><div class='del'>-		goto err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	wait_for_completion(&amp;completion);</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-err:</div><div class='del'>-	atomic_inc(&amp;t-&gt;rw_avail_ops);</div><div class='del'>-	if (first_wr)</div><div class='del'>-		rdma_rw_ctx_destroy(&amp;msg-&gt;rw_ctx, t-&gt;qp, t-&gt;qp-&gt;port,</div><div class='del'>-				    msg-&gt;sg_list, msg-&gt;sgt.nents,</div><div class='del'>-				    is_read ? DMA_FROM_DEVICE : DMA_TO_DEVICE);</div><div class='del'>-	sg_free_table_chained(&amp;msg-&gt;sgt, SG_CHUNK_SIZE);</div><div class='del'>-	kfree(msg);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int smb_direct_rdma_write(struct ksmbd_transport *t, void *buf,</div><div class='del'>-				 unsigned int buflen, u32 remote_key,</div><div class='del'>-				 u64 remote_offset, u32 remote_len)</div><div class='del'>-{</div><div class='del'>-	return smb_direct_rdma_xmit(smb_trans_direct_transfort(t), buf, buflen,</div><div class='del'>-				    remote_key, remote_offset,</div><div class='del'>-				    remote_len, false);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int smb_direct_rdma_read(struct ksmbd_transport *t, void *buf,</div><div class='del'>-				unsigned int buflen, u32 remote_key,</div><div class='del'>-				u64 remote_offset, u32 remote_len)</div><div class='del'>-{</div><div class='del'>-	return smb_direct_rdma_xmit(smb_trans_direct_transfort(t), buf, buflen,</div><div class='del'>-				    remote_key, remote_offset,</div><div class='del'>-				    remote_len, true);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void smb_direct_disconnect(struct ksmbd_transport *t)</div><div class='del'>-{</div><div class='del'>-	struct smb_direct_transport *st = smb_trans_direct_transfort(t);</div><div class='del'>-</div><div class='del'>-	ksmbd_debug(RDMA, "Disconnecting cm_id=%p\n", st-&gt;cm_id);</div><div class='del'>-</div><div class='del'>-	smb_direct_disconnect_rdma_work(&amp;st-&gt;disconnect_work);</div><div class='del'>-	wait_event_interruptible(st-&gt;wait_status,</div><div class='del'>-				 st-&gt;status == SMB_DIRECT_CS_DISCONNECTED);</div><div class='del'>-	free_transport(st);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int smb_direct_cm_handler(struct rdma_cm_id *cm_id,</div><div class='del'>-				 struct rdma_cm_event *event)</div><div class='del'>-{</div><div class='del'>-	struct smb_direct_transport *t = cm_id-&gt;context;</div><div class='del'>-</div><div class='del'>-	ksmbd_debug(RDMA, "RDMA CM event. cm_id=%p event=%s (%d)\n",</div><div class='del'>-		    cm_id, rdma_event_msg(event-&gt;event), event-&gt;event);</div><div class='del'>-</div><div class='del'>-	switch (event-&gt;event) {</div><div class='del'>-	case RDMA_CM_EVENT_ESTABLISHED: {</div><div class='del'>-		t-&gt;status = SMB_DIRECT_CS_CONNECTED;</div><div class='del'>-		wake_up_interruptible(&amp;t-&gt;wait_status);</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-	case RDMA_CM_EVENT_DEVICE_REMOVAL:</div><div class='del'>-	case RDMA_CM_EVENT_DISCONNECTED: {</div><div class='del'>-		t-&gt;status = SMB_DIRECT_CS_DISCONNECTED;</div><div class='del'>-		wake_up_interruptible(&amp;t-&gt;wait_status);</div><div class='del'>-		wake_up_interruptible(&amp;t-&gt;wait_reassembly_queue);</div><div class='del'>-		wake_up(&amp;t-&gt;wait_send_credits);</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-	case RDMA_CM_EVENT_CONNECT_ERROR: {</div><div class='del'>-		t-&gt;status = SMB_DIRECT_CS_DISCONNECTED;</div><div class='del'>-		wake_up_interruptible(&amp;t-&gt;wait_status);</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-	default:</div><div class='del'>-		pr_err("Unexpected RDMA CM event. cm_id=%p, event=%s (%d)\n",</div><div class='del'>-		       cm_id, rdma_event_msg(event-&gt;event),</div><div class='del'>-		       event-&gt;event);</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void smb_direct_qpair_handler(struct ib_event *event, void *context)</div><div class='del'>-{</div><div class='del'>-	struct smb_direct_transport *t = context;</div><div class='del'>-</div><div class='del'>-	ksmbd_debug(RDMA, "Received QP event. cm_id=%p, event=%s (%d)\n",</div><div class='del'>-		    t-&gt;cm_id, ib_event_msg(event-&gt;event), event-&gt;event);</div><div class='del'>-</div><div class='del'>-	switch (event-&gt;event) {</div><div class='del'>-	case IB_EVENT_CQ_ERR:</div><div class='del'>-	case IB_EVENT_QP_FATAL:</div><div class='del'>-		smb_direct_disconnect_rdma_connection(t);</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int smb_direct_send_negotiate_response(struct smb_direct_transport *t,</div><div class='del'>-					      int failed)</div><div class='del'>-{</div><div class='del'>-	struct smb_direct_sendmsg *sendmsg;</div><div class='del'>-	struct smb_direct_negotiate_resp *resp;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	sendmsg = smb_direct_alloc_sendmsg(t);</div><div class='del'>-	if (IS_ERR(sendmsg))</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	resp = (struct smb_direct_negotiate_resp *)sendmsg-&gt;packet;</div><div class='del'>-	if (failed) {</div><div class='del'>-		memset(resp, 0, sizeof(*resp));</div><div class='del'>-		resp-&gt;min_version = cpu_to_le16(0x0100);</div><div class='del'>-		resp-&gt;max_version = cpu_to_le16(0x0100);</div><div class='del'>-		resp-&gt;status = STATUS_NOT_SUPPORTED;</div><div class='del'>-	} else {</div><div class='del'>-		resp-&gt;status = STATUS_SUCCESS;</div><div class='del'>-		resp-&gt;min_version = SMB_DIRECT_VERSION_LE;</div><div class='del'>-		resp-&gt;max_version = SMB_DIRECT_VERSION_LE;</div><div class='del'>-		resp-&gt;negotiated_version = SMB_DIRECT_VERSION_LE;</div><div class='del'>-		resp-&gt;reserved = 0;</div><div class='del'>-		resp-&gt;credits_requested =</div><div class='del'>-				cpu_to_le16(t-&gt;send_credit_target);</div><div class='del'>-		resp-&gt;credits_granted = cpu_to_le16(manage_credits_prior_sending(t));</div><div class='del'>-		resp-&gt;max_readwrite_size = cpu_to_le32(t-&gt;max_rdma_rw_size);</div><div class='del'>-		resp-&gt;preferred_send_size = cpu_to_le32(t-&gt;max_send_size);</div><div class='del'>-		resp-&gt;max_receive_size = cpu_to_le32(t-&gt;max_recv_size);</div><div class='del'>-		resp-&gt;max_fragmented_size =</div><div class='del'>-				cpu_to_le32(t-&gt;max_fragmented_recv_size);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	sendmsg-&gt;sge[0].addr = ib_dma_map_single(t-&gt;cm_id-&gt;device,</div><div class='del'>-						 (void *)resp, sizeof(*resp),</div><div class='del'>-						 DMA_TO_DEVICE);</div><div class='del'>-	ret = ib_dma_mapping_error(t-&gt;cm_id-&gt;device, sendmsg-&gt;sge[0].addr);</div><div class='del'>-	if (ret) {</div><div class='del'>-		smb_direct_free_sendmsg(t, sendmsg);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	sendmsg-&gt;num_sge = 1;</div><div class='del'>-	sendmsg-&gt;sge[0].length = sizeof(*resp);</div><div class='del'>-	sendmsg-&gt;sge[0].lkey = t-&gt;pd-&gt;local_dma_lkey;</div><div class='del'>-</div><div class='del'>-	ret = post_sendmsg(t, NULL, sendmsg);</div><div class='del'>-	if (ret) {</div><div class='del'>-		smb_direct_free_sendmsg(t, sendmsg);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	wait_event(t-&gt;wait_send_pending,</div><div class='del'>-		   atomic_read(&amp;t-&gt;send_pending) == 0);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int smb_direct_accept_client(struct smb_direct_transport *t)</div><div class='del'>-{</div><div class='del'>-	struct rdma_conn_param conn_param;</div><div class='del'>-	struct ib_port_immutable port_immutable;</div><div class='del'>-	u32 ird_ord_hdr[2];</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	memset(&amp;conn_param, 0, sizeof(conn_param));</div><div class='del'>-	conn_param.initiator_depth = min_t(u8, t-&gt;cm_id-&gt;device-&gt;attrs.max_qp_rd_atom,</div><div class='del'>-					   SMB_DIRECT_CM_INITIATOR_DEPTH);</div><div class='del'>-	conn_param.responder_resources = 0;</div><div class='del'>-</div><div class='del'>-	t-&gt;cm_id-&gt;device-&gt;ops.get_port_immutable(t-&gt;cm_id-&gt;device,</div><div class='del'>-						 t-&gt;cm_id-&gt;port_num,</div><div class='del'>-						 &amp;port_immutable);</div><div class='del'>-	if (port_immutable.core_cap_flags &amp; RDMA_CORE_PORT_IWARP) {</div><div class='del'>-		ird_ord_hdr[0] = conn_param.responder_resources;</div><div class='del'>-		ird_ord_hdr[1] = 1;</div><div class='del'>-		conn_param.private_data = ird_ord_hdr;</div><div class='del'>-		conn_param.private_data_len = sizeof(ird_ord_hdr);</div><div class='del'>-	} else {</div><div class='del'>-		conn_param.private_data = NULL;</div><div class='del'>-		conn_param.private_data_len = 0;</div><div class='del'>-	}</div><div class='del'>-	conn_param.retry_count = SMB_DIRECT_CM_RETRY;</div><div class='del'>-	conn_param.rnr_retry_count = SMB_DIRECT_CM_RNR_RETRY;</div><div class='del'>-	conn_param.flow_control = 0;</div><div class='del'>-</div><div class='del'>-	ret = rdma_accept(t-&gt;cm_id, &amp;conn_param);</div><div class='del'>-	if (ret) {</div><div class='del'>-		pr_err("error at rdma_accept: %d\n", ret);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	wait_event_interruptible(t-&gt;wait_status,</div><div class='del'>-				 t-&gt;status != SMB_DIRECT_CS_NEW);</div><div class='del'>-	if (t-&gt;status != SMB_DIRECT_CS_CONNECTED)</div><div class='del'>-		return -ENOTCONN;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int smb_direct_negotiate(struct smb_direct_transport *t)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-	struct smb_direct_recvmsg *recvmsg;</div><div class='del'>-	struct smb_direct_negotiate_req *req;</div><div class='del'>-</div><div class='del'>-	recvmsg = get_free_recvmsg(t);</div><div class='del'>-	if (!recvmsg)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	recvmsg-&gt;type = SMB_DIRECT_MSG_NEGOTIATE_REQ;</div><div class='del'>-</div><div class='del'>-	ret = smb_direct_post_recv(t, recvmsg);</div><div class='del'>-	if (ret) {</div><div class='del'>-		pr_err("Can't post recv: %d\n", ret);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	t-&gt;negotiation_requested = false;</div><div class='del'>-	ret = smb_direct_accept_client(t);</div><div class='del'>-	if (ret) {</div><div class='del'>-		pr_err("Can't accept client\n");</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	smb_direct_post_recv_credits(&amp;t-&gt;post_recv_credits_work.work);</div><div class='del'>-</div><div class='del'>-	ksmbd_debug(RDMA, "Waiting for SMB_DIRECT negotiate request\n");</div><div class='del'>-	ret = wait_event_interruptible_timeout(t-&gt;wait_status,</div><div class='del'>-					       t-&gt;negotiation_requested ||</div><div class='del'>-						t-&gt;status == SMB_DIRECT_CS_DISCONNECTED,</div><div class='del'>-					       SMB_DIRECT_NEGOTIATE_TIMEOUT * HZ);</div><div class='del'>-	if (ret &lt;= 0 || t-&gt;status == SMB_DIRECT_CS_DISCONNECTED) {</div><div class='del'>-		ret = ret &lt; 0 ? ret : -ETIMEDOUT;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = smb_direct_check_recvmsg(recvmsg);</div><div class='del'>-	if (ret == -ECONNABORTED)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	req = (struct smb_direct_negotiate_req *)recvmsg-&gt;packet;</div><div class='del'>-	t-&gt;max_recv_size = min_t(int, t-&gt;max_recv_size,</div><div class='del'>-				 le32_to_cpu(req-&gt;preferred_send_size));</div><div class='del'>-	t-&gt;max_send_size = min_t(int, t-&gt;max_send_size,</div><div class='del'>-				 le32_to_cpu(req-&gt;max_receive_size));</div><div class='del'>-	t-&gt;max_fragmented_send_size =</div><div class='del'>-			le32_to_cpu(req-&gt;max_fragmented_size);</div><div class='del'>-</div><div class='del'>-	ret = smb_direct_send_negotiate_response(t, ret);</div><div class='del'>-out:</div><div class='del'>-	if (recvmsg)</div><div class='del'>-		put_recvmsg(t, recvmsg);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int smb_direct_init_params(struct smb_direct_transport *t,</div><div class='del'>-				  struct ib_qp_cap *cap)</div><div class='del'>-{</div><div class='del'>-	struct ib_device *device = t-&gt;cm_id-&gt;device;</div><div class='del'>-	int max_send_sges, max_pages, max_rw_wrs, max_send_wrs;</div><div class='del'>-</div><div class='del'>-	/* need 2 more sge. because a SMB_DIRECT header will be mapped,</div><div class='del'>-	 * and maybe a send buffer could be not page aligned.</div><div class='del'>-	 */</div><div class='del'>-	t-&gt;max_send_size = smb_direct_max_send_size;</div><div class='del'>-	max_send_sges = DIV_ROUND_UP(t-&gt;max_send_size, PAGE_SIZE) + 2;</div><div class='del'>-	if (max_send_sges &gt; SMB_DIRECT_MAX_SEND_SGES) {</div><div class='del'>-		pr_err("max_send_size %d is too large\n", t-&gt;max_send_size);</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * allow smb_direct_max_outstanding_rw_ops of in-flight RDMA</div><div class='del'>-	 * read/writes. HCA guarantees at least max_send_sge of sges for</div><div class='del'>-	 * a RDMA read/write work request, and if memory registration is used,</div><div class='del'>-	 * we need reg_mr, local_inv wrs for each read/write.</div><div class='del'>-	 */</div><div class='del'>-	t-&gt;max_rdma_rw_size = smb_direct_max_read_write_size;</div><div class='del'>-	max_pages = DIV_ROUND_UP(t-&gt;max_rdma_rw_size, PAGE_SIZE) + 1;</div><div class='del'>-	max_rw_wrs = DIV_ROUND_UP(max_pages, SMB_DIRECT_MAX_SEND_SGES);</div><div class='del'>-	max_rw_wrs += rdma_rw_mr_factor(device, t-&gt;cm_id-&gt;port_num,</div><div class='del'>-			max_pages) * 2;</div><div class='del'>-	max_rw_wrs *= smb_direct_max_outstanding_rw_ops;</div><div class='del'>-</div><div class='del'>-	max_send_wrs = smb_direct_send_credit_target + max_rw_wrs;</div><div class='del'>-	if (max_send_wrs &gt; device-&gt;attrs.max_cqe ||</div><div class='del'>-	    max_send_wrs &gt; device-&gt;attrs.max_qp_wr) {</div><div class='del'>-		pr_err("consider lowering send_credit_target = %d, or max_outstanding_rw_ops = %d\n",</div><div class='del'>-		       smb_direct_send_credit_target,</div><div class='del'>-		       smb_direct_max_outstanding_rw_ops);</div><div class='del'>-		pr_err("Possible CQE overrun, device reporting max_cqe %d max_qp_wr %d\n",</div><div class='del'>-		       device-&gt;attrs.max_cqe, device-&gt;attrs.max_qp_wr);</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (smb_direct_receive_credit_max &gt; device-&gt;attrs.max_cqe ||</div><div class='del'>-	    smb_direct_receive_credit_max &gt; device-&gt;attrs.max_qp_wr) {</div><div class='del'>-		pr_err("consider lowering receive_credit_max = %d\n",</div><div class='del'>-		       smb_direct_receive_credit_max);</div><div class='del'>-		pr_err("Possible CQE overrun, device reporting max_cpe %d max_qp_wr %d\n",</div><div class='del'>-		       device-&gt;attrs.max_cqe, device-&gt;attrs.max_qp_wr);</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (device-&gt;attrs.max_send_sge &lt; SMB_DIRECT_MAX_SEND_SGES) {</div><div class='del'>-		pr_err("warning: device max_send_sge = %d too small\n",</div><div class='del'>-		       device-&gt;attrs.max_send_sge);</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-	if (device-&gt;attrs.max_recv_sge &lt; SMB_DIRECT_MAX_RECV_SGES) {</div><div class='del'>-		pr_err("warning: device max_recv_sge = %d too small\n",</div><div class='del'>-		       device-&gt;attrs.max_recv_sge);</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	t-&gt;recv_credits = 0;</div><div class='del'>-	t-&gt;count_avail_recvmsg = 0;</div><div class='del'>-</div><div class='del'>-	t-&gt;recv_credit_max = smb_direct_receive_credit_max;</div><div class='del'>-	t-&gt;recv_credit_target = 10;</div><div class='del'>-	t-&gt;new_recv_credits = 0;</div><div class='del'>-</div><div class='del'>-	t-&gt;send_credit_target = smb_direct_send_credit_target;</div><div class='del'>-	atomic_set(&amp;t-&gt;send_credits, 0);</div><div class='del'>-	atomic_set(&amp;t-&gt;rw_avail_ops, smb_direct_max_outstanding_rw_ops);</div><div class='del'>-</div><div class='del'>-	t-&gt;max_send_size = smb_direct_max_send_size;</div><div class='del'>-	t-&gt;max_recv_size = smb_direct_max_receive_size;</div><div class='del'>-	t-&gt;max_fragmented_recv_size = smb_direct_max_fragmented_recv_size;</div><div class='del'>-</div><div class='del'>-	cap-&gt;max_send_wr = max_send_wrs;</div><div class='del'>-	cap-&gt;max_recv_wr = t-&gt;recv_credit_max;</div><div class='del'>-	cap-&gt;max_send_sge = SMB_DIRECT_MAX_SEND_SGES;</div><div class='del'>-	cap-&gt;max_recv_sge = SMB_DIRECT_MAX_RECV_SGES;</div><div class='del'>-	cap-&gt;max_inline_data = 0;</div><div class='del'>-	cap-&gt;max_rdma_ctxs = 0;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void smb_direct_destroy_pools(struct smb_direct_transport *t)</div><div class='del'>-{</div><div class='del'>-	struct smb_direct_recvmsg *recvmsg;</div><div class='del'>-</div><div class='del'>-	while ((recvmsg = get_free_recvmsg(t)))</div><div class='del'>-		mempool_free(recvmsg, t-&gt;recvmsg_mempool);</div><div class='del'>-	while ((recvmsg = get_empty_recvmsg(t)))</div><div class='del'>-		mempool_free(recvmsg, t-&gt;recvmsg_mempool);</div><div class='del'>-</div><div class='del'>-	mempool_destroy(t-&gt;recvmsg_mempool);</div><div class='del'>-	t-&gt;recvmsg_mempool = NULL;</div><div class='del'>-</div><div class='del'>-	kmem_cache_destroy(t-&gt;recvmsg_cache);</div><div class='del'>-	t-&gt;recvmsg_cache = NULL;</div><div class='del'>-</div><div class='del'>-	mempool_destroy(t-&gt;sendmsg_mempool);</div><div class='del'>-	t-&gt;sendmsg_mempool = NULL;</div><div class='del'>-</div><div class='del'>-	kmem_cache_destroy(t-&gt;sendmsg_cache);</div><div class='del'>-	t-&gt;sendmsg_cache = NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int smb_direct_create_pools(struct smb_direct_transport *t)</div><div class='del'>-{</div><div class='del'>-	char name[80];</div><div class='del'>-	int i;</div><div class='del'>-	struct smb_direct_recvmsg *recvmsg;</div><div class='del'>-</div><div class='del'>-	snprintf(name, sizeof(name), "smb_direct_rqst_pool_%p", t);</div><div class='del'>-	t-&gt;sendmsg_cache = kmem_cache_create(name,</div><div class='del'>-					     sizeof(struct smb_direct_sendmsg) +</div><div class='del'>-					      sizeof(struct smb_direct_negotiate_resp),</div><div class='del'>-					     0, SLAB_HWCACHE_ALIGN, NULL);</div><div class='del'>-	if (!t-&gt;sendmsg_cache)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	t-&gt;sendmsg_mempool = mempool_create(t-&gt;send_credit_target,</div><div class='del'>-					    mempool_alloc_slab, mempool_free_slab,</div><div class='del'>-					    t-&gt;sendmsg_cache);</div><div class='del'>-	if (!t-&gt;sendmsg_mempool)</div><div class='del'>-		goto err;</div><div class='del'>-</div><div class='del'>-	snprintf(name, sizeof(name), "smb_direct_resp_%p", t);</div><div class='del'>-	t-&gt;recvmsg_cache = kmem_cache_create(name,</div><div class='del'>-					     sizeof(struct smb_direct_recvmsg) +</div><div class='del'>-					      t-&gt;max_recv_size,</div><div class='del'>-					     0, SLAB_HWCACHE_ALIGN, NULL);</div><div class='del'>-	if (!t-&gt;recvmsg_cache)</div><div class='del'>-		goto err;</div><div class='del'>-</div><div class='del'>-	t-&gt;recvmsg_mempool =</div><div class='del'>-		mempool_create(t-&gt;recv_credit_max, mempool_alloc_slab,</div><div class='del'>-			       mempool_free_slab, t-&gt;recvmsg_cache);</div><div class='del'>-	if (!t-&gt;recvmsg_mempool)</div><div class='del'>-		goto err;</div><div class='del'>-</div><div class='del'>-	INIT_LIST_HEAD(&amp;t-&gt;recvmsg_queue);</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; t-&gt;recv_credit_max; i++) {</div><div class='del'>-		recvmsg = mempool_alloc(t-&gt;recvmsg_mempool, GFP_KERNEL);</div><div class='del'>-		if (!recvmsg)</div><div class='del'>-			goto err;</div><div class='del'>-		recvmsg-&gt;transport = t;</div><div class='del'>-		list_add(&amp;recvmsg-&gt;list, &amp;t-&gt;recvmsg_queue);</div><div class='del'>-	}</div><div class='del'>-	t-&gt;count_avail_recvmsg = t-&gt;recv_credit_max;</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-err:</div><div class='del'>-	smb_direct_destroy_pools(t);</div><div class='del'>-	return -ENOMEM;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int smb_direct_create_qpair(struct smb_direct_transport *t,</div><div class='del'>-				   struct ib_qp_cap *cap)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-	struct ib_qp_init_attr qp_attr;</div><div class='del'>-</div><div class='del'>-	t-&gt;pd = ib_alloc_pd(t-&gt;cm_id-&gt;device, 0);</div><div class='del'>-	if (IS_ERR(t-&gt;pd)) {</div><div class='del'>-		pr_err("Can't create RDMA PD\n");</div><div class='del'>-		ret = PTR_ERR(t-&gt;pd);</div><div class='del'>-		t-&gt;pd = NULL;</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	t-&gt;send_cq = ib_alloc_cq(t-&gt;cm_id-&gt;device, t,</div><div class='del'>-				 t-&gt;send_credit_target, 0, IB_POLL_WORKQUEUE);</div><div class='del'>-	if (IS_ERR(t-&gt;send_cq)) {</div><div class='del'>-		pr_err("Can't create RDMA send CQ\n");</div><div class='del'>-		ret = PTR_ERR(t-&gt;send_cq);</div><div class='del'>-		t-&gt;send_cq = NULL;</div><div class='del'>-		goto err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	t-&gt;recv_cq = ib_alloc_cq(t-&gt;cm_id-&gt;device, t,</div><div class='del'>-				 cap-&gt;max_send_wr + cap-&gt;max_rdma_ctxs,</div><div class='del'>-				 0, IB_POLL_WORKQUEUE);</div><div class='del'>-	if (IS_ERR(t-&gt;recv_cq)) {</div><div class='del'>-		pr_err("Can't create RDMA recv CQ\n");</div><div class='del'>-		ret = PTR_ERR(t-&gt;recv_cq);</div><div class='del'>-		t-&gt;recv_cq = NULL;</div><div class='del'>-		goto err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	memset(&amp;qp_attr, 0, sizeof(qp_attr));</div><div class='del'>-	qp_attr.event_handler = smb_direct_qpair_handler;</div><div class='del'>-	qp_attr.qp_context = t;</div><div class='del'>-	qp_attr.cap = *cap;</div><div class='del'>-	qp_attr.sq_sig_type = IB_SIGNAL_REQ_WR;</div><div class='del'>-	qp_attr.qp_type = IB_QPT_RC;</div><div class='del'>-	qp_attr.send_cq = t-&gt;send_cq;</div><div class='del'>-	qp_attr.recv_cq = t-&gt;recv_cq;</div><div class='del'>-	qp_attr.port_num = ~0;</div><div class='del'>-</div><div class='del'>-	ret = rdma_create_qp(t-&gt;cm_id, t-&gt;pd, &amp;qp_attr);</div><div class='del'>-	if (ret) {</div><div class='del'>-		pr_err("Can't create RDMA QP: %d\n", ret);</div><div class='del'>-		goto err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	t-&gt;qp = t-&gt;cm_id-&gt;qp;</div><div class='del'>-	t-&gt;cm_id-&gt;event_handler = smb_direct_cm_handler;</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-err:</div><div class='del'>-	if (t-&gt;qp) {</div><div class='del'>-		ib_destroy_qp(t-&gt;qp);</div><div class='del'>-		t-&gt;qp = NULL;</div><div class='del'>-	}</div><div class='del'>-	if (t-&gt;recv_cq) {</div><div class='del'>-		ib_destroy_cq(t-&gt;recv_cq);</div><div class='del'>-		t-&gt;recv_cq = NULL;</div><div class='del'>-	}</div><div class='del'>-	if (t-&gt;send_cq) {</div><div class='del'>-		ib_destroy_cq(t-&gt;send_cq);</div><div class='del'>-		t-&gt;send_cq = NULL;</div><div class='del'>-	}</div><div class='del'>-	if (t-&gt;pd) {</div><div class='del'>-		ib_dealloc_pd(t-&gt;pd);</div><div class='del'>-		t-&gt;pd = NULL;</div><div class='del'>-	}</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int smb_direct_prepare(struct ksmbd_transport *t)</div><div class='del'>-{</div><div class='del'>-	struct smb_direct_transport *st = smb_trans_direct_transfort(t);</div><div class='del'>-	int ret;</div><div class='del'>-	struct ib_qp_cap qp_cap;</div><div class='del'>-</div><div class='del'>-	ret = smb_direct_init_params(st, &amp;qp_cap);</div><div class='del'>-	if (ret) {</div><div class='del'>-		pr_err("Can't configure RDMA parameters\n");</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = smb_direct_create_pools(st);</div><div class='del'>-	if (ret) {</div><div class='del'>-		pr_err("Can't init RDMA pool: %d\n", ret);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = smb_direct_create_qpair(st, &amp;qp_cap);</div><div class='del'>-	if (ret) {</div><div class='del'>-		pr_err("Can't accept RDMA client: %d\n", ret);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = smb_direct_negotiate(st);</div><div class='del'>-	if (ret) {</div><div class='del'>-		pr_err("Can't negotiate: %d\n", ret);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	st-&gt;status = SMB_DIRECT_CS_CONNECTED;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool rdma_frwr_is_supported(struct ib_device_attr *attrs)</div><div class='del'>-{</div><div class='del'>-	if (!(attrs-&gt;device_cap_flags &amp; IB_DEVICE_MEM_MGT_EXTENSIONS))</div><div class='del'>-		return false;</div><div class='del'>-	if (attrs-&gt;max_fast_reg_page_list_len == 0)</div><div class='del'>-		return false;</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int smb_direct_handle_connect_request(struct rdma_cm_id *new_cm_id)</div><div class='del'>-{</div><div class='del'>-	struct smb_direct_transport *t;</div><div class='del'>-</div><div class='del'>-	if (!rdma_frwr_is_supported(&amp;new_cm_id-&gt;device-&gt;attrs)) {</div><div class='del'>-		ksmbd_debug(RDMA,</div><div class='del'>-			    "Fast Registration Work Requests is not supported. device capabilities=%llx\n",</div><div class='del'>-			    new_cm_id-&gt;device-&gt;attrs.device_cap_flags);</div><div class='del'>-		return -EPROTONOSUPPORT;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	t = alloc_transport(new_cm_id);</div><div class='del'>-	if (!t)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	KSMBD_TRANS(t)-&gt;handler = kthread_run(ksmbd_conn_handler_loop,</div><div class='del'>-					      KSMBD_TRANS(t)-&gt;conn, "ksmbd:r%u",</div><div class='del'>-					      SMB_DIRECT_PORT);</div><div class='del'>-	if (IS_ERR(KSMBD_TRANS(t)-&gt;handler)) {</div><div class='del'>-		int ret = PTR_ERR(KSMBD_TRANS(t)-&gt;handler);</div><div class='del'>-</div><div class='del'>-		pr_err("Can't start thread\n");</div><div class='del'>-		free_transport(t);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int smb_direct_listen_handler(struct rdma_cm_id *cm_id,</div><div class='del'>-				     struct rdma_cm_event *event)</div><div class='del'>-{</div><div class='del'>-	switch (event-&gt;event) {</div><div class='del'>-	case RDMA_CM_EVENT_CONNECT_REQUEST: {</div><div class='del'>-		int ret = smb_direct_handle_connect_request(cm_id);</div><div class='del'>-</div><div class='del'>-		if (ret) {</div><div class='del'>-			pr_err("Can't create transport: %d\n", ret);</div><div class='del'>-			return ret;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		ksmbd_debug(RDMA, "Received connection request. cm_id=%p\n",</div><div class='del'>-			    cm_id);</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-	default:</div><div class='del'>-		pr_err("Unexpected listen event. cm_id=%p, event=%s (%d)\n",</div><div class='del'>-		       cm_id, rdma_event_msg(event-&gt;event), event-&gt;event);</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int smb_direct_listen(int port)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-	struct rdma_cm_id *cm_id;</div><div class='del'>-	struct sockaddr_in sin = {</div><div class='del'>-		.sin_family		= AF_INET,</div><div class='del'>-		.sin_addr.s_addr	= htonl(INADDR_ANY),</div><div class='del'>-		.sin_port		= htons(port),</div><div class='del'>-	};</div><div class='del'>-</div><div class='del'>-	cm_id = rdma_create_id(&amp;init_net, smb_direct_listen_handler,</div><div class='del'>-			       &amp;smb_direct_listener, RDMA_PS_TCP, IB_QPT_RC);</div><div class='del'>-	if (IS_ERR(cm_id)) {</div><div class='del'>-		pr_err("Can't create cm id: %ld\n", PTR_ERR(cm_id));</div><div class='del'>-		return PTR_ERR(cm_id);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = rdma_bind_addr(cm_id, (struct sockaddr *)&amp;sin);</div><div class='del'>-	if (ret) {</div><div class='del'>-		pr_err("Can't bind: %d\n", ret);</div><div class='del'>-		goto err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	smb_direct_listener.cm_id = cm_id;</div><div class='del'>-</div><div class='del'>-	ret = rdma_listen(cm_id, 10);</div><div class='del'>-	if (ret) {</div><div class='del'>-		pr_err("Can't listen: %d\n", ret);</div><div class='del'>-		goto err;</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='del'>-err:</div><div class='del'>-	smb_direct_listener.cm_id = NULL;</div><div class='del'>-	rdma_destroy_id(cm_id);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int ksmbd_rdma_init(void)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	smb_direct_listener.cm_id = NULL;</div><div class='del'>-</div><div class='del'>-	/* When a client is running out of send credits, the credits are</div><div class='del'>-	 * granted by the server's sending a packet using this queue.</div><div class='del'>-	 * This avoids the situation that a clients cannot send packets</div><div class='del'>-	 * for lack of credits</div><div class='del'>-	 */</div><div class='del'>-	smb_direct_wq = alloc_workqueue("ksmbd-smb_direct-wq",</div><div class='del'>-					WQ_HIGHPRI | WQ_MEM_RECLAIM, 0);</div><div class='del'>-	if (!smb_direct_wq)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	ret = smb_direct_listen(SMB_DIRECT_PORT);</div><div class='del'>-	if (ret) {</div><div class='del'>-		destroy_workqueue(smb_direct_wq);</div><div class='del'>-		smb_direct_wq = NULL;</div><div class='del'>-		pr_err("Can't listen: %d\n", ret);</div><div class='del'>-		return ret;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ksmbd_debug(RDMA, "init RDMA listener. cm_id=%p\n",</div><div class='del'>-		    smb_direct_listener.cm_id);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int ksmbd_rdma_destroy(void)</div><div class='del'>-{</div><div class='del'>-	if (smb_direct_listener.cm_id)</div><div class='del'>-		rdma_destroy_id(smb_direct_listener.cm_id);</div><div class='del'>-	smb_direct_listener.cm_id = NULL;</div><div class='del'>-</div><div class='del'>-	if (smb_direct_wq) {</div><div class='del'>-		flush_workqueue(smb_direct_wq);</div><div class='del'>-		destroy_workqueue(smb_direct_wq);</div><div class='del'>-		smb_direct_wq = NULL;</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-bool ksmbd_rdma_capable_netdev(struct net_device *netdev)</div><div class='del'>-{</div><div class='del'>-	struct ib_device *ibdev;</div><div class='del'>-	bool rdma_capable = false;</div><div class='del'>-</div><div class='del'>-	ibdev = ib_device_get_by_netdev(netdev, RDMA_DRIVER_UNKNOWN);</div><div class='del'>-	if (ibdev) {</div><div class='del'>-		if (rdma_frwr_is_supported(&amp;ibdev-&gt;attrs))</div><div class='del'>-			rdma_capable = true;</div><div class='del'>-		ib_device_put(ibdev);</div><div class='del'>-	}</div><div class='del'>-	return rdma_capable;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct ksmbd_transport_ops ksmbd_smb_direct_transport_ops = {</div><div class='del'>-	.prepare	= smb_direct_prepare,</div><div class='del'>-	.disconnect	= smb_direct_disconnect,</div><div class='del'>-	.writev		= smb_direct_writev,</div><div class='del'>-	.read		= smb_direct_read,</div><div class='del'>-	.rdma_read	= smb_direct_rdma_read,</div><div class='del'>-	.rdma_write	= smb_direct_rdma_write,</div><div class='del'>-};</div><div class='head'>diff --git a/fs/ksmbd/transport_rdma.h b/fs/ksmbd/transport_rdma.h<br/>deleted file mode 100644<br/>index 0fa8adc0776f..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/ksmbd/transport_rdma.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/ksmbd/transport_rdma.h</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,63 +0,0 @@</div><div class='del'>-/* SPDX-License-Identifier: GPL-2.0-or-later */</div><div class='del'>-/*</div><div class='del'>- *   Copyright (C) 2017, Microsoft Corporation.</div><div class='del'>- *   Copyright (C) 2018, LG Electronics.</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#ifndef __KSMBD_TRANSPORT_RDMA_H__</div><div class='del'>-#define __KSMBD_TRANSPORT_RDMA_H__</div><div class='del'>-</div><div class='del'>-#define SMB_DIRECT_PORT	5445</div><div class='del'>-</div><div class='del'>-/* SMB DIRECT negotiation request packet [MS-SMBD] 2.2.1 */</div><div class='del'>-struct smb_direct_negotiate_req {</div><div class='del'>-	__le16 min_version;</div><div class='del'>-	__le16 max_version;</div><div class='del'>-	__le16 reserved;</div><div class='del'>-	__le16 credits_requested;</div><div class='del'>-	__le32 preferred_send_size;</div><div class='del'>-	__le32 max_receive_size;</div><div class='del'>-	__le32 max_fragmented_size;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-/* SMB DIRECT negotiation response packet [MS-SMBD] 2.2.2 */</div><div class='del'>-struct smb_direct_negotiate_resp {</div><div class='del'>-	__le16 min_version;</div><div class='del'>-	__le16 max_version;</div><div class='del'>-	__le16 negotiated_version;</div><div class='del'>-	__le16 reserved;</div><div class='del'>-	__le16 credits_requested;</div><div class='del'>-	__le16 credits_granted;</div><div class='del'>-	__le32 status;</div><div class='del'>-	__le32 max_readwrite_size;</div><div class='del'>-	__le32 preferred_send_size;</div><div class='del'>-	__le32 max_receive_size;</div><div class='del'>-	__le32 max_fragmented_size;</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#define SMB_DIRECT_RESPONSE_REQUESTED 0x0001</div><div class='del'>-</div><div class='del'>-/* SMB DIRECT data transfer packet with payload [MS-SMBD] 2.2.3 */</div><div class='del'>-struct smb_direct_data_transfer {</div><div class='del'>-	__le16 credits_requested;</div><div class='del'>-	__le16 credits_granted;</div><div class='del'>-	__le16 flags;</div><div class='del'>-	__le16 reserved;</div><div class='del'>-	__le32 remaining_data_length;</div><div class='del'>-	__le32 data_offset;</div><div class='del'>-	__le32 data_length;</div><div class='del'>-	__le32 padding;</div><div class='del'>-	__u8 buffer[];</div><div class='del'>-} __packed;</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_SMB_SERVER_SMBDIRECT</div><div class='del'>-int ksmbd_rdma_init(void);</div><div class='del'>-int ksmbd_rdma_destroy(void);</div><div class='del'>-bool ksmbd_rdma_capable_netdev(struct net_device *netdev);</div><div class='del'>-#else</div><div class='del'>-static inline int ksmbd_rdma_init(void) { return 0; }</div><div class='del'>-static inline int ksmbd_rdma_destroy(void) { return 0; }</div><div class='del'>-static inline bool ksmbd_rdma_capable_netdev(struct net_device *netdev) { return false; }</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-#endif /* __KSMBD_TRANSPORT_RDMA_H__ */</div><div class='head'>diff --git a/fs/libfs.c b/fs/libfs.c<br/>index ba7438ab9371..9264523be85c 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/libfs.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/libfs.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/libfs.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/libfs.c</a></div><div class='hunk'>@@ -15,6 +15,7 @@</div><div class='ctx'> #include &lt;linux/mutex.h&gt;</div><div class='ctx'> #include &lt;linux/namei.h&gt;</div><div class='ctx'> #include &lt;linux/exportfs.h&gt;</div><div class='add'>+#include &lt;linux/iversion.h&gt;</div><div class='ctx'> #include &lt;linux/writeback.h&gt;</div><div class='ctx'> #include &lt;linux/buffer_head.h&gt; /* sync_mapping_buffers */</div><div class='ctx'> #include &lt;linux/fs_context.h&gt;</div><div class='hunk'>@@ -22,17 +23,18 @@</div><div class='ctx'> #include &lt;linux/fsnotify.h&gt;</div><div class='ctx'> #include &lt;linux/unicode.h&gt;</div><div class='ctx'> #include &lt;linux/fscrypt.h&gt;</div><div class='add'>+#include &lt;linux/pidfs.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/uaccess.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "internal.h"</div><div class='ctx'> </div><div class='del'>-int simple_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='add'>+int simple_getattr(struct mnt_idmap *idmap, const struct path *path,</div><div class='ctx'> 		   struct kstat *stat, u32 request_mask,</div><div class='ctx'> 		   unsigned int query_flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(path-&gt;dentry);</div><div class='del'>-	generic_fillattr(&amp;init_user_ns, inode, stat);</div><div class='add'>+	generic_fillattr(&amp;nop_mnt_idmap, request_mask, inode, stat);</div><div class='ctx'> 	stat-&gt;blocks = inode-&gt;i_mapping-&gt;nrpages &lt;&lt; (PAGE_SHIFT - 9);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -40,6 +42,9 @@ EXPORT_SYMBOL(simple_getattr);</div><div class='ctx'> </div><div class='ctx'> int simple_statfs(struct dentry *dentry, struct kstatfs *buf)</div><div class='ctx'> {</div><div class='add'>+	u64 id = huge_encode_dev(dentry-&gt;d_sb-&gt;s_dev);</div><div class='add'>+</div><div class='add'>+	buf-&gt;f_fsid = u64_to_fsid(id);</div><div class='ctx'> 	buf-&gt;f_type = dentry-&gt;d_sb-&gt;s_magic;</div><div class='ctx'> 	buf-&gt;f_bsize = PAGE_SIZE;</div><div class='ctx'> 	buf-&gt;f_namelen = NAME_MAX;</div><div class='hunk'>@@ -57,11 +62,6 @@ int always_delete_dentry(const struct dentry *dentry)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(always_delete_dentry);</div><div class='ctx'> </div><div class='del'>-const struct dentry_operations simple_dentry_operations = {</div><div class='del'>-	.d_delete = always_delete_dentry,</div><div class='del'>-};</div><div class='del'>-EXPORT_SYMBOL(simple_dentry_operations);</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Lookup the data. This is trivial - if the dentry didn't already</div><div class='ctx'>  * exist, we know it is negative.  Set d_op to delete negative dentries.</div><div class='hunk'>@@ -70,8 +70,14 @@ struct dentry *simple_lookup(struct inode *dir, struct dentry *dentry, unsigned</div><div class='ctx'> {</div><div class='ctx'> 	if (dentry-&gt;d_name.len &gt; NAME_MAX)</div><div class='ctx'> 		return ERR_PTR(-ENAMETOOLONG);</div><div class='del'>-	if (!dentry-&gt;d_sb-&gt;s_d_op)</div><div class='del'>-		d_set_d_op(dentry, &amp;simple_dentry_operations);</div><div class='add'>+	if (!dentry-&gt;d_op &amp;&amp; !(dentry-&gt;d_flags &amp; DCACHE_DONTCACHE)) {</div><div class='add'>+		spin_lock(&amp;dentry-&gt;d_lock);</div><div class='add'>+		dentry-&gt;d_flags |= DCACHE_DONTCACHE;</div><div class='add'>+		spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='add'>+	}</div><div class='add'>+	if (IS_ENABLED(CONFIG_UNICODE) &amp;&amp; IS_CASEFOLDED(dir))</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='ctx'> 	d_add(dentry, NULL);</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='hunk'>@@ -100,15 +106,16 @@ EXPORT_SYMBOL(dcache_dir_close);</div><div class='ctx'>  * If no such element exists, NULL is returned.</div><div class='ctx'>  */</div><div class='ctx'> static struct dentry *scan_positives(struct dentry *cursor,</div><div class='del'>-					struct list_head *p,</div><div class='add'>+					struct hlist_node **p,</div><div class='ctx'> 					loff_t count,</div><div class='ctx'> 					struct dentry *last)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dentry = cursor-&gt;d_parent, *found = NULL;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;dentry-&gt;d_lock);</div><div class='del'>-	while ((p = p-&gt;next) != &amp;dentry-&gt;d_subdirs) {</div><div class='del'>-		struct dentry *d = list_entry(p, struct dentry, d_child);</div><div class='add'>+	while (*p) {</div><div class='add'>+		struct dentry *d = hlist_entry(*p, struct dentry, d_sib);</div><div class='add'>+		p = &amp;d-&gt;d_sib.next;</div><div class='ctx'> 		// we must at least skip cursors, to avoid livelocks</div><div class='ctx'> 		if (d-&gt;d_flags &amp; DCACHE_DENTRY_CURSOR)</div><div class='ctx'> 			continue;</div><div class='hunk'>@@ -122,8 +129,10 @@ static struct dentry *scan_positives(struct dentry *cursor,</div><div class='ctx'> 			count = 1;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (need_resched()) {</div><div class='del'>-			list_move(&amp;cursor-&gt;d_child, p);</div><div class='del'>-			p = &amp;cursor-&gt;d_child;</div><div class='add'>+			if (!hlist_unhashed(&amp;cursor-&gt;d_sib))</div><div class='add'>+				__hlist_del(&amp;cursor-&gt;d_sib);</div><div class='add'>+			hlist_add_behind(&amp;cursor-&gt;d_sib, &amp;d-&gt;d_sib);</div><div class='add'>+			p = &amp;cursor-&gt;d_sib.next;</div><div class='ctx'> 			spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 			cond_resched();</div><div class='ctx'> 			spin_lock(&amp;dentry-&gt;d_lock);</div><div class='hunk'>@@ -155,13 +164,12 @@ loff_t dcache_dir_lseek(struct file *file, loff_t offset, int whence)</div><div class='ctx'> 		inode_lock_shared(dentry-&gt;d_inode);</div><div class='ctx'> </div><div class='ctx'> 		if (offset &gt; 2)</div><div class='del'>-			to = scan_positives(cursor, &amp;dentry-&gt;d_subdirs,</div><div class='add'>+			to = scan_positives(cursor, &amp;dentry-&gt;d_children.first,</div><div class='ctx'> 					    offset - 2, NULL);</div><div class='ctx'> 		spin_lock(&amp;dentry-&gt;d_lock);</div><div class='add'>+		hlist_del_init(&amp;cursor-&gt;d_sib);</div><div class='ctx'> 		if (to)</div><div class='del'>-			list_move(&amp;cursor-&gt;d_child, &amp;to-&gt;d_child);</div><div class='del'>-		else</div><div class='del'>-			list_del_init(&amp;cursor-&gt;d_child);</div><div class='add'>+			hlist_add_behind(&amp;cursor-&gt;d_sib, &amp;to-&gt;d_sib);</div><div class='ctx'> 		spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 		dput(to);</div><div class='ctx'> </div><div class='hunk'>@@ -173,12 +181,6 @@ loff_t dcache_dir_lseek(struct file *file, loff_t offset, int whence)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(dcache_dir_lseek);</div><div class='ctx'> </div><div class='del'>-/* Relationship between i_mode and the DT_xxx types */</div><div class='del'>-static inline unsigned char dt_type(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	return (inode-&gt;i_mode &gt;&gt; 12) &amp; 15;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Directory is locked and all positive dentries in it are safe, since</div><div class='ctx'>  * for ramfs-type trees they can't go away without unlink() or rmdir(),</div><div class='hunk'>@@ -189,32 +191,29 @@ int dcache_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dentry = file-&gt;f_path.dentry;</div><div class='ctx'> 	struct dentry *cursor = file-&gt;private_data;</div><div class='del'>-	struct list_head *anchor = &amp;dentry-&gt;d_subdirs;</div><div class='ctx'> 	struct dentry *next = NULL;</div><div class='del'>-	struct list_head *p;</div><div class='add'>+	struct hlist_node **p;</div><div class='ctx'> </div><div class='ctx'> 	if (!dir_emit_dots(file, ctx))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	if (ctx-&gt;pos == 2)</div><div class='del'>-		p = anchor;</div><div class='del'>-	else if (!list_empty(&amp;cursor-&gt;d_child))</div><div class='del'>-		p = &amp;cursor-&gt;d_child;</div><div class='add'>+		p = &amp;dentry-&gt;d_children.first;</div><div class='ctx'> 	else</div><div class='del'>-		return 0;</div><div class='add'>+		p = &amp;cursor-&gt;d_sib.next;</div><div class='ctx'> </div><div class='ctx'> 	while ((next = scan_positives(cursor, p, 1, next)) != NULL) {</div><div class='ctx'> 		if (!dir_emit(ctx, next-&gt;d_name.name, next-&gt;d_name.len,</div><div class='del'>-			      d_inode(next)-&gt;i_ino, dt_type(d_inode(next))))</div><div class='add'>+			      d_inode(next)-&gt;i_ino,</div><div class='add'>+			      fs_umode_to_dtype(d_inode(next)-&gt;i_mode)))</div><div class='ctx'> 			break;</div><div class='ctx'> 		ctx-&gt;pos++;</div><div class='del'>-		p = &amp;next-&gt;d_child;</div><div class='add'>+		p = &amp;next-&gt;d_sib.next;</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_lock(&amp;dentry-&gt;d_lock);</div><div class='add'>+	hlist_del_init(&amp;cursor-&gt;d_sib);</div><div class='ctx'> 	if (next)</div><div class='del'>-		list_move_tail(&amp;cursor-&gt;d_child, &amp;next-&gt;d_child);</div><div class='del'>-	else</div><div class='del'>-		list_del_init(&amp;cursor-&gt;d_child);</div><div class='add'>+		hlist_add_before(&amp;cursor-&gt;d_sib, &amp;next-&gt;d_sib);</div><div class='ctx'> 	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 	dput(next);</div><div class='ctx'> </div><div class='hunk'>@@ -243,14 +242,351 @@ const struct inode_operations simple_dir_inode_operations = {</div><div class='ctx'> };</div><div class='ctx'> EXPORT_SYMBOL(simple_dir_inode_operations);</div><div class='ctx'> </div><div class='del'>-static struct dentry *find_next_child(struct dentry *parent, struct dentry *prev)</div><div class='add'>+/* simple_offset_add() never assigns these to a dentry */</div><div class='add'>+enum {</div><div class='add'>+	DIR_OFFSET_FIRST	= 2,		/* Find first real entry */</div><div class='add'>+	DIR_OFFSET_EOD		= S32_MAX,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/* simple_offset_add() allocation range */</div><div class='add'>+enum {</div><div class='add'>+	DIR_OFFSET_MIN		= DIR_OFFSET_FIRST + 1,</div><div class='add'>+	DIR_OFFSET_MAX		= DIR_OFFSET_EOD - 1,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static void offset_set(struct dentry *dentry, long offset)</div><div class='add'>+{</div><div class='add'>+	dentry-&gt;d_fsdata = (void *)offset;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static long dentry2offset(struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	return (long)dentry-&gt;d_fsdata;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct lock_class_key simple_offset_lock_class;</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * simple_offset_init - initialize an offset_ctx</div><div class='add'>+ * @octx: directory offset map to be initialized</div><div class='add'>+ *</div><div class='add'>+ */</div><div class='add'>+void simple_offset_init(struct offset_ctx *octx)</div><div class='add'>+{</div><div class='add'>+	mt_init_flags(&amp;octx-&gt;mt, MT_FLAGS_ALLOC_RANGE);</div><div class='add'>+	lockdep_set_class(&amp;octx-&gt;mt.ma_lock, &amp;simple_offset_lock_class);</div><div class='add'>+	octx-&gt;next_offset = DIR_OFFSET_MIN;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * simple_offset_add - Add an entry to a directory's offset map</div><div class='add'>+ * @octx: directory offset ctx to be updated</div><div class='add'>+ * @dentry: new dentry being added</div><div class='add'>+ *</div><div class='add'>+ * Returns zero on success. @octx and the dentry's offset are updated.</div><div class='add'>+ * Otherwise, a negative errno value is returned.</div><div class='add'>+ */</div><div class='add'>+int simple_offset_add(struct offset_ctx *octx, struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	unsigned long offset;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (dentry2offset(dentry) != 0)</div><div class='add'>+		return -EBUSY;</div><div class='add'>+</div><div class='add'>+	ret = mtree_alloc_cyclic(&amp;octx-&gt;mt, &amp;offset, dentry, DIR_OFFSET_MIN,</div><div class='add'>+				 DIR_OFFSET_MAX, &amp;octx-&gt;next_offset,</div><div class='add'>+				 GFP_KERNEL);</div><div class='add'>+	if (unlikely(ret &lt; 0))</div><div class='add'>+		return ret == -EBUSY ? -ENOSPC : ret;</div><div class='add'>+</div><div class='add'>+	offset_set(dentry, offset);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int simple_offset_replace(struct offset_ctx *octx, struct dentry *dentry,</div><div class='add'>+				 long offset)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = mtree_store(&amp;octx-&gt;mt, offset, dentry, GFP_KERNEL);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+	offset_set(dentry, offset);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * simple_offset_remove - Remove an entry to a directory's offset map</div><div class='add'>+ * @octx: directory offset ctx to be updated</div><div class='add'>+ * @dentry: dentry being removed</div><div class='add'>+ *</div><div class='add'>+ */</div><div class='add'>+void simple_offset_remove(struct offset_ctx *octx, struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	long offset;</div><div class='add'>+</div><div class='add'>+	offset = dentry2offset(dentry);</div><div class='add'>+	if (offset == 0)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	mtree_erase(&amp;octx-&gt;mt, offset);</div><div class='add'>+	offset_set(dentry, 0);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * simple_offset_rename - handle directory offsets for rename</div><div class='add'>+ * @old_dir: parent directory of source entry</div><div class='add'>+ * @old_dentry: dentry of source entry</div><div class='add'>+ * @new_dir: parent_directory of destination entry</div><div class='add'>+ * @new_dentry: dentry of destination</div><div class='add'>+ *</div><div class='add'>+ * Caller provides appropriate serialization.</div><div class='add'>+ *</div><div class='add'>+ * User space expects the directory offset value of the replaced</div><div class='add'>+ * (new) directory entry to be unchanged after a rename.</div><div class='add'>+ *</div><div class='add'>+ * Returns zero on success, a negative errno value on failure.</div><div class='add'>+ */</div><div class='add'>+int simple_offset_rename(struct inode *old_dir, struct dentry *old_dentry,</div><div class='add'>+			 struct inode *new_dir, struct dentry *new_dentry)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *child = NULL;</div><div class='del'>-	struct list_head *p = prev ? &amp;prev-&gt;d_child : &amp;parent-&gt;d_subdirs;</div><div class='add'>+	struct offset_ctx *old_ctx = old_dir-&gt;i_op-&gt;get_offset_ctx(old_dir);</div><div class='add'>+	struct offset_ctx *new_ctx = new_dir-&gt;i_op-&gt;get_offset_ctx(new_dir);</div><div class='add'>+	long new_offset = dentry2offset(new_dentry);</div><div class='add'>+</div><div class='add'>+	simple_offset_remove(old_ctx, old_dentry);</div><div class='add'>+</div><div class='add'>+	if (new_offset) {</div><div class='add'>+		offset_set(new_dentry, 0);</div><div class='add'>+		return simple_offset_replace(new_ctx, old_dentry, new_offset);</div><div class='add'>+	}</div><div class='add'>+	return simple_offset_add(new_ctx, old_dentry);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * simple_offset_rename_exchange - exchange rename with directory offsets</div><div class='add'>+ * @old_dir: parent of dentry being moved</div><div class='add'>+ * @old_dentry: dentry being moved</div><div class='add'>+ * @new_dir: destination parent</div><div class='add'>+ * @new_dentry: destination dentry</div><div class='add'>+ *</div><div class='add'>+ * This API preserves the directory offset values. Caller provides</div><div class='add'>+ * appropriate serialization.</div><div class='add'>+ *</div><div class='add'>+ * Returns zero on success. Otherwise a negative errno is returned and the</div><div class='add'>+ * rename is rolled back.</div><div class='add'>+ */</div><div class='add'>+int simple_offset_rename_exchange(struct inode *old_dir,</div><div class='add'>+				  struct dentry *old_dentry,</div><div class='add'>+				  struct inode *new_dir,</div><div class='add'>+				  struct dentry *new_dentry)</div><div class='add'>+{</div><div class='add'>+	struct offset_ctx *old_ctx = old_dir-&gt;i_op-&gt;get_offset_ctx(old_dir);</div><div class='add'>+	struct offset_ctx *new_ctx = new_dir-&gt;i_op-&gt;get_offset_ctx(new_dir);</div><div class='add'>+	long old_index = dentry2offset(old_dentry);</div><div class='add'>+	long new_index = dentry2offset(new_dentry);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	simple_offset_remove(old_ctx, old_dentry);</div><div class='add'>+	simple_offset_remove(new_ctx, new_dentry);</div><div class='add'>+</div><div class='add'>+	ret = simple_offset_replace(new_ctx, old_dentry, new_index);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_restore;</div><div class='add'>+</div><div class='add'>+	ret = simple_offset_replace(old_ctx, new_dentry, old_index);</div><div class='add'>+	if (ret) {</div><div class='add'>+		simple_offset_remove(new_ctx, old_dentry);</div><div class='add'>+		goto out_restore;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = simple_rename_exchange(old_dir, old_dentry, new_dir, new_dentry);</div><div class='add'>+	if (ret) {</div><div class='add'>+		simple_offset_remove(new_ctx, old_dentry);</div><div class='add'>+		simple_offset_remove(old_ctx, new_dentry);</div><div class='add'>+		goto out_restore;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+out_restore:</div><div class='add'>+	(void)simple_offset_replace(old_ctx, old_dentry, old_index);</div><div class='add'>+	(void)simple_offset_replace(new_ctx, new_dentry, new_index);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * simple_offset_destroy - Release offset map</div><div class='add'>+ * @octx: directory offset ctx that is about to be destroyed</div><div class='add'>+ *</div><div class='add'>+ * During fs teardown (eg. umount), a directory's offset map might still</div><div class='add'>+ * contain entries. xa_destroy() cleans out anything that remains.</div><div class='add'>+ */</div><div class='add'>+void simple_offset_destroy(struct offset_ctx *octx)</div><div class='add'>+{</div><div class='add'>+	mtree_destroy(&amp;octx-&gt;mt);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * offset_dir_llseek - Advance the read position of a directory descriptor</div><div class='add'>+ * @file: an open directory whose position is to be updated</div><div class='add'>+ * @offset: a byte offset</div><div class='add'>+ * @whence: enumerator describing the starting position for this update</div><div class='add'>+ *</div><div class='add'>+ * SEEK_END, SEEK_DATA, and SEEK_HOLE are not supported for directories.</div><div class='add'>+ *</div><div class='add'>+ * Returns the updated read position if successful; otherwise a</div><div class='add'>+ * negative errno is returned and the read position remains unchanged.</div><div class='add'>+ */</div><div class='add'>+static loff_t offset_dir_llseek(struct file *file, loff_t offset, int whence)</div><div class='add'>+{</div><div class='add'>+	switch (whence) {</div><div class='add'>+	case SEEK_CUR:</div><div class='add'>+		offset += file-&gt;f_pos;</div><div class='add'>+		fallthrough;</div><div class='add'>+	case SEEK_SET:</div><div class='add'>+		if (offset &gt;= 0)</div><div class='add'>+			break;</div><div class='add'>+		fallthrough;</div><div class='add'>+	default:</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return vfs_setpos(file, offset, LONG_MAX);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct dentry *find_positive_dentry(struct dentry *parent,</div><div class='add'>+					   struct dentry *dentry,</div><div class='add'>+					   bool next)</div><div class='add'>+{</div><div class='add'>+	struct dentry *found = NULL;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;parent-&gt;d_lock);</div><div class='del'>-	while ((p = p-&gt;next) != &amp;parent-&gt;d_subdirs) {</div><div class='del'>-		struct dentry *d = container_of(p, struct dentry, d_child);</div><div class='add'>+	if (next)</div><div class='add'>+		dentry = d_next_sibling(dentry);</div><div class='add'>+	else if (!dentry)</div><div class='add'>+		dentry = d_first_child(parent);</div><div class='add'>+	hlist_for_each_entry_from(dentry, d_sib) {</div><div class='add'>+		if (!simple_positive(dentry))</div><div class='add'>+			continue;</div><div class='add'>+		spin_lock_nested(&amp;dentry-&gt;d_lock, DENTRY_D_LOCK_NESTED);</div><div class='add'>+		if (simple_positive(dentry))</div><div class='add'>+			found = dget_dlock(dentry);</div><div class='add'>+		spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='add'>+		if (likely(found))</div><div class='add'>+			break;</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;parent-&gt;d_lock);</div><div class='add'>+	return found;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static noinline_for_stack struct dentry *</div><div class='add'>+offset_dir_lookup(struct dentry *parent, loff_t offset)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = d_inode(parent);</div><div class='add'>+	struct offset_ctx *octx = inode-&gt;i_op-&gt;get_offset_ctx(inode);</div><div class='add'>+	struct dentry *child, *found = NULL;</div><div class='add'>+</div><div class='add'>+	MA_STATE(mas, &amp;octx-&gt;mt, offset, offset);</div><div class='add'>+</div><div class='add'>+	if (offset == DIR_OFFSET_FIRST)</div><div class='add'>+		found = find_positive_dentry(parent, NULL, false);</div><div class='add'>+	else {</div><div class='add'>+		rcu_read_lock();</div><div class='add'>+		child = mas_find_rev(&amp;mas, DIR_OFFSET_MIN);</div><div class='add'>+		found = find_positive_dentry(parent, child, false);</div><div class='add'>+		rcu_read_unlock();</div><div class='add'>+	}</div><div class='add'>+	return found;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool offset_dir_emit(struct dir_context *ctx, struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='add'>+</div><div class='add'>+	return dir_emit(ctx, dentry-&gt;d_name.name, dentry-&gt;d_name.len,</div><div class='add'>+			inode-&gt;i_ino, fs_umode_to_dtype(inode-&gt;i_mode));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void offset_iterate_dir(struct file *file, struct dir_context *ctx)</div><div class='add'>+{</div><div class='add'>+	struct dentry *dir = file-&gt;f_path.dentry;</div><div class='add'>+	struct dentry *dentry;</div><div class='add'>+</div><div class='add'>+	dentry = offset_dir_lookup(dir, ctx-&gt;pos);</div><div class='add'>+	if (!dentry)</div><div class='add'>+		goto out_eod;</div><div class='add'>+	while (true) {</div><div class='add'>+		struct dentry *next;</div><div class='add'>+</div><div class='add'>+		ctx-&gt;pos = dentry2offset(dentry);</div><div class='add'>+		if (!offset_dir_emit(ctx, dentry))</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		next = find_positive_dentry(dir, dentry, true);</div><div class='add'>+		dput(dentry);</div><div class='add'>+</div><div class='add'>+		if (!next)</div><div class='add'>+			goto out_eod;</div><div class='add'>+		dentry = next;</div><div class='add'>+	}</div><div class='add'>+	dput(dentry);</div><div class='add'>+	return;</div><div class='add'>+</div><div class='add'>+out_eod:</div><div class='add'>+	ctx-&gt;pos = DIR_OFFSET_EOD;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * offset_readdir - Emit entries starting at offset @ctx-&gt;pos</div><div class='add'>+ * @file: an open directory to iterate over</div><div class='add'>+ * @ctx: directory iteration context</div><div class='add'>+ *</div><div class='add'>+ * Caller must hold @file's i_rwsem to prevent insertion or removal of</div><div class='add'>+ * entries during this call.</div><div class='add'>+ *</div><div class='add'>+ * On entry, @ctx-&gt;pos contains an offset that represents the first entry</div><div class='add'>+ * to be read from the directory.</div><div class='add'>+ *</div><div class='add'>+ * The operation continues until there are no more entries to read, or</div><div class='add'>+ * until the ctx-&gt;actor indicates there is no more space in the caller's</div><div class='add'>+ * output buffer.</div><div class='add'>+ *</div><div class='add'>+ * On return, @ctx-&gt;pos contains an offset that will read the next entry</div><div class='add'>+ * in this directory when offset_readdir() is called again with @ctx.</div><div class='add'>+ * Caller places this value in the d_off field of the last entry in the</div><div class='add'>+ * user's buffer.</div><div class='add'>+ *</div><div class='add'>+ * Return values:</div><div class='add'>+ *   %0 - Complete</div><div class='add'>+ */</div><div class='add'>+static int offset_readdir(struct file *file, struct dir_context *ctx)</div><div class='add'>+{</div><div class='add'>+	struct dentry *dir = file-&gt;f_path.dentry;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held(&amp;d_inode(dir)-&gt;i_rwsem);</div><div class='add'>+</div><div class='add'>+	if (!dir_emit_dots(file, ctx))</div><div class='add'>+		return 0;</div><div class='add'>+	if (ctx-&gt;pos != DIR_OFFSET_EOD)</div><div class='add'>+		offset_iterate_dir(file, ctx);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+const struct file_operations simple_offset_dir_operations = {</div><div class='add'>+	.llseek		= offset_dir_llseek,</div><div class='add'>+	.iterate_shared	= offset_readdir,</div><div class='add'>+	.read		= generic_read_dir,</div><div class='add'>+	.fsync		= noop_fsync,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct dentry *find_next_child(struct dentry *parent, struct dentry *prev)</div><div class='add'>+{</div><div class='add'>+	struct dentry *child = NULL, *d;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;parent-&gt;d_lock);</div><div class='add'>+	d = prev ? d_next_sibling(prev) : d_first_child(parent);</div><div class='add'>+	hlist_for_each_entry_from(d, d_sib) {</div><div class='ctx'> 		if (simple_positive(d)) {</div><div class='ctx'> 			spin_lock_nested(&amp;d-&gt;d_lock, DENTRY_D_LOCK_NESTED);</div><div class='ctx'> 			if (simple_positive(d))</div><div class='hunk'>@@ -264,44 +600,45 @@ static struct dentry *find_next_child(struct dentry *parent, struct dentry *prev</div><div class='ctx'> 	dput(prev);</div><div class='ctx'> 	return child;</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL(find_next_child);</div><div class='ctx'> </div><div class='del'>-void simple_recursive_removal(struct dentry *dentry,</div><div class='del'>-                              void (*callback)(struct dentry *))</div><div class='add'>+static void __simple_recursive_removal(struct dentry *dentry,</div><div class='add'>+                              void (*callback)(struct dentry *),</div><div class='add'>+			      bool locked)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *this = dget(dentry);</div><div class='ctx'> 	while (true) {</div><div class='ctx'> 		struct dentry *victim = NULL, *child;</div><div class='ctx'> 		struct inode *inode = this-&gt;d_inode;</div><div class='ctx'> </div><div class='del'>-		inode_lock(inode);</div><div class='add'>+		inode_lock_nested(inode, I_MUTEX_CHILD);</div><div class='ctx'> 		if (d_is_dir(this))</div><div class='ctx'> 			inode-&gt;i_flags |= S_DEAD;</div><div class='ctx'> 		while ((child = find_next_child(this, victim)) == NULL) {</div><div class='ctx'> 			// kill and ascend</div><div class='ctx'> 			// update metadata while it's still locked</div><div class='del'>-			inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+			inode_set_ctime_current(inode);</div><div class='ctx'> 			clear_nlink(inode);</div><div class='ctx'> 			inode_unlock(inode);</div><div class='ctx'> 			victim = this;</div><div class='ctx'> 			this = this-&gt;d_parent;</div><div class='ctx'> 			inode = this-&gt;d_inode;</div><div class='del'>-			inode_lock(inode);</div><div class='add'>+			if (!locked || victim != dentry)</div><div class='add'>+				inode_lock_nested(inode, I_MUTEX_CHILD);</div><div class='ctx'> 			if (simple_positive(victim)) {</div><div class='ctx'> 				d_invalidate(victim);	// avoid lost mounts</div><div class='del'>-				if (d_is_dir(victim))</div><div class='del'>-					fsnotify_rmdir(inode, victim);</div><div class='del'>-				else</div><div class='del'>-					fsnotify_unlink(inode, victim);</div><div class='ctx'> 				if (callback)</div><div class='ctx'> 					callback(victim);</div><div class='del'>-				dput(victim);		// unpin it</div><div class='add'>+				fsnotify_delete(inode, d_inode(victim), victim);</div><div class='add'>+				d_make_discardable(victim);</div><div class='ctx'> 			}</div><div class='ctx'> 			if (victim == dentry) {</div><div class='del'>-				inode-&gt;i_ctime = inode-&gt;i_mtime =</div><div class='del'>-					current_time(inode);</div><div class='add'>+				inode_set_mtime_to_ts(inode,</div><div class='add'>+						      inode_set_ctime_current(inode));</div><div class='ctx'> 				if (d_is_dir(dentry))</div><div class='ctx'> 					drop_nlink(inode);</div><div class='del'>-				inode_unlock(inode);</div><div class='add'>+				if (!locked)</div><div class='add'>+					inode_unlock(inode);</div><div class='ctx'> 				dput(dentry);</div><div class='ctx'> 				return;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -310,8 +647,35 @@ void simple_recursive_removal(struct dentry *dentry,</div><div class='ctx'> 		this = child;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+void simple_recursive_removal(struct dentry *dentry,</div><div class='add'>+                              void (*callback)(struct dentry *))</div><div class='add'>+{</div><div class='add'>+	return __simple_recursive_removal(dentry, callback, false);</div><div class='add'>+}</div><div class='ctx'> EXPORT_SYMBOL(simple_recursive_removal);</div><div class='ctx'> </div><div class='add'>+void simple_remove_by_name(struct dentry *parent, const char *name,</div><div class='add'>+                           void (*callback)(struct dentry *))</div><div class='add'>+{</div><div class='add'>+	struct dentry *dentry;</div><div class='add'>+</div><div class='add'>+	dentry = lookup_noperm_positive_unlocked(&amp;QSTR(name), parent);</div><div class='add'>+	if (!IS_ERR(dentry)) {</div><div class='add'>+		simple_recursive_removal(dentry, callback);</div><div class='add'>+		dput(dentry);	// paired with lookup_noperm_positive_unlocked()</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(simple_remove_by_name);</div><div class='add'>+</div><div class='add'>+/* caller holds parent directory with I_MUTEX_PARENT */</div><div class='add'>+void locked_recursive_removal(struct dentry *dentry,</div><div class='add'>+                              void (*callback)(struct dentry *))</div><div class='add'>+{</div><div class='add'>+	return __simple_recursive_removal(dentry, callback, true);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(locked_recursive_removal);</div><div class='add'>+</div><div class='ctx'> static const struct super_operations simple_super_operations = {</div><div class='ctx'> 	.statfs		= simple_statfs,</div><div class='ctx'> };</div><div class='hunk'>@@ -326,8 +690,10 @@ static int pseudo_fs_fill_super(struct super_block *s, struct fs_context *fc)</div><div class='ctx'> 	s-&gt;s_blocksize_bits = PAGE_SHIFT;</div><div class='ctx'> 	s-&gt;s_magic = ctx-&gt;magic;</div><div class='ctx'> 	s-&gt;s_op = ctx-&gt;ops ?: &amp;simple_super_operations;</div><div class='add'>+	s-&gt;s_export_op = ctx-&gt;eops;</div><div class='ctx'> 	s-&gt;s_xattr = ctx-&gt;xattr;</div><div class='ctx'> 	s-&gt;s_time_gran = 1;</div><div class='add'>+	s-&gt;s_d_flags |= ctx-&gt;s_d_flags;</div><div class='ctx'> 	root = new_inode(s);</div><div class='ctx'> 	if (!root)</div><div class='ctx'> 		return -ENOMEM;</div><div class='hunk'>@@ -339,11 +705,11 @@ static int pseudo_fs_fill_super(struct super_block *s, struct fs_context *fc)</div><div class='ctx'> 	 */</div><div class='ctx'> 	root-&gt;i_ino = 1;</div><div class='ctx'> 	root-&gt;i_mode = S_IFDIR | S_IRUSR | S_IWUSR;</div><div class='del'>-	root-&gt;i_atime = root-&gt;i_mtime = root-&gt;i_ctime = current_time(root);</div><div class='add'>+	simple_inode_init_ts(root);</div><div class='ctx'> 	s-&gt;s_root = d_make_root(root);</div><div class='ctx'> 	if (!s-&gt;s_root)</div><div class='ctx'> 		return -ENOMEM;</div><div class='del'>-	s-&gt;s_d_op = ctx-&gt;dops;</div><div class='add'>+	set_default_d_op(s, ctx-&gt;dops);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -395,11 +761,11 @@ int simple_link(struct dentry *old_dentry, struct inode *dir, struct dentry *den</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(old_dentry);</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_ctime = dir-&gt;i_ctime = dir-&gt;i_mtime = current_time(inode);</div><div class='add'>+	inode_set_mtime_to_ts(dir,</div><div class='add'>+			      inode_set_ctime_to_ts(dir, inode_set_ctime_current(inode)));</div><div class='ctx'> 	inc_nlink(inode);</div><div class='ctx'> 	ihold(inode);</div><div class='del'>-	dget(dentry);</div><div class='del'>-	d_instantiate(dentry, inode);</div><div class='add'>+	d_make_persistent(dentry, inode);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(simple_link);</div><div class='hunk'>@@ -410,7 +776,7 @@ int simple_empty(struct dentry *dentry)</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;dentry-&gt;d_lock);</div><div class='del'>-	list_for_each_entry(child, &amp;dentry-&gt;d_subdirs, d_child) {</div><div class='add'>+	hlist_for_each_entry(child, &amp;dentry-&gt;d_children, d_sib) {</div><div class='ctx'> 		spin_lock_nested(&amp;child-&gt;d_lock, DENTRY_D_LOCK_NESTED);</div><div class='ctx'> 		if (simple_positive(child)) {</div><div class='ctx'> 			spin_unlock(&amp;child-&gt;d_lock);</div><div class='hunk'>@@ -425,13 +791,28 @@ out:</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(simple_empty);</div><div class='ctx'> </div><div class='del'>-int simple_unlink(struct inode *dir, struct dentry *dentry)</div><div class='add'>+void __simple_unlink(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_ctime = dir-&gt;i_ctime = dir-&gt;i_mtime = current_time(inode);</div><div class='add'>+	inode_set_mtime_to_ts(dir,</div><div class='add'>+			      inode_set_ctime_to_ts(dir, inode_set_ctime_current(inode)));</div><div class='ctx'> 	drop_nlink(inode);</div><div class='del'>-	dput(dentry);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(__simple_unlink);</div><div class='add'>+</div><div class='add'>+void __simple_rmdir(struct inode *dir, struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	drop_nlink(d_inode(dentry));</div><div class='add'>+	__simple_unlink(dir, dentry);</div><div class='add'>+	drop_nlink(dir);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(__simple_rmdir);</div><div class='add'>+</div><div class='add'>+int simple_unlink(struct inode *dir, struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	__simple_unlink(dir, dentry);</div><div class='add'>+	d_make_discardable(dentry);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(simple_unlink);</div><div class='hunk'>@@ -441,13 +822,38 @@ int simple_rmdir(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> 	if (!simple_empty(dentry))</div><div class='ctx'> 		return -ENOTEMPTY;</div><div class='ctx'> </div><div class='del'>-	drop_nlink(d_inode(dentry));</div><div class='del'>-	simple_unlink(dir, dentry);</div><div class='del'>-	drop_nlink(dir);</div><div class='add'>+	__simple_rmdir(dir, dentry);</div><div class='add'>+	d_make_discardable(dentry);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(simple_rmdir);</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * simple_rename_timestamp - update the various inode timestamps for rename</div><div class='add'>+ * @old_dir: old parent directory</div><div class='add'>+ * @old_dentry: dentry that is being renamed</div><div class='add'>+ * @new_dir: new parent directory</div><div class='add'>+ * @new_dentry: target for rename</div><div class='add'>+ *</div><div class='add'>+ * POSIX mandates that the old and new parent directories have their ctime and</div><div class='add'>+ * mtime updated, and that inodes of @old_dentry and @new_dentry (if any), have</div><div class='add'>+ * their ctime updated.</div><div class='add'>+ */</div><div class='add'>+void simple_rename_timestamp(struct inode *old_dir, struct dentry *old_dentry,</div><div class='add'>+			     struct inode *new_dir, struct dentry *new_dentry)</div><div class='add'>+{</div><div class='add'>+	struct inode *newino = d_inode(new_dentry);</div><div class='add'>+</div><div class='add'>+	inode_set_mtime_to_ts(old_dir, inode_set_ctime_current(old_dir));</div><div class='add'>+	if (new_dir != old_dir)</div><div class='add'>+		inode_set_mtime_to_ts(new_dir,</div><div class='add'>+				      inode_set_ctime_current(new_dir));</div><div class='add'>+	inode_set_ctime_current(d_inode(old_dentry));</div><div class='add'>+	if (newino)</div><div class='add'>+		inode_set_ctime_current(newino);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(simple_rename_timestamp);</div><div class='add'>+</div><div class='ctx'> int simple_rename_exchange(struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> 			   struct inode *new_dir, struct dentry *new_dentry)</div><div class='ctx'> {</div><div class='hunk'>@@ -463,20 +869,15 @@ int simple_rename_exchange(struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> 			inc_nlink(old_dir);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	old_dir-&gt;i_ctime = old_dir-&gt;i_mtime =</div><div class='del'>-	new_dir-&gt;i_ctime = new_dir-&gt;i_mtime =</div><div class='del'>-	d_inode(old_dentry)-&gt;i_ctime =</div><div class='del'>-	d_inode(new_dentry)-&gt;i_ctime = current_time(old_dir);</div><div class='del'>-</div><div class='add'>+	simple_rename_timestamp(old_dir, old_dentry, new_dir, new_dentry);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(simple_rename_exchange);</div><div class='ctx'> </div><div class='del'>-int simple_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='add'>+int simple_rename(struct mnt_idmap *idmap, struct inode *old_dir,</div><div class='ctx'> 		  struct dentry *old_dentry, struct inode *new_dir,</div><div class='ctx'> 		  struct dentry *new_dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = d_inode(old_dentry);</div><div class='ctx'> 	int they_are_dirs = d_is_dir(old_dentry);</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; ~(RENAME_NOREPLACE | RENAME_EXCHANGE))</div><div class='hunk'>@@ -499,16 +900,14 @@ int simple_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> 		inc_nlink(new_dir);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	old_dir-&gt;i_ctime = old_dir-&gt;i_mtime = new_dir-&gt;i_ctime =</div><div class='del'>-		new_dir-&gt;i_mtime = inode-&gt;i_ctime = current_time(old_dir);</div><div class='del'>-</div><div class='add'>+	simple_rename_timestamp(old_dir, old_dentry, new_dir, new_dentry);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(simple_rename);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * simple_setattr - setattr for simple filesystem</div><div class='del'>- * @mnt_userns: user namespace of the target mount</div><div class='add'>+ * @idmap: idmap of the target mount</div><div class='ctx'>  * @dentry: dentry</div><div class='ctx'>  * @iattr: iattr structure</div><div class='ctx'>  *</div><div class='hunk'>@@ -521,52 +920,51 @@ EXPORT_SYMBOL(simple_rename);</div><div class='ctx'>  * on simple regular filesystems.  Anything that needs to change on-disk</div><div class='ctx'>  * or wire state on size changes needs its own setattr method.</div><div class='ctx'>  */</div><div class='del'>-int simple_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='add'>+int simple_setattr(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		   struct iattr *iattr)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	error = setattr_prepare(mnt_userns, dentry, iattr);</div><div class='add'>+	error = setattr_prepare(idmap, dentry, iattr);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='ctx'> 	if (iattr-&gt;ia_valid &amp; ATTR_SIZE)</div><div class='ctx'> 		truncate_setsize(inode, iattr-&gt;ia_size);</div><div class='del'>-	setattr_copy(mnt_userns, inode, iattr);</div><div class='add'>+	setattr_copy(idmap, inode, iattr);</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(simple_setattr);</div><div class='ctx'> </div><div class='del'>-static int simple_readpage(struct file *file, struct page *page)</div><div class='add'>+static int simple_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	clear_highpage(page);</div><div class='del'>-	flush_dcache_page(page);</div><div class='del'>-	SetPageUptodate(page);</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	folio_zero_range(folio, 0, folio_size(folio));</div><div class='add'>+	flush_dcache_folio(folio);</div><div class='add'>+	folio_mark_uptodate(folio);</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int simple_write_begin(struct file *file, struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned flags,</div><div class='del'>-			struct page **pagep, void **fsdata)</div><div class='add'>+int simple_write_begin(const struct kiocb *iocb, struct address_space *mapping,</div><div class='add'>+			loff_t pos, unsigned len,</div><div class='add'>+			struct folio **foliop, void **fsdata)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='del'>-	pgoff_t index;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> </div><div class='del'>-	index = pos &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	folio = __filemap_get_folio(mapping, pos / PAGE_SIZE, FGP_WRITEBEGIN,</div><div class='add'>+			mapping_gfp_mask(mapping));</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio);</div><div class='ctx'> </div><div class='del'>-	page = grab_cache_page_write_begin(mapping, index, flags);</div><div class='del'>-	if (!page)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	*foliop = folio;</div><div class='ctx'> </div><div class='del'>-	*pagep = page;</div><div class='add'>+	if (!folio_test_uptodate(folio) &amp;&amp; (len != folio_size(folio))) {</div><div class='add'>+		size_t from = offset_in_folio(folio, pos);</div><div class='ctx'> </div><div class='del'>-	if (!PageUptodate(page) &amp;&amp; (len != PAGE_SIZE)) {</div><div class='del'>-		unsigned from = pos &amp; (PAGE_SIZE - 1);</div><div class='del'>-</div><div class='del'>-		zero_user_segments(page, 0, from, from + len, PAGE_SIZE);</div><div class='add'>+		folio_zero_segments(folio, 0, from,</div><div class='add'>+				from + len, folio_size(folio));</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -574,52 +972,54 @@ EXPORT_SYMBOL(simple_write_begin);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * simple_write_end - .write_end helper for non-block-device FSes</div><div class='del'>- * @file: See .write_end of address_space_operations</div><div class='add'>+ * @iocb: kernel I/O control block</div><div class='ctx'>  * @mapping: 		"</div><div class='ctx'>  * @pos: 		"</div><div class='ctx'>  * @len: 		"</div><div class='ctx'>  * @copied: 		"</div><div class='del'>- * @page: 		"</div><div class='add'>+ * @folio: 		"</div><div class='ctx'>  * @fsdata: 		"</div><div class='ctx'>  *</div><div class='del'>- * simple_write_end does the minimum needed for updating a page after writing is</div><div class='del'>- * done. It has the same API signature as the .write_end of</div><div class='add'>+ * simple_write_end does the minimum needed for updating a folio after</div><div class='add'>+ * writing is done. It has the same API signature as the .write_end of</div><div class='ctx'>  * address_space_operations vector. So it can just be set onto .write_end for</div><div class='del'>- * FSes that don't need any other processing. i_mutex is assumed to be held.</div><div class='add'>+ * FSes that don't need any other processing. i_rwsem is assumed to be held</div><div class='add'>+ * exclusively.</div><div class='ctx'>  * Block based filesystems should use generic_write_end().</div><div class='ctx'>  * NOTE: Even though i_size might get updated by this function, mark_inode_dirty</div><div class='ctx'>  * is not called, so a filesystem that actually does store data in .write_inode</div><div class='ctx'>  * should extend on what's done here with a call to mark_inode_dirty() in the</div><div class='ctx'>  * case that i_size has changed.</div><div class='ctx'>  *</div><div class='del'>- * Use *ONLY* with simple_readpage()</div><div class='add'>+ * Use *ONLY* with simple_read_folio()</div><div class='ctx'>  */</div><div class='del'>-static int simple_write_end(struct file *file, struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned copied,</div><div class='del'>-			struct page *page, void *fsdata)</div><div class='add'>+static int simple_write_end(const struct kiocb *iocb,</div><div class='add'>+			    struct address_space *mapping,</div><div class='add'>+			    loff_t pos, unsigned len, unsigned copied,</div><div class='add'>+			    struct folio *folio, void *fsdata)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	loff_t last_pos = pos + copied;</div><div class='ctx'> </div><div class='del'>-	/* zero the stale part of the page if we did a short copy */</div><div class='del'>-	if (!PageUptodate(page)) {</div><div class='add'>+	/* zero the stale part of the folio if we did a short copy */</div><div class='add'>+	if (!folio_test_uptodate(folio)) {</div><div class='ctx'> 		if (copied &lt; len) {</div><div class='del'>-			unsigned from = pos &amp; (PAGE_SIZE - 1);</div><div class='add'>+			size_t from = offset_in_folio(folio, pos);</div><div class='ctx'> </div><div class='del'>-			zero_user(page, from + copied, len - copied);</div><div class='add'>+			folio_zero_range(folio, from + copied, len - copied);</div><div class='ctx'> 		}</div><div class='del'>-		SetPageUptodate(page);</div><div class='add'>+		folio_mark_uptodate(folio);</div><div class='ctx'> 	}</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * No need to use i_size_read() here, the i_size</div><div class='del'>-	 * cannot change under us because we hold the i_mutex.</div><div class='add'>+	 * cannot change under us because we hold the i_rwsem.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (last_pos &gt; inode-&gt;i_size)</div><div class='ctx'> 		i_size_write(inode, last_pos);</div><div class='ctx'> </div><div class='del'>-	set_page_dirty(page);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='add'>+	folio_mark_dirty(folio);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> </div><div class='ctx'> 	return copied;</div><div class='ctx'> }</div><div class='hunk'>@@ -628,10 +1028,10 @@ static int simple_write_end(struct file *file, struct address_space *mapping,</div><div class='ctx'>  * Provides ramfs-style behavior: data in the pagecache, but no writeback.</div><div class='ctx'>  */</div><div class='ctx'> const struct address_space_operations ram_aops = {</div><div class='del'>-	.readpage	= simple_readpage,</div><div class='add'>+	.read_folio	= simple_read_folio,</div><div class='ctx'> 	.write_begin	= simple_write_begin,</div><div class='ctx'> 	.write_end	= simple_write_end,</div><div class='del'>-	.set_page_dirty	= __set_page_dirty_no_writeback,</div><div class='add'>+	.dirty_folio	= noop_dirty_folio,</div><div class='ctx'> };</div><div class='ctx'> EXPORT_SYMBOL(ram_aops);</div><div class='ctx'> </div><div class='hunk'>@@ -644,7 +1044,6 @@ int simple_fill_super(struct super_block *s, unsigned long magic,</div><div class='ctx'> 		      const struct tree_descr *files)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='del'>-	struct dentry *root;</div><div class='ctx'> 	struct dentry *dentry;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='hunk'>@@ -663,12 +1062,12 @@ int simple_fill_super(struct super_block *s, unsigned long magic,</div><div class='ctx'> 	 */</div><div class='ctx'> 	inode-&gt;i_ino = 1;</div><div class='ctx'> 	inode-&gt;i_mode = S_IFDIR | 0755;</div><div class='del'>-	inode-&gt;i_atime = inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	simple_inode_init_ts(inode);</div><div class='ctx'> 	inode-&gt;i_op = &amp;simple_dir_inode_operations;</div><div class='ctx'> 	inode-&gt;i_fop = &amp;simple_dir_operations;</div><div class='ctx'> 	set_nlink(inode, 2);</div><div class='del'>-	root = d_make_root(inode);</div><div class='del'>-	if (!root)</div><div class='add'>+	s-&gt;s_root = d_make_root(inode);</div><div class='add'>+	if (!s-&gt;s_root)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	for (i = 0; !files-&gt;name || files-&gt;name[0]; i++, files++) {</div><div class='ctx'> 		if (!files-&gt;name)</div><div class='hunk'>@@ -680,27 +1079,22 @@ int simple_fill_super(struct super_block *s, unsigned long magic,</div><div class='ctx'> 				"with an index of 1!\n", __func__,</div><div class='ctx'> 				s-&gt;s_type-&gt;name);</div><div class='ctx'> </div><div class='del'>-		dentry = d_alloc_name(root, files-&gt;name);</div><div class='add'>+		dentry = d_alloc_name(s-&gt;s_root, files-&gt;name);</div><div class='ctx'> 		if (!dentry)</div><div class='del'>-			goto out;</div><div class='add'>+			return -ENOMEM;</div><div class='ctx'> 		inode = new_inode(s);</div><div class='ctx'> 		if (!inode) {</div><div class='ctx'> 			dput(dentry);</div><div class='del'>-			goto out;</div><div class='add'>+			return -ENOMEM;</div><div class='ctx'> 		}</div><div class='ctx'> 		inode-&gt;i_mode = S_IFREG | files-&gt;mode;</div><div class='del'>-		inode-&gt;i_atime = inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+		simple_inode_init_ts(inode);</div><div class='ctx'> 		inode-&gt;i_fop = files-&gt;ops;</div><div class='ctx'> 		inode-&gt;i_ino = i;</div><div class='del'>-		d_add(dentry, inode);</div><div class='add'>+		d_make_persistent(dentry, inode);</div><div class='add'>+		dput(dentry);</div><div class='ctx'> 	}</div><div class='del'>-	s-&gt;s_root = root;</div><div class='ctx'> 	return 0;</div><div class='del'>-out:</div><div class='del'>-	d_genocide(root);</div><div class='del'>-	shrink_dcache_parent(root);</div><div class='del'>-	dput(root);</div><div class='del'>-	return -ENOMEM;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(simple_fill_super);</div><div class='ctx'> </div><div class='hunk'>@@ -994,8 +1388,8 @@ out:</div><div class='ctx'> EXPORT_SYMBOL_GPL(simple_attr_read);</div><div class='ctx'> </div><div class='ctx'> /* interpret the buffer as a number to call the set function with */</div><div class='del'>-ssize_t simple_attr_write(struct file *file, const char __user *buf,</div><div class='del'>-			  size_t len, loff_t *ppos)</div><div class='add'>+static ssize_t simple_attr_write_xsigned(struct file *file, const char __user *buf,</div><div class='add'>+			  size_t len, loff_t *ppos, bool is_signed)</div><div class='ctx'> {</div><div class='ctx'> 	struct simple_attr *attr;</div><div class='ctx'> 	unsigned long long val;</div><div class='hunk'>@@ -1016,7 +1410,10 @@ ssize_t simple_attr_write(struct file *file, const char __user *buf,</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	attr-&gt;set_buf[size] = '\0';</div><div class='del'>-	ret = kstrtoull(attr-&gt;set_buf, 0, &amp;val);</div><div class='add'>+	if (is_signed)</div><div class='add'>+		ret = kstrtoll(attr-&gt;set_buf, 0, &amp;val);</div><div class='add'>+	else</div><div class='add'>+		ret = kstrtoull(attr-&gt;set_buf, 0, &amp;val);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	ret = attr-&gt;set(attr-&gt;data, val);</div><div class='hunk'>@@ -1026,8 +1423,62 @@ out:</div><div class='ctx'> 	mutex_unlock(&amp;attr-&gt;mutex);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+ssize_t simple_attr_write(struct file *file, const char __user *buf,</div><div class='add'>+			  size_t len, loff_t *ppos)</div><div class='add'>+{</div><div class='add'>+	return simple_attr_write_xsigned(file, buf, len, ppos, false);</div><div class='add'>+}</div><div class='ctx'> EXPORT_SYMBOL_GPL(simple_attr_write);</div><div class='ctx'> </div><div class='add'>+ssize_t simple_attr_write_signed(struct file *file, const char __user *buf,</div><div class='add'>+			  size_t len, loff_t *ppos)</div><div class='add'>+{</div><div class='add'>+	return simple_attr_write_xsigned(file, buf, len, ppos, true);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(simple_attr_write_signed);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * generic_encode_ino32_fh - generic export_operations-&gt;encode_fh function</div><div class='add'>+ * @inode:   the object to encode</div><div class='add'>+ * @fh:      where to store the file handle fragment</div><div class='add'>+ * @max_len: maximum length to store there (in 4 byte units)</div><div class='add'>+ * @parent:  parent directory inode, if wanted</div><div class='add'>+ *</div><div class='add'>+ * This generic encode_fh function assumes that the 32 inode number</div><div class='add'>+ * is suitable for locating an inode, and that the generation number</div><div class='add'>+ * can be used to check that it is still valid.  It places them in the</div><div class='add'>+ * filehandle fragment where export_decode_fh expects to find them.</div><div class='add'>+ */</div><div class='add'>+int generic_encode_ino32_fh(struct inode *inode, __u32 *fh, int *max_len,</div><div class='add'>+			    struct inode *parent)</div><div class='add'>+{</div><div class='add'>+	struct fid *fid = (void *)fh;</div><div class='add'>+	int len = *max_len;</div><div class='add'>+	int type = FILEID_INO32_GEN;</div><div class='add'>+</div><div class='add'>+	if (parent &amp;&amp; (len &lt; 4)) {</div><div class='add'>+		*max_len = 4;</div><div class='add'>+		return FILEID_INVALID;</div><div class='add'>+	} else if (len &lt; 2) {</div><div class='add'>+		*max_len = 2;</div><div class='add'>+		return FILEID_INVALID;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	len = 2;</div><div class='add'>+	fid-&gt;i32.ino = inode-&gt;i_ino;</div><div class='add'>+	fid-&gt;i32.gen = inode-&gt;i_generation;</div><div class='add'>+	if (parent) {</div><div class='add'>+		fid-&gt;i32.parent_ino = parent-&gt;i_ino;</div><div class='add'>+		fid-&gt;i32.parent_gen = parent-&gt;i_generation;</div><div class='add'>+		len = 4;</div><div class='add'>+		type = FILEID_INO32_GEN_PARENT;</div><div class='add'>+	}</div><div class='add'>+	*max_len = len;</div><div class='add'>+	return type;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(generic_encode_ino32_fh);</div><div class='add'>+</div><div class='ctx'> /**</div><div class='ctx'>  * generic_fh_to_dentry - generic helper for the fh_to_dentry export operation</div><div class='ctx'>  * @sb:		filesystem to do the file handle conversion on</div><div class='hunk'>@@ -1118,9 +1569,9 @@ int __generic_file_fsync(struct file *file, loff_t start, loff_t end,</div><div class='ctx'> </div><div class='ctx'> 	inode_lock(inode);</div><div class='ctx'> 	ret = sync_mapping_buffers(inode-&gt;i_mapping);</div><div class='del'>-	if (!(inode-&gt;i_state &amp; I_DIRTY_ALL))</div><div class='add'>+	if (!(inode_state_read_once(inode) &amp; I_DIRTY_ALL))</div><div class='ctx'> 		goto out;</div><div class='del'>-	if (datasync &amp;&amp; !(inode-&gt;i_state &amp; I_DIRTY_DATASYNC))</div><div class='add'>+	if (datasync &amp;&amp; !(inode_state_read_once(inode) &amp; I_DIRTY_DATASYNC))</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	err = sync_inode_metadata(inode, 1);</div><div class='hunk'>@@ -1172,13 +1623,17 @@ EXPORT_SYMBOL(generic_file_fsync);</div><div class='ctx'> int generic_check_addressable(unsigned blocksize_bits, u64 num_blocks)</div><div class='ctx'> {</div><div class='ctx'> 	u64 last_fs_block = num_blocks - 1;</div><div class='del'>-	u64 last_fs_page =</div><div class='del'>-		last_fs_block &gt;&gt; (PAGE_SHIFT - blocksize_bits);</div><div class='add'>+	u64 last_fs_page, max_bytes;</div><div class='add'>+</div><div class='add'>+	if (check_shl_overflow(num_blocks, blocksize_bits, &amp;max_bytes))</div><div class='add'>+		return -EFBIG;</div><div class='add'>+</div><div class='add'>+	last_fs_page = (max_bytes &gt;&gt; PAGE_SHIFT) - 1;</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(num_blocks == 0))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	if ((blocksize_bits &lt; 9) || (blocksize_bits &gt; PAGE_SHIFT))</div><div class='add'>+	if (blocksize_bits &lt; 9)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	if ((last_fs_block &gt; (sector_t)(~0ULL) &gt;&gt; (blocksize_bits - 9)) ||</div><div class='hunk'>@@ -1198,17 +1653,6 @@ int noop_fsync(struct file *file, loff_t start, loff_t end, int datasync)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(noop_fsync);</div><div class='ctx'> </div><div class='del'>-void noop_invalidatepage(struct page *page, unsigned int offset,</div><div class='del'>-		unsigned int length)</div><div class='del'>-{</div><div class='del'>-	/*</div><div class='del'>-	 * There is no page cache to invalidate in the dax case, however</div><div class='del'>-	 * we need this callback defined to prevent falling back to</div><div class='del'>-	 * block_invalidatepage() in do_invalidatepage().</div><div class='del'>-	 */</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL_GPL(noop_invalidatepage);</div><div class='del'>-</div><div class='ctx'> ssize_t noop_direct_IO(struct kiocb *iocb, struct iov_iter *iter)</div><div class='ctx'> {</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1231,7 +1675,7 @@ EXPORT_SYMBOL(kfree_link);</div><div class='ctx'> struct inode *alloc_anon_inode(struct super_block *s)</div><div class='ctx'> {</div><div class='ctx'> 	static const struct address_space_operations anon_aops = {</div><div class='del'>-		.set_page_dirty = __set_page_dirty_no_writeback,</div><div class='add'>+		.dirty_folio	= noop_dirty_folio,</div><div class='ctx'> 	};</div><div class='ctx'> 	struct inode *inode = new_inode_pseudo(s);</div><div class='ctx'> </div><div class='hunk'>@@ -1247,12 +1691,16 @@ struct inode *alloc_anon_inode(struct super_block *s)</div><div class='ctx'> 	 * list because mark_inode_dirty() will think</div><div class='ctx'> 	 * that it already _is_ on the dirty list.</div><div class='ctx'> 	 */</div><div class='del'>-	inode-&gt;i_state = I_DIRTY;</div><div class='add'>+	inode_state_assign_raw(inode, I_DIRTY);</div><div class='add'>+	/*</div><div class='add'>+	 * Historically anonymous inodes don't have a type at all and</div><div class='add'>+	 * userspace has come to rely on this.</div><div class='add'>+	 */</div><div class='ctx'> 	inode-&gt;i_mode = S_IRUSR | S_IWUSR;</div><div class='ctx'> 	inode-&gt;i_uid = current_fsuid();</div><div class='ctx'> 	inode-&gt;i_gid = current_fsgid();</div><div class='del'>-	inode-&gt;i_flags |= S_PRIVATE;</div><div class='del'>-	inode-&gt;i_atime = inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode-&gt;i_flags |= S_PRIVATE | S_ANON_INODE;</div><div class='add'>+	simple_inode_init_ts(inode);</div><div class='ctx'> 	return inode;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(alloc_anon_inode);</div><div class='hunk'>@@ -1268,7 +1716,7 @@ EXPORT_SYMBOL(alloc_anon_inode);</div><div class='ctx'>  * All arguments are ignored and it just returns -EINVAL.</div><div class='ctx'>  */</div><div class='ctx'> int</div><div class='del'>-simple_nosetlease(struct file *filp, long arg, struct file_lock **flp,</div><div class='add'>+simple_nosetlease(struct file *filp, int arg, struct file_lease **flp,</div><div class='ctx'> 		  void **priv)</div><div class='ctx'> {</div><div class='ctx'> 	return -EINVAL;</div><div class='hunk'>@@ -1309,16 +1757,7 @@ static struct dentry *empty_dir_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	return ERR_PTR(-ENOENT);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int empty_dir_getattr(struct user_namespace *mnt_userns,</div><div class='del'>-			     const struct path *path, struct kstat *stat,</div><div class='del'>-			     u32 request_mask, unsigned int query_flags)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = d_inode(path-&gt;dentry);</div><div class='del'>-	generic_fillattr(&amp;init_user_ns, inode, stat);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int empty_dir_setattr(struct user_namespace *mnt_userns,</div><div class='add'>+static int empty_dir_setattr(struct mnt_idmap *idmap,</div><div class='ctx'> 			     struct dentry *dentry, struct iattr *attr)</div><div class='ctx'> {</div><div class='ctx'> 	return -EPERM;</div><div class='hunk'>@@ -1331,9 +1770,7 @@ static ssize_t empty_dir_listxattr(struct dentry *dentry, char *list, size_t siz</div><div class='ctx'> </div><div class='ctx'> static const struct inode_operations empty_dir_inode_operations = {</div><div class='ctx'> 	.lookup		= empty_dir_lookup,</div><div class='del'>-	.permission	= generic_permission,</div><div class='ctx'> 	.setattr	= empty_dir_setattr,</div><div class='del'>-	.getattr	= empty_dir_getattr,</div><div class='ctx'> 	.listxattr	= empty_dir_listxattr,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -1379,17 +1816,7 @@ bool is_empty_dir_inode(struct inode *inode)</div><div class='ctx'> 		(inode-&gt;i_op == &amp;empty_dir_inode_operations);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='del'>-/*</div><div class='del'>- * Determine if the name of a dentry should be casefolded.</div><div class='del'>- *</div><div class='del'>- * Return: if names will need casefolding</div><div class='del'>- */</div><div class='del'>-static bool needs_casefold(const struct inode *dir)</div><div class='del'>-{</div><div class='del'>-	return IS_CASEFOLDED(dir) &amp;&amp; dir-&gt;i_sb-&gt;s_encoding;</div><div class='del'>-}</div><div class='del'>-</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='ctx'> /**</div><div class='ctx'>  * generic_ci_d_compare - generic d_compare implementation for casefolding filesystems</div><div class='ctx'>  * @dentry:	dentry whose name we are checking against</div><div class='hunk'>@@ -1399,44 +1826,52 @@ static bool needs_casefold(const struct inode *dir)</div><div class='ctx'>  *</div><div class='ctx'>  * Return: 0 if names match, 1 if mismatch, or -ERRNO</div><div class='ctx'>  */</div><div class='del'>-static int generic_ci_d_compare(const struct dentry *dentry, unsigned int len,</div><div class='del'>-				const char *str, const struct qstr *name)</div><div class='add'>+int generic_ci_d_compare(const struct dentry *dentry, unsigned int len,</div><div class='add'>+			 const char *str, const struct qstr *name)</div><div class='ctx'> {</div><div class='del'>-	const struct dentry *parent = READ_ONCE(dentry-&gt;d_parent);</div><div class='del'>-	const struct inode *dir = READ_ONCE(parent-&gt;d_inode);</div><div class='del'>-	const struct super_block *sb = dentry-&gt;d_sb;</div><div class='del'>-	const struct unicode_map *um = sb-&gt;s_encoding;</div><div class='del'>-	struct qstr qstr = QSTR_INIT(str, len);</div><div class='del'>-	char strbuf[DNAME_INLINE_LEN];</div><div class='del'>-	int ret;</div><div class='add'>+	const struct dentry *parent;</div><div class='add'>+	const struct inode *dir;</div><div class='add'>+	union shortname_store strbuf;</div><div class='add'>+	struct qstr qstr;</div><div class='ctx'> </div><div class='del'>-	if (!dir || !needs_casefold(dir))</div><div class='del'>-		goto fallback;</div><div class='add'>+	/*</div><div class='add'>+	 * Attempt a case-sensitive match first. It is cheaper and</div><div class='add'>+	 * should cover most lookups, including all the sane</div><div class='add'>+	 * applications that expect a case-sensitive filesystem.</div><div class='add'>+	 *</div><div class='add'>+	 * This comparison is safe under RCU because the caller</div><div class='add'>+	 * guarantees the consistency between str and len. See</div><div class='add'>+	 * __d_lookup_rcu_op_compare() for details.</div><div class='add'>+	 */</div><div class='add'>+	if (len == name-&gt;len &amp;&amp; !memcmp(str, name-&gt;name, len))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	parent = READ_ONCE(dentry-&gt;d_parent);</div><div class='add'>+	dir = READ_ONCE(parent-&gt;d_inode);</div><div class='add'>+	if (!dir || !IS_CASEFOLDED(dir))</div><div class='add'>+		return 1;</div><div class='add'>+</div><div class='add'>+	qstr.len = len;</div><div class='add'>+	qstr.name = str;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If the dentry name is stored in-line, then it may be concurrently</div><div class='ctx'> 	 * modified by a rename.  If this happens, the VFS will eventually retry</div><div class='ctx'> 	 * the lookup, so it doesn't matter what -&gt;d_compare() returns.</div><div class='ctx'> 	 * However, it's unsafe to call utf8_strncasecmp() with an unstable</div><div class='ctx'> 	 * string.  Therefore, we have to copy the name into a temporary buffer.</div><div class='add'>+	 * As above, len is guaranteed to match str, so the shortname case</div><div class='add'>+	 * is exactly when str points to -&gt;d_shortname.</div><div class='ctx'> 	 */</div><div class='del'>-	if (len &lt;= DNAME_INLINE_LEN - 1) {</div><div class='del'>-		memcpy(strbuf, str, len);</div><div class='del'>-		strbuf[len] = 0;</div><div class='del'>-		qstr.name = strbuf;</div><div class='add'>+	if (qstr.name == dentry-&gt;d_shortname.string) {</div><div class='add'>+		strbuf = dentry-&gt;d_shortname; // NUL is guaranteed to be in there</div><div class='add'>+		qstr.name = strbuf.string;</div><div class='ctx'> 		/* prevent compiler from optimizing out the temporary buffer */</div><div class='ctx'> 		barrier();</div><div class='ctx'> 	}</div><div class='del'>-	ret = utf8_strncasecmp(um, name, &amp;qstr);</div><div class='del'>-	if (ret &gt;= 0)</div><div class='del'>-		return ret;</div><div class='ctx'> </div><div class='del'>-	if (sb_has_strict_encoding(sb))</div><div class='del'>-		return -EINVAL;</div><div class='del'>-fallback:</div><div class='del'>-	if (len != name-&gt;len)</div><div class='del'>-		return 1;</div><div class='del'>-	return !!memcmp(str, name-&gt;name, len);</div><div class='add'>+	return utf8_strncasecmp(dentry-&gt;d_sb-&gt;s_encoding, name, &amp;qstr);</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL(generic_ci_d_compare);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * generic_ci_d_hash - generic d_hash implementation for casefolding filesystems</div><div class='hunk'>@@ -1445,14 +1880,14 @@ fallback:</div><div class='ctx'>  *</div><div class='ctx'>  * Return: 0 if hash was successful or unchanged, and -EINVAL on error</div><div class='ctx'>  */</div><div class='del'>-static int generic_ci_d_hash(const struct dentry *dentry, struct qstr *str)</div><div class='add'>+int generic_ci_d_hash(const struct dentry *dentry, struct qstr *str)</div><div class='ctx'> {</div><div class='ctx'> 	const struct inode *dir = READ_ONCE(dentry-&gt;d_inode);</div><div class='ctx'> 	struct super_block *sb = dentry-&gt;d_sb;</div><div class='ctx'> 	const struct unicode_map *um = sb-&gt;s_encoding;</div><div class='del'>-	int ret = 0;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	if (!dir || !needs_casefold(dir))</div><div class='add'>+	if (!dir || !IS_CASEFOLDED(dir))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	ret = utf8_casefold_hash(um, dentry, str);</div><div class='hunk'>@@ -1460,74 +1895,454 @@ static int generic_ci_d_hash(const struct dentry *dentry, struct qstr *str)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL(generic_ci_d_hash);</div><div class='ctx'> </div><div class='ctx'> static const struct dentry_operations generic_ci_dentry_ops = {</div><div class='ctx'> 	.d_hash = generic_ci_d_hash,</div><div class='ctx'> 	.d_compare = generic_ci_d_compare,</div><div class='del'>-};</div><div class='del'>-#endif</div><div class='del'>-</div><div class='ctx'> #ifdef CONFIG_FS_ENCRYPTION</div><div class='del'>-static const struct dentry_operations generic_encrypted_dentry_ops = {</div><div class='ctx'> 	.d_revalidate = fscrypt_d_revalidate,</div><div class='del'>-};</div><div class='ctx'> #endif</div><div class='del'>-</div><div class='del'>-#if defined(CONFIG_FS_ENCRYPTION) &amp;&amp; defined(CONFIG_UNICODE)</div><div class='del'>-static const struct dentry_operations generic_encrypted_ci_dentry_ops = {</div><div class='del'>-	.d_hash = generic_ci_d_hash,</div><div class='del'>-	.d_compare = generic_ci_d_compare,</div><div class='del'>-	.d_revalidate = fscrypt_d_revalidate,</div><div class='ctx'> };</div><div class='del'>-#endif</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * generic_set_encrypted_ci_d_ops - helper for setting d_ops for given dentry</div><div class='del'>- * @dentry:	dentry to set ops on</div><div class='add'>+ * generic_ci_match() - Match a name (case-insensitively) with a dirent.</div><div class='add'>+ * This is a filesystem helper for comparison with directory entries.</div><div class='add'>+ * generic_ci_d_compare should be used in VFS' -&gt;d_compare instead.</div><div class='ctx'>  *</div><div class='del'>- * Casefolded directories need d_hash and d_compare set, so that the dentries</div><div class='del'>- * contained in them are handled case-insensitively.  Note that these operations</div><div class='del'>- * are needed on the parent directory rather than on the dentries in it, and</div><div class='del'>- * while the casefolding flag can be toggled on and off on an empty directory,</div><div class='del'>- * dentry_operations can't be changed later.  As a result, if the filesystem has</div><div class='del'>- * casefolding support enabled at all, we have to give all dentries the</div><div class='del'>- * casefolding operations even if their inode doesn't have the casefolding flag</div><div class='del'>- * currently (and thus the casefolding ops would be no-ops for now).</div><div class='add'>+ * @parent: Inode of the parent of the dirent under comparison</div><div class='add'>+ * @name: name under lookup.</div><div class='add'>+ * @folded_name: Optional pre-folded name under lookup</div><div class='add'>+ * @de_name: Dirent name.</div><div class='add'>+ * @de_name_len: dirent name length.</div><div class='ctx'>  *</div><div class='del'>- * Encryption works differently in that the only dentry operation it needs is</div><div class='del'>- * d_revalidate, which it only needs on dentries that have the no-key name flag.</div><div class='del'>- * The no-key flag can't be set "later", so we don't have to worry about that.</div><div class='add'>+ * Test whether a case-insensitive directory entry matches the filename</div><div class='add'>+ * being searched.  If @folded_name is provided, it is used instead of</div><div class='add'>+ * recalculating the casefold of @name.</div><div class='ctx'>  *</div><div class='del'>- * Finally, to maximize compatibility with overlayfs (which isn't compatible</div><div class='del'>- * with certain dentry operations) and to avoid taking an unnecessary</div><div class='del'>- * performance hit, we use custom dentry_operations for each possible</div><div class='del'>- * combination rather than always installing all operations.</div><div class='add'>+ * Return: &gt; 0 if the directory entry matches, 0 if it doesn't match, or</div><div class='add'>+ * &lt; 0 on error.</div><div class='ctx'>  */</div><div class='del'>-void generic_set_encrypted_ci_d_ops(struct dentry *dentry)</div><div class='add'>+int generic_ci_match(const struct inode *parent,</div><div class='add'>+		     const struct qstr *name,</div><div class='add'>+		     const struct qstr *folded_name,</div><div class='add'>+		     const u8 *de_name, u32 de_name_len)</div><div class='ctx'> {</div><div class='del'>-#ifdef CONFIG_FS_ENCRYPTION</div><div class='del'>-	bool needs_encrypt_ops = dentry-&gt;d_flags &amp; DCACHE_NOKEY_NAME;</div><div class='add'>+	const struct super_block *sb = parent-&gt;i_sb;</div><div class='add'>+	const struct unicode_map *um = sb-&gt;s_encoding;</div><div class='add'>+	struct fscrypt_str decrypted_name = FSTR_INIT(NULL, de_name_len);</div><div class='add'>+	struct qstr dirent = QSTR_INIT(de_name, de_name_len);</div><div class='add'>+	int res = 0;</div><div class='add'>+</div><div class='add'>+	if (IS_ENCRYPTED(parent)) {</div><div class='add'>+		const struct fscrypt_str encrypted_name =</div><div class='add'>+			FSTR_INIT((u8 *) de_name, de_name_len);</div><div class='add'>+</div><div class='add'>+		if (WARN_ON_ONCE(!fscrypt_has_encryption_key(parent)))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+</div><div class='add'>+		decrypted_name.name = kmalloc(de_name_len, GFP_KERNEL);</div><div class='add'>+		if (!decrypted_name.name)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+		res = fscrypt_fname_disk_to_usr(parent, 0, 0, &amp;encrypted_name,</div><div class='add'>+						&amp;decrypted_name);</div><div class='add'>+		if (res &lt; 0) {</div><div class='add'>+			kfree(decrypted_name.name);</div><div class='add'>+			return res;</div><div class='add'>+		}</div><div class='add'>+		dirent.name = decrypted_name.name;</div><div class='add'>+		dirent.len = decrypted_name.len;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Attempt a case-sensitive match first. It is cheaper and</div><div class='add'>+	 * should cover most lookups, including all the sane</div><div class='add'>+	 * applications that expect a case-sensitive filesystem.</div><div class='add'>+	 */</div><div class='add'>+</div><div class='add'>+	if (dirent.len == name-&gt;len &amp;&amp;</div><div class='add'>+	    !memcmp(name-&gt;name, dirent.name, dirent.len))</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	if (folded_name-&gt;name)</div><div class='add'>+		res = utf8_strncasecmp_folded(um, folded_name, &amp;dirent);</div><div class='add'>+	else</div><div class='add'>+		res = utf8_strncasecmp(um, name, &amp;dirent);</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	kfree(decrypted_name.name);</div><div class='add'>+	if (res &lt; 0 &amp;&amp; sb_has_strict_encoding(sb)) {</div><div class='add'>+		pr_err_ratelimited("Directory contains filename that is invalid UTF-8");</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+	return !res;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(generic_ci_match);</div><div class='ctx'> #endif</div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='del'>-	bool needs_ci_ops = dentry-&gt;d_sb-&gt;s_encoding;</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_FS_ENCRYPTION</div><div class='add'>+static const struct dentry_operations generic_encrypted_dentry_ops = {</div><div class='add'>+	.d_revalidate = fscrypt_d_revalidate,</div><div class='add'>+};</div><div class='ctx'> #endif</div><div class='del'>-#if defined(CONFIG_FS_ENCRYPTION) &amp;&amp; defined(CONFIG_UNICODE)</div><div class='del'>-	if (needs_encrypt_ops &amp;&amp; needs_ci_ops) {</div><div class='del'>-		d_set_d_op(dentry, &amp;generic_encrypted_ci_dentry_ops);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * generic_set_sb_d_ops - helper for choosing the set of</div><div class='add'>+ * filesystem-wide dentry operations for the enabled features</div><div class='add'>+ * @sb: superblock to be configured</div><div class='add'>+ *</div><div class='add'>+ * Filesystems supporting casefolding and/or fscrypt can call this</div><div class='add'>+ * helper at mount-time to configure default dentry_operations to the</div><div class='add'>+ * best set of dentry operations required for the enabled features.</div><div class='add'>+ * The helper must be called after these have been configured, but</div><div class='add'>+ * before the root dentry is created.</div><div class='add'>+ */</div><div class='add'>+void generic_set_sb_d_ops(struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+#if IS_ENABLED(CONFIG_UNICODE)</div><div class='add'>+	if (sb-&gt;s_encoding) {</div><div class='add'>+		set_default_d_op(sb, &amp;generic_ci_dentry_ops);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> #endif</div><div class='ctx'> #ifdef CONFIG_FS_ENCRYPTION</div><div class='del'>-	if (needs_encrypt_ops) {</div><div class='del'>-		d_set_d_op(dentry, &amp;generic_encrypted_dentry_ops);</div><div class='add'>+	if (sb-&gt;s_cop) {</div><div class='add'>+		set_default_d_op(sb, &amp;generic_encrypted_dentry_ops);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> #endif</div><div class='del'>-#ifdef CONFIG_UNICODE</div><div class='del'>-	if (needs_ci_ops) {</div><div class='del'>-		d_set_d_op(dentry, &amp;generic_ci_dentry_ops);</div><div class='del'>-		return;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(generic_set_sb_d_ops);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * inode_maybe_inc_iversion - increments i_version</div><div class='add'>+ * @inode: inode with the i_version that should be updated</div><div class='add'>+ * @force: increment the counter even if it's not necessary?</div><div class='add'>+ *</div><div class='add'>+ * Every time the inode is modified, the i_version field must be seen to have</div><div class='add'>+ * changed by any observer.</div><div class='add'>+ *</div><div class='add'>+ * If "force" is set or the QUERIED flag is set, then ensure that we increment</div><div class='add'>+ * the value, and clear the queried flag.</div><div class='add'>+ *</div><div class='add'>+ * In the common case where neither is set, then we can return "false" without</div><div class='add'>+ * updating i_version.</div><div class='add'>+ *</div><div class='add'>+ * If this function returns false, and no other metadata has changed, then we</div><div class='add'>+ * can avoid logging the metadata.</div><div class='add'>+ */</div><div class='add'>+bool inode_maybe_inc_iversion(struct inode *inode, bool force)</div><div class='add'>+{</div><div class='add'>+	u64 cur, new;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The i_version field is not strictly ordered with any other inode</div><div class='add'>+	 * information, but the legacy inode_inc_iversion code used a spinlock</div><div class='add'>+	 * to serialize increments.</div><div class='add'>+	 *</div><div class='add'>+	 * We add a full memory barrier to ensure that any de facto ordering</div><div class='add'>+	 * with other state is preserved (either implicitly coming from cmpxchg</div><div class='add'>+	 * or explicitly from smp_mb if we don't know upfront if we will execute</div><div class='add'>+	 * the former).</div><div class='add'>+	 *</div><div class='add'>+	 * These barriers pair with inode_query_iversion().</div><div class='add'>+	 */</div><div class='add'>+	cur = inode_peek_iversion_raw(inode);</div><div class='add'>+	if (!force &amp;&amp; !(cur &amp; I_VERSION_QUERIED)) {</div><div class='add'>+		smp_mb();</div><div class='add'>+		cur = inode_peek_iversion_raw(inode);</div><div class='ctx'> 	}</div><div class='del'>-#endif</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		/* If flag is clear then we needn't do anything */</div><div class='add'>+		if (!force &amp;&amp; !(cur &amp; I_VERSION_QUERIED))</div><div class='add'>+			return false;</div><div class='add'>+</div><div class='add'>+		/* Since lowest bit is flag, add 2 to avoid it */</div><div class='add'>+		new = (cur &amp; ~I_VERSION_QUERIED) + I_VERSION_INCREMENT;</div><div class='add'>+	} while (!atomic64_try_cmpxchg(&amp;inode-&gt;i_version, &amp;cur, new));</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(inode_maybe_inc_iversion);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * inode_query_iversion - read i_version for later use</div><div class='add'>+ * @inode: inode from which i_version should be read</div><div class='add'>+ *</div><div class='add'>+ * Read the inode i_version counter. This should be used by callers that wish</div><div class='add'>+ * to store the returned i_version for later comparison. This will guarantee</div><div class='add'>+ * that a later query of the i_version will result in a different value if</div><div class='add'>+ * anything has changed.</div><div class='add'>+ *</div><div class='add'>+ * In this implementation, we fetch the current value, set the QUERIED flag and</div><div class='add'>+ * then try to swap it into place with a cmpxchg, if it wasn't already set. If</div><div class='add'>+ * that fails, we try again with the newly fetched value from the cmpxchg.</div><div class='add'>+ */</div><div class='add'>+u64 inode_query_iversion(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	u64 cur, new;</div><div class='add'>+	bool fenced = false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Memory barriers (implicit in cmpxchg, explicit in smp_mb) pair with</div><div class='add'>+	 * inode_maybe_inc_iversion(), see that routine for more details.</div><div class='add'>+	 */</div><div class='add'>+	cur = inode_peek_iversion_raw(inode);</div><div class='add'>+	do {</div><div class='add'>+		/* If flag is already set, then no need to swap */</div><div class='add'>+		if (cur &amp; I_VERSION_QUERIED) {</div><div class='add'>+			if (!fenced)</div><div class='add'>+				smp_mb();</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		fenced = true;</div><div class='add'>+		new = cur | I_VERSION_QUERIED;</div><div class='add'>+	} while (!atomic64_try_cmpxchg(&amp;inode-&gt;i_version, &amp;cur, new));</div><div class='add'>+	return cur &gt;&gt; I_VERSION_QUERIED_SHIFT;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(inode_query_iversion);</div><div class='add'>+</div><div class='add'>+ssize_t direct_write_fallback(struct kiocb *iocb, struct iov_iter *iter,</div><div class='add'>+		ssize_t direct_written, ssize_t buffered_written)</div><div class='add'>+{</div><div class='add'>+	struct address_space *mapping = iocb-&gt;ki_filp-&gt;f_mapping;</div><div class='add'>+	loff_t pos = iocb-&gt;ki_pos - buffered_written;</div><div class='add'>+	loff_t end = iocb-&gt;ki_pos - 1;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If the buffered write fallback returned an error, we want to return</div><div class='add'>+	 * the number of bytes which were written by direct I/O, or the error</div><div class='add'>+	 * code if that was zero.</div><div class='add'>+	 *</div><div class='add'>+	 * Note that this differs from normal direct-io semantics, which will</div><div class='add'>+	 * return -EFOO even if some bytes were written.</div><div class='add'>+	 */</div><div class='add'>+	if (unlikely(buffered_written &lt; 0)) {</div><div class='add'>+		if (direct_written)</div><div class='add'>+			return direct_written;</div><div class='add'>+		return buffered_written;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We need to ensure that the page cache pages are written to disk and</div><div class='add'>+	 * invalidated to preserve the expected O_DIRECT semantics.</div><div class='add'>+	 */</div><div class='add'>+	err = filemap_write_and_wait_range(mapping, pos, end);</div><div class='add'>+	if (err &lt; 0) {</div><div class='add'>+		/*</div><div class='add'>+		 * We don't know how much we wrote, so just return the number of</div><div class='add'>+		 * bytes which were direct-written</div><div class='add'>+		 */</div><div class='add'>+		iocb-&gt;ki_pos -= buffered_written;</div><div class='add'>+		if (direct_written)</div><div class='add'>+			return direct_written;</div><div class='add'>+		return err;</div><div class='add'>+	}</div><div class='add'>+	invalidate_mapping_pages(mapping, pos &gt;&gt; PAGE_SHIFT, end &gt;&gt; PAGE_SHIFT);</div><div class='add'>+	return direct_written + buffered_written;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(direct_write_fallback);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * simple_inode_init_ts - initialize the timestamps for a new inode</div><div class='add'>+ * @inode: inode to be initialized</div><div class='add'>+ *</div><div class='add'>+ * When a new inode is created, most filesystems set the timestamps to the</div><div class='add'>+ * current time. Add a helper to do this.</div><div class='add'>+ */</div><div class='add'>+struct timespec64 simple_inode_init_ts(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct timespec64 ts = inode_set_ctime_current(inode);</div><div class='add'>+</div><div class='add'>+	inode_set_atime_to_ts(inode, ts);</div><div class='add'>+	inode_set_mtime_to_ts(inode, ts);</div><div class='add'>+	return ts;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(simple_inode_init_ts);</div><div class='add'>+</div><div class='add'>+struct dentry *stashed_dentry_get(struct dentry **stashed)</div><div class='add'>+{</div><div class='add'>+	struct dentry *dentry;</div><div class='add'>+</div><div class='add'>+	guard(rcu)();</div><div class='add'>+	dentry = rcu_dereference(*stashed);</div><div class='add'>+	if (!dentry)</div><div class='add'>+		return NULL;</div><div class='add'>+	if (IS_ERR(dentry))</div><div class='add'>+		return dentry;</div><div class='add'>+	if (!lockref_get_not_dead(&amp;dentry-&gt;d_lockref))</div><div class='add'>+		return NULL;</div><div class='add'>+	return dentry;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct dentry *prepare_anon_dentry(struct dentry **stashed,</div><div class='add'>+					  struct super_block *sb,</div><div class='add'>+					  void *data)</div><div class='add'>+{</div><div class='add'>+	struct dentry *dentry;</div><div class='add'>+	struct inode *inode;</div><div class='add'>+	const struct stashed_operations *sops = sb-&gt;s_fs_info;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	inode = new_inode_pseudo(sb);</div><div class='add'>+	if (!inode) {</div><div class='add'>+		sops-&gt;put_data(data);</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	inode-&gt;i_flags |= S_IMMUTABLE;</div><div class='add'>+	inode-&gt;i_mode = S_IFREG;</div><div class='add'>+	simple_inode_init_ts(inode);</div><div class='add'>+</div><div class='add'>+	ret = sops-&gt;init_inode(inode, data);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		iput(inode);</div><div class='add'>+		return ERR_PTR(ret);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Notice when this is changed. */</div><div class='add'>+	WARN_ON_ONCE(!S_ISREG(inode-&gt;i_mode));</div><div class='add'>+</div><div class='add'>+	dentry = d_alloc_anon(sb);</div><div class='add'>+	if (!dentry) {</div><div class='add'>+		iput(inode);</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Store address of location where dentry's supposed to be stashed. */</div><div class='add'>+	dentry-&gt;d_fsdata = stashed;</div><div class='add'>+</div><div class='add'>+	/* @data is now owned by the fs */</div><div class='add'>+	d_instantiate(dentry, inode);</div><div class='add'>+	return dentry;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct dentry *stash_dentry(struct dentry **stashed, struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	guard(rcu)();</div><div class='add'>+	for (;;) {</div><div class='add'>+		struct dentry *old;</div><div class='add'>+</div><div class='add'>+		/* Assume any old dentry was cleared out. */</div><div class='add'>+		old = cmpxchg(stashed, NULL, dentry);</div><div class='add'>+		if (likely(!old))</div><div class='add'>+			return dentry;</div><div class='add'>+</div><div class='add'>+		/* Check if somebody else installed a reusable dentry. */</div><div class='add'>+		if (lockref_get_not_dead(&amp;old-&gt;d_lockref))</div><div class='add'>+			return old;</div><div class='add'>+</div><div class='add'>+		/* There's an old dead dentry there, try to take it over. */</div><div class='add'>+		if (likely(try_cmpxchg(stashed, &amp;old, dentry)))</div><div class='add'>+			return dentry;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * path_from_stashed - create path from stashed or new dentry</div><div class='add'>+ * @stashed:    where to retrieve or stash dentry</div><div class='add'>+ * @mnt:        mnt of the filesystems to use</div><div class='add'>+ * @data:       data to store in inode-&gt;i_private</div><div class='add'>+ * @path:       path to create</div><div class='add'>+ *</div><div class='add'>+ * The function tries to retrieve a stashed dentry from @stashed. If the dentry</div><div class='add'>+ * is still valid then it will be reused. If the dentry isn't able the function</div><div class='add'>+ * will allocate a new dentry and inode. It will then check again whether it</div><div class='add'>+ * can reuse an existing dentry in case one has been added in the meantime or</div><div class='add'>+ * update @stashed with the newly added dentry.</div><div class='add'>+ *</div><div class='add'>+ * Special-purpose helper for nsfs and pidfs.</div><div class='add'>+ *</div><div class='add'>+ * Return: On success zero and on failure a negative error is returned.</div><div class='add'>+ */</div><div class='add'>+int path_from_stashed(struct dentry **stashed, struct vfsmount *mnt, void *data,</div><div class='add'>+		      struct path *path)</div><div class='add'>+{</div><div class='add'>+	struct dentry *dentry, *res;</div><div class='add'>+	const struct stashed_operations *sops = mnt-&gt;mnt_sb-&gt;s_fs_info;</div><div class='add'>+</div><div class='add'>+	/* See if dentry can be reused. */</div><div class='add'>+	res = stashed_dentry_get(stashed);</div><div class='add'>+	if (IS_ERR(res))</div><div class='add'>+		return PTR_ERR(res);</div><div class='add'>+	if (res) {</div><div class='add'>+		sops-&gt;put_data(data);</div><div class='add'>+		goto make_path;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Allocate a new dentry. */</div><div class='add'>+	dentry = prepare_anon_dentry(stashed, mnt-&gt;mnt_sb, data);</div><div class='add'>+	if (IS_ERR(dentry))</div><div class='add'>+		return PTR_ERR(dentry);</div><div class='add'>+</div><div class='add'>+	/* Added a new dentry. @data is now owned by the filesystem. */</div><div class='add'>+	if (sops-&gt;stash_dentry)</div><div class='add'>+		res = sops-&gt;stash_dentry(stashed, dentry);</div><div class='add'>+	else</div><div class='add'>+		res = stash_dentry(stashed, dentry);</div><div class='add'>+	if (IS_ERR(res)) {</div><div class='add'>+		dput(dentry);</div><div class='add'>+		return PTR_ERR(res);</div><div class='add'>+	}</div><div class='add'>+	if (res != dentry)</div><div class='add'>+		dput(dentry);</div><div class='add'>+</div><div class='add'>+make_path:</div><div class='add'>+	path-&gt;dentry = res;</div><div class='add'>+	path-&gt;mnt = mntget(mnt);</div><div class='add'>+	VFS_WARN_ON_ONCE(path-&gt;dentry-&gt;d_fsdata != stashed);</div><div class='add'>+	VFS_WARN_ON_ONCE(d_inode(path-&gt;dentry)-&gt;i_private != data);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void stashed_dentry_prune(struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	struct dentry **stashed = dentry-&gt;d_fsdata;</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='add'>+</div><div class='add'>+	if (WARN_ON_ONCE(!stashed))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (!inode)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Only replace our own @dentry as someone else might've</div><div class='add'>+	 * already cleared out @dentry and stashed their own</div><div class='add'>+	 * dentry in there.</div><div class='add'>+	 */</div><div class='add'>+	cmpxchg(stashed, dentry, NULL);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * simple_start_creating - prepare to create a given name</div><div class='add'>+ * @parent: directory in which to prepare to create the name</div><div class='add'>+ * @name:   the name to be created</div><div class='add'>+ *</div><div class='add'>+ * Required lock is taken and a lookup in performed prior to creating an</div><div class='add'>+ * object in a directory.  No permission checking is performed.</div><div class='add'>+ *</div><div class='add'>+ * Returns: a negative dentry on which vfs_create() or similar may</div><div class='add'>+ *  be attempted, or an error.</div><div class='add'>+ */</div><div class='add'>+struct dentry *simple_start_creating(struct dentry *parent, const char *name)</div><div class='add'>+{</div><div class='add'>+	struct qstr qname = QSTR(name);</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = lookup_noperm_common(&amp;qname, parent);</div><div class='add'>+	if (err)</div><div class='add'>+		return ERR_PTR(err);</div><div class='add'>+	return start_dirop(parent, &amp;qname, LOOKUP_CREATE | LOOKUP_EXCL);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(simple_start_creating);</div><div class='add'>+</div><div class='add'>+/* parent must have been held exclusive since simple_start_creating() */</div><div class='add'>+void simple_done_creating(struct dentry *child)</div><div class='add'>+{</div><div class='add'>+	inode_unlock(child-&gt;d_parent-&gt;d_inode);</div><div class='add'>+	dput(child);</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(generic_set_encrypted_ci_d_ops);</div><div class='add'>+EXPORT_SYMBOL(simple_done_creating);</div><div class='head'>diff --git a/fs/lockd/Makefile b/fs/lockd/Makefile<br/>index 6d5e83ed4476..51bbe22d21e3 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/lockd/Makefile?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/Makefile</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/lockd/Makefile?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/lockd/Makefile</a></div><div class='hunk'>@@ -3,10 +3,11 @@</div><div class='ctx'> # Makefile for the linux lock manager stuff</div><div class='ctx'> #</div><div class='ctx'> </div><div class='add'>+ccflags-y += -I$(src)			# needed for trace events</div><div class='add'>+</div><div class='ctx'> obj-$(CONFIG_LOCKD) += lockd.o</div><div class='ctx'> </div><div class='del'>-lockd-objs-y := clntlock.o clntproc.o clntxdr.o host.o svc.o svclock.o \</div><div class='del'>-	        svcshare.o svcproc.o svcsubs.o mon.o xdr.o</div><div class='del'>-lockd-objs-$(CONFIG_LOCKD_V4) += clnt4xdr.o xdr4.o svc4proc.o</div><div class='del'>-lockd-objs-$(CONFIG_PROC_FS) += procfs.o</div><div class='del'>-lockd-objs		      := $(lockd-objs-y)</div><div class='add'>+lockd-y := clntlock.o clntproc.o clntxdr.o host.o svc.o svclock.o \</div><div class='add'>+	   svcshare.o svcproc.o svcsubs.o mon.o trace.o xdr.o netlink.o</div><div class='add'>+lockd-$(CONFIG_LOCKD_V4) += clnt4xdr.o xdr4.o svc4proc.o</div><div class='add'>+lockd-$(CONFIG_PROC_FS) += procfs.o</div><div class='head'>diff --git a/fs/lockd/clnt4xdr.c b/fs/lockd/clnt4xdr.c<br/>index 7df6324ccb8a..527458db4525 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/lockd/clnt4xdr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/clnt4xdr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/lockd/clnt4xdr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/lockd/clnt4xdr.c</a></div><div class='hunk'>@@ -243,7 +243,7 @@ static void encode_nlm4_holder(struct xdr_stream *xdr,</div><div class='ctx'> 	u64 l_offset, l_len;</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> </div><div class='del'>-	encode_bool(xdr, lock-&gt;fl.fl_type == F_RDLCK);</div><div class='add'>+	encode_bool(xdr, lock-&gt;fl.c.flc_type == F_RDLCK);</div><div class='ctx'> 	encode_int32(xdr, lock-&gt;svid);</div><div class='ctx'> 	encode_netobj(xdr, lock-&gt;oh.data, lock-&gt;oh.len);</div><div class='ctx'> </div><div class='hunk'>@@ -261,7 +261,6 @@ static int decode_nlm4_holder(struct xdr_stream *xdr, struct nlm_res *result)</div><div class='ctx'> 	u32 exclusive;</div><div class='ctx'> 	int error;</div><div class='ctx'> 	__be32 *p;</div><div class='del'>-	s32 end;</div><div class='ctx'> </div><div class='ctx'> 	memset(lock, 0, sizeof(*lock));</div><div class='ctx'> 	locks_init_lock(fl);</div><div class='hunk'>@@ -271,7 +270,7 @@ static int decode_nlm4_holder(struct xdr_stream *xdr, struct nlm_res *result)</div><div class='ctx'> 		goto out_overflow;</div><div class='ctx'> 	exclusive = be32_to_cpup(p++);</div><div class='ctx'> 	lock-&gt;svid = be32_to_cpup(p);</div><div class='del'>-	fl-&gt;fl_pid = (pid_t)lock-&gt;svid;</div><div class='add'>+	fl-&gt;c.flc_pid = (pid_t)lock-&gt;svid;</div><div class='ctx'> </div><div class='ctx'> 	error = decode_netobj(xdr, &amp;lock-&gt;oh);</div><div class='ctx'> 	if (unlikely(error))</div><div class='hunk'>@@ -281,17 +280,11 @@ static int decode_nlm4_holder(struct xdr_stream *xdr, struct nlm_res *result)</div><div class='ctx'> 	if (unlikely(p == NULL))</div><div class='ctx'> 		goto out_overflow;</div><div class='ctx'> </div><div class='del'>-	fl-&gt;fl_flags = FL_POSIX;</div><div class='del'>-	fl-&gt;fl_type  = exclusive != 0 ? F_WRLCK : F_RDLCK;</div><div class='add'>+	fl-&gt;c.flc_flags = FL_POSIX;</div><div class='add'>+	fl-&gt;c.flc_type  = exclusive != 0 ? F_WRLCK : F_RDLCK;</div><div class='ctx'> 	p = xdr_decode_hyper(p, &amp;l_offset);</div><div class='ctx'> 	xdr_decode_hyper(p, &amp;l_len);</div><div class='del'>-	end = l_offset + l_len - 1;</div><div class='del'>-</div><div class='del'>-	fl-&gt;fl_start = (loff_t)l_offset;</div><div class='del'>-	if (l_len == 0 || end &lt; 0)</div><div class='del'>-		fl-&gt;fl_end = OFFSET_MAX;</div><div class='del'>-	else</div><div class='del'>-		fl-&gt;fl_end = (loff_t)end;</div><div class='add'>+	nlm4svc_set_file_lock_range(fl, l_offset, l_len);</div><div class='ctx'> 	error = 0;</div><div class='ctx'> out:</div><div class='ctx'> 	return error;</div><div class='hunk'>@@ -364,7 +357,7 @@ static void nlm4_xdr_enc_testargs(struct rpc_rqst *req,</div><div class='ctx'> 	const struct nlm_lock *lock = &amp;args-&gt;lock;</div><div class='ctx'> </div><div class='ctx'> 	encode_cookie(xdr, &amp;args-&gt;cookie);</div><div class='del'>-	encode_bool(xdr, lock-&gt;fl.fl_type == F_WRLCK);</div><div class='add'>+	encode_bool(xdr, lock-&gt;fl.c.flc_type == F_WRLCK);</div><div class='ctx'> 	encode_nlm4_lock(xdr, lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -387,7 +380,7 @@ static void nlm4_xdr_enc_lockargs(struct rpc_rqst *req,</div><div class='ctx'> </div><div class='ctx'> 	encode_cookie(xdr, &amp;args-&gt;cookie);</div><div class='ctx'> 	encode_bool(xdr, args-&gt;block);</div><div class='del'>-	encode_bool(xdr, lock-&gt;fl.fl_type == F_WRLCK);</div><div class='add'>+	encode_bool(xdr, lock-&gt;fl.c.flc_type == F_WRLCK);</div><div class='ctx'> 	encode_nlm4_lock(xdr, lock);</div><div class='ctx'> 	encode_bool(xdr, args-&gt;reclaim);</div><div class='ctx'> 	encode_int32(xdr, args-&gt;state);</div><div class='hunk'>@@ -410,7 +403,7 @@ static void nlm4_xdr_enc_cancargs(struct rpc_rqst *req,</div><div class='ctx'> </div><div class='ctx'> 	encode_cookie(xdr, &amp;args-&gt;cookie);</div><div class='ctx'> 	encode_bool(xdr, args-&gt;block);</div><div class='del'>-	encode_bool(xdr, lock-&gt;fl.fl_type == F_WRLCK);</div><div class='add'>+	encode_bool(xdr, lock-&gt;fl.c.flc_type == F_WRLCK);</div><div class='ctx'> 	encode_nlm4_lock(xdr, lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/lockd/clntlock.c b/fs/lockd/clntlock.c<br/>index a5bb3f721a9d..a7e0519ec024 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/lockd/clntlock.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/clntlock.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/lockd/clntlock.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/lockd/clntlock.c</a></div><div class='hunk'>@@ -14,9 +14,12 @@</div><div class='ctx'> #include &lt;linux/nfs_fs.h&gt;</div><div class='ctx'> #include &lt;linux/sunrpc/addr.h&gt;</div><div class='ctx'> #include &lt;linux/sunrpc/svc.h&gt;</div><div class='add'>+#include &lt;linux/sunrpc/svc_xprt.h&gt;</div><div class='ctx'> #include &lt;linux/lockd/lockd.h&gt;</div><div class='ctx'> #include &lt;linux/kthread.h&gt;</div><div class='ctx'> </div><div class='add'>+#include "trace.h"</div><div class='add'>+</div><div class='ctx'> #define NLMDBG_FACILITY		NLMDBG_CLIENT</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -29,18 +32,6 @@ static int			reclaimer(void *ptr);</div><div class='ctx'>  * client perspective.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * This is the representation of a blocked client lock.</div><div class='del'>- */</div><div class='del'>-struct nlm_wait {</div><div class='del'>-	struct list_head	b_list;		/* linked list */</div><div class='del'>-	wait_queue_head_t	b_wait;		/* where to wait on */</div><div class='del'>-	struct nlm_host *	b_host;</div><div class='del'>-	struct file_lock *	b_lock;		/* local file lock */</div><div class='del'>-	unsigned short		b_reclaim;	/* got to reclaim lock */</div><div class='del'>-	__be32			b_status;	/* grant callback status */</div><div class='del'>-};</div><div class='del'>-</div><div class='ctx'> static LIST_HEAD(nlm_blocked);</div><div class='ctx'> static DEFINE_SPINLOCK(nlm_blocked_lock);</div><div class='ctx'> </div><div class='hunk'>@@ -94,41 +85,48 @@ void nlmclnt_done(struct nlm_host *host)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nlmclnt_done);</div><div class='ctx'> </div><div class='add'>+void nlmclnt_prepare_block(struct nlm_wait *block, struct nlm_host *host, struct file_lock *fl)</div><div class='add'>+{</div><div class='add'>+	block-&gt;b_host = host;</div><div class='add'>+	block-&gt;b_lock = fl;</div><div class='add'>+	init_waitqueue_head(&amp;block-&gt;b_wait);</div><div class='add'>+	block-&gt;b_status = nlm_lck_blocked;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct rpc_clnt *nlmclnt_rpc_clnt(struct nlm_host *host)</div><div class='add'>+{</div><div class='add'>+	return host-&gt;h_rpcclnt;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(nlmclnt_rpc_clnt);</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Queue up a lock for blocking so that the GRANTED request can see it</div><div class='ctx'>  */</div><div class='del'>-struct nlm_wait *nlmclnt_prepare_block(struct nlm_host *host, struct file_lock *fl)</div><div class='add'>+void nlmclnt_queue_block(struct nlm_wait *block)</div><div class='ctx'> {</div><div class='del'>-	struct nlm_wait *block;</div><div class='del'>-</div><div class='del'>-	block = kmalloc(sizeof(*block), GFP_KERNEL);</div><div class='del'>-	if (block != NULL) {</div><div class='del'>-		block-&gt;b_host = host;</div><div class='del'>-		block-&gt;b_lock = fl;</div><div class='del'>-		init_waitqueue_head(&amp;block-&gt;b_wait);</div><div class='del'>-		block-&gt;b_status = nlm_lck_blocked;</div><div class='del'>-</div><div class='del'>-		spin_lock(&amp;nlm_blocked_lock);</div><div class='del'>-		list_add(&amp;block-&gt;b_list, &amp;nlm_blocked);</div><div class='del'>-		spin_unlock(&amp;nlm_blocked_lock);</div><div class='del'>-	}</div><div class='del'>-	return block;</div><div class='add'>+	spin_lock(&amp;nlm_blocked_lock);</div><div class='add'>+	list_add(&amp;block-&gt;b_list, &amp;nlm_blocked);</div><div class='add'>+	spin_unlock(&amp;nlm_blocked_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void nlmclnt_finish_block(struct nlm_wait *block)</div><div class='add'>+/*</div><div class='add'>+ * Dequeue the block and return its final status</div><div class='add'>+ */</div><div class='add'>+__be32 nlmclnt_dequeue_block(struct nlm_wait *block)</div><div class='ctx'> {</div><div class='del'>-	if (block == NULL)</div><div class='del'>-		return;</div><div class='add'>+	__be32 status;</div><div class='add'>+</div><div class='ctx'> 	spin_lock(&amp;nlm_blocked_lock);</div><div class='ctx'> 	list_del(&amp;block-&gt;b_list);</div><div class='add'>+	status = block-&gt;b_status;</div><div class='ctx'> 	spin_unlock(&amp;nlm_blocked_lock);</div><div class='del'>-	kfree(block);</div><div class='add'>+	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Block on a lock</div><div class='ctx'>  */</div><div class='del'>-int nlmclnt_block(struct nlm_wait *block, struct nlm_rqst *req, long timeout)</div><div class='add'>+int nlmclnt_wait(struct nlm_wait *block, struct nlm_rqst *req, long timeout)</div><div class='ctx'> {</div><div class='ctx'> 	long ret;</div><div class='ctx'> </div><div class='hunk'>@@ -154,7 +152,6 @@ int nlmclnt_block(struct nlm_wait *block, struct nlm_rqst *req, long timeout)</div><div class='ctx'> 	/* Reset the lock status after a server reboot so we resend */</div><div class='ctx'> 	if (block-&gt;b_status == nlm_lck_denied_grace_period)</div><div class='ctx'> 		block-&gt;b_status = nlm_lck_blocked;</div><div class='del'>-	req-&gt;a_res.status = block-&gt;b_status;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -188,7 +185,7 @@ __be32 nlmclnt_grant(const struct sockaddr *addr, const struct nlm_lock *lock)</div><div class='ctx'> 			continue;</div><div class='ctx'> 		if (!rpc_cmp_addr(nlm_addr(block-&gt;b_host), addr))</div><div class='ctx'> 			continue;</div><div class='del'>-		if (nfs_compare_fh(NFS_FH(locks_inode(fl_blocked-&gt;fl_file)), fh) != 0)</div><div class='add'>+		if (nfs_compare_fh(NFS_FH(file_inode(fl_blocked-&gt;c.flc_file)), fh) != 0)</div><div class='ctx'> 			continue;</div><div class='ctx'> 		/* Alright, we found a lock. Set the return status</div><div class='ctx'> 		 * and wake up the caller</div><div class='hunk'>@@ -198,6 +195,7 @@ __be32 nlmclnt_grant(const struct sockaddr *addr, const struct nlm_lock *lock)</div><div class='ctx'> 		res = nlm_granted;</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;nlm_blocked_lock);</div><div class='add'>+	trace_nlmclnt_grant(lock, addr, svc_addr_len(addr), res);</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/lockd/clntproc.c b/fs/lockd/clntproc.c<br/>index 99fffc9cb958..cebcc283b7ce 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/lockd/clntproc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/clntproc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/lockd/clntproc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/lockd/clntproc.c</a></div><div class='hunk'>@@ -12,6 +12,7 @@</div><div class='ctx'> #include &lt;linux/types.h&gt;</div><div class='ctx'> #include &lt;linux/errno.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/filelock.h&gt;</div><div class='ctx'> #include &lt;linux/nfs_fs.h&gt;</div><div class='ctx'> #include &lt;linux/utsname.h&gt;</div><div class='ctx'> #include &lt;linux/freezer.h&gt;</div><div class='hunk'>@@ -19,6 +20,8 @@</div><div class='ctx'> #include &lt;linux/sunrpc/svc.h&gt;</div><div class='ctx'> #include &lt;linux/lockd/lockd.h&gt;</div><div class='ctx'> </div><div class='add'>+#include "trace.h"</div><div class='add'>+</div><div class='ctx'> #define NLMDBG_FACILITY		NLMDBG_CLIENT</div><div class='ctx'> #define NLMCLNT_GRACE_WAIT	(5*HZ)</div><div class='ctx'> #define NLMCLNT_POLL_TIMEOUT	(30*HZ)</div><div class='hunk'>@@ -130,7 +133,8 @@ static void nlmclnt_setlockargs(struct nlm_rqst *req, struct file_lock *fl)</div><div class='ctx'> 	char *nodename = req-&gt;a_host-&gt;h_rpcclnt-&gt;cl_nodename;</div><div class='ctx'> </div><div class='ctx'> 	nlmclnt_next_cookie(&amp;argp-&gt;cookie);</div><div class='del'>-	memcpy(&amp;lock-&gt;fh, NFS_FH(locks_inode(fl-&gt;fl_file)), sizeof(struct nfs_fh));</div><div class='add'>+	memcpy(&amp;lock-&gt;fh, NFS_FH(file_inode(fl-&gt;c.flc_file)),</div><div class='add'>+	       sizeof(struct nfs_fh));</div><div class='ctx'> 	lock-&gt;caller  = nodename;</div><div class='ctx'> 	lock-&gt;oh.data = req-&gt;a_owner;</div><div class='ctx'> 	lock-&gt;oh.len  = snprintf(req-&gt;a_owner, sizeof(req-&gt;a_owner), "%u@%s",</div><div class='hunk'>@@ -139,7 +143,7 @@ static void nlmclnt_setlockargs(struct nlm_rqst *req, struct file_lock *fl)</div><div class='ctx'> 	lock-&gt;svid = fl-&gt;fl_u.nfs_fl.owner-&gt;pid;</div><div class='ctx'> 	lock-&gt;fl.fl_start = fl-&gt;fl_start;</div><div class='ctx'> 	lock-&gt;fl.fl_end = fl-&gt;fl_end;</div><div class='del'>-	lock-&gt;fl.fl_type = fl-&gt;fl_type;</div><div class='add'>+	lock-&gt;fl.c.flc_type = fl-&gt;c.flc_type;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void nlmclnt_release_lockargs(struct nlm_rqst *req)</div><div class='hunk'>@@ -179,7 +183,7 @@ int nlmclnt_proc(struct nlm_host *host, int cmd, struct file_lock *fl, void *dat</div><div class='ctx'> 	call-&gt;a_callback_data = data;</div><div class='ctx'> </div><div class='ctx'> 	if (IS_SETLK(cmd) || IS_SETLKW(cmd)) {</div><div class='del'>-		if (fl-&gt;fl_type != F_UNLCK) {</div><div class='add'>+		if (fl-&gt;c.flc_type != F_UNLCK) {</div><div class='ctx'> 			call-&gt;a_args.block = IS_SETLKW(cmd) ? 1 : 0;</div><div class='ctx'> 			status = nlmclnt_lock(call, fl);</div><div class='ctx'> 		} else</div><div class='hunk'>@@ -429,13 +433,14 @@ nlmclnt_test(struct nlm_rqst *req, struct file_lock *fl)</div><div class='ctx'> {</div><div class='ctx'> 	int	status;</div><div class='ctx'> </div><div class='del'>-	status = nlmclnt_call(nfs_file_cred(fl-&gt;fl_file), req, NLMPROC_TEST);</div><div class='add'>+	status = nlmclnt_call(nfs_file_cred(fl-&gt;c.flc_file), req,</div><div class='add'>+			      NLMPROC_TEST);</div><div class='ctx'> 	if (status &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	switch (req-&gt;a_res.status) {</div><div class='ctx'> 		case nlm_granted:</div><div class='del'>-			fl-&gt;fl_type = F_UNLCK;</div><div class='add'>+			fl-&gt;c.flc_type = F_UNLCK;</div><div class='ctx'> 			break;</div><div class='ctx'> 		case nlm_lck_denied:</div><div class='ctx'> 			/*</div><div class='hunk'>@@ -443,13 +448,16 @@ nlmclnt_test(struct nlm_rqst *req, struct file_lock *fl)</div><div class='ctx'> 			 */</div><div class='ctx'> 			fl-&gt;fl_start = req-&gt;a_res.lock.fl.fl_start;</div><div class='ctx'> 			fl-&gt;fl_end = req-&gt;a_res.lock.fl.fl_end;</div><div class='del'>-			fl-&gt;fl_type = req-&gt;a_res.lock.fl.fl_type;</div><div class='del'>-			fl-&gt;fl_pid = -req-&gt;a_res.lock.fl.fl_pid;</div><div class='add'>+			fl-&gt;c.flc_type = req-&gt;a_res.lock.fl.c.flc_type;</div><div class='add'>+			fl-&gt;c.flc_pid = -req-&gt;a_res.lock.fl.c.flc_pid;</div><div class='ctx'> 			break;</div><div class='ctx'> 		default:</div><div class='ctx'> 			status = nlm_stat_to_errno(req-&gt;a_res.status);</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='add'>+	trace_nlmclnt_test(&amp;req-&gt;a_args.lock,</div><div class='add'>+			   (const struct sockaddr *)&amp;req-&gt;a_host-&gt;h_addr,</div><div class='add'>+			   req-&gt;a_host-&gt;h_addrlen, req-&gt;a_res.status);</div><div class='ctx'> 	nlmclnt_release_call(req);</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='hunk'>@@ -479,14 +487,15 @@ static const struct file_lock_operations nlmclnt_lock_ops = {</div><div class='ctx'> static void nlmclnt_locks_init_private(struct file_lock *fl, struct nlm_host *host)</div><div class='ctx'> {</div><div class='ctx'> 	fl-&gt;fl_u.nfs_fl.state = 0;</div><div class='del'>-	fl-&gt;fl_u.nfs_fl.owner = nlmclnt_find_lockowner(host, fl-&gt;fl_owner);</div><div class='add'>+	fl-&gt;fl_u.nfs_fl.owner = nlmclnt_find_lockowner(host,</div><div class='add'>+						       fl-&gt;c.flc_owner);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;fl-&gt;fl_u.nfs_fl.list);</div><div class='ctx'> 	fl-&gt;fl_ops = &amp;nlmclnt_lock_ops;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int do_vfs_lock(struct file_lock *fl)</div><div class='ctx'> {</div><div class='del'>-	return locks_lock_file_wait(fl-&gt;fl_file, fl);</div><div class='add'>+	return locks_lock_file_wait(fl-&gt;c.flc_file, fl);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -512,49 +521,60 @@ static int do_vfs_lock(struct file_lock *fl)</div><div class='ctx'> static int</div><div class='ctx'> nlmclnt_lock(struct nlm_rqst *req, struct file_lock *fl)</div><div class='ctx'> {</div><div class='del'>-	const struct cred *cred = nfs_file_cred(fl-&gt;fl_file);</div><div class='add'>+	const struct cred *cred = nfs_file_cred(fl-&gt;c.flc_file);</div><div class='ctx'> 	struct nlm_host	*host = req-&gt;a_host;</div><div class='ctx'> 	struct nlm_res	*resp = &amp;req-&gt;a_res;</div><div class='del'>-	struct nlm_wait *block = NULL;</div><div class='del'>-	unsigned char fl_flags = fl-&gt;fl_flags;</div><div class='del'>-	unsigned char fl_type;</div><div class='add'>+	struct nlm_wait block;</div><div class='add'>+	unsigned char flags = fl-&gt;c.flc_flags;</div><div class='add'>+	unsigned char type;</div><div class='add'>+	__be32 b_status;</div><div class='ctx'> 	int status = -ENOLCK;</div><div class='ctx'> </div><div class='ctx'> 	if (nsm_monitor(host) &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	req-&gt;a_args.state = nsm_local_state;</div><div class='ctx'> </div><div class='del'>-	fl-&gt;fl_flags |= FL_ACCESS;</div><div class='add'>+	fl-&gt;c.flc_flags |= FL_ACCESS;</div><div class='ctx'> 	status = do_vfs_lock(fl);</div><div class='del'>-	fl-&gt;fl_flags = fl_flags;</div><div class='add'>+	fl-&gt;c.flc_flags = flags;</div><div class='ctx'> 	if (status &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	block = nlmclnt_prepare_block(host, fl);</div><div class='add'>+	nlmclnt_prepare_block(&amp;block, host, fl);</div><div class='ctx'> again:</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Initialise resp-&gt;status to a valid non-zero value,</div><div class='ctx'> 	 * since 0 == nlm_lck_granted</div><div class='ctx'> 	 */</div><div class='ctx'> 	resp-&gt;status = nlm_lck_blocked;</div><div class='del'>-	for(;;) {</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * A GRANTED callback can come at any time -- even before the reply</div><div class='add'>+	 * to the LOCK request arrives, so we queue the wait before</div><div class='add'>+	 * requesting the lock.</div><div class='add'>+	 */</div><div class='add'>+	nlmclnt_queue_block(&amp;block);</div><div class='add'>+	for (;;) {</div><div class='ctx'> 		/* Reboot protection */</div><div class='ctx'> 		fl-&gt;fl_u.nfs_fl.state = host-&gt;h_state;</div><div class='ctx'> 		status = nlmclnt_call(cred, req, NLMPROC_LOCK);</div><div class='ctx'> 		if (status &lt; 0)</div><div class='ctx'> 			break;</div><div class='ctx'> 		/* Did a reclaimer thread notify us of a server reboot? */</div><div class='del'>-		if (resp-&gt;status ==  nlm_lck_denied_grace_period)</div><div class='add'>+		if (resp-&gt;status == nlm_lck_denied_grace_period)</div><div class='ctx'> 			continue;</div><div class='ctx'> 		if (resp-&gt;status != nlm_lck_blocked)</div><div class='ctx'> 			break;</div><div class='ctx'> 		/* Wait on an NLM blocking lock */</div><div class='del'>-		status = nlmclnt_block(block, req, NLMCLNT_POLL_TIMEOUT);</div><div class='add'>+		status = nlmclnt_wait(&amp;block, req, NLMCLNT_POLL_TIMEOUT);</div><div class='ctx'> 		if (status &lt; 0)</div><div class='ctx'> 			break;</div><div class='del'>-		if (resp-&gt;status != nlm_lck_blocked)</div><div class='add'>+		if (block.b_status != nlm_lck_blocked)</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='add'>+	b_status = nlmclnt_dequeue_block(&amp;block);</div><div class='add'>+	if (resp-&gt;status == nlm_lck_blocked)</div><div class='add'>+		resp-&gt;status = b_status;</div><div class='ctx'> </div><div class='ctx'> 	/* if we were interrupted while blocking, then cancel the lock request</div><div class='ctx'> 	 * and exit</div><div class='hunk'>@@ -563,7 +583,7 @@ again:</div><div class='ctx'> 		if (!req-&gt;a_args.block)</div><div class='ctx'> 			goto out_unlock;</div><div class='ctx'> 		if (nlmclnt_cancel(host, req-&gt;a_args.block, fl) == 0)</div><div class='del'>-			goto out_unblock;</div><div class='add'>+			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (resp-&gt;status == nlm_granted) {</div><div class='hunk'>@@ -574,11 +594,11 @@ again:</div><div class='ctx'> 			goto again;</div><div class='ctx'> 		}</div><div class='ctx'> 		/* Ensure the resulting lock will get added to granted list */</div><div class='del'>-		fl-&gt;fl_flags |= FL_SLEEP;</div><div class='add'>+		fl-&gt;c.flc_flags |= FL_SLEEP;</div><div class='ctx'> 		if (do_vfs_lock(fl) &lt; 0)</div><div class='ctx'> 			printk(KERN_WARNING "%s: VFS is out of sync with lock manager!\n", __func__);</div><div class='ctx'> 		up_read(&amp;host-&gt;h_rwsem);</div><div class='del'>-		fl-&gt;fl_flags = fl_flags;</div><div class='add'>+		fl-&gt;c.flc_flags = flags;</div><div class='ctx'> 		status = 0;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (status &lt; 0)</div><div class='hunk'>@@ -588,27 +608,30 @@ again:</div><div class='ctx'> 	 * cases NLM_LCK_DENIED is returned for a permanent error.  So</div><div class='ctx'> 	 * turn it into an ENOLCK.</div><div class='ctx'> 	 */</div><div class='del'>-	if (resp-&gt;status == nlm_lck_denied &amp;&amp; (fl_flags &amp; FL_SLEEP))</div><div class='add'>+	if (resp-&gt;status == nlm_lck_denied &amp;&amp; (flags &amp; FL_SLEEP))</div><div class='ctx'> 		status = -ENOLCK;</div><div class='ctx'> 	else</div><div class='ctx'> 		status = nlm_stat_to_errno(resp-&gt;status);</div><div class='del'>-out_unblock:</div><div class='del'>-	nlmclnt_finish_block(block);</div><div class='ctx'> out:</div><div class='add'>+	trace_nlmclnt_lock(&amp;req-&gt;a_args.lock,</div><div class='add'>+			   (const struct sockaddr *)&amp;req-&gt;a_host-&gt;h_addr,</div><div class='add'>+			   req-&gt;a_host-&gt;h_addrlen, req-&gt;a_res.status);</div><div class='ctx'> 	nlmclnt_release_call(req);</div><div class='ctx'> 	return status;</div><div class='ctx'> out_unlock:</div><div class='ctx'> 	/* Fatal error: ensure that we remove the lock altogether */</div><div class='add'>+	trace_nlmclnt_lock(&amp;req-&gt;a_args.lock,</div><div class='add'>+			   (const struct sockaddr *)&amp;req-&gt;a_host-&gt;h_addr,</div><div class='add'>+			   req-&gt;a_host-&gt;h_addrlen, req-&gt;a_res.status);</div><div class='ctx'> 	dprintk("lockd: lock attempt ended in fatal error.\n"</div><div class='ctx'> 		"       Attempting to unlock.\n");</div><div class='del'>-	nlmclnt_finish_block(block);</div><div class='del'>-	fl_type = fl-&gt;fl_type;</div><div class='del'>-	fl-&gt;fl_type = F_UNLCK;</div><div class='add'>+	type = fl-&gt;c.flc_type;</div><div class='add'>+	fl-&gt;c.flc_type = F_UNLCK;</div><div class='ctx'> 	down_read(&amp;host-&gt;h_rwsem);</div><div class='ctx'> 	do_vfs_lock(fl);</div><div class='ctx'> 	up_read(&amp;host-&gt;h_rwsem);</div><div class='del'>-	fl-&gt;fl_type = fl_type;</div><div class='del'>-	fl-&gt;fl_flags = fl_flags;</div><div class='add'>+	fl-&gt;c.flc_type = type;</div><div class='add'>+	fl-&gt;c.flc_flags = flags;</div><div class='ctx'> 	nlmclnt_async_call(cred, req, NLMPROC_UNLOCK, &amp;nlmclnt_unlock_ops);</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='hunk'>@@ -631,12 +654,14 @@ nlmclnt_reclaim(struct nlm_host *host, struct file_lock *fl,</div><div class='ctx'> 	nlmclnt_setlockargs(req, fl);</div><div class='ctx'> 	req-&gt;a_args.reclaim = 1;</div><div class='ctx'> </div><div class='del'>-	status = nlmclnt_call(nfs_file_cred(fl-&gt;fl_file), req, NLMPROC_LOCK);</div><div class='add'>+	status = nlmclnt_call(nfs_file_cred(fl-&gt;c.flc_file), req,</div><div class='add'>+			      NLMPROC_LOCK);</div><div class='ctx'> 	if (status &gt;= 0 &amp;&amp; req-&gt;a_res.status == nlm_granted)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	printk(KERN_WARNING "lockd: failed to reclaim lock for pid %d "</div><div class='del'>-				"(errno %d, status %d)\n", fl-&gt;fl_pid,</div><div class='add'>+				"(errno %d, status %d)\n",</div><div class='add'>+				fl-&gt;c.flc_pid,</div><div class='ctx'> 				status, ntohl(req-&gt;a_res.status));</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -663,26 +688,26 @@ nlmclnt_unlock(struct nlm_rqst *req, struct file_lock *fl)</div><div class='ctx'> 	struct nlm_host	*host = req-&gt;a_host;</div><div class='ctx'> 	struct nlm_res	*resp = &amp;req-&gt;a_res;</div><div class='ctx'> 	int status;</div><div class='del'>-	unsigned char fl_flags = fl-&gt;fl_flags;</div><div class='add'>+	unsigned char flags = fl-&gt;c.flc_flags;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Note: the server is supposed to either grant us the unlock</div><div class='ctx'> 	 * request, or to deny it with NLM_LCK_DENIED_GRACE_PERIOD. In either</div><div class='ctx'> 	 * case, we want to unlock.</div><div class='ctx'> 	 */</div><div class='del'>-	fl-&gt;fl_flags |= FL_EXISTS;</div><div class='add'>+	fl-&gt;c.flc_flags |= FL_EXISTS;</div><div class='ctx'> 	down_read(&amp;host-&gt;h_rwsem);</div><div class='ctx'> 	status = do_vfs_lock(fl);</div><div class='ctx'> 	up_read(&amp;host-&gt;h_rwsem);</div><div class='del'>-	fl-&gt;fl_flags = fl_flags;</div><div class='add'>+	fl-&gt;c.flc_flags = flags;</div><div class='ctx'> 	if (status == -ENOENT) {</div><div class='ctx'> 		status = 0;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	refcount_inc(&amp;req-&gt;a_count);</div><div class='del'>-	status = nlmclnt_async_call(nfs_file_cred(fl-&gt;fl_file), req,</div><div class='del'>-			NLMPROC_UNLOCK, &amp;nlmclnt_unlock_ops);</div><div class='add'>+	status = nlmclnt_async_call(nfs_file_cred(fl-&gt;c.flc_file), req,</div><div class='add'>+				    NLMPROC_UNLOCK, &amp;nlmclnt_unlock_ops);</div><div class='ctx'> 	if (status &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -695,6 +720,9 @@ nlmclnt_unlock(struct nlm_rqst *req, struct file_lock *fl)</div><div class='ctx'> 	/* What to do now? I'm out of my depth... */</div><div class='ctx'> 	status = -ENOLCK;</div><div class='ctx'> out:</div><div class='add'>+	trace_nlmclnt_unlock(&amp;req-&gt;a_args.lock,</div><div class='add'>+			     (const struct sockaddr *)&amp;req-&gt;a_host-&gt;h_addr,</div><div class='add'>+			     req-&gt;a_host-&gt;h_addrlen, req-&gt;a_res.status);</div><div class='ctx'> 	nlmclnt_release_call(req);</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='hunk'>@@ -772,8 +800,8 @@ static int nlmclnt_cancel(struct nlm_host *host, int block, struct file_lock *fl</div><div class='ctx'> 	req-&gt;a_args.block = block;</div><div class='ctx'> </div><div class='ctx'> 	refcount_inc(&amp;req-&gt;a_count);</div><div class='del'>-	status = nlmclnt_async_call(nfs_file_cred(fl-&gt;fl_file), req,</div><div class='del'>-			NLMPROC_CANCEL, &amp;nlmclnt_cancel_ops);</div><div class='add'>+	status = nlmclnt_async_call(nfs_file_cred(fl-&gt;c.flc_file), req,</div><div class='add'>+				    NLMPROC_CANCEL, &amp;nlmclnt_cancel_ops);</div><div class='ctx'> 	if (status == 0 &amp;&amp; req-&gt;a_res.status == nlm_lck_denied)</div><div class='ctx'> 		status = -ENOLCK;</div><div class='ctx'> 	nlmclnt_release_call(req);</div><div class='head'>diff --git a/fs/lockd/clntxdr.c b/fs/lockd/clntxdr.c<br/>index 4df62f635529..6ea3448d2d31 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/lockd/clntxdr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/clntxdr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/lockd/clntxdr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/lockd/clntxdr.c</a></div><div class='hunk'>@@ -2,8 +2,9 @@</div><div class='ctx'> /*</div><div class='ctx'>  * linux/fs/lockd/clntxdr.c</div><div class='ctx'>  *</div><div class='del'>- * XDR functions to encode/decode NLM version 3 RPC arguments and results.</div><div class='del'>- * NLM version 3 is backwards compatible with NLM versions 1 and 2.</div><div class='add'>+ * XDR functions to encode/decode NLM version 1 and 3 RPC</div><div class='add'>+ * arguments and results. NLM version 2 is not specified</div><div class='add'>+ * by a standard, thus it is not implemented.</div><div class='ctx'>  *</div><div class='ctx'>  * NLM client-side only.</div><div class='ctx'>  *</div><div class='hunk'>@@ -238,7 +239,7 @@ static void encode_nlm_holder(struct xdr_stream *xdr,</div><div class='ctx'> 	u32 l_offset, l_len;</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> </div><div class='del'>-	encode_bool(xdr, lock-&gt;fl.fl_type == F_RDLCK);</div><div class='add'>+	encode_bool(xdr, lock-&gt;fl.c.flc_type == F_RDLCK);</div><div class='ctx'> 	encode_int32(xdr, lock-&gt;svid);</div><div class='ctx'> 	encode_netobj(xdr, lock-&gt;oh.data, lock-&gt;oh.len);</div><div class='ctx'> </div><div class='hunk'>@@ -265,7 +266,7 @@ static int decode_nlm_holder(struct xdr_stream *xdr, struct nlm_res *result)</div><div class='ctx'> 		goto out_overflow;</div><div class='ctx'> 	exclusive = be32_to_cpup(p++);</div><div class='ctx'> 	lock-&gt;svid = be32_to_cpup(p);</div><div class='del'>-	fl-&gt;fl_pid = (pid_t)lock-&gt;svid;</div><div class='add'>+	fl-&gt;c.flc_pid = (pid_t)lock-&gt;svid;</div><div class='ctx'> </div><div class='ctx'> 	error = decode_netobj(xdr, &amp;lock-&gt;oh);</div><div class='ctx'> 	if (unlikely(error))</div><div class='hunk'>@@ -275,8 +276,8 @@ static int decode_nlm_holder(struct xdr_stream *xdr, struct nlm_res *result)</div><div class='ctx'> 	if (unlikely(p == NULL))</div><div class='ctx'> 		goto out_overflow;</div><div class='ctx'> </div><div class='del'>-	fl-&gt;fl_flags = FL_POSIX;</div><div class='del'>-	fl-&gt;fl_type  = exclusive != 0 ? F_WRLCK : F_RDLCK;</div><div class='add'>+	fl-&gt;c.flc_flags = FL_POSIX;</div><div class='add'>+	fl-&gt;c.flc_type  = exclusive != 0 ? F_WRLCK : F_RDLCK;</div><div class='ctx'> 	l_offset = be32_to_cpup(p++);</div><div class='ctx'> 	l_len = be32_to_cpup(p);</div><div class='ctx'> 	end = l_offset + l_len - 1;</div><div class='hunk'>@@ -357,7 +358,7 @@ static void nlm_xdr_enc_testargs(struct rpc_rqst *req,</div><div class='ctx'> 	const struct nlm_lock *lock = &amp;args-&gt;lock;</div><div class='ctx'> </div><div class='ctx'> 	encode_cookie(xdr, &amp;args-&gt;cookie);</div><div class='del'>-	encode_bool(xdr, lock-&gt;fl.fl_type == F_WRLCK);</div><div class='add'>+	encode_bool(xdr, lock-&gt;fl.c.flc_type == F_WRLCK);</div><div class='ctx'> 	encode_nlm_lock(xdr, lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -380,7 +381,7 @@ static void nlm_xdr_enc_lockargs(struct rpc_rqst *req,</div><div class='ctx'> </div><div class='ctx'> 	encode_cookie(xdr, &amp;args-&gt;cookie);</div><div class='ctx'> 	encode_bool(xdr, args-&gt;block);</div><div class='del'>-	encode_bool(xdr, lock-&gt;fl.fl_type == F_WRLCK);</div><div class='add'>+	encode_bool(xdr, lock-&gt;fl.c.flc_type == F_WRLCK);</div><div class='ctx'> 	encode_nlm_lock(xdr, lock);</div><div class='ctx'> 	encode_bool(xdr, args-&gt;reclaim);</div><div class='ctx'> 	encode_int32(xdr, args-&gt;state);</div><div class='hunk'>@@ -403,7 +404,7 @@ static void nlm_xdr_enc_cancargs(struct rpc_rqst *req,</div><div class='ctx'> </div><div class='ctx'> 	encode_cookie(xdr, &amp;args-&gt;cookie);</div><div class='ctx'> 	encode_bool(xdr, args-&gt;block);</div><div class='del'>-	encode_bool(xdr, lock-&gt;fl.fl_type == F_WRLCK);</div><div class='add'>+	encode_bool(xdr, lock-&gt;fl.c.flc_type == F_WRLCK);</div><div class='ctx'> 	encode_nlm_lock(xdr, lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/lockd/host.c b/fs/lockd/host.c<br/>index f802223e71ab..5e6877c37f73 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/lockd/host.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/host.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/lockd/host.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/lockd/host.c</a></div><div class='hunk'>@@ -117,7 +117,6 @@ static struct nlm_host *nlm_alloc_host(struct nlm_lookup_host_info *ni,</div><div class='ctx'> 	if (nsm != NULL)</div><div class='ctx'> 		refcount_inc(&amp;nsm-&gt;sm_count);</div><div class='ctx'> 	else {</div><div class='del'>-		host = NULL;</div><div class='ctx'> 		nsm = nsm_get_handle(ni-&gt;net, ni-&gt;sap, ni-&gt;salen,</div><div class='ctx'> 					ni-&gt;hostname, ni-&gt;hostname_len);</div><div class='ctx'> 		if (unlikely(nsm == NULL)) {</div><div class='hunk'>@@ -164,7 +163,7 @@ static struct nlm_host *nlm_alloc_host(struct nlm_lookup_host_info *ni,</div><div class='ctx'> 	host-&gt;h_addrbuf    = nsm-&gt;sm_addrbuf;</div><div class='ctx'> 	host-&gt;net	   = ni-&gt;net;</div><div class='ctx'> 	host-&gt;h_cred	   = get_cred(ni-&gt;cred);</div><div class='del'>-	strlcpy(host-&gt;nodename, utsname()-&gt;nodename, sizeof(host-&gt;nodename));</div><div class='add'>+	strscpy(host-&gt;nodename, utsname()-&gt;nodename, sizeof(host-&gt;nodename));</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	return host;</div><div class='hunk'>@@ -441,7 +440,7 @@ nlm_bind_host(struct nlm_host *host)</div><div class='ctx'> 	if ((clnt = host-&gt;h_rpcclnt) != NULL) {</div><div class='ctx'> 		nlm_rebind_host(host);</div><div class='ctx'> 	} else {</div><div class='del'>-		unsigned long increment = nlmsvc_timeout;</div><div class='add'>+		unsigned long increment = nlm_timeout * HZ;</div><div class='ctx'> 		struct rpc_timeout timeparms = {</div><div class='ctx'> 			.to_initval	= increment,</div><div class='ctx'> 			.to_increment	= increment,</div><div class='hunk'>@@ -629,6 +628,7 @@ nlm_shutdown_hosts_net(struct net *net)</div><div class='ctx'> 			rpc_shutdown_client(host-&gt;h_rpcclnt);</div><div class='ctx'> 			host-&gt;h_rpcclnt = NULL;</div><div class='ctx'> 		}</div><div class='add'>+		nlmsvc_free_host_resources(host);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Then, perform a garbage collection pass */</div><div class='head'>diff --git a/fs/lockd/mon.c b/fs/lockd/mon.c<br/>index 1d9488cf0534..b8fc732e1c67 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/lockd/mon.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/mon.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/lockd/mon.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/lockd/mon.c</a></div><div class='hunk'>@@ -18,7 +18,7 @@</div><div class='ctx'> #include &lt;linux/sunrpc/svc.h&gt;</div><div class='ctx'> #include &lt;linux/lockd/lockd.h&gt;</div><div class='ctx'> </div><div class='del'>-#include &lt;asm/unaligned.h&gt;</div><div class='add'>+#include &lt;linux/unaligned.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "netns.h"</div><div class='ctx'> </div><div class='hunk'>@@ -276,6 +276,9 @@ static struct nsm_handle *nsm_create_handle(const struct sockaddr *sap,</div><div class='ctx'> {</div><div class='ctx'> 	struct nsm_handle *new;</div><div class='ctx'> </div><div class='add'>+	if (!hostname)</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='ctx'> 	new = kzalloc(sizeof(*new) + hostname_len + 1, GFP_KERNEL);</div><div class='ctx'> 	if (unlikely(new == NULL))</div><div class='ctx'> 		return NULL;</div><div class='head'>diff --git a/fs/lockd/netlink.c b/fs/lockd/netlink.c<br/>new file mode 100644<br/>index 000000000000..880c42b4f8c3<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/lockd/netlink.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/lockd/netlink.c</a></div><div class='hunk'>@@ -0,0 +1,45 @@</div><div class='add'>+// SPDX-License-Identifier: ((GPL-2.0 WITH Linux-syscall-note) OR BSD-3-Clause)</div><div class='add'>+/* Do not edit directly, auto-generated from: */</div><div class='add'>+/*	Documentation/netlink/specs/lockd.yaml */</div><div class='add'>+/* YNL-GEN kernel source */</div><div class='add'>+/* To regenerate run: tools/net/ynl/ynl-regen.sh */</div><div class='add'>+</div><div class='add'>+#include &lt;net/netlink.h&gt;</div><div class='add'>+#include &lt;net/genetlink.h&gt;</div><div class='add'>+</div><div class='add'>+#include "netlink.h"</div><div class='add'>+</div><div class='add'>+#include &lt;uapi/linux/lockd_netlink.h&gt;</div><div class='add'>+</div><div class='add'>+/* LOCKD_CMD_SERVER_SET - do */</div><div class='add'>+static const struct nla_policy lockd_server_set_nl_policy[LOCKD_A_SERVER_UDP_PORT + 1] = {</div><div class='add'>+	[LOCKD_A_SERVER_GRACETIME] = { .type = NLA_U32, },</div><div class='add'>+	[LOCKD_A_SERVER_TCP_PORT] = { .type = NLA_U16, },</div><div class='add'>+	[LOCKD_A_SERVER_UDP_PORT] = { .type = NLA_U16, },</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/* Ops table for lockd */</div><div class='add'>+static const struct genl_split_ops lockd_nl_ops[] = {</div><div class='add'>+	{</div><div class='add'>+		.cmd		= LOCKD_CMD_SERVER_SET,</div><div class='add'>+		.doit		= lockd_nl_server_set_doit,</div><div class='add'>+		.policy		= lockd_server_set_nl_policy,</div><div class='add'>+		.maxattr	= LOCKD_A_SERVER_UDP_PORT,</div><div class='add'>+		.flags		= GENL_ADMIN_PERM | GENL_CMD_CAP_DO,</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+		.cmd	= LOCKD_CMD_SERVER_GET,</div><div class='add'>+		.doit	= lockd_nl_server_get_doit,</div><div class='add'>+		.flags	= GENL_CMD_CAP_DO,</div><div class='add'>+	},</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct genl_family lockd_nl_family __ro_after_init = {</div><div class='add'>+	.name		= LOCKD_FAMILY_NAME,</div><div class='add'>+	.version	= LOCKD_FAMILY_VERSION,</div><div class='add'>+	.netnsok	= true,</div><div class='add'>+	.parallel_ops	= true,</div><div class='add'>+	.module		= THIS_MODULE,</div><div class='add'>+	.split_ops	= lockd_nl_ops,</div><div class='add'>+	.n_split_ops	= ARRAY_SIZE(lockd_nl_ops),</div><div class='add'>+};</div><div class='head'>diff --git a/fs/lockd/netlink.h b/fs/lockd/netlink.h<br/>new file mode 100644<br/>index 000000000000..d8408f077dd8<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/lockd/netlink.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/lockd/netlink.h</a></div><div class='hunk'>@@ -0,0 +1,20 @@</div><div class='add'>+/* SPDX-License-Identifier: ((GPL-2.0 WITH Linux-syscall-note) OR BSD-3-Clause) */</div><div class='add'>+/* Do not edit directly, auto-generated from: */</div><div class='add'>+/*	Documentation/netlink/specs/lockd.yaml */</div><div class='add'>+/* YNL-GEN kernel header */</div><div class='add'>+/* To regenerate run: tools/net/ynl/ynl-regen.sh */</div><div class='add'>+</div><div class='add'>+#ifndef _LINUX_LOCKD_GEN_H</div><div class='add'>+#define _LINUX_LOCKD_GEN_H</div><div class='add'>+</div><div class='add'>+#include &lt;net/netlink.h&gt;</div><div class='add'>+#include &lt;net/genetlink.h&gt;</div><div class='add'>+</div><div class='add'>+#include &lt;uapi/linux/lockd_netlink.h&gt;</div><div class='add'>+</div><div class='add'>+int lockd_nl_server_set_doit(struct sk_buff *skb, struct genl_info *info);</div><div class='add'>+int lockd_nl_server_get_doit(struct sk_buff *skb, struct genl_info *info);</div><div class='add'>+</div><div class='add'>+extern struct genl_family lockd_nl_family;</div><div class='add'>+</div><div class='add'>+#endif /* _LINUX_LOCKD_GEN_H */</div><div class='head'>diff --git a/fs/lockd/netns.h b/fs/lockd/netns.h<br/>index 5bec78c8e431..88e8e2a97397 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/lockd/netns.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/netns.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/lockd/netns.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/lockd/netns.h</a></div><div class='hunk'>@@ -3,12 +3,16 @@</div><div class='ctx'> #define __LOCKD_NETNS_H__</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/filelock.h&gt;</div><div class='ctx'> #include &lt;net/netns/generic.h&gt;</div><div class='ctx'> </div><div class='ctx'> struct lockd_net {</div><div class='ctx'> 	unsigned int nlmsvc_users;</div><div class='ctx'> 	unsigned long next_gc;</div><div class='ctx'> 	unsigned long nrhosts;</div><div class='add'>+	u32 gracetime;</div><div class='add'>+	u16 tcp_port;</div><div class='add'>+	u16 udp_port;</div><div class='ctx'> </div><div class='ctx'> 	struct delayed_work grace_period_end;</div><div class='ctx'> 	struct lock_manager lockd_manager;</div><div class='head'>diff --git a/fs/lockd/svc.c b/fs/lockd/svc.c<br/>index b220e1b91726..d68afa196535 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/lockd/svc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/svc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/lockd/svc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/lockd/svc.c</a></div><div class='hunk'>@@ -24,7 +24,6 @@</div><div class='ctx'> #include &lt;linux/uio.h&gt;</div><div class='ctx'> #include &lt;linux/smp.h&gt;</div><div class='ctx'> #include &lt;linux/mutex.h&gt;</div><div class='del'>-#include &lt;linux/kthread.h&gt;</div><div class='ctx'> #include &lt;linux/freezer.h&gt;</div><div class='ctx'> #include &lt;linux/inetdevice.h&gt;</div><div class='ctx'> </div><div class='hunk'>@@ -42,10 +41,10 @@</div><div class='ctx'> </div><div class='ctx'> #include "netns.h"</div><div class='ctx'> #include "procfs.h"</div><div class='add'>+#include "netlink.h"</div><div class='ctx'> </div><div class='ctx'> #define NLMDBG_FACILITY		NLMDBG_SVC</div><div class='ctx'> #define LOCKD_BUFSIZE		(1024 + NLMSVC_XDRSIZE)</div><div class='del'>-#define ALLOWED_SIGS		(sigmask(SIGKILL))</div><div class='ctx'> </div><div class='ctx'> static struct svc_program	nlmsvc_program;</div><div class='ctx'> </div><div class='hunk'>@@ -54,12 +53,13 @@ EXPORT_SYMBOL_GPL(nlmsvc_ops);</div><div class='ctx'> </div><div class='ctx'> static DEFINE_MUTEX(nlmsvc_mutex);</div><div class='ctx'> static unsigned int		nlmsvc_users;</div><div class='del'>-static struct task_struct	*nlmsvc_task;</div><div class='del'>-static struct svc_rqst		*nlmsvc_rqst;</div><div class='del'>-unsigned long			nlmsvc_timeout;</div><div class='add'>+static struct svc_serv		*nlmsvc_serv;</div><div class='ctx'> </div><div class='del'>-static atomic_t nlm_ntf_refcnt = ATOMIC_INIT(0);</div><div class='del'>-static DECLARE_WAIT_QUEUE_HEAD(nlm_ntf_wq);</div><div class='add'>+static void nlmsvc_request_retry(struct timer_list *tl)</div><div class='add'>+{</div><div class='add'>+	svc_wake_up(nlmsvc_serv);</div><div class='add'>+}</div><div class='add'>+DEFINE_TIMER(nlmsvc_retry, nlmsvc_request_retry);</div><div class='ctx'> </div><div class='ctx'> unsigned int lockd_net_id;</div><div class='ctx'> </div><div class='hunk'>@@ -68,12 +68,9 @@ unsigned int lockd_net_id;</div><div class='ctx'>  * and also changed through the sysctl interface.  -- Jamie Lokier, Aug 2003</div><div class='ctx'>  */</div><div class='ctx'> static unsigned long		nlm_grace_period;</div><div class='del'>-static unsigned long		nlm_timeout = LOCKD_DFLT_TIMEO;</div><div class='add'>+unsigned long			nlm_timeout = LOCKD_DFLT_TIMEO;</div><div class='ctx'> static int			nlm_udpport, nlm_tcpport;</div><div class='ctx'> </div><div class='del'>-/* RLIM_NOFILE defaults to 1024. That seems like a reasonable default here. */</div><div class='del'>-static unsigned int		nlm_max_connections = 1024;</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Constants needed for the sysctl interface.</div><div class='ctx'>  */</div><div class='hunk'>@@ -81,14 +78,20 @@ static const unsigned long	nlm_grace_period_min = 0;</div><div class='ctx'> static const unsigned long	nlm_grace_period_max = 240;</div><div class='ctx'> static const unsigned long	nlm_timeout_min = 3;</div><div class='ctx'> static const unsigned long	nlm_timeout_max = 20;</div><div class='del'>-static const int		nlm_port_min = 0, nlm_port_max = 65535;</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_SYSCTL</div><div class='add'>+static const int		nlm_port_min = 0, nlm_port_max = 65535;</div><div class='ctx'> static struct ctl_table_header * nlm_sysctl_table;</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-static unsigned long get_lockd_grace_period(void)</div><div class='add'>+static unsigned long get_lockd_grace_period(struct net *net)</div><div class='ctx'> {</div><div class='add'>+	struct lockd_net *ln = net_generic(net, lockd_net_id);</div><div class='add'>+</div><div class='add'>+	/* Return the net-ns specific grace period, if there is one */</div><div class='add'>+	if (ln-&gt;gracetime)</div><div class='add'>+		return ln-&gt;gracetime * HZ;</div><div class='add'>+</div><div class='ctx'> 	/* Note: nlm_timeout should always be nonzero */</div><div class='ctx'> 	if (nlm_grace_period)</div><div class='ctx'> 		return roundup(nlm_grace_period, nlm_timeout) * HZ;</div><div class='hunk'>@@ -107,7 +110,7 @@ static void grace_ender(struct work_struct *grace)</div><div class='ctx'> </div><div class='ctx'> static void set_grace_period(struct net *net)</div><div class='ctx'> {</div><div class='del'>-	unsigned long grace_period = get_lockd_grace_period();</div><div class='add'>+	unsigned long grace_period = get_lockd_grace_period(net);</div><div class='ctx'> 	struct lockd_net *ln = net_generic(net, lockd_net_id);</div><div class='ctx'> </div><div class='ctx'> 	locks_start_grace(net, &amp;ln-&gt;lockd_manager);</div><div class='hunk'>@@ -115,75 +118,40 @@ static void set_grace_period(struct net *net)</div><div class='ctx'> 	schedule_delayed_work(&amp;ln-&gt;grace_period_end, grace_period);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void restart_grace(void)</div><div class='del'>-{</div><div class='del'>-	if (nlmsvc_ops) {</div><div class='del'>-		struct net *net = &amp;init_net;</div><div class='del'>-		struct lockd_net *ln = net_generic(net, lockd_net_id);</div><div class='del'>-</div><div class='del'>-		cancel_delayed_work_sync(&amp;ln-&gt;grace_period_end);</div><div class='del'>-		locks_end_grace(&amp;ln-&gt;lockd_manager);</div><div class='del'>-		nlmsvc_invalidate_all();</div><div class='del'>-		set_grace_period(net);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * This is the lockd kernel thread</div><div class='ctx'>  */</div><div class='ctx'> static int</div><div class='ctx'> lockd(void *vrqstp)</div><div class='ctx'> {</div><div class='del'>-	int		err = 0;</div><div class='ctx'> 	struct svc_rqst *rqstp = vrqstp;</div><div class='ctx'> 	struct net *net = &amp;init_net;</div><div class='ctx'> 	struct lockd_net *ln = net_generic(net, lockd_net_id);</div><div class='ctx'> </div><div class='add'>+	svc_thread_init_status(rqstp, 0);</div><div class='add'>+</div><div class='ctx'> 	/* try_to_freeze() is called from svc_recv() */</div><div class='ctx'> 	set_freezable();</div><div class='ctx'> </div><div class='del'>-	/* Allow SIGKILL to tell lockd to drop all of its locks */</div><div class='del'>-	allow_signal(SIGKILL);</div><div class='del'>-</div><div class='ctx'> 	dprintk("NFS locking service started (ver " LOCKD_VERSION ").\n");</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The main request loop. We don't terminate until the last</div><div class='ctx'> 	 * NFS mount or NFS daemon has gone away.</div><div class='ctx'> 	 */</div><div class='del'>-	while (!kthread_should_stop()) {</div><div class='del'>-		long timeout = MAX_SCHEDULE_TIMEOUT;</div><div class='del'>-		RPC_IFDEBUG(char buf[RPC_MAX_ADDRBUFLEN]);</div><div class='del'>-</div><div class='del'>-		/* update sv_maxconn if it has changed */</div><div class='del'>-		rqstp-&gt;rq_server-&gt;sv_maxconn = nlm_max_connections;</div><div class='del'>-</div><div class='del'>-		if (signalled()) {</div><div class='del'>-			flush_signals(current);</div><div class='del'>-			restart_grace();</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		timeout = nlmsvc_retry_blocked();</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Find a socket with data available and call its</div><div class='del'>-		 * recvfrom routine.</div><div class='del'>-		 */</div><div class='del'>-		err = svc_recv(rqstp, timeout);</div><div class='del'>-		if (err == -EAGAIN || err == -EINTR)</div><div class='del'>-			continue;</div><div class='del'>-		dprintk("lockd: request from %s\n",</div><div class='del'>-				svc_print_addr(rqstp, buf, sizeof(buf)));</div><div class='del'>-</div><div class='del'>-		svc_process(rqstp);</div><div class='add'>+	while (!svc_thread_should_stop(rqstp)) {</div><div class='add'>+		nlmsvc_retry_blocked(rqstp);</div><div class='add'>+		svc_recv(rqstp);</div><div class='ctx'> 	}</div><div class='del'>-	flush_signals(current);</div><div class='ctx'> 	if (nlmsvc_ops)</div><div class='ctx'> 		nlmsvc_invalidate_all();</div><div class='ctx'> 	nlm_shutdown_hosts();</div><div class='ctx'> 	cancel_delayed_work_sync(&amp;ln-&gt;grace_period_end);</div><div class='ctx'> 	locks_end_grace(&amp;ln-&gt;lockd_manager);</div><div class='add'>+</div><div class='add'>+	dprintk("lockd_down: service stopped\n");</div><div class='add'>+</div><div class='add'>+	svc_exit_thread(rqstp);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -196,8 +164,8 @@ static int create_lockd_listener(struct svc_serv *serv, const char *name,</div><div class='ctx'> </div><div class='ctx'> 	xprt = svc_find_xprt(serv, name, net, family, 0);</div><div class='ctx'> 	if (xprt == NULL)</div><div class='del'>-		return svc_create_xprt(serv, name, net, family, port,</div><div class='del'>-						SVC_SOCK_DEFAULTS, cred);</div><div class='add'>+		return svc_xprt_create(serv, name, net, family, port,</div><div class='add'>+				       SVC_SOCK_DEFAULTS, cred);</div><div class='ctx'> 	svc_xprt_put(xprt);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -205,15 +173,16 @@ static int create_lockd_listener(struct svc_serv *serv, const char *name,</div><div class='ctx'> static int create_lockd_family(struct svc_serv *serv, struct net *net,</div><div class='ctx'> 			       const int family, const struct cred *cred)</div><div class='ctx'> {</div><div class='add'>+	struct lockd_net *ln = net_generic(net, lockd_net_id);</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	err = create_lockd_listener(serv, "udp", net, family, nlm_udpport,</div><div class='del'>-			cred);</div><div class='add'>+	err = create_lockd_listener(serv, "udp", net, family,</div><div class='add'>+				    ln-&gt;udp_port ? ln-&gt;udp_port : nlm_udpport, cred);</div><div class='ctx'> 	if (err &lt; 0)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	return create_lockd_listener(serv, "tcp", net, family, nlm_tcpport,</div><div class='del'>-			cred);</div><div class='add'>+	return create_lockd_listener(serv, "tcp", net, family,</div><div class='add'>+				     ln-&gt;tcp_port ? ln-&gt;tcp_port : nlm_tcpport, cred);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -247,7 +216,7 @@ out_err:</div><div class='ctx'> 	if (warned++ == 0)</div><div class='ctx'> 		printk(KERN_WARNING</div><div class='ctx'> 			"lockd_up: makesock failed, error=%d\n", err);</div><div class='del'>-	svc_shutdown_net(serv, net);</div><div class='add'>+	svc_xprt_destroy_all(serv, net, true);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -285,13 +254,11 @@ static void lockd_down_net(struct svc_serv *serv, struct net *net)</div><div class='ctx'> 			nlm_shutdown_hosts_net(net);</div><div class='ctx'> 			cancel_delayed_work_sync(&amp;ln-&gt;grace_period_end);</div><div class='ctx'> 			locks_end_grace(&amp;ln-&gt;lockd_manager);</div><div class='del'>-			svc_shutdown_net(serv, net);</div><div class='del'>-			dprintk("%s: per-net data destroyed; net=%x\n",</div><div class='del'>-				__func__, net-&gt;ns.inum);</div><div class='add'>+			svc_xprt_destroy_all(serv, net, true);</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='del'>-		pr_err("%s: no users! task=%p, net=%x\n",</div><div class='del'>-			__func__, nlmsvc_task, net-&gt;ns.inum);</div><div class='add'>+		pr_err("%s: no users! net=%x\n",</div><div class='add'>+			__func__, net-&gt;ns.inum);</div><div class='ctx'> 		BUG();</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -302,20 +269,16 @@ static int lockd_inetaddr_event(struct notifier_block *this,</div><div class='ctx'> 	struct in_ifaddr *ifa = (struct in_ifaddr *)ptr;</div><div class='ctx'> 	struct sockaddr_in sin;</div><div class='ctx'> </div><div class='del'>-	if ((event != NETDEV_DOWN) ||</div><div class='del'>-	    !atomic_inc_not_zero(&amp;nlm_ntf_refcnt))</div><div class='add'>+	if (event != NETDEV_DOWN)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	if (nlmsvc_rqst) {</div><div class='add'>+	if (nlmsvc_serv) {</div><div class='ctx'> 		dprintk("lockd_inetaddr_event: removed %pI4\n",</div><div class='ctx'> 			&amp;ifa-&gt;ifa_local);</div><div class='ctx'> 		sin.sin_family = AF_INET;</div><div class='ctx'> 		sin.sin_addr.s_addr = ifa-&gt;ifa_local;</div><div class='del'>-		svc_age_temp_xprts_now(nlmsvc_rqst-&gt;rq_server,</div><div class='del'>-			(struct sockaddr *)&amp;sin);</div><div class='add'>+		svc_age_temp_xprts_now(nlmsvc_serv, (struct sockaddr *)&amp;sin);</div><div class='ctx'> 	}</div><div class='del'>-	atomic_dec(&amp;nlm_ntf_refcnt);</div><div class='del'>-	wake_up(&amp;nlm_ntf_wq);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	return NOTIFY_DONE;</div><div class='hunk'>@@ -332,21 +295,17 @@ static int lockd_inet6addr_event(struct notifier_block *this,</div><div class='ctx'> 	struct inet6_ifaddr *ifa = (struct inet6_ifaddr *)ptr;</div><div class='ctx'> 	struct sockaddr_in6 sin6;</div><div class='ctx'> </div><div class='del'>-	if ((event != NETDEV_DOWN) ||</div><div class='del'>-	    !atomic_inc_not_zero(&amp;nlm_ntf_refcnt))</div><div class='add'>+	if (event != NETDEV_DOWN)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	if (nlmsvc_rqst) {</div><div class='add'>+	if (nlmsvc_serv) {</div><div class='ctx'> 		dprintk("lockd_inet6addr_event: removed %pI6\n", &amp;ifa-&gt;addr);</div><div class='ctx'> 		sin6.sin6_family = AF_INET6;</div><div class='ctx'> 		sin6.sin6_addr = ifa-&gt;addr;</div><div class='ctx'> 		if (ipv6_addr_type(&amp;sin6.sin6_addr) &amp; IPV6_ADDR_LINKLOCAL)</div><div class='ctx'> 			sin6.sin6_scope_id = ifa-&gt;idev-&gt;dev-&gt;ifindex;</div><div class='del'>-		svc_age_temp_xprts_now(nlmsvc_rqst-&gt;rq_server,</div><div class='del'>-			(struct sockaddr *)&amp;sin6);</div><div class='add'>+		svc_age_temp_xprts_now(nlmsvc_serv, (struct sockaddr *)&amp;sin6);</div><div class='ctx'> 	}</div><div class='del'>-	atomic_dec(&amp;nlm_ntf_refcnt);</div><div class='del'>-	wake_up(&amp;nlm_ntf_wq);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	return NOTIFY_DONE;</div><div class='hunk'>@@ -357,86 +316,14 @@ static struct notifier_block lockd_inet6addr_notifier = {</div><div class='ctx'> };</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-static void lockd_unregister_notifiers(void)</div><div class='del'>-{</div><div class='del'>-	unregister_inetaddr_notifier(&amp;lockd_inetaddr_notifier);</div><div class='del'>-#if IS_ENABLED(CONFIG_IPV6)</div><div class='del'>-	unregister_inet6addr_notifier(&amp;lockd_inet6addr_notifier);</div><div class='del'>-#endif</div><div class='del'>-	wait_event(nlm_ntf_wq, atomic_read(&amp;nlm_ntf_refcnt) == 0);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void lockd_svc_exit_thread(void)</div><div class='del'>-{</div><div class='del'>-	atomic_dec(&amp;nlm_ntf_refcnt);</div><div class='del'>-	lockd_unregister_notifiers();</div><div class='del'>-	svc_exit_thread(nlmsvc_rqst);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int lockd_start_svc(struct svc_serv *serv)</div><div class='add'>+static int lockd_get(void)</div><div class='ctx'> {</div><div class='add'>+	struct svc_serv *serv;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	if (nlmsvc_rqst)</div><div class='add'>+	if (nlmsvc_serv) {</div><div class='add'>+		nlmsvc_users++;</div><div class='ctx'> 		return 0;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Create the kernel thread and wait for it to start.</div><div class='del'>-	 */</div><div class='del'>-	nlmsvc_rqst = svc_prepare_thread(serv, &amp;serv-&gt;sv_pools[0], NUMA_NO_NODE);</div><div class='del'>-	if (IS_ERR(nlmsvc_rqst)) {</div><div class='del'>-		error = PTR_ERR(nlmsvc_rqst);</div><div class='del'>-		printk(KERN_WARNING</div><div class='del'>-			"lockd_up: svc_rqst allocation failed, error=%d\n",</div><div class='del'>-			error);</div><div class='del'>-		lockd_unregister_notifiers();</div><div class='del'>-		goto out_rqst;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	atomic_inc(&amp;nlm_ntf_refcnt);</div><div class='del'>-	svc_sock_update_bufs(serv);</div><div class='del'>-	serv-&gt;sv_maxconn = nlm_max_connections;</div><div class='del'>-</div><div class='del'>-	nlmsvc_task = kthread_create(lockd, nlmsvc_rqst, "%s", serv-&gt;sv_name);</div><div class='del'>-	if (IS_ERR(nlmsvc_task)) {</div><div class='del'>-		error = PTR_ERR(nlmsvc_task);</div><div class='del'>-		printk(KERN_WARNING</div><div class='del'>-			"lockd_up: kthread_run failed, error=%d\n", error);</div><div class='del'>-		goto out_task;</div><div class='del'>-	}</div><div class='del'>-	nlmsvc_rqst-&gt;rq_task = nlmsvc_task;</div><div class='del'>-	wake_up_process(nlmsvc_task);</div><div class='del'>-</div><div class='del'>-	dprintk("lockd_up: service started\n");</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-out_task:</div><div class='del'>-	lockd_svc_exit_thread();</div><div class='del'>-	nlmsvc_task = NULL;</div><div class='del'>-out_rqst:</div><div class='del'>-	nlmsvc_rqst = NULL;</div><div class='del'>-	return error;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static const struct svc_serv_ops lockd_sv_ops = {</div><div class='del'>-	.svo_shutdown		= svc_rpcb_cleanup,</div><div class='del'>-	.svo_enqueue_xprt	= svc_xprt_do_enqueue,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static struct svc_serv *lockd_create_svc(void)</div><div class='del'>-{</div><div class='del'>-	struct svc_serv *serv;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Check whether we're already up and running.</div><div class='del'>-	 */</div><div class='del'>-	if (nlmsvc_rqst) {</div><div class='del'>-		/*</div><div class='del'>-		 * Note: increase service usage, because later in case of error</div><div class='del'>-		 * svc_destroy() will be called.</div><div class='del'>-		 */</div><div class='del'>-		svc_get(nlmsvc_rqst-&gt;rq_server);</div><div class='del'>-		return nlmsvc_rqst-&gt;rq_server;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -447,21 +334,44 @@ static struct svc_serv *lockd_create_svc(void)</div><div class='ctx'> 		printk(KERN_WARNING</div><div class='ctx'> 			"lockd_up: no pid, %d users??\n", nlmsvc_users);</div><div class='ctx'> </div><div class='del'>-	if (!nlm_timeout)</div><div class='del'>-		nlm_timeout = LOCKD_DFLT_TIMEO;</div><div class='del'>-	nlmsvc_timeout = nlm_timeout * HZ;</div><div class='del'>-</div><div class='del'>-	serv = svc_create(&amp;nlmsvc_program, LOCKD_BUFSIZE, &amp;lockd_sv_ops);</div><div class='add'>+	serv = svc_create(&amp;nlmsvc_program, LOCKD_BUFSIZE, lockd);</div><div class='ctx'> 	if (!serv) {</div><div class='ctx'> 		printk(KERN_WARNING "lockd_up: create service failed\n");</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	error = svc_set_num_threads(serv, NULL, 1);</div><div class='add'>+	if (error &lt; 0) {</div><div class='add'>+		svc_destroy(&amp;serv);</div><div class='add'>+		return error;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	nlmsvc_serv = serv;</div><div class='ctx'> 	register_inetaddr_notifier(&amp;lockd_inetaddr_notifier);</div><div class='ctx'> #if IS_ENABLED(CONFIG_IPV6)</div><div class='ctx'> 	register_inet6addr_notifier(&amp;lockd_inet6addr_notifier);</div><div class='ctx'> #endif</div><div class='ctx'> 	dprintk("lockd_up: service created\n");</div><div class='del'>-	return serv;</div><div class='add'>+	nlmsvc_users++;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void lockd_put(void)</div><div class='add'>+{</div><div class='add'>+	if (WARN(nlmsvc_users &lt;= 0, "lockd_down: no users!\n"))</div><div class='add'>+		return;</div><div class='add'>+	if (--nlmsvc_users)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	unregister_inetaddr_notifier(&amp;lockd_inetaddr_notifier);</div><div class='add'>+#if IS_ENABLED(CONFIG_IPV6)</div><div class='add'>+	unregister_inet6addr_notifier(&amp;lockd_inet6addr_notifier);</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+	svc_set_num_threads(nlmsvc_serv, NULL, 0);</div><div class='add'>+	timer_delete_sync(&amp;nlmsvc_retry);</div><div class='add'>+	svc_destroy(&amp;nlmsvc_serv);</div><div class='add'>+	dprintk("lockd_down: service destroyed\n");</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -469,36 +379,21 @@ static struct svc_serv *lockd_create_svc(void)</div><div class='ctx'>  */</div><div class='ctx'> int lockd_up(struct net *net, const struct cred *cred)</div><div class='ctx'> {</div><div class='del'>-	struct svc_serv *serv;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;nlmsvc_mutex);</div><div class='ctx'> </div><div class='del'>-	serv = lockd_create_svc();</div><div class='del'>-	if (IS_ERR(serv)) {</div><div class='del'>-		error = PTR_ERR(serv);</div><div class='del'>-		goto err_create;</div><div class='del'>-	}</div><div class='add'>+	error = lockd_get();</div><div class='add'>+	if (error)</div><div class='add'>+		goto err;</div><div class='ctx'> </div><div class='del'>-	error = lockd_up_net(serv, net, cred);</div><div class='add'>+	error = lockd_up_net(nlmsvc_serv, net, cred);</div><div class='ctx'> 	if (error &lt; 0) {</div><div class='del'>-		lockd_unregister_notifiers();</div><div class='del'>-		goto err_put;</div><div class='add'>+		lockd_put();</div><div class='add'>+		goto err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	error = lockd_start_svc(serv);</div><div class='del'>-	if (error &lt; 0) {</div><div class='del'>-		lockd_down_net(serv, net);</div><div class='del'>-		goto err_put;</div><div class='del'>-	}</div><div class='del'>-	nlmsvc_users++;</div><div class='del'>-	/*</div><div class='del'>-	 * Note: svc_serv structures have an initial use count of 1,</div><div class='del'>-	 * so we exit through here on both success and failure.</div><div class='del'>-	 */</div><div class='del'>-err_put:</div><div class='del'>-	svc_destroy(serv);</div><div class='del'>-err_create:</div><div class='add'>+err:</div><div class='ctx'> 	mutex_unlock(&amp;nlmsvc_mutex);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='hunk'>@@ -511,27 +406,8 @@ void</div><div class='ctx'> lockd_down(struct net *net)</div><div class='ctx'> {</div><div class='ctx'> 	mutex_lock(&amp;nlmsvc_mutex);</div><div class='del'>-	lockd_down_net(nlmsvc_rqst-&gt;rq_server, net);</div><div class='del'>-	if (nlmsvc_users) {</div><div class='del'>-		if (--nlmsvc_users)</div><div class='del'>-			goto out;</div><div class='del'>-	} else {</div><div class='del'>-		printk(KERN_ERR "lockd_down: no users! task=%p\n",</div><div class='del'>-			nlmsvc_task);</div><div class='del'>-		BUG();</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!nlmsvc_task) {</div><div class='del'>-		printk(KERN_ERR "lockd_down: no lockd running.\n");</div><div class='del'>-		BUG();</div><div class='del'>-	}</div><div class='del'>-	kthread_stop(nlmsvc_task);</div><div class='del'>-	dprintk("lockd_down: service stopped\n");</div><div class='del'>-	lockd_svc_exit_thread();</div><div class='del'>-	dprintk("lockd_down: service destroyed\n");</div><div class='del'>-	nlmsvc_task = NULL;</div><div class='del'>-	nlmsvc_rqst = NULL;</div><div class='del'>-out:</div><div class='add'>+	lockd_down_net(nlmsvc_serv, net);</div><div class='add'>+	lockd_put();</div><div class='ctx'> 	mutex_unlock(&amp;nlmsvc_mutex);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(lockd_down);</div><div class='hunk'>@@ -542,7 +418,7 @@ EXPORT_SYMBOL_GPL(lockd_down);</div><div class='ctx'>  * Sysctl parameters (same as module parameters, different interface).</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static struct ctl_table nlm_sysctls[] = {</div><div class='add'>+static const struct ctl_table nlm_sysctls[] = {</div><div class='ctx'> 	{</div><div class='ctx'> 		.procname	= "nlm_grace_period",</div><div class='ctx'> 		.data		= &amp;nlm_grace_period,</div><div class='hunk'>@@ -582,36 +458,18 @@ static struct ctl_table nlm_sysctls[] = {</div><div class='ctx'> 	{</div><div class='ctx'> 		.procname	= "nsm_use_hostnames",</div><div class='ctx'> 		.data		= &amp;nsm_use_hostnames,</div><div class='del'>-		.maxlen		= sizeof(int),</div><div class='add'>+		.maxlen		= sizeof(bool),</div><div class='ctx'> 		.mode		= 0644,</div><div class='ctx'> 		.proc_handler	= proc_dobool,</div><div class='ctx'> 	},</div><div class='ctx'> 	{</div><div class='ctx'> 		.procname	= "nsm_local_state",</div><div class='ctx'> 		.data		= &amp;nsm_local_state,</div><div class='del'>-		.maxlen		= sizeof(int),</div><div class='add'>+		.maxlen		= sizeof(nsm_local_state),</div><div class='ctx'> 		.mode		= 0644,</div><div class='del'>-		.proc_handler	= proc_dointvec,</div><div class='del'>-	},</div><div class='del'>-	{ }</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static struct ctl_table nlm_sysctl_dir[] = {</div><div class='del'>-	{</div><div class='del'>-		.procname	= "nfs",</div><div class='del'>-		.mode		= 0555,</div><div class='del'>-		.child		= nlm_sysctls,</div><div class='del'>-	},</div><div class='del'>-	{ }</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static struct ctl_table nlm_sysctl_root[] = {</div><div class='del'>-	{</div><div class='del'>-		.procname	= "fs",</div><div class='del'>-		.mode		= 0555,</div><div class='del'>-		.child		= nlm_sysctl_dir,</div><div class='add'>+		.proc_handler	= proc_douintvec,</div><div class='add'>+		.extra1		= SYSCTL_ZERO,</div><div class='ctx'> 	},</div><div class='del'>-	{ }</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> #endif	/* CONFIG_SYSCTL */</div><div class='hunk'>@@ -643,7 +501,7 @@ static inline int is_callback(u32 proc)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> </div><div class='del'>-static int lockd_authenticate(struct svc_rqst *rqstp)</div><div class='add'>+static enum svc_auth_status lockd_authenticate(struct svc_rqst *rqstp)</div><div class='ctx'> {</div><div class='ctx'> 	rqstp-&gt;rq_client = NULL;</div><div class='ctx'> 	switch (rqstp-&gt;rq_authop-&gt;flavour) {</div><div class='hunk'>@@ -684,7 +542,6 @@ module_param_call(nlm_udpport, param_set_port, param_get_int,</div><div class='ctx'> module_param_call(nlm_tcpport, param_set_port, param_get_int,</div><div class='ctx'> 		  &amp;nlm_tcpport, 0644);</div><div class='ctx'> module_param(nsm_use_hostnames, bool, 0644);</div><div class='del'>-module_param(nlm_max_connections, uint, 0644);</div><div class='ctx'> </div><div class='ctx'> static int lockd_init_net(struct net *net)</div><div class='ctx'> {</div><div class='hunk'>@@ -730,7 +587,7 @@ static int __init init_nlm(void)</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_SYSCTL</div><div class='ctx'> 	err = -ENOMEM;</div><div class='del'>-	nlm_sysctl_table = register_sysctl_table(nlm_sysctl_root);</div><div class='add'>+	nlm_sysctl_table = register_sysctl("fs/nfs", nlm_sysctls);</div><div class='ctx'> 	if (nlm_sysctl_table == NULL)</div><div class='ctx'> 		goto err_sysctl;</div><div class='ctx'> #endif</div><div class='hunk'>@@ -738,6 +595,10 @@ static int __init init_nlm(void)</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto err_pernet;</div><div class='ctx'> </div><div class='add'>+	err = genl_register_family(&amp;lockd_nl_family);</div><div class='add'>+	if (err)</div><div class='add'>+		goto err_netlink;</div><div class='add'>+</div><div class='ctx'> 	err = lockd_create_procfs();</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto err_procfs;</div><div class='hunk'>@@ -745,6 +606,8 @@ static int __init init_nlm(void)</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> err_procfs:</div><div class='add'>+	genl_unregister_family(&amp;lockd_nl_family);</div><div class='add'>+err_netlink:</div><div class='ctx'> 	unregister_pernet_subsys(&amp;lockd_net_ops);</div><div class='ctx'> err_pernet:</div><div class='ctx'> #ifdef CONFIG_SYSCTL</div><div class='hunk'>@@ -758,6 +621,7 @@ static void __exit exit_nlm(void)</div><div class='ctx'> {</div><div class='ctx'> 	/* FIXME: delete all NLM clients */</div><div class='ctx'> 	nlm_shutdown_hosts();</div><div class='add'>+	genl_unregister_family(&amp;lockd_nl_family);</div><div class='ctx'> 	lockd_remove_procfs();</div><div class='ctx'> 	unregister_pernet_subsys(&amp;lockd_net_ops);</div><div class='ctx'> #ifdef CONFIG_SYSCTL</div><div class='hunk'>@@ -771,17 +635,16 @@ module_exit(exit_nlm);</div><div class='ctx'> /**</div><div class='ctx'>  * nlmsvc_dispatch - Process an NLM Request</div><div class='ctx'>  * @rqstp: incoming request</div><div class='del'>- * @statp: pointer to location of accept_stat field in RPC Reply buffer</div><div class='ctx'>  *</div><div class='ctx'>  * Return values:</div><div class='ctx'>  *  %0: Processing complete; do not send a Reply</div><div class='ctx'>  *  %1: Processing complete; send Reply in rqstp-&gt;rq_res</div><div class='ctx'>  */</div><div class='del'>-static int nlmsvc_dispatch(struct svc_rqst *rqstp, __be32 *statp)</div><div class='add'>+static int nlmsvc_dispatch(struct svc_rqst *rqstp)</div><div class='ctx'> {</div><div class='ctx'> 	const struct svc_procedure *procp = rqstp-&gt;rq_procinfo;</div><div class='add'>+	__be32 *statp = rqstp-&gt;rq_accept_statp;</div><div class='ctx'> </div><div class='del'>-	svcxdr_init_decode(rqstp);</div><div class='ctx'> 	if (!procp-&gt;pc_decode(rqstp, &amp;rqstp-&gt;rq_arg_stream))</div><div class='ctx'> 		goto out_decode_err;</div><div class='ctx'> </div><div class='hunk'>@@ -791,7 +654,6 @@ static int nlmsvc_dispatch(struct svc_rqst *rqstp, __be32 *statp)</div><div class='ctx'> 	if (*statp != rpc_success)</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='del'>-	svcxdr_init_encode(rqstp);</div><div class='ctx'> 	if (!procp-&gt;pc_encode(rqstp, &amp;rqstp-&gt;rq_res_stream))</div><div class='ctx'> 		goto out_encode_err;</div><div class='ctx'> </div><div class='hunk'>@@ -809,7 +671,7 @@ out_encode_err:</div><div class='ctx'> /*</div><div class='ctx'>  * Define NLM program and procedures</div><div class='ctx'>  */</div><div class='del'>-static unsigned int nlmsvc_version1_count[17];</div><div class='add'>+static DEFINE_PER_CPU_ALIGNED(unsigned long, nlmsvc_version1_count[17]);</div><div class='ctx'> static const struct svc_version	nlmsvc_version1 = {</div><div class='ctx'> 	.vs_vers	= 1,</div><div class='ctx'> 	.vs_nproc	= 17,</div><div class='hunk'>@@ -818,26 +680,31 @@ static const struct svc_version	nlmsvc_version1 = {</div><div class='ctx'> 	.vs_dispatch	= nlmsvc_dispatch,</div><div class='ctx'> 	.vs_xdrsize	= NLMSVC_XDRSIZE,</div><div class='ctx'> };</div><div class='del'>-static unsigned int nlmsvc_version3_count[24];</div><div class='add'>+</div><div class='add'>+static DEFINE_PER_CPU_ALIGNED(unsigned long,</div><div class='add'>+			      nlmsvc_version3_count[ARRAY_SIZE(nlmsvc_procedures)]);</div><div class='ctx'> static const struct svc_version	nlmsvc_version3 = {</div><div class='ctx'> 	.vs_vers	= 3,</div><div class='del'>-	.vs_nproc	= 24,</div><div class='add'>+	.vs_nproc	= ARRAY_SIZE(nlmsvc_procedures),</div><div class='ctx'> 	.vs_proc	= nlmsvc_procedures,</div><div class='ctx'> 	.vs_count	= nlmsvc_version3_count,</div><div class='ctx'> 	.vs_dispatch	= nlmsvc_dispatch,</div><div class='ctx'> 	.vs_xdrsize	= NLMSVC_XDRSIZE,</div><div class='ctx'> };</div><div class='add'>+</div><div class='ctx'> #ifdef CONFIG_LOCKD_V4</div><div class='del'>-static unsigned int nlmsvc_version4_count[24];</div><div class='add'>+static DEFINE_PER_CPU_ALIGNED(unsigned long,</div><div class='add'>+			      nlmsvc_version4_count[ARRAY_SIZE(nlmsvc_procedures4)]);</div><div class='ctx'> static const struct svc_version	nlmsvc_version4 = {</div><div class='ctx'> 	.vs_vers	= 4,</div><div class='del'>-	.vs_nproc	= 24,</div><div class='add'>+	.vs_nproc	= ARRAY_SIZE(nlmsvc_procedures4),</div><div class='ctx'> 	.vs_proc	= nlmsvc_procedures4,</div><div class='ctx'> 	.vs_count	= nlmsvc_version4_count,</div><div class='ctx'> 	.vs_dispatch	= nlmsvc_dispatch,</div><div class='ctx'> 	.vs_xdrsize	= NLMSVC_XDRSIZE,</div><div class='ctx'> };</div><div class='ctx'> #endif</div><div class='add'>+</div><div class='ctx'> static const struct svc_version *nlmsvc_version[] = {</div><div class='ctx'> 	[1] = &amp;nlmsvc_version1,</div><div class='ctx'> 	[3] = &amp;nlmsvc_version3,</div><div class='hunk'>@@ -846,8 +713,6 @@ static const struct svc_version *nlmsvc_version[] = {</div><div class='ctx'> #endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static struct svc_stat		nlmsvc_stats;</div><div class='del'>-</div><div class='ctx'> #define NLM_NRVERS	ARRAY_SIZE(nlmsvc_version)</div><div class='ctx'> static struct svc_program	nlmsvc_program = {</div><div class='ctx'> 	.pg_prog		= NLM_PROGRAM,		/* program number */</div><div class='hunk'>@@ -855,8 +720,98 @@ static struct svc_program	nlmsvc_program = {</div><div class='ctx'> 	.pg_vers		= nlmsvc_version,	/* version table */</div><div class='ctx'> 	.pg_name		= "lockd",		/* service name */</div><div class='ctx'> 	.pg_class		= "nfsd",		/* share authentication with nfsd */</div><div class='del'>-	.pg_stats		= &amp;nlmsvc_stats,	/* stats table */</div><div class='ctx'> 	.pg_authenticate	= &amp;lockd_authenticate,	/* export authentication */</div><div class='ctx'> 	.pg_init_request	= svc_generic_init_request,</div><div class='ctx'> 	.pg_rpcbind_set		= svc_generic_rpcbind_set,</div><div class='ctx'> };</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * lockd_nl_server_set_doit - set the lockd server parameters via netlink</div><div class='add'>+ * @skb: reply buffer</div><div class='add'>+ * @info: netlink metadata and command arguments</div><div class='add'>+ *</div><div class='add'>+ * This updates the per-net values. When updating the values in the init_net</div><div class='add'>+ * namespace, also update the "legacy" global values.</div><div class='add'>+ *</div><div class='add'>+ * Return 0 on success or a negative errno.</div><div class='add'>+ */</div><div class='add'>+int lockd_nl_server_set_doit(struct sk_buff *skb, struct genl_info *info)</div><div class='add'>+{</div><div class='add'>+	struct net *net = genl_info_net(info);</div><div class='add'>+	struct lockd_net *ln = net_generic(net, lockd_net_id);</div><div class='add'>+	const struct nlattr *attr;</div><div class='add'>+</div><div class='add'>+	if (GENL_REQ_ATTR_CHECK(info, LOCKD_A_SERVER_GRACETIME))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	if (info-&gt;attrs[LOCKD_A_SERVER_GRACETIME] ||</div><div class='add'>+	    info-&gt;attrs[LOCKD_A_SERVER_TCP_PORT] ||</div><div class='add'>+	    info-&gt;attrs[LOCKD_A_SERVER_UDP_PORT]) {</div><div class='add'>+		attr = info-&gt;attrs[LOCKD_A_SERVER_GRACETIME];</div><div class='add'>+		if (attr) {</div><div class='add'>+			u32 gracetime = nla_get_u32(attr);</div><div class='add'>+</div><div class='add'>+			if (gracetime &gt; nlm_grace_period_max)</div><div class='add'>+				return -EINVAL;</div><div class='add'>+</div><div class='add'>+			ln-&gt;gracetime = gracetime;</div><div class='add'>+</div><div class='add'>+			if (net == &amp;init_net)</div><div class='add'>+				nlm_grace_period = gracetime;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		attr = info-&gt;attrs[LOCKD_A_SERVER_TCP_PORT];</div><div class='add'>+		if (attr) {</div><div class='add'>+			ln-&gt;tcp_port = nla_get_u16(attr);</div><div class='add'>+			if (net == &amp;init_net)</div><div class='add'>+				nlm_tcpport = ln-&gt;tcp_port;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		attr = info-&gt;attrs[LOCKD_A_SERVER_UDP_PORT];</div><div class='add'>+		if (attr) {</div><div class='add'>+			ln-&gt;udp_port = nla_get_u16(attr);</div><div class='add'>+			if (net == &amp;init_net)</div><div class='add'>+				nlm_udpport = ln-&gt;udp_port;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * lockd_nl_server_get_doit - get lockd server parameters via netlink</div><div class='add'>+ * @skb: reply buffer</div><div class='add'>+ * @info: netlink metadata and command arguments</div><div class='add'>+ *</div><div class='add'>+ * Return 0 on success or a negative errno.</div><div class='add'>+ */</div><div class='add'>+int lockd_nl_server_get_doit(struct sk_buff *skb, struct genl_info *info)</div><div class='add'>+{</div><div class='add'>+	struct net *net = genl_info_net(info);</div><div class='add'>+	struct lockd_net *ln = net_generic(net, lockd_net_id);</div><div class='add'>+	void *hdr;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	skb = genlmsg_new(GENLMSG_DEFAULT_SIZE, GFP_KERNEL);</div><div class='add'>+	if (!skb)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	hdr = genlmsg_iput(skb, info);</div><div class='add'>+	if (!hdr) {</div><div class='add'>+		err = -EMSGSIZE;</div><div class='add'>+		goto err_free_msg;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	err = nla_put_u32(skb, LOCKD_A_SERVER_GRACETIME, ln-&gt;gracetime) ||</div><div class='add'>+	      nla_put_u16(skb, LOCKD_A_SERVER_TCP_PORT, ln-&gt;tcp_port) ||</div><div class='add'>+	      nla_put_u16(skb, LOCKD_A_SERVER_UDP_PORT, ln-&gt;udp_port);</div><div class='add'>+	if (err)</div><div class='add'>+		goto err_free_msg;</div><div class='add'>+</div><div class='add'>+	genlmsg_end(skb, hdr);</div><div class='add'>+</div><div class='add'>+	return genlmsg_reply(skb, info);</div><div class='add'>+err_free_msg:</div><div class='add'>+	nlmsg_free(skb);</div><div class='add'>+</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/lockd/svc4proc.c b/fs/lockd/svc4proc.c<br/>index 176b468a61c7..109e5caae8c7 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/lockd/svc4proc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/svc4proc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/lockd/svc4proc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/lockd/svc4proc.c</a></div><div class='hunk'>@@ -32,6 +32,10 @@ nlm4svc_retrieve_args(struct svc_rqst *rqstp, struct nlm_args *argp,</div><div class='ctx'> 	if (!nlmsvc_ops)</div><div class='ctx'> 		return nlm_lck_denied_nolocks;</div><div class='ctx'> </div><div class='add'>+	if (lock-&gt;lock_start &gt; OFFSET_MAX ||</div><div class='add'>+	    (lock-&gt;lock_len &amp;&amp; ((lock-&gt;lock_len - 1) &gt; (OFFSET_MAX - lock-&gt;lock_start))))</div><div class='add'>+		return nlm4_fbig;</div><div class='add'>+</div><div class='ctx'> 	/* Obtain host handle */</div><div class='ctx'> 	if (!(host = nlmsvc_lookup_host(rqstp, lock-&gt;caller, lock-&gt;len))</div><div class='ctx'> 	 || (argp-&gt;monitor &amp;&amp; nsm_monitor(host) &lt; 0))</div><div class='hunk'>@@ -42,17 +46,23 @@ nlm4svc_retrieve_args(struct svc_rqst *rqstp, struct nlm_args *argp,</div><div class='ctx'> 	if (filp != NULL) {</div><div class='ctx'> 		int mode = lock_to_openmode(&amp;lock-&gt;fl);</div><div class='ctx'> </div><div class='add'>+		lock-&gt;fl.c.flc_flags = FL_POSIX;</div><div class='add'>+</div><div class='ctx'> 		error = nlm_lookup_file(rqstp, &amp;file, lock);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			goto no_locks;</div><div class='ctx'> 		*filp = file;</div><div class='ctx'> </div><div class='ctx'> 		/* Set up the missing parts of the file_lock structure */</div><div class='del'>-		lock-&gt;fl.fl_file  = file-&gt;f_file[mode];</div><div class='del'>-		lock-&gt;fl.fl_pid = current-&gt;tgid;</div><div class='add'>+		lock-&gt;fl.c.flc_file = file-&gt;f_file[mode];</div><div class='add'>+		lock-&gt;fl.c.flc_pid = current-&gt;tgid;</div><div class='add'>+		lock-&gt;fl.fl_start = (loff_t)lock-&gt;lock_start;</div><div class='add'>+		lock-&gt;fl.fl_end = lock-&gt;lock_len ?</div><div class='add'>+				   (loff_t)(lock-&gt;lock_start + lock-&gt;lock_len - 1) :</div><div class='add'>+				   OFFSET_MAX;</div><div class='ctx'> 		lock-&gt;fl.fl_lmops = &amp;nlmsvc_lock_operations;</div><div class='ctx'> 		nlmsvc_locks_init_private(&amp;lock-&gt;fl, host, (pid_t)lock-&gt;svid);</div><div class='del'>-		if (!lock-&gt;fl.fl_owner) {</div><div class='add'>+		if (!lock-&gt;fl.c.flc_owner) {</div><div class='ctx'> 			/* lockowner allocation has failed */</div><div class='ctx'> 			nlmsvc_release_host(host);</div><div class='ctx'> 			return nlm_lck_denied_nolocks;</div><div class='hunk'>@@ -87,6 +97,7 @@ __nlm4svc_proc_test(struct svc_rqst *rqstp, struct nlm_res *resp)</div><div class='ctx'> 	struct nlm_args *argp = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nlm_host	*host;</div><div class='ctx'> 	struct nlm_file	*file;</div><div class='add'>+	struct nlm_lockowner *test_owner;</div><div class='ctx'> 	__be32 rc = rpc_success;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("lockd: TEST4        called\n");</div><div class='hunk'>@@ -96,14 +107,16 @@ __nlm4svc_proc_test(struct svc_rqst *rqstp, struct nlm_res *resp)</div><div class='ctx'> 	if ((resp-&gt;status = nlm4svc_retrieve_args(rqstp, argp, &amp;host, &amp;file)))</div><div class='ctx'> 		return resp-&gt;status == nlm_drop_reply ? rpc_drop_reply :rpc_success;</div><div class='ctx'> </div><div class='add'>+	test_owner = argp-&gt;lock.fl.c.flc_owner;</div><div class='ctx'> 	/* Now check for conflicting locks */</div><div class='del'>-	resp-&gt;status = nlmsvc_testlock(rqstp, file, host, &amp;argp-&gt;lock, &amp;resp-&gt;lock, &amp;resp-&gt;cookie);</div><div class='add'>+	resp-&gt;status = nlmsvc_testlock(rqstp, file, host, &amp;argp-&gt;lock,</div><div class='add'>+				       &amp;resp-&gt;lock);</div><div class='ctx'> 	if (resp-&gt;status == nlm_drop_reply)</div><div class='ctx'> 		rc = rpc_drop_reply;</div><div class='ctx'> 	else</div><div class='ctx'> 		dprintk("lockd: TEST4        status %d\n", ntohl(resp-&gt;status));</div><div class='ctx'> </div><div class='del'>-	nlmsvc_release_lockowner(&amp;argp-&gt;lock);</div><div class='add'>+	nlmsvc_put_lockowner(test_owner);</div><div class='ctx'> 	nlmsvc_release_host(host);</div><div class='ctx'> 	nlm_release_file(file);</div><div class='ctx'> 	return rc;</div><div class='hunk'>@@ -131,18 +144,6 @@ __nlm4svc_proc_lock(struct svc_rqst *rqstp, struct nlm_res *resp)</div><div class='ctx'> 	if ((resp-&gt;status = nlm4svc_retrieve_args(rqstp, argp, &amp;host, &amp;file)))</div><div class='ctx'> 		return resp-&gt;status == nlm_drop_reply ? rpc_drop_reply :rpc_success;</div><div class='ctx'> </div><div class='del'>-#if 0</div><div class='del'>-	/* If supplied state doesn't match current state, we assume it's</div><div class='del'>-	 * an old request that time-warped somehow. Any error return would</div><div class='del'>-	 * do in this case because it's irrelevant anyway.</div><div class='del'>-	 *</div><div class='del'>-	 * NB: We don't retrieve the remote host's state yet.</div><div class='del'>-	 */</div><div class='del'>-	if (host-&gt;h_nsmstate &amp;&amp; host-&gt;h_nsmstate != argp-&gt;state) {</div><div class='del'>-		resp-&gt;status = nlm_lck_denied_nolocks;</div><div class='del'>-	} else</div><div class='del'>-#endif</div><div class='del'>-</div><div class='ctx'> 	/* Now try to lock the file */</div><div class='ctx'> 	resp-&gt;status = nlmsvc_lock(rqstp, file, host, &amp;argp-&gt;lock,</div><div class='ctx'> 					argp-&gt;block, &amp;argp-&gt;cookie,</div><div class='hunk'>@@ -511,6 +512,7 @@ const struct svc_procedure nlmsvc_procedures4[24] = {</div><div class='ctx'> 		.pc_decode = nlm4svc_decode_void,</div><div class='ctx'> 		.pc_encode = nlm4svc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_void),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = St,</div><div class='ctx'> 		.pc_name = "NULL",</div><div class='hunk'>@@ -520,6 +522,7 @@ const struct svc_procedure nlmsvc_procedures4[24] = {</div><div class='ctx'> 		.pc_decode = nlm4svc_decode_testargs,</div><div class='ctx'> 		.pc_encode = nlm4svc_encode_testres,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_args),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_args),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_res),</div><div class='ctx'> 		.pc_xdrressize = Ck+St+2+No+Rg,</div><div class='ctx'> 		.pc_name = "TEST",</div><div class='hunk'>@@ -529,6 +532,7 @@ const struct svc_procedure nlmsvc_procedures4[24] = {</div><div class='ctx'> 		.pc_decode = nlm4svc_decode_lockargs,</div><div class='ctx'> 		.pc_encode = nlm4svc_encode_res,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_args),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_args),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_res),</div><div class='ctx'> 		.pc_xdrressize = Ck+St,</div><div class='ctx'> 		.pc_name = "LOCK",</div><div class='hunk'>@@ -538,6 +542,7 @@ const struct svc_procedure nlmsvc_procedures4[24] = {</div><div class='ctx'> 		.pc_decode = nlm4svc_decode_cancargs,</div><div class='ctx'> 		.pc_encode = nlm4svc_encode_res,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_args),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_args),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_res),</div><div class='ctx'> 		.pc_xdrressize = Ck+St,</div><div class='ctx'> 		.pc_name = "CANCEL",</div><div class='hunk'>@@ -547,6 +552,7 @@ const struct svc_procedure nlmsvc_procedures4[24] = {</div><div class='ctx'> 		.pc_decode = nlm4svc_decode_unlockargs,</div><div class='ctx'> 		.pc_encode = nlm4svc_encode_res,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_args),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_args),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_res),</div><div class='ctx'> 		.pc_xdrressize = Ck+St,</div><div class='ctx'> 		.pc_name = "UNLOCK",</div><div class='hunk'>@@ -556,6 +562,7 @@ const struct svc_procedure nlmsvc_procedures4[24] = {</div><div class='ctx'> 		.pc_decode = nlm4svc_decode_testargs,</div><div class='ctx'> 		.pc_encode = nlm4svc_encode_res,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_args),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_args),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_res),</div><div class='ctx'> 		.pc_xdrressize = Ck+St,</div><div class='ctx'> 		.pc_name = "GRANTED",</div><div class='hunk'>@@ -565,6 +572,7 @@ const struct svc_procedure nlmsvc_procedures4[24] = {</div><div class='ctx'> 		.pc_decode = nlm4svc_decode_testargs,</div><div class='ctx'> 		.pc_encode = nlm4svc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_args),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_args),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = St,</div><div class='ctx'> 		.pc_name = "TEST_MSG",</div><div class='hunk'>@@ -574,6 +582,7 @@ const struct svc_procedure nlmsvc_procedures4[24] = {</div><div class='ctx'> 		.pc_decode = nlm4svc_decode_lockargs,</div><div class='ctx'> 		.pc_encode = nlm4svc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_args),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_args),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = St,</div><div class='ctx'> 		.pc_name = "LOCK_MSG",</div><div class='hunk'>@@ -583,6 +592,7 @@ const struct svc_procedure nlmsvc_procedures4[24] = {</div><div class='ctx'> 		.pc_decode = nlm4svc_decode_cancargs,</div><div class='ctx'> 		.pc_encode = nlm4svc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_args),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_args),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = St,</div><div class='ctx'> 		.pc_name = "CANCEL_MSG",</div><div class='hunk'>@@ -592,6 +602,7 @@ const struct svc_procedure nlmsvc_procedures4[24] = {</div><div class='ctx'> 		.pc_decode = nlm4svc_decode_unlockargs,</div><div class='ctx'> 		.pc_encode = nlm4svc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_args),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_args),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = St,</div><div class='ctx'> 		.pc_name = "UNLOCK_MSG",</div><div class='hunk'>@@ -601,6 +612,7 @@ const struct svc_procedure nlmsvc_procedures4[24] = {</div><div class='ctx'> 		.pc_decode = nlm4svc_decode_testargs,</div><div class='ctx'> 		.pc_encode = nlm4svc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_args),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_args),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = St,</div><div class='ctx'> 		.pc_name = "GRANTED_MSG",</div><div class='hunk'>@@ -610,6 +622,7 @@ const struct svc_procedure nlmsvc_procedures4[24] = {</div><div class='ctx'> 		.pc_decode = nlm4svc_decode_void,</div><div class='ctx'> 		.pc_encode = nlm4svc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_res),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_res),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = St,</div><div class='ctx'> 		.pc_name = "TEST_RES",</div><div class='hunk'>@@ -619,6 +632,7 @@ const struct svc_procedure nlmsvc_procedures4[24] = {</div><div class='ctx'> 		.pc_decode = nlm4svc_decode_void,</div><div class='ctx'> 		.pc_encode = nlm4svc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_res),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_res),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = St,</div><div class='ctx'> 		.pc_name = "LOCK_RES",</div><div class='hunk'>@@ -628,6 +642,7 @@ const struct svc_procedure nlmsvc_procedures4[24] = {</div><div class='ctx'> 		.pc_decode = nlm4svc_decode_void,</div><div class='ctx'> 		.pc_encode = nlm4svc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_res),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_res),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = St,</div><div class='ctx'> 		.pc_name = "CANCEL_RES",</div><div class='hunk'>@@ -637,6 +652,7 @@ const struct svc_procedure nlmsvc_procedures4[24] = {</div><div class='ctx'> 		.pc_decode = nlm4svc_decode_void,</div><div class='ctx'> 		.pc_encode = nlm4svc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_res),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_res),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = St,</div><div class='ctx'> 		.pc_name = "UNLOCK_RES",</div><div class='hunk'>@@ -646,6 +662,7 @@ const struct svc_procedure nlmsvc_procedures4[24] = {</div><div class='ctx'> 		.pc_decode = nlm4svc_decode_res,</div><div class='ctx'> 		.pc_encode = nlm4svc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_res),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_res),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = St,</div><div class='ctx'> 		.pc_name = "GRANTED_RES",</div><div class='hunk'>@@ -655,6 +672,7 @@ const struct svc_procedure nlmsvc_procedures4[24] = {</div><div class='ctx'> 		.pc_decode = nlm4svc_decode_reboot,</div><div class='ctx'> 		.pc_encode = nlm4svc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_reboot),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_reboot),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = St,</div><div class='ctx'> 		.pc_name = "SM_NOTIFY",</div><div class='hunk'>@@ -664,6 +682,7 @@ const struct svc_procedure nlmsvc_procedures4[24] = {</div><div class='ctx'> 		.pc_decode = nlm4svc_decode_void,</div><div class='ctx'> 		.pc_encode = nlm4svc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_void),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = 0,</div><div class='ctx'> 		.pc_name = "UNUSED",</div><div class='hunk'>@@ -673,6 +692,7 @@ const struct svc_procedure nlmsvc_procedures4[24] = {</div><div class='ctx'> 		.pc_decode = nlm4svc_decode_void,</div><div class='ctx'> 		.pc_encode = nlm4svc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_void),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = 0,</div><div class='ctx'> 		.pc_name = "UNUSED",</div><div class='hunk'>@@ -682,6 +702,7 @@ const struct svc_procedure nlmsvc_procedures4[24] = {</div><div class='ctx'> 		.pc_decode = nlm4svc_decode_void,</div><div class='ctx'> 		.pc_encode = nlm4svc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_void),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = 0,</div><div class='ctx'> 		.pc_name = "UNUSED",</div><div class='hunk'>@@ -691,6 +712,7 @@ const struct svc_procedure nlmsvc_procedures4[24] = {</div><div class='ctx'> 		.pc_decode = nlm4svc_decode_shareargs,</div><div class='ctx'> 		.pc_encode = nlm4svc_encode_shareres,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_args),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_args),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_res),</div><div class='ctx'> 		.pc_xdrressize = Ck+St+1,</div><div class='ctx'> 		.pc_name = "SHARE",</div><div class='hunk'>@@ -700,6 +722,7 @@ const struct svc_procedure nlmsvc_procedures4[24] = {</div><div class='ctx'> 		.pc_decode = nlm4svc_decode_shareargs,</div><div class='ctx'> 		.pc_encode = nlm4svc_encode_shareres,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_args),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_args),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_res),</div><div class='ctx'> 		.pc_xdrressize = Ck+St+1,</div><div class='ctx'> 		.pc_name = "UNSHARE",</div><div class='hunk'>@@ -709,6 +732,7 @@ const struct svc_procedure nlmsvc_procedures4[24] = {</div><div class='ctx'> 		.pc_decode = nlm4svc_decode_lockargs,</div><div class='ctx'> 		.pc_encode = nlm4svc_encode_res,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_args),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_args),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_res),</div><div class='ctx'> 		.pc_xdrressize = Ck+St,</div><div class='ctx'> 		.pc_name = "NM_LOCK",</div><div class='hunk'>@@ -718,6 +742,7 @@ const struct svc_procedure nlmsvc_procedures4[24] = {</div><div class='ctx'> 		.pc_decode = nlm4svc_decode_notify,</div><div class='ctx'> 		.pc_encode = nlm4svc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_args),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_args),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = St,</div><div class='ctx'> 		.pc_name = "FREE_ALL",</div><div class='head'>diff --git a/fs/lockd/svclock.c b/fs/lockd/svclock.c<br/>index e9b85d8fd5fe..3a3d05cfe09a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/lockd/svclock.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/svclock.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/lockd/svclock.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/lockd/svclock.c</a></div><div class='hunk'>@@ -30,8 +30,6 @@</div><div class='ctx'> #include &lt;linux/sunrpc/svc_xprt.h&gt;</div><div class='ctx'> #include &lt;linux/lockd/nlm.h&gt;</div><div class='ctx'> #include &lt;linux/lockd/lockd.h&gt;</div><div class='del'>-#include &lt;linux/kthread.h&gt;</div><div class='del'>-#include &lt;linux/exportfs.h&gt;</div><div class='ctx'> </div><div class='ctx'> #define NLMDBG_FACILITY		NLMDBG_SVCLOCK</div><div class='ctx'> </div><div class='hunk'>@@ -131,12 +129,14 @@ static void nlmsvc_insert_block(struct nlm_block *block, unsigned long when)</div><div class='ctx'> static inline void</div><div class='ctx'> nlmsvc_remove_block(struct nlm_block *block)</div><div class='ctx'> {</div><div class='add'>+	spin_lock(&amp;nlm_blocked_lock);</div><div class='ctx'> 	if (!list_empty(&amp;block-&gt;b_list)) {</div><div class='del'>-		spin_lock(&amp;nlm_blocked_lock);</div><div class='ctx'> 		list_del_init(&amp;block-&gt;b_list);</div><div class='ctx'> 		spin_unlock(&amp;nlm_blocked_lock);</div><div class='ctx'> 		nlmsvc_release_block(block);</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='add'>+	spin_unlock(&amp;nlm_blocked_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -149,21 +149,25 @@ nlmsvc_lookup_block(struct nlm_file *file, struct nlm_lock *lock)</div><div class='ctx'> 	struct file_lock	*fl;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("lockd: nlmsvc_lookup_block f=%p pd=%d %Ld-%Ld ty=%d\n",</div><div class='del'>-				file, lock-&gt;fl.fl_pid,</div><div class='add'>+				file, lock-&gt;fl.c.flc_pid,</div><div class='ctx'> 				(long long)lock-&gt;fl.fl_start,</div><div class='del'>-				(long long)lock-&gt;fl.fl_end, lock-&gt;fl.fl_type);</div><div class='add'>+				(long long)lock-&gt;fl.fl_end,</div><div class='add'>+				lock-&gt;fl.c.flc_type);</div><div class='add'>+	spin_lock(&amp;nlm_blocked_lock);</div><div class='ctx'> 	list_for_each_entry(block, &amp;nlm_blocked, b_list) {</div><div class='ctx'> 		fl = &amp;block-&gt;b_call-&gt;a_args.lock.fl;</div><div class='ctx'> 		dprintk("lockd: check f=%p pd=%d %Ld-%Ld ty=%d cookie=%s\n",</div><div class='del'>-				block-&gt;b_file, fl-&gt;fl_pid,</div><div class='add'>+				block-&gt;b_file, fl-&gt;c.flc_pid,</div><div class='ctx'> 				(long long)fl-&gt;fl_start,</div><div class='del'>-				(long long)fl-&gt;fl_end, fl-&gt;fl_type,</div><div class='add'>+				(long long)fl-&gt;fl_end, fl-&gt;c.flc_type,</div><div class='ctx'> 				nlmdbg_cookie2a(&amp;block-&gt;b_call-&gt;a_args.cookie));</div><div class='ctx'> 		if (block-&gt;b_file == file &amp;&amp; nlm_compare_locks(fl, &amp;lock-&gt;fl)) {</div><div class='ctx'> 			kref_get(&amp;block-&gt;b_count);</div><div class='add'>+			spin_unlock(&amp;nlm_blocked_lock);</div><div class='ctx'> 			return block;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='add'>+	spin_unlock(&amp;nlm_blocked_lock);</div><div class='ctx'> </div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='hunk'>@@ -185,16 +189,19 @@ nlmsvc_find_block(struct nlm_cookie *cookie)</div><div class='ctx'> {</div><div class='ctx'> 	struct nlm_block *block;</div><div class='ctx'> </div><div class='add'>+	spin_lock(&amp;nlm_blocked_lock);</div><div class='ctx'> 	list_for_each_entry(block, &amp;nlm_blocked, b_list) {</div><div class='ctx'> 		if (nlm_cookie_match(&amp;block-&gt;b_call-&gt;a_args.cookie,cookie))</div><div class='ctx'> 			goto found;</div><div class='ctx'> 	}</div><div class='add'>+	spin_unlock(&amp;nlm_blocked_lock);</div><div class='ctx'> </div><div class='ctx'> 	return NULL;</div><div class='ctx'> </div><div class='ctx'> found:</div><div class='ctx'> 	dprintk("nlmsvc_find_block(%s): block=%p\n", nlmdbg_cookie2a(cookie), block);</div><div class='ctx'> 	kref_get(&amp;block-&gt;b_count);</div><div class='add'>+	spin_unlock(&amp;nlm_blocked_lock);</div><div class='ctx'> 	return block;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -237,7 +244,7 @@ nlmsvc_create_block(struct svc_rqst *rqstp, struct nlm_host *host,</div><div class='ctx'> 		goto failed_free;</div><div class='ctx'> </div><div class='ctx'> 	/* Set notifier function for VFS, and init args */</div><div class='del'>-	call-&gt;a_args.lock.fl.fl_flags |= FL_SLEEP;</div><div class='add'>+	call-&gt;a_args.lock.fl.c.flc_flags |= FL_SLEEP;</div><div class='ctx'> 	call-&gt;a_args.lock.fl.fl_lmops = &amp;nlmsvc_lock_operations;</div><div class='ctx'> 	nlmclnt_next_cookie(&amp;call-&gt;a_args.cookie);</div><div class='ctx'> </div><div class='hunk'>@@ -317,6 +324,7 @@ void nlmsvc_traverse_blocks(struct nlm_host *host,</div><div class='ctx'> </div><div class='ctx'> restart:</div><div class='ctx'> 	mutex_lock(&amp;file-&gt;f_mutex);</div><div class='add'>+	spin_lock(&amp;nlm_blocked_lock);</div><div class='ctx'> 	list_for_each_entry_safe(block, next, &amp;file-&gt;f_blocks, b_flist) {</div><div class='ctx'> 		if (!match(block-&gt;b_host, host))</div><div class='ctx'> 			continue;</div><div class='hunk'>@@ -325,11 +333,13 @@ restart:</div><div class='ctx'> 		if (list_empty(&amp;block-&gt;b_list))</div><div class='ctx'> 			continue;</div><div class='ctx'> 		kref_get(&amp;block-&gt;b_count);</div><div class='add'>+		spin_unlock(&amp;nlm_blocked_lock);</div><div class='ctx'> 		mutex_unlock(&amp;file-&gt;f_mutex);</div><div class='ctx'> 		nlmsvc_unlink_block(block);</div><div class='ctx'> 		nlmsvc_release_block(block);</div><div class='ctx'> 		goto restart;</div><div class='ctx'> 	}</div><div class='add'>+	spin_unlock(&amp;nlm_blocked_lock);</div><div class='ctx'> 	mutex_unlock(&amp;file-&gt;f_mutex);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -340,7 +350,7 @@ nlmsvc_get_lockowner(struct nlm_lockowner *lockowner)</div><div class='ctx'> 	return lockowner;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void nlmsvc_put_lockowner(struct nlm_lockowner *lockowner)</div><div class='add'>+void nlmsvc_put_lockowner(struct nlm_lockowner *lockowner)</div><div class='ctx'> {</div><div class='ctx'> 	if (!refcount_dec_and_lock(&amp;lockowner-&gt;count, &amp;lockowner-&gt;host-&gt;h_lock))</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -392,14 +402,14 @@ static struct nlm_lockowner *nlmsvc_find_lockowner(struct nlm_host *host, pid_t</div><div class='ctx'> void</div><div class='ctx'> nlmsvc_release_lockowner(struct nlm_lock *lock)</div><div class='ctx'> {</div><div class='del'>-	if (lock-&gt;fl.fl_owner)</div><div class='del'>-		nlmsvc_put_lockowner(lock-&gt;fl.fl_owner);</div><div class='add'>+	if (lock-&gt;fl.c.flc_owner)</div><div class='add'>+		nlmsvc_put_lockowner(lock-&gt;fl.c.flc_owner);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void nlmsvc_locks_init_private(struct file_lock *fl, struct nlm_host *host,</div><div class='ctx'> 						pid_t pid)</div><div class='ctx'> {</div><div class='del'>-	fl-&gt;fl_owner = nlmsvc_find_lockowner(host, pid);</div><div class='add'>+	fl-&gt;c.flc_owner = nlmsvc_find_lockowner(host, pid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -415,7 +425,7 @@ static int nlmsvc_setgrantargs(struct nlm_rqst *call, struct nlm_lock *lock)</div><div class='ctx'> </div><div class='ctx'> 	/* set default data area */</div><div class='ctx'> 	call-&gt;a_args.lock.oh.data = call-&gt;a_owner;</div><div class='del'>-	call-&gt;a_args.lock.svid = ((struct nlm_lockowner *)lock-&gt;fl.fl_owner)-&gt;pid;</div><div class='add'>+	call-&gt;a_args.lock.svid = ((struct nlm_lockowner *) lock-&gt;fl.c.flc_owner)-&gt;pid;</div><div class='ctx'> </div><div class='ctx'> 	if (lock-&gt;oh.len &gt; NLMCLNT_OHSIZE) {</div><div class='ctx'> 		void *data = kmalloc(lock-&gt;oh.len, GFP_KERNEL);</div><div class='hunk'>@@ -470,8 +480,8 @@ nlmsvc_lock(struct svc_rqst *rqstp, struct nlm_file *file,</div><div class='ctx'> 	    struct nlm_host *host, struct nlm_lock *lock, int wait,</div><div class='ctx'> 	    struct nlm_cookie *cookie, int reclaim)</div><div class='ctx'> {</div><div class='add'>+	struct inode		*inode __maybe_unused = nlmsvc_file_inode(file);</div><div class='ctx'> 	struct nlm_block	*block = NULL;</div><div class='del'>-	struct inode		*inode = nlmsvc_file_inode(file);</div><div class='ctx'> 	int			error;</div><div class='ctx'> 	int			mode;</div><div class='ctx'> 	int			async_block = 0;</div><div class='hunk'>@@ -479,12 +489,16 @@ nlmsvc_lock(struct svc_rqst *rqstp, struct nlm_file *file,</div><div class='ctx'> </div><div class='ctx'> 	dprintk("lockd: nlmsvc_lock(%s/%ld, ty=%d, pi=%d, %Ld-%Ld, bl=%d)\n",</div><div class='ctx'> 				inode-&gt;i_sb-&gt;s_id, inode-&gt;i_ino,</div><div class='del'>-				lock-&gt;fl.fl_type, lock-&gt;fl.fl_pid,</div><div class='add'>+				lock-&gt;fl.c.flc_type,</div><div class='add'>+				lock-&gt;fl.c.flc_pid,</div><div class='ctx'> 				(long long)lock-&gt;fl.fl_start,</div><div class='ctx'> 				(long long)lock-&gt;fl.fl_end,</div><div class='ctx'> 				wait);</div><div class='ctx'> </div><div class='del'>-	if (inode-&gt;i_sb-&gt;s_export_op-&gt;flags &amp; EXPORT_OP_SYNC_LOCKS) {</div><div class='add'>+	if (nlmsvc_file_cannot_lock(file))</div><div class='add'>+		return nlm_lck_denied_nolocks;</div><div class='add'>+</div><div class='add'>+	if (!locks_can_async_lock(nlmsvc_file_file(file)-&gt;f_op)) {</div><div class='ctx'> 		async_block = wait;</div><div class='ctx'> 		wait = 0;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -502,7 +516,7 @@ nlmsvc_lock(struct svc_rqst *rqstp, struct nlm_file *file,</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		lock = &amp;block-&gt;b_call-&gt;a_args.lock;</div><div class='ctx'> 	} else</div><div class='del'>-		lock-&gt;fl.fl_flags &amp;= ~FL_SLEEP;</div><div class='add'>+		lock-&gt;fl.c.flc_flags &amp;= ~FL_SLEEP;</div><div class='ctx'> </div><div class='ctx'> 	if (block-&gt;b_flags &amp; B_QUEUED) {</div><div class='ctx'> 		dprintk("lockd: nlmsvc_lock deferred block %p flags %d\n",</div><div class='hunk'>@@ -530,25 +544,40 @@ nlmsvc_lock(struct svc_rqst *rqstp, struct nlm_file *file,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	spin_lock(&amp;nlm_blocked_lock);</div><div class='add'>+	/*</div><div class='add'>+	 * If this is a lock request for an already pending</div><div class='add'>+	 * lock request we return nlm_lck_blocked without calling</div><div class='add'>+	 * vfs_lock_file() again. Otherwise we have two pending</div><div class='add'>+	 * requests on the underlaying -&gt;lock() implementation but</div><div class='add'>+	 * only one nlm_block to being granted by lm_grant().</div><div class='add'>+	 */</div><div class='add'>+	if (locks_can_async_lock(nlmsvc_file_file(file)-&gt;f_op) &amp;&amp;</div><div class='add'>+	    !list_empty(&amp;block-&gt;b_list)) {</div><div class='add'>+		spin_unlock(&amp;nlm_blocked_lock);</div><div class='add'>+		ret = nlm_lck_blocked;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Append to list of blocked */</div><div class='add'>+	nlmsvc_insert_block_locked(block, NLM_NEVER);</div><div class='add'>+	spin_unlock(&amp;nlm_blocked_lock);</div><div class='add'>+</div><div class='ctx'> 	if (!wait)</div><div class='del'>-		lock-&gt;fl.fl_flags &amp;= ~FL_SLEEP;</div><div class='add'>+		lock-&gt;fl.c.flc_flags &amp;= ~FL_SLEEP;</div><div class='ctx'> 	mode = lock_to_openmode(&amp;lock-&gt;fl);</div><div class='ctx'> 	error = vfs_lock_file(file-&gt;f_file[mode], F_SETLK, &amp;lock-&gt;fl, NULL);</div><div class='del'>-	lock-&gt;fl.fl_flags &amp;= ~FL_SLEEP;</div><div class='add'>+	lock-&gt;fl.c.flc_flags &amp;= ~FL_SLEEP;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("lockd: vfs_lock_file returned %d\n", error);</div><div class='ctx'> 	switch (error) {</div><div class='ctx'> 		case 0:</div><div class='add'>+			nlmsvc_remove_block(block);</div><div class='ctx'> 			ret = nlm_granted;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		case -EAGAIN:</div><div class='del'>-			/*</div><div class='del'>-			 * If this is a blocking request for an</div><div class='del'>-			 * already pending lock request then we need</div><div class='del'>-			 * to put it back on lockd's block list</div><div class='del'>-			 */</div><div class='del'>-			if (wait)</div><div class='del'>-				break;</div><div class='add'>+			if (!wait)</div><div class='add'>+				nlmsvc_remove_block(block);</div><div class='ctx'> 			ret = async_block ? nlm_lck_blocked : nlm_lck_denied;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		case FILE_LOCK_DEFERRED:</div><div class='hunk'>@@ -559,17 +588,16 @@ nlmsvc_lock(struct svc_rqst *rqstp, struct nlm_file *file,</div><div class='ctx'> 			ret = nlmsvc_defer_lock_rqst(rqstp, block);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		case -EDEADLK:</div><div class='add'>+			nlmsvc_remove_block(block);</div><div class='ctx'> 			ret = nlm_deadlock;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		default:			/* includes ENOLCK */</div><div class='add'>+			nlmsvc_remove_block(block);</div><div class='ctx'> 			ret = nlm_lck_denied_nolocks;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = nlm_lck_blocked;</div><div class='del'>-</div><div class='del'>-	/* Append to list of blocked */</div><div class='del'>-	nlmsvc_insert_block(block, NLM_NEVER);</div><div class='ctx'> out:</div><div class='ctx'> 	mutex_unlock(&amp;file-&gt;f_mutex);</div><div class='ctx'> 	nlmsvc_release_block(block);</div><div class='hunk'>@@ -583,28 +611,27 @@ out:</div><div class='ctx'> __be32</div><div class='ctx'> nlmsvc_testlock(struct svc_rqst *rqstp, struct nlm_file *file,</div><div class='ctx'> 		struct nlm_host *host, struct nlm_lock *lock,</div><div class='del'>-		struct nlm_lock *conflock, struct nlm_cookie *cookie)</div><div class='add'>+		struct nlm_lock *conflock)</div><div class='ctx'> {</div><div class='ctx'> 	int			error;</div><div class='ctx'> 	int			mode;</div><div class='ctx'> 	__be32			ret;</div><div class='del'>-	struct nlm_lockowner	*test_owner;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("lockd: nlmsvc_testlock(%s/%ld, ty=%d, %Ld-%Ld)\n",</div><div class='ctx'> 				nlmsvc_file_inode(file)-&gt;i_sb-&gt;s_id,</div><div class='ctx'> 				nlmsvc_file_inode(file)-&gt;i_ino,</div><div class='del'>-				lock-&gt;fl.fl_type,</div><div class='add'>+				lock-&gt;fl.c.flc_type,</div><div class='ctx'> 				(long long)lock-&gt;fl.fl_start,</div><div class='ctx'> 				(long long)lock-&gt;fl.fl_end);</div><div class='ctx'> </div><div class='add'>+	if (nlmsvc_file_cannot_lock(file))</div><div class='add'>+		return nlm_lck_denied_nolocks;</div><div class='add'>+</div><div class='ctx'> 	if (locks_in_grace(SVC_NET(rqstp))) {</div><div class='ctx'> 		ret = nlm_lck_denied_grace_period;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* If there's a conflicting lock, remember to clean up the test lock */</div><div class='del'>-	test_owner = (struct nlm_lockowner *)lock-&gt;fl.fl_owner;</div><div class='del'>-</div><div class='ctx'> 	mode = lock_to_openmode(&amp;lock-&gt;fl);</div><div class='ctx'> 	error = vfs_test_lock(file-&gt;f_file[mode], &amp;lock-&gt;fl);</div><div class='ctx'> 	if (error) {</div><div class='hunk'>@@ -616,27 +643,23 @@ nlmsvc_testlock(struct svc_rqst *rqstp, struct nlm_file *file,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (lock-&gt;fl.fl_type == F_UNLCK) {</div><div class='add'>+	if (lock-&gt;fl.c.flc_type == F_UNLCK) {</div><div class='ctx'> 		ret = nlm_granted;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	dprintk("lockd: conflicting lock(ty=%d, %Ld-%Ld)\n",</div><div class='del'>-		lock-&gt;fl.fl_type, (long long)lock-&gt;fl.fl_start,</div><div class='add'>+		lock-&gt;fl.c.flc_type, (long long)lock-&gt;fl.fl_start,</div><div class='ctx'> 		(long long)lock-&gt;fl.fl_end);</div><div class='ctx'> 	conflock-&gt;caller = "somehost";	/* FIXME */</div><div class='ctx'> 	conflock-&gt;len = strlen(conflock-&gt;caller);</div><div class='ctx'> 	conflock-&gt;oh.len = 0;		/* don't return OH info */</div><div class='del'>-	conflock-&gt;svid = lock-&gt;fl.fl_pid;</div><div class='del'>-	conflock-&gt;fl.fl_type = lock-&gt;fl.fl_type;</div><div class='add'>+	conflock-&gt;svid = lock-&gt;fl.c.flc_pid;</div><div class='add'>+	conflock-&gt;fl.c.flc_type = lock-&gt;fl.c.flc_type;</div><div class='ctx'> 	conflock-&gt;fl.fl_start = lock-&gt;fl.fl_start;</div><div class='ctx'> 	conflock-&gt;fl.fl_end = lock-&gt;fl.fl_end;</div><div class='ctx'> 	locks_release_private(&amp;lock-&gt;fl);</div><div class='ctx'> </div><div class='del'>-	/* Clean up the test lock */</div><div class='del'>-	lock-&gt;fl.fl_owner = NULL;</div><div class='del'>-	nlmsvc_put_lockowner(test_owner);</div><div class='del'>-</div><div class='ctx'> 	ret = nlm_lck_denied;</div><div class='ctx'> out:</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -657,19 +680,24 @@ nlmsvc_unlock(struct net *net, struct nlm_file *file, struct nlm_lock *lock)</div><div class='ctx'> 	dprintk("lockd: nlmsvc_unlock(%s/%ld, pi=%d, %Ld-%Ld)\n",</div><div class='ctx'> 				nlmsvc_file_inode(file)-&gt;i_sb-&gt;s_id,</div><div class='ctx'> 				nlmsvc_file_inode(file)-&gt;i_ino,</div><div class='del'>-				lock-&gt;fl.fl_pid,</div><div class='add'>+				lock-&gt;fl.c.flc_pid,</div><div class='ctx'> 				(long long)lock-&gt;fl.fl_start,</div><div class='ctx'> 				(long long)lock-&gt;fl.fl_end);</div><div class='ctx'> </div><div class='add'>+	if (nlmsvc_file_cannot_lock(file))</div><div class='add'>+		return nlm_lck_denied_nolocks;</div><div class='add'>+</div><div class='ctx'> 	/* First, cancel any lock that might be there */</div><div class='ctx'> 	nlmsvc_cancel_blocked(net, file, lock);</div><div class='ctx'> </div><div class='del'>-	lock-&gt;fl.fl_type = F_UNLCK;</div><div class='del'>-	if (file-&gt;f_file[O_RDONLY])</div><div class='del'>-		error = vfs_lock_file(file-&gt;f_file[O_RDONLY], F_SETLK,</div><div class='add'>+	lock-&gt;fl.c.flc_type = F_UNLCK;</div><div class='add'>+	lock-&gt;fl.c.flc_file = file-&gt;f_file[O_RDONLY];</div><div class='add'>+	if (lock-&gt;fl.c.flc_file)</div><div class='add'>+		error = vfs_lock_file(lock-&gt;fl.c.flc_file, F_SETLK,</div><div class='ctx'> 					&amp;lock-&gt;fl, NULL);</div><div class='del'>-	if (file-&gt;f_file[O_WRONLY])</div><div class='del'>-		error = vfs_lock_file(file-&gt;f_file[O_WRONLY], F_SETLK,</div><div class='add'>+	lock-&gt;fl.c.flc_file = file-&gt;f_file[O_WRONLY];</div><div class='add'>+	if (lock-&gt;fl.c.flc_file)</div><div class='add'>+		error |= vfs_lock_file(lock-&gt;fl.c.flc_file, F_SETLK,</div><div class='ctx'> 					&amp;lock-&gt;fl, NULL);</div><div class='ctx'> </div><div class='ctx'> 	return (error &lt; 0)? nlm_lck_denied_nolocks : nlm_granted;</div><div class='hunk'>@@ -692,10 +720,13 @@ nlmsvc_cancel_blocked(struct net *net, struct nlm_file *file, struct nlm_lock *l</div><div class='ctx'> 	dprintk("lockd: nlmsvc_cancel(%s/%ld, pi=%d, %Ld-%Ld)\n",</div><div class='ctx'> 				nlmsvc_file_inode(file)-&gt;i_sb-&gt;s_id,</div><div class='ctx'> 				nlmsvc_file_inode(file)-&gt;i_ino,</div><div class='del'>-				lock-&gt;fl.fl_pid,</div><div class='add'>+				lock-&gt;fl.c.flc_pid,</div><div class='ctx'> 				(long long)lock-&gt;fl.fl_start,</div><div class='ctx'> 				(long long)lock-&gt;fl.fl_end);</div><div class='ctx'> </div><div class='add'>+	if (nlmsvc_file_cannot_lock(file))</div><div class='add'>+		return nlm_lck_denied_nolocks;</div><div class='add'>+</div><div class='ctx'> 	if (locks_in_grace(net))</div><div class='ctx'> 		return nlm_lck_denied_grace_period;</div><div class='ctx'> </div><div class='hunk'>@@ -703,9 +734,10 @@ nlmsvc_cancel_blocked(struct net *net, struct nlm_file *file, struct nlm_lock *l</div><div class='ctx'> 	block = nlmsvc_lookup_block(file, lock);</div><div class='ctx'> 	mutex_unlock(&amp;file-&gt;f_mutex);</div><div class='ctx'> 	if (block != NULL) {</div><div class='del'>-		mode = lock_to_openmode(&amp;lock-&gt;fl);</div><div class='del'>-		vfs_cancel_lock(block-&gt;b_file-&gt;f_file[mode],</div><div class='del'>-				&amp;block-&gt;b_call-&gt;a_args.lock.fl);</div><div class='add'>+		struct file_lock *fl = &amp;block-&gt;b_call-&gt;a_args.lock.fl;</div><div class='add'>+</div><div class='add'>+		mode = lock_to_openmode(fl);</div><div class='add'>+		vfs_cancel_lock(block-&gt;b_file-&gt;f_file[mode], fl);</div><div class='ctx'> 		status = nlmsvc_unlink_block(block);</div><div class='ctx'> 		nlmsvc_release_block(block);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -844,12 +876,12 @@ nlmsvc_grant_blocked(struct nlm_block *block)</div><div class='ctx'> 	/* vfs_lock_file() can mangle fl_start and fl_end, but we need</div><div class='ctx'> 	 * them unchanged for the GRANT_MSG</div><div class='ctx'> 	 */</div><div class='del'>-	lock-&gt;fl.fl_flags |= FL_SLEEP;</div><div class='add'>+	lock-&gt;fl.c.flc_flags |= FL_SLEEP;</div><div class='ctx'> 	fl_start = lock-&gt;fl.fl_start;</div><div class='ctx'> 	fl_end = lock-&gt;fl.fl_end;</div><div class='ctx'> 	mode = lock_to_openmode(&amp;lock-&gt;fl);</div><div class='ctx'> 	error = vfs_lock_file(file-&gt;f_file[mode], F_SETLK, &amp;lock-&gt;fl, NULL);</div><div class='del'>-	lock-&gt;fl.fl_flags &amp;= ~FL_SLEEP;</div><div class='add'>+	lock-&gt;fl.c.flc_flags &amp;= ~FL_SLEEP;</div><div class='ctx'> 	lock-&gt;fl.fl_start = fl_start;</div><div class='ctx'> 	lock-&gt;fl.fl_end = fl_end;</div><div class='ctx'> </div><div class='hunk'>@@ -957,19 +989,32 @@ void</div><div class='ctx'> nlmsvc_grant_reply(struct nlm_cookie *cookie, __be32 status)</div><div class='ctx'> {</div><div class='ctx'> 	struct nlm_block	*block;</div><div class='add'>+	struct file_lock	*fl;</div><div class='add'>+	int			error;</div><div class='ctx'> </div><div class='del'>-	dprintk("grant_reply: looking for cookie %x, s=%d \n",</div><div class='add'>+	dprintk("grant_reply: looking for cookie %x, s=%d\n",</div><div class='ctx'> 		*(unsigned int *)(cookie-&gt;data), status);</div><div class='ctx'> 	if (!(block = nlmsvc_find_block(cookie)))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	if (status == nlm_lck_denied_grace_period) {</div><div class='add'>+	switch (status) {</div><div class='add'>+	case nlm_lck_denied_grace_period:</div><div class='ctx'> 		/* Try again in a couple of seconds */</div><div class='ctx'> 		nlmsvc_insert_block(block, 10 * HZ);</div><div class='del'>-	} else {</div><div class='add'>+		break;</div><div class='add'>+	case nlm_lck_denied:</div><div class='add'>+		/* Client doesn't want it, just unlock it */</div><div class='add'>+		nlmsvc_unlink_block(block);</div><div class='add'>+		fl = &amp;block-&gt;b_call-&gt;a_args.lock.fl;</div><div class='add'>+		fl-&gt;c.flc_type = F_UNLCK;</div><div class='add'>+		error = vfs_lock_file(fl-&gt;c.flc_file, F_SETLK, fl, NULL);</div><div class='add'>+		if (error)</div><div class='add'>+			pr_warn("lockd: unable to unlock lock rejected by client!\n");</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='ctx'> 		/*</div><div class='del'>-		 * Lock is now held by client, or has been rejected.</div><div class='del'>-		 * In both cases, the block should be removed.</div><div class='add'>+		 * Either it was accepted or the status makes no sense</div><div class='add'>+		 * just unlink it either way.</div><div class='ctx'> 		 */</div><div class='ctx'> 		nlmsvc_unlink_block(block);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -998,14 +1043,14 @@ retry_deferred_block(struct nlm_block *block)</div><div class='ctx'>  * picks up locks that can be granted, or grant notifications that must</div><div class='ctx'>  * be retransmitted.</div><div class='ctx'>  */</div><div class='del'>-unsigned long</div><div class='del'>-nlmsvc_retry_blocked(void)</div><div class='add'>+void</div><div class='add'>+nlmsvc_retry_blocked(struct svc_rqst *rqstp)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned long	timeout = MAX_SCHEDULE_TIMEOUT;</div><div class='ctx'> 	struct nlm_block *block;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;nlm_blocked_lock);</div><div class='del'>-	while (!list_empty(&amp;nlm_blocked) &amp;&amp; !kthread_should_stop()) {</div><div class='add'>+	while (!list_empty(&amp;nlm_blocked) &amp;&amp; !svc_thread_should_stop(rqstp)) {</div><div class='ctx'> 		block = list_entry(nlm_blocked.next, struct nlm_block, b_list);</div><div class='ctx'> </div><div class='ctx'> 		if (block-&gt;b_when == NLM_NEVER)</div><div class='hunk'>@@ -1028,5 +1073,6 @@ nlmsvc_retry_blocked(void)</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;nlm_blocked_lock);</div><div class='ctx'> </div><div class='del'>-	return timeout;</div><div class='add'>+	if (timeout &lt; MAX_SCHEDULE_TIMEOUT)</div><div class='add'>+		mod_timer(&amp;nlmsvc_retry, jiffies + timeout);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/lockd/svcproc.c b/fs/lockd/svcproc.c<br/>index 4dc1b40a489a..f53d5177f267 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/lockd/svcproc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/svcproc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/lockd/svcproc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/lockd/svcproc.c</a></div><div class='hunk'>@@ -77,11 +77,12 @@ nlmsvc_retrieve_args(struct svc_rqst *rqstp, struct nlm_args *argp,</div><div class='ctx'> </div><div class='ctx'> 		/* Set up the missing parts of the file_lock structure */</div><div class='ctx'> 		mode = lock_to_openmode(&amp;lock-&gt;fl);</div><div class='del'>-		lock-&gt;fl.fl_file  = file-&gt;f_file[mode];</div><div class='del'>-		lock-&gt;fl.fl_pid = current-&gt;tgid;</div><div class='add'>+		lock-&gt;fl.c.flc_flags = FL_POSIX;</div><div class='add'>+		lock-&gt;fl.c.flc_file  = file-&gt;f_file[mode];</div><div class='add'>+		lock-&gt;fl.c.flc_pid = current-&gt;tgid;</div><div class='ctx'> 		lock-&gt;fl.fl_lmops = &amp;nlmsvc_lock_operations;</div><div class='ctx'> 		nlmsvc_locks_init_private(&amp;lock-&gt;fl, host, (pid_t)lock-&gt;svid);</div><div class='del'>-		if (!lock-&gt;fl.fl_owner) {</div><div class='add'>+		if (!lock-&gt;fl.c.flc_owner) {</div><div class='ctx'> 			/* lockowner allocation has failed */</div><div class='ctx'> 			nlmsvc_release_host(host);</div><div class='ctx'> 			return nlm_lck_denied_nolocks;</div><div class='hunk'>@@ -116,6 +117,7 @@ __nlmsvc_proc_test(struct svc_rqst *rqstp, struct nlm_res *resp)</div><div class='ctx'> 	struct nlm_args *argp = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nlm_host	*host;</div><div class='ctx'> 	struct nlm_file	*file;</div><div class='add'>+	struct nlm_lockowner *test_owner;</div><div class='ctx'> 	__be32 rc = rpc_success;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("lockd: TEST          called\n");</div><div class='hunk'>@@ -125,15 +127,18 @@ __nlmsvc_proc_test(struct svc_rqst *rqstp, struct nlm_res *resp)</div><div class='ctx'> 	if ((resp-&gt;status = nlmsvc_retrieve_args(rqstp, argp, &amp;host, &amp;file)))</div><div class='ctx'> 		return resp-&gt;status == nlm_drop_reply ? rpc_drop_reply :rpc_success;</div><div class='ctx'> </div><div class='add'>+	test_owner = argp-&gt;lock.fl.c.flc_owner;</div><div class='add'>+</div><div class='ctx'> 	/* Now check for conflicting locks */</div><div class='del'>-	resp-&gt;status = cast_status(nlmsvc_testlock(rqstp, file, host, &amp;argp-&gt;lock, &amp;resp-&gt;lock, &amp;resp-&gt;cookie));</div><div class='add'>+	resp-&gt;status = cast_status(nlmsvc_testlock(rqstp, file, host,</div><div class='add'>+						   &amp;argp-&gt;lock, &amp;resp-&gt;lock));</div><div class='ctx'> 	if (resp-&gt;status == nlm_drop_reply)</div><div class='ctx'> 		rc = rpc_drop_reply;</div><div class='ctx'> 	else</div><div class='ctx'> 		dprintk("lockd: TEST          status %d vers %d\n",</div><div class='ctx'> 			ntohl(resp-&gt;status), rqstp-&gt;rq_vers);</div><div class='ctx'> </div><div class='del'>-	nlmsvc_release_lockowner(&amp;argp-&gt;lock);</div><div class='add'>+	nlmsvc_put_lockowner(test_owner);</div><div class='ctx'> 	nlmsvc_release_host(host);</div><div class='ctx'> 	nlm_release_file(file);</div><div class='ctx'> 	return rc;</div><div class='hunk'>@@ -161,18 +166,6 @@ __nlmsvc_proc_lock(struct svc_rqst *rqstp, struct nlm_res *resp)</div><div class='ctx'> 	if ((resp-&gt;status = nlmsvc_retrieve_args(rqstp, argp, &amp;host, &amp;file)))</div><div class='ctx'> 		return resp-&gt;status == nlm_drop_reply ? rpc_drop_reply :rpc_success;</div><div class='ctx'> </div><div class='del'>-#if 0</div><div class='del'>-	/* If supplied state doesn't match current state, we assume it's</div><div class='del'>-	 * an old request that time-warped somehow. Any error return would</div><div class='del'>-	 * do in this case because it's irrelevant anyway.</div><div class='del'>-	 *</div><div class='del'>-	 * NB: We don't retrieve the remote host's state yet.</div><div class='del'>-	 */</div><div class='del'>-	if (host-&gt;h_nsmstate &amp;&amp; host-&gt;h_nsmstate != argp-&gt;state) {</div><div class='del'>-		resp-&gt;status = nlm_lck_denied_nolocks;</div><div class='del'>-	} else</div><div class='del'>-#endif</div><div class='del'>-</div><div class='ctx'> 	/* Now try to lock the file */</div><div class='ctx'> 	resp-&gt;status = cast_status(nlmsvc_lock(rqstp, file, host, &amp;argp-&gt;lock,</div><div class='ctx'> 					       argp-&gt;block, &amp;argp-&gt;cookie,</div><div class='hunk'>@@ -552,6 +545,7 @@ const struct svc_procedure nlmsvc_procedures[24] = {</div><div class='ctx'> 		.pc_decode = nlmsvc_decode_void,</div><div class='ctx'> 		.pc_encode = nlmsvc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_void),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = St,</div><div class='ctx'> 		.pc_name = "NULL",</div><div class='hunk'>@@ -561,6 +555,7 @@ const struct svc_procedure nlmsvc_procedures[24] = {</div><div class='ctx'> 		.pc_decode = nlmsvc_decode_testargs,</div><div class='ctx'> 		.pc_encode = nlmsvc_encode_testres,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_args),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_args),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_res),</div><div class='ctx'> 		.pc_xdrressize = Ck+St+2+No+Rg,</div><div class='ctx'> 		.pc_name = "TEST",</div><div class='hunk'>@@ -570,6 +565,7 @@ const struct svc_procedure nlmsvc_procedures[24] = {</div><div class='ctx'> 		.pc_decode = nlmsvc_decode_lockargs,</div><div class='ctx'> 		.pc_encode = nlmsvc_encode_res,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_args),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_args),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_res),</div><div class='ctx'> 		.pc_xdrressize = Ck+St,</div><div class='ctx'> 		.pc_name = "LOCK",</div><div class='hunk'>@@ -579,6 +575,7 @@ const struct svc_procedure nlmsvc_procedures[24] = {</div><div class='ctx'> 		.pc_decode = nlmsvc_decode_cancargs,</div><div class='ctx'> 		.pc_encode = nlmsvc_encode_res,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_args),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_args),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_res),</div><div class='ctx'> 		.pc_xdrressize = Ck+St,</div><div class='ctx'> 		.pc_name = "CANCEL",</div><div class='hunk'>@@ -588,6 +585,7 @@ const struct svc_procedure nlmsvc_procedures[24] = {</div><div class='ctx'> 		.pc_decode = nlmsvc_decode_unlockargs,</div><div class='ctx'> 		.pc_encode = nlmsvc_encode_res,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_args),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_args),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_res),</div><div class='ctx'> 		.pc_xdrressize = Ck+St,</div><div class='ctx'> 		.pc_name = "UNLOCK",</div><div class='hunk'>@@ -597,6 +595,7 @@ const struct svc_procedure nlmsvc_procedures[24] = {</div><div class='ctx'> 		.pc_decode = nlmsvc_decode_testargs,</div><div class='ctx'> 		.pc_encode = nlmsvc_encode_res,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_args),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_args),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_res),</div><div class='ctx'> 		.pc_xdrressize = Ck+St,</div><div class='ctx'> 		.pc_name = "GRANTED",</div><div class='hunk'>@@ -606,6 +605,7 @@ const struct svc_procedure nlmsvc_procedures[24] = {</div><div class='ctx'> 		.pc_decode = nlmsvc_decode_testargs,</div><div class='ctx'> 		.pc_encode = nlmsvc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_args),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_args),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = St,</div><div class='ctx'> 		.pc_name = "TEST_MSG",</div><div class='hunk'>@@ -615,6 +615,7 @@ const struct svc_procedure nlmsvc_procedures[24] = {</div><div class='ctx'> 		.pc_decode = nlmsvc_decode_lockargs,</div><div class='ctx'> 		.pc_encode = nlmsvc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_args),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_args),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = St,</div><div class='ctx'> 		.pc_name = "LOCK_MSG",</div><div class='hunk'>@@ -624,6 +625,7 @@ const struct svc_procedure nlmsvc_procedures[24] = {</div><div class='ctx'> 		.pc_decode = nlmsvc_decode_cancargs,</div><div class='ctx'> 		.pc_encode = nlmsvc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_args),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_args),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = St,</div><div class='ctx'> 		.pc_name = "CANCEL_MSG",</div><div class='hunk'>@@ -633,6 +635,7 @@ const struct svc_procedure nlmsvc_procedures[24] = {</div><div class='ctx'> 		.pc_decode = nlmsvc_decode_unlockargs,</div><div class='ctx'> 		.pc_encode = nlmsvc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_args),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_args),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = St,</div><div class='ctx'> 		.pc_name = "UNLOCK_MSG",</div><div class='hunk'>@@ -642,6 +645,7 @@ const struct svc_procedure nlmsvc_procedures[24] = {</div><div class='ctx'> 		.pc_decode = nlmsvc_decode_testargs,</div><div class='ctx'> 		.pc_encode = nlmsvc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_args),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_args),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = St,</div><div class='ctx'> 		.pc_name = "GRANTED_MSG",</div><div class='hunk'>@@ -651,6 +655,7 @@ const struct svc_procedure nlmsvc_procedures[24] = {</div><div class='ctx'> 		.pc_decode = nlmsvc_decode_void,</div><div class='ctx'> 		.pc_encode = nlmsvc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_res),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_res),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = St,</div><div class='ctx'> 		.pc_name = "TEST_RES",</div><div class='hunk'>@@ -660,6 +665,7 @@ const struct svc_procedure nlmsvc_procedures[24] = {</div><div class='ctx'> 		.pc_decode = nlmsvc_decode_void,</div><div class='ctx'> 		.pc_encode = nlmsvc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_res),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_res),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = St,</div><div class='ctx'> 		.pc_name = "LOCK_RES",</div><div class='hunk'>@@ -669,6 +675,7 @@ const struct svc_procedure nlmsvc_procedures[24] = {</div><div class='ctx'> 		.pc_decode = nlmsvc_decode_void,</div><div class='ctx'> 		.pc_encode = nlmsvc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_res),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_res),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = St,</div><div class='ctx'> 		.pc_name = "CANCEL_RES",</div><div class='hunk'>@@ -678,6 +685,7 @@ const struct svc_procedure nlmsvc_procedures[24] = {</div><div class='ctx'> 		.pc_decode = nlmsvc_decode_void,</div><div class='ctx'> 		.pc_encode = nlmsvc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_res),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_res),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = St,</div><div class='ctx'> 		.pc_name = "UNLOCK_RES",</div><div class='hunk'>@@ -687,6 +695,7 @@ const struct svc_procedure nlmsvc_procedures[24] = {</div><div class='ctx'> 		.pc_decode = nlmsvc_decode_res,</div><div class='ctx'> 		.pc_encode = nlmsvc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_res),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_res),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = St,</div><div class='ctx'> 		.pc_name = "GRANTED_RES",</div><div class='hunk'>@@ -696,6 +705,7 @@ const struct svc_procedure nlmsvc_procedures[24] = {</div><div class='ctx'> 		.pc_decode = nlmsvc_decode_reboot,</div><div class='ctx'> 		.pc_encode = nlmsvc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_reboot),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_reboot),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = St,</div><div class='ctx'> 		.pc_name = "SM_NOTIFY",</div><div class='hunk'>@@ -705,6 +715,7 @@ const struct svc_procedure nlmsvc_procedures[24] = {</div><div class='ctx'> 		.pc_decode = nlmsvc_decode_void,</div><div class='ctx'> 		.pc_encode = nlmsvc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_void),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = St,</div><div class='ctx'> 		.pc_name = "UNUSED",</div><div class='hunk'>@@ -714,6 +725,7 @@ const struct svc_procedure nlmsvc_procedures[24] = {</div><div class='ctx'> 		.pc_decode = nlmsvc_decode_void,</div><div class='ctx'> 		.pc_encode = nlmsvc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_void),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = St,</div><div class='ctx'> 		.pc_name = "UNUSED",</div><div class='hunk'>@@ -723,6 +735,7 @@ const struct svc_procedure nlmsvc_procedures[24] = {</div><div class='ctx'> 		.pc_decode = nlmsvc_decode_void,</div><div class='ctx'> 		.pc_encode = nlmsvc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_void),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = St,</div><div class='ctx'> 		.pc_name = "UNUSED",</div><div class='hunk'>@@ -732,6 +745,7 @@ const struct svc_procedure nlmsvc_procedures[24] = {</div><div class='ctx'> 		.pc_decode = nlmsvc_decode_shareargs,</div><div class='ctx'> 		.pc_encode = nlmsvc_encode_shareres,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_args),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_args),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_res),</div><div class='ctx'> 		.pc_xdrressize = Ck+St+1,</div><div class='ctx'> 		.pc_name = "SHARE",</div><div class='hunk'>@@ -741,6 +755,7 @@ const struct svc_procedure nlmsvc_procedures[24] = {</div><div class='ctx'> 		.pc_decode = nlmsvc_decode_shareargs,</div><div class='ctx'> 		.pc_encode = nlmsvc_encode_shareres,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_args),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_args),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_res),</div><div class='ctx'> 		.pc_xdrressize = Ck+St+1,</div><div class='ctx'> 		.pc_name = "UNSHARE",</div><div class='hunk'>@@ -750,6 +765,7 @@ const struct svc_procedure nlmsvc_procedures[24] = {</div><div class='ctx'> 		.pc_decode = nlmsvc_decode_lockargs,</div><div class='ctx'> 		.pc_encode = nlmsvc_encode_res,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_args),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_args),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_res),</div><div class='ctx'> 		.pc_xdrressize = Ck+St,</div><div class='ctx'> 		.pc_name = "NM_LOCK",</div><div class='hunk'>@@ -759,6 +775,7 @@ const struct svc_procedure nlmsvc_procedures[24] = {</div><div class='ctx'> 		.pc_decode = nlmsvc_decode_notify,</div><div class='ctx'> 		.pc_encode = nlmsvc_encode_void,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nlm_args),</div><div class='add'>+		.pc_argzero = sizeof(struct nlm_args),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nlm_void),</div><div class='ctx'> 		.pc_xdrressize = 0,</div><div class='ctx'> 		.pc_name = "FREE_ALL",</div><div class='head'>diff --git a/fs/lockd/svcshare.c b/fs/lockd/svcshare.c<br/>index ade4931b2da2..88c81ce1148d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/lockd/svcshare.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/svcshare.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/lockd/svcshare.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/lockd/svcshare.c</a></div><div class='hunk'>@@ -32,6 +32,9 @@ nlmsvc_share_file(struct nlm_host *host, struct nlm_file *file,</div><div class='ctx'> 	struct xdr_netobj	*oh = &amp;argp-&gt;lock.oh;</div><div class='ctx'> 	u8			*ohdata;</div><div class='ctx'> </div><div class='add'>+	if (nlmsvc_file_cannot_lock(file))</div><div class='add'>+		return nlm_lck_denied_nolocks;</div><div class='add'>+</div><div class='ctx'> 	for (share = file-&gt;f_shares; share; share = share-&gt;s_next) {</div><div class='ctx'> 		if (share-&gt;s_host == host &amp;&amp; nlm_cmp_owner(share, oh))</div><div class='ctx'> 			goto update;</div><div class='hunk'>@@ -72,6 +75,9 @@ nlmsvc_unshare_file(struct nlm_host *host, struct nlm_file *file,</div><div class='ctx'> 	struct nlm_share	*share, **shpp;</div><div class='ctx'> 	struct xdr_netobj	*oh = &amp;argp-&gt;lock.oh;</div><div class='ctx'> </div><div class='add'>+	if (nlmsvc_file_cannot_lock(file))</div><div class='add'>+		return nlm_lck_denied_nolocks;</div><div class='add'>+</div><div class='ctx'> 	for (shpp = &amp;file-&gt;f_shares; (share = *shpp) != NULL;</div><div class='ctx'> 					shpp = &amp;share-&gt;s_next) {</div><div class='ctx'> 		if (share-&gt;s_host == host &amp;&amp; nlm_cmp_owner(share, oh)) {</div><div class='head'>diff --git a/fs/lockd/svcsubs.c b/fs/lockd/svcsubs.c<br/>index cb3a7512c33e..9103896164f6 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/lockd/svcsubs.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/svcsubs.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/lockd/svcsubs.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/lockd/svcsubs.c</a></div><div class='hunk'>@@ -73,7 +73,7 @@ static inline unsigned int file_hash(struct nfs_fh *f)</div><div class='ctx'> </div><div class='ctx'> int lock_to_openmode(struct file_lock *lock)</div><div class='ctx'> {</div><div class='del'>-	return (lock-&gt;fl_type == F_WRLCK) ? O_WRONLY : O_RDONLY;</div><div class='add'>+	return lock_is_write(lock) ? O_WRONLY : O_RDONLY;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -176,22 +176,28 @@ nlm_delete_file(struct nlm_file *file)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int nlm_unlock_files(struct nlm_file *file)</div><div class='add'>+static int nlm_unlock_files(struct nlm_file *file, const struct file_lock *fl)</div><div class='ctx'> {</div><div class='ctx'> 	struct file_lock lock;</div><div class='del'>-	struct file *f;</div><div class='ctx'> </div><div class='del'>-	lock.fl_type  = F_UNLCK;</div><div class='add'>+	locks_init_lock(&amp;lock);</div><div class='add'>+	lock.c.flc_type  = F_UNLCK;</div><div class='ctx'> 	lock.fl_start = 0;</div><div class='ctx'> 	lock.fl_end   = OFFSET_MAX;</div><div class='del'>-	for (f = file-&gt;f_file[0]; f &lt;= file-&gt;f_file[1]; f++) {</div><div class='del'>-		if (f &amp;&amp; vfs_lock_file(f, F_SETLK, &amp;lock, NULL) &lt; 0) {</div><div class='del'>-			pr_warn("lockd: unlock failure in %s:%d\n",</div><div class='del'>-				__FILE__, __LINE__);</div><div class='del'>-			return 1;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	lock.c.flc_owner = fl-&gt;c.flc_owner;</div><div class='add'>+	lock.c.flc_pid   = fl-&gt;c.flc_pid;</div><div class='add'>+	lock.c.flc_flags = FL_POSIX;</div><div class='add'>+</div><div class='add'>+	lock.c.flc_file = file-&gt;f_file[O_RDONLY];</div><div class='add'>+	if (lock.c.flc_file &amp;&amp; vfs_lock_file(lock.c.flc_file, F_SETLK, &amp;lock, NULL))</div><div class='add'>+		goto out_err;</div><div class='add'>+	lock.c.flc_file = file-&gt;f_file[O_WRONLY];</div><div class='add'>+	if (lock.c.flc_file &amp;&amp; vfs_lock_file(lock.c.flc_file, F_SETLK, &amp;lock, NULL))</div><div class='add'>+		goto out_err;</div><div class='ctx'> 	return 0;</div><div class='add'>+out_err:</div><div class='add'>+	pr_warn("lockd: unlock failure in %s:%d\n", __FILE__, __LINE__);</div><div class='add'>+	return 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -204,7 +210,7 @@ nlm_traverse_locks(struct nlm_host *host, struct nlm_file *file,</div><div class='ctx'> {</div><div class='ctx'> 	struct inode	 *inode = nlmsvc_file_inode(file);</div><div class='ctx'> 	struct file_lock *fl;</div><div class='del'>-	struct file_lock_context *flctx = inode-&gt;i_flctx;</div><div class='add'>+	struct file_lock_context *flctx = locks_inode_context(inode);</div><div class='ctx'> 	struct nlm_host	 *lockhost;</div><div class='ctx'> </div><div class='ctx'> 	if (!flctx || list_empty_careful(&amp;flctx-&gt;flc_posix))</div><div class='hunk'>@@ -212,18 +218,18 @@ nlm_traverse_locks(struct nlm_host *host, struct nlm_file *file,</div><div class='ctx'> again:</div><div class='ctx'> 	file-&gt;f_locks = 0;</div><div class='ctx'> 	spin_lock(&amp;flctx-&gt;flc_lock);</div><div class='del'>-	list_for_each_entry(fl, &amp;flctx-&gt;flc_posix, fl_list) {</div><div class='add'>+	for_each_file_lock(fl, &amp;flctx-&gt;flc_posix) {</div><div class='ctx'> 		if (fl-&gt;fl_lmops != &amp;nlmsvc_lock_operations)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		/* update current lock count */</div><div class='ctx'> 		file-&gt;f_locks++;</div><div class='ctx'> </div><div class='del'>-		lockhost = ((struct nlm_lockowner *)fl-&gt;fl_owner)-&gt;host;</div><div class='add'>+		lockhost = ((struct nlm_lockowner *) fl-&gt;c.flc_owner)-&gt;host;</div><div class='ctx'> 		if (match(lockhost, host)) {</div><div class='ctx'> </div><div class='ctx'> 			spin_unlock(&amp;flctx-&gt;flc_lock);</div><div class='del'>-			if (nlm_unlock_files(file))</div><div class='add'>+			if (nlm_unlock_files(file, fl))</div><div class='ctx'> 				return 1;</div><div class='ctx'> 			goto again;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -259,14 +265,14 @@ nlm_file_inuse(struct nlm_file *file)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode	 *inode = nlmsvc_file_inode(file);</div><div class='ctx'> 	struct file_lock *fl;</div><div class='del'>-	struct file_lock_context *flctx = inode-&gt;i_flctx;</div><div class='add'>+	struct file_lock_context *flctx = locks_inode_context(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (file-&gt;f_count || !list_empty(&amp;file-&gt;f_blocks) || file-&gt;f_shares)</div><div class='ctx'> 		return 1;</div><div class='ctx'> </div><div class='ctx'> 	if (flctx &amp;&amp; !list_empty_careful(&amp;flctx-&gt;flc_posix)) {</div><div class='ctx'> 		spin_lock(&amp;flctx-&gt;flc_lock);</div><div class='del'>-		list_for_each_entry(fl, &amp;flctx-&gt;flc_posix, fl_list) {</div><div class='add'>+		for_each_file_lock(fl, &amp;flctx-&gt;flc_posix) {</div><div class='ctx'> 			if (fl-&gt;fl_lmops == &amp;nlmsvc_lock_operations) {</div><div class='ctx'> 				spin_unlock(&amp;flctx-&gt;flc_lock);</div><div class='ctx'> 				return 1;</div><div class='hunk'>@@ -280,11 +286,10 @@ nlm_file_inuse(struct nlm_file *file)</div><div class='ctx'> </div><div class='ctx'> static void nlm_close_files(struct nlm_file *file)</div><div class='ctx'> {</div><div class='del'>-	struct file *f;</div><div class='del'>-</div><div class='del'>-	for (f = file-&gt;f_file[0]; f &lt;= file-&gt;f_file[1]; f++)</div><div class='del'>-		if (f)</div><div class='del'>-			nlmsvc_ops-&gt;fclose(f);</div><div class='add'>+	if (file-&gt;f_file[O_RDONLY])</div><div class='add'>+		nlmsvc_ops-&gt;fclose(file-&gt;f_file[O_RDONLY]);</div><div class='add'>+	if (file-&gt;f_file[O_WRONLY])</div><div class='add'>+		nlmsvc_ops-&gt;fclose(file-&gt;f_file[O_WRONLY]);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='head'>diff --git a/fs/lockd/trace.c b/fs/lockd/trace.c<br/>new file mode 100644<br/>index 000000000000..d9a6ff6e673c<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/lockd/trace.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/lockd/trace.c</a></div><div class='hunk'>@@ -0,0 +1,3 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+#define CREATE_TRACE_POINTS</div><div class='add'>+#include "trace.h"</div><div class='head'>diff --git a/fs/lockd/trace.h b/fs/lockd/trace.h<br/>new file mode 100644<br/>index 000000000000..7461b13b6e74<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/lockd/trace.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/lockd/trace.h</a></div><div class='hunk'>@@ -0,0 +1,106 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+#undef TRACE_SYSTEM</div><div class='add'>+#define TRACE_SYSTEM lockd</div><div class='add'>+</div><div class='add'>+#if !defined(_TRACE_LOCKD_H) || defined(TRACE_HEADER_MULTI_READ)</div><div class='add'>+#define _TRACE_LOCKD_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/tracepoint.h&gt;</div><div class='add'>+#include &lt;linux/crc32.h&gt;</div><div class='add'>+#include &lt;linux/nfs.h&gt;</div><div class='add'>+#include &lt;linux/lockd/lockd.h&gt;</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_LOCKD_V4</div><div class='add'>+#define NLM_STATUS_LIST					\</div><div class='add'>+	nlm_status_code(LCK_GRANTED)			\</div><div class='add'>+	nlm_status_code(LCK_DENIED)			\</div><div class='add'>+	nlm_status_code(LCK_DENIED_NOLOCKS)		\</div><div class='add'>+	nlm_status_code(LCK_BLOCKED)			\</div><div class='add'>+	nlm_status_code(LCK_DENIED_GRACE_PERIOD)	\</div><div class='add'>+	nlm_status_code(DEADLCK)			\</div><div class='add'>+	nlm_status_code(ROFS)				\</div><div class='add'>+	nlm_status_code(STALE_FH)			\</div><div class='add'>+	nlm_status_code(FBIG)				\</div><div class='add'>+	nlm_status_code_end(FAILED)</div><div class='add'>+#else</div><div class='add'>+#define NLM_STATUS_LIST					\</div><div class='add'>+	nlm_status_code(LCK_GRANTED)			\</div><div class='add'>+	nlm_status_code(LCK_DENIED)			\</div><div class='add'>+	nlm_status_code(LCK_DENIED_NOLOCKS)		\</div><div class='add'>+	nlm_status_code(LCK_BLOCKED)			\</div><div class='add'>+	nlm_status_code_end(LCK_DENIED_GRACE_PERIOD)</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+#undef nlm_status_code</div><div class='add'>+#undef nlm_status_code_end</div><div class='add'>+#define nlm_status_code(x)	TRACE_DEFINE_ENUM(NLM_##x);</div><div class='add'>+#define nlm_status_code_end(x)	TRACE_DEFINE_ENUM(NLM_##x);</div><div class='add'>+</div><div class='add'>+NLM_STATUS_LIST</div><div class='add'>+</div><div class='add'>+#undef nlm_status_code</div><div class='add'>+#undef nlm_status_code_end</div><div class='add'>+#define nlm_status_code(x)	{ NLM_##x, #x },</div><div class='add'>+#define nlm_status_code_end(x)	{ NLM_##x, #x }</div><div class='add'>+</div><div class='add'>+#define show_nlm_status(x)	__print_symbolic(x, NLM_STATUS_LIST)</div><div class='add'>+</div><div class='add'>+DECLARE_EVENT_CLASS(nlmclnt_lock_event,</div><div class='add'>+		TP_PROTO(</div><div class='add'>+			const struct nlm_lock *lock,</div><div class='add'>+			const struct sockaddr *addr,</div><div class='add'>+			unsigned int addrlen,</div><div class='add'>+			__be32 status</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_ARGS(lock, addr, addrlen, status),</div><div class='add'>+</div><div class='add'>+		TP_STRUCT__entry(</div><div class='add'>+			__field(u32, oh)</div><div class='add'>+			__field(u32, svid)</div><div class='add'>+			__field(u32, fh)</div><div class='add'>+			__field(unsigned long, status)</div><div class='add'>+			__field(u64, start)</div><div class='add'>+			__field(u64, len)</div><div class='add'>+			__sockaddr(addr, addrlen)</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_fast_assign(</div><div class='add'>+			__entry-&gt;oh = ~crc32_le(0xffffffff, lock-&gt;oh.data, lock-&gt;oh.len);</div><div class='add'>+			__entry-&gt;svid = lock-&gt;svid;</div><div class='add'>+			__entry-&gt;fh = nfs_fhandle_hash(&amp;lock-&gt;fh);</div><div class='add'>+			__entry-&gt;start = lock-&gt;lock_start;</div><div class='add'>+			__entry-&gt;len = lock-&gt;lock_len;</div><div class='add'>+			__entry-&gt;status = be32_to_cpu(status);</div><div class='add'>+			__assign_sockaddr(addr, addr, addrlen);</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_printk(</div><div class='add'>+			"addr=%pISpc oh=0x%08x svid=0x%08x fh=0x%08x start=%llu len=%llu status=%s",</div><div class='add'>+			__get_sockaddr(addr), __entry-&gt;oh, __entry-&gt;svid,</div><div class='add'>+			__entry-&gt;fh, __entry-&gt;start, __entry-&gt;len,</div><div class='add'>+			show_nlm_status(__entry-&gt;status)</div><div class='add'>+		)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+#define DEFINE_NLMCLNT_EVENT(name)				\</div><div class='add'>+	DEFINE_EVENT(nlmclnt_lock_event, name,			\</div><div class='add'>+			TP_PROTO(				\</div><div class='add'>+				const struct nlm_lock *lock,	\</div><div class='add'>+				const struct sockaddr *addr,	\</div><div class='add'>+				unsigned int addrlen,		\</div><div class='add'>+				__be32	status			\</div><div class='add'>+			),					\</div><div class='add'>+			TP_ARGS(lock, addr, addrlen, status))</div><div class='add'>+</div><div class='add'>+DEFINE_NLMCLNT_EVENT(nlmclnt_test);</div><div class='add'>+DEFINE_NLMCLNT_EVENT(nlmclnt_lock);</div><div class='add'>+DEFINE_NLMCLNT_EVENT(nlmclnt_unlock);</div><div class='add'>+DEFINE_NLMCLNT_EVENT(nlmclnt_grant);</div><div class='add'>+</div><div class='add'>+#endif /* _TRACE_LOCKD_H */</div><div class='add'>+</div><div class='add'>+#undef TRACE_INCLUDE_PATH</div><div class='add'>+#define TRACE_INCLUDE_PATH .</div><div class='add'>+#define TRACE_INCLUDE_FILE trace</div><div class='add'>+#include &lt;trace/define_trace.h&gt;</div><div class='head'>diff --git a/fs/lockd/xdr.c b/fs/lockd/xdr.c<br/>index 2fb5748dae0c..adfcce2bf11b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/lockd/xdr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/xdr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/lockd/xdr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/lockd/xdr.c</a></div><div class='hunk'>@@ -88,8 +88,8 @@ svcxdr_decode_lock(struct xdr_stream *xdr, struct nlm_lock *lock)</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='ctx'> 	locks_init_lock(fl);</div><div class='del'>-	fl-&gt;fl_flags = FL_POSIX;</div><div class='del'>-	fl-&gt;fl_type  = F_RDLCK;</div><div class='add'>+	fl-&gt;c.flc_flags = FL_POSIX;</div><div class='add'>+	fl-&gt;c.flc_type  = F_RDLCK;</div><div class='ctx'> 	end = start + len - 1;</div><div class='ctx'> 	fl-&gt;fl_start = s32_to_loff_t(start);</div><div class='ctx'> 	if (len == 0 || end &lt; 0)</div><div class='hunk'>@@ -107,7 +107,7 @@ svcxdr_encode_holder(struct xdr_stream *xdr, const struct nlm_lock *lock)</div><div class='ctx'> 	s32 start, len;</div><div class='ctx'> </div><div class='ctx'> 	/* exclusive */</div><div class='del'>-	if (xdr_stream_encode_bool(xdr, fl-&gt;fl_type != F_RDLCK) &lt; 0)</div><div class='add'>+	if (xdr_stream_encode_bool(xdr, fl-&gt;c.flc_type != F_RDLCK) &lt; 0)</div><div class='ctx'> 		return false;</div><div class='ctx'> 	if (xdr_stream_encode_u32(xdr, lock-&gt;svid) &lt; 0)</div><div class='ctx'> 		return false;</div><div class='hunk'>@@ -164,7 +164,7 @@ nlmsvc_decode_testargs(struct svc_rqst *rqstp, struct xdr_stream *xdr)</div><div class='ctx'> 	if (!svcxdr_decode_lock(xdr, &amp;argp-&gt;lock))</div><div class='ctx'> 		return false;</div><div class='ctx'> 	if (exclusive)</div><div class='del'>-		argp-&gt;lock.fl.fl_type = F_WRLCK;</div><div class='add'>+		argp-&gt;lock.fl.c.flc_type = F_WRLCK;</div><div class='ctx'> </div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='hunk'>@@ -184,7 +184,7 @@ nlmsvc_decode_lockargs(struct svc_rqst *rqstp, struct xdr_stream *xdr)</div><div class='ctx'> 	if (!svcxdr_decode_lock(xdr, &amp;argp-&gt;lock))</div><div class='ctx'> 		return false;</div><div class='ctx'> 	if (exclusive)</div><div class='del'>-		argp-&gt;lock.fl.fl_type = F_WRLCK;</div><div class='add'>+		argp-&gt;lock.fl.c.flc_type = F_WRLCK;</div><div class='ctx'> 	if (xdr_stream_decode_bool(xdr, &amp;argp-&gt;reclaim) &lt; 0)</div><div class='ctx'> 		return false;</div><div class='ctx'> 	if (xdr_stream_decode_u32(xdr, &amp;argp-&gt;state) &lt; 0)</div><div class='hunk'>@@ -209,7 +209,7 @@ nlmsvc_decode_cancargs(struct svc_rqst *rqstp, struct xdr_stream *xdr)</div><div class='ctx'> 	if (!svcxdr_decode_lock(xdr, &amp;argp-&gt;lock))</div><div class='ctx'> 		return false;</div><div class='ctx'> 	if (exclusive)</div><div class='del'>-		argp-&gt;lock.fl.fl_type = F_WRLCK;</div><div class='add'>+		argp-&gt;lock.fl.c.flc_type = F_WRLCK;</div><div class='ctx'> </div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='hunk'>@@ -223,7 +223,7 @@ nlmsvc_decode_unlockargs(struct svc_rqst *rqstp, struct xdr_stream *xdr)</div><div class='ctx'> 		return false;</div><div class='ctx'> 	if (!svcxdr_decode_lock(xdr, &amp;argp-&gt;lock))</div><div class='ctx'> 		return false;</div><div class='del'>-	argp-&gt;lock.fl.fl_type = F_UNLCK;</div><div class='add'>+	argp-&gt;lock.fl.c.flc_type = F_UNLCK;</div><div class='ctx'> </div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/lockd/xdr4.c b/fs/lockd/xdr4.c<br/>index 856267c0864b..e343c820301f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/lockd/xdr4.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/lockd/xdr4.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/lockd/xdr4.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/lockd/xdr4.c</a></div><div class='hunk'>@@ -20,13 +20,6 @@</div><div class='ctx'> </div><div class='ctx'> #include "svcxdr.h"</div><div class='ctx'> </div><div class='del'>-static inline loff_t</div><div class='del'>-s64_to_loff_t(__s64 offset)</div><div class='del'>-{</div><div class='del'>-	return (loff_t)offset;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-</div><div class='ctx'> static inline s64</div><div class='ctx'> loff_t_to_s64(loff_t offset)</div><div class='ctx'> {</div><div class='hunk'>@@ -40,6 +33,17 @@ loff_t_to_s64(loff_t offset)</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void nlm4svc_set_file_lock_range(struct file_lock *fl, u64 off, u64 len)</div><div class='add'>+{</div><div class='add'>+	s64 end = off + len - 1;</div><div class='add'>+</div><div class='add'>+	fl-&gt;fl_start = off;</div><div class='add'>+	if (len == 0 || end &lt; 0)</div><div class='add'>+		fl-&gt;fl_end = OFFSET_MAX;</div><div class='add'>+	else</div><div class='add'>+		fl-&gt;fl_end = end;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * NLM file handles are defined by specification to be a variable-length</div><div class='ctx'>  * XDR opaque no longer than 1024 bytes. However, this implementation</div><div class='hunk'>@@ -70,8 +74,6 @@ static bool</div><div class='ctx'> svcxdr_decode_lock(struct xdr_stream *xdr, struct nlm_lock *lock)</div><div class='ctx'> {</div><div class='ctx'> 	struct file_lock *fl = &amp;lock-&gt;fl;</div><div class='del'>-	u64 len, start;</div><div class='del'>-	s64 end;</div><div class='ctx'> </div><div class='ctx'> 	if (!svcxdr_decode_string(xdr, &amp;lock-&gt;caller, &amp;lock-&gt;len))</div><div class='ctx'> 		return false;</div><div class='hunk'>@@ -81,21 +83,14 @@ svcxdr_decode_lock(struct xdr_stream *xdr, struct nlm_lock *lock)</div><div class='ctx'> 		return false;</div><div class='ctx'> 	if (xdr_stream_decode_u32(xdr, &amp;lock-&gt;svid) &lt; 0)</div><div class='ctx'> 		return false;</div><div class='del'>-	if (xdr_stream_decode_u64(xdr, &amp;start) &lt; 0)</div><div class='add'>+	if (xdr_stream_decode_u64(xdr, &amp;lock-&gt;lock_start) &lt; 0)</div><div class='ctx'> 		return false;</div><div class='del'>-	if (xdr_stream_decode_u64(xdr, &amp;len) &lt; 0)</div><div class='add'>+	if (xdr_stream_decode_u64(xdr, &amp;lock-&gt;lock_len) &lt; 0)</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='ctx'> 	locks_init_lock(fl);</div><div class='del'>-	fl-&gt;fl_flags = FL_POSIX;</div><div class='del'>-	fl-&gt;fl_type  = F_RDLCK;</div><div class='del'>-	end = start + len - 1;</div><div class='del'>-	fl-&gt;fl_start = s64_to_loff_t(start);</div><div class='del'>-	if (len == 0 || end &lt; 0)</div><div class='del'>-		fl-&gt;fl_end = OFFSET_MAX;</div><div class='del'>-	else</div><div class='del'>-		fl-&gt;fl_end = s64_to_loff_t(end);</div><div class='del'>-</div><div class='add'>+	fl-&gt;c.flc_type  = F_RDLCK;</div><div class='add'>+	nlm4svc_set_file_lock_range(fl, lock-&gt;lock_start, lock-&gt;lock_len);</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -106,7 +101,7 @@ svcxdr_encode_holder(struct xdr_stream *xdr, const struct nlm_lock *lock)</div><div class='ctx'> 	s64 start, len;</div><div class='ctx'> </div><div class='ctx'> 	/* exclusive */</div><div class='del'>-	if (xdr_stream_encode_bool(xdr, fl-&gt;fl_type != F_RDLCK) &lt; 0)</div><div class='add'>+	if (xdr_stream_encode_bool(xdr, fl-&gt;c.flc_type != F_RDLCK) &lt; 0)</div><div class='ctx'> 		return false;</div><div class='ctx'> 	if (xdr_stream_encode_u32(xdr, lock-&gt;svid) &lt; 0)</div><div class='ctx'> 		return false;</div><div class='hunk'>@@ -163,7 +158,7 @@ nlm4svc_decode_testargs(struct svc_rqst *rqstp, struct xdr_stream *xdr)</div><div class='ctx'> 	if (!svcxdr_decode_lock(xdr, &amp;argp-&gt;lock))</div><div class='ctx'> 		return false;</div><div class='ctx'> 	if (exclusive)</div><div class='del'>-		argp-&gt;lock.fl.fl_type = F_WRLCK;</div><div class='add'>+		argp-&gt;lock.fl.c.flc_type = F_WRLCK;</div><div class='ctx'> </div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='hunk'>@@ -183,7 +178,7 @@ nlm4svc_decode_lockargs(struct svc_rqst *rqstp, struct xdr_stream *xdr)</div><div class='ctx'> 	if (!svcxdr_decode_lock(xdr, &amp;argp-&gt;lock))</div><div class='ctx'> 		return false;</div><div class='ctx'> 	if (exclusive)</div><div class='del'>-		argp-&gt;lock.fl.fl_type = F_WRLCK;</div><div class='add'>+		argp-&gt;lock.fl.c.flc_type = F_WRLCK;</div><div class='ctx'> 	if (xdr_stream_decode_bool(xdr, &amp;argp-&gt;reclaim) &lt; 0)</div><div class='ctx'> 		return false;</div><div class='ctx'> 	if (xdr_stream_decode_u32(xdr, &amp;argp-&gt;state) &lt; 0)</div><div class='hunk'>@@ -208,7 +203,7 @@ nlm4svc_decode_cancargs(struct svc_rqst *rqstp, struct xdr_stream *xdr)</div><div class='ctx'> 	if (!svcxdr_decode_lock(xdr, &amp;argp-&gt;lock))</div><div class='ctx'> 		return false;</div><div class='ctx'> 	if (exclusive)</div><div class='del'>-		argp-&gt;lock.fl.fl_type = F_WRLCK;</div><div class='add'>+		argp-&gt;lock.fl.c.flc_type = F_WRLCK;</div><div class='ctx'> </div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='hunk'>@@ -222,7 +217,7 @@ nlm4svc_decode_unlockargs(struct svc_rqst *rqstp, struct xdr_stream *xdr)</div><div class='ctx'> 		return false;</div><div class='ctx'> 	if (!svcxdr_decode_lock(xdr, &amp;argp-&gt;lock))</div><div class='ctx'> 		return false;</div><div class='del'>-	argp-&gt;lock.fl.fl_type = F_UNLCK;</div><div class='add'>+	argp-&gt;lock.fl.c.flc_type = F_UNLCK;</div><div class='ctx'> </div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='hunk'>@@ -272,7 +267,6 @@ nlm4svc_decode_shareargs(struct svc_rqst *rqstp, struct xdr_stream *xdr)</div><div class='ctx'> 	struct nlm_args *argp = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nlm_lock	*lock = &amp;argp-&gt;lock;</div><div class='ctx'> </div><div class='del'>-	memset(lock, 0, sizeof(*lock));</div><div class='ctx'> 	locks_init_lock(&amp;lock-&gt;fl);</div><div class='ctx'> 	lock-&gt;svid = ~(u32)0;</div><div class='ctx'> </div><div class='head'>diff --git a/fs/locks.c b/fs/locks.c<br/>index 0fca9d680978..9f565802a88c 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/locks.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/locks.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/locks.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/locks.c</a></div><div class='hunk'>@@ -48,10 +48,10 @@</div><div class='ctx'>  * children.</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='del'>-</div><div class='ctx'> #include &lt;linux/capability.h&gt;</div><div class='ctx'> #include &lt;linux/file.h&gt;</div><div class='ctx'> #include &lt;linux/fdtable.h&gt;</div><div class='add'>+#include &lt;linux/filelock.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/init.h&gt;</div><div class='ctx'> #include &lt;linux/security.h&gt;</div><div class='hunk'>@@ -62,34 +62,67 @@</div><div class='ctx'> #include &lt;linux/pid_namespace.h&gt;</div><div class='ctx'> #include &lt;linux/hashtable.h&gt;</div><div class='ctx'> #include &lt;linux/percpu.h&gt;</div><div class='add'>+#include &lt;linux/sysctl.h&gt;</div><div class='ctx'> </div><div class='ctx'> #define CREATE_TRACE_POINTS</div><div class='ctx'> #include &lt;trace/events/filelock.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/uaccess.h&gt;</div><div class='ctx'> </div><div class='del'>-#define IS_POSIX(fl)	(fl-&gt;fl_flags &amp; FL_POSIX)</div><div class='del'>-#define IS_FLOCK(fl)	(fl-&gt;fl_flags &amp; FL_FLOCK)</div><div class='del'>-#define IS_LEASE(fl)	(fl-&gt;fl_flags &amp; (FL_LEASE|FL_DELEG|FL_LAYOUT))</div><div class='del'>-#define IS_OFDLCK(fl)	(fl-&gt;fl_flags &amp; FL_OFDLCK)</div><div class='del'>-#define IS_REMOTELCK(fl)	(fl-&gt;fl_pid &lt;= 0)</div><div class='add'>+static struct file_lock *file_lock(struct file_lock_core *flc)</div><div class='add'>+{</div><div class='add'>+	return container_of(flc, struct file_lock, c);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-static bool lease_breaking(struct file_lock *fl)</div><div class='add'>+static struct file_lease *file_lease(struct file_lock_core *flc)</div><div class='ctx'> {</div><div class='del'>-	return fl-&gt;fl_flags &amp; (FL_UNLOCK_PENDING | FL_DOWNGRADE_PENDING);</div><div class='add'>+	return container_of(flc, struct file_lease, c);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int target_leasetype(struct file_lock *fl)</div><div class='add'>+static bool lease_breaking(struct file_lease *fl)</div><div class='ctx'> {</div><div class='del'>-	if (fl-&gt;fl_flags &amp; FL_UNLOCK_PENDING)</div><div class='add'>+	return fl-&gt;c.flc_flags &amp; (FL_UNLOCK_PENDING | FL_DOWNGRADE_PENDING);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int target_leasetype(struct file_lease *fl)</div><div class='add'>+{</div><div class='add'>+	if (fl-&gt;c.flc_flags &amp; FL_UNLOCK_PENDING)</div><div class='ctx'> 		return F_UNLCK;</div><div class='del'>-	if (fl-&gt;fl_flags &amp; FL_DOWNGRADE_PENDING)</div><div class='add'>+	if (fl-&gt;c.flc_flags &amp; FL_DOWNGRADE_PENDING)</div><div class='ctx'> 		return F_RDLCK;</div><div class='del'>-	return fl-&gt;fl_type;</div><div class='del'>-}</div><div class='add'>+	return fl-&gt;c.flc_type;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int leases_enable = 1;</div><div class='add'>+static int lease_break_time = 45;</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_SYSCTL</div><div class='add'>+static const struct ctl_table locks_sysctls[] = {</div><div class='add'>+	{</div><div class='add'>+		.procname	= "leases-enable",</div><div class='add'>+		.data		= &amp;leases_enable,</div><div class='add'>+		.maxlen		= sizeof(int),</div><div class='add'>+		.mode		= 0644,</div><div class='add'>+		.proc_handler	= proc_dointvec,</div><div class='add'>+	},</div><div class='add'>+#ifdef CONFIG_MMU</div><div class='add'>+	{</div><div class='add'>+		.procname	= "lease-break-time",</div><div class='add'>+		.data		= &amp;lease_break_time,</div><div class='add'>+		.maxlen		= sizeof(int),</div><div class='add'>+		.mode		= 0644,</div><div class='add'>+		.proc_handler	= proc_dointvec,</div><div class='add'>+	},</div><div class='add'>+#endif /* CONFIG_MMU */</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-int leases_enable = 1;</div><div class='del'>-int lease_break_time = 45;</div><div class='add'>+static int __init init_fs_locks_sysctls(void)</div><div class='add'>+{</div><div class='add'>+	register_sysctl_init("fs", locks_sysctls);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+early_initcall(init_fs_locks_sysctls);</div><div class='add'>+#endif /* CONFIG_SYSCTL */</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * The global file_lock_list is only used for displaying /proc/locks, so we</div><div class='hunk'>@@ -136,8 +169,9 @@ static DEFINE_HASHTABLE(blocked_hash, BLOCKED_HASH_BITS);</div><div class='ctx'>  */</div><div class='ctx'> static DEFINE_SPINLOCK(blocked_lock_lock);</div><div class='ctx'> </div><div class='del'>-static struct kmem_cache *flctx_cache __read_mostly;</div><div class='del'>-static struct kmem_cache *filelock_cache __read_mostly;</div><div class='add'>+static struct kmem_cache *flctx_cache __ro_after_init;</div><div class='add'>+static struct kmem_cache *filelock_cache __ro_after_init;</div><div class='add'>+static struct kmem_cache *filelease_cache __ro_after_init;</div><div class='ctx'> </div><div class='ctx'> static struct file_lock_context *</div><div class='ctx'> locks_get_lock_context(struct inode *inode, int type)</div><div class='hunk'>@@ -145,7 +179,7 @@ locks_get_lock_context(struct inode *inode, int type)</div><div class='ctx'> 	struct file_lock_context *ctx;</div><div class='ctx'> </div><div class='ctx'> 	/* paired with cmpxchg() below */</div><div class='del'>-	ctx = smp_load_acquire(&amp;inode-&gt;i_flctx);</div><div class='add'>+	ctx = locks_inode_context(inode);</div><div class='ctx'> 	if (likely(ctx) || type == F_UNLCK)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -164,7 +198,7 @@ locks_get_lock_context(struct inode *inode, int type)</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (cmpxchg(&amp;inode-&gt;i_flctx, NULL, ctx)) {</div><div class='ctx'> 		kmem_cache_free(flctx_cache, ctx);</div><div class='del'>-		ctx = smp_load_acquire(&amp;inode-&gt;i_flctx);</div><div class='add'>+		ctx = locks_inode_context(inode);</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='ctx'> 	trace_locks_get_lock_context(inode, type, ctx);</div><div class='hunk'>@@ -174,11 +208,12 @@ out:</div><div class='ctx'> static void</div><div class='ctx'> locks_dump_ctx_list(struct list_head *list, char *list_type)</div><div class='ctx'> {</div><div class='del'>-	struct file_lock *fl;</div><div class='add'>+	struct file_lock_core *flc;</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry(fl, list, fl_list) {</div><div class='del'>-		pr_warn("%s: fl_owner=%p fl_flags=0x%x fl_type=0x%x fl_pid=%u\n", list_type, fl-&gt;fl_owner, fl-&gt;fl_flags, fl-&gt;fl_type, fl-&gt;fl_pid);</div><div class='del'>-	}</div><div class='add'>+	list_for_each_entry(flc, list, flc_list)</div><div class='add'>+		pr_warn("%s: fl_owner=%p fl_flags=0x%x fl_type=0x%x fl_pid=%u\n",</div><div class='add'>+			list_type, flc-&gt;flc_owner, flc-&gt;flc_flags,</div><div class='add'>+			flc-&gt;flc_type, flc-&gt;flc_pid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='hunk'>@@ -199,25 +234,25 @@ locks_check_ctx_lists(struct inode *inode)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='del'>-locks_check_ctx_file_list(struct file *filp, struct list_head *list,</div><div class='del'>-				char *list_type)</div><div class='add'>+locks_check_ctx_file_list(struct file *filp, struct list_head *list, char *list_type)</div><div class='ctx'> {</div><div class='del'>-	struct file_lock *fl;</div><div class='del'>-	struct inode *inode = locks_inode(filp);</div><div class='add'>+	struct file_lock_core *flc;</div><div class='add'>+	struct inode *inode = file_inode(filp);</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry(fl, list, fl_list)</div><div class='del'>-		if (fl-&gt;fl_file == filp)</div><div class='add'>+	list_for_each_entry(flc, list, flc_list)</div><div class='add'>+		if (flc-&gt;flc_file == filp)</div><div class='ctx'> 			pr_warn("Leaked %s lock on dev=0x%x:0x%x ino=0x%lx "</div><div class='ctx'> 				" fl_owner=%p fl_flags=0x%x fl_type=0x%x fl_pid=%u\n",</div><div class='ctx'> 				list_type, MAJOR(inode-&gt;i_sb-&gt;s_dev),</div><div class='ctx'> 				MINOR(inode-&gt;i_sb-&gt;s_dev), inode-&gt;i_ino,</div><div class='del'>-				fl-&gt;fl_owner, fl-&gt;fl_flags, fl-&gt;fl_type, fl-&gt;fl_pid);</div><div class='add'>+				flc-&gt;flc_owner, flc-&gt;flc_flags,</div><div class='add'>+				flc-&gt;flc_type, flc-&gt;flc_pid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void</div><div class='ctx'> locks_free_lock_context(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct file_lock_context *ctx = inode-&gt;i_flctx;</div><div class='add'>+	struct file_lock_context *ctx = locks_inode_context(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(ctx)) {</div><div class='ctx'> 		locks_check_ctx_lists(inode);</div><div class='hunk'>@@ -225,13 +260,13 @@ locks_free_lock_context(struct inode *inode)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void locks_init_lock_heads(struct file_lock *fl)</div><div class='add'>+static void locks_init_lock_heads(struct file_lock_core *flc)</div><div class='ctx'> {</div><div class='del'>-	INIT_HLIST_NODE(&amp;fl-&gt;fl_link);</div><div class='del'>-	INIT_LIST_HEAD(&amp;fl-&gt;fl_list);</div><div class='del'>-	INIT_LIST_HEAD(&amp;fl-&gt;fl_blocked_requests);</div><div class='del'>-	INIT_LIST_HEAD(&amp;fl-&gt;fl_blocked_member);</div><div class='del'>-	init_waitqueue_head(&amp;fl-&gt;fl_wait);</div><div class='add'>+	INIT_HLIST_NODE(&amp;flc-&gt;flc_link);</div><div class='add'>+	INIT_LIST_HEAD(&amp;flc-&gt;flc_list);</div><div class='add'>+	INIT_LIST_HEAD(&amp;flc-&gt;flc_blocked_requests);</div><div class='add'>+	INIT_LIST_HEAD(&amp;flc-&gt;flc_blocked_member);</div><div class='add'>+	init_waitqueue_head(&amp;flc-&gt;flc_wait);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Allocate an empty lock structure. */</div><div class='hunk'>@@ -240,19 +275,33 @@ struct file_lock *locks_alloc_lock(void)</div><div class='ctx'> 	struct file_lock *fl = kmem_cache_zalloc(filelock_cache, GFP_KERNEL);</div><div class='ctx'> </div><div class='ctx'> 	if (fl)</div><div class='del'>-		locks_init_lock_heads(fl);</div><div class='add'>+		locks_init_lock_heads(&amp;fl-&gt;c);</div><div class='ctx'> </div><div class='ctx'> 	return fl;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(locks_alloc_lock);</div><div class='ctx'> </div><div class='add'>+/* Allocate an empty lock structure. */</div><div class='add'>+struct file_lease *locks_alloc_lease(void)</div><div class='add'>+{</div><div class='add'>+	struct file_lease *fl = kmem_cache_zalloc(filelease_cache, GFP_KERNEL);</div><div class='add'>+</div><div class='add'>+	if (fl)</div><div class='add'>+		locks_init_lock_heads(&amp;fl-&gt;c);</div><div class='add'>+</div><div class='add'>+	return fl;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(locks_alloc_lease);</div><div class='add'>+</div><div class='ctx'> void locks_release_private(struct file_lock *fl)</div><div class='ctx'> {</div><div class='del'>-	BUG_ON(waitqueue_active(&amp;fl-&gt;fl_wait));</div><div class='del'>-	BUG_ON(!list_empty(&amp;fl-&gt;fl_list));</div><div class='del'>-	BUG_ON(!list_empty(&amp;fl-&gt;fl_blocked_requests));</div><div class='del'>-	BUG_ON(!list_empty(&amp;fl-&gt;fl_blocked_member));</div><div class='del'>-	BUG_ON(!hlist_unhashed(&amp;fl-&gt;fl_link));</div><div class='add'>+	struct file_lock_core *flc = &amp;fl-&gt;c;</div><div class='add'>+</div><div class='add'>+	BUG_ON(waitqueue_active(&amp;flc-&gt;flc_wait));</div><div class='add'>+	BUG_ON(!list_empty(&amp;flc-&gt;flc_list));</div><div class='add'>+	BUG_ON(!list_empty(&amp;flc-&gt;flc_blocked_requests));</div><div class='add'>+	BUG_ON(!list_empty(&amp;flc-&gt;flc_blocked_member));</div><div class='add'>+	BUG_ON(!hlist_unhashed(&amp;flc-&gt;flc_link));</div><div class='ctx'> </div><div class='ctx'> 	if (fl-&gt;fl_ops) {</div><div class='ctx'> 		if (fl-&gt;fl_ops-&gt;fl_release_private)</div><div class='hunk'>@@ -262,14 +311,41 @@ void locks_release_private(struct file_lock *fl)</div><div class='ctx'> </div><div class='ctx'> 	if (fl-&gt;fl_lmops) {</div><div class='ctx'> 		if (fl-&gt;fl_lmops-&gt;lm_put_owner) {</div><div class='del'>-			fl-&gt;fl_lmops-&gt;lm_put_owner(fl-&gt;fl_owner);</div><div class='del'>-			fl-&gt;fl_owner = NULL;</div><div class='add'>+			fl-&gt;fl_lmops-&gt;lm_put_owner(flc-&gt;flc_owner);</div><div class='add'>+			flc-&gt;flc_owner = NULL;</div><div class='ctx'> 		}</div><div class='ctx'> 		fl-&gt;fl_lmops = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(locks_release_private);</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * locks_owner_has_blockers - Check for blocking lock requests</div><div class='add'>+ * @flctx: file lock context</div><div class='add'>+ * @owner: lock owner</div><div class='add'>+ *</div><div class='add'>+ * Return values:</div><div class='add'>+ *   %true: @owner has at least one blocker</div><div class='add'>+ *   %false: @owner has no blockers</div><div class='add'>+ */</div><div class='add'>+bool locks_owner_has_blockers(struct file_lock_context *flctx, fl_owner_t owner)</div><div class='add'>+{</div><div class='add'>+	struct file_lock_core *flc;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;flctx-&gt;flc_lock);</div><div class='add'>+	list_for_each_entry(flc, &amp;flctx-&gt;flc_posix, flc_list) {</div><div class='add'>+		if (flc-&gt;flc_owner != owner)</div><div class='add'>+			continue;</div><div class='add'>+		if (!list_empty(&amp;flc-&gt;flc_blocked_requests)) {</div><div class='add'>+			spin_unlock(&amp;flctx-&gt;flc_lock);</div><div class='add'>+			return true;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;flctx-&gt;flc_lock);</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(locks_owner_has_blockers);</div><div class='add'>+</div><div class='ctx'> /* Free a lock which is not in use. */</div><div class='ctx'> void locks_free_lock(struct file_lock *fl)</div><div class='ctx'> {</div><div class='hunk'>@@ -278,35 +354,52 @@ void locks_free_lock(struct file_lock *fl)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(locks_free_lock);</div><div class='ctx'> </div><div class='add'>+/* Free a lease which is not in use. */</div><div class='add'>+void locks_free_lease(struct file_lease *fl)</div><div class='add'>+{</div><div class='add'>+	kmem_cache_free(filelease_cache, fl);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(locks_free_lease);</div><div class='add'>+</div><div class='ctx'> static void</div><div class='ctx'> locks_dispose_list(struct list_head *dispose)</div><div class='ctx'> {</div><div class='del'>-	struct file_lock *fl;</div><div class='add'>+	struct file_lock_core *flc;</div><div class='ctx'> </div><div class='ctx'> 	while (!list_empty(dispose)) {</div><div class='del'>-		fl = list_first_entry(dispose, struct file_lock, fl_list);</div><div class='del'>-		list_del_init(&amp;fl-&gt;fl_list);</div><div class='del'>-		locks_free_lock(fl);</div><div class='add'>+		flc = list_first_entry(dispose, struct file_lock_core, flc_list);</div><div class='add'>+		list_del_init(&amp;flc-&gt;flc_list);</div><div class='add'>+		if (flc-&gt;flc_flags &amp; (FL_LEASE|FL_DELEG|FL_LAYOUT))</div><div class='add'>+			locks_free_lease(file_lease(flc));</div><div class='add'>+		else</div><div class='add'>+			locks_free_lock(file_lock(flc));</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void locks_init_lock(struct file_lock *fl)</div><div class='ctx'> {</div><div class='ctx'> 	memset(fl, 0, sizeof(struct file_lock));</div><div class='del'>-	locks_init_lock_heads(fl);</div><div class='add'>+	locks_init_lock_heads(&amp;fl-&gt;c);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(locks_init_lock);</div><div class='ctx'> </div><div class='add'>+void locks_init_lease(struct file_lease *fl)</div><div class='add'>+{</div><div class='add'>+	memset(fl, 0, sizeof(*fl));</div><div class='add'>+	locks_init_lock_heads(&amp;fl-&gt;c);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(locks_init_lease);</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Initialize a new lock from an existing file_lock structure.</div><div class='ctx'>  */</div><div class='ctx'> void locks_copy_conflock(struct file_lock *new, struct file_lock *fl)</div><div class='ctx'> {</div><div class='del'>-	new-&gt;fl_owner = fl-&gt;fl_owner;</div><div class='del'>-	new-&gt;fl_pid = fl-&gt;fl_pid;</div><div class='del'>-	new-&gt;fl_file = NULL;</div><div class='del'>-	new-&gt;fl_flags = fl-&gt;fl_flags;</div><div class='del'>-	new-&gt;fl_type = fl-&gt;fl_type;</div><div class='add'>+	new-&gt;c.flc_owner = fl-&gt;c.flc_owner;</div><div class='add'>+	new-&gt;c.flc_pid = fl-&gt;c.flc_pid;</div><div class='add'>+	new-&gt;c.flc_file = NULL;</div><div class='add'>+	new-&gt;c.flc_flags = fl-&gt;c.flc_flags;</div><div class='add'>+	new-&gt;c.flc_type = fl-&gt;c.flc_type;</div><div class='ctx'> 	new-&gt;fl_start = fl-&gt;fl_start;</div><div class='ctx'> 	new-&gt;fl_end = fl-&gt;fl_end;</div><div class='ctx'> 	new-&gt;fl_lmops = fl-&gt;fl_lmops;</div><div class='hunk'>@@ -314,7 +407,7 @@ void locks_copy_conflock(struct file_lock *new, struct file_lock *fl)</div><div class='ctx'> </div><div class='ctx'> 	if (fl-&gt;fl_lmops) {</div><div class='ctx'> 		if (fl-&gt;fl_lmops-&gt;lm_get_owner)</div><div class='del'>-			fl-&gt;fl_lmops-&gt;lm_get_owner(fl-&gt;fl_owner);</div><div class='add'>+			fl-&gt;fl_lmops-&gt;lm_get_owner(fl-&gt;c.flc_owner);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(locks_copy_conflock);</div><div class='hunk'>@@ -326,7 +419,7 @@ void locks_copy_lock(struct file_lock *new, struct file_lock *fl)</div><div class='ctx'> </div><div class='ctx'> 	locks_copy_conflock(new, fl);</div><div class='ctx'> </div><div class='del'>-	new-&gt;fl_file = fl-&gt;fl_file;</div><div class='add'>+	new-&gt;c.flc_file = fl-&gt;c.flc_file;</div><div class='ctx'> 	new-&gt;fl_ops = fl-&gt;fl_ops;</div><div class='ctx'> </div><div class='ctx'> 	if (fl-&gt;fl_ops) {</div><div class='hunk'>@@ -342,15 +435,17 @@ static void locks_move_blocks(struct file_lock *new, struct file_lock *fl)</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * As ctx-&gt;flc_lock is held, new requests cannot be added to</div><div class='del'>-	 * -&gt;fl_blocked_requests, so we don't need a lock to check if it</div><div class='add'>+	 * -&gt;flc_blocked_requests, so we don't need a lock to check if it</div><div class='ctx'> 	 * is empty.</div><div class='ctx'> 	 */</div><div class='del'>-	if (list_empty(&amp;fl-&gt;fl_blocked_requests))</div><div class='add'>+	if (list_empty(&amp;fl-&gt;c.flc_blocked_requests))</div><div class='ctx'> 		return;</div><div class='ctx'> 	spin_lock(&amp;blocked_lock_lock);</div><div class='del'>-	list_splice_init(&amp;fl-&gt;fl_blocked_requests, &amp;new-&gt;fl_blocked_requests);</div><div class='del'>-	list_for_each_entry(f, &amp;new-&gt;fl_blocked_requests, fl_blocked_member)</div><div class='del'>-		f-&gt;fl_blocker = new;</div><div class='add'>+	list_splice_init(&amp;fl-&gt;c.flc_blocked_requests,</div><div class='add'>+			 &amp;new-&gt;c.flc_blocked_requests);</div><div class='add'>+	list_for_each_entry(f, &amp;new-&gt;c.flc_blocked_requests,</div><div class='add'>+			    c.flc_blocked_member)</div><div class='add'>+		f-&gt;c.flc_blocker = &amp;new-&gt;c;</div><div class='ctx'> 	spin_unlock(&amp;blocked_lock_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -367,39 +462,25 @@ static inline int flock_translate_cmd(int cmd) {</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Fill in a file_lock structure with an appropriate FLOCK lock. */</div><div class='del'>-static struct file_lock *</div><div class='del'>-flock_make_lock(struct file *filp, unsigned int cmd, struct file_lock *fl)</div><div class='add'>+static void flock_make_lock(struct file *filp, struct file_lock *fl, int type)</div><div class='ctx'> {</div><div class='del'>-	int type = flock_translate_cmd(cmd);</div><div class='del'>-</div><div class='del'>-	if (type &lt; 0)</div><div class='del'>-		return ERR_PTR(type);</div><div class='del'>-</div><div class='del'>-	if (fl == NULL) {</div><div class='del'>-		fl = locks_alloc_lock();</div><div class='del'>-		if (fl == NULL)</div><div class='del'>-			return ERR_PTR(-ENOMEM);</div><div class='del'>-	} else {</div><div class='del'>-		locks_init_lock(fl);</div><div class='del'>-	}</div><div class='add'>+	locks_init_lock(fl);</div><div class='ctx'> </div><div class='del'>-	fl-&gt;fl_file = filp;</div><div class='del'>-	fl-&gt;fl_owner = filp;</div><div class='del'>-	fl-&gt;fl_pid = current-&gt;tgid;</div><div class='del'>-	fl-&gt;fl_flags = FL_FLOCK;</div><div class='del'>-	fl-&gt;fl_type = type;</div><div class='add'>+	fl-&gt;c.flc_file = filp;</div><div class='add'>+	fl-&gt;c.flc_owner = filp;</div><div class='add'>+	fl-&gt;c.flc_pid = current-&gt;tgid;</div><div class='add'>+	fl-&gt;c.flc_flags = FL_FLOCK;</div><div class='add'>+	fl-&gt;c.flc_type = type;</div><div class='ctx'> 	fl-&gt;fl_end = OFFSET_MAX;</div><div class='del'>-</div><div class='del'>-	return fl;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int assign_type(struct file_lock *fl, long type)</div><div class='add'>+static int assign_type(struct file_lock_core *flc, int type)</div><div class='ctx'> {</div><div class='ctx'> 	switch (type) {</div><div class='ctx'> 	case F_RDLCK:</div><div class='ctx'> 	case F_WRLCK:</div><div class='ctx'> 	case F_UNLCK:</div><div class='del'>-		fl-&gt;fl_type = type;</div><div class='add'>+		flc-&gt;flc_type = type;</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		return -EINVAL;</div><div class='hunk'>@@ -444,14 +525,14 @@ static int flock64_to_posix_lock(struct file *filp, struct file_lock *fl,</div><div class='ctx'> 	} else</div><div class='ctx'> 		fl-&gt;fl_end = OFFSET_MAX;</div><div class='ctx'> </div><div class='del'>-	fl-&gt;fl_owner = current-&gt;files;</div><div class='del'>-	fl-&gt;fl_pid = current-&gt;tgid;</div><div class='del'>-	fl-&gt;fl_file = filp;</div><div class='del'>-	fl-&gt;fl_flags = FL_POSIX;</div><div class='add'>+	fl-&gt;c.flc_owner = current-&gt;files;</div><div class='add'>+	fl-&gt;c.flc_pid = current-&gt;tgid;</div><div class='add'>+	fl-&gt;c.flc_file = filp;</div><div class='add'>+	fl-&gt;c.flc_flags = FL_POSIX;</div><div class='ctx'> 	fl-&gt;fl_ops = NULL;</div><div class='ctx'> 	fl-&gt;fl_lmops = NULL;</div><div class='ctx'> </div><div class='del'>-	return assign_type(fl, l-&gt;l_type);</div><div class='add'>+	return assign_type(&amp;fl-&gt;c, l-&gt;l_type);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Verify a "struct flock" and copy it to a "struct file_lock" as a POSIX</div><div class='hunk'>@@ -472,16 +553,16 @@ static int flock_to_posix_lock(struct file *filp, struct file_lock *fl,</div><div class='ctx'> </div><div class='ctx'> /* default lease lock manager operations */</div><div class='ctx'> static bool</div><div class='del'>-lease_break_callback(struct file_lock *fl)</div><div class='add'>+lease_break_callback(struct file_lease *fl)</div><div class='ctx'> {</div><div class='ctx'> 	kill_fasync(&amp;fl-&gt;fl_fasync, SIGIO, POLL_MSG);</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='del'>-lease_setup(struct file_lock *fl, void **priv)</div><div class='add'>+lease_setup(struct file_lease *fl, void **priv)</div><div class='ctx'> {</div><div class='del'>-	struct file *filp = fl-&gt;fl_file;</div><div class='add'>+	struct file *filp = fl-&gt;c.flc_file;</div><div class='ctx'> 	struct fasync_struct *fa = *priv;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -495,7 +576,7 @@ lease_setup(struct file_lock *fl, void **priv)</div><div class='ctx'> 	__f_setown(filp, task_pid(current), PIDTYPE_TGID, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static const struct lock_manager_operations lease_manager_ops = {</div><div class='add'>+static const struct lease_manager_operations lease_manager_ops = {</div><div class='ctx'> 	.lm_break = lease_break_callback,</div><div class='ctx'> 	.lm_change = lease_modify,</div><div class='ctx'> 	.lm_setup = lease_setup,</div><div class='hunk'>@@ -504,35 +585,32 @@ static const struct lock_manager_operations lease_manager_ops = {</div><div class='ctx'> /*</div><div class='ctx'>  * Initialize a lease, use the default lock manager operations</div><div class='ctx'>  */</div><div class='del'>-static int lease_init(struct file *filp, long type, struct file_lock *fl)</div><div class='add'>+static int lease_init(struct file *filp, unsigned int flags, int type, struct file_lease *fl)</div><div class='ctx'> {</div><div class='del'>-	if (assign_type(fl, type) != 0)</div><div class='add'>+	if (assign_type(&amp;fl-&gt;c, type) != 0)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	fl-&gt;fl_owner = filp;</div><div class='del'>-	fl-&gt;fl_pid = current-&gt;tgid;</div><div class='add'>+	fl-&gt;c.flc_owner = filp;</div><div class='add'>+	fl-&gt;c.flc_pid = current-&gt;tgid;</div><div class='ctx'> </div><div class='del'>-	fl-&gt;fl_file = filp;</div><div class='del'>-	fl-&gt;fl_flags = FL_LEASE;</div><div class='del'>-	fl-&gt;fl_start = 0;</div><div class='del'>-	fl-&gt;fl_end = OFFSET_MAX;</div><div class='del'>-	fl-&gt;fl_ops = NULL;</div><div class='add'>+	fl-&gt;c.flc_file = filp;</div><div class='add'>+	fl-&gt;c.flc_flags = flags;</div><div class='ctx'> 	fl-&gt;fl_lmops = &amp;lease_manager_ops;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Allocate a file_lock initialised to this type of lease */</div><div class='del'>-static struct file_lock *lease_alloc(struct file *filp, long type)</div><div class='add'>+static struct file_lease *lease_alloc(struct file *filp, unsigned int flags, int type)</div><div class='ctx'> {</div><div class='del'>-	struct file_lock *fl = locks_alloc_lock();</div><div class='add'>+	struct file_lease *fl = locks_alloc_lease();</div><div class='ctx'> 	int error = -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	if (fl == NULL)</div><div class='ctx'> 		return ERR_PTR(error);</div><div class='ctx'> </div><div class='del'>-	error = lease_init(filp, type, fl);</div><div class='add'>+	error = lease_init(filp, flags, type, fl);</div><div class='ctx'> 	if (error) {</div><div class='del'>-		locks_free_lock(fl);</div><div class='add'>+		locks_free_lease(fl);</div><div class='ctx'> 		return ERR_PTR(error);</div><div class='ctx'> 	}</div><div class='ctx'> 	return fl;</div><div class='hunk'>@@ -549,26 +627,26 @@ static inline int locks_overlap(struct file_lock *fl1, struct file_lock *fl2)</div><div class='ctx'> /*</div><div class='ctx'>  * Check whether two locks have the same owner.</div><div class='ctx'>  */</div><div class='del'>-static int posix_same_owner(struct file_lock *fl1, struct file_lock *fl2)</div><div class='add'>+static int posix_same_owner(struct file_lock_core *fl1, struct file_lock_core *fl2)</div><div class='ctx'> {</div><div class='del'>-	return fl1-&gt;fl_owner == fl2-&gt;fl_owner;</div><div class='add'>+	return fl1-&gt;flc_owner == fl2-&gt;flc_owner;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Must be called with the flc_lock held! */</div><div class='del'>-static void locks_insert_global_locks(struct file_lock *fl)</div><div class='add'>+static void locks_insert_global_locks(struct file_lock_core *flc)</div><div class='ctx'> {</div><div class='ctx'> 	struct file_lock_list_struct *fll = this_cpu_ptr(&amp;file_lock_list);</div><div class='ctx'> </div><div class='ctx'> 	percpu_rwsem_assert_held(&amp;file_rwsem);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;fll-&gt;lock);</div><div class='del'>-	fl-&gt;fl_link_cpu = smp_processor_id();</div><div class='del'>-	hlist_add_head(&amp;fl-&gt;fl_link, &amp;fll-&gt;hlist);</div><div class='add'>+	flc-&gt;flc_link_cpu = smp_processor_id();</div><div class='add'>+	hlist_add_head(&amp;flc-&gt;flc_link, &amp;fll-&gt;hlist);</div><div class='ctx'> 	spin_unlock(&amp;fll-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Must be called with the flc_lock held! */</div><div class='del'>-static void locks_delete_global_locks(struct file_lock *fl)</div><div class='add'>+static void locks_delete_global_locks(struct file_lock_core *flc)</div><div class='ctx'> {</div><div class='ctx'> 	struct file_lock_list_struct *fll;</div><div class='ctx'> </div><div class='hunk'>@@ -579,33 +657,33 @@ static void locks_delete_global_locks(struct file_lock *fl)</div><div class='ctx'> 	 * is done while holding the flc_lock, and new insertions into the list</div><div class='ctx'> 	 * also require that it be held.</div><div class='ctx'> 	 */</div><div class='del'>-	if (hlist_unhashed(&amp;fl-&gt;fl_link))</div><div class='add'>+	if (hlist_unhashed(&amp;flc-&gt;flc_link))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	fll = per_cpu_ptr(&amp;file_lock_list, fl-&gt;fl_link_cpu);</div><div class='add'>+	fll = per_cpu_ptr(&amp;file_lock_list, flc-&gt;flc_link_cpu);</div><div class='ctx'> 	spin_lock(&amp;fll-&gt;lock);</div><div class='del'>-	hlist_del_init(&amp;fl-&gt;fl_link);</div><div class='add'>+	hlist_del_init(&amp;flc-&gt;flc_link);</div><div class='ctx'> 	spin_unlock(&amp;fll-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static unsigned long</div><div class='del'>-posix_owner_key(struct file_lock *fl)</div><div class='add'>+posix_owner_key(struct file_lock_core *flc)</div><div class='ctx'> {</div><div class='del'>-	return (unsigned long)fl-&gt;fl_owner;</div><div class='add'>+	return (unsigned long) flc-&gt;flc_owner;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void locks_insert_global_blocked(struct file_lock *waiter)</div><div class='add'>+static void locks_insert_global_blocked(struct file_lock_core *waiter)</div><div class='ctx'> {</div><div class='ctx'> 	lockdep_assert_held(&amp;blocked_lock_lock);</div><div class='ctx'> </div><div class='del'>-	hash_add(blocked_hash, &amp;waiter-&gt;fl_link, posix_owner_key(waiter));</div><div class='add'>+	hash_add(blocked_hash, &amp;waiter-&gt;flc_link, posix_owner_key(waiter));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void locks_delete_global_blocked(struct file_lock *waiter)</div><div class='add'>+static void locks_delete_global_blocked(struct file_lock_core *waiter)</div><div class='ctx'> {</div><div class='ctx'> 	lockdep_assert_held(&amp;blocked_lock_lock);</div><div class='ctx'> </div><div class='del'>-	hash_del(&amp;waiter-&gt;fl_link);</div><div class='add'>+	hash_del(&amp;waiter-&gt;flc_link);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Remove waiter from blocker's block list.</div><div class='hunk'>@@ -613,41 +691,39 @@ static void locks_delete_global_blocked(struct file_lock *waiter)</div><div class='ctx'>  *</div><div class='ctx'>  * Must be called with blocked_lock_lock held.</div><div class='ctx'>  */</div><div class='del'>-static void __locks_delete_block(struct file_lock *waiter)</div><div class='add'>+static void __locks_unlink_block(struct file_lock_core *waiter)</div><div class='ctx'> {</div><div class='ctx'> 	locks_delete_global_blocked(waiter);</div><div class='del'>-	list_del_init(&amp;waiter-&gt;fl_blocked_member);</div><div class='add'>+	list_del_init(&amp;waiter-&gt;flc_blocked_member);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void __locks_wake_up_blocks(struct file_lock *blocker)</div><div class='add'>+static void __locks_wake_up_blocks(struct file_lock_core *blocker)</div><div class='ctx'> {</div><div class='del'>-	while (!list_empty(&amp;blocker-&gt;fl_blocked_requests)) {</div><div class='del'>-		struct file_lock *waiter;</div><div class='add'>+	while (!list_empty(&amp;blocker-&gt;flc_blocked_requests)) {</div><div class='add'>+		struct file_lock_core *waiter;</div><div class='add'>+		struct file_lock *fl;</div><div class='ctx'> </div><div class='del'>-		waiter = list_first_entry(&amp;blocker-&gt;fl_blocked_requests,</div><div class='del'>-					  struct file_lock, fl_blocked_member);</div><div class='del'>-		__locks_delete_block(waiter);</div><div class='del'>-		if (waiter-&gt;fl_lmops &amp;&amp; waiter-&gt;fl_lmops-&gt;lm_notify)</div><div class='del'>-			waiter-&gt;fl_lmops-&gt;lm_notify(waiter);</div><div class='add'>+		waiter = list_first_entry(&amp;blocker-&gt;flc_blocked_requests,</div><div class='add'>+					  struct file_lock_core, flc_blocked_member);</div><div class='add'>+</div><div class='add'>+		fl = file_lock(waiter);</div><div class='add'>+		__locks_unlink_block(waiter);</div><div class='add'>+		if ((waiter-&gt;flc_flags &amp; (FL_POSIX | FL_FLOCK)) &amp;&amp;</div><div class='add'>+		    fl-&gt;fl_lmops &amp;&amp; fl-&gt;fl_lmops-&gt;lm_notify)</div><div class='add'>+			fl-&gt;fl_lmops-&gt;lm_notify(fl);</div><div class='ctx'> 		else</div><div class='del'>-			wake_up(&amp;waiter-&gt;fl_wait);</div><div class='add'>+			locks_wake_up_waiter(waiter);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * The setting of fl_blocker to NULL marks the "done"</div><div class='add'>+		 * The setting of flc_blocker to NULL marks the "done"</div><div class='ctx'> 		 * point in deleting a block. Paired with acquire at the top</div><div class='ctx'> 		 * of locks_delete_block().</div><div class='ctx'> 		 */</div><div class='del'>-		smp_store_release(&amp;waiter-&gt;fl_blocker, NULL);</div><div class='add'>+		smp_store_release(&amp;waiter-&gt;flc_blocker, NULL);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- *	locks_delete_block - stop waiting for a file lock</div><div class='del'>- *	@waiter: the lock which was waiting</div><div class='del'>- *</div><div class='del'>- *	lockd/nfsd need to disconnect the lock while working on it.</div><div class='del'>- */</div><div class='del'>-int locks_delete_block(struct file_lock *waiter)</div><div class='add'>+static int __locks_delete_block(struct file_lock_core *waiter)</div><div class='ctx'> {</div><div class='ctx'> 	int status = -ENOENT;</div><div class='ctx'> </div><div class='hunk'>@@ -672,24 +748,35 @@ int locks_delete_block(struct file_lock *waiter)</div><div class='ctx'> 	 * no new locks can be inserted into its fl_blocked_requests list, and</div><div class='ctx'> 	 * can avoid doing anything further if the list is empty.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!smp_load_acquire(&amp;waiter-&gt;fl_blocker) &amp;&amp;</div><div class='del'>-	    list_empty(&amp;waiter-&gt;fl_blocked_requests))</div><div class='add'>+	if (!smp_load_acquire(&amp;waiter-&gt;flc_blocker) &amp;&amp;</div><div class='add'>+	    list_empty(&amp;waiter-&gt;flc_blocked_requests))</div><div class='ctx'> 		return status;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;blocked_lock_lock);</div><div class='del'>-	if (waiter-&gt;fl_blocker)</div><div class='add'>+	if (waiter-&gt;flc_blocker)</div><div class='ctx'> 		status = 0;</div><div class='ctx'> 	__locks_wake_up_blocks(waiter);</div><div class='del'>-	__locks_delete_block(waiter);</div><div class='add'>+	__locks_unlink_block(waiter);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The setting of fl_blocker to NULL marks the "done" point in deleting</div><div class='ctx'> 	 * a block. Paired with acquire at the top of this function.</div><div class='ctx'> 	 */</div><div class='del'>-	smp_store_release(&amp;waiter-&gt;fl_blocker, NULL);</div><div class='add'>+	smp_store_release(&amp;waiter-&gt;flc_blocker, NULL);</div><div class='ctx'> 	spin_unlock(&amp;blocked_lock_lock);</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ *	locks_delete_block - stop waiting for a file lock</div><div class='add'>+ *	@waiter: the lock which was waiting</div><div class='add'>+ *</div><div class='add'>+ *	lockd/nfsd need to disconnect the lock while working on it.</div><div class='add'>+ */</div><div class='add'>+int locks_delete_block(struct file_lock *waiter)</div><div class='add'>+{</div><div class='add'>+	return __locks_delete_block(&amp;waiter-&gt;c);</div><div class='add'>+}</div><div class='ctx'> EXPORT_SYMBOL(locks_delete_block);</div><div class='ctx'> </div><div class='ctx'> /* Insert waiter into blocker's block list.</div><div class='hunk'>@@ -707,26 +794,28 @@ EXPORT_SYMBOL(locks_delete_block);</div><div class='ctx'>  * waiters, and add beneath any waiter that blocks the new waiter.</div><div class='ctx'>  * Thus wakeups don't happen until needed.</div><div class='ctx'>  */</div><div class='del'>-static void __locks_insert_block(struct file_lock *blocker,</div><div class='del'>-				 struct file_lock *waiter,</div><div class='del'>-				 bool conflict(struct file_lock *,</div><div class='del'>-					       struct file_lock *))</div><div class='add'>+static void __locks_insert_block(struct file_lock_core *blocker,</div><div class='add'>+				 struct file_lock_core *waiter,</div><div class='add'>+				 bool conflict(struct file_lock_core *,</div><div class='add'>+					       struct file_lock_core *))</div><div class='ctx'> {</div><div class='del'>-	struct file_lock *fl;</div><div class='del'>-	BUG_ON(!list_empty(&amp;waiter-&gt;fl_blocked_member));</div><div class='add'>+	struct file_lock_core *flc;</div><div class='ctx'> </div><div class='add'>+	BUG_ON(!list_empty(&amp;waiter-&gt;flc_blocked_member));</div><div class='ctx'> new_blocker:</div><div class='del'>-	list_for_each_entry(fl, &amp;blocker-&gt;fl_blocked_requests, fl_blocked_member)</div><div class='del'>-		if (conflict(fl, waiter)) {</div><div class='del'>-			blocker =  fl;</div><div class='add'>+	list_for_each_entry(flc, &amp;blocker-&gt;flc_blocked_requests, flc_blocked_member)</div><div class='add'>+		if (conflict(flc, waiter)) {</div><div class='add'>+			blocker =  flc;</div><div class='ctx'> 			goto new_blocker;</div><div class='ctx'> 		}</div><div class='del'>-	waiter-&gt;fl_blocker = blocker;</div><div class='del'>-	list_add_tail(&amp;waiter-&gt;fl_blocked_member, &amp;blocker-&gt;fl_blocked_requests);</div><div class='del'>-	if (IS_POSIX(blocker) &amp;&amp; !IS_OFDLCK(blocker))</div><div class='add'>+	waiter-&gt;flc_blocker = blocker;</div><div class='add'>+	list_add_tail(&amp;waiter-&gt;flc_blocked_member,</div><div class='add'>+		      &amp;blocker-&gt;flc_blocked_requests);</div><div class='add'>+</div><div class='add'>+	if ((blocker-&gt;flc_flags &amp; (FL_POSIX|FL_OFDLCK)) == FL_POSIX)</div><div class='ctx'> 		locks_insert_global_blocked(waiter);</div><div class='ctx'> </div><div class='del'>-	/* The requests in waiter-&gt;fl_blocked are known to conflict with</div><div class='add'>+	/* The requests in waiter-&gt;flc_blocked are known to conflict with</div><div class='ctx'> 	 * waiter, but might not conflict with blocker, or the requests</div><div class='ctx'> 	 * and lock which block it.  So they all need to be woken.</div><div class='ctx'> 	 */</div><div class='hunk'>@@ -734,10 +823,10 @@ new_blocker:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Must be called with flc_lock held. */</div><div class='del'>-static void locks_insert_block(struct file_lock *blocker,</div><div class='del'>-			       struct file_lock *waiter,</div><div class='del'>-			       bool conflict(struct file_lock *,</div><div class='del'>-					     struct file_lock *))</div><div class='add'>+static void locks_insert_block(struct file_lock_core *blocker,</div><div class='add'>+			       struct file_lock_core *waiter,</div><div class='add'>+			       bool conflict(struct file_lock_core *,</div><div class='add'>+					     struct file_lock_core *))</div><div class='ctx'> {</div><div class='ctx'> 	spin_lock(&amp;blocked_lock_lock);</div><div class='ctx'> 	__locks_insert_block(blocker, waiter, conflict);</div><div class='hunk'>@@ -749,7 +838,7 @@ static void locks_insert_block(struct file_lock *blocker,</div><div class='ctx'>  *</div><div class='ctx'>  * Must be called with the inode-&gt;flc_lock held!</div><div class='ctx'>  */</div><div class='del'>-static void locks_wake_up_blocks(struct file_lock *blocker)</div><div class='add'>+static void locks_wake_up_blocks(struct file_lock_core *blocker)</div><div class='ctx'> {</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Avoid taking global lock if list is empty. This is safe since new</div><div class='hunk'>@@ -758,7 +847,7 @@ static void locks_wake_up_blocks(struct file_lock *blocker)</div><div class='ctx'> 	 * fl_blocked_requests list does not require the flc_lock, so we must</div><div class='ctx'> 	 * recheck list_empty() after acquiring the blocked_lock_lock.</div><div class='ctx'> 	 */</div><div class='del'>-	if (list_empty(&amp;blocker-&gt;fl_blocked_requests))</div><div class='add'>+	if (list_empty(&amp;blocker-&gt;flc_blocked_requests))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;blocked_lock_lock);</div><div class='hunk'>@@ -767,39 +856,39 @@ static void locks_wake_up_blocks(struct file_lock *blocker)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='del'>-locks_insert_lock_ctx(struct file_lock *fl, struct list_head *before)</div><div class='add'>+locks_insert_lock_ctx(struct file_lock_core *fl, struct list_head *before)</div><div class='ctx'> {</div><div class='del'>-	list_add_tail(&amp;fl-&gt;fl_list, before);</div><div class='add'>+	list_add_tail(&amp;fl-&gt;flc_list, before);</div><div class='ctx'> 	locks_insert_global_locks(fl);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='del'>-locks_unlink_lock_ctx(struct file_lock *fl)</div><div class='add'>+locks_unlink_lock_ctx(struct file_lock_core *fl)</div><div class='ctx'> {</div><div class='ctx'> 	locks_delete_global_locks(fl);</div><div class='del'>-	list_del_init(&amp;fl-&gt;fl_list);</div><div class='add'>+	list_del_init(&amp;fl-&gt;flc_list);</div><div class='ctx'> 	locks_wake_up_blocks(fl);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='del'>-locks_delete_lock_ctx(struct file_lock *fl, struct list_head *dispose)</div><div class='add'>+locks_delete_lock_ctx(struct file_lock_core *fl, struct list_head *dispose)</div><div class='ctx'> {</div><div class='ctx'> 	locks_unlink_lock_ctx(fl);</div><div class='ctx'> 	if (dispose)</div><div class='del'>-		list_add(&amp;fl-&gt;fl_list, dispose);</div><div class='add'>+		list_add(&amp;fl-&gt;flc_list, dispose);</div><div class='ctx'> 	else</div><div class='del'>-		locks_free_lock(fl);</div><div class='add'>+		locks_free_lock(file_lock(fl));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Determine if lock sys_fl blocks lock caller_fl. Common functionality</div><div class='ctx'>  * checks for shared/exclusive status of overlapping locks.</div><div class='ctx'>  */</div><div class='del'>-static bool locks_conflict(struct file_lock *caller_fl,</div><div class='del'>-			   struct file_lock *sys_fl)</div><div class='add'>+static bool locks_conflict(struct file_lock_core *caller_flc,</div><div class='add'>+			   struct file_lock_core *sys_flc)</div><div class='ctx'> {</div><div class='del'>-	if (sys_fl-&gt;fl_type == F_WRLCK)</div><div class='add'>+	if (sys_flc-&gt;flc_type == F_WRLCK)</div><div class='ctx'> 		return true;</div><div class='del'>-	if (caller_fl-&gt;fl_type == F_WRLCK)</div><div class='add'>+	if (caller_flc-&gt;flc_type == F_WRLCK)</div><div class='ctx'> 		return true;</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='hunk'>@@ -807,35 +896,56 @@ static bool locks_conflict(struct file_lock *caller_fl,</div><div class='ctx'> /* Determine if lock sys_fl blocks lock caller_fl. POSIX specific</div><div class='ctx'>  * checking before calling the locks_conflict().</div><div class='ctx'>  */</div><div class='del'>-static bool posix_locks_conflict(struct file_lock *caller_fl,</div><div class='del'>-				 struct file_lock *sys_fl)</div><div class='add'>+static bool posix_locks_conflict(struct file_lock_core *caller_flc,</div><div class='add'>+				 struct file_lock_core *sys_flc)</div><div class='ctx'> {</div><div class='add'>+	struct file_lock *caller_fl = file_lock(caller_flc);</div><div class='add'>+	struct file_lock *sys_fl = file_lock(sys_flc);</div><div class='add'>+</div><div class='ctx'> 	/* POSIX locks owned by the same process do not conflict with</div><div class='ctx'> 	 * each other.</div><div class='ctx'> 	 */</div><div class='del'>-	if (posix_same_owner(caller_fl, sys_fl))</div><div class='add'>+	if (posix_same_owner(caller_flc, sys_flc))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='ctx'> 	/* Check whether they overlap */</div><div class='ctx'> 	if (!locks_overlap(caller_fl, sys_fl))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	return locks_conflict(caller_fl, sys_fl);</div><div class='add'>+	return locks_conflict(caller_flc, sys_flc);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Determine if lock sys_fl blocks lock caller_fl. Used on xx_GETLK</div><div class='add'>+ * path so checks for additional GETLK-specific things like F_UNLCK.</div><div class='add'>+ */</div><div class='add'>+static bool posix_test_locks_conflict(struct file_lock *caller_fl,</div><div class='add'>+				      struct file_lock *sys_fl)</div><div class='add'>+{</div><div class='add'>+	struct file_lock_core *caller = &amp;caller_fl-&gt;c;</div><div class='add'>+	struct file_lock_core *sys = &amp;sys_fl-&gt;c;</div><div class='add'>+</div><div class='add'>+	/* F_UNLCK checks any locks on the same fd. */</div><div class='add'>+	if (lock_is_unlock(caller_fl)) {</div><div class='add'>+		if (!posix_same_owner(caller, sys))</div><div class='add'>+			return false;</div><div class='add'>+		return locks_overlap(caller_fl, sys_fl);</div><div class='add'>+	}</div><div class='add'>+	return posix_locks_conflict(caller, sys);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Determine if lock sys_fl blocks lock caller_fl. FLOCK specific</div><div class='ctx'>  * checking before calling the locks_conflict().</div><div class='ctx'>  */</div><div class='del'>-static bool flock_locks_conflict(struct file_lock *caller_fl,</div><div class='del'>-				 struct file_lock *sys_fl)</div><div class='add'>+static bool flock_locks_conflict(struct file_lock_core *caller_flc,</div><div class='add'>+				 struct file_lock_core *sys_flc)</div><div class='ctx'> {</div><div class='ctx'> 	/* FLOCK locks referring to the same filp do not conflict with</div><div class='ctx'> 	 * each other.</div><div class='ctx'> 	 */</div><div class='del'>-	if (caller_fl-&gt;fl_file == sys_fl-&gt;fl_file)</div><div class='add'>+	if (caller_flc-&gt;flc_file == sys_flc-&gt;flc_file)</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	return locks_conflict(caller_fl, sys_fl);</div><div class='add'>+	return locks_conflict(caller_flc, sys_flc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void</div><div class='hunk'>@@ -843,22 +953,35 @@ posix_test_lock(struct file *filp, struct file_lock *fl)</div><div class='ctx'> {</div><div class='ctx'> 	struct file_lock *cfl;</div><div class='ctx'> 	struct file_lock_context *ctx;</div><div class='del'>-	struct inode *inode = locks_inode(filp);</div><div class='add'>+	struct inode *inode = file_inode(filp);</div><div class='add'>+	void *owner;</div><div class='add'>+	void (*func)(void);</div><div class='ctx'> </div><div class='del'>-	ctx = smp_load_acquire(&amp;inode-&gt;i_flctx);</div><div class='add'>+	ctx = locks_inode_context(inode);</div><div class='ctx'> 	if (!ctx || list_empty_careful(&amp;ctx-&gt;flc_posix)) {</div><div class='del'>-		fl-&gt;fl_type = F_UNLCK;</div><div class='add'>+		fl-&gt;c.flc_type = F_UNLCK;</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+retry:</div><div class='ctx'> 	spin_lock(&amp;ctx-&gt;flc_lock);</div><div class='del'>-	list_for_each_entry(cfl, &amp;ctx-&gt;flc_posix, fl_list) {</div><div class='del'>-		if (posix_locks_conflict(fl, cfl)) {</div><div class='del'>-			locks_copy_conflock(fl, cfl);</div><div class='del'>-			goto out;</div><div class='add'>+	list_for_each_entry(cfl, &amp;ctx-&gt;flc_posix, c.flc_list) {</div><div class='add'>+		if (!posix_test_locks_conflict(fl, cfl))</div><div class='add'>+			continue;</div><div class='add'>+		if (cfl-&gt;fl_lmops &amp;&amp; cfl-&gt;fl_lmops-&gt;lm_lock_expirable</div><div class='add'>+			&amp;&amp; (*cfl-&gt;fl_lmops-&gt;lm_lock_expirable)(cfl)) {</div><div class='add'>+			owner = cfl-&gt;fl_lmops-&gt;lm_mod_owner;</div><div class='add'>+			func = cfl-&gt;fl_lmops-&gt;lm_expire_lock;</div><div class='add'>+			__module_get(owner);</div><div class='add'>+			spin_unlock(&amp;ctx-&gt;flc_lock);</div><div class='add'>+			(*func)();</div><div class='add'>+			module_put(owner);</div><div class='add'>+			goto retry;</div><div class='ctx'> 		}</div><div class='add'>+		locks_copy_conflock(fl, cfl);</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	fl-&gt;fl_type = F_UNLCK;</div><div class='add'>+	fl-&gt;c.flc_type = F_UNLCK;</div><div class='ctx'> out:</div><div class='ctx'> 	spin_unlock(&amp;ctx-&gt;flc_lock);</div><div class='ctx'> 	return;</div><div class='hunk'>@@ -900,25 +1023,27 @@ EXPORT_SYMBOL(posix_test_lock);</div><div class='ctx'> </div><div class='ctx'> #define MAX_DEADLK_ITERATIONS 10</div><div class='ctx'> </div><div class='del'>-/* Find a lock that the owner of the given block_fl is blocking on. */</div><div class='del'>-static struct file_lock *what_owner_is_waiting_for(struct file_lock *block_fl)</div><div class='add'>+/* Find a lock that the owner of the given @blocker is blocking on. */</div><div class='add'>+static struct file_lock_core *what_owner_is_waiting_for(struct file_lock_core *blocker)</div><div class='ctx'> {</div><div class='del'>-	struct file_lock *fl;</div><div class='add'>+	struct file_lock_core *flc;</div><div class='ctx'> </div><div class='del'>-	hash_for_each_possible(blocked_hash, fl, fl_link, posix_owner_key(block_fl)) {</div><div class='del'>-		if (posix_same_owner(fl, block_fl)) {</div><div class='del'>-			while (fl-&gt;fl_blocker)</div><div class='del'>-				fl = fl-&gt;fl_blocker;</div><div class='del'>-			return fl;</div><div class='add'>+	hash_for_each_possible(blocked_hash, flc, flc_link, posix_owner_key(blocker)) {</div><div class='add'>+		if (posix_same_owner(flc, blocker)) {</div><div class='add'>+			while (flc-&gt;flc_blocker)</div><div class='add'>+				flc = flc-&gt;flc_blocker;</div><div class='add'>+			return flc;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Must be called with the blocked_lock_lock held! */</div><div class='del'>-static int posix_locks_deadlock(struct file_lock *caller_fl,</div><div class='del'>-				struct file_lock *block_fl)</div><div class='add'>+static bool posix_locks_deadlock(struct file_lock *caller_fl,</div><div class='add'>+				 struct file_lock *block_fl)</div><div class='ctx'> {</div><div class='add'>+	struct file_lock_core *caller = &amp;caller_fl-&gt;c;</div><div class='add'>+	struct file_lock_core *blocker = &amp;block_fl-&gt;c;</div><div class='ctx'> 	int i = 0;</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;blocked_lock_lock);</div><div class='hunk'>@@ -927,16 +1052,16 @@ static int posix_locks_deadlock(struct file_lock *caller_fl,</div><div class='ctx'> 	 * This deadlock detector can't reasonably detect deadlocks with</div><div class='ctx'> 	 * FL_OFDLCK locks, since they aren't owned by a process, per-se.</div><div class='ctx'> 	 */</div><div class='del'>-	if (IS_OFDLCK(caller_fl))</div><div class='del'>-		return 0;</div><div class='add'>+	if (caller-&gt;flc_flags &amp; FL_OFDLCK)</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-	while ((block_fl = what_owner_is_waiting_for(block_fl))) {</div><div class='add'>+	while ((blocker = what_owner_is_waiting_for(blocker))) {</div><div class='ctx'> 		if (i++ &gt; MAX_DEADLK_ITERATIONS)</div><div class='del'>-			return 0;</div><div class='del'>-		if (posix_same_owner(caller_fl, block_fl))</div><div class='del'>-			return 1;</div><div class='add'>+			return false;</div><div class='add'>+		if (posix_same_owner(caller, blocker))</div><div class='add'>+			return true;</div><div class='ctx'> 	}</div><div class='del'>-	return 0;</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Try to create a FLOCK lock on filp. We always insert new FLOCK locks</div><div class='hunk'>@@ -955,14 +1080,14 @@ static int flock_lock_inode(struct inode *inode, struct file_lock *request)</div><div class='ctx'> 	bool found = false;</div><div class='ctx'> 	LIST_HEAD(dispose);</div><div class='ctx'> </div><div class='del'>-	ctx = locks_get_lock_context(inode, request-&gt;fl_type);</div><div class='add'>+	ctx = locks_get_lock_context(inode, request-&gt;c.flc_type);</div><div class='ctx'> 	if (!ctx) {</div><div class='del'>-		if (request-&gt;fl_type != F_UNLCK)</div><div class='add'>+		if (request-&gt;c.flc_type != F_UNLCK)</div><div class='ctx'> 			return -ENOMEM;</div><div class='del'>-		return (request-&gt;fl_flags &amp; FL_EXISTS) ? -ENOENT : 0;</div><div class='add'>+		return (request-&gt;c.flc_flags &amp; FL_EXISTS) ? -ENOENT : 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!(request-&gt;fl_flags &amp; FL_ACCESS) &amp;&amp; (request-&gt;fl_type != F_UNLCK)) {</div><div class='add'>+	if (!(request-&gt;c.flc_flags &amp; FL_ACCESS) &amp;&amp; (request-&gt;c.flc_type != F_UNLCK)) {</div><div class='ctx'> 		new_fl = locks_alloc_lock();</div><div class='ctx'> 		if (!new_fl)</div><div class='ctx'> 			return -ENOMEM;</div><div class='hunk'>@@ -970,41 +1095,41 @@ static int flock_lock_inode(struct inode *inode, struct file_lock *request)</div><div class='ctx'> </div><div class='ctx'> 	percpu_down_read(&amp;file_rwsem);</div><div class='ctx'> 	spin_lock(&amp;ctx-&gt;flc_lock);</div><div class='del'>-	if (request-&gt;fl_flags &amp; FL_ACCESS)</div><div class='add'>+	if (request-&gt;c.flc_flags &amp; FL_ACCESS)</div><div class='ctx'> 		goto find_conflict;</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry(fl, &amp;ctx-&gt;flc_flock, fl_list) {</div><div class='del'>-		if (request-&gt;fl_file != fl-&gt;fl_file)</div><div class='add'>+	list_for_each_entry(fl, &amp;ctx-&gt;flc_flock, c.flc_list) {</div><div class='add'>+		if (request-&gt;c.flc_file != fl-&gt;c.flc_file)</div><div class='ctx'> 			continue;</div><div class='del'>-		if (request-&gt;fl_type == fl-&gt;fl_type)</div><div class='add'>+		if (request-&gt;c.flc_type == fl-&gt;c.flc_type)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		found = true;</div><div class='del'>-		locks_delete_lock_ctx(fl, &amp;dispose);</div><div class='add'>+		locks_delete_lock_ctx(&amp;fl-&gt;c, &amp;dispose);</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (request-&gt;fl_type == F_UNLCK) {</div><div class='del'>-		if ((request-&gt;fl_flags &amp; FL_EXISTS) &amp;&amp; !found)</div><div class='add'>+	if (lock_is_unlock(request)) {</div><div class='add'>+		if ((request-&gt;c.flc_flags &amp; FL_EXISTS) &amp;&amp; !found)</div><div class='ctx'> 			error = -ENOENT;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> find_conflict:</div><div class='del'>-	list_for_each_entry(fl, &amp;ctx-&gt;flc_flock, fl_list) {</div><div class='del'>-		if (!flock_locks_conflict(request, fl))</div><div class='add'>+	list_for_each_entry(fl, &amp;ctx-&gt;flc_flock, c.flc_list) {</div><div class='add'>+		if (!flock_locks_conflict(&amp;request-&gt;c, &amp;fl-&gt;c))</div><div class='ctx'> 			continue;</div><div class='ctx'> 		error = -EAGAIN;</div><div class='del'>-		if (!(request-&gt;fl_flags &amp; FL_SLEEP))</div><div class='add'>+		if (!(request-&gt;c.flc_flags &amp; FL_SLEEP))</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		error = FILE_LOCK_DEFERRED;</div><div class='del'>-		locks_insert_block(fl, request, flock_locks_conflict);</div><div class='add'>+		locks_insert_block(&amp;fl-&gt;c, &amp;request-&gt;c, flock_locks_conflict);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (request-&gt;fl_flags &amp; FL_ACCESS)</div><div class='add'>+	if (request-&gt;c.flc_flags &amp; FL_ACCESS)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	locks_copy_lock(new_fl, request);</div><div class='ctx'> 	locks_move_blocks(new_fl, request);</div><div class='del'>-	locks_insert_lock_ctx(new_fl, &amp;ctx-&gt;flc_flock);</div><div class='add'>+	locks_insert_lock_ctx(&amp;new_fl-&gt;c, &amp;ctx-&gt;flc_flock);</div><div class='ctx'> 	new_fl = NULL;</div><div class='ctx'> 	error = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -1030,10 +1155,12 @@ static int posix_lock_inode(struct inode *inode, struct file_lock *request,</div><div class='ctx'> 	int error;</div><div class='ctx'> 	bool added = false;</div><div class='ctx'> 	LIST_HEAD(dispose);</div><div class='add'>+	void *owner;</div><div class='add'>+	void (*func)(void);</div><div class='ctx'> </div><div class='del'>-	ctx = locks_get_lock_context(inode, request-&gt;fl_type);</div><div class='add'>+	ctx = locks_get_lock_context(inode, request-&gt;c.flc_type);</div><div class='ctx'> 	if (!ctx)</div><div class='del'>-		return (request-&gt;fl_type == F_UNLCK) ? 0 : -ENOMEM;</div><div class='add'>+		return lock_is_unlock(request) ? 0 : -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We may need two file_lock structures for this operation,</div><div class='hunk'>@@ -1041,13 +1168,14 @@ static int posix_lock_inode(struct inode *inode, struct file_lock *request,</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * In some cases we can be sure, that no new locks will be needed</div><div class='ctx'> 	 */</div><div class='del'>-	if (!(request-&gt;fl_flags &amp; FL_ACCESS) &amp;&amp;</div><div class='del'>-	    (request-&gt;fl_type != F_UNLCK ||</div><div class='add'>+	if (!(request-&gt;c.flc_flags &amp; FL_ACCESS) &amp;&amp;</div><div class='add'>+	    (request-&gt;c.flc_type != F_UNLCK ||</div><div class='ctx'> 	     request-&gt;fl_start != 0 || request-&gt;fl_end != OFFSET_MAX)) {</div><div class='ctx'> 		new_fl = locks_alloc_lock();</div><div class='ctx'> 		new_fl2 = locks_alloc_lock();</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+retry:</div><div class='ctx'> 	percpu_down_read(&amp;file_rwsem);</div><div class='ctx'> 	spin_lock(&amp;ctx-&gt;flc_lock);</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1055,14 +1183,25 @@ static int posix_lock_inode(struct inode *inode, struct file_lock *request,</div><div class='ctx'> 	 * there are any, either return error or put the request on the</div><div class='ctx'> 	 * blocker's list of waiters and the global blocked_hash.</div><div class='ctx'> 	 */</div><div class='del'>-	if (request-&gt;fl_type != F_UNLCK) {</div><div class='del'>-		list_for_each_entry(fl, &amp;ctx-&gt;flc_posix, fl_list) {</div><div class='del'>-			if (!posix_locks_conflict(request, fl))</div><div class='add'>+	if (request-&gt;c.flc_type != F_UNLCK) {</div><div class='add'>+		list_for_each_entry(fl, &amp;ctx-&gt;flc_posix, c.flc_list) {</div><div class='add'>+			if (!posix_locks_conflict(&amp;request-&gt;c, &amp;fl-&gt;c))</div><div class='ctx'> 				continue;</div><div class='add'>+			if (fl-&gt;fl_lmops &amp;&amp; fl-&gt;fl_lmops-&gt;lm_lock_expirable</div><div class='add'>+				&amp;&amp; (*fl-&gt;fl_lmops-&gt;lm_lock_expirable)(fl)) {</div><div class='add'>+				owner = fl-&gt;fl_lmops-&gt;lm_mod_owner;</div><div class='add'>+				func = fl-&gt;fl_lmops-&gt;lm_expire_lock;</div><div class='add'>+				__module_get(owner);</div><div class='add'>+				spin_unlock(&amp;ctx-&gt;flc_lock);</div><div class='add'>+				percpu_up_read(&amp;file_rwsem);</div><div class='add'>+				(*func)();</div><div class='add'>+				module_put(owner);</div><div class='add'>+				goto retry;</div><div class='add'>+			}</div><div class='ctx'> 			if (conflock)</div><div class='ctx'> 				locks_copy_conflock(conflock, fl);</div><div class='ctx'> 			error = -EAGAIN;</div><div class='del'>-			if (!(request-&gt;fl_flags &amp; FL_SLEEP))</div><div class='add'>+			if (!(request-&gt;c.flc_flags &amp; FL_SLEEP))</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Deadlock detection and insertion into the blocked</div><div class='hunk'>@@ -1074,10 +1213,10 @@ static int posix_lock_inode(struct inode *inode, struct file_lock *request,</div><div class='ctx'> 			 * Ensure that we don't find any locks blocked on this</div><div class='ctx'> 			 * request during deadlock detection.</div><div class='ctx'> 			 */</div><div class='del'>-			__locks_wake_up_blocks(request);</div><div class='add'>+			__locks_wake_up_blocks(&amp;request-&gt;c);</div><div class='ctx'> 			if (likely(!posix_locks_deadlock(request, fl))) {</div><div class='ctx'> 				error = FILE_LOCK_DEFERRED;</div><div class='del'>-				__locks_insert_block(fl, request,</div><div class='add'>+				__locks_insert_block(&amp;fl-&gt;c, &amp;request-&gt;c,</div><div class='ctx'> 						     posix_locks_conflict);</div><div class='ctx'> 			}</div><div class='ctx'> 			spin_unlock(&amp;blocked_lock_lock);</div><div class='hunk'>@@ -1087,22 +1226,22 @@ static int posix_lock_inode(struct inode *inode, struct file_lock *request,</div><div class='ctx'> </div><div class='ctx'> 	/* If we're just looking for a conflict, we're done. */</div><div class='ctx'> 	error = 0;</div><div class='del'>-	if (request-&gt;fl_flags &amp; FL_ACCESS)</div><div class='add'>+	if (request-&gt;c.flc_flags &amp; FL_ACCESS)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	/* Find the first old lock with the same owner as the new lock */</div><div class='del'>-	list_for_each_entry(fl, &amp;ctx-&gt;flc_posix, fl_list) {</div><div class='del'>-		if (posix_same_owner(request, fl))</div><div class='add'>+	list_for_each_entry(fl, &amp;ctx-&gt;flc_posix, c.flc_list) {</div><div class='add'>+		if (posix_same_owner(&amp;request-&gt;c, &amp;fl-&gt;c))</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Process locks with this owner. */</div><div class='del'>-	list_for_each_entry_safe_from(fl, tmp, &amp;ctx-&gt;flc_posix, fl_list) {</div><div class='del'>-		if (!posix_same_owner(request, fl))</div><div class='add'>+	list_for_each_entry_safe_from(fl, tmp, &amp;ctx-&gt;flc_posix, c.flc_list) {</div><div class='add'>+		if (!posix_same_owner(&amp;request-&gt;c, &amp;fl-&gt;c))</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='ctx'> 		/* Detect adjacent or overlapping regions (if same lock type) */</div><div class='del'>-		if (request-&gt;fl_type == fl-&gt;fl_type) {</div><div class='add'>+		if (request-&gt;c.flc_type == fl-&gt;c.flc_type) {</div><div class='ctx'> 			/* In all comparisons of start vs end, use</div><div class='ctx'> 			 * "start - 1" rather than "end + 1". If end</div><div class='ctx'> 			 * is OFFSET_MAX, end + 1 will become negative.</div><div class='hunk'>@@ -1129,7 +1268,7 @@ static int posix_lock_inode(struct inode *inode, struct file_lock *request,</div><div class='ctx'> 			else</div><div class='ctx'> 				request-&gt;fl_end = fl-&gt;fl_end;</div><div class='ctx'> 			if (added) {</div><div class='del'>-				locks_delete_lock_ctx(fl, &amp;dispose);</div><div class='add'>+				locks_delete_lock_ctx(&amp;fl-&gt;c, &amp;dispose);</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> 			request = fl;</div><div class='hunk'>@@ -1142,7 +1281,7 @@ static int posix_lock_inode(struct inode *inode, struct file_lock *request,</div><div class='ctx'> 				continue;</div><div class='ctx'> 			if (fl-&gt;fl_start &gt; request-&gt;fl_end)</div><div class='ctx'> 				break;</div><div class='del'>-			if (request-&gt;fl_type == F_UNLCK)</div><div class='add'>+			if (lock_is_unlock(request))</div><div class='ctx'> 				added = true;</div><div class='ctx'> 			if (fl-&gt;fl_start &lt; request-&gt;fl_start)</div><div class='ctx'> 				left = fl;</div><div class='hunk'>@@ -1158,7 +1297,7 @@ static int posix_lock_inode(struct inode *inode, struct file_lock *request,</div><div class='ctx'> 				 * one (This may happen several times).</div><div class='ctx'> 				 */</div><div class='ctx'> 				if (added) {</div><div class='del'>-					locks_delete_lock_ctx(fl, &amp;dispose);</div><div class='add'>+					locks_delete_lock_ctx(&amp;fl-&gt;c, &amp;dispose);</div><div class='ctx'> 					continue;</div><div class='ctx'> 				}</div><div class='ctx'> 				/*</div><div class='hunk'>@@ -1175,8 +1314,9 @@ static int posix_lock_inode(struct inode *inode, struct file_lock *request,</div><div class='ctx'> 				locks_move_blocks(new_fl, request);</div><div class='ctx'> 				request = new_fl;</div><div class='ctx'> 				new_fl = NULL;</div><div class='del'>-				locks_insert_lock_ctx(request, &amp;fl-&gt;fl_list);</div><div class='del'>-				locks_delete_lock_ctx(fl, &amp;dispose);</div><div class='add'>+				locks_insert_lock_ctx(&amp;request-&gt;c,</div><div class='add'>+						      &amp;fl-&gt;c.flc_list);</div><div class='add'>+				locks_delete_lock_ctx(&amp;fl-&gt;c, &amp;dispose);</div><div class='ctx'> 				added = true;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1193,8 +1333,8 @@ static int posix_lock_inode(struct inode *inode, struct file_lock *request,</div><div class='ctx'> </div><div class='ctx'> 	error = 0;</div><div class='ctx'> 	if (!added) {</div><div class='del'>-		if (request-&gt;fl_type == F_UNLCK) {</div><div class='del'>-			if (request-&gt;fl_flags &amp; FL_EXISTS)</div><div class='add'>+		if (lock_is_unlock(request)) {</div><div class='add'>+			if (request-&gt;c.flc_flags &amp; FL_EXISTS)</div><div class='ctx'> 				error = -ENOENT;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1205,7 +1345,7 @@ static int posix_lock_inode(struct inode *inode, struct file_lock *request,</div><div class='ctx'> 		}</div><div class='ctx'> 		locks_copy_lock(new_fl, request);</div><div class='ctx'> 		locks_move_blocks(new_fl, request);</div><div class='del'>-		locks_insert_lock_ctx(new_fl, &amp;fl-&gt;fl_list);</div><div class='add'>+		locks_insert_lock_ctx(&amp;new_fl-&gt;c, &amp;fl-&gt;c.flc_list);</div><div class='ctx'> 		fl = new_fl;</div><div class='ctx'> 		new_fl = NULL;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1217,16 +1357,17 @@ static int posix_lock_inode(struct inode *inode, struct file_lock *request,</div><div class='ctx'> 			left = new_fl2;</div><div class='ctx'> 			new_fl2 = NULL;</div><div class='ctx'> 			locks_copy_lock(left, right);</div><div class='del'>-			locks_insert_lock_ctx(left, &amp;fl-&gt;fl_list);</div><div class='add'>+			locks_insert_lock_ctx(&amp;left-&gt;c, &amp;fl-&gt;c.flc_list);</div><div class='ctx'> 		}</div><div class='ctx'> 		right-&gt;fl_start = request-&gt;fl_end + 1;</div><div class='del'>-		locks_wake_up_blocks(right);</div><div class='add'>+		locks_wake_up_blocks(&amp;right-&gt;c);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (left) {</div><div class='ctx'> 		left-&gt;fl_end = request-&gt;fl_start - 1;</div><div class='del'>-		locks_wake_up_blocks(left);</div><div class='add'>+		locks_wake_up_blocks(&amp;left-&gt;c);</div><div class='ctx'> 	}</div><div class='ctx'>  out:</div><div class='add'>+	trace_posix_lock_inode(inode, request, error);</div><div class='ctx'> 	spin_unlock(&amp;ctx-&gt;flc_lock);</div><div class='ctx'> 	percpu_up_read(&amp;file_rwsem);</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1237,7 +1378,6 @@ static int posix_lock_inode(struct inode *inode, struct file_lock *request,</div><div class='ctx'> 	if (new_fl2)</div><div class='ctx'> 		locks_free_lock(new_fl2);</div><div class='ctx'> 	locks_dispose_list(&amp;dispose);</div><div class='del'>-	trace_posix_lock_inode(inode, request, error);</div><div class='ctx'> </div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='hunk'>@@ -1259,7 +1399,7 @@ static int posix_lock_inode(struct inode *inode, struct file_lock *request,</div><div class='ctx'> int posix_lock_file(struct file *filp, struct file_lock *fl,</div><div class='ctx'> 			struct file_lock *conflock)</div><div class='ctx'> {</div><div class='del'>-	return posix_lock_inode(locks_inode(filp), fl, conflock);</div><div class='add'>+	return posix_lock_inode(file_inode(filp), fl, conflock);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(posix_lock_file);</div><div class='ctx'> </div><div class='hunk'>@@ -1278,8 +1418,8 @@ static int posix_lock_inode_wait(struct inode *inode, struct file_lock *fl)</div><div class='ctx'> 		error = posix_lock_inode(inode, fl, NULL);</div><div class='ctx'> 		if (error != FILE_LOCK_DEFERRED)</div><div class='ctx'> 			break;</div><div class='del'>-		error = wait_event_interruptible(fl-&gt;fl_wait,</div><div class='del'>-					list_empty(&amp;fl-&gt;fl_blocked_member));</div><div class='add'>+		error = wait_event_interruptible(fl-&gt;c.flc_wait,</div><div class='add'>+						 list_empty(&amp;fl-&gt;c.flc_blocked_member));</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1287,37 +1427,37 @@ static int posix_lock_inode_wait(struct inode *inode, struct file_lock *fl)</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void lease_clear_pending(struct file_lock *fl, int arg)</div><div class='add'>+static void lease_clear_pending(struct file_lease *fl, int arg)</div><div class='ctx'> {</div><div class='ctx'> 	switch (arg) {</div><div class='ctx'> 	case F_UNLCK:</div><div class='del'>-		fl-&gt;fl_flags &amp;= ~FL_UNLOCK_PENDING;</div><div class='add'>+		fl-&gt;c.flc_flags &amp;= ~FL_UNLOCK_PENDING;</div><div class='ctx'> 		fallthrough;</div><div class='ctx'> 	case F_RDLCK:</div><div class='del'>-		fl-&gt;fl_flags &amp;= ~FL_DOWNGRADE_PENDING;</div><div class='add'>+		fl-&gt;c.flc_flags &amp;= ~FL_DOWNGRADE_PENDING;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* We already had a lease on this file; just change its type */</div><div class='del'>-int lease_modify(struct file_lock *fl, int arg, struct list_head *dispose)</div><div class='add'>+int lease_modify(struct file_lease *fl, int arg, struct list_head *dispose)</div><div class='ctx'> {</div><div class='del'>-	int error = assign_type(fl, arg);</div><div class='add'>+	int error = assign_type(&amp;fl-&gt;c, arg);</div><div class='ctx'> </div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> 	lease_clear_pending(fl, arg);</div><div class='del'>-	locks_wake_up_blocks(fl);</div><div class='add'>+	locks_wake_up_blocks(&amp;fl-&gt;c);</div><div class='ctx'> 	if (arg == F_UNLCK) {</div><div class='del'>-		struct file *filp = fl-&gt;fl_file;</div><div class='add'>+		struct file *filp = fl-&gt;c.flc_file;</div><div class='ctx'> </div><div class='ctx'> 		f_delown(filp);</div><div class='del'>-		filp-&gt;f_owner.signum = 0;</div><div class='del'>-		fasync_helper(0, fl-&gt;fl_file, 0, &amp;fl-&gt;fl_fasync);</div><div class='add'>+		file_f_owner(filp)-&gt;signum = 0;</div><div class='add'>+		fasync_helper(0, fl-&gt;c.flc_file, 0, &amp;fl-&gt;fl_fasync);</div><div class='ctx'> 		if (fl-&gt;fl_fasync != NULL) {</div><div class='ctx'> 			printk(KERN_ERR "locks_delete_lock: fasync == %p\n", fl-&gt;fl_fasync);</div><div class='ctx'> 			fl-&gt;fl_fasync = NULL;</div><div class='ctx'> 		}</div><div class='del'>-		locks_delete_lock_ctx(fl, dispose);</div><div class='add'>+		locks_delete_lock_ctx(&amp;fl-&gt;c, dispose);</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -1334,11 +1474,11 @@ static bool past_time(unsigned long then)</div><div class='ctx'> static void time_out_leases(struct inode *inode, struct list_head *dispose)</div><div class='ctx'> {</div><div class='ctx'> 	struct file_lock_context *ctx = inode-&gt;i_flctx;</div><div class='del'>-	struct file_lock *fl, *tmp;</div><div class='add'>+	struct file_lease *fl, *tmp;</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;ctx-&gt;flc_lock);</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry_safe(fl, tmp, &amp;ctx-&gt;flc_lease, fl_list) {</div><div class='add'>+	list_for_each_entry_safe(fl, tmp, &amp;ctx-&gt;flc_lease, c.flc_list) {</div><div class='ctx'> 		trace_time_out_leases(inode, fl);</div><div class='ctx'> 		if (past_time(fl-&gt;fl_downgrade_time))</div><div class='ctx'> 			lease_modify(fl, F_RDLCK, dispose);</div><div class='hunk'>@@ -1347,38 +1487,40 @@ static void time_out_leases(struct inode *inode, struct list_head *dispose)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool leases_conflict(struct file_lock *lease, struct file_lock *breaker)</div><div class='add'>+static bool leases_conflict(struct file_lock_core *lc, struct file_lock_core *bc)</div><div class='ctx'> {</div><div class='ctx'> 	bool rc;</div><div class='add'>+	struct file_lease *lease = file_lease(lc);</div><div class='add'>+	struct file_lease *breaker = file_lease(bc);</div><div class='ctx'> </div><div class='ctx'> 	if (lease-&gt;fl_lmops-&gt;lm_breaker_owns_lease</div><div class='ctx'> 			&amp;&amp; lease-&gt;fl_lmops-&gt;lm_breaker_owns_lease(lease))</div><div class='ctx'> 		return false;</div><div class='del'>-	if ((breaker-&gt;fl_flags &amp; FL_LAYOUT) != (lease-&gt;fl_flags &amp; FL_LAYOUT)) {</div><div class='add'>+	if ((bc-&gt;flc_flags &amp; FL_LAYOUT) != (lc-&gt;flc_flags &amp; FL_LAYOUT)) {</div><div class='ctx'> 		rc = false;</div><div class='ctx'> 		goto trace;</div><div class='ctx'> 	}</div><div class='del'>-	if ((breaker-&gt;fl_flags &amp; FL_DELEG) &amp;&amp; (lease-&gt;fl_flags &amp; FL_LEASE)) {</div><div class='add'>+	if ((bc-&gt;flc_flags &amp; FL_DELEG) &amp;&amp; (lc-&gt;flc_flags &amp; FL_LEASE)) {</div><div class='ctx'> 		rc = false;</div><div class='ctx'> 		goto trace;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	rc = locks_conflict(breaker, lease);</div><div class='add'>+	rc = locks_conflict(bc, lc);</div><div class='ctx'> trace:</div><div class='ctx'> 	trace_leases_conflict(rc, lease, breaker);</div><div class='ctx'> 	return rc;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool</div><div class='del'>-any_leases_conflict(struct inode *inode, struct file_lock *breaker)</div><div class='add'>+any_leases_conflict(struct inode *inode, struct file_lease *breaker)</div><div class='ctx'> {</div><div class='ctx'> 	struct file_lock_context *ctx = inode-&gt;i_flctx;</div><div class='del'>-	struct file_lock *fl;</div><div class='add'>+	struct file_lock_core *flc;</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;ctx-&gt;flc_lock);</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry(fl, &amp;ctx-&gt;flc_lease, fl_list) {</div><div class='del'>-		if (leases_conflict(fl, breaker))</div><div class='add'>+	list_for_each_entry(flc, &amp;ctx-&gt;flc_lease, flc_list) {</div><div class='add'>+		if (leases_conflict(flc, &amp;breaker-&gt;c))</div><div class='ctx'> 			return true;</div><div class='ctx'> 	}</div><div class='ctx'> 	return false;</div><div class='hunk'>@@ -1387,32 +1529,38 @@ any_leases_conflict(struct inode *inode, struct file_lock *breaker)</div><div class='ctx'> /**</div><div class='ctx'>  *	__break_lease	-	revoke all outstanding leases on file</div><div class='ctx'>  *	@inode: the inode of the file to return</div><div class='del'>- *	@mode: O_RDONLY: break only write leases; O_WRONLY or O_RDWR:</div><div class='del'>- *	    break all leases</div><div class='del'>- *	@type: FL_LEASE: break leases and delegations; FL_DELEG: break</div><div class='del'>- *	    only delegations</div><div class='add'>+ *	@flags: LEASE_BREAK_* flags</div><div class='ctx'>  *</div><div class='ctx'>  *	break_lease (inlined for speed) has checked there already is at least</div><div class='ctx'>  *	some kind of lock (maybe a lease) on this file.  Leases are broken on</div><div class='del'>- *	a call to open() or truncate().  This function can sleep unless you</div><div class='del'>- *	specified %O_NONBLOCK to your open().</div><div class='add'>+ *	a call to open() or truncate().  This function can block waiting for the</div><div class='add'>+ *	lease break unless you specify LEASE_BREAK_NONBLOCK.</div><div class='ctx'>  */</div><div class='del'>-int __break_lease(struct inode *inode, unsigned int mode, unsigned int type)</div><div class='add'>+int __break_lease(struct inode *inode, unsigned int flags)</div><div class='ctx'> {</div><div class='del'>-	int error = 0;</div><div class='add'>+	struct file_lease *new_fl, *fl, *tmp;</div><div class='ctx'> 	struct file_lock_context *ctx;</div><div class='del'>-	struct file_lock *new_fl, *fl, *tmp;</div><div class='ctx'> 	unsigned long break_time;</div><div class='del'>-	int want_write = (mode &amp; O_ACCMODE) != O_RDONLY;</div><div class='add'>+	unsigned int type;</div><div class='ctx'> 	LIST_HEAD(dispose);</div><div class='add'>+	bool want_write = !(flags &amp; LEASE_BREAK_OPEN_RDONLY);</div><div class='add'>+	int error = 0;</div><div class='add'>+</div><div class='add'>+	if (flags &amp; LEASE_BREAK_LEASE)</div><div class='add'>+		type = FL_LEASE;</div><div class='add'>+	else if (flags &amp; LEASE_BREAK_DELEG)</div><div class='add'>+		type = FL_DELEG;</div><div class='add'>+	else if (flags &amp; LEASE_BREAK_LAYOUT)</div><div class='add'>+		type = FL_LAYOUT;</div><div class='add'>+	else</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	new_fl = lease_alloc(NULL, want_write ? F_WRLCK : F_RDLCK);</div><div class='add'>+	new_fl = lease_alloc(NULL, type, want_write ? F_WRLCK : F_RDLCK);</div><div class='ctx'> 	if (IS_ERR(new_fl))</div><div class='ctx'> 		return PTR_ERR(new_fl);</div><div class='del'>-	new_fl-&gt;fl_flags = type;</div><div class='ctx'> </div><div class='ctx'> 	/* typically we will check that ctx is non-NULL before calling */</div><div class='del'>-	ctx = smp_load_acquire(&amp;inode-&gt;i_flctx);</div><div class='add'>+	ctx = locks_inode_context(inode);</div><div class='ctx'> 	if (!ctx) {</div><div class='ctx'> 		WARN_ON_ONCE(1);</div><div class='ctx'> 		goto free_lock;</div><div class='hunk'>@@ -1433,54 +1581,54 @@ int __break_lease(struct inode *inode, unsigned int mode, unsigned int type)</div><div class='ctx'> 			break_time++;	/* so that 0 means no break time */</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry_safe(fl, tmp, &amp;ctx-&gt;flc_lease, fl_list) {</div><div class='del'>-		if (!leases_conflict(fl, new_fl))</div><div class='add'>+	list_for_each_entry_safe(fl, tmp, &amp;ctx-&gt;flc_lease, c.flc_list) {</div><div class='add'>+		if (!leases_conflict(&amp;fl-&gt;c, &amp;new_fl-&gt;c))</div><div class='ctx'> 			continue;</div><div class='ctx'> 		if (want_write) {</div><div class='del'>-			if (fl-&gt;fl_flags &amp; FL_UNLOCK_PENDING)</div><div class='add'>+			if (fl-&gt;c.flc_flags &amp; FL_UNLOCK_PENDING)</div><div class='ctx'> 				continue;</div><div class='del'>-			fl-&gt;fl_flags |= FL_UNLOCK_PENDING;</div><div class='add'>+			fl-&gt;c.flc_flags |= FL_UNLOCK_PENDING;</div><div class='ctx'> 			fl-&gt;fl_break_time = break_time;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			if (lease_breaking(fl))</div><div class='ctx'> 				continue;</div><div class='del'>-			fl-&gt;fl_flags |= FL_DOWNGRADE_PENDING;</div><div class='add'>+			fl-&gt;c.flc_flags |= FL_DOWNGRADE_PENDING;</div><div class='ctx'> 			fl-&gt;fl_downgrade_time = break_time;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (fl-&gt;fl_lmops-&gt;lm_break(fl))</div><div class='del'>-			locks_delete_lock_ctx(fl, &amp;dispose);</div><div class='add'>+			locks_delete_lock_ctx(&amp;fl-&gt;c, &amp;dispose);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (list_empty(&amp;ctx-&gt;flc_lease))</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	if (mode &amp; O_NONBLOCK) {</div><div class='add'>+	if (flags &amp; LEASE_BREAK_NONBLOCK) {</div><div class='ctx'> 		trace_break_lease_noblock(inode, new_fl);</div><div class='ctx'> 		error = -EWOULDBLOCK;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> restart:</div><div class='del'>-	fl = list_first_entry(&amp;ctx-&gt;flc_lease, struct file_lock, fl_list);</div><div class='add'>+	fl = list_first_entry(&amp;ctx-&gt;flc_lease, struct file_lease, c.flc_list);</div><div class='ctx'> 	break_time = fl-&gt;fl_break_time;</div><div class='ctx'> 	if (break_time != 0)</div><div class='ctx'> 		break_time -= jiffies;</div><div class='ctx'> 	if (break_time == 0)</div><div class='ctx'> 		break_time++;</div><div class='del'>-	locks_insert_block(fl, new_fl, leases_conflict);</div><div class='add'>+	locks_insert_block(&amp;fl-&gt;c, &amp;new_fl-&gt;c, leases_conflict);</div><div class='ctx'> 	trace_break_lease_block(inode, new_fl);</div><div class='ctx'> 	spin_unlock(&amp;ctx-&gt;flc_lock);</div><div class='ctx'> 	percpu_up_read(&amp;file_rwsem);</div><div class='ctx'> </div><div class='ctx'> 	locks_dispose_list(&amp;dispose);</div><div class='del'>-	error = wait_event_interruptible_timeout(new_fl-&gt;fl_wait,</div><div class='del'>-					list_empty(&amp;new_fl-&gt;fl_blocked_member),</div><div class='del'>-					break_time);</div><div class='add'>+	error = wait_event_interruptible_timeout(new_fl-&gt;c.flc_wait,</div><div class='add'>+						 list_empty(&amp;new_fl-&gt;c.flc_blocked_member),</div><div class='add'>+						 break_time);</div><div class='ctx'> </div><div class='ctx'> 	percpu_down_read(&amp;file_rwsem);</div><div class='ctx'> 	spin_lock(&amp;ctx-&gt;flc_lock);</div><div class='ctx'> 	trace_break_lease_unblock(inode, new_fl);</div><div class='del'>-	locks_delete_block(new_fl);</div><div class='add'>+	__locks_delete_block(&amp;new_fl-&gt;c);</div><div class='ctx'> 	if (error &gt;= 0) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Wait for the next conflicting lease that has not been</div><div class='hunk'>@@ -1497,7 +1645,7 @@ out:</div><div class='ctx'> 	percpu_up_read(&amp;file_rwsem);</div><div class='ctx'> 	locks_dispose_list(&amp;dispose);</div><div class='ctx'> free_lock:</div><div class='del'>-	locks_free_lock(new_fl);</div><div class='add'>+	locks_free_lease(new_fl);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(__break_lease);</div><div class='hunk'>@@ -1515,14 +1663,14 @@ void lease_get_mtime(struct inode *inode, struct timespec64 *time)</div><div class='ctx'> {</div><div class='ctx'> 	bool has_lease = false;</div><div class='ctx'> 	struct file_lock_context *ctx;</div><div class='del'>-	struct file_lock *fl;</div><div class='add'>+	struct file_lock_core *flc;</div><div class='ctx'> </div><div class='del'>-	ctx = smp_load_acquire(&amp;inode-&gt;i_flctx);</div><div class='add'>+	ctx = locks_inode_context(inode);</div><div class='ctx'> 	if (ctx &amp;&amp; !list_empty_careful(&amp;ctx-&gt;flc_lease)) {</div><div class='ctx'> 		spin_lock(&amp;ctx-&gt;flc_lock);</div><div class='del'>-		fl = list_first_entry_or_null(&amp;ctx-&gt;flc_lease,</div><div class='del'>-					      struct file_lock, fl_list);</div><div class='del'>-		if (fl &amp;&amp; (fl-&gt;fl_type == F_WRLCK))</div><div class='add'>+		flc = list_first_entry_or_null(&amp;ctx-&gt;flc_lease,</div><div class='add'>+					       struct file_lock_core, flc_list);</div><div class='add'>+		if (flc &amp;&amp; flc-&gt;flc_type == F_WRLCK)</div><div class='ctx'> 			has_lease = true;</div><div class='ctx'> 		spin_unlock(&amp;ctx-&gt;flc_lock);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1533,8 +1681,9 @@ void lease_get_mtime(struct inode *inode, struct timespec64 *time)</div><div class='ctx'> EXPORT_SYMBOL(lease_get_mtime);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- *	fcntl_getlease - Enquire what lease is currently active</div><div class='add'>+ *	__fcntl_getlease - Enquire what lease is currently active</div><div class='ctx'>  *	@filp: the file</div><div class='add'>+ *	@flavor: type of lease flags to check</div><div class='ctx'>  *</div><div class='ctx'>  *	The value returned by this function will be one of</div><div class='ctx'>  *	(if no lease break is pending):</div><div class='hunk'>@@ -1555,23 +1704,24 @@ EXPORT_SYMBOL(lease_get_mtime);</div><div class='ctx'>  *	XXX: sfr &amp; willy disagree over whether F_INPROGRESS</div><div class='ctx'>  *	should be returned to userspace.</div><div class='ctx'>  */</div><div class='del'>-int fcntl_getlease(struct file *filp)</div><div class='add'>+static int __fcntl_getlease(struct file *filp, unsigned int flavor)</div><div class='ctx'> {</div><div class='del'>-	struct file_lock *fl;</div><div class='del'>-	struct inode *inode = locks_inode(filp);</div><div class='add'>+	struct file_lease *fl;</div><div class='add'>+	struct inode *inode = file_inode(filp);</div><div class='ctx'> 	struct file_lock_context *ctx;</div><div class='ctx'> 	int type = F_UNLCK;</div><div class='ctx'> 	LIST_HEAD(dispose);</div><div class='ctx'> </div><div class='del'>-	ctx = smp_load_acquire(&amp;inode-&gt;i_flctx);</div><div class='add'>+	ctx = locks_inode_context(inode);</div><div class='ctx'> 	if (ctx &amp;&amp; !list_empty_careful(&amp;ctx-&gt;flc_lease)) {</div><div class='ctx'> 		percpu_down_read(&amp;file_rwsem);</div><div class='ctx'> 		spin_lock(&amp;ctx-&gt;flc_lock);</div><div class='ctx'> 		time_out_leases(inode, &amp;dispose);</div><div class='del'>-		list_for_each_entry(fl, &amp;ctx-&gt;flc_lease, fl_list) {</div><div class='del'>-			if (fl-&gt;fl_file != filp)</div><div class='add'>+		list_for_each_entry(fl, &amp;ctx-&gt;flc_lease, c.flc_list) {</div><div class='add'>+			if (fl-&gt;c.flc_file != filp)</div><div class='ctx'> 				continue;</div><div class='del'>-			type = target_leasetype(fl);</div><div class='add'>+			if (fl-&gt;c.flc_flags &amp; flavor)</div><div class='add'>+				type = target_leasetype(fl);</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 		spin_unlock(&amp;ctx-&gt;flc_lock);</div><div class='hunk'>@@ -1582,6 +1732,19 @@ int fcntl_getlease(struct file *filp)</div><div class='ctx'> 	return type;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+int fcntl_getlease(struct file *filp)</div><div class='add'>+{</div><div class='add'>+	return __fcntl_getlease(filp, FL_LEASE);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int fcntl_getdeleg(struct file *filp, struct delegation *deleg)</div><div class='add'>+{</div><div class='add'>+	if (deleg-&gt;d_flags != 0 || deleg-&gt;__pad != 0)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	deleg-&gt;d_type = __fcntl_getlease(filp, FL_DELEG);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /**</div><div class='ctx'>  * check_conflicting_open - see if the given file points to an inode that has</div><div class='ctx'>  *			    an existing open that would conflict with the</div><div class='hunk'>@@ -1594,9 +1757,9 @@ int fcntl_getlease(struct file *filp)</div><div class='ctx'>  * conflict with the lease we're trying to set.</div><div class='ctx'>  */</div><div class='ctx'> static int</div><div class='del'>-check_conflicting_open(struct file *filp, const long arg, int flags)</div><div class='add'>+check_conflicting_open(struct file *filp, const int arg, int flags)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = locks_inode(filp);</div><div class='add'>+	struct inode *inode = file_inode(filp);</div><div class='ctx'> 	int self_wcount = 0, self_rcount = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; FL_LAYOUT)</div><div class='hunk'>@@ -1629,18 +1792,22 @@ check_conflicting_open(struct file *filp, const long arg, int flags)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-generic_add_lease(struct file *filp, long arg, struct file_lock **flp, void **priv)</div><div class='add'>+generic_add_lease(struct file *filp, int arg, struct file_lease **flp, void **priv)</div><div class='ctx'> {</div><div class='del'>-	struct file_lock *fl, *my_fl = NULL, *lease;</div><div class='del'>-	struct inode *inode = locks_inode(filp);</div><div class='add'>+	struct file_lease *fl, *my_fl = NULL, *lease;</div><div class='add'>+	struct inode *inode = file_inode(filp);</div><div class='ctx'> 	struct file_lock_context *ctx;</div><div class='del'>-	bool is_deleg = (*flp)-&gt;fl_flags &amp; FL_DELEG;</div><div class='add'>+	bool is_deleg = (*flp)-&gt;c.flc_flags &amp; FL_DELEG;</div><div class='ctx'> 	int error;</div><div class='ctx'> 	LIST_HEAD(dispose);</div><div class='ctx'> </div><div class='ctx'> 	lease = *flp;</div><div class='ctx'> 	trace_generic_add_lease(inode, lease);</div><div class='ctx'> </div><div class='add'>+	error = file_f_owner_allocate(filp);</div><div class='add'>+	if (error)</div><div class='add'>+		return error;</div><div class='add'>+</div><div class='ctx'> 	/* Note that arg is never F_UNLCK here */</div><div class='ctx'> 	ctx = locks_get_lock_context(inode, arg);</div><div class='ctx'> 	if (!ctx)</div><div class='hunk'>@@ -1648,7 +1815,7 @@ generic_add_lease(struct file *filp, long arg, struct file_lock **flp, void **pr</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * In the delegation case we need mutual exclusion with</div><div class='del'>-	 * a number of operations that take the i_mutex.  We trylock</div><div class='add'>+	 * a number of operations that take the i_rwsem.  We trylock</div><div class='ctx'> 	 * because delegations are an optional optimization, and if</div><div class='ctx'> 	 * there's some chance of a conflict--we'd rather not</div><div class='ctx'> 	 * bother, maybe that's a sign this just isn't a good file to</div><div class='hunk'>@@ -1657,17 +1824,10 @@ generic_add_lease(struct file *filp, long arg, struct file_lock **flp, void **pr</div><div class='ctx'> 	if (is_deleg &amp;&amp; !inode_trylock(inode))</div><div class='ctx'> 		return -EAGAIN;</div><div class='ctx'> </div><div class='del'>-	if (is_deleg &amp;&amp; arg == F_WRLCK) {</div><div class='del'>-		/* Write delegations are not currently supported: */</div><div class='del'>-		inode_unlock(inode);</div><div class='del'>-		WARN_ON_ONCE(1);</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	percpu_down_read(&amp;file_rwsem);</div><div class='ctx'> 	spin_lock(&amp;ctx-&gt;flc_lock);</div><div class='ctx'> 	time_out_leases(inode, &amp;dispose);</div><div class='del'>-	error = check_conflicting_open(filp, arg, lease-&gt;fl_flags);</div><div class='add'>+	error = check_conflicting_open(filp, arg, lease-&gt;c.flc_flags);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -1680,9 +1840,9 @@ generic_add_lease(struct file *filp, long arg, struct file_lock **flp, void **pr</div><div class='ctx'> 	 * except for this filp.</div><div class='ctx'> 	 */</div><div class='ctx'> 	error = -EAGAIN;</div><div class='del'>-	list_for_each_entry(fl, &amp;ctx-&gt;flc_lease, fl_list) {</div><div class='del'>-		if (fl-&gt;fl_file == filp &amp;&amp;</div><div class='del'>-		    fl-&gt;fl_owner == lease-&gt;fl_owner) {</div><div class='add'>+	list_for_each_entry(fl, &amp;ctx-&gt;flc_lease, c.flc_list) {</div><div class='add'>+		if (fl-&gt;c.flc_file == filp &amp;&amp;</div><div class='add'>+		    fl-&gt;c.flc_owner == lease-&gt;c.flc_owner) {</div><div class='ctx'> 			my_fl = fl;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1697,7 +1857,7 @@ generic_add_lease(struct file *filp, long arg, struct file_lock **flp, void **pr</div><div class='ctx'> 		 * Modifying our existing lease is OK, but no getting a</div><div class='ctx'> 		 * new lease if someone else is opening for write:</div><div class='ctx'> 		 */</div><div class='del'>-		if (fl-&gt;fl_flags &amp; FL_UNLOCK_PENDING)</div><div class='add'>+		if (fl-&gt;c.flc_flags &amp; FL_UNLOCK_PENDING)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1713,7 +1873,7 @@ generic_add_lease(struct file *filp, long arg, struct file_lock **flp, void **pr</div><div class='ctx'> 	if (!leases_enable)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	locks_insert_lock_ctx(lease, &amp;ctx-&gt;flc_lease);</div><div class='add'>+	locks_insert_lock_ctx(&amp;lease-&gt;c, &amp;ctx-&gt;flc_lease);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The check in break_lease() is lockless. It's possible for another</div><div class='ctx'> 	 * open to race in after we did the earlier check for a conflicting</div><div class='hunk'>@@ -1724,9 +1884,9 @@ generic_add_lease(struct file *filp, long arg, struct file_lock **flp, void **pr</div><div class='ctx'> 	 * precedes these checks.</div><div class='ctx'> 	 */</div><div class='ctx'> 	smp_mb();</div><div class='del'>-	error = check_conflicting_open(filp, arg, lease-&gt;fl_flags);</div><div class='add'>+	error = check_conflicting_open(filp, arg, lease-&gt;c.flc_flags);</div><div class='ctx'> 	if (error) {</div><div class='del'>-		locks_unlink_lock_ctx(lease);</div><div class='add'>+		locks_unlink_lock_ctx(&amp;lease-&gt;c);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1747,12 +1907,12 @@ out:</div><div class='ctx'> static int generic_delete_lease(struct file *filp, void *owner)</div><div class='ctx'> {</div><div class='ctx'> 	int error = -EAGAIN;</div><div class='del'>-	struct file_lock *fl, *victim = NULL;</div><div class='del'>-	struct inode *inode = locks_inode(filp);</div><div class='add'>+	struct file_lease *fl, *victim = NULL;</div><div class='add'>+	struct inode *inode = file_inode(filp);</div><div class='ctx'> 	struct file_lock_context *ctx;</div><div class='ctx'> 	LIST_HEAD(dispose);</div><div class='ctx'> </div><div class='del'>-	ctx = smp_load_acquire(&amp;inode-&gt;i_flctx);</div><div class='add'>+	ctx = locks_inode_context(inode);</div><div class='ctx'> 	if (!ctx) {</div><div class='ctx'> 		trace_generic_delete_lease(inode, NULL);</div><div class='ctx'> 		return error;</div><div class='hunk'>@@ -1760,9 +1920,9 @@ static int generic_delete_lease(struct file *filp, void *owner)</div><div class='ctx'> </div><div class='ctx'> 	percpu_down_read(&amp;file_rwsem);</div><div class='ctx'> 	spin_lock(&amp;ctx-&gt;flc_lock);</div><div class='del'>-	list_for_each_entry(fl, &amp;ctx-&gt;flc_lease, fl_list) {</div><div class='del'>-		if (fl-&gt;fl_file == filp &amp;&amp;</div><div class='del'>-		    fl-&gt;fl_owner == owner) {</div><div class='add'>+	list_for_each_entry(fl, &amp;ctx-&gt;flc_lease, c.flc_list) {</div><div class='add'>+		if (fl-&gt;c.flc_file == filp &amp;&amp;</div><div class='add'>+		    fl-&gt;c.flc_owner == owner) {</div><div class='ctx'> 			victim = fl;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1787,25 +1947,22 @@ static int generic_delete_lease(struct file *filp, void *owner)</div><div class='ctx'>  *	The (input) flp-&gt;fl_lmops-&gt;lm_break function is required</div><div class='ctx'>  *	by break_lease().</div><div class='ctx'>  */</div><div class='del'>-int generic_setlease(struct file *filp, long arg, struct file_lock **flp,</div><div class='add'>+int generic_setlease(struct file *filp, int arg, struct file_lease **flp,</div><div class='ctx'> 			void **priv)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = locks_inode(filp);</div><div class='del'>-	int error;</div><div class='add'>+	struct inode *inode = file_inode(filp);</div><div class='ctx'> </div><div class='del'>-	if ((!uid_eq(current_fsuid(), inode-&gt;i_uid)) &amp;&amp; !capable(CAP_LEASE))</div><div class='del'>-		return -EACCES;</div><div class='del'>-	if (!S_ISREG(inode-&gt;i_mode))</div><div class='add'>+	if (!S_ISREG(inode-&gt;i_mode) &amp;&amp; !S_ISDIR(inode-&gt;i_mode))</div><div class='ctx'> 		return -EINVAL;</div><div class='del'>-	error = security_file_lock(filp, arg);</div><div class='del'>-	if (error)</div><div class='del'>-		return error;</div><div class='ctx'> </div><div class='ctx'> 	switch (arg) {</div><div class='ctx'> 	case F_UNLCK:</div><div class='ctx'> 		return generic_delete_lease(filp, *priv);</div><div class='del'>-	case F_RDLCK:</div><div class='ctx'> 	case F_WRLCK:</div><div class='add'>+		if (S_ISDIR(inode-&gt;i_mode))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		fallthrough;</div><div class='add'>+	case F_RDLCK:</div><div class='ctx'> 		if (!(*flp)-&gt;fl_lmops-&gt;lm_break) {</div><div class='ctx'> 			WARN_ON_ONCE(1);</div><div class='ctx'> 			return -ENOLCK;</div><div class='hunk'>@@ -1818,7 +1975,6 @@ int generic_setlease(struct file *filp, long arg, struct file_lock **flp,</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(generic_setlease);</div><div class='ctx'> </div><div class='del'>-#if IS_ENABLED(CONFIG_SRCU)</div><div class='ctx'> /*</div><div class='ctx'>  * Kernel subsystems can register to be notified on any attempt to set</div><div class='ctx'>  * a new lease with the lease_notifier_chain. This is used by (e.g.) nfsd</div><div class='hunk'>@@ -1834,7 +1990,7 @@ lease_notifier_chain_init(void)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void</div><div class='del'>-setlease_notifier(long arg, struct file_lock *lease)</div><div class='add'>+setlease_notifier(int arg, struct file_lease *lease)</div><div class='ctx'> {</div><div class='ctx'> 	if (arg != F_UNLCK)</div><div class='ctx'> 		srcu_notifier_call_chain(&amp;lease_notifier_chain, arg, lease);</div><div class='hunk'>@@ -1852,29 +2008,18 @@ void lease_unregister_notifier(struct notifier_block *nb)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(lease_unregister_notifier);</div><div class='ctx'> </div><div class='del'>-#else /* !IS_ENABLED(CONFIG_SRCU) */</div><div class='del'>-static inline void</div><div class='del'>-lease_notifier_chain_init(void)</div><div class='del'>-{</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void</div><div class='del'>-setlease_notifier(long arg, struct file_lock *lease)</div><div class='del'>-{</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int lease_register_notifier(struct notifier_block *nb)</div><div class='del'>-{</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL_GPL(lease_register_notifier);</div><div class='ctx'> </div><div class='del'>-void lease_unregister_notifier(struct notifier_block *nb)</div><div class='add'>+int</div><div class='add'>+kernel_setlease(struct file *filp, int arg, struct file_lease **lease, void **priv)</div><div class='ctx'> {</div><div class='add'>+	if (lease)</div><div class='add'>+		setlease_notifier(arg, *lease);</div><div class='add'>+	if (filp-&gt;f_op-&gt;setlease)</div><div class='add'>+		return filp-&gt;f_op-&gt;setlease(filp, arg, lease, priv);</div><div class='add'>+	else</div><div class='add'>+		return generic_setlease(filp, arg, lease, priv);</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL_GPL(lease_unregister_notifier);</div><div class='del'>-</div><div class='del'>-#endif /* IS_ENABLED(CONFIG_SRCU) */</div><div class='add'>+EXPORT_SYMBOL_GPL(kernel_setlease);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * vfs_setlease        -       sets a lease on an open file</div><div class='hunk'>@@ -1894,37 +2039,41 @@ EXPORT_SYMBOL_GPL(lease_unregister_notifier);</div><div class='ctx'>  * may be NULL if the lm_setup operation doesn't require it.</div><div class='ctx'>  */</div><div class='ctx'> int</div><div class='del'>-vfs_setlease(struct file *filp, long arg, struct file_lock **lease, void **priv)</div><div class='add'>+vfs_setlease(struct file *filp, int arg, struct file_lease **lease, void **priv)</div><div class='ctx'> {</div><div class='del'>-	if (lease)</div><div class='del'>-		setlease_notifier(arg, *lease);</div><div class='del'>-	if (filp-&gt;f_op-&gt;setlease)</div><div class='del'>-		return filp-&gt;f_op-&gt;setlease(filp, arg, lease, priv);</div><div class='del'>-	else</div><div class='del'>-		return generic_setlease(filp, arg, lease, priv);</div><div class='add'>+	struct inode *inode = file_inode(filp);</div><div class='add'>+	vfsuid_t vfsuid = i_uid_into_vfsuid(file_mnt_idmap(filp), inode);</div><div class='add'>+	int error;</div><div class='add'>+</div><div class='add'>+	if ((!vfsuid_eq_kuid(vfsuid, current_fsuid())) &amp;&amp; !capable(CAP_LEASE))</div><div class='add'>+		return -EACCES;</div><div class='add'>+	error = security_file_lock(filp, arg);</div><div class='add'>+	if (error)</div><div class='add'>+		return error;</div><div class='add'>+	return kernel_setlease(filp, arg, lease, priv);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(vfs_setlease);</div><div class='ctx'> </div><div class='del'>-static int do_fcntl_add_lease(unsigned int fd, struct file *filp, long arg)</div><div class='add'>+static int do_fcntl_add_lease(unsigned int fd, struct file *filp, unsigned int flavor, int arg)</div><div class='ctx'> {</div><div class='del'>-	struct file_lock *fl;</div><div class='add'>+	struct file_lease *fl;</div><div class='ctx'> 	struct fasync_struct *new;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	fl = lease_alloc(filp, arg);</div><div class='add'>+	fl = lease_alloc(filp, flavor, arg);</div><div class='ctx'> 	if (IS_ERR(fl))</div><div class='ctx'> 		return PTR_ERR(fl);</div><div class='ctx'> </div><div class='ctx'> 	new = fasync_alloc();</div><div class='ctx'> 	if (!new) {</div><div class='del'>-		locks_free_lock(fl);</div><div class='add'>+		locks_free_lease(fl);</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	}</div><div class='ctx'> 	new-&gt;fa_fd = fd;</div><div class='ctx'> </div><div class='ctx'> 	error = vfs_setlease(filp, arg, &amp;fl, (void **)&amp;new);</div><div class='ctx'> 	if (fl)</div><div class='del'>-		locks_free_lock(fl);</div><div class='add'>+		locks_free_lease(fl);</div><div class='ctx'> 	if (new)</div><div class='ctx'> 		fasync_free(new);</div><div class='ctx'> 	return error;</div><div class='hunk'>@@ -1940,11 +2089,35 @@ static int do_fcntl_add_lease(unsigned int fd, struct file *filp, long arg)</div><div class='ctx'>  *	Note that you also need to call %F_SETSIG to</div><div class='ctx'>  *	receive a signal when the lease is broken.</div><div class='ctx'>  */</div><div class='del'>-int fcntl_setlease(unsigned int fd, struct file *filp, long arg)</div><div class='add'>+int fcntl_setlease(unsigned int fd, struct file *filp, int arg)</div><div class='ctx'> {</div><div class='add'>+	if (S_ISDIR(file_inode(filp)-&gt;i_mode))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='ctx'> 	if (arg == F_UNLCK)</div><div class='ctx'> 		return vfs_setlease(filp, F_UNLCK, NULL, (void **)&amp;filp);</div><div class='del'>-	return do_fcntl_add_lease(fd, filp, arg);</div><div class='add'>+	return do_fcntl_add_lease(fd, filp, FL_LEASE, arg);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ *	fcntl_setdeleg	-	sets a delegation on an open file</div><div class='add'>+ *	@fd: open file descriptor</div><div class='add'>+ *	@filp: file pointer</div><div class='add'>+ *	@deleg: delegation request from userland</div><div class='add'>+ *</div><div class='add'>+ *	Call this fcntl to establish a delegation on the file.</div><div class='add'>+ *	Note that you also need to call %F_SETSIG to</div><div class='add'>+ *	receive a signal when the lease is broken.</div><div class='add'>+ */</div><div class='add'>+int fcntl_setdeleg(unsigned int fd, struct file *filp, struct delegation *deleg)</div><div class='add'>+{</div><div class='add'>+	/* For now, no flags are supported */</div><div class='add'>+	if (deleg-&gt;d_flags != 0 || deleg-&gt;__pad != 0)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	if (deleg-&gt;d_type == F_UNLCK)</div><div class='add'>+		return vfs_setlease(filp, F_UNLCK, NULL, (void **)&amp;filp);</div><div class='add'>+	return do_fcntl_add_lease(fd, filp, FL_DELEG, deleg-&gt;d_type);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -1962,8 +2135,8 @@ static int flock_lock_inode_wait(struct inode *inode, struct file_lock *fl)</div><div class='ctx'> 		error = flock_lock_inode(inode, fl);</div><div class='ctx'> 		if (error != FILE_LOCK_DEFERRED)</div><div class='ctx'> 			break;</div><div class='del'>-		error = wait_event_interruptible(fl-&gt;fl_wait,</div><div class='del'>-				list_empty(&amp;fl-&gt;fl_blocked_member));</div><div class='add'>+		error = wait_event_interruptible(fl-&gt;c.flc_wait,</div><div class='add'>+						 list_empty(&amp;fl-&gt;c.flc_blocked_member));</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1981,7 +2154,7 @@ static int flock_lock_inode_wait(struct inode *inode, struct file_lock *fl)</div><div class='ctx'> int locks_lock_inode_wait(struct inode *inode, struct file_lock *fl)</div><div class='ctx'> {</div><div class='ctx'> 	int res = 0;</div><div class='del'>-	switch (fl-&gt;fl_flags &amp; (FL_POSIX|FL_FLOCK)) {</div><div class='add'>+	switch (fl-&gt;c.flc_flags &amp; (FL_POSIX|FL_FLOCK)) {</div><div class='ctx'> 		case FL_POSIX:</div><div class='ctx'> 			res = posix_lock_inode_wait(inode, fl);</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -2012,21 +2185,8 @@ EXPORT_SYMBOL(locks_lock_inode_wait);</div><div class='ctx'>  */</div><div class='ctx'> SYSCALL_DEFINE2(flock, unsigned int, fd, unsigned int, cmd)</div><div class='ctx'> {</div><div class='del'>-	struct fd f = fdget(fd);</div><div class='del'>-	struct file_lock *lock;</div><div class='del'>-	int can_sleep, unlock;</div><div class='del'>-	int error;</div><div class='del'>-</div><div class='del'>-	error = -EBADF;</div><div class='del'>-	if (!f.file)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	can_sleep = !(cmd &amp; LOCK_NB);</div><div class='del'>-	cmd &amp;= ~LOCK_NB;</div><div class='del'>-	unlock = (cmd == LOCK_UN);</div><div class='del'>-</div><div class='del'>-	if (!unlock &amp;&amp; !(f.file-&gt;f_mode &amp; (FMODE_READ|FMODE_WRITE)))</div><div class='del'>-		goto out_putf;</div><div class='add'>+	int can_sleep, error, type;</div><div class='add'>+	struct file_lock fl;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * LOCK_MAND locks were broken for a long time in that they never</div><div class='hunk'>@@ -2037,37 +2197,39 @@ SYSCALL_DEFINE2(flock, unsigned int, fd, unsigned int, cmd)</div><div class='ctx'> 	 * throw a warning to let people know that they don't actually work.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (cmd &amp; LOCK_MAND) {</div><div class='del'>-		pr_warn_once("Attempt to set a LOCK_MAND lock via flock(2). This support has been removed and the request ignored.\n");</div><div class='del'>-		error = 0;</div><div class='del'>-		goto out_putf;</div><div class='add'>+		pr_warn_once("%s(%d): Attempt to set a LOCK_MAND lock via flock(2). This support has been removed and the request ignored.\n", current-&gt;comm, current-&gt;pid);</div><div class='add'>+		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	lock = flock_make_lock(f.file, cmd, NULL);</div><div class='del'>-	if (IS_ERR(lock)) {</div><div class='del'>-		error = PTR_ERR(lock);</div><div class='del'>-		goto out_putf;</div><div class='del'>-	}</div><div class='add'>+	type = flock_translate_cmd(cmd &amp; ~LOCK_NB);</div><div class='add'>+	if (type &lt; 0)</div><div class='add'>+		return type;</div><div class='ctx'> </div><div class='del'>-	if (can_sleep)</div><div class='del'>-		lock-&gt;fl_flags |= FL_SLEEP;</div><div class='add'>+	CLASS(fd, f)(fd);</div><div class='add'>+	if (fd_empty(f))</div><div class='add'>+		return -EBADF;</div><div class='ctx'> </div><div class='del'>-	error = security_file_lock(f.file, lock-&gt;fl_type);</div><div class='add'>+	if (type != F_UNLCK &amp;&amp; !(fd_file(f)-&gt;f_mode &amp; (FMODE_READ | FMODE_WRITE)))</div><div class='add'>+		return -EBADF;</div><div class='add'>+</div><div class='add'>+	flock_make_lock(fd_file(f), &amp;fl, type);</div><div class='add'>+</div><div class='add'>+	error = security_file_lock(fd_file(f), fl.c.flc_type);</div><div class='ctx'> 	if (error)</div><div class='del'>-		goto out_free;</div><div class='add'>+		return error;</div><div class='ctx'> </div><div class='del'>-	if (f.file-&gt;f_op-&gt;flock)</div><div class='del'>-		error = f.file-&gt;f_op-&gt;flock(f.file,</div><div class='del'>-					  (can_sleep) ? F_SETLKW : F_SETLK,</div><div class='del'>-					  lock);</div><div class='del'>-	else</div><div class='del'>-		error = locks_lock_file_wait(f.file, lock);</div><div class='add'>+	can_sleep = !(cmd &amp; LOCK_NB);</div><div class='add'>+	if (can_sleep)</div><div class='add'>+		fl.c.flc_flags |= FL_SLEEP;</div><div class='ctx'> </div><div class='del'>- out_free:</div><div class='del'>-	locks_free_lock(lock);</div><div class='add'>+	if (fd_file(f)-&gt;f_op-&gt;flock)</div><div class='add'>+		error = fd_file(f)-&gt;f_op-&gt;flock(fd_file(f),</div><div class='add'>+					    (can_sleep) ? F_SETLKW : F_SETLK,</div><div class='add'>+					    &amp;fl);</div><div class='add'>+	else</div><div class='add'>+		error = locks_lock_file_wait(fd_file(f), &amp;fl);</div><div class='ctx'> </div><div class='del'>- out_putf:</div><div class='del'>-	fdput(f);</div><div class='del'>- out:</div><div class='add'>+	locks_release_private(&amp;fl);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2081,6 +2243,7 @@ SYSCALL_DEFINE2(flock, unsigned int, fd, unsigned int, cmd)</div><div class='ctx'>  */</div><div class='ctx'> int vfs_test_lock(struct file *filp, struct file_lock *fl)</div><div class='ctx'> {</div><div class='add'>+	WARN_ON_ONCE(filp != fl-&gt;c.flc_file);</div><div class='ctx'> 	if (filp-&gt;f_op-&gt;lock)</div><div class='ctx'> 		return filp-&gt;f_op-&gt;lock(filp, F_GETLK, fl);</div><div class='ctx'> 	posix_test_lock(filp, fl);</div><div class='hunk'>@@ -2093,27 +2256,30 @@ EXPORT_SYMBOL_GPL(vfs_test_lock);</div><div class='ctx'>  * @fl: The file_lock who's fl_pid should be translated</div><div class='ctx'>  * @ns: The namespace into which the pid should be translated</div><div class='ctx'>  *</div><div class='del'>- * Used to tranlate a fl_pid into a namespace virtual pid number</div><div class='add'>+ * Used to translate a fl_pid into a namespace virtual pid number</div><div class='ctx'>  */</div><div class='del'>-static pid_t locks_translate_pid(struct file_lock *fl, struct pid_namespace *ns)</div><div class='add'>+static pid_t locks_translate_pid(struct file_lock_core *fl, struct pid_namespace *ns)</div><div class='ctx'> {</div><div class='ctx'> 	pid_t vnr;</div><div class='ctx'> 	struct pid *pid;</div><div class='ctx'> </div><div class='del'>-	if (IS_OFDLCK(fl))</div><div class='add'>+	if (fl-&gt;flc_flags &amp; FL_OFDLCK)</div><div class='ctx'> 		return -1;</div><div class='del'>-	if (IS_REMOTELCK(fl))</div><div class='del'>-		return fl-&gt;fl_pid;</div><div class='add'>+</div><div class='add'>+	/* Remote locks report a negative pid value */</div><div class='add'>+	if (fl-&gt;flc_pid &lt;= 0)</div><div class='add'>+		return fl-&gt;flc_pid;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If the flock owner process is dead and its pid has been already</div><div class='ctx'> 	 * freed, the translation below won't work, but we still want to show</div><div class='ctx'> 	 * flock owner pid number in init pidns.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (ns == &amp;init_pid_ns)</div><div class='del'>-		return (pid_t)fl-&gt;fl_pid;</div><div class='add'>+		return (pid_t) fl-&gt;flc_pid;</div><div class='ctx'> </div><div class='ctx'> 	rcu_read_lock();</div><div class='del'>-	pid = find_pid_ns(fl-&gt;fl_pid, &amp;init_pid_ns);</div><div class='add'>+	pid = find_pid_ns(fl-&gt;flc_pid, &amp;init_pid_ns);</div><div class='ctx'> 	vnr = pid_nr_ns(pid, ns);</div><div class='ctx'> 	rcu_read_unlock();</div><div class='ctx'> 	return vnr;</div><div class='hunk'>@@ -2121,7 +2287,7 @@ static pid_t locks_translate_pid(struct file_lock *fl, struct pid_namespace *ns)</div><div class='ctx'> </div><div class='ctx'> static int posix_lock_to_flock(struct flock *flock, struct file_lock *fl)</div><div class='ctx'> {</div><div class='del'>-	flock-&gt;l_pid = locks_translate_pid(fl, task_active_pid_ns(current));</div><div class='add'>+	flock-&gt;l_pid = locks_translate_pid(&amp;fl-&gt;c, task_active_pid_ns(current));</div><div class='ctx'> #if BITS_PER_LONG == 32</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Make sure we can represent the posix lock via</div><div class='hunk'>@@ -2136,19 +2302,19 @@ static int posix_lock_to_flock(struct flock *flock, struct file_lock *fl)</div><div class='ctx'> 	flock-&gt;l_len = fl-&gt;fl_end == OFFSET_MAX ? 0 :</div><div class='ctx'> 		fl-&gt;fl_end - fl-&gt;fl_start + 1;</div><div class='ctx'> 	flock-&gt;l_whence = 0;</div><div class='del'>-	flock-&gt;l_type = fl-&gt;fl_type;</div><div class='add'>+	flock-&gt;l_type = fl-&gt;c.flc_type;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #if BITS_PER_LONG == 32</div><div class='ctx'> static void posix_lock_to_flock64(struct flock64 *flock, struct file_lock *fl)</div><div class='ctx'> {</div><div class='del'>-	flock-&gt;l_pid = locks_translate_pid(fl, task_active_pid_ns(current));</div><div class='add'>+	flock-&gt;l_pid = locks_translate_pid(&amp;fl-&gt;c, task_active_pid_ns(current));</div><div class='ctx'> 	flock-&gt;l_start = fl-&gt;fl_start;</div><div class='ctx'> 	flock-&gt;l_len = fl-&gt;fl_end == OFFSET_MAX ? 0 :</div><div class='ctx'> 		fl-&gt;fl_end - fl-&gt;fl_start + 1;</div><div class='ctx'> 	flock-&gt;l_whence = 0;</div><div class='del'>-	flock-&gt;l_type = fl-&gt;fl_type;</div><div class='add'>+	flock-&gt;l_type = fl-&gt;c.flc_type;</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='hunk'>@@ -2164,7 +2330,8 @@ int fcntl_getlk(struct file *filp, unsigned int cmd, struct flock *flock)</div><div class='ctx'> 	if (fl == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	error = -EINVAL;</div><div class='del'>-	if (flock-&gt;l_type != F_RDLCK &amp;&amp; flock-&gt;l_type != F_WRLCK)</div><div class='add'>+	if (cmd != F_OFD_GETLK &amp;&amp; flock-&gt;l_type != F_RDLCK</div><div class='add'>+			&amp;&amp; flock-&gt;l_type != F_WRLCK)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	error = flock_to_posix_lock(filp, fl, flock);</div><div class='hunk'>@@ -2176,16 +2343,16 @@ int fcntl_getlk(struct file *filp, unsigned int cmd, struct flock *flock)</div><div class='ctx'> 		if (flock-&gt;l_pid != 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='del'>-		fl-&gt;fl_flags |= FL_OFDLCK;</div><div class='del'>-		fl-&gt;fl_owner = filp;</div><div class='add'>+		fl-&gt;c.flc_flags |= FL_OFDLCK;</div><div class='add'>+		fl-&gt;c.flc_owner = filp;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	error = vfs_test_lock(filp, fl);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	flock-&gt;l_type = fl-&gt;fl_type;</div><div class='del'>-	if (fl-&gt;fl_type != F_UNLCK) {</div><div class='add'>+	flock-&gt;l_type = fl-&gt;c.flc_type;</div><div class='add'>+	if (fl-&gt;c.flc_type != F_UNLCK) {</div><div class='ctx'> 		error = posix_lock_to_flock(flock, fl);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			goto out;</div><div class='hunk'>@@ -2212,11 +2379,13 @@ out:</div><div class='ctx'>  * To avoid blocking kernel daemons, such as lockd, that need to acquire POSIX</div><div class='ctx'>  * locks, the -&gt;lock() interface may return asynchronously, before the lock has</div><div class='ctx'>  * been granted or denied by the underlying filesystem, if (and only if)</div><div class='del'>- * lm_grant is set. Callers expecting -&gt;lock() to return asynchronously</div><div class='del'>- * will only use F_SETLK, not F_SETLKW; they will set FL_SLEEP if (and only if)</div><div class='del'>- * the request is for a blocking lock. When -&gt;lock() does return asynchronously,</div><div class='del'>- * it must return FILE_LOCK_DEFERRED, and call -&gt;lm_grant() when the lock</div><div class='del'>- * request completes.</div><div class='add'>+ * lm_grant is set. Additionally FOP_ASYNC_LOCK in file_operations fop_flags</div><div class='add'>+ * need to be set.</div><div class='add'>+ *</div><div class='add'>+ * Callers expecting -&gt;lock() to return asynchronously will only use F_SETLK,</div><div class='add'>+ * not F_SETLKW; they will set FL_SLEEP if (and only if) the request is for a</div><div class='add'>+ * blocking lock. When -&gt;lock() does return asynchronously, it must return</div><div class='add'>+ * FILE_LOCK_DEFERRED, and call -&gt;lm_grant() when the lock request completes.</div><div class='ctx'>  * If the request is for non-blocking lock the file system should return</div><div class='ctx'>  * FILE_LOCK_DEFERRED then try to get the lock and call the callback routine</div><div class='ctx'>  * with the result. If the request timed out the callback routine will return a</div><div class='hunk'>@@ -2230,6 +2399,7 @@ out:</div><div class='ctx'>  */</div><div class='ctx'> int vfs_lock_file(struct file *filp, unsigned int cmd, struct file_lock *fl, struct file_lock *conf)</div><div class='ctx'> {</div><div class='add'>+	WARN_ON_ONCE(filp != fl-&gt;c.flc_file);</div><div class='ctx'> 	if (filp-&gt;f_op-&gt;lock)</div><div class='ctx'> 		return filp-&gt;f_op-&gt;lock(filp, cmd, fl);</div><div class='ctx'> 	else</div><div class='hunk'>@@ -2242,7 +2412,7 @@ static int do_lock_file_wait(struct file *filp, unsigned int cmd,</div><div class='ctx'> {</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	error = security_file_lock(filp, fl-&gt;fl_type);</div><div class='add'>+	error = security_file_lock(filp, fl-&gt;c.flc_type);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='hunk'>@@ -2250,8 +2420,8 @@ static int do_lock_file_wait(struct file *filp, unsigned int cmd,</div><div class='ctx'> 		error = vfs_lock_file(filp, cmd, fl, NULL);</div><div class='ctx'> 		if (error != FILE_LOCK_DEFERRED)</div><div class='ctx'> 			break;</div><div class='del'>-		error = wait_event_interruptible(fl-&gt;fl_wait,</div><div class='del'>-					list_empty(&amp;fl-&gt;fl_blocked_member));</div><div class='add'>+		error = wait_event_interruptible(fl-&gt;c.flc_wait,</div><div class='add'>+						 list_empty(&amp;fl-&gt;c.flc_blocked_member));</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2264,13 +2434,13 @@ static int do_lock_file_wait(struct file *filp, unsigned int cmd,</div><div class='ctx'> static int</div><div class='ctx'> check_fmode_for_setlk(struct file_lock *fl)</div><div class='ctx'> {</div><div class='del'>-	switch (fl-&gt;fl_type) {</div><div class='add'>+	switch (fl-&gt;c.flc_type) {</div><div class='ctx'> 	case F_RDLCK:</div><div class='del'>-		if (!(fl-&gt;fl_file-&gt;f_mode &amp; FMODE_READ))</div><div class='add'>+		if (!(fl-&gt;c.flc_file-&gt;f_mode &amp; FMODE_READ))</div><div class='ctx'> 			return -EBADF;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case F_WRLCK:</div><div class='del'>-		if (!(fl-&gt;fl_file-&gt;f_mode &amp; FMODE_WRITE))</div><div class='add'>+		if (!(fl-&gt;c.flc_file-&gt;f_mode &amp; FMODE_WRITE))</div><div class='ctx'> 			return -EBADF;</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -2283,7 +2453,7 @@ int fcntl_setlk(unsigned int fd, struct file *filp, unsigned int cmd,</div><div class='ctx'> 		struct flock *flock)</div><div class='ctx'> {</div><div class='ctx'> 	struct file_lock *file_lock = locks_alloc_lock();</div><div class='del'>-	struct inode *inode = locks_inode(filp);</div><div class='add'>+	struct inode *inode = file_inode(filp);</div><div class='ctx'> 	struct file *f;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='hunk'>@@ -2309,8 +2479,8 @@ int fcntl_setlk(unsigned int fd, struct file *filp, unsigned int cmd,</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='ctx'> 		cmd = F_SETLK;</div><div class='del'>-		file_lock-&gt;fl_flags |= FL_OFDLCK;</div><div class='del'>-		file_lock-&gt;fl_owner = filp;</div><div class='add'>+		file_lock-&gt;c.flc_flags |= FL_OFDLCK;</div><div class='add'>+		file_lock-&gt;c.flc_owner = filp;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case F_OFD_SETLKW:</div><div class='ctx'> 		error = -EINVAL;</div><div class='hunk'>@@ -2318,22 +2488,23 @@ int fcntl_setlk(unsigned int fd, struct file *filp, unsigned int cmd,</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='ctx'> 		cmd = F_SETLKW;</div><div class='del'>-		file_lock-&gt;fl_flags |= FL_OFDLCK;</div><div class='del'>-		file_lock-&gt;fl_owner = filp;</div><div class='add'>+		file_lock-&gt;c.flc_flags |= FL_OFDLCK;</div><div class='add'>+		file_lock-&gt;c.flc_owner = filp;</div><div class='ctx'> 		fallthrough;</div><div class='ctx'> 	case F_SETLKW:</div><div class='del'>-		file_lock-&gt;fl_flags |= FL_SLEEP;</div><div class='add'>+		file_lock-&gt;c.flc_flags |= FL_SLEEP;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	error = do_lock_file_wait(filp, cmd, file_lock);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Attempt to detect a close/fcntl race and recover by releasing the</div><div class='del'>-	 * lock that was just acquired. There is no need to do that when we're</div><div class='add'>+	 * Detect close/fcntl races and recover by zapping all POSIX locks</div><div class='add'>+	 * associated with this file and our files_struct, just like on</div><div class='add'>+	 * filp_flush(). There is no need to do that when we're</div><div class='ctx'> 	 * unlocking though, or for OFD locks.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!error &amp;&amp; file_lock-&gt;fl_type != F_UNLCK &amp;&amp;</div><div class='del'>-	    !(file_lock-&gt;fl_flags &amp; FL_OFDLCK)) {</div><div class='add'>+	if (!error &amp;&amp; file_lock-&gt;c.flc_type != F_UNLCK &amp;&amp;</div><div class='add'>+	    !(file_lock-&gt;c.flc_flags &amp; FL_OFDLCK)) {</div><div class='ctx'> 		struct files_struct *files = current-&gt;files;</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We need that spin_lock here - it prevents reordering between</div><div class='hunk'>@@ -2344,9 +2515,7 @@ int fcntl_setlk(unsigned int fd, struct file *filp, unsigned int cmd,</div><div class='ctx'> 		f = files_lookup_fd_locked(files, fd);</div><div class='ctx'> 		spin_unlock(&amp;files-&gt;file_lock);</div><div class='ctx'> 		if (f != filp) {</div><div class='del'>-			file_lock-&gt;fl_type = F_UNLCK;</div><div class='del'>-			error = do_lock_file_wait(filp, cmd, file_lock);</div><div class='del'>-			WARN_ON_ONCE(error);</div><div class='add'>+			locks_remove_posix(filp, files);</div><div class='ctx'> 			error = -EBADF;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2370,7 +2539,8 @@ int fcntl_getlk64(struct file *filp, unsigned int cmd, struct flock64 *flock)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	error = -EINVAL;</div><div class='del'>-	if (flock-&gt;l_type != F_RDLCK &amp;&amp; flock-&gt;l_type != F_WRLCK)</div><div class='add'>+	if (cmd != F_OFD_GETLK &amp;&amp; flock-&gt;l_type != F_RDLCK</div><div class='add'>+			&amp;&amp; flock-&gt;l_type != F_WRLCK)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	error = flock64_to_posix_lock(filp, fl, flock);</div><div class='hunk'>@@ -2382,17 +2552,16 @@ int fcntl_getlk64(struct file *filp, unsigned int cmd, struct flock64 *flock)</div><div class='ctx'> 		if (flock-&gt;l_pid != 0)</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='del'>-		cmd = F_GETLK64;</div><div class='del'>-		fl-&gt;fl_flags |= FL_OFDLCK;</div><div class='del'>-		fl-&gt;fl_owner = filp;</div><div class='add'>+		fl-&gt;c.flc_flags |= FL_OFDLCK;</div><div class='add'>+		fl-&gt;c.flc_owner = filp;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	error = vfs_test_lock(filp, fl);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	flock-&gt;l_type = fl-&gt;fl_type;</div><div class='del'>-	if (fl-&gt;fl_type != F_UNLCK)</div><div class='add'>+	flock-&gt;l_type = fl-&gt;c.flc_type;</div><div class='add'>+	if (fl-&gt;c.flc_type != F_UNLCK)</div><div class='ctx'> 		posix_lock_to_flock64(flock, fl);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='hunk'>@@ -2432,8 +2601,8 @@ int fcntl_setlk64(unsigned int fd, struct file *filp, unsigned int cmd,</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='ctx'> 		cmd = F_SETLK64;</div><div class='del'>-		file_lock-&gt;fl_flags |= FL_OFDLCK;</div><div class='del'>-		file_lock-&gt;fl_owner = filp;</div><div class='add'>+		file_lock-&gt;c.flc_flags |= FL_OFDLCK;</div><div class='add'>+		file_lock-&gt;c.flc_owner = filp;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case F_OFD_SETLKW:</div><div class='ctx'> 		error = -EINVAL;</div><div class='hunk'>@@ -2441,22 +2610,23 @@ int fcntl_setlk64(unsigned int fd, struct file *filp, unsigned int cmd,</div><div class='ctx'> 			goto out;</div><div class='ctx'> </div><div class='ctx'> 		cmd = F_SETLKW64;</div><div class='del'>-		file_lock-&gt;fl_flags |= FL_OFDLCK;</div><div class='del'>-		file_lock-&gt;fl_owner = filp;</div><div class='add'>+		file_lock-&gt;c.flc_flags |= FL_OFDLCK;</div><div class='add'>+		file_lock-&gt;c.flc_owner = filp;</div><div class='ctx'> 		fallthrough;</div><div class='ctx'> 	case F_SETLKW64:</div><div class='del'>-		file_lock-&gt;fl_flags |= FL_SLEEP;</div><div class='add'>+		file_lock-&gt;c.flc_flags |= FL_SLEEP;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	error = do_lock_file_wait(filp, cmd, file_lock);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Attempt to detect a close/fcntl race and recover by releasing the</div><div class='del'>-	 * lock that was just acquired. There is no need to do that when we're</div><div class='add'>+	 * Detect close/fcntl races and recover by zapping all POSIX locks</div><div class='add'>+	 * associated with this file and our files_struct, just like on</div><div class='add'>+	 * filp_flush(). There is no need to do that when we're</div><div class='ctx'> 	 * unlocking though, or for OFD locks.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!error &amp;&amp; file_lock-&gt;fl_type != F_UNLCK &amp;&amp;</div><div class='del'>-	    !(file_lock-&gt;fl_flags &amp; FL_OFDLCK)) {</div><div class='add'>+	if (!error &amp;&amp; file_lock-&gt;c.flc_type != F_UNLCK &amp;&amp;</div><div class='add'>+	    !(file_lock-&gt;c.flc_flags &amp; FL_OFDLCK)) {</div><div class='ctx'> 		struct files_struct *files = current-&gt;files;</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We need that spin_lock here - it prevents reordering between</div><div class='hunk'>@@ -2467,9 +2637,7 @@ int fcntl_setlk64(unsigned int fd, struct file *filp, unsigned int cmd,</div><div class='ctx'> 		f = files_lookup_fd_locked(files, fd);</div><div class='ctx'> 		spin_unlock(&amp;files-&gt;file_lock);</div><div class='ctx'> 		if (f != filp) {</div><div class='del'>-			file_lock-&gt;fl_type = F_UNLCK;</div><div class='del'>-			error = do_lock_file_wait(filp, cmd, file_lock);</div><div class='del'>-			WARN_ON_ONCE(error);</div><div class='add'>+			locks_remove_posix(filp, files);</div><div class='ctx'> 			error = -EBADF;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2487,7 +2655,7 @@ out:</div><div class='ctx'> void locks_remove_posix(struct file *filp, fl_owner_t owner)</div><div class='ctx'> {</div><div class='ctx'> 	int error;</div><div class='del'>-	struct inode *inode = locks_inode(filp);</div><div class='add'>+	struct inode *inode = file_inode(filp);</div><div class='ctx'> 	struct file_lock lock;</div><div class='ctx'> 	struct file_lock_context *ctx;</div><div class='ctx'> </div><div class='hunk'>@@ -2496,18 +2664,18 @@ void locks_remove_posix(struct file *filp, fl_owner_t owner)</div><div class='ctx'> 	 * posix_lock_file().  Another process could be setting a lock on this</div><div class='ctx'> 	 * file at the same time, but we wouldn't remove that lock anyway.</div><div class='ctx'> 	 */</div><div class='del'>-	ctx =  smp_load_acquire(&amp;inode-&gt;i_flctx);</div><div class='add'>+	ctx = locks_inode_context(inode);</div><div class='ctx'> 	if (!ctx || list_empty(&amp;ctx-&gt;flc_posix))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	locks_init_lock(&amp;lock);</div><div class='del'>-	lock.fl_type = F_UNLCK;</div><div class='del'>-	lock.fl_flags = FL_POSIX | FL_CLOSE;</div><div class='add'>+	lock.c.flc_type = F_UNLCK;</div><div class='add'>+	lock.c.flc_flags = FL_POSIX | FL_CLOSE;</div><div class='ctx'> 	lock.fl_start = 0;</div><div class='ctx'> 	lock.fl_end = OFFSET_MAX;</div><div class='del'>-	lock.fl_owner = owner;</div><div class='del'>-	lock.fl_pid = current-&gt;tgid;</div><div class='del'>-	lock.fl_file = filp;</div><div class='add'>+	lock.c.flc_owner = owner;</div><div class='add'>+	lock.c.flc_pid = current-&gt;tgid;</div><div class='add'>+	lock.c.flc_file = filp;</div><div class='ctx'> 	lock.fl_ops = NULL;</div><div class='ctx'> 	lock.fl_lmops = NULL;</div><div class='ctx'> </div><div class='hunk'>@@ -2524,13 +2692,13 @@ static void</div><div class='ctx'> locks_remove_flock(struct file *filp, struct file_lock_context *flctx)</div><div class='ctx'> {</div><div class='ctx'> 	struct file_lock fl;</div><div class='del'>-	struct inode *inode = locks_inode(filp);</div><div class='add'>+	struct inode *inode = file_inode(filp);</div><div class='ctx'> </div><div class='ctx'> 	if (list_empty(&amp;flctx-&gt;flc_flock))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	flock_make_lock(filp, LOCK_UN, &amp;fl);</div><div class='del'>-	fl.fl_flags |= FL_CLOSE;</div><div class='add'>+	flock_make_lock(filp, &amp;fl, F_UNLCK);</div><div class='add'>+	fl.c.flc_flags |= FL_CLOSE;</div><div class='ctx'> </div><div class='ctx'> 	if (filp-&gt;f_op-&gt;flock)</div><div class='ctx'> 		filp-&gt;f_op-&gt;flock(filp, F_SETLKW, &amp;fl);</div><div class='hunk'>@@ -2545,7 +2713,7 @@ locks_remove_flock(struct file *filp, struct file_lock_context *flctx)</div><div class='ctx'> static void</div><div class='ctx'> locks_remove_lease(struct file *filp, struct file_lock_context *ctx)</div><div class='ctx'> {</div><div class='del'>-	struct file_lock *fl, *tmp;</div><div class='add'>+	struct file_lease *fl, *tmp;</div><div class='ctx'> 	LIST_HEAD(dispose);</div><div class='ctx'> </div><div class='ctx'> 	if (list_empty(&amp;ctx-&gt;flc_lease))</div><div class='hunk'>@@ -2553,8 +2721,8 @@ locks_remove_lease(struct file *filp, struct file_lock_context *ctx)</div><div class='ctx'> </div><div class='ctx'> 	percpu_down_read(&amp;file_rwsem);</div><div class='ctx'> 	spin_lock(&amp;ctx-&gt;flc_lock);</div><div class='del'>-	list_for_each_entry_safe(fl, tmp, &amp;ctx-&gt;flc_lease, fl_list)</div><div class='del'>-		if (filp == fl-&gt;fl_file)</div><div class='add'>+	list_for_each_entry_safe(fl, tmp, &amp;ctx-&gt;flc_lease, c.flc_list)</div><div class='add'>+		if (filp == fl-&gt;c.flc_file)</div><div class='ctx'> 			lease_modify(fl, F_UNLCK, &amp;dispose);</div><div class='ctx'> 	spin_unlock(&amp;ctx-&gt;flc_lock);</div><div class='ctx'> 	percpu_up_read(&amp;file_rwsem);</div><div class='hunk'>@@ -2569,7 +2737,7 @@ void locks_remove_file(struct file *filp)</div><div class='ctx'> {</div><div class='ctx'> 	struct file_lock_context *ctx;</div><div class='ctx'> </div><div class='del'>-	ctx = smp_load_acquire(&amp;locks_inode(filp)-&gt;i_flctx);</div><div class='add'>+	ctx = locks_inode_context(file_inode(filp));</div><div class='ctx'> 	if (!ctx)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='hunk'>@@ -2598,12 +2766,36 @@ void locks_remove_file(struct file *filp)</div><div class='ctx'>  */</div><div class='ctx'> int vfs_cancel_lock(struct file *filp, struct file_lock *fl)</div><div class='ctx'> {</div><div class='add'>+	WARN_ON_ONCE(filp != fl-&gt;c.flc_file);</div><div class='ctx'> 	if (filp-&gt;f_op-&gt;lock)</div><div class='ctx'> 		return filp-&gt;f_op-&gt;lock(filp, F_CANCELLK, fl);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(vfs_cancel_lock);</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * vfs_inode_has_locks - are any file locks held on @inode?</div><div class='add'>+ * @inode: inode to check for locks</div><div class='add'>+ *</div><div class='add'>+ * Return true if there are any FL_POSIX or FL_FLOCK locks currently</div><div class='add'>+ * set on @inode.</div><div class='add'>+ */</div><div class='add'>+bool vfs_inode_has_locks(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct file_lock_context *ctx;</div><div class='add'>+	bool ret;</div><div class='add'>+</div><div class='add'>+	ctx = locks_inode_context(inode);</div><div class='add'>+	if (!ctx)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;ctx-&gt;flc_lock);</div><div class='add'>+	ret = !list_empty(&amp;ctx-&gt;flc_posix) || !list_empty(&amp;ctx-&gt;flc_flock);</div><div class='add'>+	spin_unlock(&amp;ctx-&gt;flc_lock);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(vfs_inode_has_locks);</div><div class='add'>+</div><div class='ctx'> #ifdef CONFIG_PROC_FS</div><div class='ctx'> #include &lt;linux/proc_fs.h&gt;</div><div class='ctx'> #include &lt;linux/seq_file.h&gt;</div><div class='hunk'>@@ -2613,69 +2805,73 @@ struct locks_iterator {</div><div class='ctx'> 	loff_t	li_pos;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static void lock_get_status(struct seq_file *f, struct file_lock *fl,</div><div class='add'>+static void lock_get_status(struct seq_file *f, struct file_lock_core *flc,</div><div class='ctx'> 			    loff_t id, char *pfx, int repeat)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = NULL;</div><div class='del'>-	unsigned int fl_pid;</div><div class='add'>+	unsigned int pid;</div><div class='ctx'> 	struct pid_namespace *proc_pidns = proc_pid_ns(file_inode(f-&gt;file)-&gt;i_sb);</div><div class='del'>-	int type;</div><div class='add'>+	int type = flc-&gt;flc_type;</div><div class='add'>+	struct file_lock *fl = file_lock(flc);</div><div class='add'>+</div><div class='add'>+	pid = locks_translate_pid(flc, proc_pidns);</div><div class='ctx'> </div><div class='del'>-	fl_pid = locks_translate_pid(fl, proc_pidns);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If lock owner is dead (and pid is freed) or not visible in current</div><div class='ctx'> 	 * pidns, zero is shown as a pid value. Check lock info from</div><div class='ctx'> 	 * init_pid_ns to get saved lock pid value.</div><div class='ctx'> 	 */</div><div class='del'>-</div><div class='del'>-	if (fl-&gt;fl_file != NULL)</div><div class='del'>-		inode = locks_inode(fl-&gt;fl_file);</div><div class='add'>+	if (flc-&gt;flc_file != NULL)</div><div class='add'>+		inode = file_inode(flc-&gt;flc_file);</div><div class='ctx'> </div><div class='ctx'> 	seq_printf(f, "%lld: ", id);</div><div class='ctx'> </div><div class='ctx'> 	if (repeat)</div><div class='ctx'> 		seq_printf(f, "%*s", repeat - 1 + (int)strlen(pfx), pfx);</div><div class='ctx'> </div><div class='del'>-	if (IS_POSIX(fl)) {</div><div class='del'>-		if (fl-&gt;fl_flags &amp; FL_ACCESS)</div><div class='add'>+	if (flc-&gt;flc_flags &amp; FL_POSIX) {</div><div class='add'>+		if (flc-&gt;flc_flags &amp; FL_ACCESS)</div><div class='ctx'> 			seq_puts(f, "ACCESS");</div><div class='del'>-		else if (IS_OFDLCK(fl))</div><div class='add'>+		else if (flc-&gt;flc_flags &amp; FL_OFDLCK)</div><div class='ctx'> 			seq_puts(f, "OFDLCK");</div><div class='ctx'> 		else</div><div class='ctx'> 			seq_puts(f, "POSIX ");</div><div class='ctx'> </div><div class='ctx'> 		seq_printf(f, " %s ",</div><div class='ctx'> 			     (inode == NULL) ? "*NOINODE*" : "ADVISORY ");</div><div class='del'>-	} else if (IS_FLOCK(fl)) {</div><div class='add'>+	} else if (flc-&gt;flc_flags &amp; FL_FLOCK) {</div><div class='ctx'> 		seq_puts(f, "FLOCK  ADVISORY  ");</div><div class='del'>-	} else if (IS_LEASE(fl)) {</div><div class='del'>-		if (fl-&gt;fl_flags &amp; FL_DELEG)</div><div class='add'>+	} else if (flc-&gt;flc_flags &amp; (FL_LEASE|FL_DELEG|FL_LAYOUT)) {</div><div class='add'>+		struct file_lease *lease = file_lease(flc);</div><div class='add'>+</div><div class='add'>+		type = target_leasetype(lease);</div><div class='add'>+</div><div class='add'>+		if (flc-&gt;flc_flags &amp; FL_DELEG)</div><div class='ctx'> 			seq_puts(f, "DELEG  ");</div><div class='ctx'> 		else</div><div class='ctx'> 			seq_puts(f, "LEASE  ");</div><div class='ctx'> </div><div class='del'>-		if (lease_breaking(fl))</div><div class='add'>+		if (lease_breaking(lease))</div><div class='ctx'> 			seq_puts(f, "BREAKING  ");</div><div class='del'>-		else if (fl-&gt;fl_file)</div><div class='add'>+		else if (flc-&gt;flc_file)</div><div class='ctx'> 			seq_puts(f, "ACTIVE    ");</div><div class='ctx'> 		else</div><div class='ctx'> 			seq_puts(f, "BREAKER   ");</div><div class='ctx'> 	} else {</div><div class='ctx'> 		seq_puts(f, "UNKNOWN UNKNOWN  ");</div><div class='ctx'> 	}</div><div class='del'>-	type = IS_LEASE(fl) ? target_leasetype(fl) : fl-&gt;fl_type;</div><div class='ctx'> </div><div class='ctx'> 	seq_printf(f, "%s ", (type == F_WRLCK) ? "WRITE" :</div><div class='ctx'> 			     (type == F_RDLCK) ? "READ" : "UNLCK");</div><div class='ctx'> 	if (inode) {</div><div class='ctx'> 		/* userspace relies on this representation of dev_t */</div><div class='del'>-		seq_printf(f, "%d %02x:%02x:%lu ", fl_pid,</div><div class='add'>+		seq_printf(f, "%d %02x:%02x:%lu ", pid,</div><div class='ctx'> 				MAJOR(inode-&gt;i_sb-&gt;s_dev),</div><div class='ctx'> 				MINOR(inode-&gt;i_sb-&gt;s_dev), inode-&gt;i_ino);</div><div class='ctx'> 	} else {</div><div class='del'>-		seq_printf(f, "%d &lt;none&gt;:0 ", fl_pid);</div><div class='add'>+		seq_printf(f, "%d &lt;none&gt;:0 ", pid);</div><div class='ctx'> 	}</div><div class='del'>-	if (IS_POSIX(fl)) {</div><div class='add'>+	if (flc-&gt;flc_flags &amp; FL_POSIX) {</div><div class='ctx'> 		if (fl-&gt;fl_end == OFFSET_MAX)</div><div class='ctx'> 			seq_printf(f, "%Ld EOF\n", fl-&gt;fl_start);</div><div class='ctx'> 		else</div><div class='hunk'>@@ -2685,17 +2881,18 @@ static void lock_get_status(struct seq_file *f, struct file_lock *fl,</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct file_lock *get_next_blocked_member(struct file_lock *node)</div><div class='add'>+static struct file_lock_core *get_next_blocked_member(struct file_lock_core *node)</div><div class='ctx'> {</div><div class='del'>-	struct file_lock *tmp;</div><div class='add'>+	struct file_lock_core *tmp;</div><div class='ctx'> </div><div class='ctx'> 	/* NULL node or root node */</div><div class='del'>-	if (node == NULL || node-&gt;fl_blocker == NULL)</div><div class='add'>+	if (node == NULL || node-&gt;flc_blocker == NULL)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='ctx'> 	/* Next member in the linked list could be itself */</div><div class='del'>-	tmp = list_next_entry(node, fl_blocked_member);</div><div class='del'>-	if (list_entry_is_head(tmp, &amp;node-&gt;fl_blocker-&gt;fl_blocked_requests, fl_blocked_member)</div><div class='add'>+	tmp = list_next_entry(node, flc_blocked_member);</div><div class='add'>+	if (list_entry_is_head(tmp, &amp;node-&gt;flc_blocker-&gt;flc_blocked_requests,</div><div class='add'>+			       flc_blocked_member)</div><div class='ctx'> 		|| tmp == node) {</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2706,18 +2903,18 @@ static struct file_lock *get_next_blocked_member(struct file_lock *node)</div><div class='ctx'> static int locks_show(struct seq_file *f, void *v)</div><div class='ctx'> {</div><div class='ctx'> 	struct locks_iterator *iter = f-&gt;private;</div><div class='del'>-	struct file_lock *cur, *tmp;</div><div class='add'>+	struct file_lock_core *cur, *tmp;</div><div class='ctx'> 	struct pid_namespace *proc_pidns = proc_pid_ns(file_inode(f-&gt;file)-&gt;i_sb);</div><div class='ctx'> 	int level = 0;</div><div class='ctx'> </div><div class='del'>-	cur = hlist_entry(v, struct file_lock, fl_link);</div><div class='add'>+	cur = hlist_entry(v, struct file_lock_core, flc_link);</div><div class='ctx'> </div><div class='ctx'> 	if (locks_translate_pid(cur, proc_pidns) == 0)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	/* View this crossed linked list as a binary tree, the first member of fl_blocked_requests</div><div class='del'>-	 * is the left child of current node, the next silibing in fl_blocked_member is the</div><div class='del'>-	 * right child, we can alse get the parent of current node from fl_blocker, so this</div><div class='add'>+	/* View this crossed linked list as a binary tree, the first member of flc_blocked_requests</div><div class='add'>+	 * is the left child of current node, the next silibing in flc_blocked_member is the</div><div class='add'>+	 * right child, we can alse get the parent of current node from flc_blocker, so this</div><div class='ctx'> 	 * question becomes traversal of a binary tree</div><div class='ctx'> 	 */</div><div class='ctx'> 	while (cur != NULL) {</div><div class='hunk'>@@ -2726,17 +2923,18 @@ static int locks_show(struct seq_file *f, void *v)</div><div class='ctx'> 		else</div><div class='ctx'> 			lock_get_status(f, cur, iter-&gt;li_pos, "", level);</div><div class='ctx'> </div><div class='del'>-		if (!list_empty(&amp;cur-&gt;fl_blocked_requests)) {</div><div class='add'>+		if (!list_empty(&amp;cur-&gt;flc_blocked_requests)) {</div><div class='ctx'> 			/* Turn left */</div><div class='del'>-			cur = list_first_entry_or_null(&amp;cur-&gt;fl_blocked_requests,</div><div class='del'>-				struct file_lock, fl_blocked_member);</div><div class='add'>+			cur = list_first_entry_or_null(&amp;cur-&gt;flc_blocked_requests,</div><div class='add'>+						       struct file_lock_core,</div><div class='add'>+						       flc_blocked_member);</div><div class='ctx'> 			level++;</div><div class='ctx'> 		} else {</div><div class='ctx'> 			/* Turn right */</div><div class='ctx'> 			tmp = get_next_blocked_member(cur);</div><div class='ctx'> 			/* Fall back to parent node */</div><div class='del'>-			while (tmp == NULL &amp;&amp; cur-&gt;fl_blocker != NULL) {</div><div class='del'>-				cur = cur-&gt;fl_blocker;</div><div class='add'>+			while (tmp == NULL &amp;&amp; cur-&gt;flc_blocker != NULL) {</div><div class='add'>+				cur = cur-&gt;flc_blocker;</div><div class='ctx'> 				level--;</div><div class='ctx'> 				tmp = get_next_blocked_member(cur);</div><div class='ctx'> 			}</div><div class='hunk'>@@ -2751,14 +2949,13 @@ static void __show_fd_locks(struct seq_file *f,</div><div class='ctx'> 			struct list_head *head, int *id,</div><div class='ctx'> 			struct file *filp, struct files_struct *files)</div><div class='ctx'> {</div><div class='del'>-	struct file_lock *fl;</div><div class='add'>+	struct file_lock_core *fl;</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry(fl, head, fl_list) {</div><div class='add'>+	list_for_each_entry(fl, head, flc_list) {</div><div class='ctx'> </div><div class='del'>-		if (filp != fl-&gt;fl_file)</div><div class='add'>+		if (filp != fl-&gt;flc_file)</div><div class='ctx'> 			continue;</div><div class='del'>-		if (fl-&gt;fl_owner != files &amp;&amp;</div><div class='del'>-		    fl-&gt;fl_owner != filp)</div><div class='add'>+		if (fl-&gt;flc_owner != files &amp;&amp; fl-&gt;flc_owner != filp)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		(*id)++;</div><div class='hunk'>@@ -2770,11 +2967,11 @@ static void __show_fd_locks(struct seq_file *f,</div><div class='ctx'> void show_fd_locks(struct seq_file *f,</div><div class='ctx'> 		  struct file *filp, struct files_struct *files)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = locks_inode(filp);</div><div class='add'>+	struct inode *inode = file_inode(filp);</div><div class='ctx'> 	struct file_lock_context *ctx;</div><div class='ctx'> 	int id = 0;</div><div class='ctx'> </div><div class='del'>-	ctx = smp_load_acquire(&amp;inode-&gt;i_flctx);</div><div class='add'>+	ctx = locks_inode_context(inode);</div><div class='ctx'> 	if (!ctx)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='hunk'>@@ -2837,6 +3034,9 @@ static int __init filelock_init(void)</div><div class='ctx'> 	filelock_cache = kmem_cache_create("file_lock_cache",</div><div class='ctx'> 			sizeof(struct file_lock), 0, SLAB_PANIC, NULL);</div><div class='ctx'> </div><div class='add'>+	filelease_cache = kmem_cache_create("file_lease_cache",</div><div class='add'>+			sizeof(struct file_lease), 0, SLAB_PANIC, NULL);</div><div class='add'>+</div><div class='ctx'> 	for_each_possible_cpu(i) {</div><div class='ctx'> 		struct file_lock_list_struct *fll = per_cpu_ptr(&amp;file_lock_list, i);</div><div class='ctx'> </div><div class='head'>diff --git a/fs/mbcache.c b/fs/mbcache.c<br/>index 97c54d3a2227..e60a840999aa 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/mbcache.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/mbcache.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/mbcache.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/mbcache.c</a></div><div class='hunk'>@@ -11,7 +11,7 @@</div><div class='ctx'> /*</div><div class='ctx'>  * Mbcache is a simple key-value store. Keys need not be unique, however</div><div class='ctx'>  * key-value pairs are expected to be unique (we use this fact in</div><div class='del'>- * mb_cache_entry_delete()).</div><div class='add'>+ * mb_cache_entry_delete_or_get()).</div><div class='ctx'>  *</div><div class='ctx'>  * Ext2 and ext4 use this cache for deduplication of extended attribute blocks.</div><div class='ctx'>  * Ext4 also uses it for deduplication of xattr values stored in inodes.</div><div class='hunk'>@@ -37,7 +37,7 @@ struct mb_cache {</div><div class='ctx'> 	struct list_head	c_list;</div><div class='ctx'> 	/* Number of entries in cache */</div><div class='ctx'> 	unsigned long		c_entry_count;</div><div class='del'>-	struct shrinker		c_shrink;</div><div class='add'>+	struct shrinker		*c_shrink;</div><div class='ctx'> 	/* Work for shrinking when the cache has too many entries */</div><div class='ctx'> 	struct work_struct	c_shrink_work;</div><div class='ctx'> };</div><div class='hunk'>@@ -90,12 +90,19 @@ int mb_cache_entry_create(struct mb_cache *cache, gfp_t mask, u32 key,</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	INIT_LIST_HEAD(&amp;entry-&gt;e_list);</div><div class='del'>-	/* One ref for hash, one ref returned */</div><div class='del'>-	atomic_set(&amp;entry-&gt;e_refcnt, 1);</div><div class='add'>+	/*</div><div class='add'>+	 * We create entry with two references. One reference is kept by the</div><div class='add'>+	 * hash table, the other reference is used to protect us from</div><div class='add'>+	 * mb_cache_entry_delete_or_get() until the entry is fully setup. This</div><div class='add'>+	 * avoids nesting of cache-&gt;c_list_lock into hash table bit locks which</div><div class='add'>+	 * is problematic for RT.</div><div class='add'>+	 */</div><div class='add'>+	atomic_set(&amp;entry-&gt;e_refcnt, 2);</div><div class='ctx'> 	entry-&gt;e_key = key;</div><div class='ctx'> 	entry-&gt;e_value = value;</div><div class='del'>-	entry-&gt;e_reusable = reusable;</div><div class='del'>-	entry-&gt;e_referenced = 0;</div><div class='add'>+	entry-&gt;e_flags = 0;</div><div class='add'>+	if (reusable)</div><div class='add'>+		set_bit(MBE_REUSABLE_B, &amp;entry-&gt;e_flags);</div><div class='ctx'> 	head = mb_cache_entry_head(cache, key);</div><div class='ctx'> 	hlist_bl_lock(head);</div><div class='ctx'> 	hlist_bl_for_each_entry(dup, dup_node, head, e_hash_list) {</div><div class='hunk'>@@ -107,24 +114,41 @@ int mb_cache_entry_create(struct mb_cache *cache, gfp_t mask, u32 key,</div><div class='ctx'> 	}</div><div class='ctx'> 	hlist_bl_add_head(&amp;entry-&gt;e_hash_list, head);</div><div class='ctx'> 	hlist_bl_unlock(head);</div><div class='del'>-</div><div class='ctx'> 	spin_lock(&amp;cache-&gt;c_list_lock);</div><div class='ctx'> 	list_add_tail(&amp;entry-&gt;e_list, &amp;cache-&gt;c_list);</div><div class='del'>-	/* Grab ref for LRU list */</div><div class='del'>-	atomic_inc(&amp;entry-&gt;e_refcnt);</div><div class='ctx'> 	cache-&gt;c_entry_count++;</div><div class='ctx'> 	spin_unlock(&amp;cache-&gt;c_list_lock);</div><div class='add'>+	mb_cache_entry_put(cache, entry);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(mb_cache_entry_create);</div><div class='ctx'> </div><div class='del'>-void __mb_cache_entry_free(struct mb_cache_entry *entry)</div><div class='add'>+void __mb_cache_entry_free(struct mb_cache *cache, struct mb_cache_entry *entry)</div><div class='ctx'> {</div><div class='add'>+	struct hlist_bl_head *head;</div><div class='add'>+</div><div class='add'>+	head = mb_cache_entry_head(cache, entry-&gt;e_key);</div><div class='add'>+	hlist_bl_lock(head);</div><div class='add'>+	hlist_bl_del(&amp;entry-&gt;e_hash_list);</div><div class='add'>+	hlist_bl_unlock(head);</div><div class='ctx'> 	kmem_cache_free(mb_entry_cache, entry);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(__mb_cache_entry_free);</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * mb_cache_entry_wait_unused - wait to be the last user of the entry</div><div class='add'>+ *</div><div class='add'>+ * @entry - entry to work on</div><div class='add'>+ *</div><div class='add'>+ * Wait to be the last user of the entry.</div><div class='add'>+ */</div><div class='add'>+void mb_cache_entry_wait_unused(struct mb_cache_entry *entry)</div><div class='add'>+{</div><div class='add'>+	wait_var_event(&amp;entry-&gt;e_refcnt, atomic_read(&amp;entry-&gt;e_refcnt) &lt;= 2);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(mb_cache_entry_wait_unused);</div><div class='add'>+</div><div class='ctx'> static struct mb_cache_entry *__entry_find(struct mb_cache *cache,</div><div class='ctx'> 					   struct mb_cache_entry *entry,</div><div class='ctx'> 					   u32 key)</div><div class='hunk'>@@ -142,10 +166,10 @@ static struct mb_cache_entry *__entry_find(struct mb_cache *cache,</div><div class='ctx'> 	while (node) {</div><div class='ctx'> 		entry = hlist_bl_entry(node, struct mb_cache_entry,</div><div class='ctx'> 				       e_hash_list);</div><div class='del'>-		if (entry-&gt;e_key == key &amp;&amp; entry-&gt;e_reusable) {</div><div class='del'>-			atomic_inc(&amp;entry-&gt;e_refcnt);</div><div class='add'>+		if (entry-&gt;e_key == key &amp;&amp;</div><div class='add'>+		    test_bit(MBE_REUSABLE_B, &amp;entry-&gt;e_flags) &amp;&amp;</div><div class='add'>+		    atomic_inc_not_zero(&amp;entry-&gt;e_refcnt))</div><div class='ctx'> 			goto out;</div><div class='del'>-		}</div><div class='ctx'> 		node = node-&gt;next;</div><div class='ctx'> 	}</div><div class='ctx'> 	entry = NULL;</div><div class='hunk'>@@ -205,10 +229,9 @@ struct mb_cache_entry *mb_cache_entry_get(struct mb_cache *cache, u32 key,</div><div class='ctx'> 	head = mb_cache_entry_head(cache, key);</div><div class='ctx'> 	hlist_bl_lock(head);</div><div class='ctx'> 	hlist_bl_for_each_entry(entry, node, head, e_hash_list) {</div><div class='del'>-		if (entry-&gt;e_key == key &amp;&amp; entry-&gt;e_value == value) {</div><div class='del'>-			atomic_inc(&amp;entry-&gt;e_refcnt);</div><div class='add'>+		if (entry-&gt;e_key == key &amp;&amp; entry-&gt;e_value == value &amp;&amp;</div><div class='add'>+		    atomic_inc_not_zero(&amp;entry-&gt;e_refcnt))</div><div class='ctx'> 			goto out;</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='ctx'> 	entry = NULL;</div><div class='ctx'> out:</div><div class='hunk'>@@ -217,42 +240,42 @@ out:</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(mb_cache_entry_get);</div><div class='ctx'> </div><div class='del'>-/* mb_cache_entry_delete - remove a cache entry</div><div class='add'>+/* mb_cache_entry_delete_or_get - remove a cache entry if it has no users</div><div class='ctx'>  * @cache - cache we work with</div><div class='ctx'>  * @key - key</div><div class='ctx'>  * @value - value</div><div class='ctx'>  *</div><div class='del'>- * Remove entry from cache @cache with key @key and value @value.</div><div class='add'>+ * Remove entry from cache @cache with key @key and value @value. The removal</div><div class='add'>+ * happens only if the entry is unused. The function returns NULL in case the</div><div class='add'>+ * entry was successfully removed or there's no entry in cache. Otherwise the</div><div class='add'>+ * function grabs reference of the entry that we failed to delete because it</div><div class='add'>+ * still has users and return it.</div><div class='ctx'>  */</div><div class='del'>-void mb_cache_entry_delete(struct mb_cache *cache, u32 key, u64 value)</div><div class='add'>+struct mb_cache_entry *mb_cache_entry_delete_or_get(struct mb_cache *cache,</div><div class='add'>+						    u32 key, u64 value)</div><div class='ctx'> {</div><div class='del'>-	struct hlist_bl_node *node;</div><div class='del'>-	struct hlist_bl_head *head;</div><div class='ctx'> 	struct mb_cache_entry *entry;</div><div class='ctx'> </div><div class='del'>-	head = mb_cache_entry_head(cache, key);</div><div class='del'>-	hlist_bl_lock(head);</div><div class='del'>-	hlist_bl_for_each_entry(entry, node, head, e_hash_list) {</div><div class='del'>-		if (entry-&gt;e_key == key &amp;&amp; entry-&gt;e_value == value) {</div><div class='del'>-			/* We keep hash list reference to keep entry alive */</div><div class='del'>-			hlist_bl_del_init(&amp;entry-&gt;e_hash_list);</div><div class='del'>-			hlist_bl_unlock(head);</div><div class='del'>-			spin_lock(&amp;cache-&gt;c_list_lock);</div><div class='del'>-			if (!list_empty(&amp;entry-&gt;e_list)) {</div><div class='del'>-				list_del_init(&amp;entry-&gt;e_list);</div><div class='del'>-				if (!WARN_ONCE(cache-&gt;c_entry_count == 0,</div><div class='del'>-		"mbcache: attempt to decrement c_entry_count past zero"))</div><div class='del'>-					cache-&gt;c_entry_count--;</div><div class='del'>-				atomic_dec(&amp;entry-&gt;e_refcnt);</div><div class='del'>-			}</div><div class='del'>-			spin_unlock(&amp;cache-&gt;c_list_lock);</div><div class='del'>-			mb_cache_entry_put(cache, entry);</div><div class='del'>-			return;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	hlist_bl_unlock(head);</div><div class='add'>+	entry = mb_cache_entry_get(cache, key, value);</div><div class='add'>+	if (!entry)</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Drop the ref we got from mb_cache_entry_get() and the initial hash</div><div class='add'>+	 * ref if we are the last user</div><div class='add'>+	 */</div><div class='add'>+	if (atomic_cmpxchg(&amp;entry-&gt;e_refcnt, 2, 0) != 2)</div><div class='add'>+		return entry;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;cache-&gt;c_list_lock);</div><div class='add'>+	if (!list_empty(&amp;entry-&gt;e_list))</div><div class='add'>+		list_del_init(&amp;entry-&gt;e_list);</div><div class='add'>+	cache-&gt;c_entry_count--;</div><div class='add'>+	spin_unlock(&amp;cache-&gt;c_list_lock);</div><div class='add'>+	__mb_cache_entry_free(cache, entry);</div><div class='add'>+	return NULL;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(mb_cache_entry_delete);</div><div class='add'>+EXPORT_SYMBOL(mb_cache_entry_delete_or_get);</div><div class='ctx'> </div><div class='ctx'> /* mb_cache_entry_touch - cache entry got used</div><div class='ctx'>  * @cache - cache the entry belongs to</div><div class='hunk'>@@ -263,15 +286,14 @@ EXPORT_SYMBOL(mb_cache_entry_delete);</div><div class='ctx'> void mb_cache_entry_touch(struct mb_cache *cache,</div><div class='ctx'> 			  struct mb_cache_entry *entry)</div><div class='ctx'> {</div><div class='del'>-	entry-&gt;e_referenced = 1;</div><div class='add'>+	set_bit(MBE_REFERENCED_B, &amp;entry-&gt;e_flags);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(mb_cache_entry_touch);</div><div class='ctx'> </div><div class='ctx'> static unsigned long mb_cache_count(struct shrinker *shrink,</div><div class='ctx'> 				    struct shrink_control *sc)</div><div class='ctx'> {</div><div class='del'>-	struct mb_cache *cache = container_of(shrink, struct mb_cache,</div><div class='del'>-					      c_shrink);</div><div class='add'>+	struct mb_cache *cache = shrink-&gt;private_data;</div><div class='ctx'> </div><div class='ctx'> 	return cache-&gt;c_entry_count;</div><div class='ctx'> }</div><div class='hunk'>@@ -281,34 +303,24 @@ static unsigned long mb_cache_shrink(struct mb_cache *cache,</div><div class='ctx'> 				     unsigned long nr_to_scan)</div><div class='ctx'> {</div><div class='ctx'> 	struct mb_cache_entry *entry;</div><div class='del'>-	struct hlist_bl_head *head;</div><div class='ctx'> 	unsigned long shrunk = 0;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;cache-&gt;c_list_lock);</div><div class='ctx'> 	while (nr_to_scan-- &amp;&amp; !list_empty(&amp;cache-&gt;c_list)) {</div><div class='ctx'> 		entry = list_first_entry(&amp;cache-&gt;c_list,</div><div class='ctx'> 					 struct mb_cache_entry, e_list);</div><div class='del'>-		if (entry-&gt;e_referenced) {</div><div class='del'>-			entry-&gt;e_referenced = 0;</div><div class='add'>+		/* Drop initial hash reference if there is no user */</div><div class='add'>+		if (test_bit(MBE_REFERENCED_B, &amp;entry-&gt;e_flags) ||</div><div class='add'>+		    atomic_cmpxchg(&amp;entry-&gt;e_refcnt, 1, 0) != 1) {</div><div class='add'>+			clear_bit(MBE_REFERENCED_B, &amp;entry-&gt;e_flags);</div><div class='ctx'> 			list_move_tail(&amp;entry-&gt;e_list, &amp;cache-&gt;c_list);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> 		list_del_init(&amp;entry-&gt;e_list);</div><div class='ctx'> 		cache-&gt;c_entry_count--;</div><div class='del'>-		/*</div><div class='del'>-		 * We keep LRU list reference so that entry doesn't go away</div><div class='del'>-		 * from under us.</div><div class='del'>-		 */</div><div class='ctx'> 		spin_unlock(&amp;cache-&gt;c_list_lock);</div><div class='del'>-		head = mb_cache_entry_head(cache, entry-&gt;e_key);</div><div class='del'>-		hlist_bl_lock(head);</div><div class='del'>-		if (!hlist_bl_unhashed(&amp;entry-&gt;e_hash_list)) {</div><div class='del'>-			hlist_bl_del_init(&amp;entry-&gt;e_hash_list);</div><div class='del'>-			atomic_dec(&amp;entry-&gt;e_refcnt);</div><div class='del'>-		}</div><div class='del'>-		hlist_bl_unlock(head);</div><div class='del'>-		if (mb_cache_entry_put(cache, entry))</div><div class='del'>-			shrunk++;</div><div class='add'>+		__mb_cache_entry_free(cache, entry);</div><div class='add'>+		shrunk++;</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 		spin_lock(&amp;cache-&gt;c_list_lock);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -320,8 +332,7 @@ static unsigned long mb_cache_shrink(struct mb_cache *cache,</div><div class='ctx'> static unsigned long mb_cache_scan(struct shrinker *shrink,</div><div class='ctx'> 				   struct shrink_control *sc)</div><div class='ctx'> {</div><div class='del'>-	struct mb_cache *cache = container_of(shrink, struct mb_cache,</div><div class='del'>-					      c_shrink);</div><div class='add'>+	struct mb_cache *cache = shrink-&gt;private_data;</div><div class='ctx'> 	return mb_cache_shrink(cache, sc-&gt;nr_to_scan);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -364,15 +375,19 @@ struct mb_cache *mb_cache_create(int bucket_bits)</div><div class='ctx'> 	for (i = 0; i &lt; bucket_count; i++)</div><div class='ctx'> 		INIT_HLIST_BL_HEAD(&amp;cache-&gt;c_hash[i]);</div><div class='ctx'> </div><div class='del'>-	cache-&gt;c_shrink.count_objects = mb_cache_count;</div><div class='del'>-	cache-&gt;c_shrink.scan_objects = mb_cache_scan;</div><div class='del'>-	cache-&gt;c_shrink.seeks = DEFAULT_SEEKS;</div><div class='del'>-	if (register_shrinker(&amp;cache-&gt;c_shrink)) {</div><div class='add'>+	cache-&gt;c_shrink = shrinker_alloc(0, "mbcache-shrinker");</div><div class='add'>+	if (!cache-&gt;c_shrink) {</div><div class='ctx'> 		kfree(cache-&gt;c_hash);</div><div class='ctx'> 		kfree(cache);</div><div class='ctx'> 		goto err_out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	cache-&gt;c_shrink-&gt;count_objects = mb_cache_count;</div><div class='add'>+	cache-&gt;c_shrink-&gt;scan_objects = mb_cache_scan;</div><div class='add'>+	cache-&gt;c_shrink-&gt;private_data = cache;</div><div class='add'>+</div><div class='add'>+	shrinker_register(cache-&gt;c_shrink);</div><div class='add'>+</div><div class='ctx'> 	INIT_WORK(&amp;cache-&gt;c_shrink_work, mb_cache_shrink_worker);</div><div class='ctx'> </div><div class='ctx'> 	return cache;</div><div class='hunk'>@@ -393,18 +408,13 @@ void mb_cache_destroy(struct mb_cache *cache)</div><div class='ctx'> {</div><div class='ctx'> 	struct mb_cache_entry *entry, *next;</div><div class='ctx'> </div><div class='del'>-	unregister_shrinker(&amp;cache-&gt;c_shrink);</div><div class='add'>+	shrinker_free(cache-&gt;c_shrink);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We don't bother with any locking. Cache must not be used at this</div><div class='ctx'> 	 * point.</div><div class='ctx'> 	 */</div><div class='ctx'> 	list_for_each_entry_safe(entry, next, &amp;cache-&gt;c_list, e_list) {</div><div class='del'>-		if (!hlist_bl_unhashed(&amp;entry-&gt;e_hash_list)) {</div><div class='del'>-			hlist_bl_del_init(&amp;entry-&gt;e_hash_list);</div><div class='del'>-			atomic_dec(&amp;entry-&gt;e_refcnt);</div><div class='del'>-		} else</div><div class='del'>-			WARN_ON(1);</div><div class='ctx'> 		list_del(&amp;entry-&gt;e_list);</div><div class='ctx'> 		WARN_ON(atomic_read(&amp;entry-&gt;e_refcnt) != 1);</div><div class='ctx'> 		mb_cache_entry_put(cache, entry);</div><div class='hunk'>@@ -416,9 +426,7 @@ EXPORT_SYMBOL(mb_cache_destroy);</div><div class='ctx'> </div><div class='ctx'> static int __init mbcache_init(void)</div><div class='ctx'> {</div><div class='del'>-	mb_entry_cache = kmem_cache_create("mbcache",</div><div class='del'>-				sizeof(struct mb_cache_entry), 0,</div><div class='del'>-				SLAB_RECLAIM_ACCOUNT|SLAB_MEM_SPREAD, NULL);</div><div class='add'>+	mb_entry_cache = KMEM_CACHE(mb_cache_entry, SLAB_RECLAIM_ACCOUNT);</div><div class='ctx'> 	if (!mb_entry_cache)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	return 0;</div><div class='head'>diff --git a/fs/minix/Kconfig b/fs/minix/Kconfig<br/>index de2003974ff0..90ddfad2a75e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/minix/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/minix/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/minix/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/minix/Kconfig</a></div><div class='hunk'>@@ -2,6 +2,7 @@</div><div class='ctx'> config MINIX_FS</div><div class='ctx'> 	tristate "Minix file system support"</div><div class='ctx'> 	depends on BLOCK</div><div class='add'>+	select BUFFER_HEAD</div><div class='ctx'> 	help</div><div class='ctx'> 	  Minix is a simple operating system used in many classes about OS's.</div><div class='ctx'> 	  The minix file system (method to organize files on a hard disk</div><div class='head'>diff --git a/fs/minix/bitmap.c b/fs/minix/bitmap.c<br/>index 9115948c624e..7da66ca184f4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/minix/bitmap.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/minix/bitmap.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/minix/bitmap.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/minix/bitmap.c</a></div><div class='hunk'>@@ -210,7 +210,7 @@ void minix_free_inode(struct inode * inode)</div><div class='ctx'> 	mark_buffer_dirty(bh);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct inode *minix_new_inode(const struct inode *dir, umode_t mode, int *error)</div><div class='add'>+struct inode *minix_new_inode(const struct inode *dir, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = dir-&gt;i_sb;</div><div class='ctx'> 	struct minix_sb_info *sbi = minix_sb(sb);</div><div class='hunk'>@@ -220,13 +220,10 @@ struct inode *minix_new_inode(const struct inode *dir, umode_t mode, int *error)</div><div class='ctx'> 	unsigned long j;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	if (!inode) {</div><div class='del'>-		*error = -ENOMEM;</div><div class='del'>-		return NULL;</div><div class='del'>-	}</div><div class='add'>+	if (!inode)</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='ctx'> 	j = bits_per_zone;</div><div class='ctx'> 	bh = NULL;</div><div class='del'>-	*error = -ENOSPC;</div><div class='ctx'> 	spin_lock(&amp;bitmap_lock);</div><div class='ctx'> 	for (i = 0; i &lt; sbi-&gt;s_imap_blocks; i++) {</div><div class='ctx'> 		bh = sbi-&gt;s_imap[i];</div><div class='hunk'>@@ -237,30 +234,29 @@ struct inode *minix_new_inode(const struct inode *dir, umode_t mode, int *error)</div><div class='ctx'> 	if (!bh || j &gt;= bits_per_zone) {</div><div class='ctx'> 		spin_unlock(&amp;bitmap_lock);</div><div class='ctx'> 		iput(inode);</div><div class='del'>-		return NULL;</div><div class='add'>+		return ERR_PTR(-ENOSPC);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (minix_test_and_set_bit(j, bh-&gt;b_data)) {	/* shouldn't happen */</div><div class='ctx'> 		spin_unlock(&amp;bitmap_lock);</div><div class='ctx'> 		printk("minix_new_inode: bit already set\n");</div><div class='ctx'> 		iput(inode);</div><div class='del'>-		return NULL;</div><div class='add'>+		return ERR_PTR(-ENOSPC);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;bitmap_lock);</div><div class='ctx'> 	mark_buffer_dirty(bh);</div><div class='ctx'> 	j += i * bits_per_zone;</div><div class='ctx'> 	if (!j || j &gt; sbi-&gt;s_ninodes) {</div><div class='ctx'> 		iput(inode);</div><div class='del'>-		return NULL;</div><div class='add'>+		return ERR_PTR(-ENOSPC);</div><div class='ctx'> 	}</div><div class='del'>-	inode_init_owner(&amp;init_user_ns, inode, dir, mode);</div><div class='add'>+	inode_init_owner(&amp;nop_mnt_idmap, inode, dir, mode);</div><div class='ctx'> 	inode-&gt;i_ino = j;</div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_atime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	simple_inode_init_ts(inode);</div><div class='ctx'> 	inode-&gt;i_blocks = 0;</div><div class='ctx'> 	memset(&amp;minix_i(inode)-&gt;u, 0, sizeof(minix_i(inode)-&gt;u));</div><div class='ctx'> 	insert_inode_hash(inode);</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='ctx'> </div><div class='del'>-	*error = 0;</div><div class='ctx'> 	return inode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/minix/dir.c b/fs/minix/dir.c<br/>index dcfe5b25378b..19052fc47e9e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/minix/dir.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/minix/dir.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/minix/dir.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/minix/dir.c</a></div><div class='hunk'>@@ -26,12 +26,6 @@ const struct file_operations minix_dir_operations = {</div><div class='ctx'> 	.fsync		= generic_file_fsync,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static inline void dir_put_page(struct page *page)</div><div class='del'>-{</div><div class='del'>-	kunmap(page);</div><div class='del'>-	put_page(page);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Return the offset into page `page_nr' of the last valid</div><div class='ctx'>  * byte in that page, plus one.</div><div class='hunk'>@@ -46,31 +40,39 @@ minix_last_byte(struct inode *inode, unsigned long page_nr)</div><div class='ctx'> 	return last_byte;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int dir_commit_chunk(struct page *page, loff_t pos, unsigned len)</div><div class='add'>+static void dir_commit_chunk(struct folio *folio, loff_t pos, unsigned len)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *mapping = page-&gt;mapping;</div><div class='add'>+	struct address_space *mapping = folio-&gt;mapping;</div><div class='ctx'> 	struct inode *dir = mapping-&gt;host;</div><div class='del'>-	int err = 0;</div><div class='del'>-	block_write_end(NULL, mapping, pos, len, len, page, NULL);</div><div class='add'>+</div><div class='add'>+	block_write_end(pos, len, len, folio);</div><div class='ctx'> </div><div class='ctx'> 	if (pos+len &gt; dir-&gt;i_size) {</div><div class='ctx'> 		i_size_write(dir, pos+len);</div><div class='ctx'> 		mark_inode_dirty(dir);</div><div class='ctx'> 	}</div><div class='del'>-	if (IS_DIRSYNC(dir))</div><div class='del'>-		err = write_one_page(page);</div><div class='del'>-	else</div><div class='del'>-		unlock_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int minix_handle_dirsync(struct inode *dir)</div><div class='add'>+{</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = filemap_write_and_wait(dir-&gt;i_mapping);</div><div class='add'>+	if (!err)</div><div class='add'>+		err = sync_inode_metadata(dir, 1);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct page * dir_get_page(struct inode *dir, unsigned long n)</div><div class='add'>+static void *dir_get_folio(struct inode *dir, unsigned long n,</div><div class='add'>+		struct folio **foliop)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *mapping = dir-&gt;i_mapping;</div><div class='del'>-	struct page *page = read_mapping_page(mapping, n, NULL);</div><div class='del'>-	if (!IS_ERR(page))</div><div class='del'>-		kmap(page);</div><div class='del'>-	return page;</div><div class='add'>+	struct folio *folio = read_mapping_folio(dir-&gt;i_mapping, n, NULL);</div><div class='add'>+</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return ERR_CAST(folio);</div><div class='add'>+	*foliop = folio;</div><div class='add'>+	return kmap_local_folio(folio, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void *minix_next_entry(void *de, struct minix_sb_info *sbi)</div><div class='hunk'>@@ -98,11 +100,11 @@ static int minix_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> </div><div class='ctx'> 	for ( ; n &lt; npages; n++, offset = 0) {</div><div class='ctx'> 		char *p, *kaddr, *limit;</div><div class='del'>-		struct page *page = dir_get_page(inode, n);</div><div class='add'>+		struct folio *folio;</div><div class='ctx'> </div><div class='del'>-		if (IS_ERR(page))</div><div class='add'>+		kaddr = dir_get_folio(inode, n, &amp;folio);</div><div class='add'>+		if (IS_ERR(kaddr))</div><div class='ctx'> 			continue;</div><div class='del'>-		kaddr = (char *)page_address(page);</div><div class='ctx'> 		p = kaddr+offset;</div><div class='ctx'> 		limit = kaddr + minix_last_byte(inode, n) - chunk_size;</div><div class='ctx'> 		for ( ; p &lt;= limit; p = minix_next_entry(p, sbi)) {</div><div class='hunk'>@@ -121,13 +123,13 @@ static int minix_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 				unsigned l = strnlen(name, sbi-&gt;s_namelen);</div><div class='ctx'> 				if (!dir_emit(ctx, name, l,</div><div class='ctx'> 					      inumber, DT_UNKNOWN)) {</div><div class='del'>-					dir_put_page(page);</div><div class='add'>+					folio_release_kmap(folio, p);</div><div class='ctx'> 					return 0;</div><div class='ctx'> 				}</div><div class='ctx'> 			}</div><div class='ctx'> 			ctx-&gt;pos += chunk_size;</div><div class='ctx'> 		}</div><div class='del'>-		dir_put_page(page);</div><div class='add'>+		folio_release_kmap(folio, kaddr);</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -143,12 +145,13 @@ static inline int namecompare(int len, int maxlen,</div><div class='ctx'> /*</div><div class='ctx'>  *	minix_find_entry()</div><div class='ctx'>  *</div><div class='del'>- * finds an entry in the specified directory with the wanted name. It</div><div class='del'>- * returns the cache buffer in which the entry was found, and the entry</div><div class='del'>- * itself (as a parameter - res_dir). It does NOT read the inode of the</div><div class='add'>+ * finds an entry in the specified directory with the wanted name.</div><div class='add'>+ * It does NOT read the inode of the</div><div class='ctx'>  * entry - you'll have to do that yourself if you want to.</div><div class='add'>+ * </div><div class='add'>+ * On Success folio_release_kmap() should be called on *foliop.</div><div class='ctx'>  */</div><div class='del'>-minix_dirent *minix_find_entry(struct dentry *dentry, struct page **res_page)</div><div class='add'>+minix_dirent *minix_find_entry(struct dentry *dentry, struct folio **foliop)</div><div class='ctx'> {</div><div class='ctx'> 	const char * name = dentry-&gt;d_name.name;</div><div class='ctx'> 	int namelen = dentry-&gt;d_name.len;</div><div class='hunk'>@@ -157,21 +160,18 @@ minix_dirent *minix_find_entry(struct dentry *dentry, struct page **res_page)</div><div class='ctx'> 	struct minix_sb_info * sbi = minix_sb(sb);</div><div class='ctx'> 	unsigned long n;</div><div class='ctx'> 	unsigned long npages = dir_pages(dir);</div><div class='del'>-	struct page *page = NULL;</div><div class='ctx'> 	char *p;</div><div class='ctx'> </div><div class='ctx'> 	char *namx;</div><div class='ctx'> 	__u32 inumber;</div><div class='del'>-	*res_page = NULL;</div><div class='ctx'> </div><div class='ctx'> 	for (n = 0; n &lt; npages; n++) {</div><div class='ctx'> 		char *kaddr, *limit;</div><div class='ctx'> </div><div class='del'>-		page = dir_get_page(dir, n);</div><div class='del'>-		if (IS_ERR(page))</div><div class='add'>+		kaddr = dir_get_folio(dir, n, foliop);</div><div class='add'>+		if (IS_ERR(kaddr))</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		kaddr = (char*)page_address(page);</div><div class='ctx'> 		limit = kaddr + minix_last_byte(dir, n) - sbi-&gt;s_dirsize;</div><div class='ctx'> 		for (p = kaddr; p &lt;= limit; p = minix_next_entry(p, sbi)) {</div><div class='ctx'> 			if (sbi-&gt;s_version == MINIX_V3) {</div><div class='hunk'>@@ -188,12 +188,11 @@ minix_dirent *minix_find_entry(struct dentry *dentry, struct page **res_page)</div><div class='ctx'> 			if (namecompare(namelen, sbi-&gt;s_namelen, name, namx))</div><div class='ctx'> 				goto found;</div><div class='ctx'> 		}</div><div class='del'>-		dir_put_page(page);</div><div class='add'>+		folio_release_kmap(*foliop, kaddr);</div><div class='ctx'> 	}</div><div class='ctx'> 	return NULL;</div><div class='ctx'> </div><div class='ctx'> found:</div><div class='del'>-	*res_page = page;</div><div class='ctx'> 	return (minix_dirent *)p;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -204,7 +203,7 @@ int minix_add_link(struct dentry *dentry, struct inode *inode)</div><div class='ctx'> 	int namelen = dentry-&gt;d_name.len;</div><div class='ctx'> 	struct super_block * sb = dir-&gt;i_sb;</div><div class='ctx'> 	struct minix_sb_info * sbi = minix_sb(sb);</div><div class='del'>-	struct page *page = NULL;</div><div class='add'>+	struct folio *folio = NULL;</div><div class='ctx'> 	unsigned long npages = dir_pages(dir);</div><div class='ctx'> 	unsigned long n;</div><div class='ctx'> 	char *kaddr, *p;</div><div class='hunk'>@@ -223,12 +222,10 @@ int minix_add_link(struct dentry *dentry, struct inode *inode)</div><div class='ctx'> 	for (n = 0; n &lt;= npages; n++) {</div><div class='ctx'> 		char *limit, *dir_end;</div><div class='ctx'> </div><div class='del'>-		page = dir_get_page(dir, n);</div><div class='del'>-		err = PTR_ERR(page);</div><div class='del'>-		if (IS_ERR(page))</div><div class='del'>-			goto out;</div><div class='del'>-		lock_page(page);</div><div class='del'>-		kaddr = (char*)page_address(page);</div><div class='add'>+		kaddr = dir_get_folio(dir, n, &amp;folio);</div><div class='add'>+		if (IS_ERR(kaddr))</div><div class='add'>+			return PTR_ERR(kaddr);</div><div class='add'>+		folio_lock(folio);</div><div class='ctx'> 		dir_end = kaddr + minix_last_byte(dir, n);</div><div class='ctx'> 		limit = kaddr + PAGE_SIZE - sbi-&gt;s_dirsize;</div><div class='ctx'> 		for (p = kaddr; p &lt;= limit; p = minix_next_entry(p, sbi)) {</div><div class='hunk'>@@ -255,15 +252,15 @@ int minix_add_link(struct dentry *dentry, struct inode *inode)</div><div class='ctx'> 			if (namecompare(namelen, sbi-&gt;s_namelen, name, namx))</div><div class='ctx'> 				goto out_unlock;</div><div class='ctx'> 		}</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		dir_put_page(page);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_release_kmap(folio, kaddr);</div><div class='ctx'> 	}</div><div class='ctx'> 	BUG();</div><div class='ctx'> 	return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> got_it:</div><div class='del'>-	pos = page_offset(page) + p - (char *)page_address(page);</div><div class='del'>-	err = minix_prepare_chunk(page, pos, sbi-&gt;s_dirsize);</div><div class='add'>+	pos = folio_pos(folio) + offset_in_folio(folio, p);</div><div class='add'>+	err = minix_prepare_chunk(folio, pos, sbi-&gt;s_dirsize);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	memcpy (namx, name, namelen);</div><div class='hunk'>@@ -274,61 +271,59 @@ got_it:</div><div class='ctx'> 		memset (namx + namelen, 0, sbi-&gt;s_dirsize - namelen - 2);</div><div class='ctx'> 		de-&gt;inode = inode-&gt;i_ino;</div><div class='ctx'> 	}</div><div class='del'>-	err = dir_commit_chunk(page, pos, sbi-&gt;s_dirsize);</div><div class='del'>-	dir-&gt;i_mtime = dir-&gt;i_ctime = current_time(dir);</div><div class='add'>+	dir_commit_chunk(folio, pos, sbi-&gt;s_dirsize);</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='ctx'> 	mark_inode_dirty(dir);</div><div class='add'>+	err = minix_handle_dirsync(dir);</div><div class='ctx'> out_put:</div><div class='del'>-	dir_put_page(page);</div><div class='del'>-out:</div><div class='add'>+	folio_release_kmap(folio, kaddr);</div><div class='ctx'> 	return err;</div><div class='ctx'> out_unlock:</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> 	goto out_put;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int minix_delete_entry(struct minix_dir_entry *de, struct page *page)</div><div class='add'>+int minix_delete_entry(struct minix_dir_entry *de, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='del'>-	char *kaddr = page_address(page);</div><div class='del'>-	loff_t pos = page_offset(page) + (char*)de - kaddr;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+	loff_t pos = folio_pos(folio) + offset_in_folio(folio, de);</div><div class='ctx'> 	struct minix_sb_info *sbi = minix_sb(inode-&gt;i_sb);</div><div class='ctx'> 	unsigned len = sbi-&gt;s_dirsize;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	lock_page(page);</div><div class='del'>-	err = minix_prepare_chunk(page, pos, len);</div><div class='del'>-	if (err == 0) {</div><div class='del'>-		if (sbi-&gt;s_version == MINIX_V3)</div><div class='del'>-			((minix3_dirent *) de)-&gt;inode = 0;</div><div class='del'>-		else</div><div class='del'>-			de-&gt;inode = 0;</div><div class='del'>-		err = dir_commit_chunk(page, pos, len);</div><div class='del'>-	} else {</div><div class='del'>-		unlock_page(page);</div><div class='add'>+	folio_lock(folio);</div><div class='add'>+	err = minix_prepare_chunk(folio, pos, len);</div><div class='add'>+	if (err) {</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		return err;</div><div class='ctx'> 	}</div><div class='del'>-	dir_put_page(page);</div><div class='del'>-	inode-&gt;i_ctime = inode-&gt;i_mtime = current_time(inode);</div><div class='add'>+	if (sbi-&gt;s_version == MINIX_V3)</div><div class='add'>+		((minix3_dirent *)de)-&gt;inode = 0;</div><div class='add'>+	else</div><div class='add'>+		de-&gt;inode = 0;</div><div class='add'>+	dir_commit_chunk(folio, pos, len);</div><div class='add'>+	inode_set_mtime_to_ts(inode, inode_set_ctime_current(inode));</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='del'>-	return err;</div><div class='add'>+	return minix_handle_dirsync(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int minix_make_empty(struct inode *inode, struct inode *dir)</div><div class='ctx'> {</div><div class='del'>-	struct page *page = grab_cache_page(inode-&gt;i_mapping, 0);</div><div class='add'>+	struct folio *folio = filemap_grab_folio(inode-&gt;i_mapping, 0);</div><div class='ctx'> 	struct minix_sb_info *sbi = minix_sb(inode-&gt;i_sb);</div><div class='ctx'> 	char *kaddr;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	if (!page)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	err = minix_prepare_chunk(page, 0, 2 * sbi-&gt;s_dirsize);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio);</div><div class='add'>+	err = minix_prepare_chunk(folio, 0, 2 * sbi-&gt;s_dirsize);</div><div class='ctx'> 	if (err) {</div><div class='del'>-		unlock_page(page);</div><div class='add'>+		folio_unlock(folio);</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	kaddr = kmap_atomic(page);</div><div class='del'>-	memset(kaddr, 0, PAGE_SIZE);</div><div class='add'>+	kaddr = kmap_local_folio(folio, 0);</div><div class='add'>+	memset(kaddr, 0, folio_size(folio));</div><div class='ctx'> </div><div class='ctx'> 	if (sbi-&gt;s_version == MINIX_V3) {</div><div class='ctx'> 		minix3_dirent *de3 = (minix3_dirent *)kaddr;</div><div class='hunk'>@@ -347,11 +342,12 @@ int minix_make_empty(struct inode *inode, struct inode *dir)</div><div class='ctx'> 		de-&gt;inode = dir-&gt;i_ino;</div><div class='ctx'> 		strcpy(de-&gt;name, "..");</div><div class='ctx'> 	}</div><div class='del'>-	kunmap_atomic(kaddr);</div><div class='add'>+	kunmap_local(kaddr);</div><div class='ctx'> </div><div class='del'>-	err = dir_commit_chunk(page, 0, 2 * sbi-&gt;s_dirsize);</div><div class='add'>+	dir_commit_chunk(folio, 0, 2 * sbi-&gt;s_dirsize);</div><div class='add'>+	err = minix_handle_dirsync(inode);</div><div class='ctx'> fail:</div><div class='del'>-	put_page(page);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -360,20 +356,19 @@ fail:</div><div class='ctx'>  */</div><div class='ctx'> int minix_empty_dir(struct inode * inode)</div><div class='ctx'> {</div><div class='del'>-	struct page *page = NULL;</div><div class='add'>+	struct folio *folio = NULL;</div><div class='ctx'> 	unsigned long i, npages = dir_pages(inode);</div><div class='ctx'> 	struct minix_sb_info *sbi = minix_sb(inode-&gt;i_sb);</div><div class='del'>-	char *name;</div><div class='add'>+	char *name, *kaddr;</div><div class='ctx'> 	__u32 inumber;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; npages; i++) {</div><div class='del'>-		char *p, *kaddr, *limit;</div><div class='add'>+		char *p, *limit;</div><div class='ctx'> </div><div class='del'>-		page = dir_get_page(inode, i);</div><div class='del'>-		if (IS_ERR(page))</div><div class='add'>+		kaddr = dir_get_folio(inode, i, &amp;folio);</div><div class='add'>+		if (IS_ERR(kaddr))</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		kaddr = (char *)page_address(page);</div><div class='ctx'> 		limit = kaddr + minix_last_byte(inode, i) - sbi-&gt;s_dirsize;</div><div class='ctx'> 		for (p = kaddr; p &lt;= limit; p = minix_next_entry(p, sbi)) {</div><div class='ctx'> 			if (sbi-&gt;s_version == MINIX_V3) {</div><div class='hunk'>@@ -399,71 +394,65 @@ int minix_empty_dir(struct inode * inode)</div><div class='ctx'> 					goto not_empty;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		dir_put_page(page);</div><div class='add'>+		folio_release_kmap(folio, kaddr);</div><div class='ctx'> 	}</div><div class='ctx'> 	return 1;</div><div class='ctx'> </div><div class='ctx'> not_empty:</div><div class='del'>-	dir_put_page(page);</div><div class='add'>+	folio_release_kmap(folio, kaddr);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Releases the page */</div><div class='del'>-void minix_set_link(struct minix_dir_entry *de, struct page *page,</div><div class='del'>-	struct inode *inode)</div><div class='add'>+int minix_set_link(struct minix_dir_entry *de, struct folio *folio,</div><div class='add'>+		struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct inode *dir = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *dir = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	struct minix_sb_info *sbi = minix_sb(dir-&gt;i_sb);</div><div class='del'>-	loff_t pos = page_offset(page) +</div><div class='del'>-			(char *)de-(char*)page_address(page);</div><div class='add'>+	loff_t pos = folio_pos(folio) + offset_in_folio(folio, de);</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	lock_page(page);</div><div class='del'>-</div><div class='del'>-	err = minix_prepare_chunk(page, pos, sbi-&gt;s_dirsize);</div><div class='del'>-	if (err == 0) {</div><div class='del'>-		if (sbi-&gt;s_version == MINIX_V3)</div><div class='del'>-			((minix3_dirent *) de)-&gt;inode = inode-&gt;i_ino;</div><div class='del'>-		else</div><div class='del'>-			de-&gt;inode = inode-&gt;i_ino;</div><div class='del'>-		err = dir_commit_chunk(page, pos, sbi-&gt;s_dirsize);</div><div class='del'>-	} else {</div><div class='del'>-		unlock_page(page);</div><div class='add'>+	folio_lock(folio);</div><div class='add'>+	err = minix_prepare_chunk(folio, pos, sbi-&gt;s_dirsize);</div><div class='add'>+	if (err) {</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		return err;</div><div class='ctx'> 	}</div><div class='del'>-	dir_put_page(page);</div><div class='del'>-	dir-&gt;i_mtime = dir-&gt;i_ctime = current_time(dir);</div><div class='add'>+	if (sbi-&gt;s_version == MINIX_V3)</div><div class='add'>+		((minix3_dirent *)de)-&gt;inode = inode-&gt;i_ino;</div><div class='add'>+	else</div><div class='add'>+		de-&gt;inode = inode-&gt;i_ino;</div><div class='add'>+	dir_commit_chunk(folio, pos, sbi-&gt;s_dirsize);</div><div class='add'>+	inode_set_mtime_to_ts(dir, inode_set_ctime_current(dir));</div><div class='ctx'> 	mark_inode_dirty(dir);</div><div class='add'>+	return minix_handle_dirsync(dir);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct minix_dir_entry * minix_dotdot (struct inode *dir, struct page **p)</div><div class='add'>+struct minix_dir_entry *minix_dotdot(struct inode *dir, struct folio **foliop)</div><div class='ctx'> {</div><div class='del'>-	struct page *page = dir_get_page(dir, 0);</div><div class='ctx'> 	struct minix_sb_info *sbi = minix_sb(dir-&gt;i_sb);</div><div class='del'>-	struct minix_dir_entry *de = NULL;</div><div class='add'>+	struct minix_dir_entry *de = dir_get_folio(dir, 0, foliop);</div><div class='ctx'> </div><div class='del'>-	if (!IS_ERR(page)) {</div><div class='del'>-		de = minix_next_entry(page_address(page), sbi);</div><div class='del'>-		*p = page;</div><div class='del'>-	}</div><div class='del'>-	return de;</div><div class='add'>+	if (!IS_ERR(de))</div><div class='add'>+		return minix_next_entry(de, sbi);</div><div class='add'>+	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> ino_t minix_inode_by_name(struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='del'>-	struct minix_dir_entry *de = minix_find_entry(dentry, &amp;page);</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	struct minix_dir_entry *de = minix_find_entry(dentry, &amp;folio);</div><div class='ctx'> 	ino_t res = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (de) {</div><div class='del'>-		struct address_space *mapping = page-&gt;mapping;</div><div class='del'>-		struct inode *inode = mapping-&gt;host;</div><div class='add'>+		struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 		struct minix_sb_info *sbi = minix_sb(inode-&gt;i_sb);</div><div class='ctx'> </div><div class='ctx'> 		if (sbi-&gt;s_version == MINIX_V3)</div><div class='ctx'> 			res = ((minix3_dirent *) de)-&gt;inode;</div><div class='ctx'> 		else</div><div class='ctx'> 			res = de-&gt;inode;</div><div class='del'>-		dir_put_page(page);</div><div class='add'>+		folio_release_kmap(folio, de);</div><div class='ctx'> 	}</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/minix/file.c b/fs/minix/file.c<br/>index 6a7bd2d9eec0..dca7ac71f049 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/minix/file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/minix/file.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/minix/file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/minix/file.c</a></div><div class='hunk'>@@ -17,18 +17,18 @@ const struct file_operations minix_file_operations = {</div><div class='ctx'> 	.llseek		= generic_file_llseek,</div><div class='ctx'> 	.read_iter	= generic_file_read_iter,</div><div class='ctx'> 	.write_iter	= generic_file_write_iter,</div><div class='del'>-	.mmap		= generic_file_mmap,</div><div class='add'>+	.mmap_prepare	= generic_file_mmap_prepare,</div><div class='ctx'> 	.fsync		= generic_file_fsync,</div><div class='del'>-	.splice_read	= generic_file_splice_read,</div><div class='add'>+	.splice_read	= filemap_splice_read,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int minix_setattr(struct user_namespace *mnt_userns,</div><div class='add'>+static int minix_setattr(struct mnt_idmap *idmap,</div><div class='ctx'> 			 struct dentry *dentry, struct iattr *attr)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	error = setattr_prepare(&amp;init_user_ns, dentry, attr);</div><div class='add'>+	error = setattr_prepare(&amp;nop_mnt_idmap, dentry, attr);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='hunk'>@@ -42,7 +42,7 @@ static int minix_setattr(struct user_namespace *mnt_userns,</div><div class='ctx'> 		minix_truncate(inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	setattr_copy(&amp;init_user_ns, inode, attr);</div><div class='add'>+	setattr_copy(&amp;nop_mnt_idmap, inode, attr);</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/minix/inode.c b/fs/minix/inode.c<br/>index a71f1cf894b9..51ea9bdc813f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/minix/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/minix/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/minix/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/minix/inode.c</a></div><div class='hunk'>@@ -17,13 +17,30 @@</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/init.h&gt;</div><div class='ctx'> #include &lt;linux/highuid.h&gt;</div><div class='add'>+#include &lt;linux/mpage.h&gt;</div><div class='ctx'> #include &lt;linux/vfs.h&gt;</div><div class='ctx'> #include &lt;linux/writeback.h&gt;</div><div class='add'>+#include &lt;linux/fs_context.h&gt;</div><div class='ctx'> </div><div class='ctx'> static int minix_write_inode(struct inode *inode,</div><div class='ctx'> 		struct writeback_control *wbc);</div><div class='ctx'> static int minix_statfs(struct dentry *dentry, struct kstatfs *buf);</div><div class='del'>-static int minix_remount (struct super_block * sb, int * flags, char * data);</div><div class='add'>+</div><div class='add'>+void __minix_error_inode(struct inode *inode, const char *function,</div><div class='add'>+			 unsigned int line, const char *fmt, ...)</div><div class='add'>+{</div><div class='add'>+	struct va_format vaf;</div><div class='add'>+	va_list args;</div><div class='add'>+</div><div class='add'>+	va_start(args, fmt);</div><div class='add'>+	vaf.fmt = fmt;</div><div class='add'>+	vaf.va = &amp;args;</div><div class='add'>+	printk(KERN_CRIT "minix-fs error (device %s): %s:%d: "</div><div class='add'>+	       "inode #%lu: comm %s: %pV\n",</div><div class='add'>+	       inode-&gt;i_sb-&gt;s_id, function, line, inode-&gt;i_ino,</div><div class='add'>+	       current-&gt;comm, &amp;vaf);</div><div class='add'>+	va_end(args);</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> static void minix_evict_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='hunk'>@@ -63,7 +80,7 @@ static struct kmem_cache * minix_inode_cachep;</div><div class='ctx'> static struct inode *minix_alloc_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct minix_inode_info *ei;</div><div class='del'>-	ei = kmem_cache_alloc(minix_inode_cachep, GFP_KERNEL);</div><div class='add'>+	ei = alloc_inode_sb(sb, minix_inode_cachep, GFP_KERNEL);</div><div class='ctx'> 	if (!ei)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	return &amp;ei-&gt;vfs_inode;</div><div class='hunk'>@@ -86,7 +103,7 @@ static int __init init_inodecache(void)</div><div class='ctx'> 	minix_inode_cachep = kmem_cache_create("minix_inode_cache",</div><div class='ctx'> 					     sizeof(struct minix_inode_info),</div><div class='ctx'> 					     0, (SLAB_RECLAIM_ACCOUNT|</div><div class='del'>-						SLAB_MEM_SPREAD|SLAB_ACCOUNT),</div><div class='add'>+						SLAB_ACCOUNT),</div><div class='ctx'> 					     init_once);</div><div class='ctx'> 	if (minix_inode_cachep == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='hunk'>@@ -110,19 +127,19 @@ static const struct super_operations minix_sops = {</div><div class='ctx'> 	.evict_inode	= minix_evict_inode,</div><div class='ctx'> 	.put_super	= minix_put_super,</div><div class='ctx'> 	.statfs		= minix_statfs,</div><div class='del'>-	.remount_fs	= minix_remount,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int minix_remount (struct super_block * sb, int * flags, char * data)</div><div class='add'>+static int minix_reconfigure(struct fs_context *fc)</div><div class='ctx'> {</div><div class='del'>-	struct minix_sb_info * sbi = minix_sb(sb);</div><div class='ctx'> 	struct minix_super_block * ms;</div><div class='add'>+	struct super_block *sb = fc-&gt;root-&gt;d_sb;</div><div class='add'>+	struct minix_sb_info * sbi = sb-&gt;s_fs_info;</div><div class='ctx'> </div><div class='ctx'> 	sync_filesystem(sb);</div><div class='ctx'> 	ms = sbi-&gt;s_ms;</div><div class='del'>-	if ((bool)(*flags &amp; SB_RDONLY) == sb_rdonly(sb))</div><div class='add'>+	if ((bool)(fc-&gt;sb_flags &amp; SB_RDONLY) == sb_rdonly(sb))</div><div class='ctx'> 		return 0;</div><div class='del'>-	if (*flags &amp; SB_RDONLY) {</div><div class='add'>+	if (fc-&gt;sb_flags &amp; SB_RDONLY) {</div><div class='ctx'> 		if (ms-&gt;s_state &amp; MINIX_VALID_FS ||</div><div class='ctx'> 		    !(sbi-&gt;s_mount_state &amp; MINIX_VALID_FS))</div><div class='ctx'> 			return 0;</div><div class='hunk'>@@ -169,7 +186,7 @@ static bool minix_check_superblock(struct super_block *sb)</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int minix_fill_super(struct super_block *s, void *data, int silent)</div><div class='add'>+static int minix_fill_super(struct super_block *s, struct fs_context *fc)</div><div class='ctx'> {</div><div class='ctx'> 	struct buffer_head *bh;</div><div class='ctx'> 	struct buffer_head **map;</div><div class='hunk'>@@ -179,6 +196,7 @@ static int minix_fill_super(struct super_block *s, void *data, int silent)</div><div class='ctx'> 	struct inode *root_inode;</div><div class='ctx'> 	struct minix_sb_info *sbi;</div><div class='ctx'> 	int ret = -EINVAL;</div><div class='add'>+	int silent = fc-&gt;sb_flags &amp; SB_SILENT;</div><div class='ctx'> </div><div class='ctx'> 	sbi = kzalloc(sizeof(struct minix_sb_info), GFP_KERNEL);</div><div class='ctx'> 	if (!sbi)</div><div class='hunk'>@@ -370,6 +388,23 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int minix_get_tree(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	 return get_tree_bdev(fc, minix_fill_super);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct fs_context_operations minix_context_ops = {</div><div class='add'>+	.get_tree	= minix_get_tree,</div><div class='add'>+	.reconfigure	= minix_reconfigure,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int minix_init_fs_context(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	fc-&gt;ops = &amp;minix_context_ops;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int minix_statfs(struct dentry *dentry, struct kstatfs *buf)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = dentry-&gt;d_sb;</div><div class='hunk'>@@ -397,19 +432,20 @@ static int minix_get_block(struct inode *inode, sector_t block,</div><div class='ctx'> 		return V2_minix_get_block(inode, block, bh_result, create);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int minix_writepage(struct page *page, struct writeback_control *wbc)</div><div class='add'>+static int minix_writepages(struct address_space *mapping,</div><div class='add'>+		struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='del'>-	return block_write_full_page(page, minix_get_block, wbc);</div><div class='add'>+	return mpage_writepages(mapping, wbc, minix_get_block);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int minix_readpage(struct file *file, struct page *page)</div><div class='add'>+static int minix_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	return block_read_full_page(page,minix_get_block);</div><div class='add'>+	return block_read_full_folio(folio, minix_get_block);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int minix_prepare_chunk(struct page *page, loff_t pos, unsigned len)</div><div class='add'>+int minix_prepare_chunk(struct folio *folio, loff_t pos, unsigned len)</div><div class='ctx'> {</div><div class='del'>-	return __block_write_begin(page, pos, len, minix_get_block);</div><div class='add'>+	return __block_write_begin(folio, pos, len, minix_get_block);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void minix_write_failed(struct address_space *mapping, loff_t to)</div><div class='hunk'>@@ -422,14 +458,14 @@ static void minix_write_failed(struct address_space *mapping, loff_t to)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int minix_write_begin(struct file *file, struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned flags,</div><div class='del'>-			struct page **pagep, void **fsdata)</div><div class='add'>+static int minix_write_begin(const struct kiocb *iocb,</div><div class='add'>+			     struct address_space *mapping,</div><div class='add'>+			     loff_t pos, unsigned len,</div><div class='add'>+			     struct folio **foliop, void **fsdata)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	ret = block_write_begin(mapping, pos, len, flags, pagep,</div><div class='del'>-				minix_get_block);</div><div class='add'>+	ret = block_write_begin(mapping, pos, len, foliop, minix_get_block);</div><div class='ctx'> 	if (unlikely(ret))</div><div class='ctx'> 		minix_write_failed(mapping, pos + len);</div><div class='ctx'> </div><div class='hunk'>@@ -442,12 +478,15 @@ static sector_t minix_bmap(struct address_space *mapping, sector_t block)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct address_space_operations minix_aops = {</div><div class='del'>-	.set_page_dirty	= __set_page_dirty_buffers,</div><div class='del'>-	.readpage = minix_readpage,</div><div class='del'>-	.writepage = minix_writepage,</div><div class='add'>+	.dirty_folio	= block_dirty_folio,</div><div class='add'>+	.invalidate_folio = block_invalidate_folio,</div><div class='add'>+	.read_folio = minix_read_folio,</div><div class='add'>+	.writepages = minix_writepages,</div><div class='ctx'> 	.write_begin = minix_write_begin,</div><div class='ctx'> 	.write_end = generic_write_end,</div><div class='del'>-	.bmap = minix_bmap</div><div class='add'>+	.migrate_folio = buffer_migrate_folio,</div><div class='add'>+	.bmap = minix_bmap,</div><div class='add'>+	.direct_IO = noop_direct_IO</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct inode_operations minix_symlink_inode_operations = {</div><div class='hunk'>@@ -469,8 +508,14 @@ void minix_set_inode(struct inode *inode, dev_t rdev)</div><div class='ctx'> 		inode-&gt;i_op = &amp;minix_symlink_inode_operations;</div><div class='ctx'> 		inode_nohighmem(inode);</div><div class='ctx'> 		inode-&gt;i_mapping-&gt;a_ops = &amp;minix_aops;</div><div class='del'>-	} else</div><div class='add'>+	} else if (S_ISCHR(inode-&gt;i_mode) || S_ISBLK(inode-&gt;i_mode) ||</div><div class='add'>+		   S_ISFIFO(inode-&gt;i_mode) || S_ISSOCK(inode-&gt;i_mode)) {</div><div class='ctx'> 		init_special_inode(inode, inode-&gt;i_mode, rdev);</div><div class='add'>+	} else {</div><div class='add'>+		printk(KERN_DEBUG "MINIX-fs: Invalid file type 0%04o for inode %lu.\n",</div><div class='add'>+		       inode-&gt;i_mode, inode-&gt;i_ino);</div><div class='add'>+		make_bad_inode(inode);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -500,10 +545,8 @@ static struct inode *V1_minix_iget(struct inode *inode)</div><div class='ctx'> 	i_gid_write(inode, raw_inode-&gt;i_gid);</div><div class='ctx'> 	set_nlink(inode, raw_inode-&gt;i_nlinks);</div><div class='ctx'> 	inode-&gt;i_size = raw_inode-&gt;i_size;</div><div class='del'>-	inode-&gt;i_mtime.tv_sec = inode-&gt;i_atime.tv_sec = inode-&gt;i_ctime.tv_sec = raw_inode-&gt;i_time;</div><div class='del'>-	inode-&gt;i_mtime.tv_nsec = 0;</div><div class='del'>-	inode-&gt;i_atime.tv_nsec = 0;</div><div class='del'>-	inode-&gt;i_ctime.tv_nsec = 0;</div><div class='add'>+	inode_set_mtime_to_ts(inode,</div><div class='add'>+			      inode_set_atime_to_ts(inode, inode_set_ctime(inode, raw_inode-&gt;i_time, 0)));</div><div class='ctx'> 	inode-&gt;i_blocks = 0;</div><div class='ctx'> 	for (i = 0; i &lt; 9; i++)</div><div class='ctx'> 		minix_inode-&gt;u.i1_data[i] = raw_inode-&gt;i_zone[i];</div><div class='hunk'>@@ -540,12 +583,9 @@ static struct inode *V2_minix_iget(struct inode *inode)</div><div class='ctx'> 	i_gid_write(inode, raw_inode-&gt;i_gid);</div><div class='ctx'> 	set_nlink(inode, raw_inode-&gt;i_nlinks);</div><div class='ctx'> 	inode-&gt;i_size = raw_inode-&gt;i_size;</div><div class='del'>-	inode-&gt;i_mtime.tv_sec = raw_inode-&gt;i_mtime;</div><div class='del'>-	inode-&gt;i_atime.tv_sec = raw_inode-&gt;i_atime;</div><div class='del'>-	inode-&gt;i_ctime.tv_sec = raw_inode-&gt;i_ctime;</div><div class='del'>-	inode-&gt;i_mtime.tv_nsec = 0;</div><div class='del'>-	inode-&gt;i_atime.tv_nsec = 0;</div><div class='del'>-	inode-&gt;i_ctime.tv_nsec = 0;</div><div class='add'>+	inode_set_mtime(inode, raw_inode-&gt;i_mtime, 0);</div><div class='add'>+	inode_set_atime(inode, raw_inode-&gt;i_atime, 0);</div><div class='add'>+	inode_set_ctime(inode, raw_inode-&gt;i_ctime, 0);</div><div class='ctx'> 	inode-&gt;i_blocks = 0;</div><div class='ctx'> 	for (i = 0; i &lt; 10; i++)</div><div class='ctx'> 		minix_inode-&gt;u.i2_data[i] = raw_inode-&gt;i_zone[i];</div><div class='hunk'>@@ -565,7 +605,7 @@ struct inode *minix_iget(struct super_block *sb, unsigned long ino)</div><div class='ctx'> 	inode = iget_locked(sb, ino);</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='del'>-	if (!(inode-&gt;i_state &amp; I_NEW))</div><div class='add'>+	if (!(inode_state_read_once(inode) &amp; I_NEW))</div><div class='ctx'> 		return inode;</div><div class='ctx'> </div><div class='ctx'> 	if (INODE_VERSION(inode) == MINIX_V1)</div><div class='hunk'>@@ -592,7 +632,7 @@ static struct buffer_head * V1_minix_update_inode(struct inode * inode)</div><div class='ctx'> 	raw_inode-&gt;i_gid = fs_high2lowgid(i_gid_read(inode));</div><div class='ctx'> 	raw_inode-&gt;i_nlinks = inode-&gt;i_nlink;</div><div class='ctx'> 	raw_inode-&gt;i_size = inode-&gt;i_size;</div><div class='del'>-	raw_inode-&gt;i_time = inode-&gt;i_mtime.tv_sec;</div><div class='add'>+	raw_inode-&gt;i_time = inode_get_mtime_sec(inode);</div><div class='ctx'> 	if (S_ISCHR(inode-&gt;i_mode) || S_ISBLK(inode-&gt;i_mode))</div><div class='ctx'> 		raw_inode-&gt;i_zone[0] = old_encode_dev(inode-&gt;i_rdev);</div><div class='ctx'> 	else for (i = 0; i &lt; 9; i++)</div><div class='hunk'>@@ -619,9 +659,9 @@ static struct buffer_head * V2_minix_update_inode(struct inode * inode)</div><div class='ctx'> 	raw_inode-&gt;i_gid = fs_high2lowgid(i_gid_read(inode));</div><div class='ctx'> 	raw_inode-&gt;i_nlinks = inode-&gt;i_nlink;</div><div class='ctx'> 	raw_inode-&gt;i_size = inode-&gt;i_size;</div><div class='del'>-	raw_inode-&gt;i_mtime = inode-&gt;i_mtime.tv_sec;</div><div class='del'>-	raw_inode-&gt;i_atime = inode-&gt;i_atime.tv_sec;</div><div class='del'>-	raw_inode-&gt;i_ctime = inode-&gt;i_ctime.tv_sec;</div><div class='add'>+	raw_inode-&gt;i_mtime = inode_get_mtime_sec(inode);</div><div class='add'>+	raw_inode-&gt;i_atime = inode_get_atime_sec(inode);</div><div class='add'>+	raw_inode-&gt;i_ctime = inode_get_ctime_sec(inode);</div><div class='ctx'> 	if (S_ISCHR(inode-&gt;i_mode) || S_ISBLK(inode-&gt;i_mode))</div><div class='ctx'> 		raw_inode-&gt;i_zone[0] = old_encode_dev(inode-&gt;i_rdev);</div><div class='ctx'> 	else for (i = 0; i &lt; 10; i++)</div><div class='hunk'>@@ -653,13 +693,13 @@ static int minix_write_inode(struct inode *inode, struct writeback_control *wbc)</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int minix_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='add'>+int minix_getattr(struct mnt_idmap *idmap, const struct path *path,</div><div class='ctx'> 		  struct kstat *stat, u32 request_mask, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = path-&gt;dentry-&gt;d_sb;</div><div class='ctx'> 	struct inode *inode = d_inode(path-&gt;dentry);</div><div class='ctx'> </div><div class='del'>-	generic_fillattr(&amp;init_user_ns, inode, stat);</div><div class='add'>+	generic_fillattr(&amp;nop_mnt_idmap, request_mask, inode, stat);</div><div class='ctx'> 	if (INODE_VERSION(inode) == MINIX_V1)</div><div class='ctx'> 		stat-&gt;blocks = (BLOCK_SIZE / 512) * V1_minix_blocks(stat-&gt;size, sb);</div><div class='ctx'> 	else</div><div class='hunk'>@@ -681,18 +721,12 @@ void minix_truncate(struct inode * inode)</div><div class='ctx'> 		V2_minix_truncate(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct dentry *minix_mount(struct file_system_type *fs_type,</div><div class='del'>-	int flags, const char *dev_name, void *data)</div><div class='del'>-{</div><div class='del'>-	return mount_bdev(fs_type, flags, dev_name, data, minix_fill_super);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static struct file_system_type minix_fs_type = {</div><div class='del'>-	.owner		= THIS_MODULE,</div><div class='del'>-	.name		= "minix",</div><div class='del'>-	.mount		= minix_mount,</div><div class='del'>-	.kill_sb	= kill_block_super,</div><div class='del'>-	.fs_flags	= FS_REQUIRES_DEV,</div><div class='add'>+	.owner			= THIS_MODULE,</div><div class='add'>+	.name			= "minix",</div><div class='add'>+	.kill_sb		= kill_block_super,</div><div class='add'>+	.fs_flags		= FS_REQUIRES_DEV,</div><div class='add'>+	.init_fs_context	= minix_init_fs_context,</div><div class='ctx'> };</div><div class='ctx'> MODULE_ALIAS_FS("minix");</div><div class='ctx'> </div><div class='hunk'>@@ -719,5 +753,6 @@ static void __exit exit_minix_fs(void)</div><div class='ctx'> </div><div class='ctx'> module_init(init_minix_fs)</div><div class='ctx'> module_exit(exit_minix_fs)</div><div class='add'>+MODULE_DESCRIPTION("Minix file system");</div><div class='ctx'> MODULE_LICENSE("GPL");</div><div class='ctx'> </div><div class='head'>diff --git a/fs/minix/itree_common.c b/fs/minix/itree_common.c<br/>index 446148792f41..dad131e30c05 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/minix/itree_common.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/minix/itree_common.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/minix/itree_common.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/minix/itree_common.c</a></div><div class='hunk'>@@ -131,7 +131,7 @@ static inline int splice_branch(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 	/* We are done with atomic stuff, now do the rest of housekeeping */</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> </div><div class='ctx'> 	/* had we spliced it onto indirect block? */</div><div class='ctx'> 	if (where-&gt;bh)</div><div class='hunk'>@@ -350,7 +350,7 @@ do_indirects:</div><div class='ctx'> 		}</div><div class='ctx'> 		first_whole++;</div><div class='ctx'> 	}</div><div class='del'>-	inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_mtime_to_ts(inode, inode_set_ctime_current(inode));</div><div class='ctx'> 	mark_inode_dirty(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/minix/minix.h b/fs/minix/minix.h<br/>index 202173368025..2bfaf377f208 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/minix/minix.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/minix/minix.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/minix/minix.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/minix/minix.h</a></div><div class='hunk'>@@ -42,18 +42,21 @@ struct minix_sb_info {</div><div class='ctx'> 	unsigned short s_version;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-extern struct inode *minix_iget(struct super_block *, unsigned long);</div><div class='del'>-extern struct minix_inode * minix_V1_raw_inode(struct super_block *, ino_t, struct buffer_head **);</div><div class='del'>-extern struct minix2_inode * minix_V2_raw_inode(struct super_block *, ino_t, struct buffer_head **);</div><div class='del'>-extern struct inode * minix_new_inode(const struct inode *, umode_t, int *);</div><div class='del'>-extern void minix_free_inode(struct inode * inode);</div><div class='del'>-extern unsigned long minix_count_free_inodes(struct super_block *sb);</div><div class='del'>-extern int minix_new_block(struct inode * inode);</div><div class='del'>-extern void minix_free_block(struct inode *inode, unsigned long block);</div><div class='del'>-extern unsigned long minix_count_free_blocks(struct super_block *sb);</div><div class='del'>-extern int minix_getattr(struct user_namespace *, const struct path *,</div><div class='del'>-			 struct kstat *, u32, unsigned int);</div><div class='del'>-extern int minix_prepare_chunk(struct page *page, loff_t pos, unsigned len);</div><div class='add'>+void __minix_error_inode(struct inode *inode, const char *function,</div><div class='add'>+			 unsigned int line, const char *fmt, ...);</div><div class='add'>+</div><div class='add'>+struct inode *minix_iget(struct super_block *, unsigned long);</div><div class='add'>+struct minix_inode *minix_V1_raw_inode(struct super_block *, ino_t, struct buffer_head **);</div><div class='add'>+struct minix2_inode *minix_V2_raw_inode(struct super_block *, ino_t, struct buffer_head **);</div><div class='add'>+struct inode *minix_new_inode(const struct inode *, umode_t);</div><div class='add'>+void minix_free_inode(struct inode *inode);</div><div class='add'>+unsigned long minix_count_free_inodes(struct super_block *sb);</div><div class='add'>+int minix_new_block(struct inode *inode);</div><div class='add'>+void minix_free_block(struct inode *inode, unsigned long block);</div><div class='add'>+unsigned long minix_count_free_blocks(struct super_block *sb);</div><div class='add'>+int minix_getattr(struct mnt_idmap *, const struct path *,</div><div class='add'>+		struct kstat *, u32, unsigned int);</div><div class='add'>+int minix_prepare_chunk(struct folio *folio, loff_t pos, unsigned len);</div><div class='ctx'> </div><div class='ctx'> extern void V1_minix_truncate(struct inode *);</div><div class='ctx'> extern void V2_minix_truncate(struct inode *);</div><div class='hunk'>@@ -64,14 +67,15 @@ extern int V2_minix_get_block(struct inode *, long, struct buffer_head *, int);</div><div class='ctx'> extern unsigned V1_minix_blocks(loff_t, struct super_block *);</div><div class='ctx'> extern unsigned V2_minix_blocks(loff_t, struct super_block *);</div><div class='ctx'> </div><div class='del'>-extern struct minix_dir_entry *minix_find_entry(struct dentry*, struct page**);</div><div class='del'>-extern int minix_add_link(struct dentry*, struct inode*);</div><div class='del'>-extern int minix_delete_entry(struct minix_dir_entry*, struct page*);</div><div class='del'>-extern int minix_make_empty(struct inode*, struct inode*);</div><div class='del'>-extern int minix_empty_dir(struct inode*);</div><div class='del'>-extern void minix_set_link(struct minix_dir_entry*, struct page*, struct inode*);</div><div class='del'>-extern struct minix_dir_entry *minix_dotdot(struct inode*, struct page**);</div><div class='del'>-extern ino_t minix_inode_by_name(struct dentry*);</div><div class='add'>+struct minix_dir_entry *minix_find_entry(struct dentry *, struct folio **);</div><div class='add'>+int minix_add_link(struct dentry*, struct inode*);</div><div class='add'>+int minix_delete_entry(struct minix_dir_entry *, struct folio *);</div><div class='add'>+int minix_make_empty(struct inode*, struct inode*);</div><div class='add'>+int minix_empty_dir(struct inode*);</div><div class='add'>+int minix_set_link(struct minix_dir_entry *de, struct folio *folio,</div><div class='add'>+		struct inode *inode);</div><div class='add'>+struct minix_dir_entry *minix_dotdot(struct inode*, struct folio **);</div><div class='add'>+ino_t minix_inode_by_name(struct dentry*);</div><div class='ctx'> </div><div class='ctx'> extern const struct inode_operations minix_file_inode_operations;</div><div class='ctx'> extern const struct inode_operations minix_dir_inode_operations;</div><div class='hunk'>@@ -167,4 +171,10 @@ static inline int minix_test_bit(int nr, const void *vaddr)</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='add'>+#define minix_error_inode(inode, fmt, ...)			\</div><div class='add'>+	__minix_error_inode((inode), __func__, __LINE__,	\</div><div class='add'>+			    (fmt), ##__VA_ARGS__)</div><div class='add'>+</div><div class='add'>+#define EFSCORRUPTED	EUCLEAN		/* Filesystem is corrupted */</div><div class='add'>+</div><div class='ctx'> #endif /* FS_MINIX_H */</div><div class='head'>diff --git a/fs/minix/namei.c b/fs/minix/namei.c<br/>index 937fa5fae2b8..263e4ba8b1c8 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/minix/namei.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/minix/namei.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/minix/namei.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/minix/namei.c</a></div><div class='hunk'>@@ -33,71 +33,64 @@ static struct dentry *minix_lookup(struct inode * dir, struct dentry *dentry, un</div><div class='ctx'> 	return d_splice_alias(inode, dentry);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int minix_mknod(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int minix_mknod(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		       struct dentry *dentry, umode_t mode, dev_t rdev)</div><div class='ctx'> {</div><div class='del'>-	int error;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> </div><div class='ctx'> 	if (!old_valid_dev(rdev))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	inode = minix_new_inode(dir, mode, &amp;error);</div><div class='add'>+	inode = minix_new_inode(dir, mode);</div><div class='add'>+	if (IS_ERR(inode))</div><div class='add'>+		return PTR_ERR(inode);</div><div class='ctx'> </div><div class='del'>-	if (inode) {</div><div class='del'>-		minix_set_inode(inode, rdev);</div><div class='del'>-		mark_inode_dirty(inode);</div><div class='del'>-		error = add_nondir(dentry, inode);</div><div class='del'>-	}</div><div class='del'>-	return error;</div><div class='add'>+	minix_set_inode(inode, rdev);</div><div class='add'>+	mark_inode_dirty(inode);</div><div class='add'>+	return add_nondir(dentry, inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int minix_tmpfile(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-			 struct dentry *dentry, umode_t mode)</div><div class='add'>+static int minix_tmpfile(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+			 struct file *file, umode_t mode)</div><div class='ctx'> {</div><div class='del'>-	int error;</div><div class='del'>-	struct inode *inode = minix_new_inode(dir, mode, &amp;error);</div><div class='del'>-	if (inode) {</div><div class='del'>-		minix_set_inode(inode, 0);</div><div class='del'>-		mark_inode_dirty(inode);</div><div class='del'>-		d_tmpfile(dentry, inode);</div><div class='del'>-	}</div><div class='del'>-	return error;</div><div class='add'>+	struct inode *inode = minix_new_inode(dir, mode);</div><div class='add'>+</div><div class='add'>+	if (IS_ERR(inode))</div><div class='add'>+		return finish_open_simple(file, PTR_ERR(inode));</div><div class='add'>+	minix_set_inode(inode, 0);</div><div class='add'>+	mark_inode_dirty(inode);</div><div class='add'>+	d_tmpfile(file, inode);</div><div class='add'>+	return finish_open_simple(file, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int minix_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int minix_create(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 			struct dentry *dentry, umode_t mode, bool excl)</div><div class='ctx'> {</div><div class='del'>-	return minix_mknod(mnt_userns, dir, dentry, mode, 0);</div><div class='add'>+	return minix_mknod(&amp;nop_mnt_idmap, dir, dentry, mode, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int minix_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int minix_symlink(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 			 struct dentry *dentry, const char *symname)</div><div class='ctx'> {</div><div class='del'>-	int err = -ENAMETOOLONG;</div><div class='ctx'> 	int i = strlen(symname)+1;</div><div class='ctx'> 	struct inode * inode;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (i &gt; dir-&gt;i_sb-&gt;s_blocksize)</div><div class='del'>-		goto out;</div><div class='add'>+		return -ENAMETOOLONG;</div><div class='ctx'> </div><div class='del'>-	inode = minix_new_inode(dir, S_IFLNK | 0777, &amp;err);</div><div class='del'>-	if (!inode)</div><div class='del'>-		goto out;</div><div class='add'>+	inode = minix_new_inode(dir, S_IFLNK | 0777);</div><div class='add'>+	if (IS_ERR(inode))</div><div class='add'>+		return PTR_ERR(inode);</div><div class='ctx'> </div><div class='ctx'> 	minix_set_inode(inode, 0);</div><div class='ctx'> 	err = page_symlink(inode, symname, i);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out_fail;</div><div class='del'>-</div><div class='del'>-	err = add_nondir(dentry, inode);</div><div class='del'>-out:</div><div class='del'>-	return err;</div><div class='del'>-</div><div class='del'>-out_fail:</div><div class='del'>-	inode_dec_link_count(inode);</div><div class='del'>-	iput(inode);</div><div class='del'>-	goto out;</div><div class='add'>+	if (unlikely(err)) {</div><div class='add'>+		inode_dec_link_count(inode);</div><div class='add'>+		iput(inode);</div><div class='add'>+		return err;</div><div class='add'>+	}</div><div class='add'>+	return add_nondir(dentry, inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int minix_link(struct dentry * old_dentry, struct inode * dir,</div><div class='hunk'>@@ -105,26 +98,24 @@ static int minix_link(struct dentry * old_dentry, struct inode * dir,</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(old_dentry);</div><div class='ctx'> </div><div class='del'>-	inode-&gt;i_ctime = current_time(inode);</div><div class='add'>+	inode_set_ctime_current(inode);</div><div class='ctx'> 	inode_inc_link_count(inode);</div><div class='ctx'> 	ihold(inode);</div><div class='ctx'> 	return add_nondir(dentry, inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int minix_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-		       struct dentry *dentry, umode_t mode)</div><div class='add'>+static struct dentry *minix_mkdir(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+				  struct dentry *dentry, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode * inode;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	inode_inc_link_count(dir);</div><div class='del'>-</div><div class='del'>-	inode = minix_new_inode(dir, S_IFDIR | mode, &amp;err);</div><div class='del'>-	if (!inode)</div><div class='del'>-		goto out_dir;</div><div class='add'>+	inode = minix_new_inode(dir, S_IFDIR | mode);</div><div class='add'>+	if (IS_ERR(inode))</div><div class='add'>+		return ERR_CAST(inode);</div><div class='ctx'> </div><div class='add'>+	inode_inc_link_count(dir);</div><div class='ctx'> 	minix_set_inode(inode, 0);</div><div class='del'>-</div><div class='ctx'> 	inode_inc_link_count(inode);</div><div class='ctx'> </div><div class='ctx'> 	err = minix_make_empty(inode, dir);</div><div class='hunk'>@@ -137,94 +128,120 @@ static int minix_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> </div><div class='ctx'> 	d_instantiate(dentry, inode);</div><div class='ctx'> out:</div><div class='del'>-	return err;</div><div class='add'>+	return ERR_PTR(err);</div><div class='ctx'> </div><div class='ctx'> out_fail:</div><div class='ctx'> 	inode_dec_link_count(inode);</div><div class='ctx'> 	inode_dec_link_count(inode);</div><div class='ctx'> 	iput(inode);</div><div class='del'>-out_dir:</div><div class='ctx'> 	inode_dec_link_count(dir);</div><div class='ctx'> 	goto out;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int minix_unlink(struct inode * dir, struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	int err = -ENOENT;</div><div class='ctx'> 	struct inode * inode = d_inode(dentry);</div><div class='del'>-	struct page * page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	struct minix_dir_entry * de;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='del'>-	de = minix_find_entry(dentry, &amp;page);</div><div class='add'>+	if (inode-&gt;i_nlink == 0) {</div><div class='add'>+		minix_error_inode(inode, "inode has corrupted nlink");</div><div class='add'>+		return -EFSCORRUPTED;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	de = minix_find_entry(dentry, &amp;folio);</div><div class='ctx'> 	if (!de)</div><div class='del'>-		goto end_unlink;</div><div class='add'>+		return -ENOENT;</div><div class='add'>+	err = minix_delete_entry(de, folio);</div><div class='add'>+	folio_release_kmap(folio, de);</div><div class='ctx'> </div><div class='del'>-	err = minix_delete_entry(de, page);</div><div class='ctx'> 	if (err)</div><div class='del'>-		goto end_unlink;</div><div class='del'>-</div><div class='del'>-	inode-&gt;i_ctime = dir-&gt;i_ctime;</div><div class='add'>+		return err;</div><div class='add'>+	inode_set_ctime_to_ts(inode, inode_get_ctime(dir));</div><div class='ctx'> 	inode_dec_link_count(inode);</div><div class='del'>-end_unlink:</div><div class='del'>-	return err;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int minix_rmdir(struct inode * dir, struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode * inode = d_inode(dentry);</div><div class='del'>-	int err = -ENOTEMPTY;</div><div class='add'>+	int err = -EFSCORRUPTED;</div><div class='ctx'> </div><div class='del'>-	if (minix_empty_dir(inode)) {</div><div class='del'>-		err = minix_unlink(dir, dentry);</div><div class='del'>-		if (!err) {</div><div class='del'>-			inode_dec_link_count(dir);</div><div class='del'>-			inode_dec_link_count(inode);</div><div class='del'>-		}</div><div class='add'>+	if (dir-&gt;i_nlink &lt;= 2) {</div><div class='add'>+		minix_error_inode(dir, "inode has corrupted nlink");</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	err = -ENOTEMPTY;</div><div class='add'>+	if (!minix_empty_dir(inode))</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	err = minix_unlink(dir, dentry);</div><div class='add'>+	if (!err) {</div><div class='add'>+		inode_dec_link_count(dir);</div><div class='add'>+		inode_dec_link_count(inode);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+out:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int minix_rename(struct user_namespace *mnt_userns,</div><div class='add'>+static int minix_rename(struct mnt_idmap *idmap,</div><div class='ctx'> 			struct inode *old_dir, struct dentry *old_dentry,</div><div class='ctx'> 			struct inode *new_dir, struct dentry *new_dentry,</div><div class='ctx'> 			unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode * old_inode = d_inode(old_dentry);</div><div class='ctx'> 	struct inode * new_inode = d_inode(new_dentry);</div><div class='del'>-	struct page * dir_page = NULL;</div><div class='add'>+	struct folio * dir_folio = NULL;</div><div class='ctx'> 	struct minix_dir_entry * dir_de = NULL;</div><div class='del'>-	struct page * old_page;</div><div class='add'>+	struct folio *old_folio;</div><div class='ctx'> 	struct minix_dir_entry * old_de;</div><div class='ctx'> 	int err = -ENOENT;</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; ~RENAME_NOREPLACE)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	old_de = minix_find_entry(old_dentry, &amp;old_page);</div><div class='add'>+	old_de = minix_find_entry(old_dentry, &amp;old_folio);</div><div class='ctx'> 	if (!old_de)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	if (S_ISDIR(old_inode-&gt;i_mode)) {</div><div class='ctx'> 		err = -EIO;</div><div class='del'>-		dir_de = minix_dotdot(old_inode, &amp;dir_page);</div><div class='add'>+		dir_de = minix_dotdot(old_inode, &amp;dir_folio);</div><div class='ctx'> 		if (!dir_de)</div><div class='ctx'> 			goto out_old;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (new_inode) {</div><div class='del'>-		struct page * new_page;</div><div class='add'>+		struct folio *new_folio;</div><div class='ctx'> 		struct minix_dir_entry * new_de;</div><div class='ctx'> </div><div class='ctx'> 		err = -ENOTEMPTY;</div><div class='ctx'> 		if (dir_de &amp;&amp; !minix_empty_dir(new_inode))</div><div class='ctx'> 			goto out_dir;</div><div class='ctx'> </div><div class='add'>+		err = -EFSCORRUPTED;</div><div class='add'>+		if (new_inode-&gt;i_nlink == 0 || (dir_de &amp;&amp; new_inode-&gt;i_nlink != 2)) {</div><div class='add'>+			minix_error_inode(new_inode, "inode has corrupted nlink");</div><div class='add'>+			goto out_dir;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (dir_de &amp;&amp; old_dir-&gt;i_nlink &lt;= 2) {</div><div class='add'>+			minix_error_inode(old_dir, "inode has corrupted nlink");</div><div class='add'>+			goto out_dir;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		err = -ENOENT;</div><div class='del'>-		new_de = minix_find_entry(new_dentry, &amp;new_page);</div><div class='add'>+		new_de = minix_find_entry(new_dentry, &amp;new_folio);</div><div class='ctx'> 		if (!new_de)</div><div class='ctx'> 			goto out_dir;</div><div class='del'>-		minix_set_link(new_de, new_page, old_inode);</div><div class='del'>-		new_inode-&gt;i_ctime = current_time(new_inode);</div><div class='add'>+		err = minix_set_link(new_de, new_folio, old_inode);</div><div class='add'>+		folio_release_kmap(new_folio, new_de);</div><div class='add'>+		if (err)</div><div class='add'>+			goto out_dir;</div><div class='add'>+		inode_set_ctime_current(new_inode);</div><div class='ctx'> 		if (dir_de)</div><div class='ctx'> 			drop_nlink(new_inode);</div><div class='ctx'> 		inode_dec_link_count(new_inode);</div><div class='hunk'>@@ -236,23 +253,22 @@ static int minix_rename(struct user_namespace *mnt_userns,</div><div class='ctx'> 			inode_inc_link_count(new_dir);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	minix_delete_entry(old_de, old_page);</div><div class='add'>+	err = minix_delete_entry(old_de, old_folio);</div><div class='add'>+	if (err)</div><div class='add'>+		goto out_dir;</div><div class='add'>+</div><div class='ctx'> 	mark_inode_dirty(old_inode);</div><div class='ctx'> </div><div class='ctx'> 	if (dir_de) {</div><div class='del'>-		minix_set_link(dir_de, dir_page, new_dir);</div><div class='del'>-		inode_dec_link_count(old_dir);</div><div class='add'>+		err = minix_set_link(dir_de, dir_folio, new_dir);</div><div class='add'>+		if (!err)</div><div class='add'>+			inode_dec_link_count(old_dir);</div><div class='ctx'> 	}</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='ctx'> out_dir:</div><div class='del'>-	if (dir_de) {</div><div class='del'>-		kunmap(dir_page);</div><div class='del'>-		put_page(dir_page);</div><div class='del'>-	}</div><div class='add'>+	if (dir_de)</div><div class='add'>+		folio_release_kmap(dir_folio, dir_de);</div><div class='ctx'> out_old:</div><div class='del'>-	kunmap(old_page);</div><div class='del'>-	put_page(old_page);</div><div class='add'>+	folio_release_kmap(old_folio, old_de);</div><div class='ctx'> out:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/mnt_idmapping.c b/fs/mnt_idmapping.c<br/>new file mode 100644<br/>index 000000000000..a37991fdb194<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/mnt_idmapping.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/mnt_idmapping.c</a></div><div class='hunk'>@@ -0,0 +1,387 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+/* Copyright (c) 2022 Christian Brauner &lt;brauner@kernel.org&gt; */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/cred.h&gt;</div><div class='add'>+#include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/mnt_idmapping.h&gt;</div><div class='add'>+#include &lt;linux/slab.h&gt;</div><div class='add'>+#include &lt;linux/user_namespace.h&gt;</div><div class='add'>+#include &lt;linux/seq_file.h&gt;</div><div class='add'>+</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Outside of this file vfs{g,u}id_t are always created from k{g,u}id_t,</div><div class='add'>+ * never from raw values. These are just internal helpers.</div><div class='add'>+ */</div><div class='add'>+#define VFSUIDT_INIT_RAW(val) (vfsuid_t){ val }</div><div class='add'>+#define VFSGIDT_INIT_RAW(val) (vfsgid_t){ val }</div><div class='add'>+</div><div class='add'>+struct mnt_idmap {</div><div class='add'>+	struct uid_gid_map uid_map;</div><div class='add'>+	struct uid_gid_map gid_map;</div><div class='add'>+	refcount_t count;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Carries the initial idmapping of 0:0:4294967295 which is an identity</div><div class='add'>+ * mapping. This means that {g,u}id 0 is mapped to {g,u}id 0, {g,u}id 1 is</div><div class='add'>+ * mapped to {g,u}id 1, [...], {g,u}id 1000 to {g,u}id 1000, [...].</div><div class='add'>+ */</div><div class='add'>+struct mnt_idmap nop_mnt_idmap = {</div><div class='add'>+	.count	= REFCOUNT_INIT(1),</div><div class='add'>+};</div><div class='add'>+EXPORT_SYMBOL_GPL(nop_mnt_idmap);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Carries the invalid idmapping of a full 0-4294967295 {g,u}id range.</div><div class='add'>+ * This means that all {g,u}ids are mapped to INVALID_VFS{G,U}ID.</div><div class='add'>+ */</div><div class='add'>+struct mnt_idmap invalid_mnt_idmap = {</div><div class='add'>+	.count	= REFCOUNT_INIT(1),</div><div class='add'>+};</div><div class='add'>+EXPORT_SYMBOL_GPL(invalid_mnt_idmap);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * initial_idmapping - check whether this is the initial mapping</div><div class='add'>+ * @ns: idmapping to check</div><div class='add'>+ *</div><div class='add'>+ * Check whether this is the initial mapping, mapping 0 to 0, 1 to 1,</div><div class='add'>+ * [...], 1000 to 1000 [...].</div><div class='add'>+ *</div><div class='add'>+ * Return: true if this is the initial mapping, false if not.</div><div class='add'>+ */</div><div class='add'>+static inline bool initial_idmapping(const struct user_namespace *ns)</div><div class='add'>+{</div><div class='add'>+	return ns == &amp;init_user_ns;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * make_vfsuid - map a filesystem kuid according to an idmapping</div><div class='add'>+ * @idmap: the mount's idmapping</div><div class='add'>+ * @fs_userns: the filesystem's idmapping</div><div class='add'>+ * @kuid : kuid to be mapped</div><div class='add'>+ *</div><div class='add'>+ * Take a @kuid and remap it from @fs_userns into @idmap. Use this</div><div class='add'>+ * function when preparing a @kuid to be reported to userspace.</div><div class='add'>+ *</div><div class='add'>+ * If initial_idmapping() determines that this is not an idmapped mount</div><div class='add'>+ * we can simply return @kuid unchanged.</div><div class='add'>+ * If initial_idmapping() tells us that the filesystem is not mounted with an</div><div class='add'>+ * idmapping we know the value of @kuid won't change when calling</div><div class='add'>+ * from_kuid() so we can simply retrieve the value via __kuid_val()</div><div class='add'>+ * directly.</div><div class='add'>+ *</div><div class='add'>+ * Return: @kuid mapped according to @idmap.</div><div class='add'>+ * If @kuid has no mapping in either @idmap or @fs_userns INVALID_UID is</div><div class='add'>+ * returned.</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+vfsuid_t make_vfsuid(struct mnt_idmap *idmap,</div><div class='add'>+		     struct user_namespace *fs_userns,</div><div class='add'>+		     kuid_t kuid)</div><div class='add'>+{</div><div class='add'>+	uid_t uid;</div><div class='add'>+</div><div class='add'>+	if (idmap == &amp;nop_mnt_idmap)</div><div class='add'>+		return VFSUIDT_INIT(kuid);</div><div class='add'>+	if (idmap == &amp;invalid_mnt_idmap)</div><div class='add'>+		return INVALID_VFSUID;</div><div class='add'>+	if (initial_idmapping(fs_userns))</div><div class='add'>+		uid = __kuid_val(kuid);</div><div class='add'>+	else</div><div class='add'>+		uid = from_kuid(fs_userns, kuid);</div><div class='add'>+	if (uid == (uid_t)-1)</div><div class='add'>+		return INVALID_VFSUID;</div><div class='add'>+	return VFSUIDT_INIT_RAW(map_id_down(&amp;idmap-&gt;uid_map, uid));</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(make_vfsuid);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * make_vfsgid - map a filesystem kgid according to an idmapping</div><div class='add'>+ * @idmap: the mount's idmapping</div><div class='add'>+ * @fs_userns: the filesystem's idmapping</div><div class='add'>+ * @kgid : kgid to be mapped</div><div class='add'>+ *</div><div class='add'>+ * Take a @kgid and remap it from @fs_userns into @idmap. Use this</div><div class='add'>+ * function when preparing a @kgid to be reported to userspace.</div><div class='add'>+ *</div><div class='add'>+ * If initial_idmapping() determines that this is not an idmapped mount</div><div class='add'>+ * we can simply return @kgid unchanged.</div><div class='add'>+ * If initial_idmapping() tells us that the filesystem is not mounted with an</div><div class='add'>+ * idmapping we know the value of @kgid won't change when calling</div><div class='add'>+ * from_kgid() so we can simply retrieve the value via __kgid_val()</div><div class='add'>+ * directly.</div><div class='add'>+ *</div><div class='add'>+ * Return: @kgid mapped according to @idmap.</div><div class='add'>+ * If @kgid has no mapping in either @idmap or @fs_userns INVALID_GID is</div><div class='add'>+ * returned.</div><div class='add'>+ */</div><div class='add'>+vfsgid_t make_vfsgid(struct mnt_idmap *idmap,</div><div class='add'>+		     struct user_namespace *fs_userns, kgid_t kgid)</div><div class='add'>+{</div><div class='add'>+	gid_t gid;</div><div class='add'>+</div><div class='add'>+	if (idmap == &amp;nop_mnt_idmap)</div><div class='add'>+		return VFSGIDT_INIT(kgid);</div><div class='add'>+	if (idmap == &amp;invalid_mnt_idmap)</div><div class='add'>+		return INVALID_VFSGID;</div><div class='add'>+	if (initial_idmapping(fs_userns))</div><div class='add'>+		gid = __kgid_val(kgid);</div><div class='add'>+	else</div><div class='add'>+		gid = from_kgid(fs_userns, kgid);</div><div class='add'>+	if (gid == (gid_t)-1)</div><div class='add'>+		return INVALID_VFSGID;</div><div class='add'>+	return VFSGIDT_INIT_RAW(map_id_down(&amp;idmap-&gt;gid_map, gid));</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(make_vfsgid);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * from_vfsuid - map a vfsuid into the filesystem idmapping</div><div class='add'>+ * @idmap: the mount's idmapping</div><div class='add'>+ * @fs_userns: the filesystem's idmapping</div><div class='add'>+ * @vfsuid : vfsuid to be mapped</div><div class='add'>+ *</div><div class='add'>+ * Map @vfsuid into the filesystem idmapping. This function has to be used in</div><div class='add'>+ * order to e.g. write @vfsuid to inode-&gt;i_uid.</div><div class='add'>+ *</div><div class='add'>+ * Return: @vfsuid mapped into the filesystem idmapping</div><div class='add'>+ */</div><div class='add'>+kuid_t from_vfsuid(struct mnt_idmap *idmap,</div><div class='add'>+		   struct user_namespace *fs_userns, vfsuid_t vfsuid)</div><div class='add'>+{</div><div class='add'>+	uid_t uid;</div><div class='add'>+</div><div class='add'>+	if (idmap == &amp;nop_mnt_idmap)</div><div class='add'>+		return AS_KUIDT(vfsuid);</div><div class='add'>+	if (idmap == &amp;invalid_mnt_idmap)</div><div class='add'>+		return INVALID_UID;</div><div class='add'>+	uid = map_id_up(&amp;idmap-&gt;uid_map, __vfsuid_val(vfsuid));</div><div class='add'>+	if (uid == (uid_t)-1)</div><div class='add'>+		return INVALID_UID;</div><div class='add'>+	if (initial_idmapping(fs_userns))</div><div class='add'>+		return KUIDT_INIT(uid);</div><div class='add'>+	return make_kuid(fs_userns, uid);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(from_vfsuid);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * from_vfsgid - map a vfsgid into the filesystem idmapping</div><div class='add'>+ * @idmap: the mount's idmapping</div><div class='add'>+ * @fs_userns: the filesystem's idmapping</div><div class='add'>+ * @vfsgid : vfsgid to be mapped</div><div class='add'>+ *</div><div class='add'>+ * Map @vfsgid into the filesystem idmapping. This function has to be used in</div><div class='add'>+ * order to e.g. write @vfsgid to inode-&gt;i_gid.</div><div class='add'>+ *</div><div class='add'>+ * Return: @vfsgid mapped into the filesystem idmapping</div><div class='add'>+ */</div><div class='add'>+kgid_t from_vfsgid(struct mnt_idmap *idmap,</div><div class='add'>+		   struct user_namespace *fs_userns, vfsgid_t vfsgid)</div><div class='add'>+{</div><div class='add'>+	gid_t gid;</div><div class='add'>+</div><div class='add'>+	if (idmap == &amp;nop_mnt_idmap)</div><div class='add'>+		return AS_KGIDT(vfsgid);</div><div class='add'>+	if (idmap == &amp;invalid_mnt_idmap)</div><div class='add'>+		return INVALID_GID;</div><div class='add'>+	gid = map_id_up(&amp;idmap-&gt;gid_map, __vfsgid_val(vfsgid));</div><div class='add'>+	if (gid == (gid_t)-1)</div><div class='add'>+		return INVALID_GID;</div><div class='add'>+	if (initial_idmapping(fs_userns))</div><div class='add'>+		return KGIDT_INIT(gid);</div><div class='add'>+	return make_kgid(fs_userns, gid);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(from_vfsgid);</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_MULTIUSER</div><div class='add'>+/**</div><div class='add'>+ * vfsgid_in_group_p() - check whether a vfsuid matches the caller's groups</div><div class='add'>+ * @vfsgid: the mnt gid to match</div><div class='add'>+ *</div><div class='add'>+ * This function can be used to determine whether @vfsuid matches any of the</div><div class='add'>+ * caller's groups.</div><div class='add'>+ *</div><div class='add'>+ * Return: 1 if vfsuid matches caller's groups, 0 if not.</div><div class='add'>+ */</div><div class='add'>+int vfsgid_in_group_p(vfsgid_t vfsgid)</div><div class='add'>+{</div><div class='add'>+	return in_group_p(AS_KGIDT(vfsgid));</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+int vfsgid_in_group_p(vfsgid_t vfsgid)</div><div class='add'>+{</div><div class='add'>+	return 1;</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+EXPORT_SYMBOL_GPL(vfsgid_in_group_p);</div><div class='add'>+</div><div class='add'>+static int copy_mnt_idmap(struct uid_gid_map *map_from,</div><div class='add'>+			  struct uid_gid_map *map_to)</div><div class='add'>+{</div><div class='add'>+	struct uid_gid_extent *forward, *reverse;</div><div class='add'>+	u32 nr_extents = READ_ONCE(map_from-&gt;nr_extents);</div><div class='add'>+	/* Pairs with smp_wmb() when writing the idmapping. */</div><div class='add'>+	smp_rmb();</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Don't blindly copy @map_to into @map_from if nr_extents is</div><div class='add'>+	 * smaller or equal to UID_GID_MAP_MAX_BASE_EXTENTS. Since we</div><div class='add'>+	 * read @nr_extents someone could have written an idmapping and</div><div class='add'>+	 * then we might end up with inconsistent data. So just don't do</div><div class='add'>+	 * anything at all.</div><div class='add'>+	 */</div><div class='add'>+	if (nr_extents == 0)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Here we know that nr_extents is greater than zero which means</div><div class='add'>+	 * a map has been written. Since idmappings can't be changed</div><div class='add'>+	 * once they have been written we know that we can safely copy</div><div class='add'>+	 * from @map_to into @map_from.</div><div class='add'>+	 */</div><div class='add'>+</div><div class='add'>+	if (nr_extents &lt;= UID_GID_MAP_MAX_BASE_EXTENTS) {</div><div class='add'>+		*map_to = *map_from;</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	forward = kmemdup_array(map_from-&gt;forward, nr_extents,</div><div class='add'>+				sizeof(struct uid_gid_extent),</div><div class='add'>+				GFP_KERNEL_ACCOUNT);</div><div class='add'>+	if (!forward)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	reverse = kmemdup_array(map_from-&gt;reverse, nr_extents,</div><div class='add'>+				sizeof(struct uid_gid_extent),</div><div class='add'>+				GFP_KERNEL_ACCOUNT);</div><div class='add'>+	if (!reverse) {</div><div class='add'>+		kfree(forward);</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The idmapping isn't exposed anywhere so we don't need to care</div><div class='add'>+	 * about ordering between extent pointers and @nr_extents</div><div class='add'>+	 * initialization.</div><div class='add'>+	 */</div><div class='add'>+	map_to-&gt;forward = forward;</div><div class='add'>+	map_to-&gt;reverse = reverse;</div><div class='add'>+	map_to-&gt;nr_extents = nr_extents;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void free_mnt_idmap(struct mnt_idmap *idmap)</div><div class='add'>+{</div><div class='add'>+	if (idmap-&gt;uid_map.nr_extents &gt; UID_GID_MAP_MAX_BASE_EXTENTS) {</div><div class='add'>+		kfree(idmap-&gt;uid_map.forward);</div><div class='add'>+		kfree(idmap-&gt;uid_map.reverse);</div><div class='add'>+	}</div><div class='add'>+	if (idmap-&gt;gid_map.nr_extents &gt; UID_GID_MAP_MAX_BASE_EXTENTS) {</div><div class='add'>+		kfree(idmap-&gt;gid_map.forward);</div><div class='add'>+		kfree(idmap-&gt;gid_map.reverse);</div><div class='add'>+	}</div><div class='add'>+	kfree(idmap);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct mnt_idmap *alloc_mnt_idmap(struct user_namespace *mnt_userns)</div><div class='add'>+{</div><div class='add'>+	struct mnt_idmap *idmap;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	idmap = kzalloc(sizeof(struct mnt_idmap), GFP_KERNEL_ACCOUNT);</div><div class='add'>+	if (!idmap)</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+</div><div class='add'>+	refcount_set(&amp;idmap-&gt;count, 1);</div><div class='add'>+	ret = copy_mnt_idmap(&amp;mnt_userns-&gt;uid_map, &amp;idmap-&gt;uid_map);</div><div class='add'>+	if (!ret)</div><div class='add'>+		ret = copy_mnt_idmap(&amp;mnt_userns-&gt;gid_map, &amp;idmap-&gt;gid_map);</div><div class='add'>+	if (ret) {</div><div class='add'>+		free_mnt_idmap(idmap);</div><div class='add'>+		idmap = ERR_PTR(ret);</div><div class='add'>+	}</div><div class='add'>+	return idmap;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * mnt_idmap_get - get a reference to an idmapping</div><div class='add'>+ * @idmap: the idmap to bump the reference on</div><div class='add'>+ *</div><div class='add'>+ * If @idmap is not the @nop_mnt_idmap bump the reference count.</div><div class='add'>+ *</div><div class='add'>+ * Return: @idmap with reference count bumped if @not_mnt_idmap isn't passed.</div><div class='add'>+ */</div><div class='add'>+struct mnt_idmap *mnt_idmap_get(struct mnt_idmap *idmap)</div><div class='add'>+{</div><div class='add'>+	if (idmap != &amp;nop_mnt_idmap &amp;&amp; idmap != &amp;invalid_mnt_idmap)</div><div class='add'>+		refcount_inc(&amp;idmap-&gt;count);</div><div class='add'>+</div><div class='add'>+	return idmap;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(mnt_idmap_get);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * mnt_idmap_put - put a reference to an idmapping</div><div class='add'>+ * @idmap: the idmap to put the reference on</div><div class='add'>+ *</div><div class='add'>+ * If this is a non-initial idmapping, put the reference count when a mount is</div><div class='add'>+ * released and free it if we're the last user.</div><div class='add'>+ */</div><div class='add'>+void mnt_idmap_put(struct mnt_idmap *idmap)</div><div class='add'>+{</div><div class='add'>+	if (idmap != &amp;nop_mnt_idmap &amp;&amp; idmap != &amp;invalid_mnt_idmap &amp;&amp;</div><div class='add'>+	    refcount_dec_and_test(&amp;idmap-&gt;count))</div><div class='add'>+		free_mnt_idmap(idmap);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(mnt_idmap_put);</div><div class='add'>+</div><div class='add'>+int statmount_mnt_idmap(struct mnt_idmap *idmap, struct seq_file *seq, bool uid_map)</div><div class='add'>+{</div><div class='add'>+	struct uid_gid_map *map, *map_up;</div><div class='add'>+	u32 idx, nr_mappings;</div><div class='add'>+</div><div class='add'>+	if (!is_valid_mnt_idmap(idmap))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Idmappings are shown relative to the caller's idmapping.</div><div class='add'>+	 * This is both the most intuitive and most useful solution.</div><div class='add'>+	 */</div><div class='add'>+	if (uid_map) {</div><div class='add'>+		map = &amp;idmap-&gt;uid_map;</div><div class='add'>+		map_up = &amp;current_user_ns()-&gt;uid_map;</div><div class='add'>+	} else {</div><div class='add'>+		map = &amp;idmap-&gt;gid_map;</div><div class='add'>+		map_up = &amp;current_user_ns()-&gt;gid_map;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for (idx = 0, nr_mappings = 0; idx &lt; map-&gt;nr_extents; idx++) {</div><div class='add'>+		uid_t lower;</div><div class='add'>+		struct uid_gid_extent *extent;</div><div class='add'>+</div><div class='add'>+		if (map-&gt;nr_extents &lt;= UID_GID_MAP_MAX_BASE_EXTENTS)</div><div class='add'>+			extent = &amp;map-&gt;extent[idx];</div><div class='add'>+		else</div><div class='add'>+			extent = &amp;map-&gt;forward[idx];</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Verify that the whole range of the mapping can be</div><div class='add'>+		 * resolved in the caller's idmapping. If it cannot be</div><div class='add'>+		 * resolved skip the mapping.</div><div class='add'>+		 */</div><div class='add'>+		lower = map_id_range_up(map_up, extent-&gt;lower_first, extent-&gt;count);</div><div class='add'>+		if (lower == (uid_t) -1)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		seq_printf(seq, "%u %u %u", extent-&gt;first, lower, extent-&gt;count);</div><div class='add'>+</div><div class='add'>+		seq-&gt;count++; /* mappings are separated by \0 */</div><div class='add'>+		if (seq_has_overflowed(seq))</div><div class='add'>+			return -EAGAIN;</div><div class='add'>+</div><div class='add'>+		nr_mappings++;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return nr_mappings;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/mount.h b/fs/mount.h<br/>index 0b6e08cf8afb..2d28ef2a3aed 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/mount.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/mount.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/mount.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/mount.h</a></div><div class='hunk'>@@ -5,23 +5,29 @@</div><div class='ctx'> #include &lt;linux/ns_common.h&gt;</div><div class='ctx'> #include &lt;linux/fs_pin.h&gt;</div><div class='ctx'> </div><div class='add'>+extern struct list_head notify_list;</div><div class='add'>+</div><div class='ctx'> struct mnt_namespace {</div><div class='ctx'> 	struct ns_common	ns;</div><div class='ctx'> 	struct mount *	root;</div><div class='del'>-	/*</div><div class='del'>-	 * Traversal and modification of .list is protected by either</div><div class='del'>-	 * - taking namespace_sem for write, OR</div><div class='del'>-	 * - taking namespace_sem for read AND taking .ns_lock.</div><div class='del'>-	 */</div><div class='del'>-	struct list_head	list;</div><div class='del'>-	spinlock_t		ns_lock;</div><div class='add'>+	struct {</div><div class='add'>+		struct rb_root	mounts;		 /* Protected by namespace_sem */</div><div class='add'>+		struct rb_node	*mnt_last_node;	 /* last (rightmost) mount in the rbtree */</div><div class='add'>+		struct rb_node	*mnt_first_node; /* first (leftmost) mount in the rbtree */</div><div class='add'>+	};</div><div class='ctx'> 	struct user_namespace	*user_ns;</div><div class='ctx'> 	struct ucounts		*ucounts;</div><div class='del'>-	u64			seq;	/* Sequence number to prevent loops */</div><div class='del'>-	wait_queue_head_t poll;</div><div class='add'>+	wait_queue_head_t	poll;</div><div class='add'>+	u64			seq_origin; /* Sequence number of origin mount namespace */</div><div class='ctx'> 	u64 event;</div><div class='del'>-	unsigned int		mounts; /* # of mounts in the namespace */</div><div class='add'>+#ifdef CONFIG_FSNOTIFY</div><div class='add'>+	__u32			n_fsnotify_mask;</div><div class='add'>+	struct fsnotify_mark_connector __rcu *n_fsnotify_marks;</div><div class='add'>+#endif</div><div class='add'>+	unsigned int		nr_mounts; /* # of mounts in the namespace */</div><div class='ctx'> 	unsigned int		pending_mounts;</div><div class='add'>+	refcount_t		passive; /* number references not pinning @mounts */</div><div class='add'>+	bool			is_anon;</div><div class='ctx'> } __randomize_layout;</div><div class='ctx'> </div><div class='ctx'> struct mnt_pcp {</div><div class='hunk'>@@ -33,7 +39,6 @@ struct mountpoint {</div><div class='ctx'> 	struct hlist_node m_hash;</div><div class='ctx'> 	struct dentry *m_dentry;</div><div class='ctx'> 	struct hlist_head m_list;</div><div class='del'>-	int m_count;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct mount {</div><div class='hunk'>@@ -42,6 +47,7 @@ struct mount {</div><div class='ctx'> 	struct dentry *mnt_mountpoint;</div><div class='ctx'> 	struct vfsmount mnt;</div><div class='ctx'> 	union {</div><div class='add'>+		struct rb_node mnt_node; /* node in the ns-&gt;mounts rbtree */</div><div class='ctx'> 		struct rcu_head mnt_rcu;</div><div class='ctx'> 		struct llist_node mnt_llist;</div><div class='ctx'> 	};</div><div class='hunk'>@@ -53,13 +59,16 @@ struct mount {</div><div class='ctx'> #endif</div><div class='ctx'> 	struct list_head mnt_mounts;	/* list of children, anchored here */</div><div class='ctx'> 	struct list_head mnt_child;	/* and going through their mnt_child */</div><div class='del'>-	struct list_head mnt_instance;	/* mount instance on sb-&gt;s_mounts */</div><div class='add'>+	struct mount *mnt_next_for_sb;	/* the next two fields are hlist_node, */</div><div class='add'>+	struct mount * __aligned(1) *mnt_pprev_for_sb;</div><div class='add'>+					/* except that LSB of pprev is stolen */</div><div class='add'>+#define WRITE_HOLD 1			/* ... for use by mnt_hold_writers() */</div><div class='ctx'> 	const char *mnt_devname;	/* Name of device e.g. /dev/dsk/hda1 */</div><div class='ctx'> 	struct list_head mnt_list;</div><div class='ctx'> 	struct list_head mnt_expire;	/* link in fs-specific expiry list */</div><div class='ctx'> 	struct list_head mnt_share;	/* circular list of shared mounts */</div><div class='del'>-	struct list_head mnt_slave_list;/* list of slave mounts */</div><div class='del'>-	struct list_head mnt_slave;	/* slave list entry */</div><div class='add'>+	struct hlist_head mnt_slave_list;/* list of slave mounts */</div><div class='add'>+	struct hlist_node mnt_slave;	/* slave list entry */</div><div class='ctx'> 	struct mount *mnt_master;	/* slave is on master-&gt;mnt_slave_list */</div><div class='ctx'> 	struct mnt_namespace *mnt_ns;	/* containing namespace */</div><div class='ctx'> 	struct mountpoint *mnt_mp;	/* where is it mounted */</div><div class='hunk'>@@ -67,18 +76,38 @@ struct mount {</div><div class='ctx'> 		struct hlist_node mnt_mp_list;	/* list mounts with the same mountpoint */</div><div class='ctx'> 		struct hlist_node mnt_umount;</div><div class='ctx'> 	};</div><div class='del'>-	struct list_head mnt_umounting; /* list entry for umount propagation */</div><div class='ctx'> #ifdef CONFIG_FSNOTIFY</div><div class='ctx'> 	struct fsnotify_mark_connector __rcu *mnt_fsnotify_marks;</div><div class='ctx'> 	__u32 mnt_fsnotify_mask;</div><div class='add'>+	struct list_head to_notify;	/* need to queue notification */</div><div class='add'>+	struct mnt_namespace *prev_ns;	/* previous namespace (NULL if none) */</div><div class='ctx'> #endif</div><div class='del'>-	int mnt_id;			/* mount identifier */</div><div class='add'>+	int mnt_t_flags;		/* namespace_sem-protected flags */</div><div class='add'>+	int mnt_id;			/* mount identifier, reused */</div><div class='add'>+	u64 mnt_id_unique;		/* mount ID unique until reboot */</div><div class='ctx'> 	int mnt_group_id;		/* peer group identifier */</div><div class='ctx'> 	int mnt_expiry_mark;		/* true if marked for expiry */</div><div class='ctx'> 	struct hlist_head mnt_pins;</div><div class='ctx'> 	struct hlist_head mnt_stuck_children;</div><div class='add'>+	struct mount *overmount;	/* mounted on -&gt;mnt_root */</div><div class='ctx'> } __randomize_layout;</div><div class='ctx'> </div><div class='add'>+enum {</div><div class='add'>+	T_SHARED		= 1, /* mount is shared */</div><div class='add'>+	T_UNBINDABLE		= 2, /* mount is unbindable */</div><div class='add'>+	T_MARKED		= 4, /* internal mark for propagate_... */</div><div class='add'>+	T_UMOUNT_CANDIDATE	= 8, /* for propagate_umount */</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * T_SHARED_MASK is the set of flags that should be cleared when a</div><div class='add'>+	 * mount becomes shared.  Currently, this is only the flag that says a</div><div class='add'>+	 * mount cannot be bind mounted, since this is how we create a mount</div><div class='add'>+	 * that shares events with another mount.  If you add a new T_*</div><div class='add'>+	 * flag, consider how it interacts with shared mounts.</div><div class='add'>+	 */</div><div class='add'>+	T_SHARED_MASK	= T_UNBINDABLE,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> #define MNT_NS_INTERNAL ERR_PTR(-EINVAL) /* distinct from any mnt_namespace */</div><div class='ctx'> </div><div class='ctx'> static inline struct mount *real_mount(struct vfsmount *mnt)</div><div class='hunk'>@@ -86,7 +115,7 @@ static inline struct mount *real_mount(struct vfsmount *mnt)</div><div class='ctx'> 	return container_of(mnt, struct mount, mnt);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int mnt_has_parent(struct mount *mnt)</div><div class='add'>+static inline int mnt_has_parent(const struct mount *mnt)</div><div class='ctx'> {</div><div class='ctx'> 	return mnt != mnt-&gt;mnt_parent;</div><div class='ctx'> }</div><div class='hunk'>@@ -100,7 +129,6 @@ static inline int is_mounted(struct vfsmount *mnt)</div><div class='ctx'> extern struct mount *__lookup_mnt(struct vfsmount *, struct dentry *);</div><div class='ctx'> </div><div class='ctx'> extern int __legitimize_mnt(struct vfsmount *, unsigned);</div><div class='del'>-extern bool legitimize_mnt(struct vfsmount *, unsigned);</div><div class='ctx'> </div><div class='ctx'> static inline bool __path_is_mountpoint(const struct path *path)</div><div class='ctx'> {</div><div class='hunk'>@@ -119,22 +147,26 @@ static inline void detach_mounts(struct dentry *dentry)</div><div class='ctx'> </div><div class='ctx'> static inline void get_mnt_ns(struct mnt_namespace *ns)</div><div class='ctx'> {</div><div class='del'>-	refcount_inc(&amp;ns-&gt;ns.count);</div><div class='add'>+	ns_ref_inc(ns);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> extern seqlock_t mount_lock;</div><div class='ctx'> </div><div class='add'>+DEFINE_LOCK_GUARD_0(mount_writer, write_seqlock(&amp;mount_lock),</div><div class='add'>+		    write_sequnlock(&amp;mount_lock))</div><div class='add'>+DEFINE_LOCK_GUARD_0(mount_locked_reader, read_seqlock_excl(&amp;mount_lock),</div><div class='add'>+		    read_sequnlock_excl(&amp;mount_lock))</div><div class='add'>+</div><div class='ctx'> struct proc_mounts {</div><div class='ctx'> 	struct mnt_namespace *ns;</div><div class='ctx'> 	struct path root;</div><div class='ctx'> 	int (*show)(struct seq_file *, struct vfsmount *);</div><div class='del'>-	struct mount cursor;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> extern const struct seq_operations mounts_op;</div><div class='ctx'> </div><div class='del'>-extern bool __is_local_mountpoint(struct dentry *dentry);</div><div class='del'>-static inline bool is_local_mountpoint(struct dentry *dentry)</div><div class='add'>+extern bool __is_local_mountpoint(const struct dentry *dentry);</div><div class='add'>+static inline bool is_local_mountpoint(const struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	if (!d_mountpoint(dentry))</div><div class='ctx'> 		return false;</div><div class='hunk'>@@ -144,7 +176,90 @@ static inline bool is_local_mountpoint(struct dentry *dentry)</div><div class='ctx'> </div><div class='ctx'> static inline bool is_anon_ns(struct mnt_namespace *ns)</div><div class='ctx'> {</div><div class='del'>-	return ns-&gt;seq == 0;</div><div class='add'>+	return ns-&gt;is_anon;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool anon_ns_root(const struct mount *m)</div><div class='add'>+{</div><div class='add'>+	struct mnt_namespace *ns = READ_ONCE(m-&gt;mnt_ns);</div><div class='add'>+</div><div class='add'>+	return !IS_ERR_OR_NULL(ns) &amp;&amp; is_anon_ns(ns) &amp;&amp; m == ns-&gt;root;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool mnt_ns_attached(const struct mount *mnt)</div><div class='add'>+{</div><div class='add'>+	return !RB_EMPTY_NODE(&amp;mnt-&gt;mnt_node);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool mnt_ns_empty(const struct mnt_namespace *ns)</div><div class='add'>+{</div><div class='add'>+	return RB_EMPTY_ROOT(&amp;ns-&gt;mounts);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void move_from_ns(struct mount *mnt)</div><div class='add'>+{</div><div class='add'>+	struct mnt_namespace *ns = mnt-&gt;mnt_ns;</div><div class='add'>+	WARN_ON(!mnt_ns_attached(mnt));</div><div class='add'>+	if (ns-&gt;mnt_last_node == &amp;mnt-&gt;mnt_node)</div><div class='add'>+		ns-&gt;mnt_last_node = rb_prev(&amp;mnt-&gt;mnt_node);</div><div class='add'>+	if (ns-&gt;mnt_first_node == &amp;mnt-&gt;mnt_node)</div><div class='add'>+		ns-&gt;mnt_first_node = rb_next(&amp;mnt-&gt;mnt_node);</div><div class='add'>+	rb_erase(&amp;mnt-&gt;mnt_node, &amp;ns-&gt;mounts);</div><div class='add'>+	RB_CLEAR_NODE(&amp;mnt-&gt;mnt_node);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool has_locked_children(struct mount *mnt, struct dentry *dentry);</div><div class='add'>+struct mnt_namespace *get_sequential_mnt_ns(struct mnt_namespace *mnt_ns,</div><div class='add'>+					    bool previous);</div><div class='add'>+</div><div class='add'>+static inline struct mnt_namespace *to_mnt_ns(struct ns_common *ns)</div><div class='add'>+{</div><div class='add'>+	return container_of(ns, struct mnt_namespace, ns);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_FSNOTIFY</div><div class='add'>+static inline void mnt_notify_add(struct mount *m)</div><div class='add'>+{</div><div class='add'>+	/* Optimize the case where there are no watches */</div><div class='add'>+	if ((m-&gt;mnt_ns &amp;&amp; m-&gt;mnt_ns-&gt;n_fsnotify_marks) ||</div><div class='add'>+	    (m-&gt;prev_ns &amp;&amp; m-&gt;prev_ns-&gt;n_fsnotify_marks))</div><div class='add'>+		list_add_tail(&amp;m-&gt;to_notify, &amp;notify_list);</div><div class='add'>+	else</div><div class='add'>+		m-&gt;prev_ns = m-&gt;mnt_ns;</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+static inline void mnt_notify_add(struct mount *m)</div><div class='add'>+{</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+static inline struct mount *topmost_overmount(struct mount *m)</div><div class='add'>+{</div><div class='add'>+	while (m-&gt;overmount)</div><div class='add'>+		m = m-&gt;overmount;</div><div class='add'>+	return m;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool __test_write_hold(struct mount * __aligned(1) *val)</div><div class='add'>+{</div><div class='add'>+	return (unsigned long)val &amp; WRITE_HOLD;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool test_write_hold(const struct mount *m)</div><div class='add'>+{</div><div class='add'>+	return __test_write_hold(m-&gt;mnt_pprev_for_sb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void set_write_hold(struct mount *m)</div><div class='add'>+{</div><div class='add'>+	m-&gt;mnt_pprev_for_sb = (void *)((unsigned long)m-&gt;mnt_pprev_for_sb</div><div class='add'>+				       | WRITE_HOLD);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void clear_write_hold(struct mount *m)</div><div class='add'>+{</div><div class='add'>+	m-&gt;mnt_pprev_for_sb = (void *)((unsigned long)m-&gt;mnt_pprev_for_sb</div><div class='add'>+				       &amp; ~WRITE_HOLD);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-extern void mnt_cursor_del(struct mnt_namespace *ns, struct mount *cursor);</div><div class='add'>+struct mnt_namespace *mnt_ns_from_dentry(struct dentry *dentry);</div><div class='head'>diff --git a/fs/mpage.c b/fs/mpage.c<br/>index 334e7d09aa65..7dae5afc2b9e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/mpage.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/mpage.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/mpage.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/mpage.c</a></div><div class='hunk'>@@ -29,7 +29,6 @@</div><div class='ctx'> #include &lt;linux/writeback.h&gt;</div><div class='ctx'> #include &lt;linux/backing-dev.h&gt;</div><div class='ctx'> #include &lt;linux/pagevec.h&gt;</div><div class='del'>-#include &lt;linux/cleancache.h&gt;</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -37,89 +36,85 @@</div><div class='ctx'>  *</div><div class='ctx'>  * The mpage code never puts partial pages into a BIO (except for end-of-file).</div><div class='ctx'>  * If a page does not map to a contiguous run of blocks then it simply falls</div><div class='del'>- * back to block_read_full_page().</div><div class='add'>+ * back to block_read_full_folio().</div><div class='ctx'>  *</div><div class='ctx'>  * Why is this?  If a page's completion depends on a number of different BIOs</div><div class='ctx'>  * which can complete in any order (or at the same time) then determining the</div><div class='ctx'>  * status of that page is hard.  See end_buffer_async_read() for the details.</div><div class='ctx'>  * There is no point in duplicating all that complexity.</div><div class='ctx'>  */</div><div class='del'>-static void mpage_end_io(struct bio *bio)</div><div class='add'>+static void mpage_read_end_io(struct bio *bio)</div><div class='ctx'> {</div><div class='del'>-	struct bio_vec *bv;</div><div class='del'>-	struct bvec_iter_all iter_all;</div><div class='add'>+	struct folio_iter fi;</div><div class='add'>+	int err = blk_status_to_errno(bio-&gt;bi_status);</div><div class='ctx'> </div><div class='del'>-	bio_for_each_segment_all(bv, bio, iter_all) {</div><div class='del'>-		struct page *page = bv-&gt;bv_page;</div><div class='del'>-		page_endio(page, bio_op(bio),</div><div class='del'>-			   blk_status_to_errno(bio-&gt;bi_status));</div><div class='add'>+	bio_for_each_folio_all(fi, bio)</div><div class='add'>+		folio_end_read(fi.folio, err == 0);</div><div class='add'>+</div><div class='add'>+	bio_put(bio);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void mpage_write_end_io(struct bio *bio)</div><div class='add'>+{</div><div class='add'>+	struct folio_iter fi;</div><div class='add'>+	int err = blk_status_to_errno(bio-&gt;bi_status);</div><div class='add'>+</div><div class='add'>+	bio_for_each_folio_all(fi, bio) {</div><div class='add'>+		if (err)</div><div class='add'>+			mapping_set_error(fi.folio-&gt;mapping, err);</div><div class='add'>+		folio_end_writeback(fi.folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	bio_put(bio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct bio *mpage_bio_submit(int op, int op_flags, struct bio *bio)</div><div class='add'>+static struct bio *mpage_bio_submit_read(struct bio *bio)</div><div class='ctx'> {</div><div class='del'>-	bio-&gt;bi_end_io = mpage_end_io;</div><div class='del'>-	bio_set_op_attrs(bio, op, op_flags);</div><div class='add'>+	bio-&gt;bi_end_io = mpage_read_end_io;</div><div class='ctx'> 	guard_bio_eod(bio);</div><div class='ctx'> 	submit_bio(bio);</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct bio *</div><div class='del'>-mpage_alloc(struct block_device *bdev,</div><div class='del'>-		sector_t first_sector, int nr_vecs,</div><div class='del'>-		gfp_t gfp_flags)</div><div class='add'>+static struct bio *mpage_bio_submit_write(struct bio *bio)</div><div class='ctx'> {</div><div class='del'>-	struct bio *bio;</div><div class='del'>-</div><div class='del'>-	/* Restrict the given (page cache) mask for slab allocations */</div><div class='del'>-	gfp_flags &amp;= GFP_KERNEL;</div><div class='del'>-	bio = bio_alloc(gfp_flags, nr_vecs);</div><div class='del'>-</div><div class='del'>-	if (bio == NULL &amp;&amp; (current-&gt;flags &amp; PF_MEMALLOC)) {</div><div class='del'>-		while (!bio &amp;&amp; (nr_vecs /= 2))</div><div class='del'>-			bio = bio_alloc(gfp_flags, nr_vecs);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (bio) {</div><div class='del'>-		bio_set_dev(bio, bdev);</div><div class='del'>-		bio-&gt;bi_iter.bi_sector = first_sector;</div><div class='del'>-	}</div><div class='del'>-	return bio;</div><div class='add'>+	bio-&gt;bi_end_io = mpage_write_end_io;</div><div class='add'>+	guard_bio_eod(bio);</div><div class='add'>+	submit_bio(bio);</div><div class='add'>+	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * support function for mpage_readahead.  The fs supplied get_block might</div><div class='ctx'>  * return an up to date buffer.  This is used to map that buffer into</div><div class='del'>- * the page, which allows readpage to avoid triggering a duplicate call</div><div class='add'>+ * the page, which allows read_folio to avoid triggering a duplicate call</div><div class='ctx'>  * to get_block.</div><div class='ctx'>  *</div><div class='ctx'>  * The idea is to avoid adding buffers to pages that don't already have</div><div class='ctx'>  * them.  So when the buffer is up to date and the page size == block size,</div><div class='ctx'>  * this marks the page up to date instead of adding new buffers.</div><div class='ctx'>  */</div><div class='del'>-static void </div><div class='del'>-map_buffer_to_page(struct page *page, struct buffer_head *bh, int page_block) </div><div class='add'>+static void map_buffer_to_folio(struct folio *folio, struct buffer_head *bh,</div><div class='add'>+		int page_block)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	struct buffer_head *page_bh, *head;</div><div class='ctx'> 	int block = 0;</div><div class='ctx'> </div><div class='del'>-	if (!page_has_buffers(page)) {</div><div class='add'>+	head = folio_buffers(folio);</div><div class='add'>+	if (!head) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * don't make any buffers if there is only one buffer on</div><div class='del'>-		 * the page and the page just needs to be set up to date</div><div class='add'>+		 * the folio and the folio just needs to be set up to date</div><div class='ctx'> 		 */</div><div class='del'>-		if (inode-&gt;i_blkbits == PAGE_SHIFT &amp;&amp;</div><div class='add'>+		if (inode-&gt;i_blkbits == folio_shift(folio) &amp;&amp;</div><div class='ctx'> 		    buffer_uptodate(bh)) {</div><div class='del'>-			SetPageUptodate(page);    </div><div class='add'>+			folio_mark_uptodate(folio);</div><div class='ctx'> 			return;</div><div class='ctx'> 		}</div><div class='del'>-		create_empty_buffers(page, i_blocksize(inode), 0);</div><div class='add'>+		head = create_empty_buffers(folio, i_blocksize(inode), 0);</div><div class='ctx'> 	}</div><div class='del'>-	head = page_buffers(page);</div><div class='add'>+</div><div class='ctx'> 	page_bh = head;</div><div class='ctx'> 	do {</div><div class='ctx'> 		if (block == page_block) {</div><div class='hunk'>@@ -135,7 +130,7 @@ map_buffer_to_page(struct page *page, struct buffer_head *bh, int page_block)</div><div class='ctx'> </div><div class='ctx'> struct mpage_readpage_args {</div><div class='ctx'> 	struct bio *bio;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	unsigned int nr_pages;</div><div class='ctx'> 	bool is_readahead;</div><div class='ctx'> 	sector_t last_block_in_bio;</div><div class='hunk'>@@ -153,41 +148,38 @@ struct mpage_readpage_args {</div><div class='ctx'>  * represent the validity of its disk mapping and to decide when to do the next</div><div class='ctx'>  * get_block() call.</div><div class='ctx'>  */</div><div class='del'>-static struct bio *do_mpage_readpage(struct mpage_readpage_args *args)</div><div class='add'>+static void do_mpage_readpage(struct mpage_readpage_args *args)</div><div class='ctx'> {</div><div class='del'>-	struct page *page = args-&gt;page;</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct folio *folio = args-&gt;folio;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	const unsigned blkbits = inode-&gt;i_blkbits;</div><div class='del'>-	const unsigned blocks_per_page = PAGE_SIZE &gt;&gt; blkbits;</div><div class='add'>+	const unsigned blocks_per_folio = folio_size(folio) &gt;&gt; blkbits;</div><div class='ctx'> 	const unsigned blocksize = 1 &lt;&lt; blkbits;</div><div class='ctx'> 	struct buffer_head *map_bh = &amp;args-&gt;map_bh;</div><div class='ctx'> 	sector_t block_in_file;</div><div class='ctx'> 	sector_t last_block;</div><div class='ctx'> 	sector_t last_block_in_file;</div><div class='del'>-	sector_t blocks[MAX_BUF_PER_PAGE];</div><div class='add'>+	sector_t first_block;</div><div class='ctx'> 	unsigned page_block;</div><div class='del'>-	unsigned first_hole = blocks_per_page;</div><div class='add'>+	unsigned first_hole = blocks_per_folio;</div><div class='ctx'> 	struct block_device *bdev = NULL;</div><div class='ctx'> 	int length;</div><div class='ctx'> 	int fully_mapped = 1;</div><div class='del'>-	int op_flags;</div><div class='add'>+	blk_opf_t opf = REQ_OP_READ;</div><div class='ctx'> 	unsigned nblocks;</div><div class='ctx'> 	unsigned relative_block;</div><div class='del'>-	gfp_t gfp;</div><div class='add'>+	gfp_t gfp = mapping_gfp_constraint(folio-&gt;mapping, GFP_KERNEL);</div><div class='ctx'> </div><div class='ctx'> 	if (args-&gt;is_readahead) {</div><div class='del'>-		op_flags = REQ_RAHEAD;</div><div class='del'>-		gfp = readahead_gfp_mask(page-&gt;mapping);</div><div class='del'>-	} else {</div><div class='del'>-		op_flags = 0;</div><div class='del'>-		gfp = mapping_gfp_constraint(page-&gt;mapping, GFP_KERNEL);</div><div class='add'>+		opf |= REQ_RAHEAD;</div><div class='add'>+		gfp |= __GFP_NORETRY | __GFP_NOWARN;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (page_has_buffers(page))</div><div class='add'>+	if (folio_buffers(folio))</div><div class='ctx'> 		goto confused;</div><div class='ctx'> </div><div class='del'>-	block_in_file = (sector_t)page-&gt;index &lt;&lt; (PAGE_SHIFT - blkbits);</div><div class='del'>-	last_block = block_in_file + args-&gt;nr_pages * blocks_per_page;</div><div class='add'>+	block_in_file = folio_pos(folio) &gt;&gt; blkbits;</div><div class='add'>+	last_block = block_in_file + ((args-&gt;nr_pages * PAGE_SIZE) &gt;&gt; blkbits);</div><div class='ctx'> 	last_block_in_file = (i_size_read(inode) + blocksize - 1) &gt;&gt; blkbits;</div><div class='ctx'> 	if (last_block &gt; last_block_in_file)</div><div class='ctx'> 		last_block = last_block_in_file;</div><div class='hunk'>@@ -203,15 +195,14 @@ static struct bio *do_mpage_readpage(struct mpage_readpage_args *args)</div><div class='ctx'> 		unsigned map_offset = block_in_file - args-&gt;first_logical_block;</div><div class='ctx'> 		unsigned last = nblocks - map_offset;</div><div class='ctx'> </div><div class='add'>+		first_block = map_bh-&gt;b_blocknr + map_offset;</div><div class='ctx'> 		for (relative_block = 0; ; relative_block++) {</div><div class='ctx'> 			if (relative_block == last) {</div><div class='ctx'> 				clear_buffer_mapped(map_bh);</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='del'>-			if (page_block == blocks_per_page)</div><div class='add'>+			if (page_block == blocks_per_folio)</div><div class='ctx'> 				break;</div><div class='del'>-			blocks[page_block] = map_bh-&gt;b_blocknr + map_offset +</div><div class='del'>-						relative_block;</div><div class='ctx'> 			page_block++;</div><div class='ctx'> 			block_in_file++;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -219,10 +210,10 @@ static struct bio *do_mpage_readpage(struct mpage_readpage_args *args)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Then do more get_blocks calls until we are done with this page.</div><div class='add'>+	 * Then do more get_blocks calls until we are done with this folio.</div><div class='ctx'> 	 */</div><div class='del'>-	map_bh-&gt;b_page = page;</div><div class='del'>-	while (page_block &lt; blocks_per_page) {</div><div class='add'>+	map_bh-&gt;b_folio = folio;</div><div class='add'>+	while (page_block &lt; blocks_per_folio) {</div><div class='ctx'> 		map_bh-&gt;b_state = 0;</div><div class='ctx'> 		map_bh-&gt;b_size = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -235,7 +226,7 @@ static struct bio *do_mpage_readpage(struct mpage_readpage_args *args)</div><div class='ctx'> </div><div class='ctx'> 		if (!buffer_mapped(map_bh)) {</div><div class='ctx'> 			fully_mapped = 0;</div><div class='del'>-			if (first_hole == blocks_per_page)</div><div class='add'>+			if (first_hole == blocks_per_folio)</div><div class='ctx'> 				first_hole = page_block;</div><div class='ctx'> 			page_block++;</div><div class='ctx'> 			block_in_file++;</div><div class='hunk'>@@ -244,94 +235,85 @@ static struct bio *do_mpage_readpage(struct mpage_readpage_args *args)</div><div class='ctx'> </div><div class='ctx'> 		/* some filesystems will copy data into the page during</div><div class='ctx'> 		 * the get_block call, in which case we don't want to</div><div class='del'>-		 * read it again.  map_buffer_to_page copies the data</div><div class='del'>-		 * we just collected from get_block into the page's buffers</div><div class='del'>-		 * so readpage doesn't have to repeat the get_block call</div><div class='add'>+		 * read it again.  map_buffer_to_folio copies the data</div><div class='add'>+		 * we just collected from get_block into the folio's buffers</div><div class='add'>+		 * so read_folio doesn't have to repeat the get_block call</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (buffer_uptodate(map_bh)) {</div><div class='del'>-			map_buffer_to_page(page, map_bh, page_block);</div><div class='add'>+			map_buffer_to_folio(folio, map_bh, page_block);</div><div class='ctx'> 			goto confused;</div><div class='ctx'> 		}</div><div class='ctx'> 	</div><div class='del'>-		if (first_hole != blocks_per_page)</div><div class='add'>+		if (first_hole != blocks_per_folio)</div><div class='ctx'> 			goto confused;		/* hole -&gt; non-hole */</div><div class='ctx'> </div><div class='ctx'> 		/* Contiguous blocks? */</div><div class='del'>-		if (page_block &amp;&amp; blocks[page_block-1] != map_bh-&gt;b_blocknr-1)</div><div class='add'>+		if (!page_block)</div><div class='add'>+			first_block = map_bh-&gt;b_blocknr;</div><div class='add'>+		else if (first_block + page_block != map_bh-&gt;b_blocknr)</div><div class='ctx'> 			goto confused;</div><div class='ctx'> 		nblocks = map_bh-&gt;b_size &gt;&gt; blkbits;</div><div class='ctx'> 		for (relative_block = 0; ; relative_block++) {</div><div class='ctx'> 			if (relative_block == nblocks) {</div><div class='ctx'> 				clear_buffer_mapped(map_bh);</div><div class='ctx'> 				break;</div><div class='del'>-			} else if (page_block == blocks_per_page)</div><div class='add'>+			} else if (page_block == blocks_per_folio)</div><div class='ctx'> 				break;</div><div class='del'>-			blocks[page_block] = map_bh-&gt;b_blocknr+relative_block;</div><div class='ctx'> 			page_block++;</div><div class='ctx'> 			block_in_file++;</div><div class='ctx'> 		}</div><div class='ctx'> 		bdev = map_bh-&gt;b_bdev;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (first_hole != blocks_per_page) {</div><div class='del'>-		zero_user_segment(page, first_hole &lt;&lt; blkbits, PAGE_SIZE);</div><div class='add'>+	if (first_hole != blocks_per_folio) {</div><div class='add'>+		folio_zero_segment(folio, first_hole &lt;&lt; blkbits, folio_size(folio));</div><div class='ctx'> 		if (first_hole == 0) {</div><div class='del'>-			SetPageUptodate(page);</div><div class='del'>-			unlock_page(page);</div><div class='add'>+			folio_mark_uptodate(folio);</div><div class='add'>+			folio_unlock(folio);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else if (fully_mapped) {</div><div class='del'>-		SetPageMappedToDisk(page);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (fully_mapped &amp;&amp; blocks_per_page == 1 &amp;&amp; !PageUptodate(page) &amp;&amp;</div><div class='del'>-	    cleancache_get_page(page) == 0) {</div><div class='del'>-		SetPageUptodate(page);</div><div class='del'>-		goto confused;</div><div class='add'>+		folio_set_mappedtodisk(folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * This page will go to BIO.  Do we need to send this BIO off first?</div><div class='add'>+	 * This folio will go to BIO.  Do we need to send this BIO off first?</div><div class='ctx'> 	 */</div><div class='del'>-	if (args-&gt;bio &amp;&amp; (args-&gt;last_block_in_bio != blocks[0] - 1))</div><div class='del'>-		args-&gt;bio = mpage_bio_submit(REQ_OP_READ, op_flags, args-&gt;bio);</div><div class='add'>+	if (args-&gt;bio &amp;&amp; (args-&gt;last_block_in_bio != first_block - 1))</div><div class='add'>+		args-&gt;bio = mpage_bio_submit_read(args-&gt;bio);</div><div class='ctx'> </div><div class='ctx'> alloc_new:</div><div class='ctx'> 	if (args-&gt;bio == NULL) {</div><div class='del'>-		if (first_hole == blocks_per_page) {</div><div class='del'>-			if (!bdev_read_page(bdev, blocks[0] &lt;&lt; (blkbits - 9),</div><div class='del'>-								page))</div><div class='del'>-				goto out;</div><div class='del'>-		}</div><div class='del'>-		args-&gt;bio = mpage_alloc(bdev, blocks[0] &lt;&lt; (blkbits - 9),</div><div class='del'>-					bio_max_segs(args-&gt;nr_pages), gfp);</div><div class='add'>+		args-&gt;bio = bio_alloc(bdev, bio_max_segs(args-&gt;nr_pages), opf,</div><div class='add'>+				      gfp);</div><div class='ctx'> 		if (args-&gt;bio == NULL)</div><div class='ctx'> 			goto confused;</div><div class='add'>+		args-&gt;bio-&gt;bi_iter.bi_sector = first_block &lt;&lt; (blkbits - 9);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	length = first_hole &lt;&lt; blkbits;</div><div class='del'>-	if (bio_add_page(args-&gt;bio, page, length, 0) &lt; length) {</div><div class='del'>-		args-&gt;bio = mpage_bio_submit(REQ_OP_READ, op_flags, args-&gt;bio);</div><div class='add'>+	if (!bio_add_folio(args-&gt;bio, folio, length, 0)) {</div><div class='add'>+		args-&gt;bio = mpage_bio_submit_read(args-&gt;bio);</div><div class='ctx'> 		goto alloc_new;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	relative_block = block_in_file - args-&gt;first_logical_block;</div><div class='ctx'> 	nblocks = map_bh-&gt;b_size &gt;&gt; blkbits;</div><div class='ctx'> 	if ((buffer_boundary(map_bh) &amp;&amp; relative_block == nblocks) ||</div><div class='del'>-	    (first_hole != blocks_per_page))</div><div class='del'>-		args-&gt;bio = mpage_bio_submit(REQ_OP_READ, op_flags, args-&gt;bio);</div><div class='add'>+	    (first_hole != blocks_per_folio))</div><div class='add'>+		args-&gt;bio = mpage_bio_submit_read(args-&gt;bio);</div><div class='ctx'> 	else</div><div class='del'>-		args-&gt;last_block_in_bio = blocks[blocks_per_page - 1];</div><div class='add'>+		args-&gt;last_block_in_bio = first_block + blocks_per_folio - 1;</div><div class='ctx'> out:</div><div class='del'>-	return args-&gt;bio;</div><div class='add'>+	return;</div><div class='ctx'> </div><div class='ctx'> confused:</div><div class='ctx'> 	if (args-&gt;bio)</div><div class='del'>-		args-&gt;bio = mpage_bio_submit(REQ_OP_READ, op_flags, args-&gt;bio);</div><div class='del'>-	if (!PageUptodate(page))</div><div class='del'>-		block_read_full_page(page, args-&gt;get_block);</div><div class='add'>+		args-&gt;bio = mpage_bio_submit_read(args-&gt;bio);</div><div class='add'>+	if (!folio_test_uptodate(folio))</div><div class='add'>+		block_read_full_folio(folio, args-&gt;get_block);</div><div class='ctx'> 	else</div><div class='del'>-		unlock_page(page);</div><div class='add'>+		folio_unlock(folio);</div><div class='ctx'> 	goto out;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -376,41 +358,46 @@ confused:</div><div class='ctx'>  */</div><div class='ctx'> void mpage_readahead(struct readahead_control *rac, get_block_t get_block)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	struct mpage_readpage_args args = {</div><div class='ctx'> 		.get_block = get_block,</div><div class='ctx'> 		.is_readahead = true,</div><div class='ctx'> 	};</div><div class='ctx'> </div><div class='del'>-	while ((page = readahead_page(rac))) {</div><div class='del'>-		prefetchw(&amp;page-&gt;flags);</div><div class='del'>-		args.page = page;</div><div class='add'>+	while ((folio = readahead_folio(rac))) {</div><div class='add'>+		prefetchw(&amp;folio-&gt;flags);</div><div class='add'>+		args.folio = folio;</div><div class='ctx'> 		args.nr_pages = readahead_count(rac);</div><div class='del'>-		args.bio = do_mpage_readpage(&amp;args);</div><div class='del'>-		put_page(page);</div><div class='add'>+		do_mpage_readpage(&amp;args);</div><div class='add'>+		/*</div><div class='add'>+		 * If read ahead failed synchronously, it may cause by removed</div><div class='add'>+		 * device, or some filesystem metadata error.</div><div class='add'>+		 */</div><div class='add'>+		if (!folio_test_locked(folio) &amp;&amp; !folio_test_uptodate(folio))</div><div class='add'>+			break;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (args.bio)</div><div class='del'>-		mpage_bio_submit(REQ_OP_READ, REQ_RAHEAD, args.bio);</div><div class='add'>+		mpage_bio_submit_read(args.bio);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(mpage_readahead);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * This isn't called much at all</div><div class='ctx'>  */</div><div class='del'>-int mpage_readpage(struct page *page, get_block_t get_block)</div><div class='add'>+int mpage_read_folio(struct folio *folio, get_block_t get_block)</div><div class='ctx'> {</div><div class='ctx'> 	struct mpage_readpage_args args = {</div><div class='del'>-		.page = page,</div><div class='del'>-		.nr_pages = 1,</div><div class='add'>+		.folio = folio,</div><div class='add'>+		.nr_pages = folio_nr_pages(folio),</div><div class='ctx'> 		.get_block = get_block,</div><div class='ctx'> 	};</div><div class='ctx'> </div><div class='del'>-	args.bio = do_mpage_readpage(&amp;args);</div><div class='add'>+	do_mpage_readpage(&amp;args);</div><div class='ctx'> 	if (args.bio)</div><div class='del'>-		mpage_bio_submit(REQ_OP_READ, 0, args.bio);</div><div class='add'>+		mpage_bio_submit_read(args.bio);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(mpage_readpage);</div><div class='add'>+EXPORT_SYMBOL(mpage_read_folio);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Writing is not so simple.</div><div class='hunk'>@@ -433,20 +420,19 @@ struct mpage_data {</div><div class='ctx'> 	struct bio *bio;</div><div class='ctx'> 	sector_t last_block_in_bio;</div><div class='ctx'> 	get_block_t *get_block;</div><div class='del'>-	unsigned use_writepage;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * We have our BIO, so we can now mark the buffers clean.  Make</div><div class='ctx'>  * sure to only clean buffers which we know we'll be writing.</div><div class='ctx'>  */</div><div class='del'>-static void clean_buffers(struct page *page, unsigned first_unmapped)</div><div class='add'>+static void clean_buffers(struct folio *folio, unsigned first_unmapped)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned buffer_counter = 0;</div><div class='del'>-	struct buffer_head *bh, *head;</div><div class='del'>-	if (!page_has_buffers(page))</div><div class='add'>+	struct buffer_head *bh, *head = folio_buffers(folio);</div><div class='add'>+</div><div class='add'>+	if (!head)</div><div class='ctx'> 		return;</div><div class='del'>-	head = page_buffers(page);</div><div class='ctx'> 	bh = head;</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='hunk'>@@ -458,50 +444,37 @@ static void clean_buffers(struct page *page, unsigned first_unmapped)</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * we cannot drop the bh if the page is not uptodate or a concurrent</div><div class='del'>-	 * readpage would fail to serialize with the bh and it would read from</div><div class='add'>+	 * read_folio would fail to serialize with the bh and it would read from</div><div class='ctx'> 	 * disk before we reach the platter.</div><div class='ctx'> 	 */</div><div class='del'>-	if (buffer_heads_over_limit &amp;&amp; PageUptodate(page))</div><div class='del'>-		try_to_free_buffers(page);</div><div class='add'>+	if (buffer_heads_over_limit &amp;&amp; folio_test_uptodate(folio))</div><div class='add'>+		try_to_free_buffers(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * For situations where we want to clean all buffers attached to a page.</div><div class='del'>- * We don't need to calculate how many buffers are attached to the page,</div><div class='del'>- * we just need to specify a number larger than the maximum number of buffers.</div><div class='del'>- */</div><div class='del'>-void clean_page_buffers(struct page *page)</div><div class='add'>+static int mpage_write_folio(struct writeback_control *wbc, struct folio *folio,</div><div class='add'>+		struct mpage_data *mpd)</div><div class='ctx'> {</div><div class='del'>-	clean_buffers(page, ~0U);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int __mpage_writepage(struct page *page, struct writeback_control *wbc,</div><div class='del'>-		      void *data)</div><div class='del'>-{</div><div class='del'>-	struct mpage_data *mpd = data;</div><div class='ctx'> 	struct bio *bio = mpd-&gt;bio;</div><div class='del'>-	struct address_space *mapping = page-&gt;mapping;</div><div class='del'>-	struct inode *inode = page-&gt;mapping-&gt;host;</div><div class='add'>+	struct address_space *mapping = folio-&gt;mapping;</div><div class='add'>+	struct inode *inode = mapping-&gt;host;</div><div class='ctx'> 	const unsigned blkbits = inode-&gt;i_blkbits;</div><div class='del'>-	unsigned long end_index;</div><div class='del'>-	const unsigned blocks_per_page = PAGE_SIZE &gt;&gt; blkbits;</div><div class='add'>+	const unsigned blocks_per_folio = folio_size(folio) &gt;&gt; blkbits;</div><div class='ctx'> 	sector_t last_block;</div><div class='ctx'> 	sector_t block_in_file;</div><div class='del'>-	sector_t blocks[MAX_BUF_PER_PAGE];</div><div class='add'>+	sector_t first_block;</div><div class='ctx'> 	unsigned page_block;</div><div class='del'>-	unsigned first_unmapped = blocks_per_page;</div><div class='add'>+	unsigned first_unmapped = blocks_per_folio;</div><div class='ctx'> 	struct block_device *bdev = NULL;</div><div class='ctx'> 	int boundary = 0;</div><div class='ctx'> 	sector_t boundary_block = 0;</div><div class='ctx'> 	struct block_device *boundary_bdev = NULL;</div><div class='del'>-	int length;</div><div class='add'>+	size_t length;</div><div class='ctx'> 	struct buffer_head map_bh;</div><div class='ctx'> 	loff_t i_size = i_size_read(inode);</div><div class='ctx'> 	int ret = 0;</div><div class='del'>-	int op_flags = wbc_to_write_flags(wbc);</div><div class='add'>+	struct buffer_head *head = folio_buffers(folio);</div><div class='ctx'> </div><div class='del'>-	if (page_has_buffers(page)) {</div><div class='del'>-		struct buffer_head *head = page_buffers(page);</div><div class='add'>+	if (head) {</div><div class='ctx'> 		struct buffer_head *bh = head;</div><div class='ctx'> </div><div class='ctx'> 		/* If they're all mapped and dirty, do it */</div><div class='hunk'>@@ -511,25 +484,27 @@ static int __mpage_writepage(struct page *page, struct writeback_control *wbc,</div><div class='ctx'> 			if (!buffer_mapped(bh)) {</div><div class='ctx'> 				/*</div><div class='ctx'> 				 * unmapped dirty buffers are created by</div><div class='del'>-				 * __set_page_dirty_buffers -&gt; mmapped data</div><div class='add'>+				 * block_dirty_folio -&gt; mmapped data</div><div class='ctx'> 				 */</div><div class='ctx'> 				if (buffer_dirty(bh))</div><div class='ctx'> 					goto confused;</div><div class='del'>-				if (first_unmapped == blocks_per_page)</div><div class='add'>+				if (first_unmapped == blocks_per_folio)</div><div class='ctx'> 					first_unmapped = page_block;</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='del'>-			if (first_unmapped != blocks_per_page)</div><div class='add'>+			if (first_unmapped != blocks_per_folio)</div><div class='ctx'> 				goto confused;	/* hole -&gt; non-hole */</div><div class='ctx'> </div><div class='ctx'> 			if (!buffer_dirty(bh) || !buffer_uptodate(bh))</div><div class='ctx'> 				goto confused;</div><div class='ctx'> 			if (page_block) {</div><div class='del'>-				if (bh-&gt;b_blocknr != blocks[page_block-1] + 1)</div><div class='add'>+				if (bh-&gt;b_blocknr != first_block + page_block)</div><div class='ctx'> 					goto confused;</div><div class='add'>+			} else {</div><div class='add'>+				first_block = bh-&gt;b_blocknr;</div><div class='ctx'> 			}</div><div class='del'>-			blocks[page_block++] = bh-&gt;b_blocknr;</div><div class='add'>+			page_block++;</div><div class='ctx'> 			boundary = buffer_boundary(bh);</div><div class='ctx'> 			if (boundary) {</div><div class='ctx'> 				boundary_block = bh-&gt;b_blocknr;</div><div class='hunk'>@@ -544,7 +519,7 @@ static int __mpage_writepage(struct page *page, struct writeback_control *wbc,</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Page has buffers, but they are all unmapped. The page was</div><div class='ctx'> 		 * created by pagein or read over a hole which was handled by</div><div class='del'>-		 * block_read_full_page().  If this address_space is also</div><div class='add'>+		 * block_read_full_folio().  If this address_space is also</div><div class='ctx'> 		 * using mpage_readahead then this can rarely happen.</div><div class='ctx'> 		 */</div><div class='ctx'> 		goto confused;</div><div class='hunk'>@@ -553,16 +528,24 @@ static int __mpage_writepage(struct page *page, struct writeback_control *wbc,</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The page has no buffers: map it to disk</div><div class='ctx'> 	 */</div><div class='del'>-	BUG_ON(!PageUptodate(page));</div><div class='del'>-	block_in_file = (sector_t)page-&gt;index &lt;&lt; (PAGE_SHIFT - blkbits);</div><div class='add'>+	BUG_ON(!folio_test_uptodate(folio));</div><div class='add'>+	block_in_file = folio_pos(folio) &gt;&gt; blkbits;</div><div class='add'>+	/*</div><div class='add'>+	 * Whole page beyond EOF? Skip allocating blocks to avoid leaking</div><div class='add'>+	 * space.</div><div class='add'>+	 */</div><div class='add'>+	if (block_in_file &gt;= (i_size + (1 &lt;&lt; blkbits) - 1) &gt;&gt; blkbits)</div><div class='add'>+		goto page_is_mapped;</div><div class='ctx'> 	last_block = (i_size - 1) &gt;&gt; blkbits;</div><div class='del'>-	map_bh.b_page = page;</div><div class='del'>-	for (page_block = 0; page_block &lt; blocks_per_page; ) {</div><div class='add'>+	map_bh.b_folio = folio;</div><div class='add'>+	for (page_block = 0; page_block &lt; blocks_per_folio; ) {</div><div class='ctx'> </div><div class='ctx'> 		map_bh.b_state = 0;</div><div class='ctx'> 		map_bh.b_size = 1 &lt;&lt; blkbits;</div><div class='ctx'> 		if (mpd-&gt;get_block(inode, block_in_file, &amp;map_bh, 1))</div><div class='ctx'> 			goto confused;</div><div class='add'>+		if (!buffer_mapped(&amp;map_bh))</div><div class='add'>+			goto confused;</div><div class='ctx'> 		if (buffer_new(&amp;map_bh))</div><div class='ctx'> 			clean_bdev_bh_alias(&amp;map_bh);</div><div class='ctx'> 		if (buffer_boundary(&amp;map_bh)) {</div><div class='hunk'>@@ -570,10 +553,12 @@ static int __mpage_writepage(struct page *page, struct writeback_control *wbc,</div><div class='ctx'> 			boundary_bdev = map_bh.b_bdev;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (page_block) {</div><div class='del'>-			if (map_bh.b_blocknr != blocks[page_block-1] + 1)</div><div class='add'>+			if (map_bh.b_blocknr != first_block + page_block)</div><div class='ctx'> 				goto confused;</div><div class='add'>+		} else {</div><div class='add'>+			first_block = map_bh.b_blocknr;</div><div class='ctx'> 		}</div><div class='del'>-		blocks[page_block++] = map_bh.b_blocknr;</div><div class='add'>+		page_block++;</div><div class='ctx'> 		boundary = buffer_boundary(&amp;map_bh);</div><div class='ctx'> 		bdev = map_bh.b_bdev;</div><div class='ctx'> 		if (block_in_file == last_block)</div><div class='hunk'>@@ -585,8 +570,11 @@ static int __mpage_writepage(struct page *page, struct writeback_control *wbc,</div><div class='ctx'> 	first_unmapped = page_block;</div><div class='ctx'> </div><div class='ctx'> page_is_mapped:</div><div class='del'>-	end_index = i_size &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	if (page-&gt;index &gt;= end_index) {</div><div class='add'>+	/* Don't bother writing beyond EOF, truncate will discard the folio */</div><div class='add'>+	if (folio_pos(folio) &gt;= i_size)</div><div class='add'>+		goto confused;</div><div class='add'>+	length = folio_size(folio);</div><div class='add'>+	if (folio_pos(folio) + length &gt; i_size) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * The page straddles i_size.  It must be zeroed out on each</div><div class='ctx'> 		 * and every writepage invocation because it may be mmapped.</div><div class='hunk'>@@ -595,31 +583,22 @@ page_is_mapped:</div><div class='ctx'> 		 * is zeroed when mapped, and writes to that region are not</div><div class='ctx'> 		 * written out to the file."</div><div class='ctx'> 		 */</div><div class='del'>-		unsigned offset = i_size &amp; (PAGE_SIZE - 1);</div><div class='del'>-</div><div class='del'>-		if (page-&gt;index &gt; end_index || !offset)</div><div class='del'>-			goto confused;</div><div class='del'>-		zero_user_segment(page, offset, PAGE_SIZE);</div><div class='add'>+		length = i_size - folio_pos(folio);</div><div class='add'>+		folio_zero_segment(folio, length, folio_size(folio));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * This page will go to BIO.  Do we need to send this BIO off first?</div><div class='ctx'> 	 */</div><div class='del'>-	if (bio &amp;&amp; mpd-&gt;last_block_in_bio != blocks[0] - 1)</div><div class='del'>-		bio = mpage_bio_submit(REQ_OP_WRITE, op_flags, bio);</div><div class='add'>+	if (bio &amp;&amp; mpd-&gt;last_block_in_bio != first_block - 1)</div><div class='add'>+		bio = mpage_bio_submit_write(bio);</div><div class='ctx'> </div><div class='ctx'> alloc_new:</div><div class='ctx'> 	if (bio == NULL) {</div><div class='del'>-		if (first_unmapped == blocks_per_page) {</div><div class='del'>-			if (!bdev_write_page(bdev, blocks[0] &lt;&lt; (blkbits - 9),</div><div class='del'>-								page, wbc))</div><div class='del'>-				goto out;</div><div class='del'>-		}</div><div class='del'>-		bio = mpage_alloc(bdev, blocks[0] &lt;&lt; (blkbits - 9),</div><div class='del'>-				BIO_MAX_VECS, GFP_NOFS|__GFP_HIGH);</div><div class='del'>-		if (bio == NULL)</div><div class='del'>-			goto confused;</div><div class='del'>-</div><div class='add'>+		bio = bio_alloc(bdev, BIO_MAX_VECS,</div><div class='add'>+				REQ_OP_WRITE | wbc_to_write_flags(wbc),</div><div class='add'>+				GFP_NOFS);</div><div class='add'>+		bio-&gt;bi_iter.bi_sector = first_block &lt;&lt; (blkbits - 9);</div><div class='ctx'> 		wbc_init_bio(wbc, bio);</div><div class='ctx'> 		bio-&gt;bi_write_hint = inode-&gt;i_write_hint;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -629,42 +608,37 @@ alloc_new:</div><div class='ctx'> 	 * the confused fail path above (OOM) will be very confused when</div><div class='ctx'> 	 * it finds all bh marked clean (i.e. it will not write anything)</div><div class='ctx'> 	 */</div><div class='del'>-	wbc_account_cgroup_owner(wbc, page, PAGE_SIZE);</div><div class='add'>+	wbc_account_cgroup_owner(wbc, folio, folio_size(folio));</div><div class='ctx'> 	length = first_unmapped &lt;&lt; blkbits;</div><div class='del'>-	if (bio_add_page(bio, page, length, 0) &lt; length) {</div><div class='del'>-		bio = mpage_bio_submit(REQ_OP_WRITE, op_flags, bio);</div><div class='add'>+	if (!bio_add_folio(bio, folio, length, 0)) {</div><div class='add'>+		bio = mpage_bio_submit_write(bio);</div><div class='ctx'> 		goto alloc_new;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	clean_buffers(page, first_unmapped);</div><div class='add'>+	clean_buffers(folio, first_unmapped);</div><div class='ctx'> </div><div class='del'>-	BUG_ON(PageWriteback(page));</div><div class='del'>-	set_page_writeback(page);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	if (boundary || (first_unmapped != blocks_per_page)) {</div><div class='del'>-		bio = mpage_bio_submit(REQ_OP_WRITE, op_flags, bio);</div><div class='add'>+	BUG_ON(folio_test_writeback(folio));</div><div class='add'>+	folio_start_writeback(folio);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	if (boundary || (first_unmapped != blocks_per_folio)) {</div><div class='add'>+		bio = mpage_bio_submit_write(bio);</div><div class='ctx'> 		if (boundary_block) {</div><div class='ctx'> 			write_boundary_block(boundary_bdev,</div><div class='ctx'> 					boundary_block, 1 &lt;&lt; blkbits);</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='del'>-		mpd-&gt;last_block_in_bio = blocks[blocks_per_page - 1];</div><div class='add'>+		mpd-&gt;last_block_in_bio = first_block + blocks_per_folio - 1;</div><div class='ctx'> 	}</div><div class='ctx'> 	goto out;</div><div class='ctx'> </div><div class='ctx'> confused:</div><div class='ctx'> 	if (bio)</div><div class='del'>-		bio = mpage_bio_submit(REQ_OP_WRITE, op_flags, bio);</div><div class='add'>+		bio = mpage_bio_submit_write(bio);</div><div class='ctx'> </div><div class='del'>-	if (mpd-&gt;use_writepage) {</div><div class='del'>-		ret = mapping-&gt;a_ops-&gt;writepage(page, wbc);</div><div class='del'>-	} else {</div><div class='del'>-		ret = -EAGAIN;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The caller has a ref on the inode, so *mapping is stable</div><div class='ctx'> 	 */</div><div class='add'>+	ret = block_write_full_folio(folio, wbc, mpd-&gt;get_block);</div><div class='ctx'> 	mapping_set_error(mapping, ret);</div><div class='ctx'> out:</div><div class='ctx'> 	mpd-&gt;bio = bio;</div><div class='hunk'>@@ -676,66 +650,27 @@ out:</div><div class='ctx'>  * @mapping: address space structure to write</div><div class='ctx'>  * @wbc: subtract the number of written pages from *@wbc-&gt;nr_to_write</div><div class='ctx'>  * @get_block: the filesystem's block mapper function.</div><div class='del'>- *             If this is NULL then use a_ops-&gt;writepage.  Otherwise, go</div><div class='del'>- *             direct-to-BIO.</div><div class='ctx'>  *</div><div class='ctx'>  * This is a library function, which implements the writepages()</div><div class='ctx'>  * address_space_operation.</div><div class='del'>- *</div><div class='del'>- * If a page is already under I/O, generic_writepages() skips it, even</div><div class='del'>- * if it's dirty.  This is desirable behaviour for memory-cleaning writeback,</div><div class='del'>- * but it is INCORRECT for data-integrity system calls such as fsync().  fsync()</div><div class='del'>- * and msync() need to guarantee that all the data which was dirty at the time</div><div class='del'>- * the call was made get new I/O started against them.  If wbc-&gt;sync_mode is</div><div class='del'>- * WB_SYNC_ALL then we were called for data integrity and we must wait for</div><div class='del'>- * existing IO to complete.</div><div class='ctx'>  */</div><div class='ctx'> int</div><div class='ctx'> mpage_writepages(struct address_space *mapping,</div><div class='ctx'> 		struct writeback_control *wbc, get_block_t get_block)</div><div class='ctx'> {</div><div class='add'>+	struct mpage_data mpd = {</div><div class='add'>+		.get_block	= get_block,</div><div class='add'>+	};</div><div class='add'>+	struct folio *folio = NULL;</div><div class='ctx'> 	struct blk_plug plug;</div><div class='del'>-	int ret;</div><div class='add'>+	int error;</div><div class='ctx'> </div><div class='ctx'> 	blk_start_plug(&amp;plug);</div><div class='del'>-</div><div class='del'>-	if (!get_block)</div><div class='del'>-		ret = generic_writepages(mapping, wbc);</div><div class='del'>-	else {</div><div class='del'>-		struct mpage_data mpd = {</div><div class='del'>-			.bio = NULL,</div><div class='del'>-			.last_block_in_bio = 0,</div><div class='del'>-			.get_block = get_block,</div><div class='del'>-			.use_writepage = 1,</div><div class='del'>-		};</div><div class='del'>-</div><div class='del'>-		ret = write_cache_pages(mapping, wbc, __mpage_writepage, &amp;mpd);</div><div class='del'>-		if (mpd.bio) {</div><div class='del'>-			int op_flags = (wbc-&gt;sync_mode == WB_SYNC_ALL ?</div><div class='del'>-				  REQ_SYNC : 0);</div><div class='del'>-			mpage_bio_submit(REQ_OP_WRITE, op_flags, mpd.bio);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	while ((folio = writeback_iter(mapping, wbc, folio, &amp;error)))</div><div class='add'>+		error = mpage_write_folio(wbc, folio, &amp;mpd);</div><div class='add'>+	if (mpd.bio)</div><div class='add'>+		mpage_bio_submit_write(mpd.bio);</div><div class='ctx'> 	blk_finish_plug(&amp;plug);</div><div class='del'>-	return ret;</div><div class='add'>+	return error;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(mpage_writepages);</div><div class='del'>-</div><div class='del'>-int mpage_writepage(struct page *page, get_block_t get_block,</div><div class='del'>-	struct writeback_control *wbc)</div><div class='del'>-{</div><div class='del'>-	struct mpage_data mpd = {</div><div class='del'>-		.bio = NULL,</div><div class='del'>-		.last_block_in_bio = 0,</div><div class='del'>-		.get_block = get_block,</div><div class='del'>-		.use_writepage = 0,</div><div class='del'>-	};</div><div class='del'>-	int ret = __mpage_writepage(page, wbc, &amp;mpd);</div><div class='del'>-	if (mpd.bio) {</div><div class='del'>-		int op_flags = (wbc-&gt;sync_mode == WB_SYNC_ALL ?</div><div class='del'>-			  REQ_SYNC : 0);</div><div class='del'>-		mpage_bio_submit(REQ_OP_WRITE, op_flags, mpd.bio);</div><div class='del'>-	}</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(mpage_writepage);</div><div class='head'>diff --git a/fs/namei.c b/fs/namei.c<br/>index 1f9d2187c765..bf0f66f0e9b9 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/namei.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/namei.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/namei.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/namei.c</a></div><div class='hunk'>@@ -17,15 +17,16 @@</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/init.h&gt;</div><div class='ctx'> #include &lt;linux/export.h&gt;</div><div class='del'>-#include &lt;linux/kernel.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='add'>+#include &lt;linux/wordpart.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/filelock.h&gt;</div><div class='ctx'> #include &lt;linux/namei.h&gt;</div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='add'>+#include &lt;linux/sched/mm.h&gt;</div><div class='ctx'> #include &lt;linux/fsnotify.h&gt;</div><div class='ctx'> #include &lt;linux/personality.h&gt;</div><div class='ctx'> #include &lt;linux/security.h&gt;</div><div class='del'>-#include &lt;linux/ima.h&gt;</div><div class='ctx'> #include &lt;linux/syscalls.h&gt;</div><div class='ctx'> #include &lt;linux/mount.h&gt;</div><div class='ctx'> #include &lt;linux/audit.h&gt;</div><div class='hunk'>@@ -124,8 +125,15 @@</div><div class='ctx'> </div><div class='ctx'> #define EMBEDDED_NAME_MAX	(PATH_MAX - offsetof(struct filename, iname))</div><div class='ctx'> </div><div class='add'>+static inline void initname(struct filename *name, const char __user *uptr)</div><div class='add'>+{</div><div class='add'>+	name-&gt;uptr = uptr;</div><div class='add'>+	name-&gt;aname = NULL;</div><div class='add'>+	atomic_set(&amp;name-&gt;refcnt, 1);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> struct filename *</div><div class='del'>-getname_flags(const char __user *filename, int flags, int *empty)</div><div class='add'>+getname_flags(const char __user *filename, int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct filename *result;</div><div class='ctx'> 	char *kname;</div><div class='hunk'>@@ -147,9 +155,20 @@ getname_flags(const char __user *filename, int flags, int *empty)</div><div class='ctx'> 	result-&gt;name = kname;</div><div class='ctx'> </div><div class='ctx'> 	len = strncpy_from_user(kname, filename, EMBEDDED_NAME_MAX);</div><div class='del'>-	if (unlikely(len &lt; 0)) {</div><div class='del'>-		__putname(result);</div><div class='del'>-		return ERR_PTR(len);</div><div class='add'>+	/*</div><div class='add'>+	 * Handle both empty path and copy failure in one go.</div><div class='add'>+	 */</div><div class='add'>+	if (unlikely(len &lt;= 0)) {</div><div class='add'>+		if (unlikely(len &lt; 0)) {</div><div class='add'>+			__putname(result);</div><div class='add'>+			return ERR_PTR(len);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* The empty path is special. */</div><div class='add'>+		if (!(flags &amp; LOOKUP_EMPTY)) {</div><div class='add'>+			__putname(result);</div><div class='add'>+			return ERR_PTR(-ENOENT);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -179,46 +198,50 @@ getname_flags(const char __user *filename, int flags, int *empty)</div><div class='ctx'> 			kfree(result);</div><div class='ctx'> 			return ERR_PTR(len);</div><div class='ctx'> 		}</div><div class='add'>+		/* The empty path is special. */</div><div class='add'>+		if (unlikely(!len) &amp;&amp; !(flags &amp; LOOKUP_EMPTY)) {</div><div class='add'>+			__putname(kname);</div><div class='add'>+			kfree(result);</div><div class='add'>+			return ERR_PTR(-ENOENT);</div><div class='add'>+		}</div><div class='ctx'> 		if (unlikely(len == PATH_MAX)) {</div><div class='ctx'> 			__putname(kname);</div><div class='ctx'> 			kfree(result);</div><div class='ctx'> 			return ERR_PTR(-ENAMETOOLONG);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	result-&gt;refcnt = 1;</div><div class='del'>-	/* The empty path is special. */</div><div class='del'>-	if (unlikely(!len)) {</div><div class='del'>-		if (empty)</div><div class='del'>-			*empty = 1;</div><div class='del'>-		if (!(flags &amp; LOOKUP_EMPTY)) {</div><div class='del'>-			putname(result);</div><div class='del'>-			return ERR_PTR(-ENOENT);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	result-&gt;uptr = filename;</div><div class='del'>-	result-&gt;aname = NULL;</div><div class='add'>+	initname(result, filename);</div><div class='ctx'> 	audit_getname(result);</div><div class='ctx'> 	return result;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct filename *</div><div class='del'>-getname_uflags(const char __user *filename, int uflags)</div><div class='add'>+struct filename *getname_uflags(const char __user *filename, int uflags)</div><div class='ctx'> {</div><div class='ctx'> 	int flags = (uflags &amp; AT_EMPTY_PATH) ? LOOKUP_EMPTY : 0;</div><div class='ctx'> </div><div class='del'>-	return getname_flags(filename, flags, NULL);</div><div class='add'>+	return getname_flags(filename, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct filename *</div><div class='del'>-getname(const char __user * filename)</div><div class='add'>+struct filename *__getname_maybe_null(const char __user *pathname)</div><div class='ctx'> {</div><div class='del'>-	return getname_flags(filename, 0, NULL);</div><div class='add'>+	struct filename *name;</div><div class='add'>+	char c;</div><div class='add'>+</div><div class='add'>+	/* try to save on allocations; loss on um, though */</div><div class='add'>+	if (get_user(c, pathname))</div><div class='add'>+		return ERR_PTR(-EFAULT);</div><div class='add'>+	if (!c)</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	name = getname_flags(pathname, LOOKUP_EMPTY);</div><div class='add'>+	if (!IS_ERR(name) &amp;&amp; !(name-&gt;name[0])) {</div><div class='add'>+		putname(name);</div><div class='add'>+		name = NULL;</div><div class='add'>+	}</div><div class='add'>+	return name;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct filename *</div><div class='del'>-getname_kernel(const char * filename)</div><div class='add'>+struct filename *getname_kernel(const char * filename)</div><div class='ctx'> {</div><div class='ctx'> 	struct filename *result;</div><div class='ctx'> 	int len = strlen(filename) + 1;</div><div class='hunk'>@@ -245,34 +268,39 @@ getname_kernel(const char * filename)</div><div class='ctx'> 		return ERR_PTR(-ENAMETOOLONG);</div><div class='ctx'> 	}</div><div class='ctx'> 	memcpy((char *)result-&gt;name, filename, len);</div><div class='del'>-	result-&gt;uptr = NULL;</div><div class='del'>-	result-&gt;aname = NULL;</div><div class='del'>-	result-&gt;refcnt = 1;</div><div class='add'>+	initname(result, NULL);</div><div class='ctx'> 	audit_getname(result);</div><div class='del'>-</div><div class='ctx'> 	return result;</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL(getname_kernel);</div><div class='ctx'> </div><div class='ctx'> void putname(struct filename *name)</div><div class='ctx'> {</div><div class='del'>-	if (IS_ERR(name))</div><div class='add'>+	int refcnt;</div><div class='add'>+</div><div class='add'>+	if (IS_ERR_OR_NULL(name))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(name-&gt;refcnt &lt;= 0);</div><div class='add'>+	refcnt = atomic_read(&amp;name-&gt;refcnt);</div><div class='add'>+	if (unlikely(refcnt != 1)) {</div><div class='add'>+		if (WARN_ON_ONCE(!refcnt))</div><div class='add'>+			return;</div><div class='ctx'> </div><div class='del'>-	if (--name-&gt;refcnt &gt; 0)</div><div class='del'>-		return;</div><div class='add'>+		if (!atomic_dec_and_test(&amp;name-&gt;refcnt))</div><div class='add'>+			return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (name-&gt;name != name-&gt;iname) {</div><div class='add'>+	if (unlikely(name-&gt;name != name-&gt;iname)) {</div><div class='ctx'> 		__putname(name-&gt;name);</div><div class='ctx'> 		kfree(name);</div><div class='ctx'> 	} else</div><div class='ctx'> 		__putname(name);</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL(putname);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * check_acl - perform ACL permission checking</div><div class='del'>- * @mnt_userns:	user namespace of the mount the inode was found from</div><div class='add'>+ * @idmap:	idmap of the mount the inode was found from</div><div class='ctx'>  * @inode:	inode to check permissions on</div><div class='ctx'>  * @mask:	right to check for (%MAY_READ, %MAY_WRITE, %MAY_EXEC ...)</div><div class='ctx'>  *</div><div class='hunk'>@@ -280,13 +308,13 @@ void putname(struct filename *name)</div><div class='ctx'>  * retrieve POSIX acls it needs to know whether it is called from a blocking or</div><div class='ctx'>  * non-blocking context and thus cares about the MAY_NOT_BLOCK bit.</div><div class='ctx'>  *</div><div class='del'>- * If the inode has been found through an idmapped mount the user namespace of</div><div class='del'>- * the vfsmount must be passed through @mnt_userns. This function will then take</div><div class='del'>- * care to map the inode according to @mnt_userns before checking permissions.</div><div class='add'>+ * If the inode has been found through an idmapped mount the idmap of</div><div class='add'>+ * the vfsmount must be passed through @idmap. This function will then take</div><div class='add'>+ * care to map the inode according to @idmap before checking permissions.</div><div class='ctx'>  * On non-idmapped mounts or if permission checking is to be performed on the</div><div class='del'>- * raw inode simply passs init_user_ns.</div><div class='add'>+ * raw inode simply pass @nop_mnt_idmap.</div><div class='ctx'>  */</div><div class='del'>-static int check_acl(struct user_namespace *mnt_userns,</div><div class='add'>+static int check_acl(struct mnt_idmap *idmap,</div><div class='ctx'> 		     struct inode *inode, int mask)</div><div class='ctx'> {</div><div class='ctx'> #ifdef CONFIG_FS_POSIX_ACL</div><div class='hunk'>@@ -296,17 +324,17 @@ static int check_acl(struct user_namespace *mnt_userns,</div><div class='ctx'> 		acl = get_cached_acl_rcu(inode, ACL_TYPE_ACCESS);</div><div class='ctx'> 	        if (!acl)</div><div class='ctx'> 	                return -EAGAIN;</div><div class='del'>-		/* no -&gt;get_acl() calls in RCU mode... */</div><div class='add'>+		/* no -&gt;get_inode_acl() calls in RCU mode... */</div><div class='ctx'> 		if (is_uncached_acl(acl))</div><div class='ctx'> 			return -ECHILD;</div><div class='del'>-	        return posix_acl_permission(mnt_userns, inode, acl, mask);</div><div class='add'>+	        return posix_acl_permission(idmap, inode, acl, mask);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	acl = get_acl(inode, ACL_TYPE_ACCESS);</div><div class='add'>+	acl = get_inode_acl(inode, ACL_TYPE_ACCESS);</div><div class='ctx'> 	if (IS_ERR(acl))</div><div class='ctx'> 		return PTR_ERR(acl);</div><div class='ctx'> 	if (acl) {</div><div class='del'>-	        int error = posix_acl_permission(mnt_userns, inode, acl, mask);</div><div class='add'>+	        int error = posix_acl_permission(idmap, inode, acl, mask);</div><div class='ctx'> 	        posix_acl_release(acl);</div><div class='ctx'> 	        return error;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -315,9 +343,28 @@ static int check_acl(struct user_namespace *mnt_userns,</div><div class='ctx'> 	return -EAGAIN;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Very quick optimistic "we know we have no ACL's" check.</div><div class='add'>+ *</div><div class='add'>+ * Note that this is purely for ACL_TYPE_ACCESS, and purely</div><div class='add'>+ * for the "we have cached that there are no ACLs" case.</div><div class='add'>+ *</div><div class='add'>+ * If this returns true, we know there are no ACLs. But if</div><div class='add'>+ * it returns false, we might still not have ACLs (it could</div><div class='add'>+ * be the is_uncached_acl() case).</div><div class='add'>+ */</div><div class='add'>+static inline bool no_acl_inode(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+#ifdef CONFIG_FS_POSIX_ACL</div><div class='add'>+	return likely(!READ_ONCE(inode-&gt;i_acl));</div><div class='add'>+#else</div><div class='add'>+	return true;</div><div class='add'>+#endif</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /**</div><div class='ctx'>  * acl_permission_check - perform basic UNIX permission checking</div><div class='del'>- * @mnt_userns:	user namespace of the mount the inode was found from</div><div class='add'>+ * @idmap:	idmap of the mount the inode was found from</div><div class='ctx'>  * @inode:	inode to check permissions on</div><div class='ctx'>  * @mask:	right to check for (%MAY_READ, %MAY_WRITE, %MAY_EXEC ...)</div><div class='ctx'>  *</div><div class='hunk'>@@ -325,21 +372,43 @@ static int check_acl(struct user_namespace *mnt_userns,</div><div class='ctx'>  * function may retrieve POSIX acls it needs to know whether it is called from a</div><div class='ctx'>  * blocking or non-blocking context and thus cares about the MAY_NOT_BLOCK bit.</div><div class='ctx'>  *</div><div class='del'>- * If the inode has been found through an idmapped mount the user namespace of</div><div class='del'>- * the vfsmount must be passed through @mnt_userns. This function will then take</div><div class='del'>- * care to map the inode according to @mnt_userns before checking permissions.</div><div class='add'>+ * If the inode has been found through an idmapped mount the idmap of</div><div class='add'>+ * the vfsmount must be passed through @idmap. This function will then take</div><div class='add'>+ * care to map the inode according to @idmap before checking permissions.</div><div class='ctx'>  * On non-idmapped mounts or if permission checking is to be performed on the</div><div class='del'>- * raw inode simply passs init_user_ns.</div><div class='add'>+ * raw inode simply pass @nop_mnt_idmap.</div><div class='ctx'>  */</div><div class='del'>-static int acl_permission_check(struct user_namespace *mnt_userns,</div><div class='add'>+static int acl_permission_check(struct mnt_idmap *idmap,</div><div class='ctx'> 				struct inode *inode, int mask)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int mode = inode-&gt;i_mode;</div><div class='del'>-	kuid_t i_uid;</div><div class='add'>+	vfsuid_t vfsuid;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Common cheap case: everybody has the requested</div><div class='add'>+	 * rights, and there are no ACLs to check. No need</div><div class='add'>+	 * to do any owner/group checks in that case.</div><div class='add'>+	 *</div><div class='add'>+	 *  - 'mask&amp;7' is the requested permission bit set</div><div class='add'>+	 *  - multiplying by 0111 spreads them out to all of ugo</div><div class='add'>+	 *  - '&amp; ~mode' looks for missing inode permission bits</div><div class='add'>+	 *  - the '!' is for "no missing permissions"</div><div class='add'>+	 *</div><div class='add'>+	 * After that, we just need to check that there are no</div><div class='add'>+	 * ACL's on the inode - do the 'IS_POSIXACL()' check last</div><div class='add'>+	 * because it will dereference the -&gt;i_sb pointer and we</div><div class='add'>+	 * want to avoid that if at all possible.</div><div class='add'>+	 */</div><div class='add'>+	if (!((mask &amp; 7) * 0111 &amp; ~mode)) {</div><div class='add'>+		if (no_acl_inode(inode))</div><div class='add'>+			return 0;</div><div class='add'>+		if (!IS_POSIXACL(inode))</div><div class='add'>+			return 0;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* Are we the owner? If so, ACL's don't matter */</div><div class='del'>-	i_uid = i_uid_into_mnt(mnt_userns, inode);</div><div class='del'>-	if (likely(uid_eq(current_fsuid(), i_uid))) {</div><div class='add'>+	vfsuid = i_uid_into_vfsuid(idmap, inode);</div><div class='add'>+	if (likely(vfsuid_eq_kuid(vfsuid, current_fsuid()))) {</div><div class='ctx'> 		mask &amp;= 7;</div><div class='ctx'> 		mode &gt;&gt;= 6;</div><div class='ctx'> 		return (mask &amp; ~mode) ? -EACCES : 0;</div><div class='hunk'>@@ -347,7 +416,7 @@ static int acl_permission_check(struct user_namespace *mnt_userns,</div><div class='ctx'> </div><div class='ctx'> 	/* Do we have ACL's? */</div><div class='ctx'> 	if (IS_POSIXACL(inode) &amp;&amp; (mode &amp; S_IRWXG)) {</div><div class='del'>-		int error = check_acl(mnt_userns, inode, mask);</div><div class='add'>+		int error = check_acl(idmap, inode, mask);</div><div class='ctx'> 		if (error != -EAGAIN)</div><div class='ctx'> 			return error;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -361,8 +430,8 @@ static int acl_permission_check(struct user_namespace *mnt_userns,</div><div class='ctx'> 	 * about? Need to check group ownership if so.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (mask &amp; (mode ^ (mode &gt;&gt; 3))) {</div><div class='del'>-		kgid_t kgid = i_gid_into_mnt(mnt_userns, inode);</div><div class='del'>-		if (in_group_p(kgid))</div><div class='add'>+		vfsgid_t vfsgid = i_gid_into_vfsgid(idmap, inode);</div><div class='add'>+		if (vfsgid_in_group_p(vfsgid))</div><div class='ctx'> 			mode &gt;&gt;= 3;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -372,7 +441,7 @@ static int acl_permission_check(struct user_namespace *mnt_userns,</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * generic_permission -  check for access rights on a Posix-like filesystem</div><div class='del'>- * @mnt_userns:	user namespace of the mount the inode was found from</div><div class='add'>+ * @idmap:	idmap of the mount the inode was found from</div><div class='ctx'>  * @inode:	inode to check access rights for</div><div class='ctx'>  * @mask:	right to check for (%MAY_READ, %MAY_WRITE, %MAY_EXEC,</div><div class='ctx'>  *		%MAY_NOT_BLOCK ...)</div><div class='hunk'>@@ -386,13 +455,13 @@ static int acl_permission_check(struct user_namespace *mnt_userns,</div><div class='ctx'>  * request cannot be satisfied (eg. requires blocking or too much complexity).</div><div class='ctx'>  * It would then be called again in ref-walk mode.</div><div class='ctx'>  *</div><div class='del'>- * If the inode has been found through an idmapped mount the user namespace of</div><div class='del'>- * the vfsmount must be passed through @mnt_userns. This function will then take</div><div class='del'>- * care to map the inode according to @mnt_userns before checking permissions.</div><div class='add'>+ * If the inode has been found through an idmapped mount the idmap of</div><div class='add'>+ * the vfsmount must be passed through @idmap. This function will then take</div><div class='add'>+ * care to map the inode according to @idmap before checking permissions.</div><div class='ctx'>  * On non-idmapped mounts or if permission checking is to be performed on the</div><div class='del'>- * raw inode simply passs init_user_ns.</div><div class='add'>+ * raw inode simply pass @nop_mnt_idmap.</div><div class='ctx'>  */</div><div class='del'>-int generic_permission(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='add'>+int generic_permission(struct mnt_idmap *idmap, struct inode *inode,</div><div class='ctx'> 		       int mask)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -400,17 +469,17 @@ int generic_permission(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Do the basic permission checks.</div><div class='ctx'> 	 */</div><div class='del'>-	ret = acl_permission_check(mnt_userns, inode, mask);</div><div class='add'>+	ret = acl_permission_check(idmap, inode, mask);</div><div class='ctx'> 	if (ret != -EACCES)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='ctx'> 	if (S_ISDIR(inode-&gt;i_mode)) {</div><div class='ctx'> 		/* DACs are overridable for directories */</div><div class='ctx'> 		if (!(mask &amp; MAY_WRITE))</div><div class='del'>-			if (capable_wrt_inode_uidgid(mnt_userns, inode,</div><div class='add'>+			if (capable_wrt_inode_uidgid(idmap, inode,</div><div class='ctx'> 						     CAP_DAC_READ_SEARCH))</div><div class='ctx'> 				return 0;</div><div class='del'>-		if (capable_wrt_inode_uidgid(mnt_userns, inode,</div><div class='add'>+		if (capable_wrt_inode_uidgid(idmap, inode,</div><div class='ctx'> 					     CAP_DAC_OVERRIDE))</div><div class='ctx'> 			return 0;</div><div class='ctx'> 		return -EACCES;</div><div class='hunk'>@@ -421,7 +490,7 @@ int generic_permission(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='ctx'> 	 */</div><div class='ctx'> 	mask &amp;= MAY_READ | MAY_WRITE | MAY_EXEC;</div><div class='ctx'> 	if (mask == MAY_READ)</div><div class='del'>-		if (capable_wrt_inode_uidgid(mnt_userns, inode,</div><div class='add'>+		if (capable_wrt_inode_uidgid(idmap, inode,</div><div class='ctx'> 					     CAP_DAC_READ_SEARCH))</div><div class='ctx'> 			return 0;</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -430,7 +499,7 @@ int generic_permission(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='ctx'> 	 * at least one exec bit set.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (!(mask &amp; MAY_EXEC) || (inode-&gt;i_mode &amp; S_IXUGO))</div><div class='del'>-		if (capable_wrt_inode_uidgid(mnt_userns, inode,</div><div class='add'>+		if (capable_wrt_inode_uidgid(idmap, inode,</div><div class='ctx'> 					     CAP_DAC_OVERRIDE))</div><div class='ctx'> 			return 0;</div><div class='ctx'> </div><div class='hunk'>@@ -440,7 +509,7 @@ EXPORT_SYMBOL(generic_permission);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * do_inode_permission - UNIX permission checking</div><div class='del'>- * @mnt_userns:	user namespace of the mount the inode was found from</div><div class='add'>+ * @idmap:	idmap of the mount the inode was found from</div><div class='ctx'>  * @inode:	inode to check permissions on</div><div class='ctx'>  * @mask:	right to check for (%MAY_READ, %MAY_WRITE, %MAY_EXEC ...)</div><div class='ctx'>  *</div><div class='hunk'>@@ -449,19 +518,19 @@ EXPORT_SYMBOL(generic_permission);</div><div class='ctx'>  * flag in inode-&gt;i_opflags, that says "this has not special</div><div class='ctx'>  * permission function, use the fast case".</div><div class='ctx'>  */</div><div class='del'>-static inline int do_inode_permission(struct user_namespace *mnt_userns,</div><div class='add'>+static inline int do_inode_permission(struct mnt_idmap *idmap,</div><div class='ctx'> 				      struct inode *inode, int mask)</div><div class='ctx'> {</div><div class='ctx'> 	if (unlikely(!(inode-&gt;i_opflags &amp; IOP_FASTPERM))) {</div><div class='ctx'> 		if (likely(inode-&gt;i_op-&gt;permission))</div><div class='del'>-			return inode-&gt;i_op-&gt;permission(mnt_userns, inode, mask);</div><div class='add'>+			return inode-&gt;i_op-&gt;permission(idmap, inode, mask);</div><div class='ctx'> </div><div class='ctx'> 		/* This gets set once for the inode lifetime */</div><div class='ctx'> 		spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 		inode-&gt;i_opflags |= IOP_FASTPERM;</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	}</div><div class='del'>-	return generic_permission(mnt_userns, inode, mask);</div><div class='add'>+	return generic_permission(idmap, inode, mask);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -471,10 +540,13 @@ static inline int do_inode_permission(struct user_namespace *mnt_userns,</div><div class='ctx'>  * @mask: Right to check for (%MAY_READ, %MAY_WRITE, %MAY_EXEC)</div><div class='ctx'>  *</div><div class='ctx'>  * Separate out file-system wide checks from inode-specific permission checks.</div><div class='add'>+ *</div><div class='add'>+ * Note: lookup_inode_permission_may_exec() does not call here. If you add</div><div class='add'>+ * MAY_EXEC checks, adjust it.</div><div class='ctx'>  */</div><div class='ctx'> static int sb_permission(struct super_block *sb, struct inode *inode, int mask)</div><div class='ctx'> {</div><div class='del'>-	if (unlikely(mask &amp; MAY_WRITE)) {</div><div class='add'>+	if (mask &amp; MAY_WRITE) {</div><div class='ctx'> 		umode_t mode = inode-&gt;i_mode;</div><div class='ctx'> </div><div class='ctx'> 		/* Nobody gets write access to a read-only fs. */</div><div class='hunk'>@@ -486,7 +558,7 @@ static int sb_permission(struct super_block *sb, struct inode *inode, int mask)</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * inode_permission - Check for access rights to a given inode</div><div class='del'>- * @mnt_userns:	User namespace of the mount the inode was found from</div><div class='add'>+ * @idmap:	idmap of the mount the inode was found from</div><div class='ctx'>  * @inode:	Inode to check permission on</div><div class='ctx'>  * @mask:	Right to check for (%MAY_READ, %MAY_WRITE, %MAY_EXEC)</div><div class='ctx'>  *</div><div class='hunk'>@@ -496,20 +568,20 @@ static int sb_permission(struct super_block *sb, struct inode *inode, int mask)</div><div class='ctx'>  *</div><div class='ctx'>  * When checking for MAY_APPEND, MAY_WRITE must also be set in @mask.</div><div class='ctx'>  */</div><div class='del'>-int inode_permission(struct user_namespace *mnt_userns,</div><div class='add'>+int inode_permission(struct mnt_idmap *idmap,</div><div class='ctx'> 		     struct inode *inode, int mask)</div><div class='ctx'> {</div><div class='ctx'> 	int retval;</div><div class='ctx'> </div><div class='ctx'> 	retval = sb_permission(inode-&gt;i_sb, inode, mask);</div><div class='del'>-	if (retval)</div><div class='add'>+	if (unlikely(retval))</div><div class='ctx'> 		return retval;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(mask &amp; MAY_WRITE)) {</div><div class='add'>+	if (mask &amp; MAY_WRITE) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Nobody gets write access to an immutable file.</div><div class='ctx'> 		 */</div><div class='del'>-		if (IS_IMMUTABLE(inode))</div><div class='add'>+		if (unlikely(IS_IMMUTABLE(inode)))</div><div class='ctx'> 			return -EPERM;</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='hunk'>@@ -517,22 +589,58 @@ int inode_permission(struct user_namespace *mnt_userns,</div><div class='ctx'> 		 * written back improperly if their true value is unknown</div><div class='ctx'> 		 * to the vfs.</div><div class='ctx'> 		 */</div><div class='del'>-		if (HAS_UNMAPPED_ID(mnt_userns, inode))</div><div class='add'>+		if (unlikely(HAS_UNMAPPED_ID(idmap, inode)))</div><div class='ctx'> 			return -EACCES;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	retval = do_inode_permission(mnt_userns, inode, mask);</div><div class='del'>-	if (retval)</div><div class='add'>+	retval = do_inode_permission(idmap, inode, mask);</div><div class='add'>+	if (unlikely(retval))</div><div class='ctx'> 		return retval;</div><div class='ctx'> </div><div class='ctx'> 	retval = devcgroup_inode_permission(inode, mask);</div><div class='del'>-	if (retval)</div><div class='add'>+	if (unlikely(retval))</div><div class='ctx'> 		return retval;</div><div class='ctx'> </div><div class='ctx'> 	return security_inode_permission(inode, mask);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(inode_permission);</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * lookup_inode_permission_may_exec - Check traversal right for given inode</div><div class='add'>+ *</div><div class='add'>+ * This is a special case routine for may_lookup() making assumptions specific</div><div class='add'>+ * to path traversal. Use inode_permission() if you are doing something else.</div><div class='add'>+ *</div><div class='add'>+ * Work is shaved off compared to inode_permission() as follows:</div><div class='add'>+ * - we know for a fact there is no MAY_WRITE to worry about</div><div class='add'>+ * - it is an invariant the inode is a directory</div><div class='add'>+ *</div><div class='add'>+ * Since majority of real-world traversal happens on inodes which grant it for</div><div class='add'>+ * everyone, we check it upfront and only resort to more expensive work if it</div><div class='add'>+ * fails.</div><div class='add'>+ *</div><div class='add'>+ * Filesystems which have their own -&gt;permission hook and consequently miss out</div><div class='add'>+ * on IOP_FASTPERM can still get the optimization if they set IOP_FASTPERM_MAY_EXEC</div><div class='add'>+ * on their directory inodes.</div><div class='add'>+ */</div><div class='add'>+static __always_inline int lookup_inode_permission_may_exec(struct mnt_idmap *idmap,</div><div class='add'>+	struct inode *inode, int mask)</div><div class='add'>+{</div><div class='add'>+	/* Lookup already checked this to return -ENOTDIR */</div><div class='add'>+	VFS_BUG_ON_INODE(!S_ISDIR(inode-&gt;i_mode), inode);</div><div class='add'>+	VFS_BUG_ON((mask &amp; ~MAY_NOT_BLOCK) != 0);</div><div class='add'>+</div><div class='add'>+	mask |= MAY_EXEC;</div><div class='add'>+</div><div class='add'>+	if (unlikely(!(inode-&gt;i_opflags &amp; (IOP_FASTPERM | IOP_FASTPERM_MAY_EXEC))))</div><div class='add'>+		return inode_permission(idmap, inode, mask);</div><div class='add'>+</div><div class='add'>+	if (unlikely(((inode-&gt;i_mode &amp; 0111) != 0111) || !no_acl_inode(inode)))</div><div class='add'>+		return inode_permission(idmap, inode, mask);</div><div class='add'>+</div><div class='add'>+	return security_inode_permission(inode, mask);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /**</div><div class='ctx'>  * path_get - get a reference to a path</div><div class='ctx'>  * @path: path to get the reference to</div><div class='hunk'>@@ -566,7 +674,7 @@ struct nameidata {</div><div class='ctx'> 	struct path	root;</div><div class='ctx'> 	struct inode	*inode; /* path.dentry.d_inode */</div><div class='ctx'> 	unsigned int	flags, state;</div><div class='del'>-	unsigned	seq, m_seq, r_seq;</div><div class='add'>+	unsigned	seq, next_seq, m_seq, r_seq;</div><div class='ctx'> 	int		last_type;</div><div class='ctx'> 	unsigned	depth;</div><div class='ctx'> 	int		total_link_count;</div><div class='hunk'>@@ -577,10 +685,11 @@ struct nameidata {</div><div class='ctx'> 		unsigned seq;</div><div class='ctx'> 	} *stack, internal[EMBEDDED_LEVELS];</div><div class='ctx'> 	struct filename	*name;</div><div class='add'>+	const char *pathname;</div><div class='ctx'> 	struct nameidata *saved;</div><div class='ctx'> 	unsigned	root_seq;</div><div class='ctx'> 	int		dfd;</div><div class='del'>-	kuid_t		dir_uid;</div><div class='add'>+	vfsuid_t	dir_vfsuid;</div><div class='ctx'> 	umode_t		dir_mode;</div><div class='ctx'> } __randomize_layout;</div><div class='ctx'> </div><div class='hunk'>@@ -595,6 +704,7 @@ static void __set_nameidata(struct nameidata *p, int dfd, struct filename *name)</div><div class='ctx'> 	p-&gt;depth = 0;</div><div class='ctx'> 	p-&gt;dfd = dfd;</div><div class='ctx'> 	p-&gt;name = name;</div><div class='add'>+	p-&gt;pathname = likely(name) ? name-&gt;name : "";</div><div class='ctx'> 	p-&gt;path.mnt = NULL;</div><div class='ctx'> 	p-&gt;path.dentry = NULL;</div><div class='ctx'> 	p-&gt;total_link_count = old ? old-&gt;total_link_count : 0;</div><div class='hunk'>@@ -639,6 +749,8 @@ static bool nd_alloc_stack(struct nameidata *nd)</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * path_connected - Verify that a dentry is below mnt.mnt_root</div><div class='add'>+ * @mnt: The mountpoint to check.</div><div class='add'>+ * @dentry: The dentry to check.</div><div class='ctx'>  *</div><div class='ctx'>  * Rename can sometimes move a file or directory outside of a bind</div><div class='ctx'>  * mount, path_connected allows those cases to be detected.</div><div class='hunk'>@@ -664,9 +776,17 @@ static void drop_links(struct nameidata *nd)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void leave_rcu(struct nameidata *nd)</div><div class='add'>+{</div><div class='add'>+	nd-&gt;flags &amp;= ~LOOKUP_RCU;</div><div class='add'>+	nd-&gt;seq = nd-&gt;next_seq = 0;</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void terminate_walk(struct nameidata *nd)</div><div class='ctx'> {</div><div class='del'>-	drop_links(nd);</div><div class='add'>+	if (unlikely(nd-&gt;depth))</div><div class='add'>+		drop_links(nd);</div><div class='ctx'> 	if (!(nd-&gt;flags &amp; LOOKUP_RCU)) {</div><div class='ctx'> 		int i;</div><div class='ctx'> 		path_put(&amp;nd-&gt;path);</div><div class='hunk'>@@ -677,8 +797,7 @@ static void terminate_walk(struct nameidata *nd)</div><div class='ctx'> 			nd-&gt;state &amp;= ~ND_ROOT_GRABBED;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='del'>-		nd-&gt;flags &amp;= ~LOOKUP_RCU;</div><div class='del'>-		rcu_read_unlock();</div><div class='add'>+		leave_rcu(nd);</div><div class='ctx'> 	}</div><div class='ctx'> 	nd-&gt;depth = 0;</div><div class='ctx'> 	nd-&gt;path.mnt = NULL;</div><div class='hunk'>@@ -729,13 +848,6 @@ static bool legitimize_links(struct nameidata *nd)</div><div class='ctx'> </div><div class='ctx'> static bool legitimize_root(struct nameidata *nd)</div><div class='ctx'> {</div><div class='del'>-	/*</div><div class='del'>-	 * For scoped-lookups (where nd-&gt;root has been zeroed), we need to</div><div class='del'>-	 * restart the whole lookup from scratch -- because set_root() is wrong</div><div class='del'>-	 * for these lookups (nd-&gt;dfd is the root, not the filesystem root).</div><div class='del'>-	 */</div><div class='del'>-	if (!nd-&gt;root.mnt &amp;&amp; (nd-&gt;flags &amp; LOOKUP_IS_SCOPED))</div><div class='del'>-		return false;</div><div class='ctx'> 	/* Nothing to do if nd-&gt;root is zero or is managed by the VFS user. */</div><div class='ctx'> 	if (!nd-&gt;root.mnt || (nd-&gt;state &amp; ND_ROOT_PRESET))</div><div class='ctx'> 		return true;</div><div class='hunk'>@@ -771,14 +883,13 @@ static bool try_to_unlazy(struct nameidata *nd)</div><div class='ctx'> </div><div class='ctx'> 	BUG_ON(!(nd-&gt;flags &amp; LOOKUP_RCU));</div><div class='ctx'> </div><div class='del'>-	nd-&gt;flags &amp;= ~LOOKUP_RCU;</div><div class='del'>-	if (unlikely(!legitimize_links(nd)))</div><div class='add'>+	if (unlikely(nd-&gt;depth &amp;&amp; !legitimize_links(nd)))</div><div class='ctx'> 		goto out1;</div><div class='ctx'> 	if (unlikely(!legitimize_path(nd, &amp;nd-&gt;path, nd-&gt;seq)))</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	if (unlikely(!legitimize_root(nd)))</div><div class='ctx'> 		goto out;</div><div class='del'>-	rcu_read_unlock();</div><div class='add'>+	leave_rcu(nd);</div><div class='ctx'> 	BUG_ON(nd-&gt;inode != parent-&gt;d_inode);</div><div class='ctx'> 	return true;</div><div class='ctx'> </div><div class='hunk'>@@ -786,7 +897,7 @@ out1:</div><div class='ctx'> 	nd-&gt;path.mnt = NULL;</div><div class='ctx'> 	nd-&gt;path.dentry = NULL;</div><div class='ctx'> out:</div><div class='del'>-	rcu_read_unlock();</div><div class='add'>+	leave_rcu(nd);</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -794,24 +905,27 @@ out:</div><div class='ctx'>  * try_to_unlazy_next - try to switch to ref-walk mode.</div><div class='ctx'>  * @nd: nameidata pathwalk data</div><div class='ctx'>  * @dentry: next dentry to step into</div><div class='del'>- * @seq: seq number to check @dentry against</div><div class='ctx'>  * Returns: true on success, false on failure</div><div class='ctx'>  *</div><div class='del'>- * Similar to to try_to_unlazy(), but here we have the next dentry already</div><div class='add'>+ * Similar to try_to_unlazy(), but here we have the next dentry already</div><div class='ctx'>  * picked by rcu-walk and want to legitimize that in addition to the current</div><div class='ctx'>  * nd-&gt;path and nd-&gt;root for ref-walk mode.  Must be called from rcu-walk context.</div><div class='ctx'>  * Nothing should touch nameidata between try_to_unlazy_next() failure and</div><div class='ctx'>  * terminate_walk().</div><div class='ctx'>  */</div><div class='del'>-static bool try_to_unlazy_next(struct nameidata *nd, struct dentry *dentry, unsigned seq)</div><div class='add'>+static bool try_to_unlazy_next(struct nameidata *nd, struct dentry *dentry)</div><div class='ctx'> {</div><div class='add'>+	int res;</div><div class='ctx'> 	BUG_ON(!(nd-&gt;flags &amp; LOOKUP_RCU));</div><div class='ctx'> </div><div class='del'>-	nd-&gt;flags &amp;= ~LOOKUP_RCU;</div><div class='del'>-	if (unlikely(!legitimize_links(nd)))</div><div class='del'>-		goto out2;</div><div class='del'>-	if (unlikely(!legitimize_mnt(nd-&gt;path.mnt, nd-&gt;m_seq)))</div><div class='add'>+	if (unlikely(nd-&gt;depth &amp;&amp; !legitimize_links(nd)))</div><div class='ctx'> 		goto out2;</div><div class='add'>+	res = __legitimize_mnt(nd-&gt;path.mnt, nd-&gt;m_seq);</div><div class='add'>+	if (unlikely(res)) {</div><div class='add'>+		if (res &gt; 0)</div><div class='add'>+			goto out2;</div><div class='add'>+		goto out1;</div><div class='add'>+	}</div><div class='ctx'> 	if (unlikely(!lockref_get_not_dead(&amp;nd-&gt;path.dentry-&gt;d_lockref)))</div><div class='ctx'> 		goto out1;</div><div class='ctx'> </div><div class='hunk'>@@ -824,7 +938,7 @@ static bool try_to_unlazy_next(struct nameidata *nd, struct dentry *dentry, unsi</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (unlikely(!lockref_get_not_dead(&amp;dentry-&gt;d_lockref)))</div><div class='ctx'> 		goto out;</div><div class='del'>-	if (unlikely(read_seqcount_retry(&amp;dentry-&gt;d_seq, seq)))</div><div class='add'>+	if (read_seqcount_retry(&amp;dentry-&gt;d_seq, nd-&gt;next_seq))</div><div class='ctx'> 		goto out_dput;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Sequence counts matched. Now make sure that the root is</div><div class='hunk'>@@ -832,7 +946,7 @@ static bool try_to_unlazy_next(struct nameidata *nd, struct dentry *dentry, unsi</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (unlikely(!legitimize_root(nd)))</div><div class='ctx'> 		goto out_dput;</div><div class='del'>-	rcu_read_unlock();</div><div class='add'>+	leave_rcu(nd);</div><div class='ctx'> 	return true;</div><div class='ctx'> </div><div class='ctx'> out2:</div><div class='hunk'>@@ -840,18 +954,19 @@ out2:</div><div class='ctx'> out1:</div><div class='ctx'> 	nd-&gt;path.dentry = NULL;</div><div class='ctx'> out:</div><div class='del'>-	rcu_read_unlock();</div><div class='add'>+	leave_rcu(nd);</div><div class='ctx'> 	return false;</div><div class='ctx'> out_dput:</div><div class='del'>-	rcu_read_unlock();</div><div class='add'>+	leave_rcu(nd);</div><div class='ctx'> 	dput(dentry);</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int d_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='add'>+static inline int d_revalidate(struct inode *dir, const struct qstr *name,</div><div class='add'>+			       struct dentry *dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	if (unlikely(dentry-&gt;d_flags &amp; DCACHE_OP_REVALIDATE))</div><div class='del'>-		return dentry-&gt;d_op-&gt;d_revalidate(dentry, flags);</div><div class='add'>+		return dentry-&gt;d_op-&gt;d_revalidate(dir, name, dentry, flags);</div><div class='ctx'> 	else</div><div class='ctx'> 		return 1;</div><div class='ctx'> }</div><div class='hunk'>@@ -876,8 +991,8 @@ static int complete_walk(struct nameidata *nd)</div><div class='ctx'> 		 * We don't want to zero nd-&gt;root for scoped-lookups or</div><div class='ctx'> 		 * externally-managed nd-&gt;root.</div><div class='ctx'> 		 */</div><div class='del'>-		if (!(nd-&gt;state &amp; ND_ROOT_PRESET))</div><div class='del'>-			if (!(nd-&gt;flags &amp; LOOKUP_IS_SCOPED))</div><div class='add'>+		if (likely(!(nd-&gt;state &amp; ND_ROOT_PRESET)))</div><div class='add'>+			if (likely(!(nd-&gt;flags &amp; LOOKUP_IS_SCOPED)))</div><div class='ctx'> 				nd-&gt;root.mnt = NULL;</div><div class='ctx'> 		nd-&gt;flags &amp;= ~LOOKUP_CACHED;</div><div class='ctx'> 		if (!try_to_unlazy(nd))</div><div class='hunk'>@@ -937,10 +1052,10 @@ static int set_root(struct nameidata *nd)</div><div class='ctx'> 		unsigned seq;</div><div class='ctx'> </div><div class='ctx'> 		do {</div><div class='del'>-			seq = read_seqcount_begin(&amp;fs-&gt;seq);</div><div class='add'>+			seq = read_seqbegin(&amp;fs-&gt;seq);</div><div class='ctx'> 			nd-&gt;root = fs-&gt;root;</div><div class='ctx'> 			nd-&gt;root_seq = __read_seqcount_begin(&amp;nd-&gt;root.dentry-&gt;d_seq);</div><div class='del'>-		} while (read_seqcount_retry(&amp;fs-&gt;seq, seq));</div><div class='add'>+		} while (read_seqretry(&amp;fs-&gt;seq, seq));</div><div class='ctx'> 	} else {</div><div class='ctx'> 		get_fs_root(fs, &amp;nd-&gt;root);</div><div class='ctx'> 		nd-&gt;state |= ND_ROOT_GRABBED;</div><div class='hunk'>@@ -959,7 +1074,7 @@ static int nd_jump_root(struct nameidata *nd)</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!nd-&gt;root.mnt) {</div><div class='ctx'> 		int error = set_root(nd);</div><div class='del'>-		if (error)</div><div class='add'>+		if (unlikely(error))</div><div class='ctx'> 			return error;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (nd-&gt;flags &amp; LOOKUP_RCU) {</div><div class='hunk'>@@ -968,7 +1083,7 @@ static int nd_jump_root(struct nameidata *nd)</div><div class='ctx'> 		d = nd-&gt;path.dentry;</div><div class='ctx'> 		nd-&gt;inode = d-&gt;d_inode;</div><div class='ctx'> 		nd-&gt;seq = nd-&gt;root_seq;</div><div class='del'>-		if (unlikely(read_seqcount_retry(&amp;d-&gt;d_seq, nd-&gt;seq)))</div><div class='add'>+		if (read_seqcount_retry(&amp;d-&gt;d_seq, nd-&gt;seq))</div><div class='ctx'> 			return -ECHILD;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		path_put(&amp;nd-&gt;path);</div><div class='hunk'>@@ -984,7 +1099,7 @@ static int nd_jump_root(struct nameidata *nd)</div><div class='ctx'>  * Helper to directly jump to a known parsed path from -&gt;get_link,</div><div class='ctx'>  * caller must have taken a reference to path beforehand.</div><div class='ctx'>  */</div><div class='del'>-int nd_jump_link(struct path *path)</div><div class='add'>+int nd_jump_link(const struct path *path)</div><div class='ctx'> {</div><div class='ctx'> 	int error = -ELOOP;</div><div class='ctx'> 	struct nameidata *nd = current-&gt;nameidata;</div><div class='hunk'>@@ -1020,14 +1135,64 @@ static inline void put_link(struct nameidata *nd)</div><div class='ctx'> 		path_put(&amp;last-&gt;link);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int sysctl_protected_symlinks __read_mostly = 0;</div><div class='del'>-int sysctl_protected_hardlinks __read_mostly = 0;</div><div class='del'>-int sysctl_protected_fifos __read_mostly;</div><div class='del'>-int sysctl_protected_regular __read_mostly;</div><div class='add'>+static int sysctl_protected_symlinks __read_mostly;</div><div class='add'>+static int sysctl_protected_hardlinks __read_mostly;</div><div class='add'>+static int sysctl_protected_fifos __read_mostly;</div><div class='add'>+static int sysctl_protected_regular __read_mostly;</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_SYSCTL</div><div class='add'>+static const struct ctl_table namei_sysctls[] = {</div><div class='add'>+	{</div><div class='add'>+		.procname	= "protected_symlinks",</div><div class='add'>+		.data		= &amp;sysctl_protected_symlinks,</div><div class='add'>+		.maxlen		= sizeof(int),</div><div class='add'>+		.mode		= 0644,</div><div class='add'>+		.proc_handler	= proc_dointvec_minmax,</div><div class='add'>+		.extra1		= SYSCTL_ZERO,</div><div class='add'>+		.extra2		= SYSCTL_ONE,</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+		.procname	= "protected_hardlinks",</div><div class='add'>+		.data		= &amp;sysctl_protected_hardlinks,</div><div class='add'>+		.maxlen		= sizeof(int),</div><div class='add'>+		.mode		= 0644,</div><div class='add'>+		.proc_handler	= proc_dointvec_minmax,</div><div class='add'>+		.extra1		= SYSCTL_ZERO,</div><div class='add'>+		.extra2		= SYSCTL_ONE,</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+		.procname	= "protected_fifos",</div><div class='add'>+		.data		= &amp;sysctl_protected_fifos,</div><div class='add'>+		.maxlen		= sizeof(int),</div><div class='add'>+		.mode		= 0644,</div><div class='add'>+		.proc_handler	= proc_dointvec_minmax,</div><div class='add'>+		.extra1		= SYSCTL_ZERO,</div><div class='add'>+		.extra2		= SYSCTL_TWO,</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+		.procname	= "protected_regular",</div><div class='add'>+		.data		= &amp;sysctl_protected_regular,</div><div class='add'>+		.maxlen		= sizeof(int),</div><div class='add'>+		.mode		= 0644,</div><div class='add'>+		.proc_handler	= proc_dointvec_minmax,</div><div class='add'>+		.extra1		= SYSCTL_ZERO,</div><div class='add'>+		.extra2		= SYSCTL_TWO,</div><div class='add'>+	},</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int __init init_fs_namei_sysctls(void)</div><div class='add'>+{</div><div class='add'>+	register_sysctl_init("fs", namei_sysctls);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+fs_initcall(init_fs_namei_sysctls);</div><div class='add'>+</div><div class='add'>+#endif /* CONFIG_SYSCTL */</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * may_follow_link - Check symlink following for unsafe situations</div><div class='ctx'>  * @nd: nameidata pathwalk data</div><div class='add'>+ * @inode: Used for idmapping.</div><div class='ctx'>  *</div><div class='ctx'>  * In the case of the sysctl_protected_symlinks sysctl being enabled,</div><div class='ctx'>  * CAP_DAC_OVERRIDE needs to be specifically ignored if the symlink is</div><div class='hunk'>@@ -1042,16 +1207,16 @@ int sysctl_protected_regular __read_mostly;</div><div class='ctx'>  */</div><div class='ctx'> static inline int may_follow_link(struct nameidata *nd, const struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct user_namespace *mnt_userns;</div><div class='del'>-	kuid_t i_uid;</div><div class='add'>+	struct mnt_idmap *idmap;</div><div class='add'>+	vfsuid_t vfsuid;</div><div class='ctx'> </div><div class='ctx'> 	if (!sysctl_protected_symlinks)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	mnt_userns = mnt_user_ns(nd-&gt;path.mnt);</div><div class='del'>-	i_uid = i_uid_into_mnt(mnt_userns, inode);</div><div class='add'>+	idmap = mnt_idmap(nd-&gt;path.mnt);</div><div class='add'>+	vfsuid = i_uid_into_vfsuid(idmap, inode);</div><div class='ctx'> 	/* Allowed if owner and follower match. */</div><div class='del'>-	if (uid_eq(current_cred()-&gt;fsuid, i_uid))</div><div class='add'>+	if (vfsuid_eq_kuid(vfsuid, current_fsuid()))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/* Allowed if parent directory not sticky and world-writable. */</div><div class='hunk'>@@ -1059,7 +1224,7 @@ static inline int may_follow_link(struct nameidata *nd, const struct inode *inod</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/* Allowed if parent directory and link owner match. */</div><div class='del'>-	if (uid_valid(nd-&gt;dir_uid) &amp;&amp; uid_eq(nd-&gt;dir_uid, i_uid))</div><div class='add'>+	if (vfsuid_valid(nd-&gt;dir_vfsuid) &amp;&amp; vfsuid_eq(nd-&gt;dir_vfsuid, vfsuid))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	if (nd-&gt;flags &amp; LOOKUP_RCU)</div><div class='hunk'>@@ -1072,7 +1237,7 @@ static inline int may_follow_link(struct nameidata *nd, const struct inode *inod</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * safe_hardlink_source - Check for safe hardlink conditions</div><div class='del'>- * @mnt_userns:	user namespace of the mount the inode was found from</div><div class='add'>+ * @idmap: idmap of the mount the inode was found from</div><div class='ctx'>  * @inode: the source inode to hardlink from</div><div class='ctx'>  *</div><div class='ctx'>  * Return false if at least one of the following conditions:</div><div class='hunk'>@@ -1083,7 +1248,7 @@ static inline int may_follow_link(struct nameidata *nd, const struct inode *inod</div><div class='ctx'>  *</div><div class='ctx'>  * Otherwise returns true.</div><div class='ctx'>  */</div><div class='del'>-static bool safe_hardlink_source(struct user_namespace *mnt_userns,</div><div class='add'>+static bool safe_hardlink_source(struct mnt_idmap *idmap,</div><div class='ctx'> 				 struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	umode_t mode = inode-&gt;i_mode;</div><div class='hunk'>@@ -1101,7 +1266,7 @@ static bool safe_hardlink_source(struct user_namespace *mnt_userns,</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='ctx'> 	/* Hardlinking to unreadable or unwritable sources is dangerous. */</div><div class='del'>-	if (inode_permission(mnt_userns, inode, MAY_READ | MAY_WRITE))</div><div class='add'>+	if (inode_permission(idmap, inode, MAY_READ | MAY_WRITE))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='ctx'> 	return true;</div><div class='hunk'>@@ -1109,8 +1274,8 @@ static bool safe_hardlink_source(struct user_namespace *mnt_userns,</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * may_linkat - Check permissions for creating a hardlink</div><div class='del'>- * @mnt_userns:	user namespace of the mount the inode was found from</div><div class='del'>- * @link: the source to hardlink from</div><div class='add'>+ * @idmap: idmap of the mount the inode was found from</div><div class='add'>+ * @link:  the source to hardlink from</div><div class='ctx'>  *</div><div class='ctx'>  * Block hardlink when all of:</div><div class='ctx'>  *  - sysctl_protected_hardlinks enabled</div><div class='hunk'>@@ -1118,21 +1283,21 @@ static bool safe_hardlink_source(struct user_namespace *mnt_userns,</div><div class='ctx'>  *  - hardlink source is unsafe (see safe_hardlink_source() above)</div><div class='ctx'>  *  - not CAP_FOWNER in a namespace with the inode owner uid mapped</div><div class='ctx'>  *</div><div class='del'>- * If the inode has been found through an idmapped mount the user namespace of</div><div class='del'>- * the vfsmount must be passed through @mnt_userns. This function will then take</div><div class='del'>- * care to map the inode according to @mnt_userns before checking permissions.</div><div class='add'>+ * If the inode has been found through an idmapped mount the idmap of</div><div class='add'>+ * the vfsmount must be passed through @idmap. This function will then take</div><div class='add'>+ * care to map the inode according to @idmap before checking permissions.</div><div class='ctx'>  * On non-idmapped mounts or if permission checking is to be performed on the</div><div class='del'>- * raw inode simply passs init_user_ns.</div><div class='add'>+ * raw inode simply pass @nop_mnt_idmap.</div><div class='ctx'>  *</div><div class='ctx'>  * Returns 0 if successful, -ve on error.</div><div class='ctx'>  */</div><div class='del'>-int may_linkat(struct user_namespace *mnt_userns, struct path *link)</div><div class='add'>+int may_linkat(struct mnt_idmap *idmap, const struct path *link)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = link-&gt;dentry-&gt;d_inode;</div><div class='ctx'> </div><div class='ctx'> 	/* Inode writeback is not safe when the uid or gid are invalid. */</div><div class='del'>-	if (!uid_valid(i_uid_into_mnt(mnt_userns, inode)) ||</div><div class='del'>-	    !gid_valid(i_gid_into_mnt(mnt_userns, inode)))</div><div class='add'>+	if (!vfsuid_valid(i_uid_into_vfsuid(idmap, inode)) ||</div><div class='add'>+	    !vfsgid_valid(i_gid_into_vfsgid(idmap, inode)))</div><div class='ctx'> 		return -EOVERFLOW;</div><div class='ctx'> </div><div class='ctx'> 	if (!sysctl_protected_hardlinks)</div><div class='hunk'>@@ -1141,8 +1306,8 @@ int may_linkat(struct user_namespace *mnt_userns, struct path *link)</div><div class='ctx'> 	/* Source inode owner (or CAP_FOWNER) can hardlink all they like,</div><div class='ctx'> 	 * otherwise, it must be a safe source.</div><div class='ctx'> 	 */</div><div class='del'>-	if (safe_hardlink_source(mnt_userns, inode) ||</div><div class='del'>-	    inode_owner_or_capable(mnt_userns, inode))</div><div class='add'>+	if (safe_hardlink_source(idmap, inode) ||</div><div class='add'>+	    inode_owner_or_capable(idmap, inode))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	audit_log_path_denied(AUDIT_ANOM_LINK, "linkat");</div><div class='hunk'>@@ -1153,7 +1318,7 @@ int may_linkat(struct user_namespace *mnt_userns, struct path *link)</div><div class='ctx'>  * may_create_in_sticky - Check whether an O_CREAT open in a sticky directory</div><div class='ctx'>  *			  should be allowed, or not, on files that already</div><div class='ctx'>  *			  exist.</div><div class='del'>- * @mnt_userns:	user namespace of the mount the inode was found from</div><div class='add'>+ * @idmap: idmap of the mount the inode was found from</div><div class='ctx'>  * @nd: nameidata pathwalk data</div><div class='ctx'>  * @inode: the inode of the file to open</div><div class='ctx'>  *</div><div class='hunk'>@@ -1168,37 +1333,56 @@ int may_linkat(struct user_namespace *mnt_userns, struct path *link)</div><div class='ctx'>  * the directory doesn't have to be world writable: being group writable will</div><div class='ctx'>  * be enough.</div><div class='ctx'>  *</div><div class='del'>- * If the inode has been found through an idmapped mount the user namespace of</div><div class='del'>- * the vfsmount must be passed through @mnt_userns. This function will then take</div><div class='del'>- * care to map the inode according to @mnt_userns before checking permissions.</div><div class='add'>+ * If the inode has been found through an idmapped mount the idmap of</div><div class='add'>+ * the vfsmount must be passed through @idmap. This function will then take</div><div class='add'>+ * care to map the inode according to @idmap before checking permissions.</div><div class='ctx'>  * On non-idmapped mounts or if permission checking is to be performed on the</div><div class='del'>- * raw inode simply passs init_user_ns.</div><div class='add'>+ * raw inode simply pass @nop_mnt_idmap.</div><div class='ctx'>  *</div><div class='ctx'>  * Returns 0 if the open is allowed, -ve on error.</div><div class='ctx'>  */</div><div class='del'>-static int may_create_in_sticky(struct user_namespace *mnt_userns,</div><div class='del'>-				struct nameidata *nd, struct inode *const inode)</div><div class='add'>+static int may_create_in_sticky(struct mnt_idmap *idmap, struct nameidata *nd,</div><div class='add'>+				struct inode *const inode)</div><div class='ctx'> {</div><div class='ctx'> 	umode_t dir_mode = nd-&gt;dir_mode;</div><div class='del'>-	kuid_t dir_uid = nd-&gt;dir_uid;</div><div class='add'>+	vfsuid_t dir_vfsuid = nd-&gt;dir_vfsuid, i_vfsuid;</div><div class='add'>+</div><div class='add'>+	if (likely(!(dir_mode &amp; S_ISVTX)))</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	if ((!sysctl_protected_fifos &amp;&amp; S_ISFIFO(inode-&gt;i_mode)) ||</div><div class='del'>-	    (!sysctl_protected_regular &amp;&amp; S_ISREG(inode-&gt;i_mode)) ||</div><div class='del'>-	    likely(!(dir_mode &amp; S_ISVTX)) ||</div><div class='del'>-	    uid_eq(i_uid_into_mnt(mnt_userns, inode), dir_uid) ||</div><div class='del'>-	    uid_eq(current_fsuid(), i_uid_into_mnt(mnt_userns, inode)))</div><div class='add'>+	if (S_ISREG(inode-&gt;i_mode) &amp;&amp; !sysctl_protected_regular)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	if (likely(dir_mode &amp; 0002) ||</div><div class='del'>-	    (dir_mode &amp; 0020 &amp;&amp;</div><div class='del'>-	     ((sysctl_protected_fifos &gt;= 2 &amp;&amp; S_ISFIFO(inode-&gt;i_mode)) ||</div><div class='del'>-	      (sysctl_protected_regular &gt;= 2 &amp;&amp; S_ISREG(inode-&gt;i_mode))))) {</div><div class='del'>-		const char *operation = S_ISFIFO(inode-&gt;i_mode) ?</div><div class='del'>-					"sticky_create_fifo" :</div><div class='del'>-					"sticky_create_regular";</div><div class='del'>-		audit_log_path_denied(AUDIT_ANOM_CREAT, operation);</div><div class='add'>+	if (S_ISFIFO(inode-&gt;i_mode) &amp;&amp; !sysctl_protected_fifos)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	i_vfsuid = i_uid_into_vfsuid(idmap, inode);</div><div class='add'>+</div><div class='add'>+	if (vfsuid_eq(i_vfsuid, dir_vfsuid))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if (vfsuid_eq_kuid(i_vfsuid, current_fsuid()))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if (likely(dir_mode &amp; 0002)) {</div><div class='add'>+		audit_log_path_denied(AUDIT_ANOM_CREAT, "sticky_create");</div><div class='ctx'> 		return -EACCES;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	if (dir_mode &amp; 0020) {</div><div class='add'>+		if (sysctl_protected_fifos &gt;= 2 &amp;&amp; S_ISFIFO(inode-&gt;i_mode)) {</div><div class='add'>+			audit_log_path_denied(AUDIT_ANOM_CREAT,</div><div class='add'>+					      "sticky_create_fifo");</div><div class='add'>+			return -EACCES;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (sysctl_protected_regular &gt;= 2 &amp;&amp; S_ISREG(inode-&gt;i_mode)) {</div><div class='add'>+			audit_log_path_denied(AUDIT_ANOM_CREAT,</div><div class='add'>+					      "sticky_create_regular");</div><div class='add'>+			return -EACCES;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1305,6 +1489,10 @@ static int follow_automount(struct path *path, int *count, unsigned lookup_flags</div><div class='ctx'> 	    dentry-&gt;d_inode)</div><div class='ctx'> 		return -EISDIR;</div><div class='ctx'> </div><div class='add'>+	/* No need to trigger automounts if mountpoint crossing is disabled. */</div><div class='add'>+	if (lookup_flags &amp; LOOKUP_NO_XDEV)</div><div class='add'>+		return -EXDEV;</div><div class='add'>+</div><div class='ctx'> 	if (count &amp;&amp; (*count)++ &gt;= MAXSYMLINKS)</div><div class='ctx'> 		return -ELOOP;</div><div class='ctx'> </div><div class='hunk'>@@ -1325,9 +1513,13 @@ static int __traverse_mounts(struct path *path, unsigned flags, bool *jumped,</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	while (flags &amp; DCACHE_MANAGED_DENTRY) {</div><div class='del'>-		/* Allow the filesystem to manage the transit without i_mutex</div><div class='add'>+		/* Allow the filesystem to manage the transit without i_rwsem</div><div class='ctx'> 		 * being held. */</div><div class='ctx'> 		if (flags &amp; DCACHE_MANAGE_TRANSIT) {</div><div class='add'>+			if (lookup_flags &amp; LOOKUP_NO_XDEV) {</div><div class='add'>+				ret = -EXDEV;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='ctx'> 			ret = path-&gt;dentry-&gt;d_op-&gt;d_manage(path, false);</div><div class='ctx'> 			flags = smp_load_acquire(&amp;path-&gt;dentry-&gt;d_flags);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='hunk'>@@ -1345,6 +1537,10 @@ static int __traverse_mounts(struct path *path, unsigned flags, bool *jumped,</div><div class='ctx'> 				// here we know it's positive</div><div class='ctx'> 				flags = path-&gt;dentry-&gt;d_flags;</div><div class='ctx'> 				need_mntput = true;</div><div class='add'>+				if (unlikely(lookup_flags &amp; LOOKUP_NO_XDEV)) {</div><div class='add'>+					ret = -EXDEV;</div><div class='add'>+					break;</div><div class='add'>+				}</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1406,11 +1602,11 @@ EXPORT_SYMBOL(follow_down_one);</div><div class='ctx'>  * point, the filesystem owning that dentry may be queried as to whether the</div><div class='ctx'>  * caller is permitted to proceed or not.</div><div class='ctx'>  */</div><div class='del'>-int follow_down(struct path *path)</div><div class='add'>+int follow_down(struct path *path, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct vfsmount *mnt = path-&gt;mnt;</div><div class='ctx'> 	bool jumped;</div><div class='del'>-	int ret = traverse_mounts(path, &amp;jumped, NULL, 0);</div><div class='add'>+	int ret = traverse_mounts(path, &amp;jumped, NULL, flags);</div><div class='ctx'> </div><div class='ctx'> 	if (path-&gt;mnt != mnt)</div><div class='ctx'> 		mntput(mnt);</div><div class='hunk'>@@ -1422,8 +1618,7 @@ EXPORT_SYMBOL(follow_down);</div><div class='ctx'>  * Try to skip to top of mountpoint pile in rcuwalk mode.  Fail if</div><div class='ctx'>  * we meet a managed dentry that would need blocking.</div><div class='ctx'>  */</div><div class='del'>-static bool __follow_mount_rcu(struct nameidata *nd, struct path *path,</div><div class='del'>-			       struct inode **inode, unsigned *seqp)</div><div class='add'>+static bool __follow_mount_rcu(struct nameidata *nd, struct path *path)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dentry = path-&gt;dentry;</div><div class='ctx'> 	unsigned int flags = dentry-&gt;d_flags;</div><div class='hunk'>@@ -1452,15 +1647,12 @@ static bool __follow_mount_rcu(struct nameidata *nd, struct path *path,</div><div class='ctx'> 				path-&gt;mnt = &amp;mounted-&gt;mnt;</div><div class='ctx'> 				dentry = path-&gt;dentry = mounted-&gt;mnt.mnt_root;</div><div class='ctx'> 				nd-&gt;state |= ND_JUMPED;</div><div class='del'>-				*seqp = read_seqcount_begin(&amp;dentry-&gt;d_seq);</div><div class='del'>-				*inode = dentry-&gt;d_inode;</div><div class='del'>-				/*</div><div class='del'>-				 * We don't need to re-check -&gt;d_seq after this</div><div class='del'>-				 * -&gt;d_inode read - there will be an RCU delay</div><div class='del'>-				 * between mount hash removal and -&gt;mnt_root</div><div class='del'>-				 * becoming unpinned.</div><div class='del'>-				 */</div><div class='add'>+				nd-&gt;next_seq = read_seqcount_begin(&amp;dentry-&gt;d_seq);</div><div class='ctx'> 				flags = dentry-&gt;d_flags;</div><div class='add'>+				// makes sure that non-RCU pathwalk could reach</div><div class='add'>+				// this state.</div><div class='add'>+				if (read_seqretry(&amp;mount_lock, nd-&gt;m_seq))</div><div class='add'>+					return false;</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> 			if (read_seqretry(&amp;mount_lock, nd-&gt;m_seq))</div><div class='hunk'>@@ -1471,8 +1663,7 @@ static bool __follow_mount_rcu(struct nameidata *nd, struct path *path,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int handle_mounts(struct nameidata *nd, struct dentry *dentry,</div><div class='del'>-			  struct path *path, struct inode **inode,</div><div class='del'>-			  unsigned int *seqp)</div><div class='add'>+			  struct path *path)</div><div class='ctx'> {</div><div class='ctx'> 	bool jumped;</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -1480,31 +1671,25 @@ static inline int handle_mounts(struct nameidata *nd, struct dentry *dentry,</div><div class='ctx'> 	path-&gt;mnt = nd-&gt;path.mnt;</div><div class='ctx'> 	path-&gt;dentry = dentry;</div><div class='ctx'> 	if (nd-&gt;flags &amp; LOOKUP_RCU) {</div><div class='del'>-		unsigned int seq = *seqp;</div><div class='del'>-		if (unlikely(!*inode))</div><div class='del'>-			return -ENOENT;</div><div class='del'>-		if (likely(__follow_mount_rcu(nd, path, inode, seqp)))</div><div class='add'>+		unsigned int seq = nd-&gt;next_seq;</div><div class='add'>+		if (likely(!d_managed(dentry)))</div><div class='ctx'> 			return 0;</div><div class='del'>-		if (!try_to_unlazy_next(nd, dentry, seq))</div><div class='del'>-			return -ECHILD;</div><div class='del'>-		// *path might've been clobbered by __follow_mount_rcu()</div><div class='add'>+		if (likely(__follow_mount_rcu(nd, path)))</div><div class='add'>+			return 0;</div><div class='add'>+		// *path and nd-&gt;next_seq might've been clobbered</div><div class='ctx'> 		path-&gt;mnt = nd-&gt;path.mnt;</div><div class='ctx'> 		path-&gt;dentry = dentry;</div><div class='add'>+		nd-&gt;next_seq = seq;</div><div class='add'>+		if (unlikely(!try_to_unlazy_next(nd, dentry)))</div><div class='add'>+			return -ECHILD;</div><div class='ctx'> 	}</div><div class='ctx'> 	ret = traverse_mounts(path, &amp;jumped, &amp;nd-&gt;total_link_count, nd-&gt;flags);</div><div class='del'>-	if (jumped) {</div><div class='del'>-		if (unlikely(nd-&gt;flags &amp; LOOKUP_NO_XDEV))</div><div class='del'>-			ret = -EXDEV;</div><div class='del'>-		else</div><div class='del'>-			nd-&gt;state |= ND_JUMPED;</div><div class='del'>-	}</div><div class='add'>+	if (jumped)</div><div class='add'>+		nd-&gt;state |= ND_JUMPED;</div><div class='ctx'> 	if (unlikely(ret)) {</div><div class='ctx'> 		dput(path-&gt;dentry);</div><div class='ctx'> 		if (path-&gt;mnt != nd-&gt;path.mnt)</div><div class='ctx'> 			mntput(path-&gt;mnt);</div><div class='del'>-	} else {</div><div class='del'>-		*inode = d_backing_inode(path-&gt;dentry);</div><div class='del'>-		*seqp = 0; /* out of RCU mode, so the value doesn't matter */</div><div class='ctx'> 	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -1519,7 +1704,7 @@ static struct dentry *lookup_dcache(const struct qstr *name,</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dentry = d_lookup(dir, name);</div><div class='ctx'> 	if (dentry) {</div><div class='del'>-		int error = d_revalidate(dentry, flags);</div><div class='add'>+		int error = d_revalidate(dir-&gt;d_inode, name, dentry, flags);</div><div class='ctx'> 		if (unlikely(error &lt;= 0)) {</div><div class='ctx'> 			if (!error)</div><div class='ctx'> 				d_invalidate(dentry);</div><div class='hunk'>@@ -1536,18 +1721,22 @@ static struct dentry *lookup_dcache(const struct qstr *name,</div><div class='ctx'>  * dentries - as the matter of fact, this only gets called</div><div class='ctx'>  * when directory is guaranteed to have no in-lookup children</div><div class='ctx'>  * at all.</div><div class='add'>+ * Will return -ENOENT if name isn't found and LOOKUP_CREATE wasn't passed.</div><div class='add'>+ * Will return -EEXIST if name is found and LOOKUP_EXCL was passed.</div><div class='ctx'>  */</div><div class='del'>-static struct dentry *__lookup_hash(const struct qstr *name,</div><div class='del'>-		struct dentry *base, unsigned int flags)</div><div class='add'>+struct dentry *lookup_one_qstr_excl(const struct qstr *name,</div><div class='add'>+				    struct dentry *base, unsigned int flags)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *dentry = lookup_dcache(name, base, flags);</div><div class='add'>+	struct dentry *dentry;</div><div class='ctx'> 	struct dentry *old;</div><div class='del'>-	struct inode *dir = base-&gt;d_inode;</div><div class='add'>+	struct inode *dir;</div><div class='ctx'> </div><div class='add'>+	dentry = lookup_dcache(name, base, flags);</div><div class='ctx'> 	if (dentry)</div><div class='del'>-		return dentry;</div><div class='add'>+		goto found;</div><div class='ctx'> </div><div class='ctx'> 	/* Don't create child dentry for a dead directory. */</div><div class='add'>+	dir = base-&gt;d_inode;</div><div class='ctx'> 	if (unlikely(IS_DEADDIR(dir)))</div><div class='ctx'> 		return ERR_PTR(-ENOENT);</div><div class='ctx'> </div><div class='hunk'>@@ -1560,12 +1749,36 @@ static struct dentry *__lookup_hash(const struct qstr *name,</div><div class='ctx'> 		dput(dentry);</div><div class='ctx'> 		dentry = old;</div><div class='ctx'> 	}</div><div class='add'>+found:</div><div class='add'>+	if (IS_ERR(dentry))</div><div class='add'>+		return dentry;</div><div class='add'>+	if (d_is_negative(dentry) &amp;&amp; !(flags &amp; LOOKUP_CREATE)) {</div><div class='add'>+		dput(dentry);</div><div class='add'>+		return ERR_PTR(-ENOENT);</div><div class='add'>+	}</div><div class='add'>+	if (d_is_positive(dentry) &amp;&amp; (flags &amp; LOOKUP_EXCL)) {</div><div class='add'>+		dput(dentry);</div><div class='add'>+		return ERR_PTR(-EEXIST);</div><div class='add'>+	}</div><div class='ctx'> 	return dentry;</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL(lookup_one_qstr_excl);</div><div class='ctx'> </div><div class='del'>-static struct dentry *lookup_fast(struct nameidata *nd,</div><div class='del'>-				  struct inode **inode,</div><div class='del'>-			          unsigned *seqp)</div><div class='add'>+/**</div><div class='add'>+ * lookup_fast - do fast lockless (but racy) lookup of a dentry</div><div class='add'>+ * @nd: current nameidata</div><div class='add'>+ *</div><div class='add'>+ * Do a fast, but racy lookup in the dcache for the given dentry, and</div><div class='add'>+ * revalidate it. Returns a valid dentry pointer or NULL if one wasn't</div><div class='add'>+ * found. On error, an ERR_PTR will be returned.</div><div class='add'>+ *</div><div class='add'>+ * If this function returns a valid dentry and the walk is no longer</div><div class='add'>+ * lazy, the dentry will carry a reference that must later be put. If</div><div class='add'>+ * RCU mode is still in force, then this is not the case and the dentry</div><div class='add'>+ * must be legitimized before use. If this returns NULL, then the walk</div><div class='add'>+ * will no longer be in RCU mode.</div><div class='add'>+ */</div><div class='add'>+static struct dentry *lookup_fast(struct nameidata *nd)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dentry, *parent = nd-&gt;path.dentry;</div><div class='ctx'> 	int status = 1;</div><div class='hunk'>@@ -1576,8 +1789,7 @@ static struct dentry *lookup_fast(struct nameidata *nd,</div><div class='ctx'> 	 * going to fall back to non-racy lookup.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (nd-&gt;flags &amp; LOOKUP_RCU) {</div><div class='del'>-		unsigned seq;</div><div class='del'>-		dentry = __d_lookup_rcu(parent, &amp;nd-&gt;last, &amp;seq);</div><div class='add'>+		dentry = __d_lookup_rcu(parent, &amp;nd-&gt;last, &amp;nd-&gt;next_seq);</div><div class='ctx'> 		if (unlikely(!dentry)) {</div><div class='ctx'> 			if (!try_to_unlazy(nd))</div><div class='ctx'> 				return ERR_PTR(-ECHILD);</div><div class='hunk'>@@ -1585,37 +1797,26 @@ static struct dentry *lookup_fast(struct nameidata *nd,</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='del'>-		 * This sequence count validates that the inode matches</div><div class='del'>-		 * the dentry name information from lookup.</div><div class='del'>-		 */</div><div class='del'>-		*inode = d_backing_inode(dentry);</div><div class='del'>-		if (unlikely(read_seqcount_retry(&amp;dentry-&gt;d_seq, seq)))</div><div class='del'>-			return ERR_PTR(-ECHILD);</div><div class='del'>-</div><div class='del'>-		/*</div><div class='ctx'> 		 * This sequence count validates that the parent had no</div><div class='ctx'> 		 * changes while we did the lookup of the dentry above.</div><div class='del'>-		 *</div><div class='del'>-		 * The memory barrier in read_seqcount_begin of child is</div><div class='del'>-		 *  enough, we can use __read_seqcount_retry here.</div><div class='ctx'> 		 */</div><div class='del'>-		if (unlikely(__read_seqcount_retry(&amp;parent-&gt;d_seq, nd-&gt;seq)))</div><div class='add'>+		if (read_seqcount_retry(&amp;parent-&gt;d_seq, nd-&gt;seq))</div><div class='ctx'> 			return ERR_PTR(-ECHILD);</div><div class='ctx'> </div><div class='del'>-		*seqp = seq;</div><div class='del'>-		status = d_revalidate(dentry, nd-&gt;flags);</div><div class='add'>+		status = d_revalidate(nd-&gt;inode, &amp;nd-&gt;last, dentry, nd-&gt;flags);</div><div class='ctx'> 		if (likely(status &gt; 0))</div><div class='ctx'> 			return dentry;</div><div class='del'>-		if (!try_to_unlazy_next(nd, dentry, seq))</div><div class='add'>+		if (!try_to_unlazy_next(nd, dentry))</div><div class='ctx'> 			return ERR_PTR(-ECHILD);</div><div class='ctx'> 		if (status == -ECHILD)</div><div class='ctx'> 			/* we'd been told to redo it in non-rcu mode */</div><div class='del'>-			status = d_revalidate(dentry, nd-&gt;flags);</div><div class='add'>+			status = d_revalidate(nd-&gt;inode, &amp;nd-&gt;last,</div><div class='add'>+					      dentry, nd-&gt;flags);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		dentry = __d_lookup(parent, &amp;nd-&gt;last);</div><div class='ctx'> 		if (unlikely(!dentry))</div><div class='ctx'> 			return NULL;</div><div class='del'>-		status = d_revalidate(dentry, nd-&gt;flags);</div><div class='add'>+		status = d_revalidate(nd-&gt;inode, &amp;nd-&gt;last, dentry, nd-&gt;flags);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (unlikely(status &lt;= 0)) {</div><div class='ctx'> 		if (!status)</div><div class='hunk'>@@ -1643,7 +1844,7 @@ again:</div><div class='ctx'> 	if (IS_ERR(dentry))</div><div class='ctx'> 		return dentry;</div><div class='ctx'> 	if (unlikely(!d_in_lookup(dentry))) {</div><div class='del'>-		int error = d_revalidate(dentry, flags);</div><div class='add'>+		int error = d_revalidate(inode, name, dentry, flags);</div><div class='ctx'> 		if (unlikely(error &lt;= 0)) {</div><div class='ctx'> 			if (!error) {</div><div class='ctx'> 				d_invalidate(dentry);</div><div class='hunk'>@@ -1664,7 +1865,7 @@ again:</div><div class='ctx'> 	return dentry;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct dentry *lookup_slow(const struct qstr *name,</div><div class='add'>+static noinline struct dentry *lookup_slow(const struct qstr *name,</div><div class='ctx'> 				  struct dentry *dir,</div><div class='ctx'> 				  unsigned int flags)</div><div class='ctx'> {</div><div class='hunk'>@@ -1676,18 +1877,45 @@ static struct dentry *lookup_slow(const struct qstr *name,</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int may_lookup(struct user_namespace *mnt_userns,</div><div class='del'>-			     struct nameidata *nd)</div><div class='add'>+static struct dentry *lookup_slow_killable(const struct qstr *name,</div><div class='add'>+					   struct dentry *dir,</div><div class='add'>+					   unsigned int flags)</div><div class='ctx'> {</div><div class='del'>-	if (nd-&gt;flags &amp; LOOKUP_RCU) {</div><div class='del'>-		int err = inode_permission(mnt_userns, nd-&gt;inode, MAY_EXEC|MAY_NOT_BLOCK);</div><div class='del'>-		if (err != -ECHILD || !try_to_unlazy(nd))</div><div class='del'>-			return err;</div><div class='del'>-	}</div><div class='del'>-	return inode_permission(mnt_userns, nd-&gt;inode, MAY_EXEC);</div><div class='add'>+	struct inode *inode = dir-&gt;d_inode;</div><div class='add'>+	struct dentry *res;</div><div class='add'>+</div><div class='add'>+	if (inode_lock_shared_killable(inode))</div><div class='add'>+		return ERR_PTR(-EINTR);</div><div class='add'>+	res = __lookup_slow(name, dir, flags);</div><div class='add'>+	inode_unlock_shared(inode);</div><div class='add'>+	return res;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int may_lookup(struct mnt_idmap *idmap,</div><div class='add'>+			     struct nameidata *restrict nd)</div><div class='add'>+{</div><div class='add'>+	int err, mask;</div><div class='add'>+</div><div class='add'>+	mask = nd-&gt;flags &amp; LOOKUP_RCU ? MAY_NOT_BLOCK : 0;</div><div class='add'>+	err = lookup_inode_permission_may_exec(idmap, nd-&gt;inode, mask);</div><div class='add'>+	if (likely(!err))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	// If we failed, and we weren't in LOOKUP_RCU, it's final</div><div class='add'>+	if (!(nd-&gt;flags &amp; LOOKUP_RCU))</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	// Drop out of RCU mode to make sure it wasn't transient</div><div class='add'>+	if (!try_to_unlazy(nd))</div><div class='add'>+		return -ECHILD;	// redo it all non-lazy</div><div class='add'>+</div><div class='add'>+	if (err != -ECHILD)	// hard error</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	return lookup_inode_permission_may_exec(idmap, nd-&gt;inode, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int reserve_stack(struct nameidata *nd, struct path *link, unsigned seq)</div><div class='add'>+static int reserve_stack(struct nameidata *nd, struct path *link)</div><div class='ctx'> {</div><div class='ctx'> 	if (unlikely(nd-&gt;total_link_count++ &gt;= MAXSYMLINKS))</div><div class='ctx'> 		return -ELOOP;</div><div class='hunk'>@@ -1702,9 +1930,9 @@ static int reserve_stack(struct nameidata *nd, struct path *link, unsigned seq)</div><div class='ctx'> 	if (nd-&gt;flags &amp; LOOKUP_RCU) {</div><div class='ctx'> 		// we need to grab link before we do unlazy.  And we can't skip</div><div class='ctx'> 		// unlazy even if we fail to grab the link - cleanup needs it</div><div class='del'>-		bool grabbed_link = legitimize_path(nd, link, seq);</div><div class='add'>+		bool grabbed_link = legitimize_path(nd, link, nd-&gt;next_seq);</div><div class='ctx'> </div><div class='del'>-		if (!try_to_unlazy(nd) != 0 || !grabbed_link)</div><div class='add'>+		if (!try_to_unlazy(nd) || !grabbed_link)</div><div class='ctx'> 			return -ECHILD;</div><div class='ctx'> </div><div class='ctx'> 		if (nd_alloc_stack(nd))</div><div class='hunk'>@@ -1715,13 +1943,23 @@ static int reserve_stack(struct nameidata *nd, struct path *link, unsigned seq)</div><div class='ctx'> </div><div class='ctx'> enum {WALK_TRAILING = 1, WALK_MORE = 2, WALK_NOFOLLOW = 4};</div><div class='ctx'> </div><div class='del'>-static const char *pick_link(struct nameidata *nd, struct path *link,</div><div class='del'>-		     struct inode *inode, unsigned seq, int flags)</div><div class='add'>+static noinline const char *pick_link(struct nameidata *nd, struct path *link,</div><div class='add'>+		     struct inode *inode, int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct saved *last;</div><div class='ctx'> 	const char *res;</div><div class='del'>-	int error = reserve_stack(nd, link, seq);</div><div class='add'>+	int error;</div><div class='add'>+</div><div class='add'>+	if (nd-&gt;flags &amp; LOOKUP_RCU) {</div><div class='add'>+		/* make sure that d_is_symlink from step_into_slowpath() matches the inode */</div><div class='add'>+		if (read_seqcount_retry(&amp;link-&gt;dentry-&gt;d_seq, nd-&gt;next_seq))</div><div class='add'>+			return ERR_PTR(-ECHILD);</div><div class='add'>+	} else {</div><div class='add'>+		if (link-&gt;mnt == nd-&gt;path.mnt)</div><div class='add'>+			mntget(link-&gt;mnt);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='add'>+	error = reserve_stack(nd, link);</div><div class='ctx'> 	if (unlikely(error)) {</div><div class='ctx'> 		if (!(nd-&gt;flags &amp; LOOKUP_RCU))</div><div class='ctx'> 			path_put(link);</div><div class='hunk'>@@ -1730,7 +1968,7 @@ static const char *pick_link(struct nameidata *nd, struct path *link,</div><div class='ctx'> 	last = nd-&gt;stack + nd-&gt;depth++;</div><div class='ctx'> 	last-&gt;link = *link;</div><div class='ctx'> 	clear_delayed_call(&amp;last-&gt;done);</div><div class='del'>-	last-&gt;seq = seq;</div><div class='add'>+	last-&gt;seq = nd-&gt;next_seq;</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; WALK_TRAILING) {</div><div class='ctx'> 		error = may_follow_link(nd, inode);</div><div class='hunk'>@@ -1742,13 +1980,13 @@ static const char *pick_link(struct nameidata *nd, struct path *link,</div><div class='ctx'> 			unlikely(link-&gt;mnt-&gt;mnt_flags &amp; MNT_NOSYMFOLLOW))</div><div class='ctx'> 		return ERR_PTR(-ELOOP);</div><div class='ctx'> </div><div class='del'>-	if (!(nd-&gt;flags &amp; LOOKUP_RCU)) {</div><div class='add'>+	if (unlikely(atime_needs_update(&amp;last-&gt;link, inode))) {</div><div class='add'>+		if (nd-&gt;flags &amp; LOOKUP_RCU) {</div><div class='add'>+			if (!try_to_unlazy(nd))</div><div class='add'>+				return ERR_PTR(-ECHILD);</div><div class='add'>+		}</div><div class='ctx'> 		touch_atime(&amp;last-&gt;link);</div><div class='ctx'> 		cond_resched();</div><div class='del'>-	} else if (atime_needs_update(&amp;last-&gt;link, inode)) {</div><div class='del'>-		if (!try_to_unlazy(nd))</div><div class='del'>-			return ERR_PTR(-ECHILD);</div><div class='del'>-		touch_atime(&amp;last-&gt;link);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	error = security_inode_follow_link(link-&gt;dentry, inode,</div><div class='hunk'>@@ -1792,43 +2030,68 @@ all_done: // pure jump</div><div class='ctx'>  * to do this check without having to look at inode-&gt;i_op,</div><div class='ctx'>  * so we keep a cache of "no, this doesn't need follow_link"</div><div class='ctx'>  * for the common case.</div><div class='add'>+ *</div><div class='add'>+ * NOTE: dentry must be what nd-&gt;next_seq had been sampled from.</div><div class='ctx'>  */</div><div class='del'>-static const char *step_into(struct nameidata *nd, int flags,</div><div class='del'>-		     struct dentry *dentry, struct inode *inode, unsigned seq)</div><div class='add'>+static noinline const char *step_into_slowpath(struct nameidata *nd, int flags,</div><div class='add'>+		     struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	struct path path;</div><div class='del'>-	int err = handle_mounts(nd, dentry, &amp;path, &amp;inode, &amp;seq);</div><div class='add'>+	struct inode *inode;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='del'>-	if (err &lt; 0)</div><div class='add'>+	err = handle_mounts(nd, dentry, &amp;path);</div><div class='add'>+	if (unlikely(err &lt; 0))</div><div class='ctx'> 		return ERR_PTR(err);</div><div class='add'>+	inode = path.dentry-&gt;d_inode;</div><div class='ctx'> 	if (likely(!d_is_symlink(path.dentry)) ||</div><div class='ctx'> 	   ((flags &amp; WALK_TRAILING) &amp;&amp; !(nd-&gt;flags &amp; LOOKUP_FOLLOW)) ||</div><div class='ctx'> 	   (flags &amp; WALK_NOFOLLOW)) {</div><div class='ctx'> 		/* not a symlink or should not follow */</div><div class='del'>-		if (!(nd-&gt;flags &amp; LOOKUP_RCU)) {</div><div class='add'>+		if (nd-&gt;flags &amp; LOOKUP_RCU) {</div><div class='add'>+			if (read_seqcount_retry(&amp;path.dentry-&gt;d_seq, nd-&gt;next_seq))</div><div class='add'>+				return ERR_PTR(-ECHILD);</div><div class='add'>+			if (unlikely(!inode))</div><div class='add'>+				return ERR_PTR(-ENOENT);</div><div class='add'>+		} else {</div><div class='ctx'> 			dput(nd-&gt;path.dentry);</div><div class='ctx'> 			if (nd-&gt;path.mnt != path.mnt)</div><div class='ctx'> 				mntput(nd-&gt;path.mnt);</div><div class='ctx'> 		}</div><div class='ctx'> 		nd-&gt;path = path;</div><div class='ctx'> 		nd-&gt;inode = inode;</div><div class='del'>-		nd-&gt;seq = seq;</div><div class='add'>+		nd-&gt;seq = nd-&gt;next_seq;</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	}</div><div class='del'>-	if (nd-&gt;flags &amp; LOOKUP_RCU) {</div><div class='del'>-		/* make sure that d_is_symlink above matches inode */</div><div class='del'>-		if (read_seqcount_retry(&amp;path.dentry-&gt;d_seq, seq))</div><div class='add'>+	return pick_link(nd, &amp;path, inode, flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __always_inline const char *step_into(struct nameidata *nd, int flags,</div><div class='add'>+                    struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	/*</div><div class='add'>+	 * In the common case we are in rcu-walk and traversing over a non-mounted on</div><div class='add'>+	 * directory (as opposed to e.g., a symlink).</div><div class='add'>+	 *</div><div class='add'>+	 * We can handle that and negative entries with the checks below.</div><div class='add'>+	 */</div><div class='add'>+	if (likely((nd-&gt;flags &amp; LOOKUP_RCU) &amp;&amp;</div><div class='add'>+	    !d_managed(dentry) &amp;&amp; !d_is_symlink(dentry))) {</div><div class='add'>+		struct inode *inode = dentry-&gt;d_inode;</div><div class='add'>+		if (read_seqcount_retry(&amp;dentry-&gt;d_seq, nd-&gt;next_seq))</div><div class='ctx'> 			return ERR_PTR(-ECHILD);</div><div class='del'>-	} else {</div><div class='del'>-		if (path.mnt == nd-&gt;path.mnt)</div><div class='del'>-			mntget(path.mnt);</div><div class='add'>+		if (unlikely(!inode))</div><div class='add'>+			return ERR_PTR(-ENOENT);</div><div class='add'>+		nd-&gt;path.dentry = dentry;</div><div class='add'>+		/* nd-&gt;path.mnt is retained on purpose */</div><div class='add'>+		nd-&gt;inode = inode;</div><div class='add'>+		nd-&gt;seq = nd-&gt;next_seq;</div><div class='add'>+		return NULL;</div><div class='ctx'> 	}</div><div class='del'>-	return pick_link(nd, &amp;path, inode, seq, flags);</div><div class='add'>+	return step_into_slowpath(nd, flags, dentry);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct dentry *follow_dotdot_rcu(struct nameidata *nd,</div><div class='del'>-					struct inode **inodep,</div><div class='del'>-					unsigned *seqp)</div><div class='add'>+static struct dentry *follow_dotdot_rcu(struct nameidata *nd)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *parent, *old;</div><div class='ctx'> </div><div class='hunk'>@@ -1845,30 +2108,30 @@ static struct dentry *follow_dotdot_rcu(struct nameidata *nd,</div><div class='ctx'> 		nd-&gt;path = path;</div><div class='ctx'> 		nd-&gt;inode = path.dentry-&gt;d_inode;</div><div class='ctx'> 		nd-&gt;seq = seq;</div><div class='del'>-		if (unlikely(read_seqretry(&amp;mount_lock, nd-&gt;m_seq)))</div><div class='add'>+		// makes sure that non-RCU pathwalk could reach this state</div><div class='add'>+		if (read_seqretry(&amp;mount_lock, nd-&gt;m_seq))</div><div class='ctx'> 			return ERR_PTR(-ECHILD);</div><div class='ctx'> 		/* we know that mountpoint was pinned */</div><div class='ctx'> 	}</div><div class='ctx'> 	old = nd-&gt;path.dentry;</div><div class='ctx'> 	parent = old-&gt;d_parent;</div><div class='del'>-	*inodep = parent-&gt;d_inode;</div><div class='del'>-	*seqp = read_seqcount_begin(&amp;parent-&gt;d_seq);</div><div class='del'>-	if (unlikely(read_seqcount_retry(&amp;old-&gt;d_seq, nd-&gt;seq)))</div><div class='add'>+	nd-&gt;next_seq = read_seqcount_begin(&amp;parent-&gt;d_seq);</div><div class='add'>+	// makes sure that non-RCU pathwalk could reach this state</div><div class='add'>+	if (read_seqcount_retry(&amp;old-&gt;d_seq, nd-&gt;seq))</div><div class='ctx'> 		return ERR_PTR(-ECHILD);</div><div class='ctx'> 	if (unlikely(!path_connected(nd-&gt;path.mnt, parent)))</div><div class='ctx'> 		return ERR_PTR(-ECHILD);</div><div class='ctx'> 	return parent;</div><div class='ctx'> in_root:</div><div class='del'>-	if (unlikely(read_seqretry(&amp;mount_lock, nd-&gt;m_seq)))</div><div class='add'>+	if (read_seqretry(&amp;mount_lock, nd-&gt;m_seq))</div><div class='ctx'> 		return ERR_PTR(-ECHILD);</div><div class='ctx'> 	if (unlikely(nd-&gt;flags &amp; LOOKUP_BENEATH))</div><div class='ctx'> 		return ERR_PTR(-ECHILD);</div><div class='del'>-	return NULL;</div><div class='add'>+	nd-&gt;next_seq = nd-&gt;seq;</div><div class='add'>+	return nd-&gt;path.dentry;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct dentry *follow_dotdot(struct nameidata *nd,</div><div class='del'>-				 struct inode **inodep,</div><div class='del'>-				 unsigned *seqp)</div><div class='add'>+static struct dentry *follow_dotdot(struct nameidata *nd)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *parent;</div><div class='ctx'> </div><div class='hunk'>@@ -1892,15 +2155,12 @@ static struct dentry *follow_dotdot(struct nameidata *nd,</div><div class='ctx'> 		dput(parent);</div><div class='ctx'> 		return ERR_PTR(-ENOENT);</div><div class='ctx'> 	}</div><div class='del'>-	*seqp = 0;</div><div class='del'>-	*inodep = parent-&gt;d_inode;</div><div class='ctx'> 	return parent;</div><div class='ctx'> </div><div class='ctx'> in_root:</div><div class='ctx'> 	if (unlikely(nd-&gt;flags &amp; LOOKUP_BENEATH))</div><div class='ctx'> 		return ERR_PTR(-EXDEV);</div><div class='del'>-	dget(nd-&gt;path.dentry);</div><div class='del'>-	return NULL;</div><div class='add'>+	return dget(nd-&gt;path.dentry);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const char *handle_dots(struct nameidata *nd, int type)</div><div class='hunk'>@@ -1908,26 +2168,19 @@ static const char *handle_dots(struct nameidata *nd, int type)</div><div class='ctx'> 	if (type == LAST_DOTDOT) {</div><div class='ctx'> 		const char *error = NULL;</div><div class='ctx'> 		struct dentry *parent;</div><div class='del'>-		struct inode *inode;</div><div class='del'>-		unsigned seq;</div><div class='ctx'> </div><div class='ctx'> 		if (!nd-&gt;root.mnt) {</div><div class='ctx'> 			error = ERR_PTR(set_root(nd));</div><div class='del'>-			if (error)</div><div class='add'>+			if (unlikely(error))</div><div class='ctx'> 				return error;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (nd-&gt;flags &amp; LOOKUP_RCU)</div><div class='del'>-			parent = follow_dotdot_rcu(nd, &amp;inode, &amp;seq);</div><div class='add'>+			parent = follow_dotdot_rcu(nd);</div><div class='ctx'> 		else</div><div class='del'>-			parent = follow_dotdot(nd, &amp;inode, &amp;seq);</div><div class='add'>+			parent = follow_dotdot(nd);</div><div class='ctx'> 		if (IS_ERR(parent))</div><div class='ctx'> 			return ERR_CAST(parent);</div><div class='del'>-		if (unlikely(!parent))</div><div class='del'>-			error = step_into(nd, WALK_NOFOLLOW,</div><div class='del'>-					 nd-&gt;path.dentry, nd-&gt;inode, nd-&gt;seq);</div><div class='del'>-		else</div><div class='del'>-			error = step_into(nd, WALK_NOFOLLOW,</div><div class='del'>-					 parent, inode, seq);</div><div class='add'>+		error = step_into(nd, WALK_NOFOLLOW, parent);</div><div class='ctx'> 		if (unlikely(error))</div><div class='ctx'> 			return error;</div><div class='ctx'> </div><div class='hunk'>@@ -1939,31 +2192,29 @@ static const char *handle_dots(struct nameidata *nd, int type)</div><div class='ctx'> 			 * some fallback).</div><div class='ctx'> 			 */</div><div class='ctx'> 			smp_rmb();</div><div class='del'>-			if (unlikely(__read_seqcount_retry(&amp;mount_lock.seqcount, nd-&gt;m_seq)))</div><div class='add'>+			if (__read_seqcount_retry(&amp;mount_lock.seqcount, nd-&gt;m_seq))</div><div class='ctx'> 				return ERR_PTR(-EAGAIN);</div><div class='del'>-			if (unlikely(__read_seqcount_retry(&amp;rename_lock.seqcount, nd-&gt;r_seq)))</div><div class='add'>+			if (__read_seqcount_retry(&amp;rename_lock.seqcount, nd-&gt;r_seq))</div><div class='ctx'> 				return ERR_PTR(-EAGAIN);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static const char *walk_component(struct nameidata *nd, int flags)</div><div class='add'>+static __always_inline const char *walk_component(struct nameidata *nd, int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dentry;</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	unsigned seq;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * "." and ".." are special - ".." especially so because it has</div><div class='ctx'> 	 * to be able to know about the current root directory and</div><div class='ctx'> 	 * parent relationships.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (unlikely(nd-&gt;last_type != LAST_NORM)) {</div><div class='del'>-		if (!(flags &amp; WALK_MORE) &amp;&amp; nd-&gt;depth)</div><div class='add'>+		if (unlikely(nd-&gt;depth) &amp;&amp; !(flags &amp; WALK_MORE))</div><div class='ctx'> 			put_link(nd);</div><div class='ctx'> 		return handle_dots(nd, nd-&gt;last_type);</div><div class='ctx'> 	}</div><div class='del'>-	dentry = lookup_fast(nd, &amp;inode, &amp;seq);</div><div class='add'>+	dentry = lookup_fast(nd);</div><div class='ctx'> 	if (IS_ERR(dentry))</div><div class='ctx'> 		return ERR_CAST(dentry);</div><div class='ctx'> 	if (unlikely(!dentry)) {</div><div class='hunk'>@@ -1971,9 +2222,9 @@ static const char *walk_component(struct nameidata *nd, int flags)</div><div class='ctx'> 		if (IS_ERR(dentry))</div><div class='ctx'> 			return ERR_CAST(dentry);</div><div class='ctx'> 	}</div><div class='del'>-	if (!(flags &amp; WALK_MORE) &amp;&amp; nd-&gt;depth)</div><div class='add'>+	if (unlikely(nd-&gt;depth) &amp;&amp; !(flags &amp; WALK_MORE))</div><div class='ctx'> 		put_link(nd);</div><div class='del'>-	return step_into(nd, flags, dentry, inode, seq);</div><div class='add'>+	return step_into(nd, flags, dentry);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2129,21 +2380,39 @@ EXPORT_SYMBOL(hashlen_string);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Calculate the length and hash of the path component, and</div><div class='del'>- * return the "hash_len" as the result.</div><div class='add'>+ * return the length as the result.</div><div class='ctx'>  */</div><div class='del'>-static inline u64 hash_name(const void *salt, const char *name)</div><div class='add'>+static inline const char *hash_name(struct nameidata *nd,</div><div class='add'>+				    const char *name,</div><div class='add'>+				    unsigned long *lastword)</div><div class='ctx'> {</div><div class='del'>-	unsigned long a = 0, b, x = 0, y = (unsigned long)salt;</div><div class='add'>+	unsigned long a, b, x, y = (unsigned long)nd-&gt;path.dentry;</div><div class='ctx'> 	unsigned long adata, bdata, mask, len;</div><div class='ctx'> 	const struct word_at_a_time constants = WORD_AT_A_TIME_CONSTANTS;</div><div class='ctx'> </div><div class='del'>-	len = 0;</div><div class='del'>-	goto inside;</div><div class='add'>+	/*</div><div class='add'>+	 * The first iteration is special, because it can result in</div><div class='add'>+	 * '.' and '..' and has no mixing other than the final fold.</div><div class='add'>+	 */</div><div class='add'>+	a = load_unaligned_zeropad(name);</div><div class='add'>+	b = a ^ REPEAT_BYTE('/');</div><div class='add'>+	if (has_zero(a, &amp;adata, &amp;constants) | has_zero(b, &amp;bdata, &amp;constants)) {</div><div class='add'>+		adata = prep_zero_mask(a, adata, &amp;constants);</div><div class='add'>+		bdata = prep_zero_mask(b, bdata, &amp;constants);</div><div class='add'>+		mask = create_zero_mask(adata | bdata);</div><div class='add'>+		a &amp;= zero_bytemask(mask);</div><div class='add'>+		*lastword = a;</div><div class='add'>+		len = find_zero(mask);</div><div class='add'>+		nd-&gt;last.hash = fold_hash(a, y);</div><div class='add'>+		nd-&gt;last.len = len;</div><div class='add'>+		return name + len;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='add'>+	len = 0;</div><div class='add'>+	x = 0;</div><div class='ctx'> 	do {</div><div class='ctx'> 		HASH_MIX(x, y, a);</div><div class='ctx'> 		len += sizeof(unsigned long);</div><div class='del'>-inside:</div><div class='ctx'> 		a = load_unaligned_zeropad(name+len);</div><div class='ctx'> 		b = a ^ REPEAT_BYTE('/');</div><div class='ctx'> 	} while (!(has_zero(a, &amp;adata, &amp;constants) | has_zero(b, &amp;bdata, &amp;constants)));</div><div class='hunk'>@@ -2151,11 +2420,25 @@ inside:</div><div class='ctx'> 	adata = prep_zero_mask(a, adata, &amp;constants);</div><div class='ctx'> 	bdata = prep_zero_mask(b, bdata, &amp;constants);</div><div class='ctx'> 	mask = create_zero_mask(adata | bdata);</div><div class='del'>-	x ^= a &amp; zero_bytemask(mask);</div><div class='add'>+	a &amp;= zero_bytemask(mask);</div><div class='add'>+	x ^= a;</div><div class='add'>+	len += find_zero(mask);</div><div class='add'>+	*lastword = 0;		// Multi-word components cannot be DOT or DOTDOT</div><div class='ctx'> </div><div class='del'>-	return hashlen_create(fold_hash(x, y), len + find_zero(mask));</div><div class='add'>+	nd-&gt;last.hash = fold_hash(x, y);</div><div class='add'>+	nd-&gt;last.len = len;</div><div class='add'>+	return name + len;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Note that the 'last' word is always zero-masked, but</div><div class='add'>+ * was loaded as a possibly big-endian word.</div><div class='add'>+ */</div><div class='add'>+#ifdef __BIG_ENDIAN</div><div class='add'>+  #define LAST_WORD_IS_DOT	(0x2eul &lt;&lt; (BITS_PER_LONG-8))</div><div class='add'>+  #define LAST_WORD_IS_DOTDOT	(0x2e2eul &lt;&lt; (BITS_PER_LONG-16))</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> #else	/* !CONFIG_DCACHE_WORD_ACCESS: Slow, byte-at-a-time version */</div><div class='ctx'> </div><div class='ctx'> /* Return the hash of a string of known length */</div><div class='hunk'>@@ -2188,22 +2471,35 @@ EXPORT_SYMBOL(hashlen_string);</div><div class='ctx'>  * We know there's a real path component here of at least</div><div class='ctx'>  * one character.</div><div class='ctx'>  */</div><div class='del'>-static inline u64 hash_name(const void *salt, const char *name)</div><div class='add'>+static inline const char *hash_name(struct nameidata *nd, const char *name, unsigned long *lastword)</div><div class='ctx'> {</div><div class='del'>-	unsigned long hash = init_name_hash(salt);</div><div class='del'>-	unsigned long len = 0, c;</div><div class='add'>+	unsigned long hash = init_name_hash(nd-&gt;path.dentry);</div><div class='add'>+	unsigned long len = 0, c, last = 0;</div><div class='ctx'> </div><div class='ctx'> 	c = (unsigned char)*name;</div><div class='ctx'> 	do {</div><div class='add'>+		last = (last &lt;&lt; 8) + c;</div><div class='ctx'> 		len++;</div><div class='ctx'> 		hash = partial_name_hash(c, hash);</div><div class='ctx'> 		c = (unsigned char)name[len];</div><div class='ctx'> 	} while (c &amp;&amp; c != '/');</div><div class='del'>-	return hashlen_create(end_name_hash(hash), len);</div><div class='add'>+</div><div class='add'>+	// This is reliable for DOT or DOTDOT, since the component</div><div class='add'>+	// cannot contain NUL characters - top bits being zero means</div><div class='add'>+	// we cannot have had any other pathnames.</div><div class='add'>+	*lastword = last;</div><div class='add'>+	nd-&gt;last.hash = end_name_hash(hash);</div><div class='add'>+	nd-&gt;last.len = len;</div><div class='add'>+	return name + len;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='add'>+#ifndef LAST_WORD_IS_DOT</div><div class='add'>+  #define LAST_WORD_IS_DOT	0x2e</div><div class='add'>+  #define LAST_WORD_IS_DOTDOT	0x2e2e</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Name resolution.</div><div class='ctx'>  * This is the basic name resolution function, turning a pathname into</div><div class='hunk'>@@ -2221,56 +2517,52 @@ static int link_path_walk(const char *name, struct nameidata *nd)</div><div class='ctx'> 	nd-&gt;flags |= LOOKUP_PARENT;</div><div class='ctx'> 	if (IS_ERR(name))</div><div class='ctx'> 		return PTR_ERR(name);</div><div class='del'>-	while (*name=='/')</div><div class='del'>-		name++;</div><div class='del'>-	if (!*name) {</div><div class='add'>+	if (*name == '/') {</div><div class='add'>+		do {</div><div class='add'>+			name++;</div><div class='add'>+		} while (unlikely(*name == '/'));</div><div class='add'>+	}</div><div class='add'>+	if (unlikely(!*name)) {</div><div class='ctx'> 		nd-&gt;dir_mode = 0; // short-circuit the 'hardening' idiocy</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* At this point we know we have a real path component. */</div><div class='ctx'> 	for(;;) {</div><div class='del'>-		struct user_namespace *mnt_userns;</div><div class='add'>+		struct mnt_idmap *idmap;</div><div class='ctx'> 		const char *link;</div><div class='del'>-		u64 hash_len;</div><div class='del'>-		int type;</div><div class='add'>+		unsigned long lastword;</div><div class='ctx'> </div><div class='del'>-		mnt_userns = mnt_user_ns(nd-&gt;path.mnt);</div><div class='del'>-		err = may_lookup(mnt_userns, nd);</div><div class='del'>-		if (err)</div><div class='add'>+		idmap = mnt_idmap(nd-&gt;path.mnt);</div><div class='add'>+		err = may_lookup(idmap, nd);</div><div class='add'>+		if (unlikely(err))</div><div class='ctx'> 			return err;</div><div class='ctx'> </div><div class='del'>-		hash_len = hash_name(nd-&gt;path.dentry, name);</div><div class='add'>+		nd-&gt;last.name = name;</div><div class='add'>+		name = hash_name(nd, name, &amp;lastword);</div><div class='ctx'> </div><div class='del'>-		type = LAST_NORM;</div><div class='del'>-		if (name[0] == '.') switch (hashlen_len(hash_len)) {</div><div class='del'>-			case 2:</div><div class='del'>-				if (name[1] == '.') {</div><div class='del'>-					type = LAST_DOTDOT;</div><div class='del'>-					nd-&gt;state |= ND_JUMPED;</div><div class='del'>-				}</div><div class='del'>-				break;</div><div class='del'>-			case 1:</div><div class='del'>-				type = LAST_DOT;</div><div class='del'>-		}</div><div class='del'>-		if (likely(type == LAST_NORM)) {</div><div class='del'>-			struct dentry *parent = nd-&gt;path.dentry;</div><div class='add'>+		switch(lastword) {</div><div class='add'>+		case LAST_WORD_IS_DOTDOT:</div><div class='add'>+			nd-&gt;last_type = LAST_DOTDOT;</div><div class='add'>+			nd-&gt;state |= ND_JUMPED;</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		case LAST_WORD_IS_DOT:</div><div class='add'>+			nd-&gt;last_type = LAST_DOT;</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		default:</div><div class='add'>+			nd-&gt;last_type = LAST_NORM;</div><div class='ctx'> 			nd-&gt;state &amp;= ~ND_JUMPED;</div><div class='add'>+</div><div class='add'>+			struct dentry *parent = nd-&gt;path.dentry;</div><div class='ctx'> 			if (unlikely(parent-&gt;d_flags &amp; DCACHE_OP_HASH)) {</div><div class='del'>-				struct qstr this = { { .hash_len = hash_len }, .name = name };</div><div class='del'>-				err = parent-&gt;d_op-&gt;d_hash(parent, &amp;this);</div><div class='add'>+				err = parent-&gt;d_op-&gt;d_hash(parent, &amp;nd-&gt;last);</div><div class='ctx'> 				if (err &lt; 0)</div><div class='ctx'> 					return err;</div><div class='del'>-				hash_len = this.hash_len;</div><div class='del'>-				name = this.name;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		nd-&gt;last.hash_len = hash_len;</div><div class='del'>-		nd-&gt;last.name = name;</div><div class='del'>-		nd-&gt;last_type = type;</div><div class='del'>-</div><div class='del'>-		name += hashlen_len(hash_len);</div><div class='ctx'> 		if (!*name)</div><div class='ctx'> 			goto OK;</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -2283,8 +2575,8 @@ static int link_path_walk(const char *name, struct nameidata *nd)</div><div class='ctx'> 		if (unlikely(!*name)) {</div><div class='ctx'> OK:</div><div class='ctx'> 			/* pathname or trailing symlink, done */</div><div class='del'>-			if (!depth) {</div><div class='del'>-				nd-&gt;dir_uid = i_uid_into_mnt(mnt_userns, nd-&gt;inode);</div><div class='add'>+			if (likely(!depth)) {</div><div class='add'>+				nd-&gt;dir_vfsuid = i_uid_into_vfsuid(idmap, nd-&gt;inode);</div><div class='ctx'> 				nd-&gt;dir_mode = nd-&gt;inode-&gt;i_mode;</div><div class='ctx'> 				nd-&gt;flags &amp;= ~LOOKUP_PARENT;</div><div class='ctx'> 				return 0;</div><div class='hunk'>@@ -2318,16 +2610,18 @@ OK:</div><div class='ctx'> static const char *path_init(struct nameidata *nd, unsigned flags)</div><div class='ctx'> {</div><div class='ctx'> 	int error;</div><div class='del'>-	const char *s = nd-&gt;name-&gt;name;</div><div class='add'>+	const char *s = nd-&gt;pathname;</div><div class='ctx'> </div><div class='ctx'> 	/* LOOKUP_CACHED requires RCU, ask caller to retry */</div><div class='del'>-	if ((flags &amp; (LOOKUP_RCU | LOOKUP_CACHED)) == LOOKUP_CACHED)</div><div class='add'>+	if (unlikely((flags &amp; (LOOKUP_RCU | LOOKUP_CACHED)) == LOOKUP_CACHED))</div><div class='ctx'> 		return ERR_PTR(-EAGAIN);</div><div class='ctx'> </div><div class='del'>-	if (!*s)</div><div class='add'>+	if (unlikely(!*s))</div><div class='ctx'> 		flags &amp;= ~LOOKUP_RCU;</div><div class='ctx'> 	if (flags &amp; LOOKUP_RCU)</div><div class='ctx'> 		rcu_read_lock();</div><div class='add'>+	else</div><div class='add'>+		nd-&gt;seq = nd-&gt;next_seq = 0;</div><div class='ctx'> </div><div class='ctx'> 	nd-&gt;flags = flags;</div><div class='ctx'> 	nd-&gt;state |= ND_JUMPED;</div><div class='hunk'>@@ -2336,7 +2630,7 @@ static const char *path_init(struct nameidata *nd, unsigned flags)</div><div class='ctx'> 	nd-&gt;r_seq = __read_seqcount_begin(&amp;rename_lock.seqcount);</div><div class='ctx'> 	smp_rmb();</div><div class='ctx'> </div><div class='del'>-	if (nd-&gt;state &amp; ND_ROOT_PRESET) {</div><div class='add'>+	if (unlikely(nd-&gt;state &amp; ND_ROOT_PRESET)) {</div><div class='ctx'> 		struct dentry *root = nd-&gt;root.dentry;</div><div class='ctx'> 		struct inode *inode = root-&gt;d_inode;</div><div class='ctx'> 		if (*s &amp;&amp; unlikely(!d_can_lookup(root)))</div><div class='hunk'>@@ -2355,7 +2649,7 @@ static const char *path_init(struct nameidata *nd, unsigned flags)</div><div class='ctx'> 	nd-&gt;root.mnt = NULL;</div><div class='ctx'> </div><div class='ctx'> 	/* Absolute pathname -- fetch the root (LOOKUP_IN_ROOT uses nd-&gt;dfd). */</div><div class='del'>-	if (*s == '/' &amp;&amp; !(flags &amp; LOOKUP_IN_ROOT)) {</div><div class='add'>+	if (*s == '/' &amp;&amp; likely(!(flags &amp; LOOKUP_IN_ROOT))) {</div><div class='ctx'> 		error = nd_jump_root(nd);</div><div class='ctx'> 		if (unlikely(error))</div><div class='ctx'> 			return ERR_PTR(error);</div><div class='hunk'>@@ -2369,31 +2663,35 @@ static const char *path_init(struct nameidata *nd, unsigned flags)</div><div class='ctx'> 			unsigned seq;</div><div class='ctx'> </div><div class='ctx'> 			do {</div><div class='del'>-				seq = read_seqcount_begin(&amp;fs-&gt;seq);</div><div class='add'>+				seq = read_seqbegin(&amp;fs-&gt;seq);</div><div class='ctx'> 				nd-&gt;path = fs-&gt;pwd;</div><div class='ctx'> 				nd-&gt;inode = nd-&gt;path.dentry-&gt;d_inode;</div><div class='ctx'> 				nd-&gt;seq = __read_seqcount_begin(&amp;nd-&gt;path.dentry-&gt;d_seq);</div><div class='del'>-			} while (read_seqcount_retry(&amp;fs-&gt;seq, seq));</div><div class='add'>+			} while (read_seqretry(&amp;fs-&gt;seq, seq));</div><div class='ctx'> 		} else {</div><div class='ctx'> 			get_fs_pwd(current-&gt;fs, &amp;nd-&gt;path);</div><div class='ctx'> 			nd-&gt;inode = nd-&gt;path.dentry-&gt;d_inode;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='ctx'> 		/* Caller must check execute permissions on the starting path component */</div><div class='del'>-		struct fd f = fdget_raw(nd-&gt;dfd);</div><div class='add'>+		CLASS(fd_raw, f)(nd-&gt;dfd);</div><div class='ctx'> 		struct dentry *dentry;</div><div class='ctx'> </div><div class='del'>-		if (!f.file)</div><div class='add'>+		if (fd_empty(f))</div><div class='ctx'> 			return ERR_PTR(-EBADF);</div><div class='ctx'> </div><div class='del'>-		dentry = f.file-&gt;f_path.dentry;</div><div class='add'>+		if (flags &amp; LOOKUP_LINKAT_EMPTY) {</div><div class='add'>+			if (fd_file(f)-&gt;f_cred != current_cred() &amp;&amp;</div><div class='add'>+			    !ns_capable(fd_file(f)-&gt;f_cred-&gt;user_ns, CAP_DAC_READ_SEARCH))</div><div class='add'>+				return ERR_PTR(-ENOENT);</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-		if (*s &amp;&amp; unlikely(!d_can_lookup(dentry))) {</div><div class='del'>-			fdput(f);</div><div class='add'>+		dentry = fd_file(f)-&gt;f_path.dentry;</div><div class='add'>+</div><div class='add'>+		if (*s &amp;&amp; unlikely(!d_can_lookup(dentry)))</div><div class='ctx'> 			return ERR_PTR(-ENOTDIR);</div><div class='del'>-		}</div><div class='ctx'> </div><div class='del'>-		nd-&gt;path = f.file-&gt;f_path;</div><div class='add'>+		nd-&gt;path = fd_file(f)-&gt;f_path;</div><div class='ctx'> 		if (flags &amp; LOOKUP_RCU) {</div><div class='ctx'> 			nd-&gt;inode = nd-&gt;path.dentry-&gt;d_inode;</div><div class='ctx'> 			nd-&gt;seq = read_seqcount_begin(&amp;nd-&gt;path.dentry-&gt;d_seq);</div><div class='hunk'>@@ -2401,11 +2699,10 @@ static const char *path_init(struct nameidata *nd, unsigned flags)</div><div class='ctx'> 			path_get(&amp;nd-&gt;path);</div><div class='ctx'> 			nd-&gt;inode = nd-&gt;path.dentry-&gt;d_inode;</div><div class='ctx'> 		}</div><div class='del'>-		fdput(f);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* For scoped-lookups we need to set the root to the dirfd as well. */</div><div class='del'>-	if (flags &amp; LOOKUP_IS_SCOPED) {</div><div class='add'>+	if (unlikely(flags &amp; LOOKUP_IS_SCOPED)) {</div><div class='ctx'> 		nd-&gt;root = nd-&gt;path;</div><div class='ctx'> 		if (flags &amp; LOOKUP_RCU) {</div><div class='ctx'> 			nd-&gt;root_seq = nd-&gt;seq;</div><div class='hunk'>@@ -2429,11 +2726,11 @@ static int handle_lookup_down(struct nameidata *nd)</div><div class='ctx'> {</div><div class='ctx'> 	if (!(nd-&gt;flags &amp; LOOKUP_RCU))</div><div class='ctx'> 		dget(nd-&gt;path.dentry);</div><div class='del'>-	return PTR_ERR(step_into(nd, WALK_NOFOLLOW,</div><div class='del'>-			nd-&gt;path.dentry, nd-&gt;inode, nd-&gt;seq));</div><div class='add'>+	nd-&gt;next_seq = nd-&gt;seq;</div><div class='add'>+	return PTR_ERR(step_into(nd, WALK_NOFOLLOW, nd-&gt;path.dentry));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Returns 0 and nd will be valid on success; Retuns error, otherwise. */</div><div class='add'>+/* Returns 0 and nd will be valid on success; Returns error, otherwise. */</div><div class='ctx'> static int path_lookupat(struct nameidata *nd, unsigned flags, struct path *path)</div><div class='ctx'> {</div><div class='ctx'> 	const char *s = path_init(nd, flags);</div><div class='hunk'>@@ -2468,7 +2765,7 @@ static int path_lookupat(struct nameidata *nd, unsigned flags, struct path *path</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int filename_lookup(int dfd, struct filename *name, unsigned flags,</div><div class='del'>-		    struct path *path, struct path *root)</div><div class='add'>+		    struct path *path, const struct path *root)</div><div class='ctx'> {</div><div class='ctx'> 	int retval;</div><div class='ctx'> 	struct nameidata nd;</div><div class='hunk'>@@ -2488,7 +2785,7 @@ int filename_lookup(int dfd, struct filename *name, unsigned flags,</div><div class='ctx'> 	return retval;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Returns 0 and nd will be valid on success; Retuns error, otherwise. */</div><div class='add'>+/* Returns 0 and nd will be valid on success; Returns error, otherwise. */</div><div class='ctx'> static int path_parentat(struct nameidata *nd, unsigned flags,</div><div class='ctx'> 				struct path *parent)</div><div class='ctx'> {</div><div class='hunk'>@@ -2506,16 +2803,17 @@ static int path_parentat(struct nameidata *nd, unsigned flags,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Note: this does not consume "name" */</div><div class='del'>-static int filename_parentat(int dfd, struct filename *name,</div><div class='del'>-			     unsigned int flags, struct path *parent,</div><div class='del'>-			     struct qstr *last, int *type)</div><div class='add'>+static int __filename_parentat(int dfd, struct filename *name,</div><div class='add'>+			       unsigned int flags, struct path *parent,</div><div class='add'>+			       struct qstr *last, int *type,</div><div class='add'>+			       const struct path *root)</div><div class='ctx'> {</div><div class='ctx'> 	int retval;</div><div class='ctx'> 	struct nameidata nd;</div><div class='ctx'> </div><div class='ctx'> 	if (IS_ERR(name))</div><div class='ctx'> 		return PTR_ERR(name);</div><div class='del'>-	set_nameidata(&amp;nd, dfd, name, NULL);</div><div class='add'>+	set_nameidata(&amp;nd, dfd, name, root);</div><div class='ctx'> 	retval = path_parentat(&amp;nd, flags | LOOKUP_RCU, parent);</div><div class='ctx'> 	if (unlikely(retval == -ECHILD))</div><div class='ctx'> 		retval = path_parentat(&amp;nd, flags, parent);</div><div class='hunk'>@@ -2530,38 +2828,159 @@ static int filename_parentat(int dfd, struct filename *name,</div><div class='ctx'> 	return retval;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int filename_parentat(int dfd, struct filename *name,</div><div class='add'>+			     unsigned int flags, struct path *parent,</div><div class='add'>+			     struct qstr *last, int *type)</div><div class='add'>+{</div><div class='add'>+	return __filename_parentat(dfd, name, flags, parent, last, type, NULL);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * start_dirop - begin a create or remove dirop, performing locking and lookup</div><div class='add'>+ * @parent:       the dentry of the parent in which the operation will occur</div><div class='add'>+ * @name:         a qstr holding the name within that parent</div><div class='add'>+ * @lookup_flags: intent and other lookup flags.</div><div class='add'>+ *</div><div class='add'>+ * The lookup is performed and necessary locks are taken so that, on success,</div><div class='add'>+ * the returned dentry can be operated on safely.</div><div class='add'>+ * The qstr must already have the hash value calculated.</div><div class='add'>+ *</div><div class='add'>+ * Returns: a locked dentry, or an error.</div><div class='add'>+ *</div><div class='add'>+ */</div><div class='add'>+static struct dentry *__start_dirop(struct dentry *parent, struct qstr *name,</div><div class='add'>+				    unsigned int lookup_flags,</div><div class='add'>+				    unsigned int state)</div><div class='add'>+{</div><div class='add'>+	struct dentry *dentry;</div><div class='add'>+	struct inode *dir = d_inode(parent);</div><div class='add'>+</div><div class='add'>+	if (state == TASK_KILLABLE) {</div><div class='add'>+		int ret = down_write_killable_nested(&amp;dir-&gt;i_rwsem,</div><div class='add'>+						     I_MUTEX_PARENT);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ERR_PTR(ret);</div><div class='add'>+	} else {</div><div class='add'>+		inode_lock_nested(dir, I_MUTEX_PARENT);</div><div class='add'>+	}</div><div class='add'>+	dentry = lookup_one_qstr_excl(name, parent, lookup_flags);</div><div class='add'>+	if (IS_ERR(dentry))</div><div class='add'>+		inode_unlock(dir);</div><div class='add'>+	return dentry;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct dentry *start_dirop(struct dentry *parent, struct qstr *name,</div><div class='add'>+			   unsigned int lookup_flags)</div><div class='add'>+{</div><div class='add'>+	return __start_dirop(parent, name, lookup_flags, TASK_NORMAL);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * end_dirop - signal completion of a dirop</div><div class='add'>+ * @de: the dentry which was returned by start_dirop or similar.</div><div class='add'>+ *</div><div class='add'>+ * If the de is an error, nothing happens. Otherwise any lock taken to</div><div class='add'>+ * protect the dentry is dropped and the dentry itself is release (dput()).</div><div class='add'>+ */</div><div class='add'>+void end_dirop(struct dentry *de)</div><div class='add'>+{</div><div class='add'>+	if (!IS_ERR(de)) {</div><div class='add'>+		inode_unlock(de-&gt;d_parent-&gt;d_inode);</div><div class='add'>+		dput(de);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(end_dirop);</div><div class='add'>+</div><div class='ctx'> /* does lookup, returns the object with parent locked */</div><div class='del'>-static struct dentry *__kern_path_locked(struct filename *name, struct path *path)</div><div class='add'>+static struct dentry *__start_removing_path(int dfd, struct filename *name,</div><div class='add'>+					   struct path *path)</div><div class='ctx'> {</div><div class='add'>+	struct path parent_path __free(path_put) = {};</div><div class='ctx'> 	struct dentry *d;</div><div class='ctx'> 	struct qstr last;</div><div class='ctx'> 	int type, error;</div><div class='ctx'> </div><div class='del'>-	error = filename_parentat(AT_FDCWD, name, 0, path, &amp;last, &amp;type);</div><div class='add'>+	error = filename_parentat(dfd, name, 0, &amp;parent_path, &amp;last, &amp;type);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return ERR_PTR(error);</div><div class='del'>-	if (unlikely(type != LAST_NORM)) {</div><div class='del'>-		path_put(path);</div><div class='add'>+	if (unlikely(type != LAST_NORM))</div><div class='ctx'> 		return ERR_PTR(-EINVAL);</div><div class='del'>-	}</div><div class='del'>-	inode_lock_nested(path-&gt;dentry-&gt;d_inode, I_MUTEX_PARENT);</div><div class='del'>-	d = __lookup_hash(&amp;last, path-&gt;dentry, 0);</div><div class='del'>-	if (IS_ERR(d)) {</div><div class='del'>-		inode_unlock(path-&gt;dentry-&gt;d_inode);</div><div class='del'>-		path_put(path);</div><div class='del'>-	}</div><div class='add'>+	/* don't fail immediately if it's r/o, at least try to report other errors */</div><div class='add'>+	error = mnt_want_write(parent_path.mnt);</div><div class='add'>+	d = start_dirop(parent_path.dentry, &amp;last, 0);</div><div class='add'>+	if (IS_ERR(d))</div><div class='add'>+		goto drop;</div><div class='add'>+	if (error)</div><div class='add'>+		goto fail;</div><div class='add'>+	path-&gt;dentry = no_free_ptr(parent_path.dentry);</div><div class='add'>+	path-&gt;mnt = no_free_ptr(parent_path.mnt);</div><div class='add'>+	return d;</div><div class='add'>+</div><div class='add'>+fail:</div><div class='add'>+	end_dirop(d);</div><div class='add'>+	d = ERR_PTR(error);</div><div class='add'>+drop:</div><div class='add'>+	if (!error)</div><div class='add'>+		mnt_drop_write(parent_path.mnt);</div><div class='ctx'> 	return d;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct dentry *kern_path_locked(const char *name, struct path *path)</div><div class='add'>+/**</div><div class='add'>+ * kern_path_parent: lookup path returning parent and target</div><div class='add'>+ * @name: path name</div><div class='add'>+ * @path: path to store parent in</div><div class='add'>+ *</div><div class='add'>+ * The path @name should end with a normal component, not "." or ".." or "/".</div><div class='add'>+ * A lookup is performed and if successful the parent information</div><div class='add'>+ * is store in @parent and the dentry is returned.</div><div class='add'>+ *</div><div class='add'>+ * The dentry maybe negative, the parent will be positive.</div><div class='add'>+ *</div><div class='add'>+ * Returns:  dentry or error.</div><div class='add'>+ */</div><div class='add'>+struct dentry *kern_path_parent(const char *name, struct path *path)</div><div class='add'>+{</div><div class='add'>+	struct path parent_path __free(path_put) = {};</div><div class='add'>+	struct filename *filename __free(putname) = getname_kernel(name);</div><div class='add'>+	struct dentry *d;</div><div class='add'>+	struct qstr last;</div><div class='add'>+	int type, error;</div><div class='add'>+</div><div class='add'>+	error = filename_parentat(AT_FDCWD, filename, 0, &amp;parent_path, &amp;last, &amp;type);</div><div class='add'>+	if (error)</div><div class='add'>+		return ERR_PTR(error);</div><div class='add'>+	if (unlikely(type != LAST_NORM))</div><div class='add'>+		return ERR_PTR(-EINVAL);</div><div class='add'>+</div><div class='add'>+	d = lookup_noperm_unlocked(&amp;last, parent_path.dentry);</div><div class='add'>+	if (IS_ERR(d))</div><div class='add'>+		return d;</div><div class='add'>+	path-&gt;dentry = no_free_ptr(parent_path.dentry);</div><div class='add'>+	path-&gt;mnt = no_free_ptr(parent_path.mnt);</div><div class='add'>+	return d;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct dentry *start_removing_path(const char *name, struct path *path)</div><div class='ctx'> {</div><div class='ctx'> 	struct filename *filename = getname_kernel(name);</div><div class='del'>-	struct dentry *res = __kern_path_locked(filename, path);</div><div class='add'>+	struct dentry *res = __start_removing_path(AT_FDCWD, filename, path);</div><div class='ctx'> </div><div class='ctx'> 	putname(filename);</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+struct dentry *start_removing_user_path_at(int dfd,</div><div class='add'>+					   const char __user *name,</div><div class='add'>+					   struct path *path)</div><div class='add'>+{</div><div class='add'>+	struct filename *filename = getname(name);</div><div class='add'>+	struct dentry *res = __start_removing_path(dfd, filename, path);</div><div class='add'>+</div><div class='add'>+	putname(filename);</div><div class='add'>+	return res;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(start_removing_user_path_at);</div><div class='add'>+</div><div class='ctx'> int kern_path(const char *name, unsigned int flags, struct path *path)</div><div class='ctx'> {</div><div class='ctx'> 	struct filename *filename = getname_kernel(name);</div><div class='hunk'>@@ -2574,6 +2993,24 @@ int kern_path(const char *name, unsigned int flags, struct path *path)</div><div class='ctx'> EXPORT_SYMBOL(kern_path);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='add'>+ * vfs_path_parent_lookup - lookup a parent path relative to a dentry-vfsmount pair</div><div class='add'>+ * @filename: filename structure</div><div class='add'>+ * @flags: lookup flags</div><div class='add'>+ * @parent: pointer to struct path to fill</div><div class='add'>+ * @last: last component</div><div class='add'>+ * @type: type of the last component</div><div class='add'>+ * @root: pointer to struct path of the base directory</div><div class='add'>+ */</div><div class='add'>+int vfs_path_parent_lookup(struct filename *filename, unsigned int flags,</div><div class='add'>+			   struct path *parent, struct qstr *last, int *type,</div><div class='add'>+			   const struct path *root)</div><div class='add'>+{</div><div class='add'>+	return  __filename_parentat(AT_FDCWD, filename, flags, parent, last,</div><div class='add'>+				    type, root);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(vfs_path_parent_lookup);</div><div class='add'>+</div><div class='add'>+/**</div><div class='ctx'>  * vfs_path_lookup - lookup a file path relative to a dentry-vfsmount pair</div><div class='ctx'>  * @dentry:  pointer to dentry of the base directory</div><div class='ctx'>  * @mnt: pointer to vfs mount of the base directory</div><div class='hunk'>@@ -2597,20 +3034,17 @@ int vfs_path_lookup(struct dentry *dentry, struct vfsmount *mnt,</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(vfs_path_lookup);</div><div class='ctx'> </div><div class='del'>-static int lookup_one_common(struct user_namespace *mnt_userns,</div><div class='del'>-			     const char *name, struct dentry *base, int len,</div><div class='del'>-			     struct qstr *this)</div><div class='add'>+int lookup_noperm_common(struct qstr *qname, struct dentry *base)</div><div class='ctx'> {</div><div class='del'>-	this-&gt;name = name;</div><div class='del'>-	this-&gt;len = len;</div><div class='del'>-	this-&gt;hash = full_name_hash(base, name, len);</div><div class='add'>+	const char *name = qname-&gt;name;</div><div class='add'>+	u32 len = qname-&gt;len;</div><div class='add'>+</div><div class='add'>+	qname-&gt;hash = full_name_hash(base, name, len);</div><div class='ctx'> 	if (!len)</div><div class='ctx'> 		return -EACCES;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(name[0] == '.')) {</div><div class='del'>-		if (len &lt; 2 || (len == 2 &amp;&amp; name[1] == '.'))</div><div class='del'>-			return -EACCES;</div><div class='del'>-	}</div><div class='add'>+	if (is_dot_dotdot(name, len))</div><div class='add'>+		return -EACCES;</div><div class='ctx'> </div><div class='ctx'> 	while (len--) {</div><div class='ctx'> 		unsigned int c = *(const unsigned char *)name++;</div><div class='hunk'>@@ -2622,150 +3056,482 @@ static int lookup_one_common(struct user_namespace *mnt_userns,</div><div class='ctx'> 	 * to use its own hash..</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (base-&gt;d_flags &amp; DCACHE_OP_HASH) {</div><div class='del'>-		int err = base-&gt;d_op-&gt;d_hash(base, this);</div><div class='add'>+		int err = base-&gt;d_op-&gt;d_hash(base, qname);</div><div class='ctx'> 		if (err &lt; 0)</div><div class='ctx'> 			return err;</div><div class='ctx'> 	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	return inode_permission(mnt_userns, base-&gt;d_inode, MAY_EXEC);</div><div class='add'>+static int lookup_one_common(struct mnt_idmap *idmap,</div><div class='add'>+			     struct qstr *qname, struct dentry *base)</div><div class='add'>+{</div><div class='add'>+	int err;</div><div class='add'>+	err = lookup_noperm_common(qname, base);</div><div class='add'>+	if (err &lt; 0)</div><div class='add'>+		return err;</div><div class='add'>+	return inode_permission(idmap, base-&gt;d_inode, MAY_EXEC);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * try_lookup_one_len - filesystem helper to lookup single pathname component</div><div class='del'>- * @name:	pathname component to lookup</div><div class='add'>+ * try_lookup_noperm - filesystem helper to lookup single pathname component</div><div class='add'>+ * @name:	qstr storing pathname component to lookup</div><div class='ctx'>  * @base:	base directory to lookup from</div><div class='del'>- * @len:	maximum length @len should be interpreted to</div><div class='ctx'>  *</div><div class='ctx'>  * Look up a dentry by name in the dcache, returning NULL if it does not</div><div class='del'>- * currently exist.  The function does not try to create a dentry.</div><div class='add'>+ * currently exist.  The function does not try to create a dentry and if one</div><div class='add'>+ * is found it doesn't try to revalidate it.</div><div class='ctx'>  *</div><div class='ctx'>  * Note that this routine is purely a helper for filesystem usage and should</div><div class='del'>- * not be called by generic code.</div><div class='add'>+ * not be called by generic code.  It does no permission checking.</div><div class='add'>+ *</div><div class='add'>+ * No locks need be held - only a counted reference to @base is needed.</div><div class='ctx'>  *</div><div class='del'>- * The caller must hold base-&gt;i_mutex.</div><div class='ctx'>  */</div><div class='del'>-struct dentry *try_lookup_one_len(const char *name, struct dentry *base, int len)</div><div class='add'>+struct dentry *try_lookup_noperm(struct qstr *name, struct dentry *base)</div><div class='ctx'> {</div><div class='del'>-	struct qstr this;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	WARN_ON_ONCE(!inode_is_locked(base-&gt;d_inode));</div><div class='del'>-</div><div class='del'>-	err = lookup_one_common(&amp;init_user_ns, name, base, len, &amp;this);</div><div class='add'>+	err = lookup_noperm_common(name, base);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return ERR_PTR(err);</div><div class='ctx'> </div><div class='del'>-	return lookup_dcache(&amp;this, base, 0);</div><div class='add'>+	return d_lookup(base, name);</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(try_lookup_one_len);</div><div class='add'>+EXPORT_SYMBOL(try_lookup_noperm);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * lookup_one_len - filesystem helper to lookup single pathname component</div><div class='del'>- * @name:	pathname component to lookup</div><div class='add'>+ * lookup_noperm - filesystem helper to lookup single pathname component</div><div class='add'>+ * @name:	qstr storing pathname component to lookup</div><div class='ctx'>  * @base:	base directory to lookup from</div><div class='del'>- * @len:	maximum length @len should be interpreted to</div><div class='ctx'>  *</div><div class='ctx'>  * Note that this routine is purely a helper for filesystem usage and should</div><div class='del'>- * not be called by generic code.</div><div class='add'>+ * not be called by generic code.  It does no permission checking.</div><div class='ctx'>  *</div><div class='del'>- * The caller must hold base-&gt;i_mutex.</div><div class='add'>+ * The caller must hold base-&gt;i_rwsem.</div><div class='ctx'>  */</div><div class='del'>-struct dentry *lookup_one_len(const char *name, struct dentry *base, int len)</div><div class='add'>+struct dentry *lookup_noperm(struct qstr *name, struct dentry *base)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dentry;</div><div class='del'>-	struct qstr this;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	WARN_ON_ONCE(!inode_is_locked(base-&gt;d_inode));</div><div class='ctx'> </div><div class='del'>-	err = lookup_one_common(&amp;init_user_ns, name, base, len, &amp;this);</div><div class='add'>+	err = lookup_noperm_common(name, base);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return ERR_PTR(err);</div><div class='ctx'> </div><div class='del'>-	dentry = lookup_dcache(&amp;this, base, 0);</div><div class='del'>-	return dentry ? dentry : __lookup_slow(&amp;this, base, 0);</div><div class='add'>+	dentry = lookup_dcache(name, base, 0);</div><div class='add'>+	return dentry ? dentry : __lookup_slow(name, base, 0);</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(lookup_one_len);</div><div class='add'>+EXPORT_SYMBOL(lookup_noperm);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * lookup_one - filesystem helper to lookup single pathname component</div><div class='del'>- * @mnt_userns:	user namespace of the mount the lookup is performed from</div><div class='del'>- * @name:	pathname component to lookup</div><div class='add'>+ * lookup_one - lookup single pathname component</div><div class='add'>+ * @idmap:	idmap of the mount the lookup is performed from</div><div class='add'>+ * @name:	qstr holding pathname component to lookup</div><div class='ctx'>  * @base:	base directory to lookup from</div><div class='del'>- * @len:	maximum length @len should be interpreted to</div><div class='ctx'>  *</div><div class='del'>- * Note that this routine is purely a helper for filesystem usage and should</div><div class='del'>- * not be called by generic code.</div><div class='add'>+ * This can be used for in-kernel filesystem clients such as file servers.</div><div class='ctx'>  *</div><div class='del'>- * The caller must hold base-&gt;i_mutex.</div><div class='add'>+ * The caller must hold base-&gt;i_rwsem.</div><div class='ctx'>  */</div><div class='del'>-struct dentry *lookup_one(struct user_namespace *mnt_userns, const char *name,</div><div class='del'>-			  struct dentry *base, int len)</div><div class='add'>+struct dentry *lookup_one(struct mnt_idmap *idmap, struct qstr *name,</div><div class='add'>+			  struct dentry *base)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dentry;</div><div class='del'>-	struct qstr this;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	WARN_ON_ONCE(!inode_is_locked(base-&gt;d_inode));</div><div class='ctx'> </div><div class='del'>-	err = lookup_one_common(mnt_userns, name, base, len, &amp;this);</div><div class='add'>+	err = lookup_one_common(idmap, name, base);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return ERR_PTR(err);</div><div class='ctx'> </div><div class='del'>-	dentry = lookup_dcache(&amp;this, base, 0);</div><div class='del'>-	return dentry ? dentry : __lookup_slow(&amp;this, base, 0);</div><div class='add'>+	dentry = lookup_dcache(name, base, 0);</div><div class='add'>+	return dentry ? dentry : __lookup_slow(name, base, 0);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(lookup_one);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * lookup_one_len_unlocked - filesystem helper to lookup single pathname component</div><div class='add'>+ * lookup_one_unlocked - lookup single pathname component</div><div class='add'>+ * @idmap:	idmap of the mount the lookup is performed from</div><div class='add'>+ * @name:	qstr olding pathname component to lookup</div><div class='add'>+ * @base:	base directory to lookup from</div><div class='add'>+ *</div><div class='add'>+ * This can be used for in-kernel filesystem clients such as file servers.</div><div class='add'>+ *</div><div class='add'>+ * Unlike lookup_one, it should be called without the parent</div><div class='add'>+ * i_rwsem held, and will take the i_rwsem itself if necessary.</div><div class='add'>+ */</div><div class='add'>+struct dentry *lookup_one_unlocked(struct mnt_idmap *idmap, struct qstr *name,</div><div class='add'>+				   struct dentry *base)</div><div class='add'>+{</div><div class='add'>+	int err;</div><div class='add'>+	struct dentry *ret;</div><div class='add'>+</div><div class='add'>+	err = lookup_one_common(idmap, name, base);</div><div class='add'>+	if (err)</div><div class='add'>+		return ERR_PTR(err);</div><div class='add'>+</div><div class='add'>+	ret = lookup_dcache(name, base, 0);</div><div class='add'>+	if (!ret)</div><div class='add'>+		ret = lookup_slow(name, base, 0);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(lookup_one_unlocked);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * lookup_one_positive_killable - lookup single pathname component</div><div class='add'>+ * @idmap:	idmap of the mount the lookup is performed from</div><div class='add'>+ * @name:	qstr olding pathname component to lookup</div><div class='add'>+ * @base:	base directory to lookup from</div><div class='add'>+ *</div><div class='add'>+ * This helper will yield ERR_PTR(-ENOENT) on negatives. The helper returns</div><div class='add'>+ * known positive or ERR_PTR(). This is what most of the users want.</div><div class='add'>+ *</div><div class='add'>+ * Note that pinned negative with unlocked parent _can_ become positive at any</div><div class='add'>+ * time, so callers of lookup_one_unlocked() need to be very careful; pinned</div><div class='add'>+ * positives have &gt;d_inode stable, so this one avoids such problems.</div><div class='add'>+ *</div><div class='add'>+ * This can be used for in-kernel filesystem clients such as file servers.</div><div class='add'>+ *</div><div class='add'>+ * It should be called without the parent i_rwsem held, and will take</div><div class='add'>+ * the i_rwsem itself if necessary.  If a fatal signal is pending or</div><div class='add'>+ * delivered, it will return %-EINTR if the lock is needed.</div><div class='add'>+ */</div><div class='add'>+struct dentry *lookup_one_positive_killable(struct mnt_idmap *idmap,</div><div class='add'>+					    struct qstr *name,</div><div class='add'>+					    struct dentry *base)</div><div class='add'>+{</div><div class='add'>+	int err;</div><div class='add'>+	struct dentry *ret;</div><div class='add'>+</div><div class='add'>+	err = lookup_one_common(idmap, name, base);</div><div class='add'>+	if (err)</div><div class='add'>+		return ERR_PTR(err);</div><div class='add'>+</div><div class='add'>+	ret = lookup_dcache(name, base, 0);</div><div class='add'>+	if (!ret)</div><div class='add'>+		ret = lookup_slow_killable(name, base, 0);</div><div class='add'>+	if (!IS_ERR(ret) &amp;&amp; d_flags_negative(smp_load_acquire(&amp;ret-&gt;d_flags))) {</div><div class='add'>+		dput(ret);</div><div class='add'>+		ret = ERR_PTR(-ENOENT);</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(lookup_one_positive_killable);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * lookup_one_positive_unlocked - lookup single pathname component</div><div class='add'>+ * @idmap:	idmap of the mount the lookup is performed from</div><div class='add'>+ * @name:	qstr holding pathname component to lookup</div><div class='add'>+ * @base:	base directory to lookup from</div><div class='add'>+ *</div><div class='add'>+ * This helper will yield ERR_PTR(-ENOENT) on negatives. The helper returns</div><div class='add'>+ * known positive or ERR_PTR(). This is what most of the users want.</div><div class='add'>+ *</div><div class='add'>+ * Note that pinned negative with unlocked parent _can_ become positive at any</div><div class='add'>+ * time, so callers of lookup_one_unlocked() need to be very careful; pinned</div><div class='add'>+ * positives have &gt;d_inode stable, so this one avoids such problems.</div><div class='add'>+ *</div><div class='add'>+ * This can be used for in-kernel filesystem clients such as file servers.</div><div class='add'>+ *</div><div class='add'>+ * The helper should be called without i_rwsem held.</div><div class='add'>+ */</div><div class='add'>+struct dentry *lookup_one_positive_unlocked(struct mnt_idmap *idmap,</div><div class='add'>+					    struct qstr *name,</div><div class='add'>+					    struct dentry *base)</div><div class='add'>+{</div><div class='add'>+	struct dentry *ret = lookup_one_unlocked(idmap, name, base);</div><div class='add'>+</div><div class='add'>+	if (!IS_ERR(ret) &amp;&amp; d_flags_negative(smp_load_acquire(&amp;ret-&gt;d_flags))) {</div><div class='add'>+		dput(ret);</div><div class='add'>+		ret = ERR_PTR(-ENOENT);</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(lookup_one_positive_unlocked);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * lookup_noperm_unlocked - filesystem helper to lookup single pathname component</div><div class='ctx'>  * @name:	pathname component to lookup</div><div class='ctx'>  * @base:	base directory to lookup from</div><div class='del'>- * @len:	maximum length @len should be interpreted to</div><div class='ctx'>  *</div><div class='ctx'>  * Note that this routine is purely a helper for filesystem usage and should</div><div class='del'>- * not be called by generic code.</div><div class='add'>+ * not be called by generic code. It does no permission checking.</div><div class='ctx'>  *</div><div class='del'>- * Unlike lookup_one_len, it should be called without the parent</div><div class='del'>- * i_mutex held, and will take the i_mutex itself if necessary.</div><div class='add'>+ * Unlike lookup_noperm(), it should be called without the parent</div><div class='add'>+ * i_rwsem held, and will take the i_rwsem itself if necessary.</div><div class='add'>+ *</div><div class='add'>+ * Unlike try_lookup_noperm() it *does* revalidate the dentry if it already</div><div class='add'>+ * existed.</div><div class='ctx'>  */</div><div class='del'>-struct dentry *lookup_one_len_unlocked(const char *name,</div><div class='del'>-				       struct dentry *base, int len)</div><div class='add'>+struct dentry *lookup_noperm_unlocked(struct qstr *name, struct dentry *base)</div><div class='ctx'> {</div><div class='del'>-	struct qstr this;</div><div class='del'>-	int err;</div><div class='ctx'> 	struct dentry *ret;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='del'>-	err = lookup_one_common(&amp;init_user_ns, name, base, len, &amp;this);</div><div class='add'>+	err = lookup_noperm_common(name, base);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return ERR_PTR(err);</div><div class='ctx'> </div><div class='del'>-	ret = lookup_dcache(&amp;this, base, 0);</div><div class='add'>+	ret = lookup_dcache(name, base, 0);</div><div class='ctx'> 	if (!ret)</div><div class='del'>-		ret = lookup_slow(&amp;this, base, 0);</div><div class='add'>+		ret = lookup_slow(name, base, 0);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(lookup_one_len_unlocked);</div><div class='add'>+EXPORT_SYMBOL(lookup_noperm_unlocked);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Like lookup_one_len_unlocked(), except that it yields ERR_PTR(-ENOENT)</div><div class='add'>+ * Like lookup_noperm_unlocked(), except that it yields ERR_PTR(-ENOENT)</div><div class='ctx'>  * on negatives.  Returns known positive or ERR_PTR(); that's what</div><div class='ctx'>  * most of the users want.  Note that pinned negative with unlocked parent</div><div class='del'>- * _can_ become positive at any time, so callers of lookup_one_len_unlocked()</div><div class='add'>+ * _can_ become positive at any time, so callers of lookup_noperm_unlocked()</div><div class='ctx'>  * need to be very careful; pinned positives have -&gt;d_inode stable, so</div><div class='ctx'>  * this one avoids such problems.</div><div class='ctx'>  */</div><div class='del'>-struct dentry *lookup_positive_unlocked(const char *name,</div><div class='del'>-				       struct dentry *base, int len)</div><div class='add'>+struct dentry *lookup_noperm_positive_unlocked(struct qstr *name,</div><div class='add'>+					       struct dentry *base)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *ret = lookup_one_len_unlocked(name, base, len);</div><div class='add'>+	struct dentry *ret;</div><div class='add'>+</div><div class='add'>+	ret = lookup_noperm_unlocked(name, base);</div><div class='ctx'> 	if (!IS_ERR(ret) &amp;&amp; d_flags_negative(smp_load_acquire(&amp;ret-&gt;d_flags))) {</div><div class='ctx'> 		dput(ret);</div><div class='ctx'> 		ret = ERR_PTR(-ENOENT);</div><div class='ctx'> 	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(lookup_positive_unlocked);</div><div class='add'>+EXPORT_SYMBOL(lookup_noperm_positive_unlocked);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * start_creating - prepare to create a given name with permission checking</div><div class='add'>+ * @idmap:  idmap of the mount</div><div class='add'>+ * @parent: directory in which to prepare to create the name</div><div class='add'>+ * @name:   the name to be created</div><div class='add'>+ *</div><div class='add'>+ * Locks are taken and a lookup is performed prior to creating</div><div class='add'>+ * an object in a directory.  Permission checking (MAY_EXEC) is performed</div><div class='add'>+ * against @idmap.</div><div class='add'>+ *</div><div class='add'>+ * If the name already exists, a positive dentry is returned, so</div><div class='add'>+ * behaviour is similar to O_CREAT without O_EXCL, which doesn't fail</div><div class='add'>+ * with -EEXIST.</div><div class='add'>+ *</div><div class='add'>+ * Returns: a negative or positive dentry, or an error.</div><div class='add'>+ */</div><div class='add'>+struct dentry *start_creating(struct mnt_idmap *idmap, struct dentry *parent,</div><div class='add'>+			      struct qstr *name)</div><div class='add'>+{</div><div class='add'>+	int err = lookup_one_common(idmap, name, parent);</div><div class='add'>+</div><div class='add'>+	if (err)</div><div class='add'>+		return ERR_PTR(err);</div><div class='add'>+	return start_dirop(parent, name, LOOKUP_CREATE);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(start_creating);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * start_removing - prepare to remove a given name with permission checking</div><div class='add'>+ * @idmap:  idmap of the mount</div><div class='add'>+ * @parent: directory in which to find the name</div><div class='add'>+ * @name:   the name to be removed</div><div class='add'>+ *</div><div class='add'>+ * Locks are taken and a lookup in performed prior to removing</div><div class='add'>+ * an object from a directory.  Permission checking (MAY_EXEC) is performed</div><div class='add'>+ * against @idmap.</div><div class='add'>+ *</div><div class='add'>+ * If the name doesn't exist, an error is returned.</div><div class='add'>+ *</div><div class='add'>+ * end_removing() should be called when removal is complete, or aborted.</div><div class='add'>+ *</div><div class='add'>+ * Returns: a positive dentry, or an error.</div><div class='add'>+ */</div><div class='add'>+struct dentry *start_removing(struct mnt_idmap *idmap, struct dentry *parent,</div><div class='add'>+			      struct qstr *name)</div><div class='add'>+{</div><div class='add'>+	int err = lookup_one_common(idmap, name, parent);</div><div class='add'>+</div><div class='add'>+	if (err)</div><div class='add'>+		return ERR_PTR(err);</div><div class='add'>+	return start_dirop(parent, name, 0);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(start_removing);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * start_creating_killable - prepare to create a given name with permission checking</div><div class='add'>+ * @idmap:  idmap of the mount</div><div class='add'>+ * @parent: directory in which to prepare to create the name</div><div class='add'>+ * @name:   the name to be created</div><div class='add'>+ *</div><div class='add'>+ * Locks are taken and a lookup in performed prior to creating</div><div class='add'>+ * an object in a directory.  Permission checking (MAY_EXEC) is performed</div><div class='add'>+ * against @idmap.</div><div class='add'>+ *</div><div class='add'>+ * If the name already exists, a positive dentry is returned.</div><div class='add'>+ *</div><div class='add'>+ * If a signal is received or was already pending, the function aborts</div><div class='add'>+ * with -EINTR;</div><div class='add'>+ *</div><div class='add'>+ * Returns: a negative or positive dentry, or an error.</div><div class='add'>+ */</div><div class='add'>+struct dentry *start_creating_killable(struct mnt_idmap *idmap,</div><div class='add'>+				       struct dentry *parent,</div><div class='add'>+				       struct qstr *name)</div><div class='add'>+{</div><div class='add'>+	int err = lookup_one_common(idmap, name, parent);</div><div class='add'>+</div><div class='add'>+	if (err)</div><div class='add'>+		return ERR_PTR(err);</div><div class='add'>+	return __start_dirop(parent, name, LOOKUP_CREATE, TASK_KILLABLE);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(start_creating_killable);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * start_removing_killable - prepare to remove a given name with permission checking</div><div class='add'>+ * @idmap:  idmap of the mount</div><div class='add'>+ * @parent: directory in which to find the name</div><div class='add'>+ * @name:   the name to be removed</div><div class='add'>+ *</div><div class='add'>+ * Locks are taken and a lookup in performed prior to removing</div><div class='add'>+ * an object from a directory.  Permission checking (MAY_EXEC) is performed</div><div class='add'>+ * against @idmap.</div><div class='add'>+ *</div><div class='add'>+ * If the name doesn't exist, an error is returned.</div><div class='add'>+ *</div><div class='add'>+ * end_removing() should be called when removal is complete, or aborted.</div><div class='add'>+ *</div><div class='add'>+ * If a signal is received or was already pending, the function aborts</div><div class='add'>+ * with -EINTR;</div><div class='add'>+ *</div><div class='add'>+ * Returns: a positive dentry, or an error.</div><div class='add'>+ */</div><div class='add'>+struct dentry *start_removing_killable(struct mnt_idmap *idmap,</div><div class='add'>+				       struct dentry *parent,</div><div class='add'>+				       struct qstr *name)</div><div class='add'>+{</div><div class='add'>+	int err = lookup_one_common(idmap, name, parent);</div><div class='add'>+</div><div class='add'>+	if (err)</div><div class='add'>+		return ERR_PTR(err);</div><div class='add'>+	return __start_dirop(parent, name, 0, TASK_KILLABLE);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(start_removing_killable);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * start_creating_noperm - prepare to create a given name without permission checking</div><div class='add'>+ * @parent: directory in which to prepare to create the name</div><div class='add'>+ * @name:   the name to be created</div><div class='add'>+ *</div><div class='add'>+ * Locks are taken and a lookup in performed prior to creating</div><div class='add'>+ * an object in a directory.</div><div class='add'>+ *</div><div class='add'>+ * If the name already exists, a positive dentry is returned.</div><div class='add'>+ *</div><div class='add'>+ * Returns: a negative or positive dentry, or an error.</div><div class='add'>+ */</div><div class='add'>+struct dentry *start_creating_noperm(struct dentry *parent,</div><div class='add'>+				     struct qstr *name)</div><div class='add'>+{</div><div class='add'>+	int err = lookup_noperm_common(name, parent);</div><div class='add'>+</div><div class='add'>+	if (err)</div><div class='add'>+		return ERR_PTR(err);</div><div class='add'>+	return start_dirop(parent, name, LOOKUP_CREATE);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(start_creating_noperm);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * start_removing_noperm - prepare to remove a given name without permission checking</div><div class='add'>+ * @parent: directory in which to find the name</div><div class='add'>+ * @name:   the name to be removed</div><div class='add'>+ *</div><div class='add'>+ * Locks are taken and a lookup in performed prior to removing</div><div class='add'>+ * an object from a directory.</div><div class='add'>+ *</div><div class='add'>+ * If the name doesn't exist, an error is returned.</div><div class='add'>+ *</div><div class='add'>+ * end_removing() should be called when removal is complete, or aborted.</div><div class='add'>+ *</div><div class='add'>+ * Returns: a positive dentry, or an error.</div><div class='add'>+ */</div><div class='add'>+struct dentry *start_removing_noperm(struct dentry *parent,</div><div class='add'>+				     struct qstr *name)</div><div class='add'>+{</div><div class='add'>+	int err = lookup_noperm_common(name, parent);</div><div class='add'>+</div><div class='add'>+	if (err)</div><div class='add'>+		return ERR_PTR(err);</div><div class='add'>+	return start_dirop(parent, name, 0);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(start_removing_noperm);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * start_creating_dentry - prepare to create a given dentry</div><div class='add'>+ * @parent: directory from which dentry should be removed</div><div class='add'>+ * @child:  the dentry to be removed</div><div class='add'>+ *</div><div class='add'>+ * A lock is taken to protect the dentry again other dirops and</div><div class='add'>+ * the validity of the dentry is checked: correct parent and still hashed.</div><div class='add'>+ *</div><div class='add'>+ * If the dentry is valid and negative a reference is taken and</div><div class='add'>+ * returned.  If not an error is returned.</div><div class='add'>+ *</div><div class='add'>+ * end_creating() should be called when creation is complete, or aborted.</div><div class='add'>+ *</div><div class='add'>+ * Returns: the valid dentry, or an error.</div><div class='add'>+ */</div><div class='add'>+struct dentry *start_creating_dentry(struct dentry *parent,</div><div class='add'>+				     struct dentry *child)</div><div class='add'>+{</div><div class='add'>+	inode_lock_nested(parent-&gt;d_inode, I_MUTEX_PARENT);</div><div class='add'>+	if (unlikely(IS_DEADDIR(parent-&gt;d_inode) ||</div><div class='add'>+		     child-&gt;d_parent != parent ||</div><div class='add'>+		     d_unhashed(child))) {</div><div class='add'>+		inode_unlock(parent-&gt;d_inode);</div><div class='add'>+		return ERR_PTR(-EINVAL);</div><div class='add'>+	}</div><div class='add'>+	if (d_is_positive(child)) {</div><div class='add'>+		inode_unlock(parent-&gt;d_inode);</div><div class='add'>+		return ERR_PTR(-EEXIST);</div><div class='add'>+	}</div><div class='add'>+	return dget(child);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(start_creating_dentry);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * start_removing_dentry - prepare to remove a given dentry</div><div class='add'>+ * @parent: directory from which dentry should be removed</div><div class='add'>+ * @child:  the dentry to be removed</div><div class='add'>+ *</div><div class='add'>+ * A lock is taken to protect the dentry again other dirops and</div><div class='add'>+ * the validity of the dentry is checked: correct parent and still hashed.</div><div class='add'>+ *</div><div class='add'>+ * If the dentry is valid and positive, a reference is taken and</div><div class='add'>+ * returned.  If not an error is returned.</div><div class='add'>+ *</div><div class='add'>+ * end_removing() should be called when removal is complete, or aborted.</div><div class='add'>+ *</div><div class='add'>+ * Returns: the valid dentry, or an error.</div><div class='add'>+ */</div><div class='add'>+struct dentry *start_removing_dentry(struct dentry *parent,</div><div class='add'>+				     struct dentry *child)</div><div class='add'>+{</div><div class='add'>+	inode_lock_nested(parent-&gt;d_inode, I_MUTEX_PARENT);</div><div class='add'>+	if (unlikely(IS_DEADDIR(parent-&gt;d_inode) ||</div><div class='add'>+		     child-&gt;d_parent != parent ||</div><div class='add'>+		     d_unhashed(child))) {</div><div class='add'>+		inode_unlock(parent-&gt;d_inode);</div><div class='add'>+		return ERR_PTR(-EINVAL);</div><div class='add'>+	}</div><div class='add'>+	if (d_is_negative(child)) {</div><div class='add'>+		inode_unlock(parent-&gt;d_inode);</div><div class='add'>+		return ERR_PTR(-ENOENT);</div><div class='add'>+	}</div><div class='add'>+	return dget(child);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(start_removing_dentry);</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_UNIX98_PTYS</div><div class='ctx'> int path_pts(struct path *path)</div><div class='hunk'>@@ -2784,37 +3550,37 @@ int path_pts(struct path *path)</div><div class='ctx'> 	dput(path-&gt;dentry);</div><div class='ctx'> 	path-&gt;dentry = parent;</div><div class='ctx'> 	child = d_hash_and_lookup(parent, &amp;this);</div><div class='del'>-	if (!child)</div><div class='add'>+	if (IS_ERR_OR_NULL(child))</div><div class='ctx'> 		return -ENOENT;</div><div class='ctx'> </div><div class='ctx'> 	path-&gt;dentry = child;</div><div class='ctx'> 	dput(parent);</div><div class='del'>-	follow_down(path);</div><div class='add'>+	follow_down(path, 0);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-int user_path_at_empty(int dfd, const char __user *name, unsigned flags,</div><div class='del'>-		 struct path *path, int *empty)</div><div class='add'>+int user_path_at(int dfd, const char __user *name, unsigned flags,</div><div class='add'>+		 struct path *path)</div><div class='ctx'> {</div><div class='del'>-	struct filename *filename = getname_flags(name, flags, empty);</div><div class='add'>+	struct filename *filename = getname_flags(name, flags);</div><div class='ctx'> 	int ret = filename_lookup(dfd, filename, flags, path, NULL);</div><div class='ctx'> </div><div class='ctx'> 	putname(filename);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(user_path_at_empty);</div><div class='add'>+EXPORT_SYMBOL(user_path_at);</div><div class='ctx'> </div><div class='del'>-int __check_sticky(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+int __check_sticky(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		   struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	kuid_t fsuid = current_fsuid();</div><div class='ctx'> </div><div class='del'>-	if (uid_eq(i_uid_into_mnt(mnt_userns, inode), fsuid))</div><div class='add'>+	if (vfsuid_eq_kuid(i_uid_into_vfsuid(idmap, inode), fsuid))</div><div class='ctx'> 		return 0;</div><div class='del'>-	if (uid_eq(i_uid_into_mnt(mnt_userns, dir), fsuid))</div><div class='add'>+	if (vfsuid_eq_kuid(i_uid_into_vfsuid(idmap, dir), fsuid))</div><div class='ctx'> 		return 0;</div><div class='del'>-	return !capable_wrt_inode_uidgid(mnt_userns, inode, CAP_FOWNER);</div><div class='add'>+	return !capable_wrt_inode_uidgid(idmap, inode, CAP_FOWNER);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(__check_sticky);</div><div class='ctx'> </div><div class='hunk'>@@ -2838,7 +3604,7 @@ EXPORT_SYMBOL(__check_sticky);</div><div class='ctx'>  * 11. We don't allow removal of NFS sillyrenamed files; it's handled by</div><div class='ctx'>  *     nfs_async_unlink().</div><div class='ctx'>  */</div><div class='del'>-static int may_delete(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+static int may_delete(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		      struct dentry *victim, bool isdir)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_backing_inode(victim);</div><div class='hunk'>@@ -2851,21 +3617,21 @@ static int may_delete(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	BUG_ON(victim-&gt;d_parent-&gt;d_inode != dir);</div><div class='ctx'> </div><div class='ctx'> 	/* Inode writeback is not safe when the uid or gid are invalid. */</div><div class='del'>-	if (!uid_valid(i_uid_into_mnt(mnt_userns, inode)) ||</div><div class='del'>-	    !gid_valid(i_gid_into_mnt(mnt_userns, inode)))</div><div class='add'>+	if (!vfsuid_valid(i_uid_into_vfsuid(idmap, inode)) ||</div><div class='add'>+	    !vfsgid_valid(i_gid_into_vfsgid(idmap, inode)))</div><div class='ctx'> 		return -EOVERFLOW;</div><div class='ctx'> </div><div class='ctx'> 	audit_inode_child(dir, victim, AUDIT_TYPE_CHILD_DELETE);</div><div class='ctx'> </div><div class='del'>-	error = inode_permission(mnt_userns, dir, MAY_WRITE | MAY_EXEC);</div><div class='add'>+	error = inode_permission(idmap, dir, MAY_WRITE | MAY_EXEC);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> 	if (IS_APPEND(dir))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='del'>-	if (check_sticky(mnt_userns, dir, inode) || IS_APPEND(inode) ||</div><div class='add'>+	if (check_sticky(idmap, dir, inode) || IS_APPEND(inode) ||</div><div class='ctx'> 	    IS_IMMUTABLE(inode) || IS_SWAPFILE(inode) ||</div><div class='del'>-	    HAS_UNMAPPED_ID(mnt_userns, inode))</div><div class='add'>+	    HAS_UNMAPPED_ID(idmap, inode))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> 	if (isdir) {</div><div class='ctx'> 		if (!d_is_dir(victim))</div><div class='hunk'>@@ -2890,7 +3656,7 @@ static int may_delete(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'>  *  4. We should have write and exec permissions on dir</div><div class='ctx'>  *  5. We can't do it if dir is immutable (done in permission())</div><div class='ctx'>  */</div><div class='del'>-static inline int may_create(struct user_namespace *mnt_userns,</div><div class='add'>+static inline int may_create(struct mnt_idmap *idmap,</div><div class='ctx'> 			     struct inode *dir, struct dentry *child)</div><div class='ctx'> {</div><div class='ctx'> 	audit_inode_child(dir, child, AUDIT_TYPE_CHILD_CREATE);</div><div class='hunk'>@@ -2898,10 +3664,43 @@ static inline int may_create(struct user_namespace *mnt_userns,</div><div class='ctx'> 		return -EEXIST;</div><div class='ctx'> 	if (IS_DEADDIR(dir))</div><div class='ctx'> 		return -ENOENT;</div><div class='del'>-	if (!fsuidgid_has_mapping(dir-&gt;i_sb, mnt_userns))</div><div class='add'>+	if (!fsuidgid_has_mapping(dir-&gt;i_sb, idmap))</div><div class='ctx'> 		return -EOVERFLOW;</div><div class='ctx'> </div><div class='del'>-	return inode_permission(mnt_userns, dir, MAY_WRITE | MAY_EXEC);</div><div class='add'>+	return inode_permission(idmap, dir, MAY_WRITE | MAY_EXEC);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+// p1 != p2, both are on the same filesystem, -&gt;s_vfs_rename_mutex is held</div><div class='add'>+static struct dentry *lock_two_directories(struct dentry *p1, struct dentry *p2)</div><div class='add'>+{</div><div class='add'>+	struct dentry *p = p1, *q = p2, *r;</div><div class='add'>+</div><div class='add'>+	while ((r = p-&gt;d_parent) != p2 &amp;&amp; r != p)</div><div class='add'>+		p = r;</div><div class='add'>+	if (r == p2) {</div><div class='add'>+		// p is a child of p2 and an ancestor of p1 or p1 itself</div><div class='add'>+		inode_lock_nested(p2-&gt;d_inode, I_MUTEX_PARENT);</div><div class='add'>+		inode_lock_nested(p1-&gt;d_inode, I_MUTEX_PARENT2);</div><div class='add'>+		return p;</div><div class='add'>+	}</div><div class='add'>+	// p is the root of connected component that contains p1</div><div class='add'>+	// p2 does not occur on the path from p to p1</div><div class='add'>+	while ((r = q-&gt;d_parent) != p1 &amp;&amp; r != p &amp;&amp; r != q)</div><div class='add'>+		q = r;</div><div class='add'>+	if (r == p1) {</div><div class='add'>+		// q is a child of p1 and an ancestor of p2 or p2 itself</div><div class='add'>+		inode_lock_nested(p1-&gt;d_inode, I_MUTEX_PARENT);</div><div class='add'>+		inode_lock_nested(p2-&gt;d_inode, I_MUTEX_PARENT2);</div><div class='add'>+		return q;</div><div class='add'>+	} else if (likely(r == p)) {</div><div class='add'>+		// both p2 and p1 are descendents of p</div><div class='add'>+		inode_lock_nested(p1-&gt;d_inode, I_MUTEX_PARENT);</div><div class='add'>+		inode_lock_nested(p2-&gt;d_inode, I_MUTEX_PARENT2);</div><div class='add'>+		return NULL;</div><div class='add'>+	} else { // no common ancestor at the time we'd been called</div><div class='add'>+		mutex_unlock(&amp;p1-&gt;d_sb-&gt;s_vfs_rename_mutex);</div><div class='add'>+		return ERR_PTR(-EXDEV);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2909,34 +3708,57 @@ static inline int may_create(struct user_namespace *mnt_userns,</div><div class='ctx'>  */</div><div class='ctx'> struct dentry *lock_rename(struct dentry *p1, struct dentry *p2)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *p;</div><div class='del'>-</div><div class='ctx'> 	if (p1 == p2) {</div><div class='ctx'> 		inode_lock_nested(p1-&gt;d_inode, I_MUTEX_PARENT);</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock(&amp;p1-&gt;d_sb-&gt;s_vfs_rename_mutex);</div><div class='add'>+	return lock_two_directories(p1, p2);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(lock_rename);</div><div class='ctx'> </div><div class='del'>-	p = d_ancestor(p2, p1);</div><div class='del'>-	if (p) {</div><div class='add'>+/*</div><div class='add'>+ * c1 and p2 should be on the same fs.</div><div class='add'>+ */</div><div class='add'>+struct dentry *lock_rename_child(struct dentry *c1, struct dentry *p2)</div><div class='add'>+{</div><div class='add'>+	if (READ_ONCE(c1-&gt;d_parent) == p2) {</div><div class='add'>+		/*</div><div class='add'>+		 * hopefully won't need to touch -&gt;s_vfs_rename_mutex at all.</div><div class='add'>+		 */</div><div class='ctx'> 		inode_lock_nested(p2-&gt;d_inode, I_MUTEX_PARENT);</div><div class='del'>-		inode_lock_nested(p1-&gt;d_inode, I_MUTEX_CHILD);</div><div class='del'>-		return p;</div><div class='del'>-	}</div><div class='add'>+		/*</div><div class='add'>+		 * now that p2 is locked, nobody can move in or out of it,</div><div class='add'>+		 * so the test below is safe.</div><div class='add'>+		 */</div><div class='add'>+		if (likely(c1-&gt;d_parent == p2))</div><div class='add'>+			return NULL;</div><div class='ctx'> </div><div class='del'>-	p = d_ancestor(p1, p2);</div><div class='del'>-	if (p) {</div><div class='del'>-		inode_lock_nested(p1-&gt;d_inode, I_MUTEX_PARENT);</div><div class='del'>-		inode_lock_nested(p2-&gt;d_inode, I_MUTEX_CHILD);</div><div class='del'>-		return p;</div><div class='add'>+		/*</div><div class='add'>+		 * c1 got moved out of p2 while we'd been taking locks;</div><div class='add'>+		 * unlock and fall back to slow case.</div><div class='add'>+		 */</div><div class='add'>+		inode_unlock(p2-&gt;d_inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	inode_lock_nested(p1-&gt;d_inode, I_MUTEX_PARENT);</div><div class='del'>-	inode_lock_nested(p2-&gt;d_inode, I_MUTEX_PARENT2);</div><div class='add'>+	mutex_lock(&amp;c1-&gt;d_sb-&gt;s_vfs_rename_mutex);</div><div class='add'>+	/*</div><div class='add'>+	 * nobody can move out of any directories on this fs.</div><div class='add'>+	 */</div><div class='add'>+	if (likely(c1-&gt;d_parent != p2))</div><div class='add'>+		return lock_two_directories(c1-&gt;d_parent, p2);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * c1 got moved into p2 while we were taking locks;</div><div class='add'>+	 * we need p2 locked and -&gt;s_vfs_rename_mutex unlocked,</div><div class='add'>+	 * for consistency with lock_rename().</div><div class='add'>+	 */</div><div class='add'>+	inode_lock_nested(p2-&gt;d_inode, I_MUTEX_PARENT);</div><div class='add'>+	mutex_unlock(&amp;c1-&gt;d_sb-&gt;s_vfs_rename_mutex);</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(lock_rename);</div><div class='add'>+EXPORT_SYMBOL(lock_rename_child);</div><div class='ctx'> </div><div class='ctx'> void unlock_rename(struct dentry *p1, struct dentry *p2)</div><div class='ctx'> {</div><div class='hunk'>@@ -2949,36 +3771,365 @@ void unlock_rename(struct dentry *p1, struct dentry *p2)</div><div class='ctx'> EXPORT_SYMBOL(unlock_rename);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='add'>+ * __start_renaming - lookup and lock names for rename</div><div class='add'>+ * @rd:           rename data containing parents and flags, and</div><div class='add'>+ *                for receiving found dentries</div><div class='add'>+ * @lookup_flags: extra flags to pass to -&gt;lookup (e.g. LOOKUP_REVAL,</div><div class='add'>+ *                LOOKUP_NO_SYMLINKS etc).</div><div class='add'>+ * @old_last:     name of object in @rd.old_parent</div><div class='add'>+ * @new_last:     name of object in @rd.new_parent</div><div class='add'>+ *</div><div class='add'>+ * Look up two names and ensure locks are in place for</div><div class='add'>+ * rename.</div><div class='add'>+ *</div><div class='add'>+ * On success the found dentries are stored in @rd.old_dentry,</div><div class='add'>+ * @rd.new_dentry and an extra ref is taken on @rd.old_parent.</div><div class='add'>+ * These references and the lock are dropped by end_renaming().</div><div class='add'>+ *</div><div class='add'>+ * The passed in qstrs must have the hash calculated, and no permission</div><div class='add'>+ * checking is performed.</div><div class='add'>+ *</div><div class='add'>+ * Returns: zero or an error.</div><div class='add'>+ */</div><div class='add'>+static int</div><div class='add'>+__start_renaming(struct renamedata *rd, int lookup_flags,</div><div class='add'>+		 struct qstr *old_last, struct qstr *new_last)</div><div class='add'>+{</div><div class='add'>+	struct dentry *trap;</div><div class='add'>+	struct dentry *d1, *d2;</div><div class='add'>+	int target_flags = LOOKUP_RENAME_TARGET | LOOKUP_CREATE;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	if (rd-&gt;flags &amp; RENAME_EXCHANGE)</div><div class='add'>+		target_flags = 0;</div><div class='add'>+	if (rd-&gt;flags &amp; RENAME_NOREPLACE)</div><div class='add'>+		target_flags |= LOOKUP_EXCL;</div><div class='add'>+</div><div class='add'>+	trap = lock_rename(rd-&gt;old_parent, rd-&gt;new_parent);</div><div class='add'>+	if (IS_ERR(trap))</div><div class='add'>+		return PTR_ERR(trap);</div><div class='add'>+</div><div class='add'>+	d1 = lookup_one_qstr_excl(old_last, rd-&gt;old_parent,</div><div class='add'>+				  lookup_flags);</div><div class='add'>+	err = PTR_ERR(d1);</div><div class='add'>+	if (IS_ERR(d1))</div><div class='add'>+		goto out_unlock;</div><div class='add'>+</div><div class='add'>+	d2 = lookup_one_qstr_excl(new_last, rd-&gt;new_parent,</div><div class='add'>+				  lookup_flags | target_flags);</div><div class='add'>+	err = PTR_ERR(d2);</div><div class='add'>+	if (IS_ERR(d2))</div><div class='add'>+		goto out_dput_d1;</div><div class='add'>+</div><div class='add'>+	if (d1 == trap) {</div><div class='add'>+		/* source is an ancestor of target */</div><div class='add'>+		err = -EINVAL;</div><div class='add'>+		goto out_dput_d2;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (d2 == trap) {</div><div class='add'>+		/* target is an ancestor of source */</div><div class='add'>+		if (rd-&gt;flags &amp; RENAME_EXCHANGE)</div><div class='add'>+			err = -EINVAL;</div><div class='add'>+		else</div><div class='add'>+			err = -ENOTEMPTY;</div><div class='add'>+		goto out_dput_d2;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	rd-&gt;old_dentry = d1;</div><div class='add'>+	rd-&gt;new_dentry = d2;</div><div class='add'>+	dget(rd-&gt;old_parent);</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+out_dput_d2:</div><div class='add'>+	dput(d2);</div><div class='add'>+out_dput_d1:</div><div class='add'>+	dput(d1);</div><div class='add'>+out_unlock:</div><div class='add'>+	unlock_rename(rd-&gt;old_parent, rd-&gt;new_parent);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * start_renaming - lookup and lock names for rename with permission checking</div><div class='add'>+ * @rd:           rename data containing parents and flags, and</div><div class='add'>+ *                for receiving found dentries</div><div class='add'>+ * @lookup_flags: extra flags to pass to -&gt;lookup (e.g. LOOKUP_REVAL,</div><div class='add'>+ *                LOOKUP_NO_SYMLINKS etc).</div><div class='add'>+ * @old_last:     name of object in @rd.old_parent</div><div class='add'>+ * @new_last:     name of object in @rd.new_parent</div><div class='add'>+ *</div><div class='add'>+ * Look up two names and ensure locks are in place for</div><div class='add'>+ * rename.</div><div class='add'>+ *</div><div class='add'>+ * On success the found dentries are stored in @rd.old_dentry,</div><div class='add'>+ * @rd.new_dentry.  Also the refcount on @rd-&gt;old_parent is increased.</div><div class='add'>+ * These references and the lock are dropped by end_renaming().</div><div class='add'>+ *</div><div class='add'>+ * The passed in qstrs need not have the hash calculated, and basic</div><div class='add'>+ * eXecute permission checking is performed against @rd.mnt_idmap.</div><div class='add'>+ *</div><div class='add'>+ * Returns: zero or an error.</div><div class='add'>+ */</div><div class='add'>+int start_renaming(struct renamedata *rd, int lookup_flags,</div><div class='add'>+		   struct qstr *old_last, struct qstr *new_last)</div><div class='add'>+{</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = lookup_one_common(rd-&gt;mnt_idmap, old_last, rd-&gt;old_parent);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+	err = lookup_one_common(rd-&gt;mnt_idmap, new_last, rd-&gt;new_parent);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+	return __start_renaming(rd, lookup_flags, old_last, new_last);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(start_renaming);</div><div class='add'>+</div><div class='add'>+static int</div><div class='add'>+__start_renaming_dentry(struct renamedata *rd, int lookup_flags,</div><div class='add'>+			struct dentry *old_dentry, struct qstr *new_last)</div><div class='add'>+{</div><div class='add'>+	struct dentry *trap;</div><div class='add'>+	struct dentry *d2;</div><div class='add'>+	int target_flags = LOOKUP_RENAME_TARGET | LOOKUP_CREATE;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	if (rd-&gt;flags &amp; RENAME_EXCHANGE)</div><div class='add'>+		target_flags = 0;</div><div class='add'>+	if (rd-&gt;flags &amp; RENAME_NOREPLACE)</div><div class='add'>+		target_flags |= LOOKUP_EXCL;</div><div class='add'>+</div><div class='add'>+	/* Already have the dentry - need to be sure to lock the correct parent */</div><div class='add'>+	trap = lock_rename_child(old_dentry, rd-&gt;new_parent);</div><div class='add'>+	if (IS_ERR(trap))</div><div class='add'>+		return PTR_ERR(trap);</div><div class='add'>+	if (d_unhashed(old_dentry) ||</div><div class='add'>+	    (rd-&gt;old_parent &amp;&amp; rd-&gt;old_parent != old_dentry-&gt;d_parent)) {</div><div class='add'>+		/* dentry was removed, or moved and explicit parent requested */</div><div class='add'>+		err = -EINVAL;</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	d2 = lookup_one_qstr_excl(new_last, rd-&gt;new_parent,</div><div class='add'>+				  lookup_flags | target_flags);</div><div class='add'>+	err = PTR_ERR(d2);</div><div class='add'>+	if (IS_ERR(d2))</div><div class='add'>+		goto out_unlock;</div><div class='add'>+</div><div class='add'>+	if (old_dentry == trap) {</div><div class='add'>+		/* source is an ancestor of target */</div><div class='add'>+		err = -EINVAL;</div><div class='add'>+		goto out_dput_d2;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (d2 == trap) {</div><div class='add'>+		/* target is an ancestor of source */</div><div class='add'>+		if (rd-&gt;flags &amp; RENAME_EXCHANGE)</div><div class='add'>+			err = -EINVAL;</div><div class='add'>+		else</div><div class='add'>+			err = -ENOTEMPTY;</div><div class='add'>+		goto out_dput_d2;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	rd-&gt;old_dentry = dget(old_dentry);</div><div class='add'>+	rd-&gt;new_dentry = d2;</div><div class='add'>+	rd-&gt;old_parent = dget(old_dentry-&gt;d_parent);</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+out_dput_d2:</div><div class='add'>+	dput(d2);</div><div class='add'>+out_unlock:</div><div class='add'>+	unlock_rename(old_dentry-&gt;d_parent, rd-&gt;new_parent);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * start_renaming_dentry - lookup and lock name for rename with permission checking</div><div class='add'>+ * @rd:           rename data containing parents and flags, and</div><div class='add'>+ *                for receiving found dentries</div><div class='add'>+ * @lookup_flags: extra flags to pass to -&gt;lookup (e.g. LOOKUP_REVAL,</div><div class='add'>+ *                LOOKUP_NO_SYMLINKS etc).</div><div class='add'>+ * @old_dentry:   dentry of name to move</div><div class='add'>+ * @new_last:     name of target in @rd.new_parent</div><div class='add'>+ *</div><div class='add'>+ * Look up target name and ensure locks are in place for</div><div class='add'>+ * rename.</div><div class='add'>+ *</div><div class='add'>+ * On success the found dentry is stored in @rd.new_dentry and</div><div class='add'>+ * @rd.old_parent is confirmed to be the parent of @old_dentry.  If it</div><div class='add'>+ * was originally %NULL, it is set.  In either case a reference is taken</div><div class='add'>+ * so that end_renaming() can have a stable reference to unlock.</div><div class='add'>+ *</div><div class='add'>+ * References and the lock can be dropped with end_renaming()</div><div class='add'>+ *</div><div class='add'>+ * The passed in qstr need not have the hash calculated, and basic</div><div class='add'>+ * eXecute permission checking is performed against @rd.mnt_idmap.</div><div class='add'>+ *</div><div class='add'>+ * Returns: zero or an error.</div><div class='add'>+ */</div><div class='add'>+int start_renaming_dentry(struct renamedata *rd, int lookup_flags,</div><div class='add'>+			  struct dentry *old_dentry, struct qstr *new_last)</div><div class='add'>+{</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = lookup_one_common(rd-&gt;mnt_idmap, new_last, rd-&gt;new_parent);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+	return __start_renaming_dentry(rd, lookup_flags, old_dentry, new_last);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(start_renaming_dentry);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * start_renaming_two_dentries - Lock to dentries in given parents for rename</div><div class='add'>+ * @rd:           rename data containing parent</div><div class='add'>+ * @old_dentry:   dentry of name to move</div><div class='add'>+ * @new_dentry:   dentry to move to</div><div class='add'>+ *</div><div class='add'>+ * Ensure locks are in place for rename and check parentage is still correct.</div><div class='add'>+ *</div><div class='add'>+ * On success the two dentries are stored in @rd.old_dentry and</div><div class='add'>+ * @rd.new_dentry and @rd.old_parent and @rd.new_parent are confirmed to</div><div class='add'>+ * be the parents of the dentries.</div><div class='add'>+ *</div><div class='add'>+ * References and the lock can be dropped with end_renaming()</div><div class='add'>+ *</div><div class='add'>+ * Returns: zero or an error.</div><div class='add'>+ */</div><div class='add'>+int</div><div class='add'>+start_renaming_two_dentries(struct renamedata *rd,</div><div class='add'>+			    struct dentry *old_dentry, struct dentry *new_dentry)</div><div class='add'>+{</div><div class='add'>+	struct dentry *trap;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	/* Already have the dentry - need to be sure to lock the correct parent */</div><div class='add'>+	trap = lock_rename_child(old_dentry, rd-&gt;new_parent);</div><div class='add'>+	if (IS_ERR(trap))</div><div class='add'>+		return PTR_ERR(trap);</div><div class='add'>+	err = -EINVAL;</div><div class='add'>+	if (d_unhashed(old_dentry) ||</div><div class='add'>+	    (rd-&gt;old_parent &amp;&amp; rd-&gt;old_parent != old_dentry-&gt;d_parent))</div><div class='add'>+		/* old_dentry was removed, or moved and explicit parent requested */</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	if (d_unhashed(new_dentry) ||</div><div class='add'>+	    rd-&gt;new_parent != new_dentry-&gt;d_parent)</div><div class='add'>+		/* new_dentry was removed or moved */</div><div class='add'>+		goto out_unlock;</div><div class='add'>+</div><div class='add'>+	if (old_dentry == trap)</div><div class='add'>+		/* source is an ancestor of target */</div><div class='add'>+		goto out_unlock;</div><div class='add'>+</div><div class='add'>+	if (new_dentry == trap) {</div><div class='add'>+		/* target is an ancestor of source */</div><div class='add'>+		if (rd-&gt;flags &amp; RENAME_EXCHANGE)</div><div class='add'>+			err = -EINVAL;</div><div class='add'>+		else</div><div class='add'>+			err = -ENOTEMPTY;</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	err = -EEXIST;</div><div class='add'>+	if (d_is_positive(new_dentry) &amp;&amp; (rd-&gt;flags &amp; RENAME_NOREPLACE))</div><div class='add'>+		goto out_unlock;</div><div class='add'>+</div><div class='add'>+	rd-&gt;old_dentry = dget(old_dentry);</div><div class='add'>+	rd-&gt;new_dentry = dget(new_dentry);</div><div class='add'>+	rd-&gt;old_parent = dget(old_dentry-&gt;d_parent);</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+out_unlock:</div><div class='add'>+	unlock_rename(old_dentry-&gt;d_parent, rd-&gt;new_parent);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(start_renaming_two_dentries);</div><div class='add'>+</div><div class='add'>+void end_renaming(struct renamedata *rd)</div><div class='add'>+{</div><div class='add'>+	unlock_rename(rd-&gt;old_parent, rd-&gt;new_parent);</div><div class='add'>+	dput(rd-&gt;old_dentry);</div><div class='add'>+	dput(rd-&gt;new_dentry);</div><div class='add'>+	dput(rd-&gt;old_parent);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(end_renaming);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * vfs_prepare_mode - prepare the mode to be used for a new inode</div><div class='add'>+ * @idmap:	idmap of the mount the inode was found from</div><div class='add'>+ * @dir:	parent directory of the new inode</div><div class='add'>+ * @mode:	mode of the new inode</div><div class='add'>+ * @mask_perms:	allowed permission by the vfs</div><div class='add'>+ * @type:	type of file to be created</div><div class='add'>+ *</div><div class='add'>+ * This helper consolidates and enforces vfs restrictions on the @mode of a new</div><div class='add'>+ * object to be created.</div><div class='add'>+ *</div><div class='add'>+ * Umask stripping depends on whether the filesystem supports POSIX ACLs (see</div><div class='add'>+ * the kernel documentation for mode_strip_umask()). Moving umask stripping</div><div class='add'>+ * after setgid stripping allows the same ordering for both non-POSIX ACL and</div><div class='add'>+ * POSIX ACL supporting filesystems.</div><div class='add'>+ *</div><div class='add'>+ * Note that it's currently valid for @type to be 0 if a directory is created.</div><div class='add'>+ * Filesystems raise that flag individually and we need to check whether each</div><div class='add'>+ * filesystem can deal with receiving S_IFDIR from the vfs before we enforce a</div><div class='add'>+ * non-zero type.</div><div class='add'>+ *</div><div class='add'>+ * Returns: mode to be passed to the filesystem</div><div class='add'>+ */</div><div class='add'>+static inline umode_t vfs_prepare_mode(struct mnt_idmap *idmap,</div><div class='add'>+				       const struct inode *dir, umode_t mode,</div><div class='add'>+				       umode_t mask_perms, umode_t type)</div><div class='add'>+{</div><div class='add'>+	mode = mode_strip_sgid(idmap, dir, mode);</div><div class='add'>+	mode = mode_strip_umask(dir, mode);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Apply the vfs mandated allowed permission mask and set the type of</div><div class='add'>+	 * file to be created before we call into the filesystem.</div><div class='add'>+	 */</div><div class='add'>+	mode &amp;= (mask_perms &amp; ~S_IFMT);</div><div class='add'>+	mode |= (type &amp; S_IFMT);</div><div class='add'>+</div><div class='add'>+	return mode;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='ctx'>  * vfs_create - create new file</div><div class='del'>- * @mnt_userns:	user namespace of the mount the inode was found from</div><div class='del'>- * @dir:	inode of @dentry</div><div class='del'>- * @dentry:	pointer to dentry of the base directory</div><div class='del'>- * @mode:	mode of the new file</div><div class='del'>- * @want_excl:	whether the file must not yet exist</div><div class='add'>+ * @idmap:	idmap of the mount the inode was found from</div><div class='add'>+ * @dentry:	dentry of the child file</div><div class='add'>+ * @mode:	mode of the child file</div><div class='add'>+ * @di:		returns parent inode, if the inode is delegated.</div><div class='ctx'>  *</div><div class='ctx'>  * Create a new file.</div><div class='ctx'>  *</div><div class='del'>- * If the inode has been found through an idmapped mount the user namespace of</div><div class='del'>- * the vfsmount must be passed through @mnt_userns. This function will then take</div><div class='del'>- * care to map the inode according to @mnt_userns before checking permissions.</div><div class='add'>+ * If the inode has been found through an idmapped mount the idmap of</div><div class='add'>+ * the vfsmount must be passed through @idmap. This function will then take</div><div class='add'>+ * care to map the inode according to @idmap before checking permissions.</div><div class='ctx'>  * On non-idmapped mounts or if permission checking is to be performed on the</div><div class='del'>- * raw inode simply passs init_user_ns.</div><div class='add'>+ * raw inode simply pass @nop_mnt_idmap.</div><div class='ctx'>  */</div><div class='del'>-int vfs_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-	       struct dentry *dentry, umode_t mode, bool want_excl)</div><div class='add'>+int vfs_create(struct mnt_idmap *idmap, struct dentry *dentry, umode_t mode,</div><div class='add'>+	       struct delegated_inode *di)</div><div class='ctx'> {</div><div class='del'>-	int error = may_create(mnt_userns, dir, dentry);</div><div class='add'>+	struct inode *dir = d_inode(dentry-&gt;d_parent);</div><div class='add'>+	int error;</div><div class='add'>+</div><div class='add'>+	error = may_create(idmap, dir, dentry);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='ctx'> 	if (!dir-&gt;i_op-&gt;create)</div><div class='ctx'> 		return -EACCES;	/* shouldn't it be ENOSYS? */</div><div class='del'>-	mode &amp;= S_IALLUGO;</div><div class='del'>-	mode |= S_IFREG;</div><div class='add'>+</div><div class='add'>+	mode = vfs_prepare_mode(idmap, dir, mode, S_IALLUGO, S_IFREG);</div><div class='ctx'> 	error = security_inode_create(dir, dentry, mode);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='del'>-	error = dir-&gt;i_op-&gt;create(mnt_userns, dir, dentry, mode, want_excl);</div><div class='add'>+	error = try_break_deleg(dir, di);</div><div class='add'>+	if (error)</div><div class='add'>+		return error;</div><div class='add'>+	error = dir-&gt;i_op-&gt;create(idmap, dir, dentry, mode, true);</div><div class='ctx'> 	if (!error)</div><div class='ctx'> 		fsnotify_create(dir, dentry);</div><div class='ctx'> 	return error;</div><div class='hunk'>@@ -2990,7 +4141,7 @@ int vfs_mkobj(struct dentry *dentry, umode_t mode,</div><div class='ctx'> 		void *arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *dir = dentry-&gt;d_parent-&gt;d_inode;</div><div class='del'>-	int error = may_create(&amp;init_user_ns, dir, dentry);</div><div class='add'>+	int error = may_create(&amp;nop_mnt_idmap, dir, dentry);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='hunk'>@@ -3012,7 +4163,7 @@ bool may_open_dev(const struct path *path)</div><div class='ctx'> 		!(path-&gt;mnt-&gt;mnt_sb-&gt;s_iflags &amp; SB_I_NODEV);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int may_open(struct user_namespace *mnt_userns, const struct path *path,</div><div class='add'>+static int may_open(struct mnt_idmap *idmap, const struct path *path,</div><div class='ctx'> 		    int acc_mode, int flag)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dentry = path-&gt;dentry;</div><div class='hunk'>@@ -3046,9 +4197,11 @@ static int may_open(struct user_namespace *mnt_userns, const struct path *path,</div><div class='ctx'> 		if ((acc_mode &amp; MAY_EXEC) &amp;&amp; path_noexec(path))</div><div class='ctx'> 			return -EACCES;</div><div class='ctx'> 		break;</div><div class='add'>+	default:</div><div class='add'>+		VFS_BUG_ON_INODE(!IS_ANON_FILE(inode), inode);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	error = inode_permission(mnt_userns, inode, MAY_OPEN | acc_mode);</div><div class='add'>+	error = inode_permission(idmap, inode, MAY_OPEN | acc_mode);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='hunk'>@@ -3063,13 +4216,13 @@ static int may_open(struct user_namespace *mnt_userns, const struct path *path,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* O_NOATIME can only be set by the owner or superuser */</div><div class='del'>-	if (flag &amp; O_NOATIME &amp;&amp; !inode_owner_or_capable(mnt_userns, inode))</div><div class='add'>+	if (flag &amp; O_NOATIME &amp;&amp; !inode_owner_or_capable(idmap, inode))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int handle_truncate(struct user_namespace *mnt_userns, struct file *filp)</div><div class='add'>+static int handle_truncate(struct mnt_idmap *idmap, struct file *filp)</div><div class='ctx'> {</div><div class='ctx'> 	const struct path *path = &amp;filp-&gt;f_path;</div><div class='ctx'> 	struct inode *inode = path-&gt;dentry-&gt;d_inode;</div><div class='hunk'>@@ -3077,9 +4230,9 @@ static int handle_truncate(struct user_namespace *mnt_userns, struct file *filp)</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='del'>-	error = security_path_truncate(path);</div><div class='add'>+	error = security_file_truncate(filp);</div><div class='ctx'> 	if (!error) {</div><div class='del'>-		error = do_truncate(mnt_userns, path-&gt;dentry, 0,</div><div class='add'>+		error = do_truncate(idmap, path-&gt;dentry, 0,</div><div class='ctx'> 				    ATTR_MTIME|ATTR_CTIME|ATTR_OPEN,</div><div class='ctx'> 				    filp);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3094,7 +4247,7 @@ static inline int open_to_namei_flags(int flag)</div><div class='ctx'> 	return flag;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int may_o_create(struct user_namespace *mnt_userns,</div><div class='add'>+static int may_o_create(struct mnt_idmap *idmap,</div><div class='ctx'> 			const struct path *dir, struct dentry *dentry,</div><div class='ctx'> 			umode_t mode)</div><div class='ctx'> {</div><div class='hunk'>@@ -3102,10 +4255,10 @@ static int may_o_create(struct user_namespace *mnt_userns,</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='del'>-	if (!fsuidgid_has_mapping(dir-&gt;dentry-&gt;d_sb, mnt_userns))</div><div class='add'>+	if (!fsuidgid_has_mapping(dir-&gt;dentry-&gt;d_sb, idmap))</div><div class='ctx'> 		return -EOVERFLOW;</div><div class='ctx'> </div><div class='del'>-	error = inode_permission(mnt_userns, dir-&gt;dentry-&gt;d_inode,</div><div class='add'>+	error = inode_permission(idmap, dir-&gt;dentry-&gt;d_inode,</div><div class='ctx'> 				 MAY_WRITE | MAY_EXEC);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='hunk'>@@ -3137,8 +4290,8 @@ static struct dentry *atomic_open(struct nameidata *nd, struct dentry *dentry,</div><div class='ctx'> 	if (nd-&gt;flags &amp; LOOKUP_DIRECTORY)</div><div class='ctx'> 		open_flag |= O_DIRECTORY;</div><div class='ctx'> </div><div class='del'>-	file-&gt;f_path.dentry = DENTRY_NOT_SET;</div><div class='del'>-	file-&gt;f_path.mnt = nd-&gt;path.mnt;</div><div class='add'>+	file-&gt;__f_path.dentry = DENTRY_NOT_SET;</div><div class='add'>+	file-&gt;__f_path.mnt = nd-&gt;path.mnt;</div><div class='ctx'> 	error = dir-&gt;i_op-&gt;atomic_open(dir, dentry, file,</div><div class='ctx'> 				       open_to_namei_flags(open_flag), mode);</div><div class='ctx'> 	d_lookup_done(dentry);</div><div class='hunk'>@@ -3183,9 +4336,9 @@ static struct dentry *atomic_open(struct nameidata *nd, struct dentry *dentry,</div><div class='ctx'>  */</div><div class='ctx'> static struct dentry *lookup_open(struct nameidata *nd, struct file *file,</div><div class='ctx'> 				  const struct open_flags *op,</div><div class='del'>-				  bool got_write)</div><div class='add'>+				  bool got_write, struct delegated_inode *delegated_inode)</div><div class='ctx'> {</div><div class='del'>-	struct user_namespace *mnt_userns;</div><div class='add'>+	struct mnt_idmap *idmap;</div><div class='ctx'> 	struct dentry *dir = nd-&gt;path.dentry;</div><div class='ctx'> 	struct inode *dir_inode = dir-&gt;d_inode;</div><div class='ctx'> 	int open_flag = op-&gt;open_flag;</div><div class='hunk'>@@ -3208,7 +4361,7 @@ static struct dentry *lookup_open(struct nameidata *nd, struct file *file,</div><div class='ctx'> 		if (d_in_lookup(dentry))</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		error = d_revalidate(dentry, nd-&gt;flags);</div><div class='add'>+		error = d_revalidate(dir_inode, &amp;nd-&gt;last, dentry, nd-&gt;flags);</div><div class='ctx'> 		if (likely(error &gt; 0))</div><div class='ctx'> 			break;</div><div class='ctx'> 		if (error)</div><div class='hunk'>@@ -3222,6 +4375,9 @@ static struct dentry *lookup_open(struct nameidata *nd, struct file *file,</div><div class='ctx'> 		return dentry;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (open_flag &amp; O_CREAT)</div><div class='add'>+		audit_inode(nd-&gt;name, dir, AUDIT_INODE_PARENT);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Checking write permission is tricky, bacuse we don't know if we are</div><div class='ctx'> 	 * going to actually need it: O_CREAT opens should work as long as the</div><div class='hunk'>@@ -3233,14 +4389,13 @@ static struct dentry *lookup_open(struct nameidata *nd, struct file *file,</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (unlikely(!got_write))</div><div class='ctx'> 		open_flag &amp;= ~O_TRUNC;</div><div class='del'>-	mnt_userns = mnt_user_ns(nd-&gt;path.mnt);</div><div class='add'>+	idmap = mnt_idmap(nd-&gt;path.mnt);</div><div class='ctx'> 	if (open_flag &amp; O_CREAT) {</div><div class='ctx'> 		if (open_flag &amp; O_EXCL)</div><div class='ctx'> 			open_flag &amp;= ~O_TRUNC;</div><div class='del'>-		if (!IS_POSIXACL(dir-&gt;d_inode))</div><div class='del'>-			mode &amp;= ~current_umask();</div><div class='add'>+		mode = vfs_prepare_mode(idmap, dir-&gt;d_inode, mode, mode, mode);</div><div class='ctx'> 		if (likely(got_write))</div><div class='del'>-			create_error = may_o_create(mnt_userns, &amp;nd-&gt;path,</div><div class='add'>+			create_error = may_o_create(idmap, &amp;nd-&gt;path,</div><div class='ctx'> 						    dentry, mode);</div><div class='ctx'> 		else</div><div class='ctx'> 			create_error = -EROFS;</div><div class='hunk'>@@ -3270,6 +4425,11 @@ static struct dentry *lookup_open(struct nameidata *nd, struct file *file,</div><div class='ctx'> </div><div class='ctx'> 	/* Negative dentry, just create the file */</div><div class='ctx'> 	if (!dentry-&gt;d_inode &amp;&amp; (open_flag &amp; O_CREAT)) {</div><div class='add'>+		/* but break the directory lease first! */</div><div class='add'>+		error = try_break_deleg(dir_inode, delegated_inode);</div><div class='add'>+		if (error)</div><div class='add'>+			goto out_dput;</div><div class='add'>+</div><div class='ctx'> 		file-&gt;f_mode |= FMODE_CREATED;</div><div class='ctx'> 		audit_inode_child(dir_inode, dentry, AUDIT_TYPE_CHILD_CREATE);</div><div class='ctx'> 		if (!dir_inode-&gt;i_op-&gt;create) {</div><div class='hunk'>@@ -3277,7 +4437,7 @@ static struct dentry *lookup_open(struct nameidata *nd, struct file *file,</div><div class='ctx'> 			goto out_dput;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		error = dir_inode-&gt;i_op-&gt;create(mnt_userns, dir_inode, dentry,</div><div class='add'>+		error = dir_inode-&gt;i_op-&gt;create(idmap, dir_inode, dentry,</div><div class='ctx'> 						mode, open_flag &amp; O_EXCL);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			goto out_dput;</div><div class='hunk'>@@ -3293,14 +4453,49 @@ out_dput:</div><div class='ctx'> 	return ERR_PTR(error);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline bool trailing_slashes(struct nameidata *nd)</div><div class='add'>+{</div><div class='add'>+	return (bool)nd-&gt;last.name[nd-&gt;last.len];</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct dentry *lookup_fast_for_open(struct nameidata *nd, int open_flag)</div><div class='add'>+{</div><div class='add'>+	struct dentry *dentry;</div><div class='add'>+</div><div class='add'>+	if (open_flag &amp; O_CREAT) {</div><div class='add'>+		if (trailing_slashes(nd))</div><div class='add'>+			return ERR_PTR(-EISDIR);</div><div class='add'>+</div><div class='add'>+		/* Don't bother on an O_EXCL create */</div><div class='add'>+		if (open_flag &amp; O_EXCL)</div><div class='add'>+			return NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (trailing_slashes(nd))</div><div class='add'>+		nd-&gt;flags |= LOOKUP_FOLLOW | LOOKUP_DIRECTORY;</div><div class='add'>+</div><div class='add'>+	dentry = lookup_fast(nd);</div><div class='add'>+	if (IS_ERR_OR_NULL(dentry))</div><div class='add'>+		return dentry;</div><div class='add'>+</div><div class='add'>+	if (open_flag &amp; O_CREAT) {</div><div class='add'>+		/* Discard negative dentries. Need inode_lock to do the create */</div><div class='add'>+		if (!dentry-&gt;d_inode) {</div><div class='add'>+			if (!(nd-&gt;flags &amp; LOOKUP_RCU))</div><div class='add'>+				dput(dentry);</div><div class='add'>+			dentry = NULL;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	return dentry;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static const char *open_last_lookups(struct nameidata *nd,</div><div class='ctx'> 		   struct file *file, const struct open_flags *op)</div><div class='ctx'> {</div><div class='add'>+	struct delegated_inode delegated_inode = { };</div><div class='ctx'> 	struct dentry *dir = nd-&gt;path.dentry;</div><div class='ctx'> 	int open_flag = op-&gt;open_flag;</div><div class='ctx'> 	bool got_write = false;</div><div class='del'>-	unsigned seq;</div><div class='del'>-	struct inode *inode;</div><div class='ctx'> 	struct dentry *dentry;</div><div class='ctx'> 	const char *res;</div><div class='ctx'> </div><div class='hunk'>@@ -3312,29 +4507,24 @@ static const char *open_last_lookups(struct nameidata *nd,</div><div class='ctx'> 		return handle_dots(nd, nd-&gt;last_type);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!(open_flag &amp; O_CREAT)) {</div><div class='del'>-		if (nd-&gt;last.name[nd-&gt;last.len])</div><div class='del'>-			nd-&gt;flags |= LOOKUP_FOLLOW | LOOKUP_DIRECTORY;</div><div class='del'>-		/* we _can_ be in RCU mode here */</div><div class='del'>-		dentry = lookup_fast(nd, &amp;inode, &amp;seq);</div><div class='del'>-		if (IS_ERR(dentry))</div><div class='del'>-			return ERR_CAST(dentry);</div><div class='del'>-		if (likely(dentry))</div><div class='del'>-			goto finish_lookup;</div><div class='add'>+	/* We _can_ be in RCU mode here */</div><div class='add'>+	dentry = lookup_fast_for_open(nd, open_flag);</div><div class='add'>+	if (IS_ERR(dentry))</div><div class='add'>+		return ERR_CAST(dentry);</div><div class='ctx'> </div><div class='del'>-		BUG_ON(nd-&gt;flags &amp; LOOKUP_RCU);</div><div class='add'>+	if (likely(dentry))</div><div class='add'>+		goto finish_lookup;</div><div class='add'>+</div><div class='add'>+	if (!(open_flag &amp; O_CREAT)) {</div><div class='add'>+		if (WARN_ON_ONCE(nd-&gt;flags &amp; LOOKUP_RCU))</div><div class='add'>+			return ERR_PTR(-ECHILD);</div><div class='ctx'> 	} else {</div><div class='del'>-		/* create side of things */</div><div class='ctx'> 		if (nd-&gt;flags &amp; LOOKUP_RCU) {</div><div class='ctx'> 			if (!try_to_unlazy(nd))</div><div class='ctx'> 				return ERR_PTR(-ECHILD);</div><div class='ctx'> 		}</div><div class='del'>-		audit_inode(nd-&gt;name, dir, AUDIT_INODE_PARENT);</div><div class='del'>-		/* trailing slashes? */</div><div class='del'>-		if (unlikely(nd-&gt;last.name[nd-&gt;last.len]))</div><div class='del'>-			return ERR_PTR(-EISDIR);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='add'>+retry:</div><div class='ctx'> 	if (open_flag &amp; (O_CREAT | O_TRUNC | O_WRONLY | O_RDWR)) {</div><div class='ctx'> 		got_write = !mnt_want_write(nd-&gt;path.mnt);</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -3347,9 +4537,13 @@ static const char *open_last_lookups(struct nameidata *nd,</div><div class='ctx'> 		inode_lock(dir-&gt;d_inode);</div><div class='ctx'> 	else</div><div class='ctx'> 		inode_lock_shared(dir-&gt;d_inode);</div><div class='del'>-	dentry = lookup_open(nd, file, op, got_write);</div><div class='del'>-	if (!IS_ERR(dentry) &amp;&amp; (file-&gt;f_mode &amp; FMODE_CREATED))</div><div class='del'>-		fsnotify_create(dir-&gt;d_inode, dentry);</div><div class='add'>+	dentry = lookup_open(nd, file, op, got_write, &amp;delegated_inode);</div><div class='add'>+	if (!IS_ERR(dentry)) {</div><div class='add'>+		if (file-&gt;f_mode &amp; FMODE_CREATED)</div><div class='add'>+			fsnotify_create(dir-&gt;d_inode, dentry);</div><div class='add'>+		if (file-&gt;f_mode &amp; FMODE_OPENED)</div><div class='add'>+			fsnotify_open(file);</div><div class='add'>+	}</div><div class='ctx'> 	if (open_flag &amp; O_CREAT)</div><div class='ctx'> 		inode_unlock(dir-&gt;d_inode);</div><div class='ctx'> 	else</div><div class='hunk'>@@ -3358,8 +4552,16 @@ static const char *open_last_lookups(struct nameidata *nd,</div><div class='ctx'> 	if (got_write)</div><div class='ctx'> 		mnt_drop_write(nd-&gt;path.mnt);</div><div class='ctx'> </div><div class='del'>-	if (IS_ERR(dentry))</div><div class='add'>+	if (IS_ERR(dentry)) {</div><div class='add'>+		if (is_delegated(&amp;delegated_inode)) {</div><div class='add'>+			int error = break_deleg_wait(&amp;delegated_inode);</div><div class='add'>+</div><div class='add'>+			if (!error)</div><div class='add'>+				goto retry;</div><div class='add'>+			return ERR_PTR(error);</div><div class='add'>+		}</div><div class='ctx'> 		return ERR_CAST(dentry);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (file-&gt;f_mode &amp; (FMODE_OPENED | FMODE_CREATED)) {</div><div class='ctx'> 		dput(nd-&gt;path.dentry);</div><div class='hunk'>@@ -3370,7 +4572,7 @@ static const char *open_last_lookups(struct nameidata *nd,</div><div class='ctx'> finish_lookup:</div><div class='ctx'> 	if (nd-&gt;depth)</div><div class='ctx'> 		put_link(nd);</div><div class='del'>-	res = step_into(nd, WALK_TRAILING, dentry, inode, seq);</div><div class='add'>+	res = step_into(nd, WALK_TRAILING, dentry);</div><div class='ctx'> 	if (unlikely(res))</div><div class='ctx'> 		nd-&gt;flags &amp;= ~(LOOKUP_OPEN|LOOKUP_CREATE|LOOKUP_EXCL);</div><div class='ctx'> 	return res;</div><div class='hunk'>@@ -3382,7 +4584,7 @@ finish_lookup:</div><div class='ctx'> static int do_open(struct nameidata *nd,</div><div class='ctx'> 		   struct file *file, const struct open_flags *op)</div><div class='ctx'> {</div><div class='del'>-	struct user_namespace *mnt_userns;</div><div class='add'>+	struct mnt_idmap *idmap;</div><div class='ctx'> 	int open_flag = op-&gt;open_flag;</div><div class='ctx'> 	bool do_truncate;</div><div class='ctx'> 	int acc_mode;</div><div class='hunk'>@@ -3395,13 +4597,13 @@ static int do_open(struct nameidata *nd,</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!(file-&gt;f_mode &amp; FMODE_CREATED))</div><div class='ctx'> 		audit_inode(nd-&gt;name, nd-&gt;path.dentry, 0);</div><div class='del'>-	mnt_userns = mnt_user_ns(nd-&gt;path.mnt);</div><div class='add'>+	idmap = mnt_idmap(nd-&gt;path.mnt);</div><div class='ctx'> 	if (open_flag &amp; O_CREAT) {</div><div class='ctx'> 		if ((open_flag &amp; O_EXCL) &amp;&amp; !(file-&gt;f_mode &amp; FMODE_CREATED))</div><div class='ctx'> 			return -EEXIST;</div><div class='ctx'> 		if (d_is_dir(nd-&gt;path.dentry))</div><div class='ctx'> 			return -EISDIR;</div><div class='del'>-		error = may_create_in_sticky(mnt_userns, nd,</div><div class='add'>+		error = may_create_in_sticky(idmap, nd,</div><div class='ctx'> 					     d_backing_inode(nd-&gt;path.dentry));</div><div class='ctx'> 		if (unlikely(error))</div><div class='ctx'> 			return error;</div><div class='hunk'>@@ -3421,13 +4623,13 @@ static int do_open(struct nameidata *nd,</div><div class='ctx'> 			return error;</div><div class='ctx'> 		do_truncate = true;</div><div class='ctx'> 	}</div><div class='del'>-	error = may_open(mnt_userns, &amp;nd-&gt;path, acc_mode, open_flag);</div><div class='add'>+	error = may_open(idmap, &amp;nd-&gt;path, acc_mode, open_flag);</div><div class='ctx'> 	if (!error &amp;&amp; !(file-&gt;f_mode &amp; FMODE_OPENED))</div><div class='ctx'> 		error = vfs_open(&amp;nd-&gt;path, file);</div><div class='ctx'> 	if (!error)</div><div class='del'>-		error = ima_file_check(file, op-&gt;acc_mode);</div><div class='add'>+		error = security_file_post_open(file, op-&gt;acc_mode);</div><div class='ctx'> 	if (!error &amp;&amp; do_truncate)</div><div class='del'>-		error = handle_truncate(mnt_userns, file);</div><div class='add'>+		error = handle_truncate(idmap, file);</div><div class='ctx'> 	if (unlikely(error &gt; 0)) {</div><div class='ctx'> 		WARN_ON(1);</div><div class='ctx'> 		error = -EINVAL;</div><div class='hunk'>@@ -3439,84 +4641,110 @@ static int do_open(struct nameidata *nd,</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * vfs_tmpfile - create tmpfile</div><div class='del'>- * @mnt_userns:	user namespace of the mount the inode was found from</div><div class='del'>- * @dentry:	pointer to dentry of the base directory</div><div class='add'>+ * @idmap:	idmap of the mount the inode was found from</div><div class='add'>+ * @parentpath:	pointer to the path of the base directory</div><div class='add'>+ * @file:	file descriptor of the new tmpfile</div><div class='ctx'>  * @mode:	mode of the new tmpfile</div><div class='del'>- * @open_flag:	flags</div><div class='ctx'>  *</div><div class='ctx'>  * Create a temporary file.</div><div class='ctx'>  *</div><div class='del'>- * If the inode has been found through an idmapped mount the user namespace of</div><div class='del'>- * the vfsmount must be passed through @mnt_userns. This function will then take</div><div class='del'>- * care to map the inode according to @mnt_userns before checking permissions.</div><div class='add'>+ * If the inode has been found through an idmapped mount the idmap of</div><div class='add'>+ * the vfsmount must be passed through @idmap. This function will then take</div><div class='add'>+ * care to map the inode according to @idmap before checking permissions.</div><div class='ctx'>  * On non-idmapped mounts or if permission checking is to be performed on the</div><div class='del'>- * raw inode simply passs init_user_ns.</div><div class='add'>+ * raw inode simply pass @nop_mnt_idmap.</div><div class='ctx'>  */</div><div class='del'>-struct dentry *vfs_tmpfile(struct user_namespace *mnt_userns,</div><div class='del'>-			   struct dentry *dentry, umode_t mode, int open_flag)</div><div class='add'>+int vfs_tmpfile(struct mnt_idmap *idmap,</div><div class='add'>+		const struct path *parentpath,</div><div class='add'>+		struct file *file, umode_t mode)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *child = NULL;</div><div class='del'>-	struct inode *dir = dentry-&gt;d_inode;</div><div class='add'>+	struct dentry *child;</div><div class='add'>+	struct inode *dir = d_inode(parentpath-&gt;dentry);</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	int error;</div><div class='add'>+	int open_flag = file-&gt;f_flags;</div><div class='ctx'> </div><div class='ctx'> 	/* we want directory to be writable */</div><div class='del'>-	error = inode_permission(mnt_userns, dir, MAY_WRITE | MAY_EXEC);</div><div class='add'>+	error = inode_permission(idmap, dir, MAY_WRITE | MAY_EXEC);</div><div class='ctx'> 	if (error)</div><div class='del'>-		goto out_err;</div><div class='del'>-	error = -EOPNOTSUPP;</div><div class='add'>+		return error;</div><div class='ctx'> 	if (!dir-&gt;i_op-&gt;tmpfile)</div><div class='del'>-		goto out_err;</div><div class='del'>-	error = -ENOMEM;</div><div class='del'>-	child = d_alloc(dentry, &amp;slash_name);</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+	child = d_alloc(parentpath-&gt;dentry, &amp;slash_name);</div><div class='ctx'> 	if (unlikely(!child))</div><div class='del'>-		goto out_err;</div><div class='del'>-	error = dir-&gt;i_op-&gt;tmpfile(mnt_userns, dir, child, mode);</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	file-&gt;__f_path.mnt = parentpath-&gt;mnt;</div><div class='add'>+	file-&gt;__f_path.dentry = child;</div><div class='add'>+	mode = vfs_prepare_mode(idmap, dir, mode, mode, mode);</div><div class='add'>+	error = dir-&gt;i_op-&gt;tmpfile(idmap, dir, file, mode);</div><div class='add'>+	dput(child);</div><div class='add'>+	if (file-&gt;f_mode &amp; FMODE_OPENED)</div><div class='add'>+		fsnotify_open(file);</div><div class='ctx'> 	if (error)</div><div class='del'>-		goto out_err;</div><div class='del'>-	error = -ENOENT;</div><div class='del'>-	inode = child-&gt;d_inode;</div><div class='del'>-	if (unlikely(!inode))</div><div class='del'>-		goto out_err;</div><div class='add'>+		return error;</div><div class='add'>+	/* Don't check for other permissions, the inode was just created */</div><div class='add'>+	error = may_open(idmap, &amp;file-&gt;f_path, 0, file-&gt;f_flags);</div><div class='add'>+	if (error)</div><div class='add'>+		return error;</div><div class='add'>+	inode = file_inode(file);</div><div class='ctx'> 	if (!(open_flag &amp; O_EXCL)) {</div><div class='ctx'> 		spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-		inode-&gt;i_state |= I_LINKABLE;</div><div class='add'>+		inode_state_set(inode, I_LINKABLE);</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	}</div><div class='del'>-	ima_post_create_tmpfile(mnt_userns, inode);</div><div class='del'>-	return child;</div><div class='add'>+	security_inode_post_create_tmpfile(idmap, inode);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-out_err:</div><div class='del'>-	dput(child);</div><div class='del'>-	return ERR_PTR(error);</div><div class='add'>+/**</div><div class='add'>+ * kernel_tmpfile_open - open a tmpfile for kernel internal use</div><div class='add'>+ * @idmap:	idmap of the mount the inode was found from</div><div class='add'>+ * @parentpath:	path of the base directory</div><div class='add'>+ * @mode:	mode of the new tmpfile</div><div class='add'>+ * @open_flag:	flags</div><div class='add'>+ * @cred:	credentials for open</div><div class='add'>+ *</div><div class='add'>+ * Create and open a temporary file.  The file is not accounted in nr_files,</div><div class='add'>+ * hence this is only for kernel internal use, and must not be installed into</div><div class='add'>+ * file tables or such.</div><div class='add'>+ */</div><div class='add'>+struct file *kernel_tmpfile_open(struct mnt_idmap *idmap,</div><div class='add'>+				 const struct path *parentpath,</div><div class='add'>+				 umode_t mode, int open_flag,</div><div class='add'>+				 const struct cred *cred)</div><div class='add'>+{</div><div class='add'>+	struct file *file;</div><div class='add'>+	int error;</div><div class='add'>+</div><div class='add'>+	file = alloc_empty_file_noaccount(open_flag, cred);</div><div class='add'>+	if (IS_ERR(file))</div><div class='add'>+		return file;</div><div class='add'>+</div><div class='add'>+	error = vfs_tmpfile(idmap, parentpath, file, mode);</div><div class='add'>+	if (error) {</div><div class='add'>+		fput(file);</div><div class='add'>+		file = ERR_PTR(error);</div><div class='add'>+	}</div><div class='add'>+	return file;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(vfs_tmpfile);</div><div class='add'>+EXPORT_SYMBOL(kernel_tmpfile_open);</div><div class='ctx'> </div><div class='ctx'> static int do_tmpfile(struct nameidata *nd, unsigned flags,</div><div class='ctx'> 		const struct open_flags *op,</div><div class='ctx'> 		struct file *file)</div><div class='ctx'> {</div><div class='del'>-	struct user_namespace *mnt_userns;</div><div class='del'>-	struct dentry *child;</div><div class='ctx'> 	struct path path;</div><div class='ctx'> 	int error = path_lookupat(nd, flags | LOOKUP_DIRECTORY, &amp;path);</div><div class='add'>+</div><div class='ctx'> 	if (unlikely(error))</div><div class='ctx'> 		return error;</div><div class='ctx'> 	error = mnt_want_write(path.mnt);</div><div class='ctx'> 	if (unlikely(error))</div><div class='ctx'> 		goto out;</div><div class='del'>-	mnt_userns = mnt_user_ns(path.mnt);</div><div class='del'>-	child = vfs_tmpfile(mnt_userns, path.dentry, op-&gt;mode, op-&gt;open_flag);</div><div class='del'>-	error = PTR_ERR(child);</div><div class='del'>-	if (IS_ERR(child))</div><div class='add'>+	error = vfs_tmpfile(mnt_idmap(path.mnt), &amp;path, file, op-&gt;mode);</div><div class='add'>+	if (error)</div><div class='ctx'> 		goto out2;</div><div class='del'>-	dput(path.dentry);</div><div class='del'>-	path.dentry = child;</div><div class='del'>-	audit_inode(nd-&gt;name, child, 0);</div><div class='del'>-	/* Don't check for other permissions, the inode was just created */</div><div class='del'>-	error = may_open(mnt_userns, &amp;path, 0, op-&gt;open_flag);</div><div class='del'>-	if (!error)</div><div class='del'>-		error = vfs_open(&amp;path, file);</div><div class='add'>+	audit_inode(nd-&gt;name, file-&gt;f_path.dentry, 0);</div><div class='ctx'> out2:</div><div class='ctx'> 	mnt_drop_write(path.mnt);</div><div class='ctx'> out:</div><div class='hunk'>@@ -3565,7 +4793,7 @@ static struct file *path_openat(struct nameidata *nd,</div><div class='ctx'> 		WARN_ON(1);</div><div class='ctx'> 		error = -EINVAL;</div><div class='ctx'> 	}</div><div class='del'>-	fput(file);</div><div class='add'>+	fput_close(file);</div><div class='ctx'> 	if (error == -EOPENSTALE) {</div><div class='ctx'> 		if (flags &amp; LOOKUP_RCU)</div><div class='ctx'> 			error = -ECHILD;</div><div class='hunk'>@@ -3623,18 +4851,13 @@ static struct dentry *filename_create(int dfd, struct filename *name,</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dentry = ERR_PTR(-EEXIST);</div><div class='ctx'> 	struct qstr last;</div><div class='add'>+	bool want_dir = lookup_flags &amp; LOOKUP_DIRECTORY;</div><div class='add'>+	unsigned int reval_flag = lookup_flags &amp; LOOKUP_REVAL;</div><div class='add'>+	unsigned int create_flags = LOOKUP_CREATE | LOOKUP_EXCL;</div><div class='ctx'> 	int type;</div><div class='del'>-	int err2;</div><div class='ctx'> 	int error;</div><div class='del'>-	bool is_dir = (lookup_flags &amp; LOOKUP_DIRECTORY);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Note that only LOOKUP_REVAL and LOOKUP_DIRECTORY matter here. Any</div><div class='del'>-	 * other flags passed in are ignored!</div><div class='del'>-	 */</div><div class='del'>-	lookup_flags &amp;= LOOKUP_REVAL;</div><div class='del'>-</div><div class='del'>-	error = filename_parentat(dfd, name, lookup_flags, path, &amp;last, &amp;type);</div><div class='add'>+	error = filename_parentat(dfd, name, reval_flag, path, &amp;last, &amp;type);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return ERR_PTR(error);</div><div class='ctx'> </div><div class='hunk'>@@ -3646,49 +4869,34 @@ static struct dentry *filename_create(int dfd, struct filename *name,</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	/* don't fail immediately if it's r/o, at least try to report other errors */</div><div class='del'>-	err2 = mnt_want_write(path-&gt;mnt);</div><div class='add'>+	error = mnt_want_write(path-&gt;mnt);</div><div class='ctx'> 	/*</div><div class='del'>-	 * Do the final lookup.</div><div class='add'>+	 * Do the final lookup.  Suppress 'create' if there is a trailing</div><div class='add'>+	 * '/', and a directory wasn't requested.</div><div class='ctx'> 	 */</div><div class='del'>-	lookup_flags |= LOOKUP_CREATE | LOOKUP_EXCL;</div><div class='del'>-	inode_lock_nested(path-&gt;dentry-&gt;d_inode, I_MUTEX_PARENT);</div><div class='del'>-	dentry = __lookup_hash(&amp;last, path-&gt;dentry, lookup_flags);</div><div class='add'>+	if (last.name[last.len] &amp;&amp; !want_dir)</div><div class='add'>+		create_flags &amp;= ~LOOKUP_CREATE;</div><div class='add'>+	dentry = start_dirop(path-&gt;dentry, &amp;last, reval_flag | create_flags);</div><div class='ctx'> 	if (IS_ERR(dentry))</div><div class='del'>-		goto unlock;</div><div class='add'>+		goto out_drop_write;</div><div class='ctx'> </div><div class='del'>-	error = -EEXIST;</div><div class='del'>-	if (d_is_positive(dentry))</div><div class='add'>+	if (unlikely(error))</div><div class='ctx'> 		goto fail;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Special case - lookup gave negative, but... we had foo/bar/</div><div class='del'>-	 * From the vfs_mknod() POV we just have a negative dentry -</div><div class='del'>-	 * all is fine. Let's be bastards - you had / on the end, you've</div><div class='del'>-	 * been asking for (non-existent) directory. -ENOENT for you.</div><div class='del'>-	 */</div><div class='del'>-	if (unlikely(!is_dir &amp;&amp; last.name[last.len])) {</div><div class='del'>-		error = -ENOENT;</div><div class='del'>-		goto fail;</div><div class='del'>-	}</div><div class='del'>-	if (unlikely(err2)) {</div><div class='del'>-		error = err2;</div><div class='del'>-		goto fail;</div><div class='del'>-	}</div><div class='ctx'> 	return dentry;</div><div class='ctx'> fail:</div><div class='del'>-	dput(dentry);</div><div class='add'>+	end_dirop(dentry);</div><div class='ctx'> 	dentry = ERR_PTR(error);</div><div class='del'>-unlock:</div><div class='del'>-	inode_unlock(path-&gt;dentry-&gt;d_inode);</div><div class='del'>-	if (!err2)</div><div class='add'>+out_drop_write:</div><div class='add'>+	if (!error)</div><div class='ctx'> 		mnt_drop_write(path-&gt;mnt);</div><div class='ctx'> out:</div><div class='ctx'> 	path_put(path);</div><div class='ctx'> 	return dentry;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct dentry *kern_path_create(int dfd, const char *pathname,</div><div class='del'>-				struct path *path, unsigned int lookup_flags)</div><div class='add'>+struct dentry *start_creating_path(int dfd, const char *pathname,</div><div class='add'>+				   struct path *path, unsigned int lookup_flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct filename *filename = getname_kernel(pathname);</div><div class='ctx'> 	struct dentry *res = filename_create(dfd, filename, path, lookup_flags);</div><div class='hunk'>@@ -3696,19 +4904,30 @@ struct dentry *kern_path_create(int dfd, const char *pathname,</div><div class='ctx'> 	putname(filename);</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(kern_path_create);</div><div class='add'>+EXPORT_SYMBOL(start_creating_path);</div><div class='ctx'> </div><div class='del'>-void done_path_create(struct path *path, struct dentry *dentry)</div><div class='add'>+/**</div><div class='add'>+ * end_creating_path - finish a code section started by start_creating_path()</div><div class='add'>+ * @path: the path instantiated by start_creating_path()</div><div class='add'>+ * @dentry: the dentry returned by start_creating_path()</div><div class='add'>+ *</div><div class='add'>+ * end_creating_path() will unlock and locks taken by start_creating_path()</div><div class='add'>+ * and drop an references that were taken.  It should only be called</div><div class='add'>+ * if start_creating_path() returned a non-error.</div><div class='add'>+ * If vfs_mkdir() was called and it returned an error, that error *should*</div><div class='add'>+ * be passed to end_creating_path() together with the path.</div><div class='add'>+ */</div><div class='add'>+void end_creating_path(const struct path *path, struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	dput(dentry);</div><div class='del'>-	inode_unlock(path-&gt;dentry-&gt;d_inode);</div><div class='add'>+	end_creating(dentry);</div><div class='ctx'> 	mnt_drop_write(path-&gt;mnt);</div><div class='ctx'> 	path_put(path);</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(done_path_create);</div><div class='add'>+EXPORT_SYMBOL(end_creating_path);</div><div class='ctx'> </div><div class='del'>-inline struct dentry *user_path_create(int dfd, const char __user *pathname,</div><div class='del'>-				struct path *path, unsigned int lookup_flags)</div><div class='add'>+inline struct dentry *start_creating_user_path(</div><div class='add'>+	int dfd, const char __user *pathname,</div><div class='add'>+	struct path *path, unsigned int lookup_flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct filename *filename = getname(pathname);</div><div class='ctx'> 	struct dentry *res = filename_create(dfd, filename, path, lookup_flags);</div><div class='hunk'>@@ -3716,29 +4935,32 @@ inline struct dentry *user_path_create(int dfd, const char __user *pathname,</div><div class='ctx'> 	putname(filename);</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(user_path_create);</div><div class='add'>+EXPORT_SYMBOL(start_creating_user_path);</div><div class='add'>+</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * vfs_mknod - create device node or file</div><div class='del'>- * @mnt_userns:	user namespace of the mount the inode was found from</div><div class='del'>- * @dir:	inode of @dentry</div><div class='del'>- * @dentry:	pointer to dentry of the base directory</div><div class='del'>- * @mode:	mode of the new device node or file</div><div class='del'>- * @dev:	device number of device to create</div><div class='add'>+ * @idmap:		idmap of the mount the inode was found from</div><div class='add'>+ * @dir:		inode of the parent directory</div><div class='add'>+ * @dentry:		dentry of the child device node</div><div class='add'>+ * @mode:		mode of the child device node</div><div class='add'>+ * @dev:		device number of device to create</div><div class='add'>+ * @delegated_inode:	returns parent inode, if the inode is delegated.</div><div class='ctx'>  *</div><div class='ctx'>  * Create a device node or file.</div><div class='ctx'>  *</div><div class='del'>- * If the inode has been found through an idmapped mount the user namespace of</div><div class='del'>- * the vfsmount must be passed through @mnt_userns. This function will then take</div><div class='del'>- * care to map the inode according to @mnt_userns before checking permissions.</div><div class='add'>+ * If the inode has been found through an idmapped mount the idmap of</div><div class='add'>+ * the vfsmount must be passed through @idmap. This function will then take</div><div class='add'>+ * care to map the inode according to @idmap before checking permissions.</div><div class='ctx'>  * On non-idmapped mounts or if permission checking is to be performed on the</div><div class='del'>- * raw inode simply passs init_user_ns.</div><div class='add'>+ * raw inode simply pass @nop_mnt_idmap.</div><div class='ctx'>  */</div><div class='del'>-int vfs_mknod(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-	      struct dentry *dentry, umode_t mode, dev_t dev)</div><div class='add'>+int vfs_mknod(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+	      struct dentry *dentry, umode_t mode, dev_t dev,</div><div class='add'>+	      struct delegated_inode *delegated_inode)</div><div class='ctx'> {</div><div class='ctx'> 	bool is_whiteout = S_ISCHR(mode) &amp;&amp; dev == WHITEOUT_DEV;</div><div class='del'>-	int error = may_create(mnt_userns, dir, dentry);</div><div class='add'>+	int error = may_create(idmap, dir, dentry);</div><div class='ctx'> </div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='hunk'>@@ -3750,6 +4972,7 @@ int vfs_mknod(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	if (!dir-&gt;i_op-&gt;mknod)</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='add'>+	mode = vfs_prepare_mode(idmap, dir, mode, mode, mode);</div><div class='ctx'> 	error = devcgroup_inode_mknod(mode, dev);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='hunk'>@@ -3758,7 +4981,11 @@ int vfs_mknod(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='del'>-	error = dir-&gt;i_op-&gt;mknod(mnt_userns, dir, dentry, mode, dev);</div><div class='add'>+	error = try_break_deleg(dir, delegated_inode);</div><div class='add'>+	if (error)</div><div class='add'>+		return error;</div><div class='add'>+</div><div class='add'>+	error = dir-&gt;i_op-&gt;mknod(idmap, dir, dentry, mode, dev);</div><div class='ctx'> 	if (!error)</div><div class='ctx'> 		fsnotify_create(dir, dentry);</div><div class='ctx'> 	return error;</div><div class='hunk'>@@ -3785,7 +5012,8 @@ static int may_mknod(umode_t mode)</div><div class='ctx'> static int do_mknodat(int dfd, struct filename *name, umode_t mode,</div><div class='ctx'> 		unsigned int dev)</div><div class='ctx'> {</div><div class='del'>-	struct user_namespace *mnt_userns;</div><div class='add'>+	struct delegated_inode di = { };</div><div class='add'>+	struct mnt_idmap *idmap;</div><div class='ctx'> 	struct dentry *dentry;</div><div class='ctx'> 	struct path path;</div><div class='ctx'> 	int error;</div><div class='hunk'>@@ -3800,31 +5028,34 @@ retry:</div><div class='ctx'> 	if (IS_ERR(dentry))</div><div class='ctx'> 		goto out1;</div><div class='ctx'> </div><div class='del'>-	if (!IS_POSIXACL(path.dentry-&gt;d_inode))</div><div class='del'>-		mode &amp;= ~current_umask();</div><div class='del'>-	error = security_path_mknod(&amp;path, dentry, mode, dev);</div><div class='add'>+	error = security_path_mknod(&amp;path, dentry,</div><div class='add'>+			mode_strip_umask(path.dentry-&gt;d_inode, mode), dev);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out2;</div><div class='ctx'> </div><div class='del'>-	mnt_userns = mnt_user_ns(path.mnt);</div><div class='add'>+	idmap = mnt_idmap(path.mnt);</div><div class='ctx'> 	switch (mode &amp; S_IFMT) {</div><div class='ctx'> 		case 0: case S_IFREG:</div><div class='del'>-			error = vfs_create(mnt_userns, path.dentry-&gt;d_inode,</div><div class='del'>-					   dentry, mode, true);</div><div class='add'>+			error = vfs_create(idmap, dentry, mode, &amp;di);</div><div class='ctx'> 			if (!error)</div><div class='del'>-				ima_post_path_mknod(mnt_userns, dentry);</div><div class='add'>+				security_path_post_mknod(idmap, dentry);</div><div class='ctx'> 			break;</div><div class='ctx'> 		case S_IFCHR: case S_IFBLK:</div><div class='del'>-			error = vfs_mknod(mnt_userns, path.dentry-&gt;d_inode,</div><div class='del'>-					  dentry, mode, new_decode_dev(dev));</div><div class='add'>+			error = vfs_mknod(idmap, path.dentry-&gt;d_inode,</div><div class='add'>+					  dentry, mode, new_decode_dev(dev), &amp;di);</div><div class='ctx'> 			break;</div><div class='ctx'> 		case S_IFIFO: case S_IFSOCK:</div><div class='del'>-			error = vfs_mknod(mnt_userns, path.dentry-&gt;d_inode,</div><div class='del'>-					  dentry, mode, 0);</div><div class='add'>+			error = vfs_mknod(idmap, path.dentry-&gt;d_inode,</div><div class='add'>+					  dentry, mode, 0, &amp;di);</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='ctx'> out2:</div><div class='del'>-	done_path_create(&amp;path, dentry);</div><div class='add'>+	end_creating_path(&amp;path, dentry);</div><div class='add'>+	if (is_delegated(&amp;di)) {</div><div class='add'>+		error = break_deleg_wait(&amp;di);</div><div class='add'>+		if (!error)</div><div class='add'>+			goto retry;</div><div class='add'>+	}</div><div class='ctx'> 	if (retry_estale(error, lookup_flags)) {</div><div class='ctx'> 		lookup_flags |= LOOKUP_REVAL;</div><div class='ctx'> 		goto retry;</div><div class='hunk'>@@ -3846,44 +5077,70 @@ SYSCALL_DEFINE3(mknod, const char __user *, filename, umode_t, mode, unsigned, d</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * vfs_mkdir - create directory</div><div class='del'>- * @mnt_userns:	user namespace of the mount the inode was found from</div><div class='del'>- * @dir:	inode of @dentry</div><div class='del'>- * @dentry:	pointer to dentry of the base directory</div><div class='del'>- * @mode:	mode of the new directory</div><div class='add'>+ * vfs_mkdir - create directory returning correct dentry if possible</div><div class='add'>+ * @idmap:		idmap of the mount the inode was found from</div><div class='add'>+ * @dir:		inode of the parent directory</div><div class='add'>+ * @dentry:		dentry of the child directory</div><div class='add'>+ * @mode:		mode of the child directory</div><div class='add'>+ * @delegated_inode:	returns parent inode, if the inode is delegated.</div><div class='ctx'>  *</div><div class='ctx'>  * Create a directory.</div><div class='ctx'>  *</div><div class='del'>- * If the inode has been found through an idmapped mount the user namespace of</div><div class='del'>- * the vfsmount must be passed through @mnt_userns. This function will then take</div><div class='del'>- * care to map the inode according to @mnt_userns before checking permissions.</div><div class='add'>+ * If the inode has been found through an idmapped mount the idmap of</div><div class='add'>+ * the vfsmount must be passed through @idmap. This function will then take</div><div class='add'>+ * care to map the inode according to @idmap before checking permissions.</div><div class='ctx'>  * On non-idmapped mounts or if permission checking is to be performed on the</div><div class='del'>- * raw inode simply passs init_user_ns.</div><div class='add'>+ * raw inode simply pass @nop_mnt_idmap.</div><div class='add'>+ *</div><div class='add'>+ * In the event that the filesystem does not use the *@dentry but leaves it</div><div class='add'>+ * negative or unhashes it and possibly splices a different one returning it,</div><div class='add'>+ * the original dentry is dput() and the alternate is returned.</div><div class='add'>+ *</div><div class='add'>+ * In case of an error the dentry is dput() and an ERR_PTR() is returned.</div><div class='ctx'>  */</div><div class='del'>-int vfs_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-	      struct dentry *dentry, umode_t mode)</div><div class='add'>+struct dentry *vfs_mkdir(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+			 struct dentry *dentry, umode_t mode,</div><div class='add'>+			 struct delegated_inode *delegated_inode)</div><div class='ctx'> {</div><div class='del'>-	int error = may_create(mnt_userns, dir, dentry);</div><div class='add'>+	int error;</div><div class='ctx'> 	unsigned max_links = dir-&gt;i_sb-&gt;s_max_links;</div><div class='add'>+	struct dentry *de;</div><div class='ctx'> </div><div class='add'>+	error = may_create(idmap, dir, dentry);</div><div class='ctx'> 	if (error)</div><div class='del'>-		return error;</div><div class='add'>+		goto err;</div><div class='ctx'> </div><div class='add'>+	error = -EPERM;</div><div class='ctx'> 	if (!dir-&gt;i_op-&gt;mkdir)</div><div class='del'>-		return -EPERM;</div><div class='add'>+		goto err;</div><div class='ctx'> </div><div class='del'>-	mode &amp;= (S_IRWXUGO|S_ISVTX);</div><div class='add'>+	mode = vfs_prepare_mode(idmap, dir, mode, S_IRWXUGO | S_ISVTX, 0);</div><div class='ctx'> 	error = security_inode_mkdir(dir, dentry, mode);</div><div class='ctx'> 	if (error)</div><div class='del'>-		return error;</div><div class='add'>+		goto err;</div><div class='ctx'> </div><div class='add'>+	error = -EMLINK;</div><div class='ctx'> 	if (max_links &amp;&amp; dir-&gt;i_nlink &gt;= max_links)</div><div class='del'>-		return -EMLINK;</div><div class='add'>+		goto err;</div><div class='ctx'> </div><div class='del'>-	error = dir-&gt;i_op-&gt;mkdir(mnt_userns, dir, dentry, mode);</div><div class='del'>-	if (!error)</div><div class='del'>-		fsnotify_mkdir(dir, dentry);</div><div class='del'>-	return error;</div><div class='add'>+	error = try_break_deleg(dir, delegated_inode);</div><div class='add'>+	if (error)</div><div class='add'>+		goto err;</div><div class='add'>+</div><div class='add'>+	de = dir-&gt;i_op-&gt;mkdir(idmap, dir, dentry, mode);</div><div class='add'>+	error = PTR_ERR(de);</div><div class='add'>+	if (IS_ERR(de))</div><div class='add'>+		goto err;</div><div class='add'>+	if (de) {</div><div class='add'>+		dput(dentry);</div><div class='add'>+		dentry = de;</div><div class='add'>+	}</div><div class='add'>+	fsnotify_mkdir(dir, dentry);</div><div class='add'>+	return dentry;</div><div class='add'>+</div><div class='add'>+err:</div><div class='add'>+	end_creating(dentry);</div><div class='add'>+	return ERR_PTR(error);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(vfs_mkdir);</div><div class='ctx'> </div><div class='hunk'>@@ -3893,6 +5150,7 @@ int do_mkdirat(int dfd, struct filename *name, umode_t mode)</div><div class='ctx'> 	struct path path;</div><div class='ctx'> 	int error;</div><div class='ctx'> 	unsigned int lookup_flags = LOOKUP_DIRECTORY;</div><div class='add'>+	struct delegated_inode delegated_inode = { };</div><div class='ctx'> </div><div class='ctx'> retry:</div><div class='ctx'> 	dentry = filename_create(dfd, name, &amp;path, lookup_flags);</div><div class='hunk'>@@ -3900,16 +5158,20 @@ retry:</div><div class='ctx'> 	if (IS_ERR(dentry))</div><div class='ctx'> 		goto out_putname;</div><div class='ctx'> </div><div class='del'>-	if (!IS_POSIXACL(path.dentry-&gt;d_inode))</div><div class='del'>-		mode &amp;= ~current_umask();</div><div class='del'>-	error = security_path_mkdir(&amp;path, dentry, mode);</div><div class='add'>+	error = security_path_mkdir(&amp;path, dentry,</div><div class='add'>+			mode_strip_umask(path.dentry-&gt;d_inode, mode));</div><div class='ctx'> 	if (!error) {</div><div class='del'>-		struct user_namespace *mnt_userns;</div><div class='del'>-		mnt_userns = mnt_user_ns(path.mnt);</div><div class='del'>-		error = vfs_mkdir(mnt_userns, path.dentry-&gt;d_inode, dentry,</div><div class='del'>-				  mode);</div><div class='add'>+		dentry = vfs_mkdir(mnt_idmap(path.mnt), path.dentry-&gt;d_inode,</div><div class='add'>+				   dentry, mode, &amp;delegated_inode);</div><div class='add'>+		if (IS_ERR(dentry))</div><div class='add'>+			error = PTR_ERR(dentry);</div><div class='add'>+	}</div><div class='add'>+	end_creating_path(&amp;path, dentry);</div><div class='add'>+	if (is_delegated(&amp;delegated_inode)) {</div><div class='add'>+		error = break_deleg_wait(&amp;delegated_inode);</div><div class='add'>+		if (!error)</div><div class='add'>+			goto retry;</div><div class='ctx'> 	}</div><div class='del'>-	done_path_create(&amp;path, dentry);</div><div class='ctx'> 	if (retry_estale(error, lookup_flags)) {</div><div class='ctx'> 		lookup_flags |= LOOKUP_REVAL;</div><div class='ctx'> 		goto retry;</div><div class='hunk'>@@ -3931,22 +5193,23 @@ SYSCALL_DEFINE2(mkdir, const char __user *, pathname, umode_t, mode)</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * vfs_rmdir - remove directory</div><div class='del'>- * @mnt_userns:	user namespace of the mount the inode was found from</div><div class='del'>- * @dir:	inode of @dentry</div><div class='del'>- * @dentry:	pointer to dentry of the base directory</div><div class='add'>+ * @idmap:		idmap of the mount the inode was found from</div><div class='add'>+ * @dir:		inode of the parent directory</div><div class='add'>+ * @dentry:		dentry of the child directory</div><div class='add'>+ * @delegated_inode:	returns parent inode, if it's delegated.</div><div class='ctx'>  *</div><div class='ctx'>  * Remove a directory.</div><div class='ctx'>  *</div><div class='del'>- * If the inode has been found through an idmapped mount the user namespace of</div><div class='del'>- * the vfsmount must be passed through @mnt_userns. This function will then take</div><div class='del'>- * care to map the inode according to @mnt_userns before checking permissions.</div><div class='add'>+ * If the inode has been found through an idmapped mount the idmap of</div><div class='add'>+ * the vfsmount must be passed through @idmap. This function will then take</div><div class='add'>+ * care to map the inode according to @idmap before checking permissions.</div><div class='ctx'>  * On non-idmapped mounts or if permission checking is to be performed on the</div><div class='del'>- * raw inode simply passs init_user_ns.</div><div class='add'>+ * raw inode simply pass @nop_mnt_idmap.</div><div class='ctx'>  */</div><div class='del'>-int vfs_rmdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-		     struct dentry *dentry)</div><div class='add'>+int vfs_rmdir(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+	      struct dentry *dentry, struct delegated_inode *delegated_inode)</div><div class='ctx'> {</div><div class='del'>-	int error = may_delete(mnt_userns, dir, dentry, 1);</div><div class='add'>+	int error = may_delete(idmap, dir, dentry, 1);</div><div class='ctx'> </div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='hunk'>@@ -3958,13 +5221,18 @@ int vfs_rmdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	inode_lock(dentry-&gt;d_inode);</div><div class='ctx'> </div><div class='ctx'> 	error = -EBUSY;</div><div class='del'>-	if (is_local_mountpoint(dentry))</div><div class='add'>+	if (is_local_mountpoint(dentry) ||</div><div class='add'>+	    (dentry-&gt;d_inode-&gt;i_flags &amp; S_KERNEL_FILE))</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	error = security_inode_rmdir(dir, dentry);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='add'>+	error = try_break_deleg(dir, delegated_inode);</div><div class='add'>+	if (error)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='ctx'> 	error = dir-&gt;i_op-&gt;rmdir(dir, dentry);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -3973,26 +5241,25 @@ int vfs_rmdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	dentry-&gt;d_inode-&gt;i_flags |= S_DEAD;</div><div class='ctx'> 	dont_mount(dentry);</div><div class='ctx'> 	detach_mounts(dentry);</div><div class='del'>-	fsnotify_rmdir(dir, dentry);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	inode_unlock(dentry-&gt;d_inode);</div><div class='ctx'> 	dput(dentry);</div><div class='ctx'> 	if (!error)</div><div class='del'>-		d_delete(dentry);</div><div class='add'>+		d_delete_notify(dir, dentry);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(vfs_rmdir);</div><div class='ctx'> </div><div class='ctx'> int do_rmdir(int dfd, struct filename *name)</div><div class='ctx'> {</div><div class='del'>-	struct user_namespace *mnt_userns;</div><div class='ctx'> 	int error;</div><div class='ctx'> 	struct dentry *dentry;</div><div class='ctx'> 	struct path path;</div><div class='ctx'> 	struct qstr last;</div><div class='ctx'> 	int type;</div><div class='ctx'> 	unsigned int lookup_flags = 0;</div><div class='add'>+	struct delegated_inode delegated_inode = { };</div><div class='ctx'> retry:</div><div class='ctx'> 	error = filename_parentat(dfd, name, lookup_flags, &amp;path, &amp;last, &amp;type);</div><div class='ctx'> 	if (error)</div><div class='hunk'>@@ -4014,27 +5281,26 @@ retry:</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto exit2;</div><div class='ctx'> </div><div class='del'>-	inode_lock_nested(path.dentry-&gt;d_inode, I_MUTEX_PARENT);</div><div class='del'>-	dentry = __lookup_hash(&amp;last, path.dentry, lookup_flags);</div><div class='add'>+	dentry = start_dirop(path.dentry, &amp;last, lookup_flags);</div><div class='ctx'> 	error = PTR_ERR(dentry);</div><div class='ctx'> 	if (IS_ERR(dentry))</div><div class='ctx'> 		goto exit3;</div><div class='del'>-	if (!dentry-&gt;d_inode) {</div><div class='del'>-		error = -ENOENT;</div><div class='del'>-		goto exit4;</div><div class='del'>-	}</div><div class='ctx'> 	error = security_path_rmdir(&amp;path, dentry);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto exit4;</div><div class='del'>-	mnt_userns = mnt_user_ns(path.mnt);</div><div class='del'>-	error = vfs_rmdir(mnt_userns, path.dentry-&gt;d_inode, dentry);</div><div class='add'>+	error = vfs_rmdir(mnt_idmap(path.mnt), path.dentry-&gt;d_inode,</div><div class='add'>+			  dentry, &amp;delegated_inode);</div><div class='ctx'> exit4:</div><div class='del'>-	dput(dentry);</div><div class='add'>+	end_dirop(dentry);</div><div class='ctx'> exit3:</div><div class='del'>-	inode_unlock(path.dentry-&gt;d_inode);</div><div class='ctx'> 	mnt_drop_write(path.mnt);</div><div class='ctx'> exit2:</div><div class='ctx'> 	path_put(&amp;path);</div><div class='add'>+	if (is_delegated(&amp;delegated_inode)) {</div><div class='add'>+		error = break_deleg_wait(&amp;delegated_inode);</div><div class='add'>+		if (!error)</div><div class='add'>+			goto retry;</div><div class='add'>+	}</div><div class='ctx'> 	if (retry_estale(error, lookup_flags)) {</div><div class='ctx'> 		lookup_flags |= LOOKUP_REVAL;</div><div class='ctx'> 		goto retry;</div><div class='hunk'>@@ -4051,34 +5317,34 @@ SYSCALL_DEFINE1(rmdir, const char __user *, pathname)</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * vfs_unlink - unlink a filesystem object</div><div class='del'>- * @mnt_userns:	user namespace of the mount the inode was found from</div><div class='add'>+ * @idmap:	idmap of the mount the inode was found from</div><div class='ctx'>  * @dir:	parent directory</div><div class='ctx'>  * @dentry:	victim</div><div class='ctx'>  * @delegated_inode: returns victim inode, if the inode is delegated.</div><div class='ctx'>  *</div><div class='del'>- * The caller must hold dir-&gt;i_mutex.</div><div class='add'>+ * The caller must hold dir-&gt;i_rwsem exclusively.</div><div class='ctx'>  *</div><div class='ctx'>  * If vfs_unlink discovers a delegation, it will return -EWOULDBLOCK and</div><div class='ctx'>  * return a reference to the inode in delegated_inode.  The caller</div><div class='ctx'>  * should then break the delegation on that inode and retry.  Because</div><div class='ctx'>  * breaking a delegation may take a long time, the caller should drop</div><div class='del'>- * dir-&gt;i_mutex before doing so.</div><div class='add'>+ * dir-&gt;i_rwsem before doing so.</div><div class='ctx'>  *</div><div class='ctx'>  * Alternatively, a caller may pass NULL for delegated_inode.  This may</div><div class='ctx'>  * be appropriate for callers that expect the underlying filesystem not</div><div class='ctx'>  * to be NFS exported.</div><div class='ctx'>  *</div><div class='del'>- * If the inode has been found through an idmapped mount the user namespace of</div><div class='del'>- * the vfsmount must be passed through @mnt_userns. This function will then take</div><div class='del'>- * care to map the inode according to @mnt_userns before checking permissions.</div><div class='add'>+ * If the inode has been found through an idmapped mount the idmap of</div><div class='add'>+ * the vfsmount must be passed through @idmap. This function will then take</div><div class='add'>+ * care to map the inode according to @idmap before checking permissions.</div><div class='ctx'>  * On non-idmapped mounts or if permission checking is to be performed on the</div><div class='del'>- * raw inode simply passs init_user_ns.</div><div class='add'>+ * raw inode simply pass @nop_mnt_idmap.</div><div class='ctx'>  */</div><div class='del'>-int vfs_unlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-	       struct dentry *dentry, struct inode **delegated_inode)</div><div class='add'>+int vfs_unlink(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+	       struct dentry *dentry, struct delegated_inode *delegated_inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *target = dentry-&gt;d_inode;</div><div class='del'>-	int error = may_delete(mnt_userns, dir, dentry, 0);</div><div class='add'>+	int error = may_delete(idmap, dir, dentry, 0);</div><div class='ctx'> </div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='hunk'>@@ -4094,6 +5360,9 @@ int vfs_unlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	else {</div><div class='ctx'> 		error = security_inode_unlink(dir, dentry);</div><div class='ctx'> 		if (!error) {</div><div class='add'>+			error = try_break_deleg(dir, delegated_inode);</div><div class='add'>+			if (error)</div><div class='add'>+				goto out;</div><div class='ctx'> 			error = try_break_deleg(target, delegated_inode);</div><div class='ctx'> 			if (error)</div><div class='ctx'> 				goto out;</div><div class='hunk'>@@ -4101,7 +5370,6 @@ int vfs_unlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 			if (!error) {</div><div class='ctx'> 				dont_mount(dentry);</div><div class='ctx'> 				detach_mounts(dentry);</div><div class='del'>-				fsnotify_unlink(dir, dentry);</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -4109,9 +5377,11 @@ out:</div><div class='ctx'> 	inode_unlock(target);</div><div class='ctx'> </div><div class='ctx'> 	/* We don't d_delete() NFS sillyrenamed files--they still exist. */</div><div class='del'>-	if (!error &amp;&amp; !(dentry-&gt;d_flags &amp; DCACHE_NFSFS_RENAMED)) {</div><div class='add'>+	if (!error &amp;&amp; dentry-&gt;d_flags &amp; DCACHE_NFSFS_RENAMED) {</div><div class='add'>+		fsnotify_unlink(dir, dentry);</div><div class='add'>+	} else if (!error) {</div><div class='ctx'> 		fsnotify_link_count(target);</div><div class='del'>-		d_delete(dentry);</div><div class='add'>+		d_delete_notify(dir, dentry);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return error;</div><div class='hunk'>@@ -4120,7 +5390,7 @@ EXPORT_SYMBOL(vfs_unlink);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Make sure that the actual truncation of the file will occur outside its</div><div class='del'>- * directory's i_mutex.  Truncate can take a long time if there is a lot of</div><div class='add'>+ * directory's i_rwsem.  Truncate can take a long time if there is a lot of</div><div class='ctx'>  * writeout happening, and we don't want to prevent access to the directory</div><div class='ctx'>  * while waiting on the I/O.</div><div class='ctx'>  */</div><div class='hunk'>@@ -4131,73 +5401,62 @@ int do_unlinkat(int dfd, struct filename *name)</div><div class='ctx'> 	struct path path;</div><div class='ctx'> 	struct qstr last;</div><div class='ctx'> 	int type;</div><div class='del'>-	struct inode *inode = NULL;</div><div class='del'>-	struct inode *delegated_inode = NULL;</div><div class='add'>+	struct inode *inode;</div><div class='add'>+	struct delegated_inode delegated_inode = { };</div><div class='ctx'> 	unsigned int lookup_flags = 0;</div><div class='ctx'> retry:</div><div class='ctx'> 	error = filename_parentat(dfd, name, lookup_flags, &amp;path, &amp;last, &amp;type);</div><div class='ctx'> 	if (error)</div><div class='del'>-		goto exit1;</div><div class='add'>+		goto exit_putname;</div><div class='ctx'> </div><div class='ctx'> 	error = -EISDIR;</div><div class='ctx'> 	if (type != LAST_NORM)</div><div class='del'>-		goto exit2;</div><div class='add'>+		goto exit_path_put;</div><div class='ctx'> </div><div class='ctx'> 	error = mnt_want_write(path.mnt);</div><div class='ctx'> 	if (error)</div><div class='del'>-		goto exit2;</div><div class='add'>+		goto exit_path_put;</div><div class='ctx'> retry_deleg:</div><div class='del'>-	inode_lock_nested(path.dentry-&gt;d_inode, I_MUTEX_PARENT);</div><div class='del'>-	dentry = __lookup_hash(&amp;last, path.dentry, lookup_flags);</div><div class='add'>+	dentry = start_dirop(path.dentry, &amp;last, lookup_flags);</div><div class='ctx'> 	error = PTR_ERR(dentry);</div><div class='del'>-	if (!IS_ERR(dentry)) {</div><div class='del'>-		struct user_namespace *mnt_userns;</div><div class='del'>-</div><div class='del'>-		/* Why not before? Because we want correct error value */</div><div class='del'>-		if (last.name[last.len])</div><div class='del'>-			goto slashes;</div><div class='del'>-		inode = dentry-&gt;d_inode;</div><div class='del'>-		if (d_is_negative(dentry))</div><div class='del'>-			goto slashes;</div><div class='del'>-		ihold(inode);</div><div class='del'>-		error = security_path_unlink(&amp;path, dentry);</div><div class='del'>-		if (error)</div><div class='del'>-			goto exit3;</div><div class='del'>-		mnt_userns = mnt_user_ns(path.mnt);</div><div class='del'>-		error = vfs_unlink(mnt_userns, path.dentry-&gt;d_inode, dentry,</div><div class='del'>-				   &amp;delegated_inode);</div><div class='del'>-exit3:</div><div class='del'>-		dput(dentry);</div><div class='add'>+	if (IS_ERR(dentry))</div><div class='add'>+		goto exit_drop_write;</div><div class='add'>+</div><div class='add'>+	/* Why not before? Because we want correct error value */</div><div class='add'>+	if (unlikely(last.name[last.len])) {</div><div class='add'>+		if (d_is_dir(dentry))</div><div class='add'>+			error = -EISDIR;</div><div class='add'>+		else</div><div class='add'>+			error = -ENOTDIR;</div><div class='add'>+		end_dirop(dentry);</div><div class='add'>+		goto exit_drop_write;</div><div class='ctx'> 	}</div><div class='del'>-	inode_unlock(path.dentry-&gt;d_inode);</div><div class='del'>-	if (inode)</div><div class='del'>-		iput(inode);	/* truncate the inode here */</div><div class='del'>-	inode = NULL;</div><div class='del'>-	if (delegated_inode) {</div><div class='add'>+	inode = dentry-&gt;d_inode;</div><div class='add'>+	ihold(inode);</div><div class='add'>+	error = security_path_unlink(&amp;path, dentry);</div><div class='add'>+	if (error)</div><div class='add'>+		goto exit_end_dirop;</div><div class='add'>+	error = vfs_unlink(mnt_idmap(path.mnt), path.dentry-&gt;d_inode,</div><div class='add'>+			   dentry, &amp;delegated_inode);</div><div class='add'>+exit_end_dirop:</div><div class='add'>+	end_dirop(dentry);</div><div class='add'>+	iput(inode);	/* truncate the inode here */</div><div class='add'>+	if (is_delegated(&amp;delegated_inode)) {</div><div class='ctx'> 		error = break_deleg_wait(&amp;delegated_inode);</div><div class='ctx'> 		if (!error)</div><div class='ctx'> 			goto retry_deleg;</div><div class='ctx'> 	}</div><div class='add'>+exit_drop_write:</div><div class='ctx'> 	mnt_drop_write(path.mnt);</div><div class='del'>-exit2:</div><div class='add'>+exit_path_put:</div><div class='ctx'> 	path_put(&amp;path);</div><div class='ctx'> 	if (retry_estale(error, lookup_flags)) {</div><div class='ctx'> 		lookup_flags |= LOOKUP_REVAL;</div><div class='del'>-		inode = NULL;</div><div class='ctx'> 		goto retry;</div><div class='ctx'> 	}</div><div class='del'>-exit1:</div><div class='add'>+exit_putname:</div><div class='ctx'> 	putname(name);</div><div class='ctx'> 	return error;</div><div class='del'>-</div><div class='del'>-slashes:</div><div class='del'>-	if (d_is_negative(dentry))</div><div class='del'>-		error = -ENOENT;</div><div class='del'>-	else if (d_is_dir(dentry))</div><div class='del'>-		error = -EISDIR;</div><div class='del'>-	else</div><div class='del'>-		error = -ENOTDIR;</div><div class='del'>-	goto exit3;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> SYSCALL_DEFINE3(unlinkat, int, dfd, const char __user *, pathname, int, flag)</div><div class='hunk'>@@ -4217,24 +5476,27 @@ SYSCALL_DEFINE1(unlink, const char __user *, pathname)</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * vfs_symlink - create symlink</div><div class='del'>- * @mnt_userns:	user namespace of the mount the inode was found from</div><div class='del'>- * @dir:	inode of @dentry</div><div class='del'>- * @dentry:	pointer to dentry of the base directory</div><div class='add'>+ * @idmap:	idmap of the mount the inode was found from</div><div class='add'>+ * @dir:	inode of the parent directory</div><div class='add'>+ * @dentry:	dentry of the child symlink file</div><div class='ctx'>  * @oldname:	name of the file to link to</div><div class='add'>+ * @delegated_inode: returns victim inode, if the inode is delegated.</div><div class='ctx'>  *</div><div class='ctx'>  * Create a symlink.</div><div class='ctx'>  *</div><div class='del'>- * If the inode has been found through an idmapped mount the user namespace of</div><div class='del'>- * the vfsmount must be passed through @mnt_userns. This function will then take</div><div class='del'>- * care to map the inode according to @mnt_userns before checking permissions.</div><div class='add'>+ * If the inode has been found through an idmapped mount the idmap of</div><div class='add'>+ * the vfsmount must be passed through @idmap. This function will then take</div><div class='add'>+ * care to map the inode according to @idmap before checking permissions.</div><div class='ctx'>  * On non-idmapped mounts or if permission checking is to be performed on the</div><div class='del'>- * raw inode simply passs init_user_ns.</div><div class='add'>+ * raw inode simply pass @nop_mnt_idmap.</div><div class='ctx'>  */</div><div class='del'>-int vfs_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-		struct dentry *dentry, const char *oldname)</div><div class='add'>+int vfs_symlink(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+		struct dentry *dentry, const char *oldname,</div><div class='add'>+		struct delegated_inode *delegated_inode)</div><div class='ctx'> {</div><div class='del'>-	int error = may_create(mnt_userns, dir, dentry);</div><div class='add'>+	int error;</div><div class='ctx'> </div><div class='add'>+	error = may_create(idmap, dir, dentry);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='hunk'>@@ -4245,7 +5507,11 @@ int vfs_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='del'>-	error = dir-&gt;i_op-&gt;symlink(mnt_userns, dir, dentry, oldname);</div><div class='add'>+	error = try_break_deleg(dir, delegated_inode);</div><div class='add'>+	if (error)</div><div class='add'>+		return error;</div><div class='add'>+</div><div class='add'>+	error = dir-&gt;i_op-&gt;symlink(idmap, dir, dentry, oldname);</div><div class='ctx'> 	if (!error)</div><div class='ctx'> 		fsnotify_create(dir, dentry);</div><div class='ctx'> 	return error;</div><div class='hunk'>@@ -4258,6 +5524,7 @@ int do_symlinkat(struct filename *from, int newdfd, struct filename *to)</div><div class='ctx'> 	struct dentry *dentry;</div><div class='ctx'> 	struct path path;</div><div class='ctx'> 	unsigned int lookup_flags = 0;</div><div class='add'>+	struct delegated_inode delegated_inode = { };</div><div class='ctx'> </div><div class='ctx'> 	if (IS_ERR(from)) {</div><div class='ctx'> 		error = PTR_ERR(from);</div><div class='hunk'>@@ -4270,14 +5537,15 @@ retry:</div><div class='ctx'> 		goto out_putnames;</div><div class='ctx'> </div><div class='ctx'> 	error = security_path_symlink(&amp;path, dentry, from-&gt;name);</div><div class='del'>-	if (!error) {</div><div class='del'>-		struct user_namespace *mnt_userns;</div><div class='del'>-</div><div class='del'>-		mnt_userns = mnt_user_ns(path.mnt);</div><div class='del'>-		error = vfs_symlink(mnt_userns, path.dentry-&gt;d_inode, dentry,</div><div class='del'>-				    from-&gt;name);</div><div class='add'>+	if (!error)</div><div class='add'>+		error = vfs_symlink(mnt_idmap(path.mnt), path.dentry-&gt;d_inode,</div><div class='add'>+				    dentry, from-&gt;name, &amp;delegated_inode);</div><div class='add'>+	end_creating_path(&amp;path, dentry);</div><div class='add'>+	if (is_delegated(&amp;delegated_inode)) {</div><div class='add'>+		error = break_deleg_wait(&amp;delegated_inode);</div><div class='add'>+		if (!error)</div><div class='add'>+			goto retry;</div><div class='ctx'> 	}</div><div class='del'>-	done_path_create(&amp;path, dentry);</div><div class='ctx'> 	if (retry_estale(error, lookup_flags)) {</div><div class='ctx'> 		lookup_flags |= LOOKUP_REVAL;</div><div class='ctx'> 		goto retry;</div><div class='hunk'>@@ -4302,32 +5570,32 @@ SYSCALL_DEFINE2(symlink, const char __user *, oldname, const char __user *, newn</div><div class='ctx'> /**</div><div class='ctx'>  * vfs_link - create a new link</div><div class='ctx'>  * @old_dentry:	object to be linked</div><div class='del'>- * @mnt_userns:	the user namespace of the mount</div><div class='add'>+ * @idmap:	idmap of the mount</div><div class='ctx'>  * @dir:	new parent</div><div class='ctx'>  * @new_dentry:	where to create the new link</div><div class='ctx'>  * @delegated_inode: returns inode needing a delegation break</div><div class='ctx'>  *</div><div class='del'>- * The caller must hold dir-&gt;i_mutex</div><div class='add'>+ * The caller must hold dir-&gt;i_rwsem exclusively.</div><div class='ctx'>  *</div><div class='ctx'>  * If vfs_link discovers a delegation on the to-be-linked file in need</div><div class='ctx'>  * of breaking, it will return -EWOULDBLOCK and return a reference to the</div><div class='ctx'>  * inode in delegated_inode.  The caller should then break the delegation</div><div class='ctx'>  * and retry.  Because breaking a delegation may take a long time, the</div><div class='del'>- * caller should drop the i_mutex before doing so.</div><div class='add'>+ * caller should drop the i_rwsem before doing so.</div><div class='ctx'>  *</div><div class='ctx'>  * Alternatively, a caller may pass NULL for delegated_inode.  This may</div><div class='ctx'>  * be appropriate for callers that expect the underlying filesystem not</div><div class='ctx'>  * to be NFS exported.</div><div class='ctx'>  *</div><div class='del'>- * If the inode has been found through an idmapped mount the user namespace of</div><div class='del'>- * the vfsmount must be passed through @mnt_userns. This function will then take</div><div class='del'>- * care to map the inode according to @mnt_userns before checking permissions.</div><div class='add'>+ * If the inode has been found through an idmapped mount the idmap of</div><div class='add'>+ * the vfsmount must be passed through @idmap. This function will then take</div><div class='add'>+ * care to map the inode according to @idmap before checking permissions.</div><div class='ctx'>  * On non-idmapped mounts or if permission checking is to be performed on the</div><div class='del'>- * raw inode simply passs init_user_ns.</div><div class='add'>+ * raw inode simply pass @nop_mnt_idmap.</div><div class='ctx'>  */</div><div class='del'>-int vfs_link(struct dentry *old_dentry, struct user_namespace *mnt_userns,</div><div class='add'>+int vfs_link(struct dentry *old_dentry, struct mnt_idmap *idmap,</div><div class='ctx'> 	     struct inode *dir, struct dentry *new_dentry,</div><div class='del'>-	     struct inode **delegated_inode)</div><div class='add'>+	     struct delegated_inode *delegated_inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = old_dentry-&gt;d_inode;</div><div class='ctx'> 	unsigned max_links = dir-&gt;i_sb-&gt;s_max_links;</div><div class='hunk'>@@ -4336,7 +5604,7 @@ int vfs_link(struct dentry *old_dentry, struct user_namespace *mnt_userns,</div><div class='ctx'> 	if (!inode)</div><div class='ctx'> 		return -ENOENT;</div><div class='ctx'> </div><div class='del'>-	error = may_create(mnt_userns, dir, new_dentry);</div><div class='add'>+	error = may_create(idmap, dir, new_dentry);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='hunk'>@@ -4350,10 +5618,10 @@ int vfs_link(struct dentry *old_dentry, struct user_namespace *mnt_userns,</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Updating the link count will likely cause i_uid and i_gid to</div><div class='del'>-	 * be writen back improperly if their true value is unknown to</div><div class='add'>+	 * be written back improperly if their true value is unknown to</div><div class='ctx'> 	 * the vfs.</div><div class='ctx'> 	 */</div><div class='del'>-	if (HAS_UNMAPPED_ID(mnt_userns, inode))</div><div class='add'>+	if (HAS_UNMAPPED_ID(idmap, inode))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> 	if (!dir-&gt;i_op-&gt;link)</div><div class='ctx'> 		return -EPERM;</div><div class='hunk'>@@ -4366,19 +5634,21 @@ int vfs_link(struct dentry *old_dentry, struct user_namespace *mnt_userns,</div><div class='ctx'> </div><div class='ctx'> 	inode_lock(inode);</div><div class='ctx'> 	/* Make sure we don't allow creating hardlink to an unlinked file */</div><div class='del'>-	if (inode-&gt;i_nlink == 0 &amp;&amp; !(inode-&gt;i_state &amp; I_LINKABLE))</div><div class='add'>+	if (inode-&gt;i_nlink == 0 &amp;&amp; !(inode_state_read_once(inode) &amp; I_LINKABLE))</div><div class='ctx'> 		error =  -ENOENT;</div><div class='ctx'> 	else if (max_links &amp;&amp; inode-&gt;i_nlink &gt;= max_links)</div><div class='ctx'> 		error = -EMLINK;</div><div class='ctx'> 	else {</div><div class='del'>-		error = try_break_deleg(inode, delegated_inode);</div><div class='add'>+		error = try_break_deleg(dir, delegated_inode);</div><div class='add'>+		if (!error)</div><div class='add'>+			error = try_break_deleg(inode, delegated_inode);</div><div class='ctx'> 		if (!error)</div><div class='ctx'> 			error = dir-&gt;i_op-&gt;link(old_dentry, dir, new_dentry);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!error &amp;&amp; (inode-&gt;i_state &amp; I_LINKABLE)) {</div><div class='add'>+	if (!error &amp;&amp; (inode_state_read_once(inode) &amp; I_LINKABLE)) {</div><div class='ctx'> 		spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-		inode-&gt;i_state &amp;= ~I_LINKABLE;</div><div class='add'>+		inode_state_clear(inode, I_LINKABLE);</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	}</div><div class='ctx'> 	inode_unlock(inode);</div><div class='hunk'>@@ -4400,10 +5670,10 @@ EXPORT_SYMBOL(vfs_link);</div><div class='ctx'> int do_linkat(int olddfd, struct filename *old, int newdfd,</div><div class='ctx'> 	      struct filename *new, int flags)</div><div class='ctx'> {</div><div class='del'>-	struct user_namespace *mnt_userns;</div><div class='add'>+	struct mnt_idmap *idmap;</div><div class='ctx'> 	struct dentry *new_dentry;</div><div class='ctx'> 	struct path old_path, new_path;</div><div class='del'>-	struct inode *delegated_inode = NULL;</div><div class='add'>+	struct delegated_inode delegated_inode = { };</div><div class='ctx'> 	int how = 0;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='hunk'>@@ -4412,14 +5682,13 @@ int do_linkat(int olddfd, struct filename *old, int newdfd,</div><div class='ctx'> 		goto out_putnames;</div><div class='ctx'> 	}</div><div class='ctx'> 	/*</div><div class='del'>-	 * To use null names we require CAP_DAC_READ_SEARCH</div><div class='add'>+	 * To use null names we require CAP_DAC_READ_SEARCH or</div><div class='add'>+	 * that the open-time creds of the dfd matches current.</div><div class='ctx'> 	 * This ensures that not everyone will be able to create</div><div class='del'>-	 * handlink using the passed filedescriptor.</div><div class='add'>+	 * a hardlink using the passed file descriptor.</div><div class='ctx'> 	 */</div><div class='del'>-	if (flags &amp; AT_EMPTY_PATH &amp;&amp; !capable(CAP_DAC_READ_SEARCH)) {</div><div class='del'>-		error = -ENOENT;</div><div class='del'>-		goto out_putnames;</div><div class='del'>-	}</div><div class='add'>+	if (flags &amp; AT_EMPTY_PATH)</div><div class='add'>+		how |= LOOKUP_LINKAT_EMPTY;</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; AT_SYMLINK_FOLLOW)</div><div class='ctx'> 		how |= LOOKUP_FOLLOW;</div><div class='hunk'>@@ -4437,18 +5706,18 @@ retry:</div><div class='ctx'> 	error = -EXDEV;</div><div class='ctx'> 	if (old_path.mnt != new_path.mnt)</div><div class='ctx'> 		goto out_dput;</div><div class='del'>-	mnt_userns = mnt_user_ns(new_path.mnt);</div><div class='del'>-	error = may_linkat(mnt_userns, &amp;old_path);</div><div class='add'>+	idmap = mnt_idmap(new_path.mnt);</div><div class='add'>+	error = may_linkat(idmap, &amp;old_path);</div><div class='ctx'> 	if (unlikely(error))</div><div class='ctx'> 		goto out_dput;</div><div class='ctx'> 	error = security_path_link(old_path.dentry, &amp;new_path, new_dentry);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out_dput;</div><div class='del'>-	error = vfs_link(old_path.dentry, mnt_userns, new_path.dentry-&gt;d_inode,</div><div class='add'>+	error = vfs_link(old_path.dentry, idmap, new_path.dentry-&gt;d_inode,</div><div class='ctx'> 			 new_dentry, &amp;delegated_inode);</div><div class='ctx'> out_dput:</div><div class='del'>-	done_path_create(&amp;new_path, new_dentry);</div><div class='del'>-	if (delegated_inode) {</div><div class='add'>+	end_creating_path(&amp;new_path, new_dentry);</div><div class='add'>+	if (is_delegated(&amp;delegated_inode)) {</div><div class='ctx'> 		error = break_deleg_wait(&amp;delegated_inode);</div><div class='ctx'> 		if (!error) {</div><div class='ctx'> 			path_put(&amp;old_path);</div><div class='hunk'>@@ -4504,12 +5773,13 @@ SYSCALL_DEFINE2(link, const char __user *, oldname, const char __user *, newname</div><div class='ctx'>  *</div><div class='ctx'>  *	a) we can get into loop creation.</div><div class='ctx'>  *	b) race potential - two innocent renames can create a loop together.</div><div class='del'>- *	   That's where 4.4 screws up. Current fix: serialization on</div><div class='add'>+ *	   That's where 4.4BSD screws up. Current fix: serialization on</div><div class='ctx'>  *	   sb-&gt;s_vfs_rename_mutex. We might be more accurate, but that's another</div><div class='ctx'>  *	   story.</div><div class='del'>- *	c) we have to lock _four_ objects - parents and victim (if it exists),</div><div class='del'>- *	   and source (if it is not a directory).</div><div class='del'>- *	   And that - after we got -&gt;i_mutex on parents (until then we don't know</div><div class='add'>+ *	c) we may have to lock up to _four_ objects - parents and victim (if it exists),</div><div class='add'>+ *	   and source (if it's a non-directory or a subdirectory that moves to</div><div class='add'>+ *	   different parent).</div><div class='add'>+ *	   And that - after we got -&gt;i_rwsem on parents (until then we don't know</div><div class='ctx'>  *	   whether the target exists).  Solution: try to be smart with locking</div><div class='ctx'>  *	   order for inodes.  We rely on the fact that tree topology may change</div><div class='ctx'>  *	   only under -&gt;s_vfs_rename_mutex _and_ that parent of the object we</div><div class='hunk'>@@ -4521,18 +5791,19 @@ SYSCALL_DEFINE2(link, const char __user *, oldname, const char __user *, newname</div><div class='ctx'>  *	   has no more than 1 dentry.  If "hybrid" objects will ever appear,</div><div class='ctx'>  *	   we'd better make sure that there's no link(2) for them.</div><div class='ctx'>  *	d) conversion from fhandle to dentry may come in the wrong moment - when</div><div class='del'>- *	   we are removing the target. Solution: we will have to grab -&gt;i_mutex</div><div class='add'>+ *	   we are removing the target. Solution: we will have to grab -&gt;i_rwsem</div><div class='ctx'>  *	   in the fhandle_to_dentry code. [FIXME - current nfsfh.c relies on</div><div class='del'>- *	   -&gt;i_mutex on parents, which works but leads to some truly excessive</div><div class='add'>+ *	   -&gt;i_rwsem on parents, which works but leads to some truly excessive</div><div class='ctx'>  *	   locking].</div><div class='ctx'>  */</div><div class='ctx'> int vfs_rename(struct renamedata *rd)</div><div class='ctx'> {</div><div class='ctx'> 	int error;</div><div class='del'>-	struct inode *old_dir = rd-&gt;old_dir, *new_dir = rd-&gt;new_dir;</div><div class='add'>+	struct inode *old_dir = d_inode(rd-&gt;old_parent);</div><div class='add'>+	struct inode *new_dir = d_inode(rd-&gt;new_parent);</div><div class='ctx'> 	struct dentry *old_dentry = rd-&gt;old_dentry;</div><div class='ctx'> 	struct dentry *new_dentry = rd-&gt;new_dentry;</div><div class='del'>-	struct inode **delegated_inode = rd-&gt;delegated_inode;</div><div class='add'>+	struct delegated_inode *delegated_inode = rd-&gt;delegated_inode;</div><div class='ctx'> 	unsigned int flags = rd-&gt;flags;</div><div class='ctx'> 	bool is_dir = d_is_dir(old_dentry);</div><div class='ctx'> 	struct inode *source = old_dentry-&gt;d_inode;</div><div class='hunk'>@@ -4540,24 +5811,25 @@ int vfs_rename(struct renamedata *rd)</div><div class='ctx'> 	bool new_is_dir = false;</div><div class='ctx'> 	unsigned max_links = new_dir-&gt;i_sb-&gt;s_max_links;</div><div class='ctx'> 	struct name_snapshot old_name;</div><div class='add'>+	bool lock_old_subdir, lock_new_subdir;</div><div class='ctx'> </div><div class='ctx'> 	if (source == target)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	error = may_delete(rd-&gt;old_mnt_userns, old_dir, old_dentry, is_dir);</div><div class='add'>+	error = may_delete(rd-&gt;mnt_idmap, old_dir, old_dentry, is_dir);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='ctx'> 	if (!target) {</div><div class='del'>-		error = may_create(rd-&gt;new_mnt_userns, new_dir, new_dentry);</div><div class='add'>+		error = may_create(rd-&gt;mnt_idmap, new_dir, new_dentry);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		new_is_dir = d_is_dir(new_dentry);</div><div class='ctx'> </div><div class='ctx'> 		if (!(flags &amp; RENAME_EXCHANGE))</div><div class='del'>-			error = may_delete(rd-&gt;new_mnt_userns, new_dir,</div><div class='add'>+			error = may_delete(rd-&gt;mnt_idmap, new_dir,</div><div class='ctx'> 					   new_dentry, is_dir);</div><div class='ctx'> 		else</div><div class='del'>-			error = may_delete(rd-&gt;new_mnt_userns, new_dir,</div><div class='add'>+			error = may_delete(rd-&gt;mnt_idmap, new_dir,</div><div class='ctx'> 					   new_dentry, new_is_dir);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (error)</div><div class='hunk'>@@ -4572,13 +5844,13 @@ int vfs_rename(struct renamedata *rd)</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (new_dir != old_dir) {</div><div class='ctx'> 		if (is_dir) {</div><div class='del'>-			error = inode_permission(rd-&gt;old_mnt_userns, source,</div><div class='add'>+			error = inode_permission(rd-&gt;mnt_idmap, source,</div><div class='ctx'> 						 MAY_WRITE);</div><div class='ctx'> 			if (error)</div><div class='ctx'> 				return error;</div><div class='ctx'> 		}</div><div class='ctx'> 		if ((flags &amp; RENAME_EXCHANGE) &amp;&amp; new_is_dir) {</div><div class='del'>-			error = inode_permission(rd-&gt;new_mnt_userns, target,</div><div class='add'>+			error = inode_permission(rd-&gt;mnt_idmap, target,</div><div class='ctx'> 						 MAY_WRITE);</div><div class='ctx'> 			if (error)</div><div class='ctx'> 				return error;</div><div class='hunk'>@@ -4592,10 +5864,33 @@ int vfs_rename(struct renamedata *rd)</div><div class='ctx'> </div><div class='ctx'> 	take_dentry_name_snapshot(&amp;old_name, old_dentry);</div><div class='ctx'> 	dget(new_dentry);</div><div class='del'>-	if (!is_dir || (flags &amp; RENAME_EXCHANGE))</div><div class='add'>+	/*</div><div class='add'>+	 * Lock children.</div><div class='add'>+	 * The source subdirectory needs to be locked on cross-directory</div><div class='add'>+	 * rename or cross-directory exchange since its parent changes.</div><div class='add'>+	 * The target subdirectory needs to be locked on cross-directory</div><div class='add'>+	 * exchange due to parent change and on any rename due to becoming</div><div class='add'>+	 * a victim.</div><div class='add'>+	 * Non-directories need locking in all cases (for NFS reasons);</div><div class='add'>+	 * they get locked after any subdirectories (in inode address order).</div><div class='add'>+	 *</div><div class='add'>+	 * NOTE: WE ONLY LOCK UNRELATED DIRECTORIES IN CROSS-DIRECTORY CASE.</div><div class='add'>+	 * NEVER, EVER DO THAT WITHOUT -&gt;s_vfs_rename_mutex.</div><div class='add'>+	 */</div><div class='add'>+	lock_old_subdir = new_dir != old_dir;</div><div class='add'>+	lock_new_subdir = new_dir != old_dir || !(flags &amp; RENAME_EXCHANGE);</div><div class='add'>+	if (is_dir) {</div><div class='add'>+		if (lock_old_subdir)</div><div class='add'>+			inode_lock_nested(source, I_MUTEX_CHILD);</div><div class='add'>+		if (target &amp;&amp; (!new_is_dir || lock_new_subdir))</div><div class='add'>+			inode_lock(target);</div><div class='add'>+	} else if (new_is_dir) {</div><div class='add'>+		if (lock_new_subdir)</div><div class='add'>+			inode_lock_nested(target, I_MUTEX_CHILD);</div><div class='add'>+		inode_lock(source);</div><div class='add'>+	} else {</div><div class='ctx'> 		lock_two_nondirectories(source, target);</div><div class='del'>-	else if (target)</div><div class='del'>-		inode_lock(target);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	error = -EPERM;</div><div class='ctx'> 	if (IS_SWAPFILE(source) || (target &amp;&amp; IS_SWAPFILE(target)))</div><div class='hunk'>@@ -4613,6 +5908,14 @@ int vfs_rename(struct renamedata *rd)</div><div class='ctx'> 		    old_dir-&gt;i_nlink &gt;= max_links)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='add'>+	error = try_break_deleg(old_dir, delegated_inode);</div><div class='add'>+	if (error)</div><div class='add'>+		goto out;</div><div class='add'>+	if (new_dir != old_dir) {</div><div class='add'>+		error = try_break_deleg(new_dir, delegated_inode);</div><div class='add'>+		if (error)</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='ctx'> 	if (!is_dir) {</div><div class='ctx'> 		error = try_break_deleg(source, delegated_inode);</div><div class='ctx'> 		if (error)</div><div class='hunk'>@@ -4623,7 +5926,7 @@ int vfs_rename(struct renamedata *rd)</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='del'>-	error = old_dir-&gt;i_op-&gt;rename(rd-&gt;new_mnt_userns, old_dir, old_dentry,</div><div class='add'>+	error = old_dir-&gt;i_op-&gt;rename(rd-&gt;mnt_idmap, old_dir, old_dentry,</div><div class='ctx'> 				      new_dir, new_dentry, flags);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -4643,9 +5946,9 @@ int vfs_rename(struct renamedata *rd)</div><div class='ctx'> 			d_exchange(old_dentry, new_dentry);</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='del'>-	if (!is_dir || (flags &amp; RENAME_EXCHANGE))</div><div class='del'>-		unlock_two_nondirectories(source, target);</div><div class='del'>-	else if (target)</div><div class='add'>+	if (!is_dir || lock_old_subdir)</div><div class='add'>+		inode_unlock(source);</div><div class='add'>+	if (target &amp;&amp; (!new_is_dir || lock_new_subdir))</div><div class='ctx'> 		inode_unlock(target);</div><div class='ctx'> 	dput(new_dentry);</div><div class='ctx'> 	if (!error) {</div><div class='hunk'>@@ -4666,13 +5969,11 @@ int do_renameat2(int olddfd, struct filename *from, int newdfd,</div><div class='ctx'> 		 struct filename *to, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct renamedata rd;</div><div class='del'>-	struct dentry *old_dentry, *new_dentry;</div><div class='del'>-	struct dentry *trap;</div><div class='ctx'> 	struct path old_path, new_path;</div><div class='ctx'> 	struct qstr old_last, new_last;</div><div class='ctx'> 	int old_type, new_type;</div><div class='del'>-	struct inode *delegated_inode = NULL;</div><div class='del'>-	unsigned int lookup_flags = 0, target_flags = LOOKUP_RENAME_TARGET;</div><div class='add'>+	struct delegated_inode delegated_inode = { };</div><div class='add'>+	unsigned int lookup_flags = 0;</div><div class='ctx'> 	bool should_retry = false;</div><div class='ctx'> 	int error = -EINVAL;</div><div class='ctx'> </div><div class='hunk'>@@ -4683,9 +5984,6 @@ int do_renameat2(int olddfd, struct filename *from, int newdfd,</div><div class='ctx'> 	    (flags &amp; RENAME_EXCHANGE))</div><div class='ctx'> 		goto put_names;</div><div class='ctx'> </div><div class='del'>-	if (flags &amp; RENAME_EXCHANGE)</div><div class='del'>-		target_flags = 0;</div><div class='del'>-</div><div class='ctx'> retry:</div><div class='ctx'> 	error = filename_parentat(olddfd, from, lookup_flags, &amp;old_path,</div><div class='ctx'> 				  &amp;old_last, &amp;old_type);</div><div class='hunk'>@@ -4715,73 +6013,42 @@ retry:</div><div class='ctx'> 		goto exit2;</div><div class='ctx'> </div><div class='ctx'> retry_deleg:</div><div class='del'>-	trap = lock_rename(new_path.dentry, old_path.dentry);</div><div class='add'>+	rd.old_parent	   = old_path.dentry;</div><div class='add'>+	rd.mnt_idmap	   = mnt_idmap(old_path.mnt);</div><div class='add'>+	rd.new_parent	   = new_path.dentry;</div><div class='add'>+	rd.delegated_inode = &amp;delegated_inode;</div><div class='add'>+	rd.flags	   = flags;</div><div class='ctx'> </div><div class='del'>-	old_dentry = __lookup_hash(&amp;old_last, old_path.dentry, lookup_flags);</div><div class='del'>-	error = PTR_ERR(old_dentry);</div><div class='del'>-	if (IS_ERR(old_dentry))</div><div class='del'>-		goto exit3;</div><div class='del'>-	/* source must exist */</div><div class='del'>-	error = -ENOENT;</div><div class='del'>-	if (d_is_negative(old_dentry))</div><div class='del'>-		goto exit4;</div><div class='del'>-	new_dentry = __lookup_hash(&amp;new_last, new_path.dentry, lookup_flags | target_flags);</div><div class='del'>-	error = PTR_ERR(new_dentry);</div><div class='del'>-	if (IS_ERR(new_dentry))</div><div class='del'>-		goto exit4;</div><div class='del'>-	error = -EEXIST;</div><div class='del'>-	if ((flags &amp; RENAME_NOREPLACE) &amp;&amp; d_is_positive(new_dentry))</div><div class='del'>-		goto exit5;</div><div class='del'>-	if (flags &amp; RENAME_EXCHANGE) {</div><div class='del'>-		error = -ENOENT;</div><div class='del'>-		if (d_is_negative(new_dentry))</div><div class='del'>-			goto exit5;</div><div class='add'>+	error = __start_renaming(&amp;rd, lookup_flags, &amp;old_last, &amp;new_last);</div><div class='add'>+	if (error)</div><div class='add'>+		goto exit_lock_rename;</div><div class='ctx'> </div><div class='del'>-		if (!d_is_dir(new_dentry)) {</div><div class='add'>+	if (flags &amp; RENAME_EXCHANGE) {</div><div class='add'>+		if (!d_is_dir(rd.new_dentry)) {</div><div class='ctx'> 			error = -ENOTDIR;</div><div class='ctx'> 			if (new_last.name[new_last.len])</div><div class='del'>-				goto exit5;</div><div class='add'>+				goto exit_unlock;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	/* unless the source is a directory trailing slashes give -ENOTDIR */</div><div class='del'>-	if (!d_is_dir(old_dentry)) {</div><div class='add'>+	if (!d_is_dir(rd.old_dentry)) {</div><div class='ctx'> 		error = -ENOTDIR;</div><div class='ctx'> 		if (old_last.name[old_last.len])</div><div class='del'>-			goto exit5;</div><div class='add'>+			goto exit_unlock;</div><div class='ctx'> 		if (!(flags &amp; RENAME_EXCHANGE) &amp;&amp; new_last.name[new_last.len])</div><div class='del'>-			goto exit5;</div><div class='add'>+			goto exit_unlock;</div><div class='ctx'> 	}</div><div class='del'>-	/* source should not be ancestor of target */</div><div class='del'>-	error = -EINVAL;</div><div class='del'>-	if (old_dentry == trap)</div><div class='del'>-		goto exit5;</div><div class='del'>-	/* target should not be an ancestor of source */</div><div class='del'>-	if (!(flags &amp; RENAME_EXCHANGE))</div><div class='del'>-		error = -ENOTEMPTY;</div><div class='del'>-	if (new_dentry == trap)</div><div class='del'>-		goto exit5;</div><div class='ctx'> </div><div class='del'>-	error = security_path_rename(&amp;old_path, old_dentry,</div><div class='del'>-				     &amp;new_path, new_dentry, flags);</div><div class='add'>+	error = security_path_rename(&amp;old_path, rd.old_dentry,</div><div class='add'>+				     &amp;new_path, rd.new_dentry, flags);</div><div class='ctx'> 	if (error)</div><div class='del'>-		goto exit5;</div><div class='del'>-</div><div class='del'>-	rd.old_dir	   = old_path.dentry-&gt;d_inode;</div><div class='del'>-	rd.old_dentry	   = old_dentry;</div><div class='del'>-	rd.old_mnt_userns  = mnt_user_ns(old_path.mnt);</div><div class='del'>-	rd.new_dir	   = new_path.dentry-&gt;d_inode;</div><div class='del'>-	rd.new_dentry	   = new_dentry;</div><div class='del'>-	rd.new_mnt_userns  = mnt_user_ns(new_path.mnt);</div><div class='del'>-	rd.delegated_inode = &amp;delegated_inode;</div><div class='del'>-	rd.flags	   = flags;</div><div class='add'>+		goto exit_unlock;</div><div class='add'>+</div><div class='ctx'> 	error = vfs_rename(&amp;rd);</div><div class='del'>-exit5:</div><div class='del'>-	dput(new_dentry);</div><div class='del'>-exit4:</div><div class='del'>-	dput(old_dentry);</div><div class='del'>-exit3:</div><div class='del'>-	unlock_rename(new_path.dentry, old_path.dentry);</div><div class='del'>-	if (delegated_inode) {</div><div class='add'>+exit_unlock:</div><div class='add'>+	end_renaming(&amp;rd);</div><div class='add'>+exit_lock_rename:</div><div class='add'>+	if (is_delegated(&amp;delegated_inode)) {</div><div class='ctx'> 		error = break_deleg_wait(&amp;delegated_inode);</div><div class='ctx'> 		if (!error)</div><div class='ctx'> 			goto retry_deleg;</div><div class='hunk'>@@ -4824,19 +6091,16 @@ SYSCALL_DEFINE2(rename, const char __user *, oldname, const char __user *, newna</div><div class='ctx'> 				getname(newname), 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int readlink_copy(char __user *buffer, int buflen, const char *link)</div><div class='add'>+int readlink_copy(char __user *buffer, int buflen, const char *link, int linklen)</div><div class='ctx'> {</div><div class='del'>-	int len = PTR_ERR(link);</div><div class='del'>-	if (IS_ERR(link))</div><div class='del'>-		goto out;</div><div class='add'>+	int copylen;</div><div class='ctx'> </div><div class='del'>-	len = strlen(link);</div><div class='del'>-	if (len &gt; (unsigned) buflen)</div><div class='del'>-		len = buflen;</div><div class='del'>-	if (copy_to_user(buffer, link, len))</div><div class='del'>-		len = -EFAULT;</div><div class='del'>-out:</div><div class='del'>-	return len;</div><div class='add'>+	copylen = linklen;</div><div class='add'>+	if (unlikely(copylen &gt; (unsigned) buflen))</div><div class='add'>+		copylen = buflen;</div><div class='add'>+	if (copy_to_user(buffer, link, copylen))</div><div class='add'>+		copylen = -EFAULT;</div><div class='add'>+	return copylen;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -4856,6 +6120,9 @@ int vfs_readlink(struct dentry *dentry, char __user *buffer, int buflen)</div><div class='ctx'> 	const char *link;</div><div class='ctx'> 	int res;</div><div class='ctx'> </div><div class='add'>+	if (inode-&gt;i_opflags &amp; IOP_CACHED_LINK)</div><div class='add'>+		return readlink_copy(buffer, buflen, inode-&gt;i_link, inode-&gt;i_linklen);</div><div class='add'>+</div><div class='ctx'> 	if (unlikely(!(inode-&gt;i_opflags &amp; IOP_DEFAULT_READLINK))) {</div><div class='ctx'> 		if (unlikely(inode-&gt;i_op-&gt;readlink))</div><div class='ctx'> 			return inode-&gt;i_op-&gt;readlink(dentry, buffer, buflen);</div><div class='hunk'>@@ -4874,7 +6141,7 @@ int vfs_readlink(struct dentry *dentry, char __user *buffer, int buflen)</div><div class='ctx'> 		if (IS_ERR(link))</div><div class='ctx'> 			return PTR_ERR(link);</div><div class='ctx'> 	}</div><div class='del'>-	res = readlink_copy(buffer, buflen, link);</div><div class='add'>+	res = readlink_copy(buffer, buflen, link, strlen(link));</div><div class='ctx'> 	do_delayed_call(&amp;done);</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='hunk'>@@ -4906,75 +6173,117 @@ const char *vfs_get_link(struct dentry *dentry, struct delayed_call *done)</div><div class='ctx'> EXPORT_SYMBOL(vfs_get_link);</div><div class='ctx'> </div><div class='ctx'> /* get the link contents into pagecache */</div><div class='del'>-const char *page_get_link(struct dentry *dentry, struct inode *inode,</div><div class='del'>-			  struct delayed_call *callback)</div><div class='add'>+static char *__page_get_link(struct dentry *dentry, struct inode *inode,</div><div class='add'>+			     struct delayed_call *callback)</div><div class='ctx'> {</div><div class='del'>-	char *kaddr;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='ctx'> </div><div class='ctx'> 	if (!dentry) {</div><div class='del'>-		page = find_get_page(mapping, 0);</div><div class='del'>-		if (!page)</div><div class='add'>+		folio = filemap_get_folio(mapping, 0);</div><div class='add'>+		if (IS_ERR(folio))</div><div class='ctx'> 			return ERR_PTR(-ECHILD);</div><div class='del'>-		if (!PageUptodate(page)) {</div><div class='del'>-			put_page(page);</div><div class='add'>+		if (!folio_test_uptodate(folio)) {</div><div class='add'>+			folio_put(folio);</div><div class='ctx'> 			return ERR_PTR(-ECHILD);</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='del'>-		page = read_mapping_page(mapping, 0, NULL);</div><div class='del'>-		if (IS_ERR(page))</div><div class='del'>-			return (char*)page;</div><div class='add'>+		folio = read_mapping_folio(mapping, 0, NULL);</div><div class='add'>+		if (IS_ERR(folio))</div><div class='add'>+			return ERR_CAST(folio);</div><div class='ctx'> 	}</div><div class='del'>-	set_delayed_call(callback, page_put_link, page);</div><div class='add'>+	set_delayed_call(callback, page_put_link, folio);</div><div class='ctx'> 	BUG_ON(mapping_gfp_mask(mapping) &amp; __GFP_HIGHMEM);</div><div class='del'>-	kaddr = page_address(page);</div><div class='del'>-	nd_terminate_link(kaddr, inode-&gt;i_size, PAGE_SIZE - 1);</div><div class='del'>-	return kaddr;</div><div class='add'>+	return folio_address(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+const char *page_get_link_raw(struct dentry *dentry, struct inode *inode,</div><div class='add'>+			      struct delayed_call *callback)</div><div class='add'>+{</div><div class='add'>+	return __page_get_link(dentry, inode, callback);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(page_get_link_raw);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * page_get_link() - An implementation of the get_link inode_operation.</div><div class='add'>+ * @dentry: The directory entry which is the symlink.</div><div class='add'>+ * @inode: The inode for the symlink.</div><div class='add'>+ * @callback: Used to drop the reference to the symlink.</div><div class='add'>+ *</div><div class='add'>+ * Filesystems which store their symlinks in the page cache should use</div><div class='add'>+ * this to implement the get_link() member of their inode_operations.</div><div class='add'>+ *</div><div class='add'>+ * Return: A pointer to the NUL-terminated symlink.</div><div class='add'>+ */</div><div class='add'>+const char *page_get_link(struct dentry *dentry, struct inode *inode,</div><div class='add'>+					struct delayed_call *callback)</div><div class='add'>+{</div><div class='add'>+	char *kaddr = __page_get_link(dentry, inode, callback);</div><div class='add'>+</div><div class='add'>+	if (!IS_ERR(kaddr))</div><div class='add'>+		nd_terminate_link(kaddr, inode-&gt;i_size, PAGE_SIZE - 1);</div><div class='add'>+	return kaddr;</div><div class='add'>+}</div><div class='ctx'> EXPORT_SYMBOL(page_get_link);</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * page_put_link() - Drop the reference to the symlink.</div><div class='add'>+ * @arg: The folio which contains the symlink.</div><div class='add'>+ *</div><div class='add'>+ * This is used internally by page_get_link().  It is exported for use</div><div class='add'>+ * by filesystems which need to implement a variant of page_get_link()</div><div class='add'>+ * themselves.  Despite the apparent symmetry, filesystems which use</div><div class='add'>+ * page_get_link() do not need to call page_put_link().</div><div class='add'>+ *</div><div class='add'>+ * The argument, while it has a void pointer type, must be a pointer to</div><div class='add'>+ * the folio which was retrieved from the page cache.  The delayed_call</div><div class='add'>+ * infrastructure is used to drop the reference count once the caller</div><div class='add'>+ * is done with the symlink.</div><div class='add'>+ */</div><div class='ctx'> void page_put_link(void *arg)</div><div class='ctx'> {</div><div class='del'>-	put_page(arg);</div><div class='add'>+	folio_put(arg);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(page_put_link);</div><div class='ctx'> </div><div class='ctx'> int page_readlink(struct dentry *dentry, char __user *buffer, int buflen)</div><div class='ctx'> {</div><div class='add'>+	const char *link;</div><div class='add'>+	int res;</div><div class='add'>+</div><div class='ctx'> 	DEFINE_DELAYED_CALL(done);</div><div class='del'>-	int res = readlink_copy(buffer, buflen,</div><div class='del'>-				page_get_link(dentry, d_inode(dentry),</div><div class='del'>-					      &amp;done));</div><div class='add'>+	link = page_get_link(dentry, d_inode(dentry), &amp;done);</div><div class='add'>+	res = PTR_ERR(link);</div><div class='add'>+	if (!IS_ERR(link))</div><div class='add'>+		res = readlink_copy(buffer, buflen, link, strlen(link));</div><div class='ctx'> 	do_delayed_call(&amp;done);</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(page_readlink);</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * The nofs argument instructs pagecache_write_begin to pass AOP_FLAG_NOFS</div><div class='del'>- */</div><div class='del'>-int __page_symlink(struct inode *inode, const char *symname, int len, int nofs)</div><div class='add'>+int page_symlink(struct inode *inode, const char *symname, int len)</div><div class='ctx'> {</div><div class='ctx'> 	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='del'>-	struct page *page;</div><div class='del'>-	void *fsdata;</div><div class='add'>+	const struct address_space_operations *aops = mapping-&gt;a_ops;</div><div class='add'>+	bool nofs = !mapping_gfp_constraint(mapping, __GFP_FS);</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	void *fsdata = NULL;</div><div class='ctx'> 	int err;</div><div class='del'>-	unsigned int flags = 0;</div><div class='del'>-	if (nofs)</div><div class='del'>-		flags |= AOP_FLAG_NOFS;</div><div class='add'>+	unsigned int flags;</div><div class='ctx'> </div><div class='ctx'> retry:</div><div class='del'>-	err = pagecache_write_begin(NULL, mapping, 0, len-1,</div><div class='del'>-				flags, &amp;page, &amp;fsdata);</div><div class='add'>+	if (nofs)</div><div class='add'>+		flags = memalloc_nofs_save();</div><div class='add'>+	err = aops-&gt;write_begin(NULL, mapping, 0, len-1, &amp;folio, &amp;fsdata);</div><div class='add'>+	if (nofs)</div><div class='add'>+		memalloc_nofs_restore(flags);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> </div><div class='del'>-	memcpy(page_address(page), symname, len-1);</div><div class='add'>+	memcpy(folio_address(folio), symname, len - 1);</div><div class='ctx'> </div><div class='del'>-	err = pagecache_write_end(NULL, mapping, 0, len-1, len-1,</div><div class='del'>-							page, fsdata);</div><div class='add'>+	err = aops-&gt;write_end(NULL, mapping, 0, len - 1, len - 1,</div><div class='add'>+						folio, fsdata);</div><div class='ctx'> 	if (err &lt; 0)</div><div class='ctx'> 		goto fail;</div><div class='ctx'> 	if (err &lt; len-1)</div><div class='hunk'>@@ -4985,13 +6294,6 @@ retry:</div><div class='ctx'> fail:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL(__page_symlink);</div><div class='del'>-</div><div class='del'>-int page_symlink(struct inode *inode, const char *symname, int len)</div><div class='del'>-{</div><div class='del'>-	return __page_symlink(inode, symname, len,</div><div class='del'>-			!mapping_gfp_constraint(inode-&gt;i_mapping, __GFP_FS));</div><div class='del'>-}</div><div class='ctx'> EXPORT_SYMBOL(page_symlink);</div><div class='ctx'> </div><div class='ctx'> const struct inode_operations page_symlink_inode_operations = {</div><div class='head'>diff --git a/fs/namespace.c b/fs/namespace.c<br/>index 659a8f39c61a..c58674a20cad 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/namespace.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/namespace.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/namespace.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/namespace.c</a></div><div class='hunk'>@@ -31,17 +31,20 @@</div><div class='ctx'> #include &lt;uapi/linux/mount.h&gt;</div><div class='ctx'> #include &lt;linux/fs_context.h&gt;</div><div class='ctx'> #include &lt;linux/shmem_fs.h&gt;</div><div class='add'>+#include &lt;linux/mnt_idmapping.h&gt;</div><div class='add'>+#include &lt;linux/pidfs.h&gt;</div><div class='add'>+#include &lt;linux/nstree.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "pnode.h"</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> </div><div class='ctx'> /* Maximum number of mounts in a mount namespace */</div><div class='del'>-unsigned int sysctl_mount_max __read_mostly = 100000;</div><div class='add'>+static unsigned int sysctl_mount_max __read_mostly = 100000;</div><div class='ctx'> </div><div class='del'>-static unsigned int m_hash_mask __read_mostly;</div><div class='del'>-static unsigned int m_hash_shift __read_mostly;</div><div class='del'>-static unsigned int mp_hash_mask __read_mostly;</div><div class='del'>-static unsigned int mp_hash_shift __read_mostly;</div><div class='add'>+static unsigned int m_hash_mask __ro_after_init;</div><div class='add'>+static unsigned int m_hash_shift __ro_after_init;</div><div class='add'>+static unsigned int mp_hash_mask __ro_after_init;</div><div class='add'>+static unsigned int mp_hash_shift __ro_after_init;</div><div class='ctx'> </div><div class='ctx'> static __initdata unsigned long mhash_entries;</div><div class='ctx'> static int __init set_mhash_entries(char *str)</div><div class='hunk'>@@ -63,28 +66,60 @@ static int __init set_mphash_entries(char *str)</div><div class='ctx'> }</div><div class='ctx'> __setup("mphash_entries=", set_mphash_entries);</div><div class='ctx'> </div><div class='add'>+static char * __initdata initramfs_options;</div><div class='add'>+static int __init initramfs_options_setup(char *str)</div><div class='add'>+{</div><div class='add'>+	initramfs_options = str;</div><div class='add'>+	return 1;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+__setup("initramfs_options=", initramfs_options_setup);</div><div class='add'>+</div><div class='ctx'> static u64 event;</div><div class='del'>-static DEFINE_IDA(mnt_id_ida);</div><div class='add'>+static DEFINE_XARRAY_FLAGS(mnt_id_xa, XA_FLAGS_ALLOC);</div><div class='ctx'> static DEFINE_IDA(mnt_group_ida);</div><div class='ctx'> </div><div class='del'>-static struct hlist_head *mount_hashtable __read_mostly;</div><div class='del'>-static struct hlist_head *mountpoint_hashtable __read_mostly;</div><div class='del'>-static struct kmem_cache *mnt_cache __read_mostly;</div><div class='add'>+/* Don't allow confusion with old 32bit mount ID */</div><div class='add'>+#define MNT_UNIQUE_ID_OFFSET (1ULL &lt;&lt; 31)</div><div class='add'>+static u64 mnt_id_ctr = MNT_UNIQUE_ID_OFFSET;</div><div class='add'>+</div><div class='add'>+static struct hlist_head *mount_hashtable __ro_after_init;</div><div class='add'>+static struct hlist_head *mountpoint_hashtable __ro_after_init;</div><div class='add'>+static struct kmem_cache *mnt_cache __ro_after_init;</div><div class='ctx'> static DECLARE_RWSEM(namespace_sem);</div><div class='ctx'> static HLIST_HEAD(unmounted);	/* protected by namespace_sem */</div><div class='ctx'> static LIST_HEAD(ex_mountpoints); /* protected by namespace_sem */</div><div class='add'>+static struct mnt_namespace *emptied_ns; /* protected by namespace_sem */</div><div class='add'>+</div><div class='add'>+static inline void namespace_lock(void);</div><div class='add'>+static void namespace_unlock(void);</div><div class='add'>+DEFINE_LOCK_GUARD_0(namespace_excl, namespace_lock(), namespace_unlock())</div><div class='add'>+DEFINE_LOCK_GUARD_0(namespace_shared, down_read(&amp;namespace_sem),</div><div class='add'>+				      up_read(&amp;namespace_sem))</div><div class='add'>+</div><div class='add'>+DEFINE_FREE(mntput, struct vfsmount *, if (!IS_ERR(_T)) mntput(_T))</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_FSNOTIFY</div><div class='add'>+LIST_HEAD(notify_list); /* protected by namespace_sem */</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+enum mount_kattr_flags_t {</div><div class='add'>+	MOUNT_KATTR_RECURSE		= (1 &lt;&lt; 0),</div><div class='add'>+	MOUNT_KATTR_IDMAP_REPLACE	= (1 &lt;&lt; 1),</div><div class='add'>+};</div><div class='ctx'> </div><div class='ctx'> struct mount_kattr {</div><div class='ctx'> 	unsigned int attr_set;</div><div class='ctx'> 	unsigned int attr_clr;</div><div class='ctx'> 	unsigned int propagation;</div><div class='ctx'> 	unsigned int lookup_flags;</div><div class='del'>-	bool recurse;</div><div class='add'>+	enum mount_kattr_flags_t kflags;</div><div class='ctx'> 	struct user_namespace *mnt_userns;</div><div class='add'>+	struct mnt_idmap *mnt_idmap;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /* /sys/fs */</div><div class='del'>-struct kobject *fs_kobj;</div><div class='add'>+struct kobject *fs_kobj __ro_after_init;</div><div class='ctx'> EXPORT_SYMBOL_GPL(fs_kobj);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -97,6 +132,65 @@ EXPORT_SYMBOL_GPL(fs_kobj);</div><div class='ctx'>  */</div><div class='ctx'> __cacheline_aligned_in_smp DEFINE_SEQLOCK(mount_lock);</div><div class='ctx'> </div><div class='add'>+static void mnt_ns_release(struct mnt_namespace *ns)</div><div class='add'>+{</div><div class='add'>+	/* keep alive for {list,stat}mount() */</div><div class='add'>+	if (ns &amp;&amp; refcount_dec_and_test(&amp;ns-&gt;passive)) {</div><div class='add'>+		fsnotify_mntns_delete(ns);</div><div class='add'>+		put_user_ns(ns-&gt;user_ns);</div><div class='add'>+		kfree(ns);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+DEFINE_FREE(mnt_ns_release, struct mnt_namespace *,</div><div class='add'>+	    if (!IS_ERR(_T)) mnt_ns_release(_T))</div><div class='add'>+</div><div class='add'>+static void mnt_ns_release_rcu(struct rcu_head *rcu)</div><div class='add'>+{</div><div class='add'>+	mnt_ns_release(container_of(rcu, struct mnt_namespace, ns.ns_rcu));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void mnt_ns_tree_remove(struct mnt_namespace *ns)</div><div class='add'>+{</div><div class='add'>+	/* remove from global mount namespace list */</div><div class='add'>+	if (ns_tree_active(ns))</div><div class='add'>+		ns_tree_remove(ns);</div><div class='add'>+</div><div class='add'>+	call_rcu(&amp;ns-&gt;ns.ns_rcu, mnt_ns_release_rcu);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Lookup a mount namespace by id and take a passive reference count. Taking a</div><div class='add'>+ * passive reference means the mount namespace can be emptied if e.g., the last</div><div class='add'>+ * task holding an active reference exits. To access the mounts of the</div><div class='add'>+ * namespace the @namespace_sem must first be acquired. If the namespace has</div><div class='add'>+ * already shut down before acquiring @namespace_sem, {list,stat}mount() will</div><div class='add'>+ * see that the mount rbtree of the namespace is empty.</div><div class='add'>+ *</div><div class='add'>+ * Note the lookup is lockless protected by a sequence counter. We only</div><div class='add'>+ * need to guard against false negatives as false positives aren't</div><div class='add'>+ * possible. So if we didn't find a mount namespace and the sequence</div><div class='add'>+ * counter has changed we need to retry. If the sequence counter is</div><div class='add'>+ * still the same we know the search actually failed.</div><div class='add'>+ */</div><div class='add'>+static struct mnt_namespace *lookup_mnt_ns(u64 mnt_ns_id)</div><div class='add'>+{</div><div class='add'>+	struct mnt_namespace *mnt_ns;</div><div class='add'>+	struct ns_common *ns;</div><div class='add'>+</div><div class='add'>+	guard(rcu)();</div><div class='add'>+	ns = ns_tree_lookup_rcu(mnt_ns_id, CLONE_NEWNS);</div><div class='add'>+	if (!ns)</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The last reference count is put with RCU delay so we can</div><div class='add'>+	 * unconditonally acquire a reference here.</div><div class='add'>+	 */</div><div class='add'>+	mnt_ns = container_of(ns, struct mnt_namespace, ns);</div><div class='add'>+	refcount_inc(&amp;mnt_ns-&gt;passive);</div><div class='add'>+	return mnt_ns;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline void lock_mount_hash(void)</div><div class='ctx'> {</div><div class='ctx'> 	write_seqlock(&amp;mount_lock);</div><div class='hunk'>@@ -124,17 +218,19 @@ static inline struct hlist_head *mp_hash(struct dentry *dentry)</div><div class='ctx'> </div><div class='ctx'> static int mnt_alloc_id(struct mount *mnt)</div><div class='ctx'> {</div><div class='del'>-	int res = ida_alloc(&amp;mnt_id_ida, GFP_KERNEL);</div><div class='add'>+	int res;</div><div class='ctx'> </div><div class='del'>-	if (res &lt; 0)</div><div class='del'>-		return res;</div><div class='del'>-	mnt-&gt;mnt_id = res;</div><div class='del'>-	return 0;</div><div class='add'>+	xa_lock(&amp;mnt_id_xa);</div><div class='add'>+	res = __xa_alloc(&amp;mnt_id_xa, &amp;mnt-&gt;mnt_id, mnt, XA_LIMIT(1, INT_MAX), GFP_KERNEL);</div><div class='add'>+	if (!res)</div><div class='add'>+		mnt-&gt;mnt_id_unique = ++mnt_id_ctr;</div><div class='add'>+	xa_unlock(&amp;mnt_id_xa);</div><div class='add'>+	return res;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void mnt_free_id(struct mount *mnt)</div><div class='ctx'> {</div><div class='del'>-	ida_free(&amp;mnt_id_ida, mnt-&gt;mnt_id);</div><div class='add'>+	xa_erase(&amp;mnt_id_xa, mnt-&gt;mnt_id);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -202,12 +298,13 @@ static struct mount *alloc_vfsmnt(const char *name)</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto out_free_cache;</div><div class='ctx'> </div><div class='del'>-		if (name) {</div><div class='add'>+		if (name)</div><div class='ctx'> 			mnt-&gt;mnt_devname = kstrdup_const(name,</div><div class='ctx'> 							 GFP_KERNEL_ACCOUNT);</div><div class='del'>-			if (!mnt-&gt;mnt_devname)</div><div class='del'>-				goto out_free_id;</div><div class='del'>-		}</div><div class='add'>+		else</div><div class='add'>+			mnt-&gt;mnt_devname = "none";</div><div class='add'>+		if (!mnt-&gt;mnt_devname)</div><div class='add'>+			goto out_free_id;</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_SMP</div><div class='ctx'> 		mnt-&gt;mnt_pcp = alloc_percpu(struct mnt_pcp);</div><div class='hunk'>@@ -226,12 +323,12 @@ static struct mount *alloc_vfsmnt(const char *name)</div><div class='ctx'> 		INIT_LIST_HEAD(&amp;mnt-&gt;mnt_list);</div><div class='ctx'> 		INIT_LIST_HEAD(&amp;mnt-&gt;mnt_expire);</div><div class='ctx'> 		INIT_LIST_HEAD(&amp;mnt-&gt;mnt_share);</div><div class='del'>-		INIT_LIST_HEAD(&amp;mnt-&gt;mnt_slave_list);</div><div class='del'>-		INIT_LIST_HEAD(&amp;mnt-&gt;mnt_slave);</div><div class='add'>+		INIT_HLIST_HEAD(&amp;mnt-&gt;mnt_slave_list);</div><div class='add'>+		INIT_HLIST_NODE(&amp;mnt-&gt;mnt_slave);</div><div class='ctx'> 		INIT_HLIST_NODE(&amp;mnt-&gt;mnt_mp_list);</div><div class='del'>-		INIT_LIST_HEAD(&amp;mnt-&gt;mnt_umounting);</div><div class='ctx'> 		INIT_HLIST_HEAD(&amp;mnt-&gt;mnt_stuck_children);</div><div class='del'>-		mnt-&gt;mnt.mnt_userns = &amp;init_user_ns;</div><div class='add'>+		RB_CLEAR_NODE(&amp;mnt-&gt;mnt_node);</div><div class='add'>+		mnt-&gt;mnt.mnt_idmap = &amp;nop_mnt_idmap;</div><div class='ctx'> 	}</div><div class='ctx'> 	return mnt;</div><div class='ctx'> </div><div class='hunk'>@@ -265,7 +362,7 @@ out_free_cache:</div><div class='ctx'>  * mnt_want/drop_write() will _keep_ the filesystem</div><div class='ctx'>  * r/w.</div><div class='ctx'>  */</div><div class='del'>-bool __mnt_is_readonly(struct vfsmount *mnt)</div><div class='add'>+bool __mnt_is_readonly(const struct vfsmount *mnt)</div><div class='ctx'> {</div><div class='ctx'> 	return (mnt-&gt;mnt_flags &amp; MNT_READONLY) || sb_rdonly(mnt-&gt;mnt_sb);</div><div class='ctx'> }</div><div class='hunk'>@@ -305,11 +402,18 @@ static unsigned int mnt_get_writers(struct mount *mnt)</div><div class='ctx'> #endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int mnt_is_readonly(struct vfsmount *mnt)</div><div class='add'>+static int mnt_is_readonly(const struct vfsmount *mnt)</div><div class='ctx'> {</div><div class='del'>-	if (mnt-&gt;mnt_sb-&gt;s_readonly_remount)</div><div class='add'>+	if (READ_ONCE(mnt-&gt;mnt_sb-&gt;s_readonly_remount))</div><div class='ctx'> 		return 1;</div><div class='del'>-	/* Order wrt setting s_flags/s_readonly_remount in do_remount() */</div><div class='add'>+	/*</div><div class='add'>+	 * The barrier pairs with the barrier in sb_start_ro_state_change()</div><div class='add'>+	 * making sure if we don't see s_readonly_remount set yet, we also will</div><div class='add'>+	 * not see any superblock / mount flag changes done by remount.</div><div class='add'>+	 * It also pairs with the barrier in sb_end_ro_state_change()</div><div class='add'>+	 * assuring that if we see s_readonly_remount already cleared, we will</div><div class='add'>+	 * see the values of superblock / mount flags updated by remount.</div><div class='add'>+	 */</div><div class='ctx'> 	smp_rmb();</div><div class='ctx'> 	return __mnt_is_readonly(mnt);</div><div class='ctx'> }</div><div class='hunk'>@@ -321,16 +425,16 @@ static int mnt_is_readonly(struct vfsmount *mnt)</div><div class='ctx'>  * can determine when writes are able to occur to a filesystem.</div><div class='ctx'>  */</div><div class='ctx'> /**</div><div class='del'>- * __mnt_want_write - get write access to a mount without freeze protection</div><div class='add'>+ * mnt_get_write_access - get write access to a mount without freeze protection</div><div class='ctx'>  * @m: the mount on which to take a write</div><div class='ctx'>  *</div><div class='ctx'>  * This tells the low-level filesystem that a write is about to be performed to</div><div class='ctx'>  * it, and makes sure that writes are allowed (mnt it read-write) before</div><div class='ctx'>  * returning success. This operation does not protect against filesystem being</div><div class='del'>- * frozen. When the write operation is finished, __mnt_drop_write() must be</div><div class='add'>+ * frozen. When the write operation is finished, mnt_put_write_access() must be</div><div class='ctx'>  * called. This is effectively a refcount.</div><div class='ctx'>  */</div><div class='del'>-int __mnt_want_write(struct vfsmount *m)</div><div class='add'>+int mnt_get_write_access(struct vfsmount *m)</div><div class='ctx'> {</div><div class='ctx'> 	struct mount *mnt = real_mount(m);</div><div class='ctx'> 	int ret = 0;</div><div class='hunk'>@@ -339,16 +443,34 @@ int __mnt_want_write(struct vfsmount *m)</div><div class='ctx'> 	mnt_inc_writers(mnt);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The store to mnt_inc_writers must be visible before we pass</div><div class='del'>-	 * MNT_WRITE_HOLD loop below, so that the slowpath can see our</div><div class='del'>-	 * incremented count after it has set MNT_WRITE_HOLD.</div><div class='add'>+	 * WRITE_HOLD loop below, so that the slowpath can see our</div><div class='add'>+	 * incremented count after it has set WRITE_HOLD.</div><div class='ctx'> 	 */</div><div class='ctx'> 	smp_mb();</div><div class='del'>-	while (READ_ONCE(mnt-&gt;mnt.mnt_flags) &amp; MNT_WRITE_HOLD)</div><div class='del'>-		cpu_relax();</div><div class='add'>+	might_lock(&amp;mount_lock.lock);</div><div class='add'>+	while (__test_write_hold(READ_ONCE(mnt-&gt;mnt_pprev_for_sb))) {</div><div class='add'>+		if (!IS_ENABLED(CONFIG_PREEMPT_RT)) {</div><div class='add'>+			cpu_relax();</div><div class='add'>+		} else {</div><div class='add'>+			/*</div><div class='add'>+			 * This prevents priority inversion, if the task</div><div class='add'>+			 * setting WRITE_HOLD got preempted on a remote</div><div class='add'>+			 * CPU, and it prevents life lock if the task setting</div><div class='add'>+			 * WRITE_HOLD has a lower priority and is bound to</div><div class='add'>+			 * the same CPU as the task that is spinning here.</div><div class='add'>+			 */</div><div class='add'>+			preempt_enable();</div><div class='add'>+			read_seqlock_excl(&amp;mount_lock);</div><div class='add'>+			read_sequnlock_excl(&amp;mount_lock);</div><div class='add'>+			preempt_disable();</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> 	/*</div><div class='del'>-	 * After the slowpath clears MNT_WRITE_HOLD, mnt_is_readonly will</div><div class='del'>-	 * be set to match its requirements. So we must not load that until</div><div class='del'>-	 * MNT_WRITE_HOLD is cleared.</div><div class='add'>+	 * The barrier pairs with the barrier sb_start_ro_state_change() making</div><div class='add'>+	 * sure that if we see WRITE_HOLD cleared, we will also see</div><div class='add'>+	 * s_readonly_remount set (or even SB_RDONLY / MNT_READONLY flags) in</div><div class='add'>+	 * mnt_is_readonly() and bail in case we are racing with remount</div><div class='add'>+	 * read-only.</div><div class='ctx'> 	 */</div><div class='ctx'> 	smp_rmb();</div><div class='ctx'> 	if (mnt_is_readonly(m)) {</div><div class='hunk'>@@ -359,6 +481,7 @@ int __mnt_want_write(struct vfsmount *m)</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL_GPL(mnt_get_write_access);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * mnt_want_write - get write access to a mount</div><div class='hunk'>@@ -374,7 +497,7 @@ int mnt_want_write(struct vfsmount *m)</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	sb_start_write(m-&gt;mnt_sb);</div><div class='del'>-	ret = __mnt_want_write(m);</div><div class='add'>+	ret = mnt_get_write_access(m);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		sb_end_write(m-&gt;mnt_sb);</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -382,15 +505,15 @@ int mnt_want_write(struct vfsmount *m)</div><div class='ctx'> EXPORT_SYMBOL_GPL(mnt_want_write);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * __mnt_want_write_file - get write access to a file's mount</div><div class='add'>+ * mnt_get_write_access_file - get write access to a file's mount</div><div class='ctx'>  * @file: the file who's mount on which to take a write</div><div class='ctx'>  *</div><div class='del'>- * This is like __mnt_want_write, but if the file is already open for writing it</div><div class='add'>+ * This is like mnt_get_write_access, but if @file is already open for write it</div><div class='ctx'>  * skips incrementing mnt_writers (since the open file already has a reference)</div><div class='ctx'>  * and instead only does the check for emergency r/o remounts.  This must be</div><div class='del'>- * paired with __mnt_drop_write_file.</div><div class='add'>+ * paired with mnt_put_write_access_file.</div><div class='ctx'>  */</div><div class='del'>-int __mnt_want_write_file(struct file *file)</div><div class='add'>+int mnt_get_write_access_file(struct file *file)</div><div class='ctx'> {</div><div class='ctx'> 	if (file-&gt;f_mode &amp; FMODE_WRITER) {</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -401,7 +524,7 @@ int __mnt_want_write_file(struct file *file)</div><div class='ctx'> 			return -EROFS;</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='del'>-	return __mnt_want_write(file-&gt;f_path.mnt);</div><div class='add'>+	return mnt_get_write_access(file-&gt;f_path.mnt);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -418,7 +541,7 @@ int mnt_want_write_file(struct file *file)</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	sb_start_write(file_inode(file)-&gt;i_sb);</div><div class='del'>-	ret = __mnt_want_write_file(file);</div><div class='add'>+	ret = mnt_get_write_access_file(file);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		sb_end_write(file_inode(file)-&gt;i_sb);</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -426,19 +549,20 @@ int mnt_want_write_file(struct file *file)</div><div class='ctx'> EXPORT_SYMBOL_GPL(mnt_want_write_file);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * __mnt_drop_write - give up write access to a mount</div><div class='add'>+ * mnt_put_write_access - give up write access to a mount</div><div class='ctx'>  * @mnt: the mount on which to give up write access</div><div class='ctx'>  *</div><div class='ctx'>  * Tells the low-level filesystem that we are done</div><div class='ctx'>  * performing writes to it.  Must be matched with</div><div class='del'>- * __mnt_want_write() call above.</div><div class='add'>+ * mnt_get_write_access() call above.</div><div class='ctx'>  */</div><div class='del'>-void __mnt_drop_write(struct vfsmount *mnt)</div><div class='add'>+void mnt_put_write_access(struct vfsmount *mnt)</div><div class='ctx'> {</div><div class='ctx'> 	preempt_disable();</div><div class='ctx'> 	mnt_dec_writers(real_mount(mnt));</div><div class='ctx'> 	preempt_enable();</div><div class='ctx'> }</div><div class='add'>+EXPORT_SYMBOL_GPL(mnt_put_write_access);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * mnt_drop_write - give up write access to a mount</div><div class='hunk'>@@ -450,29 +574,47 @@ void __mnt_drop_write(struct vfsmount *mnt)</div><div class='ctx'>  */</div><div class='ctx'> void mnt_drop_write(struct vfsmount *mnt)</div><div class='ctx'> {</div><div class='del'>-	__mnt_drop_write(mnt);</div><div class='add'>+	mnt_put_write_access(mnt);</div><div class='ctx'> 	sb_end_write(mnt-&gt;mnt_sb);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(mnt_drop_write);</div><div class='ctx'> </div><div class='del'>-void __mnt_drop_write_file(struct file *file)</div><div class='add'>+void mnt_put_write_access_file(struct file *file)</div><div class='ctx'> {</div><div class='ctx'> 	if (!(file-&gt;f_mode &amp; FMODE_WRITER))</div><div class='del'>-		__mnt_drop_write(file-&gt;f_path.mnt);</div><div class='add'>+		mnt_put_write_access(file-&gt;f_path.mnt);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void mnt_drop_write_file(struct file *file)</div><div class='ctx'> {</div><div class='del'>-	__mnt_drop_write_file(file);</div><div class='add'>+	mnt_put_write_access_file(file);</div><div class='ctx'> 	sb_end_write(file_inode(file)-&gt;i_sb);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(mnt_drop_write_file);</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * mnt_hold_writers - prevent write access to the given mount</div><div class='add'>+ * @mnt: mnt to prevent write access to</div><div class='add'>+ *</div><div class='add'>+ * Prevents write access to @mnt if there are no active writers for @mnt.</div><div class='add'>+ * This function needs to be called and return successfully before changing</div><div class='add'>+ * properties of @mnt that need to remain stable for callers with write access</div><div class='add'>+ * to @mnt.</div><div class='add'>+ *</div><div class='add'>+ * After this functions has been called successfully callers must pair it with</div><div class='add'>+ * a call to mnt_unhold_writers() in order to stop preventing write access to</div><div class='add'>+ * @mnt.</div><div class='add'>+ *</div><div class='add'>+ * Context: This function expects to be in mount_locked_reader scope serializing</div><div class='add'>+ *          setting WRITE_HOLD.</div><div class='add'>+ * Return: On success 0 is returned.</div><div class='add'>+ *	   On error, -EBUSY is returned.</div><div class='add'>+ */</div><div class='ctx'> static inline int mnt_hold_writers(struct mount *mnt)</div><div class='ctx'> {</div><div class='del'>-	mnt-&gt;mnt.mnt_flags |= MNT_WRITE_HOLD;</div><div class='add'>+	set_write_hold(mnt);</div><div class='ctx'> 	/*</div><div class='del'>-	 * After storing MNT_WRITE_HOLD, we'll read the counters. This store</div><div class='add'>+	 * After storing WRITE_HOLD, we'll read the counters. This store</div><div class='ctx'> 	 * should be visible before we do.</div><div class='ctx'> 	 */</div><div class='ctx'> 	smp_mb();</div><div class='hunk'>@@ -488,9 +630,9 @@ static inline int mnt_hold_writers(struct mount *mnt)</div><div class='ctx'> 	 * sum up each counter, if we read a counter before it is incremented,</div><div class='ctx'> 	 * but then read another CPU's count which it has been subsequently</div><div class='ctx'> 	 * decremented from -- we would see more decrements than we should.</div><div class='del'>-	 * MNT_WRITE_HOLD protects against this scenario, because</div><div class='add'>+	 * WRITE_HOLD protects against this scenario, because</div><div class='ctx'> 	 * mnt_want_write first increments count, then smp_mb, then spins on</div><div class='del'>-	 * MNT_WRITE_HOLD, so it can't be decremented by another CPU while</div><div class='add'>+	 * WRITE_HOLD, so it can't be decremented by another CPU while</div><div class='ctx'> 	 * we're counting up here.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (mnt_get_writers(mnt) &gt; 0)</div><div class='hunk'>@@ -499,14 +641,49 @@ static inline int mnt_hold_writers(struct mount *mnt)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * mnt_unhold_writers - stop preventing write access to the given mount</div><div class='add'>+ * @mnt: mnt to stop preventing write access to</div><div class='add'>+ *</div><div class='add'>+ * Stop preventing write access to @mnt allowing callers to gain write access</div><div class='add'>+ * to @mnt again.</div><div class='add'>+ *</div><div class='add'>+ * This function can only be called after a call to mnt_hold_writers().</div><div class='add'>+ *</div><div class='add'>+ * Context: This function expects to be in the same mount_locked_reader scope</div><div class='add'>+ * as the matching mnt_hold_writers().</div><div class='add'>+ */</div><div class='ctx'> static inline void mnt_unhold_writers(struct mount *mnt)</div><div class='ctx'> {</div><div class='add'>+	if (!test_write_hold(mnt))</div><div class='add'>+		return;</div><div class='ctx'> 	/*</div><div class='del'>-	 * MNT_READONLY must become visible before ~MNT_WRITE_HOLD, so writers</div><div class='add'>+	 * MNT_READONLY must become visible before ~WRITE_HOLD, so writers</div><div class='ctx'> 	 * that become unheld will see MNT_READONLY.</div><div class='ctx'> 	 */</div><div class='ctx'> 	smp_wmb();</div><div class='del'>-	mnt-&gt;mnt.mnt_flags &amp;= ~MNT_WRITE_HOLD;</div><div class='add'>+	clear_write_hold(mnt);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void mnt_del_instance(struct mount *m)</div><div class='add'>+{</div><div class='add'>+	struct mount **p = m-&gt;mnt_pprev_for_sb;</div><div class='add'>+	struct mount *next = m-&gt;mnt_next_for_sb;</div><div class='add'>+</div><div class='add'>+	if (next)</div><div class='add'>+		next-&gt;mnt_pprev_for_sb = p;</div><div class='add'>+	*p = next;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void mnt_add_instance(struct mount *m, struct super_block *s)</div><div class='add'>+{</div><div class='add'>+	struct mount *first = s-&gt;s_mounts;</div><div class='add'>+</div><div class='add'>+	if (first)</div><div class='add'>+		first-&gt;mnt_pprev_for_sb = &amp;m-&gt;mnt_next_for_sb;</div><div class='add'>+	m-&gt;mnt_next_for_sb = first;</div><div class='add'>+	m-&gt;mnt_pprev_for_sb = &amp;s-&gt;s_mounts;</div><div class='add'>+	s-&gt;s_mounts = m;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int mnt_make_readonly(struct mount *mnt)</div><div class='hunk'>@@ -522,47 +699,37 @@ static int mnt_make_readonly(struct mount *mnt)</div><div class='ctx'> </div><div class='ctx'> int sb_prepare_remount_readonly(struct super_block *sb)</div><div class='ctx'> {</div><div class='del'>-	struct mount *mnt;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='del'>-	/* Racy optimization.  Recheck the counter under MNT_WRITE_HOLD */</div><div class='add'>+	/* Racy optimization.  Recheck the counter under WRITE_HOLD */</div><div class='ctx'> 	if (atomic_long_read(&amp;sb-&gt;s_remove_count))</div><div class='ctx'> 		return -EBUSY;</div><div class='ctx'> </div><div class='del'>-	lock_mount_hash();</div><div class='del'>-	list_for_each_entry(mnt, &amp;sb-&gt;s_mounts, mnt_instance) {</div><div class='del'>-		if (!(mnt-&gt;mnt.mnt_flags &amp; MNT_READONLY)) {</div><div class='del'>-			mnt-&gt;mnt.mnt_flags |= MNT_WRITE_HOLD;</div><div class='del'>-			smp_mb();</div><div class='del'>-			if (mnt_get_writers(mnt) &gt; 0) {</div><div class='del'>-				err = -EBUSY;</div><div class='add'>+	guard(mount_locked_reader)();</div><div class='add'>+</div><div class='add'>+	for (struct mount *m = sb-&gt;s_mounts; m; m = m-&gt;mnt_next_for_sb) {</div><div class='add'>+		if (!(m-&gt;mnt.mnt_flags &amp; MNT_READONLY)) {</div><div class='add'>+			err = mnt_hold_writers(m);</div><div class='add'>+			if (err)</div><div class='ctx'> 				break;</div><div class='del'>-			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!err &amp;&amp; atomic_long_read(&amp;sb-&gt;s_remove_count))</div><div class='ctx'> 		err = -EBUSY;</div><div class='ctx'> </div><div class='del'>-	if (!err) {</div><div class='del'>-		sb-&gt;s_readonly_remount = 1;</div><div class='del'>-		smp_wmb();</div><div class='del'>-	}</div><div class='del'>-	list_for_each_entry(mnt, &amp;sb-&gt;s_mounts, mnt_instance) {</div><div class='del'>-		if (mnt-&gt;mnt.mnt_flags &amp; MNT_WRITE_HOLD)</div><div class='del'>-			mnt-&gt;mnt.mnt_flags &amp;= ~MNT_WRITE_HOLD;</div><div class='add'>+	if (!err)</div><div class='add'>+		sb_start_ro_state_change(sb);</div><div class='add'>+	for (struct mount *m = sb-&gt;s_mounts; m; m = m-&gt;mnt_next_for_sb) {</div><div class='add'>+		if (test_write_hold(m))</div><div class='add'>+			clear_write_hold(m);</div><div class='ctx'> 	}</div><div class='del'>-	unlock_mount_hash();</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void free_vfsmnt(struct mount *mnt)</div><div class='ctx'> {</div><div class='del'>-	struct user_namespace *mnt_userns;</div><div class='del'>-</div><div class='del'>-	mnt_userns = mnt_user_ns(&amp;mnt-&gt;mnt);</div><div class='del'>-	if (mnt_userns != &amp;init_user_ns)</div><div class='del'>-		put_user_ns(mnt_userns);</div><div class='add'>+	mnt_idmap_put(mnt_idmap(&amp;mnt-&gt;mnt));</div><div class='ctx'> 	kfree_const(mnt-&gt;mnt_devname);</div><div class='ctx'> #ifdef CONFIG_SMP</div><div class='ctx'> 	free_percpu(mnt-&gt;mnt_pcp);</div><div class='hunk'>@@ -585,15 +752,11 @@ int __legitimize_mnt(struct vfsmount *bastard, unsigned seq)</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	mnt = real_mount(bastard);</div><div class='ctx'> 	mnt_add_count(mnt, 1);</div><div class='del'>-	smp_mb();			// see mntput_no_expire()</div><div class='add'>+	smp_mb();		// see mntput_no_expire() and do_umount()</div><div class='ctx'> 	if (likely(!read_seqretry(&amp;mount_lock, seq)))</div><div class='ctx'> 		return 0;</div><div class='del'>-	if (bastard-&gt;mnt_flags &amp; MNT_SYNC_UMOUNT) {</div><div class='del'>-		mnt_add_count(mnt, -1);</div><div class='del'>-		return 1;</div><div class='del'>-	}</div><div class='ctx'> 	lock_mount_hash();</div><div class='del'>-	if (unlikely(bastard-&gt;mnt_flags &amp; MNT_DOOMED)) {</div><div class='add'>+	if (unlikely(bastard-&gt;mnt_flags &amp; (MNT_SYNC_UMOUNT | MNT_DOOMED))) {</div><div class='ctx'> 		mnt_add_count(mnt, -1);</div><div class='ctx'> 		unlock_mount_hash();</div><div class='ctx'> 		return 1;</div><div class='hunk'>@@ -604,7 +767,7 @@ int __legitimize_mnt(struct vfsmount *bastard, unsigned seq)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* call under rcu_read_lock */</div><div class='del'>-bool legitimize_mnt(struct vfsmount *bastard, unsigned seq)</div><div class='add'>+static bool legitimize_mnt(struct vfsmount *bastard, unsigned seq)</div><div class='ctx'> {</div><div class='ctx'> 	int res = __legitimize_mnt(bastard, seq);</div><div class='ctx'> 	if (likely(!res))</div><div class='hunk'>@@ -617,9 +780,17 @@ bool legitimize_mnt(struct vfsmount *bastard, unsigned seq)</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * find the first mount at @dentry on vfsmount @mnt.</div><div class='del'>- * call under rcu_read_lock()</div><div class='add'>+/**</div><div class='add'>+ * __lookup_mnt - mount hash lookup</div><div class='add'>+ * @mnt:	parent mount</div><div class='add'>+ * @dentry:	dentry of mountpoint</div><div class='add'>+ *</div><div class='add'>+ * If @mnt has a child mount @c mounted on @dentry find and return it.</div><div class='add'>+ * Caller must either hold the spinlock component of @mount_lock or</div><div class='add'>+ * hold rcu_read_lock(), sample the seqcount component before the call</div><div class='add'>+ * and recheck it afterwards.</div><div class='add'>+ *</div><div class='add'>+ * Return: The child of @mnt mounted on @dentry or %NULL.</div><div class='ctx'>  */</div><div class='ctx'> struct mount *__lookup_mnt(struct vfsmount *mnt, struct dentry *dentry)</div><div class='ctx'> {</div><div class='hunk'>@@ -632,21 +803,12 @@ struct mount *__lookup_mnt(struct vfsmount *mnt, struct dentry *dentry)</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * lookup_mnt - Return the first child mount mounted at path</div><div class='del'>- *</div><div class='del'>- * "First" means first mounted chronologically.  If you create the</div><div class='del'>- * following mounts:</div><div class='del'>- *</div><div class='del'>- * mount /dev/sda1 /mnt</div><div class='del'>- * mount /dev/sda2 /mnt</div><div class='del'>- * mount /dev/sda3 /mnt</div><div class='del'>- *</div><div class='del'>- * Then lookup_mnt() on the base /mnt dentry in the root mount will</div><div class='del'>- * return successively the root dentry and vfsmount of /dev/sda1, then</div><div class='del'>- * /dev/sda2, then /dev/sda3, then NULL.</div><div class='add'>+/**</div><div class='add'>+ * lookup_mnt - Return the child mount mounted at given location</div><div class='add'>+ * @path:	location in the namespace</div><div class='ctx'>  *</div><div class='del'>- * lookup_mnt takes a reference to the found vfsmount.</div><div class='add'>+ * Acquires and returns a new reference to mount at given location</div><div class='add'>+ * or %NULL if nothing is mounted there.</div><div class='ctx'>  */</div><div class='ctx'> struct vfsmount *lookup_mnt(const struct path *path)</div><div class='ctx'> {</div><div class='hunk'>@@ -664,21 +826,6 @@ struct vfsmount *lookup_mnt(const struct path *path)</div><div class='ctx'> 	return m;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void lock_ns_list(struct mnt_namespace *ns)</div><div class='del'>-{</div><div class='del'>-	spin_lock(&amp;ns-&gt;ns_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline void unlock_ns_list(struct mnt_namespace *ns)</div><div class='del'>-{</div><div class='del'>-	spin_unlock(&amp;ns-&gt;ns_lock);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline bool mnt_is_cursor(struct mount *mnt)</div><div class='del'>-{</div><div class='del'>-	return mnt-&gt;mnt.mnt_flags &amp; MNT_CURSOR;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * __is_local_mountpoint - Test to see if dentry is a mountpoint in the</div><div class='ctx'>  *                         current mount namespace.</div><div class='hunk'>@@ -694,63 +841,63 @@ static inline bool mnt_is_cursor(struct mount *mnt)</div><div class='ctx'>  * namespace not just a mount that happens to have some specified</div><div class='ctx'>  * parent mount.</div><div class='ctx'>  */</div><div class='del'>-bool __is_local_mountpoint(struct dentry *dentry)</div><div class='add'>+bool __is_local_mountpoint(const struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	struct mnt_namespace *ns = current-&gt;nsproxy-&gt;mnt_ns;</div><div class='del'>-	struct mount *mnt;</div><div class='del'>-	bool is_covered = false;</div><div class='add'>+	struct mount *mnt, *n;</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;namespace_sem);</div><div class='del'>-	lock_ns_list(ns);</div><div class='del'>-	list_for_each_entry(mnt, &amp;ns-&gt;list, mnt_list) {</div><div class='del'>-		if (mnt_is_cursor(mnt))</div><div class='del'>-			continue;</div><div class='del'>-		is_covered = (mnt-&gt;mnt_mountpoint == dentry);</div><div class='del'>-		if (is_covered)</div><div class='del'>-			break;</div><div class='del'>-	}</div><div class='del'>-	unlock_ns_list(ns);</div><div class='del'>-	up_read(&amp;namespace_sem);</div><div class='add'>+	guard(namespace_shared)();</div><div class='add'>+</div><div class='add'>+	rbtree_postorder_for_each_entry_safe(mnt, n, &amp;ns-&gt;mounts, mnt_node)</div><div class='add'>+		if (mnt-&gt;mnt_mountpoint == dentry)</div><div class='add'>+			return true;</div><div class='ctx'> </div><div class='del'>-	return is_covered;</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct mountpoint *lookup_mountpoint(struct dentry *dentry)</div><div class='add'>+struct pinned_mountpoint {</div><div class='add'>+	struct hlist_node node;</div><div class='add'>+	struct mountpoint *mp;</div><div class='add'>+	struct mount *parent;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static bool lookup_mountpoint(struct dentry *dentry, struct pinned_mountpoint *m)</div><div class='ctx'> {</div><div class='ctx'> 	struct hlist_head *chain = mp_hash(dentry);</div><div class='ctx'> 	struct mountpoint *mp;</div><div class='ctx'> </div><div class='ctx'> 	hlist_for_each_entry(mp, chain, m_hash) {</div><div class='ctx'> 		if (mp-&gt;m_dentry == dentry) {</div><div class='del'>-			mp-&gt;m_count++;</div><div class='del'>-			return mp;</div><div class='add'>+			hlist_add_head(&amp;m-&gt;node, &amp;mp-&gt;m_list);</div><div class='add'>+			m-&gt;mp = mp;</div><div class='add'>+			return true;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	return NULL;</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct mountpoint *get_mountpoint(struct dentry *dentry)</div><div class='add'>+static int get_mountpoint(struct dentry *dentry, struct pinned_mountpoint *m)</div><div class='ctx'> {</div><div class='del'>-	struct mountpoint *mp, *new = NULL;</div><div class='add'>+	struct mountpoint *mp __free(kfree) = NULL;</div><div class='add'>+	bool found;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (d_mountpoint(dentry)) {</div><div class='ctx'> 		/* might be worth a WARN_ON() */</div><div class='ctx'> 		if (d_unlinked(dentry))</div><div class='del'>-			return ERR_PTR(-ENOENT);</div><div class='add'>+			return -ENOENT;</div><div class='ctx'> mountpoint:</div><div class='ctx'> 		read_seqlock_excl(&amp;mount_lock);</div><div class='del'>-		mp = lookup_mountpoint(dentry);</div><div class='add'>+		found = lookup_mountpoint(dentry, m);</div><div class='ctx'> 		read_sequnlock_excl(&amp;mount_lock);</div><div class='del'>-		if (mp)</div><div class='del'>-			goto done;</div><div class='add'>+		if (found)</div><div class='add'>+			return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!new)</div><div class='del'>-		new = kmalloc(sizeof(struct mountpoint), GFP_KERNEL);</div><div class='del'>-	if (!new)</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='del'>-</div><div class='add'>+	if (!mp)</div><div class='add'>+		mp = kmalloc(sizeof(struct mountpoint), GFP_KERNEL);</div><div class='add'>+	if (!mp)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	/* Exactly one processes may set d_mounted */</div><div class='ctx'> 	ret = d_set_mounted(dentry);</div><div class='hunk'>@@ -760,34 +907,28 @@ mountpoint:</div><div class='ctx'> 		goto mountpoint;</div><div class='ctx'> </div><div class='ctx'> 	/* The dentry is not available as a mountpoint? */</div><div class='del'>-	mp = ERR_PTR(ret);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto done;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	/* Add the new mountpoint to the hash table */</div><div class='ctx'> 	read_seqlock_excl(&amp;mount_lock);</div><div class='del'>-	new-&gt;m_dentry = dget(dentry);</div><div class='del'>-	new-&gt;m_count = 1;</div><div class='del'>-	hlist_add_head(&amp;new-&gt;m_hash, mp_hash(dentry));</div><div class='del'>-	INIT_HLIST_HEAD(&amp;new-&gt;m_list);</div><div class='add'>+	mp-&gt;m_dentry = dget(dentry);</div><div class='add'>+	hlist_add_head(&amp;mp-&gt;m_hash, mp_hash(dentry));</div><div class='add'>+	INIT_HLIST_HEAD(&amp;mp-&gt;m_list);</div><div class='add'>+	hlist_add_head(&amp;m-&gt;node, &amp;mp-&gt;m_list);</div><div class='add'>+	m-&gt;mp = no_free_ptr(mp);</div><div class='ctx'> 	read_sequnlock_excl(&amp;mount_lock);</div><div class='del'>-</div><div class='del'>-	mp = new;</div><div class='del'>-	new = NULL;</div><div class='del'>-done:</div><div class='del'>-	kfree(new);</div><div class='del'>-	return mp;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * vfsmount lock must be held.  Additionally, the caller is responsible</div><div class='ctx'>  * for serializing calls for given disposal list.</div><div class='ctx'>  */</div><div class='del'>-static void __put_mountpoint(struct mountpoint *mp, struct list_head *list)</div><div class='add'>+static void maybe_free_mountpoint(struct mountpoint *mp, struct list_head *list)</div><div class='ctx'> {</div><div class='del'>-	if (!--mp-&gt;m_count) {</div><div class='add'>+	if (hlist_empty(&amp;mp-&gt;m_list)) {</div><div class='ctx'> 		struct dentry *dentry = mp-&gt;m_dentry;</div><div class='del'>-		BUG_ON(!hlist_empty(&amp;mp-&gt;m_list));</div><div class='ctx'> 		spin_lock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 		dentry-&gt;d_flags &amp;= ~DCACHE_MOUNTED;</div><div class='ctx'> 		spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='hunk'>@@ -797,17 +938,33 @@ static void __put_mountpoint(struct mountpoint *mp, struct list_head *list)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* called with namespace_lock and vfsmount lock */</div><div class='del'>-static void put_mountpoint(struct mountpoint *mp)</div><div class='add'>+/*</div><div class='add'>+ * locks: mount_lock [read_seqlock_excl], namespace_sem [excl]</div><div class='add'>+ */</div><div class='add'>+static void unpin_mountpoint(struct pinned_mountpoint *m)</div><div class='ctx'> {</div><div class='del'>-	__put_mountpoint(mp, &amp;ex_mountpoints);</div><div class='add'>+	if (m-&gt;mp) {</div><div class='add'>+		hlist_del(&amp;m-&gt;node);</div><div class='add'>+		maybe_free_mountpoint(m-&gt;mp, &amp;ex_mountpoints);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int check_mnt(struct mount *mnt)</div><div class='add'>+static inline int check_mnt(const struct mount *mnt)</div><div class='ctx'> {</div><div class='ctx'> 	return mnt-&gt;mnt_ns == current-&gt;nsproxy-&gt;mnt_ns;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline bool check_anonymous_mnt(struct mount *mnt)</div><div class='add'>+{</div><div class='add'>+	u64 seq;</div><div class='add'>+</div><div class='add'>+	if (!is_anon_ns(mnt-&gt;mnt_ns))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	seq = mnt-&gt;mnt_ns-&gt;seq_origin;</div><div class='add'>+	return !seq || (seq == current-&gt;nsproxy-&gt;mnt_ns-&gt;ns.ns_id);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * vfsmount lock must be held for write</div><div class='ctx'>  */</div><div class='hunk'>@@ -831,11 +988,14 @@ static void __touch_mnt_namespace(struct mnt_namespace *ns)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * vfsmount lock must be held for write</div><div class='add'>+ * locks: mount_lock[write_seqlock]</div><div class='ctx'>  */</div><div class='del'>-static struct mountpoint *unhash_mnt(struct mount *mnt)</div><div class='add'>+static void __umount_mnt(struct mount *mnt, struct list_head *shrink_list)</div><div class='ctx'> {</div><div class='ctx'> 	struct mountpoint *mp;</div><div class='add'>+	struct mount *parent = mnt-&gt;mnt_parent;</div><div class='add'>+	if (unlikely(parent-&gt;overmount == mnt))</div><div class='add'>+		parent-&gt;overmount = NULL;</div><div class='ctx'> 	mnt-&gt;mnt_parent = mnt;</div><div class='ctx'> 	mnt-&gt;mnt_mountpoint = mnt-&gt;mnt.mnt_root;</div><div class='ctx'> 	list_del_init(&amp;mnt-&gt;mnt_child);</div><div class='hunk'>@@ -843,15 +1003,15 @@ static struct mountpoint *unhash_mnt(struct mount *mnt)</div><div class='ctx'> 	hlist_del_init(&amp;mnt-&gt;mnt_mp_list);</div><div class='ctx'> 	mp = mnt-&gt;mnt_mp;</div><div class='ctx'> 	mnt-&gt;mnt_mp = NULL;</div><div class='del'>-	return mp;</div><div class='add'>+	maybe_free_mountpoint(mp, shrink_list);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * vfsmount lock must be held for write</div><div class='add'>+ * locks: mount_lock[write_seqlock], namespace_sem[excl] (for ex_mountpoints)</div><div class='ctx'>  */</div><div class='ctx'> static void umount_mnt(struct mount *mnt)</div><div class='ctx'> {</div><div class='del'>-	put_mountpoint(unhash_mnt(mnt));</div><div class='add'>+	__umount_mnt(mnt, &amp;ex_mountpoints);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -861,36 +1021,48 @@ void mnt_set_mountpoint(struct mount *mnt,</div><div class='ctx'> 			struct mountpoint *mp,</div><div class='ctx'> 			struct mount *child_mnt)</div><div class='ctx'> {</div><div class='del'>-	mp-&gt;m_count++;</div><div class='del'>-	mnt_add_count(mnt, 1);	/* essentially, that's mntget */</div><div class='ctx'> 	child_mnt-&gt;mnt_mountpoint = mp-&gt;m_dentry;</div><div class='ctx'> 	child_mnt-&gt;mnt_parent = mnt;</div><div class='ctx'> 	child_mnt-&gt;mnt_mp = mp;</div><div class='ctx'> 	hlist_add_head(&amp;child_mnt-&gt;mnt_mp_list, &amp;mp-&gt;m_list);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void __attach_mnt(struct mount *mnt, struct mount *parent)</div><div class='add'>+static void make_visible(struct mount *mnt)</div><div class='ctx'> {</div><div class='add'>+	struct mount *parent = mnt-&gt;mnt_parent;</div><div class='add'>+	if (unlikely(mnt-&gt;mnt_mountpoint == parent-&gt;mnt.mnt_root))</div><div class='add'>+		parent-&gt;overmount = mnt;</div><div class='ctx'> 	hlist_add_head_rcu(&amp;mnt-&gt;mnt_hash,</div><div class='ctx'> 			   m_hash(&amp;parent-&gt;mnt, mnt-&gt;mnt_mountpoint));</div><div class='ctx'> 	list_add_tail(&amp;mnt-&gt;mnt_child, &amp;parent-&gt;mnt_mounts);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * vfsmount lock must be held for write</div><div class='add'>+/**</div><div class='add'>+ * attach_mnt - mount a mount, attach to @mount_hashtable and parent's</div><div class='add'>+ *              list of child mounts</div><div class='add'>+ * @parent:  the parent</div><div class='add'>+ * @mnt:     the new mount</div><div class='add'>+ * @mp:      the new mountpoint</div><div class='add'>+ *</div><div class='add'>+ * Mount @mnt at @mp on @parent. Then attach @mnt</div><div class='add'>+ * to @parent's child mount list and to @mount_hashtable.</div><div class='add'>+ *</div><div class='add'>+ * Note, when make_visible() is called @mnt-&gt;mnt_parent already points</div><div class='add'>+ * to the correct parent.</div><div class='add'>+ *</div><div class='add'>+ * Context: This function expects namespace_lock() and lock_mount_hash()</div><div class='add'>+ *          to have been acquired in that order.</div><div class='ctx'>  */</div><div class='del'>-static void attach_mnt(struct mount *mnt,</div><div class='del'>-			struct mount *parent,</div><div class='del'>-			struct mountpoint *mp)</div><div class='add'>+static void attach_mnt(struct mount *mnt, struct mount *parent,</div><div class='add'>+		       struct mountpoint *mp)</div><div class='ctx'> {</div><div class='ctx'> 	mnt_set_mountpoint(parent, mp, mnt);</div><div class='del'>-	__attach_mnt(mnt, parent);</div><div class='add'>+	make_visible(mnt);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void mnt_change_mountpoint(struct mount *parent, struct mountpoint *mp, struct mount *mnt)</div><div class='ctx'> {</div><div class='ctx'> 	struct mountpoint *old_mp = mnt-&gt;mnt_mp;</div><div class='del'>-	struct mount *old_parent = mnt-&gt;mnt_parent;</div><div class='ctx'> </div><div class='ctx'> 	list_del_init(&amp;mnt-&gt;mnt_child);</div><div class='ctx'> 	hlist_del_init(&amp;mnt-&gt;mnt_mp_list);</div><div class='hunk'>@@ -898,33 +1070,41 @@ void mnt_change_mountpoint(struct mount *parent, struct mountpoint *mp, struct m</div><div class='ctx'> </div><div class='ctx'> 	attach_mnt(mnt, parent, mp);</div><div class='ctx'> </div><div class='del'>-	put_mountpoint(old_mp);</div><div class='del'>-	mnt_add_count(old_parent, -1);</div><div class='add'>+	maybe_free_mountpoint(old_mp, &amp;ex_mountpoints);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * vfsmount lock must be held for write</div><div class='del'>- */</div><div class='del'>-static void commit_tree(struct mount *mnt)</div><div class='add'>+static inline struct mount *node_to_mount(struct rb_node *node)</div><div class='ctx'> {</div><div class='del'>-	struct mount *parent = mnt-&gt;mnt_parent;</div><div class='del'>-	struct mount *m;</div><div class='del'>-	LIST_HEAD(head);</div><div class='del'>-	struct mnt_namespace *n = parent-&gt;mnt_ns;</div><div class='del'>-</div><div class='del'>-	BUG_ON(parent == mnt);</div><div class='add'>+	return node ? rb_entry(node, struct mount, mnt_node) : NULL;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	list_add_tail(&amp;head, &amp;mnt-&gt;mnt_list);</div><div class='del'>-	list_for_each_entry(m, &amp;head, mnt_list)</div><div class='del'>-		m-&gt;mnt_ns = n;</div><div class='add'>+static void mnt_add_to_ns(struct mnt_namespace *ns, struct mount *mnt)</div><div class='add'>+{</div><div class='add'>+	struct rb_node **link = &amp;ns-&gt;mounts.rb_node;</div><div class='add'>+	struct rb_node *parent = NULL;</div><div class='add'>+	bool mnt_first_node = true, mnt_last_node = true;</div><div class='ctx'> </div><div class='del'>-	list_splice(&amp;head, n-&gt;list.prev);</div><div class='add'>+	WARN_ON(mnt_ns_attached(mnt));</div><div class='add'>+	mnt-&gt;mnt_ns = ns;</div><div class='add'>+	while (*link) {</div><div class='add'>+		parent = *link;</div><div class='add'>+		if (mnt-&gt;mnt_id_unique &lt; node_to_mount(parent)-&gt;mnt_id_unique) {</div><div class='add'>+			link = &amp;parent-&gt;rb_left;</div><div class='add'>+			mnt_last_node = false;</div><div class='add'>+		} else {</div><div class='add'>+			link = &amp;parent-&gt;rb_right;</div><div class='add'>+			mnt_first_node = false;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	n-&gt;mounts += n-&gt;pending_mounts;</div><div class='del'>-	n-&gt;pending_mounts = 0;</div><div class='add'>+	if (mnt_last_node)</div><div class='add'>+		ns-&gt;mnt_last_node = &amp;mnt-&gt;mnt_node;</div><div class='add'>+	if (mnt_first_node)</div><div class='add'>+		ns-&gt;mnt_first_node = &amp;mnt-&gt;mnt_node;</div><div class='add'>+	rb_link_node(&amp;mnt-&gt;mnt_node, parent, link);</div><div class='add'>+	rb_insert_color(&amp;mnt-&gt;mnt_node, &amp;ns-&gt;mounts);</div><div class='ctx'> </div><div class='del'>-	__attach_mnt(mnt, parent);</div><div class='del'>-	touch_mnt_namespace(n);</div><div class='add'>+	mnt_notify_add(mnt);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct mount *next_mnt(struct mount *p, struct mount *root)</div><div class='hunk'>@@ -953,6 +1133,38 @@ static struct mount *skip_mnt_tree(struct mount *p)</div><div class='ctx'> 	return p;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * vfsmount lock must be held for write</div><div class='add'>+ */</div><div class='add'>+static void commit_tree(struct mount *mnt)</div><div class='add'>+{</div><div class='add'>+	struct mnt_namespace *n = mnt-&gt;mnt_parent-&gt;mnt_ns;</div><div class='add'>+</div><div class='add'>+	if (!mnt_ns_attached(mnt)) {</div><div class='add'>+		for (struct mount *m = mnt; m; m = next_mnt(m, mnt))</div><div class='add'>+			mnt_add_to_ns(n, m);</div><div class='add'>+		n-&gt;nr_mounts += n-&gt;pending_mounts;</div><div class='add'>+		n-&gt;pending_mounts = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	make_visible(mnt);</div><div class='add'>+	touch_mnt_namespace(n);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void setup_mnt(struct mount *m, struct dentry *root)</div><div class='add'>+{</div><div class='add'>+	struct super_block *s = root-&gt;d_sb;</div><div class='add'>+</div><div class='add'>+	atomic_inc(&amp;s-&gt;s_active);</div><div class='add'>+	m-&gt;mnt.mnt_sb = s;</div><div class='add'>+	m-&gt;mnt.mnt_root = dget(root);</div><div class='add'>+	m-&gt;mnt_mountpoint = m-&gt;mnt.mnt_root;</div><div class='add'>+	m-&gt;mnt_parent = m;</div><div class='add'>+</div><div class='add'>+	guard(mount_locked_reader)();</div><div class='add'>+	mnt_add_instance(m, s);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /**</div><div class='ctx'>  * vfs_create_mount - Create a mount for a configured superblock</div><div class='ctx'>  * @fc: The configuration context with the superblock attached</div><div class='hunk'>@@ -969,22 +1181,15 @@ struct vfsmount *vfs_create_mount(struct fs_context *fc)</div><div class='ctx'> 	if (!fc-&gt;root)</div><div class='ctx'> 		return ERR_PTR(-EINVAL);</div><div class='ctx'> </div><div class='del'>-	mnt = alloc_vfsmnt(fc-&gt;source ?: "none");</div><div class='add'>+	mnt = alloc_vfsmnt(fc-&gt;source);</div><div class='ctx'> 	if (!mnt)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='ctx'> 	if (fc-&gt;sb_flags &amp; SB_KERNMOUNT)</div><div class='ctx'> 		mnt-&gt;mnt.mnt_flags = MNT_INTERNAL;</div><div class='ctx'> </div><div class='del'>-	atomic_inc(&amp;fc-&gt;root-&gt;d_sb-&gt;s_active);</div><div class='del'>-	mnt-&gt;mnt.mnt_sb		= fc-&gt;root-&gt;d_sb;</div><div class='del'>-	mnt-&gt;mnt.mnt_root	= dget(fc-&gt;root);</div><div class='del'>-	mnt-&gt;mnt_mountpoint	= mnt-&gt;mnt.mnt_root;</div><div class='del'>-	mnt-&gt;mnt_parent		= mnt;</div><div class='add'>+	setup_mnt(mnt, fc-&gt;root);</div><div class='ctx'> </div><div class='del'>-	lock_mount_hash();</div><div class='del'>-	list_add_tail(&amp;mnt-&gt;mnt_instance, &amp;mnt-&gt;mnt.mnt_sb-&gt;s_mounts);</div><div class='del'>-	unlock_mount_hash();</div><div class='ctx'> 	return &amp;mnt-&gt;mnt;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(vfs_create_mount);</div><div class='hunk'>@@ -1000,6 +1205,15 @@ struct vfsmount *fc_mount(struct fs_context *fc)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(fc_mount);</div><div class='ctx'> </div><div class='add'>+struct vfsmount *fc_mount_longterm(struct fs_context *fc)</div><div class='add'>+{</div><div class='add'>+	struct vfsmount *mnt = fc_mount(fc);</div><div class='add'>+	if (!IS_ERR(mnt))</div><div class='add'>+		real_mount(mnt)-&gt;mnt_ns = MNT_NS_INTERNAL;</div><div class='add'>+	return mnt;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(fc_mount_longterm);</div><div class='add'>+</div><div class='ctx'> struct vfsmount *vfs_kern_mount(struct file_system_type *type,</div><div class='ctx'> 				int flags, const char *name,</div><div class='ctx'> 				void *data)</div><div class='hunk'>@@ -1016,8 +1230,7 @@ struct vfsmount *vfs_kern_mount(struct file_system_type *type,</div><div class='ctx'> 		return ERR_CAST(fc);</div><div class='ctx'> </div><div class='ctx'> 	if (name)</div><div class='del'>-		ret = vfs_parse_fs_string(fc, "source",</div><div class='del'>-					  name, strlen(name));</div><div class='add'>+		ret = vfs_parse_fs_string(fc, "source", name);</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		ret = parse_monolithic_mount_data(fc, data);</div><div class='ctx'> 	if (!ret)</div><div class='hunk'>@@ -1030,25 +1243,9 @@ struct vfsmount *vfs_kern_mount(struct file_system_type *type,</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(vfs_kern_mount);</div><div class='ctx'> </div><div class='del'>-struct vfsmount *</div><div class='del'>-vfs_submount(const struct dentry *mountpoint, struct file_system_type *type,</div><div class='del'>-	     const char *name, void *data)</div><div class='del'>-{</div><div class='del'>-	/* Until it is worked out how to pass the user namespace</div><div class='del'>-	 * through from the parent mount to the submount don't support</div><div class='del'>-	 * unprivileged mounts with submounts.</div><div class='del'>-	 */</div><div class='del'>-	if (mountpoint-&gt;d_sb-&gt;s_user_ns != &amp;init_user_ns)</div><div class='del'>-		return ERR_PTR(-EPERM);</div><div class='del'>-</div><div class='del'>-	return vfs_kern_mount(type, SB_SUBMOUNT, name, data);</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL_GPL(vfs_submount);</div><div class='del'>-</div><div class='ctx'> static struct mount *clone_mnt(struct mount *old, struct dentry *root,</div><div class='ctx'> 					int flag)</div><div class='ctx'> {</div><div class='del'>-	struct super_block *sb = old-&gt;mnt.mnt_sb;</div><div class='ctx'> 	struct mount *mnt;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='hunk'>@@ -1056,7 +1253,10 @@ static struct mount *clone_mnt(struct mount *old, struct dentry *root,</div><div class='ctx'> 	if (!mnt)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='del'>-	if (flag &amp; (CL_SLAVE | CL_PRIVATE | CL_SHARED_TO_SLAVE))</div><div class='add'>+	mnt-&gt;mnt.mnt_flags = READ_ONCE(old-&gt;mnt.mnt_flags) &amp;</div><div class='add'>+			     ~MNT_INTERNAL_FLAGS;</div><div class='add'>+</div><div class='add'>+	if (flag &amp; (CL_SLAVE | CL_PRIVATE))</div><div class='ctx'> 		mnt-&gt;mnt_group_id = 0; /* not a peer of original */</div><div class='ctx'> 	else</div><div class='ctx'> 		mnt-&gt;mnt_group_id = old-&gt;mnt_group_id;</div><div class='hunk'>@@ -1067,45 +1267,26 @@ static struct mount *clone_mnt(struct mount *old, struct dentry *root,</div><div class='ctx'> 			goto out_free;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	mnt-&gt;mnt.mnt_flags = old-&gt;mnt.mnt_flags;</div><div class='del'>-	mnt-&gt;mnt.mnt_flags &amp;= ~(MNT_WRITE_HOLD|MNT_MARKED|MNT_INTERNAL);</div><div class='add'>+	if (mnt-&gt;mnt_group_id)</div><div class='add'>+		set_mnt_shared(mnt);</div><div class='ctx'> </div><div class='del'>-	atomic_inc(&amp;sb-&gt;s_active);</div><div class='del'>-	mnt-&gt;mnt.mnt_userns = mnt_user_ns(&amp;old-&gt;mnt);</div><div class='del'>-	if (mnt-&gt;mnt.mnt_userns != &amp;init_user_ns)</div><div class='del'>-		mnt-&gt;mnt.mnt_userns = get_user_ns(mnt-&gt;mnt.mnt_userns);</div><div class='del'>-	mnt-&gt;mnt.mnt_sb = sb;</div><div class='del'>-	mnt-&gt;mnt.mnt_root = dget(root);</div><div class='del'>-	mnt-&gt;mnt_mountpoint = mnt-&gt;mnt.mnt_root;</div><div class='del'>-	mnt-&gt;mnt_parent = mnt;</div><div class='del'>-	lock_mount_hash();</div><div class='del'>-	list_add_tail(&amp;mnt-&gt;mnt_instance, &amp;sb-&gt;s_mounts);</div><div class='del'>-	unlock_mount_hash();</div><div class='add'>+	mnt-&gt;mnt.mnt_idmap = mnt_idmap_get(mnt_idmap(&amp;old-&gt;mnt));</div><div class='ctx'> </div><div class='del'>-	if ((flag &amp; CL_SLAVE) ||</div><div class='del'>-	    ((flag &amp; CL_SHARED_TO_SLAVE) &amp;&amp; IS_MNT_SHARED(old))) {</div><div class='del'>-		list_add(&amp;mnt-&gt;mnt_slave, &amp;old-&gt;mnt_slave_list);</div><div class='add'>+	setup_mnt(mnt, root);</div><div class='add'>+</div><div class='add'>+	if (flag &amp; CL_PRIVATE)	// we are done with it</div><div class='add'>+		return mnt;</div><div class='add'>+</div><div class='add'>+	if (peers(mnt, old))</div><div class='add'>+		list_add(&amp;mnt-&gt;mnt_share, &amp;old-&gt;mnt_share);</div><div class='add'>+</div><div class='add'>+	if ((flag &amp; CL_SLAVE) &amp;&amp; old-&gt;mnt_group_id) {</div><div class='add'>+		hlist_add_head(&amp;mnt-&gt;mnt_slave, &amp;old-&gt;mnt_slave_list);</div><div class='ctx'> 		mnt-&gt;mnt_master = old;</div><div class='del'>-		CLEAR_MNT_SHARED(mnt);</div><div class='del'>-	} else if (!(flag &amp; CL_PRIVATE)) {</div><div class='del'>-		if ((flag &amp; CL_MAKE_SHARED) || IS_MNT_SHARED(old))</div><div class='del'>-			list_add(&amp;mnt-&gt;mnt_share, &amp;old-&gt;mnt_share);</div><div class='del'>-		if (IS_MNT_SLAVE(old))</div><div class='del'>-			list_add(&amp;mnt-&gt;mnt_slave, &amp;old-&gt;mnt_slave);</div><div class='add'>+	} else if (IS_MNT_SLAVE(old)) {</div><div class='add'>+		hlist_add_behind(&amp;mnt-&gt;mnt_slave, &amp;old-&gt;mnt_slave);</div><div class='ctx'> 		mnt-&gt;mnt_master = old-&gt;mnt_master;</div><div class='del'>-	} else {</div><div class='del'>-		CLEAR_MNT_SHARED(mnt);</div><div class='del'>-	}</div><div class='del'>-	if (flag &amp; CL_MAKE_SHARED)</div><div class='del'>-		set_mnt_shared(mnt);</div><div class='del'>-</div><div class='del'>-	/* stick the duplicate mount on the same expiry list</div><div class='del'>-	 * as the original if that was on one */</div><div class='del'>-	if (flag &amp; CL_EXPIRE) {</div><div class='del'>-		if (!list_empty(&amp;old-&gt;mnt_expire))</div><div class='del'>-			list_add(&amp;mnt-&gt;mnt_expire, &amp;old-&gt;mnt_expire);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='ctx'> 	return mnt;</div><div class='ctx'> </div><div class='ctx'>  out_free:</div><div class='hunk'>@@ -1155,26 +1336,12 @@ static void delayed_mntput(struct work_struct *unused)</div><div class='ctx'> }</div><div class='ctx'> static DECLARE_DELAYED_WORK(delayed_mntput_work, delayed_mntput);</div><div class='ctx'> </div><div class='del'>-static void mntput_no_expire(struct mount *mnt)</div><div class='add'>+static void noinline mntput_no_expire_slowpath(struct mount *mnt)</div><div class='ctx'> {</div><div class='ctx'> 	LIST_HEAD(list);</div><div class='ctx'> 	int count;</div><div class='ctx'> </div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	if (likely(READ_ONCE(mnt-&gt;mnt_ns))) {</div><div class='del'>-		/*</div><div class='del'>-		 * Since we don't do lock_mount_hash() here,</div><div class='del'>-		 * -&gt;mnt_ns can change under us.  However, if it's</div><div class='del'>-		 * non-NULL, then there's a reference that won't</div><div class='del'>-		 * be dropped until after an RCU delay done after</div><div class='del'>-		 * turning -&gt;mnt_ns NULL.  So if we observe it</div><div class='del'>-		 * non-NULL under rcu_read_lock(), the reference</div><div class='del'>-		 * we are dropping is not the final one.</div><div class='del'>-		 */</div><div class='del'>-		mnt_add_count(mnt, -1);</div><div class='del'>-		rcu_read_unlock();</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='add'>+	VFS_BUG_ON(mnt-&gt;mnt_ns);</div><div class='ctx'> 	lock_mount_hash();</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * make sure that if __legitimize_mnt() has not seen us grab</div><div class='hunk'>@@ -1197,12 +1364,14 @@ static void mntput_no_expire(struct mount *mnt)</div><div class='ctx'> 	mnt-&gt;mnt.mnt_flags |= MNT_DOOMED;</div><div class='ctx'> 	rcu_read_unlock();</div><div class='ctx'> </div><div class='del'>-	list_del(&amp;mnt-&gt;mnt_instance);</div><div class='add'>+	mnt_del_instance(mnt);</div><div class='add'>+	if (unlikely(!list_empty(&amp;mnt-&gt;mnt_expire)))</div><div class='add'>+		list_del(&amp;mnt-&gt;mnt_expire);</div><div class='ctx'> </div><div class='ctx'> 	if (unlikely(!list_empty(&amp;mnt-&gt;mnt_mounts))) {</div><div class='ctx'> 		struct mount *p, *tmp;</div><div class='ctx'> 		list_for_each_entry_safe(p, tmp, &amp;mnt-&gt;mnt_mounts,  mnt_child) {</div><div class='del'>-			__put_mountpoint(unhash_mnt(p), &amp;list);</div><div class='add'>+			__umount_mnt(p, &amp;list);</div><div class='ctx'> 			hlist_add_head(&amp;p-&gt;mnt_umount, &amp;mnt-&gt;mnt_stuck_children);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1223,13 +1392,33 @@ static void mntput_no_expire(struct mount *mnt)</div><div class='ctx'> 	cleanup_mnt(mnt);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void mntput_no_expire(struct mount *mnt)</div><div class='add'>+{</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	if (likely(READ_ONCE(mnt-&gt;mnt_ns))) {</div><div class='add'>+		/*</div><div class='add'>+		 * Since we don't do lock_mount_hash() here,</div><div class='add'>+		 * -&gt;mnt_ns can change under us.  However, if it's</div><div class='add'>+		 * non-NULL, then there's a reference that won't</div><div class='add'>+		 * be dropped until after an RCU delay done after</div><div class='add'>+		 * turning -&gt;mnt_ns NULL.  So if we observe it</div><div class='add'>+		 * non-NULL under rcu_read_lock(), the reference</div><div class='add'>+		 * we are dropping is not the final one.</div><div class='add'>+		 */</div><div class='add'>+		mnt_add_count(mnt, -1);</div><div class='add'>+		rcu_read_unlock();</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+	mntput_no_expire_slowpath(mnt);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> void mntput(struct vfsmount *mnt)</div><div class='ctx'> {</div><div class='ctx'> 	if (mnt) {</div><div class='ctx'> 		struct mount *m = real_mount(mnt);</div><div class='del'>-		/* avoid cacheline pingpong, hope gcc doesn't get "smart" */</div><div class='add'>+		/* avoid cacheline pingpong */</div><div class='ctx'> 		if (unlikely(m-&gt;mnt_expiry_mark))</div><div class='del'>-			m-&gt;mnt_expiry_mark = 0;</div><div class='add'>+			WRITE_ONCE(m-&gt;mnt_expiry_mark, 0);</div><div class='ctx'> 		mntput_no_expire(m);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -1243,6 +1432,17 @@ struct vfsmount *mntget(struct vfsmount *mnt)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(mntget);</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Make a mount point inaccessible to new lookups.</div><div class='add'>+ * Because there may still be current users, the caller MUST WAIT</div><div class='add'>+ * for an RCU grace period before destroying the mount point.</div><div class='add'>+ */</div><div class='add'>+void mnt_make_shortterm(struct vfsmount *mnt)</div><div class='add'>+{</div><div class='add'>+	if (mnt)</div><div class='add'>+		real_mount(mnt)-&gt;mnt_ns = NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /**</div><div class='ctx'>  * path_is_mountpoint() - Check if path is a mount in the current namespace.</div><div class='ctx'>  * @path: path to check</div><div class='hunk'>@@ -1283,65 +1483,81 @@ struct vfsmount *mnt_clone_internal(const struct path *path)</div><div class='ctx'> 	return &amp;p-&gt;mnt;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_PROC_FS</div><div class='del'>-static struct mount *mnt_list_next(struct mnt_namespace *ns,</div><div class='del'>-				   struct list_head *p)</div><div class='add'>+/*</div><div class='add'>+ * Returns the mount which either has the specified mnt_id, or has the next</div><div class='add'>+ * smallest id afer the specified one.</div><div class='add'>+ */</div><div class='add'>+static struct mount *mnt_find_id_at(struct mnt_namespace *ns, u64 mnt_id)</div><div class='ctx'> {</div><div class='del'>-	struct mount *mnt, *ret = NULL;</div><div class='add'>+	struct rb_node *node = ns-&gt;mounts.rb_node;</div><div class='add'>+	struct mount *ret = NULL;</div><div class='ctx'> </div><div class='del'>-	lock_ns_list(ns);</div><div class='del'>-	list_for_each_continue(p, &amp;ns-&gt;list) {</div><div class='del'>-		mnt = list_entry(p, typeof(*mnt), mnt_list);</div><div class='del'>-		if (!mnt_is_cursor(mnt)) {</div><div class='del'>-			ret = mnt;</div><div class='del'>-			break;</div><div class='add'>+	while (node) {</div><div class='add'>+		struct mount *m = node_to_mount(node);</div><div class='add'>+</div><div class='add'>+		if (mnt_id &lt;= m-&gt;mnt_id_unique) {</div><div class='add'>+			ret = node_to_mount(node);</div><div class='add'>+			if (mnt_id == m-&gt;mnt_id_unique)</div><div class='add'>+				break;</div><div class='add'>+			node = node-&gt;rb_left;</div><div class='add'>+		} else {</div><div class='add'>+			node = node-&gt;rb_right;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	unlock_ns_list(ns);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Returns the mount which either has the specified mnt_id, or has the next</div><div class='add'>+ * greater id before the specified one.</div><div class='add'>+ */</div><div class='add'>+static struct mount *mnt_find_id_at_reverse(struct mnt_namespace *ns, u64 mnt_id)</div><div class='add'>+{</div><div class='add'>+	struct rb_node *node = ns-&gt;mounts.rb_node;</div><div class='add'>+	struct mount *ret = NULL;</div><div class='add'>+</div><div class='add'>+	while (node) {</div><div class='add'>+		struct mount *m = node_to_mount(node);</div><div class='add'>+</div><div class='add'>+		if (mnt_id &gt;= m-&gt;mnt_id_unique) {</div><div class='add'>+			ret = node_to_mount(node);</div><div class='add'>+			if (mnt_id == m-&gt;mnt_id_unique)</div><div class='add'>+				break;</div><div class='add'>+			node = node-&gt;rb_right;</div><div class='add'>+		} else {</div><div class='add'>+			node = node-&gt;rb_left;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_PROC_FS</div><div class='add'>+</div><div class='ctx'> /* iterator; we want it to have access to namespace_sem, thus here... */</div><div class='ctx'> static void *m_start(struct seq_file *m, loff_t *pos)</div><div class='ctx'> {</div><div class='ctx'> 	struct proc_mounts *p = m-&gt;private;</div><div class='del'>-	struct list_head *prev;</div><div class='ctx'> </div><div class='ctx'> 	down_read(&amp;namespace_sem);</div><div class='del'>-	if (!*pos) {</div><div class='del'>-		prev = &amp;p-&gt;ns-&gt;list;</div><div class='del'>-	} else {</div><div class='del'>-		prev = &amp;p-&gt;cursor.mnt_list;</div><div class='ctx'> </div><div class='del'>-		/* Read after we'd reached the end? */</div><div class='del'>-		if (list_empty(prev))</div><div class='del'>-			return NULL;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return mnt_list_next(p-&gt;ns, prev);</div><div class='add'>+	return mnt_find_id_at(p-&gt;ns, *pos);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void *m_next(struct seq_file *m, void *v, loff_t *pos)</div><div class='ctx'> {</div><div class='del'>-	struct proc_mounts *p = m-&gt;private;</div><div class='del'>-	struct mount *mnt = v;</div><div class='add'>+	struct mount *next = NULL, *mnt = v;</div><div class='add'>+	struct rb_node *node = rb_next(&amp;mnt-&gt;mnt_node);</div><div class='ctx'> </div><div class='ctx'> 	++*pos;</div><div class='del'>-	return mnt_list_next(p-&gt;ns, &amp;mnt-&gt;mnt_list);</div><div class='add'>+	if (node) {</div><div class='add'>+		next = node_to_mount(node);</div><div class='add'>+		*pos = next-&gt;mnt_id_unique;</div><div class='add'>+	}</div><div class='add'>+	return next;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void m_stop(struct seq_file *m, void *v)</div><div class='ctx'> {</div><div class='del'>-	struct proc_mounts *p = m-&gt;private;</div><div class='del'>-	struct mount *mnt = v;</div><div class='del'>-</div><div class='del'>-	lock_ns_list(p-&gt;ns);</div><div class='del'>-	if (mnt)</div><div class='del'>-		list_move_tail(&amp;p-&gt;cursor.mnt_list, &amp;mnt-&gt;mnt_list);</div><div class='del'>-	else</div><div class='del'>-		list_del_init(&amp;p-&gt;cursor.mnt_list);</div><div class='del'>-	unlock_ns_list(p-&gt;ns);</div><div class='ctx'> 	up_read(&amp;namespace_sem);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1359,14 +1575,6 @@ const struct seq_operations mounts_op = {</div><div class='ctx'> 	.show	= m_show,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-void mnt_cursor_del(struct mnt_namespace *ns, struct mount *cursor)</div><div class='del'>-{</div><div class='del'>-	down_read(&amp;namespace_sem);</div><div class='del'>-	lock_ns_list(ns);</div><div class='del'>-	list_del(&amp;cursor-&gt;mnt_list);</div><div class='del'>-	unlock_ns_list(ns);</div><div class='del'>-	up_read(&amp;namespace_sem);</div><div class='del'>-}</div><div class='ctx'> #endif  /* CONFIG_PROC_FS */</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -1380,23 +1588,19 @@ void mnt_cursor_del(struct mnt_namespace *ns, struct mount *cursor)</div><div class='ctx'> int may_umount_tree(struct vfsmount *m)</div><div class='ctx'> {</div><div class='ctx'> 	struct mount *mnt = real_mount(m);</div><div class='del'>-	int actual_refs = 0;</div><div class='del'>-	int minimum_refs = 0;</div><div class='del'>-	struct mount *p;</div><div class='del'>-	BUG_ON(!m);</div><div class='add'>+	bool busy = false;</div><div class='ctx'> </div><div class='ctx'> 	/* write lock needed for mnt_get_count */</div><div class='ctx'> 	lock_mount_hash();</div><div class='del'>-	for (p = mnt; p; p = next_mnt(p, mnt)) {</div><div class='del'>-		actual_refs += mnt_get_count(p);</div><div class='del'>-		minimum_refs += 2;</div><div class='add'>+	for (struct mount *p = mnt; p; p = next_mnt(p, mnt)) {</div><div class='add'>+		if (mnt_get_count(p) &gt; (p == mnt ? 2 : 1)) {</div><div class='add'>+			busy = true;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> 	unlock_mount_hash();</div><div class='ctx'> </div><div class='del'>-	if (actual_refs &gt; minimum_refs)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	return 1;</div><div class='add'>+	return !busy;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> EXPORT_SYMBOL(may_umount_tree);</div><div class='hunk'>@@ -1428,17 +1632,80 @@ int may_umount(struct vfsmount *mnt)</div><div class='ctx'> </div><div class='ctx'> EXPORT_SYMBOL(may_umount);</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_FSNOTIFY</div><div class='add'>+static void mnt_notify(struct mount *p)</div><div class='add'>+{</div><div class='add'>+	if (!p-&gt;prev_ns &amp;&amp; p-&gt;mnt_ns) {</div><div class='add'>+		fsnotify_mnt_attach(p-&gt;mnt_ns, &amp;p-&gt;mnt);</div><div class='add'>+	} else if (p-&gt;prev_ns &amp;&amp; !p-&gt;mnt_ns) {</div><div class='add'>+		fsnotify_mnt_detach(p-&gt;prev_ns, &amp;p-&gt;mnt);</div><div class='add'>+	} else if (p-&gt;prev_ns == p-&gt;mnt_ns) {</div><div class='add'>+		fsnotify_mnt_move(p-&gt;mnt_ns, &amp;p-&gt;mnt);</div><div class='add'>+	} else {</div><div class='add'>+		fsnotify_mnt_detach(p-&gt;prev_ns, &amp;p-&gt;mnt);</div><div class='add'>+		fsnotify_mnt_attach(p-&gt;mnt_ns, &amp;p-&gt;mnt);</div><div class='add'>+	}</div><div class='add'>+	p-&gt;prev_ns = p-&gt;mnt_ns;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void notify_mnt_list(void)</div><div class='add'>+{</div><div class='add'>+	struct mount *m, *tmp;</div><div class='add'>+	/*</div><div class='add'>+	 * Notify about mounts that were added/reparented/detached/remain</div><div class='add'>+	 * connected after unmount.</div><div class='add'>+	 */</div><div class='add'>+	list_for_each_entry_safe(m, tmp, &amp;notify_list, to_notify) {</div><div class='add'>+		mnt_notify(m);</div><div class='add'>+		list_del_init(&amp;m-&gt;to_notify);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool need_notify_mnt_list(void)</div><div class='add'>+{</div><div class='add'>+	return !list_empty(&amp;notify_list);</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+static void notify_mnt_list(void)</div><div class='add'>+{</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool need_notify_mnt_list(void)</div><div class='add'>+{</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+static void free_mnt_ns(struct mnt_namespace *);</div><div class='ctx'> static void namespace_unlock(void)</div><div class='ctx'> {</div><div class='ctx'> 	struct hlist_head head;</div><div class='ctx'> 	struct hlist_node *p;</div><div class='ctx'> 	struct mount *m;</div><div class='add'>+	struct mnt_namespace *ns = emptied_ns;</div><div class='ctx'> 	LIST_HEAD(list);</div><div class='ctx'> </div><div class='ctx'> 	hlist_move_list(&amp;unmounted, &amp;head);</div><div class='ctx'> 	list_splice_init(&amp;ex_mountpoints, &amp;list);</div><div class='add'>+	emptied_ns = NULL;</div><div class='ctx'> </div><div class='del'>-	up_write(&amp;namespace_sem);</div><div class='add'>+	if (need_notify_mnt_list()) {</div><div class='add'>+		/*</div><div class='add'>+		 * No point blocking out concurrent readers while notifications</div><div class='add'>+		 * are sent. This will also allow statmount()/listmount() to run</div><div class='add'>+		 * concurrently.</div><div class='add'>+		 */</div><div class='add'>+		downgrade_write(&amp;namespace_sem);</div><div class='add'>+		notify_mnt_list();</div><div class='add'>+		up_read(&amp;namespace_sem);</div><div class='add'>+	} else {</div><div class='add'>+		up_write(&amp;namespace_sem);</div><div class='add'>+	}</div><div class='add'>+	if (unlikely(ns)) {</div><div class='add'>+		/* Make sure we notice when we leak mounts. */</div><div class='add'>+		VFS_WARN_ON_ONCE(!mnt_ns_empty(ns));</div><div class='add'>+		free_mnt_ns(ns);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	shrink_dentry_list(&amp;list);</div><div class='ctx'> </div><div class='hunk'>@@ -1508,7 +1775,9 @@ static void umount_tree(struct mount *mnt, enum umount_tree_flags how)</div><div class='ctx'> 	/* Gather the mounts to umount */</div><div class='ctx'> 	for (p = mnt; p; p = next_mnt(p, mnt)) {</div><div class='ctx'> 		p-&gt;mnt.mnt_flags |= MNT_UMOUNT;</div><div class='del'>-		list_move(&amp;p-&gt;mnt_list, &amp;tmp_list);</div><div class='add'>+		if (mnt_ns_attached(p))</div><div class='add'>+			move_from_ns(p);</div><div class='add'>+		list_add_tail(&amp;p-&gt;mnt_list, &amp;tmp_list);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Hide the mounts from mnt_mounts */</div><div class='hunk'>@@ -1516,10 +1785,12 @@ static void umount_tree(struct mount *mnt, enum umount_tree_flags how)</div><div class='ctx'> 		list_del_init(&amp;p-&gt;mnt_child);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Add propogated mounts to the tmp_list */</div><div class='add'>+	/* Add propagated mounts to the tmp_list */</div><div class='ctx'> 	if (how &amp; UMOUNT_PROPAGATE)</div><div class='ctx'> 		propagate_umount(&amp;tmp_list);</div><div class='ctx'> </div><div class='add'>+	bulk_make_private(&amp;tmp_list);</div><div class='add'>+</div><div class='ctx'> 	while (!list_empty(&amp;tmp_list)) {</div><div class='ctx'> 		struct mnt_namespace *ns;</div><div class='ctx'> 		bool disconnect;</div><div class='hunk'>@@ -1528,7 +1799,7 @@ static void umount_tree(struct mount *mnt, enum umount_tree_flags how)</div><div class='ctx'> 		list_del_init(&amp;p-&gt;mnt_list);</div><div class='ctx'> 		ns = p-&gt;mnt_ns;</div><div class='ctx'> 		if (ns) {</div><div class='del'>-			ns-&gt;mounts--;</div><div class='add'>+			ns-&gt;nr_mounts--;</div><div class='ctx'> 			__touch_mnt_namespace(ns);</div><div class='ctx'> 		}</div><div class='ctx'> 		p-&gt;mnt_ns = NULL;</div><div class='hunk'>@@ -1537,7 +1808,6 @@ static void umount_tree(struct mount *mnt, enum umount_tree_flags how)</div><div class='ctx'> </div><div class='ctx'> 		disconnect = disconnect_mount(p, how);</div><div class='ctx'> 		if (mnt_has_parent(p)) {</div><div class='del'>-			mnt_add_count(p-&gt;mnt_parent, -1);</div><div class='ctx'> 			if (!disconnect) {</div><div class='ctx'> 				/* Don't forget about p */</div><div class='ctx'> 				list_add_tail(&amp;p-&gt;mnt_child, &amp;p-&gt;mnt_parent-&gt;mnt_mounts);</div><div class='hunk'>@@ -1545,9 +1815,21 @@ static void umount_tree(struct mount *mnt, enum umount_tree_flags how)</div><div class='ctx'> 				umount_mnt(p);</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='del'>-		change_mnt_propagation(p, MS_PRIVATE);</div><div class='ctx'> 		if (disconnect)</div><div class='ctx'> 			hlist_add_head(&amp;p-&gt;mnt_umount, &amp;unmounted);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * At this point p-&gt;mnt_ns is NULL, notification will be queued</div><div class='add'>+		 * only if</div><div class='add'>+		 *</div><div class='add'>+		 *  - p-&gt;prev_ns is non-NULL *and*</div><div class='add'>+		 *  - p-&gt;prev_ns-&gt;n_fsnotify_marks is non-NULL</div><div class='add'>+		 *</div><div class='add'>+		 * This will preclude queuing the mount if this is a cleanup</div><div class='add'>+		 * after a failed copy_tree() or destruction of an anonymous</div><div class='add'>+		 * namespace, etc.</div><div class='add'>+		 */</div><div class='add'>+		mnt_notify_add(p);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1601,7 +1883,7 @@ static int do_umount(struct mount *mnt, int flags)</div><div class='ctx'> 		 * all race cases, but it's a slowpath.</div><div class='ctx'> 		 */</div><div class='ctx'> 		lock_mount_hash();</div><div class='del'>-		if (mnt_get_count(mnt) != 2) {</div><div class='add'>+		if (!list_empty(&amp;mnt-&gt;mnt_mounts) || mnt_get_count(mnt) != 2) {</div><div class='ctx'> 			unlock_mount_hash();</div><div class='ctx'> 			return -EBUSY;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1647,22 +1929,27 @@ static int do_umount(struct mount *mnt, int flags)</div><div class='ctx'> 	namespace_lock();</div><div class='ctx'> 	lock_mount_hash();</div><div class='ctx'> </div><div class='del'>-	/* Recheck MNT_LOCKED with the locks held */</div><div class='add'>+	/* Repeat the earlier racy checks, now that we are holding the locks */</div><div class='ctx'> 	retval = -EINVAL;</div><div class='add'>+	if (!check_mnt(mnt))</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='ctx'> 	if (mnt-&gt;mnt.mnt_flags &amp; MNT_LOCKED)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='add'>+	if (!mnt_has_parent(mnt)) /* not the absolute root */</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='ctx'> 	event++;</div><div class='ctx'> 	if (flags &amp; MNT_DETACH) {</div><div class='del'>-		if (!list_empty(&amp;mnt-&gt;mnt_list))</div><div class='del'>-			umount_tree(mnt, UMOUNT_PROPAGATE);</div><div class='add'>+		umount_tree(mnt, UMOUNT_PROPAGATE);</div><div class='ctx'> 		retval = 0;</div><div class='ctx'> 	} else {</div><div class='add'>+		smp_mb(); // paired with __legitimize_mnt()</div><div class='ctx'> 		shrink_submounts(mnt);</div><div class='ctx'> 		retval = -EBUSY;</div><div class='ctx'> 		if (!propagate_mount_busy(mnt, 2)) {</div><div class='del'>-			if (!list_empty(&amp;mnt-&gt;mnt_list))</div><div class='del'>-				umount_tree(mnt, UMOUNT_PROPAGATE|UMOUNT_SYNC);</div><div class='add'>+			umount_tree(mnt, UMOUNT_PROPAGATE|UMOUNT_SYNC);</div><div class='ctx'> 			retval = 0;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1680,38 +1967,35 @@ out:</div><div class='ctx'>  * detach_mounts allows lazily unmounting those mounts instead of</div><div class='ctx'>  * leaking them.</div><div class='ctx'>  *</div><div class='del'>- * The caller may hold dentry-&gt;d_inode-&gt;i_mutex.</div><div class='add'>+ * The caller may hold dentry-&gt;d_inode-&gt;i_rwsem.</div><div class='ctx'>  */</div><div class='ctx'> void __detach_mounts(struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	struct mountpoint *mp;</div><div class='add'>+	struct pinned_mountpoint mp = {};</div><div class='ctx'> 	struct mount *mnt;</div><div class='ctx'> </div><div class='del'>-	namespace_lock();</div><div class='del'>-	lock_mount_hash();</div><div class='del'>-	mp = lookup_mountpoint(dentry);</div><div class='del'>-	if (!mp)</div><div class='del'>-		goto out_unlock;</div><div class='add'>+	guard(namespace_excl)();</div><div class='add'>+	guard(mount_writer)();</div><div class='add'>+</div><div class='add'>+	if (!lookup_mountpoint(dentry, &amp;mp))</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='ctx'> 	event++;</div><div class='del'>-	while (!hlist_empty(&amp;mp-&gt;m_list)) {</div><div class='del'>-		mnt = hlist_entry(mp-&gt;m_list.first, struct mount, mnt_mp_list);</div><div class='add'>+	while (mp.node.next) {</div><div class='add'>+		mnt = hlist_entry(mp.node.next, struct mount, mnt_mp_list);</div><div class='ctx'> 		if (mnt-&gt;mnt.mnt_flags &amp; MNT_UMOUNT) {</div><div class='ctx'> 			umount_mnt(mnt);</div><div class='ctx'> 			hlist_add_head(&amp;mnt-&gt;mnt_umount, &amp;unmounted);</div><div class='ctx'> 		}</div><div class='ctx'> 		else umount_tree(mnt, UMOUNT_CONNECTED);</div><div class='ctx'> 	}</div><div class='del'>-	put_mountpoint(mp);</div><div class='del'>-out_unlock:</div><div class='del'>-	unlock_mount_hash();</div><div class='del'>-	namespace_unlock();</div><div class='add'>+	unpin_mountpoint(&amp;mp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Is the caller allowed to modify his namespace?</div><div class='ctx'>  */</div><div class='del'>-static inline bool may_mount(void)</div><div class='add'>+bool may_mount(void)</div><div class='ctx'> {</div><div class='ctx'> 	return ns_capable(current-&gt;nsproxy-&gt;mnt_ns-&gt;user_ns, CAP_SYS_ADMIN);</div><div class='ctx'> }</div><div class='hunk'>@@ -1728,22 +2012,23 @@ static void warn_mandlock(void)</div><div class='ctx'> static int can_umount(const struct path *path, int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct mount *mnt = real_mount(path-&gt;mnt);</div><div class='add'>+	struct super_block *sb = path-&gt;dentry-&gt;d_sb;</div><div class='ctx'> </div><div class='ctx'> 	if (!may_mount())</div><div class='ctx'> 		return -EPERM;</div><div class='del'>-	if (path-&gt;dentry != path-&gt;mnt-&gt;mnt_root)</div><div class='add'>+	if (!path_mounted(path))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	if (!check_mnt(mnt))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	if (mnt-&gt;mnt.mnt_flags &amp; MNT_LOCKED) /* Check optimistically */</div><div class='ctx'> 		return -EINVAL;</div><div class='del'>-	if (flags &amp; MNT_FORCE &amp;&amp; !capable(CAP_SYS_ADMIN))</div><div class='add'>+	if (flags &amp; MNT_FORCE &amp;&amp; !ns_capable(sb-&gt;s_user_ns, CAP_SYS_ADMIN))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> // caller is responsible for flags being sane</div><div class='del'>-int path_umount(struct path *path, int flags)</div><div class='add'>+int path_umount(const struct path *path, int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct mount *mnt = real_mount(path-&gt;mnt);</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -1795,14 +2080,15 @@ SYSCALL_DEFINE1(oldumount, char __user *, name)</div><div class='ctx'> </div><div class='ctx'> static bool is_mnt_ns_file(struct dentry *dentry)</div><div class='ctx'> {</div><div class='add'>+	struct ns_common *ns;</div><div class='add'>+</div><div class='ctx'> 	/* Is this a proxy for a mount namespace? */</div><div class='del'>-	return dentry-&gt;d_op == &amp;ns_dentry_operations &amp;&amp;</div><div class='del'>-	       dentry-&gt;d_fsdata == &amp;mntns_operations;</div><div class='del'>-}</div><div class='add'>+	if (dentry-&gt;d_op != &amp;ns_dentry_operations)</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-static struct mnt_namespace *to_mnt_ns(struct ns_common *ns)</div><div class='del'>-{</div><div class='del'>-	return container_of(ns, struct mnt_namespace, ns);</div><div class='add'>+	ns = d_inode(dentry)-&gt;i_private;</div><div class='add'>+</div><div class='add'>+	return ns-&gt;ops == &amp;mntns_operations;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct ns_common *from_mnt_ns(struct mnt_namespace *mnt)</div><div class='hunk'>@@ -1810,132 +2096,227 @@ struct ns_common *from_mnt_ns(struct mnt_namespace *mnt)</div><div class='ctx'> 	return &amp;mnt-&gt;ns;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+struct mnt_namespace *get_sequential_mnt_ns(struct mnt_namespace *mntns, bool previous)</div><div class='add'>+{</div><div class='add'>+	struct ns_common *ns;</div><div class='add'>+</div><div class='add'>+	guard(rcu)();</div><div class='add'>+</div><div class='add'>+	for (;;) {</div><div class='add'>+		ns = ns_tree_adjoined_rcu(mntns, previous);</div><div class='add'>+		if (IS_ERR(ns))</div><div class='add'>+			return ERR_CAST(ns);</div><div class='add'>+</div><div class='add'>+		mntns = to_mnt_ns(ns);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * The last passive reference count is put with RCU</div><div class='add'>+		 * delay so accessing the mount namespace is not just</div><div class='add'>+		 * safe but all relevant members are still valid.</div><div class='add'>+		 */</div><div class='add'>+		if (!ns_capable_noaudit(mntns-&gt;user_ns, CAP_SYS_ADMIN))</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * We need an active reference count as we're persisting</div><div class='add'>+		 * the mount namespace and it might already be on its</div><div class='add'>+		 * deathbed.</div><div class='add'>+		 */</div><div class='add'>+		if (!ns_ref_get(mntns))</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		return mntns;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct mnt_namespace *mnt_ns_from_dentry(struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	if (!is_mnt_ns_file(dentry))</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	return to_mnt_ns(get_proc_ns(dentry-&gt;d_inode));</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static bool mnt_ns_loop(struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	/* Could bind mounting the mount namespace inode cause a</div><div class='ctx'> 	 * mount namespace loop?</div><div class='ctx'> 	 */</div><div class='del'>-	struct mnt_namespace *mnt_ns;</div><div class='del'>-	if (!is_mnt_ns_file(dentry))</div><div class='add'>+	struct mnt_namespace *mnt_ns = mnt_ns_from_dentry(dentry);</div><div class='add'>+</div><div class='add'>+	if (!mnt_ns)</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	mnt_ns = to_mnt_ns(get_proc_ns(dentry-&gt;d_inode));</div><div class='del'>-	return current-&gt;nsproxy-&gt;mnt_ns-&gt;seq &gt;= mnt_ns-&gt;seq;</div><div class='add'>+	return current-&gt;nsproxy-&gt;mnt_ns-&gt;ns.ns_id &gt;= mnt_ns-&gt;ns.ns_id;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct mount *copy_tree(struct mount *mnt, struct dentry *dentry,</div><div class='add'>+struct mount *copy_tree(struct mount *src_root, struct dentry *dentry,</div><div class='ctx'> 					int flag)</div><div class='ctx'> {</div><div class='del'>-	struct mount *res, *p, *q, *r, *parent;</div><div class='add'>+	struct mount *res, *src_parent, *src_root_child, *src_mnt,</div><div class='add'>+		*dst_parent, *dst_mnt;</div><div class='ctx'> </div><div class='del'>-	if (!(flag &amp; CL_COPY_UNBINDABLE) &amp;&amp; IS_MNT_UNBINDABLE(mnt))</div><div class='add'>+	if (!(flag &amp; CL_COPY_UNBINDABLE) &amp;&amp; IS_MNT_UNBINDABLE(src_root))</div><div class='ctx'> 		return ERR_PTR(-EINVAL);</div><div class='ctx'> </div><div class='ctx'> 	if (!(flag &amp; CL_COPY_MNT_NS_FILE) &amp;&amp; is_mnt_ns_file(dentry))</div><div class='ctx'> 		return ERR_PTR(-EINVAL);</div><div class='ctx'> </div><div class='del'>-	res = q = clone_mnt(mnt, dentry, flag);</div><div class='del'>-	if (IS_ERR(q))</div><div class='del'>-		return q;</div><div class='add'>+	res = dst_mnt = clone_mnt(src_root, dentry, flag);</div><div class='add'>+	if (IS_ERR(dst_mnt))</div><div class='add'>+		return dst_mnt;</div><div class='ctx'> </div><div class='del'>-	q-&gt;mnt_mountpoint = mnt-&gt;mnt_mountpoint;</div><div class='add'>+	src_parent = src_root;</div><div class='ctx'> </div><div class='del'>-	p = mnt;</div><div class='del'>-	list_for_each_entry(r, &amp;mnt-&gt;mnt_mounts, mnt_child) {</div><div class='del'>-		struct mount *s;</div><div class='del'>-		if (!is_subdir(r-&gt;mnt_mountpoint, dentry))</div><div class='add'>+	list_for_each_entry(src_root_child, &amp;src_root-&gt;mnt_mounts, mnt_child) {</div><div class='add'>+		if (!is_subdir(src_root_child-&gt;mnt_mountpoint, dentry))</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		for (s = r; s; s = next_mnt(s, r)) {</div><div class='add'>+		for (src_mnt = src_root_child; src_mnt;</div><div class='add'>+		    src_mnt = next_mnt(src_mnt, src_root_child)) {</div><div class='ctx'> 			if (!(flag &amp; CL_COPY_UNBINDABLE) &amp;&amp;</div><div class='del'>-			    IS_MNT_UNBINDABLE(s)) {</div><div class='del'>-				if (s-&gt;mnt.mnt_flags &amp; MNT_LOCKED) {</div><div class='add'>+			    IS_MNT_UNBINDABLE(src_mnt)) {</div><div class='add'>+				if (src_mnt-&gt;mnt.mnt_flags &amp; MNT_LOCKED) {</div><div class='ctx'> 					/* Both unbindable and locked. */</div><div class='del'>-					q = ERR_PTR(-EPERM);</div><div class='add'>+					dst_mnt = ERR_PTR(-EPERM);</div><div class='ctx'> 					goto out;</div><div class='ctx'> 				} else {</div><div class='del'>-					s = skip_mnt_tree(s);</div><div class='add'>+					src_mnt = skip_mnt_tree(src_mnt);</div><div class='ctx'> 					continue;</div><div class='ctx'> 				}</div><div class='ctx'> 			}</div><div class='ctx'> 			if (!(flag &amp; CL_COPY_MNT_NS_FILE) &amp;&amp;</div><div class='del'>-			    is_mnt_ns_file(s-&gt;mnt.mnt_root)) {</div><div class='del'>-				s = skip_mnt_tree(s);</div><div class='add'>+			    is_mnt_ns_file(src_mnt-&gt;mnt.mnt_root)) {</div><div class='add'>+				src_mnt = skip_mnt_tree(src_mnt);</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='del'>-			while (p != s-&gt;mnt_parent) {</div><div class='del'>-				p = p-&gt;mnt_parent;</div><div class='del'>-				q = q-&gt;mnt_parent;</div><div class='add'>+			while (src_parent != src_mnt-&gt;mnt_parent) {</div><div class='add'>+				src_parent = src_parent-&gt;mnt_parent;</div><div class='add'>+				dst_mnt = dst_mnt-&gt;mnt_parent;</div><div class='ctx'> 			}</div><div class='del'>-			p = s;</div><div class='del'>-			parent = q;</div><div class='del'>-			q = clone_mnt(p, p-&gt;mnt.mnt_root, flag);</div><div class='del'>-			if (IS_ERR(q))</div><div class='add'>+</div><div class='add'>+			src_parent = src_mnt;</div><div class='add'>+			dst_parent = dst_mnt;</div><div class='add'>+			dst_mnt = clone_mnt(src_mnt, src_mnt-&gt;mnt.mnt_root, flag);</div><div class='add'>+			if (IS_ERR(dst_mnt))</div><div class='ctx'> 				goto out;</div><div class='ctx'> 			lock_mount_hash();</div><div class='del'>-			list_add_tail(&amp;q-&gt;mnt_list, &amp;res-&gt;mnt_list);</div><div class='del'>-			attach_mnt(q, parent, p-&gt;mnt_mp);</div><div class='add'>+			if (src_mnt-&gt;mnt.mnt_flags &amp; MNT_LOCKED)</div><div class='add'>+				dst_mnt-&gt;mnt.mnt_flags |= MNT_LOCKED;</div><div class='add'>+			if (unlikely(flag &amp; CL_EXPIRE)) {</div><div class='add'>+				/* stick the duplicate mount on the same expiry</div><div class='add'>+				 * list as the original if that was on one */</div><div class='add'>+				if (!list_empty(&amp;src_mnt-&gt;mnt_expire))</div><div class='add'>+					list_add(&amp;dst_mnt-&gt;mnt_expire,</div><div class='add'>+						 &amp;src_mnt-&gt;mnt_expire);</div><div class='add'>+			}</div><div class='add'>+			attach_mnt(dst_mnt, dst_parent, src_parent-&gt;mnt_mp);</div><div class='ctx'> 			unlock_mount_hash();</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> 	return res;</div><div class='add'>+</div><div class='ctx'> out:</div><div class='ctx'> 	if (res) {</div><div class='ctx'> 		lock_mount_hash();</div><div class='ctx'> 		umount_tree(res, UMOUNT_SYNC);</div><div class='ctx'> 		unlock_mount_hash();</div><div class='ctx'> 	}</div><div class='del'>-	return q;</div><div class='add'>+	return dst_mnt;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Caller should check returned pointer for errors */</div><div class='add'>+static inline bool extend_array(struct path **res, struct path **to_free,</div><div class='add'>+				unsigned n, unsigned *count, unsigned new_count)</div><div class='add'>+{</div><div class='add'>+	struct path *p;</div><div class='add'>+</div><div class='add'>+	if (likely(n &lt; *count))</div><div class='add'>+		return true;</div><div class='add'>+	p = kmalloc_array(new_count, sizeof(struct path), GFP_KERNEL);</div><div class='add'>+	if (p &amp;&amp; *count)</div><div class='add'>+		memcpy(p, *res, *count * sizeof(struct path));</div><div class='add'>+	*count = new_count;</div><div class='add'>+	kfree(*to_free);</div><div class='add'>+	*to_free = *res = p;</div><div class='add'>+	return p;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-struct vfsmount *collect_mounts(const struct path *path)</div><div class='add'>+const struct path *collect_paths(const struct path *path,</div><div class='add'>+			      struct path *prealloc, unsigned count)</div><div class='ctx'> {</div><div class='del'>-	struct mount *tree;</div><div class='del'>-	namespace_lock();</div><div class='del'>-	if (!check_mnt(real_mount(path-&gt;mnt)))</div><div class='del'>-		tree = ERR_PTR(-EINVAL);</div><div class='del'>-	else</div><div class='del'>-		tree = copy_tree(real_mount(path-&gt;mnt), path-&gt;dentry,</div><div class='del'>-				 CL_COPY_ALL | CL_PRIVATE);</div><div class='del'>-	namespace_unlock();</div><div class='del'>-	if (IS_ERR(tree))</div><div class='del'>-		return ERR_CAST(tree);</div><div class='del'>-	return &amp;tree-&gt;mnt;</div><div class='add'>+	struct mount *root = real_mount(path-&gt;mnt);</div><div class='add'>+	struct mount *child;</div><div class='add'>+	struct path *res = prealloc, *to_free = NULL;</div><div class='add'>+	unsigned n = 0;</div><div class='add'>+</div><div class='add'>+	guard(namespace_shared)();</div><div class='add'>+</div><div class='add'>+	if (!check_mnt(root))</div><div class='add'>+		return ERR_PTR(-EINVAL);</div><div class='add'>+	if (!extend_array(&amp;res, &amp;to_free, 0, &amp;count, 32))</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+	res[n++] = *path;</div><div class='add'>+	list_for_each_entry(child, &amp;root-&gt;mnt_mounts, mnt_child) {</div><div class='add'>+		if (!is_subdir(child-&gt;mnt_mountpoint, path-&gt;dentry))</div><div class='add'>+			continue;</div><div class='add'>+		for (struct mount *m = child; m; m = next_mnt(m, child)) {</div><div class='add'>+			if (!extend_array(&amp;res, &amp;to_free, n, &amp;count, 2 * count))</div><div class='add'>+				return ERR_PTR(-ENOMEM);</div><div class='add'>+			res[n].mnt = &amp;m-&gt;mnt;</div><div class='add'>+			res[n].dentry = m-&gt;mnt.mnt_root;</div><div class='add'>+			n++;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	if (!extend_array(&amp;res, &amp;to_free, n, &amp;count, count + 1))</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+	memset(res + n, 0, (count - n) * sizeof(struct path));</div><div class='add'>+	for (struct path *p = res; p-&gt;mnt; p++)</div><div class='add'>+		path_get(p);</div><div class='add'>+	return res;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void drop_collected_paths(const struct path *paths, const struct path *prealloc)</div><div class='add'>+{</div><div class='add'>+	for (const struct path *p = paths; p-&gt;mnt; p++)</div><div class='add'>+		path_put(p);</div><div class='add'>+	if (paths != prealloc)</div><div class='add'>+		kfree(paths);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void free_mnt_ns(struct mnt_namespace *);</div><div class='ctx'> static struct mnt_namespace *alloc_mnt_ns(struct user_namespace *, bool);</div><div class='ctx'> </div><div class='ctx'> void dissolve_on_fput(struct vfsmount *mnt)</div><div class='ctx'> {</div><div class='del'>-	struct mnt_namespace *ns;</div><div class='del'>-	namespace_lock();</div><div class='del'>-	lock_mount_hash();</div><div class='del'>-	ns = real_mount(mnt)-&gt;mnt_ns;</div><div class='del'>-	if (ns) {</div><div class='del'>-		if (is_anon_ns(ns))</div><div class='del'>-			umount_tree(real_mount(mnt), UMOUNT_CONNECTED);</div><div class='del'>-		else</div><div class='del'>-			ns = NULL;</div><div class='add'>+	struct mount *m = real_mount(mnt);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * m used to be the root of anon namespace; if it still is one,</div><div class='add'>+	 * we need to dissolve the mount tree and free that namespace.</div><div class='add'>+	 * Let's try to avoid taking namespace_sem if we can determine</div><div class='add'>+	 * that there's nothing to do without it - rcu_read_lock() is</div><div class='add'>+	 * enough to make anon_ns_root() memory-safe and once m has</div><div class='add'>+	 * left its namespace, it's no longer our concern, since it will</div><div class='add'>+	 * never become a root of anon ns again.</div><div class='add'>+	 */</div><div class='add'>+</div><div class='add'>+	scoped_guard(rcu) {</div><div class='add'>+		if (!anon_ns_root(m))</div><div class='add'>+			return;</div><div class='ctx'> 	}</div><div class='del'>-	unlock_mount_hash();</div><div class='del'>-	namespace_unlock();</div><div class='del'>-	if (ns)</div><div class='del'>-		free_mnt_ns(ns);</div><div class='del'>-}</div><div class='ctx'> </div><div class='del'>-void drop_collected_mounts(struct vfsmount *mnt)</div><div class='del'>-{</div><div class='del'>-	namespace_lock();</div><div class='del'>-	lock_mount_hash();</div><div class='del'>-	umount_tree(real_mount(mnt), 0);</div><div class='del'>-	unlock_mount_hash();</div><div class='del'>-	namespace_unlock();</div><div class='add'>+	scoped_guard(namespace_excl) {</div><div class='add'>+		if (!anon_ns_root(m))</div><div class='add'>+			return;</div><div class='add'>+</div><div class='add'>+		emptied_ns = m-&gt;mnt_ns;</div><div class='add'>+		lock_mount_hash();</div><div class='add'>+		umount_tree(m, UMOUNT_CONNECTED);</div><div class='add'>+		unlock_mount_hash();</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool has_locked_children(struct mount *mnt, struct dentry *dentry)</div><div class='add'>+/* locks: namespace_shared &amp;&amp; pinned(mnt) || mount_locked_reader */</div><div class='add'>+static bool __has_locked_children(struct mount *mnt, struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	struct mount *child;</div><div class='ctx'> </div><div class='hunk'>@@ -1949,6 +2330,28 @@ static bool has_locked_children(struct mount *mnt, struct dentry *dentry)</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+bool has_locked_children(struct mount *mnt, struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	guard(mount_locked_reader)();</div><div class='add'>+	return __has_locked_children(mnt, dentry);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Check that there aren't references to earlier/same mount namespaces in the</div><div class='add'>+ * specified subtree.  Such references can act as pins for mount namespaces</div><div class='add'>+ * that aren't checked by the mount-cycle checking code, thereby allowing</div><div class='add'>+ * cycles to be made.</div><div class='add'>+ *</div><div class='add'>+ * locks: mount_locked_reader || namespace_shared &amp;&amp; pinned(subtree)</div><div class='add'>+ */</div><div class='add'>+static bool check_for_nsfs_mounts(struct mount *subtree)</div><div class='add'>+{</div><div class='add'>+	for (struct mount *p = subtree; p; p = next_mnt(p, subtree))</div><div class='add'>+		if (mnt_ns_loop(p-&gt;mnt.mnt_root))</div><div class='add'>+			return false;</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /**</div><div class='ctx'>  * clone_private_mount - create a private clone of a path</div><div class='ctx'>  * @path: path to clone</div><div class='hunk'>@@ -1957,6 +2360,8 @@ static bool has_locked_children(struct mount *mnt, struct dentry *dentry)</div><div class='ctx'>  * will not be attached anywhere in the namespace and will be private (i.e.</div><div class='ctx'>  * changes to the originating mount won't be propagated into this).</div><div class='ctx'>  *</div><div class='add'>+ * This assumes caller has called or done the equivalent of may_mount().</div><div class='add'>+ *</div><div class='ctx'>  * Release with mntput().</div><div class='ctx'>  */</div><div class='ctx'> struct vfsmount *clone_private_mount(const struct path *path)</div><div class='hunk'>@@ -1964,48 +2369,42 @@ struct vfsmount *clone_private_mount(const struct path *path)</div><div class='ctx'> 	struct mount *old_mnt = real_mount(path-&gt;mnt);</div><div class='ctx'> 	struct mount *new_mnt;</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;namespace_sem);</div><div class='add'>+	guard(namespace_shared)();</div><div class='add'>+</div><div class='ctx'> 	if (IS_MNT_UNBINDABLE(old_mnt))</div><div class='del'>-		goto invalid;</div><div class='add'>+		return ERR_PTR(-EINVAL);</div><div class='ctx'> </div><div class='del'>-	if (!check_mnt(old_mnt))</div><div class='del'>-		goto invalid;</div><div class='add'>+	/*</div><div class='add'>+	 * Make sure the source mount is acceptable.</div><div class='add'>+	 * Anything mounted in our mount namespace is allowed.</div><div class='add'>+	 * Otherwise, it must be the root of an anonymous mount</div><div class='add'>+	 * namespace, and we need to make sure no namespace</div><div class='add'>+	 * loops get created.</div><div class='add'>+	 */</div><div class='add'>+	if (!check_mnt(old_mnt)) {</div><div class='add'>+		if (!anon_ns_root(old_mnt))</div><div class='add'>+			return ERR_PTR(-EINVAL);</div><div class='ctx'> </div><div class='del'>-	if (has_locked_children(old_mnt, path-&gt;dentry))</div><div class='del'>-		goto invalid;</div><div class='add'>+		if (!check_for_nsfs_mounts(old_mnt))</div><div class='add'>+			return ERR_PTR(-EINVAL);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	new_mnt = clone_mnt(old_mnt, path-&gt;dentry, CL_PRIVATE);</div><div class='del'>-	up_read(&amp;namespace_sem);</div><div class='add'>+	if (!ns_capable(old_mnt-&gt;mnt_ns-&gt;user_ns, CAP_SYS_ADMIN))</div><div class='add'>+		return ERR_PTR(-EPERM);</div><div class='add'>+</div><div class='add'>+	if (__has_locked_children(old_mnt, path-&gt;dentry))</div><div class='add'>+		return ERR_PTR(-EINVAL);</div><div class='ctx'> </div><div class='add'>+	new_mnt = clone_mnt(old_mnt, path-&gt;dentry, CL_PRIVATE);</div><div class='ctx'> 	if (IS_ERR(new_mnt))</div><div class='del'>-		return ERR_CAST(new_mnt);</div><div class='add'>+		return ERR_PTR(-EINVAL);</div><div class='ctx'> </div><div class='ctx'> 	/* Longterm mount to be removed by kern_unmount*() */</div><div class='ctx'> 	new_mnt-&gt;mnt_ns = MNT_NS_INTERNAL;</div><div class='del'>-</div><div class='ctx'> 	return &amp;new_mnt-&gt;mnt;</div><div class='del'>-</div><div class='del'>-invalid:</div><div class='del'>-	up_read(&amp;namespace_sem);</div><div class='del'>-	return ERR_PTR(-EINVAL);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(clone_private_mount);</div><div class='ctx'> </div><div class='del'>-int iterate_mounts(int (*f)(struct vfsmount *, void *), void *arg,</div><div class='del'>-		   struct vfsmount *root)</div><div class='del'>-{</div><div class='del'>-	struct mount *mnt;</div><div class='del'>-	int res = f(root, arg);</div><div class='del'>-	if (res)</div><div class='del'>-		return res;</div><div class='del'>-	list_for_each_entry(mnt, &amp;real_mount(root)-&gt;mnt_list, mnt_list) {</div><div class='del'>-		res = f(&amp;mnt-&gt;mnt, arg);</div><div class='del'>-		if (res)</div><div class='del'>-			return res;</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static void lock_mnt_tree(struct mount *mnt)</div><div class='ctx'> {</div><div class='ctx'> 	struct mount *p;</div><div class='hunk'>@@ -2027,7 +2426,7 @@ static void lock_mnt_tree(struct mount *mnt)</div><div class='ctx'> 		if (flags &amp; MNT_NOEXEC)</div><div class='ctx'> 			flags |= MNT_LOCK_NOEXEC;</div><div class='ctx'> 		/* Don't allow unprivileged users to reveal what is under a mount */</div><div class='del'>-		if (list_empty(&amp;p-&gt;mnt_expire))</div><div class='add'>+		if (list_empty(&amp;p-&gt;mnt_expire) &amp;&amp; p != mnt)</div><div class='ctx'> 			flags |= MNT_LOCKED;</div><div class='ctx'> 		p-&gt;mnt.mnt_flags = flags;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2048,7 +2447,7 @@ static int invent_group_ids(struct mount *mnt, bool recurse)</div><div class='ctx'> 	struct mount *p;</div><div class='ctx'> </div><div class='ctx'> 	for (p = mnt; p; p = recurse ? next_mnt(p, mnt) : NULL) {</div><div class='del'>-		if (!p-&gt;mnt_group_id &amp;&amp; !IS_MNT_SHARED(p)) {</div><div class='add'>+		if (!p-&gt;mnt_group_id) {</div><div class='ctx'> 			int err = mnt_alloc_group_id(p);</div><div class='ctx'> 			if (err) {</div><div class='ctx'> 				cleanup_group_ids(mnt, p);</div><div class='hunk'>@@ -2063,31 +2462,35 @@ static int invent_group_ids(struct mount *mnt, bool recurse)</div><div class='ctx'> int count_mounts(struct mnt_namespace *ns, struct mount *mnt)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int max = READ_ONCE(sysctl_mount_max);</div><div class='del'>-	unsigned int mounts = 0, old, pending, sum;</div><div class='add'>+	unsigned int mounts = 0;</div><div class='ctx'> 	struct mount *p;</div><div class='ctx'> </div><div class='add'>+	if (ns-&gt;nr_mounts &gt;= max)</div><div class='add'>+		return -ENOSPC;</div><div class='add'>+	max -= ns-&gt;nr_mounts;</div><div class='add'>+	if (ns-&gt;pending_mounts &gt;= max)</div><div class='add'>+		return -ENOSPC;</div><div class='add'>+	max -= ns-&gt;pending_mounts;</div><div class='add'>+</div><div class='ctx'> 	for (p = mnt; p; p = next_mnt(p, mnt))</div><div class='ctx'> 		mounts++;</div><div class='ctx'> </div><div class='del'>-	old = ns-&gt;mounts;</div><div class='del'>-	pending = ns-&gt;pending_mounts;</div><div class='del'>-	sum = old + pending;</div><div class='del'>-	if ((old &gt; sum) ||</div><div class='del'>-	    (pending &gt; sum) ||</div><div class='del'>-	    (max &lt; sum) ||</div><div class='del'>-	    (mounts &gt; (max - sum)))</div><div class='add'>+	if (mounts &gt; max)</div><div class='ctx'> 		return -ENOSPC;</div><div class='ctx'> </div><div class='del'>-	ns-&gt;pending_mounts = pending + mounts;</div><div class='add'>+	ns-&gt;pending_mounts += mounts;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- *  @source_mnt : mount tree to be attached</div><div class='del'>- *  @nd         : place the mount tree @source_mnt is attached</div><div class='del'>- *  @parent_nd  : if non-null, detach the source_mnt from its parent and</div><div class='del'>- *  		   store the parent mount and mountpoint dentry.</div><div class='del'>- *  		   (done when source_mnt is moved)</div><div class='add'>+enum mnt_tree_flags_t {</div><div class='add'>+	MNT_TREE_BENEATH = BIT(0),</div><div class='add'>+	MNT_TREE_PROPAGATION = BIT(1),</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * attach_recursive_mnt - attach a source mount tree</div><div class='add'>+ * @source_mnt: mount tree to be attached</div><div class='add'>+ * @dest:	the context for mounting at the place where the tree should go</div><div class='ctx'>  *</div><div class='ctx'>  *  NOTE: in the table below explains the semantics when a source mount</div><div class='ctx'>  *  of a given type is attached to a destination mount of a given type.</div><div class='hunk'>@@ -2144,26 +2547,38 @@ int count_mounts(struct mnt_namespace *ns, struct mount *mnt)</div><div class='ctx'>  * applied to each mount in the tree.</div><div class='ctx'>  * Must be called without spinlocks held, since this function can sleep</div><div class='ctx'>  * in allocations.</div><div class='add'>+ *</div><div class='add'>+ * Context: The function expects namespace_lock() to be held.</div><div class='add'>+ * Return: If @source_mnt was successfully attached 0 is returned.</div><div class='add'>+ *         Otherwise a negative error code is returned.</div><div class='ctx'>  */</div><div class='ctx'> static int attach_recursive_mnt(struct mount *source_mnt,</div><div class='del'>-			struct mount *dest_mnt,</div><div class='del'>-			struct mountpoint *dest_mp,</div><div class='del'>-			bool moving)</div><div class='add'>+				const struct pinned_mountpoint *dest)</div><div class='ctx'> {</div><div class='ctx'> 	struct user_namespace *user_ns = current-&gt;nsproxy-&gt;mnt_ns-&gt;user_ns;</div><div class='add'>+	struct mount *dest_mnt = dest-&gt;parent;</div><div class='add'>+	struct mountpoint *dest_mp = dest-&gt;mp;</div><div class='ctx'> 	HLIST_HEAD(tree_list);</div><div class='ctx'> 	struct mnt_namespace *ns = dest_mnt-&gt;mnt_ns;</div><div class='del'>-	struct mountpoint *smp;</div><div class='add'>+	struct pinned_mountpoint root = {};</div><div class='add'>+	struct mountpoint *shorter = NULL;</div><div class='ctx'> 	struct mount *child, *p;</div><div class='add'>+	struct mount *top;</div><div class='ctx'> 	struct hlist_node *n;</div><div class='del'>-	int err;</div><div class='add'>+	int err = 0;</div><div class='add'>+	bool moving = mnt_has_parent(source_mnt);</div><div class='ctx'> </div><div class='del'>-	/* Preallocate a mountpoint in case the new mounts need</div><div class='del'>-	 * to be tucked under other mounts.</div><div class='add'>+	/*</div><div class='add'>+	 * Preallocate a mountpoint in case the new mounts need to be</div><div class='add'>+	 * mounted beneath mounts on the same mountpoint.</div><div class='ctx'> 	 */</div><div class='del'>-	smp = get_mountpoint(source_mnt-&gt;mnt.mnt_root);</div><div class='del'>-	if (IS_ERR(smp))</div><div class='del'>-		return PTR_ERR(smp);</div><div class='add'>+	for (top = source_mnt; unlikely(top-&gt;overmount); top = top-&gt;overmount) {</div><div class='add'>+		if (!shorter &amp;&amp; is_mnt_ns_file(top-&gt;mnt.mnt_root))</div><div class='add'>+			shorter = top-&gt;mnt_mp;</div><div class='add'>+	}</div><div class='add'>+	err = get_mountpoint(top-&gt;mnt.mnt_root, &amp;root);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='ctx'> 	/* Is there space to add these mounts to the mount namespace? */</div><div class='ctx'> 	if (!moving) {</div><div class='hunk'>@@ -2177,41 +2592,60 @@ static int attach_recursive_mnt(struct mount *source_mnt,</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		err = propagate_mnt(dest_mnt, dest_mp, source_mnt, &amp;tree_list);</div><div class='del'>-		lock_mount_hash();</div><div class='del'>-		if (err)</div><div class='del'>-			goto out_cleanup_ids;</div><div class='add'>+	}</div><div class='add'>+	lock_mount_hash();</div><div class='add'>+	if (err)</div><div class='add'>+		goto out_cleanup_ids;</div><div class='add'>+</div><div class='add'>+	if (IS_MNT_SHARED(dest_mnt)) {</div><div class='ctx'> 		for (p = source_mnt; p; p = next_mnt(p, source_mnt))</div><div class='ctx'> 			set_mnt_shared(p);</div><div class='del'>-	} else {</div><div class='del'>-		lock_mount_hash();</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> 	if (moving) {</div><div class='del'>-		unhash_mnt(source_mnt);</div><div class='del'>-		attach_mnt(source_mnt, dest_mnt, dest_mp);</div><div class='del'>-		touch_mnt_namespace(source_mnt-&gt;mnt_ns);</div><div class='add'>+		umount_mnt(source_mnt);</div><div class='add'>+		mnt_notify_add(source_mnt);</div><div class='add'>+		/* if the mount is moved, it should no longer be expired</div><div class='add'>+		 * automatically */</div><div class='add'>+		list_del_init(&amp;source_mnt-&gt;mnt_expire);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		if (source_mnt-&gt;mnt_ns) {</div><div class='ctx'> 			/* move from anon - the caller will destroy */</div><div class='del'>-			list_del_init(&amp;source_mnt-&gt;mnt_ns-&gt;list);</div><div class='add'>+			emptied_ns = source_mnt-&gt;mnt_ns;</div><div class='add'>+			for (p = source_mnt; p; p = next_mnt(p, source_mnt))</div><div class='add'>+				move_from_ns(p);</div><div class='ctx'> 		}</div><div class='del'>-		mnt_set_mountpoint(dest_mnt, dest_mp, source_mnt);</div><div class='del'>-		commit_tree(source_mnt);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	mnt_set_mountpoint(dest_mnt, dest_mp, source_mnt);</div><div class='add'>+	/*</div><div class='add'>+	 * Now the original copy is in the same state as the secondaries -</div><div class='add'>+	 * its root attached to mountpoint, but not hashed and all mounts</div><div class='add'>+	 * in it are either in our namespace or in no namespace at all.</div><div class='add'>+	 * Add the original to the list of copies and deal with the</div><div class='add'>+	 * rest of work for all of them uniformly.</div><div class='add'>+	 */</div><div class='add'>+	hlist_add_head(&amp;source_mnt-&gt;mnt_hash, &amp;tree_list);</div><div class='add'>+</div><div class='ctx'> 	hlist_for_each_entry_safe(child, n, &amp;tree_list, mnt_hash) {</div><div class='ctx'> 		struct mount *q;</div><div class='ctx'> 		hlist_del_init(&amp;child-&gt;mnt_hash);</div><div class='del'>-		q = __lookup_mnt(&amp;child-&gt;mnt_parent-&gt;mnt,</div><div class='del'>-				 child-&gt;mnt_mountpoint);</div><div class='del'>-		if (q)</div><div class='del'>-			mnt_change_mountpoint(child, smp, q);</div><div class='ctx'> 		/* Notice when we are propagating across user namespaces */</div><div class='ctx'> 		if (child-&gt;mnt_parent-&gt;mnt_ns-&gt;user_ns != user_ns)</div><div class='ctx'> 			lock_mnt_tree(child);</div><div class='del'>-		child-&gt;mnt.mnt_flags &amp;= ~MNT_LOCKED;</div><div class='add'>+		q = __lookup_mnt(&amp;child-&gt;mnt_parent-&gt;mnt,</div><div class='add'>+				 child-&gt;mnt_mountpoint);</div><div class='ctx'> 		commit_tree(child);</div><div class='add'>+		if (q) {</div><div class='add'>+			struct mount *r = topmost_overmount(child);</div><div class='add'>+			struct mountpoint *mp = root.mp;</div><div class='add'>+</div><div class='add'>+			if (unlikely(shorter) &amp;&amp; child != source_mnt)</div><div class='add'>+				mp = shorter;</div><div class='add'>+			mnt_change_mountpoint(r, mp, q);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='del'>-	put_mountpoint(smp);</div><div class='add'>+	unpin_mountpoint(&amp;root);</div><div class='ctx'> 	unlock_mount_hash();</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -2228,63 +2662,171 @@ static int attach_recursive_mnt(struct mount *source_mnt,</div><div class='ctx'> 	ns-&gt;pending_mounts = 0;</div><div class='ctx'> </div><div class='ctx'> 	read_seqlock_excl(&amp;mount_lock);</div><div class='del'>-	put_mountpoint(smp);</div><div class='add'>+	unpin_mountpoint(&amp;root);</div><div class='ctx'> 	read_sequnlock_excl(&amp;mount_lock);</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct mountpoint *lock_mount(struct path *path)</div><div class='add'>+static inline struct mount *where_to_mount(const struct path *path,</div><div class='add'>+					   struct dentry **dentry,</div><div class='add'>+					   bool beneath)</div><div class='ctx'> {</div><div class='del'>-	struct vfsmount *mnt;</div><div class='del'>-	struct dentry *dentry = path-&gt;dentry;</div><div class='del'>-retry:</div><div class='del'>-	inode_lock(dentry-&gt;d_inode);</div><div class='del'>-	if (unlikely(cant_mount(dentry))) {</div><div class='del'>-		inode_unlock(dentry-&gt;d_inode);</div><div class='del'>-		return ERR_PTR(-ENOENT);</div><div class='add'>+	struct mount *m;</div><div class='add'>+</div><div class='add'>+	if (unlikely(beneath)) {</div><div class='add'>+		m = topmost_overmount(real_mount(path-&gt;mnt));</div><div class='add'>+		*dentry = m-&gt;mnt_mountpoint;</div><div class='add'>+		return m-&gt;mnt_parent;</div><div class='ctx'> 	}</div><div class='del'>-	namespace_lock();</div><div class='del'>-	mnt = lookup_mnt(path);</div><div class='del'>-	if (likely(!mnt)) {</div><div class='del'>-		struct mountpoint *mp = get_mountpoint(dentry);</div><div class='del'>-		if (IS_ERR(mp)) {</div><div class='add'>+	m = __lookup_mnt(path-&gt;mnt, path-&gt;dentry);</div><div class='add'>+	if (unlikely(m)) {</div><div class='add'>+		m = topmost_overmount(m);</div><div class='add'>+		*dentry = m-&gt;mnt.mnt_root;</div><div class='add'>+		return m;</div><div class='add'>+	}</div><div class='add'>+	*dentry = path-&gt;dentry;</div><div class='add'>+	return real_mount(path-&gt;mnt);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * do_lock_mount - acquire environment for mounting</div><div class='add'>+ * @path:	target path</div><div class='add'>+ * @res:	context to set up</div><div class='add'>+ * @beneath:	whether the intention is to mount beneath @path</div><div class='add'>+ *</div><div class='add'>+ * To mount something at given location, we need</div><div class='add'>+ *	namespace_sem locked exclusive</div><div class='add'>+ *	inode of dentry we are mounting on locked exclusive</div><div class='add'>+ *	struct mountpoint for that dentry</div><div class='add'>+ *	struct mount we are mounting on</div><div class='add'>+ *</div><div class='add'>+ * Results are stored in caller-supplied context (pinned_mountpoint);</div><div class='add'>+ * on success we have res-&gt;parent and res-&gt;mp pointing to parent and</div><div class='add'>+ * mountpoint respectively and res-&gt;node inserted into the -&gt;m_list</div><div class='add'>+ * of the mountpoint, making sure the mountpoint won't disappear.</div><div class='add'>+ * On failure we have res-&gt;parent set to ERR_PTR(-E...), res-&gt;mp</div><div class='add'>+ * left NULL, res-&gt;node - empty.</div><div class='add'>+ * In case of success do_lock_mount returns with locks acquired (in</div><div class='add'>+ * proper order - inode lock nests outside of namespace_sem).</div><div class='add'>+ *</div><div class='add'>+ * Request to mount on overmounted location is treated as "mount on</div><div class='add'>+ * top of whatever's overmounting it"; request to mount beneath</div><div class='add'>+ * a location - "mount immediately beneath the topmost mount at that</div><div class='add'>+ * place".</div><div class='add'>+ *</div><div class='add'>+ * In all cases the location must not have been unmounted and the</div><div class='add'>+ * chosen mountpoint must be allowed to be mounted on.  For "beneath"</div><div class='add'>+ * case we also require the location to be at the root of a mount</div><div class='add'>+ * that has a parent (i.e. is not a root of some namespace).</div><div class='add'>+ */</div><div class='add'>+static void do_lock_mount(const struct path *path,</div><div class='add'>+			  struct pinned_mountpoint *res,</div><div class='add'>+			  bool beneath)</div><div class='add'>+{</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	if (unlikely(beneath) &amp;&amp; !path_mounted(path)) {</div><div class='add'>+		res-&gt;parent = ERR_PTR(-EINVAL);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		struct dentry *dentry, *d;</div><div class='add'>+		struct mount *m, *n;</div><div class='add'>+</div><div class='add'>+		scoped_guard(mount_locked_reader) {</div><div class='add'>+			m = where_to_mount(path, &amp;dentry, beneath);</div><div class='add'>+			if (&amp;m-&gt;mnt != path-&gt;mnt) {</div><div class='add'>+				mntget(&amp;m-&gt;mnt);</div><div class='add'>+				dget(dentry);</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		inode_lock(dentry-&gt;d_inode);</div><div class='add'>+		namespace_lock();</div><div class='add'>+</div><div class='add'>+		// check if the chain of mounts (if any) has changed.</div><div class='add'>+		scoped_guard(mount_locked_reader)</div><div class='add'>+			n = where_to_mount(path, &amp;d, beneath);</div><div class='add'>+</div><div class='add'>+		if (unlikely(n != m || dentry != d))</div><div class='add'>+			err = -EAGAIN;		// something moved, retry</div><div class='add'>+		else if (unlikely(cant_mount(dentry) || !is_mounted(path-&gt;mnt)))</div><div class='add'>+			err = -ENOENT;		// not to be mounted on</div><div class='add'>+		else if (beneath &amp;&amp; &amp;m-&gt;mnt == path-&gt;mnt &amp;&amp; !m-&gt;overmount)</div><div class='add'>+			err = -EINVAL;</div><div class='add'>+		else</div><div class='add'>+			err = get_mountpoint(dentry, res);</div><div class='add'>+</div><div class='add'>+		if (unlikely(err)) {</div><div class='add'>+			res-&gt;parent = ERR_PTR(err);</div><div class='ctx'> 			namespace_unlock();</div><div class='ctx'> 			inode_unlock(dentry-&gt;d_inode);</div><div class='del'>-			return mp;</div><div class='add'>+		} else {</div><div class='add'>+			res-&gt;parent = m;</div><div class='ctx'> 		}</div><div class='del'>-		return mp;</div><div class='del'>-	}</div><div class='del'>-	namespace_unlock();</div><div class='del'>-	inode_unlock(path-&gt;dentry-&gt;d_inode);</div><div class='del'>-	path_put(path);</div><div class='del'>-	path-&gt;mnt = mnt;</div><div class='del'>-	dentry = path-&gt;dentry = dget(mnt-&gt;mnt_root);</div><div class='del'>-	goto retry;</div><div class='add'>+		/*</div><div class='add'>+		 * Drop the temporary references.  This is subtle - on success</div><div class='add'>+		 * we are doing that under namespace_sem, which would normally</div><div class='add'>+		 * be forbidden.  However, in that case we are guaranteed that</div><div class='add'>+		 * refcounts won't reach zero, since we know that path-&gt;mnt</div><div class='add'>+		 * is mounted and thus all mounts reachable from it are pinned</div><div class='add'>+		 * and stable, along with their mountpoints and roots.</div><div class='add'>+		 */</div><div class='add'>+		if (&amp;m-&gt;mnt != path-&gt;mnt) {</div><div class='add'>+			dput(dentry);</div><div class='add'>+			mntput(&amp;m-&gt;mnt);</div><div class='add'>+		}</div><div class='add'>+	} while (err == -EAGAIN);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void unlock_mount(struct mountpoint *where)</div><div class='add'>+static void __unlock_mount(struct pinned_mountpoint *m)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *dentry = where-&gt;m_dentry;</div><div class='del'>-</div><div class='add'>+	inode_unlock(m-&gt;mp-&gt;m_dentry-&gt;d_inode);</div><div class='ctx'> 	read_seqlock_excl(&amp;mount_lock);</div><div class='del'>-	put_mountpoint(where);</div><div class='add'>+	unpin_mountpoint(m);</div><div class='ctx'> 	read_sequnlock_excl(&amp;mount_lock);</div><div class='del'>-</div><div class='ctx'> 	namespace_unlock();</div><div class='del'>-	inode_unlock(dentry-&gt;d_inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int graft_tree(struct mount *mnt, struct mount *p, struct mountpoint *mp)</div><div class='add'>+static inline void unlock_mount(struct pinned_mountpoint *m)</div><div class='add'>+{</div><div class='add'>+	if (!IS_ERR(m-&gt;parent))</div><div class='add'>+		__unlock_mount(m);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define LOCK_MOUNT_MAYBE_BENEATH(mp, path, beneath) \</div><div class='add'>+	struct pinned_mountpoint mp __cleanup(unlock_mount) = {}; \</div><div class='add'>+	do_lock_mount((path), &amp;mp, (beneath))</div><div class='add'>+#define LOCK_MOUNT(mp, path) LOCK_MOUNT_MAYBE_BENEATH(mp, (path), false)</div><div class='add'>+#define LOCK_MOUNT_EXACT(mp, path) \</div><div class='add'>+	struct pinned_mountpoint mp __cleanup(unlock_mount) = {}; \</div><div class='add'>+	lock_mount_exact((path), &amp;mp)</div><div class='add'>+</div><div class='add'>+static int graft_tree(struct mount *mnt, const struct pinned_mountpoint *mp)</div><div class='ctx'> {</div><div class='ctx'> 	if (mnt-&gt;mnt.mnt_sb-&gt;s_flags &amp; SB_NOUSER)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	if (d_is_dir(mp-&gt;m_dentry) !=</div><div class='add'>+	if (d_is_dir(mp-&gt;mp-&gt;m_dentry) !=</div><div class='ctx'> 	      d_is_dir(mnt-&gt;mnt.mnt_root))</div><div class='ctx'> 		return -ENOTDIR;</div><div class='ctx'> </div><div class='del'>-	return attach_recursive_mnt(mnt, p, mp, false);</div><div class='add'>+	return attach_recursive_mnt(mnt, mp);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int may_change_propagation(const struct mount *m)</div><div class='add'>+{</div><div class='add'>+        struct mnt_namespace *ns = m-&gt;mnt_ns;</div><div class='add'>+</div><div class='add'>+	 // it must be mounted in some namespace</div><div class='add'>+	 if (IS_ERR_OR_NULL(ns))         // is_mounted()</div><div class='add'>+		 return -EINVAL;</div><div class='add'>+	 // and the caller must be admin in userns of that namespace</div><div class='add'>+	 if (!ns_capable(ns-&gt;user_ns, CAP_SYS_ADMIN))</div><div class='add'>+		 return -EPERM;</div><div class='add'>+	 return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2307,71 +2849,131 @@ static int flags_to_propagation_type(int ms_flags)</div><div class='ctx'> /*</div><div class='ctx'>  * recursively change the type of the mountpoint.</div><div class='ctx'>  */</div><div class='del'>-static int do_change_type(struct path *path, int ms_flags)</div><div class='add'>+static int do_change_type(const struct path *path, int ms_flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct mount *m;</div><div class='ctx'> 	struct mount *mnt = real_mount(path-&gt;mnt);</div><div class='ctx'> 	int recurse = ms_flags &amp; MS_REC;</div><div class='ctx'> 	int type;</div><div class='del'>-	int err = 0;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='del'>-	if (path-&gt;dentry != path-&gt;mnt-&gt;mnt_root)</div><div class='add'>+	if (!path_mounted(path))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	type = flags_to_propagation_type(ms_flags);</div><div class='ctx'> 	if (!type)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	namespace_lock();</div><div class='add'>+	guard(namespace_excl)();</div><div class='add'>+</div><div class='add'>+	err = may_change_propagation(mnt);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='ctx'> 	if (type == MS_SHARED) {</div><div class='ctx'> 		err = invent_group_ids(mnt, recurse);</div><div class='ctx'> 		if (err)</div><div class='del'>-			goto out_unlock;</div><div class='add'>+			return err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	lock_mount_hash();</div><div class='ctx'> 	for (m = mnt; m; m = (recurse ? next_mnt(m, mnt) : NULL))</div><div class='ctx'> 		change_mnt_propagation(m, type);</div><div class='del'>-	unlock_mount_hash();</div><div class='ctx'> </div><div class='del'>- out_unlock:</div><div class='del'>-	namespace_unlock();</div><div class='del'>-	return err;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* may_copy_tree() - check if a mount tree can be copied</div><div class='add'>+ * @path: path to the mount tree to be copied</div><div class='add'>+ *</div><div class='add'>+ * This helper checks if the caller may copy the mount tree starting</div><div class='add'>+ * from @path-&gt;mnt. The caller may copy the mount tree under the</div><div class='add'>+ * following circumstances:</div><div class='add'>+ *</div><div class='add'>+ * (1) The caller is located in the mount namespace of the mount tree.</div><div class='add'>+ *     This also implies that the mount does not belong to an anonymous</div><div class='add'>+ *     mount namespace.</div><div class='add'>+ * (2) The caller tries to copy an nfs mount referring to a mount</div><div class='add'>+ *     namespace, i.e., the caller is trying to copy a mount namespace</div><div class='add'>+ *     entry from nsfs.</div><div class='add'>+ * (3) The caller tries to copy a pidfs mount referring to a pidfd.</div><div class='add'>+ * (4) The caller is trying to copy a mount tree that belongs to an</div><div class='add'>+ *     anonymous mount namespace.</div><div class='add'>+ *</div><div class='add'>+ *     For that to be safe, this helper enforces that the origin mount</div><div class='add'>+ *     namespace the anonymous mount namespace was created from is the</div><div class='add'>+ *     same as the caller's mount namespace by comparing the sequence</div><div class='add'>+ *     numbers.</div><div class='add'>+ *</div><div class='add'>+ *     This is not strictly necessary. The current semantics of the new</div><div class='add'>+ *     mount api enforce that the caller must be located in the same</div><div class='add'>+ *     mount namespace as the mount tree it interacts with. Using the</div><div class='add'>+ *     origin sequence number preserves these semantics even for</div><div class='add'>+ *     anonymous mount namespaces. However, one could envision extending</div><div class='add'>+ *     the api to directly operate across mount namespace if needed.</div><div class='add'>+ *</div><div class='add'>+ *     The ownership of a non-anonymous mount namespace such as the</div><div class='add'>+ *     caller's cannot change.</div><div class='add'>+ *     =&gt; We know that the caller's mount namespace is stable.</div><div class='add'>+ *</div><div class='add'>+ *     If the origin sequence number of the anonymous mount namespace is</div><div class='add'>+ *     the same as the sequence number of the caller's mount namespace.</div><div class='add'>+ *     =&gt; The owning namespaces are the same.</div><div class='add'>+ *</div><div class='add'>+ *     ==&gt; The earlier capability check on the owning namespace of the</div><div class='add'>+ *         caller's mount namespace ensures that the caller has the</div><div class='add'>+ *         ability to copy the mount tree.</div><div class='add'>+ *</div><div class='add'>+ * Returns true if the mount tree can be copied, false otherwise.</div><div class='add'>+ */</div><div class='add'>+static inline bool may_copy_tree(const struct path *path)</div><div class='add'>+{</div><div class='add'>+	struct mount *mnt = real_mount(path-&gt;mnt);</div><div class='add'>+	const struct dentry_operations *d_op;</div><div class='add'>+</div><div class='add'>+	if (check_mnt(mnt))</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	d_op = path-&gt;dentry-&gt;d_op;</div><div class='add'>+	if (d_op == &amp;ns_dentry_operations)</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	if (d_op == &amp;pidfs_dentry_operations)</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	if (!is_mounted(path-&gt;mnt))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	return check_anonymous_mnt(mnt);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct mount *__do_loopback(struct path *old_path, int recurse)</div><div class='add'>+</div><div class='add'>+static struct mount *__do_loopback(const struct path *old_path, int recurse)</div><div class='ctx'> {</div><div class='del'>-	struct mount *mnt = ERR_PTR(-EINVAL), *old = real_mount(old_path-&gt;mnt);</div><div class='add'>+	struct mount *old = real_mount(old_path-&gt;mnt);</div><div class='ctx'> </div><div class='ctx'> 	if (IS_MNT_UNBINDABLE(old))</div><div class='del'>-		return mnt;</div><div class='add'>+		return ERR_PTR(-EINVAL);</div><div class='ctx'> </div><div class='del'>-	if (!check_mnt(old) &amp;&amp; old_path-&gt;dentry-&gt;d_op != &amp;ns_dentry_operations)</div><div class='del'>-		return mnt;</div><div class='add'>+	if (!may_copy_tree(old_path))</div><div class='add'>+		return ERR_PTR(-EINVAL);</div><div class='ctx'> </div><div class='del'>-	if (!recurse &amp;&amp; has_locked_children(old, old_path-&gt;dentry))</div><div class='del'>-		return mnt;</div><div class='add'>+	if (!recurse &amp;&amp; __has_locked_children(old, old_path-&gt;dentry))</div><div class='add'>+		return ERR_PTR(-EINVAL);</div><div class='ctx'> </div><div class='ctx'> 	if (recurse)</div><div class='del'>-		mnt = copy_tree(old, old_path-&gt;dentry, CL_COPY_MNT_NS_FILE);</div><div class='add'>+		return copy_tree(old, old_path-&gt;dentry, CL_COPY_MNT_NS_FILE);</div><div class='ctx'> 	else</div><div class='del'>-		mnt = clone_mnt(old, old_path-&gt;dentry, 0);</div><div class='del'>-</div><div class='del'>-	if (!IS_ERR(mnt))</div><div class='del'>-		mnt-&gt;mnt.mnt_flags &amp;= ~MNT_LOCKED;</div><div class='del'>-</div><div class='del'>-	return mnt;</div><div class='add'>+		return clone_mnt(old, old_path-&gt;dentry, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * do loopback mount.</div><div class='ctx'>  */</div><div class='del'>-static int do_loopback(struct path *path, const char *old_name,</div><div class='del'>-				int recurse)</div><div class='add'>+static int do_loopback(const struct path *path, const char *old_name,</div><div class='add'>+		       int recurse)</div><div class='ctx'> {</div><div class='del'>-	struct path old_path;</div><div class='del'>-	struct mount *mnt = NULL, *parent;</div><div class='del'>-	struct mountpoint *mp;</div><div class='add'>+	struct path old_path __free(path_put) = {};</div><div class='add'>+	struct mount *mnt = NULL;</div><div class='ctx'> 	int err;</div><div class='ctx'> 	if (!old_name || !*old_name)</div><div class='ctx'> 		return -EINVAL;</div><div class='hunk'>@@ -2379,70 +2981,78 @@ static int do_loopback(struct path *path, const char *old_name,</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	err = -EINVAL;</div><div class='ctx'> 	if (mnt_ns_loop(old_path.dentry))</div><div class='del'>-		goto out;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	mp = lock_mount(path);</div><div class='del'>-	if (IS_ERR(mp)) {</div><div class='del'>-		err = PTR_ERR(mp);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	LOCK_MOUNT(mp, path);</div><div class='add'>+	if (IS_ERR(mp.parent))</div><div class='add'>+		return PTR_ERR(mp.parent);</div><div class='ctx'> </div><div class='del'>-	parent = real_mount(path-&gt;mnt);</div><div class='del'>-	if (!check_mnt(parent))</div><div class='del'>-		goto out2;</div><div class='add'>+	if (!check_mnt(mp.parent))</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	mnt = __do_loopback(&amp;old_path, recurse);</div><div class='del'>-	if (IS_ERR(mnt)) {</div><div class='del'>-		err = PTR_ERR(mnt);</div><div class='del'>-		goto out2;</div><div class='del'>-	}</div><div class='add'>+	if (IS_ERR(mnt))</div><div class='add'>+		return PTR_ERR(mnt);</div><div class='ctx'> </div><div class='del'>-	err = graft_tree(mnt, parent, mp);</div><div class='add'>+	err = graft_tree(mnt, &amp;mp);</div><div class='ctx'> 	if (err) {</div><div class='ctx'> 		lock_mount_hash();</div><div class='ctx'> 		umount_tree(mnt, UMOUNT_SYNC);</div><div class='ctx'> 		unlock_mount_hash();</div><div class='ctx'> 	}</div><div class='del'>-out2:</div><div class='del'>-	unlock_mount(mp);</div><div class='del'>-out:</div><div class='del'>-	path_put(&amp;old_path);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct file *open_detached_copy(struct path *path, bool recursive)</div><div class='add'>+static struct mnt_namespace *get_detached_copy(const struct path *path, bool recursive)</div><div class='ctx'> {</div><div class='del'>-	struct user_namespace *user_ns = current-&gt;nsproxy-&gt;mnt_ns-&gt;user_ns;</div><div class='del'>-	struct mnt_namespace *ns = alloc_mnt_ns(user_ns, true);</div><div class='add'>+	struct mnt_namespace *ns, *mnt_ns = current-&gt;nsproxy-&gt;mnt_ns, *src_mnt_ns;</div><div class='add'>+	struct user_namespace *user_ns = mnt_ns-&gt;user_ns;</div><div class='ctx'> 	struct mount *mnt, *p;</div><div class='del'>-	struct file *file;</div><div class='ctx'> </div><div class='add'>+	ns = alloc_mnt_ns(user_ns, true);</div><div class='ctx'> 	if (IS_ERR(ns))</div><div class='del'>-		return ERR_CAST(ns);</div><div class='add'>+		return ns;</div><div class='add'>+</div><div class='add'>+	guard(namespace_excl)();</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Record the sequence number of the source mount namespace.</div><div class='add'>+	 * This needs to hold namespace_sem to ensure that the mount</div><div class='add'>+	 * doesn't get attached.</div><div class='add'>+	 */</div><div class='add'>+	if (is_mounted(path-&gt;mnt)) {</div><div class='add'>+		src_mnt_ns = real_mount(path-&gt;mnt)-&gt;mnt_ns;</div><div class='add'>+		if (is_anon_ns(src_mnt_ns))</div><div class='add'>+			ns-&gt;seq_origin = src_mnt_ns-&gt;seq_origin;</div><div class='add'>+		else</div><div class='add'>+			ns-&gt;seq_origin = src_mnt_ns-&gt;ns.ns_id;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	namespace_lock();</div><div class='ctx'> 	mnt = __do_loopback(path, recursive);</div><div class='ctx'> 	if (IS_ERR(mnt)) {</div><div class='del'>-		namespace_unlock();</div><div class='del'>-		free_mnt_ns(ns);</div><div class='add'>+		emptied_ns = ns;</div><div class='ctx'> 		return ERR_CAST(mnt);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	lock_mount_hash();</div><div class='ctx'> 	for (p = mnt; p; p = next_mnt(p, mnt)) {</div><div class='del'>-		p-&gt;mnt_ns = ns;</div><div class='del'>-		ns-&gt;mounts++;</div><div class='add'>+		mnt_add_to_ns(ns, p);</div><div class='add'>+		ns-&gt;nr_mounts++;</div><div class='ctx'> 	}</div><div class='ctx'> 	ns-&gt;root = mnt;</div><div class='del'>-	list_add_tail(&amp;ns-&gt;list, &amp;mnt-&gt;mnt_list);</div><div class='del'>-	mntget(&amp;mnt-&gt;mnt);</div><div class='del'>-	unlock_mount_hash();</div><div class='del'>-	namespace_unlock();</div><div class='add'>+	return ns;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct file *open_detached_copy(struct path *path, bool recursive)</div><div class='add'>+{</div><div class='add'>+	struct mnt_namespace *ns = get_detached_copy(path, recursive);</div><div class='add'>+	struct file *file;</div><div class='add'>+</div><div class='add'>+	if (IS_ERR(ns))</div><div class='add'>+		return ERR_CAST(ns);</div><div class='ctx'> </div><div class='ctx'> 	mntput(path-&gt;mnt);</div><div class='del'>-	path-&gt;mnt = &amp;mnt-&gt;mnt;</div><div class='add'>+	path-&gt;mnt = mntget(&amp;ns-&gt;root-&gt;mnt);</div><div class='ctx'> 	file = dentry_open(path, O_PATH, current_cred());</div><div class='ctx'> 	if (IS_ERR(file))</div><div class='ctx'> 		dissolve_on_fput(path-&gt;mnt);</div><div class='hunk'>@@ -2451,24 +3061,22 @@ static struct file *open_detached_copy(struct path *path, bool recursive)</div><div class='ctx'> 	return file;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-SYSCALL_DEFINE3(open_tree, int, dfd, const char __user *, filename, unsigned, flags)</div><div class='add'>+static struct file *vfs_open_tree(int dfd, const char __user *filename, unsigned int flags)</div><div class='ctx'> {</div><div class='del'>-	struct file *file;</div><div class='del'>-	struct path path;</div><div class='add'>+	int ret;</div><div class='add'>+	struct path path __free(path_put) = {};</div><div class='ctx'> 	int lookup_flags = LOOKUP_AUTOMOUNT | LOOKUP_FOLLOW;</div><div class='ctx'> 	bool detached = flags &amp; OPEN_TREE_CLONE;</div><div class='del'>-	int error;</div><div class='del'>-	int fd;</div><div class='ctx'> </div><div class='ctx'> 	BUILD_BUG_ON(OPEN_TREE_CLOEXEC != O_CLOEXEC);</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; ~(AT_EMPTY_PATH | AT_NO_AUTOMOUNT | AT_RECURSIVE |</div><div class='ctx'> 		      AT_SYMLINK_NOFOLLOW | OPEN_TREE_CLONE |</div><div class='ctx'> 		      OPEN_TREE_CLOEXEC))</div><div class='del'>-		return -EINVAL;</div><div class='add'>+		return ERR_PTR(-EINVAL);</div><div class='ctx'> </div><div class='ctx'> 	if ((flags &amp; (AT_RECURSIVE | OPEN_TREE_CLONE)) == AT_RECURSIVE)</div><div class='del'>-		return -EINVAL;</div><div class='add'>+		return ERR_PTR(-EINVAL);</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; AT_NO_AUTOMOUNT)</div><div class='ctx'> 		lookup_flags &amp;= ~LOOKUP_AUTOMOUNT;</div><div class='hunk'>@@ -2478,28 +3086,21 @@ SYSCALL_DEFINE3(open_tree, int, dfd, const char __user *, filename, unsigned, fl</div><div class='ctx'> 		lookup_flags |= LOOKUP_EMPTY;</div><div class='ctx'> </div><div class='ctx'> 	if (detached &amp;&amp; !may_mount())</div><div class='del'>-		return -EPERM;</div><div class='add'>+		return ERR_PTR(-EPERM);</div><div class='ctx'> </div><div class='del'>-	fd = get_unused_fd_flags(flags &amp; O_CLOEXEC);</div><div class='del'>-	if (fd &lt; 0)</div><div class='del'>-		return fd;</div><div class='add'>+	ret = user_path_at(dfd, filename, lookup_flags, &amp;path);</div><div class='add'>+	if (unlikely(ret))</div><div class='add'>+		return ERR_PTR(ret);</div><div class='ctx'> </div><div class='del'>-	error = user_path_at(dfd, filename, lookup_flags, &amp;path);</div><div class='del'>-	if (unlikely(error)) {</div><div class='del'>-		file = ERR_PTR(error);</div><div class='del'>-	} else {</div><div class='del'>-		if (detached)</div><div class='del'>-			file = open_detached_copy(&amp;path, flags &amp; AT_RECURSIVE);</div><div class='del'>-		else</div><div class='del'>-			file = dentry_open(&amp;path, O_PATH, current_cred());</div><div class='del'>-		path_put(&amp;path);</div><div class='del'>-	}</div><div class='del'>-	if (IS_ERR(file)) {</div><div class='del'>-		put_unused_fd(fd);</div><div class='del'>-		return PTR_ERR(file);</div><div class='del'>-	}</div><div class='del'>-	fd_install(fd, file);</div><div class='del'>-	return fd;</div><div class='add'>+	if (detached)</div><div class='add'>+		return open_detached_copy(&amp;path, flags &amp; AT_RECURSIVE);</div><div class='add'>+</div><div class='add'>+	return dentry_open(&amp;path, O_PATH, current_cred());</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+SYSCALL_DEFINE3(open_tree, int, dfd, const char __user *, filename, unsigned, flags)</div><div class='add'>+{</div><div class='add'>+	return FD_ADD(flags, vfs_open_tree(dfd, filename, flags));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2556,25 +3157,33 @@ static void set_mount_attributes(struct mount *mnt, unsigned int mnt_flags)</div><div class='ctx'> 	touch_mnt_namespace(mnt-&gt;mnt_ns);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void mnt_warn_timestamp_expiry(struct path *mountpoint, struct vfsmount *mnt)</div><div class='add'>+static void mnt_warn_timestamp_expiry(const struct path *mountpoint,</div><div class='add'>+				      struct vfsmount *mnt)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = mnt-&gt;mnt_sb;</div><div class='ctx'> </div><div class='ctx'> 	if (!__mnt_is_readonly(mnt) &amp;&amp;</div><div class='add'>+	   (!(sb-&gt;s_iflags &amp; SB_I_TS_EXPIRY_WARNED)) &amp;&amp;</div><div class='ctx'> 	   (ktime_get_real_seconds() + TIME_UPTIME_SEC_MAX &gt; sb-&gt;s_time_max)) {</div><div class='del'>-		char *buf = (char *)__get_free_page(GFP_KERNEL);</div><div class='del'>-		char *mntpath = buf ? d_path(mountpoint, buf, PAGE_SIZE) : ERR_PTR(-ENOMEM);</div><div class='del'>-		struct tm tm;</div><div class='add'>+		char *buf, *mntpath;</div><div class='ctx'> </div><div class='del'>-		time64_to_tm(sb-&gt;s_time_max, 0, &amp;tm);</div><div class='add'>+		buf = (char *)__get_free_page(GFP_KERNEL);</div><div class='add'>+		if (buf)</div><div class='add'>+			mntpath = d_path(mountpoint, buf, PAGE_SIZE);</div><div class='add'>+		else</div><div class='add'>+			mntpath = ERR_PTR(-ENOMEM);</div><div class='add'>+		if (IS_ERR(mntpath))</div><div class='add'>+			mntpath = "(unknown)";</div><div class='ctx'> </div><div class='del'>-		pr_warn("%s filesystem being %s at %s supports timestamps until %04ld (0x%llx)\n",</div><div class='add'>+		pr_warn("%s filesystem being %s at %s supports timestamps until %ptTd (0x%llx)\n",</div><div class='ctx'> 			sb-&gt;s_type-&gt;name,</div><div class='ctx'> 			is_mounted(mnt) ? "remounted" : "mounted",</div><div class='del'>-			mntpath,</div><div class='del'>-			tm.tm_year+1900, (unsigned long long)sb-&gt;s_time_max);</div><div class='add'>+			mntpath, &amp;sb-&gt;s_time_max,</div><div class='add'>+			(unsigned long long)sb-&gt;s_time_max);</div><div class='ctx'> </div><div class='del'>-		free_page((unsigned long)buf);</div><div class='add'>+		sb-&gt;s_iflags |= SB_I_TS_EXPIRY_WARNED;</div><div class='add'>+		if (buf)</div><div class='add'>+			free_page((unsigned long)buf);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2583,7 +3192,7 @@ static void mnt_warn_timestamp_expiry(struct path *mountpoint, struct vfsmount *</div><div class='ctx'>  * superblock it refers to.  This is triggered by specifying MS_REMOUNT|MS_BIND</div><div class='ctx'>  * to mount(2).</div><div class='ctx'>  */</div><div class='del'>-static int do_reconfigure_mnt(struct path *path, unsigned int mnt_flags)</div><div class='add'>+static int do_reconfigure_mnt(const struct path *path, unsigned int mnt_flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb = path-&gt;mnt-&gt;mnt_sb;</div><div class='ctx'> 	struct mount *mnt = real_mount(path-&gt;mnt);</div><div class='hunk'>@@ -2592,7 +3201,7 @@ static int do_reconfigure_mnt(struct path *path, unsigned int mnt_flags)</div><div class='ctx'> 	if (!check_mnt(mnt))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	if (path-&gt;dentry != mnt-&gt;mnt.mnt_root)</div><div class='add'>+	if (!path_mounted(path))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	if (!can_change_locked_flags(mnt, mnt_flags))</div><div class='hunk'>@@ -2620,7 +3229,7 @@ static int do_reconfigure_mnt(struct path *path, unsigned int mnt_flags)</div><div class='ctx'>  * If you've mounted a non-root directory somewhere and want to do remount</div><div class='ctx'>  * on it - tough luck.</div><div class='ctx'>  */</div><div class='del'>-static int do_remount(struct path *path, int ms_flags, int sb_flags,</div><div class='add'>+static int do_remount(const struct path *path, int sb_flags,</div><div class='ctx'> 		      int mnt_flags, void *data)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='hunk'>@@ -2631,7 +3240,7 @@ static int do_remount(struct path *path, int ms_flags, int sb_flags,</div><div class='ctx'> 	if (!check_mnt(mnt))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	if (path-&gt;dentry != path-&gt;mnt-&gt;mnt_root)</div><div class='add'>+	if (!path_mounted(path))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	if (!can_change_locked_flags(mnt, mnt_flags))</div><div class='hunk'>@@ -2641,7 +3250,12 @@ static int do_remount(struct path *path, int ms_flags, int sb_flags,</div><div class='ctx'> 	if (IS_ERR(fc))</div><div class='ctx'> 		return PTR_ERR(fc);</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Indicate to the filesystem that the remount request is coming</div><div class='add'>+	 * from the legacy mount system call.</div><div class='add'>+	 */</div><div class='ctx'> 	fc-&gt;oldapi = true;</div><div class='add'>+</div><div class='ctx'> 	err = parse_monolithic_mount_data(fc, data);</div><div class='ctx'> 	if (!err) {</div><div class='ctx'> 		down_write(&amp;sb-&gt;s_umount);</div><div class='hunk'>@@ -2673,185 +3287,296 @@ static inline int tree_contains_unbindable(struct mount *mnt)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Check that there aren't references to earlier/same mount namespaces in the</div><div class='del'>- * specified subtree.  Such references can act as pins for mount namespaces</div><div class='del'>- * that aren't checked by the mount-cycle checking code, thereby allowing</div><div class='del'>- * cycles to be made.</div><div class='del'>- */</div><div class='del'>-static bool check_for_nsfs_mounts(struct mount *subtree)</div><div class='del'>-{</div><div class='del'>-	struct mount *p;</div><div class='del'>-	bool ret = false;</div><div class='del'>-</div><div class='del'>-	lock_mount_hash();</div><div class='del'>-	for (p = subtree; p; p = next_mnt(p, subtree))</div><div class='del'>-		if (mnt_ns_loop(p-&gt;mnt.mnt_root))</div><div class='del'>-			goto out;</div><div class='del'>-</div><div class='del'>-	ret = true;</div><div class='del'>-out:</div><div class='del'>-	unlock_mount_hash();</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int do_set_group(struct path *from_path, struct path *to_path)</div><div class='add'>+static int do_set_group(const struct path *from_path, const struct path *to_path)</div><div class='ctx'> {</div><div class='del'>-	struct mount *from, *to;</div><div class='add'>+	struct mount *from = real_mount(from_path-&gt;mnt);</div><div class='add'>+	struct mount *to = real_mount(to_path-&gt;mnt);</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	from = real_mount(from_path-&gt;mnt);</div><div class='del'>-	to = real_mount(to_path-&gt;mnt);</div><div class='del'>-</div><div class='del'>-	namespace_lock();</div><div class='del'>-</div><div class='del'>-	err = -EINVAL;</div><div class='del'>-	/* To and From must be mounted */</div><div class='del'>-	if (!is_mounted(&amp;from-&gt;mnt))</div><div class='del'>-		goto out;</div><div class='del'>-	if (!is_mounted(&amp;to-&gt;mnt))</div><div class='del'>-		goto out;</div><div class='add'>+	guard(namespace_excl)();</div><div class='ctx'> </div><div class='del'>-	err = -EPERM;</div><div class='del'>-	/* We should be allowed to modify mount namespaces of both mounts */</div><div class='del'>-	if (!ns_capable(from-&gt;mnt_ns-&gt;user_ns, CAP_SYS_ADMIN))</div><div class='del'>-		goto out;</div><div class='del'>-	if (!ns_capable(to-&gt;mnt_ns-&gt;user_ns, CAP_SYS_ADMIN))</div><div class='del'>-		goto out;</div><div class='add'>+	err = may_change_propagation(from);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+	err = may_change_propagation(to);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='ctx'> </div><div class='del'>-	err = -EINVAL;</div><div class='ctx'> 	/* To and From paths should be mount roots */</div><div class='del'>-	if (from_path-&gt;dentry != from_path-&gt;mnt-&gt;mnt_root)</div><div class='del'>-		goto out;</div><div class='del'>-	if (to_path-&gt;dentry != to_path-&gt;mnt-&gt;mnt_root)</div><div class='del'>-		goto out;</div><div class='add'>+	if (!path_mounted(from_path))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	if (!path_mounted(to_path))</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	/* Setting sharing groups is only allowed across same superblock */</div><div class='ctx'> 	if (from-&gt;mnt.mnt_sb != to-&gt;mnt.mnt_sb)</div><div class='del'>-		goto out;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	/* From mount root should be wider than To mount root */</div><div class='ctx'> 	if (!is_subdir(to-&gt;mnt.mnt_root, from-&gt;mnt.mnt_root))</div><div class='del'>-		goto out;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	/* From mount should not have locked children in place of To's root */</div><div class='del'>-	if (has_locked_children(from, to-&gt;mnt.mnt_root))</div><div class='del'>-		goto out;</div><div class='add'>+	if (__has_locked_children(from, to-&gt;mnt.mnt_root))</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	/* Setting sharing groups is only allowed on private mounts */</div><div class='ctx'> 	if (IS_MNT_SHARED(to) || IS_MNT_SLAVE(to))</div><div class='del'>-		goto out;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	/* From should not be private */</div><div class='ctx'> 	if (!IS_MNT_SHARED(from) &amp;&amp; !IS_MNT_SLAVE(from))</div><div class='del'>-		goto out;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	if (IS_MNT_SLAVE(from)) {</div><div class='del'>-		struct mount *m = from-&gt;mnt_master;</div><div class='del'>-</div><div class='del'>-		list_add(&amp;to-&gt;mnt_slave, &amp;m-&gt;mnt_slave_list);</div><div class='del'>-		to-&gt;mnt_master = m;</div><div class='add'>+		hlist_add_behind(&amp;to-&gt;mnt_slave, &amp;from-&gt;mnt_slave);</div><div class='add'>+		to-&gt;mnt_master = from-&gt;mnt_master;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (IS_MNT_SHARED(from)) {</div><div class='ctx'> 		to-&gt;mnt_group_id = from-&gt;mnt_group_id;</div><div class='ctx'> 		list_add(&amp;to-&gt;mnt_share, &amp;from-&gt;mnt_share);</div><div class='del'>-		lock_mount_hash();</div><div class='ctx'> 		set_mnt_shared(to);</div><div class='del'>-		unlock_mount_hash();</div><div class='ctx'> 	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	err = 0;</div><div class='del'>-out:</div><div class='del'>-	namespace_unlock();</div><div class='del'>-	return err;</div><div class='add'>+/**</div><div class='add'>+ * path_overmounted - check if path is overmounted</div><div class='add'>+ * @path: path to check</div><div class='add'>+ *</div><div class='add'>+ * Check if path is overmounted, i.e., if there's a mount on top of</div><div class='add'>+ * @path-&gt;mnt with @path-&gt;dentry as mountpoint.</div><div class='add'>+ *</div><div class='add'>+ * Context: namespace_sem must be held at least shared.</div><div class='add'>+ * MUST NOT be called under lock_mount_hash() (there one should just</div><div class='add'>+ * call __lookup_mnt() and check if it returns NULL).</div><div class='add'>+ * Return: If path is overmounted true is returned, false if not.</div><div class='add'>+ */</div><div class='add'>+static inline bool path_overmounted(const struct path *path)</div><div class='add'>+{</div><div class='add'>+	unsigned seq = read_seqbegin(&amp;mount_lock);</div><div class='add'>+	bool no_child;</div><div class='add'>+</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	no_child = !__lookup_mnt(path-&gt;mnt, path-&gt;dentry);</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+	if (need_seqretry(&amp;mount_lock, seq)) {</div><div class='add'>+		read_seqlock_excl(&amp;mount_lock);</div><div class='add'>+		no_child = !__lookup_mnt(path-&gt;mnt, path-&gt;dentry);</div><div class='add'>+		read_sequnlock_excl(&amp;mount_lock);</div><div class='add'>+	}</div><div class='add'>+	return unlikely(!no_child);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int do_move_mount(struct path *old_path, struct path *new_path)</div><div class='add'>+/*</div><div class='add'>+ * Check if there is a possibly empty chain of descent from p1 to p2.</div><div class='add'>+ * Locks: namespace_sem (shared) or mount_lock (read_seqlock_excl).</div><div class='add'>+ */</div><div class='add'>+static bool mount_is_ancestor(const struct mount *p1, const struct mount *p2)</div><div class='ctx'> {</div><div class='del'>-	struct mnt_namespace *ns;</div><div class='del'>-	struct mount *p;</div><div class='del'>-	struct mount *old;</div><div class='del'>-	struct mount *parent;</div><div class='del'>-	struct mountpoint *mp, *old_mp;</div><div class='del'>-	int err;</div><div class='del'>-	bool attached;</div><div class='add'>+	while (p2 != p1 &amp;&amp; mnt_has_parent(p2))</div><div class='add'>+		p2 = p2-&gt;mnt_parent;</div><div class='add'>+	return p2 == p1;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	mp = lock_mount(new_path);</div><div class='del'>-	if (IS_ERR(mp))</div><div class='del'>-		return PTR_ERR(mp);</div><div class='add'>+/**</div><div class='add'>+ * can_move_mount_beneath - check that we can mount beneath the top mount</div><div class='add'>+ * @mnt_from: mount we are trying to move</div><div class='add'>+ * @mnt_to:   mount under which to mount</div><div class='add'>+ * @mp:   mountpoint of @mnt_to</div><div class='add'>+ *</div><div class='add'>+ * - Make sure that nothing can be mounted beneath the caller's current</div><div class='add'>+ *   root or the rootfs of the namespace.</div><div class='add'>+ * - Make sure that the caller can unmount the topmost mount ensuring</div><div class='add'>+ *   that the caller could reveal the underlying mountpoint.</div><div class='add'>+ * - Ensure that nothing has been mounted on top of @mnt_from before we</div><div class='add'>+ *   grabbed @namespace_sem to avoid creating pointless shadow mounts.</div><div class='add'>+ * - Prevent mounting beneath a mount if the propagation relationship</div><div class='add'>+ *   between the source mount, parent mount, and top mount would lead to</div><div class='add'>+ *   nonsensical mount trees.</div><div class='add'>+ *</div><div class='add'>+ * Context: This function expects namespace_lock() to be held.</div><div class='add'>+ * Return: On success 0, and on error a negative error code is returned.</div><div class='add'>+ */</div><div class='add'>+static int can_move_mount_beneath(const struct mount *mnt_from,</div><div class='add'>+				  const struct mount *mnt_to,</div><div class='add'>+				  const struct mountpoint *mp)</div><div class='add'>+{</div><div class='add'>+	struct mount *parent_mnt_to = mnt_to-&gt;mnt_parent;</div><div class='ctx'> </div><div class='del'>-	old = real_mount(old_path-&gt;mnt);</div><div class='del'>-	p = real_mount(new_path-&gt;mnt);</div><div class='del'>-	parent = old-&gt;mnt_parent;</div><div class='del'>-	attached = mnt_has_parent(old);</div><div class='del'>-	old_mp = old-&gt;mnt_mp;</div><div class='del'>-	ns = old-&gt;mnt_ns;</div><div class='add'>+	if (IS_MNT_LOCKED(mnt_to))</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	err = -EINVAL;</div><div class='del'>-	/* The mountpoint must be in our namespace. */</div><div class='del'>-	if (!check_mnt(p))</div><div class='del'>-		goto out;</div><div class='add'>+	/* Avoid creating shadow mounts during mount propagation. */</div><div class='add'>+	if (mnt_from-&gt;overmount)</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	/* The thing moved must be mounted... */</div><div class='del'>-	if (!is_mounted(&amp;old-&gt;mnt))</div><div class='del'>-		goto out;</div><div class='add'>+	/*</div><div class='add'>+	 * Mounting beneath the rootfs only makes sense when the</div><div class='add'>+	 * semantics of pivot_root(".", ".") are used.</div><div class='add'>+	 */</div><div class='add'>+	if (&amp;mnt_to-&gt;mnt == current-&gt;fs-&gt;root.mnt)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	if (parent_mnt_to == current-&gt;nsproxy-&gt;mnt_ns-&gt;root)</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	/* ... and either ours or the root of anon namespace */</div><div class='del'>-	if (!(attached ? check_mnt(old) : is_anon_ns(ns)))</div><div class='del'>-		goto out;</div><div class='add'>+	if (mount_is_ancestor(mnt_to, mnt_from))</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	if (old-&gt;mnt.mnt_flags &amp; MNT_LOCKED)</div><div class='del'>-		goto out;</div><div class='add'>+	/*</div><div class='add'>+	 * If the parent mount propagates to the child mount this would</div><div class='add'>+	 * mean mounting @mnt_from on @mnt_to-&gt;mnt_parent and then</div><div class='add'>+	 * propagating a copy @c of @mnt_from on top of @mnt_to. This</div><div class='add'>+	 * defeats the whole purpose of mounting beneath another mount.</div><div class='add'>+	 */</div><div class='add'>+	if (propagation_would_overmount(parent_mnt_to, mnt_to, mp))</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	if (old_path-&gt;dentry != old_path-&gt;mnt-&gt;mnt_root)</div><div class='del'>-		goto out;</div><div class='add'>+	/*</div><div class='add'>+	 * If @mnt_to-&gt;mnt_parent propagates to @mnt_from this would</div><div class='add'>+	 * mean propagating a copy @c of @mnt_from on top of @mnt_from.</div><div class='add'>+	 * Afterwards @mnt_from would be mounted on top of</div><div class='add'>+	 * @mnt_to-&gt;mnt_parent and @mnt_to would be unmounted from</div><div class='add'>+	 * @mnt-&gt;mnt_parent and remounted on @mnt_from. But since @c is</div><div class='add'>+	 * already mounted on @mnt_from, @mnt_to would ultimately be</div><div class='add'>+	 * remounted on top of @c. Afterwards, @mnt_from would be</div><div class='add'>+	 * covered by a copy @c of @mnt_from and @c would be covered by</div><div class='add'>+	 * @mnt_from itself. This defeats the whole purpose of mounting</div><div class='add'>+	 * @mnt_from beneath @mnt_to.</div><div class='add'>+	 */</div><div class='add'>+	if (check_mnt(mnt_from) &amp;&amp;</div><div class='add'>+	    propagation_would_overmount(parent_mnt_to, mnt_from, mp))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* may_use_mount() - check if a mount tree can be used</div><div class='add'>+ * @mnt: vfsmount to be used</div><div class='add'>+ *</div><div class='add'>+ * This helper checks if the caller may use the mount tree starting</div><div class='add'>+ * from @path-&gt;mnt. The caller may use the mount tree under the</div><div class='add'>+ * following circumstances:</div><div class='add'>+ *</div><div class='add'>+ * (1) The caller is located in the mount namespace of the mount tree.</div><div class='add'>+ *     This also implies that the mount does not belong to an anonymous</div><div class='add'>+ *     mount namespace.</div><div class='add'>+ * (2) The caller is trying to use a mount tree that belongs to an</div><div class='add'>+ *     anonymous mount namespace.</div><div class='add'>+ *</div><div class='add'>+ *     For that to be safe, this helper enforces that the origin mount</div><div class='add'>+ *     namespace the anonymous mount namespace was created from is the</div><div class='add'>+ *     same as the caller's mount namespace by comparing the sequence</div><div class='add'>+ *     numbers.</div><div class='add'>+ *</div><div class='add'>+ *     The ownership of a non-anonymous mount namespace such as the</div><div class='add'>+ *     caller's cannot change.</div><div class='add'>+ *     =&gt; We know that the caller's mount namespace is stable.</div><div class='add'>+ *</div><div class='add'>+ *     If the origin sequence number of the anonymous mount namespace is</div><div class='add'>+ *     the same as the sequence number of the caller's mount namespace.</div><div class='add'>+ *     =&gt; The owning namespaces are the same.</div><div class='add'>+ *</div><div class='add'>+ *     ==&gt; The earlier capability check on the owning namespace of the</div><div class='add'>+ *         caller's mount namespace ensures that the caller has the</div><div class='add'>+ *         ability to use the mount tree.</div><div class='add'>+ *</div><div class='add'>+ * Returns true if the mount tree can be used, false otherwise.</div><div class='add'>+ */</div><div class='add'>+static inline bool may_use_mount(struct mount *mnt)</div><div class='add'>+{</div><div class='add'>+	if (check_mnt(mnt))</div><div class='add'>+		return true;</div><div class='ctx'> </div><div class='del'>-	if (d_is_dir(new_path-&gt;dentry) !=</div><div class='del'>-	    d_is_dir(old_path-&gt;dentry))</div><div class='del'>-		goto out;</div><div class='ctx'> 	/*</div><div class='del'>-	 * Don't move a mount residing in a shared parent.</div><div class='add'>+	 * Make sure that noone unmounted the target path or somehow</div><div class='add'>+	 * managed to get their hands on something purely kernel</div><div class='add'>+	 * internal.</div><div class='ctx'> 	 */</div><div class='del'>-	if (attached &amp;&amp; IS_MNT_SHARED(parent))</div><div class='del'>-		goto out;</div><div class='add'>+	if (!is_mounted(&amp;mnt-&gt;mnt))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	return check_anonymous_mnt(mnt);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int do_move_mount(const struct path *old_path,</div><div class='add'>+			 const struct path *new_path,</div><div class='add'>+			 enum mnt_tree_flags_t flags)</div><div class='add'>+{</div><div class='add'>+	struct mount *old = real_mount(old_path-&gt;mnt);</div><div class='add'>+	int err;</div><div class='add'>+	bool beneath = flags &amp; MNT_TREE_BENEATH;</div><div class='add'>+</div><div class='add'>+	if (!path_mounted(old_path))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	if (d_is_dir(new_path-&gt;dentry) != d_is_dir(old_path-&gt;dentry))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	LOCK_MOUNT_MAYBE_BENEATH(mp, new_path, beneath);</div><div class='add'>+	if (IS_ERR(mp.parent))</div><div class='add'>+		return PTR_ERR(mp.parent);</div><div class='add'>+</div><div class='add'>+	if (check_mnt(old)) {</div><div class='add'>+		/* if the source is in our namespace... */</div><div class='add'>+		/* ... it should be detachable from parent */</div><div class='add'>+		if (!mnt_has_parent(old) || IS_MNT_LOCKED(old))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		/* ... which should not be shared */</div><div class='add'>+		if (IS_MNT_SHARED(old-&gt;mnt_parent))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		/* ... and the target should be in our namespace */</div><div class='add'>+		if (!check_mnt(mp.parent))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+	} else {</div><div class='add'>+		/*</div><div class='add'>+		 * otherwise the source must be the root of some anon namespace.</div><div class='add'>+		 */</div><div class='add'>+		if (!anon_ns_root(old))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		/*</div><div class='add'>+		 * Bail out early if the target is within the same namespace -</div><div class='add'>+		 * subsequent checks would've rejected that, but they lose</div><div class='add'>+		 * some corner cases if we check it early.</div><div class='add'>+		 */</div><div class='add'>+		if (old-&gt;mnt_ns == mp.parent-&gt;mnt_ns)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		/*</div><div class='add'>+		 * Target should be either in our namespace or in an acceptable</div><div class='add'>+		 * anon namespace, sensu check_anonymous_mnt().</div><div class='add'>+		 */</div><div class='add'>+		if (!may_use_mount(mp.parent))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (beneath) {</div><div class='add'>+		struct mount *over = real_mount(new_path-&gt;mnt);</div><div class='add'>+</div><div class='add'>+		if (mp.parent != over-&gt;mnt_parent)</div><div class='add'>+			over = mp.parent-&gt;overmount;</div><div class='add'>+		err = can_move_mount_beneath(old, over, mp.mp);</div><div class='add'>+		if (err)</div><div class='add'>+			return err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Don't move a mount tree containing unbindable mounts to a destination</div><div class='ctx'> 	 * mount which is shared.</div><div class='ctx'> 	 */</div><div class='del'>-	if (IS_MNT_SHARED(p) &amp;&amp; tree_contains_unbindable(old))</div><div class='del'>-		goto out;</div><div class='del'>-	err = -ELOOP;</div><div class='add'>+	if (IS_MNT_SHARED(mp.parent) &amp;&amp; tree_contains_unbindable(old))</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	if (!check_for_nsfs_mounts(old))</div><div class='del'>-		goto out;</div><div class='del'>-	for (; mnt_has_parent(p); p = p-&gt;mnt_parent)</div><div class='del'>-		if (p == old)</div><div class='del'>-			goto out;</div><div class='add'>+		return -ELOOP;</div><div class='add'>+	if (mount_is_ancestor(old, mp.parent))</div><div class='add'>+		return -ELOOP;</div><div class='ctx'> </div><div class='del'>-	err = attach_recursive_mnt(old, real_mount(new_path-&gt;mnt), mp,</div><div class='del'>-				   attached);</div><div class='del'>-	if (err)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	/* if the mount is moved, it should no longer be expire</div><div class='del'>-	 * automatically */</div><div class='del'>-	list_del_init(&amp;old-&gt;mnt_expire);</div><div class='del'>-	if (attached)</div><div class='del'>-		put_mountpoint(old_mp);</div><div class='del'>-out:</div><div class='del'>-	unlock_mount(mp);</div><div class='del'>-	if (!err) {</div><div class='del'>-		if (attached)</div><div class='del'>-			mntput_no_expire(parent);</div><div class='del'>-		else</div><div class='del'>-			free_mnt_ns(ns);</div><div class='del'>-	}</div><div class='del'>-	return err;</div><div class='add'>+	return attach_recursive_mnt(old, &amp;mp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int do_move_mount_old(struct path *path, const char *old_name)</div><div class='add'>+static int do_move_mount_old(const struct path *path, const char *old_name)</div><div class='ctx'> {</div><div class='del'>-	struct path old_path;</div><div class='add'>+	struct path old_path __free(path_put) = {};</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (!old_name || !*old_name)</div><div class='hunk'>@@ -2861,18 +3586,19 @@ static int do_move_mount_old(struct path *path, const char *old_name)</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	err = do_move_mount(&amp;old_path, path);</div><div class='del'>-	path_put(&amp;old_path);</div><div class='del'>-	return err;</div><div class='add'>+	return do_move_mount(&amp;old_path, path, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * add a mount into a namespace's mount tree</div><div class='ctx'>  */</div><div class='del'>-static int do_add_mount(struct mount *newmnt, struct mountpoint *mp,</div><div class='del'>-			struct path *path, int mnt_flags)</div><div class='add'>+static int do_add_mount(struct mount *newmnt, const struct pinned_mountpoint *mp,</div><div class='add'>+			int mnt_flags)</div><div class='ctx'> {</div><div class='del'>-	struct mount *parent = real_mount(path-&gt;mnt);</div><div class='add'>+	struct mount *parent = mp-&gt;parent;</div><div class='add'>+</div><div class='add'>+	if (IS_ERR(parent))</div><div class='add'>+		return PTR_ERR(parent);</div><div class='ctx'> </div><div class='ctx'> 	mnt_flags &amp;= ~MNT_INTERNAL_FLAGS;</div><div class='ctx'> </div><div class='hunk'>@@ -2886,15 +3612,15 @@ static int do_add_mount(struct mount *newmnt, struct mountpoint *mp,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Refuse the same filesystem on the same mount point */</div><div class='del'>-	if (path-&gt;mnt-&gt;mnt_sb == newmnt-&gt;mnt.mnt_sb &amp;&amp;</div><div class='del'>-	    path-&gt;mnt-&gt;mnt_root == path-&gt;dentry)</div><div class='add'>+	if (parent-&gt;mnt.mnt_sb == newmnt-&gt;mnt.mnt_sb &amp;&amp;</div><div class='add'>+	    parent-&gt;mnt.mnt_root == mp-&gt;mp-&gt;m_dentry)</div><div class='ctx'> 		return -EBUSY;</div><div class='ctx'> </div><div class='ctx'> 	if (d_is_symlink(newmnt-&gt;mnt.mnt_root))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	newmnt-&gt;mnt.mnt_flags = mnt_flags;</div><div class='del'>-	return graft_tree(newmnt, parent, mp);</div><div class='add'>+	return graft_tree(newmnt, mp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool mount_too_revealing(const struct super_block *sb, int *new_mnt_flags);</div><div class='hunk'>@@ -2903,40 +3629,32 @@ static bool mount_too_revealing(const struct super_block *sb, int *new_mnt_flags</div><div class='ctx'>  * Create a new mount using a superblock configuration and request it</div><div class='ctx'>  * be added to the namespace tree.</div><div class='ctx'>  */</div><div class='del'>-static int do_new_mount_fc(struct fs_context *fc, struct path *mountpoint,</div><div class='add'>+static int do_new_mount_fc(struct fs_context *fc, const struct path *mountpoint,</div><div class='ctx'> 			   unsigned int mnt_flags)</div><div class='ctx'> {</div><div class='del'>-	struct vfsmount *mnt;</div><div class='del'>-	struct mountpoint *mp;</div><div class='del'>-	struct super_block *sb = fc-&gt;root-&gt;d_sb;</div><div class='add'>+	struct super_block *sb;</div><div class='add'>+	struct vfsmount *mnt __free(mntput) = fc_mount(fc);</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	error = security_sb_kern_mount(sb);</div><div class='del'>-	if (!error &amp;&amp; mount_too_revealing(sb, &amp;mnt_flags))</div><div class='del'>-		error = -EPERM;</div><div class='add'>+	if (IS_ERR(mnt))</div><div class='add'>+		return PTR_ERR(mnt);</div><div class='ctx'> </div><div class='del'>-	if (unlikely(error)) {</div><div class='del'>-		fc_drop_locked(fc);</div><div class='add'>+	sb = fc-&gt;root-&gt;d_sb;</div><div class='add'>+	error = security_sb_kern_mount(sb);</div><div class='add'>+	if (unlikely(error))</div><div class='ctx'> 		return error;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	up_write(&amp;sb-&gt;s_umount);</div><div class='ctx'> </div><div class='del'>-	mnt = vfs_create_mount(fc);</div><div class='del'>-	if (IS_ERR(mnt))</div><div class='del'>-		return PTR_ERR(mnt);</div><div class='add'>+	if (unlikely(mount_too_revealing(sb, &amp;mnt_flags))) {</div><div class='add'>+		errorfcp(fc, "VFS", "Mount too revealing");</div><div class='add'>+		return -EPERM;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	mnt_warn_timestamp_expiry(mountpoint, mnt);</div><div class='ctx'> </div><div class='del'>-	mp = lock_mount(mountpoint);</div><div class='del'>-	if (IS_ERR(mp)) {</div><div class='del'>-		mntput(mnt);</div><div class='del'>-		return PTR_ERR(mp);</div><div class='del'>-	}</div><div class='del'>-	error = do_add_mount(real_mount(mnt), mp, mountpoint, mnt_flags);</div><div class='del'>-	unlock_mount(mp);</div><div class='del'>-	if (error &lt; 0)</div><div class='del'>-		mntput(mnt);</div><div class='add'>+	LOCK_MOUNT(mp, mountpoint);</div><div class='add'>+	error = do_add_mount(real_mount(mnt), &amp;mp, mnt_flags);</div><div class='add'>+	if (!error)</div><div class='add'>+		retain_and_null_ptr(mnt); // consumed on success</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2944,8 +3662,9 @@ static int do_new_mount_fc(struct fs_context *fc, struct path *mountpoint,</div><div class='ctx'>  * create a new mount for userspace and request it to be added into the</div><div class='ctx'>  * namespace's tree</div><div class='ctx'>  */</div><div class='del'>-static int do_new_mount(struct path *path, const char *fstype, int sb_flags,</div><div class='del'>-			int mnt_flags, const char *name, void *data)</div><div class='add'>+static int do_new_mount(const struct path *path, const char *fstype,</div><div class='add'>+			int sb_flags, int mnt_flags,</div><div class='add'>+			const char *name, void *data)</div><div class='ctx'> {</div><div class='ctx'> 	struct file_system_type *type;</div><div class='ctx'> 	struct fs_context *fc;</div><div class='hunk'>@@ -2975,28 +3694,53 @@ static int do_new_mount(struct path *path, const char *fstype, int sb_flags,</div><div class='ctx'> 	if (IS_ERR(fc))</div><div class='ctx'> 		return PTR_ERR(fc);</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Indicate to the filesystem that the mount request is coming</div><div class='add'>+	 * from the legacy mount system call.</div><div class='add'>+	 */</div><div class='add'>+	fc-&gt;oldapi = true;</div><div class='add'>+</div><div class='ctx'> 	if (subtype)</div><div class='del'>-		err = vfs_parse_fs_string(fc, "subtype",</div><div class='del'>-					  subtype, strlen(subtype));</div><div class='add'>+		err = vfs_parse_fs_string(fc, "subtype", subtype);</div><div class='ctx'> 	if (!err &amp;&amp; name)</div><div class='del'>-		err = vfs_parse_fs_string(fc, "source", name, strlen(name));</div><div class='add'>+		err = vfs_parse_fs_string(fc, "source", name);</div><div class='ctx'> 	if (!err)</div><div class='ctx'> 		err = parse_monolithic_mount_data(fc, data);</div><div class='ctx'> 	if (!err &amp;&amp; !mount_capable(fc))</div><div class='ctx'> 		err = -EPERM;</div><div class='ctx'> 	if (!err)</div><div class='del'>-		err = vfs_get_tree(fc);</div><div class='del'>-	if (!err)</div><div class='ctx'> 		err = do_new_mount_fc(fc, path, mnt_flags);</div><div class='ctx'> </div><div class='ctx'> 	put_fs_context(fc);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int finish_automount(struct vfsmount *m, struct path *path)</div><div class='add'>+static void lock_mount_exact(const struct path *path,</div><div class='add'>+			     struct pinned_mountpoint *mp)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dentry = path-&gt;dentry;</div><div class='del'>-	struct mountpoint *mp;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	inode_lock(dentry-&gt;d_inode);</div><div class='add'>+	namespace_lock();</div><div class='add'>+	if (unlikely(cant_mount(dentry)))</div><div class='add'>+		err = -ENOENT;</div><div class='add'>+	else if (path_overmounted(path))</div><div class='add'>+		err = -EBUSY;</div><div class='add'>+	else</div><div class='add'>+		err = get_mountpoint(dentry, mp);</div><div class='add'>+	if (unlikely(err)) {</div><div class='add'>+		namespace_unlock();</div><div class='add'>+		inode_unlock(dentry-&gt;d_inode);</div><div class='add'>+		mp-&gt;parent = ERR_PTR(err);</div><div class='add'>+	} else {</div><div class='add'>+		mp-&gt;parent = real_mount(path-&gt;mnt);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int finish_automount(struct vfsmount *__m, const struct path *path)</div><div class='add'>+{</div><div class='add'>+	struct vfsmount *m __free(mntput) = __m;</div><div class='ctx'> 	struct mount *mnt;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='hunk'>@@ -3006,60 +3750,22 @@ int finish_automount(struct vfsmount *m, struct path *path)</div><div class='ctx'> 		return PTR_ERR(m);</div><div class='ctx'> </div><div class='ctx'> 	mnt = real_mount(m);</div><div class='del'>-	/* The new mount record should have at least 2 refs to prevent it being</div><div class='del'>-	 * expired before we get a chance to add it</div><div class='del'>-	 */</div><div class='del'>-	BUG_ON(mnt_get_count(mnt) &lt; 2);</div><div class='ctx'> </div><div class='del'>-	if (m-&gt;mnt_sb == path-&gt;mnt-&gt;mnt_sb &amp;&amp;</div><div class='del'>-	    m-&gt;mnt_root == dentry) {</div><div class='del'>-		err = -ELOOP;</div><div class='del'>-		goto discard;</div><div class='del'>-	}</div><div class='add'>+	if (m-&gt;mnt_root == path-&gt;dentry)</div><div class='add'>+		return -ELOOP;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * we don't want to use lock_mount() - in this case finding something</div><div class='add'>+	 * we don't want to use LOCK_MOUNT() - in this case finding something</div><div class='ctx'> 	 * that overmounts our mountpoint to be means "quitely drop what we've</div><div class='ctx'> 	 * got", not "try to mount it on top".</div><div class='ctx'> 	 */</div><div class='del'>-	inode_lock(dentry-&gt;d_inode);</div><div class='del'>-	namespace_lock();</div><div class='del'>-	if (unlikely(cant_mount(dentry))) {</div><div class='del'>-		err = -ENOENT;</div><div class='del'>-		goto discard_locked;</div><div class='del'>-	}</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	if (unlikely(__lookup_mnt(path-&gt;mnt, dentry))) {</div><div class='del'>-		rcu_read_unlock();</div><div class='del'>-		err = 0;</div><div class='del'>-		goto discard_locked;</div><div class='del'>-	}</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-	mp = get_mountpoint(dentry);</div><div class='del'>-	if (IS_ERR(mp)) {</div><div class='del'>-		err = PTR_ERR(mp);</div><div class='del'>-		goto discard_locked;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	err = do_add_mount(mnt, mp, path, path-&gt;mnt-&gt;mnt_flags | MNT_SHRINKABLE);</div><div class='del'>-	unlock_mount(mp);</div><div class='del'>-	if (unlikely(err))</div><div class='del'>-		goto discard;</div><div class='del'>-	mntput(m);</div><div class='del'>-	return 0;</div><div class='add'>+	LOCK_MOUNT_EXACT(mp, path);</div><div class='add'>+	if (mp.parent == ERR_PTR(-EBUSY))</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-discard_locked:</div><div class='del'>-	namespace_unlock();</div><div class='del'>-	inode_unlock(dentry-&gt;d_inode);</div><div class='del'>-discard:</div><div class='del'>-	/* remove m from any expiration list it may be on */</div><div class='del'>-	if (!list_empty(&amp;mnt-&gt;mnt_expire)) {</div><div class='del'>-		namespace_lock();</div><div class='del'>-		list_del_init(&amp;mnt-&gt;mnt_expire);</div><div class='del'>-		namespace_unlock();</div><div class='del'>-	}</div><div class='del'>-	mntput(m);</div><div class='del'>-	mntput(m);</div><div class='add'>+	err = do_add_mount(mnt, &amp;mp, path-&gt;mnt-&gt;mnt_flags | MNT_SHRINKABLE);</div><div class='add'>+	if (likely(!err))</div><div class='add'>+		retain_and_null_ptr(m);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3070,11 +3776,8 @@ discard:</div><div class='ctx'>  */</div><div class='ctx'> void mnt_set_expiry(struct vfsmount *mnt, struct list_head *expiry_list)</div><div class='ctx'> {</div><div class='del'>-	namespace_lock();</div><div class='del'>-</div><div class='add'>+	guard(mount_locked_reader)();</div><div class='ctx'> 	list_add_tail(&amp;real_mount(mnt)-&gt;mnt_expire, expiry_list);</div><div class='del'>-</div><div class='del'>-	namespace_unlock();</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(mnt_set_expiry);</div><div class='ctx'> </div><div class='hunk'>@@ -3091,16 +3794,19 @@ void mark_mounts_for_expiry(struct list_head *mounts)</div><div class='ctx'> 	if (list_empty(mounts))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	namespace_lock();</div><div class='del'>-	lock_mount_hash();</div><div class='add'>+	guard(namespace_excl)();</div><div class='add'>+	guard(mount_writer)();</div><div class='ctx'> </div><div class='ctx'> 	/* extract from the expiration list every vfsmount that matches the</div><div class='ctx'> 	 * following criteria:</div><div class='add'>+	 * - already mounted</div><div class='ctx'> 	 * - only referenced by its parent vfsmount</div><div class='ctx'> 	 * - still marked for expiry (marked on the last call here; marks are</div><div class='ctx'> 	 *   cleared by mntput())</div><div class='ctx'> 	 */</div><div class='ctx'> 	list_for_each_entry_safe(mnt, next, mounts, mnt_expire) {</div><div class='add'>+		if (!is_mounted(&amp;mnt-&gt;mnt))</div><div class='add'>+			continue;</div><div class='ctx'> 		if (!xchg(&amp;mnt-&gt;mnt_expiry_mark, 1) ||</div><div class='ctx'> 			propagate_mount_busy(mnt, 1))</div><div class='ctx'> 			continue;</div><div class='hunk'>@@ -3111,8 +3817,6 @@ void mark_mounts_for_expiry(struct list_head *mounts)</div><div class='ctx'> 		touch_mnt_namespace(mnt-&gt;mnt_ns);</div><div class='ctx'> 		umount_tree(mnt, UMOUNT_PROPAGATE|UMOUNT_SYNC);</div><div class='ctx'> 	}</div><div class='del'>-	unlock_mount_hash();</div><div class='del'>-	namespace_unlock();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> EXPORT_SYMBOL_GPL(mark_mounts_for_expiry);</div><div class='hunk'>@@ -3240,7 +3944,7 @@ static char *copy_mount_string(const void __user *data)</div><div class='ctx'>  * Therefore, if this magic number is present, it carries no information</div><div class='ctx'>  * and must be discarded.</div><div class='ctx'>  */</div><div class='del'>-int path_mount(const char *dev_name, struct path *path,</div><div class='add'>+int path_mount(const char *dev_name, const struct path *path,</div><div class='ctx'> 		const char *type_page, unsigned long flags, void *data_page)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int mnt_flags = 0, sb_flags;</div><div class='hunk'>@@ -3307,7 +4011,7 @@ int path_mount(const char *dev_name, struct path *path,</div><div class='ctx'> 	if ((flags &amp; (MS_REMOUNT | MS_BIND)) == (MS_REMOUNT | MS_BIND))</div><div class='ctx'> 		return do_reconfigure_mnt(path, mnt_flags);</div><div class='ctx'> 	if (flags &amp; MS_REMOUNT)</div><div class='del'>-		return do_remount(path, flags, sb_flags, mnt_flags, data_page);</div><div class='add'>+		return do_remount(path, sb_flags, mnt_flags, data_page);</div><div class='ctx'> 	if (flags &amp; MS_BIND)</div><div class='ctx'> 		return do_loopback(path, dev_name, flags &amp; MS_REC);</div><div class='ctx'> 	if (flags &amp; (MS_SHARED | MS_PRIVATE | MS_SLAVE | MS_UNBINDABLE))</div><div class='hunk'>@@ -3319,18 +4023,16 @@ int path_mount(const char *dev_name, struct path *path,</div><div class='ctx'> 			    data_page);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-long do_mount(const char *dev_name, const char __user *dir_name,</div><div class='add'>+int do_mount(const char *dev_name, const char __user *dir_name,</div><div class='ctx'> 		const char *type_page, unsigned long flags, void *data_page)</div><div class='ctx'> {</div><div class='del'>-	struct path path;</div><div class='add'>+	struct path path __free(path_put) = {};</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	ret = user_path_at(AT_FDCWD, dir_name, LOOKUP_FOLLOW, &amp;path);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='del'>-	ret = path_mount(dev_name, &amp;path, type_page, flags, data_page);</div><div class='del'>-	path_put(&amp;path);</div><div class='del'>-	return ret;</div><div class='add'>+	return path_mount(dev_name, &amp;path, type_page, flags, data_page);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct ucounts *inc_mnt_namespaces(struct user_namespace *ns)</div><div class='hunk'>@@ -3346,21 +4048,11 @@ static void dec_mnt_namespaces(struct ucounts *ucounts)</div><div class='ctx'> static void free_mnt_ns(struct mnt_namespace *ns)</div><div class='ctx'> {</div><div class='ctx'> 	if (!is_anon_ns(ns))</div><div class='del'>-		ns_free_inum(&amp;ns-&gt;ns);</div><div class='add'>+		ns_common_free(ns);</div><div class='ctx'> 	dec_mnt_namespaces(ns-&gt;ucounts);</div><div class='del'>-	put_user_ns(ns-&gt;user_ns);</div><div class='del'>-	kfree(ns);</div><div class='add'>+	mnt_ns_tree_remove(ns);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Assign a sequence number so we can detect when we attempt to bind</div><div class='del'>- * mount a reference to an older mount namespace into the current</div><div class='del'>- * mount namespace, preventing reference counting loops.  A 64bit</div><div class='del'>- * number incrementing at 10Ghz will take 12,427 years to wrap which</div><div class='del'>- * is effectively never, so we can ignore the possibility.</div><div class='del'>- */</div><div class='del'>-static atomic64_t mnt_ns_seq = ATOMIC64_INIT(1);</div><div class='del'>-</div><div class='ctx'> static struct mnt_namespace *alloc_mnt_ns(struct user_namespace *user_ns, bool anon)</div><div class='ctx'> {</div><div class='ctx'> 	struct mnt_namespace *new_ns;</div><div class='hunk'>@@ -3376,32 +4068,34 @@ static struct mnt_namespace *alloc_mnt_ns(struct user_namespace *user_ns, bool a</div><div class='ctx'> 		dec_mnt_namespaces(ucounts);</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> 	}</div><div class='del'>-	if (!anon) {</div><div class='del'>-		ret = ns_alloc_inum(&amp;new_ns-&gt;ns);</div><div class='del'>-		if (ret) {</div><div class='del'>-			kfree(new_ns);</div><div class='del'>-			dec_mnt_namespaces(ucounts);</div><div class='del'>-			return ERR_PTR(ret);</div><div class='del'>-		}</div><div class='add'>+</div><div class='add'>+	if (anon)</div><div class='add'>+		ret = ns_common_init_inum(new_ns, MNT_NS_ANON_INO);</div><div class='add'>+	else</div><div class='add'>+		ret = ns_common_init(new_ns);</div><div class='add'>+	if (ret) {</div><div class='add'>+		kfree(new_ns);</div><div class='add'>+		dec_mnt_namespaces(ucounts);</div><div class='add'>+		return ERR_PTR(ret);</div><div class='ctx'> 	}</div><div class='del'>-	new_ns-&gt;ns.ops = &amp;mntns_operations;</div><div class='del'>-	if (!anon)</div><div class='del'>-		new_ns-&gt;seq = atomic64_add_return(1, &amp;mnt_ns_seq);</div><div class='del'>-	refcount_set(&amp;new_ns-&gt;ns.count, 1);</div><div class='del'>-	INIT_LIST_HEAD(&amp;new_ns-&gt;list);</div><div class='add'>+	ns_tree_gen_id(new_ns);</div><div class='add'>+</div><div class='add'>+	new_ns-&gt;is_anon = anon;</div><div class='add'>+	refcount_set(&amp;new_ns-&gt;passive, 1);</div><div class='add'>+	new_ns-&gt;mounts = RB_ROOT;</div><div class='ctx'> 	init_waitqueue_head(&amp;new_ns-&gt;poll);</div><div class='del'>-	spin_lock_init(&amp;new_ns-&gt;ns_lock);</div><div class='ctx'> 	new_ns-&gt;user_ns = get_user_ns(user_ns);</div><div class='ctx'> 	new_ns-&gt;ucounts = ucounts;</div><div class='ctx'> 	return new_ns;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> __latent_entropy</div><div class='del'>-struct mnt_namespace *copy_mnt_ns(unsigned long flags, struct mnt_namespace *ns,</div><div class='add'>+struct mnt_namespace *copy_mnt_ns(u64 flags, struct mnt_namespace *ns,</div><div class='ctx'> 		struct user_namespace *user_ns, struct fs_struct *new_fs)</div><div class='ctx'> {</div><div class='ctx'> 	struct mnt_namespace *new_ns;</div><div class='del'>-	struct vfsmount *rootmnt = NULL, *pwdmnt = NULL;</div><div class='add'>+	struct vfsmount *rootmnt __free(mntput) = NULL;</div><div class='add'>+	struct vfsmount *pwdmnt __free(mntput) = NULL;</div><div class='ctx'> 	struct mount *p, *q;</div><div class='ctx'> 	struct mount *old;</div><div class='ctx'> 	struct mount *new;</div><div class='hunk'>@@ -3420,24 +4114,21 @@ struct mnt_namespace *copy_mnt_ns(unsigned long flags, struct mnt_namespace *ns,</div><div class='ctx'> 	if (IS_ERR(new_ns))</div><div class='ctx'> 		return new_ns;</div><div class='ctx'> </div><div class='del'>-	namespace_lock();</div><div class='add'>+	guard(namespace_excl)();</div><div class='ctx'> 	/* First pass: copy the tree topology */</div><div class='ctx'> 	copy_flags = CL_COPY_UNBINDABLE | CL_EXPIRE;</div><div class='ctx'> 	if (user_ns != ns-&gt;user_ns)</div><div class='del'>-		copy_flags |= CL_SHARED_TO_SLAVE;</div><div class='add'>+		copy_flags |= CL_SLAVE;</div><div class='ctx'> 	new = copy_tree(old, old-&gt;mnt.mnt_root, copy_flags);</div><div class='ctx'> 	if (IS_ERR(new)) {</div><div class='del'>-		namespace_unlock();</div><div class='del'>-		free_mnt_ns(new_ns);</div><div class='add'>+		emptied_ns = new_ns;</div><div class='ctx'> 		return ERR_CAST(new);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (user_ns != ns-&gt;user_ns) {</div><div class='del'>-		lock_mount_hash();</div><div class='add'>+		guard(mount_writer)();</div><div class='ctx'> 		lock_mnt_tree(new);</div><div class='del'>-		unlock_mount_hash();</div><div class='ctx'> 	}</div><div class='ctx'> 	new_ns-&gt;root = new;</div><div class='del'>-	list_add_tail(&amp;new_ns-&gt;list, &amp;new-&gt;mnt_list);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Second pass: switch the tsk-&gt;fs-&gt;* elements and mark new vfsmounts</div><div class='hunk'>@@ -3447,8 +4138,8 @@ struct mnt_namespace *copy_mnt_ns(unsigned long flags, struct mnt_namespace *ns,</div><div class='ctx'> 	p = old;</div><div class='ctx'> 	q = new;</div><div class='ctx'> 	while (p) {</div><div class='del'>-		q-&gt;mnt_ns = new_ns;</div><div class='del'>-		new_ns-&gt;mounts++;</div><div class='add'>+		mnt_add_to_ns(new_ns, q);</div><div class='add'>+		new_ns-&gt;nr_mounts++;</div><div class='ctx'> 		if (new_fs) {</div><div class='ctx'> 			if (&amp;p-&gt;mnt == new_fs-&gt;root.mnt) {</div><div class='ctx'> 				new_fs-&gt;root.mnt = mntget(&amp;q-&gt;mnt);</div><div class='hunk'>@@ -3463,16 +4154,11 @@ struct mnt_namespace *copy_mnt_ns(unsigned long flags, struct mnt_namespace *ns,</div><div class='ctx'> 		q = next_mnt(q, new);</div><div class='ctx'> 		if (!q)</div><div class='ctx'> 			break;</div><div class='add'>+		// an mntns binding we'd skipped?</div><div class='ctx'> 		while (p-&gt;mnt.mnt_root != q-&gt;mnt.mnt_root)</div><div class='del'>-			p = next_mnt(p, old);</div><div class='add'>+			p = next_mnt(skip_mnt_tree(p), old);</div><div class='ctx'> 	}</div><div class='del'>-	namespace_unlock();</div><div class='del'>-</div><div class='del'>-	if (rootmnt)</div><div class='del'>-		mntput(rootmnt);</div><div class='del'>-	if (pwdmnt)</div><div class='del'>-		mntput(pwdmnt);</div><div class='del'>-</div><div class='add'>+	ns_tree_add_raw(new_ns);</div><div class='ctx'> 	return new_ns;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3489,10 +4175,9 @@ struct dentry *mount_subtree(struct vfsmount *m, const char *name)</div><div class='ctx'> 		mntput(m);</div><div class='ctx'> 		return ERR_CAST(ns);</div><div class='ctx'> 	}</div><div class='del'>-	mnt-&gt;mnt_ns = ns;</div><div class='ctx'> 	ns-&gt;root = mnt;</div><div class='del'>-	ns-&gt;mounts++;</div><div class='del'>-	list_add(&amp;mnt-&gt;mnt_list, &amp;ns-&gt;list);</div><div class='add'>+	ns-&gt;nr_mounts++;</div><div class='add'>+	mnt_add_to_ns(ns, mnt);</div><div class='ctx'> </div><div class='ctx'> 	err = vfs_path_lookup(m-&gt;mnt_root, m,</div><div class='ctx'> 			name, LOOKUP_FOLLOW|LOOKUP_AUTOMOUNT, &amp;path);</div><div class='hunk'>@@ -3584,12 +4269,11 @@ static unsigned int attr_flags_to_mnt_flags(u64 attr_flags)</div><div class='ctx'> SYSCALL_DEFINE3(fsmount, int, fs_fd, unsigned int, flags,</div><div class='ctx'> 		unsigned int, attr_flags)</div><div class='ctx'> {</div><div class='add'>+	struct path new_path __free(path_put) = {};</div><div class='ctx'> 	struct mnt_namespace *ns;</div><div class='ctx'> 	struct fs_context *fc;</div><div class='del'>-	struct file *file;</div><div class='del'>-	struct path newmount;</div><div class='add'>+	struct vfsmount *new_mnt;</div><div class='ctx'> 	struct mount *mnt;</div><div class='del'>-	struct fd f;</div><div class='ctx'> 	unsigned int mnt_flags = 0;</div><div class='ctx'> 	long ret;</div><div class='ctx'> </div><div class='hunk'>@@ -3617,45 +4301,45 @@ SYSCALL_DEFINE3(fsmount, int, fs_fd, unsigned int, flags,</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	f = fdget(fs_fd);</div><div class='del'>-	if (!f.file)</div><div class='add'>+	CLASS(fd, f)(fs_fd);</div><div class='add'>+	if (fd_empty(f))</div><div class='ctx'> 		return -EBADF;</div><div class='ctx'> </div><div class='del'>-	ret = -EINVAL;</div><div class='del'>-	if (f.file-&gt;f_op != &amp;fscontext_fops)</div><div class='del'>-		goto err_fsfd;</div><div class='add'>+	if (fd_file(f)-&gt;f_op != &amp;fscontext_fops)</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	fc = f.file-&gt;private_data;</div><div class='add'>+	fc = fd_file(f)-&gt;private_data;</div><div class='ctx'> </div><div class='del'>-	ret = mutex_lock_interruptible(&amp;fc-&gt;uapi_mutex);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto err_fsfd;</div><div class='add'>+	ACQUIRE(mutex_intr, uapi_mutex)(&amp;fc-&gt;uapi_mutex);</div><div class='add'>+	ret = ACQUIRE_ERR(mutex_intr, &amp;uapi_mutex);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	/* There must be a valid superblock or we can't mount it */</div><div class='ctx'> 	ret = -EINVAL;</div><div class='ctx'> 	if (!fc-&gt;root)</div><div class='del'>-		goto err_unlock;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	ret = -EPERM;</div><div class='ctx'> 	if (mount_too_revealing(fc-&gt;root-&gt;d_sb, &amp;mnt_flags)) {</div><div class='del'>-		pr_warn("VFS: Mount too revealing\n");</div><div class='del'>-		goto err_unlock;</div><div class='add'>+		errorfcp(fc, "VFS", "Mount too revealing");</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = -EBUSY;</div><div class='ctx'> 	if (fc-&gt;phase != FS_CONTEXT_AWAITING_MOUNT)</div><div class='del'>-		goto err_unlock;</div><div class='add'>+		return ret;</div><div class='ctx'> </div><div class='ctx'> 	if (fc-&gt;sb_flags &amp; SB_MANDLOCK)</div><div class='ctx'> 		warn_mandlock();</div><div class='ctx'> </div><div class='del'>-	newmount.mnt = vfs_create_mount(fc);</div><div class='del'>-	if (IS_ERR(newmount.mnt)) {</div><div class='del'>-		ret = PTR_ERR(newmount.mnt);</div><div class='del'>-		goto err_unlock;</div><div class='del'>-	}</div><div class='del'>-	newmount.dentry = dget(fc-&gt;root);</div><div class='del'>-	newmount.mnt-&gt;mnt_flags = mnt_flags;</div><div class='add'>+	new_mnt = vfs_create_mount(fc);</div><div class='add'>+	if (IS_ERR(new_mnt))</div><div class='add'>+		return PTR_ERR(new_mnt);</div><div class='add'>+	new_mnt-&gt;mnt_flags = mnt_flags;</div><div class='add'>+</div><div class='add'>+	new_path.dentry = dget(fc-&gt;root);</div><div class='add'>+	new_path.mnt = new_mnt;</div><div class='ctx'> </div><div class='ctx'> 	/* We've done the mount bit - now move the file context into more or</div><div class='ctx'> 	 * less the same state as if we'd done an fspick().  We don't want to</div><div class='hunk'>@@ -3665,41 +4349,43 @@ SYSCALL_DEFINE3(fsmount, int, fs_fd, unsigned int, flags,</div><div class='ctx'> 	vfs_clean_context(fc);</div><div class='ctx'> </div><div class='ctx'> 	ns = alloc_mnt_ns(current-&gt;nsproxy-&gt;mnt_ns-&gt;user_ns, true);</div><div class='del'>-	if (IS_ERR(ns)) {</div><div class='del'>-		ret = PTR_ERR(ns);</div><div class='del'>-		goto err_path;</div><div class='del'>-	}</div><div class='del'>-	mnt = real_mount(newmount.mnt);</div><div class='del'>-	mnt-&gt;mnt_ns = ns;</div><div class='add'>+	if (IS_ERR(ns))</div><div class='add'>+		return PTR_ERR(ns);</div><div class='add'>+	mnt = real_mount(new_path.mnt);</div><div class='ctx'> 	ns-&gt;root = mnt;</div><div class='del'>-	ns-&gt;mounts = 1;</div><div class='del'>-	list_add(&amp;mnt-&gt;mnt_list, &amp;ns-&gt;list);</div><div class='del'>-	mntget(newmount.mnt);</div><div class='add'>+	ns-&gt;nr_mounts = 1;</div><div class='add'>+	mnt_add_to_ns(ns, mnt);</div><div class='add'>+	mntget(new_path.mnt);</div><div class='add'>+</div><div class='add'>+	FD_PREPARE(fdf, (flags &amp; FSMOUNT_CLOEXEC) ? O_CLOEXEC : 0,</div><div class='add'>+		   dentry_open(&amp;new_path, O_PATH, fc-&gt;cred));</div><div class='add'>+	if (fdf.err) {</div><div class='add'>+		dissolve_on_fput(new_path.mnt);</div><div class='add'>+		return fdf.err;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	/* Attach to an apparent O_PATH fd with a note that we need to unmount</div><div class='del'>-	 * it, not just simply put it.</div><div class='add'>+	/*</div><div class='add'>+	 * Attach to an apparent O_PATH fd with a note that we</div><div class='add'>+	 * need to unmount it, not just simply put it.</div><div class='ctx'> 	 */</div><div class='del'>-	file = dentry_open(&amp;newmount, O_PATH, fc-&gt;cred);</div><div class='del'>-	if (IS_ERR(file)) {</div><div class='del'>-		dissolve_on_fput(newmount.mnt);</div><div class='del'>-		ret = PTR_ERR(file);</div><div class='del'>-		goto err_path;</div><div class='del'>-	}</div><div class='del'>-	file-&gt;f_mode |= FMODE_NEED_UNMOUNT;</div><div class='add'>+	fd_prepare_file(fdf)-&gt;f_mode |= FMODE_NEED_UNMOUNT;</div><div class='add'>+	return fd_publish(fdf);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	ret = get_unused_fd_flags((flags &amp; FSMOUNT_CLOEXEC) ? O_CLOEXEC : 0);</div><div class='del'>-	if (ret &gt;= 0)</div><div class='del'>-		fd_install(ret, file);</div><div class='del'>-	else</div><div class='del'>-		fput(file);</div><div class='del'>-</div><div class='del'>-err_path:</div><div class='del'>-	path_put(&amp;newmount);</div><div class='del'>-err_unlock:</div><div class='del'>-	mutex_unlock(&amp;fc-&gt;uapi_mutex);</div><div class='del'>-err_fsfd:</div><div class='del'>-	fdput(f);</div><div class='del'>-	return ret;</div><div class='add'>+static inline int vfs_move_mount(const struct path *from_path,</div><div class='add'>+				 const struct path *to_path,</div><div class='add'>+				 enum mnt_tree_flags_t mflags)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = security_move_mount(from_path, to_path);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	if (mflags &amp; MNT_TREE_PROPAGATION)</div><div class='add'>+		return do_set_group(from_path, to_path);</div><div class='add'>+</div><div class='add'>+	return do_move_mount(from_path, to_path, mflags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -3715,8 +4401,12 @@ SYSCALL_DEFINE5(move_mount,</div><div class='ctx'> 		int, to_dfd, const char __user *, to_pathname,</div><div class='ctx'> 		unsigned int, flags)</div><div class='ctx'> {</div><div class='del'>-	struct path from_path, to_path;</div><div class='del'>-	unsigned int lflags;</div><div class='add'>+	struct path to_path __free(path_put) = {};</div><div class='add'>+	struct path from_path __free(path_put) = {};</div><div class='add'>+	struct filename *to_name __free(putname) = NULL;</div><div class='add'>+	struct filename *from_name __free(putname) = NULL;</div><div class='add'>+	unsigned int lflags, uflags;</div><div class='add'>+	enum mnt_tree_flags_t mflags = 0;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (!may_mount())</div><div class='hunk'>@@ -3725,48 +4415,71 @@ SYSCALL_DEFINE5(move_mount,</div><div class='ctx'> 	if (flags &amp; ~MOVE_MOUNT__MASK)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	/* If someone gives a pathname, they aren't permitted to move</div><div class='del'>-	 * from an fd that requires unmount as we can't get at the flag</div><div class='del'>-	 * to clear it afterwards.</div><div class='del'>-	 */</div><div class='del'>-	lflags = 0;</div><div class='del'>-	if (flags &amp; MOVE_MOUNT_F_SYMLINKS)	lflags |= LOOKUP_FOLLOW;</div><div class='del'>-	if (flags &amp; MOVE_MOUNT_F_AUTOMOUNTS)	lflags |= LOOKUP_AUTOMOUNT;</div><div class='del'>-	if (flags &amp; MOVE_MOUNT_F_EMPTY_PATH)	lflags |= LOOKUP_EMPTY;</div><div class='add'>+	if ((flags &amp; (MOVE_MOUNT_BENEATH | MOVE_MOUNT_SET_GROUP)) ==</div><div class='add'>+	    (MOVE_MOUNT_BENEATH | MOVE_MOUNT_SET_GROUP))</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	ret = user_path_at(from_dfd, from_pathname, lflags, &amp;from_path);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		return ret;</div><div class='add'>+	if (flags &amp; MOVE_MOUNT_SET_GROUP)	mflags |= MNT_TREE_PROPAGATION;</div><div class='add'>+	if (flags &amp; MOVE_MOUNT_BENEATH)		mflags |= MNT_TREE_BENEATH;</div><div class='ctx'> </div><div class='del'>-	lflags = 0;</div><div class='del'>-	if (flags &amp; MOVE_MOUNT_T_SYMLINKS)	lflags |= LOOKUP_FOLLOW;</div><div class='del'>-	if (flags &amp; MOVE_MOUNT_T_AUTOMOUNTS)	lflags |= LOOKUP_AUTOMOUNT;</div><div class='del'>-	if (flags &amp; MOVE_MOUNT_T_EMPTY_PATH)	lflags |= LOOKUP_EMPTY;</div><div class='add'>+	uflags = 0;</div><div class='add'>+	if (flags &amp; MOVE_MOUNT_T_EMPTY_PATH)</div><div class='add'>+		uflags = AT_EMPTY_PATH;</div><div class='ctx'> </div><div class='del'>-	ret = user_path_at(to_dfd, to_pathname, lflags, &amp;to_path);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out_from;</div><div class='add'>+	to_name = getname_maybe_null(to_pathname, uflags);</div><div class='add'>+	if (IS_ERR(to_name))</div><div class='add'>+		return PTR_ERR(to_name);</div><div class='ctx'> </div><div class='del'>-	ret = security_move_mount(&amp;from_path, &amp;to_path);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto out_to;</div><div class='add'>+	if (!to_name &amp;&amp; to_dfd &gt;= 0) {</div><div class='add'>+		CLASS(fd_raw, f_to)(to_dfd);</div><div class='add'>+		if (fd_empty(f_to))</div><div class='add'>+			return -EBADF;</div><div class='ctx'> </div><div class='del'>-	if (flags &amp; MOVE_MOUNT_SET_GROUP)</div><div class='del'>-		ret = do_set_group(&amp;from_path, &amp;to_path);</div><div class='del'>-	else</div><div class='del'>-		ret = do_move_mount(&amp;from_path, &amp;to_path);</div><div class='add'>+		to_path = fd_file(f_to)-&gt;f_path;</div><div class='add'>+		path_get(&amp;to_path);</div><div class='add'>+	} else {</div><div class='add'>+		lflags = 0;</div><div class='add'>+		if (flags &amp; MOVE_MOUNT_T_SYMLINKS)</div><div class='add'>+			lflags |= LOOKUP_FOLLOW;</div><div class='add'>+		if (flags &amp; MOVE_MOUNT_T_AUTOMOUNTS)</div><div class='add'>+			lflags |= LOOKUP_AUTOMOUNT;</div><div class='add'>+		ret = filename_lookup(to_dfd, to_name, lflags, &amp;to_path, NULL);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-out_to:</div><div class='del'>-	path_put(&amp;to_path);</div><div class='del'>-out_from:</div><div class='del'>-	path_put(&amp;from_path);</div><div class='del'>-	return ret;</div><div class='add'>+	uflags = 0;</div><div class='add'>+	if (flags &amp; MOVE_MOUNT_F_EMPTY_PATH)</div><div class='add'>+		uflags = AT_EMPTY_PATH;</div><div class='add'>+</div><div class='add'>+	from_name = getname_maybe_null(from_pathname, uflags);</div><div class='add'>+	if (IS_ERR(from_name))</div><div class='add'>+		return PTR_ERR(from_name);</div><div class='add'>+</div><div class='add'>+	if (!from_name &amp;&amp; from_dfd &gt;= 0) {</div><div class='add'>+		CLASS(fd_raw, f_from)(from_dfd);</div><div class='add'>+		if (fd_empty(f_from))</div><div class='add'>+			return -EBADF;</div><div class='add'>+</div><div class='add'>+		return vfs_move_mount(&amp;fd_file(f_from)-&gt;f_path, &amp;to_path, mflags);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	lflags = 0;</div><div class='add'>+	if (flags &amp; MOVE_MOUNT_F_SYMLINKS)</div><div class='add'>+		lflags |= LOOKUP_FOLLOW;</div><div class='add'>+	if (flags &amp; MOVE_MOUNT_F_AUTOMOUNTS)</div><div class='add'>+		lflags |= LOOKUP_AUTOMOUNT;</div><div class='add'>+	ret = filename_lookup(from_dfd, from_name, lflags, &amp;from_path, NULL);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	return vfs_move_mount(&amp;from_path, &amp;to_path, mflags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Return true if path is reachable from root</div><div class='ctx'>  *</div><div class='del'>- * namespace_sem or mount_lock is held</div><div class='add'>+ * locks: mount_locked_reader || namespace_shared &amp;&amp; is_mounted(mnt)</div><div class='ctx'>  */</div><div class='ctx'> bool is_path_reachable(struct mount *mnt, struct dentry *dentry,</div><div class='ctx'> 			 const struct path *root)</div><div class='hunk'>@@ -3780,11 +4493,8 @@ bool is_path_reachable(struct mount *mnt, struct dentry *dentry,</div><div class='ctx'> </div><div class='ctx'> bool path_is_under(const struct path *path1, const struct path *path2)</div><div class='ctx'> {</div><div class='del'>-	bool res;</div><div class='del'>-	read_seqlock_excl(&amp;mount_lock);</div><div class='del'>-	res = is_path_reachable(real_mount(path1-&gt;mnt), path1-&gt;dentry, path2);</div><div class='del'>-	read_sequnlock_excl(&amp;mount_lock);</div><div class='del'>-	return res;</div><div class='add'>+	guard(mount_locked_reader)();</div><div class='add'>+	return is_path_reachable(real_mount(path1-&gt;mnt), path1-&gt;dentry, path2);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(path_is_under);</div><div class='ctx'> </div><div class='hunk'>@@ -3816,9 +4526,10 @@ EXPORT_SYMBOL(path_is_under);</div><div class='ctx'> SYSCALL_DEFINE2(pivot_root, const char __user *, new_root,</div><div class='ctx'> 		const char __user *, put_old)</div><div class='ctx'> {</div><div class='del'>-	struct path new, old, root;</div><div class='add'>+	struct path new __free(path_put) = {};</div><div class='add'>+	struct path old __free(path_put) = {};</div><div class='add'>+	struct path root __free(path_put) = {};</div><div class='ctx'> 	struct mount *new_mnt, *root_mnt, *old_mnt, *root_parent, *ex_parent;</div><div class='del'>-	struct mountpoint *old_mp, *root_mp;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='ctx'> 	if (!may_mount())</div><div class='hunk'>@@ -3827,89 +4538,73 @@ SYSCALL_DEFINE2(pivot_root, const char __user *, new_root,</div><div class='ctx'> 	error = user_path_at(AT_FDCWD, new_root,</div><div class='ctx'> 			     LOOKUP_FOLLOW | LOOKUP_DIRECTORY, &amp;new);</div><div class='ctx'> 	if (error)</div><div class='del'>-		goto out0;</div><div class='add'>+		return error;</div><div class='ctx'> </div><div class='ctx'> 	error = user_path_at(AT_FDCWD, put_old,</div><div class='ctx'> 			     LOOKUP_FOLLOW | LOOKUP_DIRECTORY, &amp;old);</div><div class='ctx'> 	if (error)</div><div class='del'>-		goto out1;</div><div class='add'>+		return error;</div><div class='ctx'> </div><div class='ctx'> 	error = security_sb_pivotroot(&amp;old, &amp;new);</div><div class='ctx'> 	if (error)</div><div class='del'>-		goto out2;</div><div class='add'>+		return error;</div><div class='ctx'> </div><div class='ctx'> 	get_fs_root(current-&gt;fs, &amp;root);</div><div class='del'>-	old_mp = lock_mount(&amp;old);</div><div class='del'>-	error = PTR_ERR(old_mp);</div><div class='del'>-	if (IS_ERR(old_mp))</div><div class='del'>-		goto out3;</div><div class='ctx'> </div><div class='del'>-	error = -EINVAL;</div><div class='add'>+	LOCK_MOUNT(old_mp, &amp;old);</div><div class='add'>+	old_mnt = old_mp.parent;</div><div class='add'>+	if (IS_ERR(old_mnt))</div><div class='add'>+		return PTR_ERR(old_mnt);</div><div class='add'>+</div><div class='ctx'> 	new_mnt = real_mount(new.mnt);</div><div class='ctx'> 	root_mnt = real_mount(root.mnt);</div><div class='del'>-	old_mnt = real_mount(old.mnt);</div><div class='ctx'> 	ex_parent = new_mnt-&gt;mnt_parent;</div><div class='ctx'> 	root_parent = root_mnt-&gt;mnt_parent;</div><div class='ctx'> 	if (IS_MNT_SHARED(old_mnt) ||</div><div class='ctx'> 		IS_MNT_SHARED(ex_parent) ||</div><div class='ctx'> 		IS_MNT_SHARED(root_parent))</div><div class='del'>-		goto out4;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	if (!check_mnt(root_mnt) || !check_mnt(new_mnt))</div><div class='del'>-		goto out4;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	if (new_mnt-&gt;mnt.mnt_flags &amp; MNT_LOCKED)</div><div class='del'>-		goto out4;</div><div class='del'>-	error = -ENOENT;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	if (d_unlinked(new.dentry))</div><div class='del'>-		goto out4;</div><div class='del'>-	error = -EBUSY;</div><div class='add'>+		return -ENOENT;</div><div class='ctx'> 	if (new_mnt == root_mnt || old_mnt == root_mnt)</div><div class='del'>-		goto out4; /* loop, on the same file system  */</div><div class='del'>-	error = -EINVAL;</div><div class='del'>-	if (root.mnt-&gt;mnt_root != root.dentry)</div><div class='del'>-		goto out4; /* not a mountpoint */</div><div class='add'>+		return -EBUSY; /* loop, on the same file system  */</div><div class='add'>+	if (!path_mounted(&amp;root))</div><div class='add'>+		return -EINVAL; /* not a mountpoint */</div><div class='ctx'> 	if (!mnt_has_parent(root_mnt))</div><div class='del'>-		goto out4; /* not attached */</div><div class='del'>-	if (new.mnt-&gt;mnt_root != new.dentry)</div><div class='del'>-		goto out4; /* not a mountpoint */</div><div class='add'>+		return -EINVAL; /* absolute root */</div><div class='add'>+	if (!path_mounted(&amp;new))</div><div class='add'>+		return -EINVAL; /* not a mountpoint */</div><div class='ctx'> 	if (!mnt_has_parent(new_mnt))</div><div class='del'>-		goto out4; /* not attached */</div><div class='add'>+		return -EINVAL; /* absolute root */</div><div class='ctx'> 	/* make sure we can reach put_old from new_root */</div><div class='del'>-	if (!is_path_reachable(old_mnt, old.dentry, &amp;new))</div><div class='del'>-		goto out4;</div><div class='add'>+	if (!is_path_reachable(old_mnt, old_mp.mp-&gt;m_dentry, &amp;new))</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	/* make certain new is below the root */</div><div class='ctx'> 	if (!is_path_reachable(new_mnt, new.dentry, &amp;root))</div><div class='del'>-		goto out4;</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	lock_mount_hash();</div><div class='ctx'> 	umount_mnt(new_mnt);</div><div class='del'>-	root_mp = unhash_mnt(root_mnt);  /* we'll need its mountpoint */</div><div class='ctx'> 	if (root_mnt-&gt;mnt.mnt_flags &amp; MNT_LOCKED) {</div><div class='ctx'> 		new_mnt-&gt;mnt.mnt_flags |= MNT_LOCKED;</div><div class='ctx'> 		root_mnt-&gt;mnt.mnt_flags &amp;= ~MNT_LOCKED;</div><div class='ctx'> 	}</div><div class='del'>-	/* mount old root on put_old */</div><div class='del'>-	attach_mnt(root_mnt, old_mnt, old_mp);</div><div class='ctx'> 	/* mount new_root on / */</div><div class='del'>-	attach_mnt(new_mnt, root_parent, root_mp);</div><div class='del'>-	mnt_add_count(root_parent, -1);</div><div class='add'>+	attach_mnt(new_mnt, root_parent, root_mnt-&gt;mnt_mp);</div><div class='add'>+	umount_mnt(root_mnt);</div><div class='add'>+	/* mount old root on put_old */</div><div class='add'>+	attach_mnt(root_mnt, old_mnt, old_mp.mp);</div><div class='ctx'> 	touch_mnt_namespace(current-&gt;nsproxy-&gt;mnt_ns);</div><div class='ctx'> 	/* A moved mount should not expire automatically */</div><div class='ctx'> 	list_del_init(&amp;new_mnt-&gt;mnt_expire);</div><div class='del'>-	put_mountpoint(root_mp);</div><div class='ctx'> 	unlock_mount_hash();</div><div class='add'>+	mnt_notify_add(root_mnt);</div><div class='add'>+	mnt_notify_add(new_mnt);</div><div class='ctx'> 	chroot_fs_refs(&amp;root, &amp;new);</div><div class='del'>-	error = 0;</div><div class='del'>-out4:</div><div class='del'>-	unlock_mount(old_mp);</div><div class='del'>-	if (!error)</div><div class='del'>-		mntput_no_expire(ex_parent);</div><div class='del'>-out3:</div><div class='del'>-	path_put(&amp;root);</div><div class='del'>-out2:</div><div class='del'>-	path_put(&amp;old);</div><div class='del'>-out1:</div><div class='del'>-	path_put(&amp;new);</div><div class='del'>-out0:</div><div class='del'>-	return error;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static unsigned int recalc_flags(struct mount_kattr *kattr, struct mount *mnt)</div><div class='hunk'>@@ -3927,28 +4622,35 @@ static unsigned int recalc_flags(struct mount_kattr *kattr, struct mount *mnt)</div><div class='ctx'> static int can_idmap_mount(const struct mount_kattr *kattr, struct mount *mnt)</div><div class='ctx'> {</div><div class='ctx'> 	struct vfsmount *m = &amp;mnt-&gt;mnt;</div><div class='add'>+	struct user_namespace *fs_userns = m-&gt;mnt_sb-&gt;s_user_ns;</div><div class='ctx'> </div><div class='del'>-	if (!kattr-&gt;mnt_userns)</div><div class='add'>+	if (!kattr-&gt;mnt_idmap)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Once a mount has been idmapped we don't allow it to change its</div><div class='del'>-	 * mapping. It makes things simpler and callers can just create</div><div class='del'>-	 * another bind-mount they can idmap if they want to.</div><div class='add'>+	 * Creating an idmapped mount with the filesystem wide idmapping</div><div class='add'>+	 * doesn't make sense so block that. We don't allow mushy semantics.</div><div class='add'>+	 */</div><div class='add'>+	if (kattr-&gt;mnt_userns == m-&gt;mnt_sb-&gt;s_user_ns)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We only allow an mount to change it's idmapping if it has</div><div class='add'>+	 * never been accessible to userspace.</div><div class='ctx'> 	 */</div><div class='del'>-	if (mnt_user_ns(m) != &amp;init_user_ns)</div><div class='add'>+	if (!(kattr-&gt;kflags &amp; MOUNT_KATTR_IDMAP_REPLACE) &amp;&amp; is_idmapped_mnt(m))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='ctx'> 	/* The underlying filesystem doesn't support idmapped mounts yet. */</div><div class='ctx'> 	if (!(m-&gt;mnt_sb-&gt;s_type-&gt;fs_flags &amp; FS_ALLOW_IDMAP))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	/* Don't yet support filesystem mountable in user namespaces. */</div><div class='del'>-	if (m-&gt;mnt_sb-&gt;s_user_ns != &amp;init_user_ns)</div><div class='add'>+	/* The filesystem has turned off idmapped mounts. */</div><div class='add'>+	if (m-&gt;mnt_sb-&gt;s_iflags &amp; SB_I_NOIDMAP)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	/* We're not controlling the superblock. */</div><div class='del'>-	if (!capable(CAP_SYS_ADMIN))</div><div class='add'>+	if (!ns_capable(fs_userns, CAP_SYS_ADMIN))</div><div class='ctx'> 		return -EPERM;</div><div class='ctx'> </div><div class='ctx'> 	/* Mount has already been visible in the filesystem hierarchy. */</div><div class='hunk'>@@ -3958,107 +4660,111 @@ static int can_idmap_mount(const struct mount_kattr *kattr, struct mount *mnt)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct mount *mount_setattr_prepare(struct mount_kattr *kattr,</div><div class='del'>-					   struct mount *mnt, int *err)</div><div class='add'>+/**</div><div class='add'>+ * mnt_allow_writers() - check whether the attribute change allows writers</div><div class='add'>+ * @kattr: the new mount attributes</div><div class='add'>+ * @mnt: the mount to which @kattr will be applied</div><div class='add'>+ *</div><div class='add'>+ * Check whether thew new mount attributes in @kattr allow concurrent writers.</div><div class='add'>+ *</div><div class='add'>+ * Return: true if writers need to be held, false if not</div><div class='add'>+ */</div><div class='add'>+static inline bool mnt_allow_writers(const struct mount_kattr *kattr,</div><div class='add'>+				     const struct mount *mnt)</div><div class='ctx'> {</div><div class='del'>-	struct mount *m = mnt, *last = NULL;</div><div class='del'>-</div><div class='del'>-	if (!is_mounted(&amp;m-&gt;mnt)) {</div><div class='del'>-		*err = -EINVAL;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (!(mnt_has_parent(m) ? check_mnt(m) : is_anon_ns(m-&gt;mnt_ns))) {</div><div class='del'>-		*err = -EINVAL;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	return (!(kattr-&gt;attr_set &amp; MNT_READONLY) ||</div><div class='add'>+		(mnt-&gt;mnt.mnt_flags &amp; MNT_READONLY)) &amp;&amp;</div><div class='add'>+	       !kattr-&gt;mnt_idmap;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	do {</div><div class='del'>-		unsigned int flags;</div><div class='add'>+static int mount_setattr_prepare(struct mount_kattr *kattr, struct mount *mnt)</div><div class='add'>+{</div><div class='add'>+	struct mount *m;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='del'>-		flags = recalc_flags(kattr, m);</div><div class='del'>-		if (!can_change_locked_flags(m, flags)) {</div><div class='del'>-			*err = -EPERM;</div><div class='del'>-			goto out;</div><div class='add'>+	for (m = mnt; m; m = next_mnt(m, mnt)) {</div><div class='add'>+		if (!can_change_locked_flags(m, recalc_flags(kattr, m))) {</div><div class='add'>+			err = -EPERM;</div><div class='add'>+			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		*err = can_idmap_mount(kattr, m);</div><div class='del'>-		if (*err)</div><div class='del'>-			goto out;</div><div class='del'>-</div><div class='del'>-		last = m;</div><div class='add'>+		err = can_idmap_mount(kattr, m);</div><div class='add'>+		if (err)</div><div class='add'>+			break;</div><div class='ctx'> </div><div class='del'>-		if ((kattr-&gt;attr_set &amp; MNT_READONLY) &amp;&amp;</div><div class='del'>-		    !(m-&gt;mnt.mnt_flags &amp; MNT_READONLY)) {</div><div class='del'>-			*err = mnt_hold_writers(m);</div><div class='del'>-			if (*err)</div><div class='del'>-				goto out;</div><div class='add'>+		if (!mnt_allow_writers(kattr, m)) {</div><div class='add'>+			err = mnt_hold_writers(m);</div><div class='add'>+			if (err) {</div><div class='add'>+				m = next_mnt(m, mnt);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='del'>-	} while (kattr-&gt;recurse &amp;&amp; (m = next_mnt(m, mnt)));</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	return last;</div><div class='add'>+		if (!(kattr-&gt;kflags &amp; MOUNT_KATTR_RECURSE))</div><div class='add'>+			return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (err) {</div><div class='add'>+		/* undo all mnt_hold_writers() we'd done */</div><div class='add'>+		for (struct mount *p = mnt; p != m; p = next_mnt(p, mnt))</div><div class='add'>+			mnt_unhold_writers(p);</div><div class='add'>+	}</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void do_idmap_mount(const struct mount_kattr *kattr, struct mount *mnt)</div><div class='ctx'> {</div><div class='del'>-	struct user_namespace *mnt_userns;</div><div class='add'>+	struct mnt_idmap *old_idmap;</div><div class='ctx'> </div><div class='del'>-	if (!kattr-&gt;mnt_userns)</div><div class='add'>+	if (!kattr-&gt;mnt_idmap)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	mnt_userns = get_user_ns(kattr-&gt;mnt_userns);</div><div class='del'>-	/* Pairs with smp_load_acquire() in mnt_user_ns(). */</div><div class='del'>-	smp_store_release(&amp;mnt-&gt;mnt.mnt_userns, mnt_userns);</div><div class='add'>+	old_idmap = mnt_idmap(&amp;mnt-&gt;mnt);</div><div class='add'>+</div><div class='add'>+	/* Pairs with smp_load_acquire() in mnt_idmap(). */</div><div class='add'>+	smp_store_release(&amp;mnt-&gt;mnt.mnt_idmap, mnt_idmap_get(kattr-&gt;mnt_idmap));</div><div class='add'>+	mnt_idmap_put(old_idmap);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void mount_setattr_commit(struct mount_kattr *kattr,</div><div class='del'>-				 struct mount *mnt, struct mount *last,</div><div class='del'>-				 int err)</div><div class='add'>+static void mount_setattr_commit(struct mount_kattr *kattr, struct mount *mnt)</div><div class='ctx'> {</div><div class='del'>-	struct mount *m = mnt;</div><div class='add'>+	struct mount *m;</div><div class='ctx'> </div><div class='del'>-	do {</div><div class='del'>-		if (!err) {</div><div class='del'>-			unsigned int flags;</div><div class='add'>+	for (m = mnt; m; m = next_mnt(m, mnt)) {</div><div class='add'>+		unsigned int flags;</div><div class='ctx'> </div><div class='del'>-			do_idmap_mount(kattr, m);</div><div class='del'>-			flags = recalc_flags(kattr, m);</div><div class='del'>-			WRITE_ONCE(m-&gt;mnt.mnt_flags, flags);</div><div class='del'>-		}</div><div class='add'>+		do_idmap_mount(kattr, m);</div><div class='add'>+		flags = recalc_flags(kattr, m);</div><div class='add'>+		WRITE_ONCE(m-&gt;mnt.mnt_flags, flags);</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * We either set MNT_READONLY above so make it visible</div><div class='del'>-		 * before ~MNT_WRITE_HOLD or we failed to recursively</div><div class='del'>-		 * apply mount options.</div><div class='del'>-		 */</div><div class='del'>-		if ((kattr-&gt;attr_set &amp; MNT_READONLY) &amp;&amp;</div><div class='del'>-		    (m-&gt;mnt.mnt_flags &amp; MNT_WRITE_HOLD))</div><div class='del'>-			mnt_unhold_writers(m);</div><div class='add'>+		/* If we had to hold writers unblock them. */</div><div class='add'>+		mnt_unhold_writers(m);</div><div class='ctx'> </div><div class='del'>-		if (!err &amp;&amp; kattr-&gt;propagation)</div><div class='add'>+		if (kattr-&gt;propagation)</div><div class='ctx'> 			change_mnt_propagation(m, kattr-&gt;propagation);</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * On failure, only cleanup until we found the first mount</div><div class='del'>-		 * we failed to handle.</div><div class='del'>-		 */</div><div class='del'>-		if (err &amp;&amp; m == last)</div><div class='add'>+		if (!(kattr-&gt;kflags &amp; MOUNT_KATTR_RECURSE))</div><div class='ctx'> 			break;</div><div class='del'>-	} while (kattr-&gt;recurse &amp;&amp; (m = next_mnt(m, mnt)));</div><div class='del'>-</div><div class='del'>-	if (!err)</div><div class='del'>-		touch_mnt_namespace(mnt-&gt;mnt_ns);</div><div class='add'>+	}</div><div class='add'>+	touch_mnt_namespace(mnt-&gt;mnt_ns);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int do_mount_setattr(struct path *path, struct mount_kattr *kattr)</div><div class='add'>+static int do_mount_setattr(const struct path *path, struct mount_kattr *kattr)</div><div class='ctx'> {</div><div class='del'>-	struct mount *mnt = real_mount(path-&gt;mnt), *last = NULL;</div><div class='add'>+	struct mount *mnt = real_mount(path-&gt;mnt);</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='del'>-	if (path-&gt;dentry != mnt-&gt;mnt.mnt_root)</div><div class='add'>+	if (!path_mounted(path))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='add'>+	if (kattr-&gt;mnt_userns) {</div><div class='add'>+		struct mnt_idmap *mnt_idmap;</div><div class='add'>+</div><div class='add'>+		mnt_idmap = alloc_mnt_idmap(kattr-&gt;mnt_userns);</div><div class='add'>+		if (IS_ERR(mnt_idmap))</div><div class='add'>+			return PTR_ERR(mnt_idmap);</div><div class='add'>+		kattr-&gt;mnt_idmap = mnt_idmap;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (kattr-&gt;propagation) {</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Only take namespace_lock() if we're actually changing</div><div class='hunk'>@@ -4066,7 +4772,7 @@ static int do_mount_setattr(struct path *path, struct mount_kattr *kattr)</div><div class='ctx'> 		 */</div><div class='ctx'> 		namespace_lock();</div><div class='ctx'> 		if (kattr-&gt;propagation == MS_SHARED) {</div><div class='del'>-			err = invent_group_ids(mnt, kattr-&gt;recurse);</div><div class='add'>+			err = invent_group_ids(mnt, kattr-&gt;kflags &amp; MOUNT_KATTR_RECURSE);</div><div class='ctx'> 			if (err) {</div><div class='ctx'> 				namespace_unlock();</div><div class='ctx'> 				return err;</div><div class='hunk'>@@ -4074,99 +4780,97 @@ static int do_mount_setattr(struct path *path, struct mount_kattr *kattr)</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	err = -EINVAL;</div><div class='ctx'> 	lock_mount_hash();</div><div class='ctx'> </div><div class='add'>+	if (!anon_ns_root(mnt) &amp;&amp; !check_mnt(mnt))</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='del'>-	 * Get the mount tree in a shape where we can change mount</div><div class='del'>-	 * properties without failure.</div><div class='add'>+	 * First, we get the mount tree in a shape where we can change mount</div><div class='add'>+	 * properties without failure. If we succeeded to do so we commit all</div><div class='add'>+	 * changes and if we failed we clean up.</div><div class='ctx'> 	 */</div><div class='del'>-	last = mount_setattr_prepare(kattr, mnt, &amp;err);</div><div class='del'>-	if (last) /* Commit all changes or revert to the old state. */</div><div class='del'>-		mount_setattr_commit(kattr, mnt, last, err);</div><div class='add'>+	err = mount_setattr_prepare(kattr, mnt);</div><div class='add'>+	if (!err)</div><div class='add'>+		mount_setattr_commit(kattr, mnt);</div><div class='ctx'> </div><div class='add'>+out:</div><div class='ctx'> 	unlock_mount_hash();</div><div class='ctx'> </div><div class='ctx'> 	if (kattr-&gt;propagation) {</div><div class='del'>-		namespace_unlock();</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			cleanup_group_ids(mnt, NULL);</div><div class='add'>+		namespace_unlock();</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int build_mount_idmapped(const struct mount_attr *attr, size_t usize,</div><div class='del'>-				struct mount_kattr *kattr, unsigned int flags)</div><div class='add'>+				struct mount_kattr *kattr)</div><div class='ctx'> {</div><div class='del'>-	int err = 0;</div><div class='ctx'> 	struct ns_common *ns;</div><div class='ctx'> 	struct user_namespace *mnt_userns;</div><div class='del'>-	struct file *file;</div><div class='ctx'> </div><div class='ctx'> 	if (!((attr-&gt;attr_set | attr-&gt;attr_clr) &amp; MOUNT_ATTR_IDMAP))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * We currently do not support clearing an idmapped mount. If this ever</div><div class='del'>-	 * is a use-case we can revisit this but for now let's keep it simple</div><div class='del'>-	 * and not allow it.</div><div class='del'>-	 */</div><div class='del'>-	if (attr-&gt;attr_clr &amp; MOUNT_ATTR_IDMAP)</div><div class='del'>-		return -EINVAL;</div><div class='add'>+	if (attr-&gt;attr_clr &amp; MOUNT_ATTR_IDMAP) {</div><div class='add'>+		/*</div><div class='add'>+		 * We can only remove an idmapping if it's never been</div><div class='add'>+		 * exposed to userspace.</div><div class='add'>+		 */</div><div class='add'>+		if (!(kattr-&gt;kflags &amp; MOUNT_KATTR_IDMAP_REPLACE))</div><div class='add'>+			return -EINVAL;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Removal of idmappings is equivalent to setting</div><div class='add'>+		 * nop_mnt_idmap.</div><div class='add'>+		 */</div><div class='add'>+		if (!(attr-&gt;attr_set &amp; MOUNT_ATTR_IDMAP)) {</div><div class='add'>+			kattr-&gt;mnt_idmap = &amp;nop_mnt_idmap;</div><div class='add'>+			return 0;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (attr-&gt;userns_fd &gt; INT_MAX)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	file = fget(attr-&gt;userns_fd);</div><div class='del'>-	if (!file)</div><div class='add'>+	CLASS(fd, f)(attr-&gt;userns_fd);</div><div class='add'>+	if (fd_empty(f))</div><div class='ctx'> 		return -EBADF;</div><div class='ctx'> </div><div class='del'>-	if (!proc_ns_file(file)) {</div><div class='del'>-		err = -EINVAL;</div><div class='del'>-		goto out_fput;</div><div class='del'>-	}</div><div class='add'>+	if (!proc_ns_file(fd_file(f)))</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	ns = get_proc_ns(file_inode(file));</div><div class='del'>-	if (ns-&gt;ops-&gt;type != CLONE_NEWUSER) {</div><div class='del'>-		err = -EINVAL;</div><div class='del'>-		goto out_fput;</div><div class='del'>-	}</div><div class='add'>+	ns = get_proc_ns(file_inode(fd_file(f)));</div><div class='add'>+	if (ns-&gt;ns_type != CLONE_NEWUSER)</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * The init_user_ns is used to indicate that a vfsmount is not idmapped.</div><div class='del'>-	 * This is simpler than just having to treat NULL as unmapped. Users</div><div class='del'>-	 * wanting to idmap a mount to init_user_ns can just use a namespace</div><div class='del'>-	 * with an identity mapping.</div><div class='add'>+	 * The initial idmapping cannot be used to create an idmapped</div><div class='add'>+	 * mount. We use the initial idmapping as an indicator of a mount</div><div class='add'>+	 * that is not idmapped. It can simply be passed into helpers that</div><div class='add'>+	 * are aware of idmapped mounts as a convenient shortcut. A user</div><div class='add'>+	 * can just create a dedicated identity mapping to achieve the same</div><div class='add'>+	 * result.</div><div class='ctx'> 	 */</div><div class='ctx'> 	mnt_userns = container_of(ns, struct user_namespace, ns);</div><div class='del'>-	if (mnt_userns == &amp;init_user_ns) {</div><div class='del'>-		err = -EPERM;</div><div class='del'>-		goto out_fput;</div><div class='del'>-	}</div><div class='del'>-	kattr-&gt;mnt_userns = get_user_ns(mnt_userns);</div><div class='add'>+	if (mnt_userns == &amp;init_user_ns)</div><div class='add'>+		return -EPERM;</div><div class='ctx'> </div><div class='del'>-out_fput:</div><div class='del'>-	fput(file);</div><div class='del'>-	return err;</div><div class='add'>+	/* We're not controlling the target namespace. */</div><div class='add'>+	if (!ns_capable(mnt_userns, CAP_SYS_ADMIN))</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	kattr-&gt;mnt_userns = get_user_ns(mnt_userns);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int build_mount_kattr(const struct mount_attr *attr, size_t usize,</div><div class='del'>-			     struct mount_kattr *kattr, unsigned int flags)</div><div class='add'>+			     struct mount_kattr *kattr)</div><div class='ctx'> {</div><div class='del'>-	unsigned int lookup_flags = LOOKUP_AUTOMOUNT | LOOKUP_FOLLOW;</div><div class='del'>-</div><div class='del'>-	if (flags &amp; AT_NO_AUTOMOUNT)</div><div class='del'>-		lookup_flags &amp;= ~LOOKUP_AUTOMOUNT;</div><div class='del'>-	if (flags &amp; AT_SYMLINK_NOFOLLOW)</div><div class='del'>-		lookup_flags &amp;= ~LOOKUP_FOLLOW;</div><div class='del'>-	if (flags &amp; AT_EMPTY_PATH)</div><div class='del'>-		lookup_flags |= LOOKUP_EMPTY;</div><div class='del'>-</div><div class='del'>-	*kattr = (struct mount_kattr) {</div><div class='del'>-		.lookup_flags	= lookup_flags,</div><div class='del'>-		.recurse	= !!(flags &amp; AT_RECURSIVE),</div><div class='del'>-	};</div><div class='del'>-</div><div class='ctx'> 	if (attr-&gt;propagation &amp; ~MOUNT_SETATTR_PROPAGATION_FLAGS)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	if (hweight32(attr-&gt;propagation &amp; MOUNT_SETATTR_PROPAGATION_FLAGS) &gt; 1)</div><div class='hunk'>@@ -4214,13 +4918,51 @@ static int build_mount_kattr(const struct mount_attr *attr, size_t usize,</div><div class='ctx'> 			return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return build_mount_idmapped(attr, usize, kattr, flags);</div><div class='add'>+	return build_mount_idmapped(attr, usize, kattr);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void finish_mount_kattr(struct mount_kattr *kattr)</div><div class='ctx'> {</div><div class='del'>-	put_user_ns(kattr-&gt;mnt_userns);</div><div class='del'>-	kattr-&gt;mnt_userns = NULL;</div><div class='add'>+	if (kattr-&gt;mnt_userns) {</div><div class='add'>+		put_user_ns(kattr-&gt;mnt_userns);</div><div class='add'>+		kattr-&gt;mnt_userns = NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (kattr-&gt;mnt_idmap)</div><div class='add'>+		mnt_idmap_put(kattr-&gt;mnt_idmap);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int wants_mount_setattr(struct mount_attr __user *uattr, size_t usize,</div><div class='add'>+			       struct mount_kattr *kattr)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+	struct mount_attr attr;</div><div class='add'>+</div><div class='add'>+	BUILD_BUG_ON(sizeof(struct mount_attr) != MOUNT_ATTR_SIZE_VER0);</div><div class='add'>+</div><div class='add'>+	if (unlikely(usize &gt; PAGE_SIZE))</div><div class='add'>+		return -E2BIG;</div><div class='add'>+	if (unlikely(usize &lt; MOUNT_ATTR_SIZE_VER0))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	if (!may_mount())</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	ret = copy_struct_from_user(&amp;attr, sizeof(attr), uattr, usize);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	/* Don't bother walking through the mounts if this is a nop. */</div><div class='add'>+	if (attr.attr_set == 0 &amp;&amp;</div><div class='add'>+	    attr.attr_clr == 0 &amp;&amp;</div><div class='add'>+	    attr.propagation == 0)</div><div class='add'>+		return 0; /* Tell caller to not bother. */</div><div class='add'>+</div><div class='add'>+	ret = build_mount_kattr(&amp;attr, usize, kattr);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	return 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> SYSCALL_DEFINE5(mount_setattr, int, dfd, const char __user *, path,</div><div class='hunk'>@@ -4229,10 +4971,8 @@ SYSCALL_DEFINE5(mount_setattr, int, dfd, const char __user *, path,</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='ctx'> 	struct path target;</div><div class='del'>-	struct mount_attr attr;</div><div class='ctx'> 	struct mount_kattr kattr;</div><div class='del'>-</div><div class='del'>-	BUILD_BUG_ON(sizeof(struct mount_attr) != MOUNT_ATTR_SIZE_VER0);</div><div class='add'>+	unsigned int lookup_flags = LOOKUP_AUTOMOUNT | LOOKUP_FOLLOW;</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; ~(AT_EMPTY_PATH |</div><div class='ctx'> 		      AT_RECURSIVE |</div><div class='hunk'>@@ -4240,66 +4980,1017 @@ SYSCALL_DEFINE5(mount_setattr, int, dfd, const char __user *, path,</div><div class='ctx'> 		      AT_NO_AUTOMOUNT))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(usize &gt; PAGE_SIZE))</div><div class='del'>-		return -E2BIG;</div><div class='del'>-	if (unlikely(usize &lt; MOUNT_ATTR_SIZE_VER0))</div><div class='add'>+	if (flags &amp; AT_NO_AUTOMOUNT)</div><div class='add'>+		lookup_flags &amp;= ~LOOKUP_AUTOMOUNT;</div><div class='add'>+	if (flags &amp; AT_SYMLINK_NOFOLLOW)</div><div class='add'>+		lookup_flags &amp;= ~LOOKUP_FOLLOW;</div><div class='add'>+	if (flags &amp; AT_EMPTY_PATH)</div><div class='add'>+		lookup_flags |= LOOKUP_EMPTY;</div><div class='add'>+</div><div class='add'>+	kattr = (struct mount_kattr) {</div><div class='add'>+		.lookup_flags	= lookup_flags,</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+	if (flags &amp; AT_RECURSIVE)</div><div class='add'>+		kattr.kflags |= MOUNT_KATTR_RECURSE;</div><div class='add'>+</div><div class='add'>+	err = wants_mount_setattr(uattr, usize, &amp;kattr);</div><div class='add'>+	if (err &lt;= 0)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	err = user_path_at(dfd, path, kattr.lookup_flags, &amp;target);</div><div class='add'>+	if (!err) {</div><div class='add'>+		err = do_mount_setattr(&amp;target, &amp;kattr);</div><div class='add'>+		path_put(&amp;target);</div><div class='add'>+	}</div><div class='add'>+	finish_mount_kattr(&amp;kattr);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+SYSCALL_DEFINE5(open_tree_attr, int, dfd, const char __user *, filename,</div><div class='add'>+		unsigned, flags, struct mount_attr __user *, uattr,</div><div class='add'>+		size_t, usize)</div><div class='add'>+{</div><div class='add'>+	if (!uattr &amp;&amp; usize)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	if (!may_mount())</div><div class='del'>-		return -EPERM;</div><div class='add'>+	FD_PREPARE(fdf, flags, vfs_open_tree(dfd, filename, flags));</div><div class='add'>+	if (fdf.err)</div><div class='add'>+		return fdf.err;</div><div class='add'>+</div><div class='add'>+	if (uattr) {</div><div class='add'>+		struct mount_kattr kattr = {};</div><div class='add'>+		struct file *file = fd_prepare_file(fdf);</div><div class='add'>+		int ret;</div><div class='add'>+</div><div class='add'>+		if (flags &amp; OPEN_TREE_CLONE)</div><div class='add'>+			kattr.kflags = MOUNT_KATTR_IDMAP_REPLACE;</div><div class='add'>+		if (flags &amp; AT_RECURSIVE)</div><div class='add'>+			kattr.kflags |= MOUNT_KATTR_RECURSE;</div><div class='add'>+</div><div class='add'>+		ret = wants_mount_setattr(uattr, usize, &amp;kattr);</div><div class='add'>+		if (ret &gt; 0) {</div><div class='add'>+			ret = do_mount_setattr(&amp;file-&gt;f_path, &amp;kattr);</div><div class='add'>+			finish_mount_kattr(&amp;kattr);</div><div class='add'>+		}</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return fd_publish(fdf);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int show_path(struct seq_file *m, struct dentry *root)</div><div class='add'>+{</div><div class='add'>+	if (root-&gt;d_sb-&gt;s_op-&gt;show_path)</div><div class='add'>+		return root-&gt;d_sb-&gt;s_op-&gt;show_path(m, root);</div><div class='add'>+</div><div class='add'>+	seq_dentry(m, root, " \t\n\\");</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct vfsmount *lookup_mnt_in_ns(u64 id, struct mnt_namespace *ns)</div><div class='add'>+{</div><div class='add'>+	struct mount *mnt = mnt_find_id_at(ns, id);</div><div class='add'>+</div><div class='add'>+	if (!mnt || mnt-&gt;mnt_id_unique != id)</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	return &amp;mnt-&gt;mnt;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct kstatmount {</div><div class='add'>+	struct statmount __user *buf;</div><div class='add'>+	size_t bufsize;</div><div class='add'>+	struct vfsmount *mnt;</div><div class='add'>+	struct mnt_idmap *idmap;</div><div class='add'>+	u64 mask;</div><div class='add'>+	struct path root;</div><div class='add'>+	struct seq_file seq;</div><div class='add'>+</div><div class='add'>+	/* Must be last --ends in a flexible-array member. */</div><div class='add'>+	struct statmount sm;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static u64 mnt_to_attr_flags(struct vfsmount *mnt)</div><div class='add'>+{</div><div class='add'>+	unsigned int mnt_flags = READ_ONCE(mnt-&gt;mnt_flags);</div><div class='add'>+	u64 attr_flags = 0;</div><div class='add'>+</div><div class='add'>+	if (mnt_flags &amp; MNT_READONLY)</div><div class='add'>+		attr_flags |= MOUNT_ATTR_RDONLY;</div><div class='add'>+	if (mnt_flags &amp; MNT_NOSUID)</div><div class='add'>+		attr_flags |= MOUNT_ATTR_NOSUID;</div><div class='add'>+	if (mnt_flags &amp; MNT_NODEV)</div><div class='add'>+		attr_flags |= MOUNT_ATTR_NODEV;</div><div class='add'>+	if (mnt_flags &amp; MNT_NOEXEC)</div><div class='add'>+		attr_flags |= MOUNT_ATTR_NOEXEC;</div><div class='add'>+	if (mnt_flags &amp; MNT_NODIRATIME)</div><div class='add'>+		attr_flags |= MOUNT_ATTR_NODIRATIME;</div><div class='add'>+	if (mnt_flags &amp; MNT_NOSYMFOLLOW)</div><div class='add'>+		attr_flags |= MOUNT_ATTR_NOSYMFOLLOW;</div><div class='add'>+</div><div class='add'>+	if (mnt_flags &amp; MNT_NOATIME)</div><div class='add'>+		attr_flags |= MOUNT_ATTR_NOATIME;</div><div class='add'>+	else if (mnt_flags &amp; MNT_RELATIME)</div><div class='add'>+		attr_flags |= MOUNT_ATTR_RELATIME;</div><div class='add'>+	else</div><div class='add'>+		attr_flags |= MOUNT_ATTR_STRICTATIME;</div><div class='add'>+</div><div class='add'>+	if (is_idmapped_mnt(mnt))</div><div class='add'>+		attr_flags |= MOUNT_ATTR_IDMAP;</div><div class='add'>+</div><div class='add'>+	return attr_flags;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static u64 mnt_to_propagation_flags(struct mount *m)</div><div class='add'>+{</div><div class='add'>+	u64 propagation = 0;</div><div class='add'>+</div><div class='add'>+	if (IS_MNT_SHARED(m))</div><div class='add'>+		propagation |= MS_SHARED;</div><div class='add'>+	if (IS_MNT_SLAVE(m))</div><div class='add'>+		propagation |= MS_SLAVE;</div><div class='add'>+	if (IS_MNT_UNBINDABLE(m))</div><div class='add'>+		propagation |= MS_UNBINDABLE;</div><div class='add'>+	if (!propagation)</div><div class='add'>+		propagation |= MS_PRIVATE;</div><div class='add'>+</div><div class='add'>+	return propagation;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+u64 vfsmount_to_propagation_flags(struct vfsmount *mnt)</div><div class='add'>+{</div><div class='add'>+	return mnt_to_propagation_flags(real_mount(mnt));</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(vfsmount_to_propagation_flags);</div><div class='add'>+</div><div class='add'>+static void statmount_sb_basic(struct kstatmount *s)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = s-&gt;mnt-&gt;mnt_sb;</div><div class='add'>+</div><div class='add'>+	s-&gt;sm.mask |= STATMOUNT_SB_BASIC;</div><div class='add'>+	s-&gt;sm.sb_dev_major = MAJOR(sb-&gt;s_dev);</div><div class='add'>+	s-&gt;sm.sb_dev_minor = MINOR(sb-&gt;s_dev);</div><div class='add'>+	s-&gt;sm.sb_magic = sb-&gt;s_magic;</div><div class='add'>+	s-&gt;sm.sb_flags = sb-&gt;s_flags &amp; (SB_RDONLY|SB_SYNCHRONOUS|SB_DIRSYNC|SB_LAZYTIME);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void statmount_mnt_basic(struct kstatmount *s)</div><div class='add'>+{</div><div class='add'>+	struct mount *m = real_mount(s-&gt;mnt);</div><div class='add'>+</div><div class='add'>+	s-&gt;sm.mask |= STATMOUNT_MNT_BASIC;</div><div class='add'>+	s-&gt;sm.mnt_id = m-&gt;mnt_id_unique;</div><div class='add'>+	s-&gt;sm.mnt_parent_id = m-&gt;mnt_parent-&gt;mnt_id_unique;</div><div class='add'>+	s-&gt;sm.mnt_id_old = m-&gt;mnt_id;</div><div class='add'>+	s-&gt;sm.mnt_parent_id_old = m-&gt;mnt_parent-&gt;mnt_id;</div><div class='add'>+	s-&gt;sm.mnt_attr = mnt_to_attr_flags(&amp;m-&gt;mnt);</div><div class='add'>+	s-&gt;sm.mnt_propagation = mnt_to_propagation_flags(m);</div><div class='add'>+	s-&gt;sm.mnt_peer_group = m-&gt;mnt_group_id;</div><div class='add'>+	s-&gt;sm.mnt_master = IS_MNT_SLAVE(m) ? m-&gt;mnt_master-&gt;mnt_group_id : 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void statmount_propagate_from(struct kstatmount *s)</div><div class='add'>+{</div><div class='add'>+	struct mount *m = real_mount(s-&gt;mnt);</div><div class='add'>+</div><div class='add'>+	s-&gt;sm.mask |= STATMOUNT_PROPAGATE_FROM;</div><div class='add'>+	if (IS_MNT_SLAVE(m))</div><div class='add'>+		s-&gt;sm.propagate_from = get_dominating_id(m, &amp;current-&gt;fs-&gt;root);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int statmount_mnt_root(struct kstatmount *s, struct seq_file *seq)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+	size_t start = seq-&gt;count;</div><div class='add'>+</div><div class='add'>+	ret = show_path(seq, s-&gt;mnt-&gt;mnt_root);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	if (unlikely(seq_has_overflowed(seq)))</div><div class='add'>+		return -EAGAIN;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+         * Unescape the result. It would be better if supplied string was not</div><div class='add'>+         * escaped in the first place, but that's a pretty invasive change.</div><div class='add'>+         */</div><div class='add'>+	seq-&gt;buf[seq-&gt;count] = '\0';</div><div class='add'>+	seq-&gt;count = start;</div><div class='add'>+	seq_commit(seq, string_unescape_inplace(seq-&gt;buf + start, UNESCAPE_OCTAL));</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int statmount_mnt_point(struct kstatmount *s, struct seq_file *seq)</div><div class='add'>+{</div><div class='add'>+	struct vfsmount *mnt = s-&gt;mnt;</div><div class='add'>+	struct path mnt_path = { .dentry = mnt-&gt;mnt_root, .mnt = mnt };</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = seq_path_root(seq, &amp;mnt_path, &amp;s-&gt;root, "");</div><div class='add'>+	return err == SEQ_SKIP ? 0 : err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int statmount_fs_type(struct kstatmount *s, struct seq_file *seq)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = s-&gt;mnt-&gt;mnt_sb;</div><div class='add'>+</div><div class='add'>+	seq_puts(seq, sb-&gt;s_type-&gt;name);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void statmount_fs_subtype(struct kstatmount *s, struct seq_file *seq)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = s-&gt;mnt-&gt;mnt_sb;</div><div class='add'>+</div><div class='add'>+	if (sb-&gt;s_subtype)</div><div class='add'>+		seq_puts(seq, sb-&gt;s_subtype);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int statmount_sb_source(struct kstatmount *s, struct seq_file *seq)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = s-&gt;mnt-&gt;mnt_sb;</div><div class='add'>+	struct mount *r = real_mount(s-&gt;mnt);</div><div class='add'>+</div><div class='add'>+	if (sb-&gt;s_op-&gt;show_devname) {</div><div class='add'>+		size_t start = seq-&gt;count;</div><div class='add'>+		int ret;</div><div class='add'>+</div><div class='add'>+		ret = sb-&gt;s_op-&gt;show_devname(seq, s-&gt;mnt-&gt;mnt_root);</div><div class='add'>+		if (ret)</div><div class='add'>+			return ret;</div><div class='add'>+</div><div class='add'>+		if (unlikely(seq_has_overflowed(seq)))</div><div class='add'>+			return -EAGAIN;</div><div class='add'>+</div><div class='add'>+		/* Unescape the result */</div><div class='add'>+		seq-&gt;buf[seq-&gt;count] = '\0';</div><div class='add'>+		seq-&gt;count = start;</div><div class='add'>+		seq_commit(seq, string_unescape_inplace(seq-&gt;buf + start, UNESCAPE_OCTAL));</div><div class='add'>+	} else {</div><div class='add'>+		seq_puts(seq, r-&gt;mnt_devname);</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void statmount_mnt_ns_id(struct kstatmount *s, struct mnt_namespace *ns)</div><div class='add'>+{</div><div class='add'>+	s-&gt;sm.mask |= STATMOUNT_MNT_NS_ID;</div><div class='add'>+	s-&gt;sm.mnt_ns_id = ns-&gt;ns.ns_id;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	err = copy_struct_from_user(&amp;attr, sizeof(attr), uattr, usize);</div><div class='add'>+static int statmount_mnt_opts(struct kstatmount *s, struct seq_file *seq)</div><div class='add'>+{</div><div class='add'>+	struct vfsmount *mnt = s-&gt;mnt;</div><div class='add'>+	struct super_block *sb = mnt-&gt;mnt_sb;</div><div class='add'>+	size_t start = seq-&gt;count;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = security_sb_show_options(seq, sb);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	/* Don't bother walking through the mounts if this is a nop. */</div><div class='del'>-	if (attr.attr_set == 0 &amp;&amp;</div><div class='del'>-	    attr.attr_clr == 0 &amp;&amp;</div><div class='del'>-	    attr.propagation == 0)</div><div class='add'>+	if (sb-&gt;s_op-&gt;show_options) {</div><div class='add'>+		err = sb-&gt;s_op-&gt;show_options(seq, mnt-&gt;mnt_root);</div><div class='add'>+		if (err)</div><div class='add'>+			return err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (unlikely(seq_has_overflowed(seq)))</div><div class='add'>+		return -EAGAIN;</div><div class='add'>+</div><div class='add'>+	if (seq-&gt;count == start)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	/* skip leading comma */</div><div class='add'>+	memmove(seq-&gt;buf + start, seq-&gt;buf + start + 1,</div><div class='add'>+		seq-&gt;count - start - 1);</div><div class='add'>+	seq-&gt;count--;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int statmount_opt_process(struct seq_file *seq, size_t start)</div><div class='add'>+{</div><div class='add'>+	char *buf_end, *opt_end, *src, *dst;</div><div class='add'>+	int count = 0;</div><div class='add'>+</div><div class='add'>+	if (unlikely(seq_has_overflowed(seq)))</div><div class='add'>+		return -EAGAIN;</div><div class='add'>+</div><div class='add'>+	buf_end = seq-&gt;buf + seq-&gt;count;</div><div class='add'>+	dst = seq-&gt;buf + start;</div><div class='add'>+	src = dst + 1;	/* skip initial comma */</div><div class='add'>+</div><div class='add'>+	if (src &gt;= buf_end) {</div><div class='add'>+		seq-&gt;count = start;</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	*buf_end = '\0';</div><div class='add'>+	for (; src &lt; buf_end; src = opt_end + 1) {</div><div class='add'>+		opt_end = strchrnul(src, ',');</div><div class='add'>+		*opt_end = '\0';</div><div class='add'>+		dst += string_unescape(src, dst, 0, UNESCAPE_OCTAL) + 1;</div><div class='add'>+		if (WARN_ON_ONCE(++count == INT_MAX))</div><div class='add'>+			return -EOVERFLOW;</div><div class='add'>+	}</div><div class='add'>+	seq-&gt;count = dst - 1 - seq-&gt;buf;</div><div class='add'>+	return count;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int statmount_opt_array(struct kstatmount *s, struct seq_file *seq)</div><div class='add'>+{</div><div class='add'>+	struct vfsmount *mnt = s-&gt;mnt;</div><div class='add'>+	struct super_block *sb = mnt-&gt;mnt_sb;</div><div class='add'>+	size_t start = seq-&gt;count;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	if (!sb-&gt;s_op-&gt;show_options)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	err = build_mount_kattr(&amp;attr, usize, &amp;kattr, flags);</div><div class='add'>+	err = sb-&gt;s_op-&gt;show_options(seq, mnt-&gt;mnt_root);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	err = user_path_at(dfd, path, kattr.lookup_flags, &amp;target);</div><div class='add'>+	err = statmount_opt_process(seq, start);</div><div class='add'>+	if (err &lt; 0)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	s-&gt;sm.opt_num = err;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int statmount_opt_sec_array(struct kstatmount *s, struct seq_file *seq)</div><div class='add'>+{</div><div class='add'>+	struct vfsmount *mnt = s-&gt;mnt;</div><div class='add'>+	struct super_block *sb = mnt-&gt;mnt_sb;</div><div class='add'>+	size_t start = seq-&gt;count;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = security_sb_show_options(seq, sb);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	err = do_mount_setattr(&amp;target, &amp;kattr);</div><div class='del'>-	finish_mount_kattr(&amp;kattr);</div><div class='del'>-	path_put(&amp;target);</div><div class='del'>-	return err;</div><div class='add'>+	err = statmount_opt_process(seq, start);</div><div class='add'>+	if (err &lt; 0)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	s-&gt;sm.opt_sec_num = err;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int statmount_mnt_uidmap(struct kstatmount *s, struct seq_file *seq)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = statmount_mnt_idmap(s-&gt;idmap, seq, true);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	s-&gt;sm.mnt_uidmap_num = ret;</div><div class='add'>+	/*</div><div class='add'>+	 * Always raise STATMOUNT_MNT_UIDMAP even if there are no valid</div><div class='add'>+	 * mappings. This allows userspace to distinguish between a</div><div class='add'>+	 * non-idmapped mount and an idmapped mount where none of the</div><div class='add'>+	 * individual mappings are valid in the caller's idmapping.</div><div class='add'>+	 */</div><div class='add'>+	if (is_valid_mnt_idmap(s-&gt;idmap))</div><div class='add'>+		s-&gt;sm.mask |= STATMOUNT_MNT_UIDMAP;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int statmount_mnt_gidmap(struct kstatmount *s, struct seq_file *seq)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = statmount_mnt_idmap(s-&gt;idmap, seq, false);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	s-&gt;sm.mnt_gidmap_num = ret;</div><div class='add'>+	/*</div><div class='add'>+	 * Always raise STATMOUNT_MNT_GIDMAP even if there are no valid</div><div class='add'>+	 * mappings. This allows userspace to distinguish between a</div><div class='add'>+	 * non-idmapped mount and an idmapped mount where none of the</div><div class='add'>+	 * individual mappings are valid in the caller's idmapping.</div><div class='add'>+	 */</div><div class='add'>+	if (is_valid_mnt_idmap(s-&gt;idmap))</div><div class='add'>+		s-&gt;sm.mask |= STATMOUNT_MNT_GIDMAP;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int statmount_string(struct kstatmount *s, u64 flag)</div><div class='add'>+{</div><div class='add'>+	int ret = 0;</div><div class='add'>+	size_t kbufsize;</div><div class='add'>+	struct seq_file *seq = &amp;s-&gt;seq;</div><div class='add'>+	struct statmount *sm = &amp;s-&gt;sm;</div><div class='add'>+	u32 start, *offp;</div><div class='add'>+</div><div class='add'>+	/* Reserve an empty string at the beginning for any unset offsets */</div><div class='add'>+	if (!seq-&gt;count)</div><div class='add'>+		seq_putc(seq, 0);</div><div class='add'>+</div><div class='add'>+	start = seq-&gt;count;</div><div class='add'>+</div><div class='add'>+	switch (flag) {</div><div class='add'>+	case STATMOUNT_FS_TYPE:</div><div class='add'>+		offp = &amp;sm-&gt;fs_type;</div><div class='add'>+		ret = statmount_fs_type(s, seq);</div><div class='add'>+		break;</div><div class='add'>+	case STATMOUNT_MNT_ROOT:</div><div class='add'>+		offp = &amp;sm-&gt;mnt_root;</div><div class='add'>+		ret = statmount_mnt_root(s, seq);</div><div class='add'>+		break;</div><div class='add'>+	case STATMOUNT_MNT_POINT:</div><div class='add'>+		offp = &amp;sm-&gt;mnt_point;</div><div class='add'>+		ret = statmount_mnt_point(s, seq);</div><div class='add'>+		break;</div><div class='add'>+	case STATMOUNT_MNT_OPTS:</div><div class='add'>+		offp = &amp;sm-&gt;mnt_opts;</div><div class='add'>+		ret = statmount_mnt_opts(s, seq);</div><div class='add'>+		break;</div><div class='add'>+	case STATMOUNT_OPT_ARRAY:</div><div class='add'>+		offp = &amp;sm-&gt;opt_array;</div><div class='add'>+		ret = statmount_opt_array(s, seq);</div><div class='add'>+		break;</div><div class='add'>+	case STATMOUNT_OPT_SEC_ARRAY:</div><div class='add'>+		offp = &amp;sm-&gt;opt_sec_array;</div><div class='add'>+		ret = statmount_opt_sec_array(s, seq);</div><div class='add'>+		break;</div><div class='add'>+	case STATMOUNT_FS_SUBTYPE:</div><div class='add'>+		offp = &amp;sm-&gt;fs_subtype;</div><div class='add'>+		statmount_fs_subtype(s, seq);</div><div class='add'>+		break;</div><div class='add'>+	case STATMOUNT_SB_SOURCE:</div><div class='add'>+		offp = &amp;sm-&gt;sb_source;</div><div class='add'>+		ret = statmount_sb_source(s, seq);</div><div class='add'>+		break;</div><div class='add'>+	case STATMOUNT_MNT_UIDMAP:</div><div class='add'>+		offp = &amp;sm-&gt;mnt_uidmap;</div><div class='add'>+		ret = statmount_mnt_uidmap(s, seq);</div><div class='add'>+		break;</div><div class='add'>+	case STATMOUNT_MNT_GIDMAP:</div><div class='add'>+		offp = &amp;sm-&gt;mnt_gidmap;</div><div class='add'>+		ret = statmount_mnt_gidmap(s, seq);</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		WARN_ON_ONCE(true);</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If nothing was emitted, return to avoid setting the flag</div><div class='add'>+	 * and terminating the buffer.</div><div class='add'>+	 */</div><div class='add'>+	if (seq-&gt;count == start)</div><div class='add'>+		return ret;</div><div class='add'>+	if (unlikely(check_add_overflow(sizeof(*sm), seq-&gt;count, &amp;kbufsize)))</div><div class='add'>+		return -EOVERFLOW;</div><div class='add'>+	if (kbufsize &gt;= s-&gt;bufsize)</div><div class='add'>+		return -EOVERFLOW;</div><div class='add'>+</div><div class='add'>+	/* signal a retry */</div><div class='add'>+	if (unlikely(seq_has_overflowed(seq)))</div><div class='add'>+		return -EAGAIN;</div><div class='add'>+</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	seq-&gt;buf[seq-&gt;count++] = '\0';</div><div class='add'>+	sm-&gt;mask |= flag;</div><div class='add'>+	*offp = start;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int copy_statmount_to_user(struct kstatmount *s)</div><div class='add'>+{</div><div class='add'>+	struct statmount *sm = &amp;s-&gt;sm;</div><div class='add'>+	struct seq_file *seq = &amp;s-&gt;seq;</div><div class='add'>+	char __user *str = ((char __user *)s-&gt;buf) + sizeof(*sm);</div><div class='add'>+	size_t copysize = min_t(size_t, s-&gt;bufsize, sizeof(*sm));</div><div class='add'>+</div><div class='add'>+	if (seq-&gt;count &amp;&amp; copy_to_user(str, seq-&gt;buf, seq-&gt;count))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+</div><div class='add'>+	/* Return the number of bytes copied to the buffer */</div><div class='add'>+	sm-&gt;size = copysize + seq-&gt;count;</div><div class='add'>+	if (copy_to_user(s-&gt;buf, sm, copysize))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct mount *listmnt_next(struct mount *curr, bool reverse)</div><div class='add'>+{</div><div class='add'>+	struct rb_node *node;</div><div class='add'>+</div><div class='add'>+	if (reverse)</div><div class='add'>+		node = rb_prev(&amp;curr-&gt;mnt_node);</div><div class='add'>+	else</div><div class='add'>+		node = rb_next(&amp;curr-&gt;mnt_node);</div><div class='add'>+</div><div class='add'>+	return node_to_mount(node);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int grab_requested_root(struct mnt_namespace *ns, struct path *root)</div><div class='add'>+{</div><div class='add'>+	struct mount *first, *child;</div><div class='add'>+</div><div class='add'>+	rwsem_assert_held(&amp;namespace_sem);</div><div class='add'>+</div><div class='add'>+	/* We're looking at our own ns, just use get_fs_root. */</div><div class='add'>+	if (ns == current-&gt;nsproxy-&gt;mnt_ns) {</div><div class='add'>+		get_fs_root(current-&gt;fs, root);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We have to find the first mount in our ns and use that, however it</div><div class='add'>+	 * may not exist, so handle that properly.</div><div class='add'>+	 */</div><div class='add'>+	if (mnt_ns_empty(ns))</div><div class='add'>+		return -ENOENT;</div><div class='add'>+</div><div class='add'>+	first = child = ns-&gt;root;</div><div class='add'>+	for (;;) {</div><div class='add'>+		child = listmnt_next(child, false);</div><div class='add'>+		if (!child)</div><div class='add'>+			return -ENOENT;</div><div class='add'>+		if (child-&gt;mnt_parent == first)</div><div class='add'>+			break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	root-&gt;mnt = mntget(&amp;child-&gt;mnt);</div><div class='add'>+	root-&gt;dentry = dget(root-&gt;mnt-&gt;mnt_root);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/* This must be updated whenever a new flag is added */</div><div class='add'>+#define STATMOUNT_SUPPORTED (STATMOUNT_SB_BASIC | \</div><div class='add'>+			     STATMOUNT_MNT_BASIC | \</div><div class='add'>+			     STATMOUNT_PROPAGATE_FROM | \</div><div class='add'>+			     STATMOUNT_MNT_ROOT | \</div><div class='add'>+			     STATMOUNT_MNT_POINT | \</div><div class='add'>+			     STATMOUNT_FS_TYPE | \</div><div class='add'>+			     STATMOUNT_MNT_NS_ID | \</div><div class='add'>+			     STATMOUNT_MNT_OPTS | \</div><div class='add'>+			     STATMOUNT_FS_SUBTYPE | \</div><div class='add'>+			     STATMOUNT_SB_SOURCE | \</div><div class='add'>+			     STATMOUNT_OPT_ARRAY | \</div><div class='add'>+			     STATMOUNT_OPT_SEC_ARRAY | \</div><div class='add'>+			     STATMOUNT_SUPPORTED_MASK | \</div><div class='add'>+			     STATMOUNT_MNT_UIDMAP | \</div><div class='add'>+			     STATMOUNT_MNT_GIDMAP)</div><div class='add'>+</div><div class='add'>+/* locks: namespace_shared */</div><div class='add'>+static int do_statmount(struct kstatmount *s, u64 mnt_id, u64 mnt_ns_id,</div><div class='add'>+			struct mnt_namespace *ns)</div><div class='add'>+{</div><div class='add'>+	struct mount *m;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	/* Has the namespace already been emptied? */</div><div class='add'>+	if (mnt_ns_id &amp;&amp; mnt_ns_empty(ns))</div><div class='add'>+		return -ENOENT;</div><div class='add'>+</div><div class='add'>+	s-&gt;mnt = lookup_mnt_in_ns(mnt_id, ns);</div><div class='add'>+	if (!s-&gt;mnt)</div><div class='add'>+		return -ENOENT;</div><div class='add'>+</div><div class='add'>+	err = grab_requested_root(ns, &amp;s-&gt;root);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Don't trigger audit denials. We just want to determine what</div><div class='add'>+	 * mounts to show users.</div><div class='add'>+	 */</div><div class='add'>+	m = real_mount(s-&gt;mnt);</div><div class='add'>+	if (!is_path_reachable(m, m-&gt;mnt.mnt_root, &amp;s-&gt;root) &amp;&amp;</div><div class='add'>+	    !ns_capable_noaudit(ns-&gt;user_ns, CAP_SYS_ADMIN))</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	err = security_sb_statfs(s-&gt;mnt-&gt;mnt_root);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Note that mount properties in mnt-&gt;mnt_flags, mnt-&gt;mnt_idmap</div><div class='add'>+	 * can change concurrently as we only hold the read-side of the</div><div class='add'>+	 * namespace semaphore and mount properties may change with only</div><div class='add'>+	 * the mount lock held.</div><div class='add'>+	 *</div><div class='add'>+	 * We could sample the mount lock sequence counter to detect</div><div class='add'>+	 * those changes and retry. But it's not worth it. Worst that</div><div class='add'>+	 * happens is that the mnt-&gt;mnt_idmap pointer is already changed</div><div class='add'>+	 * while mnt-&gt;mnt_flags isn't or vica versa. So what.</div><div class='add'>+	 *</div><div class='add'>+	 * Both mnt-&gt;mnt_flags and mnt-&gt;mnt_idmap are set and retrieved</div><div class='add'>+	 * via READ_ONCE()/WRITE_ONCE() and guard against theoretical</div><div class='add'>+	 * torn read/write. That's all we care about right now.</div><div class='add'>+	 */</div><div class='add'>+	s-&gt;idmap = mnt_idmap(s-&gt;mnt);</div><div class='add'>+	if (s-&gt;mask &amp; STATMOUNT_MNT_BASIC)</div><div class='add'>+		statmount_mnt_basic(s);</div><div class='add'>+</div><div class='add'>+	if (s-&gt;mask &amp; STATMOUNT_SB_BASIC)</div><div class='add'>+		statmount_sb_basic(s);</div><div class='add'>+</div><div class='add'>+	if (s-&gt;mask &amp; STATMOUNT_PROPAGATE_FROM)</div><div class='add'>+		statmount_propagate_from(s);</div><div class='add'>+</div><div class='add'>+	if (s-&gt;mask &amp; STATMOUNT_FS_TYPE)</div><div class='add'>+		err = statmount_string(s, STATMOUNT_FS_TYPE);</div><div class='add'>+</div><div class='add'>+	if (!err &amp;&amp; s-&gt;mask &amp; STATMOUNT_MNT_ROOT)</div><div class='add'>+		err = statmount_string(s, STATMOUNT_MNT_ROOT);</div><div class='add'>+</div><div class='add'>+	if (!err &amp;&amp; s-&gt;mask &amp; STATMOUNT_MNT_POINT)</div><div class='add'>+		err = statmount_string(s, STATMOUNT_MNT_POINT);</div><div class='add'>+</div><div class='add'>+	if (!err &amp;&amp; s-&gt;mask &amp; STATMOUNT_MNT_OPTS)</div><div class='add'>+		err = statmount_string(s, STATMOUNT_MNT_OPTS);</div><div class='add'>+</div><div class='add'>+	if (!err &amp;&amp; s-&gt;mask &amp; STATMOUNT_OPT_ARRAY)</div><div class='add'>+		err = statmount_string(s, STATMOUNT_OPT_ARRAY);</div><div class='add'>+</div><div class='add'>+	if (!err &amp;&amp; s-&gt;mask &amp; STATMOUNT_OPT_SEC_ARRAY)</div><div class='add'>+		err = statmount_string(s, STATMOUNT_OPT_SEC_ARRAY);</div><div class='add'>+</div><div class='add'>+	if (!err &amp;&amp; s-&gt;mask &amp; STATMOUNT_FS_SUBTYPE)</div><div class='add'>+		err = statmount_string(s, STATMOUNT_FS_SUBTYPE);</div><div class='add'>+</div><div class='add'>+	if (!err &amp;&amp; s-&gt;mask &amp; STATMOUNT_SB_SOURCE)</div><div class='add'>+		err = statmount_string(s, STATMOUNT_SB_SOURCE);</div><div class='add'>+</div><div class='add'>+	if (!err &amp;&amp; s-&gt;mask &amp; STATMOUNT_MNT_UIDMAP)</div><div class='add'>+		err = statmount_string(s, STATMOUNT_MNT_UIDMAP);</div><div class='add'>+</div><div class='add'>+	if (!err &amp;&amp; s-&gt;mask &amp; STATMOUNT_MNT_GIDMAP)</div><div class='add'>+		err = statmount_string(s, STATMOUNT_MNT_GIDMAP);</div><div class='add'>+</div><div class='add'>+	if (!err &amp;&amp; s-&gt;mask &amp; STATMOUNT_MNT_NS_ID)</div><div class='add'>+		statmount_mnt_ns_id(s, ns);</div><div class='add'>+</div><div class='add'>+	if (!err &amp;&amp; s-&gt;mask &amp; STATMOUNT_SUPPORTED_MASK) {</div><div class='add'>+		s-&gt;sm.mask |= STATMOUNT_SUPPORTED_MASK;</div><div class='add'>+		s-&gt;sm.supported_mask = STATMOUNT_SUPPORTED;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	/* Are there bits in the return mask not present in STATMOUNT_SUPPORTED? */</div><div class='add'>+	WARN_ON_ONCE(~STATMOUNT_SUPPORTED &amp; s-&gt;sm.mask);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool retry_statmount(const long ret, size_t *seq_size)</div><div class='add'>+{</div><div class='add'>+	if (likely(ret != -EAGAIN))</div><div class='add'>+		return false;</div><div class='add'>+	if (unlikely(check_mul_overflow(*seq_size, 2, seq_size)))</div><div class='add'>+		return false;</div><div class='add'>+	if (unlikely(*seq_size &gt; MAX_RW_COUNT))</div><div class='add'>+		return false;</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define STATMOUNT_STRING_REQ (STATMOUNT_MNT_ROOT | STATMOUNT_MNT_POINT | \</div><div class='add'>+			      STATMOUNT_FS_TYPE | STATMOUNT_MNT_OPTS | \</div><div class='add'>+			      STATMOUNT_FS_SUBTYPE | STATMOUNT_SB_SOURCE | \</div><div class='add'>+			      STATMOUNT_OPT_ARRAY | STATMOUNT_OPT_SEC_ARRAY | \</div><div class='add'>+			      STATMOUNT_MNT_UIDMAP | STATMOUNT_MNT_GIDMAP)</div><div class='add'>+</div><div class='add'>+static int prepare_kstatmount(struct kstatmount *ks, struct mnt_id_req *kreq,</div><div class='add'>+			      struct statmount __user *buf, size_t bufsize,</div><div class='add'>+			      size_t seq_size)</div><div class='add'>+{</div><div class='add'>+	if (!access_ok(buf, bufsize))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+</div><div class='add'>+	memset(ks, 0, sizeof(*ks));</div><div class='add'>+	ks-&gt;mask = kreq-&gt;param;</div><div class='add'>+	ks-&gt;buf = buf;</div><div class='add'>+	ks-&gt;bufsize = bufsize;</div><div class='add'>+</div><div class='add'>+	if (ks-&gt;mask &amp; STATMOUNT_STRING_REQ) {</div><div class='add'>+		if (bufsize == sizeof(ks-&gt;sm))</div><div class='add'>+			return -EOVERFLOW;</div><div class='add'>+</div><div class='add'>+		ks-&gt;seq.buf = kvmalloc(seq_size, GFP_KERNEL_ACCOUNT);</div><div class='add'>+		if (!ks-&gt;seq.buf)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+</div><div class='add'>+		ks-&gt;seq.size = seq_size;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int copy_mnt_id_req(const struct mnt_id_req __user *req,</div><div class='add'>+			   struct mnt_id_req *kreq)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+	size_t usize;</div><div class='add'>+</div><div class='add'>+	BUILD_BUG_ON(sizeof(struct mnt_id_req) != MNT_ID_REQ_SIZE_VER1);</div><div class='add'>+</div><div class='add'>+	ret = get_user(usize, &amp;req-&gt;size);</div><div class='add'>+	if (ret)</div><div class='add'>+		return -EFAULT;</div><div class='add'>+	if (unlikely(usize &gt; PAGE_SIZE))</div><div class='add'>+		return -E2BIG;</div><div class='add'>+	if (unlikely(usize &lt; MNT_ID_REQ_SIZE_VER0))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	memset(kreq, 0, sizeof(*kreq));</div><div class='add'>+	ret = copy_struct_from_user(kreq, sizeof(*kreq), req, usize);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+	if (kreq-&gt;mnt_ns_fd != 0 &amp;&amp; kreq-&gt;mnt_ns_id)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	/* The first valid unique mount id is MNT_UNIQUE_ID_OFFSET + 1. */</div><div class='add'>+	if (kreq-&gt;mnt_id &lt;= MNT_UNIQUE_ID_OFFSET)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * If the user requested a specific mount namespace id, look that up and return</div><div class='add'>+ * that, or if not simply grab a passive reference on our mount namespace and</div><div class='add'>+ * return that.</div><div class='add'>+ */</div><div class='add'>+static struct mnt_namespace *grab_requested_mnt_ns(const struct mnt_id_req *kreq)</div><div class='add'>+{</div><div class='add'>+	struct mnt_namespace *mnt_ns;</div><div class='add'>+</div><div class='add'>+	if (kreq-&gt;mnt_ns_id) {</div><div class='add'>+		mnt_ns = lookup_mnt_ns(kreq-&gt;mnt_ns_id);</div><div class='add'>+		if (!mnt_ns)</div><div class='add'>+			return ERR_PTR(-ENOENT);</div><div class='add'>+	} else if (kreq-&gt;mnt_ns_fd) {</div><div class='add'>+		struct ns_common *ns;</div><div class='add'>+</div><div class='add'>+		CLASS(fd, f)(kreq-&gt;mnt_ns_fd);</div><div class='add'>+		if (fd_empty(f))</div><div class='add'>+			return ERR_PTR(-EBADF);</div><div class='add'>+</div><div class='add'>+		if (!proc_ns_file(fd_file(f)))</div><div class='add'>+			return ERR_PTR(-EINVAL);</div><div class='add'>+</div><div class='add'>+		ns = get_proc_ns(file_inode(fd_file(f)));</div><div class='add'>+		if (ns-&gt;ns_type != CLONE_NEWNS)</div><div class='add'>+			return ERR_PTR(-EINVAL);</div><div class='add'>+</div><div class='add'>+		mnt_ns = to_mnt_ns(ns);</div><div class='add'>+		refcount_inc(&amp;mnt_ns-&gt;passive);</div><div class='add'>+	} else {</div><div class='add'>+		mnt_ns = current-&gt;nsproxy-&gt;mnt_ns;</div><div class='add'>+		refcount_inc(&amp;mnt_ns-&gt;passive);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return mnt_ns;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+SYSCALL_DEFINE4(statmount, const struct mnt_id_req __user *, req,</div><div class='add'>+		struct statmount __user *, buf, size_t, bufsize,</div><div class='add'>+		unsigned int, flags)</div><div class='add'>+{</div><div class='add'>+	struct mnt_namespace *ns __free(mnt_ns_release) = NULL;</div><div class='add'>+	struct kstatmount *ks __free(kfree) = NULL;</div><div class='add'>+	struct mnt_id_req kreq;</div><div class='add'>+	/* We currently support retrieval of 3 strings. */</div><div class='add'>+	size_t seq_size = 3 * PATH_MAX;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (flags)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	ret = copy_mnt_id_req(req, &amp;kreq);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	ns = grab_requested_mnt_ns(&amp;kreq);</div><div class='add'>+	if (IS_ERR(ns))</div><div class='add'>+		return PTR_ERR(ns);</div><div class='add'>+</div><div class='add'>+	if (kreq.mnt_ns_id &amp;&amp; (ns != current-&gt;nsproxy-&gt;mnt_ns) &amp;&amp;</div><div class='add'>+	    !ns_capable_noaudit(ns-&gt;user_ns, CAP_SYS_ADMIN))</div><div class='add'>+		return -ENOENT;</div><div class='add'>+</div><div class='add'>+	ks = kmalloc(sizeof(*ks), GFP_KERNEL_ACCOUNT);</div><div class='add'>+	if (!ks)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+retry:</div><div class='add'>+	ret = prepare_kstatmount(ks, &amp;kreq, buf, bufsize, seq_size);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	scoped_guard(namespace_shared)</div><div class='add'>+		ret = do_statmount(ks, kreq.mnt_id, kreq.mnt_ns_id, ns);</div><div class='add'>+</div><div class='add'>+	if (!ret)</div><div class='add'>+		ret = copy_statmount_to_user(ks);</div><div class='add'>+	kvfree(ks-&gt;seq.buf);</div><div class='add'>+	path_put(&amp;ks-&gt;root);</div><div class='add'>+	if (retry_statmount(ret, &amp;seq_size))</div><div class='add'>+		goto retry;</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct klistmount {</div><div class='add'>+	u64 last_mnt_id;</div><div class='add'>+	u64 mnt_parent_id;</div><div class='add'>+	u64 *kmnt_ids;</div><div class='add'>+	u32 nr_mnt_ids;</div><div class='add'>+	struct mnt_namespace *ns;</div><div class='add'>+	struct path root;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/* locks: namespace_shared */</div><div class='add'>+static ssize_t do_listmount(struct klistmount *kls, bool reverse)</div><div class='add'>+{</div><div class='add'>+	struct mnt_namespace *ns = kls-&gt;ns;</div><div class='add'>+	u64 mnt_parent_id = kls-&gt;mnt_parent_id;</div><div class='add'>+	u64 last_mnt_id = kls-&gt;last_mnt_id;</div><div class='add'>+	u64 *mnt_ids = kls-&gt;kmnt_ids;</div><div class='add'>+	size_t nr_mnt_ids = kls-&gt;nr_mnt_ids;</div><div class='add'>+	struct path orig;</div><div class='add'>+	struct mount *r, *first;</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	rwsem_assert_held(&amp;namespace_sem);</div><div class='add'>+</div><div class='add'>+	ret = grab_requested_root(ns, &amp;kls-&gt;root);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	if (mnt_parent_id == LSMT_ROOT) {</div><div class='add'>+		orig = kls-&gt;root;</div><div class='add'>+	} else {</div><div class='add'>+		orig.mnt = lookup_mnt_in_ns(mnt_parent_id, ns);</div><div class='add'>+		if (!orig.mnt)</div><div class='add'>+			return -ENOENT;</div><div class='add'>+		orig.dentry = orig.mnt-&gt;mnt_root;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Don't trigger audit denials. We just want to determine what</div><div class='add'>+	 * mounts to show users.</div><div class='add'>+	 */</div><div class='add'>+	if (!is_path_reachable(real_mount(orig.mnt), orig.dentry, &amp;kls-&gt;root) &amp;&amp;</div><div class='add'>+	    !ns_capable_noaudit(ns-&gt;user_ns, CAP_SYS_ADMIN))</div><div class='add'>+		return -EPERM;</div><div class='add'>+</div><div class='add'>+	ret = security_sb_statfs(orig.dentry);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	if (!last_mnt_id) {</div><div class='add'>+		if (reverse)</div><div class='add'>+			first = node_to_mount(ns-&gt;mnt_last_node);</div><div class='add'>+		else</div><div class='add'>+			first = node_to_mount(ns-&gt;mnt_first_node);</div><div class='add'>+	} else {</div><div class='add'>+		if (reverse)</div><div class='add'>+			first = mnt_find_id_at_reverse(ns, last_mnt_id - 1);</div><div class='add'>+		else</div><div class='add'>+			first = mnt_find_id_at(ns, last_mnt_id + 1);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for (ret = 0, r = first; r &amp;&amp; nr_mnt_ids; r = listmnt_next(r, reverse)) {</div><div class='add'>+		if (r-&gt;mnt_id_unique == mnt_parent_id)</div><div class='add'>+			continue;</div><div class='add'>+		if (!is_path_reachable(r, r-&gt;mnt.mnt_root, &amp;orig))</div><div class='add'>+			continue;</div><div class='add'>+		*mnt_ids = r-&gt;mnt_id_unique;</div><div class='add'>+		mnt_ids++;</div><div class='add'>+		nr_mnt_ids--;</div><div class='add'>+		ret++;</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void __free_klistmount_free(const struct klistmount *kls)</div><div class='add'>+{</div><div class='add'>+	path_put(&amp;kls-&gt;root);</div><div class='add'>+	kvfree(kls-&gt;kmnt_ids);</div><div class='add'>+	mnt_ns_release(kls-&gt;ns);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int prepare_klistmount(struct klistmount *kls, struct mnt_id_req *kreq,</div><div class='add'>+				     size_t nr_mnt_ids)</div><div class='add'>+{</div><div class='add'>+	u64 last_mnt_id = kreq-&gt;param;</div><div class='add'>+	struct mnt_namespace *ns;</div><div class='add'>+</div><div class='add'>+	/* The first valid unique mount id is MNT_UNIQUE_ID_OFFSET + 1. */</div><div class='add'>+	if (last_mnt_id != 0 &amp;&amp; last_mnt_id &lt;= MNT_UNIQUE_ID_OFFSET)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	kls-&gt;last_mnt_id = last_mnt_id;</div><div class='add'>+</div><div class='add'>+	kls-&gt;nr_mnt_ids = nr_mnt_ids;</div><div class='add'>+	kls-&gt;kmnt_ids = kvmalloc_array(nr_mnt_ids, sizeof(*kls-&gt;kmnt_ids),</div><div class='add'>+				       GFP_KERNEL_ACCOUNT);</div><div class='add'>+	if (!kls-&gt;kmnt_ids)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	ns = grab_requested_mnt_ns(kreq);</div><div class='add'>+	if (IS_ERR(ns))</div><div class='add'>+		return PTR_ERR(ns);</div><div class='add'>+	kls-&gt;ns = ns;</div><div class='add'>+</div><div class='add'>+	kls-&gt;mnt_parent_id = kreq-&gt;mnt_id;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+SYSCALL_DEFINE4(listmount, const struct mnt_id_req __user *, req,</div><div class='add'>+		u64 __user *, mnt_ids, size_t, nr_mnt_ids, unsigned int, flags)</div><div class='add'>+{</div><div class='add'>+	struct klistmount kls __free(klistmount_free) = {};</div><div class='add'>+	const size_t maxcount = 1000000;</div><div class='add'>+	struct mnt_id_req kreq;</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	if (flags &amp; ~LISTMOUNT_REVERSE)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If the mount namespace really has more than 1 million mounts the</div><div class='add'>+	 * caller must iterate over the mount namespace (and reconsider their</div><div class='add'>+	 * system design...).</div><div class='add'>+	 */</div><div class='add'>+	if (unlikely(nr_mnt_ids &gt; maxcount))</div><div class='add'>+		return -EOVERFLOW;</div><div class='add'>+</div><div class='add'>+	if (!access_ok(mnt_ids, nr_mnt_ids * sizeof(*mnt_ids)))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+</div><div class='add'>+	ret = copy_mnt_id_req(req, &amp;kreq);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	ret = prepare_klistmount(&amp;kls, &amp;kreq, nr_mnt_ids);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	if (kreq.mnt_ns_id &amp;&amp; (kls.ns != current-&gt;nsproxy-&gt;mnt_ns) &amp;&amp;</div><div class='add'>+	    !ns_capable_noaudit(kls.ns-&gt;user_ns, CAP_SYS_ADMIN))</div><div class='add'>+		return -ENOENT;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We only need to guard against mount topology changes as</div><div class='add'>+	 * listmount() doesn't care about any mount properties.</div><div class='add'>+	 */</div><div class='add'>+	scoped_guard(namespace_shared)</div><div class='add'>+		ret = do_listmount(&amp;kls, (flags &amp; LISTMOUNT_REVERSE));</div><div class='add'>+	if (ret &lt;= 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	if (copy_to_user(mnt_ids, kls.kmnt_ids, ret * sizeof(*mnt_ids)))</div><div class='add'>+		return -EFAULT;</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct mnt_namespace init_mnt_ns = {</div><div class='add'>+	.ns		= NS_COMMON_INIT(init_mnt_ns),</div><div class='add'>+	.user_ns	= &amp;init_user_ns,</div><div class='add'>+	.passive	= REFCOUNT_INIT(1),</div><div class='add'>+	.mounts		= RB_ROOT,</div><div class='add'>+	.poll		= __WAIT_QUEUE_HEAD_INITIALIZER(init_mnt_ns.poll),</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> static void __init init_mount_tree(void)</div><div class='ctx'> {</div><div class='ctx'> 	struct vfsmount *mnt;</div><div class='ctx'> 	struct mount *m;</div><div class='del'>-	struct mnt_namespace *ns;</div><div class='ctx'> 	struct path root;</div><div class='ctx'> </div><div class='del'>-	mnt = vfs_kern_mount(&amp;rootfs_fs_type, 0, "rootfs", NULL);</div><div class='add'>+	mnt = vfs_kern_mount(&amp;rootfs_fs_type, 0, "rootfs", initramfs_options);</div><div class='ctx'> 	if (IS_ERR(mnt))</div><div class='ctx'> 		panic("Can't create rootfs");</div><div class='ctx'> </div><div class='del'>-	ns = alloc_mnt_ns(&amp;init_user_ns, false);</div><div class='del'>-	if (IS_ERR(ns))</div><div class='del'>-		panic("Can't allocate initial namespace");</div><div class='ctx'> 	m = real_mount(mnt);</div><div class='del'>-	m-&gt;mnt_ns = ns;</div><div class='del'>-	ns-&gt;root = m;</div><div class='del'>-	ns-&gt;mounts = 1;</div><div class='del'>-	list_add(&amp;m-&gt;mnt_list, &amp;ns-&gt;list);</div><div class='del'>-	init_task.nsproxy-&gt;mnt_ns = ns;</div><div class='del'>-	get_mnt_ns(ns);</div><div class='add'>+	init_mnt_ns.root = m;</div><div class='add'>+	init_mnt_ns.nr_mounts = 1;</div><div class='add'>+	mnt_add_to_ns(&amp;init_mnt_ns, m);</div><div class='add'>+	init_task.nsproxy-&gt;mnt_ns = &amp;init_mnt_ns;</div><div class='add'>+	get_mnt_ns(&amp;init_mnt_ns);</div><div class='ctx'> </div><div class='ctx'> 	root.mnt = mnt;</div><div class='ctx'> 	root.dentry = mnt-&gt;mnt_root;</div><div class='del'>-	mnt-&gt;mnt_flags |= MNT_LOCKED;</div><div class='ctx'> </div><div class='ctx'> 	set_fs_pwd(current-&gt;fs, &amp;root);</div><div class='ctx'> 	set_fs_root(current-&gt;fs, &amp;root);</div><div class='add'>+</div><div class='add'>+	ns_tree_add(&amp;init_mnt_ns);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void __init mnt_init(void)</div><div class='hunk'>@@ -4339,10 +6030,12 @@ void __init mnt_init(void)</div><div class='ctx'> </div><div class='ctx'> void put_mnt_ns(struct mnt_namespace *ns)</div><div class='ctx'> {</div><div class='del'>-	if (!refcount_dec_and_test(&amp;ns-&gt;ns.count))</div><div class='add'>+	if (!ns_ref_put(ns))</div><div class='ctx'> 		return;</div><div class='del'>-	drop_collected_mounts(&amp;ns-&gt;root-&gt;mnt);</div><div class='del'>-	free_mnt_ns(ns);</div><div class='add'>+	guard(namespace_excl)();</div><div class='add'>+	emptied_ns = ns;</div><div class='add'>+	guard(mount_writer)();</div><div class='add'>+	umount_tree(ns-&gt;root, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct vfsmount *kern_mount(struct file_system_type *type)</div><div class='hunk'>@@ -4363,8 +6056,8 @@ EXPORT_SYMBOL_GPL(kern_mount);</div><div class='ctx'> void kern_unmount(struct vfsmount *mnt)</div><div class='ctx'> {</div><div class='ctx'> 	/* release long term mount so mount point can be released */</div><div class='del'>-	if (!IS_ERR_OR_NULL(mnt)) {</div><div class='del'>-		real_mount(mnt)-&gt;mnt_ns = NULL;</div><div class='add'>+	if (!IS_ERR(mnt)) {</div><div class='add'>+		mnt_make_shortterm(mnt);</div><div class='ctx'> 		synchronize_rcu();	/* yecchhh... */</div><div class='ctx'> 		mntput(mnt);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -4376,8 +6069,7 @@ void kern_unmount_array(struct vfsmount *mnt[], unsigned int num)</div><div class='ctx'> 	unsigned int i;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; num; i++)</div><div class='del'>-		if (mnt[i])</div><div class='del'>-			real_mount(mnt[i])-&gt;mnt_ns = NULL;</div><div class='add'>+		mnt_make_shortterm(mnt[i]);</div><div class='ctx'> 	synchronize_rcu_expedited();</div><div class='ctx'> 	for (i = 0; i &lt; num; i++)</div><div class='ctx'> 		mntput(mnt[i]);</div><div class='hunk'>@@ -4392,25 +6084,18 @@ bool our_mnt(struct vfsmount *mnt)</div><div class='ctx'> bool current_chrooted(void)</div><div class='ctx'> {</div><div class='ctx'> 	/* Does the current process have a non-standard root */</div><div class='del'>-	struct path ns_root;</div><div class='del'>-	struct path fs_root;</div><div class='del'>-	bool chrooted;</div><div class='del'>-</div><div class='del'>-	/* Find the namespace root */</div><div class='del'>-	ns_root.mnt = &amp;current-&gt;nsproxy-&gt;mnt_ns-&gt;root-&gt;mnt;</div><div class='del'>-	ns_root.dentry = ns_root.mnt-&gt;mnt_root;</div><div class='del'>-	path_get(&amp;ns_root);</div><div class='del'>-	while (d_mountpoint(ns_root.dentry) &amp;&amp; follow_down_one(&amp;ns_root))</div><div class='del'>-		;</div><div class='add'>+	struct path fs_root __free(path_put) = {};</div><div class='add'>+	struct mount *root;</div><div class='ctx'> </div><div class='ctx'> 	get_fs_root(current-&gt;fs, &amp;fs_root);</div><div class='ctx'> </div><div class='del'>-	chrooted = !path_equal(&amp;fs_root, &amp;ns_root);</div><div class='add'>+	/* Find the namespace root */</div><div class='add'>+</div><div class='add'>+	guard(mount_locked_reader)();</div><div class='ctx'> </div><div class='del'>-	path_put(&amp;fs_root);</div><div class='del'>-	path_put(&amp;ns_root);</div><div class='add'>+	root = topmost_overmount(current-&gt;nsproxy-&gt;mnt_ns-&gt;root);</div><div class='ctx'> </div><div class='del'>-	return chrooted;</div><div class='add'>+	return fs_root.mnt != &amp;root-&gt;mnt || !path_mounted(&amp;fs_root);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool mnt_already_visible(struct mnt_namespace *ns,</div><div class='hunk'>@@ -4418,18 +6103,13 @@ static bool mnt_already_visible(struct mnt_namespace *ns,</div><div class='ctx'> 				int *new_mnt_flags)</div><div class='ctx'> {</div><div class='ctx'> 	int new_flags = *new_mnt_flags;</div><div class='del'>-	struct mount *mnt;</div><div class='del'>-	bool visible = false;</div><div class='add'>+	struct mount *mnt, *n;</div><div class='ctx'> </div><div class='del'>-	down_read(&amp;namespace_sem);</div><div class='del'>-	lock_ns_list(ns);</div><div class='del'>-	list_for_each_entry(mnt, &amp;ns-&gt;list, mnt_list) {</div><div class='add'>+	guard(namespace_shared)();</div><div class='add'>+	rbtree_postorder_for_each_entry_safe(mnt, n, &amp;ns-&gt;mounts, mnt_node) {</div><div class='ctx'> 		struct mount *child;</div><div class='ctx'> 		int mnt_flags;</div><div class='ctx'> </div><div class='del'>-		if (mnt_is_cursor(mnt))</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='ctx'> 		if (mnt-&gt;mnt.mnt_sb-&gt;s_type != sb-&gt;s_type)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='hunk'>@@ -4465,21 +6145,17 @@ static bool mnt_already_visible(struct mnt_namespace *ns,</div><div class='ctx'> 			/* Only worry about locked mounts */</div><div class='ctx'> 			if (!(child-&gt;mnt.mnt_flags &amp; MNT_LOCKED))</div><div class='ctx'> 				continue;</div><div class='del'>-			/* Is the directory permanetly empty? */</div><div class='add'>+			/* Is the directory permanently empty? */</div><div class='ctx'> 			if (!is_empty_dir_inode(inode))</div><div class='ctx'> 				goto next;</div><div class='ctx'> 		}</div><div class='ctx'> 		/* Preserve the locked attributes */</div><div class='ctx'> 		*new_mnt_flags |= mnt_flags &amp; (MNT_LOCK_READONLY | \</div><div class='ctx'> 					       MNT_LOCK_ATIME);</div><div class='del'>-		visible = true;</div><div class='del'>-		goto found;</div><div class='add'>+		return true;</div><div class='ctx'> 	next:	;</div><div class='ctx'> 	}</div><div class='del'>-found:</div><div class='del'>-	unlock_ns_list(ns);</div><div class='del'>-	up_read(&amp;namespace_sem);</div><div class='del'>-	return visible;</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool mount_too_revealing(const struct super_block *sb, int *new_mnt_flags)</div><div class='hunk'>@@ -4590,9 +6266,29 @@ static struct user_namespace *mntns_owner(struct ns_common *ns)</div><div class='ctx'> </div><div class='ctx'> const struct proc_ns_operations mntns_operations = {</div><div class='ctx'> 	.name		= "mnt",</div><div class='del'>-	.type		= CLONE_NEWNS,</div><div class='ctx'> 	.get		= mntns_get,</div><div class='ctx'> 	.put		= mntns_put,</div><div class='ctx'> 	.install	= mntns_install,</div><div class='ctx'> 	.owner		= mntns_owner,</div><div class='ctx'> };</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_SYSCTL</div><div class='add'>+static const struct ctl_table fs_namespace_sysctls[] = {</div><div class='add'>+	{</div><div class='add'>+		.procname	= "mount-max",</div><div class='add'>+		.data		= &amp;sysctl_mount_max,</div><div class='add'>+		.maxlen		= sizeof(unsigned int),</div><div class='add'>+		.mode		= 0644,</div><div class='add'>+		.proc_handler	= proc_dointvec_minmax,</div><div class='add'>+		.extra1		= SYSCTL_ONE,</div><div class='add'>+	},</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static int __init init_fs_namespace_sysctls(void)</div><div class='add'>+{</div><div class='add'>+	register_sysctl_init("fs", fs_namespace_sysctls);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+fs_initcall(init_fs_namespace_sysctls);</div><div class='add'>+</div><div class='add'>+#endif /* CONFIG_SYSCTL */</div><div class='head'>diff --git a/fs/netfs/Kconfig b/fs/netfs/Kconfig<br/>index b4db21022cb4..7701c037c328 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/netfs/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/Kconfig</a></div><div class='hunk'>@@ -21,3 +21,40 @@ config NETFS_STATS</div><div class='ctx'> 	  multi-CPU system these may be on cachelines that keep bouncing</div><div class='ctx'> 	  between CPUs.  On the other hand, the stats are very useful for</div><div class='ctx'> 	  debugging purposes.  Saying 'Y' here is recommended.</div><div class='add'>+</div><div class='add'>+config NETFS_DEBUG</div><div class='add'>+	bool "Enable dynamic debugging netfslib and FS-Cache"</div><div class='add'>+	depends on NETFS_SUPPORT</div><div class='add'>+	help</div><div class='add'>+	  This permits debugging to be dynamically enabled in the local caching</div><div class='add'>+	  management module.  If this is set, the debugging output may be</div><div class='add'>+	  enabled by setting bits in /sys/module/netfs/parameters/debug.</div><div class='add'>+</div><div class='add'>+config FSCACHE</div><div class='add'>+	bool "General filesystem local caching manager"</div><div class='add'>+	depends on NETFS_SUPPORT</div><div class='add'>+	help</div><div class='add'>+	  This option enables a generic filesystem caching manager that can be</div><div class='add'>+	  used by various network and other filesystems to cache data locally.</div><div class='add'>+	  Different sorts of caches can be plugged in, depending on the</div><div class='add'>+	  resources available.</div><div class='add'>+</div><div class='add'>+	  See Documentation/filesystems/caching/fscache.rst for more information.</div><div class='add'>+</div><div class='add'>+config FSCACHE_STATS</div><div class='add'>+	bool "Gather statistical information on local caching"</div><div class='add'>+	depends on FSCACHE &amp;&amp; PROC_FS</div><div class='add'>+	select NETFS_STATS</div><div class='add'>+	help</div><div class='add'>+	  This option causes statistical information to be gathered on local</div><div class='add'>+	  caching and exported through file:</div><div class='add'>+</div><div class='add'>+		/proc/fs/fscache/stats</div><div class='add'>+</div><div class='add'>+	  The gathering of statistics adds a certain amount of overhead to</div><div class='add'>+	  execution as there are a quite a few stats gathered, and on a</div><div class='add'>+	  multi-CPU system these may be on cachelines that keep bouncing</div><div class='add'>+	  between CPUs.  On the other hand, the stats are very useful for</div><div class='add'>+	  debugging purposes.  Saying 'Y' here is recommended.</div><div class='add'>+</div><div class='add'>+	  See Documentation/filesystems/caching/fscache.rst for more information.</div><div class='head'>diff --git a/fs/netfs/Makefile b/fs/netfs/Makefile<br/>index c15bfc966d96..b43188d64bd8 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/netfs/Makefile?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/Makefile</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/Makefile?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/Makefile</a></div><div class='hunk'>@@ -1,5 +1,36 @@</div><div class='ctx'> # SPDX-License-Identifier: GPL-2.0</div><div class='ctx'> </div><div class='del'>-netfs-y := read_helper.o stats.o</div><div class='add'>+netfs-y := \</div><div class='add'>+	buffered_read.o \</div><div class='add'>+	buffered_write.o \</div><div class='add'>+	direct_read.o \</div><div class='add'>+	direct_write.o \</div><div class='add'>+	iterator.o \</div><div class='add'>+	locking.o \</div><div class='add'>+	main.o \</div><div class='add'>+	misc.o \</div><div class='add'>+	objects.o \</div><div class='add'>+	read_collect.o \</div><div class='add'>+	read_pgpriv2.o \</div><div class='add'>+	read_retry.o \</div><div class='add'>+	read_single.o \</div><div class='add'>+	rolling_buffer.o \</div><div class='add'>+	write_collect.o \</div><div class='add'>+	write_issue.o \</div><div class='add'>+	write_retry.o</div><div class='ctx'> </div><div class='del'>-obj-$(CONFIG_NETFS_SUPPORT) := netfs.o</div><div class='add'>+netfs-$(CONFIG_NETFS_STATS) += stats.o</div><div class='add'>+</div><div class='add'>+netfs-$(CONFIG_FSCACHE) += \</div><div class='add'>+	fscache_cache.o \</div><div class='add'>+	fscache_cookie.o \</div><div class='add'>+	fscache_io.o \</div><div class='add'>+	fscache_main.o \</div><div class='add'>+	fscache_volume.o</div><div class='add'>+</div><div class='add'>+ifeq ($(CONFIG_PROC_FS),y)</div><div class='add'>+netfs-$(CONFIG_FSCACHE) += fscache_proc.o</div><div class='add'>+endif</div><div class='add'>+netfs-$(CONFIG_FSCACHE_STATS) += fscache_stats.o</div><div class='add'>+</div><div class='add'>+obj-$(CONFIG_NETFS_SUPPORT) += netfs.o</div><div class='head'>diff --git a/fs/netfs/buffered_read.c b/fs/netfs/buffered_read.c<br/>new file mode 100644<br/>index 000000000000..37ab6f28b5ad<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/buffered_read.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/buffered_read.c</a></div><div class='hunk'>@@ -0,0 +1,834 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='add'>+/* Network filesystem high-level buffered read support.</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2021 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/export.h&gt;</div><div class='add'>+#include &lt;linux/task_io_accounting_ops.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+static void netfs_cache_expand_readahead(struct netfs_io_request *rreq,</div><div class='add'>+					 unsigned long long *_start,</div><div class='add'>+					 unsigned long long *_len,</div><div class='add'>+					 unsigned long long i_size)</div><div class='add'>+{</div><div class='add'>+	struct netfs_cache_resources *cres = &amp;rreq-&gt;cache_resources;</div><div class='add'>+</div><div class='add'>+	if (cres-&gt;ops &amp;&amp; cres-&gt;ops-&gt;expand_readahead)</div><div class='add'>+		cres-&gt;ops-&gt;expand_readahead(cres, _start, _len, i_size);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void netfs_rreq_expand(struct netfs_io_request *rreq,</div><div class='add'>+			      struct readahead_control *ractl)</div><div class='add'>+{</div><div class='add'>+	/* Give the cache a chance to change the request parameters.  The</div><div class='add'>+	 * resultant request must contain the original region.</div><div class='add'>+	 */</div><div class='add'>+	netfs_cache_expand_readahead(rreq, &amp;rreq-&gt;start, &amp;rreq-&gt;len, rreq-&gt;i_size);</div><div class='add'>+</div><div class='add'>+	/* Give the netfs a chance to change the request parameters.  The</div><div class='add'>+	 * resultant request must contain the original region.</div><div class='add'>+	 */</div><div class='add'>+	if (rreq-&gt;netfs_ops-&gt;expand_readahead)</div><div class='add'>+		rreq-&gt;netfs_ops-&gt;expand_readahead(rreq);</div><div class='add'>+</div><div class='add'>+	/* Expand the request if the cache wants it to start earlier.  Note</div><div class='add'>+	 * that the expansion may get further extended if the VM wishes to</div><div class='add'>+	 * insert THPs and the preferred start and/or end wind up in the middle</div><div class='add'>+	 * of THPs.</div><div class='add'>+	 *</div><div class='add'>+	 * If this is the case, however, the THP size should be an integer</div><div class='add'>+	 * multiple of the cache granule size, so we get a whole number of</div><div class='add'>+	 * granules to deal with.</div><div class='add'>+	 */</div><div class='add'>+	if (rreq-&gt;start  != readahead_pos(ractl) ||</div><div class='add'>+	    rreq-&gt;len != readahead_length(ractl)) {</div><div class='add'>+		readahead_expand(ractl, rreq-&gt;start, rreq-&gt;len);</div><div class='add'>+		rreq-&gt;start  = readahead_pos(ractl);</div><div class='add'>+		rreq-&gt;len = readahead_length(ractl);</div><div class='add'>+</div><div class='add'>+		trace_netfs_read(rreq, readahead_pos(ractl), readahead_length(ractl),</div><div class='add'>+				 netfs_read_trace_expanded);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Begin an operation, and fetch the stored zero point value from the cookie if</div><div class='add'>+ * available.</div><div class='add'>+ */</div><div class='add'>+static int netfs_begin_cache_read(struct netfs_io_request *rreq, struct netfs_inode *ctx)</div><div class='add'>+{</div><div class='add'>+	return fscache_begin_read_operation(&amp;rreq-&gt;cache_resources, netfs_i_cookie(ctx));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * netfs_prepare_read_iterator - Prepare the subreq iterator for I/O</div><div class='add'>+ * @subreq: The subrequest to be set up</div><div class='add'>+ *</div><div class='add'>+ * Prepare the I/O iterator representing the read buffer on a subrequest for</div><div class='add'>+ * the filesystem to use for I/O (it can be passed directly to a socket).  This</div><div class='add'>+ * is intended to be called from the -&gt;issue_read() method once the filesystem</div><div class='add'>+ * has trimmed the request to the size it wants.</div><div class='add'>+ *</div><div class='add'>+ * Returns the limited size if successful and -ENOMEM if insufficient memory</div><div class='add'>+ * available.</div><div class='add'>+ *</div><div class='add'>+ * [!] NOTE: This must be run in the same thread as -&gt;issue_read() was called</div><div class='add'>+ * in as we access the readahead_control struct.</div><div class='add'>+ */</div><div class='add'>+static ssize_t netfs_prepare_read_iterator(struct netfs_io_subrequest *subreq,</div><div class='add'>+					   struct readahead_control *ractl)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *rreq = subreq-&gt;rreq;</div><div class='add'>+	size_t rsize = subreq-&gt;len;</div><div class='add'>+</div><div class='add'>+	if (subreq-&gt;source == NETFS_DOWNLOAD_FROM_SERVER)</div><div class='add'>+		rsize = umin(rsize, rreq-&gt;io_streams[0].sreq_max_len);</div><div class='add'>+</div><div class='add'>+	if (ractl) {</div><div class='add'>+		/* If we don't have sufficient folios in the rolling buffer,</div><div class='add'>+		 * extract a folioq's worth from the readahead region at a time</div><div class='add'>+		 * into the buffer.  Note that this acquires a ref on each page</div><div class='add'>+		 * that we will need to release later - but we don't want to do</div><div class='add'>+		 * that until after we've started the I/O.</div><div class='add'>+		 */</div><div class='add'>+		struct folio_batch put_batch;</div><div class='add'>+</div><div class='add'>+		folio_batch_init(&amp;put_batch);</div><div class='add'>+		while (rreq-&gt;submitted &lt; subreq-&gt;start + rsize) {</div><div class='add'>+			ssize_t added;</div><div class='add'>+</div><div class='add'>+			added = rolling_buffer_load_from_ra(&amp;rreq-&gt;buffer, ractl,</div><div class='add'>+							    &amp;put_batch);</div><div class='add'>+			if (added &lt; 0)</div><div class='add'>+				return added;</div><div class='add'>+			rreq-&gt;submitted += added;</div><div class='add'>+		}</div><div class='add'>+		folio_batch_release(&amp;put_batch);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	subreq-&gt;len = rsize;</div><div class='add'>+	if (unlikely(rreq-&gt;io_streams[0].sreq_max_segs)) {</div><div class='add'>+		size_t limit = netfs_limit_iter(&amp;rreq-&gt;buffer.iter, 0, rsize,</div><div class='add'>+						rreq-&gt;io_streams[0].sreq_max_segs);</div><div class='add'>+</div><div class='add'>+		if (limit &lt; rsize) {</div><div class='add'>+			subreq-&gt;len = limit;</div><div class='add'>+			trace_netfs_sreq(subreq, netfs_sreq_trace_limited);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	subreq-&gt;io_iter	= rreq-&gt;buffer.iter;</div><div class='add'>+</div><div class='add'>+	iov_iter_truncate(&amp;subreq-&gt;io_iter, subreq-&gt;len);</div><div class='add'>+	rolling_buffer_advance(&amp;rreq-&gt;buffer, subreq-&gt;len);</div><div class='add'>+	return subreq-&gt;len;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static enum netfs_io_source netfs_cache_prepare_read(struct netfs_io_request *rreq,</div><div class='add'>+						     struct netfs_io_subrequest *subreq,</div><div class='add'>+						     loff_t i_size)</div><div class='add'>+{</div><div class='add'>+	struct netfs_cache_resources *cres = &amp;rreq-&gt;cache_resources;</div><div class='add'>+	enum netfs_io_source source;</div><div class='add'>+</div><div class='add'>+	if (!cres-&gt;ops)</div><div class='add'>+		return NETFS_DOWNLOAD_FROM_SERVER;</div><div class='add'>+	source = cres-&gt;ops-&gt;prepare_read(subreq, i_size);</div><div class='add'>+	trace_netfs_sreq(subreq, netfs_sreq_trace_prepare);</div><div class='add'>+	return source;</div><div class='add'>+</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Issue a read against the cache.</div><div class='add'>+ * - Eats the caller's ref on subreq.</div><div class='add'>+ */</div><div class='add'>+static void netfs_read_cache_to_pagecache(struct netfs_io_request *rreq,</div><div class='add'>+					  struct netfs_io_subrequest *subreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_cache_resources *cres = &amp;rreq-&gt;cache_resources;</div><div class='add'>+</div><div class='add'>+	netfs_stat(&amp;netfs_n_rh_read);</div><div class='add'>+	cres-&gt;ops-&gt;read(cres, subreq-&gt;start, &amp;subreq-&gt;io_iter, NETFS_READ_HOLE_IGNORE,</div><div class='add'>+			netfs_cache_read_terminated, subreq);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void netfs_queue_read(struct netfs_io_request *rreq,</div><div class='add'>+			     struct netfs_io_subrequest *subreq,</div><div class='add'>+			     bool last_subreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_stream *stream = &amp;rreq-&gt;io_streams[0];</div><div class='add'>+</div><div class='add'>+	__set_bit(NETFS_SREQ_IN_PROGRESS, &amp;subreq-&gt;flags);</div><div class='add'>+</div><div class='add'>+	/* We add to the end of the list whilst the collector may be walking</div><div class='add'>+	 * the list.  The collector only goes nextwards and uses the lock to</div><div class='add'>+	 * remove entries off of the front.</div><div class='add'>+	 */</div><div class='add'>+	spin_lock(&amp;rreq-&gt;lock);</div><div class='add'>+	list_add_tail(&amp;subreq-&gt;rreq_link, &amp;stream-&gt;subrequests);</div><div class='add'>+	if (list_is_first(&amp;subreq-&gt;rreq_link, &amp;stream-&gt;subrequests)) {</div><div class='add'>+		stream-&gt;front = subreq;</div><div class='add'>+		if (!stream-&gt;active) {</div><div class='add'>+			stream-&gt;collected_to = stream-&gt;front-&gt;start;</div><div class='add'>+			/* Store list pointers before active flag */</div><div class='add'>+			smp_store_release(&amp;stream-&gt;active, true);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (last_subreq) {</div><div class='add'>+		smp_wmb(); /* Write lists before ALL_QUEUED. */</div><div class='add'>+		set_bit(NETFS_RREQ_ALL_QUEUED, &amp;rreq-&gt;flags);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_unlock(&amp;rreq-&gt;lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void netfs_issue_read(struct netfs_io_request *rreq,</div><div class='add'>+			     struct netfs_io_subrequest *subreq)</div><div class='add'>+{</div><div class='add'>+	switch (subreq-&gt;source) {</div><div class='add'>+	case NETFS_DOWNLOAD_FROM_SERVER:</div><div class='add'>+		rreq-&gt;netfs_ops-&gt;issue_read(subreq);</div><div class='add'>+		break;</div><div class='add'>+	case NETFS_READ_FROM_CACHE:</div><div class='add'>+		netfs_read_cache_to_pagecache(rreq, subreq);</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		__set_bit(NETFS_SREQ_CLEAR_TAIL, &amp;subreq-&gt;flags);</div><div class='add'>+		subreq-&gt;error = 0;</div><div class='add'>+		iov_iter_zero(subreq-&gt;len, &amp;subreq-&gt;io_iter);</div><div class='add'>+		subreq-&gt;transferred = subreq-&gt;len;</div><div class='add'>+		netfs_read_subreq_terminated(subreq);</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Perform a read to the pagecache from a series of sources of different types,</div><div class='add'>+ * slicing up the region to be read according to available cache blocks and</div><div class='add'>+ * network rsize.</div><div class='add'>+ */</div><div class='add'>+static void netfs_read_to_pagecache(struct netfs_io_request *rreq,</div><div class='add'>+				    struct readahead_control *ractl)</div><div class='add'>+{</div><div class='add'>+	struct netfs_inode *ictx = netfs_inode(rreq-&gt;inode);</div><div class='add'>+	unsigned long long start = rreq-&gt;start;</div><div class='add'>+	ssize_t size = rreq-&gt;len;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		struct netfs_io_subrequest *subreq;</div><div class='add'>+		enum netfs_io_source source = NETFS_SOURCE_UNKNOWN;</div><div class='add'>+		ssize_t slice;</div><div class='add'>+</div><div class='add'>+		subreq = netfs_alloc_subrequest(rreq);</div><div class='add'>+		if (!subreq) {</div><div class='add'>+			ret = -ENOMEM;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		subreq-&gt;start	= start;</div><div class='add'>+		subreq-&gt;len	= size;</div><div class='add'>+</div><div class='add'>+		source = netfs_cache_prepare_read(rreq, subreq, rreq-&gt;i_size);</div><div class='add'>+		subreq-&gt;source = source;</div><div class='add'>+		if (source == NETFS_DOWNLOAD_FROM_SERVER) {</div><div class='add'>+			unsigned long long zp = umin(ictx-&gt;zero_point, rreq-&gt;i_size);</div><div class='add'>+			size_t len = subreq-&gt;len;</div><div class='add'>+</div><div class='add'>+			if (unlikely(rreq-&gt;origin == NETFS_READ_SINGLE))</div><div class='add'>+				zp = rreq-&gt;i_size;</div><div class='add'>+			if (subreq-&gt;start &gt;= zp) {</div><div class='add'>+				subreq-&gt;source = source = NETFS_FILL_WITH_ZEROES;</div><div class='add'>+				goto fill_with_zeroes;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			if (len &gt; zp - subreq-&gt;start)</div><div class='add'>+				len = zp - subreq-&gt;start;</div><div class='add'>+			if (len == 0) {</div><div class='add'>+				pr_err("ZERO-LEN READ: R=%08x[%x] l=%zx/%zx s=%llx z=%llx i=%llx",</div><div class='add'>+				       rreq-&gt;debug_id, subreq-&gt;debug_index,</div><div class='add'>+				       subreq-&gt;len, size,</div><div class='add'>+				       subreq-&gt;start, ictx-&gt;zero_point, rreq-&gt;i_size);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+			subreq-&gt;len = len;</div><div class='add'>+</div><div class='add'>+			netfs_stat(&amp;netfs_n_rh_download);</div><div class='add'>+			if (rreq-&gt;netfs_ops-&gt;prepare_read) {</div><div class='add'>+				ret = rreq-&gt;netfs_ops-&gt;prepare_read(subreq);</div><div class='add'>+				if (ret &lt; 0) {</div><div class='add'>+					subreq-&gt;error = ret;</div><div class='add'>+					/* Not queued - release both refs. */</div><div class='add'>+					netfs_put_subrequest(subreq,</div><div class='add'>+							     netfs_sreq_trace_put_cancel);</div><div class='add'>+					netfs_put_subrequest(subreq,</div><div class='add'>+							     netfs_sreq_trace_put_cancel);</div><div class='add'>+					break;</div><div class='add'>+				}</div><div class='add'>+				trace_netfs_sreq(subreq, netfs_sreq_trace_prepare);</div><div class='add'>+			}</div><div class='add'>+			goto issue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+	fill_with_zeroes:</div><div class='add'>+		if (source == NETFS_FILL_WITH_ZEROES) {</div><div class='add'>+			subreq-&gt;source = NETFS_FILL_WITH_ZEROES;</div><div class='add'>+			trace_netfs_sreq(subreq, netfs_sreq_trace_submit);</div><div class='add'>+			netfs_stat(&amp;netfs_n_rh_zero);</div><div class='add'>+			goto issue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (source == NETFS_READ_FROM_CACHE) {</div><div class='add'>+			trace_netfs_sreq(subreq, netfs_sreq_trace_submit);</div><div class='add'>+			goto issue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		pr_err("Unexpected read source %u\n", source);</div><div class='add'>+		WARN_ON_ONCE(1);</div><div class='add'>+		break;</div><div class='add'>+</div><div class='add'>+	issue:</div><div class='add'>+		slice = netfs_prepare_read_iterator(subreq, ractl);</div><div class='add'>+		if (slice &lt; 0) {</div><div class='add'>+			ret = slice;</div><div class='add'>+			subreq-&gt;error = ret;</div><div class='add'>+			trace_netfs_sreq(subreq, netfs_sreq_trace_cancel);</div><div class='add'>+			/* Not queued - release both refs. */</div><div class='add'>+			netfs_put_subrequest(subreq, netfs_sreq_trace_put_cancel);</div><div class='add'>+			netfs_put_subrequest(subreq, netfs_sreq_trace_put_cancel);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		size -= slice;</div><div class='add'>+		start += slice;</div><div class='add'>+</div><div class='add'>+		netfs_queue_read(rreq, subreq, size &lt;= 0);</div><div class='add'>+		netfs_issue_read(rreq, subreq);</div><div class='add'>+		cond_resched();</div><div class='add'>+	} while (size &gt; 0);</div><div class='add'>+</div><div class='add'>+	if (unlikely(size &gt; 0)) {</div><div class='add'>+		smp_wmb(); /* Write lists before ALL_QUEUED. */</div><div class='add'>+		set_bit(NETFS_RREQ_ALL_QUEUED, &amp;rreq-&gt;flags);</div><div class='add'>+		netfs_wake_collector(rreq);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Defer error return as we may need to wait for outstanding I/O. */</div><div class='add'>+	cmpxchg(&amp;rreq-&gt;error, 0, ret);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_readahead - Helper to manage a read request</div><div class='add'>+ * @ractl: The description of the readahead request</div><div class='add'>+ *</div><div class='add'>+ * Fulfil a readahead request by drawing data from the cache if possible, or</div><div class='add'>+ * the netfs if not.  Space beyond the EOF is zero-filled.  Multiple I/O</div><div class='add'>+ * requests from different sources will get munged together.  If necessary, the</div><div class='add'>+ * readahead window can be expanded in either direction to a more convenient</div><div class='add'>+ * alighment for RPC efficiency or to make storage in the cache feasible.</div><div class='add'>+ *</div><div class='add'>+ * The calling netfs must initialise a netfs context contiguous to the vfs</div><div class='add'>+ * inode before calling this.</div><div class='add'>+ *</div><div class='add'>+ * This is usable whether or not caching is enabled.</div><div class='add'>+ */</div><div class='add'>+void netfs_readahead(struct readahead_control *ractl)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *rreq;</div><div class='add'>+	struct netfs_inode *ictx = netfs_inode(ractl-&gt;mapping-&gt;host);</div><div class='add'>+	unsigned long long start = readahead_pos(ractl);</div><div class='add'>+	size_t size = readahead_length(ractl);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	rreq = netfs_alloc_request(ractl-&gt;mapping, ractl-&gt;file, start, size,</div><div class='add'>+				   NETFS_READAHEAD);</div><div class='add'>+	if (IS_ERR(rreq))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	__set_bit(NETFS_RREQ_OFFLOAD_COLLECTION, &amp;rreq-&gt;flags);</div><div class='add'>+</div><div class='add'>+	ret = netfs_begin_cache_read(rreq, ictx);</div><div class='add'>+	if (ret == -ENOMEM || ret == -EINTR || ret == -ERESTARTSYS)</div><div class='add'>+		goto cleanup_free;</div><div class='add'>+</div><div class='add'>+	netfs_stat(&amp;netfs_n_rh_readahead);</div><div class='add'>+	trace_netfs_read(rreq, readahead_pos(ractl), readahead_length(ractl),</div><div class='add'>+			 netfs_read_trace_readahead);</div><div class='add'>+</div><div class='add'>+	netfs_rreq_expand(rreq, ractl);</div><div class='add'>+</div><div class='add'>+	rreq-&gt;submitted = rreq-&gt;start;</div><div class='add'>+	if (rolling_buffer_init(&amp;rreq-&gt;buffer, rreq-&gt;debug_id, ITER_DEST) &lt; 0)</div><div class='add'>+		goto cleanup_free;</div><div class='add'>+	netfs_read_to_pagecache(rreq, ractl);</div><div class='add'>+</div><div class='add'>+	return netfs_put_request(rreq, netfs_rreq_trace_put_return);</div><div class='add'>+</div><div class='add'>+cleanup_free:</div><div class='add'>+	return netfs_put_failed_request(rreq);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_readahead);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Create a rolling buffer with a single occupying folio.</div><div class='add'>+ */</div><div class='add'>+static int netfs_create_singular_buffer(struct netfs_io_request *rreq, struct folio *folio,</div><div class='add'>+					unsigned int rollbuf_flags)</div><div class='add'>+{</div><div class='add'>+	ssize_t added;</div><div class='add'>+</div><div class='add'>+	if (rolling_buffer_init(&amp;rreq-&gt;buffer, rreq-&gt;debug_id, ITER_DEST) &lt; 0)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	added = rolling_buffer_append(&amp;rreq-&gt;buffer, folio, rollbuf_flags);</div><div class='add'>+	if (added &lt; 0)</div><div class='add'>+		return added;</div><div class='add'>+	rreq-&gt;submitted = rreq-&gt;start + added;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Read into gaps in a folio partially filled by a streaming write.</div><div class='add'>+ */</div><div class='add'>+static int netfs_read_gaps(struct file *file, struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *rreq;</div><div class='add'>+	struct address_space *mapping = folio-&gt;mapping;</div><div class='add'>+	struct netfs_folio *finfo = netfs_folio_info(folio);</div><div class='add'>+	struct netfs_inode *ctx = netfs_inode(mapping-&gt;host);</div><div class='add'>+	struct folio *sink = NULL;</div><div class='add'>+	struct bio_vec *bvec;</div><div class='add'>+	unsigned int from = finfo-&gt;dirty_offset;</div><div class='add'>+	unsigned int to = from + finfo-&gt;dirty_len;</div><div class='add'>+	unsigned int off = 0, i = 0;</div><div class='add'>+	size_t flen = folio_size(folio);</div><div class='add'>+	size_t nr_bvec = flen / PAGE_SIZE + 2;</div><div class='add'>+	size_t part;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	_enter("%lx", folio-&gt;index);</div><div class='add'>+</div><div class='add'>+	rreq = netfs_alloc_request(mapping, file, folio_pos(folio), flen, NETFS_READ_GAPS);</div><div class='add'>+	if (IS_ERR(rreq)) {</div><div class='add'>+		ret = PTR_ERR(rreq);</div><div class='add'>+		goto alloc_error;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = netfs_begin_cache_read(rreq, ctx);</div><div class='add'>+	if (ret == -ENOMEM || ret == -EINTR || ret == -ERESTARTSYS)</div><div class='add'>+		goto discard;</div><div class='add'>+</div><div class='add'>+	netfs_stat(&amp;netfs_n_rh_read_folio);</div><div class='add'>+	trace_netfs_read(rreq, rreq-&gt;start, rreq-&gt;len, netfs_read_trace_read_gaps);</div><div class='add'>+</div><div class='add'>+	/* Fiddle the buffer so that a gap at the beginning and/or a gap at the</div><div class='add'>+	 * end get copied to, but the middle is discarded.</div><div class='add'>+	 */</div><div class='add'>+	ret = -ENOMEM;</div><div class='add'>+	bvec = kmalloc_array(nr_bvec, sizeof(*bvec), GFP_KERNEL);</div><div class='add'>+	if (!bvec)</div><div class='add'>+		goto discard;</div><div class='add'>+</div><div class='add'>+	sink = folio_alloc(GFP_KERNEL, 0);</div><div class='add'>+	if (!sink) {</div><div class='add'>+		kfree(bvec);</div><div class='add'>+		goto discard;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	trace_netfs_folio(folio, netfs_folio_trace_read_gaps);</div><div class='add'>+</div><div class='add'>+	rreq-&gt;direct_bv = bvec;</div><div class='add'>+	rreq-&gt;direct_bv_count = nr_bvec;</div><div class='add'>+	if (from &gt; 0) {</div><div class='add'>+		bvec_set_folio(&amp;bvec[i++], folio, from, 0);</div><div class='add'>+		off = from;</div><div class='add'>+	}</div><div class='add'>+	while (off &lt; to) {</div><div class='add'>+		part = min_t(size_t, to - off, PAGE_SIZE);</div><div class='add'>+		bvec_set_folio(&amp;bvec[i++], sink, part, 0);</div><div class='add'>+		off += part;</div><div class='add'>+	}</div><div class='add'>+	if (to &lt; flen)</div><div class='add'>+		bvec_set_folio(&amp;bvec[i++], folio, flen - to, to);</div><div class='add'>+	iov_iter_bvec(&amp;rreq-&gt;buffer.iter, ITER_DEST, bvec, i, rreq-&gt;len);</div><div class='add'>+	rreq-&gt;submitted = rreq-&gt;start + flen;</div><div class='add'>+</div><div class='add'>+	netfs_read_to_pagecache(rreq, NULL);</div><div class='add'>+</div><div class='add'>+	if (sink)</div><div class='add'>+		folio_put(sink);</div><div class='add'>+</div><div class='add'>+	ret = netfs_wait_for_read(rreq);</div><div class='add'>+	if (ret &gt;= 0) {</div><div class='add'>+		flush_dcache_folio(folio);</div><div class='add'>+		folio_mark_uptodate(folio);</div><div class='add'>+	}</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	netfs_put_request(rreq, netfs_rreq_trace_put_return);</div><div class='add'>+	return ret &lt; 0 ? ret : 0;</div><div class='add'>+</div><div class='add'>+discard:</div><div class='add'>+	netfs_put_failed_request(rreq);</div><div class='add'>+alloc_error:</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_read_folio - Helper to manage a read_folio request</div><div class='add'>+ * @file: The file to read from</div><div class='add'>+ * @folio: The folio to read</div><div class='add'>+ *</div><div class='add'>+ * Fulfil a read_folio request by drawing data from the cache if</div><div class='add'>+ * possible, or the netfs if not.  Space beyond the EOF is zero-filled.</div><div class='add'>+ * Multiple I/O requests from different sources will get munged together.</div><div class='add'>+ *</div><div class='add'>+ * The calling netfs must initialise a netfs context contiguous to the vfs</div><div class='add'>+ * inode before calling this.</div><div class='add'>+ *</div><div class='add'>+ * This is usable whether or not caching is enabled.</div><div class='add'>+ */</div><div class='add'>+int netfs_read_folio(struct file *file, struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	struct address_space *mapping = folio-&gt;mapping;</div><div class='add'>+	struct netfs_io_request *rreq;</div><div class='add'>+	struct netfs_inode *ctx = netfs_inode(mapping-&gt;host);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (folio_test_dirty(folio)) {</div><div class='add'>+		trace_netfs_folio(folio, netfs_folio_trace_read_gaps);</div><div class='add'>+		return netfs_read_gaps(file, folio);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	_enter("%lx", folio-&gt;index);</div><div class='add'>+</div><div class='add'>+	rreq = netfs_alloc_request(mapping, file,</div><div class='add'>+				   folio_pos(folio), folio_size(folio),</div><div class='add'>+				   NETFS_READPAGE);</div><div class='add'>+	if (IS_ERR(rreq)) {</div><div class='add'>+		ret = PTR_ERR(rreq);</div><div class='add'>+		goto alloc_error;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = netfs_begin_cache_read(rreq, ctx);</div><div class='add'>+	if (ret == -ENOMEM || ret == -EINTR || ret == -ERESTARTSYS)</div><div class='add'>+		goto discard;</div><div class='add'>+</div><div class='add'>+	netfs_stat(&amp;netfs_n_rh_read_folio);</div><div class='add'>+	trace_netfs_read(rreq, rreq-&gt;start, rreq-&gt;len, netfs_read_trace_readpage);</div><div class='add'>+</div><div class='add'>+	/* Set up the output buffer */</div><div class='add'>+	ret = netfs_create_singular_buffer(rreq, folio, 0);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto discard;</div><div class='add'>+</div><div class='add'>+	netfs_read_to_pagecache(rreq, NULL);</div><div class='add'>+	ret = netfs_wait_for_read(rreq);</div><div class='add'>+	netfs_put_request(rreq, netfs_rreq_trace_put_return);</div><div class='add'>+	return ret &lt; 0 ? ret : 0;</div><div class='add'>+</div><div class='add'>+discard:</div><div class='add'>+	netfs_put_failed_request(rreq);</div><div class='add'>+alloc_error:</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_read_folio);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Prepare a folio for writing without reading first</div><div class='add'>+ * @folio: The folio being prepared</div><div class='add'>+ * @pos: starting position for the write</div><div class='add'>+ * @len: length of write</div><div class='add'>+ * @always_fill: T if the folio should always be completely filled/cleared</div><div class='add'>+ *</div><div class='add'>+ * In some cases, write_begin doesn't need to read at all:</div><div class='add'>+ * - full folio write</div><div class='add'>+ * - write that lies in a folio that is completely beyond EOF</div><div class='add'>+ * - write that covers the folio from start to EOF or beyond it</div><div class='add'>+ *</div><div class='add'>+ * If any of these criteria are met, then zero out the unwritten parts</div><div class='add'>+ * of the folio and return true. Otherwise, return false.</div><div class='add'>+ */</div><div class='add'>+static bool netfs_skip_folio_read(struct folio *folio, loff_t pos, size_t len,</div><div class='add'>+				 bool always_fill)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = folio_inode(folio);</div><div class='add'>+	loff_t i_size = i_size_read(inode);</div><div class='add'>+	size_t offset = offset_in_folio(folio, pos);</div><div class='add'>+	size_t plen = folio_size(folio);</div><div class='add'>+</div><div class='add'>+	if (unlikely(always_fill)) {</div><div class='add'>+		if (pos - offset + len &lt;= i_size)</div><div class='add'>+			return false; /* Page entirely before EOF */</div><div class='add'>+		folio_zero_segment(folio, 0, plen);</div><div class='add'>+		folio_mark_uptodate(folio);</div><div class='add'>+		return true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Full folio write */</div><div class='add'>+	if (offset == 0 &amp;&amp; len &gt;= plen)</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	/* Page entirely beyond the end of the file */</div><div class='add'>+	if (pos - offset &gt;= i_size)</div><div class='add'>+		goto zero_out;</div><div class='add'>+</div><div class='add'>+	/* Write that covers from the start of the folio to EOF or beyond */</div><div class='add'>+	if (offset == 0 &amp;&amp; (pos + len) &gt;= i_size)</div><div class='add'>+		goto zero_out;</div><div class='add'>+</div><div class='add'>+	return false;</div><div class='add'>+zero_out:</div><div class='add'>+	folio_zero_segments(folio, 0, offset, offset + len, plen);</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_write_begin - Helper to prepare for writing [DEPRECATED]</div><div class='add'>+ * @ctx: The netfs context</div><div class='add'>+ * @file: The file to read from</div><div class='add'>+ * @mapping: The mapping to read from</div><div class='add'>+ * @pos: File position at which the write will begin</div><div class='add'>+ * @len: The length of the write (may extend beyond the end of the folio chosen)</div><div class='add'>+ * @_folio: Where to put the resultant folio</div><div class='add'>+ * @_fsdata: Place for the netfs to store a cookie</div><div class='add'>+ *</div><div class='add'>+ * Pre-read data for a write-begin request by drawing data from the cache if</div><div class='add'>+ * possible, or the netfs if not.  Space beyond the EOF is zero-filled.</div><div class='add'>+ * Multiple I/O requests from different sources will get munged together.</div><div class='add'>+ *</div><div class='add'>+ * The calling netfs must provide a table of operations, only one of which,</div><div class='add'>+ * issue_read, is mandatory.</div><div class='add'>+ *</div><div class='add'>+ * The check_write_begin() operation can be provided to check for and flush</div><div class='add'>+ * conflicting writes once the folio is grabbed and locked.  It is passed a</div><div class='add'>+ * pointer to the fsdata cookie that gets returned to the VM to be passed to</div><div class='add'>+ * write_end.  It is permitted to sleep.  It should return 0 if the request</div><div class='add'>+ * should go ahead or it may return an error.  It may also unlock and put the</div><div class='add'>+ * folio, provided it sets ``*foliop`` to NULL, in which case a return of 0</div><div class='add'>+ * will cause the folio to be re-got and the process to be retried.</div><div class='add'>+ *</div><div class='add'>+ * The calling netfs must initialise a netfs context contiguous to the vfs</div><div class='add'>+ * inode before calling this.</div><div class='add'>+ *</div><div class='add'>+ * This is usable whether or not caching is enabled.</div><div class='add'>+ *</div><div class='add'>+ * Note that this should be considered deprecated and netfs_perform_write()</div><div class='add'>+ * used instead.</div><div class='add'>+ */</div><div class='add'>+int netfs_write_begin(struct netfs_inode *ctx,</div><div class='add'>+		      struct file *file, struct address_space *mapping,</div><div class='add'>+		      loff_t pos, unsigned int len, struct folio **_folio,</div><div class='add'>+		      void **_fsdata)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *rreq;</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	pgoff_t index = pos &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+retry:</div><div class='add'>+	folio = __filemap_get_folio(mapping, index, FGP_WRITEBEGIN,</div><div class='add'>+				    mapping_gfp_mask(mapping));</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return PTR_ERR(folio);</div><div class='add'>+</div><div class='add'>+	if (ctx-&gt;ops-&gt;check_write_begin) {</div><div class='add'>+		/* Allow the netfs (eg. ceph) to flush conflicts. */</div><div class='add'>+		ret = ctx-&gt;ops-&gt;check_write_begin(file, pos, len, &amp;folio, _fsdata);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			trace_netfs_failure(NULL, NULL, ret, netfs_fail_check_write_begin);</div><div class='add'>+			goto error;</div><div class='add'>+		}</div><div class='add'>+		if (!folio)</div><div class='add'>+			goto retry;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (folio_test_uptodate(folio))</div><div class='add'>+		goto have_folio;</div><div class='add'>+</div><div class='add'>+	/* If the folio is beyond the EOF, we want to clear it - unless it's</div><div class='add'>+	 * within the cache granule containing the EOF, in which case we need</div><div class='add'>+	 * to preload the granule.</div><div class='add'>+	 */</div><div class='add'>+	if (!netfs_is_cache_enabled(ctx) &amp;&amp;</div><div class='add'>+	    netfs_skip_folio_read(folio, pos, len, false)) {</div><div class='add'>+		netfs_stat(&amp;netfs_n_rh_write_zskip);</div><div class='add'>+		goto have_folio_no_wait;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	rreq = netfs_alloc_request(mapping, file,</div><div class='add'>+				   folio_pos(folio), folio_size(folio),</div><div class='add'>+				   NETFS_READ_FOR_WRITE);</div><div class='add'>+	if (IS_ERR(rreq)) {</div><div class='add'>+		ret = PTR_ERR(rreq);</div><div class='add'>+		goto error;</div><div class='add'>+	}</div><div class='add'>+	rreq-&gt;no_unlock_folio	= folio-&gt;index;</div><div class='add'>+	__set_bit(NETFS_RREQ_NO_UNLOCK_FOLIO, &amp;rreq-&gt;flags);</div><div class='add'>+</div><div class='add'>+	ret = netfs_begin_cache_read(rreq, ctx);</div><div class='add'>+	if (ret == -ENOMEM || ret == -EINTR || ret == -ERESTARTSYS)</div><div class='add'>+		goto error_put;</div><div class='add'>+</div><div class='add'>+	netfs_stat(&amp;netfs_n_rh_write_begin);</div><div class='add'>+	trace_netfs_read(rreq, pos, len, netfs_read_trace_write_begin);</div><div class='add'>+</div><div class='add'>+	/* Set up the output buffer */</div><div class='add'>+	ret = netfs_create_singular_buffer(rreq, folio, 0);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto error_put;</div><div class='add'>+</div><div class='add'>+	netfs_read_to_pagecache(rreq, NULL);</div><div class='add'>+	ret = netfs_wait_for_read(rreq);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto error;</div><div class='add'>+	netfs_put_request(rreq, netfs_rreq_trace_put_return);</div><div class='add'>+</div><div class='add'>+have_folio:</div><div class='add'>+	ret = folio_wait_private_2_killable(folio);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto error;</div><div class='add'>+have_folio_no_wait:</div><div class='add'>+	*_folio = folio;</div><div class='add'>+	_leave(" = 0");</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+error_put:</div><div class='add'>+	netfs_put_failed_request(rreq);</div><div class='add'>+error:</div><div class='add'>+	if (folio) {</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='add'>+	}</div><div class='add'>+	_leave(" = %d", ret);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_write_begin);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Preload the data into a folio we're proposing to write into.</div><div class='add'>+ */</div><div class='add'>+int netfs_prefetch_for_write(struct file *file, struct folio *folio,</div><div class='add'>+			     size_t offset, size_t len)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *rreq;</div><div class='add'>+	struct address_space *mapping = folio-&gt;mapping;</div><div class='add'>+	struct netfs_inode *ctx = netfs_inode(mapping-&gt;host);</div><div class='add'>+	unsigned long long start = folio_pos(folio);</div><div class='add'>+	size_t flen = folio_size(folio);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	_enter("%zx @%llx", flen, start);</div><div class='add'>+</div><div class='add'>+	ret = -ENOMEM;</div><div class='add'>+</div><div class='add'>+	rreq = netfs_alloc_request(mapping, file, start, flen,</div><div class='add'>+				   NETFS_READ_FOR_WRITE);</div><div class='add'>+	if (IS_ERR(rreq)) {</div><div class='add'>+		ret = PTR_ERR(rreq);</div><div class='add'>+		goto error;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	rreq-&gt;no_unlock_folio = folio-&gt;index;</div><div class='add'>+	__set_bit(NETFS_RREQ_NO_UNLOCK_FOLIO, &amp;rreq-&gt;flags);</div><div class='add'>+	ret = netfs_begin_cache_read(rreq, ctx);</div><div class='add'>+	if (ret == -ENOMEM || ret == -EINTR || ret == -ERESTARTSYS)</div><div class='add'>+		goto error_put;</div><div class='add'>+</div><div class='add'>+	netfs_stat(&amp;netfs_n_rh_write_begin);</div><div class='add'>+	trace_netfs_read(rreq, start, flen, netfs_read_trace_prefetch_for_write);</div><div class='add'>+</div><div class='add'>+	/* Set up the output buffer */</div><div class='add'>+	ret = netfs_create_singular_buffer(rreq, folio, NETFS_ROLLBUF_PAGECACHE_MARK);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto error_put;</div><div class='add'>+</div><div class='add'>+	netfs_read_to_pagecache(rreq, NULL);</div><div class='add'>+	ret = netfs_wait_for_read(rreq);</div><div class='add'>+	netfs_put_request(rreq, netfs_rreq_trace_put_return);</div><div class='add'>+	return ret &lt; 0 ? ret : 0;</div><div class='add'>+</div><div class='add'>+error_put:</div><div class='add'>+	netfs_put_failed_request(rreq);</div><div class='add'>+error:</div><div class='add'>+	_leave(" = %d", ret);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_buffered_read_iter - Filesystem buffered I/O read routine</div><div class='add'>+ * @iocb: kernel I/O control block</div><div class='add'>+ * @iter: destination for the data read</div><div class='add'>+ *</div><div class='add'>+ * This is the -&gt;read_iter() routine for all filesystems that can use the page</div><div class='add'>+ * cache directly.</div><div class='add'>+ *</div><div class='add'>+ * The IOCB_NOWAIT flag in iocb-&gt;ki_flags indicates that -EAGAIN shall be</div><div class='add'>+ * returned when no data can be read without waiting for I/O requests to</div><div class='add'>+ * complete; it doesn't prevent readahead.</div><div class='add'>+ *</div><div class='add'>+ * The IOCB_NOIO flag in iocb-&gt;ki_flags indicates that no new I/O requests</div><div class='add'>+ * shall be made for the read or for readahead.  When no data can be read,</div><div class='add'>+ * -EAGAIN shall be returned.  When readahead would be triggered, a partial,</div><div class='add'>+ * possibly empty read shall be returned.</div><div class='add'>+ *</div><div class='add'>+ * Return:</div><div class='add'>+ * * number of bytes copied, even for partial reads</div><div class='add'>+ * * negative error code (or 0 if IOCB_NOIO) if nothing was read</div><div class='add'>+ */</div><div class='add'>+ssize_t netfs_buffered_read_iter(struct kiocb *iocb, struct iov_iter *iter)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='add'>+	struct netfs_inode *ictx = netfs_inode(inode);</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	if (WARN_ON_ONCE((iocb-&gt;ki_flags &amp; IOCB_DIRECT) ||</div><div class='add'>+			 test_bit(NETFS_ICTX_UNBUFFERED, &amp;ictx-&gt;flags)))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	ret = netfs_start_io_read(inode);</div><div class='add'>+	if (ret == 0) {</div><div class='add'>+		ret = filemap_read(iocb, iter, 0);</div><div class='add'>+		netfs_end_io_read(inode);</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_buffered_read_iter);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_file_read_iter - Generic filesystem read routine</div><div class='add'>+ * @iocb: kernel I/O control block</div><div class='add'>+ * @iter: destination for the data read</div><div class='add'>+ *</div><div class='add'>+ * This is the -&gt;read_iter() routine for all filesystems that can use the page</div><div class='add'>+ * cache directly.</div><div class='add'>+ *</div><div class='add'>+ * The IOCB_NOWAIT flag in iocb-&gt;ki_flags indicates that -EAGAIN shall be</div><div class='add'>+ * returned when no data can be read without waiting for I/O requests to</div><div class='add'>+ * complete; it doesn't prevent readahead.</div><div class='add'>+ *</div><div class='add'>+ * The IOCB_NOIO flag in iocb-&gt;ki_flags indicates that no new I/O requests</div><div class='add'>+ * shall be made for the read or for readahead.  When no data can be read,</div><div class='add'>+ * -EAGAIN shall be returned.  When readahead would be triggered, a partial,</div><div class='add'>+ * possibly empty read shall be returned.</div><div class='add'>+ *</div><div class='add'>+ * Return:</div><div class='add'>+ * * number of bytes copied, even for partial reads</div><div class='add'>+ * * negative error code (or 0 if IOCB_NOIO) if nothing was read</div><div class='add'>+ */</div><div class='add'>+ssize_t netfs_file_read_iter(struct kiocb *iocb, struct iov_iter *iter)</div><div class='add'>+{</div><div class='add'>+	struct netfs_inode *ictx = netfs_inode(iocb-&gt;ki_filp-&gt;f_mapping-&gt;host);</div><div class='add'>+</div><div class='add'>+	if ((iocb-&gt;ki_flags &amp; IOCB_DIRECT) ||</div><div class='add'>+	    test_bit(NETFS_ICTX_UNBUFFERED, &amp;ictx-&gt;flags))</div><div class='add'>+		return netfs_unbuffered_read_iter(iocb, iter);</div><div class='add'>+</div><div class='add'>+	return netfs_buffered_read_iter(iocb, iter);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_file_read_iter);</div><div class='head'>diff --git a/fs/netfs/buffered_write.c b/fs/netfs/buffered_write.c<br/>new file mode 100644<br/>index 000000000000..f9d62abef2ac<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/buffered_write.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/buffered_write.c</a></div><div class='hunk'>@@ -0,0 +1,569 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-only</div><div class='add'>+/* Network filesystem high-level buffered write support.</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2023 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/export.h&gt;</div><div class='add'>+#include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/mm.h&gt;</div><div class='add'>+#include &lt;linux/pagemap.h&gt;</div><div class='add'>+#include &lt;linux/slab.h&gt;</div><div class='add'>+#include &lt;linux/pagevec.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+static void __netfs_set_group(struct folio *folio, struct netfs_group *netfs_group)</div><div class='add'>+{</div><div class='add'>+	if (netfs_group)</div><div class='add'>+		folio_attach_private(folio, netfs_get_group(netfs_group));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void netfs_set_group(struct folio *folio, struct netfs_group *netfs_group)</div><div class='add'>+{</div><div class='add'>+	void *priv = folio_get_private(folio);</div><div class='add'>+</div><div class='add'>+	if (unlikely(priv != netfs_group)) {</div><div class='add'>+		if (netfs_group &amp;&amp; (!priv || priv == NETFS_FOLIO_COPY_TO_CACHE))</div><div class='add'>+			folio_attach_private(folio, netfs_get_group(netfs_group));</div><div class='add'>+		else if (!netfs_group &amp;&amp; priv == NETFS_FOLIO_COPY_TO_CACHE)</div><div class='add'>+			folio_detach_private(folio);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Grab a folio for writing and lock it.  Attempt to allocate as large a folio</div><div class='add'>+ * as possible to hold as much of the remaining length as possible in one go.</div><div class='add'>+ */</div><div class='add'>+static struct folio *netfs_grab_folio_for_write(struct address_space *mapping,</div><div class='add'>+						loff_t pos, size_t part)</div><div class='add'>+{</div><div class='add'>+	pgoff_t index = pos / PAGE_SIZE;</div><div class='add'>+	fgf_t fgp_flags = FGP_WRITEBEGIN;</div><div class='add'>+</div><div class='add'>+	if (mapping_large_folio_support(mapping))</div><div class='add'>+		fgp_flags |= fgf_set_order(pos % PAGE_SIZE + part);</div><div class='add'>+</div><div class='add'>+	return __filemap_get_folio(mapping, index, fgp_flags,</div><div class='add'>+				   mapping_gfp_mask(mapping));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Update i_size and estimate the update to i_blocks to reflect the additional</div><div class='add'>+ * data written into the pagecache until we can find out from the server what</div><div class='add'>+ * the values actually are.</div><div class='add'>+ */</div><div class='add'>+void netfs_update_i_size(struct netfs_inode *ctx, struct inode *inode,</div><div class='add'>+			 loff_t pos, size_t copied)</div><div class='add'>+{</div><div class='add'>+	loff_t i_size, end = pos + copied;</div><div class='add'>+	blkcnt_t add;</div><div class='add'>+	size_t gap;</div><div class='add'>+</div><div class='add'>+	if (end &lt;= i_size_read(inode))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (ctx-&gt;ops-&gt;update_i_size) {</div><div class='add'>+		ctx-&gt;ops-&gt;update_i_size(inode, end);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+</div><div class='add'>+	i_size = i_size_read(inode);</div><div class='add'>+	if (end &gt; i_size) {</div><div class='add'>+		i_size_write(inode, end);</div><div class='add'>+#if IS_ENABLED(CONFIG_FSCACHE)</div><div class='add'>+		fscache_update_cookie(ctx-&gt;cache, NULL, &amp;end);</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+		gap = SECTOR_SIZE - (i_size &amp; (SECTOR_SIZE - 1));</div><div class='add'>+		if (copied &gt; gap) {</div><div class='add'>+			add = DIV_ROUND_UP(copied - gap, SECTOR_SIZE);</div><div class='add'>+</div><div class='add'>+			inode-&gt;i_blocks = min_t(blkcnt_t,</div><div class='add'>+						DIV_ROUND_UP(end, SECTOR_SIZE),</div><div class='add'>+						inode-&gt;i_blocks + add);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_perform_write - Copy data into the pagecache.</div><div class='add'>+ * @iocb: The operation parameters</div><div class='add'>+ * @iter: The source buffer</div><div class='add'>+ * @netfs_group: Grouping for dirty folios (eg. ceph snaps).</div><div class='add'>+ *</div><div class='add'>+ * Copy data into pagecache folios attached to the inode specified by @iocb.</div><div class='add'>+ * The caller must hold appropriate inode locks.</div><div class='add'>+ *</div><div class='add'>+ * Dirty folios are tagged with a netfs_folio struct if they're not up to date</div><div class='add'>+ * to indicate the range modified.  Dirty folios may also be tagged with a</div><div class='add'>+ * netfs-specific grouping such that data from an old group gets flushed before</div><div class='add'>+ * a new one is started.</div><div class='add'>+ */</div><div class='add'>+ssize_t netfs_perform_write(struct kiocb *iocb, struct iov_iter *iter,</div><div class='add'>+			    struct netfs_group *netfs_group)</div><div class='add'>+{</div><div class='add'>+	struct file *file = iocb-&gt;ki_filp;</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='add'>+	struct address_space *mapping = inode-&gt;i_mapping;</div><div class='add'>+	struct netfs_inode *ctx = netfs_inode(inode);</div><div class='add'>+	struct writeback_control wbc = {</div><div class='add'>+		.sync_mode	= WB_SYNC_NONE,</div><div class='add'>+		.for_sync	= true,</div><div class='add'>+		.nr_to_write	= LONG_MAX,</div><div class='add'>+		.range_start	= iocb-&gt;ki_pos,</div><div class='add'>+		.range_end	= iocb-&gt;ki_pos + iter-&gt;count,</div><div class='add'>+	};</div><div class='add'>+	struct netfs_io_request *wreq = NULL;</div><div class='add'>+	struct folio *folio = NULL, *writethrough = NULL;</div><div class='add'>+	unsigned int bdp_flags = (iocb-&gt;ki_flags &amp; IOCB_NOWAIT) ? BDP_ASYNC : 0;</div><div class='add'>+	ssize_t written = 0, ret, ret2;</div><div class='add'>+	loff_t pos = iocb-&gt;ki_pos;</div><div class='add'>+	size_t max_chunk = mapping_max_folio_size(mapping);</div><div class='add'>+	bool maybe_trouble = false;</div><div class='add'>+</div><div class='add'>+	if (unlikely(iocb-&gt;ki_flags &amp; (IOCB_DSYNC | IOCB_SYNC))</div><div class='add'>+	    ) {</div><div class='add'>+		wbc_attach_fdatawrite_inode(&amp;wbc, mapping-&gt;host);</div><div class='add'>+</div><div class='add'>+		ret = filemap_write_and_wait_range(mapping, pos, pos + iter-&gt;count);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			wbc_detach_inode(&amp;wbc);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		wreq = netfs_begin_writethrough(iocb, iter-&gt;count);</div><div class='add'>+		if (IS_ERR(wreq)) {</div><div class='add'>+			wbc_detach_inode(&amp;wbc);</div><div class='add'>+			ret = PTR_ERR(wreq);</div><div class='add'>+			wreq = NULL;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		if (!is_sync_kiocb(iocb))</div><div class='add'>+			wreq-&gt;iocb = iocb;</div><div class='add'>+		netfs_stat(&amp;netfs_n_wh_writethrough);</div><div class='add'>+	} else {</div><div class='add'>+		netfs_stat(&amp;netfs_n_wh_buffered_write);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		struct netfs_folio *finfo;</div><div class='add'>+		struct netfs_group *group;</div><div class='add'>+		unsigned long long fpos;</div><div class='add'>+		size_t flen;</div><div class='add'>+		size_t offset;	/* Offset into pagecache folio */</div><div class='add'>+		size_t part;	/* Bytes to write to folio */</div><div class='add'>+		size_t copied;	/* Bytes copied from user */</div><div class='add'>+</div><div class='add'>+		offset = pos &amp; (max_chunk - 1);</div><div class='add'>+		part = min(max_chunk - offset, iov_iter_count(iter));</div><div class='add'>+</div><div class='add'>+		/* Bring in the user pages that we will copy from _first_ lest</div><div class='add'>+		 * we hit a nasty deadlock on copying from the same page as</div><div class='add'>+		 * we're writing to, without it being marked uptodate.</div><div class='add'>+		 *</div><div class='add'>+		 * Not only is this an optimisation, but it is also required to</div><div class='add'>+		 * check that the address is actually valid, when atomic</div><div class='add'>+		 * usercopies are used below.</div><div class='add'>+		 *</div><div class='add'>+		 * We rely on the page being held onto long enough by the LRU</div><div class='add'>+		 * that we can grab it below if this causes it to be read.</div><div class='add'>+		 */</div><div class='add'>+		ret = -EFAULT;</div><div class='add'>+		if (unlikely(fault_in_iov_iter_readable(iter, part) == part))</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		folio = netfs_grab_folio_for_write(mapping, pos, part);</div><div class='add'>+		if (IS_ERR(folio)) {</div><div class='add'>+			ret = PTR_ERR(folio);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		flen = folio_size(folio);</div><div class='add'>+		fpos = folio_pos(folio);</div><div class='add'>+		offset = pos - fpos;</div><div class='add'>+		part = min_t(size_t, flen - offset, part);</div><div class='add'>+</div><div class='add'>+		/* Wait for writeback to complete.  The writeback engine owns</div><div class='add'>+		 * the info in folio-&gt;private and may change it until it</div><div class='add'>+		 * removes the WB mark.</div><div class='add'>+		 */</div><div class='add'>+		if (folio_get_private(folio) &amp;&amp;</div><div class='add'>+		    folio_wait_writeback_killable(folio)) {</div><div class='add'>+			ret = written ? -EINTR : -ERESTARTSYS;</div><div class='add'>+			goto error_folio_unlock;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (signal_pending(current)) {</div><div class='add'>+			ret = written ? -EINTR : -ERESTARTSYS;</div><div class='add'>+			goto error_folio_unlock;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* Decide how we should modify a folio.  We might be attempting</div><div class='add'>+		 * to do write-streaming, in which case we don't want to a</div><div class='add'>+		 * local RMW cycle if we can avoid it.  If we're doing local</div><div class='add'>+		 * caching or content crypto, we award that priority over</div><div class='add'>+		 * avoiding RMW.  If the file is open readably, then we also</div><div class='add'>+		 * assume that we may want to read what we wrote.</div><div class='add'>+		 */</div><div class='add'>+		finfo = netfs_folio_info(folio);</div><div class='add'>+		group = netfs_folio_group(folio);</div><div class='add'>+</div><div class='add'>+		if (unlikely(group != netfs_group) &amp;&amp;</div><div class='add'>+		    group != NETFS_FOLIO_COPY_TO_CACHE)</div><div class='add'>+			goto flush_content;</div><div class='add'>+</div><div class='add'>+		if (folio_test_uptodate(folio)) {</div><div class='add'>+			if (mapping_writably_mapped(mapping))</div><div class='add'>+				flush_dcache_folio(folio);</div><div class='add'>+			copied = copy_folio_from_iter_atomic(folio, offset, part, iter);</div><div class='add'>+			if (unlikely(copied == 0))</div><div class='add'>+				goto copy_failed;</div><div class='add'>+			netfs_set_group(folio, netfs_group);</div><div class='add'>+			trace_netfs_folio(folio, netfs_folio_is_uptodate);</div><div class='add'>+			goto copied;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* If the page is above the zero-point then we assume that the</div><div class='add'>+		 * server would just return a block of zeros or a short read if</div><div class='add'>+		 * we try to read it.</div><div class='add'>+		 */</div><div class='add'>+		if (fpos &gt;= ctx-&gt;zero_point) {</div><div class='add'>+			folio_zero_segment(folio, 0, offset);</div><div class='add'>+			copied = copy_folio_from_iter_atomic(folio, offset, part, iter);</div><div class='add'>+			if (unlikely(copied == 0))</div><div class='add'>+				goto copy_failed;</div><div class='add'>+			folio_zero_segment(folio, offset + copied, flen);</div><div class='add'>+			__netfs_set_group(folio, netfs_group);</div><div class='add'>+			folio_mark_uptodate(folio);</div><div class='add'>+			trace_netfs_folio(folio, netfs_modify_and_clear);</div><div class='add'>+			goto copied;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* See if we can write a whole folio in one go. */</div><div class='add'>+		if (!maybe_trouble &amp;&amp; offset == 0 &amp;&amp; part &gt;= flen) {</div><div class='add'>+			copied = copy_folio_from_iter_atomic(folio, offset, part, iter);</div><div class='add'>+			if (unlikely(copied == 0))</div><div class='add'>+				goto copy_failed;</div><div class='add'>+			if (unlikely(copied &lt; part)) {</div><div class='add'>+				maybe_trouble = true;</div><div class='add'>+				iov_iter_revert(iter, copied);</div><div class='add'>+				copied = 0;</div><div class='add'>+				folio_unlock(folio);</div><div class='add'>+				goto retry;</div><div class='add'>+			}</div><div class='add'>+			__netfs_set_group(folio, netfs_group);</div><div class='add'>+			folio_mark_uptodate(folio);</div><div class='add'>+			trace_netfs_folio(folio, netfs_whole_folio_modify);</div><div class='add'>+			goto copied;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* We don't want to do a streaming write on a file that loses</div><div class='add'>+		 * caching service temporarily because the backing store got</div><div class='add'>+		 * culled and we don't really want to get a streaming write on</div><div class='add'>+		 * a file that's open for reading as -&gt;read_folio() then has to</div><div class='add'>+		 * be able to flush it.</div><div class='add'>+		 */</div><div class='add'>+		if ((file-&gt;f_mode &amp; FMODE_READ) ||</div><div class='add'>+		    netfs_is_cache_enabled(ctx)) {</div><div class='add'>+			if (finfo) {</div><div class='add'>+				netfs_stat(&amp;netfs_n_wh_wstream_conflict);</div><div class='add'>+				goto flush_content;</div><div class='add'>+			}</div><div class='add'>+			ret = netfs_prefetch_for_write(file, folio, offset, part);</div><div class='add'>+			if (ret &lt; 0) {</div><div class='add'>+				_debug("prefetch = %zd", ret);</div><div class='add'>+				goto error_folio_unlock;</div><div class='add'>+			}</div><div class='add'>+			/* Note that copy-to-cache may have been set. */</div><div class='add'>+</div><div class='add'>+			copied = copy_folio_from_iter_atomic(folio, offset, part, iter);</div><div class='add'>+			if (unlikely(copied == 0))</div><div class='add'>+				goto copy_failed;</div><div class='add'>+			netfs_set_group(folio, netfs_group);</div><div class='add'>+			trace_netfs_folio(folio, netfs_just_prefetch);</div><div class='add'>+			goto copied;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (!finfo) {</div><div class='add'>+			ret = -EIO;</div><div class='add'>+			if (WARN_ON(folio_get_private(folio)))</div><div class='add'>+				goto error_folio_unlock;</div><div class='add'>+			copied = copy_folio_from_iter_atomic(folio, offset, part, iter);</div><div class='add'>+			if (unlikely(copied == 0))</div><div class='add'>+				goto copy_failed;</div><div class='add'>+			if (offset == 0 &amp;&amp; copied == flen) {</div><div class='add'>+				__netfs_set_group(folio, netfs_group);</div><div class='add'>+				folio_mark_uptodate(folio);</div><div class='add'>+				trace_netfs_folio(folio, netfs_streaming_filled_page);</div><div class='add'>+				goto copied;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			finfo = kzalloc(sizeof(*finfo), GFP_KERNEL);</div><div class='add'>+			if (!finfo) {</div><div class='add'>+				iov_iter_revert(iter, copied);</div><div class='add'>+				ret = -ENOMEM;</div><div class='add'>+				goto error_folio_unlock;</div><div class='add'>+			}</div><div class='add'>+			finfo-&gt;netfs_group = netfs_get_group(netfs_group);</div><div class='add'>+			finfo-&gt;dirty_offset = offset;</div><div class='add'>+			finfo-&gt;dirty_len = copied;</div><div class='add'>+			folio_attach_private(folio, (void *)((unsigned long)finfo |</div><div class='add'>+							     NETFS_FOLIO_INFO));</div><div class='add'>+			trace_netfs_folio(folio, netfs_streaming_write);</div><div class='add'>+			goto copied;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* We can continue a streaming write only if it continues on</div><div class='add'>+		 * from the previous.  If it overlaps, we must flush lest we</div><div class='add'>+		 * suffer a partial copy and disjoint dirty regions.</div><div class='add'>+		 */</div><div class='add'>+		if (offset == finfo-&gt;dirty_offset + finfo-&gt;dirty_len) {</div><div class='add'>+			copied = copy_folio_from_iter_atomic(folio, offset, part, iter);</div><div class='add'>+			if (unlikely(copied == 0))</div><div class='add'>+				goto copy_failed;</div><div class='add'>+			finfo-&gt;dirty_len += copied;</div><div class='add'>+			if (finfo-&gt;dirty_offset == 0 &amp;&amp; finfo-&gt;dirty_len == flen) {</div><div class='add'>+				if (finfo-&gt;netfs_group)</div><div class='add'>+					folio_change_private(folio, finfo-&gt;netfs_group);</div><div class='add'>+				else</div><div class='add'>+					folio_detach_private(folio);</div><div class='add'>+				folio_mark_uptodate(folio);</div><div class='add'>+				kfree(finfo);</div><div class='add'>+				trace_netfs_folio(folio, netfs_streaming_cont_filled_page);</div><div class='add'>+			} else {</div><div class='add'>+				trace_netfs_folio(folio, netfs_streaming_write_cont);</div><div class='add'>+			}</div><div class='add'>+			goto copied;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* Incompatible write; flush the folio and try again. */</div><div class='add'>+	flush_content:</div><div class='add'>+		trace_netfs_folio(folio, netfs_flush_content);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='add'>+		ret = filemap_write_and_wait_range(mapping, fpos, fpos + flen - 1);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out;</div><div class='add'>+		continue;</div><div class='add'>+</div><div class='add'>+	copied:</div><div class='add'>+		flush_dcache_folio(folio);</div><div class='add'>+</div><div class='add'>+		/* Update the inode size if we moved the EOF marker */</div><div class='add'>+		netfs_update_i_size(ctx, inode, pos, copied);</div><div class='add'>+		pos += copied;</div><div class='add'>+		written += copied;</div><div class='add'>+</div><div class='add'>+		if (likely(!wreq)) {</div><div class='add'>+			folio_mark_dirty(folio);</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+		} else {</div><div class='add'>+			netfs_advance_writethrough(wreq, &amp;wbc, folio, copied,</div><div class='add'>+						   offset + copied == flen,</div><div class='add'>+						   &amp;writethrough);</div><div class='add'>+			/* Folio unlocked */</div><div class='add'>+		}</div><div class='add'>+	retry:</div><div class='add'>+		folio_put(folio);</div><div class='add'>+		folio = NULL;</div><div class='add'>+</div><div class='add'>+		ret = balance_dirty_pages_ratelimited_flags(mapping, bdp_flags);</div><div class='add'>+		if (unlikely(ret &lt; 0))</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		cond_resched();</div><div class='add'>+	} while (iov_iter_count(iter));</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	if (likely(written)) {</div><div class='add'>+		/* Set indication that ctime and mtime got updated in case</div><div class='add'>+		 * close is deferred.</div><div class='add'>+		 */</div><div class='add'>+		set_bit(NETFS_ICTX_MODIFIED_ATTR, &amp;ctx-&gt;flags);</div><div class='add'>+		if (unlikely(ctx-&gt;ops-&gt;post_modify))</div><div class='add'>+			ctx-&gt;ops-&gt;post_modify(inode);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (unlikely(wreq)) {</div><div class='add'>+		ret2 = netfs_end_writethrough(wreq, &amp;wbc, writethrough);</div><div class='add'>+		wbc_detach_inode(&amp;wbc);</div><div class='add'>+		if (ret2 == -EIOCBQUEUED)</div><div class='add'>+			return ret2;</div><div class='add'>+		if (ret == 0 &amp;&amp; ret2 &lt; 0)</div><div class='add'>+			ret = ret2;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	iocb-&gt;ki_pos += written;</div><div class='add'>+	_leave(" = %zd [%zd]", written, ret);</div><div class='add'>+	return written ? written : ret;</div><div class='add'>+</div><div class='add'>+copy_failed:</div><div class='add'>+	ret = -EFAULT;</div><div class='add'>+error_folio_unlock:</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='add'>+	goto out;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_perform_write);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_buffered_write_iter_locked - write data to a file</div><div class='add'>+ * @iocb:	IO state structure (file, offset, etc.)</div><div class='add'>+ * @from:	iov_iter with data to write</div><div class='add'>+ * @netfs_group: Grouping for dirty folios (eg. ceph snaps).</div><div class='add'>+ *</div><div class='add'>+ * This function does all the work needed for actually writing data to a</div><div class='add'>+ * file. It does all basic checks, removes SUID from the file, updates</div><div class='add'>+ * modification times and calls proper subroutines depending on whether we</div><div class='add'>+ * do direct IO or a standard buffered write.</div><div class='add'>+ *</div><div class='add'>+ * The caller must hold appropriate locks around this function and have called</div><div class='add'>+ * generic_write_checks() already.  The caller is also responsible for doing</div><div class='add'>+ * any necessary syncing afterwards.</div><div class='add'>+ *</div><div class='add'>+ * This function does *not* take care of syncing data in case of O_SYNC write.</div><div class='add'>+ * A caller has to handle it. This is mainly due to the fact that we want to</div><div class='add'>+ * avoid syncing under i_rwsem.</div><div class='add'>+ *</div><div class='add'>+ * Return:</div><div class='add'>+ * * number of bytes written, even for truncated writes</div><div class='add'>+ * * negative error code if no data has been written at all</div><div class='add'>+ */</div><div class='add'>+ssize_t netfs_buffered_write_iter_locked(struct kiocb *iocb, struct iov_iter *from,</div><div class='add'>+					 struct netfs_group *netfs_group)</div><div class='add'>+{</div><div class='add'>+	struct file *file = iocb-&gt;ki_filp;</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	trace_netfs_write_iter(iocb, from);</div><div class='add'>+</div><div class='add'>+	ret = file_remove_privs(file);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	ret = file_update_time(file);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	return netfs_perform_write(iocb, from, netfs_group);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_buffered_write_iter_locked);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_file_write_iter - write data to a file</div><div class='add'>+ * @iocb: IO state structure</div><div class='add'>+ * @from: iov_iter with data to write</div><div class='add'>+ *</div><div class='add'>+ * Perform a write to a file, writing into the pagecache if possible and doing</div><div class='add'>+ * an unbuffered write instead if not.</div><div class='add'>+ *</div><div class='add'>+ * Return:</div><div class='add'>+ * * Negative error code if no data has been written at all of</div><div class='add'>+ *   vfs_fsync_range() failed for a synchronous write</div><div class='add'>+ * * Number of bytes written, even for truncated writes</div><div class='add'>+ */</div><div class='add'>+ssize_t netfs_file_write_iter(struct kiocb *iocb, struct iov_iter *from)</div><div class='add'>+{</div><div class='add'>+	struct file *file = iocb-&gt;ki_filp;</div><div class='add'>+	struct inode *inode = file-&gt;f_mapping-&gt;host;</div><div class='add'>+	struct netfs_inode *ictx = netfs_inode(inode);</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	_enter("%llx,%zx,%llx", iocb-&gt;ki_pos, iov_iter_count(from), i_size_read(inode));</div><div class='add'>+</div><div class='add'>+	if (!iov_iter_count(from))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if ((iocb-&gt;ki_flags &amp; IOCB_DIRECT) ||</div><div class='add'>+	    test_bit(NETFS_ICTX_UNBUFFERED, &amp;ictx-&gt;flags))</div><div class='add'>+		return netfs_unbuffered_write_iter(iocb, from);</div><div class='add'>+</div><div class='add'>+	ret = netfs_start_io_write(inode);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	ret = generic_write_checks(iocb, from);</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		ret = netfs_buffered_write_iter_locked(iocb, from, NULL);</div><div class='add'>+	netfs_end_io_write(inode);</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		ret = generic_write_sync(iocb, ret);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_file_write_iter);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Notification that a previously read-only page is about to become writable.</div><div class='add'>+ * The caller indicates the precise page that needs to be written to, but</div><div class='add'>+ * we only track group on a per-folio basis, so we block more often than</div><div class='add'>+ * we might otherwise.</div><div class='add'>+ */</div><div class='add'>+vm_fault_t netfs_page_mkwrite(struct vm_fault *vmf, struct netfs_group *netfs_group)</div><div class='add'>+{</div><div class='add'>+	struct netfs_group *group;</div><div class='add'>+	struct folio *folio = page_folio(vmf-&gt;page);</div><div class='add'>+	struct file *file = vmf-&gt;vma-&gt;vm_file;</div><div class='add'>+	struct address_space *mapping = file-&gt;f_mapping;</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='add'>+	struct netfs_inode *ictx = netfs_inode(inode);</div><div class='add'>+	vm_fault_t ret = VM_FAULT_NOPAGE;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	_enter("%lx", folio-&gt;index);</div><div class='add'>+</div><div class='add'>+	sb_start_pagefault(inode-&gt;i_sb);</div><div class='add'>+</div><div class='add'>+	if (folio_lock_killable(folio) &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+	if (folio-&gt;mapping != mapping)</div><div class='add'>+		goto unlock;</div><div class='add'>+	if (folio_wait_writeback_killable(folio) &lt; 0)</div><div class='add'>+		goto unlock;</div><div class='add'>+</div><div class='add'>+	/* Can we see a streaming write here? */</div><div class='add'>+	if (WARN_ON(!folio_test_uptodate(folio))) {</div><div class='add'>+		ret = VM_FAULT_SIGBUS;</div><div class='add'>+		goto unlock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	group = netfs_folio_group(folio);</div><div class='add'>+	if (group != netfs_group &amp;&amp; group != NETFS_FOLIO_COPY_TO_CACHE) {</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		err = filemap_fdatawrite_range(mapping,</div><div class='add'>+					       folio_pos(folio),</div><div class='add'>+					       folio_next_pos(folio));</div><div class='add'>+		switch (err) {</div><div class='add'>+		case 0:</div><div class='add'>+			ret = VM_FAULT_RETRY;</div><div class='add'>+			goto out;</div><div class='add'>+		case -ENOMEM:</div><div class='add'>+			ret = VM_FAULT_OOM;</div><div class='add'>+			goto out;</div><div class='add'>+		default:</div><div class='add'>+			ret = VM_FAULT_SIGBUS;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (folio_test_dirty(folio))</div><div class='add'>+		trace_netfs_folio(folio, netfs_folio_trace_mkwrite_plus);</div><div class='add'>+	else</div><div class='add'>+		trace_netfs_folio(folio, netfs_folio_trace_mkwrite);</div><div class='add'>+	netfs_set_group(folio, netfs_group);</div><div class='add'>+	file_update_time(file);</div><div class='add'>+	set_bit(NETFS_ICTX_MODIFIED_ATTR, &amp;ictx-&gt;flags);</div><div class='add'>+	if (ictx-&gt;ops-&gt;post_modify)</div><div class='add'>+		ictx-&gt;ops-&gt;post_modify(inode);</div><div class='add'>+	ret = VM_FAULT_LOCKED;</div><div class='add'>+out:</div><div class='add'>+	sb_end_pagefault(inode-&gt;i_sb);</div><div class='add'>+	return ret;</div><div class='add'>+unlock:</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	goto out;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_page_mkwrite);</div><div class='head'>diff --git a/fs/netfs/direct_read.c b/fs/netfs/direct_read.c<br/>new file mode 100644<br/>index 000000000000..a498ee8d6674<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/direct_read.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/direct_read.c</a></div><div class='hunk'>@@ -0,0 +1,272 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='add'>+/* Direct I/O support.</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2023 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/export.h&gt;</div><div class='add'>+#include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/mm.h&gt;</div><div class='add'>+#include &lt;linux/pagemap.h&gt;</div><div class='add'>+#include &lt;linux/slab.h&gt;</div><div class='add'>+#include &lt;linux/uio.h&gt;</div><div class='add'>+#include &lt;linux/sched/mm.h&gt;</div><div class='add'>+#include &lt;linux/task_io_accounting_ops.h&gt;</div><div class='add'>+#include &lt;linux/netfs.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+static void netfs_prepare_dio_read_iterator(struct netfs_io_subrequest *subreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *rreq = subreq-&gt;rreq;</div><div class='add'>+	size_t rsize;</div><div class='add'>+</div><div class='add'>+	rsize = umin(subreq-&gt;len, rreq-&gt;io_streams[0].sreq_max_len);</div><div class='add'>+	subreq-&gt;len = rsize;</div><div class='add'>+</div><div class='add'>+	if (unlikely(rreq-&gt;io_streams[0].sreq_max_segs)) {</div><div class='add'>+		size_t limit = netfs_limit_iter(&amp;rreq-&gt;buffer.iter, 0, rsize,</div><div class='add'>+						rreq-&gt;io_streams[0].sreq_max_segs);</div><div class='add'>+</div><div class='add'>+		if (limit &lt; rsize) {</div><div class='add'>+			subreq-&gt;len = limit;</div><div class='add'>+			trace_netfs_sreq(subreq, netfs_sreq_trace_limited);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	trace_netfs_sreq(subreq, netfs_sreq_trace_prepare);</div><div class='add'>+</div><div class='add'>+	subreq-&gt;io_iter	= rreq-&gt;buffer.iter;</div><div class='add'>+	iov_iter_truncate(&amp;subreq-&gt;io_iter, subreq-&gt;len);</div><div class='add'>+	iov_iter_advance(&amp;rreq-&gt;buffer.iter, subreq-&gt;len);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Perform a read to a buffer from the server, slicing up the region to be read</div><div class='add'>+ * according to the network rsize.</div><div class='add'>+ */</div><div class='add'>+static int netfs_dispatch_unbuffered_reads(struct netfs_io_request *rreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_stream *stream = &amp;rreq-&gt;io_streams[0];</div><div class='add'>+	unsigned long long start = rreq-&gt;start;</div><div class='add'>+	ssize_t size = rreq-&gt;len;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		struct netfs_io_subrequest *subreq;</div><div class='add'>+		ssize_t slice;</div><div class='add'>+</div><div class='add'>+		subreq = netfs_alloc_subrequest(rreq);</div><div class='add'>+		if (!subreq) {</div><div class='add'>+			ret = -ENOMEM;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		subreq-&gt;source	= NETFS_DOWNLOAD_FROM_SERVER;</div><div class='add'>+		subreq-&gt;start	= start;</div><div class='add'>+		subreq-&gt;len	= size;</div><div class='add'>+</div><div class='add'>+		__set_bit(NETFS_SREQ_IN_PROGRESS, &amp;subreq-&gt;flags);</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;rreq-&gt;lock);</div><div class='add'>+		list_add_tail(&amp;subreq-&gt;rreq_link, &amp;stream-&gt;subrequests);</div><div class='add'>+		if (list_is_first(&amp;subreq-&gt;rreq_link, &amp;stream-&gt;subrequests)) {</div><div class='add'>+			stream-&gt;front = subreq;</div><div class='add'>+			if (!stream-&gt;active) {</div><div class='add'>+				stream-&gt;collected_to = stream-&gt;front-&gt;start;</div><div class='add'>+				/* Store list pointers before active flag */</div><div class='add'>+				smp_store_release(&amp;stream-&gt;active, true);</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+		trace_netfs_sreq(subreq, netfs_sreq_trace_added);</div><div class='add'>+		spin_unlock(&amp;rreq-&gt;lock);</div><div class='add'>+</div><div class='add'>+		netfs_stat(&amp;netfs_n_rh_download);</div><div class='add'>+		if (rreq-&gt;netfs_ops-&gt;prepare_read) {</div><div class='add'>+			ret = rreq-&gt;netfs_ops-&gt;prepare_read(subreq);</div><div class='add'>+			if (ret &lt; 0) {</div><div class='add'>+				netfs_put_subrequest(subreq, netfs_sreq_trace_put_cancel);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		netfs_prepare_dio_read_iterator(subreq);</div><div class='add'>+		slice = subreq-&gt;len;</div><div class='add'>+		size -= slice;</div><div class='add'>+		start += slice;</div><div class='add'>+		rreq-&gt;submitted += slice;</div><div class='add'>+		if (size &lt;= 0) {</div><div class='add'>+			smp_wmb(); /* Write lists before ALL_QUEUED. */</div><div class='add'>+			set_bit(NETFS_RREQ_ALL_QUEUED, &amp;rreq-&gt;flags);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		rreq-&gt;netfs_ops-&gt;issue_read(subreq);</div><div class='add'>+</div><div class='add'>+		if (test_bit(NETFS_RREQ_PAUSE, &amp;rreq-&gt;flags))</div><div class='add'>+			netfs_wait_for_paused_read(rreq);</div><div class='add'>+		if (test_bit(NETFS_RREQ_FAILED, &amp;rreq-&gt;flags))</div><div class='add'>+			break;</div><div class='add'>+		cond_resched();</div><div class='add'>+	} while (size &gt; 0);</div><div class='add'>+</div><div class='add'>+	if (unlikely(size &gt; 0)) {</div><div class='add'>+		smp_wmb(); /* Write lists before ALL_QUEUED. */</div><div class='add'>+		set_bit(NETFS_RREQ_ALL_QUEUED, &amp;rreq-&gt;flags);</div><div class='add'>+		netfs_wake_collector(rreq);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Perform a read to an application buffer, bypassing the pagecache and the</div><div class='add'>+ * local disk cache.</div><div class='add'>+ */</div><div class='add'>+static ssize_t netfs_unbuffered_read(struct netfs_io_request *rreq, bool sync)</div><div class='add'>+{</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	_enter("R=%x %llx-%llx",</div><div class='add'>+	       rreq-&gt;debug_id, rreq-&gt;start, rreq-&gt;start + rreq-&gt;len - 1);</div><div class='add'>+</div><div class='add'>+	if (rreq-&gt;len == 0) {</div><div class='add'>+		pr_err("Zero-sized read [R=%x]\n", rreq-&gt;debug_id);</div><div class='add'>+		netfs_put_request(rreq, netfs_rreq_trace_put_discard);</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	// TODO: Use bounce buffer if requested</div><div class='add'>+</div><div class='add'>+	inode_dio_begin(rreq-&gt;inode);</div><div class='add'>+</div><div class='add'>+	ret = netfs_dispatch_unbuffered_reads(rreq);</div><div class='add'>+</div><div class='add'>+	if (!rreq-&gt;submitted) {</div><div class='add'>+		netfs_put_request(rreq, netfs_rreq_trace_put_no_submit);</div><div class='add'>+		inode_dio_end(rreq-&gt;inode);</div><div class='add'>+		ret = 0;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (sync)</div><div class='add'>+		ret = netfs_wait_for_read(rreq);</div><div class='add'>+	else</div><div class='add'>+		ret = -EIOCBQUEUED;</div><div class='add'>+out:</div><div class='add'>+	_leave(" = %zd", ret);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_unbuffered_read_iter_locked - Perform an unbuffered or direct I/O read</div><div class='add'>+ * @iocb: The I/O control descriptor describing the read</div><div class='add'>+ * @iter: The output buffer (also specifies read length)</div><div class='add'>+ *</div><div class='add'>+ * Perform an unbuffered I/O or direct I/O from the file in @iocb to the</div><div class='add'>+ * output buffer.  No use is made of the pagecache.</div><div class='add'>+ *</div><div class='add'>+ * The caller must hold any appropriate locks.</div><div class='add'>+ */</div><div class='add'>+ssize_t netfs_unbuffered_read_iter_locked(struct kiocb *iocb, struct iov_iter *iter)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *rreq;</div><div class='add'>+	ssize_t ret;</div><div class='add'>+	size_t orig_count = iov_iter_count(iter);</div><div class='add'>+	bool sync = is_sync_kiocb(iocb);</div><div class='add'>+</div><div class='add'>+	_enter("");</div><div class='add'>+</div><div class='add'>+	if (!orig_count)</div><div class='add'>+		return 0; /* Don't update atime */</div><div class='add'>+</div><div class='add'>+	ret = kiocb_write_and_wait(iocb, orig_count);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+	file_accessed(iocb-&gt;ki_filp);</div><div class='add'>+</div><div class='add'>+	rreq = netfs_alloc_request(iocb-&gt;ki_filp-&gt;f_mapping, iocb-&gt;ki_filp,</div><div class='add'>+				   iocb-&gt;ki_pos, orig_count,</div><div class='add'>+				   iocb-&gt;ki_flags &amp; IOCB_DIRECT ?</div><div class='add'>+				   NETFS_DIO_READ : NETFS_UNBUFFERED_READ);</div><div class='add'>+	if (IS_ERR(rreq))</div><div class='add'>+		return PTR_ERR(rreq);</div><div class='add'>+</div><div class='add'>+	netfs_stat(&amp;netfs_n_rh_dio_read);</div><div class='add'>+	trace_netfs_read(rreq, rreq-&gt;start, rreq-&gt;len, netfs_read_trace_dio_read);</div><div class='add'>+</div><div class='add'>+	/* If this is an async op, we have to keep track of the destination</div><div class='add'>+	 * buffer for ourselves as the caller's iterator will be trashed when</div><div class='add'>+	 * we return.</div><div class='add'>+	 *</div><div class='add'>+	 * In such a case, extract an iterator to represent as much of the the</div><div class='add'>+	 * output buffer as we can manage.  Note that the extraction might not</div><div class='add'>+	 * be able to allocate a sufficiently large bvec array and may shorten</div><div class='add'>+	 * the request.</div><div class='add'>+	 */</div><div class='add'>+	if (user_backed_iter(iter)) {</div><div class='add'>+		ret = netfs_extract_user_iter(iter, rreq-&gt;len, &amp;rreq-&gt;buffer.iter, 0);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto error_put;</div><div class='add'>+		rreq-&gt;direct_bv = (struct bio_vec *)rreq-&gt;buffer.iter.bvec;</div><div class='add'>+		rreq-&gt;direct_bv_count = ret;</div><div class='add'>+		rreq-&gt;direct_bv_unpin = iov_iter_extract_will_pin(iter);</div><div class='add'>+		rreq-&gt;len = iov_iter_count(&amp;rreq-&gt;buffer.iter);</div><div class='add'>+	} else {</div><div class='add'>+		rreq-&gt;buffer.iter = *iter;</div><div class='add'>+		rreq-&gt;len = orig_count;</div><div class='add'>+		rreq-&gt;direct_bv_unpin = false;</div><div class='add'>+		iov_iter_advance(iter, orig_count);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	// TODO: Set up bounce buffer if needed</div><div class='add'>+</div><div class='add'>+	if (!sync) {</div><div class='add'>+		rreq-&gt;iocb = iocb;</div><div class='add'>+		__set_bit(NETFS_RREQ_OFFLOAD_COLLECTION, &amp;rreq-&gt;flags);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = netfs_unbuffered_read(rreq, sync);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out; /* May be -EIOCBQUEUED */</div><div class='add'>+	if (sync) {</div><div class='add'>+		// TODO: Copy from bounce buffer</div><div class='add'>+		iocb-&gt;ki_pos += rreq-&gt;transferred;</div><div class='add'>+		ret = rreq-&gt;transferred;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	netfs_put_request(rreq, netfs_rreq_trace_put_return);</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		orig_count -= ret;</div><div class='add'>+	return ret;</div><div class='add'>+</div><div class='add'>+error_put:</div><div class='add'>+	netfs_put_failed_request(rreq);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_unbuffered_read_iter_locked);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_unbuffered_read_iter - Perform an unbuffered or direct I/O read</div><div class='add'>+ * @iocb: The I/O control descriptor describing the read</div><div class='add'>+ * @iter: The output buffer (also specifies read length)</div><div class='add'>+ *</div><div class='add'>+ * Perform an unbuffered I/O or direct I/O from the file in @iocb to the</div><div class='add'>+ * output buffer.  No use is made of the pagecache.</div><div class='add'>+ */</div><div class='add'>+ssize_t netfs_unbuffered_read_iter(struct kiocb *iocb, struct iov_iter *iter)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	if (!iter-&gt;count)</div><div class='add'>+		return 0; /* Don't update atime */</div><div class='add'>+</div><div class='add'>+	ret = netfs_start_io_direct(inode);</div><div class='add'>+	if (ret == 0) {</div><div class='add'>+		ret = netfs_unbuffered_read_iter_locked(iocb, iter);</div><div class='add'>+		netfs_end_io_direct(inode);</div><div class='add'>+	}</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_unbuffered_read_iter);</div><div class='head'>diff --git a/fs/netfs/direct_write.c b/fs/netfs/direct_write.c<br/>new file mode 100644<br/>index 000000000000..a9d1c3b2c084<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/direct_write.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/direct_write.c</a></div><div class='hunk'>@@ -0,0 +1,186 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='add'>+/* Unbuffered and direct write support.</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2023 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/export.h&gt;</div><div class='add'>+#include &lt;linux/uio.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Perform an unbuffered write where we may have to do an RMW operation on an</div><div class='add'>+ * encrypted file.  This can also be used for direct I/O writes.</div><div class='add'>+ */</div><div class='add'>+ssize_t netfs_unbuffered_write_iter_locked(struct kiocb *iocb, struct iov_iter *iter,</div><div class='add'>+						  struct netfs_group *netfs_group)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *wreq;</div><div class='add'>+	unsigned long long start = iocb-&gt;ki_pos;</div><div class='add'>+	unsigned long long end = start + iov_iter_count(iter);</div><div class='add'>+	ssize_t ret, n;</div><div class='add'>+	size_t len = iov_iter_count(iter);</div><div class='add'>+	bool async = !is_sync_kiocb(iocb);</div><div class='add'>+</div><div class='add'>+	_enter("");</div><div class='add'>+</div><div class='add'>+	/* We're going to need a bounce buffer if what we transmit is going to</div><div class='add'>+	 * be different in some way to the source buffer, e.g. because it gets</div><div class='add'>+	 * encrypted/compressed or because it needs expanding to a block size.</div><div class='add'>+	 */</div><div class='add'>+	// TODO</div><div class='add'>+</div><div class='add'>+	_debug("uw %llx-%llx", start, end);</div><div class='add'>+</div><div class='add'>+	wreq = netfs_create_write_req(iocb-&gt;ki_filp-&gt;f_mapping, iocb-&gt;ki_filp, start,</div><div class='add'>+				      iocb-&gt;ki_flags &amp; IOCB_DIRECT ?</div><div class='add'>+				      NETFS_DIO_WRITE : NETFS_UNBUFFERED_WRITE);</div><div class='add'>+	if (IS_ERR(wreq))</div><div class='add'>+		return PTR_ERR(wreq);</div><div class='add'>+</div><div class='add'>+	wreq-&gt;io_streams[0].avail = true;</div><div class='add'>+	trace_netfs_write(wreq, (iocb-&gt;ki_flags &amp; IOCB_DIRECT ?</div><div class='add'>+				 netfs_write_trace_dio_write :</div><div class='add'>+				 netfs_write_trace_unbuffered_write));</div><div class='add'>+</div><div class='add'>+	{</div><div class='add'>+		/* If this is an async op and we're not using a bounce buffer,</div><div class='add'>+		 * we have to save the source buffer as the iterator is only</div><div class='add'>+		 * good until we return.  In such a case, extract an iterator</div><div class='add'>+		 * to represent as much of the the output buffer as we can</div><div class='add'>+		 * manage.  Note that the extraction might not be able to</div><div class='add'>+		 * allocate a sufficiently large bvec array and may shorten the</div><div class='add'>+		 * request.</div><div class='add'>+		 */</div><div class='add'>+		if (user_backed_iter(iter)) {</div><div class='add'>+			n = netfs_extract_user_iter(iter, len, &amp;wreq-&gt;buffer.iter, 0);</div><div class='add'>+			if (n &lt; 0) {</div><div class='add'>+				ret = n;</div><div class='add'>+				goto error_put;</div><div class='add'>+			}</div><div class='add'>+			wreq-&gt;direct_bv = (struct bio_vec *)wreq-&gt;buffer.iter.bvec;</div><div class='add'>+			wreq-&gt;direct_bv_count = n;</div><div class='add'>+			wreq-&gt;direct_bv_unpin = iov_iter_extract_will_pin(iter);</div><div class='add'>+		} else {</div><div class='add'>+			/* If this is a kernel-generated async DIO request,</div><div class='add'>+			 * assume that any resources the iterator points to</div><div class='add'>+			 * (eg. a bio_vec array) will persist till the end of</div><div class='add'>+			 * the op.</div><div class='add'>+			 */</div><div class='add'>+			wreq-&gt;buffer.iter = *iter;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	__set_bit(NETFS_RREQ_USE_IO_ITER, &amp;wreq-&gt;flags);</div><div class='add'>+	if (async)</div><div class='add'>+		__set_bit(NETFS_RREQ_OFFLOAD_COLLECTION, &amp;wreq-&gt;flags);</div><div class='add'>+</div><div class='add'>+	/* Copy the data into the bounce buffer and encrypt it. */</div><div class='add'>+	// TODO</div><div class='add'>+</div><div class='add'>+	/* Dispatch the write. */</div><div class='add'>+	__set_bit(NETFS_RREQ_UPLOAD_TO_SERVER, &amp;wreq-&gt;flags);</div><div class='add'>+	if (async)</div><div class='add'>+		wreq-&gt;iocb = iocb;</div><div class='add'>+	wreq-&gt;len = iov_iter_count(&amp;wreq-&gt;buffer.iter);</div><div class='add'>+	ret = netfs_unbuffered_write(wreq, is_sync_kiocb(iocb), wreq-&gt;len);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		_debug("begin = %zd", ret);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!async) {</div><div class='add'>+		ret = netfs_wait_for_write(wreq);</div><div class='add'>+		if (ret &gt; 0)</div><div class='add'>+			iocb-&gt;ki_pos += ret;</div><div class='add'>+	} else {</div><div class='add'>+		ret = -EIOCBQUEUED;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	netfs_put_request(wreq, netfs_rreq_trace_put_return);</div><div class='add'>+	return ret;</div><div class='add'>+</div><div class='add'>+error_put:</div><div class='add'>+	netfs_put_failed_request(wreq);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_unbuffered_write_iter_locked);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_unbuffered_write_iter - Unbuffered write to a file</div><div class='add'>+ * @iocb: IO state structure</div><div class='add'>+ * @from: iov_iter with data to write</div><div class='add'>+ *</div><div class='add'>+ * Do an unbuffered write to a file, writing the data directly to the server</div><div class='add'>+ * and not lodging the data in the pagecache.</div><div class='add'>+ *</div><div class='add'>+ * Return:</div><div class='add'>+ * * Negative error code if no data has been written at all of</div><div class='add'>+ *   vfs_fsync_range() failed for a synchronous write</div><div class='add'>+ * * Number of bytes written, even for truncated writes</div><div class='add'>+ */</div><div class='add'>+ssize_t netfs_unbuffered_write_iter(struct kiocb *iocb, struct iov_iter *from)</div><div class='add'>+{</div><div class='add'>+	struct file *file = iocb-&gt;ki_filp;</div><div class='add'>+	struct address_space *mapping = file-&gt;f_mapping;</div><div class='add'>+	struct inode *inode = mapping-&gt;host;</div><div class='add'>+	struct netfs_inode *ictx = netfs_inode(inode);</div><div class='add'>+	ssize_t ret;</div><div class='add'>+	loff_t pos = iocb-&gt;ki_pos;</div><div class='add'>+	unsigned long long end = pos + iov_iter_count(from) - 1;</div><div class='add'>+</div><div class='add'>+	_enter("%llx,%zx,%llx", pos, iov_iter_count(from), i_size_read(inode));</div><div class='add'>+</div><div class='add'>+	if (!iov_iter_count(from))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	trace_netfs_write_iter(iocb, from);</div><div class='add'>+	netfs_stat(&amp;netfs_n_wh_dio_write);</div><div class='add'>+</div><div class='add'>+	ret = netfs_start_io_direct(inode);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+	ret = generic_write_checks(iocb, from);</div><div class='add'>+	if (ret &lt;= 0)</div><div class='add'>+		goto out;</div><div class='add'>+	ret = file_remove_privs(file);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+	ret = file_update_time(file);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+	if (iocb-&gt;ki_flags &amp; IOCB_NOWAIT) {</div><div class='add'>+		/* We could block if there are any pages in the range. */</div><div class='add'>+		ret = -EAGAIN;</div><div class='add'>+		if (filemap_range_has_page(mapping, pos, end))</div><div class='add'>+			if (filemap_invalidate_inode(inode, true, pos, end))</div><div class='add'>+				goto out;</div><div class='add'>+	} else {</div><div class='add'>+		ret = filemap_write_and_wait_range(mapping, pos, end);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * After a write we want buffered reads to be sure to go to disk to get</div><div class='add'>+	 * the new data.  We invalidate clean cached page from the region we're</div><div class='add'>+	 * about to write.  We do this *before* the write so that we can return</div><div class='add'>+	 * without clobbering -EIOCBQUEUED from -&gt;direct_IO().</div><div class='add'>+	 */</div><div class='add'>+	ret = filemap_invalidate_inode(inode, true, pos, end);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+	end = iocb-&gt;ki_pos + iov_iter_count(from);</div><div class='add'>+	if (end &gt; ictx-&gt;zero_point)</div><div class='add'>+		ictx-&gt;zero_point = end;</div><div class='add'>+</div><div class='add'>+	fscache_invalidate(netfs_i_cookie(ictx), NULL, i_size_read(inode),</div><div class='add'>+			   FSCACHE_INVAL_DIO_WRITE);</div><div class='add'>+	ret = netfs_unbuffered_write_iter_locked(iocb, from, NULL);</div><div class='add'>+out:</div><div class='add'>+	netfs_end_io_direct(inode);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_unbuffered_write_iter);</div><div class='head'>diff --git a/fs/netfs/fscache_cache.c b/fs/netfs/fscache_cache.c<br/>new file mode 100644<br/>index 000000000000..8f70f8da064b<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/fscache_cache.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/fscache_cache.c</a></div><div class='hunk'>@@ -0,0 +1,429 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='add'>+/* FS-Cache cache handling</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2021 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#define FSCACHE_DEBUG_LEVEL CACHE</div><div class='add'>+#include &lt;linux/export.h&gt;</div><div class='add'>+#include &lt;linux/slab.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+static LIST_HEAD(fscache_caches);</div><div class='add'>+DECLARE_RWSEM(fscache_addremove_sem);</div><div class='add'>+EXPORT_SYMBOL(fscache_addremove_sem);</div><div class='add'>+DECLARE_WAIT_QUEUE_HEAD(fscache_clearance_waiters);</div><div class='add'>+EXPORT_SYMBOL(fscache_clearance_waiters);</div><div class='add'>+</div><div class='add'>+static atomic_t fscache_cache_debug_id;</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Allocate a cache cookie.</div><div class='add'>+ */</div><div class='add'>+static struct fscache_cache *fscache_alloc_cache(const char *name)</div><div class='add'>+{</div><div class='add'>+	struct fscache_cache *cache;</div><div class='add'>+</div><div class='add'>+	cache = kzalloc(sizeof(*cache), GFP_KERNEL);</div><div class='add'>+	if (cache) {</div><div class='add'>+		if (name) {</div><div class='add'>+			cache-&gt;name = kstrdup(name, GFP_KERNEL);</div><div class='add'>+			if (!cache-&gt;name) {</div><div class='add'>+				kfree(cache);</div><div class='add'>+				return NULL;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+		refcount_set(&amp;cache-&gt;ref, 1);</div><div class='add'>+		INIT_LIST_HEAD(&amp;cache-&gt;cache_link);</div><div class='add'>+		cache-&gt;debug_id = atomic_inc_return(&amp;fscache_cache_debug_id);</div><div class='add'>+	}</div><div class='add'>+	return cache;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool fscache_get_cache_maybe(struct fscache_cache *cache,</div><div class='add'>+				    enum fscache_cache_trace where)</div><div class='add'>+{</div><div class='add'>+	bool success;</div><div class='add'>+	int ref;</div><div class='add'>+</div><div class='add'>+	success = __refcount_inc_not_zero(&amp;cache-&gt;ref, &amp;ref);</div><div class='add'>+	if (success)</div><div class='add'>+		trace_fscache_cache(cache-&gt;debug_id, ref + 1, where);</div><div class='add'>+	return success;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Look up a cache cookie.</div><div class='add'>+ */</div><div class='add'>+struct fscache_cache *fscache_lookup_cache(const char *name, bool is_cache)</div><div class='add'>+{</div><div class='add'>+	struct fscache_cache *candidate, *cache, *unnamed = NULL;</div><div class='add'>+</div><div class='add'>+	/* firstly check for the existence of the cache under read lock */</div><div class='add'>+	down_read(&amp;fscache_addremove_sem);</div><div class='add'>+</div><div class='add'>+	list_for_each_entry(cache, &amp;fscache_caches, cache_link) {</div><div class='add'>+		if (cache-&gt;name &amp;&amp; name &amp;&amp; strcmp(cache-&gt;name, name) == 0 &amp;&amp;</div><div class='add'>+		    fscache_get_cache_maybe(cache, fscache_cache_get_acquire))</div><div class='add'>+			goto got_cache_r;</div><div class='add'>+		if (!cache-&gt;name &amp;&amp; !name &amp;&amp;</div><div class='add'>+		    fscache_get_cache_maybe(cache, fscache_cache_get_acquire))</div><div class='add'>+			goto got_cache_r;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!name) {</div><div class='add'>+		list_for_each_entry(cache, &amp;fscache_caches, cache_link) {</div><div class='add'>+			if (cache-&gt;name &amp;&amp;</div><div class='add'>+			    fscache_get_cache_maybe(cache, fscache_cache_get_acquire))</div><div class='add'>+				goto got_cache_r;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	up_read(&amp;fscache_addremove_sem);</div><div class='add'>+</div><div class='add'>+	/* the cache does not exist - create a candidate */</div><div class='add'>+	candidate = fscache_alloc_cache(name);</div><div class='add'>+	if (!candidate)</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+</div><div class='add'>+	/* write lock, search again and add if still not present */</div><div class='add'>+	down_write(&amp;fscache_addremove_sem);</div><div class='add'>+</div><div class='add'>+	list_for_each_entry(cache, &amp;fscache_caches, cache_link) {</div><div class='add'>+		if (cache-&gt;name &amp;&amp; name &amp;&amp; strcmp(cache-&gt;name, name) == 0 &amp;&amp;</div><div class='add'>+		    fscache_get_cache_maybe(cache, fscache_cache_get_acquire))</div><div class='add'>+			goto got_cache_w;</div><div class='add'>+		if (!cache-&gt;name) {</div><div class='add'>+			unnamed = cache;</div><div class='add'>+			if (!name &amp;&amp;</div><div class='add'>+			    fscache_get_cache_maybe(cache, fscache_cache_get_acquire))</div><div class='add'>+				goto got_cache_w;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (unnamed &amp;&amp; is_cache &amp;&amp;</div><div class='add'>+	    fscache_get_cache_maybe(unnamed, fscache_cache_get_acquire))</div><div class='add'>+		goto use_unnamed_cache;</div><div class='add'>+</div><div class='add'>+	if (!name) {</div><div class='add'>+		list_for_each_entry(cache, &amp;fscache_caches, cache_link) {</div><div class='add'>+			if (cache-&gt;name &amp;&amp;</div><div class='add'>+			    fscache_get_cache_maybe(cache, fscache_cache_get_acquire))</div><div class='add'>+				goto got_cache_w;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	list_add_tail(&amp;candidate-&gt;cache_link, &amp;fscache_caches);</div><div class='add'>+	trace_fscache_cache(candidate-&gt;debug_id,</div><div class='add'>+			    refcount_read(&amp;candidate-&gt;ref),</div><div class='add'>+			    fscache_cache_new_acquire);</div><div class='add'>+	up_write(&amp;fscache_addremove_sem);</div><div class='add'>+	return candidate;</div><div class='add'>+</div><div class='add'>+got_cache_r:</div><div class='add'>+	up_read(&amp;fscache_addremove_sem);</div><div class='add'>+	return cache;</div><div class='add'>+use_unnamed_cache:</div><div class='add'>+	cache = unnamed;</div><div class='add'>+	cache-&gt;name = candidate-&gt;name;</div><div class='add'>+	candidate-&gt;name = NULL;</div><div class='add'>+got_cache_w:</div><div class='add'>+	up_write(&amp;fscache_addremove_sem);</div><div class='add'>+	kfree(candidate-&gt;name);</div><div class='add'>+	kfree(candidate);</div><div class='add'>+	return cache;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fscache_acquire_cache - Acquire a cache-level cookie.</div><div class='add'>+ * @name: The name of the cache.</div><div class='add'>+ *</div><div class='add'>+ * Get a cookie to represent an actual cache.  If a name is given and there is</div><div class='add'>+ * a nameless cache record available, this will acquire that and set its name,</div><div class='add'>+ * directing all the volumes using it to this cache.</div><div class='add'>+ *</div><div class='add'>+ * The cache will be switched over to the preparing state if not currently in</div><div class='add'>+ * use, otherwise -EBUSY will be returned.</div><div class='add'>+ */</div><div class='add'>+struct fscache_cache *fscache_acquire_cache(const char *name)</div><div class='add'>+{</div><div class='add'>+	struct fscache_cache *cache;</div><div class='add'>+</div><div class='add'>+	ASSERT(name);</div><div class='add'>+	cache = fscache_lookup_cache(name, true);</div><div class='add'>+	if (IS_ERR(cache))</div><div class='add'>+		return cache;</div><div class='add'>+</div><div class='add'>+	if (!fscache_set_cache_state_maybe(cache,</div><div class='add'>+					   FSCACHE_CACHE_IS_NOT_PRESENT,</div><div class='add'>+					   FSCACHE_CACHE_IS_PREPARING)) {</div><div class='add'>+		pr_warn("Cache tag %s in use\n", name);</div><div class='add'>+		fscache_put_cache(cache, fscache_cache_put_cache);</div><div class='add'>+		return ERR_PTR(-EBUSY);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return cache;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(fscache_acquire_cache);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fscache_put_cache - Release a cache-level cookie.</div><div class='add'>+ * @cache: The cache cookie to be released</div><div class='add'>+ * @where: An indication of where the release happened</div><div class='add'>+ *</div><div class='add'>+ * Release the caller's reference on a cache-level cookie.  The @where</div><div class='add'>+ * indication should give information about the circumstances in which the call</div><div class='add'>+ * occurs and will be logged through a tracepoint.</div><div class='add'>+ */</div><div class='add'>+void fscache_put_cache(struct fscache_cache *cache,</div><div class='add'>+		       enum fscache_cache_trace where)</div><div class='add'>+{</div><div class='add'>+	unsigned int debug_id;</div><div class='add'>+	bool zero;</div><div class='add'>+	int ref;</div><div class='add'>+</div><div class='add'>+	if (IS_ERR_OR_NULL(cache))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	debug_id = cache-&gt;debug_id;</div><div class='add'>+	zero = __refcount_dec_and_test(&amp;cache-&gt;ref, &amp;ref);</div><div class='add'>+	trace_fscache_cache(debug_id, ref - 1, where);</div><div class='add'>+</div><div class='add'>+	if (zero) {</div><div class='add'>+		down_write(&amp;fscache_addremove_sem);</div><div class='add'>+		list_del_init(&amp;cache-&gt;cache_link);</div><div class='add'>+		up_write(&amp;fscache_addremove_sem);</div><div class='add'>+		kfree(cache-&gt;name);</div><div class='add'>+		kfree(cache);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fscache_relinquish_cache - Reset cache state and release cookie</div><div class='add'>+ * @cache: The cache cookie to be released</div><div class='add'>+ *</div><div class='add'>+ * Reset the state of a cache and release the caller's reference on a cache</div><div class='add'>+ * cookie.</div><div class='add'>+ */</div><div class='add'>+void fscache_relinquish_cache(struct fscache_cache *cache)</div><div class='add'>+{</div><div class='add'>+	enum fscache_cache_trace where =</div><div class='add'>+		(cache-&gt;state == FSCACHE_CACHE_IS_PREPARING) ?</div><div class='add'>+		fscache_cache_put_prep_failed :</div><div class='add'>+		fscache_cache_put_relinquish;</div><div class='add'>+</div><div class='add'>+	cache-&gt;ops = NULL;</div><div class='add'>+	cache-&gt;cache_priv = NULL;</div><div class='add'>+	fscache_set_cache_state(cache, FSCACHE_CACHE_IS_NOT_PRESENT);</div><div class='add'>+	fscache_put_cache(cache, where);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(fscache_relinquish_cache);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fscache_add_cache - Declare a cache as being open for business</div><div class='add'>+ * @cache: The cache-level cookie representing the cache</div><div class='add'>+ * @ops: Table of cache operations to use</div><div class='add'>+ * @cache_priv: Private data for the cache record</div><div class='add'>+ *</div><div class='add'>+ * Add a cache to the system, making it available for netfs's to use.</div><div class='add'>+ *</div><div class='add'>+ * See Documentation/filesystems/caching/backend-api.rst for a complete</div><div class='add'>+ * description.</div><div class='add'>+ */</div><div class='add'>+int fscache_add_cache(struct fscache_cache *cache,</div><div class='add'>+		      const struct fscache_cache_ops *ops,</div><div class='add'>+		      void *cache_priv)</div><div class='add'>+{</div><div class='add'>+	int n_accesses;</div><div class='add'>+</div><div class='add'>+	_enter("{%s,%s}", ops-&gt;name, cache-&gt;name);</div><div class='add'>+</div><div class='add'>+	BUG_ON(fscache_cache_state(cache) != FSCACHE_CACHE_IS_PREPARING);</div><div class='add'>+</div><div class='add'>+	/* Get a ref on the cache cookie and keep its n_accesses counter raised</div><div class='add'>+	 * by 1 to prevent wakeups from transitioning it to 0 until we're</div><div class='add'>+	 * withdrawing caching services from it.</div><div class='add'>+	 */</div><div class='add'>+	n_accesses = atomic_inc_return(&amp;cache-&gt;n_accesses);</div><div class='add'>+	trace_fscache_access_cache(cache-&gt;debug_id, refcount_read(&amp;cache-&gt;ref),</div><div class='add'>+				   n_accesses, fscache_access_cache_pin);</div><div class='add'>+</div><div class='add'>+	down_write(&amp;fscache_addremove_sem);</div><div class='add'>+</div><div class='add'>+	cache-&gt;ops = ops;</div><div class='add'>+	cache-&gt;cache_priv = cache_priv;</div><div class='add'>+	fscache_set_cache_state(cache, FSCACHE_CACHE_IS_ACTIVE);</div><div class='add'>+</div><div class='add'>+	up_write(&amp;fscache_addremove_sem);</div><div class='add'>+	pr_notice("Cache \"%s\" added (type %s)\n", cache-&gt;name, ops-&gt;name);</div><div class='add'>+	_leave(" = 0 [%s]", cache-&gt;name);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(fscache_add_cache);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fscache_begin_cache_access - Pin a cache so it can be accessed</div><div class='add'>+ * @cache: The cache-level cookie</div><div class='add'>+ * @why: An indication of the circumstances of the access for tracing</div><div class='add'>+ *</div><div class='add'>+ * Attempt to pin the cache to prevent it from going away whilst we're</div><div class='add'>+ * accessing it and returns true if successful.  This works as follows:</div><div class='add'>+ *</div><div class='add'>+ *  (1) If the cache tests as not live (state is not FSCACHE_CACHE_IS_ACTIVE),</div><div class='add'>+ *      then we return false to indicate access was not permitted.</div><div class='add'>+ *</div><div class='add'>+ *  (2) If the cache tests as live, then we increment the n_accesses count and</div><div class='add'>+ *      then recheck the liveness, ending the access if it ceased to be live.</div><div class='add'>+ *</div><div class='add'>+ *  (3) When we end the access, we decrement n_accesses and wake up the any</div><div class='add'>+ *      waiters if it reaches 0.</div><div class='add'>+ *</div><div class='add'>+ *  (4) Whilst the cache is caching, n_accesses is kept artificially</div><div class='add'>+ *      incremented to prevent wakeups from happening.</div><div class='add'>+ *</div><div class='add'>+ *  (5) When the cache is taken offline, the state is changed to prevent new</div><div class='add'>+ *      accesses, n_accesses is decremented and we wait for n_accesses to</div><div class='add'>+ *      become 0.</div><div class='add'>+ */</div><div class='add'>+bool fscache_begin_cache_access(struct fscache_cache *cache, enum fscache_access_trace why)</div><div class='add'>+{</div><div class='add'>+	int n_accesses;</div><div class='add'>+</div><div class='add'>+	if (!fscache_cache_is_live(cache))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	n_accesses = atomic_inc_return(&amp;cache-&gt;n_accesses);</div><div class='add'>+	smp_mb__after_atomic(); /* Reread live flag after n_accesses */</div><div class='add'>+	trace_fscache_access_cache(cache-&gt;debug_id, refcount_read(&amp;cache-&gt;ref),</div><div class='add'>+				   n_accesses, why);</div><div class='add'>+	if (!fscache_cache_is_live(cache)) {</div><div class='add'>+		fscache_end_cache_access(cache, fscache_access_unlive);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fscache_end_cache_access - Unpin a cache at the end of an access.</div><div class='add'>+ * @cache: The cache-level cookie</div><div class='add'>+ * @why: An indication of the circumstances of the access for tracing</div><div class='add'>+ *</div><div class='add'>+ * Unpin a cache after we've accessed it.  The @why indicator is merely</div><div class='add'>+ * provided for tracing purposes.</div><div class='add'>+ */</div><div class='add'>+void fscache_end_cache_access(struct fscache_cache *cache, enum fscache_access_trace why)</div><div class='add'>+{</div><div class='add'>+	int n_accesses;</div><div class='add'>+</div><div class='add'>+	smp_mb__before_atomic();</div><div class='add'>+	n_accesses = atomic_dec_return(&amp;cache-&gt;n_accesses);</div><div class='add'>+	trace_fscache_access_cache(cache-&gt;debug_id, refcount_read(&amp;cache-&gt;ref),</div><div class='add'>+				   n_accesses, why);</div><div class='add'>+	if (n_accesses == 0)</div><div class='add'>+		wake_up_var(&amp;cache-&gt;n_accesses);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fscache_io_error - Note a cache I/O error</div><div class='add'>+ * @cache: The record describing the cache</div><div class='add'>+ *</div><div class='add'>+ * Note that an I/O error occurred in a cache and that it should no longer be</div><div class='add'>+ * used for anything.  This also reports the error into the kernel log.</div><div class='add'>+ *</div><div class='add'>+ * See Documentation/filesystems/caching/backend-api.rst for a complete</div><div class='add'>+ * description.</div><div class='add'>+ */</div><div class='add'>+void fscache_io_error(struct fscache_cache *cache)</div><div class='add'>+{</div><div class='add'>+	if (fscache_set_cache_state_maybe(cache,</div><div class='add'>+					  FSCACHE_CACHE_IS_ACTIVE,</div><div class='add'>+					  FSCACHE_CACHE_GOT_IOERROR))</div><div class='add'>+		pr_err("Cache '%s' stopped due to I/O error\n",</div><div class='add'>+		       cache-&gt;name);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(fscache_io_error);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fscache_withdraw_cache - Withdraw a cache from the active service</div><div class='add'>+ * @cache: The cache cookie</div><div class='add'>+ *</div><div class='add'>+ * Begin the process of withdrawing a cache from service.  This stops new</div><div class='add'>+ * cache-level and volume-level accesses from taking place and waits for</div><div class='add'>+ * currently ongoing cache-level accesses to end.</div><div class='add'>+ */</div><div class='add'>+void fscache_withdraw_cache(struct fscache_cache *cache)</div><div class='add'>+{</div><div class='add'>+	int n_accesses;</div><div class='add'>+</div><div class='add'>+	pr_notice("Withdrawing cache \"%s\" (%u objs)\n",</div><div class='add'>+		  cache-&gt;name, atomic_read(&amp;cache-&gt;object_count));</div><div class='add'>+</div><div class='add'>+	fscache_set_cache_state(cache, FSCACHE_CACHE_IS_WITHDRAWN);</div><div class='add'>+</div><div class='add'>+	/* Allow wakeups on dec-to-0 */</div><div class='add'>+	n_accesses = atomic_dec_return(&amp;cache-&gt;n_accesses);</div><div class='add'>+	trace_fscache_access_cache(cache-&gt;debug_id, refcount_read(&amp;cache-&gt;ref),</div><div class='add'>+				   n_accesses, fscache_access_cache_unpin);</div><div class='add'>+</div><div class='add'>+	wait_var_event(&amp;cache-&gt;n_accesses,</div><div class='add'>+		       atomic_read(&amp;cache-&gt;n_accesses) == 0);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(fscache_withdraw_cache);</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_PROC_FS</div><div class='add'>+static const char fscache_cache_states[NR__FSCACHE_CACHE_STATE] __nonstring = "-PAEW";</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Generate a list of caches in /proc/fs/fscache/caches</div><div class='add'>+ */</div><div class='add'>+static int fscache_caches_seq_show(struct seq_file *m, void *v)</div><div class='add'>+{</div><div class='add'>+	struct fscache_cache *cache;</div><div class='add'>+</div><div class='add'>+	if (v == &amp;fscache_caches) {</div><div class='add'>+		seq_puts(m,</div><div class='add'>+			 "CACHE    REF   VOLS  OBJS  ACCES S NAME\n"</div><div class='add'>+			 "======== ===== ===== ===== ===== = ===============\n"</div><div class='add'>+			 );</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	cache = list_entry(v, struct fscache_cache, cache_link);</div><div class='add'>+	seq_printf(m,</div><div class='add'>+		   "%08x %5d %5d %5d %5d %c %s\n",</div><div class='add'>+		   cache-&gt;debug_id,</div><div class='add'>+		   refcount_read(&amp;cache-&gt;ref),</div><div class='add'>+		   atomic_read(&amp;cache-&gt;n_volumes),</div><div class='add'>+		   atomic_read(&amp;cache-&gt;object_count),</div><div class='add'>+		   atomic_read(&amp;cache-&gt;n_accesses),</div><div class='add'>+		   fscache_cache_states[cache-&gt;state],</div><div class='add'>+		   cache-&gt;name ?: "-");</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void *fscache_caches_seq_start(struct seq_file *m, loff_t *_pos)</div><div class='add'>+	__acquires(fscache_addremove_sem)</div><div class='add'>+{</div><div class='add'>+	down_read(&amp;fscache_addremove_sem);</div><div class='add'>+	return seq_list_start_head(&amp;fscache_caches, *_pos);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void *fscache_caches_seq_next(struct seq_file *m, void *v, loff_t *_pos)</div><div class='add'>+{</div><div class='add'>+	return seq_list_next(v, &amp;fscache_caches, _pos);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fscache_caches_seq_stop(struct seq_file *m, void *v)</div><div class='add'>+	__releases(fscache_addremove_sem)</div><div class='add'>+{</div><div class='add'>+	up_read(&amp;fscache_addremove_sem);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+const struct seq_operations fscache_caches_seq_ops = {</div><div class='add'>+	.start  = fscache_caches_seq_start,</div><div class='add'>+	.next   = fscache_caches_seq_next,</div><div class='add'>+	.stop   = fscache_caches_seq_stop,</div><div class='add'>+	.show   = fscache_caches_seq_show,</div><div class='add'>+};</div><div class='add'>+#endif /* CONFIG_PROC_FS */</div><div class='head'>diff --git a/fs/netfs/fscache_cookie.c b/fs/netfs/fscache_cookie.c<br/>new file mode 100644<br/>index 000000000000..3d56fc73435f<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/fscache_cookie.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/fscache_cookie.c</a></div><div class='hunk'>@@ -0,0 +1,1184 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='add'>+/* netfs cookie management</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2021 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ *</div><div class='add'>+ * See Documentation/filesystems/caching/netfs-api.rst for more information on</div><div class='add'>+ * the netfs API.</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#define FSCACHE_DEBUG_LEVEL COOKIE</div><div class='add'>+#include &lt;linux/module.h&gt;</div><div class='add'>+#include &lt;linux/slab.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+struct kmem_cache *fscache_cookie_jar;</div><div class='add'>+</div><div class='add'>+static void fscache_cookie_lru_timed_out(struct timer_list *timer);</div><div class='add'>+static void fscache_cookie_lru_worker(struct work_struct *work);</div><div class='add'>+static void fscache_cookie_worker(struct work_struct *work);</div><div class='add'>+static void fscache_unhash_cookie(struct fscache_cookie *cookie);</div><div class='add'>+static void fscache_perform_invalidation(struct fscache_cookie *cookie);</div><div class='add'>+</div><div class='add'>+#define fscache_cookie_hash_shift 15</div><div class='add'>+static struct hlist_bl_head fscache_cookie_hash[1 &lt;&lt; fscache_cookie_hash_shift];</div><div class='add'>+static LIST_HEAD(fscache_cookies);</div><div class='add'>+static DEFINE_RWLOCK(fscache_cookies_lock);</div><div class='add'>+static LIST_HEAD(fscache_cookie_lru);</div><div class='add'>+static DEFINE_SPINLOCK(fscache_cookie_lru_lock);</div><div class='add'>+DEFINE_TIMER(fscache_cookie_lru_timer, fscache_cookie_lru_timed_out);</div><div class='add'>+static DECLARE_WORK(fscache_cookie_lru_work, fscache_cookie_lru_worker);</div><div class='add'>+static const char fscache_cookie_states[FSCACHE_COOKIE_STATE__NR] __nonstring = "-LCAIFUWRD";</div><div class='add'>+static unsigned int fscache_lru_cookie_timeout = 10 * HZ;</div><div class='add'>+</div><div class='add'>+void fscache_print_cookie(struct fscache_cookie *cookie, char prefix)</div><div class='add'>+{</div><div class='add'>+	const u8 *k;</div><div class='add'>+</div><div class='add'>+	pr_err("%c-cookie c=%08x [fl=%lx na=%u nA=%u s=%c]\n",</div><div class='add'>+	       prefix,</div><div class='add'>+	       cookie-&gt;debug_id,</div><div class='add'>+	       cookie-&gt;flags,</div><div class='add'>+	       atomic_read(&amp;cookie-&gt;n_active),</div><div class='add'>+	       atomic_read(&amp;cookie-&gt;n_accesses),</div><div class='add'>+	       fscache_cookie_states[cookie-&gt;state]);</div><div class='add'>+	pr_err("%c-cookie V=%08x [%s]\n",</div><div class='add'>+	       prefix,</div><div class='add'>+	       cookie-&gt;volume-&gt;debug_id,</div><div class='add'>+	       cookie-&gt;volume-&gt;key);</div><div class='add'>+</div><div class='add'>+	k = (cookie-&gt;key_len &lt;= sizeof(cookie-&gt;inline_key)) ?</div><div class='add'>+		cookie-&gt;inline_key : cookie-&gt;key;</div><div class='add'>+	pr_err("%c-key=[%u] '%*phN'\n", prefix, cookie-&gt;key_len, cookie-&gt;key_len, k);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fscache_free_cookie(struct fscache_cookie *cookie)</div><div class='add'>+{</div><div class='add'>+	if (WARN_ON_ONCE(!list_empty(&amp;cookie-&gt;commit_link))) {</div><div class='add'>+		spin_lock(&amp;fscache_cookie_lru_lock);</div><div class='add'>+		list_del_init(&amp;cookie-&gt;commit_link);</div><div class='add'>+		spin_unlock(&amp;fscache_cookie_lru_lock);</div><div class='add'>+		fscache_stat_d(&amp;fscache_n_cookies_lru);</div><div class='add'>+		fscache_stat(&amp;fscache_n_cookies_lru_removed);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (WARN_ON_ONCE(test_bit(FSCACHE_COOKIE_IS_HASHED, &amp;cookie-&gt;flags))) {</div><div class='add'>+		fscache_print_cookie(cookie, 'F');</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	write_lock(&amp;fscache_cookies_lock);</div><div class='add'>+	list_del(&amp;cookie-&gt;proc_link);</div><div class='add'>+	write_unlock(&amp;fscache_cookies_lock);</div><div class='add'>+	if (cookie-&gt;aux_len &gt; sizeof(cookie-&gt;inline_aux))</div><div class='add'>+		kfree(cookie-&gt;aux);</div><div class='add'>+	if (cookie-&gt;key_len &gt; sizeof(cookie-&gt;inline_key))</div><div class='add'>+		kfree(cookie-&gt;key);</div><div class='add'>+	fscache_stat_d(&amp;fscache_n_cookies);</div><div class='add'>+	kmem_cache_free(fscache_cookie_jar, cookie);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void __fscache_queue_cookie(struct fscache_cookie *cookie)</div><div class='add'>+{</div><div class='add'>+	if (!queue_work(fscache_wq, &amp;cookie-&gt;work))</div><div class='add'>+		fscache_put_cookie(cookie, fscache_cookie_put_over_queued);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fscache_queue_cookie(struct fscache_cookie *cookie,</div><div class='add'>+				 enum fscache_cookie_trace where)</div><div class='add'>+{</div><div class='add'>+	fscache_get_cookie(cookie, where);</div><div class='add'>+	__fscache_queue_cookie(cookie);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Initialise the access gate on a cookie by setting a flag to prevent the</div><div class='add'>+ * state machine from being queued when the access counter transitions to 0.</div><div class='add'>+ * We're only interested in this when we withdraw caching services from the</div><div class='add'>+ * cookie.</div><div class='add'>+ */</div><div class='add'>+static void fscache_init_access_gate(struct fscache_cookie *cookie)</div><div class='add'>+{</div><div class='add'>+	int n_accesses;</div><div class='add'>+</div><div class='add'>+	n_accesses = atomic_read(&amp;cookie-&gt;n_accesses);</div><div class='add'>+	trace_fscache_access(cookie-&gt;debug_id, refcount_read(&amp;cookie-&gt;ref),</div><div class='add'>+			     n_accesses, fscache_access_cache_pin);</div><div class='add'>+	set_bit(FSCACHE_COOKIE_NO_ACCESS_WAKE, &amp;cookie-&gt;flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fscache_end_cookie_access - Unpin a cache at the end of an access.</div><div class='add'>+ * @cookie: A data file cookie</div><div class='add'>+ * @why: An indication of the circumstances of the access for tracing</div><div class='add'>+ *</div><div class='add'>+ * Unpin a cache cookie after we've accessed it and bring a deferred</div><div class='add'>+ * relinquishment or withdrawal state into effect.</div><div class='add'>+ *</div><div class='add'>+ * The @why indicator is provided for tracing purposes.</div><div class='add'>+ */</div><div class='add'>+void fscache_end_cookie_access(struct fscache_cookie *cookie,</div><div class='add'>+			       enum fscache_access_trace why)</div><div class='add'>+{</div><div class='add'>+	int n_accesses;</div><div class='add'>+</div><div class='add'>+	smp_mb__before_atomic();</div><div class='add'>+	n_accesses = atomic_dec_return(&amp;cookie-&gt;n_accesses);</div><div class='add'>+	trace_fscache_access(cookie-&gt;debug_id, refcount_read(&amp;cookie-&gt;ref),</div><div class='add'>+			     n_accesses, why);</div><div class='add'>+	if (n_accesses == 0 &amp;&amp;</div><div class='add'>+	    !test_bit(FSCACHE_COOKIE_NO_ACCESS_WAKE, &amp;cookie-&gt;flags))</div><div class='add'>+		fscache_queue_cookie(cookie, fscache_cookie_get_end_access);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(fscache_end_cookie_access);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Pin the cache behind a cookie so that we can access it.</div><div class='add'>+ */</div><div class='add'>+static void __fscache_begin_cookie_access(struct fscache_cookie *cookie,</div><div class='add'>+					  enum fscache_access_trace why)</div><div class='add'>+{</div><div class='add'>+	int n_accesses;</div><div class='add'>+</div><div class='add'>+	n_accesses = atomic_inc_return(&amp;cookie-&gt;n_accesses);</div><div class='add'>+	smp_mb__after_atomic(); /* (Future) read state after is-caching.</div><div class='add'>+				 * Reread n_accesses after is-caching</div><div class='add'>+				 */</div><div class='add'>+	trace_fscache_access(cookie-&gt;debug_id, refcount_read(&amp;cookie-&gt;ref),</div><div class='add'>+			     n_accesses, why);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fscache_begin_cookie_access - Pin a cache so data can be accessed</div><div class='add'>+ * @cookie: A data file cookie</div><div class='add'>+ * @why: An indication of the circumstances of the access for tracing</div><div class='add'>+ *</div><div class='add'>+ * Attempt to pin the cache to prevent it from going away whilst we're</div><div class='add'>+ * accessing data and returns true if successful.  This works as follows:</div><div class='add'>+ *</div><div class='add'>+ *  (1) If the cookie is not being cached (ie. FSCACHE_COOKIE_IS_CACHING is not</div><div class='add'>+ *      set), we return false to indicate access was not permitted.</div><div class='add'>+ *</div><div class='add'>+ *  (2) If the cookie is being cached, we increment its n_accesses count and</div><div class='add'>+ *      then recheck the IS_CACHING flag, ending the access if it got cleared.</div><div class='add'>+ *</div><div class='add'>+ *  (3) When we end the access, we decrement the cookie's n_accesses and wake</div><div class='add'>+ *      up the any waiters if it reaches 0.</div><div class='add'>+ *</div><div class='add'>+ *  (4) Whilst the cookie is actively being cached, its n_accesses is kept</div><div class='add'>+ *      artificially incremented to prevent wakeups from happening.</div><div class='add'>+ *</div><div class='add'>+ *  (5) When the cache is taken offline or if the cookie is culled, the flag is</div><div class='add'>+ *      cleared to prevent new accesses, the cookie's n_accesses is decremented</div><div class='add'>+ *      and we wait for it to become 0.</div><div class='add'>+ *</div><div class='add'>+ * The @why indicator are merely provided for tracing purposes.</div><div class='add'>+ */</div><div class='add'>+bool fscache_begin_cookie_access(struct fscache_cookie *cookie,</div><div class='add'>+				 enum fscache_access_trace why)</div><div class='add'>+{</div><div class='add'>+	if (!test_bit(FSCACHE_COOKIE_IS_CACHING, &amp;cookie-&gt;flags))</div><div class='add'>+		return false;</div><div class='add'>+	__fscache_begin_cookie_access(cookie, why);</div><div class='add'>+	if (!test_bit(FSCACHE_COOKIE_IS_CACHING, &amp;cookie-&gt;flags) ||</div><div class='add'>+	    !fscache_cache_is_live(cookie-&gt;volume-&gt;cache)) {</div><div class='add'>+		fscache_end_cookie_access(cookie, fscache_access_unlive);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void wake_up_cookie_state(struct fscache_cookie *cookie)</div><div class='add'>+{</div><div class='add'>+	/* Use a barrier to ensure that waiters see the state variable</div><div class='add'>+	 * change, as spin_unlock doesn't guarantee a barrier.</div><div class='add'>+	 *</div><div class='add'>+	 * See comments over wake_up_bit() and waitqueue_active().</div><div class='add'>+	 */</div><div class='add'>+	smp_mb();</div><div class='add'>+	wake_up_var(&amp;cookie-&gt;state);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Change the state a cookie is at and wake up anyone waiting for that.  Impose</div><div class='add'>+ * an ordering between the stuff stored in the cookie and the state member.</div><div class='add'>+ * Paired with fscache_cookie_state().</div><div class='add'>+ */</div><div class='add'>+static void __fscache_set_cookie_state(struct fscache_cookie *cookie,</div><div class='add'>+				       enum fscache_cookie_state state)</div><div class='add'>+{</div><div class='add'>+	smp_store_release(&amp;cookie-&gt;state, state);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fscache_set_cookie_state(struct fscache_cookie *cookie,</div><div class='add'>+				     enum fscache_cookie_state state)</div><div class='add'>+{</div><div class='add'>+	spin_lock(&amp;cookie-&gt;lock);</div><div class='add'>+	__fscache_set_cookie_state(cookie, state);</div><div class='add'>+	spin_unlock(&amp;cookie-&gt;lock);</div><div class='add'>+	wake_up_cookie_state(cookie);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fscache_cookie_lookup_negative - Note negative lookup</div><div class='add'>+ * @cookie: The cookie that was being looked up</div><div class='add'>+ *</div><div class='add'>+ * Note that some part of the metadata path in the cache doesn't exist and so</div><div class='add'>+ * we can release any waiting readers in the certain knowledge that there's</div><div class='add'>+ * nothing for them to actually read.</div><div class='add'>+ *</div><div class='add'>+ * This function uses no locking and must only be called from the state machine.</div><div class='add'>+ */</div><div class='add'>+void fscache_cookie_lookup_negative(struct fscache_cookie *cookie)</div><div class='add'>+{</div><div class='add'>+	set_bit(FSCACHE_COOKIE_NO_DATA_TO_READ, &amp;cookie-&gt;flags);</div><div class='add'>+	fscache_set_cookie_state(cookie, FSCACHE_COOKIE_STATE_CREATING);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(fscache_cookie_lookup_negative);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fscache_resume_after_invalidation - Allow I/O to resume after invalidation</div><div class='add'>+ * @cookie: The cookie that was invalidated</div><div class='add'>+ *</div><div class='add'>+ * Tell fscache that invalidation is sufficiently complete that I/O can be</div><div class='add'>+ * allowed again.</div><div class='add'>+ */</div><div class='add'>+void fscache_resume_after_invalidation(struct fscache_cookie *cookie)</div><div class='add'>+{</div><div class='add'>+	fscache_set_cookie_state(cookie, FSCACHE_COOKIE_STATE_ACTIVE);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(fscache_resume_after_invalidation);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fscache_caching_failed - Report that a failure stopped caching on a cookie</div><div class='add'>+ * @cookie: The cookie that was affected</div><div class='add'>+ *</div><div class='add'>+ * Tell fscache that caching on a cookie needs to be stopped due to some sort</div><div class='add'>+ * of failure.</div><div class='add'>+ *</div><div class='add'>+ * This function uses no locking and must only be called from the state machine.</div><div class='add'>+ */</div><div class='add'>+void fscache_caching_failed(struct fscache_cookie *cookie)</div><div class='add'>+{</div><div class='add'>+	clear_bit(FSCACHE_COOKIE_IS_CACHING, &amp;cookie-&gt;flags);</div><div class='add'>+	fscache_set_cookie_state(cookie, FSCACHE_COOKIE_STATE_FAILED);</div><div class='add'>+	trace_fscache_cookie(cookie-&gt;debug_id, refcount_read(&amp;cookie-&gt;ref),</div><div class='add'>+				fscache_cookie_failed);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(fscache_caching_failed);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Set the index key in a cookie.  The cookie struct has space for a 16-byte</div><div class='add'>+ * key plus length and hash, but if that's not big enough, it's instead a</div><div class='add'>+ * pointer to a buffer containing 3 bytes of hash, 1 byte of length and then</div><div class='add'>+ * the key data.</div><div class='add'>+ */</div><div class='add'>+static int fscache_set_key(struct fscache_cookie *cookie,</div><div class='add'>+			   const void *index_key, size_t index_key_len)</div><div class='add'>+{</div><div class='add'>+	void *buf;</div><div class='add'>+	size_t buf_size;</div><div class='add'>+</div><div class='add'>+	buf_size = round_up(index_key_len, sizeof(__le32));</div><div class='add'>+</div><div class='add'>+	if (index_key_len &gt; sizeof(cookie-&gt;inline_key)) {</div><div class='add'>+		buf = kzalloc(buf_size, GFP_KERNEL);</div><div class='add'>+		if (!buf)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+		cookie-&gt;key = buf;</div><div class='add'>+	} else {</div><div class='add'>+		buf = cookie-&gt;inline_key;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	memcpy(buf, index_key, index_key_len);</div><div class='add'>+	cookie-&gt;key_hash = fscache_hash(cookie-&gt;volume-&gt;key_hash,</div><div class='add'>+					buf, buf_size);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool fscache_cookie_same(const struct fscache_cookie *a,</div><div class='add'>+				const struct fscache_cookie *b)</div><div class='add'>+{</div><div class='add'>+	const void *ka, *kb;</div><div class='add'>+</div><div class='add'>+	if (a-&gt;key_hash	!= b-&gt;key_hash ||</div><div class='add'>+	    a-&gt;volume	!= b-&gt;volume ||</div><div class='add'>+	    a-&gt;key_len	!= b-&gt;key_len)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	if (a-&gt;key_len &lt;= sizeof(a-&gt;inline_key)) {</div><div class='add'>+		ka = &amp;a-&gt;inline_key;</div><div class='add'>+		kb = &amp;b-&gt;inline_key;</div><div class='add'>+	} else {</div><div class='add'>+		ka = a-&gt;key;</div><div class='add'>+		kb = b-&gt;key;</div><div class='add'>+	}</div><div class='add'>+	return memcmp(ka, kb, a-&gt;key_len) == 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static atomic_t fscache_cookie_debug_id = ATOMIC_INIT(1);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Allocate a cookie.</div><div class='add'>+ */</div><div class='add'>+static struct fscache_cookie *fscache_alloc_cookie(</div><div class='add'>+	struct fscache_volume *volume,</div><div class='add'>+	u8 advice,</div><div class='add'>+	const void *index_key, size_t index_key_len,</div><div class='add'>+	const void *aux_data, size_t aux_data_len,</div><div class='add'>+	loff_t object_size)</div><div class='add'>+{</div><div class='add'>+	struct fscache_cookie *cookie;</div><div class='add'>+</div><div class='add'>+	/* allocate and initialise a cookie */</div><div class='add'>+	cookie = kmem_cache_zalloc(fscache_cookie_jar, GFP_KERNEL);</div><div class='add'>+	if (!cookie)</div><div class='add'>+		return NULL;</div><div class='add'>+	fscache_stat(&amp;fscache_n_cookies);</div><div class='add'>+</div><div class='add'>+	cookie-&gt;volume		= volume;</div><div class='add'>+	cookie-&gt;advice		= advice;</div><div class='add'>+	cookie-&gt;key_len		= index_key_len;</div><div class='add'>+	cookie-&gt;aux_len		= aux_data_len;</div><div class='add'>+	cookie-&gt;object_size	= object_size;</div><div class='add'>+	if (object_size == 0)</div><div class='add'>+		__set_bit(FSCACHE_COOKIE_NO_DATA_TO_READ, &amp;cookie-&gt;flags);</div><div class='add'>+</div><div class='add'>+	if (fscache_set_key(cookie, index_key, index_key_len) &lt; 0)</div><div class='add'>+		goto nomem;</div><div class='add'>+</div><div class='add'>+	if (cookie-&gt;aux_len &lt;= sizeof(cookie-&gt;inline_aux)) {</div><div class='add'>+		memcpy(cookie-&gt;inline_aux, aux_data, cookie-&gt;aux_len);</div><div class='add'>+	} else {</div><div class='add'>+		cookie-&gt;aux = kmemdup(aux_data, cookie-&gt;aux_len, GFP_KERNEL);</div><div class='add'>+		if (!cookie-&gt;aux)</div><div class='add'>+			goto nomem;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	refcount_set(&amp;cookie-&gt;ref, 1);</div><div class='add'>+	cookie-&gt;debug_id = atomic_inc_return(&amp;fscache_cookie_debug_id);</div><div class='add'>+	spin_lock_init(&amp;cookie-&gt;lock);</div><div class='add'>+	INIT_LIST_HEAD(&amp;cookie-&gt;commit_link);</div><div class='add'>+	INIT_WORK(&amp;cookie-&gt;work, fscache_cookie_worker);</div><div class='add'>+	__fscache_set_cookie_state(cookie, FSCACHE_COOKIE_STATE_QUIESCENT);</div><div class='add'>+</div><div class='add'>+	write_lock(&amp;fscache_cookies_lock);</div><div class='add'>+	list_add_tail(&amp;cookie-&gt;proc_link, &amp;fscache_cookies);</div><div class='add'>+	write_unlock(&amp;fscache_cookies_lock);</div><div class='add'>+	fscache_see_cookie(cookie, fscache_cookie_new_acquire);</div><div class='add'>+	return cookie;</div><div class='add'>+</div><div class='add'>+nomem:</div><div class='add'>+	fscache_free_cookie(cookie);</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool fscache_cookie_is_dropped(struct fscache_cookie *cookie)</div><div class='add'>+{</div><div class='add'>+	return READ_ONCE(cookie-&gt;state) == FSCACHE_COOKIE_STATE_DROPPED;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fscache_wait_on_collision(struct fscache_cookie *candidate,</div><div class='add'>+				      struct fscache_cookie *wait_for)</div><div class='add'>+{</div><div class='add'>+	enum fscache_cookie_state *statep = &amp;wait_for-&gt;state;</div><div class='add'>+</div><div class='add'>+	wait_var_event_timeout(statep, fscache_cookie_is_dropped(wait_for),</div><div class='add'>+			       20 * HZ);</div><div class='add'>+	if (!fscache_cookie_is_dropped(wait_for)) {</div><div class='add'>+		pr_notice("Potential collision c=%08x old: c=%08x",</div><div class='add'>+			  candidate-&gt;debug_id, wait_for-&gt;debug_id);</div><div class='add'>+		wait_var_event(statep, fscache_cookie_is_dropped(wait_for));</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Attempt to insert the new cookie into the hash.  If there's a collision, we</div><div class='add'>+ * wait for the old cookie to complete if it's being relinquished and an error</div><div class='add'>+ * otherwise.</div><div class='add'>+ */</div><div class='add'>+static bool fscache_hash_cookie(struct fscache_cookie *candidate)</div><div class='add'>+{</div><div class='add'>+	struct fscache_cookie *cursor, *wait_for = NULL;</div><div class='add'>+	struct hlist_bl_head *h;</div><div class='add'>+	struct hlist_bl_node *p;</div><div class='add'>+	unsigned int bucket;</div><div class='add'>+</div><div class='add'>+	bucket = candidate-&gt;key_hash &amp; (ARRAY_SIZE(fscache_cookie_hash) - 1);</div><div class='add'>+	h = &amp;fscache_cookie_hash[bucket];</div><div class='add'>+</div><div class='add'>+	hlist_bl_lock(h);</div><div class='add'>+	hlist_bl_for_each_entry(cursor, p, h, hash_link) {</div><div class='add'>+		if (fscache_cookie_same(candidate, cursor)) {</div><div class='add'>+			if (!test_bit(FSCACHE_COOKIE_RELINQUISHED, &amp;cursor-&gt;flags))</div><div class='add'>+				goto collision;</div><div class='add'>+			wait_for = fscache_get_cookie(cursor,</div><div class='add'>+						      fscache_cookie_get_hash_collision);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	fscache_get_volume(candidate-&gt;volume, fscache_volume_get_cookie);</div><div class='add'>+	atomic_inc(&amp;candidate-&gt;volume-&gt;n_cookies);</div><div class='add'>+	hlist_bl_add_head(&amp;candidate-&gt;hash_link, h);</div><div class='add'>+	set_bit(FSCACHE_COOKIE_IS_HASHED, &amp;candidate-&gt;flags);</div><div class='add'>+	hlist_bl_unlock(h);</div><div class='add'>+</div><div class='add'>+	if (wait_for) {</div><div class='add'>+		fscache_wait_on_collision(candidate, wait_for);</div><div class='add'>+		fscache_put_cookie(wait_for, fscache_cookie_put_hash_collision);</div><div class='add'>+	}</div><div class='add'>+	return true;</div><div class='add'>+</div><div class='add'>+collision:</div><div class='add'>+	trace_fscache_cookie(cursor-&gt;debug_id, refcount_read(&amp;cursor-&gt;ref),</div><div class='add'>+			     fscache_cookie_collision);</div><div class='add'>+	pr_err("Duplicate cookie detected\n");</div><div class='add'>+	fscache_print_cookie(cursor, 'O');</div><div class='add'>+	fscache_print_cookie(candidate, 'N');</div><div class='add'>+	hlist_bl_unlock(h);</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Request a cookie to represent a data storage object within a volume.</div><div class='add'>+ *</div><div class='add'>+ * We never let on to the netfs about errors.  We may set a negative cookie</div><div class='add'>+ * pointer, but that's okay</div><div class='add'>+ */</div><div class='add'>+struct fscache_cookie *__fscache_acquire_cookie(</div><div class='add'>+	struct fscache_volume *volume,</div><div class='add'>+	u8 advice,</div><div class='add'>+	const void *index_key, size_t index_key_len,</div><div class='add'>+	const void *aux_data, size_t aux_data_len,</div><div class='add'>+	loff_t object_size)</div><div class='add'>+{</div><div class='add'>+	struct fscache_cookie *cookie;</div><div class='add'>+</div><div class='add'>+	_enter("V=%x", volume-&gt;debug_id);</div><div class='add'>+</div><div class='add'>+	if (!index_key || !index_key_len || index_key_len &gt; 255 || aux_data_len &gt; 255)</div><div class='add'>+		return NULL;</div><div class='add'>+	if (!aux_data || !aux_data_len) {</div><div class='add'>+		aux_data = NULL;</div><div class='add'>+		aux_data_len = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	fscache_stat(&amp;fscache_n_acquires);</div><div class='add'>+</div><div class='add'>+	cookie = fscache_alloc_cookie(volume, advice,</div><div class='add'>+				      index_key, index_key_len,</div><div class='add'>+				      aux_data, aux_data_len,</div><div class='add'>+				      object_size);</div><div class='add'>+	if (!cookie) {</div><div class='add'>+		fscache_stat(&amp;fscache_n_acquires_oom);</div><div class='add'>+		return NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!fscache_hash_cookie(cookie)) {</div><div class='add'>+		fscache_see_cookie(cookie, fscache_cookie_discard);</div><div class='add'>+		fscache_free_cookie(cookie);</div><div class='add'>+		return NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	trace_fscache_acquire(cookie);</div><div class='add'>+	fscache_stat(&amp;fscache_n_acquires_ok);</div><div class='add'>+	_leave(" = c=%08x", cookie-&gt;debug_id);</div><div class='add'>+	return cookie;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(__fscache_acquire_cookie);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Prepare a cache object to be written to.</div><div class='add'>+ */</div><div class='add'>+static void fscache_prepare_to_write(struct fscache_cookie *cookie)</div><div class='add'>+{</div><div class='add'>+	cookie-&gt;volume-&gt;cache-&gt;ops-&gt;prepare_to_write(cookie);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Look up a cookie in the cache.</div><div class='add'>+ */</div><div class='add'>+static void fscache_perform_lookup(struct fscache_cookie *cookie)</div><div class='add'>+{</div><div class='add'>+	enum fscache_access_trace trace = fscache_access_lookup_cookie_end_failed;</div><div class='add'>+	bool need_withdraw = false;</div><div class='add'>+</div><div class='add'>+	_enter("");</div><div class='add'>+</div><div class='add'>+	if (!cookie-&gt;volume-&gt;cache_priv) {</div><div class='add'>+		fscache_create_volume(cookie-&gt;volume, true);</div><div class='add'>+		if (!cookie-&gt;volume-&gt;cache_priv) {</div><div class='add'>+			fscache_set_cookie_state(cookie, FSCACHE_COOKIE_STATE_QUIESCENT);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!cookie-&gt;volume-&gt;cache-&gt;ops-&gt;lookup_cookie(cookie)) {</div><div class='add'>+		if (cookie-&gt;state != FSCACHE_COOKIE_STATE_FAILED)</div><div class='add'>+			fscache_set_cookie_state(cookie, FSCACHE_COOKIE_STATE_QUIESCENT);</div><div class='add'>+		need_withdraw = true;</div><div class='add'>+		_leave(" [fail]");</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	fscache_see_cookie(cookie, fscache_cookie_see_active);</div><div class='add'>+	spin_lock(&amp;cookie-&gt;lock);</div><div class='add'>+	if (test_and_clear_bit(FSCACHE_COOKIE_DO_INVALIDATE, &amp;cookie-&gt;flags))</div><div class='add'>+		__fscache_set_cookie_state(cookie,</div><div class='add'>+					   FSCACHE_COOKIE_STATE_INVALIDATING);</div><div class='add'>+	else</div><div class='add'>+		__fscache_set_cookie_state(cookie, FSCACHE_COOKIE_STATE_ACTIVE);</div><div class='add'>+	spin_unlock(&amp;cookie-&gt;lock);</div><div class='add'>+	wake_up_cookie_state(cookie);</div><div class='add'>+	trace = fscache_access_lookup_cookie_end;</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	fscache_end_cookie_access(cookie, trace);</div><div class='add'>+	if (need_withdraw)</div><div class='add'>+		fscache_withdraw_cookie(cookie);</div><div class='add'>+	fscache_end_volume_access(cookie-&gt;volume, cookie, trace);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Begin the process of looking up a cookie.  We offload the actual process to</div><div class='add'>+ * a worker thread.</div><div class='add'>+ */</div><div class='add'>+static bool fscache_begin_lookup(struct fscache_cookie *cookie, bool will_modify)</div><div class='add'>+{</div><div class='add'>+	if (will_modify) {</div><div class='add'>+		set_bit(FSCACHE_COOKIE_LOCAL_WRITE, &amp;cookie-&gt;flags);</div><div class='add'>+		set_bit(FSCACHE_COOKIE_DO_PREP_TO_WRITE, &amp;cookie-&gt;flags);</div><div class='add'>+	}</div><div class='add'>+	if (!fscache_begin_volume_access(cookie-&gt;volume, cookie,</div><div class='add'>+					 fscache_access_lookup_cookie))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	__fscache_begin_cookie_access(cookie, fscache_access_lookup_cookie);</div><div class='add'>+	__fscache_set_cookie_state(cookie, FSCACHE_COOKIE_STATE_LOOKING_UP);</div><div class='add'>+	set_bit(FSCACHE_COOKIE_IS_CACHING, &amp;cookie-&gt;flags);</div><div class='add'>+	set_bit(FSCACHE_COOKIE_HAS_BEEN_CACHED, &amp;cookie-&gt;flags);</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Start using the cookie for I/O.  This prevents the backing object from being</div><div class='add'>+ * reaped by VM pressure.</div><div class='add'>+ */</div><div class='add'>+void __fscache_use_cookie(struct fscache_cookie *cookie, bool will_modify)</div><div class='add'>+{</div><div class='add'>+	enum fscache_cookie_state state;</div><div class='add'>+	bool queue = false;</div><div class='add'>+	int n_active;</div><div class='add'>+</div><div class='add'>+	_enter("c=%08x", cookie-&gt;debug_id);</div><div class='add'>+</div><div class='add'>+	if (WARN(test_bit(FSCACHE_COOKIE_RELINQUISHED, &amp;cookie-&gt;flags),</div><div class='add'>+		 "Trying to use relinquished cookie\n"))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;cookie-&gt;lock);</div><div class='add'>+</div><div class='add'>+	n_active = atomic_inc_return(&amp;cookie-&gt;n_active);</div><div class='add'>+	trace_fscache_active(cookie-&gt;debug_id, refcount_read(&amp;cookie-&gt;ref),</div><div class='add'>+			     n_active, atomic_read(&amp;cookie-&gt;n_accesses),</div><div class='add'>+			     will_modify ?</div><div class='add'>+			     fscache_active_use_modify : fscache_active_use);</div><div class='add'>+</div><div class='add'>+again:</div><div class='add'>+	state = fscache_cookie_state(cookie);</div><div class='add'>+	switch (state) {</div><div class='add'>+	case FSCACHE_COOKIE_STATE_QUIESCENT:</div><div class='add'>+		queue = fscache_begin_lookup(cookie, will_modify);</div><div class='add'>+		break;</div><div class='add'>+</div><div class='add'>+	case FSCACHE_COOKIE_STATE_LOOKING_UP:</div><div class='add'>+	case FSCACHE_COOKIE_STATE_CREATING:</div><div class='add'>+		if (will_modify)</div><div class='add'>+			set_bit(FSCACHE_COOKIE_LOCAL_WRITE, &amp;cookie-&gt;flags);</div><div class='add'>+		break;</div><div class='add'>+	case FSCACHE_COOKIE_STATE_ACTIVE:</div><div class='add'>+	case FSCACHE_COOKIE_STATE_INVALIDATING:</div><div class='add'>+		if (will_modify &amp;&amp;</div><div class='add'>+		    !test_and_set_bit(FSCACHE_COOKIE_LOCAL_WRITE, &amp;cookie-&gt;flags)) {</div><div class='add'>+			set_bit(FSCACHE_COOKIE_DO_PREP_TO_WRITE, &amp;cookie-&gt;flags);</div><div class='add'>+			queue = true;</div><div class='add'>+		}</div><div class='add'>+		/*</div><div class='add'>+		 * We could race with cookie_lru which may set LRU_DISCARD bit</div><div class='add'>+		 * but has yet to run the cookie state machine.  If this happens</div><div class='add'>+		 * and another thread tries to use the cookie, clear LRU_DISCARD</div><div class='add'>+		 * so we don't end up withdrawing the cookie while in use.</div><div class='add'>+		 */</div><div class='add'>+		if (test_and_clear_bit(FSCACHE_COOKIE_DO_LRU_DISCARD, &amp;cookie-&gt;flags))</div><div class='add'>+			fscache_see_cookie(cookie, fscache_cookie_see_lru_discard_clear);</div><div class='add'>+		break;</div><div class='add'>+</div><div class='add'>+	case FSCACHE_COOKIE_STATE_FAILED:</div><div class='add'>+	case FSCACHE_COOKIE_STATE_WITHDRAWING:</div><div class='add'>+		break;</div><div class='add'>+</div><div class='add'>+	case FSCACHE_COOKIE_STATE_LRU_DISCARDING:</div><div class='add'>+		spin_unlock(&amp;cookie-&gt;lock);</div><div class='add'>+		wait_var_event(&amp;cookie-&gt;state,</div><div class='add'>+			       fscache_cookie_state(cookie) !=</div><div class='add'>+			       FSCACHE_COOKIE_STATE_LRU_DISCARDING);</div><div class='add'>+		spin_lock(&amp;cookie-&gt;lock);</div><div class='add'>+		goto again;</div><div class='add'>+</div><div class='add'>+	case FSCACHE_COOKIE_STATE_DROPPED:</div><div class='add'>+	case FSCACHE_COOKIE_STATE_RELINQUISHING:</div><div class='add'>+		WARN(1, "Can't use cookie in state %u\n", state);</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_unlock(&amp;cookie-&gt;lock);</div><div class='add'>+	if (queue)</div><div class='add'>+		fscache_queue_cookie(cookie, fscache_cookie_get_use_work);</div><div class='add'>+	_leave("");</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(__fscache_use_cookie);</div><div class='add'>+</div><div class='add'>+static void fscache_unuse_cookie_locked(struct fscache_cookie *cookie)</div><div class='add'>+{</div><div class='add'>+	clear_bit(FSCACHE_COOKIE_DISABLED, &amp;cookie-&gt;flags);</div><div class='add'>+	if (!test_bit(FSCACHE_COOKIE_IS_CACHING, &amp;cookie-&gt;flags))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	cookie-&gt;unused_at = jiffies;</div><div class='add'>+	spin_lock(&amp;fscache_cookie_lru_lock);</div><div class='add'>+	if (list_empty(&amp;cookie-&gt;commit_link)) {</div><div class='add'>+		fscache_get_cookie(cookie, fscache_cookie_get_lru);</div><div class='add'>+		fscache_stat(&amp;fscache_n_cookies_lru);</div><div class='add'>+	}</div><div class='add'>+	list_move_tail(&amp;cookie-&gt;commit_link, &amp;fscache_cookie_lru);</div><div class='add'>+</div><div class='add'>+	spin_unlock(&amp;fscache_cookie_lru_lock);</div><div class='add'>+	timer_reduce(&amp;fscache_cookie_lru_timer,</div><div class='add'>+		     jiffies + fscache_lru_cookie_timeout);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Stop using the cookie for I/O.</div><div class='add'>+ */</div><div class='add'>+void __fscache_unuse_cookie(struct fscache_cookie *cookie,</div><div class='add'>+			    const void *aux_data, const loff_t *object_size)</div><div class='add'>+{</div><div class='add'>+	unsigned int debug_id = cookie-&gt;debug_id;</div><div class='add'>+	unsigned int r = refcount_read(&amp;cookie-&gt;ref);</div><div class='add'>+	unsigned int a = atomic_read(&amp;cookie-&gt;n_accesses);</div><div class='add'>+	unsigned int c;</div><div class='add'>+</div><div class='add'>+	if (aux_data || object_size)</div><div class='add'>+		__fscache_update_cookie(cookie, aux_data, object_size);</div><div class='add'>+</div><div class='add'>+	/* Subtract 1 from counter unless that drops it to 0 (ie. it was 1) */</div><div class='add'>+	c = atomic_fetch_add_unless(&amp;cookie-&gt;n_active, -1, 1);</div><div class='add'>+	if (c != 1) {</div><div class='add'>+		trace_fscache_active(debug_id, r, c - 1, a, fscache_active_unuse);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;cookie-&gt;lock);</div><div class='add'>+	r = refcount_read(&amp;cookie-&gt;ref);</div><div class='add'>+	a = atomic_read(&amp;cookie-&gt;n_accesses);</div><div class='add'>+	c = atomic_dec_return(&amp;cookie-&gt;n_active);</div><div class='add'>+	trace_fscache_active(debug_id, r, c, a, fscache_active_unuse);</div><div class='add'>+	if (c == 0)</div><div class='add'>+		fscache_unuse_cookie_locked(cookie);</div><div class='add'>+	spin_unlock(&amp;cookie-&gt;lock);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(__fscache_unuse_cookie);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Perform work upon the cookie, such as committing its cache state,</div><div class='add'>+ * relinquishing it or withdrawing the backing cache.  We're protected from the</div><div class='add'>+ * cache going away under us as object withdrawal must come through this</div><div class='add'>+ * non-reentrant work item.</div><div class='add'>+ */</div><div class='add'>+static void fscache_cookie_state_machine(struct fscache_cookie *cookie)</div><div class='add'>+{</div><div class='add'>+	enum fscache_cookie_state state;</div><div class='add'>+	bool wake = false;</div><div class='add'>+</div><div class='add'>+	_enter("c=%x", cookie-&gt;debug_id);</div><div class='add'>+</div><div class='add'>+again:</div><div class='add'>+	spin_lock(&amp;cookie-&gt;lock);</div><div class='add'>+again_locked:</div><div class='add'>+	state = cookie-&gt;state;</div><div class='add'>+	switch (state) {</div><div class='add'>+	case FSCACHE_COOKIE_STATE_QUIESCENT:</div><div class='add'>+		/* The QUIESCENT state is jumped to the LOOKING_UP state by</div><div class='add'>+		 * fscache_use_cookie().</div><div class='add'>+		 */</div><div class='add'>+</div><div class='add'>+		if (atomic_read(&amp;cookie-&gt;n_accesses) == 0 &amp;&amp;</div><div class='add'>+		    test_bit(FSCACHE_COOKIE_DO_RELINQUISH, &amp;cookie-&gt;flags)) {</div><div class='add'>+			__fscache_set_cookie_state(cookie,</div><div class='add'>+						   FSCACHE_COOKIE_STATE_RELINQUISHING);</div><div class='add'>+			wake = true;</div><div class='add'>+			goto again_locked;</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='add'>+</div><div class='add'>+	case FSCACHE_COOKIE_STATE_LOOKING_UP:</div><div class='add'>+		spin_unlock(&amp;cookie-&gt;lock);</div><div class='add'>+		fscache_init_access_gate(cookie);</div><div class='add'>+		fscache_perform_lookup(cookie);</div><div class='add'>+		goto again;</div><div class='add'>+</div><div class='add'>+	case FSCACHE_COOKIE_STATE_INVALIDATING:</div><div class='add'>+		spin_unlock(&amp;cookie-&gt;lock);</div><div class='add'>+		fscache_perform_invalidation(cookie);</div><div class='add'>+		goto again;</div><div class='add'>+</div><div class='add'>+	case FSCACHE_COOKIE_STATE_ACTIVE:</div><div class='add'>+		if (test_and_clear_bit(FSCACHE_COOKIE_DO_PREP_TO_WRITE, &amp;cookie-&gt;flags)) {</div><div class='add'>+			spin_unlock(&amp;cookie-&gt;lock);</div><div class='add'>+			fscache_prepare_to_write(cookie);</div><div class='add'>+			spin_lock(&amp;cookie-&gt;lock);</div><div class='add'>+		}</div><div class='add'>+		if (test_bit(FSCACHE_COOKIE_DO_LRU_DISCARD, &amp;cookie-&gt;flags)) {</div><div class='add'>+			if (atomic_read(&amp;cookie-&gt;n_accesses) != 0)</div><div class='add'>+				/* still being accessed: postpone it */</div><div class='add'>+				break;</div><div class='add'>+</div><div class='add'>+			__fscache_set_cookie_state(cookie,</div><div class='add'>+						   FSCACHE_COOKIE_STATE_LRU_DISCARDING);</div><div class='add'>+			wake = true;</div><div class='add'>+			goto again_locked;</div><div class='add'>+		}</div><div class='add'>+		fallthrough;</div><div class='add'>+</div><div class='add'>+	case FSCACHE_COOKIE_STATE_FAILED:</div><div class='add'>+		if (test_and_clear_bit(FSCACHE_COOKIE_DO_INVALIDATE, &amp;cookie-&gt;flags))</div><div class='add'>+			fscache_end_cookie_access(cookie, fscache_access_invalidate_cookie_end);</div><div class='add'>+</div><div class='add'>+		if (atomic_read(&amp;cookie-&gt;n_accesses) != 0)</div><div class='add'>+			break;</div><div class='add'>+		if (test_bit(FSCACHE_COOKIE_DO_RELINQUISH, &amp;cookie-&gt;flags)) {</div><div class='add'>+			__fscache_set_cookie_state(cookie,</div><div class='add'>+						   FSCACHE_COOKIE_STATE_RELINQUISHING);</div><div class='add'>+			wake = true;</div><div class='add'>+			goto again_locked;</div><div class='add'>+		}</div><div class='add'>+		if (test_bit(FSCACHE_COOKIE_DO_WITHDRAW, &amp;cookie-&gt;flags)) {</div><div class='add'>+			__fscache_set_cookie_state(cookie,</div><div class='add'>+						   FSCACHE_COOKIE_STATE_WITHDRAWING);</div><div class='add'>+			wake = true;</div><div class='add'>+			goto again_locked;</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='add'>+</div><div class='add'>+	case FSCACHE_COOKIE_STATE_LRU_DISCARDING:</div><div class='add'>+	case FSCACHE_COOKIE_STATE_RELINQUISHING:</div><div class='add'>+	case FSCACHE_COOKIE_STATE_WITHDRAWING:</div><div class='add'>+		if (cookie-&gt;cache_priv) {</div><div class='add'>+			spin_unlock(&amp;cookie-&gt;lock);</div><div class='add'>+			cookie-&gt;volume-&gt;cache-&gt;ops-&gt;withdraw_cookie(cookie);</div><div class='add'>+			spin_lock(&amp;cookie-&gt;lock);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (test_and_clear_bit(FSCACHE_COOKIE_DO_INVALIDATE, &amp;cookie-&gt;flags))</div><div class='add'>+			fscache_end_cookie_access(cookie, fscache_access_invalidate_cookie_end);</div><div class='add'>+</div><div class='add'>+		switch (state) {</div><div class='add'>+		case FSCACHE_COOKIE_STATE_RELINQUISHING:</div><div class='add'>+			fscache_see_cookie(cookie, fscache_cookie_see_relinquish);</div><div class='add'>+			fscache_unhash_cookie(cookie);</div><div class='add'>+			__fscache_set_cookie_state(cookie,</div><div class='add'>+						   FSCACHE_COOKIE_STATE_DROPPED);</div><div class='add'>+			wake = true;</div><div class='add'>+			goto out;</div><div class='add'>+		case FSCACHE_COOKIE_STATE_LRU_DISCARDING:</div><div class='add'>+			fscache_see_cookie(cookie, fscache_cookie_see_lru_discard);</div><div class='add'>+			break;</div><div class='add'>+		case FSCACHE_COOKIE_STATE_WITHDRAWING:</div><div class='add'>+			fscache_see_cookie(cookie, fscache_cookie_see_withdraw);</div><div class='add'>+			break;</div><div class='add'>+		default:</div><div class='add'>+			BUG();</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		clear_bit(FSCACHE_COOKIE_NEEDS_UPDATE, &amp;cookie-&gt;flags);</div><div class='add'>+		clear_bit(FSCACHE_COOKIE_DO_WITHDRAW, &amp;cookie-&gt;flags);</div><div class='add'>+		clear_bit(FSCACHE_COOKIE_DO_LRU_DISCARD, &amp;cookie-&gt;flags);</div><div class='add'>+		clear_bit(FSCACHE_COOKIE_DO_PREP_TO_WRITE, &amp;cookie-&gt;flags);</div><div class='add'>+		set_bit(FSCACHE_COOKIE_NO_DATA_TO_READ, &amp;cookie-&gt;flags);</div><div class='add'>+		__fscache_set_cookie_state(cookie, FSCACHE_COOKIE_STATE_QUIESCENT);</div><div class='add'>+		wake = true;</div><div class='add'>+		goto again_locked;</div><div class='add'>+</div><div class='add'>+	case FSCACHE_COOKIE_STATE_DROPPED:</div><div class='add'>+		break;</div><div class='add'>+</div><div class='add'>+	default:</div><div class='add'>+		WARN_ONCE(1, "Cookie %x in unexpected state %u\n",</div><div class='add'>+			  cookie-&gt;debug_id, state);</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	spin_unlock(&amp;cookie-&gt;lock);</div><div class='add'>+	if (wake)</div><div class='add'>+		wake_up_cookie_state(cookie);</div><div class='add'>+	_leave("");</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fscache_cookie_worker(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct fscache_cookie *cookie = container_of(work, struct fscache_cookie, work);</div><div class='add'>+</div><div class='add'>+	fscache_see_cookie(cookie, fscache_cookie_see_work);</div><div class='add'>+	fscache_cookie_state_machine(cookie);</div><div class='add'>+	fscache_put_cookie(cookie, fscache_cookie_put_work);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Wait for the object to become inactive.  The cookie's work item will be</div><div class='add'>+ * scheduled when someone transitions n_accesses to 0 - but if someone's</div><div class='add'>+ * already done that, schedule it anyway.</div><div class='add'>+ */</div><div class='add'>+static void __fscache_withdraw_cookie(struct fscache_cookie *cookie)</div><div class='add'>+{</div><div class='add'>+	int n_accesses;</div><div class='add'>+	bool unpinned;</div><div class='add'>+</div><div class='add'>+	unpinned = test_and_clear_bit(FSCACHE_COOKIE_NO_ACCESS_WAKE, &amp;cookie-&gt;flags);</div><div class='add'>+</div><div class='add'>+	/* Need to read the access count after unpinning */</div><div class='add'>+	n_accesses = atomic_read(&amp;cookie-&gt;n_accesses);</div><div class='add'>+	if (unpinned)</div><div class='add'>+		trace_fscache_access(cookie-&gt;debug_id, refcount_read(&amp;cookie-&gt;ref),</div><div class='add'>+				     n_accesses, fscache_access_cache_unpin);</div><div class='add'>+	if (n_accesses == 0)</div><div class='add'>+		fscache_queue_cookie(cookie, fscache_cookie_get_end_access);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fscache_cookie_lru_do_one(struct fscache_cookie *cookie)</div><div class='add'>+{</div><div class='add'>+	fscache_see_cookie(cookie, fscache_cookie_see_lru_do_one);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;cookie-&gt;lock);</div><div class='add'>+	if (cookie-&gt;state != FSCACHE_COOKIE_STATE_ACTIVE ||</div><div class='add'>+	    time_before(jiffies, cookie-&gt;unused_at + fscache_lru_cookie_timeout) ||</div><div class='add'>+	    atomic_read(&amp;cookie-&gt;n_active) &gt; 0) {</div><div class='add'>+		spin_unlock(&amp;cookie-&gt;lock);</div><div class='add'>+		fscache_stat(&amp;fscache_n_cookies_lru_removed);</div><div class='add'>+	} else {</div><div class='add'>+		set_bit(FSCACHE_COOKIE_DO_LRU_DISCARD, &amp;cookie-&gt;flags);</div><div class='add'>+		spin_unlock(&amp;cookie-&gt;lock);</div><div class='add'>+		fscache_stat(&amp;fscache_n_cookies_lru_expired);</div><div class='add'>+		_debug("lru c=%x", cookie-&gt;debug_id);</div><div class='add'>+		__fscache_withdraw_cookie(cookie);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	fscache_put_cookie(cookie, fscache_cookie_put_lru);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fscache_cookie_lru_worker(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct fscache_cookie *cookie;</div><div class='add'>+	unsigned long unused_at;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;fscache_cookie_lru_lock);</div><div class='add'>+</div><div class='add'>+	while (!list_empty(&amp;fscache_cookie_lru)) {</div><div class='add'>+		cookie = list_first_entry(&amp;fscache_cookie_lru,</div><div class='add'>+					  struct fscache_cookie, commit_link);</div><div class='add'>+		unused_at = cookie-&gt;unused_at + fscache_lru_cookie_timeout;</div><div class='add'>+		if (time_before(jiffies, unused_at)) {</div><div class='add'>+			timer_reduce(&amp;fscache_cookie_lru_timer, unused_at);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		list_del_init(&amp;cookie-&gt;commit_link);</div><div class='add'>+		fscache_stat_d(&amp;fscache_n_cookies_lru);</div><div class='add'>+		spin_unlock(&amp;fscache_cookie_lru_lock);</div><div class='add'>+		fscache_cookie_lru_do_one(cookie);</div><div class='add'>+		spin_lock(&amp;fscache_cookie_lru_lock);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_unlock(&amp;fscache_cookie_lru_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fscache_cookie_lru_timed_out(struct timer_list *timer)</div><div class='add'>+{</div><div class='add'>+	queue_work(fscache_wq, &amp;fscache_cookie_lru_work);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fscache_cookie_drop_from_lru(struct fscache_cookie *cookie)</div><div class='add'>+{</div><div class='add'>+	bool need_put = false;</div><div class='add'>+</div><div class='add'>+	if (!list_empty(&amp;cookie-&gt;commit_link)) {</div><div class='add'>+		spin_lock(&amp;fscache_cookie_lru_lock);</div><div class='add'>+		if (!list_empty(&amp;cookie-&gt;commit_link)) {</div><div class='add'>+			list_del_init(&amp;cookie-&gt;commit_link);</div><div class='add'>+			fscache_stat_d(&amp;fscache_n_cookies_lru);</div><div class='add'>+			fscache_stat(&amp;fscache_n_cookies_lru_dropped);</div><div class='add'>+			need_put = true;</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;fscache_cookie_lru_lock);</div><div class='add'>+		if (need_put)</div><div class='add'>+			fscache_put_cookie(cookie, fscache_cookie_put_lru);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Remove a cookie from the hash table.</div><div class='add'>+ */</div><div class='add'>+static void fscache_unhash_cookie(struct fscache_cookie *cookie)</div><div class='add'>+{</div><div class='add'>+	struct hlist_bl_head *h;</div><div class='add'>+	unsigned int bucket;</div><div class='add'>+</div><div class='add'>+	bucket = cookie-&gt;key_hash &amp; (ARRAY_SIZE(fscache_cookie_hash) - 1);</div><div class='add'>+	h = &amp;fscache_cookie_hash[bucket];</div><div class='add'>+</div><div class='add'>+	hlist_bl_lock(h);</div><div class='add'>+	hlist_bl_del(&amp;cookie-&gt;hash_link);</div><div class='add'>+	clear_bit(FSCACHE_COOKIE_IS_HASHED, &amp;cookie-&gt;flags);</div><div class='add'>+	hlist_bl_unlock(h);</div><div class='add'>+	fscache_stat(&amp;fscache_n_relinquishes_dropped);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fscache_drop_withdraw_cookie(struct fscache_cookie *cookie)</div><div class='add'>+{</div><div class='add'>+	fscache_cookie_drop_from_lru(cookie);</div><div class='add'>+	__fscache_withdraw_cookie(cookie);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fscache_withdraw_cookie - Mark a cookie for withdrawal</div><div class='add'>+ * @cookie: The cookie to be withdrawn.</div><div class='add'>+ *</div><div class='add'>+ * Allow the cache backend to withdraw the backing for a cookie for its own</div><div class='add'>+ * reasons, even if that cookie is in active use.</div><div class='add'>+ */</div><div class='add'>+void fscache_withdraw_cookie(struct fscache_cookie *cookie)</div><div class='add'>+{</div><div class='add'>+	set_bit(FSCACHE_COOKIE_DO_WITHDRAW, &amp;cookie-&gt;flags);</div><div class='add'>+	fscache_drop_withdraw_cookie(cookie);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(fscache_withdraw_cookie);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Allow the netfs to release a cookie back to the cache.</div><div class='add'>+ * - the object will be marked as recyclable on disk if retire is true</div><div class='add'>+ */</div><div class='add'>+void __fscache_relinquish_cookie(struct fscache_cookie *cookie, bool retire)</div><div class='add'>+{</div><div class='add'>+	fscache_stat(&amp;fscache_n_relinquishes);</div><div class='add'>+	if (retire)</div><div class='add'>+		fscache_stat(&amp;fscache_n_relinquishes_retire);</div><div class='add'>+</div><div class='add'>+	_enter("c=%08x{%d},%d",</div><div class='add'>+	       cookie-&gt;debug_id, atomic_read(&amp;cookie-&gt;n_active), retire);</div><div class='add'>+</div><div class='add'>+	if (WARN(test_and_set_bit(FSCACHE_COOKIE_RELINQUISHED, &amp;cookie-&gt;flags),</div><div class='add'>+		 "Cookie c=%x already relinquished\n", cookie-&gt;debug_id))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (retire)</div><div class='add'>+		set_bit(FSCACHE_COOKIE_RETIRED, &amp;cookie-&gt;flags);</div><div class='add'>+	trace_fscache_relinquish(cookie, retire);</div><div class='add'>+</div><div class='add'>+	ASSERTCMP(atomic_read(&amp;cookie-&gt;n_active), ==, 0);</div><div class='add'>+	ASSERTCMP(atomic_read(&amp;cookie-&gt;volume-&gt;n_cookies), &gt;, 0);</div><div class='add'>+	atomic_dec(&amp;cookie-&gt;volume-&gt;n_cookies);</div><div class='add'>+</div><div class='add'>+	if (test_bit(FSCACHE_COOKIE_HAS_BEEN_CACHED, &amp;cookie-&gt;flags)) {</div><div class='add'>+		set_bit(FSCACHE_COOKIE_DO_RELINQUISH, &amp;cookie-&gt;flags);</div><div class='add'>+		fscache_drop_withdraw_cookie(cookie);</div><div class='add'>+	} else {</div><div class='add'>+		fscache_set_cookie_state(cookie, FSCACHE_COOKIE_STATE_DROPPED);</div><div class='add'>+		fscache_unhash_cookie(cookie);</div><div class='add'>+	}</div><div class='add'>+	fscache_put_cookie(cookie, fscache_cookie_put_relinquish);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(__fscache_relinquish_cookie);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Drop a reference to a cookie.</div><div class='add'>+ */</div><div class='add'>+void fscache_put_cookie(struct fscache_cookie *cookie,</div><div class='add'>+			enum fscache_cookie_trace where)</div><div class='add'>+{</div><div class='add'>+	struct fscache_volume *volume = cookie-&gt;volume;</div><div class='add'>+	unsigned int cookie_debug_id = cookie-&gt;debug_id;</div><div class='add'>+	bool zero;</div><div class='add'>+	int ref;</div><div class='add'>+</div><div class='add'>+	zero = __refcount_dec_and_test(&amp;cookie-&gt;ref, &amp;ref);</div><div class='add'>+	trace_fscache_cookie(cookie_debug_id, ref - 1, where);</div><div class='add'>+	if (zero) {</div><div class='add'>+		fscache_free_cookie(cookie);</div><div class='add'>+		fscache_put_volume(volume, fscache_volume_put_cookie);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(fscache_put_cookie);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Get a reference to a cookie.</div><div class='add'>+ */</div><div class='add'>+struct fscache_cookie *fscache_get_cookie(struct fscache_cookie *cookie,</div><div class='add'>+					  enum fscache_cookie_trace where)</div><div class='add'>+{</div><div class='add'>+	int ref;</div><div class='add'>+</div><div class='add'>+	__refcount_inc(&amp;cookie-&gt;ref, &amp;ref);</div><div class='add'>+	trace_fscache_cookie(cookie-&gt;debug_id, ref + 1, where);</div><div class='add'>+	return cookie;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(fscache_get_cookie);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Ask the cache to effect invalidation of a cookie.</div><div class='add'>+ */</div><div class='add'>+static void fscache_perform_invalidation(struct fscache_cookie *cookie)</div><div class='add'>+{</div><div class='add'>+	if (!cookie-&gt;volume-&gt;cache-&gt;ops-&gt;invalidate_cookie(cookie))</div><div class='add'>+		fscache_caching_failed(cookie);</div><div class='add'>+	fscache_end_cookie_access(cookie, fscache_access_invalidate_cookie_end);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Invalidate an object.</div><div class='add'>+ */</div><div class='add'>+void __fscache_invalidate(struct fscache_cookie *cookie,</div><div class='add'>+			  const void *aux_data, loff_t new_size,</div><div class='add'>+			  unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	bool is_caching;</div><div class='add'>+</div><div class='add'>+	_enter("c=%x", cookie-&gt;debug_id);</div><div class='add'>+</div><div class='add'>+	fscache_stat(&amp;fscache_n_invalidates);</div><div class='add'>+</div><div class='add'>+	if (WARN(test_bit(FSCACHE_COOKIE_RELINQUISHED, &amp;cookie-&gt;flags),</div><div class='add'>+		 "Trying to invalidate relinquished cookie\n"))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if ((flags &amp; FSCACHE_INVAL_DIO_WRITE) &amp;&amp;</div><div class='add'>+	    test_and_set_bit(FSCACHE_COOKIE_DISABLED, &amp;cookie-&gt;flags))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;cookie-&gt;lock);</div><div class='add'>+	set_bit(FSCACHE_COOKIE_NO_DATA_TO_READ, &amp;cookie-&gt;flags);</div><div class='add'>+	fscache_update_aux(cookie, aux_data, &amp;new_size);</div><div class='add'>+	cookie-&gt;inval_counter++;</div><div class='add'>+	trace_fscache_invalidate(cookie, new_size);</div><div class='add'>+</div><div class='add'>+	switch (cookie-&gt;state) {</div><div class='add'>+	case FSCACHE_COOKIE_STATE_INVALIDATING: /* is_still_valid will catch it */</div><div class='add'>+	default:</div><div class='add'>+		spin_unlock(&amp;cookie-&gt;lock);</div><div class='add'>+		_leave(" [no %u]", cookie-&gt;state);</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	case FSCACHE_COOKIE_STATE_LOOKING_UP:</div><div class='add'>+		if (!test_and_set_bit(FSCACHE_COOKIE_DO_INVALIDATE, &amp;cookie-&gt;flags))</div><div class='add'>+			__fscache_begin_cookie_access(cookie, fscache_access_invalidate_cookie);</div><div class='add'>+		fallthrough;</div><div class='add'>+	case FSCACHE_COOKIE_STATE_CREATING:</div><div class='add'>+		spin_unlock(&amp;cookie-&gt;lock);</div><div class='add'>+		_leave(" [look %x]", cookie-&gt;inval_counter);</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	case FSCACHE_COOKIE_STATE_ACTIVE:</div><div class='add'>+		is_caching = fscache_begin_cookie_access(</div><div class='add'>+			cookie, fscache_access_invalidate_cookie);</div><div class='add'>+		if (is_caching)</div><div class='add'>+			__fscache_set_cookie_state(cookie, FSCACHE_COOKIE_STATE_INVALIDATING);</div><div class='add'>+		spin_unlock(&amp;cookie-&gt;lock);</div><div class='add'>+		wake_up_cookie_state(cookie);</div><div class='add'>+</div><div class='add'>+		if (is_caching)</div><div class='add'>+			fscache_queue_cookie(cookie, fscache_cookie_get_inval_work);</div><div class='add'>+		_leave(" [inv]");</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(__fscache_invalidate);</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_PROC_FS</div><div class='add'>+/*</div><div class='add'>+ * Generate a list of extant cookies in /proc/fs/fscache/cookies</div><div class='add'>+ */</div><div class='add'>+static int fscache_cookies_seq_show(struct seq_file *m, void *v)</div><div class='add'>+{</div><div class='add'>+	struct fscache_cookie *cookie;</div><div class='add'>+	unsigned int keylen = 0, auxlen = 0;</div><div class='add'>+	u8 *p;</div><div class='add'>+</div><div class='add'>+	if (v == &amp;fscache_cookies) {</div><div class='add'>+		seq_puts(m,</div><div class='add'>+			 "COOKIE   VOLUME   REF ACT ACC S FL DEF             \n"</div><div class='add'>+			 "======== ======== === === === = == ================\n"</div><div class='add'>+			 );</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	cookie = list_entry(v, struct fscache_cookie, proc_link);</div><div class='add'>+</div><div class='add'>+	seq_printf(m,</div><div class='add'>+		   "%08x %08x %3d %3d %3d %c %02lx",</div><div class='add'>+		   cookie-&gt;debug_id,</div><div class='add'>+		   cookie-&gt;volume-&gt;debug_id,</div><div class='add'>+		   refcount_read(&amp;cookie-&gt;ref),</div><div class='add'>+		   atomic_read(&amp;cookie-&gt;n_active),</div><div class='add'>+		   atomic_read(&amp;cookie-&gt;n_accesses),</div><div class='add'>+		   fscache_cookie_states[cookie-&gt;state],</div><div class='add'>+		   cookie-&gt;flags);</div><div class='add'>+</div><div class='add'>+	keylen = cookie-&gt;key_len;</div><div class='add'>+	auxlen = cookie-&gt;aux_len;</div><div class='add'>+</div><div class='add'>+	if (keylen &gt; 0 || auxlen &gt; 0) {</div><div class='add'>+		seq_puts(m, " ");</div><div class='add'>+		p = keylen &lt;= sizeof(cookie-&gt;inline_key) ?</div><div class='add'>+			cookie-&gt;inline_key : cookie-&gt;key;</div><div class='add'>+		for (; keylen &gt; 0; keylen--)</div><div class='add'>+			seq_printf(m, "%02x", *p++);</div><div class='add'>+		if (auxlen &gt; 0) {</div><div class='add'>+			seq_puts(m, ", ");</div><div class='add'>+			p = auxlen &lt;= sizeof(cookie-&gt;inline_aux) ?</div><div class='add'>+				cookie-&gt;inline_aux : cookie-&gt;aux;</div><div class='add'>+			for (; auxlen &gt; 0; auxlen--)</div><div class='add'>+				seq_printf(m, "%02x", *p++);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	seq_puts(m, "\n");</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void *fscache_cookies_seq_start(struct seq_file *m, loff_t *_pos)</div><div class='add'>+	__acquires(fscache_cookies_lock)</div><div class='add'>+{</div><div class='add'>+	read_lock(&amp;fscache_cookies_lock);</div><div class='add'>+	return seq_list_start_head(&amp;fscache_cookies, *_pos);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void *fscache_cookies_seq_next(struct seq_file *m, void *v, loff_t *_pos)</div><div class='add'>+{</div><div class='add'>+	return seq_list_next(v, &amp;fscache_cookies, _pos);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fscache_cookies_seq_stop(struct seq_file *m, void *v)</div><div class='add'>+	__releases(rcu)</div><div class='add'>+{</div><div class='add'>+	read_unlock(&amp;fscache_cookies_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+</div><div class='add'>+const struct seq_operations fscache_cookies_seq_ops = {</div><div class='add'>+	.start  = fscache_cookies_seq_start,</div><div class='add'>+	.next   = fscache_cookies_seq_next,</div><div class='add'>+	.stop   = fscache_cookies_seq_stop,</div><div class='add'>+	.show   = fscache_cookies_seq_show,</div><div class='add'>+};</div><div class='add'>+#endif</div><div class='head'>diff --git a/fs/netfs/fscache_internal.h b/fs/netfs/fscache_internal.h<br/>new file mode 100644<br/>index 000000000000..a09b948fcef2<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/fscache_internal.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/fscache_internal.h</a></div><div class='hunk'>@@ -0,0 +1,14 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0-or-later */</div><div class='add'>+/* Internal definitions for FS-Cache</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2021 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+#ifdef pr_fmt</div><div class='add'>+#undef pr_fmt</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+#define pr_fmt(fmt) "FS-Cache: " fmt</div><div class='head'>diff --git a/fs/netfs/fscache_io.c b/fs/netfs/fscache_io.c<br/>new file mode 100644<br/>index 000000000000..e4308457633c<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/fscache_io.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/fscache_io.c</a></div><div class='hunk'>@@ -0,0 +1,290 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='add'>+/* Cache data I/O routines</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2021 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ */</div><div class='add'>+#define FSCACHE_DEBUG_LEVEL OPERATION</div><div class='add'>+#include &lt;linux/fscache-cache.h&gt;</div><div class='add'>+#include &lt;linux/uio.h&gt;</div><div class='add'>+#include &lt;linux/bvec.h&gt;</div><div class='add'>+#include &lt;linux/slab.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fscache_wait_for_operation - Wait for an object become accessible</div><div class='add'>+ * @cres: The cache resources for the operation being performed</div><div class='add'>+ * @want_state: The minimum state the object must be at</div><div class='add'>+ *</div><div class='add'>+ * See if the target cache object is at the specified minimum state of</div><div class='add'>+ * accessibility yet, and if not, wait for it.</div><div class='add'>+ */</div><div class='add'>+bool fscache_wait_for_operation(struct netfs_cache_resources *cres,</div><div class='add'>+				enum fscache_want_state want_state)</div><div class='add'>+{</div><div class='add'>+	struct fscache_cookie *cookie = fscache_cres_cookie(cres);</div><div class='add'>+	enum fscache_cookie_state state;</div><div class='add'>+</div><div class='add'>+again:</div><div class='add'>+	if (!fscache_cache_is_live(cookie-&gt;volume-&gt;cache)) {</div><div class='add'>+		_leave(" [broken]");</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	state = fscache_cookie_state(cookie);</div><div class='add'>+	_enter("c=%08x{%u},%x", cookie-&gt;debug_id, state, want_state);</div><div class='add'>+</div><div class='add'>+	switch (state) {</div><div class='add'>+	case FSCACHE_COOKIE_STATE_CREATING:</div><div class='add'>+	case FSCACHE_COOKIE_STATE_INVALIDATING:</div><div class='add'>+		if (want_state == FSCACHE_WANT_PARAMS)</div><div class='add'>+			goto ready; /* There can be no content */</div><div class='add'>+		fallthrough;</div><div class='add'>+	case FSCACHE_COOKIE_STATE_LOOKING_UP:</div><div class='add'>+	case FSCACHE_COOKIE_STATE_LRU_DISCARDING:</div><div class='add'>+		wait_var_event(&amp;cookie-&gt;state,</div><div class='add'>+			       fscache_cookie_state(cookie) != state);</div><div class='add'>+		goto again;</div><div class='add'>+</div><div class='add'>+	case FSCACHE_COOKIE_STATE_ACTIVE:</div><div class='add'>+		goto ready;</div><div class='add'>+	case FSCACHE_COOKIE_STATE_DROPPED:</div><div class='add'>+	case FSCACHE_COOKIE_STATE_RELINQUISHING:</div><div class='add'>+	default:</div><div class='add'>+		_leave(" [not live]");</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+ready:</div><div class='add'>+	if (!cres-&gt;cache_priv2)</div><div class='add'>+		return cookie-&gt;volume-&gt;cache-&gt;ops-&gt;begin_operation(cres, want_state);</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(fscache_wait_for_operation);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Begin an I/O operation on the cache, waiting till we reach the right state.</div><div class='add'>+ *</div><div class='add'>+ * Attaches the resources required to the operation resources record.</div><div class='add'>+ */</div><div class='add'>+static int fscache_begin_operation(struct netfs_cache_resources *cres,</div><div class='add'>+				   struct fscache_cookie *cookie,</div><div class='add'>+				   enum fscache_want_state want_state,</div><div class='add'>+				   enum fscache_access_trace why)</div><div class='add'>+{</div><div class='add'>+	enum fscache_cookie_state state;</div><div class='add'>+	long timeo;</div><div class='add'>+	bool once_only = false;</div><div class='add'>+</div><div class='add'>+	cres-&gt;ops		= NULL;</div><div class='add'>+	cres-&gt;cache_priv	= cookie;</div><div class='add'>+	cres-&gt;cache_priv2	= NULL;</div><div class='add'>+	cres-&gt;debug_id		= cookie-&gt;debug_id;</div><div class='add'>+	cres-&gt;inval_counter	= cookie-&gt;inval_counter;</div><div class='add'>+</div><div class='add'>+	if (!fscache_begin_cookie_access(cookie, why)) {</div><div class='add'>+		cres-&gt;cache_priv = NULL;</div><div class='add'>+		return -ENOBUFS;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+again:</div><div class='add'>+	spin_lock(&amp;cookie-&gt;lock);</div><div class='add'>+</div><div class='add'>+	state = fscache_cookie_state(cookie);</div><div class='add'>+	_enter("c=%08x{%u},%x", cookie-&gt;debug_id, state, want_state);</div><div class='add'>+</div><div class='add'>+	switch (state) {</div><div class='add'>+	case FSCACHE_COOKIE_STATE_LOOKING_UP:</div><div class='add'>+	case FSCACHE_COOKIE_STATE_LRU_DISCARDING:</div><div class='add'>+	case FSCACHE_COOKIE_STATE_INVALIDATING:</div><div class='add'>+		goto wait_for_file_wrangling;</div><div class='add'>+	case FSCACHE_COOKIE_STATE_CREATING:</div><div class='add'>+		if (want_state == FSCACHE_WANT_PARAMS)</div><div class='add'>+			goto ready; /* There can be no content */</div><div class='add'>+		goto wait_for_file_wrangling;</div><div class='add'>+	case FSCACHE_COOKIE_STATE_ACTIVE:</div><div class='add'>+		goto ready;</div><div class='add'>+	case FSCACHE_COOKIE_STATE_DROPPED:</div><div class='add'>+	case FSCACHE_COOKIE_STATE_RELINQUISHING:</div><div class='add'>+		WARN(1, "Can't use cookie in state %u\n", cookie-&gt;state);</div><div class='add'>+		goto not_live;</div><div class='add'>+	default:</div><div class='add'>+		goto not_live;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+ready:</div><div class='add'>+	spin_unlock(&amp;cookie-&gt;lock);</div><div class='add'>+	if (!cookie-&gt;volume-&gt;cache-&gt;ops-&gt;begin_operation(cres, want_state))</div><div class='add'>+		goto failed;</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+wait_for_file_wrangling:</div><div class='add'>+	spin_unlock(&amp;cookie-&gt;lock);</div><div class='add'>+	trace_fscache_access(cookie-&gt;debug_id, refcount_read(&amp;cookie-&gt;ref),</div><div class='add'>+			     atomic_read(&amp;cookie-&gt;n_accesses),</div><div class='add'>+			     fscache_access_io_wait);</div><div class='add'>+	timeo = wait_var_event_timeout(&amp;cookie-&gt;state,</div><div class='add'>+				       fscache_cookie_state(cookie) != state, 20 * HZ);</div><div class='add'>+	if (timeo &lt;= 1 &amp;&amp; !once_only) {</div><div class='add'>+		pr_warn("%s: cookie state change wait timed out: cookie-&gt;state=%u state=%u",</div><div class='add'>+			__func__, fscache_cookie_state(cookie), state);</div><div class='add'>+		fscache_print_cookie(cookie, 'O');</div><div class='add'>+		once_only = true;</div><div class='add'>+	}</div><div class='add'>+	goto again;</div><div class='add'>+</div><div class='add'>+not_live:</div><div class='add'>+	spin_unlock(&amp;cookie-&gt;lock);</div><div class='add'>+failed:</div><div class='add'>+	cres-&gt;cache_priv = NULL;</div><div class='add'>+	cres-&gt;ops = NULL;</div><div class='add'>+	fscache_end_cookie_access(cookie, fscache_access_io_not_live);</div><div class='add'>+	_leave(" = -ENOBUFS");</div><div class='add'>+	return -ENOBUFS;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int __fscache_begin_read_operation(struct netfs_cache_resources *cres,</div><div class='add'>+				   struct fscache_cookie *cookie)</div><div class='add'>+{</div><div class='add'>+	return fscache_begin_operation(cres, cookie, FSCACHE_WANT_PARAMS,</div><div class='add'>+				       fscache_access_io_read);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(__fscache_begin_read_operation);</div><div class='add'>+</div><div class='add'>+int __fscache_begin_write_operation(struct netfs_cache_resources *cres,</div><div class='add'>+				    struct fscache_cookie *cookie)</div><div class='add'>+{</div><div class='add'>+	return fscache_begin_operation(cres, cookie, FSCACHE_WANT_PARAMS,</div><div class='add'>+				       fscache_access_io_write);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(__fscache_begin_write_operation);</div><div class='add'>+</div><div class='add'>+struct fscache_write_request {</div><div class='add'>+	struct netfs_cache_resources cache_resources;</div><div class='add'>+	struct address_space	*mapping;</div><div class='add'>+	loff_t			start;</div><div class='add'>+	size_t			len;</div><div class='add'>+	bool			set_bits;</div><div class='add'>+	bool			using_pgpriv2;</div><div class='add'>+	netfs_io_terminated_t	term_func;</div><div class='add'>+	void			*term_func_priv;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+void __fscache_clear_page_bits(struct address_space *mapping,</div><div class='add'>+			       loff_t start, size_t len)</div><div class='add'>+{</div><div class='add'>+	pgoff_t first = start / PAGE_SIZE;</div><div class='add'>+	pgoff_t last = (start + len - 1) / PAGE_SIZE;</div><div class='add'>+	struct page *page;</div><div class='add'>+</div><div class='add'>+	if (len) {</div><div class='add'>+		XA_STATE(xas, &amp;mapping-&gt;i_pages, first);</div><div class='add'>+</div><div class='add'>+		rcu_read_lock();</div><div class='add'>+		xas_for_each(&amp;xas, page, last) {</div><div class='add'>+			folio_end_private_2(page_folio(page));</div><div class='add'>+		}</div><div class='add'>+		rcu_read_unlock();</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(__fscache_clear_page_bits);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Deal with the completion of writing the data to the cache.</div><div class='add'>+ */</div><div class='add'>+static void fscache_wreq_done(void *priv, ssize_t transferred_or_error)</div><div class='add'>+{</div><div class='add'>+	struct fscache_write_request *wreq = priv;</div><div class='add'>+</div><div class='add'>+	if (wreq-&gt;using_pgpriv2)</div><div class='add'>+		fscache_clear_page_bits(wreq-&gt;mapping, wreq-&gt;start, wreq-&gt;len,</div><div class='add'>+					wreq-&gt;set_bits);</div><div class='add'>+</div><div class='add'>+	if (wreq-&gt;term_func)</div><div class='add'>+		wreq-&gt;term_func(wreq-&gt;term_func_priv, transferred_or_error);</div><div class='add'>+	fscache_end_operation(&amp;wreq-&gt;cache_resources);</div><div class='add'>+	kfree(wreq);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void __fscache_write_to_cache(struct fscache_cookie *cookie,</div><div class='add'>+			      struct address_space *mapping,</div><div class='add'>+			      loff_t start, size_t len, loff_t i_size,</div><div class='add'>+			      netfs_io_terminated_t term_func,</div><div class='add'>+			      void *term_func_priv,</div><div class='add'>+			      bool using_pgpriv2, bool cond)</div><div class='add'>+{</div><div class='add'>+	struct fscache_write_request *wreq;</div><div class='add'>+	struct netfs_cache_resources *cres;</div><div class='add'>+	struct iov_iter iter;</div><div class='add'>+	int ret = -ENOBUFS;</div><div class='add'>+</div><div class='add'>+	if (len == 0)</div><div class='add'>+		goto abandon;</div><div class='add'>+</div><div class='add'>+	_enter("%llx,%zx", start, len);</div><div class='add'>+</div><div class='add'>+	wreq = kzalloc(sizeof(struct fscache_write_request), GFP_NOFS);</div><div class='add'>+	if (!wreq)</div><div class='add'>+		goto abandon;</div><div class='add'>+	wreq-&gt;mapping		= mapping;</div><div class='add'>+	wreq-&gt;start		= start;</div><div class='add'>+	wreq-&gt;len		= len;</div><div class='add'>+	wreq-&gt;using_pgpriv2	= using_pgpriv2;</div><div class='add'>+	wreq-&gt;set_bits		= cond;</div><div class='add'>+	wreq-&gt;term_func		= term_func;</div><div class='add'>+	wreq-&gt;term_func_priv	= term_func_priv;</div><div class='add'>+</div><div class='add'>+	cres = &amp;wreq-&gt;cache_resources;</div><div class='add'>+	if (fscache_begin_operation(cres, cookie, FSCACHE_WANT_WRITE,</div><div class='add'>+				    fscache_access_io_write) &lt; 0)</div><div class='add'>+		goto abandon_free;</div><div class='add'>+</div><div class='add'>+	ret = cres-&gt;ops-&gt;prepare_write(cres, &amp;start, &amp;len, len, i_size, false);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto abandon_end;</div><div class='add'>+</div><div class='add'>+	/* TODO: Consider clearing page bits now for space the write isn't</div><div class='add'>+	 * covering.  This is more complicated than it appears when THPs are</div><div class='add'>+	 * taken into account.</div><div class='add'>+	 */</div><div class='add'>+</div><div class='add'>+	iov_iter_xarray(&amp;iter, ITER_SOURCE, &amp;mapping-&gt;i_pages, start, len);</div><div class='add'>+	fscache_write(cres, start, &amp;iter, fscache_wreq_done, wreq);</div><div class='add'>+	return;</div><div class='add'>+</div><div class='add'>+abandon_end:</div><div class='add'>+	return fscache_wreq_done(wreq, ret);</div><div class='add'>+abandon_free:</div><div class='add'>+	kfree(wreq);</div><div class='add'>+abandon:</div><div class='add'>+	if (using_pgpriv2)</div><div class='add'>+		fscache_clear_page_bits(mapping, start, len, cond);</div><div class='add'>+	if (term_func)</div><div class='add'>+		term_func(term_func_priv, ret);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(__fscache_write_to_cache);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Change the size of a backing object.</div><div class='add'>+ */</div><div class='add'>+void __fscache_resize_cookie(struct fscache_cookie *cookie, loff_t new_size)</div><div class='add'>+{</div><div class='add'>+	struct netfs_cache_resources cres;</div><div class='add'>+</div><div class='add'>+	trace_fscache_resize(cookie, new_size);</div><div class='add'>+	if (fscache_begin_operation(&amp;cres, cookie, FSCACHE_WANT_WRITE,</div><div class='add'>+				    fscache_access_io_resize) == 0) {</div><div class='add'>+		fscache_stat(&amp;fscache_n_resizes);</div><div class='add'>+		set_bit(FSCACHE_COOKIE_NEEDS_UPDATE, &amp;cookie-&gt;flags);</div><div class='add'>+</div><div class='add'>+		/* We cannot defer a resize as we need to do it inside the</div><div class='add'>+		 * netfs's inode lock so that we're serialised with respect to</div><div class='add'>+		 * writes.</div><div class='add'>+		 */</div><div class='add'>+		cookie-&gt;volume-&gt;cache-&gt;ops-&gt;resize_cookie(&amp;cres, new_size);</div><div class='add'>+		fscache_end_operation(&amp;cres);</div><div class='add'>+	} else {</div><div class='add'>+		fscache_stat(&amp;fscache_n_resizes_null);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(__fscache_resize_cookie);</div><div class='head'>diff --git a/fs/netfs/fscache_main.c b/fs/netfs/fscache_main.c<br/>new file mode 100644<br/>index 000000000000..49849005eb7c<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/fscache_main.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/fscache_main.c</a></div><div class='hunk'>@@ -0,0 +1,109 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='add'>+/* General filesystem local caching manager</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2021 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#define FSCACHE_DEBUG_LEVEL CACHE</div><div class='add'>+#include &lt;linux/module.h&gt;</div><div class='add'>+#include &lt;linux/init.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+#define CREATE_TRACE_POINTS</div><div class='add'>+#include &lt;trace/events/fscache.h&gt;</div><div class='add'>+</div><div class='add'>+EXPORT_TRACEPOINT_SYMBOL(fscache_access_cache);</div><div class='add'>+EXPORT_TRACEPOINT_SYMBOL(fscache_access_volume);</div><div class='add'>+EXPORT_TRACEPOINT_SYMBOL(fscache_access);</div><div class='add'>+</div><div class='add'>+struct workqueue_struct *fscache_wq;</div><div class='add'>+EXPORT_SYMBOL(fscache_wq);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Mixing scores (in bits) for (7,20):</div><div class='add'>+ * Input delta: 1-bit      2-bit</div><div class='add'>+ * 1 round:     330.3     9201.6</div><div class='add'>+ * 2 rounds:   1246.4    25475.4</div><div class='add'>+ * 3 rounds:   1907.1    31295.1</div><div class='add'>+ * 4 rounds:   2042.3    31718.6</div><div class='add'>+ * Perfect:    2048      31744</div><div class='add'>+ *            (32*64)   (32*31/2 * 64)</div><div class='add'>+ */</div><div class='add'>+#define HASH_MIX(x, y, a)	\</div><div class='add'>+	(	x ^= (a),	\</div><div class='add'>+	y ^= x,	x = rol32(x, 7),\</div><div class='add'>+	x += y,	y = rol32(y,20),\</div><div class='add'>+	y *= 9			)</div><div class='add'>+</div><div class='add'>+static inline unsigned int fold_hash(unsigned long x, unsigned long y)</div><div class='add'>+{</div><div class='add'>+	/* Use arch-optimized multiply if one exists */</div><div class='add'>+	return __hash_32(y ^ __hash_32(x));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Generate a hash.  This is derived from full_name_hash(), but we want to be</div><div class='add'>+ * sure it is arch independent and that it doesn't change as bits of the</div><div class='add'>+ * computed hash value might appear on disk.  The caller must guarantee that</div><div class='add'>+ * the source data is a multiple of four bytes in size.</div><div class='add'>+ */</div><div class='add'>+unsigned int fscache_hash(unsigned int salt, const void *data, size_t len)</div><div class='add'>+{</div><div class='add'>+	const __le32 *p = data;</div><div class='add'>+	unsigned int a, x = 0, y = salt, n = len / sizeof(__le32);</div><div class='add'>+</div><div class='add'>+	for (; n; n--) {</div><div class='add'>+		a = le32_to_cpu(*p++);</div><div class='add'>+		HASH_MIX(x, y, a);</div><div class='add'>+	}</div><div class='add'>+	return fold_hash(x, y);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * initialise the fs caching module</div><div class='add'>+ */</div><div class='add'>+int __init fscache_init(void)</div><div class='add'>+{</div><div class='add'>+	int ret = -ENOMEM;</div><div class='add'>+</div><div class='add'>+	fscache_wq = alloc_workqueue("fscache", WQ_UNBOUND | WQ_FREEZABLE, 0);</div><div class='add'>+	if (!fscache_wq)</div><div class='add'>+		goto error_wq;</div><div class='add'>+</div><div class='add'>+	ret = fscache_proc_init();</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto error_proc;</div><div class='add'>+</div><div class='add'>+	fscache_cookie_jar = kmem_cache_create("fscache_cookie_jar",</div><div class='add'>+					       sizeof(struct fscache_cookie),</div><div class='add'>+					       0, 0, NULL);</div><div class='add'>+	if (!fscache_cookie_jar) {</div><div class='add'>+		pr_notice("Failed to allocate a cookie jar\n");</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto error_cookie_jar;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	pr_notice("FS-Cache loaded\n");</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+error_cookie_jar:</div><div class='add'>+	fscache_proc_cleanup();</div><div class='add'>+error_proc:</div><div class='add'>+	destroy_workqueue(fscache_wq);</div><div class='add'>+error_wq:</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * clean up on module removal</div><div class='add'>+ */</div><div class='add'>+void __exit fscache_exit(void)</div><div class='add'>+{</div><div class='add'>+	_enter("");</div><div class='add'>+</div><div class='add'>+	kmem_cache_destroy(fscache_cookie_jar);</div><div class='add'>+	fscache_proc_cleanup();</div><div class='add'>+	timer_shutdown_sync(&amp;fscache_cookie_lru_timer);</div><div class='add'>+	destroy_workqueue(fscache_wq);</div><div class='add'>+	pr_notice("FS-Cache unloaded\n");</div><div class='add'>+}</div><div class='head'>diff --git a/fs/netfs/fscache_proc.c b/fs/netfs/fscache_proc.c<br/>new file mode 100644<br/>index 000000000000..874d951bc390<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/fscache_proc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/fscache_proc.c</a></div><div class='hunk'>@@ -0,0 +1,47 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='add'>+/* FS-Cache statistics viewing interface</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2021 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#define FSCACHE_DEBUG_LEVEL CACHE</div><div class='add'>+#include &lt;linux/module.h&gt;</div><div class='add'>+#include &lt;linux/proc_fs.h&gt;</div><div class='add'>+#include &lt;linux/seq_file.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Add files to /proc/fs/netfs/.</div><div class='add'>+ */</div><div class='add'>+int __init fscache_proc_init(void)</div><div class='add'>+{</div><div class='add'>+	if (!proc_symlink("fs/fscache", NULL, "netfs"))</div><div class='add'>+		goto error_sym;</div><div class='add'>+</div><div class='add'>+	if (!proc_create_seq("fs/netfs/caches", S_IFREG | 0444, NULL,</div><div class='add'>+			     &amp;fscache_caches_seq_ops))</div><div class='add'>+		goto error;</div><div class='add'>+</div><div class='add'>+	if (!proc_create_seq("fs/netfs/volumes", S_IFREG | 0444, NULL,</div><div class='add'>+			     &amp;fscache_volumes_seq_ops))</div><div class='add'>+		goto error;</div><div class='add'>+</div><div class='add'>+	if (!proc_create_seq("fs/netfs/cookies", S_IFREG | 0444, NULL,</div><div class='add'>+			     &amp;fscache_cookies_seq_ops))</div><div class='add'>+		goto error;</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+error:</div><div class='add'>+	remove_proc_entry("fs/fscache", NULL);</div><div class='add'>+error_sym:</div><div class='add'>+	return -ENOMEM;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Clean up the /proc/fs/fscache symlink.</div><div class='add'>+ */</div><div class='add'>+void fscache_proc_cleanup(void)</div><div class='add'>+{</div><div class='add'>+	remove_proc_subtree("fs/fscache", NULL);</div><div class='add'>+}</div><div class='head'>diff --git a/fs/netfs/fscache_stats.c b/fs/netfs/fscache_stats.c<br/>new file mode 100644<br/>index 000000000000..add21abdf713<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/fscache_stats.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/fscache_stats.c</a></div><div class='hunk'>@@ -0,0 +1,103 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='add'>+/* FS-Cache statistics</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2021 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#define FSCACHE_DEBUG_LEVEL CACHE</div><div class='add'>+#include &lt;linux/proc_fs.h&gt;</div><div class='add'>+#include &lt;linux/seq_file.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * operation counters</div><div class='add'>+ */</div><div class='add'>+atomic_t fscache_n_volumes;</div><div class='add'>+atomic_t fscache_n_volumes_collision;</div><div class='add'>+atomic_t fscache_n_volumes_nomem;</div><div class='add'>+atomic_t fscache_n_cookies;</div><div class='add'>+atomic_t fscache_n_cookies_lru;</div><div class='add'>+atomic_t fscache_n_cookies_lru_expired;</div><div class='add'>+atomic_t fscache_n_cookies_lru_removed;</div><div class='add'>+atomic_t fscache_n_cookies_lru_dropped;</div><div class='add'>+</div><div class='add'>+atomic_t fscache_n_acquires;</div><div class='add'>+atomic_t fscache_n_acquires_ok;</div><div class='add'>+atomic_t fscache_n_acquires_oom;</div><div class='add'>+</div><div class='add'>+atomic_t fscache_n_invalidates;</div><div class='add'>+</div><div class='add'>+atomic_t fscache_n_updates;</div><div class='add'>+EXPORT_SYMBOL(fscache_n_updates);</div><div class='add'>+</div><div class='add'>+atomic_t fscache_n_relinquishes;</div><div class='add'>+atomic_t fscache_n_relinquishes_retire;</div><div class='add'>+atomic_t fscache_n_relinquishes_dropped;</div><div class='add'>+</div><div class='add'>+atomic_t fscache_n_resizes;</div><div class='add'>+atomic_t fscache_n_resizes_null;</div><div class='add'>+</div><div class='add'>+atomic_t fscache_n_read;</div><div class='add'>+EXPORT_SYMBOL(fscache_n_read);</div><div class='add'>+atomic_t fscache_n_write;</div><div class='add'>+EXPORT_SYMBOL(fscache_n_write);</div><div class='add'>+atomic_t fscache_n_no_write_space;</div><div class='add'>+EXPORT_SYMBOL(fscache_n_no_write_space);</div><div class='add'>+atomic_t fscache_n_no_create_space;</div><div class='add'>+EXPORT_SYMBOL(fscache_n_no_create_space);</div><div class='add'>+atomic_t fscache_n_culled;</div><div class='add'>+EXPORT_SYMBOL(fscache_n_culled);</div><div class='add'>+atomic_t fscache_n_dio_misfit;</div><div class='add'>+EXPORT_SYMBOL(fscache_n_dio_misfit);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * display the general statistics</div><div class='add'>+ */</div><div class='add'>+int fscache_stats_show(struct seq_file *m)</div><div class='add'>+{</div><div class='add'>+	seq_puts(m, "-- FS-Cache statistics --\n");</div><div class='add'>+	seq_printf(m, "Cookies: n=%d v=%d vcol=%u voom=%u\n",</div><div class='add'>+		   atomic_read(&amp;fscache_n_cookies),</div><div class='add'>+		   atomic_read(&amp;fscache_n_volumes),</div><div class='add'>+		   atomic_read(&amp;fscache_n_volumes_collision),</div><div class='add'>+		   atomic_read(&amp;fscache_n_volumes_nomem)</div><div class='add'>+		   );</div><div class='add'>+</div><div class='add'>+	seq_printf(m, "Acquire: n=%u ok=%u oom=%u\n",</div><div class='add'>+		   atomic_read(&amp;fscache_n_acquires),</div><div class='add'>+		   atomic_read(&amp;fscache_n_acquires_ok),</div><div class='add'>+		   atomic_read(&amp;fscache_n_acquires_oom));</div><div class='add'>+</div><div class='add'>+	seq_printf(m, "LRU    : n=%u exp=%u rmv=%u drp=%u at=%ld\n",</div><div class='add'>+		   atomic_read(&amp;fscache_n_cookies_lru),</div><div class='add'>+		   atomic_read(&amp;fscache_n_cookies_lru_expired),</div><div class='add'>+		   atomic_read(&amp;fscache_n_cookies_lru_removed),</div><div class='add'>+		   atomic_read(&amp;fscache_n_cookies_lru_dropped),</div><div class='add'>+		   timer_pending(&amp;fscache_cookie_lru_timer) ?</div><div class='add'>+		   fscache_cookie_lru_timer.expires - jiffies : 0);</div><div class='add'>+</div><div class='add'>+	seq_printf(m, "Invals : n=%u\n",</div><div class='add'>+		   atomic_read(&amp;fscache_n_invalidates));</div><div class='add'>+</div><div class='add'>+	seq_printf(m, "Updates: n=%u rsz=%u rsn=%u\n",</div><div class='add'>+		   atomic_read(&amp;fscache_n_updates),</div><div class='add'>+		   atomic_read(&amp;fscache_n_resizes),</div><div class='add'>+		   atomic_read(&amp;fscache_n_resizes_null));</div><div class='add'>+</div><div class='add'>+	seq_printf(m, "Relinqs: n=%u rtr=%u drop=%u\n",</div><div class='add'>+		   atomic_read(&amp;fscache_n_relinquishes),</div><div class='add'>+		   atomic_read(&amp;fscache_n_relinquishes_retire),</div><div class='add'>+		   atomic_read(&amp;fscache_n_relinquishes_dropped));</div><div class='add'>+</div><div class='add'>+	seq_printf(m, "NoSpace: nwr=%u ncr=%u cull=%u\n",</div><div class='add'>+		   atomic_read(&amp;fscache_n_no_write_space),</div><div class='add'>+		   atomic_read(&amp;fscache_n_no_create_space),</div><div class='add'>+		   atomic_read(&amp;fscache_n_culled));</div><div class='add'>+</div><div class='add'>+	seq_printf(m, "IO     : rd=%u wr=%u mis=%u\n",</div><div class='add'>+		   atomic_read(&amp;fscache_n_read),</div><div class='add'>+		   atomic_read(&amp;fscache_n_write),</div><div class='add'>+		   atomic_read(&amp;fscache_n_dio_misfit));</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/netfs/fscache_volume.c b/fs/netfs/fscache_volume.c<br/>new file mode 100644<br/>index 000000000000..ced14ac78cc1<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/fscache_volume.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/fscache_volume.c</a></div><div class='hunk'>@@ -0,0 +1,533 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='add'>+/* Volume-level cache cookie handling.</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2021 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#define FSCACHE_DEBUG_LEVEL COOKIE</div><div class='add'>+#include &lt;linux/export.h&gt;</div><div class='add'>+#include &lt;linux/slab.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+#define fscache_volume_hash_shift 10</div><div class='add'>+static struct hlist_bl_head fscache_volume_hash[1 &lt;&lt; fscache_volume_hash_shift];</div><div class='add'>+static atomic_t fscache_volume_debug_id;</div><div class='add'>+static LIST_HEAD(fscache_volumes);</div><div class='add'>+</div><div class='add'>+static void fscache_create_volume_work(struct work_struct *work);</div><div class='add'>+</div><div class='add'>+struct fscache_volume *fscache_get_volume(struct fscache_volume *volume,</div><div class='add'>+					  enum fscache_volume_trace where)</div><div class='add'>+{</div><div class='add'>+	int ref;</div><div class='add'>+</div><div class='add'>+	__refcount_inc(&amp;volume-&gt;ref, &amp;ref);</div><div class='add'>+	trace_fscache_volume(volume-&gt;debug_id, ref + 1, where);</div><div class='add'>+	return volume;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct fscache_volume *fscache_try_get_volume(struct fscache_volume *volume,</div><div class='add'>+					      enum fscache_volume_trace where)</div><div class='add'>+{</div><div class='add'>+	int ref;</div><div class='add'>+</div><div class='add'>+	if (!__refcount_inc_not_zero(&amp;volume-&gt;ref, &amp;ref))</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	trace_fscache_volume(volume-&gt;debug_id, ref + 1, where);</div><div class='add'>+	return volume;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(fscache_try_get_volume);</div><div class='add'>+</div><div class='add'>+static void fscache_see_volume(struct fscache_volume *volume,</div><div class='add'>+			       enum fscache_volume_trace where)</div><div class='add'>+{</div><div class='add'>+	int ref = refcount_read(&amp;volume-&gt;ref);</div><div class='add'>+</div><div class='add'>+	trace_fscache_volume(volume-&gt;debug_id, ref, where);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Pin the cache behind a volume so that we can access it.</div><div class='add'>+ */</div><div class='add'>+static void __fscache_begin_volume_access(struct fscache_volume *volume,</div><div class='add'>+					  struct fscache_cookie *cookie,</div><div class='add'>+					  enum fscache_access_trace why)</div><div class='add'>+{</div><div class='add'>+	int n_accesses;</div><div class='add'>+</div><div class='add'>+	n_accesses = atomic_inc_return(&amp;volume-&gt;n_accesses);</div><div class='add'>+	smp_mb__after_atomic();</div><div class='add'>+	trace_fscache_access_volume(volume-&gt;debug_id, cookie ? cookie-&gt;debug_id : 0,</div><div class='add'>+				    refcount_read(&amp;volume-&gt;ref),</div><div class='add'>+				    n_accesses, why);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fscache_begin_volume_access - Pin a cache so a volume can be accessed</div><div class='add'>+ * @volume: The volume cookie</div><div class='add'>+ * @cookie: A datafile cookie for a tracing reference (or NULL)</div><div class='add'>+ * @why: An indication of the circumstances of the access for tracing</div><div class='add'>+ *</div><div class='add'>+ * Attempt to pin the cache to prevent it from going away whilst we're</div><div class='add'>+ * accessing a volume and returns true if successful.  This works as follows:</div><div class='add'>+ *</div><div class='add'>+ *  (1) If the cache tests as not live (state is not FSCACHE_CACHE_IS_ACTIVE),</div><div class='add'>+ *      then we return false to indicate access was not permitted.</div><div class='add'>+ *</div><div class='add'>+ *  (2) If the cache tests as live, then we increment the volume's n_accesses</div><div class='add'>+ *      count and then recheck the cache liveness, ending the access if it</div><div class='add'>+ *      ceased to be live.</div><div class='add'>+ *</div><div class='add'>+ *  (3) When we end the access, we decrement the volume's n_accesses and wake</div><div class='add'>+ *      up the any waiters if it reaches 0.</div><div class='add'>+ *</div><div class='add'>+ *  (4) Whilst the cache is caching, the volume's n_accesses is kept</div><div class='add'>+ *      artificially incremented to prevent wakeups from happening.</div><div class='add'>+ *</div><div class='add'>+ *  (5) When the cache is taken offline, the state is changed to prevent new</div><div class='add'>+ *      accesses, the volume's n_accesses is decremented and we wait for it to</div><div class='add'>+ *      become 0.</div><div class='add'>+ *</div><div class='add'>+ * The datafile @cookie and the @why indicator are merely provided for tracing</div><div class='add'>+ * purposes.</div><div class='add'>+ */</div><div class='add'>+bool fscache_begin_volume_access(struct fscache_volume *volume,</div><div class='add'>+				 struct fscache_cookie *cookie,</div><div class='add'>+				 enum fscache_access_trace why)</div><div class='add'>+{</div><div class='add'>+	if (!fscache_cache_is_live(volume-&gt;cache))</div><div class='add'>+		return false;</div><div class='add'>+	__fscache_begin_volume_access(volume, cookie, why);</div><div class='add'>+	if (!fscache_cache_is_live(volume-&gt;cache)) {</div><div class='add'>+		fscache_end_volume_access(volume, cookie, fscache_access_unlive);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fscache_end_volume_access - Unpin a cache at the end of an access.</div><div class='add'>+ * @volume: The volume cookie</div><div class='add'>+ * @cookie: A datafile cookie for a tracing reference (or NULL)</div><div class='add'>+ * @why: An indication of the circumstances of the access for tracing</div><div class='add'>+ *</div><div class='add'>+ * Unpin a cache volume after we've accessed it.  The datafile @cookie and the</div><div class='add'>+ * @why indicator are merely provided for tracing purposes.</div><div class='add'>+ */</div><div class='add'>+void fscache_end_volume_access(struct fscache_volume *volume,</div><div class='add'>+			       struct fscache_cookie *cookie,</div><div class='add'>+			       enum fscache_access_trace why)</div><div class='add'>+{</div><div class='add'>+	int n_accesses;</div><div class='add'>+</div><div class='add'>+	smp_mb__before_atomic();</div><div class='add'>+	n_accesses = atomic_dec_return(&amp;volume-&gt;n_accesses);</div><div class='add'>+	trace_fscache_access_volume(volume-&gt;debug_id, cookie ? cookie-&gt;debug_id : 0,</div><div class='add'>+				    refcount_read(&amp;volume-&gt;ref),</div><div class='add'>+				    n_accesses, why);</div><div class='add'>+	if (n_accesses == 0)</div><div class='add'>+		wake_up_var(&amp;volume-&gt;n_accesses);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(fscache_end_volume_access);</div><div class='add'>+</div><div class='add'>+static bool fscache_volume_same(const struct fscache_volume *a,</div><div class='add'>+				const struct fscache_volume *b)</div><div class='add'>+{</div><div class='add'>+	size_t klen;</div><div class='add'>+</div><div class='add'>+	if (a-&gt;key_hash	!= b-&gt;key_hash ||</div><div class='add'>+	    a-&gt;cache	!= b-&gt;cache ||</div><div class='add'>+	    a-&gt;key[0]	!= b-&gt;key[0])</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	klen = round_up(a-&gt;key[0] + 1, sizeof(__le32));</div><div class='add'>+	return memcmp(a-&gt;key, b-&gt;key, klen) == 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool fscache_is_acquire_pending(struct fscache_volume *volume)</div><div class='add'>+{</div><div class='add'>+	return test_bit(FSCACHE_VOLUME_ACQUIRE_PENDING, &amp;volume-&gt;flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fscache_wait_on_volume_collision(struct fscache_volume *candidate,</div><div class='add'>+					     unsigned int collidee_debug_id)</div><div class='add'>+{</div><div class='add'>+	wait_on_bit_timeout(&amp;candidate-&gt;flags, FSCACHE_VOLUME_ACQUIRE_PENDING,</div><div class='add'>+			    TASK_UNINTERRUPTIBLE, 20 * HZ);</div><div class='add'>+	if (fscache_is_acquire_pending(candidate)) {</div><div class='add'>+		pr_notice("Potential volume collision new=%08x old=%08x",</div><div class='add'>+			  candidate-&gt;debug_id, collidee_debug_id);</div><div class='add'>+		fscache_stat(&amp;fscache_n_volumes_collision);</div><div class='add'>+		wait_on_bit(&amp;candidate-&gt;flags, FSCACHE_VOLUME_ACQUIRE_PENDING,</div><div class='add'>+			    TASK_UNINTERRUPTIBLE);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Attempt to insert the new volume into the hash.  If there's a collision, we</div><div class='add'>+ * wait for the old volume to complete if it's being relinquished and an error</div><div class='add'>+ * otherwise.</div><div class='add'>+ */</div><div class='add'>+static bool fscache_hash_volume(struct fscache_volume *candidate)</div><div class='add'>+{</div><div class='add'>+	struct fscache_volume *cursor;</div><div class='add'>+	struct hlist_bl_head *h;</div><div class='add'>+	struct hlist_bl_node *p;</div><div class='add'>+	unsigned int bucket, collidee_debug_id = 0;</div><div class='add'>+</div><div class='add'>+	bucket = candidate-&gt;key_hash &amp; (ARRAY_SIZE(fscache_volume_hash) - 1);</div><div class='add'>+	h = &amp;fscache_volume_hash[bucket];</div><div class='add'>+</div><div class='add'>+	hlist_bl_lock(h);</div><div class='add'>+	hlist_bl_for_each_entry(cursor, p, h, hash_link) {</div><div class='add'>+		if (fscache_volume_same(candidate, cursor)) {</div><div class='add'>+			if (!test_bit(FSCACHE_VOLUME_RELINQUISHED, &amp;cursor-&gt;flags))</div><div class='add'>+				goto collision;</div><div class='add'>+			fscache_see_volume(cursor, fscache_volume_get_hash_collision);</div><div class='add'>+			set_bit(FSCACHE_VOLUME_COLLIDED_WITH, &amp;cursor-&gt;flags);</div><div class='add'>+			set_bit(FSCACHE_VOLUME_ACQUIRE_PENDING, &amp;candidate-&gt;flags);</div><div class='add'>+			collidee_debug_id = cursor-&gt;debug_id;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	hlist_bl_add_head(&amp;candidate-&gt;hash_link, h);</div><div class='add'>+	hlist_bl_unlock(h);</div><div class='add'>+</div><div class='add'>+	if (fscache_is_acquire_pending(candidate))</div><div class='add'>+		fscache_wait_on_volume_collision(candidate, collidee_debug_id);</div><div class='add'>+	return true;</div><div class='add'>+</div><div class='add'>+collision:</div><div class='add'>+	fscache_see_volume(cursor, fscache_volume_collision);</div><div class='add'>+	hlist_bl_unlock(h);</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Allocate and initialise a volume representation cookie.</div><div class='add'>+ */</div><div class='add'>+static struct fscache_volume *fscache_alloc_volume(const char *volume_key,</div><div class='add'>+						   const char *cache_name,</div><div class='add'>+						   const void *coherency_data,</div><div class='add'>+						   size_t coherency_len)</div><div class='add'>+{</div><div class='add'>+	struct fscache_volume *volume;</div><div class='add'>+	struct fscache_cache *cache;</div><div class='add'>+	size_t klen, hlen;</div><div class='add'>+	u8 *key;</div><div class='add'>+</div><div class='add'>+	klen = strlen(volume_key);</div><div class='add'>+	if (klen &gt; NAME_MAX)</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	if (!coherency_data)</div><div class='add'>+		coherency_len = 0;</div><div class='add'>+</div><div class='add'>+	cache = fscache_lookup_cache(cache_name, false);</div><div class='add'>+	if (IS_ERR(cache))</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	volume = kzalloc(struct_size(volume, coherency, coherency_len),</div><div class='add'>+			 GFP_KERNEL);</div><div class='add'>+	if (!volume)</div><div class='add'>+		goto err_cache;</div><div class='add'>+</div><div class='add'>+	volume-&gt;cache = cache;</div><div class='add'>+	volume-&gt;coherency_len = coherency_len;</div><div class='add'>+	if (coherency_data)</div><div class='add'>+		memcpy(volume-&gt;coherency, coherency_data, coherency_len);</div><div class='add'>+	INIT_LIST_HEAD(&amp;volume-&gt;proc_link);</div><div class='add'>+	INIT_WORK(&amp;volume-&gt;work, fscache_create_volume_work);</div><div class='add'>+	refcount_set(&amp;volume-&gt;ref, 1);</div><div class='add'>+	spin_lock_init(&amp;volume-&gt;lock);</div><div class='add'>+</div><div class='add'>+	/* Stick the length on the front of the key and pad it out to make</div><div class='add'>+	 * hashing easier.</div><div class='add'>+	 */</div><div class='add'>+	hlen = round_up(1 + klen + 1, sizeof(__le32));</div><div class='add'>+	key = kzalloc(hlen, GFP_KERNEL);</div><div class='add'>+	if (!key)</div><div class='add'>+		goto err_vol;</div><div class='add'>+	key[0] = klen;</div><div class='add'>+	memcpy(key + 1, volume_key, klen);</div><div class='add'>+</div><div class='add'>+	volume-&gt;key = key;</div><div class='add'>+	volume-&gt;key_hash = fscache_hash(0, key, hlen);</div><div class='add'>+</div><div class='add'>+	volume-&gt;debug_id = atomic_inc_return(&amp;fscache_volume_debug_id);</div><div class='add'>+	down_write(&amp;fscache_addremove_sem);</div><div class='add'>+	atomic_inc(&amp;cache-&gt;n_volumes);</div><div class='add'>+	list_add_tail(&amp;volume-&gt;proc_link, &amp;fscache_volumes);</div><div class='add'>+	fscache_see_volume(volume, fscache_volume_new_acquire);</div><div class='add'>+	fscache_stat(&amp;fscache_n_volumes);</div><div class='add'>+	up_write(&amp;fscache_addremove_sem);</div><div class='add'>+	_leave(" = v=%x", volume-&gt;debug_id);</div><div class='add'>+	return volume;</div><div class='add'>+</div><div class='add'>+err_vol:</div><div class='add'>+	kfree(volume);</div><div class='add'>+err_cache:</div><div class='add'>+	fscache_put_cache(cache, fscache_cache_put_alloc_volume);</div><div class='add'>+	fscache_stat(&amp;fscache_n_volumes_nomem);</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Create a volume's representation on disk.  Have a volume ref and a cache</div><div class='add'>+ * access we have to release.</div><div class='add'>+ */</div><div class='add'>+static void fscache_create_volume_work(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	const struct fscache_cache_ops *ops;</div><div class='add'>+	struct fscache_volume *volume =</div><div class='add'>+		container_of(work, struct fscache_volume, work);</div><div class='add'>+</div><div class='add'>+	fscache_see_volume(volume, fscache_volume_see_create_work);</div><div class='add'>+</div><div class='add'>+	ops = volume-&gt;cache-&gt;ops;</div><div class='add'>+	if (ops-&gt;acquire_volume)</div><div class='add'>+		ops-&gt;acquire_volume(volume);</div><div class='add'>+	fscache_end_cache_access(volume-&gt;cache,</div><div class='add'>+				 fscache_access_acquire_volume_end);</div><div class='add'>+</div><div class='add'>+	clear_and_wake_up_bit(FSCACHE_VOLUME_CREATING, &amp;volume-&gt;flags);</div><div class='add'>+	fscache_put_volume(volume, fscache_volume_put_create_work);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Dispatch a worker thread to create a volume's representation on disk.</div><div class='add'>+ */</div><div class='add'>+void fscache_create_volume(struct fscache_volume *volume, bool wait)</div><div class='add'>+{</div><div class='add'>+	if (test_and_set_bit(FSCACHE_VOLUME_CREATING, &amp;volume-&gt;flags))</div><div class='add'>+		goto maybe_wait;</div><div class='add'>+	if (volume-&gt;cache_priv)</div><div class='add'>+		goto no_wait; /* We raced */</div><div class='add'>+	if (!fscache_begin_cache_access(volume-&gt;cache,</div><div class='add'>+					fscache_access_acquire_volume))</div><div class='add'>+		goto no_wait;</div><div class='add'>+</div><div class='add'>+	fscache_get_volume(volume, fscache_volume_get_create_work);</div><div class='add'>+	if (!schedule_work(&amp;volume-&gt;work))</div><div class='add'>+		fscache_put_volume(volume, fscache_volume_put_create_work);</div><div class='add'>+</div><div class='add'>+maybe_wait:</div><div class='add'>+	if (wait) {</div><div class='add'>+		fscache_see_volume(volume, fscache_volume_wait_create_work);</div><div class='add'>+		wait_on_bit(&amp;volume-&gt;flags, FSCACHE_VOLUME_CREATING,</div><div class='add'>+			    TASK_UNINTERRUPTIBLE);</div><div class='add'>+	}</div><div class='add'>+	return;</div><div class='add'>+no_wait:</div><div class='add'>+	clear_and_wake_up_bit(FSCACHE_VOLUME_CREATING, &amp;volume-&gt;flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Acquire a volume representation cookie and link it to a (proposed) cache.</div><div class='add'>+ */</div><div class='add'>+struct fscache_volume *__fscache_acquire_volume(const char *volume_key,</div><div class='add'>+						const char *cache_name,</div><div class='add'>+						const void *coherency_data,</div><div class='add'>+						size_t coherency_len)</div><div class='add'>+{</div><div class='add'>+	struct fscache_volume *volume;</div><div class='add'>+</div><div class='add'>+	volume = fscache_alloc_volume(volume_key, cache_name,</div><div class='add'>+				      coherency_data, coherency_len);</div><div class='add'>+	if (!volume)</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+</div><div class='add'>+	if (!fscache_hash_volume(volume)) {</div><div class='add'>+		fscache_put_volume(volume, fscache_volume_put_hash_collision);</div><div class='add'>+		return ERR_PTR(-EBUSY);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	fscache_create_volume(volume, false);</div><div class='add'>+	return volume;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(__fscache_acquire_volume);</div><div class='add'>+</div><div class='add'>+static void fscache_wake_pending_volume(struct fscache_volume *volume,</div><div class='add'>+					struct hlist_bl_head *h)</div><div class='add'>+{</div><div class='add'>+	struct fscache_volume *cursor;</div><div class='add'>+	struct hlist_bl_node *p;</div><div class='add'>+</div><div class='add'>+	hlist_bl_for_each_entry(cursor, p, h, hash_link) {</div><div class='add'>+		if (fscache_volume_same(cursor, volume)) {</div><div class='add'>+			fscache_see_volume(cursor, fscache_volume_see_hash_wake);</div><div class='add'>+			clear_and_wake_up_bit(FSCACHE_VOLUME_ACQUIRE_PENDING,</div><div class='add'>+					      &amp;cursor-&gt;flags);</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Remove a volume cookie from the hash table.</div><div class='add'>+ */</div><div class='add'>+static void fscache_unhash_volume(struct fscache_volume *volume)</div><div class='add'>+{</div><div class='add'>+	struct hlist_bl_head *h;</div><div class='add'>+	unsigned int bucket;</div><div class='add'>+</div><div class='add'>+	bucket = volume-&gt;key_hash &amp; (ARRAY_SIZE(fscache_volume_hash) - 1);</div><div class='add'>+	h = &amp;fscache_volume_hash[bucket];</div><div class='add'>+</div><div class='add'>+	hlist_bl_lock(h);</div><div class='add'>+	hlist_bl_del(&amp;volume-&gt;hash_link);</div><div class='add'>+	if (test_bit(FSCACHE_VOLUME_COLLIDED_WITH, &amp;volume-&gt;flags))</div><div class='add'>+		fscache_wake_pending_volume(volume, h);</div><div class='add'>+	hlist_bl_unlock(h);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Drop a cache's volume attachments.</div><div class='add'>+ */</div><div class='add'>+static void fscache_free_volume(struct fscache_volume *volume)</div><div class='add'>+{</div><div class='add'>+	struct fscache_cache *cache = volume-&gt;cache;</div><div class='add'>+</div><div class='add'>+	if (volume-&gt;cache_priv) {</div><div class='add'>+		__fscache_begin_volume_access(volume, NULL,</div><div class='add'>+					      fscache_access_relinquish_volume);</div><div class='add'>+		if (volume-&gt;cache_priv)</div><div class='add'>+			cache-&gt;ops-&gt;free_volume(volume);</div><div class='add'>+		fscache_end_volume_access(volume, NULL,</div><div class='add'>+					  fscache_access_relinquish_volume_end);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	down_write(&amp;fscache_addremove_sem);</div><div class='add'>+	list_del_init(&amp;volume-&gt;proc_link);</div><div class='add'>+	atomic_dec(&amp;volume-&gt;cache-&gt;n_volumes);</div><div class='add'>+	up_write(&amp;fscache_addremove_sem);</div><div class='add'>+</div><div class='add'>+	if (!hlist_bl_unhashed(&amp;volume-&gt;hash_link))</div><div class='add'>+		fscache_unhash_volume(volume);</div><div class='add'>+</div><div class='add'>+	trace_fscache_volume(volume-&gt;debug_id, 0, fscache_volume_free);</div><div class='add'>+	kfree(volume-&gt;key);</div><div class='add'>+	kfree(volume);</div><div class='add'>+	fscache_stat_d(&amp;fscache_n_volumes);</div><div class='add'>+	fscache_put_cache(cache, fscache_cache_put_volume);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Drop a reference to a volume cookie.</div><div class='add'>+ */</div><div class='add'>+void fscache_put_volume(struct fscache_volume *volume,</div><div class='add'>+			enum fscache_volume_trace where)</div><div class='add'>+{</div><div class='add'>+	if (volume) {</div><div class='add'>+		unsigned int debug_id = volume-&gt;debug_id;</div><div class='add'>+		bool zero;</div><div class='add'>+		int ref;</div><div class='add'>+</div><div class='add'>+		zero = __refcount_dec_and_test(&amp;volume-&gt;ref, &amp;ref);</div><div class='add'>+		trace_fscache_volume(debug_id, ref - 1, where);</div><div class='add'>+		if (zero)</div><div class='add'>+			fscache_free_volume(volume);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(fscache_put_volume);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Relinquish a volume representation cookie.</div><div class='add'>+ */</div><div class='add'>+void __fscache_relinquish_volume(struct fscache_volume *volume,</div><div class='add'>+				 const void *coherency_data,</div><div class='add'>+				 bool invalidate)</div><div class='add'>+{</div><div class='add'>+	if (WARN_ON(test_and_set_bit(FSCACHE_VOLUME_RELINQUISHED, &amp;volume-&gt;flags)))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (invalidate) {</div><div class='add'>+		set_bit(FSCACHE_VOLUME_INVALIDATE, &amp;volume-&gt;flags);</div><div class='add'>+	} else if (coherency_data) {</div><div class='add'>+		memcpy(volume-&gt;coherency, coherency_data, volume-&gt;coherency_len);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	fscache_put_volume(volume, fscache_volume_put_relinquish);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(__fscache_relinquish_volume);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fscache_withdraw_volume - Withdraw a volume from being cached</div><div class='add'>+ * @volume: Volume cookie</div><div class='add'>+ *</div><div class='add'>+ * Withdraw a cache volume from service, waiting for all accesses to complete</div><div class='add'>+ * before returning.</div><div class='add'>+ */</div><div class='add'>+void fscache_withdraw_volume(struct fscache_volume *volume)</div><div class='add'>+{</div><div class='add'>+	int n_accesses;</div><div class='add'>+</div><div class='add'>+	_debug("withdraw V=%x", volume-&gt;debug_id);</div><div class='add'>+</div><div class='add'>+	/* Allow wakeups on dec-to-0 */</div><div class='add'>+	n_accesses = atomic_dec_return(&amp;volume-&gt;n_accesses);</div><div class='add'>+	trace_fscache_access_volume(volume-&gt;debug_id, 0,</div><div class='add'>+				    refcount_read(&amp;volume-&gt;ref),</div><div class='add'>+				    n_accesses, fscache_access_cache_unpin);</div><div class='add'>+</div><div class='add'>+	wait_var_event(&amp;volume-&gt;n_accesses,</div><div class='add'>+		       atomic_read(&amp;volume-&gt;n_accesses) == 0);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(fscache_withdraw_volume);</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_PROC_FS</div><div class='add'>+/*</div><div class='add'>+ * Generate a list of volumes in /proc/fs/fscache/volumes</div><div class='add'>+ */</div><div class='add'>+static int fscache_volumes_seq_show(struct seq_file *m, void *v)</div><div class='add'>+{</div><div class='add'>+	struct fscache_volume *volume;</div><div class='add'>+</div><div class='add'>+	if (v == &amp;fscache_volumes) {</div><div class='add'>+		seq_puts(m,</div><div class='add'>+			 "VOLUME   REF   nCOOK ACC FL CACHE           KEY\n"</div><div class='add'>+			 "======== ===== ===== === == =============== ================\n");</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	volume = list_entry(v, struct fscache_volume, proc_link);</div><div class='add'>+	seq_printf(m,</div><div class='add'>+		   "%08x %5d %5d %3d %02lx %-15.15s %s\n",</div><div class='add'>+		   volume-&gt;debug_id,</div><div class='add'>+		   refcount_read(&amp;volume-&gt;ref),</div><div class='add'>+		   atomic_read(&amp;volume-&gt;n_cookies),</div><div class='add'>+		   atomic_read(&amp;volume-&gt;n_accesses),</div><div class='add'>+		   volume-&gt;flags,</div><div class='add'>+		   volume-&gt;cache-&gt;name ?: "-",</div><div class='add'>+		   volume-&gt;key + 1);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void *fscache_volumes_seq_start(struct seq_file *m, loff_t *_pos)</div><div class='add'>+	__acquires(&amp;fscache_addremove_sem)</div><div class='add'>+{</div><div class='add'>+	down_read(&amp;fscache_addremove_sem);</div><div class='add'>+	return seq_list_start_head(&amp;fscache_volumes, *_pos);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void *fscache_volumes_seq_next(struct seq_file *m, void *v, loff_t *_pos)</div><div class='add'>+{</div><div class='add'>+	return seq_list_next(v, &amp;fscache_volumes, _pos);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void fscache_volumes_seq_stop(struct seq_file *m, void *v)</div><div class='add'>+	__releases(&amp;fscache_addremove_sem)</div><div class='add'>+{</div><div class='add'>+	up_read(&amp;fscache_addremove_sem);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+const struct seq_operations fscache_volumes_seq_ops = {</div><div class='add'>+	.start  = fscache_volumes_seq_start,</div><div class='add'>+	.next   = fscache_volumes_seq_next,</div><div class='add'>+	.stop   = fscache_volumes_seq_stop,</div><div class='add'>+	.show   = fscache_volumes_seq_show,</div><div class='add'>+};</div><div class='add'>+#endif /* CONFIG_PROC_FS */</div><div class='head'>diff --git a/fs/netfs/internal.h b/fs/netfs/internal.h<br/>index b7f2c4459f33..4319611f5354 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/netfs/internal.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/internal.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/internal.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/internal.h</a></div><div class='hunk'>@@ -5,6 +5,15 @@</div><div class='ctx'>  * Written by David Howells (dhowells@redhat.com)</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/slab.h&gt;</div><div class='add'>+#include &lt;linux/seq_file.h&gt;</div><div class='add'>+#include &lt;linux/folio_queue.h&gt;</div><div class='add'>+#include &lt;linux/netfs.h&gt;</div><div class='add'>+#include &lt;linux/fscache.h&gt;</div><div class='add'>+#include &lt;linux/fscache-cache.h&gt;</div><div class='add'>+#include &lt;trace/events/netfs.h&gt;</div><div class='add'>+#include &lt;trace/events/fscache.h&gt;</div><div class='add'>+</div><div class='ctx'> #ifdef pr_fmt</div><div class='ctx'> #undef pr_fmt</div><div class='ctx'> #endif</div><div class='hunk'>@@ -12,16 +21,116 @@</div><div class='ctx'> #define pr_fmt(fmt) "netfs: " fmt</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * read_helper.c</div><div class='add'>+ * buffered_read.c</div><div class='add'>+ */</div><div class='add'>+void netfs_cache_read_terminated(void *priv, ssize_t transferred_or_error);</div><div class='add'>+int netfs_prefetch_for_write(struct file *file, struct folio *folio,</div><div class='add'>+			     size_t offset, size_t len);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * buffered_write.c</div><div class='add'>+ */</div><div class='add'>+void netfs_update_i_size(struct netfs_inode *ctx, struct inode *inode,</div><div class='add'>+			 loff_t pos, size_t copied);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * main.c</div><div class='ctx'>  */</div><div class='ctx'> extern unsigned int netfs_debug;</div><div class='add'>+extern struct list_head netfs_io_requests;</div><div class='add'>+extern spinlock_t netfs_proc_lock;</div><div class='add'>+extern mempool_t netfs_request_pool;</div><div class='add'>+extern mempool_t netfs_subrequest_pool;</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_PROC_FS</div><div class='add'>+static inline void netfs_proc_add_rreq(struct netfs_io_request *rreq)</div><div class='add'>+{</div><div class='add'>+	spin_lock(&amp;netfs_proc_lock);</div><div class='add'>+	list_add_tail_rcu(&amp;rreq-&gt;proc_link, &amp;netfs_io_requests);</div><div class='add'>+	spin_unlock(&amp;netfs_proc_lock);</div><div class='add'>+}</div><div class='add'>+static inline void netfs_proc_del_rreq(struct netfs_io_request *rreq)</div><div class='add'>+{</div><div class='add'>+	if (!list_empty(&amp;rreq-&gt;proc_link)) {</div><div class='add'>+		spin_lock(&amp;netfs_proc_lock);</div><div class='add'>+		list_del_rcu(&amp;rreq-&gt;proc_link);</div><div class='add'>+		spin_unlock(&amp;netfs_proc_lock);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+static inline void netfs_proc_add_rreq(struct netfs_io_request *rreq) {}</div><div class='add'>+static inline void netfs_proc_del_rreq(struct netfs_io_request *rreq) {}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * misc.c</div><div class='add'>+ */</div><div class='add'>+struct folio_queue *netfs_buffer_make_space(struct netfs_io_request *rreq,</div><div class='add'>+					    enum netfs_folioq_trace trace);</div><div class='add'>+void netfs_reset_iter(struct netfs_io_subrequest *subreq);</div><div class='add'>+void netfs_wake_collector(struct netfs_io_request *rreq);</div><div class='add'>+void netfs_subreq_clear_in_progress(struct netfs_io_subrequest *subreq);</div><div class='add'>+void netfs_wait_for_in_progress_stream(struct netfs_io_request *rreq,</div><div class='add'>+				       struct netfs_io_stream *stream);</div><div class='add'>+ssize_t netfs_wait_for_read(struct netfs_io_request *rreq);</div><div class='add'>+ssize_t netfs_wait_for_write(struct netfs_io_request *rreq);</div><div class='add'>+void netfs_wait_for_paused_read(struct netfs_io_request *rreq);</div><div class='add'>+void netfs_wait_for_paused_write(struct netfs_io_request *rreq);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * objects.c</div><div class='add'>+ */</div><div class='add'>+struct netfs_io_request *netfs_alloc_request(struct address_space *mapping,</div><div class='add'>+					     struct file *file,</div><div class='add'>+					     loff_t start, size_t len,</div><div class='add'>+					     enum netfs_io_origin origin);</div><div class='add'>+void netfs_get_request(struct netfs_io_request *rreq, enum netfs_rreq_ref_trace what);</div><div class='add'>+void netfs_clear_subrequests(struct netfs_io_request *rreq);</div><div class='add'>+void netfs_put_request(struct netfs_io_request *rreq, enum netfs_rreq_ref_trace what);</div><div class='add'>+void netfs_put_failed_request(struct netfs_io_request *rreq);</div><div class='add'>+struct netfs_io_subrequest *netfs_alloc_subrequest(struct netfs_io_request *rreq);</div><div class='add'>+</div><div class='add'>+static inline void netfs_see_request(struct netfs_io_request *rreq,</div><div class='add'>+				     enum netfs_rreq_ref_trace what)</div><div class='add'>+{</div><div class='add'>+	trace_netfs_rreq_ref(rreq-&gt;debug_id, refcount_read(&amp;rreq-&gt;ref), what);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void netfs_see_subrequest(struct netfs_io_subrequest *subreq,</div><div class='add'>+					enum netfs_sreq_ref_trace what)</div><div class='add'>+{</div><div class='add'>+	trace_netfs_sreq_ref(subreq-&gt;rreq-&gt;debug_id, subreq-&gt;debug_index,</div><div class='add'>+			     refcount_read(&amp;subreq-&gt;ref), what);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * read_collect.c</div><div class='add'>+ */</div><div class='add'>+bool netfs_read_collection(struct netfs_io_request *rreq);</div><div class='add'>+void netfs_read_collection_worker(struct work_struct *work);</div><div class='add'>+void netfs_cache_read_terminated(void *priv, ssize_t transferred_or_error);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * read_pgpriv2.c</div><div class='add'>+ */</div><div class='add'>+void netfs_pgpriv2_copy_to_cache(struct netfs_io_request *rreq, struct folio *folio);</div><div class='add'>+void netfs_pgpriv2_end_copy_to_cache(struct netfs_io_request *rreq);</div><div class='add'>+bool netfs_pgpriv2_unlock_copied_folios(struct netfs_io_request *wreq);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * read_retry.c</div><div class='add'>+ */</div><div class='add'>+void netfs_retry_reads(struct netfs_io_request *rreq);</div><div class='add'>+void netfs_unlock_abandoned_read_pages(struct netfs_io_request *rreq);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * stats.c</div><div class='ctx'>  */</div><div class='ctx'> #ifdef CONFIG_NETFS_STATS</div><div class='add'>+extern atomic_t netfs_n_rh_dio_read;</div><div class='ctx'> extern atomic_t netfs_n_rh_readahead;</div><div class='del'>-extern atomic_t netfs_n_rh_readpage;</div><div class='add'>+extern atomic_t netfs_n_rh_read_folio;</div><div class='add'>+extern atomic_t netfs_n_rh_read_single;</div><div class='ctx'> extern atomic_t netfs_n_rh_rreq;</div><div class='ctx'> extern atomic_t netfs_n_rh_sreq;</div><div class='ctx'> extern atomic_t netfs_n_rh_download;</div><div class='hunk'>@@ -38,7 +147,27 @@ extern atomic_t netfs_n_rh_write_begin;</div><div class='ctx'> extern atomic_t netfs_n_rh_write_done;</div><div class='ctx'> extern atomic_t netfs_n_rh_write_failed;</div><div class='ctx'> extern atomic_t netfs_n_rh_write_zskip;</div><div class='add'>+extern atomic_t netfs_n_rh_retry_read_req;</div><div class='add'>+extern atomic_t netfs_n_rh_retry_read_subreq;</div><div class='add'>+extern atomic_t netfs_n_wh_buffered_write;</div><div class='add'>+extern atomic_t netfs_n_wh_writethrough;</div><div class='add'>+extern atomic_t netfs_n_wh_dio_write;</div><div class='add'>+extern atomic_t netfs_n_wh_writepages;</div><div class='add'>+extern atomic_t netfs_n_wh_copy_to_cache;</div><div class='add'>+extern atomic_t netfs_n_wh_wstream_conflict;</div><div class='add'>+extern atomic_t netfs_n_wh_upload;</div><div class='add'>+extern atomic_t netfs_n_wh_upload_done;</div><div class='add'>+extern atomic_t netfs_n_wh_upload_failed;</div><div class='add'>+extern atomic_t netfs_n_wh_write;</div><div class='add'>+extern atomic_t netfs_n_wh_write_done;</div><div class='add'>+extern atomic_t netfs_n_wh_write_failed;</div><div class='add'>+extern atomic_t netfs_n_wh_retry_write_req;</div><div class='add'>+extern atomic_t netfs_n_wh_retry_write_subreq;</div><div class='add'>+extern atomic_t netfs_n_wb_lock_skip;</div><div class='add'>+extern atomic_t netfs_n_wb_lock_wait;</div><div class='add'>+extern atomic_t netfs_n_folioq;</div><div class='ctx'> </div><div class='add'>+int netfs_stats_show(struct seq_file *m, void *v);</div><div class='ctx'> </div><div class='ctx'> static inline void netfs_stat(atomic_t *stat)</div><div class='ctx'> {</div><div class='hunk'>@@ -55,6 +184,261 @@ static inline void netfs_stat_d(atomic_t *stat)</div><div class='ctx'> #define netfs_stat_d(x) do {} while(0)</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * write_collect.c</div><div class='add'>+ */</div><div class='add'>+int netfs_folio_written_back(struct folio *folio);</div><div class='add'>+bool netfs_write_collection(struct netfs_io_request *wreq);</div><div class='add'>+void netfs_write_collection_worker(struct work_struct *work);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * write_issue.c</div><div class='add'>+ */</div><div class='add'>+struct netfs_io_request *netfs_create_write_req(struct address_space *mapping,</div><div class='add'>+						struct file *file,</div><div class='add'>+						loff_t start,</div><div class='add'>+						enum netfs_io_origin origin);</div><div class='add'>+void netfs_reissue_write(struct netfs_io_stream *stream,</div><div class='add'>+			 struct netfs_io_subrequest *subreq,</div><div class='add'>+			 struct iov_iter *source);</div><div class='add'>+void netfs_issue_write(struct netfs_io_request *wreq,</div><div class='add'>+		       struct netfs_io_stream *stream);</div><div class='add'>+size_t netfs_advance_write(struct netfs_io_request *wreq,</div><div class='add'>+			   struct netfs_io_stream *stream,</div><div class='add'>+			   loff_t start, size_t len, bool to_eof);</div><div class='add'>+struct netfs_io_request *netfs_begin_writethrough(struct kiocb *iocb, size_t len);</div><div class='add'>+int netfs_advance_writethrough(struct netfs_io_request *wreq, struct writeback_control *wbc,</div><div class='add'>+			       struct folio *folio, size_t copied, bool to_page_end,</div><div class='add'>+			       struct folio **writethrough_cache);</div><div class='add'>+ssize_t netfs_end_writethrough(struct netfs_io_request *wreq, struct writeback_control *wbc,</div><div class='add'>+			       struct folio *writethrough_cache);</div><div class='add'>+int netfs_unbuffered_write(struct netfs_io_request *wreq, bool may_wait, size_t len);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * write_retry.c</div><div class='add'>+ */</div><div class='add'>+void netfs_retry_writes(struct netfs_io_request *wreq);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Miscellaneous functions.</div><div class='add'>+ */</div><div class='add'>+static inline bool netfs_is_cache_enabled(struct netfs_inode *ctx)</div><div class='add'>+{</div><div class='add'>+#if IS_ENABLED(CONFIG_FSCACHE)</div><div class='add'>+	struct fscache_cookie *cookie = ctx-&gt;cache;</div><div class='add'>+</div><div class='add'>+	return fscache_cookie_valid(cookie) &amp;&amp; cookie-&gt;cache_priv &amp;&amp;</div><div class='add'>+		fscache_cookie_enabled(cookie);</div><div class='add'>+#else</div><div class='add'>+	return false;</div><div class='add'>+#endif</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Get a ref on a netfs group attached to a dirty page (e.g. a ceph snap).</div><div class='add'>+ */</div><div class='add'>+static inline struct netfs_group *netfs_get_group(struct netfs_group *netfs_group)</div><div class='add'>+{</div><div class='add'>+	if (netfs_group &amp;&amp; netfs_group != NETFS_FOLIO_COPY_TO_CACHE)</div><div class='add'>+		refcount_inc(&amp;netfs_group-&gt;ref);</div><div class='add'>+	return netfs_group;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Dispose of a netfs group attached to a dirty page (e.g. a ceph snap).</div><div class='add'>+ */</div><div class='add'>+static inline void netfs_put_group(struct netfs_group *netfs_group)</div><div class='add'>+{</div><div class='add'>+	if (netfs_group &amp;&amp;</div><div class='add'>+	    netfs_group != NETFS_FOLIO_COPY_TO_CACHE &amp;&amp;</div><div class='add'>+	    refcount_dec_and_test(&amp;netfs_group-&gt;ref))</div><div class='add'>+		netfs_group-&gt;free(netfs_group);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Dispose of a netfs group attached to a dirty page (e.g. a ceph snap).</div><div class='add'>+ */</div><div class='add'>+static inline void netfs_put_group_many(struct netfs_group *netfs_group, int nr)</div><div class='add'>+{</div><div class='add'>+	if (netfs_group &amp;&amp;</div><div class='add'>+	    netfs_group != NETFS_FOLIO_COPY_TO_CACHE &amp;&amp;</div><div class='add'>+	    refcount_sub_and_test(nr, &amp;netfs_group-&gt;ref))</div><div class='add'>+		netfs_group-&gt;free(netfs_group);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Clear and wake up a NETFS_RREQ_* flag bit on a request.</div><div class='add'>+ */</div><div class='add'>+static inline void netfs_wake_rreq_flag(struct netfs_io_request *rreq,</div><div class='add'>+					unsigned int rreq_flag,</div><div class='add'>+					enum netfs_rreq_trace trace)</div><div class='add'>+{</div><div class='add'>+	if (test_bit(rreq_flag, &amp;rreq-&gt;flags)) {</div><div class='add'>+		clear_bit_unlock(rreq_flag, &amp;rreq-&gt;flags);</div><div class='add'>+		smp_mb__after_atomic(); /* Set flag before task state */</div><div class='add'>+		trace_netfs_rreq(rreq, trace);</div><div class='add'>+		wake_up(&amp;rreq-&gt;waitq);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Test the NETFS_RREQ_IN_PROGRESS flag, inserting an appropriate barrier.</div><div class='add'>+ */</div><div class='add'>+static inline bool netfs_check_rreq_in_progress(const struct netfs_io_request *rreq)</div><div class='add'>+{</div><div class='add'>+	/* Order read of flags before read of anything else, such as error. */</div><div class='add'>+	return test_bit_acquire(NETFS_RREQ_IN_PROGRESS, &amp;rreq-&gt;flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Test the NETFS_SREQ_IN_PROGRESS flag, inserting an appropriate barrier.</div><div class='add'>+ */</div><div class='add'>+static inline bool netfs_check_subreq_in_progress(const struct netfs_io_subrequest *subreq)</div><div class='add'>+{</div><div class='add'>+	/* Order read of flags before read of anything else, such as error. */</div><div class='add'>+	return test_bit_acquire(NETFS_SREQ_IN_PROGRESS, &amp;subreq-&gt;flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * fscache-cache.c</div><div class='add'>+ */</div><div class='add'>+#ifdef CONFIG_PROC_FS</div><div class='add'>+extern const struct seq_operations fscache_caches_seq_ops;</div><div class='add'>+#endif</div><div class='add'>+bool fscache_begin_cache_access(struct fscache_cache *cache, enum fscache_access_trace why);</div><div class='add'>+void fscache_end_cache_access(struct fscache_cache *cache, enum fscache_access_trace why);</div><div class='add'>+struct fscache_cache *fscache_lookup_cache(const char *name, bool is_cache);</div><div class='add'>+void fscache_put_cache(struct fscache_cache *cache, enum fscache_cache_trace where);</div><div class='add'>+</div><div class='add'>+static inline enum fscache_cache_state fscache_cache_state(const struct fscache_cache *cache)</div><div class='add'>+{</div><div class='add'>+	return smp_load_acquire(&amp;cache-&gt;state);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool fscache_cache_is_live(const struct fscache_cache *cache)</div><div class='add'>+{</div><div class='add'>+	return fscache_cache_state(cache) == FSCACHE_CACHE_IS_ACTIVE;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void fscache_set_cache_state(struct fscache_cache *cache,</div><div class='add'>+					   enum fscache_cache_state new_state)</div><div class='add'>+{</div><div class='add'>+	smp_store_release(&amp;cache-&gt;state, new_state);</div><div class='add'>+</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool fscache_set_cache_state_maybe(struct fscache_cache *cache,</div><div class='add'>+						 enum fscache_cache_state old_state,</div><div class='add'>+						 enum fscache_cache_state new_state)</div><div class='add'>+{</div><div class='add'>+	return try_cmpxchg_release(&amp;cache-&gt;state, &amp;old_state, new_state);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * fscache-cookie.c</div><div class='add'>+ */</div><div class='add'>+extern struct kmem_cache *fscache_cookie_jar;</div><div class='add'>+#ifdef CONFIG_PROC_FS</div><div class='add'>+extern const struct seq_operations fscache_cookies_seq_ops;</div><div class='add'>+#endif</div><div class='add'>+extern struct timer_list fscache_cookie_lru_timer;</div><div class='add'>+</div><div class='add'>+extern void fscache_print_cookie(struct fscache_cookie *cookie, char prefix);</div><div class='add'>+extern bool fscache_begin_cookie_access(struct fscache_cookie *cookie,</div><div class='add'>+					enum fscache_access_trace why);</div><div class='add'>+</div><div class='add'>+static inline void fscache_see_cookie(struct fscache_cookie *cookie,</div><div class='add'>+				      enum fscache_cookie_trace where)</div><div class='add'>+{</div><div class='add'>+	trace_fscache_cookie(cookie-&gt;debug_id, refcount_read(&amp;cookie-&gt;ref),</div><div class='add'>+			     where);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * fscache-main.c</div><div class='add'>+ */</div><div class='add'>+extern unsigned int fscache_hash(unsigned int salt, const void *data, size_t len);</div><div class='add'>+#ifdef CONFIG_FSCACHE</div><div class='add'>+int __init fscache_init(void);</div><div class='add'>+void __exit fscache_exit(void);</div><div class='add'>+#else</div><div class='add'>+static inline int fscache_init(void) { return 0; }</div><div class='add'>+static inline void fscache_exit(void) {}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * fscache-proc.c</div><div class='add'>+ */</div><div class='add'>+#ifdef CONFIG_PROC_FS</div><div class='add'>+extern int __init fscache_proc_init(void);</div><div class='add'>+extern void fscache_proc_cleanup(void);</div><div class='add'>+#else</div><div class='add'>+#define fscache_proc_init()	(0)</div><div class='add'>+#define fscache_proc_cleanup()	do {} while (0)</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * fscache-stats.c</div><div class='add'>+ */</div><div class='add'>+#ifdef CONFIG_FSCACHE_STATS</div><div class='add'>+extern atomic_t fscache_n_volumes;</div><div class='add'>+extern atomic_t fscache_n_volumes_collision;</div><div class='add'>+extern atomic_t fscache_n_volumes_nomem;</div><div class='add'>+extern atomic_t fscache_n_cookies;</div><div class='add'>+extern atomic_t fscache_n_cookies_lru;</div><div class='add'>+extern atomic_t fscache_n_cookies_lru_expired;</div><div class='add'>+extern atomic_t fscache_n_cookies_lru_removed;</div><div class='add'>+extern atomic_t fscache_n_cookies_lru_dropped;</div><div class='add'>+</div><div class='add'>+extern atomic_t fscache_n_acquires;</div><div class='add'>+extern atomic_t fscache_n_acquires_ok;</div><div class='add'>+extern atomic_t fscache_n_acquires_oom;</div><div class='add'>+</div><div class='add'>+extern atomic_t fscache_n_invalidates;</div><div class='add'>+</div><div class='add'>+extern atomic_t fscache_n_relinquishes;</div><div class='add'>+extern atomic_t fscache_n_relinquishes_retire;</div><div class='add'>+extern atomic_t fscache_n_relinquishes_dropped;</div><div class='add'>+</div><div class='add'>+extern atomic_t fscache_n_resizes;</div><div class='add'>+extern atomic_t fscache_n_resizes_null;</div><div class='add'>+</div><div class='add'>+static inline void fscache_stat(atomic_t *stat)</div><div class='add'>+{</div><div class='add'>+	atomic_inc(stat);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void fscache_stat_d(atomic_t *stat)</div><div class='add'>+{</div><div class='add'>+	atomic_dec(stat);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define __fscache_stat(stat) (stat)</div><div class='add'>+</div><div class='add'>+int fscache_stats_show(struct seq_file *m);</div><div class='add'>+#else</div><div class='add'>+</div><div class='add'>+#define __fscache_stat(stat) (NULL)</div><div class='add'>+#define fscache_stat(stat) do {} while (0)</div><div class='add'>+#define fscache_stat_d(stat) do {} while (0)</div><div class='add'>+</div><div class='add'>+static inline int fscache_stats_show(struct seq_file *m) { return 0; }</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * fscache-volume.c</div><div class='add'>+ */</div><div class='add'>+#ifdef CONFIG_PROC_FS</div><div class='add'>+extern const struct seq_operations fscache_volumes_seq_ops;</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+struct fscache_volume *fscache_get_volume(struct fscache_volume *volume,</div><div class='add'>+					  enum fscache_volume_trace where);</div><div class='add'>+bool fscache_begin_volume_access(struct fscache_volume *volume,</div><div class='add'>+				 struct fscache_cookie *cookie,</div><div class='add'>+				 enum fscache_access_trace why);</div><div class='add'>+void fscache_create_volume(struct fscache_volume *volume, bool wait);</div><div class='add'>+</div><div class='ctx'> /*****************************************************************************/</div><div class='ctx'> /*</div><div class='ctx'>  * debug tracing</div><div class='hunk'>@@ -95,3 +479,57 @@ do {						\</div><div class='ctx'> #define _leave(FMT, ...) no_printk("&lt;== %s()"FMT"", __func__, ##__VA_ARGS__)</div><div class='ctx'> #define _debug(FMT, ...) no_printk(FMT, ##__VA_ARGS__)</div><div class='ctx'> #endif</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * assertions</div><div class='add'>+ */</div><div class='add'>+#if 1 /* defined(__KDEBUGALL) */</div><div class='add'>+</div><div class='add'>+#define ASSERT(X)							\</div><div class='add'>+do {									\</div><div class='add'>+	if (unlikely(!(X))) {						\</div><div class='add'>+		pr_err("\n");					\</div><div class='add'>+		pr_err("Assertion failed\n");	\</div><div class='add'>+		BUG();							\</div><div class='add'>+	}								\</div><div class='add'>+} while (0)</div><div class='add'>+</div><div class='add'>+#define ASSERTCMP(X, OP, Y)						\</div><div class='add'>+do {									\</div><div class='add'>+	if (unlikely(!((X) OP (Y)))) {					\</div><div class='add'>+		pr_err("\n");					\</div><div class='add'>+		pr_err("Assertion failed\n");	\</div><div class='add'>+		pr_err("%lx " #OP " %lx is false\n",		\</div><div class='add'>+		       (unsigned long)(X), (unsigned long)(Y));		\</div><div class='add'>+		BUG();							\</div><div class='add'>+	}								\</div><div class='add'>+} while (0)</div><div class='add'>+</div><div class='add'>+#define ASSERTIF(C, X)							\</div><div class='add'>+do {									\</div><div class='add'>+	if (unlikely((C) &amp;&amp; !(X))) {					\</div><div class='add'>+		pr_err("\n");					\</div><div class='add'>+		pr_err("Assertion failed\n");	\</div><div class='add'>+		BUG();							\</div><div class='add'>+	}								\</div><div class='add'>+} while (0)</div><div class='add'>+</div><div class='add'>+#define ASSERTIFCMP(C, X, OP, Y)					\</div><div class='add'>+do {									\</div><div class='add'>+	if (unlikely((C) &amp;&amp; !((X) OP (Y)))) {				\</div><div class='add'>+		pr_err("\n");					\</div><div class='add'>+		pr_err("Assertion failed\n");	\</div><div class='add'>+		pr_err("%lx " #OP " %lx is false\n",		\</div><div class='add'>+		       (unsigned long)(X), (unsigned long)(Y));		\</div><div class='add'>+		BUG();							\</div><div class='add'>+	}								\</div><div class='add'>+} while (0)</div><div class='add'>+</div><div class='add'>+#else</div><div class='add'>+</div><div class='add'>+#define ASSERT(X)			do {} while (0)</div><div class='add'>+#define ASSERTCMP(X, OP, Y)		do {} while (0)</div><div class='add'>+#define ASSERTIF(C, X)			do {} while (0)</div><div class='add'>+#define ASSERTIFCMP(C, X, OP, Y)	do {} while (0)</div><div class='add'>+</div><div class='add'>+#endif /* assert or not */</div><div class='head'>diff --git a/fs/netfs/iterator.c b/fs/netfs/iterator.c<br/>new file mode 100644<br/>index 000000000000..72a435e5fc6d<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/iterator.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/iterator.c</a></div><div class='hunk'>@@ -0,0 +1,250 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='add'>+/* Iterator helpers.</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2022 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/export.h&gt;</div><div class='add'>+#include &lt;linux/slab.h&gt;</div><div class='add'>+#include &lt;linux/mm.h&gt;</div><div class='add'>+#include &lt;linux/uio.h&gt;</div><div class='add'>+#include &lt;linux/scatterlist.h&gt;</div><div class='add'>+#include &lt;linux/netfs.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_extract_user_iter - Extract the pages from a user iterator into a bvec</div><div class='add'>+ * @orig: The original iterator</div><div class='add'>+ * @orig_len: The amount of iterator to copy</div><div class='add'>+ * @new: The iterator to be set up</div><div class='add'>+ * @extraction_flags: Flags to qualify the request</div><div class='add'>+ *</div><div class='add'>+ * Extract the page fragments from the given amount of the source iterator and</div><div class='add'>+ * build up a second iterator that refers to all of those bits.  This allows</div><div class='add'>+ * the original iterator to disposed of.</div><div class='add'>+ *</div><div class='add'>+ * @extraction_flags can have ITER_ALLOW_P2PDMA set to request peer-to-peer DMA be</div><div class='add'>+ * allowed on the pages extracted.</div><div class='add'>+ *</div><div class='add'>+ * On success, the number of elements in the bvec is returned, the original</div><div class='add'>+ * iterator will have been advanced by the amount extracted.</div><div class='add'>+ *</div><div class='add'>+ * The iov_iter_extract_mode() function should be used to query how cleanup</div><div class='add'>+ * should be performed.</div><div class='add'>+ */</div><div class='add'>+ssize_t netfs_extract_user_iter(struct iov_iter *orig, size_t orig_len,</div><div class='add'>+				struct iov_iter *new,</div><div class='add'>+				iov_iter_extraction_t extraction_flags)</div><div class='add'>+{</div><div class='add'>+	struct bio_vec *bv = NULL;</div><div class='add'>+	struct page **pages;</div><div class='add'>+	unsigned int cur_npages;</div><div class='add'>+	unsigned int max_pages;</div><div class='add'>+	unsigned int npages = 0;</div><div class='add'>+	unsigned int i;</div><div class='add'>+	ssize_t ret;</div><div class='add'>+	size_t count = orig_len, offset, len;</div><div class='add'>+	size_t bv_size, pg_size;</div><div class='add'>+</div><div class='add'>+	if (WARN_ON_ONCE(!iter_is_ubuf(orig) &amp;&amp; !iter_is_iovec(orig)))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	max_pages = iov_iter_npages(orig, INT_MAX);</div><div class='add'>+	bv_size = array_size(max_pages, sizeof(*bv));</div><div class='add'>+	bv = kvmalloc(bv_size, GFP_KERNEL);</div><div class='add'>+	if (!bv)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	/* Put the page list at the end of the bvec list storage.  bvec</div><div class='add'>+	 * elements are larger than page pointers, so as long as we work</div><div class='add'>+	 * 0-&gt;last, we should be fine.</div><div class='add'>+	 */</div><div class='add'>+	pg_size = array_size(max_pages, sizeof(*pages));</div><div class='add'>+	pages = (void *)bv + bv_size - pg_size;</div><div class='add'>+</div><div class='add'>+	while (count &amp;&amp; npages &lt; max_pages) {</div><div class='add'>+		ret = iov_iter_extract_pages(orig, &amp;pages, count,</div><div class='add'>+					     max_pages - npages, extraction_flags,</div><div class='add'>+					     &amp;offset);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			pr_err("Couldn't get user pages (rc=%zd)\n", ret);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (ret &gt; count) {</div><div class='add'>+			pr_err("get_pages rc=%zd more than %zu\n", ret, count);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		count -= ret;</div><div class='add'>+		ret += offset;</div><div class='add'>+		cur_npages = DIV_ROUND_UP(ret, PAGE_SIZE);</div><div class='add'>+</div><div class='add'>+		if (npages + cur_npages &gt; max_pages) {</div><div class='add'>+			pr_err("Out of bvec array capacity (%u vs %u)\n",</div><div class='add'>+			       npages + cur_npages, max_pages);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		for (i = 0; i &lt; cur_npages; i++) {</div><div class='add'>+			len = ret &gt; PAGE_SIZE ? PAGE_SIZE : ret;</div><div class='add'>+			bvec_set_page(bv + npages + i, *pages++, len - offset, offset);</div><div class='add'>+			ret -= len;</div><div class='add'>+			offset = 0;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		npages += cur_npages;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	iov_iter_bvec(new, orig-&gt;data_source, bv, npages, orig_len - count);</div><div class='add'>+	return npages;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(netfs_extract_user_iter);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Select the span of a bvec iterator we're going to use.  Limit it by both maximum</div><div class='add'>+ * size and maximum number of segments.  Returns the size of the span in bytes.</div><div class='add'>+ */</div><div class='add'>+static size_t netfs_limit_bvec(const struct iov_iter *iter, size_t start_offset,</div><div class='add'>+			       size_t max_size, size_t max_segs)</div><div class='add'>+{</div><div class='add'>+	const struct bio_vec *bvecs = iter-&gt;bvec;</div><div class='add'>+	unsigned int nbv = iter-&gt;nr_segs, ix = 0, nsegs = 0;</div><div class='add'>+	size_t len, span = 0, n = iter-&gt;count;</div><div class='add'>+	size_t skip = iter-&gt;iov_offset + start_offset;</div><div class='add'>+</div><div class='add'>+	if (WARN_ON(!iov_iter_is_bvec(iter)) ||</div><div class='add'>+	    WARN_ON(start_offset &gt; n) ||</div><div class='add'>+	    n == 0)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	while (n &amp;&amp; ix &lt; nbv &amp;&amp; skip) {</div><div class='add'>+		len = bvecs[ix].bv_len;</div><div class='add'>+		if (skip &lt; len)</div><div class='add'>+			break;</div><div class='add'>+		skip -= len;</div><div class='add'>+		n -= len;</div><div class='add'>+		ix++;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	while (n &amp;&amp; ix &lt; nbv) {</div><div class='add'>+		len = min3(n, bvecs[ix].bv_len - skip, max_size);</div><div class='add'>+		span += len;</div><div class='add'>+		nsegs++;</div><div class='add'>+		ix++;</div><div class='add'>+		if (span &gt;= max_size || nsegs &gt;= max_segs)</div><div class='add'>+			break;</div><div class='add'>+		skip = 0;</div><div class='add'>+		n -= len;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return min(span, max_size);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Select the span of an xarray iterator we're going to use.  Limit it by both</div><div class='add'>+ * maximum size and maximum number of segments.  It is assumed that segments</div><div class='add'>+ * can be larger than a page in size, provided they're physically contiguous.</div><div class='add'>+ * Returns the size of the span in bytes.</div><div class='add'>+ */</div><div class='add'>+static size_t netfs_limit_xarray(const struct iov_iter *iter, size_t start_offset,</div><div class='add'>+				 size_t max_size, size_t max_segs)</div><div class='add'>+{</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	unsigned int nsegs = 0;</div><div class='add'>+	loff_t pos = iter-&gt;xarray_start + iter-&gt;iov_offset;</div><div class='add'>+	pgoff_t index = pos / PAGE_SIZE;</div><div class='add'>+	size_t span = 0, n = iter-&gt;count;</div><div class='add'>+</div><div class='add'>+	XA_STATE(xas, iter-&gt;xarray, index);</div><div class='add'>+</div><div class='add'>+	if (WARN_ON(!iov_iter_is_xarray(iter)) ||</div><div class='add'>+	    WARN_ON(start_offset &gt; n) ||</div><div class='add'>+	    n == 0)</div><div class='add'>+		return 0;</div><div class='add'>+	max_size = min(max_size, n - start_offset);</div><div class='add'>+</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	xas_for_each(&amp;xas, folio, ULONG_MAX) {</div><div class='add'>+		size_t offset, flen, len;</div><div class='add'>+		if (xas_retry(&amp;xas, folio))</div><div class='add'>+			continue;</div><div class='add'>+		if (WARN_ON(xa_is_value(folio)))</div><div class='add'>+			break;</div><div class='add'>+		if (WARN_ON(folio_test_hugetlb(folio)))</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		flen = folio_size(folio);</div><div class='add'>+		offset = offset_in_folio(folio, pos);</div><div class='add'>+		len = min(max_size, flen - offset);</div><div class='add'>+		span += len;</div><div class='add'>+		nsegs++;</div><div class='add'>+		if (span &gt;= max_size || nsegs &gt;= max_segs)</div><div class='add'>+			break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+	return min(span, max_size);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Select the span of a folio queue iterator we're going to use.  Limit it by</div><div class='add'>+ * both maximum size and maximum number of segments.  Returns the size of the</div><div class='add'>+ * span in bytes.</div><div class='add'>+ */</div><div class='add'>+static size_t netfs_limit_folioq(const struct iov_iter *iter, size_t start_offset,</div><div class='add'>+				 size_t max_size, size_t max_segs)</div><div class='add'>+{</div><div class='add'>+	const struct folio_queue *folioq = iter-&gt;folioq;</div><div class='add'>+	unsigned int nsegs = 0;</div><div class='add'>+	unsigned int slot = iter-&gt;folioq_slot;</div><div class='add'>+	size_t span = 0, n = iter-&gt;count;</div><div class='add'>+</div><div class='add'>+	if (WARN_ON(!iov_iter_is_folioq(iter)) ||</div><div class='add'>+	    WARN_ON(start_offset &gt; n) ||</div><div class='add'>+	    n == 0)</div><div class='add'>+		return 0;</div><div class='add'>+	max_size = umin(max_size, n - start_offset);</div><div class='add'>+</div><div class='add'>+	if (slot &gt;= folioq_nr_slots(folioq)) {</div><div class='add'>+		folioq = folioq-&gt;next;</div><div class='add'>+		slot = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	start_offset += iter-&gt;iov_offset;</div><div class='add'>+	do {</div><div class='add'>+		size_t flen = folioq_folio_size(folioq, slot);</div><div class='add'>+</div><div class='add'>+		if (start_offset &lt; flen) {</div><div class='add'>+			span += flen - start_offset;</div><div class='add'>+			nsegs++;</div><div class='add'>+			start_offset = 0;</div><div class='add'>+		} else {</div><div class='add'>+			start_offset -= flen;</div><div class='add'>+		}</div><div class='add'>+		if (span &gt;= max_size || nsegs &gt;= max_segs)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		slot++;</div><div class='add'>+		if (slot &gt;= folioq_nr_slots(folioq)) {</div><div class='add'>+			folioq = folioq-&gt;next;</div><div class='add'>+			slot = 0;</div><div class='add'>+		}</div><div class='add'>+	} while (folioq);</div><div class='add'>+</div><div class='add'>+	return umin(span, max_size);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+size_t netfs_limit_iter(const struct iov_iter *iter, size_t start_offset,</div><div class='add'>+			size_t max_size, size_t max_segs)</div><div class='add'>+{</div><div class='add'>+	if (iov_iter_is_folioq(iter))</div><div class='add'>+		return netfs_limit_folioq(iter, start_offset, max_size, max_segs);</div><div class='add'>+	if (iov_iter_is_bvec(iter))</div><div class='add'>+		return netfs_limit_bvec(iter, start_offset, max_size, max_segs);</div><div class='add'>+	if (iov_iter_is_xarray(iter))</div><div class='add'>+		return netfs_limit_xarray(iter, start_offset, max_size, max_segs);</div><div class='add'>+	BUG();</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_limit_iter);</div><div class='head'>diff --git a/fs/netfs/locking.c b/fs/netfs/locking.c<br/>new file mode 100644<br/>index 000000000000..2249ecd09d0a<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/locking.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/locking.c</a></div><div class='hunk'>@@ -0,0 +1,205 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+/*</div><div class='add'>+ * I/O and data path helper functionality.</div><div class='add'>+ *</div><div class='add'>+ * Borrowed from NFS Copyright (c) 2016 Trond Myklebust</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/kernel.h&gt;</div><div class='add'>+#include &lt;linux/netfs.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * inode_dio_wait_interruptible - wait for outstanding DIO requests to finish</div><div class='add'>+ * @inode: inode to wait for</div><div class='add'>+ *</div><div class='add'>+ * Waits for all pending direct I/O requests to finish so that we can</div><div class='add'>+ * proceed with a truncate or equivalent operation.</div><div class='add'>+ *</div><div class='add'>+ * Must be called under a lock that serializes taking new references</div><div class='add'>+ * to i_dio_count, usually by inode-&gt;i_mutex.</div><div class='add'>+ */</div><div class='add'>+static int netfs_inode_dio_wait_interruptible(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	if (inode_dio_finished(inode))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	inode_dio_wait_interruptible(inode);</div><div class='add'>+	return !inode_dio_finished(inode) ? -ERESTARTSYS : 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Call with exclusively locked inode-&gt;i_rwsem */</div><div class='add'>+static int netfs_block_o_direct(struct netfs_inode *ictx)</div><div class='add'>+{</div><div class='add'>+	if (!test_bit(NETFS_ICTX_ODIRECT, &amp;ictx-&gt;flags))</div><div class='add'>+		return 0;</div><div class='add'>+	clear_bit(NETFS_ICTX_ODIRECT, &amp;ictx-&gt;flags);</div><div class='add'>+	return netfs_inode_dio_wait_interruptible(&amp;ictx-&gt;inode);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_start_io_read - declare the file is being used for buffered reads</div><div class='add'>+ * @inode: file inode</div><div class='add'>+ *</div><div class='add'>+ * Declare that a buffered read operation is about to start, and ensure</div><div class='add'>+ * that we block all direct I/O.</div><div class='add'>+ * On exit, the function ensures that the NETFS_ICTX_ODIRECT flag is unset,</div><div class='add'>+ * and holds a shared lock on inode-&gt;i_rwsem to ensure that the flag</div><div class='add'>+ * cannot be changed.</div><div class='add'>+ * In practice, this means that buffered read operations are allowed to</div><div class='add'>+ * execute in parallel, thanks to the shared lock, whereas direct I/O</div><div class='add'>+ * operations need to wait to grab an exclusive lock in order to set</div><div class='add'>+ * NETFS_ICTX_ODIRECT.</div><div class='add'>+ * Note that buffered writes and truncates both take a write lock on</div><div class='add'>+ * inode-&gt;i_rwsem, meaning that those are serialised w.r.t. the reads.</div><div class='add'>+ */</div><div class='add'>+int netfs_start_io_read(struct inode *inode)</div><div class='add'>+	__acquires(inode-&gt;i_rwsem)</div><div class='add'>+{</div><div class='add'>+	struct netfs_inode *ictx = netfs_inode(inode);</div><div class='add'>+</div><div class='add'>+	/* Be an optimist! */</div><div class='add'>+	if (down_read_interruptible(&amp;inode-&gt;i_rwsem) &lt; 0)</div><div class='add'>+		return -ERESTARTSYS;</div><div class='add'>+	if (test_bit(NETFS_ICTX_ODIRECT, &amp;ictx-&gt;flags) == 0)</div><div class='add'>+		return 0;</div><div class='add'>+	up_read(&amp;inode-&gt;i_rwsem);</div><div class='add'>+</div><div class='add'>+	/* Slow path.... */</div><div class='add'>+	if (down_write_killable(&amp;inode-&gt;i_rwsem) &lt; 0)</div><div class='add'>+		return -ERESTARTSYS;</div><div class='add'>+	if (netfs_block_o_direct(ictx) &lt; 0) {</div><div class='add'>+		up_write(&amp;inode-&gt;i_rwsem);</div><div class='add'>+		return -ERESTARTSYS;</div><div class='add'>+	}</div><div class='add'>+	downgrade_write(&amp;inode-&gt;i_rwsem);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_start_io_read);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_end_io_read - declare that the buffered read operation is done</div><div class='add'>+ * @inode: file inode</div><div class='add'>+ *</div><div class='add'>+ * Declare that a buffered read operation is done, and release the shared</div><div class='add'>+ * lock on inode-&gt;i_rwsem.</div><div class='add'>+ */</div><div class='add'>+void netfs_end_io_read(struct inode *inode)</div><div class='add'>+	__releases(inode-&gt;i_rwsem)</div><div class='add'>+{</div><div class='add'>+	up_read(&amp;inode-&gt;i_rwsem);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_end_io_read);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_start_io_write - declare the file is being used for buffered writes</div><div class='add'>+ * @inode: file inode</div><div class='add'>+ *</div><div class='add'>+ * Declare that a buffered read operation is about to start, and ensure</div><div class='add'>+ * that we block all direct I/O.</div><div class='add'>+ */</div><div class='add'>+int netfs_start_io_write(struct inode *inode)</div><div class='add'>+	__acquires(inode-&gt;i_rwsem)</div><div class='add'>+{</div><div class='add'>+	struct netfs_inode *ictx = netfs_inode(inode);</div><div class='add'>+</div><div class='add'>+	if (down_write_killable(&amp;inode-&gt;i_rwsem) &lt; 0)</div><div class='add'>+		return -ERESTARTSYS;</div><div class='add'>+	if (netfs_block_o_direct(ictx) &lt; 0) {</div><div class='add'>+		up_write(&amp;inode-&gt;i_rwsem);</div><div class='add'>+		return -ERESTARTSYS;</div><div class='add'>+	}</div><div class='add'>+	downgrade_write(&amp;inode-&gt;i_rwsem);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_start_io_write);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_end_io_write - declare that the buffered write operation is done</div><div class='add'>+ * @inode: file inode</div><div class='add'>+ *</div><div class='add'>+ * Declare that a buffered write operation is done, and release the</div><div class='add'>+ * lock on inode-&gt;i_rwsem.</div><div class='add'>+ */</div><div class='add'>+void netfs_end_io_write(struct inode *inode)</div><div class='add'>+	__releases(inode-&gt;i_rwsem)</div><div class='add'>+{</div><div class='add'>+	up_read(&amp;inode-&gt;i_rwsem);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_end_io_write);</div><div class='add'>+</div><div class='add'>+/* Call with exclusively locked inode-&gt;i_rwsem */</div><div class='add'>+static int netfs_block_buffered(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct netfs_inode *ictx = netfs_inode(inode);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (!test_bit(NETFS_ICTX_ODIRECT, &amp;ictx-&gt;flags)) {</div><div class='add'>+		set_bit(NETFS_ICTX_ODIRECT, &amp;ictx-&gt;flags);</div><div class='add'>+		if (inode-&gt;i_mapping-&gt;nrpages != 0) {</div><div class='add'>+			unmap_mapping_range(inode-&gt;i_mapping, 0, 0, 0);</div><div class='add'>+			ret = filemap_fdatawait(inode-&gt;i_mapping);</div><div class='add'>+			if (ret &lt; 0) {</div><div class='add'>+				clear_bit(NETFS_ICTX_ODIRECT, &amp;ictx-&gt;flags);</div><div class='add'>+				return ret;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_start_io_direct - declare the file is being used for direct i/o</div><div class='add'>+ * @inode: file inode</div><div class='add'>+ *</div><div class='add'>+ * Declare that a direct I/O operation is about to start, and ensure</div><div class='add'>+ * that we block all buffered I/O.</div><div class='add'>+ * On exit, the function ensures that the NETFS_ICTX_ODIRECT flag is set,</div><div class='add'>+ * and holds a shared lock on inode-&gt;i_rwsem to ensure that the flag</div><div class='add'>+ * cannot be changed.</div><div class='add'>+ * In practice, this means that direct I/O operations are allowed to</div><div class='add'>+ * execute in parallel, thanks to the shared lock, whereas buffered I/O</div><div class='add'>+ * operations need to wait to grab an exclusive lock in order to clear</div><div class='add'>+ * NETFS_ICTX_ODIRECT.</div><div class='add'>+ * Note that buffered writes and truncates both take a write lock on</div><div class='add'>+ * inode-&gt;i_rwsem, meaning that those are serialised w.r.t. O_DIRECT.</div><div class='add'>+ */</div><div class='add'>+int netfs_start_io_direct(struct inode *inode)</div><div class='add'>+	__acquires(inode-&gt;i_rwsem)</div><div class='add'>+{</div><div class='add'>+	struct netfs_inode *ictx = netfs_inode(inode);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	/* Be an optimist! */</div><div class='add'>+	if (down_read_interruptible(&amp;inode-&gt;i_rwsem) &lt; 0)</div><div class='add'>+		return -ERESTARTSYS;</div><div class='add'>+	if (test_bit(NETFS_ICTX_ODIRECT, &amp;ictx-&gt;flags) != 0)</div><div class='add'>+		return 0;</div><div class='add'>+	up_read(&amp;inode-&gt;i_rwsem);</div><div class='add'>+</div><div class='add'>+	/* Slow path.... */</div><div class='add'>+	if (down_write_killable(&amp;inode-&gt;i_rwsem) &lt; 0)</div><div class='add'>+		return -ERESTARTSYS;</div><div class='add'>+	ret = netfs_block_buffered(inode);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		up_write(&amp;inode-&gt;i_rwsem);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+	downgrade_write(&amp;inode-&gt;i_rwsem);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_start_io_direct);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_end_io_direct - declare that the direct i/o operation is done</div><div class='add'>+ * @inode: file inode</div><div class='add'>+ *</div><div class='add'>+ * Declare that a direct I/O operation is done, and release the shared</div><div class='add'>+ * lock on inode-&gt;i_rwsem.</div><div class='add'>+ */</div><div class='add'>+void netfs_end_io_direct(struct inode *inode)</div><div class='add'>+	__releases(inode-&gt;i_rwsem)</div><div class='add'>+{</div><div class='add'>+	up_read(&amp;inode-&gt;i_rwsem);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_end_io_direct);</div><div class='head'>diff --git a/fs/netfs/main.c b/fs/netfs/main.c<br/>new file mode 100644<br/>index 000000000000..73da6c9f5777<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/main.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/main.c</a></div><div class='hunk'>@@ -0,0 +1,176 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='add'>+/* Miscellaneous bits for the netfs support library.</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2022 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/module.h&gt;</div><div class='add'>+#include &lt;linux/export.h&gt;</div><div class='add'>+#include &lt;linux/mempool.h&gt;</div><div class='add'>+#include &lt;linux/proc_fs.h&gt;</div><div class='add'>+#include &lt;linux/seq_file.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+#define CREATE_TRACE_POINTS</div><div class='add'>+#include &lt;trace/events/netfs.h&gt;</div><div class='add'>+</div><div class='add'>+MODULE_DESCRIPTION("Network fs support");</div><div class='add'>+MODULE_AUTHOR("Red Hat, Inc.");</div><div class='add'>+MODULE_LICENSE("GPL");</div><div class='add'>+</div><div class='add'>+EXPORT_TRACEPOINT_SYMBOL(netfs_sreq);</div><div class='add'>+</div><div class='add'>+unsigned netfs_debug;</div><div class='add'>+module_param_named(debug, netfs_debug, uint, S_IWUSR | S_IRUGO);</div><div class='add'>+MODULE_PARM_DESC(netfs_debug, "Netfs support debugging mask");</div><div class='add'>+</div><div class='add'>+static struct kmem_cache *netfs_request_slab;</div><div class='add'>+static struct kmem_cache *netfs_subrequest_slab;</div><div class='add'>+mempool_t netfs_request_pool;</div><div class='add'>+mempool_t netfs_subrequest_pool;</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_PROC_FS</div><div class='add'>+LIST_HEAD(netfs_io_requests);</div><div class='add'>+DEFINE_SPINLOCK(netfs_proc_lock);</div><div class='add'>+</div><div class='add'>+static const char *netfs_origins[nr__netfs_io_origin] = {</div><div class='add'>+	[NETFS_READAHEAD]		= "RA",</div><div class='add'>+	[NETFS_READPAGE]		= "RP",</div><div class='add'>+	[NETFS_READ_GAPS]		= "RG",</div><div class='add'>+	[NETFS_READ_SINGLE]		= "R1",</div><div class='add'>+	[NETFS_READ_FOR_WRITE]		= "RW",</div><div class='add'>+	[NETFS_UNBUFFERED_READ]		= "UR",</div><div class='add'>+	[NETFS_DIO_READ]		= "DR",</div><div class='add'>+	[NETFS_WRITEBACK]		= "WB",</div><div class='add'>+	[NETFS_WRITEBACK_SINGLE]	= "W1",</div><div class='add'>+	[NETFS_WRITETHROUGH]		= "WT",</div><div class='add'>+	[NETFS_UNBUFFERED_WRITE]	= "UW",</div><div class='add'>+	[NETFS_DIO_WRITE]		= "DW",</div><div class='add'>+	[NETFS_PGPRIV2_COPY_TO_CACHE]	= "2C",</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Generate a list of I/O requests in /proc/fs/netfs/requests</div><div class='add'>+ */</div><div class='add'>+static int netfs_requests_seq_show(struct seq_file *m, void *v)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *rreq;</div><div class='add'>+</div><div class='add'>+	if (v == &amp;netfs_io_requests) {</div><div class='add'>+		seq_puts(m,</div><div class='add'>+			 "REQUEST  OR REF FLAG ERR  OPS COVERAGE\n"</div><div class='add'>+			 "======== == === ==== ==== === =========\n"</div><div class='add'>+			 );</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	rreq = list_entry(v, struct netfs_io_request, proc_link);</div><div class='add'>+	seq_printf(m,</div><div class='add'>+		   "%08x %s %3d %4lx %4ld %3d @%04llx %llx/%llx",</div><div class='add'>+		   rreq-&gt;debug_id,</div><div class='add'>+		   netfs_origins[rreq-&gt;origin],</div><div class='add'>+		   refcount_read(&amp;rreq-&gt;ref),</div><div class='add'>+		   rreq-&gt;flags,</div><div class='add'>+		   rreq-&gt;error,</div><div class='add'>+		   0,</div><div class='add'>+		   rreq-&gt;start, rreq-&gt;submitted, rreq-&gt;len);</div><div class='add'>+	seq_putc(m, '\n');</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void *netfs_requests_seq_start(struct seq_file *m, loff_t *_pos)</div><div class='add'>+	__acquires(rcu)</div><div class='add'>+{</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	return seq_list_start_head(&amp;netfs_io_requests, *_pos);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void *netfs_requests_seq_next(struct seq_file *m, void *v, loff_t *_pos)</div><div class='add'>+{</div><div class='add'>+	return seq_list_next(v, &amp;netfs_io_requests, _pos);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void netfs_requests_seq_stop(struct seq_file *m, void *v)</div><div class='add'>+	__releases(rcu)</div><div class='add'>+{</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct seq_operations netfs_requests_seq_ops = {</div><div class='add'>+	.start  = netfs_requests_seq_start,</div><div class='add'>+	.next   = netfs_requests_seq_next,</div><div class='add'>+	.stop   = netfs_requests_seq_stop,</div><div class='add'>+	.show   = netfs_requests_seq_show,</div><div class='add'>+};</div><div class='add'>+#endif /* CONFIG_PROC_FS */</div><div class='add'>+</div><div class='add'>+static int __init netfs_init(void)</div><div class='add'>+{</div><div class='add'>+	int ret = -ENOMEM;</div><div class='add'>+</div><div class='add'>+	netfs_request_slab = kmem_cache_create("netfs_request",</div><div class='add'>+					       sizeof(struct netfs_io_request), 0,</div><div class='add'>+					       SLAB_HWCACHE_ALIGN | SLAB_ACCOUNT,</div><div class='add'>+					       NULL);</div><div class='add'>+	if (!netfs_request_slab)</div><div class='add'>+		goto error_req;</div><div class='add'>+</div><div class='add'>+	if (mempool_init_slab_pool(&amp;netfs_request_pool, 100, netfs_request_slab) &lt; 0)</div><div class='add'>+		goto error_reqpool;</div><div class='add'>+</div><div class='add'>+	netfs_subrequest_slab = kmem_cache_create("netfs_subrequest",</div><div class='add'>+						  sizeof(struct netfs_io_subrequest) + 16, 0,</div><div class='add'>+						  SLAB_HWCACHE_ALIGN | SLAB_ACCOUNT,</div><div class='add'>+						  NULL);</div><div class='add'>+	if (!netfs_subrequest_slab)</div><div class='add'>+		goto error_subreq;</div><div class='add'>+</div><div class='add'>+	if (mempool_init_slab_pool(&amp;netfs_subrequest_pool, 100, netfs_subrequest_slab) &lt; 0)</div><div class='add'>+		goto error_subreqpool;</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_PROC_FS</div><div class='add'>+	if (!proc_mkdir("fs/netfs", NULL))</div><div class='add'>+		goto error_proc;</div><div class='add'>+	if (!proc_create_seq("fs/netfs/requests", S_IFREG | 0444, NULL,</div><div class='add'>+			     &amp;netfs_requests_seq_ops))</div><div class='add'>+		goto error_procfile;</div><div class='add'>+#endif</div><div class='add'>+#ifdef CONFIG_FSCACHE_STATS</div><div class='add'>+	if (!proc_create_single("fs/netfs/stats", S_IFREG | 0444, NULL,</div><div class='add'>+				netfs_stats_show))</div><div class='add'>+		goto error_procfile;</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+	ret = fscache_init();</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto error_fscache;</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+error_fscache:</div><div class='add'>+#ifdef CONFIG_PROC_FS</div><div class='add'>+error_procfile:</div><div class='add'>+	remove_proc_subtree("fs/netfs", NULL);</div><div class='add'>+error_proc:</div><div class='add'>+#endif</div><div class='add'>+	mempool_exit(&amp;netfs_subrequest_pool);</div><div class='add'>+error_subreqpool:</div><div class='add'>+	kmem_cache_destroy(netfs_subrequest_slab);</div><div class='add'>+error_subreq:</div><div class='add'>+	mempool_exit(&amp;netfs_request_pool);</div><div class='add'>+error_reqpool:</div><div class='add'>+	kmem_cache_destroy(netfs_request_slab);</div><div class='add'>+error_req:</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+fs_initcall(netfs_init);</div><div class='add'>+</div><div class='add'>+static void __exit netfs_exit(void)</div><div class='add'>+{</div><div class='add'>+	fscache_exit();</div><div class='add'>+	remove_proc_subtree("fs/netfs", NULL);</div><div class='add'>+	mempool_exit(&amp;netfs_subrequest_pool);</div><div class='add'>+	kmem_cache_destroy(netfs_subrequest_slab);</div><div class='add'>+	mempool_exit(&amp;netfs_request_pool);</div><div class='add'>+	kmem_cache_destroy(netfs_request_slab);</div><div class='add'>+}</div><div class='add'>+module_exit(netfs_exit);</div><div class='head'>diff --git a/fs/netfs/misc.c b/fs/netfs/misc.c<br/>new file mode 100644<br/>index 000000000000..6df89c92b10b<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/misc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/misc.c</a></div><div class='hunk'>@@ -0,0 +1,546 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-only</div><div class='add'>+/* Miscellaneous routines.</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2023 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/swap.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_alloc_folioq_buffer - Allocate buffer space into a folio queue</div><div class='add'>+ * @mapping: Address space to set on the folio (or NULL).</div><div class='add'>+ * @_buffer: Pointer to the folio queue to add to (may point to a NULL; updated).</div><div class='add'>+ * @_cur_size: Current size of the buffer (updated).</div><div class='add'>+ * @size: Target size of the buffer.</div><div class='add'>+ * @gfp: The allocation constraints.</div><div class='add'>+ */</div><div class='add'>+int netfs_alloc_folioq_buffer(struct address_space *mapping,</div><div class='add'>+			      struct folio_queue **_buffer,</div><div class='add'>+			      size_t *_cur_size, ssize_t size, gfp_t gfp)</div><div class='add'>+{</div><div class='add'>+	struct folio_queue *tail = *_buffer, *p;</div><div class='add'>+</div><div class='add'>+	size = round_up(size, PAGE_SIZE);</div><div class='add'>+	if (*_cur_size &gt;= size)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	if (tail)</div><div class='add'>+		while (tail-&gt;next)</div><div class='add'>+			tail = tail-&gt;next;</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		struct folio *folio;</div><div class='add'>+		int order = 0, slot;</div><div class='add'>+</div><div class='add'>+		if (!tail || folioq_full(tail)) {</div><div class='add'>+			p = netfs_folioq_alloc(0, GFP_NOFS, netfs_trace_folioq_alloc_buffer);</div><div class='add'>+			if (!p)</div><div class='add'>+				return -ENOMEM;</div><div class='add'>+			if (tail) {</div><div class='add'>+				tail-&gt;next = p;</div><div class='add'>+				p-&gt;prev = tail;</div><div class='add'>+			} else {</div><div class='add'>+				*_buffer = p;</div><div class='add'>+			}</div><div class='add'>+			tail = p;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (size - *_cur_size &gt; PAGE_SIZE)</div><div class='add'>+			order = umin(ilog2(size - *_cur_size) - PAGE_SHIFT,</div><div class='add'>+				     MAX_PAGECACHE_ORDER);</div><div class='add'>+</div><div class='add'>+		folio = folio_alloc(gfp, order);</div><div class='add'>+		if (!folio &amp;&amp; order &gt; 0)</div><div class='add'>+			folio = folio_alloc(gfp, 0);</div><div class='add'>+		if (!folio)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+</div><div class='add'>+		folio-&gt;mapping = mapping;</div><div class='add'>+		folio-&gt;index = *_cur_size / PAGE_SIZE;</div><div class='add'>+		trace_netfs_folio(folio, netfs_folio_trace_alloc_buffer);</div><div class='add'>+		slot = folioq_append_mark(tail, folio);</div><div class='add'>+		*_cur_size += folioq_folio_size(tail, slot);</div><div class='add'>+	} while (*_cur_size &lt; size);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_alloc_folioq_buffer);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_free_folioq_buffer - Free a folio queue.</div><div class='add'>+ * @fq: The start of the folio queue to free</div><div class='add'>+ *</div><div class='add'>+ * Free up a chain of folio_queues and, if marked, the marked folios they point</div><div class='add'>+ * to.</div><div class='add'>+ */</div><div class='add'>+void netfs_free_folioq_buffer(struct folio_queue *fq)</div><div class='add'>+{</div><div class='add'>+	struct folio_queue *next;</div><div class='add'>+	struct folio_batch fbatch;</div><div class='add'>+</div><div class='add'>+	folio_batch_init(&amp;fbatch);</div><div class='add'>+</div><div class='add'>+	for (; fq; fq = next) {</div><div class='add'>+		for (int slot = 0; slot &lt; folioq_count(fq); slot++) {</div><div class='add'>+			struct folio *folio = folioq_folio(fq, slot);</div><div class='add'>+</div><div class='add'>+			if (!folio ||</div><div class='add'>+			    !folioq_is_marked(fq, slot))</div><div class='add'>+				continue;</div><div class='add'>+</div><div class='add'>+			trace_netfs_folio(folio, netfs_folio_trace_put);</div><div class='add'>+			if (folio_batch_add(&amp;fbatch, folio))</div><div class='add'>+				folio_batch_release(&amp;fbatch);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		netfs_stat_d(&amp;netfs_n_folioq);</div><div class='add'>+		next = fq-&gt;next;</div><div class='add'>+		kfree(fq);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	folio_batch_release(&amp;fbatch);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_free_folioq_buffer);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Reset the subrequest iterator to refer just to the region remaining to be</div><div class='add'>+ * read.  The iterator may or may not have been advanced by socket ops or</div><div class='add'>+ * extraction ops to an extent that may or may not match the amount actually</div><div class='add'>+ * read.</div><div class='add'>+ */</div><div class='add'>+void netfs_reset_iter(struct netfs_io_subrequest *subreq)</div><div class='add'>+{</div><div class='add'>+	struct iov_iter *io_iter = &amp;subreq-&gt;io_iter;</div><div class='add'>+	size_t remain = subreq-&gt;len - subreq-&gt;transferred;</div><div class='add'>+</div><div class='add'>+	if (io_iter-&gt;count &gt; remain)</div><div class='add'>+		iov_iter_advance(io_iter, io_iter-&gt;count - remain);</div><div class='add'>+	else if (io_iter-&gt;count &lt; remain)</div><div class='add'>+		iov_iter_revert(io_iter, remain - io_iter-&gt;count);</div><div class='add'>+	iov_iter_truncate(&amp;subreq-&gt;io_iter, remain);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_dirty_folio - Mark folio dirty and pin a cache object for writeback</div><div class='add'>+ * @mapping: The mapping the folio belongs to.</div><div class='add'>+ * @folio: The folio being dirtied.</div><div class='add'>+ *</div><div class='add'>+ * Set the dirty flag on a folio and pin an in-use cache object in memory so</div><div class='add'>+ * that writeback can later write to it.  This is intended to be called from</div><div class='add'>+ * the filesystem's -&gt;dirty_folio() method.</div><div class='add'>+ *</div><div class='add'>+ * Return: true if the dirty flag was set on the folio, false otherwise.</div><div class='add'>+ */</div><div class='add'>+bool netfs_dirty_folio(struct address_space *mapping, struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = mapping-&gt;host;</div><div class='add'>+	struct netfs_inode *ictx = netfs_inode(inode);</div><div class='add'>+	struct fscache_cookie *cookie = netfs_i_cookie(ictx);</div><div class='add'>+	bool need_use = false;</div><div class='add'>+</div><div class='add'>+	_enter("");</div><div class='add'>+</div><div class='add'>+	if (!filemap_dirty_folio(mapping, folio))</div><div class='add'>+		return false;</div><div class='add'>+	if (!fscache_cookie_valid(cookie))</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	if (!(inode_state_read_once(inode) &amp; I_PINNING_NETFS_WB)) {</div><div class='add'>+		spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+		if (!(inode_state_read(inode) &amp; I_PINNING_NETFS_WB)) {</div><div class='add'>+			inode_state_set(inode, I_PINNING_NETFS_WB);</div><div class='add'>+			need_use = true;</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+</div><div class='add'>+		if (need_use)</div><div class='add'>+			fscache_use_cookie(cookie, true);</div><div class='add'>+	}</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_dirty_folio);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_unpin_writeback - Unpin writeback resources</div><div class='add'>+ * @inode: The inode on which the cookie resides</div><div class='add'>+ * @wbc: The writeback control</div><div class='add'>+ *</div><div class='add'>+ * Unpin the writeback resources pinned by netfs_dirty_folio().  This is</div><div class='add'>+ * intended to be called as/by the netfs's -&gt;write_inode() method.</div><div class='add'>+ */</div><div class='add'>+int netfs_unpin_writeback(struct inode *inode, struct writeback_control *wbc)</div><div class='add'>+{</div><div class='add'>+	struct fscache_cookie *cookie = netfs_i_cookie(netfs_inode(inode));</div><div class='add'>+</div><div class='add'>+	if (wbc-&gt;unpinned_netfs_wb)</div><div class='add'>+		fscache_unuse_cookie(cookie, NULL, NULL);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_unpin_writeback);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_clear_inode_writeback - Clear writeback resources pinned by an inode</div><div class='add'>+ * @inode: The inode to clean up</div><div class='add'>+ * @aux: Auxiliary data to apply to the inode</div><div class='add'>+ *</div><div class='add'>+ * Clear any writeback resources held by an inode when the inode is evicted.</div><div class='add'>+ * This must be called before clear_inode() is called.</div><div class='add'>+ */</div><div class='add'>+void netfs_clear_inode_writeback(struct inode *inode, const void *aux)</div><div class='add'>+{</div><div class='add'>+	struct fscache_cookie *cookie = netfs_i_cookie(netfs_inode(inode));</div><div class='add'>+</div><div class='add'>+	if (inode_state_read_once(inode) &amp; I_PINNING_NETFS_WB) {</div><div class='add'>+		loff_t i_size = i_size_read(inode);</div><div class='add'>+		fscache_unuse_cookie(cookie, aux, &amp;i_size);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_clear_inode_writeback);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_invalidate_folio - Invalidate or partially invalidate a folio</div><div class='add'>+ * @folio: Folio proposed for release</div><div class='add'>+ * @offset: Offset of the invalidated region</div><div class='add'>+ * @length: Length of the invalidated region</div><div class='add'>+ *</div><div class='add'>+ * Invalidate part or all of a folio for a network filesystem.  The folio will</div><div class='add'>+ * be removed afterwards if the invalidated region covers the entire folio.</div><div class='add'>+ */</div><div class='add'>+void netfs_invalidate_folio(struct folio *folio, size_t offset, size_t length)</div><div class='add'>+{</div><div class='add'>+	struct netfs_folio *finfo;</div><div class='add'>+	struct netfs_inode *ctx = netfs_inode(folio_inode(folio));</div><div class='add'>+	size_t flen = folio_size(folio);</div><div class='add'>+</div><div class='add'>+	_enter("{%lx},%zx,%zx", folio-&gt;index, offset, length);</div><div class='add'>+</div><div class='add'>+	if (offset == 0 &amp;&amp; length == flen) {</div><div class='add'>+		unsigned long long i_size = i_size_read(&amp;ctx-&gt;inode);</div><div class='add'>+		unsigned long long fpos = folio_pos(folio), end;</div><div class='add'>+</div><div class='add'>+		end = umin(fpos + flen, i_size);</div><div class='add'>+		if (fpos &lt; i_size &amp;&amp; end &gt; ctx-&gt;zero_point)</div><div class='add'>+			ctx-&gt;zero_point = end;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	folio_wait_private_2(folio); /* [DEPRECATED] */</div><div class='add'>+</div><div class='add'>+	if (!folio_test_private(folio))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	finfo = netfs_folio_info(folio);</div><div class='add'>+</div><div class='add'>+	if (offset == 0 &amp;&amp; length &gt;= flen)</div><div class='add'>+		goto erase_completely;</div><div class='add'>+</div><div class='add'>+	if (finfo) {</div><div class='add'>+		/* We have a partially uptodate page from a streaming write. */</div><div class='add'>+		unsigned int fstart = finfo-&gt;dirty_offset;</div><div class='add'>+		unsigned int fend = fstart + finfo-&gt;dirty_len;</div><div class='add'>+		unsigned int iend = offset + length;</div><div class='add'>+</div><div class='add'>+		if (offset &gt;= fend)</div><div class='add'>+			return;</div><div class='add'>+		if (iend &lt;= fstart)</div><div class='add'>+			return;</div><div class='add'>+</div><div class='add'>+		/* The invalidation region overlaps the data.  If the region</div><div class='add'>+		 * covers the start of the data, we either move along the start</div><div class='add'>+		 * or just erase the data entirely.</div><div class='add'>+		 */</div><div class='add'>+		if (offset &lt;= fstart) {</div><div class='add'>+			if (iend &gt;= fend)</div><div class='add'>+				goto erase_completely;</div><div class='add'>+			/* Move the start of the data. */</div><div class='add'>+			finfo-&gt;dirty_len = fend - iend;</div><div class='add'>+			finfo-&gt;dirty_offset = offset;</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* Reduce the length of the data if the invalidation region</div><div class='add'>+		 * covers the tail part.</div><div class='add'>+		 */</div><div class='add'>+		if (iend &gt;= fend) {</div><div class='add'>+			finfo-&gt;dirty_len = offset - fstart;</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* A partial write was split.  The caller has already zeroed</div><div class='add'>+		 * it, so just absorb the hole.</div><div class='add'>+		 */</div><div class='add'>+	}</div><div class='add'>+	return;</div><div class='add'>+</div><div class='add'>+erase_completely:</div><div class='add'>+	netfs_put_group(netfs_folio_group(folio));</div><div class='add'>+	folio_detach_private(folio);</div><div class='add'>+	folio_clear_uptodate(folio);</div><div class='add'>+	kfree(finfo);</div><div class='add'>+	return;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_invalidate_folio);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_release_folio - Try to release a folio</div><div class='add'>+ * @folio: Folio proposed for release</div><div class='add'>+ * @gfp: Flags qualifying the release</div><div class='add'>+ *</div><div class='add'>+ * Request release of a folio and clean up its private state if it's not busy.</div><div class='add'>+ * Returns true if the folio can now be released, false if not</div><div class='add'>+ */</div><div class='add'>+bool netfs_release_folio(struct folio *folio, gfp_t gfp)</div><div class='add'>+{</div><div class='add'>+	struct netfs_inode *ctx = netfs_inode(folio_inode(folio));</div><div class='add'>+	unsigned long long end;</div><div class='add'>+</div><div class='add'>+	if (folio_test_dirty(folio))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	end = umin(folio_next_pos(folio), i_size_read(&amp;ctx-&gt;inode));</div><div class='add'>+	if (end &gt; ctx-&gt;zero_point)</div><div class='add'>+		ctx-&gt;zero_point = end;</div><div class='add'>+</div><div class='add'>+	if (folio_test_private(folio))</div><div class='add'>+		return false;</div><div class='add'>+	if (unlikely(folio_test_private_2(folio))) { /* [DEPRECATED] */</div><div class='add'>+		if (current_is_kswapd() || !(gfp &amp; __GFP_FS))</div><div class='add'>+			return false;</div><div class='add'>+		folio_wait_private_2(folio);</div><div class='add'>+	}</div><div class='add'>+	fscache_note_page_release(netfs_i_cookie(ctx));</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_release_folio);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Wake the collection work item.</div><div class='add'>+ */</div><div class='add'>+void netfs_wake_collector(struct netfs_io_request *rreq)</div><div class='add'>+{</div><div class='add'>+	if (test_bit(NETFS_RREQ_OFFLOAD_COLLECTION, &amp;rreq-&gt;flags) &amp;&amp;</div><div class='add'>+	    !test_bit(NETFS_RREQ_RETRYING, &amp;rreq-&gt;flags)) {</div><div class='add'>+		queue_work(system_dfl_wq, &amp;rreq-&gt;work);</div><div class='add'>+	} else {</div><div class='add'>+		trace_netfs_rreq(rreq, netfs_rreq_trace_wake_queue);</div><div class='add'>+		wake_up(&amp;rreq-&gt;waitq);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Mark a subrequest as no longer being in progress and, if need be, wake the</div><div class='add'>+ * collector.</div><div class='add'>+ */</div><div class='add'>+void netfs_subreq_clear_in_progress(struct netfs_io_subrequest *subreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *rreq = subreq-&gt;rreq;</div><div class='add'>+	struct netfs_io_stream *stream = &amp;rreq-&gt;io_streams[subreq-&gt;stream_nr];</div><div class='add'>+</div><div class='add'>+	clear_bit_unlock(NETFS_SREQ_IN_PROGRESS, &amp;subreq-&gt;flags);</div><div class='add'>+	smp_mb__after_atomic(); /* Clear IN_PROGRESS before task state */</div><div class='add'>+</div><div class='add'>+	/* If we are at the head of the queue, wake up the collector. */</div><div class='add'>+	if (list_is_first(&amp;subreq-&gt;rreq_link, &amp;stream-&gt;subrequests) ||</div><div class='add'>+	    test_bit(NETFS_RREQ_RETRYING, &amp;rreq-&gt;flags))</div><div class='add'>+		netfs_wake_collector(rreq);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Wait for all outstanding I/O in a stream to quiesce.</div><div class='add'>+ */</div><div class='add'>+void netfs_wait_for_in_progress_stream(struct netfs_io_request *rreq,</div><div class='add'>+				       struct netfs_io_stream *stream)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_subrequest *subreq;</div><div class='add'>+	DEFINE_WAIT(myself);</div><div class='add'>+</div><div class='add'>+	list_for_each_entry(subreq, &amp;stream-&gt;subrequests, rreq_link) {</div><div class='add'>+		if (!netfs_check_subreq_in_progress(subreq))</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		trace_netfs_rreq(rreq, netfs_rreq_trace_wait_quiesce);</div><div class='add'>+		for (;;) {</div><div class='add'>+			prepare_to_wait(&amp;rreq-&gt;waitq, &amp;myself, TASK_UNINTERRUPTIBLE);</div><div class='add'>+</div><div class='add'>+			if (!netfs_check_subreq_in_progress(subreq))</div><div class='add'>+				break;</div><div class='add'>+</div><div class='add'>+			trace_netfs_sreq(subreq, netfs_sreq_trace_wait_for);</div><div class='add'>+			schedule();</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	trace_netfs_rreq(rreq, netfs_rreq_trace_waited_quiesce);</div><div class='add'>+	finish_wait(&amp;rreq-&gt;waitq, &amp;myself);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Perform collection in app thread if not offloaded to workqueue.</div><div class='add'>+ */</div><div class='add'>+static int netfs_collect_in_app(struct netfs_io_request *rreq,</div><div class='add'>+				bool (*collector)(struct netfs_io_request *rreq))</div><div class='add'>+{</div><div class='add'>+	bool need_collect = false, inactive = true, done = true;</div><div class='add'>+</div><div class='add'>+	if (!netfs_check_rreq_in_progress(rreq)) {</div><div class='add'>+		trace_netfs_rreq(rreq, netfs_rreq_trace_recollect);</div><div class='add'>+		return 1; /* Done */</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for (int i = 0; i &lt; NR_IO_STREAMS; i++) {</div><div class='add'>+		struct netfs_io_subrequest *subreq;</div><div class='add'>+		struct netfs_io_stream *stream = &amp;rreq-&gt;io_streams[i];</div><div class='add'>+</div><div class='add'>+		if (!stream-&gt;active)</div><div class='add'>+			continue;</div><div class='add'>+		inactive = false;</div><div class='add'>+		trace_netfs_collect_stream(rreq, stream);</div><div class='add'>+		subreq = list_first_entry_or_null(&amp;stream-&gt;subrequests,</div><div class='add'>+						  struct netfs_io_subrequest,</div><div class='add'>+						  rreq_link);</div><div class='add'>+		if (subreq &amp;&amp;</div><div class='add'>+		    (!netfs_check_subreq_in_progress(subreq) ||</div><div class='add'>+		     test_bit(NETFS_SREQ_MADE_PROGRESS, &amp;subreq-&gt;flags))) {</div><div class='add'>+			need_collect = true;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		if (subreq || !test_bit(NETFS_RREQ_ALL_QUEUED, &amp;rreq-&gt;flags))</div><div class='add'>+			done = false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!need_collect &amp;&amp; !inactive &amp;&amp; !done)</div><div class='add'>+		return 0; /* Sleep */</div><div class='add'>+</div><div class='add'>+	__set_current_state(TASK_RUNNING);</div><div class='add'>+	if (collector(rreq)) {</div><div class='add'>+		/* Drop the ref from the NETFS_RREQ_IN_PROGRESS flag. */</div><div class='add'>+		netfs_put_request(rreq, netfs_rreq_trace_put_work_ip);</div><div class='add'>+		return 1; /* Done */</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (inactive) {</div><div class='add'>+		WARN(true, "Failed to collect inactive req R=%08x\n",</div><div class='add'>+		     rreq-&gt;debug_id);</div><div class='add'>+		cond_resched();</div><div class='add'>+	}</div><div class='add'>+	return 2; /* Again */</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Wait for a request to complete, successfully or otherwise.</div><div class='add'>+ */</div><div class='add'>+static ssize_t netfs_wait_for_in_progress(struct netfs_io_request *rreq,</div><div class='add'>+					  bool (*collector)(struct netfs_io_request *rreq))</div><div class='add'>+{</div><div class='add'>+	DEFINE_WAIT(myself);</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	for (;;) {</div><div class='add'>+		prepare_to_wait(&amp;rreq-&gt;waitq, &amp;myself, TASK_UNINTERRUPTIBLE);</div><div class='add'>+</div><div class='add'>+		if (!test_bit(NETFS_RREQ_OFFLOAD_COLLECTION, &amp;rreq-&gt;flags)) {</div><div class='add'>+			switch (netfs_collect_in_app(rreq, collector)) {</div><div class='add'>+			case 0:</div><div class='add'>+				break;</div><div class='add'>+			case 1:</div><div class='add'>+				goto all_collected;</div><div class='add'>+			case 2:</div><div class='add'>+				if (!netfs_check_rreq_in_progress(rreq))</div><div class='add'>+					break;</div><div class='add'>+				cond_resched();</div><div class='add'>+				continue;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (!netfs_check_rreq_in_progress(rreq))</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		trace_netfs_rreq(rreq, netfs_rreq_trace_wait_ip);</div><div class='add'>+		schedule();</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+all_collected:</div><div class='add'>+	trace_netfs_rreq(rreq, netfs_rreq_trace_waited_ip);</div><div class='add'>+	finish_wait(&amp;rreq-&gt;waitq, &amp;myself);</div><div class='add'>+</div><div class='add'>+	ret = rreq-&gt;error;</div><div class='add'>+	if (ret == 0) {</div><div class='add'>+		ret = rreq-&gt;transferred;</div><div class='add'>+		switch (rreq-&gt;origin) {</div><div class='add'>+		case NETFS_DIO_READ:</div><div class='add'>+		case NETFS_DIO_WRITE:</div><div class='add'>+		case NETFS_READ_SINGLE:</div><div class='add'>+		case NETFS_UNBUFFERED_READ:</div><div class='add'>+		case NETFS_UNBUFFERED_WRITE:</div><div class='add'>+			break;</div><div class='add'>+		default:</div><div class='add'>+			if (rreq-&gt;submitted &lt; rreq-&gt;len) {</div><div class='add'>+				trace_netfs_failure(rreq, NULL, ret, netfs_fail_short_read);</div><div class='add'>+				ret = -EIO;</div><div class='add'>+			}</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+ssize_t netfs_wait_for_read(struct netfs_io_request *rreq)</div><div class='add'>+{</div><div class='add'>+	return netfs_wait_for_in_progress(rreq, netfs_read_collection);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+ssize_t netfs_wait_for_write(struct netfs_io_request *rreq)</div><div class='add'>+{</div><div class='add'>+	return netfs_wait_for_in_progress(rreq, netfs_write_collection);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Wait for a paused operation to unpause or complete in some manner.</div><div class='add'>+ */</div><div class='add'>+static void netfs_wait_for_pause(struct netfs_io_request *rreq,</div><div class='add'>+				 bool (*collector)(struct netfs_io_request *rreq))</div><div class='add'>+{</div><div class='add'>+	DEFINE_WAIT(myself);</div><div class='add'>+</div><div class='add'>+	for (;;) {</div><div class='add'>+		trace_netfs_rreq(rreq, netfs_rreq_trace_wait_pause);</div><div class='add'>+		prepare_to_wait(&amp;rreq-&gt;waitq, &amp;myself, TASK_UNINTERRUPTIBLE);</div><div class='add'>+</div><div class='add'>+		if (!test_bit(NETFS_RREQ_OFFLOAD_COLLECTION, &amp;rreq-&gt;flags)) {</div><div class='add'>+			switch (netfs_collect_in_app(rreq, collector)) {</div><div class='add'>+			case 0:</div><div class='add'>+				break;</div><div class='add'>+			case 1:</div><div class='add'>+				goto all_collected;</div><div class='add'>+			case 2:</div><div class='add'>+				if (!netfs_check_rreq_in_progress(rreq) ||</div><div class='add'>+				    !test_bit(NETFS_RREQ_PAUSE, &amp;rreq-&gt;flags))</div><div class='add'>+					break;</div><div class='add'>+				cond_resched();</div><div class='add'>+				continue;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (!netfs_check_rreq_in_progress(rreq) ||</div><div class='add'>+		    !test_bit(NETFS_RREQ_PAUSE, &amp;rreq-&gt;flags))</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		schedule();</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+all_collected:</div><div class='add'>+	trace_netfs_rreq(rreq, netfs_rreq_trace_waited_pause);</div><div class='add'>+	finish_wait(&amp;rreq-&gt;waitq, &amp;myself);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void netfs_wait_for_paused_read(struct netfs_io_request *rreq)</div><div class='add'>+{</div><div class='add'>+	return netfs_wait_for_pause(rreq, netfs_read_collection);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void netfs_wait_for_paused_write(struct netfs_io_request *rreq)</div><div class='add'>+{</div><div class='add'>+	return netfs_wait_for_pause(rreq, netfs_write_collection);</div><div class='add'>+}</div><div class='head'>diff --git a/fs/netfs/objects.c b/fs/netfs/objects.c<br/>new file mode 100644<br/>index 000000000000..b8c4918d3dcd<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/objects.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/objects.c</a></div><div class='hunk'>@@ -0,0 +1,256 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-only</div><div class='add'>+/* Object lifetime handling and tracing.</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2022 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/slab.h&gt;</div><div class='add'>+#include &lt;linux/mempool.h&gt;</div><div class='add'>+#include &lt;linux/delay.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+static void netfs_free_request(struct work_struct *work);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Allocate an I/O request and initialise it.</div><div class='add'>+ */</div><div class='add'>+struct netfs_io_request *netfs_alloc_request(struct address_space *mapping,</div><div class='add'>+					     struct file *file,</div><div class='add'>+					     loff_t start, size_t len,</div><div class='add'>+					     enum netfs_io_origin origin)</div><div class='add'>+{</div><div class='add'>+	static atomic_t debug_ids;</div><div class='add'>+	struct inode *inode = file ? file_inode(file) : mapping-&gt;host;</div><div class='add'>+	struct netfs_inode *ctx = netfs_inode(inode);</div><div class='add'>+	struct netfs_io_request *rreq;</div><div class='add'>+	mempool_t *mempool = ctx-&gt;ops-&gt;request_pool ?: &amp;netfs_request_pool;</div><div class='add'>+	struct kmem_cache *cache = mempool-&gt;pool_data;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	for (;;) {</div><div class='add'>+		rreq = mempool_alloc(mempool, GFP_KERNEL);</div><div class='add'>+		if (rreq)</div><div class='add'>+			break;</div><div class='add'>+		msleep(10);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	memset(rreq, 0, kmem_cache_size(cache));</div><div class='add'>+	INIT_WORK(&amp;rreq-&gt;cleanup_work, netfs_free_request);</div><div class='add'>+	rreq-&gt;start	= start;</div><div class='add'>+	rreq-&gt;len	= len;</div><div class='add'>+	rreq-&gt;origin	= origin;</div><div class='add'>+	rreq-&gt;netfs_ops	= ctx-&gt;ops;</div><div class='add'>+	rreq-&gt;mapping	= mapping;</div><div class='add'>+	rreq-&gt;inode	= inode;</div><div class='add'>+	rreq-&gt;i_size	= i_size_read(inode);</div><div class='add'>+	rreq-&gt;debug_id	= atomic_inc_return(&amp;debug_ids);</div><div class='add'>+	rreq-&gt;wsize	= INT_MAX;</div><div class='add'>+	rreq-&gt;io_streams[0].sreq_max_len = ULONG_MAX;</div><div class='add'>+	rreq-&gt;io_streams[0].sreq_max_segs = 0;</div><div class='add'>+	spin_lock_init(&amp;rreq-&gt;lock);</div><div class='add'>+	INIT_LIST_HEAD(&amp;rreq-&gt;io_streams[0].subrequests);</div><div class='add'>+	INIT_LIST_HEAD(&amp;rreq-&gt;io_streams[1].subrequests);</div><div class='add'>+	init_waitqueue_head(&amp;rreq-&gt;waitq);</div><div class='add'>+	refcount_set(&amp;rreq-&gt;ref, 2);</div><div class='add'>+</div><div class='add'>+	if (origin == NETFS_READAHEAD ||</div><div class='add'>+	    origin == NETFS_READPAGE ||</div><div class='add'>+	    origin == NETFS_READ_GAPS ||</div><div class='add'>+	    origin == NETFS_READ_SINGLE ||</div><div class='add'>+	    origin == NETFS_READ_FOR_WRITE ||</div><div class='add'>+	    origin == NETFS_UNBUFFERED_READ ||</div><div class='add'>+	    origin == NETFS_DIO_READ) {</div><div class='add'>+		INIT_WORK(&amp;rreq-&gt;work, netfs_read_collection_worker);</div><div class='add'>+		rreq-&gt;io_streams[0].avail = true;</div><div class='add'>+	} else {</div><div class='add'>+		INIT_WORK(&amp;rreq-&gt;work, netfs_write_collection_worker);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	__set_bit(NETFS_RREQ_IN_PROGRESS, &amp;rreq-&gt;flags);</div><div class='add'>+	if (rreq-&gt;netfs_ops-&gt;init_request) {</div><div class='add'>+		ret = rreq-&gt;netfs_ops-&gt;init_request(rreq, file);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			mempool_free(rreq, rreq-&gt;netfs_ops-&gt;request_pool ?: &amp;netfs_request_pool);</div><div class='add'>+			return ERR_PTR(ret);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	atomic_inc(&amp;ctx-&gt;io_count);</div><div class='add'>+	trace_netfs_rreq_ref(rreq-&gt;debug_id, refcount_read(&amp;rreq-&gt;ref), netfs_rreq_trace_new);</div><div class='add'>+	netfs_proc_add_rreq(rreq);</div><div class='add'>+	netfs_stat(&amp;netfs_n_rh_rreq);</div><div class='add'>+	return rreq;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void netfs_get_request(struct netfs_io_request *rreq, enum netfs_rreq_ref_trace what)</div><div class='add'>+{</div><div class='add'>+	int r;</div><div class='add'>+</div><div class='add'>+	__refcount_inc(&amp;rreq-&gt;ref, &amp;r);</div><div class='add'>+	trace_netfs_rreq_ref(rreq-&gt;debug_id, r + 1, what);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void netfs_clear_subrequests(struct netfs_io_request *rreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_subrequest *subreq;</div><div class='add'>+	struct netfs_io_stream *stream;</div><div class='add'>+	int s;</div><div class='add'>+</div><div class='add'>+	for (s = 0; s &lt; ARRAY_SIZE(rreq-&gt;io_streams); s++) {</div><div class='add'>+		stream = &amp;rreq-&gt;io_streams[s];</div><div class='add'>+		while (!list_empty(&amp;stream-&gt;subrequests)) {</div><div class='add'>+			subreq = list_first_entry(&amp;stream-&gt;subrequests,</div><div class='add'>+						  struct netfs_io_subrequest, rreq_link);</div><div class='add'>+			list_del(&amp;subreq-&gt;rreq_link);</div><div class='add'>+			netfs_put_subrequest(subreq, netfs_sreq_trace_put_clear);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void netfs_free_request_rcu(struct rcu_head *rcu)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *rreq = container_of(rcu, struct netfs_io_request, rcu);</div><div class='add'>+</div><div class='add'>+	mempool_free(rreq, rreq-&gt;netfs_ops-&gt;request_pool ?: &amp;netfs_request_pool);</div><div class='add'>+	netfs_stat_d(&amp;netfs_n_rh_rreq);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void netfs_deinit_request(struct netfs_io_request *rreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_inode *ictx = netfs_inode(rreq-&gt;inode);</div><div class='add'>+	unsigned int i;</div><div class='add'>+</div><div class='add'>+	trace_netfs_rreq(rreq, netfs_rreq_trace_free);</div><div class='add'>+</div><div class='add'>+	/* Cancel/flush the result collection worker.  That does not carry a</div><div class='add'>+	 * ref of its own, so we must wait for it somewhere.</div><div class='add'>+	 */</div><div class='add'>+	cancel_work_sync(&amp;rreq-&gt;work);</div><div class='add'>+</div><div class='add'>+	netfs_proc_del_rreq(rreq);</div><div class='add'>+	netfs_clear_subrequests(rreq);</div><div class='add'>+	if (rreq-&gt;netfs_ops-&gt;free_request)</div><div class='add'>+		rreq-&gt;netfs_ops-&gt;free_request(rreq);</div><div class='add'>+	if (rreq-&gt;cache_resources.ops)</div><div class='add'>+		rreq-&gt;cache_resources.ops-&gt;end_operation(&amp;rreq-&gt;cache_resources);</div><div class='add'>+	if (rreq-&gt;direct_bv) {</div><div class='add'>+		for (i = 0; i &lt; rreq-&gt;direct_bv_count; i++) {</div><div class='add'>+			if (rreq-&gt;direct_bv[i].bv_page) {</div><div class='add'>+				if (rreq-&gt;direct_bv_unpin)</div><div class='add'>+					unpin_user_page(rreq-&gt;direct_bv[i].bv_page);</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+		kvfree(rreq-&gt;direct_bv);</div><div class='add'>+	}</div><div class='add'>+	rolling_buffer_clear(&amp;rreq-&gt;buffer);</div><div class='add'>+</div><div class='add'>+	if (atomic_dec_and_test(&amp;ictx-&gt;io_count))</div><div class='add'>+		wake_up_var(&amp;ictx-&gt;io_count);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void netfs_free_request(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *rreq =</div><div class='add'>+		container_of(work, struct netfs_io_request, cleanup_work);</div><div class='add'>+</div><div class='add'>+	netfs_deinit_request(rreq);</div><div class='add'>+	call_rcu(&amp;rreq-&gt;rcu, netfs_free_request_rcu);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void netfs_put_request(struct netfs_io_request *rreq, enum netfs_rreq_ref_trace what)</div><div class='add'>+{</div><div class='add'>+	unsigned int debug_id;</div><div class='add'>+	bool dead;</div><div class='add'>+	int r;</div><div class='add'>+</div><div class='add'>+	if (rreq) {</div><div class='add'>+		debug_id = rreq-&gt;debug_id;</div><div class='add'>+		dead = __refcount_dec_and_test(&amp;rreq-&gt;ref, &amp;r);</div><div class='add'>+		trace_netfs_rreq_ref(debug_id, r - 1, what);</div><div class='add'>+		if (dead)</div><div class='add'>+			WARN_ON(!queue_work(system_dfl_wq, &amp;rreq-&gt;cleanup_work));</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Free a request (synchronously) that was just allocated but has</div><div class='add'>+ * failed before it could be submitted.</div><div class='add'>+ */</div><div class='add'>+void netfs_put_failed_request(struct netfs_io_request *rreq)</div><div class='add'>+{</div><div class='add'>+	int r = refcount_read(&amp;rreq-&gt;ref);</div><div class='add'>+</div><div class='add'>+	/* new requests have two references (see</div><div class='add'>+	 * netfs_alloc_request(), and this function is only allowed on</div><div class='add'>+	 * new request objects</div><div class='add'>+	 */</div><div class='add'>+	WARN_ON_ONCE(r != 2);</div><div class='add'>+</div><div class='add'>+	trace_netfs_rreq_ref(rreq-&gt;debug_id, r, netfs_rreq_trace_put_failed);</div><div class='add'>+	netfs_free_request(&amp;rreq-&gt;cleanup_work);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Allocate and partially initialise an I/O request structure.</div><div class='add'>+ */</div><div class='add'>+struct netfs_io_subrequest *netfs_alloc_subrequest(struct netfs_io_request *rreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_subrequest *subreq;</div><div class='add'>+	mempool_t *mempool = rreq-&gt;netfs_ops-&gt;subrequest_pool ?: &amp;netfs_subrequest_pool;</div><div class='add'>+	struct kmem_cache *cache = mempool-&gt;pool_data;</div><div class='add'>+</div><div class='add'>+	for (;;) {</div><div class='add'>+		subreq = mempool_alloc(rreq-&gt;netfs_ops-&gt;subrequest_pool ?: &amp;netfs_subrequest_pool,</div><div class='add'>+				       GFP_KERNEL);</div><div class='add'>+		if (subreq)</div><div class='add'>+			break;</div><div class='add'>+		msleep(10);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	memset(subreq, 0, kmem_cache_size(cache));</div><div class='add'>+	INIT_WORK(&amp;subreq-&gt;work, NULL);</div><div class='add'>+	INIT_LIST_HEAD(&amp;subreq-&gt;rreq_link);</div><div class='add'>+	refcount_set(&amp;subreq-&gt;ref, 2);</div><div class='add'>+	subreq-&gt;rreq = rreq;</div><div class='add'>+	subreq-&gt;debug_index = atomic_inc_return(&amp;rreq-&gt;subreq_counter);</div><div class='add'>+	netfs_get_request(rreq, netfs_rreq_trace_get_subreq);</div><div class='add'>+	netfs_stat(&amp;netfs_n_rh_sreq);</div><div class='add'>+	return subreq;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void netfs_get_subrequest(struct netfs_io_subrequest *subreq,</div><div class='add'>+			  enum netfs_sreq_ref_trace what)</div><div class='add'>+{</div><div class='add'>+	int r;</div><div class='add'>+</div><div class='add'>+	__refcount_inc(&amp;subreq-&gt;ref, &amp;r);</div><div class='add'>+	trace_netfs_sreq_ref(subreq-&gt;rreq-&gt;debug_id, subreq-&gt;debug_index, r + 1,</div><div class='add'>+			     what);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void netfs_free_subrequest(struct netfs_io_subrequest *subreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *rreq = subreq-&gt;rreq;</div><div class='add'>+</div><div class='add'>+	trace_netfs_sreq(subreq, netfs_sreq_trace_free);</div><div class='add'>+	if (rreq-&gt;netfs_ops-&gt;free_subrequest)</div><div class='add'>+		rreq-&gt;netfs_ops-&gt;free_subrequest(subreq);</div><div class='add'>+	mempool_free(subreq, rreq-&gt;netfs_ops-&gt;subrequest_pool ?: &amp;netfs_subrequest_pool);</div><div class='add'>+	netfs_stat_d(&amp;netfs_n_rh_sreq);</div><div class='add'>+	netfs_put_request(rreq, netfs_rreq_trace_put_subreq);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void netfs_put_subrequest(struct netfs_io_subrequest *subreq,</div><div class='add'>+			  enum netfs_sreq_ref_trace what)</div><div class='add'>+{</div><div class='add'>+	unsigned int debug_index = subreq-&gt;debug_index;</div><div class='add'>+	unsigned int debug_id = subreq-&gt;rreq-&gt;debug_id;</div><div class='add'>+	bool dead;</div><div class='add'>+	int r;</div><div class='add'>+</div><div class='add'>+	dead = __refcount_dec_and_test(&amp;subreq-&gt;ref, &amp;r);</div><div class='add'>+	trace_netfs_sreq_ref(debug_id, debug_index, r - 1, what);</div><div class='add'>+	if (dead)</div><div class='add'>+		netfs_free_subrequest(subreq);</div><div class='add'>+}</div><div class='head'>diff --git a/fs/netfs/read_collect.c b/fs/netfs/read_collect.c<br/>new file mode 100644<br/>index 000000000000..a95e7aadafd0<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/read_collect.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/read_collect.c</a></div><div class='hunk'>@@ -0,0 +1,585 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-only</div><div class='add'>+/* Network filesystem read subrequest result collection, assessment and</div><div class='add'>+ * retrying.</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2024 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/export.h&gt;</div><div class='add'>+#include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/mm.h&gt;</div><div class='add'>+#include &lt;linux/pagemap.h&gt;</div><div class='add'>+#include &lt;linux/slab.h&gt;</div><div class='add'>+#include &lt;linux/task_io_accounting_ops.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+/* Notes made in the collector */</div><div class='add'>+#define HIT_PENDING	0x01	/* A front op was still pending */</div><div class='add'>+#define MADE_PROGRESS	0x04	/* Made progress cleaning up a stream or the folio set */</div><div class='add'>+#define BUFFERED	0x08	/* The pagecache needs cleaning up */</div><div class='add'>+#define NEED_RETRY	0x10	/* A front op requests retrying */</div><div class='add'>+#define COPY_TO_CACHE	0x40	/* Need to copy subrequest to cache */</div><div class='add'>+#define ABANDON_SREQ	0x80	/* Need to abandon untransferred part of subrequest */</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Clear the unread part of an I/O request.</div><div class='add'>+ */</div><div class='add'>+static void netfs_clear_unread(struct netfs_io_subrequest *subreq)</div><div class='add'>+{</div><div class='add'>+	netfs_reset_iter(subreq);</div><div class='add'>+	WARN_ON_ONCE(subreq-&gt;len - subreq-&gt;transferred != iov_iter_count(&amp;subreq-&gt;io_iter));</div><div class='add'>+	iov_iter_zero(iov_iter_count(&amp;subreq-&gt;io_iter), &amp;subreq-&gt;io_iter);</div><div class='add'>+	if (subreq-&gt;start + subreq-&gt;transferred &gt;= subreq-&gt;rreq-&gt;i_size)</div><div class='add'>+		__set_bit(NETFS_SREQ_HIT_EOF, &amp;subreq-&gt;flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Flush, mark and unlock a folio that's now completely read.  If we want to</div><div class='add'>+ * cache the folio, we set the group to NETFS_FOLIO_COPY_TO_CACHE, mark it</div><div class='add'>+ * dirty and let writeback handle it.</div><div class='add'>+ */</div><div class='add'>+static void netfs_unlock_read_folio(struct netfs_io_request *rreq,</div><div class='add'>+				    struct folio_queue *folioq,</div><div class='add'>+				    int slot)</div><div class='add'>+{</div><div class='add'>+	struct netfs_folio *finfo;</div><div class='add'>+	struct folio *folio = folioq_folio(folioq, slot);</div><div class='add'>+</div><div class='add'>+	if (unlikely(folio_pos(folio) &lt; rreq-&gt;abandon_to)) {</div><div class='add'>+		trace_netfs_folio(folio, netfs_folio_trace_abandon);</div><div class='add'>+		goto just_unlock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	flush_dcache_folio(folio);</div><div class='add'>+	folio_mark_uptodate(folio);</div><div class='add'>+</div><div class='add'>+	if (!test_bit(NETFS_RREQ_USE_PGPRIV2, &amp;rreq-&gt;flags)) {</div><div class='add'>+		finfo = netfs_folio_info(folio);</div><div class='add'>+		if (finfo) {</div><div class='add'>+			trace_netfs_folio(folio, netfs_folio_trace_filled_gaps);</div><div class='add'>+			if (finfo-&gt;netfs_group)</div><div class='add'>+				folio_change_private(folio, finfo-&gt;netfs_group);</div><div class='add'>+			else</div><div class='add'>+				folio_detach_private(folio);</div><div class='add'>+			kfree(finfo);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (test_bit(NETFS_RREQ_FOLIO_COPY_TO_CACHE, &amp;rreq-&gt;flags)) {</div><div class='add'>+			if (!WARN_ON_ONCE(folio_get_private(folio) != NULL)) {</div><div class='add'>+				trace_netfs_folio(folio, netfs_folio_trace_copy_to_cache);</div><div class='add'>+				folio_attach_private(folio, NETFS_FOLIO_COPY_TO_CACHE);</div><div class='add'>+				folio_mark_dirty(folio);</div><div class='add'>+			}</div><div class='add'>+		} else {</div><div class='add'>+			trace_netfs_folio(folio, netfs_folio_trace_read_done);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		folioq_clear(folioq, slot);</div><div class='add'>+	} else {</div><div class='add'>+		// TODO: Use of PG_private_2 is deprecated.</div><div class='add'>+		if (test_bit(NETFS_RREQ_FOLIO_COPY_TO_CACHE, &amp;rreq-&gt;flags))</div><div class='add'>+			netfs_pgpriv2_copy_to_cache(rreq, folio);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+just_unlock:</div><div class='add'>+	if (folio-&gt;index == rreq-&gt;no_unlock_folio &amp;&amp;</div><div class='add'>+	    test_bit(NETFS_RREQ_NO_UNLOCK_FOLIO, &amp;rreq-&gt;flags)) {</div><div class='add'>+		_debug("no unlock");</div><div class='add'>+	} else {</div><div class='add'>+		trace_netfs_folio(folio, netfs_folio_trace_read_unlock);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	folioq_clear(folioq, slot);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Unlock any folios we've finished with.</div><div class='add'>+ */</div><div class='add'>+static void netfs_read_unlock_folios(struct netfs_io_request *rreq,</div><div class='add'>+				     unsigned int *notes)</div><div class='add'>+{</div><div class='add'>+	struct folio_queue *folioq = rreq-&gt;buffer.tail;</div><div class='add'>+	unsigned long long collected_to = rreq-&gt;collected_to;</div><div class='add'>+	unsigned int slot = rreq-&gt;buffer.first_tail_slot;</div><div class='add'>+</div><div class='add'>+	if (rreq-&gt;cleaned_to &gt;= rreq-&gt;collected_to)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	// TODO: Begin decryption</div><div class='add'>+</div><div class='add'>+	if (slot &gt;= folioq_nr_slots(folioq)) {</div><div class='add'>+		folioq = rolling_buffer_delete_spent(&amp;rreq-&gt;buffer);</div><div class='add'>+		if (!folioq) {</div><div class='add'>+			rreq-&gt;front_folio_order = 0;</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+		slot = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for (;;) {</div><div class='add'>+		struct folio *folio;</div><div class='add'>+		unsigned long long fpos, fend;</div><div class='add'>+		unsigned int order;</div><div class='add'>+		size_t fsize;</div><div class='add'>+</div><div class='add'>+		if (*notes &amp; COPY_TO_CACHE)</div><div class='add'>+			set_bit(NETFS_RREQ_FOLIO_COPY_TO_CACHE, &amp;rreq-&gt;flags);</div><div class='add'>+</div><div class='add'>+		folio = folioq_folio(folioq, slot);</div><div class='add'>+		if (WARN_ONCE(!folio_test_locked(folio),</div><div class='add'>+			      "R=%08x: folio %lx is not locked\n",</div><div class='add'>+			      rreq-&gt;debug_id, folio-&gt;index))</div><div class='add'>+			trace_netfs_folio(folio, netfs_folio_trace_not_locked);</div><div class='add'>+</div><div class='add'>+		order = folioq_folio_order(folioq, slot);</div><div class='add'>+		rreq-&gt;front_folio_order = order;</div><div class='add'>+		fsize = PAGE_SIZE &lt;&lt; order;</div><div class='add'>+		fpos = folio_pos(folio);</div><div class='add'>+		fend = umin(fpos + fsize, rreq-&gt;i_size);</div><div class='add'>+</div><div class='add'>+		trace_netfs_collect_folio(rreq, folio, fend, collected_to);</div><div class='add'>+</div><div class='add'>+		/* Unlock any folio we've transferred all of. */</div><div class='add'>+		if (collected_to &lt; fend)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		netfs_unlock_read_folio(rreq, folioq, slot);</div><div class='add'>+		WRITE_ONCE(rreq-&gt;cleaned_to, fpos + fsize);</div><div class='add'>+		*notes |= MADE_PROGRESS;</div><div class='add'>+</div><div class='add'>+		clear_bit(NETFS_RREQ_FOLIO_COPY_TO_CACHE, &amp;rreq-&gt;flags);</div><div class='add'>+</div><div class='add'>+		/* Clean up the head folioq.  If we clear an entire folioq, then</div><div class='add'>+		 * we can get rid of it provided it's not also the tail folioq</div><div class='add'>+		 * being filled by the issuer.</div><div class='add'>+		 */</div><div class='add'>+		folioq_clear(folioq, slot);</div><div class='add'>+		slot++;</div><div class='add'>+		if (slot &gt;= folioq_nr_slots(folioq)) {</div><div class='add'>+			folioq = rolling_buffer_delete_spent(&amp;rreq-&gt;buffer);</div><div class='add'>+			if (!folioq)</div><div class='add'>+				goto done;</div><div class='add'>+			slot = 0;</div><div class='add'>+			trace_netfs_folioq(folioq, netfs_trace_folioq_read_progress);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (fpos + fsize &gt;= collected_to)</div><div class='add'>+			break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	rreq-&gt;buffer.tail = folioq;</div><div class='add'>+done:</div><div class='add'>+	rreq-&gt;buffer.first_tail_slot = slot;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Collect and assess the results of various read subrequests.  We may need to</div><div class='add'>+ * retry some of the results.</div><div class='add'>+ *</div><div class='add'>+ * Note that we have a sequence of subrequests, which may be drawing on</div><div class='add'>+ * different sources and may or may not be the same size or starting position</div><div class='add'>+ * and may not even correspond in boundary alignment.</div><div class='add'>+ */</div><div class='add'>+static void netfs_collect_read_results(struct netfs_io_request *rreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_subrequest *front, *remove;</div><div class='add'>+	struct netfs_io_stream *stream = &amp;rreq-&gt;io_streams[0];</div><div class='add'>+	unsigned int notes;</div><div class='add'>+</div><div class='add'>+	_enter("%llx-%llx", rreq-&gt;start, rreq-&gt;start + rreq-&gt;len);</div><div class='add'>+	trace_netfs_rreq(rreq, netfs_rreq_trace_collect);</div><div class='add'>+	trace_netfs_collect(rreq);</div><div class='add'>+</div><div class='add'>+reassess:</div><div class='add'>+	if (rreq-&gt;origin == NETFS_READAHEAD ||</div><div class='add'>+	    rreq-&gt;origin == NETFS_READPAGE ||</div><div class='add'>+	    rreq-&gt;origin == NETFS_READ_FOR_WRITE)</div><div class='add'>+		notes = BUFFERED;</div><div class='add'>+	else</div><div class='add'>+		notes = 0;</div><div class='add'>+</div><div class='add'>+	/* Remove completed subrequests from the front of the stream and</div><div class='add'>+	 * advance the completion point.  We stop when we hit something that's</div><div class='add'>+	 * in progress.  The issuer thread may be adding stuff to the tail</div><div class='add'>+	 * whilst we're doing this.</div><div class='add'>+	 */</div><div class='add'>+	front = READ_ONCE(stream-&gt;front);</div><div class='add'>+	while (front) {</div><div class='add'>+		size_t transferred;</div><div class='add'>+</div><div class='add'>+		trace_netfs_collect_sreq(rreq, front);</div><div class='add'>+		_debug("sreq [%x] %llx %zx/%zx",</div><div class='add'>+		       front-&gt;debug_index, front-&gt;start, front-&gt;transferred, front-&gt;len);</div><div class='add'>+</div><div class='add'>+		if (stream-&gt;collected_to &lt; front-&gt;start) {</div><div class='add'>+			trace_netfs_collect_gap(rreq, stream, front-&gt;start, 'F');</div><div class='add'>+			stream-&gt;collected_to = front-&gt;start;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (netfs_check_subreq_in_progress(front))</div><div class='add'>+			notes |= HIT_PENDING;</div><div class='add'>+		smp_rmb(); /* Read counters after IN_PROGRESS flag. */</div><div class='add'>+		transferred = READ_ONCE(front-&gt;transferred);</div><div class='add'>+</div><div class='add'>+		/* If we can now collect the next folio, do so.  We don't want</div><div class='add'>+		 * to defer this as we have to decide whether we need to copy</div><div class='add'>+		 * to the cache or not, and that may differ between adjacent</div><div class='add'>+		 * subreqs.</div><div class='add'>+		 */</div><div class='add'>+		if (notes &amp; BUFFERED) {</div><div class='add'>+			size_t fsize = PAGE_SIZE &lt;&lt; rreq-&gt;front_folio_order;</div><div class='add'>+</div><div class='add'>+			/* Clear the tail of a short read. */</div><div class='add'>+			if (!(notes &amp; HIT_PENDING) &amp;&amp;</div><div class='add'>+			    front-&gt;error == 0 &amp;&amp;</div><div class='add'>+			    transferred &lt; front-&gt;len &amp;&amp;</div><div class='add'>+			    (test_bit(NETFS_SREQ_HIT_EOF, &amp;front-&gt;flags) ||</div><div class='add'>+			     test_bit(NETFS_SREQ_CLEAR_TAIL, &amp;front-&gt;flags))) {</div><div class='add'>+				netfs_clear_unread(front);</div><div class='add'>+				transferred = front-&gt;transferred = front-&gt;len;</div><div class='add'>+				trace_netfs_sreq(front, netfs_sreq_trace_clear);</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			stream-&gt;collected_to = front-&gt;start + transferred;</div><div class='add'>+			rreq-&gt;collected_to = stream-&gt;collected_to;</div><div class='add'>+</div><div class='add'>+			if (test_bit(NETFS_SREQ_COPY_TO_CACHE, &amp;front-&gt;flags))</div><div class='add'>+				notes |= COPY_TO_CACHE;</div><div class='add'>+</div><div class='add'>+			if (test_bit(NETFS_SREQ_FAILED, &amp;front-&gt;flags)) {</div><div class='add'>+				rreq-&gt;abandon_to = front-&gt;start + front-&gt;len;</div><div class='add'>+				front-&gt;transferred = front-&gt;len;</div><div class='add'>+				transferred = front-&gt;len;</div><div class='add'>+				trace_netfs_rreq(rreq, netfs_rreq_trace_set_abandon);</div><div class='add'>+			}</div><div class='add'>+			if (front-&gt;start + transferred &gt;= rreq-&gt;cleaned_to + fsize ||</div><div class='add'>+			    test_bit(NETFS_SREQ_HIT_EOF, &amp;front-&gt;flags))</div><div class='add'>+				netfs_read_unlock_folios(rreq, &amp;notes);</div><div class='add'>+		} else {</div><div class='add'>+			stream-&gt;collected_to = front-&gt;start + transferred;</div><div class='add'>+			rreq-&gt;collected_to = stream-&gt;collected_to;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* Stall if the front is still undergoing I/O. */</div><div class='add'>+		if (notes &amp; HIT_PENDING)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		if (test_bit(NETFS_SREQ_FAILED, &amp;front-&gt;flags)) {</div><div class='add'>+			if (!stream-&gt;failed) {</div><div class='add'>+				stream-&gt;error = front-&gt;error;</div><div class='add'>+				rreq-&gt;error = front-&gt;error;</div><div class='add'>+				set_bit(NETFS_RREQ_FAILED, &amp;rreq-&gt;flags);</div><div class='add'>+				stream-&gt;failed = true;</div><div class='add'>+			}</div><div class='add'>+			notes |= MADE_PROGRESS | ABANDON_SREQ;</div><div class='add'>+		} else if (test_bit(NETFS_SREQ_NEED_RETRY, &amp;front-&gt;flags)) {</div><div class='add'>+			stream-&gt;need_retry = true;</div><div class='add'>+			notes |= NEED_RETRY | MADE_PROGRESS;</div><div class='add'>+			break;</div><div class='add'>+		} else if (test_bit(NETFS_RREQ_SHORT_TRANSFER, &amp;rreq-&gt;flags)) {</div><div class='add'>+			notes |= MADE_PROGRESS;</div><div class='add'>+		} else {</div><div class='add'>+			if (!stream-&gt;failed) {</div><div class='add'>+				stream-&gt;transferred += transferred;</div><div class='add'>+				stream-&gt;transferred_valid = true;</div><div class='add'>+			}</div><div class='add'>+			if (front-&gt;transferred &lt; front-&gt;len)</div><div class='add'>+				set_bit(NETFS_RREQ_SHORT_TRANSFER, &amp;rreq-&gt;flags);</div><div class='add'>+			notes |= MADE_PROGRESS;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* Remove if completely consumed. */</div><div class='add'>+		stream-&gt;source = front-&gt;source;</div><div class='add'>+		spin_lock(&amp;rreq-&gt;lock);</div><div class='add'>+</div><div class='add'>+		remove = front;</div><div class='add'>+		trace_netfs_sreq(front,</div><div class='add'>+				 notes &amp; ABANDON_SREQ ?</div><div class='add'>+				 netfs_sreq_trace_abandoned : netfs_sreq_trace_consumed);</div><div class='add'>+		list_del_init(&amp;front-&gt;rreq_link);</div><div class='add'>+		front = list_first_entry_or_null(&amp;stream-&gt;subrequests,</div><div class='add'>+						 struct netfs_io_subrequest, rreq_link);</div><div class='add'>+		stream-&gt;front = front;</div><div class='add'>+		spin_unlock(&amp;rreq-&gt;lock);</div><div class='add'>+		netfs_put_subrequest(remove,</div><div class='add'>+				     notes &amp; ABANDON_SREQ ?</div><div class='add'>+				     netfs_sreq_trace_put_abandon :</div><div class='add'>+				     netfs_sreq_trace_put_done);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	trace_netfs_collect_stream(rreq, stream);</div><div class='add'>+	trace_netfs_collect_state(rreq, rreq-&gt;collected_to, notes);</div><div class='add'>+</div><div class='add'>+	if (!(notes &amp; BUFFERED))</div><div class='add'>+		rreq-&gt;cleaned_to = rreq-&gt;collected_to;</div><div class='add'>+</div><div class='add'>+	if (notes &amp; NEED_RETRY)</div><div class='add'>+		goto need_retry;</div><div class='add'>+	if (notes &amp; MADE_PROGRESS) {</div><div class='add'>+		netfs_wake_rreq_flag(rreq, NETFS_RREQ_PAUSE, netfs_rreq_trace_unpause);</div><div class='add'>+		//cond_resched();</div><div class='add'>+		goto reassess;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	_leave(" = %x", notes);</div><div class='add'>+	return;</div><div class='add'>+</div><div class='add'>+need_retry:</div><div class='add'>+	/* Okay...  We're going to have to retry parts of the stream.  Note</div><div class='add'>+	 * that any partially completed op will have had any wholly transferred</div><div class='add'>+	 * folios removed from it.</div><div class='add'>+	 */</div><div class='add'>+	_debug("retry");</div><div class='add'>+	netfs_retry_reads(rreq);</div><div class='add'>+	goto out;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Do page flushing and suchlike after DIO.</div><div class='add'>+ */</div><div class='add'>+static void netfs_rreq_assess_dio(struct netfs_io_request *rreq)</div><div class='add'>+{</div><div class='add'>+	unsigned int i;</div><div class='add'>+</div><div class='add'>+	if (rreq-&gt;origin == NETFS_UNBUFFERED_READ ||</div><div class='add'>+	    rreq-&gt;origin == NETFS_DIO_READ) {</div><div class='add'>+		for (i = 0; i &lt; rreq-&gt;direct_bv_count; i++) {</div><div class='add'>+			flush_dcache_page(rreq-&gt;direct_bv[i].bv_page);</div><div class='add'>+			// TODO: cifs marks pages in the destination buffer</div><div class='add'>+			// dirty under some circumstances after a read.  Do we</div><div class='add'>+			// need to do that too?</div><div class='add'>+			set_page_dirty(rreq-&gt;direct_bv[i].bv_page);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (rreq-&gt;iocb) {</div><div class='add'>+		rreq-&gt;iocb-&gt;ki_pos += rreq-&gt;transferred;</div><div class='add'>+		if (rreq-&gt;iocb-&gt;ki_complete) {</div><div class='add'>+			trace_netfs_rreq(rreq, netfs_rreq_trace_ki_complete);</div><div class='add'>+			rreq-&gt;iocb-&gt;ki_complete(</div><div class='add'>+				rreq-&gt;iocb, rreq-&gt;error ? rreq-&gt;error : rreq-&gt;transferred);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	if (rreq-&gt;netfs_ops-&gt;done)</div><div class='add'>+		rreq-&gt;netfs_ops-&gt;done(rreq);</div><div class='add'>+	if (rreq-&gt;origin == NETFS_UNBUFFERED_READ ||</div><div class='add'>+	    rreq-&gt;origin == NETFS_DIO_READ)</div><div class='add'>+		inode_dio_end(rreq-&gt;inode);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Do processing after reading a monolithic single object.</div><div class='add'>+ */</div><div class='add'>+static void netfs_rreq_assess_single(struct netfs_io_request *rreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_stream *stream = &amp;rreq-&gt;io_streams[0];</div><div class='add'>+</div><div class='add'>+	if (!rreq-&gt;error &amp;&amp; stream-&gt;source == NETFS_DOWNLOAD_FROM_SERVER &amp;&amp;</div><div class='add'>+	    fscache_resources_valid(&amp;rreq-&gt;cache_resources)) {</div><div class='add'>+		trace_netfs_rreq(rreq, netfs_rreq_trace_dirty);</div><div class='add'>+		netfs_single_mark_inode_dirty(rreq-&gt;inode);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (rreq-&gt;iocb) {</div><div class='add'>+		rreq-&gt;iocb-&gt;ki_pos += rreq-&gt;transferred;</div><div class='add'>+		if (rreq-&gt;iocb-&gt;ki_complete) {</div><div class='add'>+			trace_netfs_rreq(rreq, netfs_rreq_trace_ki_complete);</div><div class='add'>+			rreq-&gt;iocb-&gt;ki_complete(</div><div class='add'>+				rreq-&gt;iocb, rreq-&gt;error ? rreq-&gt;error : rreq-&gt;transferred);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	if (rreq-&gt;netfs_ops-&gt;done)</div><div class='add'>+		rreq-&gt;netfs_ops-&gt;done(rreq);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Perform the collection of subrequests and folios.</div><div class='add'>+ *</div><div class='add'>+ * Note that we're in normal kernel thread context at this point, possibly</div><div class='add'>+ * running on a workqueue.</div><div class='add'>+ */</div><div class='add'>+bool netfs_read_collection(struct netfs_io_request *rreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_stream *stream = &amp;rreq-&gt;io_streams[0];</div><div class='add'>+</div><div class='add'>+	netfs_collect_read_results(rreq);</div><div class='add'>+</div><div class='add'>+	/* We're done when the app thread has finished posting subreqs and the</div><div class='add'>+	 * queue is empty.</div><div class='add'>+	 */</div><div class='add'>+	if (!test_bit(NETFS_RREQ_ALL_QUEUED, &amp;rreq-&gt;flags))</div><div class='add'>+		return false;</div><div class='add'>+	smp_rmb(); /* Read ALL_QUEUED before subreq lists. */</div><div class='add'>+</div><div class='add'>+	if (!list_empty(&amp;stream-&gt;subrequests))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/* Okay, declare that all I/O is complete. */</div><div class='add'>+	rreq-&gt;transferred = stream-&gt;transferred;</div><div class='add'>+	trace_netfs_rreq(rreq, netfs_rreq_trace_complete);</div><div class='add'>+</div><div class='add'>+	//netfs_rreq_is_still_valid(rreq);</div><div class='add'>+</div><div class='add'>+	switch (rreq-&gt;origin) {</div><div class='add'>+	case NETFS_UNBUFFERED_READ:</div><div class='add'>+	case NETFS_DIO_READ:</div><div class='add'>+	case NETFS_READ_GAPS:</div><div class='add'>+		netfs_rreq_assess_dio(rreq);</div><div class='add'>+		break;</div><div class='add'>+	case NETFS_READ_SINGLE:</div><div class='add'>+		netfs_rreq_assess_single(rreq);</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+	task_io_account_read(rreq-&gt;transferred);</div><div class='add'>+</div><div class='add'>+	netfs_wake_rreq_flag(rreq, NETFS_RREQ_IN_PROGRESS, netfs_rreq_trace_wake_ip);</div><div class='add'>+	/* As we cleared NETFS_RREQ_IN_PROGRESS, we acquired its ref. */</div><div class='add'>+</div><div class='add'>+	trace_netfs_rreq(rreq, netfs_rreq_trace_done);</div><div class='add'>+	netfs_clear_subrequests(rreq);</div><div class='add'>+	netfs_unlock_abandoned_read_pages(rreq);</div><div class='add'>+	if (unlikely(rreq-&gt;copy_to_cache))</div><div class='add'>+		netfs_pgpriv2_end_copy_to_cache(rreq);</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void netfs_read_collection_worker(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *rreq = container_of(work, struct netfs_io_request, work);</div><div class='add'>+</div><div class='add'>+	netfs_see_request(rreq, netfs_rreq_trace_see_work);</div><div class='add'>+	if (netfs_check_rreq_in_progress(rreq)) {</div><div class='add'>+		if (netfs_read_collection(rreq))</div><div class='add'>+			/* Drop the ref from the IN_PROGRESS flag. */</div><div class='add'>+			netfs_put_request(rreq, netfs_rreq_trace_put_work_ip);</div><div class='add'>+		else</div><div class='add'>+			netfs_see_request(rreq, netfs_rreq_trace_see_work_complete);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_read_subreq_progress - Note progress of a read operation.</div><div class='add'>+ * @subreq: The read request that has terminated.</div><div class='add'>+ *</div><div class='add'>+ * This tells the read side of netfs lib that a contributory I/O operation has</div><div class='add'>+ * made some progress and that it may be possible to unlock some folios.</div><div class='add'>+ *</div><div class='add'>+ * Before calling, the filesystem should update subreq-&gt;transferred to track</div><div class='add'>+ * the amount of data copied into the output buffer.</div><div class='add'>+ */</div><div class='add'>+void netfs_read_subreq_progress(struct netfs_io_subrequest *subreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *rreq = subreq-&gt;rreq;</div><div class='add'>+	struct netfs_io_stream *stream = &amp;rreq-&gt;io_streams[0];</div><div class='add'>+	size_t fsize = PAGE_SIZE &lt;&lt; rreq-&gt;front_folio_order;</div><div class='add'>+</div><div class='add'>+	trace_netfs_sreq(subreq, netfs_sreq_trace_progress);</div><div class='add'>+</div><div class='add'>+	/* If we are at the head of the queue, wake up the collector,</div><div class='add'>+	 * getting a ref to it if we were the ones to do so.</div><div class='add'>+	 */</div><div class='add'>+	if (subreq-&gt;start + subreq-&gt;transferred &gt; rreq-&gt;cleaned_to + fsize &amp;&amp;</div><div class='add'>+	    (rreq-&gt;origin == NETFS_READAHEAD ||</div><div class='add'>+	     rreq-&gt;origin == NETFS_READPAGE ||</div><div class='add'>+	     rreq-&gt;origin == NETFS_READ_FOR_WRITE) &amp;&amp;</div><div class='add'>+	    list_is_first(&amp;subreq-&gt;rreq_link, &amp;stream-&gt;subrequests)</div><div class='add'>+	    ) {</div><div class='add'>+		__set_bit(NETFS_SREQ_MADE_PROGRESS, &amp;subreq-&gt;flags);</div><div class='add'>+		netfs_wake_collector(rreq);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_read_subreq_progress);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_read_subreq_terminated - Note the termination of an I/O operation.</div><div class='add'>+ * @subreq: The I/O request that has terminated.</div><div class='add'>+ *</div><div class='add'>+ * This tells the read helper that a contributory I/O operation has terminated,</div><div class='add'>+ * one way or another, and that it should integrate the results.</div><div class='add'>+ *</div><div class='add'>+ * The caller indicates the outcome of the operation through @subreq-&gt;error,</div><div class='add'>+ * supplying 0 to indicate a successful or retryable transfer (if</div><div class='add'>+ * NETFS_SREQ_NEED_RETRY is set) or a negative error code.  The helper will</div><div class='add'>+ * look after reissuing I/O operations as appropriate and writing downloaded</div><div class='add'>+ * data to the cache.</div><div class='add'>+ *</div><div class='add'>+ * Before calling, the filesystem should update subreq-&gt;transferred to track</div><div class='add'>+ * the amount of data copied into the output buffer.</div><div class='add'>+ */</div><div class='add'>+void netfs_read_subreq_terminated(struct netfs_io_subrequest *subreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *rreq = subreq-&gt;rreq;</div><div class='add'>+</div><div class='add'>+	switch (subreq-&gt;source) {</div><div class='add'>+	case NETFS_READ_FROM_CACHE:</div><div class='add'>+		netfs_stat(&amp;netfs_n_rh_read_done);</div><div class='add'>+		break;</div><div class='add'>+	case NETFS_DOWNLOAD_FROM_SERVER:</div><div class='add'>+		netfs_stat(&amp;netfs_n_rh_download_done);</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Deal with retry requests, short reads and errors.  If we retry</div><div class='add'>+	 * but don't make progress, we abandon the attempt.</div><div class='add'>+	 */</div><div class='add'>+	if (!subreq-&gt;error &amp;&amp; subreq-&gt;transferred &lt; subreq-&gt;len) {</div><div class='add'>+		if (test_bit(NETFS_SREQ_HIT_EOF, &amp;subreq-&gt;flags)) {</div><div class='add'>+			trace_netfs_sreq(subreq, netfs_sreq_trace_hit_eof);</div><div class='add'>+		} else if (test_bit(NETFS_SREQ_CLEAR_TAIL, &amp;subreq-&gt;flags)) {</div><div class='add'>+			trace_netfs_sreq(subreq, netfs_sreq_trace_need_clear);</div><div class='add'>+		} else if (test_bit(NETFS_SREQ_NEED_RETRY, &amp;subreq-&gt;flags)) {</div><div class='add'>+			trace_netfs_sreq(subreq, netfs_sreq_trace_need_retry);</div><div class='add'>+		} else if (test_bit(NETFS_SREQ_MADE_PROGRESS, &amp;subreq-&gt;flags)) {</div><div class='add'>+			__set_bit(NETFS_SREQ_NEED_RETRY, &amp;subreq-&gt;flags);</div><div class='add'>+			trace_netfs_sreq(subreq, netfs_sreq_trace_partial_read);</div><div class='add'>+		} else {</div><div class='add'>+			__set_bit(NETFS_SREQ_FAILED, &amp;subreq-&gt;flags);</div><div class='add'>+			subreq-&gt;error = -ENODATA;</div><div class='add'>+			trace_netfs_sreq(subreq, netfs_sreq_trace_short);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (unlikely(subreq-&gt;error &lt; 0)) {</div><div class='add'>+		trace_netfs_failure(rreq, subreq, subreq-&gt;error, netfs_fail_read);</div><div class='add'>+		if (subreq-&gt;source == NETFS_READ_FROM_CACHE) {</div><div class='add'>+			netfs_stat(&amp;netfs_n_rh_read_failed);</div><div class='add'>+			__set_bit(NETFS_SREQ_NEED_RETRY, &amp;subreq-&gt;flags);</div><div class='add'>+		} else {</div><div class='add'>+			netfs_stat(&amp;netfs_n_rh_download_failed);</div><div class='add'>+			__set_bit(NETFS_SREQ_FAILED, &amp;subreq-&gt;flags);</div><div class='add'>+		}</div><div class='add'>+		trace_netfs_rreq(rreq, netfs_rreq_trace_set_pause);</div><div class='add'>+		set_bit(NETFS_RREQ_PAUSE, &amp;rreq-&gt;flags);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	trace_netfs_sreq(subreq, netfs_sreq_trace_terminated);</div><div class='add'>+	netfs_subreq_clear_in_progress(subreq);</div><div class='add'>+	netfs_put_subrequest(subreq, netfs_sreq_trace_put_terminated);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_read_subreq_terminated);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Handle termination of a read from the cache.</div><div class='add'>+ */</div><div class='add'>+void netfs_cache_read_terminated(void *priv, ssize_t transferred_or_error)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_subrequest *subreq = priv;</div><div class='add'>+</div><div class='add'>+	if (transferred_or_error &gt; 0) {</div><div class='add'>+		subreq-&gt;error = 0;</div><div class='add'>+		if (transferred_or_error &gt; 0) {</div><div class='add'>+			subreq-&gt;transferred += transferred_or_error;</div><div class='add'>+			__set_bit(NETFS_SREQ_MADE_PROGRESS, &amp;subreq-&gt;flags);</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		subreq-&gt;error = transferred_or_error;</div><div class='add'>+	}</div><div class='add'>+	netfs_read_subreq_terminated(subreq);</div><div class='add'>+}</div><div class='head'>diff --git a/fs/netfs/read_helper.c b/fs/netfs/read_helper.c<br/>deleted file mode 100644<br/>index 9320a42dfaf9..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/netfs/read_helper.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/read_helper.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,1209 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='del'>-/* Network filesystem high-level read support.</div><div class='del'>- *</div><div class='del'>- * Copyright (C) 2021 Red Hat, Inc. All Rights Reserved.</div><div class='del'>- * Written by David Howells (dhowells@redhat.com)</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#include &lt;linux/module.h&gt;</div><div class='del'>-#include &lt;linux/export.h&gt;</div><div class='del'>-#include &lt;linux/fs.h&gt;</div><div class='del'>-#include &lt;linux/mm.h&gt;</div><div class='del'>-#include &lt;linux/pagemap.h&gt;</div><div class='del'>-#include &lt;linux/slab.h&gt;</div><div class='del'>-#include &lt;linux/uio.h&gt;</div><div class='del'>-#include &lt;linux/sched/mm.h&gt;</div><div class='del'>-#include &lt;linux/task_io_accounting_ops.h&gt;</div><div class='del'>-#include &lt;linux/netfs.h&gt;</div><div class='del'>-#include "internal.h"</div><div class='del'>-#define CREATE_TRACE_POINTS</div><div class='del'>-#include &lt;trace/events/netfs.h&gt;</div><div class='del'>-</div><div class='del'>-MODULE_DESCRIPTION("Network fs support");</div><div class='del'>-MODULE_AUTHOR("Red Hat, Inc.");</div><div class='del'>-MODULE_LICENSE("GPL");</div><div class='del'>-</div><div class='del'>-unsigned netfs_debug;</div><div class='del'>-module_param_named(debug, netfs_debug, uint, S_IWUSR | S_IRUGO);</div><div class='del'>-MODULE_PARM_DESC(netfs_debug, "Netfs support debugging mask");</div><div class='del'>-</div><div class='del'>-static void netfs_rreq_work(struct work_struct *);</div><div class='del'>-static void __netfs_put_subrequest(struct netfs_read_subrequest *, bool);</div><div class='del'>-</div><div class='del'>-static void netfs_put_subrequest(struct netfs_read_subrequest *subreq,</div><div class='del'>-				 bool was_async)</div><div class='del'>-{</div><div class='del'>-	if (refcount_dec_and_test(&amp;subreq-&gt;usage))</div><div class='del'>-		__netfs_put_subrequest(subreq, was_async);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct netfs_read_request *netfs_alloc_read_request(</div><div class='del'>-	const struct netfs_read_request_ops *ops, void *netfs_priv,</div><div class='del'>-	struct file *file)</div><div class='del'>-{</div><div class='del'>-	static atomic_t debug_ids;</div><div class='del'>-	struct netfs_read_request *rreq;</div><div class='del'>-</div><div class='del'>-	rreq = kzalloc(sizeof(struct netfs_read_request), GFP_KERNEL);</div><div class='del'>-	if (rreq) {</div><div class='del'>-		rreq-&gt;netfs_ops	= ops;</div><div class='del'>-		rreq-&gt;netfs_priv = netfs_priv;</div><div class='del'>-		rreq-&gt;inode	= file_inode(file);</div><div class='del'>-		rreq-&gt;i_size	= i_size_read(rreq-&gt;inode);</div><div class='del'>-		rreq-&gt;debug_id	= atomic_inc_return(&amp;debug_ids);</div><div class='del'>-		INIT_LIST_HEAD(&amp;rreq-&gt;subrequests);</div><div class='del'>-		INIT_WORK(&amp;rreq-&gt;work, netfs_rreq_work);</div><div class='del'>-		refcount_set(&amp;rreq-&gt;usage, 1);</div><div class='del'>-		__set_bit(NETFS_RREQ_IN_PROGRESS, &amp;rreq-&gt;flags);</div><div class='del'>-		ops-&gt;init_rreq(rreq, file);</div><div class='del'>-		netfs_stat(&amp;netfs_n_rh_rreq);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return rreq;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void netfs_get_read_request(struct netfs_read_request *rreq)</div><div class='del'>-{</div><div class='del'>-	refcount_inc(&amp;rreq-&gt;usage);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void netfs_rreq_clear_subreqs(struct netfs_read_request *rreq,</div><div class='del'>-				     bool was_async)</div><div class='del'>-{</div><div class='del'>-	struct netfs_read_subrequest *subreq;</div><div class='del'>-</div><div class='del'>-	while (!list_empty(&amp;rreq-&gt;subrequests)) {</div><div class='del'>-		subreq = list_first_entry(&amp;rreq-&gt;subrequests,</div><div class='del'>-					  struct netfs_read_subrequest, rreq_link);</div><div class='del'>-		list_del(&amp;subreq-&gt;rreq_link);</div><div class='del'>-		netfs_put_subrequest(subreq, was_async);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void netfs_free_read_request(struct work_struct *work)</div><div class='del'>-{</div><div class='del'>-	struct netfs_read_request *rreq =</div><div class='del'>-		container_of(work, struct netfs_read_request, work);</div><div class='del'>-	netfs_rreq_clear_subreqs(rreq, false);</div><div class='del'>-	if (rreq-&gt;netfs_priv)</div><div class='del'>-		rreq-&gt;netfs_ops-&gt;cleanup(rreq-&gt;mapping, rreq-&gt;netfs_priv);</div><div class='del'>-	trace_netfs_rreq(rreq, netfs_rreq_trace_free);</div><div class='del'>-	if (rreq-&gt;cache_resources.ops)</div><div class='del'>-		rreq-&gt;cache_resources.ops-&gt;end_operation(&amp;rreq-&gt;cache_resources);</div><div class='del'>-	kfree(rreq);</div><div class='del'>-	netfs_stat_d(&amp;netfs_n_rh_rreq);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void netfs_put_read_request(struct netfs_read_request *rreq, bool was_async)</div><div class='del'>-{</div><div class='del'>-	if (refcount_dec_and_test(&amp;rreq-&gt;usage)) {</div><div class='del'>-		if (was_async) {</div><div class='del'>-			rreq-&gt;work.func = netfs_free_read_request;</div><div class='del'>-			if (!queue_work(system_unbound_wq, &amp;rreq-&gt;work))</div><div class='del'>-				BUG();</div><div class='del'>-		} else {</div><div class='del'>-			netfs_free_read_request(&amp;rreq-&gt;work);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Allocate and partially initialise an I/O request structure.</div><div class='del'>- */</div><div class='del'>-static struct netfs_read_subrequest *netfs_alloc_subrequest(</div><div class='del'>-	struct netfs_read_request *rreq)</div><div class='del'>-{</div><div class='del'>-	struct netfs_read_subrequest *subreq;</div><div class='del'>-</div><div class='del'>-	subreq = kzalloc(sizeof(struct netfs_read_subrequest), GFP_KERNEL);</div><div class='del'>-	if (subreq) {</div><div class='del'>-		INIT_LIST_HEAD(&amp;subreq-&gt;rreq_link);</div><div class='del'>-		refcount_set(&amp;subreq-&gt;usage, 2);</div><div class='del'>-		subreq-&gt;rreq = rreq;</div><div class='del'>-		netfs_get_read_request(rreq);</div><div class='del'>-		netfs_stat(&amp;netfs_n_rh_sreq);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return subreq;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void netfs_get_read_subrequest(struct netfs_read_subrequest *subreq)</div><div class='del'>-{</div><div class='del'>-	refcount_inc(&amp;subreq-&gt;usage);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void __netfs_put_subrequest(struct netfs_read_subrequest *subreq,</div><div class='del'>-				   bool was_async)</div><div class='del'>-{</div><div class='del'>-	struct netfs_read_request *rreq = subreq-&gt;rreq;</div><div class='del'>-</div><div class='del'>-	trace_netfs_sreq(subreq, netfs_sreq_trace_free);</div><div class='del'>-	kfree(subreq);</div><div class='del'>-	netfs_stat_d(&amp;netfs_n_rh_sreq);</div><div class='del'>-	netfs_put_read_request(rreq, was_async);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Clear the unread part of an I/O request.</div><div class='del'>- */</div><div class='del'>-static void netfs_clear_unread(struct netfs_read_subrequest *subreq)</div><div class='del'>-{</div><div class='del'>-	struct iov_iter iter;</div><div class='del'>-</div><div class='del'>-	iov_iter_xarray(&amp;iter, READ, &amp;subreq-&gt;rreq-&gt;mapping-&gt;i_pages,</div><div class='del'>-			subreq-&gt;start + subreq-&gt;transferred,</div><div class='del'>-			subreq-&gt;len   - subreq-&gt;transferred);</div><div class='del'>-	iov_iter_zero(iov_iter_count(&amp;iter), &amp;iter);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void netfs_cache_read_terminated(void *priv, ssize_t transferred_or_error,</div><div class='del'>-					bool was_async)</div><div class='del'>-{</div><div class='del'>-	struct netfs_read_subrequest *subreq = priv;</div><div class='del'>-</div><div class='del'>-	netfs_subreq_terminated(subreq, transferred_or_error, was_async);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Issue a read against the cache.</div><div class='del'>- * - Eats the caller's ref on subreq.</div><div class='del'>- */</div><div class='del'>-static void netfs_read_from_cache(struct netfs_read_request *rreq,</div><div class='del'>-				  struct netfs_read_subrequest *subreq,</div><div class='del'>-				  bool seek_data)</div><div class='del'>-{</div><div class='del'>-	struct netfs_cache_resources *cres = &amp;rreq-&gt;cache_resources;</div><div class='del'>-	struct iov_iter iter;</div><div class='del'>-</div><div class='del'>-	netfs_stat(&amp;netfs_n_rh_read);</div><div class='del'>-	iov_iter_xarray(&amp;iter, READ, &amp;rreq-&gt;mapping-&gt;i_pages,</div><div class='del'>-			subreq-&gt;start + subreq-&gt;transferred,</div><div class='del'>-			subreq-&gt;len   - subreq-&gt;transferred);</div><div class='del'>-</div><div class='del'>-	cres-&gt;ops-&gt;read(cres, subreq-&gt;start, &amp;iter, seek_data,</div><div class='del'>-			netfs_cache_read_terminated, subreq);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Fill a subrequest region with zeroes.</div><div class='del'>- */</div><div class='del'>-static void netfs_fill_with_zeroes(struct netfs_read_request *rreq,</div><div class='del'>-				   struct netfs_read_subrequest *subreq)</div><div class='del'>-{</div><div class='del'>-	netfs_stat(&amp;netfs_n_rh_zero);</div><div class='del'>-	__set_bit(NETFS_SREQ_CLEAR_TAIL, &amp;subreq-&gt;flags);</div><div class='del'>-	netfs_subreq_terminated(subreq, 0, false);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Ask the netfs to issue a read request to the server for us.</div><div class='del'>- *</div><div class='del'>- * The netfs is expected to read from subreq-&gt;pos + subreq-&gt;transferred to</div><div class='del'>- * subreq-&gt;pos + subreq-&gt;len - 1.  It may not backtrack and write data into the</div><div class='del'>- * buffer prior to the transferred point as it might clobber dirty data</div><div class='del'>- * obtained from the cache.</div><div class='del'>- *</div><div class='del'>- * Alternatively, the netfs is allowed to indicate one of two things:</div><div class='del'>- *</div><div class='del'>- * - NETFS_SREQ_SHORT_READ: A short read - it will get called again to try and</div><div class='del'>- *   make progress.</div><div class='del'>- *</div><div class='del'>- * - NETFS_SREQ_CLEAR_TAIL: A short read - the rest of the buffer will be</div><div class='del'>- *   cleared.</div><div class='del'>- */</div><div class='del'>-static void netfs_read_from_server(struct netfs_read_request *rreq,</div><div class='del'>-				   struct netfs_read_subrequest *subreq)</div><div class='del'>-{</div><div class='del'>-	netfs_stat(&amp;netfs_n_rh_download);</div><div class='del'>-	rreq-&gt;netfs_ops-&gt;issue_op(subreq);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Release those waiting.</div><div class='del'>- */</div><div class='del'>-static void netfs_rreq_completed(struct netfs_read_request *rreq, bool was_async)</div><div class='del'>-{</div><div class='del'>-	trace_netfs_rreq(rreq, netfs_rreq_trace_done);</div><div class='del'>-	netfs_rreq_clear_subreqs(rreq, was_async);</div><div class='del'>-	netfs_put_read_request(rreq, was_async);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Deal with the completion of writing the data to the cache.  We have to clear</div><div class='del'>- * the PG_fscache bits on the folios involved and release the caller's ref.</div><div class='del'>- *</div><div class='del'>- * May be called in softirq mode and we inherit a ref from the caller.</div><div class='del'>- */</div><div class='del'>-static void netfs_rreq_unmark_after_write(struct netfs_read_request *rreq,</div><div class='del'>-					  bool was_async)</div><div class='del'>-{</div><div class='del'>-	struct netfs_read_subrequest *subreq;</div><div class='del'>-	struct folio *folio;</div><div class='del'>-	pgoff_t unlocked = 0;</div><div class='del'>-	bool have_unlocked = false;</div><div class='del'>-</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(subreq, &amp;rreq-&gt;subrequests, rreq_link) {</div><div class='del'>-		XA_STATE(xas, &amp;rreq-&gt;mapping-&gt;i_pages, subreq-&gt;start / PAGE_SIZE);</div><div class='del'>-</div><div class='del'>-		xas_for_each(&amp;xas, folio, (subreq-&gt;start + subreq-&gt;len - 1) / PAGE_SIZE) {</div><div class='del'>-			/* We might have multiple writes from the same huge</div><div class='del'>-			 * folio, but we mustn't unlock a folio more than once.</div><div class='del'>-			 */</div><div class='del'>-			if (have_unlocked &amp;&amp; folio_index(folio) &lt;= unlocked)</div><div class='del'>-				continue;</div><div class='del'>-			unlocked = folio_index(folio);</div><div class='del'>-			folio_end_fscache(folio);</div><div class='del'>-			have_unlocked = true;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-	netfs_rreq_completed(rreq, was_async);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void netfs_rreq_copy_terminated(void *priv, ssize_t transferred_or_error,</div><div class='del'>-				       bool was_async)</div><div class='del'>-{</div><div class='del'>-	struct netfs_read_subrequest *subreq = priv;</div><div class='del'>-	struct netfs_read_request *rreq = subreq-&gt;rreq;</div><div class='del'>-</div><div class='del'>-	if (IS_ERR_VALUE(transferred_or_error)) {</div><div class='del'>-		netfs_stat(&amp;netfs_n_rh_write_failed);</div><div class='del'>-		trace_netfs_failure(rreq, subreq, transferred_or_error,</div><div class='del'>-				    netfs_fail_copy_to_cache);</div><div class='del'>-	} else {</div><div class='del'>-		netfs_stat(&amp;netfs_n_rh_write_done);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	trace_netfs_sreq(subreq, netfs_sreq_trace_write_term);</div><div class='del'>-</div><div class='del'>-	/* If we decrement nr_wr_ops to 0, the ref belongs to us. */</div><div class='del'>-	if (atomic_dec_and_test(&amp;rreq-&gt;nr_wr_ops))</div><div class='del'>-		netfs_rreq_unmark_after_write(rreq, was_async);</div><div class='del'>-</div><div class='del'>-	netfs_put_subrequest(subreq, was_async);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Perform any outstanding writes to the cache.  We inherit a ref from the</div><div class='del'>- * caller.</div><div class='del'>- */</div><div class='del'>-static void netfs_rreq_do_write_to_cache(struct netfs_read_request *rreq)</div><div class='del'>-{</div><div class='del'>-	struct netfs_cache_resources *cres = &amp;rreq-&gt;cache_resources;</div><div class='del'>-	struct netfs_read_subrequest *subreq, *next, *p;</div><div class='del'>-	struct iov_iter iter;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	trace_netfs_rreq(rreq, netfs_rreq_trace_write);</div><div class='del'>-</div><div class='del'>-	/* We don't want terminating writes trying to wake us up whilst we're</div><div class='del'>-	 * still going through the list.</div><div class='del'>-	 */</div><div class='del'>-	atomic_inc(&amp;rreq-&gt;nr_wr_ops);</div><div class='del'>-</div><div class='del'>-	list_for_each_entry_safe(subreq, p, &amp;rreq-&gt;subrequests, rreq_link) {</div><div class='del'>-		if (!test_bit(NETFS_SREQ_WRITE_TO_CACHE, &amp;subreq-&gt;flags)) {</div><div class='del'>-			list_del_init(&amp;subreq-&gt;rreq_link);</div><div class='del'>-			netfs_put_subrequest(subreq, false);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(subreq, &amp;rreq-&gt;subrequests, rreq_link) {</div><div class='del'>-		/* Amalgamate adjacent writes */</div><div class='del'>-		while (!list_is_last(&amp;subreq-&gt;rreq_link, &amp;rreq-&gt;subrequests)) {</div><div class='del'>-			next = list_next_entry(subreq, rreq_link);</div><div class='del'>-			if (next-&gt;start != subreq-&gt;start + subreq-&gt;len)</div><div class='del'>-				break;</div><div class='del'>-			subreq-&gt;len += next-&gt;len;</div><div class='del'>-			list_del_init(&amp;next-&gt;rreq_link);</div><div class='del'>-			netfs_put_subrequest(next, false);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		ret = cres-&gt;ops-&gt;prepare_write(cres, &amp;subreq-&gt;start, &amp;subreq-&gt;len,</div><div class='del'>-					       rreq-&gt;i_size);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			trace_netfs_failure(rreq, subreq, ret, netfs_fail_prepare_write);</div><div class='del'>-			trace_netfs_sreq(subreq, netfs_sreq_trace_write_skip);</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		iov_iter_xarray(&amp;iter, WRITE, &amp;rreq-&gt;mapping-&gt;i_pages,</div><div class='del'>-				subreq-&gt;start, subreq-&gt;len);</div><div class='del'>-</div><div class='del'>-		atomic_inc(&amp;rreq-&gt;nr_wr_ops);</div><div class='del'>-		netfs_stat(&amp;netfs_n_rh_write);</div><div class='del'>-		netfs_get_read_subrequest(subreq);</div><div class='del'>-		trace_netfs_sreq(subreq, netfs_sreq_trace_write);</div><div class='del'>-		cres-&gt;ops-&gt;write(cres, subreq-&gt;start, &amp;iter,</div><div class='del'>-				 netfs_rreq_copy_terminated, subreq);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* If we decrement nr_wr_ops to 0, the usage ref belongs to us. */</div><div class='del'>-	if (atomic_dec_and_test(&amp;rreq-&gt;nr_wr_ops))</div><div class='del'>-		netfs_rreq_unmark_after_write(rreq, false);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void netfs_rreq_write_to_cache_work(struct work_struct *work)</div><div class='del'>-{</div><div class='del'>-	struct netfs_read_request *rreq =</div><div class='del'>-		container_of(work, struct netfs_read_request, work);</div><div class='del'>-</div><div class='del'>-	netfs_rreq_do_write_to_cache(rreq);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void netfs_rreq_write_to_cache(struct netfs_read_request *rreq,</div><div class='del'>-				      bool was_async)</div><div class='del'>-{</div><div class='del'>-	if (was_async) {</div><div class='del'>-		rreq-&gt;work.func = netfs_rreq_write_to_cache_work;</div><div class='del'>-		if (!queue_work(system_unbound_wq, &amp;rreq-&gt;work))</div><div class='del'>-			BUG();</div><div class='del'>-	} else {</div><div class='del'>-		netfs_rreq_do_write_to_cache(rreq);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Unlock the folios in a read operation.  We need to set PG_fscache on any</div><div class='del'>- * folios we're going to write back before we unlock them.</div><div class='del'>- */</div><div class='del'>-static void netfs_rreq_unlock(struct netfs_read_request *rreq)</div><div class='del'>-{</div><div class='del'>-	struct netfs_read_subrequest *subreq;</div><div class='del'>-	struct folio *folio;</div><div class='del'>-	unsigned int iopos, account = 0;</div><div class='del'>-	pgoff_t start_page = rreq-&gt;start / PAGE_SIZE;</div><div class='del'>-	pgoff_t last_page = ((rreq-&gt;start + rreq-&gt;len) / PAGE_SIZE) - 1;</div><div class='del'>-	bool subreq_failed = false;</div><div class='del'>-</div><div class='del'>-	XA_STATE(xas, &amp;rreq-&gt;mapping-&gt;i_pages, start_page);</div><div class='del'>-</div><div class='del'>-	if (test_bit(NETFS_RREQ_FAILED, &amp;rreq-&gt;flags)) {</div><div class='del'>-		__clear_bit(NETFS_RREQ_WRITE_TO_CACHE, &amp;rreq-&gt;flags);</div><div class='del'>-		list_for_each_entry(subreq, &amp;rreq-&gt;subrequests, rreq_link) {</div><div class='del'>-			__clear_bit(NETFS_SREQ_WRITE_TO_CACHE, &amp;subreq-&gt;flags);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* Walk through the pagecache and the I/O request lists simultaneously.</div><div class='del'>-	 * We may have a mixture of cached and uncached sections and we only</div><div class='del'>-	 * really want to write out the uncached sections.  This is slightly</div><div class='del'>-	 * complicated by the possibility that we might have huge pages with a</div><div class='del'>-	 * mixture inside.</div><div class='del'>-	 */</div><div class='del'>-	subreq = list_first_entry(&amp;rreq-&gt;subrequests,</div><div class='del'>-				  struct netfs_read_subrequest, rreq_link);</div><div class='del'>-	iopos = 0;</div><div class='del'>-	subreq_failed = (subreq-&gt;error &lt; 0);</div><div class='del'>-</div><div class='del'>-	trace_netfs_rreq(rreq, netfs_rreq_trace_unlock);</div><div class='del'>-</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	xas_for_each(&amp;xas, folio, last_page) {</div><div class='del'>-		unsigned int pgpos = (folio_index(folio) - start_page) * PAGE_SIZE;</div><div class='del'>-		unsigned int pgend = pgpos + folio_size(folio);</div><div class='del'>-		bool pg_failed = false;</div><div class='del'>-</div><div class='del'>-		for (;;) {</div><div class='del'>-			if (!subreq) {</div><div class='del'>-				pg_failed = true;</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			if (test_bit(NETFS_SREQ_WRITE_TO_CACHE, &amp;subreq-&gt;flags))</div><div class='del'>-				folio_start_fscache(folio);</div><div class='del'>-			pg_failed |= subreq_failed;</div><div class='del'>-			if (pgend &lt; iopos + subreq-&gt;len)</div><div class='del'>-				break;</div><div class='del'>-</div><div class='del'>-			account += subreq-&gt;transferred;</div><div class='del'>-			iopos += subreq-&gt;len;</div><div class='del'>-			if (!list_is_last(&amp;subreq-&gt;rreq_link, &amp;rreq-&gt;subrequests)) {</div><div class='del'>-				subreq = list_next_entry(subreq, rreq_link);</div><div class='del'>-				subreq_failed = (subreq-&gt;error &lt; 0);</div><div class='del'>-			} else {</div><div class='del'>-				subreq = NULL;</div><div class='del'>-				subreq_failed = false;</div><div class='del'>-			}</div><div class='del'>-			if (pgend == iopos)</div><div class='del'>-				break;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (!pg_failed) {</div><div class='del'>-			flush_dcache_folio(folio);</div><div class='del'>-			folio_mark_uptodate(folio);</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (!test_bit(NETFS_RREQ_DONT_UNLOCK_FOLIOS, &amp;rreq-&gt;flags)) {</div><div class='del'>-			if (folio_index(folio) == rreq-&gt;no_unlock_folio &amp;&amp;</div><div class='del'>-			    test_bit(NETFS_RREQ_NO_UNLOCK_FOLIO, &amp;rreq-&gt;flags))</div><div class='del'>-				_debug("no unlock");</div><div class='del'>-			else</div><div class='del'>-				folio_unlock(folio);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-</div><div class='del'>-	task_io_account_read(account);</div><div class='del'>-	if (rreq-&gt;netfs_ops-&gt;done)</div><div class='del'>-		rreq-&gt;netfs_ops-&gt;done(rreq);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Handle a short read.</div><div class='del'>- */</div><div class='del'>-static void netfs_rreq_short_read(struct netfs_read_request *rreq,</div><div class='del'>-				  struct netfs_read_subrequest *subreq)</div><div class='del'>-{</div><div class='del'>-	__clear_bit(NETFS_SREQ_SHORT_READ, &amp;subreq-&gt;flags);</div><div class='del'>-	__set_bit(NETFS_SREQ_SEEK_DATA_READ, &amp;subreq-&gt;flags);</div><div class='del'>-</div><div class='del'>-	netfs_stat(&amp;netfs_n_rh_short_read);</div><div class='del'>-	trace_netfs_sreq(subreq, netfs_sreq_trace_resubmit_short);</div><div class='del'>-</div><div class='del'>-	netfs_get_read_subrequest(subreq);</div><div class='del'>-	atomic_inc(&amp;rreq-&gt;nr_rd_ops);</div><div class='del'>-	if (subreq-&gt;source == NETFS_READ_FROM_CACHE)</div><div class='del'>-		netfs_read_from_cache(rreq, subreq, true);</div><div class='del'>-	else</div><div class='del'>-		netfs_read_from_server(rreq, subreq);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Resubmit any short or failed operations.  Returns true if we got the rreq</div><div class='del'>- * ref back.</div><div class='del'>- */</div><div class='del'>-static bool netfs_rreq_perform_resubmissions(struct netfs_read_request *rreq)</div><div class='del'>-{</div><div class='del'>-	struct netfs_read_subrequest *subreq;</div><div class='del'>-</div><div class='del'>-	WARN_ON(in_interrupt());</div><div class='del'>-</div><div class='del'>-	trace_netfs_rreq(rreq, netfs_rreq_trace_resubmit);</div><div class='del'>-</div><div class='del'>-	/* We don't want terminating submissions trying to wake us up whilst</div><div class='del'>-	 * we're still going through the list.</div><div class='del'>-	 */</div><div class='del'>-	atomic_inc(&amp;rreq-&gt;nr_rd_ops);</div><div class='del'>-</div><div class='del'>-	__clear_bit(NETFS_RREQ_INCOMPLETE_IO, &amp;rreq-&gt;flags);</div><div class='del'>-	list_for_each_entry(subreq, &amp;rreq-&gt;subrequests, rreq_link) {</div><div class='del'>-		if (subreq-&gt;error) {</div><div class='del'>-			if (subreq-&gt;source != NETFS_READ_FROM_CACHE)</div><div class='del'>-				break;</div><div class='del'>-			subreq-&gt;source = NETFS_DOWNLOAD_FROM_SERVER;</div><div class='del'>-			subreq-&gt;error = 0;</div><div class='del'>-			netfs_stat(&amp;netfs_n_rh_download_instead);</div><div class='del'>-			trace_netfs_sreq(subreq, netfs_sreq_trace_download_instead);</div><div class='del'>-			netfs_get_read_subrequest(subreq);</div><div class='del'>-			atomic_inc(&amp;rreq-&gt;nr_rd_ops);</div><div class='del'>-			netfs_read_from_server(rreq, subreq);</div><div class='del'>-		} else if (test_bit(NETFS_SREQ_SHORT_READ, &amp;subreq-&gt;flags)) {</div><div class='del'>-			netfs_rreq_short_read(rreq, subreq);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/* If we decrement nr_rd_ops to 0, the usage ref belongs to us. */</div><div class='del'>-	if (atomic_dec_and_test(&amp;rreq-&gt;nr_rd_ops))</div><div class='del'>-		return true;</div><div class='del'>-</div><div class='del'>-	wake_up_var(&amp;rreq-&gt;nr_rd_ops);</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Check to see if the data read is still valid.</div><div class='del'>- */</div><div class='del'>-static void netfs_rreq_is_still_valid(struct netfs_read_request *rreq)</div><div class='del'>-{</div><div class='del'>-	struct netfs_read_subrequest *subreq;</div><div class='del'>-</div><div class='del'>-	if (!rreq-&gt;netfs_ops-&gt;is_still_valid ||</div><div class='del'>-	    rreq-&gt;netfs_ops-&gt;is_still_valid(rreq))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(subreq, &amp;rreq-&gt;subrequests, rreq_link) {</div><div class='del'>-		if (subreq-&gt;source == NETFS_READ_FROM_CACHE) {</div><div class='del'>-			subreq-&gt;error = -ESTALE;</div><div class='del'>-			__set_bit(NETFS_RREQ_INCOMPLETE_IO, &amp;rreq-&gt;flags);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Assess the state of a read request and decide what to do next.</div><div class='del'>- *</div><div class='del'>- * Note that we could be in an ordinary kernel thread, on a workqueue or in</div><div class='del'>- * softirq context at this point.  We inherit a ref from the caller.</div><div class='del'>- */</div><div class='del'>-static void netfs_rreq_assess(struct netfs_read_request *rreq, bool was_async)</div><div class='del'>-{</div><div class='del'>-	trace_netfs_rreq(rreq, netfs_rreq_trace_assess);</div><div class='del'>-</div><div class='del'>-again:</div><div class='del'>-	netfs_rreq_is_still_valid(rreq);</div><div class='del'>-</div><div class='del'>-	if (!test_bit(NETFS_RREQ_FAILED, &amp;rreq-&gt;flags) &amp;&amp;</div><div class='del'>-	    test_bit(NETFS_RREQ_INCOMPLETE_IO, &amp;rreq-&gt;flags)) {</div><div class='del'>-		if (netfs_rreq_perform_resubmissions(rreq))</div><div class='del'>-			goto again;</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	netfs_rreq_unlock(rreq);</div><div class='del'>-</div><div class='del'>-	clear_bit_unlock(NETFS_RREQ_IN_PROGRESS, &amp;rreq-&gt;flags);</div><div class='del'>-	wake_up_bit(&amp;rreq-&gt;flags, NETFS_RREQ_IN_PROGRESS);</div><div class='del'>-</div><div class='del'>-	if (test_bit(NETFS_RREQ_WRITE_TO_CACHE, &amp;rreq-&gt;flags))</div><div class='del'>-		return netfs_rreq_write_to_cache(rreq, was_async);</div><div class='del'>-</div><div class='del'>-	netfs_rreq_completed(rreq, was_async);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void netfs_rreq_work(struct work_struct *work)</div><div class='del'>-{</div><div class='del'>-	struct netfs_read_request *rreq =</div><div class='del'>-		container_of(work, struct netfs_read_request, work);</div><div class='del'>-	netfs_rreq_assess(rreq, false);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Handle the completion of all outstanding I/O operations on a read request.</div><div class='del'>- * We inherit a ref from the caller.</div><div class='del'>- */</div><div class='del'>-static void netfs_rreq_terminated(struct netfs_read_request *rreq,</div><div class='del'>-				  bool was_async)</div><div class='del'>-{</div><div class='del'>-	if (test_bit(NETFS_RREQ_INCOMPLETE_IO, &amp;rreq-&gt;flags) &amp;&amp;</div><div class='del'>-	    was_async) {</div><div class='del'>-		if (!queue_work(system_unbound_wq, &amp;rreq-&gt;work))</div><div class='del'>-			BUG();</div><div class='del'>-	} else {</div><div class='del'>-		netfs_rreq_assess(rreq, was_async);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * netfs_subreq_terminated - Note the termination of an I/O operation.</div><div class='del'>- * @subreq: The I/O request that has terminated.</div><div class='del'>- * @transferred_or_error: The amount of data transferred or an error code.</div><div class='del'>- * @was_async: The termination was asynchronous</div><div class='del'>- *</div><div class='del'>- * This tells the read helper that a contributory I/O operation has terminated,</div><div class='del'>- * one way or another, and that it should integrate the results.</div><div class='del'>- *</div><div class='del'>- * The caller indicates in @transferred_or_error the outcome of the operation,</div><div class='del'>- * supplying a positive value to indicate the number of bytes transferred, 0 to</div><div class='del'>- * indicate a failure to transfer anything that should be retried or a negative</div><div class='del'>- * error code.  The helper will look after reissuing I/O operations as</div><div class='del'>- * appropriate and writing downloaded data to the cache.</div><div class='del'>- *</div><div class='del'>- * If @was_async is true, the caller might be running in softirq or interrupt</div><div class='del'>- * context and we can't sleep.</div><div class='del'>- */</div><div class='del'>-void netfs_subreq_terminated(struct netfs_read_subrequest *subreq,</div><div class='del'>-			     ssize_t transferred_or_error,</div><div class='del'>-			     bool was_async)</div><div class='del'>-{</div><div class='del'>-	struct netfs_read_request *rreq = subreq-&gt;rreq;</div><div class='del'>-	int u;</div><div class='del'>-</div><div class='del'>-	_enter("[%u]{%llx,%lx},%zd",</div><div class='del'>-	       subreq-&gt;debug_index, subreq-&gt;start, subreq-&gt;flags,</div><div class='del'>-	       transferred_or_error);</div><div class='del'>-</div><div class='del'>-	switch (subreq-&gt;source) {</div><div class='del'>-	case NETFS_READ_FROM_CACHE:</div><div class='del'>-		netfs_stat(&amp;netfs_n_rh_read_done);</div><div class='del'>-		break;</div><div class='del'>-	case NETFS_DOWNLOAD_FROM_SERVER:</div><div class='del'>-		netfs_stat(&amp;netfs_n_rh_download_done);</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (IS_ERR_VALUE(transferred_or_error)) {</div><div class='del'>-		subreq-&gt;error = transferred_or_error;</div><div class='del'>-		trace_netfs_failure(rreq, subreq, transferred_or_error,</div><div class='del'>-				    netfs_fail_read);</div><div class='del'>-		goto failed;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (WARN(transferred_or_error &gt; subreq-&gt;len - subreq-&gt;transferred,</div><div class='del'>-		 "Subreq overread: R%x[%x] %zd &gt; %zu - %zu",</div><div class='del'>-		 rreq-&gt;debug_id, subreq-&gt;debug_index,</div><div class='del'>-		 transferred_or_error, subreq-&gt;len, subreq-&gt;transferred))</div><div class='del'>-		transferred_or_error = subreq-&gt;len - subreq-&gt;transferred;</div><div class='del'>-</div><div class='del'>-	subreq-&gt;error = 0;</div><div class='del'>-	subreq-&gt;transferred += transferred_or_error;</div><div class='del'>-	if (subreq-&gt;transferred &lt; subreq-&gt;len)</div><div class='del'>-		goto incomplete;</div><div class='del'>-</div><div class='del'>-complete:</div><div class='del'>-	__clear_bit(NETFS_SREQ_NO_PROGRESS, &amp;subreq-&gt;flags);</div><div class='del'>-	if (test_bit(NETFS_SREQ_WRITE_TO_CACHE, &amp;subreq-&gt;flags))</div><div class='del'>-		set_bit(NETFS_RREQ_WRITE_TO_CACHE, &amp;rreq-&gt;flags);</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	trace_netfs_sreq(subreq, netfs_sreq_trace_terminated);</div><div class='del'>-</div><div class='del'>-	/* If we decrement nr_rd_ops to 0, the ref belongs to us. */</div><div class='del'>-	u = atomic_dec_return(&amp;rreq-&gt;nr_rd_ops);</div><div class='del'>-	if (u == 0)</div><div class='del'>-		netfs_rreq_terminated(rreq, was_async);</div><div class='del'>-	else if (u == 1)</div><div class='del'>-		wake_up_var(&amp;rreq-&gt;nr_rd_ops);</div><div class='del'>-</div><div class='del'>-	netfs_put_subrequest(subreq, was_async);</div><div class='del'>-	return;</div><div class='del'>-</div><div class='del'>-incomplete:</div><div class='del'>-	if (test_bit(NETFS_SREQ_CLEAR_TAIL, &amp;subreq-&gt;flags)) {</div><div class='del'>-		netfs_clear_unread(subreq);</div><div class='del'>-		subreq-&gt;transferred = subreq-&gt;len;</div><div class='del'>-		goto complete;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (transferred_or_error == 0) {</div><div class='del'>-		if (__test_and_set_bit(NETFS_SREQ_NO_PROGRESS, &amp;subreq-&gt;flags)) {</div><div class='del'>-			subreq-&gt;error = -ENODATA;</div><div class='del'>-			goto failed;</div><div class='del'>-		}</div><div class='del'>-	} else {</div><div class='del'>-		__clear_bit(NETFS_SREQ_NO_PROGRESS, &amp;subreq-&gt;flags);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	__set_bit(NETFS_SREQ_SHORT_READ, &amp;subreq-&gt;flags);</div><div class='del'>-	set_bit(NETFS_RREQ_INCOMPLETE_IO, &amp;rreq-&gt;flags);</div><div class='del'>-	goto out;</div><div class='del'>-</div><div class='del'>-failed:</div><div class='del'>-	if (subreq-&gt;source == NETFS_READ_FROM_CACHE) {</div><div class='del'>-		netfs_stat(&amp;netfs_n_rh_read_failed);</div><div class='del'>-		set_bit(NETFS_RREQ_INCOMPLETE_IO, &amp;rreq-&gt;flags);</div><div class='del'>-	} else {</div><div class='del'>-		netfs_stat(&amp;netfs_n_rh_download_failed);</div><div class='del'>-		set_bit(NETFS_RREQ_FAILED, &amp;rreq-&gt;flags);</div><div class='del'>-		rreq-&gt;error = subreq-&gt;error;</div><div class='del'>-	}</div><div class='del'>-	goto out;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(netfs_subreq_terminated);</div><div class='del'>-</div><div class='del'>-static enum netfs_read_source netfs_cache_prepare_read(struct netfs_read_subrequest *subreq,</div><div class='del'>-						       loff_t i_size)</div><div class='del'>-{</div><div class='del'>-	struct netfs_read_request *rreq = subreq-&gt;rreq;</div><div class='del'>-	struct netfs_cache_resources *cres = &amp;rreq-&gt;cache_resources;</div><div class='del'>-</div><div class='del'>-	if (cres-&gt;ops)</div><div class='del'>-		return cres-&gt;ops-&gt;prepare_read(subreq, i_size);</div><div class='del'>-	if (subreq-&gt;start &gt;= rreq-&gt;i_size)</div><div class='del'>-		return NETFS_FILL_WITH_ZEROES;</div><div class='del'>-	return NETFS_DOWNLOAD_FROM_SERVER;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Work out what sort of subrequest the next one will be.</div><div class='del'>- */</div><div class='del'>-static enum netfs_read_source</div><div class='del'>-netfs_rreq_prepare_read(struct netfs_read_request *rreq,</div><div class='del'>-			struct netfs_read_subrequest *subreq)</div><div class='del'>-{</div><div class='del'>-	enum netfs_read_source source;</div><div class='del'>-</div><div class='del'>-	_enter("%llx-%llx,%llx", subreq-&gt;start, subreq-&gt;start + subreq-&gt;len, rreq-&gt;i_size);</div><div class='del'>-</div><div class='del'>-	source = netfs_cache_prepare_read(subreq, rreq-&gt;i_size);</div><div class='del'>-	if (source == NETFS_INVALID_READ)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	if (source == NETFS_DOWNLOAD_FROM_SERVER) {</div><div class='del'>-		/* Call out to the netfs to let it shrink the request to fit</div><div class='del'>-		 * its own I/O sizes and boundaries.  If it shinks it here, it</div><div class='del'>-		 * will be called again to make simultaneous calls; if it wants</div><div class='del'>-		 * to make serial calls, it can indicate a short read and then</div><div class='del'>-		 * we will call it again.</div><div class='del'>-		 */</div><div class='del'>-		if (subreq-&gt;len &gt; rreq-&gt;i_size - subreq-&gt;start)</div><div class='del'>-			subreq-&gt;len = rreq-&gt;i_size - subreq-&gt;start;</div><div class='del'>-</div><div class='del'>-		if (rreq-&gt;netfs_ops-&gt;clamp_length &amp;&amp;</div><div class='del'>-		    !rreq-&gt;netfs_ops-&gt;clamp_length(subreq)) {</div><div class='del'>-			source = NETFS_INVALID_READ;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (WARN_ON(subreq-&gt;len == 0))</div><div class='del'>-		source = NETFS_INVALID_READ;</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	subreq-&gt;source = source;</div><div class='del'>-	trace_netfs_sreq(subreq, netfs_sreq_trace_prepare);</div><div class='del'>-	return source;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Slice off a piece of a read request and submit an I/O request for it.</div><div class='del'>- */</div><div class='del'>-static bool netfs_rreq_submit_slice(struct netfs_read_request *rreq,</div><div class='del'>-				    unsigned int *_debug_index)</div><div class='del'>-{</div><div class='del'>-	struct netfs_read_subrequest *subreq;</div><div class='del'>-	enum netfs_read_source source;</div><div class='del'>-</div><div class='del'>-	subreq = netfs_alloc_subrequest(rreq);</div><div class='del'>-	if (!subreq)</div><div class='del'>-		return false;</div><div class='del'>-</div><div class='del'>-	subreq-&gt;debug_index	= (*_debug_index)++;</div><div class='del'>-	subreq-&gt;start		= rreq-&gt;start + rreq-&gt;submitted;</div><div class='del'>-	subreq-&gt;len		= rreq-&gt;len   - rreq-&gt;submitted;</div><div class='del'>-</div><div class='del'>-	_debug("slice %llx,%zx,%zx", subreq-&gt;start, subreq-&gt;len, rreq-&gt;submitted);</div><div class='del'>-	list_add_tail(&amp;subreq-&gt;rreq_link, &amp;rreq-&gt;subrequests);</div><div class='del'>-</div><div class='del'>-	/* Call out to the cache to find out what it can do with the remaining</div><div class='del'>-	 * subset.  It tells us in subreq-&gt;flags what it decided should be done</div><div class='del'>-	 * and adjusts subreq-&gt;len down if the subset crosses a cache boundary.</div><div class='del'>-	 *</div><div class='del'>-	 * Then when we hand the subset, it can choose to take a subset of that</div><div class='del'>-	 * (the starts must coincide), in which case, we go around the loop</div><div class='del'>-	 * again and ask it to download the next piece.</div><div class='del'>-	 */</div><div class='del'>-	source = netfs_rreq_prepare_read(rreq, subreq);</div><div class='del'>-	if (source == NETFS_INVALID_READ)</div><div class='del'>-		goto subreq_failed;</div><div class='del'>-</div><div class='del'>-	atomic_inc(&amp;rreq-&gt;nr_rd_ops);</div><div class='del'>-</div><div class='del'>-	rreq-&gt;submitted += subreq-&gt;len;</div><div class='del'>-</div><div class='del'>-	trace_netfs_sreq(subreq, netfs_sreq_trace_submit);</div><div class='del'>-	switch (source) {</div><div class='del'>-	case NETFS_FILL_WITH_ZEROES:</div><div class='del'>-		netfs_fill_with_zeroes(rreq, subreq);</div><div class='del'>-		break;</div><div class='del'>-	case NETFS_DOWNLOAD_FROM_SERVER:</div><div class='del'>-		netfs_read_from_server(rreq, subreq);</div><div class='del'>-		break;</div><div class='del'>-	case NETFS_READ_FROM_CACHE:</div><div class='del'>-		netfs_read_from_cache(rreq, subreq, false);</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		BUG();</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return true;</div><div class='del'>-</div><div class='del'>-subreq_failed:</div><div class='del'>-	rreq-&gt;error = subreq-&gt;error;</div><div class='del'>-	netfs_put_subrequest(subreq, false);</div><div class='del'>-	return false;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void netfs_cache_expand_readahead(struct netfs_read_request *rreq,</div><div class='del'>-					 loff_t *_start, size_t *_len, loff_t i_size)</div><div class='del'>-{</div><div class='del'>-	struct netfs_cache_resources *cres = &amp;rreq-&gt;cache_resources;</div><div class='del'>-</div><div class='del'>-	if (cres-&gt;ops &amp;&amp; cres-&gt;ops-&gt;expand_readahead)</div><div class='del'>-		cres-&gt;ops-&gt;expand_readahead(cres, _start, _len, i_size);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void netfs_rreq_expand(struct netfs_read_request *rreq,</div><div class='del'>-			      struct readahead_control *ractl)</div><div class='del'>-{</div><div class='del'>-	/* Give the cache a chance to change the request parameters.  The</div><div class='del'>-	 * resultant request must contain the original region.</div><div class='del'>-	 */</div><div class='del'>-	netfs_cache_expand_readahead(rreq, &amp;rreq-&gt;start, &amp;rreq-&gt;len, rreq-&gt;i_size);</div><div class='del'>-</div><div class='del'>-	/* Give the netfs a chance to change the request parameters.  The</div><div class='del'>-	 * resultant request must contain the original region.</div><div class='del'>-	 */</div><div class='del'>-	if (rreq-&gt;netfs_ops-&gt;expand_readahead)</div><div class='del'>-		rreq-&gt;netfs_ops-&gt;expand_readahead(rreq);</div><div class='del'>-</div><div class='del'>-	/* Expand the request if the cache wants it to start earlier.  Note</div><div class='del'>-	 * that the expansion may get further extended if the VM wishes to</div><div class='del'>-	 * insert THPs and the preferred start and/or end wind up in the middle</div><div class='del'>-	 * of THPs.</div><div class='del'>-	 *</div><div class='del'>-	 * If this is the case, however, the THP size should be an integer</div><div class='del'>-	 * multiple of the cache granule size, so we get a whole number of</div><div class='del'>-	 * granules to deal with.</div><div class='del'>-	 */</div><div class='del'>-	if (rreq-&gt;start  != readahead_pos(ractl) ||</div><div class='del'>-	    rreq-&gt;len != readahead_length(ractl)) {</div><div class='del'>-		readahead_expand(ractl, rreq-&gt;start, rreq-&gt;len);</div><div class='del'>-		rreq-&gt;start  = readahead_pos(ractl);</div><div class='del'>-		rreq-&gt;len = readahead_length(ractl);</div><div class='del'>-</div><div class='del'>-		trace_netfs_read(rreq, readahead_pos(ractl), readahead_length(ractl),</div><div class='del'>-				 netfs_read_trace_expanded);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * netfs_readahead - Helper to manage a read request</div><div class='del'>- * @ractl: The description of the readahead request</div><div class='del'>- * @ops: The network filesystem's operations for the helper to use</div><div class='del'>- * @netfs_priv: Private netfs data to be retained in the request</div><div class='del'>- *</div><div class='del'>- * Fulfil a readahead request by drawing data from the cache if possible, or</div><div class='del'>- * the netfs if not.  Space beyond the EOF is zero-filled.  Multiple I/O</div><div class='del'>- * requests from different sources will get munged together.  If necessary, the</div><div class='del'>- * readahead window can be expanded in either direction to a more convenient</div><div class='del'>- * alighment for RPC efficiency or to make storage in the cache feasible.</div><div class='del'>- *</div><div class='del'>- * The calling netfs must provide a table of operations, only one of which,</div><div class='del'>- * issue_op, is mandatory.  It may also be passed a private token, which will</div><div class='del'>- * be retained in rreq-&gt;netfs_priv and will be cleaned up by ops-&gt;cleanup().</div><div class='del'>- *</div><div class='del'>- * This is usable whether or not caching is enabled.</div><div class='del'>- */</div><div class='del'>-void netfs_readahead(struct readahead_control *ractl,</div><div class='del'>-		     const struct netfs_read_request_ops *ops,</div><div class='del'>-		     void *netfs_priv)</div><div class='del'>-{</div><div class='del'>-	struct netfs_read_request *rreq;</div><div class='del'>-	unsigned int debug_index = 0;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	_enter("%lx,%x", readahead_index(ractl), readahead_count(ractl));</div><div class='del'>-</div><div class='del'>-	if (readahead_count(ractl) == 0)</div><div class='del'>-		goto cleanup;</div><div class='del'>-</div><div class='del'>-	rreq = netfs_alloc_read_request(ops, netfs_priv, ractl-&gt;file);</div><div class='del'>-	if (!rreq)</div><div class='del'>-		goto cleanup;</div><div class='del'>-	rreq-&gt;mapping	= ractl-&gt;mapping;</div><div class='del'>-	rreq-&gt;start	= readahead_pos(ractl);</div><div class='del'>-	rreq-&gt;len	= readahead_length(ractl);</div><div class='del'>-</div><div class='del'>-	if (ops-&gt;begin_cache_operation) {</div><div class='del'>-		ret = ops-&gt;begin_cache_operation(rreq);</div><div class='del'>-		if (ret == -ENOMEM || ret == -EINTR || ret == -ERESTARTSYS)</div><div class='del'>-			goto cleanup_free;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	netfs_stat(&amp;netfs_n_rh_readahead);</div><div class='del'>-	trace_netfs_read(rreq, readahead_pos(ractl), readahead_length(ractl),</div><div class='del'>-			 netfs_read_trace_readahead);</div><div class='del'>-</div><div class='del'>-	netfs_rreq_expand(rreq, ractl);</div><div class='del'>-</div><div class='del'>-	atomic_set(&amp;rreq-&gt;nr_rd_ops, 1);</div><div class='del'>-	do {</div><div class='del'>-		if (!netfs_rreq_submit_slice(rreq, &amp;debug_index))</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-	} while (rreq-&gt;submitted &lt; rreq-&gt;len);</div><div class='del'>-</div><div class='del'>-	/* Drop the refs on the folios here rather than in the cache or</div><div class='del'>-	 * filesystem.  The locks will be dropped in netfs_rreq_unlock().</div><div class='del'>-	 */</div><div class='del'>-	while (readahead_folio(ractl))</div><div class='del'>-		;</div><div class='del'>-</div><div class='del'>-	/* If we decrement nr_rd_ops to 0, the ref belongs to us. */</div><div class='del'>-	if (atomic_dec_and_test(&amp;rreq-&gt;nr_rd_ops))</div><div class='del'>-		netfs_rreq_assess(rreq, false);</div><div class='del'>-	return;</div><div class='del'>-</div><div class='del'>-cleanup_free:</div><div class='del'>-	netfs_put_read_request(rreq, false);</div><div class='del'>-	return;</div><div class='del'>-cleanup:</div><div class='del'>-	if (netfs_priv)</div><div class='del'>-		ops-&gt;cleanup(ractl-&gt;mapping, netfs_priv);</div><div class='del'>-	return;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(netfs_readahead);</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * netfs_readpage - Helper to manage a readpage request</div><div class='del'>- * @file: The file to read from</div><div class='del'>- * @folio: The folio to read</div><div class='del'>- * @ops: The network filesystem's operations for the helper to use</div><div class='del'>- * @netfs_priv: Private netfs data to be retained in the request</div><div class='del'>- *</div><div class='del'>- * Fulfil a readpage request by drawing data from the cache if possible, or the</div><div class='del'>- * netfs if not.  Space beyond the EOF is zero-filled.  Multiple I/O requests</div><div class='del'>- * from different sources will get munged together.</div><div class='del'>- *</div><div class='del'>- * The calling netfs must provide a table of operations, only one of which,</div><div class='del'>- * issue_op, is mandatory.  It may also be passed a private token, which will</div><div class='del'>- * be retained in rreq-&gt;netfs_priv and will be cleaned up by ops-&gt;cleanup().</div><div class='del'>- *</div><div class='del'>- * This is usable whether or not caching is enabled.</div><div class='del'>- */</div><div class='del'>-int netfs_readpage(struct file *file,</div><div class='del'>-		   struct folio *folio,</div><div class='del'>-		   const struct netfs_read_request_ops *ops,</div><div class='del'>-		   void *netfs_priv)</div><div class='del'>-{</div><div class='del'>-	struct netfs_read_request *rreq;</div><div class='del'>-	unsigned int debug_index = 0;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	_enter("%lx", folio_index(folio));</div><div class='del'>-</div><div class='del'>-	rreq = netfs_alloc_read_request(ops, netfs_priv, file);</div><div class='del'>-	if (!rreq) {</div><div class='del'>-		if (netfs_priv)</div><div class='del'>-			ops-&gt;cleanup(netfs_priv, folio_file_mapping(folio));</div><div class='del'>-		folio_unlock(folio);</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	}</div><div class='del'>-	rreq-&gt;mapping	= folio_file_mapping(folio);</div><div class='del'>-	rreq-&gt;start	= folio_file_pos(folio);</div><div class='del'>-	rreq-&gt;len	= folio_size(folio);</div><div class='del'>-</div><div class='del'>-	if (ops-&gt;begin_cache_operation) {</div><div class='del'>-		ret = ops-&gt;begin_cache_operation(rreq);</div><div class='del'>-		if (ret == -ENOMEM || ret == -EINTR || ret == -ERESTARTSYS) {</div><div class='del'>-			folio_unlock(folio);</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	netfs_stat(&amp;netfs_n_rh_readpage);</div><div class='del'>-	trace_netfs_read(rreq, rreq-&gt;start, rreq-&gt;len, netfs_read_trace_readpage);</div><div class='del'>-</div><div class='del'>-	netfs_get_read_request(rreq);</div><div class='del'>-</div><div class='del'>-	atomic_set(&amp;rreq-&gt;nr_rd_ops, 1);</div><div class='del'>-	do {</div><div class='del'>-		if (!netfs_rreq_submit_slice(rreq, &amp;debug_index))</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-	} while (rreq-&gt;submitted &lt; rreq-&gt;len);</div><div class='del'>-</div><div class='del'>-	/* Keep nr_rd_ops incremented so that the ref always belongs to us, and</div><div class='del'>-	 * the service code isn't punted off to a random thread pool to</div><div class='del'>-	 * process.</div><div class='del'>-	 */</div><div class='del'>-	do {</div><div class='del'>-		wait_var_event(&amp;rreq-&gt;nr_rd_ops, atomic_read(&amp;rreq-&gt;nr_rd_ops) == 1);</div><div class='del'>-		netfs_rreq_assess(rreq, false);</div><div class='del'>-	} while (test_bit(NETFS_RREQ_IN_PROGRESS, &amp;rreq-&gt;flags));</div><div class='del'>-</div><div class='del'>-	ret = rreq-&gt;error;</div><div class='del'>-	if (ret == 0 &amp;&amp; rreq-&gt;submitted &lt; rreq-&gt;len) {</div><div class='del'>-		trace_netfs_failure(rreq, NULL, ret, netfs_fail_short_readpage);</div><div class='del'>-		ret = -EIO;</div><div class='del'>-	}</div><div class='del'>-out:</div><div class='del'>-	netfs_put_read_request(rreq, false);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(netfs_readpage);</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * netfs_skip_folio_read - prep a folio for writing without reading first</div><div class='del'>- * @folio: The folio being prepared</div><div class='del'>- * @pos: starting position for the write</div><div class='del'>- * @len: length of write</div><div class='del'>- *</div><div class='del'>- * In some cases, write_begin doesn't need to read at all:</div><div class='del'>- * - full folio write</div><div class='del'>- * - write that lies in a folio that is completely beyond EOF</div><div class='del'>- * - write that covers the folio from start to EOF or beyond it</div><div class='del'>- *</div><div class='del'>- * If any of these criteria are met, then zero out the unwritten parts</div><div class='del'>- * of the folio and return true. Otherwise, return false.</div><div class='del'>- */</div><div class='del'>-static bool netfs_skip_folio_read(struct folio *folio, loff_t pos, size_t len)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = folio_inode(folio);</div><div class='del'>-	loff_t i_size = i_size_read(inode);</div><div class='del'>-	size_t offset = offset_in_folio(folio, pos);</div><div class='del'>-</div><div class='del'>-	/* Full folio write */</div><div class='del'>-	if (offset == 0 &amp;&amp; len &gt;= folio_size(folio))</div><div class='del'>-		return true;</div><div class='del'>-</div><div class='del'>-	/* pos beyond last folio in the file */</div><div class='del'>-	if (pos - offset &gt;= i_size)</div><div class='del'>-		goto zero_out;</div><div class='del'>-</div><div class='del'>-	/* Write that covers from the start of the folio to EOF or beyond */</div><div class='del'>-	if (offset == 0 &amp;&amp; (pos + len) &gt;= i_size)</div><div class='del'>-		goto zero_out;</div><div class='del'>-</div><div class='del'>-	return false;</div><div class='del'>-zero_out:</div><div class='del'>-	zero_user_segments(&amp;folio-&gt;page, 0, offset, offset + len, folio_size(folio));</div><div class='del'>-	return true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * netfs_write_begin - Helper to prepare for writing</div><div class='del'>- * @file: The file to read from</div><div class='del'>- * @mapping: The mapping to read from</div><div class='del'>- * @pos: File position at which the write will begin</div><div class='del'>- * @len: The length of the write (may extend beyond the end of the folio chosen)</div><div class='del'>- * @aop_flags: AOP_* flags</div><div class='del'>- * @_folio: Where to put the resultant folio</div><div class='del'>- * @_fsdata: Place for the netfs to store a cookie</div><div class='del'>- * @ops: The network filesystem's operations for the helper to use</div><div class='del'>- * @netfs_priv: Private netfs data to be retained in the request</div><div class='del'>- *</div><div class='del'>- * Pre-read data for a write-begin request by drawing data from the cache if</div><div class='del'>- * possible, or the netfs if not.  Space beyond the EOF is zero-filled.</div><div class='del'>- * Multiple I/O requests from different sources will get munged together.  If</div><div class='del'>- * necessary, the readahead window can be expanded in either direction to a</div><div class='del'>- * more convenient alighment for RPC efficiency or to make storage in the cache</div><div class='del'>- * feasible.</div><div class='del'>- *</div><div class='del'>- * The calling netfs must provide a table of operations, only one of which,</div><div class='del'>- * issue_op, is mandatory.</div><div class='del'>- *</div><div class='del'>- * The check_write_begin() operation can be provided to check for and flush</div><div class='del'>- * conflicting writes once the folio is grabbed and locked.  It is passed a</div><div class='del'>- * pointer to the fsdata cookie that gets returned to the VM to be passed to</div><div class='del'>- * write_end.  It is permitted to sleep.  It should return 0 if the request</div><div class='del'>- * should go ahead; unlock the folio and return -EAGAIN to cause the folio to</div><div class='del'>- * be regot; or return an error.</div><div class='del'>- *</div><div class='del'>- * This is usable whether or not caching is enabled.</div><div class='del'>- */</div><div class='del'>-int netfs_write_begin(struct file *file, struct address_space *mapping,</div><div class='del'>-		      loff_t pos, unsigned int len, unsigned int aop_flags,</div><div class='del'>-		      struct folio **_folio, void **_fsdata,</div><div class='del'>-		      const struct netfs_read_request_ops *ops,</div><div class='del'>-		      void *netfs_priv)</div><div class='del'>-{</div><div class='del'>-	struct netfs_read_request *rreq;</div><div class='del'>-	struct folio *folio;</div><div class='del'>-	struct inode *inode = file_inode(file);</div><div class='del'>-	unsigned int debug_index = 0, fgp_flags;</div><div class='del'>-	pgoff_t index = pos &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	DEFINE_READAHEAD(ractl, file, NULL, mapping, index);</div><div class='del'>-</div><div class='del'>-retry:</div><div class='del'>-	fgp_flags = FGP_LOCK | FGP_WRITE | FGP_CREAT | FGP_STABLE;</div><div class='del'>-	if (aop_flags &amp; AOP_FLAG_NOFS)</div><div class='del'>-		fgp_flags |= FGP_NOFS;</div><div class='del'>-	folio = __filemap_get_folio(mapping, index, fgp_flags,</div><div class='del'>-				    mapping_gfp_mask(mapping));</div><div class='del'>-	if (!folio)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-</div><div class='del'>-	if (ops-&gt;check_write_begin) {</div><div class='del'>-		/* Allow the netfs (eg. ceph) to flush conflicts. */</div><div class='del'>-		ret = ops-&gt;check_write_begin(file, pos, len, folio, _fsdata);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			trace_netfs_failure(NULL, NULL, ret, netfs_fail_check_write_begin);</div><div class='del'>-			if (ret == -EAGAIN)</div><div class='del'>-				goto retry;</div><div class='del'>-			goto error;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (folio_test_uptodate(folio))</div><div class='del'>-		goto have_folio;</div><div class='del'>-</div><div class='del'>-	/* If the page is beyond the EOF, we want to clear it - unless it's</div><div class='del'>-	 * within the cache granule containing the EOF, in which case we need</div><div class='del'>-	 * to preload the granule.</div><div class='del'>-	 */</div><div class='del'>-	if (!ops-&gt;is_cache_enabled(inode) &amp;&amp;</div><div class='del'>-	    netfs_skip_folio_read(folio, pos, len)) {</div><div class='del'>-		netfs_stat(&amp;netfs_n_rh_write_zskip);</div><div class='del'>-		goto have_folio_no_wait;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = -ENOMEM;</div><div class='del'>-	rreq = netfs_alloc_read_request(ops, netfs_priv, file);</div><div class='del'>-	if (!rreq)</div><div class='del'>-		goto error;</div><div class='del'>-	rreq-&gt;mapping		= folio_file_mapping(folio);</div><div class='del'>-	rreq-&gt;start		= folio_file_pos(folio);</div><div class='del'>-	rreq-&gt;len		= folio_size(folio);</div><div class='del'>-	rreq-&gt;no_unlock_folio	= folio_index(folio);</div><div class='del'>-	__set_bit(NETFS_RREQ_NO_UNLOCK_FOLIO, &amp;rreq-&gt;flags);</div><div class='del'>-	netfs_priv = NULL;</div><div class='del'>-</div><div class='del'>-	if (ops-&gt;begin_cache_operation) {</div><div class='del'>-		ret = ops-&gt;begin_cache_operation(rreq);</div><div class='del'>-		if (ret == -ENOMEM || ret == -EINTR || ret == -ERESTARTSYS)</div><div class='del'>-			goto error_put;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	netfs_stat(&amp;netfs_n_rh_write_begin);</div><div class='del'>-	trace_netfs_read(rreq, pos, len, netfs_read_trace_write_begin);</div><div class='del'>-</div><div class='del'>-	/* Expand the request to meet caching requirements and download</div><div class='del'>-	 * preferences.</div><div class='del'>-	 */</div><div class='del'>-	ractl._nr_pages = folio_nr_pages(folio);</div><div class='del'>-	netfs_rreq_expand(rreq, &amp;ractl);</div><div class='del'>-	netfs_get_read_request(rreq);</div><div class='del'>-</div><div class='del'>-	/* We hold the folio locks, so we can drop the references */</div><div class='del'>-	folio_get(folio);</div><div class='del'>-	while (readahead_folio(&amp;ractl))</div><div class='del'>-		;</div><div class='del'>-</div><div class='del'>-	atomic_set(&amp;rreq-&gt;nr_rd_ops, 1);</div><div class='del'>-	do {</div><div class='del'>-		if (!netfs_rreq_submit_slice(rreq, &amp;debug_index))</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-	} while (rreq-&gt;submitted &lt; rreq-&gt;len);</div><div class='del'>-</div><div class='del'>-	/* Keep nr_rd_ops incremented so that the ref always belongs to us, and</div><div class='del'>-	 * the service code isn't punted off to a random thread pool to</div><div class='del'>-	 * process.</div><div class='del'>-	 */</div><div class='del'>-	for (;;) {</div><div class='del'>-		wait_var_event(&amp;rreq-&gt;nr_rd_ops, atomic_read(&amp;rreq-&gt;nr_rd_ops) == 1);</div><div class='del'>-		netfs_rreq_assess(rreq, false);</div><div class='del'>-		if (!test_bit(NETFS_RREQ_IN_PROGRESS, &amp;rreq-&gt;flags))</div><div class='del'>-			break;</div><div class='del'>-		cond_resched();</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	ret = rreq-&gt;error;</div><div class='del'>-	if (ret == 0 &amp;&amp; rreq-&gt;submitted &lt; rreq-&gt;len) {</div><div class='del'>-		trace_netfs_failure(rreq, NULL, ret, netfs_fail_short_write_begin);</div><div class='del'>-		ret = -EIO;</div><div class='del'>-	}</div><div class='del'>-	netfs_put_read_request(rreq, false);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto error;</div><div class='del'>-</div><div class='del'>-have_folio:</div><div class='del'>-	ret = folio_wait_fscache_killable(folio);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		goto error;</div><div class='del'>-have_folio_no_wait:</div><div class='del'>-	if (netfs_priv)</div><div class='del'>-		ops-&gt;cleanup(netfs_priv, mapping);</div><div class='del'>-	*_folio = folio;</div><div class='del'>-	_leave(" = 0");</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-error_put:</div><div class='del'>-	netfs_put_read_request(rreq, false);</div><div class='del'>-error:</div><div class='del'>-	folio_unlock(folio);</div><div class='del'>-	folio_put(folio);</div><div class='del'>-	if (netfs_priv)</div><div class='del'>-		ops-&gt;cleanup(netfs_priv, mapping);</div><div class='del'>-	_leave(" = %d", ret);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL(netfs_write_begin);</div><div class='head'>diff --git a/fs/netfs/read_pgpriv2.c b/fs/netfs/read_pgpriv2.c<br/>new file mode 100644<br/>index 000000000000..a1489aa29f78<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/read_pgpriv2.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/read_pgpriv2.c</a></div><div class='hunk'>@@ -0,0 +1,232 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-only</div><div class='add'>+/* Read with PG_private_2 [DEPRECATED].</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2024 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/export.h&gt;</div><div class='add'>+#include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/mm.h&gt;</div><div class='add'>+#include &lt;linux/pagemap.h&gt;</div><div class='add'>+#include &lt;linux/slab.h&gt;</div><div class='add'>+#include &lt;linux/task_io_accounting_ops.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * [DEPRECATED] Copy a folio to the cache with PG_private_2 set.</div><div class='add'>+ */</div><div class='add'>+static void netfs_pgpriv2_copy_folio(struct netfs_io_request *creq, struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_stream *cache = &amp;creq-&gt;io_streams[1];</div><div class='add'>+	size_t fsize = folio_size(folio), flen = fsize;</div><div class='add'>+	loff_t fpos = folio_pos(folio), i_size;</div><div class='add'>+	bool to_eof = false;</div><div class='add'>+</div><div class='add'>+	_enter("");</div><div class='add'>+</div><div class='add'>+	/* netfs_perform_write() may shift i_size around the page or from out</div><div class='add'>+	 * of the page to beyond it, but cannot move i_size into or through the</div><div class='add'>+	 * page since we have it locked.</div><div class='add'>+	 */</div><div class='add'>+	i_size = i_size_read(creq-&gt;inode);</div><div class='add'>+</div><div class='add'>+	if (fpos &gt;= i_size) {</div><div class='add'>+		/* mmap beyond eof. */</div><div class='add'>+		_debug("beyond eof");</div><div class='add'>+		folio_end_private_2(folio);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (fpos + fsize &gt; creq-&gt;i_size)</div><div class='add'>+		creq-&gt;i_size = i_size;</div><div class='add'>+</div><div class='add'>+	if (flen &gt; i_size - fpos) {</div><div class='add'>+		flen = i_size - fpos;</div><div class='add'>+		to_eof = true;</div><div class='add'>+	} else if (flen == i_size - fpos) {</div><div class='add'>+		to_eof = true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	_debug("folio %zx %zx", flen, fsize);</div><div class='add'>+</div><div class='add'>+	trace_netfs_folio(folio, netfs_folio_trace_store_copy);</div><div class='add'>+</div><div class='add'>+	/* Attach the folio to the rolling buffer. */</div><div class='add'>+	if (rolling_buffer_append(&amp;creq-&gt;buffer, folio, 0) &lt; 0) {</div><div class='add'>+		clear_bit(NETFS_RREQ_FOLIO_COPY_TO_CACHE, &amp;creq-&gt;flags);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	cache-&gt;submit_extendable_to = fsize;</div><div class='add'>+	cache-&gt;submit_off = 0;</div><div class='add'>+	cache-&gt;submit_len = flen;</div><div class='add'>+</div><div class='add'>+	/* Attach the folio to one or more subrequests.  For a big folio, we</div><div class='add'>+	 * could end up with thousands of subrequests if the wsize is small -</div><div class='add'>+	 * but we might need to wait during the creation of subrequests for</div><div class='add'>+	 * network resources (eg. SMB credits).</div><div class='add'>+	 */</div><div class='add'>+	do {</div><div class='add'>+		ssize_t part;</div><div class='add'>+</div><div class='add'>+		creq-&gt;buffer.iter.iov_offset = cache-&gt;submit_off;</div><div class='add'>+</div><div class='add'>+		atomic64_set(&amp;creq-&gt;issued_to, fpos + cache-&gt;submit_off);</div><div class='add'>+		cache-&gt;submit_extendable_to = fsize - cache-&gt;submit_off;</div><div class='add'>+		part = netfs_advance_write(creq, cache, fpos + cache-&gt;submit_off,</div><div class='add'>+					   cache-&gt;submit_len, to_eof);</div><div class='add'>+		cache-&gt;submit_off += part;</div><div class='add'>+		if (part &gt; cache-&gt;submit_len)</div><div class='add'>+			cache-&gt;submit_len = 0;</div><div class='add'>+		else</div><div class='add'>+			cache-&gt;submit_len -= part;</div><div class='add'>+	} while (cache-&gt;submit_len &gt; 0);</div><div class='add'>+</div><div class='add'>+	creq-&gt;buffer.iter.iov_offset = 0;</div><div class='add'>+	rolling_buffer_advance(&amp;creq-&gt;buffer, fsize);</div><div class='add'>+	atomic64_set(&amp;creq-&gt;issued_to, fpos + fsize);</div><div class='add'>+</div><div class='add'>+	if (flen &lt; fsize)</div><div class='add'>+		netfs_issue_write(creq, cache);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * [DEPRECATED] Set up copying to the cache.</div><div class='add'>+ */</div><div class='add'>+static struct netfs_io_request *netfs_pgpriv2_begin_copy_to_cache(</div><div class='add'>+	struct netfs_io_request *rreq, struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *creq;</div><div class='add'>+</div><div class='add'>+	if (!fscache_resources_valid(&amp;rreq-&gt;cache_resources))</div><div class='add'>+		goto cancel;</div><div class='add'>+</div><div class='add'>+	creq = netfs_create_write_req(rreq-&gt;mapping, NULL, folio_pos(folio),</div><div class='add'>+				      NETFS_PGPRIV2_COPY_TO_CACHE);</div><div class='add'>+	if (IS_ERR(creq))</div><div class='add'>+		goto cancel;</div><div class='add'>+</div><div class='add'>+	if (!creq-&gt;io_streams[1].avail)</div><div class='add'>+		goto cancel_put;</div><div class='add'>+</div><div class='add'>+	__set_bit(NETFS_RREQ_OFFLOAD_COLLECTION, &amp;creq-&gt;flags);</div><div class='add'>+	trace_netfs_copy2cache(rreq, creq);</div><div class='add'>+	trace_netfs_write(creq, netfs_write_trace_copy_to_cache);</div><div class='add'>+	netfs_stat(&amp;netfs_n_wh_copy_to_cache);</div><div class='add'>+	rreq-&gt;copy_to_cache = creq;</div><div class='add'>+	return creq;</div><div class='add'>+</div><div class='add'>+cancel_put:</div><div class='add'>+	netfs_put_failed_request(creq);</div><div class='add'>+cancel:</div><div class='add'>+	rreq-&gt;copy_to_cache = ERR_PTR(-ENOBUFS);</div><div class='add'>+	clear_bit(NETFS_RREQ_FOLIO_COPY_TO_CACHE, &amp;rreq-&gt;flags);</div><div class='add'>+	return ERR_PTR(-ENOBUFS);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * [DEPRECATED] Mark page as requiring copy-to-cache using PG_private_2 and add</div><div class='add'>+ * it to the copy write request.</div><div class='add'>+ */</div><div class='add'>+void netfs_pgpriv2_copy_to_cache(struct netfs_io_request *rreq, struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *creq = rreq-&gt;copy_to_cache;</div><div class='add'>+</div><div class='add'>+	if (!creq)</div><div class='add'>+		creq = netfs_pgpriv2_begin_copy_to_cache(rreq, folio);</div><div class='add'>+	if (IS_ERR(creq))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	trace_netfs_folio(folio, netfs_folio_trace_copy_to_cache);</div><div class='add'>+	folio_start_private_2(folio);</div><div class='add'>+	netfs_pgpriv2_copy_folio(creq, folio);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * [DEPRECATED] End writing to the cache, flushing out any outstanding writes.</div><div class='add'>+ */</div><div class='add'>+void netfs_pgpriv2_end_copy_to_cache(struct netfs_io_request *rreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *creq = rreq-&gt;copy_to_cache;</div><div class='add'>+</div><div class='add'>+	if (IS_ERR_OR_NULL(creq))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	netfs_issue_write(creq, &amp;creq-&gt;io_streams[1]);</div><div class='add'>+	smp_wmb(); /* Write lists before ALL_QUEUED. */</div><div class='add'>+	set_bit(NETFS_RREQ_ALL_QUEUED, &amp;creq-&gt;flags);</div><div class='add'>+	trace_netfs_rreq(rreq, netfs_rreq_trace_end_copy_to_cache);</div><div class='add'>+	if (list_empty_careful(&amp;creq-&gt;io_streams[1].subrequests))</div><div class='add'>+		netfs_wake_collector(creq);</div><div class='add'>+</div><div class='add'>+	netfs_put_request(creq, netfs_rreq_trace_put_return);</div><div class='add'>+	creq-&gt;copy_to_cache = NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * [DEPRECATED] Remove the PG_private_2 mark from any folios we've finished</div><div class='add'>+ * copying.</div><div class='add'>+ */</div><div class='add'>+bool netfs_pgpriv2_unlock_copied_folios(struct netfs_io_request *creq)</div><div class='add'>+{</div><div class='add'>+	struct folio_queue *folioq = creq-&gt;buffer.tail;</div><div class='add'>+	unsigned long long collected_to = creq-&gt;collected_to;</div><div class='add'>+	unsigned int slot = creq-&gt;buffer.first_tail_slot;</div><div class='add'>+	bool made_progress = false;</div><div class='add'>+</div><div class='add'>+	if (slot &gt;= folioq_nr_slots(folioq)) {</div><div class='add'>+		folioq = rolling_buffer_delete_spent(&amp;creq-&gt;buffer);</div><div class='add'>+		slot = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for (;;) {</div><div class='add'>+		struct folio *folio;</div><div class='add'>+		unsigned long long fpos, fend;</div><div class='add'>+		size_t fsize, flen;</div><div class='add'>+</div><div class='add'>+		folio = folioq_folio(folioq, slot);</div><div class='add'>+		if (WARN_ONCE(!folio_test_private_2(folio),</div><div class='add'>+			      "R=%08x: folio %lx is not marked private_2\n",</div><div class='add'>+			      creq-&gt;debug_id, folio-&gt;index))</div><div class='add'>+			trace_netfs_folio(folio, netfs_folio_trace_not_under_wback);</div><div class='add'>+</div><div class='add'>+		fpos = folio_pos(folio);</div><div class='add'>+		fsize = folio_size(folio);</div><div class='add'>+		flen = fsize;</div><div class='add'>+</div><div class='add'>+		fend = min_t(unsigned long long, fpos + flen, creq-&gt;i_size);</div><div class='add'>+</div><div class='add'>+		trace_netfs_collect_folio(creq, folio, fend, collected_to);</div><div class='add'>+</div><div class='add'>+		/* Unlock any folio we've transferred all of. */</div><div class='add'>+		if (collected_to &lt; fend)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		trace_netfs_folio(folio, netfs_folio_trace_end_copy);</div><div class='add'>+		folio_end_private_2(folio);</div><div class='add'>+		creq-&gt;cleaned_to = fpos + fsize;</div><div class='add'>+		made_progress = true;</div><div class='add'>+</div><div class='add'>+		/* Clean up the head folioq.  If we clear an entire folioq, then</div><div class='add'>+		 * we can get rid of it provided it's not also the tail folioq</div><div class='add'>+		 * being filled by the issuer.</div><div class='add'>+		 */</div><div class='add'>+		folioq_clear(folioq, slot);</div><div class='add'>+		slot++;</div><div class='add'>+		if (slot &gt;= folioq_nr_slots(folioq)) {</div><div class='add'>+			folioq = rolling_buffer_delete_spent(&amp;creq-&gt;buffer);</div><div class='add'>+			if (!folioq)</div><div class='add'>+				goto done;</div><div class='add'>+			slot = 0;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (fpos + fsize &gt;= collected_to)</div><div class='add'>+			break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	creq-&gt;buffer.tail = folioq;</div><div class='add'>+done:</div><div class='add'>+	creq-&gt;buffer.first_tail_slot = slot;</div><div class='add'>+	return made_progress;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/netfs/read_retry.c b/fs/netfs/read_retry.c<br/>new file mode 100644<br/>index 000000000000..b99e84a8170a<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/read_retry.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/read_retry.c</a></div><div class='hunk'>@@ -0,0 +1,293 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-only</div><div class='add'>+/* Network filesystem read subrequest retrying.</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2024 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/slab.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+static void netfs_reissue_read(struct netfs_io_request *rreq,</div><div class='add'>+			       struct netfs_io_subrequest *subreq)</div><div class='add'>+{</div><div class='add'>+	__clear_bit(NETFS_SREQ_MADE_PROGRESS, &amp;subreq-&gt;flags);</div><div class='add'>+	__set_bit(NETFS_SREQ_IN_PROGRESS, &amp;subreq-&gt;flags);</div><div class='add'>+	netfs_stat(&amp;netfs_n_rh_retry_read_subreq);</div><div class='add'>+	subreq-&gt;rreq-&gt;netfs_ops-&gt;issue_read(subreq);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Go through the list of failed/short reads, retrying all retryable ones.  We</div><div class='add'>+ * need to switch failed cache reads to network downloads.</div><div class='add'>+ */</div><div class='add'>+static void netfs_retry_read_subrequests(struct netfs_io_request *rreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_subrequest *subreq;</div><div class='add'>+	struct netfs_io_stream *stream = &amp;rreq-&gt;io_streams[0];</div><div class='add'>+	struct list_head *next;</div><div class='add'>+</div><div class='add'>+	_enter("R=%x", rreq-&gt;debug_id);</div><div class='add'>+</div><div class='add'>+	if (list_empty(&amp;stream-&gt;subrequests))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (rreq-&gt;netfs_ops-&gt;retry_request)</div><div class='add'>+		rreq-&gt;netfs_ops-&gt;retry_request(rreq, NULL);</div><div class='add'>+</div><div class='add'>+	/* If there's no renegotiation to do, just resend each retryable subreq</div><div class='add'>+	 * up to the first permanently failed one.</div><div class='add'>+	 */</div><div class='add'>+	if (!rreq-&gt;netfs_ops-&gt;prepare_read &amp;&amp;</div><div class='add'>+	    !rreq-&gt;cache_resources.ops) {</div><div class='add'>+		list_for_each_entry(subreq, &amp;stream-&gt;subrequests, rreq_link) {</div><div class='add'>+			if (test_bit(NETFS_SREQ_FAILED, &amp;subreq-&gt;flags))</div><div class='add'>+				break;</div><div class='add'>+			if (__test_and_clear_bit(NETFS_SREQ_NEED_RETRY, &amp;subreq-&gt;flags)) {</div><div class='add'>+				__clear_bit(NETFS_SREQ_MADE_PROGRESS, &amp;subreq-&gt;flags);</div><div class='add'>+				subreq-&gt;retry_count++;</div><div class='add'>+				netfs_reset_iter(subreq);</div><div class='add'>+				netfs_get_subrequest(subreq, netfs_sreq_trace_get_resubmit);</div><div class='add'>+				netfs_reissue_read(rreq, subreq);</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Okay, we need to renegotiate all the download requests and flip any</div><div class='add'>+	 * failed cache reads over to being download requests and negotiate</div><div class='add'>+	 * those also.  All fully successful subreqs have been removed from the</div><div class='add'>+	 * list and any spare data from those has been donated.</div><div class='add'>+	 *</div><div class='add'>+	 * What we do is decant the list and rebuild it one subreq at a time so</div><div class='add'>+	 * that we don't end up with donations jumping over a gap we're busy</div><div class='add'>+	 * populating with smaller subrequests.  In the event that the subreq</div><div class='add'>+	 * we just launched finishes before we insert the next subreq, it'll</div><div class='add'>+	 * fill in rreq-&gt;prev_donated instead.</div><div class='add'>+	 *</div><div class='add'>+	 * Note: Alternatively, we could split the tail subrequest right before</div><div class='add'>+	 * we reissue it and fix up the donations under lock.</div><div class='add'>+	 */</div><div class='add'>+	next = stream-&gt;subrequests.next;</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		struct netfs_io_subrequest *from, *to, *tmp;</div><div class='add'>+		struct iov_iter source;</div><div class='add'>+		unsigned long long start, len;</div><div class='add'>+		size_t part;</div><div class='add'>+		bool boundary = false, subreq_superfluous = false;</div><div class='add'>+</div><div class='add'>+		/* Go through the subreqs and find the next span of contiguous</div><div class='add'>+		 * buffer that we then rejig (cifs, for example, needs the</div><div class='add'>+		 * rsize renegotiating) and reissue.</div><div class='add'>+		 */</div><div class='add'>+		from = list_entry(next, struct netfs_io_subrequest, rreq_link);</div><div class='add'>+		to = from;</div><div class='add'>+		start = from-&gt;start + from-&gt;transferred;</div><div class='add'>+		len   = from-&gt;len   - from-&gt;transferred;</div><div class='add'>+</div><div class='add'>+		_debug("from R=%08x[%x] s=%llx ctl=%zx/%zx",</div><div class='add'>+		       rreq-&gt;debug_id, from-&gt;debug_index,</div><div class='add'>+		       from-&gt;start, from-&gt;transferred, from-&gt;len);</div><div class='add'>+</div><div class='add'>+		if (test_bit(NETFS_SREQ_FAILED, &amp;from-&gt;flags) ||</div><div class='add'>+		    !test_bit(NETFS_SREQ_NEED_RETRY, &amp;from-&gt;flags))</div><div class='add'>+			goto abandon;</div><div class='add'>+</div><div class='add'>+		list_for_each_continue(next, &amp;stream-&gt;subrequests) {</div><div class='add'>+			subreq = list_entry(next, struct netfs_io_subrequest, rreq_link);</div><div class='add'>+			if (subreq-&gt;start + subreq-&gt;transferred != start + len ||</div><div class='add'>+			    test_bit(NETFS_SREQ_BOUNDARY, &amp;subreq-&gt;flags) ||</div><div class='add'>+			    !test_bit(NETFS_SREQ_NEED_RETRY, &amp;subreq-&gt;flags))</div><div class='add'>+				break;</div><div class='add'>+			to = subreq;</div><div class='add'>+			len += to-&gt;len;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		_debug(" - range: %llx-%llx %llx", start, start + len - 1, len);</div><div class='add'>+</div><div class='add'>+		/* Determine the set of buffers we're going to use.  Each</div><div class='add'>+		 * subreq gets a subset of a single overall contiguous buffer.</div><div class='add'>+		 */</div><div class='add'>+		netfs_reset_iter(from);</div><div class='add'>+		source = from-&gt;io_iter;</div><div class='add'>+		source.count = len;</div><div class='add'>+</div><div class='add'>+		/* Work through the sublist. */</div><div class='add'>+		subreq = from;</div><div class='add'>+		list_for_each_entry_from(subreq, &amp;stream-&gt;subrequests, rreq_link) {</div><div class='add'>+			if (!len) {</div><div class='add'>+				subreq_superfluous = true;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+			subreq-&gt;source	= NETFS_DOWNLOAD_FROM_SERVER;</div><div class='add'>+			subreq-&gt;start	= start - subreq-&gt;transferred;</div><div class='add'>+			subreq-&gt;len	= len   + subreq-&gt;transferred;</div><div class='add'>+			__clear_bit(NETFS_SREQ_NEED_RETRY, &amp;subreq-&gt;flags);</div><div class='add'>+			__clear_bit(NETFS_SREQ_MADE_PROGRESS, &amp;subreq-&gt;flags);</div><div class='add'>+			subreq-&gt;retry_count++;</div><div class='add'>+</div><div class='add'>+			trace_netfs_sreq(subreq, netfs_sreq_trace_retry);</div><div class='add'>+</div><div class='add'>+			/* Renegotiate max_len (rsize) */</div><div class='add'>+			stream-&gt;sreq_max_len = subreq-&gt;len;</div><div class='add'>+			if (rreq-&gt;netfs_ops-&gt;prepare_read &amp;&amp;</div><div class='add'>+			    rreq-&gt;netfs_ops-&gt;prepare_read(subreq) &lt; 0) {</div><div class='add'>+				trace_netfs_sreq(subreq, netfs_sreq_trace_reprep_failed);</div><div class='add'>+				__set_bit(NETFS_SREQ_FAILED, &amp;subreq-&gt;flags);</div><div class='add'>+				goto abandon;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			part = umin(len, stream-&gt;sreq_max_len);</div><div class='add'>+			if (unlikely(stream-&gt;sreq_max_segs))</div><div class='add'>+				part = netfs_limit_iter(&amp;source, 0, part, stream-&gt;sreq_max_segs);</div><div class='add'>+			subreq-&gt;len = subreq-&gt;transferred + part;</div><div class='add'>+			subreq-&gt;io_iter = source;</div><div class='add'>+			iov_iter_truncate(&amp;subreq-&gt;io_iter, part);</div><div class='add'>+			iov_iter_advance(&amp;source, part);</div><div class='add'>+			len -= part;</div><div class='add'>+			start += part;</div><div class='add'>+			if (!len) {</div><div class='add'>+				if (boundary)</div><div class='add'>+					__set_bit(NETFS_SREQ_BOUNDARY, &amp;subreq-&gt;flags);</div><div class='add'>+			} else {</div><div class='add'>+				__clear_bit(NETFS_SREQ_BOUNDARY, &amp;subreq-&gt;flags);</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			netfs_get_subrequest(subreq, netfs_sreq_trace_get_resubmit);</div><div class='add'>+			netfs_reissue_read(rreq, subreq);</div><div class='add'>+			if (subreq == to) {</div><div class='add'>+				subreq_superfluous = false;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* If we managed to use fewer subreqs, we can discard the</div><div class='add'>+		 * excess; if we used the same number, then we're done.</div><div class='add'>+		 */</div><div class='add'>+		if (!len) {</div><div class='add'>+			if (!subreq_superfluous)</div><div class='add'>+				continue;</div><div class='add'>+			list_for_each_entry_safe_from(subreq, tmp,</div><div class='add'>+						      &amp;stream-&gt;subrequests, rreq_link) {</div><div class='add'>+				trace_netfs_sreq(subreq, netfs_sreq_trace_superfluous);</div><div class='add'>+				list_del(&amp;subreq-&gt;rreq_link);</div><div class='add'>+				netfs_put_subrequest(subreq, netfs_sreq_trace_put_done);</div><div class='add'>+				if (subreq == to)</div><div class='add'>+					break;</div><div class='add'>+			}</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* We ran out of subrequests, so we need to allocate some more</div><div class='add'>+		 * and insert them after.</div><div class='add'>+		 */</div><div class='add'>+		do {</div><div class='add'>+			subreq = netfs_alloc_subrequest(rreq);</div><div class='add'>+			if (!subreq) {</div><div class='add'>+				subreq = to;</div><div class='add'>+				goto abandon_after;</div><div class='add'>+			}</div><div class='add'>+			subreq-&gt;source		= NETFS_DOWNLOAD_FROM_SERVER;</div><div class='add'>+			subreq-&gt;start		= start;</div><div class='add'>+			subreq-&gt;len		= len;</div><div class='add'>+			subreq-&gt;stream_nr	= stream-&gt;stream_nr;</div><div class='add'>+			subreq-&gt;retry_count	= 1;</div><div class='add'>+</div><div class='add'>+			trace_netfs_sreq_ref(rreq-&gt;debug_id, subreq-&gt;debug_index,</div><div class='add'>+					     refcount_read(&amp;subreq-&gt;ref),</div><div class='add'>+					     netfs_sreq_trace_new);</div><div class='add'>+</div><div class='add'>+			list_add(&amp;subreq-&gt;rreq_link, &amp;to-&gt;rreq_link);</div><div class='add'>+			to = list_next_entry(to, rreq_link);</div><div class='add'>+			trace_netfs_sreq(subreq, netfs_sreq_trace_retry);</div><div class='add'>+</div><div class='add'>+			stream-&gt;sreq_max_len	= umin(len, rreq-&gt;rsize);</div><div class='add'>+			stream-&gt;sreq_max_segs	= 0;</div><div class='add'>+			if (unlikely(stream-&gt;sreq_max_segs))</div><div class='add'>+				part = netfs_limit_iter(&amp;source, 0, part, stream-&gt;sreq_max_segs);</div><div class='add'>+</div><div class='add'>+			netfs_stat(&amp;netfs_n_rh_download);</div><div class='add'>+			if (rreq-&gt;netfs_ops-&gt;prepare_read(subreq) &lt; 0) {</div><div class='add'>+				trace_netfs_sreq(subreq, netfs_sreq_trace_reprep_failed);</div><div class='add'>+				__set_bit(NETFS_SREQ_FAILED, &amp;subreq-&gt;flags);</div><div class='add'>+				goto abandon;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			part = umin(len, stream-&gt;sreq_max_len);</div><div class='add'>+			subreq-&gt;len = subreq-&gt;transferred + part;</div><div class='add'>+			subreq-&gt;io_iter = source;</div><div class='add'>+			iov_iter_truncate(&amp;subreq-&gt;io_iter, part);</div><div class='add'>+			iov_iter_advance(&amp;source, part);</div><div class='add'>+</div><div class='add'>+			len -= part;</div><div class='add'>+			start += part;</div><div class='add'>+			if (!len &amp;&amp; boundary) {</div><div class='add'>+				__set_bit(NETFS_SREQ_BOUNDARY, &amp;to-&gt;flags);</div><div class='add'>+				boundary = false;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			netfs_reissue_read(rreq, subreq);</div><div class='add'>+		} while (len);</div><div class='add'>+</div><div class='add'>+	} while (!list_is_head(next, &amp;stream-&gt;subrequests));</div><div class='add'>+</div><div class='add'>+	return;</div><div class='add'>+</div><div class='add'>+	/* If we hit an error, fail all remaining incomplete subrequests */</div><div class='add'>+abandon_after:</div><div class='add'>+	if (list_is_last(&amp;subreq-&gt;rreq_link, &amp;stream-&gt;subrequests))</div><div class='add'>+		return;</div><div class='add'>+	subreq = list_next_entry(subreq, rreq_link);</div><div class='add'>+abandon:</div><div class='add'>+	list_for_each_entry_from(subreq, &amp;stream-&gt;subrequests, rreq_link) {</div><div class='add'>+		if (!subreq-&gt;error &amp;&amp;</div><div class='add'>+		    !test_bit(NETFS_SREQ_FAILED, &amp;subreq-&gt;flags) &amp;&amp;</div><div class='add'>+		    !test_bit(NETFS_SREQ_NEED_RETRY, &amp;subreq-&gt;flags))</div><div class='add'>+			continue;</div><div class='add'>+		subreq-&gt;error = -ENOMEM;</div><div class='add'>+		__set_bit(NETFS_SREQ_FAILED, &amp;subreq-&gt;flags);</div><div class='add'>+		__clear_bit(NETFS_SREQ_NEED_RETRY, &amp;subreq-&gt;flags);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Retry reads.</div><div class='add'>+ */</div><div class='add'>+void netfs_retry_reads(struct netfs_io_request *rreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_stream *stream = &amp;rreq-&gt;io_streams[0];</div><div class='add'>+</div><div class='add'>+	netfs_stat(&amp;netfs_n_rh_retry_read_req);</div><div class='add'>+</div><div class='add'>+	/* Wait for all outstanding I/O to quiesce before performing retries as</div><div class='add'>+	 * we may need to renegotiate the I/O sizes.</div><div class='add'>+	 */</div><div class='add'>+	set_bit(NETFS_RREQ_RETRYING, &amp;rreq-&gt;flags);</div><div class='add'>+	netfs_wait_for_in_progress_stream(rreq, stream);</div><div class='add'>+	clear_bit(NETFS_RREQ_RETRYING, &amp;rreq-&gt;flags);</div><div class='add'>+</div><div class='add'>+	trace_netfs_rreq(rreq, netfs_rreq_trace_resubmit);</div><div class='add'>+	netfs_retry_read_subrequests(rreq);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Unlock any the pages that haven't been unlocked yet due to abandoned</div><div class='add'>+ * subrequests.</div><div class='add'>+ */</div><div class='add'>+void netfs_unlock_abandoned_read_pages(struct netfs_io_request *rreq)</div><div class='add'>+{</div><div class='add'>+	struct folio_queue *p;</div><div class='add'>+</div><div class='add'>+	for (p = rreq-&gt;buffer.tail; p; p = p-&gt;next) {</div><div class='add'>+		for (int slot = 0; slot &lt; folioq_count(p); slot++) {</div><div class='add'>+			struct folio *folio = folioq_folio(p, slot);</div><div class='add'>+</div><div class='add'>+			if (folio &amp;&amp; !folioq_is_marked2(p, slot)) {</div><div class='add'>+				trace_netfs_folio(folio, netfs_folio_trace_abandon);</div><div class='add'>+				folio_unlock(folio);</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+}</div><div class='head'>diff --git a/fs/netfs/read_single.c b/fs/netfs/read_single.c<br/>new file mode 100644<br/>index 000000000000..8e6264f62a8f<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/read_single.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/read_single.c</a></div><div class='hunk'>@@ -0,0 +1,195 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='add'>+/* Single, monolithic object support (e.g. AFS directory).</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2024 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/export.h&gt;</div><div class='add'>+#include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/mm.h&gt;</div><div class='add'>+#include &lt;linux/pagemap.h&gt;</div><div class='add'>+#include &lt;linux/slab.h&gt;</div><div class='add'>+#include &lt;linux/uio.h&gt;</div><div class='add'>+#include &lt;linux/sched/mm.h&gt;</div><div class='add'>+#include &lt;linux/task_io_accounting_ops.h&gt;</div><div class='add'>+#include &lt;linux/netfs.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_single_mark_inode_dirty - Mark a single, monolithic object inode dirty</div><div class='add'>+ * @inode: The inode to mark</div><div class='add'>+ *</div><div class='add'>+ * Mark an inode that contains a single, monolithic object as dirty so that its</div><div class='add'>+ * writepages op will get called.  If set, the SINGLE_NO_UPLOAD flag indicates</div><div class='add'>+ * that the object will only be written to the cache and not uploaded (e.g. AFS</div><div class='add'>+ * directory contents).</div><div class='add'>+ */</div><div class='add'>+void netfs_single_mark_inode_dirty(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct netfs_inode *ictx = netfs_inode(inode);</div><div class='add'>+	bool cache_only = test_bit(NETFS_ICTX_SINGLE_NO_UPLOAD, &amp;ictx-&gt;flags);</div><div class='add'>+	bool caching = fscache_cookie_enabled(netfs_i_cookie(netfs_inode(inode)));</div><div class='add'>+</div><div class='add'>+	if (cache_only &amp;&amp; !caching)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	mark_inode_dirty(inode);</div><div class='add'>+</div><div class='add'>+	if (caching &amp;&amp; !(inode_state_read_once(inode) &amp; I_PINNING_NETFS_WB)) {</div><div class='add'>+		bool need_use = false;</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+		if (!(inode_state_read(inode) &amp; I_PINNING_NETFS_WB)) {</div><div class='add'>+			inode_state_set(inode, I_PINNING_NETFS_WB);</div><div class='add'>+			need_use = true;</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+</div><div class='add'>+		if (need_use)</div><div class='add'>+			fscache_use_cookie(netfs_i_cookie(ictx), true);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_single_mark_inode_dirty);</div><div class='add'>+</div><div class='add'>+static int netfs_single_begin_cache_read(struct netfs_io_request *rreq, struct netfs_inode *ctx)</div><div class='add'>+{</div><div class='add'>+	return fscache_begin_read_operation(&amp;rreq-&gt;cache_resources, netfs_i_cookie(ctx));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void netfs_single_cache_prepare_read(struct netfs_io_request *rreq,</div><div class='add'>+					    struct netfs_io_subrequest *subreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_cache_resources *cres = &amp;rreq-&gt;cache_resources;</div><div class='add'>+</div><div class='add'>+	if (!cres-&gt;ops) {</div><div class='add'>+		subreq-&gt;source = NETFS_DOWNLOAD_FROM_SERVER;</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+	subreq-&gt;source = cres-&gt;ops-&gt;prepare_read(subreq, rreq-&gt;i_size);</div><div class='add'>+	trace_netfs_sreq(subreq, netfs_sreq_trace_prepare);</div><div class='add'>+</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void netfs_single_read_cache(struct netfs_io_request *rreq,</div><div class='add'>+				    struct netfs_io_subrequest *subreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_cache_resources *cres = &amp;rreq-&gt;cache_resources;</div><div class='add'>+</div><div class='add'>+	_enter("R=%08x[%x]", rreq-&gt;debug_id, subreq-&gt;debug_index);</div><div class='add'>+	netfs_stat(&amp;netfs_n_rh_read);</div><div class='add'>+	cres-&gt;ops-&gt;read(cres, subreq-&gt;start, &amp;subreq-&gt;io_iter, NETFS_READ_HOLE_FAIL,</div><div class='add'>+			netfs_cache_read_terminated, subreq);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Perform a read to a buffer from the cache or the server.  Only a single</div><div class='add'>+ * subreq is permitted as the object must be fetched in a single transaction.</div><div class='add'>+ */</div><div class='add'>+static int netfs_single_dispatch_read(struct netfs_io_request *rreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_stream *stream = &amp;rreq-&gt;io_streams[0];</div><div class='add'>+	struct netfs_io_subrequest *subreq;</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	subreq = netfs_alloc_subrequest(rreq);</div><div class='add'>+	if (!subreq)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	subreq-&gt;source	= NETFS_SOURCE_UNKNOWN;</div><div class='add'>+	subreq-&gt;start	= 0;</div><div class='add'>+	subreq-&gt;len	= rreq-&gt;len;</div><div class='add'>+	subreq-&gt;io_iter	= rreq-&gt;buffer.iter;</div><div class='add'>+</div><div class='add'>+	__set_bit(NETFS_SREQ_IN_PROGRESS, &amp;subreq-&gt;flags);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;rreq-&gt;lock);</div><div class='add'>+	list_add_tail(&amp;subreq-&gt;rreq_link, &amp;stream-&gt;subrequests);</div><div class='add'>+	trace_netfs_sreq(subreq, netfs_sreq_trace_added);</div><div class='add'>+	stream-&gt;front = subreq;</div><div class='add'>+	/* Store list pointers before active flag */</div><div class='add'>+	smp_store_release(&amp;stream-&gt;active, true);</div><div class='add'>+	spin_unlock(&amp;rreq-&gt;lock);</div><div class='add'>+</div><div class='add'>+	netfs_single_cache_prepare_read(rreq, subreq);</div><div class='add'>+	switch (subreq-&gt;source) {</div><div class='add'>+	case NETFS_DOWNLOAD_FROM_SERVER:</div><div class='add'>+		netfs_stat(&amp;netfs_n_rh_download);</div><div class='add'>+		if (rreq-&gt;netfs_ops-&gt;prepare_read) {</div><div class='add'>+			ret = rreq-&gt;netfs_ops-&gt;prepare_read(subreq);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				goto cancel;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		rreq-&gt;netfs_ops-&gt;issue_read(subreq);</div><div class='add'>+		rreq-&gt;submitted += subreq-&gt;len;</div><div class='add'>+		break;</div><div class='add'>+	case NETFS_READ_FROM_CACHE:</div><div class='add'>+		trace_netfs_sreq(subreq, netfs_sreq_trace_submit);</div><div class='add'>+		netfs_single_read_cache(rreq, subreq);</div><div class='add'>+		rreq-&gt;submitted += subreq-&gt;len;</div><div class='add'>+		ret = 0;</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		pr_warn("Unexpected single-read source %u\n", subreq-&gt;source);</div><div class='add'>+		WARN_ON_ONCE(true);</div><div class='add'>+		ret = -EIO;</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	smp_wmb(); /* Write lists before ALL_QUEUED. */</div><div class='add'>+	set_bit(NETFS_RREQ_ALL_QUEUED, &amp;rreq-&gt;flags);</div><div class='add'>+	return ret;</div><div class='add'>+cancel:</div><div class='add'>+	netfs_put_subrequest(subreq, netfs_sreq_trace_put_cancel);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_read_single - Synchronously read a single blob of pages.</div><div class='add'>+ * @inode: The inode to read from.</div><div class='add'>+ * @file: The file we're using to read or NULL.</div><div class='add'>+ * @iter: The buffer we're reading into.</div><div class='add'>+ *</div><div class='add'>+ * Fulfil a read request for a single monolithic object by drawing data from</div><div class='add'>+ * the cache if possible, or the netfs if not.  The buffer may be larger than</div><div class='add'>+ * the file content; unused beyond the EOF will be zero-filled.  The content</div><div class='add'>+ * will be read with a single I/O request (though this may be retried).</div><div class='add'>+ *</div><div class='add'>+ * The calling netfs must initialise a netfs context contiguous to the vfs</div><div class='add'>+ * inode before calling this.</div><div class='add'>+ *</div><div class='add'>+ * This is usable whether or not caching is enabled.  If caching is enabled,</div><div class='add'>+ * the data will be stored as a single object into the cache.</div><div class='add'>+ */</div><div class='add'>+ssize_t netfs_read_single(struct inode *inode, struct file *file, struct iov_iter *iter)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *rreq;</div><div class='add'>+	struct netfs_inode *ictx = netfs_inode(inode);</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	rreq = netfs_alloc_request(inode-&gt;i_mapping, file, 0, iov_iter_count(iter),</div><div class='add'>+				   NETFS_READ_SINGLE);</div><div class='add'>+	if (IS_ERR(rreq))</div><div class='add'>+		return PTR_ERR(rreq);</div><div class='add'>+</div><div class='add'>+	ret = netfs_single_begin_cache_read(rreq, ictx);</div><div class='add'>+	if (ret == -ENOMEM || ret == -EINTR || ret == -ERESTARTSYS)</div><div class='add'>+		goto cleanup_free;</div><div class='add'>+</div><div class='add'>+	netfs_stat(&amp;netfs_n_rh_read_single);</div><div class='add'>+	trace_netfs_read(rreq, 0, rreq-&gt;len, netfs_read_trace_read_single);</div><div class='add'>+</div><div class='add'>+	rreq-&gt;buffer.iter = *iter;</div><div class='add'>+	netfs_single_dispatch_read(rreq);</div><div class='add'>+</div><div class='add'>+	ret = netfs_wait_for_read(rreq);</div><div class='add'>+	netfs_put_request(rreq, netfs_rreq_trace_put_return);</div><div class='add'>+	return ret;</div><div class='add'>+</div><div class='add'>+cleanup_free:</div><div class='add'>+	netfs_put_failed_request(rreq);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_read_single);</div><div class='head'>diff --git a/fs/netfs/rolling_buffer.c b/fs/netfs/rolling_buffer.c<br/>new file mode 100644<br/>index 000000000000..207b6a326651<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/rolling_buffer.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/rolling_buffer.c</a></div><div class='hunk'>@@ -0,0 +1,222 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='add'>+/* Rolling buffer helpers</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2024 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/bitops.h&gt;</div><div class='add'>+#include &lt;linux/pagemap.h&gt;</div><div class='add'>+#include &lt;linux/rolling_buffer.h&gt;</div><div class='add'>+#include &lt;linux/slab.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+static atomic_t debug_ids;</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_folioq_alloc - Allocate a folio_queue struct</div><div class='add'>+ * @rreq_id: Associated debugging ID for tracing purposes</div><div class='add'>+ * @gfp: Allocation constraints</div><div class='add'>+ * @trace: Trace tag to indicate the purpose of the allocation</div><div class='add'>+ *</div><div class='add'>+ * Allocate, initialise and account the folio_queue struct and log a trace line</div><div class='add'>+ * to mark the allocation.</div><div class='add'>+ */</div><div class='add'>+struct folio_queue *netfs_folioq_alloc(unsigned int rreq_id, gfp_t gfp,</div><div class='add'>+				       unsigned int /*enum netfs_folioq_trace*/ trace)</div><div class='add'>+{</div><div class='add'>+	struct folio_queue *fq;</div><div class='add'>+</div><div class='add'>+	fq = kmalloc(sizeof(*fq), gfp);</div><div class='add'>+	if (fq) {</div><div class='add'>+		netfs_stat(&amp;netfs_n_folioq);</div><div class='add'>+		folioq_init(fq, rreq_id);</div><div class='add'>+		fq-&gt;debug_id = atomic_inc_return(&amp;debug_ids);</div><div class='add'>+		trace_netfs_folioq(fq, trace);</div><div class='add'>+	}</div><div class='add'>+	return fq;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_folioq_alloc);</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_folioq_free - Free a folio_queue struct</div><div class='add'>+ * @folioq: The object to free</div><div class='add'>+ * @trace: Trace tag to indicate which free</div><div class='add'>+ *</div><div class='add'>+ * Free and unaccount the folio_queue struct.</div><div class='add'>+ */</div><div class='add'>+void netfs_folioq_free(struct folio_queue *folioq,</div><div class='add'>+		       unsigned int /*enum netfs_trace_folioq*/ trace)</div><div class='add'>+{</div><div class='add'>+	trace_netfs_folioq(folioq, trace);</div><div class='add'>+	netfs_stat_d(&amp;netfs_n_folioq);</div><div class='add'>+	kfree(folioq);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_folioq_free);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Initialise a rolling buffer.  We allocate an empty folio queue struct to so</div><div class='add'>+ * that the pointers can be independently driven by the producer and the</div><div class='add'>+ * consumer.</div><div class='add'>+ */</div><div class='add'>+int rolling_buffer_init(struct rolling_buffer *roll, unsigned int rreq_id,</div><div class='add'>+			unsigned int direction)</div><div class='add'>+{</div><div class='add'>+	struct folio_queue *fq;</div><div class='add'>+</div><div class='add'>+	fq = netfs_folioq_alloc(rreq_id, GFP_NOFS, netfs_trace_folioq_rollbuf_init);</div><div class='add'>+	if (!fq)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	roll-&gt;head = fq;</div><div class='add'>+	roll-&gt;tail = fq;</div><div class='add'>+	iov_iter_folio_queue(&amp;roll-&gt;iter, direction, fq, 0, 0, 0);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Add another folio_queue to a rolling buffer if there's no space left.</div><div class='add'>+ */</div><div class='add'>+int rolling_buffer_make_space(struct rolling_buffer *roll)</div><div class='add'>+{</div><div class='add'>+	struct folio_queue *fq, *head = roll-&gt;head;</div><div class='add'>+</div><div class='add'>+	if (!folioq_full(head))</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	fq = netfs_folioq_alloc(head-&gt;rreq_id, GFP_NOFS, netfs_trace_folioq_make_space);</div><div class='add'>+	if (!fq)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	fq-&gt;prev = head;</div><div class='add'>+</div><div class='add'>+	roll-&gt;head = fq;</div><div class='add'>+	if (folioq_full(head)) {</div><div class='add'>+		/* Make sure we don't leave the master iterator pointing to a</div><div class='add'>+		 * block that might get immediately consumed.</div><div class='add'>+		 */</div><div class='add'>+		if (roll-&gt;iter.folioq == head &amp;&amp;</div><div class='add'>+		    roll-&gt;iter.folioq_slot == folioq_nr_slots(head)) {</div><div class='add'>+			roll-&gt;iter.folioq = fq;</div><div class='add'>+			roll-&gt;iter.folioq_slot = 0;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Make sure the initialisation is stored before the next pointer.</div><div class='add'>+	 *</div><div class='add'>+	 * [!] NOTE: After we set head-&gt;next, the consumer is at liberty to</div><div class='add'>+	 * immediately delete the old head.</div><div class='add'>+	 */</div><div class='add'>+	smp_store_release(&amp;head-&gt;next, fq);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Decant the list of folios to read into a rolling buffer.</div><div class='add'>+ */</div><div class='add'>+ssize_t rolling_buffer_load_from_ra(struct rolling_buffer *roll,</div><div class='add'>+				    struct readahead_control *ractl,</div><div class='add'>+				    struct folio_batch *put_batch)</div><div class='add'>+{</div><div class='add'>+	struct folio_queue *fq;</div><div class='add'>+	struct page **vec;</div><div class='add'>+	int nr, ix, to;</div><div class='add'>+	ssize_t size = 0;</div><div class='add'>+</div><div class='add'>+	if (rolling_buffer_make_space(roll) &lt; 0)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	fq = roll-&gt;head;</div><div class='add'>+	vec = (struct page **)fq-&gt;vec.folios;</div><div class='add'>+	nr = __readahead_batch(ractl, vec + folio_batch_count(&amp;fq-&gt;vec),</div><div class='add'>+			       folio_batch_space(&amp;fq-&gt;vec));</div><div class='add'>+	ix = fq-&gt;vec.nr;</div><div class='add'>+	to = ix + nr;</div><div class='add'>+	fq-&gt;vec.nr = to;</div><div class='add'>+	for (; ix &lt; to; ix++) {</div><div class='add'>+		struct folio *folio = folioq_folio(fq, ix);</div><div class='add'>+		unsigned int order = folio_order(folio);</div><div class='add'>+</div><div class='add'>+		fq-&gt;orders[ix] = order;</div><div class='add'>+		size += PAGE_SIZE &lt;&lt; order;</div><div class='add'>+		trace_netfs_folio(folio, netfs_folio_trace_read);</div><div class='add'>+		if (!folio_batch_add(put_batch, folio))</div><div class='add'>+			folio_batch_release(put_batch);</div><div class='add'>+	}</div><div class='add'>+	WRITE_ONCE(roll-&gt;iter.count, roll-&gt;iter.count + size);</div><div class='add'>+</div><div class='add'>+	/* Store the counter after setting the slot. */</div><div class='add'>+	smp_store_release(&amp;roll-&gt;next_head_slot, to);</div><div class='add'>+	return size;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Append a folio to the rolling buffer.</div><div class='add'>+ */</div><div class='add'>+ssize_t rolling_buffer_append(struct rolling_buffer *roll, struct folio *folio,</div><div class='add'>+			      unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	ssize_t size = folio_size(folio);</div><div class='add'>+	int slot;</div><div class='add'>+</div><div class='add'>+	if (rolling_buffer_make_space(roll) &lt; 0)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	slot = folioq_append(roll-&gt;head, folio);</div><div class='add'>+	if (flags &amp; ROLLBUF_MARK_1)</div><div class='add'>+		folioq_mark(roll-&gt;head, slot);</div><div class='add'>+	if (flags &amp; ROLLBUF_MARK_2)</div><div class='add'>+		folioq_mark2(roll-&gt;head, slot);</div><div class='add'>+</div><div class='add'>+	WRITE_ONCE(roll-&gt;iter.count, roll-&gt;iter.count + size);</div><div class='add'>+</div><div class='add'>+	/* Store the counter after setting the slot. */</div><div class='add'>+	smp_store_release(&amp;roll-&gt;next_head_slot, slot);</div><div class='add'>+	return size;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Delete a spent buffer from a rolling queue and return the next in line.  We</div><div class='add'>+ * don't return the last buffer to keep the pointers independent, but return</div><div class='add'>+ * NULL instead.</div><div class='add'>+ */</div><div class='add'>+struct folio_queue *rolling_buffer_delete_spent(struct rolling_buffer *roll)</div><div class='add'>+{</div><div class='add'>+	struct folio_queue *spent = roll-&gt;tail, *next = READ_ONCE(spent-&gt;next);</div><div class='add'>+</div><div class='add'>+	if (!next)</div><div class='add'>+		return NULL;</div><div class='add'>+	next-&gt;prev = NULL;</div><div class='add'>+	netfs_folioq_free(spent, netfs_trace_folioq_delete);</div><div class='add'>+	roll-&gt;tail = next;</div><div class='add'>+	return next;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Clear out a rolling queue.  Folios that have mark 1 set are put.</div><div class='add'>+ */</div><div class='add'>+void rolling_buffer_clear(struct rolling_buffer *roll)</div><div class='add'>+{</div><div class='add'>+	struct folio_batch fbatch;</div><div class='add'>+	struct folio_queue *p;</div><div class='add'>+</div><div class='add'>+	folio_batch_init(&amp;fbatch);</div><div class='add'>+</div><div class='add'>+	while ((p = roll-&gt;tail)) {</div><div class='add'>+		roll-&gt;tail = p-&gt;next;</div><div class='add'>+		for (int slot = 0; slot &lt; folioq_count(p); slot++) {</div><div class='add'>+			struct folio *folio = folioq_folio(p, slot);</div><div class='add'>+</div><div class='add'>+			if (!folio)</div><div class='add'>+				continue;</div><div class='add'>+			if (folioq_is_marked(p, slot)) {</div><div class='add'>+				trace_netfs_folio(folio, netfs_folio_trace_put);</div><div class='add'>+				if (!folio_batch_add(&amp;fbatch, folio))</div><div class='add'>+					folio_batch_release(&amp;fbatch);</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		netfs_folioq_free(p, netfs_trace_folioq_clear);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	folio_batch_release(&amp;fbatch);</div><div class='add'>+}</div><div class='head'>diff --git a/fs/netfs/stats.c b/fs/netfs/stats.c<br/>index 9ae538c85378..ab6b916addc4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/netfs/stats.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/netfs/stats.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/stats.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/stats.c</a></div><div class='hunk'>@@ -7,11 +7,12 @@</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/export.h&gt;</div><div class='ctx'> #include &lt;linux/seq_file.h&gt;</div><div class='del'>-#include &lt;linux/netfs.h&gt;</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> </div><div class='add'>+atomic_t netfs_n_rh_dio_read;</div><div class='ctx'> atomic_t netfs_n_rh_readahead;</div><div class='del'>-atomic_t netfs_n_rh_readpage;</div><div class='add'>+atomic_t netfs_n_rh_read_folio;</div><div class='add'>+atomic_t netfs_n_rh_read_single;</div><div class='ctx'> atomic_t netfs_n_rh_rreq;</div><div class='ctx'> atomic_t netfs_n_rh_sreq;</div><div class='ctx'> atomic_t netfs_n_rh_download;</div><div class='hunk'>@@ -28,32 +29,75 @@ atomic_t netfs_n_rh_write_begin;</div><div class='ctx'> atomic_t netfs_n_rh_write_done;</div><div class='ctx'> atomic_t netfs_n_rh_write_failed;</div><div class='ctx'> atomic_t netfs_n_rh_write_zskip;</div><div class='add'>+atomic_t netfs_n_rh_retry_read_req;</div><div class='add'>+atomic_t netfs_n_rh_retry_read_subreq;</div><div class='add'>+atomic_t netfs_n_wh_buffered_write;</div><div class='add'>+atomic_t netfs_n_wh_writethrough;</div><div class='add'>+atomic_t netfs_n_wh_dio_write;</div><div class='add'>+atomic_t netfs_n_wh_writepages;</div><div class='add'>+atomic_t netfs_n_wh_copy_to_cache;</div><div class='add'>+atomic_t netfs_n_wh_wstream_conflict;</div><div class='add'>+atomic_t netfs_n_wh_upload;</div><div class='add'>+atomic_t netfs_n_wh_upload_done;</div><div class='add'>+atomic_t netfs_n_wh_upload_failed;</div><div class='add'>+atomic_t netfs_n_wh_write;</div><div class='add'>+atomic_t netfs_n_wh_write_done;</div><div class='add'>+atomic_t netfs_n_wh_write_failed;</div><div class='add'>+atomic_t netfs_n_wh_retry_write_req;</div><div class='add'>+atomic_t netfs_n_wh_retry_write_subreq;</div><div class='add'>+atomic_t netfs_n_wb_lock_skip;</div><div class='add'>+atomic_t netfs_n_wb_lock_wait;</div><div class='add'>+atomic_t netfs_n_folioq;</div><div class='ctx'> </div><div class='del'>-void netfs_stats_show(struct seq_file *m)</div><div class='add'>+int netfs_stats_show(struct seq_file *m, void *v)</div><div class='ctx'> {</div><div class='del'>-	seq_printf(m, "RdHelp : RA=%u RP=%u WB=%u WBZ=%u rr=%u sr=%u\n",</div><div class='add'>+	seq_printf(m, "Reads  : DR=%u RA=%u RF=%u RS=%u WB=%u WBZ=%u\n",</div><div class='add'>+		   atomic_read(&amp;netfs_n_rh_dio_read),</div><div class='ctx'> 		   atomic_read(&amp;netfs_n_rh_readahead),</div><div class='del'>-		   atomic_read(&amp;netfs_n_rh_readpage),</div><div class='add'>+		   atomic_read(&amp;netfs_n_rh_read_folio),</div><div class='add'>+		   atomic_read(&amp;netfs_n_rh_read_single),</div><div class='ctx'> 		   atomic_read(&amp;netfs_n_rh_write_begin),</div><div class='del'>-		   atomic_read(&amp;netfs_n_rh_write_zskip),</div><div class='del'>-		   atomic_read(&amp;netfs_n_rh_rreq),</div><div class='del'>-		   atomic_read(&amp;netfs_n_rh_sreq));</div><div class='del'>-	seq_printf(m, "RdHelp : ZR=%u sh=%u sk=%u\n",</div><div class='add'>+		   atomic_read(&amp;netfs_n_rh_write_zskip));</div><div class='add'>+	seq_printf(m, "Writes : BW=%u WT=%u DW=%u WP=%u 2C=%u\n",</div><div class='add'>+		   atomic_read(&amp;netfs_n_wh_buffered_write),</div><div class='add'>+		   atomic_read(&amp;netfs_n_wh_writethrough),</div><div class='add'>+		   atomic_read(&amp;netfs_n_wh_dio_write),</div><div class='add'>+		   atomic_read(&amp;netfs_n_wh_writepages),</div><div class='add'>+		   atomic_read(&amp;netfs_n_wh_copy_to_cache));</div><div class='add'>+	seq_printf(m, "ZeroOps: ZR=%u sh=%u sk=%u\n",</div><div class='ctx'> 		   atomic_read(&amp;netfs_n_rh_zero),</div><div class='ctx'> 		   atomic_read(&amp;netfs_n_rh_short_read),</div><div class='ctx'> 		   atomic_read(&amp;netfs_n_rh_write_zskip));</div><div class='del'>-	seq_printf(m, "RdHelp : DL=%u ds=%u df=%u di=%u\n",</div><div class='add'>+	seq_printf(m, "DownOps: DL=%u ds=%u df=%u di=%u\n",</div><div class='ctx'> 		   atomic_read(&amp;netfs_n_rh_download),</div><div class='ctx'> 		   atomic_read(&amp;netfs_n_rh_download_done),</div><div class='ctx'> 		   atomic_read(&amp;netfs_n_rh_download_failed),</div><div class='ctx'> 		   atomic_read(&amp;netfs_n_rh_download_instead));</div><div class='del'>-	seq_printf(m, "RdHelp : RD=%u rs=%u rf=%u\n",</div><div class='add'>+	seq_printf(m, "CaRdOps: RD=%u rs=%u rf=%u\n",</div><div class='ctx'> 		   atomic_read(&amp;netfs_n_rh_read),</div><div class='ctx'> 		   atomic_read(&amp;netfs_n_rh_read_done),</div><div class='ctx'> 		   atomic_read(&amp;netfs_n_rh_read_failed));</div><div class='del'>-	seq_printf(m, "RdHelp : WR=%u ws=%u wf=%u\n",</div><div class='del'>-		   atomic_read(&amp;netfs_n_rh_write),</div><div class='del'>-		   atomic_read(&amp;netfs_n_rh_write_done),</div><div class='del'>-		   atomic_read(&amp;netfs_n_rh_write_failed));</div><div class='add'>+	seq_printf(m, "UpldOps: UL=%u us=%u uf=%u\n",</div><div class='add'>+		   atomic_read(&amp;netfs_n_wh_upload),</div><div class='add'>+		   atomic_read(&amp;netfs_n_wh_upload_done),</div><div class='add'>+		   atomic_read(&amp;netfs_n_wh_upload_failed));</div><div class='add'>+	seq_printf(m, "CaWrOps: WR=%u ws=%u wf=%u\n",</div><div class='add'>+		   atomic_read(&amp;netfs_n_wh_write),</div><div class='add'>+		   atomic_read(&amp;netfs_n_wh_write_done),</div><div class='add'>+		   atomic_read(&amp;netfs_n_wh_write_failed));</div><div class='add'>+	seq_printf(m, "Retries: rq=%u rs=%u wq=%u ws=%u\n",</div><div class='add'>+		   atomic_read(&amp;netfs_n_rh_retry_read_req),</div><div class='add'>+		   atomic_read(&amp;netfs_n_rh_retry_read_subreq),</div><div class='add'>+		   atomic_read(&amp;netfs_n_wh_retry_write_req),</div><div class='add'>+		   atomic_read(&amp;netfs_n_wh_retry_write_subreq));</div><div class='add'>+	seq_printf(m, "Objs   : rr=%u sr=%u foq=%u wsc=%u\n",</div><div class='add'>+		   atomic_read(&amp;netfs_n_rh_rreq),</div><div class='add'>+		   atomic_read(&amp;netfs_n_rh_sreq),</div><div class='add'>+		   atomic_read(&amp;netfs_n_folioq),</div><div class='add'>+		   atomic_read(&amp;netfs_n_wh_wstream_conflict));</div><div class='add'>+	seq_printf(m, "WbLock : skip=%u wait=%u\n",</div><div class='add'>+		   atomic_read(&amp;netfs_n_wb_lock_skip),</div><div class='add'>+		   atomic_read(&amp;netfs_n_wb_lock_wait));</div><div class='add'>+	return fscache_stats_show(m);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL(netfs_stats_show);</div><div class='head'>diff --git a/fs/netfs/write_collect.c b/fs/netfs/write_collect.c<br/>new file mode 100644<br/>index 000000000000..cbf3d9194c7b<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/write_collect.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/write_collect.c</a></div><div class='hunk'>@@ -0,0 +1,531 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-only</div><div class='add'>+/* Network filesystem write subrequest result collection, assessment</div><div class='add'>+ * and retrying.</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2024 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/export.h&gt;</div><div class='add'>+#include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/mm.h&gt;</div><div class='add'>+#include &lt;linux/pagemap.h&gt;</div><div class='add'>+#include &lt;linux/slab.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+/* Notes made in the collector */</div><div class='add'>+#define HIT_PENDING		0x01	/* A front op was still pending */</div><div class='add'>+#define NEED_REASSESS		0x02	/* Need to loop round and reassess */</div><div class='add'>+#define MADE_PROGRESS		0x04	/* Made progress cleaning up a stream or the folio set */</div><div class='add'>+#define NEED_UNLOCK		0x08	/* The pagecache needs unlocking */</div><div class='add'>+#define NEED_RETRY		0x10	/* A front op requests retrying */</div><div class='add'>+#define SAW_FAILURE		0x20	/* One stream or hit a permanent failure */</div><div class='add'>+</div><div class='add'>+static void netfs_dump_request(const struct netfs_io_request *rreq)</div><div class='add'>+{</div><div class='add'>+	pr_err("Request R=%08x r=%d fl=%lx or=%x e=%ld\n",</div><div class='add'>+	       rreq-&gt;debug_id, refcount_read(&amp;rreq-&gt;ref), rreq-&gt;flags,</div><div class='add'>+	       rreq-&gt;origin, rreq-&gt;error);</div><div class='add'>+	pr_err("  st=%llx tsl=%zx/%llx/%llx\n",</div><div class='add'>+	       rreq-&gt;start, rreq-&gt;transferred, rreq-&gt;submitted, rreq-&gt;len);</div><div class='add'>+	pr_err("  cci=%llx/%llx/%llx\n",</div><div class='add'>+	       rreq-&gt;cleaned_to, rreq-&gt;collected_to, atomic64_read(&amp;rreq-&gt;issued_to));</div><div class='add'>+	pr_err("  iw=%pSR\n", rreq-&gt;netfs_ops-&gt;issue_write);</div><div class='add'>+	for (int i = 0; i &lt; NR_IO_STREAMS; i++) {</div><div class='add'>+		const struct netfs_io_subrequest *sreq;</div><div class='add'>+		const struct netfs_io_stream *s = &amp;rreq-&gt;io_streams[i];</div><div class='add'>+</div><div class='add'>+		pr_err("  str[%x] s=%x e=%d acnf=%u,%u,%u,%u\n",</div><div class='add'>+		       s-&gt;stream_nr, s-&gt;source, s-&gt;error,</div><div class='add'>+		       s-&gt;avail, s-&gt;active, s-&gt;need_retry, s-&gt;failed);</div><div class='add'>+		pr_err("  str[%x] ct=%llx t=%zx\n",</div><div class='add'>+		       s-&gt;stream_nr, s-&gt;collected_to, s-&gt;transferred);</div><div class='add'>+		list_for_each_entry(sreq, &amp;s-&gt;subrequests, rreq_link) {</div><div class='add'>+			pr_err("  sreq[%x:%x] sc=%u s=%llx t=%zx/%zx r=%d f=%lx\n",</div><div class='add'>+			       sreq-&gt;stream_nr, sreq-&gt;debug_index, sreq-&gt;source,</div><div class='add'>+			       sreq-&gt;start, sreq-&gt;transferred, sreq-&gt;len,</div><div class='add'>+			       refcount_read(&amp;sreq-&gt;ref), sreq-&gt;flags);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Successful completion of write of a folio to the server and/or cache.  Note</div><div class='add'>+ * that we are not allowed to lock the folio here on pain of deadlocking with</div><div class='add'>+ * truncate.</div><div class='add'>+ */</div><div class='add'>+int netfs_folio_written_back(struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	enum netfs_folio_trace why = netfs_folio_trace_clear;</div><div class='add'>+	struct netfs_inode *ictx = netfs_inode(folio-&gt;mapping-&gt;host);</div><div class='add'>+	struct netfs_folio *finfo;</div><div class='add'>+	struct netfs_group *group = NULL;</div><div class='add'>+	int gcount = 0;</div><div class='add'>+</div><div class='add'>+	if ((finfo = netfs_folio_info(folio))) {</div><div class='add'>+		/* Streaming writes cannot be redirtied whilst under writeback,</div><div class='add'>+		 * so discard the streaming record.</div><div class='add'>+		 */</div><div class='add'>+		unsigned long long fend;</div><div class='add'>+</div><div class='add'>+		fend = folio_pos(folio) + finfo-&gt;dirty_offset + finfo-&gt;dirty_len;</div><div class='add'>+		if (fend &gt; ictx-&gt;zero_point)</div><div class='add'>+			ictx-&gt;zero_point = fend;</div><div class='add'>+</div><div class='add'>+		folio_detach_private(folio);</div><div class='add'>+		group = finfo-&gt;netfs_group;</div><div class='add'>+		gcount++;</div><div class='add'>+		kfree(finfo);</div><div class='add'>+		why = netfs_folio_trace_clear_s;</div><div class='add'>+		goto end_wb;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if ((group = netfs_folio_group(folio))) {</div><div class='add'>+		if (group == NETFS_FOLIO_COPY_TO_CACHE) {</div><div class='add'>+			why = netfs_folio_trace_clear_cc;</div><div class='add'>+			folio_detach_private(folio);</div><div class='add'>+			goto end_wb;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* Need to detach the group pointer if the page didn't get</div><div class='add'>+		 * redirtied.  If it has been redirtied, then it must be within</div><div class='add'>+		 * the same group.</div><div class='add'>+		 */</div><div class='add'>+		why = netfs_folio_trace_redirtied;</div><div class='add'>+		if (!folio_test_dirty(folio)) {</div><div class='add'>+			folio_detach_private(folio);</div><div class='add'>+			gcount++;</div><div class='add'>+			why = netfs_folio_trace_clear_g;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+end_wb:</div><div class='add'>+	trace_netfs_folio(folio, why);</div><div class='add'>+	folio_end_writeback(folio);</div><div class='add'>+	return gcount;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Unlock any folios we've finished with.</div><div class='add'>+ */</div><div class='add'>+static void netfs_writeback_unlock_folios(struct netfs_io_request *wreq,</div><div class='add'>+					  unsigned int *notes)</div><div class='add'>+{</div><div class='add'>+	struct folio_queue *folioq = wreq-&gt;buffer.tail;</div><div class='add'>+	unsigned long long collected_to = wreq-&gt;collected_to;</div><div class='add'>+	unsigned int slot = wreq-&gt;buffer.first_tail_slot;</div><div class='add'>+</div><div class='add'>+	if (WARN_ON_ONCE(!folioq)) {</div><div class='add'>+		pr_err("[!] Writeback unlock found empty rolling buffer!\n");</div><div class='add'>+		netfs_dump_request(wreq);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (wreq-&gt;origin == NETFS_PGPRIV2_COPY_TO_CACHE) {</div><div class='add'>+		if (netfs_pgpriv2_unlock_copied_folios(wreq))</div><div class='add'>+			*notes |= MADE_PROGRESS;</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (slot &gt;= folioq_nr_slots(folioq)) {</div><div class='add'>+		folioq = rolling_buffer_delete_spent(&amp;wreq-&gt;buffer);</div><div class='add'>+		if (!folioq)</div><div class='add'>+			return;</div><div class='add'>+		slot = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for (;;) {</div><div class='add'>+		struct folio *folio;</div><div class='add'>+		struct netfs_folio *finfo;</div><div class='add'>+		unsigned long long fpos, fend;</div><div class='add'>+		size_t fsize, flen;</div><div class='add'>+</div><div class='add'>+		folio = folioq_folio(folioq, slot);</div><div class='add'>+		if (WARN_ONCE(!folio_test_writeback(folio),</div><div class='add'>+			      "R=%08x: folio %lx is not under writeback\n",</div><div class='add'>+			      wreq-&gt;debug_id, folio-&gt;index))</div><div class='add'>+			trace_netfs_folio(folio, netfs_folio_trace_not_under_wback);</div><div class='add'>+</div><div class='add'>+		fpos = folio_pos(folio);</div><div class='add'>+		fsize = folio_size(folio);</div><div class='add'>+		finfo = netfs_folio_info(folio);</div><div class='add'>+		flen = finfo ? finfo-&gt;dirty_offset + finfo-&gt;dirty_len : fsize;</div><div class='add'>+</div><div class='add'>+		fend = min_t(unsigned long long, fpos + flen, wreq-&gt;i_size);</div><div class='add'>+</div><div class='add'>+		trace_netfs_collect_folio(wreq, folio, fend, collected_to);</div><div class='add'>+</div><div class='add'>+		/* Unlock any folio we've transferred all of. */</div><div class='add'>+		if (collected_to &lt; fend)</div><div class='add'>+			break;</div><div class='add'>+</div><div class='add'>+		wreq-&gt;nr_group_rel += netfs_folio_written_back(folio);</div><div class='add'>+		wreq-&gt;cleaned_to = fpos + fsize;</div><div class='add'>+		*notes |= MADE_PROGRESS;</div><div class='add'>+</div><div class='add'>+		/* Clean up the head folioq.  If we clear an entire folioq, then</div><div class='add'>+		 * we can get rid of it provided it's not also the tail folioq</div><div class='add'>+		 * being filled by the issuer.</div><div class='add'>+		 */</div><div class='add'>+		folioq_clear(folioq, slot);</div><div class='add'>+		slot++;</div><div class='add'>+		if (slot &gt;= folioq_nr_slots(folioq)) {</div><div class='add'>+			folioq = rolling_buffer_delete_spent(&amp;wreq-&gt;buffer);</div><div class='add'>+			if (!folioq)</div><div class='add'>+				goto done;</div><div class='add'>+			slot = 0;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (fpos + fsize &gt;= collected_to)</div><div class='add'>+			break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	wreq-&gt;buffer.tail = folioq;</div><div class='add'>+done:</div><div class='add'>+	wreq-&gt;buffer.first_tail_slot = slot;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Collect and assess the results of various write subrequests.  We may need to</div><div class='add'>+ * retry some of the results - or even do an RMW cycle for content crypto.</div><div class='add'>+ *</div><div class='add'>+ * Note that we have a number of parallel, overlapping lists of subrequests,</div><div class='add'>+ * one to the server and one to the local cache for example, which may not be</div><div class='add'>+ * the same size or starting position and may not even correspond in boundary</div><div class='add'>+ * alignment.</div><div class='add'>+ */</div><div class='add'>+static void netfs_collect_write_results(struct netfs_io_request *wreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_subrequest *front, *remove;</div><div class='add'>+	struct netfs_io_stream *stream;</div><div class='add'>+	unsigned long long collected_to, issued_to;</div><div class='add'>+	unsigned int notes;</div><div class='add'>+	int s;</div><div class='add'>+</div><div class='add'>+	_enter("%llx-%llx", wreq-&gt;start, wreq-&gt;start + wreq-&gt;len);</div><div class='add'>+	trace_netfs_collect(wreq);</div><div class='add'>+	trace_netfs_rreq(wreq, netfs_rreq_trace_collect);</div><div class='add'>+</div><div class='add'>+reassess_streams:</div><div class='add'>+	issued_to = atomic64_read(&amp;wreq-&gt;issued_to);</div><div class='add'>+	smp_rmb();</div><div class='add'>+	collected_to = ULLONG_MAX;</div><div class='add'>+	if (wreq-&gt;origin == NETFS_WRITEBACK ||</div><div class='add'>+	    wreq-&gt;origin == NETFS_WRITETHROUGH ||</div><div class='add'>+	    wreq-&gt;origin == NETFS_PGPRIV2_COPY_TO_CACHE)</div><div class='add'>+		notes = NEED_UNLOCK;</div><div class='add'>+	else</div><div class='add'>+		notes = 0;</div><div class='add'>+</div><div class='add'>+	/* Remove completed subrequests from the front of the streams and</div><div class='add'>+	 * advance the completion point on each stream.  We stop when we hit</div><div class='add'>+	 * something that's in progress.  The issuer thread may be adding stuff</div><div class='add'>+	 * to the tail whilst we're doing this.</div><div class='add'>+	 */</div><div class='add'>+	for (s = 0; s &lt; NR_IO_STREAMS; s++) {</div><div class='add'>+		stream = &amp;wreq-&gt;io_streams[s];</div><div class='add'>+		/* Read active flag before list pointers */</div><div class='add'>+		if (!smp_load_acquire(&amp;stream-&gt;active))</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		front = stream-&gt;front;</div><div class='add'>+		while (front) {</div><div class='add'>+			trace_netfs_collect_sreq(wreq, front);</div><div class='add'>+			//_debug("sreq [%x] %llx %zx/%zx",</div><div class='add'>+			//       front-&gt;debug_index, front-&gt;start, front-&gt;transferred, front-&gt;len);</div><div class='add'>+</div><div class='add'>+			if (stream-&gt;collected_to &lt; front-&gt;start) {</div><div class='add'>+				trace_netfs_collect_gap(wreq, stream, issued_to, 'F');</div><div class='add'>+				stream-&gt;collected_to = front-&gt;start;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			/* Stall if the front is still undergoing I/O. */</div><div class='add'>+			if (netfs_check_subreq_in_progress(front)) {</div><div class='add'>+				notes |= HIT_PENDING;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+			smp_rmb(); /* Read counters after I-P flag. */</div><div class='add'>+</div><div class='add'>+			if (stream-&gt;failed) {</div><div class='add'>+				stream-&gt;collected_to = front-&gt;start + front-&gt;len;</div><div class='add'>+				notes |= MADE_PROGRESS | SAW_FAILURE;</div><div class='add'>+				goto cancel;</div><div class='add'>+			}</div><div class='add'>+			if (front-&gt;start + front-&gt;transferred &gt; stream-&gt;collected_to) {</div><div class='add'>+				stream-&gt;collected_to = front-&gt;start + front-&gt;transferred;</div><div class='add'>+				stream-&gt;transferred = stream-&gt;collected_to - wreq-&gt;start;</div><div class='add'>+				stream-&gt;transferred_valid = true;</div><div class='add'>+				notes |= MADE_PROGRESS;</div><div class='add'>+			}</div><div class='add'>+			if (test_bit(NETFS_SREQ_FAILED, &amp;front-&gt;flags)) {</div><div class='add'>+				stream-&gt;failed = true;</div><div class='add'>+				stream-&gt;error = front-&gt;error;</div><div class='add'>+				if (stream-&gt;source == NETFS_UPLOAD_TO_SERVER)</div><div class='add'>+					mapping_set_error(wreq-&gt;mapping, front-&gt;error);</div><div class='add'>+				notes |= NEED_REASSESS | SAW_FAILURE;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+			if (front-&gt;transferred &lt; front-&gt;len) {</div><div class='add'>+				stream-&gt;need_retry = true;</div><div class='add'>+				notes |= NEED_RETRY | MADE_PROGRESS;</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+		cancel:</div><div class='add'>+			/* Remove if completely consumed. */</div><div class='add'>+			spin_lock(&amp;wreq-&gt;lock);</div><div class='add'>+</div><div class='add'>+			remove = front;</div><div class='add'>+			list_del_init(&amp;front-&gt;rreq_link);</div><div class='add'>+			front = list_first_entry_or_null(&amp;stream-&gt;subrequests,</div><div class='add'>+							 struct netfs_io_subrequest, rreq_link);</div><div class='add'>+			stream-&gt;front = front;</div><div class='add'>+			spin_unlock(&amp;wreq-&gt;lock);</div><div class='add'>+			netfs_put_subrequest(remove,</div><div class='add'>+					     notes &amp; SAW_FAILURE ?</div><div class='add'>+					     netfs_sreq_trace_put_cancel :</div><div class='add'>+					     netfs_sreq_trace_put_done);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* If we have an empty stream, we need to jump it forward</div><div class='add'>+		 * otherwise the collection point will never advance.</div><div class='add'>+		 */</div><div class='add'>+		if (!front &amp;&amp; issued_to &gt; stream-&gt;collected_to) {</div><div class='add'>+			trace_netfs_collect_gap(wreq, stream, issued_to, 'E');</div><div class='add'>+			stream-&gt;collected_to = issued_to;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (stream-&gt;collected_to &lt; collected_to)</div><div class='add'>+			collected_to = stream-&gt;collected_to;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (collected_to != ULLONG_MAX &amp;&amp; collected_to &gt; wreq-&gt;collected_to)</div><div class='add'>+		wreq-&gt;collected_to = collected_to;</div><div class='add'>+</div><div class='add'>+	for (s = 0; s &lt; NR_IO_STREAMS; s++) {</div><div class='add'>+		stream = &amp;wreq-&gt;io_streams[s];</div><div class='add'>+		if (stream-&gt;active)</div><div class='add'>+			trace_netfs_collect_stream(wreq, stream);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	trace_netfs_collect_state(wreq, wreq-&gt;collected_to, notes);</div><div class='add'>+</div><div class='add'>+	/* Unlock any folios that we have now finished with. */</div><div class='add'>+	if (notes &amp; NEED_UNLOCK) {</div><div class='add'>+		if (wreq-&gt;cleaned_to &lt; wreq-&gt;collected_to)</div><div class='add'>+			netfs_writeback_unlock_folios(wreq, &amp;notes);</div><div class='add'>+	} else {</div><div class='add'>+		wreq-&gt;cleaned_to = wreq-&gt;collected_to;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	// TODO: Discard encryption buffers</div><div class='add'>+</div><div class='add'>+	if (notes &amp; NEED_RETRY)</div><div class='add'>+		goto need_retry;</div><div class='add'>+</div><div class='add'>+	if (notes &amp; MADE_PROGRESS) {</div><div class='add'>+		netfs_wake_rreq_flag(wreq, NETFS_RREQ_PAUSE, netfs_rreq_trace_unpause);</div><div class='add'>+		//cond_resched();</div><div class='add'>+		goto reassess_streams;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (notes &amp; NEED_REASSESS) {</div><div class='add'>+		//cond_resched();</div><div class='add'>+		goto reassess_streams;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	netfs_put_group_many(wreq-&gt;group, wreq-&gt;nr_group_rel);</div><div class='add'>+	wreq-&gt;nr_group_rel = 0;</div><div class='add'>+	_leave(" = %x", notes);</div><div class='add'>+	return;</div><div class='add'>+</div><div class='add'>+need_retry:</div><div class='add'>+	/* Okay...  We're going to have to retry one or both streams.  Note</div><div class='add'>+	 * that any partially completed op will have had any wholly transferred</div><div class='add'>+	 * folios removed from it.</div><div class='add'>+	 */</div><div class='add'>+	_debug("retry");</div><div class='add'>+	netfs_retry_writes(wreq);</div><div class='add'>+	goto out;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Perform the collection of subrequests, folios and encryption buffers.</div><div class='add'>+ */</div><div class='add'>+bool netfs_write_collection(struct netfs_io_request *wreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_inode *ictx = netfs_inode(wreq-&gt;inode);</div><div class='add'>+	size_t transferred;</div><div class='add'>+	bool transferred_valid = false;</div><div class='add'>+	int s;</div><div class='add'>+</div><div class='add'>+	_enter("R=%x", wreq-&gt;debug_id);</div><div class='add'>+</div><div class='add'>+	netfs_collect_write_results(wreq);</div><div class='add'>+</div><div class='add'>+	/* We're done when the app thread has finished posting subreqs and all</div><div class='add'>+	 * the queues in all the streams are empty.</div><div class='add'>+	 */</div><div class='add'>+	if (!test_bit(NETFS_RREQ_ALL_QUEUED, &amp;wreq-&gt;flags))</div><div class='add'>+		return false;</div><div class='add'>+	smp_rmb(); /* Read ALL_QUEUED before lists. */</div><div class='add'>+</div><div class='add'>+	transferred = LONG_MAX;</div><div class='add'>+	for (s = 0; s &lt; NR_IO_STREAMS; s++) {</div><div class='add'>+		struct netfs_io_stream *stream = &amp;wreq-&gt;io_streams[s];</div><div class='add'>+		if (!stream-&gt;active)</div><div class='add'>+			continue;</div><div class='add'>+		if (!list_empty(&amp;stream-&gt;subrequests))</div><div class='add'>+			return false;</div><div class='add'>+		if (stream-&gt;transferred_valid &amp;&amp;</div><div class='add'>+		    stream-&gt;transferred &lt; transferred) {</div><div class='add'>+			transferred = stream-&gt;transferred;</div><div class='add'>+			transferred_valid = true;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Okay, declare that all I/O is complete. */</div><div class='add'>+	if (transferred_valid)</div><div class='add'>+		wreq-&gt;transferred = transferred;</div><div class='add'>+	trace_netfs_rreq(wreq, netfs_rreq_trace_write_done);</div><div class='add'>+</div><div class='add'>+	if (wreq-&gt;io_streams[1].active &amp;&amp;</div><div class='add'>+	    wreq-&gt;io_streams[1].failed &amp;&amp;</div><div class='add'>+	    ictx-&gt;ops-&gt;invalidate_cache) {</div><div class='add'>+		/* Cache write failure doesn't prevent writeback completion</div><div class='add'>+		 * unless we're in disconnected mode.</div><div class='add'>+		 */</div><div class='add'>+		ictx-&gt;ops-&gt;invalidate_cache(wreq);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if ((wreq-&gt;origin == NETFS_UNBUFFERED_WRITE ||</div><div class='add'>+	     wreq-&gt;origin == NETFS_DIO_WRITE) &amp;&amp;</div><div class='add'>+	    !wreq-&gt;error)</div><div class='add'>+		netfs_update_i_size(ictx, &amp;ictx-&gt;inode, wreq-&gt;start, wreq-&gt;transferred);</div><div class='add'>+</div><div class='add'>+	if (wreq-&gt;origin == NETFS_DIO_WRITE &amp;&amp;</div><div class='add'>+	    wreq-&gt;mapping-&gt;nrpages) {</div><div class='add'>+		/* mmap may have got underfoot and we may now have folios</div><div class='add'>+		 * locally covering the region we just wrote.  Attempt to</div><div class='add'>+		 * discard the folios, but leave in place any modified locally.</div><div class='add'>+		 * -&gt;write_iter() is prevented from interfering by the DIO</div><div class='add'>+		 * counter.</div><div class='add'>+		 */</div><div class='add'>+		pgoff_t first = wreq-&gt;start &gt;&gt; PAGE_SHIFT;</div><div class='add'>+		pgoff_t last = (wreq-&gt;start + wreq-&gt;transferred - 1) &gt;&gt; PAGE_SHIFT;</div><div class='add'>+		invalidate_inode_pages2_range(wreq-&gt;mapping, first, last);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (wreq-&gt;origin == NETFS_DIO_WRITE)</div><div class='add'>+		inode_dio_end(wreq-&gt;inode);</div><div class='add'>+</div><div class='add'>+	_debug("finished");</div><div class='add'>+	netfs_wake_rreq_flag(wreq, NETFS_RREQ_IN_PROGRESS, netfs_rreq_trace_wake_ip);</div><div class='add'>+	/* As we cleared NETFS_RREQ_IN_PROGRESS, we acquired its ref. */</div><div class='add'>+</div><div class='add'>+	if (wreq-&gt;iocb) {</div><div class='add'>+		size_t written = min(wreq-&gt;transferred, wreq-&gt;len);</div><div class='add'>+		wreq-&gt;iocb-&gt;ki_pos += written;</div><div class='add'>+		if (wreq-&gt;iocb-&gt;ki_complete) {</div><div class='add'>+			trace_netfs_rreq(wreq, netfs_rreq_trace_ki_complete);</div><div class='add'>+			wreq-&gt;iocb-&gt;ki_complete(</div><div class='add'>+				wreq-&gt;iocb, wreq-&gt;error ? wreq-&gt;error : written);</div><div class='add'>+		}</div><div class='add'>+		wreq-&gt;iocb = VFS_PTR_POISON;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	netfs_clear_subrequests(wreq);</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void netfs_write_collection_worker(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *rreq = container_of(work, struct netfs_io_request, work);</div><div class='add'>+</div><div class='add'>+	netfs_see_request(rreq, netfs_rreq_trace_see_work);</div><div class='add'>+	if (netfs_check_rreq_in_progress(rreq)) {</div><div class='add'>+		if (netfs_write_collection(rreq))</div><div class='add'>+			/* Drop the ref from the IN_PROGRESS flag. */</div><div class='add'>+			netfs_put_request(rreq, netfs_rreq_trace_put_work_ip);</div><div class='add'>+		else</div><div class='add'>+			netfs_see_request(rreq, netfs_rreq_trace_see_work_complete);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_write_subrequest_terminated - Note the termination of a write operation.</div><div class='add'>+ * @_op: The I/O request that has terminated.</div><div class='add'>+ * @transferred_or_error: The amount of data transferred or an error code.</div><div class='add'>+ *</div><div class='add'>+ * This tells the library that a contributory write I/O operation has</div><div class='add'>+ * terminated, one way or another, and that it should collect the results.</div><div class='add'>+ *</div><div class='add'>+ * The caller indicates in @transferred_or_error the outcome of the operation,</div><div class='add'>+ * supplying a positive value to indicate the number of bytes transferred or a</div><div class='add'>+ * negative error code.  The library will look after reissuing I/O operations</div><div class='add'>+ * as appropriate and writing downloaded data to the cache.</div><div class='add'>+ *</div><div class='add'>+ * When this is called, ownership of the subrequest is transferred back to the</div><div class='add'>+ * library, along with a ref.</div><div class='add'>+ *</div><div class='add'>+ * Note that %_op is a void* so that the function can be passed to</div><div class='add'>+ * kiocb::term_func without the need for a casting wrapper.</div><div class='add'>+ */</div><div class='add'>+void netfs_write_subrequest_terminated(void *_op, ssize_t transferred_or_error)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_subrequest *subreq = _op;</div><div class='add'>+	struct netfs_io_request *wreq = subreq-&gt;rreq;</div><div class='add'>+</div><div class='add'>+	_enter("%x[%x] %zd", wreq-&gt;debug_id, subreq-&gt;debug_index, transferred_or_error);</div><div class='add'>+</div><div class='add'>+	switch (subreq-&gt;source) {</div><div class='add'>+	case NETFS_UPLOAD_TO_SERVER:</div><div class='add'>+		netfs_stat(&amp;netfs_n_wh_upload_done);</div><div class='add'>+		break;</div><div class='add'>+	case NETFS_WRITE_TO_CACHE:</div><div class='add'>+		netfs_stat(&amp;netfs_n_wh_write_done);</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		BUG();</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (IS_ERR_VALUE(transferred_or_error)) {</div><div class='add'>+		subreq-&gt;error = transferred_or_error;</div><div class='add'>+		if (subreq-&gt;error == -EAGAIN)</div><div class='add'>+			set_bit(NETFS_SREQ_NEED_RETRY, &amp;subreq-&gt;flags);</div><div class='add'>+		else</div><div class='add'>+			set_bit(NETFS_SREQ_FAILED, &amp;subreq-&gt;flags);</div><div class='add'>+		trace_netfs_failure(wreq, subreq, transferred_or_error, netfs_fail_write);</div><div class='add'>+</div><div class='add'>+		switch (subreq-&gt;source) {</div><div class='add'>+		case NETFS_WRITE_TO_CACHE:</div><div class='add'>+			netfs_stat(&amp;netfs_n_wh_write_failed);</div><div class='add'>+			break;</div><div class='add'>+		case NETFS_UPLOAD_TO_SERVER:</div><div class='add'>+			netfs_stat(&amp;netfs_n_wh_upload_failed);</div><div class='add'>+			break;</div><div class='add'>+		default:</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+		trace_netfs_rreq(wreq, netfs_rreq_trace_set_pause);</div><div class='add'>+		set_bit(NETFS_RREQ_PAUSE, &amp;wreq-&gt;flags);</div><div class='add'>+	} else {</div><div class='add'>+		if (WARN(transferred_or_error &gt; subreq-&gt;len - subreq-&gt;transferred,</div><div class='add'>+			 "Subreq excess write: R=%x[%x] %zd &gt; %zu - %zu",</div><div class='add'>+			 wreq-&gt;debug_id, subreq-&gt;debug_index,</div><div class='add'>+			 transferred_or_error, subreq-&gt;len, subreq-&gt;transferred))</div><div class='add'>+			transferred_or_error = subreq-&gt;len - subreq-&gt;transferred;</div><div class='add'>+</div><div class='add'>+		subreq-&gt;error = 0;</div><div class='add'>+		subreq-&gt;transferred += transferred_or_error;</div><div class='add'>+</div><div class='add'>+		if (subreq-&gt;transferred &lt; subreq-&gt;len)</div><div class='add'>+			set_bit(NETFS_SREQ_NEED_RETRY, &amp;subreq-&gt;flags);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	trace_netfs_sreq(subreq, netfs_sreq_trace_terminated);</div><div class='add'>+	netfs_subreq_clear_in_progress(subreq);</div><div class='add'>+	netfs_put_subrequest(subreq, netfs_sreq_trace_put_terminated);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_write_subrequest_terminated);</div><div class='head'>diff --git a/fs/netfs/write_issue.c b/fs/netfs/write_issue.c<br/>new file mode 100644<br/>index 000000000000..dd8743bc8d7f<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/write_issue.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/write_issue.c</a></div><div class='hunk'>@@ -0,0 +1,926 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-only</div><div class='add'>+/* Network filesystem high-level (buffered) writeback.</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2024 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ *</div><div class='add'>+ *</div><div class='add'>+ * To support network filesystems with local caching, we manage a situation</div><div class='add'>+ * that can be envisioned like the following:</div><div class='add'>+ *</div><div class='add'>+ *               +---+---+-----+-----+---+----------+</div><div class='add'>+ *    Folios:    |   |   |     |     |   |          |</div><div class='add'>+ *               +---+---+-----+-----+---+----------+</div><div class='add'>+ *</div><div class='add'>+ *                 +------+------+     +----+----+</div><div class='add'>+ *    Upload:      |      |      |.....|    |    |</div><div class='add'>+ *  (Stream 0)     +------+------+     +----+----+</div><div class='add'>+ *</div><div class='add'>+ *               +------+------+------+------+------+</div><div class='add'>+ *    Cache:     |      |      |      |      |      |</div><div class='add'>+ *  (Stream 1)   +------+------+------+------+------+</div><div class='add'>+ *</div><div class='add'>+ * Where we have a sequence of folios of varying sizes that we need to overlay</div><div class='add'>+ * with multiple parallel streams of I/O requests, where the I/O requests in a</div><div class='add'>+ * stream may also be of various sizes (in cifs, for example, the sizes are</div><div class='add'>+ * negotiated with the server; in something like ceph, they may represent the</div><div class='add'>+ * sizes of storage objects).</div><div class='add'>+ *</div><div class='add'>+ * The sequence in each stream may contain gaps and noncontiguous subrequests</div><div class='add'>+ * may be glued together into single vectored write RPCs.</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/export.h&gt;</div><div class='add'>+#include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/mm.h&gt;</div><div class='add'>+#include &lt;linux/pagemap.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Kill all dirty folios in the event of an unrecoverable error, starting with</div><div class='add'>+ * a locked folio we've already obtained from writeback_iter().</div><div class='add'>+ */</div><div class='add'>+static void netfs_kill_dirty_pages(struct address_space *mapping,</div><div class='add'>+				   struct writeback_control *wbc,</div><div class='add'>+				   struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	int error = 0;</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		enum netfs_folio_trace why = netfs_folio_trace_kill;</div><div class='add'>+		struct netfs_group *group = NULL;</div><div class='add'>+		struct netfs_folio *finfo = NULL;</div><div class='add'>+		void *priv;</div><div class='add'>+</div><div class='add'>+		priv = folio_detach_private(folio);</div><div class='add'>+		if (priv) {</div><div class='add'>+			finfo = __netfs_folio_info(priv);</div><div class='add'>+			if (finfo) {</div><div class='add'>+				/* Kill folio from streaming write. */</div><div class='add'>+				group = finfo-&gt;netfs_group;</div><div class='add'>+				why = netfs_folio_trace_kill_s;</div><div class='add'>+			} else {</div><div class='add'>+				group = priv;</div><div class='add'>+				if (group == NETFS_FOLIO_COPY_TO_CACHE) {</div><div class='add'>+					/* Kill copy-to-cache folio */</div><div class='add'>+					why = netfs_folio_trace_kill_cc;</div><div class='add'>+					group = NULL;</div><div class='add'>+				} else {</div><div class='add'>+					/* Kill folio with group */</div><div class='add'>+					why = netfs_folio_trace_kill_g;</div><div class='add'>+				}</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		trace_netfs_folio(folio, why);</div><div class='add'>+</div><div class='add'>+		folio_start_writeback(folio);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_end_writeback(folio);</div><div class='add'>+</div><div class='add'>+		netfs_put_group(group);</div><div class='add'>+		kfree(finfo);</div><div class='add'>+</div><div class='add'>+	} while ((folio = writeback_iter(mapping, wbc, folio, &amp;error)));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Create a write request and set it up appropriately for the origin type.</div><div class='add'>+ */</div><div class='add'>+struct netfs_io_request *netfs_create_write_req(struct address_space *mapping,</div><div class='add'>+						struct file *file,</div><div class='add'>+						loff_t start,</div><div class='add'>+						enum netfs_io_origin origin)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *wreq;</div><div class='add'>+	struct netfs_inode *ictx;</div><div class='add'>+	bool is_cacheable = (origin == NETFS_WRITEBACK ||</div><div class='add'>+			     origin == NETFS_WRITEBACK_SINGLE ||</div><div class='add'>+			     origin == NETFS_WRITETHROUGH ||</div><div class='add'>+			     origin == NETFS_PGPRIV2_COPY_TO_CACHE);</div><div class='add'>+</div><div class='add'>+	wreq = netfs_alloc_request(mapping, file, start, 0, origin);</div><div class='add'>+	if (IS_ERR(wreq))</div><div class='add'>+		return wreq;</div><div class='add'>+</div><div class='add'>+	_enter("R=%x", wreq-&gt;debug_id);</div><div class='add'>+</div><div class='add'>+	ictx = netfs_inode(wreq-&gt;inode);</div><div class='add'>+	if (is_cacheable &amp;&amp; netfs_is_cache_enabled(ictx))</div><div class='add'>+		fscache_begin_write_operation(&amp;wreq-&gt;cache_resources, netfs_i_cookie(ictx));</div><div class='add'>+	if (rolling_buffer_init(&amp;wreq-&gt;buffer, wreq-&gt;debug_id, ITER_SOURCE) &lt; 0)</div><div class='add'>+		goto nomem;</div><div class='add'>+</div><div class='add'>+	wreq-&gt;cleaned_to = wreq-&gt;start;</div><div class='add'>+</div><div class='add'>+	wreq-&gt;io_streams[0].stream_nr		= 0;</div><div class='add'>+	wreq-&gt;io_streams[0].source		= NETFS_UPLOAD_TO_SERVER;</div><div class='add'>+	wreq-&gt;io_streams[0].prepare_write	= ictx-&gt;ops-&gt;prepare_write;</div><div class='add'>+	wreq-&gt;io_streams[0].issue_write		= ictx-&gt;ops-&gt;issue_write;</div><div class='add'>+	wreq-&gt;io_streams[0].collected_to	= start;</div><div class='add'>+	wreq-&gt;io_streams[0].transferred		= 0;</div><div class='add'>+</div><div class='add'>+	wreq-&gt;io_streams[1].stream_nr		= 1;</div><div class='add'>+	wreq-&gt;io_streams[1].source		= NETFS_WRITE_TO_CACHE;</div><div class='add'>+	wreq-&gt;io_streams[1].collected_to	= start;</div><div class='add'>+	wreq-&gt;io_streams[1].transferred		= 0;</div><div class='add'>+	if (fscache_resources_valid(&amp;wreq-&gt;cache_resources)) {</div><div class='add'>+		wreq-&gt;io_streams[1].avail	= true;</div><div class='add'>+		wreq-&gt;io_streams[1].active	= true;</div><div class='add'>+		wreq-&gt;io_streams[1].prepare_write = wreq-&gt;cache_resources.ops-&gt;prepare_write_subreq;</div><div class='add'>+		wreq-&gt;io_streams[1].issue_write = wreq-&gt;cache_resources.ops-&gt;issue_write;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return wreq;</div><div class='add'>+nomem:</div><div class='add'>+	netfs_put_failed_request(wreq);</div><div class='add'>+	return ERR_PTR(-ENOMEM);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_prepare_write_failed - Note write preparation failed</div><div class='add'>+ * @subreq: The subrequest to mark</div><div class='add'>+ *</div><div class='add'>+ * Mark a subrequest to note that preparation for write failed.</div><div class='add'>+ */</div><div class='add'>+void netfs_prepare_write_failed(struct netfs_io_subrequest *subreq)</div><div class='add'>+{</div><div class='add'>+	__set_bit(NETFS_SREQ_FAILED, &amp;subreq-&gt;flags);</div><div class='add'>+	trace_netfs_sreq(subreq, netfs_sreq_trace_prep_failed);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_prepare_write_failed);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Prepare a write subrequest.  We need to allocate a new subrequest</div><div class='add'>+ * if we don't have one.</div><div class='add'>+ */</div><div class='add'>+static void netfs_prepare_write(struct netfs_io_request *wreq,</div><div class='add'>+				struct netfs_io_stream *stream,</div><div class='add'>+				loff_t start)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_subrequest *subreq;</div><div class='add'>+	struct iov_iter *wreq_iter = &amp;wreq-&gt;buffer.iter;</div><div class='add'>+</div><div class='add'>+	/* Make sure we don't point the iterator at a used-up folio_queue</div><div class='add'>+	 * struct being used as a placeholder to prevent the queue from</div><div class='add'>+	 * collapsing.  In such a case, extend the queue.</div><div class='add'>+	 */</div><div class='add'>+	if (iov_iter_is_folioq(wreq_iter) &amp;&amp;</div><div class='add'>+	    wreq_iter-&gt;folioq_slot &gt;= folioq_nr_slots(wreq_iter-&gt;folioq))</div><div class='add'>+		rolling_buffer_make_space(&amp;wreq-&gt;buffer);</div><div class='add'>+</div><div class='add'>+	subreq = netfs_alloc_subrequest(wreq);</div><div class='add'>+	subreq-&gt;source		= stream-&gt;source;</div><div class='add'>+	subreq-&gt;start		= start;</div><div class='add'>+	subreq-&gt;stream_nr	= stream-&gt;stream_nr;</div><div class='add'>+	subreq-&gt;io_iter		= *wreq_iter;</div><div class='add'>+</div><div class='add'>+	_enter("R=%x[%x]", wreq-&gt;debug_id, subreq-&gt;debug_index);</div><div class='add'>+</div><div class='add'>+	trace_netfs_sreq(subreq, netfs_sreq_trace_prepare);</div><div class='add'>+</div><div class='add'>+	stream-&gt;sreq_max_len	= UINT_MAX;</div><div class='add'>+	stream-&gt;sreq_max_segs	= INT_MAX;</div><div class='add'>+	switch (stream-&gt;source) {</div><div class='add'>+	case NETFS_UPLOAD_TO_SERVER:</div><div class='add'>+		netfs_stat(&amp;netfs_n_wh_upload);</div><div class='add'>+		stream-&gt;sreq_max_len = wreq-&gt;wsize;</div><div class='add'>+		break;</div><div class='add'>+	case NETFS_WRITE_TO_CACHE:</div><div class='add'>+		netfs_stat(&amp;netfs_n_wh_write);</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		WARN_ON_ONCE(1);</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (stream-&gt;prepare_write)</div><div class='add'>+		stream-&gt;prepare_write(subreq);</div><div class='add'>+</div><div class='add'>+	__set_bit(NETFS_SREQ_IN_PROGRESS, &amp;subreq-&gt;flags);</div><div class='add'>+</div><div class='add'>+	/* We add to the end of the list whilst the collector may be walking</div><div class='add'>+	 * the list.  The collector only goes nextwards and uses the lock to</div><div class='add'>+	 * remove entries off of the front.</div><div class='add'>+	 */</div><div class='add'>+	spin_lock(&amp;wreq-&gt;lock);</div><div class='add'>+	list_add_tail(&amp;subreq-&gt;rreq_link, &amp;stream-&gt;subrequests);</div><div class='add'>+	if (list_is_first(&amp;subreq-&gt;rreq_link, &amp;stream-&gt;subrequests)) {</div><div class='add'>+		stream-&gt;front = subreq;</div><div class='add'>+		if (!stream-&gt;active) {</div><div class='add'>+			stream-&gt;collected_to = stream-&gt;front-&gt;start;</div><div class='add'>+			/* Write list pointers before active flag */</div><div class='add'>+			smp_store_release(&amp;stream-&gt;active, true);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_unlock(&amp;wreq-&gt;lock);</div><div class='add'>+</div><div class='add'>+	stream-&gt;construct = subreq;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Set the I/O iterator for the filesystem/cache to use and dispatch the I/O</div><div class='add'>+ * operation.  The operation may be asynchronous and should call</div><div class='add'>+ * netfs_write_subrequest_terminated() when complete.</div><div class='add'>+ */</div><div class='add'>+static void netfs_do_issue_write(struct netfs_io_stream *stream,</div><div class='add'>+				 struct netfs_io_subrequest *subreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *wreq = subreq-&gt;rreq;</div><div class='add'>+</div><div class='add'>+	_enter("R=%x[%x],%zx", wreq-&gt;debug_id, subreq-&gt;debug_index, subreq-&gt;len);</div><div class='add'>+</div><div class='add'>+	if (test_bit(NETFS_SREQ_FAILED, &amp;subreq-&gt;flags))</div><div class='add'>+		return netfs_write_subrequest_terminated(subreq, subreq-&gt;error);</div><div class='add'>+</div><div class='add'>+	trace_netfs_sreq(subreq, netfs_sreq_trace_submit);</div><div class='add'>+	stream-&gt;issue_write(subreq);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void netfs_reissue_write(struct netfs_io_stream *stream,</div><div class='add'>+			 struct netfs_io_subrequest *subreq,</div><div class='add'>+			 struct iov_iter *source)</div><div class='add'>+{</div><div class='add'>+	size_t size = subreq-&gt;len - subreq-&gt;transferred;</div><div class='add'>+</div><div class='add'>+	// TODO: Use encrypted buffer</div><div class='add'>+	subreq-&gt;io_iter = *source;</div><div class='add'>+	iov_iter_advance(source, size);</div><div class='add'>+	iov_iter_truncate(&amp;subreq-&gt;io_iter, size);</div><div class='add'>+</div><div class='add'>+	subreq-&gt;retry_count++;</div><div class='add'>+	__clear_bit(NETFS_SREQ_MADE_PROGRESS, &amp;subreq-&gt;flags);</div><div class='add'>+	__set_bit(NETFS_SREQ_IN_PROGRESS, &amp;subreq-&gt;flags);</div><div class='add'>+	netfs_stat(&amp;netfs_n_wh_retry_write_subreq);</div><div class='add'>+	netfs_do_issue_write(stream, subreq);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void netfs_issue_write(struct netfs_io_request *wreq,</div><div class='add'>+		       struct netfs_io_stream *stream)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_subrequest *subreq = stream-&gt;construct;</div><div class='add'>+</div><div class='add'>+	if (!subreq)</div><div class='add'>+		return;</div><div class='add'>+	stream-&gt;construct = NULL;</div><div class='add'>+	subreq-&gt;io_iter.count = subreq-&gt;len;</div><div class='add'>+	netfs_do_issue_write(stream, subreq);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Add data to the write subrequest, dispatching each as we fill it up or if it</div><div class='add'>+ * is discontiguous with the previous.  We only fill one part at a time so that</div><div class='add'>+ * we can avoid overrunning the credits obtained (cifs) and try to parallelise</div><div class='add'>+ * content-crypto preparation with network writes.</div><div class='add'>+ */</div><div class='add'>+size_t netfs_advance_write(struct netfs_io_request *wreq,</div><div class='add'>+			   struct netfs_io_stream *stream,</div><div class='add'>+			   loff_t start, size_t len, bool to_eof)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_subrequest *subreq = stream-&gt;construct;</div><div class='add'>+	size_t part;</div><div class='add'>+</div><div class='add'>+	if (!stream-&gt;avail) {</div><div class='add'>+		_leave("no write");</div><div class='add'>+		return len;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	_enter("R=%x[%x]", wreq-&gt;debug_id, subreq ? subreq-&gt;debug_index : 0);</div><div class='add'>+</div><div class='add'>+	if (subreq &amp;&amp; start != subreq-&gt;start + subreq-&gt;len) {</div><div class='add'>+		netfs_issue_write(wreq, stream);</div><div class='add'>+		subreq = NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!stream-&gt;construct)</div><div class='add'>+		netfs_prepare_write(wreq, stream, start);</div><div class='add'>+	subreq = stream-&gt;construct;</div><div class='add'>+</div><div class='add'>+	part = umin(stream-&gt;sreq_max_len - subreq-&gt;len, len);</div><div class='add'>+	_debug("part %zx/%zx %zx/%zx", subreq-&gt;len, stream-&gt;sreq_max_len, part, len);</div><div class='add'>+	subreq-&gt;len += part;</div><div class='add'>+	subreq-&gt;nr_segs++;</div><div class='add'>+	stream-&gt;submit_extendable_to -= part;</div><div class='add'>+</div><div class='add'>+	if (subreq-&gt;len &gt;= stream-&gt;sreq_max_len ||</div><div class='add'>+	    subreq-&gt;nr_segs &gt;= stream-&gt;sreq_max_segs ||</div><div class='add'>+	    to_eof) {</div><div class='add'>+		netfs_issue_write(wreq, stream);</div><div class='add'>+		subreq = NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return part;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Write some of a pending folio data back to the server.</div><div class='add'>+ */</div><div class='add'>+static int netfs_write_folio(struct netfs_io_request *wreq,</div><div class='add'>+			     struct writeback_control *wbc,</div><div class='add'>+			     struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_stream *upload = &amp;wreq-&gt;io_streams[0];</div><div class='add'>+	struct netfs_io_stream *cache  = &amp;wreq-&gt;io_streams[1];</div><div class='add'>+	struct netfs_io_stream *stream;</div><div class='add'>+	struct netfs_group *fgroup; /* TODO: Use this with ceph */</div><div class='add'>+	struct netfs_folio *finfo;</div><div class='add'>+	size_t iter_off = 0;</div><div class='add'>+	size_t fsize = folio_size(folio), flen = fsize, foff = 0;</div><div class='add'>+	loff_t fpos = folio_pos(folio), i_size;</div><div class='add'>+	bool to_eof = false, streamw = false;</div><div class='add'>+	bool debug = false;</div><div class='add'>+</div><div class='add'>+	_enter("");</div><div class='add'>+</div><div class='add'>+	if (rolling_buffer_make_space(&amp;wreq-&gt;buffer) &lt; 0)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	/* netfs_perform_write() may shift i_size around the page or from out</div><div class='add'>+	 * of the page to beyond it, but cannot move i_size into or through the</div><div class='add'>+	 * page since we have it locked.</div><div class='add'>+	 */</div><div class='add'>+	i_size = i_size_read(wreq-&gt;inode);</div><div class='add'>+</div><div class='add'>+	if (fpos &gt;= i_size) {</div><div class='add'>+		/* mmap beyond eof. */</div><div class='add'>+		_debug("beyond eof");</div><div class='add'>+		folio_start_writeback(folio);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		wreq-&gt;nr_group_rel += netfs_folio_written_back(folio);</div><div class='add'>+		netfs_put_group_many(wreq-&gt;group, wreq-&gt;nr_group_rel);</div><div class='add'>+		wreq-&gt;nr_group_rel = 0;</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (fpos + fsize &gt; wreq-&gt;i_size)</div><div class='add'>+		wreq-&gt;i_size = i_size;</div><div class='add'>+</div><div class='add'>+	fgroup = netfs_folio_group(folio);</div><div class='add'>+	finfo = netfs_folio_info(folio);</div><div class='add'>+	if (finfo) {</div><div class='add'>+		foff = finfo-&gt;dirty_offset;</div><div class='add'>+		flen = foff + finfo-&gt;dirty_len;</div><div class='add'>+		streamw = true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (wreq-&gt;origin == NETFS_WRITETHROUGH) {</div><div class='add'>+		to_eof = false;</div><div class='add'>+		if (flen &gt; i_size - fpos)</div><div class='add'>+			flen = i_size - fpos;</div><div class='add'>+	} else if (flen &gt; i_size - fpos) {</div><div class='add'>+		flen = i_size - fpos;</div><div class='add'>+		if (!streamw)</div><div class='add'>+			folio_zero_segment(folio, flen, fsize);</div><div class='add'>+		to_eof = true;</div><div class='add'>+	} else if (flen == i_size - fpos) {</div><div class='add'>+		to_eof = true;</div><div class='add'>+	}</div><div class='add'>+	flen -= foff;</div><div class='add'>+</div><div class='add'>+	_debug("folio %zx %zx %zx", foff, flen, fsize);</div><div class='add'>+</div><div class='add'>+	/* Deal with discontinuities in the stream of dirty pages.  These can</div><div class='add'>+	 * arise from a number of sources:</div><div class='add'>+	 *</div><div class='add'>+	 * (1) Intervening non-dirty pages from random-access writes, multiple</div><div class='add'>+	 *     flushers writing back different parts simultaneously and manual</div><div class='add'>+	 *     syncing.</div><div class='add'>+	 *</div><div class='add'>+	 * (2) Partially-written pages from write-streaming.</div><div class='add'>+	 *</div><div class='add'>+	 * (3) Pages that belong to a different write-back group (eg.  Ceph</div><div class='add'>+	 *     snapshots).</div><div class='add'>+	 *</div><div class='add'>+	 * (4) Actually-clean pages that were marked for write to the cache</div><div class='add'>+	 *     when they were read.  Note that these appear as a special</div><div class='add'>+	 *     write-back group.</div><div class='add'>+	 */</div><div class='add'>+	if (fgroup == NETFS_FOLIO_COPY_TO_CACHE) {</div><div class='add'>+		netfs_issue_write(wreq, upload);</div><div class='add'>+	} else if (fgroup != wreq-&gt;group) {</div><div class='add'>+		/* We can't write this page to the server yet. */</div><div class='add'>+		kdebug("wrong group");</div><div class='add'>+		folio_redirty_for_writepage(wbc, folio);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		netfs_issue_write(wreq, upload);</div><div class='add'>+		netfs_issue_write(wreq, cache);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (foff &gt; 0)</div><div class='add'>+		netfs_issue_write(wreq, upload);</div><div class='add'>+	if (streamw)</div><div class='add'>+		netfs_issue_write(wreq, cache);</div><div class='add'>+</div><div class='add'>+	/* Flip the page to the writeback state and unlock.  If we're called</div><div class='add'>+	 * from write-through, then the page has already been put into the wb</div><div class='add'>+	 * state.</div><div class='add'>+	 */</div><div class='add'>+	if (wreq-&gt;origin == NETFS_WRITEBACK)</div><div class='add'>+		folio_start_writeback(folio);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+</div><div class='add'>+	if (fgroup == NETFS_FOLIO_COPY_TO_CACHE) {</div><div class='add'>+		if (!cache-&gt;avail) {</div><div class='add'>+			trace_netfs_folio(folio, netfs_folio_trace_cancel_copy);</div><div class='add'>+			netfs_issue_write(wreq, upload);</div><div class='add'>+			netfs_folio_written_back(folio);</div><div class='add'>+			return 0;</div><div class='add'>+		}</div><div class='add'>+		trace_netfs_folio(folio, netfs_folio_trace_store_copy);</div><div class='add'>+	} else if (!upload-&gt;avail &amp;&amp; !cache-&gt;avail) {</div><div class='add'>+		trace_netfs_folio(folio, netfs_folio_trace_cancel_store);</div><div class='add'>+		netfs_folio_written_back(folio);</div><div class='add'>+		return 0;</div><div class='add'>+	} else if (!upload-&gt;construct) {</div><div class='add'>+		trace_netfs_folio(folio, netfs_folio_trace_store);</div><div class='add'>+	} else {</div><div class='add'>+		trace_netfs_folio(folio, netfs_folio_trace_store_plus);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Attach the folio to the rolling buffer. */</div><div class='add'>+	rolling_buffer_append(&amp;wreq-&gt;buffer, folio, 0);</div><div class='add'>+</div><div class='add'>+	/* Move the submission point forward to allow for write-streaming data</div><div class='add'>+	 * not starting at the front of the page.  We don't do write-streaming</div><div class='add'>+	 * with the cache as the cache requires DIO alignment.</div><div class='add'>+	 *</div><div class='add'>+	 * Also skip uploading for data that's been read and just needs copying</div><div class='add'>+	 * to the cache.</div><div class='add'>+	 */</div><div class='add'>+	for (int s = 0; s &lt; NR_IO_STREAMS; s++) {</div><div class='add'>+		stream = &amp;wreq-&gt;io_streams[s];</div><div class='add'>+		stream-&gt;submit_off = foff;</div><div class='add'>+		stream-&gt;submit_len = flen;</div><div class='add'>+		if (!stream-&gt;avail ||</div><div class='add'>+		    (stream-&gt;source == NETFS_WRITE_TO_CACHE &amp;&amp; streamw) ||</div><div class='add'>+		    (stream-&gt;source == NETFS_UPLOAD_TO_SERVER &amp;&amp;</div><div class='add'>+		     fgroup == NETFS_FOLIO_COPY_TO_CACHE)) {</div><div class='add'>+			stream-&gt;submit_off = UINT_MAX;</div><div class='add'>+			stream-&gt;submit_len = 0;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Attach the folio to one or more subrequests.  For a big folio, we</div><div class='add'>+	 * could end up with thousands of subrequests if the wsize is small -</div><div class='add'>+	 * but we might need to wait during the creation of subrequests for</div><div class='add'>+	 * network resources (eg. SMB credits).</div><div class='add'>+	 */</div><div class='add'>+	for (;;) {</div><div class='add'>+		ssize_t part;</div><div class='add'>+		size_t lowest_off = ULONG_MAX;</div><div class='add'>+		int choose_s = -1;</div><div class='add'>+</div><div class='add'>+		/* Always add to the lowest-submitted stream first. */</div><div class='add'>+		for (int s = 0; s &lt; NR_IO_STREAMS; s++) {</div><div class='add'>+			stream = &amp;wreq-&gt;io_streams[s];</div><div class='add'>+			if (stream-&gt;submit_len &gt; 0 &amp;&amp;</div><div class='add'>+			    stream-&gt;submit_off &lt; lowest_off) {</div><div class='add'>+				lowest_off = stream-&gt;submit_off;</div><div class='add'>+				choose_s = s;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (choose_s &lt; 0)</div><div class='add'>+			break;</div><div class='add'>+		stream = &amp;wreq-&gt;io_streams[choose_s];</div><div class='add'>+</div><div class='add'>+		/* Advance the iterator(s). */</div><div class='add'>+		if (stream-&gt;submit_off &gt; iter_off) {</div><div class='add'>+			rolling_buffer_advance(&amp;wreq-&gt;buffer, stream-&gt;submit_off - iter_off);</div><div class='add'>+			iter_off = stream-&gt;submit_off;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		atomic64_set(&amp;wreq-&gt;issued_to, fpos + stream-&gt;submit_off);</div><div class='add'>+		stream-&gt;submit_extendable_to = fsize - stream-&gt;submit_off;</div><div class='add'>+		part = netfs_advance_write(wreq, stream, fpos + stream-&gt;submit_off,</div><div class='add'>+					   stream-&gt;submit_len, to_eof);</div><div class='add'>+		stream-&gt;submit_off += part;</div><div class='add'>+		if (part &gt; stream-&gt;submit_len)</div><div class='add'>+			stream-&gt;submit_len = 0;</div><div class='add'>+		else</div><div class='add'>+			stream-&gt;submit_len -= part;</div><div class='add'>+		if (part &gt; 0)</div><div class='add'>+			debug = true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (fsize &gt; iter_off)</div><div class='add'>+		rolling_buffer_advance(&amp;wreq-&gt;buffer, fsize - iter_off);</div><div class='add'>+	atomic64_set(&amp;wreq-&gt;issued_to, fpos + fsize);</div><div class='add'>+</div><div class='add'>+	if (!debug)</div><div class='add'>+		kdebug("R=%x: No submit", wreq-&gt;debug_id);</div><div class='add'>+</div><div class='add'>+	if (foff + flen &lt; fsize)</div><div class='add'>+		for (int s = 0; s &lt; NR_IO_STREAMS; s++)</div><div class='add'>+			netfs_issue_write(wreq, &amp;wreq-&gt;io_streams[s]);</div><div class='add'>+</div><div class='add'>+	_leave(" = 0");</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * End the issuing of writes, letting the collector know we're done.</div><div class='add'>+ */</div><div class='add'>+static void netfs_end_issue_write(struct netfs_io_request *wreq)</div><div class='add'>+{</div><div class='add'>+	bool needs_poke = true;</div><div class='add'>+</div><div class='add'>+	smp_wmb(); /* Write subreq lists before ALL_QUEUED. */</div><div class='add'>+	set_bit(NETFS_RREQ_ALL_QUEUED, &amp;wreq-&gt;flags);</div><div class='add'>+</div><div class='add'>+	for (int s = 0; s &lt; NR_IO_STREAMS; s++) {</div><div class='add'>+		struct netfs_io_stream *stream = &amp;wreq-&gt;io_streams[s];</div><div class='add'>+</div><div class='add'>+		if (!stream-&gt;active)</div><div class='add'>+			continue;</div><div class='add'>+		if (!list_empty(&amp;stream-&gt;subrequests))</div><div class='add'>+			needs_poke = false;</div><div class='add'>+		netfs_issue_write(wreq, stream);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (needs_poke)</div><div class='add'>+		netfs_wake_collector(wreq);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Write some of the pending data back to the server</div><div class='add'>+ */</div><div class='add'>+int netfs_writepages(struct address_space *mapping,</div><div class='add'>+		     struct writeback_control *wbc)</div><div class='add'>+{</div><div class='add'>+	struct netfs_inode *ictx = netfs_inode(mapping-&gt;host);</div><div class='add'>+	struct netfs_io_request *wreq = NULL;</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	int error = 0;</div><div class='add'>+</div><div class='add'>+	if (!mutex_trylock(&amp;ictx-&gt;wb_lock)) {</div><div class='add'>+		if (wbc-&gt;sync_mode == WB_SYNC_NONE) {</div><div class='add'>+			netfs_stat(&amp;netfs_n_wb_lock_skip);</div><div class='add'>+			return 0;</div><div class='add'>+		}</div><div class='add'>+		netfs_stat(&amp;netfs_n_wb_lock_wait);</div><div class='add'>+		mutex_lock(&amp;ictx-&gt;wb_lock);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Need the first folio to be able to set up the op. */</div><div class='add'>+	folio = writeback_iter(mapping, wbc, NULL, &amp;error);</div><div class='add'>+	if (!folio)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	wreq = netfs_create_write_req(mapping, NULL, folio_pos(folio), NETFS_WRITEBACK);</div><div class='add'>+	if (IS_ERR(wreq)) {</div><div class='add'>+		error = PTR_ERR(wreq);</div><div class='add'>+		goto couldnt_start;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	__set_bit(NETFS_RREQ_OFFLOAD_COLLECTION, &amp;wreq-&gt;flags);</div><div class='add'>+	trace_netfs_write(wreq, netfs_write_trace_writeback);</div><div class='add'>+	netfs_stat(&amp;netfs_n_wh_writepages);</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		_debug("wbiter %lx %llx", folio-&gt;index, atomic64_read(&amp;wreq-&gt;issued_to));</div><div class='add'>+</div><div class='add'>+		/* It appears we don't have to handle cyclic writeback wrapping. */</div><div class='add'>+		WARN_ON_ONCE(wreq &amp;&amp; folio_pos(folio) &lt; atomic64_read(&amp;wreq-&gt;issued_to));</div><div class='add'>+</div><div class='add'>+		if (netfs_folio_group(folio) != NETFS_FOLIO_COPY_TO_CACHE &amp;&amp;</div><div class='add'>+		    unlikely(!test_bit(NETFS_RREQ_UPLOAD_TO_SERVER, &amp;wreq-&gt;flags))) {</div><div class='add'>+			set_bit(NETFS_RREQ_UPLOAD_TO_SERVER, &amp;wreq-&gt;flags);</div><div class='add'>+			wreq-&gt;netfs_ops-&gt;begin_writeback(wreq);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		error = netfs_write_folio(wreq, wbc, folio);</div><div class='add'>+		if (error &lt; 0)</div><div class='add'>+			break;</div><div class='add'>+	} while ((folio = writeback_iter(mapping, wbc, folio, &amp;error)));</div><div class='add'>+</div><div class='add'>+	netfs_end_issue_write(wreq);</div><div class='add'>+</div><div class='add'>+	mutex_unlock(&amp;ictx-&gt;wb_lock);</div><div class='add'>+	netfs_wake_collector(wreq);</div><div class='add'>+</div><div class='add'>+	netfs_put_request(wreq, netfs_rreq_trace_put_return);</div><div class='add'>+	_leave(" = %d", error);</div><div class='add'>+	return error;</div><div class='add'>+</div><div class='add'>+couldnt_start:</div><div class='add'>+	netfs_kill_dirty_pages(mapping, wbc, folio);</div><div class='add'>+out:</div><div class='add'>+	mutex_unlock(&amp;ictx-&gt;wb_lock);</div><div class='add'>+	_leave(" = %d", error);</div><div class='add'>+	return error;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_writepages);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Begin a write operation for writing through the pagecache.</div><div class='add'>+ */</div><div class='add'>+struct netfs_io_request *netfs_begin_writethrough(struct kiocb *iocb, size_t len)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *wreq = NULL;</div><div class='add'>+	struct netfs_inode *ictx = netfs_inode(file_inode(iocb-&gt;ki_filp));</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;ictx-&gt;wb_lock);</div><div class='add'>+</div><div class='add'>+	wreq = netfs_create_write_req(iocb-&gt;ki_filp-&gt;f_mapping, iocb-&gt;ki_filp,</div><div class='add'>+				      iocb-&gt;ki_pos, NETFS_WRITETHROUGH);</div><div class='add'>+	if (IS_ERR(wreq)) {</div><div class='add'>+		mutex_unlock(&amp;ictx-&gt;wb_lock);</div><div class='add'>+		return wreq;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	wreq-&gt;io_streams[0].avail = true;</div><div class='add'>+	trace_netfs_write(wreq, netfs_write_trace_writethrough);</div><div class='add'>+	return wreq;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Advance the state of the write operation used when writing through the</div><div class='add'>+ * pagecache.  Data has been copied into the pagecache that we need to append</div><div class='add'>+ * to the request.  If we've added more than wsize then we need to create a new</div><div class='add'>+ * subrequest.</div><div class='add'>+ */</div><div class='add'>+int netfs_advance_writethrough(struct netfs_io_request *wreq, struct writeback_control *wbc,</div><div class='add'>+			       struct folio *folio, size_t copied, bool to_page_end,</div><div class='add'>+			       struct folio **writethrough_cache)</div><div class='add'>+{</div><div class='add'>+	_enter("R=%x ic=%zu ws=%u cp=%zu tp=%u",</div><div class='add'>+	       wreq-&gt;debug_id, wreq-&gt;buffer.iter.count, wreq-&gt;wsize, copied, to_page_end);</div><div class='add'>+</div><div class='add'>+	if (!*writethrough_cache) {</div><div class='add'>+		if (folio_test_dirty(folio))</div><div class='add'>+			/* Sigh.  mmap. */</div><div class='add'>+			folio_clear_dirty_for_io(folio);</div><div class='add'>+</div><div class='add'>+		/* We can make multiple writes to the folio... */</div><div class='add'>+		folio_start_writeback(folio);</div><div class='add'>+		if (wreq-&gt;len == 0)</div><div class='add'>+			trace_netfs_folio(folio, netfs_folio_trace_wthru);</div><div class='add'>+		else</div><div class='add'>+			trace_netfs_folio(folio, netfs_folio_trace_wthru_plus);</div><div class='add'>+		*writethrough_cache = folio;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	wreq-&gt;len += copied;</div><div class='add'>+	if (!to_page_end)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	*writethrough_cache = NULL;</div><div class='add'>+	return netfs_write_folio(wreq, wbc, folio);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * End a write operation used when writing through the pagecache.</div><div class='add'>+ */</div><div class='add'>+ssize_t netfs_end_writethrough(struct netfs_io_request *wreq, struct writeback_control *wbc,</div><div class='add'>+			       struct folio *writethrough_cache)</div><div class='add'>+{</div><div class='add'>+	struct netfs_inode *ictx = netfs_inode(wreq-&gt;inode);</div><div class='add'>+	ssize_t ret;</div><div class='add'>+</div><div class='add'>+	_enter("R=%x", wreq-&gt;debug_id);</div><div class='add'>+</div><div class='add'>+	if (writethrough_cache)</div><div class='add'>+		netfs_write_folio(wreq, wbc, writethrough_cache);</div><div class='add'>+</div><div class='add'>+	netfs_end_issue_write(wreq);</div><div class='add'>+</div><div class='add'>+	mutex_unlock(&amp;ictx-&gt;wb_lock);</div><div class='add'>+</div><div class='add'>+	if (wreq-&gt;iocb)</div><div class='add'>+		ret = -EIOCBQUEUED;</div><div class='add'>+	else</div><div class='add'>+		ret = netfs_wait_for_write(wreq);</div><div class='add'>+	netfs_put_request(wreq, netfs_rreq_trace_put_return);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Write data to the server without going through the pagecache and without</div><div class='add'>+ * writing it to the local cache.</div><div class='add'>+ */</div><div class='add'>+int netfs_unbuffered_write(struct netfs_io_request *wreq, bool may_wait, size_t len)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_stream *upload = &amp;wreq-&gt;io_streams[0];</div><div class='add'>+	ssize_t part;</div><div class='add'>+	loff_t start = wreq-&gt;start;</div><div class='add'>+	int error = 0;</div><div class='add'>+</div><div class='add'>+	_enter("%zx", len);</div><div class='add'>+</div><div class='add'>+	if (wreq-&gt;origin == NETFS_DIO_WRITE)</div><div class='add'>+		inode_dio_begin(wreq-&gt;inode);</div><div class='add'>+</div><div class='add'>+	while (len) {</div><div class='add'>+		// TODO: Prepare content encryption</div><div class='add'>+</div><div class='add'>+		_debug("unbuffered %zx", len);</div><div class='add'>+		part = netfs_advance_write(wreq, upload, start, len, false);</div><div class='add'>+		start += part;</div><div class='add'>+		len -= part;</div><div class='add'>+		rolling_buffer_advance(&amp;wreq-&gt;buffer, part);</div><div class='add'>+		if (test_bit(NETFS_RREQ_PAUSE, &amp;wreq-&gt;flags))</div><div class='add'>+			netfs_wait_for_paused_write(wreq);</div><div class='add'>+		if (test_bit(NETFS_RREQ_FAILED, &amp;wreq-&gt;flags))</div><div class='add'>+			break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	netfs_end_issue_write(wreq);</div><div class='add'>+	_leave(" = %d", error);</div><div class='add'>+	return error;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Write some of a pending folio data back to the server and/or the cache.</div><div class='add'>+ */</div><div class='add'>+static int netfs_write_folio_single(struct netfs_io_request *wreq,</div><div class='add'>+				    struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_stream *upload = &amp;wreq-&gt;io_streams[0];</div><div class='add'>+	struct netfs_io_stream *cache  = &amp;wreq-&gt;io_streams[1];</div><div class='add'>+	struct netfs_io_stream *stream;</div><div class='add'>+	size_t iter_off = 0;</div><div class='add'>+	size_t fsize = folio_size(folio), flen;</div><div class='add'>+	loff_t fpos = folio_pos(folio);</div><div class='add'>+	bool to_eof = false;</div><div class='add'>+	bool no_debug = false;</div><div class='add'>+</div><div class='add'>+	_enter("");</div><div class='add'>+</div><div class='add'>+	flen = folio_size(folio);</div><div class='add'>+	if (flen &gt; wreq-&gt;i_size - fpos) {</div><div class='add'>+		flen = wreq-&gt;i_size - fpos;</div><div class='add'>+		folio_zero_segment(folio, flen, fsize);</div><div class='add'>+		to_eof = true;</div><div class='add'>+	} else if (flen == wreq-&gt;i_size - fpos) {</div><div class='add'>+		to_eof = true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	_debug("folio %zx/%zx", flen, fsize);</div><div class='add'>+</div><div class='add'>+	if (!upload-&gt;avail &amp;&amp; !cache-&gt;avail) {</div><div class='add'>+		trace_netfs_folio(folio, netfs_folio_trace_cancel_store);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!upload-&gt;construct)</div><div class='add'>+		trace_netfs_folio(folio, netfs_folio_trace_store);</div><div class='add'>+	else</div><div class='add'>+		trace_netfs_folio(folio, netfs_folio_trace_store_plus);</div><div class='add'>+</div><div class='add'>+	/* Attach the folio to the rolling buffer. */</div><div class='add'>+	folio_get(folio);</div><div class='add'>+	rolling_buffer_append(&amp;wreq-&gt;buffer, folio, NETFS_ROLLBUF_PUT_MARK);</div><div class='add'>+</div><div class='add'>+	/* Move the submission point forward to allow for write-streaming data</div><div class='add'>+	 * not starting at the front of the page.  We don't do write-streaming</div><div class='add'>+	 * with the cache as the cache requires DIO alignment.</div><div class='add'>+	 *</div><div class='add'>+	 * Also skip uploading for data that's been read and just needs copying</div><div class='add'>+	 * to the cache.</div><div class='add'>+	 */</div><div class='add'>+	for (int s = 0; s &lt; NR_IO_STREAMS; s++) {</div><div class='add'>+		stream = &amp;wreq-&gt;io_streams[s];</div><div class='add'>+		stream-&gt;submit_off = 0;</div><div class='add'>+		stream-&gt;submit_len = flen;</div><div class='add'>+		if (!stream-&gt;avail) {</div><div class='add'>+			stream-&gt;submit_off = UINT_MAX;</div><div class='add'>+			stream-&gt;submit_len = 0;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Attach the folio to one or more subrequests.  For a big folio, we</div><div class='add'>+	 * could end up with thousands of subrequests if the wsize is small -</div><div class='add'>+	 * but we might need to wait during the creation of subrequests for</div><div class='add'>+	 * network resources (eg. SMB credits).</div><div class='add'>+	 */</div><div class='add'>+	for (;;) {</div><div class='add'>+		ssize_t part;</div><div class='add'>+		size_t lowest_off = ULONG_MAX;</div><div class='add'>+		int choose_s = -1;</div><div class='add'>+</div><div class='add'>+		/* Always add to the lowest-submitted stream first. */</div><div class='add'>+		for (int s = 0; s &lt; NR_IO_STREAMS; s++) {</div><div class='add'>+			stream = &amp;wreq-&gt;io_streams[s];</div><div class='add'>+			if (stream-&gt;submit_len &gt; 0 &amp;&amp;</div><div class='add'>+			    stream-&gt;submit_off &lt; lowest_off) {</div><div class='add'>+				lowest_off = stream-&gt;submit_off;</div><div class='add'>+				choose_s = s;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (choose_s &lt; 0)</div><div class='add'>+			break;</div><div class='add'>+		stream = &amp;wreq-&gt;io_streams[choose_s];</div><div class='add'>+</div><div class='add'>+		/* Advance the iterator(s). */</div><div class='add'>+		if (stream-&gt;submit_off &gt; iter_off) {</div><div class='add'>+			rolling_buffer_advance(&amp;wreq-&gt;buffer, stream-&gt;submit_off - iter_off);</div><div class='add'>+			iter_off = stream-&gt;submit_off;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		atomic64_set(&amp;wreq-&gt;issued_to, fpos + stream-&gt;submit_off);</div><div class='add'>+		stream-&gt;submit_extendable_to = fsize - stream-&gt;submit_off;</div><div class='add'>+		part = netfs_advance_write(wreq, stream, fpos + stream-&gt;submit_off,</div><div class='add'>+					   stream-&gt;submit_len, to_eof);</div><div class='add'>+		stream-&gt;submit_off += part;</div><div class='add'>+		if (part &gt; stream-&gt;submit_len)</div><div class='add'>+			stream-&gt;submit_len = 0;</div><div class='add'>+		else</div><div class='add'>+			stream-&gt;submit_len -= part;</div><div class='add'>+		if (part &gt; 0)</div><div class='add'>+			no_debug = true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	wreq-&gt;buffer.iter.iov_offset = 0;</div><div class='add'>+	if (fsize &gt; iter_off)</div><div class='add'>+		rolling_buffer_advance(&amp;wreq-&gt;buffer, fsize - iter_off);</div><div class='add'>+	atomic64_set(&amp;wreq-&gt;issued_to, fpos + fsize);</div><div class='add'>+</div><div class='add'>+	if (!no_debug)</div><div class='add'>+		kdebug("R=%x: No submit", wreq-&gt;debug_id);</div><div class='add'>+	_leave(" = 0");</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * netfs_writeback_single - Write back a monolithic payload</div><div class='add'>+ * @mapping: The mapping to write from</div><div class='add'>+ * @wbc: Hints from the VM</div><div class='add'>+ * @iter: Data to write, must be ITER_FOLIOQ.</div><div class='add'>+ *</div><div class='add'>+ * Write a monolithic, non-pagecache object back to the server and/or</div><div class='add'>+ * the cache.</div><div class='add'>+ */</div><div class='add'>+int netfs_writeback_single(struct address_space *mapping,</div><div class='add'>+			   struct writeback_control *wbc,</div><div class='add'>+			   struct iov_iter *iter)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_request *wreq;</div><div class='add'>+	struct netfs_inode *ictx = netfs_inode(mapping-&gt;host);</div><div class='add'>+	struct folio_queue *fq;</div><div class='add'>+	size_t size = iov_iter_count(iter);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (WARN_ON_ONCE(!iov_iter_is_folioq(iter)))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	if (!mutex_trylock(&amp;ictx-&gt;wb_lock)) {</div><div class='add'>+		if (wbc-&gt;sync_mode == WB_SYNC_NONE) {</div><div class='add'>+			netfs_stat(&amp;netfs_n_wb_lock_skip);</div><div class='add'>+			return 0;</div><div class='add'>+		}</div><div class='add'>+		netfs_stat(&amp;netfs_n_wb_lock_wait);</div><div class='add'>+		mutex_lock(&amp;ictx-&gt;wb_lock);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	wreq = netfs_create_write_req(mapping, NULL, 0, NETFS_WRITEBACK_SINGLE);</div><div class='add'>+	if (IS_ERR(wreq)) {</div><div class='add'>+		ret = PTR_ERR(wreq);</div><div class='add'>+		goto couldnt_start;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	__set_bit(NETFS_RREQ_OFFLOAD_COLLECTION, &amp;wreq-&gt;flags);</div><div class='add'>+	trace_netfs_write(wreq, netfs_write_trace_writeback_single);</div><div class='add'>+	netfs_stat(&amp;netfs_n_wh_writepages);</div><div class='add'>+</div><div class='add'>+	if (__test_and_set_bit(NETFS_RREQ_UPLOAD_TO_SERVER, &amp;wreq-&gt;flags))</div><div class='add'>+		wreq-&gt;netfs_ops-&gt;begin_writeback(wreq);</div><div class='add'>+</div><div class='add'>+	for (fq = (struct folio_queue *)iter-&gt;folioq; fq; fq = fq-&gt;next) {</div><div class='add'>+		for (int slot = 0; slot &lt; folioq_count(fq); slot++) {</div><div class='add'>+			struct folio *folio = folioq_folio(fq, slot);</div><div class='add'>+			size_t part = umin(folioq_folio_size(fq, slot), size);</div><div class='add'>+</div><div class='add'>+			_debug("wbiter %lx %llx", folio-&gt;index, atomic64_read(&amp;wreq-&gt;issued_to));</div><div class='add'>+</div><div class='add'>+			ret = netfs_write_folio_single(wreq, folio);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				goto stop;</div><div class='add'>+			size -= part;</div><div class='add'>+			if (size &lt;= 0)</div><div class='add'>+				goto stop;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+stop:</div><div class='add'>+	for (int s = 0; s &lt; NR_IO_STREAMS; s++)</div><div class='add'>+		netfs_issue_write(wreq, &amp;wreq-&gt;io_streams[s]);</div><div class='add'>+	smp_wmb(); /* Write lists before ALL_QUEUED. */</div><div class='add'>+	set_bit(NETFS_RREQ_ALL_QUEUED, &amp;wreq-&gt;flags);</div><div class='add'>+</div><div class='add'>+	mutex_unlock(&amp;ictx-&gt;wb_lock);</div><div class='add'>+	netfs_wake_collector(wreq);</div><div class='add'>+</div><div class='add'>+	netfs_put_request(wreq, netfs_rreq_trace_put_return);</div><div class='add'>+	_leave(" = %d", ret);</div><div class='add'>+	return ret;</div><div class='add'>+</div><div class='add'>+couldnt_start:</div><div class='add'>+	mutex_unlock(&amp;ictx-&gt;wb_lock);</div><div class='add'>+	_leave(" = %d", ret);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL(netfs_writeback_single);</div><div class='head'>diff --git a/fs/netfs/write_retry.c b/fs/netfs/write_retry.c<br/>new file mode 100644<br/>index 000000000000..fc9c3e0d34d8<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/netfs/write_retry.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/netfs/write_retry.c</a></div><div class='hunk'>@@ -0,0 +1,230 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-only</div><div class='add'>+/* Network filesystem write retrying.</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2024 Red Hat, Inc. All Rights Reserved.</div><div class='add'>+ * Written by David Howells (dhowells@redhat.com)</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/mm.h&gt;</div><div class='add'>+#include &lt;linux/pagemap.h&gt;</div><div class='add'>+#include &lt;linux/slab.h&gt;</div><div class='add'>+#include "internal.h"</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Perform retries on the streams that need it.</div><div class='add'>+ */</div><div class='add'>+static void netfs_retry_write_stream(struct netfs_io_request *wreq,</div><div class='add'>+				     struct netfs_io_stream *stream)</div><div class='add'>+{</div><div class='add'>+	struct list_head *next;</div><div class='add'>+</div><div class='add'>+	_enter("R=%x[%x:]", wreq-&gt;debug_id, stream-&gt;stream_nr);</div><div class='add'>+</div><div class='add'>+	if (list_empty(&amp;stream-&gt;subrequests))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (stream-&gt;source == NETFS_UPLOAD_TO_SERVER &amp;&amp;</div><div class='add'>+	    wreq-&gt;netfs_ops-&gt;retry_request)</div><div class='add'>+		wreq-&gt;netfs_ops-&gt;retry_request(wreq, stream);</div><div class='add'>+</div><div class='add'>+	if (unlikely(stream-&gt;failed))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/* If there's no renegotiation to do, just resend each failed subreq. */</div><div class='add'>+	if (!stream-&gt;prepare_write) {</div><div class='add'>+		struct netfs_io_subrequest *subreq;</div><div class='add'>+</div><div class='add'>+		list_for_each_entry(subreq, &amp;stream-&gt;subrequests, rreq_link) {</div><div class='add'>+			if (test_bit(NETFS_SREQ_FAILED, &amp;subreq-&gt;flags))</div><div class='add'>+				break;</div><div class='add'>+			if (__test_and_clear_bit(NETFS_SREQ_NEED_RETRY, &amp;subreq-&gt;flags)) {</div><div class='add'>+				struct iov_iter source;</div><div class='add'>+</div><div class='add'>+				netfs_reset_iter(subreq);</div><div class='add'>+				source = subreq-&gt;io_iter;</div><div class='add'>+				netfs_get_subrequest(subreq, netfs_sreq_trace_get_resubmit);</div><div class='add'>+				netfs_reissue_write(stream, subreq, &amp;source);</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	next = stream-&gt;subrequests.next;</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		struct netfs_io_subrequest *subreq = NULL, *from, *to, *tmp;</div><div class='add'>+		struct iov_iter source;</div><div class='add'>+		unsigned long long start, len;</div><div class='add'>+		size_t part;</div><div class='add'>+		bool boundary = false;</div><div class='add'>+</div><div class='add'>+		/* Go through the stream and find the next span of contiguous</div><div class='add'>+		 * data that we then rejig (cifs, for example, needs the wsize</div><div class='add'>+		 * renegotiating) and reissue.</div><div class='add'>+		 */</div><div class='add'>+		from = list_entry(next, struct netfs_io_subrequest, rreq_link);</div><div class='add'>+		to = from;</div><div class='add'>+		start = from-&gt;start + from-&gt;transferred;</div><div class='add'>+		len   = from-&gt;len   - from-&gt;transferred;</div><div class='add'>+</div><div class='add'>+		if (test_bit(NETFS_SREQ_FAILED, &amp;from-&gt;flags) ||</div><div class='add'>+		    !test_bit(NETFS_SREQ_NEED_RETRY, &amp;from-&gt;flags))</div><div class='add'>+			return;</div><div class='add'>+</div><div class='add'>+		list_for_each_continue(next, &amp;stream-&gt;subrequests) {</div><div class='add'>+			subreq = list_entry(next, struct netfs_io_subrequest, rreq_link);</div><div class='add'>+			if (subreq-&gt;start + subreq-&gt;transferred != start + len ||</div><div class='add'>+			    test_bit(NETFS_SREQ_BOUNDARY, &amp;subreq-&gt;flags) ||</div><div class='add'>+			    !test_bit(NETFS_SREQ_NEED_RETRY, &amp;subreq-&gt;flags))</div><div class='add'>+				break;</div><div class='add'>+			to = subreq;</div><div class='add'>+			len += to-&gt;len;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* Determine the set of buffers we're going to use.  Each</div><div class='add'>+		 * subreq gets a subset of a single overall contiguous buffer.</div><div class='add'>+		 */</div><div class='add'>+		netfs_reset_iter(from);</div><div class='add'>+		source = from-&gt;io_iter;</div><div class='add'>+		source.count = len;</div><div class='add'>+</div><div class='add'>+		/* Work through the sublist. */</div><div class='add'>+		subreq = from;</div><div class='add'>+		list_for_each_entry_from(subreq, &amp;stream-&gt;subrequests, rreq_link) {</div><div class='add'>+			if (!len)</div><div class='add'>+				break;</div><div class='add'>+</div><div class='add'>+			subreq-&gt;start	= start;</div><div class='add'>+			subreq-&gt;len	= len;</div><div class='add'>+			__clear_bit(NETFS_SREQ_NEED_RETRY, &amp;subreq-&gt;flags);</div><div class='add'>+			subreq-&gt;retry_count++;</div><div class='add'>+			trace_netfs_sreq(subreq, netfs_sreq_trace_retry);</div><div class='add'>+</div><div class='add'>+			/* Renegotiate max_len (wsize) */</div><div class='add'>+			stream-&gt;sreq_max_len = len;</div><div class='add'>+			stream-&gt;prepare_write(subreq);</div><div class='add'>+</div><div class='add'>+			part = umin(len, stream-&gt;sreq_max_len);</div><div class='add'>+			if (unlikely(stream-&gt;sreq_max_segs))</div><div class='add'>+				part = netfs_limit_iter(&amp;source, 0, part, stream-&gt;sreq_max_segs);</div><div class='add'>+			subreq-&gt;len = part;</div><div class='add'>+			subreq-&gt;transferred = 0;</div><div class='add'>+			len -= part;</div><div class='add'>+			start += part;</div><div class='add'>+			if (len &amp;&amp; subreq == to &amp;&amp;</div><div class='add'>+			    __test_and_clear_bit(NETFS_SREQ_BOUNDARY, &amp;to-&gt;flags))</div><div class='add'>+				boundary = true;</div><div class='add'>+</div><div class='add'>+			netfs_get_subrequest(subreq, netfs_sreq_trace_get_resubmit);</div><div class='add'>+			netfs_reissue_write(stream, subreq, &amp;source);</div><div class='add'>+			if (subreq == to)</div><div class='add'>+				break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* If we managed to use fewer subreqs, we can discard the</div><div class='add'>+		 * excess; if we used the same number, then we're done.</div><div class='add'>+		 */</div><div class='add'>+		if (!len) {</div><div class='add'>+			if (subreq == to)</div><div class='add'>+				continue;</div><div class='add'>+			list_for_each_entry_safe_from(subreq, tmp,</div><div class='add'>+						      &amp;stream-&gt;subrequests, rreq_link) {</div><div class='add'>+				trace_netfs_sreq(subreq, netfs_sreq_trace_discard);</div><div class='add'>+				list_del(&amp;subreq-&gt;rreq_link);</div><div class='add'>+				netfs_put_subrequest(subreq, netfs_sreq_trace_put_done);</div><div class='add'>+				if (subreq == to)</div><div class='add'>+					break;</div><div class='add'>+			}</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* We ran out of subrequests, so we need to allocate some more</div><div class='add'>+		 * and insert them after.</div><div class='add'>+		 */</div><div class='add'>+		do {</div><div class='add'>+			subreq = netfs_alloc_subrequest(wreq);</div><div class='add'>+			subreq-&gt;source		= to-&gt;source;</div><div class='add'>+			subreq-&gt;start		= start;</div><div class='add'>+			subreq-&gt;stream_nr	= to-&gt;stream_nr;</div><div class='add'>+			subreq-&gt;retry_count	= 1;</div><div class='add'>+</div><div class='add'>+			trace_netfs_sreq_ref(wreq-&gt;debug_id, subreq-&gt;debug_index,</div><div class='add'>+					     refcount_read(&amp;subreq-&gt;ref),</div><div class='add'>+					     netfs_sreq_trace_new);</div><div class='add'>+			trace_netfs_sreq(subreq, netfs_sreq_trace_split);</div><div class='add'>+</div><div class='add'>+			list_add(&amp;subreq-&gt;rreq_link, &amp;to-&gt;rreq_link);</div><div class='add'>+			to = list_next_entry(to, rreq_link);</div><div class='add'>+			trace_netfs_sreq(subreq, netfs_sreq_trace_retry);</div><div class='add'>+</div><div class='add'>+			stream-&gt;sreq_max_len	= len;</div><div class='add'>+			stream-&gt;sreq_max_segs	= INT_MAX;</div><div class='add'>+			switch (stream-&gt;source) {</div><div class='add'>+			case NETFS_UPLOAD_TO_SERVER:</div><div class='add'>+				netfs_stat(&amp;netfs_n_wh_upload);</div><div class='add'>+				stream-&gt;sreq_max_len = umin(len, wreq-&gt;wsize);</div><div class='add'>+				break;</div><div class='add'>+			case NETFS_WRITE_TO_CACHE:</div><div class='add'>+				netfs_stat(&amp;netfs_n_wh_write);</div><div class='add'>+				break;</div><div class='add'>+			default:</div><div class='add'>+				WARN_ON_ONCE(1);</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			stream-&gt;prepare_write(subreq);</div><div class='add'>+</div><div class='add'>+			part = umin(len, stream-&gt;sreq_max_len);</div><div class='add'>+			subreq-&gt;len = subreq-&gt;transferred + part;</div><div class='add'>+			len -= part;</div><div class='add'>+			start += part;</div><div class='add'>+			if (!len &amp;&amp; boundary) {</div><div class='add'>+				__set_bit(NETFS_SREQ_BOUNDARY, &amp;to-&gt;flags);</div><div class='add'>+				boundary = false;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			netfs_reissue_write(stream, subreq, &amp;source);</div><div class='add'>+			if (!len)</div><div class='add'>+				break;</div><div class='add'>+</div><div class='add'>+		} while (len);</div><div class='add'>+</div><div class='add'>+	} while (!list_is_head(next, &amp;stream-&gt;subrequests));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Perform retries on the streams that need it.  If we're doing content</div><div class='add'>+ * encryption and the server copy changed due to a third-party write, we may</div><div class='add'>+ * need to do an RMW cycle and also rewrite the data to the cache.</div><div class='add'>+ */</div><div class='add'>+void netfs_retry_writes(struct netfs_io_request *wreq)</div><div class='add'>+{</div><div class='add'>+	struct netfs_io_stream *stream;</div><div class='add'>+	int s;</div><div class='add'>+</div><div class='add'>+	netfs_stat(&amp;netfs_n_wh_retry_write_req);</div><div class='add'>+</div><div class='add'>+	/* Wait for all outstanding I/O to quiesce before performing retries as</div><div class='add'>+	 * we may need to renegotiate the I/O sizes.</div><div class='add'>+	 */</div><div class='add'>+	set_bit(NETFS_RREQ_RETRYING, &amp;wreq-&gt;flags);</div><div class='add'>+	for (s = 0; s &lt; NR_IO_STREAMS; s++) {</div><div class='add'>+		stream = &amp;wreq-&gt;io_streams[s];</div><div class='add'>+		if (stream-&gt;active)</div><div class='add'>+			netfs_wait_for_in_progress_stream(wreq, stream);</div><div class='add'>+	}</div><div class='add'>+	clear_bit(NETFS_RREQ_RETRYING, &amp;wreq-&gt;flags);</div><div class='add'>+</div><div class='add'>+	// TODO: Enc: Fetch changed partial pages</div><div class='add'>+	// TODO: Enc: Reencrypt content if needed.</div><div class='add'>+	// TODO: Enc: Wind back transferred point.</div><div class='add'>+	// TODO: Enc: Mark cache pages for retry.</div><div class='add'>+</div><div class='add'>+	for (s = 0; s &lt; NR_IO_STREAMS; s++) {</div><div class='add'>+		stream = &amp;wreq-&gt;io_streams[s];</div><div class='add'>+		if (stream-&gt;need_retry) {</div><div class='add'>+			stream-&gt;need_retry = false;</div><div class='add'>+			netfs_retry_write_stream(wreq, stream);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+}</div><div class='head'>diff --git a/fs/nfs/Kconfig b/fs/nfs/Kconfig<br/>index 14a72224b657..07932ce9246c 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/Kconfig</a></div><div class='hunk'>@@ -2,8 +2,10 @@</div><div class='ctx'> config NFS_FS</div><div class='ctx'> 	tristate "NFS client support"</div><div class='ctx'> 	depends on INET &amp;&amp; FILE_LOCKING &amp;&amp; MULTIUSER</div><div class='add'>+	select CRC32</div><div class='ctx'> 	select LOCKD</div><div class='ctx'> 	select SUNRPC</div><div class='add'>+	select NFS_COMMON</div><div class='ctx'> 	select NFS_ACL_SUPPORT if NFS_V3_ACL</div><div class='ctx'> 	help</div><div class='ctx'> 	  Choose Y here if you want to access files residing on other</div><div class='hunk'>@@ -33,12 +35,12 @@ config NFS_FS</div><div class='ctx'> config NFS_V2</div><div class='ctx'> 	tristate "NFS client support for NFS version 2"</div><div class='ctx'> 	depends on NFS_FS</div><div class='del'>-	default y</div><div class='add'>+	default n</div><div class='ctx'> 	help</div><div class='ctx'> 	  This option enables support for version 2 of the NFS protocol</div><div class='ctx'> 	  (RFC 1094) in the kernel's NFS client.</div><div class='ctx'> </div><div class='del'>-	  If unsure, say Y.</div><div class='add'>+	  If unsure, say N.</div><div class='ctx'> </div><div class='ctx'> config NFS_V3</div><div class='ctx'> 	tristate "NFS client support for NFS version 3"</div><div class='hunk'>@@ -75,7 +77,6 @@ config NFS_V3_ACL</div><div class='ctx'> config NFS_V4</div><div class='ctx'> 	tristate "NFS client support for NFS version 4"</div><div class='ctx'> 	depends on NFS_FS</div><div class='del'>-	select SUNRPC_GSS</div><div class='ctx'> 	select KEYS</div><div class='ctx'> 	help</div><div class='ctx'> 	  This option enables support for version 4 of the NFS protocol</div><div class='hunk'>@@ -126,7 +127,7 @@ config PNFS_BLOCK</div><div class='ctx'> </div><div class='ctx'> config PNFS_FLEXFILE_LAYOUT</div><div class='ctx'> 	tristate</div><div class='del'>-	depends on NFS_V4_1 &amp;&amp; NFS_V3</div><div class='add'>+	depends on NFS_V4_1</div><div class='ctx'> 	default NFS_V4</div><div class='ctx'> </div><div class='ctx'> config NFS_V4_1_IMPLEMENTATION_ID_DOMAIN</div><div class='hunk'>@@ -170,7 +171,9 @@ config ROOT_NFS</div><div class='ctx'> </div><div class='ctx'> config NFS_FSCACHE</div><div class='ctx'> 	bool "Provide NFS client caching support"</div><div class='del'>-	depends on NFS_FS=m &amp;&amp; FSCACHE || NFS_FS=y &amp;&amp; FSCACHE=y</div><div class='add'>+	depends on NFS_FS</div><div class='add'>+	select NETFS_SUPPORT</div><div class='add'>+	select FSCACHE</div><div class='ctx'> 	help</div><div class='ctx'> 	  Say Y here if you want NFS data to be cached locally on disc through</div><div class='ctx'> 	  the general filesystem cache manager</div><div class='hunk'>@@ -194,7 +197,6 @@ config NFS_USE_KERNEL_DNS</div><div class='ctx'> config NFS_DEBUG</div><div class='ctx'> 	bool</div><div class='ctx'> 	depends on NFS_FS &amp;&amp; SUNRPC_DEBUG</div><div class='del'>-	select CRC32</div><div class='ctx'> 	default y</div><div class='ctx'> </div><div class='ctx'> config NFS_DISABLE_UDP_SUPPORT</div><div class='hunk'>@@ -209,8 +211,6 @@ config NFS_DISABLE_UDP_SUPPORT</div><div class='ctx'> config NFS_V4_2_READ_PLUS</div><div class='ctx'> 	bool "NFS: Enable support for the NFSv4.2 READ_PLUS operation"</div><div class='ctx'> 	depends on NFS_V4_2</div><div class='del'>-	default n</div><div class='add'>+	default y</div><div class='ctx'> 	help</div><div class='del'>-	 This is intended for developers only. The READ_PLUS operation has</div><div class='del'>-	 been shown to have issues under specific conditions and should not</div><div class='del'>-	 be used in production.</div><div class='add'>+	 Choose Y here to enable use of the NFS v4.2 READ_PLUS operation.</div><div class='head'>diff --git a/fs/nfs/Makefile b/fs/nfs/Makefile<br/>index 22d11fdc6deb..9fb2f2cac87e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/Makefile?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/Makefile</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/Makefile?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/Makefile</a></div><div class='hunk'>@@ -12,7 +12,8 @@ nfs-y 			:= client.o dir.o file.o getroot.o inode.o super.o \</div><div class='ctx'> 			   export.o sysfs.o fs_context.o</div><div class='ctx'> nfs-$(CONFIG_ROOT_NFS)	+= nfsroot.o</div><div class='ctx'> nfs-$(CONFIG_SYSCTL)	+= sysctl.o</div><div class='del'>-nfs-$(CONFIG_NFS_FSCACHE) += fscache.o fscache-index.o</div><div class='add'>+nfs-$(CONFIG_NFS_FSCACHE) += fscache.o</div><div class='add'>+nfs-$(CONFIG_NFS_LOCALIO) += localio.o</div><div class='ctx'> </div><div class='ctx'> obj-$(CONFIG_NFS_V2) += nfsv2.o</div><div class='ctx'> nfsv2-y := nfs2super.o proc.o nfs2xdr.o</div><div class='head'>diff --git a/fs/nfs/blocklayout/blocklayout.c b/fs/nfs/blocklayout/blocklayout.c<br/>index fe860c538747..0e4c67373e4f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/blocklayout/blocklayout.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/blocklayout/blocklayout.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/blocklayout/blocklayout.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/blocklayout/blocklayout.c</a></div><div class='hunk'>@@ -115,30 +115,13 @@ bl_submit_bio(struct bio *bio)</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct bio *bl_alloc_init_bio(unsigned int npg,</div><div class='del'>-		struct block_device *bdev, sector_t disk_sector,</div><div class='del'>-		bio_end_io_t end_io, struct parallel_io *par)</div><div class='del'>-{</div><div class='del'>-	struct bio *bio;</div><div class='del'>-</div><div class='del'>-	npg = bio_max_segs(npg);</div><div class='del'>-	bio = bio_alloc(GFP_NOIO, npg);</div><div class='del'>-	if (bio) {</div><div class='del'>-		bio-&gt;bi_iter.bi_sector = disk_sector;</div><div class='del'>-		bio_set_dev(bio, bdev);</div><div class='del'>-		bio-&gt;bi_end_io = end_io;</div><div class='del'>-		bio-&gt;bi_private = par;</div><div class='del'>-	}</div><div class='del'>-	return bio;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static bool offset_in_map(u64 offset, struct pnfs_block_dev_map *map)</div><div class='ctx'> {</div><div class='ctx'> 	return offset &gt;= map-&gt;start &amp;&amp; offset &lt; map-&gt;start + map-&gt;len;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct bio *</div><div class='del'>-do_add_page_to_bio(struct bio *bio, int npg, int rw, sector_t isect,</div><div class='add'>+do_add_page_to_bio(struct bio *bio, int npg, enum req_op op, sector_t isect,</div><div class='ctx'> 		struct page *page, struct pnfs_block_dev_map *map,</div><div class='ctx'> 		struct pnfs_block_extent *be, bio_end_io_t end_io,</div><div class='ctx'> 		struct parallel_io *par, unsigned int offset, int *len)</div><div class='hunk'>@@ -148,7 +131,7 @@ do_add_page_to_bio(struct bio *bio, int npg, int rw, sector_t isect,</div><div class='ctx'> 	u64 disk_addr, end;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("%s: npg %d rw %d isect %llu offset %u len %d\n", __func__,</div><div class='del'>-		npg, rw, (unsigned long long)isect, offset, *len);</div><div class='add'>+		npg, (__force u32)op, (unsigned long long)isect, offset, *len);</div><div class='ctx'> </div><div class='ctx'> 	/* translate to device offset */</div><div class='ctx'> 	isect += be-&gt;be_v_offset;</div><div class='hunk'>@@ -166,16 +149,15 @@ do_add_page_to_bio(struct bio *bio, int npg, int rw, sector_t isect,</div><div class='ctx'> </div><div class='ctx'> 	/* limit length to what the device mapping allows */</div><div class='ctx'> 	end = disk_addr + *len;</div><div class='del'>-	if (end &gt;= map-&gt;start + map-&gt;len)</div><div class='del'>-		*len = map-&gt;start + map-&gt;len - disk_addr;</div><div class='add'>+	if (end &gt;= map-&gt;disk_offset + map-&gt;len)</div><div class='add'>+		*len = map-&gt;disk_offset + map-&gt;len - disk_addr;</div><div class='ctx'> </div><div class='ctx'> retry:</div><div class='ctx'> 	if (!bio) {</div><div class='del'>-		bio = bl_alloc_init_bio(npg, map-&gt;bdev,</div><div class='del'>-				disk_addr &gt;&gt; SECTOR_SHIFT, end_io, par);</div><div class='del'>-		if (!bio)</div><div class='del'>-			return ERR_PTR(-ENOMEM);</div><div class='del'>-		bio_set_op_attrs(bio, rw, 0);</div><div class='add'>+		bio = bio_alloc(map-&gt;bdev, bio_max_segs(npg), op, GFP_NOIO);</div><div class='add'>+		bio-&gt;bi_iter.bi_sector = disk_addr &gt;&gt; SECTOR_SHIFT;</div><div class='add'>+		bio-&gt;bi_end_io = end_io;</div><div class='add'>+		bio-&gt;bi_private = par;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (bio_add_page(bio, page, *len, offset) &lt; *len) {</div><div class='ctx'> 		bio = bl_submit_bio(bio);</div><div class='hunk'>@@ -309,7 +291,7 @@ bl_read_pagelist(struct nfs_pgio_header *header)</div><div class='ctx'> 		} else {</div><div class='ctx'> 			bio = do_add_page_to_bio(bio,</div><div class='ctx'> 						 header-&gt;page_array.npages - i,</div><div class='del'>-						 READ,</div><div class='add'>+						 REQ_OP_READ,</div><div class='ctx'> 						 isect, pages[i], &amp;map, &amp;be,</div><div class='ctx'> 						 bl_end_io_read, par,</div><div class='ctx'> 						 pg_offset, &amp;pg_len);</div><div class='hunk'>@@ -438,9 +420,8 @@ bl_write_pagelist(struct nfs_pgio_header *header, int sync)</div><div class='ctx'> </div><div class='ctx'> 		pg_len = PAGE_SIZE;</div><div class='ctx'> 		bio = do_add_page_to_bio(bio, header-&gt;page_array.npages - i,</div><div class='del'>-					 WRITE, isect, pages[i], &amp;map, &amp;be,</div><div class='del'>-					 bl_end_io_write, par,</div><div class='del'>-					 0, &amp;pg_len);</div><div class='add'>+					 REQ_OP_WRITE, isect, pages[i], &amp;map,</div><div class='add'>+					 &amp;be, bl_end_io_write, par, 0, &amp;pg_len);</div><div class='ctx'> 		if (IS_ERR(bio)) {</div><div class='ctx'> 			header-&gt;pnfs_error = PTR_ERR(bio);</div><div class='ctx'> 			bio = NULL;</div><div class='hunk'>@@ -583,23 +564,45 @@ bl_find_get_deviceid(struct nfs_server *server,</div><div class='ctx'> 		gfp_t gfp_mask)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_deviceid_node *node;</div><div class='del'>-	unsigned long start, end;</div><div class='add'>+	int err = -ENODEV;</div><div class='ctx'> </div><div class='ctx'> retry:</div><div class='ctx'> 	node = nfs4_find_get_deviceid(server, id, cred, gfp_mask);</div><div class='ctx'> 	if (!node)</div><div class='ctx'> 		return ERR_PTR(-ENODEV);</div><div class='ctx'> </div><div class='del'>-	if (test_bit(NFS_DEVICEID_UNAVAILABLE, &amp;node-&gt;flags) == 0)</div><div class='del'>-		return node;</div><div class='add'>+	/*</div><div class='add'>+	 * Devices that are marked unavailable are left in the cache with a</div><div class='add'>+	 * timeout to avoid sending GETDEVINFO after every LAYOUTGET, or</div><div class='add'>+	 * constantly attempting to register the device.  Once marked as</div><div class='add'>+	 * unavailable they must be deleted and never reused.</div><div class='add'>+	 */</div><div class='add'>+	if (test_bit(NFS_DEVICEID_UNAVAILABLE, &amp;node-&gt;flags)) {</div><div class='add'>+		unsigned long end = jiffies;</div><div class='add'>+		unsigned long start = end - PNFS_DEVICE_RETRY_TIMEOUT;</div><div class='add'>+</div><div class='add'>+		if (!time_in_range(node-&gt;timestamp_unavailable, start, end)) {</div><div class='add'>+			/* Uncork subsequent GETDEVINFO operations for this device */</div><div class='add'>+			nfs4_delete_deviceid(node-&gt;ld, node-&gt;nfs_client, id);</div><div class='add'>+			goto retry;</div><div class='add'>+		}</div><div class='add'>+		goto out_put;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	end = jiffies;</div><div class='del'>-	start = end - PNFS_DEVICE_RETRY_TIMEOUT;</div><div class='del'>-	if (!time_in_range(node-&gt;timestamp_unavailable, start, end)) {</div><div class='del'>-		nfs4_delete_deviceid(node-&gt;ld, node-&gt;nfs_client, id);</div><div class='del'>-		goto retry;</div><div class='add'>+	if (!bl_register_dev(container_of(node, struct pnfs_block_dev, node))) {</div><div class='add'>+		/*</div><div class='add'>+		 * If we cannot register, treat this device as transient:</div><div class='add'>+		 * Make a negative cache entry for the device</div><div class='add'>+		 */</div><div class='add'>+		nfs4_mark_deviceid_unavailable(node);</div><div class='add'>+		goto out_put;</div><div class='ctx'> 	}</div><div class='del'>-	return ERR_PTR(-ENODEV);</div><div class='add'>+</div><div class='add'>+	return node;</div><div class='add'>+</div><div class='add'>+out_put:</div><div class='add'>+	nfs4_put_deviceid_node(node);</div><div class='add'>+	return ERR_PTR(err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='hunk'>@@ -673,7 +676,7 @@ bl_alloc_lseg(struct pnfs_layout_hdr *lo, struct nfs4_layoutget_res *lgr,</div><div class='ctx'> 	struct pnfs_layout_segment *lseg;</div><div class='ctx'> 	struct xdr_buf buf;</div><div class='ctx'> 	struct xdr_stream xdr;</div><div class='del'>-	struct page *scratch;</div><div class='add'>+	struct folio *scratch;</div><div class='ctx'> 	int status, i;</div><div class='ctx'> 	uint32_t count;</div><div class='ctx'> 	__be32 *p;</div><div class='hunk'>@@ -686,13 +689,13 @@ bl_alloc_lseg(struct pnfs_layout_hdr *lo, struct nfs4_layoutget_res *lgr,</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='ctx'> 	status = -ENOMEM;</div><div class='del'>-	scratch = alloc_page(gfp_mask);</div><div class='add'>+	scratch = folio_alloc(gfp_mask, 0);</div><div class='ctx'> 	if (!scratch)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	xdr_init_decode_pages(&amp;xdr, &amp;buf,</div><div class='ctx'> 			lgr-&gt;layoutp-&gt;pages, lgr-&gt;layoutp-&gt;len);</div><div class='del'>-	xdr_set_scratch_page(&amp;xdr, scratch);</div><div class='add'>+	xdr_set_scratch_folio(&amp;xdr, scratch);</div><div class='ctx'> </div><div class='ctx'> 	status = -EIO;</div><div class='ctx'> 	p = xdr_inline_decode(&amp;xdr, 4);</div><div class='hunk'>@@ -741,7 +744,7 @@ process_extents:</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> out_free_scratch:</div><div class='del'>-	__free_page(scratch);</div><div class='add'>+	folio_put(scratch);</div><div class='ctx'> out:</div><div class='ctx'> 	dprintk("%s returns %d\n", __func__, status);</div><div class='ctx'> 	switch (status) {</div><div class='hunk'>@@ -912,10 +915,9 @@ bl_pg_init_write(struct nfs_pageio_descriptor *pgio, struct nfs_page *req)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (pgio-&gt;pg_dreq == NULL)</div><div class='del'>-		wb_size = pnfs_num_cont_bytes(pgio-&gt;pg_inode,</div><div class='del'>-					      req-&gt;wb_index);</div><div class='add'>+		wb_size = pnfs_num_cont_bytes(pgio-&gt;pg_inode, req-&gt;wb_index);</div><div class='ctx'> 	else</div><div class='del'>-		wb_size = nfs_dreq_bytes_left(pgio-&gt;pg_dreq);</div><div class='add'>+		wb_size = nfs_dreq_bytes_left(pgio-&gt;pg_dreq, req_offset(req));</div><div class='ctx'> </div><div class='ctx'> 	pnfs_generic_pg_init_write(pgio, req, wb_size);</div><div class='ctx'> </div><div class='head'>diff --git a/fs/nfs/blocklayout/blocklayout.h b/fs/nfs/blocklayout/blocklayout.h<br/>index 716bc75e9ed2..6da40ca19570 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/blocklayout/blocklayout.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/blocklayout/blocklayout.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/blocklayout/blocklayout.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/blocklayout/blocklayout.h</a></div><div class='hunk'>@@ -104,20 +104,26 @@ struct pnfs_block_dev {</div><div class='ctx'> 	u64				start;</div><div class='ctx'> 	u64				len;</div><div class='ctx'> </div><div class='add'>+	enum pnfs_block_volume_type	type;</div><div class='ctx'> 	u32				nr_children;</div><div class='ctx'> 	struct pnfs_block_dev		*children;</div><div class='ctx'> 	u64				chunk_size;</div><div class='ctx'> </div><div class='del'>-	struct block_device		*bdev;</div><div class='add'>+	struct file			*bdev_file;</div><div class='ctx'> 	u64				disk_offset;</div><div class='add'>+	unsigned long			flags;</div><div class='ctx'> </div><div class='ctx'> 	u64				pr_key;</div><div class='del'>-	bool				pr_registered;</div><div class='ctx'> </div><div class='ctx'> 	bool (*map)(struct pnfs_block_dev *dev, u64 offset,</div><div class='ctx'> 			struct pnfs_block_dev_map *map);</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+/* pnfs_block_dev flag bits */</div><div class='add'>+enum {</div><div class='add'>+	PNFS_BDEV_REGISTERED = 0,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> /* sector_t fields are all in 512-byte sectors */</div><div class='ctx'> struct pnfs_block_extent {</div><div class='ctx'> 	union {</div><div class='hunk'>@@ -172,6 +178,7 @@ struct bl_msg_hdr {</div><div class='ctx'> #define BL_DEVICE_REQUEST_ERR          0x2 /* User level process fails */</div><div class='ctx'> </div><div class='ctx'> /* dev.c */</div><div class='add'>+bool bl_register_dev(struct pnfs_block_dev *d);</div><div class='ctx'> struct nfs4_deviceid_node *bl_alloc_deviceid_node(struct nfs_server *server,</div><div class='ctx'> 		struct pnfs_device *pdev, gfp_t gfp_mask);</div><div class='ctx'> void bl_free_deviceid_node(struct nfs4_deviceid_node *d);</div><div class='head'>diff --git a/fs/nfs/blocklayout/dev.c b/fs/nfs/blocklayout/dev.c<br/>index 5e56da748b2a..ab76120705e2 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/blocklayout/dev.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/blocklayout/dev.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/blocklayout/dev.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/blocklayout/dev.c</a></div><div class='hunk'>@@ -10,12 +10,81 @@</div><div class='ctx'> #include &lt;linux/pr.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "blocklayout.h"</div><div class='add'>+#include "../nfs4trace.h"</div><div class='ctx'> </div><div class='ctx'> #define NFSDBG_FACILITY		NFSDBG_PNFS_LD</div><div class='ctx'> </div><div class='add'>+static void bl_unregister_scsi(struct pnfs_block_dev *dev)</div><div class='add'>+{</div><div class='add'>+	struct block_device *bdev = file_bdev(dev-&gt;bdev_file);</div><div class='add'>+	const struct pr_ops *ops = bdev-&gt;bd_disk-&gt;fops-&gt;pr_ops;</div><div class='add'>+	int status;</div><div class='add'>+</div><div class='add'>+	status = ops-&gt;pr_register(bdev, dev-&gt;pr_key, 0, false);</div><div class='add'>+	if (status)</div><div class='add'>+		trace_bl_pr_key_unreg_err(bdev, dev-&gt;pr_key, status);</div><div class='add'>+	else</div><div class='add'>+		trace_bl_pr_key_unreg(bdev, dev-&gt;pr_key);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool bl_register_scsi(struct pnfs_block_dev *dev)</div><div class='add'>+{</div><div class='add'>+	struct block_device *bdev = file_bdev(dev-&gt;bdev_file);</div><div class='add'>+	const struct pr_ops *ops = bdev-&gt;bd_disk-&gt;fops-&gt;pr_ops;</div><div class='add'>+	int status;</div><div class='add'>+</div><div class='add'>+	if (test_and_set_bit(PNFS_BDEV_REGISTERED, &amp;dev-&gt;flags))</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	status = ops-&gt;pr_register(bdev, 0, dev-&gt;pr_key, true);</div><div class='add'>+	if (status) {</div><div class='add'>+		trace_bl_pr_key_reg_err(bdev, dev-&gt;pr_key, status);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+	trace_bl_pr_key_reg(bdev, dev-&gt;pr_key);</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void bl_unregister_dev(struct pnfs_block_dev *dev)</div><div class='add'>+{</div><div class='add'>+	u32 i;</div><div class='add'>+</div><div class='add'>+	if (dev-&gt;nr_children) {</div><div class='add'>+		for (i = 0; i &lt; dev-&gt;nr_children; i++)</div><div class='add'>+			bl_unregister_dev(&amp;dev-&gt;children[i]);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (dev-&gt;type == PNFS_BLOCK_VOLUME_SCSI &amp;&amp;</div><div class='add'>+		test_and_clear_bit(PNFS_BDEV_REGISTERED, &amp;dev-&gt;flags))</div><div class='add'>+		bl_unregister_scsi(dev);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool bl_register_dev(struct pnfs_block_dev *dev)</div><div class='add'>+{</div><div class='add'>+	u32 i;</div><div class='add'>+</div><div class='add'>+	if (dev-&gt;nr_children) {</div><div class='add'>+		for (i = 0; i &lt; dev-&gt;nr_children; i++) {</div><div class='add'>+			if (!bl_register_dev(&amp;dev-&gt;children[i])) {</div><div class='add'>+				while (i &gt; 0)</div><div class='add'>+					bl_unregister_dev(&amp;dev-&gt;children[--i]);</div><div class='add'>+				return false;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+		return true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (dev-&gt;type == PNFS_BLOCK_VOLUME_SCSI)</div><div class='add'>+		return bl_register_scsi(dev);</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void</div><div class='ctx'> bl_free_device(struct pnfs_block_dev *dev)</div><div class='ctx'> {</div><div class='add'>+	bl_unregister_dev(dev);</div><div class='add'>+</div><div class='ctx'> 	if (dev-&gt;nr_children) {</div><div class='ctx'> 		int i;</div><div class='ctx'> </div><div class='hunk'>@@ -23,19 +92,8 @@ bl_free_device(struct pnfs_block_dev *dev)</div><div class='ctx'> 			bl_free_device(&amp;dev-&gt;children[i]);</div><div class='ctx'> 		kfree(dev-&gt;children);</div><div class='ctx'> 	} else {</div><div class='del'>-		if (dev-&gt;pr_registered) {</div><div class='del'>-			const struct pr_ops *ops =</div><div class='del'>-				dev-&gt;bdev-&gt;bd_disk-&gt;fops-&gt;pr_ops;</div><div class='del'>-			int error;</div><div class='del'>-</div><div class='del'>-			error = ops-&gt;pr_register(dev-&gt;bdev, dev-&gt;pr_key, 0,</div><div class='del'>-				false);</div><div class='del'>-			if (error)</div><div class='del'>-				pr_err("failed to unregister PR key.\n");</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		if (dev-&gt;bdev)</div><div class='del'>-			blkdev_put(dev-&gt;bdev, FMODE_READ | FMODE_WRITE);</div><div class='add'>+		if (dev-&gt;bdev_file)</div><div class='add'>+			fput(dev-&gt;bdev_file);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -169,7 +227,7 @@ static bool bl_map_simple(struct pnfs_block_dev *dev, u64 offset,</div><div class='ctx'> 	map-&gt;start = dev-&gt;start;</div><div class='ctx'> 	map-&gt;len = dev-&gt;len;</div><div class='ctx'> 	map-&gt;disk_offset = dev-&gt;disk_offset;</div><div class='del'>-	map-&gt;bdev = dev-&gt;bdev;</div><div class='add'>+	map-&gt;bdev = file_bdev(dev-&gt;bdev_file);</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -199,10 +257,11 @@ static bool bl_map_stripe(struct pnfs_block_dev *dev, u64 offset,</div><div class='ctx'> 	struct pnfs_block_dev *child;</div><div class='ctx'> 	u64 chunk;</div><div class='ctx'> 	u32 chunk_idx;</div><div class='add'>+	u64 disk_chunk;</div><div class='ctx'> 	u64 disk_offset;</div><div class='ctx'> </div><div class='ctx'> 	chunk = div_u64(offset, dev-&gt;chunk_size);</div><div class='del'>-	div_u64_rem(chunk, dev-&gt;nr_children, &amp;chunk_idx);</div><div class='add'>+	disk_chunk = div_u64_rem(chunk, dev-&gt;nr_children, &amp;chunk_idx);</div><div class='ctx'> </div><div class='ctx'> 	if (chunk_idx &gt;= dev-&gt;nr_children) {</div><div class='ctx'> 		dprintk("%s: invalid chunk idx %d (%lld/%lld)\n",</div><div class='hunk'>@@ -215,7 +274,7 @@ static bool bl_map_stripe(struct pnfs_block_dev *dev, u64 offset,</div><div class='ctx'> 	offset = chunk * dev-&gt;chunk_size;</div><div class='ctx'> </div><div class='ctx'> 	/* disk offset of the stripe */</div><div class='del'>-	disk_offset = div_u64(offset, dev-&gt;nr_children);</div><div class='add'>+	disk_offset = disk_chunk * dev-&gt;chunk_size;</div><div class='ctx'> </div><div class='ctx'> 	child = &amp;dev-&gt;children[chunk_idx];</div><div class='ctx'> 	child-&gt;map(child, disk_offset, map);</div><div class='hunk'>@@ -236,27 +295,26 @@ bl_parse_simple(struct nfs_server *server, struct pnfs_block_dev *d,</div><div class='ctx'> 		struct pnfs_block_volume *volumes, int idx, gfp_t gfp_mask)</div><div class='ctx'> {</div><div class='ctx'> 	struct pnfs_block_volume *v = &amp;volumes[idx];</div><div class='del'>-	struct block_device *bdev;</div><div class='add'>+	struct file *bdev_file;</div><div class='ctx'> 	dev_t dev;</div><div class='ctx'> </div><div class='ctx'> 	dev = bl_resolve_deviceid(server, v, gfp_mask);</div><div class='ctx'> 	if (!dev)</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> </div><div class='del'>-	bdev = blkdev_get_by_dev(dev, FMODE_READ | FMODE_WRITE, NULL);</div><div class='del'>-	if (IS_ERR(bdev)) {</div><div class='add'>+	bdev_file = bdev_file_open_by_dev(dev, BLK_OPEN_READ | BLK_OPEN_WRITE,</div><div class='add'>+				       NULL, NULL);</div><div class='add'>+	if (IS_ERR(bdev_file)) {</div><div class='ctx'> 		printk(KERN_WARNING "pNFS: failed to open device %d:%d (%ld)\n",</div><div class='del'>-			MAJOR(dev), MINOR(dev), PTR_ERR(bdev));</div><div class='del'>-		return PTR_ERR(bdev);</div><div class='add'>+			MAJOR(dev), MINOR(dev), PTR_ERR(bdev_file));</div><div class='add'>+		return PTR_ERR(bdev_file);</div><div class='ctx'> 	}</div><div class='del'>-	d-&gt;bdev = bdev;</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-	d-&gt;len = bdev_nr_bytes(d-&gt;bdev);</div><div class='add'>+	d-&gt;bdev_file = bdev_file;</div><div class='add'>+	d-&gt;len = bdev_nr_bytes(file_bdev(bdev_file));</div><div class='ctx'> 	d-&gt;map = bl_map_simple;</div><div class='ctx'> </div><div class='ctx'> 	printk(KERN_INFO "pNFS: using block device %s\n",</div><div class='del'>-		d-&gt;bdev-&gt;bd_disk-&gt;disk_name);</div><div class='add'>+		file_bdev(bdev_file)-&gt;bd_disk-&gt;disk_name);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -301,51 +359,26 @@ bl_validate_designator(struct pnfs_block_volume *v)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Try to open the udev path for the WWN.  At least on Debian the udev</div><div class='del'>- * by-id path will always point to the dm-multipath device if one exists.</div><div class='del'>- */</div><div class='del'>-static struct block_device *</div><div class='del'>-bl_open_udev_path(struct pnfs_block_volume *v)</div><div class='add'>+static struct file *</div><div class='add'>+bl_open_path(struct pnfs_block_volume *v, const char *prefix)</div><div class='ctx'> {</div><div class='del'>-	struct block_device *bdev;</div><div class='add'>+	struct file *bdev_file;</div><div class='ctx'> 	const char *devname;</div><div class='ctx'> </div><div class='del'>-	devname = kasprintf(GFP_KERNEL, "/dev/disk/by-id/wwn-0x%*phN",</div><div class='del'>-				v-&gt;scsi.designator_len, v-&gt;scsi.designator);</div><div class='add'>+	devname = kasprintf(GFP_KERNEL, "/dev/disk/by-id/%s%*phN",</div><div class='add'>+			prefix, v-&gt;scsi.designator_len, v-&gt;scsi.designator);</div><div class='ctx'> 	if (!devname)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='del'>-	bdev = blkdev_get_by_path(devname, FMODE_READ | FMODE_WRITE, NULL);</div><div class='del'>-	if (IS_ERR(bdev)) {</div><div class='del'>-		pr_warn("pNFS: failed to open device %s (%ld)\n",</div><div class='del'>-			devname, PTR_ERR(bdev));</div><div class='add'>+	bdev_file = bdev_file_open_by_path(devname, BLK_OPEN_READ | BLK_OPEN_WRITE,</div><div class='add'>+					NULL, NULL);</div><div class='add'>+	if (IS_ERR(bdev_file)) {</div><div class='add'>+		dprintk("failed to open device %s (%ld)\n",</div><div class='add'>+			devname, PTR_ERR(bdev_file));</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	kfree(devname);</div><div class='del'>-	return bdev;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Try to open the RH/Fedora specific dm-mpath udev path for this WWN, as the</div><div class='del'>- * wwn- links will only point to the first discovered SCSI device there.</div><div class='del'>- */</div><div class='del'>-static struct block_device *</div><div class='del'>-bl_open_dm_mpath_udev_path(struct pnfs_block_volume *v)</div><div class='del'>-{</div><div class='del'>-	struct block_device *bdev;</div><div class='del'>-	const char *devname;</div><div class='del'>-</div><div class='del'>-	devname = kasprintf(GFP_KERNEL,</div><div class='del'>-			"/dev/disk/by-id/dm-uuid-mpath-%d%*phN",</div><div class='del'>-			v-&gt;scsi.designator_type,</div><div class='del'>-			v-&gt;scsi.designator_len, v-&gt;scsi.designator);</div><div class='del'>-	if (!devname)</div><div class='del'>-		return ERR_PTR(-ENOMEM);</div><div class='del'>-</div><div class='del'>-	bdev = blkdev_get_by_path(devname, FMODE_READ | FMODE_WRITE, NULL);</div><div class='del'>-	kfree(devname);</div><div class='del'>-	return bdev;</div><div class='add'>+	return bdev_file;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='hunk'>@@ -355,45 +388,50 @@ bl_parse_scsi(struct nfs_server *server, struct pnfs_block_dev *d,</div><div class='ctx'> 	struct pnfs_block_volume *v = &amp;volumes[idx];</div><div class='ctx'> 	struct block_device *bdev;</div><div class='ctx'> 	const struct pr_ops *ops;</div><div class='add'>+	struct file *bdev_file;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='ctx'> 	if (!bl_validate_designator(v))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	bdev = bl_open_dm_mpath_udev_path(v);</div><div class='del'>-	if (IS_ERR(bdev))</div><div class='del'>-		bdev = bl_open_udev_path(v);</div><div class='del'>-	if (IS_ERR(bdev))</div><div class='del'>-		return PTR_ERR(bdev);</div><div class='del'>-	d-&gt;bdev = bdev;</div><div class='add'>+	/*</div><div class='add'>+	 * Try to open the RH/Fedora specific dm-mpath udev path first, as the</div><div class='add'>+	 * wwn- links will only point to the first discovered SCSI device there.</div><div class='add'>+	 * On other distributions like Debian, the default SCSI by-id path will</div><div class='add'>+	 * point to the dm-multipath device if one exists.</div><div class='add'>+	 */</div><div class='add'>+	bdev_file = bl_open_path(v, "dm-uuid-mpath-0x");</div><div class='add'>+	if (IS_ERR(bdev_file))</div><div class='add'>+		bdev_file = bl_open_path(v, "wwn-0x");</div><div class='add'>+	if (IS_ERR(bdev_file))</div><div class='add'>+		bdev_file = bl_open_path(v, "nvme-eui.");</div><div class='add'>+	if (IS_ERR(bdev_file)) {</div><div class='add'>+		pr_warn("pNFS: no device found for volume %*phN\n",</div><div class='add'>+			v-&gt;scsi.designator_len, v-&gt;scsi.designator);</div><div class='add'>+		return PTR_ERR(bdev_file);</div><div class='add'>+	}</div><div class='add'>+	d-&gt;bdev_file = bdev_file;</div><div class='add'>+	bdev = file_bdev(bdev_file);</div><div class='ctx'> </div><div class='del'>-	d-&gt;len = bdev_nr_bytes(d-&gt;bdev);</div><div class='add'>+	d-&gt;len = bdev_nr_bytes(bdev);</div><div class='ctx'> 	d-&gt;map = bl_map_simple;</div><div class='ctx'> 	d-&gt;pr_key = v-&gt;scsi.pr_key;</div><div class='ctx'> </div><div class='del'>-	pr_info("pNFS: using block device %s (reservation key 0x%llx)\n",</div><div class='del'>-		d-&gt;bdev-&gt;bd_disk-&gt;disk_name, d-&gt;pr_key);</div><div class='add'>+	if (d-&gt;len == 0)</div><div class='add'>+		return -ENODEV;</div><div class='ctx'> </div><div class='del'>-	ops = d-&gt;bdev-&gt;bd_disk-&gt;fops-&gt;pr_ops;</div><div class='add'>+	ops = bdev-&gt;bd_disk-&gt;fops-&gt;pr_ops;</div><div class='ctx'> 	if (!ops) {</div><div class='ctx'> 		pr_err("pNFS: block device %s does not support reservations.",</div><div class='del'>-				d-&gt;bdev-&gt;bd_disk-&gt;disk_name);</div><div class='add'>+				bdev-&gt;bd_disk-&gt;disk_name);</div><div class='ctx'> 		error = -EINVAL;</div><div class='ctx'> 		goto out_blkdev_put;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	error = ops-&gt;pr_register(d-&gt;bdev, 0, d-&gt;pr_key, true);</div><div class='del'>-	if (error) {</div><div class='del'>-		pr_err("pNFS: failed to register key for block device %s.",</div><div class='del'>-				d-&gt;bdev-&gt;bd_disk-&gt;disk_name);</div><div class='del'>-		goto out_blkdev_put;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	d-&gt;pr_registered = true;</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> out_blkdev_put:</div><div class='del'>-	blkdev_put(d-&gt;bdev, FMODE_READ | FMODE_WRITE);</div><div class='add'>+	fput(d-&gt;bdev_file);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -422,7 +460,7 @@ bl_parse_concat(struct nfs_server *server, struct pnfs_block_dev *d,</div><div class='ctx'> 	int ret, i;</div><div class='ctx'> </div><div class='ctx'> 	d-&gt;children = kcalloc(v-&gt;concat.volumes_count,</div><div class='del'>-			sizeof(struct pnfs_block_dev), GFP_KERNEL);</div><div class='add'>+			sizeof(struct pnfs_block_dev), gfp_mask);</div><div class='ctx'> 	if (!d-&gt;children)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='hunk'>@@ -451,7 +489,7 @@ bl_parse_stripe(struct nfs_server *server, struct pnfs_block_dev *d,</div><div class='ctx'> 	int ret, i;</div><div class='ctx'> </div><div class='ctx'> 	d-&gt;children = kcalloc(v-&gt;stripe.volumes_count,</div><div class='del'>-			sizeof(struct pnfs_block_dev), GFP_KERNEL);</div><div class='add'>+			sizeof(struct pnfs_block_dev), gfp_mask);</div><div class='ctx'> 	if (!d-&gt;children)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='hunk'>@@ -475,7 +513,9 @@ static int</div><div class='ctx'> bl_parse_deviceid(struct nfs_server *server, struct pnfs_block_dev *d,</div><div class='ctx'> 		struct pnfs_block_volume *volumes, int idx, gfp_t gfp_mask)</div><div class='ctx'> {</div><div class='del'>-	switch (volumes[idx].type) {</div><div class='add'>+	d-&gt;type = volumes[idx].type;</div><div class='add'>+</div><div class='add'>+	switch (d-&gt;type) {</div><div class='ctx'> 	case PNFS_BLOCK_VOLUME_SIMPLE:</div><div class='ctx'> 		return bl_parse_simple(server, d, volumes, idx, gfp_mask);</div><div class='ctx'> 	case PNFS_BLOCK_VOLUME_SLICE:</div><div class='hunk'>@@ -487,7 +527,7 @@ bl_parse_deviceid(struct nfs_server *server, struct pnfs_block_dev *d,</div><div class='ctx'> 	case PNFS_BLOCK_VOLUME_SCSI:</div><div class='ctx'> 		return bl_parse_scsi(server, d, volumes, idx, gfp_mask);</div><div class='ctx'> 	default:</div><div class='del'>-		dprintk("unsupported volume type: %d\n", volumes[idx].type);</div><div class='add'>+		dprintk("unsupported volume type: %d\n", d-&gt;type);</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -501,16 +541,16 @@ bl_alloc_deviceid_node(struct nfs_server *server, struct pnfs_device *pdev,</div><div class='ctx'> 	struct pnfs_block_dev *top;</div><div class='ctx'> 	struct xdr_stream xdr;</div><div class='ctx'> 	struct xdr_buf buf;</div><div class='del'>-	struct page *scratch;</div><div class='add'>+	struct folio *scratch;</div><div class='ctx'> 	int nr_volumes, ret, i;</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> </div><div class='del'>-	scratch = alloc_page(gfp_mask);</div><div class='add'>+	scratch = folio_alloc(gfp_mask, 0);</div><div class='ctx'> 	if (!scratch)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	xdr_init_decode_pages(&amp;xdr, &amp;buf, pdev-&gt;pages, pdev-&gt;pglen);</div><div class='del'>-	xdr_set_scratch_page(&amp;xdr, scratch);</div><div class='add'>+	xdr_set_scratch_folio(&amp;xdr, scratch);</div><div class='ctx'> </div><div class='ctx'> 	p = xdr_inline_decode(&amp;xdr, sizeof(__be32));</div><div class='ctx'> 	if (!p)</div><div class='hunk'>@@ -542,7 +582,7 @@ bl_alloc_deviceid_node(struct nfs_server *server, struct pnfs_device *pdev,</div><div class='ctx'> out_free_volumes:</div><div class='ctx'> 	kfree(volumes);</div><div class='ctx'> out_free_scratch:</div><div class='del'>-	__free_page(scratch);</div><div class='add'>+	folio_put(scratch);</div><div class='ctx'> out:</div><div class='ctx'> 	return node;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/nfs/blocklayout/extent_tree.c b/fs/nfs/blocklayout/extent_tree.c<br/>index 8f7cff7a4293..315949a7e92d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/blocklayout/extent_tree.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/blocklayout/extent_tree.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/blocklayout/extent_tree.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/blocklayout/extent_tree.c</a></div><div class='hunk'>@@ -6,6 +6,7 @@</div><div class='ctx'> #include &lt;linux/vmalloc.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "blocklayout.h"</div><div class='add'>+#include "../nfs4trace.h"</div><div class='ctx'> </div><div class='ctx'> #define NFSDBG_FACILITY		NFSDBG_PNFS_LD</div><div class='ctx'> </div><div class='hunk'>@@ -520,10 +521,71 @@ static __be32 *encode_scsi_range(struct pnfs_block_extent *be, __be32 *p)</div><div class='ctx'> 	return xdr_encode_hyper(p, be-&gt;be_length &lt;&lt; SECTOR_SHIFT);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int ext_tree_encode_commit(struct pnfs_block_layout *bl, __be32 *p,</div><div class='add'>+/**</div><div class='add'>+ * ext_tree_try_encode_commit - try to encode all extents into the buffer</div><div class='add'>+ * @bl: pointer to the layout</div><div class='add'>+ * @p: pointer to the output buffer</div><div class='add'>+ * @buffer_size: size of the output buffer</div><div class='add'>+ * @count: output pointer to the number of encoded extents</div><div class='add'>+ * @lastbyte: output pointer to the last written byte</div><div class='add'>+ *</div><div class='add'>+ * Return values:</div><div class='add'>+ *   %0: Success, all required extents encoded, outputs are valid</div><div class='add'>+ *   %-ENOSPC: Buffer too small, nothing encoded, outputs are invalid</div><div class='add'>+ */</div><div class='add'>+static int</div><div class='add'>+ext_tree_try_encode_commit(struct pnfs_block_layout *bl, __be32 *p,</div><div class='ctx'> 		size_t buffer_size, size_t *count, __u64 *lastbyte)</div><div class='ctx'> {</div><div class='ctx'> 	struct pnfs_block_extent *be;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;bl-&gt;bl_ext_lock);</div><div class='add'>+	for (be = ext_tree_first(&amp;bl-&gt;bl_ext_rw); be; be = ext_tree_next(be)) {</div><div class='add'>+		if (be-&gt;be_state != PNFS_BLOCK_INVALID_DATA ||</div><div class='add'>+		    be-&gt;be_tag != EXTENT_WRITTEN)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		(*count)++;</div><div class='add'>+		if (ext_tree_layoutupdate_size(bl, *count) &gt; buffer_size) {</div><div class='add'>+			spin_unlock(&amp;bl-&gt;bl_ext_lock);</div><div class='add'>+			return -ENOSPC;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	for (be = ext_tree_first(&amp;bl-&gt;bl_ext_rw); be; be = ext_tree_next(be)) {</div><div class='add'>+		if (be-&gt;be_state != PNFS_BLOCK_INVALID_DATA ||</div><div class='add'>+		    be-&gt;be_tag != EXTENT_WRITTEN)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		if (bl-&gt;bl_scsi_layout)</div><div class='add'>+			p = encode_scsi_range(be, p);</div><div class='add'>+		else</div><div class='add'>+			p = encode_block_extent(be, p);</div><div class='add'>+		be-&gt;be_tag = EXTENT_COMMITTING;</div><div class='add'>+	}</div><div class='add'>+	*lastbyte = (bl-&gt;bl_lwb != 0) ? bl-&gt;bl_lwb - 1 : U64_MAX;</div><div class='add'>+	bl-&gt;bl_lwb = 0;</div><div class='add'>+	spin_unlock(&amp;bl-&gt;bl_ext_lock);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * ext_tree_encode_commit - encode as much as possible extents into the buffer</div><div class='add'>+ * @bl: pointer to the layout</div><div class='add'>+ * @p: pointer to the output buffer</div><div class='add'>+ * @buffer_size: size of the output buffer</div><div class='add'>+ * @count: output pointer to the number of encoded extents</div><div class='add'>+ * @lastbyte: output pointer to the last written byte</div><div class='add'>+ *</div><div class='add'>+ * Return values:</div><div class='add'>+ *   %0: Success, all required extents encoded, outputs are valid</div><div class='add'>+ *   %-ENOSPC: Buffer too small, some extents are encoded, outputs are valid</div><div class='add'>+ */</div><div class='add'>+static int</div><div class='add'>+ext_tree_encode_commit(struct pnfs_block_layout *bl, __be32 *p,</div><div class='add'>+		size_t buffer_size, size_t *count, __u64 *lastbyte)</div><div class='add'>+{</div><div class='add'>+	struct pnfs_block_extent *be, *be_prev;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;bl-&gt;bl_ext_lock);</div><div class='hunk'>@@ -534,9 +596,9 @@ static int ext_tree_encode_commit(struct pnfs_block_layout *bl, __be32 *p,</div><div class='ctx'> </div><div class='ctx'> 		(*count)++;</div><div class='ctx'> 		if (ext_tree_layoutupdate_size(bl, *count) &gt; buffer_size) {</div><div class='del'>-			/* keep counting.. */</div><div class='add'>+			(*count)--;</div><div class='ctx'> 			ret = -ENOSPC;</div><div class='del'>-			continue;</div><div class='add'>+			break;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		if (bl-&gt;bl_scsi_layout)</div><div class='hunk'>@@ -544,14 +606,30 @@ static int ext_tree_encode_commit(struct pnfs_block_layout *bl, __be32 *p,</div><div class='ctx'> 		else</div><div class='ctx'> 			p = encode_block_extent(be, p);</div><div class='ctx'> 		be-&gt;be_tag = EXTENT_COMMITTING;</div><div class='add'>+		be_prev = be;</div><div class='add'>+	}</div><div class='add'>+	if (!ret) {</div><div class='add'>+		*lastbyte = (bl-&gt;bl_lwb != 0) ? bl-&gt;bl_lwb - 1 : U64_MAX;</div><div class='add'>+		bl-&gt;bl_lwb = 0;</div><div class='add'>+	} else {</div><div class='add'>+		*lastbyte = be_prev-&gt;be_f_offset + be_prev-&gt;be_length;</div><div class='add'>+		*lastbyte &lt;&lt;= SECTOR_SHIFT;</div><div class='add'>+		*lastbyte -= 1;</div><div class='ctx'> 	}</div><div class='del'>-	*lastbyte = bl-&gt;bl_lwb - 1;</div><div class='del'>-	bl-&gt;bl_lwb = 0;</div><div class='ctx'> 	spin_unlock(&amp;bl-&gt;bl_ext_lock);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * ext_tree_prepare_commit - encode extents that need to be committed</div><div class='add'>+ * @arg: layout commit data</div><div class='add'>+ *</div><div class='add'>+ * Return values:</div><div class='add'>+ *   %0: Success, all required extents are encoded</div><div class='add'>+ *   %-ENOSPC: Some extents are encoded, but not all, due to RPC size limit</div><div class='add'>+ *   %-ENOMEM: Out of memory, extents not encoded</div><div class='add'>+ */</div><div class='ctx'> int</div><div class='ctx'> ext_tree_prepare_commit(struct nfs4_layoutcommit_args *arg)</div><div class='ctx'> {</div><div class='hunk'>@@ -560,20 +638,18 @@ ext_tree_prepare_commit(struct nfs4_layoutcommit_args *arg)</div><div class='ctx'> 	__be32 *start_p;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	dprintk("%s enter\n", __func__);</div><div class='del'>-</div><div class='ctx'> 	arg-&gt;layoutupdate_page = alloc_page(GFP_NOFS);</div><div class='ctx'> 	if (!arg-&gt;layoutupdate_page)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	start_p = page_address(arg-&gt;layoutupdate_page);</div><div class='ctx'> 	arg-&gt;layoutupdate_pages = &amp;arg-&gt;layoutupdate_page;</div><div class='ctx'> </div><div class='del'>-retry:</div><div class='del'>-	ret = ext_tree_encode_commit(bl, start_p + 1, buffer_size, &amp;count, &amp;arg-&gt;lastbytewritten);</div><div class='add'>+	ret = ext_tree_try_encode_commit(bl, start_p + 1, buffer_size,</div><div class='add'>+			&amp;count, &amp;arg-&gt;lastbytewritten);</div><div class='ctx'> 	if (unlikely(ret)) {</div><div class='ctx'> 		ext_tree_free_commitdata(arg, buffer_size);</div><div class='ctx'> </div><div class='del'>-		buffer_size = ext_tree_layoutupdate_size(bl, count);</div><div class='add'>+		buffer_size = NFS_SERVER(arg-&gt;inode)-&gt;wsize;</div><div class='ctx'> 		count = 0;</div><div class='ctx'> </div><div class='ctx'> 		arg-&gt;layoutupdate_pages =</div><div class='hunk'>@@ -588,7 +664,8 @@ retry:</div><div class='ctx'> 			return -ENOMEM;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		goto retry;</div><div class='add'>+		ret = ext_tree_encode_commit(bl, start_p + 1, buffer_size,</div><div class='add'>+				&amp;count, &amp;arg-&gt;lastbytewritten);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	*start_p = cpu_to_be32(count);</div><div class='hunk'>@@ -607,8 +684,9 @@ retry:</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dprintk("%s found %zu ranges\n", __func__, count);</div><div class='del'>-	return 0;</div><div class='add'>+	trace_bl_ext_tree_prepare_commit(ret, count,</div><div class='add'>+			arg-&gt;lastbytewritten, !!ret);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void</div><div class='head'>diff --git a/fs/nfs/blocklayout/rpc_pipefs.c b/fs/nfs/blocklayout/rpc_pipefs.c<br/>index ef9db135c649..d526f5ba7887 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/blocklayout/rpc_pipefs.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/blocklayout/rpc_pipefs.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/blocklayout/rpc_pipefs.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/blocklayout/rpc_pipefs.c</a></div><div class='hunk'>@@ -27,7 +27,6 @@</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/module.h&gt;</div><div class='del'>-#include &lt;linux/genhd.h&gt;</div><div class='ctx'> #include &lt;linux/blkdev.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "blocklayout.h"</div><div class='hunk'>@@ -76,7 +75,7 @@ bl_resolve_deviceid(struct nfs_server *server, struct pnfs_block_volume *b,</div><div class='ctx'> 	msg-&gt;len = sizeof(*bl_msg) + b-&gt;simple.len;</div><div class='ctx'> 	msg-&gt;data = kzalloc(msg-&gt;len, gfp_mask);</div><div class='ctx'> 	if (!msg-&gt;data)</div><div class='del'>-		goto out_free_data;</div><div class='add'>+		goto out_unlock;</div><div class='ctx'> </div><div class='ctx'> 	bl_msg = msg-&gt;data;</div><div class='ctx'> 	bl_msg-&gt;type = BL_DEVICE_MOUNT;</div><div class='hunk'>@@ -142,24 +141,18 @@ static const struct rpc_pipe_ops bl_upcall_ops = {</div><div class='ctx'> 	.destroy_msg	= bl_pipe_destroy_msg,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static struct dentry *nfs4blocklayout_register_sb(struct super_block *sb,</div><div class='add'>+static int nfs4blocklayout_register_sb(struct super_block *sb,</div><div class='ctx'> 					    struct rpc_pipe *pipe)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *dir, *dentry;</div><div class='add'>+	struct dentry *dir;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='ctx'> 	dir = rpc_d_lookup_sb(sb, NFS_PIPE_DIRNAME);</div><div class='ctx'> 	if (dir == NULL)</div><div class='del'>-		return ERR_PTR(-ENOENT);</div><div class='del'>-	dentry = rpc_mkpipe_dentry(dir, "blocklayout", NULL, pipe);</div><div class='add'>+		return -ENOENT;</div><div class='add'>+	err = rpc_mkpipe_dentry(dir, "blocklayout", NULL, pipe);</div><div class='ctx'> 	dput(dir);</div><div class='del'>-	return dentry;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void nfs4blocklayout_unregister_sb(struct super_block *sb,</div><div class='del'>-					  struct rpc_pipe *pipe)</div><div class='del'>-{</div><div class='del'>-	if (pipe-&gt;dentry)</div><div class='del'>-		rpc_unlink(pipe-&gt;dentry);</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int rpc_pipefs_event(struct notifier_block *nb, unsigned long event,</div><div class='hunk'>@@ -168,7 +161,6 @@ static int rpc_pipefs_event(struct notifier_block *nb, unsigned long event,</div><div class='ctx'> 	struct super_block *sb = ptr;</div><div class='ctx'> 	struct net *net = sb-&gt;s_fs_info;</div><div class='ctx'> 	struct nfs_net *nn = net_generic(net, nfs_net_id);</div><div class='del'>-	struct dentry *dentry;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (!try_module_get(THIS_MODULE))</div><div class='hunk'>@@ -181,16 +173,10 @@ static int rpc_pipefs_event(struct notifier_block *nb, unsigned long event,</div><div class='ctx'> </div><div class='ctx'> 	switch (event) {</div><div class='ctx'> 	case RPC_PIPEFS_MOUNT:</div><div class='del'>-		dentry = nfs4blocklayout_register_sb(sb, nn-&gt;bl_device_pipe);</div><div class='del'>-		if (IS_ERR(dentry)) {</div><div class='del'>-			ret = PTR_ERR(dentry);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		nn-&gt;bl_device_pipe-&gt;dentry = dentry;</div><div class='add'>+		ret = nfs4blocklayout_register_sb(sb, nn-&gt;bl_device_pipe);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case RPC_PIPEFS_UMOUNT:</div><div class='del'>-		if (nn-&gt;bl_device_pipe-&gt;dentry)</div><div class='del'>-			nfs4blocklayout_unregister_sb(sb, nn-&gt;bl_device_pipe);</div><div class='add'>+		rpc_unlink(nn-&gt;bl_device_pipe);</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		ret = -ENOTSUPP;</div><div class='hunk'>@@ -204,18 +190,17 @@ static struct notifier_block nfs4blocklayout_block = {</div><div class='ctx'> 	.notifier_call = rpc_pipefs_event,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static struct dentry *nfs4blocklayout_register_net(struct net *net,</div><div class='del'>-						   struct rpc_pipe *pipe)</div><div class='add'>+static int nfs4blocklayout_register_net(struct net *net, struct rpc_pipe *pipe)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *pipefs_sb;</div><div class='del'>-	struct dentry *dentry;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='ctx'> 	pipefs_sb = rpc_get_sb_net(net);</div><div class='ctx'> 	if (!pipefs_sb)</div><div class='del'>-		return NULL;</div><div class='del'>-	dentry = nfs4blocklayout_register_sb(pipefs_sb, pipe);</div><div class='add'>+		return 0;</div><div class='add'>+	ret = nfs4blocklayout_register_sb(pipefs_sb, pipe);</div><div class='ctx'> 	rpc_put_sb_net(net);</div><div class='del'>-	return dentry;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void nfs4blocklayout_unregister_net(struct net *net,</div><div class='hunk'>@@ -225,7 +210,7 @@ static void nfs4blocklayout_unregister_net(struct net *net,</div><div class='ctx'> </div><div class='ctx'> 	pipefs_sb = rpc_get_sb_net(net);</div><div class='ctx'> 	if (pipefs_sb) {</div><div class='del'>-		nfs4blocklayout_unregister_sb(pipefs_sb, pipe);</div><div class='add'>+		rpc_unlink(pipe);</div><div class='ctx'> 		rpc_put_sb_net(net);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -233,20 +218,17 @@ static void nfs4blocklayout_unregister_net(struct net *net,</div><div class='ctx'> static int nfs4blocklayout_net_init(struct net *net)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_net *nn = net_generic(net, nfs_net_id);</div><div class='del'>-	struct dentry *dentry;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='ctx'> 	mutex_init(&amp;nn-&gt;bl_mutex);</div><div class='ctx'> 	init_waitqueue_head(&amp;nn-&gt;bl_wq);</div><div class='ctx'> 	nn-&gt;bl_device_pipe = rpc_mkpipe_data(&amp;bl_upcall_ops, 0);</div><div class='ctx'> 	if (IS_ERR(nn-&gt;bl_device_pipe))</div><div class='ctx'> 		return PTR_ERR(nn-&gt;bl_device_pipe);</div><div class='del'>-	dentry = nfs4blocklayout_register_net(net, nn-&gt;bl_device_pipe);</div><div class='del'>-	if (IS_ERR(dentry)) {</div><div class='add'>+	err = nfs4blocklayout_register_net(net, nn-&gt;bl_device_pipe);</div><div class='add'>+	if (unlikely(err))</div><div class='ctx'> 		rpc_destroy_pipe_data(nn-&gt;bl_device_pipe);</div><div class='del'>-		return PTR_ERR(dentry);</div><div class='del'>-	}</div><div class='del'>-	nn-&gt;bl_device_pipe-&gt;dentry = dentry;</div><div class='del'>-	return 0;</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void nfs4blocklayout_net_exit(struct net *net)</div><div class='head'>diff --git a/fs/nfs/callback.c b/fs/nfs/callback.c<br/>index 86d856de1389..c8b837006bb2 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/callback.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/callback.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/callback.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/callback.c</a></div><div class='hunk'>@@ -17,7 +17,6 @@</div><div class='ctx'> #include &lt;linux/errno.h&gt;</div><div class='ctx'> #include &lt;linux/mutex.h&gt;</div><div class='ctx'> #include &lt;linux/freezer.h&gt;</div><div class='del'>-#include &lt;linux/kthread.h&gt;</div><div class='ctx'> #include &lt;linux/sunrpc/svcauth_gss.h&gt;</div><div class='ctx'> #include &lt;linux/sunrpc/bc_xprt.h&gt;</div><div class='ctx'> </div><div class='hunk'>@@ -45,18 +44,18 @@ static int nfs4_callback_up_net(struct svc_serv *serv, struct net *net)</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct nfs_net *nn = net_generic(net, nfs_net_id);</div><div class='ctx'> </div><div class='del'>-	ret = svc_create_xprt(serv, "tcp", net, PF_INET,</div><div class='del'>-				nfs_callback_set_tcpport, SVC_SOCK_ANONYMOUS,</div><div class='del'>-				cred);</div><div class='add'>+	ret = svc_xprt_create(serv, "tcp", net, PF_INET,</div><div class='add'>+			      nfs_callback_set_tcpport, SVC_SOCK_ANONYMOUS,</div><div class='add'>+			      cred);</div><div class='ctx'> 	if (ret &lt;= 0)</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> 	nn-&gt;nfs_callback_tcpport = ret;</div><div class='ctx'> 	dprintk("NFS: Callback listener port = %u (af %u, net %x)\n",</div><div class='ctx'> 		nn-&gt;nfs_callback_tcpport, PF_INET, net-&gt;ns.inum);</div><div class='ctx'> </div><div class='del'>-	ret = svc_create_xprt(serv, "tcp", net, PF_INET6,</div><div class='del'>-				nfs_callback_set_tcpport, SVC_SOCK_ANONYMOUS,</div><div class='del'>-				cred);</div><div class='add'>+	ret = svc_xprt_create(serv, "tcp", net, PF_INET6,</div><div class='add'>+			      nfs_callback_set_tcpport, SVC_SOCK_ANONYMOUS,</div><div class='add'>+			      cred);</div><div class='ctx'> 	if (ret &gt; 0) {</div><div class='ctx'> 		nn-&gt;nfs_callback_tcpport6 = ret;</div><div class='ctx'> 		dprintk("NFS: Callback listener port = %u (af %u, net %x)\n",</div><div class='hunk'>@@ -75,72 +74,20 @@ out_err:</div><div class='ctx'> static int</div><div class='ctx'> nfs4_callback_svc(void *vrqstp)</div><div class='ctx'> {</div><div class='del'>-	int err;</div><div class='ctx'> 	struct svc_rqst *rqstp = vrqstp;</div><div class='ctx'> </div><div class='add'>+	svc_thread_init_status(rqstp, 0);</div><div class='add'>+</div><div class='ctx'> 	set_freezable();</div><div class='ctx'> </div><div class='del'>-	while (!kthread_freezable_should_stop(NULL)) {</div><div class='add'>+	while (!svc_thread_should_stop(rqstp))</div><div class='add'>+		svc_recv(rqstp);</div><div class='ctx'> </div><div class='del'>-		if (signal_pending(current))</div><div class='del'>-			flush_signals(current);</div><div class='del'>-		/*</div><div class='del'>-		 * Listen for a request on the socket</div><div class='del'>-		 */</div><div class='del'>-		err = svc_recv(rqstp, MAX_SCHEDULE_TIMEOUT);</div><div class='del'>-		if (err == -EAGAIN || err == -EINTR)</div><div class='del'>-			continue;</div><div class='del'>-		svc_process(rqstp);</div><div class='del'>-	}</div><div class='ctx'> 	svc_exit_thread(rqstp);</div><div class='del'>-	module_put_and_exit(0);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #if defined(CONFIG_NFS_V4_1)</div><div class='del'>-/*</div><div class='del'>- * The callback service for NFSv4.1 callbacks</div><div class='del'>- */</div><div class='del'>-static int</div><div class='del'>-nfs41_callback_svc(void *vrqstp)</div><div class='del'>-{</div><div class='del'>-	struct svc_rqst *rqstp = vrqstp;</div><div class='del'>-	struct svc_serv *serv = rqstp-&gt;rq_server;</div><div class='del'>-	struct rpc_rqst *req;</div><div class='del'>-	int error;</div><div class='del'>-	DEFINE_WAIT(wq);</div><div class='del'>-</div><div class='del'>-	set_freezable();</div><div class='del'>-</div><div class='del'>-	while (!kthread_freezable_should_stop(NULL)) {</div><div class='del'>-</div><div class='del'>-		if (signal_pending(current))</div><div class='del'>-			flush_signals(current);</div><div class='del'>-</div><div class='del'>-		prepare_to_wait(&amp;serv-&gt;sv_cb_waitq, &amp;wq, TASK_INTERRUPTIBLE);</div><div class='del'>-		spin_lock_bh(&amp;serv-&gt;sv_cb_lock);</div><div class='del'>-		if (!list_empty(&amp;serv-&gt;sv_cb_list)) {</div><div class='del'>-			req = list_first_entry(&amp;serv-&gt;sv_cb_list,</div><div class='del'>-					struct rpc_rqst, rq_bc_list);</div><div class='del'>-			list_del(&amp;req-&gt;rq_bc_list);</div><div class='del'>-			spin_unlock_bh(&amp;serv-&gt;sv_cb_lock);</div><div class='del'>-			finish_wait(&amp;serv-&gt;sv_cb_waitq, &amp;wq);</div><div class='del'>-			dprintk("Invoking bc_svc_process()\n");</div><div class='del'>-			error = bc_svc_process(serv, req, rqstp);</div><div class='del'>-			dprintk("bc_svc_process() returned w/ error code= %d\n",</div><div class='del'>-				error);</div><div class='del'>-		} else {</div><div class='del'>-			spin_unlock_bh(&amp;serv-&gt;sv_cb_lock);</div><div class='del'>-			if (!kthread_should_stop())</div><div class='del'>-				schedule();</div><div class='del'>-			finish_wait(&amp;serv-&gt;sv_cb_waitq, &amp;wq);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	svc_exit_thread(rqstp);</div><div class='del'>-	module_put_and_exit(0);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static inline void nfs_callback_bc_serv(u32 minorversion, struct rpc_xprt *xprt,</div><div class='ctx'> 		struct svc_serv *serv)</div><div class='ctx'> {</div><div class='hunk'>@@ -169,12 +116,12 @@ static int nfs_callback_start_svc(int minorversion, struct rpc_xprt *xprt,</div><div class='ctx'> 	if (nrservs &lt; NFS4_MIN_NR_CALLBACK_THREADS)</div><div class='ctx'> 		nrservs = NFS4_MIN_NR_CALLBACK_THREADS;</div><div class='ctx'> </div><div class='del'>-	if (serv-&gt;sv_nrthreads-1 == nrservs)</div><div class='add'>+	if (serv-&gt;sv_nrthreads == nrservs)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	ret = serv-&gt;sv_ops-&gt;svo_setup(serv, NULL, nrservs);</div><div class='add'>+	ret = svc_set_num_threads(serv, NULL, nrservs);</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		serv-&gt;sv_ops-&gt;svo_setup(serv, NULL, 0);</div><div class='add'>+		svc_set_num_threads(serv, NULL, 0);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='ctx'> 	dprintk("nfs_callback_up: service started\n");</div><div class='hunk'>@@ -189,7 +136,7 @@ static void nfs_callback_down_net(u32 minorversion, struct svc_serv *serv, struc</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("NFS: destroy per-net callback data; net=%x\n", net-&gt;ns.inum);</div><div class='del'>-	svc_shutdown_net(serv, net);</div><div class='add'>+	svc_xprt_destroy_all(serv, net, false);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int nfs_callback_up_net(int minorversion, struct svc_serv *serv,</div><div class='hunk'>@@ -206,7 +153,7 @@ static int nfs_callback_up_net(int minorversion, struct svc_serv *serv,</div><div class='ctx'> 	ret = svc_bind(serv, net);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='ctx'> 		printk(KERN_WARNING "NFS: bind callback service failed\n");</div><div class='del'>-		goto err_bind;</div><div class='add'>+		goto err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = 0;</div><div class='hunk'>@@ -219,72 +166,28 @@ static int nfs_callback_up_net(int minorversion, struct svc_serv *serv,</div><div class='ctx'> </div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='ctx'> 		printk(KERN_ERR "NFS: callback service start failed\n");</div><div class='del'>-		goto err_socks;</div><div class='add'>+		goto err;</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='del'>-err_socks:</div><div class='del'>-	svc_rpcb_cleanup(serv, net);</div><div class='del'>-err_bind:</div><div class='add'>+err:</div><div class='ctx'> 	nn-&gt;cb_users[minorversion]--;</div><div class='ctx'> 	dprintk("NFS: Couldn't create callback socket: err = %d; "</div><div class='ctx'> 			"net = %x\n", ret, net-&gt;ns.inum);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static const struct svc_serv_ops nfs40_cb_sv_ops = {</div><div class='del'>-	.svo_function		= nfs4_callback_svc,</div><div class='del'>-	.svo_enqueue_xprt	= svc_xprt_do_enqueue,</div><div class='del'>-	.svo_setup		= svc_set_num_threads_sync,</div><div class='del'>-	.svo_module		= THIS_MODULE,</div><div class='del'>-};</div><div class='del'>-#if defined(CONFIG_NFS_V4_1)</div><div class='del'>-static const struct svc_serv_ops nfs41_cb_sv_ops = {</div><div class='del'>-	.svo_function		= nfs41_callback_svc,</div><div class='del'>-	.svo_enqueue_xprt	= svc_xprt_do_enqueue,</div><div class='del'>-	.svo_setup		= svc_set_num_threads_sync,</div><div class='del'>-	.svo_module		= THIS_MODULE,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static const struct svc_serv_ops *nfs4_cb_sv_ops[] = {</div><div class='del'>-	[0] = &amp;nfs40_cb_sv_ops,</div><div class='del'>-	[1] = &amp;nfs41_cb_sv_ops,</div><div class='del'>-};</div><div class='del'>-#else</div><div class='del'>-static const struct svc_serv_ops *nfs4_cb_sv_ops[] = {</div><div class='del'>-	[0] = &amp;nfs40_cb_sv_ops,</div><div class='del'>-	[1] = NULL,</div><div class='del'>-};</div><div class='del'>-#endif</div><div class='del'>-</div><div class='ctx'> static struct svc_serv *nfs_callback_create_svc(int minorversion)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_callback_data *cb_info = &amp;nfs_callback_info[minorversion];</div><div class='del'>-	const struct svc_serv_ops *sv_ops;</div><div class='add'>+	int (*threadfn)(void *data);</div><div class='ctx'> 	struct svc_serv *serv;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Check whether we're already up and running.</div><div class='ctx'> 	 */</div><div class='del'>-	if (cb_info-&gt;serv) {</div><div class='del'>-		/*</div><div class='del'>-		 * Note: increase service usage, because later in case of error</div><div class='del'>-		 * svc_destroy() will be called.</div><div class='del'>-		 */</div><div class='del'>-		svc_get(cb_info-&gt;serv);</div><div class='add'>+	if (cb_info-&gt;serv)</div><div class='ctx'> 		return cb_info-&gt;serv;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	switch (minorversion) {</div><div class='del'>-	case 0:</div><div class='del'>-		sv_ops = nfs4_cb_sv_ops[0];</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		sv_ops = nfs4_cb_sv_ops[1];</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (sv_ops == NULL)</div><div class='del'>-		return ERR_PTR(-ENOTSUPP);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Sanity check: if there's no task,</div><div class='hunk'>@@ -294,16 +197,18 @@ static struct svc_serv *nfs_callback_create_svc(int minorversion)</div><div class='ctx'> 		printk(KERN_WARNING "nfs_callback_create_svc: no kthread, %d users??\n",</div><div class='ctx'> 			cb_info-&gt;users);</div><div class='ctx'> </div><div class='del'>-	serv = svc_create_pooled(&amp;nfs4_callback_program, NFS4_CALLBACK_BUFSIZE, sv_ops);</div><div class='add'>+	threadfn = nfs4_callback_svc;</div><div class='add'>+#if !defined(CONFIG_NFS_V4_1)</div><div class='add'>+	if (minorversion)</div><div class='add'>+		return ERR_PTR(-ENOTSUPP);</div><div class='add'>+#endif</div><div class='add'>+	serv = svc_create(&amp;nfs4_callback_program, NFS4_CALLBACK_BUFSIZE,</div><div class='add'>+			  threadfn);</div><div class='ctx'> 	if (!serv) {</div><div class='ctx'> 		printk(KERN_ERR "nfs_callback_create_svc: create service failed\n");</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> 	}</div><div class='ctx'> 	cb_info-&gt;serv = serv;</div><div class='del'>-	/* As there is only one thread we need to over-ride the</div><div class='del'>-	 * default maximum of 80 connections</div><div class='del'>-	 */</div><div class='del'>-	serv-&gt;sv_maxconn = 1024;</div><div class='ctx'> 	dprintk("nfs_callback_create_svc: service created\n");</div><div class='ctx'> 	return serv;</div><div class='ctx'> }</div><div class='hunk'>@@ -335,16 +240,11 @@ int nfs_callback_up(u32 minorversion, struct rpc_xprt *xprt)</div><div class='ctx'> 		goto err_start;</div><div class='ctx'> </div><div class='ctx'> 	cb_info-&gt;users++;</div><div class='del'>-	/*</div><div class='del'>-	 * svc_create creates the svc_serv with sv_nrthreads == 1, and then</div><div class='del'>-	 * svc_prepare_thread increments that. So we need to call svc_destroy</div><div class='del'>-	 * on both success and failure so that the refcount is 1 when the</div><div class='del'>-	 * thread exits.</div><div class='del'>-	 */</div><div class='ctx'> err_net:</div><div class='del'>-	if (!cb_info-&gt;users)</div><div class='del'>-		cb_info-&gt;serv = NULL;</div><div class='del'>-	svc_destroy(serv);</div><div class='add'>+	if (!cb_info-&gt;users) {</div><div class='add'>+		svc_set_num_threads(cb_info-&gt;serv, NULL, 0);</div><div class='add'>+		svc_destroy(&amp;cb_info-&gt;serv);</div><div class='add'>+	}</div><div class='ctx'> err_create:</div><div class='ctx'> 	mutex_unlock(&amp;nfs_callback_mutex);</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -368,11 +268,9 @@ void nfs_callback_down(int minorversion, struct net *net)</div><div class='ctx'> 	nfs_callback_down_net(minorversion, serv, net);</div><div class='ctx'> 	cb_info-&gt;users--;</div><div class='ctx'> 	if (cb_info-&gt;users == 0) {</div><div class='del'>-		svc_get(serv);</div><div class='del'>-		serv-&gt;sv_ops-&gt;svo_setup(serv, NULL, 0);</div><div class='del'>-		svc_destroy(serv);</div><div class='add'>+		svc_set_num_threads(serv, NULL, 0);</div><div class='ctx'> 		dprintk("nfs_callback_down: service destroyed\n");</div><div class='del'>-		cb_info-&gt;serv = NULL;</div><div class='add'>+		svc_destroy(&amp;cb_info-&gt;serv);</div><div class='ctx'> 	}</div><div class='ctx'> 	mutex_unlock(&amp;nfs_callback_mutex);</div><div class='ctx'> }</div><div class='hunk'>@@ -427,7 +325,7 @@ check_gss_callback_principal(struct nfs_client *clp, struct svc_rqst *rqstp)</div><div class='ctx'>  * All other checking done after NFS decoding where the nfs_client can be</div><div class='ctx'>  * found in nfs4_callback_compound</div><div class='ctx'>  */</div><div class='del'>-static int nfs_callback_authenticate(struct svc_rqst *rqstp)</div><div class='add'>+static enum svc_auth_status nfs_callback_authenticate(struct svc_rqst *rqstp)</div><div class='ctx'> {</div><div class='ctx'> 	rqstp-&gt;rq_auth_stat = rpc_autherr_badcred;</div><div class='ctx'> </div><div class='hunk'>@@ -454,15 +352,12 @@ static const struct svc_version *nfs4_callback_version[] = {</div><div class='ctx'> 	[4] = &amp;nfs4_callback_version4,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static struct svc_stat nfs4_callback_stats;</div><div class='del'>-</div><div class='ctx'> static struct svc_program nfs4_callback_program = {</div><div class='ctx'> 	.pg_prog = NFS4_CALLBACK,			/* RPC service number */</div><div class='ctx'> 	.pg_nvers = ARRAY_SIZE(nfs4_callback_version),	/* Number of entries */</div><div class='ctx'> 	.pg_vers = nfs4_callback_version,		/* version table */</div><div class='ctx'> 	.pg_name = "NFSv4 callback",			/* service name */</div><div class='ctx'> 	.pg_class = "nfs",				/* authentication class */</div><div class='del'>-	.pg_stats = &amp;nfs4_callback_stats,</div><div class='ctx'> 	.pg_authenticate = nfs_callback_authenticate,</div><div class='ctx'> 	.pg_init_request = svc_generic_init_request,</div><div class='ctx'> 	.pg_rpcbind_set	= svc_generic_rpcbind_set,</div><div class='head'>diff --git a/fs/nfs/callback.h b/fs/nfs/callback.h<br/>index 6a2033131c06..154a6ed1299f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/callback.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/callback.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/callback.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/callback.h</a></div><div class='hunk'>@@ -19,32 +19,14 @@ enum nfs4_callback_procnum {</div><div class='ctx'> 	CB_COMPOUND = 1,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-enum nfs4_callback_opnum {</div><div class='del'>-	OP_CB_GETATTR = 3,</div><div class='del'>-	OP_CB_RECALL  = 4,</div><div class='del'>-/* Callback operations new to NFSv4.1 */</div><div class='del'>-	OP_CB_LAYOUTRECALL  = 5,</div><div class='del'>-	OP_CB_NOTIFY        = 6,</div><div class='del'>-	OP_CB_PUSH_DELEG    = 7,</div><div class='del'>-	OP_CB_RECALL_ANY    = 8,</div><div class='del'>-	OP_CB_RECALLABLE_OBJ_AVAIL = 9,</div><div class='del'>-	OP_CB_RECALL_SLOT   = 10,</div><div class='del'>-	OP_CB_SEQUENCE      = 11,</div><div class='del'>-	OP_CB_WANTS_CANCELLED = 12,</div><div class='del'>-	OP_CB_NOTIFY_LOCK   = 13,</div><div class='del'>-	OP_CB_NOTIFY_DEVICEID = 14,</div><div class='del'>-/* Callback operations new to NFSv4.2 */</div><div class='del'>-	OP_CB_OFFLOAD = 15,</div><div class='del'>-	OP_CB_ILLEGAL = 10044,</div><div class='del'>-};</div><div class='del'>-</div><div class='ctx'> struct nfs4_slot;</div><div class='ctx'> struct cb_process_state {</div><div class='del'>-	__be32			drc_status;</div><div class='ctx'> 	struct nfs_client	*clp;</div><div class='ctx'> 	struct nfs4_slot	*slot;</div><div class='del'>-	u32			minorversion;</div><div class='ctx'> 	struct net		*net;</div><div class='add'>+	u32			minorversion;</div><div class='add'>+	__be32			drc_status;</div><div class='add'>+	unsigned int		referring_calls;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct cb_compound_hdr_arg {</div><div class='hunk'>@@ -64,14 +46,15 @@ struct cb_compound_hdr_res {</div><div class='ctx'> </div><div class='ctx'> struct cb_getattrargs {</div><div class='ctx'> 	struct nfs_fh fh;</div><div class='del'>-	uint32_t bitmap[2];</div><div class='add'>+	uint32_t bitmap[3];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct cb_getattrres {</div><div class='ctx'> 	__be32 status;</div><div class='del'>-	uint32_t bitmap[2];</div><div class='add'>+	uint32_t bitmap[3];</div><div class='ctx'> 	uint64_t size;</div><div class='ctx'> 	uint64_t change_attr;</div><div class='add'>+	struct timespec64 atime;</div><div class='ctx'> 	struct timespec64 ctime;</div><div class='ctx'> 	struct timespec64 mtime;</div><div class='ctx'> };</div><div class='hunk'>@@ -170,7 +153,7 @@ struct cb_devicenotifyitem {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct cb_devicenotifyargs {</div><div class='del'>-	int				 ndevs;</div><div class='add'>+	uint32_t			 ndevs;</div><div class='ctx'> 	struct cb_devicenotifyitem	 *devs;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='head'>diff --git a/fs/nfs/callback_proc.c b/fs/nfs/callback_proc.c<br/>index 09c5b1cb3e07..8397c43358bd 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/callback_proc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/callback_proc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/callback_proc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/callback_proc.c</a></div><div class='hunk'>@@ -37,7 +37,7 @@ __be32 nfs4_callback_getattr(void *argp, void *resp,</div><div class='ctx'> 	if (!cps-&gt;clp) /* Always set for v4.0. Set in cb_sequence for v4.1 */</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	res-&gt;bitmap[0] = res-&gt;bitmap[1] = 0;</div><div class='add'>+	memset(res-&gt;bitmap, 0, sizeof(res-&gt;bitmap));</div><div class='ctx'> 	res-&gt;status = htonl(NFS4ERR_BADHANDLE);</div><div class='ctx'> </div><div class='ctx'> 	dprintk_rcu("NFS: GETATTR callback request from %s\n",</div><div class='hunk'>@@ -59,12 +59,16 @@ __be32 nfs4_callback_getattr(void *argp, void *resp,</div><div class='ctx'> 	res-&gt;change_attr = delegation-&gt;change_attr;</div><div class='ctx'> 	if (nfs_have_writebacks(inode))</div><div class='ctx'> 		res-&gt;change_attr++;</div><div class='del'>-	res-&gt;ctime = inode-&gt;i_ctime;</div><div class='del'>-	res-&gt;mtime = inode-&gt;i_mtime;</div><div class='del'>-	res-&gt;bitmap[0] = (FATTR4_WORD0_CHANGE|FATTR4_WORD0_SIZE) &amp;</div><div class='del'>-		args-&gt;bitmap[0];</div><div class='del'>-	res-&gt;bitmap[1] = (FATTR4_WORD1_TIME_METADATA|FATTR4_WORD1_TIME_MODIFY) &amp;</div><div class='del'>-		args-&gt;bitmap[1];</div><div class='add'>+	res-&gt;atime = inode_get_atime(inode);</div><div class='add'>+	res-&gt;ctime = inode_get_ctime(inode);</div><div class='add'>+	res-&gt;mtime = inode_get_mtime(inode);</div><div class='add'>+	res-&gt;bitmap[0] = (FATTR4_WORD0_CHANGE | FATTR4_WORD0_SIZE) &amp;</div><div class='add'>+			 args-&gt;bitmap[0];</div><div class='add'>+	res-&gt;bitmap[1] = (FATTR4_WORD1_TIME_ACCESS |</div><div class='add'>+			  FATTR4_WORD1_TIME_METADATA |</div><div class='add'>+			  FATTR4_WORD1_TIME_MODIFY) &amp; args-&gt;bitmap[1];</div><div class='add'>+	res-&gt;bitmap[2] = (FATTR4_WORD2_TIME_DELEG_ACCESS |</div><div class='add'>+			  FATTR4_WORD2_TIME_DELEG_MODIFY) &amp; args-&gt;bitmap[2];</div><div class='ctx'> 	res-&gt;status = 0;</div><div class='ctx'> out_iput:</div><div class='ctx'> 	rcu_read_unlock();</div><div class='hunk'>@@ -207,7 +211,8 @@ static struct inode *nfs_layout_find_inode(struct nfs_client *clp,</div><div class='ctx'>  * Enforce RFC5661 section 12.5.5.2.1. (Layout Recall and Return Sequencing)</div><div class='ctx'>  */</div><div class='ctx'> static u32 pnfs_check_callback_stateid(struct pnfs_layout_hdr *lo,</div><div class='del'>-					const nfs4_stateid *new)</div><div class='add'>+					const nfs4_stateid *new,</div><div class='add'>+					struct cb_process_state *cps)</div><div class='ctx'> {</div><div class='ctx'> 	u32 oldseq, newseq;</div><div class='ctx'> </div><div class='hunk'>@@ -221,28 +226,29 @@ static u32 pnfs_check_callback_stateid(struct pnfs_layout_hdr *lo,</div><div class='ctx'> </div><div class='ctx'> 	newseq = be32_to_cpu(new-&gt;seqid);</div><div class='ctx'> 	/* Are we already in a layout recall situation? */</div><div class='del'>-	if (test_bit(NFS_LAYOUT_RETURN_REQUESTED, &amp;lo-&gt;plh_flags) &amp;&amp;</div><div class='del'>-	    lo-&gt;plh_return_seq != 0) {</div><div class='del'>-		if (newseq &lt; lo-&gt;plh_return_seq)</div><div class='del'>-			return NFS4ERR_OLD_STATEID;</div><div class='del'>-		if (newseq &gt; lo-&gt;plh_return_seq)</div><div class='del'>-			return NFS4ERR_DELAY;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	if (test_bit(NFS_LAYOUT_RETURN, &amp;lo-&gt;plh_flags))</div><div class='add'>+		return NFS4ERR_DELAY;</div><div class='ctx'> </div><div class='del'>-	/* Check that the stateid matches what we think it should be. */</div><div class='add'>+	/*</div><div class='add'>+	 * Check that the stateid matches what we think it should be.</div><div class='add'>+	 * Note that if the server sent us a list of referring calls,</div><div class='add'>+	 * and we know that those have completed, then we trust the</div><div class='add'>+	 * stateid argument is correct.</div><div class='add'>+	 */</div><div class='ctx'> 	oldseq = be32_to_cpu(lo-&gt;plh_stateid.seqid);</div><div class='del'>-	if (newseq &gt; oldseq + 1)</div><div class='add'>+	if (newseq &gt; oldseq + 1 &amp;&amp; !cps-&gt;referring_calls)</div><div class='ctx'> 		return NFS4ERR_DELAY;</div><div class='add'>+</div><div class='ctx'> 	/* Crazy server! */</div><div class='ctx'> 	if (newseq &lt;= oldseq)</div><div class='ctx'> 		return NFS4ERR_OLD_STATEID;</div><div class='del'>-out:</div><div class='add'>+</div><div class='ctx'> 	return NFS_OK;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static u32 initiate_file_draining(struct nfs_client *clp,</div><div class='del'>-				  struct cb_layoutrecallargs *args)</div><div class='add'>+				  struct cb_layoutrecallargs *args,</div><div class='add'>+				  struct cb_process_state *cps)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *ino;</div><div class='ctx'> 	struct pnfs_layout_hdr *lo;</div><div class='hunk'>@@ -266,7 +272,7 @@ static u32 initiate_file_draining(struct nfs_client *clp,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	pnfs_get_layout_hdr(lo);</div><div class='del'>-	rv = pnfs_check_callback_stateid(lo, &amp;args-&gt;cbl_stateid);</div><div class='add'>+	rv = pnfs_check_callback_stateid(lo, &amp;args-&gt;cbl_stateid, cps);</div><div class='ctx'> 	if (rv != NFS_OK)</div><div class='ctx'> 		goto unlock;</div><div class='ctx'> </div><div class='hunk'>@@ -288,6 +294,7 @@ static u32 initiate_file_draining(struct nfs_client *clp,</div><div class='ctx'> 		rv = NFS4_OK;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case -ENOENT:</div><div class='add'>+		set_bit(NFS_LAYOUT_DRAIN, &amp;lo-&gt;plh_flags);</div><div class='ctx'> 		/* Embrace your forgetfulness! */</div><div class='ctx'> 		rv = NFS4ERR_NOMATCHING_LAYOUT;</div><div class='ctx'> </div><div class='hunk'>@@ -316,19 +323,21 @@ static u32 initiate_bulk_draining(struct nfs_client *clp,</div><div class='ctx'> 	int stat;</div><div class='ctx'> </div><div class='ctx'> 	if (args-&gt;cbl_recall_type == RETURN_FSID)</div><div class='del'>-		stat = pnfs_destroy_layouts_byfsid(clp, &amp;args-&gt;cbl_fsid, true);</div><div class='add'>+		stat = pnfs_layout_destroy_byfsid(clp, &amp;args-&gt;cbl_fsid,</div><div class='add'>+						  PNFS_LAYOUT_BULK_RETURN);</div><div class='ctx'> 	else</div><div class='del'>-		stat = pnfs_destroy_layouts_byclid(clp, true);</div><div class='add'>+		stat = pnfs_layout_destroy_byclid(clp, PNFS_LAYOUT_BULK_RETURN);</div><div class='ctx'> 	if (stat != 0)</div><div class='ctx'> 		return NFS4ERR_DELAY;</div><div class='ctx'> 	return NFS4ERR_NOMATCHING_LAYOUT;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static u32 do_callback_layoutrecall(struct nfs_client *clp,</div><div class='del'>-				    struct cb_layoutrecallargs *args)</div><div class='add'>+				    struct cb_layoutrecallargs *args,</div><div class='add'>+				    struct cb_process_state *cps)</div><div class='ctx'> {</div><div class='ctx'> 	if (args-&gt;cbl_recall_type == RETURN_FILE)</div><div class='del'>-		return initiate_file_draining(clp, args);</div><div class='add'>+		return initiate_file_draining(clp, args, cps);</div><div class='ctx'> 	return initiate_bulk_draining(clp, args);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -339,11 +348,12 @@ __be32 nfs4_callback_layoutrecall(void *argp, void *resp,</div><div class='ctx'> 	u32 res = NFS4ERR_OP_NOT_IN_SESSION;</div><div class='ctx'> </div><div class='ctx'> 	if (cps-&gt;clp)</div><div class='del'>-		res = do_callback_layoutrecall(cps-&gt;clp, args);</div><div class='add'>+		res = do_callback_layoutrecall(cps-&gt;clp, args, cps);</div><div class='ctx'> 	return cpu_to_be32(res);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void pnfs_recall_all_layouts(struct nfs_client *clp)</div><div class='add'>+static void pnfs_recall_all_layouts(struct nfs_client *clp,</div><div class='add'>+				    struct cb_process_state *cps)</div><div class='ctx'> {</div><div class='ctx'> 	struct cb_layoutrecallargs args;</div><div class='ctx'> </div><div class='hunk'>@@ -351,19 +361,18 @@ static void pnfs_recall_all_layouts(struct nfs_client *clp)</div><div class='ctx'> 	memset(&amp;args, 0, sizeof(args));</div><div class='ctx'> 	args.cbl_recall_type = RETURN_ALL;</div><div class='ctx'> 	/* FIXME we ignore errors, what should we do? */</div><div class='del'>-	do_callback_layoutrecall(clp, &amp;args);</div><div class='add'>+	do_callback_layoutrecall(clp, &amp;args, cps);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> __be32 nfs4_callback_devicenotify(void *argp, void *resp,</div><div class='ctx'> 				  struct cb_process_state *cps)</div><div class='ctx'> {</div><div class='ctx'> 	struct cb_devicenotifyargs *args = argp;</div><div class='del'>-	int i;</div><div class='add'>+	const struct pnfs_layoutdriver_type *ld = NULL;</div><div class='add'>+	uint32_t i;</div><div class='ctx'> 	__be32 res = 0;</div><div class='del'>-	struct nfs_client *clp = cps-&gt;clp;</div><div class='del'>-	struct nfs_server *server = NULL;</div><div class='ctx'> </div><div class='del'>-	if (!clp) {</div><div class='add'>+	if (!cps-&gt;clp) {</div><div class='ctx'> 		res = cpu_to_be32(NFS4ERR_OP_NOT_IN_SESSION);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -371,23 +380,15 @@ __be32 nfs4_callback_devicenotify(void *argp, void *resp,</div><div class='ctx'> 	for (i = 0; i &lt; args-&gt;ndevs; i++) {</div><div class='ctx'> 		struct cb_devicenotifyitem *dev = &amp;args-&gt;devs[i];</div><div class='ctx'> </div><div class='del'>-		if (!server ||</div><div class='del'>-		    server-&gt;pnfs_curr_ld-&gt;id != dev-&gt;cbd_layout_type) {</div><div class='del'>-			rcu_read_lock();</div><div class='del'>-			list_for_each_entry_rcu(server, &amp;clp-&gt;cl_superblocks, client_link)</div><div class='del'>-				if (server-&gt;pnfs_curr_ld &amp;&amp;</div><div class='del'>-				    server-&gt;pnfs_curr_ld-&gt;id == dev-&gt;cbd_layout_type) {</div><div class='del'>-					rcu_read_unlock();</div><div class='del'>-					goto found;</div><div class='del'>-				}</div><div class='del'>-			rcu_read_unlock();</div><div class='del'>-			continue;</div><div class='add'>+		if (!ld || ld-&gt;id != dev-&gt;cbd_layout_type) {</div><div class='add'>+			pnfs_put_layoutdriver(ld);</div><div class='add'>+			ld = pnfs_find_layoutdriver(dev-&gt;cbd_layout_type);</div><div class='add'>+			if (!ld)</div><div class='add'>+				continue;</div><div class='ctx'> 		}</div><div class='del'>-</div><div class='del'>-	found:</div><div class='del'>-		nfs4_delete_deviceid(server-&gt;pnfs_curr_ld, clp, &amp;dev-&gt;cbd_dev_id);</div><div class='add'>+		nfs4_delete_deviceid(ld, cps-&gt;clp, &amp;dev-&gt;cbd_dev_id);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='add'>+	pnfs_put_layoutdriver(ld);</div><div class='ctx'> out:</div><div class='ctx'> 	kfree(args-&gt;devs);</div><div class='ctx'> 	return res;</div><div class='hunk'>@@ -458,6 +459,7 @@ static int referring_call_exists(struct nfs_client *clp,</div><div class='ctx'> 	__acquires(lock)</div><div class='ctx'> {</div><div class='ctx'> 	int status = 0;</div><div class='add'>+	int found = 0;</div><div class='ctx'> 	int i, j;</div><div class='ctx'> 	struct nfs4_session *session;</div><div class='ctx'> 	struct nfs4_slot_table *tbl;</div><div class='hunk'>@@ -486,11 +488,12 @@ static int referring_call_exists(struct nfs_client *clp,</div><div class='ctx'> 			spin_lock(lock);</div><div class='ctx'> 			if (status)</div><div class='ctx'> 				goto out;</div><div class='add'>+			found++;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	return status;</div><div class='add'>+	return status &lt; 0 ? status : found;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> __be32 nfs4_callback_sequence(void *argp, void *resp,</div><div class='hunk'>@@ -501,6 +504,7 @@ __be32 nfs4_callback_sequence(void *argp, void *resp,</div><div class='ctx'> 	struct nfs4_slot_table *tbl;</div><div class='ctx'> 	struct nfs4_slot *slot;</div><div class='ctx'> 	struct nfs_client *clp;</div><div class='add'>+	int ret;</div><div class='ctx'> 	int i;</div><div class='ctx'> 	__be32 status = htonl(NFS4ERR_BADSESSION);</div><div class='ctx'> </div><div class='hunk'>@@ -560,11 +564,13 @@ __be32 nfs4_callback_sequence(void *argp, void *resp,</div><div class='ctx'> 	 * related callback was received before the response to the original</div><div class='ctx'> 	 * call.</div><div class='ctx'> 	 */</div><div class='del'>-	if (referring_call_exists(clp, args-&gt;csa_nrclists, args-&gt;csa_rclists,</div><div class='del'>-				&amp;tbl-&gt;slot_tbl_lock) &lt; 0) {</div><div class='add'>+	ret = referring_call_exists(clp, args-&gt;csa_nrclists, args-&gt;csa_rclists,</div><div class='add'>+				    &amp;tbl-&gt;slot_tbl_lock);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='ctx'> 		status = htonl(NFS4ERR_DELAY);</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	}</div><div class='add'>+	cps-&gt;referring_calls = ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * RFC5661 20.9.3</div><div class='hunk'>@@ -625,7 +631,7 @@ __be32 nfs4_callback_recallany(void *argp, void *resp,</div><div class='ctx'> 		nfs_expire_unused_delegation_types(cps-&gt;clp, flags);</div><div class='ctx'> </div><div class='ctx'> 	if (args-&gt;craa_type_mask &amp; BIT(RCA4_TYPE_MASK_FILE_LAYOUT))</div><div class='del'>-		pnfs_recall_all_layouts(cps-&gt;clp);</div><div class='add'>+		pnfs_recall_all_layouts(cps-&gt;clp, cps);</div><div class='ctx'> </div><div class='ctx'> 	if (args-&gt;craa_type_mask &amp; BIT(PNFS_FF_RCA4_TYPE_MASK_READ)) {</div><div class='ctx'> 		set_bit(NFS4CLNT_RECALL_ANY_LAYOUT_READ, &amp;cps-&gt;clp-&gt;cl_state);</div><div class='hunk'>@@ -710,9 +716,9 @@ __be32 nfs4_callback_offload(void *data, void *dummy,</div><div class='ctx'> 	struct nfs4_copy_state *copy, *tmp_copy;</div><div class='ctx'> 	bool found = false;</div><div class='ctx'> </div><div class='del'>-	copy = kzalloc(sizeof(struct nfs4_copy_state), GFP_NOFS);</div><div class='add'>+	copy = kzalloc(sizeof(struct nfs4_copy_state), GFP_KERNEL);</div><div class='ctx'> 	if (!copy)</div><div class='del'>-		return htonl(NFS4ERR_SERVERFAULT);</div><div class='add'>+		return cpu_to_be32(NFS4ERR_DELAY);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;cps-&gt;clp-&gt;cl_lock);</div><div class='ctx'> 	rcu_read_lock();</div><div class='head'>diff --git a/fs/nfs/callback_xdr.c b/fs/nfs/callback_xdr.c<br/>index a67c41ec545f..4254ba3ee7c5 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/callback_xdr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/callback_xdr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/callback_xdr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/callback_xdr.c</a></div><div class='hunk'>@@ -25,8 +25,9 @@</div><div class='ctx'> #define CB_OP_GETATTR_BITMAP_MAXSZ	(4 * 4) // bitmap length, 3 bitmaps</div><div class='ctx'> #define CB_OP_GETATTR_RES_MAXSZ		(CB_OP_HDR_RES_MAXSZ + \</div><div class='ctx'> 					 CB_OP_GETATTR_BITMAP_MAXSZ + \</div><div class='del'>-					 /* change, size, ctime, mtime */\</div><div class='del'>-					 (2 + 2 + 3 + 3) * 4)</div><div class='add'>+					 /* change, size, atime, ctime,</div><div class='add'>+					  * mtime, deleg_atime, deleg_mtime */\</div><div class='add'>+					 (2 + 2 + 3 + 3 + 3 + 3 + 3) * 4)</div><div class='ctx'> #define CB_OP_RECALL_RES_MAXSZ		(CB_OP_HDR_RES_MAXSZ)</div><div class='ctx'> </div><div class='ctx'> #if defined(CONFIG_NFS_V4_1)</div><div class='hunk'>@@ -117,7 +118,9 @@ static __be32 decode_bitmap(struct xdr_stream *xdr, uint32_t *bitmap)</div><div class='ctx'> 	if (likely(attrlen &gt; 0))</div><div class='ctx'> 		bitmap[0] = ntohl(*p++);</div><div class='ctx'> 	if (attrlen &gt; 1)</div><div class='del'>-		bitmap[1] = ntohl(*p);</div><div class='add'>+		bitmap[1] = ntohl(*p++);</div><div class='add'>+	if (attrlen &gt; 2)</div><div class='add'>+		bitmap[2] = ntohl(*p);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -258,11 +261,9 @@ __be32 decode_devicenotify_args(struct svc_rqst *rqstp,</div><div class='ctx'> 				void *argp)</div><div class='ctx'> {</div><div class='ctx'> 	struct cb_devicenotifyargs *args = argp;</div><div class='add'>+	uint32_t tmp, n, i;</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> 	__be32 status = 0;</div><div class='del'>-	u32 tmp;</div><div class='del'>-	int n, i;</div><div class='del'>-	args-&gt;ndevs = 0;</div><div class='ctx'> </div><div class='ctx'> 	/* Num of device notifications */</div><div class='ctx'> 	p = xdr_inline_decode(xdr, sizeof(uint32_t));</div><div class='hunk'>@@ -271,12 +272,8 @@ __be32 decode_devicenotify_args(struct svc_rqst *rqstp,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	n = ntohl(*p++);</div><div class='del'>-	if (n &lt;= 0)</div><div class='del'>-		goto out;</div><div class='del'>-	if (n &gt; ULONG_MAX / sizeof(*args-&gt;devs)) {</div><div class='del'>-		status = htonl(NFS4ERR_BADXDR);</div><div class='add'>+	if (n == 0)</div><div class='ctx'> 		goto out;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	args-&gt;devs = kmalloc_array(n, sizeof(*args-&gt;devs), GFP_KERNEL);</div><div class='ctx'> 	if (!args-&gt;devs) {</div><div class='hunk'>@@ -330,19 +327,21 @@ __be32 decode_devicenotify_args(struct svc_rqst *rqstp,</div><div class='ctx'> 			dev-&gt;cbd_immediate = 0;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		args-&gt;ndevs++;</div><div class='del'>-</div><div class='ctx'> 		dprintk("%s: type %d layout 0x%x immediate %d\n",</div><div class='ctx'> 			__func__, dev-&gt;cbd_notify_type, dev-&gt;cbd_layout_type,</div><div class='ctx'> 			dev-&gt;cbd_immediate);</div><div class='ctx'> 	}</div><div class='add'>+	args-&gt;ndevs = n;</div><div class='add'>+	dprintk("%s: ndevs %d\n", __func__, args-&gt;ndevs);</div><div class='add'>+	return 0;</div><div class='add'>+err:</div><div class='add'>+	kfree(args-&gt;devs);</div><div class='ctx'> out:</div><div class='add'>+	args-&gt;devs = NULL;</div><div class='add'>+	args-&gt;ndevs = 0;</div><div class='ctx'> 	dprintk("%s: status %d ndevs %d\n",</div><div class='ctx'> 		__func__, ntohl(status), args-&gt;ndevs);</div><div class='ctx'> 	return status;</div><div class='del'>-err:</div><div class='del'>-	kfree(args-&gt;devs);</div><div class='del'>-	goto out;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32 decode_sessionid(struct xdr_stream *xdr,</div><div class='hunk'>@@ -376,6 +375,8 @@ static __be32 decode_rc_list(struct xdr_stream *xdr,</div><div class='ctx'> </div><div class='ctx'> 	rc_list-&gt;rcl_nrefcalls = ntohl(*p++);</div><div class='ctx'> 	if (rc_list-&gt;rcl_nrefcalls) {</div><div class='add'>+		if (unlikely(rc_list-&gt;rcl_nrefcalls &gt; xdr-&gt;buf-&gt;len))</div><div class='add'>+			goto out;</div><div class='ctx'> 		p = xdr_inline_decode(xdr,</div><div class='ctx'> 			     rc_list-&gt;rcl_nrefcalls * 2 * sizeof(uint32_t));</div><div class='ctx'> 		if (unlikely(p == NULL))</div><div class='hunk'>@@ -449,7 +450,7 @@ static __be32 decode_recallany_args(struct svc_rqst *rqstp,</div><div class='ctx'> 				      void *argp)</div><div class='ctx'> {</div><div class='ctx'> 	struct cb_recallanyargs *args = argp;</div><div class='del'>-	uint32_t bitmap[2];</div><div class='add'>+	uint32_t bitmap[3];</div><div class='ctx'> 	__be32 *p, status;</div><div class='ctx'> </div><div class='ctx'> 	p = xdr_inline_decode(xdr, 4);</div><div class='hunk'>@@ -639,6 +640,13 @@ static __be32 encode_attr_time(struct xdr_stream *xdr, const struct timespec64 *</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static __be32 encode_attr_atime(struct xdr_stream *xdr, const uint32_t *bitmap, const struct timespec64 *time)</div><div class='add'>+{</div><div class='add'>+	if (!(bitmap[1] &amp; FATTR4_WORD1_TIME_ACCESS))</div><div class='add'>+		return 0;</div><div class='add'>+	return encode_attr_time(xdr,time);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static __be32 encode_attr_ctime(struct xdr_stream *xdr, const uint32_t *bitmap, const struct timespec64 *time)</div><div class='ctx'> {</div><div class='ctx'> 	if (!(bitmap[1] &amp; FATTR4_WORD1_TIME_METADATA))</div><div class='hunk'>@@ -653,6 +661,24 @@ static __be32 encode_attr_mtime(struct xdr_stream *xdr, const uint32_t *bitmap,</div><div class='ctx'> 	return encode_attr_time(xdr,time);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static __be32 encode_attr_delegatime(struct xdr_stream *xdr,</div><div class='add'>+				     const uint32_t *bitmap,</div><div class='add'>+				     const struct timespec64 *time)</div><div class='add'>+{</div><div class='add'>+	if (!(bitmap[2] &amp; FATTR4_WORD2_TIME_DELEG_ACCESS))</div><div class='add'>+		return 0;</div><div class='add'>+	return encode_attr_time(xdr,time);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 encode_attr_delegmtime(struct xdr_stream *xdr,</div><div class='add'>+				     const uint32_t *bitmap,</div><div class='add'>+				     const struct timespec64 *time)</div><div class='add'>+{</div><div class='add'>+	if (!(bitmap[2] &amp; FATTR4_WORD2_TIME_DELEG_MODIFY))</div><div class='add'>+		return 0;</div><div class='add'>+	return encode_attr_time(xdr,time);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static __be32 encode_compound_hdr_res(struct xdr_stream *xdr, struct cb_compound_hdr_res *hdr)</div><div class='ctx'> {</div><div class='ctx'> 	__be32 status;</div><div class='hunk'>@@ -703,10 +729,19 @@ static __be32 encode_getattr_res(struct svc_rqst *rqstp, struct xdr_stream *xdr,</div><div class='ctx'> 	status = encode_attr_size(xdr, res-&gt;bitmap, res-&gt;size);</div><div class='ctx'> 	if (unlikely(status != 0))</div><div class='ctx'> 		goto out;</div><div class='add'>+	status = encode_attr_atime(xdr, res-&gt;bitmap, &amp;res-&gt;atime);</div><div class='add'>+	if (unlikely(status != 0))</div><div class='add'>+		goto out;</div><div class='ctx'> 	status = encode_attr_ctime(xdr, res-&gt;bitmap, &amp;res-&gt;ctime);</div><div class='ctx'> 	if (unlikely(status != 0))</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	status = encode_attr_mtime(xdr, res-&gt;bitmap, &amp;res-&gt;mtime);</div><div class='add'>+	if (unlikely(status != 0))</div><div class='add'>+		goto out;</div><div class='add'>+	status = encode_attr_delegatime(xdr, res-&gt;bitmap, &amp;res-&gt;atime);</div><div class='add'>+	if (unlikely(status != 0))</div><div class='add'>+		goto out;</div><div class='add'>+	status = encode_attr_delegmtime(xdr, res-&gt;bitmap, &amp;res-&gt;mtime);</div><div class='ctx'> 	*savep = htonl((unsigned int)((char *)xdr-&gt;p - (char *)(savep+1)));</div><div class='ctx'> out:</div><div class='ctx'> 	return status;</div><div class='hunk'>@@ -949,6 +984,7 @@ static __be32 nfs4_callback_compound(struct svc_rqst *rqstp)</div><div class='ctx'> 			nfs_put_client(cps.clp);</div><div class='ctx'> 			goto out_invalidcred;</div><div class='ctx'> 		}</div><div class='add'>+		svc_xprt_set_valid(rqstp-&gt;rq_xprt);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	cps.minorversion = hdr_arg.minorversion;</div><div class='hunk'>@@ -971,6 +1007,11 @@ static __be32 nfs4_callback_compound(struct svc_rqst *rqstp)</div><div class='ctx'> 		nops--;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (svc_is_backchannel(rqstp) &amp;&amp; cps.clp) {</div><div class='add'>+		rqstp-&gt;bc_to_initval = cps.clp-&gt;cl_rpcclient-&gt;cl_timeout-&gt;to_initval;</div><div class='add'>+		rqstp-&gt;bc_to_retries = cps.clp-&gt;cl_rpcclient-&gt;cl_timeout-&gt;to_retries;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	*hdr_res.status = status;</div><div class='ctx'> 	*hdr_res.nops = htonl(nops);</div><div class='ctx'> 	nfs4_cb_free_slot(&amp;cps);</div><div class='hunk'>@@ -984,14 +1025,11 @@ out_invalidcred:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-nfs_callback_dispatch(struct svc_rqst *rqstp, __be32 *statp)</div><div class='add'>+nfs_callback_dispatch(struct svc_rqst *rqstp)</div><div class='ctx'> {</div><div class='ctx'> 	const struct svc_procedure *procp = rqstp-&gt;rq_procinfo;</div><div class='ctx'> </div><div class='del'>-	svcxdr_init_decode(rqstp);</div><div class='del'>-	svcxdr_init_encode(rqstp);</div><div class='del'>-</div><div class='del'>-	*statp = procp-&gt;pc_func(rqstp);</div><div class='add'>+	*rqstp-&gt;rq_accept_statp = procp-&gt;pc_func(rqstp);</div><div class='ctx'> 	return 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1069,13 +1107,15 @@ static const struct svc_procedure nfs4_callback_procedures1[] = {</div><div class='ctx'> 		.pc_func = nfs4_callback_compound,</div><div class='ctx'> 		.pc_encode = nfs4_encode_void,</div><div class='ctx'> 		.pc_argsize = 256,</div><div class='add'>+		.pc_argzero = 256,</div><div class='ctx'> 		.pc_ressize = 256,</div><div class='ctx'> 		.pc_xdrressize = NFS4_CALLBACK_BUFSIZE,</div><div class='ctx'> 		.pc_name = "COMPOUND",</div><div class='ctx'> 	}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static unsigned int nfs4_callback_count1[ARRAY_SIZE(nfs4_callback_procedures1)];</div><div class='add'>+static DEFINE_PER_CPU_ALIGNED(unsigned long,</div><div class='add'>+			      nfs4_callback_count1[ARRAY_SIZE(nfs4_callback_procedures1)]);</div><div class='ctx'> const struct svc_version nfs4_callback_version1 = {</div><div class='ctx'> 	.vs_vers = 1,</div><div class='ctx'> 	.vs_nproc = ARRAY_SIZE(nfs4_callback_procedures1),</div><div class='hunk'>@@ -1087,7 +1127,8 @@ const struct svc_version nfs4_callback_version1 = {</div><div class='ctx'> 	.vs_need_cong_ctrl = true,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static unsigned int nfs4_callback_count4[ARRAY_SIZE(nfs4_callback_procedures1)];</div><div class='add'>+static DEFINE_PER_CPU_ALIGNED(unsigned long,</div><div class='add'>+			      nfs4_callback_count4[ARRAY_SIZE(nfs4_callback_procedures1)]);</div><div class='ctx'> const struct svc_version nfs4_callback_version4 = {</div><div class='ctx'> 	.vs_vers = 4,</div><div class='ctx'> 	.vs_nproc = ARRAY_SIZE(nfs4_callback_procedures1),</div><div class='head'>diff --git a/fs/nfs/client.c b/fs/nfs/client.c<br/>index 1e4dc1ab9312..54699299d5b1 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/client.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/client.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/client.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/client.c</a></div><div class='hunk'>@@ -38,7 +38,7 @@</div><div class='ctx'> #include &lt;linux/sunrpc/bc_xprt.h&gt;</div><div class='ctx'> #include &lt;linux/nsproxy.h&gt;</div><div class='ctx'> #include &lt;linux/pid_namespace.h&gt;</div><div class='del'>-</div><div class='add'>+#include &lt;linux/nfslocalio.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "nfs4_fs.h"</div><div class='ctx'> #include "callback.h"</div><div class='hunk'>@@ -55,9 +55,13 @@</div><div class='ctx'> #define NFSDBG_FACILITY		NFSDBG_CLIENT</div><div class='ctx'> </div><div class='ctx'> static DECLARE_WAIT_QUEUE_HEAD(nfs_client_active_wq);</div><div class='del'>-static DEFINE_SPINLOCK(nfs_version_lock);</div><div class='del'>-static DEFINE_MUTEX(nfs_version_mutex);</div><div class='del'>-static LIST_HEAD(nfs_versions);</div><div class='add'>+static DEFINE_RWLOCK(nfs_version_lock);</div><div class='add'>+</div><div class='add'>+static struct nfs_subversion *nfs_version_mods[5] = {</div><div class='add'>+	[2] = NULL,</div><div class='add'>+	[3] = NULL,</div><div class='add'>+	[4] = NULL,</div><div class='add'>+};</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * RPC cruft for NFS</div><div class='hunk'>@@ -73,46 +77,41 @@ const struct rpc_program nfs_program = {</div><div class='ctx'> 	.number			= NFS_PROGRAM,</div><div class='ctx'> 	.nrvers			= ARRAY_SIZE(nfs_version),</div><div class='ctx'> 	.version		= nfs_version,</div><div class='del'>-	.stats			= &amp;nfs_rpcstat,</div><div class='ctx'> 	.pipe_dir_name		= NFS_PIPE_DIRNAME,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-struct rpc_stat nfs_rpcstat = {</div><div class='del'>-	.program		= &amp;nfs_program</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static struct nfs_subversion *find_nfs_version(unsigned int version)</div><div class='add'>+static struct nfs_subversion *__find_nfs_version(unsigned int version)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_subversion *nfs;</div><div class='del'>-	spin_lock(&amp;nfs_version_lock);</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry(nfs, &amp;nfs_versions, list) {</div><div class='del'>-		if (nfs-&gt;rpc_ops-&gt;version == version) {</div><div class='del'>-			spin_unlock(&amp;nfs_version_lock);</div><div class='del'>-			return nfs;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	spin_unlock(&amp;nfs_version_lock);</div><div class='del'>-	return ERR_PTR(-EPROTONOSUPPORT);</div><div class='add'>+	read_lock(&amp;nfs_version_lock);</div><div class='add'>+	nfs = nfs_version_mods[version];</div><div class='add'>+	read_unlock(&amp;nfs_version_lock);</div><div class='add'>+	return nfs;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct nfs_subversion *get_nfs_version(unsigned int version)</div><div class='add'>+struct nfs_subversion *find_nfs_version(unsigned int version)</div><div class='ctx'> {</div><div class='del'>-	struct nfs_subversion *nfs = find_nfs_version(version);</div><div class='add'>+	struct nfs_subversion *nfs = __find_nfs_version(version);</div><div class='ctx'> </div><div class='del'>-	if (IS_ERR(nfs)) {</div><div class='del'>-		mutex_lock(&amp;nfs_version_mutex);</div><div class='del'>-		request_module("nfsv%d", version);</div><div class='del'>-		nfs = find_nfs_version(version);</div><div class='del'>-		mutex_unlock(&amp;nfs_version_mutex);</div><div class='del'>-	}</div><div class='add'>+	if (!nfs &amp;&amp; request_module("nfsv%d", version) == 0)</div><div class='add'>+		nfs = __find_nfs_version(version);</div><div class='ctx'> </div><div class='del'>-	if (!IS_ERR(nfs) &amp;&amp; !try_module_get(nfs-&gt;owner))</div><div class='add'>+	if (!nfs)</div><div class='add'>+		return ERR_PTR(-EPROTONOSUPPORT);</div><div class='add'>+</div><div class='add'>+	if (!get_nfs_version(nfs))</div><div class='ctx'> 		return ERR_PTR(-EAGAIN);</div><div class='add'>+</div><div class='ctx'> 	return nfs;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+int get_nfs_version(struct nfs_subversion *nfs)</div><div class='add'>+{</div><div class='add'>+	return try_module_get(nfs-&gt;owner);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(get_nfs_version);</div><div class='add'>+</div><div class='ctx'> void put_nfs_version(struct nfs_subversion *nfs)</div><div class='ctx'> {</div><div class='ctx'> 	module_put(nfs-&gt;owner);</div><div class='hunk'>@@ -120,23 +119,23 @@ void put_nfs_version(struct nfs_subversion *nfs)</div><div class='ctx'> </div><div class='ctx'> void register_nfs_version(struct nfs_subversion *nfs)</div><div class='ctx'> {</div><div class='del'>-	spin_lock(&amp;nfs_version_lock);</div><div class='add'>+	write_lock(&amp;nfs_version_lock);</div><div class='ctx'> </div><div class='del'>-	list_add(&amp;nfs-&gt;list, &amp;nfs_versions);</div><div class='add'>+	nfs_version_mods[nfs-&gt;rpc_ops-&gt;version] = nfs;</div><div class='ctx'> 	nfs_version[nfs-&gt;rpc_ops-&gt;version] = nfs-&gt;rpc_vers;</div><div class='ctx'> </div><div class='del'>-	spin_unlock(&amp;nfs_version_lock);</div><div class='add'>+	write_unlock(&amp;nfs_version_lock);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(register_nfs_version);</div><div class='ctx'> </div><div class='ctx'> void unregister_nfs_version(struct nfs_subversion *nfs)</div><div class='ctx'> {</div><div class='del'>-	spin_lock(&amp;nfs_version_lock);</div><div class='add'>+	write_lock(&amp;nfs_version_lock);</div><div class='ctx'> </div><div class='ctx'> 	nfs_version[nfs-&gt;rpc_ops-&gt;version] = NULL;</div><div class='del'>-	list_del(&amp;nfs-&gt;list);</div><div class='add'>+	nfs_version_mods[nfs-&gt;rpc_ops-&gt;version] = NULL;</div><div class='ctx'> </div><div class='del'>-	spin_unlock(&amp;nfs_version_lock);</div><div class='add'>+	write_unlock(&amp;nfs_version_lock);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(unregister_nfs_version);</div><div class='ctx'> </div><div class='hunk'>@@ -156,7 +155,7 @@ struct nfs_client *nfs_alloc_client(const struct nfs_client_initdata *cl_init)</div><div class='ctx'> </div><div class='ctx'> 	clp-&gt;cl_minorversion = cl_init-&gt;minorversion;</div><div class='ctx'> 	clp-&gt;cl_nfs_mod = cl_init-&gt;nfs_mod;</div><div class='del'>-	if (!try_module_get(clp-&gt;cl_nfs_mod-&gt;owner))</div><div class='add'>+	if (!get_nfs_version(clp-&gt;cl_nfs_mod))</div><div class='ctx'> 		goto error_dealloc;</div><div class='ctx'> </div><div class='ctx'> 	clp-&gt;rpc_ops = clp-&gt;cl_nfs_mod-&gt;rpc_ops;</div><div class='hunk'>@@ -177,14 +176,21 @@ struct nfs_client *nfs_alloc_client(const struct nfs_client_initdata *cl_init)</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;clp-&gt;cl_superblocks);</div><div class='ctx'> 	clp-&gt;cl_rpcclient = ERR_PTR(-EINVAL);</div><div class='ctx'> </div><div class='add'>+	clp-&gt;cl_flags = cl_init-&gt;init_flags;</div><div class='ctx'> 	clp-&gt;cl_proto = cl_init-&gt;proto;</div><div class='ctx'> 	clp-&gt;cl_nconnect = cl_init-&gt;nconnect;</div><div class='ctx'> 	clp-&gt;cl_max_connect = cl_init-&gt;max_connect ? cl_init-&gt;max_connect : 1;</div><div class='del'>-	clp-&gt;cl_net = get_net(cl_init-&gt;net);</div><div class='add'>+	clp-&gt;cl_net = get_net_track(cl_init-&gt;net, &amp;clp-&gt;cl_ns_tracker, GFP_KERNEL);</div><div class='ctx'> </div><div class='del'>-	clp-&gt;cl_principal = "*";</div><div class='del'>-	nfs_fscache_get_client_cookie(clp);</div><div class='add'>+#if IS_ENABLED(CONFIG_NFS_LOCALIO)</div><div class='add'>+	seqlock_init(&amp;clp-&gt;cl_boot_lock);</div><div class='add'>+	ktime_get_real_ts64(&amp;clp-&gt;cl_nfssvc_boot);</div><div class='add'>+	nfs_uuid_init(&amp;clp-&gt;cl_uuid);</div><div class='add'>+	INIT_WORK(&amp;clp-&gt;cl_local_probe_work, nfs_local_probe_async_work);</div><div class='add'>+#endif /* CONFIG_NFS_LOCALIO */</div><div class='ctx'> </div><div class='add'>+	clp-&gt;cl_principal = "*";</div><div class='add'>+	clp-&gt;cl_xprtsec = cl_init-&gt;xprtsec;</div><div class='ctx'> 	return clp;</div><div class='ctx'> </div><div class='ctx'> error_cleanup:</div><div class='hunk'>@@ -238,17 +244,17 @@ static void pnfs_init_server(struct nfs_server *server)</div><div class='ctx'>  */</div><div class='ctx'> void nfs_free_client(struct nfs_client *clp)</div><div class='ctx'> {</div><div class='del'>-	nfs_fscache_release_client_cookie(clp);</div><div class='add'>+	nfs_localio_disable_client(clp);</div><div class='ctx'> </div><div class='ctx'> 	/* -EIO all pending I/O */</div><div class='ctx'> 	if (!IS_ERR(clp-&gt;cl_rpcclient))</div><div class='ctx'> 		rpc_shutdown_client(clp-&gt;cl_rpcclient);</div><div class='ctx'> </div><div class='del'>-	put_net(clp-&gt;cl_net);</div><div class='add'>+	put_net_track(clp-&gt;cl_net, &amp;clp-&gt;cl_ns_tracker);</div><div class='ctx'> 	put_nfs_version(clp-&gt;cl_nfs_mod);</div><div class='ctx'> 	kfree(clp-&gt;cl_hostname);</div><div class='ctx'> 	kfree(clp-&gt;cl_acceptor);</div><div class='del'>-	kfree(clp);</div><div class='add'>+	kfree_rcu(clp, rcu);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_free_client);</div><div class='ctx'> </div><div class='hunk'>@@ -283,7 +289,7 @@ EXPORT_SYMBOL_GPL(nfs_put_client);</div><div class='ctx'> static struct nfs_client *nfs_match_client(const struct nfs_client_initdata *data)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_client *clp;</div><div class='del'>-	const struct sockaddr *sap = data-&gt;addr;</div><div class='add'>+	const struct sockaddr *sap = (struct sockaddr *)data-&gt;addr;</div><div class='ctx'> 	struct nfs_net *nn = net_generic(data-&gt;net, nfs_net_id);</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='hunk'>@@ -329,6 +335,18 @@ again:</div><div class='ctx'> 							   sap))</div><div class='ctx'> 				continue;</div><div class='ctx'> </div><div class='add'>+		/* Match the xprt security policy */</div><div class='add'>+		if (clp-&gt;cl_xprtsec.policy != data-&gt;xprtsec.policy)</div><div class='add'>+			continue;</div><div class='add'>+		if (clp-&gt;cl_xprtsec.policy == RPC_XPRTSEC_TLS_X509) {</div><div class='add'>+			if (clp-&gt;cl_xprtsec.cert_serial !=</div><div class='add'>+			    data-&gt;xprtsec.cert_serial)</div><div class='add'>+				continue;</div><div class='add'>+			if (clp-&gt;cl_xprtsec.privkey_serial !=</div><div class='add'>+			    data-&gt;xprtsec.privkey_serial)</div><div class='add'>+				continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		refcount_inc(&amp;clp-&gt;cl_count);</div><div class='ctx'> 		return clp;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -427,8 +445,10 @@ struct nfs_client *nfs_get_client(const struct nfs_client_initdata *cl_init)</div><div class='ctx'> 			list_add_tail(&amp;new-&gt;cl_share_link,</div><div class='ctx'> 					&amp;nn-&gt;nfs_client_list);</div><div class='ctx'> 			spin_unlock(&amp;nn-&gt;nfs_client_lock);</div><div class='del'>-			new-&gt;cl_flags = cl_init-&gt;init_flags;</div><div class='del'>-			return rpc_ops-&gt;init_client(new, cl_init);</div><div class='add'>+			new = rpc_ops-&gt;init_client(new, cl_init);</div><div class='add'>+			if (!IS_ERR(new))</div><div class='add'>+				 nfs_local_probe_async(new);</div><div class='add'>+			return new;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		spin_unlock(&amp;nn-&gt;nfs_client_lock);</div><div class='hunk'>@@ -462,6 +482,7 @@ void nfs_init_timeout_values(struct rpc_timeout *to, int proto,</div><div class='ctx'> </div><div class='ctx'> 	switch (proto) {</div><div class='ctx'> 	case XPRT_TRANSPORT_TCP:</div><div class='add'>+	case XPRT_TRANSPORT_TCP_TLS:</div><div class='ctx'> 	case XPRT_TRANSPORT_RDMA:</div><div class='ctx'> 		if (retrans == NFS_UNSPEC_RETRANS)</div><div class='ctx'> 			to-&gt;to_retries = NFS_DEF_TCP_RETRANS;</div><div class='hunk'>@@ -500,6 +521,7 @@ int nfs_create_rpc_client(struct nfs_client *clp,</div><div class='ctx'> 			  const struct nfs_client_initdata *cl_init,</div><div class='ctx'> 			  rpc_authflavor_t flavor)</div><div class='ctx'> {</div><div class='add'>+	struct nfs_net		*nn = net_generic(clp-&gt;cl_net, nfs_net_id);</div><div class='ctx'> 	struct rpc_clnt		*clnt = NULL;</div><div class='ctx'> 	struct rpc_create_args args = {</div><div class='ctx'> 		.net		= clp-&gt;cl_net,</div><div class='hunk'>@@ -511,9 +533,13 @@ int nfs_create_rpc_client(struct nfs_client *clp,</div><div class='ctx'> 		.servername	= clp-&gt;cl_hostname,</div><div class='ctx'> 		.nodename	= cl_init-&gt;nodename,</div><div class='ctx'> 		.program	= &amp;nfs_program,</div><div class='add'>+		.stats		= &amp;nn-&gt;rpcstats,</div><div class='ctx'> 		.version	= clp-&gt;rpc_ops-&gt;version,</div><div class='ctx'> 		.authflavor	= flavor,</div><div class='ctx'> 		.cred		= cl_init-&gt;cred,</div><div class='add'>+		.xprtsec	= cl_init-&gt;xprtsec,</div><div class='add'>+		.connect_timeout = cl_init-&gt;connect_timeout,</div><div class='add'>+		.reconnect_timeout = cl_init-&gt;reconnect_timeout,</div><div class='ctx'> 	};</div><div class='ctx'> </div><div class='ctx'> 	if (test_bit(NFS_CS_DISCRTRY, &amp;clp-&gt;cl_flags))</div><div class='hunk'>@@ -528,6 +554,8 @@ int nfs_create_rpc_client(struct nfs_client *clp,</div><div class='ctx'> 		args.flags |= RPC_CLNT_CREATE_NOPING;</div><div class='ctx'> 	if (test_bit(NFS_CS_REUSEPORT, &amp;clp-&gt;cl_flags))</div><div class='ctx'> 		args.flags |= RPC_CLNT_CREATE_REUSEPORT;</div><div class='add'>+	if (test_bit(NFS_CS_NETUNREACH_FATAL, &amp;clp-&gt;cl_flags))</div><div class='add'>+		args.flags |= RPC_CLNT_CREATE_NETUNREACH_FATAL;</div><div class='ctx'> </div><div class='ctx'> 	if (!IS_ERR(clp-&gt;cl_rpcclient))</div><div class='ctx'> 		return 0;</div><div class='hunk'>@@ -596,6 +624,7 @@ static int nfs_start_lockd(struct nfs_server *server)</div><div class='ctx'> </div><div class='ctx'> 	server-&gt;nlm_host = host;</div><div class='ctx'> 	server-&gt;destroy = nfs_destroy_server;</div><div class='add'>+	nfs_sysfs_link_rpc_client(server, nlmclnt_rpc_clnt(host), NULL);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -625,6 +654,7 @@ int nfs_init_server_rpcclient(struct nfs_server *server,</div><div class='ctx'> 	if (server-&gt;flags &amp; NFS_MOUNT_SOFT)</div><div class='ctx'> 		server-&gt;client-&gt;cl_softrtry = 1;</div><div class='ctx'> </div><div class='add'>+	nfs_sysfs_link_rpc_client(server, server-&gt;client, NULL);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_init_server_rpcclient);</div><div class='hunk'>@@ -660,6 +690,44 @@ struct nfs_client *nfs_init_client(struct nfs_client *clp,</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_init_client);</div><div class='ctx'> </div><div class='add'>+static void nfs4_server_set_init_caps(struct nfs_server *server)</div><div class='add'>+{</div><div class='add'>+#if IS_ENABLED(CONFIG_NFS_V4)</div><div class='add'>+	/* Set the basic capabilities */</div><div class='add'>+	server-&gt;caps = server-&gt;nfs_client-&gt;cl_mvops-&gt;init_caps;</div><div class='add'>+	if (server-&gt;flags &amp; NFS_MOUNT_NORDIRPLUS)</div><div class='add'>+		server-&gt;caps &amp;= ~NFS_CAP_READDIRPLUS;</div><div class='add'>+	if (server-&gt;nfs_client-&gt;cl_proto == XPRT_TRANSPORT_RDMA)</div><div class='add'>+		server-&gt;caps &amp;= ~NFS_CAP_READ_PLUS;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Don't use NFS uid/gid mapping if we're using AUTH_SYS or lower</div><div class='add'>+	 * authentication.</div><div class='add'>+	 */</div><div class='add'>+	if (nfs4_disable_idmapping &amp;&amp;</div><div class='add'>+	    server-&gt;client-&gt;cl_auth-&gt;au_flavor == RPC_AUTH_UNIX)</div><div class='add'>+		server-&gt;caps |= NFS_CAP_UIDGID_NOMAP;</div><div class='add'>+#endif</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void nfs_server_set_init_caps(struct nfs_server *server)</div><div class='add'>+{</div><div class='add'>+	switch (server-&gt;nfs_client-&gt;rpc_ops-&gt;version) {</div><div class='add'>+	case 2:</div><div class='add'>+		server-&gt;caps = NFS_CAP_HARDLINKS | NFS_CAP_SYMLINKS;</div><div class='add'>+		break;</div><div class='add'>+	case 3:</div><div class='add'>+		server-&gt;caps = NFS_CAP_HARDLINKS | NFS_CAP_SYMLINKS;</div><div class='add'>+		if (!(server-&gt;flags &amp; NFS_MOUNT_NORDIRPLUS))</div><div class='add'>+			server-&gt;caps |= NFS_CAP_READDIRPLUS;</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		nfs4_server_set_init_caps(server);</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(nfs_server_set_init_caps);</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Create a version 2 or 3 client</div><div class='ctx'>  */</div><div class='hunk'>@@ -670,7 +738,7 @@ static int nfs_init_server(struct nfs_server *server,</div><div class='ctx'> 	struct rpc_timeout timeparms;</div><div class='ctx'> 	struct nfs_client_initdata cl_init = {</div><div class='ctx'> 		.hostname = ctx-&gt;nfs_server.hostname,</div><div class='del'>-		.addr = (const struct sockaddr *)&amp;ctx-&gt;nfs_server.address,</div><div class='add'>+		.addr = &amp;ctx-&gt;nfs_server._address,</div><div class='ctx'> 		.addrlen = ctx-&gt;nfs_server.addrlen,</div><div class='ctx'> 		.nfs_mod = ctx-&gt;nfs_mod,</div><div class='ctx'> 		.proto = ctx-&gt;nfs_server.protocol,</div><div class='hunk'>@@ -679,6 +747,7 @@ static int nfs_init_server(struct nfs_server *server,</div><div class='ctx'> 		.cred = server-&gt;cred,</div><div class='ctx'> 		.nconnect = ctx-&gt;nfs_server.nconnect,</div><div class='ctx'> 		.init_flags = (1UL &lt;&lt; NFS_CS_REUSEPORT),</div><div class='add'>+		.xprtsec = ctx-&gt;xprtsec,</div><div class='ctx'> 	};</div><div class='ctx'> 	struct nfs_client *clp;</div><div class='ctx'> 	int error;</div><div class='hunk'>@@ -688,17 +757,21 @@ static int nfs_init_server(struct nfs_server *server,</div><div class='ctx'> 	if (ctx-&gt;flags &amp; NFS_MOUNT_NORESVPORT)</div><div class='ctx'> 		set_bit(NFS_CS_NORESVPORT, &amp;cl_init.init_flags);</div><div class='ctx'> </div><div class='add'>+	if (ctx-&gt;flags &amp; NFS_MOUNT_NETUNREACH_FATAL)</div><div class='add'>+		__set_bit(NFS_CS_NETUNREACH_FATAL, &amp;cl_init.init_flags);</div><div class='add'>+</div><div class='ctx'> 	/* Allocate or find a client reference we can use */</div><div class='ctx'> 	clp = nfs_get_client(&amp;cl_init);</div><div class='ctx'> 	if (IS_ERR(clp))</div><div class='ctx'> 		return PTR_ERR(clp);</div><div class='ctx'> </div><div class='ctx'> 	server-&gt;nfs_client = clp;</div><div class='add'>+	nfs_sysfs_add_server(server);</div><div class='add'>+	nfs_sysfs_link_rpc_client(server, clp-&gt;cl_rpcclient, "_state");</div><div class='ctx'> </div><div class='ctx'> 	/* Initialise the client representation from the mount data */</div><div class='ctx'> 	server-&gt;flags = ctx-&gt;flags;</div><div class='ctx'> 	server-&gt;options = ctx-&gt;options;</div><div class='del'>-	server-&gt;caps |= NFS_CAP_HARDLINKS | NFS_CAP_SYMLINKS;</div><div class='ctx'> </div><div class='ctx'> 	switch (clp-&gt;rpc_ops-&gt;version) {</div><div class='ctx'> 	case 2:</div><div class='hunk'>@@ -712,9 +785,9 @@ static int nfs_init_server(struct nfs_server *server,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (ctx-&gt;rsize)</div><div class='del'>-		server-&gt;rsize = nfs_block_size(ctx-&gt;rsize, NULL);</div><div class='add'>+		server-&gt;rsize = nfs_io_size(ctx-&gt;rsize, clp-&gt;cl_proto);</div><div class='ctx'> 	if (ctx-&gt;wsize)</div><div class='del'>-		server-&gt;wsize = nfs_block_size(ctx-&gt;wsize, NULL);</div><div class='add'>+		server-&gt;wsize = nfs_io_size(ctx-&gt;wsize, clp-&gt;cl_proto);</div><div class='ctx'> </div><div class='ctx'> 	server-&gt;acregmin = ctx-&gt;acregmin * HZ;</div><div class='ctx'> 	server-&gt;acregmax = ctx-&gt;acregmax * HZ;</div><div class='hunk'>@@ -734,6 +807,8 @@ static int nfs_init_server(struct nfs_server *server,</div><div class='ctx'> 	if (error &lt; 0)</div><div class='ctx'> 		goto error;</div><div class='ctx'> </div><div class='add'>+	nfs_server_set_init_caps(server);</div><div class='add'>+</div><div class='ctx'> 	/* Preserve the values of mount_server-related mount options */</div><div class='ctx'> 	if (ctx-&gt;mount_server.addrlen) {</div><div class='ctx'> 		memcpy(&amp;server-&gt;mountd_address, &amp;ctx-&gt;mount_server.address,</div><div class='hunk'>@@ -759,18 +834,19 @@ error:</div><div class='ctx'> static void nfs_server_set_fsinfo(struct nfs_server *server,</div><div class='ctx'> 				  struct nfs_fsinfo *fsinfo)</div><div class='ctx'> {</div><div class='add'>+	struct nfs_client *clp = server-&gt;nfs_client;</div><div class='ctx'> 	unsigned long max_rpc_payload, raw_max_rpc_payload;</div><div class='ctx'> </div><div class='ctx'> 	/* Work out a lot of parameters */</div><div class='ctx'> 	if (server-&gt;rsize == 0)</div><div class='del'>-		server-&gt;rsize = nfs_block_size(fsinfo-&gt;rtpref, NULL);</div><div class='add'>+		server-&gt;rsize = nfs_io_size(fsinfo-&gt;rtpref, clp-&gt;cl_proto);</div><div class='ctx'> 	if (server-&gt;wsize == 0)</div><div class='del'>-		server-&gt;wsize = nfs_block_size(fsinfo-&gt;wtpref, NULL);</div><div class='add'>+		server-&gt;wsize = nfs_io_size(fsinfo-&gt;wtpref, clp-&gt;cl_proto);</div><div class='ctx'> </div><div class='ctx'> 	if (fsinfo-&gt;rtmax &gt;= 512 &amp;&amp; server-&gt;rsize &gt; fsinfo-&gt;rtmax)</div><div class='del'>-		server-&gt;rsize = nfs_block_size(fsinfo-&gt;rtmax, NULL);</div><div class='add'>+		server-&gt;rsize = nfs_io_size(fsinfo-&gt;rtmax, clp-&gt;cl_proto);</div><div class='ctx'> 	if (fsinfo-&gt;wtmax &gt;= 512 &amp;&amp; server-&gt;wsize &gt; fsinfo-&gt;wtmax)</div><div class='del'>-		server-&gt;wsize = nfs_block_size(fsinfo-&gt;wtmax, NULL);</div><div class='add'>+		server-&gt;wsize = nfs_io_size(fsinfo-&gt;wtmax, clp-&gt;cl_proto);</div><div class='ctx'> </div><div class='ctx'> 	raw_max_rpc_payload = rpc_max_payload(server-&gt;client);</div><div class='ctx'> 	max_rpc_payload = nfs_block_size(raw_max_rpc_payload, NULL);</div><div class='hunk'>@@ -785,7 +861,6 @@ static void nfs_server_set_fsinfo(struct nfs_server *server,</div><div class='ctx'> 		server-&gt;wsize = max_rpc_payload;</div><div class='ctx'> 	if (server-&gt;wsize &gt; NFS_MAX_FILE_IO_SIZE)</div><div class='ctx'> 		server-&gt;wsize = NFS_MAX_FILE_IO_SIZE;</div><div class='del'>-	server-&gt;wpages = (server-&gt;wsize + PAGE_SIZE - 1) &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> </div><div class='ctx'> 	server-&gt;wtmult = nfs_block_bits(fsinfo-&gt;wtmult, NULL);</div><div class='ctx'> </div><div class='hunk'>@@ -802,7 +877,6 @@ static void nfs_server_set_fsinfo(struct nfs_server *server,</div><div class='ctx'> </div><div class='ctx'> 	server-&gt;maxfilesize = fsinfo-&gt;maxfilesize;</div><div class='ctx'> </div><div class='del'>-	server-&gt;time_delta = fsinfo-&gt;time_delta;</div><div class='ctx'> 	server-&gt;change_attr_type = fsinfo-&gt;change_attr_type;</div><div class='ctx'> </div><div class='ctx'> 	server-&gt;clone_blksize = fsinfo-&gt;clone_blksize;</div><div class='hunk'>@@ -822,6 +896,8 @@ static void nfs_server_set_fsinfo(struct nfs_server *server,</div><div class='ctx'> </div><div class='ctx'> 	if (fsinfo-&gt;xattr_support)</div><div class='ctx'> 		server-&gt;caps |= NFS_CAP_XATTR;</div><div class='add'>+	else</div><div class='add'>+		server-&gt;caps &amp;= ~NFS_CAP_XATTR;</div><div class='ctx'> #endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -860,6 +936,14 @@ static int nfs_probe_fsinfo(struct nfs_server *server, struct nfs_fh *mntfh, str</div><div class='ctx'> 			server-&gt;namelen = pathinfo.max_namelen;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (clp-&gt;rpc_ops-&gt;discover_trunking != NULL &amp;&amp;</div><div class='add'>+			(server-&gt;caps &amp; NFS_CAP_FS_LOCATIONS &amp;&amp;</div><div class='add'>+			 (server-&gt;flags &amp; NFS_MOUNT_TRUNK_DISCOVERY))) {</div><div class='add'>+		error = clp-&gt;rpc_ops-&gt;discover_trunking(server, mntfh);</div><div class='add'>+		if (error &lt; 0)</div><div class='add'>+			return error;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -899,7 +983,6 @@ void nfs_server_copy_userdata(struct nfs_server *target, struct nfs_server *sour</div><div class='ctx'> 	target-&gt;acregmax = source-&gt;acregmax;</div><div class='ctx'> 	target-&gt;acdirmin = source-&gt;acdirmin;</div><div class='ctx'> 	target-&gt;acdirmax = source-&gt;acdirmax;</div><div class='del'>-	target-&gt;caps = source-&gt;caps;</div><div class='ctx'> 	target-&gt;options = source-&gt;options;</div><div class='ctx'> 	target-&gt;auth_info = source-&gt;auth_info;</div><div class='ctx'> 	target-&gt;port = source-&gt;port;</div><div class='hunk'>@@ -939,6 +1022,8 @@ void nfs_server_remove_lists(struct nfs_server *server)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_server_remove_lists);</div><div class='ctx'> </div><div class='add'>+static DEFINE_IDA(s_sysfs_ids);</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Allocate and initialise a server record</div><div class='ctx'>  */</div><div class='hunk'>@@ -950,6 +1035,12 @@ struct nfs_server *nfs_alloc_server(void)</div><div class='ctx'> 	if (!server)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='add'>+	server-&gt;s_sysfs_id = ida_alloc(&amp;s_sysfs_ids, GFP_KERNEL);</div><div class='add'>+	if (server-&gt;s_sysfs_id &lt; 0) {</div><div class='add'>+		kfree(server);</div><div class='add'>+		return NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	server-&gt;client = server-&gt;client_acl = ERR_PTR(-EINVAL);</div><div class='ctx'> </div><div class='ctx'> 	/* Zero out the NFS state stuff */</div><div class='hunk'>@@ -959,8 +1050,10 @@ struct nfs_server *nfs_alloc_server(void)</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;server-&gt;layouts);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;server-&gt;state_owners_lru);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;server-&gt;ss_copies);</div><div class='add'>+	INIT_LIST_HEAD(&amp;server-&gt;ss_src_copies);</div><div class='ctx'> </div><div class='ctx'> 	atomic_set(&amp;server-&gt;active, 0);</div><div class='add'>+	atomic_long_set(&amp;server-&gt;nr_active_delegations, 0);</div><div class='ctx'> </div><div class='ctx'> 	server-&gt;io_stats = nfs_alloc_iostats();</div><div class='ctx'> 	if (!server-&gt;io_stats) {</div><div class='hunk'>@@ -970,8 +1063,11 @@ struct nfs_server *nfs_alloc_server(void)</div><div class='ctx'> </div><div class='ctx'> 	server-&gt;change_attr_type = NFS4_CHANGE_TYPE_IS_UNDEFINED;</div><div class='ctx'> </div><div class='del'>-	ida_init(&amp;server-&gt;openowner_id);</div><div class='del'>-	ida_init(&amp;server-&gt;lockowner_id);</div><div class='add'>+	init_waitqueue_head(&amp;server-&gt;write_congestion_wait);</div><div class='add'>+	atomic_long_set(&amp;server-&gt;writeback, 0);</div><div class='add'>+</div><div class='add'>+	atomic64_set(&amp;server-&gt;owner_ctr, 0);</div><div class='add'>+</div><div class='ctx'> 	pnfs_init_server(server);</div><div class='ctx'> 	rpc_init_wait_queue(&amp;server-&gt;uoc_rpcwaitq, "NFS UOC");</div><div class='ctx'> </div><div class='hunk'>@@ -979,6 +1075,14 @@ struct nfs_server *nfs_alloc_server(void)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_alloc_server);</div><div class='ctx'> </div><div class='add'>+static void delayed_free(struct rcu_head *p)</div><div class='add'>+{</div><div class='add'>+	struct nfs_server *server = container_of(p, struct nfs_server, rcu);</div><div class='add'>+</div><div class='add'>+	nfs_free_iostats(server-&gt;io_stats);</div><div class='add'>+	kfree(server);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Free up a server record</div><div class='ctx'>  */</div><div class='hunk'>@@ -996,12 +1100,15 @@ void nfs_free_server(struct nfs_server *server)</div><div class='ctx'> </div><div class='ctx'> 	nfs_put_client(server-&gt;nfs_client);</div><div class='ctx'> </div><div class='del'>-	ida_destroy(&amp;server-&gt;lockowner_id);</div><div class='del'>-	ida_destroy(&amp;server-&gt;openowner_id);</div><div class='del'>-	nfs_free_iostats(server-&gt;io_stats);</div><div class='add'>+	if (server-&gt;kobj.state_initialized) {</div><div class='add'>+		nfs_sysfs_remove_server(server);</div><div class='add'>+		kobject_put(&amp;server-&gt;kobj);</div><div class='add'>+	}</div><div class='add'>+	ida_free(&amp;s_sysfs_ids, server-&gt;s_sysfs_id);</div><div class='add'>+</div><div class='ctx'> 	put_cred(server-&gt;cred);</div><div class='del'>-	kfree(server);</div><div class='ctx'> 	nfs_release_automount_timer();</div><div class='add'>+	call_rcu(&amp;server-&gt;rcu, delayed_free);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_free_server);</div><div class='ctx'> </div><div class='hunk'>@@ -1045,6 +1152,8 @@ struct nfs_server *nfs_create_server(struct fs_context *fc)</div><div class='ctx'> 		if (server-&gt;namelen == 0 || server-&gt;namelen &gt; NFS2_MAXNAMLEN)</div><div class='ctx'> 			server-&gt;namelen = NFS2_MAXNAMLEN;</div><div class='ctx'> 	}</div><div class='add'>+	/* Linux 'subtree_check' borkenness mandates this setting */</div><div class='add'>+	server-&gt;fh_expire_type = NFS_FH_VOL_RENAME;</div><div class='ctx'> </div><div class='ctx'> 	if (!(fattr-&gt;valid &amp; NFS_ATTR_FATTR)) {</div><div class='ctx'> 		error = ctx-&gt;nfs_mod-&gt;rpc_ops-&gt;getattr(server, ctx-&gt;mntfh,</div><div class='hunk'>@@ -1097,12 +1206,19 @@ struct nfs_server *nfs_clone_server(struct nfs_server *source,</div><div class='ctx'> </div><div class='ctx'> 	server-&gt;fsid = fattr-&gt;fsid;</div><div class='ctx'> </div><div class='add'>+	nfs_sysfs_add_server(server);</div><div class='add'>+</div><div class='add'>+	nfs_sysfs_link_rpc_client(server,</div><div class='add'>+		server-&gt;nfs_client-&gt;cl_rpcclient, "_state");</div><div class='add'>+</div><div class='ctx'> 	error = nfs_init_server_rpcclient(server,</div><div class='ctx'> 			source-&gt;client-&gt;cl_timeout,</div><div class='ctx'> 			flavor);</div><div class='ctx'> 	if (error &lt; 0)</div><div class='ctx'> 		goto out_free_server;</div><div class='ctx'> </div><div class='add'>+	nfs_server_set_init_caps(server);</div><div class='add'>+</div><div class='ctx'> 	/* probe the filesystem info for this server filesystem */</div><div class='ctx'> 	error = nfs_probe_server(server, fh);</div><div class='ctx'> 	if (error &lt; 0)</div><div class='hunk'>@@ -1135,8 +1251,14 @@ void nfs_clients_init(struct net *net)</div><div class='ctx'> #if IS_ENABLED(CONFIG_NFS_V4)</div><div class='ctx'> 	idr_init(&amp;nn-&gt;cb_ident_idr);</div><div class='ctx'> #endif</div><div class='add'>+#if IS_ENABLED(CONFIG_NFS_V4_1)</div><div class='add'>+	INIT_LIST_HEAD(&amp;nn-&gt;nfs4_data_server_cache);</div><div class='add'>+	spin_lock_init(&amp;nn-&gt;nfs4_data_server_lock);</div><div class='add'>+#endif</div><div class='ctx'> 	spin_lock_init(&amp;nn-&gt;nfs_client_lock);</div><div class='ctx'> 	nn-&gt;boot_time = ktime_get_real();</div><div class='add'>+	memset(&amp;nn-&gt;rpcstats, 0, sizeof(nn-&gt;rpcstats));</div><div class='add'>+	nn-&gt;rpcstats.program = &amp;nfs_program;</div><div class='ctx'> </div><div class='ctx'> 	nfs_netns_sysfs_setup(nn, net);</div><div class='ctx'> }</div><div class='hunk'>@@ -1149,6 +1271,9 @@ void nfs_clients_exit(struct net *net)</div><div class='ctx'> 	nfs_cleanup_cb_ident_idr(net);</div><div class='ctx'> 	WARN_ON_ONCE(!list_empty(&amp;nn-&gt;nfs_client_list));</div><div class='ctx'> 	WARN_ON_ONCE(!list_empty(&amp;nn-&gt;nfs_volume_list));</div><div class='add'>+#if IS_ENABLED(CONFIG_NFS_V4_1)</div><div class='add'>+	WARN_ON_ONCE(!list_empty(&amp;nn-&gt;nfs4_data_server_cache));</div><div class='add'>+#endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_PROC_FS</div><div class='hunk'>@@ -1380,6 +1505,7 @@ error_0:</div><div class='ctx'> void nfs_fs_proc_exit(void)</div><div class='ctx'> {</div><div class='ctx'> 	remove_proc_subtree("fs/nfsfs", NULL);</div><div class='add'>+	ida_destroy(&amp;s_sysfs_ids);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #endif /* CONFIG_PROC_FS */</div><div class='head'>diff --git a/fs/nfs/delegation.c b/fs/nfs/delegation.c<br/>index 7c9eb679dbdb..9d3a5f29f17f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/delegation.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/delegation.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/delegation.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/delegation.c</a></div><div class='hunk'>@@ -27,8 +27,15 @@</div><div class='ctx'> </div><div class='ctx'> #define NFS_DEFAULT_DELEGATION_WATERMARK (5000U)</div><div class='ctx'> </div><div class='del'>-static atomic_long_t nfs_active_delegations;</div><div class='ctx'> static unsigned nfs_delegation_watermark = NFS_DEFAULT_DELEGATION_WATERMARK;</div><div class='add'>+module_param_named(delegation_watermark, nfs_delegation_watermark, uint, 0644);</div><div class='add'>+</div><div class='add'>+static struct hlist_head *nfs_delegation_hash(struct nfs_server *server,</div><div class='add'>+		const struct nfs_fh *fhandle)</div><div class='add'>+{</div><div class='add'>+	return server-&gt;delegation_hash_table +</div><div class='add'>+		(nfs_fhandle_hash(fhandle) &amp; server-&gt;delegation_hash_mask);</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> static void __nfs_free_delegation(struct nfs_delegation *delegation)</div><div class='ctx'> {</div><div class='hunk'>@@ -37,11 +44,12 @@ static void __nfs_free_delegation(struct nfs_delegation *delegation)</div><div class='ctx'> 	kfree_rcu(delegation, rcu);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void nfs_mark_delegation_revoked(struct nfs_delegation *delegation)</div><div class='add'>+static void nfs_mark_delegation_revoked(struct nfs_server *server,</div><div class='add'>+		struct nfs_delegation *delegation)</div><div class='ctx'> {</div><div class='ctx'> 	if (!test_and_set_bit(NFS_DELEGATION_REVOKED, &amp;delegation-&gt;flags)) {</div><div class='ctx'> 		delegation-&gt;stateid.type = NFS4_INVALID_STATEID_TYPE;</div><div class='del'>-		atomic_long_dec(&amp;nfs_active_delegations);</div><div class='add'>+		atomic_long_dec(&amp;server-&gt;nr_active_delegations);</div><div class='ctx'> 		if (!test_bit(NFS_DELEGATION_RETURNING, &amp;delegation-&gt;flags))</div><div class='ctx'> 			nfs_clear_verifier_delegated(delegation-&gt;inode);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -59,9 +67,10 @@ static void nfs_put_delegation(struct nfs_delegation *delegation)</div><div class='ctx'> 		__nfs_free_delegation(delegation);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void nfs_free_delegation(struct nfs_delegation *delegation)</div><div class='add'>+static void nfs_free_delegation(struct nfs_server *server,</div><div class='add'>+		struct nfs_delegation *delegation)</div><div class='ctx'> {</div><div class='del'>-	nfs_mark_delegation_revoked(delegation);</div><div class='add'>+	nfs_mark_delegation_revoked(server, delegation);</div><div class='ctx'> 	nfs_put_delegation(delegation);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -79,14 +88,14 @@ static void nfs_mark_return_delegation(struct nfs_server *server,</div><div class='ctx'> 				       struct nfs_delegation *delegation)</div><div class='ctx'> {</div><div class='ctx'> 	set_bit(NFS_DELEGATION_RETURN, &amp;delegation-&gt;flags);</div><div class='add'>+	set_bit(NFS4SERV_DELEGRETURN, &amp;server-&gt;delegation_flags);</div><div class='ctx'> 	set_bit(NFS4CLNT_DELEGRETURN, &amp;server-&gt;nfs_client-&gt;cl_state);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool</div><div class='del'>-nfs4_is_valid_delegation(const struct nfs_delegation *delegation,</div><div class='del'>-		fmode_t flags)</div><div class='add'>+static bool nfs4_is_valid_delegation(const struct nfs_delegation *delegation,</div><div class='add'>+				     fmode_t type)</div><div class='ctx'> {</div><div class='del'>-	if (delegation != NULL &amp;&amp; (delegation-&gt;type &amp; flags) == flags &amp;&amp;</div><div class='add'>+	if (delegation != NULL &amp;&amp; (delegation-&gt;type &amp; type) == type &amp;&amp;</div><div class='ctx'> 	    !test_bit(NFS_DELEGATION_REVOKED, &amp;delegation-&gt;flags) &amp;&amp;</div><div class='ctx'> 	    !test_bit(NFS_DELEGATION_RETURNING, &amp;delegation-&gt;flags))</div><div class='ctx'> 		return true;</div><div class='hunk'>@@ -103,19 +112,22 @@ struct nfs_delegation *nfs4_get_valid_delegation(const struct inode *inode)</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int</div><div class='del'>-nfs4_do_check_delegation(struct inode *inode, fmode_t flags, bool mark)</div><div class='add'>+static int nfs4_do_check_delegation(struct inode *inode, fmode_t type,</div><div class='add'>+				    int flags, bool mark)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_delegation *delegation;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	flags &amp;= FMODE_READ|FMODE_WRITE;</div><div class='add'>+	type &amp;= FMODE_READ|FMODE_WRITE;</div><div class='ctx'> 	rcu_read_lock();</div><div class='ctx'> 	delegation = rcu_dereference(NFS_I(inode)-&gt;delegation);</div><div class='del'>-	if (nfs4_is_valid_delegation(delegation, flags)) {</div><div class='add'>+	if (nfs4_is_valid_delegation(delegation, type)) {</div><div class='ctx'> 		if (mark)</div><div class='ctx'> 			nfs_mark_delegation_referenced(delegation);</div><div class='ctx'> 		ret = 1;</div><div class='add'>+		if ((flags &amp; NFS_DELEGATION_FLAG_TIME) &amp;&amp;</div><div class='add'>+		    !test_bit(NFS_DELEGATION_DELEGTIME, &amp;delegation-&gt;flags))</div><div class='add'>+			ret = 0;</div><div class='ctx'> 	}</div><div class='ctx'> 	rcu_read_unlock();</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -124,29 +136,30 @@ nfs4_do_check_delegation(struct inode *inode, fmode_t flags, bool mark)</div><div class='ctx'>  * nfs4_have_delegation - check if inode has a delegation, mark it</div><div class='ctx'>  * NFS_DELEGATION_REFERENCED if there is one.</div><div class='ctx'>  * @inode: inode to check</div><div class='del'>- * @flags: delegation types to check for</div><div class='add'>+ * @type: delegation types to check for</div><div class='add'>+ * @flags: various modifiers</div><div class='ctx'>  *</div><div class='ctx'>  * Returns one if inode has the indicated delegation, otherwise zero.</div><div class='ctx'>  */</div><div class='del'>-int nfs4_have_delegation(struct inode *inode, fmode_t flags)</div><div class='add'>+int nfs4_have_delegation(struct inode *inode, fmode_t type, int flags)</div><div class='ctx'> {</div><div class='del'>-	return nfs4_do_check_delegation(inode, flags, true);</div><div class='add'>+	return nfs4_do_check_delegation(inode, type, flags, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * nfs4_check_delegation - check if inode has a delegation, do not mark</div><div class='ctx'>  * NFS_DELEGATION_REFERENCED if it has one.</div><div class='ctx'>  */</div><div class='del'>-int nfs4_check_delegation(struct inode *inode, fmode_t flags)</div><div class='add'>+int nfs4_check_delegation(struct inode *inode, fmode_t type)</div><div class='ctx'> {</div><div class='del'>-	return nfs4_do_check_delegation(inode, flags, false);</div><div class='add'>+	return nfs4_do_check_delegation(inode, type, 0, false);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int nfs_delegation_claim_locks(struct nfs4_state *state, const nfs4_stateid *stateid)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = state-&gt;inode;</div><div class='ctx'> 	struct file_lock *fl;</div><div class='del'>-	struct file_lock_context *flctx = inode-&gt;i_flctx;</div><div class='add'>+	struct file_lock_context *flctx = locks_inode_context(inode);</div><div class='ctx'> 	struct list_head *list;</div><div class='ctx'> 	int status = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -156,8 +169,8 @@ static int nfs_delegation_claim_locks(struct nfs4_state *state, const nfs4_state</div><div class='ctx'> 	list = &amp;flctx-&gt;flc_posix;</div><div class='ctx'> 	spin_lock(&amp;flctx-&gt;flc_lock);</div><div class='ctx'> restart:</div><div class='del'>-	list_for_each_entry(fl, list, fl_list) {</div><div class='del'>-		if (nfs_file_open_context(fl-&gt;fl_file)-&gt;state != state)</div><div class='add'>+	for_each_file_lock(fl, list) {</div><div class='add'>+		if (nfs_file_open_context(fl-&gt;c.flc_file)-&gt;state != state)</div><div class='ctx'> 			continue;</div><div class='ctx'> 		spin_unlock(&amp;flctx-&gt;flc_lock);</div><div class='ctx'> 		status = nfs4_lock_delegation_recall(fl, state, stateid);</div><div class='hunk'>@@ -181,7 +194,6 @@ static int nfs_delegation_claim_opens(struct inode *inode,</div><div class='ctx'> 	struct nfs_open_context *ctx;</div><div class='ctx'> 	struct nfs4_state_owner *sp;</div><div class='ctx'> 	struct nfs4_state *state;</div><div class='del'>-	unsigned int seq;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> again:</div><div class='hunk'>@@ -202,12 +214,9 @@ again:</div><div class='ctx'> 		sp = state-&gt;owner;</div><div class='ctx'> 		/* Block nfs4_proc_unlck */</div><div class='ctx'> 		mutex_lock(&amp;sp-&gt;so_delegreturn_mutex);</div><div class='del'>-		seq = raw_seqcount_begin(&amp;sp-&gt;so_reclaim_seqcount);</div><div class='ctx'> 		err = nfs4_open_delegation_recall(ctx, state, stateid);</div><div class='ctx'> 		if (!err)</div><div class='ctx'> 			err = nfs_delegation_claim_locks(state, stateid);</div><div class='del'>-		if (!err &amp;&amp; read_seqcount_retry(&amp;sp-&gt;so_reclaim_seqcount, seq))</div><div class='del'>-			err = -EAGAIN;</div><div class='ctx'> 		mutex_unlock(&amp;sp-&gt;so_delegreturn_mutex);</div><div class='ctx'> 		put_nfs_open_context(ctx);</div><div class='ctx'> 		if (err != 0)</div><div class='hunk'>@@ -225,42 +234,51 @@ again:</div><div class='ctx'>  * @type: delegation type</div><div class='ctx'>  * @stateid: delegation stateid</div><div class='ctx'>  * @pagemod_limit: write delegation "space_limit"</div><div class='add'>+ * @deleg_type: raw delegation type</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='ctx'> void nfs_inode_reclaim_delegation(struct inode *inode, const struct cred *cred,</div><div class='del'>-				  fmode_t type,</div><div class='del'>-				  const nfs4_stateid *stateid,</div><div class='del'>-				  unsigned long pagemod_limit)</div><div class='add'>+				  fmode_t type, const nfs4_stateid *stateid,</div><div class='add'>+				  unsigned long pagemod_limit, u32 deleg_type)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_delegation *delegation;</div><div class='ctx'> 	const struct cred *oldcred = NULL;</div><div class='ctx'> </div><div class='ctx'> 	rcu_read_lock();</div><div class='ctx'> 	delegation = rcu_dereference(NFS_I(inode)-&gt;delegation);</div><div class='del'>-	if (delegation != NULL) {</div><div class='del'>-		spin_lock(&amp;delegation-&gt;lock);</div><div class='del'>-		if (nfs4_is_valid_delegation(delegation, 0)) {</div><div class='del'>-			nfs4_stateid_copy(&amp;delegation-&gt;stateid, stateid);</div><div class='del'>-			delegation-&gt;type = type;</div><div class='del'>-			delegation-&gt;pagemod_limit = pagemod_limit;</div><div class='del'>-			oldcred = delegation-&gt;cred;</div><div class='del'>-			delegation-&gt;cred = get_cred(cred);</div><div class='del'>-			clear_bit(NFS_DELEGATION_NEED_RECLAIM,</div><div class='del'>-				  &amp;delegation-&gt;flags);</div><div class='del'>-			spin_unlock(&amp;delegation-&gt;lock);</div><div class='del'>-			rcu_read_unlock();</div><div class='del'>-			put_cred(oldcred);</div><div class='del'>-			trace_nfs4_reclaim_delegation(inode, type);</div><div class='del'>-			return;</div><div class='del'>-		}</div><div class='del'>-		/* We appear to have raced with a delegation return. */</div><div class='del'>-		spin_unlock(&amp;delegation-&gt;lock);</div><div class='add'>+	if (!delegation) {</div><div class='add'>+		rcu_read_unlock();</div><div class='add'>+		nfs_inode_set_delegation(inode, cred, type, stateid,</div><div class='add'>+					 pagemod_limit, deleg_type);</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;delegation-&gt;lock);</div><div class='add'>+	nfs4_stateid_copy(&amp;delegation-&gt;stateid, stateid);</div><div class='add'>+	delegation-&gt;type = type;</div><div class='add'>+	delegation-&gt;pagemod_limit = pagemod_limit;</div><div class='add'>+	oldcred = delegation-&gt;cred;</div><div class='add'>+	delegation-&gt;cred = get_cred(cred);</div><div class='add'>+	switch (deleg_type) {</div><div class='add'>+	case NFS4_OPEN_DELEGATE_READ_ATTRS_DELEG:</div><div class='add'>+	case NFS4_OPEN_DELEGATE_WRITE_ATTRS_DELEG:</div><div class='add'>+		set_bit(NFS_DELEGATION_DELEGTIME, &amp;delegation-&gt;flags);</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		clear_bit(NFS_DELEGATION_DELEGTIME, &amp;delegation-&gt;flags);</div><div class='add'>+	}</div><div class='add'>+	clear_bit(NFS_DELEGATION_NEED_RECLAIM, &amp;delegation-&gt;flags);</div><div class='add'>+	if (test_and_clear_bit(NFS_DELEGATION_REVOKED, &amp;delegation-&gt;flags))</div><div class='add'>+		atomic_long_inc(&amp;NFS_SERVER(inode)-&gt;nr_active_delegations);</div><div class='add'>+	spin_unlock(&amp;delegation-&gt;lock);</div><div class='ctx'> 	rcu_read_unlock();</div><div class='del'>-	nfs_inode_set_delegation(inode, cred, type, stateid, pagemod_limit);</div><div class='add'>+	put_cred(oldcred);</div><div class='add'>+	trace_nfs4_reclaim_delegation(inode, type);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int nfs_do_return_delegation(struct inode *inode, struct nfs_delegation *delegation, int issync)</div><div class='add'>+static int nfs_do_return_delegation(struct inode *inode,</div><div class='add'>+				    struct nfs_delegation *delegation,</div><div class='add'>+				    int issync)</div><div class='ctx'> {</div><div class='ctx'> 	const struct cred *cred;</div><div class='ctx'> 	int res = 0;</div><div class='hunk'>@@ -269,9 +287,8 @@ static int nfs_do_return_delegation(struct inode *inode, struct nfs_delegation *</div><div class='ctx'> 		spin_lock(&amp;delegation-&gt;lock);</div><div class='ctx'> 		cred = get_cred(delegation-&gt;cred);</div><div class='ctx'> 		spin_unlock(&amp;delegation-&gt;lock);</div><div class='del'>-		res = nfs4_proc_delegreturn(inode, cred,</div><div class='del'>-				&amp;delegation-&gt;stateid,</div><div class='del'>-				issync);</div><div class='add'>+		res = nfs4_proc_delegreturn(inode, cred, &amp;delegation-&gt;stateid,</div><div class='add'>+					    delegation, issync);</div><div class='ctx'> 		put_cred(cred);</div><div class='ctx'> 	}</div><div class='ctx'> 	return res;</div><div class='hunk'>@@ -299,7 +316,8 @@ nfs_start_delegation_return_locked(struct nfs_inode *nfsi)</div><div class='ctx'> 	if (delegation == NULL)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	spin_lock(&amp;delegation-&gt;lock);</div><div class='del'>-	if (!test_and_set_bit(NFS_DELEGATION_RETURNING, &amp;delegation-&gt;flags)) {</div><div class='add'>+	if (delegation-&gt;inode &amp;&amp;</div><div class='add'>+	    !test_and_set_bit(NFS_DELEGATION_RETURNING, &amp;delegation-&gt;flags)) {</div><div class='ctx'> 		clear_bit(NFS_DELEGATION_RETURN_DELAYED, &amp;delegation-&gt;flags);</div><div class='ctx'> 		/* Refcount matched in nfs_end_delegation_return() */</div><div class='ctx'> 		ret = nfs_get_delegation(delegation);</div><div class='hunk'>@@ -323,14 +341,16 @@ nfs_start_delegation_return(struct nfs_inode *nfsi)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void nfs_abort_delegation_return(struct nfs_delegation *delegation,</div><div class='del'>-					struct nfs_client *clp, int err)</div><div class='add'>+					struct nfs_server *server, int err)</div><div class='ctx'> {</div><div class='del'>-</div><div class='ctx'> 	spin_lock(&amp;delegation-&gt;lock);</div><div class='ctx'> 	clear_bit(NFS_DELEGATION_RETURNING, &amp;delegation-&gt;flags);</div><div class='ctx'> 	if (err == -EAGAIN) {</div><div class='ctx'> 		set_bit(NFS_DELEGATION_RETURN_DELAYED, &amp;delegation-&gt;flags);</div><div class='del'>-		set_bit(NFS4CLNT_DELEGRETURN_DELAYED, &amp;clp-&gt;cl_state);</div><div class='add'>+		set_bit(NFS4SERV_DELEGRETURN_DELAYED,</div><div class='add'>+			&amp;server-&gt;delegation_flags);</div><div class='add'>+		set_bit(NFS4CLNT_DELEGRETURN_DELAYED,</div><div class='add'>+			&amp;server-&gt;nfs_client-&gt;cl_state);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;delegation-&gt;lock);</div><div class='ctx'> }</div><div class='hunk'>@@ -344,6 +364,8 @@ nfs_detach_delegation_locked(struct nfs_inode *nfsi,</div><div class='ctx'> 		rcu_dereference_protected(nfsi-&gt;delegation,</div><div class='ctx'> 				lockdep_is_held(&amp;clp-&gt;cl_lock));</div><div class='ctx'> </div><div class='add'>+	trace_nfs4_detach_delegation(&amp;nfsi-&gt;vfs_inode, delegation-&gt;type);</div><div class='add'>+</div><div class='ctx'> 	if (deleg_cur == NULL || delegation != deleg_cur)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='hunk'>@@ -352,6 +374,7 @@ nfs_detach_delegation_locked(struct nfs_inode *nfsi,</div><div class='ctx'> 		spin_unlock(&amp;delegation-&gt;lock);</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	}</div><div class='add'>+	hlist_del_init_rcu(&amp;delegation-&gt;hash);</div><div class='ctx'> 	list_del_rcu(&amp;delegation-&gt;super_list);</div><div class='ctx'> 	delegation-&gt;inode = NULL;</div><div class='ctx'> 	rcu_assign_pointer(nfsi-&gt;delegation, NULL);</div><div class='hunk'>@@ -399,7 +422,8 @@ nfs_update_delegation_cred(struct nfs_delegation *delegation,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='del'>-nfs_update_inplace_delegation(struct nfs_delegation *delegation,</div><div class='add'>+nfs_update_inplace_delegation(struct nfs_server *server,</div><div class='add'>+		struct nfs_delegation *delegation,</div><div class='ctx'> 		const struct nfs_delegation *update)</div><div class='ctx'> {</div><div class='ctx'> 	if (nfs4_stateid_is_newer(&amp;update-&gt;stateid, &amp;delegation-&gt;stateid)) {</div><div class='hunk'>@@ -412,7 +436,7 @@ nfs_update_inplace_delegation(struct nfs_delegation *delegation,</div><div class='ctx'> 			nfs_update_delegation_cred(delegation, update-&gt;cred);</div><div class='ctx'> 			/* smp_mb__before_atomic() is implicit due to xchg() */</div><div class='ctx'> 			clear_bit(NFS_DELEGATION_REVOKED, &amp;delegation-&gt;flags);</div><div class='del'>-			atomic_long_inc(&amp;nfs_active_delegations);</div><div class='add'>+			atomic_long_inc(&amp;server-&gt;nr_active_delegations);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -424,13 +448,13 @@ nfs_update_inplace_delegation(struct nfs_delegation *delegation,</div><div class='ctx'>  * @type: delegation type</div><div class='ctx'>  * @stateid: delegation stateid</div><div class='ctx'>  * @pagemod_limit: write delegation "space_limit"</div><div class='add'>+ * @deleg_type: raw delegation type</div><div class='ctx'>  *</div><div class='ctx'>  * Returns zero on success, or a negative errno value.</div><div class='ctx'>  */</div><div class='ctx'> int nfs_inode_set_delegation(struct inode *inode, const struct cred *cred,</div><div class='del'>-				  fmode_t type,</div><div class='del'>-				  const nfs4_stateid *stateid,</div><div class='del'>-				  unsigned long pagemod_limit)</div><div class='add'>+			     fmode_t type, const nfs4_stateid *stateid,</div><div class='add'>+			     unsigned long pagemod_limit, u32 deleg_type)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_server *server = NFS_SERVER(inode);</div><div class='ctx'> 	struct nfs_client *clp = server-&gt;nfs_client;</div><div class='hunk'>@@ -439,7 +463,7 @@ int nfs_inode_set_delegation(struct inode *inode, const struct cred *cred,</div><div class='ctx'> 	struct nfs_delegation *freeme = NULL;</div><div class='ctx'> 	int status = 0;</div><div class='ctx'> </div><div class='del'>-	delegation = kmalloc(sizeof(*delegation), GFP_NOFS);</div><div class='add'>+	delegation = kmalloc(sizeof(*delegation), GFP_KERNEL_ACCOUNT);</div><div class='ctx'> 	if (delegation == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	nfs4_stateid_copy(&amp;delegation-&gt;stateid, stateid);</div><div class='hunk'>@@ -450,6 +474,12 @@ int nfs_inode_set_delegation(struct inode *inode, const struct cred *cred,</div><div class='ctx'> 	delegation-&gt;cred = get_cred(cred);</div><div class='ctx'> 	delegation-&gt;inode = inode;</div><div class='ctx'> 	delegation-&gt;flags = 1&lt;&lt;NFS_DELEGATION_REFERENCED;</div><div class='add'>+	switch (deleg_type) {</div><div class='add'>+	case NFS4_OPEN_DELEGATE_READ_ATTRS_DELEG:</div><div class='add'>+	case NFS4_OPEN_DELEGATE_WRITE_ATTRS_DELEG:</div><div class='add'>+		delegation-&gt;flags |= BIT(NFS_DELEGATION_DELEGTIME);</div><div class='add'>+	}</div><div class='add'>+	delegation-&gt;test_gen = 0;</div><div class='ctx'> 	spin_lock_init(&amp;delegation-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;clp-&gt;cl_lock);</div><div class='hunk'>@@ -461,7 +491,7 @@ int nfs_inode_set_delegation(struct inode *inode, const struct cred *cred,</div><div class='ctx'> 	if (nfs4_stateid_match_other(&amp;old_delegation-&gt;stateid,</div><div class='ctx'> 				&amp;delegation-&gt;stateid)) {</div><div class='ctx'> 		spin_lock(&amp;old_delegation-&gt;lock);</div><div class='del'>-		nfs_update_inplace_delegation(old_delegation,</div><div class='add'>+		nfs_update_inplace_delegation(server, old_delegation,</div><div class='ctx'> 				delegation);</div><div class='ctx'> 		spin_unlock(&amp;old_delegation-&gt;lock);</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -507,19 +537,26 @@ add_new:</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> </div><div class='ctx'> 	list_add_tail_rcu(&amp;delegation-&gt;super_list, &amp;server-&gt;delegations);</div><div class='add'>+	hlist_add_head_rcu(&amp;delegation-&gt;hash,</div><div class='add'>+			nfs_delegation_hash(server, &amp;NFS_I(inode)-&gt;fh));</div><div class='ctx'> 	rcu_assign_pointer(nfsi-&gt;delegation, delegation);</div><div class='ctx'> 	delegation = NULL;</div><div class='ctx'> </div><div class='del'>-	atomic_long_inc(&amp;nfs_active_delegations);</div><div class='add'>+	atomic_long_inc(&amp;server-&gt;nr_active_delegations);</div><div class='ctx'> </div><div class='ctx'> 	trace_nfs4_set_delegation(inode, type);</div><div class='add'>+</div><div class='add'>+	/* If we hold writebacks and have delegated mtime then update */</div><div class='add'>+	if (deleg_type == NFS4_OPEN_DELEGATE_WRITE_ATTRS_DELEG &amp;&amp;</div><div class='add'>+	    nfs_have_writebacks(inode))</div><div class='add'>+		nfs_update_delegated_mtime(inode);</div><div class='ctx'> out:</div><div class='ctx'> 	spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='ctx'> 	if (delegation != NULL)</div><div class='ctx'> 		__nfs_free_delegation(delegation);</div><div class='ctx'> 	if (freeme != NULL) {</div><div class='ctx'> 		nfs_do_return_delegation(inode, freeme, 0);</div><div class='del'>-		nfs_free_delegation(freeme);</div><div class='add'>+		nfs_free_delegation(server, freeme);</div><div class='ctx'> 	}</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='hunk'>@@ -529,7 +566,7 @@ out:</div><div class='ctx'>  */</div><div class='ctx'> static int nfs_end_delegation_return(struct inode *inode, struct nfs_delegation *delegation, int issync)</div><div class='ctx'> {</div><div class='del'>-	struct nfs_client *clp = NFS_SERVER(inode)-&gt;nfs_client;</div><div class='add'>+	struct nfs_server *server = NFS_SERVER(inode);</div><div class='ctx'> 	unsigned int mode = O_WRONLY | O_RDWR;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -551,11 +588,11 @@ static int nfs_end_delegation_return(struct inode *inode, struct nfs_delegation</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Guard against state recovery</div><div class='ctx'> 		 */</div><div class='del'>-		err = nfs4_wait_clnt_recover(clp);</div><div class='add'>+		err = nfs4_wait_clnt_recover(server-&gt;nfs_client);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (err) {</div><div class='del'>-		nfs_abort_delegation_return(delegation, clp, err);</div><div class='add'>+		nfs_abort_delegation_return(delegation, server, err);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -570,19 +607,10 @@ static bool nfs_delegation_need_return(struct nfs_delegation *delegation)</div><div class='ctx'> {</div><div class='ctx'> 	bool ret = false;</div><div class='ctx'> </div><div class='add'>+	trace_nfs_delegation_need_return(delegation);</div><div class='add'>+</div><div class='ctx'> 	if (test_and_clear_bit(NFS_DELEGATION_RETURN, &amp;delegation-&gt;flags))</div><div class='ctx'> 		ret = true;</div><div class='del'>-	else if (test_bit(NFS_DELEGATION_RETURN_IF_CLOSED, &amp;delegation-&gt;flags)) {</div><div class='del'>-		struct inode *inode;</div><div class='del'>-</div><div class='del'>-		spin_lock(&amp;delegation-&gt;lock);</div><div class='del'>-		inode = delegation-&gt;inode;</div><div class='del'>-		if (inode &amp;&amp; list_empty(&amp;NFS_I(inode)-&gt;open_files))</div><div class='del'>-			ret = true;</div><div class='del'>-		spin_unlock(&amp;delegation-&gt;lock);</div><div class='del'>-	}</div><div class='del'>-	if (ret)</div><div class='del'>-		clear_bit(NFS_DELEGATION_RETURN_IF_CLOSED, &amp;delegation-&gt;flags);</div><div class='ctx'> 	if (test_bit(NFS_DELEGATION_RETURNING, &amp;delegation-&gt;flags) ||</div><div class='ctx'> 	    test_bit(NFS_DELEGATION_RETURN_DELAYED, &amp;delegation-&gt;flags) ||</div><div class='ctx'> 	    test_bit(NFS_DELEGATION_REVOKED, &amp;delegation-&gt;flags))</div><div class='hunk'>@@ -601,6 +629,9 @@ static int nfs_server_return_marked_delegations(struct nfs_server *server,</div><div class='ctx'> 	struct nfs_delegation *place_holder_deleg = NULL;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> </div><div class='add'>+	if (!test_and_clear_bit(NFS4SERV_DELEGRETURN,</div><div class='add'>+				&amp;server-&gt;delegation_flags))</div><div class='add'>+		return 0;</div><div class='ctx'> restart:</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * To avoid quadratic looping we hold a reference</div><div class='hunk'>@@ -629,6 +660,9 @@ restart:</div><div class='ctx'> 				prev = delegation;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='add'>+		inode = nfs_delegation_grab_inode(delegation);</div><div class='add'>+		if (inode == NULL)</div><div class='add'>+			continue;</div><div class='ctx'> </div><div class='ctx'> 		if (prev) {</div><div class='ctx'> 			struct inode *tmp = nfs_delegation_grab_inode(prev);</div><div class='hunk'>@@ -639,12 +673,6 @@ restart:</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		inode = nfs_delegation_grab_inode(delegation);</div><div class='del'>-		if (inode == NULL) {</div><div class='del'>-			rcu_read_unlock();</div><div class='del'>-			iput(to_put);</div><div class='del'>-			goto restart;</div><div class='del'>-		}</div><div class='ctx'> 		delegation = nfs_start_delegation_return_locked(NFS_I(inode));</div><div class='ctx'> 		rcu_read_unlock();</div><div class='ctx'> </div><div class='hunk'>@@ -655,6 +683,7 @@ restart:</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 		if (!err)</div><div class='ctx'> 			goto restart;</div><div class='add'>+		set_bit(NFS4SERV_DELEGRETURN, &amp;server-&gt;delegation_flags);</div><div class='ctx'> 		set_bit(NFS4CLNT_DELEGRETURN, &amp;server-&gt;nfs_client-&gt;cl_state);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -669,6 +698,9 @@ static bool nfs_server_clear_delayed_delegations(struct nfs_server *server)</div><div class='ctx'> 	struct nfs_delegation *d;</div><div class='ctx'> 	bool ret = false;</div><div class='ctx'> </div><div class='add'>+	if (!test_and_clear_bit(NFS4SERV_DELEGRETURN_DELAYED,</div><div class='add'>+				&amp;server-&gt;delegation_flags))</div><div class='add'>+		goto out;</div><div class='ctx'> 	list_for_each_entry_rcu (d, &amp;server-&gt;delegations, super_list) {</div><div class='ctx'> 		if (!test_bit(NFS_DELEGATION_RETURN_DELAYED, &amp;d-&gt;flags))</div><div class='ctx'> 			continue;</div><div class='hunk'>@@ -676,6 +708,7 @@ static bool nfs_server_clear_delayed_delegations(struct nfs_server *server)</div><div class='ctx'> 		clear_bit(NFS_DELEGATION_RETURN_DELAYED, &amp;d-&gt;flags);</div><div class='ctx'> 		ret = true;</div><div class='ctx'> 	}</div><div class='add'>+out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -735,7 +768,7 @@ void nfs_inode_evict_delegation(struct inode *inode)</div><div class='ctx'> 		set_bit(NFS_DELEGATION_RETURNING, &amp;delegation-&gt;flags);</div><div class='ctx'> 		set_bit(NFS_DELEGATION_INODE_FREEING, &amp;delegation-&gt;flags);</div><div class='ctx'> 		nfs_do_return_delegation(inode, delegation, 1);</div><div class='del'>-		nfs_free_delegation(delegation);</div><div class='add'>+		nfs_free_delegation(NFS_SERVER(inode), delegation);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -766,6 +799,43 @@ int nfs4_inode_return_delegation(struct inode *inode)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='add'>+ * nfs4_inode_set_return_delegation_on_close - asynchronously return a delegation</div><div class='add'>+ * @inode: inode to process</div><div class='add'>+ *</div><div class='add'>+ * This routine is called to request that the delegation be returned as soon</div><div class='add'>+ * as the file is closed. If the file is already closed, the delegation is</div><div class='add'>+ * immediately returned.</div><div class='add'>+ */</div><div class='add'>+void nfs4_inode_set_return_delegation_on_close(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct nfs_delegation *delegation;</div><div class='add'>+	struct nfs_delegation *ret = NULL;</div><div class='add'>+</div><div class='add'>+	if (!inode)</div><div class='add'>+		return;</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	delegation = nfs4_get_valid_delegation(inode);</div><div class='add'>+	if (!delegation)</div><div class='add'>+		goto out;</div><div class='add'>+	spin_lock(&amp;delegation-&gt;lock);</div><div class='add'>+	if (!delegation-&gt;inode)</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	if (list_empty(&amp;NFS_I(inode)-&gt;open_files) &amp;&amp;</div><div class='add'>+	    !test_and_set_bit(NFS_DELEGATION_RETURNING, &amp;delegation-&gt;flags)) {</div><div class='add'>+		/* Refcount matched in nfs_end_delegation_return() */</div><div class='add'>+		ret = nfs_get_delegation(delegation);</div><div class='add'>+	} else</div><div class='add'>+		set_bit(NFS_DELEGATION_RETURN_IF_CLOSED, &amp;delegation-&gt;flags);</div><div class='add'>+out_unlock:</div><div class='add'>+	spin_unlock(&amp;delegation-&gt;lock);</div><div class='add'>+	if (ret)</div><div class='add'>+		nfs_clear_verifier_delegated(inode);</div><div class='add'>+out:</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+	nfs_end_delegation_return(inode, ret, 0);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='ctx'>  * nfs4_inode_return_delegation_on_close - asynchronously return a delegation</div><div class='ctx'>  * @inode: inode to process</div><div class='ctx'>  *</div><div class='hunk'>@@ -784,7 +854,8 @@ void nfs4_inode_return_delegation_on_close(struct inode *inode)</div><div class='ctx'> 	if (!delegation)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	if (test_bit(NFS_DELEGATION_RETURN_IF_CLOSED, &amp;delegation-&gt;flags) ||</div><div class='del'>-	    atomic_long_read(&amp;nfs_active_delegations) &gt;= nfs_delegation_watermark) {</div><div class='add'>+	    atomic_long_read(&amp;NFS_SERVER(inode)-&gt;nr_active_delegations) &gt;=</div><div class='add'>+	    nfs_delegation_watermark) {</div><div class='ctx'> 		spin_lock(&amp;delegation-&gt;lock);</div><div class='ctx'> 		if (delegation-&gt;inode &amp;&amp;</div><div class='ctx'> 		    list_empty(&amp;NFS_I(inode)-&gt;open_files) &amp;&amp;</div><div class='hunk'>@@ -826,11 +897,25 @@ int nfs4_inode_make_writeable(struct inode *inode)</div><div class='ctx'> 	return nfs4_inode_return_delegation(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void nfs_mark_return_if_closed_delegation(struct nfs_server *server,</div><div class='del'>-		struct nfs_delegation *delegation)</div><div class='add'>+static void</div><div class='add'>+nfs_mark_return_if_closed_delegation(struct nfs_server *server,</div><div class='add'>+				     struct nfs_delegation *delegation)</div><div class='ctx'> {</div><div class='del'>-	set_bit(NFS_DELEGATION_RETURN_IF_CLOSED, &amp;delegation-&gt;flags);</div><div class='del'>-	set_bit(NFS4CLNT_DELEGRETURN, &amp;server-&gt;nfs_client-&gt;cl_state);</div><div class='add'>+	struct inode *inode;</div><div class='add'>+</div><div class='add'>+	if (test_bit(NFS_DELEGATION_RETURN, &amp;delegation-&gt;flags) ||</div><div class='add'>+	    test_bit(NFS_DELEGATION_RETURN_IF_CLOSED, &amp;delegation-&gt;flags))</div><div class='add'>+		return;</div><div class='add'>+	spin_lock(&amp;delegation-&gt;lock);</div><div class='add'>+	inode = delegation-&gt;inode;</div><div class='add'>+	if (!inode)</div><div class='add'>+		goto out;</div><div class='add'>+	if (list_empty(&amp;NFS_I(inode)-&gt;open_files))</div><div class='add'>+		nfs_mark_return_delegation(server, delegation);</div><div class='add'>+	else</div><div class='add'>+		set_bit(NFS_DELEGATION_RETURN_IF_CLOSED, &amp;delegation-&gt;flags);</div><div class='add'>+out:</div><div class='add'>+	spin_unlock(&amp;delegation-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool nfs_server_mark_return_all_delegations(struct nfs_server *server)</div><div class='hunk'>@@ -946,7 +1031,7 @@ static void nfs_revoke_delegation(struct inode *inode,</div><div class='ctx'> 		}</div><div class='ctx'> 		spin_unlock(&amp;delegation-&gt;lock);</div><div class='ctx'> 	}</div><div class='del'>-	nfs_mark_delegation_revoked(delegation);</div><div class='add'>+	nfs_mark_delegation_revoked(NFS_SERVER(inode), delegation);</div><div class='ctx'> 	ret = true;</div><div class='ctx'> out:</div><div class='ctx'> 	rcu_read_unlock();</div><div class='hunk'>@@ -954,13 +1039,6 @@ out:</div><div class='ctx'> 		nfs_inode_find_state_and_recover(inode, stateid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void nfs_remove_bad_delegation(struct inode *inode,</div><div class='del'>-		const nfs4_stateid *stateid)</div><div class='del'>-{</div><div class='del'>-	nfs_revoke_delegation(inode, stateid);</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL_GPL(nfs_remove_bad_delegation);</div><div class='del'>-</div><div class='ctx'> void nfs_delegation_mark_returned(struct inode *inode,</div><div class='ctx'> 		const nfs4_stateid *stateid)</div><div class='ctx'> {</div><div class='hunk'>@@ -985,7 +1063,12 @@ void nfs_delegation_mark_returned(struct inode *inode,</div><div class='ctx'> 			delegation-&gt;stateid.seqid = stateid-&gt;seqid;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	nfs_mark_delegation_revoked(delegation);</div><div class='add'>+	nfs_mark_delegation_revoked(NFS_SERVER(inode), delegation);</div><div class='add'>+	clear_bit(NFS_DELEGATION_RETURNING, &amp;delegation-&gt;flags);</div><div class='add'>+	spin_unlock(&amp;delegation-&gt;lock);</div><div class='add'>+	if (nfs_detach_delegation(NFS_I(inode), delegation, NFS_SERVER(inode)))</div><div class='add'>+		nfs_put_delegation(delegation);</div><div class='add'>+	goto out_rcu_unlock;</div><div class='ctx'> </div><div class='ctx'> out_clear_returning:</div><div class='ctx'> 	clear_bit(NFS_DELEGATION_RETURNING, &amp;delegation-&gt;flags);</div><div class='hunk'>@@ -998,6 +1081,24 @@ out_rcu_unlock:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='add'>+ * nfs_remove_bad_delegation - handle delegations that are unusable</div><div class='add'>+ * @inode: inode to process</div><div class='add'>+ * @stateid: the delegation's stateid</div><div class='add'>+ *</div><div class='add'>+ * If the server ACK-ed our FREE_STATEID then clean</div><div class='add'>+ * up the delegation, else mark and keep the revoked state.</div><div class='add'>+ */</div><div class='add'>+void nfs_remove_bad_delegation(struct inode *inode,</div><div class='add'>+		const nfs4_stateid *stateid)</div><div class='add'>+{</div><div class='add'>+	if (stateid &amp;&amp; stateid-&gt;type == NFS4_FREED_STATEID_TYPE)</div><div class='add'>+		nfs_delegation_mark_returned(inode, stateid);</div><div class='add'>+	else</div><div class='add'>+		nfs_revoke_delegation(inode, stateid);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(nfs_remove_bad_delegation);</div><div class='add'>+</div><div class='add'>+/**</div><div class='ctx'>  * nfs_expire_unused_delegation_types</div><div class='ctx'>  * @clp: client to process</div><div class='ctx'>  * @flags: delegation types to expire</div><div class='hunk'>@@ -1075,11 +1176,12 @@ static struct inode *</div><div class='ctx'> nfs_delegation_find_inode_server(struct nfs_server *server,</div><div class='ctx'> 				 const struct nfs_fh *fhandle)</div><div class='ctx'> {</div><div class='add'>+	struct hlist_head *head = nfs_delegation_hash(server, fhandle);</div><div class='ctx'> 	struct nfs_delegation *delegation;</div><div class='ctx'> 	struct super_block *freeme = NULL;</div><div class='ctx'> 	struct inode *res = NULL;</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry_rcu(delegation, &amp;server-&gt;delegations, super_list) {</div><div class='add'>+	hlist_for_each_entry_rcu(delegation, head, hash) {</div><div class='ctx'> 		spin_lock(&amp;delegation-&gt;lock);</div><div class='ctx'> 		if (delegation-&gt;inode != NULL &amp;&amp;</div><div class='ctx'> 		    !test_bit(NFS_DELEGATION_REVOKED, &amp;delegation-&gt;flags) &amp;&amp;</div><div class='hunk'>@@ -1166,7 +1268,6 @@ static int nfs_server_reap_unclaimed_delegations(struct nfs_server *server,</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> restart:</div><div class='ctx'> 	rcu_read_lock();</div><div class='del'>-restart_locked:</div><div class='ctx'> 	list_for_each_entry_rcu(delegation, &amp;server-&gt;delegations, super_list) {</div><div class='ctx'> 		if (test_bit(NFS_DELEGATION_INODE_FREEING,</div><div class='ctx'> 					&amp;delegation-&gt;flags) ||</div><div class='hunk'>@@ -1177,13 +1278,13 @@ restart_locked:</div><div class='ctx'> 			continue;</div><div class='ctx'> 		inode = nfs_delegation_grab_inode(delegation);</div><div class='ctx'> 		if (inode == NULL)</div><div class='del'>-			goto restart_locked;</div><div class='add'>+			continue;</div><div class='ctx'> 		delegation = nfs_start_delegation_return_locked(NFS_I(inode));</div><div class='ctx'> 		rcu_read_unlock();</div><div class='ctx'> 		if (delegation != NULL) {</div><div class='ctx'> 			if (nfs_detach_delegation(NFS_I(inode), delegation,</div><div class='ctx'> 						server) != NULL)</div><div class='del'>-				nfs_free_delegation(delegation);</div><div class='add'>+				nfs_free_delegation(server, delegation);</div><div class='ctx'> 			/* Match nfs_start_delegation_return_locked */</div><div class='ctx'> 			nfs_put_delegation(delegation);</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1220,6 +1321,7 @@ static void nfs_mark_test_expired_delegation(struct nfs_server *server,</div><div class='ctx'> 		return;</div><div class='ctx'> 	clear_bit(NFS_DELEGATION_NEED_RECLAIM, &amp;delegation-&gt;flags);</div><div class='ctx'> 	set_bit(NFS_DELEGATION_TEST_EXPIRED, &amp;delegation-&gt;flags);</div><div class='add'>+	set_bit(NFS4SERV_DELEGATION_EXPIRED, &amp;server-&gt;delegation_flags);</div><div class='ctx'> 	set_bit(NFS4CLNT_DELEGATION_EXPIRED, &amp;server-&gt;nfs_client-&gt;cl_state);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1296,24 +1398,30 @@ static int nfs_server_reap_expired_delegations(struct nfs_server *server,</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	const struct cred *cred;</div><div class='ctx'> 	nfs4_stateid stateid;</div><div class='add'>+	unsigned long gen = ++server-&gt;delegation_gen;</div><div class='add'>+</div><div class='add'>+	if (!test_and_clear_bit(NFS4SERV_DELEGATION_EXPIRED,</div><div class='add'>+				&amp;server-&gt;delegation_flags))</div><div class='add'>+		return 0;</div><div class='ctx'> restart:</div><div class='ctx'> 	rcu_read_lock();</div><div class='del'>-restart_locked:</div><div class='ctx'> 	list_for_each_entry_rcu(delegation, &amp;server-&gt;delegations, super_list) {</div><div class='ctx'> 		if (test_bit(NFS_DELEGATION_INODE_FREEING,</div><div class='ctx'> 					&amp;delegation-&gt;flags) ||</div><div class='ctx'> 		    test_bit(NFS_DELEGATION_RETURNING,</div><div class='ctx'> 					&amp;delegation-&gt;flags) ||</div><div class='ctx'> 		    test_bit(NFS_DELEGATION_TEST_EXPIRED,</div><div class='del'>-					&amp;delegation-&gt;flags) == 0)</div><div class='add'>+					&amp;delegation-&gt;flags) == 0 ||</div><div class='add'>+			delegation-&gt;test_gen == gen)</div><div class='ctx'> 			continue;</div><div class='ctx'> 		inode = nfs_delegation_grab_inode(delegation);</div><div class='ctx'> 		if (inode == NULL)</div><div class='del'>-			goto restart_locked;</div><div class='add'>+			continue;</div><div class='ctx'> 		spin_lock(&amp;delegation-&gt;lock);</div><div class='ctx'> 		cred = get_cred_rcu(delegation-&gt;cred);</div><div class='ctx'> 		nfs4_stateid_copy(&amp;stateid, &amp;delegation-&gt;stateid);</div><div class='ctx'> 		spin_unlock(&amp;delegation-&gt;lock);</div><div class='add'>+		delegation-&gt;test_gen = gen;</div><div class='ctx'> 		clear_bit(NFS_DELEGATION_TEST_EXPIRED, &amp;delegation-&gt;flags);</div><div class='ctx'> 		rcu_read_unlock();</div><div class='ctx'> 		nfs_delegation_test_free_expired(inode, &amp;stateid, cred);</div><div class='hunk'>@@ -1324,6 +1432,9 @@ restart_locked:</div><div class='ctx'> 			goto restart;</div><div class='ctx'> 		}</div><div class='ctx'> 		nfs_inode_mark_test_expired_delegation(server,inode);</div><div class='add'>+		set_bit(NFS4SERV_DELEGATION_EXPIRED, &amp;server-&gt;delegation_flags);</div><div class='add'>+		set_bit(NFS4CLNT_DELEGATION_EXPIRED,</div><div class='add'>+			&amp;server-&gt;nfs_client-&gt;cl_state);</div><div class='ctx'> 		iput(inode);</div><div class='ctx'> 		return -EAGAIN;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1478,4 +1589,17 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-module_param_named(delegation_watermark, nfs_delegation_watermark, uint, 0644);</div><div class='add'>+int nfs4_delegation_hash_alloc(struct nfs_server *server)</div><div class='add'>+{</div><div class='add'>+	int delegation_buckets, i;</div><div class='add'>+</div><div class='add'>+	delegation_buckets = roundup_pow_of_two(nfs_delegation_watermark / 16);</div><div class='add'>+	server-&gt;delegation_hash_mask = delegation_buckets - 1;</div><div class='add'>+	server-&gt;delegation_hash_table = kmalloc_array(delegation_buckets,</div><div class='add'>+			sizeof(*server-&gt;delegation_hash_table), GFP_KERNEL);</div><div class='add'>+	if (!server-&gt;delegation_hash_table)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	for (i = 0; i &lt; delegation_buckets; i++)</div><div class='add'>+		INIT_HLIST_HEAD(&amp;server-&gt;delegation_hash_table[i]);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/nfs/delegation.h b/fs/nfs/delegation.h<br/>index 1c378992b7c0..08ec2e9c68a4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/delegation.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/delegation.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/delegation.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/delegation.h</a></div><div class='hunk'>@@ -14,6 +14,7 @@</div><div class='ctx'>  * NFSv4 delegation</div><div class='ctx'>  */</div><div class='ctx'> struct nfs_delegation {</div><div class='add'>+	struct hlist_node hash;</div><div class='ctx'> 	struct list_head super_list;</div><div class='ctx'> 	const struct cred *cred;</div><div class='ctx'> 	struct inode *inode;</div><div class='hunk'>@@ -21,6 +22,7 @@ struct nfs_delegation {</div><div class='ctx'> 	fmode_t type;</div><div class='ctx'> 	unsigned long pagemod_limit;</div><div class='ctx'> 	__u64 change_attr;</div><div class='add'>+	unsigned long test_gen;</div><div class='ctx'> 	unsigned long flags;</div><div class='ctx'> 	refcount_t refcount;</div><div class='ctx'> 	spinlock_t lock;</div><div class='hunk'>@@ -37,14 +39,18 @@ enum {</div><div class='ctx'> 	NFS_DELEGATION_TEST_EXPIRED,</div><div class='ctx'> 	NFS_DELEGATION_INODE_FREEING,</div><div class='ctx'> 	NFS_DELEGATION_RETURN_DELAYED,</div><div class='add'>+	NFS_DELEGATION_DELEGTIME,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> int nfs_inode_set_delegation(struct inode *inode, const struct cred *cred,</div><div class='del'>-		fmode_t type, const nfs4_stateid *stateid, unsigned long pagemod_limit);</div><div class='add'>+			     fmode_t type, const nfs4_stateid *stateid,</div><div class='add'>+			     unsigned long pagemod_limit, u32 deleg_type);</div><div class='ctx'> void nfs_inode_reclaim_delegation(struct inode *inode, const struct cred *cred,</div><div class='del'>-		fmode_t type, const nfs4_stateid *stateid, unsigned long pagemod_limit);</div><div class='add'>+				  fmode_t type, const nfs4_stateid *stateid,</div><div class='add'>+				  unsigned long pagemod_limit, u32 deleg_type);</div><div class='ctx'> int nfs4_inode_return_delegation(struct inode *inode);</div><div class='ctx'> void nfs4_inode_return_delegation_on_close(struct inode *inode);</div><div class='add'>+void nfs4_inode_set_return_delegation_on_close(struct inode *inode);</div><div class='ctx'> int nfs_async_inode_return_delegation(struct inode *inode, const nfs4_stateid *stateid);</div><div class='ctx'> void nfs_inode_evict_delegation(struct inode *inode);</div><div class='ctx'> </div><div class='hunk'>@@ -66,7 +72,9 @@ void nfs_test_expired_all_delegations(struct nfs_client *clp);</div><div class='ctx'> void nfs_reap_expired_delegations(struct nfs_client *clp);</div><div class='ctx'> </div><div class='ctx'> /* NFSv4 delegation-related procedures */</div><div class='del'>-int nfs4_proc_delegreturn(struct inode *inode, const struct cred *cred, const nfs4_stateid *stateid, int issync);</div><div class='add'>+int nfs4_proc_delegreturn(struct inode *inode, const struct cred *cred,</div><div class='add'>+			  const nfs4_stateid *stateid,</div><div class='add'>+			  struct nfs_delegation *delegation, int issync);</div><div class='ctx'> int nfs4_open_delegation_recall(struct nfs_open_context *ctx, struct nfs4_state *state, const nfs4_stateid *stateid);</div><div class='ctx'> int nfs4_lock_delegation_recall(struct file_lock *fl, struct nfs4_state *state, const nfs4_stateid *stateid);</div><div class='ctx'> bool nfs4_copy_delegation_stateid(struct inode *inode, fmode_t flags, nfs4_stateid *dst, const struct cred **cred);</div><div class='hunk'>@@ -74,8 +82,8 @@ bool nfs4_refresh_delegation_stateid(nfs4_stateid *dst, struct inode *inode);</div><div class='ctx'> </div><div class='ctx'> struct nfs_delegation *nfs4_get_valid_delegation(const struct inode *inode);</div><div class='ctx'> void nfs_mark_delegation_referenced(struct nfs_delegation *delegation);</div><div class='del'>-int nfs4_have_delegation(struct inode *inode, fmode_t flags);</div><div class='del'>-int nfs4_check_delegation(struct inode *inode, fmode_t flags);</div><div class='add'>+int nfs4_have_delegation(struct inode *inode, fmode_t type, int flags);</div><div class='add'>+int nfs4_check_delegation(struct inode *inode, fmode_t type);</div><div class='ctx'> bool nfs4_delegation_flush_on_close(const struct inode *inode);</div><div class='ctx'> void nfs_inode_find_delegation_state_and_recover(struct inode *inode,</div><div class='ctx'> 		const nfs4_stateid *stateid);</div><div class='hunk'>@@ -83,9 +91,39 @@ int nfs4_inode_make_writeable(struct inode *inode);</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='add'>+#define NFS_DELEGATION_FLAG_TIME	BIT(1)</div><div class='add'>+</div><div class='add'>+void nfs_update_delegated_atime(struct inode *inode);</div><div class='add'>+void nfs_update_delegated_mtime(struct inode *inode);</div><div class='add'>+void nfs_update_delegated_mtime_locked(struct inode *inode);</div><div class='add'>+</div><div class='add'>+static inline int nfs_have_read_or_write_delegation(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	return NFS_PROTO(inode)-&gt;have_delegation(inode, FMODE_READ, 0);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int nfs_have_write_delegation(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	return NFS_PROTO(inode)-&gt;have_delegation(inode, FMODE_WRITE, 0);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline int nfs_have_delegated_attributes(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	return NFS_PROTO(inode)-&gt;have_delegation(inode, FMODE_READ);</div><div class='add'>+	return NFS_PROTO(inode)-&gt;have_delegation(inode, FMODE_READ, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline int nfs_have_delegated_atime(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	return NFS_PROTO(inode)-&gt;have_delegation(inode, FMODE_READ,</div><div class='add'>+						 NFS_DELEGATION_FLAG_TIME);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline int nfs_have_delegated_mtime(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	return NFS_PROTO(inode)-&gt;have_delegation(inode, FMODE_WRITE,</div><div class='add'>+						 NFS_DELEGATION_FLAG_TIME);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int nfs4_delegation_hash_alloc(struct nfs_server *server);</div><div class='add'>+</div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/nfs/dir.c b/fs/nfs/dir.c<br/>index 731d31015b6a..ea9f6ca8f30f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/dir.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/dir.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/dir.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/dir.c</a></div><div class='hunk'>@@ -18,6 +18,7 @@</div><div class='ctx'>  *  6 Jun 1999	Cache readdir lookups in the page cache. -DaveM</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/compat.h&gt;</div><div class='ctx'> #include &lt;linux/module.h&gt;</div><div class='ctx'> #include &lt;linux/time.h&gt;</div><div class='ctx'> #include &lt;linux/errno.h&gt;</div><div class='hunk'>@@ -38,6 +39,7 @@</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='ctx'> #include &lt;linux/kmemleak.h&gt;</div><div class='ctx'> #include &lt;linux/xattr.h&gt;</div><div class='add'>+#include &lt;linux/hash.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "delegation.h"</div><div class='ctx'> #include "iostat.h"</div><div class='hunk'>@@ -53,7 +55,9 @@ static int nfs_closedir(struct inode *, struct file *);</div><div class='ctx'> static int nfs_readdir(struct file *, struct dir_context *);</div><div class='ctx'> static int nfs_fsync_dir(struct file *, loff_t, loff_t, int);</div><div class='ctx'> static loff_t nfs_llseek_dir(struct file *, loff_t, int);</div><div class='del'>-static void nfs_readdir_clear_array(struct page*);</div><div class='add'>+static void nfs_readdir_clear_array(struct folio *);</div><div class='add'>+static int nfs_do_create(struct inode *dir, struct dentry *dentry,</div><div class='add'>+			 umode_t mode, int open_flags);</div><div class='ctx'> </div><div class='ctx'> const struct file_operations nfs_dir_operations = {</div><div class='ctx'> 	.llseek		= nfs_llseek_dir,</div><div class='hunk'>@@ -65,28 +69,29 @@ const struct file_operations nfs_dir_operations = {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations nfs_dir_aops = {</div><div class='del'>-	.freepage = nfs_readdir_clear_array,</div><div class='add'>+	.free_folio = nfs_readdir_clear_array,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static struct nfs_open_dir_context *alloc_nfs_open_dir_context(struct inode *dir)</div><div class='add'>+#define NFS_INIT_DTSIZE PAGE_SIZE</div><div class='add'>+</div><div class='add'>+static struct nfs_open_dir_context *</div><div class='add'>+alloc_nfs_open_dir_context(struct inode *dir)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_inode *nfsi = NFS_I(dir);</div><div class='ctx'> 	struct nfs_open_dir_context *ctx;</div><div class='del'>-	ctx = kmalloc(sizeof(*ctx), GFP_KERNEL);</div><div class='add'>+</div><div class='add'>+	ctx = kzalloc(sizeof(*ctx), GFP_KERNEL_ACCOUNT);</div><div class='ctx'> 	if (ctx != NULL) {</div><div class='del'>-		ctx-&gt;duped = 0;</div><div class='ctx'> 		ctx-&gt;attr_gencount = nfsi-&gt;attr_gencount;</div><div class='del'>-		ctx-&gt;dir_cookie = 0;</div><div class='del'>-		ctx-&gt;dup_cookie = 0;</div><div class='del'>-		ctx-&gt;page_index = 0;</div><div class='add'>+		ctx-&gt;dtsize = NFS_INIT_DTSIZE;</div><div class='ctx'> 		spin_lock(&amp;dir-&gt;i_lock);</div><div class='ctx'> 		if (list_empty(&amp;nfsi-&gt;open_files) &amp;&amp;</div><div class='ctx'> 		    (nfsi-&gt;cache_validity &amp; NFS_INO_DATA_INVAL_DEFER))</div><div class='ctx'> 			nfs_set_cache_invalid(dir,</div><div class='ctx'> 					      NFS_INO_INVALID_DATA |</div><div class='ctx'> 						      NFS_INO_REVAL_FORCED);</div><div class='del'>-		list_add(&amp;ctx-&gt;list, &amp;nfsi-&gt;open_files);</div><div class='del'>-		clear_bit(NFS_INO_FORCE_READDIR, &amp;nfsi-&gt;flags);</div><div class='add'>+		list_add_tail_rcu(&amp;ctx-&gt;list, &amp;nfsi-&gt;open_files);</div><div class='add'>+		memcpy(ctx-&gt;verf, nfsi-&gt;cookieverf, sizeof(ctx-&gt;verf));</div><div class='ctx'> 		spin_unlock(&amp;dir-&gt;i_lock);</div><div class='ctx'> 		return ctx;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -96,9 +101,9 @@ static struct nfs_open_dir_context *alloc_nfs_open_dir_context(struct inode *dir</div><div class='ctx'> static void put_nfs_open_dir_context(struct inode *dir, struct nfs_open_dir_context *ctx)</div><div class='ctx'> {</div><div class='ctx'> 	spin_lock(&amp;dir-&gt;i_lock);</div><div class='del'>-	list_del(&amp;ctx-&gt;list);</div><div class='add'>+	list_del_rcu(&amp;ctx-&gt;list);</div><div class='ctx'> 	spin_unlock(&amp;dir-&gt;i_lock);</div><div class='del'>-	kfree(ctx);</div><div class='add'>+	kfree_rcu(ctx, rcu_head);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -140,24 +145,24 @@ struct nfs_cache_array_entry {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct nfs_cache_array {</div><div class='add'>+	u64 change_attr;</div><div class='ctx'> 	u64 last_cookie;</div><div class='ctx'> 	unsigned int size;</div><div class='del'>-	unsigned char page_full : 1,</div><div class='del'>-		      page_is_eof : 1,</div><div class='add'>+	unsigned char folio_full : 1,</div><div class='add'>+		      folio_is_eof : 1,</div><div class='ctx'> 		      cookies_are_ordered : 1;</div><div class='del'>-	struct nfs_cache_array_entry array[];</div><div class='add'>+	struct nfs_cache_array_entry array[] __counted_by(size);</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct nfs_readdir_descriptor {</div><div class='ctx'> 	struct file	*file;</div><div class='del'>-	struct page	*page;</div><div class='add'>+	struct folio	*folio;</div><div class='ctx'> 	struct dir_context *ctx;</div><div class='del'>-	pgoff_t		page_index;</div><div class='add'>+	pgoff_t		folio_index;</div><div class='add'>+	pgoff_t		folio_index_max;</div><div class='ctx'> 	u64		dir_cookie;</div><div class='ctx'> 	u64		last_cookie;</div><div class='del'>-	u64		dup_cookie;</div><div class='ctx'> 	loff_t		current_index;</div><div class='del'>-	loff_t		prev_index;</div><div class='ctx'> </div><div class='ctx'> 	__be32		verf[NFS_DIR_VERIFIER_SIZE];</div><div class='ctx'> 	unsigned long	dir_verifier;</div><div class='hunk'>@@ -165,69 +170,104 @@ struct nfs_readdir_descriptor {</div><div class='ctx'> 	unsigned long	gencount;</div><div class='ctx'> 	unsigned long	attr_gencount;</div><div class='ctx'> 	unsigned int	cache_entry_index;</div><div class='del'>-	signed char duped;</div><div class='add'>+	unsigned int	buffer_fills;</div><div class='add'>+	unsigned int	dtsize;</div><div class='add'>+	bool clear_cache;</div><div class='ctx'> 	bool plus;</div><div class='add'>+	bool eob;</div><div class='ctx'> 	bool eof;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static void nfs_readdir_array_init(struct nfs_cache_array *array)</div><div class='add'>+static void nfs_set_dtsize(struct nfs_readdir_descriptor *desc, unsigned int sz)</div><div class='add'>+{</div><div class='add'>+	struct nfs_server *server = NFS_SERVER(file_inode(desc-&gt;file));</div><div class='add'>+	unsigned int maxsize = server-&gt;dtsize;</div><div class='add'>+</div><div class='add'>+	if (sz &gt; maxsize)</div><div class='add'>+		sz = maxsize;</div><div class='add'>+	if (sz &lt; NFS_MIN_FILE_IO_SIZE)</div><div class='add'>+		sz = NFS_MIN_FILE_IO_SIZE;</div><div class='add'>+	desc-&gt;dtsize = sz;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfs_shrink_dtsize(struct nfs_readdir_descriptor *desc)</div><div class='ctx'> {</div><div class='del'>-	memset(array, 0, sizeof(struct nfs_cache_array));</div><div class='add'>+	nfs_set_dtsize(desc, desc-&gt;dtsize &gt;&gt; 1);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void nfs_readdir_page_init_array(struct page *page, u64 last_cookie)</div><div class='add'>+static void nfs_grow_dtsize(struct nfs_readdir_descriptor *desc)</div><div class='add'>+{</div><div class='add'>+	nfs_set_dtsize(desc, desc-&gt;dtsize &lt;&lt; 1);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfs_readdir_folio_init_array(struct folio *folio, u64 last_cookie,</div><div class='add'>+					 u64 change_attr)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_cache_array *array;</div><div class='ctx'> </div><div class='del'>-	array = kmap_atomic(page);</div><div class='del'>-	nfs_readdir_array_init(array);</div><div class='add'>+	array = kmap_local_folio(folio, 0);</div><div class='add'>+	array-&gt;change_attr = change_attr;</div><div class='ctx'> 	array-&gt;last_cookie = last_cookie;</div><div class='add'>+	array-&gt;size = 0;</div><div class='add'>+	array-&gt;folio_full = 0;</div><div class='add'>+	array-&gt;folio_is_eof = 0;</div><div class='ctx'> 	array-&gt;cookies_are_ordered = 1;</div><div class='del'>-	kunmap_atomic(array);</div><div class='add'>+	kunmap_local(array);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * we are freeing strings created by nfs_add_to_readdir_array()</div><div class='ctx'>  */</div><div class='del'>-static</div><div class='del'>-void nfs_readdir_clear_array(struct page *page)</div><div class='add'>+static void nfs_readdir_clear_array(struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_cache_array *array;</div><div class='del'>-	int i;</div><div class='add'>+	unsigned int i;</div><div class='ctx'> </div><div class='del'>-	array = kmap_atomic(page);</div><div class='add'>+	array = kmap_local_folio(folio, 0);</div><div class='ctx'> 	for (i = 0; i &lt; array-&gt;size; i++)</div><div class='ctx'> 		kfree(array-&gt;array[i].name);</div><div class='del'>-	nfs_readdir_array_init(array);</div><div class='del'>-	kunmap_atomic(array);</div><div class='add'>+	array-&gt;size = 0;</div><div class='add'>+	kunmap_local(array);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct page *</div><div class='del'>-nfs_readdir_page_array_alloc(u64 last_cookie, gfp_t gfp_flags)</div><div class='add'>+static void nfs_readdir_folio_reinit_array(struct folio *folio, u64 last_cookie,</div><div class='add'>+					   u64 change_attr)</div><div class='ctx'> {</div><div class='del'>-	struct page *page = alloc_page(gfp_flags);</div><div class='del'>-	if (page)</div><div class='del'>-		nfs_readdir_page_init_array(page, last_cookie);</div><div class='del'>-	return page;</div><div class='add'>+	nfs_readdir_clear_array(folio);</div><div class='add'>+	nfs_readdir_folio_init_array(folio, last_cookie, change_attr);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void nfs_readdir_page_array_free(struct page *page)</div><div class='add'>+static struct folio *</div><div class='add'>+nfs_readdir_folio_array_alloc(u64 last_cookie, gfp_t gfp_flags)</div><div class='ctx'> {</div><div class='del'>-	if (page) {</div><div class='del'>-		nfs_readdir_clear_array(page);</div><div class='del'>-		put_page(page);</div><div class='add'>+	struct folio *folio = folio_alloc(gfp_flags, 0);</div><div class='add'>+	if (folio)</div><div class='add'>+		nfs_readdir_folio_init_array(folio, last_cookie, 0);</div><div class='add'>+	return folio;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfs_readdir_folio_array_free(struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	if (folio) {</div><div class='add'>+		nfs_readdir_clear_array(folio);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static u64 nfs_readdir_array_index_cookie(struct nfs_cache_array *array)</div><div class='add'>+{</div><div class='add'>+	return array-&gt;size == 0 ? array-&gt;last_cookie : array-&gt;array[0].cookie;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void nfs_readdir_array_set_eof(struct nfs_cache_array *array)</div><div class='ctx'> {</div><div class='del'>-	array-&gt;page_is_eof = 1;</div><div class='del'>-	array-&gt;page_full = 1;</div><div class='add'>+	array-&gt;folio_is_eof = 1;</div><div class='add'>+	array-&gt;folio_full = 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool nfs_readdir_array_is_full(struct nfs_cache_array *array)</div><div class='ctx'> {</div><div class='del'>-	return array-&gt;page_full;</div><div class='add'>+	return array-&gt;folio_full;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -248,44 +288,49 @@ static const char *nfs_readdir_copy_name(const char *name, unsigned int len)</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static size_t nfs_readdir_array_maxentries(void)</div><div class='add'>+{</div><div class='add'>+	return (PAGE_SIZE - sizeof(struct nfs_cache_array)) /</div><div class='add'>+	       sizeof(struct nfs_cache_array_entry);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Check that the next array entry lies entirely within the page bounds</div><div class='ctx'>  */</div><div class='ctx'> static int nfs_readdir_array_can_expand(struct nfs_cache_array *array)</div><div class='ctx'> {</div><div class='del'>-	struct nfs_cache_array_entry *cache_entry;</div><div class='del'>-</div><div class='del'>-	if (array-&gt;page_full)</div><div class='add'>+	if (array-&gt;folio_full)</div><div class='ctx'> 		return -ENOSPC;</div><div class='del'>-	cache_entry = &amp;array-&gt;array[array-&gt;size + 1];</div><div class='del'>-	if ((char *)cache_entry - (char *)array &gt; PAGE_SIZE) {</div><div class='del'>-		array-&gt;page_full = 1;</div><div class='add'>+	if (array-&gt;size == nfs_readdir_array_maxentries()) {</div><div class='add'>+		array-&gt;folio_full = 1;</div><div class='ctx'> 		return -ENOSPC;</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static</div><div class='del'>-int nfs_readdir_add_to_array(struct nfs_entry *entry, struct page *page)</div><div class='add'>+static int nfs_readdir_folio_array_append(struct folio *folio,</div><div class='add'>+					  const struct nfs_entry *entry,</div><div class='add'>+					  u64 *cookie)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_cache_array *array;</div><div class='ctx'> 	struct nfs_cache_array_entry *cache_entry;</div><div class='ctx'> 	const char *name;</div><div class='del'>-	int ret;</div><div class='add'>+	int ret = -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	name = nfs_readdir_copy_name(entry-&gt;name, entry-&gt;len);</div><div class='del'>-	if (!name)</div><div class='del'>-		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	array = kmap_atomic(page);</div><div class='add'>+	array = kmap_local_folio(folio, 0);</div><div class='add'>+	if (!name)</div><div class='add'>+		goto out;</div><div class='ctx'> 	ret = nfs_readdir_array_can_expand(array);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		kfree(name);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	cache_entry = &amp;array-&gt;array[array-&gt;size];</div><div class='del'>-	cache_entry-&gt;cookie = entry-&gt;prev_cookie;</div><div class='add'>+	array-&gt;size++;</div><div class='add'>+	cache_entry = &amp;array-&gt;array[array-&gt;size - 1];</div><div class='add'>+	cache_entry-&gt;cookie = array-&gt;last_cookie;</div><div class='ctx'> 	cache_entry-&gt;ino = entry-&gt;ino;</div><div class='ctx'> 	cache_entry-&gt;d_type = entry-&gt;d_type;</div><div class='ctx'> 	cache_entry-&gt;name_len = entry-&gt;len;</div><div class='hunk'>@@ -293,79 +338,124 @@ int nfs_readdir_add_to_array(struct nfs_entry *entry, struct page *page)</div><div class='ctx'> 	array-&gt;last_cookie = entry-&gt;cookie;</div><div class='ctx'> 	if (array-&gt;last_cookie &lt;= cache_entry-&gt;cookie)</div><div class='ctx'> 		array-&gt;cookies_are_ordered = 0;</div><div class='del'>-	array-&gt;size++;</div><div class='ctx'> 	if (entry-&gt;eof != 0)</div><div class='ctx'> 		nfs_readdir_array_set_eof(array);</div><div class='ctx'> out:</div><div class='del'>-	kunmap_atomic(array);</div><div class='add'>+	*cookie = array-&gt;last_cookie;</div><div class='add'>+	kunmap_local(array);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct page *nfs_readdir_page_get_locked(struct address_space *mapping,</div><div class='del'>-						pgoff_t index, u64 last_cookie)</div><div class='add'>+#define NFS_READDIR_COOKIE_MASK (U32_MAX &gt;&gt; 14)</div><div class='add'>+/*</div><div class='add'>+ * Hash algorithm allowing content addressible access to sequences</div><div class='add'>+ * of directory cookies. Content is addressed by the value of the</div><div class='add'>+ * cookie index of the first readdir entry in a page.</div><div class='add'>+ *</div><div class='add'>+ * We select only the first 18 bits to avoid issues with excessive</div><div class='add'>+ * memory use for the page cache XArray. 18 bits should allow the caching</div><div class='add'>+ * of 262144 pages of sequences of readdir entries. Since each page holds</div><div class='add'>+ * 127 readdir entries for a typical 64-bit system, that works out to a</div><div class='add'>+ * cache of ~ 33 million entries per directory.</div><div class='add'>+ */</div><div class='add'>+static pgoff_t nfs_readdir_folio_cookie_hash(u64 cookie)</div><div class='add'>+{</div><div class='add'>+	if (cookie == 0)</div><div class='add'>+		return 0;</div><div class='add'>+	return hash_64(cookie, 18);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool nfs_readdir_folio_validate(struct folio *folio, u64 last_cookie,</div><div class='add'>+				       u64 change_attr)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct nfs_cache_array *array = kmap_local_folio(folio, 0);</div><div class='add'>+	int ret = true;</div><div class='ctx'> </div><div class='del'>-	page = grab_cache_page(mapping, index);</div><div class='del'>-	if (page &amp;&amp; !PageUptodate(page)) {</div><div class='del'>-		nfs_readdir_page_init_array(page, last_cookie);</div><div class='del'>-		if (invalidate_inode_pages2_range(mapping, index + 1, -1) &lt; 0)</div><div class='del'>-			nfs_zap_mapping(mapping-&gt;host, mapping);</div><div class='del'>-		SetPageUptodate(page);</div><div class='add'>+	if (array-&gt;change_attr != change_attr)</div><div class='add'>+		ret = false;</div><div class='add'>+	if (nfs_readdir_array_index_cookie(array) != last_cookie)</div><div class='add'>+		ret = false;</div><div class='add'>+	kunmap_local(array);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfs_readdir_folio_unlock_and_put(struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfs_readdir_folio_init_and_validate(struct folio *folio, u64 cookie,</div><div class='add'>+						u64 change_attr)</div><div class='add'>+{</div><div class='add'>+	if (folio_test_uptodate(folio)) {</div><div class='add'>+		if (nfs_readdir_folio_validate(folio, cookie, change_attr))</div><div class='add'>+			return;</div><div class='add'>+		nfs_readdir_clear_array(folio);</div><div class='ctx'> 	}</div><div class='add'>+	nfs_readdir_folio_init_array(folio, cookie, change_attr);</div><div class='add'>+	folio_mark_uptodate(folio);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	return page;</div><div class='add'>+static struct folio *nfs_readdir_folio_get_locked(struct address_space *mapping,</div><div class='add'>+						  u64 cookie, u64 change_attr)</div><div class='add'>+{</div><div class='add'>+	pgoff_t index = nfs_readdir_folio_cookie_hash(cookie);</div><div class='add'>+	struct folio *folio;</div><div class='add'>+</div><div class='add'>+	folio = filemap_grab_folio(mapping, index);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return NULL;</div><div class='add'>+	nfs_readdir_folio_init_and_validate(folio, cookie, change_attr);</div><div class='add'>+	return folio;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static u64 nfs_readdir_page_last_cookie(struct page *page)</div><div class='add'>+static u64 nfs_readdir_folio_last_cookie(struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_cache_array *array;</div><div class='ctx'> 	u64 ret;</div><div class='ctx'> </div><div class='del'>-	array = kmap_atomic(page);</div><div class='add'>+	array = kmap_local_folio(folio, 0);</div><div class='ctx'> 	ret = array-&gt;last_cookie;</div><div class='del'>-	kunmap_atomic(array);</div><div class='add'>+	kunmap_local(array);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool nfs_readdir_page_needs_filling(struct page *page)</div><div class='add'>+static bool nfs_readdir_folio_needs_filling(struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_cache_array *array;</div><div class='ctx'> 	bool ret;</div><div class='ctx'> </div><div class='del'>-	array = kmap_atomic(page);</div><div class='add'>+	array = kmap_local_folio(folio, 0);</div><div class='ctx'> 	ret = !nfs_readdir_array_is_full(array);</div><div class='del'>-	kunmap_atomic(array);</div><div class='add'>+	kunmap_local(array);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void nfs_readdir_page_set_eof(struct page *page)</div><div class='add'>+static void nfs_readdir_folio_set_eof(struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_cache_array *array;</div><div class='ctx'> </div><div class='del'>-	array = kmap_atomic(page);</div><div class='add'>+	array = kmap_local_folio(folio, 0);</div><div class='ctx'> 	nfs_readdir_array_set_eof(array);</div><div class='del'>-	kunmap_atomic(array);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void nfs_readdir_page_unlock_and_put(struct page *page)</div><div class='del'>-{</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='add'>+	kunmap_local(array);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct page *nfs_readdir_page_get_next(struct address_space *mapping,</div><div class='del'>-					      pgoff_t index, u64 cookie)</div><div class='add'>+static struct folio *nfs_readdir_folio_get_next(struct address_space *mapping,</div><div class='add'>+						u64 cookie, u64 change_attr)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='add'>+	pgoff_t index = nfs_readdir_folio_cookie_hash(cookie);</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> </div><div class='del'>-	page = nfs_readdir_page_get_locked(mapping, index, cookie);</div><div class='del'>-	if (page) {</div><div class='del'>-		if (nfs_readdir_page_last_cookie(page) == cookie)</div><div class='del'>-			return page;</div><div class='del'>-		nfs_readdir_page_unlock_and_put(page);</div><div class='del'>-	}</div><div class='del'>-	return NULL;</div><div class='add'>+	folio = __filemap_get_folio(mapping, index,</div><div class='add'>+			FGP_LOCK|FGP_CREAT|FGP_NOFS|FGP_NOWAIT,</div><div class='add'>+			mapping_gfp_mask(mapping));</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return NULL;</div><div class='add'>+	nfs_readdir_folio_init_and_validate(folio, cookie, change_attr);</div><div class='add'>+	if (nfs_readdir_folio_last_cookie(folio) != cookie)</div><div class='add'>+		nfs_readdir_folio_reinit_array(folio, cookie, change_attr);</div><div class='add'>+	return folio;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline</div><div class='hunk'>@@ -387,6 +477,25 @@ bool nfs_readdir_use_cookie(const struct file *filp)</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void nfs_readdir_seek_next_array(struct nfs_cache_array *array,</div><div class='add'>+					struct nfs_readdir_descriptor *desc)</div><div class='add'>+{</div><div class='add'>+	if (array-&gt;folio_full) {</div><div class='add'>+		desc-&gt;last_cookie = array-&gt;last_cookie;</div><div class='add'>+		desc-&gt;current_index += array-&gt;size;</div><div class='add'>+		desc-&gt;cache_entry_index = 0;</div><div class='add'>+		desc-&gt;folio_index++;</div><div class='add'>+	} else</div><div class='add'>+		desc-&gt;last_cookie = nfs_readdir_array_index_cookie(array);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfs_readdir_rewind_search(struct nfs_readdir_descriptor *desc)</div><div class='add'>+{</div><div class='add'>+	desc-&gt;current_index = 0;</div><div class='add'>+	desc-&gt;last_cookie = 0;</div><div class='add'>+	desc-&gt;folio_index = 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int nfs_readdir_search_for_pos(struct nfs_cache_array *array,</div><div class='ctx'> 				      struct nfs_readdir_descriptor *desc)</div><div class='ctx'> {</div><div class='hunk'>@@ -396,8 +505,9 @@ static int nfs_readdir_search_for_pos(struct nfs_cache_array *array,</div><div class='ctx'> 	if (diff &lt; 0)</div><div class='ctx'> 		goto out_eof;</div><div class='ctx'> 	if (diff &gt;= array-&gt;size) {</div><div class='del'>-		if (array-&gt;page_is_eof)</div><div class='add'>+		if (array-&gt;folio_is_eof)</div><div class='ctx'> 			goto out_eof;</div><div class='add'>+		nfs_readdir_seek_next_array(array, desc);</div><div class='ctx'> 		return -EAGAIN;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -410,16 +520,6 @@ out_eof:</div><div class='ctx'> 	return -EBADCOOKIE;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool</div><div class='del'>-nfs_readdir_inode_mapping_valid(struct nfs_inode *nfsi)</div><div class='del'>-{</div><div class='del'>-	if (nfsi-&gt;cache_validity &amp; (NFS_INO_INVALID_CHANGE |</div><div class='del'>-				    NFS_INO_INVALID_DATA))</div><div class='del'>-		return false;</div><div class='del'>-	smp_rmb();</div><div class='del'>-	return !test_bit(NFS_INO_INVALIDATING, &amp;nfsi-&gt;flags);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static bool nfs_readdir_array_cookie_in_range(struct nfs_cache_array *array,</div><div class='ctx'> 					      u64 cookie)</div><div class='ctx'> {</div><div class='hunk'>@@ -436,8 +536,7 @@ static bool nfs_readdir_array_cookie_in_range(struct nfs_cache_array *array,</div><div class='ctx'> static int nfs_readdir_search_for_cookie(struct nfs_cache_array *array,</div><div class='ctx'> 					 struct nfs_readdir_descriptor *desc)</div><div class='ctx'> {</div><div class='del'>-	int i;</div><div class='del'>-	loff_t new_pos;</div><div class='add'>+	unsigned int i;</div><div class='ctx'> 	int status = -EAGAIN;</div><div class='ctx'> </div><div class='ctx'> 	if (!nfs_readdir_array_cookie_in_range(array, desc-&gt;dir_cookie))</div><div class='hunk'>@@ -445,44 +544,21 @@ static int nfs_readdir_search_for_cookie(struct nfs_cache_array *array,</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; array-&gt;size; i++) {</div><div class='ctx'> 		if (array-&gt;array[i].cookie == desc-&gt;dir_cookie) {</div><div class='del'>-			struct nfs_inode *nfsi = NFS_I(file_inode(desc-&gt;file));</div><div class='del'>-</div><div class='del'>-			new_pos = desc-&gt;current_index + i;</div><div class='del'>-			if (desc-&gt;attr_gencount != nfsi-&gt;attr_gencount ||</div><div class='del'>-			    !nfs_readdir_inode_mapping_valid(nfsi)) {</div><div class='del'>-				desc-&gt;duped = 0;</div><div class='del'>-				desc-&gt;attr_gencount = nfsi-&gt;attr_gencount;</div><div class='del'>-			} else if (new_pos &lt; desc-&gt;prev_index) {</div><div class='del'>-				if (desc-&gt;duped &gt; 0</div><div class='del'>-				    &amp;&amp; desc-&gt;dup_cookie == desc-&gt;dir_cookie) {</div><div class='del'>-					if (printk_ratelimit()) {</div><div class='del'>-						pr_notice("NFS: directory %pD2 contains a readdir loop."</div><div class='del'>-								"Please contact your server vendor.  "</div><div class='del'>-								"The file: %s has duplicate cookie %llu\n",</div><div class='del'>-								desc-&gt;file, array-&gt;array[i].name, desc-&gt;dir_cookie);</div><div class='del'>-					}</div><div class='del'>-					status = -ELOOP;</div><div class='del'>-					goto out;</div><div class='del'>-				}</div><div class='del'>-				desc-&gt;dup_cookie = desc-&gt;dir_cookie;</div><div class='del'>-				desc-&gt;duped = -1;</div><div class='del'>-			}</div><div class='ctx'> 			if (nfs_readdir_use_cookie(desc-&gt;file))</div><div class='ctx'> 				desc-&gt;ctx-&gt;pos = desc-&gt;dir_cookie;</div><div class='ctx'> 			else</div><div class='del'>-				desc-&gt;ctx-&gt;pos = new_pos;</div><div class='del'>-			desc-&gt;prev_index = new_pos;</div><div class='add'>+				desc-&gt;ctx-&gt;pos = desc-&gt;current_index + i;</div><div class='ctx'> 			desc-&gt;cache_entry_index = i;</div><div class='ctx'> 			return 0;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> check_eof:</div><div class='del'>-	if (array-&gt;page_is_eof) {</div><div class='add'>+	if (array-&gt;folio_is_eof) {</div><div class='ctx'> 		status = -EBADCOOKIE;</div><div class='ctx'> 		if (desc-&gt;dir_cookie == array-&gt;last_cookie)</div><div class='ctx'> 			desc-&gt;eof = true;</div><div class='del'>-	}</div><div class='del'>-out:</div><div class='add'>+	} else</div><div class='add'>+		nfs_readdir_seek_next_array(array, desc);</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -491,19 +567,14 @@ static int nfs_readdir_search_array(struct nfs_readdir_descriptor *desc)</div><div class='ctx'> 	struct nfs_cache_array *array;</div><div class='ctx'> 	int status;</div><div class='ctx'> </div><div class='del'>-	array = kmap_atomic(desc-&gt;page);</div><div class='add'>+	array = kmap_local_folio(desc-&gt;folio, 0);</div><div class='ctx'> </div><div class='ctx'> 	if (desc-&gt;dir_cookie == 0)</div><div class='ctx'> 		status = nfs_readdir_search_for_pos(array, desc);</div><div class='ctx'> 	else</div><div class='ctx'> 		status = nfs_readdir_search_for_cookie(array, desc);</div><div class='ctx'> </div><div class='del'>-	if (status == -EAGAIN) {</div><div class='del'>-		desc-&gt;last_cookie = array-&gt;last_cookie;</div><div class='del'>-		desc-&gt;current_index += array-&gt;size;</div><div class='del'>-		desc-&gt;page_index++;</div><div class='del'>-	}</div><div class='del'>-	kunmap_atomic(array);</div><div class='add'>+	kunmap_local(array);</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -538,7 +609,6 @@ static int nfs_readdir_xdr_filler(struct nfs_readdir_descriptor *desc,</div><div class='ctx'> 		/* We requested READDIRPLUS, but the server doesn't grok it */</div><div class='ctx'> 		if (error == -ENOTSUPP &amp;&amp; desc-&gt;plus) {</div><div class='ctx'> 			NFS_SERVER(inode)-&gt;caps &amp;= ~NFS_CAP_READDIRPLUS;</div><div class='del'>-			clear_bit(NFS_INO_ADVISE_RDPLUS, &amp;NFS_I(inode)-&gt;flags);</div><div class='ctx'> 			desc-&gt;plus = arg.plus = false;</div><div class='ctx'> 			goto again;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -588,51 +658,70 @@ int nfs_same_file(struct dentry *dentry, struct nfs_entry *entry)</div><div class='ctx'> 	return 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static</div><div class='del'>-bool nfs_use_readdirplus(struct inode *dir, struct dir_context *ctx)</div><div class='add'>+#define NFS_READDIR_CACHE_USAGE_THRESHOLD (8UL)</div><div class='add'>+</div><div class='add'>+static bool nfs_use_readdirplus(struct inode *dir, struct dir_context *ctx,</div><div class='add'>+				unsigned int cache_hits,</div><div class='add'>+				unsigned int cache_misses)</div><div class='ctx'> {</div><div class='ctx'> 	if (!nfs_server_capable(dir, NFS_CAP_READDIRPLUS))</div><div class='ctx'> 		return false;</div><div class='del'>-	if (test_and_clear_bit(NFS_INO_ADVISE_RDPLUS, &amp;NFS_I(dir)-&gt;flags))</div><div class='add'>+	if (NFS_SERVER(dir)-&gt;flags &amp; NFS_MOUNT_FORCE_RDIRPLUS)</div><div class='ctx'> 		return true;</div><div class='del'>-	if (ctx-&gt;pos == 0)</div><div class='add'>+	if (ctx-&gt;pos == 0 ||</div><div class='add'>+	    cache_hits + cache_misses &gt; NFS_READDIR_CACHE_USAGE_THRESHOLD)</div><div class='ctx'> 		return true;</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * This function is called by the lookup and getattr code to request the</div><div class='add'>+ * This function is called by the getattr code to request the</div><div class='ctx'>  * use of readdirplus to accelerate any future lookups in the same</div><div class='ctx'>  * directory.</div><div class='ctx'>  */</div><div class='del'>-void nfs_advise_use_readdirplus(struct inode *dir)</div><div class='add'>+void nfs_readdir_record_entry_cache_hit(struct inode *dir)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_inode *nfsi = NFS_I(dir);</div><div class='add'>+	struct nfs_open_dir_context *ctx;</div><div class='ctx'> </div><div class='ctx'> 	if (nfs_server_capable(dir, NFS_CAP_READDIRPLUS) &amp;&amp;</div><div class='del'>-	    !list_empty(&amp;nfsi-&gt;open_files))</div><div class='del'>-		set_bit(NFS_INO_ADVISE_RDPLUS, &amp;nfsi-&gt;flags);</div><div class='add'>+	    S_ISDIR(dir-&gt;i_mode)) {</div><div class='add'>+		rcu_read_lock();</div><div class='add'>+		list_for_each_entry_rcu (ctx, &amp;nfsi-&gt;open_files, list)</div><div class='add'>+			atomic_inc(&amp;ctx-&gt;cache_hits);</div><div class='add'>+		rcu_read_unlock();</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * This function is mainly for use by nfs_getattr().</div><div class='ctx'>  *</div><div class='ctx'>  * If this is an 'ls -l', we want to force use of readdirplus.</div><div class='del'>- * Do this by checking if there is an active file descriptor</div><div class='del'>- * and calling nfs_advise_use_readdirplus, then forcing a</div><div class='del'>- * cache flush.</div><div class='ctx'>  */</div><div class='del'>-void nfs_force_use_readdirplus(struct inode *dir)</div><div class='add'>+void nfs_readdir_record_entry_cache_miss(struct inode *dir)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_inode *nfsi = NFS_I(dir);</div><div class='add'>+	struct nfs_open_dir_context *ctx;</div><div class='ctx'> </div><div class='ctx'> 	if (nfs_server_capable(dir, NFS_CAP_READDIRPLUS) &amp;&amp;</div><div class='del'>-	    !list_empty(&amp;nfsi-&gt;open_files)) {</div><div class='del'>-		set_bit(NFS_INO_ADVISE_RDPLUS, &amp;nfsi-&gt;flags);</div><div class='del'>-		set_bit(NFS_INO_FORCE_READDIR, &amp;nfsi-&gt;flags);</div><div class='add'>+	    S_ISDIR(dir-&gt;i_mode)) {</div><div class='add'>+		rcu_read_lock();</div><div class='add'>+		list_for_each_entry_rcu (ctx, &amp;nfsi-&gt;open_files, list)</div><div class='add'>+			atomic_inc(&amp;ctx-&gt;cache_misses);</div><div class='add'>+		rcu_read_unlock();</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void nfs_lookup_advise_force_readdirplus(struct inode *dir,</div><div class='add'>+						unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	if (nfs_server_capable(dir, NFS_CAP_CASE_INSENSITIVE))</div><div class='add'>+		return;</div><div class='add'>+	if (flags &amp; (LOOKUP_EXCL | LOOKUP_PARENT | LOOKUP_REVAL))</div><div class='add'>+		return;</div><div class='add'>+	nfs_readdir_record_entry_cache_miss(dir);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static</div><div class='ctx'> void nfs_prime_dcache(struct dentry *parent, struct nfs_entry *entry,</div><div class='ctx'> 		unsigned long dir_verifier)</div><div class='hunk'>@@ -683,8 +772,12 @@ again:</div><div class='ctx'> 			status = nfs_refresh_inode(d_inode(dentry), entry-&gt;fattr);</div><div class='ctx'> 			if (!status)</div><div class='ctx'> 				nfs_setsecurity(d_inode(dentry), entry-&gt;fattr);</div><div class='add'>+			trace_nfs_readdir_lookup_revalidate(d_inode(parent),</div><div class='add'>+							    dentry, 0, status);</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		} else {</div><div class='add'>+			trace_nfs_readdir_lookup_revalidate_failed(</div><div class='add'>+				d_inode(parent), dentry, 0);</div><div class='ctx'> 			d_invalidate(dentry);</div><div class='ctx'> 			dput(dentry);</div><div class='ctx'> 			dentry = NULL;</div><div class='hunk'>@@ -706,86 +799,99 @@ again:</div><div class='ctx'> 		dentry = alias;</div><div class='ctx'> 	}</div><div class='ctx'> 	nfs_set_verifier(dentry, dir_verifier);</div><div class='add'>+	trace_nfs_readdir_lookup(d_inode(parent), dentry, 0);</div><div class='ctx'> out:</div><div class='ctx'> 	dput(dentry);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int nfs_readdir_entry_decode(struct nfs_readdir_descriptor *desc,</div><div class='add'>+				    struct nfs_entry *entry,</div><div class='add'>+				    struct xdr_stream *stream)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (entry-&gt;fattr-&gt;label)</div><div class='add'>+		entry-&gt;fattr-&gt;label-&gt;len = NFS4_MAXLABELLEN;</div><div class='add'>+	ret = xdr_decode(desc, entry, stream);</div><div class='add'>+	if (ret || !desc-&gt;plus)</div><div class='add'>+		return ret;</div><div class='add'>+	nfs_prime_dcache(file_dentry(desc-&gt;file), entry, desc-&gt;dir_verifier);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /* Perform conversion from xdr to cache array */</div><div class='del'>-static int nfs_readdir_page_filler(struct nfs_readdir_descriptor *desc,</div><div class='del'>-				   struct nfs_entry *entry,</div><div class='del'>-				   struct page **xdr_pages,</div><div class='del'>-				   unsigned int buflen,</div><div class='del'>-				   struct page **arrays,</div><div class='del'>-				   size_t narrays)</div><div class='add'>+static int nfs_readdir_folio_filler(struct nfs_readdir_descriptor *desc,</div><div class='add'>+				    struct nfs_entry *entry,</div><div class='add'>+				    struct page **xdr_pages, unsigned int buflen,</div><div class='add'>+				    struct folio **arrays, size_t narrays,</div><div class='add'>+				    u64 change_attr)</div><div class='ctx'> {</div><div class='ctx'> 	struct address_space *mapping = desc-&gt;file-&gt;f_mapping;</div><div class='add'>+	struct folio *new, *folio = *arrays;</div><div class='ctx'> 	struct xdr_stream stream;</div><div class='add'>+	struct folio *scratch;</div><div class='ctx'> 	struct xdr_buf buf;</div><div class='del'>-	struct page *scratch, *new, *page = *arrays;</div><div class='add'>+	u64 cookie;</div><div class='ctx'> 	int status;</div><div class='ctx'> </div><div class='del'>-	scratch = alloc_page(GFP_KERNEL);</div><div class='add'>+	scratch = folio_alloc(GFP_KERNEL, 0);</div><div class='ctx'> 	if (scratch == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	xdr_init_decode_pages(&amp;stream, &amp;buf, xdr_pages, buflen);</div><div class='del'>-	xdr_set_scratch_page(&amp;stream, scratch);</div><div class='add'>+	xdr_set_scratch_folio(&amp;stream, scratch);</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='del'>-		if (entry-&gt;fattr-&gt;label)</div><div class='del'>-			entry-&gt;fattr-&gt;label-&gt;len = NFS4_MAXLABELLEN;</div><div class='del'>-</div><div class='del'>-		status = xdr_decode(desc, entry, &amp;stream);</div><div class='add'>+		status = nfs_readdir_entry_decode(desc, entry, &amp;stream);</div><div class='ctx'> 		if (status != 0)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='del'>-		if (desc-&gt;plus)</div><div class='del'>-			nfs_prime_dcache(file_dentry(desc-&gt;file), entry,</div><div class='del'>-					desc-&gt;dir_verifier);</div><div class='del'>-</div><div class='del'>-		status = nfs_readdir_add_to_array(entry, page);</div><div class='add'>+		status = nfs_readdir_folio_array_append(folio, entry, &amp;cookie);</div><div class='ctx'> 		if (status != -ENOSPC)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='del'>-		if (page-&gt;mapping != mapping) {</div><div class='add'>+		if (folio-&gt;mapping != mapping) {</div><div class='ctx'> 			if (!--narrays)</div><div class='ctx'> 				break;</div><div class='del'>-			new = nfs_readdir_page_array_alloc(entry-&gt;prev_cookie,</div><div class='del'>-							   GFP_KERNEL);</div><div class='add'>+			new = nfs_readdir_folio_array_alloc(cookie, GFP_KERNEL);</div><div class='ctx'> 			if (!new)</div><div class='ctx'> 				break;</div><div class='ctx'> 			arrays++;</div><div class='del'>-			*arrays = page = new;</div><div class='add'>+			*arrays = folio = new;</div><div class='ctx'> 		} else {</div><div class='del'>-			new = nfs_readdir_page_get_next(mapping,</div><div class='del'>-							page-&gt;index + 1,</div><div class='del'>-							entry-&gt;prev_cookie);</div><div class='add'>+			new = nfs_readdir_folio_get_next(mapping, cookie,</div><div class='add'>+							 change_attr);</div><div class='ctx'> 			if (!new)</div><div class='ctx'> 				break;</div><div class='del'>-			if (page != *arrays)</div><div class='del'>-				nfs_readdir_page_unlock_and_put(page);</div><div class='del'>-			page = new;</div><div class='add'>+			if (folio != *arrays)</div><div class='add'>+				nfs_readdir_folio_unlock_and_put(folio);</div><div class='add'>+			folio = new;</div><div class='ctx'> 		}</div><div class='del'>-		status = nfs_readdir_add_to_array(entry, page);</div><div class='add'>+		desc-&gt;folio_index_max++;</div><div class='add'>+		status = nfs_readdir_folio_array_append(folio, entry, &amp;cookie);</div><div class='ctx'> 	} while (!status &amp;&amp; !entry-&gt;eof);</div><div class='ctx'> </div><div class='ctx'> 	switch (status) {</div><div class='ctx'> 	case -EBADCOOKIE:</div><div class='del'>-		if (entry-&gt;eof) {</div><div class='del'>-			nfs_readdir_page_set_eof(page);</div><div class='del'>-			status = 0;</div><div class='del'>-		}</div><div class='del'>-		break;</div><div class='del'>-	case -ENOSPC:</div><div class='add'>+		if (!entry-&gt;eof)</div><div class='add'>+			break;</div><div class='add'>+		nfs_readdir_folio_set_eof(folio);</div><div class='add'>+		fallthrough;</div><div class='ctx'> 	case -EAGAIN:</div><div class='ctx'> 		status = 0;</div><div class='ctx'> 		break;</div><div class='add'>+	case -ENOSPC:</div><div class='add'>+		status = 0;</div><div class='add'>+		if (!desc-&gt;plus)</div><div class='add'>+			break;</div><div class='add'>+		while (!nfs_readdir_entry_decode(desc, entry, &amp;stream))</div><div class='add'>+			;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (page != *arrays)</div><div class='del'>-		nfs_readdir_page_unlock_and_put(page);</div><div class='add'>+	if (folio != *arrays)</div><div class='add'>+		nfs_readdir_folio_unlock_and_put(folio);</div><div class='ctx'> </div><div class='del'>-	put_page(scratch);</div><div class='add'>+	folio_put(scratch);</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -823,20 +929,22 @@ out_freepages:</div><div class='ctx'> </div><div class='ctx'> static int nfs_readdir_xdr_to_array(struct nfs_readdir_descriptor *desc,</div><div class='ctx'> 				    __be32 *verf_arg, __be32 *verf_res,</div><div class='del'>-				    struct page **arrays, size_t narrays)</div><div class='add'>+				    struct folio **arrays, size_t narrays)</div><div class='ctx'> {</div><div class='add'>+	u64 change_attr;</div><div class='ctx'> 	struct page **pages;</div><div class='del'>-	struct page *page = *arrays;</div><div class='add'>+	struct folio *folio = *arrays;</div><div class='ctx'> 	struct nfs_entry *entry;</div><div class='ctx'> 	size_t array_size;</div><div class='ctx'> 	struct inode *inode = file_inode(desc-&gt;file);</div><div class='del'>-	size_t dtsize = NFS_SERVER(inode)-&gt;dtsize;</div><div class='add'>+	unsigned int dtsize = desc-&gt;dtsize;</div><div class='add'>+	unsigned int pglen;</div><div class='ctx'> 	int status = -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	entry = kzalloc(sizeof(*entry), GFP_KERNEL);</div><div class='ctx'> 	if (!entry)</div><div class='ctx'> 		return -ENOMEM;</div><div class='del'>-	entry-&gt;cookie = nfs_readdir_page_last_cookie(page);</div><div class='add'>+	entry-&gt;cookie = nfs_readdir_folio_last_cookie(folio);</div><div class='ctx'> 	entry-&gt;fh = nfs_alloc_fhandle();</div><div class='ctx'> 	entry-&gt;fattr = nfs_alloc_fattr_with_label(NFS_SERVER(inode));</div><div class='ctx'> 	entry-&gt;server = NFS_SERVER(inode);</div><div class='hunk'>@@ -848,26 +956,21 @@ static int nfs_readdir_xdr_to_array(struct nfs_readdir_descriptor *desc,</div><div class='ctx'> 	if (!pages)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	do {</div><div class='del'>-		unsigned int pglen;</div><div class='del'>-		status = nfs_readdir_xdr_filler(desc, verf_arg, entry-&gt;cookie,</div><div class='del'>-						pages, dtsize,</div><div class='del'>-						verf_res);</div><div class='del'>-		if (status &lt; 0)</div><div class='del'>-			break;</div><div class='del'>-</div><div class='del'>-		pglen = status;</div><div class='del'>-		if (pglen == 0) {</div><div class='del'>-			nfs_readdir_page_set_eof(page);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='add'>+	change_attr = inode_peek_iversion_raw(inode);</div><div class='add'>+	status = nfs_readdir_xdr_filler(desc, verf_arg, entry-&gt;cookie, pages,</div><div class='add'>+					dtsize, verf_res);</div><div class='add'>+	if (status &lt; 0)</div><div class='add'>+		goto free_pages;</div><div class='ctx'> </div><div class='del'>-		verf_arg = verf_res;</div><div class='del'>-</div><div class='del'>-		status = nfs_readdir_page_filler(desc, entry, pages, pglen,</div><div class='del'>-						 arrays, narrays);</div><div class='del'>-	} while (!status &amp;&amp; nfs_readdir_page_needs_filling(page));</div><div class='add'>+	pglen = status;</div><div class='add'>+	if (pglen != 0)</div><div class='add'>+		status = nfs_readdir_folio_filler(desc, entry, pages, pglen,</div><div class='add'>+						  arrays, narrays, change_attr);</div><div class='add'>+	else</div><div class='add'>+		nfs_readdir_folio_set_eof(folio);</div><div class='add'>+	desc-&gt;buffer_fills++;</div><div class='ctx'> </div><div class='add'>+free_pages:</div><div class='ctx'> 	nfs_readdir_free_pages(pages, array_size);</div><div class='ctx'> out:</div><div class='ctx'> 	nfs_free_fattr(entry-&gt;fattr);</div><div class='hunk'>@@ -876,25 +979,33 @@ out:</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void nfs_readdir_page_put(struct nfs_readdir_descriptor *desc)</div><div class='add'>+static void nfs_readdir_folio_put(struct nfs_readdir_descriptor *desc)</div><div class='ctx'> {</div><div class='del'>-	put_page(desc-&gt;page);</div><div class='del'>-	desc-&gt;page = NULL;</div><div class='add'>+	folio_put(desc-&gt;folio);</div><div class='add'>+	desc-&gt;folio = NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='del'>-nfs_readdir_page_unlock_and_put_cached(struct nfs_readdir_descriptor *desc)</div><div class='add'>+nfs_readdir_folio_unlock_and_put_cached(struct nfs_readdir_descriptor *desc)</div><div class='ctx'> {</div><div class='del'>-	unlock_page(desc-&gt;page);</div><div class='del'>-	nfs_readdir_page_put(desc);</div><div class='add'>+	folio_unlock(desc-&gt;folio);</div><div class='add'>+	nfs_readdir_folio_put(desc);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct page *</div><div class='del'>-nfs_readdir_page_get_cached(struct nfs_readdir_descriptor *desc)</div><div class='add'>+static struct folio *</div><div class='add'>+nfs_readdir_folio_get_cached(struct nfs_readdir_descriptor *desc)</div><div class='ctx'> {</div><div class='del'>-	return nfs_readdir_page_get_locked(desc-&gt;file-&gt;f_mapping,</div><div class='del'>-					   desc-&gt;page_index,</div><div class='del'>-					   desc-&gt;last_cookie);</div><div class='add'>+	struct address_space *mapping = desc-&gt;file-&gt;f_mapping;</div><div class='add'>+	u64 change_attr = inode_peek_iversion_raw(mapping-&gt;host);</div><div class='add'>+	u64 cookie = desc-&gt;last_cookie;</div><div class='add'>+	struct folio *folio;</div><div class='add'>+</div><div class='add'>+	folio = nfs_readdir_folio_get_locked(mapping, cookie, change_attr);</div><div class='add'>+	if (!folio)</div><div class='add'>+		return NULL;</div><div class='add'>+	if (desc-&gt;clear_cache &amp;&amp; !nfs_readdir_folio_needs_filling(folio))</div><div class='add'>+		nfs_readdir_folio_reinit_array(folio, cookie, change_attr);</div><div class='add'>+	return folio;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -908,17 +1019,27 @@ static int find_and_lock_cache_page(struct nfs_readdir_descriptor *desc)</div><div class='ctx'> 	__be32 verf[NFS_DIR_VERIFIER_SIZE];</div><div class='ctx'> 	int res;</div><div class='ctx'> </div><div class='del'>-	desc-&gt;page = nfs_readdir_page_get_cached(desc);</div><div class='del'>-	if (!desc-&gt;page)</div><div class='add'>+	desc-&gt;folio = nfs_readdir_folio_get_cached(desc);</div><div class='add'>+	if (!desc-&gt;folio)</div><div class='ctx'> 		return -ENOMEM;</div><div class='del'>-	if (nfs_readdir_page_needs_filling(desc-&gt;page)) {</div><div class='add'>+	if (nfs_readdir_folio_needs_filling(desc-&gt;folio)) {</div><div class='add'>+		/* Grow the dtsize if we had to go back for more pages */</div><div class='add'>+		if (desc-&gt;folio_index == desc-&gt;folio_index_max)</div><div class='add'>+			nfs_grow_dtsize(desc);</div><div class='add'>+		desc-&gt;folio_index_max = desc-&gt;folio_index;</div><div class='add'>+		trace_nfs_readdir_cache_fill(desc-&gt;file, nfsi-&gt;cookieverf,</div><div class='add'>+					     desc-&gt;last_cookie,</div><div class='add'>+					     desc-&gt;folio-&gt;index, desc-&gt;dtsize);</div><div class='ctx'> 		res = nfs_readdir_xdr_to_array(desc, nfsi-&gt;cookieverf, verf,</div><div class='del'>-					       &amp;desc-&gt;page, 1);</div><div class='add'>+					       &amp;desc-&gt;folio, 1);</div><div class='ctx'> 		if (res &lt; 0) {</div><div class='del'>-			nfs_readdir_page_unlock_and_put_cached(desc);</div><div class='add'>+			nfs_readdir_folio_unlock_and_put_cached(desc);</div><div class='add'>+			trace_nfs_readdir_cache_fill_done(inode, res);</div><div class='ctx'> 			if (res == -EBADCOOKIE || res == -ENOTSYNC) {</div><div class='ctx'> 				invalidate_inode_pages2(desc-&gt;file-&gt;f_mapping);</div><div class='del'>-				desc-&gt;page_index = 0;</div><div class='add'>+				nfs_readdir_rewind_search(desc);</div><div class='add'>+				trace_nfs_readdir_invalidate_cache_range(</div><div class='add'>+					inode, 0, MAX_LFS_FILESIZE);</div><div class='ctx'> 				return -EAGAIN;</div><div class='ctx'> 			}</div><div class='ctx'> 			return res;</div><div class='hunk'>@@ -926,50 +1047,37 @@ static int find_and_lock_cache_page(struct nfs_readdir_descriptor *desc)</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Set the cookie verifier if the page cache was empty</div><div class='ctx'> 		 */</div><div class='del'>-		if (desc-&gt;page_index == 0)</div><div class='add'>+		if (desc-&gt;last_cookie == 0 &amp;&amp;</div><div class='add'>+		    memcmp(nfsi-&gt;cookieverf, verf, sizeof(nfsi-&gt;cookieverf))) {</div><div class='ctx'> 			memcpy(nfsi-&gt;cookieverf, verf,</div><div class='ctx'> 			       sizeof(nfsi-&gt;cookieverf));</div><div class='add'>+			invalidate_inode_pages2_range(desc-&gt;file-&gt;f_mapping, 1,</div><div class='add'>+						      -1);</div><div class='add'>+			trace_nfs_readdir_invalidate_cache_range(</div><div class='add'>+				inode, 1, MAX_LFS_FILESIZE);</div><div class='add'>+		}</div><div class='add'>+		desc-&gt;clear_cache = false;</div><div class='ctx'> 	}</div><div class='ctx'> 	res = nfs_readdir_search_array(desc);</div><div class='ctx'> 	if (res == 0)</div><div class='ctx'> 		return 0;</div><div class='del'>-	nfs_readdir_page_unlock_and_put_cached(desc);</div><div class='add'>+	nfs_readdir_folio_unlock_and_put_cached(desc);</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool nfs_readdir_dont_search_cache(struct nfs_readdir_descriptor *desc)</div><div class='del'>-{</div><div class='del'>-	struct address_space *mapping = desc-&gt;file-&gt;f_mapping;</div><div class='del'>-	struct inode *dir = file_inode(desc-&gt;file);</div><div class='del'>-	unsigned int dtsize = NFS_SERVER(dir)-&gt;dtsize;</div><div class='del'>-	loff_t size = i_size_read(dir);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Default to uncached readdir if the page cache is empty, and</div><div class='del'>-	 * we're looking for a non-zero cookie in a large directory.</div><div class='del'>-	 */</div><div class='del'>-	return desc-&gt;dir_cookie != 0 &amp;&amp; mapping-&gt;nrpages == 0 &amp;&amp; size &gt; dtsize;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /* Search for desc-&gt;dir_cookie from the beginning of the page cache */</div><div class='ctx'> static int readdir_search_pagecache(struct nfs_readdir_descriptor *desc)</div><div class='ctx'> {</div><div class='ctx'> 	int res;</div><div class='ctx'> </div><div class='del'>-	if (nfs_readdir_dont_search_cache(desc))</div><div class='del'>-		return -EBADCOOKIE;</div><div class='del'>-</div><div class='ctx'> 	do {</div><div class='del'>-		if (desc-&gt;page_index == 0) {</div><div class='del'>-			desc-&gt;current_index = 0;</div><div class='del'>-			desc-&gt;prev_index = 0;</div><div class='del'>-			desc-&gt;last_cookie = 0;</div><div class='del'>-		}</div><div class='ctx'> 		res = find_and_lock_cache_page(desc);</div><div class='ctx'> 	} while (res == -EAGAIN);</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#define NFS_READDIR_CACHE_MISS_THRESHOLD (16UL)</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Once we've found the start of the dirent within a page: fill 'er up...</div><div class='ctx'>  */</div><div class='hunk'>@@ -978,34 +1086,47 @@ static void nfs_do_filldir(struct nfs_readdir_descriptor *desc,</div><div class='ctx'> {</div><div class='ctx'> 	struct file	*file = desc-&gt;file;</div><div class='ctx'> 	struct nfs_cache_array *array;</div><div class='del'>-	unsigned int i = 0;</div><div class='add'>+	unsigned int i;</div><div class='add'>+	bool first_emit = !desc-&gt;dir_cookie;</div><div class='ctx'> </div><div class='del'>-	array = kmap(desc-&gt;page);</div><div class='add'>+	array = kmap_local_folio(desc-&gt;folio, 0);</div><div class='ctx'> 	for (i = desc-&gt;cache_entry_index; i &lt; array-&gt;size; i++) {</div><div class='ctx'> 		struct nfs_cache_array_entry *ent;</div><div class='ctx'> </div><div class='add'>+		/*</div><div class='add'>+		 * nfs_readdir_handle_cache_misses return force clear at</div><div class='add'>+		 * (cache_misses &gt; NFS_READDIR_CACHE_MISS_THRESHOLD) for</div><div class='add'>+		 * readdir heuristic, NFS_READDIR_CACHE_MISS_THRESHOLD + 1</div><div class='add'>+		 * entries need be emitted here.</div><div class='add'>+		 */</div><div class='add'>+		if (first_emit &amp;&amp; i &gt; NFS_READDIR_CACHE_MISS_THRESHOLD + 2) {</div><div class='add'>+			desc-&gt;eob = true;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		ent = &amp;array-&gt;array[i];</div><div class='ctx'> 		if (!dir_emit(desc-&gt;ctx, ent-&gt;name, ent-&gt;name_len,</div><div class='ctx'> 		    nfs_compat_user_ino64(ent-&gt;ino), ent-&gt;d_type)) {</div><div class='del'>-			desc-&gt;eof = true;</div><div class='add'>+			desc-&gt;eob = true;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 		memcpy(desc-&gt;verf, verf, sizeof(desc-&gt;verf));</div><div class='del'>-		if (i &lt; (array-&gt;size-1))</div><div class='del'>-			desc-&gt;dir_cookie = array-&gt;array[i+1].cookie;</div><div class='del'>-		else</div><div class='add'>+		if (i == array-&gt;size - 1) {</div><div class='ctx'> 			desc-&gt;dir_cookie = array-&gt;last_cookie;</div><div class='add'>+			nfs_readdir_seek_next_array(array, desc);</div><div class='add'>+		} else {</div><div class='add'>+			desc-&gt;dir_cookie = array-&gt;array[i + 1].cookie;</div><div class='add'>+			desc-&gt;last_cookie = array-&gt;array[0].cookie;</div><div class='add'>+		}</div><div class='ctx'> 		if (nfs_readdir_use_cookie(file))</div><div class='ctx'> 			desc-&gt;ctx-&gt;pos = desc-&gt;dir_cookie;</div><div class='ctx'> 		else</div><div class='ctx'> 			desc-&gt;ctx-&gt;pos++;</div><div class='del'>-		if (desc-&gt;duped != 0)</div><div class='del'>-			desc-&gt;duped = 1;</div><div class='ctx'> 	}</div><div class='del'>-	if (array-&gt;page_is_eof)</div><div class='del'>-		desc-&gt;eof = true;</div><div class='add'>+	if (array-&gt;folio_is_eof)</div><div class='add'>+		desc-&gt;eof = !desc-&gt;eob;</div><div class='ctx'> </div><div class='del'>-	kunmap(desc-&gt;page);</div><div class='add'>+	kunmap_local(array);</div><div class='ctx'> 	dfprintk(DIRCACHE, "NFS: nfs_do_filldir() filling ended @ cookie %llu\n",</div><div class='ctx'> 			(unsigned long long)desc-&gt;dir_cookie);</div><div class='ctx'> }</div><div class='hunk'>@@ -1024,7 +1145,7 @@ static void nfs_do_filldir(struct nfs_readdir_descriptor *desc,</div><div class='ctx'>  */</div><div class='ctx'> static int uncached_readdir(struct nfs_readdir_descriptor *desc)</div><div class='ctx'> {</div><div class='del'>-	struct page	**arrays;</div><div class='add'>+	struct folio	**arrays;</div><div class='ctx'> 	size_t		i, sz = 512;</div><div class='ctx'> 	__be32		verf[NFS_DIR_VERIFIER_SIZE];</div><div class='ctx'> 	int		status = -ENOMEM;</div><div class='hunk'>@@ -1035,31 +1156,66 @@ static int uncached_readdir(struct nfs_readdir_descriptor *desc)</div><div class='ctx'> 	arrays = kcalloc(sz, sizeof(*arrays), GFP_KERNEL);</div><div class='ctx'> 	if (!arrays)</div><div class='ctx'> 		goto out;</div><div class='del'>-	arrays[0] = nfs_readdir_page_array_alloc(desc-&gt;dir_cookie, GFP_KERNEL);</div><div class='add'>+	arrays[0] = nfs_readdir_folio_array_alloc(desc-&gt;dir_cookie, GFP_KERNEL);</div><div class='ctx'> 	if (!arrays[0])</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	desc-&gt;page_index = 0;</div><div class='add'>+	desc-&gt;folio_index = 0;</div><div class='add'>+	desc-&gt;cache_entry_index = 0;</div><div class='ctx'> 	desc-&gt;last_cookie = desc-&gt;dir_cookie;</div><div class='del'>-	desc-&gt;duped = 0;</div><div class='add'>+	desc-&gt;folio_index_max = 0;</div><div class='add'>+</div><div class='add'>+	trace_nfs_readdir_uncached(desc-&gt;file, desc-&gt;verf, desc-&gt;last_cookie,</div><div class='add'>+				   -1, desc-&gt;dtsize);</div><div class='ctx'> </div><div class='ctx'> 	status = nfs_readdir_xdr_to_array(desc, desc-&gt;verf, verf, arrays, sz);</div><div class='add'>+	if (status &lt; 0) {</div><div class='add'>+		trace_nfs_readdir_uncached_done(file_inode(desc-&gt;file), status);</div><div class='add'>+		goto out_free;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	for (i = 0; !desc-&gt;eof &amp;&amp; i &lt; sz &amp;&amp; arrays[i]; i++) {</div><div class='del'>-		desc-&gt;page = arrays[i];</div><div class='add'>+	for (i = 0; !desc-&gt;eob &amp;&amp; i &lt; sz &amp;&amp; arrays[i]; i++) {</div><div class='add'>+		desc-&gt;folio = arrays[i];</div><div class='ctx'> 		nfs_do_filldir(desc, verf);</div><div class='ctx'> 	}</div><div class='del'>-	desc-&gt;page = NULL;</div><div class='del'>-</div><div class='add'>+	desc-&gt;folio = NULL;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Grow the dtsize if we have to go back for more pages,</div><div class='add'>+	 * or shrink it if we're reading too many.</div><div class='add'>+	 */</div><div class='add'>+	if (!desc-&gt;eof) {</div><div class='add'>+		if (!desc-&gt;eob)</div><div class='add'>+			nfs_grow_dtsize(desc);</div><div class='add'>+		else if (desc-&gt;buffer_fills == 1 &amp;&amp;</div><div class='add'>+			 i &lt; (desc-&gt;folio_index_max &gt;&gt; 1))</div><div class='add'>+			nfs_shrink_dtsize(desc);</div><div class='add'>+	}</div><div class='add'>+out_free:</div><div class='ctx'> 	for (i = 0; i &lt; sz &amp;&amp; arrays[i]; i++)</div><div class='del'>-		nfs_readdir_page_array_free(arrays[i]);</div><div class='add'>+		nfs_readdir_folio_array_free(arrays[i]);</div><div class='ctx'> out:</div><div class='add'>+	if (!nfs_readdir_use_cookie(desc-&gt;file))</div><div class='add'>+		nfs_readdir_rewind_search(desc);</div><div class='add'>+	desc-&gt;folio_index_max = -1;</div><div class='ctx'> 	kfree(arrays);</div><div class='ctx'> 	dfprintk(DIRCACHE, "NFS: %s: returns %d\n", __func__, status);</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool nfs_readdir_handle_cache_misses(struct inode *inode,</div><div class='add'>+					    struct nfs_readdir_descriptor *desc,</div><div class='add'>+					    unsigned int cache_misses,</div><div class='add'>+					    bool force_clear)</div><div class='add'>+{</div><div class='add'>+	if (desc-&gt;ctx-&gt;pos == 0 || !desc-&gt;plus)</div><div class='add'>+		return false;</div><div class='add'>+	if (cache_misses &lt;= NFS_READDIR_CACHE_MISS_THRESHOLD &amp;&amp; !force_clear)</div><div class='add'>+		return false;</div><div class='add'>+	trace_nfs_readdir_force_readdirplus(inode);</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /* The file offset position represents the dirent entry number.  A</div><div class='ctx'>    last cookie cache takes care of the common case of reading the</div><div class='ctx'>    whole directory.</div><div class='hunk'>@@ -1071,7 +1227,8 @@ static int nfs_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 	struct nfs_inode *nfsi = NFS_I(inode);</div><div class='ctx'> 	struct nfs_open_dir_context *dir_ctx = file-&gt;private_data;</div><div class='ctx'> 	struct nfs_readdir_descriptor *desc;</div><div class='del'>-	pgoff_t page_index;</div><div class='add'>+	unsigned int cache_hits, cache_misses;</div><div class='add'>+	bool force_clear;</div><div class='ctx'> 	int res;</div><div class='ctx'> </div><div class='ctx'> 	dfprintk(FILE, "NFS: readdir(%pD2) starting at cookie %llu\n",</div><div class='hunk'>@@ -1084,11 +1241,7 @@ static int nfs_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 	 * to either find the entry with the appropriate number or</div><div class='ctx'> 	 * revalidate the cookie.</div><div class='ctx'> 	 */</div><div class='del'>-	if (ctx-&gt;pos == 0 || nfs_attribute_cache_expired(inode)) {</div><div class='del'>-		res = nfs_revalidate_mapping(inode, file-&gt;f_mapping);</div><div class='del'>-		if (res &lt; 0)</div><div class='del'>-			goto out;</div><div class='del'>-	}</div><div class='add'>+	nfs_revalidate_mapping(inode, file-&gt;f_mapping);</div><div class='ctx'> </div><div class='ctx'> 	res = -ENOMEM;</div><div class='ctx'> 	desc = kzalloc(sizeof(*desc), GFP_KERNEL);</div><div class='hunk'>@@ -1096,20 +1249,30 @@ static int nfs_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	desc-&gt;file = file;</div><div class='ctx'> 	desc-&gt;ctx = ctx;</div><div class='del'>-	desc-&gt;plus = nfs_use_readdirplus(inode, ctx);</div><div class='add'>+	desc-&gt;folio_index_max = -1;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;file-&gt;f_lock);</div><div class='ctx'> 	desc-&gt;dir_cookie = dir_ctx-&gt;dir_cookie;</div><div class='del'>-	desc-&gt;dup_cookie = dir_ctx-&gt;dup_cookie;</div><div class='del'>-	desc-&gt;duped = dir_ctx-&gt;duped;</div><div class='del'>-	page_index = dir_ctx-&gt;page_index;</div><div class='add'>+	desc-&gt;folio_index = dir_ctx-&gt;page_index;</div><div class='add'>+	desc-&gt;last_cookie = dir_ctx-&gt;last_cookie;</div><div class='ctx'> 	desc-&gt;attr_gencount = dir_ctx-&gt;attr_gencount;</div><div class='add'>+	desc-&gt;eof = dir_ctx-&gt;eof;</div><div class='add'>+	nfs_set_dtsize(desc, dir_ctx-&gt;dtsize);</div><div class='ctx'> 	memcpy(desc-&gt;verf, dir_ctx-&gt;verf, sizeof(desc-&gt;verf));</div><div class='add'>+	cache_hits = atomic_xchg(&amp;dir_ctx-&gt;cache_hits, 0);</div><div class='add'>+	cache_misses = atomic_xchg(&amp;dir_ctx-&gt;cache_misses, 0);</div><div class='add'>+	force_clear = dir_ctx-&gt;force_clear;</div><div class='ctx'> 	spin_unlock(&amp;file-&gt;f_lock);</div><div class='ctx'> </div><div class='del'>-	if (test_and_clear_bit(NFS_INO_FORCE_READDIR, &amp;nfsi-&gt;flags) &amp;&amp;</div><div class='del'>-	    list_is_singular(&amp;nfsi-&gt;open_files))</div><div class='del'>-		invalidate_mapping_pages(inode-&gt;i_mapping, page_index + 1, -1);</div><div class='add'>+	if (desc-&gt;eof) {</div><div class='add'>+		res = 0;</div><div class='add'>+		goto out_free;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	desc-&gt;plus = nfs_use_readdirplus(inode, ctx, cache_hits, cache_misses);</div><div class='add'>+	force_clear = nfs_readdir_handle_cache_misses(inode, desc, cache_misses,</div><div class='add'>+						      force_clear);</div><div class='add'>+	desc-&gt;clear_cache = force_clear;</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='ctx'> 		res = readdir_search_pagecache(desc);</div><div class='hunk'>@@ -1128,9 +1291,7 @@ static int nfs_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (res == -ETOOSMALL &amp;&amp; desc-&gt;plus) {</div><div class='del'>-			clear_bit(NFS_INO_ADVISE_RDPLUS, &amp;nfsi-&gt;flags);</div><div class='ctx'> 			nfs_zap_caches(inode);</div><div class='del'>-			desc-&gt;page_index = 0;</div><div class='ctx'> 			desc-&gt;plus = false;</div><div class='ctx'> 			desc-&gt;eof = false;</div><div class='ctx'> 			continue;</div><div class='hunk'>@@ -1139,18 +1300,22 @@ static int nfs_readdir(struct file *file, struct dir_context *ctx)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='ctx'> 		nfs_do_filldir(desc, nfsi-&gt;cookieverf);</div><div class='del'>-		nfs_readdir_page_unlock_and_put_cached(desc);</div><div class='del'>-	} while (!desc-&gt;eof);</div><div class='add'>+		nfs_readdir_folio_unlock_and_put_cached(desc);</div><div class='add'>+		if (desc-&gt;folio_index == desc-&gt;folio_index_max)</div><div class='add'>+			desc-&gt;clear_cache = force_clear;</div><div class='add'>+	} while (!desc-&gt;eob &amp;&amp; !desc-&gt;eof);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;file-&gt;f_lock);</div><div class='ctx'> 	dir_ctx-&gt;dir_cookie = desc-&gt;dir_cookie;</div><div class='del'>-	dir_ctx-&gt;dup_cookie = desc-&gt;dup_cookie;</div><div class='del'>-	dir_ctx-&gt;duped = desc-&gt;duped;</div><div class='add'>+	dir_ctx-&gt;last_cookie = desc-&gt;last_cookie;</div><div class='ctx'> 	dir_ctx-&gt;attr_gencount = desc-&gt;attr_gencount;</div><div class='del'>-	dir_ctx-&gt;page_index = desc-&gt;page_index;</div><div class='add'>+	dir_ctx-&gt;page_index = desc-&gt;folio_index;</div><div class='add'>+	dir_ctx-&gt;force_clear = force_clear;</div><div class='add'>+	dir_ctx-&gt;eof = desc-&gt;eof;</div><div class='add'>+	dir_ctx-&gt;dtsize = desc-&gt;dtsize;</div><div class='ctx'> 	memcpy(dir_ctx-&gt;verf, desc-&gt;verf, sizeof(dir_ctx-&gt;verf));</div><div class='ctx'> 	spin_unlock(&amp;file-&gt;f_lock);</div><div class='del'>-</div><div class='add'>+out_free:</div><div class='ctx'> 	kfree(desc);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='hunk'>@@ -1185,13 +1350,15 @@ static loff_t nfs_llseek_dir(struct file *filp, loff_t offset, int whence)</div><div class='ctx'> 	}</div><div class='ctx'> 	if (offset != filp-&gt;f_pos) {</div><div class='ctx'> 		filp-&gt;f_pos = offset;</div><div class='del'>-		if (nfs_readdir_use_cookie(filp))</div><div class='del'>-			dir_ctx-&gt;dir_cookie = offset;</div><div class='del'>-		else</div><div class='add'>+		dir_ctx-&gt;page_index = 0;</div><div class='add'>+		if (!nfs_readdir_use_cookie(filp)) {</div><div class='ctx'> 			dir_ctx-&gt;dir_cookie = 0;</div><div class='del'>-		if (offset == 0)</div><div class='del'>-			memset(dir_ctx-&gt;verf, 0, sizeof(dir_ctx-&gt;verf));</div><div class='del'>-		dir_ctx-&gt;duped = 0;</div><div class='add'>+			dir_ctx-&gt;last_cookie = 0;</div><div class='add'>+		} else {</div><div class='add'>+			dir_ctx-&gt;dir_cookie = offset;</div><div class='add'>+			dir_ctx-&gt;last_cookie = offset;</div><div class='add'>+		}</div><div class='add'>+		dir_ctx-&gt;eof = false;</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;filp-&gt;f_lock);</div><div class='ctx'> 	return offset;</div><div class='hunk'>@@ -1268,11 +1435,11 @@ static bool nfs_verifier_is_delegated(struct dentry *dentry)</div><div class='ctx'> static void nfs_set_verifier_locked(struct dentry *dentry, unsigned long verf)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='del'>-	struct inode *dir = d_inode(dentry-&gt;d_parent);</div><div class='add'>+	struct inode *dir = d_inode_rcu(dentry-&gt;d_parent);</div><div class='ctx'> </div><div class='del'>-	if (!nfs_verify_change_attribute(dir, verf))</div><div class='add'>+	if (!dir || !nfs_verify_change_attribute(dir, verf))</div><div class='ctx'> 		return;</div><div class='del'>-	if (inode &amp;&amp; NFS_PROTO(inode)-&gt;have_delegation(inode, FMODE_READ))</div><div class='add'>+	if (inode &amp;&amp; NFS_PROTO(inode)-&gt;have_delegation(inode, FMODE_READ, 0))</div><div class='ctx'> 		nfs_set_verifier_delegated(&amp;verf);</div><div class='ctx'> 	dentry-&gt;d_time = verf;</div><div class='ctx'> }</div><div class='hunk'>@@ -1324,6 +1491,14 @@ void nfs_clear_verifier_delegated(struct inode *inode)</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_clear_verifier_delegated);</div><div class='ctx'> #endif /* IS_ENABLED(CONFIG_NFS_V4) */</div><div class='ctx'> </div><div class='add'>+static int nfs_dentry_verify_change(struct inode *dir, struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	if (nfs_server_capable(dir, NFS_CAP_CASE_INSENSITIVE) &amp;&amp;</div><div class='add'>+	    d_really_is_negative(dentry))</div><div class='add'>+		return dentry-&gt;d_time == inode_peek_iversion_raw(dir);</div><div class='add'>+	return nfs_verify_change_attribute(dir, dentry-&gt;d_time);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * A check for whether or not the parent directory has changed.</div><div class='ctx'>  * In the case it has, we assume that the dentries are untrustworthy</div><div class='hunk'>@@ -1337,7 +1512,7 @@ static int nfs_check_verifier(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 		return 1;</div><div class='ctx'> 	if (NFS_SERVER(dir)-&gt;flags &amp; NFS_MOUNT_LOOKUP_CACHE_NONE)</div><div class='ctx'> 		return 0;</div><div class='del'>-	if (!nfs_verify_change_attribute(dir, dentry-&gt;d_time))</div><div class='add'>+	if (!nfs_dentry_verify_change(dir, dentry))</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	/* Revalidate nfsi-&gt;cache_change_attribute before we declare a match */</div><div class='ctx'> 	if (nfs_mapping_need_revalidate_inode(dir)) {</div><div class='hunk'>@@ -1346,7 +1521,7 @@ static int nfs_check_verifier(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 		if (__nfs_revalidate_inode(NFS_SERVER(dir), dir) &lt; 0)</div><div class='ctx'> 			return 0;</div><div class='ctx'> 	}</div><div class='del'>-	if (!nfs_verify_change_attribute(dir, dentry-&gt;d_time))</div><div class='add'>+	if (!nfs_dentry_verify_change(dir, dentry))</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	return 1;</div><div class='ctx'> }</div><div class='hunk'>@@ -1359,7 +1534,8 @@ static int nfs_is_exclusive_create(struct inode *dir, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	if (NFS_PROTO(dir)-&gt;version == 2)</div><div class='ctx'> 		return 0;</div><div class='del'>-	return flags &amp; LOOKUP_EXCL;</div><div class='add'>+	return (flags &amp; (LOOKUP_CREATE | LOOKUP_EXCL)) ==</div><div class='add'>+		(LOOKUP_CREATE | LOOKUP_EXCL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1398,7 +1574,12 @@ int nfs_lookup_verify_inode(struct inode *inode, unsigned int flags)</div><div class='ctx'> 	if (flags &amp; LOOKUP_REVAL)</div><div class='ctx'> 		goto out_force;</div><div class='ctx'> out:</div><div class='del'>-	return (inode-&gt;i_nlink == 0) ? -ESTALE : 0;</div><div class='add'>+	if (inode-&gt;i_nlink &gt; 0 ||</div><div class='add'>+	    (inode-&gt;i_nlink == 0 &amp;&amp;</div><div class='add'>+	     test_bit(NFS_INO_PRESERVE_UNLINKED, &amp;NFS_I(inode)-&gt;flags)))</div><div class='add'>+		return 0;</div><div class='add'>+	else</div><div class='add'>+		return -ESTALE;</div><div class='ctx'> out_force:</div><div class='ctx'> 	if (flags &amp; LOOKUP_RCU)</div><div class='ctx'> 		return -ECHILD;</div><div class='hunk'>@@ -1436,6 +1617,9 @@ int nfs_neg_need_reval(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	if (NFS_SERVER(dir)-&gt;flags &amp; NFS_MOUNT_LOOKUP_CACHE_NONEG)</div><div class='ctx'> 		return 1;</div><div class='add'>+	/* Case insensitive server? Revalidate negative dentries */</div><div class='add'>+	if (nfs_server_capable(dir, NFS_CAP_CASE_INSENSITIVE))</div><div class='add'>+		return 1;</div><div class='ctx'> 	return !nfs_check_verifier(dir, dentry, flags &amp; LOOKUP_RCU);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1445,10 +1629,17 @@ nfs_lookup_revalidate_done(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> {</div><div class='ctx'> 	switch (error) {</div><div class='ctx'> 	case 1:</div><div class='del'>-		dfprintk(LOOKUPCACHE, "NFS: %s(%pd2) is valid\n",</div><div class='del'>-			__func__, dentry);</div><div class='del'>-		return 1;</div><div class='del'>-	case 0:</div><div class='add'>+		break;</div><div class='add'>+	case -ETIMEDOUT:</div><div class='add'>+		if (inode &amp;&amp; (IS_ROOT(dentry) ||</div><div class='add'>+			      NFS_SERVER(inode)-&gt;flags &amp; NFS_MOUNT_SOFTREVAL))</div><div class='add'>+			error = 1;</div><div class='add'>+		break;</div><div class='add'>+	case -ESTALE:</div><div class='add'>+	case -ENOENT:</div><div class='add'>+		error = 0;</div><div class='add'>+		fallthrough;</div><div class='add'>+	default:</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We can't d_drop the root of a disconnected tree:</div><div class='ctx'> 		 * its d_hash is on the s_anon list and d_drop() would hide</div><div class='hunk'>@@ -1456,13 +1647,10 @@ nfs_lookup_revalidate_done(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 		 * inodes on unmount and further oopses.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (inode &amp;&amp; IS_ROOT(dentry))</div><div class='del'>-			return 1;</div><div class='del'>-		dfprintk(LOOKUPCACHE, "NFS: %s(%pd2) is invalid\n",</div><div class='del'>-				__func__, dentry);</div><div class='del'>-		return 0;</div><div class='add'>+			error = 1;</div><div class='add'>+		break;</div><div class='ctx'> 	}</div><div class='del'>-	dfprintk(LOOKUPCACHE, "NFS: %s(%pd2) lookup returned error %d\n",</div><div class='del'>-				__func__, dentry, error);</div><div class='add'>+	trace_nfs_lookup_revalidate_exit(dir, dentry, 0, error);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1487,15 +1675,17 @@ nfs_lookup_revalidate_delegated(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	return nfs_lookup_revalidate_done(dir, dentry, inode, 1);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int</div><div class='del'>-nfs_lookup_revalidate_dentry(struct inode *dir, struct dentry *dentry,</div><div class='del'>-			     struct inode *inode)</div><div class='add'>+static int nfs_lookup_revalidate_dentry(struct inode *dir, const struct qstr *name,</div><div class='add'>+					struct dentry *dentry,</div><div class='add'>+					struct inode *inode, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_fh *fhandle;</div><div class='ctx'> 	struct nfs_fattr *fattr;</div><div class='ctx'> 	unsigned long dir_verifier;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='add'>+	trace_nfs_lookup_revalidate_enter(dir, dentry, flags);</div><div class='add'>+</div><div class='ctx'> 	ret = -ENOMEM;</div><div class='ctx'> 	fhandle = nfs_alloc_fhandle();</div><div class='ctx'> 	fattr = nfs_alloc_fattr_with_label(NFS_SERVER(inode));</div><div class='hunk'>@@ -1503,19 +1693,13 @@ nfs_lookup_revalidate_dentry(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	dir_verifier = nfs_save_change_attribute(dir);</div><div class='del'>-	ret = NFS_PROTO(dir)-&gt;lookup(dir, dentry, fhandle, fattr);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='del'>-		switch (ret) {</div><div class='del'>-		case -ESTALE:</div><div class='del'>-		case -ENOENT:</div><div class='del'>-			ret = 0;</div><div class='del'>-			break;</div><div class='del'>-		case -ETIMEDOUT:</div><div class='del'>-			if (NFS_SERVER(inode)-&gt;flags &amp; NFS_MOUNT_SOFTREVAL)</div><div class='del'>-				ret = 1;</div><div class='del'>-		}</div><div class='add'>+	ret = NFS_PROTO(dir)-&gt;lookup(dir, dentry, name, fhandle, fattr);</div><div class='add'>+	if (ret &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='del'>-	}</div><div class='add'>+</div><div class='add'>+	/* Request help from readdirplus */</div><div class='add'>+	nfs_lookup_advise_force_readdirplus(dir, flags);</div><div class='add'>+</div><div class='ctx'> 	ret = 0;</div><div class='ctx'> 	if (nfs_compare_fh(NFS_FH(inode), fhandle))</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -1525,8 +1709,6 @@ nfs_lookup_revalidate_dentry(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	nfs_setsecurity(inode, fattr);</div><div class='ctx'> 	nfs_set_verifier(dentry, dir_verifier);</div><div class='ctx'> </div><div class='del'>-	/* set a readdirplus hint that we had a cache miss */</div><div class='del'>-	nfs_force_use_readdirplus(dir);</div><div class='ctx'> 	ret = 1;</div><div class='ctx'> out:</div><div class='ctx'> 	nfs_free_fattr(fattr);</div><div class='hunk'>@@ -1536,7 +1718,7 @@ out:</div><div class='ctx'> 	 * If the lookup failed despite the dentry change attribute being</div><div class='ctx'> 	 * a match, then we should revalidate the directory cache.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!ret &amp;&amp; nfs_verify_change_attribute(dir, dentry-&gt;d_time))</div><div class='add'>+	if (!ret &amp;&amp; nfs_dentry_verify_change(dir, dentry))</div><div class='ctx'> 		nfs_mark_dir_for_revalidate(dir);</div><div class='ctx'> 	return nfs_lookup_revalidate_done(dir, dentry, inode, ret);</div><div class='ctx'> }</div><div class='hunk'>@@ -1553,11 +1735,11 @@ out:</div><div class='ctx'>  * cached dentry and do a new lookup.</div><div class='ctx'>  */</div><div class='ctx'> static int</div><div class='del'>-nfs_do_lookup_revalidate(struct inode *dir, struct dentry *dentry,</div><div class='del'>-			 unsigned int flags)</div><div class='add'>+nfs_do_lookup_revalidate(struct inode *dir, const struct qstr *name,</div><div class='add'>+			 struct dentry *dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='del'>-	int error;</div><div class='add'>+	int error = 0;</div><div class='ctx'> </div><div class='ctx'> 	nfs_inc_stats(dir, NFSIOS_DENTRYREVALIDATE);</div><div class='ctx'> 	inode = d_inode(dentry);</div><div class='hunk'>@@ -1571,6 +1753,10 @@ nfs_do_lookup_revalidate(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 		goto out_bad;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if ((flags &amp; LOOKUP_RENAME_TARGET) &amp;&amp; d_count(dentry) &lt; 2 &amp;&amp;</div><div class='add'>+	    nfs_server_capable(dir, NFS_CAP_CASE_INSENSITIVE))</div><div class='add'>+		goto out_bad;</div><div class='add'>+</div><div class='ctx'> 	if (nfs_verifier_is_delegated(dentry))</div><div class='ctx'> 		return nfs_lookup_revalidate_delegated(dir, dentry, inode);</div><div class='ctx'> </div><div class='hunk'>@@ -1583,7 +1769,6 @@ nfs_do_lookup_revalidate(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 				nfs_mark_dir_for_revalidate(dir);</div><div class='ctx'> 			goto out_bad;</div><div class='ctx'> 		}</div><div class='del'>-		nfs_advise_use_readdirplus(dir);</div><div class='ctx'> 		goto out_valid;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1593,45 +1778,57 @@ nfs_do_lookup_revalidate(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	if (NFS_STALE(inode))</div><div class='ctx'> 		goto out_bad;</div><div class='ctx'> </div><div class='del'>-	trace_nfs_lookup_revalidate_enter(dir, dentry, flags);</div><div class='del'>-	error = nfs_lookup_revalidate_dentry(dir, dentry, inode);</div><div class='del'>-	trace_nfs_lookup_revalidate_exit(dir, dentry, flags, error);</div><div class='del'>-	return error;</div><div class='add'>+	return nfs_lookup_revalidate_dentry(dir, name, dentry, inode, flags);</div><div class='ctx'> out_valid:</div><div class='ctx'> 	return nfs_lookup_revalidate_done(dir, dentry, inode, 1);</div><div class='ctx'> out_bad:</div><div class='ctx'> 	if (flags &amp; LOOKUP_RCU)</div><div class='ctx'> 		return -ECHILD;</div><div class='del'>-	return nfs_lookup_revalidate_done(dir, dentry, inode, 0);</div><div class='add'>+	return nfs_lookup_revalidate_done(dir, dentry, inode, error);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-__nfs_lookup_revalidate(struct dentry *dentry, unsigned int flags,</div><div class='del'>-			int (*reval)(struct inode *, struct dentry *, unsigned int))</div><div class='add'>+__nfs_lookup_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *parent;</div><div class='del'>-	struct inode *dir;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='ctx'> 	if (flags &amp; LOOKUP_RCU) {</div><div class='del'>-		parent = READ_ONCE(dentry-&gt;d_parent);</div><div class='del'>-		dir = d_inode_rcu(parent);</div><div class='del'>-		if (!dir)</div><div class='del'>-			return -ECHILD;</div><div class='del'>-		ret = reval(dir, dentry, flags);</div><div class='del'>-		if (parent != READ_ONCE(dentry-&gt;d_parent))</div><div class='add'>+		if (dentry-&gt;d_fsdata == NFS_FSDATA_BLOCKED)</div><div class='ctx'> 			return -ECHILD;</div><div class='ctx'> 	} else {</div><div class='del'>-		parent = dget_parent(dentry);</div><div class='del'>-		ret = reval(d_inode(parent), dentry, flags);</div><div class='del'>-		dput(parent);</div><div class='add'>+		/* Wait for unlink to complete - see unblock_revalidate() */</div><div class='add'>+		wait_var_event(&amp;dentry-&gt;d_fsdata,</div><div class='add'>+			       smp_load_acquire(&amp;dentry-&gt;d_fsdata)</div><div class='add'>+			       != NFS_FSDATA_BLOCKED);</div><div class='ctx'> 	}</div><div class='del'>-	return ret;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int nfs_lookup_revalidate(struct inode *dir, const struct qstr *name,</div><div class='add'>+				 struct dentry *dentry, unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	if (__nfs_lookup_revalidate(dentry, flags))</div><div class='add'>+		return -ECHILD;</div><div class='add'>+	return nfs_do_lookup_revalidate(dir, name, dentry, flags);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void block_revalidate(struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	/* old devname - just in case */</div><div class='add'>+	kfree(dentry-&gt;d_fsdata);</div><div class='add'>+</div><div class='add'>+	/* Any new reference that could lead to an open</div><div class='add'>+	 * will take -&gt;d_lock in lookup_open() -&gt; d_lookup().</div><div class='add'>+	 * Holding this lock ensures we cannot race with</div><div class='add'>+	 * __nfs_lookup_revalidate() and removes and need</div><div class='add'>+	 * for further barriers.</div><div class='add'>+	 */</div><div class='add'>+	lockdep_assert_held(&amp;dentry-&gt;d_lock);</div><div class='add'>+</div><div class='add'>+	dentry-&gt;d_fsdata = NFS_FSDATA_BLOCKED;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int nfs_lookup_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='add'>+static void unblock_revalidate(struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	return __nfs_lookup_revalidate(dentry, flags, nfs_do_lookup_revalidate);</div><div class='add'>+	store_release_wake_up(&amp;dentry-&gt;d_fsdata, NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1774,9 +1971,13 @@ struct dentry *nfs_lookup(struct inode *dir, struct dentry * dentry, unsigned in</div><div class='ctx'> </div><div class='ctx'> 	dir_verifier = nfs_save_change_attribute(dir);</div><div class='ctx'> 	trace_nfs_lookup_enter(dir, dentry, flags);</div><div class='del'>-	error = NFS_PROTO(dir)-&gt;lookup(dir, dentry, fhandle, fattr);</div><div class='del'>-	if (error == -ENOENT)</div><div class='add'>+	error = NFS_PROTO(dir)-&gt;lookup(dir, dentry, &amp;dentry-&gt;d_name,</div><div class='add'>+				       fhandle, fattr);</div><div class='add'>+	if (error == -ENOENT) {</div><div class='add'>+		if (nfs_server_capable(dir, NFS_CAP_CASE_INSENSITIVE))</div><div class='add'>+			dir_verifier = inode_peek_iversion_raw(dir);</div><div class='ctx'> 		goto no_entry;</div><div class='add'>+	}</div><div class='ctx'> 	if (error &lt; 0) {</div><div class='ctx'> 		res = ERR_PTR(error);</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -1787,7 +1988,7 @@ struct dentry *nfs_lookup(struct inode *dir, struct dentry * dentry, unsigned in</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	/* Notify readdir to use READDIRPLUS */</div><div class='del'>-	nfs_force_use_readdirplus(dir);</div><div class='add'>+	nfs_lookup_advise_force_readdirplus(dir, flags);</div><div class='ctx'> </div><div class='ctx'> no_entry:</div><div class='ctx'> 	res = d_splice_alias(inode, dentry);</div><div class='hunk'>@@ -1805,8 +2006,17 @@ out:</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_lookup);</div><div class='ctx'> </div><div class='add'>+void nfs_d_prune_case_insensitive_aliases(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	/* Case insensitive server? Revalidate dentries */</div><div class='add'>+	if (inode &amp;&amp; nfs_server_capable(inode, NFS_CAP_CASE_INSENSITIVE))</div><div class='add'>+		d_prune_aliases(inode);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(nfs_d_prune_case_insensitive_aliases);</div><div class='add'>+</div><div class='ctx'> #if IS_ENABLED(CONFIG_NFS_V4)</div><div class='del'>-static int nfs4_lookup_revalidate(struct dentry *, unsigned int);</div><div class='add'>+static int nfs4_lookup_revalidate(struct inode *, const struct qstr *,</div><div class='add'>+				  struct dentry *, unsigned int);</div><div class='ctx'> </div><div class='ctx'> const struct dentry_operations nfs4_dentry_operations = {</div><div class='ctx'> 	.d_revalidate	= nfs4_lookup_revalidate,</div><div class='hunk'>@@ -1818,16 +2028,6 @@ const struct dentry_operations nfs4_dentry_operations = {</div><div class='ctx'> };</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs4_dentry_operations);</div><div class='ctx'> </div><div class='del'>-static fmode_t flags_to_mode(int flags)</div><div class='del'>-{</div><div class='del'>-	fmode_t res = (__force fmode_t)flags &amp; FMODE_EXEC;</div><div class='del'>-	if ((flags &amp; O_ACCMODE) != O_WRONLY)</div><div class='del'>-		res |= FMODE_READ;</div><div class='del'>-	if ((flags &amp; O_ACCMODE) != O_RDONLY)</div><div class='del'>-		res |= FMODE_WRITE;</div><div class='del'>-	return res;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static struct nfs_open_context *create_nfs_open_context(struct dentry *dentry, int open_flags, struct file *filp)</div><div class='ctx'> {</div><div class='ctx'> 	return alloc_nfs_open_context(dentry, flags_to_mode(open_flags), filp);</div><div class='hunk'>@@ -1848,7 +2048,7 @@ static int nfs_finish_open(struct nfs_open_context *ctx,</div><div class='ctx'> 	err = finish_open(file, dentry, do_open);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='del'>-	if (S_ISREG(file-&gt;f_path.dentry-&gt;d_inode-&gt;i_mode))</div><div class='add'>+	if (S_ISREG(file_inode(file)-&gt;i_mode))</div><div class='ctx'> 		nfs_file_set_open_context(file, ctx);</div><div class='ctx'> 	else</div><div class='ctx'> 		err = -EOPENSTALE;</div><div class='hunk'>@@ -1866,6 +2066,7 @@ int nfs_atomic_open(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	struct iattr attr = { .ia_valid = ATTR_OPEN };</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	unsigned int lookup_flags = 0;</div><div class='add'>+	unsigned long dir_verifier;</div><div class='ctx'> 	bool switched = false;</div><div class='ctx'> 	int created = 0;</div><div class='ctx'> 	int err;</div><div class='hunk'>@@ -1939,7 +2140,11 @@ int nfs_atomic_open(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 		switch (err) {</div><div class='ctx'> 		case -ENOENT:</div><div class='ctx'> 			d_splice_alias(NULL, dentry);</div><div class='del'>-			nfs_set_verifier(dentry, nfs_save_change_attribute(dir));</div><div class='add'>+			if (nfs_server_capable(dir, NFS_CAP_CASE_INSENSITIVE))</div><div class='add'>+				dir_verifier = inode_peek_iversion_raw(dir);</div><div class='add'>+			else</div><div class='add'>+				dir_verifier = nfs_save_change_attribute(dir);</div><div class='add'>+			nfs_set_verifier(dentry, dir_verifier);</div><div class='ctx'> 			break;</div><div class='ctx'> 		case -EISDIR:</div><div class='ctx'> 		case -ENOTDIR:</div><div class='hunk'>@@ -1954,6 +2159,7 @@ int nfs_atomic_open(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 		}</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='add'>+	file-&gt;f_mode |= FMODE_CAN_ODIRECT;</div><div class='ctx'> </div><div class='ctx'> 	err = nfs_finish_open(ctx, ctx-&gt;dentry, file, open_flags);</div><div class='ctx'> 	trace_nfs_atomic_open_exit(dir, ctx, open_flags, err);</div><div class='hunk'>@@ -1967,6 +2173,24 @@ out:</div><div class='ctx'> </div><div class='ctx'> no_open:</div><div class='ctx'> 	res = nfs_lookup(dir, dentry, lookup_flags);</div><div class='add'>+	if (!res) {</div><div class='add'>+		inode = d_inode(dentry);</div><div class='add'>+		if ((lookup_flags &amp; LOOKUP_DIRECTORY) &amp;&amp; inode &amp;&amp;</div><div class='add'>+		    !(S_ISDIR(inode-&gt;i_mode) || S_ISLNK(inode-&gt;i_mode)))</div><div class='add'>+			res = ERR_PTR(-ENOTDIR);</div><div class='add'>+		else if (inode &amp;&amp; S_ISREG(inode-&gt;i_mode))</div><div class='add'>+			res = ERR_PTR(-EOPENSTALE);</div><div class='add'>+	} else if (!IS_ERR(res)) {</div><div class='add'>+		inode = d_inode(res);</div><div class='add'>+		if ((lookup_flags &amp; LOOKUP_DIRECTORY) &amp;&amp; inode &amp;&amp;</div><div class='add'>+		    !(S_ISDIR(inode-&gt;i_mode) || S_ISLNK(inode-&gt;i_mode))) {</div><div class='add'>+			dput(res);</div><div class='add'>+			res = ERR_PTR(-ENOTDIR);</div><div class='add'>+		} else if (inode &amp;&amp; S_ISREG(inode-&gt;i_mode)) {</div><div class='add'>+			dput(res);</div><div class='add'>+			res = ERR_PTR(-EOPENSTALE);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> 	if (switched) {</div><div class='ctx'> 		d_lookup_done(dentry);</div><div class='ctx'> 		if (!res)</div><div class='hunk'>@@ -1974,18 +2198,21 @@ no_open:</div><div class='ctx'> 		else</div><div class='ctx'> 			dput(dentry);</div><div class='ctx'> 	}</div><div class='del'>-	if (IS_ERR(res))</div><div class='del'>-		return PTR_ERR(res);</div><div class='ctx'> 	return finish_no_open(file, res);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_atomic_open);</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-nfs4_do_lookup_revalidate(struct inode *dir, struct dentry *dentry,</div><div class='del'>-			  unsigned int flags)</div><div class='add'>+nfs4_lookup_revalidate(struct inode *dir, const struct qstr *name,</div><div class='add'>+		       struct dentry *dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> </div><div class='add'>+	if (__nfs_lookup_revalidate(dentry, flags))</div><div class='add'>+		return -ECHILD;</div><div class='add'>+</div><div class='add'>+	trace_nfs_lookup_revalidate_enter(dir, dentry, flags);</div><div class='add'>+</div><div class='ctx'> 	if (!(flags &amp; LOOKUP_OPEN) || (flags &amp; LOOKUP_DIRECTORY))</div><div class='ctx'> 		goto full_reval;</div><div class='ctx'> 	if (d_mountpoint(dentry))</div><div class='hunk'>@@ -2019,19 +2246,46 @@ nfs4_do_lookup_revalidate(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> reval_dentry:</div><div class='ctx'> 	if (flags &amp; LOOKUP_RCU)</div><div class='ctx'> 		return -ECHILD;</div><div class='del'>-	return nfs_lookup_revalidate_dentry(dir, dentry, inode);</div><div class='add'>+	return nfs_lookup_revalidate_dentry(dir, name, dentry, inode, flags);</div><div class='ctx'> </div><div class='ctx'> full_reval:</div><div class='del'>-	return nfs_do_lookup_revalidate(dir, dentry, flags);</div><div class='add'>+	return nfs_do_lookup_revalidate(dir, name, dentry, flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int nfs4_lookup_revalidate(struct dentry *dentry, unsigned int flags)</div><div class='add'>+#endif /* CONFIG_NFSV4 */</div><div class='add'>+</div><div class='add'>+int nfs_atomic_open_v23(struct inode *dir, struct dentry *dentry,</div><div class='add'>+			struct file *file, unsigned int open_flags,</div><div class='add'>+			umode_t mode)</div><div class='ctx'> {</div><div class='del'>-	return __nfs_lookup_revalidate(dentry, flags,</div><div class='del'>-			nfs4_do_lookup_revalidate);</div><div class='del'>-}</div><div class='add'>+	struct dentry *res = NULL;</div><div class='add'>+	/* Same as look+open from lookup_open(), but with different O_TRUNC</div><div class='add'>+	 * handling.</div><div class='add'>+	 */</div><div class='add'>+	int error = 0;</div><div class='ctx'> </div><div class='del'>-#endif /* CONFIG_NFSV4 */</div><div class='add'>+	if (dentry-&gt;d_name.len &gt; NFS_SERVER(dir)-&gt;namelen)</div><div class='add'>+		return -ENAMETOOLONG;</div><div class='add'>+</div><div class='add'>+	if (open_flags &amp; O_CREAT) {</div><div class='add'>+		error = nfs_do_create(dir, dentry, mode, open_flags);</div><div class='add'>+		if (!error) {</div><div class='add'>+			file-&gt;f_mode |= FMODE_CREATED;</div><div class='add'>+			return finish_open(file, dentry, NULL);</div><div class='add'>+		} else if (error != -EEXIST || open_flags &amp; O_EXCL)</div><div class='add'>+			return error;</div><div class='add'>+	}</div><div class='add'>+	if (d_in_lookup(dentry)) {</div><div class='add'>+		/* The only flags nfs_lookup considers are</div><div class='add'>+		 * LOOKUP_EXCL and LOOKUP_RENAME_TARGET, and</div><div class='add'>+		 * we want those to be zero so the lookup isn't skipped.</div><div class='add'>+		 */</div><div class='add'>+		res = nfs_lookup(dir, dentry, 0);</div><div class='add'>+	}</div><div class='add'>+	return finish_no_open(file, res);</div><div class='add'>+</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(nfs_atomic_open_v23);</div><div class='ctx'> </div><div class='ctx'> struct dentry *</div><div class='ctx'> nfs_add_or_obtain(struct dentry *dentry, struct nfs_fh *fhandle,</div><div class='hunk'>@@ -2046,7 +2300,8 @@ nfs_add_or_obtain(struct dentry *dentry, struct nfs_fh *fhandle,</div><div class='ctx'> 	d_drop(dentry);</div><div class='ctx'> </div><div class='ctx'> 	if (fhandle-&gt;size == 0) {</div><div class='del'>-		error = NFS_PROTO(dir)-&gt;lookup(dir, dentry, fhandle, fattr);</div><div class='add'>+		error = NFS_PROTO(dir)-&gt;lookup(dir, dentry, &amp;dentry-&gt;d_name,</div><div class='add'>+					       fhandle, fattr);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			goto out_error;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2093,18 +2348,23 @@ EXPORT_SYMBOL_GPL(nfs_instantiate);</div><div class='ctx'>  * that the operation succeeded on the server, but an error in the</div><div class='ctx'>  * reply path made it appear to have failed.</div><div class='ctx'>  */</div><div class='del'>-int nfs_create(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-	       struct dentry *dentry, umode_t mode, bool excl)</div><div class='add'>+static int nfs_do_create(struct inode *dir, struct dentry *dentry,</div><div class='add'>+			 umode_t mode, int open_flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct iattr attr;</div><div class='del'>-	int open_flags = excl ? O_CREAT | O_EXCL : O_CREAT;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='add'>+	open_flags |= O_CREAT;</div><div class='add'>+</div><div class='ctx'> 	dfprintk(VFS, "NFS: create(%s/%lu), %pd\n",</div><div class='ctx'> 			dir-&gt;i_sb-&gt;s_id, dir-&gt;i_ino, dentry);</div><div class='ctx'> </div><div class='ctx'> 	attr.ia_mode = mode;</div><div class='ctx'> 	attr.ia_valid = ATTR_MODE;</div><div class='add'>+	if (open_flags &amp; O_TRUNC) {</div><div class='add'>+		attr.ia_size = 0;</div><div class='add'>+		attr.ia_valid |= ATTR_SIZE;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	trace_nfs_create_enter(dir, dentry, open_flags);</div><div class='ctx'> 	error = NFS_PROTO(dir)-&gt;create(dir, dentry, &amp;attr, open_flags);</div><div class='hunk'>@@ -2116,13 +2376,19 @@ out_err:</div><div class='ctx'> 	d_drop(dentry);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+int nfs_create(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+	       struct dentry *dentry, umode_t mode, bool excl)</div><div class='add'>+{</div><div class='add'>+	return nfs_do_create(dir, dentry, mode, excl ? O_EXCL : 0);</div><div class='add'>+}</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_create);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * See comments for nfs_proc_create regarding failed operations.</div><div class='ctx'>  */</div><div class='ctx'> int</div><div class='del'>-nfs_mknod(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+nfs_mknod(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 	  struct dentry *dentry, umode_t mode, dev_t rdev)</div><div class='ctx'> {</div><div class='ctx'> 	struct iattr attr;</div><div class='hunk'>@@ -2149,11 +2415,11 @@ EXPORT_SYMBOL_GPL(nfs_mknod);</div><div class='ctx'> /*</div><div class='ctx'>  * See comments for nfs_proc_create regarding failed operations.</div><div class='ctx'>  */</div><div class='del'>-int nfs_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='del'>-	      struct dentry *dentry, umode_t mode)</div><div class='add'>+struct dentry *nfs_mkdir(struct mnt_idmap *idmap, struct inode *dir,</div><div class='add'>+			 struct dentry *dentry, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct iattr attr;</div><div class='del'>-	int error;</div><div class='add'>+	struct dentry *ret;</div><div class='ctx'> </div><div class='ctx'> 	dfprintk(VFS, "NFS: mkdir(%s/%lu), %pd\n",</div><div class='ctx'> 			dir-&gt;i_sb-&gt;s_id, dir-&gt;i_ino, dentry);</div><div class='hunk'>@@ -2162,14 +2428,9 @@ int nfs_mkdir(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	attr.ia_mode = mode | S_IFDIR;</div><div class='ctx'> </div><div class='ctx'> 	trace_nfs_mkdir_enter(dir, dentry);</div><div class='del'>-	error = NFS_PROTO(dir)-&gt;mkdir(dir, dentry, &amp;attr);</div><div class='del'>-	trace_nfs_mkdir_exit(dir, dentry, error);</div><div class='del'>-	if (error != 0)</div><div class='del'>-		goto out_err;</div><div class='del'>-	return 0;</div><div class='del'>-out_err:</div><div class='del'>-	d_drop(dentry);</div><div class='del'>-	return error;</div><div class='add'>+	ret = NFS_PROTO(dir)-&gt;mkdir(dir, dentry, &amp;attr);</div><div class='add'>+	trace_nfs_mkdir_exit(dir, dentry, PTR_ERR_OR_ZERO(ret));</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_mkdir);</div><div class='ctx'> </div><div class='hunk'>@@ -2184,9 +2445,12 @@ static void nfs_dentry_remove_handle_error(struct inode *dir,</div><div class='ctx'> {</div><div class='ctx'> 	switch (error) {</div><div class='ctx'> 	case -ENOENT:</div><div class='del'>-		d_delete(dentry);</div><div class='del'>-		fallthrough;</div><div class='add'>+		if (d_really_is_positive(dentry))</div><div class='add'>+			d_delete(dentry);</div><div class='add'>+		nfs_set_verifier(dentry, nfs_save_change_attribute(dir));</div><div class='add'>+		break;</div><div class='ctx'> 	case 0:</div><div class='add'>+		nfs_d_prune_case_insensitive_aliases(d_inode(dentry));</div><div class='ctx'> 		nfs_set_verifier(dentry, nfs_save_change_attribute(dir));</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -2263,29 +2527,37 @@ out:</div><div class='ctx'> int nfs_unlink(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	int error;</div><div class='del'>-	int need_rehash = 0;</div><div class='ctx'> </div><div class='ctx'> 	dfprintk(VFS, "NFS: unlink(%s/%lu, %pd)\n", dir-&gt;i_sb-&gt;s_id,</div><div class='ctx'> 		dir-&gt;i_ino, dentry);</div><div class='ctx'> </div><div class='ctx'> 	trace_nfs_unlink_enter(dir, dentry);</div><div class='ctx'> 	spin_lock(&amp;dentry-&gt;d_lock);</div><div class='del'>-	if (d_count(dentry) &gt; 1) {</div><div class='add'>+	if (d_count(dentry) &gt; 1 &amp;&amp; !test_bit(NFS_INO_PRESERVE_UNLINKED,</div><div class='add'>+					     &amp;NFS_I(d_inode(dentry))-&gt;flags)) {</div><div class='ctx'> 		spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 		/* Start asynchronous writeout of the inode */</div><div class='ctx'> 		write_inode_now(d_inode(dentry), 0);</div><div class='ctx'> 		error = nfs_sillyrename(dir, dentry);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	if (!d_unhashed(dentry)) {</div><div class='del'>-		__d_drop(dentry);</div><div class='del'>-		need_rehash = 1;</div><div class='add'>+	/* We must prevent any concurrent open until the unlink</div><div class='add'>+	 * completes.  -&gt;d_revalidate will wait for -&gt;d_fsdata</div><div class='add'>+	 * to clear.  We set it here to ensure no lookup succeeds until</div><div class='add'>+	 * the unlink is complete on the server.</div><div class='add'>+	 */</div><div class='add'>+	error = -ETXTBSY;</div><div class='add'>+	if (WARN_ON(dentry-&gt;d_flags &amp; DCACHE_NFSFS_RENAMED) ||</div><div class='add'>+	    WARN_ON(dentry-&gt;d_fsdata == NFS_FSDATA_BLOCKED)) {</div><div class='add'>+		spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='add'>+	block_revalidate(dentry);</div><div class='add'>+</div><div class='ctx'> 	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 	error = nfs_safe_remove(dentry);</div><div class='ctx'> 	nfs_dentry_remove_handle_error(dir, dentry, error);</div><div class='del'>-	if (need_rehash)</div><div class='del'>-		d_rehash(dentry);</div><div class='add'>+	unblock_revalidate(dentry);</div><div class='ctx'> out:</div><div class='ctx'> 	trace_nfs_unlink_exit(dir, dentry, error);</div><div class='ctx'> 	return error;</div><div class='hunk'>@@ -2307,10 +2579,10 @@ EXPORT_SYMBOL_GPL(nfs_unlink);</div><div class='ctx'>  * now have a new file handle and can instantiate an in-core NFS inode</div><div class='ctx'>  * and move the raw page into its mapping.</div><div class='ctx'>  */</div><div class='del'>-int nfs_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='add'>+int nfs_symlink(struct mnt_idmap *idmap, struct inode *dir,</div><div class='ctx'> 		struct dentry *dentry, const char *symname)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	char *kaddr;</div><div class='ctx'> 	struct iattr attr;</div><div class='ctx'> 	unsigned int pathlen = strlen(symname);</div><div class='hunk'>@@ -2325,24 +2597,24 @@ int nfs_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	attr.ia_mode = S_IFLNK | S_IRWXUGO;</div><div class='ctx'> 	attr.ia_valid = ATTR_MODE;</div><div class='ctx'> </div><div class='del'>-	page = alloc_page(GFP_USER);</div><div class='del'>-	if (!page)</div><div class='add'>+	folio = folio_alloc(GFP_USER, 0);</div><div class='add'>+	if (!folio)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	kaddr = page_address(page);</div><div class='add'>+	kaddr = folio_address(folio);</div><div class='ctx'> 	memcpy(kaddr, symname, pathlen);</div><div class='ctx'> 	if (pathlen &lt; PAGE_SIZE)</div><div class='ctx'> 		memset(kaddr + pathlen, 0, PAGE_SIZE - pathlen);</div><div class='ctx'> </div><div class='ctx'> 	trace_nfs_symlink_enter(dir, dentry);</div><div class='del'>-	error = NFS_PROTO(dir)-&gt;symlink(dir, dentry, page, pathlen, &amp;attr);</div><div class='add'>+	error = NFS_PROTO(dir)-&gt;symlink(dir, dentry, folio, pathlen, &amp;attr);</div><div class='ctx'> 	trace_nfs_symlink_exit(dir, dentry, error);</div><div class='ctx'> 	if (error != 0) {</div><div class='ctx'> 		dfprintk(VFS, "NFS: symlink(%s/%lu, %pd, %s) error %d\n",</div><div class='ctx'> 			dir-&gt;i_sb-&gt;s_id, dir-&gt;i_ino,</div><div class='ctx'> 			dentry, symname, error);</div><div class='ctx'> 		d_drop(dentry);</div><div class='del'>-		__free_page(page);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 		return error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -2352,18 +2624,13 @@ int nfs_symlink(struct user_namespace *mnt_userns, struct inode *dir,</div><div class='ctx'> 	 * No big deal if we can't add this page to the page cache here.</div><div class='ctx'> 	 * READLINK will get the missing page from the server if needed.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!add_to_page_cache_lru(page, d_inode(dentry)-&gt;i_mapping, 0,</div><div class='del'>-							GFP_KERNEL)) {</div><div class='del'>-		SetPageUptodate(page);</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		/*</div><div class='del'>-		 * add_to_page_cache_lru() grabs an extra page refcount.</div><div class='del'>-		 * Drop it here to avoid leaking this page later.</div><div class='del'>-		 */</div><div class='del'>-		put_page(page);</div><div class='del'>-	} else</div><div class='del'>-		__free_page(page);</div><div class='add'>+	if (filemap_add_folio(d_inode(dentry)-&gt;i_mapping, folio, 0,</div><div class='add'>+							GFP_KERNEL) == 0) {</div><div class='add'>+		folio_mark_uptodate(folio);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='add'>+	folio_put(folio);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_symlink);</div><div class='hunk'>@@ -2379,6 +2646,8 @@ nfs_link(struct dentry *old_dentry, struct inode *dir, struct dentry *dentry)</div><div class='ctx'> </div><div class='ctx'> 	trace_nfs_link_enter(inode, dir, dentry);</div><div class='ctx'> 	d_drop(dentry);</div><div class='add'>+	if (S_ISREG(inode-&gt;i_mode))</div><div class='add'>+		nfs_sync_inode(inode);</div><div class='ctx'> 	error = NFS_PROTO(dir)-&gt;link(inode, dir, &amp;dentry-&gt;d_name);</div><div class='ctx'> 	if (error == 0) {</div><div class='ctx'> 		nfs_set_verifier(dentry, nfs_save_change_attribute(dir));</div><div class='hunk'>@@ -2390,6 +2659,26 @@ nfs_link(struct dentry *old_dentry, struct inode *dir, struct dentry *dentry)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_link);</div><div class='ctx'> </div><div class='add'>+static void</div><div class='add'>+nfs_unblock_rename(struct rpc_task *task, struct nfs_renamedata *data)</div><div class='add'>+{</div><div class='add'>+	struct dentry *new_dentry = data-&gt;new_dentry;</div><div class='add'>+</div><div class='add'>+	unblock_revalidate(new_dentry);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool nfs_rename_is_unsafe_cross_dir(struct dentry *old_dentry,</div><div class='add'>+					   struct dentry *new_dentry)</div><div class='add'>+{</div><div class='add'>+	struct nfs_server *server = NFS_SB(old_dentry-&gt;d_sb);</div><div class='add'>+</div><div class='add'>+	if (old_dentry-&gt;d_parent != new_dentry-&gt;d_parent)</div><div class='add'>+		return false;</div><div class='add'>+	if (server-&gt;fh_expire_type &amp; NFS_FH_RENAME_UNSAFE)</div><div class='add'>+		return !(server-&gt;fh_expire_type &amp; NFS_FH_NOEXPIRE_WITH_OPEN);</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * RENAME</div><div class='ctx'>  * FIXME: Some nfsds, like the Linux user space nfsd, may generate a</div><div class='hunk'>@@ -2414,14 +2703,15 @@ EXPORT_SYMBOL_GPL(nfs_link);</div><div class='ctx'>  * If these conditions are met, we can drop the dentries before doing</div><div class='ctx'>  * the rename.</div><div class='ctx'>  */</div><div class='del'>-int nfs_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='add'>+int nfs_rename(struct mnt_idmap *idmap, struct inode *old_dir,</div><div class='ctx'> 	       struct dentry *old_dentry, struct inode *new_dir,</div><div class='ctx'> 	       struct dentry *new_dentry, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *old_inode = d_inode(old_dentry);</div><div class='ctx'> 	struct inode *new_inode = d_inode(new_dentry);</div><div class='del'>-	struct dentry *dentry = NULL, *rehash = NULL;</div><div class='add'>+	struct dentry *dentry = NULL;</div><div class='ctx'> 	struct rpc_task *task;</div><div class='add'>+	bool must_unblock = false;</div><div class='ctx'> 	int error = -EBUSY;</div><div class='ctx'> </div><div class='ctx'> 	if (flags)</div><div class='hunk'>@@ -2439,18 +2729,22 @@ int nfs_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> 	 * the new target.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (new_inode &amp;&amp; !S_ISDIR(new_inode-&gt;i_mode)) {</div><div class='del'>-		/*</div><div class='del'>-		 * To prevent any new references to the target during the</div><div class='del'>-		 * rename, we unhash the dentry in advance.</div><div class='add'>+		/* We must prevent any concurrent open until the unlink</div><div class='add'>+		 * completes.  -&gt;d_revalidate will wait for -&gt;d_fsdata</div><div class='add'>+		 * to clear.  We set it here to ensure no lookup succeeds until</div><div class='add'>+		 * the unlink is complete on the server.</div><div class='ctx'> 		 */</div><div class='del'>-		if (!d_unhashed(new_dentry)) {</div><div class='del'>-			d_drop(new_dentry);</div><div class='del'>-			rehash = new_dentry;</div><div class='del'>-		}</div><div class='add'>+		error = -ETXTBSY;</div><div class='add'>+		if (WARN_ON(new_dentry-&gt;d_flags &amp; DCACHE_NFSFS_RENAMED) ||</div><div class='add'>+		    WARN_ON(new_dentry-&gt;d_fsdata == NFS_FSDATA_BLOCKED))</div><div class='add'>+			goto out;</div><div class='ctx'> </div><div class='add'>+		spin_lock(&amp;new_dentry-&gt;d_lock);</div><div class='ctx'> 		if (d_count(new_dentry) &gt; 2) {</div><div class='ctx'> 			int err;</div><div class='ctx'> </div><div class='add'>+			spin_unlock(&amp;new_dentry-&gt;d_lock);</div><div class='add'>+</div><div class='ctx'> 			/* copy the target dentry's name */</div><div class='ctx'> 			dentry = d_alloc(new_dentry-&gt;d_parent,</div><div class='ctx'> 					 &amp;new_dentry-&gt;d_name);</div><div class='hunk'>@@ -2463,13 +2757,23 @@ int nfs_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> 				goto out;</div><div class='ctx'> </div><div class='ctx'> 			new_dentry = dentry;</div><div class='del'>-			rehash = NULL;</div><div class='ctx'> 			new_inode = NULL;</div><div class='add'>+		} else {</div><div class='add'>+			block_revalidate(new_dentry);</div><div class='add'>+			must_unblock = true;</div><div class='add'>+			spin_unlock(&amp;new_dentry-&gt;d_lock);</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	task = nfs_async_rename(old_dir, new_dir, old_dentry, new_dentry, NULL);</div><div class='add'>+	if (S_ISREG(old_inode-&gt;i_mode) &amp;&amp;</div><div class='add'>+	    nfs_rename_is_unsafe_cross_dir(old_dentry, new_dentry))</div><div class='add'>+		nfs_sync_inode(old_inode);</div><div class='add'>+	task = nfs_async_rename(old_dir, new_dir, old_dentry, new_dentry,</div><div class='add'>+				must_unblock ? nfs_unblock_rename : NULL);</div><div class='ctx'> 	if (IS_ERR(task)) {</div><div class='add'>+		if (must_unblock)</div><div class='add'>+			unblock_revalidate(new_dentry);</div><div class='ctx'> 		error = PTR_ERR(task);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2492,8 +2796,6 @@ int nfs_rename(struct user_namespace *mnt_userns, struct inode *old_dir,</div><div class='ctx'> 		spin_unlock(&amp;old_inode-&gt;i_lock);</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='del'>-	if (rehash)</div><div class='del'>-		d_rehash(rehash);</div><div class='ctx'> 	trace_nfs_rename_exit(old_dir, old_dentry,</div><div class='ctx'> 			new_dir, new_dentry, error);</div><div class='ctx'> 	if (!error) {</div><div class='hunk'>@@ -2528,7 +2830,7 @@ MODULE_PARM_DESC(nfs_access_max_cachesize, "NFS access maximum total cache lengt</div><div class='ctx'> </div><div class='ctx'> static void nfs_access_free_entry(struct nfs_access_entry *entry)</div><div class='ctx'> {</div><div class='del'>-	put_cred(entry-&gt;cred);</div><div class='add'>+	put_group_info(entry-&gt;group_info);</div><div class='ctx'> 	kfree_rcu(entry, rcu_head);</div><div class='ctx'> 	smp_mb__before_atomic();</div><div class='ctx'> 	atomic_long_dec(&amp;nfs_access_nr_entries);</div><div class='hunk'>@@ -2654,6 +2956,43 @@ void nfs_access_zap_cache(struct inode *inode)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_access_zap_cache);</div><div class='ctx'> </div><div class='add'>+static int access_cmp(const struct cred *a, const struct nfs_access_entry *b)</div><div class='add'>+{</div><div class='add'>+	struct group_info *ga, *gb;</div><div class='add'>+	int g;</div><div class='add'>+</div><div class='add'>+	if (uid_lt(a-&gt;fsuid, b-&gt;fsuid))</div><div class='add'>+		return -1;</div><div class='add'>+	if (uid_gt(a-&gt;fsuid, b-&gt;fsuid))</div><div class='add'>+		return 1;</div><div class='add'>+</div><div class='add'>+	if (gid_lt(a-&gt;fsgid, b-&gt;fsgid))</div><div class='add'>+		return -1;</div><div class='add'>+	if (gid_gt(a-&gt;fsgid, b-&gt;fsgid))</div><div class='add'>+		return 1;</div><div class='add'>+</div><div class='add'>+	ga = a-&gt;group_info;</div><div class='add'>+	gb = b-&gt;group_info;</div><div class='add'>+	if (ga == gb)</div><div class='add'>+		return 0;</div><div class='add'>+	if (ga == NULL)</div><div class='add'>+		return -1;</div><div class='add'>+	if (gb == NULL)</div><div class='add'>+		return 1;</div><div class='add'>+	if (ga-&gt;ngroups &lt; gb-&gt;ngroups)</div><div class='add'>+		return -1;</div><div class='add'>+	if (ga-&gt;ngroups &gt; gb-&gt;ngroups)</div><div class='add'>+		return 1;</div><div class='add'>+</div><div class='add'>+	for (g = 0; g &lt; ga-&gt;ngroups; g++) {</div><div class='add'>+		if (gid_lt(ga-&gt;gid[g], gb-&gt;gid[g]))</div><div class='add'>+			return -1;</div><div class='add'>+		if (gid_gt(ga-&gt;gid[g], gb-&gt;gid[g]))</div><div class='add'>+			return 1;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static struct nfs_access_entry *nfs_access_search_rbtree(struct inode *inode, const struct cred *cred)</div><div class='ctx'> {</div><div class='ctx'> 	struct rb_node *n = NFS_I(inode)-&gt;access_cache.rb_node;</div><div class='hunk'>@@ -2661,7 +3000,7 @@ static struct nfs_access_entry *nfs_access_search_rbtree(struct inode *inode, co</div><div class='ctx'> 	while (n != NULL) {</div><div class='ctx'> 		struct nfs_access_entry *entry =</div><div class='ctx'> 			rb_entry(n, struct nfs_access_entry, rb_node);</div><div class='del'>-		int cmp = cred_fscmp(cred, entry-&gt;cred);</div><div class='add'>+		int cmp = access_cmp(cred, entry);</div><div class='ctx'> </div><div class='ctx'> 		if (cmp &lt; 0)</div><div class='ctx'> 			n = n-&gt;rb_left;</div><div class='hunk'>@@ -2673,9 +3012,30 @@ static struct nfs_access_entry *nfs_access_search_rbtree(struct inode *inode, co</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int nfs_access_get_cached_locked(struct inode *inode, const struct cred *cred, struct nfs_access_entry *res, bool may_block)</div><div class='add'>+static u64 nfs_access_login_time(const struct task_struct *task,</div><div class='add'>+				 const struct cred *cred)</div><div class='add'>+{</div><div class='add'>+	const struct task_struct *parent;</div><div class='add'>+	const struct cred *pcred;</div><div class='add'>+	u64 ret;</div><div class='add'>+</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	for (;;) {</div><div class='add'>+		parent = rcu_dereference(task-&gt;real_parent);</div><div class='add'>+		pcred = __task_cred(parent);</div><div class='add'>+		if (parent == task || cred_fscmp(pcred, cred) != 0)</div><div class='add'>+			break;</div><div class='add'>+		task = parent;</div><div class='add'>+	}</div><div class='add'>+	ret = task-&gt;start_time;</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int nfs_access_get_cached_locked(struct inode *inode, const struct cred *cred, u32 *mask, bool may_block)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_inode *nfsi = NFS_I(inode);</div><div class='add'>+	u64 login_time = nfs_access_login_time(current, cred);</div><div class='ctx'> 	struct nfs_access_entry *cache;</div><div class='ctx'> 	bool retry = true;</div><div class='ctx'> 	int err;</div><div class='hunk'>@@ -2703,8 +3063,10 @@ static int nfs_access_get_cached_locked(struct inode *inode, const struct cred *</div><div class='ctx'> 		spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 		retry = false;</div><div class='ctx'> 	}</div><div class='del'>-	res-&gt;cred = cache-&gt;cred;</div><div class='del'>-	res-&gt;mask = cache-&gt;mask;</div><div class='add'>+	err = -ENOENT;</div><div class='add'>+	if ((s64)(login_time - cache-&gt;timestamp) &gt; 0)</div><div class='add'>+		goto out;</div><div class='add'>+	*mask = cache-&gt;mask;</div><div class='ctx'> 	list_move_tail(&amp;cache-&gt;lru, &amp;nfsi-&gt;access_cache_entry_lru);</div><div class='ctx'> 	err = 0;</div><div class='ctx'> out:</div><div class='hunk'>@@ -2716,12 +3078,13 @@ out_zap:</div><div class='ctx'> 	return -ENOENT;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int nfs_access_get_cached_rcu(struct inode *inode, const struct cred *cred, struct nfs_access_entry *res)</div><div class='add'>+static int nfs_access_get_cached_rcu(struct inode *inode, const struct cred *cred, u32 *mask)</div><div class='ctx'> {</div><div class='ctx'> 	/* Only check the most recently returned cache entry,</div><div class='ctx'> 	 * but do it without locking.</div><div class='ctx'> 	 */</div><div class='ctx'> 	struct nfs_inode *nfsi = NFS_I(inode);</div><div class='add'>+	u64 login_time = nfs_access_login_time(current, cred);</div><div class='ctx'> 	struct nfs_access_entry *cache;</div><div class='ctx'> 	int err = -ECHILD;</div><div class='ctx'> 	struct list_head *lh;</div><div class='hunk'>@@ -2732,35 +3095,38 @@ static int nfs_access_get_cached_rcu(struct inode *inode, const struct cred *cre</div><div class='ctx'> 	lh = rcu_dereference(list_tail_rcu(&amp;nfsi-&gt;access_cache_entry_lru));</div><div class='ctx'> 	cache = list_entry(lh, struct nfs_access_entry, lru);</div><div class='ctx'> 	if (lh == &amp;nfsi-&gt;access_cache_entry_lru ||</div><div class='del'>-	    cred_fscmp(cred, cache-&gt;cred) != 0)</div><div class='add'>+	    access_cmp(cred, cache) != 0)</div><div class='ctx'> 		cache = NULL;</div><div class='ctx'> 	if (cache == NULL)</div><div class='ctx'> 		goto out;</div><div class='add'>+	if ((s64)(login_time - cache-&gt;timestamp) &gt; 0)</div><div class='add'>+		goto out;</div><div class='ctx'> 	if (nfs_check_cache_invalid(inode, NFS_INO_INVALID_ACCESS))</div><div class='ctx'> 		goto out;</div><div class='del'>-	res-&gt;cred = cache-&gt;cred;</div><div class='del'>-	res-&gt;mask = cache-&gt;mask;</div><div class='add'>+	*mask = cache-&gt;mask;</div><div class='ctx'> 	err = 0;</div><div class='ctx'> out:</div><div class='ctx'> 	rcu_read_unlock();</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int nfs_access_get_cached(struct inode *inode, const struct cred *cred, struct</div><div class='del'>-nfs_access_entry *res, bool may_block)</div><div class='add'>+int nfs_access_get_cached(struct inode *inode, const struct cred *cred,</div><div class='add'>+			  u32 *mask, bool may_block)</div><div class='ctx'> {</div><div class='ctx'> 	int status;</div><div class='ctx'> </div><div class='del'>-	status = nfs_access_get_cached_rcu(inode, cred, res);</div><div class='add'>+	status = nfs_access_get_cached_rcu(inode, cred, mask);</div><div class='ctx'> 	if (status != 0)</div><div class='del'>-		status = nfs_access_get_cached_locked(inode, cred, res,</div><div class='add'>+		status = nfs_access_get_cached_locked(inode, cred, mask,</div><div class='ctx'> 		    may_block);</div><div class='ctx'> </div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_access_get_cached);</div><div class='ctx'> </div><div class='del'>-static void nfs_access_add_rbtree(struct inode *inode, struct nfs_access_entry *set)</div><div class='add'>+static void nfs_access_add_rbtree(struct inode *inode,</div><div class='add'>+				  struct nfs_access_entry *set,</div><div class='add'>+				  const struct cred *cred)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_inode *nfsi = NFS_I(inode);</div><div class='ctx'> 	struct rb_root *root_node = &amp;nfsi-&gt;access_cache;</div><div class='hunk'>@@ -2773,7 +3139,7 @@ static void nfs_access_add_rbtree(struct inode *inode, struct nfs_access_entry *</div><div class='ctx'> 	while (*p != NULL) {</div><div class='ctx'> 		parent = *p;</div><div class='ctx'> 		entry = rb_entry(parent, struct nfs_access_entry, rb_node);</div><div class='del'>-		cmp = cred_fscmp(set-&gt;cred, entry-&gt;cred);</div><div class='add'>+		cmp = access_cmp(cred, entry);</div><div class='ctx'> </div><div class='ctx'> 		if (cmp &lt; 0)</div><div class='ctx'> 			p = &amp;parent-&gt;rb_left;</div><div class='hunk'>@@ -2795,21 +3161,25 @@ found:</div><div class='ctx'> 	nfs_access_free_entry(entry);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void nfs_access_add_cache(struct inode *inode, struct nfs_access_entry *set)</div><div class='add'>+void nfs_access_add_cache(struct inode *inode, struct nfs_access_entry *set,</div><div class='add'>+			  const struct cred *cred)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_access_entry *cache = kmalloc(sizeof(*cache), GFP_KERNEL);</div><div class='ctx'> 	if (cache == NULL)</div><div class='ctx'> 		return;</div><div class='ctx'> 	RB_CLEAR_NODE(&amp;cache-&gt;rb_node);</div><div class='del'>-	cache-&gt;cred = get_cred(set-&gt;cred);</div><div class='add'>+	cache-&gt;fsuid = cred-&gt;fsuid;</div><div class='add'>+	cache-&gt;fsgid = cred-&gt;fsgid;</div><div class='add'>+	cache-&gt;group_info = get_group_info(cred-&gt;group_info);</div><div class='ctx'> 	cache-&gt;mask = set-&gt;mask;</div><div class='add'>+	cache-&gt;timestamp = ktime_get_ns();</div><div class='ctx'> </div><div class='ctx'> 	/* The above field assignments must be visible</div><div class='ctx'> 	 * before this item appears on the lru.  We cannot easily</div><div class='ctx'> 	 * use rcu_assign_pointer, so just force the memory barrier.</div><div class='ctx'> 	 */</div><div class='ctx'> 	smp_wmb();</div><div class='del'>-	nfs_access_add_rbtree(inode, cache);</div><div class='add'>+	nfs_access_add_rbtree(inode, cache, cred);</div><div class='ctx'> </div><div class='ctx'> 	/* Update accounting */</div><div class='ctx'> 	smp_mb__before_atomic();</div><div class='hunk'>@@ -2874,7 +3244,7 @@ static int nfs_do_access(struct inode *inode, const struct cred *cred, int mask)</div><div class='ctx'> </div><div class='ctx'> 	trace_nfs_access_enter(inode);</div><div class='ctx'> </div><div class='del'>-	status = nfs_access_get_cached(inode, cred, &amp;cache, may_block);</div><div class='add'>+	status = nfs_access_get_cached(inode, cred, &amp;cache.mask, may_block);</div><div class='ctx'> 	if (status == 0)</div><div class='ctx'> 		goto out_cached;</div><div class='ctx'> </div><div class='hunk'>@@ -2885,17 +3255,13 @@ static int nfs_do_access(struct inode *inode, const struct cred *cred, int mask)</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Determine which access bits we want to ask for...</div><div class='ctx'> 	 */</div><div class='del'>-	cache.mask = NFS_ACCESS_READ | NFS_ACCESS_MODIFY | NFS_ACCESS_EXTEND;</div><div class='del'>-	if (nfs_server_capable(inode, NFS_CAP_XATTR)) {</div><div class='del'>-		cache.mask |= NFS_ACCESS_XAREAD | NFS_ACCESS_XAWRITE |</div><div class='del'>-		    NFS_ACCESS_XALIST;</div><div class='del'>-	}</div><div class='add'>+	cache.mask = NFS_ACCESS_READ | NFS_ACCESS_MODIFY | NFS_ACCESS_EXTEND |</div><div class='add'>+		     nfs_access_xattr_mask(NFS_SERVER(inode));</div><div class='ctx'> 	if (S_ISDIR(inode-&gt;i_mode))</div><div class='ctx'> 		cache.mask |= NFS_ACCESS_DELETE | NFS_ACCESS_LOOKUP;</div><div class='ctx'> 	else</div><div class='ctx'> 		cache.mask |= NFS_ACCESS_EXECUTE;</div><div class='del'>-	cache.cred = cred;</div><div class='del'>-	status = NFS_PROTO(inode)-&gt;access(inode, &amp;cache);</div><div class='add'>+	status = NFS_PROTO(inode)-&gt;access(inode, &amp;cache, cred);</div><div class='ctx'> 	if (status != 0) {</div><div class='ctx'> 		if (status == -ESTALE) {</div><div class='ctx'> 			if (!S_ISDIR(inode-&gt;i_mode))</div><div class='hunk'>@@ -2905,7 +3271,7 @@ static int nfs_do_access(struct inode *inode, const struct cred *cred, int mask)</div><div class='ctx'> 		}</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	nfs_access_add_cache(inode, &amp;cache);</div><div class='add'>+	nfs_access_add_cache(inode, &amp;cache, cred);</div><div class='ctx'> out_cached:</div><div class='ctx'> 	cache_mask = nfs_access_calc_mask(cache.mask, inode-&gt;i_mode);</div><div class='ctx'> 	if ((mask &amp; ~cache_mask &amp; (MAY_READ | MAY_WRITE | MAY_EXEC)) != 0)</div><div class='hunk'>@@ -2955,7 +3321,7 @@ static int nfs_execute_ok(struct inode *inode, int mask)</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int nfs_permission(struct user_namespace *mnt_userns,</div><div class='add'>+int nfs_permission(struct mnt_idmap *idmap,</div><div class='ctx'> 		   struct inode *inode,</div><div class='ctx'> 		   int mask)</div><div class='ctx'> {</div><div class='hunk'>@@ -3006,7 +3372,7 @@ out_notsup:</div><div class='ctx'> 	res = nfs_revalidate_inode(inode, NFS_INO_INVALID_MODE |</div><div class='ctx'> 						  NFS_INO_INVALID_OTHER);</div><div class='ctx'> 	if (res == 0)</div><div class='del'>-		res = generic_permission(&amp;init_user_ns, inode, mask);</div><div class='add'>+		res = generic_permission(&amp;nop_mnt_idmap, inode, mask);</div><div class='ctx'> 	goto out;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_permission);</div><div class='head'>diff --git a/fs/nfs/direct.c b/fs/nfs/direct.c<br/>index 9cff8709c80a..48d89716193a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/direct.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/direct.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/direct.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/direct.c</a></div><div class='hunk'>@@ -56,47 +56,17 @@</div><div class='ctx'> #include &lt;linux/uaccess.h&gt;</div><div class='ctx'> #include &lt;linux/atomic.h&gt;</div><div class='ctx'> </div><div class='add'>+#include "delegation.h"</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> #include "iostat.h"</div><div class='ctx'> #include "pnfs.h"</div><div class='add'>+#include "fscache.h"</div><div class='add'>+#include "nfstrace.h"</div><div class='ctx'> </div><div class='ctx'> #define NFSDBG_FACILITY		NFSDBG_VFS</div><div class='ctx'> </div><div class='ctx'> static struct kmem_cache *nfs_direct_cachep;</div><div class='ctx'> </div><div class='del'>-struct nfs_direct_req {</div><div class='del'>-	struct kref		kref;		/* release manager */</div><div class='del'>-</div><div class='del'>-	/* I/O parameters */</div><div class='del'>-	struct nfs_open_context	*ctx;		/* file open context info */</div><div class='del'>-	struct nfs_lock_context *l_ctx;		/* Lock context info */</div><div class='del'>-	struct kiocb *		iocb;		/* controlling i/o request */</div><div class='del'>-	struct inode *		inode;		/* target file of i/o */</div><div class='del'>-</div><div class='del'>-	/* completion state */</div><div class='del'>-	atomic_t		io_count;	/* i/os we're waiting for */</div><div class='del'>-	spinlock_t		lock;		/* protect completion state */</div><div class='del'>-</div><div class='del'>-	loff_t			io_start;	/* Start offset for I/O */</div><div class='del'>-	ssize_t			count,		/* bytes actually processed */</div><div class='del'>-				max_count,	/* max expected count */</div><div class='del'>-				bytes_left,	/* bytes left to be sent */</div><div class='del'>-				error;		/* any reported error */</div><div class='del'>-	struct completion	completion;	/* wait for i/o completion */</div><div class='del'>-</div><div class='del'>-	/* commit state */</div><div class='del'>-	struct nfs_mds_commit_info mds_cinfo;	/* Storage for cinfo */</div><div class='del'>-	struct pnfs_ds_commit_info ds_cinfo;	/* Storage for cinfo */</div><div class='del'>-	struct work_struct	work;</div><div class='del'>-	int			flags;</div><div class='del'>-	/* for write */</div><div class='del'>-#define NFS_ODIRECT_DO_COMMIT		(1)	/* an unstable reply was received */</div><div class='del'>-#define NFS_ODIRECT_RESCHED_WRITES	(2)	/* write verification failed */</div><div class='del'>-	/* for read */</div><div class='del'>-#define NFS_ODIRECT_SHOULD_DIRTY	(3)	/* dirty user-space page after read */</div><div class='del'>-#define NFS_ODIRECT_DONE		INT_MAX	/* write verification failed */</div><div class='del'>-};</div><div class='del'>-</div><div class='ctx'> static const struct nfs_pgio_completion_ops nfs_direct_write_completion_ops;</div><div class='ctx'> static const struct nfs_commit_completion_ops nfs_direct_commit_completion_ops;</div><div class='ctx'> static void nfs_direct_write_complete(struct nfs_direct_req *dreq);</div><div class='hunk'>@@ -124,12 +94,10 @@ nfs_direct_handle_truncated(struct nfs_direct_req *dreq,</div><div class='ctx'> 		dreq-&gt;max_count = dreq_len;</div><div class='ctx'> 		if (dreq-&gt;count &gt; dreq_len)</div><div class='ctx'> 			dreq-&gt;count = dreq_len;</div><div class='del'>-</div><div class='del'>-		if (test_bit(NFS_IOHDR_ERROR, &amp;hdr-&gt;flags))</div><div class='del'>-			dreq-&gt;error = hdr-&gt;error;</div><div class='del'>-		else /* Clear outstanding error if this is EOF */</div><div class='del'>-			dreq-&gt;error = 0;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	if (test_bit(NFS_IOHDR_ERROR, &amp;hdr-&gt;flags) &amp;&amp; !dreq-&gt;error)</div><div class='add'>+		dreq-&gt;error = hdr-&gt;error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='hunk'>@@ -151,29 +119,50 @@ nfs_direct_count_bytes(struct nfs_direct_req *dreq,</div><div class='ctx'> 		dreq-&gt;count = dreq_len;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void nfs_direct_truncate_request(struct nfs_direct_req *dreq,</div><div class='add'>+					struct nfs_page *req)</div><div class='add'>+{</div><div class='add'>+	loff_t offs = req_offset(req);</div><div class='add'>+	size_t req_start = (size_t)(offs - dreq-&gt;io_start);</div><div class='add'>+</div><div class='add'>+	if (req_start &lt; dreq-&gt;max_count)</div><div class='add'>+		dreq-&gt;max_count = req_start;</div><div class='add'>+	if (req_start &lt; dreq-&gt;count)</div><div class='add'>+		dreq-&gt;count = req_start;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfs_direct_file_adjust_size_locked(struct inode *inode,</div><div class='add'>+					       loff_t offset, size_t count)</div><div class='add'>+{</div><div class='add'>+	loff_t newsize = offset + (loff_t)count;</div><div class='add'>+	loff_t oldsize = i_size_read(inode);</div><div class='add'>+</div><div class='add'>+	if (newsize &gt; oldsize) {</div><div class='add'>+		i_size_write(inode, newsize);</div><div class='add'>+		NFS_I(inode)-&gt;cache_validity &amp;= ~NFS_INO_INVALID_SIZE;</div><div class='add'>+		trace_nfs_size_grow(inode, newsize);</div><div class='add'>+		nfs_inc_stats(inode, NFSIOS_EXTENDWRITE);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /**</div><div class='del'>- * nfs_direct_IO - NFS address space operation for direct I/O</div><div class='add'>+ * nfs_swap_rw - NFS address space operation for swap I/O</div><div class='ctx'>  * @iocb: target I/O control block</div><div class='ctx'>  * @iter: I/O buffer</div><div class='ctx'>  *</div><div class='del'>- * The presence of this routine in the address space ops vector means</div><div class='del'>- * the NFS client supports direct I/O. However, for most direct IO, we</div><div class='del'>- * shunt off direct read and write requests before the VFS gets them,</div><div class='del'>- * so this method is only ever called for swap.</div><div class='add'>+ * Perform IO to the swap-file.  This is much like direct IO.</div><div class='ctx'>  */</div><div class='del'>-ssize_t nfs_direct_IO(struct kiocb *iocb, struct iov_iter *iter)</div><div class='add'>+int nfs_swap_rw(struct kiocb *iocb, struct iov_iter *iter)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = iocb-&gt;ki_filp-&gt;f_mapping-&gt;host;</div><div class='del'>-</div><div class='del'>-	/* we only support swap file calling nfs_direct_IO */</div><div class='del'>-	if (!IS_SWAPFILE(inode))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	VM_BUG_ON(iov_iter_count(iter) != PAGE_SIZE);</div><div class='add'>+	ssize_t ret;</div><div class='ctx'> </div><div class='ctx'> 	if (iov_iter_rw(iter) == READ)</div><div class='del'>-		return nfs_file_direct_read(iocb, iter);</div><div class='del'>-	return nfs_file_direct_write(iocb, iter);</div><div class='add'>+		ret = nfs_file_direct_read(iocb, iter, true);</div><div class='add'>+	else</div><div class='add'>+		ret = nfs_file_direct_write(iocb, iter, true);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		return ret;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void nfs_direct_release_pages(struct page **pages, unsigned int npages)</div><div class='hunk'>@@ -229,9 +218,10 @@ static void nfs_direct_req_release(struct nfs_direct_req *dreq)</div><div class='ctx'> 	kref_put(&amp;dreq-&gt;kref, nfs_direct_req_free);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-ssize_t nfs_dreq_bytes_left(struct nfs_direct_req *dreq)</div><div class='add'>+ssize_t nfs_dreq_bytes_left(struct nfs_direct_req *dreq, loff_t offset)</div><div class='ctx'> {</div><div class='del'>-	return dreq-&gt;bytes_left;</div><div class='add'>+	loff_t start = offset - dreq-&gt;io_start;</div><div class='add'>+	return dreq-&gt;max_count - start;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_dreq_bytes_left);</div><div class='ctx'> </div><div class='hunk'>@@ -297,6 +287,8 @@ static void nfs_direct_read_completion(struct nfs_pgio_header *hdr)</div><div class='ctx'> 	nfs_direct_count_bytes(dreq, hdr);</div><div class='ctx'> 	spin_unlock(&amp;dreq-&gt;lock);</div><div class='ctx'> </div><div class='add'>+	nfs_update_delegated_atime(dreq-&gt;inode);</div><div class='add'>+</div><div class='ctx'> 	while (!list_empty(&amp;hdr-&gt;pages)) {</div><div class='ctx'> 		struct nfs_page *req = nfs_list_entry(hdr-&gt;pages.next);</div><div class='ctx'> 		struct page *page = req-&gt;wb_page;</div><div class='hunk'>@@ -328,6 +320,7 @@ static void nfs_read_sync_pgio_error(struct list_head *head, int error)</div><div class='ctx'> static void nfs_direct_pgio_init(struct nfs_pgio_header *hdr)</div><div class='ctx'> {</div><div class='ctx'> 	get_dreq(hdr-&gt;dreq);</div><div class='add'>+	set_bit(NFS_IOHDR_ODIRECT, &amp;hdr-&gt;flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct nfs_pgio_completion_ops nfs_direct_read_completion_ops = {</div><div class='hunk'>@@ -366,26 +359,23 @@ static ssize_t nfs_direct_read_schedule_iovec(struct nfs_direct_req *dreq,</div><div class='ctx'> 		size_t pgbase;</div><div class='ctx'> 		unsigned npages, i;</div><div class='ctx'> </div><div class='del'>-		result = iov_iter_get_pages_alloc(iter, &amp;pagevec, </div><div class='add'>+		result = iov_iter_get_pages_alloc2(iter, &amp;pagevec,</div><div class='ctx'> 						  rsize, &amp;pgbase);</div><div class='ctx'> 		if (result &lt; 0)</div><div class='ctx'> 			break;</div><div class='ctx'> 	</div><div class='ctx'> 		bytes = result;</div><div class='del'>-		iov_iter_advance(iter, bytes);</div><div class='ctx'> 		npages = (result + pgbase + PAGE_SIZE - 1) / PAGE_SIZE;</div><div class='ctx'> 		for (i = 0; i &lt; npages; i++) {</div><div class='ctx'> 			struct nfs_page *req;</div><div class='ctx'> 			unsigned int req_len = min_t(size_t, bytes, PAGE_SIZE - pgbase);</div><div class='ctx'> 			/* XXX do we need to do the eof zeroing found in async_filler? */</div><div class='del'>-			req = nfs_create_request(dreq-&gt;ctx, pagevec[i],</div><div class='del'>-						 pgbase, req_len);</div><div class='add'>+			req = nfs_page_create_from_page(dreq-&gt;ctx, pagevec[i],</div><div class='add'>+							pgbase, pos, req_len);</div><div class='ctx'> 			if (IS_ERR(req)) {</div><div class='ctx'> 				result = PTR_ERR(req);</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='del'>-			req-&gt;wb_index = pos &gt;&gt; PAGE_SHIFT;</div><div class='del'>-			req-&gt;wb_offset = pos &amp; ~PAGE_MASK;</div><div class='ctx'> 			if (!nfs_pageio_add_request(&amp;desc, req)) {</div><div class='ctx'> 				result = desc.pg_error;</div><div class='ctx'> 				nfs_release_request(req);</div><div class='hunk'>@@ -395,7 +385,6 @@ static ssize_t nfs_direct_read_schedule_iovec(struct nfs_direct_req *dreq,</div><div class='ctx'> 			bytes -= req_len;</div><div class='ctx'> 			requested_bytes += req_len;</div><div class='ctx'> 			pos += req_len;</div><div class='del'>-			dreq-&gt;bytes_left -= req_len;</div><div class='ctx'> 		}</div><div class='ctx'> 		nfs_direct_release_pages(pagevec, npages);</div><div class='ctx'> 		kvfree(pagevec);</div><div class='hunk'>@@ -424,6 +413,7 @@ static ssize_t nfs_direct_read_schedule_iovec(struct nfs_direct_req *dreq,</div><div class='ctx'>  * nfs_file_direct_read - file direct read operation for NFS files</div><div class='ctx'>  * @iocb: target I/O control block</div><div class='ctx'>  * @iter: vector of user buffers into which to read data</div><div class='add'>+ * @swap: flag indicating this is swap IO, not O_DIRECT IO</div><div class='ctx'>  *</div><div class='ctx'>  * We use this function for direct reads instead of calling</div><div class='ctx'>  * generic_file_aio_read() in order to avoid gfar's check to see if</div><div class='hunk'>@@ -439,7 +429,8 @@ static ssize_t nfs_direct_read_schedule_iovec(struct nfs_direct_req *dreq,</div><div class='ctx'>  * client must read the updated atime from the server back into its</div><div class='ctx'>  * cache.</div><div class='ctx'>  */</div><div class='del'>-ssize_t nfs_file_direct_read(struct kiocb *iocb, struct iov_iter *iter)</div><div class='add'>+ssize_t nfs_file_direct_read(struct kiocb *iocb, struct iov_iter *iter,</div><div class='add'>+			     bool swap)</div><div class='ctx'> {</div><div class='ctx'> 	struct file *file = iocb-&gt;ki_filp;</div><div class='ctx'> 	struct address_space *mapping = file-&gt;f_mapping;</div><div class='hunk'>@@ -465,7 +456,7 @@ ssize_t nfs_file_direct_read(struct kiocb *iocb, struct iov_iter *iter)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	dreq-&gt;inode = inode;</div><div class='del'>-	dreq-&gt;bytes_left = dreq-&gt;max_count = count;</div><div class='add'>+	dreq-&gt;max_count = count;</div><div class='ctx'> 	dreq-&gt;io_start = iocb-&gt;ki_pos;</div><div class='ctx'> 	dreq-&gt;ctx = get_nfs_open_context(nfs_file_open_context(iocb-&gt;ki_filp));</div><div class='ctx'> 	l_ctx = nfs_get_lock_context(dreq-&gt;ctx);</div><div class='hunk'>@@ -478,15 +469,25 @@ ssize_t nfs_file_direct_read(struct kiocb *iocb, struct iov_iter *iter)</div><div class='ctx'> 	if (!is_sync_kiocb(iocb))</div><div class='ctx'> 		dreq-&gt;iocb = iocb;</div><div class='ctx'> </div><div class='del'>-	if (iter_is_iovec(iter))</div><div class='add'>+	if (user_backed_iter(iter))</div><div class='ctx'> 		dreq-&gt;flags = NFS_ODIRECT_SHOULD_DIRTY;</div><div class='ctx'> </div><div class='del'>-	nfs_start_io_direct(inode);</div><div class='add'>+	if (!swap) {</div><div class='add'>+		result = nfs_start_io_direct(inode);</div><div class='add'>+		if (result) {</div><div class='add'>+			/* release the reference that would usually be</div><div class='add'>+			 * consumed by nfs_direct_read_schedule_iovec()</div><div class='add'>+			 */</div><div class='add'>+			nfs_direct_req_release(dreq);</div><div class='add'>+			goto out_release;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	NFS_I(inode)-&gt;read_io += count;</div><div class='ctx'> 	requested = nfs_direct_read_schedule_iovec(dreq, iter, iocb-&gt;ki_pos);</div><div class='ctx'> </div><div class='del'>-	nfs_end_io_direct(inode);</div><div class='add'>+	if (!swap)</div><div class='add'>+		nfs_end_io_direct(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (requested &gt; 0) {</div><div class='ctx'> 		result = nfs_direct_wait(dreq);</div><div class='hunk'>@@ -505,21 +506,47 @@ out:</div><div class='ctx'> 	return result;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void</div><div class='del'>-nfs_direct_join_group(struct list_head *list, struct inode *inode)</div><div class='add'>+static void nfs_direct_add_page_head(struct list_head *list,</div><div class='add'>+				     struct nfs_page *req)</div><div class='ctx'> {</div><div class='del'>-	struct nfs_page *req, *next;</div><div class='add'>+	struct nfs_page *head = req-&gt;wb_head;</div><div class='add'>+</div><div class='add'>+	if (!list_empty(&amp;head-&gt;wb_list) || !nfs_lock_request(head))</div><div class='add'>+		return;</div><div class='add'>+	if (!list_empty(&amp;head-&gt;wb_list)) {</div><div class='add'>+		nfs_unlock_request(head);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+	list_add(&amp;head-&gt;wb_list, list);</div><div class='add'>+	kref_get(&amp;head-&gt;wb_kref);</div><div class='add'>+	kref_get(&amp;head-&gt;wb_kref);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfs_direct_join_group(struct list_head *list,</div><div class='add'>+				  struct nfs_commit_info *cinfo,</div><div class='add'>+				  struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct nfs_page *req, *subreq;</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(req, list, wb_list) {</div><div class='del'>-		if (req-&gt;wb_head != req || req-&gt;wb_this_page == req)</div><div class='add'>+		if (req-&gt;wb_head != req) {</div><div class='add'>+			nfs_direct_add_page_head(&amp;req-&gt;wb_list, req);</div><div class='ctx'> 			continue;</div><div class='del'>-		for (next = req-&gt;wb_this_page;</div><div class='del'>-				next != req-&gt;wb_head;</div><div class='del'>-				next = next-&gt;wb_this_page) {</div><div class='del'>-			nfs_list_remove_request(next);</div><div class='del'>-			nfs_release_request(next);</div><div class='ctx'> 		}</div><div class='del'>-		nfs_join_page_group(req, inode);</div><div class='add'>+		subreq = req-&gt;wb_this_page;</div><div class='add'>+		if (subreq == req)</div><div class='add'>+			continue;</div><div class='add'>+		do {</div><div class='add'>+			/*</div><div class='add'>+			 * Remove subrequests from this list before freeing</div><div class='add'>+			 * them in the call to nfs_join_page_group().</div><div class='add'>+			 */</div><div class='add'>+			if (!list_empty(&amp;subreq-&gt;wb_list)) {</div><div class='add'>+				nfs_list_remove_request(subreq);</div><div class='add'>+				nfs_release_request(subreq);</div><div class='add'>+			}</div><div class='add'>+		} while ((subreq = subreq-&gt;wb_this_page) != req);</div><div class='add'>+		nfs_join_page_group(req, cinfo, inode);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -537,20 +564,15 @@ nfs_direct_write_scan_commit_list(struct inode *inode,</div><div class='ctx'> static void nfs_direct_write_reschedule(struct nfs_direct_req *dreq)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_pageio_descriptor desc;</div><div class='del'>-	struct nfs_page *req, *tmp;</div><div class='add'>+	struct nfs_page *req;</div><div class='ctx'> 	LIST_HEAD(reqs);</div><div class='ctx'> 	struct nfs_commit_info cinfo;</div><div class='del'>-	LIST_HEAD(failed);</div><div class='ctx'> </div><div class='ctx'> 	nfs_init_cinfo_from_dreq(&amp;cinfo, dreq);</div><div class='ctx'> 	nfs_direct_write_scan_commit_list(dreq-&gt;inode, &amp;reqs, &amp;cinfo);</div><div class='ctx'> </div><div class='del'>-	nfs_direct_join_group(&amp;reqs, dreq-&gt;inode);</div><div class='add'>+	nfs_direct_join_group(&amp;reqs, &amp;cinfo, dreq-&gt;inode);</div><div class='ctx'> </div><div class='del'>-	dreq-&gt;count = 0;</div><div class='del'>-	dreq-&gt;max_count = 0;</div><div class='del'>-	list_for_each_entry(req, &amp;reqs, wb_list)</div><div class='del'>-		dreq-&gt;max_count += req-&gt;wb_bytes;</div><div class='ctx'> 	nfs_clear_pnfs_ds_commit_verifiers(&amp;dreq-&gt;ds_cinfo);</div><div class='ctx'> 	get_dreq(dreq);</div><div class='ctx'> </div><div class='hunk'>@@ -558,27 +580,40 @@ static void nfs_direct_write_reschedule(struct nfs_direct_req *dreq)</div><div class='ctx'> 			      &amp;nfs_direct_write_completion_ops);</div><div class='ctx'> 	desc.pg_dreq = dreq;</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry_safe(req, tmp, &amp;reqs, wb_list) {</div><div class='add'>+	while (!list_empty(&amp;reqs)) {</div><div class='add'>+		req = nfs_list_entry(reqs.next);</div><div class='ctx'> 		/* Bump the transmission count */</div><div class='ctx'> 		req-&gt;wb_nio++;</div><div class='ctx'> 		if (!nfs_pageio_add_request(&amp;desc, req)) {</div><div class='del'>-			nfs_list_move_request(req, &amp;failed);</div><div class='del'>-			spin_lock(&amp;cinfo.inode-&gt;i_lock);</div><div class='del'>-			dreq-&gt;flags = 0;</div><div class='del'>-			if (desc.pg_error &lt; 0)</div><div class='add'>+			spin_lock(&amp;dreq-&gt;lock);</div><div class='add'>+			if (dreq-&gt;error &lt; 0) {</div><div class='add'>+				desc.pg_error = dreq-&gt;error;</div><div class='add'>+			} else if (desc.pg_error != -EAGAIN) {</div><div class='add'>+				dreq-&gt;flags = 0;</div><div class='add'>+				if (!desc.pg_error)</div><div class='add'>+					desc.pg_error = -EIO;</div><div class='ctx'> 				dreq-&gt;error = desc.pg_error;</div><div class='del'>-			else</div><div class='del'>-				dreq-&gt;error = -EIO;</div><div class='del'>-			spin_unlock(&amp;cinfo.inode-&gt;i_lock);</div><div class='add'>+			} else</div><div class='add'>+				dreq-&gt;flags = NFS_ODIRECT_RESCHED_WRITES;</div><div class='add'>+			spin_unlock(&amp;dreq-&gt;lock);</div><div class='add'>+			break;</div><div class='ctx'> 		}</div><div class='ctx'> 		nfs_release_request(req);</div><div class='ctx'> 	}</div><div class='ctx'> 	nfs_pageio_complete(&amp;desc);</div><div class='ctx'> </div><div class='del'>-	while (!list_empty(&amp;failed)) {</div><div class='del'>-		req = nfs_list_entry(failed.next);</div><div class='add'>+	while (!list_empty(&amp;reqs)) {</div><div class='add'>+		req = nfs_list_entry(reqs.next);</div><div class='ctx'> 		nfs_list_remove_request(req);</div><div class='ctx'> 		nfs_unlock_and_release_request(req);</div><div class='add'>+		if (desc.pg_error == -EAGAIN) {</div><div class='add'>+			nfs_mark_request_commit(req, NULL, &amp;cinfo, 0);</div><div class='add'>+		} else {</div><div class='add'>+			spin_lock(&amp;dreq-&gt;lock);</div><div class='add'>+			nfs_direct_truncate_request(dreq, req);</div><div class='add'>+			spin_unlock(&amp;dreq-&gt;lock);</div><div class='add'>+			nfs_release_request(req);</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (put_dreq(dreq))</div><div class='hunk'>@@ -593,29 +628,40 @@ static void nfs_direct_commit_complete(struct nfs_commit_data *data)</div><div class='ctx'> 	struct nfs_page *req;</div><div class='ctx'> 	int status = data-&gt;task.tk_status;</div><div class='ctx'> </div><div class='add'>+	trace_nfs_direct_commit_complete(dreq);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;dreq-&gt;lock);</div><div class='ctx'> 	if (status &lt; 0) {</div><div class='ctx'> 		/* Errors in commit are fatal */</div><div class='ctx'> 		dreq-&gt;error = status;</div><div class='del'>-		dreq-&gt;max_count = 0;</div><div class='del'>-		dreq-&gt;count = 0;</div><div class='ctx'> 		dreq-&gt;flags = NFS_ODIRECT_DONE;</div><div class='del'>-	} else if (dreq-&gt;flags == NFS_ODIRECT_DONE)</div><div class='add'>+	} else {</div><div class='ctx'> 		status = dreq-&gt;error;</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;dreq-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	nfs_init_cinfo_from_dreq(&amp;cinfo, dreq);</div><div class='ctx'> </div><div class='ctx'> 	while (!list_empty(&amp;data-&gt;pages)) {</div><div class='ctx'> 		req = nfs_list_entry(data-&gt;pages.next);</div><div class='ctx'> 		nfs_list_remove_request(req);</div><div class='del'>-		if (status &gt;= 0 &amp;&amp; !nfs_write_match_verf(verf, req)) {</div><div class='del'>-			dreq-&gt;flags = NFS_ODIRECT_RESCHED_WRITES;</div><div class='add'>+		if (status &lt; 0) {</div><div class='add'>+			spin_lock(&amp;dreq-&gt;lock);</div><div class='add'>+			nfs_direct_truncate_request(dreq, req);</div><div class='add'>+			spin_unlock(&amp;dreq-&gt;lock);</div><div class='add'>+			nfs_release_request(req);</div><div class='add'>+		} else if (!nfs_write_match_verf(verf, req)) {</div><div class='add'>+			spin_lock(&amp;dreq-&gt;lock);</div><div class='add'>+			if (dreq-&gt;flags == 0)</div><div class='add'>+				dreq-&gt;flags = NFS_ODIRECT_RESCHED_WRITES;</div><div class='add'>+			spin_unlock(&amp;dreq-&gt;lock);</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Despite the reboot, the write was successful,</div><div class='ctx'> 			 * so reset wb_nio.</div><div class='ctx'> 			 */</div><div class='ctx'> 			req-&gt;wb_nio = 0;</div><div class='ctx'> 			nfs_mark_request_commit(req, NULL, &amp;cinfo, 0);</div><div class='del'>-		} else /* Error or match */</div><div class='add'>+		} else</div><div class='ctx'> 			nfs_release_request(req);</div><div class='ctx'> 		nfs_unlock_and_release_request(req);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -629,6 +675,8 @@ static void nfs_direct_resched_write(struct nfs_commit_info *cinfo,</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_direct_req *dreq = cinfo-&gt;dreq;</div><div class='ctx'> </div><div class='add'>+	trace_nfs_direct_resched_write(dreq);</div><div class='add'>+</div><div class='ctx'> 	spin_lock(&amp;dreq-&gt;lock);</div><div class='ctx'> 	if (dreq-&gt;flags != NFS_ODIRECT_DONE)</div><div class='ctx'> 		dreq-&gt;flags = NFS_ODIRECT_RESCHED_WRITES;</div><div class='hunk'>@@ -648,10 +696,17 @@ static void nfs_direct_commit_schedule(struct nfs_direct_req *dreq)</div><div class='ctx'> 	LIST_HEAD(mds_list);</div><div class='ctx'> </div><div class='ctx'> 	nfs_init_cinfo_from_dreq(&amp;cinfo, dreq);</div><div class='add'>+	nfs_commit_begin(cinfo.mds);</div><div class='ctx'> 	nfs_scan_commit(dreq-&gt;inode, &amp;mds_list, &amp;cinfo);</div><div class='ctx'> 	res = nfs_generic_commit_list(dreq-&gt;inode, &amp;mds_list, 0, &amp;cinfo);</div><div class='del'>-	if (res &lt; 0) /* res == -ENOMEM */</div><div class='del'>-		nfs_direct_write_reschedule(dreq);</div><div class='add'>+	if (res &lt; 0) { /* res == -ENOMEM */</div><div class='add'>+		spin_lock(&amp;dreq-&gt;lock);</div><div class='add'>+		if (dreq-&gt;flags == 0)</div><div class='add'>+			dreq-&gt;flags = NFS_ODIRECT_RESCHED_WRITES;</div><div class='add'>+		spin_unlock(&amp;dreq-&gt;lock);</div><div class='add'>+	}</div><div class='add'>+	if (nfs_commit_end(cinfo.mds))</div><div class='add'>+		nfs_direct_write_complete(dreq);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void nfs_direct_write_clear_reqs(struct nfs_direct_req *dreq)</div><div class='hunk'>@@ -666,6 +721,7 @@ static void nfs_direct_write_clear_reqs(struct nfs_direct_req *dreq)</div><div class='ctx'> 	while (!list_empty(&amp;reqs)) {</div><div class='ctx'> 		req = nfs_list_entry(reqs.next);</div><div class='ctx'> 		nfs_list_remove_request(req);</div><div class='add'>+		nfs_direct_truncate_request(dreq, req);</div><div class='ctx'> 		nfs_release_request(req);</div><div class='ctx'> 		nfs_unlock_and_release_request(req);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -693,6 +749,7 @@ static void nfs_direct_write_schedule_work(struct work_struct *work)</div><div class='ctx'> </div><div class='ctx'> static void nfs_direct_write_complete(struct nfs_direct_req *dreq)</div><div class='ctx'> {</div><div class='add'>+	trace_nfs_direct_write_complete(dreq);</div><div class='ctx'> 	queue_work(nfsiod_workqueue, &amp;dreq-&gt;work); /* Calls nfs_direct_write_schedule_work */</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -700,9 +757,11 @@ static void nfs_direct_write_completion(struct nfs_pgio_header *hdr)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_direct_req *dreq = hdr-&gt;dreq;</div><div class='ctx'> 	struct nfs_commit_info cinfo;</div><div class='del'>-	struct nfs_page *req = nfs_list_entry(hdr-&gt;pages.next);</div><div class='add'>+	struct inode *inode = dreq-&gt;inode;</div><div class='ctx'> 	int flags = NFS_ODIRECT_DONE;</div><div class='ctx'> </div><div class='add'>+	trace_nfs_direct_write_completion(dreq);</div><div class='add'>+</div><div class='ctx'> 	nfs_init_cinfo_from_dreq(&amp;cinfo, dreq);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;dreq-&gt;lock);</div><div class='hunk'>@@ -712,14 +771,21 @@ static void nfs_direct_write_completion(struct nfs_pgio_header *hdr)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	nfs_direct_count_bytes(dreq, hdr);</div><div class='del'>-	if (hdr-&gt;good_bytes != 0 &amp;&amp; nfs_write_need_commit(hdr)) {</div><div class='add'>+	if (test_bit(NFS_IOHDR_UNSTABLE_WRITES, &amp;hdr-&gt;flags) &amp;&amp;</div><div class='add'>+	    !test_bit(NFS_IOHDR_ERROR, &amp;hdr-&gt;flags)) {</div><div class='ctx'> 		if (!dreq-&gt;flags)</div><div class='ctx'> 			dreq-&gt;flags = NFS_ODIRECT_DO_COMMIT;</div><div class='ctx'> 		flags = dreq-&gt;flags;</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;dreq-&gt;lock);</div><div class='ctx'> </div><div class='add'>+	spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+	nfs_direct_file_adjust_size_locked(inode, dreq-&gt;io_start, dreq-&gt;count);</div><div class='add'>+	nfs_update_delegated_mtime_locked(dreq-&gt;inode);</div><div class='add'>+	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+</div><div class='ctx'> 	while (!list_empty(&amp;hdr-&gt;pages)) {</div><div class='add'>+		struct nfs_page *req;</div><div class='ctx'> </div><div class='ctx'> 		req = nfs_list_entry(hdr-&gt;pages.next);</div><div class='ctx'> 		nfs_list_remove_request(req);</div><div class='hunk'>@@ -756,16 +822,23 @@ static void nfs_write_sync_pgio_error(struct list_head *head, int error)</div><div class='ctx'> static void nfs_direct_write_reschedule_io(struct nfs_pgio_header *hdr)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_direct_req *dreq = hdr-&gt;dreq;</div><div class='add'>+	struct nfs_page *req;</div><div class='add'>+	struct nfs_commit_info cinfo;</div><div class='add'>+</div><div class='add'>+	trace_nfs_direct_write_reschedule_io(dreq);</div><div class='ctx'> </div><div class='add'>+	nfs_init_cinfo_from_dreq(&amp;cinfo, dreq);</div><div class='ctx'> 	spin_lock(&amp;dreq-&gt;lock);</div><div class='del'>-	if (dreq-&gt;error == 0) {</div><div class='add'>+	if (dreq-&gt;error == 0)</div><div class='ctx'> 		dreq-&gt;flags = NFS_ODIRECT_RESCHED_WRITES;</div><div class='del'>-		/* fake unstable write to let common nfs resend pages */</div><div class='del'>-		hdr-&gt;verf.committed = NFS_UNSTABLE;</div><div class='del'>-		hdr-&gt;good_bytes = hdr-&gt;args.offset + hdr-&gt;args.count -</div><div class='del'>-			hdr-&gt;io_start;</div><div class='del'>-	}</div><div class='add'>+	set_bit(NFS_IOHDR_REDO, &amp;hdr-&gt;flags);</div><div class='ctx'> 	spin_unlock(&amp;dreq-&gt;lock);</div><div class='add'>+	while (!list_empty(&amp;hdr-&gt;pages)) {</div><div class='add'>+		req = nfs_list_entry(hdr-&gt;pages.next);</div><div class='add'>+		nfs_list_remove_request(req);</div><div class='add'>+		nfs_unlock_request(req);</div><div class='add'>+		nfs_mark_request_commit(req, NULL, &amp;cinfo, 0);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct nfs_pgio_completion_ops nfs_direct_write_completion_ops = {</div><div class='hunk'>@@ -789,15 +862,19 @@ static const struct nfs_pgio_completion_ops nfs_direct_write_completion_ops = {</div><div class='ctx'>  */</div><div class='ctx'> static ssize_t nfs_direct_write_schedule_iovec(struct nfs_direct_req *dreq,</div><div class='ctx'> 					       struct iov_iter *iter,</div><div class='del'>-					       loff_t pos)</div><div class='add'>+					       loff_t pos, int ioflags)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_pageio_descriptor desc;</div><div class='ctx'> 	struct inode *inode = dreq-&gt;inode;</div><div class='add'>+	struct nfs_commit_info cinfo;</div><div class='ctx'> 	ssize_t result = 0;</div><div class='ctx'> 	size_t requested_bytes = 0;</div><div class='ctx'> 	size_t wsize = max_t(size_t, NFS_SERVER(inode)-&gt;wsize, PAGE_SIZE);</div><div class='add'>+	bool defer = false;</div><div class='add'>+</div><div class='add'>+	trace_nfs_direct_write_schedule_iovec(dreq);</div><div class='ctx'> </div><div class='del'>-	nfs_pageio_init_write(&amp;desc, inode, FLUSH_COND_STABLE, false,</div><div class='add'>+	nfs_pageio_init_write(&amp;desc, inode, ioflags, false,</div><div class='ctx'> 			      &amp;nfs_direct_write_completion_ops);</div><div class='ctx'> 	desc.pg_dreq = dreq;</div><div class='ctx'> 	get_dreq(dreq);</div><div class='hunk'>@@ -810,20 +887,19 @@ static ssize_t nfs_direct_write_schedule_iovec(struct nfs_direct_req *dreq,</div><div class='ctx'> 		size_t pgbase;</div><div class='ctx'> 		unsigned npages, i;</div><div class='ctx'> </div><div class='del'>-		result = iov_iter_get_pages_alloc(iter, &amp;pagevec, </div><div class='add'>+		result = iov_iter_get_pages_alloc2(iter, &amp;pagevec,</div><div class='ctx'> 						  wsize, &amp;pgbase);</div><div class='ctx'> 		if (result &lt; 0)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='ctx'> 		bytes = result;</div><div class='del'>-		iov_iter_advance(iter, bytes);</div><div class='ctx'> 		npages = (result + pgbase + PAGE_SIZE - 1) / PAGE_SIZE;</div><div class='ctx'> 		for (i = 0; i &lt; npages; i++) {</div><div class='ctx'> 			struct nfs_page *req;</div><div class='ctx'> 			unsigned int req_len = min_t(size_t, bytes, PAGE_SIZE - pgbase);</div><div class='ctx'> </div><div class='del'>-			req = nfs_create_request(dreq-&gt;ctx, pagevec[i],</div><div class='del'>-						 pgbase, req_len);</div><div class='add'>+			req = nfs_page_create_from_page(dreq-&gt;ctx, pagevec[i],</div><div class='add'>+							pgbase, pos, req_len);</div><div class='ctx'> 			if (IS_ERR(req)) {</div><div class='ctx'> 				result = PTR_ERR(req);</div><div class='ctx'> 				break;</div><div class='hunk'>@@ -835,19 +911,36 @@ static ssize_t nfs_direct_write_schedule_iovec(struct nfs_direct_req *dreq,</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='add'>+			pgbase = 0;</div><div class='add'>+			bytes -= req_len;</div><div class='add'>+			requested_bytes += req_len;</div><div class='add'>+			pos += req_len;</div><div class='add'>+</div><div class='add'>+			if (defer) {</div><div class='add'>+				nfs_mark_request_commit(req, NULL, &amp;cinfo, 0);</div><div class='add'>+				continue;</div><div class='add'>+			}</div><div class='add'>+</div><div class='ctx'> 			nfs_lock_request(req);</div><div class='del'>-			req-&gt;wb_index = pos &gt;&gt; PAGE_SHIFT;</div><div class='del'>-			req-&gt;wb_offset = pos &amp; ~PAGE_MASK;</div><div class='del'>-			if (!nfs_pageio_add_request(&amp;desc, req)) {</div><div class='add'>+			if (nfs_pageio_add_request(&amp;desc, req))</div><div class='add'>+				continue;</div><div class='add'>+</div><div class='add'>+			/* Exit on hard errors */</div><div class='add'>+			if (desc.pg_error &lt; 0 &amp;&amp; desc.pg_error != -EAGAIN) {</div><div class='ctx'> 				result = desc.pg_error;</div><div class='ctx'> 				nfs_unlock_and_release_request(req);</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='del'>-			pgbase = 0;</div><div class='del'>-			bytes -= req_len;</div><div class='del'>-			requested_bytes += req_len;</div><div class='del'>-			pos += req_len;</div><div class='del'>-			dreq-&gt;bytes_left -= req_len;</div><div class='add'>+</div><div class='add'>+			/* If the error is soft, defer remaining requests */</div><div class='add'>+			nfs_init_cinfo_from_dreq(&amp;cinfo, dreq);</div><div class='add'>+			spin_lock(&amp;dreq-&gt;lock);</div><div class='add'>+			dreq-&gt;flags = NFS_ODIRECT_RESCHED_WRITES;</div><div class='add'>+			spin_unlock(&amp;dreq-&gt;lock);</div><div class='add'>+			nfs_unlock_request(req);</div><div class='add'>+			nfs_mark_request_commit(req, NULL, &amp;cinfo, 0);</div><div class='add'>+			desc.pg_error = 0;</div><div class='add'>+			defer = true;</div><div class='ctx'> 		}</div><div class='ctx'> 		nfs_direct_release_pages(pagevec, npages);</div><div class='ctx'> 		kvfree(pagevec);</div><div class='hunk'>@@ -875,6 +968,7 @@ static ssize_t nfs_direct_write_schedule_iovec(struct nfs_direct_req *dreq,</div><div class='ctx'>  * nfs_file_direct_write - file direct write operation for NFS files</div><div class='ctx'>  * @iocb: target I/O control block</div><div class='ctx'>  * @iter: vector of user buffers from which to write data</div><div class='add'>+ * @swap: flag indicating this is swap IO, not O_DIRECT IO</div><div class='ctx'>  *</div><div class='ctx'>  * We use this function for direct writes instead of calling</div><div class='ctx'>  * generic_file_aio_write() in order to avoid taking the inode</div><div class='hunk'>@@ -891,7 +985,8 @@ static ssize_t nfs_direct_write_schedule_iovec(struct nfs_direct_req *dreq,</div><div class='ctx'>  * Note that O_APPEND is not supported for NFS direct writes, as there</div><div class='ctx'>  * is no atomic O_APPEND write facility in the NFS protocol.</div><div class='ctx'>  */</div><div class='del'>-ssize_t nfs_file_direct_write(struct kiocb *iocb, struct iov_iter *iter)</div><div class='add'>+ssize_t nfs_file_direct_write(struct kiocb *iocb, struct iov_iter *iter,</div><div class='add'>+			      bool swap)</div><div class='ctx'> {</div><div class='ctx'> 	ssize_t result, requested;</div><div class='ctx'> 	size_t count;</div><div class='hunk'>@@ -905,7 +1000,11 @@ ssize_t nfs_file_direct_write(struct kiocb *iocb, struct iov_iter *iter)</div><div class='ctx'> 	dfprintk(FILE, "NFS: direct write(%pD2, %zd@%Ld)\n",</div><div class='ctx'> 		file, iov_iter_count(iter), (long long) iocb-&gt;ki_pos);</div><div class='ctx'> </div><div class='del'>-	result = generic_write_checks(iocb, iter);</div><div class='add'>+	if (swap)</div><div class='add'>+		/* bypass generic checks */</div><div class='add'>+		result =  iov_iter_count(iter);</div><div class='add'>+	else</div><div class='add'>+		result = generic_write_checks(iocb, iter);</div><div class='ctx'> 	if (result &lt;= 0)</div><div class='ctx'> 		return result;</div><div class='ctx'> 	count = result;</div><div class='hunk'>@@ -922,7 +1021,7 @@ ssize_t nfs_file_direct_write(struct kiocb *iocb, struct iov_iter *iter)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	dreq-&gt;inode = inode;</div><div class='del'>-	dreq-&gt;bytes_left = dreq-&gt;max_count = count;</div><div class='add'>+	dreq-&gt;max_count = count;</div><div class='ctx'> 	dreq-&gt;io_start = pos;</div><div class='ctx'> 	dreq-&gt;ctx = get_nfs_open_context(nfs_file_open_context(iocb-&gt;ki_filp));</div><div class='ctx'> 	l_ctx = nfs_get_lock_context(dreq-&gt;ctx);</div><div class='hunk'>@@ -936,16 +1035,29 @@ ssize_t nfs_file_direct_write(struct kiocb *iocb, struct iov_iter *iter)</div><div class='ctx'> 		dreq-&gt;iocb = iocb;</div><div class='ctx'> 	pnfs_init_ds_commit_info_ops(&amp;dreq-&gt;ds_cinfo, inode);</div><div class='ctx'> </div><div class='del'>-	nfs_start_io_direct(inode);</div><div class='add'>+	if (swap) {</div><div class='add'>+		requested = nfs_direct_write_schedule_iovec(dreq, iter, pos,</div><div class='add'>+							    FLUSH_STABLE);</div><div class='add'>+	} else {</div><div class='add'>+		result = nfs_start_io_direct(inode);</div><div class='add'>+		if (result) {</div><div class='add'>+			/* release the reference that would usually be</div><div class='add'>+			 * consumed by nfs_direct_write_schedule_iovec()</div><div class='add'>+			 */</div><div class='add'>+			nfs_direct_req_release(dreq);</div><div class='add'>+			goto out_release;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	requested = nfs_direct_write_schedule_iovec(dreq, iter, pos);</div><div class='add'>+		requested = nfs_direct_write_schedule_iovec(dreq, iter, pos,</div><div class='add'>+							    FLUSH_COND_STABLE);</div><div class='ctx'> </div><div class='del'>-	if (mapping-&gt;nrpages) {</div><div class='del'>-		invalidate_inode_pages2_range(mapping,</div><div class='del'>-					      pos &gt;&gt; PAGE_SHIFT, end);</div><div class='del'>-	}</div><div class='add'>+		if (mapping-&gt;nrpages) {</div><div class='add'>+			invalidate_inode_pages2_range(mapping,</div><div class='add'>+						      pos &gt;&gt; PAGE_SHIFT, end);</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-	nfs_end_io_direct(inode);</div><div class='add'>+		nfs_end_io_direct(inode);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (requested &gt; 0) {</div><div class='ctx'> 		result = nfs_direct_wait(dreq);</div><div class='hunk'>@@ -959,6 +1071,7 @@ ssize_t nfs_file_direct_write(struct kiocb *iocb, struct iov_iter *iter)</div><div class='ctx'> 	} else {</div><div class='ctx'> 		result = requested;</div><div class='ctx'> 	}</div><div class='add'>+	nfs_fscache_invalidate(inode, FSCACHE_INVAL_DIO_WRITE);</div><div class='ctx'> out_release:</div><div class='ctx'> 	nfs_direct_req_release(dreq);</div><div class='ctx'> out:</div><div class='hunk'>@@ -973,8 +1086,7 @@ int __init nfs_init_directcache(void)</div><div class='ctx'> {</div><div class='ctx'> 	nfs_direct_cachep = kmem_cache_create("nfs_direct_cache",</div><div class='ctx'> 						sizeof(struct nfs_direct_req),</div><div class='del'>-						0, (SLAB_RECLAIM_ACCOUNT|</div><div class='del'>-							SLAB_MEM_SPREAD),</div><div class='add'>+						0, SLAB_RECLAIM_ACCOUNT,</div><div class='ctx'> 						NULL);</div><div class='ctx'> 	if (nfs_direct_cachep == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='head'>diff --git a/fs/nfs/dns_resolve.c b/fs/nfs/dns_resolve.c<br/>index e87d500ad95a..714975e5c0db 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/dns_resolve.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/dns_resolve.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/dns_resolve.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/dns_resolve.c</a></div><div class='hunk'>@@ -7,17 +7,20 @@</div><div class='ctx'>  * Resolves DNS hostnames into valid ip addresses</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_NFS_USE_KERNEL_DNS</div><div class='del'>-</div><div class='ctx'> #include &lt;linux/module.h&gt;</div><div class='ctx'> #include &lt;linux/sunrpc/clnt.h&gt;</div><div class='ctx'> #include &lt;linux/sunrpc/addr.h&gt;</div><div class='del'>-#include &lt;linux/dns_resolver.h&gt;</div><div class='add'>+</div><div class='ctx'> #include "dns_resolve.h"</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_NFS_USE_KERNEL_DNS</div><div class='add'>+</div><div class='add'>+#include &lt;linux/dns_resolver.h&gt;</div><div class='add'>+</div><div class='ctx'> ssize_t nfs_dns_resolve_name(struct net *net, char *name, size_t namelen,</div><div class='del'>-		struct sockaddr *sa, size_t salen)</div><div class='add'>+		struct sockaddr_storage *ss, size_t salen)</div><div class='ctx'> {</div><div class='add'>+	struct sockaddr *sa = (struct sockaddr *)ss;</div><div class='ctx'> 	ssize_t ret;</div><div class='ctx'> 	char *ip_addr = NULL;</div><div class='ctx'> 	int ip_len;</div><div class='hunk'>@@ -34,7 +37,6 @@ ssize_t nfs_dns_resolve_name(struct net *net, char *name, size_t namelen,</div><div class='ctx'> </div><div class='ctx'> #else</div><div class='ctx'> </div><div class='del'>-#include &lt;linux/module.h&gt;</div><div class='ctx'> #include &lt;linux/hash.h&gt;</div><div class='ctx'> #include &lt;linux/string.h&gt;</div><div class='ctx'> #include &lt;linux/kmod.h&gt;</div><div class='hunk'>@@ -42,15 +44,12 @@ ssize_t nfs_dns_resolve_name(struct net *net, char *name, size_t namelen,</div><div class='ctx'> #include &lt;linux/socket.h&gt;</div><div class='ctx'> #include &lt;linux/seq_file.h&gt;</div><div class='ctx'> #include &lt;linux/inet.h&gt;</div><div class='del'>-#include &lt;linux/sunrpc/clnt.h&gt;</div><div class='del'>-#include &lt;linux/sunrpc/addr.h&gt;</div><div class='ctx'> #include &lt;linux/sunrpc/cache.h&gt;</div><div class='ctx'> #include &lt;linux/sunrpc/svcauth.h&gt;</div><div class='ctx'> #include &lt;linux/sunrpc/rpc_pipe_fs.h&gt;</div><div class='ctx'> #include &lt;linux/nfs_fs.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "nfs4_fs.h"</div><div class='del'>-#include "dns_resolve.h"</div><div class='ctx'> #include "cache_lib.h"</div><div class='ctx'> #include "netns.h"</div><div class='ctx'> </div><div class='hunk'>@@ -341,7 +340,7 @@ out:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> ssize_t nfs_dns_resolve_name(struct net *net, char *name,</div><div class='del'>-		size_t namelen, struct sockaddr *sa, size_t salen)</div><div class='add'>+		size_t namelen, struct sockaddr_storage *ss, size_t salen)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_dns_ent key = {</div><div class='ctx'> 		.hostname = name,</div><div class='hunk'>@@ -354,7 +353,7 @@ ssize_t nfs_dns_resolve_name(struct net *net, char *name,</div><div class='ctx'> 	ret = do_cache_lookup_wait(nn-&gt;nfs_dns_resolve, &amp;key, &amp;item);</div><div class='ctx'> 	if (ret == 0) {</div><div class='ctx'> 		if (salen &gt;= item-&gt;addrlen) {</div><div class='del'>-			memcpy(sa, &amp;item-&gt;addr, item-&gt;addrlen);</div><div class='add'>+			memcpy(ss, &amp;item-&gt;addr, item-&gt;addrlen);</div><div class='ctx'> 			ret = item-&gt;addrlen;</div><div class='ctx'> 		} else</div><div class='ctx'> 			ret = -EOVERFLOW;</div><div class='head'>diff --git a/fs/nfs/dns_resolve.h b/fs/nfs/dns_resolve.h<br/>index 576ff4b54c82..fe3b172c4de1 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/dns_resolve.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/dns_resolve.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/dns_resolve.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/dns_resolve.h</a></div><div class='hunk'>@@ -32,6 +32,6 @@ extern void nfs_dns_resolver_cache_destroy(struct net *net);</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> extern ssize_t nfs_dns_resolve_name(struct net *net, char *name,</div><div class='del'>-		size_t namelen,	struct sockaddr *sa, size_t salen);</div><div class='add'>+		size_t namelen,	struct sockaddr_storage *sa, size_t salen);</div><div class='ctx'> </div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/nfs/export.c b/fs/nfs/export.c<br/>index 171c424cb6d5..a10dd5f9d078 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/export.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/export.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/export.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/export.c</a></div><div class='hunk'>@@ -42,7 +42,7 @@ nfs_encode_fh(struct inode *inode, __u32 *p, int *max_len, struct inode *parent)</div><div class='ctx'> 	dprintk("%s: max fh len %d inode %p parent %p",</div><div class='ctx'> 		__func__, *max_len, inode, parent);</div><div class='ctx'> </div><div class='del'>-	if (*max_len &lt; len || IS_AUTOMOUNT(inode)) {</div><div class='add'>+	if (*max_len &lt; len) {</div><div class='ctx'> 		dprintk("%s: fh len %d too small, required %d\n",</div><div class='ctx'> 			__func__, *max_len, len);</div><div class='ctx'> 		*max_len = len;</div><div class='hunk'>@@ -66,14 +66,21 @@ nfs_fh_to_dentry(struct super_block *sb, struct fid *fid,</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_fattr *fattr = NULL;</div><div class='ctx'> 	struct nfs_fh *server_fh = nfs_exp_embedfh(fid-&gt;raw);</div><div class='del'>-	size_t fh_size = offsetof(struct nfs_fh, data) + server_fh-&gt;size;</div><div class='add'>+	size_t fh_size = offsetof(struct nfs_fh, data);</div><div class='ctx'> 	const struct nfs_rpc_ops *rpc_ops;</div><div class='ctx'> 	struct dentry *dentry;</div><div class='ctx'> 	struct inode *inode;</div><div class='del'>-	int len = EMBED_FH_OFF + XDR_QUADLEN(fh_size);</div><div class='add'>+	int len = EMBED_FH_OFF;</div><div class='ctx'> 	u32 *p = fid-&gt;raw;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='add'>+	/* Initial check of bounds */</div><div class='add'>+	if (fh_len &lt; len + XDR_QUADLEN(fh_size) ||</div><div class='add'>+	    fh_len &gt; XDR_QUADLEN(NFS_MAXFHSIZE))</div><div class='add'>+		return NULL;</div><div class='add'>+	/* Calculate embedded filehandle size */</div><div class='add'>+	fh_size += server_fh-&gt;size;</div><div class='add'>+	len += XDR_QUADLEN(fh_size);</div><div class='ctx'> 	/* NULL translates to ESTALE */</div><div class='ctx'> 	if (fh_len &lt; len || fh_type != len)</div><div class='ctx'> 		return NULL;</div><div class='hunk'>@@ -145,18 +152,15 @@ out:</div><div class='ctx'> 	return parent;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static u64 nfs_fetch_iversion(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	nfs_revalidate_inode(inode, NFS_INO_INVALID_CHANGE);</div><div class='del'>-	return inode_peek_iversion_raw(inode);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> const struct export_operations nfs_export_ops = {</div><div class='ctx'> 	.encode_fh = nfs_encode_fh,</div><div class='ctx'> 	.fh_to_dentry = nfs_fh_to_dentry,</div><div class='ctx'> 	.get_parent = nfs_get_parent,</div><div class='del'>-	.fetch_iversion = nfs_fetch_iversion,</div><div class='del'>-	.flags = EXPORT_OP_NOWCC|EXPORT_OP_NOSUBTREECHK|</div><div class='del'>-		EXPORT_OP_CLOSE_BEFORE_UNLINK|EXPORT_OP_REMOTE_FS|</div><div class='del'>-		EXPORT_OP_NOATOMIC_ATTR|EXPORT_OP_SYNC_LOCKS,</div><div class='add'>+	.flags = EXPORT_OP_NOWCC		|</div><div class='add'>+		 EXPORT_OP_NOSUBTREECHK		|</div><div class='add'>+		 EXPORT_OP_CLOSE_BEFORE_UNLINK	|</div><div class='add'>+		 EXPORT_OP_REMOTE_FS		|</div><div class='add'>+		 EXPORT_OP_NOATOMIC_ATTR	|</div><div class='add'>+		 EXPORT_OP_FLUSH_ON_CLOSE	|</div><div class='add'>+		 EXPORT_OP_NOLOCKS,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/nfs/file.c b/fs/nfs/file.c<br/>index 24e7dccce355..d020aab40c64 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/file.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/file.c</a></div><div class='hunk'>@@ -28,9 +28,12 @@</div><div class='ctx'> #include &lt;linux/mm.h&gt;</div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='ctx'> #include &lt;linux/gfp.h&gt;</div><div class='add'>+#include &lt;linux/rmap.h&gt;</div><div class='ctx'> #include &lt;linux/swap.h&gt;</div><div class='add'>+#include &lt;linux/compaction.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/uaccess.h&gt;</div><div class='add'>+#include &lt;linux/filelock.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "delegation.h"</div><div class='ctx'> #include "internal.h"</div><div class='hunk'>@@ -44,11 +47,6 @@</div><div class='ctx'> </div><div class='ctx'> static const struct vm_operations_struct nfs_file_vm_ops;</div><div class='ctx'> </div><div class='del'>-/* Hack for future NFS swap support */</div><div class='del'>-#ifndef IS_SWAPFILE</div><div class='del'>-# define IS_SWAPFILE(inode)	(0)</div><div class='del'>-#endif</div><div class='del'>-</div><div class='ctx'> int nfs_check_flags(int flags)</div><div class='ctx'> {</div><div class='ctx'> 	if ((flags &amp; (O_APPEND | O_DIRECT)) == (O_APPEND | O_DIRECT))</div><div class='hunk'>@@ -74,6 +72,8 @@ nfs_file_open(struct inode *inode, struct file *filp)</div><div class='ctx'> 		return res;</div><div class='ctx'> </div><div class='ctx'> 	res = nfs_open(inode, filp);</div><div class='add'>+	if (res == 0)</div><div class='add'>+		filp-&gt;f_mode |= FMODE_CAN_ODIRECT;</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -84,6 +84,7 @@ nfs_file_release(struct inode *inode, struct file *filp)</div><div class='ctx'> </div><div class='ctx'> 	nfs_inc_stats(inode, NFSIOS_VFSRELEASE);</div><div class='ctx'> 	nfs_file_clear_open_context(filp);</div><div class='add'>+	nfs_fscache_release_file(inode, filp);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_file_release);</div><div class='hunk'>@@ -160,14 +161,19 @@ nfs_file_read(struct kiocb *iocb, struct iov_iter *to)</div><div class='ctx'> 	struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='ctx'> 	ssize_t result;</div><div class='ctx'> </div><div class='add'>+	trace_nfs_file_read(iocb, to);</div><div class='add'>+</div><div class='ctx'> 	if (iocb-&gt;ki_flags &amp; IOCB_DIRECT)</div><div class='del'>-		return nfs_file_direct_read(iocb, to);</div><div class='add'>+		return nfs_file_direct_read(iocb, to, false);</div><div class='ctx'> </div><div class='ctx'> 	dprintk("NFS: read(%pD2, %zu@%lu)\n",</div><div class='ctx'> 		iocb-&gt;ki_filp,</div><div class='ctx'> 		iov_iter_count(to), (unsigned long) iocb-&gt;ki_pos);</div><div class='ctx'> </div><div class='del'>-	nfs_start_io_read(inode);</div><div class='add'>+	result = nfs_start_io_read(inode);</div><div class='add'>+	if (result)</div><div class='add'>+		return result;</div><div class='add'>+</div><div class='ctx'> 	result = nfs_revalidate_mapping(inode, iocb-&gt;ki_filp-&gt;f_mapping);</div><div class='ctx'> 	if (!result) {</div><div class='ctx'> 		result = generic_file_read_iter(iocb, to);</div><div class='hunk'>@@ -179,25 +185,50 @@ nfs_file_read(struct kiocb *iocb, struct iov_iter *to)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_file_read);</div><div class='ctx'> </div><div class='add'>+ssize_t</div><div class='add'>+nfs_file_splice_read(struct file *in, loff_t *ppos, struct pipe_inode_info *pipe,</div><div class='add'>+		     size_t len, unsigned int flags)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file_inode(in);</div><div class='add'>+	ssize_t result;</div><div class='add'>+</div><div class='add'>+	dprintk("NFS: splice_read(%pD2, %zu@%llu)\n", in, len, *ppos);</div><div class='add'>+</div><div class='add'>+	result = nfs_start_io_read(inode);</div><div class='add'>+	if (result)</div><div class='add'>+		return result;</div><div class='add'>+</div><div class='add'>+	result = nfs_revalidate_mapping(inode, in-&gt;f_mapping);</div><div class='add'>+	if (!result) {</div><div class='add'>+		result = filemap_splice_read(in, ppos, pipe, len, flags);</div><div class='add'>+		if (result &gt; 0)</div><div class='add'>+			nfs_add_stats(inode, NFSIOS_NORMALREADBYTES, result);</div><div class='add'>+	}</div><div class='add'>+	nfs_end_io_read(inode);</div><div class='add'>+	return result;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(nfs_file_splice_read);</div><div class='add'>+</div><div class='ctx'> int</div><div class='del'>-nfs_file_mmap(struct file * file, struct vm_area_struct * vma)</div><div class='add'>+nfs_file_mmap_prepare(struct vm_area_desc *desc)</div><div class='ctx'> {</div><div class='add'>+	struct file *file = desc-&gt;file;</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='ctx'> 	int	status;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("NFS: mmap(%pD2)\n", file);</div><div class='ctx'> </div><div class='del'>-	/* Note: generic_file_mmap() returns ENOSYS on nommu systems</div><div class='add'>+	/* Note: generic_file_mmap_prepare() returns ENOSYS on nommu systems</div><div class='ctx'> 	 *       so we call that before revalidating the mapping</div><div class='ctx'> 	 */</div><div class='del'>-	status = generic_file_mmap(file, vma);</div><div class='add'>+	status = generic_file_mmap_prepare(desc);</div><div class='ctx'> 	if (!status) {</div><div class='del'>-		vma-&gt;vm_ops = &amp;nfs_file_vm_ops;</div><div class='add'>+		desc-&gt;vm_ops = &amp;nfs_file_vm_ops;</div><div class='ctx'> 		status = nfs_revalidate_mapping(inode, file-&gt;f_mapping);</div><div class='ctx'> 	}</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL_GPL(nfs_file_mmap);</div><div class='add'>+EXPORT_SYMBOL_GPL(nfs_file_mmap_prepare);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Flush any dirty pages for this process, and check for write errors.</div><div class='hunk'>@@ -208,22 +239,25 @@ static int</div><div class='ctx'> nfs_file_fsync_commit(struct file *file, int datasync)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='del'>-	int ret;</div><div class='add'>+	int ret, ret2;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("NFS: fsync file(%pD2) datasync %d\n", file, datasync);</div><div class='ctx'> </div><div class='ctx'> 	nfs_inc_stats(inode, NFSIOS_VFSFSYNC);</div><div class='ctx'> 	ret = nfs_commit_inode(inode, FLUSH_SYNC);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		return ret;</div><div class='del'>-	return file_check_and_advance_wb_err(file);</div><div class='add'>+	ret2 = file_check_and_advance_wb_err(file);</div><div class='add'>+	if (ret2 &lt; 0)</div><div class='add'>+		return ret2;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int</div><div class='ctx'> nfs_file_fsync(struct file *file, loff_t start, loff_t end, int datasync)</div><div class='ctx'> {</div><div class='del'>-	struct nfs_open_context *ctx = nfs_file_open_context(file);</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='add'>+	struct nfs_inode *nfsi = NFS_I(inode);</div><div class='add'>+	long save_nredirtied = atomic_long_read(&amp;nfsi-&gt;redirtied_pages);</div><div class='add'>+	long nredirtied;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	trace_nfs_fsync_enter(inode);</div><div class='hunk'>@@ -238,15 +272,10 @@ nfs_file_fsync(struct file *file, loff_t start, loff_t end, int datasync)</div><div class='ctx'> 		ret = pnfs_sync_inode(inode, !!datasync);</div><div class='ctx'> 		if (ret != 0)</div><div class='ctx'> 			break;</div><div class='del'>-		if (!test_and_clear_bit(NFS_CONTEXT_RESEND_WRITES, &amp;ctx-&gt;flags))</div><div class='add'>+		nredirtied = atomic_long_read(&amp;nfsi-&gt;redirtied_pages);</div><div class='add'>+		if (nredirtied == save_nredirtied)</div><div class='ctx'> 			break;</div><div class='del'>-		/*</div><div class='del'>-		 * If nfs_file_fsync_commit detected a server reboot, then</div><div class='del'>-		 * resend all dirty pages that might have been covered by</div><div class='del'>-		 * the NFS_CONTEXT_RESEND_WRITES flag</div><div class='del'>-		 */</div><div class='del'>-		start = 0;</div><div class='del'>-		end = LLONG_MAX;</div><div class='add'>+		save_nredirtied = nredirtied;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	trace_nfs_fsync_exit(inode, ret);</div><div class='hunk'>@@ -254,6 +283,37 @@ nfs_file_fsync(struct file *file, loff_t start, loff_t end, int datasync)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_file_fsync);</div><div class='ctx'> </div><div class='add'>+void nfs_truncate_last_folio(struct address_space *mapping, loff_t from,</div><div class='add'>+			     loff_t to)</div><div class='add'>+{</div><div class='add'>+	struct folio *folio;</div><div class='add'>+</div><div class='add'>+	if (from &gt;= to)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	folio = filemap_lock_folio(mapping, from &gt;&gt; PAGE_SHIFT);</div><div class='add'>+	if (IS_ERR(folio))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (folio_mkclean(folio))</div><div class='add'>+		folio_mark_dirty(folio);</div><div class='add'>+</div><div class='add'>+	if (folio_test_uptodate(folio)) {</div><div class='add'>+		loff_t fpos = folio_pos(folio);</div><div class='add'>+		size_t offset = from - fpos;</div><div class='add'>+		size_t end = folio_size(folio);</div><div class='add'>+</div><div class='add'>+		if (to - fpos &lt; end)</div><div class='add'>+			end = to - fpos;</div><div class='add'>+		folio_zero_segment(folio, offset, end);</div><div class='add'>+		trace_nfs_size_truncate_folio(mapping-&gt;host, to);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(nfs_truncate_last_folio);</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Decide whether a read/modify/write cycle may be more efficient</div><div class='ctx'>  * then a modify/write/read cycle when writing to a page in the</div><div class='hunk'>@@ -280,28 +340,31 @@ EXPORT_SYMBOL_GPL(nfs_file_fsync);</div><div class='ctx'>  * and that the new data won't completely replace the old data in</div><div class='ctx'>  * that range of the file.</div><div class='ctx'>  */</div><div class='del'>-static bool nfs_full_page_write(struct page *page, loff_t pos, unsigned int len)</div><div class='add'>+static bool nfs_folio_is_full_write(struct folio *folio, loff_t pos,</div><div class='add'>+				    unsigned int len)</div><div class='ctx'> {</div><div class='del'>-	unsigned int pglen = nfs_page_length(page);</div><div class='del'>-	unsigned int offset = pos &amp; (PAGE_SIZE - 1);</div><div class='add'>+	unsigned int pglen = nfs_folio_length(folio);</div><div class='add'>+	unsigned int offset = offset_in_folio(folio, pos);</div><div class='ctx'> 	unsigned int end = offset + len;</div><div class='ctx'> </div><div class='ctx'> 	return !pglen || (end &gt;= pglen &amp;&amp; !offset);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool nfs_want_read_modify_write(struct file *file, struct page *page,</div><div class='del'>-			loff_t pos, unsigned int len)</div><div class='add'>+static bool nfs_want_read_modify_write(struct file *file, struct folio *folio,</div><div class='add'>+				       loff_t pos, unsigned int len)</div><div class='ctx'> {</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Up-to-date pages, those with ongoing or full-page write</div><div class='ctx'> 	 * don't need read/modify/write</div><div class='ctx'> 	 */</div><div class='del'>-	if (PageUptodate(page) || PagePrivate(page) ||</div><div class='del'>-	    nfs_full_page_write(page, pos, len))</div><div class='add'>+	if (folio_test_uptodate(folio) || folio_test_private(folio) ||</div><div class='add'>+	    nfs_folio_is_full_write(folio, pos, len))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	if (pnfs_ld_read_whole_page(file-&gt;f_mapping-&gt;host))</div><div class='add'>+	if (pnfs_ld_read_whole_page(file_inode(file)))</div><div class='ctx'> 		return true;</div><div class='add'>+	if (folio_test_dropbehind(folio))</div><div class='add'>+		return false;</div><div class='ctx'> 	/* Open for reading too? */</div><div class='ctx'> 	if (file-&gt;f_mode &amp; FMODE_READ)</div><div class='ctx'> 		return true;</div><div class='hunk'>@@ -316,47 +379,59 @@ static bool nfs_want_read_modify_write(struct file *file, struct page *page,</div><div class='ctx'>  * If the writer ends up delaying the write, the writer needs to</div><div class='ctx'>  * increment the page use counts until he is done with the page.</div><div class='ctx'>  */</div><div class='del'>-static int nfs_write_begin(struct file *file, struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned flags,</div><div class='del'>-			struct page **pagep, void **fsdata)</div><div class='add'>+static int nfs_write_begin(const struct kiocb *iocb,</div><div class='add'>+			   struct address_space *mapping,</div><div class='add'>+			   loff_t pos, unsigned len, struct folio **foliop,</div><div class='add'>+			   void **fsdata)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='del'>-	pgoff_t index = pos &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='add'>+	struct file *file = iocb-&gt;ki_filp;</div><div class='ctx'> 	int once_thru = 0;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	trace_nfs_write_begin(file_inode(file), pos, len);</div><div class='ctx'> </div><div class='ctx'> 	dfprintk(PAGECACHE, "NFS: write_begin(%pD2(%lu), %u@%lld)\n",</div><div class='ctx'> 		file, mapping-&gt;host-&gt;i_ino, len, (long long) pos);</div><div class='add'>+	nfs_truncate_last_folio(mapping, i_size_read(mapping-&gt;host), pos);</div><div class='ctx'> </div><div class='ctx'> start:</div><div class='del'>-	page = grab_cache_page_write_begin(mapping, index, flags);</div><div class='del'>-	if (!page)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	*pagep = page;</div><div class='add'>+	folio = write_begin_get_folio(iocb, mapping, pos &gt;&gt; PAGE_SHIFT, len);</div><div class='add'>+	if (IS_ERR(folio)) {</div><div class='add'>+		ret = PTR_ERR(folio);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	*foliop = folio;</div><div class='ctx'> </div><div class='del'>-	ret = nfs_flush_incompatible(file, page);</div><div class='add'>+	ret = nfs_flush_incompatible(file, folio);</div><div class='ctx'> 	if (ret) {</div><div class='del'>-		unlock_page(page);</div><div class='del'>-		put_page(page);</div><div class='add'>+		folio_unlock(folio);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 	} else if (!once_thru &amp;&amp;</div><div class='del'>-		   nfs_want_read_modify_write(file, page, pos, len)) {</div><div class='add'>+		   nfs_want_read_modify_write(file, folio, pos, len)) {</div><div class='ctx'> 		once_thru = 1;</div><div class='del'>-		ret = nfs_readpage(file, page);</div><div class='del'>-		put_page(page);</div><div class='add'>+		folio_clear_dropbehind(folio);</div><div class='add'>+		ret = nfs_read_folio(file, folio);</div><div class='add'>+		folio_put(folio);</div><div class='ctx'> 		if (!ret)</div><div class='ctx'> 			goto start;</div><div class='ctx'> 	}</div><div class='add'>+out:</div><div class='add'>+	trace_nfs_write_begin_done(file_inode(file), pos, len, ret);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int nfs_write_end(struct file *file, struct address_space *mapping,</div><div class='del'>-			loff_t pos, unsigned len, unsigned copied,</div><div class='del'>-			struct page *page, void *fsdata)</div><div class='add'>+static int nfs_write_end(const struct kiocb *iocb,</div><div class='add'>+			 struct address_space *mapping,</div><div class='add'>+			 loff_t pos, unsigned len, unsigned copied,</div><div class='add'>+			 struct folio *folio, void *fsdata)</div><div class='ctx'> {</div><div class='del'>-	unsigned offset = pos &amp; (PAGE_SIZE - 1);</div><div class='add'>+	struct file *file = iocb-&gt;ki_filp;</div><div class='ctx'> 	struct nfs_open_context *ctx = nfs_file_open_context(file);</div><div class='add'>+	unsigned offset = offset_in_folio(folio, pos);</div><div class='ctx'> 	int status;</div><div class='ctx'> </div><div class='add'>+	trace_nfs_write_end(file_inode(file), pos, len);</div><div class='ctx'> 	dfprintk(PAGECACHE, "NFS: write_end(%pD2(%lu), %u@%lld)\n",</div><div class='ctx'> 		file, mapping-&gt;host-&gt;i_ino, len, (long long) pos);</div><div class='ctx'> </div><div class='hunk'>@@ -364,37 +439,37 @@ static int nfs_write_end(struct file *file, struct address_space *mapping,</div><div class='ctx'> 	 * Zero any uninitialised parts of the page, and then mark the page</div><div class='ctx'> 	 * as up to date if it turns out that we're extending the file.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!PageUptodate(page)) {</div><div class='del'>-		unsigned pglen = nfs_page_length(page);</div><div class='add'>+	if (!folio_test_uptodate(folio)) {</div><div class='add'>+		size_t fsize = folio_size(folio);</div><div class='add'>+		unsigned pglen = nfs_folio_length(folio);</div><div class='ctx'> 		unsigned end = offset + copied;</div><div class='ctx'> </div><div class='ctx'> 		if (pglen == 0) {</div><div class='del'>-			zero_user_segments(page, 0, offset,</div><div class='del'>-					end, PAGE_SIZE);</div><div class='del'>-			SetPageUptodate(page);</div><div class='add'>+			folio_zero_segments(folio, 0, offset, end, fsize);</div><div class='add'>+			folio_mark_uptodate(folio);</div><div class='ctx'> 		} else if (end &gt;= pglen) {</div><div class='del'>-			zero_user_segment(page, end, PAGE_SIZE);</div><div class='add'>+			folio_zero_segment(folio, end, fsize);</div><div class='ctx'> 			if (offset == 0)</div><div class='del'>-				SetPageUptodate(page);</div><div class='add'>+				folio_mark_uptodate(folio);</div><div class='ctx'> 		} else</div><div class='del'>-			zero_user_segment(page, pglen, PAGE_SIZE);</div><div class='add'>+			folio_zero_segment(folio, pglen, fsize);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	status = nfs_updatepage(file, page, offset, copied);</div><div class='add'>+	status = nfs_update_folio(file, folio, offset, copied);</div><div class='ctx'> </div><div class='del'>-	unlock_page(page);</div><div class='del'>-	put_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	folio_put(folio);</div><div class='ctx'> </div><div class='del'>-	if (status &lt; 0)</div><div class='add'>+	if (status &lt; 0) {</div><div class='add'>+		trace_nfs_write_end_done(file_inode(file), pos, len, status);</div><div class='ctx'> 		return status;</div><div class='add'>+	}</div><div class='ctx'> 	NFS_I(mapping-&gt;host)-&gt;write_io += copied;</div><div class='ctx'> </div><div class='del'>-	if (nfs_ctx_key_to_expire(ctx, mapping-&gt;host)) {</div><div class='del'>-		status = nfs_wb_all(mapping-&gt;host);</div><div class='del'>-		if (status &lt; 0)</div><div class='del'>-			return status;</div><div class='del'>-	}</div><div class='add'>+	if (nfs_ctx_key_to_expire(ctx, mapping-&gt;host))</div><div class='add'>+		nfs_wb_all(mapping-&gt;host);</div><div class='ctx'> </div><div class='add'>+	trace_nfs_write_end_done(file_inode(file), pos, len, copied);</div><div class='ctx'> 	return copied;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -405,49 +480,53 @@ static int nfs_write_end(struct file *file, struct address_space *mapping,</div><div class='ctx'>  * - Called if either PG_private or PG_fscache is set on the page</div><div class='ctx'>  * - Caller holds page lock</div><div class='ctx'>  */</div><div class='del'>-static void nfs_invalidate_page(struct page *page, unsigned int offset,</div><div class='del'>-				unsigned int length)</div><div class='add'>+static void nfs_invalidate_folio(struct folio *folio, size_t offset,</div><div class='add'>+				size_t length)</div><div class='ctx'> {</div><div class='del'>-	dfprintk(PAGECACHE, "NFS: invalidate_page(%p, %u, %u)\n",</div><div class='del'>-		 page, offset, length);</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+	dfprintk(PAGECACHE, "NFS: invalidate_folio(%lu, %zu, %zu)\n",</div><div class='add'>+		 folio-&gt;index, offset, length);</div><div class='ctx'> </div><div class='del'>-	if (offset != 0 || length &lt; PAGE_SIZE)</div><div class='del'>-		return;</div><div class='ctx'> 	/* Cancel any unstarted writes on this page */</div><div class='del'>-	nfs_wb_page_cancel(page_file_mapping(page)-&gt;host, page);</div><div class='del'>-</div><div class='del'>-	nfs_fscache_invalidate_page(page, page-&gt;mapping-&gt;host);</div><div class='add'>+	if (offset != 0 || length &lt; folio_size(folio))</div><div class='add'>+		nfs_wb_folio(inode, folio);</div><div class='add'>+	else</div><div class='add'>+		nfs_wb_folio_cancel(inode, folio);</div><div class='add'>+	folio_wait_private_2(folio); /* [DEPRECATED] */</div><div class='add'>+	trace_nfs_invalidate_folio(inode, folio_pos(folio) + offset, length);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Attempt to release the private state associated with a page</div><div class='del'>- * - Called if either PG_private or PG_fscache is set on the page</div><div class='del'>- * - Caller holds page lock</div><div class='del'>- * - Return true (may release page) or false (may not)</div><div class='add'>+ * Attempt to release the private state associated with a folio</div><div class='add'>+ * - Called if either private or fscache flags are set on the folio</div><div class='add'>+ * - Caller holds folio lock</div><div class='add'>+ * - Return true (may release folio) or false (may not)</div><div class='ctx'>  */</div><div class='del'>-static int nfs_release_page(struct page *page, gfp_t gfp)</div><div class='add'>+static bool nfs_release_folio(struct folio *folio, gfp_t gfp)</div><div class='ctx'> {</div><div class='del'>-	dfprintk(PAGECACHE, "NFS: release_page(%p)\n", page);</div><div class='del'>-</div><div class='del'>-	/* If PagePrivate() is set, then the page is not freeable */</div><div class='del'>-	if (PagePrivate(page))</div><div class='del'>-		return 0;</div><div class='del'>-	return nfs_fscache_release_page(page, gfp);</div><div class='add'>+	dfprintk(PAGECACHE, "NFS: release_folio(%p)\n", folio);</div><div class='add'>+</div><div class='add'>+	/* If the private flag is set, then the folio is not freeable */</div><div class='add'>+	if (folio_test_private(folio)) {</div><div class='add'>+		if ((current_gfp_context(gfp) &amp; GFP_KERNEL) != GFP_KERNEL ||</div><div class='add'>+		    current_is_kswapd() || current_is_kcompactd())</div><div class='add'>+			return false;</div><div class='add'>+		if (nfs_wb_folio(folio-&gt;mapping-&gt;host, folio) &lt; 0)</div><div class='add'>+			return false;</div><div class='add'>+	}</div><div class='add'>+	return nfs_fscache_release_folio(folio, gfp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void nfs_check_dirty_writeback(struct page *page,</div><div class='add'>+static void nfs_check_dirty_writeback(struct folio *folio,</div><div class='ctx'> 				bool *dirty, bool *writeback)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_inode *nfsi;</div><div class='del'>-	struct address_space *mapping = page_file_mapping(page);</div><div class='del'>-</div><div class='del'>-	if (!mapping || PageSwapCache(page))</div><div class='del'>-		return;</div><div class='add'>+	struct address_space *mapping = folio-&gt;mapping;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * Check if an unstable page is currently being committed and</div><div class='del'>-	 * if so, have the VM treat it as if the page is under writeback</div><div class='del'>-	 * so it will not block due to pages that will shortly be freeable.</div><div class='add'>+	 * Check if an unstable folio is currently being committed and</div><div class='add'>+	 * if so, have the VM treat it as if the folio is under writeback</div><div class='add'>+	 * so it will not block due to folios that will shortly be freeable.</div><div class='ctx'> 	 */</div><div class='ctx'> 	nfsi = NFS_I(mapping-&gt;host);</div><div class='ctx'> 	if (atomic_read(&amp;nfsi-&gt;commit_info.rpcs_out)) {</div><div class='hunk'>@@ -456,11 +535,11 @@ static void nfs_check_dirty_writeback(struct page *page,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * If PagePrivate() is set, then the page is not freeable and as the</div><div class='del'>-	 * inode is not being committed, it's not going to be cleaned in the</div><div class='del'>-	 * near future so treat it as dirty</div><div class='add'>+	 * If the private flag is set, then the folio is not freeable</div><div class='add'>+	 * and as the inode is not being committed, it's not going to</div><div class='add'>+	 * be cleaned in the near future so treat it as dirty</div><div class='ctx'> 	 */</div><div class='del'>-	if (PagePrivate(page))</div><div class='add'>+	if (folio_test_private(folio))</div><div class='ctx'> 		*dirty = true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -472,16 +551,19 @@ static void nfs_check_dirty_writeback(struct page *page,</div><div class='ctx'>  * - Caller holds page lock</div><div class='ctx'>  * - Return 0 if successful, -error otherwise</div><div class='ctx'>  */</div><div class='del'>-static int nfs_launder_page(struct page *page)</div><div class='add'>+static int nfs_launder_folio(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page_file_mapping(page)-&gt;host;</div><div class='del'>-	struct nfs_inode *nfsi = NFS_I(inode);</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	dfprintk(PAGECACHE, "NFS: launder_page(%ld, %llu)\n",</div><div class='del'>-		inode-&gt;i_ino, (long long)page_offset(page));</div><div class='add'>+	dfprintk(PAGECACHE, "NFS: launder_folio(%ld, %llu)\n",</div><div class='add'>+		inode-&gt;i_ino, folio_pos(folio));</div><div class='ctx'> </div><div class='del'>-	nfs_fscache_wait_on_page_write(nfsi, page);</div><div class='del'>-	return nfs_wb_page(inode, page);</div><div class='add'>+	folio_wait_private_2(folio); /* [DEPRECATED] */</div><div class='add'>+	ret = nfs_wb_folio(inode, folio);</div><div class='add'>+	trace_nfs_launder_folio_done(inode, folio_pos(folio),</div><div class='add'>+			folio_size(folio), ret);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int nfs_swap_activate(struct swap_info_struct *sis, struct file *file,</div><div class='hunk'>@@ -489,8 +571,10 @@ static int nfs_swap_activate(struct swap_info_struct *sis, struct file *file,</div><div class='ctx'> {</div><div class='ctx'> 	unsigned long blocks;</div><div class='ctx'> 	long long isize;</div><div class='del'>-	struct rpc_clnt *clnt = NFS_CLIENT(file-&gt;f_mapping-&gt;host);</div><div class='del'>-	struct inode *inode = file-&gt;f_mapping-&gt;host;</div><div class='add'>+	int ret;</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='add'>+	struct rpc_clnt *clnt = NFS_CLIENT(inode);</div><div class='add'>+	struct nfs_client *cl = NFS_SERVER(inode)-&gt;nfs_client;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	blocks = inode-&gt;i_blocks;</div><div class='hunk'>@@ -501,37 +585,51 @@ static int nfs_swap_activate(struct swap_info_struct *sis, struct file *file,</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	ret = rpc_clnt_swap_activate(clnt);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+	ret = add_swap_extent(sis, 0, sis-&gt;max, 0);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		rpc_clnt_swap_deactivate(clnt);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	*span = sis-&gt;pages;</div><div class='ctx'> </div><div class='del'>-	return rpc_clnt_swap_activate(clnt);</div><div class='add'>+	if (cl-&gt;rpc_ops-&gt;enable_swap)</div><div class='add'>+		cl-&gt;rpc_ops-&gt;enable_swap(inode);</div><div class='add'>+</div><div class='add'>+	sis-&gt;flags |= SWP_FS_OPS;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void nfs_swap_deactivate(struct file *file)</div><div class='ctx'> {</div><div class='del'>-	struct rpc_clnt *clnt = NFS_CLIENT(file-&gt;f_mapping-&gt;host);</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='add'>+	struct rpc_clnt *clnt = NFS_CLIENT(inode);</div><div class='add'>+	struct nfs_client *cl = NFS_SERVER(inode)-&gt;nfs_client;</div><div class='ctx'> </div><div class='ctx'> 	rpc_clnt_swap_deactivate(clnt);</div><div class='add'>+	if (cl-&gt;rpc_ops-&gt;disable_swap)</div><div class='add'>+		cl-&gt;rpc_ops-&gt;disable_swap(file_inode(file));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct address_space_operations nfs_file_aops = {</div><div class='del'>-	.readpage = nfs_readpage,</div><div class='del'>-	.readpages = nfs_readpages,</div><div class='del'>-	.set_page_dirty = __set_page_dirty_nobuffers,</div><div class='del'>-	.writepage = nfs_writepage,</div><div class='add'>+	.read_folio = nfs_read_folio,</div><div class='add'>+	.readahead = nfs_readahead,</div><div class='add'>+	.dirty_folio = filemap_dirty_folio,</div><div class='ctx'> 	.writepages = nfs_writepages,</div><div class='ctx'> 	.write_begin = nfs_write_begin,</div><div class='ctx'> 	.write_end = nfs_write_end,</div><div class='del'>-	.invalidatepage = nfs_invalidate_page,</div><div class='del'>-	.releasepage = nfs_release_page,</div><div class='del'>-	.direct_IO = nfs_direct_IO,</div><div class='del'>-#ifdef CONFIG_MIGRATION</div><div class='del'>-	.migratepage = nfs_migrate_page,</div><div class='del'>-#endif</div><div class='del'>-	.launder_page = nfs_launder_page,</div><div class='add'>+	.invalidate_folio = nfs_invalidate_folio,</div><div class='add'>+	.release_folio = nfs_release_folio,</div><div class='add'>+	.migrate_folio = nfs_migrate_folio,</div><div class='add'>+	.launder_folio = nfs_launder_folio,</div><div class='ctx'> 	.is_dirty_writeback = nfs_check_dirty_writeback,</div><div class='del'>-	.error_remove_page = generic_error_remove_page,</div><div class='add'>+	.error_remove_folio = generic_error_remove_folio,</div><div class='ctx'> 	.swap_activate = nfs_swap_activate,</div><div class='ctx'> 	.swap_deactivate = nfs_swap_deactivate,</div><div class='add'>+	.swap_rw = nfs_swap_rw,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -541,44 +639,49 @@ const struct address_space_operations nfs_file_aops = {</div><div class='ctx'>  */</div><div class='ctx'> static vm_fault_t nfs_vm_page_mkwrite(struct vm_fault *vmf)</div><div class='ctx'> {</div><div class='del'>-	struct page *page = vmf-&gt;page;</div><div class='ctx'> 	struct file *filp = vmf-&gt;vma-&gt;vm_file;</div><div class='ctx'> 	struct inode *inode = file_inode(filp);</div><div class='ctx'> 	unsigned pagelen;</div><div class='ctx'> 	vm_fault_t ret = VM_FAULT_NOPAGE;</div><div class='ctx'> 	struct address_space *mapping;</div><div class='add'>+	struct folio *folio = page_folio(vmf-&gt;page);</div><div class='ctx'> </div><div class='ctx'> 	dfprintk(PAGECACHE, "NFS: vm_page_mkwrite(%pD2(%lu), offset %lld)\n",</div><div class='del'>-		filp, filp-&gt;f_mapping-&gt;host-&gt;i_ino,</div><div class='del'>-		(long long)page_offset(page));</div><div class='add'>+		 filp, filp-&gt;f_mapping-&gt;host-&gt;i_ino,</div><div class='add'>+		 (long long)folio_pos(folio));</div><div class='ctx'> </div><div class='ctx'> 	sb_start_pagefault(inode-&gt;i_sb);</div><div class='ctx'> </div><div class='ctx'> 	/* make sure the cache has finished storing the page */</div><div class='del'>-	nfs_fscache_wait_on_page_write(NFS_I(inode), page);</div><div class='add'>+	if (folio_test_private_2(folio) &amp;&amp; /* [DEPRECATED] */</div><div class='add'>+	    folio_wait_private_2_killable(folio) &lt; 0) {</div><div class='add'>+		ret = VM_FAULT_RETRY;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	wait_on_bit_action(&amp;NFS_I(inode)-&gt;flags, NFS_INO_INVALIDATING,</div><div class='del'>-			nfs_wait_bit_killable, TASK_KILLABLE);</div><div class='add'>+			   nfs_wait_bit_killable,</div><div class='add'>+			   TASK_KILLABLE|TASK_FREEZABLE_UNSAFE);</div><div class='ctx'> </div><div class='del'>-	lock_page(page);</div><div class='del'>-	mapping = page_file_mapping(page);</div><div class='add'>+	folio_lock(folio);</div><div class='add'>+	mapping = folio-&gt;mapping;</div><div class='ctx'> 	if (mapping != inode-&gt;i_mapping)</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='del'>-	wait_on_page_writeback(page);</div><div class='add'>+	folio_wait_writeback(folio);</div><div class='ctx'> </div><div class='del'>-	pagelen = nfs_page_length(page);</div><div class='add'>+	pagelen = nfs_folio_length(folio);</div><div class='ctx'> 	if (pagelen == 0)</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='ctx'> 	ret = VM_FAULT_LOCKED;</div><div class='del'>-	if (nfs_flush_incompatible(filp, page) == 0 &amp;&amp;</div><div class='del'>-	    nfs_updatepage(filp, page, 0, pagelen) == 0)</div><div class='add'>+	if (nfs_flush_incompatible(filp, folio) == 0 &amp;&amp;</div><div class='add'>+	    nfs_update_folio(filp, folio, 0, pagelen) == 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	ret = VM_FAULT_SIGBUS;</div><div class='ctx'> out_unlock:</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	folio_unlock(folio);</div><div class='ctx'> out:</div><div class='ctx'> 	sb_end_pagefault(inode-&gt;i_sb);</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -590,18 +693,6 @@ static const struct vm_operations_struct nfs_file_vm_ops = {</div><div class='ctx'> 	.page_mkwrite = nfs_vm_page_mkwrite,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int nfs_need_check_write(struct file *filp, struct inode *inode,</div><div class='del'>-				int error)</div><div class='del'>-{</div><div class='del'>-	struct nfs_open_context *ctx;</div><div class='del'>-</div><div class='del'>-	ctx = nfs_file_open_context(filp);</div><div class='del'>-	if (nfs_error_is_fatal_on_server(error) ||</div><div class='del'>-	    nfs_ctx_key_to_expire(ctx, inode))</div><div class='del'>-		return 1;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> ssize_t nfs_file_write(struct kiocb *iocb, struct iov_iter *from)</div><div class='ctx'> {</div><div class='ctx'> 	struct file *file = iocb-&gt;ki_filp;</div><div class='hunk'>@@ -611,12 +702,14 @@ ssize_t nfs_file_write(struct kiocb *iocb, struct iov_iter *from)</div><div class='ctx'> 	errseq_t since;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='add'>+	trace_nfs_file_write(iocb, from);</div><div class='add'>+</div><div class='ctx'> 	result = nfs_key_timeout_notify(file, inode);</div><div class='ctx'> 	if (result)</div><div class='ctx'> 		return result;</div><div class='ctx'> </div><div class='ctx'> 	if (iocb-&gt;ki_flags &amp; IOCB_DIRECT)</div><div class='del'>-		return nfs_file_direct_write(iocb, from);</div><div class='add'>+		return nfs_file_direct_write(iocb, from, false);</div><div class='ctx'> </div><div class='ctx'> 	dprintk("NFS: write(%pD2, %zu@%Ld)\n",</div><div class='ctx'> 		file, iov_iter_count(from), (long long) iocb-&gt;ki_pos);</div><div class='hunk'>@@ -629,25 +722,24 @@ ssize_t nfs_file_write(struct kiocb *iocb, struct iov_iter *from)</div><div class='ctx'> 	if (iocb-&gt;ki_flags &amp; IOCB_APPEND || iocb-&gt;ki_pos &gt; i_size_read(inode)) {</div><div class='ctx'> 		result = nfs_revalidate_file_size(inode, file);</div><div class='ctx'> 		if (result)</div><div class='del'>-			goto out;</div><div class='add'>+			return result;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	nfs_clear_invalid_mapping(file-&gt;f_mapping);</div><div class='ctx'> </div><div class='ctx'> 	since = filemap_sample_wb_err(file-&gt;f_mapping);</div><div class='del'>-	nfs_start_io_write(inode);</div><div class='add'>+	error = nfs_start_io_write(inode);</div><div class='add'>+	if (error)</div><div class='add'>+		return error;</div><div class='ctx'> 	result = generic_write_checks(iocb, from);</div><div class='del'>-	if (result &gt; 0) {</div><div class='del'>-		current-&gt;backing_dev_info = inode_to_bdi(inode);</div><div class='del'>-		result = generic_perform_write(file, from, iocb-&gt;ki_pos);</div><div class='del'>-		current-&gt;backing_dev_info = NULL;</div><div class='del'>-	}</div><div class='add'>+	if (result &gt; 0)</div><div class='add'>+		result = generic_perform_write(iocb, from);</div><div class='ctx'> 	nfs_end_io_write(inode);</div><div class='ctx'> 	if (result &lt;= 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	written = result;</div><div class='del'>-	iocb-&gt;ki_pos += written;</div><div class='add'>+	nfs_add_stats(inode, NFSIOS_NORMALWRITTENBYTES, written);</div><div class='ctx'> </div><div class='ctx'> 	if (mntflags &amp; NFS_MOUNT_WRITE_EAGER) {</div><div class='ctx'> 		result = filemap_fdatawrite_range(file-&gt;f_mapping,</div><div class='hunk'>@@ -657,25 +749,28 @@ ssize_t nfs_file_write(struct kiocb *iocb, struct iov_iter *from)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (mntflags &amp; NFS_MOUNT_WRITE_WAIT) {</div><div class='del'>-		result = filemap_fdatawait_range(file-&gt;f_mapping,</div><div class='del'>-						 iocb-&gt;ki_pos - written,</div><div class='del'>-						 iocb-&gt;ki_pos - 1);</div><div class='del'>-		if (result &lt; 0)</div><div class='del'>-			goto out;</div><div class='add'>+		filemap_fdatawait_range(file-&gt;f_mapping,</div><div class='add'>+					iocb-&gt;ki_pos - written,</div><div class='add'>+					iocb-&gt;ki_pos - 1);</div><div class='ctx'> 	}</div><div class='ctx'> 	result = generic_write_sync(iocb, written);</div><div class='ctx'> 	if (result &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return result;</div><div class='ctx'> </div><div class='add'>+out:</div><div class='ctx'> 	/* Return error values */</div><div class='ctx'> 	error = filemap_check_wb_err(file-&gt;f_mapping, since);</div><div class='del'>-	if (nfs_need_check_write(file, inode, error)) {</div><div class='del'>-		int err = nfs_wb_all(inode);</div><div class='del'>-		if (err &lt; 0)</div><div class='del'>-			result = err;</div><div class='add'>+	switch (error) {</div><div class='add'>+	default:</div><div class='add'>+		break;</div><div class='add'>+	case -EDQUOT:</div><div class='add'>+	case -EFBIG:</div><div class='add'>+	case -ENOSPC:</div><div class='add'>+		nfs_wb_all(inode);</div><div class='add'>+		error = file_check_and_advance_wb_err(file);</div><div class='add'>+		if (error &lt; 0)</div><div class='add'>+			result = error;</div><div class='ctx'> 	}</div><div class='del'>-	nfs_add_stats(inode, NFSIOS_NORMALWRITTENBYTES, written);</div><div class='del'>-out:</div><div class='ctx'> 	return result;</div><div class='ctx'> </div><div class='ctx'> out_swapfile:</div><div class='hunk'>@@ -689,17 +784,17 @@ do_getlk(struct file *filp, int cmd, struct file_lock *fl, int is_local)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = filp-&gt;f_mapping-&gt;host;</div><div class='ctx'> 	int status = 0;</div><div class='del'>-	unsigned int saved_type = fl-&gt;fl_type;</div><div class='add'>+	unsigned int saved_type = fl-&gt;c.flc_type;</div><div class='ctx'> </div><div class='ctx'> 	/* Try local locking first */</div><div class='ctx'> 	posix_test_lock(filp, fl);</div><div class='del'>-	if (fl-&gt;fl_type != F_UNLCK) {</div><div class='add'>+	if (fl-&gt;c.flc_type != F_UNLCK) {</div><div class='ctx'> 		/* found a conflict */</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	fl-&gt;fl_type = saved_type;</div><div class='add'>+	fl-&gt;c.flc_type = saved_type;</div><div class='ctx'> </div><div class='del'>-	if (NFS_PROTO(inode)-&gt;have_delegation(inode, FMODE_READ))</div><div class='add'>+	if (nfs_have_read_or_write_delegation(inode))</div><div class='ctx'> 		goto out_noconflict;</div><div class='ctx'> </div><div class='ctx'> 	if (is_local)</div><div class='hunk'>@@ -709,7 +804,7 @@ do_getlk(struct file *filp, int cmd, struct file_lock *fl, int is_local)</div><div class='ctx'> out:</div><div class='ctx'> 	return status;</div><div class='ctx'> out_noconflict:</div><div class='del'>-	fl-&gt;fl_type = F_UNLCK;</div><div class='add'>+	fl-&gt;c.flc_type = F_UNLCK;</div><div class='ctx'> 	goto out;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -734,7 +829,7 @@ do_unlk(struct file *filp, int cmd, struct file_lock *fl, int is_local)</div><div class='ctx'> 		 * 	If we're signalled while cleaning up locks on process exit, we</div><div class='ctx'> 		 * 	still need to complete the unlock.</div><div class='ctx'> 		 */</div><div class='del'>-		if (status &lt; 0 &amp;&amp; !(fl-&gt;fl_flags &amp; FL_CLOSE))</div><div class='add'>+		if (status &lt; 0 &amp;&amp; !(fl-&gt;c.flc_flags &amp; FL_CLOSE))</div><div class='ctx'> 			return status;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -782,7 +877,7 @@ do_setlk(struct file *filp, int cmd, struct file_lock *fl, int is_local)</div><div class='ctx'> 	 * This makes locking act as a cache coherency point.</div><div class='ctx'> 	 */</div><div class='ctx'> 	nfs_sync_mapping(filp-&gt;f_mapping);</div><div class='del'>-	if (!NFS_PROTO(inode)-&gt;have_delegation(inode, FMODE_READ)) {</div><div class='add'>+	if (!nfs_have_read_or_write_delegation(inode)) {</div><div class='ctx'> 		nfs_zap_caches(inode);</div><div class='ctx'> 		if (mapping_mapped(filp-&gt;f_mapping))</div><div class='ctx'> 			nfs_revalidate_mapping(inode, filp-&gt;f_mapping);</div><div class='hunk'>@@ -801,12 +896,12 @@ int nfs_lock(struct file *filp, int cmd, struct file_lock *fl)</div><div class='ctx'> 	int is_local = 0;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("NFS: lock(%pD2, t=%x, fl=%x, r=%lld:%lld)\n",</div><div class='del'>-			filp, fl-&gt;fl_type, fl-&gt;fl_flags,</div><div class='add'>+			filp, fl-&gt;c.flc_type, fl-&gt;c.flc_flags,</div><div class='ctx'> 			(long long)fl-&gt;fl_start, (long long)fl-&gt;fl_end);</div><div class='ctx'> </div><div class='ctx'> 	nfs_inc_stats(inode, NFSIOS_VFSLOCK);</div><div class='ctx'> </div><div class='del'>-	if (fl-&gt;fl_flags &amp; FL_RECLAIM)</div><div class='add'>+	if (fl-&gt;c.flc_flags &amp; FL_RECLAIM)</div><div class='ctx'> 		return -ENOGRACE;</div><div class='ctx'> </div><div class='ctx'> 	if (NFS_SERVER(inode)-&gt;flags &amp; NFS_MOUNT_LOCAL_FCNTL)</div><div class='hunk'>@@ -820,7 +915,7 @@ int nfs_lock(struct file *filp, int cmd, struct file_lock *fl)</div><div class='ctx'> </div><div class='ctx'> 	if (IS_GETLK(cmd))</div><div class='ctx'> 		ret = do_getlk(filp, cmd, fl, is_local);</div><div class='del'>-	else if (fl-&gt;fl_type == F_UNLCK)</div><div class='add'>+	else if (lock_is_unlock(fl))</div><div class='ctx'> 		ret = do_unlk(filp, cmd, fl, is_local);</div><div class='ctx'> 	else</div><div class='ctx'> 		ret = do_setlk(filp, cmd, fl, is_local);</div><div class='hunk'>@@ -838,16 +933,16 @@ int nfs_flock(struct file *filp, int cmd, struct file_lock *fl)</div><div class='ctx'> 	int is_local = 0;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("NFS: flock(%pD2, t=%x, fl=%x)\n",</div><div class='del'>-			filp, fl-&gt;fl_type, fl-&gt;fl_flags);</div><div class='add'>+			filp, fl-&gt;c.flc_type, fl-&gt;c.flc_flags);</div><div class='ctx'> </div><div class='del'>-	if (!(fl-&gt;fl_flags &amp; FL_FLOCK))</div><div class='add'>+	if (!(fl-&gt;c.flc_flags &amp; FL_FLOCK))</div><div class='ctx'> 		return -ENOLCK;</div><div class='ctx'> </div><div class='ctx'> 	if (NFS_SERVER(inode)-&gt;flags &amp; NFS_MOUNT_LOCAL_FLOCK)</div><div class='ctx'> 		is_local = 1;</div><div class='ctx'> </div><div class='ctx'> 	/* We're simulating flock() locks using posix locks on the server */</div><div class='del'>-	if (fl-&gt;fl_type == F_UNLCK)</div><div class='add'>+	if (lock_is_unlock(fl))</div><div class='ctx'> 		return do_unlk(filp, cmd, fl, is_local);</div><div class='ctx'> 	return do_setlk(filp, cmd, fl, is_local);</div><div class='ctx'> }</div><div class='hunk'>@@ -857,16 +952,17 @@ const struct file_operations nfs_file_operations = {</div><div class='ctx'> 	.llseek		= nfs_file_llseek,</div><div class='ctx'> 	.read_iter	= nfs_file_read,</div><div class='ctx'> 	.write_iter	= nfs_file_write,</div><div class='del'>-	.mmap		= nfs_file_mmap,</div><div class='add'>+	.mmap_prepare	= nfs_file_mmap_prepare,</div><div class='ctx'> 	.open		= nfs_file_open,</div><div class='ctx'> 	.flush		= nfs_file_flush,</div><div class='ctx'> 	.release	= nfs_file_release,</div><div class='ctx'> 	.fsync		= nfs_file_fsync,</div><div class='ctx'> 	.lock		= nfs_lock,</div><div class='ctx'> 	.flock		= nfs_flock,</div><div class='del'>-	.splice_read	= generic_file_splice_read,</div><div class='add'>+	.splice_read	= nfs_file_splice_read,</div><div class='ctx'> 	.splice_write	= iter_file_splice_write,</div><div class='ctx'> 	.check_flags	= nfs_check_flags,</div><div class='ctx'> 	.setlease	= simple_nosetlease,</div><div class='add'>+	.fop_flags	= FOP_DONTCACHE,</div><div class='ctx'> };</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_file_operations);</div><div class='head'>diff --git a/fs/nfs/filelayout/filelayout.c b/fs/nfs/filelayout/filelayout.c<br/>index 9c96e3e5ed35..5c4551117c58 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/filelayout/filelayout.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/filelayout/filelayout.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/filelayout/filelayout.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/filelayout/filelayout.c</a></div><div class='hunk'>@@ -181,6 +181,8 @@ static int filelayout_async_handle_error(struct rpc_task *task,</div><div class='ctx'> 	case -EIO:</div><div class='ctx'> 	case -ETIMEDOUT:</div><div class='ctx'> 	case -EPIPE:</div><div class='add'>+	case -EPROTO:</div><div class='add'>+	case -ENODEV:</div><div class='ctx'> 		dprintk("%s DS connection error %d\n", __func__,</div><div class='ctx'> 			task-&gt;tk_status);</div><div class='ctx'> 		nfs4_mark_deviceid_unavailable(devid);</div><div class='hunk'>@@ -486,7 +488,7 @@ filelayout_read_pagelist(struct nfs_pgio_header *hdr)</div><div class='ctx'> 	/* Perform an asynchronous read to ds */</div><div class='ctx'> 	nfs_initiate_pgio(ds_clnt, hdr, hdr-&gt;cred,</div><div class='ctx'> 			  NFS_PROTO(hdr-&gt;inode), &amp;filelayout_read_call_ops,</div><div class='del'>-			  0, RPC_TASK_SOFTCONN);</div><div class='add'>+			  0, RPC_TASK_SOFTCONN, NULL);</div><div class='ctx'> 	return PNFS_ATTEMPTED;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -528,7 +530,7 @@ filelayout_write_pagelist(struct nfs_pgio_header *hdr, int sync)</div><div class='ctx'> 	/* Perform an asynchronous write */</div><div class='ctx'> 	nfs_initiate_pgio(ds_clnt, hdr, hdr-&gt;cred,</div><div class='ctx'> 			  NFS_PROTO(hdr-&gt;inode), &amp;filelayout_write_call_ops,</div><div class='del'>-			  sync, RPC_TASK_SOFTCONN);</div><div class='add'>+			  sync, RPC_TASK_SOFTCONN, NULL);</div><div class='ctx'> 	return PNFS_ATTEMPTED;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -603,14 +605,6 @@ filelayout_check_layout(struct pnfs_layout_hdr *lo,</div><div class='ctx'> </div><div class='ctx'> 	dprintk("--&gt; %s\n", __func__);</div><div class='ctx'> </div><div class='del'>-	/* FIXME: remove this check when layout segment support is added */</div><div class='del'>-	if (lgr-&gt;range.offset != 0 ||</div><div class='del'>-	    lgr-&gt;range.length != NFS4_MAX_UINT64) {</div><div class='del'>-		dprintk("%s Only whole file layouts supported. Use MDS i/o\n",</div><div class='del'>-			__func__);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	if (fl-&gt;pattern_offset &gt; lgr-&gt;range.offset) {</div><div class='ctx'> 		dprintk("%s pattern_offset %lld too large\n",</div><div class='ctx'> 				__func__, fl-&gt;pattern_offset);</div><div class='hunk'>@@ -652,19 +646,19 @@ filelayout_decode_layout(struct pnfs_layout_hdr *flo,</div><div class='ctx'> {</div><div class='ctx'> 	struct xdr_stream stream;</div><div class='ctx'> 	struct xdr_buf buf;</div><div class='del'>-	struct page *scratch;</div><div class='add'>+	struct folio *scratch;</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> 	uint32_t nfl_util;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("%s: set_layout_map Begin\n", __func__);</div><div class='ctx'> </div><div class='del'>-	scratch = alloc_page(gfp_flags);</div><div class='add'>+	scratch = folio_alloc(gfp_flags, 0);</div><div class='ctx'> 	if (!scratch)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	xdr_init_decode_pages(&amp;stream, &amp;buf, lgr-&gt;layoutp-&gt;pages, lgr-&gt;layoutp-&gt;len);</div><div class='del'>-	xdr_set_scratch_page(&amp;stream, scratch);</div><div class='add'>+	xdr_set_scratch_folio(&amp;stream, scratch);</div><div class='ctx'> </div><div class='ctx'> 	/* 20 = ufl_util (4), first_stripe_index (4), pattern_offset (8),</div><div class='ctx'> 	 * num_fh (4) */</div><div class='hunk'>@@ -730,11 +724,11 @@ filelayout_decode_layout(struct pnfs_layout_hdr *flo,</div><div class='ctx'> 			fl-&gt;fh_array[i]-&gt;size);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	__free_page(scratch);</div><div class='add'>+	folio_put(scratch);</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> out_err:</div><div class='del'>-	__free_page(scratch);</div><div class='add'>+	folio_put(scratch);</div><div class='ctx'> 	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -781,6 +775,12 @@ filelayout_alloc_lseg(struct pnfs_layout_hdr *layoutid,</div><div class='ctx'> 	return &amp;fl-&gt;generic_hdr;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool</div><div class='add'>+filelayout_lseg_is_striped(const struct nfs4_filelayout_segment *flseg)</div><div class='add'>+{</div><div class='add'>+	return flseg-&gt;num_fh &gt; 1;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * filelayout_pg_test(). Called by nfs_can_coalesce_requests()</div><div class='ctx'>  *</div><div class='hunk'>@@ -801,6 +801,8 @@ filelayout_pg_test(struct nfs_pageio_descriptor *pgio, struct nfs_page *prev,</div><div class='ctx'> 	size = pnfs_generic_pg_test(pgio, prev, req);</div><div class='ctx'> 	if (!size)</div><div class='ctx'> 		return 0;</div><div class='add'>+	else if (!filelayout_lseg_is_striped(FILELAYOUT_LSEG(pgio-&gt;pg_lseg)))</div><div class='add'>+		return size;</div><div class='ctx'> </div><div class='ctx'> 	/* see if req and prev are in the same stripe */</div><div class='ctx'> 	if (prev) {</div><div class='hunk'>@@ -839,7 +841,12 @@ fl_pnfs_update_layout(struct inode *ino,</div><div class='ctx'> </div><div class='ctx'> 	lseg = pnfs_update_layout(ino, ctx, pos, count, iomode, strict_iomode,</div><div class='ctx'> 				  gfp_flags);</div><div class='del'>-	if (IS_ERR_OR_NULL(lseg))</div><div class='add'>+	if (IS_ERR(lseg)) {</div><div class='add'>+		/* Fall back to MDS on recoverable errors */</div><div class='add'>+		if (!nfs_error_is_fatal_on_server(PTR_ERR(lseg)))</div><div class='add'>+			lseg = NULL;</div><div class='add'>+		goto out;</div><div class='add'>+	} else if (!lseg)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	lo = NFS_I(ino)-&gt;layout;</div><div class='hunk'>@@ -847,6 +854,8 @@ fl_pnfs_update_layout(struct inode *ino,</div><div class='ctx'> </div><div class='ctx'> 	status = filelayout_check_deviceid(lo, fl, gfp_flags);</div><div class='ctx'> 	if (status) {</div><div class='add'>+		pnfs_error_mark_layout_for_return(ino, lseg);</div><div class='add'>+		pnfs_set_lo_fail(lseg);</div><div class='ctx'> 		pnfs_put_lseg(lseg);</div><div class='ctx'> 		lseg = NULL;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -858,15 +867,15 @@ static void</div><div class='ctx'> filelayout_pg_init_read(struct nfs_pageio_descriptor *pgio,</div><div class='ctx'> 			struct nfs_page *req)</div><div class='ctx'> {</div><div class='del'>-	pnfs_generic_pg_check_layout(pgio);</div><div class='add'>+	pnfs_generic_pg_check_layout(pgio, req);</div><div class='ctx'> 	if (!pgio-&gt;pg_lseg) {</div><div class='ctx'> 		pgio-&gt;pg_lseg = fl_pnfs_update_layout(pgio-&gt;pg_inode,</div><div class='ctx'> 						      nfs_req_openctx(req),</div><div class='del'>-						      0,</div><div class='del'>-						      NFS4_MAX_UINT64,</div><div class='add'>+						      req_offset(req),</div><div class='add'>+						      req-&gt;wb_bytes,</div><div class='ctx'> 						      IOMODE_READ,</div><div class='ctx'> 						      false,</div><div class='del'>-						      GFP_KERNEL);</div><div class='add'>+						      nfs_io_gfp_mask());</div><div class='ctx'> 		if (IS_ERR(pgio-&gt;pg_lseg)) {</div><div class='ctx'> 			pgio-&gt;pg_error = PTR_ERR(pgio-&gt;pg_lseg);</div><div class='ctx'> 			pgio-&gt;pg_lseg = NULL;</div><div class='hunk'>@@ -882,15 +891,15 @@ static void</div><div class='ctx'> filelayout_pg_init_write(struct nfs_pageio_descriptor *pgio,</div><div class='ctx'> 			 struct nfs_page *req)</div><div class='ctx'> {</div><div class='del'>-	pnfs_generic_pg_check_layout(pgio);</div><div class='add'>+	pnfs_generic_pg_check_layout(pgio, req);</div><div class='ctx'> 	if (!pgio-&gt;pg_lseg) {</div><div class='ctx'> 		pgio-&gt;pg_lseg = fl_pnfs_update_layout(pgio-&gt;pg_inode,</div><div class='ctx'> 						      nfs_req_openctx(req),</div><div class='del'>-						      0,</div><div class='del'>-						      NFS4_MAX_UINT64,</div><div class='add'>+						      req_offset(req),</div><div class='add'>+						      req-&gt;wb_bytes,</div><div class='ctx'> 						      IOMODE_RW,</div><div class='ctx'> 						      false,</div><div class='del'>-						      GFP_NOFS);</div><div class='add'>+						      nfs_io_gfp_mask());</div><div class='ctx'> 		if (IS_ERR(pgio-&gt;pg_lseg)) {</div><div class='ctx'> 			pgio-&gt;pg_error = PTR_ERR(pgio-&gt;pg_lseg);</div><div class='ctx'> 			pgio-&gt;pg_lseg = NULL;</div><div class='hunk'>@@ -1002,7 +1011,7 @@ static int filelayout_initiate_commit(struct nfs_commit_data *data, int how)</div><div class='ctx'> 		data-&gt;args.fh = fh;</div><div class='ctx'> 	return nfs_initiate_commit(ds_clnt, data, NFS_PROTO(data-&gt;inode),</div><div class='ctx'> 				   &amp;filelayout_commit_call_ops, how,</div><div class='del'>-				   RPC_TASK_SOFTCONN);</div><div class='add'>+				   RPC_TASK_SOFTCONN, NULL);</div><div class='ctx'> out_err:</div><div class='ctx'> 	pnfs_generic_prepare_to_resend_writes(data);</div><div class='ctx'> 	pnfs_generic_commit_release(data);</div><div class='hunk'>@@ -1075,7 +1084,7 @@ filelayout_setup_ds_info(struct pnfs_ds_commit_info *fl_cinfo,</div><div class='ctx'> 	unsigned int size = (fl-&gt;stripe_type == STRIPE_SPARSE) ?</div><div class='ctx'> 		fl-&gt;dsaddr-&gt;ds_num : fl-&gt;dsaddr-&gt;stripe_count;</div><div class='ctx'> </div><div class='del'>-	new = pnfs_alloc_commit_array(size, GFP_NOIO);</div><div class='add'>+	new = pnfs_alloc_commit_array(size, nfs_io_gfp_mask());</div><div class='ctx'> 	if (new) {</div><div class='ctx'> 		spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 		array = pnfs_add_commit_array(fl_cinfo, new, lseg);</div><div class='hunk'>@@ -1101,7 +1110,6 @@ static const struct pnfs_commit_ops filelayout_commit_ops = {</div><div class='ctx'> 	.clear_request_commit	= pnfs_generic_clear_request_commit,</div><div class='ctx'> 	.scan_commit_lists	= pnfs_generic_scan_commit_lists,</div><div class='ctx'> 	.recover_commit_reqs	= pnfs_generic_recover_commit_reqs,</div><div class='del'>-	.search_commit_reqs	= pnfs_generic_search_commit_reqs,</div><div class='ctx'> 	.commit_pagelist	= filelayout_commit_pagelist,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='head'>diff --git a/fs/nfs/filelayout/filelayout.h b/fs/nfs/filelayout/filelayout.h<br/>index 79323b5dab0c..c7bb5da93307 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/filelayout/filelayout.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/filelayout/filelayout.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/filelayout/filelayout.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/filelayout/filelayout.h</a></div><div class='hunk'>@@ -51,7 +51,7 @@ struct nfs4_file_layout_dsaddr {</div><div class='ctx'> 	u32				stripe_count;</div><div class='ctx'> 	u8				*stripe_indices;</div><div class='ctx'> 	u32				ds_num;</div><div class='del'>-	struct nfs4_pnfs_ds		*ds_list[1];</div><div class='add'>+	struct nfs4_pnfs_ds		*ds_list[] __counted_by(ds_num);</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct nfs4_filelayout_segment {</div><div class='head'>diff --git a/fs/nfs/filelayout/filelayoutdev.c b/fs/nfs/filelayout/filelayoutdev.c<br/>index 86c3f7e69ec4..df79aeb68db4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/filelayout/filelayoutdev.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/filelayout/filelayoutdev.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/filelayout/filelayoutdev.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/filelayout/filelayoutdev.c</a></div><div class='hunk'>@@ -35,6 +35,7 @@</div><div class='ctx'> #include "../internal.h"</div><div class='ctx'> #include "../nfs4session.h"</div><div class='ctx'> #include "filelayout.h"</div><div class='add'>+#include "../nfs4trace.h"</div><div class='ctx'> </div><div class='ctx'> #define NFSDBG_FACILITY		NFSDBG_PNFS_LD</div><div class='ctx'> </div><div class='hunk'>@@ -72,17 +73,18 @@ nfs4_fl_alloc_deviceid_node(struct nfs_server *server, struct pnfs_device *pdev,</div><div class='ctx'> 	struct nfs4_file_layout_dsaddr *dsaddr = NULL;</div><div class='ctx'> 	struct xdr_stream stream;</div><div class='ctx'> 	struct xdr_buf buf;</div><div class='del'>-	struct page *scratch;</div><div class='add'>+	struct folio *scratch;</div><div class='ctx'> 	struct list_head dsaddrs;</div><div class='ctx'> 	struct nfs4_pnfs_ds_addr *da;</div><div class='add'>+	struct net *net = server-&gt;nfs_client-&gt;cl_net;</div><div class='ctx'> </div><div class='ctx'> 	/* set up xdr stream */</div><div class='del'>-	scratch = alloc_page(gfp_flags);</div><div class='add'>+	scratch = folio_alloc(gfp_flags, 0);</div><div class='ctx'> 	if (!scratch)</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> </div><div class='ctx'> 	xdr_init_decode_pages(&amp;stream, &amp;buf, pdev-&gt;pages, pdev-&gt;pglen);</div><div class='del'>-	xdr_set_scratch_page(&amp;stream, scratch);</div><div class='add'>+	xdr_set_scratch_folio(&amp;stream, scratch);</div><div class='ctx'> </div><div class='ctx'> 	/* Get the stripe count (number of stripe index) */</div><div class='ctx'> 	p = xdr_inline_decode(&amp;stream, 4);</div><div class='hunk'>@@ -136,9 +138,7 @@ nfs4_fl_alloc_deviceid_node(struct nfs_server *server, struct pnfs_device *pdev,</div><div class='ctx'> 		goto out_err_free_stripe_indices;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dsaddr = kzalloc(sizeof(*dsaddr) +</div><div class='del'>-			(sizeof(struct nfs4_pnfs_ds *) * (num - 1)),</div><div class='del'>-			gfp_flags);</div><div class='add'>+	dsaddr = kzalloc(struct_size(dsaddr, ds_list, num), gfp_flags);</div><div class='ctx'> 	if (!dsaddr)</div><div class='ctx'> 		goto out_err_free_stripe_indices;</div><div class='ctx'> </div><div class='hunk'>@@ -160,8 +160,7 @@ nfs4_fl_alloc_deviceid_node(struct nfs_server *server, struct pnfs_device *pdev,</div><div class='ctx'> </div><div class='ctx'> 		mp_count = be32_to_cpup(p); /* multipath count */</div><div class='ctx'> 		for (j = 0; j &lt; mp_count; j++) {</div><div class='del'>-			da = nfs4_decode_mp_ds_addr(server-&gt;nfs_client-&gt;cl_net,</div><div class='del'>-						    &amp;stream, gfp_flags);</div><div class='add'>+			da = nfs4_decode_mp_ds_addr(net, &amp;stream, gfp_flags);</div><div class='ctx'> 			if (da)</div><div class='ctx'> 				list_add_tail(&amp;da-&gt;da_node, &amp;dsaddrs);</div><div class='ctx'> 		}</div><div class='hunk'>@@ -171,9 +170,10 @@ nfs4_fl_alloc_deviceid_node(struct nfs_server *server, struct pnfs_device *pdev,</div><div class='ctx'> 			goto out_err_free_deviceid;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		dsaddr-&gt;ds_list[i] = nfs4_pnfs_ds_add(&amp;dsaddrs, gfp_flags);</div><div class='add'>+		dsaddr-&gt;ds_list[i] = nfs4_pnfs_ds_add(net, &amp;dsaddrs, gfp_flags);</div><div class='ctx'> 		if (!dsaddr-&gt;ds_list[i])</div><div class='ctx'> 			goto out_err_drain_dsaddrs;</div><div class='add'>+		trace_fl_getdevinfo(server, &amp;pdev-&gt;dev_id, dsaddr-&gt;ds_list[i]-&gt;ds_remotestr);</div><div class='ctx'> </div><div class='ctx'> 		/* If DS was already in cache, free ds addrs */</div><div class='ctx'> 		while (!list_empty(&amp;dsaddrs)) {</div><div class='hunk'>@@ -186,7 +186,7 @@ nfs4_fl_alloc_deviceid_node(struct nfs_server *server, struct pnfs_device *pdev,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	__free_page(scratch);</div><div class='add'>+	folio_put(scratch);</div><div class='ctx'> 	return dsaddr;</div><div class='ctx'> </div><div class='ctx'> out_err_drain_dsaddrs:</div><div class='hunk'>@@ -204,7 +204,7 @@ out_err_free_deviceid:</div><div class='ctx'> out_err_free_stripe_indices:</div><div class='ctx'> 	kfree(stripe_indices);</div><div class='ctx'> out_err_free_scratch:</div><div class='del'>-	__free_page(scratch);</div><div class='add'>+	folio_put(scratch);</div><div class='ctx'> out_err:</div><div class='ctx'> 	dprintk("%s ERROR: returning NULL\n", __func__);</div><div class='ctx'> 	return NULL;</div><div class='head'>diff --git a/fs/nfs/flexfilelayout/flexfilelayout.c b/fs/nfs/flexfilelayout/flexfilelayout.c<br/>index a553d59afa8b..9056f05a67dc 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/flexfilelayout/flexfilelayout.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/flexfilelayout/flexfilelayout.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/flexfilelayout/flexfilelayout.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/flexfilelayout/flexfilelayout.c</a></div><div class='hunk'>@@ -11,6 +11,7 @@</div><div class='ctx'> #include &lt;linux/nfs_mount.h&gt;</div><div class='ctx'> #include &lt;linux/nfs_page.h&gt;</div><div class='ctx'> #include &lt;linux/module.h&gt;</div><div class='add'>+#include &lt;linux/file.h&gt;</div><div class='ctx'> #include &lt;linux/sched/mm.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/sunrpc/metrics.h&gt;</div><div class='hunk'>@@ -30,17 +31,23 @@</div><div class='ctx'> #define FF_LAYOUT_POLL_RETRY_MAX     (15*HZ)</div><div class='ctx'> #define FF_LAYOUTRETURN_MAXERR 20</div><div class='ctx'> </div><div class='add'>+enum nfs4_ff_op_type {</div><div class='add'>+	NFS4_FF_OP_LAYOUTSTATS,</div><div class='add'>+	NFS4_FF_OP_LAYOUTRETURN,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> static unsigned short io_maxretrans;</div><div class='ctx'> </div><div class='ctx'> static const struct pnfs_commit_ops ff_layout_commit_ops;</div><div class='ctx'> static void ff_layout_read_record_layoutstats_done(struct rpc_task *task,</div><div class='ctx'> 		struct nfs_pgio_header *hdr);</div><div class='del'>-static int ff_layout_mirror_prepare_stats(struct pnfs_layout_hdr *lo,</div><div class='add'>+static int</div><div class='add'>+ff_layout_mirror_prepare_stats(struct pnfs_layout_hdr *lo,</div><div class='ctx'> 			       struct nfs42_layoutstat_devinfo *devinfo,</div><div class='del'>-			       int dev_limit);</div><div class='add'>+			       int dev_limit, enum nfs4_ff_op_type type);</div><div class='ctx'> static void ff_layout_encode_ff_layoutupdate(struct xdr_stream *xdr,</div><div class='ctx'> 			      const struct nfs42_layoutstat_devinfo *devinfo,</div><div class='del'>-			      struct nfs4_ff_layout_mirror *mirror);</div><div class='add'>+			      struct nfs4_ff_layout_ds_stripe *dss_info);</div><div class='ctx'> </div><div class='ctx'> static struct pnfs_layout_hdr *</div><div class='ctx'> ff_layout_alloc_layout_hdr(struct inode *inode, gfp_t gfp_flags)</div><div class='hunk'>@@ -156,18 +163,33 @@ decode_name(struct xdr_stream *xdr, u32 *id)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool ff_mirror_match_fh(const struct nfs4_ff_layout_mirror *m1,</div><div class='del'>-		const struct nfs4_ff_layout_mirror *m2)</div><div class='add'>+static struct nfsd_file *</div><div class='add'>+ff_local_open_fh(struct pnfs_layout_segment *lseg, u32 ds_idx, u32 dss_id,</div><div class='add'>+		 struct nfs_client *clp, const struct cred *cred,</div><div class='add'>+		 struct nfs_fh *fh, fmode_t mode)</div><div class='add'>+{</div><div class='add'>+#if IS_ENABLED(CONFIG_NFS_LOCALIO)</div><div class='add'>+	struct nfs4_ff_layout_mirror *mirror = FF_LAYOUT_COMP(lseg, ds_idx);</div><div class='add'>+</div><div class='add'>+	return nfs_local_open_fh(clp, cred, fh, &amp;mirror-&gt;dss[dss_id].nfl, mode);</div><div class='add'>+#else</div><div class='add'>+	return NULL;</div><div class='add'>+#endif</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool ff_dss_match_fh(const struct nfs4_ff_layout_ds_stripe *dss1,</div><div class='add'>+		const struct nfs4_ff_layout_ds_stripe *dss2)</div><div class='ctx'> {</div><div class='ctx'> 	int i, j;</div><div class='ctx'> </div><div class='del'>-	if (m1-&gt;fh_versions_cnt != m2-&gt;fh_versions_cnt)</div><div class='add'>+	if (dss1-&gt;fh_versions_cnt != dss2-&gt;fh_versions_cnt)</div><div class='ctx'> 		return false;</div><div class='del'>-	for (i = 0; i &lt; m1-&gt;fh_versions_cnt; i++) {</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; dss1-&gt;fh_versions_cnt; i++) {</div><div class='ctx'> 		bool found_fh = false;</div><div class='del'>-		for (j = 0; j &lt; m2-&gt;fh_versions_cnt; j++) {</div><div class='del'>-			if (nfs_compare_fh(&amp;m1-&gt;fh_versions[i],</div><div class='del'>-					&amp;m2-&gt;fh_versions[j]) == 0) {</div><div class='add'>+		for (j = 0; j &lt; dss2-&gt;fh_versions_cnt; j++) {</div><div class='add'>+			if (nfs_compare_fh(&amp;dss1-&gt;fh_versions[i],</div><div class='add'>+					&amp;dss2-&gt;fh_versions[j]) == 0) {</div><div class='ctx'> 				found_fh = true;</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='hunk'>@@ -178,6 +200,38 @@ static bool ff_mirror_match_fh(const struct nfs4_ff_layout_mirror *m1,</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool ff_mirror_match_fh(const struct nfs4_ff_layout_mirror *m1,</div><div class='add'>+		const struct nfs4_ff_layout_mirror *m2)</div><div class='add'>+{</div><div class='add'>+	u32 dss_id;</div><div class='add'>+</div><div class='add'>+	if (m1-&gt;dss_count != m2-&gt;dss_count)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	for (dss_id = 0; dss_id &lt; m1-&gt;dss_count; dss_id++)</div><div class='add'>+		if (!ff_dss_match_fh(&amp;m1-&gt;dss[dss_id], &amp;m2-&gt;dss[dss_id]))</div><div class='add'>+			return false;</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool ff_mirror_match_devid(const struct nfs4_ff_layout_mirror *m1,</div><div class='add'>+		const struct nfs4_ff_layout_mirror *m2)</div><div class='add'>+{</div><div class='add'>+	u32 dss_id;</div><div class='add'>+</div><div class='add'>+	if (m1-&gt;dss_count != m2-&gt;dss_count)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	for (dss_id = 0; dss_id &lt; m1-&gt;dss_count; dss_id++)</div><div class='add'>+		if (memcmp(&amp;m1-&gt;dss[dss_id].devid,</div><div class='add'>+			   &amp;m2-&gt;dss[dss_id].devid,</div><div class='add'>+			   sizeof(m1-&gt;dss[dss_id].devid)) != 0)</div><div class='add'>+			return false;</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static struct nfs4_ff_layout_mirror *</div><div class='ctx'> ff_layout_add_mirror(struct pnfs_layout_hdr *lo,</div><div class='ctx'> 		struct nfs4_ff_layout_mirror *mirror)</div><div class='hunk'>@@ -188,7 +242,7 @@ ff_layout_add_mirror(struct pnfs_layout_hdr *lo,</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	list_for_each_entry(pos, &amp;ff_layout-&gt;mirrors, mirrors) {</div><div class='del'>-		if (memcmp(&amp;mirror-&gt;devid, &amp;pos-&gt;devid, sizeof(pos-&gt;devid)) != 0)</div><div class='add'>+		if (!ff_mirror_match_devid(mirror, pos))</div><div class='ctx'> 			continue;</div><div class='ctx'> 		if (!ff_mirror_match_fh(mirror, pos))</div><div class='ctx'> 			continue;</div><div class='hunk'>@@ -216,30 +270,52 @@ ff_layout_remove_mirror(struct nfs4_ff_layout_mirror *mirror)</div><div class='ctx'> 	mirror-&gt;layout = NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct nfs4_ff_layout_mirror *ff_layout_alloc_mirror(gfp_t gfp_flags)</div><div class='add'>+static struct nfs4_ff_layout_mirror *ff_layout_alloc_mirror(u32 dss_count,</div><div class='add'>+							    gfp_t gfp_flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_ff_layout_mirror *mirror;</div><div class='ctx'> </div><div class='ctx'> 	mirror = kzalloc(sizeof(*mirror), gfp_flags);</div><div class='del'>-	if (mirror != NULL) {</div><div class='del'>-		spin_lock_init(&amp;mirror-&gt;lock);</div><div class='del'>-		refcount_set(&amp;mirror-&gt;ref, 1);</div><div class='del'>-		INIT_LIST_HEAD(&amp;mirror-&gt;mirrors);</div><div class='add'>+	if (mirror == NULL)</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	spin_lock_init(&amp;mirror-&gt;lock);</div><div class='add'>+	refcount_set(&amp;mirror-&gt;ref, 1);</div><div class='add'>+	INIT_LIST_HEAD(&amp;mirror-&gt;mirrors);</div><div class='add'>+</div><div class='add'>+	mirror-&gt;dss_count = dss_count;</div><div class='add'>+	mirror-&gt;dss =</div><div class='add'>+		kcalloc(dss_count, sizeof(struct nfs4_ff_layout_ds_stripe),</div><div class='add'>+			gfp_flags);</div><div class='add'>+	if (mirror-&gt;dss == NULL) {</div><div class='add'>+		kfree(mirror);</div><div class='add'>+		return NULL;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	for (u32 dss_id = 0; dss_id &lt; mirror-&gt;dss_count; dss_id++)</div><div class='add'>+		nfs_localio_file_init(&amp;mirror-&gt;dss[dss_id].nfl);</div><div class='add'>+</div><div class='ctx'> 	return mirror;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void ff_layout_free_mirror(struct nfs4_ff_layout_mirror *mirror)</div><div class='ctx'> {</div><div class='ctx'> 	const struct cred	*cred;</div><div class='add'>+	u32 dss_id;</div><div class='ctx'> </div><div class='ctx'> 	ff_layout_remove_mirror(mirror);</div><div class='del'>-	kfree(mirror-&gt;fh_versions);</div><div class='del'>-	cred = rcu_access_pointer(mirror-&gt;ro_cred);</div><div class='del'>-	put_cred(cred);</div><div class='del'>-	cred = rcu_access_pointer(mirror-&gt;rw_cred);</div><div class='del'>-	put_cred(cred);</div><div class='del'>-	nfs4_ff_layout_put_deviceid(mirror-&gt;mirror_ds);</div><div class='add'>+</div><div class='add'>+	for (dss_id = 0; dss_id &lt; mirror-&gt;dss_count; dss_id++) {</div><div class='add'>+		kfree(mirror-&gt;dss[dss_id].fh_versions);</div><div class='add'>+		cred = rcu_access_pointer(mirror-&gt;dss[dss_id].ro_cred);</div><div class='add'>+		put_cred(cred);</div><div class='add'>+		cred = rcu_access_pointer(mirror-&gt;dss[dss_id].rw_cred);</div><div class='add'>+		put_cred(cred);</div><div class='add'>+		nfs_close_local_fh(&amp;mirror-&gt;dss[dss_id].nfl);</div><div class='add'>+		nfs4_ff_layout_put_deviceid(mirror-&gt;dss[dss_id].mirror_ds);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	kfree(mirror-&gt;dss);</div><div class='ctx'> 	kfree(mirror);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -270,7 +346,7 @@ ff_lseg_match_mirrors(struct pnfs_layout_segment *l1,</div><div class='ctx'> 		struct pnfs_layout_segment *l2)</div><div class='ctx'> {</div><div class='ctx'> 	const struct nfs4_ff_layout_segment *fl1 = FF_LAYOUT_LSEG(l1);</div><div class='del'>-	const struct nfs4_ff_layout_segment *fl2 = FF_LAYOUT_LSEG(l1);</div><div class='add'>+	const struct nfs4_ff_layout_segment *fl2 = FF_LAYOUT_LSEG(l2);</div><div class='ctx'> 	u32 i;</div><div class='ctx'> </div><div class='ctx'> 	if (fl1-&gt;mirror_array_cnt != fl2-&gt;mirror_array_cnt)</div><div class='hunk'>@@ -343,14 +419,24 @@ ff_layout_add_lseg(struct pnfs_layout_hdr *lo,</div><div class='ctx'> 			free_me);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static u32 ff_mirror_efficiency_sum(const struct nfs4_ff_layout_mirror *mirror)</div><div class='add'>+{</div><div class='add'>+	u32 dss_id, sum = 0;</div><div class='add'>+</div><div class='add'>+	for (dss_id = 0; dss_id &lt; mirror-&gt;dss_count; dss_id++)</div><div class='add'>+		sum += mirror-&gt;dss[dss_id].efficiency;</div><div class='add'>+</div><div class='add'>+	return sum;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void ff_layout_sort_mirrors(struct nfs4_ff_layout_segment *fls)</div><div class='ctx'> {</div><div class='ctx'> 	int i, j;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; fls-&gt;mirror_array_cnt - 1; i++) {</div><div class='ctx'> 		for (j = i + 1; j &lt; fls-&gt;mirror_array_cnt; j++)</div><div class='del'>-			if (fls-&gt;mirror_array[i]-&gt;efficiency &lt;</div><div class='del'>-			    fls-&gt;mirror_array[j]-&gt;efficiency)</div><div class='add'>+			if (ff_mirror_efficiency_sum(fls-&gt;mirror_array[i]) &lt;</div><div class='add'>+			    ff_mirror_efficiency_sum(fls-&gt;mirror_array[j]))</div><div class='ctx'> 				swap(fls-&gt;mirror_array[i],</div><div class='ctx'> 				     fls-&gt;mirror_array[j]);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -365,20 +451,21 @@ ff_layout_alloc_lseg(struct pnfs_layout_hdr *lh,</div><div class='ctx'> 	struct nfs4_ff_layout_segment *fls = NULL;</div><div class='ctx'> 	struct xdr_stream stream;</div><div class='ctx'> 	struct xdr_buf buf;</div><div class='del'>-	struct page *scratch;</div><div class='add'>+	struct folio *scratch;</div><div class='ctx'> 	u64 stripe_unit;</div><div class='ctx'> 	u32 mirror_array_cnt;</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> 	int i, rc;</div><div class='add'>+	struct nfs4_ff_layout_ds_stripe *dss_info;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("--&gt; %s\n", __func__);</div><div class='del'>-	scratch = alloc_page(gfp_flags);</div><div class='add'>+	scratch = folio_alloc(gfp_flags, 0);</div><div class='ctx'> 	if (!scratch)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='ctx'> 	xdr_init_decode_pages(&amp;stream, &amp;buf, lgr-&gt;layoutp-&gt;pages,</div><div class='ctx'> 			      lgr-&gt;layoutp-&gt;len);</div><div class='del'>-	xdr_set_scratch_page(&amp;stream, scratch);</div><div class='add'>+	xdr_set_scratch_folio(&amp;stream, scratch);</div><div class='ctx'> </div><div class='ctx'> 	/* stripe unit and mirror_array_cnt */</div><div class='ctx'> 	rc = -EIO;</div><div class='hunk'>@@ -404,116 +491,134 @@ ff_layout_alloc_lseg(struct pnfs_layout_hdr *lh,</div><div class='ctx'> 	fls-&gt;mirror_array_cnt = mirror_array_cnt;</div><div class='ctx'> 	fls-&gt;stripe_unit = stripe_unit;</div><div class='ctx'> </div><div class='add'>+	u32 dss_count = 0;</div><div class='ctx'> 	for (i = 0; i &lt; fls-&gt;mirror_array_cnt; i++) {</div><div class='ctx'> 		struct nfs4_ff_layout_mirror *mirror;</div><div class='ctx'> 		struct cred *kcred;</div><div class='ctx'> 		const struct cred __rcu *cred;</div><div class='ctx'> 		kuid_t uid;</div><div class='ctx'> 		kgid_t gid;</div><div class='del'>-		u32 ds_count, fh_count, id;</div><div class='del'>-		int j;</div><div class='add'>+		u32 fh_count, id;</div><div class='add'>+		int j, dss_id;</div><div class='ctx'> </div><div class='ctx'> 		rc = -EIO;</div><div class='ctx'> 		p = xdr_inline_decode(&amp;stream, 4);</div><div class='ctx'> 		if (!p)</div><div class='ctx'> 			goto out_err_free;</div><div class='del'>-		ds_count = be32_to_cpup(p);</div><div class='ctx'> </div><div class='del'>-		/* FIXME: allow for striping? */</div><div class='del'>-		if (ds_count != 1)</div><div class='add'>+		// Ensure all mirrors have same stripe count.</div><div class='add'>+		if (dss_count == 0)</div><div class='add'>+			dss_count = be32_to_cpup(p);</div><div class='add'>+		else if (dss_count != be32_to_cpup(p))</div><div class='add'>+			goto out_err_free;</div><div class='add'>+</div><div class='add'>+		if (dss_count &gt; NFS4_FLEXFILE_LAYOUT_MAX_STRIPE_CNT ||</div><div class='add'>+		    dss_count == 0)</div><div class='ctx'> 			goto out_err_free;</div><div class='ctx'> </div><div class='del'>-		fls-&gt;mirror_array[i] = ff_layout_alloc_mirror(gfp_flags);</div><div class='add'>+		if (dss_count &gt; 1 &amp;&amp; stripe_unit == 0)</div><div class='add'>+			goto out_err_free;</div><div class='add'>+</div><div class='add'>+		fls-&gt;mirror_array[i] = ff_layout_alloc_mirror(dss_count, gfp_flags);</div><div class='ctx'> 		if (fls-&gt;mirror_array[i] == NULL) {</div><div class='ctx'> 			rc = -ENOMEM;</div><div class='ctx'> 			goto out_err_free;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		fls-&gt;mirror_array[i]-&gt;ds_count = ds_count;</div><div class='add'>+		for (dss_id = 0; dss_id &lt; dss_count; dss_id++) {</div><div class='add'>+			dss_info = &amp;fls-&gt;mirror_array[i]-&gt;dss[dss_id];</div><div class='add'>+			dss_info-&gt;mirror = fls-&gt;mirror_array[i];</div><div class='ctx'> </div><div class='del'>-		/* deviceid */</div><div class='del'>-		rc = decode_deviceid(&amp;stream, &amp;fls-&gt;mirror_array[i]-&gt;devid);</div><div class='del'>-		if (rc)</div><div class='del'>-			goto out_err_free;</div><div class='add'>+			/* deviceid */</div><div class='add'>+			rc = decode_deviceid(&amp;stream, &amp;dss_info-&gt;devid);</div><div class='add'>+			if (rc)</div><div class='add'>+				goto out_err_free;</div><div class='ctx'> </div><div class='del'>-		/* efficiency */</div><div class='del'>-		rc = -EIO;</div><div class='del'>-		p = xdr_inline_decode(&amp;stream, 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_err_free;</div><div class='del'>-		fls-&gt;mirror_array[i]-&gt;efficiency = be32_to_cpup(p);</div><div class='add'>+			/* efficiency */</div><div class='add'>+			rc = -EIO;</div><div class='add'>+			p = xdr_inline_decode(&amp;stream, 4);</div><div class='add'>+			if (!p)</div><div class='add'>+				goto out_err_free;</div><div class='add'>+			dss_info-&gt;efficiency = be32_to_cpup(p);</div><div class='ctx'> </div><div class='del'>-		/* stateid */</div><div class='del'>-		rc = decode_pnfs_stateid(&amp;stream, &amp;fls-&gt;mirror_array[i]-&gt;stateid);</div><div class='del'>-		if (rc)</div><div class='del'>-			goto out_err_free;</div><div class='add'>+			/* stateid */</div><div class='add'>+			rc = decode_pnfs_stateid(&amp;stream, &amp;dss_info-&gt;stateid);</div><div class='add'>+			if (rc)</div><div class='add'>+				goto out_err_free;</div><div class='ctx'> </div><div class='del'>-		/* fh */</div><div class='del'>-		rc = -EIO;</div><div class='del'>-		p = xdr_inline_decode(&amp;stream, 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_err_free;</div><div class='del'>-		fh_count = be32_to_cpup(p);</div><div class='add'>+			/* fh */</div><div class='add'>+			rc = -EIO;</div><div class='add'>+			p = xdr_inline_decode(&amp;stream, 4);</div><div class='add'>+			if (!p)</div><div class='add'>+				goto out_err_free;</div><div class='add'>+			fh_count = be32_to_cpup(p);</div><div class='ctx'> </div><div class='del'>-		fls-&gt;mirror_array[i]-&gt;fh_versions =</div><div class='del'>-			kcalloc(fh_count, sizeof(struct nfs_fh),</div><div class='del'>-				gfp_flags);</div><div class='del'>-		if (fls-&gt;mirror_array[i]-&gt;fh_versions == NULL) {</div><div class='del'>-			rc = -ENOMEM;</div><div class='del'>-			goto out_err_free;</div><div class='del'>-		}</div><div class='add'>+			dss_info-&gt;fh_versions =</div><div class='add'>+			    kcalloc(fh_count, sizeof(struct nfs_fh),</div><div class='add'>+				    gfp_flags);</div><div class='add'>+			if (dss_info-&gt;fh_versions == NULL) {</div><div class='add'>+				rc = -ENOMEM;</div><div class='add'>+				goto out_err_free;</div><div class='add'>+			}</div><div class='ctx'> </div><div class='del'>-		for (j = 0; j &lt; fh_count; j++) {</div><div class='del'>-			rc = decode_nfs_fh(&amp;stream,</div><div class='del'>-					   &amp;fls-&gt;mirror_array[i]-&gt;fh_versions[j]);</div><div class='add'>+			for (j = 0; j &lt; fh_count; j++) {</div><div class='add'>+				rc = decode_nfs_fh(&amp;stream,</div><div class='add'>+						   &amp;dss_info-&gt;fh_versions[j]);</div><div class='add'>+				if (rc)</div><div class='add'>+					goto out_err_free;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			dss_info-&gt;fh_versions_cnt = fh_count;</div><div class='add'>+</div><div class='add'>+			/* user */</div><div class='add'>+			rc = decode_name(&amp;stream, &amp;id);</div><div class='ctx'> 			if (rc)</div><div class='ctx'> 				goto out_err_free;</div><div class='del'>-		}</div><div class='ctx'> </div><div class='del'>-		fls-&gt;mirror_array[i]-&gt;fh_versions_cnt = fh_count;</div><div class='add'>+			uid = make_kuid(&amp;init_user_ns, id);</div><div class='ctx'> </div><div class='del'>-		/* user */</div><div class='del'>-		rc = decode_name(&amp;stream, &amp;id);</div><div class='del'>-		if (rc)</div><div class='del'>-			goto out_err_free;</div><div class='del'>-</div><div class='del'>-		uid = make_kuid(&amp;init_user_ns, id);</div><div class='add'>+			/* group */</div><div class='add'>+			rc = decode_name(&amp;stream, &amp;id);</div><div class='add'>+			if (rc)</div><div class='add'>+				goto out_err_free;</div><div class='ctx'> </div><div class='del'>-		/* group */</div><div class='del'>-		rc = decode_name(&amp;stream, &amp;id);</div><div class='del'>-		if (rc)</div><div class='del'>-			goto out_err_free;</div><div class='add'>+			gid = make_kgid(&amp;init_user_ns, id);</div><div class='ctx'> </div><div class='del'>-		gid = make_kgid(&amp;init_user_ns, id);</div><div class='add'>+			if (gfp_flags &amp; __GFP_FS)</div><div class='add'>+				kcred = prepare_kernel_cred(&amp;init_task);</div><div class='add'>+			else {</div><div class='add'>+				unsigned int nofs_flags = memalloc_nofs_save();</div><div class='ctx'> </div><div class='del'>-		if (gfp_flags &amp; __GFP_FS)</div><div class='del'>-			kcred = prepare_kernel_cred(NULL);</div><div class='del'>-		else {</div><div class='del'>-			unsigned int nofs_flags = memalloc_nofs_save();</div><div class='del'>-			kcred = prepare_kernel_cred(NULL);</div><div class='del'>-			memalloc_nofs_restore(nofs_flags);</div><div class='add'>+				kcred = prepare_kernel_cred(&amp;init_task);</div><div class='add'>+				memalloc_nofs_restore(nofs_flags);</div><div class='add'>+			}</div><div class='add'>+			rc = -ENOMEM;</div><div class='add'>+			if (!kcred)</div><div class='add'>+				goto out_err_free;</div><div class='add'>+			kcred-&gt;fsuid = uid;</div><div class='add'>+			kcred-&gt;fsgid = gid;</div><div class='add'>+			cred = RCU_INITIALIZER(kcred);</div><div class='add'>+</div><div class='add'>+			if (lgr-&gt;range.iomode == IOMODE_READ)</div><div class='add'>+				rcu_assign_pointer(dss_info-&gt;ro_cred, cred);</div><div class='add'>+			else</div><div class='add'>+				rcu_assign_pointer(dss_info-&gt;rw_cred, cred);</div><div class='ctx'> 		}</div><div class='del'>-		rc = -ENOMEM;</div><div class='del'>-		if (!kcred)</div><div class='del'>-			goto out_err_free;</div><div class='del'>-		kcred-&gt;fsuid = uid;</div><div class='del'>-		kcred-&gt;fsgid = gid;</div><div class='del'>-		cred = RCU_INITIALIZER(kcred);</div><div class='del'>-</div><div class='del'>-		if (lgr-&gt;range.iomode == IOMODE_READ)</div><div class='del'>-			rcu_assign_pointer(fls-&gt;mirror_array[i]-&gt;ro_cred, cred);</div><div class='del'>-		else</div><div class='del'>-			rcu_assign_pointer(fls-&gt;mirror_array[i]-&gt;rw_cred, cred);</div><div class='ctx'> </div><div class='ctx'> 		mirror = ff_layout_add_mirror(lh, fls-&gt;mirror_array[i]);</div><div class='ctx'> 		if (mirror != fls-&gt;mirror_array[i]) {</div><div class='del'>-			/* swap cred ptrs so free_mirror will clean up old */</div><div class='del'>-			if (lgr-&gt;range.iomode == IOMODE_READ) {</div><div class='del'>-				cred = xchg(&amp;mirror-&gt;ro_cred, cred);</div><div class='del'>-				rcu_assign_pointer(fls-&gt;mirror_array[i]-&gt;ro_cred, cred);</div><div class='del'>-			} else {</div><div class='del'>-				cred = xchg(&amp;mirror-&gt;rw_cred, cred);</div><div class='del'>-				rcu_assign_pointer(fls-&gt;mirror_array[i]-&gt;rw_cred, cred);</div><div class='add'>+			for (dss_id = 0; dss_id &lt; dss_count; dss_id++) {</div><div class='add'>+				dss_info = &amp;fls-&gt;mirror_array[i]-&gt;dss[dss_id];</div><div class='add'>+				/* swap cred ptrs so free_mirror will clean up old */</div><div class='add'>+				if (lgr-&gt;range.iomode == IOMODE_READ) {</div><div class='add'>+					cred = xchg(&amp;mirror-&gt;dss[dss_id].ro_cred,</div><div class='add'>+						    dss_info-&gt;ro_cred);</div><div class='add'>+					rcu_assign_pointer(dss_info-&gt;ro_cred, cred);</div><div class='add'>+				} else {</div><div class='add'>+					cred = xchg(&amp;mirror-&gt;dss[dss_id].rw_cred,</div><div class='add'>+						    dss_info-&gt;rw_cred);</div><div class='add'>+					rcu_assign_pointer(dss_info-&gt;rw_cred, cred);</div><div class='add'>+				}</div><div class='ctx'> 			}</div><div class='ctx'> 			ff_layout_free_mirror(fls-&gt;mirror_array[i]);</div><div class='ctx'> 			fls-&gt;mirror_array[i] = mirror;</div><div class='hunk'>@@ -541,7 +646,7 @@ out_sort_mirrors:</div><div class='ctx'> 	ret = &amp;fls-&gt;generic_hdr;</div><div class='ctx'> 	dprintk("&lt;-- %s (success)\n", __func__);</div><div class='ctx'> out_free_page:</div><div class='del'>-	__free_page(scratch);</div><div class='add'>+	folio_put(scratch);</div><div class='ctx'> 	return ret;</div><div class='ctx'> out_err_free:</div><div class='ctx'> 	_ff_layout_free_lseg(fls);</div><div class='hunk'>@@ -570,6 +675,26 @@ ff_layout_free_lseg(struct pnfs_layout_segment *lseg)</div><div class='ctx'> 	_ff_layout_free_lseg(fls);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static u32 calc_commit_idx(struct pnfs_layout_segment *lseg,</div><div class='add'>+			   u32 mirror_idx, u32 dss_id)</div><div class='add'>+{</div><div class='add'>+	struct nfs4_ff_layout_segment *flseg = FF_LAYOUT_LSEG(lseg);</div><div class='add'>+</div><div class='add'>+	return (mirror_idx * flseg-&gt;mirror_array[0]-&gt;dss_count) + dss_id;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static u32 calc_mirror_idx_from_commit(struct pnfs_layout_segment *lseg,</div><div class='add'>+				       u32 commit_index)</div><div class='add'>+{</div><div class='add'>+	return commit_index / FF_LAYOUT_LSEG(lseg)-&gt;mirror_array[0]-&gt;dss_count;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static u32 calc_dss_id_from_commit(struct pnfs_layout_segment *lseg,</div><div class='add'>+				   u32 commit_index)</div><div class='add'>+{</div><div class='add'>+	return commit_index % FF_LAYOUT_LSEG(lseg)-&gt;mirror_array[0]-&gt;dss_count;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void</div><div class='ctx'> nfs4_ff_start_busy_timer(struct nfs4_ff_busy_timer *timer, ktime_t now)</div><div class='ctx'> {</div><div class='hunk'>@@ -594,6 +719,7 @@ nfs4_ff_end_busy_timer(struct nfs4_ff_busy_timer *timer, ktime_t now)</div><div class='ctx'> </div><div class='ctx'> static bool</div><div class='ctx'> nfs4_ff_layoutstat_start_io(struct nfs4_ff_layout_mirror *mirror,</div><div class='add'>+			    u32 dss_id,</div><div class='ctx'> 			    struct nfs4_ff_layoutstat *layoutstat,</div><div class='ctx'> 			    ktime_t now)</div><div class='ctx'> {</div><div class='hunk'>@@ -601,8 +727,8 @@ nfs4_ff_layoutstat_start_io(struct nfs4_ff_layout_mirror *mirror,</div><div class='ctx'> 	struct nfs4_flexfile_layout *ffl = FF_LAYOUT_FROM_HDR(mirror-&gt;layout);</div><div class='ctx'> </div><div class='ctx'> 	nfs4_ff_start_busy_timer(&amp;layoutstat-&gt;busy_timer, now);</div><div class='del'>-	if (!mirror-&gt;start_time)</div><div class='del'>-		mirror-&gt;start_time = now;</div><div class='add'>+	if (!mirror-&gt;dss[dss_id].start_time)</div><div class='add'>+		mirror-&gt;dss[dss_id].start_time = now;</div><div class='ctx'> 	if (mirror-&gt;report_interval != 0)</div><div class='ctx'> 		report_interval = (s64)mirror-&gt;report_interval * 1000LL;</div><div class='ctx'> 	else if (layoutstats_timer != 0)</div><div class='hunk'>@@ -652,28 +778,32 @@ nfs4_ff_layout_stat_io_update_completed(struct nfs4_ff_layoutstat *layoutstat,</div><div class='ctx'> static void</div><div class='ctx'> nfs4_ff_layout_stat_io_start_read(struct inode *inode,</div><div class='ctx'> 		struct nfs4_ff_layout_mirror *mirror,</div><div class='add'>+		u32 dss_id,</div><div class='ctx'> 		__u64 requested, ktime_t now)</div><div class='ctx'> {</div><div class='ctx'> 	bool report;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;mirror-&gt;lock);</div><div class='del'>-	report = nfs4_ff_layoutstat_start_io(mirror, &amp;mirror-&gt;read_stat, now);</div><div class='del'>-	nfs4_ff_layout_stat_io_update_requested(&amp;mirror-&gt;read_stat, requested);</div><div class='add'>+	report = nfs4_ff_layoutstat_start_io(</div><div class='add'>+		mirror, dss_id, &amp;mirror-&gt;dss[dss_id].read_stat, now);</div><div class='add'>+	nfs4_ff_layout_stat_io_update_requested(</div><div class='add'>+		&amp;mirror-&gt;dss[dss_id].read_stat, requested);</div><div class='ctx'> 	set_bit(NFS4_FF_MIRROR_STAT_AVAIL, &amp;mirror-&gt;flags);</div><div class='ctx'> 	spin_unlock(&amp;mirror-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	if (report)</div><div class='del'>-		pnfs_report_layoutstat(inode, GFP_KERNEL);</div><div class='add'>+		pnfs_report_layoutstat(inode, nfs_io_gfp_mask());</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='ctx'> nfs4_ff_layout_stat_io_end_read(struct rpc_task *task,</div><div class='ctx'> 		struct nfs4_ff_layout_mirror *mirror,</div><div class='add'>+		u32 dss_id,</div><div class='ctx'> 		__u64 requested,</div><div class='ctx'> 		__u64 completed)</div><div class='ctx'> {</div><div class='ctx'> 	spin_lock(&amp;mirror-&gt;lock);</div><div class='del'>-	nfs4_ff_layout_stat_io_update_completed(&amp;mirror-&gt;read_stat,</div><div class='add'>+	nfs4_ff_layout_stat_io_update_completed(&amp;mirror-&gt;dss[dss_id].read_stat,</div><div class='ctx'> 			requested, completed,</div><div class='ctx'> 			ktime_get(), task-&gt;tk_start);</div><div class='ctx'> 	set_bit(NFS4_FF_MIRROR_STAT_AVAIL, &amp;mirror-&gt;flags);</div><div class='hunk'>@@ -683,23 +813,31 @@ nfs4_ff_layout_stat_io_end_read(struct rpc_task *task,</div><div class='ctx'> static void</div><div class='ctx'> nfs4_ff_layout_stat_io_start_write(struct inode *inode,</div><div class='ctx'> 		struct nfs4_ff_layout_mirror *mirror,</div><div class='add'>+		u32 dss_id,</div><div class='ctx'> 		__u64 requested, ktime_t now)</div><div class='ctx'> {</div><div class='ctx'> 	bool report;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;mirror-&gt;lock);</div><div class='del'>-	report = nfs4_ff_layoutstat_start_io(mirror , &amp;mirror-&gt;write_stat, now);</div><div class='del'>-	nfs4_ff_layout_stat_io_update_requested(&amp;mirror-&gt;write_stat, requested);</div><div class='add'>+	report = nfs4_ff_layoutstat_start_io(</div><div class='add'>+		mirror,</div><div class='add'>+		dss_id,</div><div class='add'>+		&amp;mirror-&gt;dss[dss_id].write_stat,</div><div class='add'>+		now);</div><div class='add'>+	nfs4_ff_layout_stat_io_update_requested(</div><div class='add'>+		&amp;mirror-&gt;dss[dss_id].write_stat,</div><div class='add'>+		requested);</div><div class='ctx'> 	set_bit(NFS4_FF_MIRROR_STAT_AVAIL, &amp;mirror-&gt;flags);</div><div class='ctx'> 	spin_unlock(&amp;mirror-&gt;lock);</div><div class='ctx'> </div><div class='ctx'> 	if (report)</div><div class='del'>-		pnfs_report_layoutstat(inode, GFP_NOIO);</div><div class='add'>+		pnfs_report_layoutstat(inode, nfs_io_gfp_mask());</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='ctx'> nfs4_ff_layout_stat_io_end_write(struct rpc_task *task,</div><div class='ctx'> 		struct nfs4_ff_layout_mirror *mirror,</div><div class='add'>+		u32 dss_id,</div><div class='ctx'> 		__u64 requested,</div><div class='ctx'> 		__u64 completed,</div><div class='ctx'> 		enum nfs3_stable_how committed)</div><div class='hunk'>@@ -708,25 +846,25 @@ nfs4_ff_layout_stat_io_end_write(struct rpc_task *task,</div><div class='ctx'> 		requested = completed = 0;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;mirror-&gt;lock);</div><div class='del'>-	nfs4_ff_layout_stat_io_update_completed(&amp;mirror-&gt;write_stat,</div><div class='add'>+	nfs4_ff_layout_stat_io_update_completed(&amp;mirror-&gt;dss[dss_id].write_stat,</div><div class='ctx'> 			requested, completed, ktime_get(), task-&gt;tk_start);</div><div class='ctx'> 	set_bit(NFS4_FF_MIRROR_STAT_AVAIL, &amp;mirror-&gt;flags);</div><div class='ctx'> 	spin_unlock(&amp;mirror-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='del'>-ff_layout_mark_ds_unreachable(struct pnfs_layout_segment *lseg, u32 idx)</div><div class='add'>+ff_layout_mark_ds_unreachable(struct pnfs_layout_segment *lseg, u32 idx, u32 dss_id)</div><div class='ctx'> {</div><div class='del'>-	struct nfs4_deviceid_node *devid = FF_LAYOUT_DEVID_NODE(lseg, idx);</div><div class='add'>+	struct nfs4_deviceid_node *devid = FF_LAYOUT_DEVID_NODE(lseg, idx, dss_id);</div><div class='ctx'> </div><div class='ctx'> 	if (devid)</div><div class='ctx'> 		nfs4_mark_deviceid_unavailable(devid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='del'>-ff_layout_mark_ds_reachable(struct pnfs_layout_segment *lseg, u32 idx)</div><div class='add'>+ff_layout_mark_ds_reachable(struct pnfs_layout_segment *lseg, u32 idx, u32 dss_id)</div><div class='ctx'> {</div><div class='del'>-	struct nfs4_deviceid_node *devid = FF_LAYOUT_DEVID_NODE(lseg, idx);</div><div class='add'>+	struct nfs4_deviceid_node *devid = FF_LAYOUT_DEVID_NODE(lseg, idx, dss_id);</div><div class='ctx'> </div><div class='ctx'> 	if (devid)</div><div class='ctx'> 		nfs4_mark_deviceid_available(devid);</div><div class='hunk'>@@ -735,69 +873,87 @@ ff_layout_mark_ds_reachable(struct pnfs_layout_segment *lseg, u32 idx)</div><div class='ctx'> static struct nfs4_pnfs_ds *</div><div class='ctx'> ff_layout_choose_ds_for_read(struct pnfs_layout_segment *lseg,</div><div class='ctx'> 			     u32 start_idx, u32 *best_idx,</div><div class='add'>+			     u32 offset, u32 *dss_id,</div><div class='ctx'> 			     bool check_device)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_ff_layout_segment *fls = FF_LAYOUT_LSEG(lseg);</div><div class='ctx'> 	struct nfs4_ff_layout_mirror *mirror;</div><div class='del'>-	struct nfs4_pnfs_ds *ds;</div><div class='add'>+	struct nfs4_pnfs_ds *ds = ERR_PTR(-EAGAIN);</div><div class='ctx'> 	u32 idx;</div><div class='ctx'> </div><div class='ctx'> 	/* mirrors are initially sorted by efficiency */</div><div class='ctx'> 	for (idx = start_idx; idx &lt; fls-&gt;mirror_array_cnt; idx++) {</div><div class='ctx'> 		mirror = FF_LAYOUT_COMP(lseg, idx);</div><div class='del'>-		ds = nfs4_ff_layout_prepare_ds(lseg, mirror, false);</div><div class='del'>-		if (!ds)</div><div class='add'>+		*dss_id = nfs4_ff_layout_calc_dss_id(</div><div class='add'>+			fls-&gt;stripe_unit,</div><div class='add'>+			fls-&gt;mirror_array[idx]-&gt;dss_count,</div><div class='add'>+			offset);</div><div class='add'>+		ds = nfs4_ff_layout_prepare_ds(lseg, mirror, *dss_id, false);</div><div class='add'>+		if (IS_ERR(ds))</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		if (check_device &amp;&amp;</div><div class='del'>-		    nfs4_test_deviceid_unavailable(&amp;mirror-&gt;mirror_ds-&gt;id_node))</div><div class='add'>+		    nfs4_test_deviceid_unavailable(&amp;mirror-&gt;dss[*dss_id].mirror_ds-&gt;id_node)) {</div><div class='add'>+			// reinitialize the error state in case if this is the last iteration</div><div class='add'>+			ds = ERR_PTR(-EINVAL);</div><div class='ctx'> 			continue;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		*best_idx = idx;</div><div class='del'>-		return ds;</div><div class='add'>+		break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return NULL;</div><div class='add'>+	return ds;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct nfs4_pnfs_ds *</div><div class='ctx'> ff_layout_choose_any_ds_for_read(struct pnfs_layout_segment *lseg,</div><div class='del'>-				 u32 start_idx, u32 *best_idx)</div><div class='add'>+				 u32 start_idx, u32 *best_idx,</div><div class='add'>+				 u32 offset, u32 *dss_id)</div><div class='ctx'> {</div><div class='del'>-	return ff_layout_choose_ds_for_read(lseg, start_idx, best_idx, false);</div><div class='add'>+	return ff_layout_choose_ds_for_read(lseg, start_idx, best_idx,</div><div class='add'>+					    offset, dss_id, false);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct nfs4_pnfs_ds *</div><div class='ctx'> ff_layout_choose_valid_ds_for_read(struct pnfs_layout_segment *lseg,</div><div class='del'>-				   u32 start_idx, u32 *best_idx)</div><div class='add'>+				   u32 start_idx, u32 *best_idx,</div><div class='add'>+				   u32 offset, u32 *dss_id)</div><div class='ctx'> {</div><div class='del'>-	return ff_layout_choose_ds_for_read(lseg, start_idx, best_idx, true);</div><div class='add'>+	return ff_layout_choose_ds_for_read(lseg, start_idx, best_idx,</div><div class='add'>+					    offset, dss_id, true);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct nfs4_pnfs_ds *</div><div class='ctx'> ff_layout_choose_best_ds_for_read(struct pnfs_layout_segment *lseg,</div><div class='del'>-				  u32 start_idx, u32 *best_idx)</div><div class='add'>+				  u32 start_idx, u32 *best_idx,</div><div class='add'>+				  u32 offset, u32 *dss_id)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_pnfs_ds *ds;</div><div class='ctx'> </div><div class='del'>-	ds = ff_layout_choose_valid_ds_for_read(lseg, start_idx, best_idx);</div><div class='del'>-	if (ds)</div><div class='add'>+	ds = ff_layout_choose_valid_ds_for_read(lseg, start_idx, best_idx,</div><div class='add'>+						offset, dss_id);</div><div class='add'>+	if (!IS_ERR(ds))</div><div class='ctx'> 		return ds;</div><div class='del'>-	return ff_layout_choose_any_ds_for_read(lseg, start_idx, best_idx);</div><div class='add'>+	return ff_layout_choose_any_ds_for_read(lseg, start_idx, best_idx,</div><div class='add'>+						offset, dss_id);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct nfs4_pnfs_ds *</div><div class='ctx'> ff_layout_get_ds_for_read(struct nfs_pageio_descriptor *pgio,</div><div class='del'>-			  u32 *best_idx)</div><div class='add'>+			  u32 *best_idx,</div><div class='add'>+			  u32 offset,</div><div class='add'>+			  u32 *dss_id)</div><div class='ctx'> {</div><div class='ctx'> 	struct pnfs_layout_segment *lseg = pgio-&gt;pg_lseg;</div><div class='ctx'> 	struct nfs4_pnfs_ds *ds;</div><div class='ctx'> </div><div class='ctx'> 	ds = ff_layout_choose_best_ds_for_read(lseg, pgio-&gt;pg_mirror_idx,</div><div class='del'>-					       best_idx);</div><div class='del'>-	if (ds || !pgio-&gt;pg_mirror_idx)</div><div class='add'>+					       best_idx, offset, dss_id);</div><div class='add'>+	if (!IS_ERR(ds) || !pgio-&gt;pg_mirror_idx)</div><div class='ctx'> 		return ds;</div><div class='del'>-	return ff_layout_choose_best_ds_for_read(lseg, 0, best_idx);</div><div class='add'>+	return ff_layout_choose_best_ds_for_read(lseg, 0, best_idx,</div><div class='add'>+						 offset, dss_id);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='hunk'>@@ -806,25 +962,64 @@ ff_layout_pg_get_read(struct nfs_pageio_descriptor *pgio,</div><div class='ctx'> 		      bool strict_iomode)</div><div class='ctx'> {</div><div class='ctx'> 	pnfs_put_lseg(pgio-&gt;pg_lseg);</div><div class='del'>-	pgio-&gt;pg_lseg = pnfs_update_layout(pgio-&gt;pg_inode,</div><div class='del'>-					   nfs_req_openctx(req),</div><div class='del'>-					   req_offset(req),</div><div class='del'>-					   req-&gt;wb_bytes,</div><div class='del'>-					   IOMODE_READ,</div><div class='del'>-					   strict_iomode,</div><div class='del'>-					   GFP_KERNEL);</div><div class='add'>+	pgio-&gt;pg_lseg =</div><div class='add'>+		pnfs_update_layout(pgio-&gt;pg_inode, nfs_req_openctx(req),</div><div class='add'>+				   req_offset(req), req-&gt;wb_bytes, IOMODE_READ,</div><div class='add'>+				   strict_iomode, nfs_io_gfp_mask());</div><div class='ctx'> 	if (IS_ERR(pgio-&gt;pg_lseg)) {</div><div class='ctx'> 		pgio-&gt;pg_error = PTR_ERR(pgio-&gt;pg_lseg);</div><div class='ctx'> 		pgio-&gt;pg_lseg = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void</div><div class='del'>-ff_layout_pg_check_layout(struct nfs_pageio_descriptor *pgio,</div><div class='del'>-			  struct nfs_page *req)</div><div class='add'>+static bool</div><div class='add'>+ff_layout_lseg_is_striped(const struct nfs4_ff_layout_segment *fls)</div><div class='ctx'> {</div><div class='del'>-	pnfs_generic_pg_check_layout(pgio);</div><div class='del'>-	pnfs_generic_pg_check_range(pgio, req);</div><div class='add'>+	return fls-&gt;mirror_array[0]-&gt;dss_count &gt; 1;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * ff_layout_pg_test(). Called by nfs_can_coalesce_requests()</div><div class='add'>+ *</div><div class='add'>+ * Return 0 if @req cannot be coalesced into @pgio, otherwise return the number</div><div class='add'>+ * of bytes (maximum @req-&gt;wb_bytes) that can be coalesced.</div><div class='add'>+ */</div><div class='add'>+static size_t</div><div class='add'>+ff_layout_pg_test(struct nfs_pageio_descriptor *pgio, struct nfs_page *prev,</div><div class='add'>+		  struct nfs_page *req)</div><div class='add'>+{</div><div class='add'>+	unsigned int size;</div><div class='add'>+	u64 p_stripe, r_stripe;</div><div class='add'>+	u32 stripe_offset;</div><div class='add'>+	u64 segment_offset = pgio-&gt;pg_lseg-&gt;pls_range.offset;</div><div class='add'>+	u32 stripe_unit = FF_LAYOUT_LSEG(pgio-&gt;pg_lseg)-&gt;stripe_unit;</div><div class='add'>+</div><div class='add'>+	/* calls nfs_generic_pg_test */</div><div class='add'>+	size = pnfs_generic_pg_test(pgio, prev, req);</div><div class='add'>+	if (!size)</div><div class='add'>+		return 0;</div><div class='add'>+	else if (!ff_layout_lseg_is_striped(FF_LAYOUT_LSEG(pgio-&gt;pg_lseg)))</div><div class='add'>+		return size;</div><div class='add'>+</div><div class='add'>+	/* see if req and prev are in the same stripe */</div><div class='add'>+	if (prev) {</div><div class='add'>+		p_stripe = (u64)req_offset(prev) - segment_offset;</div><div class='add'>+		r_stripe = (u64)req_offset(req) - segment_offset;</div><div class='add'>+		do_div(p_stripe, stripe_unit);</div><div class='add'>+		do_div(r_stripe, stripe_unit);</div><div class='add'>+</div><div class='add'>+		if (p_stripe != r_stripe)</div><div class='add'>+			return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* calculate remaining bytes in the current stripe */</div><div class='add'>+	div_u64_rem((u64)req_offset(req) - segment_offset,</div><div class='add'>+			stripe_unit,</div><div class='add'>+			&amp;stripe_offset);</div><div class='add'>+	WARN_ON_ONCE(stripe_offset &gt; stripe_unit);</div><div class='add'>+	if (stripe_offset &gt;= stripe_unit)</div><div class='add'>+		return 0;</div><div class='add'>+	return min(stripe_unit - (unsigned int)stripe_offset, size);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='hunk'>@@ -834,10 +1029,13 @@ ff_layout_pg_init_read(struct nfs_pageio_descriptor *pgio,</div><div class='ctx'> 	struct nfs_pgio_mirror *pgm;</div><div class='ctx'> 	struct nfs4_ff_layout_mirror *mirror;</div><div class='ctx'> 	struct nfs4_pnfs_ds *ds;</div><div class='del'>-	u32 ds_idx;</div><div class='add'>+	u32 ds_idx, dss_id;</div><div class='ctx'> </div><div class='add'>+	if (NFS_SERVER(pgio-&gt;pg_inode)-&gt;flags &amp;</div><div class='add'>+			(NFS_MOUNT_SOFT|NFS_MOUNT_SOFTERR))</div><div class='add'>+		pgio-&gt;pg_maxretrans = io_maxretrans;</div><div class='ctx'> retry:</div><div class='del'>-	ff_layout_pg_check_layout(pgio, req);</div><div class='add'>+	pnfs_generic_pg_check_layout(pgio, req);</div><div class='ctx'> 	/* Use full layout for now */</div><div class='ctx'> 	if (!pgio-&gt;pg_lseg) {</div><div class='ctx'> 		ff_layout_pg_get_read(pgio, req, false);</div><div class='hunk'>@@ -849,9 +1047,12 @@ retry:</div><div class='ctx'> 		if (!pgio-&gt;pg_lseg)</div><div class='ctx'> 			goto out_nolseg;</div><div class='ctx'> 	}</div><div class='add'>+	/* Reset wb_nio, since getting layout segment was successful */</div><div class='add'>+	req-&gt;wb_nio = 0;</div><div class='ctx'> </div><div class='del'>-	ds = ff_layout_get_ds_for_read(pgio, &amp;ds_idx);</div><div class='del'>-	if (!ds) {</div><div class='add'>+	ds = ff_layout_get_ds_for_read(pgio, &amp;ds_idx,</div><div class='add'>+				       req_offset(req), &amp;dss_id);</div><div class='add'>+	if (IS_ERR(ds)) {</div><div class='ctx'> 		if (!ff_layout_no_fallback_to_mds(pgio-&gt;pg_lseg))</div><div class='ctx'> 			goto out_mds;</div><div class='ctx'> 		pnfs_generic_pg_cleanup(pgio);</div><div class='hunk'>@@ -862,17 +1063,27 @@ retry:</div><div class='ctx'> </div><div class='ctx'> 	mirror = FF_LAYOUT_COMP(pgio-&gt;pg_lseg, ds_idx);</div><div class='ctx'> 	pgm = &amp;pgio-&gt;pg_mirrors[0];</div><div class='del'>-	pgm-&gt;pg_bsize = mirror-&gt;mirror_ds-&gt;ds_versions[0].rsize;</div><div class='add'>+	pgm-&gt;pg_bsize = mirror-&gt;dss[dss_id].mirror_ds-&gt;ds_versions[0].rsize;</div><div class='ctx'> </div><div class='ctx'> 	pgio-&gt;pg_mirror_idx = ds_idx;</div><div class='del'>-</div><div class='del'>-	if (NFS_SERVER(pgio-&gt;pg_inode)-&gt;flags &amp;</div><div class='del'>-			(NFS_MOUNT_SOFT|NFS_MOUNT_SOFTERR))</div><div class='del'>-		pgio-&gt;pg_maxretrans = io_maxretrans;</div><div class='ctx'> 	return;</div><div class='ctx'> out_nolseg:</div><div class='del'>-	if (pgio-&gt;pg_error &lt; 0)</div><div class='del'>-		return;</div><div class='add'>+	if (pgio-&gt;pg_error &lt; 0) {</div><div class='add'>+		if (pgio-&gt;pg_error != -EAGAIN)</div><div class='add'>+			return;</div><div class='add'>+		/* Retry getting layout segment if lower layer returned -EAGAIN */</div><div class='add'>+		if (pgio-&gt;pg_maxretrans &amp;&amp; req-&gt;wb_nio++ &gt; pgio-&gt;pg_maxretrans) {</div><div class='add'>+			if (NFS_SERVER(pgio-&gt;pg_inode)-&gt;flags &amp; NFS_MOUNT_SOFTERR)</div><div class='add'>+				pgio-&gt;pg_error = -ETIMEDOUT;</div><div class='add'>+			else</div><div class='add'>+				pgio-&gt;pg_error = -EIO;</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+		pgio-&gt;pg_error = 0;</div><div class='add'>+		/* Sleep for 1 second before retrying */</div><div class='add'>+		ssleep(1);</div><div class='add'>+		goto retry;</div><div class='add'>+	}</div><div class='ctx'> out_mds:</div><div class='ctx'> 	trace_pnfs_mds_fallback_pg_init_read(pgio-&gt;pg_inode,</div><div class='ctx'> 			0, NFS4_MAX_UINT64, IOMODE_READ,</div><div class='hunk'>@@ -889,18 +1100,15 @@ ff_layout_pg_init_write(struct nfs_pageio_descriptor *pgio,</div><div class='ctx'> 	struct nfs4_ff_layout_mirror *mirror;</div><div class='ctx'> 	struct nfs_pgio_mirror *pgm;</div><div class='ctx'> 	struct nfs4_pnfs_ds *ds;</div><div class='del'>-	u32 i;</div><div class='add'>+	u32 i, dss_id;</div><div class='ctx'> </div><div class='ctx'> retry:</div><div class='del'>-	ff_layout_pg_check_layout(pgio, req);</div><div class='add'>+	pnfs_generic_pg_check_layout(pgio, req);</div><div class='ctx'> 	if (!pgio-&gt;pg_lseg) {</div><div class='del'>-		pgio-&gt;pg_lseg = pnfs_update_layout(pgio-&gt;pg_inode,</div><div class='del'>-						   nfs_req_openctx(req),</div><div class='del'>-						   req_offset(req),</div><div class='del'>-						   req-&gt;wb_bytes,</div><div class='del'>-						   IOMODE_RW,</div><div class='del'>-						   false,</div><div class='del'>-						   GFP_NOFS);</div><div class='add'>+		pgio-&gt;pg_lseg =</div><div class='add'>+			pnfs_update_layout(pgio-&gt;pg_inode, nfs_req_openctx(req),</div><div class='add'>+					   req_offset(req), req-&gt;wb_bytes,</div><div class='add'>+					   IOMODE_RW, false, nfs_io_gfp_mask());</div><div class='ctx'> 		if (IS_ERR(pgio-&gt;pg_lseg)) {</div><div class='ctx'> 			pgio-&gt;pg_error = PTR_ERR(pgio-&gt;pg_lseg);</div><div class='ctx'> 			pgio-&gt;pg_lseg = NULL;</div><div class='hunk'>@@ -917,8 +1125,13 @@ retry:</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; pgio-&gt;pg_mirror_count; i++) {</div><div class='ctx'> 		mirror = FF_LAYOUT_COMP(pgio-&gt;pg_lseg, i);</div><div class='del'>-		ds = nfs4_ff_layout_prepare_ds(pgio-&gt;pg_lseg, mirror, true);</div><div class='del'>-		if (!ds) {</div><div class='add'>+		dss_id = nfs4_ff_layout_calc_dss_id(</div><div class='add'>+			FF_LAYOUT_LSEG(pgio-&gt;pg_lseg)-&gt;stripe_unit,</div><div class='add'>+			mirror-&gt;dss_count,</div><div class='add'>+			req_offset(req));</div><div class='add'>+		ds = nfs4_ff_layout_prepare_ds(pgio-&gt;pg_lseg, mirror,</div><div class='add'>+					       dss_id, true);</div><div class='add'>+		if (IS_ERR(ds)) {</div><div class='ctx'> 			if (!ff_layout_no_fallback_to_mds(pgio-&gt;pg_lseg))</div><div class='ctx'> 				goto out_mds;</div><div class='ctx'> 			pnfs_generic_pg_cleanup(pgio);</div><div class='hunk'>@@ -927,7 +1140,7 @@ retry:</div><div class='ctx'> 			goto retry;</div><div class='ctx'> 		}</div><div class='ctx'> 		pgm = &amp;pgio-&gt;pg_mirrors[i];</div><div class='del'>-		pgm-&gt;pg_bsize = mirror-&gt;mirror_ds-&gt;ds_versions[0].wsize;</div><div class='add'>+		pgm-&gt;pg_bsize = mirror-&gt;dss[dss_id].mirror_ds-&gt;ds_versions[0].wsize;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (NFS_SERVER(pgio-&gt;pg_inode)-&gt;flags &amp;</div><div class='hunk'>@@ -953,13 +1166,10 @@ ff_layout_pg_get_mirror_count_write(struct nfs_pageio_descriptor *pgio,</div><div class='ctx'> 				    struct nfs_page *req)</div><div class='ctx'> {</div><div class='ctx'> 	if (!pgio-&gt;pg_lseg) {</div><div class='del'>-		pgio-&gt;pg_lseg = pnfs_update_layout(pgio-&gt;pg_inode,</div><div class='del'>-						   nfs_req_openctx(req),</div><div class='del'>-						   req_offset(req),</div><div class='del'>-						   req-&gt;wb_bytes,</div><div class='del'>-						   IOMODE_RW,</div><div class='del'>-						   false,</div><div class='del'>-						   GFP_NOFS);</div><div class='add'>+		pgio-&gt;pg_lseg =</div><div class='add'>+			pnfs_update_layout(pgio-&gt;pg_inode, nfs_req_openctx(req),</div><div class='add'>+					   req_offset(req), req-&gt;wb_bytes,</div><div class='add'>+					   IOMODE_RW, false, nfs_io_gfp_mask());</div><div class='ctx'> 		if (IS_ERR(pgio-&gt;pg_lseg)) {</div><div class='ctx'> 			pgio-&gt;pg_error = PTR_ERR(pgio-&gt;pg_lseg);</div><div class='ctx'> 			pgio-&gt;pg_lseg = NULL;</div><div class='hunk'>@@ -996,14 +1206,14 @@ ff_layout_pg_get_mirror_write(struct nfs_pageio_descriptor *desc, u32 idx)</div><div class='ctx'> </div><div class='ctx'> static const struct nfs_pageio_ops ff_layout_pg_read_ops = {</div><div class='ctx'> 	.pg_init = ff_layout_pg_init_read,</div><div class='del'>-	.pg_test = pnfs_generic_pg_test,</div><div class='add'>+	.pg_test = ff_layout_pg_test,</div><div class='ctx'> 	.pg_doio = pnfs_generic_pg_readpages,</div><div class='ctx'> 	.pg_cleanup = pnfs_generic_pg_cleanup,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct nfs_pageio_ops ff_layout_pg_write_ops = {</div><div class='ctx'> 	.pg_init = ff_layout_pg_init_write,</div><div class='del'>-	.pg_test = pnfs_generic_pg_test,</div><div class='add'>+	.pg_test = ff_layout_pg_test,</div><div class='ctx'> 	.pg_doio = pnfs_generic_pg_writepages,</div><div class='ctx'> 	.pg_get_mirror_count = ff_layout_pg_get_mirror_count_write,</div><div class='ctx'> 	.pg_cleanup = pnfs_generic_pg_cleanup,</div><div class='hunk'>@@ -1051,11 +1261,15 @@ static void ff_layout_resend_pnfs_read(struct nfs_pgio_header *hdr)</div><div class='ctx'> {</div><div class='ctx'> 	u32 idx = hdr-&gt;pgio_mirror_idx + 1;</div><div class='ctx'> 	u32 new_idx = 0;</div><div class='add'>+	u32 dss_id = 0;</div><div class='add'>+	struct nfs4_pnfs_ds *ds;</div><div class='ctx'> </div><div class='del'>-	if (ff_layout_choose_any_ds_for_read(hdr-&gt;lseg, idx, &amp;new_idx))</div><div class='del'>-		ff_layout_send_layouterror(hdr-&gt;lseg);</div><div class='del'>-	else</div><div class='add'>+	ds = ff_layout_choose_any_ds_for_read(hdr-&gt;lseg, idx, &amp;new_idx,</div><div class='add'>+					      hdr-&gt;args.offset, &amp;dss_id);</div><div class='add'>+	if (IS_ERR(ds))</div><div class='ctx'> 		pnfs_error_mark_layout_for_return(hdr-&gt;inode, hdr-&gt;lseg);</div><div class='add'>+	else</div><div class='add'>+		ff_layout_send_layouterror(hdr-&gt;lseg);</div><div class='ctx'> 	pnfs_read_resend_pnfs(hdr, new_idx);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1084,42 +1298,53 @@ static void ff_layout_reset_read(struct nfs_pgio_header *hdr)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ff_layout_async_handle_error_v4(struct rpc_task *task,</div><div class='add'>+					   u32 op_status,</div><div class='ctx'> 					   struct nfs4_state *state,</div><div class='ctx'> 					   struct nfs_client *clp,</div><div class='ctx'> 					   struct pnfs_layout_segment *lseg,</div><div class='del'>-					   u32 idx)</div><div class='add'>+					   u32 idx, u32 dss_id)</div><div class='ctx'> {</div><div class='ctx'> 	struct pnfs_layout_hdr *lo = lseg-&gt;pls_layout;</div><div class='ctx'> 	struct inode *inode = lo-&gt;plh_inode;</div><div class='del'>-	struct nfs4_deviceid_node *devid = FF_LAYOUT_DEVID_NODE(lseg, idx);</div><div class='add'>+	struct nfs4_deviceid_node *devid = FF_LAYOUT_DEVID_NODE(lseg, idx, dss_id);</div><div class='ctx'> 	struct nfs4_slot_table *tbl = &amp;clp-&gt;cl_session-&gt;fc_slot_table;</div><div class='ctx'> </div><div class='del'>-	switch (task-&gt;tk_status) {</div><div class='del'>-	case -NFS4ERR_BADSESSION:</div><div class='del'>-	case -NFS4ERR_BADSLOT:</div><div class='del'>-	case -NFS4ERR_BAD_HIGH_SLOT:</div><div class='del'>-	case -NFS4ERR_DEADSESSION:</div><div class='del'>-	case -NFS4ERR_CONN_NOT_BOUND_TO_SESSION:</div><div class='del'>-	case -NFS4ERR_SEQ_FALSE_RETRY:</div><div class='del'>-	case -NFS4ERR_SEQ_MISORDERED:</div><div class='add'>+	switch (op_status) {</div><div class='add'>+	case NFS4_OK:</div><div class='add'>+	case NFS4ERR_NXIO:</div><div class='add'>+		break;</div><div class='add'>+	case NFSERR_PERM:</div><div class='add'>+		if (!task-&gt;tk_xprt)</div><div class='add'>+			break;</div><div class='add'>+		xprt_force_disconnect(task-&gt;tk_xprt);</div><div class='add'>+		goto out_retry;</div><div class='add'>+	case NFS4ERR_BADSESSION:</div><div class='add'>+	case NFS4ERR_BADSLOT:</div><div class='add'>+	case NFS4ERR_BAD_HIGH_SLOT:</div><div class='add'>+	case NFS4ERR_DEADSESSION:</div><div class='add'>+	case NFS4ERR_CONN_NOT_BOUND_TO_SESSION:</div><div class='add'>+	case NFS4ERR_SEQ_FALSE_RETRY:</div><div class='add'>+	case NFS4ERR_SEQ_MISORDERED:</div><div class='ctx'> 		dprintk("%s ERROR %d, Reset session. Exchangeid "</div><div class='ctx'> 			"flags 0x%x\n", __func__, task-&gt;tk_status,</div><div class='ctx'> 			clp-&gt;cl_exchange_flags);</div><div class='ctx'> 		nfs4_schedule_session_recovery(clp-&gt;cl_session, task-&gt;tk_status);</div><div class='del'>-		break;</div><div class='del'>-	case -NFS4ERR_DELAY:</div><div class='del'>-	case -NFS4ERR_GRACE:</div><div class='add'>+		goto out_retry;</div><div class='add'>+	case NFS4ERR_DELAY:</div><div class='add'>+		nfs_inc_stats(lseg-&gt;pls_layout-&gt;plh_inode, NFSIOS_DELAY);</div><div class='add'>+		fallthrough;</div><div class='add'>+	case NFS4ERR_GRACE:</div><div class='ctx'> 		rpc_delay(task, FF_LAYOUT_POLL_RETRY_MAX);</div><div class='del'>-		break;</div><div class='del'>-	case -NFS4ERR_RETRY_UNCACHED_REP:</div><div class='del'>-		break;</div><div class='add'>+		goto out_retry;</div><div class='add'>+	case NFS4ERR_RETRY_UNCACHED_REP:</div><div class='add'>+		goto out_retry;</div><div class='ctx'> 	/* Invalidate Layout errors */</div><div class='del'>-	case -NFS4ERR_PNFS_NO_LAYOUT:</div><div class='del'>-	case -ESTALE:           /* mapped NFS4ERR_STALE */</div><div class='del'>-	case -EBADHANDLE:       /* mapped NFS4ERR_BADHANDLE */</div><div class='del'>-	case -EISDIR:           /* mapped NFS4ERR_ISDIR */</div><div class='del'>-	case -NFS4ERR_FHEXPIRED:</div><div class='del'>-	case -NFS4ERR_WRONG_TYPE:</div><div class='add'>+	case NFS4ERR_PNFS_NO_LAYOUT:</div><div class='add'>+	case NFS4ERR_STALE:</div><div class='add'>+	case NFS4ERR_BADHANDLE:</div><div class='add'>+	case NFS4ERR_ISDIR:</div><div class='add'>+	case NFS4ERR_FHEXPIRED:</div><div class='add'>+	case NFS4ERR_WRONG_TYPE:</div><div class='ctx'> 		dprintk("%s Invalid layout error %d\n", __func__,</div><div class='ctx'> 			task-&gt;tk_status);</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -1132,38 +1357,79 @@ static int ff_layout_async_handle_error_v4(struct rpc_task *task,</div><div class='ctx'> 		pnfs_destroy_layout(NFS_I(inode));</div><div class='ctx'> 		rpc_wake_up(&amp;tbl-&gt;slot_tbl_waitq);</div><div class='ctx'> 		goto reset;</div><div class='add'>+	default:</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	switch (task-&gt;tk_status) {</div><div class='ctx'> 	/* RPC connection errors */</div><div class='add'>+	case -ENETDOWN:</div><div class='add'>+	case -ENETUNREACH:</div><div class='add'>+		if (test_bit(NFS_CS_NETUNREACH_FATAL, &amp;clp-&gt;cl_flags))</div><div class='add'>+			return -NFS4ERR_FATAL_IOERROR;</div><div class='add'>+		fallthrough;</div><div class='ctx'> 	case -ECONNREFUSED:</div><div class='ctx'> 	case -EHOSTDOWN:</div><div class='ctx'> 	case -EHOSTUNREACH:</div><div class='del'>-	case -ENETUNREACH:</div><div class='ctx'> 	case -EIO:</div><div class='ctx'> 	case -ETIMEDOUT:</div><div class='ctx'> 	case -EPIPE:</div><div class='add'>+	case -EPROTO:</div><div class='add'>+	case -ENODEV:</div><div class='ctx'> 		dprintk("%s DS connection error %d\n", __func__,</div><div class='ctx'> 			task-&gt;tk_status);</div><div class='ctx'> 		nfs4_delete_deviceid(devid-&gt;ld, devid-&gt;nfs_client,</div><div class='ctx'> 				&amp;devid-&gt;deviceid);</div><div class='ctx'> 		rpc_wake_up(&amp;tbl-&gt;slot_tbl_waitq);</div><div class='del'>-		fallthrough;</div><div class='add'>+		break;</div><div class='ctx'> 	default:</div><div class='del'>-		if (ff_layout_avoid_mds_available_ds(lseg))</div><div class='del'>-			return -NFS4ERR_RESET_TO_PNFS;</div><div class='del'>-reset:</div><div class='del'>-		dprintk("%s Retry through MDS. Error %d\n", __func__,</div><div class='del'>-			task-&gt;tk_status);</div><div class='del'>-		return -NFS4ERR_RESET_TO_MDS;</div><div class='add'>+		break;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	if (ff_layout_avoid_mds_available_ds(lseg))</div><div class='add'>+		return -NFS4ERR_RESET_TO_PNFS;</div><div class='add'>+reset:</div><div class='add'>+	dprintk("%s Retry through MDS. Error %d\n", __func__,</div><div class='add'>+		task-&gt;tk_status);</div><div class='add'>+	return -NFS4ERR_RESET_TO_MDS;</div><div class='add'>+</div><div class='add'>+out_retry:</div><div class='ctx'> 	task-&gt;tk_status = 0;</div><div class='ctx'> 	return -EAGAIN;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Retry all errors through either pNFS or MDS except for -EJUKEBOX */</div><div class='ctx'> static int ff_layout_async_handle_error_v3(struct rpc_task *task,</div><div class='add'>+					   u32 op_status,</div><div class='add'>+					   struct nfs_client *clp,</div><div class='ctx'> 					   struct pnfs_layout_segment *lseg,</div><div class='del'>-					   u32 idx)</div><div class='add'>+					   u32 idx, u32 dss_id)</div><div class='ctx'> {</div><div class='del'>-	struct nfs4_deviceid_node *devid = FF_LAYOUT_DEVID_NODE(lseg, idx);</div><div class='add'>+	struct nfs4_deviceid_node *devid = FF_LAYOUT_DEVID_NODE(lseg, idx, dss_id);</div><div class='add'>+</div><div class='add'>+	switch (op_status) {</div><div class='add'>+	case NFS_OK:</div><div class='add'>+	case NFSERR_NXIO:</div><div class='add'>+		break;</div><div class='add'>+	case NFSERR_PERM:</div><div class='add'>+		if (!task-&gt;tk_xprt)</div><div class='add'>+			break;</div><div class='add'>+		xprt_force_disconnect(task-&gt;tk_xprt);</div><div class='add'>+		goto out_retry;</div><div class='add'>+	case NFSERR_ACCES:</div><div class='add'>+	case NFSERR_BADHANDLE:</div><div class='add'>+	case NFSERR_FBIG:</div><div class='add'>+	case NFSERR_IO:</div><div class='add'>+	case NFSERR_NOSPC:</div><div class='add'>+	case NFSERR_ROFS:</div><div class='add'>+	case NFSERR_STALE:</div><div class='add'>+		goto out_reset_to_pnfs;</div><div class='add'>+	case NFSERR_JUKEBOX:</div><div class='add'>+		nfs_inc_stats(lseg-&gt;pls_layout-&gt;plh_inode, NFSIOS_DELAY);</div><div class='add'>+		goto out_retry;</div><div class='add'>+	default:</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	switch (task-&gt;tk_status) {</div><div class='ctx'> 	/* File access problems. Don't mark the device as unavailable */</div><div class='hunk'>@@ -1177,12 +1443,18 @@ static int ff_layout_async_handle_error_v3(struct rpc_task *task,</div><div class='ctx'> 	case -EJUKEBOX:</div><div class='ctx'> 		nfs_inc_stats(lseg-&gt;pls_layout-&gt;plh_inode, NFSIOS_DELAY);</div><div class='ctx'> 		goto out_retry;</div><div class='add'>+	case -ENETDOWN:</div><div class='add'>+	case -ENETUNREACH:</div><div class='add'>+		if (test_bit(NFS_CS_NETUNREACH_FATAL, &amp;clp-&gt;cl_flags))</div><div class='add'>+			return -NFS4ERR_FATAL_IOERROR;</div><div class='add'>+		fallthrough;</div><div class='ctx'> 	default:</div><div class='ctx'> 		dprintk("%s DS connection error %d\n", __func__,</div><div class='ctx'> 			task-&gt;tk_status);</div><div class='ctx'> 		nfs4_delete_deviceid(devid-&gt;ld, devid-&gt;nfs_client,</div><div class='ctx'> 				&amp;devid-&gt;deviceid);</div><div class='ctx'> 	}</div><div class='add'>+out_reset_to_pnfs:</div><div class='ctx'> 	/* FIXME: Need to prevent infinite looping here. */</div><div class='ctx'> 	return -NFS4ERR_RESET_TO_PNFS;</div><div class='ctx'> out_retry:</div><div class='hunk'>@@ -1193,15 +1465,16 @@ out_retry:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ff_layout_async_handle_error(struct rpc_task *task,</div><div class='add'>+					u32 op_status,</div><div class='ctx'> 					struct nfs4_state *state,</div><div class='ctx'> 					struct nfs_client *clp,</div><div class='ctx'> 					struct pnfs_layout_segment *lseg,</div><div class='del'>-					u32 idx)</div><div class='add'>+					u32 idx, u32 dss_id)</div><div class='ctx'> {</div><div class='ctx'> 	int vers = clp-&gt;cl_nfs_mod-&gt;rpc_vers-&gt;number;</div><div class='ctx'> </div><div class='ctx'> 	if (task-&gt;tk_status &gt;= 0) {</div><div class='del'>-		ff_layout_mark_ds_reachable(lseg, idx);</div><div class='add'>+		ff_layout_mark_ds_reachable(lseg, idx, dss_id);</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1211,10 +1484,11 @@ static int ff_layout_async_handle_error(struct rpc_task *task,</div><div class='ctx'> </div><div class='ctx'> 	switch (vers) {</div><div class='ctx'> 	case 3:</div><div class='del'>-		return ff_layout_async_handle_error_v3(task, lseg, idx);</div><div class='add'>+		return ff_layout_async_handle_error_v3(task, op_status, clp,</div><div class='add'>+						       lseg, idx, dss_id);</div><div class='ctx'> 	case 4:</div><div class='del'>-		return ff_layout_async_handle_error_v4(task, state, clp,</div><div class='del'>-						       lseg, idx);</div><div class='add'>+		return ff_layout_async_handle_error_v4(task, op_status, state,</div><div class='add'>+						       clp, lseg, idx, dss_id);</div><div class='ctx'> 	default:</div><div class='ctx'> 		/* should never happen */</div><div class='ctx'> 		WARN_ON_ONCE(1);</div><div class='hunk'>@@ -1223,7 +1497,7 @@ static int ff_layout_async_handle_error(struct rpc_task *task,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void ff_layout_io_track_ds_error(struct pnfs_layout_segment *lseg,</div><div class='del'>-					u32 idx, u64 offset, u64 length,</div><div class='add'>+					u32 idx, u32 dss_id, u64 offset, u64 length,</div><div class='ctx'> 					u32 *op_status, int opnum, int error)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_ff_layout_mirror *mirror;</div><div class='hunk'>@@ -1236,15 +1510,19 @@ static void ff_layout_io_track_ds_error(struct pnfs_layout_segment *lseg,</div><div class='ctx'> 		case -EPFNOSUPPORT:</div><div class='ctx'> 		case -EPROTONOSUPPORT:</div><div class='ctx'> 		case -EOPNOTSUPP:</div><div class='add'>+		case -EINVAL:</div><div class='ctx'> 		case -ECONNREFUSED:</div><div class='ctx'> 		case -ECONNRESET:</div><div class='ctx'> 		case -EHOSTDOWN:</div><div class='ctx'> 		case -EHOSTUNREACH:</div><div class='add'>+		case -ENETDOWN:</div><div class='ctx'> 		case -ENETUNREACH:</div><div class='ctx'> 		case -EADDRINUSE:</div><div class='ctx'> 		case -ENOBUFS:</div><div class='ctx'> 		case -EPIPE:</div><div class='ctx'> 		case -EPERM:</div><div class='add'>+		case -EPROTO:</div><div class='add'>+		case -ENODEV:</div><div class='ctx'> 			*op_status = status = NFS4ERR_NXIO;</div><div class='ctx'> 			break;</div><div class='ctx'> 		case -EACCES:</div><div class='hunk'>@@ -1257,15 +1535,16 @@ static void ff_layout_io_track_ds_error(struct pnfs_layout_segment *lseg,</div><div class='ctx'> </div><div class='ctx'> 	mirror = FF_LAYOUT_COMP(lseg, idx);</div><div class='ctx'> 	err = ff_layout_track_ds_error(FF_LAYOUT_FROM_HDR(lseg-&gt;pls_layout),</div><div class='del'>-				       mirror, offset, length, status, opnum,</div><div class='del'>-				       GFP_NOIO);</div><div class='add'>+				       mirror, dss_id, offset, length, status, opnum,</div><div class='add'>+				       nfs_io_gfp_mask());</div><div class='ctx'> </div><div class='ctx'> 	switch (status) {</div><div class='ctx'> 	case NFS4ERR_DELAY:</div><div class='ctx'> 	case NFS4ERR_GRACE:</div><div class='add'>+	case NFS4ERR_PERM:</div><div class='ctx'> 		break;</div><div class='ctx'> 	case NFS4ERR_NXIO:</div><div class='del'>-		ff_layout_mark_ds_unreachable(lseg, idx);</div><div class='add'>+		ff_layout_mark_ds_unreachable(lseg, idx, dss_id);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Don't return the layout if this is a read and we still</div><div class='ctx'> 		 * have layouts to try</div><div class='hunk'>@@ -1285,19 +1564,27 @@ static void ff_layout_io_track_ds_error(struct pnfs_layout_segment *lseg,</div><div class='ctx'> static int ff_layout_read_done_cb(struct rpc_task *task,</div><div class='ctx'> 				struct nfs_pgio_header *hdr)</div><div class='ctx'> {</div><div class='add'>+	struct nfs4_ff_layout_segment *flseg = FF_LAYOUT_LSEG(hdr-&gt;lseg);</div><div class='add'>+	u32 dss_id = nfs4_ff_layout_calc_dss_id(</div><div class='add'>+		flseg-&gt;stripe_unit,</div><div class='add'>+		flseg-&gt;mirror_array[hdr-&gt;pgio_mirror_idx]-&gt;dss_count,</div><div class='add'>+		hdr-&gt;args.offset);</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (task-&gt;tk_status &lt; 0) {</div><div class='del'>-		ff_layout_io_track_ds_error(hdr-&gt;lseg, hdr-&gt;pgio_mirror_idx,</div><div class='add'>+		ff_layout_io_track_ds_error(hdr-&gt;lseg,</div><div class='add'>+					    hdr-&gt;pgio_mirror_idx, dss_id,</div><div class='ctx'> 					    hdr-&gt;args.offset, hdr-&gt;args.count,</div><div class='ctx'> 					    &amp;hdr-&gt;res.op_status, OP_READ,</div><div class='ctx'> 					    task-&gt;tk_status);</div><div class='del'>-		trace_ff_layout_read_error(hdr);</div><div class='add'>+		trace_ff_layout_read_error(hdr, task-&gt;tk_status);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = ff_layout_async_handle_error(task, hdr-&gt;args.context-&gt;state,</div><div class='add'>+	err = ff_layout_async_handle_error(task, hdr-&gt;res.op_status,</div><div class='add'>+					   hdr-&gt;args.context-&gt;state,</div><div class='ctx'> 					   hdr-&gt;ds_clp, hdr-&gt;lseg,</div><div class='del'>-					   hdr-&gt;pgio_mirror_idx);</div><div class='add'>+					   hdr-&gt;pgio_mirror_idx,</div><div class='add'>+					   dss_id);</div><div class='ctx'> </div><div class='ctx'> 	trace_nfs4_pnfs_read(hdr, err);</div><div class='ctx'> 	clear_bit(NFS_IOHDR_RESEND_PNFS, &amp;hdr-&gt;flags);</div><div class='hunk'>@@ -1311,6 +1598,9 @@ static int ff_layout_read_done_cb(struct rpc_task *task,</div><div class='ctx'> 		return task-&gt;tk_status;</div><div class='ctx'> 	case -EAGAIN:</div><div class='ctx'> 		goto out_eagain;</div><div class='add'>+	case -NFS4ERR_FATAL_IOERROR:</div><div class='add'>+		task-&gt;tk_status = -EIO;</div><div class='add'>+		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -1350,23 +1640,47 @@ ff_layout_set_layoutcommit(struct inode *inode,</div><div class='ctx'> static void ff_layout_read_record_layoutstats_start(struct rpc_task *task,</div><div class='ctx'> 		struct nfs_pgio_header *hdr)</div><div class='ctx'> {</div><div class='add'>+	struct nfs4_ff_layout_mirror *mirror;</div><div class='add'>+	u32 dss_id;</div><div class='add'>+</div><div class='ctx'> 	if (test_and_set_bit(NFS_IOHDR_STAT, &amp;hdr-&gt;flags))</div><div class='ctx'> 		return;</div><div class='del'>-	nfs4_ff_layout_stat_io_start_read(hdr-&gt;inode,</div><div class='del'>-			FF_LAYOUT_COMP(hdr-&gt;lseg, hdr-&gt;pgio_mirror_idx),</div><div class='del'>-			hdr-&gt;args.count,</div><div class='del'>-			task-&gt;tk_start);</div><div class='add'>+</div><div class='add'>+	mirror = FF_LAYOUT_COMP(hdr-&gt;lseg, hdr-&gt;pgio_mirror_idx);</div><div class='add'>+	dss_id = nfs4_ff_layout_calc_dss_id(</div><div class='add'>+		FF_LAYOUT_LSEG(hdr-&gt;lseg)-&gt;stripe_unit,</div><div class='add'>+		mirror-&gt;dss_count,</div><div class='add'>+		hdr-&gt;args.offset);</div><div class='add'>+</div><div class='add'>+	nfs4_ff_layout_stat_io_start_read(</div><div class='add'>+		hdr-&gt;inode,</div><div class='add'>+		mirror,</div><div class='add'>+		dss_id,</div><div class='add'>+		hdr-&gt;args.count,</div><div class='add'>+		task-&gt;tk_start);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void ff_layout_read_record_layoutstats_done(struct rpc_task *task,</div><div class='ctx'> 		struct nfs_pgio_header *hdr)</div><div class='ctx'> {</div><div class='add'>+	struct nfs4_ff_layout_mirror *mirror;</div><div class='add'>+	u32 dss_id;</div><div class='add'>+</div><div class='ctx'> 	if (!test_and_clear_bit(NFS_IOHDR_STAT, &amp;hdr-&gt;flags))</div><div class='ctx'> 		return;</div><div class='del'>-	nfs4_ff_layout_stat_io_end_read(task,</div><div class='del'>-			FF_LAYOUT_COMP(hdr-&gt;lseg, hdr-&gt;pgio_mirror_idx),</div><div class='del'>-			hdr-&gt;args.count,</div><div class='del'>-			hdr-&gt;res.count);</div><div class='add'>+</div><div class='add'>+	mirror = FF_LAYOUT_COMP(hdr-&gt;lseg, hdr-&gt;pgio_mirror_idx);</div><div class='add'>+	dss_id = nfs4_ff_layout_calc_dss_id(</div><div class='add'>+		FF_LAYOUT_LSEG(hdr-&gt;lseg)-&gt;stripe_unit,</div><div class='add'>+		mirror-&gt;dss_count,</div><div class='add'>+		hdr-&gt;args.offset);</div><div class='add'>+</div><div class='add'>+	nfs4_ff_layout_stat_io_end_read(</div><div class='add'>+		task,</div><div class='add'>+		mirror,</div><div class='add'>+		dss_id,</div><div class='add'>+		hdr-&gt;args.count,</div><div class='add'>+		hdr-&gt;res.count);</div><div class='ctx'> 	set_bit(NFS_LSEG_LAYOUTRETURN, &amp;hdr-&gt;lseg-&gt;pls_flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1378,6 +1692,11 @@ static int ff_layout_read_prepare_common(struct rpc_task *task,</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (!pnfs_is_valid_lseg(hdr-&gt;lseg)) {</div><div class='add'>+		rpc_exit(task, -EAGAIN);</div><div class='add'>+		return -EAGAIN;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	ff_layout_read_record_layoutstats_start(task, hdr);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -1449,20 +1768,28 @@ static void ff_layout_read_release(void *data)</div><div class='ctx'> static int ff_layout_write_done_cb(struct rpc_task *task,</div><div class='ctx'> 				struct nfs_pgio_header *hdr)</div><div class='ctx'> {</div><div class='add'>+	struct nfs4_ff_layout_segment *flseg = FF_LAYOUT_LSEG(hdr-&gt;lseg);</div><div class='add'>+	u32 dss_id = nfs4_ff_layout_calc_dss_id(</div><div class='add'>+		flseg-&gt;stripe_unit,</div><div class='add'>+		flseg-&gt;mirror_array[hdr-&gt;pgio_mirror_idx]-&gt;dss_count,</div><div class='add'>+		hdr-&gt;args.offset);</div><div class='ctx'> 	loff_t end_offs = 0;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (task-&gt;tk_status &lt; 0) {</div><div class='del'>-		ff_layout_io_track_ds_error(hdr-&gt;lseg, hdr-&gt;pgio_mirror_idx,</div><div class='add'>+		ff_layout_io_track_ds_error(hdr-&gt;lseg,</div><div class='add'>+					    hdr-&gt;pgio_mirror_idx, dss_id,</div><div class='ctx'> 					    hdr-&gt;args.offset, hdr-&gt;args.count,</div><div class='ctx'> 					    &amp;hdr-&gt;res.op_status, OP_WRITE,</div><div class='ctx'> 					    task-&gt;tk_status);</div><div class='del'>-		trace_ff_layout_write_error(hdr);</div><div class='add'>+		trace_ff_layout_write_error(hdr, task-&gt;tk_status);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = ff_layout_async_handle_error(task, hdr-&gt;args.context-&gt;state,</div><div class='add'>+	err = ff_layout_async_handle_error(task, hdr-&gt;res.op_status,</div><div class='add'>+					   hdr-&gt;args.context-&gt;state,</div><div class='ctx'> 					   hdr-&gt;ds_clp, hdr-&gt;lseg,</div><div class='del'>-					   hdr-&gt;pgio_mirror_idx);</div><div class='add'>+					   hdr-&gt;pgio_mirror_idx,</div><div class='add'>+					   dss_id);</div><div class='ctx'> </div><div class='ctx'> 	trace_nfs4_pnfs_write(hdr, err);</div><div class='ctx'> 	clear_bit(NFS_IOHDR_RESEND_PNFS, &amp;hdr-&gt;flags);</div><div class='hunk'>@@ -1476,6 +1803,9 @@ static int ff_layout_write_done_cb(struct rpc_task *task,</div><div class='ctx'> 		return task-&gt;tk_status;</div><div class='ctx'> 	case -EAGAIN:</div><div class='ctx'> 		return -EAGAIN;</div><div class='add'>+	case -NFS4ERR_FATAL_IOERROR:</div><div class='add'>+		task-&gt;tk_status = -EIO;</div><div class='add'>+		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (hdr-&gt;res.verf-&gt;committed == NFS_FILE_SYNC ||</div><div class='hunk'>@@ -1497,17 +1827,20 @@ static int ff_layout_commit_done_cb(struct rpc_task *task,</div><div class='ctx'> 				     struct nfs_commit_data *data)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='add'>+	u32 idx = calc_mirror_idx_from_commit(data-&gt;lseg, data-&gt;ds_commit_index);</div><div class='add'>+	u32 dss_id = calc_dss_id_from_commit(data-&gt;lseg, data-&gt;ds_commit_index);</div><div class='ctx'> </div><div class='ctx'> 	if (task-&gt;tk_status &lt; 0) {</div><div class='del'>-		ff_layout_io_track_ds_error(data-&gt;lseg, data-&gt;ds_commit_index,</div><div class='add'>+		ff_layout_io_track_ds_error(data-&gt;lseg, idx, dss_id,</div><div class='ctx'> 					    data-&gt;args.offset, data-&gt;args.count,</div><div class='ctx'> 					    &amp;data-&gt;res.op_status, OP_COMMIT,</div><div class='ctx'> 					    task-&gt;tk_status);</div><div class='del'>-		trace_ff_layout_commit_error(data);</div><div class='add'>+		trace_ff_layout_commit_error(data, task-&gt;tk_status);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = ff_layout_async_handle_error(task, NULL, data-&gt;ds_clp,</div><div class='del'>-					   data-&gt;lseg, data-&gt;ds_commit_index);</div><div class='add'>+	err = ff_layout_async_handle_error(task, data-&gt;res.op_status,</div><div class='add'>+					   NULL, data-&gt;ds_clp, data-&gt;lseg, idx,</div><div class='add'>+					   dss_id);</div><div class='ctx'> </div><div class='ctx'> 	trace_nfs4_pnfs_commit_ds(data, err);</div><div class='ctx'> 	switch (err) {</div><div class='hunk'>@@ -1520,33 +1853,60 @@ static int ff_layout_commit_done_cb(struct rpc_task *task,</div><div class='ctx'> 	case -EAGAIN:</div><div class='ctx'> 		rpc_restart_call_prepare(task);</div><div class='ctx'> 		return -EAGAIN;</div><div class='add'>+	case -NFS4ERR_FATAL_IOERROR:</div><div class='add'>+		task-&gt;tk_status = -EIO;</div><div class='add'>+		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ff_layout_set_layoutcommit(data-&gt;inode, data-&gt;lseg, data-&gt;lwb);</div><div class='del'>-</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void ff_layout_write_record_layoutstats_start(struct rpc_task *task,</div><div class='ctx'> 		struct nfs_pgio_header *hdr)</div><div class='ctx'> {</div><div class='add'>+	struct nfs4_ff_layout_mirror *mirror;</div><div class='add'>+	u32 dss_id;</div><div class='add'>+</div><div class='ctx'> 	if (test_and_set_bit(NFS_IOHDR_STAT, &amp;hdr-&gt;flags))</div><div class='ctx'> 		return;</div><div class='del'>-	nfs4_ff_layout_stat_io_start_write(hdr-&gt;inode,</div><div class='del'>-			FF_LAYOUT_COMP(hdr-&gt;lseg, hdr-&gt;pgio_mirror_idx),</div><div class='del'>-			hdr-&gt;args.count,</div><div class='del'>-			task-&gt;tk_start);</div><div class='add'>+</div><div class='add'>+	mirror = FF_LAYOUT_COMP(hdr-&gt;lseg, hdr-&gt;pgio_mirror_idx);</div><div class='add'>+	dss_id = nfs4_ff_layout_calc_dss_id(</div><div class='add'>+		FF_LAYOUT_LSEG(hdr-&gt;lseg)-&gt;stripe_unit,</div><div class='add'>+		mirror-&gt;dss_count,</div><div class='add'>+		hdr-&gt;args.offset);</div><div class='add'>+</div><div class='add'>+	nfs4_ff_layout_stat_io_start_write(</div><div class='add'>+		hdr-&gt;inode,</div><div class='add'>+		mirror,</div><div class='add'>+		dss_id,</div><div class='add'>+		hdr-&gt;args.count,</div><div class='add'>+		task-&gt;tk_start);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void ff_layout_write_record_layoutstats_done(struct rpc_task *task,</div><div class='ctx'> 		struct nfs_pgio_header *hdr)</div><div class='ctx'> {</div><div class='add'>+	struct nfs4_ff_layout_mirror *mirror;</div><div class='add'>+	u32 dss_id;</div><div class='add'>+</div><div class='ctx'> 	if (!test_and_clear_bit(NFS_IOHDR_STAT, &amp;hdr-&gt;flags))</div><div class='ctx'> 		return;</div><div class='del'>-	nfs4_ff_layout_stat_io_end_write(task,</div><div class='del'>-			FF_LAYOUT_COMP(hdr-&gt;lseg, hdr-&gt;pgio_mirror_idx),</div><div class='del'>-			hdr-&gt;args.count, hdr-&gt;res.count,</div><div class='del'>-			hdr-&gt;res.verf-&gt;committed);</div><div class='add'>+</div><div class='add'>+	mirror = FF_LAYOUT_COMP(hdr-&gt;lseg, hdr-&gt;pgio_mirror_idx);</div><div class='add'>+	dss_id = nfs4_ff_layout_calc_dss_id(</div><div class='add'>+		FF_LAYOUT_LSEG(hdr-&gt;lseg)-&gt;stripe_unit,</div><div class='add'>+		mirror-&gt;dss_count,</div><div class='add'>+		hdr-&gt;args.offset);</div><div class='add'>+</div><div class='add'>+	nfs4_ff_layout_stat_io_end_write(</div><div class='add'>+		task,</div><div class='add'>+		mirror,</div><div class='add'>+		dss_id,</div><div class='add'>+		hdr-&gt;args.count,</div><div class='add'>+		hdr-&gt;res.count,</div><div class='add'>+		hdr-&gt;res.verf-&gt;committed);</div><div class='ctx'> 	set_bit(NFS_LSEG_LAYOUTRETURN, &amp;hdr-&gt;lseg-&gt;pls_flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1558,6 +1918,11 @@ static int ff_layout_write_prepare_common(struct rpc_task *task,</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (!pnfs_is_valid_lseg(hdr-&gt;lseg)) {</div><div class='add'>+		rpc_exit(task, -EAGAIN);</div><div class='add'>+		return -EAGAIN;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	ff_layout_write_record_layoutstats_start(task, hdr);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -1624,10 +1989,16 @@ static void ff_layout_write_release(void *data)</div><div class='ctx'> static void ff_layout_commit_record_layoutstats_start(struct rpc_task *task,</div><div class='ctx'> 		struct nfs_commit_data *cdata)</div><div class='ctx'> {</div><div class='add'>+	u32 idx, dss_id;</div><div class='add'>+</div><div class='ctx'> 	if (test_and_set_bit(NFS_IOHDR_STAT, &amp;cdata-&gt;flags))</div><div class='ctx'> 		return;</div><div class='add'>+</div><div class='add'>+	idx = calc_mirror_idx_from_commit(cdata-&gt;lseg, cdata-&gt;ds_commit_index);</div><div class='add'>+	dss_id = calc_dss_id_from_commit(cdata-&gt;lseg, cdata-&gt;ds_commit_index);</div><div class='ctx'> 	nfs4_ff_layout_stat_io_start_write(cdata-&gt;inode,</div><div class='del'>-			FF_LAYOUT_COMP(cdata-&gt;lseg, cdata-&gt;ds_commit_index),</div><div class='add'>+			FF_LAYOUT_COMP(cdata-&gt;lseg, idx),</div><div class='add'>+			dss_id,</div><div class='ctx'> 			0, task-&gt;tk_start);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1636,6 +2007,7 @@ static void ff_layout_commit_record_layoutstats_done(struct rpc_task *task,</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_page *req;</div><div class='ctx'> 	__u64 count = 0;</div><div class='add'>+	u32 idx, dss_id;</div><div class='ctx'> </div><div class='ctx'> 	if (!test_and_clear_bit(NFS_IOHDR_STAT, &amp;cdata-&gt;flags))</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -1644,21 +2016,33 @@ static void ff_layout_commit_record_layoutstats_done(struct rpc_task *task,</div><div class='ctx'> 		list_for_each_entry(req, &amp;cdata-&gt;pages, wb_list)</div><div class='ctx'> 			count += req-&gt;wb_bytes;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	idx = calc_mirror_idx_from_commit(cdata-&gt;lseg, cdata-&gt;ds_commit_index);</div><div class='add'>+	dss_id = calc_dss_id_from_commit(cdata-&gt;lseg, cdata-&gt;ds_commit_index);</div><div class='ctx'> 	nfs4_ff_layout_stat_io_end_write(task,</div><div class='del'>-			FF_LAYOUT_COMP(cdata-&gt;lseg, cdata-&gt;ds_commit_index),</div><div class='add'>+			FF_LAYOUT_COMP(cdata-&gt;lseg, idx),</div><div class='add'>+			dss_id,</div><div class='ctx'> 			count, count, NFS_FILE_SYNC);</div><div class='ctx'> 	set_bit(NFS_LSEG_LAYOUTRETURN, &amp;cdata-&gt;lseg-&gt;pls_flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void ff_layout_commit_prepare_common(struct rpc_task *task,</div><div class='del'>-		struct nfs_commit_data *cdata)</div><div class='add'>+static int ff_layout_commit_prepare_common(struct rpc_task *task,</div><div class='add'>+					   struct nfs_commit_data *cdata)</div><div class='ctx'> {</div><div class='add'>+	if (!pnfs_is_valid_lseg(cdata-&gt;lseg)) {</div><div class='add'>+		rpc_exit(task, -EAGAIN);</div><div class='add'>+		return -EAGAIN;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	ff_layout_commit_record_layoutstats_start(task, cdata);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void ff_layout_commit_prepare_v3(struct rpc_task *task, void *data)</div><div class='ctx'> {</div><div class='del'>-	ff_layout_commit_prepare_common(task, data);</div><div class='add'>+	if (ff_layout_commit_prepare_common(task, data))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='ctx'> 	rpc_call_start(task);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1744,32 +2128,41 @@ ff_layout_read_pagelist(struct nfs_pgio_header *hdr)</div><div class='ctx'> 	struct pnfs_layout_segment *lseg = hdr-&gt;lseg;</div><div class='ctx'> 	struct nfs4_pnfs_ds *ds;</div><div class='ctx'> 	struct rpc_clnt *ds_clnt;</div><div class='add'>+	struct nfsd_file *localio;</div><div class='ctx'> 	struct nfs4_ff_layout_mirror *mirror;</div><div class='ctx'> 	const struct cred *ds_cred;</div><div class='ctx'> 	loff_t offset = hdr-&gt;args.offset;</div><div class='ctx'> 	u32 idx = hdr-&gt;pgio_mirror_idx;</div><div class='ctx'> 	int vers;</div><div class='ctx'> 	struct nfs_fh *fh;</div><div class='add'>+	u32 dss_id;</div><div class='add'>+	bool ds_fatal_error = false;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("--&gt; %s ino %lu pgbase %u req %zu@%llu\n",</div><div class='ctx'> 		__func__, hdr-&gt;inode-&gt;i_ino,</div><div class='ctx'> 		hdr-&gt;args.pgbase, (size_t)hdr-&gt;args.count, offset);</div><div class='ctx'> </div><div class='ctx'> 	mirror = FF_LAYOUT_COMP(lseg, idx);</div><div class='del'>-	ds = nfs4_ff_layout_prepare_ds(lseg, mirror, false);</div><div class='del'>-	if (!ds)</div><div class='add'>+	dss_id = nfs4_ff_layout_calc_dss_id(</div><div class='add'>+		FF_LAYOUT_LSEG(lseg)-&gt;stripe_unit,</div><div class='add'>+		mirror-&gt;dss_count,</div><div class='add'>+		offset);</div><div class='add'>+	ds = nfs4_ff_layout_prepare_ds(lseg, mirror, dss_id, false);</div><div class='add'>+	if (IS_ERR(ds)) {</div><div class='add'>+		ds_fatal_error = nfs_error_is_fatal(PTR_ERR(ds));</div><div class='ctx'> 		goto out_failed;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	ds_clnt = nfs4_ff_find_or_create_ds_client(mirror, ds-&gt;ds_clp,</div><div class='del'>-						   hdr-&gt;inode);</div><div class='add'>+						   hdr-&gt;inode, dss_id);</div><div class='ctx'> 	if (IS_ERR(ds_clnt))</div><div class='ctx'> 		goto out_failed;</div><div class='ctx'> </div><div class='del'>-	ds_cred = ff_layout_get_ds_cred(mirror, &amp;lseg-&gt;pls_range, hdr-&gt;cred);</div><div class='add'>+	ds_cred = ff_layout_get_ds_cred(mirror, &amp;lseg-&gt;pls_range, hdr-&gt;cred, dss_id);</div><div class='ctx'> 	if (!ds_cred)</div><div class='ctx'> 		goto out_failed;</div><div class='ctx'> </div><div class='del'>-	vers = nfs4_ff_layout_ds_version(mirror);</div><div class='add'>+	vers = nfs4_ff_layout_ds_version(mirror, dss_id);</div><div class='ctx'> </div><div class='ctx'> 	dprintk("%s USE DS: %s cl_count %d vers %d\n", __func__,</div><div class='ctx'> 		ds-&gt;ds_remotestr, refcount_read(&amp;ds-&gt;ds_clp-&gt;cl_count), vers);</div><div class='hunk'>@@ -1777,11 +2170,11 @@ ff_layout_read_pagelist(struct nfs_pgio_header *hdr)</div><div class='ctx'> 	hdr-&gt;pgio_done_cb = ff_layout_read_done_cb;</div><div class='ctx'> 	refcount_inc(&amp;ds-&gt;ds_clp-&gt;cl_count);</div><div class='ctx'> 	hdr-&gt;ds_clp = ds-&gt;ds_clp;</div><div class='del'>-	fh = nfs4_ff_layout_select_ds_fh(mirror);</div><div class='add'>+	fh = nfs4_ff_layout_select_ds_fh(mirror, dss_id);</div><div class='ctx'> 	if (fh)</div><div class='ctx'> 		hdr-&gt;args.fh = fh;</div><div class='ctx'> </div><div class='del'>-	nfs4_ff_layout_select_ds_stateid(mirror, &amp;hdr-&gt;args.stateid);</div><div class='add'>+	nfs4_ff_layout_select_ds_stateid(mirror, dss_id, &amp;hdr-&gt;args.stateid);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Note that if we ever decide to split across DSes,</div><div class='hunk'>@@ -1790,16 +2183,24 @@ ff_layout_read_pagelist(struct nfs_pgio_header *hdr)</div><div class='ctx'> 	hdr-&gt;args.offset = offset;</div><div class='ctx'> 	hdr-&gt;mds_offset = offset;</div><div class='ctx'> </div><div class='add'>+	/* Start IO accounting for local read */</div><div class='add'>+	localio = ff_local_open_fh(lseg, idx, dss_id, ds-&gt;ds_clp, ds_cred, fh,</div><div class='add'>+				FMODE_READ);</div><div class='add'>+	if (localio) {</div><div class='add'>+		hdr-&gt;task.tk_start = ktime_get();</div><div class='add'>+		ff_layout_read_record_layoutstats_start(&amp;hdr-&gt;task, hdr);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/* Perform an asynchronous read to ds */</div><div class='ctx'> 	nfs_initiate_pgio(ds_clnt, hdr, ds_cred, ds-&gt;ds_clp-&gt;rpc_ops,</div><div class='ctx'> 			  vers == 3 ? &amp;ff_layout_read_call_ops_v3 :</div><div class='ctx'> 				      &amp;ff_layout_read_call_ops_v4,</div><div class='del'>-			  0, RPC_TASK_SOFTCONN);</div><div class='add'>+			  0, RPC_TASK_SOFTCONN, localio);</div><div class='ctx'> 	put_cred(ds_cred);</div><div class='ctx'> 	return PNFS_ATTEMPTED;</div><div class='ctx'> </div><div class='ctx'> out_failed:</div><div class='del'>-	if (ff_layout_avoid_mds_available_ds(lseg))</div><div class='add'>+	if (ff_layout_avoid_mds_available_ds(lseg) &amp;&amp; !ds_fatal_error)</div><div class='ctx'> 		return PNFS_TRY_AGAIN;</div><div class='ctx'> 	trace_pnfs_mds_fallback_read_pagelist(hdr-&gt;inode,</div><div class='ctx'> 			hdr-&gt;args.offset, hdr-&gt;args.count,</div><div class='hunk'>@@ -1814,28 +2215,37 @@ ff_layout_write_pagelist(struct nfs_pgio_header *hdr, int sync)</div><div class='ctx'> 	struct pnfs_layout_segment *lseg = hdr-&gt;lseg;</div><div class='ctx'> 	struct nfs4_pnfs_ds *ds;</div><div class='ctx'> 	struct rpc_clnt *ds_clnt;</div><div class='add'>+	struct nfsd_file *localio;</div><div class='ctx'> 	struct nfs4_ff_layout_mirror *mirror;</div><div class='ctx'> 	const struct cred *ds_cred;</div><div class='ctx'> 	loff_t offset = hdr-&gt;args.offset;</div><div class='ctx'> 	int vers;</div><div class='ctx'> 	struct nfs_fh *fh;</div><div class='ctx'> 	u32 idx = hdr-&gt;pgio_mirror_idx;</div><div class='add'>+	u32 dss_id;</div><div class='add'>+	bool ds_fatal_error = false;</div><div class='ctx'> </div><div class='ctx'> 	mirror = FF_LAYOUT_COMP(lseg, idx);</div><div class='del'>-	ds = nfs4_ff_layout_prepare_ds(lseg, mirror, true);</div><div class='del'>-	if (!ds)</div><div class='add'>+	dss_id = nfs4_ff_layout_calc_dss_id(</div><div class='add'>+		FF_LAYOUT_LSEG(lseg)-&gt;stripe_unit,</div><div class='add'>+		mirror-&gt;dss_count,</div><div class='add'>+		offset);</div><div class='add'>+	ds = nfs4_ff_layout_prepare_ds(lseg, mirror, dss_id, true);</div><div class='add'>+	if (IS_ERR(ds)) {</div><div class='add'>+		ds_fatal_error = nfs_error_is_fatal(PTR_ERR(ds));</div><div class='ctx'> 		goto out_failed;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	ds_clnt = nfs4_ff_find_or_create_ds_client(mirror, ds-&gt;ds_clp,</div><div class='del'>-						   hdr-&gt;inode);</div><div class='add'>+						   hdr-&gt;inode, dss_id);</div><div class='ctx'> 	if (IS_ERR(ds_clnt))</div><div class='ctx'> 		goto out_failed;</div><div class='ctx'> </div><div class='del'>-	ds_cred = ff_layout_get_ds_cred(mirror, &amp;lseg-&gt;pls_range, hdr-&gt;cred);</div><div class='add'>+	ds_cred = ff_layout_get_ds_cred(mirror, &amp;lseg-&gt;pls_range, hdr-&gt;cred, dss_id);</div><div class='ctx'> 	if (!ds_cred)</div><div class='ctx'> 		goto out_failed;</div><div class='ctx'> </div><div class='del'>-	vers = nfs4_ff_layout_ds_version(mirror);</div><div class='add'>+	vers = nfs4_ff_layout_ds_version(mirror, dss_id);</div><div class='ctx'> </div><div class='ctx'> 	dprintk("%s ino %lu sync %d req %zu@%llu DS: %s cl_count %d vers %d\n",</div><div class='ctx'> 		__func__, hdr-&gt;inode-&gt;i_ino, sync, (size_t) hdr-&gt;args.count,</div><div class='hunk'>@@ -1845,12 +2255,12 @@ ff_layout_write_pagelist(struct nfs_pgio_header *hdr, int sync)</div><div class='ctx'> 	hdr-&gt;pgio_done_cb = ff_layout_write_done_cb;</div><div class='ctx'> 	refcount_inc(&amp;ds-&gt;ds_clp-&gt;cl_count);</div><div class='ctx'> 	hdr-&gt;ds_clp = ds-&gt;ds_clp;</div><div class='del'>-	hdr-&gt;ds_commit_idx = idx;</div><div class='del'>-	fh = nfs4_ff_layout_select_ds_fh(mirror);</div><div class='add'>+	hdr-&gt;ds_commit_idx = calc_commit_idx(lseg, idx, dss_id);</div><div class='add'>+	fh = nfs4_ff_layout_select_ds_fh(mirror, dss_id);</div><div class='ctx'> 	if (fh)</div><div class='ctx'> 		hdr-&gt;args.fh = fh;</div><div class='ctx'> </div><div class='del'>-	nfs4_ff_layout_select_ds_stateid(mirror, &amp;hdr-&gt;args.stateid);</div><div class='add'>+	nfs4_ff_layout_select_ds_stateid(mirror, dss_id, &amp;hdr-&gt;args.stateid);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Note that if we ever decide to split across DSes,</div><div class='hunk'>@@ -1858,16 +2268,24 @@ ff_layout_write_pagelist(struct nfs_pgio_header *hdr, int sync)</div><div class='ctx'> 	 */</div><div class='ctx'> 	hdr-&gt;args.offset = offset;</div><div class='ctx'> </div><div class='add'>+	/* Start IO accounting for local write */</div><div class='add'>+	localio = ff_local_open_fh(lseg, idx, dss_id, ds-&gt;ds_clp, ds_cred, fh,</div><div class='add'>+				   FMODE_READ|FMODE_WRITE);</div><div class='add'>+	if (localio) {</div><div class='add'>+		hdr-&gt;task.tk_start = ktime_get();</div><div class='add'>+		ff_layout_write_record_layoutstats_start(&amp;hdr-&gt;task, hdr);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/* Perform an asynchronous write */</div><div class='ctx'> 	nfs_initiate_pgio(ds_clnt, hdr, ds_cred, ds-&gt;ds_clp-&gt;rpc_ops,</div><div class='ctx'> 			  vers == 3 ? &amp;ff_layout_write_call_ops_v3 :</div><div class='ctx'> 				      &amp;ff_layout_write_call_ops_v4,</div><div class='del'>-			  sync, RPC_TASK_SOFTCONN);</div><div class='add'>+			  sync, RPC_TASK_SOFTCONN, localio);</div><div class='ctx'> 	put_cred(ds_cred);</div><div class='ctx'> 	return PNFS_ATTEMPTED;</div><div class='ctx'> </div><div class='ctx'> out_failed:</div><div class='del'>-	if (ff_layout_avoid_mds_available_ds(lseg))</div><div class='add'>+	if (ff_layout_avoid_mds_available_ds(lseg) &amp;&amp; !ds_fatal_error)</div><div class='ctx'> 		return PNFS_TRY_AGAIN;</div><div class='ctx'> 	trace_pnfs_mds_fallback_write_pagelist(hdr-&gt;inode,</div><div class='ctx'> 			hdr-&gt;args.offset, hdr-&gt;args.count,</div><div class='hunk'>@@ -1875,20 +2293,15 @@ out_failed:</div><div class='ctx'> 	return PNFS_NOT_ATTEMPTED;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static u32 calc_ds_index_from_commit(struct pnfs_layout_segment *lseg, u32 i)</div><div class='del'>-{</div><div class='del'>-	return i;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static struct nfs_fh *</div><div class='del'>-select_ds_fh_from_commit(struct pnfs_layout_segment *lseg, u32 i)</div><div class='add'>+select_ds_fh_from_commit(struct pnfs_layout_segment *lseg, u32 i, u32 dss_id)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_ff_layout_segment *flseg = FF_LAYOUT_LSEG(lseg);</div><div class='ctx'> </div><div class='ctx'> 	/* FIXME: Assume that there is only one NFS version available</div><div class='ctx'> 	 * for the DS.</div><div class='ctx'> 	 */</div><div class='del'>-	return &amp;flseg-&gt;mirror_array[i]-&gt;fh_versions[0];</div><div class='add'>+	return &amp;flseg-&gt;mirror_array[i]-&gt;dss[dss_id].fh_versions[0];</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int ff_layout_initiate_commit(struct nfs_commit_data *data, int how)</div><div class='hunk'>@@ -1896,9 +2309,10 @@ static int ff_layout_initiate_commit(struct nfs_commit_data *data, int how)</div><div class='ctx'> 	struct pnfs_layout_segment *lseg = data-&gt;lseg;</div><div class='ctx'> 	struct nfs4_pnfs_ds *ds;</div><div class='ctx'> 	struct rpc_clnt *ds_clnt;</div><div class='add'>+	struct nfsd_file *localio;</div><div class='ctx'> 	struct nfs4_ff_layout_mirror *mirror;</div><div class='ctx'> 	const struct cred *ds_cred;</div><div class='del'>-	u32 idx;</div><div class='add'>+	u32 idx, dss_id;</div><div class='ctx'> 	int vers, ret;</div><div class='ctx'> 	struct nfs_fh *fh;</div><div class='ctx'> </div><div class='hunk'>@@ -1906,22 +2320,23 @@ static int ff_layout_initiate_commit(struct nfs_commit_data *data, int how)</div><div class='ctx'> 	    test_bit(NFS_LSEG_LAYOUTRETURN, &amp;lseg-&gt;pls_flags)))</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> </div><div class='del'>-	idx = calc_ds_index_from_commit(lseg, data-&gt;ds_commit_index);</div><div class='add'>+	idx = calc_mirror_idx_from_commit(lseg, data-&gt;ds_commit_index);</div><div class='ctx'> 	mirror = FF_LAYOUT_COMP(lseg, idx);</div><div class='del'>-	ds = nfs4_ff_layout_prepare_ds(lseg, mirror, true);</div><div class='del'>-	if (!ds)</div><div class='add'>+	dss_id = calc_dss_id_from_commit(lseg, data-&gt;ds_commit_index);</div><div class='add'>+	ds = nfs4_ff_layout_prepare_ds(lseg, mirror, dss_id, true);</div><div class='add'>+	if (IS_ERR(ds))</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> </div><div class='ctx'> 	ds_clnt = nfs4_ff_find_or_create_ds_client(mirror, ds-&gt;ds_clp,</div><div class='del'>-						   data-&gt;inode);</div><div class='add'>+						   data-&gt;inode, dss_id);</div><div class='ctx'> 	if (IS_ERR(ds_clnt))</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> </div><div class='del'>-	ds_cred = ff_layout_get_ds_cred(mirror, &amp;lseg-&gt;pls_range, data-&gt;cred);</div><div class='add'>+	ds_cred = ff_layout_get_ds_cred(mirror, &amp;lseg-&gt;pls_range, data-&gt;cred, dss_id);</div><div class='ctx'> 	if (!ds_cred)</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> </div><div class='del'>-	vers = nfs4_ff_layout_ds_version(mirror);</div><div class='add'>+	vers = nfs4_ff_layout_ds_version(mirror, dss_id);</div><div class='ctx'> </div><div class='ctx'> 	dprintk("%s ino %lu, how %d cl_count %d vers %d\n", __func__,</div><div class='ctx'> 		data-&gt;inode-&gt;i_ino, how, refcount_read(&amp;ds-&gt;ds_clp-&gt;cl_count),</div><div class='hunk'>@@ -1930,14 +2345,22 @@ static int ff_layout_initiate_commit(struct nfs_commit_data *data, int how)</div><div class='ctx'> 	data-&gt;cred = ds_cred;</div><div class='ctx'> 	refcount_inc(&amp;ds-&gt;ds_clp-&gt;cl_count);</div><div class='ctx'> 	data-&gt;ds_clp = ds-&gt;ds_clp;</div><div class='del'>-	fh = select_ds_fh_from_commit(lseg, data-&gt;ds_commit_index);</div><div class='add'>+	fh = select_ds_fh_from_commit(lseg, idx, dss_id);</div><div class='ctx'> 	if (fh)</div><div class='ctx'> 		data-&gt;args.fh = fh;</div><div class='ctx'> </div><div class='add'>+	/* Start IO accounting for local commit */</div><div class='add'>+	localio = ff_local_open_fh(lseg, idx, dss_id, ds-&gt;ds_clp, ds_cred, fh,</div><div class='add'>+				   FMODE_READ|FMODE_WRITE);</div><div class='add'>+	if (localio) {</div><div class='add'>+		data-&gt;task.tk_start = ktime_get();</div><div class='add'>+		ff_layout_commit_record_layoutstats_start(&amp;data-&gt;task, data);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	ret = nfs_initiate_commit(ds_clnt, data, ds-&gt;ds_clp-&gt;rpc_ops,</div><div class='ctx'> 				   vers == 3 ? &amp;ff_layout_commit_call_ops_v3 :</div><div class='ctx'> 					       &amp;ff_layout_commit_call_ops_v4,</div><div class='del'>-				   how, RPC_TASK_SOFTCONN);</div><div class='add'>+				   how, RPC_TASK_SOFTCONN, localio);</div><div class='ctx'> 	put_cred(ds_cred);</div><div class='ctx'> 	return ret;</div><div class='ctx'> out_err:</div><div class='hunk'>@@ -1954,6 +2377,68 @@ ff_layout_commit_pagelist(struct inode *inode, struct list_head *mds_pages,</div><div class='ctx'> 					    ff_layout_initiate_commit);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool ff_layout_match_rw(const struct rpc_task *task,</div><div class='add'>+			       const struct nfs_pgio_header *hdr,</div><div class='add'>+			       const struct pnfs_layout_segment *lseg)</div><div class='add'>+{</div><div class='add'>+	return hdr-&gt;lseg == lseg;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool ff_layout_match_commit(const struct rpc_task *task,</div><div class='add'>+				   const struct nfs_commit_data *cdata,</div><div class='add'>+				   const struct pnfs_layout_segment *lseg)</div><div class='add'>+{</div><div class='add'>+	return cdata-&gt;lseg == lseg;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool ff_layout_match_io(const struct rpc_task *task, const void *data)</div><div class='add'>+{</div><div class='add'>+	const struct rpc_call_ops *ops = task-&gt;tk_ops;</div><div class='add'>+</div><div class='add'>+	if (ops == &amp;ff_layout_read_call_ops_v3 ||</div><div class='add'>+	    ops == &amp;ff_layout_read_call_ops_v4 ||</div><div class='add'>+	    ops == &amp;ff_layout_write_call_ops_v3 ||</div><div class='add'>+	    ops == &amp;ff_layout_write_call_ops_v4)</div><div class='add'>+		return ff_layout_match_rw(task, task-&gt;tk_calldata, data);</div><div class='add'>+	if (ops == &amp;ff_layout_commit_call_ops_v3 ||</div><div class='add'>+	    ops == &amp;ff_layout_commit_call_ops_v4)</div><div class='add'>+		return ff_layout_match_commit(task, task-&gt;tk_calldata, data);</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void ff_layout_cancel_io(struct pnfs_layout_segment *lseg)</div><div class='add'>+{</div><div class='add'>+	struct nfs4_ff_layout_segment *flseg = FF_LAYOUT_LSEG(lseg);</div><div class='add'>+	struct nfs4_ff_layout_mirror *mirror;</div><div class='add'>+	struct nfs4_ff_layout_ds *mirror_ds;</div><div class='add'>+	struct nfs4_pnfs_ds *ds;</div><div class='add'>+	struct nfs_client *ds_clp;</div><div class='add'>+	struct rpc_clnt *clnt;</div><div class='add'>+	u32 idx, dss_id;</div><div class='add'>+</div><div class='add'>+	for (idx = 0; idx &lt; flseg-&gt;mirror_array_cnt; idx++) {</div><div class='add'>+		mirror = flseg-&gt;mirror_array[idx];</div><div class='add'>+		for (dss_id = 0; dss_id &lt; mirror-&gt;dss_count; dss_id++) {</div><div class='add'>+			mirror_ds = mirror-&gt;dss[dss_id].mirror_ds;</div><div class='add'>+			if (IS_ERR_OR_NULL(mirror_ds))</div><div class='add'>+				continue;</div><div class='add'>+			ds = mirror-&gt;dss[dss_id].mirror_ds-&gt;ds;</div><div class='add'>+			if (!ds)</div><div class='add'>+				continue;</div><div class='add'>+			ds_clp = ds-&gt;ds_clp;</div><div class='add'>+			if (!ds_clp)</div><div class='add'>+				continue;</div><div class='add'>+			clnt = ds_clp-&gt;cl_rpcclient;</div><div class='add'>+			if (!clnt)</div><div class='add'>+				continue;</div><div class='add'>+			if (!rpc_cancel_tasks(clnt, -EAGAIN,</div><div class='add'>+					      ff_layout_match_io, lseg))</div><div class='add'>+				continue;</div><div class='add'>+			rpc_clnt_disconnect(clnt);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static struct pnfs_ds_commit_info *</div><div class='ctx'> ff_layout_get_ds_info(struct inode *inode)</div><div class='ctx'> {</div><div class='hunk'>@@ -1972,8 +2457,10 @@ ff_layout_setup_ds_info(struct pnfs_ds_commit_info *fl_cinfo,</div><div class='ctx'> 	struct nfs4_ff_layout_segment *flseg = FF_LAYOUT_LSEG(lseg);</div><div class='ctx'> 	struct inode *inode = lseg-&gt;pls_layout-&gt;plh_inode;</div><div class='ctx'> 	struct pnfs_commit_array *array, *new;</div><div class='add'>+	u32 size = flseg-&gt;mirror_array_cnt * flseg-&gt;mirror_array[0]-&gt;dss_count;</div><div class='ctx'> </div><div class='del'>-	new = pnfs_alloc_commit_array(flseg-&gt;mirror_array_cnt, GFP_NOIO);</div><div class='add'>+	new = pnfs_alloc_commit_array(size,</div><div class='add'>+				      nfs_io_gfp_mask());</div><div class='ctx'> 	if (new) {</div><div class='ctx'> 		spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 		array = pnfs_add_commit_array(fl_cinfo, new, lseg);</div><div class='hunk'>@@ -2015,12 +2502,6 @@ static int ff_layout_encode_ioerr(struct xdr_stream *xdr,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='del'>-encode_opaque_fixed(struct xdr_stream *xdr, const void *buf, size_t len)</div><div class='del'>-{</div><div class='del'>-	WARN_ON_ONCE(xdr_stream_encode_opaque_fixed(xdr, buf, len) &lt; 0);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void</div><div class='ctx'> ff_layout_encode_ff_iostat_head(struct xdr_stream *xdr,</div><div class='ctx'> 			    const nfs4_stateid *stateid,</div><div class='ctx'> 			    const struct nfs42_layoutstat_devinfo *devinfo)</div><div class='hunk'>@@ -2152,10 +2633,10 @@ ff_layout_prepare_layoutreturn(struct nfs4_layoutreturn_args *args)</div><div class='ctx'> 	struct nfs4_flexfile_layoutreturn_args *ff_args;</div><div class='ctx'> 	struct nfs4_flexfile_layout *ff_layout = FF_LAYOUT_FROM_HDR(args-&gt;layout);</div><div class='ctx'> </div><div class='del'>-	ff_args = kmalloc(sizeof(*ff_args), GFP_KERNEL);</div><div class='add'>+	ff_args = kmalloc(sizeof(*ff_args), nfs_io_gfp_mask());</div><div class='ctx'> 	if (!ff_args)</div><div class='ctx'> 		goto out_nomem;</div><div class='del'>-	ff_args-&gt;pages[0] = alloc_page(GFP_KERNEL);</div><div class='add'>+	ff_args-&gt;pages[0] = alloc_page(nfs_io_gfp_mask());</div><div class='ctx'> 	if (!ff_args-&gt;pages[0])</div><div class='ctx'> 		goto out_nomem_free;</div><div class='ctx'> </div><div class='hunk'>@@ -2165,8 +2646,9 @@ ff_layout_prepare_layoutreturn(struct nfs4_layoutreturn_args *args)</div><div class='ctx'> 			FF_LAYOUTRETURN_MAXERR);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;args-&gt;inode-&gt;i_lock);</div><div class='del'>-	ff_args-&gt;num_dev = ff_layout_mirror_prepare_stats(&amp;ff_layout-&gt;generic_hdr,</div><div class='del'>-			&amp;ff_args-&gt;devinfo[0], ARRAY_SIZE(ff_args-&gt;devinfo));</div><div class='add'>+	ff_args-&gt;num_dev = ff_layout_mirror_prepare_stats(</div><div class='add'>+		&amp;ff_layout-&gt;generic_hdr, &amp;ff_args-&gt;devinfo[0],</div><div class='add'>+		ARRAY_SIZE(ff_args-&gt;devinfo), NFS4_FF_OP_LAYOUTRETURN);</div><div class='ctx'> 	spin_unlock(&amp;args-&gt;inode-&gt;i_lock);</div><div class='ctx'> </div><div class='ctx'> 	args-&gt;ld_private-&gt;ops = &amp;layoutreturn_ops;</div><div class='hunk'>@@ -2192,8 +2674,8 @@ ff_layout_send_layouterror(struct pnfs_layout_segment *lseg)</div><div class='ctx'> 	if (list_empty(&amp;head))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	errors = kmalloc_array(NFS42_LAYOUTERROR_MAX,</div><div class='del'>-			sizeof(*errors), GFP_NOFS);</div><div class='add'>+	errors = kmalloc_array(NFS42_LAYOUTERROR_MAX, sizeof(*errors),</div><div class='add'>+			       nfs_io_gfp_mask());</div><div class='ctx'> 	if (errors != NULL) {</div><div class='ctx'> 		const struct nfs4_ff_layout_ds_err *pos;</div><div class='ctx'> 		size_t n = 0;</div><div class='hunk'>@@ -2341,11 +2823,11 @@ ff_layout_encode_io_latency(struct xdr_stream *xdr,</div><div class='ctx'> static void</div><div class='ctx'> ff_layout_encode_ff_layoutupdate(struct xdr_stream *xdr,</div><div class='ctx'> 			      const struct nfs42_layoutstat_devinfo *devinfo,</div><div class='del'>-			      struct nfs4_ff_layout_mirror *mirror)</div><div class='add'>+			      struct nfs4_ff_layout_ds_stripe *dss_info)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_pnfs_ds_addr *da;</div><div class='del'>-	struct nfs4_pnfs_ds *ds = mirror-&gt;mirror_ds-&gt;ds;</div><div class='del'>-	struct nfs_fh *fh = &amp;mirror-&gt;fh_versions[0];</div><div class='add'>+	struct nfs4_pnfs_ds *ds = dss_info-&gt;mirror_ds-&gt;ds;</div><div class='add'>+	struct nfs_fh *fh = &amp;dss_info-&gt;fh_versions[0];</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> </div><div class='ctx'> 	da = list_first_entry(&amp;ds-&gt;ds_addrs, struct nfs4_pnfs_ds_addr, da_node);</div><div class='hunk'>@@ -2357,13 +2839,17 @@ ff_layout_encode_ff_layoutupdate(struct xdr_stream *xdr,</div><div class='ctx'> 	p = xdr_reserve_space(xdr, 4 + fh-&gt;size);</div><div class='ctx'> 	xdr_encode_opaque(p, fh-&gt;data, fh-&gt;size);</div><div class='ctx'> 	/* ff_io_latency4 read */</div><div class='del'>-	spin_lock(&amp;mirror-&gt;lock);</div><div class='del'>-	ff_layout_encode_io_latency(xdr, &amp;mirror-&gt;read_stat.io_stat);</div><div class='add'>+	spin_lock(&amp;dss_info-&gt;mirror-&gt;lock);</div><div class='add'>+	ff_layout_encode_io_latency(xdr,</div><div class='add'>+				    &amp;dss_info-&gt;read_stat.io_stat);</div><div class='ctx'> 	/* ff_io_latency4 write */</div><div class='del'>-	ff_layout_encode_io_latency(xdr, &amp;mirror-&gt;write_stat.io_stat);</div><div class='del'>-	spin_unlock(&amp;mirror-&gt;lock);</div><div class='add'>+	ff_layout_encode_io_latency(xdr,</div><div class='add'>+				    &amp;dss_info-&gt;write_stat.io_stat);</div><div class='add'>+	spin_unlock(&amp;dss_info-&gt;mirror-&gt;lock);</div><div class='ctx'> 	/* nfstime4 */</div><div class='del'>-	ff_layout_encode_nfstime(xdr, ktime_sub(ktime_get(), mirror-&gt;start_time));</div><div class='add'>+	ff_layout_encode_nfstime(xdr,</div><div class='add'>+				 ktime_sub(ktime_get(),</div><div class='add'>+					   dss_info-&gt;start_time));</div><div class='ctx'> 	/* bool */</div><div class='ctx'> 	p = xdr_reserve_space(xdr, 4);</div><div class='ctx'> 	*p = cpu_to_be32(false);</div><div class='hunk'>@@ -2387,7 +2873,8 @@ ff_layout_encode_layoutstats(struct xdr_stream *xdr, const void *args,</div><div class='ctx'> static void</div><div class='ctx'> ff_layout_free_layoutstats(struct nfs4_xdr_opaque_data *opaque)</div><div class='ctx'> {</div><div class='del'>-	struct nfs4_ff_layout_mirror *mirror = opaque-&gt;data;</div><div class='add'>+	struct nfs4_ff_layout_ds_stripe *dss_info = opaque-&gt;data;</div><div class='add'>+	struct nfs4_ff_layout_mirror *mirror = dss_info-&gt;mirror;</div><div class='ctx'> </div><div class='ctx'> 	ff_layout_put_mirror(mirror);</div><div class='ctx'> }</div><div class='hunk'>@@ -2400,58 +2887,76 @@ static const struct nfs4_xdr_opaque_ops layoutstat_ops = {</div><div class='ctx'> static int</div><div class='ctx'> ff_layout_mirror_prepare_stats(struct pnfs_layout_hdr *lo,</div><div class='ctx'> 			       struct nfs42_layoutstat_devinfo *devinfo,</div><div class='del'>-			       int dev_limit)</div><div class='add'>+			       int dev_limit, enum nfs4_ff_op_type type)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_flexfile_layout *ff_layout = FF_LAYOUT_FROM_HDR(lo);</div><div class='ctx'> 	struct nfs4_ff_layout_mirror *mirror;</div><div class='add'>+	struct nfs4_ff_layout_ds_stripe *dss_info;</div><div class='ctx'> 	struct nfs4_deviceid_node *dev;</div><div class='del'>-	int i = 0;</div><div class='add'>+	int i = 0, dss_id;</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(mirror, &amp;ff_layout-&gt;mirrors, mirrors) {</div><div class='del'>-		if (i &gt;= dev_limit)</div><div class='del'>-			break;</div><div class='del'>-		if (IS_ERR_OR_NULL(mirror-&gt;mirror_ds))</div><div class='del'>-			continue;</div><div class='del'>-		if (!test_and_clear_bit(NFS4_FF_MIRROR_STAT_AVAIL, &amp;mirror-&gt;flags))</div><div class='del'>-			continue;</div><div class='del'>-		/* mirror refcount put in cleanup_layoutstats */</div><div class='del'>-		if (!refcount_inc_not_zero(&amp;mirror-&gt;ref))</div><div class='del'>-			continue;</div><div class='del'>-		dev = &amp;mirror-&gt;mirror_ds-&gt;id_node; </div><div class='del'>-		memcpy(&amp;devinfo-&gt;dev_id, &amp;dev-&gt;deviceid, NFS4_DEVICEID4_SIZE);</div><div class='del'>-		devinfo-&gt;offset = 0;</div><div class='del'>-		devinfo-&gt;length = NFS4_MAX_UINT64;</div><div class='del'>-		spin_lock(&amp;mirror-&gt;lock);</div><div class='del'>-		devinfo-&gt;read_count = mirror-&gt;read_stat.io_stat.ops_completed;</div><div class='del'>-		devinfo-&gt;read_bytes = mirror-&gt;read_stat.io_stat.bytes_completed;</div><div class='del'>-		devinfo-&gt;write_count = mirror-&gt;write_stat.io_stat.ops_completed;</div><div class='del'>-		devinfo-&gt;write_bytes = mirror-&gt;write_stat.io_stat.bytes_completed;</div><div class='del'>-		spin_unlock(&amp;mirror-&gt;lock);</div><div class='del'>-		devinfo-&gt;layout_type = LAYOUT_FLEX_FILES;</div><div class='del'>-		devinfo-&gt;ld_private.ops = &amp;layoutstat_ops;</div><div class='del'>-		devinfo-&gt;ld_private.data = mirror;</div><div class='del'>-</div><div class='del'>-		devinfo++;</div><div class='del'>-		i++;</div><div class='add'>+		for (dss_id = 0; dss_id &lt; mirror-&gt;dss_count; ++dss_id) {</div><div class='add'>+			dss_info = &amp;mirror-&gt;dss[dss_id];</div><div class='add'>+			if (i &gt;= dev_limit)</div><div class='add'>+				break;</div><div class='add'>+			if (IS_ERR_OR_NULL(dss_info-&gt;mirror_ds))</div><div class='add'>+				continue;</div><div class='add'>+			if (!test_and_clear_bit(NFS4_FF_MIRROR_STAT_AVAIL,</div><div class='add'>+						&amp;mirror-&gt;flags) &amp;&amp;</div><div class='add'>+			    type != NFS4_FF_OP_LAYOUTRETURN)</div><div class='add'>+				continue;</div><div class='add'>+			/* mirror refcount put in cleanup_layoutstats */</div><div class='add'>+			if (!refcount_inc_not_zero(&amp;mirror-&gt;ref))</div><div class='add'>+				continue;</div><div class='add'>+			dev = &amp;dss_info-&gt;mirror_ds-&gt;id_node;</div><div class='add'>+			memcpy(&amp;devinfo-&gt;dev_id,</div><div class='add'>+			       &amp;dev-&gt;deviceid,</div><div class='add'>+			       NFS4_DEVICEID4_SIZE);</div><div class='add'>+			devinfo-&gt;offset = 0;</div><div class='add'>+			devinfo-&gt;length = NFS4_MAX_UINT64;</div><div class='add'>+			spin_lock(&amp;mirror-&gt;lock);</div><div class='add'>+			devinfo-&gt;read_count =</div><div class='add'>+			    dss_info-&gt;read_stat.io_stat.ops_completed;</div><div class='add'>+			devinfo-&gt;read_bytes =</div><div class='add'>+			    dss_info-&gt;read_stat.io_stat.bytes_completed;</div><div class='add'>+			devinfo-&gt;write_count =</div><div class='add'>+			    dss_info-&gt;write_stat.io_stat.ops_completed;</div><div class='add'>+			devinfo-&gt;write_bytes =</div><div class='add'>+			    dss_info-&gt;write_stat.io_stat.bytes_completed;</div><div class='add'>+			spin_unlock(&amp;mirror-&gt;lock);</div><div class='add'>+			devinfo-&gt;layout_type = LAYOUT_FLEX_FILES;</div><div class='add'>+			devinfo-&gt;ld_private.ops = &amp;layoutstat_ops;</div><div class='add'>+			devinfo-&gt;ld_private.data = &amp;mirror-&gt;dss[dss_id];</div><div class='add'>+</div><div class='add'>+			devinfo++;</div><div class='add'>+			i++;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> 	return i;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int</div><div class='del'>-ff_layout_prepare_layoutstats(struct nfs42_layoutstat_args *args)</div><div class='add'>+static int ff_layout_prepare_layoutstats(struct nfs42_layoutstat_args *args)</div><div class='ctx'> {</div><div class='add'>+	struct pnfs_layout_hdr *lo;</div><div class='ctx'> 	struct nfs4_flexfile_layout *ff_layout;</div><div class='ctx'> 	const int dev_count = PNFS_LAYOUTSTATS_MAXDEV;</div><div class='ctx'> </div><div class='ctx'> 	/* For now, send at most PNFS_LAYOUTSTATS_MAXDEV statistics */</div><div class='del'>-	args-&gt;devinfo = kmalloc_array(dev_count, sizeof(*args-&gt;devinfo), GFP_NOIO);</div><div class='add'>+	args-&gt;devinfo = kmalloc_array(dev_count, sizeof(*args-&gt;devinfo),</div><div class='add'>+				      nfs_io_gfp_mask());</div><div class='ctx'> 	if (!args-&gt;devinfo)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;args-&gt;inode-&gt;i_lock);</div><div class='del'>-	ff_layout = FF_LAYOUT_FROM_HDR(NFS_I(args-&gt;inode)-&gt;layout);</div><div class='del'>-	args-&gt;num_dev = ff_layout_mirror_prepare_stats(&amp;ff_layout-&gt;generic_hdr,</div><div class='del'>-			&amp;args-&gt;devinfo[0], dev_count);</div><div class='add'>+	lo = NFS_I(args-&gt;inode)-&gt;layout;</div><div class='add'>+	if (lo &amp;&amp; pnfs_layout_is_valid(lo)) {</div><div class='add'>+		ff_layout = FF_LAYOUT_FROM_HDR(lo);</div><div class='add'>+		args-&gt;num_dev = ff_layout_mirror_prepare_stats(</div><div class='add'>+			&amp;ff_layout-&gt;generic_hdr, &amp;args-&gt;devinfo[0], dev_count,</div><div class='add'>+			NFS4_FF_OP_LAYOUTSTATS);</div><div class='add'>+	} else</div><div class='add'>+		args-&gt;num_dev = 0;</div><div class='ctx'> 	spin_unlock(&amp;args-&gt;inode-&gt;i_lock);</div><div class='ctx'> 	if (!args-&gt;num_dev) {</div><div class='ctx'> 		kfree(args-&gt;devinfo);</div><div class='hunk'>@@ -2467,7 +2972,7 @@ ff_layout_set_layoutdriver(struct nfs_server *server,</div><div class='ctx'> 		const struct nfs_fh *dummy)</div><div class='ctx'> {</div><div class='ctx'> #if IS_ENABLED(CONFIG_NFS_V4_2)</div><div class='del'>-	server-&gt;caps |= NFS_CAP_LAYOUTSTATS;</div><div class='add'>+	server-&gt;caps |= NFS_CAP_LAYOUTSTATS | NFS_CAP_REBOOT_LAYOUTRETURN;</div><div class='ctx'> #endif</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -2504,6 +3009,7 @@ static struct pnfs_layoutdriver_type flexfilelayout_type = {</div><div class='ctx'> 	.prepare_layoutreturn   = ff_layout_prepare_layoutreturn,</div><div class='ctx'> 	.sync			= pnfs_nfs_generic_sync,</div><div class='ctx'> 	.prepare_layoutstats	= ff_layout_prepare_layoutstats,</div><div class='add'>+	.cancel_io		= ff_layout_cancel_io,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static int __init nfs4flexfilelayout_init(void)</div><div class='head'>diff --git a/fs/nfs/flexfilelayout/flexfilelayout.h b/fs/nfs/flexfilelayout/flexfilelayout.h<br/>index 354a031c69b1..17a008c8e97c 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/flexfilelayout/flexfilelayout.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/flexfilelayout/flexfilelayout.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/flexfilelayout/flexfilelayout.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/flexfilelayout/flexfilelayout.h</a></div><div class='hunk'>@@ -21,6 +21,8 @@</div><div class='ctx'>  * due to network error etc. */</div><div class='ctx'> #define NFS4_FLEXFILE_LAYOUT_MAX_MIRROR_CNT 4096</div><div class='ctx'> </div><div class='add'>+#define NFS4_FLEXFILE_LAYOUT_MAX_STRIPE_CNT 4096</div><div class='add'>+</div><div class='ctx'> /* LAYOUTSTATS report interval in ms */</div><div class='ctx'> #define FF_LAYOUTSTATS_REPORT_INTERVAL (60000L)</div><div class='ctx'> #define FF_LAYOUTSTATS_MAXDEV 4</div><div class='hunk'>@@ -71,24 +73,32 @@ struct nfs4_ff_layoutstat {</div><div class='ctx'> 	struct nfs4_ff_busy_timer busy_timer;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-struct nfs4_ff_layout_mirror {</div><div class='del'>-	struct pnfs_layout_hdr		*layout;</div><div class='del'>-	struct list_head		mirrors;</div><div class='del'>-	u32				ds_count;</div><div class='del'>-	u32				efficiency;</div><div class='add'>+struct nfs4_ff_layout_mirror;</div><div class='add'>+</div><div class='add'>+struct nfs4_ff_layout_ds_stripe {</div><div class='add'>+	struct nfs4_ff_layout_mirror   *mirror;</div><div class='ctx'> 	struct nfs4_deviceid		devid;</div><div class='add'>+	u32				efficiency;</div><div class='ctx'> 	struct nfs4_ff_layout_ds	*mirror_ds;</div><div class='ctx'> 	u32				fh_versions_cnt;</div><div class='ctx'> 	struct nfs_fh			*fh_versions;</div><div class='ctx'> 	nfs4_stateid			stateid;</div><div class='ctx'> 	const struct cred __rcu		*ro_cred;</div><div class='ctx'> 	const struct cred __rcu		*rw_cred;</div><div class='del'>-	refcount_t			ref;</div><div class='del'>-	spinlock_t			lock;</div><div class='del'>-	unsigned long			flags;</div><div class='add'>+	struct nfs_file_localio		nfl;</div><div class='ctx'> 	struct nfs4_ff_layoutstat	read_stat;</div><div class='ctx'> 	struct nfs4_ff_layoutstat	write_stat;</div><div class='ctx'> 	ktime_t				start_time;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct nfs4_ff_layout_mirror {</div><div class='add'>+	struct pnfs_layout_hdr		*layout;</div><div class='add'>+	struct list_head		mirrors;</div><div class='add'>+	u32				dss_count;</div><div class='add'>+	struct nfs4_ff_layout_ds_stripe *dss;</div><div class='add'>+	refcount_t			ref;</div><div class='add'>+	spinlock_t			lock;</div><div class='add'>+	unsigned long			flags;</div><div class='ctx'> 	u32				report_interval;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -99,7 +109,7 @@ struct nfs4_ff_layout_segment {</div><div class='ctx'> 	u64				stripe_unit;</div><div class='ctx'> 	u32				flags;</div><div class='ctx'> 	u32				mirror_array_cnt;</div><div class='del'>-	struct nfs4_ff_layout_mirror	*mirror_array[];</div><div class='add'>+	struct nfs4_ff_layout_mirror	*mirror_array[] __counted_by(mirror_array_cnt);</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct nfs4_flexfile_layout {</div><div class='hunk'>@@ -149,12 +159,12 @@ FF_LAYOUT_COMP(struct pnfs_layout_segment *lseg, u32 idx)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline struct nfs4_deviceid_node *</div><div class='del'>-FF_LAYOUT_DEVID_NODE(struct pnfs_layout_segment *lseg, u32 idx)</div><div class='add'>+FF_LAYOUT_DEVID_NODE(struct pnfs_layout_segment *lseg, u32 idx, u32 dss_id)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_ff_layout_mirror *mirror = FF_LAYOUT_COMP(lseg, idx);</div><div class='ctx'> </div><div class='ctx'> 	if (mirror != NULL) {</div><div class='del'>-		struct nfs4_ff_layout_ds *mirror_ds = mirror-&gt;mirror_ds;</div><div class='add'>+		struct nfs4_ff_layout_ds *mirror_ds = mirror-&gt;dss[dss_id].mirror_ds;</div><div class='ctx'> </div><div class='ctx'> 		if (!IS_ERR_OR_NULL(mirror_ds))</div><div class='ctx'> 			return &amp;mirror_ds-&gt;id_node;</div><div class='hunk'>@@ -181,9 +191,22 @@ ff_layout_no_read_on_rw(struct pnfs_layout_segment *lseg)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline int</div><div class='del'>-nfs4_ff_layout_ds_version(const struct nfs4_ff_layout_mirror *mirror)</div><div class='add'>+nfs4_ff_layout_ds_version(const struct nfs4_ff_layout_mirror *mirror, u32 dss_id)</div><div class='add'>+{</div><div class='add'>+	return mirror-&gt;dss[dss_id].mirror_ds-&gt;ds_versions[0].version;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline u32</div><div class='add'>+nfs4_ff_layout_calc_dss_id(const u64 stripe_unit, const u32 dss_count, const loff_t offset)</div><div class='ctx'> {</div><div class='del'>-	return mirror-&gt;mirror_ds-&gt;ds_versions[0].version;</div><div class='add'>+	u64 tmp = offset;</div><div class='add'>+</div><div class='add'>+	if (dss_count == 1 || stripe_unit == 0)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	do_div(tmp, stripe_unit);</div><div class='add'>+</div><div class='add'>+	return do_div(tmp, dss_count);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct nfs4_ff_layout_ds *</div><div class='hunk'>@@ -192,9 +215,9 @@ nfs4_ff_alloc_deviceid_node(struct nfs_server *server, struct pnfs_device *pdev,</div><div class='ctx'> void nfs4_ff_layout_put_deviceid(struct nfs4_ff_layout_ds *mirror_ds);</div><div class='ctx'> void nfs4_ff_layout_free_deviceid(struct nfs4_ff_layout_ds *mirror_ds);</div><div class='ctx'> int ff_layout_track_ds_error(struct nfs4_flexfile_layout *flo,</div><div class='del'>-			     struct nfs4_ff_layout_mirror *mirror, u64 offset,</div><div class='del'>-			     u64 length, int status, enum nfs_opnum4 opnum,</div><div class='del'>-			     gfp_t gfp_flags);</div><div class='add'>+			     struct nfs4_ff_layout_mirror *mirror,</div><div class='add'>+			     u32 dss_id, u64 offset, u64 length, int status,</div><div class='add'>+			     enum nfs_opnum4 opnum, gfp_t gfp_flags);</div><div class='ctx'> void ff_layout_send_layouterror(struct pnfs_layout_segment *lseg);</div><div class='ctx'> int ff_layout_encode_ds_ioerr(struct xdr_stream *xdr, const struct list_head *head);</div><div class='ctx'> void ff_layout_free_ds_ioerr(struct list_head *head);</div><div class='hunk'>@@ -203,23 +226,27 @@ unsigned int ff_layout_fetch_ds_ioerr(struct pnfs_layout_hdr *lo,</div><div class='ctx'> 		struct list_head *head,</div><div class='ctx'> 		unsigned int maxnum);</div><div class='ctx'> struct nfs_fh *</div><div class='del'>-nfs4_ff_layout_select_ds_fh(struct nfs4_ff_layout_mirror *mirror);</div><div class='add'>+nfs4_ff_layout_select_ds_fh(struct nfs4_ff_layout_mirror *mirror, u32 dss_id);</div><div class='ctx'> void</div><div class='ctx'> nfs4_ff_layout_select_ds_stateid(const struct nfs4_ff_layout_mirror *mirror,</div><div class='del'>-		nfs4_stateid *stateid);</div><div class='add'>+				 u32 dss_id,</div><div class='add'>+				 nfs4_stateid *stateid);</div><div class='ctx'> </div><div class='ctx'> struct nfs4_pnfs_ds *</div><div class='ctx'> nfs4_ff_layout_prepare_ds(struct pnfs_layout_segment *lseg,</div><div class='ctx'> 			  struct nfs4_ff_layout_mirror *mirror,</div><div class='add'>+			  u32 dss_id,</div><div class='ctx'> 			  bool fail_return);</div><div class='ctx'> </div><div class='ctx'> struct rpc_clnt *</div><div class='ctx'> nfs4_ff_find_or_create_ds_client(struct nfs4_ff_layout_mirror *mirror,</div><div class='ctx'> 				 struct nfs_client *ds_clp,</div><div class='del'>-				 struct inode *inode);</div><div class='add'>+				 struct inode *inode,</div><div class='add'>+				 u32 dss_id);</div><div class='ctx'> const struct cred *ff_layout_get_ds_cred(struct nfs4_ff_layout_mirror *mirror,</div><div class='ctx'> 					 const struct pnfs_layout_range *range,</div><div class='del'>-					 const struct cred *mdscred);</div><div class='add'>+					 const struct cred *mdscred,</div><div class='add'>+					 u32 dss_id);</div><div class='ctx'> bool ff_layout_avoid_mds_available_ds(struct pnfs_layout_segment *lseg);</div><div class='ctx'> bool ff_layout_avoid_read_on_rw(struct pnfs_layout_segment *lseg);</div><div class='ctx'> </div><div class='head'>diff --git a/fs/nfs/flexfilelayout/flexfilelayoutdev.c b/fs/nfs/flexfilelayout/flexfilelayoutdev.c<br/>index bfa7202ca7be..c55ea8fa3bfa 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/flexfilelayout/flexfilelayoutdev.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/flexfilelayout/flexfilelayoutdev.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/flexfilelayout/flexfilelayoutdev.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/flexfilelayout/flexfilelayoutdev.c</a></div><div class='hunk'>@@ -44,18 +44,19 @@ nfs4_ff_alloc_deviceid_node(struct nfs_server *server, struct pnfs_device *pdev,</div><div class='ctx'> {</div><div class='ctx'> 	struct xdr_stream stream;</div><div class='ctx'> 	struct xdr_buf buf;</div><div class='del'>-	struct page *scratch;</div><div class='add'>+	struct folio *scratch;</div><div class='ctx'> 	struct list_head dsaddrs;</div><div class='ctx'> 	struct nfs4_pnfs_ds_addr *da;</div><div class='ctx'> 	struct nfs4_ff_layout_ds *new_ds = NULL;</div><div class='ctx'> 	struct nfs4_ff_ds_version *ds_versions = NULL;</div><div class='add'>+	struct net *net = server-&gt;nfs_client-&gt;cl_net;</div><div class='ctx'> 	u32 mp_count;</div><div class='ctx'> 	u32 version_count;</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> 	int i, ret = -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	/* set up xdr stream */</div><div class='del'>-	scratch = alloc_page(gfp_flags);</div><div class='add'>+	scratch = folio_alloc(gfp_flags, 0);</div><div class='ctx'> 	if (!scratch)</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> </div><div class='hunk'>@@ -69,7 +70,7 @@ nfs4_ff_alloc_deviceid_node(struct nfs_server *server, struct pnfs_device *pdev,</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;dsaddrs);</div><div class='ctx'> </div><div class='ctx'> 	xdr_init_decode_pages(&amp;stream, &amp;buf, pdev-&gt;pages, pdev-&gt;pglen);</div><div class='del'>-	xdr_set_scratch_page(&amp;stream, scratch);</div><div class='add'>+	xdr_set_scratch_folio(&amp;stream, scratch);</div><div class='ctx'> </div><div class='ctx'> 	/* multipath count */</div><div class='ctx'> 	p = xdr_inline_decode(&amp;stream, 4);</div><div class='hunk'>@@ -80,8 +81,7 @@ nfs4_ff_alloc_deviceid_node(struct nfs_server *server, struct pnfs_device *pdev,</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; mp_count; i++) {</div><div class='ctx'> 		/* multipath ds */</div><div class='del'>-		da = nfs4_decode_mp_ds_addr(server-&gt;nfs_client-&gt;cl_net,</div><div class='del'>-					    &amp;stream, gfp_flags);</div><div class='add'>+		da = nfs4_decode_mp_ds_addr(net, &amp;stream, gfp_flags);</div><div class='ctx'> 		if (da)</div><div class='ctx'> 			list_add_tail(&amp;da-&gt;da_node, &amp;dsaddrs);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -113,8 +113,10 @@ nfs4_ff_alloc_deviceid_node(struct nfs_server *server, struct pnfs_device *pdev,</div><div class='ctx'> 			goto out_err_drain_dsaddrs;</div><div class='ctx'> 		ds_versions[i].version = be32_to_cpup(p++);</div><div class='ctx'> 		ds_versions[i].minor_version = be32_to_cpup(p++);</div><div class='del'>-		ds_versions[i].rsize = nfs_block_size(be32_to_cpup(p++), NULL);</div><div class='del'>-		ds_versions[i].wsize = nfs_block_size(be32_to_cpup(p++), NULL);</div><div class='add'>+		ds_versions[i].rsize = nfs_io_size(be32_to_cpup(p++),</div><div class='add'>+						   server-&gt;nfs_client-&gt;cl_proto);</div><div class='add'>+		ds_versions[i].wsize = nfs_io_size(be32_to_cpup(p++),</div><div class='add'>+						   server-&gt;nfs_client-&gt;cl_proto);</div><div class='ctx'> 		ds_versions[i].tightly_coupled = be32_to_cpup(p);</div><div class='ctx'> </div><div class='ctx'> 		if (ds_versions[i].rsize &gt; NFS_MAX_FILE_IO_SIZE)</div><div class='hunk'>@@ -147,7 +149,7 @@ nfs4_ff_alloc_deviceid_node(struct nfs_server *server, struct pnfs_device *pdev,</div><div class='ctx'> 	new_ds-&gt;ds_versions = ds_versions;</div><div class='ctx'> 	new_ds-&gt;ds_versions_cnt = version_count;</div><div class='ctx'> </div><div class='del'>-	new_ds-&gt;ds = nfs4_pnfs_ds_add(&amp;dsaddrs, gfp_flags);</div><div class='add'>+	new_ds-&gt;ds = nfs4_pnfs_ds_add(net, &amp;dsaddrs, gfp_flags);</div><div class='ctx'> 	if (!new_ds-&gt;ds)</div><div class='ctx'> 		goto out_err_drain_dsaddrs;</div><div class='ctx'> </div><div class='hunk'>@@ -161,7 +163,7 @@ nfs4_ff_alloc_deviceid_node(struct nfs_server *server, struct pnfs_device *pdev,</div><div class='ctx'> 		kfree(da);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	__free_page(scratch);</div><div class='add'>+	folio_put(scratch);</div><div class='ctx'> 	return new_ds;</div><div class='ctx'> </div><div class='ctx'> out_err_drain_dsaddrs:</div><div class='hunk'>@@ -175,7 +177,7 @@ out_err_drain_dsaddrs:</div><div class='ctx'> </div><div class='ctx'> 	kfree(ds_versions);</div><div class='ctx'> out_scratch:</div><div class='del'>-	__free_page(scratch);</div><div class='add'>+	folio_put(scratch);</div><div class='ctx'> out_err:</div><div class='ctx'> 	kfree(new_ds);</div><div class='ctx'> </div><div class='hunk'>@@ -248,16 +250,16 @@ ff_layout_add_ds_error_locked(struct nfs4_flexfile_layout *flo,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int ff_layout_track_ds_error(struct nfs4_flexfile_layout *flo,</div><div class='del'>-			     struct nfs4_ff_layout_mirror *mirror, u64 offset,</div><div class='del'>-			     u64 length, int status, enum nfs_opnum4 opnum,</div><div class='del'>-			     gfp_t gfp_flags)</div><div class='add'>+			     struct nfs4_ff_layout_mirror *mirror,</div><div class='add'>+			     u32 dss_id, u64 offset, u64 length, int status,</div><div class='add'>+			     enum nfs_opnum4 opnum, gfp_t gfp_flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_ff_layout_ds_err *dserr;</div><div class='ctx'> </div><div class='ctx'> 	if (status == 0)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	if (IS_ERR_OR_NULL(mirror-&gt;mirror_ds))</div><div class='add'>+	if (IS_ERR_OR_NULL(mirror-&gt;dss[dss_id].mirror_ds))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	dserr = kmalloc(sizeof(*dserr), gfp_flags);</div><div class='hunk'>@@ -269,8 +271,8 @@ int ff_layout_track_ds_error(struct nfs4_flexfile_layout *flo,</div><div class='ctx'> 	dserr-&gt;length = length;</div><div class='ctx'> 	dserr-&gt;status = status;</div><div class='ctx'> 	dserr-&gt;opnum = opnum;</div><div class='del'>-	nfs4_stateid_copy(&amp;dserr-&gt;stateid, &amp;mirror-&gt;stateid);</div><div class='del'>-	memcpy(&amp;dserr-&gt;deviceid, &amp;mirror-&gt;mirror_ds-&gt;id_node.deviceid,</div><div class='add'>+	nfs4_stateid_copy(&amp;dserr-&gt;stateid, &amp;mirror-&gt;dss[dss_id].stateid);</div><div class='add'>+	memcpy(&amp;dserr-&gt;deviceid, &amp;mirror-&gt;dss[dss_id].mirror_ds-&gt;id_node.deviceid,</div><div class='ctx'> 	       NFS4_DEVICEID4_SIZE);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;flo-&gt;generic_hdr.plh_inode-&gt;i_lock);</div><div class='hunk'>@@ -280,14 +282,14 @@ int ff_layout_track_ds_error(struct nfs4_flexfile_layout *flo,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct cred *</div><div class='del'>-ff_layout_get_mirror_cred(struct nfs4_ff_layout_mirror *mirror, u32 iomode)</div><div class='add'>+ff_layout_get_mirror_cred(struct nfs4_ff_layout_mirror *mirror, u32 iomode, u32 dss_id)</div><div class='ctx'> {</div><div class='ctx'> 	const struct cred *cred, __rcu **pcred;</div><div class='ctx'> </div><div class='ctx'> 	if (iomode == IOMODE_READ)</div><div class='del'>-		pcred = &amp;mirror-&gt;ro_cred;</div><div class='add'>+		pcred = &amp;mirror-&gt;dss[dss_id].ro_cred;</div><div class='ctx'> 	else</div><div class='del'>-		pcred = &amp;mirror-&gt;rw_cred;</div><div class='add'>+		pcred = &amp;mirror-&gt;dss[dss_id].rw_cred;</div><div class='ctx'> </div><div class='ctx'> 	rcu_read_lock();</div><div class='ctx'> 	do {</div><div class='hunk'>@@ -302,43 +304,45 @@ ff_layout_get_mirror_cred(struct nfs4_ff_layout_mirror *mirror, u32 iomode)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct nfs_fh *</div><div class='del'>-nfs4_ff_layout_select_ds_fh(struct nfs4_ff_layout_mirror *mirror)</div><div class='add'>+nfs4_ff_layout_select_ds_fh(struct nfs4_ff_layout_mirror *mirror, u32 dss_id)</div><div class='ctx'> {</div><div class='ctx'> 	/* FIXME: For now assume there is only 1 version available for the DS */</div><div class='del'>-	return &amp;mirror-&gt;fh_versions[0];</div><div class='add'>+	return &amp;mirror-&gt;dss[dss_id].fh_versions[0];</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void</div><div class='ctx'> nfs4_ff_layout_select_ds_stateid(const struct nfs4_ff_layout_mirror *mirror,</div><div class='del'>-		nfs4_stateid *stateid)</div><div class='add'>+				 u32 dss_id,</div><div class='add'>+				 nfs4_stateid *stateid)</div><div class='ctx'> {</div><div class='del'>-	if (nfs4_ff_layout_ds_version(mirror) == 4)</div><div class='del'>-		nfs4_stateid_copy(stateid, &amp;mirror-&gt;stateid);</div><div class='add'>+	if (nfs4_ff_layout_ds_version(mirror, dss_id) == 4)</div><div class='add'>+		nfs4_stateid_copy(stateid, &amp;mirror-&gt;dss[dss_id].stateid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool</div><div class='ctx'> ff_layout_init_mirror_ds(struct pnfs_layout_hdr *lo,</div><div class='del'>-			 struct nfs4_ff_layout_mirror *mirror)</div><div class='add'>+			 struct nfs4_ff_layout_mirror *mirror,</div><div class='add'>+			 u32 dss_id)</div><div class='ctx'> {</div><div class='ctx'> 	if (mirror == NULL)</div><div class='ctx'> 		goto outerr;</div><div class='del'>-	if (mirror-&gt;mirror_ds == NULL) {</div><div class='add'>+	if (mirror-&gt;dss[dss_id].mirror_ds == NULL) {</div><div class='ctx'> 		struct nfs4_deviceid_node *node;</div><div class='ctx'> 		struct nfs4_ff_layout_ds *mirror_ds = ERR_PTR(-ENODEV);</div><div class='ctx'> </div><div class='ctx'> 		node = nfs4_find_get_deviceid(NFS_SERVER(lo-&gt;plh_inode),</div><div class='del'>-				&amp;mirror-&gt;devid, lo-&gt;plh_lc_cred,</div><div class='add'>+				&amp;mirror-&gt;dss[dss_id].devid, lo-&gt;plh_lc_cred,</div><div class='ctx'> 				GFP_KERNEL);</div><div class='ctx'> 		if (node)</div><div class='ctx'> 			mirror_ds = FF_LAYOUT_MIRROR_DS(node);</div><div class='ctx'> </div><div class='ctx'> 		/* check for race with another call to this function */</div><div class='del'>-		if (cmpxchg(&amp;mirror-&gt;mirror_ds, NULL, mirror_ds) &amp;&amp;</div><div class='add'>+		if (cmpxchg(&amp;mirror-&gt;dss[dss_id].mirror_ds, NULL, mirror_ds) &amp;&amp;</div><div class='ctx'> 		    mirror_ds != ERR_PTR(-ENODEV))</div><div class='ctx'> 			nfs4_put_deviceid_node(node);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (IS_ERR(mirror-&gt;mirror_ds))</div><div class='add'>+	if (IS_ERR(mirror-&gt;dss[dss_id].mirror_ds))</div><div class='ctx'> 		goto outerr;</div><div class='ctx'> </div><div class='ctx'> 	return true;</div><div class='hunk'>@@ -350,6 +354,7 @@ outerr:</div><div class='ctx'>  * nfs4_ff_layout_prepare_ds - prepare a DS connection for an RPC call</div><div class='ctx'>  * @lseg: the layout segment we're operating on</div><div class='ctx'>  * @mirror: layout mirror describing the DS to use</div><div class='add'>+ * @dss_id: DS stripe id to select stripe to use</div><div class='ctx'>  * @fail_return: return layout on connect failure?</div><div class='ctx'>  *</div><div class='ctx'>  * Try to prepare a DS connection to accept an RPC call. This involves</div><div class='hunk'>@@ -366,18 +371,19 @@ outerr:</div><div class='ctx'> struct nfs4_pnfs_ds *</div><div class='ctx'> nfs4_ff_layout_prepare_ds(struct pnfs_layout_segment *lseg,</div><div class='ctx'> 			  struct nfs4_ff_layout_mirror *mirror,</div><div class='add'>+			  u32 dss_id,</div><div class='ctx'> 			  bool fail_return)</div><div class='ctx'> {</div><div class='del'>-	struct nfs4_pnfs_ds *ds = NULL;</div><div class='add'>+	struct nfs4_pnfs_ds *ds;</div><div class='ctx'> 	struct inode *ino = lseg-&gt;pls_layout-&gt;plh_inode;</div><div class='ctx'> 	struct nfs_server *s = NFS_SERVER(ino);</div><div class='ctx'> 	unsigned int max_payload;</div><div class='del'>-	int status;</div><div class='add'>+	int status = -EAGAIN;</div><div class='ctx'> </div><div class='del'>-	if (!ff_layout_init_mirror_ds(lseg-&gt;pls_layout, mirror))</div><div class='add'>+	if (!ff_layout_init_mirror_ds(lseg-&gt;pls_layout, mirror, dss_id))</div><div class='ctx'> 		goto noconnect;</div><div class='ctx'> </div><div class='del'>-	ds = mirror-&gt;mirror_ds-&gt;ds;</div><div class='add'>+	ds = mirror-&gt;dss[dss_id].mirror_ds-&gt;ds;</div><div class='ctx'> 	if (READ_ONCE(ds-&gt;ds_clp))</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	/* matching smp_wmb() in _nfs4_pnfs_v3/4_ds_connect */</div><div class='hunk'>@@ -386,31 +392,37 @@ nfs4_ff_layout_prepare_ds(struct pnfs_layout_segment *lseg,</div><div class='ctx'> 	/* FIXME: For now we assume the server sent only one version of NFS</div><div class='ctx'> 	 * to use for the DS.</div><div class='ctx'> 	 */</div><div class='del'>-	status = nfs4_pnfs_ds_connect(s, ds, &amp;mirror-&gt;mirror_ds-&gt;id_node,</div><div class='add'>+	status = nfs4_pnfs_ds_connect(s, ds, &amp;mirror-&gt;dss[dss_id].mirror_ds-&gt;id_node,</div><div class='ctx'> 			     dataserver_timeo, dataserver_retrans,</div><div class='del'>-			     mirror-&gt;mirror_ds-&gt;ds_versions[0].version,</div><div class='del'>-			     mirror-&gt;mirror_ds-&gt;ds_versions[0].minor_version);</div><div class='add'>+			     mirror-&gt;dss[dss_id].mirror_ds-&gt;ds_versions[0].version,</div><div class='add'>+			     mirror-&gt;dss[dss_id].mirror_ds-&gt;ds_versions[0].minor_version);</div><div class='ctx'> </div><div class='ctx'> 	/* connect success, check rsize/wsize limit */</div><div class='ctx'> 	if (!status) {</div><div class='add'>+		/*</div><div class='add'>+		 * ds_clp is put in destroy_ds().</div><div class='add'>+		 * keep ds_clp even if DS is local, so that if local IO cannot</div><div class='add'>+		 * proceed somehow, we can fall back to NFS whenever we want.</div><div class='add'>+		 */</div><div class='add'>+		nfs_local_probe_async(ds-&gt;ds_clp);</div><div class='ctx'> 		max_payload =</div><div class='ctx'> 			nfs_block_size(rpc_max_payload(ds-&gt;ds_clp-&gt;cl_rpcclient),</div><div class='ctx'> 				       NULL);</div><div class='del'>-		if (mirror-&gt;mirror_ds-&gt;ds_versions[0].rsize &gt; max_payload)</div><div class='del'>-			mirror-&gt;mirror_ds-&gt;ds_versions[0].rsize = max_payload;</div><div class='del'>-		if (mirror-&gt;mirror_ds-&gt;ds_versions[0].wsize &gt; max_payload)</div><div class='del'>-			mirror-&gt;mirror_ds-&gt;ds_versions[0].wsize = max_payload;</div><div class='add'>+		if (mirror-&gt;dss[dss_id].mirror_ds-&gt;ds_versions[0].rsize &gt; max_payload)</div><div class='add'>+			mirror-&gt;dss[dss_id].mirror_ds-&gt;ds_versions[0].rsize = max_payload;</div><div class='add'>+		if (mirror-&gt;dss[dss_id].mirror_ds-&gt;ds_versions[0].wsize &gt; max_payload)</div><div class='add'>+			mirror-&gt;dss[dss_id].mirror_ds-&gt;ds_versions[0].wsize = max_payload;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> noconnect:</div><div class='ctx'> 	ff_layout_track_ds_error(FF_LAYOUT_FROM_HDR(lseg-&gt;pls_layout),</div><div class='del'>-				 mirror, lseg-&gt;pls_range.offset,</div><div class='add'>+				 mirror, dss_id, lseg-&gt;pls_range.offset,</div><div class='ctx'> 				 lseg-&gt;pls_range.length, NFS4ERR_NXIO,</div><div class='ctx'> 				 OP_ILLEGAL, GFP_NOIO);</div><div class='ctx'> 	ff_layout_send_layouterror(lseg);</div><div class='ctx'> 	if (fail_return || !ff_layout_has_available_ds(lseg))</div><div class='ctx'> 		pnfs_error_mark_layout_for_return(ino, lseg);</div><div class='del'>-	ds = NULL;</div><div class='add'>+	ds = ERR_PTR(status);</div><div class='ctx'> out:</div><div class='ctx'> 	return ds;</div><div class='ctx'> }</div><div class='hunk'>@@ -418,12 +430,13 @@ out:</div><div class='ctx'> const struct cred *</div><div class='ctx'> ff_layout_get_ds_cred(struct nfs4_ff_layout_mirror *mirror,</div><div class='ctx'> 		      const struct pnfs_layout_range *range,</div><div class='del'>-		      const struct cred *mdscred)</div><div class='add'>+		      const struct cred *mdscred,</div><div class='add'>+		      u32 dss_id)</div><div class='ctx'> {</div><div class='ctx'> 	const struct cred *cred;</div><div class='ctx'> </div><div class='del'>-	if (mirror &amp;&amp; !mirror-&gt;mirror_ds-&gt;ds_versions[0].tightly_coupled) {</div><div class='del'>-		cred = ff_layout_get_mirror_cred(mirror, range-&gt;iomode);</div><div class='add'>+	if (mirror &amp;&amp; !mirror-&gt;dss[dss_id].mirror_ds-&gt;ds_versions[0].tightly_coupled) {</div><div class='add'>+		cred = ff_layout_get_mirror_cred(mirror, range-&gt;iomode, dss_id);</div><div class='ctx'> 		if (!cred)</div><div class='ctx'> 			cred = get_cred(mdscred);</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -437,15 +450,17 @@ ff_layout_get_ds_cred(struct nfs4_ff_layout_mirror *mirror,</div><div class='ctx'>  * @mirror: pointer to the mirror</div><div class='ctx'>  * @ds_clp: nfs_client for the DS</div><div class='ctx'>  * @inode: pointer to inode</div><div class='add'>+ * @dss_id: DS stripe id</div><div class='ctx'>  *</div><div class='ctx'>  * Find or create a DS rpc client with th MDS server rpc client auth flavor</div><div class='ctx'>  * in the nfs_client cl_ds_clients list.</div><div class='ctx'>  */</div><div class='ctx'> struct rpc_clnt *</div><div class='ctx'> nfs4_ff_find_or_create_ds_client(struct nfs4_ff_layout_mirror *mirror,</div><div class='del'>-				 struct nfs_client *ds_clp, struct inode *inode)</div><div class='add'>+				 struct nfs_client *ds_clp, struct inode *inode,</div><div class='add'>+				 u32 dss_id)</div><div class='ctx'> {</div><div class='del'>-	switch (mirror-&gt;mirror_ds-&gt;ds_versions[0].version) {</div><div class='add'>+	switch (mirror-&gt;dss[dss_id].mirror_ds-&gt;ds_versions[0].version) {</div><div class='ctx'> 	case 3:</div><div class='ctx'> 		/* For NFSv3 DS, flavor is set when creating DS connections */</div><div class='ctx'> 		return ds_clp-&gt;cl_rpcclient;</div><div class='hunk'>@@ -551,16 +566,18 @@ static bool ff_read_layout_has_available_ds(struct pnfs_layout_segment *lseg)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_ff_layout_mirror *mirror;</div><div class='ctx'> 	struct nfs4_deviceid_node *devid;</div><div class='del'>-	u32 idx;</div><div class='add'>+	u32 idx, dss_id;</div><div class='ctx'> </div><div class='ctx'> 	for (idx = 0; idx &lt; FF_LAYOUT_MIRROR_COUNT(lseg); idx++) {</div><div class='ctx'> 		mirror = FF_LAYOUT_COMP(lseg, idx);</div><div class='del'>-		if (mirror) {</div><div class='del'>-			if (!mirror-&gt;mirror_ds)</div><div class='add'>+		if (!mirror)</div><div class='add'>+			continue;</div><div class='add'>+		for (dss_id = 0; dss_id &lt; mirror-&gt;dss_count; dss_id++) {</div><div class='add'>+			if (!mirror-&gt;dss[dss_id].mirror_ds)</div><div class='ctx'> 				return true;</div><div class='del'>-			if (IS_ERR(mirror-&gt;mirror_ds))</div><div class='add'>+			if (IS_ERR(mirror-&gt;dss[dss_id].mirror_ds))</div><div class='ctx'> 				continue;</div><div class='del'>-			devid = &amp;mirror-&gt;mirror_ds-&gt;id_node;</div><div class='add'>+			devid = &amp;mirror-&gt;dss[dss_id].mirror_ds-&gt;id_node;</div><div class='ctx'> 			if (!nfs4_test_deviceid_unavailable(devid))</div><div class='ctx'> 				return true;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -573,17 +590,21 @@ static bool ff_rw_layout_has_available_ds(struct pnfs_layout_segment *lseg)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_ff_layout_mirror *mirror;</div><div class='ctx'> 	struct nfs4_deviceid_node *devid;</div><div class='del'>-	u32 idx;</div><div class='add'>+	u32 idx, dss_id;</div><div class='ctx'> </div><div class='ctx'> 	for (idx = 0; idx &lt; FF_LAYOUT_MIRROR_COUNT(lseg); idx++) {</div><div class='ctx'> 		mirror = FF_LAYOUT_COMP(lseg, idx);</div><div class='del'>-		if (!mirror || IS_ERR(mirror-&gt;mirror_ds))</div><div class='del'>-			return false;</div><div class='del'>-		if (!mirror-&gt;mirror_ds)</div><div class='del'>-			continue;</div><div class='del'>-		devid = &amp;mirror-&gt;mirror_ds-&gt;id_node;</div><div class='del'>-		if (nfs4_test_deviceid_unavailable(devid))</div><div class='add'>+		if (!mirror)</div><div class='ctx'> 			return false;</div><div class='add'>+		for (dss_id = 0; dss_id &lt; mirror-&gt;dss_count; dss_id++) {</div><div class='add'>+			if (IS_ERR(mirror-&gt;dss[dss_id].mirror_ds))</div><div class='add'>+				return false;</div><div class='add'>+			if (!mirror-&gt;dss[dss_id].mirror_ds)</div><div class='add'>+				continue;</div><div class='add'>+			devid = &amp;mirror-&gt;dss[dss_id].mirror_ds-&gt;id_node;</div><div class='add'>+			if (nfs4_test_deviceid_unavailable(devid))</div><div class='add'>+				return false;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return FF_LAYOUT_MIRROR_COUNT(lseg) != 0;</div><div class='head'>diff --git a/fs/nfs/fs_context.c b/fs/nfs/fs_context.c<br/>index 0d444a90f513..b4679b7161b0 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/fs_context.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/fs_context.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/fs_context.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/fs_context.c</a></div><div class='hunk'>@@ -10,6 +10,7 @@</div><div class='ctx'>  * Split from fs/nfs/super.c by David Howells &lt;dhowells@redhat.com&gt;</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/compat.h&gt;</div><div class='ctx'> #include &lt;linux/module.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/fs_context.h&gt;</div><div class='hunk'>@@ -17,9 +18,14 @@</div><div class='ctx'> #include &lt;linux/nfs_fs.h&gt;</div><div class='ctx'> #include &lt;linux/nfs_mount.h&gt;</div><div class='ctx'> #include &lt;linux/nfs4_mount.h&gt;</div><div class='add'>+</div><div class='add'>+#include &lt;net/handshake.h&gt;</div><div class='add'>+</div><div class='ctx'> #include "nfs.h"</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> </div><div class='add'>+#include "nfstrace.h"</div><div class='add'>+</div><div class='ctx'> #define NFSDBG_FACILITY		NFSDBG_MOUNT</div><div class='ctx'> </div><div class='ctx'> #if IS_ENABLED(CONFIG_NFS_V3)</div><div class='hunk'>@@ -43,6 +49,8 @@ enum nfs_param {</div><div class='ctx'> 	Opt_bsize,</div><div class='ctx'> 	Opt_clientaddr,</div><div class='ctx'> 	Opt_cto,</div><div class='add'>+	Opt_alignwrite,</div><div class='add'>+	Opt_fatal_neterrors,</div><div class='ctx'> 	Opt_fg,</div><div class='ctx'> 	Opt_fscache,</div><div class='ctx'> 	Opt_fscache_flag,</div><div class='hunk'>@@ -65,6 +73,8 @@ enum nfs_param {</div><div class='ctx'> 	Opt_posix,</div><div class='ctx'> 	Opt_proto,</div><div class='ctx'> 	Opt_rdirplus,</div><div class='add'>+	Opt_rdirplus_none,</div><div class='add'>+	Opt_rdirplus_force,</div><div class='ctx'> 	Opt_rdma,</div><div class='ctx'> 	Opt_resvport,</div><div class='ctx'> 	Opt_retrans,</div><div class='hunk'>@@ -79,11 +89,29 @@ enum nfs_param {</div><div class='ctx'> 	Opt_source,</div><div class='ctx'> 	Opt_tcp,</div><div class='ctx'> 	Opt_timeo,</div><div class='add'>+	Opt_trunkdiscovery,</div><div class='ctx'> 	Opt_udp,</div><div class='ctx'> 	Opt_v,</div><div class='ctx'> 	Opt_vers,</div><div class='ctx'> 	Opt_wsize,</div><div class='ctx'> 	Opt_write,</div><div class='add'>+	Opt_xprtsec,</div><div class='add'>+	Opt_cert_serial,</div><div class='add'>+	Opt_privkey_serial,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+enum {</div><div class='add'>+	Opt_fatal_neterrors_default,</div><div class='add'>+	Opt_fatal_neterrors_enetunreach,</div><div class='add'>+	Opt_fatal_neterrors_none,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct constant_table nfs_param_enums_fatal_neterrors[] = {</div><div class='add'>+	{ "default",			Opt_fatal_neterrors_default },</div><div class='add'>+	{ "ENETDOWN:ENETUNREACH",	Opt_fatal_neterrors_enetunreach },</div><div class='add'>+	{ "ENETUNREACH:ENETDOWN",	Opt_fatal_neterrors_enetunreach },</div><div class='add'>+	{ "none",			Opt_fatal_neterrors_none },</div><div class='add'>+	{}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> enum {</div><div class='hunk'>@@ -141,6 +169,9 @@ static const struct fs_parameter_spec nfs_fs_parameters[] = {</div><div class='ctx'> 	fsparam_u32   ("bsize",		Opt_bsize),</div><div class='ctx'> 	fsparam_string("clientaddr",	Opt_clientaddr),</div><div class='ctx'> 	fsparam_flag_no("cto",		Opt_cto),</div><div class='add'>+	fsparam_flag_no("alignwrite",	Opt_alignwrite),</div><div class='add'>+	fsparam_enum("fatal_neterrors", Opt_fatal_neterrors,</div><div class='add'>+		     nfs_param_enums_fatal_neterrors),</div><div class='ctx'> 	fsparam_flag  ("fg",		Opt_fg),</div><div class='ctx'> 	fsparam_flag_no("fsc",		Opt_fscache_flag),</div><div class='ctx'> 	fsparam_string("fsc",		Opt_fscache),</div><div class='hunk'>@@ -164,7 +195,8 @@ static const struct fs_parameter_spec nfs_fs_parameters[] = {</div><div class='ctx'> 	fsparam_u32   ("port",		Opt_port),</div><div class='ctx'> 	fsparam_flag_no("posix",	Opt_posix),</div><div class='ctx'> 	fsparam_string("proto",		Opt_proto),</div><div class='del'>-	fsparam_flag_no("rdirplus",	Opt_rdirplus),</div><div class='add'>+	fsparam_flag_no("rdirplus", Opt_rdirplus), // rdirplus|nordirplus</div><div class='add'>+	fsparam_string("rdirplus",  Opt_rdirplus), // rdirplus=...</div><div class='ctx'> 	fsparam_flag  ("rdma",		Opt_rdma),</div><div class='ctx'> 	fsparam_flag_no("resvport",	Opt_resvport),</div><div class='ctx'> 	fsparam_u32   ("retrans",	Opt_retrans),</div><div class='hunk'>@@ -179,6 +211,7 @@ static const struct fs_parameter_spec nfs_fs_parameters[] = {</div><div class='ctx'> 	fsparam_string("source",	Opt_source),</div><div class='ctx'> 	fsparam_flag  ("tcp",		Opt_tcp),</div><div class='ctx'> 	fsparam_u32   ("timeo",		Opt_timeo),</div><div class='add'>+	fsparam_flag_no("trunkdiscovery", Opt_trunkdiscovery),</div><div class='ctx'> 	fsparam_flag  ("udp",		Opt_udp),</div><div class='ctx'> 	fsparam_flag  ("v2",		Opt_v),</div><div class='ctx'> 	fsparam_flag  ("v3",		Opt_v),</div><div class='hunk'>@@ -189,6 +222,9 @@ static const struct fs_parameter_spec nfs_fs_parameters[] = {</div><div class='ctx'> 	fsparam_string("vers",		Opt_vers),</div><div class='ctx'> 	fsparam_enum  ("write",		Opt_write, nfs_param_enums_write),</div><div class='ctx'> 	fsparam_u32   ("wsize",		Opt_wsize),</div><div class='add'>+	fsparam_string("xprtsec",	Opt_xprtsec),</div><div class='add'>+	fsparam_s32("cert_serial",	Opt_cert_serial),</div><div class='add'>+	fsparam_s32("privkey_serial",	Opt_privkey_serial),</div><div class='ctx'> 	{}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -262,15 +298,35 @@ static const struct constant_table nfs_secflavor_tokens[] = {</div><div class='ctx'> 	{}</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+enum {</div><div class='add'>+	Opt_xprtsec_none,</div><div class='add'>+	Opt_xprtsec_tls,</div><div class='add'>+	Opt_xprtsec_mtls,</div><div class='add'>+	nr__Opt_xprtsec</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct constant_table nfs_xprtsec_policies[] = {</div><div class='add'>+	{ "none",	Opt_xprtsec_none },</div><div class='add'>+	{ "tls",	Opt_xprtsec_tls },</div><div class='add'>+	{ "mtls",	Opt_xprtsec_mtls },</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct constant_table nfs_rdirplus_tokens[] = {</div><div class='add'>+	{ "none",	Opt_rdirplus_none },</div><div class='add'>+	{ "force",	Opt_rdirplus_force },</div><div class='add'>+	{}</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Sanity-check a server address provided by the mount command.</div><div class='ctx'>  *</div><div class='ctx'>  * Address family must be initialized, and address must not be</div><div class='ctx'>  * the ANY address for that family.</div><div class='ctx'>  */</div><div class='del'>-static int nfs_verify_server_address(struct sockaddr *addr)</div><div class='add'>+static int nfs_verify_server_address(struct sockaddr_storage *addr)</div><div class='ctx'> {</div><div class='del'>-	switch (addr-&gt;sa_family) {</div><div class='add'>+	switch (addr-&gt;ss_family) {</div><div class='ctx'> 	case AF_INET: {</div><div class='ctx'> 		struct sockaddr_in *sa = (struct sockaddr_in *)addr;</div><div class='ctx'> 		return sa-&gt;sin_addr.s_addr != htonl(INADDR_ANY);</div><div class='hunk'>@@ -281,7 +337,6 @@ static int nfs_verify_server_address(struct sockaddr *addr)</div><div class='ctx'> 	}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dfprintk(MOUNT, "NFS: Invalid IP address specified\n");</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -316,9 +371,21 @@ static int nfs_validate_transport_protocol(struct fs_context *fc,</div><div class='ctx'> 	default:</div><div class='ctx'> 		ctx-&gt;nfs_server.protocol = XPRT_TRANSPORT_TCP;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	if (ctx-&gt;xprtsec.policy != RPC_XPRTSEC_NONE)</div><div class='add'>+		switch (ctx-&gt;nfs_server.protocol) {</div><div class='add'>+		case XPRT_TRANSPORT_TCP:</div><div class='add'>+			ctx-&gt;nfs_server.protocol = XPRT_TRANSPORT_TCP_TLS;</div><div class='add'>+			break;</div><div class='add'>+		default:</div><div class='add'>+			goto out_invalid_xprtsec_policy;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> out_invalid_transport_udp:</div><div class='ctx'> 	return nfs_invalf(fc, "NFS: Unsupported transport protocol udp");</div><div class='add'>+out_invalid_xprtsec_policy:</div><div class='add'>+	return nfs_invalf(fc, "NFS: Transport does not support xprtsec");</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -375,7 +442,7 @@ static int nfs_parse_security_flavors(struct fs_context *fc,</div><div class='ctx'> 	char *string = param-&gt;string, *p;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	dfprintk(MOUNT, "NFS: parsing %s=%s option\n", param-&gt;key, param-&gt;string);</div><div class='add'>+	trace_nfs_mount_assign(param-&gt;key, string);</div><div class='ctx'> </div><div class='ctx'> 	while ((p = strsep(&amp;string, ":")) != NULL) {</div><div class='ctx'> 		if (!*p)</div><div class='hunk'>@@ -426,6 +493,29 @@ static int nfs_parse_security_flavors(struct fs_context *fc,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int nfs_parse_xprtsec_policy(struct fs_context *fc,</div><div class='add'>+				    struct fs_parameter *param)</div><div class='add'>+{</div><div class='add'>+	struct nfs_fs_context *ctx = nfs_fc2context(fc);</div><div class='add'>+</div><div class='add'>+	trace_nfs_mount_assign(param-&gt;key, param-&gt;string);</div><div class='add'>+</div><div class='add'>+	switch (lookup_constant(nfs_xprtsec_policies, param-&gt;string, -1)) {</div><div class='add'>+	case Opt_xprtsec_none:</div><div class='add'>+		ctx-&gt;xprtsec.policy = RPC_XPRTSEC_NONE;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_xprtsec_tls:</div><div class='add'>+		ctx-&gt;xprtsec.policy = RPC_XPRTSEC_TLS_ANON;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_xprtsec_mtls:</div><div class='add'>+		ctx-&gt;xprtsec.policy = RPC_XPRTSEC_TLS_X509;</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		return nfs_invalf(fc, "NFS: Unrecognized transport security policy");</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int nfs_parse_version_string(struct fs_context *fc,</div><div class='ctx'> 				    const char *string)</div><div class='ctx'> {</div><div class='hunk'>@@ -465,6 +555,32 @@ static int nfs_parse_version_string(struct fs_context *fc,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_KEYS</div><div class='add'>+static int nfs_tls_key_verify(key_serial_t key_id)</div><div class='add'>+{</div><div class='add'>+	struct key *key = key_lookup(key_id);</div><div class='add'>+	int error = 0;</div><div class='add'>+</div><div class='add'>+	if (IS_ERR(key)) {</div><div class='add'>+		pr_err("key id %08x not found\n", key_id);</div><div class='add'>+		return PTR_ERR(key);</div><div class='add'>+	}</div><div class='add'>+	if (test_bit(KEY_FLAG_REVOKED, &amp;key-&gt;flags) ||</div><div class='add'>+	    test_bit(KEY_FLAG_INVALIDATED, &amp;key-&gt;flags)) {</div><div class='add'>+		pr_err("key id %08x revoked\n", key_id);</div><div class='add'>+		error = -EKEYREVOKED;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	key_put(key);</div><div class='add'>+	return error;</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+static inline int nfs_tls_key_verify(key_serial_t key_id)</div><div class='add'>+{</div><div class='add'>+	return -ENOENT;</div><div class='add'>+}</div><div class='add'>+#endif /* CONFIG_KEYS */</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Parse a single mount parameter.</div><div class='ctx'>  */</div><div class='hunk'>@@ -477,11 +593,11 @@ static int nfs_fs_context_parse_param(struct fs_context *fc,</div><div class='ctx'> 	unsigned int len;</div><div class='ctx'> 	int ret, opt;</div><div class='ctx'> </div><div class='del'>-	dfprintk(MOUNT, "NFS:   parsing nfs mount option '%s'\n", param-&gt;key);</div><div class='add'>+	trace_nfs_mount_option(param);</div><div class='ctx'> </div><div class='ctx'> 	opt = fs_parse(fc, nfs_fs_parameters, param, &amp;result);</div><div class='ctx'> 	if (opt &lt; 0)</div><div class='del'>-		return ctx-&gt;sloppy ? 1 : opt;</div><div class='add'>+		return (opt == -ENOPARAM &amp;&amp; ctx-&gt;sloppy) ? 1 : opt;</div><div class='ctx'> </div><div class='ctx'> 	if (fc-&gt;security)</div><div class='ctx'> 		ctx-&gt;has_sec_mnt_opts = 1;</div><div class='hunk'>@@ -514,7 +630,7 @@ static int nfs_fs_context_parse_param(struct fs_context *fc,</div><div class='ctx'> 		if (result.negated)</div><div class='ctx'> 			ctx-&gt;flags &amp;= ~NFS_MOUNT_SOFTREVAL;</div><div class='ctx'> 		else</div><div class='del'>-			ctx-&gt;flags &amp;= NFS_MOUNT_SOFTREVAL;</div><div class='add'>+			ctx-&gt;flags |= NFS_MOUNT_SOFTREVAL;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case Opt_posix:</div><div class='ctx'> 		if (result.negated)</div><div class='hunk'>@@ -528,6 +644,18 @@ static int nfs_fs_context_parse_param(struct fs_context *fc,</div><div class='ctx'> 		else</div><div class='ctx'> 			ctx-&gt;flags &amp;= ~NFS_MOUNT_NOCTO;</div><div class='ctx'> 		break;</div><div class='add'>+	case Opt_trunkdiscovery:</div><div class='add'>+		if (result.negated)</div><div class='add'>+			ctx-&gt;flags &amp;= ~NFS_MOUNT_TRUNK_DISCOVERY;</div><div class='add'>+		else</div><div class='add'>+			ctx-&gt;flags |= NFS_MOUNT_TRUNK_DISCOVERY;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_alignwrite:</div><div class='add'>+		if (result.negated)</div><div class='add'>+			ctx-&gt;flags |= NFS_MOUNT_NO_ALIGNWRITE;</div><div class='add'>+		else</div><div class='add'>+			ctx-&gt;flags &amp;= ~NFS_MOUNT_NO_ALIGNWRITE;</div><div class='add'>+		break;</div><div class='ctx'> 	case Opt_ac:</div><div class='ctx'> 		if (result.negated)</div><div class='ctx'> 			ctx-&gt;flags |= NFS_MOUNT_NOAC;</div><div class='hunk'>@@ -536,9 +664,11 @@ static int nfs_fs_context_parse_param(struct fs_context *fc,</div><div class='ctx'> 		break;</div><div class='ctx'> 	case Opt_lock:</div><div class='ctx'> 		if (result.negated) {</div><div class='add'>+			ctx-&gt;lock_status = NFS_LOCK_NOLOCK;</div><div class='ctx'> 			ctx-&gt;flags |= NFS_MOUNT_NONLM;</div><div class='ctx'> 			ctx-&gt;flags |= (NFS_MOUNT_LOCAL_FLOCK | NFS_MOUNT_LOCAL_FCNTL);</div><div class='ctx'> 		} else {</div><div class='add'>+			ctx-&gt;lock_status = NFS_LOCK_LOCK;</div><div class='ctx'> 			ctx-&gt;flags &amp;= ~NFS_MOUNT_NONLM;</div><div class='ctx'> 			ctx-&gt;flags &amp;= ~(NFS_MOUNT_LOCAL_FLOCK | NFS_MOUNT_LOCAL_FCNTL);</div><div class='ctx'> 		}</div><div class='hunk'>@@ -562,10 +692,25 @@ static int nfs_fs_context_parse_param(struct fs_context *fc,</div><div class='ctx'> 			ctx-&gt;flags &amp;= ~NFS_MOUNT_NOACL;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case Opt_rdirplus:</div><div class='del'>-		if (result.negated)</div><div class='add'>+		if (result.negated) {</div><div class='add'>+			ctx-&gt;flags &amp;= ~NFS_MOUNT_FORCE_RDIRPLUS;</div><div class='ctx'> 			ctx-&gt;flags |= NFS_MOUNT_NORDIRPLUS;</div><div class='del'>-		else</div><div class='del'>-			ctx-&gt;flags &amp;= ~NFS_MOUNT_NORDIRPLUS;</div><div class='add'>+		} else if (!param-&gt;string) {</div><div class='add'>+			ctx-&gt;flags &amp;= ~(NFS_MOUNT_NORDIRPLUS | NFS_MOUNT_FORCE_RDIRPLUS);</div><div class='add'>+		} else {</div><div class='add'>+			switch (lookup_constant(nfs_rdirplus_tokens, param-&gt;string, -1)) {</div><div class='add'>+			case Opt_rdirplus_none:</div><div class='add'>+				ctx-&gt;flags &amp;= ~NFS_MOUNT_FORCE_RDIRPLUS;</div><div class='add'>+				ctx-&gt;flags |= NFS_MOUNT_NORDIRPLUS;</div><div class='add'>+				break;</div><div class='add'>+			case Opt_rdirplus_force:</div><div class='add'>+				ctx-&gt;flags &amp;= ~NFS_MOUNT_NORDIRPLUS;</div><div class='add'>+				ctx-&gt;flags |= NFS_MOUNT_FORCE_RDIRPLUS;</div><div class='add'>+				break;</div><div class='add'>+			default:</div><div class='add'>+				goto out_invalid_value;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='ctx'> 		break;</div><div class='ctx'> 	case Opt_sharecache:</div><div class='ctx'> 		if (result.negated)</div><div class='hunk'>@@ -588,6 +733,7 @@ static int nfs_fs_context_parse_param(struct fs_context *fc,</div><div class='ctx'> 		ctx-&gt;fscache_uniq = NULL;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case Opt_fscache:</div><div class='add'>+		trace_nfs_mount_assign(param-&gt;key, param-&gt;string);</div><div class='ctx'> 		ctx-&gt;options |= NFS_OPTION_FSCACHE;</div><div class='ctx'> 		kfree(ctx-&gt;fscache_uniq);</div><div class='ctx'> 		ctx-&gt;fscache_uniq = param-&gt;string;</div><div class='hunk'>@@ -674,6 +820,9 @@ static int nfs_fs_context_parse_param(struct fs_context *fc,</div><div class='ctx'> 			return ret;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case Opt_vers:</div><div class='add'>+		if (!param-&gt;string)</div><div class='add'>+			goto out_invalid_value;</div><div class='add'>+		trace_nfs_mount_assign(param-&gt;key, param-&gt;string);</div><div class='ctx'> 		ret = nfs_parse_version_string(fc, param-&gt;string);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			return ret;</div><div class='hunk'>@@ -683,8 +832,28 @@ static int nfs_fs_context_parse_param(struct fs_context *fc,</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			return ret;</div><div class='ctx'> 		break;</div><div class='add'>+	case Opt_xprtsec:</div><div class='add'>+		ret = nfs_parse_xprtsec_policy(fc, param);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_cert_serial:</div><div class='add'>+		ret = nfs_tls_key_verify(result.int_32);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='add'>+		ctx-&gt;xprtsec.cert_serial = result.int_32;</div><div class='add'>+		break;</div><div class='add'>+	case Opt_privkey_serial:</div><div class='add'>+		ret = nfs_tls_key_verify(result.int_32);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			return ret;</div><div class='add'>+		ctx-&gt;xprtsec.privkey_serial = result.int_32;</div><div class='add'>+		break;</div><div class='ctx'> </div><div class='ctx'> 	case Opt_proto:</div><div class='add'>+		if (!param-&gt;string)</div><div class='add'>+			goto out_invalid_value;</div><div class='add'>+		trace_nfs_mount_assign(param-&gt;key, param-&gt;string);</div><div class='ctx'> 		protofamily = AF_INET;</div><div class='ctx'> 		switch (lookup_constant(nfs_xprt_protocol_tokens, param-&gt;string, -1)) {</div><div class='ctx'> 		case Opt_xprt_udp6:</div><div class='hunk'>@@ -720,6 +889,9 @@ static int nfs_fs_context_parse_param(struct fs_context *fc,</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	case Opt_mountproto:</div><div class='add'>+		if (!param-&gt;string)</div><div class='add'>+			goto out_invalid_value;</div><div class='add'>+		trace_nfs_mount_assign(param-&gt;key, param-&gt;string);</div><div class='ctx'> 		mountfamily = AF_INET;</div><div class='ctx'> 		switch (lookup_constant(nfs_xprt_protocol_tokens, param-&gt;string, -1)) {</div><div class='ctx'> 		case Opt_xprt_udp6:</div><div class='hunk'>@@ -742,6 +914,7 @@ static int nfs_fs_context_parse_param(struct fs_context *fc,</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	case Opt_addr:</div><div class='add'>+		trace_nfs_mount_assign(param-&gt;key, param-&gt;string);</div><div class='ctx'> 		len = rpc_pton(fc-&gt;net_ns, param-&gt;string, param-&gt;size,</div><div class='ctx'> 			       &amp;ctx-&gt;nfs_server.address,</div><div class='ctx'> 			       sizeof(ctx-&gt;nfs_server._address));</div><div class='hunk'>@@ -750,16 +923,19 @@ static int nfs_fs_context_parse_param(struct fs_context *fc,</div><div class='ctx'> 		ctx-&gt;nfs_server.addrlen = len;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case Opt_clientaddr:</div><div class='add'>+		trace_nfs_mount_assign(param-&gt;key, param-&gt;string);</div><div class='ctx'> 		kfree(ctx-&gt;client_address);</div><div class='ctx'> 		ctx-&gt;client_address = param-&gt;string;</div><div class='ctx'> 		param-&gt;string = NULL;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case Opt_mounthost:</div><div class='add'>+		trace_nfs_mount_assign(param-&gt;key, param-&gt;string);</div><div class='ctx'> 		kfree(ctx-&gt;mount_server.hostname);</div><div class='ctx'> 		ctx-&gt;mount_server.hostname = param-&gt;string;</div><div class='ctx'> 		param-&gt;string = NULL;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case Opt_mountaddr:</div><div class='add'>+		trace_nfs_mount_assign(param-&gt;key, param-&gt;string);</div><div class='ctx'> 		len = rpc_pton(fc-&gt;net_ns, param-&gt;string, param-&gt;size,</div><div class='ctx'> 			       &amp;ctx-&gt;mount_server.address,</div><div class='ctx'> 			       sizeof(ctx-&gt;mount_server._address));</div><div class='hunk'>@@ -768,16 +944,38 @@ static int nfs_fs_context_parse_param(struct fs_context *fc,</div><div class='ctx'> 		ctx-&gt;mount_server.addrlen = len;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case Opt_nconnect:</div><div class='add'>+		trace_nfs_mount_assign(param-&gt;key, param-&gt;string);</div><div class='ctx'> 		if (result.uint_32 &lt; 1 || result.uint_32 &gt; NFS_MAX_CONNECTIONS)</div><div class='ctx'> 			goto out_of_bounds;</div><div class='ctx'> 		ctx-&gt;nfs_server.nconnect = result.uint_32;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case Opt_max_connect:</div><div class='add'>+		trace_nfs_mount_assign(param-&gt;key, param-&gt;string);</div><div class='ctx'> 		if (result.uint_32 &lt; 1 || result.uint_32 &gt; NFS_MAX_TRANSPORTS)</div><div class='ctx'> 			goto out_of_bounds;</div><div class='ctx'> 		ctx-&gt;nfs_server.max_connect = result.uint_32;</div><div class='ctx'> 		break;</div><div class='add'>+	case Opt_fatal_neterrors:</div><div class='add'>+		trace_nfs_mount_assign(param-&gt;key, param-&gt;string);</div><div class='add'>+		switch (result.uint_32) {</div><div class='add'>+		case Opt_fatal_neterrors_default:</div><div class='add'>+			if (fc-&gt;net_ns != &amp;init_net)</div><div class='add'>+				ctx-&gt;flags |= NFS_MOUNT_NETUNREACH_FATAL;</div><div class='add'>+			else</div><div class='add'>+				ctx-&gt;flags &amp;= ~NFS_MOUNT_NETUNREACH_FATAL;</div><div class='add'>+			break;</div><div class='add'>+		case Opt_fatal_neterrors_enetunreach:</div><div class='add'>+			ctx-&gt;flags |= NFS_MOUNT_NETUNREACH_FATAL;</div><div class='add'>+			break;</div><div class='add'>+		case Opt_fatal_neterrors_none:</div><div class='add'>+			ctx-&gt;flags &amp;= ~NFS_MOUNT_NETUNREACH_FATAL;</div><div class='add'>+			break;</div><div class='add'>+		default:</div><div class='add'>+			goto out_invalid_value;</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='ctx'> 	case Opt_lookupcache:</div><div class='add'>+		trace_nfs_mount_assign(param-&gt;key, param-&gt;string);</div><div class='ctx'> 		switch (result.uint_32) {</div><div class='ctx'> 		case Opt_lookupcache_all:</div><div class='ctx'> 			ctx-&gt;flags &amp;= ~(NFS_MOUNT_LOOKUP_CACHE_NONEG|NFS_MOUNT_LOOKUP_CACHE_NONE);</div><div class='hunk'>@@ -794,6 +992,7 @@ static int nfs_fs_context_parse_param(struct fs_context *fc,</div><div class='ctx'> 		}</div><div class='ctx'> 		break;</div><div class='ctx'> 	case Opt_local_lock:</div><div class='add'>+		trace_nfs_mount_assign(param-&gt;key, param-&gt;string);</div><div class='ctx'> 		switch (result.uint_32) {</div><div class='ctx'> 		case Opt_local_lock_all:</div><div class='ctx'> 			ctx-&gt;flags |= (NFS_MOUNT_LOCAL_FLOCK |</div><div class='hunk'>@@ -814,6 +1013,7 @@ static int nfs_fs_context_parse_param(struct fs_context *fc,</div><div class='ctx'> 		}</div><div class='ctx'> 		break;</div><div class='ctx'> 	case Opt_write:</div><div class='add'>+		trace_nfs_mount_assign(param-&gt;key, param-&gt;string);</div><div class='ctx'> 		switch (result.uint_32) {</div><div class='ctx'> 		case Opt_write_lazy:</div><div class='ctx'> 			ctx-&gt;flags &amp;=</div><div class='hunk'>@@ -837,7 +1037,6 @@ static int nfs_fs_context_parse_param(struct fs_context *fc,</div><div class='ctx'> 		 */</div><div class='ctx'> 	case Opt_sloppy:</div><div class='ctx'> 		ctx-&gt;sloppy = true;</div><div class='del'>-		dfprintk(MOUNT, "NFS:   relaxing parsing rules\n");</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -870,10 +1069,8 @@ static int nfs_parse_source(struct fs_context *fc,</div><div class='ctx'> 	size_t len;</div><div class='ctx'> 	const char *end;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(!dev_name || !*dev_name)) {</div><div class='del'>-		dfprintk(MOUNT, "NFS: device name not specified\n");</div><div class='add'>+	if (unlikely(!dev_name || !*dev_name))</div><div class='ctx'> 		return -EINVAL;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	/* Is the host name protected with square brakcets? */</div><div class='ctx'> 	if (*dev_name == '[') {</div><div class='hunk'>@@ -913,7 +1110,7 @@ static int nfs_parse_source(struct fs_context *fc,</div><div class='ctx'> 	if (!ctx-&gt;nfs_server.export_path)</div><div class='ctx'> 		goto out_nomem;</div><div class='ctx'> </div><div class='del'>-	dfprintk(MOUNT, "NFS: MNTPATH: '%s'\n", ctx-&gt;nfs_server.export_path);</div><div class='add'>+	trace_nfs_mount_path(ctx-&gt;nfs_server.export_path);</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> out_bad_devname:</div><div class='hunk'>@@ -955,7 +1152,7 @@ static int nfs23_parse_monolithic(struct fs_context *fc,</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_fs_context *ctx = nfs_fc2context(fc);</div><div class='ctx'> 	struct nfs_fh *mntfh = ctx-&gt;mntfh;</div><div class='del'>-	struct sockaddr *sap = (struct sockaddr *)&amp;ctx-&gt;nfs_server.address;</div><div class='add'>+	struct sockaddr_storage *sap = &amp;ctx-&gt;nfs_server._address;</div><div class='ctx'> 	int extra_flags = NFS_MOUNT_LEGACY_INTERFACE;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='hunk'>@@ -1027,10 +1224,13 @@ static int nfs23_parse_monolithic(struct fs_context *fc,</div><div class='ctx'> 		ctx-&gt;acdirmax	= data-&gt;acdirmax;</div><div class='ctx'> 		ctx-&gt;need_mount	= false;</div><div class='ctx'> </div><div class='del'>-		memcpy(sap, &amp;data-&gt;addr, sizeof(data-&gt;addr));</div><div class='del'>-		ctx-&gt;nfs_server.addrlen = sizeof(data-&gt;addr);</div><div class='del'>-		ctx-&gt;nfs_server.port = ntohs(data-&gt;addr.sin_port);</div><div class='del'>-		if (sap-&gt;sa_family != AF_INET ||</div><div class='add'>+		if (!is_remount_fc(fc)) {</div><div class='add'>+			memcpy(sap, &amp;data-&gt;addr, sizeof(data-&gt;addr));</div><div class='add'>+			ctx-&gt;nfs_server.addrlen = sizeof(data-&gt;addr);</div><div class='add'>+			ctx-&gt;nfs_server.port = ntohs(data-&gt;addr.sin_port);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (sap-&gt;ss_family != AF_INET ||</div><div class='ctx'> 		    !nfs_verify_server_address(sap))</div><div class='ctx'> 			goto out_no_address;</div><div class='ctx'> </div><div class='hunk'>@@ -1069,8 +1269,7 @@ static int nfs23_parse_monolithic(struct fs_context *fc,</div><div class='ctx'> 			int ret;</div><div class='ctx'> </div><div class='ctx'> 			data-&gt;context[NFS_MAX_CONTEXT_LEN] = '\0';</div><div class='del'>-			ret = vfs_parse_fs_string(fc, "context",</div><div class='del'>-						  data-&gt;context, strlen(data-&gt;context));</div><div class='add'>+			ret = vfs_parse_fs_string(fc, "context", data-&gt;context);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='ctx'> 				return ret;</div><div class='ctx'> #else</div><div class='hunk'>@@ -1107,7 +1306,6 @@ out_no_sec:</div><div class='ctx'> 	return nfs_invalf(fc, "NFS: nfs_mount_data version supports only AUTH_SYS");</div><div class='ctx'> </div><div class='ctx'> out_nomem:</div><div class='del'>-	dfprintk(MOUNT, "NFS: not enough memory to handle mount options");</div><div class='ctx'> 	return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> out_no_address:</div><div class='hunk'>@@ -1187,7 +1385,7 @@ static int nfs4_parse_monolithic(struct fs_context *fc,</div><div class='ctx'> 				 struct nfs4_mount_data *data)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_fs_context *ctx = nfs_fc2context(fc);</div><div class='del'>-	struct sockaddr *sap = (struct sockaddr *)&amp;ctx-&gt;nfs_server.address;</div><div class='add'>+	struct sockaddr_storage *sap = &amp;ctx-&gt;nfs_server._address;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	char *c;</div><div class='ctx'> </div><div class='hunk'>@@ -1239,7 +1437,7 @@ static int nfs4_parse_monolithic(struct fs_context *fc,</div><div class='ctx'> 	if (IS_ERR(c))</div><div class='ctx'> 		return PTR_ERR(c);</div><div class='ctx'> 	ctx-&gt;nfs_server.export_path = c;</div><div class='del'>-	dfprintk(MOUNT, "NFS: MNTPATH: '%s'\n", c);</div><div class='add'>+	trace_nfs_mount_path(c);</div><div class='ctx'> </div><div class='ctx'> 	c = strndup_user(data-&gt;client_addr.data, 16);</div><div class='ctx'> 	if (IS_ERR(c))</div><div class='hunk'>@@ -1301,7 +1499,7 @@ static int nfs_fs_context_validate(struct fs_context *fc)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_fs_context *ctx = nfs_fc2context(fc);</div><div class='ctx'> 	struct nfs_subversion *nfs_mod;</div><div class='del'>-	struct sockaddr *sap = (struct sockaddr *)&amp;ctx-&gt;nfs_server.address;</div><div class='add'>+	struct sockaddr_storage *sap = &amp;ctx-&gt;nfs_server._address;</div><div class='ctx'> 	int max_namelen = PAGE_SIZE;</div><div class='ctx'> 	int max_pathlen = NFS_MAXPATHLEN;</div><div class='ctx'> 	int port = 0;</div><div class='hunk'>@@ -1370,7 +1568,7 @@ static int nfs_fs_context_validate(struct fs_context *fc)</div><div class='ctx'> </div><div class='ctx'> 	/* Load the NFS protocol module if we haven't done so yet */</div><div class='ctx'> 	if (!ctx-&gt;nfs_mod) {</div><div class='del'>-		nfs_mod = get_nfs_version(ctx-&gt;version);</div><div class='add'>+		nfs_mod = find_nfs_version(ctx-&gt;version);</div><div class='ctx'> 		if (IS_ERR(nfs_mod)) {</div><div class='ctx'> 			ret = PTR_ERR(nfs_mod);</div><div class='ctx'> 			goto out_version_unavailable;</div><div class='hunk'>@@ -1444,7 +1642,7 @@ static int nfs_fs_context_dup(struct fs_context *fc, struct fs_context *src_fc)</div><div class='ctx'> 	}</div><div class='ctx'> 	nfs_copy_fh(ctx-&gt;mntfh, src-&gt;mntfh);</div><div class='ctx'> </div><div class='del'>-	__module_get(ctx-&gt;nfs_mod-&gt;owner);</div><div class='add'>+	get_nfs_version(ctx-&gt;nfs_mod);</div><div class='ctx'> 	ctx-&gt;client_address		= NULL;</div><div class='ctx'> 	ctx-&gt;mount_server.hostname	= NULL;</div><div class='ctx'> 	ctx-&gt;nfs_server.export_path	= NULL;</div><div class='hunk'>@@ -1527,7 +1725,7 @@ static int nfs_init_fs_context(struct fs_context *fc)</div><div class='ctx'> 		ctx-&gt;version		= nfss-&gt;nfs_client-&gt;rpc_ops-&gt;version;</div><div class='ctx'> 		ctx-&gt;minorversion	= nfss-&gt;nfs_client-&gt;cl_minorversion;</div><div class='ctx'> </div><div class='del'>-		memcpy(&amp;ctx-&gt;nfs_server.address, &amp;nfss-&gt;nfs_client-&gt;cl_addr,</div><div class='add'>+		memcpy(&amp;ctx-&gt;nfs_server._address, &amp;nfss-&gt;nfs_client-&gt;cl_addr,</div><div class='ctx'> 			ctx-&gt;nfs_server.addrlen);</div><div class='ctx'> </div><div class='ctx'> 		if (fc-&gt;net_ns != net) {</div><div class='hunk'>@@ -1536,7 +1734,7 @@ static int nfs_init_fs_context(struct fs_context *fc)</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		ctx-&gt;nfs_mod = nfss-&gt;nfs_client-&gt;cl_nfs_mod;</div><div class='del'>-		__module_get(ctx-&gt;nfs_mod-&gt;owner);</div><div class='add'>+		get_nfs_version(ctx-&gt;nfs_mod);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		/* defaults */</div><div class='ctx'> 		ctx-&gt;timeo		= NFS_UNSPEC_TIMEO;</div><div class='hunk'>@@ -1550,6 +1748,12 @@ static int nfs_init_fs_context(struct fs_context *fc)</div><div class='ctx'> 		ctx-&gt;selected_flavor	= RPC_AUTH_MAXFLAVOR;</div><div class='ctx'> 		ctx-&gt;minorversion	= 0;</div><div class='ctx'> 		ctx-&gt;need_mount		= true;</div><div class='add'>+		ctx-&gt;xprtsec.policy	= RPC_XPRTSEC_NONE;</div><div class='add'>+		ctx-&gt;xprtsec.cert_serial	= TLS_NO_CERT;</div><div class='add'>+		ctx-&gt;xprtsec.privkey_serial	= TLS_NO_PRIVKEY;</div><div class='add'>+</div><div class='add'>+		if (fc-&gt;net_ns != &amp;init_net)</div><div class='add'>+			ctx-&gt;flags |= NFS_MOUNT_NETUNREACH_FATAL;</div><div class='ctx'> </div><div class='ctx'> 		fc-&gt;s_iflags		|= SB_I_STABLE_WRITES;</div><div class='ctx'> 	}</div><div class='head'>diff --git a/fs/nfs/fscache-index.c b/fs/nfs/fscache-index.c<br/>deleted file mode 100644<br/>index 573b1da9342c..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/fscache-index.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/fscache-index.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,140 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0-or-later</div><div class='del'>-/* NFS FS-Cache index structure definition</div><div class='del'>- *</div><div class='del'>- * Copyright (C) 2008 Red Hat, Inc. All Rights Reserved.</div><div class='del'>- * Written by David Howells (dhowells@redhat.com)</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#include &lt;linux/init.h&gt;</div><div class='del'>-#include &lt;linux/kernel.h&gt;</div><div class='del'>-#include &lt;linux/sched.h&gt;</div><div class='del'>-#include &lt;linux/mm.h&gt;</div><div class='del'>-#include &lt;linux/nfs_fs.h&gt;</div><div class='del'>-#include &lt;linux/nfs_fs_sb.h&gt;</div><div class='del'>-#include &lt;linux/in6.h&gt;</div><div class='del'>-#include &lt;linux/iversion.h&gt;</div><div class='del'>-</div><div class='del'>-#include "internal.h"</div><div class='del'>-#include "fscache.h"</div><div class='del'>-</div><div class='del'>-#define NFSDBG_FACILITY		NFSDBG_FSCACHE</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Define the NFS filesystem for FS-Cache.  Upon registration FS-Cache sticks</div><div class='del'>- * the cookie for the top-level index object for NFS into here.  The top-level</div><div class='del'>- * index can than have other cache objects inserted into it.</div><div class='del'>- */</div><div class='del'>-struct fscache_netfs nfs_fscache_netfs = {</div><div class='del'>-	.name		= "nfs",</div><div class='del'>-	.version	= 0,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Register NFS for caching</div><div class='del'>- */</div><div class='del'>-int nfs_fscache_register(void)</div><div class='del'>-{</div><div class='del'>-	return fscache_register_netfs(&amp;nfs_fscache_netfs);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Unregister NFS for caching</div><div class='del'>- */</div><div class='del'>-void nfs_fscache_unregister(void)</div><div class='del'>-{</div><div class='del'>-	fscache_unregister_netfs(&amp;nfs_fscache_netfs);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Define the server object for FS-Cache.  This is used to describe a server</div><div class='del'>- * object to fscache_acquire_cookie().  It is keyed by the NFS protocol and</div><div class='del'>- * server address parameters.</div><div class='del'>- */</div><div class='del'>-const struct fscache_cookie_def nfs_fscache_server_index_def = {</div><div class='del'>-	.name		= "NFS.server",</div><div class='del'>-	.type 		= FSCACHE_COOKIE_TYPE_INDEX,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Define the superblock object for FS-Cache.  This is used to describe a</div><div class='del'>- * superblock object to fscache_acquire_cookie().  It is keyed by all the NFS</div><div class='del'>- * parameters that might cause a separate superblock.</div><div class='del'>- */</div><div class='del'>-const struct fscache_cookie_def nfs_fscache_super_index_def = {</div><div class='del'>-	.name		= "NFS.super",</div><div class='del'>-	.type 		= FSCACHE_COOKIE_TYPE_INDEX,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Consult the netfs about the state of an object</div><div class='del'>- * - This function can be absent if the index carries no state data</div><div class='del'>- * - The netfs data from the cookie being used as the target is</div><div class='del'>- *   presented, as is the auxiliary data</div><div class='del'>- */</div><div class='del'>-static</div><div class='del'>-enum fscache_checkaux nfs_fscache_inode_check_aux(void *cookie_netfs_data,</div><div class='del'>-						  const void *data,</div><div class='del'>-						  uint16_t datalen,</div><div class='del'>-						  loff_t object_size)</div><div class='del'>-{</div><div class='del'>-	struct nfs_fscache_inode_auxdata auxdata;</div><div class='del'>-	struct nfs_inode *nfsi = cookie_netfs_data;</div><div class='del'>-</div><div class='del'>-	if (datalen != sizeof(auxdata))</div><div class='del'>-		return FSCACHE_CHECKAUX_OBSOLETE;</div><div class='del'>-</div><div class='del'>-	memset(&amp;auxdata, 0, sizeof(auxdata));</div><div class='del'>-	auxdata.mtime_sec  = nfsi-&gt;vfs_inode.i_mtime.tv_sec;</div><div class='del'>-	auxdata.mtime_nsec = nfsi-&gt;vfs_inode.i_mtime.tv_nsec;</div><div class='del'>-	auxdata.ctime_sec  = nfsi-&gt;vfs_inode.i_ctime.tv_sec;</div><div class='del'>-	auxdata.ctime_nsec = nfsi-&gt;vfs_inode.i_ctime.tv_nsec;</div><div class='del'>-</div><div class='del'>-	if (NFS_SERVER(&amp;nfsi-&gt;vfs_inode)-&gt;nfs_client-&gt;rpc_ops-&gt;version == 4)</div><div class='del'>-		auxdata.change_attr = inode_peek_iversion_raw(&amp;nfsi-&gt;vfs_inode);</div><div class='del'>-</div><div class='del'>-	if (memcmp(data, &amp;auxdata, datalen) != 0)</div><div class='del'>-		return FSCACHE_CHECKAUX_OBSOLETE;</div><div class='del'>-</div><div class='del'>-	return FSCACHE_CHECKAUX_OKAY;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Get an extra reference on a read context.</div><div class='del'>- * - This function can be absent if the completion function doesn't require a</div><div class='del'>- *   context.</div><div class='del'>- * - The read context is passed back to NFS in the event that a data read on the</div><div class='del'>- *   cache fails with EIO - in which case the server must be contacted to</div><div class='del'>- *   retrieve the data, which requires the read context for security.</div><div class='del'>- */</div><div class='del'>-static void nfs_fh_get_context(void *cookie_netfs_data, void *context)</div><div class='del'>-{</div><div class='del'>-	get_nfs_open_context(context);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Release an extra reference on a read context.</div><div class='del'>- * - This function can be absent if the completion function doesn't require a</div><div class='del'>- *   context.</div><div class='del'>- */</div><div class='del'>-static void nfs_fh_put_context(void *cookie_netfs_data, void *context)</div><div class='del'>-{</div><div class='del'>-	if (context)</div><div class='del'>-		put_nfs_open_context(context);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Define the inode object for FS-Cache.  This is used to describe an inode</div><div class='del'>- * object to fscache_acquire_cookie().  It is keyed by the NFS file handle for</div><div class='del'>- * an inode.</div><div class='del'>- *</div><div class='del'>- * Coherency is managed by comparing the copies of i_size, i_mtime and i_ctime</div><div class='del'>- * held in the cache auxiliary data for the data storage object with those in</div><div class='del'>- * the inode struct in memory.</div><div class='del'>- */</div><div class='del'>-const struct fscache_cookie_def nfs_fscache_inode_object_def = {</div><div class='del'>-	.name		= "NFS.fh",</div><div class='del'>-	.type		= FSCACHE_COOKIE_TYPE_DATAFILE,</div><div class='del'>-	.check_aux	= nfs_fscache_inode_check_aux,</div><div class='del'>-	.get_context	= nfs_fh_get_context,</div><div class='del'>-	.put_context	= nfs_fh_put_context,</div><div class='del'>-};</div><div class='head'>diff --git a/fs/nfs/fscache.c b/fs/nfs/fscache.c<br/>index d743629e05e1..8b0785178731 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/fscache.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/fscache.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/fscache.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/fscache.c</a></div><div class='hunk'>@@ -15,31 +15,27 @@</div><div class='ctx'> #include &lt;linux/seq_file.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/iversion.h&gt;</div><div class='add'>+#include &lt;linux/xarray.h&gt;</div><div class='add'>+#include &lt;linux/fscache.h&gt;</div><div class='add'>+#include &lt;linux/netfs.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "internal.h"</div><div class='ctx'> #include "iostat.h"</div><div class='ctx'> #include "fscache.h"</div><div class='add'>+#include "nfstrace.h"</div><div class='ctx'> </div><div class='del'>-#define NFSDBG_FACILITY		NFSDBG_FSCACHE</div><div class='add'>+#define NFS_MAX_KEY_LEN 1000</div><div class='ctx'> </div><div class='del'>-static struct rb_root nfs_fscache_keys = RB_ROOT;</div><div class='del'>-static DEFINE_SPINLOCK(nfs_fscache_keys_lock);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Layout of the key for an NFS server cache object.</div><div class='del'>- */</div><div class='del'>-struct nfs_server_key {</div><div class='del'>-	struct {</div><div class='del'>-		uint16_t	nfsversion;		/* NFS protocol version */</div><div class='del'>-		uint32_t	minorversion;		/* NFSv4 minor version */</div><div class='del'>-		uint16_t	family;			/* address family */</div><div class='del'>-		__be16		port;			/* IP port */</div><div class='del'>-	} hdr;</div><div class='del'>-	union {</div><div class='del'>-		struct in_addr	ipv4_addr;	/* IPv4 address */</div><div class='del'>-		struct in6_addr ipv6_addr;	/* IPv6 address */</div><div class='del'>-	};</div><div class='del'>-} __packed;</div><div class='add'>+static bool nfs_append_int(char *key, int *_len, unsigned long long x)</div><div class='add'>+{</div><div class='add'>+	if (*_len &gt; NFS_MAX_KEY_LEN)</div><div class='add'>+		return false;</div><div class='add'>+	if (x == 0)</div><div class='add'>+		key[(*_len)++] = ',';</div><div class='add'>+	else</div><div class='add'>+		*_len += sprintf(key + *_len, ",%llx", x);</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Get the per-client index cookie for an NFS client if the appropriate mount</div><div class='hunk'>@@ -47,160 +43,106 @@ struct nfs_server_key {</div><div class='ctx'>  * - We always try and get an index cookie for the client, but get filehandle</div><div class='ctx'>  *   cookies on a per-superblock basis, depending on the mount flags</div><div class='ctx'>  */</div><div class='del'>-void nfs_fscache_get_client_cookie(struct nfs_client *clp)</div><div class='add'>+static bool nfs_fscache_get_client_key(struct nfs_client *clp,</div><div class='add'>+				       char *key, int *_len)</div><div class='ctx'> {</div><div class='ctx'> 	const struct sockaddr_in6 *sin6 = (struct sockaddr_in6 *) &amp;clp-&gt;cl_addr;</div><div class='ctx'> 	const struct sockaddr_in *sin = (struct sockaddr_in *) &amp;clp-&gt;cl_addr;</div><div class='del'>-	struct nfs_server_key key;</div><div class='del'>-	uint16_t len = sizeof(key.hdr);</div><div class='ctx'> </div><div class='del'>-	memset(&amp;key, 0, sizeof(key));</div><div class='del'>-	key.hdr.nfsversion = clp-&gt;rpc_ops-&gt;version;</div><div class='del'>-	key.hdr.minorversion = clp-&gt;cl_minorversion;</div><div class='del'>-	key.hdr.family = clp-&gt;cl_addr.ss_family;</div><div class='add'>+	*_len += snprintf(key + *_len, NFS_MAX_KEY_LEN - *_len,</div><div class='add'>+			  ",%u.%u,%x",</div><div class='add'>+			  clp-&gt;rpc_ops-&gt;version,</div><div class='add'>+			  clp-&gt;cl_minorversion,</div><div class='add'>+			  clp-&gt;cl_addr.ss_family);</div><div class='ctx'> </div><div class='ctx'> 	switch (clp-&gt;cl_addr.ss_family) {</div><div class='ctx'> 	case AF_INET:</div><div class='del'>-		key.hdr.port = sin-&gt;sin_port;</div><div class='del'>-		key.ipv4_addr = sin-&gt;sin_addr;</div><div class='del'>-		len += sizeof(key.ipv4_addr);</div><div class='del'>-		break;</div><div class='add'>+		if (!nfs_append_int(key, _len, sin-&gt;sin_port) ||</div><div class='add'>+		    !nfs_append_int(key, _len, sin-&gt;sin_addr.s_addr))</div><div class='add'>+			return false;</div><div class='add'>+		return true;</div><div class='ctx'> </div><div class='ctx'> 	case AF_INET6:</div><div class='del'>-		key.hdr.port = sin6-&gt;sin6_port;</div><div class='del'>-		key.ipv6_addr = sin6-&gt;sin6_addr;</div><div class='del'>-		len += sizeof(key.ipv6_addr);</div><div class='del'>-		break;</div><div class='add'>+		if (!nfs_append_int(key, _len, sin6-&gt;sin6_port) ||</div><div class='add'>+		    !nfs_append_int(key, _len, sin6-&gt;sin6_addr.s6_addr32[0]) ||</div><div class='add'>+		    !nfs_append_int(key, _len, sin6-&gt;sin6_addr.s6_addr32[1]) ||</div><div class='add'>+		    !nfs_append_int(key, _len, sin6-&gt;sin6_addr.s6_addr32[2]) ||</div><div class='add'>+		    !nfs_append_int(key, _len, sin6-&gt;sin6_addr.s6_addr32[3]))</div><div class='add'>+			return false;</div><div class='add'>+		return true;</div><div class='ctx'> </div><div class='ctx'> 	default:</div><div class='ctx'> 		printk(KERN_WARNING "NFS: Unknown network family '%d'\n",</div><div class='ctx'> 		       clp-&gt;cl_addr.ss_family);</div><div class='del'>-		clp-&gt;fscache = NULL;</div><div class='del'>-		return;</div><div class='add'>+		return false;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	/* create a cache index for looking up filehandles */</div><div class='del'>-	clp-&gt;fscache = fscache_acquire_cookie(nfs_fscache_netfs.primary_index,</div><div class='del'>-					      &amp;nfs_fscache_server_index_def,</div><div class='del'>-					      &amp;key, len,</div><div class='del'>-					      NULL, 0,</div><div class='del'>-					      clp, 0, true);</div><div class='del'>-	dfprintk(FSCACHE, "NFS: get client cookie (0x%p/0x%p)\n",</div><div class='del'>-		 clp, clp-&gt;fscache);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Dispose of a per-client cookie</div><div class='del'>- */</div><div class='del'>-void nfs_fscache_release_client_cookie(struct nfs_client *clp)</div><div class='del'>-{</div><div class='del'>-	dfprintk(FSCACHE, "NFS: releasing client cookie (0x%p/0x%p)\n",</div><div class='del'>-		 clp, clp-&gt;fscache);</div><div class='del'>-</div><div class='del'>-	fscache_relinquish_cookie(clp-&gt;fscache, NULL, false);</div><div class='del'>-	clp-&gt;fscache = NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Get the cache cookie for an NFS superblock.  We have to handle</div><div class='del'>- * uniquification here because the cache doesn't do it for us.</div><div class='add'>+ * Get the cache cookie for an NFS superblock.</div><div class='ctx'>  *</div><div class='ctx'>  * The default uniquifier is just an empty string, but it may be overridden</div><div class='ctx'>  * either by the 'fsc=xxx' option to mount, or by inheriting it from the parent</div><div class='ctx'>  * superblock across an automount point of some nature.</div><div class='ctx'>  */</div><div class='del'>-void nfs_fscache_get_super_cookie(struct super_block *sb, const char *uniq, int ulen)</div><div class='add'>+int nfs_fscache_get_super_cookie(struct super_block *sb, const char *uniq, int ulen)</div><div class='ctx'> {</div><div class='del'>-	struct nfs_fscache_key *key, *xkey;</div><div class='add'>+	struct fscache_volume *vcookie;</div><div class='ctx'> 	struct nfs_server *nfss = NFS_SB(sb);</div><div class='del'>-	struct rb_node **p, *parent;</div><div class='del'>-	int diff;</div><div class='add'>+	unsigned int len = 3;</div><div class='add'>+	char *key;</div><div class='ctx'> </div><div class='del'>-	nfss-&gt;fscache_key = NULL;</div><div class='del'>-	nfss-&gt;fscache = NULL;</div><div class='del'>-	if (!uniq) {</div><div class='del'>-		uniq = "";</div><div class='del'>-		ulen = 1;</div><div class='add'>+	if (uniq) {</div><div class='add'>+		nfss-&gt;fscache_uniq = kmemdup_nul(uniq, ulen, GFP_KERNEL);</div><div class='add'>+		if (!nfss-&gt;fscache_uniq)</div><div class='add'>+			return -ENOMEM;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	key = kzalloc(sizeof(*key) + ulen, GFP_KERNEL);</div><div class='add'>+	key = kmalloc(NFS_MAX_KEY_LEN + 24, GFP_KERNEL);</div><div class='ctx'> 	if (!key)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	key-&gt;nfs_client = nfss-&gt;nfs_client;</div><div class='del'>-	key-&gt;key.super.s_flags = sb-&gt;s_flags &amp; NFS_SB_MASK;</div><div class='del'>-	key-&gt;key.nfs_server.flags = nfss-&gt;flags;</div><div class='del'>-	key-&gt;key.nfs_server.rsize = nfss-&gt;rsize;</div><div class='del'>-	key-&gt;key.nfs_server.wsize = nfss-&gt;wsize;</div><div class='del'>-	key-&gt;key.nfs_server.acregmin = nfss-&gt;acregmin;</div><div class='del'>-	key-&gt;key.nfs_server.acregmax = nfss-&gt;acregmax;</div><div class='del'>-	key-&gt;key.nfs_server.acdirmin = nfss-&gt;acdirmin;</div><div class='del'>-	key-&gt;key.nfs_server.acdirmax = nfss-&gt;acdirmax;</div><div class='del'>-	key-&gt;key.nfs_server.fsid = nfss-&gt;fsid;</div><div class='del'>-	key-&gt;key.rpc_auth.au_flavor = nfss-&gt;client-&gt;cl_auth-&gt;au_flavor;</div><div class='del'>-</div><div class='del'>-	key-&gt;key.uniq_len = ulen;</div><div class='del'>-	memcpy(key-&gt;key.uniquifier, uniq, ulen);</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;nfs_fscache_keys_lock);</div><div class='del'>-	p = &amp;nfs_fscache_keys.rb_node;</div><div class='del'>-	parent = NULL;</div><div class='del'>-	while (*p) {</div><div class='del'>-		parent = *p;</div><div class='del'>-		xkey = rb_entry(parent, struct nfs_fscache_key, node);</div><div class='del'>-</div><div class='del'>-		if (key-&gt;nfs_client &lt; xkey-&gt;nfs_client)</div><div class='del'>-			goto go_left;</div><div class='del'>-		if (key-&gt;nfs_client &gt; xkey-&gt;nfs_client)</div><div class='del'>-			goto go_right;</div><div class='del'>-</div><div class='del'>-		diff = memcmp(&amp;key-&gt;key, &amp;xkey-&gt;key, sizeof(key-&gt;key));</div><div class='del'>-		if (diff &lt; 0)</div><div class='del'>-			goto go_left;</div><div class='del'>-		if (diff &gt; 0)</div><div class='del'>-			goto go_right;</div><div class='del'>-</div><div class='del'>-		if (key-&gt;key.uniq_len == 0)</div><div class='del'>-			goto non_unique;</div><div class='del'>-		diff = memcmp(key-&gt;key.uniquifier,</div><div class='del'>-			      xkey-&gt;key.uniquifier,</div><div class='del'>-			      key-&gt;key.uniq_len);</div><div class='del'>-		if (diff &lt; 0)</div><div class='del'>-			goto go_left;</div><div class='del'>-		if (diff &gt; 0)</div><div class='del'>-			goto go_right;</div><div class='del'>-		goto non_unique;</div><div class='del'>-</div><div class='del'>-	go_left:</div><div class='del'>-		p = &amp;(*p)-&gt;rb_left;</div><div class='del'>-		continue;</div><div class='del'>-	go_right:</div><div class='del'>-		p = &amp;(*p)-&gt;rb_right;</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	memcpy(key, "nfs", 3);</div><div class='add'>+	if (!nfs_fscache_get_client_key(nfss-&gt;nfs_client, key, &amp;len) ||</div><div class='add'>+	    !nfs_append_int(key, &amp;len, nfss-&gt;fsid.major) ||</div><div class='add'>+	    !nfs_append_int(key, &amp;len, nfss-&gt;fsid.minor) ||</div><div class='add'>+	    !nfs_append_int(key, &amp;len, sb-&gt;s_flags &amp; NFS_SB_MASK) ||</div><div class='add'>+	    !nfs_append_int(key, &amp;len, nfss-&gt;flags) ||</div><div class='add'>+	    !nfs_append_int(key, &amp;len, nfss-&gt;rsize) ||</div><div class='add'>+	    !nfs_append_int(key, &amp;len, nfss-&gt;wsize) ||</div><div class='add'>+	    !nfs_append_int(key, &amp;len, nfss-&gt;acregmin) ||</div><div class='add'>+	    !nfs_append_int(key, &amp;len, nfss-&gt;acregmax) ||</div><div class='add'>+	    !nfs_append_int(key, &amp;len, nfss-&gt;acdirmin) ||</div><div class='add'>+	    !nfs_append_int(key, &amp;len, nfss-&gt;acdirmax) ||</div><div class='add'>+	    !nfs_append_int(key, &amp;len, nfss-&gt;client-&gt;cl_auth-&gt;au_flavor))</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	if (ulen &gt; 0) {</div><div class='add'>+		if (ulen &gt; NFS_MAX_KEY_LEN - len)</div><div class='add'>+			goto out;</div><div class='add'>+		key[len++] = ',';</div><div class='add'>+		memcpy(key + len, uniq, ulen);</div><div class='add'>+		len += ulen;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	rb_link_node(&amp;key-&gt;node, parent, p);</div><div class='del'>-	rb_insert_color(&amp;key-&gt;node, &amp;nfs_fscache_keys);</div><div class='del'>-	spin_unlock(&amp;nfs_fscache_keys_lock);</div><div class='del'>-	nfss-&gt;fscache_key = key;</div><div class='add'>+	key[len] = 0;</div><div class='ctx'> </div><div class='ctx'> 	/* create a cache index for looking up filehandles */</div><div class='del'>-	nfss-&gt;fscache = fscache_acquire_cookie(nfss-&gt;nfs_client-&gt;fscache,</div><div class='del'>-					       &amp;nfs_fscache_super_index_def,</div><div class='del'>-					       &amp;key-&gt;key,</div><div class='del'>-					       sizeof(key-&gt;key) + ulen,</div><div class='del'>-					       NULL, 0,</div><div class='del'>-					       nfss, 0, true);</div><div class='del'>-	dfprintk(FSCACHE, "NFS: get superblock cookie (0x%p/0x%p)\n",</div><div class='del'>-		 nfss, nfss-&gt;fscache);</div><div class='del'>-	return;</div><div class='del'>-</div><div class='del'>-non_unique:</div><div class='del'>-	spin_unlock(&amp;nfs_fscache_keys_lock);</div><div class='add'>+	vcookie = fscache_acquire_volume(key,</div><div class='add'>+					 NULL, /* preferred_cache */</div><div class='add'>+					 NULL, 0 /* coherency_data */);</div><div class='add'>+	if (IS_ERR(vcookie)) {</div><div class='add'>+		if (vcookie != ERR_PTR(-EBUSY)) {</div><div class='add'>+			kfree(key);</div><div class='add'>+			return PTR_ERR(vcookie);</div><div class='add'>+		}</div><div class='add'>+		pr_err("NFS: Cache volume key already in use (%s)\n", key);</div><div class='add'>+		vcookie = NULL;</div><div class='add'>+	}</div><div class='add'>+	nfss-&gt;fscache = vcookie;</div><div class='add'>+</div><div class='add'>+out:</div><div class='ctx'> 	kfree(key);</div><div class='del'>-	nfss-&gt;fscache_key = NULL;</div><div class='del'>-	nfss-&gt;fscache = NULL;</div><div class='del'>-	printk(KERN_WARNING "NFS:"</div><div class='del'>-	       " Cache request denied due to non-unique superblock keys\n");</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -210,32 +152,9 @@ void nfs_fscache_release_super_cookie(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_server *nfss = NFS_SB(sb);</div><div class='ctx'> </div><div class='del'>-	dfprintk(FSCACHE, "NFS: releasing superblock cookie (0x%p/0x%p)\n",</div><div class='del'>-		 nfss, nfss-&gt;fscache);</div><div class='del'>-</div><div class='del'>-	fscache_relinquish_cookie(nfss-&gt;fscache, NULL, false);</div><div class='add'>+	fscache_relinquish_volume(nfss-&gt;fscache, NULL, false);</div><div class='ctx'> 	nfss-&gt;fscache = NULL;</div><div class='del'>-</div><div class='del'>-	if (nfss-&gt;fscache_key) {</div><div class='del'>-		spin_lock(&amp;nfs_fscache_keys_lock);</div><div class='del'>-		rb_erase(&amp;nfss-&gt;fscache_key-&gt;node, &amp;nfs_fscache_keys);</div><div class='del'>-		spin_unlock(&amp;nfs_fscache_keys_lock);</div><div class='del'>-		kfree(nfss-&gt;fscache_key);</div><div class='del'>-		nfss-&gt;fscache_key = NULL;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void nfs_fscache_update_auxdata(struct nfs_fscache_inode_auxdata *auxdata,</div><div class='del'>-				  struct nfs_inode *nfsi)</div><div class='del'>-{</div><div class='del'>-	memset(auxdata, 0, sizeof(*auxdata));</div><div class='del'>-	auxdata-&gt;mtime_sec  = nfsi-&gt;vfs_inode.i_mtime.tv_sec;</div><div class='del'>-	auxdata-&gt;mtime_nsec = nfsi-&gt;vfs_inode.i_mtime.tv_nsec;</div><div class='del'>-	auxdata-&gt;ctime_sec  = nfsi-&gt;vfs_inode.i_ctime.tv_sec;</div><div class='del'>-	auxdata-&gt;ctime_nsec = nfsi-&gt;vfs_inode.i_ctime.tv_nsec;</div><div class='del'>-</div><div class='del'>-	if (NFS_SERVER(&amp;nfsi-&gt;vfs_inode)-&gt;nfs_client-&gt;rpc_ops-&gt;version == 4)</div><div class='del'>-		auxdata-&gt;change_attr = inode_peek_iversion_raw(&amp;nfsi-&gt;vfs_inode);</div><div class='add'>+	kfree(nfss-&gt;fscache_uniq);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -247,17 +166,23 @@ void nfs_fscache_init_inode(struct inode *inode)</div><div class='ctx'> 	struct nfs_server *nfss = NFS_SERVER(inode);</div><div class='ctx'> 	struct nfs_inode *nfsi = NFS_I(inode);</div><div class='ctx'> </div><div class='del'>-	nfsi-&gt;fscache = NULL;</div><div class='add'>+	netfs_inode(inode)-&gt;cache = NULL;</div><div class='ctx'> 	if (!(nfss-&gt;fscache &amp;&amp; S_ISREG(inode-&gt;i_mode)))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	nfs_fscache_update_auxdata(&amp;auxdata, nfsi);</div><div class='add'>+	nfs_fscache_update_auxdata(&amp;auxdata, inode);</div><div class='ctx'> </div><div class='del'>-	nfsi-&gt;fscache = fscache_acquire_cookie(NFS_SB(inode-&gt;i_sb)-&gt;fscache,</div><div class='del'>-					       &amp;nfs_fscache_inode_object_def,</div><div class='del'>-					       nfsi-&gt;fh.data, nfsi-&gt;fh.size,</div><div class='del'>-					       &amp;auxdata, sizeof(auxdata),</div><div class='del'>-					       nfsi, nfsi-&gt;vfs_inode.i_size, false);</div><div class='add'>+	netfs_inode(inode)-&gt;cache = fscache_acquire_cookie(</div><div class='add'>+					       nfss-&gt;fscache,</div><div class='add'>+					       0,</div><div class='add'>+					       nfsi-&gt;fh.data, /* index_key */</div><div class='add'>+					       nfsi-&gt;fh.size,</div><div class='add'>+					       &amp;auxdata,      /* aux_data */</div><div class='add'>+					       sizeof(auxdata),</div><div class='add'>+					       i_size_read(inode));</div><div class='add'>+</div><div class='add'>+	if (netfs_inode(inode)-&gt;cache)</div><div class='add'>+		mapping_set_release_always(inode-&gt;i_mapping);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -265,22 +190,8 @@ void nfs_fscache_init_inode(struct inode *inode)</div><div class='ctx'>  */</div><div class='ctx'> void nfs_fscache_clear_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct nfs_fscache_inode_auxdata auxdata;</div><div class='del'>-	struct nfs_inode *nfsi = NFS_I(inode);</div><div class='del'>-	struct fscache_cookie *cookie = nfs_i_fscache(inode);</div><div class='del'>-</div><div class='del'>-	dfprintk(FSCACHE, "NFS: clear cookie (0x%p/0x%p)\n", nfsi, cookie);</div><div class='del'>-</div><div class='del'>-	nfs_fscache_update_auxdata(&amp;auxdata, nfsi);</div><div class='del'>-	fscache_relinquish_cookie(cookie, &amp;auxdata, false);</div><div class='del'>-	nfsi-&gt;fscache = NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool nfs_fscache_can_enable(void *data)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = data;</div><div class='del'>-</div><div class='del'>-	return !inode_is_open_for_write(inode);</div><div class='add'>+	fscache_relinquish_cookie(netfs_i_cookie(netfs_inode(inode)), false);</div><div class='add'>+	netfs_inode(inode)-&gt;cache = NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -305,216 +216,172 @@ static bool nfs_fscache_can_enable(void *data)</div><div class='ctx'> void nfs_fscache_open_file(struct inode *inode, struct file *filp)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_fscache_inode_auxdata auxdata;</div><div class='del'>-	struct nfs_inode *nfsi = NFS_I(inode);</div><div class='del'>-	struct fscache_cookie *cookie = nfs_i_fscache(inode);</div><div class='add'>+	struct fscache_cookie *cookie = netfs_i_cookie(netfs_inode(inode));</div><div class='add'>+	bool open_for_write = inode_is_open_for_write(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (!fscache_cookie_valid(cookie))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	nfs_fscache_update_auxdata(&amp;auxdata, nfsi);</div><div class='del'>-</div><div class='del'>-	if (inode_is_open_for_write(inode)) {</div><div class='del'>-		dfprintk(FSCACHE, "NFS: nfsi 0x%p disabling cache\n", nfsi);</div><div class='del'>-		clear_bit(NFS_INO_FSCACHE, &amp;nfsi-&gt;flags);</div><div class='del'>-		fscache_disable_cookie(cookie, &amp;auxdata, true);</div><div class='del'>-		fscache_uncache_all_inode_pages(cookie, inode);</div><div class='del'>-	} else {</div><div class='del'>-		dfprintk(FSCACHE, "NFS: nfsi 0x%p enabling cache\n", nfsi);</div><div class='del'>-		fscache_enable_cookie(cookie, &amp;auxdata, nfsi-&gt;vfs_inode.i_size,</div><div class='del'>-				      nfs_fscache_can_enable, inode);</div><div class='del'>-		if (fscache_cookie_enabled(cookie))</div><div class='del'>-			set_bit(NFS_INO_FSCACHE, &amp;NFS_I(inode)-&gt;flags);</div><div class='add'>+	fscache_use_cookie(cookie, open_for_write);</div><div class='add'>+	if (open_for_write) {</div><div class='add'>+		nfs_fscache_update_auxdata(&amp;auxdata, inode);</div><div class='add'>+		fscache_invalidate(cookie, &amp;auxdata, i_size_read(inode),</div><div class='add'>+				   FSCACHE_INVAL_DIO_WRITE);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_fscache_open_file);</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Release the caching state associated with a page, if the page isn't busy</div><div class='del'>- * interacting with the cache.</div><div class='del'>- * - Returns true (can release page) or false (page busy).</div><div class='del'>- */</div><div class='del'>-int nfs_fscache_release_page(struct page *page, gfp_t gfp)</div><div class='add'>+void nfs_fscache_release_file(struct inode *inode, struct file *filp)</div><div class='ctx'> {</div><div class='del'>-	if (PageFsCache(page)) {</div><div class='del'>-		struct fscache_cookie *cookie = nfs_i_fscache(page-&gt;mapping-&gt;host);</div><div class='del'>-</div><div class='del'>-		BUG_ON(!cookie);</div><div class='del'>-		dfprintk(FSCACHE, "NFS: fscache releasepage (0x%p/0x%p/0x%p)\n",</div><div class='del'>-			 cookie, page, NFS_I(page-&gt;mapping-&gt;host));</div><div class='add'>+	struct nfs_fscache_inode_auxdata auxdata;</div><div class='add'>+	struct fscache_cookie *cookie = netfs_i_cookie(netfs_inode(inode));</div><div class='add'>+	loff_t i_size = i_size_read(inode);</div><div class='ctx'> </div><div class='del'>-		if (!fscache_maybe_release_page(cookie, page, gfp))</div><div class='del'>-			return 0;</div><div class='add'>+	nfs_fscache_update_auxdata(&amp;auxdata, inode);</div><div class='add'>+	fscache_unuse_cookie(cookie, &amp;auxdata, &amp;i_size);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		nfs_inc_fscache_stats(page-&gt;mapping-&gt;host,</div><div class='del'>-				      NFSIOS_FSCACHE_PAGES_UNCACHED);</div><div class='del'>-	}</div><div class='add'>+int nfs_netfs_read_folio(struct file *file, struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	if (!netfs_inode(folio_inode(folio))-&gt;cache)</div><div class='add'>+		return -ENOBUFS;</div><div class='ctx'> </div><div class='del'>-	return 1;</div><div class='add'>+	return netfs_read_folio(file, folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Release the caching state associated with a page if undergoing complete page</div><div class='del'>- * invalidation.</div><div class='del'>- */</div><div class='del'>-void __nfs_fscache_invalidate_page(struct page *page, struct inode *inode)</div><div class='add'>+int nfs_netfs_readahead(struct readahead_control *ractl)</div><div class='ctx'> {</div><div class='del'>-	struct fscache_cookie *cookie = nfs_i_fscache(inode);</div><div class='add'>+	struct inode *inode = ractl-&gt;mapping-&gt;host;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(!cookie);</div><div class='add'>+	if (!netfs_inode(inode)-&gt;cache)</div><div class='add'>+		return -ENOBUFS;</div><div class='ctx'> </div><div class='del'>-	dfprintk(FSCACHE, "NFS: fscache invalidatepage (0x%p/0x%p/0x%p)\n",</div><div class='del'>-		 cookie, page, NFS_I(inode));</div><div class='add'>+	netfs_readahead(ractl);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	fscache_wait_on_page_write(cookie, page);</div><div class='add'>+static atomic_t nfs_netfs_debug_id;</div><div class='add'>+static int nfs_netfs_init_request(struct netfs_io_request *rreq, struct file *file)</div><div class='add'>+{</div><div class='add'>+	if (!file) {</div><div class='add'>+		if (WARN_ON_ONCE(rreq-&gt;origin != NETFS_PGPRIV2_COPY_TO_CACHE))</div><div class='add'>+			return -EIO;</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	rreq-&gt;netfs_priv = get_nfs_open_context(nfs_file_open_context(file));</div><div class='add'>+	rreq-&gt;debug_id = atomic_inc_return(&amp;nfs_netfs_debug_id);</div><div class='add'>+	/* [DEPRECATED] Use PG_private_2 to mark folio being written to the cache. */</div><div class='add'>+	__set_bit(NETFS_RREQ_USE_PGPRIV2, &amp;rreq-&gt;flags);</div><div class='add'>+	rreq-&gt;io_streams[0].sreq_max_len = NFS_SB(rreq-&gt;inode-&gt;i_sb)-&gt;rsize;</div><div class='ctx'> </div><div class='del'>-	BUG_ON(!PageLocked(page));</div><div class='del'>-	fscache_uncache_page(cookie, page);</div><div class='del'>-	nfs_inc_fscache_stats(page-&gt;mapping-&gt;host,</div><div class='del'>-			      NFSIOS_FSCACHE_PAGES_UNCACHED);</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Handle completion of a page being read from the cache.</div><div class='del'>- * - Called in process (keventd) context.</div><div class='del'>- */</div><div class='del'>-static void nfs_readpage_from_fscache_complete(struct page *page,</div><div class='del'>-					       void *context,</div><div class='del'>-					       int error)</div><div class='add'>+static void nfs_netfs_free_request(struct netfs_io_request *rreq)</div><div class='ctx'> {</div><div class='del'>-	dfprintk(FSCACHE,</div><div class='del'>-		 "NFS: readpage_from_fscache_complete (0x%p/0x%p/%d)\n",</div><div class='del'>-		 page, context, error);</div><div class='add'>+	if (rreq-&gt;netfs_priv)</div><div class='add'>+		put_nfs_open_context(rreq-&gt;netfs_priv);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * If the read completes with an error, mark the page with PG_checked,</div><div class='del'>-	 * unlock the page, and let the VM reissue the readpage.</div><div class='del'>-	 */</div><div class='del'>-	if (!error)</div><div class='del'>-		SetPageUptodate(page);</div><div class='del'>-	else</div><div class='del'>-		SetPageChecked(page);</div><div class='del'>-	unlock_page(page);</div><div class='add'>+static struct nfs_netfs_io_data *nfs_netfs_alloc(struct netfs_io_subrequest *sreq)</div><div class='add'>+{</div><div class='add'>+	struct nfs_netfs_io_data *netfs;</div><div class='add'>+</div><div class='add'>+	netfs = kzalloc(sizeof(*netfs), GFP_KERNEL_ACCOUNT);</div><div class='add'>+	if (!netfs)</div><div class='add'>+		return NULL;</div><div class='add'>+	netfs-&gt;sreq = sreq;</div><div class='add'>+	refcount_set(&amp;netfs-&gt;refcount, 1);</div><div class='add'>+	return netfs;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Retrieve a page from fscache</div><div class='del'>- */</div><div class='del'>-int __nfs_readpage_from_fscache(struct nfs_open_context *ctx,</div><div class='del'>-				struct inode *inode, struct page *page)</div><div class='add'>+static void nfs_netfs_issue_read(struct netfs_io_subrequest *sreq)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='add'>+	struct nfs_netfs_io_data	*netfs;</div><div class='add'>+	struct nfs_pageio_descriptor	pgio;</div><div class='add'>+	struct inode *inode = sreq-&gt;rreq-&gt;inode;</div><div class='add'>+	struct nfs_open_context *ctx = sreq-&gt;rreq-&gt;netfs_priv;</div><div class='add'>+	struct page *page;</div><div class='add'>+	unsigned long idx;</div><div class='add'>+	pgoff_t start, last;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	start = (sreq-&gt;start + sreq-&gt;transferred) &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	last = ((sreq-&gt;start + sreq-&gt;len - sreq-&gt;transferred - 1) &gt;&gt; PAGE_SHIFT);</div><div class='add'>+</div><div class='add'>+	nfs_pageio_init_read(&amp;pgio, inode, false,</div><div class='add'>+			     &amp;nfs_async_read_completion_ops);</div><div class='add'>+</div><div class='add'>+	netfs = nfs_netfs_alloc(sreq);</div><div class='add'>+	if (!netfs) {</div><div class='add'>+		sreq-&gt;error = -ENOMEM;</div><div class='add'>+		return netfs_read_subreq_terminated(sreq);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	dfprintk(FSCACHE,</div><div class='del'>-		 "NFS: readpage_from_fscache(fsc:%p/p:%p(i:%lx f:%lx)/0x%p)\n",</div><div class='del'>-		 nfs_i_fscache(inode), page, page-&gt;index, page-&gt;flags, inode);</div><div class='add'>+	pgio.pg_netfs = netfs; /* used in completion */</div><div class='ctx'> </div><div class='del'>-	if (PageChecked(page)) {</div><div class='del'>-		ClearPageChecked(page);</div><div class='del'>-		return 1;</div><div class='add'>+	xa_for_each_range(&amp;sreq-&gt;rreq-&gt;mapping-&gt;i_pages, idx, page, start, last) {</div><div class='add'>+		/* nfs_read_add_folio() may schedule() due to pNFS layout and other RPCs  */</div><div class='add'>+		err = nfs_read_add_folio(&amp;pgio, ctx, page_folio(page));</div><div class='add'>+		if (err &lt; 0) {</div><div class='add'>+			netfs-&gt;error = err;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='add'>+out:</div><div class='add'>+	nfs_pageio_complete_read(&amp;pgio);</div><div class='add'>+	nfs_netfs_put(netfs);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void nfs_netfs_initiate_read(struct nfs_pgio_header *hdr)</div><div class='add'>+{</div><div class='add'>+	struct nfs_netfs_io_data        *netfs = hdr-&gt;netfs;</div><div class='ctx'> </div><div class='del'>-	ret = fscache_read_or_alloc_page(nfs_i_fscache(inode),</div><div class='del'>-					 page,</div><div class='del'>-					 nfs_readpage_from_fscache_complete,</div><div class='del'>-					 ctx,</div><div class='del'>-					 GFP_KERNEL);</div><div class='del'>-</div><div class='del'>-	switch (ret) {</div><div class='del'>-	case 0: /* read BIO submitted (page in fscache) */</div><div class='del'>-		dfprintk(FSCACHE,</div><div class='del'>-			 "NFS:    readpage_from_fscache: BIO submitted\n");</div><div class='del'>-		nfs_inc_fscache_stats(inode, NFSIOS_FSCACHE_PAGES_READ_OK);</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	case -ENOBUFS: /* inode not in cache */</div><div class='del'>-	case -ENODATA: /* page not in cache */</div><div class='del'>-		nfs_inc_fscache_stats(inode, NFSIOS_FSCACHE_PAGES_READ_FAIL);</div><div class='del'>-		dfprintk(FSCACHE,</div><div class='del'>-			 "NFS:    readpage_from_fscache %d\n", ret);</div><div class='del'>-		return 1;</div><div class='add'>+	if (!netfs)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='del'>-	default:</div><div class='del'>-		dfprintk(FSCACHE, "NFS:    readpage_from_fscache %d\n", ret);</div><div class='del'>-		nfs_inc_fscache_stats(inode, NFSIOS_FSCACHE_PAGES_READ_FAIL);</div><div class='del'>-	}</div><div class='del'>-	return ret;</div><div class='add'>+	nfs_netfs_get(netfs);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Retrieve a set of pages from fscache</div><div class='del'>- */</div><div class='del'>-int __nfs_readpages_from_fscache(struct nfs_open_context *ctx,</div><div class='del'>-				 struct inode *inode,</div><div class='del'>-				 struct address_space *mapping,</div><div class='del'>-				 struct list_head *pages,</div><div class='del'>-				 unsigned *nr_pages)</div><div class='add'>+int nfs_netfs_folio_unlock(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	unsigned npages = *nr_pages;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	dfprintk(FSCACHE, "NFS: nfs_getpages_from_fscache (0x%p/%u/0x%p)\n",</div><div class='del'>-		 nfs_i_fscache(inode), npages, inode);</div><div class='del'>-</div><div class='del'>-	ret = fscache_read_or_alloc_pages(nfs_i_fscache(inode),</div><div class='del'>-					  mapping, pages, nr_pages,</div><div class='del'>-					  nfs_readpage_from_fscache_complete,</div><div class='del'>-					  ctx,</div><div class='del'>-					  mapping_gfp_mask(mapping));</div><div class='del'>-	if (*nr_pages &lt; npages)</div><div class='del'>-		nfs_add_fscache_stats(inode, NFSIOS_FSCACHE_PAGES_READ_OK,</div><div class='del'>-				      npages);</div><div class='del'>-	if (*nr_pages &gt; 0)</div><div class='del'>-		nfs_add_fscache_stats(inode, NFSIOS_FSCACHE_PAGES_READ_FAIL,</div><div class='del'>-				      *nr_pages);</div><div class='del'>-</div><div class='del'>-	switch (ret) {</div><div class='del'>-	case 0: /* read submitted to the cache for all pages */</div><div class='del'>-		BUG_ON(!list_empty(pages));</div><div class='del'>-		BUG_ON(*nr_pages != 0);</div><div class='del'>-		dfprintk(FSCACHE,</div><div class='del'>-			 "NFS: nfs_getpages_from_fscache: submitted\n");</div><div class='del'>-</div><div class='del'>-		return ret;</div><div class='del'>-</div><div class='del'>-	case -ENOBUFS: /* some pages aren't cached and can't be */</div><div class='del'>-	case -ENODATA: /* some pages aren't cached */</div><div class='del'>-		dfprintk(FSCACHE,</div><div class='del'>-			 "NFS: nfs_getpages_from_fscache: no page: %d\n", ret);</div><div class='del'>-		return 1;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> </div><div class='del'>-	default:</div><div class='del'>-		dfprintk(FSCACHE,</div><div class='del'>-			 "NFS: nfs_getpages_from_fscache: ret  %d\n", ret);</div><div class='del'>-	}</div><div class='add'>+	/*</div><div class='add'>+	 * If fscache is enabled, netfs will unlock pages.</div><div class='add'>+	 */</div><div class='add'>+	if (netfs_inode(inode)-&gt;cache)</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	return ret;</div><div class='add'>+	return 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Store a newly fetched page in fscache</div><div class='del'>- * - PG_fscache must be set on the page</div><div class='del'>- */</div><div class='del'>-void __nfs_readpage_to_fscache(struct inode *inode, struct page *page, int sync)</div><div class='add'>+void nfs_netfs_read_completion(struct nfs_pgio_header *hdr)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	dfprintk(FSCACHE,</div><div class='del'>-		 "NFS: readpage_to_fscache(fsc:%p/p:%p(i:%lx f:%lx)/%d)\n",</div><div class='del'>-		 nfs_i_fscache(inode), page, page-&gt;index, page-&gt;flags, sync);</div><div class='del'>-</div><div class='del'>-	ret = fscache_write_page(nfs_i_fscache(inode), page,</div><div class='del'>-				 inode-&gt;i_size, GFP_KERNEL);</div><div class='del'>-	dfprintk(FSCACHE,</div><div class='del'>-		 "NFS:     readpage_to_fscache: p:%p(i:%lu f:%lx) ret %d\n",</div><div class='del'>-		 page, page-&gt;index, page-&gt;flags, ret);</div><div class='del'>-</div><div class='del'>-	if (ret != 0) {</div><div class='del'>-		fscache_uncache_page(nfs_i_fscache(inode), page);</div><div class='del'>-		nfs_inc_fscache_stats(inode,</div><div class='del'>-				      NFSIOS_FSCACHE_PAGES_WRITTEN_FAIL);</div><div class='del'>-		nfs_inc_fscache_stats(inode, NFSIOS_FSCACHE_PAGES_UNCACHED);</div><div class='del'>-	} else {</div><div class='del'>-		nfs_inc_fscache_stats(inode,</div><div class='del'>-				      NFSIOS_FSCACHE_PAGES_WRITTEN_OK);</div><div class='del'>-	}</div><div class='add'>+	struct nfs_netfs_io_data        *netfs = hdr-&gt;netfs;</div><div class='add'>+	struct netfs_io_subrequest      *sreq;</div><div class='add'>+</div><div class='add'>+	if (!netfs)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	sreq = netfs-&gt;sreq;</div><div class='add'>+	if (test_bit(NFS_IOHDR_EOF, &amp;hdr-&gt;flags) &amp;&amp;</div><div class='add'>+	    sreq-&gt;rreq-&gt;origin != NETFS_UNBUFFERED_READ &amp;&amp;</div><div class='add'>+	    sreq-&gt;rreq-&gt;origin != NETFS_DIO_READ)</div><div class='add'>+		__set_bit(NETFS_SREQ_CLEAR_TAIL, &amp;sreq-&gt;flags);</div><div class='add'>+</div><div class='add'>+	if (hdr-&gt;error)</div><div class='add'>+		netfs-&gt;error = hdr-&gt;error;</div><div class='add'>+	else</div><div class='add'>+		atomic64_add(hdr-&gt;res.count, &amp;netfs-&gt;transferred);</div><div class='add'>+</div><div class='add'>+	nfs_netfs_put(netfs);</div><div class='add'>+	hdr-&gt;netfs = NULL;</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+const struct netfs_request_ops nfs_netfs_ops = {</div><div class='add'>+	.init_request		= nfs_netfs_init_request,</div><div class='add'>+	.free_request		= nfs_netfs_free_request,</div><div class='add'>+	.issue_read		= nfs_netfs_issue_read,</div><div class='add'>+};</div><div class='head'>diff --git a/fs/nfs/fscache.h b/fs/nfs/fscache.h<br/>index 6754c8607230..9d86868f4998 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/fscache.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/fscache.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/fscache.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/fscache.h</a></div><div class='hunk'>@@ -8,51 +8,16 @@</div><div class='ctx'> #ifndef _NFS_FSCACHE_H</div><div class='ctx'> #define _NFS_FSCACHE_H</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/swap.h&gt;</div><div class='ctx'> #include &lt;linux/nfs_fs.h&gt;</div><div class='ctx'> #include &lt;linux/nfs_mount.h&gt;</div><div class='ctx'> #include &lt;linux/nfs4_mount.h&gt;</div><div class='ctx'> #include &lt;linux/fscache.h&gt;</div><div class='add'>+#include &lt;linux/iversion.h&gt;</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_NFS_FSCACHE</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * set of NFS FS-Cache objects that form a superblock key</div><div class='del'>- */</div><div class='del'>-struct nfs_fscache_key {</div><div class='del'>-	struct rb_node		node;</div><div class='del'>-	struct nfs_client	*nfs_client;	/* the server */</div><div class='del'>-</div><div class='del'>-	/* the elements of the unique key - as used by nfs_compare_super() and</div><div class='del'>-	 * nfs_compare_mount_options() to distinguish superblocks */</div><div class='del'>-	struct {</div><div class='del'>-		struct {</div><div class='del'>-			unsigned long	s_flags;	/* various flags</div><div class='del'>-							 * (&amp; NFS_MS_MASK) */</div><div class='del'>-		} super;</div><div class='del'>-</div><div class='del'>-		struct {</div><div class='del'>-			struct nfs_fsid fsid;</div><div class='del'>-			int		flags;</div><div class='del'>-			unsigned int	rsize;		/* read size */</div><div class='del'>-			unsigned int	wsize;		/* write size */</div><div class='del'>-			unsigned int	acregmin;	/* attr cache timeouts */</div><div class='del'>-			unsigned int	acregmax;</div><div class='del'>-			unsigned int	acdirmin;</div><div class='del'>-			unsigned int	acdirmax;</div><div class='del'>-		} nfs_server;</div><div class='del'>-</div><div class='del'>-		struct {</div><div class='del'>-			rpc_authflavor_t au_flavor;</div><div class='del'>-		} rpc_auth;</div><div class='del'>-</div><div class='del'>-		/* uniquifier - can be used if nfs_server.flags includes</div><div class='del'>-		 * NFS_MOUNT_UNSHARED  */</div><div class='del'>-		u8 uniq_len;</div><div class='del'>-		char uniquifier[0];</div><div class='del'>-	} key;</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * Definition of the auxiliary data attached to NFS inode storage objects</div><div class='ctx'>  * within the cache.</div><div class='ctx'>  *</div><div class='hunk'>@@ -69,114 +34,105 @@ struct nfs_fscache_inode_auxdata {</div><div class='ctx'> 	u64	change_attr;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * fscache-index.c</div><div class='del'>- */</div><div class='del'>-extern struct fscache_netfs nfs_fscache_netfs;</div><div class='del'>-extern const struct fscache_cookie_def nfs_fscache_server_index_def;</div><div class='del'>-extern const struct fscache_cookie_def nfs_fscache_super_index_def;</div><div class='del'>-extern const struct fscache_cookie_def nfs_fscache_inode_object_def;</div><div class='del'>-</div><div class='del'>-extern int nfs_fscache_register(void);</div><div class='del'>-extern void nfs_fscache_unregister(void);</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * fscache.c</div><div class='del'>- */</div><div class='del'>-extern void nfs_fscache_get_client_cookie(struct nfs_client *);</div><div class='del'>-extern void nfs_fscache_release_client_cookie(struct nfs_client *);</div><div class='del'>-</div><div class='del'>-extern void nfs_fscache_get_super_cookie(struct super_block *, const char *, int);</div><div class='del'>-extern void nfs_fscache_release_super_cookie(struct super_block *);</div><div class='del'>-</div><div class='del'>-extern void nfs_fscache_init_inode(struct inode *);</div><div class='del'>-extern void nfs_fscache_clear_inode(struct inode *);</div><div class='del'>-extern void nfs_fscache_open_file(struct inode *, struct file *);</div><div class='del'>-</div><div class='del'>-extern void __nfs_fscache_invalidate_page(struct page *, struct inode *);</div><div class='del'>-extern int nfs_fscache_release_page(struct page *, gfp_t);</div><div class='del'>-</div><div class='del'>-extern int __nfs_readpage_from_fscache(struct nfs_open_context *,</div><div class='del'>-				       struct inode *, struct page *);</div><div class='del'>-extern int __nfs_readpages_from_fscache(struct nfs_open_context *,</div><div class='del'>-					struct inode *, struct address_space *,</div><div class='del'>-					struct list_head *, unsigned *);</div><div class='del'>-extern void __nfs_readpage_to_fscache(struct inode *, struct page *, int);</div><div class='add'>+struct nfs_netfs_io_data {</div><div class='add'>+	/*</div><div class='add'>+	 * NFS may split a netfs_io_subrequest into multiple RPCs, each</div><div class='add'>+	 * with their own read completion.  In netfs, we can only call</div><div class='add'>+	 * netfs_subreq_terminated() once for each subrequest.  Use the</div><div class='add'>+	 * refcount here to double as a marker of the last RPC completion,</div><div class='add'>+	 * and only call netfs via netfs_subreq_terminated() once.</div><div class='add'>+	 */</div><div class='add'>+	refcount_t			refcount;</div><div class='add'>+	struct netfs_io_subrequest	*sreq;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Final disposition of the netfs_io_subrequest, sent in</div><div class='add'>+	 * netfs_subreq_terminated()</div><div class='add'>+	 */</div><div class='add'>+	atomic64_t	transferred;</div><div class='add'>+	int		error;</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * wait for a page to complete writing to the cache</div><div class='del'>- */</div><div class='del'>-static inline void nfs_fscache_wait_on_page_write(struct nfs_inode *nfsi,</div><div class='del'>-						  struct page *page)</div><div class='add'>+static inline void nfs_netfs_get(struct nfs_netfs_io_data *netfs)</div><div class='ctx'> {</div><div class='del'>-	if (PageFsCache(page))</div><div class='del'>-		fscache_wait_on_page_write(nfsi-&gt;fscache, page);</div><div class='add'>+	refcount_inc(&amp;netfs-&gt;refcount);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * release the caching state associated with a page if undergoing complete page</div><div class='del'>- * invalidation</div><div class='del'>- */</div><div class='del'>-static inline void nfs_fscache_invalidate_page(struct page *page,</div><div class='del'>-					       struct inode *inode)</div><div class='add'>+static inline void nfs_netfs_put(struct nfs_netfs_io_data *netfs)</div><div class='ctx'> {</div><div class='del'>-	if (PageFsCache(page))</div><div class='del'>-		__nfs_fscache_invalidate_page(page, inode);</div><div class='add'>+	/* Only the last RPC completion should call netfs_subreq_terminated() */</div><div class='add'>+	if (!refcount_dec_and_test(&amp;netfs-&gt;refcount))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * The NFS pageio interface may read a complete page, even when netfs</div><div class='add'>+	 * only asked for a partial page.  Specifically, this may be seen when</div><div class='add'>+	 * one thread is truncating a file while another one is reading the last</div><div class='add'>+	 * page of the file.</div><div class='add'>+	 * Correct the final length here to be no larger than the netfs subrequest</div><div class='add'>+	 * length, and thus avoid netfs's "Subreq overread" warning message.</div><div class='add'>+	 */</div><div class='add'>+	netfs-&gt;sreq-&gt;transferred = min_t(s64, netfs-&gt;sreq-&gt;len,</div><div class='add'>+					 atomic64_read(&amp;netfs-&gt;transferred));</div><div class='add'>+	netfs-&gt;sreq-&gt;error = netfs-&gt;error;</div><div class='add'>+	netfs_read_subreq_terminated(netfs-&gt;sreq);</div><div class='add'>+	kfree(netfs);</div><div class='ctx'> }</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Retrieve a page from an inode data storage object.</div><div class='del'>- */</div><div class='del'>-static inline int nfs_readpage_from_fscache(struct nfs_open_context *ctx,</div><div class='del'>-					    struct inode *inode,</div><div class='del'>-					    struct page *page)</div><div class='add'>+static inline void nfs_netfs_inode_init(struct nfs_inode *nfsi)</div><div class='ctx'> {</div><div class='del'>-	if (NFS_I(inode)-&gt;fscache)</div><div class='del'>-		return __nfs_readpage_from_fscache(ctx, inode, page);</div><div class='del'>-	return -ENOBUFS;</div><div class='add'>+	netfs_inode_init(&amp;nfsi-&gt;netfs, &amp;nfs_netfs_ops, false);</div><div class='ctx'> }</div><div class='add'>+extern void nfs_netfs_initiate_read(struct nfs_pgio_header *hdr);</div><div class='add'>+extern void nfs_netfs_read_completion(struct nfs_pgio_header *hdr);</div><div class='add'>+extern int nfs_netfs_folio_unlock(struct folio *folio);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Retrieve a set of pages from an inode data storage object.</div><div class='add'>+ * fscache.c</div><div class='ctx'>  */</div><div class='del'>-static inline int nfs_readpages_from_fscache(struct nfs_open_context *ctx,</div><div class='del'>-					     struct inode *inode,</div><div class='del'>-					     struct address_space *mapping,</div><div class='del'>-					     struct list_head *pages,</div><div class='del'>-					     unsigned *nr_pages)</div><div class='add'>+extern int nfs_fscache_get_super_cookie(struct super_block *, const char *, int);</div><div class='add'>+extern void nfs_fscache_release_super_cookie(struct super_block *);</div><div class='add'>+</div><div class='add'>+extern void nfs_fscache_init_inode(struct inode *);</div><div class='add'>+extern void nfs_fscache_clear_inode(struct inode *);</div><div class='add'>+extern void nfs_fscache_open_file(struct inode *, struct file *);</div><div class='add'>+extern void nfs_fscache_release_file(struct inode *, struct file *);</div><div class='add'>+extern int nfs_netfs_readahead(struct readahead_control *ractl);</div><div class='add'>+extern int nfs_netfs_read_folio(struct file *file, struct folio *folio);</div><div class='add'>+</div><div class='add'>+static inline bool nfs_fscache_release_folio(struct folio *folio, gfp_t gfp)</div><div class='ctx'> {</div><div class='del'>-	if (NFS_I(inode)-&gt;fscache)</div><div class='del'>-		return __nfs_readpages_from_fscache(ctx, inode, mapping, pages,</div><div class='del'>-						    nr_pages);</div><div class='del'>-	return -ENOBUFS;</div><div class='add'>+	if (folio_test_private_2(folio)) { /* [DEPRECATED] */</div><div class='add'>+		if (current_is_kswapd() || !(gfp &amp; __GFP_FS))</div><div class='add'>+			return false;</div><div class='add'>+		folio_wait_private_2(folio);</div><div class='add'>+	}</div><div class='add'>+	fscache_note_page_release(netfs_i_cookie(netfs_inode(folio-&gt;mapping-&gt;host)));</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Store a page newly fetched from the server in an inode data storage object</div><div class='del'>- * in the cache.</div><div class='del'>- */</div><div class='del'>-static inline void nfs_readpage_to_fscache(struct inode *inode,</div><div class='del'>-					   struct page *page,</div><div class='del'>-					   int sync)</div><div class='add'>+static inline void nfs_fscache_update_auxdata(struct nfs_fscache_inode_auxdata *auxdata,</div><div class='add'>+					      struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	if (PageFsCache(page))</div><div class='del'>-		__nfs_readpage_to_fscache(inode, page, sync);</div><div class='add'>+	memset(auxdata, 0, sizeof(*auxdata));</div><div class='add'>+	auxdata-&gt;mtime_sec  = inode_get_mtime(inode).tv_sec;</div><div class='add'>+	auxdata-&gt;mtime_nsec = inode_get_mtime(inode).tv_nsec;</div><div class='add'>+	auxdata-&gt;ctime_sec  = inode_get_ctime(inode).tv_sec;</div><div class='add'>+	auxdata-&gt;ctime_nsec = inode_get_ctime(inode).tv_nsec;</div><div class='add'>+</div><div class='add'>+	if (NFS_SERVER(inode)-&gt;nfs_client-&gt;rpc_ops-&gt;version == 4)</div><div class='add'>+		auxdata-&gt;change_attr = inode_peek_iversion_raw(inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Invalidate the contents of fscache for this inode.  This will not sleep.</div><div class='ctx'>  */</div><div class='del'>-static inline void nfs_fscache_invalidate(struct inode *inode)</div><div class='add'>+static inline void nfs_fscache_invalidate(struct inode *inode, int flags)</div><div class='ctx'> {</div><div class='del'>-	fscache_invalidate(NFS_I(inode)-&gt;fscache);</div><div class='del'>-}</div><div class='add'>+	struct nfs_fscache_inode_auxdata auxdata;</div><div class='add'>+	struct fscache_cookie *cookie =  netfs_i_cookie(&amp;NFS_I(inode)-&gt;netfs);</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Wait for an object to finish being invalidated.</div><div class='del'>- */</div><div class='del'>-static inline void nfs_fscache_wait_on_invalidate(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	fscache_wait_on_invalidate(NFS_I(inode)-&gt;fscache);</div><div class='add'>+	nfs_fscache_update_auxdata(&amp;auxdata, inode);</div><div class='add'>+	fscache_invalidate(cookie, &amp;auxdata, i_size_read(inode), flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -189,54 +145,58 @@ static inline const char *nfs_server_fscache_state(struct nfs_server *server)</div><div class='ctx'> 	return "no ";</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline void nfs_netfs_set_pgio_header(struct nfs_pgio_header *hdr,</div><div class='add'>+					     struct nfs_pageio_descriptor *desc)</div><div class='add'>+{</div><div class='add'>+	hdr-&gt;netfs = desc-&gt;pg_netfs;</div><div class='add'>+}</div><div class='add'>+static inline void nfs_netfs_set_pageio_descriptor(struct nfs_pageio_descriptor *desc,</div><div class='add'>+						   struct nfs_pgio_header *hdr)</div><div class='add'>+{</div><div class='add'>+	desc-&gt;pg_netfs = hdr-&gt;netfs;</div><div class='add'>+}</div><div class='add'>+static inline void nfs_netfs_reset_pageio_descriptor(struct nfs_pageio_descriptor *desc)</div><div class='add'>+{</div><div class='add'>+	desc-&gt;pg_netfs = NULL;</div><div class='add'>+}</div><div class='ctx'> #else /* CONFIG_NFS_FSCACHE */</div><div class='del'>-static inline int nfs_fscache_register(void) { return 0; }</div><div class='del'>-static inline void nfs_fscache_unregister(void) {}</div><div class='del'>-</div><div class='del'>-static inline void nfs_fscache_get_client_cookie(struct nfs_client *clp) {}</div><div class='del'>-static inline void nfs_fscache_release_client_cookie(struct nfs_client *clp) {}</div><div class='del'>-</div><div class='add'>+static inline void nfs_netfs_inode_init(struct nfs_inode *nfsi) {}</div><div class='add'>+static inline void nfs_netfs_initiate_read(struct nfs_pgio_header *hdr) {}</div><div class='add'>+static inline void nfs_netfs_read_completion(struct nfs_pgio_header *hdr) {}</div><div class='add'>+static inline int nfs_netfs_folio_unlock(struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	return 1;</div><div class='add'>+}</div><div class='ctx'> static inline void nfs_fscache_release_super_cookie(struct super_block *sb) {}</div><div class='ctx'> </div><div class='ctx'> static inline void nfs_fscache_init_inode(struct inode *inode) {}</div><div class='ctx'> static inline void nfs_fscache_clear_inode(struct inode *inode) {}</div><div class='ctx'> static inline void nfs_fscache_open_file(struct inode *inode,</div><div class='ctx'> 					 struct file *filp) {}</div><div class='del'>-</div><div class='del'>-static inline int nfs_fscache_release_page(struct page *page, gfp_t gfp)</div><div class='del'>-{</div><div class='del'>-	return 1; /* True: may release page */</div><div class='del'>-}</div><div class='del'>-static inline void nfs_fscache_invalidate_page(struct page *page,</div><div class='del'>-					       struct inode *inode) {}</div><div class='del'>-static inline void nfs_fscache_wait_on_page_write(struct nfs_inode *nfsi,</div><div class='del'>-						  struct page *page) {}</div><div class='del'>-</div><div class='del'>-static inline int nfs_readpage_from_fscache(struct nfs_open_context *ctx,</div><div class='del'>-					    struct inode *inode,</div><div class='del'>-					    struct page *page)</div><div class='add'>+static inline void nfs_fscache_release_file(struct inode *inode, struct file *file) {}</div><div class='add'>+static inline int nfs_netfs_readahead(struct readahead_control *ractl)</div><div class='ctx'> {</div><div class='ctx'> 	return -ENOBUFS;</div><div class='ctx'> }</div><div class='del'>-static inline int nfs_readpages_from_fscache(struct nfs_open_context *ctx,</div><div class='del'>-					     struct inode *inode,</div><div class='del'>-					     struct address_space *mapping,</div><div class='del'>-					     struct list_head *pages,</div><div class='del'>-					     unsigned *nr_pages)</div><div class='add'>+static inline int nfs_netfs_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	return -ENOBUFS;</div><div class='ctx'> }</div><div class='del'>-static inline void nfs_readpage_to_fscache(struct inode *inode,</div><div class='del'>-					   struct page *page, int sync) {}</div><div class='del'>-</div><div class='ctx'> </div><div class='del'>-static inline void nfs_fscache_invalidate(struct inode *inode) {}</div><div class='del'>-static inline void nfs_fscache_wait_on_invalidate(struct inode *inode) {}</div><div class='add'>+static inline bool nfs_fscache_release_folio(struct folio *folio, gfp_t gfp)</div><div class='add'>+{</div><div class='add'>+	return true; /* may release folio */</div><div class='add'>+}</div><div class='add'>+static inline void nfs_fscache_invalidate(struct inode *inode, int flags) {}</div><div class='ctx'> </div><div class='ctx'> static inline const char *nfs_server_fscache_state(struct nfs_server *server)</div><div class='ctx'> {</div><div class='ctx'> 	return "no ";</div><div class='ctx'> }</div><div class='del'>-</div><div class='add'>+static inline void nfs_netfs_set_pgio_header(struct nfs_pgio_header *hdr,</div><div class='add'>+					     struct nfs_pageio_descriptor *desc) {}</div><div class='add'>+static inline void nfs_netfs_set_pageio_descriptor(struct nfs_pageio_descriptor *desc,</div><div class='add'>+						   struct nfs_pgio_header *hdr) {}</div><div class='add'>+static inline void nfs_netfs_reset_pageio_descriptor(struct nfs_pageio_descriptor *desc) {}</div><div class='ctx'> #endif /* CONFIG_NFS_FSCACHE */</div><div class='ctx'> #endif /* _NFS_FSCACHE_H */</div><div class='head'>diff --git a/fs/nfs/getroot.c b/fs/nfs/getroot.c<br/>index 11ff2b2e060f..f13d25d95b85 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/getroot.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/getroot.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/getroot.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/getroot.c</a></div><div class='hunk'>@@ -62,7 +62,7 @@ static int nfs_superblock_set_dummy_root(struct super_block *sb, struct inode *i</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * get an NFS2/NFS3 root dentry from the root filehandle</div><div class='add'>+ * get a root dentry from the root filehandle</div><div class='ctx'>  */</div><div class='ctx'> int nfs_get_root(struct super_block *s, struct fs_context *fc)</div><div class='ctx'> {</div><div class='head'>diff --git a/fs/nfs/inode.c b/fs/nfs/inode.c<br/>index dd53704c3f40..f76fe406937a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/inode.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/inode.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/inode.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/inode.c</a></div><div class='hunk'>@@ -72,18 +72,15 @@ nfs_fattr_to_ino_t(struct nfs_fattr *fattr)</div><div class='ctx'> 	return nfs_fileid_to_ino_t(fattr-&gt;fileid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int nfs_wait_killable(int mode)</div><div class='add'>+int nfs_wait_bit_killable(struct wait_bit_key *key, int mode)</div><div class='ctx'> {</div><div class='del'>-	freezable_schedule_unsafe();</div><div class='add'>+	if (unlikely(nfs_current_task_exiting()))</div><div class='add'>+		return -EINTR;</div><div class='add'>+	schedule();</div><div class='ctx'> 	if (signal_pending_state(mode, current))</div><div class='ctx'> 		return -ERESTARTSYS;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='del'>-</div><div class='del'>-int nfs_wait_bit_killable(struct wait_bit_key *key, int mode)</div><div class='del'>-{</div><div class='del'>-	return nfs_wait_killable(mode);</div><div class='del'>-}</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_wait_bit_killable);</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -111,7 +108,7 @@ u64 nfs_compat_user_ino64(u64 fileid)</div><div class='ctx'> </div><div class='ctx'> int nfs_drop_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	return NFS_STALE(inode) || generic_drop_inode(inode);</div><div class='add'>+	return NFS_STALE(inode) || inode_generic_drop(inode);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_drop_inode);</div><div class='ctx'> </div><div class='hunk'>@@ -195,30 +192,34 @@ static bool nfs_has_xattr_cache(const struct nfs_inode *nfsi)</div><div class='ctx'> void nfs_set_cache_invalid(struct inode *inode, unsigned long flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_inode *nfsi = NFS_I(inode);</div><div class='del'>-	bool have_delegation = NFS_PROTO(inode)-&gt;have_delegation(inode, FMODE_READ);</div><div class='ctx'> </div><div class='del'>-	if (have_delegation) {</div><div class='add'>+	if (nfs_have_delegated_attributes(inode)) {</div><div class='ctx'> 		if (!(flags &amp; NFS_INO_REVAL_FORCED))</div><div class='ctx'> 			flags &amp;= ~(NFS_INO_INVALID_MODE |</div><div class='ctx'> 				   NFS_INO_INVALID_OTHER |</div><div class='add'>+				   NFS_INO_INVALID_BTIME |</div><div class='ctx'> 				   NFS_INO_INVALID_XATTR);</div><div class='ctx'> 		flags &amp;= ~(NFS_INO_INVALID_CHANGE | NFS_INO_INVALID_SIZE);</div><div class='del'>-	} else if (flags &amp; NFS_INO_REVAL_PAGECACHE)</div><div class='del'>-		flags |= NFS_INO_INVALID_CHANGE | NFS_INO_INVALID_SIZE;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (!nfs_has_xattr_cache(nfsi))</div><div class='ctx'> 		flags &amp;= ~NFS_INO_INVALID_XATTR;</div><div class='ctx'> 	if (flags &amp; NFS_INO_INVALID_DATA)</div><div class='del'>-		nfs_fscache_invalidate(inode);</div><div class='del'>-	flags &amp;= ~(NFS_INO_REVAL_PAGECACHE | NFS_INO_REVAL_FORCED);</div><div class='del'>-</div><div class='del'>-	nfsi-&gt;cache_validity |= flags;</div><div class='add'>+		nfs_fscache_invalidate(inode, 0);</div><div class='add'>+	flags &amp;= ~NFS_INO_REVAL_FORCED;</div><div class='ctx'> </div><div class='add'>+	flags |= nfsi-&gt;cache_validity;</div><div class='ctx'> 	if (inode-&gt;i_mapping-&gt;nrpages == 0)</div><div class='del'>-		nfsi-&gt;cache_validity &amp;= ~(NFS_INO_INVALID_DATA |</div><div class='del'>-					  NFS_INO_DATA_INVAL_DEFER);</div><div class='del'>-	else if (nfsi-&gt;cache_validity &amp; NFS_INO_INVALID_DATA)</div><div class='del'>-		nfsi-&gt;cache_validity &amp;= ~NFS_INO_DATA_INVAL_DEFER;</div><div class='add'>+		flags &amp;= ~NFS_INO_INVALID_DATA;</div><div class='add'>+</div><div class='add'>+	/* pairs with nfs_clear_invalid_mapping()'s smp_load_acquire() */</div><div class='add'>+	smp_store_release(&amp;nfsi-&gt;cache_validity, flags);</div><div class='add'>+</div><div class='add'>+	if (inode-&gt;i_mapping-&gt;nrpages == 0 ||</div><div class='add'>+	    nfsi-&gt;cache_validity &amp; NFS_INO_INVALID_DATA) {</div><div class='add'>+		nfs_ooo_clear(nfsi);</div><div class='add'>+	}</div><div class='add'>+	trace_nfs_set_cache_invalid(inode, 0);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_set_cache_invalid);</div><div class='ctx'> </div><div class='hunk'>@@ -235,19 +236,17 @@ static void nfs_zap_caches_locked(struct inode *inode)</div><div class='ctx'> 	nfsi-&gt;attrtimeo = NFS_MINATTRTIMEO(inode);</div><div class='ctx'> 	nfsi-&gt;attrtimeo_timestamp = jiffies;</div><div class='ctx'> </div><div class='del'>-	if (S_ISREG(mode) || S_ISDIR(mode) || S_ISLNK(mode)) {</div><div class='del'>-		nfs_set_cache_invalid(inode, NFS_INO_INVALID_ATTR</div><div class='del'>-					| NFS_INO_INVALID_DATA</div><div class='del'>-					| NFS_INO_INVALID_ACCESS</div><div class='del'>-					| NFS_INO_INVALID_ACL</div><div class='del'>-					| NFS_INO_INVALID_XATTR</div><div class='del'>-					| NFS_INO_REVAL_PAGECACHE);</div><div class='del'>-	} else</div><div class='del'>-		nfs_set_cache_invalid(inode, NFS_INO_INVALID_ATTR</div><div class='del'>-					| NFS_INO_INVALID_ACCESS</div><div class='del'>-					| NFS_INO_INVALID_ACL</div><div class='del'>-					| NFS_INO_INVALID_XATTR</div><div class='del'>-					| NFS_INO_REVAL_PAGECACHE);</div><div class='add'>+	if (S_ISREG(mode) || S_ISDIR(mode) || S_ISLNK(mode))</div><div class='add'>+		nfs_set_cache_invalid(inode, NFS_INO_INVALID_ATTR |</div><div class='add'>+						     NFS_INO_INVALID_DATA |</div><div class='add'>+						     NFS_INO_INVALID_ACCESS |</div><div class='add'>+						     NFS_INO_INVALID_ACL |</div><div class='add'>+						     NFS_INO_INVALID_XATTR);</div><div class='add'>+	else</div><div class='add'>+		nfs_set_cache_invalid(inode, NFS_INO_INVALID_ATTR |</div><div class='add'>+						     NFS_INO_INVALID_ACCESS |</div><div class='add'>+						     NFS_INO_INVALID_ACL |</div><div class='add'>+						     NFS_INO_INVALID_XATTR);</div><div class='ctx'> 	nfs_zap_label_cache_locked(nfsi);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -282,6 +281,8 @@ EXPORT_SYMBOL_GPL(nfs_zap_acl_cache);</div><div class='ctx'> </div><div class='ctx'> void nfs_invalidate_atime(struct inode *inode)</div><div class='ctx'> {</div><div class='add'>+	if (nfs_have_delegated_atime(inode))</div><div class='add'>+		return;</div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	nfs_set_cache_invalid(inode, NFS_INO_INVALID_ATIME);</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='hunk'>@@ -320,7 +321,7 @@ struct nfs_find_desc {</div><div class='ctx'> static int</div><div class='ctx'> nfs_find_actor(struct inode *inode, void *opaque)</div><div class='ctx'> {</div><div class='del'>-	struct nfs_find_desc	*desc = (struct nfs_find_desc *)opaque;</div><div class='add'>+	struct nfs_find_desc	*desc = opaque;</div><div class='ctx'> 	struct nfs_fh		*fh = desc-&gt;fh;</div><div class='ctx'> 	struct nfs_fattr	*fattr = desc-&gt;fattr;</div><div class='ctx'> </div><div class='hunk'>@@ -338,7 +339,7 @@ nfs_find_actor(struct inode *inode, void *opaque)</div><div class='ctx'> static int</div><div class='ctx'> nfs_init_locked(struct inode *inode, void *opaque)</div><div class='ctx'> {</div><div class='del'>-	struct nfs_find_desc	*desc = (struct nfs_find_desc *)opaque;</div><div class='add'>+	struct nfs_find_desc	*desc = opaque;</div><div class='ctx'> 	struct nfs_fattr	*fattr = desc-&gt;fattr;</div><div class='ctx'> </div><div class='ctx'> 	set_nfs_fileid(inode, fattr-&gt;fileid);</div><div class='hunk'>@@ -428,6 +429,7 @@ nfs_ilookup(struct super_block *sb, struct nfs_fattr *fattr, struct nfs_fh *fh)</div><div class='ctx'> static void nfs_inode_init_regular(struct nfs_inode *nfsi)</div><div class='ctx'> {</div><div class='ctx'> 	atomic_long_set(&amp;nfsi-&gt;nrequests, 0);</div><div class='add'>+	atomic_long_set(&amp;nfsi-&gt;redirtied_pages, 0);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;nfsi-&gt;commit_info.list);</div><div class='ctx'> 	atomic_long_set(&amp;nfsi-&gt;commit_info.ncommit, 0);</div><div class='ctx'> 	atomic_set(&amp;nfsi-&gt;commit_info.rpcs_out, 0);</div><div class='hunk'>@@ -473,7 +475,7 @@ nfs_fhget(struct super_block *sb, struct nfs_fh *fh, struct nfs_fattr *fattr)</div><div class='ctx'> 		goto out_no_inode;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (inode-&gt;i_state &amp; I_NEW) {</div><div class='add'>+	if (inode_state_read_once(inode) &amp; I_NEW) {</div><div class='ctx'> 		struct nfs_inode *nfsi = NFS_I(inode);</div><div class='ctx'> 		unsigned long now = jiffies;</div><div class='ctx'> </div><div class='hunk'>@@ -496,6 +498,7 @@ nfs_fhget(struct super_block *sb, struct nfs_fh *fh, struct nfs_fattr *fattr)</div><div class='ctx'> 			inode-&gt;i_fop = NFS_SB(sb)-&gt;nfs_client-&gt;rpc_ops-&gt;file_ops;</div><div class='ctx'> 			inode-&gt;i_data.a_ops = &amp;nfs_file_aops;</div><div class='ctx'> 			nfs_inode_init_regular(nfsi);</div><div class='add'>+			mapping_set_large_folios(inode-&gt;i_mapping);</div><div class='ctx'> 		} else if (S_ISDIR(inode-&gt;i_mode)) {</div><div class='ctx'> 			inode-&gt;i_op = NFS_SB(sb)-&gt;nfs_client-&gt;rpc_ops-&gt;dir_inode_ops;</div><div class='ctx'> 			inode-&gt;i_fop = &amp;nfs_dir_operations;</div><div class='hunk'>@@ -517,9 +520,10 @@ nfs_fhget(struct super_block *sb, struct nfs_fh *fh, struct nfs_fattr *fattr)</div><div class='ctx'> 		} else</div><div class='ctx'> 			init_special_inode(inode, inode-&gt;i_mode, fattr-&gt;rdev);</div><div class='ctx'> </div><div class='del'>-		memset(&amp;inode-&gt;i_atime, 0, sizeof(inode-&gt;i_atime));</div><div class='del'>-		memset(&amp;inode-&gt;i_mtime, 0, sizeof(inode-&gt;i_mtime));</div><div class='del'>-		memset(&amp;inode-&gt;i_ctime, 0, sizeof(inode-&gt;i_ctime));</div><div class='add'>+		inode_set_atime(inode, 0, 0);</div><div class='add'>+		inode_set_mtime(inode, 0, 0);</div><div class='add'>+		inode_set_ctime(inode, 0, 0);</div><div class='add'>+		memset(&amp;nfsi-&gt;btime, 0, sizeof(nfsi-&gt;btime));</div><div class='ctx'> 		inode_set_iversion_raw(inode, 0);</div><div class='ctx'> 		inode-&gt;i_size = 0;</div><div class='ctx'> 		clear_nlink(inode);</div><div class='hunk'>@@ -532,17 +536,21 @@ nfs_fhget(struct super_block *sb, struct nfs_fh *fh, struct nfs_fattr *fattr)</div><div class='ctx'> 		nfsi-&gt;read_cache_jiffies = fattr-&gt;time_start;</div><div class='ctx'> 		nfsi-&gt;attr_gencount = fattr-&gt;gencount;</div><div class='ctx'> 		if (fattr-&gt;valid &amp; NFS_ATTR_FATTR_ATIME)</div><div class='del'>-			inode-&gt;i_atime = fattr-&gt;atime;</div><div class='add'>+			inode_set_atime_to_ts(inode, fattr-&gt;atime);</div><div class='ctx'> 		else if (fattr_supported &amp; NFS_ATTR_FATTR_ATIME)</div><div class='ctx'> 			nfs_set_cache_invalid(inode, NFS_INO_INVALID_ATIME);</div><div class='ctx'> 		if (fattr-&gt;valid &amp; NFS_ATTR_FATTR_MTIME)</div><div class='del'>-			inode-&gt;i_mtime = fattr-&gt;mtime;</div><div class='add'>+			inode_set_mtime_to_ts(inode, fattr-&gt;mtime);</div><div class='ctx'> 		else if (fattr_supported &amp; NFS_ATTR_FATTR_MTIME)</div><div class='ctx'> 			nfs_set_cache_invalid(inode, NFS_INO_INVALID_MTIME);</div><div class='ctx'> 		if (fattr-&gt;valid &amp; NFS_ATTR_FATTR_CTIME)</div><div class='del'>-			inode-&gt;i_ctime = fattr-&gt;ctime;</div><div class='add'>+			inode_set_ctime_to_ts(inode, fattr-&gt;ctime);</div><div class='ctx'> 		else if (fattr_supported &amp; NFS_ATTR_FATTR_CTIME)</div><div class='ctx'> 			nfs_set_cache_invalid(inode, NFS_INO_INVALID_CTIME);</div><div class='add'>+		if (fattr-&gt;valid &amp; NFS_ATTR_FATTR_BTIME)</div><div class='add'>+			nfsi-&gt;btime = fattr-&gt;btime;</div><div class='add'>+		else if (fattr_supported &amp; NFS_ATTR_FATTR_BTIME)</div><div class='add'>+			nfs_set_cache_invalid(inode, NFS_INO_INVALID_BTIME);</div><div class='ctx'> 		if (fattr-&gt;valid &amp; NFS_ATTR_FATTR_CHANGE)</div><div class='ctx'> 			inode_set_iversion_raw(inode, fattr-&gt;change_attr);</div><div class='ctx'> 		else</div><div class='hunk'>@@ -555,6 +563,8 @@ nfs_fhget(struct super_block *sb, struct nfs_fh *fh, struct nfs_fattr *fattr)</div><div class='ctx'> 			set_nlink(inode, fattr-&gt;nlink);</div><div class='ctx'> 		else if (fattr_supported &amp; NFS_ATTR_FATTR_NLINK)</div><div class='ctx'> 			nfs_set_cache_invalid(inode, NFS_INO_INVALID_NLINK);</div><div class='add'>+		else</div><div class='add'>+			set_nlink(inode, 1);</div><div class='ctx'> 		if (fattr-&gt;valid &amp; NFS_ATTR_FATTR_OWNER)</div><div class='ctx'> 			inode-&gt;i_uid = fattr-&gt;uid;</div><div class='ctx'> 		else if (fattr_supported &amp; NFS_ATTR_FATTR_OWNER)</div><div class='hunk'>@@ -563,8 +573,6 @@ nfs_fhget(struct super_block *sb, struct nfs_fh *fh, struct nfs_fattr *fattr)</div><div class='ctx'> 			inode-&gt;i_gid = fattr-&gt;gid;</div><div class='ctx'> 		else if (fattr_supported &amp; NFS_ATTR_FATTR_GROUP)</div><div class='ctx'> 			nfs_set_cache_invalid(inode, NFS_INO_INVALID_OTHER);</div><div class='del'>-		if (nfs_server_capable(inode, NFS_CAP_XATTR))</div><div class='del'>-			nfs_set_cache_invalid(inode, NFS_INO_INVALID_XATTR);</div><div class='ctx'> 		if (fattr-&gt;valid &amp; NFS_ATTR_FATTR_BLOCKS_USED)</div><div class='ctx'> 			inode-&gt;i_blocks = fattr-&gt;du.nfs2.blocks;</div><div class='ctx'> 		else if (fattr_supported &amp; NFS_ATTR_FATTR_BLOCKS_USED &amp;&amp;</div><div class='hunk'>@@ -600,7 +608,7 @@ nfs_fhget(struct super_block *sb, struct nfs_fh *fh, struct nfs_fattr *fattr)</div><div class='ctx'> 		inode-&gt;i_sb-&gt;s_id,</div><div class='ctx'> 		(unsigned long long)NFS_FILEID(inode),</div><div class='ctx'> 		nfs_display_fhandle_hash(fh),</div><div class='del'>-		atomic_read(&amp;inode-&gt;i_count));</div><div class='add'>+		icount_read(inode));</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	return inode;</div><div class='hunk'>@@ -611,15 +619,107 @@ out_no_inode:</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_fhget);</div><div class='ctx'> </div><div class='add'>+static void</div><div class='add'>+nfs_fattr_fixup_delegated(struct inode *inode, struct nfs_fattr *fattr)</div><div class='add'>+{</div><div class='add'>+	unsigned long cache_validity = NFS_I(inode)-&gt;cache_validity;</div><div class='add'>+</div><div class='add'>+	if (nfs_have_delegated_mtime(inode)) {</div><div class='add'>+		if (!(cache_validity &amp; NFS_INO_INVALID_CTIME))</div><div class='add'>+			fattr-&gt;valid &amp;= ~(NFS_ATTR_FATTR_PRECTIME |</div><div class='add'>+					  NFS_ATTR_FATTR_CTIME);</div><div class='add'>+</div><div class='add'>+		if (!(cache_validity &amp; NFS_INO_INVALID_MTIME))</div><div class='add'>+			fattr-&gt;valid &amp;= ~(NFS_ATTR_FATTR_PREMTIME |</div><div class='add'>+					  NFS_ATTR_FATTR_MTIME);</div><div class='add'>+</div><div class='add'>+		if (!(cache_validity &amp; NFS_INO_INVALID_ATIME))</div><div class='add'>+			fattr-&gt;valid &amp;= ~NFS_ATTR_FATTR_ATIME;</div><div class='add'>+	} else if (nfs_have_delegated_atime(inode)) {</div><div class='add'>+		if (!(cache_validity &amp; NFS_INO_INVALID_ATIME))</div><div class='add'>+			fattr-&gt;valid &amp;= ~NFS_ATTR_FATTR_ATIME;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfs_set_timestamps_to_ts(struct inode *inode, struct iattr *attr)</div><div class='add'>+{</div><div class='add'>+	unsigned int cache_flags = 0;</div><div class='add'>+</div><div class='add'>+	if (attr-&gt;ia_valid &amp; ATTR_MTIME_SET) {</div><div class='add'>+		struct timespec64 ctime = inode_get_ctime(inode);</div><div class='add'>+		struct timespec64 mtime = inode_get_mtime(inode);</div><div class='add'>+		struct timespec64 now;</div><div class='add'>+		int updated = 0;</div><div class='add'>+</div><div class='add'>+		now = inode_set_ctime_current(inode);</div><div class='add'>+		if (!timespec64_equal(&amp;now, &amp;ctime))</div><div class='add'>+			updated |= S_CTIME;</div><div class='add'>+</div><div class='add'>+		inode_set_mtime_to_ts(inode, attr-&gt;ia_mtime);</div><div class='add'>+		if (!timespec64_equal(&amp;now, &amp;mtime))</div><div class='add'>+			updated |= S_MTIME;</div><div class='add'>+</div><div class='add'>+		inode_maybe_inc_iversion(inode, updated);</div><div class='add'>+		cache_flags |= NFS_INO_INVALID_CTIME | NFS_INO_INVALID_MTIME;</div><div class='add'>+	}</div><div class='add'>+	if (attr-&gt;ia_valid &amp; ATTR_ATIME_SET) {</div><div class='add'>+		inode_set_atime_to_ts(inode, attr-&gt;ia_atime);</div><div class='add'>+		cache_flags |= NFS_INO_INVALID_ATIME;</div><div class='add'>+	}</div><div class='add'>+	NFS_I(inode)-&gt;cache_validity &amp;= ~cache_flags;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfs_update_timestamps(struct inode *inode, unsigned int ia_valid)</div><div class='add'>+{</div><div class='add'>+	enum file_time_flags time_flags = 0;</div><div class='add'>+	unsigned int cache_flags = 0;</div><div class='add'>+</div><div class='add'>+	if (ia_valid &amp; ATTR_MTIME) {</div><div class='add'>+		time_flags |= S_MTIME | S_CTIME;</div><div class='add'>+		cache_flags |= NFS_INO_INVALID_CTIME | NFS_INO_INVALID_MTIME;</div><div class='add'>+	}</div><div class='add'>+	if (ia_valid &amp; ATTR_ATIME) {</div><div class='add'>+		time_flags |= S_ATIME;</div><div class='add'>+		cache_flags |= NFS_INO_INVALID_ATIME;</div><div class='add'>+	}</div><div class='add'>+	inode_update_timestamps(inode, time_flags);</div><div class='add'>+	NFS_I(inode)-&gt;cache_validity &amp;= ~cache_flags;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void nfs_update_delegated_atime(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+	if (nfs_have_delegated_atime(inode))</div><div class='add'>+		nfs_update_timestamps(inode, ATTR_ATIME);</div><div class='add'>+	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void nfs_update_delegated_mtime_locked(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	if (nfs_have_delegated_mtime(inode))</div><div class='add'>+		nfs_update_timestamps(inode, ATTR_MTIME);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void nfs_update_delegated_mtime(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+	nfs_update_delegated_mtime_locked(inode);</div><div class='add'>+	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(nfs_update_delegated_mtime);</div><div class='add'>+</div><div class='ctx'> #define NFS_VALID_ATTRS (ATTR_MODE|ATTR_UID|ATTR_GID|ATTR_SIZE|ATTR_ATIME|ATTR_ATIME_SET|ATTR_MTIME|ATTR_MTIME_SET|ATTR_FILE|ATTR_OPEN)</div><div class='ctx'> </div><div class='ctx'> int</div><div class='del'>-nfs_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='add'>+nfs_setattr(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 	    struct iattr *attr)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	struct nfs_fattr *fattr;</div><div class='add'>+	loff_t oldsize = i_size_read(inode);</div><div class='ctx'> 	int error = 0;</div><div class='add'>+	kuid_t task_uid = current_fsuid();</div><div class='add'>+	kuid_t owner_uid = inode-&gt;i_uid;</div><div class='ctx'> </div><div class='ctx'> 	nfs_inc_stats(inode, NFSIOS_VFSSETATTR);</div><div class='ctx'> </div><div class='hunk'>@@ -634,10 +734,39 @@ nfs_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			return error;</div><div class='ctx'> </div><div class='del'>-		if (attr-&gt;ia_size == i_size_read(inode))</div><div class='add'>+		if (attr-&gt;ia_size == oldsize)</div><div class='ctx'> 			attr-&gt;ia_valid &amp;= ~ATTR_SIZE;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (nfs_have_delegated_mtime(inode) &amp;&amp; attr-&gt;ia_valid &amp; ATTR_MTIME) {</div><div class='add'>+		spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+		if (attr-&gt;ia_valid &amp; ATTR_MTIME_SET) {</div><div class='add'>+			if (uid_eq(task_uid, owner_uid)) {</div><div class='add'>+				nfs_set_timestamps_to_ts(inode, attr);</div><div class='add'>+				attr-&gt;ia_valid &amp;= ~(ATTR_MTIME|ATTR_MTIME_SET|</div><div class='add'>+						ATTR_ATIME|ATTR_ATIME_SET);</div><div class='add'>+			}</div><div class='add'>+		} else {</div><div class='add'>+			nfs_update_timestamps(inode, attr-&gt;ia_valid);</div><div class='add'>+			attr-&gt;ia_valid &amp;= ~(ATTR_MTIME|ATTR_ATIME);</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+	} else if (nfs_have_delegated_atime(inode) &amp;&amp;</div><div class='add'>+		   attr-&gt;ia_valid &amp; ATTR_ATIME &amp;&amp;</div><div class='add'>+		   !(attr-&gt;ia_valid &amp; ATTR_MTIME)) {</div><div class='add'>+		if (attr-&gt;ia_valid &amp; ATTR_ATIME_SET) {</div><div class='add'>+			if (uid_eq(task_uid, owner_uid)) {</div><div class='add'>+				spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+				nfs_set_timestamps_to_ts(inode, attr);</div><div class='add'>+				spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+				attr-&gt;ia_valid &amp;= ~(ATTR_ATIME|ATTR_ATIME_SET);</div><div class='add'>+			}</div><div class='add'>+		} else {</div><div class='add'>+			nfs_update_delegated_atime(inode);</div><div class='add'>+			attr-&gt;ia_valid &amp;= ~ATTR_ATIME;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/* Optimization: if the end result is no change, don't RPC */</div><div class='ctx'> 	if (((attr-&gt;ia_valid &amp; NFS_VALID_ATTRS) &amp; ~(ATTR_FILE|ATTR_OPEN)) == 0)</div><div class='ctx'> 		return 0;</div><div class='hunk'>@@ -645,8 +774,10 @@ nfs_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 	trace_nfs_setattr_enter(inode);</div><div class='ctx'> </div><div class='ctx'> 	/* Write all dirty data */</div><div class='del'>-	if (S_ISREG(inode-&gt;i_mode))</div><div class='add'>+	if (S_ISREG(inode-&gt;i_mode)) {</div><div class='add'>+		nfs_file_block_o_direct(NFS_I(inode));</div><div class='ctx'> 		nfs_sync_inode(inode);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	fattr = nfs_alloc_fattr_with_label(NFS_SERVER(inode));</div><div class='ctx'> 	if (fattr == NULL) {</div><div class='hunk'>@@ -655,8 +786,12 @@ nfs_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	error = NFS_PROTO(inode)-&gt;setattr(dentry, fattr, attr);</div><div class='del'>-	if (error == 0)</div><div class='add'>+	if (error == 0) {</div><div class='add'>+		if (attr-&gt;ia_valid &amp; ATTR_SIZE)</div><div class='add'>+			nfs_truncate_last_folio(inode-&gt;i_mapping, oldsize,</div><div class='add'>+						attr-&gt;ia_size);</div><div class='ctx'> 		error = nfs_refresh_inode(inode, fattr);</div><div class='add'>+	}</div><div class='ctx'> 	nfs_free_fattr(fattr);</div><div class='ctx'> out:</div><div class='ctx'> 	trace_nfs_setattr_exit(inode, error);</div><div class='hunk'>@@ -685,13 +820,15 @@ static int nfs_vmtruncate(struct inode * inode, loff_t offset)</div><div class='ctx'> 	trace_nfs_size_truncate(inode, offset);</div><div class='ctx'> 	i_size_write(inode, offset);</div><div class='ctx'> 	/* Optimisation */</div><div class='del'>-	if (offset == 0)</div><div class='del'>-		NFS_I(inode)-&gt;cache_validity &amp;= ~(NFS_INO_INVALID_DATA |</div><div class='del'>-				NFS_INO_DATA_INVAL_DEFER);</div><div class='add'>+	if (offset == 0) {</div><div class='add'>+		NFS_I(inode)-&gt;cache_validity &amp;= ~NFS_INO_INVALID_DATA;</div><div class='add'>+		nfs_ooo_clear(NFS_I(inode));</div><div class='add'>+	}</div><div class='ctx'> 	NFS_I(inode)-&gt;cache_validity &amp;= ~NFS_INO_INVALID_SIZE;</div><div class='ctx'> </div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	truncate_pagecache(inode, offset);</div><div class='add'>+	nfs_update_delegated_mtime_locked(inode);</div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> out:</div><div class='ctx'> 	return err;</div><div class='hunk'>@@ -715,8 +852,9 @@ void nfs_setattr_update_inode(struct inode *inode, struct iattr *attr,</div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	NFS_I(inode)-&gt;attr_gencount = fattr-&gt;gencount;</div><div class='ctx'> 	if ((attr-&gt;ia_valid &amp; ATTR_SIZE) != 0) {</div><div class='del'>-		nfs_set_cache_invalid(inode, NFS_INO_INVALID_MTIME |</div><div class='del'>-						     NFS_INO_INVALID_BLOCKS);</div><div class='add'>+		if (!nfs_have_delegated_mtime(inode))</div><div class='add'>+			nfs_set_cache_invalid(inode, NFS_INO_INVALID_MTIME);</div><div class='add'>+		nfs_set_cache_invalid(inode, NFS_INO_INVALID_BLOCKS);</div><div class='ctx'> 		nfs_inc_stats(inode, NFSIOS_SETATTRTRUNC);</div><div class='ctx'> 		nfs_vmtruncate(inode, attr-&gt;ia_size);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -725,9 +863,7 @@ void nfs_setattr_update_inode(struct inode *inode, struct iattr *attr,</div><div class='ctx'> 		if ((attr-&gt;ia_valid &amp; ATTR_KILL_SUID) != 0 &amp;&amp;</div><div class='ctx'> 		    inode-&gt;i_mode &amp; S_ISUID)</div><div class='ctx'> 			inode-&gt;i_mode &amp;= ~S_ISUID;</div><div class='del'>-		if ((attr-&gt;ia_valid &amp; ATTR_KILL_SGID) != 0 &amp;&amp;</div><div class='del'>-		    (inode-&gt;i_mode &amp; (S_ISGID | S_IXGRP)) ==</div><div class='del'>-		     (S_ISGID | S_IXGRP))</div><div class='add'>+		if (setattr_should_drop_sgid(&amp;nop_mnt_idmap, inode))</div><div class='ctx'> 			inode-&gt;i_mode &amp;= ~S_ISGID;</div><div class='ctx'> 		if ((attr-&gt;ia_valid &amp; ATTR_MODE) != 0) {</div><div class='ctx'> 			int mode = attr-&gt;ia_mode &amp; S_IALLUGO;</div><div class='hunk'>@@ -739,7 +875,7 @@ void nfs_setattr_update_inode(struct inode *inode, struct iattr *attr,</div><div class='ctx'> 		if ((attr-&gt;ia_valid &amp; ATTR_GID) != 0)</div><div class='ctx'> 			inode-&gt;i_gid = attr-&gt;ia_gid;</div><div class='ctx'> 		if (fattr-&gt;valid &amp; NFS_ATTR_FATTR_CTIME)</div><div class='del'>-			inode-&gt;i_ctime = fattr-&gt;ctime;</div><div class='add'>+			inode_set_ctime_to_ts(inode, fattr-&gt;ctime);</div><div class='ctx'> 		else</div><div class='ctx'> 			nfs_set_cache_invalid(inode, NFS_INO_INVALID_CHANGE</div><div class='ctx'> 					| NFS_INO_INVALID_CTIME);</div><div class='hunk'>@@ -750,14 +886,14 @@ void nfs_setattr_update_inode(struct inode *inode, struct iattr *attr,</div><div class='ctx'> 		NFS_I(inode)-&gt;cache_validity &amp;= ~(NFS_INO_INVALID_ATIME</div><div class='ctx'> 				| NFS_INO_INVALID_CTIME);</div><div class='ctx'> 		if (fattr-&gt;valid &amp; NFS_ATTR_FATTR_ATIME)</div><div class='del'>-			inode-&gt;i_atime = fattr-&gt;atime;</div><div class='add'>+			inode_set_atime_to_ts(inode, fattr-&gt;atime);</div><div class='ctx'> 		else if (attr-&gt;ia_valid &amp; ATTR_ATIME_SET)</div><div class='del'>-			inode-&gt;i_atime = attr-&gt;ia_atime;</div><div class='add'>+			inode_set_atime_to_ts(inode, attr-&gt;ia_atime);</div><div class='ctx'> 		else</div><div class='ctx'> 			nfs_set_cache_invalid(inode, NFS_INO_INVALID_ATIME);</div><div class='ctx'> </div><div class='ctx'> 		if (fattr-&gt;valid &amp; NFS_ATTR_FATTR_CTIME)</div><div class='del'>-			inode-&gt;i_ctime = fattr-&gt;ctime;</div><div class='add'>+			inode_set_ctime_to_ts(inode, fattr-&gt;ctime);</div><div class='ctx'> 		else</div><div class='ctx'> 			nfs_set_cache_invalid(inode, NFS_INO_INVALID_CHANGE</div><div class='ctx'> 					| NFS_INO_INVALID_CTIME);</div><div class='hunk'>@@ -766,14 +902,14 @@ void nfs_setattr_update_inode(struct inode *inode, struct iattr *attr,</div><div class='ctx'> 		NFS_I(inode)-&gt;cache_validity &amp;= ~(NFS_INO_INVALID_MTIME</div><div class='ctx'> 				| NFS_INO_INVALID_CTIME);</div><div class='ctx'> 		if (fattr-&gt;valid &amp; NFS_ATTR_FATTR_MTIME)</div><div class='del'>-			inode-&gt;i_mtime = fattr-&gt;mtime;</div><div class='add'>+			inode_set_mtime_to_ts(inode, fattr-&gt;mtime);</div><div class='ctx'> 		else if (attr-&gt;ia_valid &amp; ATTR_MTIME_SET)</div><div class='del'>-			inode-&gt;i_mtime = attr-&gt;ia_mtime;</div><div class='add'>+			inode_set_mtime_to_ts(inode, attr-&gt;ia_mtime);</div><div class='ctx'> 		else</div><div class='ctx'> 			nfs_set_cache_invalid(inode, NFS_INO_INVALID_MTIME);</div><div class='ctx'> </div><div class='ctx'> 		if (fattr-&gt;valid &amp; NFS_ATTR_FATTR_CTIME)</div><div class='del'>-			inode-&gt;i_ctime = fattr-&gt;ctime;</div><div class='add'>+			inode_set_ctime_to_ts(inode, fattr-&gt;ctime);</div><div class='ctx'> 		else</div><div class='ctx'> 			nfs_set_cache_invalid(inode, NFS_INO_INVALID_CHANGE</div><div class='ctx'> 					| NFS_INO_INVALID_CTIME);</div><div class='hunk'>@@ -784,30 +920,37 @@ void nfs_setattr_update_inode(struct inode *inode, struct iattr *attr,</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_setattr_update_inode);</div><div class='ctx'> </div><div class='del'>-static void nfs_readdirplus_parent_cache_miss(struct dentry *dentry)</div><div class='add'>+/*</div><div class='add'>+ * Don't request help from readdirplus if the file is being written to,</div><div class='add'>+ * or if attribute caching is turned off</div><div class='add'>+ */</div><div class='add'>+static bool nfs_getattr_readdirplus_enable(const struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *parent;</div><div class='add'>+	return nfs_server_capable(inode, NFS_CAP_READDIRPLUS) &amp;&amp;</div><div class='add'>+	       !nfs_have_writebacks(inode) &amp;&amp; NFS_MAXATTRTIMEO(inode) &gt; 5 * HZ;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if (!nfs_server_capable(d_inode(dentry), NFS_CAP_READDIRPLUS))</div><div class='del'>-		return;</div><div class='del'>-	parent = dget_parent(dentry);</div><div class='del'>-	nfs_force_use_readdirplus(d_inode(parent));</div><div class='del'>-	dput(parent);</div><div class='add'>+static void nfs_readdirplus_parent_cache_miss(struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	if (!IS_ROOT(dentry)) {</div><div class='add'>+		struct dentry *parent = dget_parent(dentry);</div><div class='add'>+		nfs_readdir_record_entry_cache_miss(d_inode(parent));</div><div class='add'>+		dput(parent);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void nfs_readdirplus_parent_cache_hit(struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *parent;</div><div class='del'>-</div><div class='del'>-	if (!nfs_server_capable(d_inode(dentry), NFS_CAP_READDIRPLUS))</div><div class='del'>-		return;</div><div class='del'>-	parent = dget_parent(dentry);</div><div class='del'>-	nfs_advise_use_readdirplus(d_inode(parent));</div><div class='del'>-	dput(parent);</div><div class='add'>+	if (!IS_ROOT(dentry)) {</div><div class='add'>+		struct dentry *parent = dget_parent(dentry);</div><div class='add'>+		nfs_readdir_record_entry_cache_hit(d_inode(parent));</div><div class='add'>+		dput(parent);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static u32 nfs_get_valid_attrmask(struct inode *inode)</div><div class='ctx'> {</div><div class='add'>+	u64 fattr_valid = NFS_SERVER(inode)-&gt;fattr_valid;</div><div class='ctx'> 	unsigned long cache_validity = READ_ONCE(NFS_I(inode)-&gt;cache_validity);</div><div class='ctx'> 	u32 reply_mask = STATX_INO | STATX_TYPE;</div><div class='ctx'> </div><div class='hunk'>@@ -827,36 +970,49 @@ static u32 nfs_get_valid_attrmask(struct inode *inode)</div><div class='ctx'> 		reply_mask |= STATX_UID | STATX_GID;</div><div class='ctx'> 	if (!(cache_validity &amp; NFS_INO_INVALID_BLOCKS))</div><div class='ctx'> 		reply_mask |= STATX_BLOCKS;</div><div class='add'>+	if (!(cache_validity &amp; NFS_INO_INVALID_BTIME) &amp;&amp;</div><div class='add'>+	    (fattr_valid &amp; NFS_ATTR_FATTR_BTIME))</div><div class='add'>+		reply_mask |= STATX_BTIME;</div><div class='add'>+	if (!(cache_validity &amp; NFS_INO_INVALID_CHANGE))</div><div class='add'>+		reply_mask |= STATX_CHANGE_COOKIE;</div><div class='ctx'> 	return reply_mask;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int nfs_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='add'>+int nfs_getattr(struct mnt_idmap *idmap, const struct path *path,</div><div class='ctx'> 		struct kstat *stat, u32 request_mask, unsigned int query_flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(path-&gt;dentry);</div><div class='ctx'> 	struct nfs_server *server = NFS_SERVER(inode);</div><div class='add'>+	u64 fattr_valid = server-&gt;fattr_valid;</div><div class='ctx'> 	unsigned long cache_validity;</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> 	bool force_sync = query_flags &amp; AT_STATX_FORCE_SYNC;</div><div class='ctx'> 	bool do_update = false;</div><div class='add'>+	bool readdirplus_enabled = nfs_getattr_readdirplus_enable(inode);</div><div class='ctx'> </div><div class='ctx'> 	trace_nfs_getattr_enter(inode);</div><div class='ctx'> </div><div class='ctx'> 	request_mask &amp;= STATX_TYPE | STATX_MODE | STATX_NLINK | STATX_UID |</div><div class='ctx'> 			STATX_GID | STATX_ATIME | STATX_MTIME | STATX_CTIME |</div><div class='del'>-			STATX_INO | STATX_SIZE | STATX_BLOCKS;</div><div class='add'>+			STATX_INO | STATX_SIZE | STATX_BLOCKS | STATX_BTIME |</div><div class='add'>+			STATX_CHANGE_COOKIE;</div><div class='add'>+</div><div class='add'>+	if (!(fattr_valid &amp; NFS_ATTR_FATTR_BTIME))</div><div class='add'>+		request_mask &amp;= ~STATX_BTIME;</div><div class='ctx'> </div><div class='ctx'> 	if ((query_flags &amp; AT_STATX_DONT_SYNC) &amp;&amp; !force_sync) {</div><div class='del'>-		nfs_readdirplus_parent_cache_hit(path-&gt;dentry);</div><div class='add'>+		if (readdirplus_enabled)</div><div class='add'>+			nfs_readdirplus_parent_cache_hit(path-&gt;dentry);</div><div class='ctx'> 		goto out_no_revalidate;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Flush out writes to the server in order to update c/mtime.  */</div><div class='del'>-	if ((request_mask &amp; (STATX_CTIME|STATX_MTIME)) &amp;&amp;</div><div class='del'>-			S_ISREG(inode-&gt;i_mode)) {</div><div class='del'>-		err = filemap_write_and_wait(inode-&gt;i_mapping);</div><div class='del'>-		if (err)</div><div class='del'>-			goto out;</div><div class='add'>+	/* Flush out writes to the server in order to update c/mtime/version.  */</div><div class='add'>+	if ((request_mask &amp; (STATX_CTIME | STATX_MTIME | STATX_CHANGE_COOKIE)) &amp;&amp;</div><div class='add'>+	    S_ISREG(inode-&gt;i_mode)) {</div><div class='add'>+		if (nfs_have_delegated_mtime(inode))</div><div class='add'>+			filemap_fdatawrite(inode-&gt;i_mapping);</div><div class='add'>+		else</div><div class='add'>+			filemap_write_and_wait(inode-&gt;i_mapping);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -875,7 +1031,8 @@ int nfs_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='ctx'> 	/* Is the user requesting attributes that might need revalidation? */</div><div class='ctx'> 	if (!(request_mask &amp; (STATX_MODE|STATX_NLINK|STATX_ATIME|STATX_CTIME|</div><div class='ctx'> 					STATX_MTIME|STATX_UID|STATX_GID|</div><div class='del'>-					STATX_SIZE|STATX_BLOCKS)))</div><div class='add'>+					STATX_SIZE|STATX_BLOCKS|STATX_BTIME|</div><div class='add'>+					STATX_CHANGE_COOKIE)))</div><div class='ctx'> 		goto out_no_revalidate;</div><div class='ctx'> </div><div class='ctx'> 	/* Check whether the cached attributes are stale */</div><div class='hunk'>@@ -898,26 +1055,45 @@ int nfs_getattr(struct user_namespace *mnt_userns, const struct path *path,</div><div class='ctx'> 		do_update |= cache_validity &amp; NFS_INO_INVALID_OTHER;</div><div class='ctx'> 	if (request_mask &amp; STATX_BLOCKS)</div><div class='ctx'> 		do_update |= cache_validity &amp; NFS_INO_INVALID_BLOCKS;</div><div class='add'>+	if (request_mask &amp; STATX_BTIME)</div><div class='add'>+		do_update |= cache_validity &amp; NFS_INO_INVALID_BTIME;</div><div class='ctx'> </div><div class='ctx'> 	if (do_update) {</div><div class='del'>-		/* Update the attribute cache */</div><div class='del'>-		if (!(server-&gt;flags &amp; NFS_MOUNT_NOAC))</div><div class='add'>+		if (readdirplus_enabled)</div><div class='ctx'> 			nfs_readdirplus_parent_cache_miss(path-&gt;dentry);</div><div class='del'>-		else</div><div class='del'>-			nfs_readdirplus_parent_cache_hit(path-&gt;dentry);</div><div class='ctx'> 		err = __nfs_revalidate_inode(server, inode);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto out;</div><div class='del'>-	} else</div><div class='add'>+	} else if (readdirplus_enabled)</div><div class='ctx'> 		nfs_readdirplus_parent_cache_hit(path-&gt;dentry);</div><div class='ctx'> out_no_revalidate:</div><div class='ctx'> 	/* Only return attributes that were revalidated. */</div><div class='ctx'> 	stat-&gt;result_mask = nfs_get_valid_attrmask(inode) | request_mask;</div><div class='ctx'> </div><div class='del'>-	generic_fillattr(&amp;init_user_ns, inode, stat);</div><div class='add'>+	generic_fillattr(&amp;nop_mnt_idmap, request_mask, inode, stat);</div><div class='ctx'> 	stat-&gt;ino = nfs_compat_user_ino64(NFS_FILEID(inode));</div><div class='add'>+	stat-&gt;change_cookie = inode_peek_iversion_raw(inode);</div><div class='add'>+	stat-&gt;attributes_mask |= STATX_ATTR_CHANGE_MONOTONIC;</div><div class='add'>+	if (server-&gt;change_attr_type != NFS4_CHANGE_TYPE_IS_UNDEFINED)</div><div class='add'>+		stat-&gt;attributes |= STATX_ATTR_CHANGE_MONOTONIC;</div><div class='ctx'> 	if (S_ISDIR(inode-&gt;i_mode))</div><div class='ctx'> 		stat-&gt;blksize = NFS_SERVER(inode)-&gt;dtsize;</div><div class='add'>+	stat-&gt;btime = NFS_I(inode)-&gt;btime;</div><div class='add'>+</div><div class='add'>+	/* Special handling for STATX_DIOALIGN and STATX_DIO_READ_ALIGN</div><div class='add'>+	 * - NFS doesn't have DIO alignment constraints, avoid getting</div><div class='add'>+	 *   these DIO attrs from remote and just respond with most</div><div class='add'>+	 *   accommodating limits (so client will issue supported DIO).</div><div class='add'>+	 * - this is unintuitive, but the most coarse-grained</div><div class='add'>+	 *   dio_offset_align is the most accommodating.</div><div class='add'>+	 */</div><div class='add'>+	if ((request_mask &amp; (STATX_DIOALIGN | STATX_DIO_READ_ALIGN)) &amp;&amp;</div><div class='add'>+	    S_ISREG(inode-&gt;i_mode)) {</div><div class='add'>+		stat-&gt;result_mask |= STATX_DIOALIGN | STATX_DIO_READ_ALIGN;</div><div class='add'>+		stat-&gt;dio_mem_align = 4; /* 4-byte alignment */</div><div class='add'>+		stat-&gt;dio_offset_align = PAGE_SIZE;</div><div class='add'>+		stat-&gt;dio_read_offset_align = stat-&gt;dio_offset_align;</div><div class='add'>+	}</div><div class='ctx'> out:</div><div class='ctx'> 	trace_nfs_getattr_exit(inode, err);</div><div class='ctx'> 	return err;</div><div class='hunk'>@@ -954,7 +1130,7 @@ struct nfs_lock_context *nfs_get_lock_context(struct nfs_open_context *ctx)</div><div class='ctx'> 	res = __nfs_find_lock_context(ctx);</div><div class='ctx'> 	rcu_read_unlock();</div><div class='ctx'> 	if (res == NULL) {</div><div class='del'>-		new = kmalloc(sizeof(*new), GFP_KERNEL);</div><div class='add'>+		new = kmalloc(sizeof(*new), GFP_KERNEL_ACCOUNT);</div><div class='ctx'> 		if (new == NULL)</div><div class='ctx'> 			return ERR_PTR(-ENOMEM);</div><div class='ctx'> 		nfs_init_lock_context(new);</div><div class='hunk'>@@ -1010,7 +1186,7 @@ void nfs_close_context(struct nfs_open_context *ctx, int is_sync)</div><div class='ctx'> 	if (!is_sync)</div><div class='ctx'> 		return;</div><div class='ctx'> 	inode = d_inode(ctx-&gt;dentry);</div><div class='del'>-	if (NFS_PROTO(inode)-&gt;have_delegation(inode, FMODE_READ))</div><div class='add'>+	if (nfs_have_read_or_write_delegation(inode))</div><div class='ctx'> 		return;</div><div class='ctx'> 	nfsi = NFS_I(inode);</div><div class='ctx'> 	if (inode-&gt;i_mapping-&gt;nrpages == 0)</div><div class='hunk'>@@ -1032,7 +1208,7 @@ struct nfs_open_context *alloc_nfs_open_context(struct dentry *dentry,</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_open_context *ctx;</div><div class='ctx'> </div><div class='del'>-	ctx = kmalloc(sizeof(*ctx), GFP_KERNEL);</div><div class='add'>+	ctx = kmalloc(sizeof(*ctx), GFP_KERNEL_ACCOUNT);</div><div class='ctx'> 	if (!ctx)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> 	nfs_sb_active(dentry-&gt;d_sb);</div><div class='hunk'>@@ -1051,6 +1227,8 @@ struct nfs_open_context *alloc_nfs_open_context(struct dentry *dentry,</div><div class='ctx'> 	ctx-&gt;lock_context.open_context = ctx;</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;ctx-&gt;list);</div><div class='ctx'> 	ctx-&gt;mdsthreshold = NULL;</div><div class='add'>+	nfs_localio_file_init(&amp;ctx-&gt;nfl);</div><div class='add'>+</div><div class='ctx'> 	return ctx;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(alloc_nfs_open_context);</div><div class='hunk'>@@ -1082,6 +1260,7 @@ static void __put_nfs_open_context(struct nfs_open_context *ctx, int is_sync)</div><div class='ctx'> 	nfs_sb_deactive(sb);</div><div class='ctx'> 	put_rpccred(rcu_dereference_protected(ctx-&gt;ll_cred, 1));</div><div class='ctx'> 	kfree(ctx-&gt;mdsthreshold);</div><div class='add'>+	nfs_close_local_fh(&amp;ctx-&gt;nfl);</div><div class='ctx'> 	kfree_rcu(ctx, rcu_head);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1107,7 +1286,7 @@ void nfs_inode_attach_open_context(struct nfs_open_context *ctx)</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	if (list_empty(&amp;nfsi-&gt;open_files) &amp;&amp;</div><div class='del'>-	    (nfsi-&gt;cache_validity &amp; NFS_INO_DATA_INVAL_DEFER))</div><div class='add'>+	    nfs_ooo_test(nfsi))</div><div class='ctx'> 		nfs_set_cache_invalid(inode, NFS_INO_INVALID_DATA |</div><div class='ctx'> 						     NFS_INO_REVAL_FORCED);</div><div class='ctx'> 	list_add_tail_rcu(&amp;ctx-&gt;list, &amp;nfsi-&gt;open_files);</div><div class='hunk'>@@ -1174,7 +1353,8 @@ int nfs_open(struct inode *inode, struct file *filp)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_open_context *ctx;</div><div class='ctx'> </div><div class='del'>-	ctx = alloc_nfs_open_context(file_dentry(filp), filp-&gt;f_mode, filp);</div><div class='add'>+	ctx = alloc_nfs_open_context(file_dentry(filp),</div><div class='add'>+				     flags_to_mode(filp-&gt;f_flags), filp);</div><div class='ctx'> 	if (IS_ERR(ctx))</div><div class='ctx'> 		return PTR_ERR(ctx);</div><div class='ctx'> 	nfs_file_set_open_context(filp, ctx);</div><div class='hunk'>@@ -1182,7 +1362,6 @@ int nfs_open(struct inode *inode, struct file *filp)</div><div class='ctx'> 	nfs_fscache_open_file(inode, filp);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL_GPL(nfs_open);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * This function is called whenever some part of NFS notices that</div><div class='hunk'>@@ -1288,6 +1467,7 @@ static int nfs_invalidate_mapping(struct inode *inode, struct address_space *map</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='add'>+	nfs_fscache_invalidate(inode, 0);</div><div class='ctx'> 	if (mapping-&gt;nrpages != 0) {</div><div class='ctx'> 		if (S_ISREG(inode-&gt;i_mode)) {</div><div class='ctx'> 			ret = nfs_sync_mapping(mapping);</div><div class='hunk'>@@ -1299,7 +1479,6 @@ static int nfs_invalidate_mapping(struct inode *inode, struct address_space *map</div><div class='ctx'> 			return ret;</div><div class='ctx'> 	}</div><div class='ctx'> 	nfs_inc_stats(inode, NFSIOS_DATAINVALIDATE);</div><div class='del'>-	nfs_fscache_wait_on_invalidate(inode);</div><div class='ctx'> </div><div class='ctx'> 	dfprintk(PAGECACHE, "NFS: (%s/%Lu) data cache invalidated\n",</div><div class='ctx'> 			inode-&gt;i_sb-&gt;s_id,</div><div class='hunk'>@@ -1334,9 +1513,17 @@ int nfs_clear_invalid_mapping(struct address_space *mapping)</div><div class='ctx'> 	 */</div><div class='ctx'> 	for (;;) {</div><div class='ctx'> 		ret = wait_on_bit_action(bitlock, NFS_INO_INVALIDATING,</div><div class='del'>-					 nfs_wait_bit_killable, TASK_KILLABLE);</div><div class='add'>+					 nfs_wait_bit_killable,</div><div class='add'>+					 TASK_KILLABLE|TASK_FREEZABLE_UNSAFE);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto out;</div><div class='add'>+		smp_rmb(); /* pairs with smp_wmb() below */</div><div class='add'>+		if (test_bit(NFS_INO_INVALIDATING, bitlock))</div><div class='add'>+			continue;</div><div class='add'>+		/* pairs with nfs_set_cache_invalid()'s smp_store_release() */</div><div class='add'>+		if (!(smp_load_acquire(&amp;nfsi-&gt;cache_validity) &amp; NFS_INO_INVALID_DATA))</div><div class='add'>+			goto out;</div><div class='add'>+		/* Slow-path that double-checks with spinlock held */</div><div class='ctx'> 		spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 		if (test_bit(NFS_INO_INVALIDATING, bitlock)) {</div><div class='ctx'> 			spin_unlock(&amp;inode-&gt;i_lock);</div><div class='hunk'>@@ -1350,8 +1537,8 @@ int nfs_clear_invalid_mapping(struct address_space *mapping)</div><div class='ctx'> </div><div class='ctx'> 	set_bit(NFS_INO_INVALIDATING, bitlock);</div><div class='ctx'> 	smp_wmb();</div><div class='del'>-	nfsi-&gt;cache_validity &amp;=</div><div class='del'>-		~(NFS_INO_INVALID_DATA | NFS_INO_DATA_INVAL_DEFER);</div><div class='add'>+	nfsi-&gt;cache_validity &amp;= ~NFS_INO_INVALID_DATA;</div><div class='add'>+	nfs_ooo_clear(nfsi);</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	trace_nfs_invalidate_mapping_enter(inode);</div><div class='ctx'> 	ret = nfs_invalidate_mapping(inode, mapping);</div><div class='hunk'>@@ -1441,18 +1628,18 @@ static void nfs_wcc_update_inode(struct inode *inode, struct nfs_fattr *fattr)</div><div class='ctx'> 			nfs_set_cache_invalid(inode, NFS_INO_INVALID_XATTR);</div><div class='ctx'> 	}</div><div class='ctx'> 	/* If we have atomic WCC data, we may update some attributes */</div><div class='del'>-	ts = inode-&gt;i_ctime;</div><div class='add'>+	ts = inode_get_ctime(inode);</div><div class='ctx'> 	if ((fattr-&gt;valid &amp; NFS_ATTR_FATTR_PRECTIME)</div><div class='ctx'> 			&amp;&amp; (fattr-&gt;valid &amp; NFS_ATTR_FATTR_CTIME)</div><div class='ctx'> 			&amp;&amp; timespec64_equal(&amp;ts, &amp;fattr-&gt;pre_ctime)) {</div><div class='del'>-		inode-&gt;i_ctime = fattr-&gt;ctime;</div><div class='add'>+		inode_set_ctime_to_ts(inode, fattr-&gt;ctime);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ts = inode-&gt;i_mtime;</div><div class='add'>+	ts = inode_get_mtime(inode);</div><div class='ctx'> 	if ((fattr-&gt;valid &amp; NFS_ATTR_FATTR_PREMTIME)</div><div class='ctx'> 			&amp;&amp; (fattr-&gt;valid &amp; NFS_ATTR_FATTR_MTIME)</div><div class='ctx'> 			&amp;&amp; timespec64_equal(&amp;ts, &amp;fattr-&gt;pre_mtime)) {</div><div class='del'>-		inode-&gt;i_mtime = fattr-&gt;mtime;</div><div class='add'>+		inode_set_mtime_to_ts(inode, fattr-&gt;mtime);</div><div class='ctx'> 	}</div><div class='ctx'> 	if ((fattr-&gt;valid &amp; NFS_ATTR_FATTR_PRESIZE)</div><div class='ctx'> 			&amp;&amp; (fattr-&gt;valid &amp; NFS_ATTR_FATTR_SIZE)</div><div class='hunk'>@@ -1479,7 +1666,7 @@ static int nfs_check_inode_attributes(struct inode *inode, struct nfs_fattr *fat</div><div class='ctx'> 	unsigned long invalid = 0;</div><div class='ctx'> 	struct timespec64 ts;</div><div class='ctx'> </div><div class='del'>-	if (NFS_PROTO(inode)-&gt;have_delegation(inode, FMODE_READ))</div><div class='add'>+	if (nfs_have_delegated_attributes(inode))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	if (!(fattr-&gt;valid &amp; NFS_ATTR_FATTR_FILEID)) {</div><div class='hunk'>@@ -1503,11 +1690,11 @@ static int nfs_check_inode_attributes(struct inode *inode, struct nfs_fattr *fat</div><div class='ctx'> 		if ((fattr-&gt;valid &amp; NFS_ATTR_FATTR_CHANGE) != 0 &amp;&amp; !inode_eq_iversion_raw(inode, fattr-&gt;change_attr))</div><div class='ctx'> 			invalid |= NFS_INO_INVALID_CHANGE;</div><div class='ctx'> </div><div class='del'>-		ts = inode-&gt;i_mtime;</div><div class='add'>+		ts = inode_get_mtime(inode);</div><div class='ctx'> 		if ((fattr-&gt;valid &amp; NFS_ATTR_FATTR_MTIME) &amp;&amp; !timespec64_equal(&amp;ts, &amp;fattr-&gt;mtime))</div><div class='ctx'> 			invalid |= NFS_INO_INVALID_MTIME;</div><div class='ctx'> </div><div class='del'>-		ts = inode-&gt;i_ctime;</div><div class='add'>+		ts = inode_get_ctime(inode);</div><div class='ctx'> 		if ((fattr-&gt;valid &amp; NFS_ATTR_FATTR_CTIME) &amp;&amp; !timespec64_equal(&amp;ts, &amp;fattr-&gt;ctime))</div><div class='ctx'> 			invalid |= NFS_INO_INVALID_CTIME;</div><div class='ctx'> </div><div class='hunk'>@@ -1531,7 +1718,7 @@ static int nfs_check_inode_attributes(struct inode *inode, struct nfs_fattr *fat</div><div class='ctx'> 	if ((fattr-&gt;valid &amp; NFS_ATTR_FATTR_NLINK) &amp;&amp; inode-&gt;i_nlink != fattr-&gt;nlink)</div><div class='ctx'> 		invalid |= NFS_INO_INVALID_NLINK;</div><div class='ctx'> </div><div class='del'>-	ts = inode-&gt;i_atime;</div><div class='add'>+	ts = inode_get_atime(inode);</div><div class='ctx'> 	if ((fattr-&gt;valid &amp; NFS_ATTR_FATTR_ATIME) &amp;&amp; !timespec64_equal(&amp;ts, &amp;fattr-&gt;atime))</div><div class='ctx'> 		invalid |= NFS_INO_INVALID_ATIME;</div><div class='ctx'> </div><div class='hunk'>@@ -1562,6 +1749,7 @@ void nfs_fattr_init(struct nfs_fattr *fattr)</div><div class='ctx'> 	fattr-&gt;gencount = nfs_inc_attr_generation_counter();</div><div class='ctx'> 	fattr-&gt;owner_name = NULL;</div><div class='ctx'> 	fattr-&gt;group_name = NULL;</div><div class='add'>+	fattr-&gt;mdsthreshold = NULL;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_fattr_init);</div><div class='ctx'> </div><div class='hunk'>@@ -1585,7 +1773,7 @@ struct nfs_fattr *nfs_alloc_fattr(void)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_fattr *fattr;</div><div class='ctx'> </div><div class='del'>-	fattr = kmalloc(sizeof(*fattr), GFP_NOFS);</div><div class='add'>+	fattr = kmalloc(sizeof(*fattr), GFP_KERNEL);</div><div class='ctx'> 	if (fattr != NULL) {</div><div class='ctx'> 		nfs_fattr_init(fattr);</div><div class='ctx'> 		fattr-&gt;label = NULL;</div><div class='hunk'>@@ -1601,7 +1789,7 @@ struct nfs_fattr *nfs_alloc_fattr_with_label(struct nfs_server *server)</div><div class='ctx'> 	if (!fattr)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='del'>-	fattr-&gt;label = nfs4_label_alloc(server, GFP_NOFS);</div><div class='add'>+	fattr-&gt;label = nfs4_label_alloc(server, GFP_KERNEL);</div><div class='ctx'> 	if (IS_ERR(fattr-&gt;label)) {</div><div class='ctx'> 		kfree(fattr);</div><div class='ctx'> 		return NULL;</div><div class='hunk'>@@ -1615,7 +1803,7 @@ struct nfs_fh *nfs_alloc_fhandle(void)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_fh *fh;</div><div class='ctx'> </div><div class='del'>-	fh = kmalloc(sizeof(struct nfs_fh), GFP_NOFS);</div><div class='add'>+	fh = kmalloc(sizeof(struct nfs_fh), GFP_KERNEL);</div><div class='ctx'> 	if (fh != NULL)</div><div class='ctx'> 		fh-&gt;size = 0;</div><div class='ctx'> 	return fh;</div><div class='hunk'>@@ -1800,7 +1988,7 @@ static int nfs_inode_finish_partial_attr_update(const struct nfs_fattr *fattr,</div><div class='ctx'> 		NFS_INO_INVALID_ATIME | NFS_INO_INVALID_CTIME |</div><div class='ctx'> 		NFS_INO_INVALID_MTIME | NFS_INO_INVALID_SIZE |</div><div class='ctx'> 		NFS_INO_INVALID_BLOCKS | NFS_INO_INVALID_OTHER |</div><div class='del'>-		NFS_INO_INVALID_NLINK;</div><div class='add'>+		NFS_INO_INVALID_NLINK | NFS_INO_INVALID_BTIME;</div><div class='ctx'> 	unsigned long cache_validity = NFS_I(inode)-&gt;cache_validity;</div><div class='ctx'> 	enum nfs4_change_attr_type ctype = NFS_SERVER(inode)-&gt;change_attr_type;</div><div class='ctx'> </div><div class='hunk'>@@ -1813,6 +2001,66 @@ static int nfs_inode_finish_partial_attr_update(const struct nfs_fattr *fattr,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void nfs_ooo_merge(struct nfs_inode *nfsi,</div><div class='add'>+			  u64 start, u64 end)</div><div class='add'>+{</div><div class='add'>+	int i, cnt;</div><div class='add'>+</div><div class='add'>+	if (nfsi-&gt;cache_validity &amp; NFS_INO_DATA_INVAL_DEFER)</div><div class='add'>+		/* No point merging anything */</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (!nfsi-&gt;ooo) {</div><div class='add'>+		nfsi-&gt;ooo = kmalloc(sizeof(*nfsi-&gt;ooo), GFP_ATOMIC);</div><div class='add'>+		if (!nfsi-&gt;ooo) {</div><div class='add'>+			nfsi-&gt;cache_validity |= NFS_INO_DATA_INVAL_DEFER;</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+		nfsi-&gt;ooo-&gt;cnt = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* add this range, merging if possible */</div><div class='add'>+	cnt = nfsi-&gt;ooo-&gt;cnt;</div><div class='add'>+	for (i = 0; i &lt; cnt; i++) {</div><div class='add'>+		if (end == nfsi-&gt;ooo-&gt;gap[i].start)</div><div class='add'>+			end = nfsi-&gt;ooo-&gt;gap[i].end;</div><div class='add'>+		else if (start == nfsi-&gt;ooo-&gt;gap[i].end)</div><div class='add'>+			start = nfsi-&gt;ooo-&gt;gap[i].start;</div><div class='add'>+		else</div><div class='add'>+			continue;</div><div class='add'>+		/* Remove 'i' from table and loop to insert the new range */</div><div class='add'>+		cnt -= 1;</div><div class='add'>+		nfsi-&gt;ooo-&gt;gap[i] = nfsi-&gt;ooo-&gt;gap[cnt];</div><div class='add'>+		i = -1;</div><div class='add'>+	}</div><div class='add'>+	if (start != end) {</div><div class='add'>+		if (cnt &gt;= ARRAY_SIZE(nfsi-&gt;ooo-&gt;gap)) {</div><div class='add'>+			nfsi-&gt;cache_validity |= NFS_INO_DATA_INVAL_DEFER;</div><div class='add'>+			kfree(nfsi-&gt;ooo);</div><div class='add'>+			nfsi-&gt;ooo = NULL;</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+		nfsi-&gt;ooo-&gt;gap[cnt].start = start;</div><div class='add'>+		nfsi-&gt;ooo-&gt;gap[cnt].end = end;</div><div class='add'>+		cnt += 1;</div><div class='add'>+	}</div><div class='add'>+	nfsi-&gt;ooo-&gt;cnt = cnt;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfs_ooo_record(struct nfs_inode *nfsi,</div><div class='add'>+			   struct nfs_fattr *fattr)</div><div class='add'>+{</div><div class='add'>+	/* This reply was out-of-order, so record in the</div><div class='add'>+	 * pre/post change id, possibly cancelling</div><div class='add'>+	 * gaps created when iversion was jumpped forward.</div><div class='add'>+	 */</div><div class='add'>+	if ((fattr-&gt;valid &amp; NFS_ATTR_FATTR_CHANGE) &amp;&amp;</div><div class='add'>+	    (fattr-&gt;valid &amp; NFS_ATTR_FATTR_PRECHANGE))</div><div class='add'>+		nfs_ooo_merge(nfsi,</div><div class='add'>+			      fattr-&gt;change_attr,</div><div class='add'>+			      fattr-&gt;pre_change_attr);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int nfs_refresh_inode_locked(struct inode *inode,</div><div class='ctx'> 				    struct nfs_fattr *fattr)</div><div class='ctx'> {</div><div class='hunk'>@@ -1823,8 +2071,12 @@ static int nfs_refresh_inode_locked(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> 	if (attr_cmp &gt; 0 || nfs_inode_finish_partial_attr_update(fattr, inode))</div><div class='ctx'> 		ret = nfs_update_inode(inode, fattr);</div><div class='del'>-	else if (attr_cmp == 0)</div><div class='del'>-		ret = nfs_check_inode_attributes(inode, fattr);</div><div class='add'>+	else {</div><div class='add'>+		nfs_ooo_record(NFS_I(inode), fattr);</div><div class='add'>+</div><div class='add'>+		if (attr_cmp == 0)</div><div class='add'>+			ret = nfs_check_inode_attributes(inode, fattr);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	trace_nfs_refresh_inode_exit(inode, ret);</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -1915,6 +2167,8 @@ int nfs_post_op_update_inode_force_wcc_locked(struct inode *inode, struct nfs_fa</div><div class='ctx'> 	if (attr_cmp &lt; 0)</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	if ((fattr-&gt;valid &amp; NFS_ATTR_FATTR) == 0 || !attr_cmp) {</div><div class='add'>+		/* Record the pre/post change info before clearing PRECHANGE */</div><div class='add'>+		nfs_ooo_record(NFS_I(inode), fattr);</div><div class='ctx'> 		fattr-&gt;valid &amp;= ~(NFS_ATTR_FATTR_PRECHANGE</div><div class='ctx'> 				| NFS_ATTR_FATTR_PRESIZE</div><div class='ctx'> 				| NFS_ATTR_FATTR_PREMTIME</div><div class='hunk'>@@ -1928,12 +2182,12 @@ int nfs_post_op_update_inode_force_wcc_locked(struct inode *inode, struct nfs_fa</div><div class='ctx'> 	}</div><div class='ctx'> 	if ((fattr-&gt;valid &amp; NFS_ATTR_FATTR_CTIME) != 0 &amp;&amp;</div><div class='ctx'> 			(fattr-&gt;valid &amp; NFS_ATTR_FATTR_PRECTIME) == 0) {</div><div class='del'>-		fattr-&gt;pre_ctime = inode-&gt;i_ctime;</div><div class='add'>+		fattr-&gt;pre_ctime = inode_get_ctime(inode);</div><div class='ctx'> 		fattr-&gt;valid |= NFS_ATTR_FATTR_PRECTIME;</div><div class='ctx'> 	}</div><div class='ctx'> 	if ((fattr-&gt;valid &amp; NFS_ATTR_FATTR_MTIME) != 0 &amp;&amp;</div><div class='ctx'> 			(fattr-&gt;valid &amp; NFS_ATTR_FATTR_PREMTIME) == 0) {</div><div class='del'>-		fattr-&gt;pre_mtime = inode-&gt;i_mtime;</div><div class='add'>+		fattr-&gt;pre_mtime = inode_get_mtime(inode);</div><div class='ctx'> 		fattr-&gt;valid |= NFS_ATTR_FATTR_PREMTIME;</div><div class='ctx'> 	}</div><div class='ctx'> 	if ((fattr-&gt;valid &amp; NFS_ATTR_FATTR_SIZE) != 0 &amp;&amp;</div><div class='hunk'>@@ -2000,10 +2254,10 @@ static int nfs_update_inode(struct inode *inode, struct nfs_fattr *fattr)</div><div class='ctx'> 	bool attr_changed = false;</div><div class='ctx'> 	bool have_delegation;</div><div class='ctx'> </div><div class='del'>-	dfprintk(VFS, "NFS: %s(%s/%lu fh_crc=0x%08x ct=%d info=0x%x)\n",</div><div class='add'>+	dfprintk(VFS, "NFS: %s(%s/%lu fh_crc=0x%08x ct=%d info=0x%llx)\n",</div><div class='ctx'> 			__func__, inode-&gt;i_sb-&gt;s_id, inode-&gt;i_ino,</div><div class='ctx'> 			nfs_display_fhandle_hash(NFS_FH(inode)),</div><div class='del'>-			atomic_read(&amp;inode-&gt;i_count), fattr-&gt;valid);</div><div class='add'>+			icount_read(inode), fattr-&gt;valid);</div><div class='ctx'> </div><div class='ctx'> 	if (!(fattr-&gt;valid &amp; NFS_ATTR_FATTR_FILEID)) {</div><div class='ctx'> 		/* Only a mounted-on-fileid? Just exit */</div><div class='hunk'>@@ -2049,6 +2303,9 @@ static int nfs_update_inode(struct inode *inode, struct nfs_fattr *fattr)</div><div class='ctx'> 	 */</div><div class='ctx'> 	nfsi-&gt;read_cache_jiffies = fattr-&gt;time_start;</div><div class='ctx'> </div><div class='add'>+	/* Fix up any delegated attributes in the struct nfs_fattr */</div><div class='add'>+	nfs_fattr_fixup_delegated(inode, fattr);</div><div class='add'>+</div><div class='ctx'> 	save_cache_validity = nfsi-&gt;cache_validity;</div><div class='ctx'> 	nfsi-&gt;cache_validity &amp;= ~(NFS_INO_INVALID_ATTR</div><div class='ctx'> 			| NFS_INO_INVALID_ATIME</div><div class='hunk'>@@ -2069,6 +2326,15 @@ static int nfs_update_inode(struct inode *inode, struct nfs_fattr *fattr)</div><div class='ctx'> </div><div class='ctx'> 	/* More cache consistency checks */</div><div class='ctx'> 	if (fattr-&gt;valid &amp; NFS_ATTR_FATTR_CHANGE) {</div><div class='add'>+		if (!have_writers &amp;&amp; nfsi-&gt;ooo &amp;&amp; nfsi-&gt;ooo-&gt;cnt == 1 &amp;&amp;</div><div class='add'>+		    nfsi-&gt;ooo-&gt;gap[0].end == inode_peek_iversion_raw(inode)) {</div><div class='add'>+			/* There is one remaining gap that hasn't been</div><div class='add'>+			 * merged into iversion - do that now.</div><div class='add'>+			 */</div><div class='add'>+			inode_set_iversion_raw(inode, nfsi-&gt;ooo-&gt;gap[0].start);</div><div class='add'>+			kfree(nfsi-&gt;ooo);</div><div class='add'>+			nfsi-&gt;ooo = NULL;</div><div class='add'>+		}</div><div class='ctx'> 		if (!inode_eq_iversion_raw(inode, fattr-&gt;change_attr)) {</div><div class='ctx'> 			/* Could it be a race with writeback? */</div><div class='ctx'> 			if (!(have_writers || have_delegation)) {</div><div class='hunk'>@@ -2083,15 +2349,19 @@ static int nfs_update_inode(struct inode *inode, struct nfs_fattr *fattr)</div><div class='ctx'> 					| NFS_INO_INVALID_BLOCKS</div><div class='ctx'> 					| NFS_INO_INVALID_NLINK</div><div class='ctx'> 					| NFS_INO_INVALID_MODE</div><div class='del'>-					| NFS_INO_INVALID_OTHER;</div><div class='add'>+					| NFS_INO_INVALID_OTHER</div><div class='add'>+					| NFS_INO_INVALID_BTIME;</div><div class='ctx'> 				if (S_ISDIR(inode-&gt;i_mode))</div><div class='ctx'> 					nfs_force_lookup_revalidate(inode);</div><div class='ctx'> 				attr_changed = true;</div><div class='ctx'> 				dprintk("NFS: change_attr change on server for file %s/%ld\n",</div><div class='ctx'> 						inode-&gt;i_sb-&gt;s_id,</div><div class='ctx'> 						inode-&gt;i_ino);</div><div class='del'>-			} else if (!have_delegation)</div><div class='del'>-				nfsi-&gt;cache_validity |= NFS_INO_DATA_INVAL_DEFER;</div><div class='add'>+			} else if (!have_delegation) {</div><div class='add'>+				nfs_ooo_record(nfsi, fattr);</div><div class='add'>+				nfs_ooo_merge(nfsi, inode_peek_iversion_raw(inode),</div><div class='add'>+					      fattr-&gt;change_attr);</div><div class='add'>+			}</div><div class='ctx'> 			inode_set_iversion_raw(inode, fattr-&gt;change_attr);</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -2103,17 +2373,23 @@ static int nfs_update_inode(struct inode *inode, struct nfs_fattr *fattr)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (fattr-&gt;valid &amp; NFS_ATTR_FATTR_MTIME)</div><div class='del'>-		inode-&gt;i_mtime = fattr-&gt;mtime;</div><div class='add'>+		inode_set_mtime_to_ts(inode, fattr-&gt;mtime);</div><div class='ctx'> 	else if (fattr_supported &amp; NFS_ATTR_FATTR_MTIME)</div><div class='ctx'> 		nfsi-&gt;cache_validity |=</div><div class='ctx'> 			save_cache_validity &amp; NFS_INO_INVALID_MTIME;</div><div class='ctx'> </div><div class='ctx'> 	if (fattr-&gt;valid &amp; NFS_ATTR_FATTR_CTIME)</div><div class='del'>-		inode-&gt;i_ctime = fattr-&gt;ctime;</div><div class='add'>+		inode_set_ctime_to_ts(inode, fattr-&gt;ctime);</div><div class='ctx'> 	else if (fattr_supported &amp; NFS_ATTR_FATTR_CTIME)</div><div class='ctx'> 		nfsi-&gt;cache_validity |=</div><div class='ctx'> 			save_cache_validity &amp; NFS_INO_INVALID_CTIME;</div><div class='ctx'> </div><div class='add'>+	if (fattr-&gt;valid &amp; NFS_ATTR_FATTR_BTIME)</div><div class='add'>+		nfsi-&gt;btime = fattr-&gt;btime;</div><div class='add'>+	else if (fattr_supported &amp; NFS_ATTR_FATTR_BTIME)</div><div class='add'>+		nfsi-&gt;cache_validity |=</div><div class='add'>+			save_cache_validity &amp; NFS_INO_INVALID_BTIME;</div><div class='add'>+</div><div class='ctx'> 	/* Check if our cached file size is stale */</div><div class='ctx'> 	if (fattr-&gt;valid &amp; NFS_ATTR_FATTR_SIZE) {</div><div class='ctx'> 		new_isize = nfs_size_to_loff_t(fattr-&gt;size);</div><div class='hunk'>@@ -2139,7 +2415,7 @@ static int nfs_update_inode(struct inode *inode, struct nfs_fattr *fattr)</div><div class='ctx'> 			save_cache_validity &amp; NFS_INO_INVALID_SIZE;</div><div class='ctx'> </div><div class='ctx'> 	if (fattr-&gt;valid &amp; NFS_ATTR_FATTR_ATIME)</div><div class='del'>-		inode-&gt;i_atime = fattr-&gt;atime;</div><div class='add'>+		inode_set_atime_to_ts(inode, fattr-&gt;atime);</div><div class='ctx'> 	else if (fattr_supported &amp; NFS_ATTR_FATTR_ATIME)</div><div class='ctx'> 		nfsi-&gt;cache_validity |=</div><div class='ctx'> 			save_cache_validity &amp; NFS_INO_INVALID_ATIME;</div><div class='hunk'>@@ -2240,23 +2516,27 @@ static int nfs_update_inode(struct inode *inode, struct nfs_fattr *fattr)</div><div class='ctx'> struct inode *nfs_alloc_inode(struct super_block *sb)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_inode *nfsi;</div><div class='del'>-	nfsi = kmem_cache_alloc(nfs_inode_cachep, GFP_KERNEL);</div><div class='add'>+	nfsi = alloc_inode_sb(sb, nfs_inode_cachep, GFP_KERNEL);</div><div class='ctx'> 	if (!nfsi)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	nfsi-&gt;flags = 0UL;</div><div class='ctx'> 	nfsi-&gt;cache_validity = 0UL;</div><div class='add'>+	nfsi-&gt;ooo = NULL;</div><div class='ctx'> #if IS_ENABLED(CONFIG_NFS_V4)</div><div class='ctx'> 	nfsi-&gt;nfs4_acl = NULL;</div><div class='ctx'> #endif /* CONFIG_NFS_V4 */</div><div class='ctx'> #ifdef CONFIG_NFS_V4_2</div><div class='ctx'> 	nfsi-&gt;xattr_cache = NULL;</div><div class='ctx'> #endif</div><div class='add'>+	nfs_netfs_inode_init(nfsi);</div><div class='add'>+</div><div class='ctx'> 	return &amp;nfsi-&gt;vfs_inode;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_alloc_inode);</div><div class='ctx'> </div><div class='ctx'> void nfs_free_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='add'>+	kfree(NFS_I(inode)-&gt;ooo);</div><div class='ctx'> 	kmem_cache_free(nfs_inode_cachep, NFS_I(inode));</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_free_inode);</div><div class='hunk'>@@ -2273,7 +2553,7 @@ static inline void nfs4_init_once(struct nfs_inode *nfsi)</div><div class='ctx'> </div><div class='ctx'> static void init_once(void *foo)</div><div class='ctx'> {</div><div class='del'>-	struct nfs_inode *nfsi = (struct nfs_inode *) foo;</div><div class='add'>+	struct nfs_inode *nfsi = foo;</div><div class='ctx'> </div><div class='ctx'> 	inode_init_once(&amp;nfsi-&gt;vfs_inode);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;nfsi-&gt;open_files);</div><div class='hunk'>@@ -2287,7 +2567,7 @@ static int __init nfs_init_inodecache(void)</div><div class='ctx'> 	nfs_inode_cachep = kmem_cache_create("nfs_inode_cache",</div><div class='ctx'> 					     sizeof(struct nfs_inode),</div><div class='ctx'> 					     0, (SLAB_RECLAIM_ACCOUNT|</div><div class='del'>-						SLAB_MEM_SPREAD|SLAB_ACCOUNT),</div><div class='add'>+						SLAB_ACCOUNT),</div><div class='ctx'> 					     init_once);</div><div class='ctx'> 	if (nfs_inode_cachep == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='hunk'>@@ -2305,35 +2585,54 @@ static void nfs_destroy_inodecache(void)</div><div class='ctx'> 	kmem_cache_destroy(nfs_inode_cachep);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+struct workqueue_struct *nfslocaliod_workqueue;</div><div class='ctx'> struct workqueue_struct *nfsiod_workqueue;</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfsiod_workqueue);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * start up the nfsiod workqueue</div><div class='add'>+ * Destroy the nfsiod workqueues</div><div class='ctx'>  */</div><div class='del'>-static int nfsiod_start(void)</div><div class='add'>+static void nfsiod_stop(void)</div><div class='ctx'> {</div><div class='ctx'> 	struct workqueue_struct *wq;</div><div class='del'>-	dprintk("RPC:       creating workqueue nfsiod\n");</div><div class='del'>-	wq = alloc_workqueue("nfsiod", WQ_MEM_RECLAIM | WQ_UNBOUND, 0);</div><div class='del'>-	if (wq == NULL)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	nfsiod_workqueue = wq;</div><div class='del'>-	return 0;</div><div class='add'>+</div><div class='add'>+	wq = nfsiod_workqueue;</div><div class='add'>+	if (wq != NULL) {</div><div class='add'>+		nfsiod_workqueue = NULL;</div><div class='add'>+		destroy_workqueue(wq);</div><div class='add'>+	}</div><div class='add'>+#if IS_ENABLED(CONFIG_NFS_LOCALIO)</div><div class='add'>+	wq = nfslocaliod_workqueue;</div><div class='add'>+	if (wq != NULL) {</div><div class='add'>+		nfslocaliod_workqueue = NULL;</div><div class='add'>+		destroy_workqueue(wq);</div><div class='add'>+	}</div><div class='add'>+#endif /* CONFIG_NFS_LOCALIO */</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Destroy the nfsiod workqueue</div><div class='add'>+ * Start the nfsiod workqueues</div><div class='ctx'>  */</div><div class='del'>-static void nfsiod_stop(void)</div><div class='add'>+static int nfsiod_start(void)</div><div class='ctx'> {</div><div class='del'>-	struct workqueue_struct *wq;</div><div class='del'>-</div><div class='del'>-	wq = nfsiod_workqueue;</div><div class='del'>-	if (wq == NULL)</div><div class='del'>-		return;</div><div class='del'>-	nfsiod_workqueue = NULL;</div><div class='del'>-	destroy_workqueue(wq);</div><div class='add'>+	dprintk("RPC:       creating workqueue nfsiod\n");</div><div class='add'>+	nfsiod_workqueue = alloc_workqueue("nfsiod", WQ_MEM_RECLAIM | WQ_UNBOUND, 0);</div><div class='add'>+	if (nfsiod_workqueue == NULL)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+#if IS_ENABLED(CONFIG_NFS_LOCALIO)</div><div class='add'>+	/*</div><div class='add'>+	 * localio writes need to use a normal (non-memreclaim) workqueue.</div><div class='add'>+	 * When we start getting low on space, XFS goes and calls flush_work() on</div><div class='add'>+	 * a non-memreclaim work queue, which causes a priority inversion problem.</div><div class='add'>+	 */</div><div class='add'>+	dprintk("RPC:       creating workqueue nfslocaliod\n");</div><div class='add'>+	nfslocaliod_workqueue = alloc_workqueue("nfslocaliod", WQ_UNBOUND, 0);</div><div class='add'>+	if (unlikely(nfslocaliod_workqueue == NULL)) {</div><div class='add'>+		nfsiod_stop();</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+#endif /* CONFIG_NFS_LOCALIO */</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> unsigned int nfs_net_id;</div><div class='hunk'>@@ -2341,12 +2640,32 @@ EXPORT_SYMBOL_GPL(nfs_net_id);</div><div class='ctx'> </div><div class='ctx'> static int nfs_net_init(struct net *net)</div><div class='ctx'> {</div><div class='add'>+	struct nfs_net *nn = net_generic(net, nfs_net_id);</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='ctx'> 	nfs_clients_init(net);</div><div class='del'>-	return nfs_fs_proc_net_init(net);</div><div class='add'>+</div><div class='add'>+	if (!rpc_proc_register(net, &amp;nn-&gt;rpcstats)) {</div><div class='add'>+		err = -ENOMEM;</div><div class='add'>+		goto err_proc_rpc;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	err = nfs_fs_proc_net_init(net);</div><div class='add'>+	if (err)</div><div class='add'>+		goto err_proc_nfs;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='add'>+err_proc_nfs:</div><div class='add'>+	rpc_proc_unregister(net, "nfs");</div><div class='add'>+err_proc_rpc:</div><div class='add'>+	nfs_clients_exit(net);</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void nfs_net_exit(struct net *net)</div><div class='ctx'> {</div><div class='add'>+	rpc_proc_unregister(net, "nfs");</div><div class='ctx'> 	nfs_fs_proc_net_exit(net);</div><div class='ctx'> 	nfs_clients_exit(net);</div><div class='ctx'> }</div><div class='hunk'>@@ -2358,6 +2677,35 @@ static struct pernet_operations nfs_net_ops = {</div><div class='ctx'> 	.size = sizeof(struct nfs_net),</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_KEYS</div><div class='add'>+static struct key *nfs_keyring;</div><div class='add'>+</div><div class='add'>+static int __init nfs_init_keyring(void)</div><div class='add'>+{</div><div class='add'>+	nfs_keyring = keyring_alloc(".nfs",</div><div class='add'>+			     GLOBAL_ROOT_UID, GLOBAL_ROOT_GID,</div><div class='add'>+			     current_cred(),</div><div class='add'>+			     (KEY_POS_ALL &amp; ~KEY_POS_SETATTR) |</div><div class='add'>+			     (KEY_USR_ALL &amp; ~KEY_USR_SETATTR),</div><div class='add'>+			     KEY_ALLOC_NOT_IN_QUOTA, NULL, NULL);</div><div class='add'>+	return PTR_ERR_OR_ZERO(nfs_keyring);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfs_exit_keyring(void)</div><div class='add'>+{</div><div class='add'>+	key_put(nfs_keyring);</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+static inline int nfs_init_keyring(void)</div><div class='add'>+{</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void nfs_exit_keyring(void)</div><div class='add'>+{</div><div class='add'>+}</div><div class='add'>+#endif /* CONFIG_KEYS */</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Initialize NFS</div><div class='ctx'>  */</div><div class='hunk'>@@ -2365,6 +2713,10 @@ static int __init init_nfs_fs(void)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='add'>+	err = nfs_init_keyring();</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='ctx'> 	err = nfs_sysfs_init();</div><div class='ctx'> 	if (err &lt; 0)</div><div class='ctx'> 		goto out10;</div><div class='hunk'>@@ -2373,10 +2725,6 @@ static int __init init_nfs_fs(void)</div><div class='ctx'> 	if (err &lt; 0)</div><div class='ctx'> 		goto out9;</div><div class='ctx'> </div><div class='del'>-	err = nfs_fscache_register();</div><div class='del'>-	if (err &lt; 0)</div><div class='del'>-		goto out8;</div><div class='del'>-</div><div class='ctx'> 	err = nfsiod_start();</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out7;</div><div class='hunk'>@@ -2405,15 +2753,12 @@ static int __init init_nfs_fs(void)</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out1;</div><div class='ctx'> </div><div class='del'>-	rpc_proc_register(&amp;init_net, &amp;nfs_rpcstat);</div><div class='del'>-</div><div class='ctx'> 	err = register_nfs_fs();</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out0;</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> out0:</div><div class='del'>-	rpc_proc_unregister(&amp;init_net, "nfs");</div><div class='ctx'> 	nfs_destroy_directcache();</div><div class='ctx'> out1:</div><div class='ctx'> 	nfs_destroy_writepagecache();</div><div class='hunk'>@@ -2428,12 +2773,11 @@ out5:</div><div class='ctx'> out6:</div><div class='ctx'> 	nfsiod_stop();</div><div class='ctx'> out7:</div><div class='del'>-	nfs_fscache_unregister();</div><div class='del'>-out8:</div><div class='ctx'> 	unregister_pernet_subsys(&amp;nfs_net_ops);</div><div class='ctx'> out9:</div><div class='ctx'> 	nfs_sysfs_exit();</div><div class='ctx'> out10:</div><div class='add'>+	nfs_exit_keyring();</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2444,17 +2788,17 @@ static void __exit exit_nfs_fs(void)</div><div class='ctx'> 	nfs_destroy_readpagecache();</div><div class='ctx'> 	nfs_destroy_inodecache();</div><div class='ctx'> 	nfs_destroy_nfspagecache();</div><div class='del'>-	nfs_fscache_unregister();</div><div class='ctx'> 	unregister_pernet_subsys(&amp;nfs_net_ops);</div><div class='del'>-	rpc_proc_unregister(&amp;init_net, "nfs");</div><div class='ctx'> 	unregister_nfs_fs();</div><div class='ctx'> 	nfs_fs_proc_exit();</div><div class='ctx'> 	nfsiod_stop();</div><div class='ctx'> 	nfs_sysfs_exit();</div><div class='add'>+	nfs_exit_keyring();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Not quite true; I just maintain it */</div><div class='ctx'> MODULE_AUTHOR("Olaf Kirch &lt;okir@monad.swb.de&gt;");</div><div class='add'>+MODULE_DESCRIPTION("NFS client support");</div><div class='ctx'> MODULE_LICENSE("GPL");</div><div class='ctx'> module_param(enable_ino64, bool, 0644);</div><div class='ctx'> </div><div class='head'>diff --git a/fs/nfs/internal.h b/fs/nfs/internal.h<br/>index 12f6acb483bb..2ecd38e1d17a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/internal.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/internal.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/internal.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/internal.h</a></div><div class='hunk'>@@ -6,12 +6,14 @@</div><div class='ctx'> #include "nfs4_fs.h"</div><div class='ctx'> #include &lt;linux/fs_context.h&gt;</div><div class='ctx'> #include &lt;linux/security.h&gt;</div><div class='add'>+#include &lt;linux/compiler_attributes.h&gt;</div><div class='ctx'> #include &lt;linux/crc32.h&gt;</div><div class='ctx'> #include &lt;linux/sunrpc/addr.h&gt;</div><div class='ctx'> #include &lt;linux/nfs_page.h&gt;</div><div class='add'>+#include &lt;linux/nfslocalio.h&gt;</div><div class='ctx'> #include &lt;linux/wait_bit.h&gt;</div><div class='ctx'> </div><div class='del'>-#define NFS_SB_MASK (SB_RDONLY|SB_NOSUID|SB_NODEV|SB_NOEXEC|SB_SYNCHRONOUS)</div><div class='add'>+#define NFS_SB_MASK (SB_NOSUID|SB_NODEV|SB_NOEXEC|SB_SYNCHRONOUS)</div><div class='ctx'> </div><div class='ctx'> extern const struct export_operations nfs_export_ops;</div><div class='ctx'> </div><div class='hunk'>@@ -42,6 +44,16 @@ static inline bool nfs_lookup_is_soft_revalidate(const struct dentry *dentry)</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline fmode_t flags_to_mode(int flags)</div><div class='add'>+{</div><div class='add'>+	fmode_t res = (__force fmode_t)flags &amp; FMODE_EXEC;</div><div class='add'>+	if ((flags &amp; O_ACCMODE) != O_WRONLY)</div><div class='add'>+		res |= FMODE_READ;</div><div class='add'>+	if ((flags &amp; O_ACCMODE) != O_RDONLY)</div><div class='add'>+		res |= FMODE_WRITE;</div><div class='add'>+	return res;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Note: RFC 1813 doesn't limit the number of auth flavors that</div><div class='ctx'>  * a server can return, so make something up.</div><div class='hunk'>@@ -59,7 +71,7 @@ static inline bool nfs_lookup_is_soft_revalidate(const struct dentry *dentry)</div><div class='ctx'> struct nfs_client_initdata {</div><div class='ctx'> 	unsigned long init_flags;</div><div class='ctx'> 	const char *hostname;			/* Hostname of the server */</div><div class='del'>-	const struct sockaddr *addr;		/* Address of the server */</div><div class='add'>+	const struct sockaddr_storage *addr;	/* Address of the server */</div><div class='ctx'> 	const char *nodename;			/* Hostname of the client */</div><div class='ctx'> 	const char *ip_addr;			/* IP address of the client */</div><div class='ctx'> 	size_t addrlen;</div><div class='hunk'>@@ -71,6 +83,9 @@ struct nfs_client_initdata {</div><div class='ctx'> 	struct net *net;</div><div class='ctx'> 	const struct rpc_timeout *timeparms;</div><div class='ctx'> 	const struct cred *cred;</div><div class='add'>+	struct xprtsec_parms xprtsec;</div><div class='add'>+	unsigned long connect_timeout;</div><div class='add'>+	unsigned long reconnect_timeout;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -91,6 +106,7 @@ struct nfs_fs_context {</div><div class='ctx'> 	unsigned int		bsize;</div><div class='ctx'> 	struct nfs_auth_info	auth_info;</div><div class='ctx'> 	rpc_authflavor_t	selected_flavor;</div><div class='add'>+	struct xprtsec_parms	xprtsec;</div><div class='ctx'> 	char			*client_address;</div><div class='ctx'> 	unsigned int		version;</div><div class='ctx'> 	unsigned int		minorversion;</div><div class='hunk'>@@ -98,6 +114,7 @@ struct nfs_fs_context {</div><div class='ctx'> 	unsigned short		protofamily;</div><div class='ctx'> 	unsigned short		mountfamily;</div><div class='ctx'> 	bool			has_sec_mnt_opts;</div><div class='add'>+	int			lock_status;</div><div class='ctx'> </div><div class='ctx'> 	struct {</div><div class='ctx'> 		union {</div><div class='hunk'>@@ -139,6 +156,12 @@ struct nfs_fs_context {</div><div class='ctx'> 	} clone_data;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+enum nfs_lock_status {</div><div class='add'>+	NFS_LOCK_NOT_SET	= 0,</div><div class='add'>+	NFS_LOCK_LOCK		= 1,</div><div class='add'>+	NFS_LOCK_NOLOCK		= 2,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> #define nfs_errorf(fc, fmt, ...) ((fc)-&gt;log.log ?		\</div><div class='ctx'> 	errorf(fc, fmt, ## __VA_ARGS__) :			\</div><div class='ctx'> 	({ dprintk(fmt "\n", ## __VA_ARGS__); }))</div><div class='hunk'>@@ -170,7 +193,7 @@ static inline struct nfs_fs_context *nfs_fc2context(const struct fs_context *fc)</div><div class='ctx'> </div><div class='ctx'> /* mount_clnt.c */</div><div class='ctx'> struct nfs_mount_request {</div><div class='del'>-	struct sockaddr		*sap;</div><div class='add'>+	struct sockaddr_storage	*sap;</div><div class='ctx'> 	size_t			salen;</div><div class='ctx'> 	char			*hostname;</div><div class='ctx'> 	char			*dirpath;</div><div class='hunk'>@@ -184,7 +207,6 @@ struct nfs_mount_request {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> extern int nfs_mount(struct nfs_mount_request *info, int timeo, int retrans);</div><div class='del'>-extern void nfs_umount(const struct nfs_mount_request *info);</div><div class='ctx'> </div><div class='ctx'> /* client.c */</div><div class='ctx'> extern const struct rpc_program nfs_program;</div><div class='hunk'>@@ -209,11 +231,11 @@ extern struct nfs_client *</div><div class='ctx'> nfs4_find_client_sessionid(struct net *, const struct sockaddr *,</div><div class='ctx'> 				struct nfs4_sessionid *, u32);</div><div class='ctx'> extern struct nfs_server *nfs_create_server(struct fs_context *);</div><div class='del'>-extern void nfs4_server_set_init_caps(struct nfs_server *);</div><div class='add'>+extern void nfs_server_set_init_caps(struct nfs_server *);</div><div class='ctx'> extern struct nfs_server *nfs4_create_server(struct fs_context *);</div><div class='ctx'> extern struct nfs_server *nfs4_create_referral_server(struct fs_context *);</div><div class='ctx'> extern int nfs4_update_server(struct nfs_server *server, const char *hostname,</div><div class='del'>-					struct sockaddr *sap, size_t salen,</div><div class='add'>+					struct sockaddr_storage *sap, size_t salen,</div><div class='ctx'> 					struct net *net);</div><div class='ctx'> extern void nfs_free_server(struct nfs_server *server);</div><div class='ctx'> extern struct nfs_server *nfs_clone_server(struct nfs_server *,</div><div class='hunk'>@@ -225,7 +247,7 @@ extern int nfs_client_init_status(const struct nfs_client *clp);</div><div class='ctx'> extern int nfs_wait_client_init_complete(const struct nfs_client *clp);</div><div class='ctx'> extern void nfs_mark_client_ready(struct nfs_client *clp, int state);</div><div class='ctx'> extern struct nfs_client *nfs4_set_ds_client(struct nfs_server *mds_srv,</div><div class='del'>-					     const struct sockaddr *ds_addr,</div><div class='add'>+					     const struct sockaddr_storage *ds_addr,</div><div class='ctx'> 					     int ds_addrlen, int ds_proto,</div><div class='ctx'> 					     unsigned int ds_timeo,</div><div class='ctx'> 					     unsigned int ds_retrans,</div><div class='hunk'>@@ -233,7 +255,7 @@ extern struct nfs_client *nfs4_set_ds_client(struct nfs_server *mds_srv,</div><div class='ctx'> extern struct rpc_clnt *nfs4_find_or_create_ds_client(struct nfs_client *,</div><div class='ctx'> 						struct inode *);</div><div class='ctx'> extern struct nfs_client *nfs3_set_ds_client(struct nfs_server *mds_srv,</div><div class='del'>-			const struct sockaddr *ds_addr, int ds_addrlen,</div><div class='add'>+			const struct sockaddr_storage *ds_addr, int ds_addrlen,</div><div class='ctx'> 			int ds_proto, unsigned int ds_timeo,</div><div class='ctx'> 			unsigned int ds_retrans);</div><div class='ctx'> #ifdef CONFIG_PROC_FS</div><div class='hunk'>@@ -287,7 +309,8 @@ void nfs_pgio_header_free(struct nfs_pgio_header *);</div><div class='ctx'> int nfs_generic_pgio(struct nfs_pageio_descriptor *, struct nfs_pgio_header *);</div><div class='ctx'> int nfs_initiate_pgio(struct rpc_clnt *clnt, struct nfs_pgio_header *hdr,</div><div class='ctx'> 		      const struct cred *cred, const struct nfs_rpc_ops *rpc_ops,</div><div class='del'>-		      const struct rpc_call_ops *call_ops, int how, int flags);</div><div class='add'>+		      const struct rpc_call_ops *call_ops, int how, int flags,</div><div class='add'>+		      struct nfsd_file *localio);</div><div class='ctx'> void nfs_free_request(struct nfs_page *req);</div><div class='ctx'> struct nfs_pgio_mirror *</div><div class='ctx'> nfs_pgio_current_mirror(struct nfs_pageio_descriptor *desc);</div><div class='hunk'>@@ -366,40 +389,60 @@ extern struct nfs_client *nfs_init_client(struct nfs_client *clp,</div><div class='ctx'> 			   const struct nfs_client_initdata *);</div><div class='ctx'> </div><div class='ctx'> /* dir.c */</div><div class='del'>-extern void nfs_advise_use_readdirplus(struct inode *dir);</div><div class='del'>-extern void nfs_force_use_readdirplus(struct inode *dir);</div><div class='add'>+extern void nfs_readdir_record_entry_cache_hit(struct inode *dir);</div><div class='add'>+extern void nfs_readdir_record_entry_cache_miss(struct inode *dir);</div><div class='ctx'> extern unsigned long nfs_access_cache_count(struct shrinker *shrink,</div><div class='ctx'> 					    struct shrink_control *sc);</div><div class='ctx'> extern unsigned long nfs_access_cache_scan(struct shrinker *shrink,</div><div class='ctx'> 					   struct shrink_control *sc);</div><div class='ctx'> struct dentry *nfs_lookup(struct inode *, struct dentry *, unsigned int);</div><div class='del'>-int nfs_create(struct user_namespace *, struct inode *, struct dentry *,</div><div class='add'>+void nfs_d_prune_case_insensitive_aliases(struct inode *inode);</div><div class='add'>+int nfs_create(struct mnt_idmap *, struct inode *, struct dentry *,</div><div class='ctx'> 	       umode_t, bool);</div><div class='del'>-int nfs_mkdir(struct user_namespace *, struct inode *, struct dentry *,</div><div class='del'>-	      umode_t);</div><div class='add'>+struct dentry *nfs_mkdir(struct mnt_idmap *, struct inode *, struct dentry *,</div><div class='add'>+			 umode_t);</div><div class='ctx'> int nfs_rmdir(struct inode *, struct dentry *);</div><div class='ctx'> int nfs_unlink(struct inode *, struct dentry *);</div><div class='del'>-int nfs_symlink(struct user_namespace *, struct inode *, struct dentry *,</div><div class='add'>+int nfs_symlink(struct mnt_idmap *, struct inode *, struct dentry *,</div><div class='ctx'> 		const char *);</div><div class='ctx'> int nfs_link(struct dentry *, struct inode *, struct dentry *);</div><div class='del'>-int nfs_mknod(struct user_namespace *, struct inode *, struct dentry *, umode_t,</div><div class='add'>+int nfs_mknod(struct mnt_idmap *, struct inode *, struct dentry *, umode_t,</div><div class='ctx'> 	      dev_t);</div><div class='del'>-int nfs_rename(struct user_namespace *, struct inode *, struct dentry *,</div><div class='add'>+int nfs_rename(struct mnt_idmap *, struct inode *, struct dentry *,</div><div class='ctx'> 	       struct inode *, struct dentry *, unsigned int);</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_NFS_V4_2</div><div class='add'>+static inline __u32 nfs_access_xattr_mask(const struct nfs_server *server)</div><div class='add'>+{</div><div class='add'>+	if (!(server-&gt;caps &amp; NFS_CAP_XATTR))</div><div class='add'>+		return 0;</div><div class='add'>+	return NFS4_ACCESS_XAREAD | NFS4_ACCESS_XAWRITE | NFS4_ACCESS_XALIST;</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+static inline __u32 nfs_access_xattr_mask(const struct nfs_server *server)</div><div class='add'>+{</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> /* file.c */</div><div class='ctx'> int nfs_file_fsync(struct file *file, loff_t start, loff_t end, int datasync);</div><div class='ctx'> loff_t nfs_file_llseek(struct file *, loff_t, int);</div><div class='ctx'> ssize_t nfs_file_read(struct kiocb *, struct iov_iter *);</div><div class='del'>-int nfs_file_mmap(struct file *, struct vm_area_struct *);</div><div class='add'>+ssize_t nfs_file_splice_read(struct file *in, loff_t *ppos, struct pipe_inode_info *pipe,</div><div class='add'>+			     size_t len, unsigned int flags);</div><div class='add'>+int nfs_file_mmap_prepare(struct vm_area_desc *);</div><div class='ctx'> ssize_t nfs_file_write(struct kiocb *, struct iov_iter *);</div><div class='ctx'> int nfs_file_release(struct inode *, struct file *);</div><div class='ctx'> int nfs_lock(struct file *, int, struct file_lock *);</div><div class='ctx'> int nfs_flock(struct file *, int, struct file_lock *);</div><div class='ctx'> int nfs_check_flags(int);</div><div class='add'>+void nfs_truncate_last_folio(struct address_space *mapping, loff_t from,</div><div class='add'>+			     loff_t to);</div><div class='ctx'> </div><div class='ctx'> /* inode.c */</div><div class='ctx'> extern struct workqueue_struct *nfsiod_workqueue;</div><div class='add'>+extern struct workqueue_struct *nfslocaliod_workqueue;</div><div class='ctx'> extern struct inode *nfs_alloc_inode(struct super_block *sb);</div><div class='ctx'> extern void nfs_free_inode(struct inode *);</div><div class='ctx'> extern int nfs_write_inode(struct inode *, struct writeback_control *);</div><div class='hunk'>@@ -410,7 +453,63 @@ extern void nfs_zap_acl_cache(struct inode *inode);</div><div class='ctx'> extern void nfs_set_cache_invalid(struct inode *inode, unsigned long flags);</div><div class='ctx'> extern bool nfs_check_cache_invalid(struct inode *, unsigned long);</div><div class='ctx'> extern int nfs_wait_bit_killable(struct wait_bit_key *key, int mode);</div><div class='del'>-extern int nfs_wait_atomic_killable(atomic_t *p, unsigned int mode);</div><div class='add'>+</div><div class='add'>+#if IS_ENABLED(CONFIG_NFS_LOCALIO)</div><div class='add'>+/* localio.c */</div><div class='add'>+struct nfs_local_dio {</div><div class='add'>+	u32 mem_align;</div><div class='add'>+	u32 offset_align;</div><div class='add'>+	loff_t middle_offset;</div><div class='add'>+	loff_t end_offset;</div><div class='add'>+	ssize_t	start_len;	/* Length for misaligned first extent */</div><div class='add'>+	ssize_t	middle_len;	/* Length for DIO-aligned middle extent */</div><div class='add'>+	ssize_t	end_len;	/* Length for misaligned last extent */</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+extern void nfs_local_probe_async(struct nfs_client *);</div><div class='add'>+extern void nfs_local_probe_async_work(struct work_struct *);</div><div class='add'>+extern struct nfsd_file *nfs_local_open_fh(struct nfs_client *,</div><div class='add'>+					   const struct cred *,</div><div class='add'>+					   struct nfs_fh *,</div><div class='add'>+					   struct nfs_file_localio *,</div><div class='add'>+					   const fmode_t);</div><div class='add'>+extern int nfs_local_doio(struct nfs_client *,</div><div class='add'>+			  struct nfsd_file *,</div><div class='add'>+			  struct nfs_pgio_header *,</div><div class='add'>+			  const struct rpc_call_ops *);</div><div class='add'>+extern int nfs_local_commit(struct nfsd_file *,</div><div class='add'>+			    struct nfs_commit_data *,</div><div class='add'>+			    const struct rpc_call_ops *, int);</div><div class='add'>+extern bool nfs_server_is_local(const struct nfs_client *clp);</div><div class='add'>+</div><div class='add'>+#else /* CONFIG_NFS_LOCALIO */</div><div class='add'>+static inline void nfs_local_probe(struct nfs_client *clp) {}</div><div class='add'>+static inline void nfs_local_probe_async(struct nfs_client *clp) {}</div><div class='add'>+static inline struct nfsd_file *</div><div class='add'>+nfs_local_open_fh(struct nfs_client *clp, const struct cred *cred,</div><div class='add'>+		  struct nfs_fh *fh, struct nfs_file_localio *nfl,</div><div class='add'>+		  const fmode_t mode)</div><div class='add'>+{</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+static inline int nfs_local_doio(struct nfs_client *clp,</div><div class='add'>+				 struct nfsd_file *localio,</div><div class='add'>+				 struct nfs_pgio_header *hdr,</div><div class='add'>+				 const struct rpc_call_ops *call_ops)</div><div class='add'>+{</div><div class='add'>+	return -EINVAL;</div><div class='add'>+}</div><div class='add'>+static inline int nfs_local_commit(struct nfsd_file *localio,</div><div class='add'>+				struct nfs_commit_data *data,</div><div class='add'>+				const struct rpc_call_ops *call_ops, int how)</div><div class='add'>+{</div><div class='add'>+	return -EINVAL;</div><div class='add'>+}</div><div class='add'>+static inline bool nfs_server_is_local(const struct nfs_client *clp)</div><div class='add'>+{</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+#endif /* CONFIG_NFS_LOCALIO */</div><div class='ctx'> </div><div class='ctx'> /* super.c */</div><div class='ctx'> extern const struct super_operations nfs_sops;</div><div class='hunk'>@@ -419,8 +518,6 @@ int nfs_try_get_tree(struct fs_context *);</div><div class='ctx'> int nfs_get_tree_common(struct fs_context *);</div><div class='ctx'> void nfs_kill_super(struct super_block *);</div><div class='ctx'> </div><div class='del'>-extern struct rpc_stat nfs_rpcstat;</div><div class='del'>-</div><div class='ctx'> extern int __init register_nfs_fs(void);</div><div class='ctx'> extern void __exit unregister_nfs_fs(void);</div><div class='ctx'> extern bool nfs_sb_active(struct super_block *sb);</div><div class='hunk'>@@ -428,12 +525,16 @@ extern void nfs_sb_deactive(struct super_block *sb);</div><div class='ctx'> extern int nfs_client_for_each_server(struct nfs_client *clp,</div><div class='ctx'> 				      int (*fn)(struct nfs_server *, void *),</div><div class='ctx'> 				      void *data);</div><div class='add'>+#ifdef CONFIG_NFS_FSCACHE</div><div class='add'>+extern const struct netfs_request_ops nfs_netfs_ops;</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> /* io.c */</div><div class='del'>-extern void nfs_start_io_read(struct inode *inode);</div><div class='add'>+extern __must_check int nfs_start_io_read(struct inode *inode);</div><div class='ctx'> extern void nfs_end_io_read(struct inode *inode);</div><div class='del'>-extern void nfs_start_io_write(struct inode *inode);</div><div class='add'>+extern  __must_check int nfs_start_io_write(struct inode *inode);</div><div class='ctx'> extern void nfs_end_io_write(struct inode *inode);</div><div class='del'>-extern void nfs_start_io_direct(struct inode *inode);</div><div class='add'>+extern __must_check int nfs_start_io_direct(struct inode *inode);</div><div class='ctx'> extern void nfs_end_io_direct(struct inode *inode);</div><div class='ctx'> </div><div class='ctx'> static inline bool nfs_file_io_is_buffered(struct nfs_inode *nfsi)</div><div class='hunk'>@@ -441,6 +542,16 @@ static inline bool nfs_file_io_is_buffered(struct nfs_inode *nfsi)</div><div class='ctx'> 	return test_bit(NFS_INO_ODIRECT, &amp;nfsi-&gt;flags) == 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/* Must be called with exclusively locked inode-&gt;i_rwsem */</div><div class='add'>+static inline void nfs_file_block_o_direct(struct nfs_inode *nfsi)</div><div class='add'>+{</div><div class='add'>+	if (test_bit(NFS_INO_ODIRECT, &amp;nfsi-&gt;flags)) {</div><div class='add'>+		clear_bit(NFS_INO_ODIRECT, &amp;nfsi-&gt;flags);</div><div class='add'>+		inode_dio_wait(&amp;nfsi-&gt;vfs_inode);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+</div><div class='ctx'> /* namespace.c */</div><div class='ctx'> #define NFS_PATH_CANONICAL 1</div><div class='ctx'> extern char *nfs_path(char **p, struct dentry *dentry,</div><div class='hunk'>@@ -457,10 +568,15 @@ extern int nfs4_get_rootfh(struct nfs_server *server, struct nfs_fh *mntfh, bool</div><div class='ctx'> </div><div class='ctx'> struct nfs_pgio_completion_ops;</div><div class='ctx'> /* read.c */</div><div class='add'>+extern const struct nfs_pgio_completion_ops nfs_async_read_completion_ops;</div><div class='ctx'> extern void nfs_pageio_init_read(struct nfs_pageio_descriptor *pgio,</div><div class='ctx'> 			struct inode *inode, bool force_mds,</div><div class='ctx'> 			const struct nfs_pgio_completion_ops *compl_ops);</div><div class='del'>-extern void nfs_read_prepare(struct rpc_task *task, void *calldata);</div><div class='add'>+extern bool nfs_read_alloc_scratch(struct nfs_pgio_header *hdr, size_t size);</div><div class='add'>+extern int nfs_read_add_folio(struct nfs_pageio_descriptor *pgio,</div><div class='add'>+			       struct nfs_open_context *ctx,</div><div class='add'>+			       struct folio *folio);</div><div class='add'>+extern void nfs_pageio_complete_read(struct nfs_pageio_descriptor *pgio);</div><div class='ctx'> extern void nfs_pageio_reset_read_mds(struct nfs_pageio_descriptor *pgio);</div><div class='ctx'> </div><div class='ctx'> /* super.c */</div><div class='hunk'>@@ -478,13 +594,13 @@ extern void nfs_pageio_init_write(struct nfs_pageio_descriptor *pgio,</div><div class='ctx'> 			const struct nfs_pgio_completion_ops *compl_ops);</div><div class='ctx'> extern void nfs_pageio_reset_write_mds(struct nfs_pageio_descriptor *pgio);</div><div class='ctx'> extern void nfs_commit_free(struct nfs_commit_data *p);</div><div class='del'>-extern void nfs_write_prepare(struct rpc_task *task, void *calldata);</div><div class='ctx'> extern void nfs_commit_prepare(struct rpc_task *task, void *calldata);</div><div class='ctx'> extern int nfs_initiate_commit(struct rpc_clnt *clnt,</div><div class='ctx'> 			       struct nfs_commit_data *data,</div><div class='ctx'> 			       const struct nfs_rpc_ops *nfs_ops,</div><div class='ctx'> 			       const struct rpc_call_ops *call_ops,</div><div class='del'>-			       int how, int flags);</div><div class='add'>+			       int how, int flags,</div><div class='add'>+			       struct nfsd_file *localio);</div><div class='ctx'> extern void nfs_init_commit(struct nfs_commit_data *data,</div><div class='ctx'> 			    struct list_head *head,</div><div class='ctx'> 			    struct pnfs_layout_segment *lseg,</div><div class='hunk'>@@ -553,8 +669,10 @@ void nfs_clear_pnfs_ds_commit_verifiers(struct pnfs_ds_commit_info *cinfo)</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_MIGRATION</div><div class='del'>-extern int nfs_migrate_page(struct address_space *,</div><div class='del'>-		struct page *, struct page *, enum migrate_mode);</div><div class='add'>+int nfs_migrate_folio(struct address_space *, struct folio *dst,</div><div class='add'>+		struct folio *src, enum migrate_mode);</div><div class='add'>+#else</div><div class='add'>+#define nfs_migrate_folio NULL</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> static inline int</div><div class='hunk'>@@ -572,6 +690,41 @@ nfs_write_match_verf(const struct nfs_writeverf *verf,</div><div class='ctx'> 		!nfs_write_verifier_cmp(&amp;req-&gt;wb_verf, &amp;verf-&gt;verifier);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline gfp_t nfs_io_gfp_mask(void)</div><div class='add'>+{</div><div class='add'>+	gfp_t ret = current_gfp_context(GFP_KERNEL);</div><div class='add'>+</div><div class='add'>+	/* For workers __GFP_NORETRY only with __GFP_IO or __GFP_FS */</div><div class='add'>+	if ((current-&gt;flags &amp; PF_WQ_WORKER) &amp;&amp; ret == GFP_KERNEL)</div><div class='add'>+		ret |= __GFP_NORETRY | __GFP_NOWARN;</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Special version of should_remove_suid() that ignores capabilities.</div><div class='add'>+ */</div><div class='add'>+static inline int nfs_should_remove_suid(const struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	umode_t mode = inode-&gt;i_mode;</div><div class='add'>+	int kill = 0;</div><div class='add'>+</div><div class='add'>+	/* suid always must be killed */</div><div class='add'>+	if (unlikely(mode &amp; S_ISUID))</div><div class='add'>+		kill = ATTR_KILL_SUID;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * sgid without any exec bits is just a mandatory locking mark; leave</div><div class='add'>+	 * it alone.  If some exec bits are set, it's a real sgid; kill it.</div><div class='add'>+	 */</div><div class='add'>+	if (unlikely((mode &amp; S_ISGID) &amp;&amp; (mode &amp; S_IXGRP)))</div><div class='add'>+		kill |= ATTR_KILL_SGID;</div><div class='add'>+</div><div class='add'>+	if (unlikely(kill &amp;&amp; S_ISREG(mode)))</div><div class='add'>+		return kill;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /* unlink.c */</div><div class='ctx'> extern struct rpc_task *</div><div class='ctx'> nfs_async_rename(struct inode *old_dir, struct inode *new_dir,</div><div class='hunk'>@@ -582,7 +735,7 @@ extern int nfs_sillyrename(struct inode *dir, struct dentry *dentry);</div><div class='ctx'> /* direct.c */</div><div class='ctx'> void nfs_init_cinfo_from_dreq(struct nfs_commit_info *cinfo,</div><div class='ctx'> 			      struct nfs_direct_req *dreq);</div><div class='del'>-extern ssize_t nfs_dreq_bytes_left(struct nfs_direct_req *dreq);</div><div class='add'>+extern ssize_t nfs_dreq_bytes_left(struct nfs_direct_req *dreq, loff_t offset);</div><div class='ctx'> </div><div class='ctx'> /* nfs4proc.c */</div><div class='ctx'> extern struct nfs_client *nfs4_init_client(struct nfs_client *clp,</div><div class='hunk'>@@ -639,9 +792,9 @@ unsigned long nfs_block_bits(unsigned long bsize, unsigned char *nrbitsp)</div><div class='ctx'> 	if ((bsize &amp; (bsize - 1)) || nrbitsp) {</div><div class='ctx'> 		unsigned char	nrbits;</div><div class='ctx'> </div><div class='del'>-		for (nrbits = 31; nrbits &amp;&amp; !(bsize &amp; (1 &lt;&lt; nrbits)); nrbits--)</div><div class='add'>+		for (nrbits = 31; nrbits &amp;&amp; !(bsize &amp; (1UL &lt;&lt; nrbits)); nrbits--)</div><div class='ctx'> 			;</div><div class='del'>-		bsize = 1 &lt;&lt; nrbits;</div><div class='add'>+		bsize = 1UL &lt;&lt; nrbits;</div><div class='ctx'> 		if (nrbitsp)</div><div class='ctx'> 			*nrbitsp = nrbits;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -673,6 +826,22 @@ unsigned long nfs_block_size(unsigned long bsize, unsigned char *nrbitsp)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * Compute and set NFS server rsize / wsize</div><div class='add'>+ */</div><div class='add'>+static inline</div><div class='add'>+unsigned long nfs_io_size(unsigned long iosize, enum xprt_transports proto)</div><div class='add'>+{</div><div class='add'>+	if (iosize &lt; NFS_MIN_FILE_IO_SIZE)</div><div class='add'>+		iosize = NFS_DEF_FILE_IO_SIZE;</div><div class='add'>+	else if (iosize &gt;= NFS_MAX_FILE_IO_SIZE)</div><div class='add'>+		iosize = NFS_MAX_FILE_IO_SIZE;</div><div class='add'>+</div><div class='add'>+	if (proto == XPRT_TRANSPORT_UDP || iosize &lt; PAGE_SIZE)</div><div class='add'>+		return nfs_block_bits(iosize, NULL);</div><div class='add'>+	return iosize &amp; PAGE_MASK;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * Determine the maximum file size for a superblock</div><div class='ctx'>  */</div><div class='ctx'> static inline</div><div class='hunk'>@@ -687,17 +856,18 @@ void nfs_super_set_maxbytes(struct super_block *sb, __u64 maxfilesize)</div><div class='ctx'>  * Record the page as unstable (an extra writeback period) and mark its</div><div class='ctx'>  * inode as dirty.</div><div class='ctx'>  */</div><div class='del'>-static inline</div><div class='del'>-void nfs_mark_page_unstable(struct page *page, struct nfs_commit_info *cinfo)</div><div class='add'>+static inline void nfs_folio_mark_unstable(struct folio *folio,</div><div class='add'>+					   struct nfs_commit_info *cinfo)</div><div class='ctx'> {</div><div class='del'>-	if (!cinfo-&gt;dreq) {</div><div class='del'>-		struct inode *inode = page_file_mapping(page)-&gt;host;</div><div class='add'>+	if (folio &amp;&amp; !cinfo-&gt;dreq) {</div><div class='add'>+		struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+		long nr = folio_nr_pages(folio);</div><div class='ctx'> </div><div class='ctx'> 		/* This page is really still in write-back - just that the</div><div class='ctx'> 		 * writeback is happening on the server now.</div><div class='ctx'> 		 */</div><div class='del'>-		inc_node_page_state(page, NR_WRITEBACK);</div><div class='del'>-		inc_wb_stat(&amp;inode_to_bdi(inode)-&gt;wb, WB_WRITEBACK);</div><div class='add'>+		node_stat_mod_folio(folio, NR_WRITEBACK, nr);</div><div class='add'>+		wb_stat_mod(&amp;inode_to_bdi(inode)-&gt;wb, WB_WRITEBACK, nr);</div><div class='ctx'> 		__mark_inode_dirty(inode, I_DIRTY_DATASYNC);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -705,18 +875,17 @@ void nfs_mark_page_unstable(struct page *page, struct nfs_commit_info *cinfo)</div><div class='ctx'> /*</div><div class='ctx'>  * Determine the number of bytes of data the page contains</div><div class='ctx'>  */</div><div class='del'>-static inline</div><div class='del'>-unsigned int nfs_page_length(struct page *page)</div><div class='add'>+static inline size_t nfs_folio_length(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	loff_t i_size = i_size_read(page_file_mapping(page)-&gt;host);</div><div class='add'>+	loff_t i_size = i_size_read(folio-&gt;mapping-&gt;host);</div><div class='ctx'> </div><div class='ctx'> 	if (i_size &gt; 0) {</div><div class='del'>-		pgoff_t index = page_index(page);</div><div class='del'>-		pgoff_t end_index = (i_size - 1) &gt;&gt; PAGE_SHIFT;</div><div class='add'>+		pgoff_t index = folio-&gt;index &gt;&gt; folio_order(folio);</div><div class='add'>+		pgoff_t end_index = (i_size - 1) &gt;&gt; folio_shift(folio);</div><div class='ctx'> 		if (index &lt; end_index)</div><div class='del'>-			return PAGE_SIZE;</div><div class='add'>+			return folio_size(folio);</div><div class='ctx'> 		if (index == end_index)</div><div class='del'>-			return ((i_size - 1) &amp; ~PAGE_MASK) + 1;</div><div class='add'>+			return offset_in_folio(folio, i_size - 1) + 1;</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -734,11 +903,10 @@ unsigned char nfs_umode_to_dtype(umode_t mode)</div><div class='ctx'>  * Determine the number of pages in an array of length 'len' and</div><div class='ctx'>  * with a base offset of 'base'</div><div class='ctx'>  */</div><div class='del'>-static inline</div><div class='del'>-unsigned int nfs_page_array_len(unsigned int base, size_t len)</div><div class='add'>+static inline unsigned int nfs_page_array_len(unsigned int base, size_t len)</div><div class='ctx'> {</div><div class='del'>-	return ((unsigned long)len + (unsigned long)base +</div><div class='del'>-		PAGE_SIZE - 1) &gt;&gt; PAGE_SHIFT;</div><div class='add'>+	return ((unsigned long)len + (unsigned long)base + PAGE_SIZE - 1) &gt;&gt;</div><div class='add'>+	       PAGE_SHIFT;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -754,33 +922,16 @@ u64 nfs_timespec_to_change_attr(const struct timespec64 *ts)</div><div class='ctx'> 	return ((u64)ts-&gt;tv_sec &lt;&lt; 30) + ts-&gt;tv_nsec;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_CRC32</div><div class='del'>-/**</div><div class='del'>- * nfs_fhandle_hash - calculate the crc32 hash for the filehandle</div><div class='del'>- * @fh - pointer to filehandle</div><div class='del'>- *</div><div class='del'>- * returns a crc32 hash for the filehandle that is compatible with</div><div class='del'>- * the one displayed by "wireshark".</div><div class='del'>- */</div><div class='del'>-static inline u32 nfs_fhandle_hash(const struct nfs_fh *fh)</div><div class='del'>-{</div><div class='del'>-	return ~crc32_le(0xFFFFFFFF, &amp;fh-&gt;data[0], fh-&gt;size);</div><div class='del'>-}</div><div class='ctx'> static inline u32 nfs_stateid_hash(const nfs4_stateid *stateid)</div><div class='ctx'> {</div><div class='ctx'> 	return ~crc32_le(0xFFFFFFFF, &amp;stateid-&gt;other[0],</div><div class='ctx'> 				NFS4_STATEID_OTHER_SIZE);</div><div class='ctx'> }</div><div class='del'>-#else</div><div class='del'>-static inline u32 nfs_fhandle_hash(const struct nfs_fh *fh)</div><div class='del'>-{</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-static inline u32 nfs_stateid_hash(nfs4_stateid *stateid)</div><div class='add'>+</div><div class='add'>+static inline bool nfs_current_task_exiting(void)</div><div class='ctx'> {</div><div class='del'>-	return 0;</div><div class='add'>+	return (current-&gt;flags &amp; PF_EXITING) != 0;</div><div class='ctx'> }</div><div class='del'>-#endif</div><div class='ctx'> </div><div class='ctx'> static inline bool nfs_error_is_fatal(int err)</div><div class='ctx'> {</div><div class='hunk'>@@ -809,6 +960,7 @@ static inline bool nfs_error_is_fatal_on_server(int err)</div><div class='ctx'> 	case 0:</div><div class='ctx'> 	case -ERESTARTSYS:</div><div class='ctx'> 	case -EINTR:</div><div class='add'>+	case -ENOMEM:</div><div class='ctx'> 		return false;</div><div class='ctx'> 	}</div><div class='ctx'> 	return nfs_error_is_fatal(err);</div><div class='hunk'>@@ -818,11 +970,43 @@ static inline bool nfs_error_is_fatal_on_server(int err)</div><div class='ctx'>  * Select between a default port value and a user-specified port value.</div><div class='ctx'>  * If a zero value is set, then autobind will be used.</div><div class='ctx'>  */</div><div class='del'>-static inline void nfs_set_port(struct sockaddr *sap, int *port,</div><div class='add'>+static inline void nfs_set_port(struct sockaddr_storage *sap, int *port,</div><div class='ctx'> 				const unsigned short default_port)</div><div class='ctx'> {</div><div class='ctx'> 	if (*port == NFS_UNSPEC_PORT)</div><div class='ctx'> 		*port = default_port;</div><div class='ctx'> </div><div class='del'>-	rpc_set_port(sap, *port);</div><div class='del'>-}</div><div class='add'>+	rpc_set_port((struct sockaddr *)sap, *port);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct nfs_direct_req {</div><div class='add'>+	struct kref		kref;		/* release manager */</div><div class='add'>+</div><div class='add'>+	/* I/O parameters */</div><div class='add'>+	struct nfs_open_context	*ctx;		/* file open context info */</div><div class='add'>+	struct nfs_lock_context *l_ctx;		/* Lock context info */</div><div class='add'>+	struct kiocb *		iocb;		/* controlling i/o request */</div><div class='add'>+	struct inode *		inode;		/* target file of i/o */</div><div class='add'>+</div><div class='add'>+	/* completion state */</div><div class='add'>+	atomic_t		io_count;	/* i/os we're waiting for */</div><div class='add'>+	spinlock_t		lock;		/* protect completion state */</div><div class='add'>+</div><div class='add'>+	loff_t			io_start;	/* Start offset for I/O */</div><div class='add'>+	ssize_t			count,		/* bytes actually processed */</div><div class='add'>+				max_count,	/* max expected count */</div><div class='add'>+				error;		/* any reported error */</div><div class='add'>+	struct completion	completion;	/* wait for i/o completion */</div><div class='add'>+</div><div class='add'>+	/* commit state */</div><div class='add'>+	struct nfs_mds_commit_info mds_cinfo;	/* Storage for cinfo */</div><div class='add'>+	struct pnfs_ds_commit_info ds_cinfo;	/* Storage for cinfo */</div><div class='add'>+	struct work_struct	work;</div><div class='add'>+	int			flags;</div><div class='add'>+	/* for write */</div><div class='add'>+#define NFS_ODIRECT_DO_COMMIT		(1)	/* an unstable reply was received */</div><div class='add'>+#define NFS_ODIRECT_RESCHED_WRITES	(2)	/* write verification failed */</div><div class='add'>+	/* for read */</div><div class='add'>+#define NFS_ODIRECT_SHOULD_DIRTY	(3)	/* dirty user-space page after read */</div><div class='add'>+#define NFS_ODIRECT_DONE		INT_MAX	/* write verification failed */</div><div class='add'>+};</div><div class='head'>diff --git a/fs/nfs/io.c b/fs/nfs/io.c<br/>index b5551ed8f648..d275b0a250bf 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/io.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/io.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/io.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/io.c</a></div><div class='hunk'>@@ -14,15 +14,6 @@</div><div class='ctx'> </div><div class='ctx'> #include "internal.h"</div><div class='ctx'> </div><div class='del'>-/* Call with exclusively locked inode-&gt;i_rwsem */</div><div class='del'>-static void nfs_block_o_direct(struct nfs_inode *nfsi, struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	if (test_bit(NFS_INO_ODIRECT, &amp;nfsi-&gt;flags)) {</div><div class='del'>-		clear_bit(NFS_INO_ODIRECT, &amp;nfsi-&gt;flags);</div><div class='del'>-		inode_dio_wait(inode);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /**</div><div class='ctx'>  * nfs_start_io_read - declare the file is being used for buffered reads</div><div class='ctx'>  * @inode: file inode</div><div class='hunk'>@@ -39,19 +30,28 @@ static void nfs_block_o_direct(struct nfs_inode *nfsi, struct inode *inode)</div><div class='ctx'>  * Note that buffered writes and truncates both take a write lock on</div><div class='ctx'>  * inode-&gt;i_rwsem, meaning that those are serialised w.r.t. the reads.</div><div class='ctx'>  */</div><div class='del'>-void</div><div class='add'>+int</div><div class='ctx'> nfs_start_io_read(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_inode *nfsi = NFS_I(inode);</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='ctx'> 	/* Be an optimist! */</div><div class='del'>-	down_read(&amp;inode-&gt;i_rwsem);</div><div class='add'>+	err = down_read_killable(&amp;inode-&gt;i_rwsem);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='ctx'> 	if (test_bit(NFS_INO_ODIRECT, &amp;nfsi-&gt;flags) == 0)</div><div class='del'>-		return;</div><div class='add'>+		return 0;</div><div class='ctx'> 	up_read(&amp;inode-&gt;i_rwsem);</div><div class='add'>+</div><div class='ctx'> 	/* Slow path.... */</div><div class='del'>-	down_write(&amp;inode-&gt;i_rwsem);</div><div class='del'>-	nfs_block_o_direct(nfsi, inode);</div><div class='add'>+	err = down_write_killable(&amp;inode-&gt;i_rwsem);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+	nfs_file_block_o_direct(nfsi);</div><div class='ctx'> 	downgrade_write(&amp;inode-&gt;i_rwsem);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -74,11 +74,15 @@ nfs_end_io_read(struct inode *inode)</div><div class='ctx'>  * Declare that a buffered read operation is about to start, and ensure</div><div class='ctx'>  * that we block all direct I/O.</div><div class='ctx'>  */</div><div class='del'>-void</div><div class='add'>+int</div><div class='ctx'> nfs_start_io_write(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	down_write(&amp;inode-&gt;i_rwsem);</div><div class='del'>-	nfs_block_o_direct(NFS_I(inode), inode);</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = down_write_killable(&amp;inode-&gt;i_rwsem);</div><div class='add'>+	if (!err)</div><div class='add'>+		nfs_file_block_o_direct(NFS_I(inode));</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -119,19 +123,28 @@ static void nfs_block_buffered(struct nfs_inode *nfsi, struct inode *inode)</div><div class='ctx'>  * Note that buffered writes and truncates both take a write lock on</div><div class='ctx'>  * inode-&gt;i_rwsem, meaning that those are serialised w.r.t. O_DIRECT.</div><div class='ctx'>  */</div><div class='del'>-void</div><div class='add'>+int</div><div class='ctx'> nfs_start_io_direct(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_inode *nfsi = NFS_I(inode);</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='ctx'> 	/* Be an optimist! */</div><div class='del'>-	down_read(&amp;inode-&gt;i_rwsem);</div><div class='add'>+	err = down_read_killable(&amp;inode-&gt;i_rwsem);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='ctx'> 	if (test_bit(NFS_INO_ODIRECT, &amp;nfsi-&gt;flags) != 0)</div><div class='del'>-		return;</div><div class='add'>+		return 0;</div><div class='ctx'> 	up_read(&amp;inode-&gt;i_rwsem);</div><div class='add'>+</div><div class='ctx'> 	/* Slow path.... */</div><div class='del'>-	down_write(&amp;inode-&gt;i_rwsem);</div><div class='add'>+	err = down_write_killable(&amp;inode-&gt;i_rwsem);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='ctx'> 	nfs_block_buffered(nfsi, inode);</div><div class='ctx'> 	downgrade_write(&amp;inode-&gt;i_rwsem);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='head'>diff --git a/fs/nfs/iostat.h b/fs/nfs/iostat.h<br/>index 2ddaab1ac653..49862c95b224 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/iostat.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/iostat.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/iostat.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/iostat.h</a></div><div class='hunk'>@@ -17,9 +17,6 @@</div><div class='ctx'> </div><div class='ctx'> struct nfs_iostats {</div><div class='ctx'> 	unsigned long long	bytes[__NFSIOS_BYTESMAX];</div><div class='del'>-#ifdef CONFIG_NFS_FSCACHE</div><div class='del'>-	unsigned long long	fscache[__NFSIOS_FSCACHEMAX];</div><div class='del'>-#endif</div><div class='ctx'> 	unsigned long		events[__NFSIOS_COUNTSMAX];</div><div class='ctx'> } ____cacheline_aligned;</div><div class='ctx'> </div><div class='hunk'>@@ -49,24 +46,11 @@ static inline void nfs_add_stats(const struct inode *inode,</div><div class='ctx'> 	nfs_add_server_stats(NFS_SERVER(inode), stat, addend);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_NFS_FSCACHE</div><div class='del'>-static inline void nfs_add_fscache_stats(struct inode *inode,</div><div class='del'>-					 enum nfs_stat_fscachecounters stat,</div><div class='del'>-					 long addend)</div><div class='del'>-{</div><div class='del'>-	this_cpu_add(NFS_SERVER(inode)-&gt;io_stats-&gt;fscache[stat], addend);</div><div class='del'>-}</div><div class='del'>-static inline void nfs_inc_fscache_stats(struct inode *inode,</div><div class='del'>-					 enum nfs_stat_fscachecounters stat)</div><div class='del'>-{</div><div class='del'>-	this_cpu_inc(NFS_SERVER(inode)-&gt;io_stats-&gt;fscache[stat]);</div><div class='del'>-}</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-static inline struct nfs_iostats __percpu *nfs_alloc_iostats(void)</div><div class='del'>-{</div><div class='del'>-	return alloc_percpu(struct nfs_iostats);</div><div class='del'>-}</div><div class='add'>+/*</div><div class='add'>+ * This specialized allocator has to be a macro for its allocations to be</div><div class='add'>+ * accounted separately (to have a separate alloc_tag).</div><div class='add'>+ */</div><div class='add'>+#define nfs_alloc_iostats()	alloc_percpu(struct nfs_iostats)</div><div class='ctx'> </div><div class='ctx'> static inline void nfs_free_iostats(struct nfs_iostats __percpu *stats)</div><div class='ctx'> {</div><div class='head'>diff --git a/fs/nfs/localio.c b/fs/nfs/localio.c<br/>new file mode 100644<br/>index 000000000000..f33bfa7b58e6<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/localio.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/localio.c</a></div><div class='hunk'>@@ -0,0 +1,1072 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-only</div><div class='add'>+/*</div><div class='add'>+ * NFS client support for local clients to bypass network stack</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2014 Weston Andros Adamson &lt;dros@primarydata.com&gt;</div><div class='add'>+ * Copyright (C) 2019 Trond Myklebust &lt;trond.myklebust@hammerspace.com&gt;</div><div class='add'>+ * Copyright (C) 2024 Mike Snitzer &lt;snitzer@hammerspace.com&gt;</div><div class='add'>+ * Copyright (C) 2024 NeilBrown &lt;neilb@suse.de&gt;</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/module.h&gt;</div><div class='add'>+#include &lt;linux/errno.h&gt;</div><div class='add'>+#include &lt;linux/vfs.h&gt;</div><div class='add'>+#include &lt;linux/file.h&gt;</div><div class='add'>+#include &lt;linux/inet.h&gt;</div><div class='add'>+#include &lt;linux/sunrpc/addr.h&gt;</div><div class='add'>+#include &lt;linux/inetdevice.h&gt;</div><div class='add'>+#include &lt;net/addrconf.h&gt;</div><div class='add'>+#include &lt;linux/nfs_common.h&gt;</div><div class='add'>+#include &lt;linux/nfslocalio.h&gt;</div><div class='add'>+#include &lt;linux/bvec.h&gt;</div><div class='add'>+</div><div class='add'>+#include &lt;linux/nfs.h&gt;</div><div class='add'>+#include &lt;linux/nfs_fs.h&gt;</div><div class='add'>+#include &lt;linux/nfs_xdr.h&gt;</div><div class='add'>+</div><div class='add'>+#include "internal.h"</div><div class='add'>+#include "pnfs.h"</div><div class='add'>+#include "nfstrace.h"</div><div class='add'>+</div><div class='add'>+#define NFSDBG_FACILITY		NFSDBG_VFS</div><div class='add'>+</div><div class='add'>+#define NFSLOCAL_MAX_IOS	3</div><div class='add'>+</div><div class='add'>+struct nfs_local_kiocb {</div><div class='add'>+	struct kiocb		kiocb;</div><div class='add'>+	struct bio_vec		*bvec;</div><div class='add'>+	struct nfs_pgio_header	*hdr;</div><div class='add'>+	struct work_struct	work;</div><div class='add'>+	void (*aio_complete_work)(struct work_struct *);</div><div class='add'>+	struct nfsd_file	*localio;</div><div class='add'>+	/* Begin mostly DIO-specific members */</div><div class='add'>+	size_t                  end_len;</div><div class='add'>+	short int		end_iter_index;</div><div class='add'>+	atomic_t		n_iters;</div><div class='add'>+	bool			iter_is_dio_aligned[NFSLOCAL_MAX_IOS];</div><div class='add'>+	struct iov_iter		iters[NFSLOCAL_MAX_IOS] ____cacheline_aligned;</div><div class='add'>+	/* End mostly DIO-specific members */</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct nfs_local_fsync_ctx {</div><div class='add'>+	struct nfsd_file	*localio;</div><div class='add'>+	struct nfs_commit_data	*data;</div><div class='add'>+	struct work_struct	work;</div><div class='add'>+	struct completion	*done;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static bool localio_enabled __read_mostly = true;</div><div class='add'>+module_param(localio_enabled, bool, 0644);</div><div class='add'>+</div><div class='add'>+static inline bool nfs_client_is_local(const struct nfs_client *clp)</div><div class='add'>+{</div><div class='add'>+	return !!rcu_access_pointer(clp-&gt;cl_uuid.net);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool nfs_server_is_local(const struct nfs_client *clp)</div><div class='add'>+{</div><div class='add'>+	return nfs_client_is_local(clp) &amp;&amp; localio_enabled;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(nfs_server_is_local);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * UUID_IS_LOCAL XDR functions</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+static void localio_xdr_enc_uuidargs(struct rpc_rqst *req,</div><div class='add'>+				     struct xdr_stream *xdr,</div><div class='add'>+				     const void *data)</div><div class='add'>+{</div><div class='add'>+	const u8 *uuid = data;</div><div class='add'>+</div><div class='add'>+	encode_opaque_fixed(xdr, uuid, UUID_SIZE);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int localio_xdr_dec_uuidres(struct rpc_rqst *req,</div><div class='add'>+				   struct xdr_stream *xdr,</div><div class='add'>+				   void *result)</div><div class='add'>+{</div><div class='add'>+	/* void return */</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct rpc_procinfo nfs_localio_procedures[] = {</div><div class='add'>+	[LOCALIOPROC_UUID_IS_LOCAL] = {</div><div class='add'>+		.p_proc = LOCALIOPROC_UUID_IS_LOCAL,</div><div class='add'>+		.p_encode = localio_xdr_enc_uuidargs,</div><div class='add'>+		.p_decode = localio_xdr_dec_uuidres,</div><div class='add'>+		.p_arglen = XDR_QUADLEN(UUID_SIZE),</div><div class='add'>+		.p_replen = 0,</div><div class='add'>+		.p_statidx = LOCALIOPROC_UUID_IS_LOCAL,</div><div class='add'>+		.p_name = "UUID_IS_LOCAL",</div><div class='add'>+	},</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static unsigned int nfs_localio_counts[ARRAY_SIZE(nfs_localio_procedures)];</div><div class='add'>+static const struct rpc_version nfslocalio_version1 = {</div><div class='add'>+	.number			= 1,</div><div class='add'>+	.nrprocs		= ARRAY_SIZE(nfs_localio_procedures),</div><div class='add'>+	.procs			= nfs_localio_procedures,</div><div class='add'>+	.counts			= nfs_localio_counts,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct rpc_version *nfslocalio_version[] = {</div><div class='add'>+       [1]			= &amp;nfslocalio_version1,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+extern const struct rpc_program nfslocalio_program;</div><div class='add'>+static struct rpc_stat		nfslocalio_rpcstat = { &amp;nfslocalio_program };</div><div class='add'>+</div><div class='add'>+const struct rpc_program nfslocalio_program = {</div><div class='add'>+	.name			= "nfslocalio",</div><div class='add'>+	.number			= NFS_LOCALIO_PROGRAM,</div><div class='add'>+	.nrvers			= ARRAY_SIZE(nfslocalio_version),</div><div class='add'>+	.version		= nfslocalio_version,</div><div class='add'>+	.stats			= &amp;nfslocalio_rpcstat,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * nfs_init_localioclient - Initialise an NFS localio client connection</div><div class='add'>+ */</div><div class='add'>+static struct rpc_clnt *nfs_init_localioclient(struct nfs_client *clp)</div><div class='add'>+{</div><div class='add'>+	struct rpc_clnt *rpcclient_localio;</div><div class='add'>+</div><div class='add'>+	rpcclient_localio = rpc_bind_new_program(clp-&gt;cl_rpcclient,</div><div class='add'>+						 &amp;nfslocalio_program, 1);</div><div class='add'>+</div><div class='add'>+	dprintk_rcu("%s: server (%s) %s NFS LOCALIO.\n",</div><div class='add'>+		__func__, rpc_peeraddr2str(clp-&gt;cl_rpcclient, RPC_DISPLAY_ADDR),</div><div class='add'>+		(IS_ERR(rpcclient_localio) ? "does not support" : "supports"));</div><div class='add'>+</div><div class='add'>+	return rpcclient_localio;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool nfs_server_uuid_is_local(struct nfs_client *clp)</div><div class='add'>+{</div><div class='add'>+	u8 uuid[UUID_SIZE];</div><div class='add'>+	struct rpc_message msg = {</div><div class='add'>+		.rpc_argp = &amp;uuid,</div><div class='add'>+	};</div><div class='add'>+	struct rpc_clnt *rpcclient_localio;</div><div class='add'>+	int status;</div><div class='add'>+</div><div class='add'>+	rpcclient_localio = nfs_init_localioclient(clp);</div><div class='add'>+	if (IS_ERR(rpcclient_localio))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	export_uuid(uuid, &amp;clp-&gt;cl_uuid.uuid);</div><div class='add'>+</div><div class='add'>+	msg.rpc_proc = &amp;nfs_localio_procedures[LOCALIOPROC_UUID_IS_LOCAL];</div><div class='add'>+	status = rpc_call_sync(rpcclient_localio, &amp;msg, 0);</div><div class='add'>+	dprintk("%s: NFS reply UUID_IS_LOCAL: status=%d\n",</div><div class='add'>+		__func__, status);</div><div class='add'>+	rpc_shutdown_client(rpcclient_localio);</div><div class='add'>+</div><div class='add'>+	/* Server is only local if it initialized required struct members */</div><div class='add'>+	if (status || !rcu_access_pointer(clp-&gt;cl_uuid.net) || !clp-&gt;cl_uuid.dom)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * nfs_local_probe - probe local i/o support for an nfs_server and nfs_client</div><div class='add'>+ * - called after alloc_client and init_client (so cl_rpcclient exists)</div><div class='add'>+ * - this function is idempotent, it can be called for old or new clients</div><div class='add'>+ */</div><div class='add'>+static void nfs_local_probe(struct nfs_client *clp)</div><div class='add'>+{</div><div class='add'>+	/* Disallow localio if disabled via sysfs or AUTH_SYS isn't used */</div><div class='add'>+	if (!localio_enabled ||</div><div class='add'>+	    clp-&gt;cl_rpcclient-&gt;cl_auth-&gt;au_flavor != RPC_AUTH_UNIX) {</div><div class='add'>+		nfs_localio_disable_client(clp);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (nfs_client_is_local(clp))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	if (!nfs_uuid_begin(&amp;clp-&gt;cl_uuid))</div><div class='add'>+		return;</div><div class='add'>+	if (nfs_server_uuid_is_local(clp))</div><div class='add'>+		nfs_localio_enable_client(clp);</div><div class='add'>+	nfs_uuid_end(&amp;clp-&gt;cl_uuid);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void nfs_local_probe_async_work(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct nfs_client *clp =</div><div class='add'>+		container_of(work, struct nfs_client, cl_local_probe_work);</div><div class='add'>+</div><div class='add'>+	if (!refcount_inc_not_zero(&amp;clp-&gt;cl_count))</div><div class='add'>+		return;</div><div class='add'>+	nfs_local_probe(clp);</div><div class='add'>+	nfs_put_client(clp);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void nfs_local_probe_async(struct nfs_client *clp)</div><div class='add'>+{</div><div class='add'>+	queue_work(nfsiod_workqueue, &amp;clp-&gt;cl_local_probe_work);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(nfs_local_probe_async);</div><div class='add'>+</div><div class='add'>+static inline void nfs_local_file_put(struct nfsd_file *localio)</div><div class='add'>+{</div><div class='add'>+	/* nfs_to_nfsd_file_put_local() expects an __rcu pointer</div><div class='add'>+	 * but we have a __kernel pointer.  It is always safe</div><div class='add'>+	 * to cast a __kernel pointer to an __rcu pointer</div><div class='add'>+	 * because the cast only weakens what is known about the pointer.</div><div class='add'>+	 */</div><div class='add'>+	struct nfsd_file __rcu *nf = (struct nfsd_file __rcu*) localio;</div><div class='add'>+</div><div class='add'>+	nfs_to_nfsd_file_put_local(&amp;nf);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * __nfs_local_open_fh - open a local filehandle in terms of nfsd_file.</div><div class='add'>+ *</div><div class='add'>+ * Returns a pointer to a struct nfsd_file or ERR_PTR.</div><div class='add'>+ * Caller must release returned nfsd_file with nfs_to_nfsd_file_put_local().</div><div class='add'>+ */</div><div class='add'>+static struct nfsd_file *</div><div class='add'>+__nfs_local_open_fh(struct nfs_client *clp, const struct cred *cred,</div><div class='add'>+		    struct nfs_fh *fh, struct nfs_file_localio *nfl,</div><div class='add'>+		    struct nfsd_file __rcu **pnf,</div><div class='add'>+		    const fmode_t mode)</div><div class='add'>+{</div><div class='add'>+	int status = 0;</div><div class='add'>+	struct nfsd_file *localio;</div><div class='add'>+</div><div class='add'>+	localio = nfs_open_local_fh(&amp;clp-&gt;cl_uuid, clp-&gt;cl_rpcclient,</div><div class='add'>+				    cred, fh, nfl, pnf, mode);</div><div class='add'>+	if (IS_ERR(localio)) {</div><div class='add'>+		status = PTR_ERR(localio);</div><div class='add'>+		switch (status) {</div><div class='add'>+		case -ENOMEM:</div><div class='add'>+		case -ENXIO:</div><div class='add'>+		case -ENOENT:</div><div class='add'>+			/* Revalidate localio */</div><div class='add'>+			nfs_localio_disable_client(clp);</div><div class='add'>+			nfs_local_probe(clp);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	trace_nfs_local_open_fh(fh, mode, status);</div><div class='add'>+	return localio;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * nfs_local_open_fh - open a local filehandle in terms of nfsd_file.</div><div class='add'>+ * First checking if the open nfsd_file is already cached, otherwise</div><div class='add'>+ * must __nfs_local_open_fh and insert the nfsd_file in nfs_file_localio.</div><div class='add'>+ *</div><div class='add'>+ * Returns a pointer to a struct nfsd_file or NULL.</div><div class='add'>+ */</div><div class='add'>+struct nfsd_file *</div><div class='add'>+nfs_local_open_fh(struct nfs_client *clp, const struct cred *cred,</div><div class='add'>+		  struct nfs_fh *fh, struct nfs_file_localio *nfl,</div><div class='add'>+		  const fmode_t mode)</div><div class='add'>+{</div><div class='add'>+	struct nfsd_file *nf, __rcu **pnf;</div><div class='add'>+</div><div class='add'>+	if (!nfs_server_is_local(clp))</div><div class='add'>+		return NULL;</div><div class='add'>+	if (mode &amp; ~(FMODE_READ | FMODE_WRITE))</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	if (mode &amp; FMODE_WRITE)</div><div class='add'>+		pnf = &amp;nfl-&gt;rw_file;</div><div class='add'>+	else</div><div class='add'>+		pnf = &amp;nfl-&gt;ro_file;</div><div class='add'>+</div><div class='add'>+	nf = __nfs_local_open_fh(clp, cred, fh, nfl, pnf, mode);</div><div class='add'>+	if (IS_ERR(nf))</div><div class='add'>+		return NULL;</div><div class='add'>+	return nf;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(nfs_local_open_fh);</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+nfs_local_iocb_free(struct nfs_local_kiocb *iocb)</div><div class='add'>+{</div><div class='add'>+	kfree(iocb-&gt;bvec);</div><div class='add'>+	kfree(iocb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct nfs_local_kiocb *</div><div class='add'>+nfs_local_iocb_alloc(struct nfs_pgio_header *hdr,</div><div class='add'>+		     struct file *file, gfp_t flags)</div><div class='add'>+{</div><div class='add'>+	struct nfs_local_kiocb *iocb;</div><div class='add'>+</div><div class='add'>+	iocb = kzalloc(sizeof(*iocb), flags);</div><div class='add'>+	if (iocb == NULL)</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	iocb-&gt;bvec = kmalloc_array(hdr-&gt;page_array.npages,</div><div class='add'>+				   sizeof(struct bio_vec), flags);</div><div class='add'>+	if (iocb-&gt;bvec == NULL) {</div><div class='add'>+		kfree(iocb);</div><div class='add'>+		return NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	init_sync_kiocb(&amp;iocb-&gt;kiocb, file);</div><div class='add'>+</div><div class='add'>+	iocb-&gt;hdr = hdr;</div><div class='add'>+	iocb-&gt;kiocb.ki_pos = hdr-&gt;args.offset;</div><div class='add'>+	iocb-&gt;kiocb.ki_flags &amp;= ~IOCB_APPEND;</div><div class='add'>+	iocb-&gt;kiocb.ki_complete = NULL;</div><div class='add'>+	iocb-&gt;aio_complete_work = NULL;</div><div class='add'>+</div><div class='add'>+	iocb-&gt;end_iter_index = -1;</div><div class='add'>+</div><div class='add'>+	return iocb;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool</div><div class='add'>+nfs_is_local_dio_possible(struct nfs_local_kiocb *iocb, int rw,</div><div class='add'>+			  size_t len, struct nfs_local_dio *local_dio)</div><div class='add'>+{</div><div class='add'>+	struct nfs_pgio_header *hdr = iocb-&gt;hdr;</div><div class='add'>+	loff_t offset = hdr-&gt;args.offset;</div><div class='add'>+	u32 nf_dio_mem_align, nf_dio_offset_align, nf_dio_read_offset_align;</div><div class='add'>+	loff_t start_end, orig_end, middle_end;</div><div class='add'>+</div><div class='add'>+	nfs_to-&gt;nfsd_file_dio_alignment(iocb-&gt;localio, &amp;nf_dio_mem_align,</div><div class='add'>+			&amp;nf_dio_offset_align, &amp;nf_dio_read_offset_align);</div><div class='add'>+	if (rw == ITER_DEST)</div><div class='add'>+		nf_dio_offset_align = nf_dio_read_offset_align;</div><div class='add'>+</div><div class='add'>+	if (unlikely(!nf_dio_mem_align || !nf_dio_offset_align))</div><div class='add'>+		return false;</div><div class='add'>+	if (unlikely(nf_dio_offset_align &gt; PAGE_SIZE))</div><div class='add'>+		return false;</div><div class='add'>+	if (unlikely(len &lt; nf_dio_offset_align))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	local_dio-&gt;mem_align = nf_dio_mem_align;</div><div class='add'>+	local_dio-&gt;offset_align = nf_dio_offset_align;</div><div class='add'>+</div><div class='add'>+	start_end = round_up(offset, nf_dio_offset_align);</div><div class='add'>+	orig_end = offset + len;</div><div class='add'>+	middle_end = round_down(orig_end, nf_dio_offset_align);</div><div class='add'>+</div><div class='add'>+	local_dio-&gt;middle_offset = start_end;</div><div class='add'>+	local_dio-&gt;end_offset = middle_end;</div><div class='add'>+</div><div class='add'>+	local_dio-&gt;start_len = start_end - offset;</div><div class='add'>+	local_dio-&gt;middle_len = middle_end - start_end;</div><div class='add'>+	local_dio-&gt;end_len = orig_end - middle_end;</div><div class='add'>+</div><div class='add'>+	if (rw == ITER_DEST)</div><div class='add'>+		trace_nfs_local_dio_read(hdr-&gt;inode, offset, len, local_dio);</div><div class='add'>+	else</div><div class='add'>+		trace_nfs_local_dio_write(hdr-&gt;inode, offset, len, local_dio);</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool nfs_iov_iter_aligned_bvec(const struct iov_iter *i,</div><div class='add'>+		unsigned int addr_mask, unsigned int len_mask)</div><div class='add'>+{</div><div class='add'>+	const struct bio_vec *bvec = i-&gt;bvec;</div><div class='add'>+	size_t skip = i-&gt;iov_offset;</div><div class='add'>+	size_t size = i-&gt;count;</div><div class='add'>+</div><div class='add'>+	if (size &amp; len_mask)</div><div class='add'>+		return false;</div><div class='add'>+	do {</div><div class='add'>+		size_t len = bvec-&gt;bv_len;</div><div class='add'>+</div><div class='add'>+		if (len &gt; size)</div><div class='add'>+			len = size;</div><div class='add'>+		if ((unsigned long)(bvec-&gt;bv_offset + skip) &amp; addr_mask)</div><div class='add'>+			return false;</div><div class='add'>+		bvec++;</div><div class='add'>+		size -= len;</div><div class='add'>+		skip = 0;</div><div class='add'>+	} while (size);</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+nfs_local_iter_setup(struct iov_iter *iter, int rw, struct bio_vec *bvec,</div><div class='add'>+		     unsigned int nvecs, unsigned long total,</div><div class='add'>+		     size_t start, size_t len)</div><div class='add'>+{</div><div class='add'>+	iov_iter_bvec(iter, rw, bvec, nvecs, total);</div><div class='add'>+	if (start)</div><div class='add'>+		iov_iter_advance(iter, start);</div><div class='add'>+	iov_iter_truncate(iter, len);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Setup as many as 3 iov_iter based on extents described by @local_dio.</div><div class='add'>+ * Returns the number of iov_iter that were setup.</div><div class='add'>+ */</div><div class='add'>+static int</div><div class='add'>+nfs_local_iters_setup_dio(struct nfs_local_kiocb *iocb, int rw,</div><div class='add'>+			  unsigned int nvecs, unsigned long total,</div><div class='add'>+			  struct nfs_local_dio *local_dio)</div><div class='add'>+{</div><div class='add'>+	int n_iters = 0;</div><div class='add'>+	struct iov_iter *iters = iocb-&gt;iters;</div><div class='add'>+</div><div class='add'>+	/* Setup misaligned start? */</div><div class='add'>+	if (local_dio-&gt;start_len) {</div><div class='add'>+		nfs_local_iter_setup(&amp;iters[n_iters], rw, iocb-&gt;bvec,</div><div class='add'>+				     nvecs, total, 0, local_dio-&gt;start_len);</div><div class='add'>+		++n_iters;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Setup DIO-aligned middle, if there is no misaligned end (below)</div><div class='add'>+	 * then AIO completion is used, see nfs_local_call_{read,write}</div><div class='add'>+	 */</div><div class='add'>+	nfs_local_iter_setup(&amp;iters[n_iters], rw, iocb-&gt;bvec, nvecs,</div><div class='add'>+			     total, local_dio-&gt;start_len, local_dio-&gt;middle_len);</div><div class='add'>+</div><div class='add'>+	iocb-&gt;iter_is_dio_aligned[n_iters] =</div><div class='add'>+		nfs_iov_iter_aligned_bvec(&amp;iters[n_iters],</div><div class='add'>+			local_dio-&gt;mem_align-1, local_dio-&gt;offset_align-1);</div><div class='add'>+</div><div class='add'>+	if (unlikely(!iocb-&gt;iter_is_dio_aligned[n_iters])) {</div><div class='add'>+		trace_nfs_local_dio_misaligned(iocb-&gt;hdr-&gt;inode,</div><div class='add'>+			local_dio-&gt;start_len, local_dio-&gt;middle_len, local_dio);</div><div class='add'>+		return 0; /* no DIO-aligned IO possible */</div><div class='add'>+	}</div><div class='add'>+	iocb-&gt;end_iter_index = n_iters;</div><div class='add'>+	++n_iters;</div><div class='add'>+</div><div class='add'>+	/* Setup misaligned end? */</div><div class='add'>+	if (local_dio-&gt;end_len) {</div><div class='add'>+		nfs_local_iter_setup(&amp;iters[n_iters], rw, iocb-&gt;bvec,</div><div class='add'>+				     nvecs, total, local_dio-&gt;start_len +</div><div class='add'>+				     local_dio-&gt;middle_len, local_dio-&gt;end_len);</div><div class='add'>+		iocb-&gt;end_iter_index = n_iters;</div><div class='add'>+		++n_iters;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	atomic_set(&amp;iocb-&gt;n_iters, n_iters);</div><div class='add'>+	return n_iters;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static noinline_for_stack void</div><div class='add'>+nfs_local_iters_init(struct nfs_local_kiocb *iocb, int rw)</div><div class='add'>+{</div><div class='add'>+	struct nfs_pgio_header *hdr = iocb-&gt;hdr;</div><div class='add'>+	struct page **pagevec = hdr-&gt;page_array.pagevec;</div><div class='add'>+	unsigned long v, total;</div><div class='add'>+	unsigned int base;</div><div class='add'>+	size_t len;</div><div class='add'>+</div><div class='add'>+	v = 0;</div><div class='add'>+	total = hdr-&gt;args.count;</div><div class='add'>+	base = hdr-&gt;args.pgbase;</div><div class='add'>+	while (total &amp;&amp; v &lt; hdr-&gt;page_array.npages) {</div><div class='add'>+		len = min_t(size_t, total, PAGE_SIZE - base);</div><div class='add'>+		bvec_set_page(&amp;iocb-&gt;bvec[v], *pagevec, len, base);</div><div class='add'>+		total -= len;</div><div class='add'>+		++pagevec;</div><div class='add'>+		++v;</div><div class='add'>+		base = 0;</div><div class='add'>+	}</div><div class='add'>+	len = hdr-&gt;args.count - total;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * For each iocb, iocb-&gt;n_iters is always at least 1 and we always</div><div class='add'>+	 * end io after first nfs_local_pgio_done call unless misaligned DIO.</div><div class='add'>+	 */</div><div class='add'>+	atomic_set(&amp;iocb-&gt;n_iters, 1);</div><div class='add'>+</div><div class='add'>+	if (test_bit(NFS_IOHDR_ODIRECT, &amp;hdr-&gt;flags)) {</div><div class='add'>+		struct nfs_local_dio local_dio;</div><div class='add'>+</div><div class='add'>+		if (nfs_is_local_dio_possible(iocb, rw, len, &amp;local_dio) &amp;&amp;</div><div class='add'>+		    nfs_local_iters_setup_dio(iocb, rw, v, len, &amp;local_dio) != 0) {</div><div class='add'>+			/* Ensure DIO WRITE's IO on stable storage upon completion */</div><div class='add'>+			if (rw == ITER_SOURCE)</div><div class='add'>+				iocb-&gt;kiocb.ki_flags |= IOCB_DSYNC|IOCB_SYNC;</div><div class='add'>+			return; /* is DIO-aligned */</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Use buffered IO */</div><div class='add'>+	iov_iter_bvec(&amp;iocb-&gt;iters[0], rw, iocb-&gt;bvec, v, len);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+nfs_local_hdr_release(struct nfs_pgio_header *hdr,</div><div class='add'>+		const struct rpc_call_ops *call_ops)</div><div class='add'>+{</div><div class='add'>+	call_ops-&gt;rpc_call_done(&amp;hdr-&gt;task, hdr);</div><div class='add'>+	call_ops-&gt;rpc_release(hdr);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+nfs_local_pgio_init(struct nfs_pgio_header *hdr,</div><div class='add'>+		const struct rpc_call_ops *call_ops)</div><div class='add'>+{</div><div class='add'>+	hdr-&gt;task.tk_ops = call_ops;</div><div class='add'>+	if (!hdr-&gt;task.tk_start)</div><div class='add'>+		hdr-&gt;task.tk_start = ktime_get();</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool</div><div class='add'>+nfs_local_pgio_done(struct nfs_local_kiocb *iocb, long status, bool force)</div><div class='add'>+{</div><div class='add'>+	struct nfs_pgio_header *hdr = iocb-&gt;hdr;</div><div class='add'>+</div><div class='add'>+	/* Must handle partial completions */</div><div class='add'>+	if (status &gt;= 0) {</div><div class='add'>+		hdr-&gt;res.count += status;</div><div class='add'>+		/* @hdr was initialized to 0 (zeroed during allocation) */</div><div class='add'>+		if (hdr-&gt;task.tk_status == 0)</div><div class='add'>+			hdr-&gt;res.op_status = NFS4_OK;</div><div class='add'>+	} else {</div><div class='add'>+		hdr-&gt;res.op_status = nfs_localio_errno_to_nfs4_stat(status);</div><div class='add'>+		hdr-&gt;task.tk_status = status;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (force)</div><div class='add'>+		return true;</div><div class='add'>+</div><div class='add'>+	BUG_ON(atomic_read(&amp;iocb-&gt;n_iters) &lt;= 0);</div><div class='add'>+	return atomic_dec_and_test(&amp;iocb-&gt;n_iters);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+nfs_local_iocb_release(struct nfs_local_kiocb *iocb)</div><div class='add'>+{</div><div class='add'>+	nfs_local_file_put(iocb-&gt;localio);</div><div class='add'>+	nfs_local_iocb_free(iocb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+nfs_local_pgio_release(struct nfs_local_kiocb *iocb)</div><div class='add'>+{</div><div class='add'>+	struct nfs_pgio_header *hdr = iocb-&gt;hdr;</div><div class='add'>+</div><div class='add'>+	nfs_local_iocb_release(iocb);</div><div class='add'>+	nfs_local_hdr_release(hdr, hdr-&gt;task.tk_ops);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Complete the I/O from iocb-&gt;kiocb.ki_complete()</div><div class='add'>+ *</div><div class='add'>+ * Note that this function can be called from a bottom half context,</div><div class='add'>+ * hence we need to queue the rpc_call_done() etc to a workqueue</div><div class='add'>+ */</div><div class='add'>+static inline void nfs_local_pgio_aio_complete(struct nfs_local_kiocb *iocb)</div><div class='add'>+{</div><div class='add'>+	INIT_WORK(&amp;iocb-&gt;work, iocb-&gt;aio_complete_work);</div><div class='add'>+	queue_work(nfsiod_workqueue, &amp;iocb-&gt;work);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfs_local_read_done(struct nfs_local_kiocb *iocb)</div><div class='add'>+{</div><div class='add'>+	struct nfs_pgio_header *hdr = iocb-&gt;hdr;</div><div class='add'>+	struct file *filp = iocb-&gt;kiocb.ki_filp;</div><div class='add'>+	long status = hdr-&gt;task.tk_status;</div><div class='add'>+</div><div class='add'>+	if ((iocb-&gt;kiocb.ki_flags &amp; IOCB_DIRECT) &amp;&amp; status == -EINVAL) {</div><div class='add'>+		/* Underlying FS will return -EINVAL if misaligned DIO is attempted. */</div><div class='add'>+		pr_info_ratelimited("nfs: Unexpected direct I/O read alignment failure\n");</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Must clear replen otherwise NFSv3 data corruption will occur</div><div class='add'>+	 * if/when switching from LOCALIO back to using normal RPC.</div><div class='add'>+	 */</div><div class='add'>+	hdr-&gt;res.replen = 0;</div><div class='add'>+</div><div class='add'>+	/* nfs_readpage_result() handles short read */</div><div class='add'>+</div><div class='add'>+	if (hdr-&gt;args.offset + hdr-&gt;res.count &gt;= i_size_read(file_inode(filp)))</div><div class='add'>+		hdr-&gt;res.eof = true;</div><div class='add'>+</div><div class='add'>+	dprintk("%s: read %ld bytes eof %d.\n", __func__,</div><div class='add'>+			status &gt; 0 ? status : 0, hdr-&gt;res.eof);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void nfs_local_read_iocb_done(struct nfs_local_kiocb *iocb)</div><div class='add'>+{</div><div class='add'>+	nfs_local_read_done(iocb);</div><div class='add'>+	nfs_local_pgio_release(iocb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfs_local_read_aio_complete_work(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct nfs_local_kiocb *iocb =</div><div class='add'>+		container_of(work, struct nfs_local_kiocb, work);</div><div class='add'>+</div><div class='add'>+	nfs_local_read_iocb_done(iocb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfs_local_read_aio_complete(struct kiocb *kiocb, long ret)</div><div class='add'>+{</div><div class='add'>+	struct nfs_local_kiocb *iocb =</div><div class='add'>+		container_of(kiocb, struct nfs_local_kiocb, kiocb);</div><div class='add'>+</div><div class='add'>+	/* AIO completion of DIO read should always be last to complete */</div><div class='add'>+	if (unlikely(!nfs_local_pgio_done(iocb, ret, false)))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	nfs_local_pgio_aio_complete(iocb); /* Calls nfs_local_read_aio_complete_work */</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfs_local_call_read(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct nfs_local_kiocb *iocb =</div><div class='add'>+		container_of(work, struct nfs_local_kiocb, work);</div><div class='add'>+	struct file *filp = iocb-&gt;kiocb.ki_filp;</div><div class='add'>+	bool force_done = false;</div><div class='add'>+	ssize_t status;</div><div class='add'>+	int n_iters;</div><div class='add'>+</div><div class='add'>+	n_iters = atomic_read(&amp;iocb-&gt;n_iters);</div><div class='add'>+	for (int i = 0; i &lt; n_iters ; i++) {</div><div class='add'>+		if (iocb-&gt;iter_is_dio_aligned[i]) {</div><div class='add'>+			iocb-&gt;kiocb.ki_flags |= IOCB_DIRECT;</div><div class='add'>+			/* Only use AIO completion if DIO-aligned segment is last */</div><div class='add'>+			if (i == iocb-&gt;end_iter_index) {</div><div class='add'>+				iocb-&gt;kiocb.ki_complete = nfs_local_read_aio_complete;</div><div class='add'>+				iocb-&gt;aio_complete_work = nfs_local_read_aio_complete_work;</div><div class='add'>+			}</div><div class='add'>+		} else</div><div class='add'>+			iocb-&gt;kiocb.ki_flags &amp;= ~IOCB_DIRECT;</div><div class='add'>+</div><div class='add'>+		scoped_with_creds(filp-&gt;f_cred)</div><div class='add'>+			status = filp-&gt;f_op-&gt;read_iter(&amp;iocb-&gt;kiocb, &amp;iocb-&gt;iters[i]);</div><div class='add'>+</div><div class='add'>+		if (status != -EIOCBQUEUED) {</div><div class='add'>+			if (unlikely(status &gt;= 0 &amp;&amp; status &lt; iocb-&gt;iters[i].count))</div><div class='add'>+				force_done = true; /* Partial read */</div><div class='add'>+			if (nfs_local_pgio_done(iocb, status, force_done)) {</div><div class='add'>+				nfs_local_read_iocb_done(iocb);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int</div><div class='add'>+nfs_local_do_read(struct nfs_local_kiocb *iocb,</div><div class='add'>+		  const struct rpc_call_ops *call_ops)</div><div class='add'>+{</div><div class='add'>+	struct nfs_pgio_header *hdr = iocb-&gt;hdr;</div><div class='add'>+</div><div class='add'>+	dprintk("%s: vfs_read count=%u pos=%llu\n",</div><div class='add'>+		__func__, hdr-&gt;args.count, hdr-&gt;args.offset);</div><div class='add'>+</div><div class='add'>+	nfs_local_pgio_init(hdr, call_ops);</div><div class='add'>+	hdr-&gt;res.eof = false;</div><div class='add'>+</div><div class='add'>+	INIT_WORK(&amp;iocb-&gt;work, nfs_local_call_read);</div><div class='add'>+	queue_work(nfslocaliod_workqueue, &amp;iocb-&gt;work);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+nfs_copy_boot_verifier(struct nfs_write_verifier *verifier, struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct nfs_client *clp = NFS_SERVER(inode)-&gt;nfs_client;</div><div class='add'>+	u32 *verf = (u32 *)verifier-&gt;data;</div><div class='add'>+	unsigned int seq;</div><div class='add'>+</div><div class='add'>+	do {</div><div class='add'>+		seq = read_seqbegin(&amp;clp-&gt;cl_boot_lock);</div><div class='add'>+		verf[0] = (u32)clp-&gt;cl_nfssvc_boot.tv_sec;</div><div class='add'>+		verf[1] = (u32)clp-&gt;cl_nfssvc_boot.tv_nsec;</div><div class='add'>+	} while (read_seqretry(&amp;clp-&gt;cl_boot_lock, seq));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+nfs_reset_boot_verifier(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct nfs_client *clp = NFS_SERVER(inode)-&gt;nfs_client;</div><div class='add'>+</div><div class='add'>+	write_seqlock(&amp;clp-&gt;cl_boot_lock);</div><div class='add'>+	ktime_get_real_ts64(&amp;clp-&gt;cl_nfssvc_boot);</div><div class='add'>+	write_sequnlock(&amp;clp-&gt;cl_boot_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+nfs_set_local_verifier(struct inode *inode,</div><div class='add'>+		struct nfs_writeverf *verf,</div><div class='add'>+		enum nfs3_stable_how how)</div><div class='add'>+{</div><div class='add'>+	nfs_copy_boot_verifier(&amp;verf-&gt;verifier, inode);</div><div class='add'>+	verf-&gt;committed = how;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Factored out from fs/nfsd/vfs.h:fh_getattr() */</div><div class='add'>+static int __vfs_getattr(const struct path *p, struct kstat *stat, int version)</div><div class='add'>+{</div><div class='add'>+	u32 request_mask = STATX_BASIC_STATS;</div><div class='add'>+</div><div class='add'>+	if (version == 4)</div><div class='add'>+		request_mask |= (STATX_BTIME | STATX_CHANGE_COOKIE);</div><div class='add'>+	return vfs_getattr(p, stat, request_mask, AT_STATX_SYNC_AS_STAT);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* Copied from fs/nfsd/nfsfh.c:nfsd4_change_attribute() */</div><div class='add'>+static u64 __nfsd4_change_attribute(const struct kstat *stat,</div><div class='add'>+				    const struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	u64 chattr;</div><div class='add'>+</div><div class='add'>+	if (stat-&gt;result_mask &amp; STATX_CHANGE_COOKIE) {</div><div class='add'>+		chattr = stat-&gt;change_cookie;</div><div class='add'>+		if (S_ISREG(inode-&gt;i_mode) &amp;&amp;</div><div class='add'>+		    !(stat-&gt;attributes &amp; STATX_ATTR_CHANGE_MONOTONIC)) {</div><div class='add'>+			chattr += (u64)stat-&gt;ctime.tv_sec &lt;&lt; 30;</div><div class='add'>+			chattr += stat-&gt;ctime.tv_nsec;</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		chattr = time_to_chattr(&amp;stat-&gt;ctime);</div><div class='add'>+	}</div><div class='add'>+	return chattr;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfs_local_vfs_getattr(struct nfs_local_kiocb *iocb)</div><div class='add'>+{</div><div class='add'>+	struct kstat stat;</div><div class='add'>+	struct file *filp = iocb-&gt;kiocb.ki_filp;</div><div class='add'>+	struct nfs_pgio_header *hdr = iocb-&gt;hdr;</div><div class='add'>+	struct nfs_fattr *fattr = hdr-&gt;res.fattr;</div><div class='add'>+	int version = NFS_PROTO(hdr-&gt;inode)-&gt;version;</div><div class='add'>+</div><div class='add'>+	if (unlikely(!fattr) || __vfs_getattr(&amp;filp-&gt;f_path, &amp;stat, version))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	fattr-&gt;valid = (NFS_ATTR_FATTR_FILEID |</div><div class='add'>+			NFS_ATTR_FATTR_CHANGE |</div><div class='add'>+			NFS_ATTR_FATTR_SIZE |</div><div class='add'>+			NFS_ATTR_FATTR_ATIME |</div><div class='add'>+			NFS_ATTR_FATTR_MTIME |</div><div class='add'>+			NFS_ATTR_FATTR_CTIME |</div><div class='add'>+			NFS_ATTR_FATTR_SPACE_USED);</div><div class='add'>+</div><div class='add'>+	fattr-&gt;fileid = stat.ino;</div><div class='add'>+	fattr-&gt;size = stat.size;</div><div class='add'>+	fattr-&gt;atime = stat.atime;</div><div class='add'>+	fattr-&gt;mtime = stat.mtime;</div><div class='add'>+	fattr-&gt;ctime = stat.ctime;</div><div class='add'>+	if (version == 4) {</div><div class='add'>+		fattr-&gt;change_attr =</div><div class='add'>+			__nfsd4_change_attribute(&amp;stat, file_inode(filp));</div><div class='add'>+	} else</div><div class='add'>+		fattr-&gt;change_attr = nfs_timespec_to_change_attr(&amp;fattr-&gt;ctime);</div><div class='add'>+	fattr-&gt;du.nfs3.used = stat.blocks &lt;&lt; 9;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfs_local_write_done(struct nfs_local_kiocb *iocb)</div><div class='add'>+{</div><div class='add'>+	struct nfs_pgio_header *hdr = iocb-&gt;hdr;</div><div class='add'>+	long status = hdr-&gt;task.tk_status;</div><div class='add'>+</div><div class='add'>+	dprintk("%s: wrote %ld bytes.\n", __func__, status &gt; 0 ? status : 0);</div><div class='add'>+</div><div class='add'>+	if ((iocb-&gt;kiocb.ki_flags &amp; IOCB_DIRECT) &amp;&amp; status == -EINVAL) {</div><div class='add'>+		/* Underlying FS will return -EINVAL if misaligned DIO is attempted. */</div><div class='add'>+		pr_info_ratelimited("nfs: Unexpected direct I/O write alignment failure\n");</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Handle short writes as if they are ENOSPC */</div><div class='add'>+	status = hdr-&gt;res.count;</div><div class='add'>+	if (status &gt; 0 &amp;&amp; status &lt; hdr-&gt;args.count) {</div><div class='add'>+		hdr-&gt;mds_offset += status;</div><div class='add'>+		hdr-&gt;args.offset += status;</div><div class='add'>+		hdr-&gt;args.pgbase += status;</div><div class='add'>+		hdr-&gt;args.count -= status;</div><div class='add'>+		nfs_set_pgio_error(hdr, -ENOSPC, hdr-&gt;args.offset);</div><div class='add'>+		status = -ENOSPC;</div><div class='add'>+		/* record -ENOSPC in terms of nfs_local_pgio_done */</div><div class='add'>+		(void) nfs_local_pgio_done(iocb, status, true);</div><div class='add'>+	}</div><div class='add'>+	if (hdr-&gt;task.tk_status &lt; 0)</div><div class='add'>+		nfs_reset_boot_verifier(hdr-&gt;inode);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline void nfs_local_write_iocb_done(struct nfs_local_kiocb *iocb)</div><div class='add'>+{</div><div class='add'>+	nfs_local_write_done(iocb);</div><div class='add'>+	nfs_local_vfs_getattr(iocb);</div><div class='add'>+	nfs_local_pgio_release(iocb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfs_local_write_aio_complete_work(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct nfs_local_kiocb *iocb =</div><div class='add'>+		container_of(work, struct nfs_local_kiocb, work);</div><div class='add'>+</div><div class='add'>+	nfs_local_write_iocb_done(iocb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfs_local_write_aio_complete(struct kiocb *kiocb, long ret)</div><div class='add'>+{</div><div class='add'>+	struct nfs_local_kiocb *iocb =</div><div class='add'>+		container_of(kiocb, struct nfs_local_kiocb, kiocb);</div><div class='add'>+</div><div class='add'>+	/* AIO completion of DIO write should always be last to complete */</div><div class='add'>+	if (unlikely(!nfs_local_pgio_done(iocb, ret, false)))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	nfs_local_pgio_aio_complete(iocb); /* Calls nfs_local_write_aio_complete_work */</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfs_local_call_write(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct nfs_local_kiocb *iocb =</div><div class='add'>+		container_of(work, struct nfs_local_kiocb, work);</div><div class='add'>+	struct file *filp = iocb-&gt;kiocb.ki_filp;</div><div class='add'>+	unsigned long old_flags = current-&gt;flags;</div><div class='add'>+	bool force_done = false;</div><div class='add'>+	ssize_t status;</div><div class='add'>+	int n_iters;</div><div class='add'>+</div><div class='add'>+	current-&gt;flags |= PF_LOCAL_THROTTLE | PF_MEMALLOC_NOIO;</div><div class='add'>+</div><div class='add'>+	file_start_write(filp);</div><div class='add'>+	n_iters = atomic_read(&amp;iocb-&gt;n_iters);</div><div class='add'>+	for (int i = 0; i &lt; n_iters ; i++) {</div><div class='add'>+		if (iocb-&gt;iter_is_dio_aligned[i]) {</div><div class='add'>+			iocb-&gt;kiocb.ki_flags |= IOCB_DIRECT;</div><div class='add'>+			/* Only use AIO completion if DIO-aligned segment is last */</div><div class='add'>+			if (i == iocb-&gt;end_iter_index) {</div><div class='add'>+				iocb-&gt;kiocb.ki_complete = nfs_local_write_aio_complete;</div><div class='add'>+				iocb-&gt;aio_complete_work = nfs_local_write_aio_complete_work;</div><div class='add'>+			}</div><div class='add'>+		} else</div><div class='add'>+			iocb-&gt;kiocb.ki_flags &amp;= ~IOCB_DIRECT;</div><div class='add'>+</div><div class='add'>+		scoped_with_creds(filp-&gt;f_cred)</div><div class='add'>+			status = filp-&gt;f_op-&gt;write_iter(&amp;iocb-&gt;kiocb, &amp;iocb-&gt;iters[i]);</div><div class='add'>+</div><div class='add'>+		if (status != -EIOCBQUEUED) {</div><div class='add'>+			if (unlikely(status &gt;= 0 &amp;&amp; status &lt; iocb-&gt;iters[i].count))</div><div class='add'>+				force_done = true; /* Partial write */</div><div class='add'>+			if (nfs_local_pgio_done(iocb, status, force_done)) {</div><div class='add'>+				nfs_local_write_iocb_done(iocb);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	file_end_write(filp);</div><div class='add'>+</div><div class='add'>+	current-&gt;flags = old_flags;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int</div><div class='add'>+nfs_local_do_write(struct nfs_local_kiocb *iocb,</div><div class='add'>+		   const struct rpc_call_ops *call_ops)</div><div class='add'>+{</div><div class='add'>+	struct nfs_pgio_header *hdr = iocb-&gt;hdr;</div><div class='add'>+</div><div class='add'>+	dprintk("%s: vfs_write count=%u pos=%llu %s\n",</div><div class='add'>+		__func__, hdr-&gt;args.count, hdr-&gt;args.offset,</div><div class='add'>+		(hdr-&gt;args.stable == NFS_UNSTABLE) ?  "unstable" : "stable");</div><div class='add'>+</div><div class='add'>+	switch (hdr-&gt;args.stable) {</div><div class='add'>+	default:</div><div class='add'>+		break;</div><div class='add'>+	case NFS_DATA_SYNC:</div><div class='add'>+		iocb-&gt;kiocb.ki_flags |= IOCB_DSYNC;</div><div class='add'>+		break;</div><div class='add'>+	case NFS_FILE_SYNC:</div><div class='add'>+		iocb-&gt;kiocb.ki_flags |= IOCB_DSYNC|IOCB_SYNC;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	nfs_local_pgio_init(hdr, call_ops);</div><div class='add'>+</div><div class='add'>+	nfs_set_local_verifier(hdr-&gt;inode, hdr-&gt;res.verf, hdr-&gt;args.stable);</div><div class='add'>+</div><div class='add'>+	INIT_WORK(&amp;iocb-&gt;work, nfs_local_call_write);</div><div class='add'>+	queue_work(nfslocaliod_workqueue, &amp;iocb-&gt;work);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct nfs_local_kiocb *</div><div class='add'>+nfs_local_iocb_init(struct nfs_pgio_header *hdr, struct nfsd_file *localio)</div><div class='add'>+{</div><div class='add'>+	struct file *file = nfs_to-&gt;nfsd_file_file(localio);</div><div class='add'>+	struct nfs_local_kiocb *iocb;</div><div class='add'>+	gfp_t gfp_mask;</div><div class='add'>+	int rw;</div><div class='add'>+</div><div class='add'>+	if (hdr-&gt;rw_mode &amp; FMODE_READ) {</div><div class='add'>+		if (!file-&gt;f_op-&gt;read_iter)</div><div class='add'>+			return ERR_PTR(-EOPNOTSUPP);</div><div class='add'>+		gfp_mask = GFP_KERNEL;</div><div class='add'>+		rw = ITER_DEST;</div><div class='add'>+	} else {</div><div class='add'>+		if (!file-&gt;f_op-&gt;write_iter)</div><div class='add'>+			return ERR_PTR(-EOPNOTSUPP);</div><div class='add'>+		gfp_mask = GFP_NOIO;</div><div class='add'>+		rw = ITER_SOURCE;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	iocb = nfs_local_iocb_alloc(hdr, file, gfp_mask);</div><div class='add'>+	if (iocb == NULL)</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+	iocb-&gt;hdr = hdr;</div><div class='add'>+	iocb-&gt;localio = localio;</div><div class='add'>+</div><div class='add'>+	nfs_local_iters_init(iocb, rw);</div><div class='add'>+</div><div class='add'>+	return iocb;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int nfs_local_doio(struct nfs_client *clp, struct nfsd_file *localio,</div><div class='add'>+		   struct nfs_pgio_header *hdr,</div><div class='add'>+		   const struct rpc_call_ops *call_ops)</div><div class='add'>+{</div><div class='add'>+	struct nfs_local_kiocb *iocb;</div><div class='add'>+	int status = 0;</div><div class='add'>+</div><div class='add'>+	if (!hdr-&gt;args.count)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	iocb = nfs_local_iocb_init(hdr, localio);</div><div class='add'>+	if (IS_ERR(iocb))</div><div class='add'>+		return PTR_ERR(iocb);</div><div class='add'>+</div><div class='add'>+	switch (hdr-&gt;rw_mode) {</div><div class='add'>+	case FMODE_READ:</div><div class='add'>+		status = nfs_local_do_read(iocb, call_ops);</div><div class='add'>+		break;</div><div class='add'>+	case FMODE_WRITE:</div><div class='add'>+		status = nfs_local_do_write(iocb, call_ops);</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		dprintk("%s: invalid mode: %d\n", __func__,</div><div class='add'>+			hdr-&gt;rw_mode);</div><div class='add'>+		status = -EOPNOTSUPP;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (status != 0) {</div><div class='add'>+		if (status == -EAGAIN)</div><div class='add'>+			nfs_localio_disable_client(clp);</div><div class='add'>+		nfs_local_iocb_release(iocb);</div><div class='add'>+		hdr-&gt;task.tk_status = status;</div><div class='add'>+		nfs_local_hdr_release(hdr, call_ops);</div><div class='add'>+	}</div><div class='add'>+	return status;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+nfs_local_init_commit(struct nfs_commit_data *data,</div><div class='add'>+		const struct rpc_call_ops *call_ops)</div><div class='add'>+{</div><div class='add'>+	data-&gt;task.tk_ops = call_ops;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int</div><div class='add'>+nfs_local_run_commit(struct file *filp, struct nfs_commit_data *data)</div><div class='add'>+{</div><div class='add'>+	loff_t start = data-&gt;args.offset;</div><div class='add'>+	loff_t end = LLONG_MAX;</div><div class='add'>+</div><div class='add'>+	if (data-&gt;args.count &gt; 0) {</div><div class='add'>+		end = start + data-&gt;args.count - 1;</div><div class='add'>+		if (end &lt; start)</div><div class='add'>+			end = LLONG_MAX;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	dprintk("%s: commit %llu - %llu\n", __func__, start, end);</div><div class='add'>+	return vfs_fsync_range(filp, start, end, 0);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+nfs_local_commit_done(struct nfs_commit_data *data, int status)</div><div class='add'>+{</div><div class='add'>+	if (status &gt;= 0) {</div><div class='add'>+		nfs_set_local_verifier(data-&gt;inode,</div><div class='add'>+				data-&gt;res.verf,</div><div class='add'>+				NFS_FILE_SYNC);</div><div class='add'>+		data-&gt;res.op_status = NFS4_OK;</div><div class='add'>+		data-&gt;task.tk_status = 0;</div><div class='add'>+	} else {</div><div class='add'>+		nfs_reset_boot_verifier(data-&gt;inode);</div><div class='add'>+		data-&gt;res.op_status = nfs_localio_errno_to_nfs4_stat(status);</div><div class='add'>+		data-&gt;task.tk_status = status;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+nfs_local_release_commit_data(struct nfsd_file *localio,</div><div class='add'>+		struct nfs_commit_data *data,</div><div class='add'>+		const struct rpc_call_ops *call_ops)</div><div class='add'>+{</div><div class='add'>+	nfs_local_file_put(localio);</div><div class='add'>+	call_ops-&gt;rpc_call_done(&amp;data-&gt;task, data);</div><div class='add'>+	call_ops-&gt;rpc_release(data);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+nfs_local_fsync_ctx_free(struct nfs_local_fsync_ctx *ctx)</div><div class='add'>+{</div><div class='add'>+	nfs_local_release_commit_data(ctx-&gt;localio, ctx-&gt;data,</div><div class='add'>+				      ctx-&gt;data-&gt;task.tk_ops);</div><div class='add'>+	kfree(ctx);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+nfs_local_fsync_work(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct nfs_local_fsync_ctx *ctx;</div><div class='add'>+	int status;</div><div class='add'>+</div><div class='add'>+	ctx = container_of(work, struct nfs_local_fsync_ctx, work);</div><div class='add'>+</div><div class='add'>+	status = nfs_local_run_commit(nfs_to-&gt;nfsd_file_file(ctx-&gt;localio),</div><div class='add'>+				      ctx-&gt;data);</div><div class='add'>+	nfs_local_commit_done(ctx-&gt;data, status);</div><div class='add'>+	if (ctx-&gt;done != NULL)</div><div class='add'>+		complete(ctx-&gt;done);</div><div class='add'>+	nfs_local_fsync_ctx_free(ctx);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct nfs_local_fsync_ctx *</div><div class='add'>+nfs_local_fsync_ctx_alloc(struct nfs_commit_data *data,</div><div class='add'>+			  struct nfsd_file *localio, gfp_t flags)</div><div class='add'>+{</div><div class='add'>+	struct nfs_local_fsync_ctx *ctx = kmalloc(sizeof(*ctx), flags);</div><div class='add'>+</div><div class='add'>+	if (ctx != NULL) {</div><div class='add'>+		ctx-&gt;localio = localio;</div><div class='add'>+		ctx-&gt;data = data;</div><div class='add'>+		INIT_WORK(&amp;ctx-&gt;work, nfs_local_fsync_work);</div><div class='add'>+		ctx-&gt;done = NULL;</div><div class='add'>+	}</div><div class='add'>+	return ctx;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int nfs_local_commit(struct nfsd_file *localio,</div><div class='add'>+		     struct nfs_commit_data *data,</div><div class='add'>+		     const struct rpc_call_ops *call_ops, int how)</div><div class='add'>+{</div><div class='add'>+	struct nfs_local_fsync_ctx *ctx;</div><div class='add'>+</div><div class='add'>+	ctx = nfs_local_fsync_ctx_alloc(data, localio, GFP_KERNEL);</div><div class='add'>+	if (!ctx) {</div><div class='add'>+		nfs_local_commit_done(data, -ENOMEM);</div><div class='add'>+		nfs_local_release_commit_data(localio, data, call_ops);</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	nfs_local_init_commit(data, call_ops);</div><div class='add'>+</div><div class='add'>+	if (how &amp; FLUSH_SYNC) {</div><div class='add'>+		DECLARE_COMPLETION_ONSTACK(done);</div><div class='add'>+		ctx-&gt;done = &amp;done;</div><div class='add'>+		queue_work(nfsiod_workqueue, &amp;ctx-&gt;work);</div><div class='add'>+		wait_for_completion(&amp;done);</div><div class='add'>+	} else</div><div class='add'>+		queue_work(nfsiod_workqueue, &amp;ctx-&gt;work);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/nfs/mount_clnt.c b/fs/nfs/mount_clnt.c<br/>index c5e3b6b3366a..db8dfb920394 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/mount_clnt.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/mount_clnt.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/mount_clnt.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/mount_clnt.c</a></div><div class='hunk'>@@ -128,11 +128,6 @@ struct mountres {</div><div class='ctx'> 	rpc_authflavor_t *auth_flavors;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-struct mnt_fhstatus {</div><div class='del'>-	u32 status;</div><div class='del'>-	struct nfs_fh *fh;</div><div class='del'>-};</div><div class='del'>-</div><div class='ctx'> /**</div><div class='ctx'>  * nfs_mount - Obtain an NFS file handle for the given host and path</div><div class='ctx'>  * @info: pointer to mount request arguments</div><div class='hunk'>@@ -158,7 +153,7 @@ int nfs_mount(struct nfs_mount_request *info, int timeo, int retrans)</div><div class='ctx'> 	struct rpc_create_args args = {</div><div class='ctx'> 		.net		= info-&gt;net,</div><div class='ctx'> 		.protocol	= info-&gt;protocol,</div><div class='del'>-		.address	= info-&gt;sap,</div><div class='add'>+		.address	= (struct sockaddr *)info-&gt;sap,</div><div class='ctx'> 		.addrsize	= info-&gt;salen,</div><div class='ctx'> 		.timeout	= &amp;mnt_timeout,</div><div class='ctx'> 		.servername	= info-&gt;hostname,</div><div class='hunk'>@@ -228,74 +223,6 @@ out_mnt_err:</div><div class='ctx'> 	goto out;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * nfs_umount - Notify a server that we have unmounted this export</div><div class='del'>- * @info: pointer to umount request arguments</div><div class='del'>- *</div><div class='del'>- * MOUNTPROC_UMNT is advisory, so we set a short timeout, and always</div><div class='del'>- * use UDP.</div><div class='del'>- */</div><div class='del'>-void nfs_umount(const struct nfs_mount_request *info)</div><div class='del'>-{</div><div class='del'>-	static const struct rpc_timeout nfs_umnt_timeout = {</div><div class='del'>-		.to_initval = 1 * HZ,</div><div class='del'>-		.to_maxval = 3 * HZ,</div><div class='del'>-		.to_retries = 2,</div><div class='del'>-	};</div><div class='del'>-	struct rpc_create_args args = {</div><div class='del'>-		.net		= info-&gt;net,</div><div class='del'>-		.protocol	= IPPROTO_UDP,</div><div class='del'>-		.address	= info-&gt;sap,</div><div class='del'>-		.addrsize	= info-&gt;salen,</div><div class='del'>-		.timeout	= &amp;nfs_umnt_timeout,</div><div class='del'>-		.servername	= info-&gt;hostname,</div><div class='del'>-		.program	= &amp;mnt_program,</div><div class='del'>-		.version	= info-&gt;version,</div><div class='del'>-		.authflavor	= RPC_AUTH_UNIX,</div><div class='del'>-		.flags		= RPC_CLNT_CREATE_NOPING,</div><div class='del'>-		.cred		= current_cred(),</div><div class='del'>-	};</div><div class='del'>-	struct rpc_message msg	= {</div><div class='del'>-		.rpc_argp	= info-&gt;dirpath,</div><div class='del'>-	};</div><div class='del'>-	struct rpc_clnt *clnt;</div><div class='del'>-	int status;</div><div class='del'>-</div><div class='del'>-	if (strlen(info-&gt;dirpath) &gt; MNTPATHLEN)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	if (info-&gt;noresvport)</div><div class='del'>-		args.flags |= RPC_CLNT_CREATE_NONPRIVPORT;</div><div class='del'>-</div><div class='del'>-	clnt = rpc_create(&amp;args);</div><div class='del'>-	if (IS_ERR(clnt))</div><div class='del'>-		goto out_clnt_err;</div><div class='del'>-</div><div class='del'>-	dprintk("NFS: sending UMNT request for %s:%s\n",</div><div class='del'>-		(info-&gt;hostname ? info-&gt;hostname : "server"), info-&gt;dirpath);</div><div class='del'>-</div><div class='del'>-	if (info-&gt;version == NFS_MNT3_VERSION)</div><div class='del'>-		msg.rpc_proc = &amp;clnt-&gt;cl_procinfo[MOUNTPROC3_UMNT];</div><div class='del'>-	else</div><div class='del'>-		msg.rpc_proc = &amp;clnt-&gt;cl_procinfo[MOUNTPROC_UMNT];</div><div class='del'>-</div><div class='del'>-	status = rpc_call_sync(clnt, &amp;msg, 0);</div><div class='del'>-	rpc_shutdown_client(clnt);</div><div class='del'>-</div><div class='del'>-	if (unlikely(status &lt; 0))</div><div class='del'>-		goto out_call_err;</div><div class='del'>-</div><div class='del'>-	return;</div><div class='del'>-</div><div class='del'>-out_clnt_err:</div><div class='del'>-	dprintk("NFS: failed to create UMNT RPC client, status=%ld\n",</div><div class='del'>-			PTR_ERR(clnt));</div><div class='del'>-	return;</div><div class='del'>-</div><div class='del'>-out_call_err:</div><div class='del'>-	dprintk("NFS: UMNT request failed, status=%d\n", status);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * XDR encode/decode functions for MOUNT</div><div class='ctx'>  */</div><div class='head'>diff --git a/fs/nfs/namespace.c b/fs/nfs/namespace.c<br/>index 3295af4110f1..5a4d193da1a9 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/namespace.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/namespace.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/namespace.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/namespace.c</a></div><div class='hunk'>@@ -147,7 +147,7 @@ struct vfsmount *nfs_d_automount(struct path *path)</div><div class='ctx'> 	struct nfs_fs_context *ctx;</div><div class='ctx'> 	struct fs_context *fc;</div><div class='ctx'> 	struct vfsmount *mnt = ERR_PTR(-ENOMEM);</div><div class='del'>-	struct nfs_server *server = NFS_SERVER(d_inode(path-&gt;dentry));</div><div class='add'>+	struct nfs_server *server = NFS_SB(path-&gt;dentry-&gt;d_sb);</div><div class='ctx'> 	struct nfs_client *client = server-&gt;nfs_client;</div><div class='ctx'> 	int timeout = READ_ONCE(nfs_mountpoint_expiry_timeout);</div><div class='ctx'> 	int ret;</div><div class='hunk'>@@ -175,14 +175,14 @@ struct vfsmount *nfs_d_automount(struct path *path)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* for submounts we want the same server; referrals will reassign */</div><div class='del'>-	memcpy(&amp;ctx-&gt;nfs_server.address, &amp;client-&gt;cl_addr, client-&gt;cl_addrlen);</div><div class='add'>+	memcpy(&amp;ctx-&gt;nfs_server._address, &amp;client-&gt;cl_addr, client-&gt;cl_addrlen);</div><div class='ctx'> 	ctx-&gt;nfs_server.addrlen	= client-&gt;cl_addrlen;</div><div class='ctx'> 	ctx-&gt;nfs_server.port	= server-&gt;port;</div><div class='ctx'> </div><div class='ctx'> 	ctx-&gt;version		= client-&gt;rpc_ops-&gt;version;</div><div class='ctx'> 	ctx-&gt;minorversion	= client-&gt;cl_minorversion;</div><div class='ctx'> 	ctx-&gt;nfs_mod		= client-&gt;cl_nfs_mod;</div><div class='del'>-	__module_get(ctx-&gt;nfs_mod-&gt;owner);</div><div class='add'>+	get_nfs_version(ctx-&gt;nfs_mod);</div><div class='ctx'> </div><div class='ctx'> 	ret = client-&gt;rpc_ops-&gt;submount(fc, server);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='hunk'>@@ -195,7 +195,6 @@ struct vfsmount *nfs_d_automount(struct path *path)</div><div class='ctx'> 	if (IS_ERR(mnt))</div><div class='ctx'> 		goto out_fc;</div><div class='ctx'> </div><div class='del'>-	mntget(mnt); /* prevent immediate expiration */</div><div class='ctx'> 	if (timeout &lt;= 0)</div><div class='ctx'> 		goto out_fc;</div><div class='ctx'> </div><div class='hunk'>@@ -208,23 +207,24 @@ out_fc:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-nfs_namespace_getattr(struct user_namespace *mnt_userns,</div><div class='add'>+nfs_namespace_getattr(struct mnt_idmap *idmap,</div><div class='ctx'> 		      const struct path *path, struct kstat *stat,</div><div class='ctx'> 		      u32 request_mask, unsigned int query_flags)</div><div class='ctx'> {</div><div class='ctx'> 	if (NFS_FH(d_inode(path-&gt;dentry))-&gt;size != 0)</div><div class='del'>-		return nfs_getattr(mnt_userns, path, stat, request_mask,</div><div class='add'>+		return nfs_getattr(idmap, path, stat, request_mask,</div><div class='ctx'> 				   query_flags);</div><div class='del'>-	generic_fillattr(&amp;init_user_ns, d_inode(path-&gt;dentry), stat);</div><div class='add'>+	generic_fillattr(&amp;nop_mnt_idmap, request_mask, d_inode(path-&gt;dentry),</div><div class='add'>+			 stat);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-nfs_namespace_setattr(struct user_namespace *mnt_userns, struct dentry *dentry,</div><div class='add'>+nfs_namespace_setattr(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		      struct iattr *attr)</div><div class='ctx'> {</div><div class='ctx'> 	if (NFS_FH(d_inode(dentry))-&gt;size != 0)</div><div class='del'>-		return nfs_setattr(mnt_userns, dentry, attr);</div><div class='add'>+		return nfs_setattr(idmap, dentry, attr);</div><div class='ctx'> 	return -EACCES;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -290,7 +290,8 @@ int nfs_do_submount(struct fs_context *fc)</div><div class='ctx'> 		nfs_errorf(fc, "NFS: Couldn't determine submount pathname");</div><div class='ctx'> 		ret = PTR_ERR(p);</div><div class='ctx'> 	} else {</div><div class='del'>-		ret = vfs_parse_fs_string(fc, "source", p, buffer + 4096 - p);</div><div class='add'>+		ret = vfs_parse_fs_qstr(fc, "source",</div><div class='add'>+					&amp;QSTR_LEN(p, buffer + 4096 - p));</div><div class='ctx'> 		if (!ret)</div><div class='ctx'> 			ret = vfs_get_tree(fc);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -307,7 +308,7 @@ int nfs_submount(struct fs_context *fc, struct nfs_server *server)</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	/* Look it up again to get its attributes */</div><div class='del'>-	err = server-&gt;nfs_client-&gt;rpc_ops-&gt;lookup(d_inode(parent), dentry,</div><div class='add'>+	err = server-&gt;nfs_client-&gt;rpc_ops-&gt;lookup(d_inode(parent), dentry, &amp;dentry-&gt;d_name,</div><div class='ctx'> 						  ctx-&gt;mntfh, ctx-&gt;clone_data.fattr);</div><div class='ctx'> 	dput(parent);</div><div class='ctx'> 	if (err != 0)</div><div class='hunk'>@@ -335,7 +336,7 @@ static int param_set_nfs_timeout(const char *val, const struct kernel_param *kp)</div><div class='ctx'> 			num *= HZ;</div><div class='ctx'> 		*((int *)kp-&gt;arg) = num;</div><div class='ctx'> 		if (!list_empty(&amp;nfs_automount_list))</div><div class='del'>-			mod_delayed_work(system_wq, &amp;nfs_automount_task, num);</div><div class='add'>+			mod_delayed_work(system_percpu_wq, &amp;nfs_automount_task, num);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		*((int *)kp-&gt;arg) = -1*HZ;</div><div class='ctx'> 		cancel_delayed_work(&amp;nfs_automount_task);</div><div class='hunk'>@@ -354,7 +355,7 @@ static int param_get_nfs_timeout(char *buffer, const struct kernel_param *kp)</div><div class='ctx'> 			num = (num + (HZ - 1)) / HZ;</div><div class='ctx'> 	} else</div><div class='ctx'> 		num = -1;</div><div class='del'>-	return scnprintf(buffer, PAGE_SIZE, "%li\n", num);</div><div class='add'>+	return sysfs_emit(buffer, "%li\n", num);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct kernel_param_ops param_ops_nfs_timeout = {</div><div class='head'>diff --git a/fs/nfs/netns.h b/fs/nfs/netns.h<br/>index c8374f74dce1..6ba3ea39e928 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/netns.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/netns.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/netns.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/netns.h</a></div><div class='hunk'>@@ -9,6 +9,7 @@</div><div class='ctx'> #include &lt;linux/nfs4.h&gt;</div><div class='ctx'> #include &lt;net/net_namespace.h&gt;</div><div class='ctx'> #include &lt;net/netns/generic.h&gt;</div><div class='add'>+#include &lt;linux/sunrpc/stats.h&gt;</div><div class='ctx'> </div><div class='ctx'> struct bl_dev_msg {</div><div class='ctx'> 	int32_t status;</div><div class='hunk'>@@ -30,10 +31,15 @@ struct nfs_net {</div><div class='ctx'> 	unsigned short nfs_callback_tcpport;</div><div class='ctx'> 	unsigned short nfs_callback_tcpport6;</div><div class='ctx'> 	int cb_users[NFS4_MAX_MINOR_VERSION + 1];</div><div class='del'>-#endif</div><div class='add'>+#endif /* CONFIG_NFS_V4 */</div><div class='add'>+#if IS_ENABLED(CONFIG_NFS_V4_1)</div><div class='add'>+	struct list_head nfs4_data_server_cache;</div><div class='add'>+	spinlock_t nfs4_data_server_lock;</div><div class='add'>+#endif /* CONFIG_NFS_V4_1 */</div><div class='ctx'> 	struct nfs_netns_client *nfs_client;</div><div class='ctx'> 	spinlock_t nfs_client_lock;</div><div class='ctx'> 	ktime_t boot_time;</div><div class='add'>+	struct rpc_stat rpcstats;</div><div class='ctx'> #ifdef CONFIG_PROC_FS</div><div class='ctx'> 	struct proc_dir_entry *proc_nfsfs;</div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/nfs/nfs.h b/fs/nfs/nfs.h<br/>index 5ba00610aede..8a5f51be013a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfs.h</a></div><div class='hunk'>@@ -18,11 +18,11 @@ struct nfs_subversion {</div><div class='ctx'> 	const struct rpc_version *rpc_vers;	/* NFS version information */</div><div class='ctx'> 	const struct nfs_rpc_ops *rpc_ops;	/* NFS operations */</div><div class='ctx'> 	const struct super_operations *sops;	/* NFS Super operations */</div><div class='del'>-	const struct xattr_handler **xattr;	/* NFS xattr handlers */</div><div class='del'>-	struct list_head list;		/* List of NFS versions */</div><div class='add'>+	const struct xattr_handler * const *xattr;	/* NFS xattr handlers */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-struct nfs_subversion *get_nfs_version(unsigned int);</div><div class='add'>+struct nfs_subversion *find_nfs_version(unsigned int);</div><div class='add'>+int get_nfs_version(struct nfs_subversion *);</div><div class='ctx'> void put_nfs_version(struct nfs_subversion *);</div><div class='ctx'> void register_nfs_version(struct nfs_subversion *);</div><div class='ctx'> void unregister_nfs_version(struct nfs_subversion *);</div><div class='head'>diff --git a/fs/nfs/nfs2super.c b/fs/nfs/nfs2super.c<br/>index 467f21ee6a35..b1badc70bd71 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs2super.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs2super.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs2super.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfs2super.c</a></div><div class='hunk'>@@ -26,6 +26,7 @@ static void __exit exit_nfs_v2(void)</div><div class='ctx'> 	unregister_nfs_version(&amp;nfs_v2);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+MODULE_DESCRIPTION("NFSv2 client support");</div><div class='ctx'> MODULE_LICENSE("GPL");</div><div class='ctx'> </div><div class='ctx'> module_init(init_nfs_v2);</div><div class='head'>diff --git a/fs/nfs/nfs2xdr.c b/fs/nfs/nfs2xdr.c<br/>index 7fba7711e6b3..9eff09158518 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs2xdr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs2xdr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs2xdr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfs2xdr.c</a></div><div class='hunk'>@@ -22,14 +22,12 @@</div><div class='ctx'> #include &lt;linux/nfs.h&gt;</div><div class='ctx'> #include &lt;linux/nfs2.h&gt;</div><div class='ctx'> #include &lt;linux/nfs_fs.h&gt;</div><div class='del'>-#include "nfstrace.h"</div><div class='add'>+#include &lt;linux/nfs_common.h&gt;</div><div class='ctx'> #include "internal.h"</div><div class='add'>+#include "nfstrace.h"</div><div class='ctx'> </div><div class='ctx'> #define NFSDBG_FACILITY		NFSDBG_XDR</div><div class='ctx'> </div><div class='del'>-/* Mapping from NFS error code to "errno" error code. */</div><div class='del'>-#define errno_NFSERR_IO		EIO</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Declare the space requirements for NFS arguments and replies as</div><div class='ctx'>  * number of 32bit-words</div><div class='hunk'>@@ -64,8 +62,6 @@</div><div class='ctx'> #define NFS_readdirres_sz	(1+NFS_pagepad_sz)</div><div class='ctx'> #define NFS_statfsres_sz	(1+NFS_info_sz)</div><div class='ctx'> </div><div class='del'>-static int nfs_stat_to_errno(enum nfs_stat);</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Encode/decode NFSv2 basic data types</div><div class='ctx'>  *</div><div class='hunk'>@@ -949,13 +945,12 @@ int nfs2_decode_dirent(struct xdr_stream *xdr, struct nfs_entry *entry,</div><div class='ctx'> </div><div class='ctx'> 	error = decode_filename_inline(xdr, &amp;entry-&gt;name, &amp;entry-&gt;len);</div><div class='ctx'> 	if (unlikely(error))</div><div class='del'>-		return error;</div><div class='add'>+		return error == -ENAMETOOLONG ? -ENAMETOOLONG : -EAGAIN;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The type (size and byte order) of nfscookie isn't defined in</div><div class='ctx'> 	 * RFC 1094.  This implementation assumes that it's an XDR uint32.</div><div class='ctx'> 	 */</div><div class='del'>-	entry-&gt;prev_cookie = entry-&gt;cookie;</div><div class='ctx'> 	p = xdr_inline_decode(xdr, 4);</div><div class='ctx'> 	if (unlikely(!p))</div><div class='ctx'> 		return -EAGAIN;</div><div class='hunk'>@@ -1055,70 +1050,6 @@ out_default:</div><div class='ctx'> 	return nfs_stat_to_errno(status);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * We need to translate between nfs status return values and</div><div class='del'>- * the local errno values which may not be the same.</div><div class='del'>- */</div><div class='del'>-static const struct {</div><div class='del'>-	int stat;</div><div class='del'>-	int errno;</div><div class='del'>-} nfs_errtbl[] = {</div><div class='del'>-	{ NFS_OK,		0		},</div><div class='del'>-	{ NFSERR_PERM,		-EPERM		},</div><div class='del'>-	{ NFSERR_NOENT,		-ENOENT		},</div><div class='del'>-	{ NFSERR_IO,		-errno_NFSERR_IO},</div><div class='del'>-	{ NFSERR_NXIO,		-ENXIO		},</div><div class='del'>-/*	{ NFSERR_EAGAIN,	-EAGAIN		}, */</div><div class='del'>-	{ NFSERR_ACCES,		-EACCES		},</div><div class='del'>-	{ NFSERR_EXIST,		-EEXIST		},</div><div class='del'>-	{ NFSERR_XDEV,		-EXDEV		},</div><div class='del'>-	{ NFSERR_NODEV,		-ENODEV		},</div><div class='del'>-	{ NFSERR_NOTDIR,	-ENOTDIR	},</div><div class='del'>-	{ NFSERR_ISDIR,		-EISDIR		},</div><div class='del'>-	{ NFSERR_INVAL,		-EINVAL		},</div><div class='del'>-	{ NFSERR_FBIG,		-EFBIG		},</div><div class='del'>-	{ NFSERR_NOSPC,		-ENOSPC		},</div><div class='del'>-	{ NFSERR_ROFS,		-EROFS		},</div><div class='del'>-	{ NFSERR_MLINK,		-EMLINK		},</div><div class='del'>-	{ NFSERR_NAMETOOLONG,	-ENAMETOOLONG	},</div><div class='del'>-	{ NFSERR_NOTEMPTY,	-ENOTEMPTY	},</div><div class='del'>-	{ NFSERR_DQUOT,		-EDQUOT		},</div><div class='del'>-	{ NFSERR_STALE,		-ESTALE		},</div><div class='del'>-	{ NFSERR_REMOTE,	-EREMOTE	},</div><div class='del'>-#ifdef EWFLUSH</div><div class='del'>-	{ NFSERR_WFLUSH,	-EWFLUSH	},</div><div class='del'>-#endif</div><div class='del'>-	{ NFSERR_BADHANDLE,	-EBADHANDLE	},</div><div class='del'>-	{ NFSERR_NOT_SYNC,	-ENOTSYNC	},</div><div class='del'>-	{ NFSERR_BAD_COOKIE,	-EBADCOOKIE	},</div><div class='del'>-	{ NFSERR_NOTSUPP,	-ENOTSUPP	},</div><div class='del'>-	{ NFSERR_TOOSMALL,	-ETOOSMALL	},</div><div class='del'>-	{ NFSERR_SERVERFAULT,	-EREMOTEIO	},</div><div class='del'>-	{ NFSERR_BADTYPE,	-EBADTYPE	},</div><div class='del'>-	{ NFSERR_JUKEBOX,	-EJUKEBOX	},</div><div class='del'>-	{ -1,			-EIO		}</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * nfs_stat_to_errno - convert an NFS status code to a local errno</div><div class='del'>- * @status: NFS status code to convert</div><div class='del'>- *</div><div class='del'>- * Returns a local errno value, or -EIO if the NFS status code is</div><div class='del'>- * not recognized.  This function is used jointly by NFSv2 and NFSv3.</div><div class='del'>- */</div><div class='del'>-static int nfs_stat_to_errno(enum nfs_stat status)</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; nfs_errtbl[i].stat != -1; i++) {</div><div class='del'>-		if (nfs_errtbl[i].stat == (int)status)</div><div class='del'>-			return nfs_errtbl[i].errno;</div><div class='del'>-	}</div><div class='del'>-	dprintk("NFS: Unrecognized nfs status value: %u\n", status);</div><div class='del'>-	return nfs_errtbl[i].errno;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> #define PROC(proc, argtype, restype, timer)				\</div><div class='ctx'> [NFSPROC_##proc] = {							\</div><div class='ctx'> 	.p_proc	    =  NFSPROC_##proc,					\</div><div class='head'>diff --git a/fs/nfs/nfs3_fs.h b/fs/nfs/nfs3_fs.h<br/>index 03a4e679fd99..b333ea119ef5 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs3_fs.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs3_fs.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs3_fs.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfs3_fs.h</a></div><div class='hunk'>@@ -12,12 +12,11 @@</div><div class='ctx'>  */</div><div class='ctx'> #ifdef CONFIG_NFS_V3_ACL</div><div class='ctx'> extern struct posix_acl *nfs3_get_acl(struct inode *inode, int type, bool rcu);</div><div class='del'>-extern int nfs3_set_acl(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='add'>+extern int nfs3_set_acl(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 			struct posix_acl *acl, int type);</div><div class='ctx'> extern int nfs3_proc_setacls(struct inode *inode, struct posix_acl *acl,</div><div class='ctx'> 		struct posix_acl *dfacl);</div><div class='ctx'> extern ssize_t nfs3_listxattr(struct dentry *, char *, size_t);</div><div class='del'>-extern const struct xattr_handler *nfs3_xattr_handlers[];</div><div class='ctx'> #else</div><div class='ctx'> static inline int nfs3_proc_setacls(struct inode *inode, struct posix_acl *acl,</div><div class='ctx'> 		struct posix_acl *dfacl)</div><div class='head'>diff --git a/fs/nfs/nfs3acl.c b/fs/nfs/nfs3acl.c<br/>index 93de0b58647a..a126eb31f62f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs3acl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs3acl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs3acl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfs3acl.c</a></div><div class='hunk'>@@ -21,9 +21,8 @@ static void nfs3_prepare_get_acl(struct posix_acl **p)</div><div class='ctx'> {</div><div class='ctx'> 	struct posix_acl *sentinel = uncached_acl_sentinel(current);</div><div class='ctx'> </div><div class='del'>-	if (cmpxchg(p, ACL_NOT_CACHED, sentinel) != ACL_NOT_CACHED) {</div><div class='del'>-		/* Not the first reader or sentinel already in place. */</div><div class='del'>-	}</div><div class='add'>+	/* If the ACL isn't being read yet, set our sentinel. */</div><div class='add'>+	cmpxchg(p, ACL_NOT_CACHED, sentinel);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void nfs3_complete_get_acl(struct posix_acl **p, struct posix_acl *acl)</div><div class='hunk'>@@ -105,7 +104,7 @@ struct posix_acl *nfs3_get_acl(struct inode *inode, int type, bool rcu)</div><div class='ctx'> </div><div class='ctx'> 	switch (status) {</div><div class='ctx'> 		case 0:</div><div class='del'>-			status = nfs_refresh_inode(inode, res.fattr);</div><div class='add'>+			nfs_refresh_inode(inode, res.fattr);</div><div class='ctx'> 			break;</div><div class='ctx'> 		case -EPFNOSUPPORT:</div><div class='ctx'> 		case -EPROTONOSUPPORT:</div><div class='hunk'>@@ -255,23 +254,24 @@ int nfs3_proc_setacls(struct inode *inode, struct posix_acl *acl,</div><div class='ctx'> </div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int nfs3_set_acl(struct user_namespace *mnt_userns, struct inode *inode,</div><div class='add'>+int nfs3_set_acl(struct mnt_idmap *idmap, struct dentry *dentry,</div><div class='ctx'> 		 struct posix_acl *acl, int type)</div><div class='ctx'> {</div><div class='ctx'> 	struct posix_acl *orig = acl, *dfacl = NULL, *alloc;</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	int status;</div><div class='ctx'> </div><div class='ctx'> 	if (S_ISDIR(inode-&gt;i_mode)) {</div><div class='ctx'> 		switch(type) {</div><div class='ctx'> 		case ACL_TYPE_ACCESS:</div><div class='del'>-			alloc = get_acl(inode, ACL_TYPE_DEFAULT);</div><div class='add'>+			alloc = get_inode_acl(inode, ACL_TYPE_DEFAULT);</div><div class='ctx'> 			if (IS_ERR(alloc))</div><div class='ctx'> 				goto fail;</div><div class='ctx'> 			dfacl = alloc;</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='ctx'> 		case ACL_TYPE_DEFAULT:</div><div class='del'>-			alloc = get_acl(inode, ACL_TYPE_ACCESS);</div><div class='add'>+			alloc = get_inode_acl(inode, ACL_TYPE_ACCESS);</div><div class='ctx'> 			if (IS_ERR(alloc))</div><div class='ctx'> 				goto fail;</div><div class='ctx'> 			dfacl = acl;</div><div class='hunk'>@@ -299,12 +299,6 @@ fail:</div><div class='ctx'> 	goto out;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-const struct xattr_handler *nfs3_xattr_handlers[] = {</div><div class='del'>-	&amp;posix_acl_access_xattr_handler,</div><div class='del'>-	&amp;posix_acl_default_xattr_handler,</div><div class='del'>-	NULL,</div><div class='del'>-};</div><div class='del'>-</div><div class='ctx'> static int</div><div class='ctx'> nfs3_list_one_acl(struct inode *inode, int type, const char *name, void *data,</div><div class='ctx'> 		size_t size, ssize_t *result)</div><div class='hunk'>@@ -312,7 +306,7 @@ nfs3_list_one_acl(struct inode *inode, int type, const char *name, void *data,</div><div class='ctx'> 	struct posix_acl *acl;</div><div class='ctx'> 	char *p = data + *result;</div><div class='ctx'> </div><div class='del'>-	acl = get_acl(inode, type);</div><div class='add'>+	acl = get_inode_acl(inode, type);</div><div class='ctx'> 	if (IS_ERR_OR_NULL(acl))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='head'>diff --git a/fs/nfs/nfs3client.c b/fs/nfs/nfs3client.c<br/>index 5601e47360c2..5d97c1d38bb6 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs3client.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs3client.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs3client.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfs3client.c</a></div><div class='hunk'>@@ -2,8 +2,11 @@</div><div class='ctx'> #include &lt;linux/nfs_fs.h&gt;</div><div class='ctx'> #include &lt;linux/nfs_mount.h&gt;</div><div class='ctx'> #include &lt;linux/sunrpc/addr.h&gt;</div><div class='add'>+#include &lt;net/handshake.h&gt;</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> #include "nfs3_fs.h"</div><div class='add'>+#include "netns.h"</div><div class='add'>+#include "sysfs.h"</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_NFS_V3_ACL</div><div class='ctx'> static struct rpc_stat		nfsacl_rpcstat = { &amp;nfsacl_program };</div><div class='hunk'>@@ -31,6 +34,8 @@ static void nfs_init_server_aclclient(struct nfs_server *server)</div><div class='ctx'> 	if (IS_ERR(server-&gt;client_acl))</div><div class='ctx'> 		goto out_noacl;</div><div class='ctx'> </div><div class='add'>+	nfs_sysfs_link_rpc_client(server, server-&gt;client_acl, NULL);</div><div class='add'>+</div><div class='ctx'> 	/* No errors! Assume that Sun nfsacls are supported */</div><div class='ctx'> 	server-&gt;caps |= NFS_CAP_ACLS;</div><div class='ctx'> 	return;</div><div class='hunk'>@@ -78,10 +83,11 @@ struct nfs_server *nfs3_clone_server(struct nfs_server *source,</div><div class='ctx'>  * the MDS.</div><div class='ctx'>  */</div><div class='ctx'> struct nfs_client *nfs3_set_ds_client(struct nfs_server *mds_srv,</div><div class='del'>-		const struct sockaddr *ds_addr, int ds_addrlen,</div><div class='add'>+		const struct sockaddr_storage *ds_addr, int ds_addrlen,</div><div class='ctx'> 		int ds_proto, unsigned int ds_timeo, unsigned int ds_retrans)</div><div class='ctx'> {</div><div class='ctx'> 	struct rpc_timeout ds_timeout;</div><div class='add'>+	unsigned long connect_timeout = ds_timeo * (ds_retrans + 1) * HZ / 10;</div><div class='ctx'> 	struct nfs_client *mds_clp = mds_srv-&gt;nfs_client;</div><div class='ctx'> 	struct nfs_client_initdata cl_init = {</div><div class='ctx'> 		.addr = ds_addr,</div><div class='hunk'>@@ -93,22 +99,40 @@ struct nfs_client *nfs3_set_ds_client(struct nfs_server *mds_srv,</div><div class='ctx'> 		.net = mds_clp-&gt;cl_net,</div><div class='ctx'> 		.timeparms = &amp;ds_timeout,</div><div class='ctx'> 		.cred = mds_srv-&gt;cred,</div><div class='add'>+		.xprtsec = {</div><div class='add'>+			.policy = RPC_XPRTSEC_NONE,</div><div class='add'>+			.cert_serial = TLS_NO_CERT,</div><div class='add'>+			.privkey_serial = TLS_NO_PRIVKEY,</div><div class='add'>+		},</div><div class='add'>+		.connect_timeout = connect_timeout,</div><div class='add'>+		.reconnect_timeout = connect_timeout,</div><div class='ctx'> 	};</div><div class='ctx'> 	struct nfs_client *clp;</div><div class='ctx'> 	char buf[INET6_ADDRSTRLEN + 1];</div><div class='ctx'> </div><div class='ctx'> 	/* fake a hostname because lockd wants it */</div><div class='del'>-	if (rpc_ntop(ds_addr, buf, sizeof(buf)) &lt;= 0)</div><div class='add'>+	if (rpc_ntop((struct sockaddr *)ds_addr, buf, sizeof(buf)) &lt;= 0)</div><div class='ctx'> 		return ERR_PTR(-EINVAL);</div><div class='ctx'> 	cl_init.hostname = buf;</div><div class='ctx'> </div><div class='del'>-	if (mds_clp-&gt;cl_nconnect &gt; 1 &amp;&amp; ds_proto == XPRT_TRANSPORT_TCP)</div><div class='del'>-		cl_init.nconnect = mds_clp-&gt;cl_nconnect;</div><div class='add'>+	switch (ds_proto) {</div><div class='add'>+	case XPRT_TRANSPORT_TCP_TLS:</div><div class='add'>+		if (mds_clp-&gt;cl_xprtsec.policy != RPC_XPRTSEC_NONE)</div><div class='add'>+			cl_init.xprtsec = mds_clp-&gt;cl_xprtsec;</div><div class='add'>+		else</div><div class='add'>+			ds_proto = XPRT_TRANSPORT_TCP;</div><div class='add'>+		fallthrough;</div><div class='add'>+	case XPRT_TRANSPORT_RDMA:</div><div class='add'>+	case XPRT_TRANSPORT_TCP:</div><div class='add'>+		if (mds_clp-&gt;cl_nconnect &gt; 1)</div><div class='add'>+			cl_init.nconnect = mds_clp-&gt;cl_nconnect;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (mds_srv-&gt;flags &amp; NFS_MOUNT_NORESVPORT)</div><div class='ctx'> 		__set_bit(NFS_CS_NORESVPORT, &amp;cl_init.init_flags);</div><div class='add'>+	if (test_bit(NFS_CS_NETUNREACH_FATAL, &amp;mds_clp-&gt;cl_flags))</div><div class='add'>+		__set_bit(NFS_CS_NETUNREACH_FATAL, &amp;cl_init.init_flags);</div><div class='ctx'> </div><div class='del'>-	__set_bit(NFS_CS_NOPING, &amp;cl_init.init_flags);</div><div class='ctx'> 	__set_bit(NFS_CS_DS, &amp;cl_init.init_flags);</div><div class='ctx'> </div><div class='ctx'> 	/* Use the MDS nfs_client cl_ipaddr. */</div><div class='head'>diff --git a/fs/nfs/nfs3proc.c b/fs/nfs/nfs3proc.c<br/>index 7100514d306b..a4cb67573aa7 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs3proc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs3proc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs3proc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfs3proc.c</a></div><div class='hunk'>@@ -36,9 +36,10 @@ nfs3_rpc_wrapper(struct rpc_clnt *clnt, struct rpc_message *msg, int flags)</div><div class='ctx'> 		res = rpc_call_sync(clnt, msg, flags);</div><div class='ctx'> 		if (res != -EJUKEBOX)</div><div class='ctx'> 			break;</div><div class='del'>-		freezable_schedule_timeout_killable_unsafe(NFS_JUKEBOX_RETRY_TIME);</div><div class='add'>+		__set_current_state(TASK_KILLABLE|TASK_FREEZABLE_UNSAFE);</div><div class='add'>+		schedule_timeout(NFS_JUKEBOX_RETRY_TIME);</div><div class='ctx'> 		res = -ERESTARTSYS;</div><div class='del'>-	} while (!fatal_signal_pending(current));</div><div class='add'>+	} while (!fatal_signal_pending(current) &amp;&amp; !nfs_current_task_exiting());</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -191,7 +192,7 @@ __nfs3_proc_lookup(struct inode *dir, const char *name, size_t len,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-nfs3_proc_lookup(struct inode *dir, struct dentry *dentry,</div><div class='add'>+nfs3_proc_lookup(struct inode *dir, struct dentry *dentry, const struct qstr *name,</div><div class='ctx'> 		 struct nfs_fh *fhandle, struct nfs_fattr *fattr)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned short task_flags = 0;</div><div class='hunk'>@@ -201,8 +202,7 @@ nfs3_proc_lookup(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 		task_flags |= RPC_TASK_TIMEOUT;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("NFS call  lookup %pd2\n", dentry);</div><div class='del'>-	return __nfs3_proc_lookup(dir, dentry-&gt;d_name.name,</div><div class='del'>-				  dentry-&gt;d_name.len, fhandle, fattr,</div><div class='add'>+	return __nfs3_proc_lookup(dir, name-&gt;name, name-&gt;len, fhandle, fattr,</div><div class='ctx'> 				  task_flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -220,7 +220,8 @@ static int nfs3_proc_lookupp(struct inode *inode, struct nfs_fh *fhandle,</div><div class='ctx'> 				  task_flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int nfs3_proc_access(struct inode *inode, struct nfs_access_entry *entry)</div><div class='add'>+static int nfs3_proc_access(struct inode *inode, struct nfs_access_entry *entry,</div><div class='add'>+			    const struct cred *cred)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs3_accessargs	arg = {</div><div class='ctx'> 		.fh		= NFS_FH(inode),</div><div class='hunk'>@@ -231,7 +232,7 @@ static int nfs3_proc_access(struct inode *inode, struct nfs_access_entry *entry)</div><div class='ctx'> 		.rpc_proc	= &amp;nfs3_procedures[NFS3PROC_ACCESS],</div><div class='ctx'> 		.rpc_argp	= &amp;arg,</div><div class='ctx'> 		.rpc_resp	= &amp;res,</div><div class='del'>-		.rpc_cred	= entry-&gt;cred,</div><div class='add'>+		.rpc_cred	= cred,</div><div class='ctx'> 	};</div><div class='ctx'> 	int status = -ENOMEM;</div><div class='ctx'> </div><div class='hunk'>@@ -541,9 +542,10 @@ out:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-nfs3_proc_symlink(struct inode *dir, struct dentry *dentry, struct page *page,</div><div class='add'>+nfs3_proc_symlink(struct inode *dir, struct dentry *dentry, struct folio *folio,</div><div class='ctx'> 		  unsigned int len, struct iattr *sattr)</div><div class='ctx'> {</div><div class='add'>+	struct page *page = &amp;folio-&gt;page;</div><div class='ctx'> 	struct nfs3_createdata *data;</div><div class='ctx'> 	struct dentry *d_alias;</div><div class='ctx'> 	int status = -ENOMEM;</div><div class='hunk'>@@ -576,13 +578,13 @@ out:</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int</div><div class='add'>+static struct dentry *</div><div class='ctx'> nfs3_proc_mkdir(struct inode *dir, struct dentry *dentry, struct iattr *sattr)</div><div class='ctx'> {</div><div class='ctx'> 	struct posix_acl *default_acl, *acl;</div><div class='ctx'> 	struct nfs3_createdata *data;</div><div class='del'>-	struct dentry *d_alias;</div><div class='del'>-	int status = -ENOMEM;</div><div class='add'>+	struct dentry *ret = ERR_PTR(-ENOMEM);</div><div class='add'>+	int status;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("NFS call  mkdir %pd\n", dentry);</div><div class='ctx'> </div><div class='hunk'>@@ -590,8 +592,9 @@ nfs3_proc_mkdir(struct inode *dir, struct dentry *dentry, struct iattr *sattr)</div><div class='ctx'> 	if (data == NULL)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	status = posix_acl_create(dir, &amp;sattr-&gt;ia_mode, &amp;default_acl, &amp;acl);</div><div class='del'>-	if (status)</div><div class='add'>+	ret = ERR_PTR(posix_acl_create(dir, &amp;sattr-&gt;ia_mode,</div><div class='add'>+				       &amp;default_acl, &amp;acl));</div><div class='add'>+	if (IS_ERR(ret))</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	data-&gt;msg.rpc_proc = &amp;nfs3_procedures[NFS3PROC_MKDIR];</div><div class='hunk'>@@ -600,25 +603,27 @@ nfs3_proc_mkdir(struct inode *dir, struct dentry *dentry, struct iattr *sattr)</div><div class='ctx'> 	data-&gt;arg.mkdir.len = dentry-&gt;d_name.len;</div><div class='ctx'> 	data-&gt;arg.mkdir.sattr = sattr;</div><div class='ctx'> </div><div class='del'>-	d_alias = nfs3_do_create(dir, dentry, data);</div><div class='del'>-	status = PTR_ERR_OR_ZERO(d_alias);</div><div class='add'>+	ret = nfs3_do_create(dir, dentry, data);</div><div class='ctx'> </div><div class='del'>-	if (status != 0)</div><div class='add'>+	if (IS_ERR(ret))</div><div class='ctx'> 		goto out_release_acls;</div><div class='ctx'> </div><div class='del'>-	if (d_alias)</div><div class='del'>-		dentry = d_alias;</div><div class='add'>+	if (ret)</div><div class='add'>+		dentry = ret;</div><div class='ctx'> </div><div class='ctx'> 	status = nfs3_proc_setacls(d_inode(dentry), acl, default_acl);</div><div class='add'>+	if (status) {</div><div class='add'>+		dput(ret);</div><div class='add'>+		ret = ERR_PTR(status);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	dput(d_alias);</div><div class='ctx'> out_release_acls:</div><div class='ctx'> 	posix_acl_release(acl);</div><div class='ctx'> 	posix_acl_release(default_acl);</div><div class='ctx'> out:</div><div class='ctx'> 	nfs3_free_createdata(data);</div><div class='del'>-	dprintk("NFS reply mkdir: %d\n", status);</div><div class='del'>-	return status;</div><div class='add'>+	dprintk("NFS reply mkdir: %d\n", PTR_ERR_OR_ZERO(ret));</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='hunk'>@@ -841,6 +846,41 @@ nfs3_proc_pathconf(struct nfs_server *server, struct nfs_fh *fhandle,</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#if IS_ENABLED(CONFIG_NFS_LOCALIO)</div><div class='add'>+</div><div class='add'>+static unsigned nfs3_localio_probe_throttle __read_mostly = 0;</div><div class='add'>+module_param(nfs3_localio_probe_throttle, uint, 0644);</div><div class='add'>+MODULE_PARM_DESC(nfs3_localio_probe_throttle,</div><div class='add'>+		 "Probe for NFSv3 LOCALIO every N IO requests. Must be power-of-2, defaults to 0 (probing disabled).");</div><div class='add'>+</div><div class='add'>+static void nfs3_localio_probe(struct nfs_server *server)</div><div class='add'>+{</div><div class='add'>+	struct nfs_client *clp = server-&gt;nfs_client;</div><div class='add'>+</div><div class='add'>+	/* Throttled to reduce nfs_local_probe_async() frequency */</div><div class='add'>+	if (!nfs3_localio_probe_throttle || nfs_server_is_local(clp))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Try (re)enabling LOCALIO if isn't enabled -- admin deems</div><div class='add'>+	 * it worthwhile to periodically check if LOCALIO possible by</div><div class='add'>+	 * setting the 'nfs3_localio_probe_throttle' module parameter.</div><div class='add'>+	 *</div><div class='add'>+	 * This is useful if LOCALIO was previously enabled, but was</div><div class='add'>+	 * disabled due to server restart, and IO has successfully</div><div class='add'>+	 * completed in terms of normal RPC.</div><div class='add'>+	 */</div><div class='add'>+	if ((clp-&gt;cl_uuid.nfs3_localio_probe_count++ &amp;</div><div class='add'>+	     (nfs3_localio_probe_throttle - 1)) == 0) {</div><div class='add'>+		if (!nfs_server_is_local(clp))</div><div class='add'>+			nfs_local_probe_async(clp);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#else</div><div class='add'>+static void nfs3_localio_probe(struct nfs_server *server) {}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> static int nfs3_read_done(struct rpc_task *task, struct nfs_pgio_header *hdr)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = hdr-&gt;inode;</div><div class='hunk'>@@ -852,8 +892,11 @@ static int nfs3_read_done(struct rpc_task *task, struct nfs_pgio_header *hdr)</div><div class='ctx'> 	if (nfs3_async_handle_jukebox(task, inode))</div><div class='ctx'> 		return -EAGAIN;</div><div class='ctx'> </div><div class='del'>-	if (task-&gt;tk_status &gt;= 0 &amp;&amp; !server-&gt;read_hdrsize)</div><div class='del'>-		cmpxchg(&amp;server-&gt;read_hdrsize, 0, hdr-&gt;res.replen);</div><div class='add'>+	if (task-&gt;tk_status &gt;= 0) {</div><div class='add'>+		if (!server-&gt;read_hdrsize)</div><div class='add'>+			cmpxchg(&amp;server-&gt;read_hdrsize, 0, hdr-&gt;res.replen);</div><div class='add'>+		nfs3_localio_probe(server);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	nfs_invalidate_atime(inode);</div><div class='ctx'> 	nfs_refresh_inode(inode, &amp;hdr-&gt;fattr);</div><div class='hunk'>@@ -883,8 +926,10 @@ static int nfs3_write_done(struct rpc_task *task, struct nfs_pgio_header *hdr)</div><div class='ctx'> </div><div class='ctx'> 	if (nfs3_async_handle_jukebox(task, inode))</div><div class='ctx'> 		return -EAGAIN;</div><div class='del'>-	if (task-&gt;tk_status &gt;= 0)</div><div class='add'>+	if (task-&gt;tk_status &gt;= 0) {</div><div class='ctx'> 		nfs_writeback_update_inode(hdr);</div><div class='add'>+		nfs3_localio_probe(NFS_SERVER(inode));</div><div class='add'>+	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -960,7 +1005,7 @@ nfs3_proc_lock(struct file *filp, int cmd, struct file_lock *fl)</div><div class='ctx'> 	struct nfs_open_context *ctx = nfs_file_open_context(filp);</div><div class='ctx'> 	int status;</div><div class='ctx'> </div><div class='del'>-	if (fl-&gt;fl_flags &amp; FL_CLOSE) {</div><div class='add'>+	if (fl-&gt;c.flc_flags &amp; FL_CLOSE) {</div><div class='ctx'> 		l_ctx = nfs_get_lock_context(ctx);</div><div class='ctx'> 		if (IS_ERR(l_ctx))</div><div class='ctx'> 			l_ctx = NULL;</div><div class='hunk'>@@ -976,13 +1021,21 @@ nfs3_proc_lock(struct file *filp, int cmd, struct file_lock *fl)</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int nfs3_have_delegation(struct inode *inode, fmode_t flags)</div><div class='add'>+static int nfs3_have_delegation(struct inode *inode, fmode_t type, int flags)</div><div class='add'>+{</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int nfs3_return_delegation(struct inode *inode)</div><div class='ctx'> {</div><div class='add'>+	if (S_ISREG(inode-&gt;i_mode))</div><div class='add'>+		nfs_wb_all(inode);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct inode_operations nfs3_dir_inode_operations = {</div><div class='ctx'> 	.create		= nfs_create,</div><div class='add'>+	.atomic_open	= nfs_atomic_open_v23,</div><div class='ctx'> 	.lookup		= nfs_lookup,</div><div class='ctx'> 	.link		= nfs_link,</div><div class='ctx'> 	.unlink		= nfs_unlink,</div><div class='hunk'>@@ -996,7 +1049,7 @@ static const struct inode_operations nfs3_dir_inode_operations = {</div><div class='ctx'> 	.setattr	= nfs_setattr,</div><div class='ctx'> #ifdef CONFIG_NFS_V3_ACL</div><div class='ctx'> 	.listxattr	= nfs3_listxattr,</div><div class='del'>-	.get_acl	= nfs3_get_acl,</div><div class='add'>+	.get_inode_acl	= nfs3_get_acl,</div><div class='ctx'> 	.set_acl	= nfs3_set_acl,</div><div class='ctx'> #endif</div><div class='ctx'> };</div><div class='hunk'>@@ -1007,7 +1060,7 @@ static const struct inode_operations nfs3_file_inode_operations = {</div><div class='ctx'> 	.setattr	= nfs_setattr,</div><div class='ctx'> #ifdef CONFIG_NFS_V3_ACL</div><div class='ctx'> 	.listxattr	= nfs3_listxattr,</div><div class='del'>-	.get_acl	= nfs3_get_acl,</div><div class='add'>+	.get_inode_acl	= nfs3_get_acl,</div><div class='ctx'> 	.set_acl	= nfs3_set_acl,</div><div class='ctx'> #endif</div><div class='ctx'> };</div><div class='hunk'>@@ -1058,6 +1111,7 @@ const struct nfs_rpc_ops nfs_v3_clientops = {</div><div class='ctx'> 	.clear_acl_cache = forget_all_cached_acls,</div><div class='ctx'> 	.close_context	= nfs_close_context,</div><div class='ctx'> 	.have_delegation = nfs3_have_delegation,</div><div class='add'>+	.return_delegation = nfs3_return_delegation,</div><div class='ctx'> 	.alloc_client	= nfs_alloc_client,</div><div class='ctx'> 	.init_client	= nfs_init_client,</div><div class='ctx'> 	.free_client	= nfs_free_client,</div><div class='head'>diff --git a/fs/nfs/nfs3super.c b/fs/nfs/nfs3super.c<br/>index 7c5809431e61..20a80478449e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs3super.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs3super.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs3super.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfs3super.c</a></div><div class='hunk'>@@ -14,9 +14,6 @@ struct nfs_subversion nfs_v3 = {</div><div class='ctx'> 	.rpc_vers = &amp;nfs_version3,</div><div class='ctx'> 	.rpc_ops  = &amp;nfs_v3_clientops,</div><div class='ctx'> 	.sops     = &amp;nfs_sops,</div><div class='del'>-#ifdef CONFIG_NFS_V3_ACL</div><div class='del'>-	.xattr    = nfs3_xattr_handlers,</div><div class='del'>-#endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static int __init init_nfs_v3(void)</div><div class='hunk'>@@ -30,6 +27,7 @@ static void __exit exit_nfs_v3(void)</div><div class='ctx'> 	unregister_nfs_version(&amp;nfs_v3);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+MODULE_DESCRIPTION("NFSv3 client support");</div><div class='ctx'> MODULE_LICENSE("GPL");</div><div class='ctx'> </div><div class='ctx'> module_init(init_nfs_v3);</div><div class='head'>diff --git a/fs/nfs/nfs3xdr.c b/fs/nfs/nfs3xdr.c<br/>index 9274c9c5efea..e17d72908412 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs3xdr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs3xdr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs3xdr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfs3xdr.c</a></div><div class='hunk'>@@ -21,14 +21,13 @@</div><div class='ctx'> #include &lt;linux/nfs3.h&gt;</div><div class='ctx'> #include &lt;linux/nfs_fs.h&gt;</div><div class='ctx'> #include &lt;linux/nfsacl.h&gt;</div><div class='del'>-#include "nfstrace.h"</div><div class='add'>+#include &lt;linux/nfs_common.h&gt;</div><div class='add'>+</div><div class='ctx'> #include "internal.h"</div><div class='add'>+#include "nfstrace.h"</div><div class='ctx'> </div><div class='ctx'> #define NFSDBG_FACILITY		NFSDBG_XDR</div><div class='ctx'> </div><div class='del'>-/* Mapping from NFS error code to "errno" error code. */</div><div class='del'>-#define errno_NFSERR_IO		EIO</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Declare the space requirements for NFS arguments and replies as</div><div class='ctx'>  * number of 32bit-words</div><div class='hunk'>@@ -91,8 +90,6 @@</div><div class='ctx'> 				NFS3_pagepad_sz)</div><div class='ctx'> #define ACL3_setaclres_sz	(1+NFS3_post_op_attr_sz)</div><div class='ctx'> </div><div class='del'>-static int nfs3_stat_to_errno(enum nfs_stat);</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Map file type to S_IFMT bits</div><div class='ctx'>  */</div><div class='hunk'>@@ -1261,6 +1258,8 @@ static void nfs3_xdr_enc_readdir3args(struct rpc_rqst *req,</div><div class='ctx'> static void encode_readdirplus3args(struct xdr_stream *xdr,</div><div class='ctx'> 				    const struct nfs3_readdirargs *args)</div><div class='ctx'> {</div><div class='add'>+	uint32_t dircount = args-&gt;count;</div><div class='add'>+	uint32_t maxcount = args-&gt;count;</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> </div><div class='ctx'> 	encode_nfs_fh3(xdr, args-&gt;fh);</div><div class='hunk'>@@ -1273,9 +1272,8 @@ static void encode_readdirplus3args(struct xdr_stream *xdr,</div><div class='ctx'> 	 * readdirplus: need dircount + buffer size.</div><div class='ctx'> 	 * We just make sure we make dircount big enough</div><div class='ctx'> 	 */</div><div class='del'>-	*p++ = cpu_to_be32(args-&gt;count &gt;&gt; 3);</div><div class='del'>-</div><div class='del'>-	*p = cpu_to_be32(args-&gt;count);</div><div class='add'>+	*p++ = cpu_to_be32(dircount);</div><div class='add'>+	*p = cpu_to_be32(maxcount);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void nfs3_xdr_enc_readdirplus3args(struct rpc_rqst *req,</div><div class='hunk'>@@ -1405,7 +1403,7 @@ static int nfs3_xdr_dec_getattr3res(struct rpc_rqst *req,</div><div class='ctx'> out:</div><div class='ctx'> 	return error;</div><div class='ctx'> out_default:</div><div class='del'>-	return nfs3_stat_to_errno(status);</div><div class='add'>+	return nfs_stat_to_errno(status);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1444,7 +1442,7 @@ static int nfs3_xdr_dec_setattr3res(struct rpc_rqst *req,</div><div class='ctx'> out:</div><div class='ctx'> 	return error;</div><div class='ctx'> out_status:</div><div class='del'>-	return nfs3_stat_to_errno(status);</div><div class='add'>+	return nfs_stat_to_errno(status);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1494,7 +1492,7 @@ out_default:</div><div class='ctx'> 	error = decode_post_op_attr(xdr, result-&gt;dir_attr, userns);</div><div class='ctx'> 	if (unlikely(error))</div><div class='ctx'> 		goto out;</div><div class='del'>-	return nfs3_stat_to_errno(status);</div><div class='add'>+	return nfs_stat_to_errno(status);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1536,7 +1534,7 @@ static int nfs3_xdr_dec_access3res(struct rpc_rqst *req,</div><div class='ctx'> out:</div><div class='ctx'> 	return error;</div><div class='ctx'> out_default:</div><div class='del'>-	return nfs3_stat_to_errno(status);</div><div class='add'>+	return nfs_stat_to_errno(status);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1577,7 +1575,7 @@ static int nfs3_xdr_dec_readlink3res(struct rpc_rqst *req,</div><div class='ctx'> out:</div><div class='ctx'> 	return error;</div><div class='ctx'> out_default:</div><div class='del'>-	return nfs3_stat_to_errno(status);</div><div class='add'>+	return nfs_stat_to_errno(status);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1657,7 +1655,7 @@ static int nfs3_xdr_dec_read3res(struct rpc_rqst *req, struct xdr_stream *xdr,</div><div class='ctx'> out:</div><div class='ctx'> 	return error;</div><div class='ctx'> out_status:</div><div class='del'>-	return nfs3_stat_to_errno(status);</div><div class='add'>+	return nfs_stat_to_errno(status);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1727,7 +1725,7 @@ static int nfs3_xdr_dec_write3res(struct rpc_rqst *req, struct xdr_stream *xdr,</div><div class='ctx'> out:</div><div class='ctx'> 	return error;</div><div class='ctx'> out_status:</div><div class='del'>-	return nfs3_stat_to_errno(status);</div><div class='add'>+	return nfs_stat_to_errno(status);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1794,7 +1792,7 @@ out_default:</div><div class='ctx'> 	error = decode_wcc_data(xdr, result-&gt;dir_attr, userns);</div><div class='ctx'> 	if (unlikely(error))</div><div class='ctx'> 		goto out;</div><div class='del'>-	return nfs3_stat_to_errno(status);</div><div class='add'>+	return nfs_stat_to_errno(status);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1834,7 +1832,7 @@ static int nfs3_xdr_dec_remove3res(struct rpc_rqst *req,</div><div class='ctx'> out:</div><div class='ctx'> 	return error;</div><div class='ctx'> out_status:</div><div class='del'>-	return nfs3_stat_to_errno(status);</div><div class='add'>+	return nfs_stat_to_errno(status);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1880,7 +1878,7 @@ static int nfs3_xdr_dec_rename3res(struct rpc_rqst *req,</div><div class='ctx'> out:</div><div class='ctx'> 	return error;</div><div class='ctx'> out_status:</div><div class='del'>-	return nfs3_stat_to_errno(status);</div><div class='add'>+	return nfs_stat_to_errno(status);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1925,7 +1923,7 @@ static int nfs3_xdr_dec_link3res(struct rpc_rqst *req, struct xdr_stream *xdr,</div><div class='ctx'> out:</div><div class='ctx'> 	return error;</div><div class='ctx'> out_status:</div><div class='del'>-	return nfs3_stat_to_errno(status);</div><div class='add'>+	return nfs_stat_to_errno(status);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -1967,7 +1965,6 @@ int nfs3_decode_dirent(struct xdr_stream *xdr, struct nfs_entry *entry,</div><div class='ctx'> 		       bool plus)</div><div class='ctx'> {</div><div class='ctx'> 	struct user_namespace *userns = rpc_userns(entry-&gt;server-&gt;client);</div><div class='del'>-	struct nfs_entry old = *entry;</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> 	int error;</div><div class='ctx'> 	u64 new_cookie;</div><div class='hunk'>@@ -1987,15 +1984,15 @@ int nfs3_decode_dirent(struct xdr_stream *xdr, struct nfs_entry *entry,</div><div class='ctx'> </div><div class='ctx'> 	error = decode_fileid3(xdr, &amp;entry-&gt;ino);</div><div class='ctx'> 	if (unlikely(error))</div><div class='del'>-		return error;</div><div class='add'>+		return -EAGAIN;</div><div class='ctx'> </div><div class='ctx'> 	error = decode_inline_filename3(xdr, &amp;entry-&gt;name, &amp;entry-&gt;len);</div><div class='ctx'> 	if (unlikely(error))</div><div class='del'>-		return error;</div><div class='add'>+		return error == -ENAMETOOLONG ? -ENAMETOOLONG : -EAGAIN;</div><div class='ctx'> </div><div class='ctx'> 	error = decode_cookie3(xdr, &amp;new_cookie);</div><div class='ctx'> 	if (unlikely(error))</div><div class='del'>-		return error;</div><div class='add'>+		return -EAGAIN;</div><div class='ctx'> </div><div class='ctx'> 	entry-&gt;d_type = DT_UNKNOWN;</div><div class='ctx'> </div><div class='hunk'>@@ -2003,7 +2000,7 @@ int nfs3_decode_dirent(struct xdr_stream *xdr, struct nfs_entry *entry,</div><div class='ctx'> 		entry-&gt;fattr-&gt;valid = 0;</div><div class='ctx'> 		error = decode_post_op_attr(xdr, entry-&gt;fattr, userns);</div><div class='ctx'> 		if (unlikely(error))</div><div class='del'>-			return error;</div><div class='add'>+			return -EAGAIN;</div><div class='ctx'> 		if (entry-&gt;fattr-&gt;valid &amp; NFS_ATTR_FATTR_V3)</div><div class='ctx'> 			entry-&gt;d_type = nfs_umode_to_dtype(entry-&gt;fattr-&gt;mode);</div><div class='ctx'> </div><div class='hunk'>@@ -2018,24 +2015,15 @@ int nfs3_decode_dirent(struct xdr_stream *xdr, struct nfs_entry *entry,</div><div class='ctx'> 			return -EAGAIN;</div><div class='ctx'> 		if (*p != xdr_zero) {</div><div class='ctx'> 			error = decode_nfs_fh3(xdr, entry-&gt;fh);</div><div class='del'>-			if (unlikely(error)) {</div><div class='del'>-				if (error == -E2BIG)</div><div class='del'>-					goto out_truncated;</div><div class='del'>-				return error;</div><div class='del'>-			}</div><div class='add'>+			if (unlikely(error))</div><div class='add'>+				return -EAGAIN;</div><div class='ctx'> 		} else</div><div class='ctx'> 			zero_nfs_fh3(entry-&gt;fh);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	entry-&gt;prev_cookie = entry-&gt;cookie;</div><div class='ctx'> 	entry-&gt;cookie = new_cookie;</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='del'>-</div><div class='del'>-out_truncated:</div><div class='del'>-	dprintk("NFS: directory entry contains invalid file handle\n");</div><div class='del'>-	*entry = old;</div><div class='del'>-	return -EAGAIN;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2110,7 +2098,7 @@ out_default:</div><div class='ctx'> 	error = decode_post_op_attr(xdr, result-&gt;dir_attr, rpc_rqst_userns(req));</div><div class='ctx'> 	if (unlikely(error))</div><div class='ctx'> 		goto out;</div><div class='del'>-	return nfs3_stat_to_errno(status);</div><div class='add'>+	return nfs_stat_to_errno(status);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2176,7 +2164,7 @@ static int nfs3_xdr_dec_fsstat3res(struct rpc_rqst *req,</div><div class='ctx'> out:</div><div class='ctx'> 	return error;</div><div class='ctx'> out_status:</div><div class='del'>-	return nfs3_stat_to_errno(status);</div><div class='add'>+	return nfs_stat_to_errno(status);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2228,6 +2216,7 @@ static int decode_fsinfo3resok(struct xdr_stream *xdr,</div><div class='ctx'> 	/* ignore properties */</div><div class='ctx'> 	result-&gt;lease_time = 0;</div><div class='ctx'> 	result-&gt;change_attr_type = NFS4_CHANGE_TYPE_IS_UNDEFINED;</div><div class='add'>+	result-&gt;xattr_support = 0;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2251,7 +2240,7 @@ static int nfs3_xdr_dec_fsinfo3res(struct rpc_rqst *req,</div><div class='ctx'> out:</div><div class='ctx'> 	return error;</div><div class='ctx'> out_status:</div><div class='del'>-	return nfs3_stat_to_errno(status);</div><div class='add'>+	return nfs_stat_to_errno(status);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2312,7 +2301,7 @@ static int nfs3_xdr_dec_pathconf3res(struct rpc_rqst *req,</div><div class='ctx'> out:</div><div class='ctx'> 	return error;</div><div class='ctx'> out_status:</div><div class='del'>-	return nfs3_stat_to_errno(status);</div><div class='add'>+	return nfs_stat_to_errno(status);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -2358,7 +2347,7 @@ static int nfs3_xdr_dec_commit3res(struct rpc_rqst *req,</div><div class='ctx'> out:</div><div class='ctx'> 	return error;</div><div class='ctx'> out_status:</div><div class='del'>-	return nfs3_stat_to_errno(status);</div><div class='add'>+	return nfs_stat_to_errno(status);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_NFS_V3_ACL</div><div class='hunk'>@@ -2424,7 +2413,7 @@ static int nfs3_xdr_dec_getacl3res(struct rpc_rqst *req,</div><div class='ctx'> out:</div><div class='ctx'> 	return error;</div><div class='ctx'> out_default:</div><div class='del'>-	return nfs3_stat_to_errno(status);</div><div class='add'>+	return nfs_stat_to_errno(status);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int nfs3_xdr_dec_setacl3res(struct rpc_rqst *req,</div><div class='hunk'>@@ -2443,76 +2432,11 @@ static int nfs3_xdr_dec_setacl3res(struct rpc_rqst *req,</div><div class='ctx'> out:</div><div class='ctx'> 	return error;</div><div class='ctx'> out_default:</div><div class='del'>-	return nfs3_stat_to_errno(status);</div><div class='add'>+	return nfs_stat_to_errno(status);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #endif  /* CONFIG_NFS_V3_ACL */</div><div class='ctx'> </div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * We need to translate between nfs status return values and</div><div class='del'>- * the local errno values which may not be the same.</div><div class='del'>- */</div><div class='del'>-static const struct {</div><div class='del'>-	int stat;</div><div class='del'>-	int errno;</div><div class='del'>-} nfs_errtbl[] = {</div><div class='del'>-	{ NFS_OK,		0		},</div><div class='del'>-	{ NFSERR_PERM,		-EPERM		},</div><div class='del'>-	{ NFSERR_NOENT,		-ENOENT		},</div><div class='del'>-	{ NFSERR_IO,		-errno_NFSERR_IO},</div><div class='del'>-	{ NFSERR_NXIO,		-ENXIO		},</div><div class='del'>-/*	{ NFSERR_EAGAIN,	-EAGAIN		}, */</div><div class='del'>-	{ NFSERR_ACCES,		-EACCES		},</div><div class='del'>-	{ NFSERR_EXIST,		-EEXIST		},</div><div class='del'>-	{ NFSERR_XDEV,		-EXDEV		},</div><div class='del'>-	{ NFSERR_NODEV,		-ENODEV		},</div><div class='del'>-	{ NFSERR_NOTDIR,	-ENOTDIR	},</div><div class='del'>-	{ NFSERR_ISDIR,		-EISDIR		},</div><div class='del'>-	{ NFSERR_INVAL,		-EINVAL		},</div><div class='del'>-	{ NFSERR_FBIG,		-EFBIG		},</div><div class='del'>-	{ NFSERR_NOSPC,		-ENOSPC		},</div><div class='del'>-	{ NFSERR_ROFS,		-EROFS		},</div><div class='del'>-	{ NFSERR_MLINK,		-EMLINK		},</div><div class='del'>-	{ NFSERR_NAMETOOLONG,	-ENAMETOOLONG	},</div><div class='del'>-	{ NFSERR_NOTEMPTY,	-ENOTEMPTY	},</div><div class='del'>-	{ NFSERR_DQUOT,		-EDQUOT		},</div><div class='del'>-	{ NFSERR_STALE,		-ESTALE		},</div><div class='del'>-	{ NFSERR_REMOTE,	-EREMOTE	},</div><div class='del'>-#ifdef EWFLUSH</div><div class='del'>-	{ NFSERR_WFLUSH,	-EWFLUSH	},</div><div class='del'>-#endif</div><div class='del'>-	{ NFSERR_BADHANDLE,	-EBADHANDLE	},</div><div class='del'>-	{ NFSERR_NOT_SYNC,	-ENOTSYNC	},</div><div class='del'>-	{ NFSERR_BAD_COOKIE,	-EBADCOOKIE	},</div><div class='del'>-	{ NFSERR_NOTSUPP,	-ENOTSUPP	},</div><div class='del'>-	{ NFSERR_TOOSMALL,	-ETOOSMALL	},</div><div class='del'>-	{ NFSERR_SERVERFAULT,	-EREMOTEIO	},</div><div class='del'>-	{ NFSERR_BADTYPE,	-EBADTYPE	},</div><div class='del'>-	{ NFSERR_JUKEBOX,	-EJUKEBOX	},</div><div class='del'>-	{ -1,			-EIO		}</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/**</div><div class='del'>- * nfs3_stat_to_errno - convert an NFS status code to a local errno</div><div class='del'>- * @status: NFS status code to convert</div><div class='del'>- *</div><div class='del'>- * Returns a local errno value, or -EIO if the NFS status code is</div><div class='del'>- * not recognized.  This function is used jointly by NFSv2 and NFSv3.</div><div class='del'>- */</div><div class='del'>-static int nfs3_stat_to_errno(enum nfs_stat status)</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; nfs_errtbl[i].stat != -1; i++) {</div><div class='del'>-		if (nfs_errtbl[i].stat == (int)status)</div><div class='del'>-			return nfs_errtbl[i].errno;</div><div class='del'>-	}</div><div class='del'>-	dprintk("NFS: Unrecognized nfs status value: %u\n", status);</div><div class='del'>-	return nfs_errtbl[i].errno;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-</div><div class='ctx'> #define PROC(proc, argtype, restype, timer)				\</div><div class='ctx'> [NFS3PROC_##proc] = {							\</div><div class='ctx'> 	.p_proc      = NFS3PROC_##proc,					\</div><div class='head'>diff --git a/fs/nfs/nfs42.h b/fs/nfs/nfs42.h<br/>index 0fe5aacbcfdf..aafd15a4afce 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs42.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs42.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs42.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfs42.h</a></div><div class='hunk'>@@ -13,6 +13,7 @@</div><div class='ctx'>  * more? Need to consider not to pre-alloc too much for a compound.</div><div class='ctx'>  */</div><div class='ctx'> #define PNFS_LAYOUTSTATS_MAXDEV (4)</div><div class='add'>+#define READ_PLUS_SCRATCH_SIZE (16)</div><div class='ctx'> </div><div class='ctx'> /* nfs4.2proc.c */</div><div class='ctx'> #ifdef CONFIG_NFS_V4_2</div><div class='hunk'>@@ -20,6 +21,7 @@ int nfs42_proc_allocate(struct file *, loff_t, loff_t);</div><div class='ctx'> ssize_t nfs42_proc_copy(struct file *, loff_t, struct file *, loff_t, size_t,</div><div class='ctx'> 			struct nl4_server *, nfs4_stateid *, bool);</div><div class='ctx'> int nfs42_proc_deallocate(struct file *, loff_t, loff_t);</div><div class='add'>+int nfs42_proc_zero_range(struct file *, loff_t, loff_t);</div><div class='ctx'> loff_t nfs42_proc_llseek(struct file *, loff_t, int);</div><div class='ctx'> int nfs42_proc_layoutstats_generic(struct nfs_server *,</div><div class='ctx'> 				   struct nfs42_layoutstat_data *);</div><div class='hunk'>@@ -54,11 +56,14 @@ int nfs42_proc_removexattr(struct inode *inode, const char *name);</div><div class='ctx'>  * They would be 7 bytes long in the eventual buffer ("user.x\0"), and</div><div class='ctx'>  * 8 bytes long XDR-encoded.</div><div class='ctx'>  *</div><div class='del'>- * Include the trailing eof word as well.</div><div class='add'>+ * Include the trailing eof word as well and make the result a multiple</div><div class='add'>+ * of 4 bytes.</div><div class='ctx'>  */</div><div class='ctx'> static inline u32 nfs42_listxattr_xdrsize(u32 buflen)</div><div class='ctx'> {</div><div class='del'>-	return ((buflen / (XATTR_USER_PREFIX_LEN + 2)) * 8) + 4;</div><div class='add'>+	u32 size = 8 * buflen / (XATTR_USER_PREFIX_LEN + 2) + 4;</div><div class='add'>+</div><div class='add'>+	return (size + 3) &amp; ~3;</div><div class='ctx'> }</div><div class='ctx'> #endif /* CONFIG_NFS_V4_2 */</div><div class='ctx'> #endif /* __LINUX_FS_NFS_NFS4_2_H */</div><div class='head'>diff --git a/fs/nfs/nfs42proc.c b/fs/nfs/nfs42proc.c<br/>index 08355b66e7cb..d537fb0c230e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs42proc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs42proc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs42proc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfs42proc.c</a></div><div class='hunk'>@@ -21,6 +21,8 @@</div><div class='ctx'> </div><div class='ctx'> #define NFSDBG_FACILITY NFSDBG_PROC</div><div class='ctx'> static int nfs42_do_offload_cancel_async(struct file *dst, nfs4_stateid *std);</div><div class='add'>+static int nfs42_proc_offload_status(struct file *file, nfs4_stateid *stateid,</div><div class='add'>+				     u64 *copied);</div><div class='ctx'> </div><div class='ctx'> static void nfs42_set_netaddr(struct file *filep, struct nfs42_netaddr *naddr)</div><div class='ctx'> {</div><div class='hunk'>@@ -46,7 +48,7 @@ static int _nfs42_proc_fallocate(struct rpc_message *msg, struct file *filep,</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(filep);</div><div class='ctx'> 	struct nfs_server *server = NFS_SERVER(inode);</div><div class='del'>-	u32 bitmask[3];</div><div class='add'>+	u32 bitmask[NFS_BITMASK_SZ];</div><div class='ctx'> 	struct nfs42_falloc_args args = {</div><div class='ctx'> 		.falloc_fh	= NFS_FH(inode),</div><div class='ctx'> 		.falloc_offset	= offset,</div><div class='hunk'>@@ -69,9 +71,8 @@ static int _nfs42_proc_fallocate(struct rpc_message *msg, struct file *filep,</div><div class='ctx'> 		return status;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	memcpy(bitmask, server-&gt;cache_consistency_bitmask, sizeof(bitmask));</div><div class='del'>-	if (server-&gt;attr_bitmask[1] &amp; FATTR4_WORD1_SPACE_USED)</div><div class='del'>-		bitmask[1] |= FATTR4_WORD1_SPACE_USED;</div><div class='add'>+	nfs4_bitmask_set(bitmask, server-&gt;cache_consistency_bitmask, inode,</div><div class='add'>+			 NFS_INO_INVALID_BLOCKS);</div><div class='ctx'> </div><div class='ctx'> 	res.falloc_fattr = nfs_alloc_fattr();</div><div class='ctx'> 	if (!res.falloc_fattr)</div><div class='hunk'>@@ -79,10 +80,16 @@ static int _nfs42_proc_fallocate(struct rpc_message *msg, struct file *filep,</div><div class='ctx'> </div><div class='ctx'> 	status = nfs4_call_sync(server-&gt;client, server, msg,</div><div class='ctx'> 				&amp;args.seq_args, &amp;res.seq_res, 0);</div><div class='del'>-	if (status == 0)</div><div class='add'>+	if (status == 0) {</div><div class='add'>+		if (nfs_should_remove_suid(inode)) {</div><div class='add'>+			spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+			nfs_set_cache_invalid(inode,</div><div class='add'>+				NFS_INO_REVAL_FORCED | NFS_INO_INVALID_MODE);</div><div class='add'>+			spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+		}</div><div class='ctx'> 		status = nfs_post_op_update_inode_force_wcc(inode,</div><div class='ctx'> 							    res.falloc_fattr);</div><div class='del'>-</div><div class='add'>+	}</div><div class='ctx'> 	if (msg-&gt;rpc_proc == &amp;nfs4_procedures[NFSPROC4_CLNT_ALLOCATE])</div><div class='ctx'> 		trace_nfs4_fallocate(inode, &amp;args, status);</div><div class='ctx'> 	else</div><div class='hunk'>@@ -107,6 +114,7 @@ static int nfs42_proc_fallocate(struct rpc_message *msg, struct file *filep,</div><div class='ctx'> 	exception.inode = inode;</div><div class='ctx'> 	exception.state = lock-&gt;open_context-&gt;state;</div><div class='ctx'> </div><div class='add'>+	nfs_file_block_o_direct(NFS_I(inode));</div><div class='ctx'> 	err = nfs_sync_inode(inode);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -130,6 +138,7 @@ int nfs42_proc_allocate(struct file *filep, loff_t offset, loff_t len)</div><div class='ctx'> 		.rpc_proc = &amp;nfs4_procedures[NFSPROC4_CLNT_ALLOCATE],</div><div class='ctx'> 	};</div><div class='ctx'> 	struct inode *inode = file_inode(filep);</div><div class='add'>+	loff_t oldsize = i_size_read(inode);</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (!nfs_server_capable(inode, NFS_CAP_ALLOCATE))</div><div class='hunk'>@@ -138,8 +147,13 @@ int nfs42_proc_allocate(struct file *filep, loff_t offset, loff_t len)</div><div class='ctx'> 	inode_lock(inode);</div><div class='ctx'> </div><div class='ctx'> 	err = nfs42_proc_fallocate(&amp;msg, filep, offset, len);</div><div class='del'>-	if (err == -EOPNOTSUPP)</div><div class='del'>-		NFS_SERVER(inode)-&gt;caps &amp;= ~NFS_CAP_ALLOCATE;</div><div class='add'>+</div><div class='add'>+	if (err == 0)</div><div class='add'>+		nfs_truncate_last_folio(inode-&gt;i_mapping, oldsize,</div><div class='add'>+					offset + len);</div><div class='add'>+	else if (err == -EOPNOTSUPP)</div><div class='add'>+		NFS_SERVER(inode)-&gt;caps &amp;= ~(NFS_CAP_ALLOCATE |</div><div class='add'>+					     NFS_CAP_ZERO_RANGE);</div><div class='ctx'> </div><div class='ctx'> 	inode_unlock(inode);</div><div class='ctx'> 	return err;</div><div class='hunk'>@@ -162,12 +176,53 @@ int nfs42_proc_deallocate(struct file *filep, loff_t offset, loff_t len)</div><div class='ctx'> 	if (err == 0)</div><div class='ctx'> 		truncate_pagecache_range(inode, offset, (offset + len) -1);</div><div class='ctx'> 	if (err == -EOPNOTSUPP)</div><div class='del'>-		NFS_SERVER(inode)-&gt;caps &amp;= ~NFS_CAP_DEALLOCATE;</div><div class='add'>+		NFS_SERVER(inode)-&gt;caps &amp;= ~(NFS_CAP_DEALLOCATE |</div><div class='add'>+					     NFS_CAP_ZERO_RANGE);</div><div class='add'>+</div><div class='add'>+	inode_unlock(inode);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int nfs42_proc_zero_range(struct file *filep, loff_t offset, loff_t len)</div><div class='add'>+{</div><div class='add'>+	struct rpc_message msg = {</div><div class='add'>+		.rpc_proc = &amp;nfs4_procedures[NFSPROC4_CLNT_ZERO_RANGE],</div><div class='add'>+	};</div><div class='add'>+	struct inode *inode = file_inode(filep);</div><div class='add'>+	loff_t oldsize = i_size_read(inode);</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	if (!nfs_server_capable(inode, NFS_CAP_ZERO_RANGE))</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+</div><div class='add'>+	inode_lock(inode);</div><div class='add'>+</div><div class='add'>+	err = nfs42_proc_fallocate(&amp;msg, filep, offset, len);</div><div class='add'>+	if (err == 0) {</div><div class='add'>+		nfs_truncate_last_folio(inode-&gt;i_mapping, oldsize,</div><div class='add'>+					offset + len);</div><div class='add'>+		truncate_pagecache_range(inode, offset, (offset + len) -1);</div><div class='add'>+	} else if (err == -EOPNOTSUPP)</div><div class='add'>+		NFS_SERVER(inode)-&gt;caps &amp;= ~NFS_CAP_ZERO_RANGE;</div><div class='ctx'> </div><div class='ctx'> 	inode_unlock(inode);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void nfs4_copy_dequeue_callback(struct nfs_server *dst_server,</div><div class='add'>+				       struct nfs_server *src_server,</div><div class='add'>+				       struct nfs4_copy_state *copy)</div><div class='add'>+{</div><div class='add'>+	spin_lock(&amp;dst_server-&gt;nfs_client-&gt;cl_lock);</div><div class='add'>+	list_del_init(&amp;copy-&gt;copies);</div><div class='add'>+	spin_unlock(&amp;dst_server-&gt;nfs_client-&gt;cl_lock);</div><div class='add'>+	if (dst_server != src_server) {</div><div class='add'>+		spin_lock(&amp;src_server-&gt;nfs_client-&gt;cl_lock);</div><div class='add'>+		list_del_init(&amp;copy-&gt;src_copies);</div><div class='add'>+		spin_unlock(&amp;src_server-&gt;nfs_client-&gt;cl_lock);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int handle_async_copy(struct nfs42_copy_res *res,</div><div class='ctx'> 			     struct nfs_server *dst_server,</div><div class='ctx'> 			     struct nfs_server *src_server,</div><div class='hunk'>@@ -176,28 +231,30 @@ static int handle_async_copy(struct nfs42_copy_res *res,</div><div class='ctx'> 			     nfs4_stateid *src_stateid,</div><div class='ctx'> 			     bool *restart)</div><div class='ctx'> {</div><div class='del'>-	struct nfs4_copy_state *copy, *tmp_copy;</div><div class='del'>-	int status = NFS4_OK;</div><div class='del'>-	bool found_pending = false;</div><div class='add'>+	struct nfs4_copy_state *copy, *tmp_copy = NULL, *iter;</div><div class='ctx'> 	struct nfs_open_context *dst_ctx = nfs_file_open_context(dst);</div><div class='ctx'> 	struct nfs_open_context *src_ctx = nfs_file_open_context(src);</div><div class='add'>+	struct nfs_client *clp = dst_server-&gt;nfs_client;</div><div class='add'>+	unsigned long timeout = 3 * HZ;</div><div class='add'>+	int status = NFS4_OK;</div><div class='add'>+	u64 copied;</div><div class='ctx'> </div><div class='del'>-	copy = kzalloc(sizeof(struct nfs4_copy_state), GFP_NOFS);</div><div class='add'>+	copy = kzalloc(sizeof(struct nfs4_copy_state), GFP_KERNEL);</div><div class='ctx'> 	if (!copy)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;dst_server-&gt;nfs_client-&gt;cl_lock);</div><div class='del'>-	list_for_each_entry(tmp_copy,</div><div class='add'>+	list_for_each_entry(iter,</div><div class='ctx'> 				&amp;dst_server-&gt;nfs_client-&gt;pending_cb_stateids,</div><div class='ctx'> 				copies) {</div><div class='del'>-		if (memcmp(&amp;res-&gt;write_res.stateid, &amp;tmp_copy-&gt;stateid,</div><div class='add'>+		if (memcmp(&amp;res-&gt;write_res.stateid, &amp;iter-&gt;stateid,</div><div class='ctx'> 				NFS4_STATEID_SIZE))</div><div class='ctx'> 			continue;</div><div class='del'>-		found_pending = true;</div><div class='del'>-		list_del(&amp;tmp_copy-&gt;copies);</div><div class='add'>+		tmp_copy = iter;</div><div class='add'>+		list_del(&amp;iter-&gt;copies);</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='del'>-	if (found_pending) {</div><div class='add'>+	if (tmp_copy) {</div><div class='ctx'> 		spin_unlock(&amp;dst_server-&gt;nfs_client-&gt;cl_lock);</div><div class='ctx'> 		kfree(copy);</div><div class='ctx'> 		copy = tmp_copy;</div><div class='hunk'>@@ -214,19 +271,16 @@ static int handle_async_copy(struct nfs42_copy_res *res,</div><div class='ctx'> </div><div class='ctx'> 	if (dst_server != src_server) {</div><div class='ctx'> 		spin_lock(&amp;src_server-&gt;nfs_client-&gt;cl_lock);</div><div class='del'>-		list_add_tail(&amp;copy-&gt;src_copies, &amp;src_server-&gt;ss_copies);</div><div class='add'>+		list_add_tail(&amp;copy-&gt;src_copies, &amp;src_server-&gt;ss_src_copies);</div><div class='ctx'> 		spin_unlock(&amp;src_server-&gt;nfs_client-&gt;cl_lock);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	status = wait_for_completion_interruptible(&amp;copy-&gt;completion);</div><div class='del'>-	spin_lock(&amp;dst_server-&gt;nfs_client-&gt;cl_lock);</div><div class='del'>-	list_del_init(&amp;copy-&gt;copies);</div><div class='del'>-	spin_unlock(&amp;dst_server-&gt;nfs_client-&gt;cl_lock);</div><div class='del'>-	if (dst_server != src_server) {</div><div class='del'>-		spin_lock(&amp;src_server-&gt;nfs_client-&gt;cl_lock);</div><div class='del'>-		list_del_init(&amp;copy-&gt;src_copies);</div><div class='del'>-		spin_unlock(&amp;src_server-&gt;nfs_client-&gt;cl_lock);</div><div class='del'>-	}</div><div class='add'>+wait:</div><div class='add'>+	status = wait_for_completion_interruptible_timeout(&amp;copy-&gt;completion,</div><div class='add'>+							   timeout);</div><div class='add'>+	if (!status)</div><div class='add'>+		goto timeout;</div><div class='add'>+	nfs4_copy_dequeue_callback(dst_server, src_server, copy);</div><div class='ctx'> 	if (status == -ERESTARTSYS) {</div><div class='ctx'> 		goto out_cancel;</div><div class='ctx'> 	} else if (copy-&gt;flags || copy-&gt;error == NFS4ERR_PARTNER_NO_AUTH) {</div><div class='hunk'>@@ -236,6 +290,7 @@ static int handle_async_copy(struct nfs42_copy_res *res,</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='ctx'> 	res-&gt;write_res.count = copy-&gt;count;</div><div class='add'>+	/* Copy out the updated write verifier provided by CB_OFFLOAD. */</div><div class='ctx'> 	memcpy(&amp;res-&gt;write_res.verifier, &amp;copy-&gt;verf, sizeof(copy-&gt;verf));</div><div class='ctx'> 	status = -copy-&gt;error;</div><div class='ctx'> </div><div class='hunk'>@@ -247,6 +302,39 @@ out_cancel:</div><div class='ctx'> 	if (!nfs42_files_from_same_server(src, dst))</div><div class='ctx'> 		nfs42_do_offload_cancel_async(src, src_stateid);</div><div class='ctx'> 	goto out_free;</div><div class='add'>+timeout:</div><div class='add'>+	timeout &lt;&lt;= 1;</div><div class='add'>+	if (timeout &gt; (clp-&gt;cl_lease_time &gt;&gt; 1))</div><div class='add'>+		timeout = clp-&gt;cl_lease_time &gt;&gt; 1;</div><div class='add'>+	status = nfs42_proc_offload_status(dst, &amp;copy-&gt;stateid, &amp;copied);</div><div class='add'>+	if (status == -EINPROGRESS)</div><div class='add'>+		goto wait;</div><div class='add'>+	nfs4_copy_dequeue_callback(dst_server, src_server, copy);</div><div class='add'>+	switch (status) {</div><div class='add'>+	case 0:</div><div class='add'>+		/* The server recognized the copy stateid, so it hasn't</div><div class='add'>+		 * rebooted. Don't overwrite the verifier returned in the</div><div class='add'>+		 * COPY result. */</div><div class='add'>+		res-&gt;write_res.count = copied;</div><div class='add'>+		goto out_free;</div><div class='add'>+	case -EREMOTEIO:</div><div class='add'>+		/* COPY operation failed on the server. */</div><div class='add'>+		status = -EOPNOTSUPP;</div><div class='add'>+		res-&gt;write_res.count = copied;</div><div class='add'>+		goto out_free;</div><div class='add'>+	case -EBADF:</div><div class='add'>+		/* Server did not recognize the copy stateid. It has</div><div class='add'>+		 * probably restarted and lost the plot. */</div><div class='add'>+		res-&gt;write_res.count = 0;</div><div class='add'>+		status = -EOPNOTSUPP;</div><div class='add'>+		break;</div><div class='add'>+	case -EOPNOTSUPP:</div><div class='add'>+		/* RFC 7862 REQUIREs server to support OFFLOAD_STATUS when</div><div class='add'>+		 * it has signed up for an async COPY, so server is not</div><div class='add'>+		 * spec-compliant. */</div><div class='add'>+		res-&gt;write_res.count = 0;</div><div class='add'>+	}</div><div class='add'>+	goto out_free;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int process_copy_commit(struct file *dst, loff_t pos_dst,</div><div class='hunk'>@@ -255,7 +343,7 @@ static int process_copy_commit(struct file *dst, loff_t pos_dst,</div><div class='ctx'> 	struct nfs_commitres cres;</div><div class='ctx'> 	int status = -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	cres.verf = kzalloc(sizeof(struct nfs_writeverf), GFP_NOFS);</div><div class='add'>+	cres.verf = kzalloc(sizeof(struct nfs_writeverf), GFP_KERNEL);</div><div class='ctx'> 	if (!cres.verf)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -275,21 +363,28 @@ out:</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * nfs42_copy_dest_done - perform inode cache updates after clone/copy offload</div><div class='del'>- * @inode: pointer to destination inode</div><div class='add'>+ * @file: pointer to destination file</div><div class='ctx'>  * @pos: destination offset</div><div class='ctx'>  * @len: copy length</div><div class='add'>+ * @oldsize: length of the file prior to clone/copy</div><div class='ctx'>  *</div><div class='ctx'>  * Punch a hole in the inode page cache, so that the NFS client will</div><div class='ctx'>  * know to retrieve new data.</div><div class='ctx'>  * Update the file size if necessary, and then mark the inode as having</div><div class='ctx'>  * invalid cached values for change attribute, ctime, mtime and space used.</div><div class='ctx'>  */</div><div class='del'>-static void nfs42_copy_dest_done(struct inode *inode, loff_t pos, loff_t len)</div><div class='add'>+static void nfs42_copy_dest_done(struct file *file, loff_t pos, loff_t len,</div><div class='add'>+				 loff_t oldsize)</div><div class='ctx'> {</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='add'>+	struct address_space *mapping = file-&gt;f_mapping;</div><div class='ctx'> 	loff_t newsize = pos + len;</div><div class='ctx'> 	loff_t end = newsize - 1;</div><div class='ctx'> </div><div class='del'>-	truncate_pagecache_range(inode, pos, end);</div><div class='add'>+	nfs_truncate_last_folio(mapping, oldsize, pos);</div><div class='add'>+	WARN_ON_ONCE(invalidate_inode_pages2_range(mapping, pos &gt;&gt; PAGE_SHIFT,</div><div class='add'>+						   end &gt;&gt; PAGE_SHIFT));</div><div class='add'>+</div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	if (newsize &gt; i_size_read(inode))</div><div class='ctx'> 		i_size_write(inode, newsize);</div><div class='hunk'>@@ -321,6 +416,7 @@ static ssize_t _nfs42_proc_copy(struct file *src,</div><div class='ctx'> 	struct nfs_server *src_server = NFS_SERVER(src_inode);</div><div class='ctx'> 	loff_t pos_src = args-&gt;src_pos;</div><div class='ctx'> 	loff_t pos_dst = args-&gt;dst_pos;</div><div class='add'>+	loff_t oldsize_dst = i_size_read(dst_inode);</div><div class='ctx'> 	size_t count = args-&gt;count;</div><div class='ctx'> 	ssize_t status;</div><div class='ctx'> </div><div class='hunk'>@@ -336,7 +432,7 @@ static ssize_t _nfs42_proc_copy(struct file *src,</div><div class='ctx'> 			return status;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	status = nfs_filemap_write_and_wait_range(file_inode(src)-&gt;i_mapping,</div><div class='add'>+	status = nfs_filemap_write_and_wait_range(src-&gt;f_mapping,</div><div class='ctx'> 			pos_src, pos_src + (loff_t)count - 1);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		return status;</div><div class='hunk'>@@ -349,6 +445,7 @@ static ssize_t _nfs42_proc_copy(struct file *src,</div><div class='ctx'> 		return status;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	nfs_file_block_o_direct(NFS_I(dst_inode));</div><div class='ctx'> 	status = nfs_sync_inode(dst_inode);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		return status;</div><div class='hunk'>@@ -356,7 +453,7 @@ static ssize_t _nfs42_proc_copy(struct file *src,</div><div class='ctx'> 	res-&gt;commit_res.verf = NULL;</div><div class='ctx'> 	if (args-&gt;sync) {</div><div class='ctx'> 		res-&gt;commit_res.verf =</div><div class='del'>-			kzalloc(sizeof(struct nfs_writeverf), GFP_NOFS);</div><div class='add'>+			kzalloc(sizeof(struct nfs_writeverf), GFP_KERNEL);</div><div class='ctx'> 		if (!res-&gt;commit_res.verf)</div><div class='ctx'> 			return -ENOMEM;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -394,7 +491,7 @@ static ssize_t _nfs42_proc_copy(struct file *src,</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	nfs42_copy_dest_done(dst_inode, pos_dst, res-&gt;write_res.count);</div><div class='add'>+	nfs42_copy_dest_done(dst, pos_dst, res-&gt;write_res.count, oldsize_dst);</div><div class='ctx'> 	nfs_invalidate_atime(src_inode);</div><div class='ctx'> 	status = res-&gt;write_res.count;</div><div class='ctx'> out:</div><div class='hunk'>@@ -455,7 +552,8 @@ ssize_t nfs42_proc_copy(struct file *src, loff_t pos_src,</div><div class='ctx'> </div><div class='ctx'> 		if (err &gt;= 0)</div><div class='ctx'> 			break;</div><div class='del'>-		if (err == -ENOTSUPP &amp;&amp;</div><div class='add'>+		if ((err == -ENOTSUPP ||</div><div class='add'>+				err == -NFS4ERR_OFFLOAD_DENIED) &amp;&amp;</div><div class='ctx'> 				nfs42_files_from_same_server(src, dst)) {</div><div class='ctx'> 			err = -EOPNOTSUPP;</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -465,8 +563,9 @@ ssize_t nfs42_proc_copy(struct file *src, loff_t pos_src,</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='ctx'> 			break;</div><div class='del'>-		} else if (err == -NFS4ERR_OFFLOAD_NO_REQS &amp;&amp; !args.sync) {</div><div class='del'>-			args.sync = true;</div><div class='add'>+		} else if (err == -NFS4ERR_OFFLOAD_NO_REQS &amp;&amp;</div><div class='add'>+				args.sync != res.synchronous) {</div><div class='add'>+			args.sync = res.synchronous;</div><div class='ctx'> 			dst_exception.retry = 1;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		} else if ((err == -ESTALE ||</div><div class='hunk'>@@ -490,15 +589,15 @@ out_put_src_lock:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct nfs42_offloadcancel_data {</div><div class='add'>+struct nfs42_offload_data {</div><div class='ctx'> 	struct nfs_server *seq_server;</div><div class='ctx'> 	struct nfs42_offload_status_args args;</div><div class='ctx'> 	struct nfs42_offload_status_res res;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static void nfs42_offload_cancel_prepare(struct rpc_task *task, void *calldata)</div><div class='add'>+static void nfs42_offload_prepare(struct rpc_task *task, void *calldata)</div><div class='ctx'> {</div><div class='del'>-	struct nfs42_offloadcancel_data *data = calldata;</div><div class='add'>+	struct nfs42_offload_data *data = calldata;</div><div class='ctx'> </div><div class='ctx'> 	nfs4_setup_sequence(data-&gt;seq_server-&gt;nfs_client,</div><div class='ctx'> 				&amp;data-&gt;args.osa_seq_args,</div><div class='hunk'>@@ -507,7 +606,7 @@ static void nfs42_offload_cancel_prepare(struct rpc_task *task, void *calldata)</div><div class='ctx'> </div><div class='ctx'> static void nfs42_offload_cancel_done(struct rpc_task *task, void *calldata)</div><div class='ctx'> {</div><div class='del'>-	struct nfs42_offloadcancel_data *data = calldata;</div><div class='add'>+	struct nfs42_offload_data *data = calldata;</div><div class='ctx'> </div><div class='ctx'> 	trace_nfs4_offload_cancel(&amp;data-&gt;args, task-&gt;tk_status);</div><div class='ctx'> 	nfs41_sequence_done(task, &amp;data-&gt;res.osr_seq_res);</div><div class='hunk'>@@ -517,22 +616,22 @@ static void nfs42_offload_cancel_done(struct rpc_task *task, void *calldata)</div><div class='ctx'> 		rpc_restart_call_prepare(task);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void nfs42_free_offloadcancel_data(void *data)</div><div class='add'>+static void nfs42_offload_release(void *data)</div><div class='ctx'> {</div><div class='ctx'> 	kfree(data);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct rpc_call_ops nfs42_offload_cancel_ops = {</div><div class='del'>-	.rpc_call_prepare = nfs42_offload_cancel_prepare,</div><div class='add'>+	.rpc_call_prepare = nfs42_offload_prepare,</div><div class='ctx'> 	.rpc_call_done = nfs42_offload_cancel_done,</div><div class='del'>-	.rpc_release = nfs42_free_offloadcancel_data,</div><div class='add'>+	.rpc_release = nfs42_offload_release,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static int nfs42_do_offload_cancel_async(struct file *dst,</div><div class='ctx'> 					 nfs4_stateid *stateid)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_server *dst_server = NFS_SERVER(file_inode(dst));</div><div class='del'>-	struct nfs42_offloadcancel_data *data = NULL;</div><div class='add'>+	struct nfs42_offload_data *data = NULL;</div><div class='ctx'> 	struct nfs_open_context *ctx = nfs_file_open_context(dst);</div><div class='ctx'> 	struct rpc_task *task;</div><div class='ctx'> 	struct rpc_message msg = {</div><div class='hunk'>@@ -544,14 +643,14 @@ static int nfs42_do_offload_cancel_async(struct file *dst,</div><div class='ctx'> 		.rpc_message = &amp;msg,</div><div class='ctx'> 		.callback_ops = &amp;nfs42_offload_cancel_ops,</div><div class='ctx'> 		.workqueue = nfsiod_workqueue,</div><div class='del'>-		.flags = RPC_TASK_ASYNC,</div><div class='add'>+		.flags = RPC_TASK_ASYNC | RPC_TASK_MOVEABLE,</div><div class='ctx'> 	};</div><div class='ctx'> 	int status;</div><div class='ctx'> </div><div class='ctx'> 	if (!(dst_server-&gt;caps &amp; NFS_CAP_OFFLOAD_CANCEL))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='del'>-	data = kzalloc(sizeof(struct nfs42_offloadcancel_data), GFP_NOFS);</div><div class='add'>+	data = kzalloc(sizeof(struct nfs42_offload_data), GFP_KERNEL);</div><div class='ctx'> 	if (data == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='hunk'>@@ -574,6 +673,108 @@ static int nfs42_do_offload_cancel_async(struct file *dst,</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int</div><div class='add'>+_nfs42_proc_offload_status(struct nfs_server *server, struct file *file,</div><div class='add'>+			   struct nfs42_offload_data *data)</div><div class='add'>+{</div><div class='add'>+	struct nfs_open_context *ctx = nfs_file_open_context(file);</div><div class='add'>+	struct rpc_message msg = {</div><div class='add'>+		.rpc_proc	= &amp;nfs4_procedures[NFSPROC4_CLNT_OFFLOAD_STATUS],</div><div class='add'>+		.rpc_argp	= &amp;data-&gt;args,</div><div class='add'>+		.rpc_resp	= &amp;data-&gt;res,</div><div class='add'>+		.rpc_cred	= ctx-&gt;cred,</div><div class='add'>+	};</div><div class='add'>+	int status;</div><div class='add'>+</div><div class='add'>+	status = nfs4_call_sync(server-&gt;client, server, &amp;msg,</div><div class='add'>+				&amp;data-&gt;args.osa_seq_args,</div><div class='add'>+				&amp;data-&gt;res.osr_seq_res, 1);</div><div class='add'>+	trace_nfs4_offload_status(&amp;data-&gt;args, status);</div><div class='add'>+	switch (status) {</div><div class='add'>+	case 0:</div><div class='add'>+		break;</div><div class='add'>+</div><div class='add'>+	case -NFS4ERR_ADMIN_REVOKED:</div><div class='add'>+	case -NFS4ERR_BAD_STATEID:</div><div class='add'>+	case -NFS4ERR_OLD_STATEID:</div><div class='add'>+		/*</div><div class='add'>+		 * Server does not recognize the COPY stateid. CB_OFFLOAD</div><div class='add'>+		 * could have purged it, or server might have rebooted.</div><div class='add'>+		 * Since COPY stateids don't have an associated inode,</div><div class='add'>+		 * avoid triggering state recovery.</div><div class='add'>+		 */</div><div class='add'>+		status = -EBADF;</div><div class='add'>+		break;</div><div class='add'>+	case -NFS4ERR_NOTSUPP:</div><div class='add'>+	case -ENOTSUPP:</div><div class='add'>+	case -EOPNOTSUPP:</div><div class='add'>+		server-&gt;caps &amp;= ~NFS_CAP_OFFLOAD_STATUS;</div><div class='add'>+		status = -EOPNOTSUPP;</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return status;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * nfs42_proc_offload_status - Poll completion status of an async copy operation</div><div class='add'>+ * @dst: handle of file being copied into</div><div class='add'>+ * @stateid: copy stateid (from async COPY result)</div><div class='add'>+ * @copied: OUT: number of bytes copied so far</div><div class='add'>+ *</div><div class='add'>+ * Return values:</div><div class='add'>+ *   %0: Server returned an NFS4_OK completion status</div><div class='add'>+ *   %-EINPROGRESS: Server returned no completion status</div><div class='add'>+ *   %-EREMOTEIO: Server returned an error completion status</div><div class='add'>+ *   %-EBADF: Server did not recognize the copy stateid</div><div class='add'>+ *   %-EOPNOTSUPP: Server does not support OFFLOAD_STATUS</div><div class='add'>+ *   %-ERESTARTSYS: Wait interrupted by signal</div><div class='add'>+ *</div><div class='add'>+ * Other negative errnos indicate the client could not complete the</div><div class='add'>+ * request.</div><div class='add'>+ */</div><div class='add'>+static int</div><div class='add'>+nfs42_proc_offload_status(struct file *dst, nfs4_stateid *stateid, u64 *copied)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file_inode(dst);</div><div class='add'>+	struct nfs_server *server = NFS_SERVER(inode);</div><div class='add'>+	struct nfs4_exception exception = {</div><div class='add'>+		.inode = inode,</div><div class='add'>+	};</div><div class='add'>+	struct nfs42_offload_data *data;</div><div class='add'>+	int status;</div><div class='add'>+</div><div class='add'>+	if (!(server-&gt;caps &amp; NFS_CAP_OFFLOAD_STATUS))</div><div class='add'>+		return -EOPNOTSUPP;</div><div class='add'>+</div><div class='add'>+	data = kzalloc(sizeof(*data), GFP_KERNEL);</div><div class='add'>+	if (!data)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	data-&gt;seq_server = server;</div><div class='add'>+	data-&gt;args.osa_src_fh = NFS_FH(inode);</div><div class='add'>+	memcpy(&amp;data-&gt;args.osa_stateid, stateid,</div><div class='add'>+		sizeof(data-&gt;args.osa_stateid));</div><div class='add'>+	exception.stateid = &amp;data-&gt;args.osa_stateid;</div><div class='add'>+	do {</div><div class='add'>+		status = _nfs42_proc_offload_status(server, dst, data);</div><div class='add'>+		if (status == -EOPNOTSUPP)</div><div class='add'>+			goto out;</div><div class='add'>+		status = nfs4_handle_exception(server, status, &amp;exception);</div><div class='add'>+	} while (exception.retry);</div><div class='add'>+	if (status)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	*copied = data-&gt;res.osr_count;</div><div class='add'>+	if (!data-&gt;res.complete_count)</div><div class='add'>+		status = -EINPROGRESS;</div><div class='add'>+	else if (data-&gt;res.osr_complete != NFS_OK)</div><div class='add'>+		status = -EREMOTEIO;</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	kfree(data);</div><div class='add'>+	return status;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int _nfs42_proc_copy_notify(struct file *src, struct file *dst,</div><div class='ctx'> 				   struct nfs42_copy_notify_args *args,</div><div class='ctx'> 				   struct nfs42_copy_notify_res *res)</div><div class='hunk'>@@ -590,8 +791,10 @@ static int _nfs42_proc_copy_notify(struct file *src, struct file *dst,</div><div class='ctx'> </div><div class='ctx'> 	ctx = get_nfs_open_context(nfs_file_open_context(src));</div><div class='ctx'> 	l_ctx = nfs_get_lock_context(ctx);</div><div class='del'>-	if (IS_ERR(l_ctx))</div><div class='del'>-		return PTR_ERR(l_ctx);</div><div class='add'>+	if (IS_ERR(l_ctx)) {</div><div class='add'>+		status = PTR_ERR(l_ctx);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	status = nfs4_set_rw_stateid(&amp;args-&gt;cna_src_stateid, ctx, l_ctx,</div><div class='ctx'> 				     FMODE_READ);</div><div class='hunk'>@@ -599,7 +802,7 @@ static int _nfs42_proc_copy_notify(struct file *src, struct file *dst,</div><div class='ctx'> 	if (status) {</div><div class='ctx'> 		if (status == -EAGAIN)</div><div class='ctx'> 			status = -NFS4ERR_BAD_STATEID;</div><div class='del'>-		return status;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	status = nfs4_call_sync(src_server-&gt;client, src_server, &amp;msg,</div><div class='hunk'>@@ -608,6 +811,7 @@ static int _nfs42_proc_copy_notify(struct file *src, struct file *dst,</div><div class='ctx'> 	if (status == -ENOTSUPP)</div><div class='ctx'> 		src_server-&gt;caps &amp;= ~NFS_CAP_COPY_NOTIFY;</div><div class='ctx'> </div><div class='add'>+out:</div><div class='ctx'> 	put_nfs_open_context(nfs_file_open_context(src));</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='hunk'>@@ -625,7 +829,7 @@ int nfs42_proc_copy_notify(struct file *src, struct file *dst,</div><div class='ctx'> 	if (!(src_server-&gt;caps &amp; NFS_CAP_COPY_NOTIFY))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='del'>-	args = kzalloc(sizeof(struct nfs42_copy_notify_args), GFP_NOFS);</div><div class='add'>+	args = kzalloc(sizeof(struct nfs42_copy_notify_args), GFP_KERNEL);</div><div class='ctx'> 	if (args == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='hunk'>@@ -850,7 +1054,7 @@ int nfs42_proc_layoutstats_generic(struct nfs_server *server,</div><div class='ctx'> 		.rpc_message = &amp;msg,</div><div class='ctx'> 		.callback_ops = &amp;nfs42_layoutstat_ops,</div><div class='ctx'> 		.callback_data = data,</div><div class='del'>-		.flags = RPC_TASK_ASYNC,</div><div class='add'>+		.flags = RPC_TASK_ASYNC | RPC_TASK_MOVEABLE,</div><div class='ctx'> 	};</div><div class='ctx'> 	struct rpc_task *task;</div><div class='ctx'> </div><div class='hunk'>@@ -1005,7 +1209,7 @@ int nfs42_proc_layouterror(struct pnfs_layout_segment *lseg,</div><div class='ctx'> 	struct rpc_task_setup task_setup = {</div><div class='ctx'> 		.rpc_message = &amp;msg,</div><div class='ctx'> 		.callback_ops = &amp;nfs42_layouterror_ops,</div><div class='del'>-		.flags = RPC_TASK_ASYNC,</div><div class='add'>+		.flags = RPC_TASK_ASYNC | RPC_TASK_MOVEABLE,</div><div class='ctx'> 	};</div><div class='ctx'> 	unsigned int i;</div><div class='ctx'> </div><div class='hunk'>@@ -1013,7 +1217,7 @@ int nfs42_proc_layouterror(struct pnfs_layout_segment *lseg,</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> 	if (n &gt; NFS42_LAYOUTERROR_MAX)</div><div class='ctx'> 		return -EINVAL;</div><div class='del'>-	data = nfs42_alloc_layouterror_data(lseg, GFP_NOFS);</div><div class='add'>+	data = nfs42_alloc_layouterror_data(lseg, nfs_io_gfp_mask());</div><div class='ctx'> 	if (!data)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	for (i = 0; i &lt; n; i++) {</div><div class='hunk'>@@ -1042,17 +1246,19 @@ static int _nfs42_proc_clone(struct rpc_message *msg, struct file *src_f,</div><div class='ctx'> 	struct inode *src_inode = file_inode(src_f);</div><div class='ctx'> 	struct inode *dst_inode = file_inode(dst_f);</div><div class='ctx'> 	struct nfs_server *server = NFS_SERVER(dst_inode);</div><div class='add'>+	__u32 dst_bitmask[NFS_BITMASK_SZ];</div><div class='ctx'> 	struct nfs42_clone_args args = {</div><div class='ctx'> 		.src_fh = NFS_FH(src_inode),</div><div class='ctx'> 		.dst_fh = NFS_FH(dst_inode),</div><div class='ctx'> 		.src_offset = src_offset,</div><div class='ctx'> 		.dst_offset = dst_offset,</div><div class='ctx'> 		.count = count,</div><div class='del'>-		.dst_bitmask = server-&gt;cache_consistency_bitmask,</div><div class='add'>+		.dst_bitmask = dst_bitmask,</div><div class='ctx'> 	};</div><div class='ctx'> 	struct nfs42_clone_res res = {</div><div class='ctx'> 		.server	= server,</div><div class='ctx'> 	};</div><div class='add'>+	loff_t oldsize_dst = i_size_read(dst_inode);</div><div class='ctx'> 	int status;</div><div class='ctx'> </div><div class='ctx'> 	msg-&gt;rpc_argp = &amp;args;</div><div class='hunk'>@@ -1077,11 +1283,17 @@ static int _nfs42_proc_clone(struct rpc_message *msg, struct file *src_f,</div><div class='ctx'> 	if (!res.dst_fattr)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='add'>+	nfs4_bitmask_set(dst_bitmask, server-&gt;cache_consistency_bitmask,</div><div class='add'>+			 dst_inode, NFS_INO_INVALID_BLOCKS);</div><div class='add'>+</div><div class='ctx'> 	status = nfs4_call_sync(server-&gt;client, server, msg,</div><div class='ctx'> 				&amp;args.seq_args, &amp;res.seq_res, 0);</div><div class='ctx'> 	trace_nfs4_clone(src_inode, dst_inode, &amp;args, status);</div><div class='ctx'> 	if (status == 0) {</div><div class='del'>-		nfs42_copy_dest_done(dst_inode, dst_offset, count);</div><div class='add'>+		/* a zero-length count means clone to EOF in src */</div><div class='add'>+		if (count == 0 &amp;&amp; res.dst_fattr-&gt;valid &amp; NFS_ATTR_FATTR_SIZE)</div><div class='add'>+			count = nfs_size_to_loff_t(res.dst_fattr-&gt;size) - dst_offset;</div><div class='add'>+		nfs42_copy_dest_done(dst_f, dst_offset, count, oldsize_dst);</div><div class='ctx'> 		status = nfs_post_op_update_inode(dst_inode, res.dst_fattr);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1163,6 +1375,7 @@ static int _nfs42_proc_removexattr(struct inode *inode, const char *name)</div><div class='ctx'> </div><div class='ctx'> 	ret = nfs4_call_sync(server-&gt;client, server, &amp;msg, &amp;args.seq_args,</div><div class='ctx'> 	    &amp;res.seq_res, 1);</div><div class='add'>+	trace_nfs4_removexattr(inode, name, ret);</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		nfs4_update_changeattr(inode, &amp;res.cinfo, timestamp, 0);</div><div class='ctx'> </div><div class='hunk'>@@ -1173,15 +1386,19 @@ static int _nfs42_proc_setxattr(struct inode *inode, const char *name,</div><div class='ctx'> 				const void *buf, size_t buflen, int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_server *server = NFS_SERVER(inode);</div><div class='add'>+	__u32 bitmask[NFS_BITMASK_SZ];</div><div class='ctx'> 	struct page *pages[NFS4XATTR_MAXPAGES];</div><div class='ctx'> 	struct nfs42_setxattrargs arg = {</div><div class='ctx'> 		.fh		= NFS_FH(inode),</div><div class='add'>+		.bitmask	= bitmask,</div><div class='ctx'> 		.xattr_pages	= pages,</div><div class='ctx'> 		.xattr_len	= buflen,</div><div class='ctx'> 		.xattr_name	= name,</div><div class='ctx'> 		.xattr_flags	= flags,</div><div class='ctx'> 	};</div><div class='del'>-	struct nfs42_setxattrres res;</div><div class='add'>+	struct nfs42_setxattrres res = {</div><div class='add'>+		.server		= server,</div><div class='add'>+	};</div><div class='ctx'> 	struct rpc_message msg = {</div><div class='ctx'> 		.rpc_proc	= &amp;nfs4_procedures[NFSPROC4_CLNT_SETXATTR],</div><div class='ctx'> 		.rpc_argp	= &amp;arg,</div><div class='hunk'>@@ -1193,22 +1410,36 @@ static int _nfs42_proc_setxattr(struct inode *inode, const char *name,</div><div class='ctx'> 	if (buflen &gt; server-&gt;sxasize)</div><div class='ctx'> 		return -ERANGE;</div><div class='ctx'> </div><div class='add'>+	res.fattr = nfs_alloc_fattr();</div><div class='add'>+	if (!res.fattr)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='ctx'> 	if (buflen &gt; 0) {</div><div class='ctx'> 		np = nfs4_buf_to_pages_noslab(buf, buflen, arg.xattr_pages);</div><div class='del'>-		if (np &lt; 0)</div><div class='del'>-			return np;</div><div class='add'>+		if (np &lt; 0) {</div><div class='add'>+			ret = np;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> 	} else</div><div class='ctx'> 		np = 0;</div><div class='ctx'> </div><div class='add'>+	nfs4_bitmask_set(bitmask, server-&gt;cache_consistency_bitmask,</div><div class='add'>+			 inode, NFS_INO_INVALID_CHANGE);</div><div class='add'>+</div><div class='ctx'> 	ret = nfs4_call_sync(server-&gt;client, server, &amp;msg, &amp;arg.seq_args,</div><div class='ctx'> 	    &amp;res.seq_res, 1);</div><div class='add'>+	trace_nfs4_setxattr(inode, name, ret);</div><div class='ctx'> </div><div class='ctx'> 	for (; np &gt; 0; np--)</div><div class='ctx'> 		put_page(pages[np - 1]);</div><div class='ctx'> </div><div class='del'>-	if (!ret)</div><div class='add'>+	if (!ret) {</div><div class='ctx'> 		nfs4_update_changeattr(inode, &amp;res.cinfo, timestamp, 0);</div><div class='add'>+		ret = nfs_post_op_update_inode(inode, res.fattr);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='add'>+out:</div><div class='add'>+	kfree(res.fattr);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1234,6 +1465,7 @@ static ssize_t _nfs42_proc_getxattr(struct inode *inode, const char *name,</div><div class='ctx'> </div><div class='ctx'> 	ret = nfs4_call_sync(server-&gt;client, server, &amp;msg, &amp;arg.seq_args,</div><div class='ctx'> 	    &amp;res.seq_res, 0);</div><div class='add'>+	trace_nfs4_getxattr(inode, name, ret);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> </div><div class='hunk'>@@ -1282,7 +1514,7 @@ static ssize_t _nfs42_proc_listxattrs(struct inode *inode, void *buf,</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> 	ret = -ENOMEM;</div><div class='del'>-	res.scratch = alloc_page(GFP_KERNEL);</div><div class='add'>+	res.scratch = folio_alloc(GFP_KERNEL, 0);</div><div class='ctx'> 	if (!res.scratch)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -1305,6 +1537,7 @@ static ssize_t _nfs42_proc_listxattrs(struct inode *inode, void *buf,</div><div class='ctx'> </div><div class='ctx'> 	ret = nfs4_call_sync(server-&gt;client, server, &amp;msg, &amp;arg.seq_args,</div><div class='ctx'> 	    &amp;res.seq_res, 0);</div><div class='add'>+	trace_nfs4_listxattr(inode, ret);</div><div class='ctx'> </div><div class='ctx'> 	if (ret &gt;= 0) {</div><div class='ctx'> 		ret = res.copied;</div><div class='hunk'>@@ -1319,7 +1552,7 @@ out_free_pages:</div><div class='ctx'> 	}</div><div class='ctx'> 	kfree(pages);</div><div class='ctx'> out_free_scratch:</div><div class='del'>-	__free_page(res.scratch);</div><div class='add'>+	folio_put(res.scratch);</div><div class='ctx'> out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> </div><div class='hunk'>@@ -1340,7 +1573,6 @@ ssize_t nfs42_proc_getxattr(struct inode *inode, const char *name,</div><div class='ctx'> 	for (i = 0; i &lt; np; i++) {</div><div class='ctx'> 		pages[i] = alloc_page(GFP_KERNEL);</div><div class='ctx'> 		if (!pages[i]) {</div><div class='del'>-			np = i + 1;</div><div class='ctx'> 			err = -ENOMEM;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -1364,8 +1596,8 @@ ssize_t nfs42_proc_getxattr(struct inode *inode, const char *name,</div><div class='ctx'> 	} while (exception.retry);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	while (--np &gt;= 0)</div><div class='del'>-		__free_page(pages[np]);</div><div class='add'>+	while (--i &gt;= 0)</div><div class='add'>+		__free_page(pages[i]);</div><div class='ctx'> 	kfree(pages);</div><div class='ctx'> </div><div class='ctx'> 	return err;</div><div class='head'>diff --git a/fs/nfs/nfs42xattr.c b/fs/nfs/nfs42xattr.c<br/>index 1c4d2a05b401..37d79400e5f4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs42xattr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs42xattr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs42xattr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfs42xattr.c</a></div><div class='hunk'>@@ -132,7 +132,7 @@ nfs4_xattr_entry_lru_add(struct nfs4_xattr_entry *entry)</div><div class='ctx'> 	lru = (entry-&gt;flags &amp; NFS4_XATTR_ENTRY_EXTVAL) ?</div><div class='ctx'> 	    &amp;nfs4_xattr_large_entry_lru : &amp;nfs4_xattr_entry_lru;</div><div class='ctx'> </div><div class='del'>-	return list_lru_add(lru, &amp;entry-&gt;lru);</div><div class='add'>+	return list_lru_add_obj(lru, &amp;entry-&gt;lru);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool</div><div class='hunk'>@@ -143,7 +143,7 @@ nfs4_xattr_entry_lru_del(struct nfs4_xattr_entry *entry)</div><div class='ctx'> 	lru = (entry-&gt;flags &amp; NFS4_XATTR_ENTRY_EXTVAL) ?</div><div class='ctx'> 	    &amp;nfs4_xattr_large_entry_lru : &amp;nfs4_xattr_entry_lru;</div><div class='ctx'> </div><div class='del'>-	return list_lru_del(lru, &amp;entry-&gt;lru);</div><div class='add'>+	return list_lru_del_obj(lru, &amp;entry-&gt;lru);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -199,7 +199,7 @@ nfs4_xattr_alloc_entry(const char *name, const void *value,</div><div class='ctx'> 		flags = NFS4_XATTR_ENTRY_EXTVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	buf = kmalloc(alloclen, GFP_KERNEL_ACCOUNT | GFP_NOFS);</div><div class='add'>+	buf = kmalloc(alloclen, GFP_KERNEL);</div><div class='ctx'> 	if (buf == NULL)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	entry = (struct nfs4_xattr_entry *)buf;</div><div class='hunk'>@@ -213,7 +213,7 @@ nfs4_xattr_alloc_entry(const char *name, const void *value,</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; NFS4_XATTR_ENTRY_EXTVAL) {</div><div class='del'>-		valp = kvmalloc(len, GFP_KERNEL_ACCOUNT | GFP_NOFS);</div><div class='add'>+		valp = kvmalloc(len, GFP_KERNEL);</div><div class='ctx'> 		if (valp == NULL) {</div><div class='ctx'> 			kfree(buf);</div><div class='ctx'> 			return NULL;</div><div class='hunk'>@@ -289,8 +289,7 @@ nfs4_xattr_alloc_cache(void)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_xattr_cache *cache;</div><div class='ctx'> </div><div class='del'>-	cache = kmem_cache_alloc(nfs4_xattr_cache_cachep,</div><div class='del'>-	    GFP_KERNEL_ACCOUNT | GFP_NOFS);</div><div class='add'>+	cache = kmem_cache_alloc(nfs4_xattr_cache_cachep, GFP_KERNEL);</div><div class='ctx'> 	if (cache == NULL)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='hunk'>@@ -350,7 +349,7 @@ nfs4_xattr_cache_unlink(struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> 	oldcache = nfsi-&gt;xattr_cache;</div><div class='ctx'> 	if (oldcache != NULL) {</div><div class='del'>-		list_lru_del(&amp;nfs4_xattr_cache_lru, &amp;oldcache-&gt;lru);</div><div class='add'>+		list_lru_del_obj(&amp;nfs4_xattr_cache_lru, &amp;oldcache-&gt;lru);</div><div class='ctx'> 		oldcache-&gt;inode = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> 	nfsi-&gt;xattr_cache = NULL;</div><div class='hunk'>@@ -475,7 +474,7 @@ nfs4_xattr_get_cache(struct inode *inode, int add)</div><div class='ctx'> 			kref_get(&amp;cache-&gt;ref);</div><div class='ctx'> 			nfsi-&gt;xattr_cache = cache;</div><div class='ctx'> 			cache-&gt;inode = inode;</div><div class='del'>-			list_lru_add(&amp;nfs4_xattr_cache_lru, &amp;cache-&gt;lru);</div><div class='add'>+			list_lru_add_obj(&amp;nfs4_xattr_cache_lru, &amp;cache-&gt;lru);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='hunk'>@@ -797,32 +796,13 @@ static unsigned long nfs4_xattr_cache_scan(struct shrinker *shrink,</div><div class='ctx'> static unsigned long nfs4_xattr_entry_scan(struct shrinker *shrink,</div><div class='ctx'> 					   struct shrink_control *sc);</div><div class='ctx'> </div><div class='del'>-static struct shrinker nfs4_xattr_cache_shrinker = {</div><div class='del'>-	.count_objects	= nfs4_xattr_cache_count,</div><div class='del'>-	.scan_objects	= nfs4_xattr_cache_scan,</div><div class='del'>-	.seeks		= DEFAULT_SEEKS,</div><div class='del'>-	.flags		= SHRINKER_MEMCG_AWARE,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static struct shrinker nfs4_xattr_entry_shrinker = {</div><div class='del'>-	.count_objects	= nfs4_xattr_entry_count,</div><div class='del'>-	.scan_objects	= nfs4_xattr_entry_scan,</div><div class='del'>-	.seeks		= DEFAULT_SEEKS,</div><div class='del'>-	.batch		= 512,</div><div class='del'>-	.flags		= SHRINKER_MEMCG_AWARE,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static struct shrinker nfs4_xattr_large_entry_shrinker = {</div><div class='del'>-	.count_objects	= nfs4_xattr_entry_count,</div><div class='del'>-	.scan_objects	= nfs4_xattr_entry_scan,</div><div class='del'>-	.seeks		= 1,</div><div class='del'>-	.batch		= 512,</div><div class='del'>-	.flags		= SHRINKER_MEMCG_AWARE,</div><div class='del'>-};</div><div class='add'>+static struct shrinker *nfs4_xattr_cache_shrinker;</div><div class='add'>+static struct shrinker *nfs4_xattr_entry_shrinker;</div><div class='add'>+static struct shrinker *nfs4_xattr_large_entry_shrinker;</div><div class='ctx'> </div><div class='ctx'> static enum lru_status</div><div class='ctx'> cache_lru_isolate(struct list_head *item,</div><div class='del'>-	struct list_lru_one *lru, spinlock_t *lru_lock, void *arg)</div><div class='add'>+	struct list_lru_one *lru, void *arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct list_head *dispose = arg;</div><div class='ctx'> 	struct inode *inode;</div><div class='hunk'>@@ -887,7 +867,7 @@ nfs4_xattr_cache_count(struct shrinker *shrink, struct shrink_control *sc)</div><div class='ctx'> </div><div class='ctx'> static enum lru_status</div><div class='ctx'> entry_lru_isolate(struct list_head *item,</div><div class='del'>-	struct list_lru_one *lru, spinlock_t *lru_lock, void *arg)</div><div class='add'>+	struct list_lru_one *lru, void *arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct list_head *dispose = arg;</div><div class='ctx'> 	struct nfs4_xattr_bucket *bucket;</div><div class='hunk'>@@ -944,7 +924,7 @@ nfs4_xattr_entry_scan(struct shrinker *shrink, struct shrink_control *sc)</div><div class='ctx'> 	struct nfs4_xattr_entry *entry;</div><div class='ctx'> 	struct list_lru *lru;</div><div class='ctx'> </div><div class='del'>-	lru = (shrink == &amp;nfs4_xattr_large_entry_shrinker) ?</div><div class='add'>+	lru = (shrink == nfs4_xattr_large_entry_shrinker) ?</div><div class='ctx'> 	    &amp;nfs4_xattr_large_entry_lru : &amp;nfs4_xattr_entry_lru;</div><div class='ctx'> </div><div class='ctx'> 	freed = list_lru_shrink_walk(lru, sc, entry_lru_isolate, &amp;dispose);</div><div class='hunk'>@@ -972,7 +952,7 @@ nfs4_xattr_entry_count(struct shrinker *shrink, struct shrink_control *sc)</div><div class='ctx'> 	unsigned long count;</div><div class='ctx'> 	struct list_lru *lru;</div><div class='ctx'> </div><div class='del'>-	lru = (shrink == &amp;nfs4_xattr_large_entry_shrinker) ?</div><div class='add'>+	lru = (shrink == nfs4_xattr_large_entry_shrinker) ?</div><div class='ctx'> 	    &amp;nfs4_xattr_large_entry_lru : &amp;nfs4_xattr_entry_lru;</div><div class='ctx'> </div><div class='ctx'> 	count = list_lru_shrink_count(lru, sc);</div><div class='hunk'>@@ -982,7 +962,7 @@ nfs4_xattr_entry_count(struct shrinker *shrink, struct shrink_control *sc)</div><div class='ctx'> </div><div class='ctx'> static void nfs4_xattr_cache_init_once(void *p)</div><div class='ctx'> {</div><div class='del'>-	struct nfs4_xattr_cache *cache = (struct nfs4_xattr_cache *)p;</div><div class='add'>+	struct nfs4_xattr_cache *cache = p;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock_init(&amp;cache-&gt;listxattr_lock);</div><div class='ctx'> 	atomic_long_set(&amp;cache-&gt;nent, 0);</div><div class='hunk'>@@ -992,54 +972,84 @@ static void nfs4_xattr_cache_init_once(void *p)</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;cache-&gt;dispose);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+typedef unsigned long (*count_objects_cb)(struct shrinker *s,</div><div class='add'>+					  struct shrink_control *sc);</div><div class='add'>+typedef unsigned long (*scan_objects_cb)(struct shrinker *s,</div><div class='add'>+					 struct shrink_control *sc);</div><div class='add'>+</div><div class='add'>+static int __init nfs4_xattr_shrinker_init(struct shrinker **shrinker,</div><div class='add'>+					   struct list_lru *lru, const char *name,</div><div class='add'>+					   count_objects_cb count,</div><div class='add'>+					   scan_objects_cb scan, long batch, int seeks)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	*shrinker = shrinker_alloc(SHRINKER_MEMCG_AWARE, name);</div><div class='add'>+	if (!*shrinker)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	ret = list_lru_init_memcg(lru, *shrinker);</div><div class='add'>+	if (ret) {</div><div class='add'>+		shrinker_free(*shrinker);</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	(*shrinker)-&gt;count_objects = count;</div><div class='add'>+	(*shrinker)-&gt;scan_objects = scan;</div><div class='add'>+	(*shrinker)-&gt;batch = batch;</div><div class='add'>+	(*shrinker)-&gt;seeks = seeks;</div><div class='add'>+</div><div class='add'>+	shrinker_register(*shrinker);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfs4_xattr_shrinker_destroy(struct shrinker *shrinker,</div><div class='add'>+					struct list_lru *lru)</div><div class='add'>+{</div><div class='add'>+	shrinker_free(shrinker);</div><div class='add'>+	list_lru_destroy(lru);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> int __init nfs4_xattr_cache_init(void)</div><div class='ctx'> {</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	nfs4_xattr_cache_cachep = kmem_cache_create("nfs4_xattr_cache_cache",</div><div class='ctx'> 	    sizeof(struct nfs4_xattr_cache), 0,</div><div class='del'>-	    (SLAB_RECLAIM_ACCOUNT|SLAB_MEM_SPREAD|SLAB_ACCOUNT),</div><div class='add'>+	    (SLAB_RECLAIM_ACCOUNT),</div><div class='ctx'> 	    nfs4_xattr_cache_init_once);</div><div class='ctx'> 	if (nfs4_xattr_cache_cachep == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	ret = list_lru_init_memcg(&amp;nfs4_xattr_large_entry_lru,</div><div class='del'>-	    &amp;nfs4_xattr_large_entry_shrinker);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto out4;</div><div class='del'>-</div><div class='del'>-	ret = list_lru_init_memcg(&amp;nfs4_xattr_entry_lru,</div><div class='del'>-	    &amp;nfs4_xattr_entry_shrinker);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto out3;</div><div class='del'>-</div><div class='del'>-	ret = list_lru_init_memcg(&amp;nfs4_xattr_cache_lru,</div><div class='del'>-	    &amp;nfs4_xattr_cache_shrinker);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto out2;</div><div class='del'>-</div><div class='del'>-	ret = register_shrinker(&amp;nfs4_xattr_cache_shrinker);</div><div class='add'>+	ret = nfs4_xattr_shrinker_init(&amp;nfs4_xattr_cache_shrinker,</div><div class='add'>+				       &amp;nfs4_xattr_cache_lru, "nfs-xattr_cache",</div><div class='add'>+				       nfs4_xattr_cache_count,</div><div class='add'>+				       nfs4_xattr_cache_scan, 0, DEFAULT_SEEKS);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out1;</div><div class='ctx'> </div><div class='del'>-	ret = register_shrinker(&amp;nfs4_xattr_entry_shrinker);</div><div class='add'>+	ret = nfs4_xattr_shrinker_init(&amp;nfs4_xattr_entry_shrinker,</div><div class='add'>+				       &amp;nfs4_xattr_entry_lru, "nfs-xattr_entry",</div><div class='add'>+				       nfs4_xattr_entry_count,</div><div class='add'>+				       nfs4_xattr_entry_scan, 512, DEFAULT_SEEKS);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out;</div><div class='add'>+		goto out2;</div><div class='ctx'> </div><div class='del'>-	ret = register_shrinker(&amp;nfs4_xattr_large_entry_shrinker);</div><div class='add'>+	ret = nfs4_xattr_shrinker_init(&amp;nfs4_xattr_large_entry_shrinker,</div><div class='add'>+				       &amp;nfs4_xattr_large_entry_lru,</div><div class='add'>+				       "nfs-xattr_large_entry",</div><div class='add'>+				       nfs4_xattr_entry_count,</div><div class='add'>+				       nfs4_xattr_entry_scan, 512, 1);</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	unregister_shrinker(&amp;nfs4_xattr_entry_shrinker);</div><div class='del'>-out:</div><div class='del'>-	unregister_shrinker(&amp;nfs4_xattr_cache_shrinker);</div><div class='del'>-out1:</div><div class='del'>-	list_lru_destroy(&amp;nfs4_xattr_cache_lru);</div><div class='add'>+	nfs4_xattr_shrinker_destroy(nfs4_xattr_entry_shrinker,</div><div class='add'>+				    &amp;nfs4_xattr_entry_lru);</div><div class='ctx'> out2:</div><div class='del'>-	list_lru_destroy(&amp;nfs4_xattr_entry_lru);</div><div class='del'>-out3:</div><div class='del'>-	list_lru_destroy(&amp;nfs4_xattr_large_entry_lru);</div><div class='del'>-out4:</div><div class='add'>+	nfs4_xattr_shrinker_destroy(nfs4_xattr_cache_shrinker,</div><div class='add'>+				    &amp;nfs4_xattr_cache_lru);</div><div class='add'>+out1:</div><div class='ctx'> 	kmem_cache_destroy(nfs4_xattr_cache_cachep);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -1047,11 +1057,11 @@ out4:</div><div class='ctx'> </div><div class='ctx'> void nfs4_xattr_cache_exit(void)</div><div class='ctx'> {</div><div class='del'>-	unregister_shrinker(&amp;nfs4_xattr_large_entry_shrinker);</div><div class='del'>-	unregister_shrinker(&amp;nfs4_xattr_entry_shrinker);</div><div class='del'>-	unregister_shrinker(&amp;nfs4_xattr_cache_shrinker);</div><div class='del'>-	list_lru_destroy(&amp;nfs4_xattr_large_entry_lru);</div><div class='del'>-	list_lru_destroy(&amp;nfs4_xattr_entry_lru);</div><div class='del'>-	list_lru_destroy(&amp;nfs4_xattr_cache_lru);</div><div class='add'>+	nfs4_xattr_shrinker_destroy(nfs4_xattr_large_entry_shrinker,</div><div class='add'>+				    &amp;nfs4_xattr_large_entry_lru);</div><div class='add'>+	nfs4_xattr_shrinker_destroy(nfs4_xattr_entry_shrinker,</div><div class='add'>+				    &amp;nfs4_xattr_entry_lru);</div><div class='add'>+	nfs4_xattr_shrinker_destroy(nfs4_xattr_cache_shrinker,</div><div class='add'>+				    &amp;nfs4_xattr_cache_lru);</div><div class='ctx'> 	kmem_cache_destroy(nfs4_xattr_cache_cachep);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/nfs/nfs42xdr.c b/fs/nfs/nfs42xdr.c<br/>index c8bad735e4c1..e10d83ba835e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs42xdr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs42xdr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs42xdr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfs42xdr.c</a></div><div class='hunk'>@@ -7,6 +7,9 @@</div><div class='ctx'> </div><div class='ctx'> #include "nfs42.h"</div><div class='ctx'> </div><div class='add'>+/* Not limited by NFS itself, limited by the generic xattr code */</div><div class='add'>+#define nfs4_xattr_name_maxsz   XDR_QUADLEN(XATTR_NAME_MAX)</div><div class='add'>+</div><div class='ctx'> #define encode_fallocate_maxsz		(encode_stateid_maxsz + \</div><div class='ctx'> 					 2 /* offset */ + \</div><div class='ctx'> 					 2 /* length */)</div><div class='hunk'>@@ -32,6 +35,11 @@</div><div class='ctx'> #define encode_offload_cancel_maxsz	(op_encode_hdr_maxsz + \</div><div class='ctx'> 					 XDR_QUADLEN(NFS4_STATEID_SIZE))</div><div class='ctx'> #define decode_offload_cancel_maxsz	(op_decode_hdr_maxsz)</div><div class='add'>+#define encode_offload_status_maxsz	(op_encode_hdr_maxsz + \</div><div class='add'>+					 XDR_QUADLEN(NFS4_STATEID_SIZE))</div><div class='add'>+#define decode_offload_status_maxsz	(op_decode_hdr_maxsz + \</div><div class='add'>+					 2 /* osr_count */ + \</div><div class='add'>+					 2 /* osr_complete */)</div><div class='ctx'> #define encode_copy_notify_maxsz	(op_encode_hdr_maxsz + \</div><div class='ctx'> 					 XDR_QUADLEN(NFS4_STATEID_SIZE) + \</div><div class='ctx'> 					 1 + /* nl4_type */ \</div><div class='hunk'>@@ -47,13 +55,20 @@</div><div class='ctx'> #define decode_deallocate_maxsz		(op_decode_hdr_maxsz)</div><div class='ctx'> #define encode_read_plus_maxsz		(op_encode_hdr_maxsz + \</div><div class='ctx'> 					 encode_stateid_maxsz + 3)</div><div class='del'>-#define NFS42_READ_PLUS_SEGMENT_SIZE	(1 /* data_content4 */ + \</div><div class='add'>+#define NFS42_READ_PLUS_DATA_SEGMENT_SIZE \</div><div class='add'>+					(1 /* data_content4 */ + \</div><div class='add'>+					 2 /* data_info4.di_offset */ + \</div><div class='add'>+					 1 /* data_info4.di_length */)</div><div class='add'>+#define NFS42_READ_PLUS_HOLE_SEGMENT_SIZE \</div><div class='add'>+					(1 /* data_content4 */ + \</div><div class='ctx'> 					 2 /* data_info4.di_offset */ + \</div><div class='ctx'> 					 2 /* data_info4.di_length */)</div><div class='add'>+#define READ_PLUS_SEGMENT_SIZE_DIFF	(NFS42_READ_PLUS_HOLE_SEGMENT_SIZE - \</div><div class='add'>+					 NFS42_READ_PLUS_DATA_SEGMENT_SIZE)</div><div class='ctx'> #define decode_read_plus_maxsz		(op_decode_hdr_maxsz + \</div><div class='ctx'> 					 1 /* rpr_eof */ + \</div><div class='ctx'> 					 1 /* rpr_contents count */ + \</div><div class='del'>-					 2 * NFS42_READ_PLUS_SEGMENT_SIZE)</div><div class='add'>+					 NFS42_READ_PLUS_HOLE_SEGMENT_SIZE)</div><div class='ctx'> #define encode_seek_maxsz		(op_encode_hdr_maxsz + \</div><div class='ctx'> 					 encode_stateid_maxsz + \</div><div class='ctx'> 					 2 /* offset */ + \</div><div class='hunk'>@@ -88,6 +103,18 @@</div><div class='ctx'> 					2 /* dst offset */ + \</div><div class='ctx'> 					2 /* count */)</div><div class='ctx'> #define decode_clone_maxsz		(op_decode_hdr_maxsz)</div><div class='add'>+#define encode_getxattr_maxsz		(op_encode_hdr_maxsz + 1 + \</div><div class='add'>+					 nfs4_xattr_name_maxsz)</div><div class='add'>+#define decode_getxattr_maxsz		(op_decode_hdr_maxsz + 1 + pagepad_maxsz)</div><div class='add'>+#define encode_setxattr_maxsz		(op_encode_hdr_maxsz + \</div><div class='add'>+					 1 + nfs4_xattr_name_maxsz + 1)</div><div class='add'>+#define decode_setxattr_maxsz		(op_decode_hdr_maxsz + decode_change_info_maxsz)</div><div class='add'>+#define encode_listxattrs_maxsz		(op_encode_hdr_maxsz + 2 + 1)</div><div class='add'>+#define decode_listxattrs_maxsz		(op_decode_hdr_maxsz + 2 + 1 + 1 + 1)</div><div class='add'>+#define encode_removexattr_maxsz	(op_encode_hdr_maxsz + 1 + \</div><div class='add'>+					 nfs4_xattr_name_maxsz)</div><div class='add'>+#define decode_removexattr_maxsz	(op_decode_hdr_maxsz + \</div><div class='add'>+					 decode_change_info_maxsz)</div><div class='ctx'> </div><div class='ctx'> #define NFS4_enc_allocate_sz		(compound_encode_hdr_maxsz + \</div><div class='ctx'> 					 encode_sequence_maxsz + \</div><div class='hunk'>@@ -121,10 +148,20 @@</div><div class='ctx'> 					 decode_sequence_maxsz + \</div><div class='ctx'> 					 decode_putfh_maxsz + \</div><div class='ctx'> 					 decode_offload_cancel_maxsz)</div><div class='add'>+#define NFS4_enc_offload_status_sz	(compound_encode_hdr_maxsz + \</div><div class='add'>+					 encode_sequence_maxsz + \</div><div class='add'>+					 encode_putfh_maxsz + \</div><div class='add'>+					 encode_offload_status_maxsz)</div><div class='add'>+#define NFS4_dec_offload_status_sz	(compound_decode_hdr_maxsz + \</div><div class='add'>+					 decode_sequence_maxsz + \</div><div class='add'>+					 decode_putfh_maxsz + \</div><div class='add'>+					 decode_offload_status_maxsz)</div><div class='ctx'> #define NFS4_enc_copy_notify_sz		(compound_encode_hdr_maxsz + \</div><div class='add'>+					 encode_sequence_maxsz + \</div><div class='ctx'> 					 encode_putfh_maxsz + \</div><div class='ctx'> 					 encode_copy_notify_maxsz)</div><div class='ctx'> #define NFS4_dec_copy_notify_sz		(compound_decode_hdr_maxsz + \</div><div class='add'>+					 decode_sequence_maxsz + \</div><div class='ctx'> 					 decode_putfh_maxsz + \</div><div class='ctx'> 					 decode_copy_notify_maxsz)</div><div class='ctx'> #define NFS4_enc_deallocate_sz		(compound_encode_hdr_maxsz + \</div><div class='hunk'>@@ -137,6 +174,18 @@</div><div class='ctx'> 					 decode_putfh_maxsz + \</div><div class='ctx'> 					 decode_deallocate_maxsz + \</div><div class='ctx'> 					 decode_getattr_maxsz)</div><div class='add'>+#define NFS4_enc_zero_range_sz		(compound_encode_hdr_maxsz + \</div><div class='add'>+					 encode_sequence_maxsz + \</div><div class='add'>+					 encode_putfh_maxsz + \</div><div class='add'>+					 encode_deallocate_maxsz + \</div><div class='add'>+					 encode_allocate_maxsz + \</div><div class='add'>+					 encode_getattr_maxsz)</div><div class='add'>+#define NFS4_dec_zero_range_sz		(compound_decode_hdr_maxsz + \</div><div class='add'>+					 decode_sequence_maxsz + \</div><div class='add'>+					 decode_putfh_maxsz + \</div><div class='add'>+					 decode_deallocate_maxsz + \</div><div class='add'>+					 decode_allocate_maxsz + \</div><div class='add'>+					 decode_getattr_maxsz)</div><div class='ctx'> #define NFS4_enc_read_plus_sz		(compound_encode_hdr_maxsz + \</div><div class='ctx'> 					 encode_sequence_maxsz + \</div><div class='ctx'> 					 encode_putfh_maxsz + \</div><div class='hunk'>@@ -185,55 +234,40 @@</div><div class='ctx'> 					 decode_putfh_maxsz + \</div><div class='ctx'> 					 decode_clone_maxsz + \</div><div class='ctx'> 					 decode_getattr_maxsz)</div><div class='del'>-</div><div class='del'>-/* Not limited by NFS itself, limited by the generic xattr code */</div><div class='del'>-#define nfs4_xattr_name_maxsz   XDR_QUADLEN(XATTR_NAME_MAX)</div><div class='del'>-</div><div class='del'>-#define encode_getxattr_maxsz   (op_encode_hdr_maxsz + 1 + \</div><div class='del'>-				 nfs4_xattr_name_maxsz)</div><div class='del'>-#define decode_getxattr_maxsz   (op_decode_hdr_maxsz + 1 + pagepad_maxsz)</div><div class='del'>-#define encode_setxattr_maxsz   (op_encode_hdr_maxsz + \</div><div class='del'>-				 1 + nfs4_xattr_name_maxsz + 1)</div><div class='del'>-#define decode_setxattr_maxsz   (op_decode_hdr_maxsz + decode_change_info_maxsz)</div><div class='del'>-#define encode_listxattrs_maxsz  (op_encode_hdr_maxsz + 2 + 1)</div><div class='del'>-#define decode_listxattrs_maxsz  (op_decode_hdr_maxsz + 2 + 1 + 1 + 1)</div><div class='del'>-#define encode_removexattr_maxsz (op_encode_hdr_maxsz + 1 + \</div><div class='del'>-				  nfs4_xattr_name_maxsz)</div><div class='del'>-#define decode_removexattr_maxsz (op_decode_hdr_maxsz + \</div><div class='del'>-				  decode_change_info_maxsz)</div><div class='del'>-</div><div class='del'>-#define NFS4_enc_getxattr_sz	(compound_encode_hdr_maxsz + \</div><div class='del'>-				encode_sequence_maxsz + \</div><div class='del'>-				encode_putfh_maxsz + \</div><div class='del'>-				encode_getxattr_maxsz)</div><div class='del'>-#define NFS4_dec_getxattr_sz	(compound_decode_hdr_maxsz + \</div><div class='del'>-				decode_sequence_maxsz + \</div><div class='del'>-				decode_putfh_maxsz + \</div><div class='del'>-				decode_getxattr_maxsz)</div><div class='del'>-#define NFS4_enc_setxattr_sz	(compound_encode_hdr_maxsz + \</div><div class='del'>-				encode_sequence_maxsz + \</div><div class='del'>-				encode_putfh_maxsz + \</div><div class='del'>-				encode_setxattr_maxsz)</div><div class='del'>-#define NFS4_dec_setxattr_sz	(compound_decode_hdr_maxsz + \</div><div class='del'>-				decode_sequence_maxsz + \</div><div class='del'>-				decode_putfh_maxsz + \</div><div class='del'>-				decode_setxattr_maxsz)</div><div class='del'>-#define NFS4_enc_listxattrs_sz	(compound_encode_hdr_maxsz + \</div><div class='del'>-				encode_sequence_maxsz + \</div><div class='del'>-				encode_putfh_maxsz + \</div><div class='del'>-				encode_listxattrs_maxsz)</div><div class='del'>-#define NFS4_dec_listxattrs_sz	(compound_decode_hdr_maxsz + \</div><div class='del'>-				decode_sequence_maxsz + \</div><div class='del'>-				decode_putfh_maxsz + \</div><div class='del'>-				decode_listxattrs_maxsz)</div><div class='del'>-#define NFS4_enc_removexattr_sz	(compound_encode_hdr_maxsz + \</div><div class='del'>-				encode_sequence_maxsz + \</div><div class='del'>-				encode_putfh_maxsz + \</div><div class='del'>-				encode_removexattr_maxsz)</div><div class='del'>-#define NFS4_dec_removexattr_sz	(compound_decode_hdr_maxsz + \</div><div class='del'>-				decode_sequence_maxsz + \</div><div class='del'>-				decode_putfh_maxsz + \</div><div class='del'>-				decode_removexattr_maxsz)</div><div class='add'>+#define NFS4_enc_getxattr_sz		(compound_encode_hdr_maxsz + \</div><div class='add'>+					 encode_sequence_maxsz + \</div><div class='add'>+					 encode_putfh_maxsz + \</div><div class='add'>+					 encode_getxattr_maxsz)</div><div class='add'>+#define NFS4_dec_getxattr_sz		(compound_decode_hdr_maxsz + \</div><div class='add'>+					 decode_sequence_maxsz + \</div><div class='add'>+					 decode_putfh_maxsz + \</div><div class='add'>+					 decode_getxattr_maxsz)</div><div class='add'>+#define NFS4_enc_setxattr_sz		(compound_encode_hdr_maxsz + \</div><div class='add'>+					 encode_sequence_maxsz + \</div><div class='add'>+					 encode_putfh_maxsz + \</div><div class='add'>+					 encode_setxattr_maxsz + \</div><div class='add'>+					 encode_getattr_maxsz)</div><div class='add'>+#define NFS4_dec_setxattr_sz		(compound_decode_hdr_maxsz + \</div><div class='add'>+					 decode_sequence_maxsz + \</div><div class='add'>+					 decode_putfh_maxsz + \</div><div class='add'>+					 decode_setxattr_maxsz + \</div><div class='add'>+					 decode_getattr_maxsz)</div><div class='add'>+#define NFS4_enc_listxattrs_sz		(compound_encode_hdr_maxsz + \</div><div class='add'>+					 encode_sequence_maxsz + \</div><div class='add'>+					 encode_putfh_maxsz + \</div><div class='add'>+					 encode_listxattrs_maxsz)</div><div class='add'>+#define NFS4_dec_listxattrs_sz		(compound_decode_hdr_maxsz + \</div><div class='add'>+					 decode_sequence_maxsz + \</div><div class='add'>+					 decode_putfh_maxsz + \</div><div class='add'>+					 decode_listxattrs_maxsz)</div><div class='add'>+#define NFS4_enc_removexattr_sz		(compound_encode_hdr_maxsz + \</div><div class='add'>+					 encode_sequence_maxsz + \</div><div class='add'>+					 encode_putfh_maxsz + \</div><div class='add'>+					 encode_removexattr_maxsz)</div><div class='add'>+#define NFS4_dec_removexattr_sz		(compound_decode_hdr_maxsz + \</div><div class='add'>+					 decode_sequence_maxsz + \</div><div class='add'>+					 decode_putfh_maxsz + \</div><div class='add'>+					 decode_removexattr_maxsz)</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * These values specify the maximum amount of data that is not</div><div class='hunk'>@@ -316,6 +350,18 @@ static void encode_copy(struct xdr_stream *xdr,</div><div class='ctx'> 	encode_nl4_server(xdr, args-&gt;cp_src);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void encode_copy_commit(struct xdr_stream *xdr,</div><div class='add'>+			  const struct nfs42_copy_args *args,</div><div class='add'>+			  struct compound_hdr *hdr)</div><div class='add'>+{</div><div class='add'>+	__be32 *p;</div><div class='add'>+</div><div class='add'>+	encode_op_hdr(xdr, OP_COMMIT, decode_commit_maxsz, hdr);</div><div class='add'>+	p = reserve_space(xdr, 12);</div><div class='add'>+	p = xdr_encode_hyper(p, args-&gt;dst_pos);</div><div class='add'>+	*p = cpu_to_be32(args-&gt;count);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void encode_offload_cancel(struct xdr_stream *xdr,</div><div class='ctx'> 				  const struct nfs42_offload_status_args *args,</div><div class='ctx'> 				  struct compound_hdr *hdr)</div><div class='hunk'>@@ -324,6 +370,14 @@ static void encode_offload_cancel(struct xdr_stream *xdr,</div><div class='ctx'> 	encode_nfs4_stateid(xdr, &amp;args-&gt;osa_stateid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void encode_offload_status(struct xdr_stream *xdr,</div><div class='add'>+				  const struct nfs42_offload_status_args *args,</div><div class='add'>+				  struct compound_hdr *hdr)</div><div class='add'>+{</div><div class='add'>+	encode_op_hdr(xdr, OP_OFFLOAD_STATUS, decode_offload_status_maxsz, hdr);</div><div class='add'>+	encode_nfs4_stateid(xdr, &amp;args-&gt;osa_stateid);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void encode_copy_notify(struct xdr_stream *xdr,</div><div class='ctx'> 			       const struct nfs42_copy_notify_args *args,</div><div class='ctx'> 			       struct compound_hdr *hdr)</div><div class='hunk'>@@ -451,20 +505,6 @@ static void encode_setxattr(struct xdr_stream *xdr,</div><div class='ctx'> 		xdr_write_pages(xdr, arg-&gt;xattr_pages, 0, arg-&gt;xattr_len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int decode_setxattr(struct xdr_stream *xdr,</div><div class='del'>-			   struct nfs4_change_info *cinfo)</div><div class='del'>-{</div><div class='del'>-	int status;</div><div class='del'>-</div><div class='del'>-	status = decode_op_hdr(xdr, OP_SETXATTR);</div><div class='del'>-	if (status)</div><div class='del'>-		goto out;</div><div class='del'>-	status = decode_change_info(xdr, cinfo);</div><div class='del'>-out:</div><div class='del'>-	return status;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-</div><div class='ctx'> static void encode_getxattr(struct xdr_stream *xdr, const char *name,</div><div class='ctx'> 			    struct compound_hdr *hdr)</div><div class='ctx'> {</div><div class='hunk'>@@ -472,43 +512,6 @@ static void encode_getxattr(struct xdr_stream *xdr, const char *name,</div><div class='ctx'> 	encode_string(xdr, strlen(name), name);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int decode_getxattr(struct xdr_stream *xdr,</div><div class='del'>-			   struct nfs42_getxattrres *res,</div><div class='del'>-			   struct rpc_rqst *req)</div><div class='del'>-{</div><div class='del'>-	int status;</div><div class='del'>-	__be32 *p;</div><div class='del'>-	u32 len, rdlen;</div><div class='del'>-</div><div class='del'>-	status = decode_op_hdr(xdr, OP_GETXATTR);</div><div class='del'>-	if (status)</div><div class='del'>-		return status;</div><div class='del'>-</div><div class='del'>-	p = xdr_inline_decode(xdr, 4);</div><div class='del'>-	if (unlikely(!p))</div><div class='del'>-		return -EIO;</div><div class='del'>-</div><div class='del'>-	len = be32_to_cpup(p);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Only check against the page length here. The actual</div><div class='del'>-	 * requested length may be smaller, but that is only</div><div class='del'>-	 * checked against after possibly caching a valid reply.</div><div class='del'>-	 */</div><div class='del'>-	if (len &gt; req-&gt;rq_rcv_buf.page_len)</div><div class='del'>-		return -ERANGE;</div><div class='del'>-</div><div class='del'>-	res-&gt;xattr_len = len;</div><div class='del'>-</div><div class='del'>-	if (len &gt; 0) {</div><div class='del'>-		rdlen = xdr_read_pages(xdr, len);</div><div class='del'>-		if (rdlen &lt; len)</div><div class='del'>-			return -EIO;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static void encode_removexattr(struct xdr_stream *xdr, const char *name,</div><div class='ctx'> 			       struct compound_hdr *hdr)</div><div class='ctx'> {</div><div class='hunk'>@@ -516,21 +519,6 @@ static void encode_removexattr(struct xdr_stream *xdr, const char *name,</div><div class='ctx'> 	encode_string(xdr, strlen(name), name);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-</div><div class='del'>-static int decode_removexattr(struct xdr_stream *xdr,</div><div class='del'>-			   struct nfs4_change_info *cinfo)</div><div class='del'>-{</div><div class='del'>-	int status;</div><div class='del'>-</div><div class='del'>-	status = decode_op_hdr(xdr, OP_REMOVEXATTR);</div><div class='del'>-	if (status)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	status = decode_change_info(xdr, cinfo);</div><div class='del'>-out:</div><div class='del'>-	return status;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static void encode_listxattrs(struct xdr_stream *xdr,</div><div class='ctx'> 			     const struct nfs42_listxattrsargs *arg,</div><div class='ctx'> 			     struct compound_hdr *hdr)</div><div class='hunk'>@@ -552,96 +540,6 @@ static void encode_listxattrs(struct xdr_stream *xdr,</div><div class='ctx'> 	*p = cpu_to_be32(arg-&gt;count + 8 + 4);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int decode_listxattrs(struct xdr_stream *xdr,</div><div class='del'>-			    struct nfs42_listxattrsres *res)</div><div class='del'>-{</div><div class='del'>-	int status;</div><div class='del'>-	__be32 *p;</div><div class='del'>-	u32 count, len, ulen;</div><div class='del'>-	size_t left, copied;</div><div class='del'>-	char *buf;</div><div class='del'>-</div><div class='del'>-	status = decode_op_hdr(xdr, OP_LISTXATTRS);</div><div class='del'>-	if (status) {</div><div class='del'>-		/*</div><div class='del'>-		 * Special case: for LISTXATTRS, NFS4ERR_TOOSMALL</div><div class='del'>-		 * should be translated to ERANGE.</div><div class='del'>-		 */</div><div class='del'>-		if (status == -ETOOSMALL)</div><div class='del'>-			status = -ERANGE;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	p = xdr_inline_decode(xdr, 8);</div><div class='del'>-	if (unlikely(!p))</div><div class='del'>-		return -EIO;</div><div class='del'>-</div><div class='del'>-	xdr_decode_hyper(p, &amp;res-&gt;cookie);</div><div class='del'>-</div><div class='del'>-	p = xdr_inline_decode(xdr, 4);</div><div class='del'>-	if (unlikely(!p))</div><div class='del'>-		return -EIO;</div><div class='del'>-</div><div class='del'>-	left = res-&gt;xattr_len;</div><div class='del'>-	buf = res-&gt;xattr_buf;</div><div class='del'>-</div><div class='del'>-	count = be32_to_cpup(p);</div><div class='del'>-	copied = 0;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * We have asked for enough room to encode the maximum number</div><div class='del'>-	 * of possible attribute names, so everything should fit.</div><div class='del'>-	 *</div><div class='del'>-	 * But, don't rely on that assumption. Just decode entries</div><div class='del'>-	 * until they don't fit anymore, just in case the server did</div><div class='del'>-	 * something odd.</div><div class='del'>-	 */</div><div class='del'>-	while (count--) {</div><div class='del'>-		p = xdr_inline_decode(xdr, 4);</div><div class='del'>-		if (unlikely(!p))</div><div class='del'>-			return -EIO;</div><div class='del'>-</div><div class='del'>-		len = be32_to_cpup(p);</div><div class='del'>-		if (len &gt; (XATTR_NAME_MAX - XATTR_USER_PREFIX_LEN)) {</div><div class='del'>-			status = -ERANGE;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		p = xdr_inline_decode(xdr, len);</div><div class='del'>-		if (unlikely(!p))</div><div class='del'>-			return -EIO;</div><div class='del'>-</div><div class='del'>-		ulen = len + XATTR_USER_PREFIX_LEN + 1;</div><div class='del'>-		if (buf) {</div><div class='del'>-			if (ulen &gt; left) {</div><div class='del'>-				status = -ERANGE;</div><div class='del'>-				goto out;</div><div class='del'>-			}</div><div class='del'>-</div><div class='del'>-			memcpy(buf, XATTR_USER_PREFIX, XATTR_USER_PREFIX_LEN);</div><div class='del'>-			memcpy(buf + XATTR_USER_PREFIX_LEN, p, len);</div><div class='del'>-</div><div class='del'>-			buf[ulen - 1] = 0;</div><div class='del'>-			buf += ulen;</div><div class='del'>-			left -= ulen;</div><div class='del'>-		}</div><div class='del'>-		copied += ulen;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	p = xdr_inline_decode(xdr, 4);</div><div class='del'>-	if (unlikely(!p))</div><div class='del'>-		return -EIO;</div><div class='del'>-</div><div class='del'>-	res-&gt;eof = be32_to_cpup(p);</div><div class='del'>-	res-&gt;copied = copied;</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	if (status == -ERANGE &amp;&amp; res-&gt;xattr_len == XATTR_LIST_MAX)</div><div class='del'>-		status = -E2BIG;</div><div class='del'>-</div><div class='del'>-	return status;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Encode ALLOCATE request</div><div class='ctx'>  */</div><div class='hunk'>@@ -662,18 +560,6 @@ static void nfs4_xdr_enc_allocate(struct rpc_rqst *req,</div><div class='ctx'> 	encode_nops(&amp;hdr);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void encode_copy_commit(struct xdr_stream *xdr,</div><div class='del'>-			  const struct nfs42_copy_args *args,</div><div class='del'>-			  struct compound_hdr *hdr)</div><div class='del'>-{</div><div class='del'>-	__be32 *p;</div><div class='del'>-</div><div class='del'>-	encode_op_hdr(xdr, OP_COMMIT, decode_commit_maxsz, hdr);</div><div class='del'>-	p = reserve_space(xdr, 12);</div><div class='del'>-	p = xdr_encode_hyper(p, args-&gt;dst_pos);</div><div class='del'>-	*p = cpu_to_be32(args-&gt;count);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Encode COPY request</div><div class='ctx'>  */</div><div class='hunk'>@@ -698,7 +584,7 @@ static void nfs4_xdr_enc_copy(struct rpc_rqst *req,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Encode OFFLOAD_CANEL request</div><div class='add'>+ * Encode OFFLOAD_CANCEL request</div><div class='ctx'>  */</div><div class='ctx'> static void nfs4_xdr_enc_offload_cancel(struct rpc_rqst *req,</div><div class='ctx'> 					struct xdr_stream *xdr,</div><div class='hunk'>@@ -717,6 +603,25 @@ static void nfs4_xdr_enc_offload_cancel(struct rpc_rqst *req,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * Encode OFFLOAD_STATUS request</div><div class='add'>+ */</div><div class='add'>+static void nfs4_xdr_enc_offload_status(struct rpc_rqst *req,</div><div class='add'>+					struct xdr_stream *xdr,</div><div class='add'>+					const void *data)</div><div class='add'>+{</div><div class='add'>+	const struct nfs42_offload_status_args *args = data;</div><div class='add'>+	struct compound_hdr hdr = {</div><div class='add'>+		.minorversion = nfs4_xdr_minorversion(&amp;args-&gt;osa_seq_args),</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+	encode_compound_hdr(xdr, req, &amp;hdr);</div><div class='add'>+	encode_sequence(xdr, &amp;args-&gt;osa_seq_args, &amp;hdr);</div><div class='add'>+	encode_putfh(xdr, args-&gt;osa_src_fh, &amp;hdr);</div><div class='add'>+	encode_offload_status(xdr, args, &amp;hdr);</div><div class='add'>+	encode_nops(&amp;hdr);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * Encode COPY_NOTIFY request</div><div class='ctx'>  */</div><div class='ctx'> static void nfs4_xdr_enc_copy_notify(struct rpc_rqst *req,</div><div class='hunk'>@@ -756,6 +661,27 @@ static void nfs4_xdr_enc_deallocate(struct rpc_rqst *req,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * Encode ZERO_RANGE request</div><div class='add'>+ */</div><div class='add'>+static void nfs4_xdr_enc_zero_range(struct rpc_rqst *req,</div><div class='add'>+				    struct xdr_stream *xdr,</div><div class='add'>+				    const void *data)</div><div class='add'>+{</div><div class='add'>+	const struct nfs42_falloc_args *args = data;</div><div class='add'>+	struct compound_hdr hdr = {</div><div class='add'>+		.minorversion = nfs4_xdr_minorversion(&amp;args-&gt;seq_args),</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+	encode_compound_hdr(xdr, req, &amp;hdr);</div><div class='add'>+	encode_sequence(xdr, &amp;args-&gt;seq_args, &amp;hdr);</div><div class='add'>+	encode_putfh(xdr, args-&gt;falloc_fh, &amp;hdr);</div><div class='add'>+	encode_deallocate(xdr, args, &amp;hdr);</div><div class='add'>+	encode_allocate(xdr, args, &amp;hdr);</div><div class='add'>+	encode_getfattr(xdr, args-&gt;falloc_bitmask, &amp;hdr);</div><div class='add'>+	encode_nops(&amp;hdr);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * Encode READ_PLUS request</div><div class='ctx'>  */</div><div class='ctx'> static void nfs4_xdr_enc_read_plus(struct rpc_rqst *req,</div><div class='hunk'>@@ -772,8 +698,8 @@ static void nfs4_xdr_enc_read_plus(struct rpc_rqst *req,</div><div class='ctx'> 	encode_putfh(xdr, args-&gt;fh, &amp;hdr);</div><div class='ctx'> 	encode_read_plus(xdr, args, &amp;hdr);</div><div class='ctx'> </div><div class='del'>-	rpc_prepare_reply_pages(req, args-&gt;pages, args-&gt;pgbase,</div><div class='del'>-				args-&gt;count, hdr.replen);</div><div class='add'>+	rpc_prepare_reply_pages(req, args-&gt;pages, args-&gt;pgbase, args-&gt;count,</div><div class='add'>+				hdr.replen - READ_PLUS_SEGMENT_SIZE_DIFF);</div><div class='ctx'> 	encode_nops(&amp;hdr);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -862,6 +788,90 @@ static void nfs4_xdr_enc_layouterror(struct rpc_rqst *req,</div><div class='ctx'> 	encode_nops(&amp;hdr);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Encode SETXATTR request</div><div class='add'>+ */</div><div class='add'>+static void nfs4_xdr_enc_setxattr(struct rpc_rqst *req, struct xdr_stream *xdr,</div><div class='add'>+				  const void *data)</div><div class='add'>+{</div><div class='add'>+	const struct nfs42_setxattrargs *args = data;</div><div class='add'>+	struct compound_hdr hdr = {</div><div class='add'>+		.minorversion = nfs4_xdr_minorversion(&amp;args-&gt;seq_args),</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+	encode_compound_hdr(xdr, req, &amp;hdr);</div><div class='add'>+	encode_sequence(xdr, &amp;args-&gt;seq_args, &amp;hdr);</div><div class='add'>+	encode_putfh(xdr, args-&gt;fh, &amp;hdr);</div><div class='add'>+	encode_setxattr(xdr, args, &amp;hdr);</div><div class='add'>+	encode_getfattr(xdr, args-&gt;bitmask, &amp;hdr);</div><div class='add'>+	encode_nops(&amp;hdr);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Encode GETXATTR request</div><div class='add'>+ */</div><div class='add'>+static void nfs4_xdr_enc_getxattr(struct rpc_rqst *req, struct xdr_stream *xdr,</div><div class='add'>+				  const void *data)</div><div class='add'>+{</div><div class='add'>+	const struct nfs42_getxattrargs *args = data;</div><div class='add'>+	struct compound_hdr hdr = {</div><div class='add'>+		.minorversion = nfs4_xdr_minorversion(&amp;args-&gt;seq_args),</div><div class='add'>+	};</div><div class='add'>+	uint32_t replen;</div><div class='add'>+</div><div class='add'>+	encode_compound_hdr(xdr, req, &amp;hdr);</div><div class='add'>+	encode_sequence(xdr, &amp;args-&gt;seq_args, &amp;hdr);</div><div class='add'>+	encode_putfh(xdr, args-&gt;fh, &amp;hdr);</div><div class='add'>+	replen = hdr.replen + op_decode_hdr_maxsz + 1;</div><div class='add'>+	encode_getxattr(xdr, args-&gt;xattr_name, &amp;hdr);</div><div class='add'>+</div><div class='add'>+	rpc_prepare_reply_pages(req, args-&gt;xattr_pages, 0, args-&gt;xattr_len,</div><div class='add'>+				replen);</div><div class='add'>+</div><div class='add'>+	encode_nops(&amp;hdr);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Encode LISTXATTR request</div><div class='add'>+ */</div><div class='add'>+static void nfs4_xdr_enc_listxattrs(struct rpc_rqst *req,</div><div class='add'>+				    struct xdr_stream *xdr, const void *data)</div><div class='add'>+{</div><div class='add'>+	const struct nfs42_listxattrsargs *args = data;</div><div class='add'>+	struct compound_hdr hdr = {</div><div class='add'>+		.minorversion = nfs4_xdr_minorversion(&amp;args-&gt;seq_args),</div><div class='add'>+	};</div><div class='add'>+	uint32_t replen;</div><div class='add'>+</div><div class='add'>+	encode_compound_hdr(xdr, req, &amp;hdr);</div><div class='add'>+	encode_sequence(xdr, &amp;args-&gt;seq_args, &amp;hdr);</div><div class='add'>+	encode_putfh(xdr, args-&gt;fh, &amp;hdr);</div><div class='add'>+	replen = hdr.replen + op_decode_hdr_maxsz + 2 + 1;</div><div class='add'>+	encode_listxattrs(xdr, args, &amp;hdr);</div><div class='add'>+</div><div class='add'>+	rpc_prepare_reply_pages(req, args-&gt;xattr_pages, 0, args-&gt;count, replen);</div><div class='add'>+</div><div class='add'>+	encode_nops(&amp;hdr);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Encode REMOVEXATTR request</div><div class='add'>+ */</div><div class='add'>+static void nfs4_xdr_enc_removexattr(struct rpc_rqst *req,</div><div class='add'>+				     struct xdr_stream *xdr, const void *data)</div><div class='add'>+{</div><div class='add'>+	const struct nfs42_removexattrargs *args = data;</div><div class='add'>+	struct compound_hdr hdr = {</div><div class='add'>+		.minorversion = nfs4_xdr_minorversion(&amp;args-&gt;seq_args),</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+	encode_compound_hdr(xdr, req, &amp;hdr);</div><div class='add'>+	encode_sequence(xdr, &amp;args-&gt;seq_args, &amp;hdr);</div><div class='add'>+	encode_putfh(xdr, args-&gt;fh, &amp;hdr);</div><div class='add'>+	encode_removexattr(xdr, args-&gt;xattr_name, &amp;hdr);</div><div class='add'>+	encode_nops(&amp;hdr);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int decode_allocate(struct xdr_stream *xdr, struct nfs42_falloc_res *res)</div><div class='ctx'> {</div><div class='ctx'> 	return decode_op_hdr(xdr, OP_ALLOCATE);</div><div class='hunk'>@@ -984,6 +994,26 @@ static int decode_offload_cancel(struct xdr_stream *xdr,</div><div class='ctx'> 	return decode_op_hdr(xdr, OP_OFFLOAD_CANCEL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int decode_offload_status(struct xdr_stream *xdr,</div><div class='add'>+				 struct nfs42_offload_status_res *res)</div><div class='add'>+{</div><div class='add'>+	ssize_t result;</div><div class='add'>+	int status;</div><div class='add'>+</div><div class='add'>+	status = decode_op_hdr(xdr, OP_OFFLOAD_STATUS);</div><div class='add'>+	if (status)</div><div class='add'>+		return status;</div><div class='add'>+	/* osr_count */</div><div class='add'>+	if (xdr_stream_decode_u64(xdr, &amp;res-&gt;osr_count) &lt; 0)</div><div class='add'>+		return -EIO;</div><div class='add'>+	/* osr_complete&lt;1&gt; */</div><div class='add'>+	result = xdr_stream_decode_uint32_array(xdr, &amp;res-&gt;osr_complete, 1);</div><div class='add'>+	if (result &lt; 0)</div><div class='add'>+		return -EIO;</div><div class='add'>+	res-&gt;complete_count = result;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int decode_copy_notify(struct xdr_stream *xdr,</div><div class='ctx'> 			      struct nfs42_copy_notify_res *res)</div><div class='ctx'> {</div><div class='hunk'>@@ -1025,81 +1055,93 @@ static int decode_deallocate(struct xdr_stream *xdr, struct nfs42_falloc_res *re</div><div class='ctx'> 	return decode_op_hdr(xdr, OP_DEALLOCATE);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int decode_read_plus_data(struct xdr_stream *xdr,</div><div class='del'>-				 struct nfs_pgio_args *args,</div><div class='del'>-				 struct nfs_pgio_res *res)</div><div class='del'>-{</div><div class='del'>-	uint32_t count, recvd;</div><div class='add'>+struct read_plus_segment {</div><div class='add'>+	enum data_content4 type;</div><div class='ctx'> 	uint64_t offset;</div><div class='del'>-	__be32 *p;</div><div class='del'>-</div><div class='del'>-	p = xdr_inline_decode(xdr, 8 + 4);</div><div class='del'>-	if (!p)</div><div class='del'>-		return 1;</div><div class='add'>+	union {</div><div class='add'>+		struct {</div><div class='add'>+			uint64_t length;</div><div class='add'>+		} hole;</div><div class='add'>+</div><div class='add'>+		struct {</div><div class='add'>+			uint32_t length;</div><div class='add'>+			unsigned int from;</div><div class='add'>+		} data;</div><div class='add'>+	};</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-	p = xdr_decode_hyper(p, &amp;offset);</div><div class='del'>-	count = be32_to_cpup(p);</div><div class='del'>-	recvd = xdr_align_data(xdr, res-&gt;count, xdr_align_size(count));</div><div class='del'>-	if (recvd &gt; count)</div><div class='del'>-		recvd = count;</div><div class='del'>-	if (res-&gt;count + recvd &gt; args-&gt;count) {</div><div class='del'>-		if (args-&gt;count &gt; res-&gt;count)</div><div class='del'>-			res-&gt;count += args-&gt;count - res-&gt;count;</div><div class='del'>-		return 1;</div><div class='del'>-	}</div><div class='del'>-	res-&gt;count += recvd;</div><div class='del'>-	if (count &gt; recvd)</div><div class='del'>-		return 1;</div><div class='del'>-	return 0;</div><div class='add'>+static inline uint64_t read_plus_segment_length(struct read_plus_segment *seg)</div><div class='add'>+{</div><div class='add'>+	return seg-&gt;type == NFS4_CONTENT_DATA ? seg-&gt;data.length : seg-&gt;hole.length;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int decode_read_plus_hole(struct xdr_stream *xdr,</div><div class='del'>-				 struct nfs_pgio_args *args,</div><div class='del'>-				 struct nfs_pgio_res *res, uint32_t *eof)</div><div class='add'>+static int decode_read_plus_segment(struct xdr_stream *xdr,</div><div class='add'>+				    struct read_plus_segment *seg)</div><div class='ctx'> {</div><div class='del'>-	uint64_t offset, length, recvd;</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> </div><div class='del'>-	p = xdr_inline_decode(xdr, 8 + 8);</div><div class='add'>+	p = xdr_inline_decode(xdr, 4);</div><div class='ctx'> 	if (!p)</div><div class='del'>-		return 1;</div><div class='del'>-</div><div class='del'>-	p = xdr_decode_hyper(p, &amp;offset);</div><div class='del'>-	p = xdr_decode_hyper(p, &amp;length);</div><div class='del'>-	if (offset != args-&gt;offset + res-&gt;count) {</div><div class='del'>-		/* Server returned an out-of-sequence extent */</div><div class='del'>-		if (offset &gt; args-&gt;offset + res-&gt;count ||</div><div class='del'>-		    offset + length &lt; args-&gt;offset + res-&gt;count) {</div><div class='del'>-			dprintk("NFS: server returned out of sequence extent: "</div><div class='del'>-				"offset/size = %llu/%llu != expected %llu\n",</div><div class='del'>-				(unsigned long long)offset,</div><div class='del'>-				(unsigned long long)length,</div><div class='del'>-				(unsigned long long)(args-&gt;offset +</div><div class='del'>-						     res-&gt;count));</div><div class='del'>-			return 1;</div><div class='del'>-		}</div><div class='del'>-		length -= args-&gt;offset + res-&gt;count - offset;</div><div class='del'>-	}</div><div class='del'>-	if (length + res-&gt;count &gt; args-&gt;count) {</div><div class='del'>-		*eof = 0;</div><div class='del'>-		if (unlikely(res-&gt;count &gt;= args-&gt;count))</div><div class='del'>-			return 1;</div><div class='del'>-		length = args-&gt;count - res-&gt;count;</div><div class='del'>-	}</div><div class='del'>-	recvd = xdr_expand_hole(xdr, res-&gt;count, length);</div><div class='del'>-	res-&gt;count += recvd;</div><div class='add'>+		return -EIO;</div><div class='add'>+	seg-&gt;type = be32_to_cpup(p++);</div><div class='ctx'> </div><div class='del'>-	if (recvd &lt; length)</div><div class='del'>-		return 1;</div><div class='add'>+	p = xdr_inline_decode(xdr, seg-&gt;type == NFS4_CONTENT_DATA ? 12 : 16);</div><div class='add'>+	if (!p)</div><div class='add'>+		return -EIO;</div><div class='add'>+	p = xdr_decode_hyper(p, &amp;seg-&gt;offset);</div><div class='add'>+</div><div class='add'>+	if (seg-&gt;type == NFS4_CONTENT_DATA) {</div><div class='add'>+		struct xdr_buf buf;</div><div class='add'>+		uint32_t len = be32_to_cpup(p);</div><div class='add'>+</div><div class='add'>+		seg-&gt;data.length = len;</div><div class='add'>+		seg-&gt;data.from = xdr_stream_pos(xdr);</div><div class='add'>+</div><div class='add'>+		if (!xdr_stream_subsegment(xdr, &amp;buf, xdr_align_size(len)))</div><div class='add'>+			return -EIO;</div><div class='add'>+	} else if (seg-&gt;type == NFS4_CONTENT_HOLE) {</div><div class='add'>+		xdr_decode_hyper(p, &amp;seg-&gt;hole.length);</div><div class='add'>+	} else</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int process_read_plus_segment(struct xdr_stream *xdr,</div><div class='add'>+				     struct nfs_pgio_args *args,</div><div class='add'>+				     struct nfs_pgio_res *res,</div><div class='add'>+				     struct read_plus_segment *seg)</div><div class='add'>+{</div><div class='add'>+	unsigned long offset = seg-&gt;offset;</div><div class='add'>+	unsigned long length = read_plus_segment_length(seg);</div><div class='add'>+	unsigned int bufpos;</div><div class='add'>+</div><div class='add'>+	if (offset + length &lt; args-&gt;offset)</div><div class='add'>+		return 0;</div><div class='add'>+	else if (offset &gt; args-&gt;offset + args-&gt;count) {</div><div class='add'>+		res-&gt;eof = 0;</div><div class='add'>+		return 0;</div><div class='add'>+	} else if (offset &lt; args-&gt;offset) {</div><div class='add'>+		length -= (args-&gt;offset - offset);</div><div class='add'>+		offset = args-&gt;offset;</div><div class='add'>+	} else if (offset + length &gt; args-&gt;offset + args-&gt;count) {</div><div class='add'>+		length = (args-&gt;offset + args-&gt;count) - offset;</div><div class='add'>+		res-&gt;eof = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	bufpos = xdr-&gt;buf-&gt;head[0].iov_len + (offset - args-&gt;offset);</div><div class='add'>+	if (seg-&gt;type == NFS4_CONTENT_HOLE)</div><div class='add'>+		return xdr_stream_zero(xdr, bufpos, length);</div><div class='add'>+	else</div><div class='add'>+		return xdr_stream_move_subsegment(xdr, seg-&gt;data.from, bufpos, length);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int decode_read_plus(struct xdr_stream *xdr, struct nfs_pgio_res *res)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_pgio_header *hdr =</div><div class='ctx'> 		container_of(res, struct nfs_pgio_header, res);</div><div class='ctx'> 	struct nfs_pgio_args *args = &amp;hdr-&gt;args;</div><div class='del'>-	uint32_t eof, segments, type;</div><div class='add'>+	uint32_t segments;</div><div class='add'>+	struct read_plus_segment *segs;</div><div class='ctx'> 	int status, i;</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> </div><div class='hunk'>@@ -1112,38 +1154,29 @@ static int decode_read_plus(struct xdr_stream *xdr, struct nfs_pgio_res *res)</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> </div><div class='ctx'> 	res-&gt;count = 0;</div><div class='del'>-	eof = be32_to_cpup(p++);</div><div class='add'>+	res-&gt;eof = be32_to_cpup(p++);</div><div class='ctx'> 	segments = be32_to_cpup(p++);</div><div class='ctx'> 	if (segments == 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; segments; i++) {</div><div class='del'>-		p = xdr_inline_decode(xdr, 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto early_out;</div><div class='del'>-</div><div class='del'>-		type = be32_to_cpup(p++);</div><div class='del'>-		if (type == NFS4_CONTENT_DATA)</div><div class='del'>-			status = decode_read_plus_data(xdr, args, res);</div><div class='del'>-		else if (type == NFS4_CONTENT_HOLE)</div><div class='del'>-			status = decode_read_plus_hole(xdr, args, res, &amp;eof);</div><div class='del'>-		else</div><div class='del'>-			return -EINVAL;</div><div class='add'>+	segs = kmalloc_array(segments, sizeof(*segs), GFP_KERNEL);</div><div class='add'>+	if (!segs)</div><div class='add'>+		return -ENOMEM;</div><div class='ctx'> </div><div class='add'>+	for (i = 0; i &lt; segments; i++) {</div><div class='add'>+		status = decode_read_plus_segment(xdr, &amp;segs[i]);</div><div class='ctx'> 		if (status &lt; 0)</div><div class='del'>-			return status;</div><div class='del'>-		if (status &gt; 0)</div><div class='del'>-			goto early_out;</div><div class='add'>+			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	xdr_set_pagelen(xdr, xdr_align_size(args-&gt;count));</div><div class='add'>+	for (i = segments; i &gt; 0; i--)</div><div class='add'>+		res-&gt;count += process_read_plus_segment(xdr, args, res, &amp;segs[i-1]);</div><div class='add'>+	status = 0;</div><div class='add'>+</div><div class='ctx'> out:</div><div class='del'>-	res-&gt;eof = eof;</div><div class='del'>-	return 0;</div><div class='del'>-early_out:</div><div class='del'>-	if (unlikely(!i))</div><div class='del'>-		return -EIO;</div><div class='del'>-	res-&gt;eof = 0;</div><div class='del'>-	return 0;</div><div class='add'>+	kfree(segs);</div><div class='add'>+	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int decode_seek(struct xdr_stream *xdr, struct nfs42_seek_res *res)</div><div class='hunk'>@@ -1179,6 +1212,168 @@ static int decode_layouterror(struct xdr_stream *xdr)</div><div class='ctx'> 	return decode_op_hdr(xdr, OP_LAYOUTERROR);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int decode_setxattr(struct xdr_stream *xdr,</div><div class='add'>+			   struct nfs4_change_info *cinfo)</div><div class='add'>+{</div><div class='add'>+	int status;</div><div class='add'>+</div><div class='add'>+	status = decode_op_hdr(xdr, OP_SETXATTR);</div><div class='add'>+	if (status)</div><div class='add'>+		goto out;</div><div class='add'>+	status = decode_change_info(xdr, cinfo);</div><div class='add'>+out:</div><div class='add'>+	return status;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int decode_getxattr(struct xdr_stream *xdr,</div><div class='add'>+			   struct nfs42_getxattrres *res,</div><div class='add'>+			   struct rpc_rqst *req)</div><div class='add'>+{</div><div class='add'>+	int status;</div><div class='add'>+	__be32 *p;</div><div class='add'>+	u32 len, rdlen;</div><div class='add'>+</div><div class='add'>+	status = decode_op_hdr(xdr, OP_GETXATTR);</div><div class='add'>+	if (status)</div><div class='add'>+		return status;</div><div class='add'>+</div><div class='add'>+	p = xdr_inline_decode(xdr, 4);</div><div class='add'>+	if (unlikely(!p))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	len = be32_to_cpup(p);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Only check against the page length here. The actual</div><div class='add'>+	 * requested length may be smaller, but that is only</div><div class='add'>+	 * checked against after possibly caching a valid reply.</div><div class='add'>+	 */</div><div class='add'>+	if (len &gt; req-&gt;rq_rcv_buf.page_len)</div><div class='add'>+		return -ERANGE;</div><div class='add'>+</div><div class='add'>+	res-&gt;xattr_len = len;</div><div class='add'>+</div><div class='add'>+	if (len &gt; 0) {</div><div class='add'>+		rdlen = xdr_read_pages(xdr, len);</div><div class='add'>+		if (rdlen &lt; len)</div><div class='add'>+			return -EIO;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int decode_removexattr(struct xdr_stream *xdr,</div><div class='add'>+			   struct nfs4_change_info *cinfo)</div><div class='add'>+{</div><div class='add'>+	int status;</div><div class='add'>+</div><div class='add'>+	status = decode_op_hdr(xdr, OP_REMOVEXATTR);</div><div class='add'>+	if (status)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	status = decode_change_info(xdr, cinfo);</div><div class='add'>+out:</div><div class='add'>+	return status;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int decode_listxattrs(struct xdr_stream *xdr,</div><div class='add'>+			    struct nfs42_listxattrsres *res)</div><div class='add'>+{</div><div class='add'>+	int status;</div><div class='add'>+	__be32 *p;</div><div class='add'>+	u32 count, len, ulen;</div><div class='add'>+	size_t left, copied;</div><div class='add'>+	char *buf;</div><div class='add'>+</div><div class='add'>+	status = decode_op_hdr(xdr, OP_LISTXATTRS);</div><div class='add'>+	if (status) {</div><div class='add'>+		/*</div><div class='add'>+		 * Special case: for LISTXATTRS, NFS4ERR_TOOSMALL</div><div class='add'>+		 * should be translated to ERANGE.</div><div class='add'>+		 */</div><div class='add'>+		if (status == -ETOOSMALL)</div><div class='add'>+			status = -ERANGE;</div><div class='add'>+		/*</div><div class='add'>+		 * Special case: for LISTXATTRS, NFS4ERR_NOXATTR</div><div class='add'>+		 * should be translated to success with zero-length reply.</div><div class='add'>+		 */</div><div class='add'>+		if (status == -ENODATA) {</div><div class='add'>+			res-&gt;eof = true;</div><div class='add'>+			status = 0;</div><div class='add'>+		}</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	p = xdr_inline_decode(xdr, 8);</div><div class='add'>+	if (unlikely(!p))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	xdr_decode_hyper(p, &amp;res-&gt;cookie);</div><div class='add'>+</div><div class='add'>+	p = xdr_inline_decode(xdr, 4);</div><div class='add'>+	if (unlikely(!p))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	left = res-&gt;xattr_len;</div><div class='add'>+	buf = res-&gt;xattr_buf;</div><div class='add'>+</div><div class='add'>+	count = be32_to_cpup(p);</div><div class='add'>+	copied = 0;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We have asked for enough room to encode the maximum number</div><div class='add'>+	 * of possible attribute names, so everything should fit.</div><div class='add'>+	 *</div><div class='add'>+	 * But, don't rely on that assumption. Just decode entries</div><div class='add'>+	 * until they don't fit anymore, just in case the server did</div><div class='add'>+	 * something odd.</div><div class='add'>+	 */</div><div class='add'>+	while (count--) {</div><div class='add'>+		p = xdr_inline_decode(xdr, 4);</div><div class='add'>+		if (unlikely(!p))</div><div class='add'>+			return -EIO;</div><div class='add'>+</div><div class='add'>+		len = be32_to_cpup(p);</div><div class='add'>+		if (len &gt; (XATTR_NAME_MAX - XATTR_USER_PREFIX_LEN)) {</div><div class='add'>+			status = -ERANGE;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		p = xdr_inline_decode(xdr, len);</div><div class='add'>+		if (unlikely(!p))</div><div class='add'>+			return -EIO;</div><div class='add'>+</div><div class='add'>+		ulen = len + XATTR_USER_PREFIX_LEN + 1;</div><div class='add'>+		if (buf) {</div><div class='add'>+			if (ulen &gt; left) {</div><div class='add'>+				status = -ERANGE;</div><div class='add'>+				goto out;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			memcpy(buf, XATTR_USER_PREFIX, XATTR_USER_PREFIX_LEN);</div><div class='add'>+			memcpy(buf + XATTR_USER_PREFIX_LEN, p, len);</div><div class='add'>+</div><div class='add'>+			buf[ulen - 1] = 0;</div><div class='add'>+			buf += ulen;</div><div class='add'>+			left -= ulen;</div><div class='add'>+		}</div><div class='add'>+		copied += ulen;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	p = xdr_inline_decode(xdr, 4);</div><div class='add'>+	if (unlikely(!p))</div><div class='add'>+		return -EIO;</div><div class='add'>+</div><div class='add'>+	res-&gt;eof = be32_to_cpup(p);</div><div class='add'>+	res-&gt;copied = copied;</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	if (status == -ERANGE &amp;&amp; res-&gt;xattr_len == XATTR_LIST_MAX)</div><div class='add'>+		status = -E2BIG;</div><div class='add'>+</div><div class='add'>+	return status;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Decode ALLOCATE request</div><div class='ctx'>  */</div><div class='hunk'>@@ -1269,6 +1464,32 @@ out:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * Decode OFFLOAD_STATUS response</div><div class='add'>+ */</div><div class='add'>+static int nfs4_xdr_dec_offload_status(struct rpc_rqst *rqstp,</div><div class='add'>+				       struct xdr_stream *xdr,</div><div class='add'>+				       void *data)</div><div class='add'>+{</div><div class='add'>+	struct nfs42_offload_status_res *res = data;</div><div class='add'>+	struct compound_hdr hdr;</div><div class='add'>+	int status;</div><div class='add'>+</div><div class='add'>+	status = decode_compound_hdr(xdr, &amp;hdr);</div><div class='add'>+	if (status)</div><div class='add'>+		goto out;</div><div class='add'>+	status = decode_sequence(xdr, &amp;res-&gt;osr_seq_res, rqstp);</div><div class='add'>+	if (status)</div><div class='add'>+		goto out;</div><div class='add'>+	status = decode_putfh(xdr);</div><div class='add'>+	if (status)</div><div class='add'>+		goto out;</div><div class='add'>+	status = decode_offload_status(xdr, res);</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	return status;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * Decode COPY_NOTIFY response</div><div class='ctx'>  */</div><div class='ctx'> static int nfs4_xdr_dec_copy_notify(struct rpc_rqst *rqstp,</div><div class='hunk'>@@ -1323,6 +1544,37 @@ out:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * Decode ZERO_RANGE request</div><div class='add'>+ */</div><div class='add'>+static int nfs4_xdr_dec_zero_range(struct rpc_rqst *rqstp,</div><div class='add'>+				   struct xdr_stream *xdr,</div><div class='add'>+				   void *data)</div><div class='add'>+{</div><div class='add'>+	struct nfs42_falloc_res *res = data;</div><div class='add'>+	struct compound_hdr hdr;</div><div class='add'>+	int status;</div><div class='add'>+</div><div class='add'>+	status = decode_compound_hdr(xdr, &amp;hdr);</div><div class='add'>+	if (status)</div><div class='add'>+		goto out;</div><div class='add'>+	status = decode_sequence(xdr, &amp;res-&gt;seq_res, rqstp);</div><div class='add'>+	if (status)</div><div class='add'>+		goto out;</div><div class='add'>+	status = decode_putfh(xdr);</div><div class='add'>+	if (status)</div><div class='add'>+		goto out;</div><div class='add'>+	status = decode_deallocate(xdr, res);</div><div class='add'>+	if (status)</div><div class='add'>+		goto out;</div><div class='add'>+	status = decode_allocate(xdr, res);</div><div class='add'>+	if (status)</div><div class='add'>+		goto out;</div><div class='add'>+	decode_getfattr(xdr, res-&gt;falloc_fattr, res-&gt;falloc_server);</div><div class='add'>+out:</div><div class='add'>+	return status;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * Decode READ_PLUS request</div><div class='ctx'>  */</div><div class='ctx'> static int nfs4_xdr_dec_read_plus(struct rpc_rqst *rqstp,</div><div class='hunk'>@@ -1333,6 +1585,8 @@ static int nfs4_xdr_dec_read_plus(struct rpc_rqst *rqstp,</div><div class='ctx'> 	struct compound_hdr hdr;</div><div class='ctx'> 	int status;</div><div class='ctx'> </div><div class='add'>+	xdr_set_scratch_buffer(xdr, res-&gt;scratch, READ_PLUS_SCRATCH_SIZE);</div><div class='add'>+</div><div class='ctx'> 	status = decode_compound_hdr(xdr, &amp;hdr);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -1434,8 +1688,7 @@ static int nfs4_xdr_dec_clone(struct rpc_rqst *rqstp,</div><div class='ctx'> 	status = decode_clone(xdr);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		goto out;</div><div class='del'>-	status = decode_getfattr(xdr, res-&gt;dst_fattr, res-&gt;server);</div><div class='del'>-</div><div class='add'>+	decode_getfattr(xdr, res-&gt;dst_fattr, res-&gt;server);</div><div class='ctx'> out:</div><div class='ctx'> 	res-&gt;rpc_status = status;</div><div class='ctx'> 	return status;</div><div class='hunk'>@@ -1467,22 +1720,9 @@ out:</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_NFS_V4_2</div><div class='del'>-static void nfs4_xdr_enc_setxattr(struct rpc_rqst *req, struct xdr_stream *xdr,</div><div class='del'>-				  const void *data)</div><div class='del'>-{</div><div class='del'>-	const struct nfs42_setxattrargs *args = data;</div><div class='del'>-	struct compound_hdr hdr = {</div><div class='del'>-		.minorversion = nfs4_xdr_minorversion(&amp;args-&gt;seq_args),</div><div class='del'>-	};</div><div class='del'>-</div><div class='del'>-	encode_compound_hdr(xdr, req, &amp;hdr);</div><div class='del'>-	encode_sequence(xdr, &amp;args-&gt;seq_args, &amp;hdr);</div><div class='del'>-	encode_putfh(xdr, args-&gt;fh, &amp;hdr);</div><div class='del'>-	encode_setxattr(xdr, args, &amp;hdr);</div><div class='del'>-	encode_nops(&amp;hdr);</div><div class='del'>-}</div><div class='del'>-</div><div class='add'>+/*</div><div class='add'>+ * Decode SETXATTR request</div><div class='add'>+ */</div><div class='ctx'> static int nfs4_xdr_dec_setxattr(struct rpc_rqst *req, struct xdr_stream *xdr,</div><div class='ctx'> 				 void *data)</div><div class='ctx'> {</div><div class='hunk'>@@ -1499,33 +1739,17 @@ static int nfs4_xdr_dec_setxattr(struct rpc_rqst *req, struct xdr_stream *xdr,</div><div class='ctx'> 	status = decode_putfh(xdr);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		goto out;</div><div class='del'>-</div><div class='ctx'> 	status = decode_setxattr(xdr, &amp;res-&gt;cinfo);</div><div class='add'>+	if (status)</div><div class='add'>+		goto out;</div><div class='add'>+	status = decode_getfattr(xdr, res-&gt;fattr, res-&gt;server);</div><div class='ctx'> out:</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void nfs4_xdr_enc_getxattr(struct rpc_rqst *req, struct xdr_stream *xdr,</div><div class='del'>-				  const void *data)</div><div class='del'>-{</div><div class='del'>-	const struct nfs42_getxattrargs *args = data;</div><div class='del'>-	struct compound_hdr hdr = {</div><div class='del'>-		.minorversion = nfs4_xdr_minorversion(&amp;args-&gt;seq_args),</div><div class='del'>-	};</div><div class='del'>-	uint32_t replen;</div><div class='del'>-</div><div class='del'>-	encode_compound_hdr(xdr, req, &amp;hdr);</div><div class='del'>-	encode_sequence(xdr, &amp;args-&gt;seq_args, &amp;hdr);</div><div class='del'>-	encode_putfh(xdr, args-&gt;fh, &amp;hdr);</div><div class='del'>-	replen = hdr.replen + op_decode_hdr_maxsz + 1;</div><div class='del'>-	encode_getxattr(xdr, args-&gt;xattr_name, &amp;hdr);</div><div class='del'>-</div><div class='del'>-	rpc_prepare_reply_pages(req, args-&gt;xattr_pages, 0, args-&gt;xattr_len,</div><div class='del'>-				replen);</div><div class='del'>-</div><div class='del'>-	encode_nops(&amp;hdr);</div><div class='del'>-}</div><div class='del'>-</div><div class='add'>+/*</div><div class='add'>+ * Decode GETXATTR request</div><div class='add'>+ */</div><div class='ctx'> static int nfs4_xdr_dec_getxattr(struct rpc_rqst *rqstp,</div><div class='ctx'> 				 struct xdr_stream *xdr, void *data)</div><div class='ctx'> {</div><div class='hunk'>@@ -1547,26 +1771,9 @@ out:</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void nfs4_xdr_enc_listxattrs(struct rpc_rqst *req,</div><div class='del'>-				    struct xdr_stream *xdr, const void *data)</div><div class='del'>-{</div><div class='del'>-	const struct nfs42_listxattrsargs *args = data;</div><div class='del'>-	struct compound_hdr hdr = {</div><div class='del'>-		.minorversion = nfs4_xdr_minorversion(&amp;args-&gt;seq_args),</div><div class='del'>-	};</div><div class='del'>-	uint32_t replen;</div><div class='del'>-</div><div class='del'>-	encode_compound_hdr(xdr, req, &amp;hdr);</div><div class='del'>-	encode_sequence(xdr, &amp;args-&gt;seq_args, &amp;hdr);</div><div class='del'>-	encode_putfh(xdr, args-&gt;fh, &amp;hdr);</div><div class='del'>-	replen = hdr.replen + op_decode_hdr_maxsz + 2 + 1;</div><div class='del'>-	encode_listxattrs(xdr, args, &amp;hdr);</div><div class='del'>-</div><div class='del'>-	rpc_prepare_reply_pages(req, args-&gt;xattr_pages, 0, args-&gt;count, replen);</div><div class='del'>-</div><div class='del'>-	encode_nops(&amp;hdr);</div><div class='del'>-}</div><div class='del'>-</div><div class='add'>+/*</div><div class='add'>+ * Decode LISTXATTR request</div><div class='add'>+ */</div><div class='ctx'> static int nfs4_xdr_dec_listxattrs(struct rpc_rqst *rqstp,</div><div class='ctx'> 				   struct xdr_stream *xdr, void *data)</div><div class='ctx'> {</div><div class='hunk'>@@ -1574,7 +1781,7 @@ static int nfs4_xdr_dec_listxattrs(struct rpc_rqst *rqstp,</div><div class='ctx'> 	struct compound_hdr hdr;</div><div class='ctx'> 	int status;</div><div class='ctx'> </div><div class='del'>-	xdr_set_scratch_page(xdr, res-&gt;scratch);</div><div class='add'>+	xdr_set_scratch_folio(xdr, res-&gt;scratch);</div><div class='ctx'> </div><div class='ctx'> 	status = decode_compound_hdr(xdr, &amp;hdr);</div><div class='ctx'> 	if (status)</div><div class='hunk'>@@ -1590,21 +1797,9 @@ out:</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void nfs4_xdr_enc_removexattr(struct rpc_rqst *req,</div><div class='del'>-				     struct xdr_stream *xdr, const void *data)</div><div class='del'>-{</div><div class='del'>-	const struct nfs42_removexattrargs *args = data;</div><div class='del'>-	struct compound_hdr hdr = {</div><div class='del'>-		.minorversion = nfs4_xdr_minorversion(&amp;args-&gt;seq_args),</div><div class='del'>-	};</div><div class='del'>-</div><div class='del'>-	encode_compound_hdr(xdr, req, &amp;hdr);</div><div class='del'>-	encode_sequence(xdr, &amp;args-&gt;seq_args, &amp;hdr);</div><div class='del'>-	encode_putfh(xdr, args-&gt;fh, &amp;hdr);</div><div class='del'>-	encode_removexattr(xdr, args-&gt;xattr_name, &amp;hdr);</div><div class='del'>-	encode_nops(&amp;hdr);</div><div class='del'>-}</div><div class='del'>-</div><div class='add'>+/*</div><div class='add'>+ * Decode REMOVEXATTR request</div><div class='add'>+ */</div><div class='ctx'> static int nfs4_xdr_dec_removexattr(struct rpc_rqst *req,</div><div class='ctx'> 				    struct xdr_stream *xdr, void *data)</div><div class='ctx'> {</div><div class='hunk'>@@ -1626,5 +1821,4 @@ static int nfs4_xdr_dec_removexattr(struct rpc_rqst *req,</div><div class='ctx'> out:</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='del'>-#endif</div><div class='ctx'> #endif /* __LINUX_FS_NFS_NFS4_2XDR_H */</div><div class='head'>diff --git a/fs/nfs/nfs4_fs.h b/fs/nfs/nfs4_fs.h<br/>index ed5eaca6801e..c34c89af9c7d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4_fs.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4_fs.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4_fs.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfs4_fs.h</a></div><div class='hunk'>@@ -23,6 +23,7 @@</div><div class='ctx'> #define NFS4_MAX_LOOP_ON_RECOVER (10)</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/seqlock.h&gt;</div><div class='add'>+#include &lt;linux/filelock.h&gt;</div><div class='ctx'> </div><div class='ctx'> struct idmap;</div><div class='ctx'> </div><div class='hunk'>@@ -42,6 +43,7 @@ enum nfs4_client_state {</div><div class='ctx'> 	NFS4CLNT_LEASE_MOVED,</div><div class='ctx'> 	NFS4CLNT_DELEGATION_EXPIRED,</div><div class='ctx'> 	NFS4CLNT_RUN_MANAGER,</div><div class='add'>+	NFS4CLNT_MANAGER_AVAILABLE,</div><div class='ctx'> 	NFS4CLNT_RECALL_RUNNING,</div><div class='ctx'> 	NFS4CLNT_RECALL_ANY_LAYOUT_READ,</div><div class='ctx'> 	NFS4CLNT_RECALL_ANY_LAYOUT_RW,</div><div class='hunk'>@@ -61,11 +63,11 @@ struct nfs4_minor_version_ops {</div><div class='ctx'> 	bool	(*match_stateid)(const nfs4_stateid *,</div><div class='ctx'> 			const nfs4_stateid *);</div><div class='ctx'> 	int	(*find_root_sec)(struct nfs_server *, struct nfs_fh *,</div><div class='del'>-			struct nfs_fsinfo *);</div><div class='add'>+				 struct nfs_fattr *);</div><div class='ctx'> 	void	(*free_lock_state)(struct nfs_server *,</div><div class='ctx'> 			struct nfs4_lock_state *);</div><div class='ctx'> 	int	(*test_and_free_expired)(struct nfs_server *,</div><div class='del'>-			nfs4_stateid *, const struct cred *);</div><div class='add'>+					 nfs4_stateid *, const struct cred *);</div><div class='ctx'> 	struct nfs_seqid *</div><div class='ctx'> 		(*alloc_seqid)(struct nfs_seqid_counter *, gfp_t);</div><div class='ctx'> 	void	(*session_trunk)(struct rpc_clnt *clnt,</div><div class='hunk'>@@ -80,7 +82,7 @@ struct nfs4_minor_version_ops {</div><div class='ctx'> #define NFS_SEQID_CONFIRMED 1</div><div class='ctx'> struct nfs_seqid_counter {</div><div class='ctx'> 	ktime_t create_time;</div><div class='del'>-	int owner_id;</div><div class='add'>+	u64 owner_id;</div><div class='ctx'> 	int flags;</div><div class='ctx'> 	u32 counter;</div><div class='ctx'> 	spinlock_t lock;		/* Protects the list */</div><div class='hunk'>@@ -118,7 +120,6 @@ struct nfs4_state_owner {</div><div class='ctx'> 	unsigned long	     so_flags;</div><div class='ctx'> 	struct list_head     so_states;</div><div class='ctx'> 	struct nfs_seqid_counter so_seqid;</div><div class='del'>-	seqcount_spinlock_t  so_reclaim_seqcount;</div><div class='ctx'> 	struct mutex	     so_delegreturn_mutex;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -148,6 +149,7 @@ struct nfs4_lock_state {</div><div class='ctx'> 	struct nfs4_state *	ls_state;	/* Pointer to open state */</div><div class='ctx'> #define NFS_LOCK_INITIALIZED 0</div><div class='ctx'> #define NFS_LOCK_LOST        1</div><div class='add'>+#define NFS_LOCK_UNLOCKING   2</div><div class='ctx'> 	unsigned long		ls_flags;</div><div class='ctx'> 	struct nfs_seqid_counter	ls_seqid;</div><div class='ctx'> 	nfs4_stateid		ls_stateid;</div><div class='hunk'>@@ -206,6 +208,7 @@ struct nfs4_exception {</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	nfs4_stateid *stateid;</div><div class='ctx'> 	long timeout;</div><div class='add'>+	unsigned short retrans;</div><div class='ctx'> 	unsigned char task_is_privileged : 1;</div><div class='ctx'> 	unsigned char delay : 1,</div><div class='ctx'> 		      recovering : 1,</div><div class='hunk'>@@ -260,8 +263,8 @@ struct nfs4_state_maintenance_ops {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct nfs4_mig_recovery_ops {</div><div class='del'>-	int (*get_locations)(struct inode *, struct nfs4_fs_locations *,</div><div class='del'>-		struct page *, const struct cred *);</div><div class='add'>+	int (*get_locations)(struct nfs_server *, struct nfs_fh *,</div><div class='add'>+		struct nfs4_fs_locations *, struct page *, const struct cred *);</div><div class='ctx'> 	int (*fsid_present)(struct inode *, const struct cred *);</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -280,7 +283,8 @@ struct rpc_clnt *nfs4_negotiate_security(struct rpc_clnt *, struct inode *,</div><div class='ctx'> int nfs4_submount(struct fs_context *, struct nfs_server *);</div><div class='ctx'> int nfs4_replace_transport(struct nfs_server *server,</div><div class='ctx'> 				const struct nfs4_fs_locations *locations);</div><div class='del'>-</div><div class='add'>+size_t nfs_parse_server_name(char *string, size_t len, struct sockaddr_storage *ss,</div><div class='add'>+			     size_t salen, struct net *net, int port);</div><div class='ctx'> /* nfs4proc.c */</div><div class='ctx'> extern int nfs4_handle_exception(struct nfs_server *, int, struct nfs4_exception *);</div><div class='ctx'> extern int nfs4_async_handle_error(struct rpc_task *task,</div><div class='hunk'>@@ -292,7 +296,8 @@ extern int nfs4_call_sync(struct rpc_clnt *, struct nfs_server *,</div><div class='ctx'> extern void nfs4_init_sequence(struct nfs4_sequence_args *, struct nfs4_sequence_res *, int, int);</div><div class='ctx'> extern int nfs4_proc_setclientid(struct nfs_client *, u32, unsigned short, const struct cred *, struct nfs4_setclientid_res *);</div><div class='ctx'> extern int nfs4_proc_setclientid_confirm(struct nfs_client *, struct nfs4_setclientid_res *arg, const struct cred *);</div><div class='del'>-extern int nfs4_proc_get_rootfh(struct nfs_server *, struct nfs_fh *, struct nfs_fsinfo *, bool);</div><div class='add'>+extern int nfs4_proc_get_rootfh(struct nfs_server *, struct nfs_fh *,</div><div class='add'>+				struct nfs_fattr *, bool);</div><div class='ctx'> extern int nfs4_proc_bind_conn_to_session(struct nfs_client *, const struct cred *cred);</div><div class='ctx'> extern int nfs4_proc_exchange_id(struct nfs_client *clp, const struct cred *cred);</div><div class='ctx'> extern int nfs4_destroy_clientid(struct nfs_client *clp);</div><div class='hunk'>@@ -302,27 +307,30 @@ extern int nfs4_do_close(struct nfs4_state *state, gfp_t gfp_mask, int wait);</div><div class='ctx'> extern int nfs4_server_capabilities(struct nfs_server *server, struct nfs_fh *fhandle);</div><div class='ctx'> extern int nfs4_proc_fs_locations(struct rpc_clnt *, struct inode *, const struct qstr *,</div><div class='ctx'> 				  struct nfs4_fs_locations *, struct page *);</div><div class='del'>-extern int nfs4_proc_get_locations(struct inode *, struct nfs4_fs_locations *,</div><div class='del'>-		struct page *page, const struct cred *);</div><div class='add'>+extern int nfs4_proc_get_locations(struct nfs_server *, struct nfs_fh *,</div><div class='add'>+				   struct nfs4_fs_locations *,</div><div class='add'>+				   struct page *page, const struct cred *);</div><div class='ctx'> extern int nfs4_proc_fsid_present(struct inode *, const struct cred *);</div><div class='ctx'> extern struct rpc_clnt *nfs4_proc_lookup_mountpoint(struct inode *,</div><div class='ctx'> 						    struct dentry *,</div><div class='ctx'> 						    struct nfs_fh *,</div><div class='ctx'> 						    struct nfs_fattr *);</div><div class='ctx'> extern int nfs4_proc_secinfo(struct inode *, const struct qstr *, struct nfs4_secinfo_flavors *);</div><div class='del'>-extern const struct xattr_handler *nfs4_xattr_handlers[];</div><div class='add'>+extern const struct xattr_handler * const nfs4_xattr_handlers[];</div><div class='ctx'> extern int nfs4_set_rw_stateid(nfs4_stateid *stateid,</div><div class='ctx'> 		const struct nfs_open_context *ctx,</div><div class='ctx'> 		const struct nfs_lock_context *l_ctx,</div><div class='ctx'> 		fmode_t fmode);</div><div class='add'>+extern void nfs4_bitmask_set(__u32 bitmask[], const __u32 src[],</div><div class='add'>+			     struct inode *inode, unsigned long cache_validity);</div><div class='ctx'> extern int nfs4_proc_getattr(struct nfs_server *server, struct nfs_fh *fhandle,</div><div class='ctx'> 			     struct nfs_fattr *fattr, struct inode *inode);</div><div class='ctx'> extern int update_open_stateid(struct nfs4_state *state,</div><div class='ctx'> 				const nfs4_stateid *open_stateid,</div><div class='ctx'> 				const nfs4_stateid *deleg_stateid,</div><div class='ctx'> 				fmode_t fmode);</div><div class='del'>-extern int nfs4_proc_setlease(struct file *file, long arg,</div><div class='del'>-			      struct file_lock **lease, void **priv);</div><div class='add'>+extern int nfs4_proc_setlease(struct file *file, int arg,</div><div class='add'>+			      struct file_lease **lease, void **priv);</div><div class='ctx'> extern int nfs4_proc_get_lease_time(struct nfs_client *clp,</div><div class='ctx'> 		struct nfs_fsinfo *fsinfo);</div><div class='ctx'> extern void nfs4_update_changeattr(struct inode *dir,</div><div class='hunk'>@@ -454,7 +462,6 @@ struct nfs_client *nfs4_alloc_client(const struct nfs_client_initdata *);</div><div class='ctx'> </div><div class='ctx'> /* nfs4renewd.c */</div><div class='ctx'> extern void nfs4_schedule_state_renewal(struct nfs_client *);</div><div class='del'>-extern void nfs4_renewd_prepare_shutdown(struct nfs_server *);</div><div class='ctx'> extern void nfs4_kill_renewd(struct nfs_client *);</div><div class='ctx'> extern void nfs4_renew_state(struct work_struct *);</div><div class='ctx'> extern void nfs4_set_lease_period(struct nfs_client *clp, unsigned long lease);</div><div class='hunk'>@@ -540,6 +547,7 @@ extern unsigned short max_session_slots;</div><div class='ctx'> extern unsigned short max_session_cb_slots;</div><div class='ctx'> extern unsigned short send_implementation_id;</div><div class='ctx'> extern bool recover_lost_locks;</div><div class='add'>+extern short nfs_delay_retrans;</div><div class='ctx'> </div><div class='ctx'> #define NFS4_CLIENT_ID_UNIQ_LEN		(64)</div><div class='ctx'> extern char nfs4_client_id_uniquifier[NFS4_CLIENT_ID_UNIQ_LEN];</div><div class='head'>diff --git a/fs/nfs/nfs4client.c b/fs/nfs/nfs4client.c<br/>index d8b5a250ca05..3a4baed993c9 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4client.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4client.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4client.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfs4client.c</a></div><div class='hunk'>@@ -11,6 +11,7 @@</div><div class='ctx'> #include &lt;linux/sunrpc/xprt.h&gt;</div><div class='ctx'> #include &lt;linux/sunrpc/bc_xprt.h&gt;</div><div class='ctx'> #include &lt;linux/sunrpc/rpc_pipe_fs.h&gt;</div><div class='add'>+#include &lt;net/handshake.h&gt;</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> #include "callback.h"</div><div class='ctx'> #include "delegation.h"</div><div class='hunk'>@@ -18,6 +19,7 @@</div><div class='ctx'> #include "nfs4idmap.h"</div><div class='ctx'> #include "pnfs.h"</div><div class='ctx'> #include "netns.h"</div><div class='add'>+#include "sysfs.h"</div><div class='ctx'> </div><div class='ctx'> #define NFSDBG_FACILITY		NFSDBG_CLIENT</div><div class='ctx'> </div><div class='hunk'>@@ -221,6 +223,7 @@ struct nfs_client *nfs4_alloc_client(const struct nfs_client_initdata *cl_init)</div><div class='ctx'> 	clp-&gt;cl_state = 1 &lt;&lt; NFS4CLNT_LEASE_EXPIRED;</div><div class='ctx'> 	clp-&gt;cl_mvops = nfs_v4_minor_ops[cl_init-&gt;minorversion];</div><div class='ctx'> 	clp-&gt;cl_mig_gen = 1;</div><div class='add'>+	clp-&gt;cl_last_renewal = jiffies;</div><div class='ctx'> #if IS_ENABLED(CONFIG_NFS_V4_1)</div><div class='ctx'> 	init_waitqueue_head(&amp;clp-&gt;cl_lock_waitq);</div><div class='ctx'> #endif</div><div class='hunk'>@@ -230,7 +233,10 @@ struct nfs_client *nfs4_alloc_client(const struct nfs_client_initdata *cl_init)</div><div class='ctx'> 		__set_bit(NFS_CS_INFINITE_SLOTS, &amp;clp-&gt;cl_flags);</div><div class='ctx'> 	__set_bit(NFS_CS_DISCRTRY, &amp;clp-&gt;cl_flags);</div><div class='ctx'> 	__set_bit(NFS_CS_NO_RETRANS_TIMEOUT, &amp;clp-&gt;cl_flags);</div><div class='del'>-</div><div class='add'>+	if (test_bit(NFS_CS_PNFS, &amp;cl_init-&gt;init_flags))</div><div class='add'>+		__set_bit(NFS_CS_PNFS, &amp;clp-&gt;cl_flags);</div><div class='add'>+	if (test_bit(NFS_CS_NETUNREACH_FATAL, &amp;cl_init-&gt;init_flags))</div><div class='add'>+		__set_bit(NFS_CS_NETUNREACH_FATAL, &amp;clp-&gt;cl_flags);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Set up the connection to the server before we add add to the</div><div class='ctx'> 	 * global list.</div><div class='hunk'>@@ -254,7 +260,7 @@ struct nfs_client *nfs4_alloc_client(const struct nfs_client_initdata *cl_init)</div><div class='ctx'> 			goto error;</div><div class='ctx'> 		ip_addr = (const char *)buf;</div><div class='ctx'> 	}</div><div class='del'>-	strlcpy(clp-&gt;cl_ipaddr, ip_addr, sizeof(clp-&gt;cl_ipaddr));</div><div class='add'>+	strscpy(clp-&gt;cl_ipaddr, ip_addr, sizeof(clp-&gt;cl_ipaddr));</div><div class='ctx'> </div><div class='ctx'> 	err = nfs_idmap_new(clp);</div><div class='ctx'> 	if (err &lt; 0) {</div><div class='hunk'>@@ -346,6 +352,7 @@ int nfs40_init_client(struct nfs_client *clp)</div><div class='ctx'> 	ret = nfs4_setup_slot_table(tbl, NFS4_MAX_SLOT_TABLE,</div><div class='ctx'> 					"NFSv4.0 transport Slot table");</div><div class='ctx'> 	if (ret) {</div><div class='add'>+		nfs4_shutdown_slot_table(tbl);</div><div class='ctx'> 		kfree(tbl);</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -413,6 +420,8 @@ static void nfs4_add_trunk(struct nfs_client *clp, struct nfs_client *old)</div><div class='ctx'> 		.net = old-&gt;cl_net,</div><div class='ctx'> 		.servername = old-&gt;cl_hostname,</div><div class='ctx'> 	};</div><div class='add'>+	int max_connect = test_bit(NFS_CS_PNFS, &amp;clp-&gt;cl_flags) ?</div><div class='add'>+		clp-&gt;cl_max_connect : old-&gt;cl_max_connect;</div><div class='ctx'> </div><div class='ctx'> 	if (clp-&gt;cl_proto != old-&gt;cl_proto)</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -426,7 +435,7 @@ static void nfs4_add_trunk(struct nfs_client *clp, struct nfs_client *old)</div><div class='ctx'> 	xprt_args.addrlen = clp_salen;</div><div class='ctx'> </div><div class='ctx'> 	rpc_clnt_add_xprt(old-&gt;cl_rpcclient, &amp;xprt_args,</div><div class='del'>-			  rpc_clnt_test_and_add_xprt, NULL);</div><div class='add'>+			  rpc_clnt_test_and_add_xprt, &amp;max_connect);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -795,6 +804,7 @@ static void nfs4_destroy_server(struct nfs_server *server)</div><div class='ctx'> 	unset_pnfs_layoutdriver(server);</div><div class='ctx'> 	nfs4_purge_state_owners(server, &amp;freeme);</div><div class='ctx'> 	nfs4_free_state_owners(&amp;freeme);</div><div class='add'>+	kfree(server-&gt;delegation_hash_table);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -888,46 +898,40 @@ nfs4_find_client_sessionid(struct net *net, const struct sockaddr *addr,</div><div class='ctx'>  * Set up an NFS4 client</div><div class='ctx'>  */</div><div class='ctx'> static int nfs4_set_client(struct nfs_server *server,</div><div class='del'>-		const char *hostname,</div><div class='del'>-		const struct sockaddr *addr,</div><div class='del'>-		const size_t addrlen,</div><div class='del'>-		const char *ip_addr,</div><div class='del'>-		int proto, const struct rpc_timeout *timeparms,</div><div class='del'>-		u32 minorversion, unsigned int nconnect,</div><div class='del'>-		unsigned int max_connect,</div><div class='del'>-		struct net *net)</div><div class='add'>+		struct nfs_client_initdata *cl_init)</div><div class='ctx'> {</div><div class='del'>-	struct nfs_client_initdata cl_init = {</div><div class='del'>-		.hostname = hostname,</div><div class='del'>-		.addr = addr,</div><div class='del'>-		.addrlen = addrlen,</div><div class='del'>-		.ip_addr = ip_addr,</div><div class='del'>-		.nfs_mod = &amp;nfs_v4,</div><div class='del'>-		.proto = proto,</div><div class='del'>-		.minorversion = minorversion,</div><div class='del'>-		.net = net,</div><div class='del'>-		.timeparms = timeparms,</div><div class='del'>-		.cred = server-&gt;cred,</div><div class='del'>-	};</div><div class='ctx'> 	struct nfs_client *clp;</div><div class='ctx'> </div><div class='del'>-	if (minorversion == 0)</div><div class='del'>-		__set_bit(NFS_CS_REUSEPORT, &amp;cl_init.init_flags);</div><div class='del'>-	else</div><div class='del'>-		cl_init.max_connect = max_connect;</div><div class='del'>-	if (proto == XPRT_TRANSPORT_TCP)</div><div class='del'>-		cl_init.nconnect = nconnect;</div><div class='add'>+	cl_init-&gt;nfs_mod = &amp;nfs_v4;</div><div class='add'>+	cl_init-&gt;cred = server-&gt;cred;</div><div class='add'>+</div><div class='add'>+	if (cl_init-&gt;minorversion == 0) {</div><div class='add'>+		__set_bit(NFS_CS_REUSEPORT, &amp;cl_init-&gt;init_flags);</div><div class='add'>+		cl_init-&gt;max_connect = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	switch (cl_init-&gt;proto) {</div><div class='add'>+	case XPRT_TRANSPORT_RDMA:</div><div class='add'>+	case XPRT_TRANSPORT_TCP:</div><div class='add'>+	case XPRT_TRANSPORT_TCP_TLS:</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		cl_init-&gt;nconnect = 0;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (server-&gt;flags &amp; NFS_MOUNT_NORESVPORT)</div><div class='del'>-		__set_bit(NFS_CS_NORESVPORT, &amp;cl_init.init_flags);</div><div class='add'>+		__set_bit(NFS_CS_NORESVPORT, &amp;cl_init-&gt;init_flags);</div><div class='ctx'> 	if (server-&gt;options &amp; NFS_OPTION_MIGRATION)</div><div class='del'>-		__set_bit(NFS_CS_MIGRATION, &amp;cl_init.init_flags);</div><div class='add'>+		__set_bit(NFS_CS_MIGRATION, &amp;cl_init-&gt;init_flags);</div><div class='ctx'> 	if (test_bit(NFS_MIG_TSM_POSSIBLE, &amp;server-&gt;mig_status))</div><div class='del'>-		__set_bit(NFS_CS_TSM_POSSIBLE, &amp;cl_init.init_flags);</div><div class='del'>-	server-&gt;port = rpc_get_port(addr);</div><div class='add'>+		__set_bit(NFS_CS_TSM_POSSIBLE, &amp;cl_init-&gt;init_flags);</div><div class='add'>+	server-&gt;port = rpc_get_port((struct sockaddr *)cl_init-&gt;addr);</div><div class='add'>+</div><div class='add'>+	if (server-&gt;flags &amp; NFS_MOUNT_NETUNREACH_FATAL)</div><div class='add'>+		__set_bit(NFS_CS_NETUNREACH_FATAL, &amp;cl_init-&gt;init_flags);</div><div class='ctx'> </div><div class='ctx'> 	/* Allocate or find a client reference we can use */</div><div class='del'>-	clp = nfs_get_client(&amp;cl_init);</div><div class='add'>+	clp = nfs_get_client(cl_init);</div><div class='ctx'> 	if (IS_ERR(clp))</div><div class='ctx'> 		return PTR_ERR(clp);</div><div class='ctx'> </div><div class='hunk'>@@ -946,6 +950,9 @@ static int nfs4_set_client(struct nfs_server *server,</div><div class='ctx'> 	set_bit(NFS_CS_CHECK_LEASE_TIME, &amp;clp-&gt;cl_res_state);</div><div class='ctx'> </div><div class='ctx'> 	server-&gt;nfs_client = clp;</div><div class='add'>+	nfs_sysfs_add_server(server);</div><div class='add'>+	nfs_sysfs_link_rpc_client(server, clp-&gt;cl_rpcclient, "_state");</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -960,7 +967,7 @@ static int nfs4_set_client(struct nfs_server *server,</div><div class='ctx'>  * the MDS.</div><div class='ctx'>  */</div><div class='ctx'> struct nfs_client *nfs4_set_ds_client(struct nfs_server *mds_srv,</div><div class='del'>-		const struct sockaddr *ds_addr, int ds_addrlen,</div><div class='add'>+		const struct sockaddr_storage *ds_addr, int ds_addrlen,</div><div class='ctx'> 		int ds_proto, unsigned int ds_timeo, unsigned int ds_retrans,</div><div class='ctx'> 		u32 minor_version)</div><div class='ctx'> {</div><div class='hunk'>@@ -977,21 +984,40 @@ struct nfs_client *nfs4_set_ds_client(struct nfs_server *mds_srv,</div><div class='ctx'> 		.net = mds_clp-&gt;cl_net,</div><div class='ctx'> 		.timeparms = &amp;ds_timeout,</div><div class='ctx'> 		.cred = mds_srv-&gt;cred,</div><div class='add'>+		.xprtsec = {</div><div class='add'>+			.policy = RPC_XPRTSEC_NONE,</div><div class='add'>+			.cert_serial = TLS_NO_CERT,</div><div class='add'>+			.privkey_serial = TLS_NO_PRIVKEY,</div><div class='add'>+		},</div><div class='ctx'> 	};</div><div class='ctx'> 	char buf[INET6_ADDRSTRLEN + 1];</div><div class='ctx'> </div><div class='del'>-	if (rpc_ntop(ds_addr, buf, sizeof(buf)) &lt;= 0)</div><div class='add'>+	if (rpc_ntop((struct sockaddr *)ds_addr, buf, sizeof(buf)) &lt;= 0)</div><div class='ctx'> 		return ERR_PTR(-EINVAL);</div><div class='ctx'> 	cl_init.hostname = buf;</div><div class='ctx'> </div><div class='del'>-	if (mds_clp-&gt;cl_nconnect &gt; 1 &amp;&amp; ds_proto == XPRT_TRANSPORT_TCP) {</div><div class='del'>-		cl_init.nconnect = mds_clp-&gt;cl_nconnect;</div><div class='del'>-		cl_init.max_connect = NFS_MAX_TRANSPORTS;</div><div class='add'>+	switch (ds_proto) {</div><div class='add'>+	case XPRT_TRANSPORT_TCP_TLS:</div><div class='add'>+		if (mds_srv-&gt;nfs_client-&gt;cl_xprtsec.policy != RPC_XPRTSEC_NONE)</div><div class='add'>+			cl_init.xprtsec = mds_srv-&gt;nfs_client-&gt;cl_xprtsec;</div><div class='add'>+		else</div><div class='add'>+			ds_proto = XPRT_TRANSPORT_TCP;</div><div class='add'>+		fallthrough;</div><div class='add'>+	case XPRT_TRANSPORT_RDMA:</div><div class='add'>+	case XPRT_TRANSPORT_TCP:</div><div class='add'>+		if (mds_clp-&gt;cl_nconnect &gt; 1) {</div><div class='add'>+			cl_init.nconnect = mds_clp-&gt;cl_nconnect;</div><div class='add'>+			cl_init.max_connect = NFS_MAX_TRANSPORTS;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	if (mds_srv-&gt;flags &amp; NFS_MOUNT_NORESVPORT)</div><div class='ctx'> 		__set_bit(NFS_CS_NORESVPORT, &amp;cl_init.init_flags);</div><div class='add'>+	if (test_bit(NFS_CS_NETUNREACH_FATAL, &amp;mds_clp-&gt;cl_flags))</div><div class='add'>+		__set_bit(NFS_CS_NETUNREACH_FATAL, &amp;cl_init.init_flags);</div><div class='ctx'> </div><div class='add'>+	__set_bit(NFS_CS_PNFS, &amp;cl_init.init_flags);</div><div class='add'>+	cl_init.max_connect = NFS_MAX_TRANSPORTS;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Set an authflavor equual to the MDS value. Use the MDS nfs_client</div><div class='ctx'> 	 * cl_ipaddr so as to use the same EXCHANGE_ID co_ownerid as the MDS</div><div class='hunk'>@@ -1059,29 +1085,15 @@ static void nfs4_session_limit_xasize(struct nfs_server *server)</div><div class='ctx'> #endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void nfs4_server_set_init_caps(struct nfs_server *server)</div><div class='del'>-{</div><div class='del'>-	/* Set the basic capabilities */</div><div class='del'>-	server-&gt;caps |= server-&gt;nfs_client-&gt;cl_mvops-&gt;init_caps;</div><div class='del'>-	if (server-&gt;flags &amp; NFS_MOUNT_NORDIRPLUS)</div><div class='del'>-			server-&gt;caps &amp;= ~NFS_CAP_READDIRPLUS;</div><div class='del'>-	if (server-&gt;nfs_client-&gt;cl_proto == XPRT_TRANSPORT_RDMA)</div><div class='del'>-		server-&gt;caps &amp;= ~NFS_CAP_READ_PLUS;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Don't use NFS uid/gid mapping if we're using AUTH_SYS or lower</div><div class='del'>-	 * authentication.</div><div class='del'>-	 */</div><div class='del'>-	if (nfs4_disable_idmapping &amp;&amp;</div><div class='del'>-			server-&gt;client-&gt;cl_auth-&gt;au_flavor == RPC_AUTH_UNIX)</div><div class='del'>-		server-&gt;caps |= NFS_CAP_UIDGID_NOMAP;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int nfs4_server_common_setup(struct nfs_server *server,</div><div class='ctx'> 		struct nfs_fh *mntfh, bool auth_probe)</div><div class='ctx'> {</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='add'>+	error = nfs4_delegation_hash_alloc(server);</div><div class='add'>+	if (error)</div><div class='add'>+		return error;</div><div class='add'>+</div><div class='ctx'> 	/* data servers support only a subset of NFSv4.1 */</div><div class='ctx'> 	if (is_ds_only_client(server-&gt;nfs_client))</div><div class='ctx'> 		return -EPROTONOSUPPORT;</div><div class='hunk'>@@ -1089,14 +1101,14 @@ static int nfs4_server_common_setup(struct nfs_server *server,</div><div class='ctx'> 	/* We must ensure the session is initialised first */</div><div class='ctx'> 	error = nfs4_init_session(server-&gt;nfs_client);</div><div class='ctx'> 	if (error &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return error;</div><div class='ctx'> </div><div class='del'>-	nfs4_server_set_init_caps(server);</div><div class='add'>+	nfs_server_set_init_caps(server);</div><div class='ctx'> </div><div class='ctx'> 	/* Probe the root fh to retrieve its FSID and filehandle */</div><div class='ctx'> 	error = nfs4_get_rootfh(server, mntfh, auth_probe);</div><div class='ctx'> 	if (error &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return error;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("Server FSID: %llx:%llx\n",</div><div class='ctx'> 			(unsigned long long) server-&gt;fsid.major,</div><div class='hunk'>@@ -1105,7 +1117,7 @@ static int nfs4_server_common_setup(struct nfs_server *server,</div><div class='ctx'> </div><div class='ctx'> 	error = nfs_probe_server(server, mntfh);</div><div class='ctx'> 	if (error &lt; 0)</div><div class='del'>-		goto out;</div><div class='add'>+		return error;</div><div class='ctx'> </div><div class='ctx'> 	nfs4_session_limit_rwsize(server);</div><div class='ctx'> 	nfs4_session_limit_xasize(server);</div><div class='hunk'>@@ -1116,8 +1128,7 @@ static int nfs4_server_common_setup(struct nfs_server *server,</div><div class='ctx'> 	nfs_server_insert_lists(server);</div><div class='ctx'> 	server-&gt;mount_time = jiffies;</div><div class='ctx'> 	server-&gt;destroy = nfs4_destroy_server;</div><div class='del'>-out:</div><div class='del'>-	return error;</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1127,6 +1138,19 @@ static int nfs4_init_server(struct nfs_server *server, struct fs_context *fc)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_fs_context *ctx = nfs_fc2context(fc);</div><div class='ctx'> 	struct rpc_timeout timeparms;</div><div class='add'>+	struct nfs_client_initdata cl_init = {</div><div class='add'>+		.hostname = ctx-&gt;nfs_server.hostname,</div><div class='add'>+		.addr = &amp;ctx-&gt;nfs_server._address,</div><div class='add'>+		.addrlen = ctx-&gt;nfs_server.addrlen,</div><div class='add'>+		.ip_addr = ctx-&gt;client_address,</div><div class='add'>+		.proto = ctx-&gt;nfs_server.protocol,</div><div class='add'>+		.minorversion = ctx-&gt;minorversion,</div><div class='add'>+		.net = fc-&gt;net_ns,</div><div class='add'>+		.timeparms = &amp;timeparms,</div><div class='add'>+		.xprtsec = ctx-&gt;xprtsec,</div><div class='add'>+		.nconnect = ctx-&gt;nfs_server.nconnect,</div><div class='add'>+		.max_connect = ctx-&gt;nfs_server.max_connect,</div><div class='add'>+	};</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='ctx'> 	nfs_init_timeout_values(&amp;timeparms, ctx-&gt;nfs_server.protocol,</div><div class='hunk'>@@ -1146,24 +1170,14 @@ static int nfs4_init_server(struct nfs_server *server, struct fs_context *fc)</div><div class='ctx'> 		ctx-&gt;selected_flavor = RPC_AUTH_UNIX;</div><div class='ctx'> </div><div class='ctx'> 	/* Get a client record */</div><div class='del'>-	error = nfs4_set_client(server,</div><div class='del'>-				ctx-&gt;nfs_server.hostname,</div><div class='del'>-				&amp;ctx-&gt;nfs_server.address,</div><div class='del'>-				ctx-&gt;nfs_server.addrlen,</div><div class='del'>-				ctx-&gt;client_address,</div><div class='del'>-				ctx-&gt;nfs_server.protocol,</div><div class='del'>-				&amp;timeparms,</div><div class='del'>-				ctx-&gt;minorversion,</div><div class='del'>-				ctx-&gt;nfs_server.nconnect,</div><div class='del'>-				ctx-&gt;nfs_server.max_connect,</div><div class='del'>-				fc-&gt;net_ns);</div><div class='add'>+	error = nfs4_set_client(server, &amp;cl_init);</div><div class='ctx'> 	if (error &lt; 0)</div><div class='ctx'> 		return error;</div><div class='ctx'> </div><div class='ctx'> 	if (ctx-&gt;rsize)</div><div class='del'>-		server-&gt;rsize = nfs_block_size(ctx-&gt;rsize, NULL);</div><div class='add'>+		server-&gt;rsize = nfs_io_size(ctx-&gt;rsize, server-&gt;nfs_client-&gt;cl_proto);</div><div class='ctx'> 	if (ctx-&gt;wsize)</div><div class='del'>-		server-&gt;wsize = nfs_block_size(ctx-&gt;wsize, NULL);</div><div class='add'>+		server-&gt;wsize = nfs_io_size(ctx-&gt;wsize, server-&gt;nfs_client-&gt;cl_proto);</div><div class='ctx'> </div><div class='ctx'> 	server-&gt;acregmin = ctx-&gt;acregmin * HZ;</div><div class='ctx'> 	server-&gt;acregmax = ctx-&gt;acregmax * HZ;</div><div class='hunk'>@@ -1216,8 +1230,21 @@ error:</div><div class='ctx'> struct nfs_server *nfs4_create_referral_server(struct fs_context *fc)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_fs_context *ctx = nfs_fc2context(fc);</div><div class='del'>-	struct nfs_client *parent_client;</div><div class='del'>-	struct nfs_server *server, *parent_server;</div><div class='add'>+	struct nfs_server *parent_server = NFS_SB(ctx-&gt;clone_data.sb);</div><div class='add'>+	struct nfs_client *parent_client = parent_server-&gt;nfs_client;</div><div class='add'>+	struct nfs_client_initdata cl_init = {</div><div class='add'>+		.hostname = ctx-&gt;nfs_server.hostname,</div><div class='add'>+		.addr = &amp;ctx-&gt;nfs_server._address,</div><div class='add'>+		.addrlen = ctx-&gt;nfs_server.addrlen,</div><div class='add'>+		.ip_addr = parent_client-&gt;cl_ipaddr,</div><div class='add'>+		.minorversion = parent_client-&gt;cl_mvops-&gt;minor_version,</div><div class='add'>+		.net = parent_client-&gt;cl_net,</div><div class='add'>+		.timeparms = parent_server-&gt;client-&gt;cl_timeout,</div><div class='add'>+		.xprtsec = parent_client-&gt;cl_xprtsec,</div><div class='add'>+		.nconnect = parent_client-&gt;cl_nconnect,</div><div class='add'>+		.max_connect = parent_client-&gt;cl_max_connect,</div><div class='add'>+	};</div><div class='add'>+	struct nfs_server *server;</div><div class='ctx'> 	bool auth_probe;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='hunk'>@@ -1225,9 +1252,6 @@ struct nfs_server *nfs4_create_referral_server(struct fs_context *fc)</div><div class='ctx'> 	if (!server)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='ctx'> </div><div class='del'>-	parent_server = NFS_SB(ctx-&gt;clone_data.sb);</div><div class='del'>-	parent_client = parent_server-&gt;nfs_client;</div><div class='del'>-</div><div class='ctx'> 	server-&gt;cred = get_cred(parent_server-&gt;cred);</div><div class='ctx'> </div><div class='ctx'> 	/* Initialise the client representation from the parent server */</div><div class='hunk'>@@ -1236,33 +1260,17 @@ struct nfs_server *nfs4_create_referral_server(struct fs_context *fc)</div><div class='ctx'> 	/* Get a client representation */</div><div class='ctx'> #if IS_ENABLED(CONFIG_SUNRPC_XPRT_RDMA)</div><div class='ctx'> 	rpc_set_port(&amp;ctx-&gt;nfs_server.address, NFS_RDMA_PORT);</div><div class='del'>-	error = nfs4_set_client(server,</div><div class='del'>-				ctx-&gt;nfs_server.hostname,</div><div class='del'>-				&amp;ctx-&gt;nfs_server.address,</div><div class='del'>-				ctx-&gt;nfs_server.addrlen,</div><div class='del'>-				parent_client-&gt;cl_ipaddr,</div><div class='del'>-				XPRT_TRANSPORT_RDMA,</div><div class='del'>-				parent_server-&gt;client-&gt;cl_timeout,</div><div class='del'>-				parent_client-&gt;cl_mvops-&gt;minor_version,</div><div class='del'>-				parent_client-&gt;cl_nconnect,</div><div class='del'>-				parent_client-&gt;cl_max_connect,</div><div class='del'>-				parent_client-&gt;cl_net);</div><div class='add'>+	cl_init.proto = XPRT_TRANSPORT_RDMA;</div><div class='add'>+	error = nfs4_set_client(server, &amp;cl_init);</div><div class='ctx'> 	if (!error)</div><div class='ctx'> 		goto init_server;</div><div class='ctx'> #endif	/* IS_ENABLED(CONFIG_SUNRPC_XPRT_RDMA) */</div><div class='ctx'> </div><div class='add'>+	cl_init.proto = XPRT_TRANSPORT_TCP;</div><div class='add'>+	if (parent_client-&gt;cl_xprtsec.policy != RPC_XPRTSEC_NONE)</div><div class='add'>+		cl_init.proto = XPRT_TRANSPORT_TCP_TLS;</div><div class='ctx'> 	rpc_set_port(&amp;ctx-&gt;nfs_server.address, NFS_PORT);</div><div class='del'>-	error = nfs4_set_client(server,</div><div class='del'>-				ctx-&gt;nfs_server.hostname,</div><div class='del'>-				&amp;ctx-&gt;nfs_server.address,</div><div class='del'>-				ctx-&gt;nfs_server.addrlen,</div><div class='del'>-				parent_client-&gt;cl_ipaddr,</div><div class='del'>-				XPRT_TRANSPORT_TCP,</div><div class='del'>-				parent_server-&gt;client-&gt;cl_timeout,</div><div class='del'>-				parent_client-&gt;cl_mvops-&gt;minor_version,</div><div class='del'>-				parent_client-&gt;cl_nconnect,</div><div class='del'>-				parent_client-&gt;cl_max_connect,</div><div class='del'>-				parent_client-&gt;cl_net);</div><div class='add'>+	error = nfs4_set_client(server, &amp;cl_init);</div><div class='ctx'> 	if (error &lt; 0)</div><div class='ctx'> 		goto error;</div><div class='ctx'> </div><div class='hunk'>@@ -1303,20 +1311,34 @@ error:</div><div class='ctx'>  * Returns zero on success, or a negative errno value.</div><div class='ctx'>  */</div><div class='ctx'> int nfs4_update_server(struct nfs_server *server, const char *hostname,</div><div class='del'>-		       struct sockaddr *sap, size_t salen, struct net *net)</div><div class='add'>+		       struct sockaddr_storage *sap, size_t salen, struct net *net)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_client *clp = server-&gt;nfs_client;</div><div class='ctx'> 	struct rpc_clnt *clnt = server-&gt;client;</div><div class='ctx'> 	struct xprt_create xargs = {</div><div class='ctx'> 		.ident		= clp-&gt;cl_proto,</div><div class='ctx'> 		.net		= net,</div><div class='del'>-		.dstaddr	= sap,</div><div class='add'>+		.dstaddr	= (struct sockaddr *)sap,</div><div class='ctx'> 		.addrlen	= salen,</div><div class='ctx'> 		.servername	= hostname,</div><div class='add'>+		/* cel: bleh. We might need to pass TLS parameters here */</div><div class='ctx'> 	};</div><div class='ctx'> 	char buf[INET6_ADDRSTRLEN + 1];</div><div class='ctx'> 	struct sockaddr_storage address;</div><div class='ctx'> 	struct sockaddr *localaddr = (struct sockaddr *)&amp;address;</div><div class='add'>+	struct nfs_client_initdata cl_init = {</div><div class='add'>+		.hostname = hostname,</div><div class='add'>+		.addr = sap,</div><div class='add'>+		.addrlen = salen,</div><div class='add'>+		.ip_addr = buf,</div><div class='add'>+		.proto = clp-&gt;cl_proto,</div><div class='add'>+		.minorversion = clp-&gt;cl_minorversion,</div><div class='add'>+		.net = net,</div><div class='add'>+		.timeparms = clnt-&gt;cl_timeout,</div><div class='add'>+		.xprtsec = clp-&gt;cl_xprtsec,</div><div class='add'>+		.nconnect = clp-&gt;cl_nconnect,</div><div class='add'>+		.max_connect = clp-&gt;cl_max_connect,</div><div class='add'>+	};</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='ctx'> 	error = rpc_switch_client_transport(clnt, &amp;xargs, clnt-&gt;cl_timeout);</div><div class='hunk'>@@ -1332,10 +1354,7 @@ int nfs4_update_server(struct nfs_server *server, const char *hostname,</div><div class='ctx'> </div><div class='ctx'> 	nfs_server_remove_lists(server);</div><div class='ctx'> 	set_bit(NFS_MIG_TSM_POSSIBLE, &amp;server-&gt;mig_status);</div><div class='del'>-	error = nfs4_set_client(server, hostname, sap, salen, buf,</div><div class='del'>-				clp-&gt;cl_proto, clnt-&gt;cl_timeout,</div><div class='del'>-				clp-&gt;cl_minorversion,</div><div class='del'>-				clp-&gt;cl_nconnect, clp-&gt;cl_max_connect, net);</div><div class='add'>+	error = nfs4_set_client(server, &amp;cl_init);</div><div class='ctx'> 	clear_bit(NFS_MIG_TSM_POSSIBLE, &amp;server-&gt;mig_status);</div><div class='ctx'> 	if (error != 0) {</div><div class='ctx'> 		nfs_server_insert_lists(server);</div><div class='hunk'>@@ -1343,8 +1362,11 @@ int nfs4_update_server(struct nfs_server *server, const char *hostname,</div><div class='ctx'> 	}</div><div class='ctx'> 	nfs_put_client(clp);</div><div class='ctx'> </div><div class='del'>-	if (server-&gt;nfs_client-&gt;cl_hostname == NULL)</div><div class='add'>+	if (server-&gt;nfs_client-&gt;cl_hostname == NULL) {</div><div class='ctx'> 		server-&gt;nfs_client-&gt;cl_hostname = kstrdup(hostname, GFP_KERNEL);</div><div class='add'>+		if (server-&gt;nfs_client-&gt;cl_hostname == NULL)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+	}</div><div class='ctx'> 	nfs_server_insert_lists(server);</div><div class='ctx'> </div><div class='ctx'> 	return nfs_probe_server(server, NFS_FH(d_inode(server-&gt;super-&gt;s_root)));</div><div class='head'>diff --git a/fs/nfs/nfs4file.c b/fs/nfs/nfs4file.c<br/>index e79ae4cbc395..7317f26892c5 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4file.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4file.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4file.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfs4file.c</a></div><div class='hunk'>@@ -10,6 +10,7 @@</div><div class='ctx'> #include &lt;linux/mount.h&gt;</div><div class='ctx'> #include &lt;linux/nfs_fs.h&gt;</div><div class='ctx'> #include &lt;linux/nfs_ssc.h&gt;</div><div class='add'>+#include &lt;linux/splice.h&gt;</div><div class='ctx'> #include "delegation.h"</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> #include "iostat.h"</div><div class='hunk'>@@ -50,16 +51,14 @@ nfs4_file_open(struct inode *inode, struct file *filp)</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	if ((openflags &amp; O_ACCMODE) == 3)</div><div class='del'>-		return nfs_open(inode, filp);</div><div class='del'>-</div><div class='ctx'> 	/* We can't create new files here */</div><div class='ctx'> 	openflags &amp;= ~(O_CREAT|O_EXCL);</div><div class='ctx'> </div><div class='ctx'> 	parent = dget_parent(dentry);</div><div class='ctx'> 	dir = d_inode(parent);</div><div class='ctx'> </div><div class='del'>-	ctx = alloc_nfs_open_context(file_dentry(filp), filp-&gt;f_mode, filp);</div><div class='add'>+	ctx = alloc_nfs_open_context(file_dentry(filp),</div><div class='add'>+				     flags_to_mode(openflags), filp);</div><div class='ctx'> 	err = PTR_ERR(ctx);</div><div class='ctx'> 	if (IS_ERR(ctx))</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -91,6 +90,7 @@ nfs4_file_open(struct inode *inode, struct file *filp)</div><div class='ctx'> 	nfs_file_set_open_context(filp, ctx);</div><div class='ctx'> 	nfs_fscache_open_file(inode, filp);</div><div class='ctx'> 	err = 0;</div><div class='add'>+	filp-&gt;f_mode |= FMODE_CAN_ODIRECT;</div><div class='ctx'> </div><div class='ctx'> out_put_ctx:</div><div class='ctx'> 	put_nfs_open_context(ctx);</div><div class='hunk'>@@ -165,7 +165,7 @@ retry:</div><div class='ctx'> 		if (sync)</div><div class='ctx'> 			return -EOPNOTSUPP;</div><div class='ctx'> 		cn_resp = kzalloc(sizeof(struct nfs42_copy_notify_res),</div><div class='del'>-				GFP_NOFS);</div><div class='add'>+				  GFP_KERNEL);</div><div class='ctx'> 		if (unlikely(cn_resp == NULL))</div><div class='ctx'> 			return -ENOMEM;</div><div class='ctx'> </div><div class='hunk'>@@ -180,8 +180,8 @@ retry:</div><div class='ctx'> 	ret = nfs42_proc_copy(file_in, pos_in, file_out, pos_out, count,</div><div class='ctx'> 				nss, cnrs, sync);</div><div class='ctx'> out:</div><div class='del'>-	if (!nfs42_files_from_same_server(file_in, file_out))</div><div class='del'>-		kfree(cn_resp);</div><div class='add'>+	kfree(cn_resp);</div><div class='add'>+</div><div class='ctx'> 	if (ret == -EAGAIN)</div><div class='ctx'> 		goto retry;</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -196,8 +196,8 @@ static ssize_t nfs4_copy_file_range(struct file *file_in, loff_t pos_in,</div><div class='ctx'> 	ret = __nfs4_copy_file_range(file_in, pos_in, file_out, pos_out, count,</div><div class='ctx'> 				     flags);</div><div class='ctx'> 	if (ret == -EOPNOTSUPP || ret == -EXDEV)</div><div class='del'>-		ret = generic_copy_file_range(file_in, pos_in, file_out,</div><div class='del'>-					      pos_out, count, flags);</div><div class='add'>+		ret = splice_copy_file_range(file_in, pos_in, file_out,</div><div class='add'>+					     pos_out, count);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -225,8 +225,14 @@ static long nfs42_fallocate(struct file *filep, int mode, loff_t offset, loff_t</div><div class='ctx'> 	if (!S_ISREG(inode-&gt;i_mode))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='del'>-	if ((mode != 0) &amp;&amp; (mode != (FALLOC_FL_PUNCH_HOLE | FALLOC_FL_KEEP_SIZE)))</div><div class='add'>+	switch (mode) {</div><div class='add'>+	case 0:</div><div class='add'>+	case FALLOC_FL_PUNCH_HOLE | FALLOC_FL_KEEP_SIZE:</div><div class='add'>+	case FALLOC_FL_ZERO_RANGE:</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	ret = inode_newsize_ok(inode, offset + len);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='hunk'>@@ -234,6 +240,8 @@ static long nfs42_fallocate(struct file *filep, int mode, loff_t offset, loff_t</div><div class='ctx'> </div><div class='ctx'> 	if (mode &amp; FALLOC_FL_PUNCH_HOLE)</div><div class='ctx'> 		return nfs42_proc_deallocate(filep, offset, len);</div><div class='add'>+	else if (mode &amp; FALLOC_FL_ZERO_RANGE)</div><div class='add'>+		return nfs42_proc_zero_range(filep, offset ,len);</div><div class='ctx'> 	return nfs42_proc_allocate(filep, offset, len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -245,7 +253,6 @@ static loff_t nfs42_remap_file_range(struct file *src_file, loff_t src_off,</div><div class='ctx'> 	struct nfs_server *server = NFS_SERVER(dst_inode);</div><div class='ctx'> 	struct inode *src_inode = file_inode(src_file);</div><div class='ctx'> 	unsigned int bs = server-&gt;clone_blksize;</div><div class='del'>-	bool same_inode = false;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	/* NFS does not support deduplication. */</div><div class='hunk'>@@ -267,25 +274,15 @@ static loff_t nfs42_remap_file_range(struct file *src_file, loff_t src_off,</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (src_inode == dst_inode)</div><div class='del'>-		same_inode = true;</div><div class='del'>-</div><div class='ctx'> 	/* XXX: do we lock at all? what if server needs CB_RECALL_LAYOUT? */</div><div class='del'>-	if (same_inode) {</div><div class='del'>-		inode_lock(src_inode);</div><div class='del'>-	} else if (dst_inode &lt; src_inode) {</div><div class='del'>-		inode_lock_nested(dst_inode, I_MUTEX_PARENT);</div><div class='del'>-		inode_lock_nested(src_inode, I_MUTEX_CHILD);</div><div class='del'>-	} else {</div><div class='del'>-		inode_lock_nested(src_inode, I_MUTEX_PARENT);</div><div class='del'>-		inode_lock_nested(dst_inode, I_MUTEX_CHILD);</div><div class='del'>-	}</div><div class='del'>-</div><div class='add'>+	lock_two_nondirectories(src_inode, dst_inode);</div><div class='ctx'> 	/* flush all pending writes on both src and dst so that server</div><div class='ctx'> 	 * has the latest data */</div><div class='add'>+	nfs_file_block_o_direct(NFS_I(src_inode));</div><div class='ctx'> 	ret = nfs_sync_inode(src_inode);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out_unlock;</div><div class='add'>+	nfs_file_block_o_direct(NFS_I(dst_inode));</div><div class='ctx'> 	ret = nfs_sync_inode(dst_inode);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out_unlock;</div><div class='hunk'>@@ -298,15 +295,7 @@ static loff_t nfs42_remap_file_range(struct file *src_file, loff_t src_off,</div><div class='ctx'> 		truncate_inode_pages_range(&amp;dst_inode-&gt;i_data, dst_off, dst_off + count - 1);</div><div class='ctx'> </div><div class='ctx'> out_unlock:</div><div class='del'>-	if (same_inode) {</div><div class='del'>-		inode_unlock(src_inode);</div><div class='del'>-	} else if (dst_inode &lt; src_inode) {</div><div class='del'>-		inode_unlock(src_inode);</div><div class='del'>-		inode_unlock(dst_inode);</div><div class='del'>-	} else {</div><div class='del'>-		inode_unlock(dst_inode);</div><div class='del'>-		inode_unlock(src_inode);</div><div class='del'>-	}</div><div class='add'>+	unlock_two_nondirectories(src_inode, dst_inode);</div><div class='ctx'> out:</div><div class='ctx'> 	return ret &lt; 0 ? ret : count;</div><div class='ctx'> }</div><div class='hunk'>@@ -326,7 +315,7 @@ static struct file *__nfs42_ssc_open(struct vfsmount *ss_mnt,</div><div class='ctx'> 	char *read_name = NULL;</div><div class='ctx'> 	int len, status = 0;</div><div class='ctx'> </div><div class='del'>-	server = NFS_SERVER(ss_mnt-&gt;mnt_root-&gt;d_inode);</div><div class='add'>+	server = NFS_SB(ss_mnt-&gt;mnt_sb);</div><div class='ctx'> </div><div class='ctx'> 	if (!fattr)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='hunk'>@@ -337,14 +326,19 @@ static struct file *__nfs42_ssc_open(struct vfsmount *ss_mnt,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (!S_ISREG(fattr-&gt;mode)) {</div><div class='add'>+		res = ERR_PTR(-EBADF);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	res = ERR_PTR(-ENOMEM);</div><div class='ctx'> 	len = strlen(SSC_READ_NAME_BODY) + 16;</div><div class='del'>-	read_name = kzalloc(len, GFP_NOFS);</div><div class='add'>+	read_name = kzalloc(len, GFP_KERNEL);</div><div class='ctx'> 	if (read_name == NULL)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	snprintf(read_name, len, SSC_READ_NAME_BODY, read_name_gen++);</div><div class='ctx'> </div><div class='del'>-	r_ino = nfs_fhget(ss_mnt-&gt;mnt_root-&gt;d_inode-&gt;i_sb, src_fh, fattr);</div><div class='add'>+	r_ino = nfs_fhget(ss_mnt-&gt;mnt_sb, src_fh, fattr);</div><div class='ctx'> 	if (IS_ERR(r_ino)) {</div><div class='ctx'> 		res = ERR_CAST(r_ino);</div><div class='ctx'> 		goto out_free_name;</div><div class='hunk'>@@ -354,11 +348,12 @@ static struct file *__nfs42_ssc_open(struct vfsmount *ss_mnt,</div><div class='ctx'> 				     r_ino-&gt;i_fop);</div><div class='ctx'> 	if (IS_ERR(filep)) {</div><div class='ctx'> 		res = ERR_CAST(filep);</div><div class='add'>+		iput(r_ino);</div><div class='ctx'> 		goto out_free_name;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ctx = alloc_nfs_open_context(filep-&gt;f_path.dentry, filep-&gt;f_mode,</div><div class='del'>-					filep);</div><div class='add'>+	ctx = alloc_nfs_open_context(filep-&gt;f_path.dentry,</div><div class='add'>+				     flags_to_mode(filep-&gt;f_flags), filep);</div><div class='ctx'> 	if (IS_ERR(ctx)) {</div><div class='ctx'> 		res = ERR_CAST(ctx);</div><div class='ctx'> 		goto out_filep;</div><div class='hunk'>@@ -433,23 +428,25 @@ void nfs42_ssc_unregister_ops(void)</div><div class='ctx'> }</div><div class='ctx'> #endif /* CONFIG_NFS_V4_2 */</div><div class='ctx'> </div><div class='del'>-static int nfs4_setlease(struct file *file, long arg, struct file_lock **lease,</div><div class='add'>+static int nfs4_setlease(struct file *file, int arg, struct file_lease **lease,</div><div class='ctx'> 			 void **priv)</div><div class='ctx'> {</div><div class='add'>+	if (!S_ISREG(file_inode(file)-&gt;i_mode))</div><div class='add'>+		return -EINVAL;</div><div class='ctx'> 	return nfs4_proc_setlease(file, arg, lease, priv);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct file_operations nfs4_file_operations = {</div><div class='ctx'> 	.read_iter	= nfs_file_read,</div><div class='ctx'> 	.write_iter	= nfs_file_write,</div><div class='del'>-	.mmap		= nfs_file_mmap,</div><div class='add'>+	.mmap_prepare	= nfs_file_mmap_prepare,</div><div class='ctx'> 	.open		= nfs4_file_open,</div><div class='ctx'> 	.flush		= nfs4_file_flush,</div><div class='ctx'> 	.release	= nfs_file_release,</div><div class='ctx'> 	.fsync		= nfs_file_fsync,</div><div class='ctx'> 	.lock		= nfs_lock,</div><div class='ctx'> 	.flock		= nfs_flock,</div><div class='del'>-	.splice_read	= generic_file_splice_read,</div><div class='add'>+	.splice_read	= nfs_file_splice_read,</div><div class='ctx'> 	.splice_write	= iter_file_splice_write,</div><div class='ctx'> 	.check_flags	= nfs_check_flags,</div><div class='ctx'> 	.setlease	= nfs4_setlease,</div><div class='hunk'>@@ -461,4 +458,5 @@ const struct file_operations nfs4_file_operations = {</div><div class='ctx'> #else</div><div class='ctx'> 	.llseek		= nfs_file_llseek,</div><div class='ctx'> #endif</div><div class='add'>+	.fop_flags	= FOP_DONTCACHE,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/nfs/nfs4getroot.c b/fs/nfs/nfs4getroot.c<br/>index 1a69479a3a59..e67ea345de69 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4getroot.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4getroot.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4getroot.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfs4getroot.c</a></div><div class='hunk'>@@ -12,30 +12,28 @@</div><div class='ctx'> </div><div class='ctx'> int nfs4_get_rootfh(struct nfs_server *server, struct nfs_fh *mntfh, bool auth_probe)</div><div class='ctx'> {</div><div class='del'>-	struct nfs_fsinfo fsinfo;</div><div class='add'>+	struct nfs_fattr *fattr = nfs_alloc_fattr();</div><div class='ctx'> 	int ret = -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	fsinfo.fattr = nfs_alloc_fattr();</div><div class='del'>-	if (fsinfo.fattr == NULL)</div><div class='add'>+	if (fattr == NULL)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	/* Start by getting the root filehandle from the server */</div><div class='del'>-	ret = nfs4_proc_get_rootfh(server, mntfh, &amp;fsinfo, auth_probe);</div><div class='add'>+	ret = nfs4_proc_get_rootfh(server, mntfh, fattr, auth_probe);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='ctx'> 		dprintk("nfs4_get_rootfh: getroot error = %d\n", -ret);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!(fsinfo.fattr-&gt;valid &amp; NFS_ATTR_FATTR_TYPE)</div><div class='del'>-			|| !S_ISDIR(fsinfo.fattr-&gt;mode)) {</div><div class='add'>+	if (!(fattr-&gt;valid &amp; NFS_ATTR_FATTR_TYPE) || !S_ISDIR(fattr-&gt;mode)) {</div><div class='ctx'> 		printk(KERN_ERR "nfs4_get_rootfh:"</div><div class='ctx'> 		       " getroot encountered non-directory\n");</div><div class='ctx'> 		ret = -ENOTDIR;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	memcpy(&amp;server-&gt;fsid, &amp;fsinfo.fattr-&gt;fsid, sizeof(server-&gt;fsid));</div><div class='add'>+	memcpy(&amp;server-&gt;fsid, &amp;fattr-&gt;fsid, sizeof(server-&gt;fsid));</div><div class='ctx'> out:</div><div class='del'>-	nfs_free_fattr(fsinfo.fattr);</div><div class='add'>+	nfs_free_fattr(fattr);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/nfs/nfs4idmap.c b/fs/nfs/nfs4idmap.c<br/>index f331866dd418..9e1c48c5c0b8 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4idmap.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4idmap.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4idmap.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfs4idmap.c</a></div><div class='hunk'>@@ -203,7 +203,7 @@ int nfs_idmap_init(void)</div><div class='ctx'> 	printk(KERN_NOTICE "NFS: Registering the %s key type\n",</div><div class='ctx'> 		key_type_id_resolver.name);</div><div class='ctx'> </div><div class='del'>-	cred = prepare_kernel_cred(NULL);</div><div class='add'>+	cred = prepare_kernel_cred(&amp;init_task);</div><div class='ctx'> 	if (!cred)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='hunk'>@@ -306,15 +306,12 @@ static ssize_t nfs_idmap_get_key(const char *name, size_t namelen,</div><div class='ctx'> 				 const char *type, void *data,</div><div class='ctx'> 				 size_t data_size, struct idmap *idmap)</div><div class='ctx'> {</div><div class='del'>-	const struct cred *saved_cred;</div><div class='ctx'> 	struct key *rkey;</div><div class='ctx'> 	const struct user_key_payload *payload;</div><div class='ctx'> 	ssize_t ret;</div><div class='ctx'> </div><div class='del'>-	saved_cred = override_creds(id_resolver_cache);</div><div class='del'>-	rkey = nfs_idmap_request_key(name, namelen, type, idmap);</div><div class='del'>-	revert_creds(saved_cred);</div><div class='del'>-</div><div class='add'>+	scoped_with_creds(id_resolver_cache)</div><div class='add'>+		rkey = nfs_idmap_request_key(name, namelen, type, idmap);</div><div class='ctx'> 	if (IS_ERR(rkey)) {</div><div class='ctx'> 		ret = PTR_ERR(rkey);</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -424,26 +421,16 @@ static void nfs_idmap_pipe_destroy(struct dentry *dir,</div><div class='ctx'> 		struct rpc_pipe_dir_object *pdo)</div><div class='ctx'> {</div><div class='ctx'> 	struct idmap *idmap = pdo-&gt;pdo_data;</div><div class='del'>-	struct rpc_pipe *pipe = idmap-&gt;idmap_pipe;</div><div class='ctx'> </div><div class='del'>-	if (pipe-&gt;dentry) {</div><div class='del'>-		rpc_unlink(pipe-&gt;dentry);</div><div class='del'>-		pipe-&gt;dentry = NULL;</div><div class='del'>-	}</div><div class='add'>+	rpc_unlink(idmap-&gt;idmap_pipe);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int nfs_idmap_pipe_create(struct dentry *dir,</div><div class='ctx'> 		struct rpc_pipe_dir_object *pdo)</div><div class='ctx'> {</div><div class='ctx'> 	struct idmap *idmap = pdo-&gt;pdo_data;</div><div class='del'>-	struct rpc_pipe *pipe = idmap-&gt;idmap_pipe;</div><div class='del'>-	struct dentry *dentry;</div><div class='ctx'> </div><div class='del'>-	dentry = rpc_mkpipe_dentry(dir, "idmap", idmap, pipe);</div><div class='del'>-	if (IS_ERR(dentry))</div><div class='del'>-		return PTR_ERR(dentry);</div><div class='del'>-	pipe-&gt;dentry = dentry;</div><div class='del'>-	return 0;</div><div class='add'>+	return rpc_mkpipe_dentry(dir, "idmap", idmap, idmap-&gt;idmap_pipe);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct rpc_pipe_dir_object_ops nfs_idmap_pipe_dir_object_ops = {</div><div class='hunk'>@@ -561,22 +548,20 @@ nfs_idmap_prepare_pipe_upcall(struct idmap *idmap,</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void</div><div class='del'>-nfs_idmap_complete_pipe_upcall_locked(struct idmap *idmap, int ret)</div><div class='add'>+static void nfs_idmap_complete_pipe_upcall(struct idmap_legacy_upcalldata *data,</div><div class='add'>+					   int ret)</div><div class='ctx'> {</div><div class='del'>-	struct key *authkey = idmap-&gt;idmap_upcall_data-&gt;authkey;</div><div class='del'>-</div><div class='del'>-	kfree(idmap-&gt;idmap_upcall_data);</div><div class='del'>-	idmap-&gt;idmap_upcall_data = NULL;</div><div class='del'>-	complete_request_key(authkey, ret);</div><div class='del'>-	key_put(authkey);</div><div class='add'>+	complete_request_key(data-&gt;authkey, ret);</div><div class='add'>+	key_put(data-&gt;authkey);</div><div class='add'>+	kfree(data);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void</div><div class='del'>-nfs_idmap_abort_pipe_upcall(struct idmap *idmap, int ret)</div><div class='add'>+static void nfs_idmap_abort_pipe_upcall(struct idmap *idmap,</div><div class='add'>+					struct idmap_legacy_upcalldata *data,</div><div class='add'>+					int ret)</div><div class='ctx'> {</div><div class='del'>-	if (idmap-&gt;idmap_upcall_data != NULL)</div><div class='del'>-		nfs_idmap_complete_pipe_upcall_locked(idmap, ret);</div><div class='add'>+	if (cmpxchg(&amp;idmap-&gt;idmap_upcall_data, data, NULL) == data)</div><div class='add'>+		nfs_idmap_complete_pipe_upcall(data, ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int nfs_idmap_legacy_upcall(struct key *authkey, void *aux)</div><div class='hunk'>@@ -585,7 +570,7 @@ static int nfs_idmap_legacy_upcall(struct key *authkey, void *aux)</div><div class='ctx'> 	struct request_key_auth *rka = get_request_key_auth(authkey);</div><div class='ctx'> 	struct rpc_pipe_msg *msg;</div><div class='ctx'> 	struct idmap_msg *im;</div><div class='del'>-	struct idmap *idmap = (struct idmap *)aux;</div><div class='add'>+	struct idmap *idmap = aux;</div><div class='ctx'> 	struct key *key = rka-&gt;target_key;</div><div class='ctx'> 	int ret = -ENOKEY;</div><div class='ctx'> </div><div class='hunk'>@@ -613,7 +598,7 @@ static int nfs_idmap_legacy_upcall(struct key *authkey, void *aux)</div><div class='ctx'> </div><div class='ctx'> 	ret = rpc_queue_upcall(idmap-&gt;idmap_pipe, msg);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='del'>-		nfs_idmap_abort_pipe_upcall(idmap, ret);</div><div class='add'>+		nfs_idmap_abort_pipe_upcall(idmap, data, ret);</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> out2:</div><div class='hunk'>@@ -669,6 +654,7 @@ idmap_pipe_downcall(struct file *filp, const char __user *src, size_t mlen)</div><div class='ctx'> 	struct request_key_auth *rka;</div><div class='ctx'> 	struct rpc_inode *rpci = RPC_I(file_inode(filp));</div><div class='ctx'> 	struct idmap *idmap = (struct idmap *)rpci-&gt;private;</div><div class='add'>+	struct idmap_legacy_upcalldata *data;</div><div class='ctx'> 	struct key *authkey;</div><div class='ctx'> 	struct idmap_msg im;</div><div class='ctx'> 	size_t namelen_in;</div><div class='hunk'>@@ -678,10 +664,11 @@ idmap_pipe_downcall(struct file *filp, const char __user *src, size_t mlen)</div><div class='ctx'> 	 * will have been woken up and someone else may now have used</div><div class='ctx'> 	 * idmap_key_cons - so after this point we may no longer touch it.</div><div class='ctx'> 	 */</div><div class='del'>-	if (idmap-&gt;idmap_upcall_data == NULL)</div><div class='add'>+	data = xchg(&amp;idmap-&gt;idmap_upcall_data, NULL);</div><div class='add'>+	if (data == NULL)</div><div class='ctx'> 		goto out_noupcall;</div><div class='ctx'> </div><div class='del'>-	authkey = idmap-&gt;idmap_upcall_data-&gt;authkey;</div><div class='add'>+	authkey = data-&gt;authkey;</div><div class='ctx'> 	rka = get_request_key_auth(authkey);</div><div class='ctx'> </div><div class='ctx'> 	if (mlen != sizeof(im)) {</div><div class='hunk'>@@ -703,18 +690,17 @@ idmap_pipe_downcall(struct file *filp, const char __user *src, size_t mlen)</div><div class='ctx'> 	if (namelen_in == 0 || namelen_in == IDMAP_NAMESZ) {</div><div class='ctx'> 		ret = -EINVAL;</div><div class='ctx'> 		goto out;</div><div class='del'>-}</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	ret = nfs_idmap_read_and_verify_message(&amp;im,</div><div class='del'>-			&amp;idmap-&gt;idmap_upcall_data-&gt;idmap_msg,</div><div class='del'>-			rka-&gt;target_key, authkey);</div><div class='add'>+	ret = nfs_idmap_read_and_verify_message(&amp;im, &amp;data-&gt;idmap_msg,</div><div class='add'>+						rka-&gt;target_key, authkey);</div><div class='ctx'> 	if (ret &gt;= 0) {</div><div class='ctx'> 		key_set_timeout(rka-&gt;target_key, nfs_idmap_cache_timeout);</div><div class='ctx'> 		ret = mlen;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	nfs_idmap_complete_pipe_upcall_locked(idmap, ret);</div><div class='add'>+	nfs_idmap_complete_pipe_upcall(data, ret);</div><div class='ctx'> out_noupcall:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -728,7 +714,7 @@ idmap_pipe_destroy_msg(struct rpc_pipe_msg *msg)</div><div class='ctx'> 	struct idmap *idmap = data-&gt;idmap;</div><div class='ctx'> </div><div class='ctx'> 	if (msg-&gt;errno)</div><div class='del'>-		nfs_idmap_abort_pipe_upcall(idmap, msg-&gt;errno);</div><div class='add'>+		nfs_idmap_abort_pipe_upcall(idmap, data, msg-&gt;errno);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='hunk'>@@ -736,8 +722,11 @@ idmap_release_pipe(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct rpc_inode *rpci = RPC_I(inode);</div><div class='ctx'> 	struct idmap *idmap = (struct idmap *)rpci-&gt;private;</div><div class='add'>+	struct idmap_legacy_upcalldata *data;</div><div class='ctx'> </div><div class='del'>-	nfs_idmap_abort_pipe_upcall(idmap, -EPIPE);</div><div class='add'>+	data = xchg(&amp;idmap-&gt;idmap_upcall_data, NULL);</div><div class='add'>+	if (data)</div><div class='add'>+		nfs_idmap_complete_pipe_upcall(data, -EPIPE);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int nfs_map_name_to_uid(const struct nfs_server *server, const char *name, size_t namelen, kuid_t *uid)</div><div class='head'>diff --git a/fs/nfs/nfs4namespace.c b/fs/nfs/nfs4namespace.c<br/>index 873342308dc0..9a98595bb160 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4namespace.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4namespace.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4namespace.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfs4namespace.c</a></div><div class='hunk'>@@ -164,16 +164,22 @@ static int nfs4_validate_fspath(struct dentry *dentry,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static size_t nfs_parse_server_name(char *string, size_t len,</div><div class='del'>-		struct sockaddr *sa, size_t salen, struct net *net)</div><div class='add'>+size_t nfs_parse_server_name(char *string, size_t len, struct sockaddr_storage *ss,</div><div class='add'>+			     size_t salen, struct net *net, int port)</div><div class='ctx'> {</div><div class='add'>+	struct sockaddr *sa = (struct sockaddr *)ss;</div><div class='ctx'> 	ssize_t ret;</div><div class='ctx'> </div><div class='ctx'> 	ret = rpc_pton(net, string, len, sa, salen);</div><div class='ctx'> 	if (ret == 0) {</div><div class='del'>-		ret = nfs_dns_resolve_name(net, string, len, sa, salen);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			ret = 0;</div><div class='add'>+		ret = rpc_uaddr2sockaddr(net, string, len, sa, salen);</div><div class='add'>+		if (ret == 0) {</div><div class='add'>+			ret = nfs_dns_resolve_name(net, string, len, ss, salen);</div><div class='add'>+			if (ret &lt; 0)</div><div class='add'>+				ret = 0;</div><div class='add'>+		}</div><div class='add'>+	} else if (port) {</div><div class='add'>+		rpc_set_port(sa, port);</div><div class='ctx'> 	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -326,9 +332,9 @@ static int try_location(struct fs_context *fc,</div><div class='ctx'> </div><div class='ctx'> 		ctx-&gt;nfs_server.addrlen =</div><div class='ctx'> 			nfs_parse_server_name(buf-&gt;data, buf-&gt;len,</div><div class='del'>-					      &amp;ctx-&gt;nfs_server.address,</div><div class='add'>+					      &amp;ctx-&gt;nfs_server._address,</div><div class='ctx'> 					      sizeof(ctx-&gt;nfs_server._address),</div><div class='del'>-					      fc-&gt;net_ns);</div><div class='add'>+					      fc-&gt;net_ns, 0);</div><div class='ctx'> 		if (ctx-&gt;nfs_server.addrlen == 0)</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='hunk'>@@ -412,6 +418,9 @@ static int nfs_do_refmount(struct fs_context *fc, struct rpc_clnt *client)</div><div class='ctx'> 	fs_locations = kmalloc(sizeof(struct nfs4_fs_locations), GFP_KERNEL);</div><div class='ctx'> 	if (!fs_locations)</div><div class='ctx'> 		goto out_free;</div><div class='add'>+	fs_locations-&gt;fattr = nfs_alloc_fattr();</div><div class='add'>+	if (!fs_locations-&gt;fattr)</div><div class='add'>+		goto out_free_2;</div><div class='ctx'> </div><div class='ctx'> 	/* Get locations */</div><div class='ctx'> 	dentry = ctx-&gt;clone_data.dentry;</div><div class='hunk'>@@ -422,14 +431,16 @@ static int nfs_do_refmount(struct fs_context *fc, struct rpc_clnt *client)</div><div class='ctx'> 	err = nfs4_proc_fs_locations(client, d_inode(parent), &amp;dentry-&gt;d_name, fs_locations, page);</div><div class='ctx'> 	dput(parent);</div><div class='ctx'> 	if (err != 0)</div><div class='del'>-		goto out_free_2;</div><div class='add'>+		goto out_free_3;</div><div class='ctx'> </div><div class='ctx'> 	err = -ENOENT;</div><div class='ctx'> 	if (fs_locations-&gt;nlocations &lt;= 0 ||</div><div class='ctx'> 	    fs_locations-&gt;fs_path.ncomponents &lt;= 0)</div><div class='del'>-		goto out_free_2;</div><div class='add'>+		goto out_free_3;</div><div class='ctx'> </div><div class='ctx'> 	err = nfs_follow_referral(fc, fs_locations);</div><div class='add'>+out_free_3:</div><div class='add'>+	kfree(fs_locations-&gt;fattr);</div><div class='ctx'> out_free_2:</div><div class='ctx'> 	kfree(fs_locations);</div><div class='ctx'> out_free:</div><div class='hunk'>@@ -473,14 +484,13 @@ static int nfs4_try_replacing_one_location(struct nfs_server *server,</div><div class='ctx'> 		char *page, char *page2,</div><div class='ctx'> 		const struct nfs4_fs_location *location)</div><div class='ctx'> {</div><div class='del'>-	const size_t addr_bufsize = sizeof(struct sockaddr_storage);</div><div class='ctx'> 	struct net *net = rpc_net_ns(server-&gt;client);</div><div class='del'>-	struct sockaddr *sap;</div><div class='add'>+	struct sockaddr_storage *sap;</div><div class='ctx'> 	unsigned int s;</div><div class='ctx'> 	size_t salen;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	sap = kmalloc(addr_bufsize, GFP_KERNEL);</div><div class='add'>+	sap = kmalloc(sizeof(*sap), GFP_KERNEL);</div><div class='ctx'> 	if (sap == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='hunk'>@@ -496,10 +506,10 @@ static int nfs4_try_replacing_one_location(struct nfs_server *server,</div><div class='ctx'> 			continue;</div><div class='ctx'> </div><div class='ctx'> 		salen = nfs_parse_server_name(buf-&gt;data, buf-&gt;len,</div><div class='del'>-						sap, addr_bufsize, net);</div><div class='add'>+					      sap, sizeof(*sap), net, 0);</div><div class='ctx'> 		if (salen == 0)</div><div class='ctx'> 			continue;</div><div class='del'>-		rpc_set_port(sap, NFS_PORT);</div><div class='add'>+		rpc_set_port((struct sockaddr *)sap, NFS_PORT);</div><div class='ctx'> </div><div class='ctx'> 		error = -ENOMEM;</div><div class='ctx'> 		hostname = kmemdup_nul(buf-&gt;data, buf-&gt;len, GFP_KERNEL);</div><div class='head'>diff --git a/fs/nfs/nfs4proc.c b/fs/nfs/nfs4proc.c<br/>index ee3bc79f6ca3..93c6ce04332b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4proc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4proc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4proc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfs4proc.c</a></div><div class='hunk'>@@ -103,21 +103,18 @@ static struct rpc_task *_nfs41_proc_sequence(struct nfs_client *clp,</div><div class='ctx'> 		const struct cred *cred,</div><div class='ctx'> 		struct nfs4_slot *slot,</div><div class='ctx'> 		bool is_privileged);</div><div class='del'>-static int nfs41_test_stateid(struct nfs_server *, nfs4_stateid *,</div><div class='del'>-		const struct cred *);</div><div class='del'>-static int nfs41_free_stateid(struct nfs_server *, const nfs4_stateid *,</div><div class='del'>-		const struct cred *, bool);</div><div class='add'>+static int nfs41_test_stateid(struct nfs_server *, const nfs4_stateid *,</div><div class='add'>+			      const struct cred *);</div><div class='add'>+static int nfs41_free_stateid(struct nfs_server *, nfs4_stateid *,</div><div class='add'>+			      const struct cred *, bool);</div><div class='ctx'> #endif</div><div class='del'>-static void nfs4_bitmask_set(__u32 bitmask[NFS4_BITMASK_SZ],</div><div class='del'>-			     const __u32 *src, struct inode *inode,</div><div class='del'>-			     struct nfs_server *server,</div><div class='del'>-			     struct nfs4_label *label);</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_NFS_V4_SECURITY_LABEL</div><div class='ctx'> static inline struct nfs4_label *</div><div class='ctx'> nfs4_label_init_security(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	struct iattr *sattr, struct nfs4_label *label)</div><div class='ctx'> {</div><div class='add'>+	struct lsm_context shim;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (label == NULL)</div><div class='hunk'>@@ -126,19 +123,32 @@ nfs4_label_init_security(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	if (nfs_server_capable(dir, NFS_CAP_SECURITY_LABEL) == 0)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='add'>+	label-&gt;lfs = 0;</div><div class='add'>+	label-&gt;pi = 0;</div><div class='add'>+	label-&gt;len = 0;</div><div class='add'>+	label-&gt;label = NULL;</div><div class='add'>+</div><div class='ctx'> 	err = security_dentry_init_security(dentry, sattr-&gt;ia_mode,</div><div class='del'>-				&amp;dentry-&gt;d_name, NULL,</div><div class='del'>-				(void **)&amp;label-&gt;label, &amp;label-&gt;len);</div><div class='del'>-	if (err == 0)</div><div class='del'>-		return label;</div><div class='add'>+				&amp;dentry-&gt;d_name, NULL, &amp;shim);</div><div class='add'>+	if (err)</div><div class='add'>+		return NULL;</div><div class='ctx'> </div><div class='del'>-	return NULL;</div><div class='add'>+	label-&gt;lsmid = shim.id;</div><div class='add'>+	label-&gt;label = shim.context;</div><div class='add'>+	label-&gt;len = shim.len;</div><div class='add'>+	return label;</div><div class='ctx'> }</div><div class='ctx'> static inline void</div><div class='ctx'> nfs4_label_release_security(struct nfs4_label *label)</div><div class='ctx'> {</div><div class='del'>-	if (label)</div><div class='del'>-		security_release_secctx(label-&gt;label, label-&gt;len);</div><div class='add'>+	struct lsm_context shim;</div><div class='add'>+</div><div class='add'>+	if (label) {</div><div class='add'>+		shim.context = label-&gt;label;</div><div class='add'>+		shim.len = label-&gt;len;</div><div class='add'>+		shim.id = label-&gt;lsmid;</div><div class='add'>+		security_release_secctx(&amp;shim);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> static inline u32 *nfs4_bitmask(struct nfs_server *server, struct nfs4_label *label)</div><div class='ctx'> {</div><div class='hunk'>@@ -169,6 +179,7 @@ static int nfs4_map_errors(int err)</div><div class='ctx'> 	case -NFS4ERR_RESOURCE:</div><div class='ctx'> 	case -NFS4ERR_LAYOUTTRYLATER:</div><div class='ctx'> 	case -NFS4ERR_RECALLCONFLICT:</div><div class='add'>+	case -NFS4ERR_RETURNCONFLICT:</div><div class='ctx'> 		return -EREMOTEIO;</div><div class='ctx'> 	case -NFS4ERR_WRONGSEC:</div><div class='ctx'> 	case -NFS4ERR_WRONG_CRED:</div><div class='hunk'>@@ -184,6 +195,9 @@ static int nfs4_map_errors(int err)</div><div class='ctx'> 		return -EBUSY;</div><div class='ctx'> 	case -NFS4ERR_NOT_SAME:</div><div class='ctx'> 		return -ENOTSYNC;</div><div class='add'>+	case -ENETDOWN:</div><div class='add'>+	case -ENETUNREACH:</div><div class='add'>+		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		dprintk("%s could not handle NFSv4 error %d\n",</div><div class='ctx'> 				__func__, -err);</div><div class='hunk'>@@ -208,6 +222,7 @@ const u32 nfs4_fattr_bitmap[3] = {</div><div class='ctx'> 	| FATTR4_WORD1_RAWDEV</div><div class='ctx'> 	| FATTR4_WORD1_SPACE_USED</div><div class='ctx'> 	| FATTR4_WORD1_TIME_ACCESS</div><div class='add'>+	| FATTR4_WORD1_TIME_CREATE</div><div class='ctx'> 	| FATTR4_WORD1_TIME_METADATA</div><div class='ctx'> 	| FATTR4_WORD1_TIME_MODIFY</div><div class='ctx'> 	| FATTR4_WORD1_MOUNTED_ON_FILEID,</div><div class='hunk'>@@ -229,6 +244,7 @@ static const u32 nfs4_pnfs_open_bitmap[3] = {</div><div class='ctx'> 	| FATTR4_WORD1_RAWDEV</div><div class='ctx'> 	| FATTR4_WORD1_SPACE_USED</div><div class='ctx'> 	| FATTR4_WORD1_TIME_ACCESS</div><div class='add'>+	| FATTR4_WORD1_TIME_CREATE</div><div class='ctx'> 	| FATTR4_WORD1_TIME_METADATA</div><div class='ctx'> 	| FATTR4_WORD1_TIME_MODIFY,</div><div class='ctx'> 	FATTR4_WORD2_MDSTHRESHOLD</div><div class='hunk'>@@ -291,7 +307,7 @@ static void nfs4_bitmap_copy_adjust(__u32 *dst, const __u32 *src,</div><div class='ctx'> 	unsigned long cache_validity;</div><div class='ctx'> </div><div class='ctx'> 	memcpy(dst, src, NFS4_BITMASK_SZ*sizeof(*dst));</div><div class='del'>-	if (!inode || !nfs4_have_delegation(inode, FMODE_READ))</div><div class='add'>+	if (!inode || !nfs_have_read_or_write_delegation(inode))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	cache_validity = READ_ONCE(NFS_I(inode)-&gt;cache_validity) | flags;</div><div class='hunk'>@@ -308,6 +324,21 @@ static void nfs4_bitmap_copy_adjust(__u32 *dst, const __u32 *src,</div><div class='ctx'> 		dst[1] &amp;= ~FATTR4_WORD1_MODE;</div><div class='ctx'> 	if (!(cache_validity &amp; NFS_INO_INVALID_OTHER))</div><div class='ctx'> 		dst[1] &amp;= ~(FATTR4_WORD1_OWNER | FATTR4_WORD1_OWNER_GROUP);</div><div class='add'>+</div><div class='add'>+	if (!(cache_validity &amp; NFS_INO_INVALID_BTIME))</div><div class='add'>+		dst[1] &amp;= ~FATTR4_WORD1_TIME_CREATE;</div><div class='add'>+</div><div class='add'>+	if (nfs_have_delegated_mtime(inode)) {</div><div class='add'>+		if (!(cache_validity &amp; NFS_INO_INVALID_ATIME))</div><div class='add'>+			dst[1] &amp;= ~(FATTR4_WORD1_TIME_ACCESS|FATTR4_WORD1_TIME_ACCESS_SET);</div><div class='add'>+		if (!(cache_validity &amp; NFS_INO_INVALID_MTIME))</div><div class='add'>+			dst[1] &amp;= ~(FATTR4_WORD1_TIME_MODIFY|FATTR4_WORD1_TIME_MODIFY_SET);</div><div class='add'>+		if (!(cache_validity &amp; NFS_INO_INVALID_CTIME))</div><div class='add'>+			dst[1] &amp;= ~(FATTR4_WORD1_TIME_METADATA|FATTR4_WORD1_TIME_MODIFY_SET);</div><div class='add'>+	} else if (nfs_have_delegated_atime(inode)) {</div><div class='add'>+		if (!(cache_validity &amp; NFS_INO_INVALID_ATIME))</div><div class='add'>+			dst[1] &amp;= ~(FATTR4_WORD1_TIME_ACCESS|FATTR4_WORD1_TIME_ACCESS_SET);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void nfs4_setup_readdir(u64 cookie, __be32 *verifier, struct dentry *dentry,</div><div class='hunk'>@@ -360,13 +391,23 @@ static void nfs4_setup_readdir(u64 cookie, __be32 *verifier, struct dentry *dent</div><div class='ctx'> 	*p++ = htonl(attrs);                           /* bitmap */</div><div class='ctx'> 	*p++ = htonl(12);             /* attribute buffer length */</div><div class='ctx'> 	*p++ = htonl(NF4DIR);</div><div class='add'>+	spin_lock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 	p = xdr_encode_hyper(p, NFS_FILEID(d_inode(dentry-&gt;d_parent)));</div><div class='add'>+	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> </div><div class='ctx'> 	readdir-&gt;pgbase = (char *)p - (char *)start;</div><div class='ctx'> 	readdir-&gt;count -= readdir-&gt;pgbase;</div><div class='ctx'> 	kunmap_atomic(start);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void nfs4_fattr_set_prechange(struct nfs_fattr *fattr, u64 version)</div><div class='add'>+{</div><div class='add'>+	if (!(fattr-&gt;valid &amp; NFS_ATTR_FATTR_PRECHANGE)) {</div><div class='add'>+		fattr-&gt;pre_change_attr = version;</div><div class='add'>+		fattr-&gt;valid |= NFS_ATTR_FATTR_PRECHANGE;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void nfs4_test_and_free_stateid(struct nfs_server *server,</div><div class='ctx'> 		nfs4_stateid *stateid,</div><div class='ctx'> 		const struct cred *cred)</div><div class='hunk'>@@ -412,8 +453,10 @@ static int nfs4_delay_killable(long *timeout)</div><div class='ctx'> {</div><div class='ctx'> 	might_sleep();</div><div class='ctx'> </div><div class='del'>-	freezable_schedule_timeout_killable_unsafe(</div><div class='del'>-		nfs4_update_delay(timeout));</div><div class='add'>+	if (unlikely(nfs_current_task_exiting()))</div><div class='add'>+		return -EINTR;</div><div class='add'>+	__set_current_state(TASK_KILLABLE|TASK_FREEZABLE_UNSAFE);</div><div class='add'>+	schedule_timeout(nfs4_update_delay(timeout));</div><div class='ctx'> 	if (!__fatal_signal_pending(current))</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	return -EINTR;</div><div class='hunk'>@@ -423,7 +466,10 @@ static int nfs4_delay_interruptible(long *timeout)</div><div class='ctx'> {</div><div class='ctx'> 	might_sleep();</div><div class='ctx'> </div><div class='del'>-	freezable_schedule_timeout_interruptible_unsafe(nfs4_update_delay(timeout));</div><div class='add'>+	if (unlikely(nfs_current_task_exiting()))</div><div class='add'>+		return -EINTR;</div><div class='add'>+	__set_current_state(TASK_INTERRUPTIBLE|TASK_FREEZABLE_UNSAFE);</div><div class='add'>+	schedule_timeout(nfs4_update_delay(timeout));</div><div class='ctx'> 	if (!signal_pending(current))</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	return __fatal_signal_pending(current) ? -EINTR :-ERESTARTSYS;</div><div class='hunk'>@@ -548,6 +594,7 @@ static int nfs4_do_handle_exception(struct nfs_server *server,</div><div class='ctx'> 		case -NFS4ERR_GRACE:</div><div class='ctx'> 		case -NFS4ERR_LAYOUTTRYLATER:</div><div class='ctx'> 		case -NFS4ERR_RECALLCONFLICT:</div><div class='add'>+		case -NFS4ERR_RETURNCONFLICT:</div><div class='ctx'> 			exception-&gt;delay = 1;</div><div class='ctx'> 			return 0;</div><div class='ctx'> </div><div class='hunk'>@@ -575,6 +622,21 @@ wait_on_recovery:</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Track the number of NFS4ERR_DELAY related retransmissions and return</div><div class='add'>+ * EAGAIN if the 'softerr' mount option is set, and we've exceeded the limit</div><div class='add'>+ * set by 'nfs_delay_retrans'.</div><div class='add'>+ */</div><div class='add'>+static int nfs4_exception_should_retrans(const struct nfs_server *server,</div><div class='add'>+					 struct nfs4_exception *exception)</div><div class='add'>+{</div><div class='add'>+	if (server-&gt;flags &amp; NFS_MOUNT_SOFTERR &amp;&amp; nfs_delay_retrans &gt;= 0) {</div><div class='add'>+		if (exception-&gt;retrans++ &gt;= (unsigned short)nfs_delay_retrans)</div><div class='add'>+			return -EAGAIN;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /* This is the error handling routine for processes that are allowed</div><div class='ctx'>  * to sleep.</div><div class='ctx'>  */</div><div class='hunk'>@@ -585,6 +647,11 @@ int nfs4_handle_exception(struct nfs_server *server, int errorcode, struct nfs4_</div><div class='ctx'> </div><div class='ctx'> 	ret = nfs4_do_handle_exception(server, errorcode, exception);</div><div class='ctx'> 	if (exception-&gt;delay) {</div><div class='add'>+		int ret2 = nfs4_exception_should_retrans(server, exception);</div><div class='add'>+		if (ret2 &lt; 0) {</div><div class='add'>+			exception-&gt;retry = 0;</div><div class='add'>+			return ret2;</div><div class='add'>+		}</div><div class='ctx'> 		ret = nfs4_delay(&amp;exception-&gt;timeout,</div><div class='ctx'> 				exception-&gt;interruptible);</div><div class='ctx'> 		goto out_retry;</div><div class='hunk'>@@ -611,8 +678,22 @@ nfs4_async_handle_exception(struct rpc_task *task, struct nfs_server *server,</div><div class='ctx'> 	struct nfs_client *clp = server-&gt;nfs_client;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='add'>+	if ((task-&gt;tk_rpc_status == -ENETDOWN ||</div><div class='add'>+	     task-&gt;tk_rpc_status == -ENETUNREACH) &amp;&amp;</div><div class='add'>+	    task-&gt;tk_flags &amp; RPC_TASK_NETUNREACH_FATAL) {</div><div class='add'>+		exception-&gt;delay = 0;</div><div class='add'>+		exception-&gt;recovering = 0;</div><div class='add'>+		exception-&gt;retry = 0;</div><div class='add'>+		return -EIO;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	ret = nfs4_do_handle_exception(server, errorcode, exception);</div><div class='ctx'> 	if (exception-&gt;delay) {</div><div class='add'>+		int ret2 = nfs4_exception_should_retrans(server, exception);</div><div class='add'>+		if (ret2 &lt; 0) {</div><div class='add'>+			exception-&gt;retry = 0;</div><div class='add'>+			return ret2;</div><div class='add'>+		}</div><div class='ctx'> 		rpc_delay(task, nfs4_update_delay(&amp;exception-&gt;timeout));</div><div class='ctx'> 		goto out_retry;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -780,10 +861,9 @@ static void nfs4_slot_sequence_record_sent(struct nfs4_slot *slot,</div><div class='ctx'> 	if ((s32)(seqnr - slot-&gt;seq_nr_highest_sent) &gt; 0)</div><div class='ctx'> 		slot-&gt;seq_nr_highest_sent = seqnr;</div><div class='ctx'> }</div><div class='del'>-static void nfs4_slot_sequence_acked(struct nfs4_slot *slot,</div><div class='del'>-		u32 seqnr)</div><div class='add'>+static void nfs4_slot_sequence_acked(struct nfs4_slot *slot, u32 seqnr)</div><div class='ctx'> {</div><div class='del'>-	slot-&gt;seq_nr_highest_sent = seqnr;</div><div class='add'>+	nfs4_slot_sequence_record_sent(slot, seqnr);</div><div class='ctx'> 	slot-&gt;seq_nr_last_acked = seqnr;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -850,7 +930,6 @@ static int nfs41_sequence_process(struct rpc_task *task,</div><div class='ctx'> 			__func__,</div><div class='ctx'> 			slot-&gt;slot_nr,</div><div class='ctx'> 			slot-&gt;seq_nr);</div><div class='del'>-		nfs4_slot_sequence_acked(slot, slot-&gt;seq_nr);</div><div class='ctx'> 		goto out_retry;</div><div class='ctx'> 	case -NFS4ERR_RETRY_UNCACHED_REP:</div><div class='ctx'> 	case -NFS4ERR_SEQ_FALSE_RETRY:</div><div class='hunk'>@@ -913,6 +992,7 @@ out:</div><div class='ctx'> out_noaction:</div><div class='ctx'> 	return ret;</div><div class='ctx'> session_recover:</div><div class='add'>+	set_bit(NFS4_SLOT_TBL_DRAINING, &amp;session-&gt;fc_slot_table.slot_tbl_state);</div><div class='ctx'> 	nfs4_schedule_session_recovery(session, status);</div><div class='ctx'> 	dprintk("%s ERROR: %d Reset session\n", __func__, status);</div><div class='ctx'> 	nfs41_sequence_free_slot(res);</div><div class='hunk'>@@ -1158,7 +1238,7 @@ static int nfs4_call_sync_sequence(struct rpc_clnt *clnt,</div><div class='ctx'> {</div><div class='ctx'> 	unsigned short task_flags = 0;</div><div class='ctx'> </div><div class='del'>-	if (server-&gt;nfs_client-&gt;cl_minorversion)</div><div class='add'>+	if (server-&gt;caps &amp; NFS_CAP_MOVEABLE)</div><div class='ctx'> 		task_flags = RPC_TASK_MOVEABLE;</div><div class='ctx'> 	return nfs4_do_call_sync(clnt, server, msg, args, res, task_flags);</div><div class='ctx'> }</div><div class='hunk'>@@ -1209,7 +1289,8 @@ nfs4_update_changeattr_locked(struct inode *inode,</div><div class='ctx'> 	struct nfs_inode *nfsi = NFS_I(inode);</div><div class='ctx'> 	u64 change_attr = inode_peek_iversion_raw(inode);</div><div class='ctx'> </div><div class='del'>-	cache_validity |= NFS_INO_INVALID_CTIME | NFS_INO_INVALID_MTIME;</div><div class='add'>+	if (!nfs_have_delegated_mtime(inode))</div><div class='add'>+		cache_validity |= NFS_INO_INVALID_CTIME | NFS_INO_INVALID_MTIME;</div><div class='ctx'> 	if (S_ISDIR(inode-&gt;i_mode))</div><div class='ctx'> 		cache_validity |= NFS_INO_INVALID_DATA;</div><div class='ctx'> </div><div class='hunk'>@@ -1228,13 +1309,13 @@ nfs4_update_changeattr_locked(struct inode *inode,</div><div class='ctx'> 		if (S_ISDIR(inode-&gt;i_mode))</div><div class='ctx'> 			nfs_force_lookup_revalidate(inode);</div><div class='ctx'> </div><div class='del'>-		if (!NFS_PROTO(inode)-&gt;have_delegation(inode, FMODE_READ))</div><div class='add'>+		if (!nfs_have_delegated_attributes(inode))</div><div class='ctx'> 			cache_validity |=</div><div class='ctx'> 				NFS_INO_INVALID_ACCESS | NFS_INO_INVALID_ACL |</div><div class='ctx'> 				NFS_INO_INVALID_SIZE | NFS_INO_INVALID_OTHER |</div><div class='ctx'> 				NFS_INO_INVALID_BLOCKS | NFS_INO_INVALID_NLINK |</div><div class='del'>-				NFS_INO_INVALID_MODE | NFS_INO_INVALID_XATTR |</div><div class='del'>-				NFS_INO_REVAL_PAGECACHE;</div><div class='add'>+				NFS_INO_INVALID_MODE | NFS_INO_INVALID_BTIME |</div><div class='add'>+				NFS_INO_INVALID_XATTR;</div><div class='ctx'> 		nfsi-&gt;attrtimeo = NFS_MINATTRTIMEO(inode);</div><div class='ctx'> 	}</div><div class='ctx'> 	nfsi-&gt;attrtimeo_timestamp = jiffies;</div><div class='hunk'>@@ -1285,8 +1366,7 @@ static fmode_t _nfs4_ctx_to_openmode(const struct nfs_open_context *ctx)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static u32</div><div class='del'>-nfs4_map_atomic_open_share(struct nfs_server *server,</div><div class='del'>-		fmode_t fmode, int openflags)</div><div class='add'>+nfs4_fmode_to_share_access(fmode_t fmode)</div><div class='ctx'> {</div><div class='ctx'> 	u32 res = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -1300,11 +1380,27 @@ nfs4_map_atomic_open_share(struct nfs_server *server,</div><div class='ctx'> 	case FMODE_READ|FMODE_WRITE:</div><div class='ctx'> 		res = NFS4_SHARE_ACCESS_BOTH;</div><div class='ctx'> 	}</div><div class='add'>+	return res;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static u32</div><div class='add'>+nfs4_map_atomic_open_share(struct nfs_server *server,</div><div class='add'>+		fmode_t fmode, int openflags)</div><div class='add'>+{</div><div class='add'>+	u32 res = nfs4_fmode_to_share_access(fmode);</div><div class='add'>+</div><div class='ctx'> 	if (!(server-&gt;caps &amp; NFS_CAP_ATOMIC_OPEN_V1))</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	/* Want no delegation if we're using O_DIRECT */</div><div class='del'>-	if (openflags &amp; O_DIRECT)</div><div class='add'>+	if (openflags &amp; O_DIRECT) {</div><div class='ctx'> 		res |= NFS4_SHARE_WANT_NO_DELEG;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	/* res |= NFS4_SHARE_WANT_NO_PREFERENCE; */</div><div class='add'>+	if (server-&gt;caps &amp; NFS_CAP_DELEGTIME)</div><div class='add'>+		res |= NFS4_SHARE_WANT_DELEG_TIMESTAMPS;</div><div class='add'>+	if (server-&gt;caps &amp; NFS_CAP_OPEN_XOR)</div><div class='add'>+		res |= NFS4_SHARE_WANT_OPEN_XOR_DELEGATION;</div><div class='ctx'> out:</div><div class='ctx'> 	return res;</div><div class='ctx'> }</div><div class='hunk'>@@ -1397,13 +1493,8 @@ static struct nfs4_opendata *nfs4_opendata_alloc(struct dentry *dentry,</div><div class='ctx'> 	case NFS4_OPEN_CLAIM_FH:</div><div class='ctx'> 		p-&gt;o_arg.access = NFS4_ACCESS_READ | NFS4_ACCESS_MODIFY |</div><div class='ctx'> 				  NFS4_ACCESS_EXTEND | NFS4_ACCESS_DELETE |</div><div class='del'>-				  NFS4_ACCESS_EXECUTE;</div><div class='del'>-#ifdef CONFIG_NFS_V4_2</div><div class='del'>-		if (!(server-&gt;caps &amp; NFS_CAP_XATTR))</div><div class='del'>-			break;</div><div class='del'>-		p-&gt;o_arg.access |= NFS4_ACCESS_XAREAD | NFS4_ACCESS_XAWRITE |</div><div class='del'>-				   NFS4_ACCESS_XALIST;</div><div class='del'>-#endif</div><div class='add'>+				  NFS4_ACCESS_EXECUTE |</div><div class='add'>+				  nfs_access_xattr_mask(server);</div><div class='ctx'> 	}</div><div class='ctx'> 	p-&gt;o_arg.clientid = server-&gt;nfs_client-&gt;cl_clientid;</div><div class='ctx'> 	p-&gt;o_arg.id.create_time = ktime_to_ns(sp-&gt;so_seqid.create_time);</div><div class='hunk'>@@ -1707,7 +1798,8 @@ static void nfs_set_open_stateid_locked(struct nfs4_state *state,</div><div class='ctx'> 		rcu_read_unlock();</div><div class='ctx'> 		trace_nfs4_open_stateid_update_wait(state-&gt;inode, stateid, 0);</div><div class='ctx'> </div><div class='del'>-		if (!fatal_signal_pending(current)) {</div><div class='add'>+		if (!fatal_signal_pending(current) &amp;&amp;</div><div class='add'>+		    !nfs_current_task_exiting()) {</div><div class='ctx'> 			if (schedule_timeout(5*HZ) == 0)</div><div class='ctx'> 				status = -EAGAIN;</div><div class='ctx'> 			else</div><div class='hunk'>@@ -1924,44 +2016,41 @@ out_return_state:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='del'>-nfs4_opendata_check_deleg(struct nfs4_opendata *data, struct nfs4_state *state)</div><div class='del'>-{</div><div class='del'>-	struct nfs_client *clp = NFS_SERVER(state-&gt;inode)-&gt;nfs_client;</div><div class='del'>-	struct nfs_delegation *delegation;</div><div class='del'>-	int delegation_flags = 0;</div><div class='del'>-</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	delegation = rcu_dereference(NFS_I(state-&gt;inode)-&gt;delegation);</div><div class='del'>-	if (delegation)</div><div class='del'>-		delegation_flags = delegation-&gt;flags;</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-	switch (data-&gt;o_arg.claim) {</div><div class='del'>-	default:</div><div class='add'>+nfs4_process_delegation(struct inode *inode, const struct cred *cred,</div><div class='add'>+			enum open_claim_type4 claim,</div><div class='add'>+			const struct nfs4_open_delegation *delegation)</div><div class='add'>+{</div><div class='add'>+	switch (delegation-&gt;open_delegation_type) {</div><div class='add'>+	case NFS4_OPEN_DELEGATE_READ:</div><div class='add'>+	case NFS4_OPEN_DELEGATE_WRITE:</div><div class='add'>+	case NFS4_OPEN_DELEGATE_READ_ATTRS_DELEG:</div><div class='add'>+	case NFS4_OPEN_DELEGATE_WRITE_ATTRS_DELEG:</div><div class='ctx'> 		break;</div><div class='add'>+	default:</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+	switch (claim) {</div><div class='ctx'> 	case NFS4_OPEN_CLAIM_DELEGATE_CUR:</div><div class='ctx'> 	case NFS4_OPEN_CLAIM_DELEG_CUR_FH:</div><div class='ctx'> 		pr_err_ratelimited("NFS: Broken NFSv4 server %s is "</div><div class='ctx'> 				   "returning a delegation for "</div><div class='ctx'> 				   "OPEN(CLAIM_DELEGATE_CUR)\n",</div><div class='del'>-				   clp-&gt;cl_hostname);</div><div class='del'>-		return;</div><div class='add'>+				   NFS_SERVER(inode)-&gt;nfs_client-&gt;cl_hostname);</div><div class='add'>+		break;</div><div class='add'>+	case NFS4_OPEN_CLAIM_PREVIOUS:</div><div class='add'>+		nfs_inode_reclaim_delegation(inode, cred, delegation-&gt;type,</div><div class='add'>+					     &amp;delegation-&gt;stateid,</div><div class='add'>+					     delegation-&gt;pagemod_limit,</div><div class='add'>+					     delegation-&gt;open_delegation_type);</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		nfs_inode_set_delegation(inode, cred, delegation-&gt;type,</div><div class='add'>+					 &amp;delegation-&gt;stateid,</div><div class='add'>+					 delegation-&gt;pagemod_limit,</div><div class='add'>+					 delegation-&gt;open_delegation_type);</div><div class='ctx'> 	}</div><div class='del'>-	if ((delegation_flags &amp; 1UL&lt;&lt;NFS_DELEGATION_NEED_RECLAIM) == 0)</div><div class='del'>-		nfs_inode_set_delegation(state-&gt;inode,</div><div class='del'>-				data-&gt;owner-&gt;so_cred,</div><div class='del'>-				data-&gt;o_res.delegation_type,</div><div class='del'>-				&amp;data-&gt;o_res.delegation,</div><div class='del'>-				data-&gt;o_res.pagemod_limit);</div><div class='del'>-	else</div><div class='del'>-		nfs_inode_reclaim_delegation(state-&gt;inode,</div><div class='del'>-				data-&gt;owner-&gt;so_cred,</div><div class='del'>-				data-&gt;o_res.delegation_type,</div><div class='del'>-				&amp;data-&gt;o_res.delegation,</div><div class='del'>-				data-&gt;o_res.pagemod_limit);</div><div class='del'>-</div><div class='del'>-	if (data-&gt;o_res.do_recall)</div><div class='del'>-		nfs_async_inode_return_delegation(state-&gt;inode,</div><div class='del'>-						  &amp;data-&gt;o_res.delegation);</div><div class='add'>+	if (delegation-&gt;do_recall)</div><div class='add'>+		nfs_async_inode_return_delegation(inode, &amp;delegation-&gt;stateid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1978,19 +2067,23 @@ _nfs4_opendata_reclaim_to_nfs4_state(struct nfs4_opendata *data)</div><div class='ctx'> 	if (!data-&gt;rpc_done) {</div><div class='ctx'> 		if (data-&gt;rpc_status)</div><div class='ctx'> 			return ERR_PTR(data-&gt;rpc_status);</div><div class='del'>-		/* cached opens have already been processed */</div><div class='del'>-		goto update;</div><div class='add'>+		return nfs4_try_open_cached(data);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	ret = nfs_refresh_inode(inode, &amp;data-&gt;f_attr);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ERR_PTR(ret);</div><div class='ctx'> </div><div class='del'>-	if (data-&gt;o_res.delegation_type != 0)</div><div class='del'>-		nfs4_opendata_check_deleg(data, state);</div><div class='del'>-update:</div><div class='del'>-	if (!update_open_stateid(state, &amp;data-&gt;o_res.stateid,</div><div class='del'>-				NULL, data-&gt;o_arg.fmode))</div><div class='add'>+	nfs4_process_delegation(state-&gt;inode,</div><div class='add'>+				data-&gt;owner-&gt;so_cred,</div><div class='add'>+				data-&gt;o_arg.claim,</div><div class='add'>+				&amp;data-&gt;o_res.delegation);</div><div class='add'>+</div><div class='add'>+	if (!(data-&gt;o_res.rflags &amp; NFS4_OPEN_RESULT_NO_OPEN_STATEID)) {</div><div class='add'>+		if (!update_open_stateid(state, &amp;data-&gt;o_res.stateid,</div><div class='add'>+					 NULL, data-&gt;o_arg.fmode))</div><div class='add'>+			return ERR_PTR(-EAGAIN);</div><div class='add'>+	} else if (!update_open_stateid(state, NULL, NULL, data-&gt;o_arg.fmode))</div><div class='ctx'> 		return ERR_PTR(-EAGAIN);</div><div class='ctx'> 	refcount_inc(&amp;state-&gt;count);</div><div class='ctx'> </div><div class='hunk'>@@ -2054,10 +2147,18 @@ _nfs4_opendata_to_nfs4_state(struct nfs4_opendata *data)</div><div class='ctx'> 	if (IS_ERR(state))</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	if (data-&gt;o_res.delegation_type != 0)</div><div class='del'>-		nfs4_opendata_check_deleg(data, state);</div><div class='del'>-	if (!update_open_stateid(state, &amp;data-&gt;o_res.stateid,</div><div class='del'>-				NULL, data-&gt;o_arg.fmode)) {</div><div class='add'>+	nfs4_process_delegation(state-&gt;inode,</div><div class='add'>+				data-&gt;owner-&gt;so_cred,</div><div class='add'>+				data-&gt;o_arg.claim,</div><div class='add'>+				&amp;data-&gt;o_res.delegation);</div><div class='add'>+</div><div class='add'>+	if (!(data-&gt;o_res.rflags &amp; NFS4_OPEN_RESULT_NO_OPEN_STATEID)) {</div><div class='add'>+		if (!update_open_stateid(state, &amp;data-&gt;o_res.stateid,</div><div class='add'>+					 NULL, data-&gt;o_arg.fmode)) {</div><div class='add'>+			nfs4_put_open_state(state);</div><div class='add'>+			state = ERR_PTR(-EAGAIN);</div><div class='add'>+		}</div><div class='add'>+	} else if (!update_open_stateid(state, NULL, NULL, data-&gt;o_arg.fmode)) {</div><div class='ctx'> 		nfs4_put_open_state(state);</div><div class='ctx'> 		state = ERR_PTR(-EAGAIN);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2129,18 +2230,18 @@ static struct nfs4_opendata *nfs4_open_recoverdata_alloc(struct nfs_open_context</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int nfs4_open_recover_helper(struct nfs4_opendata *opendata,</div><div class='del'>-		fmode_t fmode)</div><div class='add'>+				    fmode_t fmode)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_state *newstate;</div><div class='add'>+	struct nfs_server *server = NFS_SB(opendata-&gt;dentry-&gt;d_sb);</div><div class='add'>+	int openflags = opendata-&gt;o_arg.open_flags;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!nfs4_mode_match_open_stateid(opendata-&gt;state, fmode))</div><div class='ctx'> 		return 0;</div><div class='del'>-	opendata-&gt;o_arg.open_flags = 0;</div><div class='ctx'> 	opendata-&gt;o_arg.fmode = fmode;</div><div class='del'>-	opendata-&gt;o_arg.share_access = nfs4_map_atomic_open_share(</div><div class='del'>-			NFS_SB(opendata-&gt;dentry-&gt;d_sb),</div><div class='del'>-			fmode, 0);</div><div class='add'>+	opendata-&gt;o_arg.share_access =</div><div class='add'>+		nfs4_map_atomic_open_share(server, fmode, openflags);</div><div class='ctx'> 	memset(&amp;opendata-&gt;o_res, 0, sizeof(opendata-&gt;o_res));</div><div class='ctx'> 	memset(&amp;opendata-&gt;c_res, 0, sizeof(opendata-&gt;c_res));</div><div class='ctx'> 	nfs4_init_opendata_res(opendata);</div><div class='hunk'>@@ -2193,7 +2294,7 @@ static int _nfs4_do_open_reclaim(struct nfs_open_context *ctx, struct nfs4_state</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_delegation *delegation;</div><div class='ctx'> 	struct nfs4_opendata *opendata;</div><div class='del'>-	fmode_t delegation_type = 0;</div><div class='add'>+	u32 delegation_type = NFS4_OPEN_DELEGATE_NONE;</div><div class='ctx'> 	int status;</div><div class='ctx'> </div><div class='ctx'> 	opendata = nfs4_open_recoverdata_alloc(ctx, state,</div><div class='hunk'>@@ -2202,8 +2303,20 @@ static int _nfs4_do_open_reclaim(struct nfs_open_context *ctx, struct nfs4_state</div><div class='ctx'> 		return PTR_ERR(opendata);</div><div class='ctx'> 	rcu_read_lock();</div><div class='ctx'> 	delegation = rcu_dereference(NFS_I(state-&gt;inode)-&gt;delegation);</div><div class='del'>-	if (delegation != NULL &amp;&amp; test_bit(NFS_DELEGATION_NEED_RECLAIM, &amp;delegation-&gt;flags) != 0)</div><div class='del'>-		delegation_type = delegation-&gt;type;</div><div class='add'>+	if (delegation != NULL &amp;&amp; test_bit(NFS_DELEGATION_NEED_RECLAIM, &amp;delegation-&gt;flags) != 0) {</div><div class='add'>+		switch(delegation-&gt;type) {</div><div class='add'>+		case FMODE_READ:</div><div class='add'>+			delegation_type = NFS4_OPEN_DELEGATE_READ;</div><div class='add'>+			if (test_bit(NFS_DELEGATION_DELEGTIME, &amp;delegation-&gt;flags))</div><div class='add'>+				delegation_type = NFS4_OPEN_DELEGATE_READ_ATTRS_DELEG;</div><div class='add'>+			break;</div><div class='add'>+		case FMODE_WRITE:</div><div class='add'>+		case FMODE_READ|FMODE_WRITE:</div><div class='add'>+			delegation_type = NFS4_OPEN_DELEGATE_WRITE;</div><div class='add'>+			if (test_bit(NFS_DELEGATION_DELEGTIME, &amp;delegation-&gt;flags))</div><div class='add'>+				delegation_type = NFS4_OPEN_DELEGATE_WRITE_ATTRS_DELEG;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> 	rcu_read_unlock();</div><div class='ctx'> 	opendata-&gt;o_arg.u.delegation_type = delegation_type;</div><div class='ctx'> 	status = nfs4_open_recover(opendata, state);</div><div class='hunk'>@@ -2524,12 +2637,14 @@ static void nfs4_open_release(void *calldata)</div><div class='ctx'> 	struct nfs4_opendata *data = calldata;</div><div class='ctx'> 	struct nfs4_state *state = NULL;</div><div class='ctx'> </div><div class='add'>+	/* In case of error, no cleanup! */</div><div class='add'>+	if (data-&gt;rpc_status != 0 || !data-&gt;rpc_done) {</div><div class='add'>+		nfs_release_seqid(data-&gt;o_arg.seqid);</div><div class='add'>+		goto out_free;</div><div class='add'>+	}</div><div class='ctx'> 	/* If this request hasn't been cancelled, do nothing */</div><div class='ctx'> 	if (!data-&gt;cancelled)</div><div class='ctx'> 		goto out_free;</div><div class='del'>-	/* In case of error, no cleanup! */</div><div class='del'>-	if (data-&gt;rpc_status != 0 || !data-&gt;rpc_done)</div><div class='del'>-		goto out_free;</div><div class='ctx'> 	/* In case we need an open_confirm, no cleanup! */</div><div class='ctx'> 	if (data-&gt;o_res.rflags &amp; NFS4_OPEN_RESULT_CONFIRM)</div><div class='ctx'> 		goto out_free;</div><div class='hunk'>@@ -2570,7 +2685,7 @@ static int nfs4_run_open_task(struct nfs4_opendata *data,</div><div class='ctx'> 	};</div><div class='ctx'> 	int status;</div><div class='ctx'> </div><div class='del'>-	if (server-&gt;nfs_client-&gt;cl_minorversion)</div><div class='add'>+	if (nfs_server_capable(dir, NFS_CAP_MOVEABLE))</div><div class='ctx'> 		task_setup_data.flags |= RPC_TASK_MOVEABLE;</div><div class='ctx'> </div><div class='ctx'> 	kref_get(&amp;data-&gt;kref);</div><div class='hunk'>@@ -2628,8 +2743,7 @@ static int _nfs4_recover_proc_open(struct nfs4_opendata *data)</div><div class='ctx'>  */</div><div class='ctx'> static int nfs4_opendata_access(const struct cred *cred,</div><div class='ctx'> 				struct nfs4_opendata *opendata,</div><div class='del'>-				struct nfs4_state *state, fmode_t fmode,</div><div class='del'>-				int openflags)</div><div class='add'>+				struct nfs4_state *state, fmode_t fmode)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_access_entry cache;</div><div class='ctx'> 	u32 mask, flags;</div><div class='hunk'>@@ -2640,11 +2754,7 @@ static int nfs4_opendata_access(const struct cred *cred,</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	mask = 0;</div><div class='del'>-	/*</div><div class='del'>-	 * Use openflags to check for exec, because fmode won't</div><div class='del'>-	 * always have FMODE_EXEC set when file open for exec.</div><div class='del'>-	 */</div><div class='del'>-	if (openflags &amp; __FMODE_EXEC) {</div><div class='add'>+	if (fmode &amp; FMODE_EXEC) {</div><div class='ctx'> 		/* ONLY check for exec rights */</div><div class='ctx'> 		if (S_ISDIR(state-&gt;inode-&gt;i_mode))</div><div class='ctx'> 			mask = NFS4_ACCESS_LOOKUP;</div><div class='hunk'>@@ -2653,9 +2763,8 @@ static int nfs4_opendata_access(const struct cred *cred,</div><div class='ctx'> 	} else if ((fmode &amp; FMODE_READ) &amp;&amp; !opendata-&gt;file_created)</div><div class='ctx'> 		mask = NFS4_ACCESS_READ;</div><div class='ctx'> </div><div class='del'>-	cache.cred = cred;</div><div class='ctx'> 	nfs_access_set_mask(&amp;cache, opendata-&gt;o_res.access_result);</div><div class='del'>-	nfs_access_add_cache(state-&gt;inode, &amp;cache);</div><div class='add'>+	nfs_access_add_cache(state-&gt;inode, &amp;cache, cred);</div><div class='ctx'> </div><div class='ctx'> 	flags = NFS4_ACCESS_READ | NFS4_ACCESS_EXECUTE | NFS4_ACCESS_LOOKUP;</div><div class='ctx'> 	if ((mask &amp; ~cache.mask &amp; flags) == 0)</div><div class='hunk'>@@ -2707,8 +2816,12 @@ static int _nfs4_proc_open(struct nfs4_opendata *data,</div><div class='ctx'> 			return status;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!(o_res-&gt;f_attr-&gt;valid &amp; NFS_ATTR_FATTR)) {</div><div class='add'>+		struct nfs_fh *fh = &amp;o_res-&gt;fh;</div><div class='add'>+</div><div class='ctx'> 		nfs4_sequence_free_slot(&amp;o_res-&gt;seq_res);</div><div class='del'>-		nfs4_proc_getattr(server, &amp;o_res-&gt;fh, o_res-&gt;f_attr, NULL);</div><div class='add'>+		if (o_arg-&gt;claim == NFS4_OPEN_CLAIM_FH)</div><div class='add'>+			fh = NFS_FH(d_inode(data-&gt;dentry));</div><div class='add'>+		nfs4_proc_getattr(server, fh, o_res-&gt;f_attr, NULL);</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -2723,10 +2836,15 @@ static int _nfs4_open_expired(struct nfs_open_context *ctx, struct nfs4_state *s</div><div class='ctx'> 	struct nfs4_opendata *opendata;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	opendata = nfs4_open_recoverdata_alloc(ctx, state,</div><div class='del'>-			NFS4_OPEN_CLAIM_FH);</div><div class='add'>+	opendata = nfs4_open_recoverdata_alloc(ctx, state, NFS4_OPEN_CLAIM_FH);</div><div class='ctx'> 	if (IS_ERR(opendata))</div><div class='ctx'> 		return PTR_ERR(opendata);</div><div class='add'>+	/*</div><div class='add'>+	 * We're not recovering a delegation, so ask for no delegation.</div><div class='add'>+	 * Otherwise the recovery thread could deadlock with an outstanding</div><div class='add'>+	 * delegation return.</div><div class='add'>+	 */</div><div class='add'>+	opendata-&gt;o_arg.open_flags = O_DIRECT;</div><div class='ctx'> 	ret = nfs4_open_recover(opendata, state);</div><div class='ctx'> 	if (ret == -ESTALE)</div><div class='ctx'> 		d_drop(ctx-&gt;dentry);</div><div class='hunk'>@@ -2793,16 +2911,14 @@ static int nfs40_open_expired(struct nfs4_state_owner *sp, struct nfs4_state *st</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int nfs40_test_and_free_expired_stateid(struct nfs_server *server,</div><div class='del'>-		nfs4_stateid *stateid,</div><div class='del'>-		const struct cred *cred)</div><div class='add'>+					       nfs4_stateid *stateid, const struct cred *cred)</div><div class='ctx'> {</div><div class='ctx'> 	return -NFS4ERR_BAD_STATEID;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #if defined(CONFIG_NFS_V4_1)</div><div class='ctx'> static int nfs41_test_and_free_expired_stateid(struct nfs_server *server,</div><div class='del'>-		nfs4_stateid *stateid,</div><div class='del'>-		const struct cred *cred)</div><div class='add'>+					       nfs4_stateid *stateid, const struct cred *cred)</div><div class='ctx'> {</div><div class='ctx'> 	int status;</div><div class='ctx'> </div><div class='hunk'>@@ -2811,6 +2927,7 @@ static int nfs41_test_and_free_expired_stateid(struct nfs_server *server,</div><div class='ctx'> 		break;</div><div class='ctx'> 	case NFS4_INVALID_STATEID_TYPE:</div><div class='ctx'> 	case NFS4_SPECIAL_STATEID_TYPE:</div><div class='add'>+	case NFS4_FREED_STATEID_TYPE:</div><div class='ctx'> 		return -NFS4ERR_BAD_STATEID;</div><div class='ctx'> 	case NFS4_REVOKED_STATEID_TYPE:</div><div class='ctx'> 		goto out_free;</div><div class='hunk'>@@ -3028,7 +3145,7 @@ static unsigned nfs4_exclusive_attrset(struct nfs4_opendata *opendata,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int _nfs4_open_and_get_state(struct nfs4_opendata *opendata,</div><div class='del'>-		int flags, struct nfs_open_context *ctx)</div><div class='add'>+		struct nfs_open_context *ctx)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_state_owner *sp = opendata-&gt;owner;</div><div class='ctx'> 	struct nfs_server *server = sp-&gt;so_server;</div><div class='hunk'>@@ -3037,10 +3154,8 @@ static int _nfs4_open_and_get_state(struct nfs4_opendata *opendata,</div><div class='ctx'> 	fmode_t acc_mode = _nfs4_ctx_to_accessmode(ctx);</div><div class='ctx'> 	struct inode *dir = d_inode(opendata-&gt;dir);</div><div class='ctx'> 	unsigned long dir_verifier;</div><div class='del'>-	unsigned int seq;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	seq = raw_seqcount_begin(&amp;sp-&gt;so_reclaim_seqcount);</div><div class='ctx'> 	dir_verifier = nfs_save_change_attribute(dir);</div><div class='ctx'> </div><div class='ctx'> 	ret = _nfs4_proc_open(opendata, ctx);</div><div class='hunk'>@@ -3056,14 +3171,14 @@ static int _nfs4_open_and_get_state(struct nfs4_opendata *opendata,</div><div class='ctx'> 		set_bit(NFS_STATE_POSIX_LOCKS, &amp;state-&gt;flags);</div><div class='ctx'> 	if (opendata-&gt;o_res.rflags &amp; NFS4_OPEN_RESULT_MAY_NOTIFY_LOCK)</div><div class='ctx'> 		set_bit(NFS_STATE_MAY_NOTIFY_LOCK, &amp;state-&gt;flags);</div><div class='add'>+	if (opendata-&gt;o_res.rflags &amp; NFS4_OPEN_RESULT_PRESERVE_UNLINKED)</div><div class='add'>+		set_bit(NFS_INO_PRESERVE_UNLINKED, &amp;NFS_I(state-&gt;inode)-&gt;flags);</div><div class='ctx'> </div><div class='ctx'> 	dentry = opendata-&gt;dentry;</div><div class='ctx'> 	if (d_really_is_negative(dentry)) {</div><div class='ctx'> 		struct dentry *alias;</div><div class='ctx'> 		d_drop(dentry);</div><div class='del'>-		alias = d_exact_alias(dentry, state-&gt;inode);</div><div class='del'>-		if (!alias)</div><div class='del'>-			alias = d_splice_alias(igrab(state-&gt;inode), dentry);</div><div class='add'>+		alias = d_splice_alias(igrab(state-&gt;inode), dentry);</div><div class='ctx'> 		/* d_splice_alias() can't fail here - it's a non-directory */</div><div class='ctx'> 		if (alias) {</div><div class='ctx'> 			dput(ctx-&gt;dentry);</div><div class='hunk'>@@ -3079,7 +3194,7 @@ static int _nfs4_open_and_get_state(struct nfs4_opendata *opendata,</div><div class='ctx'> 	case NFS4_OPEN_CLAIM_DELEGATE_PREV:</div><div class='ctx'> 		if (!opendata-&gt;rpc_done)</div><div class='ctx'> 			break;</div><div class='del'>-		if (opendata-&gt;o_res.delegation_type != 0)</div><div class='add'>+		if (opendata-&gt;o_res.delegation.type != 0)</div><div class='ctx'> 			dir_verifier = nfs_save_change_attribute(dir);</div><div class='ctx'> 		nfs_set_verifier(dentry, dir_verifier);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3087,20 +3202,21 @@ static int _nfs4_open_and_get_state(struct nfs4_opendata *opendata,</div><div class='ctx'> 	/* Parse layoutget results before we check for access */</div><div class='ctx'> 	pnfs_parse_lgopen(state-&gt;inode, opendata-&gt;lgp, ctx);</div><div class='ctx'> </div><div class='del'>-	ret = nfs4_opendata_access(sp-&gt;so_cred, opendata, state,</div><div class='del'>-			acc_mode, flags);</div><div class='add'>+	ret = nfs4_opendata_access(sp-&gt;so_cred, opendata, state, acc_mode);</div><div class='ctx'> 	if (ret != 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	if (d_inode(dentry) == state-&gt;inode) {</div><div class='add'>+	if (d_inode(dentry) == state-&gt;inode)</div><div class='ctx'> 		nfs_inode_attach_open_context(ctx);</div><div class='del'>-		if (read_seqcount_retry(&amp;sp-&gt;so_reclaim_seqcount, seq))</div><div class='del'>-			nfs4_schedule_stateid_recovery(server, state);</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='del'>-	if (!opendata-&gt;cancelled)</div><div class='add'>+	if (!opendata-&gt;cancelled) {</div><div class='add'>+		if (opendata-&gt;lgp) {</div><div class='add'>+			nfs4_lgopen_release(opendata-&gt;lgp);</div><div class='add'>+			opendata-&gt;lgp = NULL;</div><div class='add'>+		}</div><div class='ctx'> 		nfs4_sequence_free_slot(&amp;opendata-&gt;o_res.seq_res);</div><div class='add'>+	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3157,7 +3273,7 @@ static int _nfs4_do_open(struct inode *dir,</div><div class='ctx'> 	if (d_really_is_positive(dentry))</div><div class='ctx'> 		opendata-&gt;state = nfs4_get_open_state(d_inode(dentry), sp);</div><div class='ctx'> </div><div class='del'>-	status = _nfs4_open_and_get_state(opendata, flags, ctx);</div><div class='add'>+	status = _nfs4_open_and_get_state(opendata, ctx);</div><div class='ctx'> 	if (status != 0)</div><div class='ctx'> 		goto err_opendata_put;</div><div class='ctx'> 	state = ctx-&gt;state;</div><div class='hunk'>@@ -3361,13 +3477,18 @@ static int nfs4_do_setattr(struct inode *inode, const struct cred *cred,</div><div class='ctx'> 		.inode = inode,</div><div class='ctx'> 		.stateid = &amp;arg.stateid,</div><div class='ctx'> 	};</div><div class='del'>-	unsigned long adjust_flags = NFS_INO_INVALID_CHANGE;</div><div class='add'>+	unsigned long adjust_flags = NFS_INO_INVALID_CHANGE |</div><div class='add'>+				     NFS_INO_INVALID_CTIME;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	if (sattr-&gt;ia_valid &amp; (ATTR_MODE | ATTR_KILL_SUID | ATTR_KILL_SGID))</div><div class='ctx'> 		adjust_flags |= NFS_INO_INVALID_MODE;</div><div class='ctx'> 	if (sattr-&gt;ia_valid &amp; (ATTR_UID | ATTR_GID))</div><div class='ctx'> 		adjust_flags |= NFS_INO_INVALID_OTHER;</div><div class='add'>+	if (sattr-&gt;ia_valid &amp; ATTR_ATIME)</div><div class='add'>+		adjust_flags |= NFS_INO_INVALID_ATIME;</div><div class='add'>+	if (sattr-&gt;ia_valid &amp; ATTR_MTIME)</div><div class='add'>+		adjust_flags |= NFS_INO_INVALID_MTIME;</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='ctx'> 		nfs4_bitmap_copy_adjust(bitmask, nfs4_bitmask(server, fattr-&gt;label),</div><div class='hunk'>@@ -3479,7 +3600,7 @@ static bool nfs4_refresh_open_old_stateid(nfs4_stateid *dst,</div><div class='ctx'> 		write_sequnlock(&amp;state-&gt;seqlock);</div><div class='ctx'> 		trace_nfs4_close_stateid_update_wait(state-&gt;inode, dst, 0);</div><div class='ctx'> </div><div class='del'>-		if (fatal_signal_pending(current))</div><div class='add'>+		if (fatal_signal_pending(current) || nfs_current_task_exiting())</div><div class='ctx'> 			status = -EINTR;</div><div class='ctx'> 		else</div><div class='ctx'> 			if (schedule_timeout(5*HZ) != 0)</div><div class='hunk'>@@ -3515,6 +3636,7 @@ struct nfs4_closedata {</div><div class='ctx'> 	} lr;</div><div class='ctx'> 	struct nfs_fattr fattr;</div><div class='ctx'> 	unsigned long timestamp;</div><div class='add'>+	unsigned short retrans;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static void nfs4_free_closedata(void *data)</div><div class='hunk'>@@ -3543,6 +3665,7 @@ static void nfs4_close_done(struct rpc_task *task, void *data)</div><div class='ctx'> 		.state = state,</div><div class='ctx'> 		.inode = calldata-&gt;inode,</div><div class='ctx'> 		.stateid = &amp;calldata-&gt;arg.stateid,</div><div class='add'>+		.retrans = calldata-&gt;retrans,</div><div class='ctx'> 	};</div><div class='ctx'> </div><div class='ctx'> 	if (!nfs4_sequence_done(task, &amp;calldata-&gt;res.seq_res))</div><div class='hunk'>@@ -3590,6 +3713,7 @@ static void nfs4_close_done(struct rpc_task *task, void *data)</div><div class='ctx'> 		default:</div><div class='ctx'> 			task-&gt;tk_status = nfs4_async_handle_exception(task,</div><div class='ctx'> 					server, task-&gt;tk_status, &amp;exception);</div><div class='add'>+			calldata-&gt;retrans = exception.retrans;</div><div class='ctx'> 			if (exception.retry)</div><div class='ctx'> 				goto out_restart;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -3667,18 +3791,17 @@ static void nfs4_close_prepare(struct rpc_task *task, void *data)</div><div class='ctx'> </div><div class='ctx'> 	if (calldata-&gt;arg.fmode == 0 || calldata-&gt;arg.fmode == FMODE_READ) {</div><div class='ctx'> 		/* Close-to-open cache consistency revalidation */</div><div class='del'>-		if (!nfs4_have_delegation(inode, FMODE_READ)) {</div><div class='add'>+		if (!nfs4_have_delegation(inode, FMODE_READ, 0)) {</div><div class='ctx'> 			nfs4_bitmask_set(calldata-&gt;arg.bitmask_store,</div><div class='ctx'> 					 server-&gt;cache_consistency_bitmask,</div><div class='del'>-					 inode, server, NULL);</div><div class='add'>+					 inode, 0);</div><div class='ctx'> 			calldata-&gt;arg.bitmask = calldata-&gt;arg.bitmask_store;</div><div class='ctx'> 		} else</div><div class='ctx'> 			calldata-&gt;arg.bitmask = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	calldata-&gt;arg.share_access =</div><div class='del'>-		nfs4_map_atomic_open_share(NFS_SERVER(inode),</div><div class='del'>-				calldata-&gt;arg.fmode, 0);</div><div class='add'>+		nfs4_fmode_to_share_access(calldata-&gt;arg.fmode);</div><div class='ctx'> </div><div class='ctx'> 	if (calldata-&gt;res.fattr == NULL)</div><div class='ctx'> 		calldata-&gt;arg.bitmask = NULL;</div><div class='hunk'>@@ -3734,7 +3857,7 @@ int nfs4_do_close(struct nfs4_state *state, gfp_t gfp_mask, int wait)</div><div class='ctx'> 	};</div><div class='ctx'> 	int status = -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	if (server-&gt;nfs_client-&gt;cl_minorversion)</div><div class='add'>+	if (nfs_server_capable(state-&gt;inode, NFS_CAP_MOVEABLE))</div><div class='ctx'> 		task_setup_data.flags |= RPC_TASK_MOVEABLE;</div><div class='ctx'> </div><div class='ctx'> 	nfs4_state_protect(server-&gt;nfs_client, NFS_SP4_MACH_CRED_CLEANUP,</div><div class='hunk'>@@ -3793,7 +3916,7 @@ nfs4_atomic_open(struct inode *dir, struct nfs_open_context *ctx,</div><div class='ctx'> 		int open_flags, struct iattr *attr, int *opened)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_state *state;</div><div class='del'>-	struct nfs4_label l = {0, 0, 0, NULL}, *label = NULL;</div><div class='add'>+	struct nfs4_label l, *label;</div><div class='ctx'> </div><div class='ctx'> 	label = nfs4_label_init_security(dir, ctx-&gt;dentry, attr, &amp;l);</div><div class='ctx'> </div><div class='hunk'>@@ -3809,8 +3932,11 @@ nfs4_atomic_open(struct inode *dir, struct nfs_open_context *ctx,</div><div class='ctx'> </div><div class='ctx'> static void nfs4_close_context(struct nfs_open_context *ctx, int is_sync)</div><div class='ctx'> {</div><div class='add'>+	struct dentry *dentry = ctx-&gt;dentry;</div><div class='ctx'> 	if (ctx-&gt;state == NULL)</div><div class='ctx'> 		return;</div><div class='add'>+	if (dentry-&gt;d_flags &amp; DCACHE_NFSFS_RENAMED)</div><div class='add'>+		nfs4_inode_set_return_delegation_on_close(d_inode(dentry));</div><div class='ctx'> 	if (is_sync)</div><div class='ctx'> 		nfs4_close_sync(ctx-&gt;state, _nfs4_ctx_to_openmode(ctx));</div><div class='ctx'> 	else</div><div class='hunk'>@@ -3819,11 +3945,26 @@ static void nfs4_close_context(struct nfs_open_context *ctx, int is_sync)</div><div class='ctx'> </div><div class='ctx'> #define FATTR4_WORD1_NFS40_MASK (2*FATTR4_WORD1_MOUNTED_ON_FILEID - 1UL)</div><div class='ctx'> #define FATTR4_WORD2_NFS41_MASK (2*FATTR4_WORD2_SUPPATTR_EXCLCREAT - 1UL)</div><div class='del'>-#define FATTR4_WORD2_NFS42_MASK (2*FATTR4_WORD2_XATTR_SUPPORT - 1UL)</div><div class='add'>+#define FATTR4_WORD2_NFS42_MASK (2*FATTR4_WORD2_OPEN_ARGUMENTS - 1UL)</div><div class='add'>+</div><div class='add'>+#define FATTR4_WORD2_NFS42_TIME_DELEG_MASK \</div><div class='add'>+	(FATTR4_WORD2_TIME_DELEG_MODIFY|FATTR4_WORD2_TIME_DELEG_ACCESS)</div><div class='add'>+static bool nfs4_server_delegtime_capable(struct nfs4_server_caps_res *res)</div><div class='add'>+{</div><div class='add'>+	u32 share_access_want = res-&gt;open_caps.oa_share_access_want[0];</div><div class='add'>+	u32 attr_bitmask = res-&gt;attr_bitmask[2];</div><div class='add'>+</div><div class='add'>+	return (share_access_want &amp; NFS4_SHARE_WANT_DELEG_TIMESTAMPS) &amp;&amp;</div><div class='add'>+	       ((attr_bitmask &amp; FATTR4_WORD2_NFS42_TIME_DELEG_MASK) ==</div><div class='add'>+					FATTR4_WORD2_NFS42_TIME_DELEG_MASK);</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> static int _nfs4_server_capabilities(struct nfs_server *server, struct nfs_fh *fhandle)</div><div class='ctx'> {</div><div class='del'>-	u32 bitmask[3] = {}, minorversion = server-&gt;nfs_client-&gt;cl_minorversion;</div><div class='add'>+	u32 minorversion = server-&gt;nfs_client-&gt;cl_minorversion;</div><div class='add'>+	u32 bitmask[3] = {</div><div class='add'>+		[0] = FATTR4_WORD0_SUPPORTED_ATTRS,</div><div class='add'>+	};</div><div class='ctx'> 	struct nfs4_server_caps_arg args = {</div><div class='ctx'> 		.fhandle = fhandle,</div><div class='ctx'> 		.bitmask = bitmask,</div><div class='hunk'>@@ -3841,12 +3982,24 @@ static int _nfs4_server_capabilities(struct nfs_server *server, struct nfs_fh *f</div><div class='ctx'> 		     FATTR4_WORD0_FH_EXPIRE_TYPE |</div><div class='ctx'> 		     FATTR4_WORD0_LINK_SUPPORT |</div><div class='ctx'> 		     FATTR4_WORD0_SYMLINK_SUPPORT |</div><div class='del'>-		     FATTR4_WORD0_ACLSUPPORT;</div><div class='add'>+		     FATTR4_WORD0_ACLSUPPORT |</div><div class='add'>+		     FATTR4_WORD0_CASE_INSENSITIVE |</div><div class='add'>+		     FATTR4_WORD0_CASE_PRESERVING;</div><div class='ctx'> 	if (minorversion)</div><div class='ctx'> 		bitmask[2] = FATTR4_WORD2_SUPPATTR_EXCLCREAT;</div><div class='add'>+	if (minorversion &gt; 1)</div><div class='add'>+		bitmask[2] |= FATTR4_WORD2_OPEN_ARGUMENTS;</div><div class='ctx'> </div><div class='ctx'> 	status = nfs4_call_sync(server-&gt;client, server, &amp;msg, &amp;args.seq_args, &amp;res.seq_res, 0);</div><div class='ctx'> 	if (status == 0) {</div><div class='add'>+		bitmask[0] = (FATTR4_WORD0_SUPPORTED_ATTRS |</div><div class='add'>+			      FATTR4_WORD0_FH_EXPIRE_TYPE |</div><div class='add'>+			      FATTR4_WORD0_LINK_SUPPORT |</div><div class='add'>+			      FATTR4_WORD0_SYMLINK_SUPPORT |</div><div class='add'>+			      FATTR4_WORD0_ACLSUPPORT |</div><div class='add'>+			      FATTR4_WORD0_CASE_INSENSITIVE |</div><div class='add'>+			      FATTR4_WORD0_CASE_PRESERVING) &amp;</div><div class='add'>+			     res.attr_bitmask[0];</div><div class='ctx'> 		/* Sanity check the server answers */</div><div class='ctx'> 		switch (minorversion) {</div><div class='ctx'> 		case 0:</div><div class='hunk'>@@ -3855,13 +4008,20 @@ static int _nfs4_server_capabilities(struct nfs_server *server, struct nfs_fh *f</div><div class='ctx'> 			break;</div><div class='ctx'> 		case 1:</div><div class='ctx'> 			res.attr_bitmask[2] &amp;= FATTR4_WORD2_NFS41_MASK;</div><div class='add'>+			bitmask[2] = FATTR4_WORD2_SUPPATTR_EXCLCREAT &amp;</div><div class='add'>+				     res.attr_bitmask[2];</div><div class='ctx'> 			break;</div><div class='ctx'> 		case 2:</div><div class='ctx'> 			res.attr_bitmask[2] &amp;= FATTR4_WORD2_NFS42_MASK;</div><div class='add'>+			bitmask[2] = (FATTR4_WORD2_SUPPATTR_EXCLCREAT |</div><div class='add'>+				      FATTR4_WORD2_OPEN_ARGUMENTS) &amp;</div><div class='add'>+				     res.attr_bitmask[2];</div><div class='ctx'> 		}</div><div class='ctx'> 		memcpy(server-&gt;attr_bitmask, res.attr_bitmask, sizeof(server-&gt;attr_bitmask));</div><div class='del'>-		server-&gt;caps &amp;= ~(NFS_CAP_ACLS | NFS_CAP_HARDLINKS |</div><div class='del'>-				  NFS_CAP_SYMLINKS| NFS_CAP_SECURITY_LABEL);</div><div class='add'>+		server-&gt;caps &amp;=</div><div class='add'>+			~(NFS_CAP_ACLS | NFS_CAP_HARDLINKS | NFS_CAP_SYMLINKS |</div><div class='add'>+			  NFS_CAP_SECURITY_LABEL | NFS_CAP_FS_LOCATIONS |</div><div class='add'>+			  NFS_CAP_OPEN_XOR | NFS_CAP_DELEGTIME);</div><div class='ctx'> 		server-&gt;fattr_valid = NFS_ATTR_FATTR_V4;</div><div class='ctx'> 		if (res.attr_bitmask[0] &amp; FATTR4_WORD0_ACL &amp;&amp;</div><div class='ctx'> 				res.acl_bitmask &amp; ACL4_SUPPORT_ALLOW_ACL)</div><div class='hunk'>@@ -3870,10 +4030,16 @@ static int _nfs4_server_capabilities(struct nfs_server *server, struct nfs_fh *f</div><div class='ctx'> 			server-&gt;caps |= NFS_CAP_HARDLINKS;</div><div class='ctx'> 		if (res.has_symlinks != 0)</div><div class='ctx'> 			server-&gt;caps |= NFS_CAP_SYMLINKS;</div><div class='add'>+		if (res.case_insensitive)</div><div class='add'>+			server-&gt;caps |= NFS_CAP_CASE_INSENSITIVE;</div><div class='add'>+		if (res.case_preserving)</div><div class='add'>+			server-&gt;caps |= NFS_CAP_CASE_PRESERVING;</div><div class='ctx'> #ifdef CONFIG_NFS_V4_SECURITY_LABEL</div><div class='ctx'> 		if (res.attr_bitmask[2] &amp; FATTR4_WORD2_SECURITY_LABEL)</div><div class='ctx'> 			server-&gt;caps |= NFS_CAP_SECURITY_LABEL;</div><div class='ctx'> #endif</div><div class='add'>+		if (res.attr_bitmask[0] &amp; FATTR4_WORD0_FS_LOCATIONS)</div><div class='add'>+			server-&gt;caps |= NFS_CAP_FS_LOCATIONS;</div><div class='ctx'> 		if (!(res.attr_bitmask[0] &amp; FATTR4_WORD0_FILEID))</div><div class='ctx'> 			server-&gt;fattr_valid &amp;= ~NFS_ATTR_FATTR_FILEID;</div><div class='ctx'> 		if (!(res.attr_bitmask[1] &amp; FATTR4_WORD1_MODE))</div><div class='hunk'>@@ -3894,10 +4060,20 @@ static int _nfs4_server_capabilities(struct nfs_server *server, struct nfs_fh *f</div><div class='ctx'> 			server-&gt;fattr_valid &amp;= ~NFS_ATTR_FATTR_CTIME;</div><div class='ctx'> 		if (!(res.attr_bitmask[1] &amp; FATTR4_WORD1_TIME_MODIFY))</div><div class='ctx'> 			server-&gt;fattr_valid &amp;= ~NFS_ATTR_FATTR_MTIME;</div><div class='add'>+		if (!(res.attr_bitmask[1] &amp; FATTR4_WORD1_TIME_MODIFY))</div><div class='add'>+			server-&gt;fattr_valid &amp;= ~NFS_ATTR_FATTR_MTIME;</div><div class='add'>+		if (!(res.attr_bitmask[1] &amp; FATTR4_WORD1_TIME_CREATE))</div><div class='add'>+			server-&gt;fattr_valid &amp;= ~NFS_ATTR_FATTR_BTIME;</div><div class='ctx'> 		memcpy(server-&gt;attr_bitmask_nl, res.attr_bitmask,</div><div class='ctx'> 				sizeof(server-&gt;attr_bitmask));</div><div class='ctx'> 		server-&gt;attr_bitmask_nl[2] &amp;= ~FATTR4_WORD2_SECURITY_LABEL;</div><div class='ctx'> </div><div class='add'>+		if (res.open_caps.oa_share_access_want[0] &amp;</div><div class='add'>+		    NFS4_SHARE_WANT_OPEN_XOR_DELEGATION)</div><div class='add'>+			server-&gt;caps |= NFS_CAP_OPEN_XOR;</div><div class='add'>+		if (nfs4_server_delegtime_capable(&amp;res))</div><div class='add'>+			server-&gt;caps |= NFS_CAP_DELEGTIME;</div><div class='add'>+</div><div class='ctx'> 		memcpy(server-&gt;cache_consistency_bitmask, res.attr_bitmask, sizeof(server-&gt;cache_consistency_bitmask));</div><div class='ctx'> 		server-&gt;cache_consistency_bitmask[0] &amp;= FATTR4_WORD0_CHANGE|FATTR4_WORD0_SIZE;</div><div class='ctx'> 		server-&gt;cache_consistency_bitmask[1] &amp;= FATTR4_WORD1_TIME_METADATA|FATTR4_WORD1_TIME_MODIFY;</div><div class='hunk'>@@ -3923,7 +4099,6 @@ int nfs4_server_capabilities(struct nfs_server *server, struct nfs_fh *fhandle)</div><div class='ctx'> 	};</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	nfs4_server_set_init_caps(server);</div><div class='ctx'> 	do {</div><div class='ctx'> 		err = nfs4_handle_exception(server,</div><div class='ctx'> 				_nfs4_server_capabilities(server, fhandle),</div><div class='hunk'>@@ -3932,16 +4107,157 @@ int nfs4_server_capabilities(struct nfs_server *server, struct nfs_fh *fhandle)</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void test_fs_location_for_trunking(struct nfs4_fs_location *location,</div><div class='add'>+					  struct nfs_client *clp,</div><div class='add'>+					  struct nfs_server *server)</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; location-&gt;nservers; i++) {</div><div class='add'>+		struct nfs4_string *srv_loc = &amp;location-&gt;servers[i];</div><div class='add'>+		struct sockaddr_storage addr;</div><div class='add'>+		size_t addrlen;</div><div class='add'>+		struct xprt_create xprt_args = {</div><div class='add'>+			.ident = 0,</div><div class='add'>+			.net = clp-&gt;cl_net,</div><div class='add'>+		};</div><div class='add'>+		struct nfs4_add_xprt_data xprtdata = {</div><div class='add'>+			.clp = clp,</div><div class='add'>+		};</div><div class='add'>+		struct rpc_add_xprt_test rpcdata = {</div><div class='add'>+			.add_xprt_test = clp-&gt;cl_mvops-&gt;session_trunk,</div><div class='add'>+			.data = &amp;xprtdata,</div><div class='add'>+		};</div><div class='add'>+		char *servername = NULL;</div><div class='add'>+</div><div class='add'>+		if (!srv_loc-&gt;len)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		addrlen = nfs_parse_server_name(srv_loc-&gt;data, srv_loc-&gt;len,</div><div class='add'>+						&amp;addr, sizeof(addr),</div><div class='add'>+						clp-&gt;cl_net, server-&gt;port);</div><div class='add'>+		if (!addrlen)</div><div class='add'>+			return;</div><div class='add'>+		xprt_args.dstaddr = (struct sockaddr *)&amp;addr;</div><div class='add'>+		xprt_args.addrlen = addrlen;</div><div class='add'>+		servername = kmalloc(srv_loc-&gt;len + 1, GFP_KERNEL);</div><div class='add'>+		if (!servername)</div><div class='add'>+			return;</div><div class='add'>+		memcpy(servername, srv_loc-&gt;data, srv_loc-&gt;len);</div><div class='add'>+		servername[srv_loc-&gt;len] = '\0';</div><div class='add'>+		xprt_args.servername = servername;</div><div class='add'>+</div><div class='add'>+		xprtdata.cred = nfs4_get_clid_cred(clp);</div><div class='add'>+		rpc_clnt_add_xprt(clp-&gt;cl_rpcclient, &amp;xprt_args,</div><div class='add'>+				  rpc_clnt_setup_test_and_add_xprt,</div><div class='add'>+				  &amp;rpcdata);</div><div class='add'>+		if (xprtdata.cred)</div><div class='add'>+			put_cred(xprtdata.cred);</div><div class='add'>+		kfree(servername);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool _is_same_nfs4_pathname(struct nfs4_pathname *path1,</div><div class='add'>+				   struct nfs4_pathname *path2)</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	if (path1-&gt;ncomponents != path2-&gt;ncomponents)</div><div class='add'>+		return false;</div><div class='add'>+	for (i = 0; i &lt; path1-&gt;ncomponents; i++) {</div><div class='add'>+		if (path1-&gt;components[i].len != path2-&gt;components[i].len)</div><div class='add'>+			return false;</div><div class='add'>+		if (memcmp(path1-&gt;components[i].data, path2-&gt;components[i].data,</div><div class='add'>+				path1-&gt;components[i].len))</div><div class='add'>+			return false;</div><div class='add'>+	}</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int _nfs4_discover_trunking(struct nfs_server *server,</div><div class='add'>+				   struct nfs_fh *fhandle)</div><div class='add'>+{</div><div class='add'>+	struct nfs4_fs_locations *locations = NULL;</div><div class='add'>+	struct page *page;</div><div class='add'>+	const struct cred *cred;</div><div class='add'>+	struct nfs_client *clp = server-&gt;nfs_client;</div><div class='add'>+	const struct nfs4_state_maintenance_ops *ops =</div><div class='add'>+		clp-&gt;cl_mvops-&gt;state_renewal_ops;</div><div class='add'>+	int status = -ENOMEM, i;</div><div class='add'>+</div><div class='add'>+	cred = ops-&gt;get_state_renewal_cred(clp);</div><div class='add'>+	if (cred == NULL) {</div><div class='add'>+		cred = nfs4_get_clid_cred(clp);</div><div class='add'>+		if (cred == NULL)</div><div class='add'>+			return -ENOKEY;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	page = alloc_page(GFP_KERNEL);</div><div class='add'>+	if (!page)</div><div class='add'>+		goto out_put_cred;</div><div class='add'>+	locations = kmalloc(sizeof(struct nfs4_fs_locations), GFP_KERNEL);</div><div class='add'>+	if (!locations)</div><div class='add'>+		goto out_free;</div><div class='add'>+	locations-&gt;fattr = nfs_alloc_fattr();</div><div class='add'>+	if (!locations-&gt;fattr)</div><div class='add'>+		goto out_free_2;</div><div class='add'>+</div><div class='add'>+	status = nfs4_proc_get_locations(server, fhandle, locations, page,</div><div class='add'>+					 cred);</div><div class='add'>+	if (status)</div><div class='add'>+		goto out_free_3;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; locations-&gt;nlocations; i++) {</div><div class='add'>+		if (!_is_same_nfs4_pathname(&amp;locations-&gt;fs_path,</div><div class='add'>+					&amp;locations-&gt;locations[i].rootpath))</div><div class='add'>+			continue;</div><div class='add'>+		test_fs_location_for_trunking(&amp;locations-&gt;locations[i], clp,</div><div class='add'>+					      server);</div><div class='add'>+	}</div><div class='add'>+out_free_3:</div><div class='add'>+	kfree(locations-&gt;fattr);</div><div class='add'>+out_free_2:</div><div class='add'>+	kfree(locations);</div><div class='add'>+out_free:</div><div class='add'>+	__free_page(page);</div><div class='add'>+out_put_cred:</div><div class='add'>+	put_cred(cred);</div><div class='add'>+	return status;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int nfs4_discover_trunking(struct nfs_server *server,</div><div class='add'>+				  struct nfs_fh *fhandle)</div><div class='add'>+{</div><div class='add'>+	struct nfs4_exception exception = {</div><div class='add'>+		.interruptible = true,</div><div class='add'>+	};</div><div class='add'>+	struct nfs_client *clp = server-&gt;nfs_client;</div><div class='add'>+	int err = 0;</div><div class='add'>+</div><div class='add'>+	if (!nfs4_has_session(clp))</div><div class='add'>+		goto out;</div><div class='add'>+	do {</div><div class='add'>+		err = nfs4_handle_exception(server,</div><div class='add'>+				_nfs4_discover_trunking(server, fhandle),</div><div class='add'>+				&amp;exception);</div><div class='add'>+	} while (exception.retry);</div><div class='add'>+out:</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int _nfs4_lookup_root(struct nfs_server *server, struct nfs_fh *fhandle,</div><div class='del'>-		struct nfs_fsinfo *info)</div><div class='add'>+			     struct nfs_fattr *fattr)</div><div class='ctx'> {</div><div class='del'>-	u32 bitmask[3];</div><div class='add'>+	u32 bitmask[3] = {</div><div class='add'>+		[0] = FATTR4_WORD0_TYPE | FATTR4_WORD0_CHANGE |</div><div class='add'>+		      FATTR4_WORD0_SIZE | FATTR4_WORD0_FSID,</div><div class='add'>+	};</div><div class='ctx'> 	struct nfs4_lookup_root_arg args = {</div><div class='ctx'> 		.bitmask = bitmask,</div><div class='ctx'> 	};</div><div class='ctx'> 	struct nfs4_lookup_res res = {</div><div class='ctx'> 		.server = server,</div><div class='del'>-		.fattr = info-&gt;fattr,</div><div class='add'>+		.fattr = fattr,</div><div class='ctx'> 		.fh = fhandle,</div><div class='ctx'> 	};</div><div class='ctx'> 	struct rpc_message msg = {</div><div class='hunk'>@@ -3950,27 +4266,20 @@ static int _nfs4_lookup_root(struct nfs_server *server, struct nfs_fh *fhandle,</div><div class='ctx'> 		.rpc_resp = &amp;res,</div><div class='ctx'> 	};</div><div class='ctx'> </div><div class='del'>-	bitmask[0] = nfs4_fattr_bitmap[0];</div><div class='del'>-	bitmask[1] = nfs4_fattr_bitmap[1];</div><div class='del'>-	/*</div><div class='del'>-	 * Process the label in the upcoming getfattr</div><div class='del'>-	 */</div><div class='del'>-	bitmask[2] = nfs4_fattr_bitmap[2] &amp; ~FATTR4_WORD2_SECURITY_LABEL;</div><div class='del'>-</div><div class='del'>-	nfs_fattr_init(info-&gt;fattr);</div><div class='add'>+	nfs_fattr_init(fattr);</div><div class='ctx'> 	return nfs4_call_sync(server-&gt;client, server, &amp;msg, &amp;args.seq_args, &amp;res.seq_res, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int nfs4_lookup_root(struct nfs_server *server, struct nfs_fh *fhandle,</div><div class='del'>-		struct nfs_fsinfo *info)</div><div class='add'>+			    struct nfs_fattr *fattr)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_exception exception = {</div><div class='ctx'> 		.interruptible = true,</div><div class='ctx'> 	};</div><div class='ctx'> 	int err;</div><div class='ctx'> 	do {</div><div class='del'>-		err = _nfs4_lookup_root(server, fhandle, info);</div><div class='del'>-		trace_nfs4_lookup_root(server, fhandle, info-&gt;fattr, err);</div><div class='add'>+		err = _nfs4_lookup_root(server, fhandle, fattr);</div><div class='add'>+		trace_nfs4_lookup_root(server, fhandle, fattr, err);</div><div class='ctx'> 		switch (err) {</div><div class='ctx'> 		case 0:</div><div class='ctx'> 		case -NFS4ERR_WRONGSEC:</div><div class='hunk'>@@ -3983,8 +4292,9 @@ out:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int nfs4_lookup_root_sec(struct nfs_server *server, struct nfs_fh *fhandle,</div><div class='del'>-				struct nfs_fsinfo *info, rpc_authflavor_t flavor)</div><div class='add'>+static int nfs4_lookup_root_sec(struct nfs_server *server,</div><div class='add'>+				struct nfs_fh *fhandle, struct nfs_fattr *fattr,</div><div class='add'>+				rpc_authflavor_t flavor)</div><div class='ctx'> {</div><div class='ctx'> 	struct rpc_auth_create_args auth_args = {</div><div class='ctx'> 		.pseudoflavor = flavor,</div><div class='hunk'>@@ -3994,7 +4304,7 @@ static int nfs4_lookup_root_sec(struct nfs_server *server, struct nfs_fh *fhandl</div><div class='ctx'> 	auth = rpcauth_create(&amp;auth_args, server-&gt;client);</div><div class='ctx'> 	if (IS_ERR(auth))</div><div class='ctx'> 		return -EACCES;</div><div class='del'>-	return nfs4_lookup_root(server, fhandle, info);</div><div class='add'>+	return nfs4_lookup_root(server, fhandle, fattr);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -4007,7 +4317,7 @@ static int nfs4_lookup_root_sec(struct nfs_server *server, struct nfs_fh *fhandl</div><div class='ctx'>  * negative errno value.</div><div class='ctx'>  */</div><div class='ctx'> static int nfs4_find_root_sec(struct nfs_server *server, struct nfs_fh *fhandle,</div><div class='del'>-			      struct nfs_fsinfo *info)</div><div class='add'>+			      struct nfs_fattr *fattr)</div><div class='ctx'> {</div><div class='ctx'> 	/* Per 3530bis 15.33.5 */</div><div class='ctx'> 	static const rpc_authflavor_t flav_array[] = {</div><div class='hunk'>@@ -4023,8 +4333,9 @@ static int nfs4_find_root_sec(struct nfs_server *server, struct nfs_fh *fhandle,</div><div class='ctx'> 	if (server-&gt;auth_info.flavor_len &gt; 0) {</div><div class='ctx'> 		/* try each flavor specified by user */</div><div class='ctx'> 		for (i = 0; i &lt; server-&gt;auth_info.flavor_len; i++) {</div><div class='del'>-			status = nfs4_lookup_root_sec(server, fhandle, info,</div><div class='del'>-						server-&gt;auth_info.flavors[i]);</div><div class='add'>+			status = nfs4_lookup_root_sec(</div><div class='add'>+				server, fhandle, fattr,</div><div class='add'>+				server-&gt;auth_info.flavors[i]);</div><div class='ctx'> 			if (status == -NFS4ERR_WRONGSEC || status == -EACCES)</div><div class='ctx'> 				continue;</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -4032,7 +4343,7 @@ static int nfs4_find_root_sec(struct nfs_server *server, struct nfs_fh *fhandle,</div><div class='ctx'> 	} else {</div><div class='ctx'> 		/* no flavors specified by user, try default list */</div><div class='ctx'> 		for (i = 0; i &lt; ARRAY_SIZE(flav_array); i++) {</div><div class='del'>-			status = nfs4_lookup_root_sec(server, fhandle, info,</div><div class='add'>+			status = nfs4_lookup_root_sec(server, fhandle, fattr,</div><div class='ctx'> 						      flav_array[i]);</div><div class='ctx'> 			if (status == -NFS4ERR_WRONGSEC || status == -EACCES)</div><div class='ctx'> 				continue;</div><div class='hunk'>@@ -4056,28 +4367,22 @@ static int nfs4_find_root_sec(struct nfs_server *server, struct nfs_fh *fhandle,</div><div class='ctx'>  * nfs4_proc_get_rootfh - get file handle for server's pseudoroot</div><div class='ctx'>  * @server: initialized nfs_server handle</div><div class='ctx'>  * @fhandle: we fill in the pseudo-fs root file handle</div><div class='del'>- * @info: we fill in an FSINFO struct</div><div class='add'>+ * @fattr: we fill in a bare bones struct fattr</div><div class='ctx'>  * @auth_probe: probe the auth flavours</div><div class='ctx'>  *</div><div class='ctx'>  * Returns zero on success, or a negative errno.</div><div class='ctx'>  */</div><div class='ctx'> int nfs4_proc_get_rootfh(struct nfs_server *server, struct nfs_fh *fhandle,</div><div class='del'>-			 struct nfs_fsinfo *info,</div><div class='del'>-			 bool auth_probe)</div><div class='add'>+			 struct nfs_fattr *fattr, bool auth_probe)</div><div class='ctx'> {</div><div class='ctx'> 	int status = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (!auth_probe)</div><div class='del'>-		status = nfs4_lookup_root(server, fhandle, info);</div><div class='add'>+		status = nfs4_lookup_root(server, fhandle, fattr);</div><div class='ctx'> </div><div class='ctx'> 	if (auth_probe || status == NFS4ERR_WRONGSEC)</div><div class='del'>-		status = server-&gt;nfs_client-&gt;cl_mvops-&gt;find_root_sec(server,</div><div class='del'>-				fhandle, info);</div><div class='del'>-</div><div class='del'>-	if (status == 0)</div><div class='del'>-		status = nfs4_server_capabilities(server, fhandle);</div><div class='del'>-	if (status == 0)</div><div class='del'>-		status = nfs4_do_fsinfo(server, fhandle, info);</div><div class='add'>+		status = server-&gt;nfs_client-&gt;cl_mvops-&gt;find_root_sec(</div><div class='add'>+			server, fhandle, fattr);</div><div class='ctx'> </div><div class='ctx'> 	return nfs4_map_errors(status);</div><div class='ctx'> }</div><div class='hunk'>@@ -4128,6 +4433,8 @@ static int nfs4_get_referral(struct rpc_clnt *client, struct inode *dir,</div><div class='ctx'> 	if (locations == NULL)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='add'>+	locations-&gt;fattr = fattr;</div><div class='add'>+</div><div class='ctx'> 	status = nfs4_proc_fs_locations(client, dir, name, locations, page);</div><div class='ctx'> 	if (status != 0)</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -4137,17 +4444,14 @@ static int nfs4_get_referral(struct rpc_clnt *client, struct inode *dir,</div><div class='ctx'> 	 * referral.  Cause us to drop into the exception handler, which</div><div class='ctx'> 	 * will kick off migration recovery.</div><div class='ctx'> 	 */</div><div class='del'>-	if (nfs_fsid_equal(&amp;NFS_SERVER(dir)-&gt;fsid, &amp;locations-&gt;fattr.fsid)) {</div><div class='add'>+	if (nfs_fsid_equal(&amp;NFS_SERVER(dir)-&gt;fsid, &amp;fattr-&gt;fsid)) {</div><div class='ctx'> 		dprintk("%s: server did not return a different fsid for"</div><div class='ctx'> 			" a referral at %s\n", __func__, name-&gt;name);</div><div class='ctx'> 		status = -NFS4ERR_MOVED;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	/* Fixup attributes for the nfs_lookup() call to nfs_fhget() */</div><div class='del'>-	nfs_fixup_referral_attributes(&amp;locations-&gt;fattr);</div><div class='del'>-</div><div class='del'>-	/* replace the lookup nfs_fattr with the locations nfs_fattr */</div><div class='del'>-	memcpy(fattr, &amp;locations-&gt;fattr, sizeof(struct nfs_fattr));</div><div class='add'>+	nfs_fixup_referral_attributes(fattr);</div><div class='ctx'> 	memset(fhandle, 0, sizeof(struct nfs_fh));</div><div class='ctx'> out:</div><div class='ctx'> 	if (page)</div><div class='hunk'>@@ -4267,15 +4571,15 @@ nfs4_proc_setattr(struct dentry *dentry, struct nfs_fattr *fattr,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int _nfs4_proc_lookup(struct rpc_clnt *clnt, struct inode *dir,</div><div class='del'>-		struct dentry *dentry, struct nfs_fh *fhandle,</div><div class='del'>-		struct nfs_fattr *fattr)</div><div class='add'>+		struct dentry *dentry, const struct qstr *name,</div><div class='add'>+		struct nfs_fh *fhandle, struct nfs_fattr *fattr)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_server *server = NFS_SERVER(dir);</div><div class='ctx'> 	int		       status;</div><div class='ctx'> 	struct nfs4_lookup_arg args = {</div><div class='ctx'> 		.bitmask = server-&gt;attr_bitmask,</div><div class='ctx'> 		.dir_fh = NFS_FH(dir),</div><div class='del'>-		.name = &amp;dentry-&gt;d_name,</div><div class='add'>+		.name = name,</div><div class='ctx'> 	};</div><div class='ctx'> 	struct nfs4_lookup_res res = {</div><div class='ctx'> 		.server = server,</div><div class='hunk'>@@ -4289,7 +4593,7 @@ static int _nfs4_proc_lookup(struct rpc_clnt *clnt, struct inode *dir,</div><div class='ctx'> 	};</div><div class='ctx'> 	unsigned short task_flags = 0;</div><div class='ctx'> </div><div class='del'>-	if (server-&gt;nfs_client-&gt;cl_minorversion)</div><div class='add'>+	if (nfs_server_capable(dir, NFS_CAP_MOVEABLE))</div><div class='ctx'> 		task_flags = RPC_TASK_MOVEABLE;</div><div class='ctx'> </div><div class='ctx'> 	/* Is this is an attribute revalidation, subject to softreval? */</div><div class='hunk'>@@ -4317,17 +4621,16 @@ static void nfs_fixup_secinfo_attributes(struct nfs_fattr *fattr)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int nfs4_proc_lookup_common(struct rpc_clnt **clnt, struct inode *dir,</div><div class='del'>-				   struct dentry *dentry, struct nfs_fh *fhandle,</div><div class='del'>-				   struct nfs_fattr *fattr)</div><div class='add'>+				   struct dentry *dentry, const struct qstr *name,</div><div class='add'>+				   struct nfs_fh *fhandle, struct nfs_fattr *fattr)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_exception exception = {</div><div class='ctx'> 		.interruptible = true,</div><div class='ctx'> 	};</div><div class='ctx'> 	struct rpc_clnt *client = *clnt;</div><div class='del'>-	const struct qstr *name = &amp;dentry-&gt;d_name;</div><div class='ctx'> 	int err;</div><div class='ctx'> 	do {</div><div class='del'>-		err = _nfs4_proc_lookup(client, dir, dentry, fhandle, fattr);</div><div class='add'>+		err = _nfs4_proc_lookup(client, dir, dentry, name, fhandle, fattr);</div><div class='ctx'> 		trace_nfs4_lookup(dir, name, err);</div><div class='ctx'> 		switch (err) {</div><div class='ctx'> 		case -NFS4ERR_BADNAME:</div><div class='hunk'>@@ -4362,13 +4665,13 @@ out:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int nfs4_proc_lookup(struct inode *dir, struct dentry *dentry,</div><div class='add'>+static int nfs4_proc_lookup(struct inode *dir, struct dentry *dentry, const struct qstr *name,</div><div class='ctx'> 			    struct nfs_fh *fhandle, struct nfs_fattr *fattr)</div><div class='ctx'> {</div><div class='ctx'> 	int status;</div><div class='ctx'> 	struct rpc_clnt *client = NFS_CLIENT(dir);</div><div class='ctx'> </div><div class='del'>-	status = nfs4_proc_lookup_common(&amp;client, dir, dentry, fhandle, fattr);</div><div class='add'>+	status = nfs4_proc_lookup_common(&amp;client, dir, dentry, name, fhandle, fattr);</div><div class='ctx'> 	if (client != NFS_CLIENT(dir)) {</div><div class='ctx'> 		rpc_shutdown_client(client);</div><div class='ctx'> 		nfs_fixup_secinfo_attributes(fattr);</div><div class='hunk'>@@ -4383,7 +4686,8 @@ nfs4_proc_lookup_mountpoint(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	struct rpc_clnt *client = NFS_CLIENT(dir);</div><div class='ctx'> 	int status;</div><div class='ctx'> </div><div class='del'>-	status = nfs4_proc_lookup_common(&amp;client, dir, dentry, fhandle, fattr);</div><div class='add'>+	status = nfs4_proc_lookup_common(&amp;client, dir, dentry, &amp;dentry-&gt;d_name,</div><div class='add'>+					 fhandle, fattr);</div><div class='ctx'> 	if (status &lt; 0)</div><div class='ctx'> 		return ERR_PTR(status);</div><div class='ctx'> 	return (client == NFS_CLIENT(dir)) ? rpc_clone_client(client) : client;</div><div class='hunk'>@@ -4411,16 +4715,19 @@ static int _nfs4_proc_lookupp(struct inode *inode,</div><div class='ctx'> 	};</div><div class='ctx'> 	unsigned short task_flags = 0;</div><div class='ctx'> </div><div class='del'>-	if (NFS_SERVER(inode)-&gt;flags &amp; NFS_MOUNT_SOFTREVAL)</div><div class='add'>+	if (server-&gt;flags &amp; NFS_MOUNT_SOFTREVAL)</div><div class='ctx'> 		task_flags |= RPC_TASK_TIMEOUT;</div><div class='add'>+	if (server-&gt;caps &amp; NFS_CAP_MOVEABLE)</div><div class='add'>+		task_flags |= RPC_TASK_MOVEABLE;</div><div class='ctx'> </div><div class='ctx'> 	args.bitmask = nfs4_bitmask(server, fattr-&gt;label);</div><div class='ctx'> </div><div class='ctx'> 	nfs_fattr_init(fattr);</div><div class='add'>+	nfs4_init_sequence(&amp;args.seq_args, &amp;res.seq_res, 0, 0);</div><div class='ctx'> </div><div class='ctx'> 	dprintk("NFS call  lookupp ino=0x%lx\n", inode-&gt;i_ino);</div><div class='del'>-	status = nfs4_call_sync(clnt, server, &amp;msg, &amp;args.seq_args,</div><div class='del'>-				&amp;res.seq_res, task_flags);</div><div class='add'>+	status = nfs4_do_call_sync(clnt, server, &amp;msg, &amp;args.seq_args,</div><div class='add'>+				   &amp;res.seq_res, task_flags);</div><div class='ctx'> 	dprintk("NFS reply lookupp: %d\n", status);</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='hunk'>@@ -4441,7 +4748,8 @@ static int nfs4_proc_lookupp(struct inode *inode, struct nfs_fh *fhandle,</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int _nfs4_proc_access(struct inode *inode, struct nfs_access_entry *entry)</div><div class='add'>+static int _nfs4_proc_access(struct inode *inode, struct nfs_access_entry *entry,</div><div class='add'>+			     const struct cred *cred)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_server *server = NFS_SERVER(inode);</div><div class='ctx'> 	struct nfs4_accessargs args = {</div><div class='hunk'>@@ -4455,11 +4763,11 @@ static int _nfs4_proc_access(struct inode *inode, struct nfs_access_entry *entry</div><div class='ctx'> 		.rpc_proc = &amp;nfs4_procedures[NFSPROC4_CLNT_ACCESS],</div><div class='ctx'> 		.rpc_argp = &amp;args,</div><div class='ctx'> 		.rpc_resp = &amp;res,</div><div class='del'>-		.rpc_cred = entry-&gt;cred,</div><div class='add'>+		.rpc_cred = cred,</div><div class='ctx'> 	};</div><div class='ctx'> 	int status = 0;</div><div class='ctx'> </div><div class='del'>-	if (!nfs4_have_delegation(inode, FMODE_READ)) {</div><div class='add'>+	if (!nfs4_have_delegation(inode, FMODE_READ, 0)) {</div><div class='ctx'> 		res.fattr = nfs_alloc_fattr();</div><div class='ctx'> 		if (res.fattr == NULL)</div><div class='ctx'> 			return -ENOMEM;</div><div class='hunk'>@@ -4475,14 +4783,15 @@ static int _nfs4_proc_access(struct inode *inode, struct nfs_access_entry *entry</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int nfs4_proc_access(struct inode *inode, struct nfs_access_entry *entry)</div><div class='add'>+static int nfs4_proc_access(struct inode *inode, struct nfs_access_entry *entry,</div><div class='add'>+			    const struct cred *cred)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_exception exception = {</div><div class='ctx'> 		.interruptible = true,</div><div class='ctx'> 	};</div><div class='ctx'> 	int err;</div><div class='ctx'> 	do {</div><div class='del'>-		err = _nfs4_proc_access(inode, entry);</div><div class='add'>+		err = _nfs4_proc_access(inode, entry, cred);</div><div class='ctx'> 		trace_nfs4_access(inode, err);</div><div class='ctx'> 		err = nfs4_handle_exception(NFS_SERVER(inode), err,</div><div class='ctx'> 				&amp;exception);</div><div class='hunk'>@@ -4555,7 +4864,7 @@ nfs4_proc_create(struct inode *dir, struct dentry *dentry, struct iattr *sattr,</div><div class='ctx'> 		 int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_server *server = NFS_SERVER(dir);</div><div class='del'>-	struct nfs4_label l, *ilabel = NULL;</div><div class='add'>+	struct nfs4_label l, *ilabel;</div><div class='ctx'> 	struct nfs_open_context *ctx;</div><div class='ctx'> 	struct nfs4_state *state;</div><div class='ctx'> 	int status = 0;</div><div class='hunk'>@@ -4663,8 +4972,10 @@ static void nfs4_proc_unlink_setup(struct rpc_message *msg,</div><div class='ctx'> </div><div class='ctx'> 	nfs_fattr_init(res-&gt;dir_attr);</div><div class='ctx'> </div><div class='del'>-	if (inode)</div><div class='add'>+	if (inode) {</div><div class='ctx'> 		nfs4_inode_return_delegation(inode);</div><div class='add'>+		nfs_d_prune_case_insensitive_aliases(inode);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void nfs4_proc_unlink_rpc_prepare(struct rpc_task *task, struct nfs_unlinkdata *data)</div><div class='hunk'>@@ -4730,6 +5041,7 @@ static int nfs4_proc_rename_done(struct rpc_task *task, struct inode *old_dir,</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='ctx'> 	if (task-&gt;tk_status == 0) {</div><div class='add'>+		nfs_d_prune_case_insensitive_aliases(d_inode(data-&gt;old_dentry));</div><div class='ctx'> 		if (new_dir != old_dir) {</div><div class='ctx'> 			/* Note: If we moved a directory, nlink will change */</div><div class='ctx'> 			nfs4_update_changeattr(old_dir, &amp;res-&gt;old_cinfo,</div><div class='hunk'>@@ -4773,8 +5085,9 @@ static int _nfs4_proc_link(struct inode *inode, struct inode *dir, const struct</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	nfs4_inode_make_writeable(inode);</div><div class='del'>-	nfs4_bitmap_copy_adjust(bitmask, nfs4_bitmask(server, res.fattr-&gt;label), inode,</div><div class='del'>-				NFS_INO_INVALID_CHANGE);</div><div class='add'>+	nfs4_bitmap_copy_adjust(bitmask, nfs4_bitmask(server, res.fattr-&gt;label),</div><div class='add'>+				inode,</div><div class='add'>+				NFS_INO_INVALID_CHANGE | NFS_INO_INVALID_CTIME);</div><div class='ctx'> 	status = nfs4_call_sync(server-&gt;client, server, &amp;msg, &amp;arg.seq_args, &amp;res.seq_res, 1);</div><div class='ctx'> 	if (!status) {</div><div class='ctx'> 		nfs4_update_changeattr(dir, &amp;res.cinfo, res.fattr-&gt;time_start,</div><div class='hunk'>@@ -4852,9 +5165,6 @@ static int nfs4_do_create(struct inode *dir, struct dentry *dentry, struct nfs4_</div><div class='ctx'> 				    &amp;data-&gt;arg.seq_args, &amp;data-&gt;res.seq_res, 1);</div><div class='ctx'> 	if (status == 0) {</div><div class='ctx'> 		spin_lock(&amp;dir-&gt;i_lock);</div><div class='del'>-		/* Creating a directory bumps nlink in the parent */</div><div class='del'>-		if (data-&gt;arg.ftype == NF4DIR)</div><div class='del'>-			nfs4_inc_nlink_locked(dir);</div><div class='ctx'> 		nfs4_update_changeattr_locked(dir, &amp;data-&gt;res.dir_cinfo,</div><div class='ctx'> 					      data-&gt;res.fattr-&gt;time_start,</div><div class='ctx'> 					      NFS_INO_INVALID_DATA);</div><div class='hunk'>@@ -4864,6 +5174,31 @@ static int nfs4_do_create(struct inode *dir, struct dentry *dentry, struct nfs4_</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static struct dentry *nfs4_do_mkdir(struct inode *dir, struct dentry *dentry,</div><div class='add'>+				    struct nfs4_createdata *data, int *statusp)</div><div class='add'>+{</div><div class='add'>+	struct dentry *ret;</div><div class='add'>+</div><div class='add'>+	*statusp = nfs4_call_sync(NFS_SERVER(dir)-&gt;client, NFS_SERVER(dir), &amp;data-&gt;msg,</div><div class='add'>+				    &amp;data-&gt;arg.seq_args, &amp;data-&gt;res.seq_res, 1);</div><div class='add'>+</div><div class='add'>+	if (*statusp)</div><div class='add'>+		return NULL;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;dir-&gt;i_lock);</div><div class='add'>+	/* Creating a directory bumps nlink in the parent */</div><div class='add'>+	nfs4_inc_nlink_locked(dir);</div><div class='add'>+	nfs4_update_changeattr_locked(dir, &amp;data-&gt;res.dir_cinfo,</div><div class='add'>+				      data-&gt;res.fattr-&gt;time_start,</div><div class='add'>+				      NFS_INO_INVALID_DATA);</div><div class='add'>+	spin_unlock(&amp;dir-&gt;i_lock);</div><div class='add'>+	ret = nfs_add_or_obtain(dentry, data-&gt;res.fh, data-&gt;res.fattr);</div><div class='add'>+	if (!IS_ERR(ret))</div><div class='add'>+		return ret;</div><div class='add'>+	*statusp = PTR_ERR(ret);</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void nfs4_free_createdata(struct nfs4_createdata *data)</div><div class='ctx'> {</div><div class='ctx'> 	nfs4_label_free(data-&gt;fattr.label);</div><div class='hunk'>@@ -4871,9 +5206,10 @@ static void nfs4_free_createdata(struct nfs4_createdata *data)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int _nfs4_proc_symlink(struct inode *dir, struct dentry *dentry,</div><div class='del'>-		struct page *page, unsigned int len, struct iattr *sattr,</div><div class='add'>+		struct folio *folio, unsigned int len, struct iattr *sattr,</div><div class='ctx'> 		struct nfs4_label *label)</div><div class='ctx'> {</div><div class='add'>+	struct page *page = &amp;folio-&gt;page;</div><div class='ctx'> 	struct nfs4_createdata *data;</div><div class='ctx'> 	int status = -ENAMETOOLONG;</div><div class='ctx'> </div><div class='hunk'>@@ -4898,18 +5234,18 @@ out:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int nfs4_proc_symlink(struct inode *dir, struct dentry *dentry,</div><div class='del'>-		struct page *page, unsigned int len, struct iattr *sattr)</div><div class='add'>+		struct folio *folio, unsigned int len, struct iattr *sattr)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_exception exception = {</div><div class='ctx'> 		.interruptible = true,</div><div class='ctx'> 	};</div><div class='del'>-	struct nfs4_label l, *label = NULL;</div><div class='add'>+	struct nfs4_label l, *label;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	label = nfs4_label_init_security(dir, dentry, sattr, &amp;l);</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='del'>-		err = _nfs4_proc_symlink(dir, dentry, page, len, sattr, label);</div><div class='add'>+		err = _nfs4_proc_symlink(dir, dentry, folio, len, sattr, label);</div><div class='ctx'> 		trace_nfs4_symlink(dir, &amp;dentry-&gt;d_name, err);</div><div class='ctx'> 		err = nfs4_handle_exception(NFS_SERVER(dir), err,</div><div class='ctx'> 				&amp;exception);</div><div class='hunk'>@@ -4919,32 +5255,35 @@ static int nfs4_proc_symlink(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int _nfs4_proc_mkdir(struct inode *dir, struct dentry *dentry,</div><div class='del'>-		struct iattr *sattr, struct nfs4_label *label)</div><div class='add'>+static struct dentry *_nfs4_proc_mkdir(struct inode *dir, struct dentry *dentry,</div><div class='add'>+				       struct iattr *sattr,</div><div class='add'>+				       struct nfs4_label *label, int *statusp)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_createdata *data;</div><div class='del'>-	int status = -ENOMEM;</div><div class='add'>+	struct dentry *ret = NULL;</div><div class='ctx'> </div><div class='add'>+	*statusp = -ENOMEM;</div><div class='ctx'> 	data = nfs4_alloc_createdata(dir, &amp;dentry-&gt;d_name, sattr, NF4DIR);</div><div class='ctx'> 	if (data == NULL)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	data-&gt;arg.label = label;</div><div class='del'>-	status = nfs4_do_create(dir, dentry, data);</div><div class='add'>+	ret = nfs4_do_mkdir(dir, dentry, data, statusp);</div><div class='ctx'> </div><div class='ctx'> 	nfs4_free_createdata(data);</div><div class='ctx'> out:</div><div class='del'>-	return status;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int nfs4_proc_mkdir(struct inode *dir, struct dentry *dentry,</div><div class='del'>-		struct iattr *sattr)</div><div class='add'>+static struct dentry *nfs4_proc_mkdir(struct inode *dir, struct dentry *dentry,</div><div class='add'>+				      struct iattr *sattr)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_server *server = NFS_SERVER(dir);</div><div class='ctx'> 	struct nfs4_exception exception = {</div><div class='ctx'> 		.interruptible = true,</div><div class='ctx'> 	};</div><div class='del'>-	struct nfs4_label l, *label = NULL;</div><div class='add'>+	struct nfs4_label l, *label;</div><div class='add'>+	struct dentry *alias;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	label = nfs4_label_init_security(dir, dentry, sattr, &amp;l);</div><div class='hunk'>@@ -4952,14 +5291,16 @@ static int nfs4_proc_mkdir(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	if (!(server-&gt;attr_bitmask[2] &amp; FATTR4_WORD2_MODE_UMASK))</div><div class='ctx'> 		sattr-&gt;ia_mode &amp;= ~current_umask();</div><div class='ctx'> 	do {</div><div class='del'>-		err = _nfs4_proc_mkdir(dir, dentry, sattr, label);</div><div class='add'>+		alias = _nfs4_proc_mkdir(dir, dentry, sattr, label, &amp;err);</div><div class='ctx'> 		trace_nfs4_mkdir(dir, &amp;dentry-&gt;d_name, err);</div><div class='del'>-		err = nfs4_handle_exception(NFS_SERVER(dir), err,</div><div class='del'>-				&amp;exception);</div><div class='add'>+		if (err)</div><div class='add'>+			alias = ERR_PTR(nfs4_handle_exception(NFS_SERVER(dir),</div><div class='add'>+							      err,</div><div class='add'>+							      &amp;exception));</div><div class='ctx'> 	} while (exception.retry);</div><div class='ctx'> 	nfs4_label_release_security(label);</div><div class='ctx'> </div><div class='del'>-	return err;</div><div class='add'>+	return alias;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int _nfs4_proc_readdir(struct nfs_readdir_arg *nr_arg,</div><div class='hunk'>@@ -5063,7 +5404,7 @@ static int nfs4_proc_mknod(struct inode *dir, struct dentry *dentry,</div><div class='ctx'> 	struct nfs4_exception exception = {</div><div class='ctx'> 		.interruptible = true,</div><div class='ctx'> 	};</div><div class='del'>-	struct nfs4_label l, *label = NULL;</div><div class='add'>+	struct nfs4_label l, *label;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	label = nfs4_label_init_security(dir, dentry, sattr, &amp;l);</div><div class='hunk'>@@ -5258,9 +5599,11 @@ static int nfs4_read_done_cb(struct rpc_task *task, struct nfs_pgio_header *hdr)</div><div class='ctx'> 			.inode = hdr-&gt;inode,</div><div class='ctx'> 			.state = hdr-&gt;args.context-&gt;state,</div><div class='ctx'> 			.stateid = &amp;hdr-&gt;args.stateid,</div><div class='add'>+			.retrans = hdr-&gt;retrans,</div><div class='ctx'> 		};</div><div class='ctx'> 		task-&gt;tk_status = nfs4_async_handle_exception(task,</div><div class='ctx'> 				server, task-&gt;tk_status, &amp;exception);</div><div class='add'>+		hdr-&gt;retrans = exception.retrans;</div><div class='ctx'> 		if (exception.retry) {</div><div class='ctx'> 			rpc_restart_call_prepare(task);</div><div class='ctx'> 			return -EAGAIN;</div><div class='hunk'>@@ -5293,7 +5636,7 @@ static bool nfs4_read_plus_not_supported(struct rpc_task *task,</div><div class='ctx'> 	struct rpc_message *msg = &amp;task-&gt;tk_msg;</div><div class='ctx'> </div><div class='ctx'> 	if (msg-&gt;rpc_proc == &amp;nfs4_procedures[NFSPROC4_CLNT_READ_PLUS] &amp;&amp;</div><div class='del'>-	    server-&gt;caps &amp; NFS_CAP_READ_PLUS &amp;&amp; task-&gt;tk_status == -ENOTSUPP) {</div><div class='add'>+	    task-&gt;tk_status == -ENOTSUPP) {</div><div class='ctx'> 		server-&gt;caps &amp;= ~NFS_CAP_READ_PLUS;</div><div class='ctx'> 		msg-&gt;rpc_proc = &amp;nfs4_procedures[NFSPROC4_CLNT_READ];</div><div class='ctx'> 		rpc_restart_call_prepare(task);</div><div class='hunk'>@@ -5317,17 +5660,21 @@ static int nfs4_read_done(struct rpc_task *task, struct nfs_pgio_header *hdr)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #if defined CONFIG_NFS_V4_2 &amp;&amp; defined CONFIG_NFS_V4_2_READ_PLUS</div><div class='del'>-static void nfs42_read_plus_support(struct nfs_pgio_header *hdr,</div><div class='add'>+static bool nfs42_read_plus_support(struct nfs_pgio_header *hdr,</div><div class='ctx'> 				    struct rpc_message *msg)</div><div class='ctx'> {</div><div class='ctx'> 	/* Note: We don't use READ_PLUS with pNFS yet */</div><div class='del'>-	if (nfs_server_capable(hdr-&gt;inode, NFS_CAP_READ_PLUS) &amp;&amp; !hdr-&gt;ds_clp)</div><div class='add'>+	if (nfs_server_capable(hdr-&gt;inode, NFS_CAP_READ_PLUS) &amp;&amp; !hdr-&gt;ds_clp) {</div><div class='ctx'> 		msg-&gt;rpc_proc = &amp;nfs4_procedures[NFSPROC4_CLNT_READ_PLUS];</div><div class='add'>+		return nfs_read_alloc_scratch(hdr, READ_PLUS_SCRATCH_SIZE);</div><div class='add'>+	}</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> #else</div><div class='del'>-static void nfs42_read_plus_support(struct nfs_pgio_header *hdr,</div><div class='add'>+static bool nfs42_read_plus_support(struct nfs_pgio_header *hdr,</div><div class='ctx'> 				    struct rpc_message *msg)</div><div class='ctx'> {</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> #endif /* CONFIG_NFS_V4_2 */</div><div class='ctx'> </div><div class='hunk'>@@ -5337,8 +5684,8 @@ static void nfs4_proc_read_setup(struct nfs_pgio_header *hdr,</div><div class='ctx'> 	hdr-&gt;timestamp   = jiffies;</div><div class='ctx'> 	if (!hdr-&gt;pgio_done_cb)</div><div class='ctx'> 		hdr-&gt;pgio_done_cb = nfs4_read_done_cb;</div><div class='del'>-	msg-&gt;rpc_proc = &amp;nfs4_procedures[NFSPROC4_CLNT_READ];</div><div class='del'>-	nfs42_read_plus_support(hdr, msg);</div><div class='add'>+	if (!nfs42_read_plus_support(hdr, msg))</div><div class='add'>+		msg-&gt;rpc_proc = &amp;nfs4_procedures[NFSPROC4_CLNT_READ];</div><div class='ctx'> 	nfs4_init_sequence(&amp;hdr-&gt;args.seq_args, &amp;hdr-&gt;res.seq_res, 0, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5370,10 +5717,12 @@ static int nfs4_write_done_cb(struct rpc_task *task,</div><div class='ctx'> 			.inode = hdr-&gt;inode,</div><div class='ctx'> 			.state = hdr-&gt;args.context-&gt;state,</div><div class='ctx'> 			.stateid = &amp;hdr-&gt;args.stateid,</div><div class='add'>+			.retrans = hdr-&gt;retrans,</div><div class='ctx'> 		};</div><div class='ctx'> 		task-&gt;tk_status = nfs4_async_handle_exception(task,</div><div class='ctx'> 				NFS_SERVER(inode), task-&gt;tk_status,</div><div class='ctx'> 				&amp;exception);</div><div class='add'>+		hdr-&gt;retrans = exception.retrans;</div><div class='ctx'> 		if (exception.retry) {</div><div class='ctx'> 			rpc_restart_call_prepare(task);</div><div class='ctx'> 			return -EAGAIN;</div><div class='hunk'>@@ -5419,17 +5768,17 @@ bool nfs4_write_need_cache_consistency_data(struct nfs_pgio_header *hdr)</div><div class='ctx'> 	/* Otherwise, request attributes if and only if we don't hold</div><div class='ctx'> 	 * a delegation</div><div class='ctx'> 	 */</div><div class='del'>-	return nfs4_have_delegation(hdr-&gt;inode, FMODE_READ) == 0;</div><div class='add'>+	return nfs4_have_delegation(hdr-&gt;inode, FMODE_READ, 0) == 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void nfs4_bitmask_set(__u32 bitmask[NFS4_BITMASK_SZ], const __u32 *src,</div><div class='del'>-			     struct inode *inode, struct nfs_server *server,</div><div class='del'>-			     struct nfs4_label *label)</div><div class='add'>+void nfs4_bitmask_set(__u32 bitmask[], const __u32 src[],</div><div class='add'>+		      struct inode *inode, unsigned long cache_validity)</div><div class='ctx'> {</div><div class='del'>-	unsigned long cache_validity = READ_ONCE(NFS_I(inode)-&gt;cache_validity);</div><div class='add'>+	struct nfs_server *server = NFS_SERVER(inode);</div><div class='ctx'> 	unsigned int i;</div><div class='ctx'> </div><div class='ctx'> 	memcpy(bitmask, src, sizeof(*bitmask) * NFS4_BITMASK_SZ);</div><div class='add'>+	cache_validity |= READ_ONCE(NFS_I(inode)-&gt;cache_validity);</div><div class='ctx'> </div><div class='ctx'> 	if (cache_validity &amp; NFS_INO_INVALID_CHANGE)</div><div class='ctx'> 		bitmask[0] |= FATTR4_WORD0_CHANGE;</div><div class='hunk'>@@ -5441,14 +5790,14 @@ static void nfs4_bitmask_set(__u32 bitmask[NFS4_BITMASK_SZ], const __u32 *src,</div><div class='ctx'> 		bitmask[1] |= FATTR4_WORD1_OWNER | FATTR4_WORD1_OWNER_GROUP;</div><div class='ctx'> 	if (cache_validity &amp; NFS_INO_INVALID_NLINK)</div><div class='ctx'> 		bitmask[1] |= FATTR4_WORD1_NUMLINKS;</div><div class='del'>-	if (label &amp;&amp; label-&gt;len &amp;&amp; cache_validity &amp; NFS_INO_INVALID_LABEL)</div><div class='del'>-		bitmask[2] |= FATTR4_WORD2_SECURITY_LABEL;</div><div class='ctx'> 	if (cache_validity &amp; NFS_INO_INVALID_CTIME)</div><div class='ctx'> 		bitmask[1] |= FATTR4_WORD1_TIME_METADATA;</div><div class='ctx'> 	if (cache_validity &amp; NFS_INO_INVALID_MTIME)</div><div class='ctx'> 		bitmask[1] |= FATTR4_WORD1_TIME_MODIFY;</div><div class='ctx'> 	if (cache_validity &amp; NFS_INO_INVALID_BLOCKS)</div><div class='ctx'> 		bitmask[1] |= FATTR4_WORD1_SPACE_USED;</div><div class='add'>+	if (cache_validity &amp; NFS_INO_INVALID_BTIME)</div><div class='add'>+		bitmask[1] |= FATTR4_WORD1_TIME_CREATE;</div><div class='ctx'> </div><div class='ctx'> 	if (cache_validity &amp; NFS_INO_INVALID_SIZE)</div><div class='ctx'> 		bitmask[0] |= FATTR4_WORD0_SIZE;</div><div class='hunk'>@@ -5469,7 +5818,7 @@ static void nfs4_proc_write_setup(struct nfs_pgio_header *hdr,</div><div class='ctx'> 	} else {</div><div class='ctx'> 		nfs4_bitmask_set(hdr-&gt;args.bitmask_store,</div><div class='ctx'> 				 server-&gt;cache_consistency_bitmask,</div><div class='del'>-				 hdr-&gt;inode, server, NULL);</div><div class='add'>+				 hdr-&gt;inode, NFS_INO_INVALID_BLOCKS);</div><div class='ctx'> 		hdr-&gt;args.bitmask = hdr-&gt;args.bitmask_store;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -5480,7 +5829,7 @@ static void nfs4_proc_write_setup(struct nfs_pgio_header *hdr,</div><div class='ctx'> </div><div class='ctx'> 	msg-&gt;rpc_proc = &amp;nfs4_procedures[NFSPROC4_CLNT_WRITE];</div><div class='ctx'> 	nfs4_init_sequence(&amp;hdr-&gt;args.seq_args, &amp;hdr-&gt;res.seq_res, 0, 0);</div><div class='del'>-	nfs4_state_protect_write(server-&gt;nfs_client, clnt, msg, hdr);</div><div class='add'>+	nfs4_state_protect_write(hdr-&gt;ds_clp ? hdr-&gt;ds_clp : server-&gt;nfs_client, clnt, msg, hdr);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void nfs4_proc_commit_rpc_prepare(struct rpc_task *task, struct nfs_commit_data *data)</div><div class='hunk'>@@ -5521,7 +5870,8 @@ static void nfs4_proc_commit_setup(struct nfs_commit_data *data, struct rpc_mess</div><div class='ctx'> 	data-&gt;res.server = server;</div><div class='ctx'> 	msg-&gt;rpc_proc = &amp;nfs4_procedures[NFSPROC4_CLNT_COMMIT];</div><div class='ctx'> 	nfs4_init_sequence(&amp;data-&gt;args.seq_args, &amp;data-&gt;res.seq_res, 1, 0);</div><div class='del'>-	nfs4_state_protect(server-&gt;nfs_client, NFS_SP4_MACH_CRED_COMMIT, clnt, msg);</div><div class='add'>+	nfs4_state_protect(data-&gt;ds_clp ? data-&gt;ds_clp : server-&gt;nfs_client,</div><div class='add'>+			NFS_SP4_MACH_CRED_COMMIT, clnt, msg);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int _nfs4_proc_commit(struct file *dst, struct nfs_commitargs *args,</div><div class='hunk'>@@ -5650,9 +6000,17 @@ static int nfs4_proc_renew(struct nfs_client *clp, const struct cred *cred)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline int nfs4_server_supports_acls(struct nfs_server *server)</div><div class='add'>+static bool nfs4_server_supports_acls(const struct nfs_server *server,</div><div class='add'>+				      enum nfs4_acl_type type)</div><div class='ctx'> {</div><div class='del'>-	return server-&gt;caps &amp; NFS_CAP_ACLS;</div><div class='add'>+	switch (type) {</div><div class='add'>+	default:</div><div class='add'>+		return server-&gt;attr_bitmask[0] &amp; FATTR4_WORD0_ACL;</div><div class='add'>+	case NFS4ACL_DACL:</div><div class='add'>+		return server-&gt;attr_bitmask[1] &amp; FATTR4_WORD1_DACL;</div><div class='add'>+	case NFS4ACL_SACL:</div><div class='add'>+		return server-&gt;attr_bitmask[1] &amp; FATTR4_WORD1_SACL;</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Assuming that XATTR_SIZE_MAX is a multiple of PAGE_SIZE, and that</div><div class='hunk'>@@ -5691,6 +6049,7 @@ unwind:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct nfs4_cached_acl {</div><div class='add'>+	enum nfs4_acl_type type;</div><div class='ctx'> 	int cached;</div><div class='ctx'> 	size_t len;</div><div class='ctx'> 	char data[];</div><div class='hunk'>@@ -5711,7 +6070,8 @@ static void nfs4_zap_acl_attr(struct inode *inode)</div><div class='ctx'> 	nfs4_set_cached_acl(inode, NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline ssize_t nfs4_read_cached_acl(struct inode *inode, char *buf, size_t buflen)</div><div class='add'>+static ssize_t nfs4_read_cached_acl(struct inode *inode, char *buf,</div><div class='add'>+				    size_t buflen, enum nfs4_acl_type type)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_inode *nfsi = NFS_I(inode);</div><div class='ctx'> 	struct nfs4_cached_acl *acl;</div><div class='hunk'>@@ -5721,6 +6081,8 @@ static inline ssize_t nfs4_read_cached_acl(struct inode *inode, char *buf, size_</div><div class='ctx'> 	acl = nfsi-&gt;nfs4_acl;</div><div class='ctx'> 	if (acl == NULL)</div><div class='ctx'> 		goto out;</div><div class='add'>+	if (acl-&gt;type != type)</div><div class='add'>+		goto out;</div><div class='ctx'> 	if (buf == NULL) /* user is just asking for length */</div><div class='ctx'> 		goto out_len;</div><div class='ctx'> 	if (acl-&gt;cached == 0)</div><div class='hunk'>@@ -5736,7 +6098,9 @@ out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void nfs4_write_cached_acl(struct inode *inode, struct page **pages, size_t pgbase, size_t acl_len)</div><div class='add'>+static void nfs4_write_cached_acl(struct inode *inode, struct page **pages,</div><div class='add'>+				  size_t pgbase, size_t acl_len,</div><div class='add'>+				  enum nfs4_acl_type type)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_cached_acl *acl;</div><div class='ctx'> 	size_t buflen = sizeof(*acl) + acl_len;</div><div class='hunk'>@@ -5753,6 +6117,7 @@ static void nfs4_write_cached_acl(struct inode *inode, struct page **pages, size</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		acl-&gt;cached = 0;</div><div class='ctx'> 	}</div><div class='add'>+	acl-&gt;type = type;</div><div class='ctx'> 	acl-&gt;len = acl_len;</div><div class='ctx'> out:</div><div class='ctx'> 	nfs4_set_cached_acl(inode, acl);</div><div class='hunk'>@@ -5768,14 +6133,17 @@ out:</div><div class='ctx'>  * length. The next getxattr call will then produce another round trip to</div><div class='ctx'>  * the server, this time with the input buf of the required size.</div><div class='ctx'>  */</div><div class='del'>-static ssize_t __nfs4_get_acl_uncached(struct inode *inode, void *buf, size_t buflen)</div><div class='add'>+static ssize_t __nfs4_get_acl_uncached(struct inode *inode, void *buf,</div><div class='add'>+				       size_t buflen, enum nfs4_acl_type type)</div><div class='ctx'> {</div><div class='ctx'> 	struct page **pages;</div><div class='ctx'> 	struct nfs_getaclargs args = {</div><div class='ctx'> 		.fh = NFS_FH(inode),</div><div class='add'>+		.acl_type = type,</div><div class='ctx'> 		.acl_len = buflen,</div><div class='ctx'> 	};</div><div class='ctx'> 	struct nfs_getaclres res = {</div><div class='add'>+		.acl_type = type,</div><div class='ctx'> 		.acl_len = buflen,</div><div class='ctx'> 	};</div><div class='ctx'> 	struct rpc_message msg = {</div><div class='hunk'>@@ -5791,7 +6159,7 @@ static ssize_t __nfs4_get_acl_uncached(struct inode *inode, void *buf, size_t bu</div><div class='ctx'> 		buflen = server-&gt;rsize;</div><div class='ctx'> </div><div class='ctx'> 	npages = DIV_ROUND_UP(buflen, PAGE_SIZE) + 1;</div><div class='del'>-	pages = kmalloc_array(npages, sizeof(struct page *), GFP_NOFS);</div><div class='add'>+	pages = kmalloc_array(npages, sizeof(struct page *), GFP_KERNEL);</div><div class='ctx'> 	if (!pages)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='hunk'>@@ -5804,7 +6172,7 @@ static ssize_t __nfs4_get_acl_uncached(struct inode *inode, void *buf, size_t bu</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* for decoding across pages */</div><div class='del'>-	res.acl_scratch = alloc_page(GFP_KERNEL);</div><div class='add'>+	res.acl_scratch = folio_alloc(GFP_KERNEL, 0);</div><div class='ctx'> 	if (!res.acl_scratch)</div><div class='ctx'> 		goto out_free;</div><div class='ctx'> </div><div class='hunk'>@@ -5825,7 +6193,8 @@ static ssize_t __nfs4_get_acl_uncached(struct inode *inode, void *buf, size_t bu</div><div class='ctx'> 		ret = -ERANGE;</div><div class='ctx'> 		goto out_free;</div><div class='ctx'> 	}</div><div class='del'>-	nfs4_write_cached_acl(inode, pages, res.acl_data_offset, res.acl_len);</div><div class='add'>+	nfs4_write_cached_acl(inode, pages, res.acl_data_offset, res.acl_len,</div><div class='add'>+			      type);</div><div class='ctx'> 	if (buf) {</div><div class='ctx'> 		if (res.acl_len &gt; buflen) {</div><div class='ctx'> 			ret = -ERANGE;</div><div class='hunk'>@@ -5836,23 +6205,23 @@ static ssize_t __nfs4_get_acl_uncached(struct inode *inode, void *buf, size_t bu</div><div class='ctx'> out_ok:</div><div class='ctx'> 	ret = res.acl_len;</div><div class='ctx'> out_free:</div><div class='del'>-	for (i = 0; i &lt; npages; i++)</div><div class='del'>-		if (pages[i])</div><div class='del'>-			__free_page(pages[i]);</div><div class='add'>+	while (--i &gt;= 0)</div><div class='add'>+		__free_page(pages[i]);</div><div class='ctx'> 	if (res.acl_scratch)</div><div class='del'>-		__free_page(res.acl_scratch);</div><div class='add'>+		folio_put(res.acl_scratch);</div><div class='ctx'> 	kfree(pages);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static ssize_t nfs4_get_acl_uncached(struct inode *inode, void *buf, size_t buflen)</div><div class='add'>+static ssize_t nfs4_get_acl_uncached(struct inode *inode, void *buf,</div><div class='add'>+				     size_t buflen, enum nfs4_acl_type type)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_exception exception = {</div><div class='ctx'> 		.interruptible = true,</div><div class='ctx'> 	};</div><div class='ctx'> 	ssize_t ret;</div><div class='ctx'> 	do {</div><div class='del'>-		ret = __nfs4_get_acl_uncached(inode, buf, buflen);</div><div class='add'>+		ret = __nfs4_get_acl_uncached(inode, buf, buflen, type);</div><div class='ctx'> 		trace_nfs4_get_acl(inode, ret);</div><div class='ctx'> 		if (ret &gt;= 0)</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -5861,34 +6230,39 @@ static ssize_t nfs4_get_acl_uncached(struct inode *inode, void *buf, size_t bufl</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static ssize_t nfs4_proc_get_acl(struct inode *inode, void *buf, size_t buflen)</div><div class='add'>+static ssize_t nfs4_proc_get_acl(struct inode *inode, void *buf, size_t buflen,</div><div class='add'>+				 enum nfs4_acl_type type)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_server *server = NFS_SERVER(inode);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	if (!nfs4_server_supports_acls(server))</div><div class='add'>+	if (unlikely(NFS_FH(inode)-&gt;size == 0))</div><div class='add'>+		return -ENODATA;</div><div class='add'>+	if (!nfs4_server_supports_acls(server, type))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> 	ret = nfs_revalidate_inode(inode, NFS_INO_INVALID_CHANGE);</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	if (NFS_I(inode)-&gt;cache_validity &amp; NFS_INO_INVALID_ACL)</div><div class='ctx'> 		nfs_zap_acl_cache(inode);</div><div class='del'>-	ret = nfs4_read_cached_acl(inode, buf, buflen);</div><div class='add'>+	ret = nfs4_read_cached_acl(inode, buf, buflen, type);</div><div class='ctx'> 	if (ret != -ENOENT)</div><div class='ctx'> 		/* -ENOENT is returned if there is no ACL or if there is an ACL</div><div class='ctx'> 		 * but no cached acl data, just the acl length */</div><div class='ctx'> 		return ret;</div><div class='del'>-	return nfs4_get_acl_uncached(inode, buf, buflen);</div><div class='add'>+	return nfs4_get_acl_uncached(inode, buf, buflen, type);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __nfs4_proc_set_acl(struct inode *inode, const void *buf, size_t buflen)</div><div class='add'>+static int __nfs4_proc_set_acl(struct inode *inode, const void *buf,</div><div class='add'>+			       size_t buflen, enum nfs4_acl_type type)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_server *server = NFS_SERVER(inode);</div><div class='ctx'> 	struct page *pages[NFS4ACL_MAXPAGES];</div><div class='ctx'> 	struct nfs_setaclargs arg = {</div><div class='del'>-		.fh		= NFS_FH(inode),</div><div class='del'>-		.acl_pages	= pages,</div><div class='del'>-		.acl_len	= buflen,</div><div class='add'>+		.fh = NFS_FH(inode),</div><div class='add'>+		.acl_type = type,</div><div class='add'>+		.acl_len = buflen,</div><div class='add'>+		.acl_pages = pages,</div><div class='ctx'> 	};</div><div class='ctx'> 	struct nfs_setaclres res;</div><div class='ctx'> 	struct rpc_message msg = {</div><div class='hunk'>@@ -5902,7 +6276,7 @@ static int __nfs4_proc_set_acl(struct inode *inode, const void *buf, size_t bufl</div><div class='ctx'> 	/* You can't remove system.nfs4_acl: */</div><div class='ctx'> 	if (buflen == 0)</div><div class='ctx'> 		return -EINVAL;</div><div class='del'>-	if (!nfs4_server_supports_acls(server))</div><div class='add'>+	if (!nfs4_server_supports_acls(server, type))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> 	if (npages &gt; ARRAY_SIZE(pages))</div><div class='ctx'> 		return -ERANGE;</div><div class='hunk'>@@ -5933,12 +6307,16 @@ static int __nfs4_proc_set_acl(struct inode *inode, const void *buf, size_t bufl</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int nfs4_proc_set_acl(struct inode *inode, const void *buf, size_t buflen)</div><div class='add'>+static int nfs4_proc_set_acl(struct inode *inode, const void *buf,</div><div class='add'>+			     size_t buflen, enum nfs4_acl_type type)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_exception exception = { };</div><div class='ctx'> 	int err;</div><div class='add'>+</div><div class='add'>+	if (unlikely(NFS_FH(inode)-&gt;size == 0))</div><div class='add'>+		return -ENODATA;</div><div class='ctx'> 	do {</div><div class='del'>-		err = __nfs4_proc_set_acl(inode, buf, buflen);</div><div class='add'>+		err = __nfs4_proc_set_acl(inode, buf, buflen, type);</div><div class='ctx'> 		trace_nfs4_set_acl(inode, err);</div><div class='ctx'> 		if (err == -NFS4ERR_BADOWNER || err == -NFS4ERR_BADNAME) {</div><div class='ctx'> 			/*</div><div class='hunk'>@@ -5959,7 +6337,7 @@ static int _nfs4_get_security_label(struct inode *inode, void *buf,</div><div class='ctx'> 					size_t buflen)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_server *server = NFS_SERVER(inode);</div><div class='del'>-	struct nfs4_label label = {0, 0, buflen, buf};</div><div class='add'>+	struct nfs4_label label = {0, 0, 0, buflen, buf};</div><div class='ctx'> </div><div class='ctx'> 	u32 bitmask[3] = { 0, 0, FATTR4_WORD2_SECURITY_LABEL };</div><div class='ctx'> 	struct nfs_fattr fattr = {</div><div class='hunk'>@@ -6064,7 +6442,7 @@ static int nfs4_do_set_security_label(struct inode *inode,</div><div class='ctx'> static int</div><div class='ctx'> nfs4_set_security_label(struct inode *inode, const void *buf, size_t buflen)</div><div class='ctx'> {</div><div class='del'>-	struct nfs4_label ilabel = {0, 0, buflen, (char *)buf };</div><div class='add'>+	struct nfs4_label ilabel = {0, 0, 0, buflen, (char *)buf };</div><div class='ctx'> 	struct nfs_fattr *fattr;</div><div class='ctx'> 	int status;</div><div class='ctx'> </div><div class='hunk'>@@ -6079,6 +6457,7 @@ nfs4_set_security_label(struct inode *inode, const void *buf, size_t buflen)</div><div class='ctx'> 	if (status == 0)</div><div class='ctx'> 		nfs_setsecurity(inode, fattr);</div><div class='ctx'> </div><div class='add'>+	nfs_free_fattr(fattr);</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> #endif	/* CONFIG_NFS_V4_SECURITY_LABEL */</div><div class='hunk'>@@ -6357,6 +6736,7 @@ struct nfs4_delegreturndata {</div><div class='ctx'> 	struct nfs_fh fh;</div><div class='ctx'> 	nfs4_stateid stateid;</div><div class='ctx'> 	unsigned long timestamp;</div><div class='add'>+	unsigned short retrans;</div><div class='ctx'> 	struct {</div><div class='ctx'> 		struct nfs4_layoutreturn_args arg;</div><div class='ctx'> 		struct nfs4_layoutreturn_res res;</div><div class='hunk'>@@ -6364,6 +6744,7 @@ struct nfs4_delegreturndata {</div><div class='ctx'> 		u32 roc_barrier;</div><div class='ctx'> 		bool roc;</div><div class='ctx'> 	} lr;</div><div class='add'>+	struct nfs4_delegattr sattr;</div><div class='ctx'> 	struct nfs_fattr fattr;</div><div class='ctx'> 	int rpc_status;</div><div class='ctx'> 	struct inode *inode;</div><div class='hunk'>@@ -6376,6 +6757,7 @@ static void nfs4_delegreturn_done(struct rpc_task *task, void *calldata)</div><div class='ctx'> 		.inode = data-&gt;inode,</div><div class='ctx'> 		.stateid = &amp;data-&gt;stateid,</div><div class='ctx'> 		.task_is_privileged = data-&gt;args.seq_args.sa_privileged,</div><div class='add'>+		.retrans = data-&gt;retrans,</div><div class='ctx'> 	};</div><div class='ctx'> </div><div class='ctx'> 	if (!nfs4_sequence_done(task, &amp;data-&gt;res.seq_res))</div><div class='hunk'>@@ -6388,6 +6770,30 @@ static void nfs4_delegreturn_done(struct rpc_task *task, void *calldata)</div><div class='ctx'> 			  &amp;data-&gt;res.lr_ret) == -EAGAIN)</div><div class='ctx'> 		goto out_restart;</div><div class='ctx'> </div><div class='add'>+	if (data-&gt;args.sattr_args &amp;&amp; task-&gt;tk_status != 0) {</div><div class='add'>+		switch(data-&gt;res.sattr_ret) {</div><div class='add'>+		case 0:</div><div class='add'>+			data-&gt;args.sattr_args = NULL;</div><div class='add'>+			data-&gt;res.sattr_res = false;</div><div class='add'>+			break;</div><div class='add'>+		case -NFS4ERR_ADMIN_REVOKED:</div><div class='add'>+		case -NFS4ERR_DELEG_REVOKED:</div><div class='add'>+		case -NFS4ERR_EXPIRED:</div><div class='add'>+		case -NFS4ERR_BAD_STATEID:</div><div class='add'>+			/* Let the main handler below do stateid recovery */</div><div class='add'>+			break;</div><div class='add'>+		case -NFS4ERR_OLD_STATEID:</div><div class='add'>+			if (nfs4_refresh_delegation_stateid(&amp;data-&gt;stateid,</div><div class='add'>+						data-&gt;inode))</div><div class='add'>+				goto out_restart;</div><div class='add'>+			fallthrough;</div><div class='add'>+		default:</div><div class='add'>+			data-&gt;args.sattr_args = NULL;</div><div class='add'>+			data-&gt;res.sattr_res = false;</div><div class='add'>+			goto out_restart;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	switch (task-&gt;tk_status) {</div><div class='ctx'> 	case 0:</div><div class='ctx'> 		renew_lease(data-&gt;res.server, data-&gt;timestamp);</div><div class='hunk'>@@ -6423,6 +6829,7 @@ static void nfs4_delegreturn_done(struct rpc_task *task, void *calldata)</div><div class='ctx'> 		task-&gt;tk_status = nfs4_async_handle_exception(task,</div><div class='ctx'> 				data-&gt;res.server, task-&gt;tk_status,</div><div class='ctx'> 				&amp;exception);</div><div class='add'>+		data-&gt;retrans = exception.retrans;</div><div class='ctx'> 		if (exception.retry)</div><div class='ctx'> 			goto out_restart;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -6443,7 +6850,9 @@ static void nfs4_delegreturn_release(void *calldata)</div><div class='ctx'> 		pnfs_roc_release(&amp;data-&gt;lr.arg, &amp;data-&gt;lr.res,</div><div class='ctx'> 				 data-&gt;res.lr_ret);</div><div class='ctx'> 	if (inode) {</div><div class='del'>-		nfs_post_op_update_inode_force_wcc(inode, &amp;data-&gt;fattr);</div><div class='add'>+		nfs4_fattr_set_prechange(&amp;data-&gt;fattr,</div><div class='add'>+					 inode_peek_iversion_raw(inode));</div><div class='add'>+		nfs_refresh_inode(inode, &amp;data-&gt;fattr);</div><div class='ctx'> 		nfs_iput_and_deactive(inode);</div><div class='ctx'> 	}</div><div class='ctx'> 	kfree(calldata);</div><div class='hunk'>@@ -6454,7 +6863,7 @@ static void nfs4_delegreturn_prepare(struct rpc_task *task, void *data)</div><div class='ctx'> 	struct nfs4_delegreturndata *d_data;</div><div class='ctx'> 	struct pnfs_layout_hdr *lo;</div><div class='ctx'> </div><div class='del'>-	d_data = (struct nfs4_delegreturndata *)data;</div><div class='add'>+	d_data = data;</div><div class='ctx'> </div><div class='ctx'> 	if (!d_data-&gt;lr.roc &amp;&amp; nfs4_wait_on_layoutreturn(d_data-&gt;inode, task)) {</div><div class='ctx'> 		nfs4_sequence_done(task, &amp;d_data-&gt;res.seq_res);</div><div class='hunk'>@@ -6479,7 +6888,10 @@ static const struct rpc_call_ops nfs4_delegreturn_ops = {</div><div class='ctx'> 	.rpc_release = nfs4_delegreturn_release,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int _nfs4_proc_delegreturn(struct inode *inode, const struct cred *cred, const nfs4_stateid *stateid, int issync)</div><div class='add'>+static int _nfs4_proc_delegreturn(struct inode *inode, const struct cred *cred,</div><div class='add'>+				  const nfs4_stateid *stateid,</div><div class='add'>+				  struct nfs_delegation *delegation,</div><div class='add'>+				  int issync)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_delegreturndata *data;</div><div class='ctx'> 	struct nfs_server *server = NFS_SERVER(inode);</div><div class='hunk'>@@ -6492,11 +6904,14 @@ static int _nfs4_proc_delegreturn(struct inode *inode, const struct cred *cred,</div><div class='ctx'> 		.rpc_client = server-&gt;client,</div><div class='ctx'> 		.rpc_message = &amp;msg,</div><div class='ctx'> 		.callback_ops = &amp;nfs4_delegreturn_ops,</div><div class='del'>-		.flags = RPC_TASK_ASYNC | RPC_TASK_TIMEOUT | RPC_TASK_MOVEABLE,</div><div class='add'>+		.flags = RPC_TASK_ASYNC | RPC_TASK_TIMEOUT,</div><div class='ctx'> 	};</div><div class='ctx'> 	int status = 0;</div><div class='ctx'> </div><div class='del'>-	data = kzalloc(sizeof(*data), GFP_NOFS);</div><div class='add'>+	if (nfs_server_capable(inode, NFS_CAP_MOVEABLE))</div><div class='add'>+		task_setup_data.flags |= RPC_TASK_MOVEABLE;</div><div class='add'>+</div><div class='add'>+	data = kzalloc(sizeof(*data), GFP_KERNEL);</div><div class='ctx'> 	if (data == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='hunk'>@@ -6507,8 +6922,7 @@ static int _nfs4_proc_delegreturn(struct inode *inode, const struct cred *cred,</div><div class='ctx'> 	data-&gt;args.fhandle = &amp;data-&gt;fh;</div><div class='ctx'> 	data-&gt;args.stateid = &amp;data-&gt;stateid;</div><div class='ctx'> 	nfs4_bitmask_set(data-&gt;args.bitmask_store,</div><div class='del'>-			 server-&gt;cache_consistency_bitmask, inode, server,</div><div class='del'>-			 NULL);</div><div class='add'>+			 server-&gt;cache_consistency_bitmask, inode, 0);</div><div class='ctx'> 	data-&gt;args.bitmask = data-&gt;args.bitmask_store;</div><div class='ctx'> 	nfs_copy_fh(&amp;data-&gt;fh, NFS_FH(inode));</div><div class='ctx'> 	nfs4_stateid_copy(&amp;data-&gt;stateid, stateid);</div><div class='hunk'>@@ -6529,12 +6943,27 @@ static int _nfs4_proc_delegreturn(struct inode *inode, const struct cred *cred,</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (delegation &amp;&amp;</div><div class='add'>+	    test_bit(NFS_DELEGATION_DELEGTIME, &amp;delegation-&gt;flags)) {</div><div class='add'>+		if (delegation-&gt;type &amp; FMODE_READ) {</div><div class='add'>+			data-&gt;sattr.atime = inode_get_atime(inode);</div><div class='add'>+			data-&gt;sattr.atime_set = true;</div><div class='add'>+		}</div><div class='add'>+		if (delegation-&gt;type &amp; FMODE_WRITE) {</div><div class='add'>+			data-&gt;sattr.mtime = inode_get_mtime(inode);</div><div class='add'>+			data-&gt;sattr.mtime_set = true;</div><div class='add'>+		}</div><div class='add'>+		data-&gt;args.sattr_args = &amp;data-&gt;sattr;</div><div class='add'>+		data-&gt;res.sattr_res = true;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (!data-&gt;inode)</div><div class='ctx'> 		nfs4_init_sequence(&amp;data-&gt;args.seq_args, &amp;data-&gt;res.seq_res, 1,</div><div class='ctx'> 				   1);</div><div class='ctx'> 	else</div><div class='ctx'> 		nfs4_init_sequence(&amp;data-&gt;args.seq_args, &amp;data-&gt;res.seq_res, 1,</div><div class='ctx'> 				   0);</div><div class='add'>+</div><div class='ctx'> 	task_setup_data.callback_data = data;</div><div class='ctx'> 	msg.rpc_argp = &amp;data-&gt;args;</div><div class='ctx'> 	msg.rpc_resp = &amp;data-&gt;res;</div><div class='hunk'>@@ -6552,13 +6981,16 @@ out:</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int nfs4_proc_delegreturn(struct inode *inode, const struct cred *cred, const nfs4_stateid *stateid, int issync)</div><div class='add'>+int nfs4_proc_delegreturn(struct inode *inode, const struct cred *cred,</div><div class='add'>+			  const nfs4_stateid *stateid,</div><div class='add'>+			  struct nfs_delegation *delegation, int issync)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_server *server = NFS_SERVER(inode);</div><div class='ctx'> 	struct nfs4_exception exception = { };</div><div class='ctx'> 	int err;</div><div class='ctx'> 	do {</div><div class='del'>-		err = _nfs4_proc_delegreturn(inode, cred, stateid, issync);</div><div class='add'>+		err = _nfs4_proc_delegreturn(inode, cred, stateid,</div><div class='add'>+					     delegation, issync);</div><div class='ctx'> 		trace_nfs4_delegreturn(inode, stateid, err);</div><div class='ctx'> 		switch (err) {</div><div class='ctx'> 			case -NFS4ERR_STALE_STATEID:</div><div class='hunk'>@@ -6602,7 +7034,7 @@ static int _nfs4_proc_getlk(struct nfs4_state *state, int cmd, struct file_lock</div><div class='ctx'> 	status = nfs4_call_sync(server-&gt;client, server, &amp;msg, &amp;arg.seq_args, &amp;res.seq_res, 1);</div><div class='ctx'> 	switch (status) {</div><div class='ctx'> 		case 0:</div><div class='del'>-			request-&gt;fl_type = F_UNLCK;</div><div class='add'>+			request-&gt;c.flc_type = F_UNLCK;</div><div class='ctx'> 			break;</div><div class='ctx'> 		case -NFS4ERR_DENIED:</div><div class='ctx'> 			status = 0;</div><div class='hunk'>@@ -6674,6 +7106,7 @@ struct nfs4_unlockdata {</div><div class='ctx'> 	struct file_lock fl;</div><div class='ctx'> 	struct nfs_server *server;</div><div class='ctx'> 	unsigned long timestamp;</div><div class='add'>+	unsigned short retrans;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static struct nfs4_unlockdata *nfs4_alloc_unlockdata(struct file_lock *fl,</div><div class='hunk'>@@ -6684,10 +7117,18 @@ static struct nfs4_unlockdata *nfs4_alloc_unlockdata(struct file_lock *fl,</div><div class='ctx'> 	struct nfs4_unlockdata *p;</div><div class='ctx'> 	struct nfs4_state *state = lsp-&gt;ls_state;</div><div class='ctx'> 	struct inode *inode = state-&gt;inode;</div><div class='add'>+	struct nfs_lock_context *l_ctx;</div><div class='ctx'> </div><div class='del'>-	p = kzalloc(sizeof(*p), GFP_NOFS);</div><div class='add'>+	p = kzalloc(sizeof(*p), GFP_KERNEL);</div><div class='ctx'> 	if (p == NULL)</div><div class='ctx'> 		return NULL;</div><div class='add'>+	l_ctx = nfs_get_lock_context(ctx);</div><div class='add'>+	if (!IS_ERR(l_ctx)) {</div><div class='add'>+		p-&gt;l_ctx = l_ctx;</div><div class='add'>+	} else {</div><div class='add'>+		kfree(p);</div><div class='add'>+		return NULL;</div><div class='add'>+	}</div><div class='ctx'> 	p-&gt;arg.fh = NFS_FH(inode);</div><div class='ctx'> 	p-&gt;arg.fl = &amp;p-&gt;fl;</div><div class='ctx'> 	p-&gt;arg.seqid = seqid;</div><div class='hunk'>@@ -6695,7 +7136,6 @@ static struct nfs4_unlockdata *nfs4_alloc_unlockdata(struct file_lock *fl,</div><div class='ctx'> 	p-&gt;lsp = lsp;</div><div class='ctx'> 	/* Ensure we don't close file until we're done freeing locks! */</div><div class='ctx'> 	p-&gt;ctx = get_nfs_open_context(ctx);</div><div class='del'>-	p-&gt;l_ctx = nfs_get_lock_context(ctx);</div><div class='ctx'> 	locks_init_lock(&amp;p-&gt;fl);</div><div class='ctx'> 	locks_copy_lock(&amp;p-&gt;fl, fl);</div><div class='ctx'> 	p-&gt;server = NFS_SERVER(inode);</div><div class='hunk'>@@ -6721,6 +7161,7 @@ static void nfs4_locku_done(struct rpc_task *task, void *data)</div><div class='ctx'> 	struct nfs4_exception exception = {</div><div class='ctx'> 		.inode = calldata-&gt;lsp-&gt;ls_state-&gt;inode,</div><div class='ctx'> 		.stateid = &amp;calldata-&gt;arg.stateid,</div><div class='add'>+		.retrans = calldata-&gt;retrans,</div><div class='ctx'> 	};</div><div class='ctx'> </div><div class='ctx'> 	if (!nfs4_sequence_done(task, &amp;calldata-&gt;res.seq_res))</div><div class='hunk'>@@ -6754,6 +7195,7 @@ static void nfs4_locku_done(struct rpc_task *task, void *data)</div><div class='ctx'> 			task-&gt;tk_status = nfs4_async_handle_exception(task,</div><div class='ctx'> 					calldata-&gt;server, task-&gt;tk_status,</div><div class='ctx'> 					&amp;exception);</div><div class='add'>+			calldata-&gt;retrans = exception.retrans;</div><div class='ctx'> 			if (exception.retry)</div><div class='ctx'> 				rpc_restart_call_prepare(task);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -6810,10 +7252,8 @@ static struct rpc_task *nfs4_do_unlck(struct file_lock *fl,</div><div class='ctx'> 		.workqueue = nfsiod_workqueue,</div><div class='ctx'> 		.flags = RPC_TASK_ASYNC,</div><div class='ctx'> 	};</div><div class='del'>-	struct nfs_client *client =</div><div class='del'>-		NFS_SERVER(lsp-&gt;ls_state-&gt;inode)-&gt;nfs_client;</div><div class='ctx'> </div><div class='del'>-	if (client-&gt;cl_minorversion)</div><div class='add'>+	if (nfs_server_capable(lsp-&gt;ls_state-&gt;inode, NFS_CAP_MOVEABLE))</div><div class='ctx'> 		task_setup_data.flags |= RPC_TASK_MOVEABLE;</div><div class='ctx'> </div><div class='ctx'> 	nfs4_state_protect(NFS_SERVER(lsp-&gt;ls_state-&gt;inode)-&gt;nfs_client,</div><div class='hunk'>@@ -6822,8 +7262,8 @@ static struct rpc_task *nfs4_do_unlck(struct file_lock *fl,</div><div class='ctx'> 	/* Ensure this is an unlock - when canceling a lock, the</div><div class='ctx'> 	 * canceled lock is passed in, and it won't be an unlock.</div><div class='ctx'> 	 */</div><div class='del'>-	fl-&gt;fl_type = F_UNLCK;</div><div class='del'>-	if (fl-&gt;fl_flags &amp; FL_CLOSE)</div><div class='add'>+	fl-&gt;c.flc_type = F_UNLCK;</div><div class='add'>+	if (fl-&gt;c.flc_flags &amp; FL_CLOSE)</div><div class='ctx'> 		set_bit(NFS_CONTEXT_UNLOCK, &amp;ctx-&gt;flags);</div><div class='ctx'> </div><div class='ctx'> 	data = nfs4_alloc_unlockdata(fl, ctx, lsp, seqid);</div><div class='hunk'>@@ -6849,11 +7289,11 @@ static int nfs4_proc_unlck(struct nfs4_state *state, int cmd, struct file_lock *</div><div class='ctx'> 	struct rpc_task *task;</div><div class='ctx'> 	struct nfs_seqid *(*alloc_seqid)(struct nfs_seqid_counter *, gfp_t);</div><div class='ctx'> 	int status = 0;</div><div class='del'>-	unsigned char fl_flags = request-&gt;fl_flags;</div><div class='add'>+	unsigned char saved_flags = request-&gt;c.flc_flags;</div><div class='ctx'> </div><div class='ctx'> 	status = nfs4_set_lock_state(state, request);</div><div class='ctx'> 	/* Unlock _before_ we do the RPC call */</div><div class='del'>-	request-&gt;fl_flags |= FL_EXISTS;</div><div class='add'>+	request-&gt;c.flc_flags |= FL_EXISTS;</div><div class='ctx'> 	/* Exclude nfs_delegation_claim_locks() */</div><div class='ctx'> 	mutex_lock(&amp;sp-&gt;so_delegreturn_mutex);</div><div class='ctx'> 	/* Exclude nfs4_reclaim_open_stateid() - note nesting! */</div><div class='hunk'>@@ -6863,12 +7303,13 @@ static int nfs4_proc_unlck(struct nfs4_state *state, int cmd, struct file_lock *</div><div class='ctx'> 		mutex_unlock(&amp;sp-&gt;so_delegreturn_mutex);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='add'>+	lsp = request-&gt;fl_u.nfs4_fl.owner;</div><div class='add'>+	set_bit(NFS_LOCK_UNLOCKING, &amp;lsp-&gt;ls_flags);</div><div class='ctx'> 	up_read(&amp;nfsi-&gt;rwsem);</div><div class='ctx'> 	mutex_unlock(&amp;sp-&gt;so_delegreturn_mutex);</div><div class='ctx'> 	if (status != 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	/* Is this a delegated lock? */</div><div class='del'>-	lsp = request-&gt;fl_u.nfs4_fl.owner;</div><div class='ctx'> 	if (test_bit(NFS_LOCK_INITIALIZED, &amp;lsp-&gt;ls_flags) == 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	alloc_seqid = NFS_SERVER(inode)-&gt;nfs_client-&gt;cl_mvops-&gt;alloc_seqid;</div><div class='hunk'>@@ -6876,14 +7317,16 @@ static int nfs4_proc_unlck(struct nfs4_state *state, int cmd, struct file_lock *</div><div class='ctx'> 	status = -ENOMEM;</div><div class='ctx'> 	if (IS_ERR(seqid))</div><div class='ctx'> 		goto out;</div><div class='del'>-	task = nfs4_do_unlck(request, nfs_file_open_context(request-&gt;fl_file), lsp, seqid);</div><div class='add'>+	task = nfs4_do_unlck(request,</div><div class='add'>+			     nfs_file_open_context(request-&gt;c.flc_file),</div><div class='add'>+			     lsp, seqid);</div><div class='ctx'> 	status = PTR_ERR(task);</div><div class='ctx'> 	if (IS_ERR(task))</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	status = rpc_wait_for_completion_task(task);</div><div class='ctx'> 	rpc_put_task(task);</div><div class='ctx'> out:</div><div class='del'>-	request-&gt;fl_flags = fl_flags;</div><div class='add'>+	request-&gt;c.flc_flags = saved_flags;</div><div class='ctx'> 	trace_nfs4_unlock(request, state, F_SETLK, status);</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='hunk'>@@ -6994,7 +7437,7 @@ static void nfs4_lock_done(struct rpc_task *task, void *calldata)</div><div class='ctx'> 		renew_lease(NFS_SERVER(d_inode(data-&gt;ctx-&gt;dentry)),</div><div class='ctx'> 				data-&gt;timestamp);</div><div class='ctx'> 		if (data-&gt;arg.new_lock &amp;&amp; !data-&gt;cancelled) {</div><div class='del'>-			data-&gt;fl.fl_flags &amp;= ~(FL_SLEEP | FL_ACCESS);</div><div class='add'>+			data-&gt;fl.c.flc_flags &amp;= ~(FL_SLEEP | FL_ACCESS);</div><div class='ctx'> 			if (locks_lock_inode_wait(lsp-&gt;ls_state-&gt;inode, &amp;data-&gt;fl) &lt; 0)</div><div class='ctx'> 				goto out_restart;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -7005,8 +7448,15 @@ static void nfs4_lock_done(struct rpc_task *task, void *calldata)</div><div class='ctx'> 		} else if (!nfs4_update_lock_stateid(lsp, &amp;data-&gt;res.stateid))</div><div class='ctx'> 			goto out_restart;</div><div class='ctx'> 		break;</div><div class='del'>-	case -NFS4ERR_BAD_STATEID:</div><div class='ctx'> 	case -NFS4ERR_OLD_STATEID:</div><div class='add'>+		if (data-&gt;arg.new_lock_owner != 0 &amp;&amp;</div><div class='add'>+			nfs4_refresh_open_old_stateid(&amp;data-&gt;arg.open_stateid,</div><div class='add'>+					lsp-&gt;ls_state))</div><div class='add'>+			goto out_restart;</div><div class='add'>+		if (nfs4_refresh_lock_old_stateid(&amp;data-&gt;arg.lock_stateid, lsp))</div><div class='add'>+			goto out_restart;</div><div class='add'>+		fallthrough;</div><div class='add'>+	case -NFS4ERR_BAD_STATEID:</div><div class='ctx'> 	case -NFS4ERR_STALE_STATEID:</div><div class='ctx'> 	case -NFS4ERR_EXPIRED:</div><div class='ctx'> 		if (data-&gt;arg.new_lock_owner != 0) {</div><div class='hunk'>@@ -7084,14 +7534,13 @@ static int _nfs4_do_setlk(struct nfs4_state *state, int cmd, struct file_lock *f</div><div class='ctx'> 		.flags = RPC_TASK_ASYNC | RPC_TASK_CRED_NOREF,</div><div class='ctx'> 	};</div><div class='ctx'> 	int ret;</div><div class='del'>-	struct nfs_client *client = NFS_SERVER(state-&gt;inode)-&gt;nfs_client;</div><div class='ctx'> </div><div class='del'>-	if (client-&gt;cl_minorversion)</div><div class='add'>+	if (nfs_server_capable(state-&gt;inode, NFS_CAP_MOVEABLE))</div><div class='ctx'> 		task_setup_data.flags |= RPC_TASK_MOVEABLE;</div><div class='ctx'> </div><div class='del'>-	data = nfs4_alloc_lockdata(fl, nfs_file_open_context(fl-&gt;fl_file),</div><div class='del'>-			fl-&gt;fl_u.nfs4_fl.owner,</div><div class='del'>-			recovery_type == NFS_LOCK_NEW ? GFP_KERNEL : GFP_NOFS);</div><div class='add'>+	data = nfs4_alloc_lockdata(fl,</div><div class='add'>+				   nfs_file_open_context(fl-&gt;c.flc_file),</div><div class='add'>+				   fl-&gt;fl_u.nfs4_fl.owner, GFP_KERNEL);</div><div class='ctx'> 	if (data == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	if (IS_SETLKW(cmd))</div><div class='hunk'>@@ -7196,10 +7645,10 @@ static int _nfs4_proc_setlk(struct nfs4_state *state, int cmd, struct file_lock</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_inode *nfsi = NFS_I(state-&gt;inode);</div><div class='ctx'> 	struct nfs4_state_owner *sp = state-&gt;owner;</div><div class='del'>-	unsigned char fl_flags = request-&gt;fl_flags;</div><div class='add'>+	unsigned char flags = request-&gt;c.flc_flags;</div><div class='ctx'> 	int status;</div><div class='ctx'> </div><div class='del'>-	request-&gt;fl_flags |= FL_ACCESS;</div><div class='add'>+	request-&gt;c.flc_flags |= FL_ACCESS;</div><div class='ctx'> 	status = locks_lock_inode_wait(state-&gt;inode, request);</div><div class='ctx'> 	if (status &lt; 0)</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -7208,7 +7657,7 @@ static int _nfs4_proc_setlk(struct nfs4_state *state, int cmd, struct file_lock</div><div class='ctx'> 	if (test_bit(NFS_DELEGATED_STATE, &amp;state-&gt;flags)) {</div><div class='ctx'> 		/* Yes: cache locks! */</div><div class='ctx'> 		/* ...but avoid races with delegation recall... */</div><div class='del'>-		request-&gt;fl_flags = fl_flags &amp; ~FL_SLEEP;</div><div class='add'>+		request-&gt;c.flc_flags = flags &amp; ~FL_SLEEP;</div><div class='ctx'> 		status = locks_lock_inode_wait(state-&gt;inode, request);</div><div class='ctx'> 		up_read(&amp;nfsi-&gt;rwsem);</div><div class='ctx'> 		mutex_unlock(&amp;sp-&gt;so_delegreturn_mutex);</div><div class='hunk'>@@ -7218,7 +7667,7 @@ static int _nfs4_proc_setlk(struct nfs4_state *state, int cmd, struct file_lock</div><div class='ctx'> 	mutex_unlock(&amp;sp-&gt;so_delegreturn_mutex);</div><div class='ctx'> 	status = _nfs4_do_setlk(state, cmd, request, NFS_LOCK_NEW);</div><div class='ctx'> out:</div><div class='del'>-	request-&gt;fl_flags = fl_flags;</div><div class='add'>+	request-&gt;c.flc_flags = flags;</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -7255,7 +7704,8 @@ nfs4_retry_setlk_simple(struct nfs4_state *state, int cmd,</div><div class='ctx'> 		status = nfs4_proc_setlk(state, cmd, request);</div><div class='ctx'> 		if ((status != -EAGAIN) || IS_SETLK(cmd))</div><div class='ctx'> 			break;</div><div class='del'>-		freezable_schedule_timeout_interruptible(timeout);</div><div class='add'>+		__set_current_state(TASK_INTERRUPTIBLE|TASK_FREEZABLE);</div><div class='add'>+		schedule_timeout(timeout);</div><div class='ctx'> 		timeout *= 2;</div><div class='ctx'> 		timeout = min_t(unsigned long, NFS4_LOCK_MAXTIMEOUT, timeout);</div><div class='ctx'> 		status = -ERESTARTSYS;</div><div class='hunk'>@@ -7323,10 +7773,8 @@ nfs4_retry_setlk(struct nfs4_state *state, int cmd, struct file_lock *request)</div><div class='ctx'> 			break;</div><div class='ctx'> </div><div class='ctx'> 		status = -ERESTARTSYS;</div><div class='del'>-		freezer_do_not_count();</div><div class='del'>-		wait_woken(&amp;waiter.wait, TASK_INTERRUPTIBLE,</div><div class='add'>+		wait_woken(&amp;waiter.wait, TASK_INTERRUPTIBLE|TASK_FREEZABLE,</div><div class='ctx'> 			   NFS4_LOCK_MAXTIMEOUT);</div><div class='del'>-		freezer_count();</div><div class='ctx'> 	} while (!signalled());</div><div class='ctx'> </div><div class='ctx'> 	remove_wait_queue(q, &amp;waiter.wait);</div><div class='hunk'>@@ -7361,7 +7809,7 @@ nfs4_proc_lock(struct file *filp, int cmd, struct file_lock *request)</div><div class='ctx'> 	if (!(IS_SETLK(cmd) || IS_SETLKW(cmd)))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='del'>-	if (request-&gt;fl_type == F_UNLCK) {</div><div class='add'>+	if (lock_is_unlock(request)) {</div><div class='ctx'> 		if (state != NULL)</div><div class='ctx'> 			return nfs4_proc_unlck(state, cmd, request);</div><div class='ctx'> 		return 0;</div><div class='hunk'>@@ -7370,7 +7818,7 @@ nfs4_proc_lock(struct file *filp, int cmd, struct file_lock *request)</div><div class='ctx'> 	if (state == NULL)</div><div class='ctx'> 		return -ENOLCK;</div><div class='ctx'> </div><div class='del'>-	if ((request-&gt;fl_flags &amp; FL_POSIX) &amp;&amp;</div><div class='add'>+	if ((request-&gt;c.flc_flags &amp; FL_POSIX) &amp;&amp;</div><div class='ctx'> 	    !test_bit(NFS_STATE_POSIX_LOCKS, &amp;state-&gt;flags))</div><div class='ctx'> 		return -ENOLCK;</div><div class='ctx'> </div><div class='hunk'>@@ -7378,7 +7826,7 @@ nfs4_proc_lock(struct file *filp, int cmd, struct file_lock *request)</div><div class='ctx'> 	 * Don't rely on the VFS having checked the file open mode,</div><div class='ctx'> 	 * since it won't do this for flock() locks.</div><div class='ctx'> 	 */</div><div class='del'>-	switch (request-&gt;fl_type) {</div><div class='add'>+	switch (request-&gt;c.flc_type) {</div><div class='ctx'> 	case F_RDLCK:</div><div class='ctx'> 		if (!(filp-&gt;f_mode &amp; FMODE_READ))</div><div class='ctx'> 			return -EBADF;</div><div class='hunk'>@@ -7400,7 +7848,7 @@ static int nfs4_delete_lease(struct file *file, void **priv)</div><div class='ctx'> 	return generic_setlease(file, F_UNLCK, NULL, priv);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int nfs4_add_lease(struct file *file, long arg, struct file_lock **lease,</div><div class='add'>+static int nfs4_add_lease(struct file *file, int arg, struct file_lease **lease,</div><div class='ctx'> 			  void **priv)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = file_inode(file);</div><div class='hunk'>@@ -7408,17 +7856,17 @@ static int nfs4_add_lease(struct file *file, long arg, struct file_lock **lease,</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	/* No delegation, no lease */</div><div class='del'>-	if (!nfs4_have_delegation(inode, type))</div><div class='add'>+	if (!nfs4_have_delegation(inode, type, 0))</div><div class='ctx'> 		return -EAGAIN;</div><div class='ctx'> 	ret = generic_setlease(file, arg, lease, priv);</div><div class='del'>-	if (ret || nfs4_have_delegation(inode, type))</div><div class='add'>+	if (ret || nfs4_have_delegation(inode, type, 0))</div><div class='ctx'> 		return ret;</div><div class='ctx'> 	/* We raced with a delegation return */</div><div class='ctx'> 	nfs4_delete_lease(file, priv);</div><div class='ctx'> 	return -EAGAIN;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int nfs4_proc_setlease(struct file *file, long arg, struct file_lock **lease,</div><div class='add'>+int nfs4_proc_setlease(struct file *file, int arg, struct file_lease **lease,</div><div class='ctx'> 		       void **priv)</div><div class='ctx'> {</div><div class='ctx'> 	switch (arg) {</div><div class='hunk'>@@ -7442,10 +7890,10 @@ int nfs4_lock_delegation_recall(struct file_lock *fl, struct nfs4_state *state,</div><div class='ctx'> 		return err;</div><div class='ctx'> 	do {</div><div class='ctx'> 		err = _nfs4_do_setlk(state, F_SETLK, fl, NFS_LOCK_NEW);</div><div class='del'>-		if (err != -NFS4ERR_DELAY)</div><div class='add'>+		if (err != -NFS4ERR_DELAY &amp;&amp; err != -NFS4ERR_GRACE)</div><div class='ctx'> 			break;</div><div class='ctx'> 		ssleep(1);</div><div class='del'>-	} while (err == -NFS4ERR_DELAY);</div><div class='add'>+	} while (err == -NFS4ERR_DELAY || err == -NFSERR_GRACE);</div><div class='ctx'> 	return nfs4_handle_delegation_recall_error(server, state, stateid, fl, err);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -7514,7 +7962,7 @@ nfs4_release_lockowner(struct nfs_server *server, struct nfs4_lock_state *lsp)</div><div class='ctx'> 	if (server-&gt;nfs_client-&gt;cl_mvops-&gt;minor_version != 0)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	data = kmalloc(sizeof(*data), GFP_NOFS);</div><div class='add'>+	data = kmalloc(sizeof(*data), GFP_KERNEL);</div><div class='ctx'> 	if (!data)</div><div class='ctx'> 		return;</div><div class='ctx'> 	data-&gt;lsp = lsp;</div><div class='hunk'>@@ -7532,30 +7980,79 @@ nfs4_release_lockowner(struct nfs_server *server, struct nfs4_lock_state *lsp)</div><div class='ctx'> #define XATTR_NAME_NFSV4_ACL "system.nfs4_acl"</div><div class='ctx'> </div><div class='ctx'> static int nfs4_xattr_set_nfs4_acl(const struct xattr_handler *handler,</div><div class='del'>-				   struct user_namespace *mnt_userns,</div><div class='add'>+				   struct mnt_idmap *idmap,</div><div class='ctx'> 				   struct dentry *unused, struct inode *inode,</div><div class='ctx'> 				   const char *key, const void *buf,</div><div class='ctx'> 				   size_t buflen, int flags)</div><div class='ctx'> {</div><div class='del'>-	return nfs4_proc_set_acl(inode, buf, buflen);</div><div class='add'>+	return nfs4_proc_set_acl(inode, buf, buflen, NFS4ACL_ACL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int nfs4_xattr_get_nfs4_acl(const struct xattr_handler *handler,</div><div class='ctx'> 				   struct dentry *unused, struct inode *inode,</div><div class='ctx'> 				   const char *key, void *buf, size_t buflen)</div><div class='ctx'> {</div><div class='del'>-	return nfs4_proc_get_acl(inode, buf, buflen);</div><div class='add'>+	return nfs4_proc_get_acl(inode, buf, buflen, NFS4ACL_ACL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool nfs4_xattr_list_nfs4_acl(struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	return nfs4_server_supports_acls(NFS_SERVER(d_inode(dentry)));</div><div class='add'>+	return nfs4_server_supports_acls(NFS_SB(dentry-&gt;d_sb), NFS4ACL_ACL);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#if defined(CONFIG_NFS_V4_1)</div><div class='add'>+#define XATTR_NAME_NFSV4_DACL "system.nfs4_dacl"</div><div class='add'>+</div><div class='add'>+static int nfs4_xattr_set_nfs4_dacl(const struct xattr_handler *handler,</div><div class='add'>+				    struct mnt_idmap *idmap,</div><div class='add'>+				    struct dentry *unused, struct inode *inode,</div><div class='add'>+				    const char *key, const void *buf,</div><div class='add'>+				    size_t buflen, int flags)</div><div class='add'>+{</div><div class='add'>+	return nfs4_proc_set_acl(inode, buf, buflen, NFS4ACL_DACL);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int nfs4_xattr_get_nfs4_dacl(const struct xattr_handler *handler,</div><div class='add'>+				    struct dentry *unused, struct inode *inode,</div><div class='add'>+				    const char *key, void *buf, size_t buflen)</div><div class='add'>+{</div><div class='add'>+	return nfs4_proc_get_acl(inode, buf, buflen, NFS4ACL_DACL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool nfs4_xattr_list_nfs4_dacl(struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	return nfs4_server_supports_acls(NFS_SB(dentry-&gt;d_sb), NFS4ACL_DACL);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define XATTR_NAME_NFSV4_SACL "system.nfs4_sacl"</div><div class='add'>+</div><div class='add'>+static int nfs4_xattr_set_nfs4_sacl(const struct xattr_handler *handler,</div><div class='add'>+				    struct mnt_idmap *idmap,</div><div class='add'>+				    struct dentry *unused, struct inode *inode,</div><div class='add'>+				    const char *key, const void *buf,</div><div class='add'>+				    size_t buflen, int flags)</div><div class='add'>+{</div><div class='add'>+	return nfs4_proc_set_acl(inode, buf, buflen, NFS4ACL_SACL);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int nfs4_xattr_get_nfs4_sacl(const struct xattr_handler *handler,</div><div class='add'>+				    struct dentry *unused, struct inode *inode,</div><div class='add'>+				    const char *key, void *buf, size_t buflen)</div><div class='add'>+{</div><div class='add'>+	return nfs4_proc_get_acl(inode, buf, buflen, NFS4ACL_SACL);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool nfs4_xattr_list_nfs4_sacl(struct dentry *dentry)</div><div class='add'>+{</div><div class='add'>+	return nfs4_server_supports_acls(NFS_SB(dentry-&gt;d_sb), NFS4ACL_SACL);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> #ifdef CONFIG_NFS_V4_SECURITY_LABEL</div><div class='ctx'> </div><div class='ctx'> static int nfs4_xattr_set_nfs4_label(const struct xattr_handler *handler,</div><div class='del'>-				     struct user_namespace *mnt_userns,</div><div class='add'>+				     struct mnt_idmap *idmap,</div><div class='ctx'> 				     struct dentry *unused, struct inode *inode,</div><div class='ctx'> 				     const char *key, const void *buf,</div><div class='ctx'> 				     size_t buflen, int flags)</div><div class='hunk'>@@ -7606,12 +8103,12 @@ nfs4_listxattr_nfs4_label(struct inode *inode, char *list, size_t list_len)</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_NFS_V4_2</div><div class='ctx'> static int nfs4_xattr_set_nfs4_user(const struct xattr_handler *handler,</div><div class='del'>-				    struct user_namespace *mnt_userns,</div><div class='add'>+				    struct mnt_idmap *idmap,</div><div class='ctx'> 				    struct dentry *unused, struct inode *inode,</div><div class='ctx'> 				    const char *key, const void *buf,</div><div class='ctx'> 				    size_t buflen, int flags)</div><div class='ctx'> {</div><div class='del'>-	struct nfs_access_entry cache;</div><div class='add'>+	u32 mask;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!nfs_server_capable(inode, NFS_CAP_XATTR))</div><div class='hunk'>@@ -7626,8 +8123,8 @@ static int nfs4_xattr_set_nfs4_user(const struct xattr_handler *handler,</div><div class='ctx'> 	 * do a cached access check for the XA* flags to possibly avoid</div><div class='ctx'> 	 * doing an RPC and getting EACCES back.</div><div class='ctx'> 	 */</div><div class='del'>-	if (!nfs_access_get_cached(inode, current_cred(), &amp;cache, true)) {</div><div class='del'>-		if (!(cache.mask &amp; NFS_ACCESS_XAWRITE))</div><div class='add'>+	if (!nfs_access_get_cached(inode, current_cred(), &amp;mask, true)) {</div><div class='add'>+		if (!(mask &amp; NFS_ACCESS_XAWRITE))</div><div class='ctx'> 			return -EACCES;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -7648,14 +8145,14 @@ static int nfs4_xattr_get_nfs4_user(const struct xattr_handler *handler,</div><div class='ctx'> 				    struct dentry *unused, struct inode *inode,</div><div class='ctx'> 				    const char *key, void *buf, size_t buflen)</div><div class='ctx'> {</div><div class='del'>-	struct nfs_access_entry cache;</div><div class='add'>+	u32 mask;</div><div class='ctx'> 	ssize_t ret;</div><div class='ctx'> </div><div class='ctx'> 	if (!nfs_server_capable(inode, NFS_CAP_XATTR))</div><div class='ctx'> 		return -EOPNOTSUPP;</div><div class='ctx'> </div><div class='del'>-	if (!nfs_access_get_cached(inode, current_cred(), &amp;cache, true)) {</div><div class='del'>-		if (!(cache.mask &amp; NFS_ACCESS_XAREAD))</div><div class='add'>+	if (!nfs_access_get_cached(inode, current_cred(), &amp;mask, true)) {</div><div class='add'>+		if (!(mask &amp; NFS_ACCESS_XAREAD))</div><div class='ctx'> 			return -EACCES;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -7680,13 +8177,13 @@ nfs4_listxattr_nfs4_user(struct inode *inode, char *list, size_t list_len)</div><div class='ctx'> 	ssize_t ret, size;</div><div class='ctx'> 	char *buf;</div><div class='ctx'> 	size_t buflen;</div><div class='del'>-	struct nfs_access_entry cache;</div><div class='add'>+	u32 mask;</div><div class='ctx'> </div><div class='ctx'> 	if (!nfs_server_capable(inode, NFS_CAP_XATTR))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	if (!nfs_access_get_cached(inode, current_cred(), &amp;cache, true)) {</div><div class='del'>-		if (!(cache.mask &amp; NFS_ACCESS_XALIST))</div><div class='add'>+	if (!nfs_access_get_cached(inode, current_cred(), &amp;mask, true)) {</div><div class='add'>+		if (!(mask &amp; NFS_ACCESS_XALIST))</div><div class='ctx'> 			return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -7784,7 +8281,7 @@ static int _nfs4_proc_fs_locations(struct rpc_clnt *client, struct inode *dir,</div><div class='ctx'> 	else</div><div class='ctx'> 		bitmask[1] &amp;= ~FATTR4_WORD1_MOUNTED_ON_FILEID;</div><div class='ctx'> </div><div class='del'>-	nfs_fattr_init(&amp;fs_locations-&gt;fattr);</div><div class='add'>+	nfs_fattr_init(fs_locations-&gt;fattr);</div><div class='ctx'> 	fs_locations-&gt;server = server;</div><div class='ctx'> 	fs_locations-&gt;nlocations = 0;</div><div class='ctx'> 	status = nfs4_call_sync(client, server, &amp;msg, &amp;args.seq_args, &amp;res.seq_res, 0);</div><div class='hunk'>@@ -7818,18 +8315,18 @@ int nfs4_proc_fs_locations(struct rpc_clnt *client, struct inode *dir,</div><div class='ctx'>  * appended to this compound to identify the client ID which is</div><div class='ctx'>  * performing recovery.</div><div class='ctx'>  */</div><div class='del'>-static int _nfs40_proc_get_locations(struct inode *inode,</div><div class='add'>+static int _nfs40_proc_get_locations(struct nfs_server *server,</div><div class='add'>+				     struct nfs_fh *fhandle,</div><div class='ctx'> 				     struct nfs4_fs_locations *locations,</div><div class='ctx'> 				     struct page *page, const struct cred *cred)</div><div class='ctx'> {</div><div class='del'>-	struct nfs_server *server = NFS_SERVER(inode);</div><div class='ctx'> 	struct rpc_clnt *clnt = server-&gt;client;</div><div class='ctx'> 	u32 bitmask[2] = {</div><div class='ctx'> 		[0] = FATTR4_WORD0_FSID | FATTR4_WORD0_FS_LOCATIONS,</div><div class='ctx'> 	};</div><div class='ctx'> 	struct nfs4_fs_locations_arg args = {</div><div class='ctx'> 		.clientid	= server-&gt;nfs_client-&gt;cl_clientid,</div><div class='del'>-		.fh		= NFS_FH(inode),</div><div class='add'>+		.fh		= fhandle,</div><div class='ctx'> 		.page		= page,</div><div class='ctx'> 		.bitmask	= bitmask,</div><div class='ctx'> 		.migration	= 1,		/* skip LOOKUP */</div><div class='hunk'>@@ -7849,7 +8346,7 @@ static int _nfs40_proc_get_locations(struct inode *inode,</div><div class='ctx'> 	unsigned long now = jiffies;</div><div class='ctx'> 	int status;</div><div class='ctx'> </div><div class='del'>-	nfs_fattr_init(&amp;locations-&gt;fattr);</div><div class='add'>+	nfs_fattr_init(locations-&gt;fattr);</div><div class='ctx'> 	locations-&gt;server = server;</div><div class='ctx'> 	locations-&gt;nlocations = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -7875,17 +8372,17 @@ static int _nfs40_proc_get_locations(struct inode *inode,</div><div class='ctx'>  * When the client supports GETATTR(fs_locations_info), it can</div><div class='ctx'>  * be plumbed in here.</div><div class='ctx'>  */</div><div class='del'>-static int _nfs41_proc_get_locations(struct inode *inode,</div><div class='add'>+static int _nfs41_proc_get_locations(struct nfs_server *server,</div><div class='add'>+				     struct nfs_fh *fhandle,</div><div class='ctx'> 				     struct nfs4_fs_locations *locations,</div><div class='ctx'> 				     struct page *page, const struct cred *cred)</div><div class='ctx'> {</div><div class='del'>-	struct nfs_server *server = NFS_SERVER(inode);</div><div class='ctx'> 	struct rpc_clnt *clnt = server-&gt;client;</div><div class='ctx'> 	u32 bitmask[2] = {</div><div class='ctx'> 		[0] = FATTR4_WORD0_FSID | FATTR4_WORD0_FS_LOCATIONS,</div><div class='ctx'> 	};</div><div class='ctx'> 	struct nfs4_fs_locations_arg args = {</div><div class='del'>-		.fh		= NFS_FH(inode),</div><div class='add'>+		.fh		= fhandle,</div><div class='ctx'> 		.page		= page,</div><div class='ctx'> 		.bitmask	= bitmask,</div><div class='ctx'> 		.migration	= 1,		/* skip LOOKUP */</div><div class='hunk'>@@ -7900,15 +8397,26 @@ static int _nfs41_proc_get_locations(struct inode *inode,</div><div class='ctx'> 		.rpc_resp	= &amp;res,</div><div class='ctx'> 		.rpc_cred	= cred,</div><div class='ctx'> 	};</div><div class='add'>+	struct nfs4_call_sync_data data = {</div><div class='add'>+		.seq_server = server,</div><div class='add'>+		.seq_args = &amp;args.seq_args,</div><div class='add'>+		.seq_res = &amp;res.seq_res,</div><div class='add'>+	};</div><div class='add'>+	struct rpc_task_setup task_setup_data = {</div><div class='add'>+		.rpc_client = clnt,</div><div class='add'>+		.rpc_message = &amp;msg,</div><div class='add'>+		.callback_ops = server-&gt;nfs_client-&gt;cl_mvops-&gt;call_sync_ops,</div><div class='add'>+		.callback_data = &amp;data,</div><div class='add'>+		.flags = RPC_TASK_NO_ROUND_ROBIN,</div><div class='add'>+	};</div><div class='ctx'> 	int status;</div><div class='ctx'> </div><div class='del'>-	nfs_fattr_init(&amp;locations-&gt;fattr);</div><div class='add'>+	nfs_fattr_init(locations-&gt;fattr);</div><div class='ctx'> 	locations-&gt;server = server;</div><div class='ctx'> 	locations-&gt;nlocations = 0;</div><div class='ctx'> </div><div class='ctx'> 	nfs4_init_sequence(&amp;args.seq_args, &amp;res.seq_res, 0, 1);</div><div class='del'>-	status = nfs4_call_sync_sequence(clnt, server, &amp;msg,</div><div class='del'>-					&amp;args.seq_args, &amp;res.seq_res);</div><div class='add'>+	status = nfs4_call_sync_custom(&amp;task_setup_data);</div><div class='ctx'> 	if (status == NFS4_OK &amp;&amp;</div><div class='ctx'> 	    res.seq_res.sr_status_flags &amp; SEQ4_STATUS_LEASE_MOVED)</div><div class='ctx'> 		status = -NFS4ERR_LEASE_MOVED;</div><div class='hunk'>@@ -7919,7 +8427,8 @@ static int _nfs41_proc_get_locations(struct inode *inode,</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * nfs4_proc_get_locations - discover locations for a migrated FSID</div><div class='del'>- * @inode: inode on FSID that is migrating</div><div class='add'>+ * @server: pointer to nfs_server to process</div><div class='add'>+ * @fhandle: pointer to the kernel NFS client file handle</div><div class='ctx'>  * @locations: result of query</div><div class='ctx'>  * @page: buffer</div><div class='ctx'>  * @cred: credential to use for this operation</div><div class='hunk'>@@ -7934,11 +8443,11 @@ static int _nfs41_proc_get_locations(struct inode *inode,</div><div class='ctx'>  * -NFS4ERR_LEASE_MOVED is returned if the server still has leases</div><div class='ctx'>  * from this client that require migration recovery.</div><div class='ctx'>  */</div><div class='del'>-int nfs4_proc_get_locations(struct inode *inode,</div><div class='add'>+int nfs4_proc_get_locations(struct nfs_server *server,</div><div class='add'>+			    struct nfs_fh *fhandle,</div><div class='ctx'> 			    struct nfs4_fs_locations *locations,</div><div class='ctx'> 			    struct page *page, const struct cred *cred)</div><div class='ctx'> {</div><div class='del'>-	struct nfs_server *server = NFS_SERVER(inode);</div><div class='ctx'> 	struct nfs_client *clp = server-&gt;nfs_client;</div><div class='ctx'> 	const struct nfs4_mig_recovery_ops *ops =</div><div class='ctx'> 					clp-&gt;cl_mvops-&gt;mig_recovery_ops;</div><div class='hunk'>@@ -7951,10 +8460,11 @@ int nfs4_proc_get_locations(struct inode *inode,</div><div class='ctx'> 		(unsigned long long)server-&gt;fsid.major,</div><div class='ctx'> 		(unsigned long long)server-&gt;fsid.minor,</div><div class='ctx'> 		clp-&gt;cl_hostname);</div><div class='del'>-	nfs_display_fhandle(NFS_FH(inode), __func__);</div><div class='add'>+	nfs_display_fhandle(fhandle, __func__);</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='del'>-		status = ops-&gt;get_locations(inode, locations, page, cred);</div><div class='add'>+		status = ops-&gt;get_locations(server, fhandle, locations, page,</div><div class='add'>+					    cred);</div><div class='ctx'> 		if (status != -NFS4ERR_DELAY)</div><div class='ctx'> 			break;</div><div class='ctx'> 		nfs4_handle_exception(server, status, &amp;exception);</div><div class='hunk'>@@ -8219,6 +8729,7 @@ nfs4_bind_one_conn_to_session_done(struct rpc_task *task, void *calldata)</div><div class='ctx'> 	case -NFS4ERR_DEADSESSION:</div><div class='ctx'> 		nfs4_schedule_session_recovery(clp-&gt;cl_session,</div><div class='ctx'> 				task-&gt;tk_status);</div><div class='add'>+		return;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (args-&gt;dir == NFS4_CDFC4_FORE_OR_BOTH &amp;&amp;</div><div class='ctx'> 			res-&gt;dir != NFS4_CDFS4_BOTH) {</div><div class='hunk'>@@ -8556,6 +9067,8 @@ nfs4_run_exchange_id(struct nfs_client *clp, const struct cred *cred,</div><div class='ctx'> #ifdef CONFIG_NFS_V4_1_MIGRATION</div><div class='ctx'> 	calldata-&gt;args.flags |= EXCHGID4_FLAG_SUPP_MOVED_MIGR;</div><div class='ctx'> #endif</div><div class='add'>+	if (test_bit(NFS_CS_PNFS, &amp;clp-&gt;cl_flags))</div><div class='add'>+		calldata-&gt;args.flags |= EXCHGID4_FLAG_USE_PNFS_DS;</div><div class='ctx'> 	msg.rpc_argp = &amp;calldata-&gt;args;</div><div class='ctx'> 	msg.rpc_resp = &amp;calldata-&gt;res;</div><div class='ctx'> 	task_setup_data.callback_data = calldata;</div><div class='hunk'>@@ -8686,7 +9199,7 @@ int nfs4_proc_exchange_id(struct nfs_client *clp, const struct cred *cred)</div><div class='ctx'> void nfs4_test_session_trunk(struct rpc_clnt *clnt, struct rpc_xprt *xprt,</div><div class='ctx'> 			    void *data)</div><div class='ctx'> {</div><div class='del'>-	struct nfs4_add_xprt_data *adata = (struct nfs4_add_xprt_data *)data;</div><div class='add'>+	struct nfs4_add_xprt_data *adata = data;</div><div class='ctx'> 	struct rpc_task *task;</div><div class='ctx'> 	int status;</div><div class='ctx'> </div><div class='hunk'>@@ -8697,20 +9210,30 @@ void nfs4_test_session_trunk(struct rpc_clnt *clnt, struct rpc_xprt *xprt,</div><div class='ctx'> </div><div class='ctx'> 	sp4_how = (adata-&gt;clp-&gt;cl_sp4_flags == 0 ? SP4_NONE : SP4_MACH_CRED);</div><div class='ctx'> </div><div class='add'>+try_again:</div><div class='ctx'> 	/* Test connection for session trunking. Async exchange_id call */</div><div class='ctx'> 	task = nfs4_run_exchange_id(adata-&gt;clp, adata-&gt;cred, sp4_how, xprt);</div><div class='ctx'> 	if (IS_ERR(task))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	status = task-&gt;tk_status;</div><div class='del'>-	if (status == 0)</div><div class='add'>+	if (status == 0) {</div><div class='ctx'> 		status = nfs4_detect_session_trunking(adata-&gt;clp,</div><div class='ctx'> 				task-&gt;tk_msg.rpc_resp, xprt);</div><div class='del'>-</div><div class='add'>+		trace_nfs4_trunked_exchange_id(adata-&gt;clp,</div><div class='add'>+			xprt-&gt;address_strings[RPC_DISPLAY_ADDR], status);</div><div class='add'>+	}</div><div class='ctx'> 	if (status == 0)</div><div class='ctx'> 		rpc_clnt_xprt_switch_add_xprt(clnt, xprt);</div><div class='add'>+	else if (status != -NFS4ERR_DELAY &amp;&amp; rpc_clnt_xprt_switch_has_addr(clnt,</div><div class='add'>+				(struct sockaddr *)&amp;xprt-&gt;addr))</div><div class='add'>+		rpc_clnt_xprt_switch_remove_xprt(clnt, xprt);</div><div class='ctx'> </div><div class='ctx'> 	rpc_put_task(task);</div><div class='add'>+	if (status == -NFS4ERR_DELAY) {</div><div class='add'>+		ssleep(1);</div><div class='add'>+		goto try_again;</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs4_test_session_trunk);</div><div class='ctx'> </div><div class='hunk'>@@ -8937,7 +9460,7 @@ static int nfs4_verify_back_channel_attrs(struct nfs41_create_session_args *args</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	if (rcvd-&gt;max_rqst_sz &gt; sent-&gt;max_rqst_sz)</div><div class='ctx'> 		return -EINVAL;</div><div class='del'>-	if (rcvd-&gt;max_resp_sz &lt; sent-&gt;max_resp_sz)</div><div class='add'>+	if (rcvd-&gt;max_resp_sz &gt; sent-&gt;max_resp_sz)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	if (rcvd-&gt;max_resp_sz_cached &gt; sent-&gt;max_resp_sz_cached)</div><div class='ctx'> 		return -EINVAL;</div><div class='hunk'>@@ -9033,6 +9556,13 @@ int nfs4_proc_create_session(struct nfs_client *clp, const struct cred *cred)</div><div class='ctx'> 	int status;</div><div class='ctx'> 	unsigned *ptr;</div><div class='ctx'> 	struct nfs4_session *session = clp-&gt;cl_session;</div><div class='add'>+	struct nfs4_add_xprt_data xprtdata = {</div><div class='add'>+		.clp = clp,</div><div class='add'>+	};</div><div class='add'>+	struct rpc_add_xprt_test rpcdata = {</div><div class='add'>+		.add_xprt_test = clp-&gt;cl_mvops-&gt;session_trunk,</div><div class='add'>+		.data = &amp;xprtdata,</div><div class='add'>+	};</div><div class='ctx'> </div><div class='ctx'> 	dprintk("--&gt; %s clp=%p session=%p\n", __func__, clp, session);</div><div class='ctx'> </div><div class='hunk'>@@ -9049,6 +9579,7 @@ int nfs4_proc_create_session(struct nfs_client *clp, const struct cred *cred)</div><div class='ctx'> 	ptr = (unsigned *)&amp;session-&gt;sess_id.data[0];</div><div class='ctx'> 	dprintk("%s client&gt;seqid %d sessionid %u:%u:%u:%u\n", __func__,</div><div class='ctx'> 		clp-&gt;cl_seqid, ptr[0], ptr[1], ptr[2], ptr[3]);</div><div class='add'>+	rpc_clnt_probe_trunked_xprts(clp-&gt;cl_rpcclient, &amp;rpcdata);</div><div class='ctx'> out:</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='hunk'>@@ -9078,6 +9609,7 @@ int nfs4_proc_destroy_session(struct nfs4_session *session,</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		dprintk("NFS: Got error %d from the server on DESTROY_SESSION. "</div><div class='ctx'> 			"Session has been destroyed regardless...\n", status);</div><div class='add'>+	rpc_clnt_manage_trunked_xprts(session-&gt;clp-&gt;cl_rpcclient);</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -9122,7 +9654,7 @@ static void nfs41_sequence_call_done(struct rpc_task *task, void *data)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	trace_nfs4_sequence(clp, task-&gt;tk_status);</div><div class='del'>-	if (task-&gt;tk_status &lt; 0) {</div><div class='add'>+	if (task-&gt;tk_status &lt; 0 &amp;&amp; clp-&gt;cl_cons_state &gt;= 0) {</div><div class='ctx'> 		dprintk("%s ERROR %d\n", __func__, task-&gt;tk_status);</div><div class='ctx'> 		if (refcount_read(&amp;clp-&gt;cl_count) == 1)</div><div class='ctx'> 			return;</div><div class='hunk'>@@ -9177,7 +9709,7 @@ static struct rpc_task *_nfs41_proc_sequence(struct nfs_client *clp,</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> </div><div class='ctx'> 	ret = ERR_PTR(-ENOMEM);</div><div class='del'>-	calldata = kzalloc(sizeof(*calldata), GFP_NOFS);</div><div class='add'>+	calldata = kzalloc(sizeof(*calldata), GFP_KERNEL);</div><div class='ctx'> 	if (calldata == NULL)</div><div class='ctx'> 		goto out_put_clp;</div><div class='ctx'> 	nfs4_init_sequence(&amp;calldata-&gt;args, &amp;calldata-&gt;res, 0, is_privileged);</div><div class='hunk'>@@ -9262,6 +9794,9 @@ static int nfs41_reclaim_complete_handle_errors(struct rpc_task *task, struct nf</div><div class='ctx'> 		rpc_delay(task, NFS4_POLL_RETRY_MAX);</div><div class='ctx'> 		fallthrough;</div><div class='ctx'> 	case -NFS4ERR_RETRY_UNCACHED_REP:</div><div class='add'>+	case -EACCES:</div><div class='add'>+		dprintk("%s: failed to reclaim complete error %d for server %s, retrying\n",</div><div class='add'>+			__func__, task-&gt;tk_status, clp-&gt;cl_hostname);</div><div class='ctx'> 		return -EAGAIN;</div><div class='ctx'> 	case -NFS4ERR_BADSESSION:</div><div class='ctx'> 	case -NFS4ERR_DEADSESSION:</div><div class='hunk'>@@ -9369,6 +9904,9 @@ nfs4_layoutget_handle_exception(struct rpc_task *task,</div><div class='ctx'> </div><div class='ctx'> 	nfs4_sequence_free_slot(&amp;lgp-&gt;res.seq_res);</div><div class='ctx'> </div><div class='add'>+	exception-&gt;state = NULL;</div><div class='add'>+	exception-&gt;stateid = NULL;</div><div class='add'>+</div><div class='ctx'> 	switch (nfs4err) {</div><div class='ctx'> 	case 0:</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -9404,6 +9942,7 @@ nfs4_layoutget_handle_exception(struct rpc_task *task,</div><div class='ctx'> 		status = -EBUSY;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case -NFS4ERR_RECALLCONFLICT:</div><div class='add'>+	case -NFS4ERR_RETURNCONFLICT:</div><div class='ctx'> 		status = -ERECALLCONFLICT;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case -NFS4ERR_DELEG_REVOKED:</div><div class='hunk'>@@ -9464,7 +10003,8 @@ static const struct rpc_call_ops nfs4_layoutget_call_ops = {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct pnfs_layout_segment *</div><div class='del'>-nfs4_proc_layoutget(struct nfs4_layoutget *lgp, long *timeout)</div><div class='add'>+nfs4_proc_layoutget(struct nfs4_layoutget *lgp,</div><div class='add'>+		    struct nfs4_exception *exception)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = lgp-&gt;args.inode;</div><div class='ctx'> 	struct nfs_server *server = NFS_SERVER(inode);</div><div class='hunk'>@@ -9484,26 +10024,26 @@ nfs4_proc_layoutget(struct nfs4_layoutget *lgp, long *timeout)</div><div class='ctx'> 			 RPC_TASK_MOVEABLE,</div><div class='ctx'> 	};</div><div class='ctx'> 	struct pnfs_layout_segment *lseg = NULL;</div><div class='del'>-	struct nfs4_exception exception = {</div><div class='del'>-		.inode = inode,</div><div class='del'>-		.timeout = *timeout,</div><div class='del'>-	};</div><div class='ctx'> 	int status = 0;</div><div class='ctx'> </div><div class='ctx'> 	nfs4_init_sequence(&amp;lgp-&gt;args.seq_args, &amp;lgp-&gt;res.seq_res, 0, 0);</div><div class='add'>+	exception-&gt;retry = 0;</div><div class='ctx'> </div><div class='ctx'> 	task = rpc_run_task(&amp;task_setup_data);</div><div class='add'>+	if (IS_ERR(task))</div><div class='add'>+		return ERR_CAST(task);</div><div class='ctx'> </div><div class='ctx'> 	status = rpc_wait_for_completion_task(task);</div><div class='ctx'> 	if (status != 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	if (task-&gt;tk_status &lt; 0) {</div><div class='del'>-		status = nfs4_layoutget_handle_exception(task, lgp, &amp;exception);</div><div class='del'>-		*timeout = exception.timeout;</div><div class='add'>+		exception-&gt;retry = 1;</div><div class='add'>+		status = nfs4_layoutget_handle_exception(task, lgp, exception);</div><div class='ctx'> 	} else if (lgp-&gt;res.layoutp-&gt;len == 0) {</div><div class='add'>+		exception-&gt;retry = 1;</div><div class='ctx'> 		status = -EAGAIN;</div><div class='del'>-		*timeout = nfs4_update_delay(&amp;exception.timeout);</div><div class='add'>+		nfs4_update_delay(&amp;exception-&gt;timeout);</div><div class='ctx'> 	} else</div><div class='ctx'> 		lseg = pnfs_layout_process(lgp);</div><div class='ctx'> out:</div><div class='hunk'>@@ -9541,6 +10081,11 @@ static void nfs4_layoutreturn_done(struct rpc_task *task, void *calldata)</div><div class='ctx'> 	if (!nfs41_sequence_process(task, &amp;lrp-&gt;res.seq_res))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='add'>+	if (task-&gt;tk_rpc_status == -ETIMEDOUT) {</div><div class='add'>+		lrp-&gt;rpc_status = -EAGAIN;</div><div class='add'>+		lrp-&gt;res.lrs_present = 0;</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Was there an RPC level error? Assume the call succeeded,</div><div class='ctx'> 	 * and that we need to release the layout</div><div class='hunk'>@@ -9560,13 +10105,25 @@ static void nfs4_layoutreturn_done(struct rpc_task *task, void *calldata)</div><div class='ctx'> 		fallthrough;</div><div class='ctx'> 	default:</div><div class='ctx'> 		task-&gt;tk_status = 0;</div><div class='add'>+		lrp-&gt;res.lrs_present = 0;</div><div class='ctx'> 		fallthrough;</div><div class='ctx'> 	case 0:</div><div class='ctx'> 		break;</div><div class='add'>+	case -NFS4ERR_BADSESSION:</div><div class='add'>+	case -NFS4ERR_DEADSESSION:</div><div class='add'>+	case -NFS4ERR_CONN_NOT_BOUND_TO_SESSION:</div><div class='add'>+		nfs4_schedule_session_recovery(server-&gt;nfs_client-&gt;cl_session,</div><div class='add'>+					       task-&gt;tk_status);</div><div class='add'>+		lrp-&gt;res.lrs_present = 0;</div><div class='add'>+		lrp-&gt;rpc_status = -EAGAIN;</div><div class='add'>+		task-&gt;tk_status = 0;</div><div class='add'>+		break;</div><div class='ctx'> 	case -NFS4ERR_DELAY:</div><div class='del'>-		if (nfs4_async_handle_error(task, server, NULL, NULL) != -EAGAIN)</div><div class='del'>-			break;</div><div class='del'>-		goto out_restart;</div><div class='add'>+		if (nfs4_async_handle_error(task, server, NULL, NULL) ==</div><div class='add'>+		    -EAGAIN)</div><div class='add'>+			goto out_restart;</div><div class='add'>+		lrp-&gt;res.lrs_present = 0;</div><div class='add'>+		break;</div><div class='ctx'> 	}</div><div class='ctx'> 	return;</div><div class='ctx'> out_restart:</div><div class='hunk'>@@ -9580,8 +10137,13 @@ static void nfs4_layoutreturn_release(void *calldata)</div><div class='ctx'> 	struct nfs4_layoutreturn *lrp = calldata;</div><div class='ctx'> 	struct pnfs_layout_hdr *lo = lrp-&gt;args.layout;</div><div class='ctx'> </div><div class='del'>-	pnfs_layoutreturn_free_lsegs(lo, &amp;lrp-&gt;args.stateid, &amp;lrp-&gt;args.range,</div><div class='add'>+	if (lrp-&gt;rpc_status == 0 || !lrp-&gt;inode)</div><div class='add'>+		pnfs_layoutreturn_free_lsegs(</div><div class='add'>+			lo, &amp;lrp-&gt;args.stateid, &amp;lrp-&gt;args.range,</div><div class='ctx'> 			lrp-&gt;res.lrs_present ? &amp;lrp-&gt;res.stateid : NULL);</div><div class='add'>+	else</div><div class='add'>+		pnfs_layoutreturn_retry_later(lo, &amp;lrp-&gt;args.stateid,</div><div class='add'>+					      &amp;lrp-&gt;args.range);</div><div class='ctx'> 	nfs4_sequence_free_slot(&amp;lrp-&gt;res.seq_res);</div><div class='ctx'> 	if (lrp-&gt;ld_private.ops &amp;&amp; lrp-&gt;ld_private.ops-&gt;free)</div><div class='ctx'> 		lrp-&gt;ld_private.ops-&gt;free(&amp;lrp-&gt;ld_private);</div><div class='hunk'>@@ -9597,7 +10159,7 @@ static const struct rpc_call_ops nfs4_layoutreturn_call_ops = {</div><div class='ctx'> 	.rpc_release = nfs4_layoutreturn_release,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-int nfs4_proc_layoutreturn(struct nfs4_layoutreturn *lrp, bool sync)</div><div class='add'>+int nfs4_proc_layoutreturn(struct nfs4_layoutreturn *lrp, unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct rpc_task *task;</div><div class='ctx'> 	struct rpc_message msg = {</div><div class='hunk'>@@ -9620,7 +10182,7 @@ int nfs4_proc_layoutreturn(struct nfs4_layoutreturn *lrp, bool sync)</div><div class='ctx'> 			&amp;task_setup_data.rpc_client, &amp;msg);</div><div class='ctx'> </div><div class='ctx'> 	lrp-&gt;inode = nfs_igrab_and_active(lrp-&gt;args.inode);</div><div class='del'>-	if (!sync) {</div><div class='add'>+	if (flags &amp; PNFS_FL_LAYOUTRETURN_ASYNC) {</div><div class='ctx'> 		if (!lrp-&gt;inode) {</div><div class='ctx'> 			nfs4_layoutreturn_release(lrp);</div><div class='ctx'> 			return -EAGAIN;</div><div class='hunk'>@@ -9628,6 +10190,8 @@ int nfs4_proc_layoutreturn(struct nfs4_layoutreturn *lrp, bool sync)</div><div class='ctx'> 		task_setup_data.flags |= RPC_TASK_ASYNC;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (!lrp-&gt;inode)</div><div class='add'>+		flags |= PNFS_FL_LAYOUTRETURN_PRIVILEGED;</div><div class='add'>+	if (flags &amp; PNFS_FL_LAYOUTRETURN_PRIVILEGED)</div><div class='ctx'> 		nfs4_init_sequence(&amp;lrp-&gt;args.seq_args, &amp;lrp-&gt;res.seq_res, 1,</div><div class='ctx'> 				   1);</div><div class='ctx'> 	else</div><div class='hunk'>@@ -9636,7 +10200,7 @@ int nfs4_proc_layoutreturn(struct nfs4_layoutreturn *lrp, bool sync)</div><div class='ctx'> 	task = rpc_run_task(&amp;task_setup_data);</div><div class='ctx'> 	if (IS_ERR(task))</div><div class='ctx'> 		return PTR_ERR(task);</div><div class='del'>-	if (sync)</div><div class='add'>+	if (!(flags &amp; PNFS_FL_LAYOUTRETURN_ASYNC))</div><div class='ctx'> 		status = task-&gt;tk_status;</div><div class='ctx'> 	trace_nfs4_layoutreturn(lrp-&gt;args.inode, &amp;lrp-&gt;args.stateid, status);</div><div class='ctx'> 	dprintk("&lt;-- %s status=%d\n", __func__, status);</div><div class='hunk'>@@ -9798,10 +10362,10 @@ nfs4_proc_layoutcommit(struct nfs4_layoutcommit_data *data, bool sync)</div><div class='ctx'>  * Use the state managment nfs_client cl_rpcclient, which uses krb5i (if</div><div class='ctx'>  * possible) as per RFC3530bis and RFC5661 Security Considerations sections</div><div class='ctx'>  */</div><div class='del'>-static int</div><div class='del'>-_nfs41_proc_secinfo_no_name(struct nfs_server *server, struct nfs_fh *fhandle,</div><div class='del'>-		    struct nfs_fsinfo *info,</div><div class='del'>-		    struct nfs4_secinfo_flavors *flavors, bool use_integrity)</div><div class='add'>+static int _nfs41_proc_secinfo_no_name(struct nfs_server *server,</div><div class='add'>+				       struct nfs_fh *fhandle,</div><div class='add'>+				       struct nfs4_secinfo_flavors *flavors,</div><div class='add'>+				       bool use_integrity)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs41_secinfo_no_name_args args = {</div><div class='ctx'> 		.style = SECINFO_STYLE_CURRENT_FH,</div><div class='hunk'>@@ -9845,9 +10409,9 @@ _nfs41_proc_secinfo_no_name(struct nfs_server *server, struct nfs_fh *fhandle,</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int</div><div class='del'>-nfs41_proc_secinfo_no_name(struct nfs_server *server, struct nfs_fh *fhandle,</div><div class='del'>-			   struct nfs_fsinfo *info, struct nfs4_secinfo_flavors *flavors)</div><div class='add'>+static int nfs41_proc_secinfo_no_name(struct nfs_server *server,</div><div class='add'>+				      struct nfs_fh *fhandle,</div><div class='add'>+				      struct nfs4_secinfo_flavors *flavors)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_exception exception = {</div><div class='ctx'> 		.interruptible = true,</div><div class='hunk'>@@ -9859,7 +10423,7 @@ nfs41_proc_secinfo_no_name(struct nfs_server *server, struct nfs_fh *fhandle,</div><div class='ctx'> </div><div class='ctx'> 		/* try to use integrity protection with machine cred */</div><div class='ctx'> 		if (_nfs4_is_integrity_protected(server-&gt;nfs_client))</div><div class='del'>-			err = _nfs41_proc_secinfo_no_name(server, fhandle, info,</div><div class='add'>+			err = _nfs41_proc_secinfo_no_name(server, fhandle,</div><div class='ctx'> 							  flavors, true);</div><div class='ctx'> </div><div class='ctx'> 		/*</div><div class='hunk'>@@ -9869,7 +10433,7 @@ nfs41_proc_secinfo_no_name(struct nfs_server *server, struct nfs_fh *fhandle,</div><div class='ctx'> 		 * the current filesystem's rpc_client and the user cred.</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (err == -NFS4ERR_WRONGSEC)</div><div class='del'>-			err = _nfs41_proc_secinfo_no_name(server, fhandle, info,</div><div class='add'>+			err = _nfs41_proc_secinfo_no_name(server, fhandle,</div><div class='ctx'> 							  flavors, false);</div><div class='ctx'> </div><div class='ctx'> 		switch (err) {</div><div class='hunk'>@@ -9885,9 +10449,8 @@ out:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int</div><div class='del'>-nfs41_find_root_sec(struct nfs_server *server, struct nfs_fh *fhandle,</div><div class='del'>-		    struct nfs_fsinfo *info)</div><div class='add'>+static int nfs41_find_root_sec(struct nfs_server *server,</div><div class='add'>+			       struct nfs_fh *fhandle, struct nfs_fattr *fattr)</div><div class='ctx'> {</div><div class='ctx'> 	int err;</div><div class='ctx'> 	struct page *page;</div><div class='hunk'>@@ -9903,14 +10466,14 @@ nfs41_find_root_sec(struct nfs_server *server, struct nfs_fh *fhandle,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	flavors = page_address(page);</div><div class='del'>-	err = nfs41_proc_secinfo_no_name(server, fhandle, info, flavors);</div><div class='add'>+	err = nfs41_proc_secinfo_no_name(server, fhandle, flavors);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Fall back on "guess and check" method if</div><div class='ctx'> 	 * the server doesn't support SECINFO_NO_NAME</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (err == -NFS4ERR_WRONGSEC || err == -ENOTSUPP) {</div><div class='del'>-		err = nfs4_find_root_sec(server, fhandle, info);</div><div class='add'>+		err = nfs4_find_root_sec(server, fhandle, fattr);</div><div class='ctx'> 		goto out_freepage;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (err)</div><div class='hunk'>@@ -9935,8 +10498,8 @@ nfs41_find_root_sec(struct nfs_server *server, struct nfs_fh *fhandle,</div><div class='ctx'> 			flavor = RPC_AUTH_MAXFLAVOR;</div><div class='ctx'> </div><div class='ctx'> 		if (flavor != RPC_AUTH_MAXFLAVOR) {</div><div class='del'>-			err = nfs4_lookup_root_sec(server, fhandle,</div><div class='del'>-						   info, flavor);</div><div class='add'>+			err = nfs4_lookup_root_sec(server, fhandle, fattr,</div><div class='add'>+						   flavor);</div><div class='ctx'> 			if (!err)</div><div class='ctx'> 				break;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -9954,12 +10517,12 @@ out:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int _nfs41_test_stateid(struct nfs_server *server,</div><div class='del'>-		nfs4_stateid *stateid,</div><div class='del'>-		const struct cred *cred)</div><div class='add'>+			       const nfs4_stateid *stateid,</div><div class='add'>+			       const struct cred *cred)</div><div class='ctx'> {</div><div class='ctx'> 	int status;</div><div class='ctx'> 	struct nfs41_test_stateid_args args = {</div><div class='del'>-		.stateid = stateid,</div><div class='add'>+		.stateid = *stateid,</div><div class='ctx'> 	};</div><div class='ctx'> 	struct nfs41_test_stateid_res res;</div><div class='ctx'> 	struct rpc_message msg = {</div><div class='hunk'>@@ -10015,8 +10578,8 @@ static void nfs4_handle_delay_or_session_error(struct nfs_server *server,</div><div class='ctx'>  * failed or the state ID is not currently valid.</div><div class='ctx'>  */</div><div class='ctx'> static int nfs41_test_stateid(struct nfs_server *server,</div><div class='del'>-		nfs4_stateid *stateid,</div><div class='del'>-		const struct cred *cred)</div><div class='add'>+			      const nfs4_stateid *stateid,</div><div class='add'>+			      const struct cred *cred)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_exception exception = {</div><div class='ctx'> 		.interruptible = true,</div><div class='hunk'>@@ -10083,7 +10646,7 @@ static const struct rpc_call_ops nfs41_free_stateid_ops = {</div><div class='ctx'>  * Note: this function is always asynchronous.</div><div class='ctx'>  */</div><div class='ctx'> static int nfs41_free_stateid(struct nfs_server *server,</div><div class='del'>-		const nfs4_stateid *stateid,</div><div class='add'>+		nfs4_stateid *stateid,</div><div class='ctx'> 		const struct cred *cred,</div><div class='ctx'> 		bool privileged)</div><div class='ctx'> {</div><div class='hunk'>@@ -10108,7 +10671,7 @@ static int nfs41_free_stateid(struct nfs_server *server,</div><div class='ctx'> 		&amp;task_setup.rpc_client, &amp;msg);</div><div class='ctx'> </div><div class='ctx'> 	dprintk("NFS call  free_stateid %p\n", stateid);</div><div class='del'>-	data = kmalloc(sizeof(*data), GFP_NOFS);</div><div class='add'>+	data = kmalloc(sizeof(*data), GFP_KERNEL);</div><div class='ctx'> 	if (!data)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	data-&gt;server = server;</div><div class='hunk'>@@ -10123,6 +10686,7 @@ static int nfs41_free_stateid(struct nfs_server *server,</div><div class='ctx'> 	if (IS_ERR(task))</div><div class='ctx'> 		return PTR_ERR(task);</div><div class='ctx'> 	rpc_put_task(task);</div><div class='add'>+	stateid-&gt;type = NFS4_FREED_STATEID_TYPE;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -10138,6 +10702,8 @@ nfs41_free_lock_state(struct nfs_server *server, struct nfs4_lock_state *lsp)</div><div class='ctx'> static bool nfs41_match_stateid(const nfs4_stateid *s1,</div><div class='ctx'> 		const nfs4_stateid *s2)</div><div class='ctx'> {</div><div class='add'>+	trace_nfs41_match_stateid(s1, s2);</div><div class='add'>+</div><div class='ctx'> 	if (s1-&gt;type != s2-&gt;type)</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='hunk'>@@ -10155,6 +10721,8 @@ static bool nfs41_match_stateid(const nfs4_stateid *s1,</div><div class='ctx'> static bool nfs4_match_stateid(const nfs4_stateid *s1,</div><div class='ctx'> 		const nfs4_stateid *s2)</div><div class='ctx'> {</div><div class='add'>+	trace_nfs4_match_stateid(s1, s2);</div><div class='add'>+</div><div class='ctx'> 	return nfs4_stateid_match(s1, s2);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -10257,7 +10825,8 @@ static const struct nfs4_minor_version_ops nfs_v4_1_minor_ops = {</div><div class='ctx'> 		| NFS_CAP_POSIX_LOCK</div><div class='ctx'> 		| NFS_CAP_STATEID_NFSV41</div><div class='ctx'> 		| NFS_CAP_ATOMIC_OPEN_V1</div><div class='del'>-		| NFS_CAP_LGOPEN,</div><div class='add'>+		| NFS_CAP_LGOPEN</div><div class='add'>+		| NFS_CAP_MOVEABLE,</div><div class='ctx'> 	.init_client = nfs41_init_client,</div><div class='ctx'> 	.shutdown_client = nfs41_shutdown_client,</div><div class='ctx'> 	.match_stateid = nfs41_match_stateid,</div><div class='hunk'>@@ -10288,11 +10857,14 @@ static const struct nfs4_minor_version_ops nfs_v4_2_minor_ops = {</div><div class='ctx'> 		| NFS_CAP_OFFLOAD_CANCEL</div><div class='ctx'> 		| NFS_CAP_COPY_NOTIFY</div><div class='ctx'> 		| NFS_CAP_DEALLOCATE</div><div class='add'>+		| NFS_CAP_ZERO_RANGE</div><div class='ctx'> 		| NFS_CAP_SEEK</div><div class='ctx'> 		| NFS_CAP_LAYOUTSTATS</div><div class='ctx'> 		| NFS_CAP_CLONE</div><div class='ctx'> 		| NFS_CAP_LAYOUTERROR</div><div class='del'>-		| NFS_CAP_READ_PLUS,</div><div class='add'>+		| NFS_CAP_READ_PLUS</div><div class='add'>+		| NFS_CAP_MOVEABLE</div><div class='add'>+		| NFS_CAP_OFFLOAD_STATUS,</div><div class='ctx'> 	.init_client = nfs41_init_client,</div><div class='ctx'> 	.shutdown_client = nfs41_shutdown_client,</div><div class='ctx'> 	.match_stateid = nfs41_match_stateid,</div><div class='hunk'>@@ -10321,30 +10893,66 @@ const struct nfs4_minor_version_ops *nfs_v4_minor_ops[] = {</div><div class='ctx'> </div><div class='ctx'> static ssize_t nfs4_listxattr(struct dentry *dentry, char *list, size_t size)</div><div class='ctx'> {</div><div class='del'>-	ssize_t error, error2, error3;</div><div class='add'>+	ssize_t error, error2, error3, error4 = 0;</div><div class='add'>+	size_t left = size;</div><div class='ctx'> </div><div class='del'>-	error = generic_listxattr(dentry, list, size);</div><div class='add'>+	error = generic_listxattr(dentry, list, left);</div><div class='ctx'> 	if (error &lt; 0)</div><div class='ctx'> 		return error;</div><div class='ctx'> 	if (list) {</div><div class='ctx'> 		list += error;</div><div class='del'>-		size -= error;</div><div class='add'>+		left -= error;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	error2 = nfs4_listxattr_nfs4_label(d_inode(dentry), list, size);</div><div class='add'>+	error2 = nfs4_listxattr_nfs4_label(d_inode(dentry), list, left);</div><div class='ctx'> 	if (error2 &lt; 0)</div><div class='ctx'> 		return error2;</div><div class='ctx'> </div><div class='ctx'> 	if (list) {</div><div class='ctx'> 		list += error2;</div><div class='del'>-		size -= error2;</div><div class='add'>+		left -= error2;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	error3 = nfs4_listxattr_nfs4_user(d_inode(dentry), list, size);</div><div class='add'>+	error3 = nfs4_listxattr_nfs4_user(d_inode(dentry), list, left);</div><div class='ctx'> 	if (error3 &lt; 0)</div><div class='ctx'> 		return error3;</div><div class='add'>+	if (list) {</div><div class='add'>+		list += error3;</div><div class='add'>+		left -= error3;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!nfs_server_capable(d_inode(dentry), NFS_CAP_SECURITY_LABEL)) {</div><div class='add'>+		error4 = security_inode_listsecurity(d_inode(dentry), list, left);</div><div class='add'>+		if (error4 &lt; 0)</div><div class='add'>+			return error4;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	return error + error2 + error3;</div><div class='add'>+	error += error2 + error3 + error4;</div><div class='add'>+	if (size &amp;&amp; error &gt; size)</div><div class='add'>+		return -ERANGE;</div><div class='add'>+	return error;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfs4_enable_swap(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	/* The state manager thread must always be running.</div><div class='add'>+	 * It will notice the client is a swapper, and stay put.</div><div class='add'>+	 */</div><div class='add'>+	struct nfs_client *clp = NFS_SERVER(inode)-&gt;nfs_client;</div><div class='add'>+</div><div class='add'>+	nfs4_schedule_state_manager(clp);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfs4_disable_swap(struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	/* The state manager thread will now exit once it is</div><div class='add'>+	 * woken.</div><div class='add'>+	 */</div><div class='add'>+	struct nfs_client *clp = NFS_SERVER(inode)-&gt;nfs_client;</div><div class='add'>+</div><div class='add'>+	set_bit(NFS4CLNT_RUN_MANAGER, &amp;clp-&gt;cl_state);</div><div class='add'>+	clear_bit(NFS4CLNT_MANAGER_AVAILABLE, &amp;clp-&gt;cl_state);</div><div class='add'>+	wake_up_var(&amp;clp-&gt;cl_state);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct inode_operations nfs4_dir_inode_operations = {</div><div class='hunk'>@@ -10371,6 +10979,26 @@ static const struct inode_operations nfs4_file_inode_operations = {</div><div class='ctx'> 	.listxattr	= nfs4_listxattr,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+static struct nfs_server *nfs4_clone_server(struct nfs_server *source,</div><div class='add'>+		struct nfs_fh *fh, struct nfs_fattr *fattr,</div><div class='add'>+		rpc_authflavor_t flavor)</div><div class='add'>+{</div><div class='add'>+	struct nfs_server *server;</div><div class='add'>+	int error;</div><div class='add'>+</div><div class='add'>+	server = nfs_clone_server(source, fh, fattr, flavor);</div><div class='add'>+	if (IS_ERR(server))</div><div class='add'>+		return server;</div><div class='add'>+</div><div class='add'>+	error = nfs4_delegation_hash_alloc(server);</div><div class='add'>+	if (error) {</div><div class='add'>+		nfs_free_server(server);</div><div class='add'>+		return ERR_PTR(error);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return server;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> const struct nfs_rpc_ops nfs_v4_clientops = {</div><div class='ctx'> 	.version	= 4,			/* protocol version */</div><div class='ctx'> 	.dentry_ops	= &amp;nfs4_dentry_operations,</div><div class='hunk'>@@ -10418,11 +11046,15 @@ const struct nfs_rpc_ops nfs_v4_clientops = {</div><div class='ctx'> 	.close_context  = nfs4_close_context,</div><div class='ctx'> 	.open_context	= nfs4_atomic_open,</div><div class='ctx'> 	.have_delegation = nfs4_have_delegation,</div><div class='add'>+	.return_delegation = nfs4_inode_return_delegation,</div><div class='ctx'> 	.alloc_client	= nfs4_alloc_client,</div><div class='ctx'> 	.init_client	= nfs4_init_client,</div><div class='ctx'> 	.free_client	= nfs4_free_client,</div><div class='ctx'> 	.create_server	= nfs4_create_server,</div><div class='del'>-	.clone_server	= nfs_clone_server,</div><div class='add'>+	.clone_server	= nfs4_clone_server,</div><div class='add'>+	.discover_trunking = nfs4_discover_trunking,</div><div class='add'>+	.enable_swap	= nfs4_enable_swap,</div><div class='add'>+	.disable_swap	= nfs4_disable_swap,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static const struct xattr_handler nfs4_xattr_nfs4_acl_handler = {</div><div class='hunk'>@@ -10432,6 +11064,22 @@ static const struct xattr_handler nfs4_xattr_nfs4_acl_handler = {</div><div class='ctx'> 	.set	= nfs4_xattr_set_nfs4_acl,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+#if defined(CONFIG_NFS_V4_1)</div><div class='add'>+static const struct xattr_handler nfs4_xattr_nfs4_dacl_handler = {</div><div class='add'>+	.name	= XATTR_NAME_NFSV4_DACL,</div><div class='add'>+	.list	= nfs4_xattr_list_nfs4_dacl,</div><div class='add'>+	.get	= nfs4_xattr_get_nfs4_dacl,</div><div class='add'>+	.set	= nfs4_xattr_set_nfs4_dacl,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct xattr_handler nfs4_xattr_nfs4_sacl_handler = {</div><div class='add'>+	.name	= XATTR_NAME_NFSV4_SACL,</div><div class='add'>+	.list	= nfs4_xattr_list_nfs4_sacl,</div><div class='add'>+	.get	= nfs4_xattr_get_nfs4_sacl,</div><div class='add'>+	.set	= nfs4_xattr_set_nfs4_sacl,</div><div class='add'>+};</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> #ifdef CONFIG_NFS_V4_2</div><div class='ctx'> static const struct xattr_handler nfs4_xattr_nfs4_user_handler = {</div><div class='ctx'> 	.prefix	= XATTR_USER_PREFIX,</div><div class='hunk'>@@ -10440,8 +11088,12 @@ static const struct xattr_handler nfs4_xattr_nfs4_user_handler = {</div><div class='ctx'> };</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-const struct xattr_handler *nfs4_xattr_handlers[] = {</div><div class='add'>+const struct xattr_handler * const nfs4_xattr_handlers[] = {</div><div class='ctx'> 	&amp;nfs4_xattr_nfs4_acl_handler,</div><div class='add'>+#if defined(CONFIG_NFS_V4_1)</div><div class='add'>+	&amp;nfs4_xattr_nfs4_dacl_handler,</div><div class='add'>+	&amp;nfs4_xattr_nfs4_sacl_handler,</div><div class='add'>+#endif</div><div class='ctx'> #ifdef CONFIG_NFS_V4_SECURITY_LABEL</div><div class='ctx'> 	&amp;nfs4_xattr_nfs4_label_handler,</div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/nfs/nfs4renewd.c b/fs/nfs/nfs4renewd.c<br/>index db3811af0796..18ae614e5a6c 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4renewd.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4renewd.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4renewd.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfs4renewd.c</a></div><div class='hunk'>@@ -122,7 +122,7 @@ nfs4_schedule_state_renewal(struct nfs_client *clp)</div><div class='ctx'> 		timeout = 5 * HZ;</div><div class='ctx'> 	dprintk("%s: requeueing work. Lease period = %ld\n",</div><div class='ctx'> 			__func__, (timeout + HZ - 1) / HZ);</div><div class='del'>-	mod_delayed_work(system_wq, &amp;clp-&gt;cl_renewd, timeout);</div><div class='add'>+	mod_delayed_work(system_percpu_wq, &amp;clp-&gt;cl_renewd, timeout);</div><div class='ctx'> 	set_bit(NFS_CS_RENEWD, &amp;clp-&gt;cl_res_state);</div><div class='ctx'> 	spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/nfs/nfs4session.h b/fs/nfs/nfs4session.h<br/>index 351616c61df5..f9c291e2165c 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4session.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4session.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4session.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfs4session.h</a></div><div class='hunk'>@@ -148,16 +148,12 @@ static inline void nfs4_copy_sessionid(struct nfs4_sessionid *dst,</div><div class='ctx'> 	memcpy(dst-&gt;data, src-&gt;data, NFS4_MAX_SESSIONID_LEN);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_CRC32</div><div class='ctx'> /*</div><div class='ctx'>  * nfs_session_id_hash - calculate the crc32 hash for the session id</div><div class='ctx'>  * @session - pointer to session</div><div class='ctx'>  */</div><div class='ctx'> #define nfs_session_id_hash(sess_id) \</div><div class='ctx'> 	(~crc32_le(0xFFFFFFFF, &amp;(sess_id)-&gt;data[0], sizeof((sess_id)-&gt;data)))</div><div class='del'>-#else</div><div class='del'>-#define nfs_session_id_hash(session) (0)</div><div class='del'>-#endif</div><div class='ctx'> #else /* defined(CONFIG_NFS_V4_1) */</div><div class='ctx'> </div><div class='ctx'> static inline int nfs4_init_session(struct nfs_client *clp)</div><div class='head'>diff --git a/fs/nfs/nfs4state.c b/fs/nfs/nfs4state.c<br/>index ecc4594299d6..01179f7de322 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4state.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4state.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4state.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfs4state.c</a></div><div class='hunk'>@@ -49,6 +49,7 @@</div><div class='ctx'> #include &lt;linux/workqueue.h&gt;</div><div class='ctx'> #include &lt;linux/bitops.h&gt;</div><div class='ctx'> #include &lt;linux/jiffies.h&gt;</div><div class='add'>+#include &lt;linux/sched/mm.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/sunrpc/clnt.h&gt;</div><div class='ctx'> </div><div class='hunk'>@@ -66,6 +67,8 @@</div><div class='ctx'> </div><div class='ctx'> #define OPENOWNER_POOL_SIZE	8</div><div class='ctx'> </div><div class='add'>+static void nfs4_state_start_reclaim_reboot(struct nfs_client *clp);</div><div class='add'>+</div><div class='ctx'> const nfs4_stateid zero_stateid = {</div><div class='ctx'> 	{ .data = { 0 } },</div><div class='ctx'> 	.type = NFS4_SPECIAL_STATEID_TYPE,</div><div class='hunk'>@@ -329,6 +332,8 @@ do_confirm:</div><div class='ctx'> 	status = nfs4_proc_create_session(clp, cred);</div><div class='ctx'> 	if (status != 0)</div><div class='ctx'> 		goto out;</div><div class='add'>+	if (!(clp-&gt;cl_exchange_flags &amp; EXCHGID4_FLAG_CONFIRMED_R))</div><div class='add'>+		nfs4_state_start_reclaim_reboot(clp);</div><div class='ctx'> 	nfs41_finish_session_reset(clp);</div><div class='ctx'> 	nfs_mark_client_ready(clp, NFS_CS_READY);</div><div class='ctx'> out:</div><div class='hunk'>@@ -496,12 +501,7 @@ nfs4_alloc_state_owner(struct nfs_server *server,</div><div class='ctx'> 	sp = kzalloc(sizeof(*sp), gfp_flags);</div><div class='ctx'> 	if (!sp)</div><div class='ctx'> 		return NULL;</div><div class='del'>-	sp-&gt;so_seqid.owner_id = ida_simple_get(&amp;server-&gt;openowner_id, 0, 0,</div><div class='del'>-						gfp_flags);</div><div class='del'>-	if (sp-&gt;so_seqid.owner_id &lt; 0) {</div><div class='del'>-		kfree(sp);</div><div class='del'>-		return NULL;</div><div class='del'>-	}</div><div class='add'>+	sp-&gt;so_seqid.owner_id = atomic64_inc_return(&amp;server-&gt;owner_ctr);</div><div class='ctx'> 	sp-&gt;so_server = server;</div><div class='ctx'> 	sp-&gt;so_cred = get_cred(cred);</div><div class='ctx'> 	spin_lock_init(&amp;sp-&gt;so_lock);</div><div class='hunk'>@@ -509,7 +509,6 @@ nfs4_alloc_state_owner(struct nfs_server *server,</div><div class='ctx'> 	nfs4_init_seqid_counter(&amp;sp-&gt;so_seqid);</div><div class='ctx'> 	atomic_set(&amp;sp-&gt;so_count, 1);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;sp-&gt;so_lru);</div><div class='del'>-	seqcount_spinlock_init(&amp;sp-&gt;so_reclaim_seqcount, &amp;sp-&gt;so_lock);</div><div class='ctx'> 	mutex_init(&amp;sp-&gt;so_delegreturn_mutex);</div><div class='ctx'> 	return sp;</div><div class='ctx'> }</div><div class='hunk'>@@ -533,7 +532,6 @@ static void nfs4_free_state_owner(struct nfs4_state_owner *sp)</div><div class='ctx'> {</div><div class='ctx'> 	nfs4_destroy_seqid_counter(&amp;sp-&gt;so_seqid);</div><div class='ctx'> 	put_cred(sp-&gt;so_cred);</div><div class='del'>-	ida_simple_remove(&amp;sp-&gt;so_server-&gt;openowner_id, sp-&gt;so_seqid.owner_id);</div><div class='ctx'> 	kfree(sp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -666,7 +664,7 @@ nfs4_alloc_open_state(void)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_state *state;</div><div class='ctx'> </div><div class='del'>-	state = kzalloc(sizeof(*state), GFP_NOFS);</div><div class='add'>+	state = kzalloc(sizeof(*state), GFP_KERNEL_ACCOUNT);</div><div class='ctx'> 	if (!state)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	refcount_set(&amp;state-&gt;count, 1);</div><div class='hunk'>@@ -820,7 +818,7 @@ static void __nfs4_close(struct nfs4_state *state,</div><div class='ctx'> </div><div class='ctx'> void nfs4_close_state(struct nfs4_state *state, fmode_t fmode)</div><div class='ctx'> {</div><div class='del'>-	__nfs4_close(state, fmode, GFP_NOFS, 0);</div><div class='add'>+	__nfs4_close(state, fmode, GFP_KERNEL, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void nfs4_close_sync(struct nfs4_state *state, fmode_t fmode)</div><div class='hunk'>@@ -843,15 +841,15 @@ void nfs4_close_sync(struct nfs4_state *state, fmode_t fmode)</div><div class='ctx'>  */</div><div class='ctx'> static struct nfs4_lock_state *</div><div class='ctx'> __nfs4_find_lock_state(struct nfs4_state *state,</div><div class='del'>-		       fl_owner_t fl_owner, fl_owner_t fl_owner2)</div><div class='add'>+		       fl_owner_t owner, fl_owner_t owner2)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_lock_state *pos, *ret = NULL;</div><div class='ctx'> 	list_for_each_entry(pos, &amp;state-&gt;lock_states, ls_locks) {</div><div class='del'>-		if (pos-&gt;ls_owner == fl_owner) {</div><div class='add'>+		if (pos-&gt;ls_owner == owner) {</div><div class='ctx'> 			ret = pos;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-		if (pos-&gt;ls_owner == fl_owner2)</div><div class='add'>+		if (pos-&gt;ls_owner == owner2)</div><div class='ctx'> 			ret = pos;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (ret)</div><div class='hunk'>@@ -864,31 +862,25 @@ __nfs4_find_lock_state(struct nfs4_state *state,</div><div class='ctx'>  * exists, return an uninitialized one.</div><div class='ctx'>  *</div><div class='ctx'>  */</div><div class='del'>-static struct nfs4_lock_state *nfs4_alloc_lock_state(struct nfs4_state *state, fl_owner_t fl_owner)</div><div class='add'>+static struct nfs4_lock_state *nfs4_alloc_lock_state(struct nfs4_state *state, fl_owner_t owner)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_lock_state *lsp;</div><div class='ctx'> 	struct nfs_server *server = state-&gt;owner-&gt;so_server;</div><div class='ctx'> </div><div class='del'>-	lsp = kzalloc(sizeof(*lsp), GFP_NOFS);</div><div class='add'>+	lsp = kzalloc(sizeof(*lsp), GFP_KERNEL_ACCOUNT);</div><div class='ctx'> 	if (lsp == NULL)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	nfs4_init_seqid_counter(&amp;lsp-&gt;ls_seqid);</div><div class='ctx'> 	refcount_set(&amp;lsp-&gt;ls_count, 1);</div><div class='ctx'> 	lsp-&gt;ls_state = state;</div><div class='del'>-	lsp-&gt;ls_owner = fl_owner;</div><div class='del'>-	lsp-&gt;ls_seqid.owner_id = ida_simple_get(&amp;server-&gt;lockowner_id, 0, 0, GFP_NOFS);</div><div class='del'>-	if (lsp-&gt;ls_seqid.owner_id &lt; 0)</div><div class='del'>-		goto out_free;</div><div class='add'>+	lsp-&gt;ls_owner = owner;</div><div class='add'>+	lsp-&gt;ls_seqid.owner_id = atomic64_inc_return(&amp;server-&gt;owner_ctr);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;lsp-&gt;ls_locks);</div><div class='ctx'> 	return lsp;</div><div class='del'>-out_free:</div><div class='del'>-	kfree(lsp);</div><div class='del'>-	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void nfs4_free_lock_state(struct nfs_server *server, struct nfs4_lock_state *lsp)</div><div class='ctx'> {</div><div class='del'>-	ida_simple_remove(&amp;server-&gt;lockowner_id, lsp-&gt;ls_seqid.owner_id);</div><div class='ctx'> 	nfs4_destroy_seqid_counter(&amp;lsp-&gt;ls_seqid);</div><div class='ctx'> 	kfree(lsp);</div><div class='ctx'> }</div><div class='hunk'>@@ -976,7 +968,7 @@ int nfs4_set_lock_state(struct nfs4_state *state, struct file_lock *fl)</div><div class='ctx'> </div><div class='ctx'> 	if (fl-&gt;fl_ops != NULL)</div><div class='ctx'> 		return 0;</div><div class='del'>-	lsp = nfs4_get_lock_state(state, fl-&gt;fl_owner);</div><div class='add'>+	lsp = nfs4_get_lock_state(state, fl-&gt;c.flc_owner);</div><div class='ctx'> 	if (lsp == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	fl-&gt;fl_u.nfs4_fl.owner = lsp;</div><div class='hunk'>@@ -989,7 +981,7 @@ static int nfs4_copy_lock_stateid(nfs4_stateid *dst,</div><div class='ctx'> 		const struct nfs_lock_context *l_ctx)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_lock_state *lsp;</div><div class='del'>-	fl_owner_t fl_owner, fl_flock_owner;</div><div class='add'>+	fl_owner_t owner, fl_flock_owner;</div><div class='ctx'> 	int ret = -ENOENT;</div><div class='ctx'> </div><div class='ctx'> 	if (l_ctx == NULL)</div><div class='hunk'>@@ -998,11 +990,11 @@ static int nfs4_copy_lock_stateid(nfs4_stateid *dst,</div><div class='ctx'> 	if (test_bit(LK_STATE_IN_USE, &amp;state-&gt;flags) == 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	fl_owner = l_ctx-&gt;lockowner;</div><div class='add'>+	owner = l_ctx-&gt;lockowner;</div><div class='ctx'> 	fl_flock_owner = l_ctx-&gt;open_context-&gt;flock_owner;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;state-&gt;state_lock);</div><div class='del'>-	lsp = __nfs4_find_lock_state(state, fl_owner, fl_flock_owner);</div><div class='add'>+	lsp = __nfs4_find_lock_state(state, owner, fl_flock_owner);</div><div class='ctx'> 	if (lsp &amp;&amp; test_bit(NFS_LOCK_LOST, &amp;lsp-&gt;ls_flags))</div><div class='ctx'> 		ret = -EIO;</div><div class='ctx'> 	else if (lsp != NULL &amp;&amp; test_bit(NFS_LOCK_INITIALIZED, &amp;lsp-&gt;ls_flags) != 0) {</div><div class='hunk'>@@ -1091,14 +1083,12 @@ void nfs_release_seqid(struct nfs_seqid *seqid)</div><div class='ctx'> 		return;</div><div class='ctx'> 	sequence = seqid-&gt;sequence;</div><div class='ctx'> 	spin_lock(&amp;sequence-&gt;lock);</div><div class='del'>-	list_del_init(&amp;seqid-&gt;list);</div><div class='del'>-	if (!list_empty(&amp;sequence-&gt;list)) {</div><div class='del'>-		struct nfs_seqid *next;</div><div class='del'>-</div><div class='del'>-		next = list_first_entry(&amp;sequence-&gt;list,</div><div class='del'>-				struct nfs_seqid, list);</div><div class='add'>+	if (list_is_first(&amp;seqid-&gt;list, &amp;sequence-&gt;list) &amp;&amp;</div><div class='add'>+	    !list_is_singular(&amp;sequence-&gt;list)) {</div><div class='add'>+		struct nfs_seqid *next = list_next_entry(seqid, list);</div><div class='ctx'> 		rpc_wake_up_queued_task(&amp;sequence-&gt;wait, next-&gt;task);</div><div class='ctx'> 	}</div><div class='add'>+	list_del_init(&amp;seqid-&gt;list);</div><div class='ctx'> 	spin_unlock(&amp;sequence-&gt;lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1205,10 +1195,26 @@ void nfs4_schedule_state_manager(struct nfs_client *clp)</div><div class='ctx'> {</div><div class='ctx'> 	struct task_struct *task;</div><div class='ctx'> 	char buf[INET6_ADDRSTRLEN + sizeof("-manager") + 1];</div><div class='add'>+	struct rpc_clnt *clnt = clp-&gt;cl_rpcclient;</div><div class='add'>+	bool swapon = false;</div><div class='add'>+</div><div class='add'>+	if (clp-&gt;cl_cons_state &lt; 0)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='ctx'> 	set_bit(NFS4CLNT_RUN_MANAGER, &amp;clp-&gt;cl_state);</div><div class='add'>+</div><div class='add'>+	if (atomic_read(&amp;clnt-&gt;cl_swapper)) {</div><div class='add'>+		swapon = !test_and_set_bit(NFS4CLNT_MANAGER_AVAILABLE,</div><div class='add'>+					   &amp;clp-&gt;cl_state);</div><div class='add'>+		if (!swapon) {</div><div class='add'>+			wake_up_var(&amp;clp-&gt;cl_state);</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (test_and_set_bit(NFS4CLNT_MANAGER_RUNNING, &amp;clp-&gt;cl_state) != 0)</div><div class='ctx'> 		return;</div><div class='add'>+</div><div class='ctx'> 	__module_get(THIS_MODULE);</div><div class='ctx'> 	refcount_inc(&amp;clp-&gt;cl_count);</div><div class='ctx'> </div><div class='hunk'>@@ -1223,6 +1229,10 @@ void nfs4_schedule_state_manager(struct nfs_client *clp)</div><div class='ctx'> 	if (IS_ERR(task)) {</div><div class='ctx'> 		printk(KERN_ERR "%s: kthread_run: %ld\n",</div><div class='ctx'> 			__func__, PTR_ERR(task));</div><div class='add'>+		if (!nfs_client_init_is_complete(clp))</div><div class='add'>+			nfs_mark_client_ready(clp, PTR_ERR(task));</div><div class='add'>+		if (swapon)</div><div class='add'>+			clear_bit(NFS4CLNT_MANAGER_AVAILABLE, &amp;clp-&gt;cl_state);</div><div class='ctx'> 		nfs4_clear_state_manager_bit(clp);</div><div class='ctx'> 		nfs_put_client(clp);</div><div class='ctx'> 		module_put(THIS_MODULE);</div><div class='hunk'>@@ -1304,7 +1314,8 @@ int nfs4_wait_clnt_recover(struct nfs_client *clp)</div><div class='ctx'> </div><div class='ctx'> 	refcount_inc(&amp;clp-&gt;cl_count);</div><div class='ctx'> 	res = wait_on_bit_action(&amp;clp-&gt;cl_state, NFS4CLNT_MANAGER_RUNNING,</div><div class='del'>-				 nfs_wait_bit_killable, TASK_KILLABLE);</div><div class='add'>+				 nfs_wait_bit_killable,</div><div class='add'>+				 TASK_KILLABLE|TASK_FREEZABLE_UNSAFE);</div><div class='ctx'> 	if (res)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	if (clp-&gt;cl_cons_state &lt; 0)</div><div class='hunk'>@@ -1392,7 +1403,7 @@ int nfs4_schedule_stateid_recovery(const struct nfs_server *server, struct nfs4_</div><div class='ctx'> 	dprintk("%s: scheduling stateid recovery for server %s\n", __func__,</div><div class='ctx'> 			clp-&gt;cl_hostname);</div><div class='ctx'> 	nfs4_schedule_state_manager(clp);</div><div class='del'>-	return 0;</div><div class='add'>+	return clp-&gt;cl_cons_state &lt; 0 ? clp-&gt;cl_cons_state : 0;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs4_schedule_stateid_recovery);</div><div class='ctx'> </div><div class='hunk'>@@ -1492,7 +1503,7 @@ static int nfs4_reclaim_locks(struct nfs4_state *state, const struct nfs4_state_</div><div class='ctx'> 	struct file_lock *fl;</div><div class='ctx'> 	struct nfs4_lock_state *lsp;</div><div class='ctx'> 	int status = 0;</div><div class='del'>-	struct file_lock_context *flctx = inode-&gt;i_flctx;</div><div class='add'>+	struct file_lock_context *flctx = locks_inode_context(inode);</div><div class='ctx'> 	struct list_head *list;</div><div class='ctx'> </div><div class='ctx'> 	if (flctx == NULL)</div><div class='hunk'>@@ -1504,8 +1515,8 @@ static int nfs4_reclaim_locks(struct nfs4_state *state, const struct nfs4_state_</div><div class='ctx'> 	down_write(&amp;nfsi-&gt;rwsem);</div><div class='ctx'> 	spin_lock(&amp;flctx-&gt;flc_lock);</div><div class='ctx'> restart:</div><div class='del'>-	list_for_each_entry(fl, list, fl_list) {</div><div class='del'>-		if (nfs_file_open_context(fl-&gt;fl_file)-&gt;state != state)</div><div class='add'>+	for_each_file_lock(fl, list) {</div><div class='add'>+		if (nfs_file_open_context(fl-&gt;c.flc_file)-&gt;state != state)</div><div class='ctx'> 			continue;</div><div class='ctx'> 		spin_unlock(&amp;flctx-&gt;flc_lock);</div><div class='ctx'> 		status = ops-&gt;recover_lock(state, fl);</div><div class='hunk'>@@ -1572,7 +1583,7 @@ static void nfs42_complete_copies(struct nfs4_state_owner *sp, struct nfs4_state</div><div class='ctx'> 			complete(&amp;copy-&gt;completion);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	list_for_each_entry(copy, &amp;sp-&gt;so_server-&gt;ss_copies, src_copies) {</div><div class='add'>+	list_for_each_entry(copy, &amp;sp-&gt;so_server-&gt;ss_src_copies, src_copies) {</div><div class='ctx'> 		if ((test_bit(NFS_CLNT_SRC_SSC_COPY_STATE, &amp;state-&gt;flags) &amp;&amp;</div><div class='ctx'> 				!nfs4_stateid_match_other(&amp;state-&gt;stateid,</div><div class='ctx'> 				&amp;copy-&gt;parent_src_state-&gt;stateid)))</div><div class='hunk'>@@ -1592,7 +1603,8 @@ static inline void nfs42_complete_copies(struct nfs4_state_owner *sp,</div><div class='ctx'> #endif /* CONFIG_NFS_V4_2 */</div><div class='ctx'> </div><div class='ctx'> static int __nfs4_reclaim_open_state(struct nfs4_state_owner *sp, struct nfs4_state *state,</div><div class='del'>-				     const struct nfs4_state_recovery_ops *ops)</div><div class='add'>+				     const struct nfs4_state_recovery_ops *ops,</div><div class='add'>+				     int *lost_locks)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_lock_state *lock;</div><div class='ctx'> 	int status;</div><div class='hunk'>@@ -1609,8 +1621,9 @@ static int __nfs4_reclaim_open_state(struct nfs4_state_owner *sp, struct nfs4_st</div><div class='ctx'> 		spin_lock(&amp;state-&gt;state_lock);</div><div class='ctx'> 		list_for_each_entry(lock, &amp;state-&gt;lock_states, ls_locks) {</div><div class='ctx'> 			trace_nfs4_state_lock_reclaim(state, lock);</div><div class='del'>-			if (!test_bit(NFS_LOCK_INITIALIZED, &amp;lock-&gt;ls_flags))</div><div class='del'>-				pr_warn_ratelimited("NFS: %s: Lock reclaim failed!\n", __func__);</div><div class='add'>+			if (!test_bit(NFS_LOCK_INITIALIZED, &amp;lock-&gt;ls_flags) &amp;&amp;</div><div class='add'>+			    !test_bit(NFS_LOCK_UNLOCKING, &amp;lock-&gt;ls_flags))</div><div class='add'>+				*lost_locks += 1;</div><div class='ctx'> 		}</div><div class='ctx'> 		spin_unlock(&amp;state-&gt;state_lock);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1620,7 +1633,9 @@ static int __nfs4_reclaim_open_state(struct nfs4_state_owner *sp, struct nfs4_st</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int nfs4_reclaim_open_state(struct nfs4_state_owner *sp, const struct nfs4_state_recovery_ops *ops)</div><div class='add'>+static int nfs4_reclaim_open_state(struct nfs4_state_owner *sp,</div><div class='add'>+				   const struct nfs4_state_recovery_ops *ops,</div><div class='add'>+				   int *lost_locks)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_state *state;</div><div class='ctx'> 	unsigned int loop = 0;</div><div class='hunk'>@@ -1638,7 +1653,6 @@ static int nfs4_reclaim_open_state(struct nfs4_state_owner *sp, const struct nfs</div><div class='ctx'> 	 * server that doesn't support a grace period.</div><div class='ctx'> 	 */</div><div class='ctx'> 	spin_lock(&amp;sp-&gt;so_lock);</div><div class='del'>-	raw_write_seqcount_begin(&amp;sp-&gt;so_reclaim_seqcount);</div><div class='ctx'> restart:</div><div class='ctx'> 	list_for_each_entry(state, &amp;sp-&gt;so_states, open_states) {</div><div class='ctx'> 		if (!test_and_clear_bit(ops-&gt;state_flag_bit, &amp;state-&gt;flags))</div><div class='hunk'>@@ -1656,7 +1670,7 @@ restart:</div><div class='ctx'> #endif /* CONFIG_NFS_V4_2 */</div><div class='ctx'> 		refcount_inc(&amp;state-&gt;count);</div><div class='ctx'> 		spin_unlock(&amp;sp-&gt;so_lock);</div><div class='del'>-		status = __nfs4_reclaim_open_state(sp, state, ops);</div><div class='add'>+		status = __nfs4_reclaim_open_state(sp, state, ops, lost_locks);</div><div class='ctx'> </div><div class='ctx'> 		switch (status) {</div><div class='ctx'> 		default:</div><div class='hunk'>@@ -1706,7 +1720,6 @@ restart:</div><div class='ctx'> 		spin_lock(&amp;sp-&gt;so_lock);</div><div class='ctx'> 		goto restart;</div><div class='ctx'> 	}</div><div class='del'>-	raw_write_seqcount_end(&amp;sp-&gt;so_reclaim_seqcount);</div><div class='ctx'> 	spin_unlock(&amp;sp-&gt;so_lock);</div><div class='ctx'> #ifdef CONFIG_NFS_V4_2</div><div class='ctx'> 	if (found_ssc_copy_state)</div><div class='hunk'>@@ -1716,7 +1729,6 @@ restart:</div><div class='ctx'> out_err:</div><div class='ctx'> 	nfs4_put_open_state(state);</div><div class='ctx'> 	spin_lock(&amp;sp-&gt;so_lock);</div><div class='del'>-	raw_write_seqcount_end(&amp;sp-&gt;so_reclaim_seqcount);</div><div class='ctx'> 	spin_unlock(&amp;sp-&gt;so_lock);</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='hunk'>@@ -1774,6 +1786,7 @@ static void nfs4_state_mark_reclaim_helper(struct nfs_client *clp,</div><div class='ctx'> </div><div class='ctx'> static void nfs4_state_start_reclaim_reboot(struct nfs_client *clp)</div><div class='ctx'> {</div><div class='add'>+	set_bit(NFS4CLNT_RECLAIM_REBOOT, &amp;clp-&gt;cl_state);</div><div class='ctx'> 	/* Mark all delegations for reclaim */</div><div class='ctx'> 	nfs_delegation_mark_reclaim(clp);</div><div class='ctx'> 	nfs4_state_mark_reclaim_helper(clp, nfs4_state_mark_reclaim_reboot);</div><div class='hunk'>@@ -1837,6 +1850,7 @@ static void nfs4_state_end_reclaim_reboot(struct nfs_client *clp)</div><div class='ctx'> </div><div class='ctx'> 	if (!nfs4_state_clear_reclaim_reboot(clp))</div><div class='ctx'> 		return;</div><div class='add'>+	pnfs_destroy_all_layouts(clp);</div><div class='ctx'> 	ops = clp-&gt;cl_mvops-&gt;reboot_recovery_ops;</div><div class='ctx'> 	cred = nfs4_get_clid_cred(clp);</div><div class='ctx'> 	err = nfs4_reclaim_complete(clp, ops, cred);</div><div class='hunk'>@@ -1898,8 +1912,12 @@ static int nfs4_do_reclaim(struct nfs_client *clp, const struct nfs4_state_recov</div><div class='ctx'> 	struct nfs_server *server;</div><div class='ctx'> 	struct rb_node *pos;</div><div class='ctx'> 	LIST_HEAD(freeme);</div><div class='del'>-	int status = 0;</div><div class='add'>+	int lost_locks = 0;</div><div class='add'>+	int status;</div><div class='ctx'> </div><div class='add'>+	status = nfs4_begin_drain_session(clp);</div><div class='add'>+	if (status &lt; 0)</div><div class='add'>+		return status;</div><div class='ctx'> restart:</div><div class='ctx'> 	rcu_read_lock();</div><div class='ctx'> 	list_for_each_entry_rcu(server, &amp;clp-&gt;cl_superblocks, client_link) {</div><div class='hunk'>@@ -1918,11 +1936,15 @@ restart:</div><div class='ctx'> 			spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='ctx'> 			rcu_read_unlock();</div><div class='ctx'> </div><div class='del'>-			status = nfs4_reclaim_open_state(sp, ops);</div><div class='add'>+			status = nfs4_reclaim_open_state(sp, ops, &amp;lost_locks);</div><div class='ctx'> 			if (status &lt; 0) {</div><div class='add'>+				if (lost_locks)</div><div class='add'>+					pr_warn("NFS: %s: lost %d locks\n",</div><div class='add'>+						clp-&gt;cl_hostname, lost_locks);</div><div class='ctx'> 				set_bit(ops-&gt;owner_flag_bit, &amp;sp-&gt;so_flags);</div><div class='ctx'> 				nfs4_put_state_owner(sp);</div><div class='ctx'> 				status = nfs4_recovery_handle_error(clp, status);</div><div class='add'>+				nfs4_free_state_owners(&amp;freeme);</div><div class='ctx'> 				return (status != 0) ? status : -EAGAIN;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='hunk'>@@ -1933,6 +1955,10 @@ restart:</div><div class='ctx'> 	}</div><div class='ctx'> 	rcu_read_unlock();</div><div class='ctx'> 	nfs4_free_state_owners(&amp;freeme);</div><div class='add'>+	nfs_local_probe_async(clp);</div><div class='add'>+	if (lost_locks)</div><div class='add'>+		pr_warn("NFS: %s: lost %d locks\n",</div><div class='add'>+			clp-&gt;cl_hostname, lost_locks);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1986,6 +2012,12 @@ static int nfs4_handle_reclaim_lease_error(struct nfs_client *clp, int status)</div><div class='ctx'> 		nfs_mark_client_ready(clp, -EPERM);</div><div class='ctx'> 		clear_bit(NFS4CLNT_LEASE_CONFIRM, &amp;clp-&gt;cl_state);</div><div class='ctx'> 		return -EPERM;</div><div class='add'>+	case -ETIMEDOUT:</div><div class='add'>+		if (clp-&gt;cl_cons_state == NFS_CS_SESSION_INITING) {</div><div class='add'>+			nfs_mark_client_ready(clp, -EIO);</div><div class='add'>+			return -EIO;</div><div class='add'>+		}</div><div class='add'>+		fallthrough;</div><div class='ctx'> 	case -EACCES:</div><div class='ctx'> 	case -NFS4ERR_DELAY:</div><div class='ctx'> 	case -EAGAIN:</div><div class='hunk'>@@ -1998,6 +2030,10 @@ static int nfs4_handle_reclaim_lease_error(struct nfs_client *clp, int status)</div><div class='ctx'> 		dprintk("%s: exit with error %d for server %s\n",</div><div class='ctx'> 				__func__, -EPROTONOSUPPORT, clp-&gt;cl_hostname);</div><div class='ctx'> 		return -EPROTONOSUPPORT;</div><div class='add'>+	case -ENOSPC:</div><div class='add'>+		if (clp-&gt;cl_cons_state == NFS_CS_SESSION_INITING)</div><div class='add'>+			nfs_mark_client_ready(clp, -EIO);</div><div class='add'>+		return -EIO;</div><div class='ctx'> 	case -NFS4ERR_NOT_SAME: /* FixMe: implement recovery</div><div class='ctx'> 				 * in nfs4_exchange_id */</div><div class='ctx'> 	default:</div><div class='hunk'>@@ -2028,7 +2064,6 @@ static int nfs4_establish_lease(struct nfs_client *clp)</div><div class='ctx'> 	put_cred(cred);</div><div class='ctx'> 	if (status != 0)</div><div class='ctx'> 		return status;</div><div class='del'>-	pnfs_destroy_all_layouts(clp);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2076,6 +2111,7 @@ static int nfs4_try_migration(struct nfs_server *server, const struct cred *cred</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_client *clp = server-&gt;nfs_client;</div><div class='ctx'> 	struct nfs4_fs_locations *locations = NULL;</div><div class='add'>+	struct nfs_fattr *fattr;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct page *page;</div><div class='ctx'> 	int status, result;</div><div class='hunk'>@@ -2085,16 +2121,19 @@ static int nfs4_try_migration(struct nfs_server *server, const struct cred *cred</div><div class='ctx'> 			(unsigned long long)server-&gt;fsid.minor,</div><div class='ctx'> 			clp-&gt;cl_hostname);</div><div class='ctx'> </div><div class='del'>-	result = 0;</div><div class='ctx'> 	page = alloc_page(GFP_KERNEL);</div><div class='ctx'> 	locations = kmalloc(sizeof(struct nfs4_fs_locations), GFP_KERNEL);</div><div class='del'>-	if (page == NULL || locations == NULL) {</div><div class='add'>+	fattr = nfs_alloc_fattr();</div><div class='add'>+	if (page == NULL || locations == NULL || fattr == NULL) {</div><div class='ctx'> 		dprintk("&lt;-- %s: no memory\n", __func__);</div><div class='add'>+		result = 0;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	locations-&gt;fattr = fattr;</div><div class='ctx'> 	inode = d_inode(server-&gt;super-&gt;s_root);</div><div class='del'>-	result = nfs4_proc_get_locations(inode, locations, page, cred);</div><div class='add'>+	result = nfs4_proc_get_locations(server, NFS_FH(inode), locations,</div><div class='add'>+					 page, cred);</div><div class='ctx'> 	if (result) {</div><div class='ctx'> 		dprintk("&lt;-- %s: failed to retrieve fs_locations: %d\n",</div><div class='ctx'> 			__func__, result);</div><div class='hunk'>@@ -2102,7 +2141,10 @@ static int nfs4_try_migration(struct nfs_server *server, const struct cred *cred</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	result = -NFS4ERR_NXIO;</div><div class='del'>-	if (!(locations-&gt;fattr.valid &amp; NFS_ATTR_FATTR_V4_LOCATIONS)) {</div><div class='add'>+	if (!locations-&gt;nlocations)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	if (!(locations-&gt;fattr-&gt;valid &amp; NFS_ATTR_FATTR_V4_LOCATIONS)) {</div><div class='ctx'> 		dprintk("&lt;-- %s: No fs_locations data, migration skipped\n",</div><div class='ctx'> 			__func__);</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -2127,6 +2169,8 @@ static int nfs4_try_migration(struct nfs_server *server, const struct cred *cred</div><div class='ctx'> out:</div><div class='ctx'> 	if (page != NULL)</div><div class='ctx'> 		__free_page(page);</div><div class='add'>+	if (locations != NULL)</div><div class='add'>+		kfree(locations-&gt;fattr);</div><div class='ctx'> 	kfree(locations);</div><div class='ctx'> 	if (result) {</div><div class='ctx'> 		pr_err("NFS: migration recovery failed (server %s)\n",</div><div class='hunk'>@@ -2552,9 +2596,17 @@ static void nfs4_layoutreturn_any_run(struct nfs_client *clp)</div><div class='ctx'> </div><div class='ctx'> static void nfs4_state_manager(struct nfs_client *clp)</div><div class='ctx'> {</div><div class='add'>+	unsigned int memflags;</div><div class='ctx'> 	int status = 0;</div><div class='ctx'> 	const char *section = "", *section_sep = "";</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * State recovery can deadlock if the direct reclaim code tries</div><div class='add'>+	 * start NFS writeback. So ensure memory allocations are all</div><div class='add'>+	 * GFP_NOFS.</div><div class='add'>+	 */</div><div class='add'>+	memflags = memalloc_nofs_save();</div><div class='add'>+</div><div class='ctx'> 	/* Ensure exclusive access to NFSv4 state */</div><div class='ctx'> 	do {</div><div class='ctx'> 		trace_nfs4_state_mgr(clp);</div><div class='hunk'>@@ -2623,16 +2675,22 @@ static void nfs4_state_manager(struct nfs_client *clp)</div><div class='ctx'> 			section = "reclaim reboot";</div><div class='ctx'> 			status = nfs4_do_reclaim(clp,</div><div class='ctx'> 				clp-&gt;cl_mvops-&gt;reboot_recovery_ops);</div><div class='add'>+			if (status == 0)</div><div class='add'>+				status = pnfs_layout_handle_reboot(clp);</div><div class='ctx'> 			if (status == -EAGAIN)</div><div class='ctx'> 				continue;</div><div class='ctx'> 			if (status &lt; 0)</div><div class='ctx'> 				goto out_error;</div><div class='ctx'> 			nfs4_state_end_reclaim_reboot(clp);</div><div class='add'>+			continue;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 		/* Detect expired delegations... */</div><div class='ctx'> 		if (test_and_clear_bit(NFS4CLNT_DELEGATION_EXPIRED, &amp;clp-&gt;cl_state)) {</div><div class='ctx'> 			section = "detect expired delegations";</div><div class='add'>+			status = nfs4_begin_drain_session(clp);</div><div class='add'>+			if (status &lt; 0)</div><div class='add'>+				goto out_error;</div><div class='ctx'> 			nfs_reap_expired_delegations(clp);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -2649,9 +2707,17 @@ static void nfs4_state_manager(struct nfs_client *clp)</div><div class='ctx'> 			clear_bit(NFS4CLNT_RECLAIM_NOGRACE, &amp;clp-&gt;cl_state);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='add'>+		memalloc_nofs_restore(memflags);</div><div class='ctx'> 		nfs4_end_drain_session(clp);</div><div class='ctx'> 		nfs4_clear_state_manager_bit(clp);</div><div class='ctx'> </div><div class='add'>+		if (test_bit(NFS4CLNT_RUN_MANAGER, &amp;clp-&gt;cl_state) &amp;&amp;</div><div class='add'>+		    !test_and_set_bit(NFS4CLNT_MANAGER_RUNNING,</div><div class='add'>+				      &amp;clp-&gt;cl_state)) {</div><div class='add'>+			memflags = memalloc_nofs_save();</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		if (!test_and_set_bit(NFS4CLNT_RECALL_RUNNING, &amp;clp-&gt;cl_state)) {</div><div class='ctx'> 			if (test_and_clear_bit(NFS4CLNT_DELEGRETURN, &amp;clp-&gt;cl_state)) {</div><div class='ctx'> 				nfs_client_return_marked_delegations(clp);</div><div class='hunk'>@@ -2661,11 +2727,8 @@ static void nfs4_state_manager(struct nfs_client *clp)</div><div class='ctx'> 			clear_bit(NFS4CLNT_RECALL_RUNNING, &amp;clp-&gt;cl_state);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		/* Did we race with an attempt to give us more work? */</div><div class='del'>-		if (!test_bit(NFS4CLNT_RUN_MANAGER, &amp;clp-&gt;cl_state))</div><div class='del'>-			return;</div><div class='del'>-		if (test_and_set_bit(NFS4CLNT_MANAGER_RUNNING, &amp;clp-&gt;cl_state) != 0)</div><div class='del'>-			return;</div><div class='add'>+		return;</div><div class='add'>+</div><div class='ctx'> 	} while (refcount_read(&amp;clp-&gt;cl_count) &gt; 1 &amp;&amp; !signalled());</div><div class='ctx'> 	goto out_drain;</div><div class='ctx'> </div><div class='hunk'>@@ -2676,8 +2739,20 @@ out_error:</div><div class='ctx'> 	pr_warn_ratelimited("NFS: state manager%s%s failed on NFSv4 server %s"</div><div class='ctx'> 			" with error %d\n", section_sep, section,</div><div class='ctx'> 			clp-&gt;cl_hostname, -status);</div><div class='del'>-	ssleep(1);</div><div class='add'>+	switch (status) {</div><div class='add'>+	case -ENETDOWN:</div><div class='add'>+	case -ENETUNREACH:</div><div class='add'>+		nfs_mark_client_ready(clp, -EIO);</div><div class='add'>+		break;</div><div class='add'>+	case -EINVAL:</div><div class='add'>+		nfs_mark_client_ready(clp, status);</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		ssleep(1);</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='ctx'> out_drain:</div><div class='add'>+	memalloc_nofs_restore(memflags);</div><div class='ctx'> 	nfs4_end_drain_session(clp);</div><div class='ctx'> 	nfs4_clear_state_manager_bit(clp);</div><div class='ctx'> }</div><div class='hunk'>@@ -2685,10 +2760,35 @@ out_drain:</div><div class='ctx'> static int nfs4_run_state_manager(void *ptr)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_client *clp = ptr;</div><div class='add'>+	struct rpc_clnt *cl = clp-&gt;cl_rpcclient;</div><div class='add'>+</div><div class='add'>+	while (cl != cl-&gt;cl_parent)</div><div class='add'>+		cl = cl-&gt;cl_parent;</div><div class='ctx'> </div><div class='ctx'> 	allow_signal(SIGKILL);</div><div class='add'>+again:</div><div class='ctx'> 	nfs4_state_manager(clp);</div><div class='add'>+</div><div class='add'>+	if (test_bit(NFS4CLNT_MANAGER_AVAILABLE, &amp;clp-&gt;cl_state) &amp;&amp;</div><div class='add'>+	    !test_bit(NFS4CLNT_MANAGER_RUNNING, &amp;clp-&gt;cl_state)) {</div><div class='add'>+		wait_var_event_interruptible(&amp;clp-&gt;cl_state,</div><div class='add'>+					     test_bit(NFS4CLNT_RUN_MANAGER,</div><div class='add'>+						      &amp;clp-&gt;cl_state));</div><div class='add'>+		if (!atomic_read(&amp;cl-&gt;cl_swapper))</div><div class='add'>+			clear_bit(NFS4CLNT_MANAGER_AVAILABLE, &amp;clp-&gt;cl_state);</div><div class='add'>+		if (refcount_read(&amp;clp-&gt;cl_count) &gt; 1 &amp;&amp; !signalled() &amp;&amp;</div><div class='add'>+		    !test_and_set_bit(NFS4CLNT_MANAGER_RUNNING, &amp;clp-&gt;cl_state))</div><div class='add'>+			goto again;</div><div class='add'>+		/* Either no longer a swapper, or were signalled */</div><div class='add'>+		clear_bit(NFS4CLNT_MANAGER_AVAILABLE, &amp;clp-&gt;cl_state);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (refcount_read(&amp;clp-&gt;cl_count) &gt; 1 &amp;&amp; !signalled() &amp;&amp;</div><div class='add'>+	    test_bit(NFS4CLNT_RUN_MANAGER, &amp;clp-&gt;cl_state) &amp;&amp;</div><div class='add'>+	    !test_and_set_bit(NFS4CLNT_MANAGER_RUNNING, &amp;clp-&gt;cl_state))</div><div class='add'>+		goto again;</div><div class='add'>+</div><div class='ctx'> 	nfs_put_client(clp);</div><div class='del'>-	module_put_and_exit(0);</div><div class='add'>+	module_put_and_kthread_exit(0);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/nfs/nfs4super.c b/fs/nfs/nfs4super.c<br/>index d09bcfd7db89..5ec9c83f1ef0 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4super.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4super.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4super.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfs4super.c</a></div><div class='hunk'>@@ -145,18 +145,13 @@ static int do_nfs4_mount(struct nfs_server *server,</div><div class='ctx'> 			 const char *export_path)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_fs_context *root_ctx;</div><div class='add'>+	struct nfs_fs_context *ctx;</div><div class='ctx'> 	struct fs_context *root_fc;</div><div class='ctx'> 	struct vfsmount *root_mnt;</div><div class='ctx'> 	struct dentry *dentry;</div><div class='del'>-	size_t len;</div><div class='add'>+	char *source;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	struct fs_parameter param = {</div><div class='del'>-		.key	= "source",</div><div class='del'>-		.type	= fs_value_is_string,</div><div class='del'>-		.dirfd	= -1,</div><div class='del'>-	};</div><div class='del'>-</div><div class='ctx'> 	if (IS_ERR(server))</div><div class='ctx'> 		return PTR_ERR(server);</div><div class='ctx'> </div><div class='hunk'>@@ -168,25 +163,32 @@ static int do_nfs4_mount(struct nfs_server *server,</div><div class='ctx'> 	kfree(root_fc-&gt;source);</div><div class='ctx'> 	root_fc-&gt;source = NULL;</div><div class='ctx'> </div><div class='add'>+	ctx = nfs_fc2context(fc);</div><div class='ctx'> 	root_ctx = nfs_fc2context(root_fc);</div><div class='ctx'> 	root_ctx-&gt;internal = true;</div><div class='ctx'> 	root_ctx-&gt;server = server;</div><div class='del'>-	/* We leave export_path unset as it's not used to find the root. */</div><div class='ctx'> </div><div class='del'>-	len = strlen(hostname) + 5;</div><div class='del'>-	param.string = kmalloc(len, GFP_KERNEL);</div><div class='del'>-	if (param.string == NULL) {</div><div class='del'>-		put_fs_context(root_fc);</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	if (ctx-&gt;fscache_uniq) {</div><div class='add'>+		ret = vfs_parse_fs_string(root_fc, "fsc", ctx-&gt;fscache_uniq);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			put_fs_context(root_fc);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='add'>+	/* We leave export_path unset as it's not used to find the root. */</div><div class='ctx'> </div><div class='ctx'> 	/* Does hostname needs to be enclosed in brackets? */</div><div class='ctx'> 	if (strchr(hostname, ':'))</div><div class='del'>-		param.size = snprintf(param.string, len, "[%s]:/", hostname);</div><div class='add'>+		source = kasprintf(GFP_KERNEL, "[%s]:/", hostname);</div><div class='ctx'> 	else</div><div class='del'>-		param.size = snprintf(param.string, len, "%s:/", hostname);</div><div class='del'>-	ret = vfs_parse_fs_param(root_fc, &amp;param);</div><div class='del'>-	kfree(param.string);</div><div class='add'>+		source = kasprintf(GFP_KERNEL, "%s:/", hostname);</div><div class='add'>+</div><div class='add'>+	if (!source) {</div><div class='add'>+		put_fs_context(root_fc);</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+	ret = vfs_parse_fs_string(root_fc, "source", source);</div><div class='add'>+	kfree(source);</div><div class='ctx'> 	if (ret &lt; 0) {</div><div class='ctx'> 		put_fs_context(root_fc);</div><div class='ctx'> 		return ret;</div><div class='hunk'>@@ -308,6 +310,7 @@ static void __exit exit_nfs_v4(void)</div><div class='ctx'> 	nfs_dns_resolver_destroy();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+MODULE_DESCRIPTION("NFSv4 client support");</div><div class='ctx'> MODULE_LICENSE("GPL");</div><div class='ctx'> </div><div class='ctx'> module_init(init_nfs_v4);</div><div class='head'>diff --git a/fs/nfs/nfs4sysctl.c b/fs/nfs/nfs4sysctl.c<br/>index c394e4447100..d1a92d8f8ba4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4sysctl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4sysctl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4sysctl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfs4sysctl.c</a></div><div class='hunk'>@@ -17,7 +17,7 @@ static const int nfs_set_port_min;</div><div class='ctx'> static const int nfs_set_port_max = 65535;</div><div class='ctx'> static struct ctl_table_header *nfs4_callback_sysctl_table;</div><div class='ctx'> </div><div class='del'>-static struct ctl_table nfs4_cb_sysctls[] = {</div><div class='add'>+static const struct ctl_table nfs4_cb_sysctls[] = {</div><div class='ctx'> 	{</div><div class='ctx'> 		.procname = "nfs_callback_tcpport",</div><div class='ctx'> 		.data = &amp;nfs_callback_set_tcpport,</div><div class='hunk'>@@ -34,30 +34,12 @@ static struct ctl_table nfs4_cb_sysctls[] = {</div><div class='ctx'> 		.mode = 0644,</div><div class='ctx'> 		.proc_handler = proc_dointvec,</div><div class='ctx'> 	},</div><div class='del'>-	{ }</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static struct ctl_table nfs4_cb_sysctl_dir[] = {</div><div class='del'>-	{</div><div class='del'>-		.procname = "nfs",</div><div class='del'>-		.mode = 0555,</div><div class='del'>-		.child = nfs4_cb_sysctls,</div><div class='del'>-	},</div><div class='del'>-	{ }</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static struct ctl_table nfs4_cb_sysctl_root[] = {</div><div class='del'>-	{</div><div class='del'>-		.procname = "fs",</div><div class='del'>-		.mode = 0555,</div><div class='del'>-		.child = nfs4_cb_sysctl_dir,</div><div class='del'>-	},</div><div class='del'>-	{ }</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> int nfs4_register_sysctl(void)</div><div class='ctx'> {</div><div class='del'>-	nfs4_callback_sysctl_table = register_sysctl_table(nfs4_cb_sysctl_root);</div><div class='add'>+	nfs4_callback_sysctl_table = register_sysctl("fs/nfs",</div><div class='add'>+						     nfs4_cb_sysctls);</div><div class='ctx'> 	if (nfs4_callback_sysctl_table == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	return 0;</div><div class='head'>diff --git a/fs/nfs/nfs4trace.c b/fs/nfs/nfs4trace.c<br/>index d9ac556bebcf..987c92d6364b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4trace.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4trace.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4trace.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfs4trace.c</a></div><div class='hunk'>@@ -2,6 +2,8 @@</div><div class='ctx'> /*</div><div class='ctx'>  * Copyright (c) 2013 Trond Myklebust &lt;Trond.Myklebust@netapp.com&gt;</div><div class='ctx'>  */</div><div class='add'>+#include &lt;uapi/linux/pr.h&gt;</div><div class='add'>+#include &lt;linux/blkdev.h&gt;</div><div class='ctx'> #include &lt;linux/nfs_fs.h&gt;</div><div class='ctx'> #include "nfs4_fs.h"</div><div class='ctx'> #include "internal.h"</div><div class='hunk'>@@ -24,8 +26,17 @@ EXPORT_TRACEPOINT_SYMBOL_GPL(pnfs_mds_fallback_read_done);</div><div class='ctx'> EXPORT_TRACEPOINT_SYMBOL_GPL(pnfs_mds_fallback_write_done);</div><div class='ctx'> EXPORT_TRACEPOINT_SYMBOL_GPL(pnfs_mds_fallback_read_pagelist);</div><div class='ctx'> EXPORT_TRACEPOINT_SYMBOL_GPL(pnfs_mds_fallback_write_pagelist);</div><div class='add'>+EXPORT_TRACEPOINT_SYMBOL_GPL(pnfs_ds_connect);</div><div class='ctx'> </div><div class='ctx'> EXPORT_TRACEPOINT_SYMBOL_GPL(ff_layout_read_error);</div><div class='ctx'> EXPORT_TRACEPOINT_SYMBOL_GPL(ff_layout_write_error);</div><div class='ctx'> EXPORT_TRACEPOINT_SYMBOL_GPL(ff_layout_commit_error);</div><div class='add'>+</div><div class='add'>+EXPORT_TRACEPOINT_SYMBOL_GPL(bl_ext_tree_prepare_commit);</div><div class='add'>+EXPORT_TRACEPOINT_SYMBOL_GPL(bl_pr_key_reg);</div><div class='add'>+EXPORT_TRACEPOINT_SYMBOL_GPL(bl_pr_key_reg_err);</div><div class='add'>+EXPORT_TRACEPOINT_SYMBOL_GPL(bl_pr_key_unreg);</div><div class='add'>+EXPORT_TRACEPOINT_SYMBOL_GPL(bl_pr_key_unreg_err);</div><div class='add'>+</div><div class='add'>+EXPORT_TRACEPOINT_SYMBOL_GPL(fl_getdevinfo);</div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/nfs/nfs4trace.h b/fs/nfs/nfs4trace.h<br/>index 6ee6ad3674a2..9776d220cec3 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4trace.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4trace.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4trace.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfs4trace.h</a></div><div class='hunk'>@@ -9,10 +9,12 @@</div><div class='ctx'> #define _TRACE_NFS4_H</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/tracepoint.h&gt;</div><div class='del'>-#include &lt;trace/events/sunrpc_base.h&gt;</div><div class='add'>+#include &lt;trace/misc/sunrpc.h&gt;</div><div class='ctx'> </div><div class='del'>-#include &lt;trace/events/fs.h&gt;</div><div class='del'>-#include &lt;trace/events/nfs.h&gt;</div><div class='add'>+#include &lt;trace/misc/fs.h&gt;</div><div class='add'>+#include &lt;trace/misc/nfs.h&gt;</div><div class='add'>+</div><div class='add'>+#include "delegation.h"</div><div class='ctx'> </div><div class='ctx'> #define show_nfs_fattr_flags(valid) \</div><div class='ctx'> 	__print_flags((unsigned long)valid, "|", \</div><div class='hunk'>@@ -30,7 +32,8 @@</div><div class='ctx'> 		{ NFS_ATTR_FATTR_CTIME, "CTIME" }, \</div><div class='ctx'> 		{ NFS_ATTR_FATTR_CHANGE, "CHANGE" }, \</div><div class='ctx'> 		{ NFS_ATTR_FATTR_OWNER_NAME, "OWNER_NAME" }, \</div><div class='del'>-		{ NFS_ATTR_FATTR_GROUP_NAME, "GROUP_NAME" })</div><div class='add'>+		{ NFS_ATTR_FATTR_GROUP_NAME, "GROUP_NAME" }, \</div><div class='add'>+		{ NFS_ATTR_FATTR_BTIME, "BTIME" })</div><div class='ctx'> </div><div class='ctx'> DECLARE_EVENT_CLASS(nfs4_clientid_event,</div><div class='ctx'> 		TP_PROTO(</div><div class='hunk'>@@ -47,7 +50,7 @@ DECLARE_EVENT_CLASS(nfs4_clientid_event,</div><div class='ctx'> </div><div class='ctx'> 		TP_fast_assign(</div><div class='ctx'> 			__entry-&gt;error = error &lt; 0 ? -error : 0;</div><div class='del'>-			__assign_str(dstaddr, clp-&gt;cl_hostname);</div><div class='add'>+			__assign_str(dstaddr);</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='hunk'>@@ -77,6 +80,36 @@ DEFINE_NFS4_CLIENTID_EVENT(nfs4_bind_conn_to_session);</div><div class='ctx'> DEFINE_NFS4_CLIENTID_EVENT(nfs4_sequence);</div><div class='ctx'> DEFINE_NFS4_CLIENTID_EVENT(nfs4_reclaim_complete);</div><div class='ctx'> </div><div class='add'>+TRACE_EVENT(nfs4_trunked_exchange_id,</div><div class='add'>+		TP_PROTO(</div><div class='add'>+			const struct nfs_client *clp,</div><div class='add'>+			const char *addr,</div><div class='add'>+			int error</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_ARGS(clp, addr, error),</div><div class='add'>+</div><div class='add'>+		TP_STRUCT__entry(</div><div class='add'>+			__string(main_addr, clp-&gt;cl_hostname)</div><div class='add'>+			__string(trunk_addr, addr)</div><div class='add'>+			__field(unsigned long, error)</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_fast_assign(</div><div class='add'>+			__entry-&gt;error = error &lt; 0 ? -error : 0;</div><div class='add'>+			__assign_str(main_addr);</div><div class='add'>+			__assign_str(trunk_addr);</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_printk(</div><div class='add'>+			"error=%ld (%s) main_addr=%s trunk_addr=%s",</div><div class='add'>+			-__entry-&gt;error,</div><div class='add'>+			show_nfs4_status(__entry-&gt;error),</div><div class='add'>+			__get_str(main_addr),</div><div class='add'>+			__get_str(trunk_addr)</div><div class='add'>+		)</div><div class='add'>+);</div><div class='add'>+</div><div class='ctx'> TRACE_EVENT(nfs4_sequence_done,</div><div class='ctx'> 		TP_PROTO(</div><div class='ctx'> 			const struct nfs4_session *session,</div><div class='hunk'>@@ -243,6 +276,32 @@ TRACE_EVENT(nfs4_cb_offload,</div><div class='ctx'> 			show_nfs_stable_how(__entry-&gt;cb_how)</div><div class='ctx'> 		)</div><div class='ctx'> );</div><div class='add'>+</div><div class='add'>+TRACE_EVENT(pnfs_ds_connect,</div><div class='add'>+		TP_PROTO(</div><div class='add'>+			char *ds_remotestr,</div><div class='add'>+			int status</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_ARGS(ds_remotestr, status),</div><div class='add'>+</div><div class='add'>+		TP_STRUCT__entry(</div><div class='add'>+			__string(ds_ips, ds_remotestr)</div><div class='add'>+			__field(int, status)</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_fast_assign(</div><div class='add'>+			__assign_str(ds_ips);</div><div class='add'>+			__entry-&gt;status = status;</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_printk(</div><div class='add'>+			"ds_ips=%s, status=%d",</div><div class='add'>+			__get_str(ds_ips),</div><div class='add'>+			__entry-&gt;status</div><div class='add'>+                )</div><div class='add'>+);</div><div class='add'>+</div><div class='ctx'> #endif /* CONFIG_NFS_V4_1 */</div><div class='ctx'> </div><div class='ctx'> TRACE_EVENT(nfs4_setup_sequence,</div><div class='hunk'>@@ -292,32 +351,34 @@ TRACE_DEFINE_ENUM(NFS4CLNT_MOVED);</div><div class='ctx'> TRACE_DEFINE_ENUM(NFS4CLNT_LEASE_MOVED);</div><div class='ctx'> TRACE_DEFINE_ENUM(NFS4CLNT_DELEGATION_EXPIRED);</div><div class='ctx'> TRACE_DEFINE_ENUM(NFS4CLNT_RUN_MANAGER);</div><div class='add'>+TRACE_DEFINE_ENUM(NFS4CLNT_MANAGER_AVAILABLE);</div><div class='ctx'> TRACE_DEFINE_ENUM(NFS4CLNT_RECALL_RUNNING);</div><div class='ctx'> TRACE_DEFINE_ENUM(NFS4CLNT_RECALL_ANY_LAYOUT_READ);</div><div class='ctx'> TRACE_DEFINE_ENUM(NFS4CLNT_RECALL_ANY_LAYOUT_RW);</div><div class='add'>+TRACE_DEFINE_ENUM(NFS4CLNT_DELEGRETURN_DELAYED);</div><div class='ctx'> </div><div class='ctx'> #define show_nfs4_clp_state(state) \</div><div class='ctx'> 	__print_flags(state, "|", \</div><div class='del'>-		{ NFS4CLNT_MANAGER_RUNNING,	"MANAGER_RUNNING" }, \</div><div class='del'>-		{ NFS4CLNT_CHECK_LEASE,		"CHECK_LEASE" }, \</div><div class='del'>-		{ NFS4CLNT_LEASE_EXPIRED,	"LEASE_EXPIRED" }, \</div><div class='del'>-		{ NFS4CLNT_RECLAIM_REBOOT,	"RECLAIM_REBOOT" }, \</div><div class='del'>-		{ NFS4CLNT_RECLAIM_NOGRACE,	"RECLAIM_NOGRACE" }, \</div><div class='del'>-		{ NFS4CLNT_DELEGRETURN,		"DELEGRETURN" }, \</div><div class='del'>-		{ NFS4CLNT_SESSION_RESET,	"SESSION_RESET" }, \</div><div class='del'>-		{ NFS4CLNT_LEASE_CONFIRM,	"LEASE_CONFIRM" }, \</div><div class='del'>-		{ NFS4CLNT_SERVER_SCOPE_MISMATCH, \</div><div class='del'>-						"SERVER_SCOPE_MISMATCH" }, \</div><div class='del'>-		{ NFS4CLNT_PURGE_STATE,		"PURGE_STATE" }, \</div><div class='del'>-		{ NFS4CLNT_BIND_CONN_TO_SESSION, \</div><div class='del'>-						"BIND_CONN_TO_SESSION" }, \</div><div class='del'>-		{ NFS4CLNT_MOVED,		"MOVED" }, \</div><div class='del'>-		{ NFS4CLNT_LEASE_MOVED,		"LEASE_MOVED" }, \</div><div class='del'>-		{ NFS4CLNT_DELEGATION_EXPIRED,	"DELEGATION_EXPIRED" }, \</div><div class='del'>-		{ NFS4CLNT_RUN_MANAGER,		"RUN_MANAGER" }, \</div><div class='del'>-		{ NFS4CLNT_RECALL_RUNNING,	"RECALL_RUNNING" }, \</div><div class='del'>-		{ NFS4CLNT_RECALL_ANY_LAYOUT_READ, "RECALL_ANY_LAYOUT_READ" }, \</div><div class='del'>-		{ NFS4CLNT_RECALL_ANY_LAYOUT_RW, "RECALL_ANY_LAYOUT_RW" })</div><div class='add'>+	{ BIT(NFS4CLNT_MANAGER_RUNNING),	"MANAGER_RUNNING" }, \</div><div class='add'>+	{ BIT(NFS4CLNT_CHECK_LEASE),		"CHECK_LEASE" }, \</div><div class='add'>+	{ BIT(NFS4CLNT_LEASE_EXPIRED),	"LEASE_EXPIRED" }, \</div><div class='add'>+	{ BIT(NFS4CLNT_RECLAIM_REBOOT),	"RECLAIM_REBOOT" }, \</div><div class='add'>+	{ BIT(NFS4CLNT_RECLAIM_NOGRACE),	"RECLAIM_NOGRACE" }, \</div><div class='add'>+	{ BIT(NFS4CLNT_DELEGRETURN),		"DELEGRETURN" }, \</div><div class='add'>+	{ BIT(NFS4CLNT_SESSION_RESET),	"SESSION_RESET" }, \</div><div class='add'>+	{ BIT(NFS4CLNT_LEASE_CONFIRM),	"LEASE_CONFIRM" }, \</div><div class='add'>+	{ BIT(NFS4CLNT_SERVER_SCOPE_MISMATCH),	"SERVER_SCOPE_MISMATCH" }, \</div><div class='add'>+	{ BIT(NFS4CLNT_PURGE_STATE),		"PURGE_STATE" }, \</div><div class='add'>+	{ BIT(NFS4CLNT_BIND_CONN_TO_SESSION),	"BIND_CONN_TO_SESSION" }, \</div><div class='add'>+	{ BIT(NFS4CLNT_MOVED),		"MOVED" }, \</div><div class='add'>+	{ BIT(NFS4CLNT_LEASE_MOVED),		"LEASE_MOVED" }, \</div><div class='add'>+	{ BIT(NFS4CLNT_DELEGATION_EXPIRED),	"DELEGATION_EXPIRED" }, \</div><div class='add'>+	{ BIT(NFS4CLNT_RUN_MANAGER),		"RUN_MANAGER" }, \</div><div class='add'>+	{ BIT(NFS4CLNT_MANAGER_AVAILABLE), "MANAGER_AVAILABLE" }, \</div><div class='add'>+	{ BIT(NFS4CLNT_RECALL_RUNNING),	"RECALL_RUNNING" }, \</div><div class='add'>+	{ BIT(NFS4CLNT_RECALL_ANY_LAYOUT_READ), "RECALL_ANY_LAYOUT_READ" }, \</div><div class='add'>+	{ BIT(NFS4CLNT_RECALL_ANY_LAYOUT_RW), "RECALL_ANY_LAYOUT_RW" }, \</div><div class='add'>+	{ BIT(NFS4CLNT_DELEGRETURN_DELAYED), "DELERETURN_DELAYED" })</div><div class='ctx'> </div><div class='ctx'> TRACE_EVENT(nfs4_state_mgr,</div><div class='ctx'> 		TP_PROTO(</div><div class='hunk'>@@ -333,7 +394,7 @@ TRACE_EVENT(nfs4_state_mgr,</div><div class='ctx'> </div><div class='ctx'> 		TP_fast_assign(</div><div class='ctx'> 			__entry-&gt;state = clp-&gt;cl_state;</div><div class='del'>-			__assign_str(hostname, clp-&gt;cl_hostname);</div><div class='add'>+			__assign_str(hostname);</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='hunk'>@@ -361,8 +422,8 @@ TRACE_EVENT(nfs4_state_mgr_failed,</div><div class='ctx'> 		TP_fast_assign(</div><div class='ctx'> 			__entry-&gt;error = status &lt; 0 ? -status : 0;</div><div class='ctx'> 			__entry-&gt;state = clp-&gt;cl_state;</div><div class='del'>-			__assign_str(hostname, clp-&gt;cl_hostname);</div><div class='del'>-			__assign_str(section, section);</div><div class='add'>+			__assign_str(hostname);</div><div class='add'>+			__assign_str(section);</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='hunk'>@@ -546,7 +607,7 @@ DECLARE_EVENT_CLASS(nfs4_open_event,</div><div class='ctx'> 				__entry-&gt;fhandle = 0;</div><div class='ctx'> 			}</div><div class='ctx'> 			__entry-&gt;dir = NFS_FILEID(d_inode(ctx-&gt;dentry-&gt;d_parent));</div><div class='del'>-			__assign_str(name, ctx-&gt;dentry-&gt;d_name.name);</div><div class='add'>+			__assign_str(name);</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='hunk'>@@ -697,7 +758,7 @@ DECLARE_EVENT_CLASS(nfs4_lock_event,</div><div class='ctx'> </div><div class='ctx'> 			__entry-&gt;error = error &lt; 0 ? -error : 0;</div><div class='ctx'> 			__entry-&gt;cmd = cmd;</div><div class='del'>-			__entry-&gt;type = request-&gt;fl_type;</div><div class='add'>+			__entry-&gt;type = request-&gt;c.flc_type;</div><div class='ctx'> 			__entry-&gt;start = request-&gt;fl_start;</div><div class='ctx'> 			__entry-&gt;end = request-&gt;fl_end;</div><div class='ctx'> 			__entry-&gt;dev = inode-&gt;i_sb-&gt;s_dev;</div><div class='hunk'>@@ -769,7 +830,7 @@ TRACE_EVENT(nfs4_set_lock,</div><div class='ctx'> </div><div class='ctx'> 			__entry-&gt;error = error &lt; 0 ? -error : 0;</div><div class='ctx'> 			__entry-&gt;cmd = cmd;</div><div class='del'>-			__entry-&gt;type = request-&gt;fl_type;</div><div class='add'>+			__entry-&gt;type = request-&gt;c.flc_type;</div><div class='ctx'> 			__entry-&gt;start = request-&gt;fl_start;</div><div class='ctx'> 			__entry-&gt;end = request-&gt;fl_end;</div><div class='ctx'> 			__entry-&gt;dev = inode-&gt;i_sb-&gt;s_dev;</div><div class='hunk'>@@ -924,6 +985,52 @@ DECLARE_EVENT_CLASS(nfs4_set_delegation_event,</div><div class='ctx'> 			TP_ARGS(inode, fmode))</div><div class='ctx'> DEFINE_NFS4_SET_DELEGATION_EVENT(nfs4_set_delegation);</div><div class='ctx'> DEFINE_NFS4_SET_DELEGATION_EVENT(nfs4_reclaim_delegation);</div><div class='add'>+DEFINE_NFS4_SET_DELEGATION_EVENT(nfs4_detach_delegation);</div><div class='add'>+</div><div class='add'>+#define show_delegation_flags(flags) \</div><div class='add'>+	__print_flags(flags, "|", \</div><div class='add'>+		{ BIT(NFS_DELEGATION_NEED_RECLAIM), "NEED_RECLAIM" }, \</div><div class='add'>+		{ BIT(NFS_DELEGATION_RETURN), "RETURN" }, \</div><div class='add'>+		{ BIT(NFS_DELEGATION_RETURN_IF_CLOSED), "RETURN_IF_CLOSED" }, \</div><div class='add'>+		{ BIT(NFS_DELEGATION_REFERENCED), "REFERENCED" }, \</div><div class='add'>+		{ BIT(NFS_DELEGATION_RETURNING), "RETURNING" }, \</div><div class='add'>+		{ BIT(NFS_DELEGATION_REVOKED), "REVOKED" }, \</div><div class='add'>+		{ BIT(NFS_DELEGATION_TEST_EXPIRED), "TEST_EXPIRED" }, \</div><div class='add'>+		{ BIT(NFS_DELEGATION_INODE_FREEING), "INODE_FREEING" }, \</div><div class='add'>+		{ BIT(NFS_DELEGATION_RETURN_DELAYED), "RETURN_DELAYED" })</div><div class='add'>+</div><div class='add'>+DECLARE_EVENT_CLASS(nfs4_delegation_event,</div><div class='add'>+		TP_PROTO(</div><div class='add'>+			const struct nfs_delegation *delegation</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_ARGS(delegation),</div><div class='add'>+</div><div class='add'>+		TP_STRUCT__entry(</div><div class='add'>+			__field(u32, fhandle)</div><div class='add'>+			__field(unsigned int, fmode)</div><div class='add'>+			__field(unsigned long, flags)</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_fast_assign(</div><div class='add'>+			__entry-&gt;fhandle = nfs_fhandle_hash(NFS_FH(delegation-&gt;inode));</div><div class='add'>+			__entry-&gt;fmode = delegation-&gt;type;</div><div class='add'>+			__entry-&gt;flags = delegation-&gt;flags;</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_printk(</div><div class='add'>+			"fhandle=0x%08x fmode=%s flags=%s",</div><div class='add'>+			__entry-&gt;fhandle, show_fs_fmode_flags(__entry-&gt;fmode),</div><div class='add'>+			show_delegation_flags(__entry-&gt;flags)</div><div class='add'>+		)</div><div class='add'>+);</div><div class='add'>+#define DEFINE_NFS4_DELEGATION_EVENT(name) \</div><div class='add'>+	DEFINE_EVENT(nfs4_delegation_event, name, \</div><div class='add'>+			TP_PROTO( \</div><div class='add'>+				const struct nfs_delegation *delegation \</div><div class='add'>+			), \</div><div class='add'>+			TP_ARGS(delegation))</div><div class='add'>+DEFINE_NFS4_DELEGATION_EVENT(nfs_delegation_need_return);</div><div class='ctx'> </div><div class='ctx'> TRACE_EVENT(nfs4_delegreturn_exit,</div><div class='ctx'> 		TP_PROTO(</div><div class='hunk'>@@ -1040,7 +1147,7 @@ DECLARE_EVENT_CLASS(nfs4_lookup_event,</div><div class='ctx'> 			__entry-&gt;dev = dir-&gt;i_sb-&gt;s_dev;</div><div class='ctx'> 			__entry-&gt;dir = NFS_FILEID(dir);</div><div class='ctx'> 			__entry-&gt;error = -error;</div><div class='del'>-			__assign_str(name, name-&gt;name);</div><div class='add'>+			__assign_str(name);</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='hunk'>@@ -1124,8 +1231,8 @@ TRACE_EVENT(nfs4_rename,</div><div class='ctx'> 			__entry-&gt;olddir = NFS_FILEID(olddir);</div><div class='ctx'> 			__entry-&gt;newdir = NFS_FILEID(newdir);</div><div class='ctx'> 			__entry-&gt;error = error &lt; 0 ? -error : 0;</div><div class='del'>-			__assign_str(oldname, oldname-&gt;name);</div><div class='del'>-			__assign_str(newname, newname-&gt;name);</div><div class='add'>+			__assign_str(oldname);</div><div class='add'>+			__assign_str(newname);</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='hunk'>@@ -1327,7 +1434,7 @@ DECLARE_EVENT_CLASS(nfs4_inode_callback_event,</div><div class='ctx'> 				__entry-&gt;fileid = 0;</div><div class='ctx'> 				__entry-&gt;dev = 0;</div><div class='ctx'> 			}</div><div class='del'>-			__assign_str(dstaddr, clp ? clp-&gt;cl_hostname : "unknown");</div><div class='add'>+			__assign_str(dstaddr);</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='hunk'>@@ -1384,7 +1491,7 @@ DECLARE_EVENT_CLASS(nfs4_inode_stateid_callback_event,</div><div class='ctx'> 				__entry-&gt;fileid = 0;</div><div class='ctx'> 				__entry-&gt;dev = 0;</div><div class='ctx'> 			}</div><div class='del'>-			__assign_str(dstaddr, clp ? clp-&gt;cl_hostname : "unknown");</div><div class='add'>+			__assign_str(dstaddr);</div><div class='ctx'> 			__entry-&gt;stateid_seq =</div><div class='ctx'> 				be32_to_cpu(stateid-&gt;seqid);</div><div class='ctx'> 			__entry-&gt;stateid_hash =</div><div class='hunk'>@@ -1417,6 +1524,63 @@ DECLARE_EVENT_CLASS(nfs4_inode_stateid_callback_event,</div><div class='ctx'> DEFINE_NFS4_INODE_STATEID_CALLBACK_EVENT(nfs4_cb_recall);</div><div class='ctx'> DEFINE_NFS4_INODE_STATEID_CALLBACK_EVENT(nfs4_cb_layoutrecall_file);</div><div class='ctx'> </div><div class='add'>+#define show_stateid_type(type) \</div><div class='add'>+	__print_symbolic(type, \</div><div class='add'>+		{ NFS4_INVALID_STATEID_TYPE,	"INVALID" }, \</div><div class='add'>+		{ NFS4_SPECIAL_STATEID_TYPE,	"SPECIAL" }, \</div><div class='add'>+		{ NFS4_OPEN_STATEID_TYPE,	"OPEN" }, \</div><div class='add'>+		{ NFS4_LOCK_STATEID_TYPE,	"LOCK" }, \</div><div class='add'>+		{ NFS4_DELEGATION_STATEID_TYPE,	"DELEGATION" }, \</div><div class='add'>+		{ NFS4_LAYOUT_STATEID_TYPE,	"LAYOUT" },	\</div><div class='add'>+		{ NFS4_PNFS_DS_STATEID_TYPE,	"PNFS_DS" }, \</div><div class='add'>+		{ NFS4_REVOKED_STATEID_TYPE,	"REVOKED" }, \</div><div class='add'>+		{ NFS4_FREED_STATEID_TYPE,	"FREED" })</div><div class='add'>+</div><div class='add'>+DECLARE_EVENT_CLASS(nfs4_match_stateid_event,</div><div class='add'>+		TP_PROTO(</div><div class='add'>+			const nfs4_stateid *s1,</div><div class='add'>+			const nfs4_stateid *s2</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_ARGS(s1, s2),</div><div class='add'>+</div><div class='add'>+		TP_STRUCT__entry(</div><div class='add'>+			__field(int, s1_seq)</div><div class='add'>+			__field(int, s2_seq)</div><div class='add'>+			__field(u32, s1_hash)</div><div class='add'>+			__field(u32, s2_hash)</div><div class='add'>+			__field(int, s1_type)</div><div class='add'>+			__field(int, s2_type)</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_fast_assign(</div><div class='add'>+			__entry-&gt;s1_seq = s1-&gt;seqid;</div><div class='add'>+			__entry-&gt;s1_hash = nfs_stateid_hash(s1);</div><div class='add'>+			__entry-&gt;s1_type = s1-&gt;type;</div><div class='add'>+			__entry-&gt;s2_seq = s2-&gt;seqid;</div><div class='add'>+			__entry-&gt;s2_hash = nfs_stateid_hash(s2);</div><div class='add'>+			__entry-&gt;s2_type = s2-&gt;type;</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_printk(</div><div class='add'>+			"s1=%s:%x:%u s2=%s:%x:%u",</div><div class='add'>+			show_stateid_type(__entry-&gt;s1_type),</div><div class='add'>+			__entry-&gt;s1_hash, __entry-&gt;s1_seq,</div><div class='add'>+			show_stateid_type(__entry-&gt;s2_type),</div><div class='add'>+			__entry-&gt;s2_hash, __entry-&gt;s2_seq</div><div class='add'>+		)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+#define DEFINE_NFS4_MATCH_STATEID_EVENT(name) \</div><div class='add'>+	DEFINE_EVENT(nfs4_match_stateid_event, name, \</div><div class='add'>+			TP_PROTO( \</div><div class='add'>+				const nfs4_stateid *s1, \</div><div class='add'>+				const nfs4_stateid *s2 \</div><div class='add'>+			), \</div><div class='add'>+			TP_ARGS(s1, s2))</div><div class='add'>+DEFINE_NFS4_MATCH_STATEID_EVENT(nfs41_match_stateid);</div><div class='add'>+DEFINE_NFS4_MATCH_STATEID_EVENT(nfs4_match_stateid);</div><div class='add'>+</div><div class='ctx'> DECLARE_EVENT_CLASS(nfs4_idmap_event,</div><div class='ctx'> 		TP_PROTO(</div><div class='ctx'> 			const char *name,</div><div class='hunk'>@@ -1815,7 +1979,7 @@ TRACE_EVENT(pnfs_update_layout,</div><div class='ctx'> 			__entry-&gt;count = count;</div><div class='ctx'> 			__entry-&gt;iomode = iomode;</div><div class='ctx'> 			__entry-&gt;reason = reason;</div><div class='del'>-			if (lo != NULL) {</div><div class='add'>+			if (lo != NULL &amp;&amp; pnfs_layout_is_valid(lo)) {</div><div class='ctx'> 				__entry-&gt;layoutstateid_seq =</div><div class='ctx'> 				be32_to_cpu(lo-&gt;plh_stateid.seqid);</div><div class='ctx'> 				__entry-&gt;layoutstateid_hash =</div><div class='hunk'>@@ -1869,7 +2033,7 @@ DECLARE_EVENT_CLASS(pnfs_layout_event,</div><div class='ctx'> 			__entry-&gt;pos = pos;</div><div class='ctx'> 			__entry-&gt;count = count;</div><div class='ctx'> 			__entry-&gt;iomode = iomode;</div><div class='del'>-			if (lo != NULL) {</div><div class='add'>+			if (lo != NULL &amp;&amp; pnfs_layout_is_valid(lo)) {</div><div class='ctx'> 				__entry-&gt;layoutstateid_seq =</div><div class='ctx'> 				be32_to_cpu(lo-&gt;plh_stateid.seqid);</div><div class='ctx'> 				__entry-&gt;layoutstateid_hash =</div><div class='hunk'>@@ -1928,7 +2092,7 @@ DECLARE_EVENT_CLASS(nfs4_deviceid_event,</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_fast_assign(</div><div class='del'>-			__assign_str(dstaddr, clp-&gt;cl_hostname);</div><div class='add'>+			__assign_str(dstaddr);</div><div class='ctx'> 			memcpy(__entry-&gt;deviceid, deviceid-&gt;data,</div><div class='ctx'> 			       NFS4_DEVICEID4_SIZE);</div><div class='ctx'> 		),</div><div class='hunk'>@@ -1966,7 +2130,7 @@ DECLARE_EVENT_CLASS(nfs4_deviceid_status,</div><div class='ctx'> 		TP_fast_assign(</div><div class='ctx'> 			__entry-&gt;dev = server-&gt;s_dev;</div><div class='ctx'> 			__entry-&gt;status = status;</div><div class='del'>-			__assign_str(dstaddr, server-&gt;nfs_client-&gt;cl_hostname);</div><div class='add'>+			__assign_str(dstaddr);</div><div class='ctx'> 			memcpy(__entry-&gt;deviceid, deviceid-&gt;data,</div><div class='ctx'> 			       NFS4_DEVICEID4_SIZE);</div><div class='ctx'> 		),</div><div class='hunk'>@@ -1989,15 +2153,45 @@ DECLARE_EVENT_CLASS(nfs4_deviceid_status,</div><div class='ctx'> DEFINE_PNFS_DEVICEID_STATUS(nfs4_getdeviceinfo);</div><div class='ctx'> DEFINE_PNFS_DEVICEID_STATUS(nfs4_find_deviceid);</div><div class='ctx'> </div><div class='add'>+TRACE_EVENT(fl_getdevinfo,</div><div class='add'>+		TP_PROTO(</div><div class='add'>+			const struct nfs_server *server,</div><div class='add'>+			const struct nfs4_deviceid *deviceid,</div><div class='add'>+			char *ds_remotestr</div><div class='add'>+		),</div><div class='add'>+		TP_ARGS(server, deviceid, ds_remotestr),</div><div class='add'>+</div><div class='add'>+		TP_STRUCT__entry(</div><div class='add'>+			__string(mds_addr, server-&gt;nfs_client-&gt;cl_hostname)</div><div class='add'>+			__array(unsigned char, deviceid, NFS4_DEVICEID4_SIZE)</div><div class='add'>+			__string(ds_ips, ds_remotestr)</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_fast_assign(</div><div class='add'>+			__assign_str(mds_addr);</div><div class='add'>+			__assign_str(ds_ips);</div><div class='add'>+			memcpy(__entry-&gt;deviceid, deviceid-&gt;data,</div><div class='add'>+			       NFS4_DEVICEID4_SIZE);</div><div class='add'>+		),</div><div class='add'>+		TP_printk(</div><div class='add'>+			"deviceid=%s, mds_addr=%s, ds_ips=%s",</div><div class='add'>+			__print_hex(__entry-&gt;deviceid, NFS4_DEVICEID4_SIZE),</div><div class='add'>+			__get_str(mds_addr),</div><div class='add'>+			__get_str(ds_ips)</div><div class='add'>+		)</div><div class='add'>+);</div><div class='add'>+</div><div class='ctx'> DECLARE_EVENT_CLASS(nfs4_flexfiles_io_event,</div><div class='ctx'> 		TP_PROTO(</div><div class='del'>-			const struct nfs_pgio_header *hdr</div><div class='add'>+			const struct nfs_pgio_header *hdr,</div><div class='add'>+			int error</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='del'>-		TP_ARGS(hdr),</div><div class='add'>+		TP_ARGS(hdr, error),</div><div class='ctx'> </div><div class='ctx'> 		TP_STRUCT__entry(</div><div class='ctx'> 			__field(unsigned long, error)</div><div class='add'>+			__field(unsigned long, nfs_error)</div><div class='ctx'> 			__field(dev_t, dev)</div><div class='ctx'> 			__field(u32, fhandle)</div><div class='ctx'> 			__field(u64, fileid)</div><div class='hunk'>@@ -2013,7 +2207,8 @@ DECLARE_EVENT_CLASS(nfs4_flexfiles_io_event,</div><div class='ctx'> 		TP_fast_assign(</div><div class='ctx'> 			const struct inode *inode = hdr-&gt;inode;</div><div class='ctx'> </div><div class='del'>-			__entry-&gt;error = hdr-&gt;res.op_status;</div><div class='add'>+			__entry-&gt;error = -error;</div><div class='add'>+			__entry-&gt;nfs_error = hdr-&gt;res.op_status;</div><div class='ctx'> 			__entry-&gt;fhandle = nfs_fhandle_hash(hdr-&gt;args.fh);</div><div class='ctx'> 			__entry-&gt;fileid = NFS_FILEID(inode);</div><div class='ctx'> 			__entry-&gt;dev = inode-&gt;i_sb-&gt;s_dev;</div><div class='hunk'>@@ -2023,14 +2218,13 @@ DECLARE_EVENT_CLASS(nfs4_flexfiles_io_event,</div><div class='ctx'> 				be32_to_cpu(hdr-&gt;args.stateid.seqid);</div><div class='ctx'> 			__entry-&gt;stateid_hash =</div><div class='ctx'> 				nfs_stateid_hash(&amp;hdr-&gt;args.stateid);</div><div class='del'>-			__assign_str(dstaddr, hdr-&gt;ds_clp ?</div><div class='del'>-				rpc_peeraddr2str(hdr-&gt;ds_clp-&gt;cl_rpcclient,</div><div class='del'>-					RPC_DISPLAY_ADDR) : "unknown");</div><div class='add'>+			__assign_str(dstaddr);</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='ctx'> 			"error=%ld (%s) fileid=%02x:%02x:%llu fhandle=0x%08x "</div><div class='del'>-			"offset=%llu count=%u stateid=%d:0x%08x dstaddr=%s",</div><div class='add'>+			"offset=%llu count=%u stateid=%d:0x%08x dstaddr=%s "</div><div class='add'>+			"nfs_error=%lu (%s)",</div><div class='ctx'> 			-__entry-&gt;error,</div><div class='ctx'> 			show_nfs4_status(__entry-&gt;error),</div><div class='ctx'> 			MAJOR(__entry-&gt;dev), MINOR(__entry-&gt;dev),</div><div class='hunk'>@@ -2038,28 +2232,32 @@ DECLARE_EVENT_CLASS(nfs4_flexfiles_io_event,</div><div class='ctx'> 			__entry-&gt;fhandle,</div><div class='ctx'> 			__entry-&gt;offset, __entry-&gt;count,</div><div class='ctx'> 			__entry-&gt;stateid_seq, __entry-&gt;stateid_hash,</div><div class='del'>-			__get_str(dstaddr)</div><div class='add'>+			__get_str(dstaddr), __entry-&gt;nfs_error,</div><div class='add'>+			show_nfs4_status(__entry-&gt;nfs_error)</div><div class='ctx'> 		)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='ctx'> #define DEFINE_NFS4_FLEXFILES_IO_EVENT(name) \</div><div class='ctx'> 	DEFINE_EVENT(nfs4_flexfiles_io_event, name, \</div><div class='ctx'> 			TP_PROTO( \</div><div class='del'>-				const struct nfs_pgio_header *hdr \</div><div class='add'>+				const struct nfs_pgio_header *hdr, \</div><div class='add'>+				int error \</div><div class='ctx'> 			), \</div><div class='del'>-			TP_ARGS(hdr))</div><div class='add'>+			TP_ARGS(hdr, error))</div><div class='ctx'> DEFINE_NFS4_FLEXFILES_IO_EVENT(ff_layout_read_error);</div><div class='ctx'> DEFINE_NFS4_FLEXFILES_IO_EVENT(ff_layout_write_error);</div><div class='ctx'> </div><div class='ctx'> TRACE_EVENT(ff_layout_commit_error,</div><div class='ctx'> 		TP_PROTO(</div><div class='del'>-			const struct nfs_commit_data *data</div><div class='add'>+			const struct nfs_commit_data *data,</div><div class='add'>+			int error</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='del'>-		TP_ARGS(data),</div><div class='add'>+		TP_ARGS(data, error),</div><div class='ctx'> </div><div class='ctx'> 		TP_STRUCT__entry(</div><div class='ctx'> 			__field(unsigned long, error)</div><div class='add'>+			__field(unsigned long, nfs_error)</div><div class='ctx'> 			__field(dev_t, dev)</div><div class='ctx'> 			__field(u32, fhandle)</div><div class='ctx'> 			__field(u64, fileid)</div><div class='hunk'>@@ -2073,30 +2271,153 @@ TRACE_EVENT(ff_layout_commit_error,</div><div class='ctx'> 		TP_fast_assign(</div><div class='ctx'> 			const struct inode *inode = data-&gt;inode;</div><div class='ctx'> </div><div class='del'>-			__entry-&gt;error = data-&gt;res.op_status;</div><div class='add'>+			__entry-&gt;error = -error;</div><div class='add'>+			__entry-&gt;nfs_error = data-&gt;res.op_status;</div><div class='ctx'> 			__entry-&gt;fhandle = nfs_fhandle_hash(data-&gt;args.fh);</div><div class='ctx'> 			__entry-&gt;fileid = NFS_FILEID(inode);</div><div class='ctx'> 			__entry-&gt;dev = inode-&gt;i_sb-&gt;s_dev;</div><div class='ctx'> 			__entry-&gt;offset = data-&gt;args.offset;</div><div class='ctx'> 			__entry-&gt;count = data-&gt;args.count;</div><div class='del'>-			__assign_str(dstaddr, data-&gt;ds_clp ?</div><div class='del'>-				rpc_peeraddr2str(data-&gt;ds_clp-&gt;cl_rpcclient,</div><div class='del'>-					RPC_DISPLAY_ADDR) : "unknown");</div><div class='add'>+			__assign_str(dstaddr);</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='ctx'> 			"error=%ld (%s) fileid=%02x:%02x:%llu fhandle=0x%08x "</div><div class='del'>-			"offset=%llu count=%u dstaddr=%s",</div><div class='add'>+			"offset=%llu count=%u dstaddr=%s nfs_error=%lu (%s)",</div><div class='ctx'> 			-__entry-&gt;error,</div><div class='ctx'> 			show_nfs4_status(__entry-&gt;error),</div><div class='ctx'> 			MAJOR(__entry-&gt;dev), MINOR(__entry-&gt;dev),</div><div class='ctx'> 			(unsigned long long)__entry-&gt;fileid,</div><div class='ctx'> 			__entry-&gt;fhandle,</div><div class='ctx'> 			__entry-&gt;offset, __entry-&gt;count,</div><div class='del'>-			__get_str(dstaddr)</div><div class='add'>+			__get_str(dstaddr), __entry-&gt;nfs_error,</div><div class='add'>+			show_nfs4_status(__entry-&gt;nfs_error)</div><div class='add'>+		)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+TRACE_EVENT(bl_ext_tree_prepare_commit,</div><div class='add'>+		TP_PROTO(</div><div class='add'>+			int ret,</div><div class='add'>+			size_t count,</div><div class='add'>+			u64 lwb,</div><div class='add'>+			bool not_all_ranges</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_ARGS(ret, count, lwb, not_all_ranges),</div><div class='add'>+</div><div class='add'>+		TP_STRUCT__entry(</div><div class='add'>+			__field(int, ret)</div><div class='add'>+			__field(size_t, count)</div><div class='add'>+			__field(u64, lwb)</div><div class='add'>+			__field(bool, not_all_ranges)</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_fast_assign(</div><div class='add'>+			__entry-&gt;ret = ret;</div><div class='add'>+			__entry-&gt;count = count;</div><div class='add'>+			__entry-&gt;lwb = lwb;</div><div class='add'>+			__entry-&gt;not_all_ranges = not_all_ranges;</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_printk(</div><div class='add'>+			"ret=%d, found %zu ranges, lwb=%llu%s",</div><div class='add'>+			__entry-&gt;ret,</div><div class='add'>+			__entry-&gt;count,</div><div class='add'>+			__entry-&gt;lwb,</div><div class='add'>+			__entry-&gt;not_all_ranges ? ", not all ranges encoded" :</div><div class='add'>+						  ""</div><div class='ctx'> 		)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='add'>+DECLARE_EVENT_CLASS(pnfs_bl_pr_key_class,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct block_device *bdev,</div><div class='add'>+		u64 key</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(bdev, key),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(u64, key)</div><div class='add'>+		__field(dev_t, dev)</div><div class='add'>+		__string(device, bdev-&gt;bd_disk-&gt;disk_name)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;key = key;</div><div class='add'>+		__entry-&gt;dev = bdev-&gt;bd_dev;</div><div class='add'>+		__assign_str(device);</div><div class='add'>+	),</div><div class='add'>+	TP_printk("dev=%d,%d (%s) key=0x%016llx",</div><div class='add'>+		MAJOR(__entry-&gt;dev), MINOR(__entry-&gt;dev),</div><div class='add'>+		__get_str(device), __entry-&gt;key</div><div class='add'>+	)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+#define DEFINE_NFS4_BLOCK_PRKEY_EVENT(name) \</div><div class='add'>+	DEFINE_EVENT(pnfs_bl_pr_key_class, name, \</div><div class='add'>+		TP_PROTO( \</div><div class='add'>+			const struct block_device *bdev, \</div><div class='add'>+			u64 key \</div><div class='add'>+		), \</div><div class='add'>+		TP_ARGS(bdev, key))</div><div class='add'>+DEFINE_NFS4_BLOCK_PRKEY_EVENT(bl_pr_key_reg);</div><div class='add'>+DEFINE_NFS4_BLOCK_PRKEY_EVENT(bl_pr_key_unreg);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * From uapi/linux/pr.h</div><div class='add'>+ */</div><div class='add'>+TRACE_DEFINE_ENUM(PR_STS_SUCCESS);</div><div class='add'>+TRACE_DEFINE_ENUM(PR_STS_IOERR);</div><div class='add'>+TRACE_DEFINE_ENUM(PR_STS_RESERVATION_CONFLICT);</div><div class='add'>+TRACE_DEFINE_ENUM(PR_STS_RETRY_PATH_FAILURE);</div><div class='add'>+TRACE_DEFINE_ENUM(PR_STS_PATH_FAST_FAILED);</div><div class='add'>+TRACE_DEFINE_ENUM(PR_STS_PATH_FAILED);</div><div class='add'>+</div><div class='add'>+#define show_pr_status(x) \</div><div class='add'>+	__print_symbolic(x, \</div><div class='add'>+		{ PR_STS_SUCCESS,		"SUCCESS" }, \</div><div class='add'>+		{ PR_STS_IOERR,			"IOERR" }, \</div><div class='add'>+		{ PR_STS_RESERVATION_CONFLICT,	"RESERVATION_CONFLICT" }, \</div><div class='add'>+		{ PR_STS_RETRY_PATH_FAILURE,	"RETRY_PATH_FAILURE" }, \</div><div class='add'>+		{ PR_STS_PATH_FAST_FAILED,	"PATH_FAST_FAILED" }, \</div><div class='add'>+		{ PR_STS_PATH_FAILED,		"PATH_FAILED" })</div><div class='add'>+</div><div class='add'>+DECLARE_EVENT_CLASS(pnfs_bl_pr_key_err_class,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct block_device *bdev,</div><div class='add'>+		u64 key,</div><div class='add'>+		int status</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(bdev, key, status),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(u64, key)</div><div class='add'>+		__field(dev_t, dev)</div><div class='add'>+		__field(unsigned long, status)</div><div class='add'>+		__string(device, bdev-&gt;bd_disk-&gt;disk_name)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;key = key;</div><div class='add'>+		__entry-&gt;dev = bdev-&gt;bd_dev;</div><div class='add'>+		__entry-&gt;status = status;</div><div class='add'>+		__assign_str(device);</div><div class='add'>+	),</div><div class='add'>+	TP_printk("dev=%d,%d (%s) key=0x%016llx status=%s",</div><div class='add'>+		MAJOR(__entry-&gt;dev), MINOR(__entry-&gt;dev),</div><div class='add'>+		__get_str(device), __entry-&gt;key,</div><div class='add'>+		show_pr_status(__entry-&gt;status)</div><div class='add'>+	)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+#define DEFINE_NFS4_BLOCK_PRKEY_ERR_EVENT(name) \</div><div class='add'>+	DEFINE_EVENT(pnfs_bl_pr_key_err_class, name, \</div><div class='add'>+		TP_PROTO( \</div><div class='add'>+			const struct block_device *bdev, \</div><div class='add'>+			u64 key, \</div><div class='add'>+			int status \</div><div class='add'>+		), \</div><div class='add'>+		TP_ARGS(bdev, key, status))</div><div class='add'>+DEFINE_NFS4_BLOCK_PRKEY_ERR_EVENT(bl_pr_key_reg_err);</div><div class='add'>+DEFINE_NFS4_BLOCK_PRKEY_ERR_EVENT(bl_pr_key_unreg_err);</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_NFS_V4_2</div><div class='ctx'> TRACE_DEFINE_ENUM(NFS4_CONTENT_DATA);</div><div class='ctx'> TRACE_DEFINE_ENUM(NFS4_CONTENT_HOLE);</div><div class='ctx'> </div><div class='hunk'>@@ -2105,7 +2426,6 @@ TRACE_DEFINE_ENUM(NFS4_CONTENT_HOLE);</div><div class='ctx'> 		{ NFS4_CONTENT_DATA, "DATA" },		\</div><div class='ctx'> 		{ NFS4_CONTENT_HOLE, "HOLE" })</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_NFS_V4_2</div><div class='ctx'> TRACE_EVENT(nfs4_llseek,</div><div class='ctx'> 		TP_PROTO(</div><div class='ctx'> 			const struct inode *inode,</div><div class='hunk'>@@ -2464,7 +2784,7 @@ TRACE_EVENT(nfs4_copy_notify,</div><div class='ctx'> 		)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='del'>-TRACE_EVENT(nfs4_offload_cancel,</div><div class='add'>+DECLARE_EVENT_CLASS(nfs4_offload_class,</div><div class='ctx'> 		TP_PROTO(</div><div class='ctx'> 			const struct nfs42_offload_status_args *args,</div><div class='ctx'> 			int error</div><div class='hunk'>@@ -2496,6 +2816,63 @@ TRACE_EVENT(nfs4_offload_cancel,</div><div class='ctx'> 			__entry-&gt;stateid_seq, __entry-&gt;stateid_hash</div><div class='ctx'> 		)</div><div class='ctx'> );</div><div class='add'>+#define DEFINE_NFS4_OFFLOAD_EVENT(name) \</div><div class='add'>+	DEFINE_EVENT(nfs4_offload_class, name,  \</div><div class='add'>+			TP_PROTO( \</div><div class='add'>+				const struct nfs42_offload_status_args *args, \</div><div class='add'>+				int error \</div><div class='add'>+			), \</div><div class='add'>+			TP_ARGS(args, error))</div><div class='add'>+DEFINE_NFS4_OFFLOAD_EVENT(nfs4_offload_cancel);</div><div class='add'>+DEFINE_NFS4_OFFLOAD_EVENT(nfs4_offload_status);</div><div class='add'>+</div><div class='add'>+DECLARE_EVENT_CLASS(nfs4_xattr_event,</div><div class='add'>+		TP_PROTO(</div><div class='add'>+			const struct inode *inode,</div><div class='add'>+			const char *name,</div><div class='add'>+			int error</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_ARGS(inode, name, error),</div><div class='add'>+</div><div class='add'>+		TP_STRUCT__entry(</div><div class='add'>+			__field(unsigned long, error)</div><div class='add'>+			__field(dev_t, dev)</div><div class='add'>+			__field(u32, fhandle)</div><div class='add'>+			__field(u64, fileid)</div><div class='add'>+			__string(name, name)</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_fast_assign(</div><div class='add'>+			__entry-&gt;error = error &lt; 0 ? -error : 0;</div><div class='add'>+			__entry-&gt;dev = inode-&gt;i_sb-&gt;s_dev;</div><div class='add'>+			__entry-&gt;fileid = NFS_FILEID(inode);</div><div class='add'>+			__entry-&gt;fhandle = nfs_fhandle_hash(NFS_FH(inode));</div><div class='add'>+			__assign_str(name);</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_printk(</div><div class='add'>+			"error=%ld (%s) fileid=%02x:%02x:%llu fhandle=0x%08x "</div><div class='add'>+			"name=%s",</div><div class='add'>+			-__entry-&gt;error, show_nfs4_status(__entry-&gt;error),</div><div class='add'>+			MAJOR(__entry-&gt;dev), MINOR(__entry-&gt;dev),</div><div class='add'>+			(unsigned long long)__entry-&gt;fileid,</div><div class='add'>+			__entry-&gt;fhandle, __get_str(name)</div><div class='add'>+		)</div><div class='add'>+);</div><div class='add'>+#define DEFINE_NFS4_XATTR_EVENT(name) \</div><div class='add'>+	DEFINE_EVENT(nfs4_xattr_event, name,  \</div><div class='add'>+			TP_PROTO( \</div><div class='add'>+				const struct inode *inode, \</div><div class='add'>+				const char *name, \</div><div class='add'>+				int error \</div><div class='add'>+			), \</div><div class='add'>+			TP_ARGS(inode, name, error))</div><div class='add'>+DEFINE_NFS4_XATTR_EVENT(nfs4_getxattr);</div><div class='add'>+DEFINE_NFS4_XATTR_EVENT(nfs4_setxattr);</div><div class='add'>+DEFINE_NFS4_XATTR_EVENT(nfs4_removexattr);</div><div class='add'>+</div><div class='add'>+DEFINE_NFS4_INODE_EVENT(nfs4_listxattr);</div><div class='ctx'> #endif /* CONFIG_NFS_V4_2 */</div><div class='ctx'> </div><div class='ctx'> #endif /* CONFIG_NFS_V4_1 */</div><div class='head'>diff --git a/fs/nfs/nfs4xdr.c b/fs/nfs/nfs4xdr.c<br/>index 69862bf6db00..1d0e6c10f921 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4xdr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfs4xdr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfs4xdr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfs4xdr.c</a></div><div class='hunk'>@@ -52,6 +52,7 @@</div><div class='ctx'> #include &lt;linux/nfs.h&gt;</div><div class='ctx'> #include &lt;linux/nfs4.h&gt;</div><div class='ctx'> #include &lt;linux/nfs_fs.h&gt;</div><div class='add'>+#include &lt;linux/nfs_common.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "nfs4_fs.h"</div><div class='ctx'> #include "nfs4trace.h"</div><div class='hunk'>@@ -63,11 +64,7 @@</div><div class='ctx'> </div><div class='ctx'> #define NFSDBG_FACILITY		NFSDBG_XDR</div><div class='ctx'> </div><div class='del'>-/* Mapping from NFS error code to "errno" error code. */</div><div class='del'>-#define errno_NFSERR_IO		EIO</div><div class='del'>-</div><div class='ctx'> struct compound_hdr;</div><div class='del'>-static int nfs4_stat_to_errno(int);</div><div class='ctx'> static void encode_layoutget(struct xdr_stream *xdr,</div><div class='ctx'> 			     const struct nfs4_layoutget_args *args,</div><div class='ctx'> 			     struct compound_hdr *hdr);</div><div class='hunk'>@@ -85,9 +82,8 @@ static int decode_layoutget(struct xdr_stream *xdr, struct rpc_rqst *req,</div><div class='ctx'>  * we currently use size 2 (u64) out of (NFS4_OPAQUE_LIMIT  &gt;&gt; 2)</div><div class='ctx'>  */</div><div class='ctx'> #define pagepad_maxsz		(1)</div><div class='del'>-#define open_owner_id_maxsz	(1 + 2 + 1 + 1 + 2)</div><div class='del'>-#define lock_owner_id_maxsz	(1 + 1 + 4)</div><div class='del'>-#define decode_lockowner_maxsz	(1 + XDR_QUADLEN(IDMAP_NAMESZ))</div><div class='add'>+#define open_owner_id_maxsz	(2 + 1 + 2 + 2)</div><div class='add'>+#define lock_owner_id_maxsz	(2 + 1 + 2)</div><div class='ctx'> #define compound_encode_hdr_maxsz	(3 + (NFS4_MAXTAGLEN &gt;&gt; 2))</div><div class='ctx'> #define compound_decode_hdr_maxsz	(3 + (NFS4_MAXTAGLEN &gt;&gt; 2))</div><div class='ctx'> #define op_encode_hdr_maxsz	(1)</div><div class='hunk'>@@ -188,7 +184,7 @@ static int decode_layoutget(struct xdr_stream *xdr, struct rpc_rqst *req,</div><div class='ctx'> #define encode_claim_null_maxsz	(1 + nfs4_name_maxsz)</div><div class='ctx'> #define encode_open_maxsz	(op_encode_hdr_maxsz + \</div><div class='ctx'> 				2 + encode_share_access_maxsz + 2 + \</div><div class='del'>-				open_owner_id_maxsz + \</div><div class='add'>+				1 + open_owner_id_maxsz + \</div><div class='ctx'> 				encode_opentype_maxsz + \</div><div class='ctx'> 				encode_claim_null_maxsz)</div><div class='ctx'> #define decode_space_limit_maxsz	(3)</div><div class='hunk'>@@ -224,6 +220,11 @@ static int decode_layoutget(struct xdr_stream *xdr, struct rpc_rqst *req,</div><div class='ctx'> 				 encode_attrs_maxsz)</div><div class='ctx'> #define decode_setattr_maxsz	(op_decode_hdr_maxsz + \</div><div class='ctx'> 				 nfs4_fattr_bitmap_maxsz)</div><div class='add'>+#define encode_delegattr_maxsz	(op_encode_hdr_maxsz + \</div><div class='add'>+				 encode_stateid_maxsz + \</div><div class='add'>+				nfs4_fattr_bitmap_maxsz + \</div><div class='add'>+				2*nfstime4_maxsz)</div><div class='add'>+#define decode_delegattr_maxsz	(decode_setattr_maxsz)</div><div class='ctx'> #define encode_read_maxsz	(op_encode_hdr_maxsz + \</div><div class='ctx'> 				 encode_stateid_maxsz + 3)</div><div class='ctx'> #define decode_read_maxsz	(op_decode_hdr_maxsz + 2 + pagepad_maxsz)</div><div class='hunk'>@@ -253,13 +254,14 @@ static int decode_layoutget(struct xdr_stream *xdr, struct rpc_rqst *req,</div><div class='ctx'> #define encode_link_maxsz	(op_encode_hdr_maxsz + \</div><div class='ctx'> 				nfs4_name_maxsz)</div><div class='ctx'> #define decode_link_maxsz	(op_decode_hdr_maxsz + decode_change_info_maxsz)</div><div class='del'>-#define encode_lockowner_maxsz	(7)</div><div class='add'>+#define encode_lockowner_maxsz	(2 + 1 + lock_owner_id_maxsz)</div><div class='add'>+</div><div class='ctx'> #define encode_lock_maxsz	(op_encode_hdr_maxsz + \</div><div class='ctx'> 				 7 + \</div><div class='ctx'> 				 1 + encode_stateid_maxsz + 1 + \</div><div class='ctx'> 				 encode_lockowner_maxsz)</div><div class='ctx'> #define decode_lock_denied_maxsz \</div><div class='del'>-				(8 + decode_lockowner_maxsz)</div><div class='add'>+				(2 + 2 + 1 + 2 + 1 + lock_owner_id_maxsz)</div><div class='ctx'> #define decode_lock_maxsz	(op_decode_hdr_maxsz + \</div><div class='ctx'> 				 decode_lock_denied_maxsz)</div><div class='ctx'> #define encode_lockt_maxsz	(op_encode_hdr_maxsz + 5 + \</div><div class='hunk'>@@ -615,7 +617,7 @@ static int decode_layoutget(struct xdr_stream *xdr, struct rpc_rqst *req,</div><div class='ctx'> 				 encode_lockowner_maxsz)</div><div class='ctx'> #define NFS4_dec_release_lockowner_sz \</div><div class='ctx'> 				(compound_decode_hdr_maxsz + \</div><div class='del'>-				 decode_lockowner_maxsz)</div><div class='add'>+				 decode_release_lockowner_maxsz)</div><div class='ctx'> #define NFS4_enc_access_sz	(compound_encode_hdr_maxsz + \</div><div class='ctx'> 				encode_sequence_maxsz + \</div><div class='ctx'> 				encode_putfh_maxsz + \</div><div class='hunk'>@@ -758,12 +760,14 @@ static int decode_layoutget(struct xdr_stream *xdr, struct rpc_rqst *req,</div><div class='ctx'> 				encode_sequence_maxsz + \</div><div class='ctx'> 				encode_putfh_maxsz + \</div><div class='ctx'> 				encode_layoutreturn_maxsz + \</div><div class='add'>+				encode_delegattr_maxsz + \</div><div class='ctx'> 				encode_delegreturn_maxsz + \</div><div class='ctx'> 				encode_getattr_maxsz)</div><div class='ctx'> #define NFS4_dec_delegreturn_sz (compound_decode_hdr_maxsz + \</div><div class='ctx'> 				decode_sequence_maxsz + \</div><div class='ctx'> 				decode_putfh_maxsz + \</div><div class='ctx'> 				decode_layoutreturn_maxsz + \</div><div class='add'>+				decode_delegattr_maxsz + \</div><div class='ctx'> 				decode_delegreturn_maxsz + \</div><div class='ctx'> 				decode_getattr_maxsz)</div><div class='ctx'> #define NFS4_enc_getacl_sz	(compound_encode_hdr_maxsz + \</div><div class='hunk'>@@ -968,11 +972,6 @@ static __be32 *reserve_space(struct xdr_stream *xdr, size_t nbytes)</div><div class='ctx'> 	return p;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void encode_opaque_fixed(struct xdr_stream *xdr, const void *buf, size_t len)</div><div class='del'>-{</div><div class='del'>-	WARN_ON_ONCE(xdr_stream_encode_opaque_fixed(xdr, buf, len) &lt; 0);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static void encode_string(struct xdr_stream *xdr, unsigned int len, const char *str)</div><div class='ctx'> {</div><div class='ctx'> 	WARN_ON_ONCE(xdr_stream_encode_opaque(xdr, str, len) &lt; 0);</div><div class='hunk'>@@ -1060,9 +1059,10 @@ static void encode_nops(struct compound_hdr *hdr)</div><div class='ctx'> 	*hdr-&gt;nops_p = htonl(hdr-&gt;nops);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void encode_nfs4_stateid(struct xdr_stream *xdr, const nfs4_stateid *stateid)</div><div class='add'>+static void encode_nfs4_stateid(struct xdr_stream *xdr,</div><div class='add'>+				const nfs4_stateid *stateid)</div><div class='ctx'> {</div><div class='del'>-	encode_opaque_fixed(xdr, stateid, NFS4_STATEID_SIZE);</div><div class='add'>+	encode_opaque_fixed(xdr, stateid-&gt;data, NFS4_STATEID_SIZE);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void encode_nfs4_verifier(struct xdr_stream *xdr, const nfs4_verifier *verf)</div><div class='hunk'>@@ -1305,7 +1305,7 @@ static void encode_link(struct xdr_stream *xdr, const struct qstr *name, struct</div><div class='ctx'> </div><div class='ctx'> static inline int nfs4_lock_type(struct file_lock *fl, int block)</div><div class='ctx'> {</div><div class='del'>-	if (fl-&gt;fl_type == F_RDLCK)</div><div class='add'>+	if (lock_is_read(fl))</div><div class='ctx'> 		return block ? NFS4_READW_LT : NFS4_READ_LT;</div><div class='ctx'> 	return block ? NFS4_WRITEW_LT : NFS4_WRITE_LT;</div><div class='ctx'> }</div><div class='hunk'>@@ -1412,16 +1412,16 @@ static inline void encode_openhdr(struct xdr_stream *xdr, const struct nfs_opena</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'>  /*</div><div class='ctx'>  * opcode 4, seqid 4, share_access 4, share_deny 4, clientid 8, ownerlen 4,</div><div class='del'>- * owner 4 = 32</div><div class='add'>+ * owner 28</div><div class='ctx'>  */</div><div class='ctx'> 	encode_nfs4_seqid(xdr, arg-&gt;seqid);</div><div class='ctx'> 	encode_share_access(xdr, arg-&gt;share_access);</div><div class='del'>-	p = reserve_space(xdr, 36);</div><div class='add'>+	p = reserve_space(xdr, 40);</div><div class='ctx'> 	p = xdr_encode_hyper(p, arg-&gt;clientid);</div><div class='del'>-	*p++ = cpu_to_be32(24);</div><div class='add'>+	*p++ = cpu_to_be32(28);</div><div class='ctx'> 	p = xdr_encode_opaque_fixed(p, "open id:", 8);</div><div class='ctx'> 	*p++ = cpu_to_be32(arg-&gt;server-&gt;s_dev);</div><div class='del'>-	*p++ = cpu_to_be32(arg-&gt;id.uniquifier);</div><div class='add'>+	p = xdr_encode_hyper(p, arg-&gt;id.uniquifier);</div><div class='ctx'> 	xdr_encode_hyper(p, arg-&gt;id.create_time);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1468,20 +1468,18 @@ static void encode_opentype(struct xdr_stream *xdr, const struct nfs_openargs *a</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void encode_delegation_type(struct xdr_stream *xdr, fmode_t delegation_type)</div><div class='add'>+static inline void encode_delegation_type(struct xdr_stream *xdr, u32 delegation_type)</div><div class='ctx'> {</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> </div><div class='ctx'> 	p = reserve_space(xdr, 4);</div><div class='ctx'> 	switch (delegation_type) {</div><div class='del'>-	case 0:</div><div class='del'>-		*p = cpu_to_be32(NFS4_OPEN_DELEGATE_NONE);</div><div class='del'>-		break;</div><div class='del'>-	case FMODE_READ:</div><div class='del'>-		*p = cpu_to_be32(NFS4_OPEN_DELEGATE_READ);</div><div class='del'>-		break;</div><div class='del'>-	case FMODE_WRITE|FMODE_READ:</div><div class='del'>-		*p = cpu_to_be32(NFS4_OPEN_DELEGATE_WRITE);</div><div class='add'>+	case NFS4_OPEN_DELEGATE_NONE:</div><div class='add'>+	case NFS4_OPEN_DELEGATE_READ:</div><div class='add'>+	case NFS4_OPEN_DELEGATE_WRITE:</div><div class='add'>+	case NFS4_OPEN_DELEGATE_READ_ATTRS_DELEG:</div><div class='add'>+	case NFS4_OPEN_DELEGATE_WRITE_ATTRS_DELEG:</div><div class='add'>+		*p = cpu_to_be32(delegation_type);</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		BUG();</div><div class='hunk'>@@ -1497,7 +1495,7 @@ static inline void encode_claim_null(struct xdr_stream *xdr, const struct qstr *</div><div class='ctx'> 	encode_string(xdr, name-&gt;len, name-&gt;name);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void encode_claim_previous(struct xdr_stream *xdr, fmode_t type)</div><div class='add'>+static inline void encode_claim_previous(struct xdr_stream *xdr, u32 type)</div><div class='ctx'> {</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> </div><div class='hunk'>@@ -1602,23 +1600,33 @@ static void encode_read(struct xdr_stream *xdr, const struct nfs_pgio_args *args</div><div class='ctx'> static void encode_readdir(struct xdr_stream *xdr, const struct nfs4_readdir_arg *readdir, struct rpc_rqst *req, struct compound_hdr *hdr)</div><div class='ctx'> {</div><div class='ctx'> 	uint32_t attrs[3] = {</div><div class='del'>-		FATTR4_WORD0_RDATTR_ERROR,</div><div class='add'>+		FATTR4_WORD0_TYPE</div><div class='add'>+		| FATTR4_WORD0_RDATTR_ERROR,</div><div class='ctx'> 		FATTR4_WORD1_MOUNTED_ON_FILEID,</div><div class='ctx'> 	};</div><div class='del'>-	uint32_t dircount = readdir-&gt;count &gt;&gt; 1;</div><div class='add'>+	uint32_t dircount = readdir-&gt;count;</div><div class='add'>+	uint32_t maxcount = readdir-&gt;count;</div><div class='ctx'> 	__be32 *p, verf[2];</div><div class='ctx'> 	uint32_t attrlen = 0;</div><div class='ctx'> 	unsigned int i;</div><div class='ctx'> </div><div class='ctx'> 	if (readdir-&gt;plus) {</div><div class='del'>-		attrs[0] |= FATTR4_WORD0_TYPE|FATTR4_WORD0_CHANGE|FATTR4_WORD0_SIZE|</div><div class='del'>-			FATTR4_WORD0_FSID|FATTR4_WORD0_FILEHANDLE|FATTR4_WORD0_FILEID;</div><div class='del'>-		attrs[1] |= FATTR4_WORD1_MODE|FATTR4_WORD1_NUMLINKS|FATTR4_WORD1_OWNER|</div><div class='del'>-			FATTR4_WORD1_OWNER_GROUP|FATTR4_WORD1_RAWDEV|</div><div class='del'>-			FATTR4_WORD1_SPACE_USED|FATTR4_WORD1_TIME_ACCESS|</div><div class='del'>-			FATTR4_WORD1_TIME_METADATA|FATTR4_WORD1_TIME_MODIFY;</div><div class='add'>+		attrs[0] |= FATTR4_WORD0_CHANGE</div><div class='add'>+			| FATTR4_WORD0_SIZE</div><div class='add'>+			| FATTR4_WORD0_FSID</div><div class='add'>+			| FATTR4_WORD0_FILEHANDLE</div><div class='add'>+			| FATTR4_WORD0_FILEID;</div><div class='add'>+		attrs[1] |= FATTR4_WORD1_MODE</div><div class='add'>+			| FATTR4_WORD1_NUMLINKS</div><div class='add'>+			| FATTR4_WORD1_OWNER</div><div class='add'>+			| FATTR4_WORD1_OWNER_GROUP</div><div class='add'>+			| FATTR4_WORD1_RAWDEV</div><div class='add'>+			| FATTR4_WORD1_SPACE_USED</div><div class='add'>+			| FATTR4_WORD1_TIME_ACCESS</div><div class='add'>+			| FATTR4_WORD1_TIME_CREATE</div><div class='add'>+			| FATTR4_WORD1_TIME_METADATA</div><div class='add'>+			| FATTR4_WORD1_TIME_MODIFY;</div><div class='ctx'> 		attrs[2] |= FATTR4_WORD2_SECURITY_LABEL;</div><div class='del'>-		dircount &gt;&gt;= 1;</div><div class='ctx'> 	}</div><div class='ctx'> 	/* Use mounted_on_fileid only if the server supports it */</div><div class='ctx'> 	if (!(readdir-&gt;bitmask[1] &amp; FATTR4_WORD1_MOUNTED_ON_FILEID))</div><div class='hunk'>@@ -1634,7 +1642,7 @@ static void encode_readdir(struct xdr_stream *xdr, const struct nfs4_readdir_arg</div><div class='ctx'> 	encode_nfs4_verifier(xdr, &amp;readdir-&gt;verifier);</div><div class='ctx'> 	p = reserve_space(xdr, 12 + (attrlen &lt;&lt; 2));</div><div class='ctx'> 	*p++ = cpu_to_be32(dircount);</div><div class='del'>-	*p++ = cpu_to_be32(readdir-&gt;count);</div><div class='add'>+	*p++ = cpu_to_be32(maxcount);</div><div class='ctx'> 	*p++ = cpu_to_be32(attrlen);</div><div class='ctx'> 	for (i = 0; i &lt; attrlen; i++)</div><div class='ctx'> 		*p++ = cpu_to_be32(attrs[i]);</div><div class='hunk'>@@ -1680,19 +1688,35 @@ encode_restorefh(struct xdr_stream *xdr, struct compound_hdr *hdr)</div><div class='ctx'> 	encode_op_hdr(xdr, OP_RESTOREFH, decode_restorefh_maxsz, hdr);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void</div><div class='del'>-encode_setacl(struct xdr_stream *xdr, const struct nfs_setaclargs *arg,</div><div class='del'>-		struct compound_hdr *hdr)</div><div class='add'>+static void nfs4_acltype_to_bitmap(enum nfs4_acl_type type, __u32 bitmap[2])</div><div class='ctx'> {</div><div class='del'>-	__be32 *p;</div><div class='add'>+	switch (type) {</div><div class='add'>+	default:</div><div class='add'>+		bitmap[0] = FATTR4_WORD0_ACL;</div><div class='add'>+		bitmap[1] = 0;</div><div class='add'>+		break;</div><div class='add'>+	case NFS4ACL_DACL:</div><div class='add'>+		bitmap[0] = 0;</div><div class='add'>+		bitmap[1] = FATTR4_WORD1_DACL;</div><div class='add'>+		break;</div><div class='add'>+	case NFS4ACL_SACL:</div><div class='add'>+		bitmap[0] = 0;</div><div class='add'>+		bitmap[1] = FATTR4_WORD1_SACL;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void encode_setacl(struct xdr_stream *xdr,</div><div class='add'>+			  const struct nfs_setaclargs *arg,</div><div class='add'>+			  struct compound_hdr *hdr)</div><div class='add'>+{</div><div class='add'>+	__u32 bitmap[2];</div><div class='add'>+</div><div class='add'>+	nfs4_acltype_to_bitmap(arg-&gt;acl_type, bitmap);</div><div class='ctx'> </div><div class='ctx'> 	encode_op_hdr(xdr, OP_SETATTR, decode_setacl_maxsz, hdr);</div><div class='ctx'> 	encode_nfs4_stateid(xdr, &amp;zero_stateid);</div><div class='del'>-	p = reserve_space(xdr, 2*4);</div><div class='del'>-	*p++ = cpu_to_be32(1);</div><div class='del'>-	*p = cpu_to_be32(FATTR4_WORD0_ACL);</div><div class='del'>-	p = reserve_space(xdr, 4);</div><div class='del'>-	*p = cpu_to_be32(arg-&gt;acl_len);</div><div class='add'>+	xdr_encode_bitmap4(xdr, bitmap, ARRAY_SIZE(bitmap));</div><div class='add'>+	encode_uint32(xdr, arg-&gt;acl_len);</div><div class='ctx'> 	xdr_write_pages(xdr, arg-&gt;acl_pages, 0, arg-&gt;acl_len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1710,6 +1734,33 @@ static void encode_setattr(struct xdr_stream *xdr, const struct nfs_setattrargs</div><div class='ctx'> 			server-&gt;attr_bitmask);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void encode_delegattr(struct xdr_stream *xdr,</div><div class='add'>+		const nfs4_stateid *stateid,</div><div class='add'>+		const struct nfs4_delegattr *attr,</div><div class='add'>+		struct compound_hdr *hdr)</div><div class='add'>+{</div><div class='add'>+	uint32_t bitmap[3] = { 0 };</div><div class='add'>+	uint32_t len = 0;</div><div class='add'>+	__be32 *p;</div><div class='add'>+</div><div class='add'>+	encode_op_hdr(xdr, OP_SETATTR, encode_delegattr_maxsz, hdr);</div><div class='add'>+	encode_nfs4_stateid(xdr, stateid);</div><div class='add'>+	if (attr-&gt;atime_set) {</div><div class='add'>+		bitmap[2] |= FATTR4_WORD2_TIME_DELEG_ACCESS;</div><div class='add'>+		len += (nfstime4_maxsz &lt;&lt; 2);</div><div class='add'>+	}</div><div class='add'>+	if (attr-&gt;mtime_set) {</div><div class='add'>+		bitmap[2] |= FATTR4_WORD2_TIME_DELEG_MODIFY;</div><div class='add'>+		len += (nfstime4_maxsz &lt;&lt; 2);</div><div class='add'>+	}</div><div class='add'>+	xdr_encode_bitmap4(xdr, bitmap, ARRAY_SIZE(bitmap));</div><div class='add'>+	xdr_stream_encode_opaque_inline(xdr, (void **)&amp;p, len);</div><div class='add'>+	if (bitmap[2] &amp; FATTR4_WORD2_TIME_DELEG_ACCESS)</div><div class='add'>+		p = xdr_encode_nfstime4(p, &amp;attr-&gt;atime);</div><div class='add'>+	if (bitmap[2] &amp; FATTR4_WORD2_TIME_DELEG_MODIFY)</div><div class='add'>+		p = xdr_encode_nfstime4(p, &amp;attr-&gt;mtime);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void encode_setclientid(struct xdr_stream *xdr, const struct nfs4_setclientid *setclientid, struct compound_hdr *hdr)</div><div class='ctx'> {</div><div class='ctx'> 	__be32 *p;</div><div class='hunk'>@@ -2080,7 +2131,7 @@ static void encode_test_stateid(struct xdr_stream *xdr,</div><div class='ctx'> {</div><div class='ctx'> 	encode_op_hdr(xdr, OP_TEST_STATEID, decode_test_stateid_maxsz, hdr);</div><div class='ctx'> 	encode_uint32(xdr, 1);</div><div class='del'>-	encode_nfs4_stateid(xdr, args-&gt;stateid);</div><div class='add'>+	encode_nfs4_stateid(xdr, &amp;args-&gt;stateid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void encode_free_stateid(struct xdr_stream *xdr,</div><div class='hunk'>@@ -2587,11 +2638,11 @@ static void nfs4_xdr_enc_getacl(struct rpc_rqst *req, struct xdr_stream *xdr,</div><div class='ctx'> 	struct compound_hdr hdr = {</div><div class='ctx'> 		.minorversion = nfs4_xdr_minorversion(&amp;args-&gt;seq_args),</div><div class='ctx'> 	};</div><div class='del'>-	const __u32 nfs4_acl_bitmap[1] = {</div><div class='del'>-		[0] = FATTR4_WORD0_ACL,</div><div class='del'>-	};</div><div class='add'>+	__u32 nfs4_acl_bitmap[2];</div><div class='ctx'> 	uint32_t replen;</div><div class='ctx'> </div><div class='add'>+	nfs4_acltype_to_bitmap(args-&gt;acl_type, nfs4_acl_bitmap);</div><div class='add'>+</div><div class='ctx'> 	encode_compound_hdr(xdr, req, &amp;hdr);</div><div class='ctx'> 	encode_sequence(xdr, &amp;args-&gt;seq_args, &amp;hdr);</div><div class='ctx'> 	encode_putfh(xdr, args-&gt;fh, &amp;hdr);</div><div class='hunk'>@@ -2787,6 +2838,8 @@ static void nfs4_xdr_enc_delegreturn(struct rpc_rqst *req,</div><div class='ctx'> 	encode_putfh(xdr, args-&gt;fhandle, &amp;hdr);</div><div class='ctx'> 	if (args-&gt;lr_args)</div><div class='ctx'> 		encode_layoutreturn(xdr, args-&gt;lr_args, &amp;hdr);</div><div class='add'>+	if (args-&gt;sattr_args)</div><div class='add'>+		encode_delegattr(xdr, args-&gt;stateid, args-&gt;sattr_args, &amp;hdr);</div><div class='ctx'> 	if (args-&gt;bitmask)</div><div class='ctx'> 		encode_getfattr(xdr, args-&gt;bitmask, &amp;hdr);</div><div class='ctx'> 	encode_delegreturn(xdr, args-&gt;stateid, &amp;hdr);</div><div class='hunk'>@@ -3387,7 +3440,7 @@ static int decode_attr_link_support(struct xdr_stream *xdr, uint32_t *bitmap, ui</div><div class='ctx'> 		*res = be32_to_cpup(p);</div><div class='ctx'> 		bitmap[0] &amp;= ~FATTR4_WORD0_LINK_SUPPORT;</div><div class='ctx'> 	}</div><div class='del'>-	dprintk("%s: link support=%s\n", __func__, *res == 0 ? "false" : "true");</div><div class='add'>+	dprintk("%s: link support=%s\n", __func__, str_false_true(*res == 0));</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3405,7 +3458,7 @@ static int decode_attr_symlink_support(struct xdr_stream *xdr, uint32_t *bitmap,</div><div class='ctx'> 		*res = be32_to_cpup(p);</div><div class='ctx'> 		bitmap[0] &amp;= ~FATTR4_WORD0_SYMLINK_SUPPORT;</div><div class='ctx'> 	}</div><div class='del'>-	dprintk("%s: symlink support=%s\n", __func__, *res == 0 ? "false" : "true");</div><div class='add'>+	dprintk("%s: symlink support=%s\n", __func__, str_false_true(*res == 0));</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3533,6 +3586,42 @@ static int decode_attr_aclsupport(struct xdr_stream *xdr, uint32_t *bitmap, uint</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int decode_attr_case_insensitive(struct xdr_stream *xdr, uint32_t *bitmap, uint32_t *res)</div><div class='add'>+{</div><div class='add'>+	__be32 *p;</div><div class='add'>+</div><div class='add'>+	*res = 0;</div><div class='add'>+	if (unlikely(bitmap[0] &amp; (FATTR4_WORD0_CASE_INSENSITIVE - 1U)))</div><div class='add'>+		return -EIO;</div><div class='add'>+	if (likely(bitmap[0] &amp; FATTR4_WORD0_CASE_INSENSITIVE)) {</div><div class='add'>+		p = xdr_inline_decode(xdr, 4);</div><div class='add'>+		if (unlikely(!p))</div><div class='add'>+			return -EIO;</div><div class='add'>+		*res = be32_to_cpup(p);</div><div class='add'>+		bitmap[0] &amp;= ~FATTR4_WORD0_CASE_INSENSITIVE;</div><div class='add'>+	}</div><div class='add'>+	dprintk("%s: case_insensitive=%s\n", __func__, str_false_true(*res == 0));</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int decode_attr_case_preserving(struct xdr_stream *xdr, uint32_t *bitmap, uint32_t *res)</div><div class='add'>+{</div><div class='add'>+	__be32 *p;</div><div class='add'>+</div><div class='add'>+	*res = 0;</div><div class='add'>+	if (unlikely(bitmap[0] &amp; (FATTR4_WORD0_CASE_PRESERVING - 1U)))</div><div class='add'>+		return -EIO;</div><div class='add'>+	if (likely(bitmap[0] &amp; FATTR4_WORD0_CASE_PRESERVING)) {</div><div class='add'>+		p = xdr_inline_decode(xdr, 4);</div><div class='add'>+		if (unlikely(!p))</div><div class='add'>+			return -EIO;</div><div class='add'>+		*res = be32_to_cpup(p);</div><div class='add'>+		bitmap[0] &amp;= ~FATTR4_WORD0_CASE_PRESERVING;</div><div class='add'>+	}</div><div class='add'>+	dprintk("%s: case_preserving=%s\n", __func__, str_false_true(*res == 0));</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int decode_attr_fileid(struct xdr_stream *xdr, uint32_t *bitmap, uint64_t *fileid)</div><div class='ctx'> {</div><div class='ctx'> 	__be32 *p;</div><div class='hunk'>@@ -3696,8 +3785,6 @@ static int decode_attr_fs_locations(struct xdr_stream *xdr, uint32_t *bitmap, st</div><div class='ctx'> 	if (unlikely(!p))</div><div class='ctx'> 		goto out_eio;</div><div class='ctx'> 	n = be32_to_cpup(p);</div><div class='del'>-	if (n &lt;= 0)</div><div class='del'>-		goto out_eio;</div><div class='ctx'> 	for (res-&gt;nlocations = 0; res-&gt;nlocations &lt; n; res-&gt;nlocations++) {</div><div class='ctx'> 		u32 m;</div><div class='ctx'> 		struct nfs4_fs_location *loc;</div><div class='hunk'>@@ -4121,6 +4208,24 @@ static int decode_attr_time_access(struct xdr_stream *xdr, uint32_t *bitmap, str</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int decode_attr_time_create(struct xdr_stream *xdr, uint32_t *bitmap, struct timespec64 *time)</div><div class='add'>+{</div><div class='add'>+	int status = 0;</div><div class='add'>+</div><div class='add'>+	time-&gt;tv_sec = 0;</div><div class='add'>+	time-&gt;tv_nsec = 0;</div><div class='add'>+	if (unlikely(bitmap[1] &amp; (FATTR4_WORD1_TIME_CREATE - 1U)))</div><div class='add'>+		return -EIO;</div><div class='add'>+	if (likely(bitmap[1] &amp; FATTR4_WORD1_TIME_CREATE)) {</div><div class='add'>+		status = decode_attr_time(xdr, time);</div><div class='add'>+		if (status == 0)</div><div class='add'>+			status = NFS_ATTR_FATTR_BTIME;</div><div class='add'>+		bitmap[1] &amp;= ~FATTR4_WORD1_TIME_CREATE;</div><div class='add'>+	}</div><div class='add'>+	dprintk("%s: btime=%lld\n", __func__, time-&gt;tv_sec);</div><div class='add'>+	return status;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int decode_attr_time_metadata(struct xdr_stream *xdr, uint32_t *bitmap, struct timespec64 *time)</div><div class='ctx'> {</div><div class='ctx'> 	int status = 0;</div><div class='hunk'>@@ -4184,26 +4289,25 @@ static int decode_attr_security_label(struct xdr_stream *xdr, uint32_t *bitmap,</div><div class='ctx'> 		p = xdr_inline_decode(xdr, len);</div><div class='ctx'> 		if (unlikely(!p))</div><div class='ctx'> 			return -EIO;</div><div class='add'>+		bitmap[2] &amp;= ~FATTR4_WORD2_SECURITY_LABEL;</div><div class='ctx'> 		if (len &lt; NFS4_MAXLABELLEN) {</div><div class='del'>-			if (label) {</div><div class='del'>-				if (label-&gt;len) {</div><div class='del'>-					if (label-&gt;len &lt; len)</div><div class='del'>-						return -ERANGE;</div><div class='del'>-					memcpy(label-&gt;label, p, len);</div><div class='del'>-				}</div><div class='add'>+			if (label &amp;&amp; label-&gt;len) {</div><div class='add'>+				if (label-&gt;len &lt; len)</div><div class='add'>+					return -ERANGE;</div><div class='add'>+				memcpy(label-&gt;label, p, len);</div><div class='ctx'> 				label-&gt;len = len;</div><div class='ctx'> 				label-&gt;pi = pi;</div><div class='ctx'> 				label-&gt;lfs = lfs;</div><div class='ctx'> 				status = NFS_ATTR_FATTR_V4_SECURITY_LABEL;</div><div class='ctx'> 			}</div><div class='del'>-			bitmap[2] &amp;= ~FATTR4_WORD2_SECURITY_LABEL;</div><div class='ctx'> 		} else</div><div class='ctx'> 			printk(KERN_WARNING "%s: label too long (%u)!\n",</div><div class='ctx'> 					__func__, len);</div><div class='add'>+		if (label &amp;&amp; label-&gt;label)</div><div class='add'>+			dprintk("%s: label=%.*s, len=%d, PI=%d, LFS=%d\n",</div><div class='add'>+				__func__, label-&gt;len, (char *)label-&gt;label,</div><div class='add'>+				label-&gt;len, label-&gt;pi, label-&gt;lfs);</div><div class='ctx'> 	}</div><div class='del'>-	if (label &amp;&amp; label-&gt;label)</div><div class='del'>-		dprintk("%s: label=%s, len=%d, PI=%d, LFS=%d\n", __func__,</div><div class='del'>-			(char *)label-&gt;label, label-&gt;len, label-&gt;pi, label-&gt;lfs);</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -4240,8 +4344,29 @@ static int decode_attr_xattrsupport(struct xdr_stream *xdr, uint32_t *bitmap,</div><div class='ctx'> 		*res = be32_to_cpup(p);</div><div class='ctx'> 		bitmap[2] &amp;= ~FATTR4_WORD2_XATTR_SUPPORT;</div><div class='ctx'> 	}</div><div class='del'>-	dprintk("%s: XATTR support=%s\n", __func__,</div><div class='del'>-		*res == 0 ? "false" : "true");</div><div class='add'>+	dprintk("%s: XATTR support=%s\n", __func__, str_false_true(*res == 0));</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int decode_attr_open_arguments(struct xdr_stream *xdr, uint32_t *bitmap,</div><div class='add'>+		struct nfs4_open_caps *res)</div><div class='add'>+{</div><div class='add'>+	memset(res, 0, sizeof(*res));</div><div class='add'>+	if (unlikely(bitmap[2] &amp; (FATTR4_WORD2_OPEN_ARGUMENTS - 1U)))</div><div class='add'>+		return -EIO;</div><div class='add'>+	if (likely(bitmap[2] &amp; FATTR4_WORD2_OPEN_ARGUMENTS)) {</div><div class='add'>+		if (decode_bitmap4(xdr, res-&gt;oa_share_access, ARRAY_SIZE(res-&gt;oa_share_access)) &lt; 0)</div><div class='add'>+			return -EIO;</div><div class='add'>+		if (decode_bitmap4(xdr, res-&gt;oa_share_deny, ARRAY_SIZE(res-&gt;oa_share_deny)) &lt; 0)</div><div class='add'>+			return -EIO;</div><div class='add'>+		if (decode_bitmap4(xdr, res-&gt;oa_share_access_want, ARRAY_SIZE(res-&gt;oa_share_access_want)) &lt; 0)</div><div class='add'>+			return -EIO;</div><div class='add'>+		if (decode_bitmap4(xdr, res-&gt;oa_open_claim, ARRAY_SIZE(res-&gt;oa_open_claim)) &lt; 0)</div><div class='add'>+			return -EIO;</div><div class='add'>+		if (decode_bitmap4(xdr, res-&gt;oa_createmode, ARRAY_SIZE(res-&gt;oa_createmode)) &lt; 0)</div><div class='add'>+			return -EIO;</div><div class='add'>+		bitmap[2] &amp;= ~FATTR4_WORD2_OPEN_ARGUMENTS;</div><div class='add'>+	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -4294,14 +4419,6 @@ static int decode_access(struct xdr_stream *xdr, u32 *supported, u32 *access)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int decode_opaque_fixed(struct xdr_stream *xdr, void *buf, size_t len)</div><div class='del'>-{</div><div class='del'>-	ssize_t ret = xdr_stream_decode_opaque_fixed(xdr, buf, len);</div><div class='del'>-	if (unlikely(ret &lt; 0))</div><div class='del'>-		return -EIO;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int decode_stateid(struct xdr_stream *xdr, nfs4_stateid *stateid)</div><div class='ctx'> {</div><div class='ctx'> 	return decode_opaque_fixed(xdr, stateid, NFS4_STATEID_SIZE);</div><div class='hunk'>@@ -4412,9 +4529,15 @@ static int decode_server_caps(struct xdr_stream *xdr, struct nfs4_server_caps_re</div><div class='ctx'> 		goto xdr_error;</div><div class='ctx'> 	if ((status = decode_attr_aclsupport(xdr, bitmap, &amp;res-&gt;acl_bitmask)) != 0)</div><div class='ctx'> 		goto xdr_error;</div><div class='add'>+	if ((status = decode_attr_case_insensitive(xdr, bitmap, &amp;res-&gt;case_insensitive)) != 0)</div><div class='add'>+		goto xdr_error;</div><div class='add'>+	if ((status = decode_attr_case_preserving(xdr, bitmap, &amp;res-&gt;case_preserving)) != 0)</div><div class='add'>+		goto xdr_error;</div><div class='ctx'> 	if ((status = decode_attr_exclcreat_supported(xdr, bitmap,</div><div class='ctx'> 				res-&gt;exclcreat_bitmask)) != 0)</div><div class='ctx'> 		goto xdr_error;</div><div class='add'>+	if ((status = decode_attr_open_arguments(xdr, bitmap, &amp;res-&gt;open_caps)) != 0)</div><div class='add'>+		goto xdr_error;</div><div class='ctx'> 	status = verify_attr_len(xdr, savep, attrlen);</div><div class='ctx'> xdr_error:</div><div class='ctx'> 	dprintk("%s: xdr returned %d!\n", __func__, -status);</div><div class='hunk'>@@ -4677,6 +4800,11 @@ static int decode_getfattr_attrs(struct xdr_stream *xdr, uint32_t *bitmap,</div><div class='ctx'> 		goto xdr_error;</div><div class='ctx'> 	fattr-&gt;valid |= status;</div><div class='ctx'> </div><div class='add'>+	status = decode_attr_time_create(xdr, bitmap, &amp;fattr-&gt;btime);</div><div class='add'>+	if (status &lt; 0)</div><div class='add'>+		goto xdr_error;</div><div class='add'>+	fattr-&gt;valid |= status;</div><div class='add'>+</div><div class='ctx'> 	status = decode_attr_time_metadata(xdr, bitmap, &amp;fattr-&gt;ctime);</div><div class='ctx'> 	if (status &lt; 0)</div><div class='ctx'> 		goto xdr_error;</div><div class='hunk'>@@ -4700,12 +4828,10 @@ static int decode_getfattr_attrs(struct xdr_stream *xdr, uint32_t *bitmap,</div><div class='ctx'> 	if (status &lt; 0)</div><div class='ctx'> 		goto xdr_error;</div><div class='ctx'> </div><div class='del'>-	if (fattr-&gt;label) {</div><div class='del'>-		status = decode_attr_security_label(xdr, bitmap, fattr-&gt;label);</div><div class='del'>-		if (status &lt; 0)</div><div class='del'>-			goto xdr_error;</div><div class='del'>-		fattr-&gt;valid |= status;</div><div class='del'>-	}</div><div class='add'>+	status = decode_attr_security_label(xdr, bitmap, fattr-&gt;label);</div><div class='add'>+	if (status &lt; 0)</div><div class='add'>+		goto xdr_error;</div><div class='add'>+	fattr-&gt;valid |= status;</div><div class='ctx'> </div><div class='ctx'> xdr_error:</div><div class='ctx'> 	dprintk("%s: xdr returned %d\n", __func__, -status);</div><div class='hunk'>@@ -4804,7 +4930,7 @@ static int decode_attr_pnfstype(struct xdr_stream *xdr, uint32_t *bitmap,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * The prefered block size for layout directed io</div><div class='add'>+ * The preferred block size for layout directed io</div><div class='ctx'>  */</div><div class='ctx'> static int decode_attr_layout_blksize(struct xdr_stream *xdr, uint32_t *bitmap,</div><div class='ctx'> 				      uint32_t *res)</div><div class='hunk'>@@ -4975,7 +5101,7 @@ static int decode_link(struct xdr_stream *xdr, struct nfs4_change_info *cinfo)</div><div class='ctx'> /*</div><div class='ctx'>  * We create the owner, so we know a proper owner.id length is 4.</div><div class='ctx'>  */</div><div class='del'>-static int decode_lock_denied (struct xdr_stream *xdr, struct file_lock *fl)</div><div class='add'>+static int decode_lock_denied(struct xdr_stream *xdr, struct file_lock *fl)</div><div class='ctx'> {</div><div class='ctx'> 	uint64_t offset, length, clientid;</div><div class='ctx'> 	__be32 *p;</div><div class='hunk'>@@ -4992,10 +5118,10 @@ static int decode_lock_denied (struct xdr_stream *xdr, struct file_lock *fl)</div><div class='ctx'> 		fl-&gt;fl_end = fl-&gt;fl_start + (loff_t)length - 1;</div><div class='ctx'> 		if (length == ~(uint64_t)0)</div><div class='ctx'> 			fl-&gt;fl_end = OFFSET_MAX;</div><div class='del'>-		fl-&gt;fl_type = F_WRLCK;</div><div class='add'>+		fl-&gt;c.flc_type = F_WRLCK;</div><div class='ctx'> 		if (type &amp; 1)</div><div class='del'>-			fl-&gt;fl_type = F_RDLCK;</div><div class='del'>-		fl-&gt;fl_pid = 0;</div><div class='add'>+			fl-&gt;c.flc_type = F_RDLCK;</div><div class='add'>+		fl-&gt;c.flc_pid = 0;</div><div class='ctx'> 	}</div><div class='ctx'> 	p = xdr_decode_hyper(p, &amp;clientid); /* read 8 bytes */</div><div class='ctx'> 	namelen = be32_to_cpup(p); /* read 4 bytes */  /* have read all 32 bytes now */</div><div class='hunk'>@@ -5088,13 +5214,12 @@ static int decode_space_limit(struct xdr_stream *xdr,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int decode_rw_delegation(struct xdr_stream *xdr,</div><div class='del'>-		uint32_t delegation_type,</div><div class='del'>-		struct nfs_openres *res)</div><div class='add'>+		struct nfs4_open_delegation *res)</div><div class='ctx'> {</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> 	int status;</div><div class='ctx'> </div><div class='del'>-	status = decode_delegation_stateid(xdr, &amp;res-&gt;delegation);</div><div class='add'>+	status = decode_delegation_stateid(xdr, &amp;res-&gt;stateid);</div><div class='ctx'> 	if (unlikely(status))</div><div class='ctx'> 		return status;</div><div class='ctx'> 	p = xdr_inline_decode(xdr, 4);</div><div class='hunk'>@@ -5102,52 +5227,57 @@ static int decode_rw_delegation(struct xdr_stream *xdr,</div><div class='ctx'> 		return -EIO;</div><div class='ctx'> 	res-&gt;do_recall = be32_to_cpup(p);</div><div class='ctx'> </div><div class='del'>-	switch (delegation_type) {</div><div class='add'>+	switch (res-&gt;open_delegation_type) {</div><div class='ctx'> 	case NFS4_OPEN_DELEGATE_READ:</div><div class='del'>-		res-&gt;delegation_type = FMODE_READ;</div><div class='add'>+	case NFS4_OPEN_DELEGATE_READ_ATTRS_DELEG:</div><div class='add'>+		res-&gt;type = FMODE_READ;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case NFS4_OPEN_DELEGATE_WRITE:</div><div class='del'>-		res-&gt;delegation_type = FMODE_WRITE|FMODE_READ;</div><div class='add'>+	case NFS4_OPEN_DELEGATE_WRITE_ATTRS_DELEG:</div><div class='add'>+		res-&gt;type = FMODE_WRITE|FMODE_READ;</div><div class='ctx'> 		if (decode_space_limit(xdr, &amp;res-&gt;pagemod_limit) &lt; 0)</div><div class='ctx'> 				return -EIO;</div><div class='ctx'> 	}</div><div class='ctx'> 	return decode_ace(xdr, NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int decode_no_delegation(struct xdr_stream *xdr, struct nfs_openres *res)</div><div class='add'>+static int decode_no_delegation(struct xdr_stream *xdr,</div><div class='add'>+		struct nfs4_open_delegation *res)</div><div class='ctx'> {</div><div class='ctx'> 	__be32 *p;</div><div class='del'>-	uint32_t why_no_delegation;</div><div class='ctx'> </div><div class='ctx'> 	p = xdr_inline_decode(xdr, 4);</div><div class='ctx'> 	if (unlikely(!p))</div><div class='ctx'> 		return -EIO;</div><div class='del'>-	why_no_delegation = be32_to_cpup(p);</div><div class='del'>-	switch (why_no_delegation) {</div><div class='add'>+	res-&gt;why_no_delegation = be32_to_cpup(p);</div><div class='add'>+	switch (res-&gt;why_no_delegation) {</div><div class='ctx'> 		case WND4_CONTENTION:</div><div class='ctx'> 		case WND4_RESOURCE:</div><div class='del'>-			xdr_inline_decode(xdr, 4);</div><div class='del'>-			/* Ignore for now */</div><div class='add'>+			p = xdr_inline_decode(xdr, 4);</div><div class='add'>+			if (unlikely(!p))</div><div class='add'>+				return -EIO;</div><div class='add'>+			res-&gt;will_notify = be32_to_cpup(p);</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int decode_delegation(struct xdr_stream *xdr, struct nfs_openres *res)</div><div class='add'>+static int decode_delegation(struct xdr_stream *xdr,</div><div class='add'>+		struct nfs4_open_delegation *res)</div><div class='ctx'> {</div><div class='ctx'> 	__be32 *p;</div><div class='del'>-	uint32_t delegation_type;</div><div class='ctx'> </div><div class='ctx'> 	p = xdr_inline_decode(xdr, 4);</div><div class='ctx'> 	if (unlikely(!p))</div><div class='ctx'> 		return -EIO;</div><div class='del'>-	delegation_type = be32_to_cpup(p);</div><div class='del'>-	res-&gt;delegation_type = 0;</div><div class='del'>-	switch (delegation_type) {</div><div class='add'>+	res-&gt;open_delegation_type = be32_to_cpup(p);</div><div class='add'>+	switch (res-&gt;open_delegation_type) {</div><div class='ctx'> 	case NFS4_OPEN_DELEGATE_NONE:</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	case NFS4_OPEN_DELEGATE_READ:</div><div class='ctx'> 	case NFS4_OPEN_DELEGATE_WRITE:</div><div class='del'>-		return decode_rw_delegation(xdr, delegation_type, res);</div><div class='add'>+	case NFS4_OPEN_DELEGATE_READ_ATTRS_DELEG:</div><div class='add'>+	case NFS4_OPEN_DELEGATE_WRITE_ATTRS_DELEG:</div><div class='add'>+		return decode_rw_delegation(xdr, res);</div><div class='ctx'> 	case NFS4_OPEN_DELEGATE_NONE_EXT:</div><div class='ctx'> 		return decode_no_delegation(xdr, res);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -5188,7 +5318,7 @@ static int decode_open(struct xdr_stream *xdr, struct nfs_openres *res)</div><div class='ctx'> 	for (; i &lt; NFS4_BITMAP_SIZE; i++)</div><div class='ctx'> 		res-&gt;attrset[i] = 0;</div><div class='ctx'> </div><div class='del'>-	return decode_delegation(xdr, res);</div><div class='add'>+	return decode_delegation(xdr, &amp;res-&gt;delegation);</div><div class='ctx'> xdr_error:</div><div class='ctx'> 	dprintk("%s: Bitmap too large! Length = %u\n", __func__, bmlen);</div><div class='ctx'> 	return -EIO;</div><div class='hunk'>@@ -5347,7 +5477,7 @@ decode_restorefh(struct xdr_stream *xdr)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int decode_getacl(struct xdr_stream *xdr, struct rpc_rqst *req,</div><div class='del'>-			 struct nfs_getaclres *res)</div><div class='add'>+			 struct nfs_getaclres *res, enum nfs4_acl_type type)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int savep;</div><div class='ctx'> 	uint32_t attrlen,</div><div class='hunk'>@@ -5365,26 +5495,39 @@ static int decode_getacl(struct xdr_stream *xdr, struct rpc_rqst *req,</div><div class='ctx'> 	if ((status = decode_attr_length(xdr, &amp;attrlen, &amp;savep)) != 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	if (unlikely(bitmap[0] &amp; (FATTR4_WORD0_ACL - 1U)))</div><div class='del'>-		return -EIO;</div><div class='del'>-	if (likely(bitmap[0] &amp; FATTR4_WORD0_ACL)) {</div><div class='del'>-</div><div class='del'>-		/* The bitmap (xdr len + bitmaps) and the attr xdr len words</div><div class='del'>-		 * are stored with the acl data to handle the problem of</div><div class='del'>-		 * variable length bitmaps.*/</div><div class='del'>-		res-&gt;acl_data_offset = xdr_page_pos(xdr);</div><div class='del'>-		res-&gt;acl_len = attrlen;</div><div class='del'>-</div><div class='del'>-		/* Check for receive buffer overflow */</div><div class='del'>-		if (res-&gt;acl_len &gt; xdr_stream_remaining(xdr) ||</div><div class='del'>-		    res-&gt;acl_len + res-&gt;acl_data_offset &gt; xdr-&gt;buf-&gt;page_len) {</div><div class='del'>-			res-&gt;acl_flags |= NFS4_ACL_TRUNC;</div><div class='del'>-			dprintk("NFS: acl reply: attrlen %u &gt; page_len %zu\n",</div><div class='del'>-				attrlen, xdr_stream_remaining(xdr));</div><div class='del'>-		}</div><div class='del'>-	} else</div><div class='del'>-		status = -EOPNOTSUPP;</div><div class='add'>+	switch (type) {</div><div class='add'>+	default:</div><div class='add'>+		if (unlikely(bitmap[0] &amp; (FATTR4_WORD0_ACL - 1U)))</div><div class='add'>+			return -EIO;</div><div class='add'>+		if (!(bitmap[0] &amp; FATTR4_WORD0_ACL))</div><div class='add'>+			return -EOPNOTSUPP;</div><div class='add'>+		break;</div><div class='add'>+	case NFS4ACL_DACL:</div><div class='add'>+		if (unlikely(bitmap[0] || bitmap[1] &amp; (FATTR4_WORD1_DACL - 1U)))</div><div class='add'>+			return -EIO;</div><div class='add'>+		if (!(bitmap[1] &amp; FATTR4_WORD1_DACL))</div><div class='add'>+			return -EOPNOTSUPP;</div><div class='add'>+		break;</div><div class='add'>+	case NFS4ACL_SACL:</div><div class='add'>+		if (unlikely(bitmap[0] || bitmap[1] &amp; (FATTR4_WORD1_SACL - 1U)))</div><div class='add'>+			return -EIO;</div><div class='add'>+		if (!(bitmap[1] &amp; FATTR4_WORD1_SACL))</div><div class='add'>+			return -EOPNOTSUPP;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='add'>+	/* The bitmap (xdr len + bitmaps) and the attr xdr len words</div><div class='add'>+	 * are stored with the acl data to handle the problem of</div><div class='add'>+	 * variable length bitmaps.*/</div><div class='add'>+	res-&gt;acl_data_offset = xdr_page_pos(xdr);</div><div class='add'>+	res-&gt;acl_len = attrlen;</div><div class='add'>+</div><div class='add'>+	/* Check for receive buffer overflow */</div><div class='add'>+	if (res-&gt;acl_len &gt; xdr_stream_remaining(xdr) ||</div><div class='add'>+	    res-&gt;acl_len + res-&gt;acl_data_offset &gt; xdr-&gt;buf-&gt;page_len) {</div><div class='add'>+		res-&gt;acl_flags |= NFS4_ACL_TRUNC;</div><div class='add'>+		dprintk("NFS: acl reply: attrlen %u &gt; page_len %zu\n",</div><div class='add'>+			attrlen, xdr_stream_remaining(xdr));</div><div class='add'>+	}</div><div class='ctx'> out:</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='hunk'>@@ -5407,6 +5550,11 @@ static int decode_setattr(struct xdr_stream *xdr)</div><div class='ctx'> 	return -EIO;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int decode_delegattr(struct xdr_stream *xdr)</div><div class='add'>+{</div><div class='add'>+	return decode_setattr(xdr);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int decode_setclientid(struct xdr_stream *xdr, struct nfs4_setclientid_res *res)</div><div class='ctx'> {</div><div class='ctx'> 	__be32 *p;</div><div class='hunk'>@@ -6437,7 +6585,7 @@ nfs4_xdr_dec_getacl(struct rpc_rqst *rqstp, struct xdr_stream *xdr,</div><div class='ctx'> 	int status;</div><div class='ctx'> </div><div class='ctx'> 	if (res-&gt;acl_scratch != NULL)</div><div class='del'>-		xdr_set_scratch_page(xdr, res-&gt;acl_scratch);</div><div class='add'>+		xdr_set_scratch_folio(xdr, res-&gt;acl_scratch);</div><div class='ctx'> 	status = decode_compound_hdr(xdr, &amp;hdr);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -6447,7 +6595,7 @@ nfs4_xdr_dec_getacl(struct rpc_rqst *rqstp, struct xdr_stream *xdr,</div><div class='ctx'> 	status = decode_putfh(xdr);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		goto out;</div><div class='del'>-	status = decode_getacl(xdr, rqstp, res);</div><div class='add'>+	status = decode_getacl(xdr, rqstp, res, res-&gt;acl_type);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	return status;</div><div class='hunk'>@@ -6979,6 +7127,12 @@ static int nfs4_xdr_dec_delegreturn(struct rpc_rqst *rqstp,</div><div class='ctx'> 		if (status)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='add'>+	if (res-&gt;sattr_res) {</div><div class='add'>+		status = decode_delegattr(xdr);</div><div class='add'>+		res-&gt;sattr_ret = status;</div><div class='add'>+		if (status)</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='ctx'> 	if (res-&gt;fattr) {</div><div class='ctx'> 		status = decode_getfattr(xdr, res-&gt;fattr, res-&gt;server);</div><div class='ctx'> 		if (status != 0)</div><div class='hunk'>@@ -7012,7 +7166,7 @@ static int nfs4_xdr_dec_fs_locations(struct rpc_rqst *req,</div><div class='ctx'> 	if (res-&gt;migration) {</div><div class='ctx'> 		xdr_enter_page(xdr, PAGE_SIZE);</div><div class='ctx'> 		status = decode_getfattr_generic(xdr,</div><div class='del'>-					&amp;res-&gt;fs_locations-&gt;fattr,</div><div class='add'>+					res-&gt;fs_locations-&gt;fattr,</div><div class='ctx'> 					 NULL, res-&gt;fs_locations,</div><div class='ctx'> 					 res-&gt;fs_locations-&gt;server);</div><div class='ctx'> 		if (status)</div><div class='hunk'>@@ -7025,7 +7179,7 @@ static int nfs4_xdr_dec_fs_locations(struct rpc_rqst *req,</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		xdr_enter_page(xdr, PAGE_SIZE);</div><div class='ctx'> 		status = decode_getfattr_generic(xdr,</div><div class='del'>-					&amp;res-&gt;fs_locations-&gt;fattr,</div><div class='add'>+					res-&gt;fs_locations-&gt;fattr,</div><div class='ctx'> 					 NULL, res-&gt;fs_locations,</div><div class='ctx'> 					 res-&gt;fs_locations-&gt;server);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -7469,78 +7623,11 @@ int nfs4_decode_dirent(struct xdr_stream *xdr, struct nfs_entry *entry,</div><div class='ctx'> 	if (entry-&gt;fattr-&gt;valid &amp; NFS_ATTR_FATTR_TYPE)</div><div class='ctx'> 		entry-&gt;d_type = nfs_umode_to_dtype(entry-&gt;fattr-&gt;mode);</div><div class='ctx'> </div><div class='del'>-	entry-&gt;prev_cookie = entry-&gt;cookie;</div><div class='ctx'> 	entry-&gt;cookie = new_cookie;</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * We need to translate between nfs status return values and</div><div class='del'>- * the local errno values which may not be the same.</div><div class='del'>- */</div><div class='del'>-static struct {</div><div class='del'>-	int stat;</div><div class='del'>-	int errno;</div><div class='del'>-} nfs_errtbl[] = {</div><div class='del'>-	{ NFS4_OK,		0		},</div><div class='del'>-	{ NFS4ERR_PERM,		-EPERM		},</div><div class='del'>-	{ NFS4ERR_NOENT,	-ENOENT		},</div><div class='del'>-	{ NFS4ERR_IO,		-errno_NFSERR_IO},</div><div class='del'>-	{ NFS4ERR_NXIO,		-ENXIO		},</div><div class='del'>-	{ NFS4ERR_ACCESS,	-EACCES		},</div><div class='del'>-	{ NFS4ERR_EXIST,	-EEXIST		},</div><div class='del'>-	{ NFS4ERR_XDEV,		-EXDEV		},</div><div class='del'>-	{ NFS4ERR_NOTDIR,	-ENOTDIR	},</div><div class='del'>-	{ NFS4ERR_ISDIR,	-EISDIR		},</div><div class='del'>-	{ NFS4ERR_INVAL,	-EINVAL		},</div><div class='del'>-	{ NFS4ERR_FBIG,		-EFBIG		},</div><div class='del'>-	{ NFS4ERR_NOSPC,	-ENOSPC		},</div><div class='del'>-	{ NFS4ERR_ROFS,		-EROFS		},</div><div class='del'>-	{ NFS4ERR_MLINK,	-EMLINK		},</div><div class='del'>-	{ NFS4ERR_NAMETOOLONG,	-ENAMETOOLONG	},</div><div class='del'>-	{ NFS4ERR_NOTEMPTY,	-ENOTEMPTY	},</div><div class='del'>-	{ NFS4ERR_DQUOT,	-EDQUOT		},</div><div class='del'>-	{ NFS4ERR_STALE,	-ESTALE		},</div><div class='del'>-	{ NFS4ERR_BADHANDLE,	-EBADHANDLE	},</div><div class='del'>-	{ NFS4ERR_BAD_COOKIE,	-EBADCOOKIE	},</div><div class='del'>-	{ NFS4ERR_NOTSUPP,	-ENOTSUPP	},</div><div class='del'>-	{ NFS4ERR_TOOSMALL,	-ETOOSMALL	},</div><div class='del'>-	{ NFS4ERR_SERVERFAULT,	-EREMOTEIO	},</div><div class='del'>-	{ NFS4ERR_BADTYPE,	-EBADTYPE	},</div><div class='del'>-	{ NFS4ERR_LOCKED,	-EAGAIN		},</div><div class='del'>-	{ NFS4ERR_SYMLINK,	-ELOOP		},</div><div class='del'>-	{ NFS4ERR_OP_ILLEGAL,	-EOPNOTSUPP	},</div><div class='del'>-	{ NFS4ERR_DEADLOCK,	-EDEADLK	},</div><div class='del'>-	{ NFS4ERR_NOXATTR,	-ENODATA	},</div><div class='del'>-	{ NFS4ERR_XATTR2BIG,	-E2BIG		},</div><div class='del'>-	{ -1,			-EIO		}</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Convert an NFS error code to a local one.</div><div class='del'>- * This one is used jointly by NFSv2 and NFSv3.</div><div class='del'>- */</div><div class='del'>-static int</div><div class='del'>-nfs4_stat_to_errno(int stat)</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-	for (i = 0; nfs_errtbl[i].stat != -1; i++) {</div><div class='del'>-		if (nfs_errtbl[i].stat == stat)</div><div class='del'>-			return nfs_errtbl[i].errno;</div><div class='del'>-	}</div><div class='del'>-	if (stat &lt;= 10000 || stat &gt; 10100) {</div><div class='del'>-		/* The server is looney tunes. */</div><div class='del'>-		return -EREMOTEIO;</div><div class='del'>-	}</div><div class='del'>-	/* If we cannot translate the error, the recovery routines should</div><div class='del'>-	 * handle it.</div><div class='del'>-	 * Note: remaining NFSv4 error codes have values &gt; 10000, so should</div><div class='del'>-	 * not conflict with native Linux error codes.</div><div class='del'>-	 */</div><div class='del'>-	return -stat;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> #ifdef CONFIG_NFS_V4_2</div><div class='ctx'> #include "nfs42xdr.c"</div><div class='ctx'> #endif /* CONFIG_NFS_V4_2 */</div><div class='hunk'>@@ -7639,6 +7726,7 @@ const struct rpc_procinfo nfs4_procedures[] = {</div><div class='ctx'> 	PROC42(CLONE,		enc_clone,		dec_clone),</div><div class='ctx'> 	PROC42(COPY,		enc_copy,		dec_copy),</div><div class='ctx'> 	PROC42(OFFLOAD_CANCEL,	enc_offload_cancel,	dec_offload_cancel),</div><div class='add'>+	PROC42(OFFLOAD_STATUS,	enc_offload_status,	dec_offload_status),</div><div class='ctx'> 	PROC42(COPY_NOTIFY,	enc_copy_notify,	dec_copy_notify),</div><div class='ctx'> 	PROC(LOOKUPP,		enc_lookupp,		dec_lookupp),</div><div class='ctx'> 	PROC42(LAYOUTERROR,	enc_layouterror,	dec_layouterror),</div><div class='hunk'>@@ -7647,6 +7735,7 @@ const struct rpc_procinfo nfs4_procedures[] = {</div><div class='ctx'> 	PROC42(LISTXATTRS,	enc_listxattrs,		dec_listxattrs),</div><div class='ctx'> 	PROC42(REMOVEXATTR,	enc_removexattr,	dec_removexattr),</div><div class='ctx'> 	PROC42(READ_PLUS,	enc_read_plus,		dec_read_plus),</div><div class='add'>+	PROC42(ZERO_RANGE,	enc_zero_range,		dec_zero_range),</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static unsigned int nfs_version4_counts[ARRAY_SIZE(nfs4_procedures)];</div><div class='head'>diff --git a/fs/nfs/nfsroot.c b/fs/nfs/nfsroot.c<br/>index fa148308822c..432612d22437 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfsroot.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfsroot.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfsroot.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfsroot.c</a></div><div class='hunk'>@@ -139,7 +139,7 @@ static int __init nfs_root_setup(char *line)</div><div class='ctx'> 	ROOT_DEV = Root_NFS;</div><div class='ctx'> </div><div class='ctx'> 	if (line[0] == '/' || line[0] == ',' || (line[0] &gt;= '0' &amp;&amp; line[0] &lt;= '9')) {</div><div class='del'>-		strlcpy(nfs_root_parms, line, sizeof(nfs_root_parms));</div><div class='add'>+		strscpy(nfs_root_parms, line, sizeof(nfs_root_parms));</div><div class='ctx'> 	} else {</div><div class='ctx'> 		size_t n = strlen(line) + sizeof(NFS_ROOT) - 1;</div><div class='ctx'> 		if (n &gt;= sizeof(nfs_root_parms))</div><div class='hunk'>@@ -164,7 +164,7 @@ __setup("nfsroot=", nfs_root_setup);</div><div class='ctx'> static int __init root_nfs_copy(char *dest, const char *src,</div><div class='ctx'> 				     const size_t destlen)</div><div class='ctx'> {</div><div class='del'>-	if (strlcpy(dest, src, destlen) &gt; destlen)</div><div class='add'>+	if (strscpy(dest, src, destlen) == -E2BIG)</div><div class='ctx'> 		return -1;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -175,10 +175,10 @@ static int __init root_nfs_cat(char *dest, const char *src,</div><div class='ctx'> 	size_t len = strlen(dest);</div><div class='ctx'> </div><div class='ctx'> 	if (len &amp;&amp; dest[len - 1] != ',')</div><div class='del'>-		if (strlcat(dest, ",", destlen) &gt; destlen)</div><div class='add'>+		if (strlcat(dest, ",", destlen) &gt;= destlen)</div><div class='ctx'> 			return -1;</div><div class='ctx'> </div><div class='del'>-	if (strlcat(dest, src, destlen) &gt; destlen)</div><div class='add'>+	if (strlcat(dest, src, destlen) &gt;= destlen)</div><div class='ctx'> 		return -1;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/nfs/nfstrace.h b/fs/nfs/nfstrace.h<br/>index 21dac847f1e4..6ce55e8e6b67 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfstrace.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/nfstrace.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/nfstrace.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/nfstrace.h</a></div><div class='hunk'>@@ -11,9 +11,9 @@</div><div class='ctx'> #include &lt;linux/tracepoint.h&gt;</div><div class='ctx'> #include &lt;linux/iversion.h&gt;</div><div class='ctx'> </div><div class='del'>-#include &lt;trace/events/fs.h&gt;</div><div class='del'>-#include &lt;trace/events/nfs.h&gt;</div><div class='del'>-#include &lt;trace/events/sunrpc_base.h&gt;</div><div class='add'>+#include &lt;trace/misc/fs.h&gt;</div><div class='add'>+#include &lt;trace/misc/nfs.h&gt;</div><div class='add'>+#include &lt;trace/misc/sunrpc.h&gt;</div><div class='ctx'> </div><div class='ctx'> #define nfs_show_cache_validity(v) \</div><div class='ctx'> 	__print_flags(v, "|", \</div><div class='hunk'>@@ -21,7 +21,6 @@</div><div class='ctx'> 			{ NFS_INO_INVALID_ATIME, "INVALID_ATIME" }, \</div><div class='ctx'> 			{ NFS_INO_INVALID_ACCESS, "INVALID_ACCESS" }, \</div><div class='ctx'> 			{ NFS_INO_INVALID_ACL, "INVALID_ACL" }, \</div><div class='del'>-			{ NFS_INO_REVAL_PAGECACHE, "REVAL_PAGECACHE" }, \</div><div class='ctx'> 			{ NFS_INO_REVAL_FORCED, "REVAL_FORCED" }, \</div><div class='ctx'> 			{ NFS_INO_INVALID_LABEL, "INVALID_LABEL" }, \</div><div class='ctx'> 			{ NFS_INO_INVALID_CHANGE, "INVALID_CHANGE" }, \</div><div class='hunk'>@@ -33,21 +32,36 @@</div><div class='ctx'> 			{ NFS_INO_INVALID_BLOCKS, "INVALID_BLOCKS" }, \</div><div class='ctx'> 			{ NFS_INO_INVALID_XATTR, "INVALID_XATTR" }, \</div><div class='ctx'> 			{ NFS_INO_INVALID_NLINK, "INVALID_NLINK" }, \</div><div class='del'>-			{ NFS_INO_INVALID_MODE, "INVALID_MODE" })</div><div class='add'>+			{ NFS_INO_INVALID_MODE, "INVALID_MODE" }, \</div><div class='add'>+			{ NFS_INO_INVALID_BTIME, "INVALID_BTIME" })</div><div class='ctx'> </div><div class='ctx'> #define nfs_show_nfsi_flags(v) \</div><div class='ctx'> 	__print_flags(v, "|", \</div><div class='del'>-			{ BIT(NFS_INO_ADVISE_RDPLUS), "ADVISE_RDPLUS" }, \</div><div class='ctx'> 			{ BIT(NFS_INO_STALE), "STALE" }, \</div><div class='ctx'> 			{ BIT(NFS_INO_ACL_LRU_SET), "ACL_LRU_SET" }, \</div><div class='ctx'> 			{ BIT(NFS_INO_INVALIDATING), "INVALIDATING" }, \</div><div class='del'>-			{ BIT(NFS_INO_FSCACHE), "FSCACHE" }, \</div><div class='del'>-			{ BIT(NFS_INO_FSCACHE_LOCK), "FSCACHE_LOCK" }, \</div><div class='ctx'> 			{ BIT(NFS_INO_LAYOUTCOMMIT), "NEED_LAYOUTCOMMIT" }, \</div><div class='ctx'> 			{ BIT(NFS_INO_LAYOUTCOMMITTING), "LAYOUTCOMMIT" }, \</div><div class='ctx'> 			{ BIT(NFS_INO_LAYOUTSTATS), "LAYOUTSTATS" }, \</div><div class='ctx'> 			{ BIT(NFS_INO_ODIRECT), "ODIRECT" })</div><div class='ctx'> </div><div class='add'>+#define nfs_show_wb_flags(v) \</div><div class='add'>+	__print_flags(v, "|", \</div><div class='add'>+			{ BIT(PG_BUSY), "BUSY" }, \</div><div class='add'>+			{ BIT(PG_MAPPED), "MAPPED" }, \</div><div class='add'>+			{ BIT(PG_FOLIO), "FOLIO" }, \</div><div class='add'>+			{ BIT(PG_CLEAN), "CLEAN" }, \</div><div class='add'>+			{ BIT(PG_COMMIT_TO_DS), "COMMIT_TO_DS" }, \</div><div class='add'>+			{ BIT(PG_INODE_REF), "INODE_REF" }, \</div><div class='add'>+			{ BIT(PG_HEADLOCK), "HEADLOCK" }, \</div><div class='add'>+			{ BIT(PG_TEARDOWN), "TEARDOWN" }, \</div><div class='add'>+			{ BIT(PG_UNLOCKPAGE), "UNLOCKPAGE" }, \</div><div class='add'>+			{ BIT(PG_UPTODATE), "UPTODATE" }, \</div><div class='add'>+			{ BIT(PG_WB_END), "WB_END" }, \</div><div class='add'>+			{ BIT(PG_REMOVE), "REMOVE" }, \</div><div class='add'>+			{ BIT(PG_CONTENDED1), "CONTENDED1" }, \</div><div class='add'>+			{ BIT(PG_CONTENDED2), "CONTENDED2" })</div><div class='add'>+</div><div class='ctx'> DECLARE_EVENT_CLASS(nfs_inode_event,</div><div class='ctx'> 		TP_PROTO(</div><div class='ctx'> 			const struct inode *inode</div><div class='hunk'>@@ -60,6 +74,7 @@ DECLARE_EVENT_CLASS(nfs_inode_event,</div><div class='ctx'> 			__field(u32, fhandle)</div><div class='ctx'> 			__field(u64, fileid)</div><div class='ctx'> 			__field(u64, version)</div><div class='add'>+			__field(unsigned long, cache_validity)</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_fast_assign(</div><div class='hunk'>@@ -68,14 +83,17 @@ DECLARE_EVENT_CLASS(nfs_inode_event,</div><div class='ctx'> 			__entry-&gt;fileid = nfsi-&gt;fileid;</div><div class='ctx'> 			__entry-&gt;fhandle = nfs_fhandle_hash(&amp;nfsi-&gt;fh);</div><div class='ctx'> 			__entry-&gt;version = inode_peek_iversion_raw(inode);</div><div class='add'>+			__entry-&gt;cache_validity = nfsi-&gt;cache_validity;</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='del'>-			"fileid=%02x:%02x:%llu fhandle=0x%08x version=%llu ",</div><div class='add'>+			"fileid=%02x:%02x:%llu fhandle=0x%08x version=%llu cache_validity=0x%lx (%s)",</div><div class='ctx'> 			MAJOR(__entry-&gt;dev), MINOR(__entry-&gt;dev),</div><div class='ctx'> 			(unsigned long long)__entry-&gt;fileid,</div><div class='ctx'> 			__entry-&gt;fhandle,</div><div class='del'>-			(unsigned long long)__entry-&gt;version</div><div class='add'>+			(unsigned long long)__entry-&gt;version,</div><div class='add'>+			__entry-&gt;cache_validity,</div><div class='add'>+			nfs_show_cache_validity(__entry-&gt;cache_validity)</div><div class='ctx'> 		)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='hunk'>@@ -155,13 +173,15 @@ DEFINE_NFS_INODE_EVENT(nfs_getattr_enter);</div><div class='ctx'> DEFINE_NFS_INODE_EVENT_DONE(nfs_getattr_exit);</div><div class='ctx'> DEFINE_NFS_INODE_EVENT(nfs_setattr_enter);</div><div class='ctx'> DEFINE_NFS_INODE_EVENT_DONE(nfs_setattr_exit);</div><div class='del'>-DEFINE_NFS_INODE_EVENT(nfs_writeback_page_enter);</div><div class='del'>-DEFINE_NFS_INODE_EVENT_DONE(nfs_writeback_page_exit);</div><div class='ctx'> DEFINE_NFS_INODE_EVENT(nfs_writeback_inode_enter);</div><div class='ctx'> DEFINE_NFS_INODE_EVENT_DONE(nfs_writeback_inode_exit);</div><div class='ctx'> DEFINE_NFS_INODE_EVENT(nfs_fsync_enter);</div><div class='ctx'> DEFINE_NFS_INODE_EVENT_DONE(nfs_fsync_exit);</div><div class='ctx'> DEFINE_NFS_INODE_EVENT(nfs_access_enter);</div><div class='add'>+DEFINE_NFS_INODE_EVENT_DONE(nfs_set_cache_invalid);</div><div class='add'>+DEFINE_NFS_INODE_EVENT(nfs_readdir_force_readdirplus);</div><div class='add'>+DEFINE_NFS_INODE_EVENT_DONE(nfs_readdir_cache_fill_done);</div><div class='add'>+DEFINE_NFS_INODE_EVENT_DONE(nfs_readdir_uncached_done);</div><div class='ctx'> </div><div class='ctx'> TRACE_EVENT(nfs_access_exit,</div><div class='ctx'> 		TP_PROTO(</div><div class='hunk'>@@ -269,10 +289,127 @@ DECLARE_EVENT_CLASS(nfs_update_size_class,</div><div class='ctx'> 			TP_ARGS(inode, new_size))</div><div class='ctx'> </div><div class='ctx'> DEFINE_NFS_UPDATE_SIZE_EVENT(truncate);</div><div class='add'>+DEFINE_NFS_UPDATE_SIZE_EVENT(truncate_folio);</div><div class='ctx'> DEFINE_NFS_UPDATE_SIZE_EVENT(wcc);</div><div class='ctx'> DEFINE_NFS_UPDATE_SIZE_EVENT(update);</div><div class='ctx'> DEFINE_NFS_UPDATE_SIZE_EVENT(grow);</div><div class='ctx'> </div><div class='add'>+DECLARE_EVENT_CLASS(nfs_inode_range_event,</div><div class='add'>+		TP_PROTO(</div><div class='add'>+			const struct inode *inode,</div><div class='add'>+			loff_t range_start,</div><div class='add'>+			loff_t range_end</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_ARGS(inode, range_start, range_end),</div><div class='add'>+</div><div class='add'>+		TP_STRUCT__entry(</div><div class='add'>+			__field(dev_t, dev)</div><div class='add'>+			__field(u32, fhandle)</div><div class='add'>+			__field(u64, fileid)</div><div class='add'>+			__field(u64, version)</div><div class='add'>+			__field(loff_t, range_start)</div><div class='add'>+			__field(loff_t, range_end)</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_fast_assign(</div><div class='add'>+			const struct nfs_inode *nfsi = NFS_I(inode);</div><div class='add'>+</div><div class='add'>+			__entry-&gt;dev = inode-&gt;i_sb-&gt;s_dev;</div><div class='add'>+			__entry-&gt;fhandle = nfs_fhandle_hash(&amp;nfsi-&gt;fh);</div><div class='add'>+			__entry-&gt;fileid = nfsi-&gt;fileid;</div><div class='add'>+			__entry-&gt;version = inode_peek_iversion_raw(inode);</div><div class='add'>+			__entry-&gt;range_start = range_start;</div><div class='add'>+			__entry-&gt;range_end = range_end;</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_printk(</div><div class='add'>+			"fileid=%02x:%02x:%llu fhandle=0x%08x version=%llu "</div><div class='add'>+			"range=[%lld, %lld]",</div><div class='add'>+			MAJOR(__entry-&gt;dev), MINOR(__entry-&gt;dev),</div><div class='add'>+			(unsigned long long)__entry-&gt;fileid,</div><div class='add'>+			__entry-&gt;fhandle, __entry-&gt;version,</div><div class='add'>+			__entry-&gt;range_start, __entry-&gt;range_end</div><div class='add'>+		)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+#define DEFINE_NFS_INODE_RANGE_EVENT(name) \</div><div class='add'>+	DEFINE_EVENT(nfs_inode_range_event, name, \</div><div class='add'>+			TP_PROTO( \</div><div class='add'>+				const struct inode *inode, \</div><div class='add'>+				loff_t range_start, \</div><div class='add'>+				loff_t range_end \</div><div class='add'>+			), \</div><div class='add'>+			TP_ARGS(inode, range_start, range_end))</div><div class='add'>+</div><div class='add'>+DEFINE_NFS_INODE_RANGE_EVENT(nfs_readdir_invalidate_cache_range);</div><div class='add'>+</div><div class='add'>+DECLARE_EVENT_CLASS(nfs_readdir_event,</div><div class='add'>+		TP_PROTO(</div><div class='add'>+			const struct file *file,</div><div class='add'>+			const __be32 *verifier,</div><div class='add'>+			u64 cookie,</div><div class='add'>+			pgoff_t page_index,</div><div class='add'>+			unsigned int dtsize</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_ARGS(file, verifier, cookie, page_index, dtsize),</div><div class='add'>+</div><div class='add'>+		TP_STRUCT__entry(</div><div class='add'>+			__field(dev_t, dev)</div><div class='add'>+			__field(u32, fhandle)</div><div class='add'>+			__field(u64, fileid)</div><div class='add'>+			__field(u64, version)</div><div class='add'>+			__array(char, verifier, NFS4_VERIFIER_SIZE)</div><div class='add'>+			__field(u64, cookie)</div><div class='add'>+			__field(pgoff_t, index)</div><div class='add'>+			__field(unsigned int, dtsize)</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_fast_assign(</div><div class='add'>+			const struct inode *dir = file_inode(file);</div><div class='add'>+			const struct nfs_inode *nfsi = NFS_I(dir);</div><div class='add'>+</div><div class='add'>+			__entry-&gt;dev = dir-&gt;i_sb-&gt;s_dev;</div><div class='add'>+			__entry-&gt;fileid = nfsi-&gt;fileid;</div><div class='add'>+			__entry-&gt;fhandle = nfs_fhandle_hash(&amp;nfsi-&gt;fh);</div><div class='add'>+			__entry-&gt;version = inode_peek_iversion_raw(dir);</div><div class='add'>+			if (cookie != 0)</div><div class='add'>+				memcpy(__entry-&gt;verifier, verifier,</div><div class='add'>+				       NFS4_VERIFIER_SIZE);</div><div class='add'>+			else</div><div class='add'>+				memset(__entry-&gt;verifier, 0,</div><div class='add'>+				       NFS4_VERIFIER_SIZE);</div><div class='add'>+			__entry-&gt;cookie = cookie;</div><div class='add'>+			__entry-&gt;index = page_index;</div><div class='add'>+			__entry-&gt;dtsize = dtsize;</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_printk(</div><div class='add'>+			"fileid=%02x:%02x:%llu fhandle=0x%08x version=%llu "</div><div class='add'>+			"cookie=%s:0x%llx cache_index=%lu dtsize=%u",</div><div class='add'>+			MAJOR(__entry-&gt;dev), MINOR(__entry-&gt;dev),</div><div class='add'>+			(unsigned long long)__entry-&gt;fileid, __entry-&gt;fhandle,</div><div class='add'>+			__entry-&gt;version, show_nfs4_verifier(__entry-&gt;verifier),</div><div class='add'>+			(unsigned long long)__entry-&gt;cookie, __entry-&gt;index,</div><div class='add'>+			__entry-&gt;dtsize</div><div class='add'>+		)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+#define DEFINE_NFS_READDIR_EVENT(name) \</div><div class='add'>+	DEFINE_EVENT(nfs_readdir_event, name, \</div><div class='add'>+			TP_PROTO( \</div><div class='add'>+				const struct file *file, \</div><div class='add'>+				const __be32 *verifier, \</div><div class='add'>+				u64 cookie, \</div><div class='add'>+				pgoff_t page_index, \</div><div class='add'>+				unsigned int dtsize \</div><div class='add'>+				), \</div><div class='add'>+			TP_ARGS(file, verifier, cookie, page_index, dtsize))</div><div class='add'>+</div><div class='add'>+DEFINE_NFS_READDIR_EVENT(nfs_readdir_cache_fill);</div><div class='add'>+DEFINE_NFS_READDIR_EVENT(nfs_readdir_uncached);</div><div class='add'>+</div><div class='ctx'> DECLARE_EVENT_CLASS(nfs_lookup_event,</div><div class='ctx'> 		TP_PROTO(</div><div class='ctx'> 			const struct inode *dir,</div><div class='hunk'>@@ -286,6 +423,7 @@ DECLARE_EVENT_CLASS(nfs_lookup_event,</div><div class='ctx'> 			__field(unsigned long, flags)</div><div class='ctx'> 			__field(dev_t, dev)</div><div class='ctx'> 			__field(u64, dir)</div><div class='add'>+			__field(u64, fileid)</div><div class='ctx'> 			__string(name, dentry-&gt;d_name.name)</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='hunk'>@@ -293,16 +431,18 @@ DECLARE_EVENT_CLASS(nfs_lookup_event,</div><div class='ctx'> 			__entry-&gt;dev = dir-&gt;i_sb-&gt;s_dev;</div><div class='ctx'> 			__entry-&gt;dir = NFS_FILEID(dir);</div><div class='ctx'> 			__entry-&gt;flags = flags;</div><div class='del'>-			__assign_str(name, dentry-&gt;d_name.name);</div><div class='add'>+			__entry-&gt;fileid = d_is_negative(dentry) ? 0 : NFS_FILEID(d_inode(dentry));</div><div class='add'>+			__assign_str(name);</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='del'>-			"flags=0x%lx (%s) name=%02x:%02x:%llu/%s",</div><div class='add'>+			"flags=0x%lx (%s) name=%02x:%02x:%llu/%s fileid=%llu",</div><div class='ctx'> 			__entry-&gt;flags,</div><div class='ctx'> 			show_fs_lookup_flags(__entry-&gt;flags),</div><div class='ctx'> 			MAJOR(__entry-&gt;dev), MINOR(__entry-&gt;dev),</div><div class='ctx'> 			(unsigned long long)__entry-&gt;dir,</div><div class='del'>-			__get_str(name)</div><div class='add'>+			__get_str(name),</div><div class='add'>+			__entry-&gt;fileid</div><div class='ctx'> 		)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='hunk'>@@ -330,6 +470,7 @@ DECLARE_EVENT_CLASS(nfs_lookup_event_done,</div><div class='ctx'> 			__field(unsigned long, flags)</div><div class='ctx'> 			__field(dev_t, dev)</div><div class='ctx'> 			__field(u64, dir)</div><div class='add'>+			__field(u64, fileid)</div><div class='ctx'> 			__string(name, dentry-&gt;d_name.name)</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='hunk'>@@ -338,17 +479,19 @@ DECLARE_EVENT_CLASS(nfs_lookup_event_done,</div><div class='ctx'> 			__entry-&gt;dir = NFS_FILEID(dir);</div><div class='ctx'> 			__entry-&gt;error = error &lt; 0 ? -error : 0;</div><div class='ctx'> 			__entry-&gt;flags = flags;</div><div class='del'>-			__assign_str(name, dentry-&gt;d_name.name);</div><div class='add'>+			__entry-&gt;fileid = d_is_negative(dentry) ? 0 : NFS_FILEID(d_inode(dentry));</div><div class='add'>+			__assign_str(name);</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='del'>-			"error=%ld (%s) flags=0x%lx (%s) name=%02x:%02x:%llu/%s",</div><div class='add'>+			"error=%ld (%s) flags=0x%lx (%s) name=%02x:%02x:%llu/%s fileid=%llu",</div><div class='ctx'> 			-__entry-&gt;error, show_nfs_status(__entry-&gt;error),</div><div class='ctx'> 			__entry-&gt;flags,</div><div class='ctx'> 			show_fs_lookup_flags(__entry-&gt;flags),</div><div class='ctx'> 			MAJOR(__entry-&gt;dev), MINOR(__entry-&gt;dev),</div><div class='ctx'> 			(unsigned long long)__entry-&gt;dir,</div><div class='del'>-			__get_str(name)</div><div class='add'>+			__get_str(name),</div><div class='add'>+			__entry-&gt;fileid</div><div class='ctx'> 		)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='hunk'>@@ -366,6 +509,9 @@ DEFINE_NFS_LOOKUP_EVENT(nfs_lookup_enter);</div><div class='ctx'> DEFINE_NFS_LOOKUP_EVENT_DONE(nfs_lookup_exit);</div><div class='ctx'> DEFINE_NFS_LOOKUP_EVENT(nfs_lookup_revalidate_enter);</div><div class='ctx'> DEFINE_NFS_LOOKUP_EVENT_DONE(nfs_lookup_revalidate_exit);</div><div class='add'>+DEFINE_NFS_LOOKUP_EVENT(nfs_readdir_lookup);</div><div class='add'>+DEFINE_NFS_LOOKUP_EVENT(nfs_readdir_lookup_revalidate_failed);</div><div class='add'>+DEFINE_NFS_LOOKUP_EVENT_DONE(nfs_readdir_lookup_revalidate);</div><div class='ctx'> </div><div class='ctx'> TRACE_EVENT(nfs_atomic_open_enter,</div><div class='ctx'> 		TP_PROTO(</div><div class='hunk'>@@ -389,7 +535,7 @@ TRACE_EVENT(nfs_atomic_open_enter,</div><div class='ctx'> 			__entry-&gt;dir = NFS_FILEID(dir);</div><div class='ctx'> 			__entry-&gt;flags = flags;</div><div class='ctx'> 			__entry-&gt;fmode = (__force unsigned long)ctx-&gt;mode;</div><div class='del'>-			__assign_str(name, ctx-&gt;dentry-&gt;d_name.name);</div><div class='add'>+			__assign_str(name);</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='hunk'>@@ -428,7 +574,7 @@ TRACE_EVENT(nfs_atomic_open_exit,</div><div class='ctx'> 			__entry-&gt;dir = NFS_FILEID(dir);</div><div class='ctx'> 			__entry-&gt;flags = flags;</div><div class='ctx'> 			__entry-&gt;fmode = (__force unsigned long)ctx-&gt;mode;</div><div class='del'>-			__assign_str(name, ctx-&gt;dentry-&gt;d_name.name);</div><div class='add'>+			__assign_str(name);</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='hunk'>@@ -464,7 +610,7 @@ TRACE_EVENT(nfs_create_enter,</div><div class='ctx'> 			__entry-&gt;dev = dir-&gt;i_sb-&gt;s_dev;</div><div class='ctx'> 			__entry-&gt;dir = NFS_FILEID(dir);</div><div class='ctx'> 			__entry-&gt;flags = flags;</div><div class='del'>-			__assign_str(name, dentry-&gt;d_name.name);</div><div class='add'>+			__assign_str(name);</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='hunk'>@@ -500,7 +646,7 @@ TRACE_EVENT(nfs_create_exit,</div><div class='ctx'> 			__entry-&gt;dev = dir-&gt;i_sb-&gt;s_dev;</div><div class='ctx'> 			__entry-&gt;dir = NFS_FILEID(dir);</div><div class='ctx'> 			__entry-&gt;flags = flags;</div><div class='del'>-			__assign_str(name, dentry-&gt;d_name.name);</div><div class='add'>+			__assign_str(name);</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='hunk'>@@ -531,7 +677,7 @@ DECLARE_EVENT_CLASS(nfs_directory_event,</div><div class='ctx'> 		TP_fast_assign(</div><div class='ctx'> 			__entry-&gt;dev = dir-&gt;i_sb-&gt;s_dev;</div><div class='ctx'> 			__entry-&gt;dir = NFS_FILEID(dir);</div><div class='del'>-			__assign_str(name, dentry-&gt;d_name.name);</div><div class='add'>+			__assign_str(name);</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='hunk'>@@ -570,7 +716,7 @@ DECLARE_EVENT_CLASS(nfs_directory_event_done,</div><div class='ctx'> 			__entry-&gt;dev = dir-&gt;i_sb-&gt;s_dev;</div><div class='ctx'> 			__entry-&gt;dir = NFS_FILEID(dir);</div><div class='ctx'> 			__entry-&gt;error = error &lt; 0 ? -error : 0;</div><div class='del'>-			__assign_str(name, dentry-&gt;d_name.name);</div><div class='add'>+			__assign_str(name);</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='hunk'>@@ -624,7 +770,7 @@ TRACE_EVENT(nfs_link_enter,</div><div class='ctx'> 			__entry-&gt;dev = inode-&gt;i_sb-&gt;s_dev;</div><div class='ctx'> 			__entry-&gt;fileid = NFS_FILEID(inode);</div><div class='ctx'> 			__entry-&gt;dir = NFS_FILEID(dir);</div><div class='del'>-			__assign_str(name, dentry-&gt;d_name.name);</div><div class='add'>+			__assign_str(name);</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='hunk'>@@ -660,7 +806,7 @@ TRACE_EVENT(nfs_link_exit,</div><div class='ctx'> 			__entry-&gt;fileid = NFS_FILEID(inode);</div><div class='ctx'> 			__entry-&gt;dir = NFS_FILEID(dir);</div><div class='ctx'> 			__entry-&gt;error = error &lt; 0 ? -error : 0;</div><div class='del'>-			__assign_str(name, dentry-&gt;d_name.name);</div><div class='add'>+			__assign_str(name);</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='hunk'>@@ -696,8 +842,8 @@ DECLARE_EVENT_CLASS(nfs_rename_event,</div><div class='ctx'> 			__entry-&gt;dev = old_dir-&gt;i_sb-&gt;s_dev;</div><div class='ctx'> 			__entry-&gt;old_dir = NFS_FILEID(old_dir);</div><div class='ctx'> 			__entry-&gt;new_dir = NFS_FILEID(new_dir);</div><div class='del'>-			__assign_str(old_name, old_dentry-&gt;d_name.name);</div><div class='del'>-			__assign_str(new_name, new_dentry-&gt;d_name.name);</div><div class='add'>+			__assign_str(old_name);</div><div class='add'>+			__assign_str(new_name);</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='hunk'>@@ -745,8 +891,8 @@ DECLARE_EVENT_CLASS(nfs_rename_event_done,</div><div class='ctx'> 			__entry-&gt;error = -error;</div><div class='ctx'> 			__entry-&gt;old_dir = NFS_FILEID(old_dir);</div><div class='ctx'> 			__entry-&gt;new_dir = NFS_FILEID(new_dir);</div><div class='del'>-			__assign_str(old_name, old_dentry-&gt;d_name.name);</div><div class='del'>-			__assign_str(new_name, new_dentry-&gt;d_name.name);</div><div class='add'>+			__assign_str(old_name);</div><div class='add'>+			__assign_str(new_name);</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='hunk'>@@ -776,7 +922,7 @@ DECLARE_EVENT_CLASS(nfs_rename_event_done,</div><div class='ctx'> DEFINE_NFS_RENAME_EVENT(nfs_rename_enter);</div><div class='ctx'> DEFINE_NFS_RENAME_EVENT_DONE(nfs_rename_exit);</div><div class='ctx'> </div><div class='del'>-DEFINE_NFS_RENAME_EVENT_DONE(nfs_sillyrename_rename);</div><div class='add'>+DEFINE_NFS_RENAME_EVENT_DONE(nfs_async_rename_done);</div><div class='ctx'> </div><div class='ctx'> TRACE_EVENT(nfs_sillyrename_unlink,</div><div class='ctx'> 		TP_PROTO(</div><div class='hunk'>@@ -813,13 +959,14 @@ TRACE_EVENT(nfs_sillyrename_unlink,</div><div class='ctx'> 		)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='del'>-TRACE_EVENT(nfs_aop_readpage,</div><div class='add'>+DECLARE_EVENT_CLASS(nfs_folio_event,</div><div class='ctx'> 		TP_PROTO(</div><div class='ctx'> 			const struct inode *inode,</div><div class='del'>-			struct page *page</div><div class='add'>+			loff_t offset,</div><div class='add'>+			size_t count</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='del'>-		TP_ARGS(inode, page),</div><div class='add'>+		TP_ARGS(inode, offset, count),</div><div class='ctx'> </div><div class='ctx'> 		TP_STRUCT__entry(</div><div class='ctx'> 			__field(dev_t, dev)</div><div class='hunk'>@@ -827,6 +974,7 @@ TRACE_EVENT(nfs_aop_readpage,</div><div class='ctx'> 			__field(u64, fileid)</div><div class='ctx'> 			__field(u64, version)</div><div class='ctx'> 			__field(loff_t, offset)</div><div class='add'>+			__field(size_t, count)</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_fast_assign(</div><div class='hunk'>@@ -836,26 +984,38 @@ TRACE_EVENT(nfs_aop_readpage,</div><div class='ctx'> 			__entry-&gt;fileid = nfsi-&gt;fileid;</div><div class='ctx'> 			__entry-&gt;fhandle = nfs_fhandle_hash(&amp;nfsi-&gt;fh);</div><div class='ctx'> 			__entry-&gt;version = inode_peek_iversion_raw(inode);</div><div class='del'>-			__entry-&gt;offset = page_index(page) &lt;&lt; PAGE_SHIFT;</div><div class='add'>+			__entry-&gt;offset = offset;</div><div class='add'>+			__entry-&gt;count = count;</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='del'>-			"fileid=%02x:%02x:%llu fhandle=0x%08x version=%llu offset=%lld",</div><div class='add'>+			"fileid=%02x:%02x:%llu fhandle=0x%08x version=%llu "</div><div class='add'>+			"offset=%lld count=%zu",</div><div class='ctx'> 			MAJOR(__entry-&gt;dev), MINOR(__entry-&gt;dev),</div><div class='ctx'> 			(unsigned long long)__entry-&gt;fileid,</div><div class='ctx'> 			__entry-&gt;fhandle, __entry-&gt;version,</div><div class='del'>-			__entry-&gt;offset</div><div class='add'>+			__entry-&gt;offset, __entry-&gt;count</div><div class='ctx'> 		)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='del'>-TRACE_EVENT(nfs_aop_readpage_done,</div><div class='add'>+#define DEFINE_NFS_FOLIO_EVENT(name) \</div><div class='add'>+	DEFINE_EVENT(nfs_folio_event, name, \</div><div class='add'>+			TP_PROTO( \</div><div class='add'>+				const struct inode *inode, \</div><div class='add'>+				loff_t offset, \</div><div class='add'>+				size_t count \</div><div class='add'>+			), \</div><div class='add'>+			TP_ARGS(inode, offset, count))</div><div class='add'>+</div><div class='add'>+DECLARE_EVENT_CLASS(nfs_folio_event_done,</div><div class='ctx'> 		TP_PROTO(</div><div class='ctx'> 			const struct inode *inode,</div><div class='del'>-			struct page *page,</div><div class='add'>+			loff_t offset,</div><div class='add'>+			size_t count,</div><div class='ctx'> 			int ret</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='del'>-		TP_ARGS(inode, page, ret),</div><div class='add'>+		TP_ARGS(inode, offset, count, ret),</div><div class='ctx'> </div><div class='ctx'> 		TP_STRUCT__entry(</div><div class='ctx'> 			__field(dev_t, dev)</div><div class='hunk'>@@ -864,6 +1024,7 @@ TRACE_EVENT(nfs_aop_readpage_done,</div><div class='ctx'> 			__field(u64, fileid)</div><div class='ctx'> 			__field(u64, version)</div><div class='ctx'> 			__field(loff_t, offset)</div><div class='add'>+			__field(size_t, count)</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_fast_assign(</div><div class='hunk'>@@ -873,27 +1034,115 @@ TRACE_EVENT(nfs_aop_readpage_done,</div><div class='ctx'> 			__entry-&gt;fileid = nfsi-&gt;fileid;</div><div class='ctx'> 			__entry-&gt;fhandle = nfs_fhandle_hash(&amp;nfsi-&gt;fh);</div><div class='ctx'> 			__entry-&gt;version = inode_peek_iversion_raw(inode);</div><div class='del'>-			__entry-&gt;offset = page_index(page) &lt;&lt; PAGE_SHIFT;</div><div class='add'>+			__entry-&gt;offset = offset;</div><div class='add'>+			__entry-&gt;count = count;</div><div class='ctx'> 			__entry-&gt;ret = ret;</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='del'>-			"fileid=%02x:%02x:%llu fhandle=0x%08x version=%llu offset=%lld ret=%d",</div><div class='add'>+			"fileid=%02x:%02x:%llu fhandle=0x%08x version=%llu "</div><div class='add'>+			"offset=%lld count=%zu ret=%d",</div><div class='add'>+			MAJOR(__entry-&gt;dev), MINOR(__entry-&gt;dev),</div><div class='add'>+			(unsigned long long)__entry-&gt;fileid,</div><div class='add'>+			__entry-&gt;fhandle, __entry-&gt;version,</div><div class='add'>+			__entry-&gt;offset, __entry-&gt;count, __entry-&gt;ret</div><div class='add'>+		)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+#define DEFINE_NFS_FOLIO_EVENT_DONE(name) \</div><div class='add'>+	DEFINE_EVENT(nfs_folio_event_done, name, \</div><div class='add'>+			TP_PROTO( \</div><div class='add'>+				const struct inode *inode, \</div><div class='add'>+				loff_t offset, \</div><div class='add'>+				size_t count, \</div><div class='add'>+				int ret \</div><div class='add'>+			), \</div><div class='add'>+			TP_ARGS(inode, offset, count, ret))</div><div class='add'>+</div><div class='add'>+DEFINE_NFS_FOLIO_EVENT(nfs_aop_readpage);</div><div class='add'>+DEFINE_NFS_FOLIO_EVENT_DONE(nfs_aop_readpage_done);</div><div class='add'>+</div><div class='add'>+DEFINE_NFS_FOLIO_EVENT(nfs_writeback_folio);</div><div class='add'>+DEFINE_NFS_FOLIO_EVENT_DONE(nfs_writeback_folio_done);</div><div class='add'>+</div><div class='add'>+DEFINE_NFS_FOLIO_EVENT(nfs_invalidate_folio);</div><div class='add'>+DEFINE_NFS_FOLIO_EVENT_DONE(nfs_launder_folio_done);</div><div class='add'>+</div><div class='add'>+DEFINE_NFS_FOLIO_EVENT(nfs_try_to_update_request);</div><div class='add'>+DEFINE_NFS_FOLIO_EVENT_DONE(nfs_try_to_update_request_done);</div><div class='add'>+</div><div class='add'>+DEFINE_NFS_FOLIO_EVENT(nfs_update_folio);</div><div class='add'>+DEFINE_NFS_FOLIO_EVENT_DONE(nfs_update_folio_done);</div><div class='add'>+</div><div class='add'>+DEFINE_NFS_FOLIO_EVENT(nfs_write_begin);</div><div class='add'>+DEFINE_NFS_FOLIO_EVENT_DONE(nfs_write_begin_done);</div><div class='add'>+</div><div class='add'>+DEFINE_NFS_FOLIO_EVENT(nfs_write_end);</div><div class='add'>+DEFINE_NFS_FOLIO_EVENT_DONE(nfs_write_end_done);</div><div class='add'>+</div><div class='add'>+DEFINE_NFS_FOLIO_EVENT(nfs_writepages);</div><div class='add'>+DEFINE_NFS_FOLIO_EVENT_DONE(nfs_writepages_done);</div><div class='add'>+</div><div class='add'>+DECLARE_EVENT_CLASS(nfs_kiocb_event,</div><div class='add'>+		TP_PROTO(</div><div class='add'>+			const struct kiocb *iocb,</div><div class='add'>+			const struct iov_iter *iter</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_ARGS(iocb, iter),</div><div class='add'>+</div><div class='add'>+		TP_STRUCT__entry(</div><div class='add'>+			__field(dev_t, dev)</div><div class='add'>+			__field(u32, fhandle)</div><div class='add'>+			__field(u64, fileid)</div><div class='add'>+			__field(u64, version)</div><div class='add'>+			__field(loff_t, offset)</div><div class='add'>+			__field(size_t, count)</div><div class='add'>+			__field(int, flags)</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_fast_assign(</div><div class='add'>+			const struct inode *inode = file_inode(iocb-&gt;ki_filp);</div><div class='add'>+			const struct nfs_inode *nfsi = NFS_I(inode);</div><div class='add'>+</div><div class='add'>+			__entry-&gt;dev = inode-&gt;i_sb-&gt;s_dev;</div><div class='add'>+			__entry-&gt;fileid = nfsi-&gt;fileid;</div><div class='add'>+			__entry-&gt;fhandle = nfs_fhandle_hash(&amp;nfsi-&gt;fh);</div><div class='add'>+			__entry-&gt;version = inode_peek_iversion_raw(inode);</div><div class='add'>+			__entry-&gt;offset = iocb-&gt;ki_pos;</div><div class='add'>+			__entry-&gt;count = iov_iter_count(iter);</div><div class='add'>+			__entry-&gt;flags = iocb-&gt;ki_flags;</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_printk(</div><div class='add'>+			"fileid=%02x:%02x:%llu fhandle=0x%08x version=%llu offset=%lld count=%zu ki_flags=%s",</div><div class='ctx'> 			MAJOR(__entry-&gt;dev), MINOR(__entry-&gt;dev),</div><div class='ctx'> 			(unsigned long long)__entry-&gt;fileid,</div><div class='ctx'> 			__entry-&gt;fhandle, __entry-&gt;version,</div><div class='del'>-			__entry-&gt;offset, __entry-&gt;ret</div><div class='add'>+			__entry-&gt;offset, __entry-&gt;count,</div><div class='add'>+			__print_flags(__entry-&gt;flags, "|", TRACE_IOCB_STRINGS)</div><div class='ctx'> 		)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='add'>+#define DEFINE_NFS_KIOCB_EVENT(name) \</div><div class='add'>+	DEFINE_EVENT(nfs_kiocb_event, name, \</div><div class='add'>+			TP_PROTO( \</div><div class='add'>+				const struct kiocb *iocb, \</div><div class='add'>+				const struct iov_iter *iter \</div><div class='add'>+			), \</div><div class='add'>+			TP_ARGS(iocb, iter))</div><div class='add'>+</div><div class='add'>+DEFINE_NFS_KIOCB_EVENT(nfs_file_read);</div><div class='add'>+DEFINE_NFS_KIOCB_EVENT(nfs_file_write);</div><div class='add'>+</div><div class='ctx'> TRACE_EVENT(nfs_aop_readahead,</div><div class='ctx'> 		TP_PROTO(</div><div class='ctx'> 			const struct inode *inode,</div><div class='del'>-			struct page *page,</div><div class='add'>+			loff_t pos,</div><div class='ctx'> 			unsigned int nr_pages</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='del'>-		TP_ARGS(inode, page, nr_pages),</div><div class='add'>+		TP_ARGS(inode, pos, nr_pages),</div><div class='ctx'> </div><div class='ctx'> 		TP_STRUCT__entry(</div><div class='ctx'> 			__field(dev_t, dev)</div><div class='hunk'>@@ -911,7 +1160,7 @@ TRACE_EVENT(nfs_aop_readahead,</div><div class='ctx'> 			__entry-&gt;fileid = nfsi-&gt;fileid;</div><div class='ctx'> 			__entry-&gt;fhandle = nfs_fhandle_hash(&amp;nfsi-&gt;fh);</div><div class='ctx'> 			__entry-&gt;version = inode_peek_iversion_raw(inode);</div><div class='del'>-			__entry-&gt;offset = page_index(page) &lt;&lt; PAGE_SHIFT;</div><div class='add'>+			__entry-&gt;offset = pos;</div><div class='ctx'> 			__entry-&gt;nr_pages = nr_pages;</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='hunk'>@@ -1017,7 +1266,7 @@ TRACE_EVENT(nfs_readpage_done,</div><div class='ctx'> 			__field(u32, arg_count)</div><div class='ctx'> 			__field(u32, res_count)</div><div class='ctx'> 			__field(bool, eof)</div><div class='del'>-			__field(int, status)</div><div class='add'>+			__field(int, error)</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_fast_assign(</div><div class='hunk'>@@ -1026,7 +1275,7 @@ TRACE_EVENT(nfs_readpage_done,</div><div class='ctx'> 			const struct nfs_fh *fh = hdr-&gt;args.fh ?</div><div class='ctx'> 						  hdr-&gt;args.fh : &amp;nfsi-&gt;fh;</div><div class='ctx'> </div><div class='del'>-			__entry-&gt;status = task-&gt;tk_status;</div><div class='add'>+			__entry-&gt;error = task-&gt;tk_status;</div><div class='ctx'> 			__entry-&gt;offset = hdr-&gt;args.offset;</div><div class='ctx'> 			__entry-&gt;arg_count = hdr-&gt;args.count;</div><div class='ctx'> 			__entry-&gt;res_count = hdr-&gt;res.count;</div><div class='hunk'>@@ -1037,14 +1286,13 @@ TRACE_EVENT(nfs_readpage_done,</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='del'>-			"fileid=%02x:%02x:%llu fhandle=0x%08x "</div><div class='del'>-			"offset=%lld count=%u res=%u status=%d%s",</div><div class='add'>+			"error=%d fileid=%02x:%02x:%llu fhandle=0x%08x "</div><div class='add'>+			"offset=%lld count=%u res=%u%s", __entry-&gt;error,</div><div class='ctx'> 			MAJOR(__entry-&gt;dev), MINOR(__entry-&gt;dev),</div><div class='ctx'> 			(unsigned long long)__entry-&gt;fileid,</div><div class='ctx'> 			__entry-&gt;fhandle,</div><div class='ctx'> 			(long long)__entry-&gt;offset, __entry-&gt;arg_count,</div><div class='del'>-			__entry-&gt;res_count, __entry-&gt;status,</div><div class='del'>-			__entry-&gt;eof ? " eof" : ""</div><div class='add'>+			__entry-&gt;res_count, __entry-&gt;eof ? " eof" : ""</div><div class='ctx'> 		)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='hunk'>@@ -1064,7 +1312,7 @@ TRACE_EVENT(nfs_readpage_short,</div><div class='ctx'> 			__field(u32, arg_count)</div><div class='ctx'> 			__field(u32, res_count)</div><div class='ctx'> 			__field(bool, eof)</div><div class='del'>-			__field(int, status)</div><div class='add'>+			__field(int, error)</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_fast_assign(</div><div class='hunk'>@@ -1073,7 +1321,7 @@ TRACE_EVENT(nfs_readpage_short,</div><div class='ctx'> 			const struct nfs_fh *fh = hdr-&gt;args.fh ?</div><div class='ctx'> 						  hdr-&gt;args.fh : &amp;nfsi-&gt;fh;</div><div class='ctx'> </div><div class='del'>-			__entry-&gt;status = task-&gt;tk_status;</div><div class='add'>+			__entry-&gt;error = task-&gt;tk_status;</div><div class='ctx'> 			__entry-&gt;offset = hdr-&gt;args.offset;</div><div class='ctx'> 			__entry-&gt;arg_count = hdr-&gt;args.count;</div><div class='ctx'> 			__entry-&gt;res_count = hdr-&gt;res.count;</div><div class='hunk'>@@ -1084,17 +1332,17 @@ TRACE_EVENT(nfs_readpage_short,</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='del'>-			"fileid=%02x:%02x:%llu fhandle=0x%08x "</div><div class='del'>-			"offset=%lld count=%u res=%u status=%d%s",</div><div class='add'>+			"error=%d fileid=%02x:%02x:%llu fhandle=0x%08x "</div><div class='add'>+			"offset=%lld count=%u res=%u%s", __entry-&gt;error,</div><div class='ctx'> 			MAJOR(__entry-&gt;dev), MINOR(__entry-&gt;dev),</div><div class='ctx'> 			(unsigned long long)__entry-&gt;fileid,</div><div class='ctx'> 			__entry-&gt;fhandle,</div><div class='ctx'> 			(long long)__entry-&gt;offset, __entry-&gt;arg_count,</div><div class='del'>-			__entry-&gt;res_count, __entry-&gt;status,</div><div class='del'>-			__entry-&gt;eof ? " eof" : ""</div><div class='add'>+			__entry-&gt;res_count, __entry-&gt;eof ? " eof" : ""</div><div class='ctx'> 		)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='add'>+</div><div class='ctx'> TRACE_EVENT(nfs_pgio_error,</div><div class='ctx'> 	TP_PROTO(</div><div class='ctx'> 		const struct nfs_pgio_header *hdr,</div><div class='hunk'>@@ -1112,7 +1360,7 @@ TRACE_EVENT(nfs_pgio_error,</div><div class='ctx'> 		__field(u32, arg_count)</div><div class='ctx'> 		__field(u32, res_count)</div><div class='ctx'> 		__field(loff_t, pos)</div><div class='del'>-		__field(int, status)</div><div class='add'>+		__field(int, error)</div><div class='ctx'> 	),</div><div class='ctx'> </div><div class='ctx'> 	TP_fast_assign(</div><div class='hunk'>@@ -1121,7 +1369,7 @@ TRACE_EVENT(nfs_pgio_error,</div><div class='ctx'> 		const struct nfs_fh *fh = hdr-&gt;args.fh ?</div><div class='ctx'> 					  hdr-&gt;args.fh : &amp;nfsi-&gt;fh;</div><div class='ctx'> </div><div class='del'>-		__entry-&gt;status = error;</div><div class='add'>+		__entry-&gt;error = error;</div><div class='ctx'> 		__entry-&gt;offset = hdr-&gt;args.offset;</div><div class='ctx'> 		__entry-&gt;arg_count = hdr-&gt;args.count;</div><div class='ctx'> 		__entry-&gt;res_count = hdr-&gt;res.count;</div><div class='hunk'>@@ -1130,12 +1378,12 @@ TRACE_EVENT(nfs_pgio_error,</div><div class='ctx'> 		__entry-&gt;fhandle = nfs_fhandle_hash(fh);</div><div class='ctx'> 	),</div><div class='ctx'> </div><div class='del'>-	TP_printk("fileid=%02x:%02x:%llu fhandle=0x%08x "</div><div class='del'>-		  "offset=%lld count=%u res=%u pos=%llu status=%d",</div><div class='add'>+	TP_printk("error=%d fileid=%02x:%02x:%llu fhandle=0x%08x "</div><div class='add'>+		  "offset=%lld count=%u res=%u pos=%llu", __entry-&gt;error,</div><div class='ctx'> 		MAJOR(__entry-&gt;dev), MINOR(__entry-&gt;dev),</div><div class='ctx'> 		(unsigned long long)__entry-&gt;fileid, __entry-&gt;fhandle,</div><div class='ctx'> 		(long long)__entry-&gt;offset, __entry-&gt;arg_count, __entry-&gt;res_count,</div><div class='del'>-		__entry-&gt;pos, __entry-&gt;status</div><div class='add'>+		__entry-&gt;pos</div><div class='ctx'> 	)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='hunk'>@@ -1195,7 +1443,7 @@ TRACE_EVENT(nfs_writeback_done,</div><div class='ctx'> 			__field(loff_t, offset)</div><div class='ctx'> 			__field(u32, arg_count)</div><div class='ctx'> 			__field(u32, res_count)</div><div class='del'>-			__field(int, status)</div><div class='add'>+			__field(int, error)</div><div class='ctx'> 			__field(unsigned long, stable)</div><div class='ctx'> 			__array(char, verifier, NFS4_VERIFIER_SIZE)</div><div class='ctx'> 		),</div><div class='hunk'>@@ -1207,7 +1455,7 @@ TRACE_EVENT(nfs_writeback_done,</div><div class='ctx'> 						  hdr-&gt;args.fh : &amp;nfsi-&gt;fh;</div><div class='ctx'> 			const struct nfs_writeverf *verf = hdr-&gt;res.verf;</div><div class='ctx'> </div><div class='del'>-			__entry-&gt;status = task-&gt;tk_status;</div><div class='add'>+			__entry-&gt;error = task-&gt;tk_status;</div><div class='ctx'> 			__entry-&gt;offset = hdr-&gt;args.offset;</div><div class='ctx'> 			__entry-&gt;arg_count = hdr-&gt;args.count;</div><div class='ctx'> 			__entry-&gt;res_count = hdr-&gt;res.count;</div><div class='hunk'>@@ -1221,59 +1469,114 @@ TRACE_EVENT(nfs_writeback_done,</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='del'>-			"fileid=%02x:%02x:%llu fhandle=0x%08x "</div><div class='del'>-			"offset=%lld count=%u res=%u status=%d stable=%s "</div><div class='del'>-			"verifier=%s",</div><div class='add'>+			"error=%d fileid=%02x:%02x:%llu fhandle=0x%08x "</div><div class='add'>+			"offset=%lld count=%u res=%u stable=%s "</div><div class='add'>+			"verifier=%s", __entry-&gt;error,</div><div class='ctx'> 			MAJOR(__entry-&gt;dev), MINOR(__entry-&gt;dev),</div><div class='ctx'> 			(unsigned long long)__entry-&gt;fileid,</div><div class='ctx'> 			__entry-&gt;fhandle,</div><div class='ctx'> 			(long long)__entry-&gt;offset, __entry-&gt;arg_count,</div><div class='del'>-			__entry-&gt;res_count, __entry-&gt;status,</div><div class='add'>+			__entry-&gt;res_count,</div><div class='ctx'> 			show_nfs_stable_how(__entry-&gt;stable),</div><div class='ctx'> 			show_nfs4_verifier(__entry-&gt;verifier)</div><div class='ctx'> 		)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='add'>+DECLARE_EVENT_CLASS(nfs_page_class,</div><div class='add'>+		TP_PROTO(</div><div class='add'>+			const struct nfs_page *req</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_ARGS(req),</div><div class='add'>+</div><div class='add'>+		TP_STRUCT__entry(</div><div class='add'>+			__field(dev_t, dev)</div><div class='add'>+			__field(u32, fhandle)</div><div class='add'>+			__field(u64, fileid)</div><div class='add'>+			__field(const struct nfs_page *__private, req)</div><div class='add'>+			__field(loff_t, offset)</div><div class='add'>+			__field(unsigned int, count)</div><div class='add'>+			__field(unsigned long, flags)</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_fast_assign(</div><div class='add'>+			const struct inode *inode = folio_inode(req-&gt;wb_folio);</div><div class='add'>+			const struct nfs_inode *nfsi = NFS_I(inode);</div><div class='add'>+</div><div class='add'>+			__entry-&gt;dev = inode-&gt;i_sb-&gt;s_dev;</div><div class='add'>+			__entry-&gt;fileid = nfsi-&gt;fileid;</div><div class='add'>+			__entry-&gt;fhandle = nfs_fhandle_hash(&amp;nfsi-&gt;fh);</div><div class='add'>+			__entry-&gt;req = req;</div><div class='add'>+			__entry-&gt;offset = req_offset(req);</div><div class='add'>+			__entry-&gt;count = req-&gt;wb_bytes;</div><div class='add'>+			__entry-&gt;flags = req-&gt;wb_flags;</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_printk(</div><div class='add'>+			"fileid=%02x:%02x:%llu fhandle=0x%08x req=%p offset=%lld count=%u flags=%s",</div><div class='add'>+			MAJOR(__entry-&gt;dev), MINOR(__entry-&gt;dev),</div><div class='add'>+			(unsigned long long)__entry-&gt;fileid, __entry-&gt;fhandle,</div><div class='add'>+			__entry-&gt;req, __entry-&gt;offset, __entry-&gt;count,</div><div class='add'>+			nfs_show_wb_flags(__entry-&gt;flags)</div><div class='add'>+		)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+#define DEFINE_NFS_PAGE_EVENT(name) \</div><div class='add'>+	DEFINE_EVENT(nfs_page_class, name, \</div><div class='add'>+			TP_PROTO( \</div><div class='add'>+				const struct nfs_page *req \</div><div class='add'>+			), \</div><div class='add'>+			TP_ARGS(req))</div><div class='add'>+</div><div class='add'>+DEFINE_NFS_PAGE_EVENT(nfs_writepage_setup);</div><div class='add'>+DEFINE_NFS_PAGE_EVENT(nfs_do_writepage);</div><div class='add'>+</div><div class='ctx'> DECLARE_EVENT_CLASS(nfs_page_error_class,</div><div class='ctx'> 		TP_PROTO(</div><div class='add'>+			const struct inode *inode,</div><div class='ctx'> 			const struct nfs_page *req,</div><div class='ctx'> 			int error</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='del'>-		TP_ARGS(req, error),</div><div class='add'>+		TP_ARGS(inode, req, error),</div><div class='ctx'> </div><div class='ctx'> 		TP_STRUCT__entry(</div><div class='del'>-			__field(const void *, req)</div><div class='del'>-			__field(pgoff_t, index)</div><div class='del'>-			__field(unsigned int, offset)</div><div class='del'>-			__field(unsigned int, pgbase)</div><div class='del'>-			__field(unsigned int, bytes)</div><div class='add'>+			__field(dev_t, dev)</div><div class='add'>+			__field(u32, fhandle)</div><div class='add'>+			__field(u64, fileid)</div><div class='add'>+			__field(loff_t, offset)</div><div class='add'>+			__field(unsigned int, count)</div><div class='ctx'> 			__field(int, error)</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_fast_assign(</div><div class='del'>-			__entry-&gt;req = req;</div><div class='del'>-			__entry-&gt;index = req-&gt;wb_index;</div><div class='del'>-			__entry-&gt;offset = req-&gt;wb_offset;</div><div class='del'>-			__entry-&gt;pgbase = req-&gt;wb_pgbase;</div><div class='del'>-			__entry-&gt;bytes = req-&gt;wb_bytes;</div><div class='add'>+			const struct nfs_inode *nfsi = NFS_I(inode);</div><div class='add'>+			__entry-&gt;dev = inode-&gt;i_sb-&gt;s_dev;</div><div class='add'>+			__entry-&gt;fileid = nfsi-&gt;fileid;</div><div class='add'>+			__entry-&gt;fhandle = nfs_fhandle_hash(&amp;nfsi-&gt;fh);</div><div class='add'>+			__entry-&gt;offset = req_offset(req);</div><div class='add'>+			__entry-&gt;count = req-&gt;wb_bytes;</div><div class='ctx'> 			__entry-&gt;error = error;</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='del'>-			"req=%p index=%lu offset=%u pgbase=%u bytes=%u error=%d",</div><div class='del'>-			__entry-&gt;req, __entry-&gt;index, __entry-&gt;offset,</div><div class='del'>-			__entry-&gt;pgbase, __entry-&gt;bytes, __entry-&gt;error</div><div class='add'>+			"error=%d fileid=%02x:%02x:%llu fhandle=0x%08x "</div><div class='add'>+			"offset=%lld count=%u", __entry-&gt;error,</div><div class='add'>+			MAJOR(__entry-&gt;dev), MINOR(__entry-&gt;dev),</div><div class='add'>+			(unsigned long long)__entry-&gt;fileid,</div><div class='add'>+			__entry-&gt;fhandle, __entry-&gt;offset,</div><div class='add'>+			__entry-&gt;count</div><div class='ctx'> 		)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='ctx'> #define DEFINE_NFS_PAGEERR_EVENT(name) \</div><div class='ctx'> 	DEFINE_EVENT(nfs_page_error_class, name, \</div><div class='ctx'> 			TP_PROTO( \</div><div class='add'>+				const struct inode *inode, \</div><div class='ctx'> 				const struct nfs_page *req, \</div><div class='ctx'> 				int error \</div><div class='ctx'> 			), \</div><div class='del'>-			TP_ARGS(req, error))</div><div class='add'>+			TP_ARGS(inode, req, error))</div><div class='ctx'> </div><div class='ctx'> DEFINE_NFS_PAGEERR_EVENT(nfs_write_error);</div><div class='ctx'> DEFINE_NFS_PAGEERR_EVENT(nfs_comp_error);</div><div class='hunk'>@@ -1330,7 +1633,7 @@ TRACE_EVENT(nfs_commit_done,</div><div class='ctx'> 			__field(u32, fhandle)</div><div class='ctx'> 			__field(u64, fileid)</div><div class='ctx'> 			__field(loff_t, offset)</div><div class='del'>-			__field(int, status)</div><div class='add'>+			__field(int, error)</div><div class='ctx'> 			__field(unsigned long, stable)</div><div class='ctx'> 			__array(char, verifier, NFS4_VERIFIER_SIZE)</div><div class='ctx'> 		),</div><div class='hunk'>@@ -1342,7 +1645,7 @@ TRACE_EVENT(nfs_commit_done,</div><div class='ctx'> 						  data-&gt;args.fh : &amp;nfsi-&gt;fh;</div><div class='ctx'> 			const struct nfs_writeverf *verf = data-&gt;res.verf;</div><div class='ctx'> </div><div class='del'>-			__entry-&gt;status = task-&gt;tk_status;</div><div class='add'>+			__entry-&gt;error = task-&gt;tk_status;</div><div class='ctx'> 			__entry-&gt;offset = data-&gt;args.offset;</div><div class='ctx'> 			__entry-&gt;stable = verf-&gt;committed;</div><div class='ctx'> 			memcpy(__entry-&gt;verifier,</div><div class='hunk'>@@ -1354,17 +1657,151 @@ TRACE_EVENT(nfs_commit_done,</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(</div><div class='del'>-			"fileid=%02x:%02x:%llu fhandle=0x%08x "</div><div class='del'>-			"offset=%lld status=%d stable=%s verifier=%s",</div><div class='add'>+			"error=%d fileid=%02x:%02x:%llu fhandle=0x%08x "</div><div class='add'>+			"offset=%lld stable=%s verifier=%s", __entry-&gt;error,</div><div class='ctx'> 			MAJOR(__entry-&gt;dev), MINOR(__entry-&gt;dev),</div><div class='ctx'> 			(unsigned long long)__entry-&gt;fileid,</div><div class='ctx'> 			__entry-&gt;fhandle,</div><div class='del'>-			(long long)__entry-&gt;offset, __entry-&gt;status,</div><div class='add'>+			(long long)__entry-&gt;offset,</div><div class='ctx'> 			show_nfs_stable_how(__entry-&gt;stable),</div><div class='ctx'> 			show_nfs4_verifier(__entry-&gt;verifier)</div><div class='ctx'> 		)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='add'>+#define nfs_show_direct_req_flags(v) \</div><div class='add'>+	__print_flags(v, "|", \</div><div class='add'>+			{ NFS_ODIRECT_DO_COMMIT, "DO_COMMIT" }, \</div><div class='add'>+			{ NFS_ODIRECT_RESCHED_WRITES, "RESCHED_WRITES" }, \</div><div class='add'>+			{ NFS_ODIRECT_SHOULD_DIRTY, "SHOULD DIRTY" }, \</div><div class='add'>+			{ NFS_ODIRECT_DONE, "DONE" } )</div><div class='add'>+</div><div class='add'>+DECLARE_EVENT_CLASS(nfs_direct_req_class,</div><div class='add'>+		TP_PROTO(</div><div class='add'>+			const struct nfs_direct_req *dreq</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_ARGS(dreq),</div><div class='add'>+</div><div class='add'>+		TP_STRUCT__entry(</div><div class='add'>+			__field(dev_t, dev)</div><div class='add'>+			__field(u64, fileid)</div><div class='add'>+			__field(u32, fhandle)</div><div class='add'>+			__field(loff_t, offset)</div><div class='add'>+			__field(ssize_t, count)</div><div class='add'>+			__field(ssize_t, error)</div><div class='add'>+			__field(int, flags)</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_fast_assign(</div><div class='add'>+			const struct inode *inode = dreq-&gt;inode;</div><div class='add'>+			const struct nfs_inode *nfsi = NFS_I(inode);</div><div class='add'>+			const struct nfs_fh *fh = &amp;nfsi-&gt;fh;</div><div class='add'>+</div><div class='add'>+			__entry-&gt;dev = inode-&gt;i_sb-&gt;s_dev;</div><div class='add'>+			__entry-&gt;fileid = nfsi-&gt;fileid;</div><div class='add'>+			__entry-&gt;fhandle = nfs_fhandle_hash(fh);</div><div class='add'>+			__entry-&gt;offset = dreq-&gt;io_start;</div><div class='add'>+			__entry-&gt;count = dreq-&gt;count;</div><div class='add'>+			__entry-&gt;error = dreq-&gt;error;</div><div class='add'>+			__entry-&gt;flags = dreq-&gt;flags;</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_printk(</div><div class='add'>+			"error=%zd fileid=%02x:%02x:%llu fhandle=0x%08x "</div><div class='add'>+			"offset=%lld count=%zd flags=%s",</div><div class='add'>+			__entry-&gt;error, MAJOR(__entry-&gt;dev),</div><div class='add'>+			MINOR(__entry-&gt;dev),</div><div class='add'>+			(unsigned long long)__entry-&gt;fileid,</div><div class='add'>+			__entry-&gt;fhandle, __entry-&gt;offset,</div><div class='add'>+			__entry-&gt;count,</div><div class='add'>+			nfs_show_direct_req_flags(__entry-&gt;flags)</div><div class='add'>+		)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+#define DEFINE_NFS_DIRECT_REQ_EVENT(name) \</div><div class='add'>+	DEFINE_EVENT(nfs_direct_req_class, name, \</div><div class='add'>+			TP_PROTO( \</div><div class='add'>+				const struct nfs_direct_req *dreq \</div><div class='add'>+			), \</div><div class='add'>+			TP_ARGS(dreq))</div><div class='add'>+</div><div class='add'>+DEFINE_NFS_DIRECT_REQ_EVENT(nfs_direct_commit_complete);</div><div class='add'>+DEFINE_NFS_DIRECT_REQ_EVENT(nfs_direct_resched_write);</div><div class='add'>+DEFINE_NFS_DIRECT_REQ_EVENT(nfs_direct_write_complete);</div><div class='add'>+DEFINE_NFS_DIRECT_REQ_EVENT(nfs_direct_write_completion);</div><div class='add'>+DEFINE_NFS_DIRECT_REQ_EVENT(nfs_direct_write_schedule_iovec);</div><div class='add'>+DEFINE_NFS_DIRECT_REQ_EVENT(nfs_direct_write_reschedule_io);</div><div class='add'>+</div><div class='add'>+#if IS_ENABLED(CONFIG_NFS_LOCALIO)</div><div class='add'>+</div><div class='add'>+DECLARE_EVENT_CLASS(nfs_local_dio_class,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct inode *inode,</div><div class='add'>+		loff_t offset,</div><div class='add'>+		ssize_t count,</div><div class='add'>+		const struct nfs_local_dio *local_dio</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(inode, offset, count, local_dio),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(dev_t, dev)</div><div class='add'>+		__field(u64, fileid)</div><div class='add'>+		__field(u32, fhandle)</div><div class='add'>+		__field(loff_t, offset)</div><div class='add'>+		__field(ssize_t, count)</div><div class='add'>+		__field(u32, mem_align)</div><div class='add'>+		__field(u32, offset_align)</div><div class='add'>+		__field(loff_t, start)</div><div class='add'>+		__field(ssize_t, start_len)</div><div class='add'>+		__field(loff_t, middle)</div><div class='add'>+		__field(ssize_t, middle_len)</div><div class='add'>+		__field(loff_t, end)</div><div class='add'>+		__field(ssize_t, end_len)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		const struct nfs_inode *nfsi = NFS_I(inode);</div><div class='add'>+		const struct nfs_fh *fh = &amp;nfsi-&gt;fh;</div><div class='add'>+</div><div class='add'>+		__entry-&gt;dev = inode-&gt;i_sb-&gt;s_dev;</div><div class='add'>+		__entry-&gt;fileid = nfsi-&gt;fileid;</div><div class='add'>+		__entry-&gt;fhandle = nfs_fhandle_hash(fh);</div><div class='add'>+		__entry-&gt;offset = offset;</div><div class='add'>+		__entry-&gt;count = count;</div><div class='add'>+		__entry-&gt;mem_align = local_dio-&gt;mem_align;</div><div class='add'>+		__entry-&gt;offset_align = local_dio-&gt;offset_align;</div><div class='add'>+		__entry-&gt;start = offset;</div><div class='add'>+		__entry-&gt;start_len = local_dio-&gt;start_len;</div><div class='add'>+		__entry-&gt;middle = local_dio-&gt;middle_offset;</div><div class='add'>+		__entry-&gt;middle_len = local_dio-&gt;middle_len;</div><div class='add'>+		__entry-&gt;end = local_dio-&gt;end_offset;</div><div class='add'>+		__entry-&gt;end_len = local_dio-&gt;end_len;</div><div class='add'>+	),</div><div class='add'>+	TP_printk("fileid=%02x:%02x:%llu fhandle=0x%08x "</div><div class='add'>+		  "offset=%lld count=%zd "</div><div class='add'>+		  "mem_align=%u offset_align=%u "</div><div class='add'>+		  "start=%llu+%zd middle=%llu+%zd end=%llu+%zd",</div><div class='add'>+		  MAJOR(__entry-&gt;dev), MINOR(__entry-&gt;dev),</div><div class='add'>+		  (unsigned long long)__entry-&gt;fileid,</div><div class='add'>+		  __entry-&gt;fhandle, __entry-&gt;offset, __entry-&gt;count,</div><div class='add'>+		  __entry-&gt;mem_align, __entry-&gt;offset_align,</div><div class='add'>+		  __entry-&gt;start, __entry-&gt;start_len,</div><div class='add'>+		  __entry-&gt;middle, __entry-&gt;middle_len,</div><div class='add'>+		  __entry-&gt;end, __entry-&gt;end_len)</div><div class='add'>+)</div><div class='add'>+</div><div class='add'>+#define DEFINE_NFS_LOCAL_DIO_EVENT(name)		\</div><div class='add'>+DEFINE_EVENT(nfs_local_dio_class, nfs_local_dio_##name,	\</div><div class='add'>+	TP_PROTO(const struct inode *inode,		\</div><div class='add'>+		 loff_t offset,				\</div><div class='add'>+		 ssize_t count,				\</div><div class='add'>+		 const struct nfs_local_dio *local_dio),\</div><div class='add'>+	TP_ARGS(inode, offset, count, local_dio))</div><div class='add'>+</div><div class='add'>+DEFINE_NFS_LOCAL_DIO_EVENT(read);</div><div class='add'>+DEFINE_NFS_LOCAL_DIO_EVENT(write);</div><div class='add'>+DEFINE_NFS_LOCAL_DIO_EVENT(misaligned);</div><div class='add'>+</div><div class='add'>+#endif /* CONFIG_NFS_LOCALIO */</div><div class='add'>+</div><div class='ctx'> TRACE_EVENT(nfs_fh_to_dentry,</div><div class='ctx'> 		TP_PROTO(</div><div class='ctx'> 			const struct super_block *sb,</div><div class='hunk'>@@ -1398,6 +1835,94 @@ TRACE_EVENT(nfs_fh_to_dentry,</div><div class='ctx'> 		)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='add'>+TRACE_EVENT(nfs_mount_assign,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const char *option,</div><div class='add'>+		const char *value</div><div class='add'>+	),</div><div class='add'>+</div><div class='add'>+	TP_ARGS(option, value),</div><div class='add'>+</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__string(option, option)</div><div class='add'>+		__string(value, value)</div><div class='add'>+	),</div><div class='add'>+</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__assign_str(option);</div><div class='add'>+		__assign_str(value);</div><div class='add'>+	),</div><div class='add'>+</div><div class='add'>+	TP_printk("option %s=%s",</div><div class='add'>+		__get_str(option), __get_str(value)</div><div class='add'>+	)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+TRACE_EVENT(nfs_mount_option,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct fs_parameter *param</div><div class='add'>+	),</div><div class='add'>+</div><div class='add'>+	TP_ARGS(param),</div><div class='add'>+</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__string(option, param-&gt;key)</div><div class='add'>+	),</div><div class='add'>+</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__assign_str(option);</div><div class='add'>+	),</div><div class='add'>+</div><div class='add'>+	TP_printk("option %s", __get_str(option))</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+TRACE_EVENT(nfs_mount_path,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const char *path</div><div class='add'>+	),</div><div class='add'>+</div><div class='add'>+	TP_ARGS(path),</div><div class='add'>+</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__string(path, path)</div><div class='add'>+	),</div><div class='add'>+</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__assign_str(path);</div><div class='add'>+	),</div><div class='add'>+</div><div class='add'>+	TP_printk("path='%s'", __get_str(path))</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+TRACE_EVENT(nfs_local_open_fh,</div><div class='add'>+		TP_PROTO(</div><div class='add'>+			const struct nfs_fh *fh,</div><div class='add'>+			fmode_t fmode,</div><div class='add'>+			int error</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_ARGS(fh, fmode, error),</div><div class='add'>+</div><div class='add'>+		TP_STRUCT__entry(</div><div class='add'>+			__field(int, error)</div><div class='add'>+			__field(u32, fhandle)</div><div class='add'>+			__field(unsigned int, fmode)</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_fast_assign(</div><div class='add'>+			__entry-&gt;error = error;</div><div class='add'>+			__entry-&gt;fhandle = nfs_fhandle_hash(fh);</div><div class='add'>+			__entry-&gt;fmode = (__force unsigned int)fmode;</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_printk(</div><div class='add'>+			"fhandle=0x%08x mode=%s result=%d",</div><div class='add'>+			__entry-&gt;fhandle,</div><div class='add'>+			show_fs_fmode_flags(__entry-&gt;fmode),</div><div class='add'>+			__entry-&gt;error</div><div class='add'>+		)</div><div class='add'>+);</div><div class='add'>+</div><div class='ctx'> DECLARE_EVENT_CLASS(nfs_xdr_event,</div><div class='ctx'> 		TP_PROTO(</div><div class='ctx'> 			const struct xdr_stream *xdr,</div><div class='hunk'>@@ -1427,9 +1952,8 @@ DECLARE_EVENT_CLASS(nfs_xdr_event,</div><div class='ctx'> 			__entry-&gt;xid = be32_to_cpu(rqstp-&gt;rq_xid);</div><div class='ctx'> 			__entry-&gt;version = task-&gt;tk_client-&gt;cl_vers;</div><div class='ctx'> 			__entry-&gt;error = error;</div><div class='del'>-			__assign_str(program,</div><div class='del'>-				     task-&gt;tk_client-&gt;cl_program-&gt;name);</div><div class='del'>-			__assign_str(procedure, task-&gt;tk_msg.rpc_proc-&gt;p_name);</div><div class='add'>+			__assign_str(program);</div><div class='add'>+			__assign_str(procedure);</div><div class='ctx'> 		),</div><div class='ctx'> </div><div class='ctx'> 		TP_printk(SUNRPC_TRACE_TASK_SPECIFIER</div><div class='head'>diff --git a/fs/nfs/pagelist.c b/fs/nfs/pagelist.c<br/>index ad7f83dc9a2d..6e69ce43a13f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/pagelist.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/pagelist.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/pagelist.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/pagelist.c</a></div><div class='hunk'>@@ -21,16 +21,54 @@</div><div class='ctx'> #include &lt;linux/nfs_page.h&gt;</div><div class='ctx'> #include &lt;linux/nfs_mount.h&gt;</div><div class='ctx'> #include &lt;linux/export.h&gt;</div><div class='add'>+#include &lt;linux/filelock.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "internal.h"</div><div class='ctx'> #include "pnfs.h"</div><div class='ctx'> #include "nfstrace.h"</div><div class='add'>+#include "fscache.h"</div><div class='ctx'> </div><div class='ctx'> #define NFSDBG_FACILITY		NFSDBG_PAGECACHE</div><div class='ctx'> </div><div class='ctx'> static struct kmem_cache *nfs_page_cachep;</div><div class='ctx'> static const struct rpc_call_ops nfs_pgio_common_ops;</div><div class='ctx'> </div><div class='add'>+struct nfs_page_iter_page {</div><div class='add'>+	const struct nfs_page *req;</div><div class='add'>+	size_t count;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static void nfs_page_iter_page_init(struct nfs_page_iter_page *i,</div><div class='add'>+				    const struct nfs_page *req)</div><div class='add'>+{</div><div class='add'>+	i-&gt;req = req;</div><div class='add'>+	i-&gt;count = 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfs_page_iter_page_advance(struct nfs_page_iter_page *i, size_t sz)</div><div class='add'>+{</div><div class='add'>+	const struct nfs_page *req = i-&gt;req;</div><div class='add'>+	size_t tmp = i-&gt;count + sz;</div><div class='add'>+</div><div class='add'>+	i-&gt;count = (tmp &lt; req-&gt;wb_bytes) ? tmp : req-&gt;wb_bytes;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct page *nfs_page_iter_page_get(struct nfs_page_iter_page *i)</div><div class='add'>+{</div><div class='add'>+	const struct nfs_page *req = i-&gt;req;</div><div class='add'>+	struct page *page;</div><div class='add'>+</div><div class='add'>+	if (i-&gt;count != req-&gt;wb_bytes) {</div><div class='add'>+		size_t base = i-&gt;count + req-&gt;wb_pgbase;</div><div class='add'>+		size_t len = PAGE_SIZE - offset_in_page(base);</div><div class='add'>+</div><div class='add'>+		page = nfs_page_to_page(req, base);</div><div class='add'>+		nfs_page_iter_page_advance(i, len);</div><div class='add'>+		return page;</div><div class='add'>+	}</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static struct nfs_pgio_mirror *</div><div class='ctx'> nfs_pgio_get_mirror(struct nfs_pageio_descriptor *desc, u32 idx)</div><div class='ctx'> {</div><div class='hunk'>@@ -68,6 +106,7 @@ void nfs_pgheader_init(struct nfs_pageio_descriptor *desc,</div><div class='ctx'> 	hdr-&gt;good_bytes = mirror-&gt;pg_count;</div><div class='ctx'> 	hdr-&gt;io_completion = desc-&gt;pg_io_completion;</div><div class='ctx'> 	hdr-&gt;dreq = desc-&gt;pg_dreq;</div><div class='add'>+	nfs_netfs_set_pgio_header(hdr, desc);</div><div class='ctx'> 	hdr-&gt;release = release;</div><div class='ctx'> 	hdr-&gt;completion_ops = desc-&gt;pg_completion_ops;</div><div class='ctx'> 	if (hdr-&gt;completion_ops-&gt;init_hdr)</div><div class='hunk'>@@ -90,10 +129,10 @@ void nfs_set_pgio_error(struct nfs_pgio_header *hdr, int error, loff_t pos)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline struct nfs_page *</div><div class='del'>-nfs_page_alloc(void)</div><div class='add'>+static inline struct nfs_page *nfs_page_alloc(void)</div><div class='ctx'> {</div><div class='del'>-	struct nfs_page	*p = kmem_cache_zalloc(nfs_page_cachep, GFP_KERNEL);</div><div class='add'>+	struct nfs_page *p =</div><div class='add'>+		kmem_cache_zalloc(nfs_page_cachep, nfs_io_gfp_mask());</div><div class='ctx'> 	if (p)</div><div class='ctx'> 		INIT_LIST_HEAD(&amp;p-&gt;wb_list);</div><div class='ctx'> 	return p;</div><div class='hunk'>@@ -149,102 +188,6 @@ nfs_async_iocounter_wait(struct rpc_task *task, struct nfs_lock_context *l_ctx)</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_async_iocounter_wait);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * nfs_page_lock_head_request - page lock the head of the page group</div><div class='del'>- * @req: any member of the page group</div><div class='del'>- */</div><div class='del'>-struct nfs_page *</div><div class='del'>-nfs_page_group_lock_head(struct nfs_page *req)</div><div class='del'>-{</div><div class='del'>-	struct nfs_page *head = req-&gt;wb_head;</div><div class='del'>-</div><div class='del'>-	while (!nfs_lock_request(head)) {</div><div class='del'>-		int ret = nfs_wait_on_request(head);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			return ERR_PTR(ret);</div><div class='del'>-	}</div><div class='del'>-	if (head != req)</div><div class='del'>-		kref_get(&amp;head-&gt;wb_kref);</div><div class='del'>-	return head;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * nfs_unroll_locks -  unlock all newly locked reqs and wait on @req</div><div class='del'>- * @head: head request of page group, must be holding head lock</div><div class='del'>- * @req: request that couldn't lock and needs to wait on the req bit lock</div><div class='del'>- *</div><div class='del'>- * This is a helper function for nfs_lock_and_join_requests</div><div class='del'>- * returns 0 on success, &lt; 0 on error.</div><div class='del'>- */</div><div class='del'>-static void</div><div class='del'>-nfs_unroll_locks(struct nfs_page *head, struct nfs_page *req)</div><div class='del'>-{</div><div class='del'>-	struct nfs_page *tmp;</div><div class='del'>-</div><div class='del'>-	/* relinquish all the locks successfully grabbed this run */</div><div class='del'>-	for (tmp = head-&gt;wb_this_page ; tmp != req; tmp = tmp-&gt;wb_this_page) {</div><div class='del'>-		if (!kref_read(&amp;tmp-&gt;wb_kref))</div><div class='del'>-			continue;</div><div class='del'>-		nfs_unlock_and_release_request(tmp);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * nfs_page_group_lock_subreq -  try to lock a subrequest</div><div class='del'>- * @head: head request of page group</div><div class='del'>- * @subreq: request to lock</div><div class='del'>- *</div><div class='del'>- * This is a helper function for nfs_lock_and_join_requests which</div><div class='del'>- * must be called with the head request and page group both locked.</div><div class='del'>- * On error, it returns with the page group unlocked.</div><div class='del'>- */</div><div class='del'>-static int</div><div class='del'>-nfs_page_group_lock_subreq(struct nfs_page *head, struct nfs_page *subreq)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (!kref_get_unless_zero(&amp;subreq-&gt;wb_kref))</div><div class='del'>-		return 0;</div><div class='del'>-	while (!nfs_lock_request(subreq)) {</div><div class='del'>-		nfs_page_group_unlock(head);</div><div class='del'>-		ret = nfs_wait_on_request(subreq);</div><div class='del'>-		if (!ret)</div><div class='del'>-			ret = nfs_page_group_lock(head);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			nfs_unroll_locks(head, subreq);</div><div class='del'>-			nfs_release_request(subreq);</div><div class='del'>-			return ret;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * nfs_page_group_lock_subrequests -  try to lock the subrequests</div><div class='del'>- * @head: head request of page group</div><div class='del'>- *</div><div class='del'>- * This is a helper function for nfs_lock_and_join_requests which</div><div class='del'>- * must be called with the head request locked.</div><div class='del'>- */</div><div class='del'>-int nfs_page_group_lock_subrequests(struct nfs_page *head)</div><div class='del'>-{</div><div class='del'>-	struct nfs_page *subreq;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ret = nfs_page_group_lock(head);</div><div class='del'>-	if (ret &lt; 0)</div><div class='del'>-		return ret;</div><div class='del'>-	/* lock each request in the page group */</div><div class='del'>-	for (subreq = head-&gt;wb_this_page; subreq != head;</div><div class='del'>-			subreq = subreq-&gt;wb_this_page) {</div><div class='del'>-		ret = nfs_page_group_lock_subreq(head, subreq);</div><div class='del'>-		if (ret &lt; 0)</div><div class='del'>-			return ret;</div><div class='del'>-	}</div><div class='del'>-	nfs_page_group_unlock(head);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * nfs_page_set_headlock - set the request PG_HEADLOCK</div><div class='ctx'>  * @req: request that is to be locked</div><div class='ctx'>  *</div><div class='hunk'>@@ -310,13 +253,14 @@ nfs_page_group_unlock(struct nfs_page *req)</div><div class='ctx'> 	nfs_page_clear_headlock(req);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * nfs_page_group_sync_on_bit_locked</div><div class='add'>+/**</div><div class='add'>+ * nfs_page_group_sync_on_bit_locked - Test if all requests have @bit set</div><div class='add'>+ * @req: request in page group</div><div class='add'>+ * @bit: PG_* bit that is used to sync page group</div><div class='ctx'>  *</div><div class='ctx'>  * must be called with page group lock held</div><div class='ctx'>  */</div><div class='del'>-static bool</div><div class='del'>-nfs_page_group_sync_on_bit_locked(struct nfs_page *req, unsigned int bit)</div><div class='add'>+bool nfs_page_group_sync_on_bit_locked(struct nfs_page *req, unsigned int bit)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_page *head = req-&gt;wb_head;</div><div class='ctx'> 	struct nfs_page *tmp;</div><div class='hunk'>@@ -390,7 +334,7 @@ nfs_page_group_init(struct nfs_page *req, struct nfs_page *prev)</div><div class='ctx'> 		 * has extra ref from the write/commit path to handle handoff</div><div class='ctx'> 		 * between write and commit lists. */</div><div class='ctx'> 		if (test_bit(PG_INODE_REF, &amp;prev-&gt;wb_head-&gt;wb_flags)) {</div><div class='del'>-			inode = page_file_mapping(req-&gt;wb_page)-&gt;host;</div><div class='add'>+			inode = nfs_page_to_inode(req);</div><div class='ctx'> 			set_bit(PG_INODE_REF, &amp;req-&gt;wb_flags);</div><div class='ctx'> 			kref_get(&amp;req-&gt;wb_kref);</div><div class='ctx'> 			atomic_long_inc(&amp;NFS_I(inode)-&gt;nrequests);</div><div class='hunk'>@@ -430,10 +374,9 @@ out:</div><div class='ctx'> 		nfs_release_request(head);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct nfs_page *</div><div class='del'>-__nfs_create_request(struct nfs_lock_context *l_ctx, struct page *page,</div><div class='del'>-		   unsigned int pgbase, unsigned int offset,</div><div class='del'>-		   unsigned int count)</div><div class='add'>+static struct nfs_page *nfs_page_create(struct nfs_lock_context *l_ctx,</div><div class='add'>+					unsigned int pgbase, pgoff_t index,</div><div class='add'>+					unsigned int offset, unsigned int count)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_page		*req;</div><div class='ctx'> 	struct nfs_open_context *ctx = l_ctx-&gt;open_context;</div><div class='hunk'>@@ -452,42 +395,90 @@ __nfs_create_request(struct nfs_lock_context *l_ctx, struct page *page,</div><div class='ctx'> 	/* Initialize the request struct. Initially, we assume a</div><div class='ctx'> 	 * long write-back delay. This will be adjusted in</div><div class='ctx'> 	 * update_nfs_request below if the region is not locked. */</div><div class='del'>-	req-&gt;wb_page    = page;</div><div class='del'>-	if (page) {</div><div class='del'>-		req-&gt;wb_index = page_index(page);</div><div class='del'>-		get_page(page);</div><div class='del'>-	}</div><div class='del'>-	req-&gt;wb_offset  = offset;</div><div class='del'>-	req-&gt;wb_pgbase	= pgbase;</div><div class='del'>-	req-&gt;wb_bytes   = count;</div><div class='add'>+	req-&gt;wb_pgbase = pgbase;</div><div class='add'>+	req-&gt;wb_index = index;</div><div class='add'>+	req-&gt;wb_offset = offset;</div><div class='add'>+	req-&gt;wb_bytes = count;</div><div class='ctx'> 	kref_init(&amp;req-&gt;wb_kref);</div><div class='ctx'> 	req-&gt;wb_nio = 0;</div><div class='ctx'> 	return req;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void nfs_page_assign_folio(struct nfs_page *req, struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	if (folio != NULL) {</div><div class='add'>+		req-&gt;wb_folio = folio;</div><div class='add'>+		folio_get(folio);</div><div class='add'>+		set_bit(PG_FOLIO, &amp;req-&gt;wb_flags);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfs_page_assign_page(struct nfs_page *req, struct page *page)</div><div class='add'>+{</div><div class='add'>+	if (page != NULL) {</div><div class='add'>+		req-&gt;wb_page = page;</div><div class='add'>+		get_page(page);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /**</div><div class='del'>- * nfs_create_request - Create an NFS read/write request.</div><div class='add'>+ * nfs_page_create_from_page - Create an NFS read/write request.</div><div class='ctx'>  * @ctx: open context to use</div><div class='ctx'>  * @page: page to write</div><div class='del'>- * @offset: starting offset within the page for the write</div><div class='add'>+ * @pgbase: starting offset within the page for the write</div><div class='add'>+ * @offset: file offset for the write</div><div class='ctx'>  * @count: number of bytes to read/write</div><div class='ctx'>  *</div><div class='ctx'>  * The page must be locked by the caller. This makes sure we never</div><div class='ctx'>  * create two different requests for the same page.</div><div class='ctx'>  * User should ensure it is safe to sleep in this function.</div><div class='ctx'>  */</div><div class='del'>-struct nfs_page *</div><div class='del'>-nfs_create_request(struct nfs_open_context *ctx, struct page *page,</div><div class='del'>-		   unsigned int offset, unsigned int count)</div><div class='add'>+struct nfs_page *nfs_page_create_from_page(struct nfs_open_context *ctx,</div><div class='add'>+					   struct page *page,</div><div class='add'>+					   unsigned int pgbase, loff_t offset,</div><div class='add'>+					   unsigned int count)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_lock_context *l_ctx = nfs_get_lock_context(ctx);</div><div class='ctx'> 	struct nfs_page *ret;</div><div class='ctx'> </div><div class='ctx'> 	if (IS_ERR(l_ctx))</div><div class='ctx'> 		return ERR_CAST(l_ctx);</div><div class='del'>-	ret = __nfs_create_request(l_ctx, page, offset, offset, count);</div><div class='del'>-	if (!IS_ERR(ret))</div><div class='add'>+	ret = nfs_page_create(l_ctx, pgbase, offset &gt;&gt; PAGE_SHIFT,</div><div class='add'>+			      offset_in_page(offset), count);</div><div class='add'>+	if (!IS_ERR(ret)) {</div><div class='add'>+		nfs_page_assign_page(ret, page);</div><div class='ctx'> 		nfs_page_group_init(ret, NULL);</div><div class='add'>+	}</div><div class='add'>+	nfs_put_lock_context(l_ctx);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * nfs_page_create_from_folio - Create an NFS read/write request.</div><div class='add'>+ * @ctx: open context to use</div><div class='add'>+ * @folio: folio to write</div><div class='add'>+ * @offset: starting offset within the folio for the write</div><div class='add'>+ * @count: number of bytes to read/write</div><div class='add'>+ *</div><div class='add'>+ * The page must be locked by the caller. This makes sure we never</div><div class='add'>+ * create two different requests for the same page.</div><div class='add'>+ * User should ensure it is safe to sleep in this function.</div><div class='add'>+ */</div><div class='add'>+struct nfs_page *nfs_page_create_from_folio(struct nfs_open_context *ctx,</div><div class='add'>+					    struct folio *folio,</div><div class='add'>+					    unsigned int offset,</div><div class='add'>+					    unsigned int count)</div><div class='add'>+{</div><div class='add'>+	struct nfs_lock_context *l_ctx = nfs_get_lock_context(ctx);</div><div class='add'>+	struct nfs_page *ret;</div><div class='add'>+</div><div class='add'>+	if (IS_ERR(l_ctx))</div><div class='add'>+		return ERR_CAST(l_ctx);</div><div class='add'>+	ret = nfs_page_create(l_ctx, offset, folio-&gt;index, offset, count);</div><div class='add'>+	if (!IS_ERR(ret)) {</div><div class='add'>+		nfs_page_assign_folio(ret, folio);</div><div class='add'>+		nfs_page_group_init(ret, NULL);</div><div class='add'>+	}</div><div class='ctx'> 	nfs_put_lock_context(l_ctx);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -500,10 +491,16 @@ nfs_create_subreq(struct nfs_page *req,</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_page *last;</div><div class='ctx'> 	struct nfs_page *ret;</div><div class='add'>+	struct folio *folio = nfs_page_to_folio(req);</div><div class='add'>+	struct page *page = nfs_page_to_page(req, pgbase);</div><div class='ctx'> </div><div class='del'>-	ret = __nfs_create_request(req-&gt;wb_lock_context, req-&gt;wb_page,</div><div class='del'>-			pgbase, offset, count);</div><div class='add'>+	ret = nfs_page_create(req-&gt;wb_lock_context, pgbase, req-&gt;wb_index,</div><div class='add'>+			      offset, count);</div><div class='ctx'> 	if (!IS_ERR(ret)) {</div><div class='add'>+		if (folio)</div><div class='add'>+			nfs_page_assign_folio(ret, folio);</div><div class='add'>+		else</div><div class='add'>+			nfs_page_assign_page(ret, page);</div><div class='ctx'> 		/* find the last request */</div><div class='ctx'> 		for (last = req-&gt;wb_head;</div><div class='ctx'> 		     last-&gt;wb_this_page != req-&gt;wb_head;</div><div class='hunk'>@@ -511,7 +508,6 @@ nfs_create_subreq(struct nfs_page *req,</div><div class='ctx'> 			;</div><div class='ctx'> </div><div class='ctx'> 		nfs_lock_request(ret);</div><div class='del'>-		ret-&gt;wb_index = req-&gt;wb_index;</div><div class='ctx'> 		nfs_page_group_init(ret, last);</div><div class='ctx'> 		ret-&gt;wb_nio = req-&gt;wb_nio;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -550,11 +546,16 @@ void nfs_unlock_and_release_request(struct nfs_page *req)</div><div class='ctx'>  */</div><div class='ctx'> static void nfs_clear_request(struct nfs_page *req)</div><div class='ctx'> {</div><div class='add'>+	struct folio *folio = nfs_page_to_folio(req);</div><div class='ctx'> 	struct page *page = req-&gt;wb_page;</div><div class='ctx'> 	struct nfs_lock_context *l_ctx = req-&gt;wb_lock_context;</div><div class='ctx'> 	struct nfs_open_context *ctx;</div><div class='ctx'> </div><div class='del'>-	if (page != NULL) {</div><div class='add'>+	if (folio != NULL) {</div><div class='add'>+		folio_put(folio);</div><div class='add'>+		req-&gt;wb_folio = NULL;</div><div class='add'>+		clear_bit(PG_FOLIO, &amp;req-&gt;wb_flags);</div><div class='add'>+	} else if (page != NULL) {</div><div class='ctx'> 		put_page(page);</div><div class='ctx'> 		req-&gt;wb_page = NULL;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -598,25 +599,6 @@ void nfs_release_request(struct nfs_page *req)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_release_request);</div><div class='ctx'> </div><div class='del'>-/**</div><div class='del'>- * nfs_wait_on_request - Wait for a request to complete.</div><div class='del'>- * @req: request to wait upon.</div><div class='del'>- *</div><div class='del'>- * Interruptible by fatal signals only.</div><div class='del'>- * The user is responsible for holding a count on the request.</div><div class='del'>- */</div><div class='del'>-int</div><div class='del'>-nfs_wait_on_request(struct nfs_page *req)</div><div class='del'>-{</div><div class='del'>-	if (!test_bit(PG_BUSY, &amp;req-&gt;wb_flags))</div><div class='del'>-		return 0;</div><div class='del'>-	set_bit(PG_CONTENDED2, &amp;req-&gt;wb_flags);</div><div class='del'>-	smp_mb__after_atomic();</div><div class='del'>-	return wait_on_bit_io(&amp;req-&gt;wb_flags, PG_BUSY,</div><div class='del'>-			      TASK_UNINTERRUPTIBLE);</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL_GPL(nfs_wait_on_request);</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * nfs_generic_pg_test - determine if requests can be coalesced</div><div class='ctx'>  * @desc: pointer to descriptor</div><div class='hunk'>@@ -692,13 +674,14 @@ EXPORT_SYMBOL_GPL(nfs_pgio_header_free);</div><div class='ctx'> /**</div><div class='ctx'>  * nfs_pgio_rpcsetup - Set up arguments for a pageio call</div><div class='ctx'>  * @hdr: The pageio hdr</div><div class='add'>+ * @pgbase: base</div><div class='ctx'>  * @count: Number of bytes to read</div><div class='ctx'>  * @how: How to commit data (writes only)</div><div class='ctx'>  * @cinfo: Commit information for the call (writes only)</div><div class='ctx'>  */</div><div class='del'>-static void nfs_pgio_rpcsetup(struct nfs_pgio_header *hdr,</div><div class='del'>-			      unsigned int count,</div><div class='del'>-			      int how, struct nfs_commit_info *cinfo)</div><div class='add'>+static void nfs_pgio_rpcsetup(struct nfs_pgio_header *hdr, unsigned int pgbase,</div><div class='add'>+			      unsigned int count, int how,</div><div class='add'>+			      struct nfs_commit_info *cinfo)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_page *req = hdr-&gt;req;</div><div class='ctx'> </div><div class='hunk'>@@ -709,7 +692,7 @@ static void nfs_pgio_rpcsetup(struct nfs_pgio_header *hdr,</div><div class='ctx'> 	hdr-&gt;args.offset = req_offset(req);</div><div class='ctx'> 	/* pnfs_set_layoutcommit needs this */</div><div class='ctx'> 	hdr-&gt;mds_offset = hdr-&gt;args.offset;</div><div class='del'>-	hdr-&gt;args.pgbase = req-&gt;wb_pgbase;</div><div class='add'>+	hdr-&gt;args.pgbase = pgbase;</div><div class='ctx'> 	hdr-&gt;args.pages  = hdr-&gt;page_array.pagevec;</div><div class='ctx'> 	hdr-&gt;args.count  = count;</div><div class='ctx'> 	hdr-&gt;args.context = get_nfs_open_context(nfs_req_openctx(req));</div><div class='hunk'>@@ -749,7 +732,8 @@ static void nfs_pgio_prepare(struct rpc_task *task, void *calldata)</div><div class='ctx'> </div><div class='ctx'> int nfs_initiate_pgio(struct rpc_clnt *clnt, struct nfs_pgio_header *hdr,</div><div class='ctx'> 		      const struct cred *cred, const struct nfs_rpc_ops *rpc_ops,</div><div class='del'>-		      const struct rpc_call_ops *call_ops, int how, int flags)</div><div class='add'>+		      const struct rpc_call_ops *call_ops, int how, int flags,</div><div class='add'>+		      struct nfsd_file *localio)</div><div class='ctx'> {</div><div class='ctx'> 	struct rpc_task *task;</div><div class='ctx'> 	struct rpc_message msg = {</div><div class='hunk'>@@ -767,6 +751,9 @@ int nfs_initiate_pgio(struct rpc_clnt *clnt, struct nfs_pgio_header *hdr,</div><div class='ctx'> 		.flags = RPC_TASK_ASYNC | flags,</div><div class='ctx'> 	};</div><div class='ctx'> </div><div class='add'>+	if (nfs_server_capable(hdr-&gt;inode, NFS_CAP_MOVEABLE))</div><div class='add'>+		task_setup_data.flags |= RPC_TASK_MOVEABLE;</div><div class='add'>+</div><div class='ctx'> 	hdr-&gt;rw_ops-&gt;rw_initiate(hdr, &amp;msg, rpc_ops, &amp;task_setup_data, how);</div><div class='ctx'> </div><div class='ctx'> 	dprintk("NFS: initiated pgio call "</div><div class='hunk'>@@ -776,6 +763,10 @@ int nfs_initiate_pgio(struct rpc_clnt *clnt, struct nfs_pgio_header *hdr,</div><div class='ctx'> 		hdr-&gt;args.count,</div><div class='ctx'> 		(unsigned long long)hdr-&gt;args.offset);</div><div class='ctx'> </div><div class='add'>+	if (localio)</div><div class='add'>+		return nfs_local_doio(NFS_SERVER(hdr-&gt;inode)-&gt;nfs_client,</div><div class='add'>+				      localio, hdr, call_ops);</div><div class='add'>+</div><div class='ctx'> 	task = rpc_run_task(&amp;task_setup_data);</div><div class='ctx'> 	if (IS_ERR(task))</div><div class='ctx'> 		return PTR_ERR(task);</div><div class='hunk'>@@ -843,6 +834,7 @@ void nfs_pageio_init(struct nfs_pageio_descriptor *desc,</div><div class='ctx'> 	desc-&gt;pg_lseg = NULL;</div><div class='ctx'> 	desc-&gt;pg_io_completion = NULL;</div><div class='ctx'> 	desc-&gt;pg_dreq = NULL;</div><div class='add'>+	nfs_netfs_reset_pageio_descriptor(desc);</div><div class='ctx'> 	desc-&gt;pg_bsize = bsize;</div><div class='ctx'> </div><div class='ctx'> 	desc-&gt;pg_mirror_count = 1;</div><div class='hunk'>@@ -892,9 +884,10 @@ int nfs_generic_pgio(struct nfs_pageio_descriptor *desc,</div><div class='ctx'> 	struct nfs_commit_info cinfo;</div><div class='ctx'> 	struct nfs_page_array *pg_array = &amp;hdr-&gt;page_array;</div><div class='ctx'> 	unsigned int pagecount, pageused;</div><div class='del'>-	gfp_t gfp_flags = GFP_KERNEL;</div><div class='add'>+	unsigned int pg_base = offset_in_page(mirror-&gt;pg_base);</div><div class='add'>+	gfp_t gfp_flags = nfs_io_gfp_mask();</div><div class='ctx'> </div><div class='del'>-	pagecount = nfs_page_array_len(mirror-&gt;pg_base, mirror-&gt;pg_count);</div><div class='add'>+	pagecount = nfs_page_array_len(pg_base, mirror-&gt;pg_count);</div><div class='ctx'> 	pg_array-&gt;npages = pagecount;</div><div class='ctx'> </div><div class='ctx'> 	if (pagecount &lt;= ARRAY_SIZE(pg_array-&gt;page_array))</div><div class='hunk'>@@ -914,16 +907,26 @@ int nfs_generic_pgio(struct nfs_pageio_descriptor *desc,</div><div class='ctx'> 	last_page = NULL;</div><div class='ctx'> 	pageused = 0;</div><div class='ctx'> 	while (!list_empty(head)) {</div><div class='add'>+		struct nfs_page_iter_page i;</div><div class='add'>+		struct page *page;</div><div class='add'>+</div><div class='ctx'> 		req = nfs_list_entry(head-&gt;next);</div><div class='ctx'> 		nfs_list_move_request(req, &amp;hdr-&gt;pages);</div><div class='ctx'> </div><div class='del'>-		if (!last_page || last_page != req-&gt;wb_page) {</div><div class='del'>-			pageused++;</div><div class='del'>-			if (pageused &gt; pagecount)</div><div class='del'>-				break;</div><div class='del'>-			*pages++ = last_page = req-&gt;wb_page;</div><div class='add'>+		if (req-&gt;wb_pgbase == 0)</div><div class='add'>+			last_page = NULL;</div><div class='add'>+</div><div class='add'>+		nfs_page_iter_page_init(&amp;i, req);</div><div class='add'>+		while ((page = nfs_page_iter_page_get(&amp;i)) != NULL) {</div><div class='add'>+			if (last_page != page) {</div><div class='add'>+				pageused++;</div><div class='add'>+				if (pageused &gt; pagecount)</div><div class='add'>+					goto full;</div><div class='add'>+				*pages++ = last_page = page;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='add'>+full:</div><div class='ctx'> 	if (WARN_ON_ONCE(pageused != pagecount)) {</div><div class='ctx'> 		nfs_pgio_error(hdr);</div><div class='ctx'> 		desc-&gt;pg_error = -EINVAL;</div><div class='hunk'>@@ -935,7 +938,8 @@ int nfs_generic_pgio(struct nfs_pageio_descriptor *desc,</div><div class='ctx'> 		desc-&gt;pg_ioflags &amp;= ~FLUSH_COND_STABLE;</div><div class='ctx'> </div><div class='ctx'> 	/* Set up the argument struct */</div><div class='del'>-	nfs_pgio_rpcsetup(hdr, mirror-&gt;pg_count, desc-&gt;pg_ioflags, &amp;cinfo);</div><div class='add'>+	nfs_pgio_rpcsetup(hdr, pg_base, mirror-&gt;pg_count, desc-&gt;pg_ioflags,</div><div class='add'>+			  &amp;cinfo);</div><div class='ctx'> 	desc-&gt;pg_rpc_callops = &amp;nfs_pgio_common_ops;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -955,6 +959,13 @@ static int nfs_generic_pg_pgios(struct nfs_pageio_descriptor *desc)</div><div class='ctx'> 	nfs_pgheader_init(desc, hdr, nfs_pgio_header_free);</div><div class='ctx'> 	ret = nfs_generic_pgio(desc, hdr);</div><div class='ctx'> 	if (ret == 0) {</div><div class='add'>+		struct nfs_client *clp = NFS_SERVER(hdr-&gt;inode)-&gt;nfs_client;</div><div class='add'>+</div><div class='add'>+		struct nfsd_file *localio =</div><div class='add'>+			nfs_local_open_fh(clp, hdr-&gt;cred, hdr-&gt;args.fh,</div><div class='add'>+					  &amp;hdr-&gt;args.context-&gt;nfl,</div><div class='add'>+					  hdr-&gt;args.context-&gt;mode);</div><div class='add'>+</div><div class='ctx'> 		if (NFS_SERVER(hdr-&gt;inode)-&gt;nfs_client-&gt;cl_minorversion)</div><div class='ctx'> 			task_flags = RPC_TASK_MOVEABLE;</div><div class='ctx'> 		ret = nfs_initiate_pgio(NFS_CLIENT(hdr-&gt;inode),</div><div class='hunk'>@@ -963,7 +974,8 @@ static int nfs_generic_pg_pgios(struct nfs_pageio_descriptor *desc)</div><div class='ctx'> 					NFS_PROTO(hdr-&gt;inode),</div><div class='ctx'> 					desc-&gt;pg_rpc_callops,</div><div class='ctx'> 					desc-&gt;pg_ioflags,</div><div class='del'>-					RPC_TASK_CRED_NOREF | task_flags);</div><div class='add'>+					RPC_TASK_CRED_NOREF | task_flags,</div><div class='add'>+					localio);</div><div class='ctx'> 	}</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -979,7 +991,7 @@ nfs_pageio_alloc_mirrors(struct nfs_pageio_descriptor *desc,</div><div class='ctx'> 	desc-&gt;pg_mirrors_dynamic = NULL;</div><div class='ctx'> 	if (mirror_count == 1)</div><div class='ctx'> 		return desc-&gt;pg_mirrors_static;</div><div class='del'>-	ret = kmalloc_array(mirror_count, sizeof(*ret), GFP_KERNEL);</div><div class='add'>+	ret = kmalloc_array(mirror_count, sizeof(*ret), nfs_io_gfp_mask());</div><div class='ctx'> 	if (ret != NULL) {</div><div class='ctx'> 		for (i = 0; i &lt; mirror_count; i++)</div><div class='ctx'> 			nfs_pageio_mirror_init(&amp;ret[i], desc-&gt;pg_bsize);</div><div class='hunk'>@@ -1031,6 +1043,24 @@ static bool nfs_match_lock_context(const struct nfs_lock_context *l1,</div><div class='ctx'> 	return l1-&gt;lockowner == l2-&gt;lockowner;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool nfs_page_is_contiguous(const struct nfs_page *prev,</div><div class='add'>+				   const struct nfs_page *req)</div><div class='add'>+{</div><div class='add'>+	size_t prev_end = prev-&gt;wb_pgbase + prev-&gt;wb_bytes;</div><div class='add'>+</div><div class='add'>+	if (req_offset(req) != req_offset(prev) + prev-&gt;wb_bytes)</div><div class='add'>+		return false;</div><div class='add'>+	if (req-&gt;wb_pgbase == 0)</div><div class='add'>+		return prev_end == nfs_page_max_length(prev);</div><div class='add'>+	if (req-&gt;wb_pgbase == prev_end) {</div><div class='add'>+		struct folio *folio = nfs_page_to_folio(req);</div><div class='add'>+		if (folio)</div><div class='add'>+			return folio == nfs_page_to_folio(prev);</div><div class='add'>+		return req-&gt;wb_page == prev-&gt;wb_page;</div><div class='add'>+	}</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /**</div><div class='ctx'>  * nfs_coalesce_size - test two requests for compatibility</div><div class='ctx'>  * @prev: pointer to nfs_page</div><div class='hunk'>@@ -1052,23 +1082,15 @@ static unsigned int nfs_coalesce_size(struct nfs_page *prev,</div><div class='ctx'> 	if (prev) {</div><div class='ctx'> 		if (!nfs_match_open_context(nfs_req_openctx(req), nfs_req_openctx(prev)))</div><div class='ctx'> 			return 0;</div><div class='del'>-		flctx = d_inode(nfs_req_openctx(req)-&gt;dentry)-&gt;i_flctx;</div><div class='add'>+		flctx = locks_inode_context(d_inode(nfs_req_openctx(req)-&gt;dentry));</div><div class='ctx'> 		if (flctx != NULL &amp;&amp;</div><div class='ctx'> 		    !(list_empty_careful(&amp;flctx-&gt;flc_posix) &amp;&amp;</div><div class='ctx'> 		      list_empty_careful(&amp;flctx-&gt;flc_flock)) &amp;&amp;</div><div class='ctx'> 		    !nfs_match_lock_context(req-&gt;wb_lock_context,</div><div class='ctx'> 					    prev-&gt;wb_lock_context))</div><div class='ctx'> 			return 0;</div><div class='del'>-		if (req_offset(req) != req_offset(prev) + prev-&gt;wb_bytes)</div><div class='add'>+		if (!nfs_page_is_contiguous(prev, req))</div><div class='ctx'> 			return 0;</div><div class='del'>-		if (req-&gt;wb_page == prev-&gt;wb_page) {</div><div class='del'>-			if (req-&gt;wb_pgbase != prev-&gt;wb_pgbase + prev-&gt;wb_bytes)</div><div class='del'>-				return 0;</div><div class='del'>-		} else {</div><div class='del'>-			if (req-&gt;wb_pgbase != 0 ||</div><div class='del'>-			    prev-&gt;wb_pgbase + prev-&gt;wb_bytes != PAGE_SIZE)</div><div class='del'>-				return 0;</div><div class='del'>-		}</div><div class='ctx'> 	}</div><div class='ctx'> 	return pgio-&gt;pg_ops-&gt;pg_test(pgio, prev, req);</div><div class='ctx'> }</div><div class='hunk'>@@ -1218,6 +1240,7 @@ static int nfs_do_recoalesce(struct nfs_pageio_descriptor *desc)</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='ctx'> 		list_splice_init(&amp;mirror-&gt;pg_list, &amp;head);</div><div class='add'>+		mirror-&gt;pg_recoalesce = 0;</div><div class='ctx'> </div><div class='ctx'> 		while (!list_empty(&amp;head)) {</div><div class='ctx'> 			struct nfs_page *req;</div><div class='hunk'>@@ -1356,6 +1379,7 @@ int nfs_pageio_resend(struct nfs_pageio_descriptor *desc,</div><div class='ctx'> </div><div class='ctx'> 	desc-&gt;pg_io_completion = hdr-&gt;io_completion;</div><div class='ctx'> 	desc-&gt;pg_dreq = hdr-&gt;dreq;</div><div class='add'>+	nfs_netfs_set_pageio_descriptor(desc, hdr);</div><div class='ctx'> 	list_splice_init(&amp;hdr-&gt;pages, &amp;pages);</div><div class='ctx'> 	while (!list_empty(&amp;pages)) {</div><div class='ctx'> 		struct nfs_page *req = nfs_list_entry(pages.next);</div><div class='hunk'>@@ -1407,16 +1431,26 @@ void nfs_pageio_cond_complete(struct nfs_pageio_descriptor *desc, pgoff_t index)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_pgio_mirror *mirror;</div><div class='ctx'> 	struct nfs_page *prev;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	u32 midx;</div><div class='ctx'> </div><div class='ctx'> 	for (midx = 0; midx &lt; desc-&gt;pg_mirror_count; midx++) {</div><div class='ctx'> 		mirror = nfs_pgio_get_mirror(desc, midx);</div><div class='ctx'> 		if (!list_empty(&amp;mirror-&gt;pg_list)) {</div><div class='ctx'> 			prev = nfs_list_entry(mirror-&gt;pg_list.prev);</div><div class='del'>-			if (index != prev-&gt;wb_index + 1) {</div><div class='del'>-				nfs_pageio_complete(desc);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='add'>+			folio = nfs_page_to_folio(prev);</div><div class='add'>+			if (folio) {</div><div class='add'>+				if (index == folio_next_index(folio))</div><div class='add'>+					continue;</div><div class='add'>+			} else if (index == prev-&gt;wb_index + 1)</div><div class='add'>+				continue;</div><div class='add'>+			/*</div><div class='add'>+			 * We will submit more requests after these. Indicate</div><div class='add'>+			 * this to the underlying layers.</div><div class='add'>+			 */</div><div class='add'>+			desc-&gt;pg_moreio = 1;</div><div class='add'>+			nfs_pageio_complete(desc);</div><div class='add'>+			break;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/nfs/pnfs.c b/fs/nfs/pnfs.c<br/>index 7c9090a28e5c..f157d43d1312 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/pnfs.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/pnfs.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/pnfs.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/pnfs.c</a></div><div class='hunk'>@@ -61,6 +61,7 @@ static void pnfs_free_returned_lsegs(struct pnfs_layout_hdr *lo,</div><div class='ctx'> 		u32 seq);</div><div class='ctx'> static bool pnfs_lseg_dec_and_remove_zero(struct pnfs_layout_segment *lseg,</div><div class='ctx'> 		                struct list_head *tmp_list);</div><div class='add'>+static int pnfs_layout_return_on_reboot(struct pnfs_layout_hdr *lo);</div><div class='ctx'> </div><div class='ctx'> /* Return the registered pnfs layout driver module matching given id */</div><div class='ctx'> static struct pnfs_layoutdriver_type *</div><div class='hunk'>@@ -92,6 +93,17 @@ find_pnfs_driver(u32 id)</div><div class='ctx'> 	return local;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+const struct pnfs_layoutdriver_type *pnfs_find_layoutdriver(u32 id)</div><div class='add'>+{</div><div class='add'>+	return find_pnfs_driver(id);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void pnfs_put_layoutdriver(const struct pnfs_layoutdriver_type *ld)</div><div class='add'>+{</div><div class='add'>+	if (ld)</div><div class='add'>+		module_put(ld-&gt;owner);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> void</div><div class='ctx'> unset_pnfs_layoutdriver(struct nfs_server *nfss)</div><div class='ctx'> {</div><div class='hunk'>@@ -294,7 +306,6 @@ void</div><div class='ctx'> pnfs_put_layout_hdr(struct pnfs_layout_hdr *lo)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode;</div><div class='del'>-	unsigned long i_state;</div><div class='ctx'> </div><div class='ctx'> 	if (!lo)</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -305,12 +316,11 @@ pnfs_put_layout_hdr(struct pnfs_layout_hdr *lo)</div><div class='ctx'> 		if (!list_empty(&amp;lo-&gt;plh_segs))</div><div class='ctx'> 			WARN_ONCE(1, "NFS: BUG unfreed layout segments.\n");</div><div class='ctx'> 		pnfs_detach_layout_hdr(lo);</div><div class='del'>-		i_state = inode-&gt;i_state;</div><div class='add'>+		/* Notify pnfs_destroy_layout_final() that we're done */</div><div class='add'>+		if (inode_state_read(inode) &amp; (I_FREEING | I_CLEAR))</div><div class='add'>+			wake_up_var_locked(lo, &amp;inode-&gt;i_lock);</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 		pnfs_free_layout_hdr(lo);</div><div class='del'>-		/* Notify pnfs_destroy_layout_final() that we're done */</div><div class='del'>-		if (i_state &amp; (I_FREEING | I_CLEAR))</div><div class='del'>-			wake_up_var(lo);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -458,12 +468,25 @@ pnfs_mark_layout_stateid_invalid(struct pnfs_layout_hdr *lo,</div><div class='ctx'> 		pnfs_clear_lseg_state(lseg, lseg_list);</div><div class='ctx'> 	pnfs_clear_layoutreturn_info(lo);</div><div class='ctx'> 	pnfs_free_returned_lsegs(lo, lseg_list, &amp;range, 0);</div><div class='add'>+	set_bit(NFS_LAYOUT_DRAIN, &amp;lo-&gt;plh_flags);</div><div class='ctx'> 	if (test_bit(NFS_LAYOUT_RETURN, &amp;lo-&gt;plh_flags) &amp;&amp;</div><div class='ctx'> 	    !test_and_set_bit(NFS_LAYOUT_RETURN_LOCK, &amp;lo-&gt;plh_flags))</div><div class='ctx'> 		pnfs_clear_layoutreturn_waitbit(lo);</div><div class='ctx'> 	return !list_empty(&amp;lo-&gt;plh_segs);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int pnfs_mark_layout_stateid_return(struct pnfs_layout_hdr *lo,</div><div class='add'>+					   struct list_head *lseg_list,</div><div class='add'>+					   enum pnfs_iomode iomode, u32 seq)</div><div class='add'>+{</div><div class='add'>+	struct pnfs_layout_range range = {</div><div class='add'>+		.iomode = iomode,</div><div class='add'>+		.length = NFS4_MAX_UINT64,</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+	return pnfs_mark_matching_lsegs_return(lo, lseg_list, &amp;range, seq);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int</div><div class='ctx'> pnfs_iomode_to_fail_bit(u32 iomode)</div><div class='ctx'> {</div><div class='hunk'>@@ -499,7 +522,7 @@ pnfs_layout_io_set_failed(struct pnfs_layout_hdr *lo, u32 iomode)</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	pnfs_layout_set_fail_bit(lo, pnfs_iomode_to_fail_bit(iomode));</div><div class='del'>-	pnfs_mark_matching_lsegs_invalid(lo, &amp;head, &amp;range, 0);</div><div class='add'>+	pnfs_mark_matching_lsegs_return(lo, &amp;head, &amp;range, 0);</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	pnfs_free_lseg_list(&amp;head);</div><div class='ctx'> 	dprintk("%s Setting layout IOMODE_%s fail bit\n", __func__,</div><div class='hunk'>@@ -698,6 +721,7 @@ pnfs_mark_matching_lsegs_invalid(struct pnfs_layout_hdr *lo,</div><div class='ctx'> 			    u32 seq)</div><div class='ctx'> {</div><div class='ctx'> 	struct pnfs_layout_segment *lseg, *next;</div><div class='add'>+	struct nfs_server *server = NFS_SERVER(lo-&gt;plh_inode);</div><div class='ctx'> 	int remaining = 0;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("%s:Begin lo %p\n", __func__, lo);</div><div class='hunk'>@@ -710,13 +734,23 @@ pnfs_mark_matching_lsegs_invalid(struct pnfs_layout_hdr *lo,</div><div class='ctx'> 				"offset %llu length %llu\n", __func__,</div><div class='ctx'> 				lseg, lseg-&gt;pls_range.iomode, lseg-&gt;pls_seq,</div><div class='ctx'> 				lseg-&gt;pls_range.offset, lseg-&gt;pls_range.length);</div><div class='del'>-			if (!mark_lseg_invalid(lseg, tmp_list))</div><div class='del'>-				remaining++;</div><div class='add'>+			if (mark_lseg_invalid(lseg, tmp_list))</div><div class='add'>+				continue;</div><div class='add'>+			remaining++;</div><div class='add'>+			pnfs_lseg_cancel_io(server, lseg);</div><div class='ctx'> 		}</div><div class='ctx'> 	dprintk("%s:Return %i\n", __func__, remaining);</div><div class='ctx'> 	return remaining;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void pnfs_reset_return_info(struct pnfs_layout_hdr *lo)</div><div class='add'>+{</div><div class='add'>+	struct pnfs_layout_segment *lseg;</div><div class='add'>+</div><div class='add'>+	list_for_each_entry(lseg, &amp;lo-&gt;plh_return_segs, pls_list)</div><div class='add'>+		pnfs_set_plh_return_info(lo, lseg-&gt;pls_range.iomode, 0);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void</div><div class='ctx'> pnfs_free_returned_lsegs(struct pnfs_layout_hdr *lo,</div><div class='ctx'> 		struct list_head *free_me,</div><div class='hunk'>@@ -773,23 +807,17 @@ void pnfs_destroy_layout(struct nfs_inode *nfsi)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(pnfs_destroy_layout);</div><div class='ctx'> </div><div class='del'>-static bool pnfs_layout_removed(struct nfs_inode *nfsi,</div><div class='del'>-				struct pnfs_layout_hdr *lo)</div><div class='del'>-{</div><div class='del'>-	bool ret;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;nfsi-&gt;vfs_inode.i_lock);</div><div class='del'>-	ret = nfsi-&gt;layout != lo;</div><div class='del'>-	spin_unlock(&amp;nfsi-&gt;vfs_inode.i_lock);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> void pnfs_destroy_layout_final(struct nfs_inode *nfsi)</div><div class='ctx'> {</div><div class='ctx'> 	struct pnfs_layout_hdr *lo = __pnfs_destroy_layout(nfsi);</div><div class='add'>+	struct inode *inode = &amp;nfsi-&gt;vfs_inode;</div><div class='ctx'> </div><div class='del'>-	if (lo)</div><div class='del'>-		wait_var_event(lo, pnfs_layout_removed(nfsi, lo));</div><div class='add'>+	if (lo) {</div><div class='add'>+		spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+		wait_var_event_spinlock(lo, nfsi-&gt;layout != lo,</div><div class='add'>+					&amp;inode-&gt;i_lock);</div><div class='add'>+		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool</div><div class='hunk'>@@ -831,8 +859,6 @@ pnfs_layout_bulk_destroy_byserver_locked(struct nfs_client *clp,</div><div class='ctx'> 			break;</div><div class='ctx'> 		inode = pnfs_grab_inode_layout_hdr(lo);</div><div class='ctx'> 		if (inode != NULL) {</div><div class='del'>-			if (test_and_clear_bit(NFS_LAYOUT_HASHED, &amp;lo-&gt;plh_flags))</div><div class='del'>-				list_del_rcu(&amp;lo-&gt;plh_layouts);</div><div class='ctx'> 			if (pnfs_layout_add_bulk_destroy_list(inode,</div><div class='ctx'> 						layout_list))</div><div class='ctx'> 				continue;</div><div class='hunk'>@@ -853,7 +879,7 @@ pnfs_layout_bulk_destroy_byserver_locked(struct nfs_client *clp,</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='ctx'> pnfs_layout_free_bulk_destroy_list(struct list_head *layout_list,</div><div class='del'>-		bool is_bulk_recall)</div><div class='add'>+				   enum pnfs_layout_destroy_mode mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct pnfs_layout_hdr *lo;</div><div class='ctx'> 	struct inode *inode;</div><div class='hunk'>@@ -871,8 +897,11 @@ pnfs_layout_free_bulk_destroy_list(struct list_head *layout_list,</div><div class='ctx'> </div><div class='ctx'> 		spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 		list_del_init(&amp;lo-&gt;plh_bulk_destroy);</div><div class='del'>-		if (pnfs_mark_layout_stateid_invalid(lo, &amp;lseg_list)) {</div><div class='del'>-			if (is_bulk_recall)</div><div class='add'>+		if (mode == PNFS_LAYOUT_FILE_BULK_RETURN) {</div><div class='add'>+			pnfs_mark_layout_stateid_return(lo, &amp;lseg_list,</div><div class='add'>+							IOMODE_ANY, 0);</div><div class='add'>+		} else if (pnfs_mark_layout_stateid_invalid(lo, &amp;lseg_list)) {</div><div class='add'>+			if (mode == PNFS_LAYOUT_BULK_RETURN)</div><div class='ctx'> 				set_bit(NFS_LAYOUT_BULK_RECALL, &amp;lo-&gt;plh_flags);</div><div class='ctx'> 			ret = -EAGAIN;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -886,10 +915,8 @@ pnfs_layout_free_bulk_destroy_list(struct list_head *layout_list,</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int</div><div class='del'>-pnfs_destroy_layouts_byfsid(struct nfs_client *clp,</div><div class='del'>-		struct nfs_fsid *fsid,</div><div class='del'>-		bool is_recall)</div><div class='add'>+int pnfs_layout_destroy_byfsid(struct nfs_client *clp, struct nfs_fsid *fsid,</div><div class='add'>+			       enum pnfs_layout_destroy_mode mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_server *server;</div><div class='ctx'> 	LIST_HEAD(layout_list);</div><div class='hunk'>@@ -908,33 +935,40 @@ restart:</div><div class='ctx'> 	rcu_read_unlock();</div><div class='ctx'> 	spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='ctx'> </div><div class='del'>-	if (list_empty(&amp;layout_list))</div><div class='del'>-		return 0;</div><div class='del'>-	return pnfs_layout_free_bulk_destroy_list(&amp;layout_list, is_recall);</div><div class='add'>+	return pnfs_layout_free_bulk_destroy_list(&amp;layout_list, mode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int</div><div class='del'>-pnfs_destroy_layouts_byclid(struct nfs_client *clp,</div><div class='del'>-		bool is_recall)</div><div class='add'>+static void pnfs_layout_build_destroy_list_byclient(struct nfs_client *clp,</div><div class='add'>+						    struct list_head *list)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_server *server;</div><div class='del'>-	LIST_HEAD(layout_list);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;clp-&gt;cl_lock);</div><div class='ctx'> 	rcu_read_lock();</div><div class='ctx'> restart:</div><div class='ctx'> 	list_for_each_entry_rcu(server, &amp;clp-&gt;cl_superblocks, client_link) {</div><div class='del'>-		if (pnfs_layout_bulk_destroy_byserver_locked(clp,</div><div class='del'>-					server,</div><div class='del'>-					&amp;layout_list) != 0)</div><div class='add'>+		if (pnfs_layout_bulk_destroy_byserver_locked(clp, server,</div><div class='add'>+							     list) != 0)</div><div class='ctx'> 			goto restart;</div><div class='ctx'> 	}</div><div class='ctx'> 	rcu_read_unlock();</div><div class='ctx'> 	spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	if (list_empty(&amp;layout_list))</div><div class='del'>-		return 0;</div><div class='del'>-	return pnfs_layout_free_bulk_destroy_list(&amp;layout_list, is_recall);</div><div class='add'>+static int pnfs_layout_do_destroy_byclid(struct nfs_client *clp,</div><div class='add'>+					 struct list_head *list,</div><div class='add'>+					 enum pnfs_layout_destroy_mode mode)</div><div class='add'>+{</div><div class='add'>+	pnfs_layout_build_destroy_list_byclient(clp, list);</div><div class='add'>+	return pnfs_layout_free_bulk_destroy_list(list, mode);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int pnfs_layout_destroy_byclid(struct nfs_client *clp,</div><div class='add'>+			       enum pnfs_layout_destroy_mode mode)</div><div class='add'>+{</div><div class='add'>+	LIST_HEAD(layout_list);</div><div class='add'>+</div><div class='add'>+	return pnfs_layout_do_destroy_byclid(clp, &amp;layout_list, mode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -947,7 +981,68 @@ pnfs_destroy_all_layouts(struct nfs_client *clp)</div><div class='ctx'> 	nfs4_deviceid_mark_client_invalid(clp);</div><div class='ctx'> 	nfs4_deviceid_purge_client(clp);</div><div class='ctx'> </div><div class='del'>-	pnfs_destroy_layouts_byclid(clp, false);</div><div class='add'>+	pnfs_layout_destroy_byclid(clp, PNFS_LAYOUT_INVALIDATE);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void pnfs_layout_build_recover_list_byclient(struct nfs_client *clp,</div><div class='add'>+						    struct list_head *list)</div><div class='add'>+{</div><div class='add'>+	struct nfs_server *server;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;clp-&gt;cl_lock);</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+restart:</div><div class='add'>+	list_for_each_entry_rcu(server, &amp;clp-&gt;cl_superblocks, client_link) {</div><div class='add'>+		if (!(server-&gt;caps &amp; NFS_CAP_REBOOT_LAYOUTRETURN))</div><div class='add'>+			continue;</div><div class='add'>+		if (pnfs_layout_bulk_destroy_byserver_locked(clp, server,</div><div class='add'>+							     list) != 0)</div><div class='add'>+			goto restart;</div><div class='add'>+	}</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+	spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int pnfs_layout_bulk_list_reboot(struct list_head *list)</div><div class='add'>+{</div><div class='add'>+	struct pnfs_layout_hdr *lo;</div><div class='add'>+	struct nfs_server *server;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	list_for_each_entry(lo, list, plh_bulk_destroy) {</div><div class='add'>+		server = NFS_SERVER(lo-&gt;plh_inode);</div><div class='add'>+		ret = pnfs_layout_return_on_reboot(lo);</div><div class='add'>+		switch (ret) {</div><div class='add'>+		case 0:</div><div class='add'>+			continue;</div><div class='add'>+		case -NFS4ERR_BAD_STATEID:</div><div class='add'>+			server-&gt;caps &amp;= ~NFS_CAP_REBOOT_LAYOUTRETURN;</div><div class='add'>+			break;</div><div class='add'>+		case -NFS4ERR_NO_GRACE:</div><div class='add'>+			break;</div><div class='add'>+		default:</div><div class='add'>+			goto err;</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+err:</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+int pnfs_layout_handle_reboot(struct nfs_client *clp)</div><div class='add'>+{</div><div class='add'>+	LIST_HEAD(list);</div><div class='add'>+	int ret = 0, ret2;</div><div class='add'>+</div><div class='add'>+	pnfs_layout_build_recover_list_byclient(clp, &amp;list);</div><div class='add'>+	if (!list_empty(&amp;list))</div><div class='add'>+		ret = pnfs_layout_bulk_list_reboot(&amp;list);</div><div class='add'>+	ret2 = pnfs_layout_do_destroy_byclid(clp, &amp;list,</div><div class='add'>+					     PNFS_LAYOUT_INVALIDATE);</div><div class='add'>+	if (!ret)</div><div class='add'>+		ret = ret2;</div><div class='add'>+	return (ret == 0) ?  0 : -EAGAIN;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='hunk'>@@ -1148,6 +1243,33 @@ static void pnfs_clear_layoutcommit(struct inode *inode,</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void</div><div class='add'>+pnfs_layoutreturn_retry_later_locked(struct pnfs_layout_hdr *lo,</div><div class='add'>+				     const nfs4_stateid *arg_stateid,</div><div class='add'>+				     const struct pnfs_layout_range *range,</div><div class='add'>+				     struct list_head *freeme)</div><div class='add'>+{</div><div class='add'>+	if (pnfs_layout_is_valid(lo) &amp;&amp;</div><div class='add'>+	    nfs4_stateid_match_other(&amp;lo-&gt;plh_stateid, arg_stateid))</div><div class='add'>+		pnfs_reset_return_info(lo);</div><div class='add'>+	else</div><div class='add'>+		pnfs_mark_layout_stateid_invalid(lo, freeme);</div><div class='add'>+	pnfs_clear_layoutreturn_waitbit(lo);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void pnfs_layoutreturn_retry_later(struct pnfs_layout_hdr *lo,</div><div class='add'>+				   const nfs4_stateid *arg_stateid,</div><div class='add'>+				   const struct pnfs_layout_range *range)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = lo-&gt;plh_inode;</div><div class='add'>+	LIST_HEAD(freeme);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+	pnfs_layoutreturn_retry_later_locked(lo, arg_stateid, range, &amp;freeme);</div><div class='add'>+	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+	pnfs_free_lseg_list(&amp;freeme);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> void pnfs_layoutreturn_free_lsegs(struct pnfs_layout_hdr *lo,</div><div class='ctx'> 		const nfs4_stateid *arg_stateid,</div><div class='ctx'> 		const struct pnfs_layout_range *range,</div><div class='hunk'>@@ -1157,15 +1279,15 @@ void pnfs_layoutreturn_free_lsegs(struct pnfs_layout_hdr *lo,</div><div class='ctx'> 	LIST_HEAD(freeme);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-	if (!pnfs_layout_is_valid(lo) ||</div><div class='del'>-	    !nfs4_stateid_match_other(&amp;lo-&gt;plh_stateid, arg_stateid))</div><div class='add'>+	if (!nfs4_stateid_match_other(&amp;lo-&gt;plh_stateid, arg_stateid))</div><div class='ctx'> 		goto out_unlock;</div><div class='del'>-	if (stateid) {</div><div class='add'>+	if (stateid &amp;&amp; pnfs_layout_is_valid(lo)) {</div><div class='ctx'> 		u32 seq = be32_to_cpu(arg_stateid-&gt;seqid);</div><div class='ctx'> </div><div class='ctx'> 		pnfs_mark_matching_lsegs_invalid(lo, &amp;freeme, range, seq);</div><div class='ctx'> 		pnfs_free_returned_lsegs(lo, &amp;freeme, range, seq);</div><div class='ctx'> 		pnfs_set_layout_stateid(lo, stateid, NULL, true);</div><div class='add'>+		pnfs_reset_return_info(lo);</div><div class='ctx'> 	} else</div><div class='ctx'> 		pnfs_mark_layout_stateid_invalid(lo, &amp;freeme);</div><div class='ctx'> out_unlock:</div><div class='hunk'>@@ -1182,7 +1304,7 @@ pnfs_prepare_layoutreturn(struct pnfs_layout_hdr *lo,</div><div class='ctx'> 		enum pnfs_iomode *iomode)</div><div class='ctx'> {</div><div class='ctx'> 	/* Serialise LAYOUTGET/LAYOUTRETURN */</div><div class='del'>-	if (atomic_read(&amp;lo-&gt;plh_outstanding) != 0)</div><div class='add'>+	if (atomic_read(&amp;lo-&gt;plh_outstanding) != 0 &amp;&amp; lo-&gt;plh_return_seq == 0)</div><div class='ctx'> 		return false;</div><div class='ctx'> 	if (test_and_set_bit(NFS_LAYOUT_RETURN_LOCK, &amp;lo-&gt;plh_flags))</div><div class='ctx'> 		return false;</div><div class='hunk'>@@ -1224,7 +1346,7 @@ pnfs_send_layoutreturn(struct pnfs_layout_hdr *lo,</div><div class='ctx'> 		       const nfs4_stateid *stateid,</div><div class='ctx'> 		       const struct cred **pcred,</div><div class='ctx'> 		       enum pnfs_iomode iomode,</div><div class='del'>-		       bool sync)</div><div class='add'>+		       unsigned int flags)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *ino = lo-&gt;plh_inode;</div><div class='ctx'> 	struct pnfs_layoutdriver_type *ld = NFS_SERVER(ino)-&gt;pnfs_curr_ld;</div><div class='hunk'>@@ -1233,7 +1355,7 @@ pnfs_send_layoutreturn(struct pnfs_layout_hdr *lo,</div><div class='ctx'> 	int status = 0;</div><div class='ctx'> </div><div class='ctx'> 	*pcred = NULL;</div><div class='del'>-	lrp = kzalloc(sizeof(*lrp), GFP_NOFS);</div><div class='add'>+	lrp = kzalloc(sizeof(*lrp), nfs_io_gfp_mask());</div><div class='ctx'> 	if (unlikely(lrp == NULL)) {</div><div class='ctx'> 		status = -ENOMEM;</div><div class='ctx'> 		spin_lock(&amp;ino-&gt;i_lock);</div><div class='hunk'>@@ -1251,33 +1373,21 @@ pnfs_send_layoutreturn(struct pnfs_layout_hdr *lo,</div><div class='ctx'> 	if (ld-&gt;prepare_layoutreturn)</div><div class='ctx'> 		ld-&gt;prepare_layoutreturn(&amp;lrp-&gt;args);</div><div class='ctx'> </div><div class='del'>-	status = nfs4_proc_layoutreturn(lrp, sync);</div><div class='add'>+	status = nfs4_proc_layoutreturn(lrp, flags);</div><div class='ctx'> out:</div><div class='ctx'> 	dprintk("&lt;-- %s status: %d\n", __func__, status);</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool</div><div class='del'>-pnfs_layout_segments_returnable(struct pnfs_layout_hdr *lo,</div><div class='del'>-				enum pnfs_iomode iomode,</div><div class='del'>-				u32 seq)</div><div class='del'>-{</div><div class='del'>-	struct pnfs_layout_range recall_range = {</div><div class='del'>-		.length = NFS4_MAX_UINT64,</div><div class='del'>-		.iomode = iomode,</div><div class='del'>-	};</div><div class='del'>-	return pnfs_mark_matching_lsegs_return(lo, &amp;lo-&gt;plh_return_segs,</div><div class='del'>-					       &amp;recall_range, seq) != -EBUSY;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /* Return true if layoutreturn is needed */</div><div class='ctx'> static bool</div><div class='ctx'> pnfs_layout_need_return(struct pnfs_layout_hdr *lo)</div><div class='ctx'> {</div><div class='ctx'> 	if (!test_bit(NFS_LAYOUT_RETURN_REQUESTED, &amp;lo-&gt;plh_flags))</div><div class='ctx'> 		return false;</div><div class='del'>-	return pnfs_layout_segments_returnable(lo, lo-&gt;plh_return_iomode,</div><div class='del'>-					       lo-&gt;plh_return_seq);</div><div class='add'>+	return pnfs_mark_layout_stateid_return(lo, &amp;lo-&gt;plh_return_segs,</div><div class='add'>+					       lo-&gt;plh_return_iomode,</div><div class='add'>+					       lo-&gt;plh_return_seq) != EBUSY;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void pnfs_layoutreturn_before_put_layout_hdr(struct pnfs_layout_hdr *lo)</div><div class='hunk'>@@ -1297,7 +1407,8 @@ static void pnfs_layoutreturn_before_put_layout_hdr(struct pnfs_layout_hdr *lo)</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 		if (send) {</div><div class='ctx'> 			/* Send an async layoutreturn so we dont deadlock */</div><div class='del'>-			pnfs_send_layoutreturn(lo, &amp;stateid, &amp;cred, iomode, false);</div><div class='add'>+			pnfs_send_layoutreturn(lo, &amp;stateid, &amp;cred, iomode,</div><div class='add'>+					       PNFS_FL_LAYOUTRETURN_ASYNC);</div><div class='ctx'> 		}</div><div class='ctx'> 	} else</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='hunk'>@@ -1364,7 +1475,8 @@ _pnfs_return_layout(struct inode *ino)</div><div class='ctx'> 	send = pnfs_prepare_layoutreturn(lo, &amp;stateid, &amp;cred, NULL);</div><div class='ctx'> 	spin_unlock(&amp;ino-&gt;i_lock);</div><div class='ctx'> 	if (send)</div><div class='del'>-		status = pnfs_send_layoutreturn(lo, &amp;stateid, &amp;cred, IOMODE_ANY, true);</div><div class='add'>+		status = pnfs_send_layoutreturn(lo, &amp;stateid, &amp;cred, IOMODE_ANY,</div><div class='add'>+						0);</div><div class='ctx'> out_wait_layoutreturn:</div><div class='ctx'> 	wait_on_bit(&amp;lo-&gt;plh_flags, NFS_LAYOUT_RETURN, TASK_UNINTERRUPTIBLE);</div><div class='ctx'> out_put_layout_hdr:</div><div class='hunk'>@@ -1402,6 +1514,24 @@ pnfs_commit_and_return_layout(struct inode *inode)</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int pnfs_layout_return_on_reboot(struct pnfs_layout_hdr *lo)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = lo-&gt;plh_inode;</div><div class='add'>+	const struct cred *cred;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+	if (!pnfs_layout_is_valid(lo)) {</div><div class='add'>+		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+	cred = get_cred(lo-&gt;plh_lc_cred);</div><div class='add'>+	pnfs_get_layout_hdr(lo);</div><div class='add'>+	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+</div><div class='add'>+	return pnfs_send_layoutreturn(lo, &amp;zero_stateid, &amp;cred, IOMODE_ANY,</div><div class='add'>+				      PNFS_FL_LAYOUTRETURN_PRIVILEGED);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> bool pnfs_roc(struct inode *ino,</div><div class='ctx'> 		struct nfs4_layoutreturn_args *args,</div><div class='ctx'> 		struct nfs4_layoutreturn_res *res,</div><div class='hunk'>@@ -1505,7 +1635,7 @@ out_noroc:</div><div class='ctx'> 		return true;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (layoutreturn)</div><div class='del'>-		pnfs_send_layoutreturn(lo, &amp;stateid, &amp;lc_cred, iomode, true);</div><div class='add'>+		pnfs_send_layoutreturn(lo, &amp;stateid, &amp;lc_cred, iomode, 0);</div><div class='ctx'> 	pnfs_put_layout_hdr(lo);</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='hunk'>@@ -1527,6 +1657,18 @@ int pnfs_roc_done(struct rpc_task *task, struct nfs4_layoutreturn_args **argpp,</div><div class='ctx'> 		/* Was there an RPC level error? If not, retry */</div><div class='ctx'> 		if (task-&gt;tk_rpc_status == 0)</div><div class='ctx'> 			break;</div><div class='add'>+		/*</div><div class='add'>+		 * Is there a fatal network level error?</div><div class='add'>+		 * If so release the layout, but flag the error.</div><div class='add'>+		 */</div><div class='add'>+		if ((task-&gt;tk_rpc_status == -ENETDOWN ||</div><div class='add'>+		     task-&gt;tk_rpc_status == -ENETUNREACH) &amp;&amp;</div><div class='add'>+		    task-&gt;tk_flags &amp; RPC_TASK_NETUNREACH_FATAL) {</div><div class='add'>+			*ret = 0;</div><div class='add'>+			(*respp)-&gt;lrs_present = 0;</div><div class='add'>+			retval = -EIO;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='ctx'> 		/* If the call was not sent, let caller handle it */</div><div class='ctx'> 		if (!RPC_WAS_SENT(task))</div><div class='ctx'> 			return 0;</div><div class='hunk'>@@ -1555,22 +1697,24 @@ int pnfs_roc_done(struct rpc_task *task, struct nfs4_layoutreturn_args **argpp,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void pnfs_roc_release(struct nfs4_layoutreturn_args *args,</div><div class='del'>-		struct nfs4_layoutreturn_res *res,</div><div class='del'>-		int ret)</div><div class='add'>+		      struct nfs4_layoutreturn_res *res, int ret)</div><div class='ctx'> {</div><div class='ctx'> 	struct pnfs_layout_hdr *lo = args-&gt;layout;</div><div class='ctx'> 	struct inode *inode = args-&gt;inode;</div><div class='ctx'> 	const nfs4_stateid *res_stateid = NULL;</div><div class='ctx'> 	struct nfs4_xdr_opaque_data *ld_private = args-&gt;ld_private;</div><div class='add'>+	LIST_HEAD(freeme);</div><div class='ctx'> </div><div class='ctx'> 	switch (ret) {</div><div class='add'>+	case -NFS4ERR_BADSESSION:</div><div class='add'>+	case -NFS4ERR_DEADSESSION:</div><div class='add'>+	case -NFS4ERR_CONN_NOT_BOUND_TO_SESSION:</div><div class='ctx'> 	case -NFS4ERR_NOMATCHING_LAYOUT:</div><div class='ctx'> 		spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-		if (pnfs_layout_is_valid(lo) &amp;&amp;</div><div class='del'>-		    nfs4_stateid_match_other(&amp;args-&gt;stateid, &amp;lo-&gt;plh_stateid))</div><div class='del'>-			pnfs_set_plh_return_info(lo, args-&gt;range.iomode, 0);</div><div class='del'>-		pnfs_clear_layoutreturn_waitbit(lo);</div><div class='add'>+		pnfs_layoutreturn_retry_later_locked(lo, &amp;args-&gt;stateid,</div><div class='add'>+						     &amp;args-&gt;range, &amp;freeme);</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+		pnfs_free_lseg_list(&amp;freeme);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case 0:</div><div class='ctx'> 		if (res-&gt;lrs_present)</div><div class='hunk'>@@ -1896,7 +2040,7 @@ static int pnfs_prepare_to_retry_layoutget(struct pnfs_layout_hdr *lo)</div><div class='ctx'> 	pnfs_layoutcommit_inode(lo-&gt;plh_inode, false);</div><div class='ctx'> 	return wait_on_bit_action(&amp;lo-&gt;plh_flags, NFS_LAYOUT_RETURN,</div><div class='ctx'> 				   nfs_wait_bit_killable,</div><div class='del'>-				   TASK_KILLABLE);</div><div class='add'>+				   TASK_KILLABLE|TASK_FREEZABLE_UNSAFE);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void nfs_layoutget_begin(struct pnfs_layout_hdr *lo)</div><div class='hunk'>@@ -1906,8 +2050,11 @@ static void nfs_layoutget_begin(struct pnfs_layout_hdr *lo)</div><div class='ctx'> </div><div class='ctx'> static void nfs_layoutget_end(struct pnfs_layout_hdr *lo)</div><div class='ctx'> {</div><div class='del'>-	if (atomic_dec_and_test(&amp;lo-&gt;plh_outstanding))</div><div class='del'>-		wake_up_var(&amp;lo-&gt;plh_outstanding);</div><div class='add'>+	if (atomic_dec_and_test(&amp;lo-&gt;plh_outstanding) &amp;&amp;</div><div class='add'>+	    test_and_clear_bit(NFS_LAYOUT_DRAIN, &amp;lo-&gt;plh_flags)) {</div><div class='add'>+		smp_mb__after_atomic();</div><div class='add'>+		wake_up_bit(&amp;lo-&gt;plh_flags, NFS_LAYOUT_DRAIN);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool pnfs_is_first_layoutget(struct pnfs_layout_hdr *lo)</div><div class='hunk'>@@ -1964,7 +2111,9 @@ pnfs_update_layout(struct inode *ino,</div><div class='ctx'> 	struct pnfs_layout_segment *lseg = NULL;</div><div class='ctx'> 	struct nfs4_layoutget *lgp;</div><div class='ctx'> 	nfs4_stateid stateid;</div><div class='del'>-	long timeout = 0;</div><div class='add'>+	struct nfs4_exception exception = {</div><div class='add'>+		.inode = ino,</div><div class='add'>+	};</div><div class='ctx'> 	unsigned long giveup = jiffies + (clp-&gt;cl_lease_time &lt;&lt; 1);</div><div class='ctx'> 	bool first;</div><div class='ctx'> </div><div class='hunk'>@@ -1981,6 +2130,14 @@ pnfs_update_layout(struct inode *ino,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> lookup_again:</div><div class='add'>+	if (!nfs4_valid_open_stateid(ctx-&gt;state)) {</div><div class='add'>+		trace_pnfs_update_layout(ino, pos, count,</div><div class='add'>+					 iomode, lo, lseg,</div><div class='add'>+					 PNFS_UPDATE_LAYOUT_INVALID_OPEN);</div><div class='add'>+		lseg = ERR_PTR(-EIO);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	lseg = ERR_PTR(nfs4_client_recover_expired_lease(clp));</div><div class='ctx'> 	if (IS_ERR(lseg))</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -1989,6 +2146,7 @@ lookup_again:</div><div class='ctx'> 	lo = pnfs_find_alloc_layout(ino, ctx, gfp_flags);</div><div class='ctx'> 	if (lo == NULL) {</div><div class='ctx'> 		spin_unlock(&amp;ino-&gt;i_lock);</div><div class='add'>+		lseg = ERR_PTR(-ENOMEM);</div><div class='ctx'> 		trace_pnfs_update_layout(ino, pos, count, iomode, lo, lseg,</div><div class='ctx'> 				 PNFS_UPDATE_LAYOUT_NOMEM);</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -2013,11 +2171,11 @@ lookup_again:</div><div class='ctx'> 	 * If the layout segment list is empty, but there are outstanding</div><div class='ctx'> 	 * layoutget calls, then they might be subject to a layoutrecall.</div><div class='ctx'> 	 */</div><div class='del'>-	if ((list_empty(&amp;lo-&gt;plh_segs) || !pnfs_layout_is_valid(lo)) &amp;&amp;</div><div class='add'>+	if (test_bit(NFS_LAYOUT_DRAIN, &amp;lo-&gt;plh_flags) &amp;&amp;</div><div class='ctx'> 	    atomic_read(&amp;lo-&gt;plh_outstanding) != 0) {</div><div class='ctx'> 		spin_unlock(&amp;ino-&gt;i_lock);</div><div class='del'>-		lseg = ERR_PTR(wait_var_event_killable(&amp;lo-&gt;plh_outstanding,</div><div class='del'>-					!atomic_read(&amp;lo-&gt;plh_outstanding)));</div><div class='add'>+		lseg = ERR_PTR(wait_on_bit(&amp;lo-&gt;plh_flags, NFS_LAYOUT_DRAIN,</div><div class='add'>+					   TASK_KILLABLE));</div><div class='ctx'> 		if (IS_ERR(lseg))</div><div class='ctx'> 			goto out_put_layout_hdr;</div><div class='ctx'> 		pnfs_put_layout_hdr(lo);</div><div class='hunk'>@@ -2117,6 +2275,7 @@ lookup_again:</div><div class='ctx'> </div><div class='ctx'> 	lgp = pnfs_alloc_init_layoutget_args(ino, ctx, &amp;stateid, &amp;arg, gfp_flags);</div><div class='ctx'> 	if (!lgp) {</div><div class='add'>+		lseg = ERR_PTR(-ENOMEM);</div><div class='ctx'> 		trace_pnfs_update_layout(ino, pos, count, iomode, lo, NULL,</div><div class='ctx'> 					 PNFS_UPDATE_LAYOUT_NOMEM);</div><div class='ctx'> 		nfs_layoutget_end(lo);</div><div class='hunk'>@@ -2126,7 +2285,7 @@ lookup_again:</div><div class='ctx'> 	lgp-&gt;lo = lo;</div><div class='ctx'> 	pnfs_get_layout_hdr(lo);</div><div class='ctx'> </div><div class='del'>-	lseg = nfs4_proc_layoutget(lgp, &amp;timeout);</div><div class='add'>+	lseg = nfs4_proc_layoutget(lgp, &amp;exception);</div><div class='ctx'> 	trace_pnfs_update_layout(ino, pos, count, iomode, lo, lseg,</div><div class='ctx'> 				 PNFS_UPDATE_LAYOUT_SEND_LAYOUTGET);</div><div class='ctx'> 	nfs_layoutget_end(lo);</div><div class='hunk'>@@ -2139,6 +2298,12 @@ lookup_again:</div><div class='ctx'> 		case -ERECALLCONFLICT:</div><div class='ctx'> 		case -EAGAIN:</div><div class='ctx'> 			break;</div><div class='add'>+		case -ENODATA:</div><div class='add'>+			/* The server returned NFS4ERR_LAYOUTUNAVAILABLE */</div><div class='add'>+			pnfs_layout_set_fail_bit(</div><div class='add'>+				lo, pnfs_iomode_to_fail_bit(iomode));</div><div class='add'>+			lseg = NULL;</div><div class='add'>+			goto out_put_layout_hdr;</div><div class='ctx'> 		default:</div><div class='ctx'> 			if (!nfs_error_is_fatal(PTR_ERR(lseg))) {</div><div class='ctx'> 				pnfs_layout_clear_fail_bit(lo, pnfs_iomode_to_fail_bit(iomode));</div><div class='hunk'>@@ -2147,6 +2312,8 @@ lookup_again:</div><div class='ctx'> 			goto out_put_layout_hdr;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (lseg) {</div><div class='add'>+			if (!exception.retry)</div><div class='add'>+				goto out_put_layout_hdr;</div><div class='ctx'> 			if (first)</div><div class='ctx'> 				pnfs_clear_first_layoutget(lo);</div><div class='ctx'> 			trace_pnfs_update_layout(ino, pos, count,</div><div class='hunk'>@@ -2206,7 +2373,7 @@ _pnfs_grab_empty_layout(struct inode *ino, struct nfs_open_context *ctx)</div><div class='ctx'> 	struct pnfs_layout_hdr *lo;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;ino-&gt;i_lock);</div><div class='del'>-	lo = pnfs_find_alloc_layout(ino, ctx, GFP_KERNEL);</div><div class='add'>+	lo = pnfs_find_alloc_layout(ino, ctx, nfs_io_gfp_mask());</div><div class='ctx'> 	if (!lo)</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> 	if (!test_bit(NFS_LAYOUT_INVALID_STID, &amp;lo-&gt;plh_flags))</div><div class='hunk'>@@ -2249,8 +2416,8 @@ static void _lgopen_prepare_attached(struct nfs4_opendata *data,</div><div class='ctx'> 	lo = _pnfs_grab_empty_layout(ino, ctx);</div><div class='ctx'> 	if (!lo)</div><div class='ctx'> 		return;</div><div class='del'>-	lgp = pnfs_alloc_init_layoutget_args(ino, ctx, &amp;current_stateid,</div><div class='del'>-					     &amp;rng, GFP_KERNEL);</div><div class='add'>+	lgp = pnfs_alloc_init_layoutget_args(ino, ctx, &amp;current_stateid, &amp;rng,</div><div class='add'>+					     nfs_io_gfp_mask());</div><div class='ctx'> 	if (!lgp) {</div><div class='ctx'> 		pnfs_clear_first_layoutget(lo);</div><div class='ctx'> 		nfs_layoutget_end(lo);</div><div class='hunk'>@@ -2275,8 +2442,8 @@ static void _lgopen_prepare_floating(struct nfs4_opendata *data,</div><div class='ctx'> 	};</div><div class='ctx'> 	struct nfs4_layoutget *lgp;</div><div class='ctx'> </div><div class='del'>-	lgp = pnfs_alloc_init_layoutget_args(ino, ctx, &amp;current_stateid,</div><div class='del'>-					     &amp;rng, GFP_KERNEL);</div><div class='add'>+	lgp = pnfs_alloc_init_layoutget_args(ino, ctx, &amp;current_stateid, &amp;rng,</div><div class='add'>+					     nfs_io_gfp_mask());</div><div class='ctx'> 	if (!lgp)</div><div class='ctx'> 		return;</div><div class='ctx'> 	data-&gt;lgp = lgp;</div><div class='hunk'>@@ -2394,7 +2561,8 @@ pnfs_layout_process(struct nfs4_layoutget *lgp)</div><div class='ctx'> 		goto out_forget;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!pnfs_layout_is_valid(lo) &amp;&amp; !pnfs_is_first_layoutget(lo))</div><div class='add'>+	if (test_bit(NFS_LAYOUT_DRAIN, &amp;lo-&gt;plh_flags) &amp;&amp;</div><div class='add'>+	    !pnfs_is_first_layoutget(lo))</div><div class='ctx'> 		goto out_forget;</div><div class='ctx'> </div><div class='ctx'> 	if (nfs4_stateid_match_other(&amp;lo-&gt;plh_stateid, &amp;res-&gt;stateid)) {</div><div class='hunk'>@@ -2463,6 +2631,7 @@ pnfs_mark_matching_lsegs_return(struct pnfs_layout_hdr *lo,</div><div class='ctx'> 				u32 seq)</div><div class='ctx'> {</div><div class='ctx'> 	struct pnfs_layout_segment *lseg, *next;</div><div class='add'>+	struct nfs_server *server = NFS_SERVER(lo-&gt;plh_inode);</div><div class='ctx'> 	int remaining = 0;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("%s:Begin lo %p\n", __func__, lo);</div><div class='hunk'>@@ -2485,6 +2654,7 @@ pnfs_mark_matching_lsegs_return(struct pnfs_layout_hdr *lo,</div><div class='ctx'> 				continue;</div><div class='ctx'> 			remaining++;</div><div class='ctx'> 			set_bit(NFS_LSEG_LAYOUTRETURN, &amp;lseg-&gt;pls_flags);</div><div class='add'>+			pnfs_lseg_cancel_io(server, lseg);</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='ctx'> 	if (remaining) {</div><div class='hunk'>@@ -2527,7 +2697,8 @@ pnfs_mark_layout_for_return(struct inode *inode,</div><div class='ctx'> 		return_now = pnfs_prepare_layoutreturn(lo, &amp;stateid, &amp;cred, &amp;iomode);</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 		if (return_now)</div><div class='del'>-			pnfs_send_layoutreturn(lo, &amp;stateid, &amp;cred, iomode, false);</div><div class='add'>+			pnfs_send_layoutreturn(lo, &amp;stateid, &amp;cred, iomode,</div><div class='add'>+					       PNFS_FL_LAYOUTRETURN_ASYNC);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 		nfs_commit_inode(inode, 0);</div><div class='hunk'>@@ -2607,31 +2778,45 @@ pnfs_should_return_unused_layout(struct pnfs_layout_hdr *lo,</div><div class='ctx'> 	return mode == 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int</div><div class='del'>-pnfs_layout_return_unused_byserver(struct nfs_server *server, void *data)</div><div class='add'>+static int pnfs_layout_return_unused_byserver(struct nfs_server *server,</div><div class='add'>+					      void *data)</div><div class='ctx'> {</div><div class='ctx'> 	const struct pnfs_layout_range *range = data;</div><div class='add'>+	const struct cred *cred;</div><div class='ctx'> 	struct pnfs_layout_hdr *lo;</div><div class='ctx'> 	struct inode *inode;</div><div class='add'>+	nfs4_stateid stateid;</div><div class='add'>+	enum pnfs_iomode iomode;</div><div class='add'>+</div><div class='ctx'> restart:</div><div class='ctx'> 	rcu_read_lock();</div><div class='ctx'> 	list_for_each_entry_rcu(lo, &amp;server-&gt;layouts, plh_layouts) {</div><div class='del'>-		if (!pnfs_layout_can_be_returned(lo) ||</div><div class='add'>+		inode = lo-&gt;plh_inode;</div><div class='add'>+		if (!inode || !pnfs_layout_can_be_returned(lo) ||</div><div class='ctx'> 		    test_bit(NFS_LAYOUT_RETURN_REQUESTED, &amp;lo-&gt;plh_flags))</div><div class='ctx'> 			continue;</div><div class='del'>-		inode = lo-&gt;plh_inode;</div><div class='ctx'> 		spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-		if (!pnfs_should_return_unused_layout(lo, range)) {</div><div class='add'>+		if (!lo-&gt;plh_inode ||</div><div class='add'>+		    !pnfs_should_return_unused_layout(lo, range)) {</div><div class='ctx'> 			spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='add'>+		pnfs_get_layout_hdr(lo);</div><div class='add'>+		pnfs_set_plh_return_info(lo, range-&gt;iomode, 0);</div><div class='add'>+		if (pnfs_mark_matching_lsegs_return(lo, &amp;lo-&gt;plh_return_segs,</div><div class='add'>+						    range, 0) != 0 ||</div><div class='add'>+		    !pnfs_prepare_layoutreturn(lo, &amp;stateid, &amp;cred, &amp;iomode)) {</div><div class='add'>+			spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+			rcu_read_unlock();</div><div class='add'>+			pnfs_put_layout_hdr(lo);</div><div class='add'>+			cond_resched();</div><div class='add'>+			goto restart;</div><div class='add'>+		}</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='del'>-		inode = pnfs_grab_inode_layout_hdr(lo);</div><div class='del'>-		if (!inode)</div><div class='del'>-			continue;</div><div class='ctx'> 		rcu_read_unlock();</div><div class='del'>-		pnfs_mark_layout_for_return(inode, range);</div><div class='del'>-		iput(inode);</div><div class='add'>+		pnfs_send_layoutreturn(lo, &amp;stateid, &amp;cred, iomode,</div><div class='add'>+				       PNFS_FL_LAYOUTRETURN_ASYNC);</div><div class='add'>+		pnfs_put_layout_hdr(lo);</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 		goto restart;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2653,51 +2838,40 @@ pnfs_layout_return_unused_byclid(struct nfs_client *clp,</div><div class='ctx'> 			&amp;range);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/* Check if we have we have a valid layout but if there isn't an intersection</div><div class='add'>+ * between the request and the pgio-&gt;pg_lseg, put this pgio-&gt;pg_lseg away.</div><div class='add'>+ */</div><div class='ctx'> void</div><div class='del'>-pnfs_generic_pg_check_layout(struct nfs_pageio_descriptor *pgio)</div><div class='add'>+pnfs_generic_pg_check_layout(struct nfs_pageio_descriptor *pgio,</div><div class='add'>+			     struct nfs_page *req)</div><div class='ctx'> {</div><div class='ctx'> 	if (pgio-&gt;pg_lseg == NULL ||</div><div class='del'>-	    test_bit(NFS_LSEG_VALID, &amp;pgio-&gt;pg_lseg-&gt;pls_flags))</div><div class='add'>+	    (test_bit(NFS_LSEG_VALID, &amp;pgio-&gt;pg_lseg-&gt;pls_flags) &amp;&amp;</div><div class='add'>+	    pnfs_lseg_request_intersecting(pgio-&gt;pg_lseg, req)))</div><div class='ctx'> 		return;</div><div class='ctx'> 	pnfs_put_lseg(pgio-&gt;pg_lseg);</div><div class='ctx'> 	pgio-&gt;pg_lseg = NULL;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(pnfs_generic_pg_check_layout);</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Check for any intersection between the request and the pgio-&gt;pg_lseg,</div><div class='del'>- * and if none, put this pgio-&gt;pg_lseg away.</div><div class='del'>- */</div><div class='del'>-void</div><div class='del'>-pnfs_generic_pg_check_range(struct nfs_pageio_descriptor *pgio, struct nfs_page *req)</div><div class='del'>-{</div><div class='del'>-	if (pgio-&gt;pg_lseg &amp;&amp; !pnfs_lseg_request_intersecting(pgio-&gt;pg_lseg, req)) {</div><div class='del'>-		pnfs_put_lseg(pgio-&gt;pg_lseg);</div><div class='del'>-		pgio-&gt;pg_lseg = NULL;</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL_GPL(pnfs_generic_pg_check_range);</div><div class='del'>-</div><div class='ctx'> void</div><div class='ctx'> pnfs_generic_pg_init_read(struct nfs_pageio_descriptor *pgio, struct nfs_page *req)</div><div class='ctx'> {</div><div class='ctx'> 	u64 rd_size;</div><div class='ctx'> </div><div class='del'>-	pnfs_generic_pg_check_layout(pgio);</div><div class='del'>-	pnfs_generic_pg_check_range(pgio, req);</div><div class='add'>+	pnfs_generic_pg_check_layout(pgio, req);</div><div class='ctx'> 	if (pgio-&gt;pg_lseg == NULL) {</div><div class='ctx'> 		if (pgio-&gt;pg_dreq == NULL)</div><div class='ctx'> 			rd_size = i_size_read(pgio-&gt;pg_inode) - req_offset(req);</div><div class='ctx'> 		else</div><div class='del'>-			rd_size = nfs_dreq_bytes_left(pgio-&gt;pg_dreq);</div><div class='del'>-</div><div class='del'>-		pgio-&gt;pg_lseg = pnfs_update_layout(pgio-&gt;pg_inode,</div><div class='del'>-						   nfs_req_openctx(req),</div><div class='del'>-						   req_offset(req),</div><div class='del'>-						   rd_size,</div><div class='del'>-						   IOMODE_READ,</div><div class='del'>-						   false,</div><div class='del'>-						   GFP_KERNEL);</div><div class='add'>+			rd_size = nfs_dreq_bytes_left(pgio-&gt;pg_dreq,</div><div class='add'>+						      req_offset(req));</div><div class='add'>+</div><div class='add'>+		pgio-&gt;pg_lseg =</div><div class='add'>+			pnfs_update_layout(pgio-&gt;pg_inode, nfs_req_openctx(req),</div><div class='add'>+					   req_offset(req), rd_size,</div><div class='add'>+					   IOMODE_READ, false,</div><div class='add'>+					   nfs_io_gfp_mask());</div><div class='ctx'> 		if (IS_ERR(pgio-&gt;pg_lseg)) {</div><div class='ctx'> 			pgio-&gt;pg_error = PTR_ERR(pgio-&gt;pg_lseg);</div><div class='ctx'> 			pgio-&gt;pg_lseg = NULL;</div><div class='hunk'>@@ -2715,16 +2889,12 @@ void</div><div class='ctx'> pnfs_generic_pg_init_write(struct nfs_pageio_descriptor *pgio,</div><div class='ctx'> 			   struct nfs_page *req, u64 wb_size)</div><div class='ctx'> {</div><div class='del'>-	pnfs_generic_pg_check_layout(pgio);</div><div class='del'>-	pnfs_generic_pg_check_range(pgio, req);</div><div class='add'>+	pnfs_generic_pg_check_layout(pgio, req);</div><div class='ctx'> 	if (pgio-&gt;pg_lseg == NULL) {</div><div class='del'>-		pgio-&gt;pg_lseg = pnfs_update_layout(pgio-&gt;pg_inode,</div><div class='del'>-						   nfs_req_openctx(req),</div><div class='del'>-						   req_offset(req),</div><div class='del'>-						   wb_size,</div><div class='del'>-						   IOMODE_RW,</div><div class='del'>-						   false,</div><div class='del'>-						   GFP_KERNEL);</div><div class='add'>+		pgio-&gt;pg_lseg =</div><div class='add'>+			pnfs_update_layout(pgio-&gt;pg_inode, nfs_req_openctx(req),</div><div class='add'>+					   req_offset(req), wb_size, IOMODE_RW,</div><div class='add'>+					   false, nfs_io_gfp_mask());</div><div class='ctx'> 		if (IS_ERR(pgio-&gt;pg_lseg)) {</div><div class='ctx'> 			pgio-&gt;pg_error = PTR_ERR(pgio-&gt;pg_lseg);</div><div class='ctx'> 			pgio-&gt;pg_lseg = NULL;</div><div class='hunk'>@@ -2800,7 +2970,6 @@ int pnfs_write_done_resend_to_mds(struct nfs_pgio_header *hdr)</div><div class='ctx'> 	/* Resend all requests through the MDS */</div><div class='ctx'> 	nfs_pageio_init_write(&amp;pgio, hdr-&gt;inode, FLUSH_STABLE, true,</div><div class='ctx'> 			      hdr-&gt;completion_ops);</div><div class='del'>-	set_bit(NFS_CONTEXT_RESEND_WRITES, &amp;hdr-&gt;args.context-&gt;flags);</div><div class='ctx'> 	return nfs_pageio_resend(&amp;pgio, hdr);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(pnfs_write_done_resend_to_mds);</div><div class='hunk'>@@ -3163,6 +3332,7 @@ pnfs_layoutcommit_inode(struct inode *inode, bool sync)</div><div class='ctx'> 	struct nfs_inode *nfsi = NFS_I(inode);</div><div class='ctx'> 	loff_t end_pos;</div><div class='ctx'> 	int status;</div><div class='add'>+	bool mark_as_dirty = false;</div><div class='ctx'> </div><div class='ctx'> 	if (!pnfs_layoutcommit_outstanding(inode))</div><div class='ctx'> 		return 0;</div><div class='hunk'>@@ -3176,14 +3346,14 @@ pnfs_layoutcommit_inode(struct inode *inode, bool sync)</div><div class='ctx'> 		status = wait_on_bit_lock_action(&amp;nfsi-&gt;flags,</div><div class='ctx'> 				NFS_INO_LAYOUTCOMMITTING,</div><div class='ctx'> 				nfs_wait_bit_killable,</div><div class='del'>-				TASK_KILLABLE);</div><div class='add'>+				TASK_KILLABLE|TASK_FREEZABLE_UNSAFE);</div><div class='ctx'> 		if (status)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	status = -ENOMEM;</div><div class='ctx'> 	/* Note kzalloc ensures data-&gt;res.seq_res.sr_slot == NULL */</div><div class='del'>-	data = kzalloc(sizeof(*data), GFP_NOFS);</div><div class='add'>+	data = kzalloc(sizeof(*data), nfs_io_gfp_mask());</div><div class='ctx'> 	if (!data)</div><div class='ctx'> 		goto clear_layoutcommitting;</div><div class='ctx'> </div><div class='hunk'>@@ -3214,19 +3384,23 @@ pnfs_layoutcommit_inode(struct inode *inode, bool sync)</div><div class='ctx'> 	if (ld-&gt;prepare_layoutcommit) {</div><div class='ctx'> 		status = ld-&gt;prepare_layoutcommit(&amp;data-&gt;args);</div><div class='ctx'> 		if (status) {</div><div class='del'>-			put_cred(data-&gt;cred);</div><div class='add'>+			if (status != -ENOSPC)</div><div class='add'>+				put_cred(data-&gt;cred);</div><div class='ctx'> 			spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 			set_bit(NFS_INO_LAYOUTCOMMIT, &amp;nfsi-&gt;flags);</div><div class='ctx'> 			if (end_pos &gt; nfsi-&gt;layout-&gt;plh_lwb)</div><div class='ctx'> 				nfsi-&gt;layout-&gt;plh_lwb = end_pos;</div><div class='del'>-			goto out_unlock;</div><div class='add'>+			if (status != -ENOSPC)</div><div class='add'>+				goto out_unlock;</div><div class='add'>+			spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+			mark_as_dirty = true;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> 	status = nfs4_proc_layoutcommit(data, sync);</div><div class='ctx'> out:</div><div class='del'>-	if (status)</div><div class='add'>+	if (status || mark_as_dirty)</div><div class='ctx'> 		mark_inode_dirty_sync(inode);</div><div class='ctx'> 	dprintk("&lt;-- %s status %d\n", __func__, status);</div><div class='ctx'> 	return status;</div><div class='hunk'>@@ -3250,7 +3424,7 @@ struct nfs4_threshold *pnfs_mdsthreshold_alloc(void)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_threshold *thp;</div><div class='ctx'> </div><div class='del'>-	thp = kzalloc(sizeof(*thp), GFP_NOFS);</div><div class='add'>+	thp = kzalloc(sizeof(*thp), nfs_io_gfp_mask());</div><div class='ctx'> 	if (!thp) {</div><div class='ctx'> 		dprintk("%s mdsthreshold allocation failed\n", __func__);</div><div class='ctx'> 		return NULL;</div><div class='head'>diff --git a/fs/nfs/pnfs.h b/fs/nfs/pnfs.h<br/>index f4d7548d67b2..91ff877185c8 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/pnfs.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/pnfs.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/pnfs.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/pnfs.h</a></div><div class='hunk'>@@ -35,6 +35,7 @@</div><div class='ctx'> #include &lt;linux/nfs_page.h&gt;</div><div class='ctx'> #include &lt;linux/workqueue.h&gt;</div><div class='ctx'> </div><div class='add'>+struct nfs4_exception;</div><div class='ctx'> struct nfs4_opendata;</div><div class='ctx'> </div><div class='ctx'> enum {</div><div class='hunk'>@@ -59,6 +60,7 @@ struct nfs4_pnfs_ds {</div><div class='ctx'> 	struct list_head	ds_node;  /* nfs4_pnfs_dev_hlist dev_dslist */</div><div class='ctx'> 	char			*ds_remotestr;	/* comma sep list of addrs */</div><div class='ctx'> 	struct list_head	ds_addrs;</div><div class='add'>+	const struct net	*ds_net;</div><div class='ctx'> 	struct nfs_client	*ds_clp;</div><div class='ctx'> 	refcount_t		ds_count;</div><div class='ctx'> 	unsigned long		ds_state;</div><div class='hunk'>@@ -105,6 +107,7 @@ enum {</div><div class='ctx'> 	NFS_LAYOUT_FIRST_LAYOUTGET,	/* Serialize first layoutget */</div><div class='ctx'> 	NFS_LAYOUT_INODE_FREEING,	/* The inode is being freed */</div><div class='ctx'> 	NFS_LAYOUT_HASHED,		/* The layout visible */</div><div class='add'>+	NFS_LAYOUT_DRAIN,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> enum layoutdriver_policy_flags {</div><div class='hunk'>@@ -116,6 +119,12 @@ enum layoutdriver_policy_flags {</div><div class='ctx'> 	PNFS_LAYOUTGET_ON_OPEN		= 1 &lt;&lt; 3,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+enum pnfs_layout_destroy_mode {</div><div class='add'>+	PNFS_LAYOUT_INVALIDATE = 0,</div><div class='add'>+	PNFS_LAYOUT_BULK_RETURN,</div><div class='add'>+	PNFS_LAYOUT_FILE_BULK_RETURN,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> struct nfs4_deviceid_node;</div><div class='ctx'> </div><div class='ctx'> /* Per-layout driver specific registration structure */</div><div class='hunk'>@@ -125,7 +134,6 @@ struct pnfs_layoutdriver_type {</div><div class='ctx'> 	const char *name;</div><div class='ctx'> 	struct module *owner;</div><div class='ctx'> 	unsigned flags;</div><div class='del'>-	unsigned max_deviceinfo_size;</div><div class='ctx'> 	unsigned max_layoutget_response;</div><div class='ctx'> </div><div class='ctx'> 	int (*set_layoutdriver) (struct nfs_server *, const struct nfs_fh *);</div><div class='hunk'>@@ -168,6 +176,8 @@ struct pnfs_layoutdriver_type {</div><div class='ctx'> 	void (*cleanup_layoutcommit) (struct nfs4_layoutcommit_data *data);</div><div class='ctx'> 	int (*prepare_layoutcommit) (struct nfs4_layoutcommit_args *args);</div><div class='ctx'> 	int (*prepare_layoutstats) (struct nfs42_layoutstat_args *args);</div><div class='add'>+</div><div class='add'>+	void (*cancel_io)(struct pnfs_layout_segment *lseg);</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct pnfs_commit_ops {</div><div class='hunk'>@@ -189,8 +199,6 @@ struct pnfs_commit_ops {</div><div class='ctx'> 				  int max);</div><div class='ctx'> 	void (*recover_commit_reqs) (struct list_head *list,</div><div class='ctx'> 				     struct nfs_commit_info *cinfo);</div><div class='del'>-	struct nfs_page * (*search_commit_reqs)(struct nfs_commit_info *cinfo,</div><div class='del'>-						struct page *page);</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct pnfs_layout_hdr {</div><div class='hunk'>@@ -234,14 +242,22 @@ struct pnfs_devicelist {</div><div class='ctx'> </div><div class='ctx'> extern int pnfs_register_layoutdriver(struct pnfs_layoutdriver_type *);</div><div class='ctx'> extern void pnfs_unregister_layoutdriver(struct pnfs_layoutdriver_type *);</div><div class='add'>+extern const struct pnfs_layoutdriver_type *pnfs_find_layoutdriver(u32 id);</div><div class='add'>+extern void pnfs_put_layoutdriver(const struct pnfs_layoutdriver_type *ld);</div><div class='ctx'> </div><div class='ctx'> /* nfs4proc.c */</div><div class='add'>+#define PNFS_FL_LAYOUTRETURN_ASYNC (1U &lt;&lt; 0)</div><div class='add'>+#define PNFS_FL_LAYOUTRETURN_PRIVILEGED (1U &lt;&lt; 1)</div><div class='add'>+</div><div class='ctx'> extern size_t max_response_pages(struct nfs_server *server);</div><div class='ctx'> extern int nfs4_proc_getdeviceinfo(struct nfs_server *server,</div><div class='ctx'> 				   struct pnfs_device *dev,</div><div class='ctx'> 				   const struct cred *cred);</div><div class='del'>-extern struct pnfs_layout_segment* nfs4_proc_layoutget(struct nfs4_layoutget *lgp, long *timeout);</div><div class='del'>-extern int nfs4_proc_layoutreturn(struct nfs4_layoutreturn *lrp, bool sync);</div><div class='add'>+extern struct pnfs_layout_segment *</div><div class='add'>+nfs4_proc_layoutget(struct nfs4_layoutget *lgp,</div><div class='add'>+		    struct nfs4_exception *exception);</div><div class='add'>+extern int nfs4_proc_layoutreturn(struct nfs4_layoutreturn *lrp,</div><div class='add'>+				  unsigned int flags);</div><div class='ctx'> </div><div class='ctx'> /* pnfs.c */</div><div class='ctx'> void pnfs_get_layout_hdr(struct pnfs_layout_hdr *lo);</div><div class='hunk'>@@ -249,8 +265,7 @@ void pnfs_put_lseg(struct pnfs_layout_segment *lseg);</div><div class='ctx'> </div><div class='ctx'> void set_pnfs_layoutdriver(struct nfs_server *, const struct nfs_fh *, struct nfs_fsinfo *);</div><div class='ctx'> void unset_pnfs_layoutdriver(struct nfs_server *);</div><div class='del'>-void pnfs_generic_pg_check_layout(struct nfs_pageio_descriptor *pgio);</div><div class='del'>-void pnfs_generic_pg_check_range(struct nfs_pageio_descriptor *pgio, struct nfs_page *req);</div><div class='add'>+void pnfs_generic_pg_check_layout(struct nfs_pageio_descriptor *pgio, struct nfs_page *req);</div><div class='ctx'> void pnfs_generic_pg_init_read(struct nfs_pageio_descriptor *, struct nfs_page *);</div><div class='ctx'> int pnfs_generic_pg_readpages(struct nfs_pageio_descriptor *desc);</div><div class='ctx'> void pnfs_generic_pg_init_write(struct nfs_pageio_descriptor *pgio,</div><div class='hunk'>@@ -266,11 +281,10 @@ void pnfs_free_lseg_list(struct list_head *tmp_list);</div><div class='ctx'> void pnfs_destroy_layout(struct nfs_inode *);</div><div class='ctx'> void pnfs_destroy_layout_final(struct nfs_inode *);</div><div class='ctx'> void pnfs_destroy_all_layouts(struct nfs_client *);</div><div class='del'>-int pnfs_destroy_layouts_byfsid(struct nfs_client *clp,</div><div class='del'>-		struct nfs_fsid *fsid,</div><div class='del'>-		bool is_recall);</div><div class='del'>-int pnfs_destroy_layouts_byclid(struct nfs_client *clp,</div><div class='del'>-		bool is_recall);</div><div class='add'>+int pnfs_layout_destroy_byfsid(struct nfs_client *clp, struct nfs_fsid *fsid,</div><div class='add'>+			       enum pnfs_layout_destroy_mode mode);</div><div class='add'>+int pnfs_layout_destroy_byclid(struct nfs_client *clp,</div><div class='add'>+			       enum pnfs_layout_destroy_mode mode);</div><div class='ctx'> bool nfs4_layout_refresh_old_stateid(nfs4_stateid *dst,</div><div class='ctx'> 		struct pnfs_layout_range *dst_range,</div><div class='ctx'> 		struct inode *inode);</div><div class='hunk'>@@ -316,6 +330,9 @@ struct pnfs_layout_segment *pnfs_update_layout(struct inode *ino,</div><div class='ctx'> 					       enum pnfs_iomode iomode,</div><div class='ctx'> 					       bool strict_iomode,</div><div class='ctx'> 					       gfp_t gfp_flags);</div><div class='add'>+void pnfs_layoutreturn_retry_later(struct pnfs_layout_hdr *lo,</div><div class='add'>+				   const nfs4_stateid *arg_stateid,</div><div class='add'>+				   const struct pnfs_layout_range *range);</div><div class='ctx'> void pnfs_layoutreturn_free_lsegs(struct pnfs_layout_hdr *lo,</div><div class='ctx'> 		const nfs4_stateid *arg_stateid,</div><div class='ctx'> 		const struct pnfs_layout_range *range,</div><div class='hunk'>@@ -337,6 +354,7 @@ void pnfs_error_mark_layout_for_return(struct inode *inode,</div><div class='ctx'> 				       struct pnfs_layout_segment *lseg);</div><div class='ctx'> void pnfs_layout_return_unused_byclid(struct nfs_client *clp,</div><div class='ctx'> 				      enum pnfs_iomode iomode);</div><div class='add'>+int pnfs_layout_handle_reboot(struct nfs_client *clp);</div><div class='ctx'> </div><div class='ctx'> /* nfs4_deviceid_flags */</div><div class='ctx'> enum {</div><div class='hunk'>@@ -389,8 +407,6 @@ void pnfs_generic_prepare_to_resend_writes(struct nfs_commit_data *data);</div><div class='ctx'> void pnfs_generic_rw_release(void *data);</div><div class='ctx'> void pnfs_generic_recover_commit_reqs(struct list_head *dst,</div><div class='ctx'> 				      struct nfs_commit_info *cinfo);</div><div class='del'>-struct nfs_page *pnfs_generic_search_commit_reqs(struct nfs_commit_info *cinfo,</div><div class='del'>-						 struct page *page);</div><div class='ctx'> int pnfs_generic_commit_pagelist(struct inode *inode,</div><div class='ctx'> 				 struct list_head *mds_pages,</div><div class='ctx'> 				 int how,</div><div class='hunk'>@@ -400,7 +416,8 @@ int pnfs_generic_commit_pagelist(struct inode *inode,</div><div class='ctx'> int pnfs_generic_scan_commit_lists(struct nfs_commit_info *cinfo, int max);</div><div class='ctx'> void pnfs_generic_write_commit_done(struct rpc_task *task, void *data);</div><div class='ctx'> void nfs4_pnfs_ds_put(struct nfs4_pnfs_ds *ds);</div><div class='del'>-struct nfs4_pnfs_ds *nfs4_pnfs_ds_add(struct list_head *dsaddrs,</div><div class='add'>+struct nfs4_pnfs_ds *nfs4_pnfs_ds_add(const struct net *net,</div><div class='add'>+				      struct list_head *dsaddrs,</div><div class='ctx'> 				      gfp_t gfp_flags);</div><div class='ctx'> void nfs4_pnfs_v3_ds_connect_unload(void);</div><div class='ctx'> int nfs4_pnfs_ds_connect(struct nfs_server *mds_srv, struct nfs4_pnfs_ds *ds,</div><div class='hunk'>@@ -550,17 +567,6 @@ pnfs_recover_commit_reqs(struct list_head *head, struct nfs_commit_info *cinfo)</div><div class='ctx'> 		fl_cinfo-&gt;ops-&gt;recover_commit_reqs(head, cinfo);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline struct nfs_page *</div><div class='del'>-pnfs_search_commit_reqs(struct inode *inode, struct nfs_commit_info *cinfo,</div><div class='del'>-			struct page *page)</div><div class='del'>-{</div><div class='del'>-	struct pnfs_ds_commit_info *fl_cinfo = cinfo-&gt;ds;</div><div class='del'>-</div><div class='del'>-	if (!fl_cinfo-&gt;ops || !fl_cinfo-&gt;ops-&gt;search_commit_reqs)</div><div class='del'>-		return NULL;</div><div class='del'>-	return fl_cinfo-&gt;ops-&gt;search_commit_reqs(cinfo, page);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /* Should the pNFS client commit and return the layout upon a setattr */</div><div class='ctx'> static inline bool</div><div class='ctx'> pnfs_ld_layoutret_on_setattr(struct inode *inode)</div><div class='hunk'>@@ -682,6 +688,13 @@ pnfs_lseg_request_intersecting(struct pnfs_layout_segment *lseg, struct nfs_page</div><div class='ctx'> 				req_offset(req), req_last);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline void pnfs_lseg_cancel_io(struct nfs_server *server,</div><div class='add'>+				       struct pnfs_layout_segment *lseg)</div><div class='add'>+{</div><div class='add'>+	if (server-&gt;pnfs_curr_ld-&gt;cancel_io)</div><div class='add'>+		server-&gt;pnfs_curr_ld-&gt;cancel_io(lseg);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> extern unsigned int layoutstats_timer;</div><div class='ctx'> </div><div class='ctx'> #ifdef NFS_DEBUG</div><div class='hunk'>@@ -711,6 +724,11 @@ static inline void pnfs_destroy_layout_final(struct nfs_inode *nfsi)</div><div class='ctx'> {</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline int pnfs_layout_handle_reboot(struct nfs_client *clp)</div><div class='add'>+{</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline struct pnfs_layout_segment *</div><div class='ctx'> pnfs_get_lseg(struct pnfs_layout_segment *lseg)</div><div class='ctx'> {</div><div class='hunk'>@@ -850,13 +868,6 @@ pnfs_recover_commit_reqs(struct list_head *head, struct nfs_commit_info *cinfo)</div><div class='ctx'> {</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline struct nfs_page *</div><div class='del'>-pnfs_search_commit_reqs(struct inode *inode, struct nfs_commit_info *cinfo,</div><div class='del'>-			struct page *page)</div><div class='del'>-{</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static inline int pnfs_layoutcommit_inode(struct inode *inode, bool sync)</div><div class='ctx'> {</div><div class='ctx'> 	return 0;</div><div class='head'>diff --git a/fs/nfs/pnfs_dev.c b/fs/nfs/pnfs_dev.c<br/>index ddbbf4fcda86..bf0f2d67e96c 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/pnfs_dev.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/pnfs_dev.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/pnfs_dev.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/pnfs_dev.c</a></div><div class='hunk'>@@ -110,9 +110,6 @@ nfs4_get_device_info(struct nfs_server *server,</div><div class='ctx'> 	 * GETDEVICEINFO's maxcount</div><div class='ctx'> 	 */</div><div class='ctx'> 	max_resp_sz = server-&gt;nfs_client-&gt;cl_session-&gt;fc_attrs.max_resp_sz;</div><div class='del'>-	if (server-&gt;pnfs_curr_ld-&gt;max_deviceinfo_size &amp;&amp;</div><div class='del'>-	    server-&gt;pnfs_curr_ld-&gt;max_deviceinfo_size &lt; max_resp_sz)</div><div class='del'>-		max_resp_sz = server-&gt;pnfs_curr_ld-&gt;max_deviceinfo_size;</div><div class='ctx'> 	max_pages = nfs_page_array_len(0, max_resp_sz);</div><div class='ctx'> 	dprintk("%s: server %p max_resp_sz %u max_pages %d\n",</div><div class='ctx'> 		__func__, server, max_resp_sz, max_pages);</div><div class='hunk'>@@ -154,7 +151,7 @@ nfs4_get_device_info(struct nfs_server *server,</div><div class='ctx'> 		set_bit(NFS_DEVICEID_NOCACHE, &amp;d-&gt;flags);</div><div class='ctx'> </div><div class='ctx'> out_free_pages:</div><div class='del'>-	for (i = 0; i &lt; max_pages; i++)</div><div class='add'>+	while (--i &gt;= 0)</div><div class='ctx'> 		__free_page(pages[i]);</div><div class='ctx'> 	kfree(pages);</div><div class='ctx'> out_free_pdev:</div><div class='head'>diff --git a/fs/nfs/pnfs_nfs.c b/fs/nfs/pnfs_nfs.c<br/>index 316f68f96e57..9976cc16b689 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/pnfs_nfs.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/pnfs_nfs.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/pnfs_nfs.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/pnfs_nfs.c</a></div><div class='hunk'>@@ -16,6 +16,8 @@</div><div class='ctx'> #include "nfs4session.h"</div><div class='ctx'> #include "internal.h"</div><div class='ctx'> #include "pnfs.h"</div><div class='add'>+#include "netns.h"</div><div class='add'>+#include "nfs4trace.h"</div><div class='ctx'> </div><div class='ctx'> #define NFSDBG_FACILITY		NFSDBG_PNFS</div><div class='ctx'> </div><div class='hunk'>@@ -351,53 +353,6 @@ void pnfs_generic_recover_commit_reqs(struct list_head *dst,</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(pnfs_generic_recover_commit_reqs);</div><div class='ctx'> </div><div class='del'>-static struct nfs_page *</div><div class='del'>-pnfs_bucket_search_commit_reqs(struct pnfs_commit_bucket *buckets,</div><div class='del'>-		unsigned int nbuckets, struct page *page)</div><div class='del'>-{</div><div class='del'>-	struct nfs_page *req;</div><div class='del'>-	struct pnfs_commit_bucket *b;</div><div class='del'>-	unsigned int i;</div><div class='del'>-</div><div class='del'>-	/* Linearly search the commit lists for each bucket until a matching</div><div class='del'>-	 * request is found */</div><div class='del'>-	for (i = 0, b = buckets; i &lt; nbuckets; i++, b++) {</div><div class='del'>-		list_for_each_entry(req, &amp;b-&gt;written, wb_list) {</div><div class='del'>-			if (req-&gt;wb_page == page)</div><div class='del'>-				return req-&gt;wb_head;</div><div class='del'>-		}</div><div class='del'>-		list_for_each_entry(req, &amp;b-&gt;committing, wb_list) {</div><div class='del'>-			if (req-&gt;wb_page == page)</div><div class='del'>-				return req-&gt;wb_head;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/* pnfs_generic_search_commit_reqs - Search lists in @cinfo for the head reqest</div><div class='del'>- *				   for @page</div><div class='del'>- * @cinfo - commit info for current inode</div><div class='del'>- * @page - page to search for matching head request</div><div class='del'>- *</div><div class='del'>- * Returns a the head request if one is found, otherwise returns NULL.</div><div class='del'>- */</div><div class='del'>-struct nfs_page *</div><div class='del'>-pnfs_generic_search_commit_reqs(struct nfs_commit_info *cinfo, struct page *page)</div><div class='del'>-{</div><div class='del'>-	struct pnfs_ds_commit_info *fl_cinfo = cinfo-&gt;ds;</div><div class='del'>-	struct pnfs_commit_array *array;</div><div class='del'>-	struct nfs_page *req;</div><div class='del'>-</div><div class='del'>-	list_for_each_entry(array, &amp;fl_cinfo-&gt;commits, cinfo_list) {</div><div class='del'>-		req = pnfs_bucket_search_commit_reqs(array-&gt;buckets,</div><div class='del'>-				array-&gt;nbuckets, page);</div><div class='del'>-		if (req)</div><div class='del'>-			return req;</div><div class='del'>-	}</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-EXPORT_SYMBOL_GPL(pnfs_generic_search_commit_reqs);</div><div class='del'>-</div><div class='ctx'> static struct pnfs_layout_segment *</div><div class='ctx'> pnfs_bucket_get_committing(struct list_head *head,</div><div class='ctx'> 			   struct pnfs_commit_bucket *bucket,</div><div class='hunk'>@@ -419,7 +374,7 @@ static struct nfs_commit_data *</div><div class='ctx'> pnfs_bucket_fetch_commitdata(struct pnfs_commit_bucket *bucket,</div><div class='ctx'> 			     struct nfs_commit_info *cinfo)</div><div class='ctx'> {</div><div class='del'>-	struct nfs_commit_data *data = nfs_commitdata_alloc(false);</div><div class='add'>+	struct nfs_commit_data *data = nfs_commitdata_alloc();</div><div class='ctx'> </div><div class='ctx'> 	if (!data)</div><div class='ctx'> 		return NULL;</div><div class='hunk'>@@ -515,7 +470,11 @@ pnfs_generic_commit_pagelist(struct inode *inode, struct list_head *mds_pages,</div><div class='ctx'> 	unsigned int nreq = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (!list_empty(mds_pages)) {</div><div class='del'>-		data = nfs_commitdata_alloc(true);</div><div class='add'>+		data = nfs_commitdata_alloc();</div><div class='add'>+		if (!data) {</div><div class='add'>+			nfs_retry_commit(mds_pages, NULL, cinfo, -1);</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+		}</div><div class='ctx'> 		data-&gt;ds_commit_index = -1;</div><div class='ctx'> 		list_splice_init(mds_pages, &amp;data-&gt;pages);</div><div class='ctx'> 		list_add_tail(&amp;data-&gt;list, &amp;list);</div><div class='hunk'>@@ -533,7 +492,7 @@ pnfs_generic_commit_pagelist(struct inode *inode, struct list_head *mds_pages,</div><div class='ctx'> 			nfs_initiate_commit(NFS_CLIENT(inode), data,</div><div class='ctx'> 					    NFS_PROTO(data-&gt;inode),</div><div class='ctx'> 					    data-&gt;mds_ops, how,</div><div class='del'>-					    RPC_TASK_CRED_NOREF);</div><div class='add'>+					    RPC_TASK_CRED_NOREF, NULL);</div><div class='ctx'> 		} else {</div><div class='ctx'> 			nfs_init_commit(data, NULL, data-&gt;lseg, cinfo);</div><div class='ctx'> 			initiate_commit(data, how);</div><div class='hunk'>@@ -547,14 +506,14 @@ EXPORT_SYMBOL_GPL(pnfs_generic_commit_pagelist);</div><div class='ctx'> /*</div><div class='ctx'>  * Data server cache</div><div class='ctx'>  *</div><div class='del'>- * Data servers can be mapped to different device ids.</div><div class='del'>- * nfs4_pnfs_ds reference counting</div><div class='add'>+ * Data servers can be mapped to different device ids, but should</div><div class='add'>+ * never be shared between net namespaces.</div><div class='add'>+ *</div><div class='add'>+ * nfs4_pnfs_ds reference counting:</div><div class='ctx'>  *   - set to 1 on allocation</div><div class='ctx'>  *   - incremented when a device id maps a data server already in the cache.</div><div class='ctx'>  *   - decremented when deviceid is removed from the cache.</div><div class='ctx'>  */</div><div class='del'>-static DEFINE_SPINLOCK(nfs4_ds_cache_lock);</div><div class='del'>-static LIST_HEAD(nfs4_data_server_cache);</div><div class='ctx'> </div><div class='ctx'> /* Debug routines */</div><div class='ctx'> static void</div><div class='hunk'>@@ -647,11 +606,11 @@ _same_data_server_addrs_locked(const struct list_head *dsaddrs1,</div><div class='ctx'>  * Lookup DS by addresses.  nfs4_ds_cache_lock is held</div><div class='ctx'>  */</div><div class='ctx'> static struct nfs4_pnfs_ds *</div><div class='del'>-_data_server_lookup_locked(const struct list_head *dsaddrs)</div><div class='add'>+_data_server_lookup_locked(const struct nfs_net *nn, const struct list_head *dsaddrs)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_pnfs_ds *ds;</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry(ds, &amp;nfs4_data_server_cache, ds_node)</div><div class='add'>+	list_for_each_entry(ds, &amp;nn-&gt;nfs4_data_server_cache, ds_node)</div><div class='ctx'> 		if (_same_data_server_addrs_locked(&amp;ds-&gt;ds_addrs, dsaddrs))</div><div class='ctx'> 			return ds;</div><div class='ctx'> 	return NULL;</div><div class='hunk'>@@ -696,10 +655,11 @@ static void destroy_ds(struct nfs4_pnfs_ds *ds)</div><div class='ctx'> </div><div class='ctx'> void nfs4_pnfs_ds_put(struct nfs4_pnfs_ds *ds)</div><div class='ctx'> {</div><div class='del'>-	if (refcount_dec_and_lock(&amp;ds-&gt;ds_count,</div><div class='del'>-				&amp;nfs4_ds_cache_lock)) {</div><div class='add'>+	struct nfs_net *nn = net_generic(ds-&gt;ds_net, nfs_net_id);</div><div class='add'>+</div><div class='add'>+	if (refcount_dec_and_lock(&amp;ds-&gt;ds_count, &amp;nn-&gt;nfs4_data_server_lock)) {</div><div class='ctx'> 		list_del_init(&amp;ds-&gt;ds_node);</div><div class='del'>-		spin_unlock(&amp;nfs4_ds_cache_lock);</div><div class='add'>+		spin_unlock(&amp;nn-&gt;nfs4_data_server_lock);</div><div class='ctx'> 		destroy_ds(ds);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -759,8 +719,9 @@ out_err:</div><div class='ctx'>  * uncached and return cached struct nfs4_pnfs_ds.</div><div class='ctx'>  */</div><div class='ctx'> struct nfs4_pnfs_ds *</div><div class='del'>-nfs4_pnfs_ds_add(struct list_head *dsaddrs, gfp_t gfp_flags)</div><div class='add'>+nfs4_pnfs_ds_add(const struct net *net, struct list_head *dsaddrs, gfp_t gfp_flags)</div><div class='ctx'> {</div><div class='add'>+	struct nfs_net *nn = net_generic(net, nfs_net_id);</div><div class='ctx'> 	struct nfs4_pnfs_ds *tmp_ds, *ds = NULL;</div><div class='ctx'> 	char *remotestr;</div><div class='ctx'> </div><div class='hunk'>@@ -776,16 +737,17 @@ nfs4_pnfs_ds_add(struct list_head *dsaddrs, gfp_t gfp_flags)</div><div class='ctx'> 	/* this is only used for debugging, so it's ok if its NULL */</div><div class='ctx'> 	remotestr = nfs4_pnfs_remotestr(dsaddrs, gfp_flags);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;nfs4_ds_cache_lock);</div><div class='del'>-	tmp_ds = _data_server_lookup_locked(dsaddrs);</div><div class='add'>+	spin_lock(&amp;nn-&gt;nfs4_data_server_lock);</div><div class='add'>+	tmp_ds = _data_server_lookup_locked(nn, dsaddrs);</div><div class='ctx'> 	if (tmp_ds == NULL) {</div><div class='ctx'> 		INIT_LIST_HEAD(&amp;ds-&gt;ds_addrs);</div><div class='ctx'> 		list_splice_init(dsaddrs, &amp;ds-&gt;ds_addrs);</div><div class='ctx'> 		ds-&gt;ds_remotestr = remotestr;</div><div class='ctx'> 		refcount_set(&amp;ds-&gt;ds_count, 1);</div><div class='ctx'> 		INIT_LIST_HEAD(&amp;ds-&gt;ds_node);</div><div class='add'>+		ds-&gt;ds_net = net;</div><div class='ctx'> 		ds-&gt;ds_clp = NULL;</div><div class='del'>-		list_add(&amp;ds-&gt;ds_node, &amp;nfs4_data_server_cache);</div><div class='add'>+		list_add(&amp;ds-&gt;ds_node, &amp;nn-&gt;nfs4_data_server_cache);</div><div class='ctx'> 		dprintk("%s add new data server %s\n", __func__,</div><div class='ctx'> 			ds-&gt;ds_remotestr);</div><div class='ctx'> 	} else {</div><div class='hunk'>@@ -797,7 +759,7 @@ nfs4_pnfs_ds_add(struct list_head *dsaddrs, gfp_t gfp_flags)</div><div class='ctx'> 			refcount_read(&amp;tmp_ds-&gt;ds_count));</div><div class='ctx'> 		ds = tmp_ds;</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;nfs4_ds_cache_lock);</div><div class='add'>+	spin_unlock(&amp;nn-&gt;nfs4_data_server_lock);</div><div class='ctx'> out:</div><div class='ctx'> 	return ds;</div><div class='ctx'> }</div><div class='hunk'>@@ -817,7 +779,7 @@ static void nfs4_clear_ds_conn_bit(struct nfs4_pnfs_ds *ds)</div><div class='ctx'> </div><div class='ctx'> static struct nfs_client *(*get_v3_ds_connect)(</div><div class='ctx'> 			struct nfs_server *mds_srv,</div><div class='del'>-			const struct sockaddr *ds_addr,</div><div class='add'>+			const struct sockaddr_storage *ds_addr,</div><div class='ctx'> 			int ds_addrlen,</div><div class='ctx'> 			int ds_proto,</div><div class='ctx'> 			unsigned int ds_timeo,</div><div class='hunk'>@@ -847,7 +809,11 @@ static int _nfs4_pnfs_v3_ds_connect(struct nfs_server *mds_srv,</div><div class='ctx'> 				 unsigned int retrans)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_client *clp = ERR_PTR(-EIO);</div><div class='add'>+	struct nfs_client *mds_clp = mds_srv-&gt;nfs_client;</div><div class='add'>+	enum xprtsec_policies xprtsec_policy = mds_clp-&gt;cl_xprtsec.policy;</div><div class='ctx'> 	struct nfs4_pnfs_ds_addr *da;</div><div class='add'>+	unsigned long connect_timeout = timeo * (retrans + 1) * HZ / 10;</div><div class='add'>+	int ds_proto;</div><div class='ctx'> 	int status = 0;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("--&gt; %s DS %s\n", __func__, ds-&gt;ds_remotestr);</div><div class='hunk'>@@ -866,21 +832,33 @@ static int _nfs4_pnfs_v3_ds_connect(struct nfs_server *mds_srv,</div><div class='ctx'> 				.dstaddr = (struct sockaddr *)&amp;da-&gt;da_addr,</div><div class='ctx'> 				.addrlen = da-&gt;da_addrlen,</div><div class='ctx'> 				.servername = clp-&gt;cl_hostname,</div><div class='add'>+				.connect_timeout = connect_timeout,</div><div class='add'>+				.reconnect_timeout = connect_timeout,</div><div class='add'>+				.xprtsec = clp-&gt;cl_xprtsec,</div><div class='ctx'> 			};</div><div class='ctx'> </div><div class='del'>-			if (da-&gt;da_transport != clp-&gt;cl_proto)</div><div class='add'>+			if (xprt_args.ident == XPRT_TRANSPORT_TCP &amp;&amp;</div><div class='add'>+			    clp-&gt;cl_proto == XPRT_TRANSPORT_TCP_TLS)</div><div class='add'>+				xprt_args.ident = XPRT_TRANSPORT_TCP_TLS;</div><div class='add'>+</div><div class='add'>+			if (xprt_args.ident != clp-&gt;cl_proto)</div><div class='ctx'> 				continue;</div><div class='del'>-			if (da-&gt;da_addr.ss_family != clp-&gt;cl_addr.ss_family)</div><div class='add'>+			if (xprt_args.dstaddr-&gt;sa_family !=</div><div class='add'>+			    clp-&gt;cl_addr.ss_family)</div><div class='ctx'> 				continue;</div><div class='ctx'> 			/* Add this address as an alias */</div><div class='ctx'> 			rpc_clnt_add_xprt(clp-&gt;cl_rpcclient, &amp;xprt_args,</div><div class='del'>-					rpc_clnt_test_and_add_xprt, NULL);</div><div class='add'>+					  rpc_clnt_test_and_add_xprt, NULL);</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='del'>-		clp = get_v3_ds_connect(mds_srv,</div><div class='del'>-				(struct sockaddr *)&amp;da-&gt;da_addr,</div><div class='del'>-				da-&gt;da_addrlen, da-&gt;da_transport,</div><div class='del'>-				timeo, retrans);</div><div class='add'>+</div><div class='add'>+		ds_proto = da-&gt;da_transport;</div><div class='add'>+		if (ds_proto == XPRT_TRANSPORT_TCP &amp;&amp;</div><div class='add'>+		    xprtsec_policy != RPC_XPRTSEC_NONE)</div><div class='add'>+			ds_proto = XPRT_TRANSPORT_TCP_TLS;</div><div class='add'>+</div><div class='add'>+		clp = get_v3_ds_connect(mds_srv, &amp;da-&gt;da_addr, da-&gt;da_addrlen,</div><div class='add'>+					ds_proto, timeo, retrans);</div><div class='ctx'> 		if (IS_ERR(clp))</div><div class='ctx'> 			continue;</div><div class='ctx'> 		clp-&gt;cl_rpcclient-&gt;cl_softerr = 0;</div><div class='hunk'>@@ -906,12 +884,17 @@ static int _nfs4_pnfs_v4_ds_connect(struct nfs_server *mds_srv,</div><div class='ctx'> 				 u32 minor_version)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_client *clp = ERR_PTR(-EIO);</div><div class='add'>+	struct nfs_client *mds_clp = mds_srv-&gt;nfs_client;</div><div class='add'>+	enum xprtsec_policies xprtsec_policy = mds_clp-&gt;cl_xprtsec.policy;</div><div class='ctx'> 	struct nfs4_pnfs_ds_addr *da;</div><div class='add'>+	int ds_proto;</div><div class='ctx'> 	int status = 0;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("--&gt; %s DS %s\n", __func__, ds-&gt;ds_remotestr);</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry(da, &amp;ds-&gt;ds_addrs, da_node) {</div><div class='add'>+		char servername[48];</div><div class='add'>+</div><div class='ctx'> 		dprintk("%s: DS %s: trying address %s\n",</div><div class='ctx'> 			__func__, ds-&gt;ds_remotestr, da-&gt;da_remotestr);</div><div class='ctx'> </div><div class='hunk'>@@ -922,6 +905,7 @@ static int _nfs4_pnfs_v4_ds_connect(struct nfs_server *mds_srv,</div><div class='ctx'> 				.dstaddr = (struct sockaddr *)&amp;da-&gt;da_addr,</div><div class='ctx'> 				.addrlen = da-&gt;da_addrlen,</div><div class='ctx'> 				.servername = clp-&gt;cl_hostname,</div><div class='add'>+				.xprtsec = clp-&gt;cl_xprtsec,</div><div class='ctx'> 			};</div><div class='ctx'> 			struct nfs4_add_xprt_data xprtdata = {</div><div class='ctx'> 				.clp = clp,</div><div class='hunk'>@@ -931,26 +915,63 @@ static int _nfs4_pnfs_v4_ds_connect(struct nfs_server *mds_srv,</div><div class='ctx'> 				.data = &amp;xprtdata,</div><div class='ctx'> 			};</div><div class='ctx'> </div><div class='del'>-			if (da-&gt;da_transport != clp-&gt;cl_proto)</div><div class='add'>+			if (xprt_args.ident == XPRT_TRANSPORT_TCP &amp;&amp;</div><div class='add'>+			    clp-&gt;cl_proto == XPRT_TRANSPORT_TCP_TLS) {</div><div class='add'>+				struct sockaddr *addr =</div><div class='add'>+					(struct sockaddr *)&amp;da-&gt;da_addr;</div><div class='add'>+				struct sockaddr_in *sin =</div><div class='add'>+					(struct sockaddr_in *)&amp;da-&gt;da_addr;</div><div class='add'>+				struct sockaddr_in6 *sin6 =</div><div class='add'>+					(struct sockaddr_in6 *)&amp;da-&gt;da_addr;</div><div class='add'>+</div><div class='add'>+				/* for NFS with TLS we need to supply a correct</div><div class='add'>+				 * servername of the trunked transport, not the</div><div class='add'>+				 * servername of the main transport stored in</div><div class='add'>+				 * clp-&gt;cl_hostname. And set the protocol to</div><div class='add'>+				 * indicate to use TLS</div><div class='add'>+				 */</div><div class='add'>+				servername[0] = '\0';</div><div class='add'>+				switch(addr-&gt;sa_family) {</div><div class='add'>+				case AF_INET:</div><div class='add'>+					snprintf(servername, sizeof(servername),</div><div class='add'>+						"%pI4", &amp;sin-&gt;sin_addr.s_addr);</div><div class='add'>+					break;</div><div class='add'>+				case AF_INET6:</div><div class='add'>+					snprintf(servername, sizeof(servername),</div><div class='add'>+						"%pI6", &amp;sin6-&gt;sin6_addr);</div><div class='add'>+					break;</div><div class='add'>+				default:</div><div class='add'>+					/* do not consider this address */</div><div class='add'>+					continue;</div><div class='add'>+				}</div><div class='add'>+				xprt_args.ident = XPRT_TRANSPORT_TCP_TLS;</div><div class='add'>+				xprt_args.servername = servername;</div><div class='add'>+			}</div><div class='add'>+			if (xprt_args.ident != clp-&gt;cl_proto)</div><div class='ctx'> 				continue;</div><div class='del'>-			if (da-&gt;da_addr.ss_family != clp-&gt;cl_addr.ss_family)</div><div class='add'>+			if (xprt_args.dstaddr-&gt;sa_family !=</div><div class='add'>+			    clp-&gt;cl_addr.ss_family)</div><div class='ctx'> 				continue;</div><div class='add'>+</div><div class='ctx'> 			/**</div><div class='ctx'> 			* Test this address for session trunking and</div><div class='ctx'> 			* add as an alias</div><div class='ctx'> 			*/</div><div class='del'>-			xprtdata.cred = nfs4_get_clid_cred(clp),</div><div class='add'>+			xprtdata.cred = nfs4_get_clid_cred(clp);</div><div class='ctx'> 			rpc_clnt_add_xprt(clp-&gt;cl_rpcclient, &amp;xprt_args,</div><div class='ctx'> 					  rpc_clnt_setup_test_and_add_xprt,</div><div class='ctx'> 					  &amp;rpcdata);</div><div class='ctx'> 			if (xprtdata.cred)</div><div class='ctx'> 				put_cred(xprtdata.cred);</div><div class='ctx'> 		} else {</div><div class='del'>-			clp = nfs4_set_ds_client(mds_srv,</div><div class='del'>-						(struct sockaddr *)&amp;da-&gt;da_addr,</div><div class='del'>-						da-&gt;da_addrlen,</div><div class='del'>-						da-&gt;da_transport, timeo,</div><div class='del'>-						retrans, minor_version);</div><div class='add'>+			ds_proto = da-&gt;da_transport;</div><div class='add'>+			if (ds_proto == XPRT_TRANSPORT_TCP &amp;&amp;</div><div class='add'>+			    xprtsec_policy != RPC_XPRTSEC_NONE)</div><div class='add'>+				ds_proto = XPRT_TRANSPORT_TCP_TLS;</div><div class='add'>+</div><div class='add'>+			clp = nfs4_set_ds_client(mds_srv, &amp;da-&gt;da_addr,</div><div class='add'>+						 da-&gt;da_addrlen, ds_proto,</div><div class='add'>+						 timeo, retrans, minor_version);</div><div class='ctx'> 			if (IS_ERR(clp))</div><div class='ctx'> 				continue;</div><div class='ctx'> </div><div class='hunk'>@@ -961,7 +982,6 @@ static int _nfs4_pnfs_v4_ds_connect(struct nfs_server *mds_srv,</div><div class='ctx'> 				clp = ERR_PTR(-EIO);</div><div class='ctx'> 				continue;</div><div class='ctx'> 			}</div><div class='del'>-</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -992,8 +1012,10 @@ int nfs4_pnfs_ds_connect(struct nfs_server *mds_srv, struct nfs4_pnfs_ds *ds,</div><div class='ctx'> 		err = nfs4_wait_ds_connect(ds);</div><div class='ctx'> 		if (err || ds-&gt;ds_clp)</div><div class='ctx'> 			goto out;</div><div class='del'>-		if (nfs4_test_deviceid_unavailable(devid))</div><div class='del'>-			return -ENODEV;</div><div class='add'>+		if (nfs4_test_deviceid_unavailable(devid)) {</div><div class='add'>+			err = -ENODEV;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> 	} while (test_and_set_bit(NFS4DS_CONNECTING, &amp;ds-&gt;ds_state) != 0);</div><div class='ctx'> </div><div class='ctx'> 	if (ds-&gt;ds_clp)</div><div class='hunk'>@@ -1023,11 +1045,12 @@ out:</div><div class='ctx'> 		if (!ds-&gt;ds_clp || !nfs_client_init_is_complete(ds-&gt;ds_clp)) {</div><div class='ctx'> 			WARN_ON_ONCE(ds-&gt;ds_clp ||</div><div class='ctx'> 				!nfs4_test_deviceid_unavailable(devid));</div><div class='del'>-			return -EINVAL;</div><div class='del'>-		}</div><div class='del'>-		err = nfs_client_init_status(ds-&gt;ds_clp);</div><div class='add'>+			err = -EINVAL;</div><div class='add'>+		} else</div><div class='add'>+			err = nfs_client_init_status(ds-&gt;ds_clp);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	trace_pnfs_ds_connect(ds-&gt;ds_remotestr, err);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs4_pnfs_ds_connect);</div><div class='hunk'>@@ -1176,7 +1199,7 @@ pnfs_layout_mark_request_commit(struct nfs_page *req,</div><div class='ctx'> </div><div class='ctx'> 	nfs_request_add_commit_list_locked(req, list, cinfo);</div><div class='ctx'> 	mutex_unlock(&amp;NFS_I(cinfo-&gt;inode)-&gt;commit_mutex);</div><div class='del'>-	nfs_mark_page_unstable(req-&gt;wb_page, cinfo);</div><div class='add'>+	nfs_folio_mark_unstable(nfs_page_to_folio(req), cinfo);</div><div class='ctx'> 	return;</div><div class='ctx'> out_resched:</div><div class='ctx'> 	mutex_unlock(&amp;NFS_I(cinfo-&gt;inode)-&gt;commit_mutex);</div><div class='head'>diff --git a/fs/nfs/proc.c b/fs/nfs/proc.c<br/>index 73dcaa99fa9b..63e71310b9f6 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/proc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/proc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/proc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/proc.c</a></div><div class='hunk'>@@ -92,6 +92,7 @@ nfs_proc_get_root(struct nfs_server *server, struct nfs_fh *fhandle,</div><div class='ctx'> 	info-&gt;maxfilesize = 0x7FFFFFFF;</div><div class='ctx'> 	info-&gt;lease_time = 0;</div><div class='ctx'> 	info-&gt;change_attr_type = NFS4_CHANGE_TYPE_IS_UNDEFINED;</div><div class='add'>+	info-&gt;xattr_support = 0;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -152,13 +153,13 @@ nfs_proc_setattr(struct dentry *dentry, struct nfs_fattr *fattr,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-nfs_proc_lookup(struct inode *dir, struct dentry *dentry,</div><div class='add'>+nfs_proc_lookup(struct inode *dir, struct dentry *dentry, const struct qstr *name,</div><div class='ctx'> 		struct nfs_fh *fhandle, struct nfs_fattr *fattr)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_diropargs	arg = {</div><div class='ctx'> 		.fh		= NFS_FH(dir),</div><div class='del'>-		.name		= dentry-&gt;d_name.name,</div><div class='del'>-		.len		= dentry-&gt;d_name.len</div><div class='add'>+		.name		= name-&gt;name,</div><div class='add'>+		.len		= name-&gt;len</div><div class='ctx'> 	};</div><div class='ctx'> 	struct nfs_diropok	res = {</div><div class='ctx'> 		.fh		= fhandle,</div><div class='hunk'>@@ -395,9 +396,10 @@ nfs_proc_link(struct inode *inode, struct inode *dir, const struct qstr *name)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-nfs_proc_symlink(struct inode *dir, struct dentry *dentry, struct page *page,</div><div class='add'>+nfs_proc_symlink(struct inode *dir, struct dentry *dentry, struct folio *folio,</div><div class='ctx'> 		 unsigned int len, struct iattr *sattr)</div><div class='ctx'> {</div><div class='add'>+	struct page *page = &amp;folio-&gt;page;</div><div class='ctx'> 	struct nfs_fh *fh;</div><div class='ctx'> 	struct nfs_fattr *fattr;</div><div class='ctx'> 	struct nfs_symlinkargs	arg = {</div><div class='hunk'>@@ -444,13 +446,14 @@ out:</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int</div><div class='add'>+static struct dentry *</div><div class='ctx'> nfs_proc_mkdir(struct inode *dir, struct dentry *dentry, struct iattr *sattr)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_createdata *data;</div><div class='ctx'> 	struct rpc_message msg = {</div><div class='ctx'> 		.rpc_proc	= &amp;nfs_procedures[NFSPROC_MKDIR],</div><div class='ctx'> 	};</div><div class='add'>+	struct dentry *alias = NULL;</div><div class='ctx'> 	int status = -ENOMEM;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("NFS call  mkdir %pd\n", dentry);</div><div class='hunk'>@@ -462,12 +465,15 @@ nfs_proc_mkdir(struct inode *dir, struct dentry *dentry, struct iattr *sattr)</div><div class='ctx'> </div><div class='ctx'> 	status = rpc_call_sync(NFS_CLIENT(dir), &amp;msg, 0);</div><div class='ctx'> 	nfs_mark_for_revalidate(dir);</div><div class='del'>-	if (status == 0)</div><div class='del'>-		status = nfs_instantiate(dentry, data-&gt;res.fh, data-&gt;res.fattr);</div><div class='add'>+	if (status == 0) {</div><div class='add'>+		alias = nfs_add_or_obtain(dentry, data-&gt;res.fh, data-&gt;res.fattr);</div><div class='add'>+		status = PTR_ERR_OR_ZERO(alias);</div><div class='add'>+	} else</div><div class='add'>+		alias = ERR_PTR(status);</div><div class='ctx'> 	nfs_free_createdata(data);</div><div class='ctx'> out:</div><div class='ctx'> 	dprintk("NFS reply mkdir: %d\n", status);</div><div class='del'>-	return status;</div><div class='add'>+	return alias;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='hunk'>@@ -685,14 +691,22 @@ out_einval:</div><div class='ctx'> 	return -EINVAL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int nfs_have_delegation(struct inode *inode, fmode_t flags)</div><div class='add'>+static int nfs_have_delegation(struct inode *inode, fmode_t type, int flags)</div><div class='add'>+{</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int nfs_return_delegation(struct inode *inode)</div><div class='ctx'> {</div><div class='add'>+	if (S_ISREG(inode-&gt;i_mode))</div><div class='add'>+		nfs_wb_all(inode);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct inode_operations nfs_dir_inode_operations = {</div><div class='ctx'> 	.create		= nfs_create,</div><div class='ctx'> 	.lookup		= nfs_lookup,</div><div class='add'>+	.atomic_open	= nfs_atomic_open_v23,</div><div class='ctx'> 	.link		= nfs_link,</div><div class='ctx'> 	.unlink		= nfs_unlink,</div><div class='ctx'> 	.symlink	= nfs_symlink,</div><div class='hunk'>@@ -754,6 +768,7 @@ const struct nfs_rpc_ops nfs_v2_clientops = {</div><div class='ctx'> 	.lock_check_bounds = nfs_lock_check_bounds,</div><div class='ctx'> 	.close_context	= nfs_close_context,</div><div class='ctx'> 	.have_delegation = nfs_have_delegation,</div><div class='add'>+	.return_delegation = nfs_return_delegation,</div><div class='ctx'> 	.alloc_client	= nfs_alloc_client,</div><div class='ctx'> 	.init_client	= nfs_init_client,</div><div class='ctx'> 	.free_client	= nfs_free_client,</div><div class='head'>diff --git a/fs/nfs/read.c b/fs/nfs/read.c<br/>index d11af2a9299c..3c1fa320b3f1 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/read.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/read.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/read.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/read.c</a></div><div class='hunk'>@@ -15,6 +15,7 @@</div><div class='ctx'> #include &lt;linux/stat.h&gt;</div><div class='ctx'> #include &lt;linux/mm.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='add'>+#include &lt;linux/task_io_accounting_ops.h&gt;</div><div class='ctx'> #include &lt;linux/pagemap.h&gt;</div><div class='ctx'> #include &lt;linux/sunrpc/clnt.h&gt;</div><div class='ctx'> #include &lt;linux/nfs_fs.h&gt;</div><div class='hunk'>@@ -27,10 +28,11 @@</div><div class='ctx'> #include "fscache.h"</div><div class='ctx'> #include "pnfs.h"</div><div class='ctx'> #include "nfstrace.h"</div><div class='add'>+#include "delegation.h"</div><div class='ctx'> </div><div class='ctx'> #define NFSDBG_FACILITY		NFSDBG_PAGECACHE</div><div class='ctx'> </div><div class='del'>-static const struct nfs_pgio_completion_ops nfs_async_read_completion_ops;</div><div class='add'>+const struct nfs_pgio_completion_ops nfs_async_read_completion_ops;</div><div class='ctx'> static const struct nfs_rw_ops nfs_rw_read_ops;</div><div class='ctx'> </div><div class='ctx'> static struct kmem_cache *nfs_rdata_cachep;</div><div class='hunk'>@@ -46,15 +48,16 @@ static struct nfs_pgio_header *nfs_readhdr_alloc(void)</div><div class='ctx'> </div><div class='ctx'> static void nfs_readhdr_free(struct nfs_pgio_header *rhdr)</div><div class='ctx'> {</div><div class='add'>+	kfree(rhdr-&gt;res.scratch);</div><div class='ctx'> 	kmem_cache_free(nfs_rdata_cachep, rhdr);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static</div><div class='del'>-int nfs_return_empty_page(struct page *page)</div><div class='add'>+static int nfs_return_empty_folio(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	zero_user(page, 0, PAGE_SIZE);</div><div class='del'>-	SetPageUptodate(page);</div><div class='del'>-	unlock_page(page);</div><div class='add'>+	folio_zero_segment(folio, 0, folio_size(folio));</div><div class='add'>+	folio_mark_uptodate(folio);</div><div class='add'>+	if (nfs_netfs_folio_unlock(folio))</div><div class='add'>+		folio_unlock(folio);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -74,7 +77,7 @@ void nfs_pageio_init_read(struct nfs_pageio_descriptor *pgio,</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_pageio_init_read);</div><div class='ctx'> </div><div class='del'>-static void nfs_pageio_complete_read(struct nfs_pageio_descriptor *pgio)</div><div class='add'>+void nfs_pageio_complete_read(struct nfs_pageio_descriptor *pgio)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_pgio_mirror *pgm;</div><div class='ctx'> 	unsigned long npages;</div><div class='hunk'>@@ -108,38 +111,29 @@ void nfs_pageio_reset_read_mds(struct nfs_pageio_descriptor *pgio)</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_pageio_reset_read_mds);</div><div class='ctx'> </div><div class='add'>+bool nfs_read_alloc_scratch(struct nfs_pgio_header *hdr, size_t size)</div><div class='add'>+{</div><div class='add'>+	WARN_ON(hdr-&gt;res.scratch != NULL);</div><div class='add'>+	hdr-&gt;res.scratch = kmalloc(size, GFP_KERNEL);</div><div class='add'>+	return hdr-&gt;res.scratch != NULL;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(nfs_read_alloc_scratch);</div><div class='add'>+</div><div class='ctx'> static void nfs_readpage_release(struct nfs_page *req, int error)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = d_inode(nfs_req_openctx(req)-&gt;dentry);</div><div class='del'>-	struct page *page = req-&gt;wb_page;</div><div class='del'>-</div><div class='del'>-	dprintk("NFS: read done (%s/%llu %d@%lld)\n", inode-&gt;i_sb-&gt;s_id,</div><div class='del'>-		(unsigned long long)NFS_FILEID(inode), req-&gt;wb_bytes,</div><div class='del'>-		(long long)req_offset(req));</div><div class='del'>-</div><div class='del'>-	if (nfs_error_is_fatal_on_server(error) &amp;&amp; error != -ETIMEDOUT)</div><div class='del'>-		SetPageError(page);</div><div class='del'>-	if (nfs_page_group_sync_on_bit(req, PG_UNLOCKPAGE)) {</div><div class='del'>-		struct address_space *mapping = page_file_mapping(page);</div><div class='del'>-</div><div class='del'>-		if (PageUptodate(page))</div><div class='del'>-			nfs_readpage_to_fscache(inode, page, 0);</div><div class='del'>-		else if (!PageError(page) &amp;&amp; !PagePrivate(page))</div><div class='del'>-			generic_error_remove_page(mapping, page);</div><div class='del'>-		unlock_page(page);</div><div class='del'>-	}</div><div class='add'>+	struct folio *folio = nfs_page_to_folio(req);</div><div class='add'>+</div><div class='add'>+	if (nfs_page_group_sync_on_bit(req, PG_UNLOCKPAGE))</div><div class='add'>+		if (nfs_netfs_folio_unlock(folio))</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+</div><div class='ctx'> 	nfs_release_request(req);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct nfs_readdesc {</div><div class='del'>-	struct nfs_pageio_descriptor pgio;</div><div class='del'>-	struct nfs_open_context *ctx;</div><div class='del'>-};</div><div class='del'>-</div><div class='ctx'> static void nfs_page_group_set_uptodate(struct nfs_page *req)</div><div class='ctx'> {</div><div class='ctx'> 	if (nfs_page_group_sync_on_bit(req, PG_UPTODATE))</div><div class='del'>-		SetPageUptodate(req-&gt;wb_page);</div><div class='add'>+		folio_mark_uptodate(nfs_page_to_folio(req));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void nfs_read_completion(struct nfs_pgio_header *hdr)</div><div class='hunk'>@@ -151,24 +145,25 @@ static void nfs_read_completion(struct nfs_pgio_header *hdr)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	while (!list_empty(&amp;hdr-&gt;pages)) {</div><div class='ctx'> 		struct nfs_page *req = nfs_list_entry(hdr-&gt;pages.next);</div><div class='del'>-		struct page *page = req-&gt;wb_page;</div><div class='add'>+		struct folio *folio = nfs_page_to_folio(req);</div><div class='ctx'> 		unsigned long start = req-&gt;wb_pgbase;</div><div class='ctx'> 		unsigned long end = req-&gt;wb_pgbase + req-&gt;wb_bytes;</div><div class='ctx'> </div><div class='ctx'> 		if (test_bit(NFS_IOHDR_EOF, &amp;hdr-&gt;flags)) {</div><div class='ctx'> 			/* note: regions of the page not covered by a</div><div class='del'>-			 * request are zeroed in readpage_async_filler */</div><div class='add'>+			 * request are zeroed in nfs_read_add_folio</div><div class='add'>+			 */</div><div class='ctx'> 			if (bytes &gt; hdr-&gt;good_bytes) {</div><div class='ctx'> 				/* nothing in this request was good, so zero</div><div class='ctx'> 				 * the full extent of the request */</div><div class='del'>-				zero_user_segment(page, start, end);</div><div class='add'>+				folio_zero_segment(folio, start, end);</div><div class='ctx'> </div><div class='ctx'> 			} else if (hdr-&gt;good_bytes - bytes &lt; req-&gt;wb_bytes) {</div><div class='ctx'> 				/* part of this request has good bytes, but</div><div class='ctx'> 				 * not all. zero the bad bytes */</div><div class='ctx'> 				start += hdr-&gt;good_bytes - bytes;</div><div class='ctx'> 				WARN_ON(start &lt; req-&gt;wb_pgbase);</div><div class='del'>-				zero_user_segment(page, start, end);</div><div class='add'>+				folio_zero_segment(folio, start, end);</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 		error = 0;</div><div class='hunk'>@@ -185,6 +180,8 @@ static void nfs_read_completion(struct nfs_pgio_header *hdr)</div><div class='ctx'> 		nfs_list_remove_request(req);</div><div class='ctx'> 		nfs_readpage_release(req, error);</div><div class='ctx'> 	}</div><div class='add'>+	nfs_netfs_read_completion(hdr);</div><div class='add'>+</div><div class='ctx'> out:</div><div class='ctx'> 	hdr-&gt;release(hdr);</div><div class='ctx'> }</div><div class='hunk'>@@ -194,11 +191,8 @@ static void nfs_initiate_read(struct nfs_pgio_header *hdr,</div><div class='ctx'> 			      const struct nfs_rpc_ops *rpc_ops,</div><div class='ctx'> 			      struct rpc_task_setup *task_setup_data, int how)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = hdr-&gt;inode;</div><div class='del'>-	int swap_flags = IS_SWAPFILE(inode) ? NFS_RPC_SWAPFLAGS : 0;</div><div class='del'>-</div><div class='del'>-	task_setup_data-&gt;flags |= swap_flags;</div><div class='ctx'> 	rpc_ops-&gt;read_setup(hdr, msg);</div><div class='add'>+	nfs_netfs_initiate_read(hdr);</div><div class='ctx'> 	trace_nfs_initiate_read(hdr);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -214,7 +208,7 @@ nfs_async_read_error(struct list_head *head, int error)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static const struct nfs_pgio_completion_ops nfs_async_read_completion_ops = {</div><div class='add'>+const struct nfs_pgio_completion_ops nfs_async_read_completion_ops = {</div><div class='ctx'> 	.error_cleanup = nfs_async_read_error,</div><div class='ctx'> 	.completion = nfs_read_completion,</div><div class='ctx'> };</div><div class='hunk'>@@ -289,156 +283,171 @@ static void nfs_readpage_result(struct rpc_task *task,</div><div class='ctx'> 		nfs_readpage_retry(task, hdr);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int</div><div class='del'>-readpage_async_filler(void *data, struct page *page)</div><div class='add'>+int nfs_read_add_folio(struct nfs_pageio_descriptor *pgio,</div><div class='add'>+		       struct nfs_open_context *ctx,</div><div class='add'>+		       struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct nfs_readdesc *desc = data;</div><div class='del'>-	struct inode *inode = page_file_mapping(page)-&gt;host;</div><div class='del'>-	unsigned int rsize = NFS_SERVER(inode)-&gt;rsize;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+	struct nfs_server *server = NFS_SERVER(inode);</div><div class='add'>+	size_t fsize = folio_size(folio);</div><div class='add'>+	unsigned int rsize = server-&gt;rsize;</div><div class='ctx'> 	struct nfs_page *new;</div><div class='ctx'> 	unsigned int len, aligned_len;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	len = nfs_page_length(page);</div><div class='add'>+	len = nfs_folio_length(folio);</div><div class='ctx'> 	if (len == 0)</div><div class='del'>-		return nfs_return_empty_page(page);</div><div class='add'>+		return nfs_return_empty_folio(folio);</div><div class='ctx'> </div><div class='del'>-	aligned_len = min_t(unsigned int, ALIGN(len, rsize), PAGE_SIZE);</div><div class='add'>+	aligned_len = min_t(unsigned int, ALIGN(len, rsize), fsize);</div><div class='ctx'> </div><div class='del'>-	new = nfs_create_request(desc-&gt;ctx, page, 0, aligned_len);</div><div class='del'>-	if (IS_ERR(new))</div><div class='del'>-		goto out_error;</div><div class='add'>+	new = nfs_page_create_from_folio(ctx, folio, 0, aligned_len);</div><div class='add'>+	if (IS_ERR(new)) {</div><div class='add'>+		error = PTR_ERR(new);</div><div class='add'>+		if (nfs_netfs_folio_unlock(folio))</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (len &lt; PAGE_SIZE)</div><div class='del'>-		zero_user_segment(page, len, PAGE_SIZE);</div><div class='del'>-	if (!nfs_pageio_add_request(&amp;desc-&gt;pgio, new)) {</div><div class='add'>+	if (len &lt; fsize)</div><div class='add'>+		folio_zero_segment(folio, len, fsize);</div><div class='add'>+	if (!nfs_pageio_add_request(pgio, new)) {</div><div class='ctx'> 		nfs_list_remove_request(new);</div><div class='del'>-		error = desc-&gt;pgio.pg_error;</div><div class='add'>+		error = pgio-&gt;pg_error;</div><div class='ctx'> 		nfs_readpage_release(new, error);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='del'>-out_error:</div><div class='del'>-	error = PTR_ERR(new);</div><div class='del'>-	unlock_page(page);</div><div class='ctx'> out:</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Read a page over NFS.</div><div class='del'>- * We read the page synchronously in the following case:</div><div class='del'>- *  -	The error flag is set for this page. This happens only when a</div><div class='del'>- *	previous async read operation failed.</div><div class='add'>+ * Actually read a folio over the wire.</div><div class='add'>+ */</div><div class='add'>+static int nfs_do_read_folio(struct file *file, struct folio *folio)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='add'>+	struct nfs_pageio_descriptor pgio;</div><div class='add'>+	struct nfs_open_context *ctx;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ctx = get_nfs_open_context(nfs_file_open_context(file));</div><div class='add'>+</div><div class='add'>+	xchg(&amp;ctx-&gt;error, 0);</div><div class='add'>+	nfs_pageio_init_read(&amp;pgio, inode, false,</div><div class='add'>+			     &amp;nfs_async_read_completion_ops);</div><div class='add'>+</div><div class='add'>+	ret = nfs_read_add_folio(&amp;pgio, ctx, folio);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_put;</div><div class='add'>+</div><div class='add'>+	nfs_pageio_complete_read(&amp;pgio);</div><div class='add'>+	nfs_update_delegated_atime(inode);</div><div class='add'>+	if (pgio.pg_error &lt; 0) {</div><div class='add'>+		ret = pgio.pg_error;</div><div class='add'>+		goto out_put;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = folio_wait_locked_killable(folio);</div><div class='add'>+	if (!folio_test_uptodate(folio) &amp;&amp; !ret)</div><div class='add'>+		ret = xchg(&amp;ctx-&gt;error, 0);</div><div class='add'>+</div><div class='add'>+out_put:</div><div class='add'>+	put_nfs_open_context(ctx);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Synchronously read a folio.</div><div class='add'>+ *</div><div class='add'>+ * This is not heavily used as most users to try an asynchronous</div><div class='add'>+ * large read through -&gt;readahead first.</div><div class='ctx'>  */</div><div class='del'>-int nfs_readpage(struct file *file, struct page *page)</div><div class='add'>+int nfs_read_folio(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct nfs_readdesc desc;</div><div class='del'>-	struct inode *inode = page_file_mapping(page)-&gt;host;</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='add'>+	loff_t pos = folio_pos(folio);</div><div class='add'>+	size_t len = folio_size(folio);</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	trace_nfs_aop_readpage(inode, page);</div><div class='add'>+	trace_nfs_aop_readpage(inode, pos, len);</div><div class='ctx'> 	nfs_inc_stats(inode, NFSIOS_VFSREADPAGE);</div><div class='add'>+	task_io_account_read(len);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Try to flush any pending writes to the file..</div><div class='ctx'> 	 *</div><div class='del'>-	 * NOTE! Because we own the page lock, there cannot</div><div class='add'>+	 * NOTE! Because we own the folio lock, there cannot</div><div class='ctx'> 	 * be any new pending writes generated at this point</div><div class='del'>-	 * for this page (other pages can be written to).</div><div class='add'>+	 * for this folio (other folios can be written to).</div><div class='ctx'> 	 */</div><div class='del'>-	ret = nfs_wb_page(inode, page);</div><div class='add'>+	ret = nfs_wb_folio(inode, folio);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out_unlock;</div><div class='del'>-	if (PageUptodate(page))</div><div class='add'>+	if (folio_test_uptodate(folio))</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='ctx'> 	ret = -ESTALE;</div><div class='ctx'> 	if (NFS_STALE(inode))</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='del'>-	if (file == NULL) {</div><div class='del'>-		ret = -EBADF;</div><div class='del'>-		desc.ctx = nfs_find_open_context(inode, NULL, FMODE_READ);</div><div class='del'>-		if (desc.ctx == NULL)</div><div class='del'>-			goto out_unlock;</div><div class='del'>-	} else</div><div class='del'>-		desc.ctx = get_nfs_open_context(nfs_file_open_context(file));</div><div class='del'>-</div><div class='del'>-	xchg(&amp;desc.ctx-&gt;error, 0);</div><div class='del'>-	if (!IS_SYNC(inode)) {</div><div class='del'>-		ret = nfs_readpage_from_fscache(desc.ctx, inode, page);</div><div class='del'>-		if (ret == 0)</div><div class='del'>-			goto out_wait;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	nfs_pageio_init_read(&amp;desc.pgio, inode, false,</div><div class='del'>-			     &amp;nfs_async_read_completion_ops);</div><div class='del'>-</div><div class='del'>-	ret = readpage_async_filler(&amp;desc, page);</div><div class='add'>+	ret = nfs_netfs_read_folio(file, folio);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	nfs_pageio_complete_read(&amp;desc.pgio);</div><div class='del'>-	ret = desc.pgio.pg_error &lt; 0 ? desc.pgio.pg_error : 0;</div><div class='del'>-out_wait:</div><div class='del'>-	if (!ret) {</div><div class='del'>-		ret = wait_on_page_locked_killable(page);</div><div class='del'>-		if (!PageUptodate(page) &amp;&amp; !ret)</div><div class='del'>-			ret = xchg(&amp;desc.ctx-&gt;error, 0);</div><div class='del'>-	}</div><div class='add'>+		ret = nfs_do_read_folio(file, folio);</div><div class='ctx'> out:</div><div class='del'>-	put_nfs_open_context(desc.ctx);</div><div class='del'>-	trace_nfs_aop_readpage_done(inode, page, ret);</div><div class='add'>+	trace_nfs_aop_readpage_done(inode, pos, len, ret);</div><div class='ctx'> 	return ret;</div><div class='ctx'> out_unlock:</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	trace_nfs_aop_readpage_done(inode, page, ret);</div><div class='del'>-	return ret;</div><div class='add'>+	folio_unlock(folio);</div><div class='add'>+	goto out;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int nfs_readpages(struct file *file, struct address_space *mapping,</div><div class='del'>-		struct list_head *pages, unsigned nr_pages)</div><div class='add'>+void nfs_readahead(struct readahead_control *ractl)</div><div class='ctx'> {</div><div class='del'>-	struct nfs_readdesc desc;</div><div class='del'>-	struct inode *inode = mapping-&gt;host;</div><div class='add'>+	struct nfs_pageio_descriptor pgio;</div><div class='add'>+	struct nfs_open_context *ctx;</div><div class='add'>+	unsigned int nr_pages = readahead_count(ractl);</div><div class='add'>+	struct file *file = ractl-&gt;file;</div><div class='add'>+	struct inode *inode = ractl-&gt;mapping-&gt;host;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	trace_nfs_aop_readahead(inode, lru_to_page(pages), nr_pages);</div><div class='add'>+	trace_nfs_aop_readahead(inode, readahead_pos(ractl), nr_pages);</div><div class='ctx'> 	nfs_inc_stats(inode, NFSIOS_VFSREADPAGES);</div><div class='add'>+	task_io_account_read(readahead_length(ractl));</div><div class='ctx'> </div><div class='ctx'> 	ret = -ESTALE;</div><div class='ctx'> 	if (NFS_STALE(inode))</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='add'>+	ret = nfs_netfs_readahead(ractl);</div><div class='add'>+	if (!ret)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='ctx'> 	if (file == NULL) {</div><div class='ctx'> 		ret = -EBADF;</div><div class='del'>-		desc.ctx = nfs_find_open_context(inode, NULL, FMODE_READ);</div><div class='del'>-		if (desc.ctx == NULL)</div><div class='add'>+		ctx = nfs_find_open_context(inode, NULL, FMODE_READ);</div><div class='add'>+		if (ctx == NULL)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	} else</div><div class='del'>-		desc.ctx = get_nfs_open_context(nfs_file_open_context(file));</div><div class='del'>-</div><div class='del'>-	/* attempt to read as many of the pages as possible from the cache</div><div class='del'>-	 * - this returns -ENOBUFS immediately if the cookie is negative</div><div class='del'>-	 */</div><div class='del'>-	ret = nfs_readpages_from_fscache(desc.ctx, inode, mapping,</div><div class='del'>-					 pages, &amp;nr_pages);</div><div class='del'>-	if (ret == 0)</div><div class='del'>-		goto read_complete; /* all pages were read */</div><div class='add'>+		ctx = get_nfs_open_context(nfs_file_open_context(file));</div><div class='ctx'> </div><div class='del'>-	nfs_pageio_init_read(&amp;desc.pgio, inode, false,</div><div class='add'>+	nfs_pageio_init_read(&amp;pgio, inode, false,</div><div class='ctx'> 			     &amp;nfs_async_read_completion_ops);</div><div class='ctx'> </div><div class='del'>-	ret = read_cache_pages(mapping, pages, readpage_async_filler, &amp;desc);</div><div class='add'>+	while ((folio = readahead_folio(ractl)) != NULL) {</div><div class='add'>+		ret = nfs_read_add_folio(&amp;pgio, ctx, folio);</div><div class='add'>+		if (ret)</div><div class='add'>+			break;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	nfs_pageio_complete_read(&amp;desc.pgio);</div><div class='add'>+	nfs_pageio_complete_read(&amp;pgio);</div><div class='add'>+	nfs_update_delegated_atime(inode);</div><div class='ctx'> </div><div class='del'>-read_complete:</div><div class='del'>-	put_nfs_open_context(desc.ctx);</div><div class='add'>+	put_nfs_open_context(ctx);</div><div class='ctx'> out:</div><div class='ctx'> 	trace_nfs_aop_readahead_done(inode, nr_pages, ret);</div><div class='del'>-	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int __init nfs_init_readpagecache(void)</div><div class='head'>diff --git a/fs/nfs/super.c b/fs/nfs/super.c<br/>index 3aced401735c..72dee6f3050e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/super.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/super.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/super.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/super.c</a></div><div class='hunk'>@@ -47,6 +47,7 @@</div><div class='ctx'> #include &lt;linux/vfs.h&gt;</div><div class='ctx'> #include &lt;linux/inet.h&gt;</div><div class='ctx'> #include &lt;linux/in6.h&gt;</div><div class='add'>+#include &lt;linux/sched.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;net/ipv6.h&gt;</div><div class='ctx'> #include &lt;linux/netdevice.h&gt;</div><div class='hunk'>@@ -59,6 +60,8 @@</div><div class='ctx'> #include &lt;linux/uaccess.h&gt;</div><div class='ctx'> #include &lt;linux/nfs_ssc.h&gt;</div><div class='ctx'> </div><div class='add'>+#include &lt;uapi/linux/tls.h&gt;</div><div class='add'>+</div><div class='ctx'> #include "nfs4_fs.h"</div><div class='ctx'> #include "callback.h"</div><div class='ctx'> #include "delegation.h"</div><div class='hunk'>@@ -68,6 +71,9 @@</div><div class='ctx'> #include "nfs4session.h"</div><div class='ctx'> #include "pnfs.h"</div><div class='ctx'> #include "nfs.h"</div><div class='add'>+#include "netns.h"</div><div class='add'>+#include "sysfs.h"</div><div class='add'>+#include "nfs4idmap.h"</div><div class='ctx'> </div><div class='ctx'> #define NFSDBG_FACILITY		NFSDBG_VFS</div><div class='ctx'> </div><div class='hunk'>@@ -125,11 +131,7 @@ static void nfs_ssc_unregister_ops(void)</div><div class='ctx'> }</div><div class='ctx'> #endif /* CONFIG_NFS_V4_2 */</div><div class='ctx'> </div><div class='del'>-static struct shrinker acl_shrinker = {</div><div class='del'>-	.count_objects	= nfs_access_cache_count,</div><div class='del'>-	.scan_objects	= nfs_access_cache_scan,</div><div class='del'>-	.seeks		= DEFAULT_SEEKS,</div><div class='del'>-};</div><div class='add'>+static struct shrinker *acl_shrinker;</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Register the NFS filesystems</div><div class='hunk'>@@ -149,9 +151,18 @@ int __init register_nfs_fs(void)</div><div class='ctx'> 	ret = nfs_register_sysctl();</div><div class='ctx'> 	if (ret &lt; 0)</div><div class='ctx'> 		goto error_2;</div><div class='del'>-	ret = register_shrinker(&amp;acl_shrinker);</div><div class='del'>-	if (ret &lt; 0)</div><div class='add'>+</div><div class='add'>+	acl_shrinker = shrinker_alloc(0, "nfs-acl");</div><div class='add'>+	if (!acl_shrinker) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='ctx'> 		goto error_3;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	acl_shrinker-&gt;count_objects = nfs_access_cache_count;</div><div class='add'>+	acl_shrinker-&gt;scan_objects = nfs_access_cache_scan;</div><div class='add'>+</div><div class='add'>+	shrinker_register(acl_shrinker);</div><div class='add'>+</div><div class='ctx'> #ifdef CONFIG_NFS_V4_2</div><div class='ctx'> 	nfs_ssc_register_ops();</div><div class='ctx'> #endif</div><div class='hunk'>@@ -171,7 +182,7 @@ error_0:</div><div class='ctx'>  */</div><div class='ctx'> void __exit unregister_nfs_fs(void)</div><div class='ctx'> {</div><div class='del'>-	unregister_shrinker(&amp;acl_shrinker);</div><div class='add'>+	shrinker_free(acl_shrinker);</div><div class='ctx'> 	nfs_unregister_sysctl();</div><div class='ctx'> 	unregister_nfs4_fs();</div><div class='ctx'> #ifdef CONFIG_NFS_V4_2</div><div class='hunk'>@@ -219,6 +230,7 @@ static int __nfs_list_for_each_server(struct list_head *head,</div><div class='ctx'> 		ret = fn(server, data);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			goto out;</div><div class='add'>+		cond_resched();</div><div class='ctx'> 		rcu_read_lock();</div><div class='ctx'> 	}</div><div class='ctx'> 	rcu_read_unlock();</div><div class='hunk'>@@ -442,8 +454,12 @@ static void nfs_show_mount_options(struct seq_file *m, struct nfs_server *nfss,</div><div class='ctx'> 		{ NFS_MOUNT_NONLM, ",nolock", "" },</div><div class='ctx'> 		{ NFS_MOUNT_NOACL, ",noacl", "" },</div><div class='ctx'> 		{ NFS_MOUNT_NORDIRPLUS, ",nordirplus", "" },</div><div class='add'>+		{ NFS_MOUNT_FORCE_RDIRPLUS, ",rdirplus=force", "" },</div><div class='ctx'> 		{ NFS_MOUNT_UNSHARED, ",nosharecache", "" },</div><div class='ctx'> 		{ NFS_MOUNT_NORESVPORT, ",noresvport", "" },</div><div class='add'>+		{ NFS_MOUNT_NETUNREACH_FATAL,</div><div class='add'>+		  ",fatal_neterrors=ENETDOWN:ENETUNREACH",</div><div class='add'>+		  ",fatal_neterrors=none" },</div><div class='ctx'> 		{ 0, NULL, NULL }</div><div class='ctx'> 	};</div><div class='ctx'> 	const struct proc_nfs_info *nfs_infop;</div><div class='hunk'>@@ -491,14 +507,32 @@ static void nfs_show_mount_options(struct seq_file *m, struct nfs_server *nfss,</div><div class='ctx'> 	seq_printf(m, ",timeo=%lu", 10U * nfss-&gt;client-&gt;cl_timeout-&gt;to_initval / HZ);</div><div class='ctx'> 	seq_printf(m, ",retrans=%u", nfss-&gt;client-&gt;cl_timeout-&gt;to_retries);</div><div class='ctx'> 	seq_printf(m, ",sec=%s", nfs_pseudoflavour_to_name(nfss-&gt;client-&gt;cl_auth-&gt;au_flavor));</div><div class='add'>+	switch (clp-&gt;cl_xprtsec.policy) {</div><div class='add'>+	case RPC_XPRTSEC_TLS_ANON:</div><div class='add'>+		seq_puts(m, ",xprtsec=tls");</div><div class='add'>+		break;</div><div class='add'>+	case RPC_XPRTSEC_TLS_X509:</div><div class='add'>+		seq_puts(m, ",xprtsec=mtls");</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (version != 4)</div><div class='ctx'> 		nfs_show_mountd_options(m, nfss, showdefaults);</div><div class='ctx'> 	else</div><div class='ctx'> 		nfs_show_nfsv4_options(m, nfss, showdefaults);</div><div class='ctx'> </div><div class='del'>-	if (nfss-&gt;options &amp; NFS_OPTION_FSCACHE)</div><div class='add'>+	if (nfss-&gt;options &amp; NFS_OPTION_FSCACHE) {</div><div class='add'>+#ifdef CONFIG_NFS_FSCACHE</div><div class='add'>+		if (nfss-&gt;fscache_uniq)</div><div class='add'>+			seq_printf(m, ",fsc=%s", nfss-&gt;fscache_uniq);</div><div class='add'>+		else</div><div class='add'>+			seq_puts(m, ",fsc");</div><div class='add'>+#else</div><div class='ctx'> 		seq_puts(m, ",fsc");</div><div class='add'>+#endif</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (nfss-&gt;options &amp; NFS_OPTION_MIGRATION)</div><div class='ctx'> 		seq_puts(m, ",migration");</div><div class='hunk'>@@ -522,6 +556,9 @@ static void nfs_show_mount_options(struct seq_file *m, struct nfs_server *nfss,</div><div class='ctx'> 	else</div><div class='ctx'> 		seq_puts(m, ",local_lock=posix");</div><div class='ctx'> </div><div class='add'>+	if (nfss-&gt;flags &amp; NFS_MOUNT_NO_ALIGNWRITE)</div><div class='add'>+		seq_puts(m, ",noalignwrite");</div><div class='add'>+</div><div class='ctx'> 	if (nfss-&gt;flags &amp; NFS_MOUNT_WRITE_EAGER) {</div><div class='ctx'> 		if (nfss-&gt;flags &amp; NFS_MOUNT_WRITE_WAIT)</div><div class='ctx'> 			seq_puts(m, ",write=wait");</div><div class='hunk'>@@ -692,10 +729,6 @@ int nfs_show_stats(struct seq_file *m, struct dentry *root)</div><div class='ctx'> 			totals.events[i] += stats-&gt;events[i];</div><div class='ctx'> 		for (i = 0; i &lt; __NFSIOS_BYTESMAX; i++)</div><div class='ctx'> 			totals.bytes[i] += stats-&gt;bytes[i];</div><div class='del'>-#ifdef CONFIG_NFS_FSCACHE</div><div class='del'>-		for (i = 0; i &lt; __NFSIOS_FSCACHEMAX; i++)</div><div class='del'>-			totals.fscache[i] += stats-&gt;fscache[i];</div><div class='del'>-#endif</div><div class='ctx'> </div><div class='ctx'> 		preempt_enable();</div><div class='ctx'> 	}</div><div class='hunk'>@@ -706,13 +739,6 @@ int nfs_show_stats(struct seq_file *m, struct dentry *root)</div><div class='ctx'> 	seq_puts(m, "\n\tbytes:\t");</div><div class='ctx'> 	for (i = 0; i &lt; __NFSIOS_BYTESMAX; i++)</div><div class='ctx'> 		seq_printf(m, "%Lu ", totals.bytes[i]);</div><div class='del'>-#ifdef CONFIG_NFS_FSCACHE</div><div class='del'>-	if (nfss-&gt;options &amp; NFS_OPTION_FSCACHE) {</div><div class='del'>-		seq_puts(m, "\n\tfsc:\t");</div><div class='del'>-		for (i = 0; i &lt; __NFSIOS_FSCACHEMAX; i++)</div><div class='del'>-			seq_printf(m, "%Lu ", totals.fscache[i]);</div><div class='del'>-	}</div><div class='del'>-#endif</div><div class='ctx'> 	seq_putc(m, '\n');</div><div class='ctx'> </div><div class='ctx'> 	rpc_clnt_show_stats(m, nfss-&gt;client);</div><div class='hunk'>@@ -822,8 +848,7 @@ static int nfs_request_mount(struct fs_context *fc,</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_fs_context *ctx = nfs_fc2context(fc);</div><div class='ctx'> 	struct nfs_mount_request request = {</div><div class='del'>-		.sap		= (struct sockaddr *)</div><div class='del'>-						&amp;ctx-&gt;mount_server.address,</div><div class='add'>+		.sap		= &amp;ctx-&gt;mount_server._address,</div><div class='ctx'> 		.dirpath	= ctx-&gt;nfs_server.export_path,</div><div class='ctx'> 		.protocol	= ctx-&gt;mount_server.protocol,</div><div class='ctx'> 		.fh		= root_fh,</div><div class='hunk'>@@ -854,7 +879,7 @@ static int nfs_request_mount(struct fs_context *fc,</div><div class='ctx'> 	 * Construct the mount server's address.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (ctx-&gt;mount_server.address.sa_family == AF_UNSPEC) {</div><div class='del'>-		memcpy(request.sap, &amp;ctx-&gt;nfs_server.address,</div><div class='add'>+		memcpy(request.sap, &amp;ctx-&gt;nfs_server._address,</div><div class='ctx'> 		       ctx-&gt;nfs_server.addrlen);</div><div class='ctx'> 		ctx-&gt;mount_server.addrlen = ctx-&gt;nfs_server.addrlen;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -865,7 +890,15 @@ static int nfs_request_mount(struct fs_context *fc,</div><div class='ctx'> 	 * Now ask the mount server to map our export path</div><div class='ctx'> 	 * to a file handle.</div><div class='ctx'> 	 */</div><div class='del'>-	status = nfs_mount(&amp;request, ctx-&gt;timeo, ctx-&gt;retrans);</div><div class='add'>+	if ((request.protocol == XPRT_TRANSPORT_UDP) ==</div><div class='add'>+	    !(ctx-&gt;flags &amp; NFS_MOUNT_TCP))</div><div class='add'>+		/*</div><div class='add'>+		 * NFS protocol and mount protocol are both UDP or neither UDP</div><div class='add'>+		 * so timeouts are compatible.  Use NFS timeouts for MOUNT</div><div class='add'>+		 */</div><div class='add'>+		status = nfs_mount(&amp;request, ctx-&gt;timeo, ctx-&gt;retrans);</div><div class='add'>+	else</div><div class='add'>+		status = nfs_mount(&amp;request, NFS_UNSPEC_TIMEO, NFS_UNSPEC_RETRANS);</div><div class='ctx'> 	if (status != 0) {</div><div class='ctx'> 		dfprintk(MOUNT, "NFS: unable to mount server %s, error %d\n",</div><div class='ctx'> 				request.hostname, status);</div><div class='hunk'>@@ -886,6 +919,16 @@ static struct nfs_server *nfs_try_mount_request(struct fs_context *fc)</div><div class='ctx'> 	rpc_authflavor_t authlist[NFS_MAX_SECFLAVORS];</div><div class='ctx'> 	unsigned int authlist_len = ARRAY_SIZE(authlist);</div><div class='ctx'> </div><div class='add'>+	/* make sure 'nolock'/'lock' override the 'local_lock' mount option */</div><div class='add'>+	if (ctx-&gt;lock_status) {</div><div class='add'>+		if (ctx-&gt;lock_status == NFS_LOCK_NOLOCK) {</div><div class='add'>+			ctx-&gt;flags |= NFS_MOUNT_NONLM;</div><div class='add'>+			ctx-&gt;flags |= (NFS_MOUNT_LOCAL_FLOCK | NFS_MOUNT_LOCAL_FCNTL);</div><div class='add'>+		} else {</div><div class='add'>+			ctx-&gt;flags &amp;= ~NFS_MOUNT_NONLM;</div><div class='add'>+			ctx-&gt;flags &amp;= ~(NFS_MOUNT_LOCAL_FLOCK | NFS_MOUNT_LOCAL_FCNTL);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> 	status = nfs_request_mount(fc, ctx-&gt;mntfh, authlist, &amp;authlist_len);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		return ERR_PTR(status);</div><div class='hunk'>@@ -1009,6 +1052,16 @@ int nfs_reconfigure(struct fs_context *fc)</div><div class='ctx'> 	sync_filesystem(sb);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='add'>+	 * The SB_RDONLY flag has been removed from the superblock during</div><div class='add'>+	 * mounts to prevent interference between different filesystems.</div><div class='add'>+	 * Similarly, it is also necessary to ignore the SB_RDONLY flag</div><div class='add'>+	 * during reconfiguration; otherwise, it may also result in the</div><div class='add'>+	 * creation of redundant superblocks when mounting a directory with</div><div class='add'>+	 * different rw and ro flags multiple times.</div><div class='add'>+	 */</div><div class='add'>+	fc-&gt;sb_flags_mask &amp;= ~SB_RDONLY;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='ctx'> 	 * Userspace mount programs that send binary options generally send</div><div class='ctx'> 	 * them populated with default values. We have no way to know which</div><div class='ctx'> 	 * ones were explicitly specified. Fall back to legacy behavior and</div><div class='hunk'>@@ -1051,22 +1104,31 @@ static void nfs_fill_super(struct super_block *sb, struct nfs_fs_context *ctx)</div><div class='ctx'> 	if (ctx-&gt;bsize)</div><div class='ctx'> 		sb-&gt;s_blocksize = nfs_block_size(ctx-&gt;bsize, &amp;sb-&gt;s_blocksize_bits);</div><div class='ctx'> </div><div class='del'>-	if (server-&gt;nfs_client-&gt;rpc_ops-&gt;version != 2) {</div><div class='del'>-		/* The VFS shouldn't apply the umask to mode bits. We will do</div><div class='del'>-		 * so ourselves when necessary.</div><div class='add'>+	switch (server-&gt;nfs_client-&gt;rpc_ops-&gt;version) {</div><div class='add'>+	case 2:</div><div class='add'>+		sb-&gt;s_time_gran = 1000;</div><div class='add'>+		sb-&gt;s_time_min = 0;</div><div class='add'>+		sb-&gt;s_time_max = U32_MAX;</div><div class='add'>+		break;</div><div class='add'>+	case 3:</div><div class='add'>+		/*</div><div class='add'>+		 * The VFS shouldn't apply the umask to mode bits.</div><div class='add'>+		 * We will do so ourselves when necessary.</div><div class='ctx'> 		 */</div><div class='ctx'> 		sb-&gt;s_flags |= SB_POSIXACL;</div><div class='ctx'> 		sb-&gt;s_time_gran = 1;</div><div class='del'>-		sb-&gt;s_export_op = &amp;nfs_export_ops;</div><div class='del'>-	} else</div><div class='del'>-		sb-&gt;s_time_gran = 1000;</div><div class='del'>-</div><div class='del'>-	if (server-&gt;nfs_client-&gt;rpc_ops-&gt;version != 4) {</div><div class='ctx'> 		sb-&gt;s_time_min = 0;</div><div class='ctx'> 		sb-&gt;s_time_max = U32_MAX;</div><div class='del'>-	} else {</div><div class='add'>+		sb-&gt;s_export_op = &amp;nfs_export_ops;</div><div class='add'>+		break;</div><div class='add'>+	case 4:</div><div class='add'>+		sb-&gt;s_iflags |= SB_I_NOUMASK;</div><div class='add'>+		sb-&gt;s_time_gran = 1;</div><div class='ctx'> 		sb-&gt;s_time_min = S64_MIN;</div><div class='ctx'> 		sb-&gt;s_time_max = S64_MAX;</div><div class='add'>+		if (server-&gt;caps &amp; NFS_CAP_ATOMIC_OPEN_V1)</div><div class='add'>+			sb-&gt;s_export_op = &amp;nfs_export_ops;</div><div class='add'>+		break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	sb-&gt;s_magic = NFS_SUPER_MAGIC;</div><div class='hunk'>@@ -1080,6 +1142,7 @@ static void nfs_fill_super(struct super_block *sb, struct nfs_fs_context *ctx)</div><div class='ctx'> 						 &amp;sb-&gt;s_blocksize_bits);</div><div class='ctx'> </div><div class='ctx'> 	nfs_super_set_maxbytes(sb, server-&gt;maxfilesize);</div><div class='add'>+	nfs_sysfs_move_server_to_sb(sb);</div><div class='ctx'> 	server-&gt;has_sec_mnt_opts = ctx-&gt;has_sec_mnt_opts;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1120,7 +1183,7 @@ static int nfs_set_super(struct super_block *s, struct fs_context *fc)</div><div class='ctx'> 	struct nfs_server *server = fc-&gt;s_fs_info;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	s-&gt;s_d_op = server-&gt;nfs_client-&gt;rpc_ops-&gt;dentry_ops;</div><div class='add'>+	set_default_d_op(s, server-&gt;nfs_client-&gt;rpc_ops-&gt;dentry_ops);</div><div class='ctx'> 	ret = set_anon_super(s, server);</div><div class='ctx'> 	if (ret == 0)</div><div class='ctx'> 		server-&gt;s_dev = s-&gt;s_dev;</div><div class='hunk'>@@ -1204,42 +1267,42 @@ static int nfs_compare_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_NFS_FSCACHE</div><div class='del'>-static void nfs_get_cache_cookie(struct super_block *sb,</div><div class='del'>-				 struct nfs_fs_context *ctx)</div><div class='add'>+static int nfs_get_cache_cookie(struct super_block *sb,</div><div class='add'>+				struct nfs_fs_context *ctx)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_server *nfss = NFS_SB(sb);</div><div class='ctx'> 	char *uniq = NULL;</div><div class='ctx'> 	int ulen = 0;</div><div class='ctx'> </div><div class='del'>-	nfss-&gt;fscache_key = NULL;</div><div class='ctx'> 	nfss-&gt;fscache = NULL;</div><div class='ctx'> </div><div class='ctx'> 	if (!ctx)</div><div class='del'>-		return;</div><div class='add'>+		return 0;</div><div class='ctx'> </div><div class='ctx'> 	if (ctx-&gt;clone_data.sb) {</div><div class='ctx'> 		struct nfs_server *mnt_s = NFS_SB(ctx-&gt;clone_data.sb);</div><div class='ctx'> 		if (!(mnt_s-&gt;options &amp; NFS_OPTION_FSCACHE))</div><div class='del'>-			return;</div><div class='del'>-		if (mnt_s-&gt;fscache_key) {</div><div class='del'>-			uniq = mnt_s-&gt;fscache_key-&gt;key.uniquifier;</div><div class='del'>-			ulen = mnt_s-&gt;fscache_key-&gt;key.uniq_len;</div><div class='add'>+			return 0;</div><div class='add'>+		if (mnt_s-&gt;fscache_uniq) {</div><div class='add'>+			uniq = mnt_s-&gt;fscache_uniq;</div><div class='add'>+			ulen = strlen(uniq);</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='ctx'> 		if (!(ctx-&gt;options &amp; NFS_OPTION_FSCACHE))</div><div class='del'>-			return;</div><div class='add'>+			return 0;</div><div class='ctx'> 		if (ctx-&gt;fscache_uniq) {</div><div class='ctx'> 			uniq = ctx-&gt;fscache_uniq;</div><div class='ctx'> 			ulen = strlen(ctx-&gt;fscache_uniq);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	nfs_fscache_get_super_cookie(sb, uniq, ulen);</div><div class='add'>+	return nfs_fscache_get_super_cookie(sb, uniq, ulen);</div><div class='ctx'> }</div><div class='ctx'> #else</div><div class='del'>-static void nfs_get_cache_cookie(struct super_block *sb,</div><div class='del'>-				 struct nfs_fs_context *ctx)</div><div class='add'>+static int nfs_get_cache_cookie(struct super_block *sb,</div><div class='add'>+				struct nfs_fs_context *ctx)</div><div class='ctx'> {</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='hunk'>@@ -1255,8 +1318,17 @@ int nfs_get_tree_common(struct fs_context *fc)</div><div class='ctx'> 	if (IS_ERR(server))</div><div class='ctx'> 		return PTR_ERR(server);</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * When NFS_MOUNT_UNSHARED is not set, NFS forces the sharing of a</div><div class='add'>+	 * superblock among each filesystem that mounts sub-directories</div><div class='add'>+	 * belonging to a single exported root path.</div><div class='add'>+	 * To prevent interference between different filesystems, the</div><div class='add'>+	 * SB_RDONLY flag should be removed from the superblock.</div><div class='add'>+	 */</div><div class='ctx'> 	if (server-&gt;flags &amp; NFS_MOUNT_UNSHARED)</div><div class='ctx'> 		compare_super = NULL;</div><div class='add'>+	else</div><div class='add'>+		fc-&gt;sb_flags &amp;= ~SB_RDONLY;</div><div class='ctx'> </div><div class='ctx'> 	/* -o noac implies -o sync */</div><div class='ctx'> 	if (server-&gt;flags &amp; NFS_MOUNT_NOAC)</div><div class='hunk'>@@ -1266,9 +1338,6 @@ int nfs_get_tree_common(struct fs_context *fc)</div><div class='ctx'> 		if (ctx-&gt;clone_data.sb-&gt;s_flags &amp; SB_SYNCHRONOUS)</div><div class='ctx'> 			fc-&gt;sb_flags |= SB_SYNCHRONOUS;</div><div class='ctx'> </div><div class='del'>-	if (server-&gt;caps &amp; NFS_CAP_SECURITY_LABEL)</div><div class='del'>-		fc-&gt;lsm_flags |= SECURITY_LSM_NATIVE_LABELS;</div><div class='del'>-</div><div class='ctx'> 	/* Get a superblock - note that we may end up sharing one that already exists */</div><div class='ctx'> 	fc-&gt;s_fs_info = server;</div><div class='ctx'> 	s = sget_fc(fc, compare_super, nfs_set_super);</div><div class='hunk'>@@ -1299,7 +1368,9 @@ int nfs_get_tree_common(struct fs_context *fc)</div><div class='ctx'> 			s-&gt;s_blocksize_bits = bsize;</div><div class='ctx'> 			s-&gt;s_blocksize = 1U &lt;&lt; bsize;</div><div class='ctx'> 		}</div><div class='del'>-		nfs_get_cache_cookie(s, ctx);</div><div class='add'>+		error = nfs_get_cache_cookie(s, ctx);</div><div class='add'>+		if (error &lt; 0)</div><div class='add'>+			goto error_splat_super;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	error = nfs_get_root(s, fc);</div><div class='hunk'>@@ -1323,19 +1394,18 @@ error_splat_super:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Destroy an NFS2/3 superblock</div><div class='add'>+ * Destroy an NFS superblock</div><div class='ctx'>  */</div><div class='ctx'> void nfs_kill_super(struct super_block *s)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_server *server = NFS_SB(s);</div><div class='del'>-	dev_t dev = s-&gt;s_dev;</div><div class='ctx'> </div><div class='del'>-	generic_shutdown_super(s);</div><div class='add'>+	nfs_sysfs_move_sb_to_server(server);</div><div class='add'>+	kill_anon_super(s);</div><div class='ctx'> </div><div class='ctx'> 	nfs_fscache_release_super_cookie(s);</div><div class='ctx'> </div><div class='ctx'> 	nfs_free_server(server);</div><div class='del'>-	free_anon_bdev(dev);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_kill_super);</div><div class='ctx'> </div><div class='hunk'>@@ -1356,6 +1426,7 @@ unsigned short max_session_cb_slots = NFS4_DEF_CB_SLOT_TABLE_SIZE;</div><div class='ctx'> unsigned short send_implementation_id = 1;</div><div class='ctx'> char nfs4_client_id_uniquifier[NFS4_CLIENT_ID_UNIQ_LEN] = "";</div><div class='ctx'> bool recover_lost_locks = false;</div><div class='add'>+short nfs_delay_retrans = -1;</div><div class='ctx'> </div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_callback_nr_threads);</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_callback_set_tcpport);</div><div class='hunk'>@@ -1366,6 +1437,7 @@ EXPORT_SYMBOL_GPL(max_session_cb_slots);</div><div class='ctx'> EXPORT_SYMBOL_GPL(send_implementation_id);</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs4_client_id_uniquifier);</div><div class='ctx'> EXPORT_SYMBOL_GPL(recover_lost_locks);</div><div class='add'>+EXPORT_SYMBOL_GPL(nfs_delay_retrans);</div><div class='ctx'> </div><div class='ctx'> #define NFS_CALLBACK_MAXPORTNR (65535U)</div><div class='ctx'> </div><div class='hunk'>@@ -1414,5 +1486,9 @@ MODULE_PARM_DESC(recover_lost_locks,</div><div class='ctx'> 		 "If the server reports that a lock might be lost, "</div><div class='ctx'> 		 "try to recover it risking data corruption.");</div><div class='ctx'> </div><div class='del'>-</div><div class='add'>+module_param_named(delay_retrans, nfs_delay_retrans, short, 0644);</div><div class='add'>+MODULE_PARM_DESC(delay_retrans,</div><div class='add'>+		 "Unless negative, specifies the number of times the NFSv4 "</div><div class='add'>+		 "client retries a request before returning an EAGAIN error, "</div><div class='add'>+		 "after a reply of NFS4ERR_DELAY from the server.");</div><div class='ctx'> #endif /* CONFIG_NFS_V4 */</div><div class='head'>diff --git a/fs/nfs/symlink.c b/fs/nfs/symlink.c<br/>index 25ba299fdac2..58146e935402 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/symlink.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/symlink.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/symlink.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/symlink.c</a></div><div class='hunk'>@@ -26,53 +26,45 @@</div><div class='ctx'>  * and straight-forward than readdir caching.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-static int nfs_symlink_filler(void *data, struct page *page)</div><div class='add'>+static int nfs_symlink_filler(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = data;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	error = NFS_PROTO(inode)-&gt;readlink(inode, page, 0, PAGE_SIZE);</div><div class='del'>-	if (error &lt; 0)</div><div class='del'>-		goto error;</div><div class='del'>-	SetPageUptodate(page);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	return 0;</div><div class='del'>-</div><div class='del'>-error:</div><div class='del'>-	SetPageError(page);</div><div class='del'>-	unlock_page(page);</div><div class='del'>-	return -EIO;</div><div class='add'>+	error = NFS_PROTO(inode)-&gt;readlink(inode, &amp;folio-&gt;page, 0, PAGE_SIZE);</div><div class='add'>+	folio_end_read(folio, error == 0);</div><div class='add'>+	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const char *nfs_get_link(struct dentry *dentry,</div><div class='ctx'> 				struct inode *inode,</div><div class='ctx'> 				struct delayed_call *done)</div><div class='ctx'> {</div><div class='del'>-	struct page *page;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> 	void *err;</div><div class='ctx'> </div><div class='ctx'> 	if (!dentry) {</div><div class='ctx'> 		err = ERR_PTR(nfs_revalidate_mapping_rcu(inode));</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			return err;</div><div class='del'>-		page = find_get_page(inode-&gt;i_mapping, 0);</div><div class='del'>-		if (!page)</div><div class='add'>+		folio = filemap_get_folio(inode-&gt;i_mapping, 0);</div><div class='add'>+		if (IS_ERR(folio))</div><div class='ctx'> 			return ERR_PTR(-ECHILD);</div><div class='del'>-		if (!PageUptodate(page)) {</div><div class='del'>-			put_page(page);</div><div class='add'>+		if (!folio_test_uptodate(folio)) {</div><div class='add'>+			folio_put(folio);</div><div class='ctx'> 			return ERR_PTR(-ECHILD);</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='ctx'> 		err = ERR_PTR(nfs_revalidate_mapping(inode, inode-&gt;i_mapping));</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			return err;</div><div class='del'>-		page = read_cache_page(&amp;inode-&gt;i_data, 0, nfs_symlink_filler,</div><div class='del'>-				inode);</div><div class='del'>-		if (IS_ERR(page))</div><div class='del'>-			return ERR_CAST(page);</div><div class='add'>+		folio = read_cache_folio(&amp;inode-&gt;i_data, 0, nfs_symlink_filler,</div><div class='add'>+				NULL);</div><div class='add'>+		if (IS_ERR(folio))</div><div class='add'>+			return ERR_CAST(folio);</div><div class='ctx'> 	}</div><div class='del'>-	set_delayed_call(done, page_put_link, page);</div><div class='del'>-	return page_address(page);</div><div class='add'>+	set_delayed_call(done, page_put_link, folio);</div><div class='add'>+	return folio_address(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='head'>diff --git a/fs/nfs/sysctl.c b/fs/nfs/sysctl.c<br/>index 7aea195ddb35..f579df0e8d67 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/sysctl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/sysctl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/sysctl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/sysctl.c</a></div><div class='hunk'>@@ -14,7 +14,7 @@</div><div class='ctx'> </div><div class='ctx'> static struct ctl_table_header *nfs_callback_sysctl_table;</div><div class='ctx'> </div><div class='del'>-static struct ctl_table nfs_cb_sysctls[] = {</div><div class='add'>+static const struct ctl_table nfs_cb_sysctls[] = {</div><div class='ctx'> 	{</div><div class='ctx'> 		.procname	= "nfs_mountpoint_timeout",</div><div class='ctx'> 		.data		= &amp;nfs_mountpoint_expiry_timeout,</div><div class='hunk'>@@ -29,30 +29,11 @@ static struct ctl_table nfs_cb_sysctls[] = {</div><div class='ctx'> 		.mode		= 0644,</div><div class='ctx'> 		.proc_handler	= proc_dointvec,</div><div class='ctx'> 	},</div><div class='del'>-	{ }</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static struct ctl_table nfs_cb_sysctl_dir[] = {</div><div class='del'>-	{</div><div class='del'>-		.procname = "nfs",</div><div class='del'>-		.mode = 0555,</div><div class='del'>-		.child = nfs_cb_sysctls,</div><div class='del'>-	},</div><div class='del'>-	{ }</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static struct ctl_table nfs_cb_sysctl_root[] = {</div><div class='del'>-	{</div><div class='del'>-		.procname = "fs",</div><div class='del'>-		.mode = 0555,</div><div class='del'>-		.child = nfs_cb_sysctl_dir,</div><div class='del'>-	},</div><div class='del'>-	{ }</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> int nfs_register_sysctl(void)</div><div class='ctx'> {</div><div class='del'>-	nfs_callback_sysctl_table = register_sysctl_table(nfs_cb_sysctl_root);</div><div class='add'>+	nfs_callback_sysctl_table = register_sysctl("fs/nfs", nfs_cb_sysctls);</div><div class='ctx'> 	if (nfs_callback_sysctl_table == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	return 0;</div><div class='head'>diff --git a/fs/nfs/sysfs.c b/fs/nfs/sysfs.c<br/>index 8cb70755e3c9..ea6e6168092b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/sysfs.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/sysfs.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/sysfs.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/sysfs.c</a></div><div class='hunk'>@@ -12,65 +12,63 @@</div><div class='ctx'> #include &lt;linux/string.h&gt;</div><div class='ctx'> #include &lt;linux/nfs_fs.h&gt;</div><div class='ctx'> #include &lt;linux/rcupdate.h&gt;</div><div class='add'>+#include &lt;linux/lockd/lockd.h&gt;</div><div class='ctx'> </div><div class='add'>+#include "internal.h"</div><div class='ctx'> #include "nfs4_fs.h"</div><div class='ctx'> #include "netns.h"</div><div class='ctx'> #include "sysfs.h"</div><div class='ctx'> </div><div class='del'>-struct kobject *nfs_client_kobj;</div><div class='del'>-static struct kset *nfs_client_kset;</div><div class='add'>+static struct kset *nfs_kset;</div><div class='ctx'> </div><div class='del'>-static void nfs_netns_object_release(struct kobject *kobj)</div><div class='add'>+static void nfs_kset_release(struct kobject *kobj)</div><div class='ctx'> {</div><div class='del'>-	kfree(kobj);</div><div class='add'>+	struct kset *kset = container_of(kobj, struct kset, kobj);</div><div class='add'>+	kfree(kset);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct kobj_ns_type_operations *nfs_netns_object_child_ns_type(</div><div class='del'>-		struct kobject *kobj)</div><div class='add'>+		const struct kobject *kobj)</div><div class='ctx'> {</div><div class='ctx'> 	return &amp;net_ns_type_operations;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct kobj_type nfs_netns_object_type = {</div><div class='del'>-	.release = nfs_netns_object_release,</div><div class='add'>+static struct kobj_type nfs_kset_type = {</div><div class='add'>+	.release = nfs_kset_release,</div><div class='ctx'> 	.sysfs_ops = &amp;kobj_sysfs_ops,</div><div class='ctx'> 	.child_ns_type = nfs_netns_object_child_ns_type,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static struct kobject *nfs_netns_object_alloc(const char *name,</div><div class='del'>-		struct kset *kset, struct kobject *parent)</div><div class='add'>+int nfs_sysfs_init(void)</div><div class='ctx'> {</div><div class='del'>-	struct kobject *kobj;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	kobj = kzalloc(sizeof(*kobj), GFP_KERNEL);</div><div class='del'>-	if (kobj) {</div><div class='del'>-		kobj-&gt;kset = kset;</div><div class='del'>-		if (kobject_init_and_add(kobj, &amp;nfs_netns_object_type,</div><div class='del'>-					parent, "%s", name) == 0)</div><div class='del'>-			return kobj;</div><div class='del'>-		kobject_put(kobj);</div><div class='add'>+	nfs_kset = kzalloc(sizeof(*nfs_kset), GFP_KERNEL);</div><div class='add'>+	if (!nfs_kset)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	ret = kobject_set_name(&amp;nfs_kset-&gt;kobj, "nfs");</div><div class='add'>+	if (ret) {</div><div class='add'>+		kfree(nfs_kset);</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='ctx'> </div><div class='del'>-int nfs_sysfs_init(void)</div><div class='del'>-{</div><div class='del'>-	nfs_client_kset = kset_create_and_add("nfs", NULL, fs_kobj);</div><div class='del'>-	if (!nfs_client_kset)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	nfs_client_kobj = nfs_netns_object_alloc("net", nfs_client_kset, NULL);</div><div class='del'>-	if  (!nfs_client_kobj) {</div><div class='del'>-		kset_unregister(nfs_client_kset);</div><div class='del'>-		nfs_client_kset = NULL;</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+	nfs_kset-&gt;kobj.parent = fs_kobj;</div><div class='add'>+	nfs_kset-&gt;kobj.ktype = &amp;nfs_kset_type;</div><div class='add'>+	nfs_kset-&gt;kobj.kset = NULL;</div><div class='add'>+</div><div class='add'>+	ret = kset_register(nfs_kset);</div><div class='add'>+	if (ret) {</div><div class='add'>+		kfree(nfs_kset);</div><div class='add'>+		return ret;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void nfs_sysfs_exit(void)</div><div class='ctx'> {</div><div class='del'>-	kobject_put(nfs_client_kobj);</div><div class='del'>-	kset_unregister(nfs_client_kset);</div><div class='add'>+	kset_unregister(nfs_kset);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t nfs_netns_identifier_show(struct kobject *kobj,</div><div class='hunk'>@@ -82,7 +80,7 @@ static ssize_t nfs_netns_identifier_show(struct kobject *kobj,</div><div class='ctx'> 	ssize_t ret;</div><div class='ctx'> </div><div class='ctx'> 	rcu_read_lock();</div><div class='del'>-	ret = scnprintf(buf, PAGE_SIZE, "%s\n", rcu_dereference(c-&gt;identifier));</div><div class='add'>+	ret = sysfs_emit(buf, "%s\n", rcu_dereference(c-&gt;identifier));</div><div class='ctx'> 	rcu_read_unlock();</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='hunk'>@@ -127,10 +125,9 @@ static void nfs_netns_client_release(struct kobject *kobj)</div><div class='ctx'> 			kobject);</div><div class='ctx'> </div><div class='ctx'> 	kfree(rcu_dereference_raw(c-&gt;identifier));</div><div class='del'>-	kfree(c);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static const void *nfs_netns_client_namespace(struct kobject *kobj)</div><div class='add'>+static const void *nfs_netns_client_namespace(const struct kobject *kobj)</div><div class='ctx'> {</div><div class='ctx'> 	return container_of(kobj, struct nfs_netns_client, kobject)-&gt;net;</div><div class='ctx'> }</div><div class='hunk'>@@ -142,14 +139,34 @@ static struct attribute *nfs_netns_client_attrs[] = {</div><div class='ctx'> 	&amp;nfs_netns_client_id.attr,</div><div class='ctx'> 	NULL,</div><div class='ctx'> };</div><div class='add'>+ATTRIBUTE_GROUPS(nfs_netns_client);</div><div class='ctx'> </div><div class='ctx'> static struct kobj_type nfs_netns_client_type = {</div><div class='ctx'> 	.release = nfs_netns_client_release,</div><div class='del'>-	.default_attrs = nfs_netns_client_attrs,</div><div class='add'>+	.default_groups = nfs_netns_client_groups,</div><div class='ctx'> 	.sysfs_ops = &amp;kobj_sysfs_ops,</div><div class='ctx'> 	.namespace = nfs_netns_client_namespace,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+static void nfs_netns_object_release(struct kobject *kobj)</div><div class='add'>+{</div><div class='add'>+	struct nfs_netns_client *c = container_of(kobj,</div><div class='add'>+			struct nfs_netns_client,</div><div class='add'>+			nfs_net_kobj);</div><div class='add'>+	kfree(c);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const void *nfs_netns_namespace(const struct kobject *kobj)</div><div class='add'>+{</div><div class='add'>+	return container_of(kobj, struct nfs_netns_client, nfs_net_kobj)-&gt;net;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct kobj_type nfs_netns_object_type = {</div><div class='add'>+	.release = nfs_netns_object_release,</div><div class='add'>+	.sysfs_ops = &amp;kobj_sysfs_ops,</div><div class='add'>+	.namespace =  nfs_netns_namespace,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> static struct nfs_netns_client *nfs_netns_client_alloc(struct kobject *parent,</div><div class='ctx'> 		struct net *net)</div><div class='ctx'> {</div><div class='hunk'>@@ -158,11 +175,21 @@ static struct nfs_netns_client *nfs_netns_client_alloc(struct kobject *parent,</div><div class='ctx'> 	p = kzalloc(sizeof(*p), GFP_KERNEL);</div><div class='ctx'> 	if (p) {</div><div class='ctx'> 		p-&gt;net = net;</div><div class='del'>-		p-&gt;kobject.kset = nfs_client_kset;</div><div class='add'>+		p-&gt;kobject.kset = nfs_kset;</div><div class='add'>+		p-&gt;nfs_net_kobj.kset = nfs_kset;</div><div class='add'>+</div><div class='add'>+		if (kobject_init_and_add(&amp;p-&gt;nfs_net_kobj, &amp;nfs_netns_object_type,</div><div class='add'>+					parent, "net") != 0) {</div><div class='add'>+			kobject_put(&amp;p-&gt;nfs_net_kobj);</div><div class='add'>+			return NULL;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		if (kobject_init_and_add(&amp;p-&gt;kobject, &amp;nfs_netns_client_type,</div><div class='del'>-					parent, "nfs_client") == 0)</div><div class='add'>+					&amp;p-&gt;nfs_net_kobj, "nfs_client") == 0)</div><div class='ctx'> 			return p;</div><div class='add'>+</div><div class='ctx'> 		kobject_put(&amp;p-&gt;kobject);</div><div class='add'>+		kobject_put(&amp;p-&gt;nfs_net_kobj);</div><div class='ctx'> 	}</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='hunk'>@@ -171,7 +198,7 @@ void nfs_netns_sysfs_setup(struct nfs_net *netns, struct net *net)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_netns_client *clp;</div><div class='ctx'> </div><div class='del'>-	clp = nfs_netns_client_alloc(nfs_client_kobj, net);</div><div class='add'>+	clp = nfs_netns_client_alloc(&amp;nfs_kset-&gt;kobj, net);</div><div class='ctx'> 	if (clp) {</div><div class='ctx'> 		netns-&gt;nfs_client = clp;</div><div class='ctx'> 		kobject_uevent(&amp;clp-&gt;kobject, KOBJ_ADD);</div><div class='hunk'>@@ -186,6 +213,258 @@ void nfs_netns_sysfs_destroy(struct nfs_net *netns)</div><div class='ctx'> 		kobject_uevent(&amp;clp-&gt;kobject, KOBJ_REMOVE);</div><div class='ctx'> 		kobject_del(&amp;clp-&gt;kobject);</div><div class='ctx'> 		kobject_put(&amp;clp-&gt;kobject);</div><div class='add'>+		kobject_del(&amp;clp-&gt;nfs_net_kobj);</div><div class='add'>+		kobject_put(&amp;clp-&gt;nfs_net_kobj);</div><div class='ctx'> 		netns-&gt;nfs_client = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+static bool shutdown_match_client(const struct rpc_task *task, const void *data)</div><div class='add'>+{</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void shutdown_client(struct rpc_clnt *clnt)</div><div class='add'>+{</div><div class='add'>+	clnt-&gt;cl_shutdown = 1;</div><div class='add'>+	rpc_cancel_tasks(clnt, -EIO, shutdown_match_client, NULL);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Shut down the nfs_client only once all the superblocks</div><div class='add'>+ * have been shut down.</div><div class='add'>+ */</div><div class='add'>+static void shutdown_nfs_client(struct nfs_client *clp)</div><div class='add'>+{</div><div class='add'>+	struct nfs_server *server;</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	list_for_each_entry_rcu(server, &amp;clp-&gt;cl_superblocks, client_link) {</div><div class='add'>+		if (!(server-&gt;flags &amp; NFS_MOUNT_SHUTDOWN)) {</div><div class='add'>+			rcu_read_unlock();</div><div class='add'>+			return;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+	nfs_mark_client_ready(clp, -EIO);</div><div class='add'>+	shutdown_client(clp-&gt;cl_rpcclient);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t</div><div class='add'>+shutdown_show(struct kobject *kobj, struct kobj_attribute *attr,</div><div class='add'>+				char *buf)</div><div class='add'>+{</div><div class='add'>+	struct nfs_server *server = container_of(kobj, struct nfs_server, kobj);</div><div class='add'>+	bool shutdown = server-&gt;flags &amp; NFS_MOUNT_SHUTDOWN;</div><div class='add'>+	return sysfs_emit(buf, "%d\n", shutdown);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static ssize_t</div><div class='add'>+shutdown_store(struct kobject *kobj, struct kobj_attribute *attr,</div><div class='add'>+				const char *buf, size_t count)</div><div class='add'>+{</div><div class='add'>+	struct nfs_server *server;</div><div class='add'>+	int ret, val;</div><div class='add'>+</div><div class='add'>+	server = container_of(kobj, struct nfs_server, kobj);</div><div class='add'>+</div><div class='add'>+	ret = kstrtoint(buf, 0, &amp;val);</div><div class='add'>+	if (ret)</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	if (val != 1)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	/* already shut down? */</div><div class='add'>+	if (server-&gt;flags &amp; NFS_MOUNT_SHUTDOWN)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	server-&gt;flags |= NFS_MOUNT_SHUTDOWN;</div><div class='add'>+	shutdown_client(server-&gt;client);</div><div class='add'>+</div><div class='add'>+	if (!IS_ERR(server-&gt;client_acl))</div><div class='add'>+		shutdown_client(server-&gt;client_acl);</div><div class='add'>+</div><div class='add'>+	if (server-&gt;nlm_host)</div><div class='add'>+		shutdown_client(server-&gt;nlm_host-&gt;h_rpcclnt);</div><div class='add'>+out:</div><div class='add'>+	shutdown_nfs_client(server-&gt;nfs_client);</div><div class='add'>+	return count;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct kobj_attribute nfs_sysfs_attr_shutdown = __ATTR_RW(shutdown);</div><div class='add'>+</div><div class='add'>+#if IS_ENABLED(CONFIG_NFS_V4_1)</div><div class='add'>+static ssize_t</div><div class='add'>+implid_domain_show(struct kobject *kobj, struct kobj_attribute *attr,</div><div class='add'>+				char *buf)</div><div class='add'>+{</div><div class='add'>+	struct nfs_server *server = container_of(kobj, struct nfs_server, kobj);</div><div class='add'>+	struct nfs41_impl_id *impl_id = server-&gt;nfs_client-&gt;cl_implid;</div><div class='add'>+</div><div class='add'>+	if (!impl_id || strlen(impl_id-&gt;domain) == 0)</div><div class='add'>+		return 0; //sysfs_emit(buf, "");</div><div class='add'>+	return sysfs_emit(buf, "%s\n", impl_id-&gt;domain);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct kobj_attribute nfs_sysfs_attr_implid_domain = __ATTR_RO(implid_domain);</div><div class='add'>+</div><div class='add'>+</div><div class='add'>+static ssize_t</div><div class='add'>+implid_name_show(struct kobject *kobj, struct kobj_attribute *attr,</div><div class='add'>+				char *buf)</div><div class='add'>+{</div><div class='add'>+	struct nfs_server *server = container_of(kobj, struct nfs_server, kobj);</div><div class='add'>+	struct nfs41_impl_id *impl_id = server-&gt;nfs_client-&gt;cl_implid;</div><div class='add'>+</div><div class='add'>+	if (!impl_id || strlen(impl_id-&gt;name) == 0)</div><div class='add'>+		return 0; //sysfs_emit(buf, "");</div><div class='add'>+	return sysfs_emit(buf, "%s\n", impl_id-&gt;name);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct kobj_attribute nfs_sysfs_attr_implid_name = __ATTR_RO(implid_name);</div><div class='add'>+</div><div class='add'>+#endif /* IS_ENABLED(CONFIG_NFS_V4_1) */</div><div class='add'>+</div><div class='add'>+#define RPC_CLIENT_NAME_SIZE 64</div><div class='add'>+</div><div class='add'>+void nfs_sysfs_link_rpc_client(struct nfs_server *server,</div><div class='add'>+			struct rpc_clnt *clnt, const char *uniq)</div><div class='add'>+{</div><div class='add'>+	char name[RPC_CLIENT_NAME_SIZE];</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	strscpy(name, clnt-&gt;cl_program-&gt;name, sizeof(name));</div><div class='add'>+	strncat(name, uniq ? uniq : "", sizeof(name) - strlen(name) - 1);</div><div class='add'>+	strncat(name, "_client", sizeof(name) - strlen(name) - 1);</div><div class='add'>+</div><div class='add'>+	ret = sysfs_create_link_nowarn(&amp;server-&gt;kobj,</div><div class='add'>+						&amp;clnt-&gt;cl_sysfs-&gt;kobject, name);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		pr_warn("NFS: can't create link to %s in sysfs (%d)\n",</div><div class='add'>+			name, ret);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(nfs_sysfs_link_rpc_client);</div><div class='add'>+</div><div class='add'>+static void nfs_sysfs_sb_release(struct kobject *kobj)</div><div class='add'>+{</div><div class='add'>+	/* no-op: why? see lib/kobject.c kobject_cleanup() */</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const void *nfs_netns_server_namespace(const struct kobject *kobj)</div><div class='add'>+{</div><div class='add'>+	return container_of(kobj, struct nfs_server, kobj)-&gt;nfs_client-&gt;cl_net;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct kobj_type nfs_sb_ktype = {</div><div class='add'>+	.release = nfs_sysfs_sb_release,</div><div class='add'>+	.sysfs_ops = &amp;kobj_sysfs_ops,</div><div class='add'>+	.namespace = nfs_netns_server_namespace,</div><div class='add'>+	.child_ns_type = nfs_netns_object_child_ns_type,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+#if IS_ENABLED(CONFIG_NFS_V4_1)</div><div class='add'>+static void nfs_sysfs_add_nfsv41_server(struct nfs_server *server)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (!server-&gt;nfs_client-&gt;cl_implid)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	ret = sysfs_create_file_ns(&amp;server-&gt;kobj, &amp;nfs_sysfs_attr_implid_domain.attr,</div><div class='add'>+					   nfs_netns_server_namespace(&amp;server-&gt;kobj));</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		pr_warn("NFS: sysfs_create_file_ns for server-%d failed (%d)\n",</div><div class='add'>+			server-&gt;s_sysfs_id, ret);</div><div class='add'>+</div><div class='add'>+	ret = sysfs_create_file_ns(&amp;server-&gt;kobj, &amp;nfs_sysfs_attr_implid_name.attr,</div><div class='add'>+				   nfs_netns_server_namespace(&amp;server-&gt;kobj));</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		pr_warn("NFS: sysfs_create_file_ns for server-%d failed (%d)\n",</div><div class='add'>+			server-&gt;s_sysfs_id, ret);</div><div class='add'>+}</div><div class='add'>+#else /* CONFIG_NFS_V4_1 */</div><div class='add'>+static inline void nfs_sysfs_add_nfsv41_server(struct nfs_server *server)</div><div class='add'>+{</div><div class='add'>+}</div><div class='add'>+#endif /* CONFIG_NFS_V4_1 */</div><div class='add'>+</div><div class='add'>+#if IS_ENABLED(CONFIG_NFS_LOCALIO)</div><div class='add'>+</div><div class='add'>+static ssize_t</div><div class='add'>+localio_show(struct kobject *kobj, struct kobj_attribute *attr,</div><div class='add'>+				char *buf)</div><div class='add'>+{</div><div class='add'>+	struct nfs_server *server = container_of(kobj, struct nfs_server, kobj);</div><div class='add'>+	bool localio = nfs_server_is_local(server-&gt;nfs_client);</div><div class='add'>+	return sysfs_emit(buf, "%d\n", localio);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct kobj_attribute nfs_sysfs_attr_localio = __ATTR_RO(localio);</div><div class='add'>+</div><div class='add'>+static void nfs_sysfs_add_nfs_localio_server(struct nfs_server *server)</div><div class='add'>+{</div><div class='add'>+	int ret = sysfs_create_file_ns(&amp;server-&gt;kobj, &amp;nfs_sysfs_attr_localio.attr,</div><div class='add'>+				       nfs_netns_server_namespace(&amp;server-&gt;kobj));</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		pr_warn("NFS: sysfs_create_file_ns for server-%d failed (%d)\n",</div><div class='add'>+			server-&gt;s_sysfs_id, ret);</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+static inline void nfs_sysfs_add_nfs_localio_server(struct nfs_server *server)</div><div class='add'>+{</div><div class='add'>+}</div><div class='add'>+#endif /* IS_ENABLED(CONFIG_NFS_LOCALIO) */</div><div class='add'>+</div><div class='add'>+void nfs_sysfs_add_server(struct nfs_server *server)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = kobject_init_and_add(&amp;server-&gt;kobj, &amp;nfs_sb_ktype,</div><div class='add'>+				&amp;nfs_kset-&gt;kobj, "server-%d", server-&gt;s_sysfs_id);</div><div class='add'>+	if (ret &lt; 0) {</div><div class='add'>+		pr_warn("NFS: nfs sysfs add server-%d failed (%d)\n",</div><div class='add'>+					server-&gt;s_sysfs_id, ret);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+	ret = sysfs_create_file_ns(&amp;server-&gt;kobj, &amp;nfs_sysfs_attr_shutdown.attr,</div><div class='add'>+				nfs_netns_server_namespace(&amp;server-&gt;kobj));</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		pr_warn("NFS: sysfs_create_file_ns for server-%d failed (%d)\n",</div><div class='add'>+			server-&gt;s_sysfs_id, ret);</div><div class='add'>+</div><div class='add'>+	nfs_sysfs_add_nfsv41_server(server);</div><div class='add'>+	nfs_sysfs_add_nfs_localio_server(server);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(nfs_sysfs_add_server);</div><div class='add'>+</div><div class='add'>+void nfs_sysfs_move_server_to_sb(struct super_block *s)</div><div class='add'>+{</div><div class='add'>+	struct nfs_server *server = s-&gt;s_fs_info;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	ret = kobject_rename(&amp;server-&gt;kobj, s-&gt;s_id);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		pr_warn("NFS: rename sysfs %s failed (%d)\n",</div><div class='add'>+					server-&gt;kobj.name, ret);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void nfs_sysfs_move_sb_to_server(struct nfs_server *server)</div><div class='add'>+{</div><div class='add'>+	const char *s;</div><div class='add'>+	int ret = -ENOMEM;</div><div class='add'>+</div><div class='add'>+	s = kasprintf(GFP_KERNEL, "server-%d", server-&gt;s_sysfs_id);</div><div class='add'>+	if (s) {</div><div class='add'>+		ret = kobject_rename(&amp;server-&gt;kobj, s);</div><div class='add'>+		kfree(s);</div><div class='add'>+	}</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		pr_warn("NFS: rename sysfs %s failed (%d)\n",</div><div class='add'>+					server-&gt;kobj.name, ret);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* unlink, not dec-ref */</div><div class='add'>+void nfs_sysfs_remove_server(struct nfs_server *server)</div><div class='add'>+{</div><div class='add'>+	kobject_del(&amp;server-&gt;kobj);</div><div class='add'>+}</div><div class='head'>diff --git a/fs/nfs/sysfs.h b/fs/nfs/sysfs.h<br/>index 5501ef573c32..c5d1990cade5 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/sysfs.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/sysfs.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/sysfs.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/sysfs.h</a></div><div class='hunk'>@@ -10,11 +10,12 @@</div><div class='ctx'> </div><div class='ctx'> struct nfs_netns_client {</div><div class='ctx'> 	struct kobject kobject;</div><div class='add'>+	struct kobject nfs_net_kobj;</div><div class='ctx'> 	struct net *net;</div><div class='ctx'> 	const char __rcu *identifier;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-extern struct kobject *nfs_client_kobj;</div><div class='add'>+extern struct kobject *nfs_net_kobj;</div><div class='ctx'> </div><div class='ctx'> extern int nfs_sysfs_init(void);</div><div class='ctx'> extern void nfs_sysfs_exit(void);</div><div class='hunk'>@@ -22,4 +23,11 @@ extern void nfs_sysfs_exit(void);</div><div class='ctx'> void nfs_netns_sysfs_setup(struct nfs_net *netns, struct net *net);</div><div class='ctx'> void nfs_netns_sysfs_destroy(struct nfs_net *netns);</div><div class='ctx'> </div><div class='add'>+void nfs_sysfs_link_rpc_client(struct nfs_server *server,</div><div class='add'>+			struct rpc_clnt *clnt, const char *sysfs_prefix);</div><div class='add'>+void nfs_sysfs_add_server(struct nfs_server *s);</div><div class='add'>+void nfs_sysfs_move_server_to_sb(struct super_block *s);</div><div class='add'>+void nfs_sysfs_move_sb_to_server(struct nfs_server *s);</div><div class='add'>+void nfs_sysfs_remove_server(struct nfs_server *s);</div><div class='add'>+</div><div class='ctx'> #endif</div><div class='head'>diff --git a/fs/nfs/unlink.c b/fs/nfs/unlink.c<br/>index 5fa11e1aca4c..b55467911648 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/unlink.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/unlink.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/unlink.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/unlink.c</a></div><div class='hunk'>@@ -102,6 +102,10 @@ static void nfs_do_call_unlink(struct inode *inode, struct nfs_unlinkdata *data)</div><div class='ctx'> 	};</div><div class='ctx'> 	struct rpc_task *task;</div><div class='ctx'> 	struct inode *dir = d_inode(data-&gt;dentry-&gt;d_parent);</div><div class='add'>+</div><div class='add'>+	if (nfs_server_capable(inode, NFS_CAP_MOVEABLE))</div><div class='add'>+		task_setup_data.flags |= RPC_TASK_MOVEABLE;</div><div class='add'>+</div><div class='ctx'> 	nfs_sb_active(dir-&gt;i_sb);</div><div class='ctx'> 	data-&gt;args.fh = NFS_FH(dir);</div><div class='ctx'> 	nfs_fattr_init(data-&gt;res.dir_attr);</div><div class='hunk'>@@ -135,6 +139,7 @@ static int nfs_call_unlink(struct dentry *dentry, struct inode *inode, struct nf</div><div class='ctx'> 		 */</div><div class='ctx'> 		spin_lock(&amp;alias-&gt;d_lock);</div><div class='ctx'> 		if (d_really_is_positive(alias) &amp;&amp;</div><div class='add'>+		    !nfs_compare_fh(NFS_FH(inode), NFS_FH(d_inode(alias))) &amp;&amp;</div><div class='ctx'> 		    !(alias-&gt;d_flags &amp; DCACHE_NFSFS_RENAMED)) {</div><div class='ctx'> 			devname_garbage = alias-&gt;d_fsdata;</div><div class='ctx'> 			alias-&gt;d_fsdata = data;</div><div class='hunk'>@@ -227,6 +232,8 @@ nfs_complete_unlink(struct dentry *dentry, struct inode *inode)</div><div class='ctx'> 	dentry-&gt;d_fsdata = NULL;</div><div class='ctx'> 	spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> </div><div class='add'>+	NFS_PROTO(inode)-&gt;return_delegation(inode);</div><div class='add'>+</div><div class='ctx'> 	if (NFS_STALE(inode) || !nfs_call_unlink(dentry, inode, data))</div><div class='ctx'> 		nfs_free_unlinkdata(data);</div><div class='ctx'> }</div><div class='hunk'>@@ -262,7 +269,7 @@ static void nfs_async_rename_done(struct rpc_task *task, void *calldata)</div><div class='ctx'> 	struct inode *new_dir = data-&gt;new_dir;</div><div class='ctx'> 	struct dentry *old_dentry = data-&gt;old_dentry;</div><div class='ctx'> </div><div class='del'>-	trace_nfs_sillyrename_rename(old_dir, old_dentry,</div><div class='add'>+	trace_nfs_async_rename_done(old_dir, old_dentry,</div><div class='ctx'> 			new_dir, data-&gt;new_dentry, task-&gt;tk_status);</div><div class='ctx'> 	if (!NFS_PROTO(old_dir)-&gt;rename_done(task, old_dir, new_dir)) {</div><div class='ctx'> 		rpc_restart_call_prepare(task);</div><div class='hunk'>@@ -344,9 +351,14 @@ nfs_async_rename(struct inode *old_dir, struct inode *new_dir,</div><div class='ctx'> 		.flags = RPC_TASK_ASYNC | RPC_TASK_CRED_NOREF,</div><div class='ctx'> 	};</div><div class='ctx'> </div><div class='add'>+	if (nfs_server_capable(old_dir, NFS_CAP_MOVEABLE) &amp;&amp;</div><div class='add'>+	    nfs_server_capable(new_dir, NFS_CAP_MOVEABLE))</div><div class='add'>+		task_setup_data.flags |= RPC_TASK_MOVEABLE;</div><div class='add'>+</div><div class='ctx'> 	data = kzalloc(sizeof(*data), GFP_KERNEL);</div><div class='ctx'> 	if (data == NULL)</div><div class='ctx'> 		return ERR_PTR(-ENOMEM);</div><div class='add'>+	task_setup_data.task = &amp;data-&gt;task;</div><div class='ctx'> 	task_setup_data.callback_data = data;</div><div class='ctx'> </div><div class='ctx'> 	data-&gt;cred = get_current_cred();</div><div class='hunk'>@@ -452,18 +464,17 @@ nfs_sillyrename(struct inode *dir, struct dentry *dentry)</div><div class='ctx'> </div><div class='ctx'> 	sdentry = NULL;</div><div class='ctx'> 	do {</div><div class='del'>-		int slen;</div><div class='ctx'> 		dput(sdentry);</div><div class='ctx'> 		sillycounter++;</div><div class='del'>-		slen = scnprintf(silly, sizeof(silly),</div><div class='del'>-				SILLYNAME_PREFIX "%0*llx%0*x",</div><div class='del'>-				SILLYNAME_FILEID_LEN, fileid,</div><div class='del'>-				SILLYNAME_COUNTER_LEN, sillycounter);</div><div class='add'>+		scnprintf(silly, sizeof(silly),</div><div class='add'>+			  SILLYNAME_PREFIX "%0*llx%0*x",</div><div class='add'>+			  SILLYNAME_FILEID_LEN, fileid,</div><div class='add'>+			  SILLYNAME_COUNTER_LEN, sillycounter);</div><div class='ctx'> </div><div class='ctx'> 		dfprintk(VFS, "NFS: trying to rename %pd to %s\n",</div><div class='ctx'> 				dentry, silly);</div><div class='ctx'> </div><div class='del'>-		sdentry = lookup_one_len(silly, dentry-&gt;d_parent, slen);</div><div class='add'>+		sdentry = lookup_noperm(&amp;QSTR(silly), dentry-&gt;d_parent);</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * N.B. Better to return EBUSY here ... it could be</div><div class='ctx'> 		 * dangerous to delete the file while it's in use.</div><div class='head'>diff --git a/fs/nfs/write.c b/fs/nfs/write.c<br/>index 9b7619ce17a7..336c510f3750 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs/write.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs/write.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs/write.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs/write.c</a></div><div class='hunk'>@@ -25,6 +25,7 @@</div><div class='ctx'> #include &lt;linux/freezer.h&gt;</div><div class='ctx'> #include &lt;linux/wait.h&gt;</div><div class='ctx'> #include &lt;linux/iversion.h&gt;</div><div class='add'>+#include &lt;linux/filelock.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/uaccess.h&gt;</div><div class='ctx'> #include &lt;linux/sched/mm.h&gt;</div><div class='hunk'>@@ -58,39 +59,27 @@ static const struct nfs_pgio_completion_ops nfs_async_write_completion_ops;</div><div class='ctx'> static const struct nfs_commit_completion_ops nfs_commit_completion_ops;</div><div class='ctx'> static const struct nfs_rw_ops nfs_rw_write_ops;</div><div class='ctx'> static void nfs_inode_remove_request(struct nfs_page *req);</div><div class='del'>-static void nfs_clear_request_commit(struct nfs_page *req);</div><div class='add'>+static void nfs_clear_request_commit(struct nfs_commit_info *cinfo,</div><div class='add'>+				     struct nfs_page *req);</div><div class='ctx'> static void nfs_init_cinfo_from_inode(struct nfs_commit_info *cinfo,</div><div class='ctx'> 				      struct inode *inode);</div><div class='del'>-static struct nfs_page *</div><div class='del'>-nfs_page_search_commits_for_head_request_locked(struct nfs_inode *nfsi,</div><div class='del'>-						struct page *page);</div><div class='ctx'> </div><div class='ctx'> static struct kmem_cache *nfs_wdata_cachep;</div><div class='ctx'> static mempool_t *nfs_wdata_mempool;</div><div class='ctx'> static struct kmem_cache *nfs_cdata_cachep;</div><div class='ctx'> static mempool_t *nfs_commit_mempool;</div><div class='ctx'> </div><div class='del'>-struct nfs_commit_data *nfs_commitdata_alloc(bool never_fail)</div><div class='add'>+struct nfs_commit_data *nfs_commitdata_alloc(void)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_commit_data *p;</div><div class='ctx'> </div><div class='del'>-	if (never_fail)</div><div class='del'>-		p = mempool_alloc(nfs_commit_mempool, GFP_NOIO);</div><div class='del'>-	else {</div><div class='del'>-		/* It is OK to do some reclaim, not no safe to wait</div><div class='del'>-		 * for anything to be returned to the pool.</div><div class='del'>-		 * mempool_alloc() cannot handle that particular combination,</div><div class='del'>-		 * so we need two separate attempts.</div><div class='del'>-		 */</div><div class='add'>+	p = kmem_cache_zalloc(nfs_cdata_cachep, nfs_io_gfp_mask());</div><div class='add'>+	if (!p) {</div><div class='ctx'> 		p = mempool_alloc(nfs_commit_mempool, GFP_NOWAIT);</div><div class='ctx'> 		if (!p)</div><div class='del'>-			p = kmem_cache_alloc(nfs_cdata_cachep, GFP_NOIO |</div><div class='del'>-					     __GFP_NOWARN | __GFP_NORETRY);</div><div class='del'>-		if (!p)</div><div class='ctx'> 			return NULL;</div><div class='add'>+		memset(p, 0, sizeof(*p));</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	memset(p, 0, sizeof(*p));</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;p-&gt;pages);</div><div class='ctx'> 	return p;</div><div class='ctx'> }</div><div class='hunk'>@@ -104,9 +93,15 @@ EXPORT_SYMBOL_GPL(nfs_commit_free);</div><div class='ctx'> </div><div class='ctx'> static struct nfs_pgio_header *nfs_writehdr_alloc(void)</div><div class='ctx'> {</div><div class='del'>-	struct nfs_pgio_header *p = mempool_alloc(nfs_wdata_mempool, GFP_KERNEL);</div><div class='add'>+	struct nfs_pgio_header *p;</div><div class='ctx'> </div><div class='del'>-	memset(p, 0, sizeof(*p));</div><div class='add'>+	p = kmem_cache_zalloc(nfs_wdata_cachep, nfs_io_gfp_mask());</div><div class='add'>+	if (!p) {</div><div class='add'>+		p = mempool_alloc(nfs_wdata_mempool, GFP_NOWAIT);</div><div class='add'>+		if (!p)</div><div class='add'>+			return NULL;</div><div class='add'>+		memset(p, 0, sizeof(*p));</div><div class='add'>+	}</div><div class='ctx'> 	p-&gt;rw_mode = FMODE_WRITE;</div><div class='ctx'> 	return p;</div><div class='ctx'> }</div><div class='hunk'>@@ -158,134 +153,51 @@ nfs_page_set_inode_ref(struct nfs_page *req, struct inode *inode)</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int</div><div class='del'>-nfs_cancel_remove_inode(struct nfs_page *req, struct inode *inode)</div><div class='add'>+static void nfs_cancel_remove_inode(struct nfs_page *req, struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	if (!test_bit(PG_REMOVE, &amp;req-&gt;wb_flags))</div><div class='del'>-		return 0;</div><div class='del'>-	ret = nfs_page_group_lock(req);</div><div class='del'>-	if (ret)</div><div class='del'>-		return ret;</div><div class='ctx'> 	if (test_and_clear_bit(PG_REMOVE, &amp;req-&gt;wb_flags))</div><div class='ctx'> 		nfs_page_set_inode_ref(req, inode);</div><div class='del'>-	nfs_page_group_unlock(req);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct nfs_page *</div><div class='del'>-nfs_page_private_request(struct page *page)</div><div class='del'>-{</div><div class='del'>-	if (!PagePrivate(page))</div><div class='del'>-		return NULL;</div><div class='del'>-	return (struct nfs_page *)page_private(page);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * nfs_page_find_head_request_locked - find head request associated with @page</div><div class='add'>+/**</div><div class='add'>+ * nfs_folio_find_head_request - find head request associated with a folio</div><div class='add'>+ * @folio: pointer to folio</div><div class='ctx'>  *</div><div class='ctx'>  * must be called while holding the inode lock.</div><div class='ctx'>  *</div><div class='ctx'>  * returns matching head request with reference held, or NULL if not found.</div><div class='ctx'>  */</div><div class='del'>-static struct nfs_page *</div><div class='del'>-nfs_page_find_private_request(struct page *page)</div><div class='add'>+static struct nfs_page *nfs_folio_find_head_request(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *mapping = page_file_mapping(page);</div><div class='add'>+	struct address_space *mapping = folio-&gt;mapping;</div><div class='ctx'> 	struct nfs_page *req;</div><div class='ctx'> </div><div class='del'>-	if (!PagePrivate(page))</div><div class='add'>+	if (!folio_test_private(folio))</div><div class='ctx'> 		return NULL;</div><div class='del'>-	spin_lock(&amp;mapping-&gt;private_lock);</div><div class='del'>-	req = nfs_page_private_request(page);</div><div class='add'>+	spin_lock(&amp;mapping-&gt;i_private_lock);</div><div class='add'>+	req = folio-&gt;private;</div><div class='ctx'> 	if (req) {</div><div class='ctx'> 		WARN_ON_ONCE(req-&gt;wb_head != req);</div><div class='ctx'> 		kref_get(&amp;req-&gt;wb_kref);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;mapping-&gt;private_lock);</div><div class='add'>+	spin_unlock(&amp;mapping-&gt;i_private_lock);</div><div class='ctx'> 	return req;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct nfs_page *</div><div class='del'>-nfs_page_find_swap_request(struct page *page)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = page_file_mapping(page)-&gt;host;</div><div class='del'>-	struct nfs_inode *nfsi = NFS_I(inode);</div><div class='del'>-	struct nfs_page *req = NULL;</div><div class='del'>-	if (!PageSwapCache(page))</div><div class='del'>-		return NULL;</div><div class='del'>-	mutex_lock(&amp;nfsi-&gt;commit_mutex);</div><div class='del'>-	if (PageSwapCache(page)) {</div><div class='del'>-		req = nfs_page_search_commits_for_head_request_locked(nfsi,</div><div class='del'>-			page);</div><div class='del'>-		if (req) {</div><div class='del'>-			WARN_ON_ONCE(req-&gt;wb_head != req);</div><div class='del'>-			kref_get(&amp;req-&gt;wb_kref);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	mutex_unlock(&amp;nfsi-&gt;commit_mutex);</div><div class='del'>-	return req;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * nfs_page_find_head_request - find head request associated with @page</div><div class='del'>- *</div><div class='del'>- * returns matching head request with reference held, or NULL if not found.</div><div class='del'>- */</div><div class='del'>-static struct nfs_page *nfs_page_find_head_request(struct page *page)</div><div class='del'>-{</div><div class='del'>-	struct nfs_page *req;</div><div class='del'>-</div><div class='del'>-	req = nfs_page_find_private_request(page);</div><div class='del'>-	if (!req)</div><div class='del'>-		req = nfs_page_find_swap_request(page);</div><div class='del'>-	return req;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct nfs_page *nfs_find_and_lock_page_request(struct page *page)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = page_file_mapping(page)-&gt;host;</div><div class='del'>-	struct nfs_page *req, *head;</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	for (;;) {</div><div class='del'>-		req = nfs_page_find_head_request(page);</div><div class='del'>-		if (!req)</div><div class='del'>-			return req;</div><div class='del'>-		head = nfs_page_group_lock_head(req);</div><div class='del'>-		if (head != req)</div><div class='del'>-			nfs_release_request(req);</div><div class='del'>-		if (IS_ERR(head))</div><div class='del'>-			return head;</div><div class='del'>-		ret = nfs_cancel_remove_inode(head, inode);</div><div class='del'>-		if (ret &lt; 0) {</div><div class='del'>-			nfs_unlock_and_release_request(head);</div><div class='del'>-			return ERR_PTR(ret);</div><div class='del'>-		}</div><div class='del'>-		/* Ensure that nobody removed the request before we locked it */</div><div class='del'>-		if (head == nfs_page_private_request(page))</div><div class='del'>-			break;</div><div class='del'>-		if (PageSwapCache(page))</div><div class='del'>-			break;</div><div class='del'>-		nfs_unlock_and_release_request(head);</div><div class='del'>-	}</div><div class='del'>-	return head;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /* Adjust the file length if we're writing beyond the end */</div><div class='del'>-static void nfs_grow_file(struct page *page, unsigned int offset, unsigned int count)</div><div class='add'>+static void nfs_grow_file(struct folio *folio, unsigned int offset,</div><div class='add'>+			  unsigned int count)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page_file_mapping(page)-&gt;host;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	loff_t end, i_size;</div><div class='ctx'> 	pgoff_t end_index;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	i_size = i_size_read(inode);</div><div class='del'>-	end_index = (i_size - 1) &gt;&gt; PAGE_SHIFT;</div><div class='del'>-	if (i_size &gt; 0 &amp;&amp; page_index(page) &lt; end_index)</div><div class='add'>+	end_index = ((i_size - 1) &gt;&gt; folio_shift(folio)) &lt;&lt; folio_order(folio);</div><div class='add'>+	if (i_size &gt; 0 &amp;&amp; folio-&gt;index &lt; end_index)</div><div class='ctx'> 		goto out;</div><div class='del'>-	end = page_file_offset(page) + ((loff_t)offset+count);</div><div class='add'>+	end = folio_pos(folio) + (loff_t)offset + (loff_t)count;</div><div class='ctx'> 	if (i_size &gt;= end)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	trace_nfs_size_grow(inode, end);</div><div class='hunk'>@@ -293,7 +205,10 @@ static void nfs_grow_file(struct page *page, unsigned int offset, unsigned int c</div><div class='ctx'> 	NFS_I(inode)-&gt;cache_validity &amp;= ~NFS_INO_INVALID_SIZE;</div><div class='ctx'> 	nfs_inc_stats(inode, NFSIOS_EXTENDWRITE);</div><div class='ctx'> out:</div><div class='add'>+	/* Atomically update timestamps if they are delegated to us. */</div><div class='add'>+	nfs_update_delegated_mtime_locked(inode);</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+	nfs_fscache_invalidate(inode, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* A writeback failed: mark the page as bad, and invalidate the page cache */</div><div class='hunk'>@@ -305,74 +220,34 @@ static void nfs_set_pageerror(struct address_space *mapping)</div><div class='ctx'> 	/* Force file size revalidation */</div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	nfs_set_cache_invalid(inode, NFS_INO_REVAL_FORCED |</div><div class='del'>-					     NFS_INO_REVAL_PAGECACHE |</div><div class='add'>+					     NFS_INO_INVALID_CHANGE |</div><div class='ctx'> 					     NFS_INO_INVALID_SIZE);</div><div class='ctx'> 	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void nfs_mapping_set_error(struct page *page, int error)</div><div class='add'>+static void nfs_mapping_set_error(struct folio *folio, int error)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *mapping = page_file_mapping(page);</div><div class='add'>+	struct address_space *mapping = folio-&gt;mapping;</div><div class='ctx'> </div><div class='del'>-	SetPageError(page);</div><div class='del'>-	mapping_set_error(mapping, error);</div><div class='add'>+	filemap_set_wb_err(mapping, error);</div><div class='add'>+	if (mapping-&gt;host)</div><div class='add'>+		errseq_set(&amp;mapping-&gt;host-&gt;i_sb-&gt;s_wb_err,</div><div class='add'>+			   error == -ENOSPC ? -ENOSPC : -EIO);</div><div class='ctx'> 	nfs_set_pageerror(mapping);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * nfs_page_group_search_locked</div><div class='del'>- * @head - head request of page group</div><div class='del'>- * @page_offset - offset into page</div><div class='del'>- *</div><div class='del'>- * Search page group with head @head to find a request that contains the</div><div class='del'>- * page offset @page_offset.</div><div class='del'>- *</div><div class='del'>- * Returns a pointer to the first matching nfs request, or NULL if no</div><div class='del'>- * match is found.</div><div class='del'>- *</div><div class='del'>- * Must be called with the page group lock held</div><div class='del'>- */</div><div class='del'>-static struct nfs_page *</div><div class='del'>-nfs_page_group_search_locked(struct nfs_page *head, unsigned int page_offset)</div><div class='del'>-{</div><div class='del'>-	struct nfs_page *req;</div><div class='del'>-</div><div class='del'>-	req = head;</div><div class='del'>-	do {</div><div class='del'>-		if (page_offset &gt;= req-&gt;wb_pgbase &amp;&amp;</div><div class='del'>-		    page_offset &lt; (req-&gt;wb_pgbase + req-&gt;wb_bytes))</div><div class='del'>-			return req;</div><div class='del'>-</div><div class='del'>-		req = req-&gt;wb_this_page;</div><div class='del'>-	} while (req != head);</div><div class='del'>-</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * nfs_page_group_covers_page</div><div class='del'>- * @head - head request of page group</div><div class='add'>+ * nfs_page_covers_folio</div><div class='add'>+ * @req: struct nfs_page</div><div class='ctx'>  *</div><div class='del'>- * Return true if the page group with head @head covers the whole page,</div><div class='del'>- * returns false otherwise</div><div class='add'>+ * Return true if the request covers the whole folio.</div><div class='add'>+ * Note that the caller should ensure all subrequests have been joined</div><div class='ctx'>  */</div><div class='ctx'> static bool nfs_page_group_covers_page(struct nfs_page *req)</div><div class='ctx'> {</div><div class='del'>-	struct nfs_page *tmp;</div><div class='del'>-	unsigned int pos = 0;</div><div class='del'>-	unsigned int len = nfs_page_length(req-&gt;wb_page);</div><div class='del'>-</div><div class='del'>-	nfs_page_group_lock(req);</div><div class='add'>+	unsigned int len = nfs_folio_length(nfs_page_to_folio(req));</div><div class='ctx'> </div><div class='del'>-	for (;;) {</div><div class='del'>-		tmp = nfs_page_group_search_locked(req-&gt;wb_head, pos);</div><div class='del'>-		if (!tmp)</div><div class='del'>-			break;</div><div class='del'>-		pos = tmp-&gt;wb_pgbase + tmp-&gt;wb_bytes;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	nfs_page_group_unlock(req);</div><div class='del'>-	return pos &gt;= len;</div><div class='add'>+	return req-&gt;wb_pgbase == 0 &amp;&amp; req-&gt;wb_bytes == len;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* We can set the PG_uptodate flag if we see that a write request</div><div class='hunk'>@@ -380,11 +255,13 @@ static bool nfs_page_group_covers_page(struct nfs_page *req)</div><div class='ctx'>  */</div><div class='ctx'> static void nfs_mark_uptodate(struct nfs_page *req)</div><div class='ctx'> {</div><div class='del'>-	if (PageUptodate(req-&gt;wb_page))</div><div class='add'>+	struct folio *folio = nfs_page_to_folio(req);</div><div class='add'>+</div><div class='add'>+	if (folio_test_uptodate(folio))</div><div class='ctx'> 		return;</div><div class='ctx'> 	if (!nfs_page_group_covers_page(req))</div><div class='ctx'> 		return;</div><div class='del'>-	SetPageUptodate(req-&gt;wb_page);</div><div class='add'>+	folio_mark_uptodate(folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int wb_priority(struct writeback_control *wbc)</div><div class='hunk'>@@ -406,33 +283,34 @@ int nfs_congestion_kb;</div><div class='ctx'> #define NFS_CONGESTION_OFF_THRESH	\</div><div class='ctx'> 	(NFS_CONGESTION_ON_THRESH - (NFS_CONGESTION_ON_THRESH &gt;&gt; 2))</div><div class='ctx'> </div><div class='del'>-static void nfs_set_page_writeback(struct page *page)</div><div class='add'>+static void nfs_folio_set_writeback(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page_file_mapping(page)-&gt;host;</div><div class='del'>-	struct nfs_server *nfss = NFS_SERVER(inode);</div><div class='del'>-	int ret = test_set_page_writeback(page);</div><div class='del'>-</div><div class='del'>-	WARN_ON_ONCE(ret != 0);</div><div class='add'>+	struct nfs_server *nfss = NFS_SERVER(folio-&gt;mapping-&gt;host);</div><div class='ctx'> </div><div class='del'>-	if (atomic_long_inc_return(&amp;nfss-&gt;writeback) &gt;</div><div class='del'>-			NFS_CONGESTION_ON_THRESH)</div><div class='del'>-		set_bdi_congested(inode_to_bdi(inode), BLK_RW_ASYNC);</div><div class='add'>+	folio_start_writeback(folio);</div><div class='add'>+	if (atomic_long_inc_return(&amp;nfss-&gt;writeback) &gt; NFS_CONGESTION_ON_THRESH)</div><div class='add'>+		nfss-&gt;write_congested = 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void nfs_end_page_writeback(struct nfs_page *req)</div><div class='add'>+static void nfs_folio_end_writeback(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page_file_mapping(req-&gt;wb_page)-&gt;host;</div><div class='del'>-	struct nfs_server *nfss = NFS_SERVER(inode);</div><div class='del'>-	bool is_done;</div><div class='add'>+	struct nfs_server *nfss = NFS_SERVER(folio-&gt;mapping-&gt;host);</div><div class='ctx'> </div><div class='del'>-	is_done = nfs_page_group_sync_on_bit(req, PG_WB_END);</div><div class='del'>-	nfs_unlock_request(req);</div><div class='del'>-	if (!is_done)</div><div class='del'>-		return;</div><div class='add'>+	folio_end_writeback_no_dropbehind(folio);</div><div class='add'>+	if (atomic_long_dec_return(&amp;nfss-&gt;writeback) &lt;</div><div class='add'>+	    NFS_CONGESTION_OFF_THRESH) {</div><div class='add'>+		nfss-&gt;write_congested = 0;</div><div class='add'>+		wake_up_all(&amp;nfss-&gt;write_congestion_wait);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	end_page_writeback(req-&gt;wb_page);</div><div class='del'>-	if (atomic_long_dec_return(&amp;nfss-&gt;writeback) &lt; NFS_CONGESTION_OFF_THRESH)</div><div class='del'>-		clear_bdi_congested(inode_to_bdi(inode), BLK_RW_ASYNC);</div><div class='add'>+static void nfs_page_end_writeback(struct nfs_page *req)</div><div class='add'>+{</div><div class='add'>+	if (nfs_page_group_sync_on_bit(req, PG_WB_END)) {</div><div class='add'>+		nfs_unlock_request(req);</div><div class='add'>+		nfs_folio_end_writeback(nfs_page_to_folio(req));</div><div class='add'>+	} else</div><div class='add'>+		nfs_unlock_request(req);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -502,8 +380,8 @@ nfs_destroy_unlinked_subrequests(struct nfs_page *destroy_list,</div><div class='ctx'>  * the (former) group.  All subrequests are removed from any write or commit</div><div class='ctx'>  * lists, unlinked from the group and destroyed.</div><div class='ctx'>  */</div><div class='del'>-void</div><div class='del'>-nfs_join_page_group(struct nfs_page *head, struct inode *inode)</div><div class='add'>+void nfs_join_page_group(struct nfs_page *head, struct nfs_commit_info *cinfo,</div><div class='add'>+			 struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_page *subreq;</div><div class='ctx'> 	struct nfs_page *destroy_list = NULL;</div><div class='hunk'>@@ -533,7 +411,7 @@ nfs_join_page_group(struct nfs_page *head, struct inode *inode)</div><div class='ctx'> 	 * Commit list removal accounting is done after locks are dropped */</div><div class='ctx'> 	subreq = head;</div><div class='ctx'> 	do {</div><div class='del'>-		nfs_clear_request_commit(subreq);</div><div class='add'>+		nfs_clear_request_commit(cinfo, subreq);</div><div class='ctx'> 		subreq = subreq-&gt;wb_this_page;</div><div class='ctx'> 	} while (subreq != head);</div><div class='ctx'> </div><div class='hunk'>@@ -547,9 +425,77 @@ nfs_join_page_group(struct nfs_page *head, struct inode *inode)</div><div class='ctx'> 	nfs_destroy_unlinked_subrequests(destroy_list, head, inode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * nfs_wait_on_request - Wait for a request to complete.</div><div class='add'>+ * @req: request to wait upon.</div><div class='add'>+ *</div><div class='add'>+ * Interruptible by fatal signals only.</div><div class='add'>+ * The user is responsible for holding a count on the request.</div><div class='add'>+ */</div><div class='add'>+static int nfs_wait_on_request(struct nfs_page *req)</div><div class='add'>+{</div><div class='add'>+	if (!test_bit(PG_BUSY, &amp;req-&gt;wb_flags))</div><div class='add'>+		return 0;</div><div class='add'>+	set_bit(PG_CONTENDED2, &amp;req-&gt;wb_flags);</div><div class='add'>+	smp_mb__after_atomic();</div><div class='add'>+	return wait_on_bit_io(&amp;req-&gt;wb_flags, PG_BUSY,</div><div class='add'>+			      TASK_UNINTERRUPTIBLE);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * nfs_unroll_locks -  unlock all newly locked reqs and wait on @req</div><div class='add'>+ * @head: head request of page group, must be holding head lock</div><div class='add'>+ * @req: request that couldn't lock and needs to wait on the req bit lock</div><div class='add'>+ *</div><div class='add'>+ * This is a helper function for nfs_lock_and_join_requests</div><div class='add'>+ * returns 0 on success, &lt; 0 on error.</div><div class='add'>+ */</div><div class='add'>+static void</div><div class='add'>+nfs_unroll_locks(struct nfs_page *head, struct nfs_page *req)</div><div class='add'>+{</div><div class='add'>+	struct nfs_page *tmp;</div><div class='add'>+</div><div class='add'>+	/* relinquish all the locks successfully grabbed this run */</div><div class='add'>+	for (tmp = head-&gt;wb_this_page ; tmp != req; tmp = tmp-&gt;wb_this_page) {</div><div class='add'>+		if (!kref_read(&amp;tmp-&gt;wb_kref))</div><div class='add'>+			continue;</div><div class='add'>+		nfs_unlock_and_release_request(tmp);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * nfs_page_group_lock_subreq -  try to lock a subrequest</div><div class='add'>+ * @head: head request of page group</div><div class='add'>+ * @subreq: request to lock</div><div class='add'>+ *</div><div class='add'>+ * This is a helper function for nfs_lock_and_join_requests which</div><div class='add'>+ * must be called with the head request and page group both locked.</div><div class='add'>+ * On error, it returns with the page group unlocked.</div><div class='add'>+ */</div><div class='add'>+static int</div><div class='add'>+nfs_page_group_lock_subreq(struct nfs_page *head, struct nfs_page *subreq)</div><div class='add'>+{</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (!kref_get_unless_zero(&amp;subreq-&gt;wb_kref))</div><div class='add'>+		return 0;</div><div class='add'>+	while (!nfs_lock_request(subreq)) {</div><div class='add'>+		nfs_page_group_unlock(head);</div><div class='add'>+		ret = nfs_wait_on_request(subreq);</div><div class='add'>+		if (!ret)</div><div class='add'>+			ret = nfs_page_group_lock(head);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			nfs_unroll_locks(head, subreq);</div><div class='add'>+			nfs_release_request(subreq);</div><div class='add'>+			return ret;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * nfs_lock_and_join_requests - join all subreqs to the head req</div><div class='del'>- * @page: the page used to lookup the "page group" of nfs_page structures</div><div class='add'>+ * @folio: the folio used to lookup the "page group" of nfs_page structures</div><div class='ctx'>  *</div><div class='ctx'>  * This function joins all sub requests to the head request by first</div><div class='ctx'>  * locking all requests in the group, cancelling any pending operations</div><div class='hunk'>@@ -559,14 +505,14 @@ nfs_join_page_group(struct nfs_page *head, struct inode *inode)</div><div class='ctx'>  *</div><div class='ctx'>  * Returns a locked, referenced pointer to the head request - which after</div><div class='ctx'>  * this call is guaranteed to be the only request associated with the page.</div><div class='del'>- * Returns NULL if no requests are found for @page, or a ERR_PTR if an</div><div class='add'>+ * Returns NULL if no requests are found for @folio, or a ERR_PTR if an</div><div class='ctx'>  * error was encountered.</div><div class='ctx'>  */</div><div class='del'>-static struct nfs_page *</div><div class='del'>-nfs_lock_and_join_requests(struct page *page)</div><div class='add'>+static struct nfs_page *nfs_lock_and_join_requests(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page_file_mapping(page)-&gt;host;</div><div class='del'>-	struct nfs_page *head;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='add'>+	struct nfs_page *head, *subreq;</div><div class='add'>+	struct nfs_commit_info cinfo;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -574,28 +520,58 @@ nfs_lock_and_join_requests(struct page *page)</div><div class='ctx'> 	 * reference to the whole page group - the group will not be destroyed</div><div class='ctx'> 	 * until the head reference is released.</div><div class='ctx'> 	 */</div><div class='del'>-	head = nfs_find_and_lock_page_request(page);</div><div class='del'>-	if (IS_ERR_OR_NULL(head))</div><div class='del'>-		return head;</div><div class='add'>+retry:</div><div class='add'>+	head = nfs_folio_find_head_request(folio);</div><div class='add'>+	if (!head)</div><div class='add'>+		return NULL;</div><div class='ctx'> </div><div class='del'>-	/* lock each request in the page group */</div><div class='del'>-	ret = nfs_page_group_lock_subrequests(head);</div><div class='del'>-	if (ret &lt; 0) {</div><div class='add'>+	while (!nfs_lock_request(head)) {</div><div class='add'>+		ret = nfs_wait_on_request(head);</div><div class='add'>+		if (ret &lt; 0) {</div><div class='add'>+			nfs_release_request(head);</div><div class='add'>+			return ERR_PTR(ret);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = nfs_page_group_lock(head);</div><div class='add'>+	if (ret &lt; 0)</div><div class='add'>+		goto out_unlock;</div><div class='add'>+</div><div class='add'>+	/* Ensure that nobody removed the request before we locked it */</div><div class='add'>+	if (head != folio-&gt;private) {</div><div class='add'>+		nfs_page_group_unlock(head);</div><div class='ctx'> 		nfs_unlock_and_release_request(head);</div><div class='del'>-		return ERR_PTR(ret);</div><div class='add'>+		goto retry;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	nfs_cancel_remove_inode(head, inode);</div><div class='add'>+</div><div class='add'>+	/* lock each request in the page group */</div><div class='add'>+	for (subreq = head-&gt;wb_this_page;</div><div class='add'>+	     subreq != head;</div><div class='add'>+	     subreq = subreq-&gt;wb_this_page) {</div><div class='add'>+		ret = nfs_page_group_lock_subreq(head, subreq);</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			goto out_unlock;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	nfs_join_page_group(head, inode);</div><div class='add'>+	nfs_page_group_unlock(head);</div><div class='ctx'> </div><div class='add'>+	nfs_init_cinfo_from_inode(&amp;cinfo, inode);</div><div class='add'>+	nfs_join_page_group(head, &amp;cinfo, inode);</div><div class='ctx'> 	return head;</div><div class='add'>+</div><div class='add'>+out_unlock:</div><div class='add'>+	nfs_unlock_and_release_request(head);</div><div class='add'>+	return ERR_PTR(ret);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void nfs_write_error(struct nfs_page *req, int error)</div><div class='ctx'> {</div><div class='del'>-	trace_nfs_write_error(req, error);</div><div class='del'>-	nfs_mapping_set_error(req-&gt;wb_page, error);</div><div class='add'>+	trace_nfs_write_error(nfs_page_to_inode(req), req, error);</div><div class='add'>+	nfs_mapping_set_error(nfs_page_to_folio(req), error);</div><div class='ctx'> 	nfs_inode_remove_request(req);</div><div class='del'>-	nfs_end_page_writeback(req);</div><div class='add'>+	nfs_page_end_writeback(req);</div><div class='ctx'> 	nfs_release_request(req);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -603,20 +579,22 @@ static void nfs_write_error(struct nfs_page *req, int error)</div><div class='ctx'>  * Find an associated nfs write request, and prepare to flush it out</div><div class='ctx'>  * May return an error if the user signalled nfs_wait_on_request().</div><div class='ctx'>  */</div><div class='del'>-static int nfs_page_async_flush(struct nfs_pageio_descriptor *pgio,</div><div class='del'>-				struct page *page)</div><div class='add'>+static int nfs_do_writepage(struct folio *folio, struct writeback_control *wbc,</div><div class='add'>+		struct nfs_pageio_descriptor *pgio)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_page *req;</div><div class='del'>-	int ret = 0;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	req = nfs_lock_and_join_requests(page);</div><div class='add'>+	nfs_pageio_cond_complete(pgio, folio-&gt;index);</div><div class='add'>+</div><div class='add'>+	req = nfs_lock_and_join_requests(folio);</div><div class='ctx'> 	if (!req)</div><div class='del'>-		goto out;</div><div class='del'>-	ret = PTR_ERR(req);</div><div class='add'>+		return 0;</div><div class='ctx'> 	if (IS_ERR(req))</div><div class='del'>-		goto out;</div><div class='add'>+		return PTR_ERR(req);</div><div class='ctx'> </div><div class='del'>-	nfs_set_page_writeback(page);</div><div class='add'>+	trace_nfs_do_writepage(req);</div><div class='add'>+	nfs_folio_set_writeback(folio);</div><div class='ctx'> 	WARN_ON_ONCE(test_bit(PG_CLEAN, &amp;req-&gt;wb_flags));</div><div class='ctx'> </div><div class='ctx'> 	/* If there is a fatal error that covers this write, just exit */</div><div class='hunk'>@@ -624,84 +602,44 @@ static int nfs_page_async_flush(struct nfs_pageio_descriptor *pgio,</div><div class='ctx'> 	if (nfs_error_is_fatal_on_server(ret))</div><div class='ctx'> 		goto out_launder;</div><div class='ctx'> </div><div class='del'>-	ret = 0;</div><div class='ctx'> 	if (!nfs_pageio_add_request(pgio, req)) {</div><div class='ctx'> 		ret = pgio-&gt;pg_error;</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Remove the problematic req upon fatal errors on the server</div><div class='ctx'> 		 */</div><div class='del'>-		if (nfs_error_is_fatal(ret)) {</div><div class='del'>-			if (nfs_error_is_fatal_on_server(ret))</div><div class='del'>-				goto out_launder;</div><div class='del'>-		} else</div><div class='del'>-			ret = -EAGAIN;</div><div class='add'>+		if (nfs_error_is_fatal_on_server(ret))</div><div class='add'>+			goto out_launder;</div><div class='add'>+		folio_redirty_for_writepage(wbc, folio);</div><div class='ctx'> 		nfs_redirty_request(req);</div><div class='ctx'> 		pgio-&gt;pg_error = 0;</div><div class='del'>-	} else</div><div class='del'>-		nfs_add_stats(page_file_mapping(page)-&gt;host,</div><div class='del'>-				NFSIOS_WRITEPAGES, 1);</div><div class='del'>-out:</div><div class='del'>-	return ret;</div><div class='add'>+		return ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	nfs_add_stats(folio-&gt;mapping-&gt;host, NFSIOS_WRITEPAGES, 1);</div><div class='add'>+	return 0;</div><div class='add'>+</div><div class='ctx'> out_launder:</div><div class='ctx'> 	nfs_write_error(req, ret);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int nfs_do_writepage(struct page *page, struct writeback_control *wbc,</div><div class='del'>-			    struct nfs_pageio_descriptor *pgio)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	nfs_pageio_cond_complete(pgio, page_index(page));</div><div class='del'>-	ret = nfs_page_async_flush(pgio, page);</div><div class='del'>-	if (ret == -EAGAIN) {</div><div class='del'>-		redirty_page_for_writepage(wbc, page);</div><div class='del'>-		ret = AOP_WRITEPAGE_ACTIVATE;</div><div class='del'>-	}</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Write an mmapped page to the server.</div><div class='ctx'>  */</div><div class='del'>-static int nfs_writepage_locked(struct page *page,</div><div class='add'>+static int nfs_writepage_locked(struct folio *folio,</div><div class='ctx'> 				struct writeback_control *wbc)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_pageio_descriptor pgio;</div><div class='del'>-	struct inode *inode = page_file_mapping(page)-&gt;host;</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	nfs_inc_stats(inode, NFSIOS_VFSWRITEPAGE);</div><div class='del'>-	nfs_pageio_init_write(&amp;pgio, inode, 0,</div><div class='del'>-				false, &amp;nfs_async_write_completion_ops);</div><div class='del'>-	err = nfs_do_writepage(page, wbc, &amp;pgio);</div><div class='add'>+	nfs_pageio_init_write(&amp;pgio, inode, 0, false,</div><div class='add'>+			      &amp;nfs_async_write_completion_ops);</div><div class='add'>+	err = nfs_do_writepage(folio, wbc, &amp;pgio);</div><div class='ctx'> 	pgio.pg_error = 0;</div><div class='ctx'> 	nfs_pageio_complete(&amp;pgio);</div><div class='del'>-	if (err &lt; 0)</div><div class='del'>-		return err;</div><div class='del'>-	if (nfs_error_is_fatal(pgio.pg_error))</div><div class='del'>-		return pgio.pg_error;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int nfs_writepage(struct page *page, struct writeback_control *wbc)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ret = nfs_writepage_locked(page, wbc);</div><div class='del'>-	if (ret != AOP_WRITEPAGE_ACTIVATE)</div><div class='del'>-		unlock_page(page);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int nfs_writepages_callback(struct page *page, struct writeback_control *wbc, void *data)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	ret = nfs_do_writepage(page, wbc, data);</div><div class='del'>-	if (ret != AOP_WRITEPAGE_ACTIVATE)</div><div class='del'>-		unlock_page(page);</div><div class='del'>-	return ret;</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void nfs_io_completion_commit(void *inode)</div><div class='hunk'>@@ -715,13 +653,24 @@ int nfs_writepages(struct address_space *mapping, struct writeback_control *wbc)</div><div class='ctx'> 	struct nfs_pageio_descriptor pgio;</div><div class='ctx'> 	struct nfs_io_completion *ioc = NULL;</div><div class='ctx'> 	unsigned int mntflags = NFS_SERVER(inode)-&gt;flags;</div><div class='add'>+	struct nfs_server *nfss = NFS_SERVER(inode);</div><div class='ctx'> 	int priority = 0;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='add'>+	trace_nfs_writepages(inode, wbc-&gt;range_start, wbc-&gt;range_end - wbc-&gt;range_start);</div><div class='add'>+</div><div class='add'>+	/* Wait with writeback until write congestion eases */</div><div class='add'>+	if (wbc-&gt;sync_mode == WB_SYNC_NONE &amp;&amp; nfss-&gt;write_congested) {</div><div class='add'>+		err = wait_event_killable(nfss-&gt;write_congestion_wait,</div><div class='add'>+					  nfss-&gt;write_congested == 0);</div><div class='add'>+		if (err)</div><div class='add'>+			goto out_err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	nfs_inc_stats(inode, NFSIOS_VFSWRITEPAGES);</div><div class='ctx'> </div><div class='ctx'> 	if (!(mntflags &amp; NFS_MOUNT_WRITE_EAGER) || wbc-&gt;for_kupdate ||</div><div class='del'>-	    wbc-&gt;for_background || wbc-&gt;for_sync || wbc-&gt;for_reclaim) {</div><div class='add'>+	    wbc-&gt;for_background || wbc-&gt;for_sync) {</div><div class='ctx'> 		ioc = nfs_io_completion_alloc(GFP_KERNEL);</div><div class='ctx'> 		if (ioc)</div><div class='ctx'> 			nfs_io_completion_init(ioc, nfs_io_completion_commit,</div><div class='hunk'>@@ -729,48 +678,48 @@ int nfs_writepages(struct address_space *mapping, struct writeback_control *wbc)</div><div class='ctx'> 		priority = wb_priority(wbc);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	nfs_pageio_init_write(&amp;pgio, inode, priority, false,</div><div class='del'>-				&amp;nfs_async_write_completion_ops);</div><div class='del'>-	pgio.pg_io_completion = ioc;</div><div class='del'>-	err = write_cache_pages(mapping, wbc, nfs_writepages_callback, &amp;pgio);</div><div class='del'>-	pgio.pg_error = 0;</div><div class='del'>-	nfs_pageio_complete(&amp;pgio);</div><div class='add'>+	do {</div><div class='add'>+		struct folio *folio = NULL;</div><div class='add'>+</div><div class='add'>+		nfs_pageio_init_write(&amp;pgio, inode, priority, false,</div><div class='add'>+				      &amp;nfs_async_write_completion_ops);</div><div class='add'>+		pgio.pg_io_completion = ioc;</div><div class='add'>+		while ((folio = writeback_iter(mapping, wbc, folio, &amp;err))) {</div><div class='add'>+			err = nfs_do_writepage(folio, wbc, &amp;pgio);</div><div class='add'>+			folio_unlock(folio);</div><div class='add'>+		}</div><div class='add'>+		pgio.pg_error = 0;</div><div class='add'>+		nfs_pageio_complete(&amp;pgio);</div><div class='add'>+		if (err == -EAGAIN &amp;&amp; mntflags &amp; NFS_MOUNT_SOFTERR)</div><div class='add'>+			break;</div><div class='add'>+	} while (err &lt; 0 &amp;&amp; !nfs_error_is_fatal(err));</div><div class='ctx'> 	nfs_io_completion_put(ioc);</div><div class='ctx'> </div><div class='del'>-	if (err &lt; 0)</div><div class='del'>-		goto out_err;</div><div class='del'>-	err = pgio.pg_error;</div><div class='del'>-	if (nfs_error_is_fatal(err))</div><div class='del'>-		goto out_err;</div><div class='del'>-	return 0;</div><div class='add'>+	if (err &gt; 0)</div><div class='add'>+		err = 0;</div><div class='ctx'> out_err:</div><div class='add'>+	trace_nfs_writepages_done(inode, wbc-&gt;range_start, wbc-&gt;range_end - wbc-&gt;range_start, err);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Insert a write request into an inode</div><div class='ctx'>  */</div><div class='del'>-static void nfs_inode_add_request(struct inode *inode, struct nfs_page *req)</div><div class='add'>+static void nfs_inode_add_request(struct nfs_page *req)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *mapping = page_file_mapping(req-&gt;wb_page);</div><div class='del'>-	struct nfs_inode *nfsi = NFS_I(inode);</div><div class='add'>+	struct folio *folio = nfs_page_to_folio(req);</div><div class='add'>+	struct address_space *mapping = folio-&gt;mapping;</div><div class='add'>+	struct nfs_inode *nfsi = NFS_I(mapping-&gt;host);</div><div class='ctx'> </div><div class='ctx'> 	WARN_ON_ONCE(req-&gt;wb_this_page != req);</div><div class='ctx'> </div><div class='ctx'> 	/* Lock the request! */</div><div class='ctx'> 	nfs_lock_request(req);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Swap-space should not get truncated. Hence no need to plug the race</div><div class='del'>-	 * with invalidate/truncate.</div><div class='del'>-	 */</div><div class='del'>-	spin_lock(&amp;mapping-&gt;private_lock);</div><div class='del'>-	if (likely(!PageSwapCache(req-&gt;wb_page))) {</div><div class='del'>-		set_bit(PG_MAPPED, &amp;req-&gt;wb_flags);</div><div class='del'>-		SetPagePrivate(req-&gt;wb_page);</div><div class='del'>-		set_page_private(req-&gt;wb_page, (unsigned long)req);</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;mapping-&gt;private_lock);</div><div class='add'>+	spin_lock(&amp;mapping-&gt;i_private_lock);</div><div class='add'>+	set_bit(PG_MAPPED, &amp;req-&gt;wb_flags);</div><div class='add'>+	folio_set_private(folio);</div><div class='add'>+	folio-&gt;private = req;</div><div class='add'>+	spin_unlock(&amp;mapping-&gt;i_private_lock);</div><div class='ctx'> 	atomic_long_inc(&amp;nfsi-&gt;nrequests);</div><div class='ctx'> 	/* this a head request for a page group - mark it as having an</div><div class='ctx'> 	 * extra reference so sub groups can follow suit.</div><div class='hunk'>@@ -785,66 +734,36 @@ static void nfs_inode_add_request(struct inode *inode, struct nfs_page *req)</div><div class='ctx'>  */</div><div class='ctx'> static void nfs_inode_remove_request(struct nfs_page *req)</div><div class='ctx'> {</div><div class='del'>-	struct address_space *mapping = page_file_mapping(req-&gt;wb_page);</div><div class='del'>-	struct inode *inode = mapping-&gt;host;</div><div class='del'>-	struct nfs_inode *nfsi = NFS_I(inode);</div><div class='del'>-	struct nfs_page *head;</div><div class='add'>+	struct nfs_inode *nfsi = NFS_I(nfs_page_to_inode(req));</div><div class='ctx'> </div><div class='del'>-	if (nfs_page_group_sync_on_bit(req, PG_REMOVE)) {</div><div class='del'>-		head = req-&gt;wb_head;</div><div class='del'>-</div><div class='del'>-		spin_lock(&amp;mapping-&gt;private_lock);</div><div class='del'>-		if (likely(head-&gt;wb_page &amp;&amp; !PageSwapCache(head-&gt;wb_page))) {</div><div class='del'>-			set_page_private(head-&gt;wb_page, 0);</div><div class='del'>-			ClearPagePrivate(head-&gt;wb_page);</div><div class='del'>-			clear_bit(PG_MAPPED, &amp;head-&gt;wb_flags);</div><div class='add'>+	nfs_page_group_lock(req);</div><div class='add'>+	if (nfs_page_group_sync_on_bit_locked(req, PG_REMOVE)) {</div><div class='add'>+		struct folio *folio = nfs_page_to_folio(req-&gt;wb_head);</div><div class='add'>+		struct address_space *mapping = folio-&gt;mapping;</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;mapping-&gt;i_private_lock);</div><div class='add'>+		if (likely(folio)) {</div><div class='add'>+			folio-&gt;private = NULL;</div><div class='add'>+			folio_clear_private(folio);</div><div class='add'>+			clear_bit(PG_MAPPED, &amp;req-&gt;wb_head-&gt;wb_flags);</div><div class='ctx'> 		}</div><div class='del'>-		spin_unlock(&amp;mapping-&gt;private_lock);</div><div class='add'>+		spin_unlock(&amp;mapping-&gt;i_private_lock);</div><div class='add'>+</div><div class='add'>+		folio_end_dropbehind(folio);</div><div class='ctx'> 	}</div><div class='add'>+	nfs_page_group_unlock(req);</div><div class='ctx'> </div><div class='ctx'> 	if (test_and_clear_bit(PG_INODE_REF, &amp;req-&gt;wb_flags)) {</div><div class='del'>-		nfs_release_request(req);</div><div class='ctx'> 		atomic_long_dec(&amp;nfsi-&gt;nrequests);</div><div class='add'>+		nfs_release_request(req);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void</div><div class='del'>-nfs_mark_request_dirty(struct nfs_page *req)</div><div class='del'>-{</div><div class='del'>-	if (req-&gt;wb_page)</div><div class='del'>-		__set_page_dirty_nobuffers(req-&gt;wb_page);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * nfs_page_search_commits_for_head_request_locked</div><div class='del'>- *</div><div class='del'>- * Search through commit lists on @inode for the head request for @page.</div><div class='del'>- * Must be called while holding the inode (which is cinfo) lock.</div><div class='del'>- *</div><div class='del'>- * Returns the head request if found, or NULL if not found.</div><div class='del'>- */</div><div class='del'>-static struct nfs_page *</div><div class='del'>-nfs_page_search_commits_for_head_request_locked(struct nfs_inode *nfsi,</div><div class='del'>-						struct page *page)</div><div class='add'>+static void nfs_mark_request_dirty(struct nfs_page *req)</div><div class='ctx'> {</div><div class='del'>-	struct nfs_page *freq, *t;</div><div class='del'>-	struct nfs_commit_info cinfo;</div><div class='del'>-	struct inode *inode = &amp;nfsi-&gt;vfs_inode;</div><div class='del'>-</div><div class='del'>-	nfs_init_cinfo_from_inode(&amp;cinfo, inode);</div><div class='del'>-</div><div class='del'>-	/* search through pnfs commit lists */</div><div class='del'>-	freq = pnfs_search_commit_reqs(inode, &amp;cinfo, page);</div><div class='del'>-	if (freq)</div><div class='del'>-		return freq-&gt;wb_head;</div><div class='del'>-</div><div class='del'>-	/* Linearly search the commit list for the correct request */</div><div class='del'>-	list_for_each_entry_safe(freq, t, &amp;cinfo.mds-&gt;list, wb_list) {</div><div class='del'>-		if (freq-&gt;wb_page == page)</div><div class='del'>-			return freq-&gt;wb_head;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return NULL;</div><div class='add'>+	struct folio *folio = nfs_page_to_folio(req);</div><div class='add'>+	if (folio)</div><div class='add'>+		filemap_dirty_folio(folio_mapping(folio), folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='hunk'>@@ -888,8 +807,7 @@ nfs_request_add_commit_list(struct nfs_page *req, struct nfs_commit_info *cinfo)</div><div class='ctx'> 	mutex_lock(&amp;NFS_I(cinfo-&gt;inode)-&gt;commit_mutex);</div><div class='ctx'> 	nfs_request_add_commit_list_locked(req, &amp;cinfo-&gt;mds-&gt;list, cinfo);</div><div class='ctx'> 	mutex_unlock(&amp;NFS_I(cinfo-&gt;inode)-&gt;commit_mutex);</div><div class='del'>-	if (req-&gt;wb_page)</div><div class='del'>-		nfs_mark_page_unstable(req-&gt;wb_page, cinfo);</div><div class='add'>+	nfs_folio_mark_unstable(nfs_page_to_folio(req), cinfo);</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_request_add_commit_list);</div><div class='ctx'> </div><div class='hunk'>@@ -948,30 +866,31 @@ nfs_mark_request_commit(struct nfs_page *req, struct pnfs_layout_segment *lseg,</div><div class='ctx'> 	nfs_request_add_commit_list(req, cinfo);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void</div><div class='del'>-nfs_clear_page_commit(struct page *page)</div><div class='add'>+static void nfs_folio_clear_commit(struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	dec_node_page_state(page, NR_WRITEBACK);</div><div class='del'>-	dec_wb_stat(&amp;inode_to_bdi(page_file_mapping(page)-&gt;host)-&gt;wb,</div><div class='del'>-		    WB_WRITEBACK);</div><div class='add'>+	if (folio) {</div><div class='add'>+		long nr = folio_nr_pages(folio);</div><div class='add'>+</div><div class='add'>+		node_stat_mod_folio(folio, NR_WRITEBACK, -nr);</div><div class='add'>+		wb_stat_mod(&amp;inode_to_bdi(folio-&gt;mapping-&gt;host)-&gt;wb,</div><div class='add'>+			    WB_WRITEBACK, -nr);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Called holding the request lock on @req */</div><div class='del'>-static void</div><div class='del'>-nfs_clear_request_commit(struct nfs_page *req)</div><div class='add'>+static void nfs_clear_request_commit(struct nfs_commit_info *cinfo,</div><div class='add'>+				     struct nfs_page *req)</div><div class='ctx'> {</div><div class='ctx'> 	if (test_bit(PG_CLEAN, &amp;req-&gt;wb_flags)) {</div><div class='ctx'> 		struct nfs_open_context *ctx = nfs_req_openctx(req);</div><div class='ctx'> 		struct inode *inode = d_inode(ctx-&gt;dentry);</div><div class='del'>-		struct nfs_commit_info cinfo;</div><div class='ctx'> </div><div class='del'>-		nfs_init_cinfo_from_inode(&amp;cinfo, inode);</div><div class='ctx'> 		mutex_lock(&amp;NFS_I(inode)-&gt;commit_mutex);</div><div class='del'>-		if (!pnfs_clear_request_commit(req, &amp;cinfo)) {</div><div class='del'>-			nfs_request_remove_commit_list(req, &amp;cinfo);</div><div class='add'>+		if (!pnfs_clear_request_commit(req, cinfo)) {</div><div class='add'>+			nfs_request_remove_commit_list(req, cinfo);</div><div class='ctx'> 		}</div><div class='ctx'> 		mutex_unlock(&amp;NFS_I(inode)-&gt;commit_mutex);</div><div class='del'>-		nfs_clear_page_commit(req-&gt;wb_page);</div><div class='add'>+		nfs_folio_clear_commit(nfs_page_to_folio(req));</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1002,8 +921,9 @@ static void nfs_write_completion(struct nfs_pgio_header *hdr)</div><div class='ctx'> 		nfs_list_remove_request(req);</div><div class='ctx'> 		if (test_bit(NFS_IOHDR_ERROR, &amp;hdr-&gt;flags) &amp;&amp;</div><div class='ctx'> 		    (hdr-&gt;good_bytes &lt; bytes)) {</div><div class='del'>-			trace_nfs_comp_error(req, hdr-&gt;error);</div><div class='del'>-			nfs_mapping_set_error(req-&gt;wb_page, hdr-&gt;error);</div><div class='add'>+			trace_nfs_comp_error(hdr-&gt;inode, req, hdr-&gt;error);</div><div class='add'>+			nfs_mapping_set_error(nfs_page_to_folio(req),</div><div class='add'>+					      hdr-&gt;error);</div><div class='ctx'> 			goto remove_req;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (nfs_write_need_commit(hdr)) {</div><div class='hunk'>@@ -1011,13 +931,13 @@ static void nfs_write_completion(struct nfs_pgio_header *hdr)</div><div class='ctx'> 			req-&gt;wb_nio = 0;</div><div class='ctx'> 			memcpy(&amp;req-&gt;wb_verf, &amp;hdr-&gt;verf.verifier, sizeof(req-&gt;wb_verf));</div><div class='ctx'> 			nfs_mark_request_commit(req, hdr-&gt;lseg, &amp;cinfo,</div><div class='del'>-				hdr-&gt;pgio_mirror_idx);</div><div class='add'>+				hdr-&gt;ds_commit_idx);</div><div class='ctx'> 			goto next;</div><div class='ctx'> 		}</div><div class='ctx'> remove_req:</div><div class='ctx'> 		nfs_inode_remove_request(req);</div><div class='ctx'> next:</div><div class='del'>-		nfs_end_page_writeback(req);</div><div class='add'>+		nfs_page_end_writeback(req);</div><div class='ctx'> 		nfs_release_request(req);</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='hunk'>@@ -1093,21 +1013,21 @@ nfs_scan_commit(struct inode *inode, struct list_head *dst,</div><div class='ctx'>  * If the attempt fails, then the existing request is flushed out</div><div class='ctx'>  * to disk.</div><div class='ctx'>  */</div><div class='del'>-static struct nfs_page *nfs_try_to_update_request(struct inode *inode,</div><div class='del'>-		struct page *page,</div><div class='del'>-		unsigned int offset,</div><div class='del'>-		unsigned int bytes)</div><div class='add'>+static struct nfs_page *nfs_try_to_update_request(struct folio *folio,</div><div class='add'>+						  unsigned int offset,</div><div class='add'>+						  unsigned int bytes)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_page *req;</div><div class='ctx'> 	unsigned int rqend;</div><div class='ctx'> 	unsigned int end;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='add'>+	trace_nfs_try_to_update_request(folio_inode(folio), offset, bytes);</div><div class='ctx'> 	end = offset + bytes;</div><div class='ctx'> </div><div class='del'>-	req = nfs_lock_and_join_requests(page);</div><div class='add'>+	req = nfs_lock_and_join_requests(folio);</div><div class='ctx'> 	if (IS_ERR_OR_NULL(req))</div><div class='del'>-		return req;</div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='ctx'> 	rqend = req-&gt;wb_offset + req-&gt;wb_bytes;</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1129,6 +1049,9 @@ static struct nfs_page *nfs_try_to_update_request(struct inode *inode,</div><div class='ctx'> 	else</div><div class='ctx'> 		req-&gt;wb_bytes = rqend - req-&gt;wb_offset;</div><div class='ctx'> 	req-&gt;wb_nio = 0;</div><div class='add'>+out:</div><div class='add'>+	trace_nfs_try_to_update_request_done(folio_inode(folio), offset, bytes,</div><div class='add'>+					     PTR_ERR_OR_ZERO(req));</div><div class='ctx'> 	return req;</div><div class='ctx'> out_flushme:</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1138,7 +1061,8 @@ out_flushme:</div><div class='ctx'> 	 */</div><div class='ctx'> 	nfs_mark_request_dirty(req);</div><div class='ctx'> 	nfs_unlock_and_release_request(req);</div><div class='del'>-	error = nfs_wb_page(inode, page);</div><div class='add'>+	error = nfs_wb_folio(folio-&gt;mapping-&gt;host, folio);</div><div class='add'>+	trace_nfs_try_to_update_request_done(folio_inode(folio), offset, bytes, error);</div><div class='ctx'> 	return (error &lt; 0) ? ERR_PTR(error) : NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1149,44 +1073,47 @@ out_flushme:</div><div class='ctx'>  * if we have to add a new request. Also assumes that the caller has</div><div class='ctx'>  * already called nfs_flush_incompatible() if necessary.</div><div class='ctx'>  */</div><div class='del'>-static struct nfs_page * nfs_setup_write_request(struct nfs_open_context* ctx,</div><div class='del'>-		struct page *page, unsigned int offset, unsigned int bytes)</div><div class='add'>+static struct nfs_page *nfs_setup_write_request(struct nfs_open_context *ctx,</div><div class='add'>+						struct folio *folio,</div><div class='add'>+						unsigned int offset,</div><div class='add'>+						unsigned int bytes)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = page_file_mapping(page)-&gt;host;</div><div class='del'>-	struct nfs_page	*req;</div><div class='add'>+	struct nfs_page *req;</div><div class='ctx'> </div><div class='del'>-	req = nfs_try_to_update_request(inode, page, offset, bytes);</div><div class='add'>+	req = nfs_try_to_update_request(folio, offset, bytes);</div><div class='ctx'> 	if (req != NULL)</div><div class='ctx'> 		goto out;</div><div class='del'>-	req = nfs_create_request(ctx, page, offset, bytes);</div><div class='add'>+	req = nfs_page_create_from_folio(ctx, folio, offset, bytes);</div><div class='ctx'> 	if (IS_ERR(req))</div><div class='ctx'> 		goto out;</div><div class='del'>-	nfs_inode_add_request(inode, req);</div><div class='add'>+	nfs_inode_add_request(req);</div><div class='ctx'> out:</div><div class='ctx'> 	return req;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int nfs_writepage_setup(struct nfs_open_context *ctx, struct page *page,</div><div class='del'>-		unsigned int offset, unsigned int count)</div><div class='add'>+static int nfs_writepage_setup(struct nfs_open_context *ctx,</div><div class='add'>+			       struct folio *folio, unsigned int offset,</div><div class='add'>+			       unsigned int count)</div><div class='ctx'> {</div><div class='del'>-	struct nfs_page	*req;</div><div class='add'>+	struct nfs_page *req;</div><div class='ctx'> </div><div class='del'>-	req = nfs_setup_write_request(ctx, page, offset, count);</div><div class='add'>+	req = nfs_setup_write_request(ctx, folio, offset, count);</div><div class='ctx'> 	if (IS_ERR(req))</div><div class='ctx'> 		return PTR_ERR(req);</div><div class='add'>+	trace_nfs_writepage_setup(req);</div><div class='ctx'> 	/* Update file length */</div><div class='del'>-	nfs_grow_file(page, offset, count);</div><div class='add'>+	nfs_grow_file(folio, offset, count);</div><div class='ctx'> 	nfs_mark_uptodate(req);</div><div class='ctx'> 	nfs_mark_request_dirty(req);</div><div class='ctx'> 	nfs_unlock_and_release_request(req);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int nfs_flush_incompatible(struct file *file, struct page *page)</div><div class='add'>+int nfs_flush_incompatible(struct file *file, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_open_context *ctx = nfs_file_open_context(file);</div><div class='ctx'> 	struct nfs_lock_context *l_ctx;</div><div class='del'>-	struct file_lock_context *flctx = file_inode(file)-&gt;i_flctx;</div><div class='add'>+	struct file_lock_context *flctx = locks_inode_context(file_inode(file));</div><div class='ctx'> 	struct nfs_page	*req;</div><div class='ctx'> 	int do_flush, status;</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -1198,12 +1125,12 @@ int nfs_flush_incompatible(struct file *file, struct page *page)</div><div class='ctx'> 	 * dropped page.</div><div class='ctx'> 	 */</div><div class='ctx'> 	do {</div><div class='del'>-		req = nfs_page_find_head_request(page);</div><div class='add'>+		req = nfs_folio_find_head_request(folio);</div><div class='ctx'> 		if (req == NULL)</div><div class='ctx'> 			return 0;</div><div class='ctx'> 		l_ctx = req-&gt;wb_lock_context;</div><div class='del'>-		do_flush = req-&gt;wb_page != page ||</div><div class='del'>-			!nfs_match_open_context(nfs_req_openctx(req), ctx);</div><div class='add'>+		do_flush = nfs_page_to_folio(req) != folio ||</div><div class='add'>+			   !nfs_match_open_context(nfs_req_openctx(req), ctx);</div><div class='ctx'> 		if (l_ctx &amp;&amp; flctx &amp;&amp;</div><div class='ctx'> 		    !(list_empty_careful(&amp;flctx-&gt;flc_posix) &amp;&amp;</div><div class='ctx'> 		      list_empty_careful(&amp;flctx-&gt;flc_flock))) {</div><div class='hunk'>@@ -1212,7 +1139,7 @@ int nfs_flush_incompatible(struct file *file, struct page *page)</div><div class='ctx'> 		nfs_release_request(req);</div><div class='ctx'> 		if (!do_flush)</div><div class='ctx'> 			return 0;</div><div class='del'>-		status = nfs_wb_page(page_file_mapping(page)-&gt;host, page);</div><div class='add'>+		status = nfs_wb_folio(folio-&gt;mapping-&gt;host, folio);</div><div class='ctx'> 	} while (status == 0);</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='hunk'>@@ -1284,9 +1211,9 @@ out:</div><div class='ctx'>  * the PageUptodate() flag. In this case, we will need to turn off</div><div class='ctx'>  * write optimisations that depend on the page contents being correct.</div><div class='ctx'>  */</div><div class='del'>-static bool nfs_write_pageuptodate(struct page *page, struct inode *inode,</div><div class='del'>-				   unsigned int pagelen)</div><div class='add'>+static bool nfs_folio_write_uptodate(struct folio *folio, unsigned int pagelen)</div><div class='ctx'> {</div><div class='add'>+	struct inode *inode = folio-&gt;mapping-&gt;host;</div><div class='ctx'> 	struct nfs_inode *nfsi = NFS_I(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (nfs_have_delegated_attributes(inode))</div><div class='hunk'>@@ -1300,14 +1227,14 @@ static bool nfs_write_pageuptodate(struct page *page, struct inode *inode,</div><div class='ctx'> out:</div><div class='ctx'> 	if (nfsi-&gt;cache_validity &amp; NFS_INO_INVALID_DATA &amp;&amp; pagelen != 0)</div><div class='ctx'> 		return false;</div><div class='del'>-	return PageUptodate(page) != 0;</div><div class='add'>+	return folio_test_uptodate(folio) != 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool</div><div class='ctx'> is_whole_file_wrlock(struct file_lock *fl)</div><div class='ctx'> {</div><div class='ctx'> 	return fl-&gt;fl_start == 0 &amp;&amp; fl-&gt;fl_end == OFFSET_MAX &amp;&amp;</div><div class='del'>-			fl-&gt;fl_type == F_WRLCK;</div><div class='add'>+			lock_is_write(fl);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* If we know the page is up to date, and we're not using byte range locks (or</div><div class='hunk'>@@ -1318,18 +1245,22 @@ is_whole_file_wrlock(struct file_lock *fl)</div><div class='ctx'>  * If the file is opened for synchronous writes then we can just skip the rest</div><div class='ctx'>  * of the checks.</div><div class='ctx'>  */</div><div class='del'>-static int nfs_can_extend_write(struct file *file, struct page *page,</div><div class='del'>-				struct inode *inode, unsigned int pagelen)</div><div class='add'>+static int nfs_can_extend_write(struct file *file, struct folio *folio,</div><div class='add'>+				unsigned int pagelen)</div><div class='ctx'> {</div><div class='del'>-	int ret;</div><div class='del'>-	struct file_lock_context *flctx = inode-&gt;i_flctx;</div><div class='add'>+	struct inode *inode = file_inode(file);</div><div class='add'>+	struct file_lock_context *flctx = locks_inode_context(inode);</div><div class='ctx'> 	struct file_lock *fl;</div><div class='add'>+	int ret;</div><div class='add'>+	unsigned int mntflags = NFS_SERVER(inode)-&gt;flags;</div><div class='ctx'> </div><div class='add'>+	if (mntflags &amp; NFS_MOUNT_NO_ALIGNWRITE)</div><div class='add'>+		return 0;</div><div class='ctx'> 	if (file-&gt;f_flags &amp; O_DSYNC)</div><div class='ctx'> 		return 0;</div><div class='del'>-	if (!nfs_write_pageuptodate(page, inode, pagelen))</div><div class='add'>+	if (!nfs_folio_write_uptodate(folio, pagelen))</div><div class='ctx'> 		return 0;</div><div class='del'>-	if (NFS_PROTO(inode)-&gt;have_delegation(inode, FMODE_WRITE))</div><div class='add'>+	if (nfs_have_write_delegation(inode))</div><div class='ctx'> 		return 1;</div><div class='ctx'> 	if (!flctx || (list_empty_careful(&amp;flctx-&gt;flc_flock) &amp;&amp;</div><div class='ctx'> 		       list_empty_careful(&amp;flctx-&gt;flc_posix)))</div><div class='hunk'>@@ -1340,13 +1271,13 @@ static int nfs_can_extend_write(struct file *file, struct page *page,</div><div class='ctx'> 	spin_lock(&amp;flctx-&gt;flc_lock);</div><div class='ctx'> 	if (!list_empty(&amp;flctx-&gt;flc_posix)) {</div><div class='ctx'> 		fl = list_first_entry(&amp;flctx-&gt;flc_posix, struct file_lock,</div><div class='del'>-					fl_list);</div><div class='add'>+					c.flc_list);</div><div class='ctx'> 		if (is_whole_file_wrlock(fl))</div><div class='ctx'> 			ret = 1;</div><div class='ctx'> 	} else if (!list_empty(&amp;flctx-&gt;flc_flock)) {</div><div class='ctx'> 		fl = list_first_entry(&amp;flctx-&gt;flc_flock, struct file_lock,</div><div class='del'>-					fl_list);</div><div class='del'>-		if (fl-&gt;fl_type == F_WRLCK)</div><div class='add'>+					c.flc_list);</div><div class='add'>+		if (lock_is_write(fl))</div><div class='ctx'> 			ret = 1;</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;flctx-&gt;flc_lock);</div><div class='hunk'>@@ -1359,33 +1290,40 @@ static int nfs_can_extend_write(struct file *file, struct page *page,</div><div class='ctx'>  * XXX: Keep an eye on generic_file_read to make sure it doesn't do bad</div><div class='ctx'>  * things with a page scheduled for an RPC call (e.g. invalidate it).</div><div class='ctx'>  */</div><div class='del'>-int nfs_updatepage(struct file *file, struct page *page,</div><div class='del'>-		unsigned int offset, unsigned int count)</div><div class='add'>+int nfs_update_folio(struct file *file, struct folio *folio,</div><div class='add'>+		     unsigned int offset, unsigned int count)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_open_context *ctx = nfs_file_open_context(file);</div><div class='del'>-	struct address_space *mapping = page_file_mapping(page);</div><div class='del'>-	struct inode	*inode = mapping-&gt;host;</div><div class='del'>-	unsigned int	pagelen = nfs_page_length(page);</div><div class='add'>+	struct address_space *mapping = folio-&gt;mapping;</div><div class='add'>+	struct inode *inode = mapping-&gt;host;</div><div class='add'>+	unsigned int pagelen = nfs_folio_length(folio);</div><div class='ctx'> 	int		status = 0;</div><div class='ctx'> </div><div class='ctx'> 	nfs_inc_stats(inode, NFSIOS_VFSUPDATEPAGE);</div><div class='ctx'> </div><div class='del'>-	dprintk("NFS:       nfs_updatepage(%pD2 %d@%lld)\n",</div><div class='del'>-		file, count, (long long)(page_file_offset(page) + offset));</div><div class='add'>+	trace_nfs_update_folio(inode, offset, count);</div><div class='add'>+</div><div class='add'>+	dprintk("NFS:       nfs_update_folio(%pD2 %d@%lld)\n", file, count,</div><div class='add'>+		(long long)(folio_pos(folio) + offset));</div><div class='ctx'> </div><div class='ctx'> 	if (!count)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	if (nfs_can_extend_write(file, page, inode, pagelen)) {</div><div class='del'>-		count = max(count + offset, pagelen);</div><div class='del'>-		offset = 0;</div><div class='add'>+	if (nfs_can_extend_write(file, folio, pagelen)) {</div><div class='add'>+		unsigned int end = count + offset;</div><div class='add'>+</div><div class='add'>+		offset = round_down(offset, PAGE_SIZE);</div><div class='add'>+		if (end &lt; pagelen)</div><div class='add'>+			end = min(round_up(end, PAGE_SIZE), pagelen);</div><div class='add'>+		count = end - offset;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	status = nfs_writepage_setup(ctx, page, offset, count);</div><div class='add'>+	status = nfs_writepage_setup(ctx, folio, offset, count);</div><div class='ctx'> 	if (status &lt; 0)</div><div class='ctx'> 		nfs_set_pageerror(mapping);</div><div class='ctx'> out:</div><div class='del'>-	dprintk("NFS:       nfs_updatepage returns %d (isize %lld)\n",</div><div class='add'>+	trace_nfs_update_folio_done(inode, offset, count, status);</div><div class='add'>+	dprintk("NFS:       nfs_update_folio returns %d (isize %lld)\n",</div><div class='ctx'> 			status, (long long)i_size_read(inode));</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='hunk'>@@ -1408,6 +1346,8 @@ static void nfs_initiate_write(struct nfs_pgio_header *hdr,</div><div class='ctx'> {</div><div class='ctx'> 	int priority = flush_task_priority(how);</div><div class='ctx'> </div><div class='add'>+	if (IS_SWAPFILE(hdr-&gt;inode))</div><div class='add'>+		task_setup_data-&gt;flags |= RPC_TASK_SWAPPER;</div><div class='ctx'> 	task_setup_data-&gt;priority = priority;</div><div class='ctx'> 	rpc_ops-&gt;write_setup(hdr, msg, &amp;task_setup_data-&gt;rpc_client);</div><div class='ctx'> 	trace_nfs_initiate_write(hdr);</div><div class='hunk'>@@ -1419,11 +1359,13 @@ static void nfs_initiate_write(struct nfs_pgio_header *hdr,</div><div class='ctx'>  */</div><div class='ctx'> static void nfs_redirty_request(struct nfs_page *req)</div><div class='ctx'> {</div><div class='add'>+	struct nfs_inode *nfsi = NFS_I(nfs_page_to_inode(req));</div><div class='add'>+</div><div class='ctx'> 	/* Bump the transmission count */</div><div class='ctx'> 	req-&gt;wb_nio++;</div><div class='ctx'> 	nfs_mark_request_dirty(req);</div><div class='del'>-	set_bit(NFS_CONTEXT_RESEND_WRITES, &amp;nfs_req_openctx(req)-&gt;flags);</div><div class='del'>-	nfs_end_page_writeback(req);</div><div class='add'>+	atomic_long_inc(&amp;nfsi-&gt;redirtied_pages);</div><div class='add'>+	nfs_page_end_writeback(req);</div><div class='ctx'> 	nfs_release_request(req);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1434,7 +1376,7 @@ static void nfs_async_write_error(struct list_head *head, int error)</div><div class='ctx'> 	while (!list_empty(head)) {</div><div class='ctx'> 		req = nfs_list_entry(head-&gt;next);</div><div class='ctx'> 		nfs_list_remove_request(req);</div><div class='del'>-		if (nfs_error_is_fatal(error))</div><div class='add'>+		if (nfs_error_is_fatal_on_server(error))</div><div class='ctx'> 			nfs_write_error(req, error);</div><div class='ctx'> 		else</div><div class='ctx'> 			nfs_redirty_request(req);</div><div class='hunk'>@@ -1444,8 +1386,6 @@ static void nfs_async_write_error(struct list_head *head, int error)</div><div class='ctx'> static void nfs_async_write_reschedule_io(struct nfs_pgio_header *hdr)</div><div class='ctx'> {</div><div class='ctx'> 	nfs_async_write_error(&amp;hdr-&gt;pages, 0);</div><div class='del'>-	filemap_fdatawrite_range(hdr-&gt;inode-&gt;i_mapping, hdr-&gt;args.offset,</div><div class='del'>-			hdr-&gt;args.offset + hdr-&gt;args.count - 1);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct nfs_pgio_completion_ops nfs_async_write_completion_ops = {</div><div class='hunk'>@@ -1495,31 +1435,6 @@ void nfs_commit_prepare(struct rpc_task *task, void *calldata)</div><div class='ctx'> 	NFS_PROTO(data-&gt;inode)-&gt;commit_rpc_prepare(task, data);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Special version of should_remove_suid() that ignores capabilities.</div><div class='del'>- */</div><div class='del'>-static int nfs_should_remove_suid(const struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	umode_t mode = inode-&gt;i_mode;</div><div class='del'>-	int kill = 0;</div><div class='del'>-</div><div class='del'>-	/* suid always must be killed */</div><div class='del'>-	if (unlikely(mode &amp; S_ISUID))</div><div class='del'>-		kill = ATTR_KILL_SUID;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * sgid without any exec bits is just a mandatory locking mark; leave</div><div class='del'>-	 * it alone.  If some exec bits are set, it's a real sgid; kill it.</div><div class='del'>-	 */</div><div class='del'>-	if (unlikely((mode &amp; S_ISGID) &amp;&amp; (mode &amp; S_IXGRP)))</div><div class='del'>-		kill |= ATTR_KILL_SGID;</div><div class='del'>-</div><div class='del'>-	if (unlikely(kill &amp;&amp; S_ISREG(mode)))</div><div class='del'>-		return kill;</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static void nfs_writeback_check_extend(struct nfs_pgio_header *hdr,</div><div class='ctx'> 		struct nfs_fattr *fattr)</div><div class='ctx'> {</div><div class='hunk'>@@ -1546,6 +1461,13 @@ void nfs_writeback_update_inode(struct nfs_pgio_header *hdr)</div><div class='ctx'> 	struct nfs_fattr *fattr = &amp;hdr-&gt;fattr;</div><div class='ctx'> 	struct inode *inode = hdr-&gt;inode;</div><div class='ctx'> </div><div class='add'>+	if (nfs_have_delegated_mtime(inode)) {</div><div class='add'>+		spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+		nfs_set_cache_invalid(inode, NFS_INO_INVALID_BLOCKS);</div><div class='add'>+		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	nfs_writeback_check_extend(hdr, fattr);</div><div class='ctx'> 	nfs_post_op_update_inode_force_wcc_locked(inode, fattr);</div><div class='hunk'>@@ -1576,32 +1498,45 @@ static int nfs_writeback_done(struct rpc_task *task,</div><div class='ctx'> 	nfs_add_stats(inode, NFSIOS_SERVERWRITTENBYTES, hdr-&gt;res.count);</div><div class='ctx'> 	trace_nfs_writeback_done(task, hdr);</div><div class='ctx'> </div><div class='del'>-	if (hdr-&gt;res.verf-&gt;committed &lt; hdr-&gt;args.stable &amp;&amp;</div><div class='del'>-	    task-&gt;tk_status &gt;= 0) {</div><div class='del'>-		/* We tried a write call, but the server did not</div><div class='del'>-		 * commit data to stable storage even though we</div><div class='del'>-		 * requested it.</div><div class='del'>-		 * Note: There is a known bug in Tru64 &lt; 5.0 in which</div><div class='del'>-		 *	 the server reports NFS_DATA_SYNC, but performs</div><div class='del'>-		 *	 NFS_FILE_SYNC. We therefore implement this checking</div><div class='del'>-		 *	 as a dprintk() in order to avoid filling syslog.</div><div class='del'>-		 */</div><div class='del'>-		static unsigned long    complain;</div><div class='add'>+	if (task-&gt;tk_status &gt;= 0) {</div><div class='add'>+		enum nfs3_stable_how committed = hdr-&gt;res.verf-&gt;committed;</div><div class='ctx'> </div><div class='del'>-		/* Note this will print the MDS for a DS write */</div><div class='del'>-		if (time_before(complain, jiffies)) {</div><div class='del'>-			dprintk("NFS:       faulty NFS server %s:"</div><div class='del'>-				" (committed = %d) != (stable = %d)\n",</div><div class='del'>-				NFS_SERVER(inode)-&gt;nfs_client-&gt;cl_hostname,</div><div class='del'>-				hdr-&gt;res.verf-&gt;committed, hdr-&gt;args.stable);</div><div class='del'>-			complain = jiffies + 300 * HZ;</div><div class='add'>+		if (committed == NFS_UNSTABLE) {</div><div class='add'>+			/*</div><div class='add'>+			 * We have some uncommitted data on the server at</div><div class='add'>+			 * this point, so ensure that we keep track of that</div><div class='add'>+			 * fact irrespective of what later writes do.</div><div class='add'>+			 */</div><div class='add'>+			set_bit(NFS_IOHDR_UNSTABLE_WRITES, &amp;hdr-&gt;flags);</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (committed &lt; hdr-&gt;args.stable) {</div><div class='add'>+			/* We tried a write call, but the server did not</div><div class='add'>+			 * commit data to stable storage even though we</div><div class='add'>+			 * requested it.</div><div class='add'>+			 * Note: There is a known bug in Tru64 &lt; 5.0 in which</div><div class='add'>+			 *	 the server reports NFS_DATA_SYNC, but performs</div><div class='add'>+			 *	 NFS_FILE_SYNC. We therefore implement this checking</div><div class='add'>+			 *	 as a dprintk() in order to avoid filling syslog.</div><div class='add'>+			 */</div><div class='add'>+			static unsigned long    complain;</div><div class='add'>+</div><div class='add'>+			/* Note this will print the MDS for a DS write */</div><div class='add'>+			if (time_before(complain, jiffies)) {</div><div class='add'>+				dprintk("NFS:       faulty NFS server %s:"</div><div class='add'>+					" (committed = %d) != (stable = %d)\n",</div><div class='add'>+					NFS_SERVER(inode)-&gt;nfs_client-&gt;cl_hostname,</div><div class='add'>+					committed, hdr-&gt;args.stable);</div><div class='add'>+				complain = jiffies + 300 * HZ;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Deal with the suid/sgid bit corner case */</div><div class='ctx'> 	if (nfs_should_remove_suid(inode)) {</div><div class='ctx'> 		spin_lock(&amp;inode-&gt;i_lock);</div><div class='del'>-		nfs_set_cache_invalid(inode, NFS_INO_INVALID_MODE);</div><div class='add'>+		nfs_set_cache_invalid(inode, NFS_INO_INVALID_MODE</div><div class='add'>+				| NFS_INO_REVAL_FORCED);</div><div class='ctx'> 		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -1666,7 +1601,7 @@ static int wait_on_commit(struct nfs_mds_commit_info *cinfo)</div><div class='ctx'> 				       !atomic_read(&amp;cinfo-&gt;rpcs_out));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void nfs_commit_begin(struct nfs_mds_commit_info *cinfo)</div><div class='add'>+void nfs_commit_begin(struct nfs_mds_commit_info *cinfo)</div><div class='ctx'> {</div><div class='ctx'> 	atomic_inc(&amp;cinfo-&gt;rpcs_out);</div><div class='ctx'> }</div><div class='hunk'>@@ -1690,7 +1625,8 @@ EXPORT_SYMBOL_GPL(nfs_commitdata_release);</div><div class='ctx'> int nfs_initiate_commit(struct rpc_clnt *clnt, struct nfs_commit_data *data,</div><div class='ctx'> 			const struct nfs_rpc_ops *nfs_ops,</div><div class='ctx'> 			const struct rpc_call_ops *call_ops,</div><div class='del'>-			int how, int flags)</div><div class='add'>+			int how, int flags,</div><div class='add'>+			struct nfsd_file *localio)</div><div class='ctx'> {</div><div class='ctx'> 	struct rpc_task *task;</div><div class='ctx'> 	int priority = flush_task_priority(how);</div><div class='hunk'>@@ -1709,12 +1645,19 @@ int nfs_initiate_commit(struct rpc_clnt *clnt, struct nfs_commit_data *data,</div><div class='ctx'> 		.flags = RPC_TASK_ASYNC | flags,</div><div class='ctx'> 		.priority = priority,</div><div class='ctx'> 	};</div><div class='add'>+</div><div class='add'>+	if (nfs_server_capable(data-&gt;inode, NFS_CAP_MOVEABLE))</div><div class='add'>+		task_setup_data.flags |= RPC_TASK_MOVEABLE;</div><div class='add'>+</div><div class='ctx'> 	/* Set up the initial task struct.  */</div><div class='ctx'> 	nfs_ops-&gt;commit_setup(data, &amp;msg, &amp;task_setup_data.rpc_client);</div><div class='ctx'> 	trace_nfs_initiate_commit(data);</div><div class='ctx'> </div><div class='ctx'> 	dprintk("NFS: initiated commit call\n");</div><div class='ctx'> </div><div class='add'>+	if (localio)</div><div class='add'>+		return nfs_local_commit(localio, data, call_ops, how);</div><div class='add'>+</div><div class='ctx'> 	task = rpc_run_task(&amp;task_setup_data);</div><div class='ctx'> 	if (IS_ERR(task))</div><div class='ctx'> 		return PTR_ERR(task);</div><div class='hunk'>@@ -1792,18 +1735,18 @@ void nfs_retry_commit(struct list_head *page_list,</div><div class='ctx'> 		req = nfs_list_entry(page_list-&gt;next);</div><div class='ctx'> 		nfs_list_remove_request(req);</div><div class='ctx'> 		nfs_mark_request_commit(req, lseg, cinfo, ds_commit_idx);</div><div class='del'>-		if (!cinfo-&gt;dreq)</div><div class='del'>-			nfs_clear_page_commit(req-&gt;wb_page);</div><div class='add'>+		nfs_folio_clear_commit(nfs_page_to_folio(req));</div><div class='ctx'> 		nfs_unlock_and_release_request(req);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_retry_commit);</div><div class='ctx'> </div><div class='del'>-static void</div><div class='del'>-nfs_commit_resched_write(struct nfs_commit_info *cinfo,</div><div class='del'>-		struct nfs_page *req)</div><div class='add'>+static void nfs_commit_resched_write(struct nfs_commit_info *cinfo,</div><div class='add'>+				     struct nfs_page *req)</div><div class='ctx'> {</div><div class='del'>-	__set_page_dirty_nobuffers(req-&gt;wb_page);</div><div class='add'>+	struct folio *folio = nfs_page_to_folio(req);</div><div class='add'>+</div><div class='add'>+	filemap_dirty_folio(folio_mapping(folio), folio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1814,21 +1757,30 @@ nfs_commit_list(struct inode *inode, struct list_head *head, int how,</div><div class='ctx'> 		struct nfs_commit_info *cinfo)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_commit_data	*data;</div><div class='add'>+	struct nfsd_file *localio;</div><div class='ctx'> 	unsigned short task_flags = 0;</div><div class='ctx'> </div><div class='ctx'> 	/* another commit raced with us */</div><div class='ctx'> 	if (list_empty(head))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	data = nfs_commitdata_alloc(true);</div><div class='add'>+	data = nfs_commitdata_alloc();</div><div class='add'>+	if (!data) {</div><div class='add'>+		nfs_retry_commit(head, NULL, cinfo, -1);</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* Set up the argument struct */</div><div class='ctx'> 	nfs_init_commit(data, head, NULL, cinfo);</div><div class='ctx'> 	if (NFS_SERVER(inode)-&gt;nfs_client-&gt;cl_minorversion)</div><div class='ctx'> 		task_flags = RPC_TASK_MOVEABLE;</div><div class='add'>+</div><div class='add'>+	localio = nfs_local_open_fh(NFS_SERVER(inode)-&gt;nfs_client, data-&gt;cred,</div><div class='add'>+				    data-&gt;args.fh, &amp;data-&gt;context-&gt;nfl,</div><div class='add'>+				    data-&gt;context-&gt;mode);</div><div class='ctx'> 	return nfs_initiate_commit(NFS_CLIENT(inode), data, NFS_PROTO(inode),</div><div class='ctx'> 				   data-&gt;mds_ops, how,</div><div class='del'>-				   RPC_TASK_CRED_NOREF | task_flags);</div><div class='add'>+				   RPC_TASK_CRED_NOREF | task_flags, localio);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1849,13 +1801,13 @@ static void nfs_commit_release_pages(struct nfs_commit_data *data)</div><div class='ctx'> 	struct nfs_page	*req;</div><div class='ctx'> 	int status = data-&gt;task.tk_status;</div><div class='ctx'> 	struct nfs_commit_info cinfo;</div><div class='del'>-	struct nfs_server *nfss;</div><div class='add'>+	struct folio *folio;</div><div class='ctx'> </div><div class='ctx'> 	while (!list_empty(&amp;data-&gt;pages)) {</div><div class='ctx'> 		req = nfs_list_entry(data-&gt;pages.next);</div><div class='ctx'> 		nfs_list_remove_request(req);</div><div class='del'>-		if (req-&gt;wb_page)</div><div class='del'>-			nfs_clear_page_commit(req-&gt;wb_page);</div><div class='add'>+		folio = nfs_page_to_folio(req);</div><div class='add'>+		nfs_folio_clear_commit(folio);</div><div class='ctx'> </div><div class='ctx'> 		dprintk("NFS:       commit (%s/%llu %d@%lld)",</div><div class='ctx'> 			nfs_req_openctx(req)-&gt;dentry-&gt;d_sb-&gt;s_id,</div><div class='hunk'>@@ -1863,12 +1815,13 @@ static void nfs_commit_release_pages(struct nfs_commit_data *data)</div><div class='ctx'> 			req-&gt;wb_bytes,</div><div class='ctx'> 			(long long)req_offset(req));</div><div class='ctx'> 		if (status &lt; 0) {</div><div class='del'>-			if (req-&gt;wb_page) {</div><div class='del'>-				trace_nfs_commit_error(req, status);</div><div class='del'>-				nfs_mapping_set_error(req-&gt;wb_page, status);</div><div class='add'>+			if (folio) {</div><div class='add'>+				trace_nfs_commit_error(data-&gt;inode, req,</div><div class='add'>+						       status);</div><div class='add'>+				nfs_mapping_set_error(folio, status);</div><div class='ctx'> 				nfs_inode_remove_request(req);</div><div class='ctx'> 			}</div><div class='del'>-			dprintk_cont(", error = %d\n", status);</div><div class='add'>+			dprintk(", error = %d\n", status);</div><div class='ctx'> 			goto next;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -1876,23 +1829,20 @@ static void nfs_commit_release_pages(struct nfs_commit_data *data)</div><div class='ctx'> 		 * returned by the server against all stored verfs. */</div><div class='ctx'> 		if (nfs_write_match_verf(verf, req)) {</div><div class='ctx'> 			/* We have a match */</div><div class='del'>-			if (req-&gt;wb_page)</div><div class='add'>+			if (folio)</div><div class='ctx'> 				nfs_inode_remove_request(req);</div><div class='del'>-			dprintk_cont(" OK\n");</div><div class='add'>+			dprintk(" OK\n");</div><div class='ctx'> 			goto next;</div><div class='ctx'> 		}</div><div class='ctx'> 		/* We have a mismatch. Write the page again */</div><div class='del'>-		dprintk_cont(" mismatch\n");</div><div class='add'>+		dprintk(" mismatch\n");</div><div class='ctx'> 		nfs_mark_request_dirty(req);</div><div class='del'>-		set_bit(NFS_CONTEXT_RESEND_WRITES, &amp;nfs_req_openctx(req)-&gt;flags);</div><div class='add'>+		atomic_long_inc(&amp;NFS_I(data-&gt;inode)-&gt;redirtied_pages);</div><div class='ctx'> 	next:</div><div class='ctx'> 		nfs_unlock_and_release_request(req);</div><div class='ctx'> 		/* Latency breaker */</div><div class='ctx'> 		cond_resched();</div><div class='ctx'> 	}</div><div class='del'>-	nfss = NFS_SERVER(data-&gt;inode);</div><div class='del'>-	if (atomic_long_read(&amp;nfss-&gt;writeback) &lt; NFS_CONGESTION_OFF_THRESH)</div><div class='del'>-		clear_bdi_congested(inode_to_bdi(data-&gt;inode), BLK_RW_ASYNC);</div><div class='ctx'> </div><div class='ctx'> 	nfs_init_cinfo(&amp;cinfo, data-&gt;inode, data-&gt;dreq);</div><div class='ctx'> 	nfs_commit_end(cinfo.mds);</div><div class='hunk'>@@ -2048,87 +1998,100 @@ out:</div><div class='ctx'> }</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_wb_all);</div><div class='ctx'> </div><div class='del'>-int nfs_wb_page_cancel(struct inode *inode, struct page *page)</div><div class='add'>+int nfs_wb_folio_cancel(struct inode *inode, struct folio *folio)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs_page *req;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	wait_on_page_writeback(page);</div><div class='add'>+	folio_wait_writeback(folio);</div><div class='ctx'> </div><div class='ctx'> 	/* blocking call to cancel all requests and join to a single (head)</div><div class='ctx'> 	 * request */</div><div class='del'>-	req = nfs_lock_and_join_requests(page);</div><div class='add'>+	req = nfs_lock_and_join_requests(folio);</div><div class='ctx'> </div><div class='ctx'> 	if (IS_ERR(req)) {</div><div class='ctx'> 		ret = PTR_ERR(req);</div><div class='ctx'> 	} else if (req) {</div><div class='del'>-		/* all requests from this page have been cancelled by</div><div class='add'>+		/* all requests from this folio have been cancelled by</div><div class='ctx'> 		 * nfs_lock_and_join_requests, so just remove the head</div><div class='ctx'> 		 * request from the inode / page_private pointer and</div><div class='ctx'> 		 * release it */</div><div class='ctx'> 		nfs_inode_remove_request(req);</div><div class='ctx'> 		nfs_unlock_and_release_request(req);</div><div class='add'>+		folio_cancel_dirty(folio);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Write back all requests on one page - we do this before reading it.</div><div class='add'>+/**</div><div class='add'>+ * nfs_wb_folio - Write back all requests on one page</div><div class='add'>+ * @inode: pointer to page</div><div class='add'>+ * @folio: pointer to folio</div><div class='add'>+ *</div><div class='add'>+ * Assumes that the folio has been locked by the caller, and will</div><div class='add'>+ * not unlock it.</div><div class='ctx'>  */</div><div class='del'>-int nfs_wb_page(struct inode *inode, struct page *page)</div><div class='add'>+int nfs_wb_folio(struct inode *inode, struct folio *folio)</div><div class='ctx'> {</div><div class='del'>-	loff_t range_start = page_file_offset(page);</div><div class='del'>-	loff_t range_end = range_start + (loff_t)(PAGE_SIZE - 1);</div><div class='add'>+	loff_t range_start = folio_pos(folio);</div><div class='add'>+	size_t len = folio_size(folio);</div><div class='ctx'> 	struct writeback_control wbc = {</div><div class='ctx'> 		.sync_mode = WB_SYNC_ALL,</div><div class='ctx'> 		.nr_to_write = 0,</div><div class='ctx'> 		.range_start = range_start,</div><div class='del'>-		.range_end = range_end,</div><div class='add'>+		.range_end = range_start + len - 1,</div><div class='ctx'> 	};</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	trace_nfs_writeback_page_enter(inode);</div><div class='add'>+	trace_nfs_writeback_folio(inode, range_start, len);</div><div class='ctx'> </div><div class='ctx'> 	for (;;) {</div><div class='del'>-		wait_on_page_writeback(page);</div><div class='del'>-		if (clear_page_dirty_for_io(page)) {</div><div class='del'>-			ret = nfs_writepage_locked(page, &amp;wbc);</div><div class='add'>+		folio_wait_writeback(folio);</div><div class='add'>+		if (folio_clear_dirty_for_io(folio)) {</div><div class='add'>+			ret = nfs_writepage_locked(folio, &amp;wbc);</div><div class='ctx'> 			if (ret &lt; 0)</div><div class='ctx'> 				goto out_error;</div><div class='ctx'> 			continue;</div><div class='ctx'> 		}</div><div class='ctx'> 		ret = 0;</div><div class='del'>-		if (!PagePrivate(page))</div><div class='add'>+		if (!folio_test_private(folio))</div><div class='ctx'> 			break;</div><div class='ctx'> 		ret = nfs_commit_inode(inode, FLUSH_SYNC);</div><div class='ctx'> 		if (ret &lt; 0)</div><div class='ctx'> 			goto out_error;</div><div class='ctx'> 	}</div><div class='ctx'> out_error:</div><div class='del'>-	trace_nfs_writeback_page_exit(inode, ret);</div><div class='add'>+	trace_nfs_writeback_folio_done(inode, range_start, len, ret);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_MIGRATION</div><div class='del'>-int nfs_migrate_page(struct address_space *mapping, struct page *newpage,</div><div class='del'>-		struct page *page, enum migrate_mode mode)</div><div class='add'>+int nfs_migrate_folio(struct address_space *mapping, struct folio *dst,</div><div class='add'>+		struct folio *src, enum migrate_mode mode)</div><div class='ctx'> {</div><div class='ctx'> 	/*</div><div class='del'>-	 * If PagePrivate is set, then the page is currently associated with</div><div class='add'>+	 * If the private flag is set, the folio is currently associated with</div><div class='ctx'> 	 * an in-progress read or write request. Don't try to migrate it.</div><div class='ctx'> 	 *</div><div class='ctx'> 	 * FIXME: we could do this in principle, but we'll need a way to ensure</div><div class='ctx'> 	 *        that we can safely release the inode reference while holding</div><div class='del'>-	 *        the page lock.</div><div class='add'>+	 *        the folio lock.</div><div class='ctx'> 	 */</div><div class='del'>-	if (PagePrivate(page))</div><div class='del'>-		return -EBUSY;</div><div class='add'>+	if (folio_test_private(src)) {</div><div class='add'>+		if (mode == MIGRATE_SYNC)</div><div class='add'>+			nfs_wb_folio(src-&gt;mapping-&gt;host, src);</div><div class='add'>+		if (folio_test_private(src))</div><div class='add'>+			return -EBUSY;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (!nfs_fscache_release_page(page, GFP_KERNEL))</div><div class='del'>-		return -EBUSY;</div><div class='add'>+	if (folio_test_private_2(src)) { /* [DEPRECATED] */</div><div class='add'>+		if (mode == MIGRATE_ASYNC)</div><div class='add'>+			return -EBUSY;</div><div class='add'>+		folio_wait_private_2(src);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	return migrate_page(mapping, newpage, page, mode);</div><div class='add'>+	return migrate_folio(mapping, dst, src, mode);</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='head'>diff --git a/fs/nfs_common/Makefile b/fs/nfs_common/Makefile<br/>index 119c75ab9fd0..c10ead273ff2 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs_common/Makefile?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs_common/Makefile</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs_common/Makefile?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs_common/Makefile</a></div><div class='hunk'>@@ -6,5 +6,11 @@</div><div class='ctx'> obj-$(CONFIG_NFS_ACL_SUPPORT) += nfs_acl.o</div><div class='ctx'> nfs_acl-objs := nfsacl.o</div><div class='ctx'> </div><div class='add'>+CFLAGS_localio_trace.o += -I$(src)</div><div class='add'>+obj-$(CONFIG_NFS_COMMON_LOCALIO_SUPPORT) += nfs_localio.o</div><div class='add'>+nfs_localio-objs := nfslocalio.o localio_trace.o</div><div class='add'>+</div><div class='ctx'> obj-$(CONFIG_GRACE_PERIOD) += grace.o</div><div class='ctx'> obj-$(CONFIG_NFS_V4_2_SSC_HELPER) += nfs_ssc.o</div><div class='add'>+</div><div class='add'>+obj-$(CONFIG_NFS_COMMON) += common.o</div><div class='head'>diff --git a/fs/nfs_common/common.c b/fs/nfs_common/common.c<br/>new file mode 100644<br/>index 000000000000..af09aed09fd2<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs_common/common.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs_common/common.c</a></div><div class='hunk'>@@ -0,0 +1,201 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-only</div><div class='add'>+</div><div class='add'>+#include &lt;linux/module.h&gt;</div><div class='add'>+#include &lt;linux/nfs_common.h&gt;</div><div class='add'>+#include &lt;linux/nfs4.h&gt;</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * We need to translate between nfs status return values and</div><div class='add'>+ * the local errno values which may not be the same.</div><div class='add'>+ */</div><div class='add'>+static const struct {</div><div class='add'>+	int stat;</div><div class='add'>+	int errno;</div><div class='add'>+} nfs_errtbl[] = {</div><div class='add'>+	{ NFS_OK,		0		},</div><div class='add'>+	{ NFSERR_PERM,		-EPERM		},</div><div class='add'>+	{ NFSERR_NOENT,		-ENOENT		},</div><div class='add'>+	{ NFSERR_IO,		-EIO		},</div><div class='add'>+	{ NFSERR_NXIO,		-ENXIO		},</div><div class='add'>+/*	{ NFSERR_EAGAIN,	-EAGAIN		}, */</div><div class='add'>+	{ NFSERR_ACCES,		-EACCES		},</div><div class='add'>+	{ NFSERR_EXIST,		-EEXIST		},</div><div class='add'>+	{ NFSERR_XDEV,		-EXDEV		},</div><div class='add'>+	{ NFSERR_NODEV,		-ENODEV		},</div><div class='add'>+	{ NFSERR_NOTDIR,	-ENOTDIR	},</div><div class='add'>+	{ NFSERR_ISDIR,		-EISDIR		},</div><div class='add'>+	{ NFSERR_INVAL,		-EINVAL		},</div><div class='add'>+	{ NFSERR_FBIG,		-EFBIG		},</div><div class='add'>+	{ NFSERR_NOSPC,		-ENOSPC		},</div><div class='add'>+	{ NFSERR_ROFS,		-EROFS		},</div><div class='add'>+	{ NFSERR_MLINK,		-EMLINK		},</div><div class='add'>+	{ NFSERR_NAMETOOLONG,	-ENAMETOOLONG	},</div><div class='add'>+	{ NFSERR_NOTEMPTY,	-ENOTEMPTY	},</div><div class='add'>+	{ NFSERR_DQUOT,		-EDQUOT		},</div><div class='add'>+	{ NFSERR_STALE,		-ESTALE		},</div><div class='add'>+	{ NFSERR_REMOTE,	-EREMOTE	},</div><div class='add'>+#ifdef EWFLUSH</div><div class='add'>+	{ NFSERR_WFLUSH,	-EWFLUSH	},</div><div class='add'>+#endif</div><div class='add'>+	{ NFSERR_BADHANDLE,	-EBADHANDLE	},</div><div class='add'>+	{ NFSERR_NOT_SYNC,	-ENOTSYNC	},</div><div class='add'>+	{ NFSERR_BAD_COOKIE,	-EBADCOOKIE	},</div><div class='add'>+	{ NFSERR_NOTSUPP,	-ENOTSUPP	},</div><div class='add'>+	{ NFSERR_TOOSMALL,	-ETOOSMALL	},</div><div class='add'>+	{ NFSERR_SERVERFAULT,	-EREMOTEIO	},</div><div class='add'>+	{ NFSERR_BADTYPE,	-EBADTYPE	},</div><div class='add'>+	{ NFSERR_JUKEBOX,	-EJUKEBOX	},</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * nfs_stat_to_errno - convert an NFS status code to a local errno</div><div class='add'>+ * @status: NFS status code to convert</div><div class='add'>+ *</div><div class='add'>+ * Returns a local errno value, or -EIO if the NFS status code is</div><div class='add'>+ * not recognized.  This function is used jointly by NFSv2 and NFSv3.</div><div class='add'>+ */</div><div class='add'>+int nfs_stat_to_errno(enum nfs_stat status)</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; ARRAY_SIZE(nfs_errtbl); i++) {</div><div class='add'>+		if (nfs_errtbl[i].stat == (int)status)</div><div class='add'>+			return nfs_errtbl[i].errno;</div><div class='add'>+	}</div><div class='add'>+	return -EIO;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(nfs_stat_to_errno);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * We need to translate between nfs v4 status return values and</div><div class='add'>+ * the local errno values which may not be the same.</div><div class='add'>+ *</div><div class='add'>+ * nfs4_errtbl_common[] is used before more specialized mappings</div><div class='add'>+ * available in nfs4_errtbl[] or nfs4_errtbl_localio[].</div><div class='add'>+ */</div><div class='add'>+static const struct {</div><div class='add'>+	int stat;</div><div class='add'>+	int errno;</div><div class='add'>+} nfs4_errtbl_common[] = {</div><div class='add'>+	{ NFS4_OK,		0		},</div><div class='add'>+	{ NFS4ERR_PERM,		-EPERM		},</div><div class='add'>+	{ NFS4ERR_NOENT,	-ENOENT		},</div><div class='add'>+	{ NFS4ERR_IO,		-EIO		},</div><div class='add'>+	{ NFS4ERR_NXIO,		-ENXIO		},</div><div class='add'>+	{ NFS4ERR_ACCESS,	-EACCES		},</div><div class='add'>+	{ NFS4ERR_EXIST,	-EEXIST		},</div><div class='add'>+	{ NFS4ERR_XDEV,		-EXDEV		},</div><div class='add'>+	{ NFS4ERR_NOTDIR,	-ENOTDIR	},</div><div class='add'>+	{ NFS4ERR_ISDIR,	-EISDIR		},</div><div class='add'>+	{ NFS4ERR_INVAL,	-EINVAL		},</div><div class='add'>+	{ NFS4ERR_FBIG,		-EFBIG		},</div><div class='add'>+	{ NFS4ERR_NOSPC,	-ENOSPC		},</div><div class='add'>+	{ NFS4ERR_ROFS,		-EROFS		},</div><div class='add'>+	{ NFS4ERR_MLINK,	-EMLINK		},</div><div class='add'>+	{ NFS4ERR_NAMETOOLONG,	-ENAMETOOLONG	},</div><div class='add'>+	{ NFS4ERR_NOTEMPTY,	-ENOTEMPTY	},</div><div class='add'>+	{ NFS4ERR_DQUOT,	-EDQUOT		},</div><div class='add'>+	{ NFS4ERR_STALE,	-ESTALE		},</div><div class='add'>+	{ NFS4ERR_BADHANDLE,	-EBADHANDLE	},</div><div class='add'>+	{ NFS4ERR_BAD_COOKIE,	-EBADCOOKIE	},</div><div class='add'>+	{ NFS4ERR_NOTSUPP,	-ENOTSUPP	},</div><div class='add'>+	{ NFS4ERR_TOOSMALL,	-ETOOSMALL	},</div><div class='add'>+	{ NFS4ERR_BADTYPE,	-EBADTYPE	},</div><div class='add'>+	{ NFS4ERR_SYMLINK,	-ELOOP		},</div><div class='add'>+	{ NFS4ERR_DEADLOCK,	-EDEADLK	},</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct {</div><div class='add'>+	int stat;</div><div class='add'>+	int errno;</div><div class='add'>+} nfs4_errtbl[] = {</div><div class='add'>+	{ NFS4ERR_SERVERFAULT,	-EREMOTEIO	},</div><div class='add'>+	{ NFS4ERR_LOCKED,	-EAGAIN		},</div><div class='add'>+	{ NFS4ERR_OP_ILLEGAL,	-EOPNOTSUPP	},</div><div class='add'>+	{ NFS4ERR_NOXATTR,	-ENODATA	},</div><div class='add'>+	{ NFS4ERR_XATTR2BIG,	-E2BIG		},</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Convert an NFS error code to a local one.</div><div class='add'>+ * This one is used by NFSv4.</div><div class='add'>+ */</div><div class='add'>+int nfs4_stat_to_errno(int stat)</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	/* First check nfs4_errtbl_common */</div><div class='add'>+	for (i = 0; i &lt; ARRAY_SIZE(nfs4_errtbl_common); i++) {</div><div class='add'>+		if (nfs4_errtbl_common[i].stat == stat)</div><div class='add'>+			return nfs4_errtbl_common[i].errno;</div><div class='add'>+	}</div><div class='add'>+	/* Then check nfs4_errtbl */</div><div class='add'>+	for (i = 0; i &lt; ARRAY_SIZE(nfs4_errtbl); i++) {</div><div class='add'>+		if (nfs4_errtbl[i].stat == stat)</div><div class='add'>+			return nfs4_errtbl[i].errno;</div><div class='add'>+	}</div><div class='add'>+	if (stat &lt;= 10000 || stat &gt; 10100) {</div><div class='add'>+		/* The server is looney tunes. */</div><div class='add'>+		return -EREMOTEIO;</div><div class='add'>+	}</div><div class='add'>+	/* If we cannot translate the error, the recovery routines should</div><div class='add'>+	 * handle it.</div><div class='add'>+	 * Note: remaining NFSv4 error codes have values &gt; 10000, so should</div><div class='add'>+	 * not conflict with native Linux error codes.</div><div class='add'>+	 */</div><div class='add'>+	return -stat;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(nfs4_stat_to_errno);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * This table is useful for conversion from local errno to NFS error.</div><div class='add'>+ * It provides more logically correct mappings for use with LOCALIO</div><div class='add'>+ * (which is focused on converting from errno to NFS status).</div><div class='add'>+ */</div><div class='add'>+static const struct {</div><div class='add'>+	int stat;</div><div class='add'>+	int errno;</div><div class='add'>+} nfs4_errtbl_localio[] = {</div><div class='add'>+	/* Map errors differently than nfs4_errtbl */</div><div class='add'>+	{ NFS4ERR_IO,		-EREMOTEIO	},</div><div class='add'>+	{ NFS4ERR_DELAY,	-EAGAIN		},</div><div class='add'>+	{ NFS4ERR_FBIG,		-E2BIG		},</div><div class='add'>+	/* Map errors not handled by nfs4_errtbl */</div><div class='add'>+	{ NFS4ERR_STALE,	-EBADF		},</div><div class='add'>+	{ NFS4ERR_STALE,	-EOPENSTALE	},</div><div class='add'>+	{ NFS4ERR_DELAY,	-ETIMEDOUT	},</div><div class='add'>+	{ NFS4ERR_DELAY,	-ERESTARTSYS	},</div><div class='add'>+	{ NFS4ERR_DELAY,	-ENOMEM		},</div><div class='add'>+	{ NFS4ERR_IO,		-ETXTBSY	},</div><div class='add'>+	{ NFS4ERR_IO,		-EBUSY		},</div><div class='add'>+	{ NFS4ERR_SERVERFAULT,	-ESERVERFAULT	},</div><div class='add'>+	{ NFS4ERR_SERVERFAULT,	-ENFILE		},</div><div class='add'>+	{ NFS4ERR_IO,		-EUCLEAN	},</div><div class='add'>+	{ NFS4ERR_PERM,		-ENOKEY		},</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Convert an errno to an NFS error code for LOCALIO.</div><div class='add'>+ */</div><div class='add'>+__u32 nfs_localio_errno_to_nfs4_stat(int errno)</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	/* First check nfs4_errtbl_common */</div><div class='add'>+	for (i = 0; i &lt; ARRAY_SIZE(nfs4_errtbl_common); i++) {</div><div class='add'>+		if (nfs4_errtbl_common[i].errno == errno)</div><div class='add'>+			return nfs4_errtbl_common[i].stat;</div><div class='add'>+	}</div><div class='add'>+	/* Then check nfs4_errtbl_localio */</div><div class='add'>+	for (i = 0; i &lt; ARRAY_SIZE(nfs4_errtbl_localio); i++) {</div><div class='add'>+		if (nfs4_errtbl_localio[i].errno == errno)</div><div class='add'>+			return nfs4_errtbl_localio[i].stat;</div><div class='add'>+	}</div><div class='add'>+	/* If we cannot translate the error, the recovery routines should</div><div class='add'>+	 * handle it.</div><div class='add'>+	 * Note: remaining NFSv4 error codes have values &gt; 10000, so should</div><div class='add'>+	 * not conflict with native Linux error codes.</div><div class='add'>+	 */</div><div class='add'>+	return NFS4ERR_SERVERFAULT;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(nfs_localio_errno_to_nfs4_stat);</div><div class='head'>diff --git a/fs/nfs_common/grace.c b/fs/nfs_common/grace.c<br/>index 0a9b72685f98..27cd0d13143b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs_common/grace.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs_common/grace.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs_common/grace.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs_common/grace.c</a></div><div class='hunk'>@@ -9,6 +9,7 @@</div><div class='ctx'> #include &lt;net/net_namespace.h&gt;</div><div class='ctx'> #include &lt;net/netns/generic.h&gt;</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='add'>+#include &lt;linux/filelock.h&gt;</div><div class='ctx'> </div><div class='ctx'> static unsigned int grace_net_id;</div><div class='ctx'> static DEFINE_SPINLOCK(grace_lock);</div><div class='hunk'>@@ -138,6 +139,7 @@ exit_grace(void)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> MODULE_AUTHOR("Jeff Layton &lt;jlayton@primarydata.com&gt;");</div><div class='add'>+MODULE_DESCRIPTION("NFS client and server infrastructure");</div><div class='ctx'> MODULE_LICENSE("GPL");</div><div class='ctx'> module_init(init_grace)</div><div class='ctx'> module_exit(exit_grace)</div><div class='head'>diff --git a/fs/nfs_common/localio_trace.c b/fs/nfs_common/localio_trace.c<br/>new file mode 100644<br/>index 000000000000..7decfe57abeb<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs_common/localio_trace.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs_common/localio_trace.c</a></div><div class='hunk'>@@ -0,0 +1,10 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+/*</div><div class='add'>+ * Copyright (c) 2024 Trond Myklebust &lt;trond.myklebust@hammerspace.com&gt;</div><div class='add'>+ * Copyright (C) 2024 Mike Snitzer &lt;snitzer@hammerspace.com&gt;</div><div class='add'>+ */</div><div class='add'>+#include &lt;linux/nfs_fs.h&gt;</div><div class='add'>+#include &lt;linux/namei.h&gt;</div><div class='add'>+</div><div class='add'>+#define CREATE_TRACE_POINTS</div><div class='add'>+#include "localio_trace.h"</div><div class='head'>diff --git a/fs/nfs_common/localio_trace.h b/fs/nfs_common/localio_trace.h<br/>new file mode 100644<br/>index 000000000000..4055aec9ff8d<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs_common/localio_trace.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs_common/localio_trace.h</a></div><div class='hunk'>@@ -0,0 +1,56 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+/*</div><div class='add'>+ * Copyright (c) 2024 Trond Myklebust &lt;trond.myklebust@hammerspace.com&gt;</div><div class='add'>+ * Copyright (C) 2024 Mike Snitzer &lt;snitzer@hammerspace.com&gt;</div><div class='add'>+ */</div><div class='add'>+#undef TRACE_SYSTEM</div><div class='add'>+#define TRACE_SYSTEM nfs_localio</div><div class='add'>+</div><div class='add'>+#if !defined(_TRACE_NFS_COMMON_LOCALIO_H) || defined(TRACE_HEADER_MULTI_READ)</div><div class='add'>+#define _TRACE_NFS_COMMON_LOCALIO_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/tracepoint.h&gt;</div><div class='add'>+</div><div class='add'>+#include &lt;trace/misc/fs.h&gt;</div><div class='add'>+#include &lt;trace/misc/nfs.h&gt;</div><div class='add'>+#include &lt;trace/misc/sunrpc.h&gt;</div><div class='add'>+</div><div class='add'>+DECLARE_EVENT_CLASS(nfs_local_client_event,</div><div class='add'>+		TP_PROTO(</div><div class='add'>+			const struct nfs_client *clp</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_ARGS(clp),</div><div class='add'>+</div><div class='add'>+		TP_STRUCT__entry(</div><div class='add'>+			__field(unsigned int, protocol)</div><div class='add'>+			__string(server, clp-&gt;cl_hostname)</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_fast_assign(</div><div class='add'>+			__entry-&gt;protocol = clp-&gt;rpc_ops-&gt;version;</div><div class='add'>+			__assign_str(server);</div><div class='add'>+		),</div><div class='add'>+</div><div class='add'>+		TP_printk(</div><div class='add'>+			"server=%s NFSv%u", __get_str(server), __entry-&gt;protocol</div><div class='add'>+		)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+#define DEFINE_NFS_LOCAL_CLIENT_EVENT(name) \</div><div class='add'>+	DEFINE_EVENT(nfs_local_client_event, name, \</div><div class='add'>+			TP_PROTO( \</div><div class='add'>+				const struct nfs_client *clp \</div><div class='add'>+			), \</div><div class='add'>+			TP_ARGS(clp))</div><div class='add'>+</div><div class='add'>+DEFINE_NFS_LOCAL_CLIENT_EVENT(nfs_localio_enable_client);</div><div class='add'>+DEFINE_NFS_LOCAL_CLIENT_EVENT(nfs_localio_disable_client);</div><div class='add'>+</div><div class='add'>+#endif /* _TRACE_NFS_COMMON_LOCALIO_H */</div><div class='add'>+</div><div class='add'>+#undef TRACE_INCLUDE_PATH</div><div class='add'>+#define TRACE_INCLUDE_PATH .</div><div class='add'>+#define TRACE_INCLUDE_FILE localio_trace</div><div class='add'>+/* This part must be outside protection */</div><div class='add'>+#include &lt;trace/define_trace.h&gt;</div><div class='head'>diff --git a/fs/nfs_common/nfs_ssc.c b/fs/nfs_common/nfs_ssc.c<br/>index 7c1509e968c8..832246b22c51 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs_common/nfs_ssc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs_common/nfs_ssc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs_common/nfs_ssc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs_common/nfs_ssc.c</a></div><div class='hunk'>@@ -12,7 +12,6 @@</div><div class='ctx'> #include &lt;linux/nfs_ssc.h&gt;</div><div class='ctx'> #include "../nfs/nfs4_fs.h"</div><div class='ctx'> </div><div class='del'>-MODULE_LICENSE("GPL");</div><div class='ctx'> </div><div class='ctx'> struct nfs_ssc_client_ops_tbl nfs_ssc_client_tbl;</div><div class='ctx'> EXPORT_SYMBOL_GPL(nfs_ssc_client_tbl);</div><div class='head'>diff --git a/fs/nfs_common/nfsacl.c b/fs/nfs_common/nfsacl.c<br/>index 5a5bd85d08f8..e2eaac14fd8e 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfs_common/nfsacl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfs_common/nfsacl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs_common/nfsacl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs_common/nfsacl.c</a></div><div class='hunk'>@@ -29,6 +29,7 @@</div><div class='ctx'> #include &lt;linux/nfs3.h&gt;</div><div class='ctx'> #include &lt;linux/sort.h&gt;</div><div class='ctx'> </div><div class='add'>+MODULE_DESCRIPTION("NFS ACL support");</div><div class='ctx'> MODULE_LICENSE("GPL");</div><div class='ctx'> </div><div class='ctx'> struct nfsacl_encode_desc {</div><div class='hunk'>@@ -41,7 +42,7 @@ struct nfsacl_encode_desc {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct nfsacl_simple_acl {</div><div class='del'>-	struct posix_acl acl;</div><div class='add'>+	struct posix_acl_hdr acl;</div><div class='ctx'> 	struct posix_acl_entry ace[4];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -111,7 +112,8 @@ int nfsacl_encode(struct xdr_buf *buf, unsigned int base, struct inode *inode,</div><div class='ctx'> 	    xdr_encode_word(buf, base, entries))</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	if (encode_entries &amp;&amp; acl &amp;&amp; acl-&gt;a_count == 3) {</div><div class='del'>-		struct posix_acl *acl2 = &amp;aclbuf.acl;</div><div class='add'>+		struct posix_acl *acl2 =</div><div class='add'>+			container_of(&amp;aclbuf.acl, struct posix_acl, hdr);</div><div class='ctx'> </div><div class='ctx'> 		/* Avoid the use of posix_acl_alloc().  nfsacl_encode() is</div><div class='ctx'> 		 * invoked in contexts where a memory allocation failure is</div><div class='hunk'>@@ -176,7 +178,8 @@ bool nfs_stream_encode_acl(struct xdr_stream *xdr, struct inode *inode,</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='ctx'> 	if (encode_entries &amp;&amp; acl &amp;&amp; acl-&gt;a_count == 3) {</div><div class='del'>-		struct posix_acl *acl2 = &amp;aclbuf.acl;</div><div class='add'>+		struct posix_acl *acl2 =</div><div class='add'>+			container_of(&amp;aclbuf.acl, struct posix_acl, hdr);</div><div class='ctx'> </div><div class='ctx'> 		/* Avoid the use of posix_acl_alloc().  nfsacl_encode() is</div><div class='ctx'> 		 * invoked in contexts where a memory allocation failure is</div><div class='head'>diff --git a/fs/nfs_common/nfslocalio.c b/fs/nfs_common/nfslocalio.c<br/>new file mode 100644<br/>index 000000000000..dd715cdb6c04<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfs_common/nfslocalio.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfs_common/nfslocalio.c</a></div><div class='hunk'>@@ -0,0 +1,373 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-only</div><div class='add'>+/*</div><div class='add'>+ * Copyright (C) 2024 Mike Snitzer &lt;snitzer@hammerspace.com&gt;</div><div class='add'>+ * Copyright (C) 2024 NeilBrown &lt;neilb@suse.de&gt;</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/module.h&gt;</div><div class='add'>+#include &lt;linux/list.h&gt;</div><div class='add'>+#include &lt;linux/nfslocalio.h&gt;</div><div class='add'>+#include &lt;linux/nfs3.h&gt;</div><div class='add'>+#include &lt;linux/nfs4.h&gt;</div><div class='add'>+#include &lt;linux/nfs_fs.h&gt;</div><div class='add'>+#include &lt;net/netns/generic.h&gt;</div><div class='add'>+</div><div class='add'>+#include "localio_trace.h"</div><div class='add'>+</div><div class='add'>+MODULE_LICENSE("GPL");</div><div class='add'>+MODULE_DESCRIPTION("NFS localio protocol bypass support");</div><div class='add'>+</div><div class='add'>+static DEFINE_SPINLOCK(nfs_uuids_lock);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Global list of nfs_uuid_t instances</div><div class='add'>+ * that is protected by nfs_uuids_lock.</div><div class='add'>+ */</div><div class='add'>+static LIST_HEAD(nfs_uuids);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Lock ordering:</div><div class='add'>+ * 1: nfs_uuid-&gt;lock</div><div class='add'>+ * 2: nfs_uuids_lock</div><div class='add'>+ * 3: nfs_uuid-&gt;list_lock (aka nn-&gt;local_clients_lock)</div><div class='add'>+ *</div><div class='add'>+ * May skip locks in select cases, but never hold multiple</div><div class='add'>+ * locks out of order.</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+void nfs_uuid_init(nfs_uuid_t *nfs_uuid)</div><div class='add'>+{</div><div class='add'>+	RCU_INIT_POINTER(nfs_uuid-&gt;net, NULL);</div><div class='add'>+	nfs_uuid-&gt;dom = NULL;</div><div class='add'>+	nfs_uuid-&gt;list_lock = NULL;</div><div class='add'>+	INIT_LIST_HEAD(&amp;nfs_uuid-&gt;list);</div><div class='add'>+	INIT_LIST_HEAD(&amp;nfs_uuid-&gt;files);</div><div class='add'>+	spin_lock_init(&amp;nfs_uuid-&gt;lock);</div><div class='add'>+	nfs_uuid-&gt;nfs3_localio_probe_count = 0;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(nfs_uuid_init);</div><div class='add'>+</div><div class='add'>+bool nfs_uuid_begin(nfs_uuid_t *nfs_uuid)</div><div class='add'>+{</div><div class='add'>+	spin_lock(&amp;nfs_uuid-&gt;lock);</div><div class='add'>+	if (rcu_access_pointer(nfs_uuid-&gt;net)) {</div><div class='add'>+		/* This nfs_uuid is already in use */</div><div class='add'>+		spin_unlock(&amp;nfs_uuid-&gt;lock);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;nfs_uuids_lock);</div><div class='add'>+	if (!list_empty(&amp;nfs_uuid-&gt;list)) {</div><div class='add'>+		/* This nfs_uuid is already in use */</div><div class='add'>+		spin_unlock(&amp;nfs_uuids_lock);</div><div class='add'>+		spin_unlock(&amp;nfs_uuid-&gt;lock);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+	list_add_tail(&amp;nfs_uuid-&gt;list, &amp;nfs_uuids);</div><div class='add'>+	spin_unlock(&amp;nfs_uuids_lock);</div><div class='add'>+</div><div class='add'>+	uuid_gen(&amp;nfs_uuid-&gt;uuid);</div><div class='add'>+	spin_unlock(&amp;nfs_uuid-&gt;lock);</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(nfs_uuid_begin);</div><div class='add'>+</div><div class='add'>+void nfs_uuid_end(nfs_uuid_t *nfs_uuid)</div><div class='add'>+{</div><div class='add'>+	if (!rcu_access_pointer(nfs_uuid-&gt;net)) {</div><div class='add'>+		spin_lock(&amp;nfs_uuid-&gt;lock);</div><div class='add'>+		if (!rcu_access_pointer(nfs_uuid-&gt;net)) {</div><div class='add'>+			/* Not local, remove from nfs_uuids */</div><div class='add'>+			spin_lock(&amp;nfs_uuids_lock);</div><div class='add'>+			list_del_init(&amp;nfs_uuid-&gt;list);</div><div class='add'>+			spin_unlock(&amp;nfs_uuids_lock);</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;nfs_uuid-&gt;lock);</div><div class='add'>+        }</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(nfs_uuid_end);</div><div class='add'>+</div><div class='add'>+static nfs_uuid_t * nfs_uuid_lookup_locked(const uuid_t *uuid)</div><div class='add'>+{</div><div class='add'>+	nfs_uuid_t *nfs_uuid;</div><div class='add'>+</div><div class='add'>+	list_for_each_entry(nfs_uuid, &amp;nfs_uuids, list)</div><div class='add'>+		if (uuid_equal(&amp;nfs_uuid-&gt;uuid, uuid))</div><div class='add'>+			return nfs_uuid;</div><div class='add'>+</div><div class='add'>+	return NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static struct module *nfsd_mod;</div><div class='add'>+</div><div class='add'>+void nfs_uuid_is_local(const uuid_t *uuid, struct list_head *list,</div><div class='add'>+		       spinlock_t *list_lock, struct net *net,</div><div class='add'>+		       struct auth_domain *dom, struct module *mod)</div><div class='add'>+{</div><div class='add'>+	nfs_uuid_t *nfs_uuid;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;nfs_uuids_lock);</div><div class='add'>+	nfs_uuid = nfs_uuid_lookup_locked(uuid);</div><div class='add'>+	if (!nfs_uuid) {</div><div class='add'>+		spin_unlock(&amp;nfs_uuids_lock);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * We don't hold a ref on the net, but instead put</div><div class='add'>+	 * ourselves on @list (nn-&gt;local_clients) so the net</div><div class='add'>+	 * pointer can be invalidated.</div><div class='add'>+	 */</div><div class='add'>+	spin_lock(list_lock); /* list_lock is nn-&gt;local_clients_lock */</div><div class='add'>+	list_move(&amp;nfs_uuid-&gt;list, list);</div><div class='add'>+	spin_unlock(list_lock);</div><div class='add'>+</div><div class='add'>+	spin_unlock(&amp;nfs_uuids_lock);</div><div class='add'>+	/* Once nfs_uuid is parented to @list, avoid global nfs_uuids_lock */</div><div class='add'>+	spin_lock(&amp;nfs_uuid-&gt;lock);</div><div class='add'>+</div><div class='add'>+	__module_get(mod);</div><div class='add'>+	nfsd_mod = mod;</div><div class='add'>+</div><div class='add'>+	nfs_uuid-&gt;list_lock = list_lock;</div><div class='add'>+	kref_get(&amp;dom-&gt;ref);</div><div class='add'>+	nfs_uuid-&gt;dom = dom;</div><div class='add'>+	rcu_assign_pointer(nfs_uuid-&gt;net, net);</div><div class='add'>+	spin_unlock(&amp;nfs_uuid-&gt;lock);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(nfs_uuid_is_local);</div><div class='add'>+</div><div class='add'>+void nfs_localio_enable_client(struct nfs_client *clp)</div><div class='add'>+{</div><div class='add'>+	/* nfs_uuid_is_local() does the actual enablement */</div><div class='add'>+	trace_nfs_localio_enable_client(clp);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(nfs_localio_enable_client);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Cleanup the nfs_uuid_t embedded in an nfs_client.</div><div class='add'>+ * This is the long-form of nfs_uuid_init().</div><div class='add'>+ */</div><div class='add'>+static bool nfs_uuid_put(nfs_uuid_t *nfs_uuid)</div><div class='add'>+{</div><div class='add'>+	struct nfs_file_localio *nfl;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;nfs_uuid-&gt;lock);</div><div class='add'>+	if (unlikely(!rcu_access_pointer(nfs_uuid-&gt;net))) {</div><div class='add'>+		spin_unlock(&amp;nfs_uuid-&gt;lock);</div><div class='add'>+		return false;</div><div class='add'>+	}</div><div class='add'>+	RCU_INIT_POINTER(nfs_uuid-&gt;net, NULL);</div><div class='add'>+</div><div class='add'>+	if (nfs_uuid-&gt;dom) {</div><div class='add'>+		auth_domain_put(nfs_uuid-&gt;dom);</div><div class='add'>+		nfs_uuid-&gt;dom = NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Walk list of files and ensure their last references dropped */</div><div class='add'>+</div><div class='add'>+	while ((nfl = list_first_entry_or_null(&amp;nfs_uuid-&gt;files,</div><div class='add'>+					       struct nfs_file_localio,</div><div class='add'>+					       list)) != NULL) {</div><div class='add'>+		/* If nfs_uuid is already NULL, nfs_close_local_fh is</div><div class='add'>+		 * closing and we must wait, else we unlink and close.</div><div class='add'>+		 */</div><div class='add'>+		if (rcu_access_pointer(nfl-&gt;nfs_uuid) == NULL) {</div><div class='add'>+			/* nfs_close_local_fh() is doing the</div><div class='add'>+			 * close and we must wait. until it unlinks</div><div class='add'>+			 */</div><div class='add'>+			wait_var_event_spinlock(nfs_uuid,</div><div class='add'>+						list_first_entry_or_null(</div><div class='add'>+							&amp;nfs_uuid-&gt;files,</div><div class='add'>+							struct nfs_file_localio,</div><div class='add'>+							list) != nfl,</div><div class='add'>+						&amp;nfs_uuid-&gt;lock);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* Remove nfl from nfs_uuid-&gt;files list */</div><div class='add'>+		list_del_init(&amp;nfl-&gt;list);</div><div class='add'>+		spin_unlock(&amp;nfs_uuid-&gt;lock);</div><div class='add'>+</div><div class='add'>+		nfs_to_nfsd_file_put_local(&amp;nfl-&gt;ro_file);</div><div class='add'>+		nfs_to_nfsd_file_put_local(&amp;nfl-&gt;rw_file);</div><div class='add'>+		cond_resched();</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;nfs_uuid-&gt;lock);</div><div class='add'>+		/* Now we can allow racing nfs_close_local_fh() to</div><div class='add'>+		 * skip the locking.</div><div class='add'>+		 */</div><div class='add'>+		store_release_wake_up(&amp;nfl-&gt;nfs_uuid, RCU_INITIALIZER(NULL));</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Remove client from nn-&gt;local_clients */</div><div class='add'>+	if (nfs_uuid-&gt;list_lock) {</div><div class='add'>+		spin_lock(nfs_uuid-&gt;list_lock);</div><div class='add'>+		BUG_ON(list_empty(&amp;nfs_uuid-&gt;list));</div><div class='add'>+		list_del_init(&amp;nfs_uuid-&gt;list);</div><div class='add'>+		spin_unlock(nfs_uuid-&gt;list_lock);</div><div class='add'>+		nfs_uuid-&gt;list_lock = NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	module_put(nfsd_mod);</div><div class='add'>+	spin_unlock(&amp;nfs_uuid-&gt;lock);</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void nfs_localio_disable_client(struct nfs_client *clp)</div><div class='add'>+{</div><div class='add'>+	if (nfs_uuid_put(&amp;clp-&gt;cl_uuid))</div><div class='add'>+		trace_nfs_localio_disable_client(clp);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(nfs_localio_disable_client);</div><div class='add'>+</div><div class='add'>+void nfs_localio_invalidate_clients(struct list_head *nn_local_clients,</div><div class='add'>+				    spinlock_t *nn_local_clients_lock)</div><div class='add'>+{</div><div class='add'>+	LIST_HEAD(local_clients);</div><div class='add'>+	nfs_uuid_t *nfs_uuid, *tmp;</div><div class='add'>+	struct nfs_client *clp;</div><div class='add'>+</div><div class='add'>+	spin_lock(nn_local_clients_lock);</div><div class='add'>+	list_splice_init(nn_local_clients, &amp;local_clients);</div><div class='add'>+	spin_unlock(nn_local_clients_lock);</div><div class='add'>+	list_for_each_entry_safe(nfs_uuid, tmp, &amp;local_clients, list) {</div><div class='add'>+		if (WARN_ON(nfs_uuid-&gt;list_lock != nn_local_clients_lock))</div><div class='add'>+			break;</div><div class='add'>+		clp = container_of(nfs_uuid, struct nfs_client, cl_uuid);</div><div class='add'>+		nfs_localio_disable_client(clp);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(nfs_localio_invalidate_clients);</div><div class='add'>+</div><div class='add'>+static int nfs_uuid_add_file(nfs_uuid_t *nfs_uuid, struct nfs_file_localio *nfl)</div><div class='add'>+{</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	/* Add nfl to nfs_uuid-&gt;files if it isn't already */</div><div class='add'>+	spin_lock(&amp;nfs_uuid-&gt;lock);</div><div class='add'>+	if (rcu_access_pointer(nfs_uuid-&gt;net) == NULL) {</div><div class='add'>+		ret = -ENXIO;</div><div class='add'>+	} else if (list_empty(&amp;nfl-&gt;list)) {</div><div class='add'>+		rcu_assign_pointer(nfl-&gt;nfs_uuid, nfs_uuid);</div><div class='add'>+		list_add_tail(&amp;nfl-&gt;list, &amp;nfs_uuid-&gt;files);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;nfs_uuid-&gt;lock);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Caller is responsible for calling nfsd_net_put and</div><div class='add'>+ * nfsd_file_put (via nfs_to_nfsd_file_put_local).</div><div class='add'>+ */</div><div class='add'>+struct nfsd_file *nfs_open_local_fh(nfs_uuid_t *uuid,</div><div class='add'>+		   struct rpc_clnt *rpc_clnt, const struct cred *cred,</div><div class='add'>+		   const struct nfs_fh *nfs_fh, struct nfs_file_localio *nfl,</div><div class='add'>+		   struct nfsd_file __rcu **pnf,</div><div class='add'>+		   const fmode_t fmode)</div><div class='add'>+{</div><div class='add'>+	struct net *net;</div><div class='add'>+	struct nfsd_file *localio;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Not running in nfsd context, so must safely get reference on nfsd_serv.</div><div class='add'>+	 * But the server may already be shutting down, if so disallow new localio.</div><div class='add'>+	 * uuid-&gt;net is NOT a counted reference, but rcu_read_lock() ensures that</div><div class='add'>+	 * if uuid-&gt;net is not NULL, then calling nfsd_net_try_get() is safe</div><div class='add'>+	 * and if it succeeds we will have an implied reference to the net.</div><div class='add'>+	 *</div><div class='add'>+	 * Otherwise NFS may not have ref on NFSD and therefore cannot safely</div><div class='add'>+	 * make 'nfs_to' calls.</div><div class='add'>+	 */</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	net = rcu_dereference(uuid-&gt;net);</div><div class='add'>+	if (!net || !nfs_to-&gt;nfsd_net_try_get(net)) {</div><div class='add'>+		rcu_read_unlock();</div><div class='add'>+		return ERR_PTR(-ENXIO);</div><div class='add'>+	}</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+	/* We have an implied reference to net thanks to nfsd_net_try_get */</div><div class='add'>+	localio = nfs_to-&gt;nfsd_open_local_fh(net, uuid-&gt;dom, rpc_clnt, cred,</div><div class='add'>+					     nfs_fh, pnf, fmode);</div><div class='add'>+	if (!IS_ERR(localio) &amp;&amp; nfs_uuid_add_file(uuid, nfl) &lt; 0) {</div><div class='add'>+		/* Delete the cached file when racing with nfs_uuid_put() */</div><div class='add'>+		nfs_to_nfsd_file_put_local(pnf);</div><div class='add'>+	}</div><div class='add'>+	nfs_to_nfsd_net_put(net);</div><div class='add'>+</div><div class='add'>+	return localio;</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(nfs_open_local_fh);</div><div class='add'>+</div><div class='add'>+void nfs_close_local_fh(struct nfs_file_localio *nfl)</div><div class='add'>+{</div><div class='add'>+	nfs_uuid_t *nfs_uuid;</div><div class='add'>+</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	nfs_uuid = rcu_dereference(nfl-&gt;nfs_uuid);</div><div class='add'>+	if (!nfs_uuid) {</div><div class='add'>+		/* regular (non-LOCALIO) NFS will hammer this */</div><div class='add'>+		rcu_read_unlock();</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;nfs_uuid-&gt;lock);</div><div class='add'>+	if (!rcu_access_pointer(nfl-&gt;nfs_uuid)) {</div><div class='add'>+		/* nfs_uuid_put has finished here */</div><div class='add'>+		spin_unlock(&amp;nfs_uuid-&gt;lock);</div><div class='add'>+		rcu_read_unlock();</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+	if (list_empty(&amp;nfl-&gt;list)) {</div><div class='add'>+		/* nfs_uuid_put() has started closing files, wait for it</div><div class='add'>+		 * to finished</div><div class='add'>+		 */</div><div class='add'>+		spin_unlock(&amp;nfs_uuid-&gt;lock);</div><div class='add'>+		rcu_read_unlock();</div><div class='add'>+		wait_var_event(&amp;nfl-&gt;nfs_uuid,</div><div class='add'>+			       rcu_access_pointer(nfl-&gt;nfs_uuid) == NULL);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+	/* tell nfs_uuid_put() to wait for us */</div><div class='add'>+	RCU_INIT_POINTER(nfl-&gt;nfs_uuid, NULL);</div><div class='add'>+	spin_unlock(&amp;nfs_uuid-&gt;lock);</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+</div><div class='add'>+	nfs_to_nfsd_file_put_local(&amp;nfl-&gt;ro_file);</div><div class='add'>+	nfs_to_nfsd_file_put_local(&amp;nfl-&gt;rw_file);</div><div class='add'>+</div><div class='add'>+	/* Remove nfl from nfs_uuid-&gt;files list and signal nfs_uuid_put()</div><div class='add'>+	 * that we are done.  The moment we drop the spinlock the</div><div class='add'>+	 * nfs_uuid could be freed.</div><div class='add'>+	 */</div><div class='add'>+	spin_lock(&amp;nfs_uuid-&gt;lock);</div><div class='add'>+	list_del_init(&amp;nfl-&gt;list);</div><div class='add'>+	wake_up_var_locked(nfs_uuid, &amp;nfs_uuid-&gt;lock);</div><div class='add'>+	spin_unlock(&amp;nfs_uuid-&gt;lock);</div><div class='add'>+}</div><div class='add'>+EXPORT_SYMBOL_GPL(nfs_close_local_fh);</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * The NFS LOCALIO code needs to call into NFSD using various symbols,</div><div class='add'>+ * but cannot be statically linked, because that will make the NFS</div><div class='add'>+ * module always depend on the NFSD module.</div><div class='add'>+ *</div><div class='add'>+ * 'nfs_to' provides NFS access to NFSD functions needed for LOCALIO,</div><div class='add'>+ * its lifetime is tightly coupled to the NFSD module and will always</div><div class='add'>+ * be available to NFS LOCALIO because any successful client&lt;-&gt;server</div><div class='add'>+ * LOCALIO handshake results in a reference on the NFSD module (above),</div><div class='add'>+ * so NFS implicitly holds a reference to the NFSD module and its</div><div class='add'>+ * functions in the 'nfs_to' nfsd_localio_operations cannot disappear.</div><div class='add'>+ *</div><div class='add'>+ * If the last NFS client using LOCALIO disconnects (and its reference</div><div class='add'>+ * on NFSD dropped) then NFSD could be unloaded, resulting in 'nfs_to'</div><div class='add'>+ * functions being invalid pointers. But if NFSD isn't loaded then NFS</div><div class='add'>+ * will not be able to handshake with NFSD and will have no cause to</div><div class='add'>+ * try to call 'nfs_to' function pointers. If/when NFSD is reloaded it</div><div class='add'>+ * will reinitialize the 'nfs_to' function pointers and make LOCALIO</div><div class='add'>+ * possible.</div><div class='add'>+ */</div><div class='add'>+const struct nfsd_localio_operations *nfs_to;</div><div class='add'>+EXPORT_SYMBOL_GPL(nfs_to);</div><div class='head'>diff --git a/fs/nfsd/Kconfig b/fs/nfsd/Kconfig<br/>index 3d1d17256a91..0b5c1a0bf1cf 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/Kconfig?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/Kconfig</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/Kconfig?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/Kconfig</a></div><div class='hunk'>@@ -4,10 +4,15 @@ config NFSD</div><div class='ctx'> 	depends on INET</div><div class='ctx'> 	depends on FILE_LOCKING</div><div class='ctx'> 	depends on FSNOTIFY</div><div class='add'>+	select CRC32</div><div class='add'>+	select CRYPTO_LIB_MD5 if NFSD_LEGACY_CLIENT_TRACKING</div><div class='add'>+	select CRYPTO_LIB_SHA256 if NFSD_V4</div><div class='ctx'> 	select LOCKD</div><div class='ctx'> 	select SUNRPC</div><div class='ctx'> 	select EXPORTFS</div><div class='add'>+	select NFS_COMMON</div><div class='ctx'> 	select NFS_ACL_SUPPORT if NFSD_V2_ACL</div><div class='add'>+	select NFS_ACL_SUPPORT if NFSD_V3_ACL</div><div class='ctx'> 	depends on MULTIUSER</div><div class='ctx'> 	help</div><div class='ctx'> 	  Choose Y here if you want to allow other computers to access</div><div class='hunk'>@@ -26,28 +31,29 @@ config NFSD</div><div class='ctx'> </div><div class='ctx'> 	  Below you can choose which versions of the NFS protocol are</div><div class='ctx'> 	  available to clients mounting the NFS server on this system.</div><div class='del'>-	  Support for NFS version 2 (RFC 1094) is always available when</div><div class='add'>+	  Support for NFS version 3 (RFC 1813) is always available when</div><div class='ctx'> 	  CONFIG_NFSD is selected.</div><div class='ctx'> </div><div class='ctx'> 	  If unsure, say N.</div><div class='ctx'> </div><div class='del'>-config NFSD_V2_ACL</div><div class='del'>-	bool</div><div class='del'>-	depends on NFSD</div><div class='del'>-</div><div class='del'>-config NFSD_V3</div><div class='del'>-	bool "NFS server support for NFS version 3"</div><div class='add'>+config NFSD_V2</div><div class='add'>+	bool "NFS server support for NFS version 2 (DEPRECATED)"</div><div class='ctx'> 	depends on NFSD</div><div class='add'>+	default n</div><div class='ctx'> 	help</div><div class='del'>-	  This option enables support in your system's NFS server for</div><div class='del'>-	  version 3 of the NFS protocol (RFC 1813).</div><div class='add'>+	  NFSv2 (RFC 1094) was the first publicly-released version of NFS.</div><div class='add'>+	  Unless you are hosting ancient (1990's era) NFS clients, you don't</div><div class='add'>+	  need this.</div><div class='add'>+</div><div class='add'>+	  If unsure, say N.</div><div class='ctx'> </div><div class='del'>-	  If unsure, say Y.</div><div class='add'>+config NFSD_V2_ACL</div><div class='add'>+	bool "NFS server support for the NFSv2 ACL protocol extension"</div><div class='add'>+	depends on NFSD_V2</div><div class='ctx'> </div><div class='ctx'> config NFSD_V3_ACL</div><div class='ctx'> 	bool "NFS server support for the NFSv3 ACL protocol extension"</div><div class='del'>-	depends on NFSD_V3</div><div class='del'>-	select NFSD_V2_ACL</div><div class='add'>+	depends on NFSD</div><div class='ctx'> 	help</div><div class='ctx'> 	  Solaris NFS servers support an auxiliary NFSv3 ACL protocol that</div><div class='ctx'> 	  never became an official part of the NFS version 3 protocol.</div><div class='hunk'>@@ -70,12 +76,9 @@ config NFSD_V3_ACL</div><div class='ctx'> config NFSD_V4</div><div class='ctx'> 	bool "NFS server support for NFS version 4"</div><div class='ctx'> 	depends on NFSD &amp;&amp; PROC_FS</div><div class='del'>-	select NFSD_V3</div><div class='ctx'> 	select FS_POSIX_ACL</div><div class='del'>-	select SUNRPC_GSS</div><div class='del'>-	select CRYPTO</div><div class='del'>-	select CRYPTO_MD5</div><div class='del'>-	select CRYPTO_SHA256</div><div class='add'>+	select RPCSEC_GSS_KRB5</div><div class='add'>+	select CRYPTO # required by RPCSEC_GSS_KRB5</div><div class='ctx'> 	select GRACE_PERIOD</div><div class='ctx'> 	select NFS_V4_2_SSC_HELPER if NFS_V4_2</div><div class='ctx'> 	help</div><div class='hunk'>@@ -157,3 +160,29 @@ config NFSD_V4_SECURITY_LABEL</div><div class='ctx'> </div><div class='ctx'> 	If you do not wish to enable fine-grained security labels SELinux or</div><div class='ctx'> 	Smack policies on NFSv4 files, say N.</div><div class='add'>+</div><div class='add'>+config NFSD_LEGACY_CLIENT_TRACKING</div><div class='add'>+	bool "Support legacy NFSv4 client tracking methods (DEPRECATED)"</div><div class='add'>+	depends on NFSD_V4</div><div class='add'>+	default n</div><div class='add'>+	help</div><div class='add'>+	  The NFSv4 server needs to store a small amount of information on</div><div class='add'>+	  stable storage in order to handle state recovery after reboot. Most</div><div class='add'>+	  modern deployments upcall to a userland daemon for this (nfsdcld),</div><div class='add'>+	  but older NFS servers may store information directly in a</div><div class='add'>+	  recoverydir, or spawn a process directly using a usermodehelper</div><div class='add'>+	  upcall.</div><div class='add'>+</div><div class='add'>+	  These legacy client tracking methods have proven to be problematic</div><div class='add'>+	  and will be removed in the future. Say Y here if you need support</div><div class='add'>+	  for them in the interim.</div><div class='add'>+</div><div class='add'>+config NFSD_V4_DELEG_TIMESTAMPS</div><div class='add'>+	bool "Support delegated timestamps"</div><div class='add'>+	depends on NFSD_V4</div><div class='add'>+	default n</div><div class='add'>+	help</div><div class='add'>+	  NFSD implements delegated timestamps according to</div><div class='add'>+	  draft-ietf-nfsv4-delstid-08 "Extending the Opening of Files". This</div><div class='add'>+	  is currently an experimental feature and is therefore left disabled</div><div class='add'>+	  by default.</div><div class='head'>diff --git a/fs/nfsd/Makefile b/fs/nfsd/Makefile<br/>index 3f0983e93a99..55744bb786c9 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/Makefile?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/Makefile</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/Makefile?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/Makefile</a></div><div class='hunk'>@@ -10,15 +10,32 @@ obj-$(CONFIG_NFSD)	+= nfsd.o</div><div class='ctx'> # this one should be compiled first, as the tracing macros can easily blow up</div><div class='ctx'> nfsd-y			+= trace.o</div><div class='ctx'> </div><div class='del'>-nfsd-y 			+= nfssvc.o nfsctl.o nfsproc.o nfsfh.o vfs.o \</div><div class='del'>-			   export.o auth.o lockd.o nfscache.o nfsxdr.o \</div><div class='del'>-			   stats.o filecache.o</div><div class='add'>+nfsd-y 			+= nfssvc.o nfsctl.o nfsfh.o vfs.o \</div><div class='add'>+			   export.o auth.o lockd.o nfscache.o \</div><div class='add'>+			   stats.o filecache.o nfs3proc.o nfs3xdr.o \</div><div class='add'>+			   netlink.o</div><div class='add'>+nfsd-$(CONFIG_NFSD_V2) += nfsproc.o nfsxdr.o</div><div class='ctx'> nfsd-$(CONFIG_NFSD_V2_ACL) += nfs2acl.o</div><div class='del'>-nfsd-$(CONFIG_NFSD_V3)	+= nfs3proc.o nfs3xdr.o</div><div class='ctx'> nfsd-$(CONFIG_NFSD_V3_ACL) += nfs3acl.o</div><div class='ctx'> nfsd-$(CONFIG_NFSD_V4)	+= nfs4proc.o nfs4xdr.o nfs4state.o nfs4idmap.o \</div><div class='del'>-			   nfs4acl.o nfs4callback.o nfs4recover.o</div><div class='add'>+			   nfs4acl.o nfs4callback.o nfs4recover.o nfs4xdr_gen.o</div><div class='ctx'> nfsd-$(CONFIG_NFSD_PNFS) += nfs4layouts.o</div><div class='ctx'> nfsd-$(CONFIG_NFSD_BLOCKLAYOUT) += blocklayout.o blocklayoutxdr.o</div><div class='ctx'> nfsd-$(CONFIG_NFSD_SCSILAYOUT) += blocklayout.o blocklayoutxdr.o</div><div class='ctx'> nfsd-$(CONFIG_NFSD_FLEXFILELAYOUT) += flexfilelayout.o flexfilelayoutxdr.o</div><div class='add'>+nfsd-$(CONFIG_NFS_LOCALIO) += localio.o</div><div class='add'>+nfsd-$(CONFIG_DEBUG_FS) += debugfs.o</div><div class='add'>+</div><div class='add'>+</div><div class='add'>+.PHONY: xdrgen</div><div class='add'>+</div><div class='add'>+xdrgen: ../../include/linux/sunrpc/xdrgen/nfs4_1.h nfs4xdr_gen.h nfs4xdr_gen.c</div><div class='add'>+</div><div class='add'>+../../include/linux/sunrpc/xdrgen/nfs4_1.h: ../../Documentation/sunrpc/xdr/nfs4_1.x</div><div class='add'>+	../../tools/net/sunrpc/xdrgen/xdrgen definitions $&lt; &gt; $@</div><div class='add'>+</div><div class='add'>+nfs4xdr_gen.h: ../../Documentation/sunrpc/xdr/nfs4_1.x</div><div class='add'>+	../../tools/net/sunrpc/xdrgen/xdrgen declarations $&lt; &gt; $@</div><div class='add'>+</div><div class='add'>+nfs4xdr_gen.c: ../../Documentation/sunrpc/xdr/nfs4_1.x</div><div class='add'>+	../../tools/net/sunrpc/xdrgen/xdrgen source $&lt; &gt; $@</div><div class='head'>diff --git a/fs/nfsd/acl.h b/fs/nfsd/acl.h<br/>index ba14d2f4b64f..4b7324458a94 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/acl.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/acl.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/acl.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/acl.h</a></div><div class='hunk'>@@ -38,6 +38,8 @@</div><div class='ctx'> struct nfs4_acl;</div><div class='ctx'> struct svc_fh;</div><div class='ctx'> struct svc_rqst;</div><div class='add'>+struct nfsd_attrs;</div><div class='add'>+enum nfs_ftype4;</div><div class='ctx'> </div><div class='ctx'> int nfs4_acl_bytes(int entries);</div><div class='ctx'> int nfs4_acl_get_whotype(char *, u32);</div><div class='hunk'>@@ -45,7 +47,7 @@ __be32 nfs4_acl_write_who(struct xdr_stream *xdr, int who);</div><div class='ctx'> </div><div class='ctx'> int nfsd4_get_nfs4_acl(struct svc_rqst *rqstp, struct dentry *dentry,</div><div class='ctx'> 		struct nfs4_acl **acl);</div><div class='del'>-__be32 nfsd4_set_nfs4_acl(struct svc_rqst *rqstp, struct svc_fh *fhp,</div><div class='del'>-		struct nfs4_acl *acl);</div><div class='add'>+__be32 nfsd4_acl_to_attr(enum nfs_ftype4 type, struct nfs4_acl *acl,</div><div class='add'>+			 struct nfsd_attrs *attr);</div><div class='ctx'> </div><div class='ctx'> #endif /* LINUX_NFS4_ACL_H */</div><div class='head'>diff --git a/fs/nfsd/auth.c b/fs/nfsd/auth.c<br/>index fdf2aad73470..4dc327e02456 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/auth.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/auth.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/auth.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/auth.c</a></div><div class='hunk'>@@ -5,39 +5,37 @@</div><div class='ctx'> #include "nfsd.h"</div><div class='ctx'> #include "auth.h"</div><div class='ctx'> </div><div class='del'>-int nfsexp_flags(struct svc_rqst *rqstp, struct svc_export *exp)</div><div class='add'>+int nfsexp_flags(struct svc_cred *cred, struct svc_export *exp)</div><div class='ctx'> {</div><div class='ctx'> 	struct exp_flavor_info *f;</div><div class='ctx'> 	struct exp_flavor_info *end = exp-&gt;ex_flavors + exp-&gt;ex_nflavors;</div><div class='ctx'> </div><div class='ctx'> 	for (f = exp-&gt;ex_flavors; f &lt; end; f++) {</div><div class='del'>-		if (f-&gt;pseudoflavor == rqstp-&gt;rq_cred.cr_flavor)</div><div class='add'>+		if (f-&gt;pseudoflavor == cred-&gt;cr_flavor)</div><div class='ctx'> 			return f-&gt;flags;</div><div class='ctx'> 	}</div><div class='ctx'> 	return exp-&gt;ex_flags;</div><div class='ctx'> </div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int nfsd_setuser(struct svc_rqst *rqstp, struct svc_export *exp)</div><div class='add'>+int nfsd_setuser(struct svc_cred *cred, struct svc_export *exp)</div><div class='ctx'> {</div><div class='ctx'> 	struct group_info *rqgi;</div><div class='ctx'> 	struct group_info *gi;</div><div class='ctx'> 	struct cred *new;</div><div class='ctx'> 	int i;</div><div class='del'>-	int flags = nfsexp_flags(rqstp, exp);</div><div class='del'>-</div><div class='del'>-	validate_process_creds();</div><div class='add'>+	int flags = nfsexp_flags(cred, exp);</div><div class='ctx'> </div><div class='ctx'> 	/* discard any old override before preparing the new set */</div><div class='del'>-	revert_creds(get_cred(current_real_cred()));</div><div class='add'>+	put_cred(revert_creds(get_cred(current_real_cred())));</div><div class='ctx'> 	new = prepare_creds();</div><div class='ctx'> 	if (!new)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	new-&gt;fsuid = rqstp-&gt;rq_cred.cr_uid;</div><div class='del'>-	new-&gt;fsgid = rqstp-&gt;rq_cred.cr_gid;</div><div class='add'>+	new-&gt;fsuid = cred-&gt;cr_uid;</div><div class='add'>+	new-&gt;fsgid = cred-&gt;cr_gid;</div><div class='ctx'> </div><div class='del'>-	rqgi = rqstp-&gt;rq_cred.cr_group_info;</div><div class='add'>+	rqgi = cred-&gt;cr_group_info;</div><div class='ctx'> </div><div class='ctx'> 	if (flags &amp; NFSEXP_ALLSQUASH) {</div><div class='ctx'> 		new-&gt;fsuid = exp-&gt;ex_anon_uid;</div><div class='hunk'>@@ -81,10 +79,7 @@ int nfsd_setuser(struct svc_rqst *rqstp, struct svc_export *exp)</div><div class='ctx'> 	else</div><div class='ctx'> 		new-&gt;cap_effective = cap_raise_nfsd_set(new-&gt;cap_effective,</div><div class='ctx'> 							new-&gt;cap_permitted);</div><div class='del'>-	validate_process_creds();</div><div class='ctx'> 	put_cred(override_creds(new));</div><div class='del'>-	put_cred(new);</div><div class='del'>-	validate_process_creds();</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> oom:</div><div class='head'>diff --git a/fs/nfsd/auth.h b/fs/nfsd/auth.h<br/>index dbd66424f600..8c5031bbbcee 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/auth.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/auth.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/auth.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/auth.h</a></div><div class='hunk'>@@ -12,6 +12,6 @@</div><div class='ctx'>  * Set the current process's fsuid/fsgid etc to those of the NFS</div><div class='ctx'>  * client user</div><div class='ctx'>  */</div><div class='del'>-int nfsd_setuser(struct svc_rqst *, struct svc_export *);</div><div class='add'>+int nfsd_setuser(struct svc_cred *cred, struct svc_export *exp);</div><div class='ctx'> </div><div class='ctx'> #endif /* LINUX_NFSD_AUTH_H */</div><div class='head'>diff --git a/fs/nfsd/blocklayout.c b/fs/nfsd/blocklayout.c<br/>index e5c0982a381d..afa16d7a8013 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/blocklayout.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/blocklayout.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/blocklayout.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/blocklayout.c</a></div><div class='hunk'>@@ -4,7 +4,6 @@</div><div class='ctx'>  */</div><div class='ctx'> #include &lt;linux/exportfs.h&gt;</div><div class='ctx'> #include &lt;linux/iomap.h&gt;</div><div class='del'>-#include &lt;linux/genhd.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/pr.h&gt;</div><div class='ctx'> </div><div class='hunk'>@@ -13,67 +12,50 @@</div><div class='ctx'> #include "blocklayoutxdr.h"</div><div class='ctx'> #include "pnfs.h"</div><div class='ctx'> #include "filecache.h"</div><div class='add'>+#include "vfs.h"</div><div class='add'>+#include "trace.h"</div><div class='ctx'> </div><div class='ctx'> #define NFSDDBG_FACILITY	NFSDDBG_PNFS</div><div class='ctx'> </div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Get an extent from the file system that starts at offset or below</div><div class='add'>+ * and may be shorter than the requested length.</div><div class='add'>+ */</div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_block_proc_layoutget(struct inode *inode, const struct svc_fh *fhp,</div><div class='del'>-		struct nfsd4_layoutget *args)</div><div class='add'>+nfsd4_block_map_extent(struct inode *inode, const struct svc_fh *fhp,</div><div class='add'>+		u64 offset, u64 length, u32 iomode, u64 minlength,</div><div class='add'>+		struct pnfs_block_extent *bex)</div><div class='ctx'> {</div><div class='del'>-	struct nfsd4_layout_seg *seg = &amp;args-&gt;lg_seg;</div><div class='ctx'> 	struct super_block *sb = inode-&gt;i_sb;</div><div class='del'>-	u32 block_size = i_blocksize(inode);</div><div class='del'>-	struct pnfs_block_extent *bex;</div><div class='ctx'> 	struct iomap iomap;</div><div class='ctx'> 	u32 device_generation = 0;</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='del'>-	if (seg-&gt;offset &amp; (block_size - 1)) {</div><div class='del'>-		dprintk("pnfsd: I/O misaligned\n");</div><div class='del'>-		goto out_layoutunavailable;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Some clients barf on non-zero block numbers for NONE or INVALID</div><div class='del'>-	 * layouts, so make sure to zero the whole structure.</div><div class='del'>-	 */</div><div class='del'>-	error = -ENOMEM;</div><div class='del'>-	bex = kzalloc(sizeof(*bex), GFP_KERNEL);</div><div class='del'>-	if (!bex)</div><div class='del'>-		goto out_error;</div><div class='del'>-	args-&gt;lg_content = bex;</div><div class='del'>-</div><div class='del'>-	error = sb-&gt;s_export_op-&gt;map_blocks(inode, seg-&gt;offset, seg-&gt;length,</div><div class='del'>-					    &amp;iomap, seg-&gt;iomode != IOMODE_READ,</div><div class='del'>-					    &amp;device_generation);</div><div class='add'>+	error = sb-&gt;s_export_op-&gt;map_blocks(inode, offset, length, &amp;iomap,</div><div class='add'>+			iomode != IOMODE_READ, &amp;device_generation);</div><div class='ctx'> 	if (error) {</div><div class='ctx'> 		if (error == -ENXIO)</div><div class='del'>-			goto out_layoutunavailable;</div><div class='del'>-		goto out_error;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (iomap.length &lt; args-&gt;lg_minlength) {</div><div class='del'>-		dprintk("pnfsd: extent smaller than minlength\n");</div><div class='del'>-		goto out_layoutunavailable;</div><div class='add'>+			return nfserr_layoutunavailable;</div><div class='add'>+		return nfserrno(error);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	switch (iomap.type) {</div><div class='ctx'> 	case IOMAP_MAPPED:</div><div class='del'>-		if (seg-&gt;iomode == IOMODE_READ)</div><div class='add'>+		if (iomode == IOMODE_READ)</div><div class='ctx'> 			bex-&gt;es = PNFS_BLOCK_READ_DATA;</div><div class='ctx'> 		else</div><div class='ctx'> 			bex-&gt;es = PNFS_BLOCK_READWRITE_DATA;</div><div class='ctx'> 		bex-&gt;soff = iomap.addr;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case IOMAP_UNWRITTEN:</div><div class='del'>-		if (seg-&gt;iomode &amp; IOMODE_RW) {</div><div class='add'>+		if (iomode &amp; IOMODE_RW) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Crack monkey special case from section 2.3.1.</div><div class='ctx'> 			 */</div><div class='del'>-			if (args-&gt;lg_minlength == 0) {</div><div class='add'>+			if (minlength == 0) {</div><div class='ctx'> 				dprintk("pnfsd: no soup for you!\n");</div><div class='del'>-				goto out_layoutunavailable;</div><div class='add'>+				return nfserr_layoutunavailable;</div><div class='ctx'> 			}</div><div class='ctx'> </div><div class='ctx'> 			bex-&gt;es = PNFS_BLOCK_INVALID_DATA;</div><div class='hunk'>@@ -82,7 +64,7 @@ nfsd4_block_proc_layoutget(struct inode *inode, const struct svc_fh *fhp,</div><div class='ctx'> 		}</div><div class='ctx'> 		fallthrough;</div><div class='ctx'> 	case IOMAP_HOLE:</div><div class='del'>-		if (seg-&gt;iomode == IOMODE_READ) {</div><div class='add'>+		if (iomode == IOMODE_READ) {</div><div class='ctx'> 			bex-&gt;es = PNFS_BLOCK_NONE_DATA;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -90,46 +72,126 @@ nfsd4_block_proc_layoutget(struct inode *inode, const struct svc_fh *fhp,</div><div class='ctx'> 	case IOMAP_DELALLOC:</div><div class='ctx'> 	default:</div><div class='ctx'> 		WARN(1, "pnfsd: filesystem returned %d extent\n", iomap.type);</div><div class='del'>-		goto out_layoutunavailable;</div><div class='add'>+		return nfserr_layoutunavailable;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	error = nfsd4_set_deviceid(&amp;bex-&gt;vol_id, fhp, device_generation);</div><div class='ctx'> 	if (error)</div><div class='del'>-		goto out_error;</div><div class='add'>+		return nfserrno(error);</div><div class='add'>+</div><div class='ctx'> 	bex-&gt;foff = iomap.offset;</div><div class='ctx'> 	bex-&gt;len = iomap.length;</div><div class='add'>+	return nfs_ok;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	seg-&gt;offset = iomap.offset;</div><div class='del'>-	seg-&gt;length = iomap.length;</div><div class='add'>+static __be32</div><div class='add'>+nfsd4_block_proc_layoutget(struct svc_rqst *rqstp, struct inode *inode,</div><div class='add'>+		const struct svc_fh *fhp, struct nfsd4_layoutget *args)</div><div class='add'>+{</div><div class='add'>+	struct nfsd4_layout_seg *seg = &amp;args-&gt;lg_seg;</div><div class='add'>+	struct pnfs_block_layout *bl;</div><div class='add'>+	struct pnfs_block_extent *first_bex, *last_bex;</div><div class='add'>+	u64 offset = seg-&gt;offset, length = seg-&gt;length;</div><div class='add'>+	u32 i, nr_extents_max, block_size = i_blocksize(inode);</div><div class='add'>+	__be32 nfserr;</div><div class='ctx'> </div><div class='del'>-	dprintk("GET: 0x%llx:0x%llx %d\n", bex-&gt;foff, bex-&gt;len, bex-&gt;es);</div><div class='del'>-	return 0;</div><div class='add'>+	if (locks_in_grace(SVC_NET(rqstp)))</div><div class='add'>+		return nfserr_grace;</div><div class='add'>+</div><div class='add'>+	nfserr = nfserr_layoutunavailable;</div><div class='add'>+	if (seg-&gt;offset &amp; (block_size - 1)) {</div><div class='add'>+		dprintk("pnfsd: I/O misaligned\n");</div><div class='add'>+		goto out_error;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * RFC 8881, section 3.3.17:</div><div class='add'>+	 *   The layout4 data type defines a layout for a file.</div><div class='add'>+	 *</div><div class='add'>+	 * RFC 8881, section 18.43.3:</div><div class='add'>+	 *   The loga_maxcount field specifies the maximum layout size</div><div class='add'>+	 *   (in bytes) that the client can handle. If the size of the</div><div class='add'>+	 *   layout structure exceeds the size specified by maxcount,</div><div class='add'>+	 *   the metadata server will return the NFS4ERR_TOOSMALL error.</div><div class='add'>+	 */</div><div class='add'>+	nfserr = nfserr_toosmall;</div><div class='add'>+	if (args-&gt;lg_maxcount &lt; PNFS_BLOCK_LAYOUT4_SIZE +</div><div class='add'>+				PNFS_BLOCK_EXTENT_SIZE)</div><div class='add'>+		goto out_error;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Limit the maximum layout size to avoid allocating</div><div class='add'>+	 * a large buffer on the server for each layout request.</div><div class='add'>+	 */</div><div class='add'>+	nr_extents_max = (min(args-&gt;lg_maxcount, PAGE_SIZE) -</div><div class='add'>+			  PNFS_BLOCK_LAYOUT4_SIZE) / PNFS_BLOCK_EXTENT_SIZE;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Some clients barf on non-zero block numbers for NONE or INVALID</div><div class='add'>+	 * layouts, so make sure to zero the whole structure.</div><div class='add'>+	 */</div><div class='add'>+	nfserr = nfserrno(-ENOMEM);</div><div class='add'>+	bl = kzalloc(struct_size(bl, extents, nr_extents_max), GFP_KERNEL);</div><div class='add'>+	if (!bl)</div><div class='add'>+		goto out_error;</div><div class='add'>+	bl-&gt;nr_extents = nr_extents_max;</div><div class='add'>+	args-&gt;lg_content = bl;</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; bl-&gt;nr_extents; i++) {</div><div class='add'>+		struct pnfs_block_extent *bex = bl-&gt;extents + i;</div><div class='add'>+		u64 bex_length;</div><div class='add'>+</div><div class='add'>+		nfserr = nfsd4_block_map_extent(inode, fhp, offset, length,</div><div class='add'>+				seg-&gt;iomode, args-&gt;lg_minlength, bex);</div><div class='add'>+		if (nfserr != nfs_ok)</div><div class='add'>+			goto out_error;</div><div class='add'>+</div><div class='add'>+		bex_length = bex-&gt;len - (offset - bex-&gt;foff);</div><div class='add'>+		if (bex_length &gt;= length) {</div><div class='add'>+			bl-&gt;nr_extents = i + 1;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		offset = bex-&gt;foff + bex-&gt;len;</div><div class='add'>+		length -= bex_length;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	first_bex = bl-&gt;extents;</div><div class='add'>+	last_bex = bl-&gt;extents + bl-&gt;nr_extents - 1;</div><div class='add'>+</div><div class='add'>+	nfserr = nfserr_layoutunavailable;</div><div class='add'>+	length = last_bex-&gt;foff + last_bex-&gt;len - seg-&gt;offset;</div><div class='add'>+	if (length &lt; args-&gt;lg_minlength) {</div><div class='add'>+		dprintk("pnfsd: extent smaller than minlength\n");</div><div class='add'>+		goto out_error;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	seg-&gt;offset = first_bex-&gt;foff;</div><div class='add'>+	seg-&gt;length = last_bex-&gt;foff - first_bex-&gt;foff + last_bex-&gt;len;</div><div class='add'>+	return nfs_ok;</div><div class='ctx'> </div><div class='ctx'> out_error:</div><div class='ctx'> 	seg-&gt;length = 0;</div><div class='del'>-	return nfserrno(error);</div><div class='del'>-out_layoutunavailable:</div><div class='del'>-	seg-&gt;length = 0;</div><div class='del'>-	return nfserr_layoutunavailable;</div><div class='add'>+	return nfserr;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_block_commit_blocks(struct inode *inode, struct nfsd4_layoutcommit *lcp,</div><div class='ctx'> 		struct iomap *iomaps, int nr_iomaps)</div><div class='ctx'> {</div><div class='del'>-	loff_t new_size = lcp-&gt;lc_last_wr + 1;</div><div class='add'>+	struct timespec64 mtime = inode_get_mtime(inode);</div><div class='ctx'> 	struct iattr iattr = { .ia_valid = 0 };</div><div class='ctx'> 	int error;</div><div class='ctx'> </div><div class='ctx'> 	if (lcp-&gt;lc_mtime.tv_nsec == UTIME_NOW ||</div><div class='del'>-	    timespec64_compare(&amp;lcp-&gt;lc_mtime, &amp;inode-&gt;i_mtime) &lt; 0)</div><div class='add'>+	    timespec64_compare(&amp;lcp-&gt;lc_mtime, &amp;mtime) &lt; 0)</div><div class='ctx'> 		lcp-&gt;lc_mtime = current_time(inode);</div><div class='ctx'> 	iattr.ia_valid |= ATTR_ATIME | ATTR_CTIME | ATTR_MTIME;</div><div class='ctx'> 	iattr.ia_atime = iattr.ia_ctime = iattr.ia_mtime = lcp-&gt;lc_mtime;</div><div class='ctx'> </div><div class='del'>-	if (new_size &gt; i_size_read(inode)) {</div><div class='add'>+	if (lcp-&gt;lc_size_chg) {</div><div class='ctx'> 		iattr.ia_valid |= ATTR_SIZE;</div><div class='del'>-		iattr.ia_size = new_size;</div><div class='add'>+		iattr.ia_size = lcp-&gt;lc_newsize;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	error = inode-&gt;i_sb-&gt;s_export_op-&gt;commit_blocks(inode, iomaps,</div><div class='hunk'>@@ -146,8 +208,7 @@ nfsd4_block_get_device_info_simple(struct super_block *sb,</div><div class='ctx'> 	struct pnfs_block_deviceaddr *dev;</div><div class='ctx'> 	struct pnfs_block_volume *b;</div><div class='ctx'> </div><div class='del'>-	dev = kzalloc(sizeof(struct pnfs_block_deviceaddr) +</div><div class='del'>-		      sizeof(struct pnfs_block_volume), GFP_KERNEL);</div><div class='add'>+	dev = kzalloc(struct_size(dev, volumes, 1), GFP_KERNEL);</div><div class='ctx'> 	if (!dev)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	gdp-&gt;gd_device = dev;</div><div class='hunk'>@@ -173,16 +234,20 @@ nfsd4_block_proc_getdeviceinfo(struct super_block *sb,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_block_proc_layoutcommit(struct inode *inode,</div><div class='add'>+nfsd4_block_proc_layoutcommit(struct inode *inode, struct svc_rqst *rqstp,</div><div class='ctx'> 		struct nfsd4_layoutcommit *lcp)</div><div class='ctx'> {</div><div class='ctx'> 	struct iomap *iomaps;</div><div class='ctx'> 	int nr_iomaps;</div><div class='add'>+	__be32 nfserr;</div><div class='add'>+</div><div class='add'>+	rqstp-&gt;rq_arg = lcp-&gt;lc_up_layout;</div><div class='add'>+	svcxdr_init_decode(rqstp);</div><div class='ctx'> </div><div class='del'>-	nr_iomaps = nfsd4_block_decode_layoutupdate(lcp-&gt;lc_up_layout,</div><div class='del'>-			lcp-&gt;lc_up_len, &amp;iomaps, i_blocksize(inode));</div><div class='del'>-	if (nr_iomaps &lt; 0)</div><div class='del'>-		return nfserrno(nr_iomaps);</div><div class='add'>+	nfserr = nfsd4_block_decode_layoutupdate(&amp;rqstp-&gt;rq_arg_stream,</div><div class='add'>+			&amp;iomaps, &amp;nr_iomaps, i_blocksize(inode));</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='ctx'> </div><div class='ctx'> 	return nfsd4_block_commit_blocks(inode, lcp, iomaps, nr_iomaps);</div><div class='ctx'> }</div><div class='hunk'>@@ -254,8 +319,7 @@ nfsd4_block_get_device_info_scsi(struct super_block *sb,</div><div class='ctx'> 	const struct pr_ops *ops;</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	dev = kzalloc(sizeof(struct pnfs_block_deviceaddr) +</div><div class='del'>-		      sizeof(struct pnfs_block_volume), GFP_KERNEL);</div><div class='add'>+	dev = kzalloc(struct_size(dev, volumes, 1), GFP_KERNEL);</div><div class='ctx'> 	if (!dev)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	gdp-&gt;gd_device = dev;</div><div class='hunk'>@@ -297,6 +361,7 @@ nfsd4_block_get_device_info_scsi(struct super_block *sb,</div><div class='ctx'> </div><div class='ctx'> out_free_dev:</div><div class='ctx'> 	kfree(dev);</div><div class='add'>+	gdp-&gt;gd_device = NULL;</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -311,28 +376,35 @@ nfsd4_scsi_proc_getdeviceinfo(struct super_block *sb,</div><div class='ctx'> 	return nfserrno(nfsd4_block_get_device_info_scsi(sb, clp, gdp));</div><div class='ctx'> }</div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_scsi_proc_layoutcommit(struct inode *inode,</div><div class='add'>+nfsd4_scsi_proc_layoutcommit(struct inode *inode, struct svc_rqst *rqstp,</div><div class='ctx'> 		struct nfsd4_layoutcommit *lcp)</div><div class='ctx'> {</div><div class='ctx'> 	struct iomap *iomaps;</div><div class='ctx'> 	int nr_iomaps;</div><div class='add'>+	__be32 nfserr;</div><div class='add'>+</div><div class='add'>+	rqstp-&gt;rq_arg = lcp-&gt;lc_up_layout;</div><div class='add'>+	svcxdr_init_decode(rqstp);</div><div class='ctx'> </div><div class='del'>-	nr_iomaps = nfsd4_scsi_decode_layoutupdate(lcp-&gt;lc_up_layout,</div><div class='del'>-			lcp-&gt;lc_up_len, &amp;iomaps, i_blocksize(inode));</div><div class='del'>-	if (nr_iomaps &lt; 0)</div><div class='del'>-		return nfserrno(nr_iomaps);</div><div class='add'>+	nfserr = nfsd4_scsi_decode_layoutupdate(&amp;rqstp-&gt;rq_arg_stream,</div><div class='add'>+			&amp;iomaps, &amp;nr_iomaps, i_blocksize(inode));</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='ctx'> </div><div class='ctx'> 	return nfsd4_block_commit_blocks(inode, lcp, iomaps, nr_iomaps);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='del'>-nfsd4_scsi_fence_client(struct nfs4_layout_stateid *ls)</div><div class='add'>+nfsd4_scsi_fence_client(struct nfs4_layout_stateid *ls, struct nfsd_file *file)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_client *clp = ls-&gt;ls_stid.sc_client;</div><div class='del'>-	struct block_device *bdev = ls-&gt;ls_file-&gt;nf_file-&gt;f_path.mnt-&gt;mnt_sb-&gt;s_bdev;</div><div class='add'>+	struct block_device *bdev = file-&gt;nf_file-&gt;f_path.mnt-&gt;mnt_sb-&gt;s_bdev;</div><div class='add'>+	int status;</div><div class='ctx'> </div><div class='del'>-	bdev-&gt;bd_disk-&gt;fops-&gt;pr_ops-&gt;pr_preempt(bdev, NFSD_MDS_PR_KEY,</div><div class='del'>-			nfsd4_scsi_pr_key(clp), 0, true);</div><div class='add'>+	status = bdev-&gt;bd_disk-&gt;fops-&gt;pr_ops-&gt;pr_preempt(bdev, NFSD_MDS_PR_KEY,</div><div class='add'>+			nfsd4_scsi_pr_key(clp),</div><div class='add'>+			PR_EXCLUSIVE_ACCESS_REG_ONLY, true);</div><div class='add'>+	trace_nfsd_pnfs_fence(clp, bdev-&gt;bd_disk-&gt;disk_name, status);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> const struct nfsd4_layout_ops scsi_layout_ops = {</div><div class='head'>diff --git a/fs/nfsd/blocklayoutxdr.c b/fs/nfsd/blocklayoutxdr.c<br/>index 442543304930..196ef4245604 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/blocklayoutxdr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/blocklayoutxdr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/blocklayoutxdr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/blocklayoutxdr.c</a></div><div class='hunk'>@@ -9,16 +9,30 @@</div><div class='ctx'> </div><div class='ctx'> #include "nfsd.h"</div><div class='ctx'> #include "blocklayoutxdr.h"</div><div class='add'>+#include "vfs.h"</div><div class='ctx'> </div><div class='ctx'> #define NFSDDBG_FACILITY	NFSDDBG_PNFS</div><div class='ctx'> </div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * nfsd4_block_encode_layoutget - encode block/scsi layout extent array</div><div class='add'>+ * @xdr: stream for data encoding</div><div class='add'>+ * @lgp: layoutget content, actually an array of extents to encode</div><div class='add'>+ *</div><div class='add'>+ * Encode the opaque loc_body field in the layoutget response. Since the</div><div class='add'>+ * pnfs_block_layout4 and pnfs_scsi_layout4 structures on the wire are</div><div class='add'>+ * the same, this function is used by both layout drivers.</div><div class='add'>+ *</div><div class='add'>+ * Return values:</div><div class='add'>+ *   %nfs_ok: Success, all extents encoded into @xdr</div><div class='add'>+ *   %nfserr_toosmall: Not enough space in @xdr to encode all the data</div><div class='add'>+ */</div><div class='ctx'> __be32</div><div class='ctx'> nfsd4_block_encode_layoutget(struct xdr_stream *xdr,</div><div class='del'>-		struct nfsd4_layoutget *lgp)</div><div class='add'>+		const struct nfsd4_layoutget *lgp)</div><div class='ctx'> {</div><div class='del'>-	struct pnfs_block_extent *b = lgp-&gt;lg_content;</div><div class='del'>-	int len = sizeof(__be32) + 5 * sizeof(__be64) + sizeof(__be32);</div><div class='add'>+	const struct pnfs_block_layout *bl = lgp-&gt;lg_content;</div><div class='add'>+	u32 i, len = sizeof(__be32) + bl-&gt;nr_extents * PNFS_BLOCK_EXTENT_SIZE;</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> </div><div class='ctx'> 	p = xdr_reserve_space(xdr, sizeof(__be32) + len);</div><div class='hunk'>@@ -26,15 +40,19 @@ nfsd4_block_encode_layoutget(struct xdr_stream *xdr,</div><div class='ctx'> 		return nfserr_toosmall;</div><div class='ctx'> </div><div class='ctx'> 	*p++ = cpu_to_be32(len);</div><div class='del'>-	*p++ = cpu_to_be32(1);		/* we always return a single extent */</div><div class='del'>-</div><div class='del'>-	p = xdr_encode_opaque_fixed(p, &amp;b-&gt;vol_id,</div><div class='del'>-			sizeof(struct nfsd4_deviceid));</div><div class='del'>-	p = xdr_encode_hyper(p, b-&gt;foff);</div><div class='del'>-	p = xdr_encode_hyper(p, b-&gt;len);</div><div class='del'>-	p = xdr_encode_hyper(p, b-&gt;soff);</div><div class='del'>-	*p++ = cpu_to_be32(b-&gt;es);</div><div class='del'>-	return 0;</div><div class='add'>+	*p++ = cpu_to_be32(bl-&gt;nr_extents);</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; bl-&gt;nr_extents; i++) {</div><div class='add'>+		const struct pnfs_block_extent *bex = bl-&gt;extents + i;</div><div class='add'>+</div><div class='add'>+		p = svcxdr_encode_deviceid4(p, &amp;bex-&gt;vol_id);</div><div class='add'>+		p = xdr_encode_hyper(p, bex-&gt;foff);</div><div class='add'>+		p = xdr_encode_hyper(p, bex-&gt;len);</div><div class='add'>+		p = xdr_encode_hyper(p, bex-&gt;soff);</div><div class='add'>+		*p++ = cpu_to_be32(bex-&gt;es);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='hunk'>@@ -76,12 +94,21 @@ nfsd4_block_encode_volume(struct xdr_stream *xdr, struct pnfs_block_volume *b)</div><div class='ctx'> </div><div class='ctx'> __be32</div><div class='ctx'> nfsd4_block_encode_getdeviceinfo(struct xdr_stream *xdr,</div><div class='del'>-		struct nfsd4_getdeviceinfo *gdp)</div><div class='add'>+		const struct nfsd4_getdeviceinfo *gdp)</div><div class='ctx'> {</div><div class='ctx'> 	struct pnfs_block_deviceaddr *dev = gdp-&gt;gd_device;</div><div class='ctx'> 	int len = sizeof(__be32), ret, i;</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * See paragraph 5 of RFC 8881 S18.40.3.</div><div class='add'>+	 */</div><div class='add'>+	if (!gdp-&gt;gd_maxcount) {</div><div class='add'>+		if (xdr_stream_encode_u32(xdr, 0) != XDR_UNIT)</div><div class='add'>+			return nfserr_resource;</div><div class='add'>+		return nfs_ok;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	p = xdr_reserve_space(xdr, len + sizeof(__be32));</div><div class='ctx'> 	if (!p)</div><div class='ctx'> 		return nfserr_resource;</div><div class='hunk'>@@ -102,64 +129,86 @@ nfsd4_block_encode_getdeviceinfo(struct xdr_stream *xdr,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int</div><div class='del'>-nfsd4_block_decode_layoutupdate(__be32 *p, u32 len, struct iomap **iomapp,</div><div class='del'>-		u32 block_size)</div><div class='add'>+/**</div><div class='add'>+ * nfsd4_block_decode_layoutupdate - decode the block layout extent array</div><div class='add'>+ * @xdr: subbuf set to the encoded array</div><div class='add'>+ * @iomapp: pointer to store the decoded extent array</div><div class='add'>+ * @nr_iomapsp: pointer to store the number of extents</div><div class='add'>+ * @block_size: alignment of extent offset and length</div><div class='add'>+ *</div><div class='add'>+ * This function decodes the opaque field of the layoutupdate4 structure</div><div class='add'>+ * in a layoutcommit request for the block layout driver. The field is</div><div class='add'>+ * actually an array of extents sent by the client. It also checks that</div><div class='add'>+ * the file offset, storage offset and length of each extent are aligned</div><div class='add'>+ * by @block_size.</div><div class='add'>+ *</div><div class='add'>+ * Return values:</div><div class='add'>+ *   %nfs_ok: Successful decoding, @iomapp and @nr_iomapsp are valid</div><div class='add'>+ *   %nfserr_bad_xdr: The encoded array in @xdr is invalid</div><div class='add'>+ *   %nfserr_inval: An unaligned extent found</div><div class='add'>+ *   %nfserr_delay: Failed to allocate memory for @iomapp</div><div class='add'>+ */</div><div class='add'>+__be32</div><div class='add'>+nfsd4_block_decode_layoutupdate(struct xdr_stream *xdr, struct iomap **iomapp,</div><div class='add'>+		int *nr_iomapsp, u32 block_size)</div><div class='ctx'> {</div><div class='ctx'> 	struct iomap *iomaps;</div><div class='del'>-	u32 nr_iomaps, i;</div><div class='add'>+	u32 nr_iomaps, expected, len, i;</div><div class='add'>+	__be32 nfserr;</div><div class='ctx'> </div><div class='del'>-	if (len &lt; sizeof(u32)) {</div><div class='del'>-		dprintk("%s: extent array too small: %u\n", __func__, len);</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='del'>-	len -= sizeof(u32);</div><div class='del'>-	if (len % PNFS_BLOCK_EXTENT_SIZE) {</div><div class='del'>-		dprintk("%s: extent array invalid: %u\n", __func__, len);</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='add'>+	if (xdr_stream_decode_u32(xdr, &amp;nr_iomaps))</div><div class='add'>+		return nfserr_bad_xdr;</div><div class='ctx'> </div><div class='del'>-	nr_iomaps = be32_to_cpup(p++);</div><div class='del'>-	if (nr_iomaps != len / PNFS_BLOCK_EXTENT_SIZE) {</div><div class='del'>-		dprintk("%s: extent array size mismatch: %u/%u\n",</div><div class='del'>-			__func__, len, nr_iomaps);</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='add'>+	len = sizeof(__be32) + xdr_stream_remaining(xdr);</div><div class='add'>+	expected = sizeof(__be32) + nr_iomaps * PNFS_BLOCK_EXTENT_SIZE;</div><div class='add'>+	if (len != expected)</div><div class='add'>+		return nfserr_bad_xdr;</div><div class='ctx'> </div><div class='ctx'> 	iomaps = kcalloc(nr_iomaps, sizeof(*iomaps), GFP_KERNEL);</div><div class='del'>-	if (!iomaps) {</div><div class='del'>-		dprintk("%s: failed to allocate extent array\n", __func__);</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	}</div><div class='add'>+	if (!iomaps)</div><div class='add'>+		return nfserr_delay;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; nr_iomaps; i++) {</div><div class='ctx'> 		struct pnfs_block_extent bex;</div><div class='ctx'> </div><div class='del'>-		memcpy(&amp;bex.vol_id, p, sizeof(struct nfsd4_deviceid));</div><div class='del'>-		p += XDR_QUADLEN(sizeof(struct nfsd4_deviceid));</div><div class='add'>+		if (nfsd4_decode_deviceid4(xdr, &amp;bex.vol_id)) {</div><div class='add'>+			nfserr = nfserr_bad_xdr;</div><div class='add'>+			goto fail;</div><div class='add'>+		}</div><div class='ctx'> </div><div class='del'>-		p = xdr_decode_hyper(p, &amp;bex.foff);</div><div class='add'>+		if (xdr_stream_decode_u64(xdr, &amp;bex.foff)) {</div><div class='add'>+			nfserr = nfserr_bad_xdr;</div><div class='add'>+			goto fail;</div><div class='add'>+		}</div><div class='ctx'> 		if (bex.foff &amp; (block_size - 1)) {</div><div class='del'>-			dprintk("%s: unaligned offset 0x%llx\n",</div><div class='del'>-				__func__, bex.foff);</div><div class='add'>+			nfserr = nfserr_inval;</div><div class='add'>+			goto fail;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (xdr_stream_decode_u64(xdr, &amp;bex.len)) {</div><div class='add'>+			nfserr = nfserr_bad_xdr;</div><div class='ctx'> 			goto fail;</div><div class='ctx'> 		}</div><div class='del'>-		p = xdr_decode_hyper(p, &amp;bex.len);</div><div class='ctx'> 		if (bex.len &amp; (block_size - 1)) {</div><div class='del'>-			dprintk("%s: unaligned length 0x%llx\n",</div><div class='del'>-				__func__, bex.foff);</div><div class='add'>+			nfserr = nfserr_inval;</div><div class='add'>+			goto fail;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (xdr_stream_decode_u64(xdr, &amp;bex.soff)) {</div><div class='add'>+			nfserr = nfserr_bad_xdr;</div><div class='ctx'> 			goto fail;</div><div class='ctx'> 		}</div><div class='del'>-		p = xdr_decode_hyper(p, &amp;bex.soff);</div><div class='ctx'> 		if (bex.soff &amp; (block_size - 1)) {</div><div class='del'>-			dprintk("%s: unaligned disk offset 0x%llx\n",</div><div class='del'>-				__func__, bex.soff);</div><div class='add'>+			nfserr = nfserr_inval;</div><div class='add'>+			goto fail;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (xdr_stream_decode_u32(xdr, &amp;bex.es)) {</div><div class='add'>+			nfserr = nfserr_bad_xdr;</div><div class='ctx'> 			goto fail;</div><div class='ctx'> 		}</div><div class='del'>-		bex.es = be32_to_cpup(p++);</div><div class='ctx'> 		if (bex.es != PNFS_BLOCK_READWRITE_DATA) {</div><div class='del'>-			dprintk("%s: incorrect extent state %d\n",</div><div class='del'>-				__func__, bex.es);</div><div class='add'>+			nfserr = nfserr_inval;</div><div class='ctx'> 			goto fail;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='hunk'>@@ -168,59 +217,79 @@ nfsd4_block_decode_layoutupdate(__be32 *p, u32 len, struct iomap **iomapp,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	*iomapp = iomaps;</div><div class='del'>-	return nr_iomaps;</div><div class='add'>+	*nr_iomapsp = nr_iomaps;</div><div class='add'>+	return nfs_ok;</div><div class='ctx'> fail:</div><div class='ctx'> 	kfree(iomaps);</div><div class='del'>-	return -EINVAL;</div><div class='add'>+	return nfserr;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-int</div><div class='del'>-nfsd4_scsi_decode_layoutupdate(__be32 *p, u32 len, struct iomap **iomapp,</div><div class='del'>-		u32 block_size)</div><div class='add'>+/**</div><div class='add'>+ * nfsd4_scsi_decode_layoutupdate - decode the scsi layout extent array</div><div class='add'>+ * @xdr: subbuf set to the encoded array</div><div class='add'>+ * @iomapp: pointer to store the decoded extent array</div><div class='add'>+ * @nr_iomapsp: pointer to store the number of extents</div><div class='add'>+ * @block_size: alignment of extent offset and length</div><div class='add'>+ *</div><div class='add'>+ * This function decodes the opaque field of the layoutupdate4 structure</div><div class='add'>+ * in a layoutcommit request for the scsi layout driver. The field is</div><div class='add'>+ * actually an array of extents sent by the client. It also checks that</div><div class='add'>+ * the offset and length of each extent are aligned by @block_size.</div><div class='add'>+ *</div><div class='add'>+ * Return values:</div><div class='add'>+ *   %nfs_ok: Successful decoding, @iomapp and @nr_iomapsp are valid</div><div class='add'>+ *   %nfserr_bad_xdr: The encoded array in @xdr is invalid</div><div class='add'>+ *   %nfserr_inval: An unaligned extent found</div><div class='add'>+ *   %nfserr_delay: Failed to allocate memory for @iomapp</div><div class='add'>+ */</div><div class='add'>+__be32</div><div class='add'>+nfsd4_scsi_decode_layoutupdate(struct xdr_stream *xdr, struct iomap **iomapp,</div><div class='add'>+		int *nr_iomapsp, u32 block_size)</div><div class='ctx'> {</div><div class='ctx'> 	struct iomap *iomaps;</div><div class='del'>-	u32 nr_iomaps, expected, i;</div><div class='add'>+	u32 nr_iomaps, expected, len, i;</div><div class='add'>+	__be32 nfserr;</div><div class='ctx'> </div><div class='del'>-	if (len &lt; sizeof(u32)) {</div><div class='del'>-		dprintk("%s: extent array too small: %u\n", __func__, len);</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='add'>+	if (xdr_stream_decode_u32(xdr, &amp;nr_iomaps))</div><div class='add'>+		return nfserr_bad_xdr;</div><div class='ctx'> </div><div class='del'>-	nr_iomaps = be32_to_cpup(p++);</div><div class='add'>+	len = sizeof(__be32) + xdr_stream_remaining(xdr);</div><div class='ctx'> 	expected = sizeof(__be32) + nr_iomaps * PNFS_SCSI_RANGE_SIZE;</div><div class='del'>-	if (len != expected) {</div><div class='del'>-		dprintk("%s: extent array size mismatch: %u/%u\n",</div><div class='del'>-			__func__, len, expected);</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='add'>+	if (len != expected)</div><div class='add'>+		return nfserr_bad_xdr;</div><div class='ctx'> </div><div class='ctx'> 	iomaps = kcalloc(nr_iomaps, sizeof(*iomaps), GFP_KERNEL);</div><div class='del'>-	if (!iomaps) {</div><div class='del'>-		dprintk("%s: failed to allocate extent array\n", __func__);</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	}</div><div class='add'>+	if (!iomaps)</div><div class='add'>+		return nfserr_delay;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; nr_iomaps; i++) {</div><div class='ctx'> 		u64 val;</div><div class='ctx'> </div><div class='del'>-		p = xdr_decode_hyper(p, &amp;val);</div><div class='add'>+		if (xdr_stream_decode_u64(xdr, &amp;val)) {</div><div class='add'>+			nfserr = nfserr_bad_xdr;</div><div class='add'>+			goto fail;</div><div class='add'>+		}</div><div class='ctx'> 		if (val &amp; (block_size - 1)) {</div><div class='del'>-			dprintk("%s: unaligned offset 0x%llx\n", __func__, val);</div><div class='add'>+			nfserr = nfserr_inval;</div><div class='ctx'> 			goto fail;</div><div class='ctx'> 		}</div><div class='ctx'> 		iomaps[i].offset = val;</div><div class='ctx'> </div><div class='del'>-		p = xdr_decode_hyper(p, &amp;val);</div><div class='add'>+		if (xdr_stream_decode_u64(xdr, &amp;val)) {</div><div class='add'>+			nfserr = nfserr_bad_xdr;</div><div class='add'>+			goto fail;</div><div class='add'>+		}</div><div class='ctx'> 		if (val &amp; (block_size - 1)) {</div><div class='del'>-			dprintk("%s: unaligned length 0x%llx\n", __func__, val);</div><div class='add'>+			nfserr = nfserr_inval;</div><div class='ctx'> 			goto fail;</div><div class='ctx'> 		}</div><div class='ctx'> 		iomaps[i].length = val;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	*iomapp = iomaps;</div><div class='del'>-	return nr_iomaps;</div><div class='add'>+	*nr_iomapsp = nr_iomaps;</div><div class='add'>+	return nfs_ok;</div><div class='ctx'> fail:</div><div class='ctx'> 	kfree(iomaps);</div><div class='del'>-	return -EINVAL;</div><div class='add'>+	return nfserr;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/nfsd/blocklayoutxdr.h b/fs/nfsd/blocklayoutxdr.h<br/>index bc5166bfe46b..2e0c6c7d2b42 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/blocklayoutxdr.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/blocklayoutxdr.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/blocklayoutxdr.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/blocklayoutxdr.h</a></div><div class='hunk'>@@ -8,6 +8,15 @@</div><div class='ctx'> struct iomap;</div><div class='ctx'> struct xdr_stream;</div><div class='ctx'> </div><div class='add'>+/* On the wire size of the layout4 struct with zero number of extents */</div><div class='add'>+#define PNFS_BLOCK_LAYOUT4_SIZE \</div><div class='add'>+	(sizeof(__be32) * 2 +	/* offset4 */ \</div><div class='add'>+	 sizeof(__be32) * 2 +	/* length4 */ \</div><div class='add'>+	 sizeof(__be32) +	/* layoutiomode4 */ \</div><div class='add'>+	 sizeof(__be32) +	/* layouttype4 */ \</div><div class='add'>+	 sizeof(__be32) +	/* number of bytes */ \</div><div class='add'>+	 sizeof(__be32))	/* number of extents */</div><div class='add'>+</div><div class='ctx'> struct pnfs_block_extent {</div><div class='ctx'> 	struct nfsd4_deviceid		vol_id;</div><div class='ctx'> 	u64				foff;</div><div class='hunk'>@@ -21,6 +30,11 @@ struct pnfs_block_range {</div><div class='ctx'> 	u64				len;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+struct pnfs_block_layout {</div><div class='add'>+	u32				nr_extents;</div><div class='add'>+	struct pnfs_block_extent	extents[] __counted_by(nr_extents);</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Random upper cap for the uuid length to avoid unbounded allocation.</div><div class='ctx'>  * Not actually limited by the protocol.</div><div class='hunk'>@@ -47,16 +61,16 @@ struct pnfs_block_volume {</div><div class='ctx'> </div><div class='ctx'> struct pnfs_block_deviceaddr {</div><div class='ctx'> 	u32				nr_volumes;</div><div class='del'>-	struct pnfs_block_volume	volumes[];</div><div class='add'>+	struct pnfs_block_volume	volumes[] __counted_by(nr_volumes);</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> __be32 nfsd4_block_encode_getdeviceinfo(struct xdr_stream *xdr,</div><div class='del'>-		struct nfsd4_getdeviceinfo *gdp);</div><div class='add'>+		const struct nfsd4_getdeviceinfo *gdp);</div><div class='ctx'> __be32 nfsd4_block_encode_layoutget(struct xdr_stream *xdr,</div><div class='del'>-		struct nfsd4_layoutget *lgp);</div><div class='del'>-int nfsd4_block_decode_layoutupdate(__be32 *p, u32 len, struct iomap **iomapp,</div><div class='del'>-		u32 block_size);</div><div class='del'>-int nfsd4_scsi_decode_layoutupdate(__be32 *p, u32 len, struct iomap **iomapp,</div><div class='del'>-		u32 block_size);</div><div class='add'>+		const struct nfsd4_layoutget *lgp);</div><div class='add'>+__be32 nfsd4_block_decode_layoutupdate(struct xdr_stream *xdr,</div><div class='add'>+		struct iomap **iomapp, int *nr_iomapsp, u32 block_size);</div><div class='add'>+__be32 nfsd4_scsi_decode_layoutupdate(struct xdr_stream *xdr,</div><div class='add'>+		struct iomap **iomapp, int *nr_iomapsp, u32 block_size);</div><div class='ctx'> </div><div class='ctx'> #endif /* _NFSD_BLOCKLAYOUTXDR_H */</div><div class='head'>diff --git a/fs/nfsd/cache.h b/fs/nfsd/cache.h<br/>index 65c331f75e9c..bb7addef4a31 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/cache.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/cache.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/cache.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/cache.h</a></div><div class='hunk'>@@ -10,7 +10,7 @@</div><div class='ctx'> #define NFSCACHE_H</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/sunrpc/svc.h&gt;</div><div class='del'>-#include "netns.h"</div><div class='add'>+#include "nfsd.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Representation of a reply cache entry.</div><div class='hunk'>@@ -19,7 +19,7 @@</div><div class='ctx'>  * typical sockaddr_storage. This is for space reasons, since sockaddr_storage</div><div class='ctx'>  * is much larger than a sockaddr_in6.</div><div class='ctx'>  */</div><div class='del'>-struct svc_cacherep {</div><div class='add'>+struct nfsd_cacherep {</div><div class='ctx'> 	struct {</div><div class='ctx'> 		/* Keep often-read xid, csum in the same cache line: */</div><div class='ctx'> 		__be32			k_xid;</div><div class='hunk'>@@ -82,8 +82,10 @@ int	nfsd_drc_slab_create(void);</div><div class='ctx'> void	nfsd_drc_slab_free(void);</div><div class='ctx'> int	nfsd_reply_cache_init(struct nfsd_net *);</div><div class='ctx'> void	nfsd_reply_cache_shutdown(struct nfsd_net *);</div><div class='del'>-int	nfsd_cache_lookup(struct svc_rqst *);</div><div class='del'>-void	nfsd_cache_update(struct svc_rqst *, int, __be32 *);</div><div class='del'>-int	nfsd_reply_cache_stats_open(struct inode *, struct file *);</div><div class='add'>+int	nfsd_cache_lookup(struct svc_rqst *rqstp, unsigned int start,</div><div class='add'>+			  unsigned int len, struct nfsd_cacherep **cacherep);</div><div class='add'>+void	nfsd_cache_update(struct svc_rqst *rqstp, struct nfsd_cacherep *rp,</div><div class='add'>+			  int cachetype, __be32 *statp);</div><div class='add'>+int	nfsd_reply_cache_stats_show(struct seq_file *m, void *v);</div><div class='ctx'> </div><div class='ctx'> #endif /* NFSCACHE_H */</div><div class='head'>diff --git a/fs/nfsd/debugfs.c b/fs/nfsd/debugfs.c<br/>new file mode 100644<br/>index 000000000000..7f44689e0a53<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/debugfs.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/debugfs.c</a></div><div class='hunk'>@@ -0,0 +1,143 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+</div><div class='add'>+#include &lt;linux/debugfs.h&gt;</div><div class='add'>+</div><div class='add'>+#include "nfsd.h"</div><div class='add'>+</div><div class='add'>+static struct dentry *nfsd_top_dir __read_mostly;</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * /sys/kernel/debug/nfsd/disable-splice-read</div><div class='add'>+ *</div><div class='add'>+ * Contents:</div><div class='add'>+ *   %0: NFS READ is allowed to use page splicing</div><div class='add'>+ *   %1: NFS READ uses only iov iter read</div><div class='add'>+ *</div><div class='add'>+ * The default value of this setting is zero (page splicing is</div><div class='add'>+ * allowed). This setting takes immediate effect for all NFS</div><div class='add'>+ * versions, all exports, and in all NFSD net namespaces.</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+static int nfsd_dsr_get(void *data, u64 *val)</div><div class='add'>+{</div><div class='add'>+	*val = nfsd_disable_splice_read ? 1 : 0;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int nfsd_dsr_set(void *data, u64 val)</div><div class='add'>+{</div><div class='add'>+	nfsd_disable_splice_read = (val &gt; 0);</div><div class='add'>+	if (!nfsd_disable_splice_read) {</div><div class='add'>+		/*</div><div class='add'>+		 * Must use buffered I/O if splice_read is enabled.</div><div class='add'>+		 */</div><div class='add'>+		nfsd_io_cache_read = NFSD_IO_BUFFERED;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+DEFINE_DEBUGFS_ATTRIBUTE(nfsd_dsr_fops, nfsd_dsr_get, nfsd_dsr_set, "%llu\n");</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * /sys/kernel/debug/nfsd/io_cache_read</div><div class='add'>+ *</div><div class='add'>+ * Contents:</div><div class='add'>+ *   %0: NFS READ will use buffered IO</div><div class='add'>+ *   %1: NFS READ will use dontcache (buffered IO w/ dropbehind)</div><div class='add'>+ *   %2: NFS READ will use direct IO</div><div class='add'>+ *</div><div class='add'>+ * This setting takes immediate effect for all NFS versions,</div><div class='add'>+ * all exports, and in all NFSD net namespaces.</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+static int nfsd_io_cache_read_get(void *data, u64 *val)</div><div class='add'>+{</div><div class='add'>+	*val = nfsd_io_cache_read;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int nfsd_io_cache_read_set(void *data, u64 val)</div><div class='add'>+{</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	switch (val) {</div><div class='add'>+	case NFSD_IO_BUFFERED:</div><div class='add'>+		nfsd_io_cache_read = NFSD_IO_BUFFERED;</div><div class='add'>+		break;</div><div class='add'>+	case NFSD_IO_DONTCACHE:</div><div class='add'>+	case NFSD_IO_DIRECT:</div><div class='add'>+		/*</div><div class='add'>+		 * Must disable splice_read when enabling</div><div class='add'>+		 * NFSD_IO_DONTCACHE.</div><div class='add'>+		 */</div><div class='add'>+		nfsd_disable_splice_read = true;</div><div class='add'>+		nfsd_io_cache_read = val;</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+DEFINE_DEBUGFS_ATTRIBUTE(nfsd_io_cache_read_fops, nfsd_io_cache_read_get,</div><div class='add'>+			 nfsd_io_cache_read_set, "%llu\n");</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * /sys/kernel/debug/nfsd/io_cache_write</div><div class='add'>+ *</div><div class='add'>+ * Contents:</div><div class='add'>+ *   %0: NFS WRITE will use buffered IO</div><div class='add'>+ *   %1: NFS WRITE will use dontcache (buffered IO w/ dropbehind)</div><div class='add'>+ *</div><div class='add'>+ * This setting takes immediate effect for all NFS versions,</div><div class='add'>+ * all exports, and in all NFSD net namespaces.</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+static int nfsd_io_cache_write_get(void *data, u64 *val)</div><div class='add'>+{</div><div class='add'>+	*val = nfsd_io_cache_write;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int nfsd_io_cache_write_set(void *data, u64 val)</div><div class='add'>+{</div><div class='add'>+	int ret = 0;</div><div class='add'>+</div><div class='add'>+	switch (val) {</div><div class='add'>+	case NFSD_IO_BUFFERED:</div><div class='add'>+	case NFSD_IO_DONTCACHE:</div><div class='add'>+	case NFSD_IO_DIRECT:</div><div class='add'>+		nfsd_io_cache_write = val;</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+DEFINE_DEBUGFS_ATTRIBUTE(nfsd_io_cache_write_fops, nfsd_io_cache_write_get,</div><div class='add'>+			 nfsd_io_cache_write_set, "%llu\n");</div><div class='add'>+</div><div class='add'>+void nfsd_debugfs_exit(void)</div><div class='add'>+{</div><div class='add'>+	debugfs_remove_recursive(nfsd_top_dir);</div><div class='add'>+	nfsd_top_dir = NULL;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void nfsd_debugfs_init(void)</div><div class='add'>+{</div><div class='add'>+	nfsd_top_dir = debugfs_create_dir("nfsd", NULL);</div><div class='add'>+</div><div class='add'>+	debugfs_create_file("disable-splice-read", S_IWUSR | S_IRUGO,</div><div class='add'>+			    nfsd_top_dir, NULL, &amp;nfsd_dsr_fops);</div><div class='add'>+</div><div class='add'>+	debugfs_create_file("io_cache_read", 0644, nfsd_top_dir, NULL,</div><div class='add'>+			    &amp;nfsd_io_cache_read_fops);</div><div class='add'>+</div><div class='add'>+	debugfs_create_file("io_cache_write", 0644, nfsd_top_dir, NULL,</div><div class='add'>+			    &amp;nfsd_io_cache_write_fops);</div><div class='add'>+}</div><div class='head'>diff --git a/fs/nfsd/export.c b/fs/nfsd/export.c<br/>index 9421dae22737..9d55512d0cc9 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/export.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/export.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/export.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/export.c</a></div><div class='hunk'>@@ -82,8 +82,7 @@ static int expkey_parse(struct cache_detail *cd, char *mesg, int mlen)</div><div class='ctx'> 	int len;</div><div class='ctx'> 	struct auth_domain *dom = NULL;</div><div class='ctx'> 	int err;</div><div class='del'>-	int fsidtype;</div><div class='del'>-	char *ep;</div><div class='add'>+	u8 fsidtype;</div><div class='ctx'> 	struct svc_expkey key;</div><div class='ctx'> 	struct svc_expkey *ek = NULL;</div><div class='ctx'> </div><div class='hunk'>@@ -97,7 +96,7 @@ static int expkey_parse(struct cache_detail *cd, char *mesg, int mlen)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	err = -EINVAL;</div><div class='del'>-	if ((len=qword_get(&amp;mesg, buf, PAGE_SIZE)) &lt;= 0)</div><div class='add'>+	if (qword_get(&amp;mesg, buf, PAGE_SIZE) &lt;= 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	err = -ENOENT;</div><div class='hunk'>@@ -107,12 +106,11 @@ static int expkey_parse(struct cache_detail *cd, char *mesg, int mlen)</div><div class='ctx'> 	dprintk("found domain %s\n", buf);</div><div class='ctx'> </div><div class='ctx'> 	err = -EINVAL;</div><div class='del'>-	if ((len=qword_get(&amp;mesg, buf, PAGE_SIZE)) &lt;= 0)</div><div class='add'>+	if (qword_get(&amp;mesg, buf, PAGE_SIZE) &lt;= 0)</div><div class='ctx'> 		goto out;</div><div class='del'>-	fsidtype = simple_strtoul(buf, &amp;ep, 10);</div><div class='del'>-	if (*ep)</div><div class='add'>+	if (kstrtou8(buf, 10, &amp;fsidtype))</div><div class='ctx'> 		goto out;</div><div class='del'>-	dprintk("found fsidtype %d\n", fsidtype);</div><div class='add'>+	dprintk("found fsidtype %u\n", fsidtype);</div><div class='ctx'> 	if (key_len(fsidtype)==0) /* invalid type */</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	if ((len=qword_get(&amp;mesg, buf, PAGE_SIZE)) &lt;= 0)</div><div class='hunk'>@@ -123,11 +121,11 @@ static int expkey_parse(struct cache_detail *cd, char *mesg, int mlen)</div><div class='ctx'> </div><div class='ctx'> 	/* OK, we seem to have a valid key */</div><div class='ctx'> 	key.h.flags = 0;</div><div class='del'>-	key.h.expiry_time = get_expiry(&amp;mesg);</div><div class='del'>-	if (key.h.expiry_time == 0)</div><div class='add'>+	err = get_expiry(&amp;mesg, &amp;key.h.expiry_time);</div><div class='add'>+	if (err)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	key.ek_client = dom;	</div><div class='add'>+	key.ek_client = dom;</div><div class='ctx'> 	key.ek_fsidtype = fsidtype;</div><div class='ctx'> 	memcpy(key.ek_fsid, buf, len);</div><div class='ctx'> </div><div class='hunk'>@@ -334,28 +332,46 @@ static void nfsd4_fslocs_free(struct nfsd4_fs_locations *fsloc)</div><div class='ctx'> static int export_stats_init(struct export_stats *stats)</div><div class='ctx'> {</div><div class='ctx'> 	stats-&gt;start_time = ktime_get_seconds();</div><div class='del'>-	return nfsd_percpu_counters_init(stats-&gt;counter, EXP_STATS_COUNTERS_NUM);</div><div class='add'>+	return percpu_counter_init_many(stats-&gt;counter, 0, GFP_KERNEL,</div><div class='add'>+					EXP_STATS_COUNTERS_NUM);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void export_stats_reset(struct export_stats *stats)</div><div class='ctx'> {</div><div class='del'>-	nfsd_percpu_counters_reset(stats-&gt;counter, EXP_STATS_COUNTERS_NUM);</div><div class='add'>+	if (stats) {</div><div class='add'>+		int i;</div><div class='add'>+</div><div class='add'>+		for (i = 0; i &lt; EXP_STATS_COUNTERS_NUM; i++)</div><div class='add'>+			percpu_counter_set(&amp;stats-&gt;counter[i], 0);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void export_stats_destroy(struct export_stats *stats)</div><div class='ctx'> {</div><div class='del'>-	nfsd_percpu_counters_destroy(stats-&gt;counter, EXP_STATS_COUNTERS_NUM);</div><div class='add'>+	if (stats)</div><div class='add'>+		percpu_counter_destroy_many(stats-&gt;counter,</div><div class='add'>+					    EXP_STATS_COUNTERS_NUM);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void svc_export_release(struct rcu_head *rcu_head)</div><div class='add'>+{</div><div class='add'>+	struct svc_export *exp = container_of(rcu_head, struct svc_export,</div><div class='add'>+			ex_rcu);</div><div class='add'>+</div><div class='add'>+	nfsd4_fslocs_free(&amp;exp-&gt;ex_fslocs);</div><div class='add'>+	export_stats_destroy(exp-&gt;ex_stats);</div><div class='add'>+	kfree(exp-&gt;ex_stats);</div><div class='add'>+	kfree(exp-&gt;ex_uuid);</div><div class='add'>+	kfree(exp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void svc_export_put(struct kref *ref)</div><div class='ctx'> {</div><div class='ctx'> 	struct svc_export *exp = container_of(ref, struct svc_export, h.ref);</div><div class='add'>+</div><div class='ctx'> 	path_put(&amp;exp-&gt;ex_path);</div><div class='ctx'> 	auth_domain_put(exp-&gt;ex_client);</div><div class='del'>-	nfsd4_fslocs_free(&amp;exp-&gt;ex_fslocs);</div><div class='del'>-	export_stats_destroy(&amp;exp-&gt;ex_stats);</div><div class='del'>-	kfree(exp-&gt;ex_uuid);</div><div class='del'>-	kfree_rcu(exp, ex_rcu);</div><div class='add'>+	call_rcu(&amp;exp-&gt;ex_rcu, svc_export_release);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int svc_export_upcall(struct cache_detail *cd, struct cache_head *h)</div><div class='hunk'>@@ -386,7 +402,7 @@ static struct svc_export *svc_export_update(struct svc_export *new,</div><div class='ctx'> 					    struct svc_export *old);</div><div class='ctx'> static struct svc_export *svc_export_lookup(struct svc_export *);</div><div class='ctx'> </div><div class='del'>-static int check_export(struct path *path, int *flags, unsigned char *uuid)</div><div class='add'>+static int check_export(const struct path *path, int *flags, unsigned char *uuid)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = d_inode(path-&gt;dentry);</div><div class='ctx'> </div><div class='hunk'>@@ -421,13 +437,12 @@ static int check_export(struct path *path, int *flags, unsigned char *uuid)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (!inode-&gt;i_sb-&gt;s_export_op ||</div><div class='del'>-	    !inode-&gt;i_sb-&gt;s_export_op-&gt;fh_to_dentry) {</div><div class='add'>+	if (!exportfs_can_decode_fh(inode-&gt;i_sb-&gt;s_export_op)) {</div><div class='ctx'> 		dprintk("exp_export: export of invalid fs type.\n");</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (mnt_user_ns(path-&gt;mnt) != &amp;init_user_ns) {</div><div class='add'>+	if (is_idmapped_mnt(path-&gt;mnt)) {</div><div class='ctx'> 		dprintk("exp_export: export of idmapped mounts not yet supported.\n");</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -439,7 +454,6 @@ static int check_export(struct path *path, int *flags, unsigned char *uuid)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	}</div><div class='ctx'> 	return 0;</div><div class='del'>-</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_NFSD_V4</div><div class='hunk'>@@ -546,6 +560,29 @@ static inline int</div><div class='ctx'> secinfo_parse(char **mesg, char *buf, struct svc_export *exp) { return 0; }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='add'>+static int xprtsec_parse(char **mesg, char *buf, struct svc_export *exp)</div><div class='add'>+{</div><div class='add'>+	unsigned int i, mode, listsize;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	err = get_uint(mesg, &amp;listsize);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+	if (listsize &gt; NFSEXP_XPRTSEC_NUM)</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	exp-&gt;ex_xprtsec_modes = 0;</div><div class='add'>+	for (i = 0; i &lt; listsize; i++) {</div><div class='add'>+		err = get_uint(mesg, &amp;mode);</div><div class='add'>+		if (err)</div><div class='add'>+			return err;</div><div class='add'>+		if (mode &gt; NFSEXP_XPRTSEC_MTLS)</div><div class='add'>+			return -EINVAL;</div><div class='add'>+		exp-&gt;ex_xprtsec_modes |= mode;</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline int</div><div class='ctx'> nfsd_uuid_parse(char **mesg, char *buf, unsigned char **puuid)</div><div class='ctx'> {</div><div class='hunk'>@@ -571,7 +608,6 @@ static int svc_export_parse(struct cache_detail *cd, char *mesg, int mlen)</div><div class='ctx'> {</div><div class='ctx'> 	/* client path expiry [flags anonuid anongid fsid] */</div><div class='ctx'> 	char *buf;</div><div class='del'>-	int len;</div><div class='ctx'> 	int err;</div><div class='ctx'> 	struct auth_domain *dom = NULL;</div><div class='ctx'> 	struct svc_export exp = {}, *expp;</div><div class='hunk'>@@ -587,8 +623,7 @@ static int svc_export_parse(struct cache_detail *cd, char *mesg, int mlen)</div><div class='ctx'> </div><div class='ctx'> 	/* client */</div><div class='ctx'> 	err = -EINVAL;</div><div class='del'>-	len = qword_get(&amp;mesg, buf, PAGE_SIZE);</div><div class='del'>-	if (len &lt;= 0)</div><div class='add'>+	if (qword_get(&amp;mesg, buf, PAGE_SIZE) &lt;= 0)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	err = -ENOENT;</div><div class='hunk'>@@ -598,7 +633,7 @@ static int svc_export_parse(struct cache_detail *cd, char *mesg, int mlen)</div><div class='ctx'> </div><div class='ctx'> 	/* path */</div><div class='ctx'> 	err = -EINVAL;</div><div class='del'>-	if ((len = qword_get(&amp;mesg, buf, PAGE_SIZE)) &lt;= 0)</div><div class='add'>+	if (qword_get(&amp;mesg, buf, PAGE_SIZE) &lt;= 0)</div><div class='ctx'> 		goto out1;</div><div class='ctx'> </div><div class='ctx'> 	err = kern_path(buf, 0, &amp;exp.ex_path);</div><div class='hunk'>@@ -608,11 +643,11 @@ static int svc_export_parse(struct cache_detail *cd, char *mesg, int mlen)</div><div class='ctx'> 	exp.ex_client = dom;</div><div class='ctx'> 	exp.cd = cd;</div><div class='ctx'> 	exp.ex_devid_map = NULL;</div><div class='add'>+	exp.ex_xprtsec_modes = NFSEXP_XPRTSEC_ALL;</div><div class='ctx'> </div><div class='ctx'> 	/* expiry */</div><div class='del'>-	err = -EINVAL;</div><div class='del'>-	exp.h.expiry_time = get_expiry(&amp;mesg);</div><div class='del'>-	if (exp.h.expiry_time == 0)</div><div class='add'>+	err = get_expiry(&amp;mesg, &amp;exp.h.expiry_time);</div><div class='add'>+	if (err)</div><div class='ctx'> 		goto out3;</div><div class='ctx'> </div><div class='ctx'> 	/* flags */</div><div class='hunk'>@@ -624,7 +659,7 @@ static int svc_export_parse(struct cache_detail *cd, char *mesg, int mlen)</div><div class='ctx'> 		if (err || an_int &lt; 0)</div><div class='ctx'> 			goto out3;</div><div class='ctx'> 		exp.ex_flags= an_int;</div><div class='del'>-	</div><div class='add'>+</div><div class='ctx'> 		/* anon uid */</div><div class='ctx'> 		err = get_int(&amp;mesg, &amp;an_int);</div><div class='ctx'> 		if (err)</div><div class='hunk'>@@ -643,13 +678,15 @@ static int svc_export_parse(struct cache_detail *cd, char *mesg, int mlen)</div><div class='ctx'> 			goto out3;</div><div class='ctx'> 		exp.ex_fsid = an_int;</div><div class='ctx'> </div><div class='del'>-		while ((len = qword_get(&amp;mesg, buf, PAGE_SIZE)) &gt; 0) {</div><div class='add'>+		while (qword_get(&amp;mesg, buf, PAGE_SIZE) &gt; 0) {</div><div class='ctx'> 			if (strcmp(buf, "fsloc") == 0)</div><div class='ctx'> 				err = fsloc_parse(&amp;mesg, buf, &amp;exp.ex_fslocs);</div><div class='ctx'> 			else if (strcmp(buf, "uuid") == 0)</div><div class='ctx'> 				err = nfsd_uuid_parse(&amp;mesg, buf, &amp;exp.ex_uuid);</div><div class='ctx'> 			else if (strcmp(buf, "secinfo") == 0)</div><div class='ctx'> 				err = secinfo_parse(&amp;mesg, buf, &amp;exp);</div><div class='add'>+			else if (strcmp(buf, "xprtsec") == 0)</div><div class='add'>+				err = xprtsec_parse(&amp;mesg, buf, &amp;exp);</div><div class='ctx'> 			else</div><div class='ctx'> 				/* quietly ignore unknown words and anything</div><div class='ctx'> 				 * following. Newer user-space can try to set</div><div class='hunk'>@@ -663,6 +700,7 @@ static int svc_export_parse(struct cache_detail *cd, char *mesg, int mlen)</div><div class='ctx'> 		err = check_export(&amp;exp.ex_path, &amp;exp.ex_flags, exp.ex_uuid);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto out4;</div><div class='add'>+</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * No point caching this if it would immediately expire.</div><div class='ctx'> 		 * Also, this protects exportfs's dummy export from the</div><div class='hunk'>@@ -744,13 +782,15 @@ static int svc_export_show(struct seq_file *m,</div><div class='ctx'> 	seq_putc(m, '\t');</div><div class='ctx'> 	seq_escape(m, exp-&gt;ex_client-&gt;name, " \t\n\\");</div><div class='ctx'> 	if (export_stats) {</div><div class='del'>-		seq_printf(m, "\t%lld\n", exp-&gt;ex_stats.start_time);</div><div class='add'>+		struct percpu_counter *counter = exp-&gt;ex_stats-&gt;counter;</div><div class='add'>+</div><div class='add'>+		seq_printf(m, "\t%lld\n", exp-&gt;ex_stats-&gt;start_time);</div><div class='ctx'> 		seq_printf(m, "\tfh_stale: %lld\n",</div><div class='del'>-			   percpu_counter_sum_positive(&amp;exp-&gt;ex_stats.counter[EXP_STATS_FH_STALE]));</div><div class='add'>+			   percpu_counter_sum_positive(&amp;counter[EXP_STATS_FH_STALE]));</div><div class='ctx'> 		seq_printf(m, "\tio_read: %lld\n",</div><div class='del'>-			   percpu_counter_sum_positive(&amp;exp-&gt;ex_stats.counter[EXP_STATS_IO_READ]));</div><div class='add'>+			   percpu_counter_sum_positive(&amp;counter[EXP_STATS_IO_READ]));</div><div class='ctx'> 		seq_printf(m, "\tio_write: %lld\n",</div><div class='del'>-			   percpu_counter_sum_positive(&amp;exp-&gt;ex_stats.counter[EXP_STATS_IO_WRITE]));</div><div class='add'>+			   percpu_counter_sum_positive(&amp;counter[EXP_STATS_IO_WRITE]));</div><div class='ctx'> 		seq_putc(m, '\n');</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -796,7 +836,7 @@ static void svc_export_init(struct cache_head *cnew, struct cache_head *citem)</div><div class='ctx'> 	new-&gt;ex_layout_types = 0;</div><div class='ctx'> 	new-&gt;ex_uuid = NULL;</div><div class='ctx'> 	new-&gt;cd = item-&gt;cd;</div><div class='del'>-	export_stats_reset(&amp;new-&gt;ex_stats);</div><div class='add'>+	export_stats_reset(new-&gt;ex_stats);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void export_update(struct cache_head *cnew, struct cache_head *citem)</div><div class='hunk'>@@ -824,6 +864,7 @@ static void export_update(struct cache_head *cnew, struct cache_head *citem)</div><div class='ctx'> 	for (i = 0; i &lt; MAX_SECINFO_LIST; i++) {</div><div class='ctx'> 		new-&gt;ex_flavors[i] = item-&gt;ex_flavors[i];</div><div class='ctx'> 	}</div><div class='add'>+	new-&gt;ex_xprtsec_modes = item-&gt;ex_xprtsec_modes;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct cache_head *svc_export_alloc(void)</div><div class='hunk'>@@ -832,7 +873,14 @@ static struct cache_head *svc_export_alloc(void)</div><div class='ctx'> 	if (!i)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='del'>-	if (export_stats_init(&amp;i-&gt;ex_stats)) {</div><div class='add'>+	i-&gt;ex_stats = kmalloc(sizeof(*(i-&gt;ex_stats)), GFP_KERNEL);</div><div class='add'>+	if (!i-&gt;ex_stats) {</div><div class='add'>+		kfree(i);</div><div class='add'>+		return NULL;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (export_stats_init(i-&gt;ex_stats)) {</div><div class='add'>+		kfree(i-&gt;ex_stats);</div><div class='ctx'> 		kfree(i);</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1033,24 +1081,76 @@ static struct svc_export *exp_find(struct cache_detail *cd,</div><div class='ctx'> 	return exp;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-__be32 check_nfsd_access(struct svc_export *exp, struct svc_rqst *rqstp)</div><div class='add'>+/**</div><div class='add'>+ * check_xprtsec_policy - check if access to export is allowed by the</div><div class='add'>+ *			  xprtsec policy</div><div class='add'>+ * @exp: svc_export that is being accessed.</div><div class='add'>+ * @rqstp: svc_rqst attempting to access @exp.</div><div class='add'>+ *</div><div class='add'>+ * Helper function for check_nfsd_access().  Note that callers should be</div><div class='add'>+ * using check_nfsd_access() instead of calling this function directly.  The</div><div class='add'>+ * one exception is __fh_verify() since it has logic that may result in one</div><div class='add'>+ * or both of the helpers being skipped.</div><div class='add'>+ *</div><div class='add'>+ * Return values:</div><div class='add'>+ *   %nfs_ok if access is granted, or</div><div class='add'>+ *   %nfserr_wrongsec if access is denied</div><div class='add'>+ */</div><div class='add'>+__be32 check_xprtsec_policy(struct svc_export *exp, struct svc_rqst *rqstp)</div><div class='ctx'> {</div><div class='del'>-	struct exp_flavor_info *f;</div><div class='del'>-	struct exp_flavor_info *end = exp-&gt;ex_flavors + exp-&gt;ex_nflavors;</div><div class='add'>+	struct svc_xprt *xprt = rqstp-&gt;rq_xprt;</div><div class='add'>+</div><div class='add'>+	if (exp-&gt;ex_xprtsec_modes &amp; NFSEXP_XPRTSEC_NONE) {</div><div class='add'>+		if (!test_bit(XPT_TLS_SESSION, &amp;xprt-&gt;xpt_flags))</div><div class='add'>+			return nfs_ok;</div><div class='add'>+	}</div><div class='add'>+	if (exp-&gt;ex_xprtsec_modes &amp; NFSEXP_XPRTSEC_TLS) {</div><div class='add'>+		if (test_bit(XPT_TLS_SESSION, &amp;xprt-&gt;xpt_flags) &amp;&amp;</div><div class='add'>+		    !test_bit(XPT_PEER_AUTH, &amp;xprt-&gt;xpt_flags))</div><div class='add'>+			return nfs_ok;</div><div class='add'>+	}</div><div class='add'>+	if (exp-&gt;ex_xprtsec_modes &amp; NFSEXP_XPRTSEC_MTLS) {</div><div class='add'>+		if (test_bit(XPT_TLS_SESSION, &amp;xprt-&gt;xpt_flags) &amp;&amp;</div><div class='add'>+		    test_bit(XPT_PEER_AUTH, &amp;xprt-&gt;xpt_flags))</div><div class='add'>+			return nfs_ok;</div><div class='add'>+	}</div><div class='add'>+	return nfserr_wrongsec;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * check_security_flavor - check if access to export is allowed by the</div><div class='add'>+ *			   security flavor</div><div class='add'>+ * @exp: svc_export that is being accessed.</div><div class='add'>+ * @rqstp: svc_rqst attempting to access @exp.</div><div class='add'>+ * @may_bypass_gss: reduce strictness of authorization check</div><div class='add'>+ *</div><div class='add'>+ * Helper function for check_nfsd_access().  Note that callers should be</div><div class='add'>+ * using check_nfsd_access() instead of calling this function directly.  The</div><div class='add'>+ * one exception is __fh_verify() since it has logic that may result in one</div><div class='add'>+ * or both of the helpers being skipped.</div><div class='add'>+ *</div><div class='add'>+ * Return values:</div><div class='add'>+ *   %nfs_ok if access is granted, or</div><div class='add'>+ *   %nfserr_wrongsec if access is denied</div><div class='add'>+ */</div><div class='add'>+__be32 check_security_flavor(struct svc_export *exp, struct svc_rqst *rqstp,</div><div class='add'>+			     bool may_bypass_gss)</div><div class='add'>+{</div><div class='add'>+	struct exp_flavor_info *f, *end = exp-&gt;ex_flavors + exp-&gt;ex_nflavors;</div><div class='ctx'> </div><div class='ctx'> 	/* legacy gss-only clients are always OK: */</div><div class='ctx'> 	if (exp-&gt;ex_client == rqstp-&gt;rq_gssclient)</div><div class='del'>-		return 0;</div><div class='add'>+		return nfs_ok;</div><div class='ctx'> 	/* ip-address based client; check sec= export option: */</div><div class='ctx'> 	for (f = exp-&gt;ex_flavors; f &lt; end; f++) {</div><div class='ctx'> 		if (f-&gt;pseudoflavor == rqstp-&gt;rq_cred.cr_flavor)</div><div class='del'>-			return 0;</div><div class='add'>+			return nfs_ok;</div><div class='ctx'> 	}</div><div class='ctx'> 	/* defaults in absence of sec= options: */</div><div class='ctx'> 	if (exp-&gt;ex_nflavors == 0) {</div><div class='ctx'> 		if (rqstp-&gt;rq_cred.cr_flavor == RPC_AUTH_NULL ||</div><div class='ctx'> 		    rqstp-&gt;rq_cred.cr_flavor == RPC_AUTH_UNIX)</div><div class='del'>-			return 0;</div><div class='add'>+			return nfs_ok;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* If the compound op contains a spo_must_allowed op,</div><div class='hunk'>@@ -1060,9 +1160,47 @@ __be32 check_nfsd_access(struct svc_export *exp, struct svc_rqst *rqstp)</div><div class='ctx'> 	 */</div><div class='ctx'> </div><div class='ctx'> 	if (nfsd4_spo_must_allow(rqstp))</div><div class='del'>-		return 0;</div><div class='add'>+		return nfs_ok;</div><div class='add'>+</div><div class='add'>+	/* Some calls may be processed without authentication</div><div class='add'>+	 * on GSS exports. For example NFS2/3 calls on root</div><div class='add'>+	 * directory, see section 2.3.2 of rfc 2623.</div><div class='add'>+	 * For "may_bypass_gss" check that export has really</div><div class='add'>+	 * enabled some flavor with authentication (GSS or any</div><div class='add'>+	 * other) and also check that the used auth flavor is</div><div class='add'>+	 * without authentication (none or sys).</div><div class='add'>+	 */</div><div class='add'>+	if (may_bypass_gss &amp;&amp; (</div><div class='add'>+	     rqstp-&gt;rq_cred.cr_flavor == RPC_AUTH_NULL ||</div><div class='add'>+	     rqstp-&gt;rq_cred.cr_flavor == RPC_AUTH_UNIX)) {</div><div class='add'>+		for (f = exp-&gt;ex_flavors; f &lt; end; f++) {</div><div class='add'>+			if (f-&gt;pseudoflavor &gt;= RPC_AUTH_DES)</div><div class='add'>+				return 0;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return nfserr_wrongsec;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * check_nfsd_access - check if access to export is allowed.</div><div class='add'>+ * @exp: svc_export that is being accessed.</div><div class='add'>+ * @rqstp: svc_rqst attempting to access @exp.</div><div class='add'>+ * @may_bypass_gss: reduce strictness of authorization check</div><div class='add'>+ *</div><div class='add'>+ * Return values:</div><div class='add'>+ *   %nfs_ok if access is granted, or</div><div class='add'>+ *   %nfserr_wrongsec if access is denied</div><div class='add'>+ */</div><div class='add'>+__be32 check_nfsd_access(struct svc_export *exp, struct svc_rqst *rqstp,</div><div class='add'>+			 bool may_bypass_gss)</div><div class='add'>+{</div><div class='add'>+	__be32 status;</div><div class='ctx'> </div><div class='del'>-	return rqstp-&gt;rq_vers &lt; 4 ? nfserr_acces : nfserr_wrongsec;</div><div class='add'>+	status = check_xprtsec_policy(exp, rqstp);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	return check_security_flavor(exp, rqstp, may_bypass_gss);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1075,7 +1213,7 @@ __be32 check_nfsd_access(struct svc_export *exp, struct svc_rqst *rqstp)</div><div class='ctx'>  * use exp_get_by_name() or exp_find().</div><div class='ctx'>  */</div><div class='ctx'> struct svc_export *</div><div class='del'>-rqst_exp_get_by_name(struct svc_rqst *rqstp, struct path *path)</div><div class='add'>+rqst_exp_get_by_name(struct svc_rqst *rqstp, const struct path *path)</div><div class='ctx'> {</div><div class='ctx'> 	struct svc_export *gssexp, *exp = ERR_PTR(-ENOENT);</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(SVC_NET(rqstp), nfsd_net_id);</div><div class='hunk'>@@ -1105,19 +1243,35 @@ gss:</div><div class='ctx'> 	return gssexp;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * rqst_exp_find - Find an svc_export in the context of a rqst or similar</div><div class='add'>+ * @reqp:	The handle to be used to suspend the request if a cache-upcall is needed</div><div class='add'>+ *		If NULL, missing in-cache information will result in failure.</div><div class='add'>+ * @net:	The network namespace in which the request exists</div><div class='add'>+ * @cl:		default auth_domain to use for looking up the export</div><div class='add'>+ * @gsscl:	an alternate auth_domain defined using deprecated gss/krb5 format.</div><div class='add'>+ * @fsid_type:	The type of fsid to look for</div><div class='add'>+ * @fsidv:	The actual fsid to look up in the context of either client.</div><div class='add'>+ *</div><div class='add'>+ * Perform a lookup for @cl/@fsidv in the given @net for an export.  If</div><div class='add'>+ * none found and @gsscl specified, repeat the lookup.</div><div class='add'>+ *</div><div class='add'>+ * Returns an export, or an error pointer.</div><div class='add'>+ */</div><div class='ctx'> struct svc_export *</div><div class='del'>-rqst_exp_find(struct svc_rqst *rqstp, int fsid_type, u32 *fsidv)</div><div class='add'>+rqst_exp_find(struct cache_req *reqp, struct net *net,</div><div class='add'>+	      struct auth_domain *cl, struct auth_domain *gsscl,</div><div class='add'>+	      int fsid_type, u32 *fsidv)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='ctx'> 	struct svc_export *gssexp, *exp = ERR_PTR(-ENOENT);</div><div class='del'>-	struct nfsd_net *nn = net_generic(SVC_NET(rqstp), nfsd_net_id);</div><div class='ctx'> 	struct cache_detail *cd = nn-&gt;svc_export_cache;</div><div class='ctx'> </div><div class='del'>-	if (rqstp-&gt;rq_client == NULL)</div><div class='add'>+	if (!cl)</div><div class='ctx'> 		goto gss;</div><div class='ctx'> </div><div class='ctx'> 	/* First try the auth_unix client: */</div><div class='del'>-	exp = exp_find(cd, rqstp-&gt;rq_client, fsid_type,</div><div class='del'>-		       fsidv, &amp;rqstp-&gt;rq_chandle);</div><div class='add'>+	exp = exp_find(cd, cl, fsid_type, fsidv, reqp);</div><div class='ctx'> 	if (PTR_ERR(exp) == -ENOENT)</div><div class='ctx'> 		goto gss;</div><div class='ctx'> 	if (IS_ERR(exp))</div><div class='hunk'>@@ -1127,10 +1281,9 @@ rqst_exp_find(struct svc_rqst *rqstp, int fsid_type, u32 *fsidv)</div><div class='ctx'> 		return exp;</div><div class='ctx'> gss:</div><div class='ctx'> 	/* Otherwise, try falling back on gss client */</div><div class='del'>-	if (rqstp-&gt;rq_gssclient == NULL)</div><div class='add'>+	if (!gsscl)</div><div class='ctx'> 		return exp;</div><div class='del'>-	gssexp = exp_find(cd, rqstp-&gt;rq_gssclient, fsid_type, fsidv,</div><div class='del'>-						&amp;rqstp-&gt;rq_chandle);</div><div class='add'>+	gssexp = exp_find(cd, gsscl, fsid_type, fsidv, reqp);</div><div class='ctx'> 	if (PTR_ERR(gssexp) == -ENOENT)</div><div class='ctx'> 		return exp;</div><div class='ctx'> 	if (!IS_ERR(exp))</div><div class='hunk'>@@ -1161,7 +1314,9 @@ struct svc_export *rqst_find_fsidzero_export(struct svc_rqst *rqstp)</div><div class='ctx'> </div><div class='ctx'> 	mk_fsid(FSID_NUM, fsidv, 0, 0, 0, NULL);</div><div class='ctx'> </div><div class='del'>-	return rqst_exp_find(rqstp, FSID_NUM, fsidv);</div><div class='add'>+	return rqst_exp_find(&amp;rqstp-&gt;rq_chandle, SVC_NET(rqstp),</div><div class='add'>+			     rqstp-&gt;rq_client, rqstp-&gt;rq_gssclient,</div><div class='add'>+			     FSID_NUM, fsidv);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1310,10 +1465,9 @@ static int e_show(struct seq_file *m, void *p)</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	exp_get(exp);</div><div class='del'>-	if (cache_check(cd, &amp;exp-&gt;h, NULL))</div><div class='add'>+	if (cache_check_rcu(cd, &amp;exp-&gt;h, NULL))</div><div class='ctx'> 		return 0;</div><div class='del'>-	exp_put(exp);</div><div class='add'>+</div><div class='ctx'> 	return svc_export_show(m, cd, cp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/nfsd/export.h b/fs/nfsd/export.h<br/>index ee0e3aba4a6e..d2b09cd76145 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/export.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/export.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/export.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/export.h</a></div><div class='hunk'>@@ -64,10 +64,10 @@ struct svc_export {</div><div class='ctx'> 	struct cache_head	h;</div><div class='ctx'> 	struct auth_domain *	ex_client;</div><div class='ctx'> 	int			ex_flags;</div><div class='add'>+	int			ex_fsid;</div><div class='ctx'> 	struct path		ex_path;</div><div class='ctx'> 	kuid_t			ex_anon_uid;</div><div class='ctx'> 	kgid_t			ex_anon_gid;</div><div class='del'>-	int			ex_fsid;</div><div class='ctx'> 	unsigned char *		ex_uuid; /* 16 byte fsid */</div><div class='ctx'> 	struct nfsd4_fs_locations ex_fslocs;</div><div class='ctx'> 	uint32_t		ex_nflavors;</div><div class='hunk'>@@ -76,7 +76,8 @@ struct svc_export {</div><div class='ctx'> 	struct nfsd4_deviceid_map *ex_devid_map;</div><div class='ctx'> 	struct cache_detail	*cd;</div><div class='ctx'> 	struct rcu_head		ex_rcu;</div><div class='del'>-	struct export_stats	ex_stats;</div><div class='add'>+	unsigned long		ex_xprtsec_modes;</div><div class='add'>+	struct export_stats	*ex_stats;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /* an "export key" (expkey) maps a filehandlefragement to an</div><div class='hunk'>@@ -87,7 +88,7 @@ struct svc_expkey {</div><div class='ctx'> 	struct cache_head	h;</div><div class='ctx'> </div><div class='ctx'> 	struct auth_domain *	ek_client;</div><div class='del'>-	int			ek_fsidtype;</div><div class='add'>+	u8			ek_fsidtype;</div><div class='ctx'> 	u32			ek_fsid[6];</div><div class='ctx'> </div><div class='ctx'> 	struct path		ek_path;</div><div class='hunk'>@@ -98,8 +99,13 @@ struct svc_expkey {</div><div class='ctx'> #define EX_NOHIDE(exp)		((exp)-&gt;ex_flags &amp; NFSEXP_NOHIDE)</div><div class='ctx'> #define EX_WGATHER(exp)		((exp)-&gt;ex_flags &amp; NFSEXP_GATHERED_WRITES)</div><div class='ctx'> </div><div class='del'>-int nfsexp_flags(struct svc_rqst *rqstp, struct svc_export *exp);</div><div class='del'>-__be32 check_nfsd_access(struct svc_export *exp, struct svc_rqst *rqstp);</div><div class='add'>+struct svc_cred;</div><div class='add'>+int nfsexp_flags(struct svc_cred *cred, struct svc_export *exp);</div><div class='add'>+__be32 check_xprtsec_policy(struct svc_export *exp, struct svc_rqst *rqstp);</div><div class='add'>+__be32 check_security_flavor(struct svc_export *exp, struct svc_rqst *rqstp,</div><div class='add'>+			     bool may_bypass_gss);</div><div class='add'>+__be32 check_nfsd_access(struct svc_export *exp, struct svc_rqst *rqstp,</div><div class='add'>+			 bool may_bypass_gss);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Function declarations</div><div class='hunk'>@@ -108,14 +114,13 @@ int			nfsd_export_init(struct net *);</div><div class='ctx'> void			nfsd_export_shutdown(struct net *);</div><div class='ctx'> void			nfsd_export_flush(struct net *);</div><div class='ctx'> struct svc_export *	rqst_exp_get_by_name(struct svc_rqst *,</div><div class='del'>-					     struct path *);</div><div class='add'>+					     const struct path *);</div><div class='ctx'> struct svc_export *	rqst_exp_parent(struct svc_rqst *,</div><div class='ctx'> 					struct path *);</div><div class='ctx'> struct svc_export *	rqst_find_fsidzero_export(struct svc_rqst *);</div><div class='ctx'> int			exp_rootfh(struct net *, struct auth_domain *,</div><div class='ctx'> 					char *path, struct knfsd_fh *, int maxsize);</div><div class='ctx'> __be32			exp_pseudoroot(struct svc_rqst *, struct svc_fh *);</div><div class='del'>-__be32			nfserrno(int errno);</div><div class='ctx'> </div><div class='ctx'> static inline void exp_put(struct svc_export *exp)</div><div class='ctx'> {</div><div class='hunk'>@@ -127,6 +132,8 @@ static inline struct svc_export *exp_get(struct svc_export *exp)</div><div class='ctx'> 	cache_get(&amp;exp-&gt;h);</div><div class='ctx'> 	return exp;</div><div class='ctx'> }</div><div class='del'>-struct svc_export * rqst_exp_find(struct svc_rqst *, int, u32 *);</div><div class='add'>+struct svc_export *rqst_exp_find(struct cache_req *reqp, struct net *net,</div><div class='add'>+				 struct auth_domain *cl, struct auth_domain *gsscl,</div><div class='add'>+				 int fsid_type, u32 *fsidv);</div><div class='ctx'> </div><div class='ctx'> #endif /* NFSD_EXPORT_H */</div><div class='head'>diff --git a/fs/nfsd/fault_inject.c b/fs/nfsd/fault_inject.c<br/>deleted file mode 100644<br/>index 76bee0a0d308..000000000000<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/fault_inject.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/fault_inject.c</a><br/>+++ /dev/null</div><div class='hunk'>@@ -1,142 +0,0 @@</div><div class='del'>-// SPDX-License-Identifier: GPL-2.0</div><div class='del'>-/*</div><div class='del'>- * Copyright (c) 2011 Bryan Schumaker &lt;bjschuma@netapp.com&gt;</div><div class='del'>- *</div><div class='del'>- * Uses debugfs to create fault injection points for client testing</div><div class='del'>- */</div><div class='del'>-</div><div class='del'>-#include &lt;linux/types.h&gt;</div><div class='del'>-#include &lt;linux/fs.h&gt;</div><div class='del'>-#include &lt;linux/debugfs.h&gt;</div><div class='del'>-#include &lt;linux/module.h&gt;</div><div class='del'>-#include &lt;linux/nsproxy.h&gt;</div><div class='del'>-#include &lt;linux/sunrpc/addr.h&gt;</div><div class='del'>-#include &lt;linux/uaccess.h&gt;</div><div class='del'>-#include &lt;linux/kernel.h&gt;</div><div class='del'>-</div><div class='del'>-#include "state.h"</div><div class='del'>-#include "netns.h"</div><div class='del'>-</div><div class='del'>-struct nfsd_fault_inject_op {</div><div class='del'>-	char *file;</div><div class='del'>-	u64 (*get)(void);</div><div class='del'>-	u64 (*set_val)(u64);</div><div class='del'>-	u64 (*set_clnt)(struct sockaddr_storage *, size_t);</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static struct dentry *debug_dir;</div><div class='del'>-</div><div class='del'>-static ssize_t fault_inject_read(struct file *file, char __user *buf,</div><div class='del'>-				 size_t len, loff_t *ppos)</div><div class='del'>-{</div><div class='del'>-	static u64 val;</div><div class='del'>-	char read_buf[25];</div><div class='del'>-	size_t size;</div><div class='del'>-	loff_t pos = *ppos;</div><div class='del'>-	struct nfsd_fault_inject_op *op = file_inode(file)-&gt;i_private;</div><div class='del'>-</div><div class='del'>-	if (!pos)</div><div class='del'>-		val = op-&gt;get();</div><div class='del'>-	size = scnprintf(read_buf, sizeof(read_buf), "%llu\n", val);</div><div class='del'>-</div><div class='del'>-	return simple_read_from_buffer(buf, len, ppos, read_buf, size);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static ssize_t fault_inject_write(struct file *file, const char __user *buf,</div><div class='del'>-				  size_t len, loff_t *ppos)</div><div class='del'>-{</div><div class='del'>-	char write_buf[INET6_ADDRSTRLEN];</div><div class='del'>-	size_t size = min(sizeof(write_buf) - 1, len);</div><div class='del'>-	struct net *net = current-&gt;nsproxy-&gt;net_ns;</div><div class='del'>-	struct sockaddr_storage sa;</div><div class='del'>-	struct nfsd_fault_inject_op *op = file_inode(file)-&gt;i_private;</div><div class='del'>-	u64 val;</div><div class='del'>-	char *nl;</div><div class='del'>-</div><div class='del'>-	if (copy_from_user(write_buf, buf, size))</div><div class='del'>-		return -EFAULT;</div><div class='del'>-	write_buf[size] = '\0';</div><div class='del'>-</div><div class='del'>-	/* Deal with any embedded newlines in the string */</div><div class='del'>-	nl = strchr(write_buf, '\n');</div><div class='del'>-	if (nl) {</div><div class='del'>-		size = nl - write_buf;</div><div class='del'>-		*nl = '\0';</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	size = rpc_pton(net, write_buf, size, (struct sockaddr *)&amp;sa, sizeof(sa));</div><div class='del'>-	if (size &gt; 0) {</div><div class='del'>-		val = op-&gt;set_clnt(&amp;sa, size);</div><div class='del'>-		if (val)</div><div class='del'>-			pr_info("NFSD [%s]: Client %s had %llu state object(s)\n",</div><div class='del'>-				op-&gt;file, write_buf, val);</div><div class='del'>-	} else {</div><div class='del'>-		val = simple_strtoll(write_buf, NULL, 0);</div><div class='del'>-		if (val == 0)</div><div class='del'>-			pr_info("NFSD Fault Injection: %s (all)", op-&gt;file);</div><div class='del'>-		else</div><div class='del'>-			pr_info("NFSD Fault Injection: %s (n = %llu)",</div><div class='del'>-				op-&gt;file, val);</div><div class='del'>-		val = op-&gt;set_val(val);</div><div class='del'>-		pr_info("NFSD: %s: found %llu", op-&gt;file, val);</div><div class='del'>-	}</div><div class='del'>-	return len; /* on success, claim we got the whole input */</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static const struct file_operations fops_nfsd = {</div><div class='del'>-	.owner   = THIS_MODULE,</div><div class='del'>-	.read    = fault_inject_read,</div><div class='del'>-	.write   = fault_inject_write,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-void nfsd_fault_inject_cleanup(void)</div><div class='del'>-{</div><div class='del'>-	debugfs_remove_recursive(debug_dir);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct nfsd_fault_inject_op inject_ops[] = {</div><div class='del'>-	{</div><div class='del'>-		.file     = "forget_clients",</div><div class='del'>-		.get	  = nfsd_inject_print_clients,</div><div class='del'>-		.set_val  = nfsd_inject_forget_clients,</div><div class='del'>-		.set_clnt = nfsd_inject_forget_client,</div><div class='del'>-	},</div><div class='del'>-	{</div><div class='del'>-		.file     = "forget_locks",</div><div class='del'>-		.get	  = nfsd_inject_print_locks,</div><div class='del'>-		.set_val  = nfsd_inject_forget_locks,</div><div class='del'>-		.set_clnt = nfsd_inject_forget_client_locks,</div><div class='del'>-	},</div><div class='del'>-	{</div><div class='del'>-		.file     = "forget_openowners",</div><div class='del'>-		.get	  = nfsd_inject_print_openowners,</div><div class='del'>-		.set_val  = nfsd_inject_forget_openowners,</div><div class='del'>-		.set_clnt = nfsd_inject_forget_client_openowners,</div><div class='del'>-	},</div><div class='del'>-	{</div><div class='del'>-		.file     = "forget_delegations",</div><div class='del'>-		.get	  = nfsd_inject_print_delegations,</div><div class='del'>-		.set_val  = nfsd_inject_forget_delegations,</div><div class='del'>-		.set_clnt = nfsd_inject_forget_client_delegations,</div><div class='del'>-	},</div><div class='del'>-	{</div><div class='del'>-		.file     = "recall_delegations",</div><div class='del'>-		.get	  = nfsd_inject_print_delegations,</div><div class='del'>-		.set_val  = nfsd_inject_recall_delegations,</div><div class='del'>-		.set_clnt = nfsd_inject_recall_client_delegations,</div><div class='del'>-	},</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-void nfsd_fault_inject_init(void)</div><div class='del'>-{</div><div class='del'>-	unsigned int i;</div><div class='del'>-	struct nfsd_fault_inject_op *op;</div><div class='del'>-	umode_t mode = S_IFREG | S_IRUSR | S_IWUSR;</div><div class='del'>-</div><div class='del'>-	debug_dir = debugfs_create_dir("nfsd", NULL);</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; ARRAY_SIZE(inject_ops); i++) {</div><div class='del'>-		op = &amp;inject_ops[i];</div><div class='del'>-		debugfs_create_file(op-&gt;file, mode, debug_dir, op, &amp;fops_nfsd);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='head'>diff --git a/fs/nfsd/filecache.c b/fs/nfsd/filecache.c<br/>index fdf89fcf1a0c..93798575b807 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/filecache.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/filecache.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/filecache.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/filecache.c</a></div><div class='hunk'>@@ -1,17 +1,45 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='ctx'> /*</div><div class='del'>- * Open file cache.</div><div class='add'>+ * The NFSD open file cache.</div><div class='ctx'>  *</div><div class='ctx'>  * (c) 2015 - Jeff Layton &lt;jeff.layton@primarydata.com&gt;</div><div class='add'>+ *</div><div class='add'>+ * An nfsd_file object is a per-file collection of open state that binds</div><div class='add'>+ * together:</div><div class='add'>+ *   - a struct file *</div><div class='add'>+ *   - a user credential</div><div class='add'>+ *   - a network namespace</div><div class='add'>+ *   - a read-ahead context</div><div class='add'>+ *   - monitoring for writeback errors</div><div class='add'>+ *</div><div class='add'>+ * nfsd_file objects are reference-counted. Consumers acquire a new</div><div class='add'>+ * object via the nfsd_file_acquire API. They manage their interest in</div><div class='add'>+ * the acquired object, and hence the object's reference count, via</div><div class='add'>+ * nfsd_file_get and nfsd_file_put. There are two varieties of nfsd_file</div><div class='add'>+ * object:</div><div class='add'>+ *</div><div class='add'>+ *  * non-garbage-collected: When a consumer wants to precisely control</div><div class='add'>+ *    the lifetime of a file's open state, it acquires a non-garbage-</div><div class='add'>+ *    collected nfsd_file. The final nfsd_file_put releases the open</div><div class='add'>+ *    state immediately.</div><div class='add'>+ *</div><div class='add'>+ *  * garbage-collected: When a consumer does not control the lifetime</div><div class='add'>+ *    of open state, it acquires a garbage-collected nfsd_file. The</div><div class='add'>+ *    final nfsd_file_put allows the open state to linger for a period</div><div class='add'>+ *    during which it may be re-used.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/hash.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/file.h&gt;</div><div class='add'>+#include &lt;linux/pagemap.h&gt;</div><div class='ctx'> #include &lt;linux/sched.h&gt;</div><div class='ctx'> #include &lt;linux/list_lru.h&gt;</div><div class='ctx'> #include &lt;linux/fsnotify_backend.h&gt;</div><div class='ctx'> #include &lt;linux/fsnotify.h&gt;</div><div class='ctx'> #include &lt;linux/seq_file.h&gt;</div><div class='add'>+#include &lt;linux/rhashtable.h&gt;</div><div class='add'>+#include &lt;linux/nfslocalio.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "vfs.h"</div><div class='ctx'> #include "nfsd.h"</div><div class='hunk'>@@ -20,63 +48,73 @@</div><div class='ctx'> #include "filecache.h"</div><div class='ctx'> #include "trace.h"</div><div class='ctx'> </div><div class='del'>-#define NFSDDBG_FACILITY	NFSDDBG_FH</div><div class='del'>-</div><div class='del'>-/* FIXME: dynamically size this for the machine somehow? */</div><div class='del'>-#define NFSD_FILE_HASH_BITS                   12</div><div class='del'>-#define NFSD_FILE_HASH_SIZE                  (1 &lt;&lt; NFSD_FILE_HASH_BITS)</div><div class='ctx'> #define NFSD_LAUNDRETTE_DELAY		     (2 * HZ)</div><div class='ctx'> </div><div class='del'>-#define NFSD_FILE_SHUTDOWN		     (1)</div><div class='del'>-#define NFSD_FILE_LRU_THRESHOLD		     (4096UL)</div><div class='del'>-#define NFSD_FILE_LRU_LIMIT		     (NFSD_FILE_LRU_THRESHOLD &lt;&lt; 2)</div><div class='add'>+#define NFSD_FILE_CACHE_UP		     (0)</div><div class='ctx'> </div><div class='ctx'> /* We only care about NFSD_MAY_READ/WRITE for this cache */</div><div class='del'>-#define NFSD_FILE_MAY_MASK	(NFSD_MAY_READ|NFSD_MAY_WRITE)</div><div class='del'>-</div><div class='del'>-struct nfsd_fcache_bucket {</div><div class='del'>-	struct hlist_head	nfb_head;</div><div class='del'>-	spinlock_t		nfb_lock;</div><div class='del'>-	unsigned int		nfb_count;</div><div class='del'>-	unsigned int		nfb_maxcount;</div><div class='del'>-};</div><div class='add'>+#define NFSD_FILE_MAY_MASK	(NFSD_MAY_READ|NFSD_MAY_WRITE|NFSD_MAY_LOCALIO)</div><div class='ctx'> </div><div class='ctx'> static DEFINE_PER_CPU(unsigned long, nfsd_file_cache_hits);</div><div class='add'>+static DEFINE_PER_CPU(unsigned long, nfsd_file_acquisitions);</div><div class='add'>+static DEFINE_PER_CPU(unsigned long, nfsd_file_allocations);</div><div class='add'>+static DEFINE_PER_CPU(unsigned long, nfsd_file_releases);</div><div class='add'>+static DEFINE_PER_CPU(unsigned long, nfsd_file_total_age);</div><div class='add'>+static DEFINE_PER_CPU(unsigned long, nfsd_file_evictions);</div><div class='ctx'> </div><div class='ctx'> struct nfsd_fcache_disposal {</div><div class='del'>-	struct list_head list;</div><div class='del'>-	struct work_struct work;</div><div class='del'>-	struct net *net;</div><div class='ctx'> 	spinlock_t lock;</div><div class='ctx'> 	struct list_head freeme;</div><div class='del'>-	struct rcu_head rcu;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static struct workqueue_struct *nfsd_filecache_wq __read_mostly;</div><div class='del'>-</div><div class='ctx'> static struct kmem_cache		*nfsd_file_slab;</div><div class='ctx'> static struct kmem_cache		*nfsd_file_mark_slab;</div><div class='del'>-static struct nfsd_fcache_bucket	*nfsd_file_hashtbl;</div><div class='ctx'> static struct list_lru			nfsd_file_lru;</div><div class='del'>-static long				nfsd_file_lru_flags;</div><div class='add'>+static unsigned long			nfsd_file_flags;</div><div class='ctx'> static struct fsnotify_group		*nfsd_file_fsnotify_group;</div><div class='del'>-static atomic_long_t			nfsd_filecache_count;</div><div class='ctx'> static struct delayed_work		nfsd_filecache_laundrette;</div><div class='del'>-static DEFINE_SPINLOCK(laundrette_lock);</div><div class='del'>-static LIST_HEAD(laundrettes);</div><div class='add'>+static struct rhltable			nfsd_file_rhltable</div><div class='add'>+						____cacheline_aligned_in_smp;</div><div class='add'>+</div><div class='add'>+static bool</div><div class='add'>+nfsd_match_cred(const struct cred *c1, const struct cred *c2)</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	if (!uid_eq(c1-&gt;fsuid, c2-&gt;fsuid))</div><div class='add'>+		return false;</div><div class='add'>+	if (!gid_eq(c1-&gt;fsgid, c2-&gt;fsgid))</div><div class='add'>+		return false;</div><div class='add'>+	if (c1-&gt;group_info == NULL || c2-&gt;group_info == NULL)</div><div class='add'>+		return c1-&gt;group_info == c2-&gt;group_info;</div><div class='add'>+	if (c1-&gt;group_info-&gt;ngroups != c2-&gt;group_info-&gt;ngroups)</div><div class='add'>+		return false;</div><div class='add'>+	for (i = 0; i &lt; c1-&gt;group_info-&gt;ngroups; i++) {</div><div class='add'>+		if (!gid_eq(c1-&gt;group_info-&gt;gid[i], c2-&gt;group_info-&gt;gid[i]))</div><div class='add'>+			return false;</div><div class='add'>+	}</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-static void nfsd_file_gc(void);</div><div class='add'>+static const struct rhashtable_params nfsd_file_rhash_params = {</div><div class='add'>+	.key_len		= sizeof_field(struct nfsd_file, nf_inode),</div><div class='add'>+	.key_offset		= offsetof(struct nfsd_file, nf_inode),</div><div class='add'>+	.head_offset		= offsetof(struct nfsd_file, nf_rlist),</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Start with a single page hash table to reduce resizing churn</div><div class='add'>+	 * on light workloads.</div><div class='add'>+	 */</div><div class='add'>+	.min_size		= 256,</div><div class='add'>+	.automatic_shrinking	= true,</div><div class='add'>+};</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='ctx'> nfsd_file_schedule_laundrette(void)</div><div class='ctx'> {</div><div class='del'>-	long count = atomic_long_read(&amp;nfsd_filecache_count);</div><div class='del'>-</div><div class='del'>-	if (count == 0 || test_bit(NFSD_FILE_SHUTDOWN, &amp;nfsd_file_lru_flags))</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	queue_delayed_work(system_wq, &amp;nfsd_filecache_laundrette,</div><div class='del'>-			NFSD_LAUNDRETTE_DELAY);</div><div class='add'>+	if (test_bit(NFSD_FILE_CACHE_UP, &amp;nfsd_file_flags))</div><div class='add'>+		queue_delayed_work(system_dfl_wq, &amp;nfsd_filecache_laundrette,</div><div class='add'>+				   NFSD_LAUNDRETTE_DELAY);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='hunk'>@@ -115,22 +153,21 @@ nfsd_file_mark_put(struct nfsd_file_mark *nfm)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct nfsd_file_mark *</div><div class='del'>-nfsd_file_mark_find_or_create(struct nfsd_file *nf)</div><div class='add'>+nfsd_file_mark_find_or_create(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	int			err;</div><div class='ctx'> 	struct fsnotify_mark	*mark;</div><div class='ctx'> 	struct nfsd_file_mark	*nfm = NULL, *new;</div><div class='del'>-	struct inode *inode = nf-&gt;nf_inode;</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='del'>-		mutex_lock(&amp;nfsd_file_fsnotify_group-&gt;mark_mutex);</div><div class='del'>-		mark = fsnotify_find_mark(&amp;inode-&gt;i_fsnotify_marks,</div><div class='del'>-				nfsd_file_fsnotify_group);</div><div class='add'>+		fsnotify_group_lock(nfsd_file_fsnotify_group);</div><div class='add'>+		mark = fsnotify_find_inode_mark(inode,</div><div class='add'>+						nfsd_file_fsnotify_group);</div><div class='ctx'> 		if (mark) {</div><div class='ctx'> 			nfm = nfsd_file_mark_get(container_of(mark,</div><div class='ctx'> 						 struct nfsd_file_mark,</div><div class='ctx'> 						 nfm_mark));</div><div class='del'>-			mutex_unlock(&amp;nfsd_file_fsnotify_group-&gt;mark_mutex);</div><div class='add'>+			fsnotify_group_unlock(nfsd_file_fsnotify_group);</div><div class='ctx'> 			if (nfm) {</div><div class='ctx'> 				fsnotify_put_mark(mark);</div><div class='ctx'> 				break;</div><div class='hunk'>@@ -138,8 +175,9 @@ nfsd_file_mark_find_or_create(struct nfsd_file *nf)</div><div class='ctx'> 			/* Avoid soft lockup race with nfsd_file_mark_put() */</div><div class='ctx'> 			fsnotify_destroy_mark(mark, nfsd_file_fsnotify_group);</div><div class='ctx'> 			fsnotify_put_mark(mark);</div><div class='del'>-		} else</div><div class='del'>-			mutex_unlock(&amp;nfsd_file_fsnotify_group-&gt;mark_mutex);</div><div class='add'>+		} else {</div><div class='add'>+			fsnotify_group_unlock(nfsd_file_fsnotify_group);</div><div class='add'>+		}</div><div class='ctx'> </div><div class='ctx'> 		/* allocate a new nfm */</div><div class='ctx'> 		new = kmem_cache_alloc(nfsd_file_mark_slab, GFP_KERNEL);</div><div class='hunk'>@@ -170,320 +208,389 @@ nfsd_file_mark_find_or_create(struct nfsd_file *nf)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct nfsd_file *</div><div class='del'>-nfsd_file_alloc(struct inode *inode, unsigned int may, unsigned int hashval,</div><div class='del'>-		struct net *net)</div><div class='add'>+nfsd_file_alloc(struct net *net, struct inode *inode, unsigned char need,</div><div class='add'>+		bool want_gc)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd_file *nf;</div><div class='ctx'> </div><div class='ctx'> 	nf = kmem_cache_alloc(nfsd_file_slab, GFP_KERNEL);</div><div class='del'>-	if (nf) {</div><div class='del'>-		INIT_HLIST_NODE(&amp;nf-&gt;nf_node);</div><div class='del'>-		INIT_LIST_HEAD(&amp;nf-&gt;nf_lru);</div><div class='del'>-		nf-&gt;nf_file = NULL;</div><div class='del'>-		nf-&gt;nf_cred = get_current_cred();</div><div class='del'>-		nf-&gt;nf_net = net;</div><div class='del'>-		nf-&gt;nf_flags = 0;</div><div class='del'>-		nf-&gt;nf_inode = inode;</div><div class='del'>-		nf-&gt;nf_hashval = hashval;</div><div class='del'>-		refcount_set(&amp;nf-&gt;nf_ref, 1);</div><div class='del'>-		nf-&gt;nf_may = may &amp; NFSD_FILE_MAY_MASK;</div><div class='del'>-		if (may &amp; NFSD_MAY_NOT_BREAK_LEASE) {</div><div class='del'>-			if (may &amp; NFSD_MAY_WRITE)</div><div class='del'>-				__set_bit(NFSD_FILE_BREAK_WRITE, &amp;nf-&gt;nf_flags);</div><div class='del'>-			if (may &amp; NFSD_MAY_READ)</div><div class='del'>-				__set_bit(NFSD_FILE_BREAK_READ, &amp;nf-&gt;nf_flags);</div><div class='del'>-		}</div><div class='del'>-		nf-&gt;nf_mark = NULL;</div><div class='del'>-		init_rwsem(&amp;nf-&gt;nf_rwsem);</div><div class='del'>-		trace_nfsd_file_alloc(nf);</div><div class='del'>-	}</div><div class='del'>-	return nf;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool</div><div class='del'>-nfsd_file_free(struct nfsd_file *nf)</div><div class='del'>-{</div><div class='del'>-	bool flush = false;</div><div class='del'>-</div><div class='del'>-	trace_nfsd_file_put_final(nf);</div><div class='del'>-	if (nf-&gt;nf_mark)</div><div class='del'>-		nfsd_file_mark_put(nf-&gt;nf_mark);</div><div class='del'>-	if (nf-&gt;nf_file) {</div><div class='del'>-		get_file(nf-&gt;nf_file);</div><div class='del'>-		filp_close(nf-&gt;nf_file, NULL);</div><div class='del'>-		fput(nf-&gt;nf_file);</div><div class='del'>-		flush = true;</div><div class='del'>-	}</div><div class='del'>-	call_rcu(&amp;nf-&gt;nf_rcu, nfsd_file_slab_free);</div><div class='del'>-	return flush;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool</div><div class='del'>-nfsd_file_check_writeback(struct nfsd_file *nf)</div><div class='del'>-{</div><div class='del'>-	struct file *file = nf-&gt;nf_file;</div><div class='del'>-	struct address_space *mapping;</div><div class='add'>+	if (unlikely(!nf))</div><div class='add'>+		return NULL;</div><div class='ctx'> </div><div class='del'>-	if (!file || !(file-&gt;f_mode &amp; FMODE_WRITE))</div><div class='del'>-		return false;</div><div class='del'>-	mapping = file-&gt;f_mapping;</div><div class='del'>-	return mapping_tagged(mapping, PAGECACHE_TAG_DIRTY) ||</div><div class='del'>-		mapping_tagged(mapping, PAGECACHE_TAG_WRITEBACK);</div><div class='add'>+	this_cpu_inc(nfsd_file_allocations);</div><div class='add'>+	INIT_LIST_HEAD(&amp;nf-&gt;nf_lru);</div><div class='add'>+	INIT_LIST_HEAD(&amp;nf-&gt;nf_gc);</div><div class='add'>+	nf-&gt;nf_birthtime = ktime_get();</div><div class='add'>+	nf-&gt;nf_file = NULL;</div><div class='add'>+	nf-&gt;nf_cred = get_current_cred();</div><div class='add'>+	nf-&gt;nf_net = net;</div><div class='add'>+	nf-&gt;nf_flags = want_gc ?</div><div class='add'>+		BIT(NFSD_FILE_HASHED) | BIT(NFSD_FILE_PENDING) | BIT(NFSD_FILE_GC) :</div><div class='add'>+		BIT(NFSD_FILE_HASHED) | BIT(NFSD_FILE_PENDING);</div><div class='add'>+	nf-&gt;nf_inode = inode;</div><div class='add'>+	refcount_set(&amp;nf-&gt;nf_ref, 1);</div><div class='add'>+	nf-&gt;nf_may = need;</div><div class='add'>+	nf-&gt;nf_mark = NULL;</div><div class='add'>+	nf-&gt;nf_dio_mem_align = 0;</div><div class='add'>+	nf-&gt;nf_dio_offset_align = 0;</div><div class='add'>+	nf-&gt;nf_dio_read_offset_align = 0;</div><div class='add'>+	return nf;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int</div><div class='add'>+/**</div><div class='add'>+ * nfsd_file_check_write_error - check for writeback errors on a file</div><div class='add'>+ * @nf: nfsd_file to check for writeback errors</div><div class='add'>+ *</div><div class='add'>+ * Check whether a nfsd_file has an unseen error. Reset the write</div><div class='add'>+ * verifier if so.</div><div class='add'>+ */</div><div class='add'>+static void</div><div class='ctx'> nfsd_file_check_write_error(struct nfsd_file *nf)</div><div class='ctx'> {</div><div class='ctx'> 	struct file *file = nf-&gt;nf_file;</div><div class='ctx'> </div><div class='del'>-	if (!file || !(file-&gt;f_mode &amp; FMODE_WRITE))</div><div class='del'>-		return 0;</div><div class='del'>-	return filemap_check_wb_err(file-&gt;f_mapping, READ_ONCE(file-&gt;f_wb_err));</div><div class='add'>+	if ((file-&gt;f_mode &amp; FMODE_WRITE) &amp;&amp;</div><div class='add'>+	    filemap_check_wb_err(file-&gt;f_mapping, READ_ONCE(file-&gt;f_wb_err)))</div><div class='add'>+		nfsd_reset_write_verifier(net_generic(nf-&gt;nf_net, nfsd_net_id));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='del'>-nfsd_file_do_unhash(struct nfsd_file *nf)</div><div class='add'>+nfsd_file_hash_remove(struct nfsd_file *nf)</div><div class='ctx'> {</div><div class='del'>-	lockdep_assert_held(&amp;nfsd_file_hashtbl[nf-&gt;nf_hashval].nfb_lock);</div><div class='del'>-</div><div class='ctx'> 	trace_nfsd_file_unhash(nf);</div><div class='del'>-</div><div class='del'>-	if (nfsd_file_check_write_error(nf))</div><div class='del'>-		nfsd_reset_boot_verifier(net_generic(nf-&gt;nf_net, nfsd_net_id));</div><div class='del'>-	--nfsd_file_hashtbl[nf-&gt;nf_hashval].nfb_count;</div><div class='del'>-	hlist_del_rcu(&amp;nf-&gt;nf_node);</div><div class='del'>-	atomic_long_dec(&amp;nfsd_filecache_count);</div><div class='add'>+	rhltable_remove(&amp;nfsd_file_rhltable, &amp;nf-&gt;nf_rlist,</div><div class='add'>+			nfsd_file_rhash_params);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool</div><div class='ctx'> nfsd_file_unhash(struct nfsd_file *nf)</div><div class='ctx'> {</div><div class='ctx'> 	if (test_and_clear_bit(NFSD_FILE_HASHED, &amp;nf-&gt;nf_flags)) {</div><div class='del'>-		nfsd_file_do_unhash(nf);</div><div class='del'>-		if (!list_empty(&amp;nf-&gt;nf_lru))</div><div class='del'>-			list_lru_del(&amp;nfsd_file_lru, &amp;nf-&gt;nf_lru);</div><div class='add'>+		nfsd_file_hash_remove(nf);</div><div class='ctx'> 		return true;</div><div class='ctx'> 	}</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Return true if the file was unhashed.</div><div class='del'>- */</div><div class='del'>-static bool</div><div class='del'>-nfsd_file_unhash_and_release_locked(struct nfsd_file *nf, struct list_head *dispose)</div><div class='add'>+static void</div><div class='add'>+nfsd_file_free(struct nfsd_file *nf)</div><div class='ctx'> {</div><div class='del'>-	lockdep_assert_held(&amp;nfsd_file_hashtbl[nf-&gt;nf_hashval].nfb_lock);</div><div class='add'>+	s64 age = ktime_to_ms(ktime_sub(ktime_get(), nf-&gt;nf_birthtime));</div><div class='ctx'> </div><div class='del'>-	trace_nfsd_file_unhash_and_release_locked(nf);</div><div class='del'>-	if (!nfsd_file_unhash(nf))</div><div class='del'>-		return false;</div><div class='del'>-	/* keep final reference for nfsd_file_lru_dispose */</div><div class='del'>-	if (refcount_dec_not_one(&amp;nf-&gt;nf_ref))</div><div class='del'>-		return true;</div><div class='add'>+	trace_nfsd_file_free(nf);</div><div class='ctx'> </div><div class='del'>-	list_add(&amp;nf-&gt;nf_lru, dispose);</div><div class='del'>-	return true;</div><div class='add'>+	this_cpu_inc(nfsd_file_releases);</div><div class='add'>+	this_cpu_add(nfsd_file_total_age, age);</div><div class='add'>+</div><div class='add'>+	nfsd_file_unhash(nf);</div><div class='add'>+	if (nf-&gt;nf_mark)</div><div class='add'>+		nfsd_file_mark_put(nf-&gt;nf_mark);</div><div class='add'>+	if (nf-&gt;nf_file) {</div><div class='add'>+		nfsd_file_check_write_error(nf);</div><div class='add'>+		nfsd_filp_close(nf-&gt;nf_file);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If this item is still linked via nf_lru, that's a bug.</div><div class='add'>+	 * WARN and leak it to preserve system stability.</div><div class='add'>+	 */</div><div class='add'>+	if (WARN_ON_ONCE(!list_empty(&amp;nf-&gt;nf_lru)))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	call_rcu(&amp;nf-&gt;nf_rcu, nfsd_file_slab_free);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void</div><div class='del'>-nfsd_file_put_noref(struct nfsd_file *nf)</div><div class='add'>+static bool</div><div class='add'>+nfsd_file_check_writeback(struct nfsd_file *nf)</div><div class='ctx'> {</div><div class='del'>-	trace_nfsd_file_put(nf);</div><div class='add'>+	struct file *file = nf-&gt;nf_file;</div><div class='add'>+	struct address_space *mapping;</div><div class='ctx'> </div><div class='del'>-	if (refcount_dec_and_test(&amp;nf-&gt;nf_ref)) {</div><div class='del'>-		WARN_ON(test_bit(NFSD_FILE_HASHED, &amp;nf-&gt;nf_flags));</div><div class='del'>-		nfsd_file_free(nf);</div><div class='del'>-	}</div><div class='add'>+	/* File not open for write? */</div><div class='add'>+	if (!(file-&gt;f_mode &amp; FMODE_WRITE))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Some filesystems (e.g. NFS) flush all dirty data on close.</div><div class='add'>+	 * On others, there is no need to wait for writeback.</div><div class='add'>+	 */</div><div class='add'>+	if (!(file_inode(file)-&gt;i_sb-&gt;s_export_op-&gt;flags &amp; EXPORT_OP_FLUSH_ON_CLOSE))</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	mapping = file-&gt;f_mapping;</div><div class='add'>+	return mapping_tagged(mapping, PAGECACHE_TAG_DIRTY) ||</div><div class='add'>+		mapping_tagged(mapping, PAGECACHE_TAG_WRITEBACK);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void</div><div class='del'>-nfsd_file_put(struct nfsd_file *nf)</div><div class='add'>+static void nfsd_file_lru_add(struct nfsd_file *nf)</div><div class='ctx'> {</div><div class='del'>-	bool is_hashed;</div><div class='add'>+	refcount_inc(&amp;nf-&gt;nf_ref);</div><div class='add'>+	if (list_lru_add_obj(&amp;nfsd_file_lru, &amp;nf-&gt;nf_lru))</div><div class='add'>+		trace_nfsd_file_lru_add(nf);</div><div class='add'>+	else</div><div class='add'>+		WARN_ON(1);</div><div class='add'>+	nfsd_file_schedule_laundrette();</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	set_bit(NFSD_FILE_REFERENCED, &amp;nf-&gt;nf_flags);</div><div class='del'>-	if (refcount_read(&amp;nf-&gt;nf_ref) &gt; 2 || !nf-&gt;nf_file) {</div><div class='del'>-		nfsd_file_put_noref(nf);</div><div class='del'>-		return;</div><div class='add'>+static bool nfsd_file_lru_remove(struct nfsd_file *nf)</div><div class='add'>+{</div><div class='add'>+	if (list_lru_del_obj(&amp;nfsd_file_lru, &amp;nf-&gt;nf_lru)) {</div><div class='add'>+		trace_nfsd_file_lru_del(nf);</div><div class='add'>+		return true;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	filemap_flush(nf-&gt;nf_file-&gt;f_mapping);</div><div class='del'>-	is_hashed = test_bit(NFSD_FILE_HASHED, &amp;nf-&gt;nf_flags) != 0;</div><div class='del'>-	nfsd_file_put_noref(nf);</div><div class='del'>-	if (is_hashed)</div><div class='del'>-		nfsd_file_schedule_laundrette();</div><div class='del'>-	if (atomic_long_read(&amp;nfsd_filecache_count) &gt;= NFSD_FILE_LRU_LIMIT)</div><div class='del'>-		nfsd_file_gc();</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> struct nfsd_file *</div><div class='ctx'> nfsd_file_get(struct nfsd_file *nf)</div><div class='ctx'> {</div><div class='del'>-	if (likely(refcount_inc_not_zero(&amp;nf-&gt;nf_ref)))</div><div class='add'>+	if (nf &amp;&amp; refcount_inc_not_zero(&amp;nf-&gt;nf_ref))</div><div class='ctx'> 		return nf;</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void</div><div class='del'>-nfsd_file_dispose_list(struct list_head *dispose)</div><div class='add'>+/**</div><div class='add'>+ * nfsd_file_put - put the reference to a nfsd_file</div><div class='add'>+ * @nf: nfsd_file of which to put the reference</div><div class='add'>+ *</div><div class='add'>+ * Put a reference to a nfsd_file. In the non-GC case, we just put the</div><div class='add'>+ * reference immediately. In the GC case, if the reference would be</div><div class='add'>+ * the last one, the put it on the LRU instead to be cleaned up later.</div><div class='add'>+ */</div><div class='add'>+void</div><div class='add'>+nfsd_file_put(struct nfsd_file *nf)</div><div class='ctx'> {</div><div class='del'>-	struct nfsd_file *nf;</div><div class='add'>+	might_sleep();</div><div class='add'>+	trace_nfsd_file_put(nf);</div><div class='ctx'> </div><div class='del'>-	while(!list_empty(dispose)) {</div><div class='del'>-		nf = list_first_entry(dispose, struct nfsd_file, nf_lru);</div><div class='del'>-		list_del(&amp;nf-&gt;nf_lru);</div><div class='del'>-		nfsd_file_put_noref(nf);</div><div class='add'>+	if (test_bit(NFSD_FILE_GC, &amp;nf-&gt;nf_flags) &amp;&amp;</div><div class='add'>+	    test_bit(NFSD_FILE_HASHED, &amp;nf-&gt;nf_flags)) {</div><div class='add'>+		set_bit(NFSD_FILE_REFERENCED, &amp;nf-&gt;nf_flags);</div><div class='add'>+		set_bit(NFSD_FILE_RECENT, &amp;nf-&gt;nf_flags);</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	if (refcount_dec_and_test(&amp;nf-&gt;nf_ref))</div><div class='add'>+		nfsd_file_free(nf);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void</div><div class='del'>-nfsd_file_dispose_list_sync(struct list_head *dispose)</div><div class='add'>+/**</div><div class='add'>+ * nfsd_file_put_local - put nfsd_file reference and arm nfsd_net_put in caller</div><div class='add'>+ * @pnf: nfsd_file of which to put the reference</div><div class='add'>+ *</div><div class='add'>+ * First save the associated net to return to caller, then put</div><div class='add'>+ * the reference of the nfsd_file.</div><div class='add'>+ */</div><div class='add'>+struct net *</div><div class='add'>+nfsd_file_put_local(struct nfsd_file __rcu **pnf)</div><div class='ctx'> {</div><div class='del'>-	bool flush = false;</div><div class='ctx'> 	struct nfsd_file *nf;</div><div class='add'>+	struct net *net = NULL;</div><div class='ctx'> </div><div class='del'>-	while(!list_empty(dispose)) {</div><div class='del'>-		nf = list_first_entry(dispose, struct nfsd_file, nf_lru);</div><div class='del'>-		list_del(&amp;nf-&gt;nf_lru);</div><div class='del'>-		if (!refcount_dec_and_test(&amp;nf-&gt;nf_ref))</div><div class='del'>-			continue;</div><div class='del'>-		if (nfsd_file_free(nf))</div><div class='del'>-			flush = true;</div><div class='add'>+	nf = unrcu_pointer(xchg(pnf, NULL));</div><div class='add'>+	if (nf) {</div><div class='add'>+		net = nf-&gt;nf_net;</div><div class='add'>+		nfsd_file_put(nf);</div><div class='ctx'> 	}</div><div class='del'>-	if (flush)</div><div class='del'>-		flush_delayed_fput();</div><div class='add'>+	return net;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void</div><div class='del'>-nfsd_file_list_remove_disposal(struct list_head *dst,</div><div class='del'>-		struct nfsd_fcache_disposal *l)</div><div class='add'>+/**</div><div class='add'>+ * nfsd_file_file - get the backing file of an nfsd_file</div><div class='add'>+ * @nf: nfsd_file of which to access the backing file.</div><div class='add'>+ *</div><div class='add'>+ * Return backing file for @nf.</div><div class='add'>+ */</div><div class='add'>+struct file *</div><div class='add'>+nfsd_file_file(struct nfsd_file *nf)</div><div class='ctx'> {</div><div class='del'>-	spin_lock(&amp;l-&gt;lock);</div><div class='del'>-	list_splice_init(&amp;l-&gt;freeme, dst);</div><div class='del'>-	spin_unlock(&amp;l-&gt;lock);</div><div class='add'>+	return nf-&gt;nf_file;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='del'>-nfsd_file_list_add_disposal(struct list_head *files, struct net *net)</div><div class='add'>+nfsd_file_dispose_list(struct list_head *dispose)</div><div class='ctx'> {</div><div class='del'>-	struct nfsd_fcache_disposal *l;</div><div class='add'>+	struct nfsd_file *nf;</div><div class='ctx'> </div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	list_for_each_entry_rcu(l, &amp;laundrettes, list) {</div><div class='del'>-		if (l-&gt;net == net) {</div><div class='del'>-			spin_lock(&amp;l-&gt;lock);</div><div class='del'>-			list_splice_tail_init(files, &amp;l-&gt;freeme);</div><div class='del'>-			spin_unlock(&amp;l-&gt;lock);</div><div class='del'>-			queue_work(nfsd_filecache_wq, &amp;l-&gt;work);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='add'>+	while (!list_empty(dispose)) {</div><div class='add'>+		nf = list_first_entry(dispose, struct nfsd_file, nf_gc);</div><div class='add'>+		list_del_init(&amp;nf-&gt;nf_gc);</div><div class='add'>+		nfsd_file_free(nf);</div><div class='ctx'> 	}</div><div class='del'>-	rcu_read_unlock();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * nfsd_file_dispose_list_delayed - move list of dead files to net's freeme list</div><div class='add'>+ * @dispose: list of nfsd_files to be disposed</div><div class='add'>+ *</div><div class='add'>+ * Transfers each file to the "freeme" list for its nfsd_net, to eventually</div><div class='add'>+ * be disposed of by the per-net garbage collector.</div><div class='add'>+ */</div><div class='ctx'> static void</div><div class='del'>-nfsd_file_list_add_pernet(struct list_head *dst, struct list_head *src,</div><div class='del'>-		struct net *net)</div><div class='add'>+nfsd_file_dispose_list_delayed(struct list_head *dispose)</div><div class='ctx'> {</div><div class='del'>-	struct nfsd_file *nf, *tmp;</div><div class='add'>+	while(!list_empty(dispose)) {</div><div class='add'>+		struct nfsd_file *nf = list_first_entry(dispose,</div><div class='add'>+						struct nfsd_file, nf_gc);</div><div class='add'>+		struct nfsd_net *nn = net_generic(nf-&gt;nf_net, nfsd_net_id);</div><div class='add'>+		struct nfsd_fcache_disposal *l = nn-&gt;fcache_disposal;</div><div class='add'>+		struct svc_serv *serv;</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;l-&gt;lock);</div><div class='add'>+		list_move_tail(&amp;nf-&gt;nf_gc, &amp;l-&gt;freeme);</div><div class='add'>+		spin_unlock(&amp;l-&gt;lock);</div><div class='ctx'> </div><div class='del'>-	list_for_each_entry_safe(nf, tmp, src, nf_lru) {</div><div class='del'>-		if (nf-&gt;nf_net == net)</div><div class='del'>-			list_move_tail(&amp;nf-&gt;nf_lru, dst);</div><div class='add'>+		/*</div><div class='add'>+		 * The filecache laundrette is shut down after the</div><div class='add'>+		 * nn-&gt;nfsd_serv pointer is cleared, but before the</div><div class='add'>+		 * svc_serv is freed.</div><div class='add'>+		 */</div><div class='add'>+		serv = nn-&gt;nfsd_serv;</div><div class='add'>+		if (serv)</div><div class='add'>+			svc_wake_up(serv);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void</div><div class='del'>-nfsd_file_dispose_list_delayed(struct list_head *dispose)</div><div class='add'>+/**</div><div class='add'>+ * nfsd_file_net_dispose - deal with nfsd_files waiting to be disposed.</div><div class='add'>+ * @nn: nfsd_net in which to find files to be disposed.</div><div class='add'>+ *</div><div class='add'>+ * When files held open for nfsv3 are removed from the filecache, whether</div><div class='add'>+ * due to memory pressure or garbage collection, they are queued to</div><div class='add'>+ * a per-net-ns queue.  This function completes the disposal, either</div><div class='add'>+ * directly or by waking another nfsd thread to help with the work.</div><div class='add'>+ */</div><div class='add'>+void nfsd_file_net_dispose(struct nfsd_net *nn)</div><div class='ctx'> {</div><div class='del'>-	LIST_HEAD(list);</div><div class='del'>-	struct nfsd_file *nf;</div><div class='del'>-</div><div class='del'>-	while(!list_empty(dispose)) {</div><div class='del'>-		nf = list_first_entry(dispose, struct nfsd_file, nf_lru);</div><div class='del'>-		nfsd_file_list_add_pernet(&amp;list, dispose, nf-&gt;nf_net);</div><div class='del'>-		nfsd_file_list_add_disposal(&amp;list, nf-&gt;nf_net);</div><div class='add'>+	struct nfsd_fcache_disposal *l = nn-&gt;fcache_disposal;</div><div class='add'>+</div><div class='add'>+	if (!list_empty(&amp;l-&gt;freeme)) {</div><div class='add'>+		LIST_HEAD(dispose);</div><div class='add'>+		int i;</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;l-&gt;lock);</div><div class='add'>+		for (i = 0; i &lt; 8 &amp;&amp; !list_empty(&amp;l-&gt;freeme); i++)</div><div class='add'>+			list_move(l-&gt;freeme.next, &amp;dispose);</div><div class='add'>+		spin_unlock(&amp;l-&gt;lock);</div><div class='add'>+		if (!list_empty(&amp;l-&gt;freeme))</div><div class='add'>+			/* Wake up another thread to share the work</div><div class='add'>+			 * *before* doing any actual disposing.</div><div class='add'>+			 */</div><div class='add'>+			svc_wake_up(nn-&gt;nfsd_serv);</div><div class='add'>+		nfsd_file_dispose_list(&amp;dispose);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Note this can deadlock with nfsd_file_cache_purge.</div><div class='add'>+/**</div><div class='add'>+ * nfsd_file_lru_cb - Examine an entry on the LRU list</div><div class='add'>+ * @item: LRU entry to examine</div><div class='add'>+ * @lru: controlling LRU</div><div class='add'>+ * @arg: dispose list</div><div class='add'>+ *</div><div class='add'>+ * Return values:</div><div class='add'>+ *   %LRU_REMOVED: @item was removed from the LRU</div><div class='add'>+ *   %LRU_ROTATE: @item is to be moved to the LRU tail</div><div class='add'>+ *   %LRU_SKIP: @item cannot be evicted</div><div class='ctx'>  */</div><div class='ctx'> static enum lru_status</div><div class='ctx'> nfsd_file_lru_cb(struct list_head *item, struct list_lru_one *lru,</div><div class='del'>-		 spinlock_t *lock, void *arg)</div><div class='del'>-	__releases(lock)</div><div class='del'>-	__acquires(lock)</div><div class='add'>+		 void *arg)</div><div class='ctx'> {</div><div class='ctx'> 	struct list_head *head = arg;</div><div class='ctx'> 	struct nfsd_file *nf = list_entry(item, struct nfsd_file, nf_lru);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Do a lockless refcount check. The hashtable holds one reference, so</div><div class='del'>-	 * we look to see if anything else has a reference, or if any have</div><div class='del'>-	 * been put since the shrinker last ran. Those don't get unhashed and</div><div class='del'>-	 * released.</div><div class='del'>-	 *</div><div class='del'>-	 * Note that in the put path, we set the flag and then decrement the</div><div class='del'>-	 * counter. Here we check the counter and then test and clear the flag.</div><div class='del'>-	 * That order is deliberate to ensure that we can do this locklessly.</div><div class='del'>-	 */</div><div class='del'>-	if (refcount_read(&amp;nf-&gt;nf_ref) &gt; 1)</div><div class='del'>-		goto out_skip;</div><div class='add'>+	/* We should only be dealing with GC entries here */</div><div class='add'>+	WARN_ON_ONCE(!test_bit(NFSD_FILE_GC, &amp;nf-&gt;nf_flags));</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Don't throw out files that are still undergoing I/O or</div><div class='ctx'> 	 * that have uncleared errors pending.</div><div class='ctx'> 	 */</div><div class='del'>-	if (nfsd_file_check_writeback(nf))</div><div class='del'>-		goto out_skip;</div><div class='add'>+	if (nfsd_file_check_writeback(nf)) {</div><div class='add'>+		trace_nfsd_file_gc_writeback(nf);</div><div class='add'>+		return LRU_SKIP;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (test_and_clear_bit(NFSD_FILE_REFERENCED, &amp;nf-&gt;nf_flags))</div><div class='del'>-		goto out_skip;</div><div class='add'>+	/* If it was recently added to the list, skip it */</div><div class='add'>+	if (test_and_clear_bit(NFSD_FILE_REFERENCED, &amp;nf-&gt;nf_flags)) {</div><div class='add'>+		trace_nfsd_file_gc_referenced(nf);</div><div class='add'>+		return LRU_ROTATE;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	if (!test_and_clear_bit(NFSD_FILE_HASHED, &amp;nf-&gt;nf_flags))</div><div class='del'>-		goto out_skip;</div><div class='add'>+	/*</div><div class='add'>+	 * Put the reference held on behalf of the LRU if it is the last</div><div class='add'>+	 * reference, else rotate.</div><div class='add'>+	 */</div><div class='add'>+	if (!refcount_dec_if_one(&amp;nf-&gt;nf_ref)) {</div><div class='add'>+		trace_nfsd_file_gc_in_use(nf);</div><div class='add'>+		return LRU_ROTATE;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	list_lru_isolate_move(lru, &amp;nf-&gt;nf_lru, head);</div><div class='add'>+	/* Refcount went to zero. Unhash it and queue it to the dispose list */</div><div class='add'>+	nfsd_file_unhash(nf);</div><div class='add'>+	list_lru_isolate(lru, &amp;nf-&gt;nf_lru);</div><div class='add'>+	list_add(&amp;nf-&gt;nf_gc, head);</div><div class='add'>+	this_cpu_inc(nfsd_file_evictions);</div><div class='add'>+	trace_nfsd_file_gc_disposed(nf);</div><div class='ctx'> 	return LRU_REMOVED;</div><div class='del'>-out_skip:</div><div class='del'>-	return LRU_SKIP;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static unsigned long</div><div class='del'>-nfsd_file_lru_walk_list(struct shrink_control *sc)</div><div class='add'>+static enum lru_status</div><div class='add'>+nfsd_file_gc_cb(struct list_head *item, struct list_lru_one *lru,</div><div class='add'>+		 void *arg)</div><div class='ctx'> {</div><div class='del'>-	LIST_HEAD(head);</div><div class='del'>-	struct nfsd_file *nf;</div><div class='del'>-	unsigned long ret;</div><div class='add'>+	struct nfsd_file *nf = list_entry(item, struct nfsd_file, nf_lru);</div><div class='ctx'> </div><div class='del'>-	if (sc)</div><div class='del'>-		ret = list_lru_shrink_walk(&amp;nfsd_file_lru, sc,</div><div class='del'>-				nfsd_file_lru_cb, &amp;head);</div><div class='del'>-	else</div><div class='del'>-		ret = list_lru_walk(&amp;nfsd_file_lru,</div><div class='del'>-				nfsd_file_lru_cb,</div><div class='del'>-				&amp;head, LONG_MAX);</div><div class='del'>-	list_for_each_entry(nf, &amp;head, nf_lru) {</div><div class='del'>-		spin_lock(&amp;nfsd_file_hashtbl[nf-&gt;nf_hashval].nfb_lock);</div><div class='del'>-		nfsd_file_do_unhash(nf);</div><div class='del'>-		spin_unlock(&amp;nfsd_file_hashtbl[nf-&gt;nf_hashval].nfb_lock);</div><div class='add'>+	if (test_and_clear_bit(NFSD_FILE_RECENT, &amp;nf-&gt;nf_flags)) {</div><div class='add'>+		/*</div><div class='add'>+		 * "REFERENCED" really means "should be at the end of the</div><div class='add'>+		 * LRU. As we are putting it there we can clear the flag.</div><div class='add'>+		 */</div><div class='add'>+		clear_bit(NFSD_FILE_REFERENCED, &amp;nf-&gt;nf_flags);</div><div class='add'>+		trace_nfsd_file_gc_aged(nf);</div><div class='add'>+		return LRU_ROTATE;</div><div class='ctx'> 	}</div><div class='del'>-	nfsd_file_dispose_list_delayed(&amp;head);</div><div class='del'>-	return ret;</div><div class='add'>+	return nfsd_file_lru_cb(item, lru, arg);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/* If the shrinker runs between calls to list_lru_walk_node() in</div><div class='add'>+ * nfsd_file_gc(), the "remaining" count will be wrong.  This could</div><div class='add'>+ * result in premature freeing of some files.  This may not matter much</div><div class='add'>+ * but is easy to fix with this spinlock which temporarily disables</div><div class='add'>+ * the shrinker.</div><div class='add'>+ */</div><div class='add'>+static DEFINE_SPINLOCK(nfsd_gc_lock);</div><div class='ctx'> static void</div><div class='ctx'> nfsd_file_gc(void)</div><div class='ctx'> {</div><div class='del'>-	nfsd_file_lru_walk_list(NULL);</div><div class='add'>+	unsigned long ret = 0;</div><div class='add'>+	LIST_HEAD(dispose);</div><div class='add'>+	int nid;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;nfsd_gc_lock);</div><div class='add'>+	for_each_node_state(nid, N_NORMAL_MEMORY) {</div><div class='add'>+		unsigned long remaining = list_lru_count_node(&amp;nfsd_file_lru, nid);</div><div class='add'>+</div><div class='add'>+		while (remaining &gt; 0) {</div><div class='add'>+			unsigned long nr = min(remaining, NFSD_FILE_GC_BATCH);</div><div class='add'>+</div><div class='add'>+			remaining -= nr;</div><div class='add'>+			ret += list_lru_walk_node(&amp;nfsd_file_lru, nid, nfsd_file_gc_cb,</div><div class='add'>+						  &amp;dispose, &amp;nr);</div><div class='add'>+			if (nr)</div><div class='add'>+				/* walk aborted early */</div><div class='add'>+				remaining = 0;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;nfsd_gc_lock);</div><div class='add'>+	trace_nfsd_file_gc_removed(ret, list_lru_count(&amp;nfsd_file_lru));</div><div class='add'>+	nfsd_file_dispose_list_delayed(&amp;dispose);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='ctx'> nfsd_file_gc_worker(struct work_struct *work)</div><div class='ctx'> {</div><div class='del'>-	nfsd_file_gc();</div><div class='add'>+	if (list_lru_count(&amp;nfsd_file_lru))</div><div class='add'>+		nfsd_file_gc();</div><div class='ctx'> 	nfsd_file_schedule_laundrette();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -496,100 +603,136 @@ nfsd_file_lru_count(struct shrinker *s, struct shrink_control *sc)</div><div class='ctx'> static unsigned long</div><div class='ctx'> nfsd_file_lru_scan(struct shrinker *s, struct shrink_control *sc)</div><div class='ctx'> {</div><div class='del'>-	return nfsd_file_lru_walk_list(sc);</div><div class='add'>+	LIST_HEAD(dispose);</div><div class='add'>+	unsigned long ret;</div><div class='add'>+</div><div class='add'>+	if (!spin_trylock(&amp;nfsd_gc_lock))</div><div class='add'>+		return SHRINK_STOP;</div><div class='add'>+</div><div class='add'>+	ret = list_lru_shrink_walk(&amp;nfsd_file_lru, sc,</div><div class='add'>+				   nfsd_file_lru_cb, &amp;dispose);</div><div class='add'>+	spin_unlock(&amp;nfsd_gc_lock);</div><div class='add'>+	trace_nfsd_file_shrinker_removed(ret, list_lru_count(&amp;nfsd_file_lru));</div><div class='add'>+	nfsd_file_dispose_list_delayed(&amp;dispose);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct shrinker	nfsd_file_shrinker = {</div><div class='del'>-	.scan_objects = nfsd_file_lru_scan,</div><div class='del'>-	.count_objects = nfsd_file_lru_count,</div><div class='del'>-	.seeks = 1,</div><div class='del'>-};</div><div class='add'>+static struct shrinker *nfsd_file_shrinker;</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * nfsd_file_cond_queue - conditionally unhash and queue a nfsd_file</div><div class='add'>+ * @nf: nfsd_file to attempt to queue</div><div class='add'>+ * @dispose: private list to queue successfully-put objects</div><div class='add'>+ *</div><div class='add'>+ * Unhash an nfsd_file, try to get a reference to it, and then put that</div><div class='add'>+ * reference. If it's the last reference, queue it to the dispose list.</div><div class='add'>+ */</div><div class='ctx'> static void</div><div class='del'>-__nfsd_file_close_inode(struct inode *inode, unsigned int hashval,</div><div class='del'>-			struct list_head *dispose)</div><div class='add'>+nfsd_file_cond_queue(struct nfsd_file *nf, struct list_head *dispose)</div><div class='add'>+	__must_hold(RCU)</div><div class='ctx'> {</div><div class='del'>-	struct nfsd_file	*nf;</div><div class='del'>-	struct hlist_node	*tmp;</div><div class='add'>+	int decrement = 1;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;nfsd_file_hashtbl[hashval].nfb_lock);</div><div class='del'>-	hlist_for_each_entry_safe(nf, tmp, &amp;nfsd_file_hashtbl[hashval].nfb_head, nf_node) {</div><div class='del'>-		if (inode == nf-&gt;nf_inode)</div><div class='del'>-			nfsd_file_unhash_and_release_locked(nf, dispose);</div><div class='add'>+	/* If we raced with someone else unhashing, ignore it */</div><div class='add'>+	if (!nfsd_file_unhash(nf))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/* If we can't get a reference, ignore it */</div><div class='add'>+	if (!nfsd_file_get(nf))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/* Extra decrement if we remove from the LRU */</div><div class='add'>+	if (nfsd_file_lru_remove(nf))</div><div class='add'>+		++decrement;</div><div class='add'>+</div><div class='add'>+	/* If refcount goes to 0, then put on the dispose list */</div><div class='add'>+	if (refcount_sub_and_test(decrement, &amp;nf-&gt;nf_ref)) {</div><div class='add'>+		list_add(&amp;nf-&gt;nf_gc, dispose);</div><div class='add'>+		trace_nfsd_file_closing(nf);</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;nfsd_file_hashtbl[hashval].nfb_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * nfsd_file_close_inode_sync - attempt to forcibly close a nfsd_file</div><div class='del'>- * @inode: inode of the file to attempt to remove</div><div class='add'>+ * nfsd_file_queue_for_close: try to close out any open nfsd_files for an inode</div><div class='add'>+ * @inode:   inode on which to close out nfsd_files</div><div class='add'>+ * @dispose: list on which to gather nfsd_files to close out</div><div class='add'>+ *</div><div class='add'>+ * An nfsd_file represents a struct file being held open on behalf of nfsd.</div><div class='add'>+ * An open file however can block other activity (such as leases), or cause</div><div class='add'>+ * undesirable behavior (e.g. spurious silly-renames when reexporting NFS).</div><div class='add'>+ *</div><div class='add'>+ * This function is intended to find open nfsd_files when this sort of</div><div class='add'>+ * conflicting access occurs and then attempt to close those files out.</div><div class='ctx'>  *</div><div class='del'>- * Walk the whole hash bucket, looking for any files that correspond to "inode".</div><div class='del'>- * If any do, then unhash them and put the hashtable reference to them and</div><div class='del'>- * destroy any that had their last reference put. Also ensure that any of the</div><div class='del'>- * fputs also have their final __fput done as well.</div><div class='add'>+ * Populates the dispose list with entries that have already had their</div><div class='add'>+ * refcounts go to zero. The actual free of an nfsd_file can be expensive,</div><div class='add'>+ * so we leave it up to the caller whether it wants to wait or not.</div><div class='ctx'>  */</div><div class='del'>-void</div><div class='del'>-nfsd_file_close_inode_sync(struct inode *inode)</div><div class='add'>+static void</div><div class='add'>+nfsd_file_queue_for_close(struct inode *inode, struct list_head *dispose)</div><div class='ctx'> {</div><div class='del'>-	unsigned int		hashval = (unsigned int)hash_long(inode-&gt;i_ino,</div><div class='del'>-						NFSD_FILE_HASH_BITS);</div><div class='del'>-	LIST_HEAD(dispose);</div><div class='add'>+	struct rhlist_head *tmp, *list;</div><div class='add'>+	struct nfsd_file *nf;</div><div class='ctx'> </div><div class='del'>-	__nfsd_file_close_inode(inode, hashval, &amp;dispose);</div><div class='del'>-	trace_nfsd_file_close_inode_sync(inode, hashval, !list_empty(&amp;dispose));</div><div class='del'>-	nfsd_file_dispose_list_sync(&amp;dispose);</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	list = rhltable_lookup(&amp;nfsd_file_rhltable, &amp;inode,</div><div class='add'>+			       nfsd_file_rhash_params);</div><div class='add'>+	rhl_for_each_entry_rcu(nf, tmp, list, nf_rlist) {</div><div class='add'>+		if (!test_bit(NFSD_FILE_GC, &amp;nf-&gt;nf_flags))</div><div class='add'>+			continue;</div><div class='add'>+		nfsd_file_cond_queue(nf, dispose);</div><div class='add'>+	}</div><div class='add'>+	rcu_read_unlock();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * nfsd_file_close_inode - attempt a delayed close of a nfsd_file</div><div class='ctx'>  * @inode: inode of the file to attempt to remove</div><div class='ctx'>  *</div><div class='del'>- * Walk the whole hash bucket, looking for any files that correspond to "inode".</div><div class='del'>- * If any do, then unhash them and put the hashtable reference to them and</div><div class='del'>- * destroy any that had their last reference put.</div><div class='add'>+ * Close out any open nfsd_files that can be reaped for @inode. The</div><div class='add'>+ * actual freeing is deferred to the dispose_list_delayed infrastructure.</div><div class='add'>+ *</div><div class='add'>+ * This is used by the fsnotify callbacks and setlease notifier.</div><div class='ctx'>  */</div><div class='ctx'> static void</div><div class='ctx'> nfsd_file_close_inode(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	unsigned int		hashval = (unsigned int)hash_long(inode-&gt;i_ino,</div><div class='del'>-						NFSD_FILE_HASH_BITS);</div><div class='ctx'> 	LIST_HEAD(dispose);</div><div class='ctx'> </div><div class='del'>-	__nfsd_file_close_inode(inode, hashval, &amp;dispose);</div><div class='del'>-	trace_nfsd_file_close_inode(inode, hashval, !list_empty(&amp;dispose));</div><div class='add'>+	nfsd_file_queue_for_close(inode, &amp;dispose);</div><div class='ctx'> 	nfsd_file_dispose_list_delayed(&amp;dispose);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * nfsd_file_delayed_close - close unused nfsd_files</div><div class='del'>- * @work: dummy</div><div class='add'>+ * nfsd_file_close_inode_sync - attempt to forcibly close a nfsd_file</div><div class='add'>+ * @inode: inode of the file to attempt to remove</div><div class='ctx'>  *</div><div class='del'>- * Walk the LRU list and close any entries that have not been used since</div><div class='del'>- * the last scan.</div><div class='add'>+ * Close out any open nfsd_files that can be reaped for @inode. The</div><div class='add'>+ * nfsd_files are closed out synchronously.</div><div class='ctx'>  *</div><div class='del'>- * Note this can deadlock with nfsd_file_cache_purge.</div><div class='add'>+ * This is called from nfsd_rename and nfsd_unlink to avoid silly-renames</div><div class='add'>+ * when reexporting NFS.</div><div class='ctx'>  */</div><div class='del'>-static void</div><div class='del'>-nfsd_file_delayed_close(struct work_struct *work)</div><div class='add'>+void</div><div class='add'>+nfsd_file_close_inode_sync(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	LIST_HEAD(head);</div><div class='del'>-	struct nfsd_fcache_disposal *l = container_of(work,</div><div class='del'>-			struct nfsd_fcache_disposal, work);</div><div class='add'>+	LIST_HEAD(dispose);</div><div class='add'>+</div><div class='add'>+	trace_nfsd_file_close(inode);</div><div class='ctx'> </div><div class='del'>-	nfsd_file_list_remove_disposal(&amp;head, l);</div><div class='del'>-	nfsd_file_dispose_list(&amp;head);</div><div class='add'>+	nfsd_file_queue_for_close(inode, &amp;dispose);</div><div class='add'>+	nfsd_file_dispose_list(&amp;dispose);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='ctx'> nfsd_file_lease_notifier_call(struct notifier_block *nb, unsigned long arg,</div><div class='ctx'> 			    void *data)</div><div class='ctx'> {</div><div class='del'>-	struct file_lock *fl = data;</div><div class='add'>+	struct file_lease *fl = data;</div><div class='ctx'> </div><div class='ctx'> 	/* Only close files for F_SETLEASE leases */</div><div class='del'>-	if (fl-&gt;fl_flags &amp; FL_LEASE)</div><div class='del'>-		nfsd_file_close_inode_sync(file_inode(fl-&gt;fl_file));</div><div class='add'>+	if (fl-&gt;c.flc_flags &amp; FL_LEASE)</div><div class='add'>+		nfsd_file_close_inode(file_inode(fl-&gt;c.flc_file));</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -632,59 +775,56 @@ static const struct fsnotify_ops nfsd_file_fsnotify_ops = {</div><div class='ctx'> int</div><div class='ctx'> nfsd_file_cache_init(void)</div><div class='ctx'> {</div><div class='del'>-	int		ret = -ENOMEM;</div><div class='del'>-	unsigned int	i;</div><div class='add'>+	int ret;</div><div class='ctx'> </div><div class='del'>-	clear_bit(NFSD_FILE_SHUTDOWN, &amp;nfsd_file_lru_flags);</div><div class='del'>-</div><div class='del'>-	if (nfsd_file_hashtbl)</div><div class='add'>+	lockdep_assert_held(&amp;nfsd_mutex);</div><div class='add'>+	if (test_and_set_bit(NFSD_FILE_CACHE_UP, &amp;nfsd_file_flags) == 1)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	nfsd_filecache_wq = alloc_workqueue("nfsd_filecache", 0, 0);</div><div class='del'>-	if (!nfsd_filecache_wq)</div><div class='add'>+	ret = rhltable_init(&amp;nfsd_file_rhltable, &amp;nfsd_file_rhash_params);</div><div class='add'>+	if (ret)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	nfsd_file_hashtbl = kcalloc(NFSD_FILE_HASH_SIZE,</div><div class='del'>-				sizeof(*nfsd_file_hashtbl), GFP_KERNEL);</div><div class='del'>-	if (!nfsd_file_hashtbl) {</div><div class='del'>-		pr_err("nfsd: unable to allocate nfsd_file_hashtbl\n");</div><div class='del'>-		goto out_err;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	nfsd_file_slab = kmem_cache_create("nfsd_file",</div><div class='del'>-				sizeof(struct nfsd_file), 0, 0, NULL);</div><div class='add'>+	ret = -ENOMEM;</div><div class='add'>+	nfsd_file_slab = KMEM_CACHE(nfsd_file, 0);</div><div class='ctx'> 	if (!nfsd_file_slab) {</div><div class='ctx'> 		pr_err("nfsd: unable to create nfsd_file_slab\n");</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	nfsd_file_mark_slab = kmem_cache_create("nfsd_file_mark",</div><div class='del'>-					sizeof(struct nfsd_file_mark), 0, 0, NULL);</div><div class='add'>+	nfsd_file_mark_slab = KMEM_CACHE(nfsd_file_mark, 0);</div><div class='ctx'> 	if (!nfsd_file_mark_slab) {</div><div class='ctx'> 		pr_err("nfsd: unable to create nfsd_file_mark_slab\n");</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-</div><div class='ctx'> 	ret = list_lru_init(&amp;nfsd_file_lru);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		pr_err("nfsd: failed to init nfsd_file_lru: %d\n", ret);</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	ret = register_shrinker(&amp;nfsd_file_shrinker);</div><div class='del'>-	if (ret) {</div><div class='del'>-		pr_err("nfsd: failed to register nfsd_file_shrinker: %d\n", ret);</div><div class='add'>+	nfsd_file_shrinker = shrinker_alloc(0, "nfsd-filecache");</div><div class='add'>+	if (!nfsd_file_shrinker) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		pr_err("nfsd: failed to allocate nfsd_file_shrinker\n");</div><div class='ctx'> 		goto out_lru;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	nfsd_file_shrinker-&gt;count_objects = nfsd_file_lru_count;</div><div class='add'>+	nfsd_file_shrinker-&gt;scan_objects = nfsd_file_lru_scan;</div><div class='add'>+	nfsd_file_shrinker-&gt;seeks = 1;</div><div class='add'>+</div><div class='add'>+	shrinker_register(nfsd_file_shrinker);</div><div class='add'>+</div><div class='ctx'> 	ret = lease_register_notifier(&amp;nfsd_file_lease_notifier);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		pr_err("nfsd: unable to register lease notifier: %d\n", ret);</div><div class='ctx'> 		goto out_shrinker;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	nfsd_file_fsnotify_group = fsnotify_alloc_group(&amp;nfsd_file_fsnotify_ops);</div><div class='add'>+	nfsd_file_fsnotify_group = fsnotify_alloc_group(&amp;nfsd_file_fsnotify_ops,</div><div class='add'>+							0);</div><div class='ctx'> 	if (IS_ERR(nfsd_file_fsnotify_group)) {</div><div class='ctx'> 		pr_err("nfsd: unable to create fsnotify group: %ld\n",</div><div class='ctx'> 			PTR_ERR(nfsd_file_fsnotify_group));</div><div class='hunk'>@@ -693,18 +833,15 @@ nfsd_file_cache_init(void)</div><div class='ctx'> 		goto out_notifier;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; NFSD_FILE_HASH_SIZE; i++) {</div><div class='del'>-		INIT_HLIST_HEAD(&amp;nfsd_file_hashtbl[i].nfb_head);</div><div class='del'>-		spin_lock_init(&amp;nfsd_file_hashtbl[i].nfb_lock);</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	INIT_DELAYED_WORK(&amp;nfsd_filecache_laundrette, nfsd_file_gc_worker);</div><div class='ctx'> out:</div><div class='add'>+	if (ret)</div><div class='add'>+		clear_bit(NFSD_FILE_CACHE_UP, &amp;nfsd_file_flags);</div><div class='ctx'> 	return ret;</div><div class='ctx'> out_notifier:</div><div class='ctx'> 	lease_unregister_notifier(&amp;nfsd_file_lease_notifier);</div><div class='ctx'> out_shrinker:</div><div class='del'>-	unregister_shrinker(&amp;nfsd_file_shrinker);</div><div class='add'>+	shrinker_free(nfsd_file_shrinker);</div><div class='ctx'> out_lru:</div><div class='ctx'> 	list_lru_destroy(&amp;nfsd_file_lru);</div><div class='ctx'> out_err:</div><div class='hunk'>@@ -712,58 +849,59 @@ out_err:</div><div class='ctx'> 	nfsd_file_slab = NULL;</div><div class='ctx'> 	kmem_cache_destroy(nfsd_file_mark_slab);</div><div class='ctx'> 	nfsd_file_mark_slab = NULL;</div><div class='del'>-	kfree(nfsd_file_hashtbl);</div><div class='del'>-	nfsd_file_hashtbl = NULL;</div><div class='del'>-	destroy_workqueue(nfsd_filecache_wq);</div><div class='del'>-	nfsd_filecache_wq = NULL;</div><div class='add'>+	rhltable_destroy(&amp;nfsd_file_rhltable);</div><div class='ctx'> 	goto out;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Note this can deadlock with nfsd_file_lru_cb.</div><div class='add'>+/**</div><div class='add'>+ * __nfsd_file_cache_purge: clean out the cache for shutdown</div><div class='add'>+ * @net: net-namespace to shut down the cache (may be NULL)</div><div class='add'>+ *</div><div class='add'>+ * Walk the nfsd_file cache and close out any that match @net. If @net is NULL,</div><div class='add'>+ * then close out everything. Called when an nfsd instance is being shut down,</div><div class='add'>+ * and when the exports table is flushed.</div><div class='ctx'>  */</div><div class='del'>-void</div><div class='del'>-nfsd_file_cache_purge(struct net *net)</div><div class='add'>+static void</div><div class='add'>+__nfsd_file_cache_purge(struct net *net)</div><div class='ctx'> {</div><div class='del'>-	unsigned int		i;</div><div class='del'>-	struct nfsd_file	*nf;</div><div class='del'>-	struct hlist_node	*next;</div><div class='add'>+	struct rhashtable_iter iter;</div><div class='add'>+	struct nfsd_file *nf;</div><div class='ctx'> 	LIST_HEAD(dispose);</div><div class='del'>-	bool del;</div><div class='ctx'> </div><div class='del'>-	if (!nfsd_file_hashtbl)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; NFSD_FILE_HASH_SIZE; i++) {</div><div class='del'>-		struct nfsd_fcache_bucket *nfb = &amp;nfsd_file_hashtbl[i];</div><div class='add'>+#if IS_ENABLED(CONFIG_NFS_LOCALIO)</div><div class='add'>+	if (net) {</div><div class='add'>+		struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='add'>+		nfs_localio_invalidate_clients(&amp;nn-&gt;local_clients,</div><div class='add'>+					       &amp;nn-&gt;local_clients_lock);</div><div class='add'>+	}</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='del'>-		spin_lock(&amp;nfb-&gt;nfb_lock);</div><div class='del'>-		hlist_for_each_entry_safe(nf, next, &amp;nfb-&gt;nfb_head, nf_node) {</div><div class='del'>-			if (net &amp;&amp; nf-&gt;nf_net != net)</div><div class='del'>-				continue;</div><div class='del'>-			del = nfsd_file_unhash_and_release_locked(nf, &amp;dispose);</div><div class='add'>+	rhltable_walk_enter(&amp;nfsd_file_rhltable, &amp;iter);</div><div class='add'>+	do {</div><div class='add'>+		rhashtable_walk_start(&amp;iter);</div><div class='ctx'> </div><div class='del'>-			/*</div><div class='del'>-			 * Deadlock detected! Something marked this entry as</div><div class='del'>-			 * unhased, but hasn't removed it from the hash list.</div><div class='del'>-			 */</div><div class='del'>-			WARN_ON_ONCE(!del);</div><div class='add'>+		nf = rhashtable_walk_next(&amp;iter);</div><div class='add'>+		while (!IS_ERR_OR_NULL(nf)) {</div><div class='add'>+			if (!net || nf-&gt;nf_net == net)</div><div class='add'>+				nfsd_file_cond_queue(nf, &amp;dispose);</div><div class='add'>+			nf = rhashtable_walk_next(&amp;iter);</div><div class='ctx'> 		}</div><div class='del'>-		spin_unlock(&amp;nfb-&gt;nfb_lock);</div><div class='del'>-		nfsd_file_dispose_list(&amp;dispose);</div><div class='del'>-	}</div><div class='add'>+</div><div class='add'>+		rhashtable_walk_stop(&amp;iter);</div><div class='add'>+	} while (nf == ERR_PTR(-EAGAIN));</div><div class='add'>+	rhashtable_walk_exit(&amp;iter);</div><div class='add'>+</div><div class='add'>+	nfsd_file_dispose_list(&amp;dispose);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct nfsd_fcache_disposal *</div><div class='del'>-nfsd_alloc_fcache_disposal(struct net *net)</div><div class='add'>+nfsd_alloc_fcache_disposal(void)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd_fcache_disposal *l;</div><div class='ctx'> </div><div class='ctx'> 	l = kmalloc(sizeof(*l), GFP_KERNEL);</div><div class='ctx'> 	if (!l)</div><div class='ctx'> 		return NULL;</div><div class='del'>-	INIT_WORK(&amp;l-&gt;work, nfsd_file_delayed_close);</div><div class='del'>-	l-&gt;net = net;</div><div class='ctx'> 	spin_lock_init(&amp;l-&gt;lock);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;l-&gt;freeme);</div><div class='ctx'> 	return l;</div><div class='hunk'>@@ -772,61 +910,39 @@ nfsd_alloc_fcache_disposal(struct net *net)</div><div class='ctx'> static void</div><div class='ctx'> nfsd_free_fcache_disposal(struct nfsd_fcache_disposal *l)</div><div class='ctx'> {</div><div class='del'>-	rcu_assign_pointer(l-&gt;net, NULL);</div><div class='del'>-	cancel_work_sync(&amp;l-&gt;work);</div><div class='ctx'> 	nfsd_file_dispose_list(&amp;l-&gt;freeme);</div><div class='del'>-	kfree_rcu(l, rcu);</div><div class='add'>+	kfree(l);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='del'>-nfsd_add_fcache_disposal(struct nfsd_fcache_disposal *l)</div><div class='add'>+nfsd_free_fcache_disposal_net(struct net *net)</div><div class='ctx'> {</div><div class='del'>-	spin_lock(&amp;laundrette_lock);</div><div class='del'>-	list_add_tail_rcu(&amp;l-&gt;list, &amp;laundrettes);</div><div class='del'>-	spin_unlock(&amp;laundrette_lock);</div><div class='del'>-}</div><div class='add'>+	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='add'>+	struct nfsd_fcache_disposal *l = nn-&gt;fcache_disposal;</div><div class='ctx'> </div><div class='del'>-static void</div><div class='del'>-nfsd_del_fcache_disposal(struct nfsd_fcache_disposal *l)</div><div class='del'>-{</div><div class='del'>-	spin_lock(&amp;laundrette_lock);</div><div class='del'>-	list_del_rcu(&amp;l-&gt;list);</div><div class='del'>-	spin_unlock(&amp;laundrette_lock);</div><div class='add'>+	nfsd_free_fcache_disposal(l);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int</div><div class='del'>-nfsd_alloc_fcache_disposal_net(struct net *net)</div><div class='add'>+int</div><div class='add'>+nfsd_file_cache_start_net(struct net *net)</div><div class='ctx'> {</div><div class='del'>-	struct nfsd_fcache_disposal *l;</div><div class='add'>+	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='ctx'> </div><div class='del'>-	l = nfsd_alloc_fcache_disposal(net);</div><div class='del'>-	if (!l)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	nfsd_add_fcache_disposal(l);</div><div class='del'>-	return 0;</div><div class='add'>+	nn-&gt;fcache_disposal = nfsd_alloc_fcache_disposal();</div><div class='add'>+	return nn-&gt;fcache_disposal ? 0 : -ENOMEM;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void</div><div class='del'>-nfsd_free_fcache_disposal_net(struct net *net)</div><div class='del'>-{</div><div class='del'>-	struct nfsd_fcache_disposal *l;</div><div class='del'>-</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	list_for_each_entry_rcu(l, &amp;laundrettes, list) {</div><div class='del'>-		if (l-&gt;net != net)</div><div class='del'>-			continue;</div><div class='del'>-		nfsd_del_fcache_disposal(l);</div><div class='del'>-		rcu_read_unlock();</div><div class='del'>-		nfsd_free_fcache_disposal(l);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int</div><div class='del'>-nfsd_file_cache_start_net(struct net *net)</div><div class='add'>+/**</div><div class='add'>+ * nfsd_file_cache_purge - Remove all cache items associated with @net</div><div class='add'>+ * @net: target net namespace</div><div class='add'>+ *</div><div class='add'>+ */</div><div class='add'>+void</div><div class='add'>+nfsd_file_cache_purge(struct net *net)</div><div class='ctx'> {</div><div class='del'>-	return nfsd_alloc_fcache_disposal_net(net);</div><div class='add'>+	lockdep_assert_held(&amp;nfsd_mutex);</div><div class='add'>+	if (test_bit(NFSD_FILE_CACHE_UP, &amp;nfsd_file_flags) == 1)</div><div class='add'>+		__nfsd_file_cache_purge(net);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void</div><div class='hunk'>@@ -839,16 +955,20 @@ nfsd_file_cache_shutdown_net(struct net *net)</div><div class='ctx'> void</div><div class='ctx'> nfsd_file_cache_shutdown(void)</div><div class='ctx'> {</div><div class='del'>-	set_bit(NFSD_FILE_SHUTDOWN, &amp;nfsd_file_lru_flags);</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held(&amp;nfsd_mutex);</div><div class='add'>+	if (test_and_clear_bit(NFSD_FILE_CACHE_UP, &amp;nfsd_file_flags) == 0)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='ctx'> 	lease_unregister_notifier(&amp;nfsd_file_lease_notifier);</div><div class='del'>-	unregister_shrinker(&amp;nfsd_file_shrinker);</div><div class='add'>+	shrinker_free(nfsd_file_shrinker);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * make sure all callers of nfsd_file_lru_cb are done before</div><div class='ctx'> 	 * calling nfsd_file_cache_purge</div><div class='ctx'> 	 */</div><div class='ctx'> 	cancel_delayed_work_sync(&amp;nfsd_filecache_laundrette);</div><div class='del'>-	nfsd_file_cache_purge(NULL);</div><div class='add'>+	__nfsd_file_cache_purge(NULL);</div><div class='ctx'> 	list_lru_destroy(&amp;nfsd_file_lru);</div><div class='ctx'> 	rcu_barrier();</div><div class='ctx'> 	fsnotify_put_group(nfsd_file_fsnotify_group);</div><div class='hunk'>@@ -858,240 +978,453 @@ nfsd_file_cache_shutdown(void)</div><div class='ctx'> 	fsnotify_wait_marks_destroyed();</div><div class='ctx'> 	kmem_cache_destroy(nfsd_file_mark_slab);</div><div class='ctx'> 	nfsd_file_mark_slab = NULL;</div><div class='del'>-	kfree(nfsd_file_hashtbl);</div><div class='del'>-	nfsd_file_hashtbl = NULL;</div><div class='del'>-	destroy_workqueue(nfsd_filecache_wq);</div><div class='del'>-	nfsd_filecache_wq = NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool</div><div class='del'>-nfsd_match_cred(const struct cred *c1, const struct cred *c2)</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	if (!uid_eq(c1-&gt;fsuid, c2-&gt;fsuid))</div><div class='del'>-		return false;</div><div class='del'>-	if (!gid_eq(c1-&gt;fsgid, c2-&gt;fsgid))</div><div class='del'>-		return false;</div><div class='del'>-	if (c1-&gt;group_info == NULL || c2-&gt;group_info == NULL)</div><div class='del'>-		return c1-&gt;group_info == c2-&gt;group_info;</div><div class='del'>-	if (c1-&gt;group_info-&gt;ngroups != c2-&gt;group_info-&gt;ngroups)</div><div class='del'>-		return false;</div><div class='del'>-	for (i = 0; i &lt; c1-&gt;group_info-&gt;ngroups; i++) {</div><div class='del'>-		if (!gid_eq(c1-&gt;group_info-&gt;gid[i], c2-&gt;group_info-&gt;gid[i]))</div><div class='del'>-			return false;</div><div class='add'>+	rhltable_destroy(&amp;nfsd_file_rhltable);</div><div class='add'>+</div><div class='add'>+	for_each_possible_cpu(i) {</div><div class='add'>+		per_cpu(nfsd_file_cache_hits, i) = 0;</div><div class='add'>+		per_cpu(nfsd_file_acquisitions, i) = 0;</div><div class='add'>+		per_cpu(nfsd_file_allocations, i) = 0;</div><div class='add'>+		per_cpu(nfsd_file_releases, i) = 0;</div><div class='add'>+		per_cpu(nfsd_file_total_age, i) = 0;</div><div class='add'>+		per_cpu(nfsd_file_evictions, i) = 0;</div><div class='ctx'> 	}</div><div class='del'>-	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct nfsd_file *</div><div class='del'>-nfsd_file_find_locked(struct inode *inode, unsigned int may_flags,</div><div class='del'>-			unsigned int hashval, struct net *net)</div><div class='add'>+nfsd_file_lookup_locked(const struct net *net, const struct cred *cred,</div><div class='add'>+			struct inode *inode, unsigned char need,</div><div class='add'>+			bool want_gc)</div><div class='ctx'> {</div><div class='add'>+	struct rhlist_head *tmp, *list;</div><div class='ctx'> 	struct nfsd_file *nf;</div><div class='del'>-	unsigned char need = may_flags &amp; NFSD_FILE_MAY_MASK;</div><div class='ctx'> </div><div class='del'>-	hlist_for_each_entry_rcu(nf, &amp;nfsd_file_hashtbl[hashval].nfb_head,</div><div class='del'>-				 nf_node, lockdep_is_held(&amp;nfsd_file_hashtbl[hashval].nfb_lock)) {</div><div class='add'>+	list = rhltable_lookup(&amp;nfsd_file_rhltable, &amp;inode,</div><div class='add'>+			       nfsd_file_rhash_params);</div><div class='add'>+	rhl_for_each_entry_rcu(nf, tmp, list, nf_rlist) {</div><div class='ctx'> 		if (nf-&gt;nf_may != need)</div><div class='ctx'> 			continue;</div><div class='del'>-		if (nf-&gt;nf_inode != inode)</div><div class='del'>-			continue;</div><div class='ctx'> 		if (nf-&gt;nf_net != net)</div><div class='ctx'> 			continue;</div><div class='del'>-		if (!nfsd_match_cred(nf-&gt;nf_cred, current_cred()))</div><div class='add'>+		if (!nfsd_match_cred(nf-&gt;nf_cred, cred))</div><div class='add'>+			continue;</div><div class='add'>+		if (test_bit(NFSD_FILE_GC, &amp;nf-&gt;nf_flags) != want_gc)</div><div class='ctx'> 			continue;</div><div class='del'>-		if (!test_bit(NFSD_FILE_HASHED, &amp;nf-&gt;nf_flags))</div><div class='add'>+		if (test_bit(NFSD_FILE_HASHED, &amp;nf-&gt;nf_flags) == 0)</div><div class='ctx'> 			continue;</div><div class='del'>-		if (nfsd_file_get(nf) != NULL)</div><div class='del'>-			return nf;</div><div class='add'>+</div><div class='add'>+		if (!nfsd_file_get(nf))</div><div class='add'>+			continue;</div><div class='add'>+		return nf;</div><div class='ctx'> 	}</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * nfsd_file_is_cached - are there any cached open files for this fh?</div><div class='del'>- * @inode: inode of the file to check</div><div class='add'>+ * nfsd_file_is_cached - are there any cached open files for this inode?</div><div class='add'>+ * @inode: inode to check</div><div class='ctx'>  *</div><div class='del'>- * Scan the hashtable for open files that match this fh. Returns true if there</div><div class='del'>- * are any, and false if not.</div><div class='add'>+ * The lookup matches inodes in all net namespaces and is atomic wrt</div><div class='add'>+ * nfsd_file_acquire().</div><div class='add'>+ *</div><div class='add'>+ * Return values:</div><div class='add'>+ *   %true: filecache contains at least one file matching this inode</div><div class='add'>+ *   %false: filecache contains no files matching this inode</div><div class='ctx'>  */</div><div class='ctx'> bool</div><div class='ctx'> nfsd_file_is_cached(struct inode *inode)</div><div class='ctx'> {</div><div class='del'>-	bool			ret = false;</div><div class='del'>-	struct nfsd_file	*nf;</div><div class='del'>-	unsigned int		hashval;</div><div class='del'>-</div><div class='del'>-        hashval = (unsigned int)hash_long(inode-&gt;i_ino, NFSD_FILE_HASH_BITS);</div><div class='add'>+	struct rhlist_head *tmp, *list;</div><div class='add'>+	struct nfsd_file *nf;</div><div class='add'>+	bool ret = false;</div><div class='ctx'> </div><div class='ctx'> 	rcu_read_lock();</div><div class='del'>-	hlist_for_each_entry_rcu(nf, &amp;nfsd_file_hashtbl[hashval].nfb_head,</div><div class='del'>-				 nf_node) {</div><div class='del'>-		if (inode == nf-&gt;nf_inode) {</div><div class='add'>+	list = rhltable_lookup(&amp;nfsd_file_rhltable, &amp;inode,</div><div class='add'>+			       nfsd_file_rhash_params);</div><div class='add'>+	rhl_for_each_entry_rcu(nf, tmp, list, nf_rlist)</div><div class='add'>+		if (test_bit(NFSD_FILE_GC, &amp;nf-&gt;nf_flags)) {</div><div class='ctx'> 			ret = true;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='del'>-	}</div><div class='ctx'> 	rcu_read_unlock();</div><div class='del'>-	trace_nfsd_file_is_cached(inode, hashval, (int)ret);</div><div class='add'>+</div><div class='add'>+	trace_nfsd_file_is_cached(inode, (int)ret);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-__be32</div><div class='del'>-nfsd_file_acquire(struct svc_rqst *rqstp, struct svc_fh *fhp,</div><div class='del'>-		  unsigned int may_flags, struct nfsd_file **pnf)</div><div class='add'>+static __be32</div><div class='add'>+nfsd_file_get_dio_attrs(const struct svc_fh *fhp, struct nfsd_file *nf)</div><div class='ctx'> {</div><div class='del'>-	__be32	status;</div><div class='del'>-	struct net *net = SVC_NET(rqstp);</div><div class='del'>-	struct nfsd_file *nf, *new;</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	unsigned int hashval;</div><div class='del'>-	bool retry = true;</div><div class='add'>+	struct inode *inode = file_inode(nf-&gt;nf_file);</div><div class='add'>+	struct kstat stat;</div><div class='add'>+	__be32 status;</div><div class='add'>+</div><div class='add'>+	/* Currently only need to get DIO alignment info for regular files */</div><div class='add'>+	if (!S_ISREG(inode-&gt;i_mode))</div><div class='add'>+		return nfs_ok;</div><div class='ctx'> </div><div class='del'>-	/* FIXME: skip this if fh_dentry is already set? */</div><div class='del'>-	status = fh_verify(rqstp, fhp, S_IFREG,</div><div class='del'>-				may_flags|NFSD_MAY_OWNER_OVERRIDE);</div><div class='add'>+	status = fh_getattr(fhp, &amp;stat);</div><div class='ctx'> 	if (status != nfs_ok)</div><div class='ctx'> 		return status;</div><div class='ctx'> </div><div class='del'>-	inode = d_inode(fhp-&gt;fh_dentry);</div><div class='del'>-	hashval = (unsigned int)hash_long(inode-&gt;i_ino, NFSD_FILE_HASH_BITS);</div><div class='add'>+	trace_nfsd_file_get_dio_attrs(inode, &amp;stat);</div><div class='add'>+</div><div class='add'>+	if (stat.result_mask &amp; STATX_DIOALIGN) {</div><div class='add'>+		nf-&gt;nf_dio_mem_align = stat.dio_mem_align;</div><div class='add'>+		nf-&gt;nf_dio_offset_align = stat.dio_offset_align;</div><div class='add'>+	}</div><div class='add'>+	if (stat.result_mask &amp; STATX_DIO_READ_ALIGN)</div><div class='add'>+		nf-&gt;nf_dio_read_offset_align = stat.dio_read_offset_align;</div><div class='add'>+	else</div><div class='add'>+		nf-&gt;nf_dio_read_offset_align = nf-&gt;nf_dio_offset_align;</div><div class='add'>+</div><div class='add'>+	return nfs_ok;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32</div><div class='add'>+nfsd_file_do_acquire(struct svc_rqst *rqstp, struct net *net,</div><div class='add'>+		     struct svc_cred *cred,</div><div class='add'>+		     struct auth_domain *client,</div><div class='add'>+		     struct svc_fh *fhp,</div><div class='add'>+		     unsigned int may_flags, struct file *file,</div><div class='add'>+		     umode_t type, bool want_gc, struct nfsd_file **pnf)</div><div class='add'>+{</div><div class='add'>+	unsigned char need = may_flags &amp; NFSD_FILE_MAY_MASK;</div><div class='add'>+	struct nfsd_file *new, *nf;</div><div class='add'>+	bool stale_retry = true;</div><div class='add'>+	bool open_retry = true;</div><div class='add'>+	struct inode *inode;</div><div class='add'>+	__be32 status;</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='ctx'> retry:</div><div class='add'>+	if (rqstp)</div><div class='add'>+		status = fh_verify(rqstp, fhp, type,</div><div class='add'>+				   may_flags|NFSD_MAY_OWNER_OVERRIDE);</div><div class='add'>+	else</div><div class='add'>+		status = fh_verify_local(net, cred, client, fhp, type,</div><div class='add'>+					 may_flags|NFSD_MAY_OWNER_OVERRIDE);</div><div class='add'>+</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	inode = d_inode(fhp-&gt;fh_dentry);</div><div class='add'>+</div><div class='ctx'> 	rcu_read_lock();</div><div class='del'>-	nf = nfsd_file_find_locked(inode, may_flags, hashval, net);</div><div class='add'>+	nf = nfsd_file_lookup_locked(net, current_cred(), inode, need, want_gc);</div><div class='ctx'> 	rcu_read_unlock();</div><div class='add'>+</div><div class='ctx'> 	if (nf)</div><div class='ctx'> 		goto wait_for_construction;</div><div class='ctx'> </div><div class='del'>-	new = nfsd_file_alloc(inode, may_flags, hashval, net);</div><div class='add'>+	new = nfsd_file_alloc(net, inode, need, want_gc);</div><div class='ctx'> 	if (!new) {</div><div class='del'>-		trace_nfsd_file_acquire(rqstp, hashval, inode, may_flags,</div><div class='del'>-					NULL, nfserr_jukebox);</div><div class='del'>-		return nfserr_jukebox;</div><div class='add'>+		status = nfserr_jukebox;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;nfsd_file_hashtbl[hashval].nfb_lock);</div><div class='del'>-	nf = nfsd_file_find_locked(inode, may_flags, hashval, net);</div><div class='del'>-	if (nf == NULL)</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+	nf = nfsd_file_lookup_locked(net, current_cred(), inode, need, want_gc);</div><div class='add'>+	if (unlikely(nf)) {</div><div class='add'>+		spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+		rcu_read_unlock();</div><div class='add'>+		nfsd_file_free(new);</div><div class='add'>+		goto wait_for_construction;</div><div class='add'>+	}</div><div class='add'>+	nf = new;</div><div class='add'>+	ret = rhltable_insert(&amp;nfsd_file_rhltable, &amp;nf-&gt;nf_rlist,</div><div class='add'>+			      nfsd_file_rhash_params);</div><div class='add'>+	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+	if (likely(ret == 0))</div><div class='ctx'> 		goto open_file;</div><div class='del'>-	spin_unlock(&amp;nfsd_file_hashtbl[hashval].nfb_lock);</div><div class='del'>-	nfsd_file_slab_free(&amp;new-&gt;nf_rcu);</div><div class='add'>+</div><div class='add'>+	trace_nfsd_file_insert_err(rqstp, inode, may_flags, ret);</div><div class='add'>+	status = nfserr_jukebox;</div><div class='add'>+	goto construction_err;</div><div class='ctx'> </div><div class='ctx'> wait_for_construction:</div><div class='ctx'> 	wait_on_bit(&amp;nf-&gt;nf_flags, NFSD_FILE_PENDING, TASK_UNINTERRUPTIBLE);</div><div class='ctx'> </div><div class='ctx'> 	/* Did construction of this file fail? */</div><div class='ctx'> 	if (!test_bit(NFSD_FILE_HASHED, &amp;nf-&gt;nf_flags)) {</div><div class='del'>-		if (!retry) {</div><div class='add'>+		trace_nfsd_file_cons_err(rqstp, inode, may_flags, nf);</div><div class='add'>+		if (!open_retry) {</div><div class='ctx'> 			status = nfserr_jukebox;</div><div class='del'>-			goto out;</div><div class='add'>+			goto construction_err;</div><div class='ctx'> 		}</div><div class='del'>-		retry = false;</div><div class='del'>-		nfsd_file_put_noref(nf);</div><div class='add'>+		nfsd_file_put(nf);</div><div class='add'>+		open_retry = false;</div><div class='add'>+		fh_put(fhp);</div><div class='ctx'> 		goto retry;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='ctx'> 	this_cpu_inc(nfsd_file_cache_hits);</div><div class='ctx'> </div><div class='del'>-	if (!(may_flags &amp; NFSD_MAY_NOT_BREAK_LEASE)) {</div><div class='del'>-		bool write = (may_flags &amp; NFSD_MAY_WRITE);</div><div class='del'>-</div><div class='del'>-		if (test_bit(NFSD_FILE_BREAK_READ, &amp;nf-&gt;nf_flags) ||</div><div class='del'>-		    (test_bit(NFSD_FILE_BREAK_WRITE, &amp;nf-&gt;nf_flags) &amp;&amp; write)) {</div><div class='del'>-			status = nfserrno(nfsd_open_break_lease(</div><div class='del'>-					file_inode(nf-&gt;nf_file), may_flags));</div><div class='del'>-			if (status == nfs_ok) {</div><div class='del'>-				clear_bit(NFSD_FILE_BREAK_READ, &amp;nf-&gt;nf_flags);</div><div class='del'>-				if (write)</div><div class='del'>-					clear_bit(NFSD_FILE_BREAK_WRITE,</div><div class='del'>-						  &amp;nf-&gt;nf_flags);</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='add'>+	status = nfserrno(nfsd_open_break_lease(file_inode(nf-&gt;nf_file), may_flags));</div><div class='add'>+	if (status != nfs_ok) {</div><div class='add'>+		nfsd_file_put(nf);</div><div class='add'>+		nf = NULL;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> out:</div><div class='ctx'> 	if (status == nfs_ok) {</div><div class='add'>+		this_cpu_inc(nfsd_file_acquisitions);</div><div class='add'>+		nfsd_file_check_write_error(nf);</div><div class='ctx'> 		*pnf = nf;</div><div class='del'>-	} else {</div><div class='del'>-		nfsd_file_put(nf);</div><div class='del'>-		nf = NULL;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	trace_nfsd_file_acquire(rqstp, hashval, inode, may_flags, nf, status);</div><div class='add'>+	trace_nfsd_file_acquire(rqstp, inode, may_flags, nf, status);</div><div class='ctx'> 	return status;</div><div class='del'>-open_file:</div><div class='del'>-	nf = new;</div><div class='del'>-	/* Take reference for the hashtable */</div><div class='del'>-	refcount_inc(&amp;nf-&gt;nf_ref);</div><div class='del'>-	__set_bit(NFSD_FILE_HASHED, &amp;nf-&gt;nf_flags);</div><div class='del'>-	__set_bit(NFSD_FILE_PENDING, &amp;nf-&gt;nf_flags);</div><div class='del'>-	list_lru_add(&amp;nfsd_file_lru, &amp;nf-&gt;nf_lru);</div><div class='del'>-	hlist_add_head_rcu(&amp;nf-&gt;nf_node, &amp;nfsd_file_hashtbl[hashval].nfb_head);</div><div class='del'>-	++nfsd_file_hashtbl[hashval].nfb_count;</div><div class='del'>-	nfsd_file_hashtbl[hashval].nfb_maxcount = max(nfsd_file_hashtbl[hashval].nfb_maxcount,</div><div class='del'>-			nfsd_file_hashtbl[hashval].nfb_count);</div><div class='del'>-	spin_unlock(&amp;nfsd_file_hashtbl[hashval].nfb_lock);</div><div class='del'>-	if (atomic_long_inc_return(&amp;nfsd_filecache_count) &gt;= NFSD_FILE_LRU_THRESHOLD)</div><div class='del'>-		nfsd_file_gc();</div><div class='ctx'> </div><div class='del'>-	nf-&gt;nf_mark = nfsd_file_mark_find_or_create(nf);</div><div class='del'>-	if (nf-&gt;nf_mark)</div><div class='del'>-		status = nfsd_open_verified(rqstp, fhp, S_IFREG,</div><div class='del'>-				may_flags, &amp;nf-&gt;nf_file);</div><div class='del'>-	else</div><div class='add'>+open_file:</div><div class='add'>+	trace_nfsd_file_alloc(nf);</div><div class='add'>+</div><div class='add'>+	if (type == S_IFREG)</div><div class='add'>+		nf-&gt;nf_mark = nfsd_file_mark_find_or_create(inode);</div><div class='add'>+</div><div class='add'>+	if (type != S_IFREG || nf-&gt;nf_mark) {</div><div class='add'>+		if (file) {</div><div class='add'>+			get_file(file);</div><div class='add'>+			nf-&gt;nf_file = file;</div><div class='add'>+			status = nfs_ok;</div><div class='add'>+			trace_nfsd_file_opened(nf, status);</div><div class='add'>+		} else {</div><div class='add'>+			ret = nfsd_open_verified(fhp, type, may_flags, &amp;nf-&gt;nf_file);</div><div class='add'>+			if (ret == -EOPENSTALE &amp;&amp; stale_retry) {</div><div class='add'>+				stale_retry = false;</div><div class='add'>+				nfsd_file_unhash(nf);</div><div class='add'>+				clear_and_wake_up_bit(NFSD_FILE_PENDING,</div><div class='add'>+						      &amp;nf-&gt;nf_flags);</div><div class='add'>+				if (refcount_dec_and_test(&amp;nf-&gt;nf_ref))</div><div class='add'>+					nfsd_file_free(nf);</div><div class='add'>+				nf = NULL;</div><div class='add'>+				fh_put(fhp);</div><div class='add'>+				goto retry;</div><div class='add'>+			}</div><div class='add'>+			status = nfserrno(ret);</div><div class='add'>+			trace_nfsd_file_open(nf, status);</div><div class='add'>+			if (status == nfs_ok)</div><div class='add'>+				status = nfsd_file_get_dio_attrs(fhp, nf);</div><div class='add'>+		}</div><div class='add'>+	} else</div><div class='ctx'> 		status = nfserr_jukebox;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If construction failed, or we raced with a call to unlink()</div><div class='ctx'> 	 * then unhash.</div><div class='ctx'> 	 */</div><div class='del'>-	if (status != nfs_ok || inode-&gt;i_nlink == 0) {</div><div class='del'>-		bool do_free;</div><div class='del'>-		spin_lock(&amp;nfsd_file_hashtbl[hashval].nfb_lock);</div><div class='del'>-		do_free = nfsd_file_unhash(nf);</div><div class='del'>-		spin_unlock(&amp;nfsd_file_hashtbl[hashval].nfb_lock);</div><div class='del'>-		if (do_free)</div><div class='del'>-			nfsd_file_put_noref(nf);</div><div class='del'>-	}</div><div class='del'>-	clear_bit_unlock(NFSD_FILE_PENDING, &amp;nf-&gt;nf_flags);</div><div class='del'>-	smp_mb__after_atomic();</div><div class='del'>-	wake_up_bit(&amp;nf-&gt;nf_flags, NFSD_FILE_PENDING);</div><div class='add'>+	if (status != nfs_ok || inode-&gt;i_nlink == 0)</div><div class='add'>+		nfsd_file_unhash(nf);</div><div class='add'>+	else if (want_gc)</div><div class='add'>+		nfsd_file_lru_add(nf);</div><div class='add'>+</div><div class='add'>+	clear_and_wake_up_bit(NFSD_FILE_PENDING, &amp;nf-&gt;nf_flags);</div><div class='add'>+	if (status == nfs_ok)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+construction_err:</div><div class='add'>+	if (refcount_dec_and_test(&amp;nf-&gt;nf_ref))</div><div class='add'>+		nfsd_file_free(nf);</div><div class='add'>+	nf = NULL;</div><div class='ctx'> 	goto out;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * nfsd_file_acquire_gc - Get a struct nfsd_file with an open file</div><div class='add'>+ * @rqstp: the RPC transaction being executed</div><div class='add'>+ * @fhp: the NFS filehandle of the file to be opened</div><div class='add'>+ * @may_flags: NFSD_MAY_ settings for the file</div><div class='add'>+ * @pnf: OUT: new or found "struct nfsd_file" object</div><div class='add'>+ *</div><div class='add'>+ * The nfsd_file object returned by this API is reference-counted</div><div class='add'>+ * and garbage-collected. The object is retained for a few</div><div class='add'>+ * seconds after the final nfsd_file_put() in case the caller</div><div class='add'>+ * wants to re-use it.</div><div class='add'>+ *</div><div class='add'>+ * Return values:</div><div class='add'>+ *   %nfs_ok - @pnf points to an nfsd_file with its reference</div><div class='add'>+ *   count boosted.</div><div class='add'>+ *</div><div class='add'>+ * On error, an nfsstat value in network byte order is returned.</div><div class='add'>+ */</div><div class='add'>+__be32</div><div class='add'>+nfsd_file_acquire_gc(struct svc_rqst *rqstp, struct svc_fh *fhp,</div><div class='add'>+		     unsigned int may_flags, struct nfsd_file **pnf)</div><div class='add'>+{</div><div class='add'>+	return nfsd_file_do_acquire(rqstp, SVC_NET(rqstp), NULL, NULL,</div><div class='add'>+				    fhp, may_flags, NULL, S_IFREG, true, pnf);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * nfsd_file_acquire - Get a struct nfsd_file with an open file</div><div class='add'>+ * @rqstp: the RPC transaction being executed</div><div class='add'>+ * @fhp: the NFS filehandle of the file to be opened</div><div class='add'>+ * @may_flags: NFSD_MAY_ settings for the file</div><div class='add'>+ * @pnf: OUT: new or found "struct nfsd_file" object</div><div class='add'>+ *</div><div class='add'>+ * The nfsd_file_object returned by this API is reference-counted</div><div class='add'>+ * but not garbage-collected. The object is unhashed after the</div><div class='add'>+ * final nfsd_file_put().</div><div class='add'>+ *</div><div class='add'>+ * Return values:</div><div class='add'>+ *   %nfs_ok - @pnf points to an nfsd_file with its reference</div><div class='add'>+ *   count boosted.</div><div class='add'>+ *</div><div class='add'>+ * On error, an nfsstat value in network byte order is returned.</div><div class='add'>+ */</div><div class='add'>+__be32</div><div class='add'>+nfsd_file_acquire(struct svc_rqst *rqstp, struct svc_fh *fhp,</div><div class='add'>+		  unsigned int may_flags, struct nfsd_file **pnf)</div><div class='add'>+{</div><div class='add'>+	return nfsd_file_do_acquire(rqstp, SVC_NET(rqstp), NULL, NULL,</div><div class='add'>+				    fhp, may_flags, NULL, S_IFREG, false, pnf);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * nfsd_file_acquire_local - Get a struct nfsd_file with an open file for localio</div><div class='add'>+ * @net: The network namespace in which to perform a lookup</div><div class='add'>+ * @cred: the user credential with which to validate access</div><div class='add'>+ * @client: the auth_domain for LOCALIO lookup</div><div class='add'>+ * @fhp: the NFS filehandle of the file to be opened</div><div class='add'>+ * @may_flags: NFSD_MAY_ settings for the file</div><div class='add'>+ * @pnf: OUT: new or found "struct nfsd_file" object</div><div class='add'>+ *</div><div class='add'>+ * This file lookup interface provide access to a file given the</div><div class='add'>+ * filehandle and credential.  No connection-based authorisation</div><div class='add'>+ * is performed and in that way it is quite different to other</div><div class='add'>+ * file access mediated by nfsd.  It allows a kernel module such as the NFS</div><div class='add'>+ * client to reach across network and filesystem namespaces to access</div><div class='add'>+ * a file.  The security implications of this should be carefully</div><div class='add'>+ * considered before use.</div><div class='add'>+ *</div><div class='add'>+ * The nfsd_file_object returned by this API is reference-counted</div><div class='add'>+ * but not garbage-collected. The object is unhashed after the</div><div class='add'>+ * final nfsd_file_put().</div><div class='add'>+ *</div><div class='add'>+ * Return values:</div><div class='add'>+ *   %nfs_ok - @pnf points to an nfsd_file with its reference</div><div class='add'>+ *   count boosted.</div><div class='add'>+ *</div><div class='add'>+ * On error, an nfsstat value in network byte order is returned.</div><div class='add'>+ */</div><div class='add'>+__be32</div><div class='add'>+nfsd_file_acquire_local(struct net *net, struct svc_cred *cred,</div><div class='add'>+			struct auth_domain *client, struct svc_fh *fhp,</div><div class='add'>+			unsigned int may_flags, struct nfsd_file **pnf)</div><div class='add'>+{</div><div class='add'>+	/*</div><div class='add'>+	 * Save creds before calling nfsd_file_do_acquire() (which calls</div><div class='add'>+	 * nfsd_setuser). Important because caller (LOCALIO) is from</div><div class='add'>+	 * client context.</div><div class='add'>+	 */</div><div class='add'>+	const struct cred *save_cred = get_current_cred();</div><div class='add'>+	__be32 beres;</div><div class='add'>+</div><div class='add'>+	beres = nfsd_file_do_acquire(NULL, net, cred, client, fhp, may_flags,</div><div class='add'>+				     NULL, S_IFREG, false, pnf);</div><div class='add'>+	put_cred(revert_creds(save_cred));</div><div class='add'>+	return beres;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * nfsd_file_acquire_opened - Get a struct nfsd_file using existing open file</div><div class='add'>+ * @rqstp: the RPC transaction being executed</div><div class='add'>+ * @fhp: the NFS filehandle of the file just created</div><div class='add'>+ * @may_flags: NFSD_MAY_ settings for the file</div><div class='add'>+ * @file: cached, already-open file (may be NULL)</div><div class='add'>+ * @pnf: OUT: new or found "struct nfsd_file" object</div><div class='add'>+ *</div><div class='add'>+ * Acquire a nfsd_file object that is not GC'ed. If one doesn't already exist,</div><div class='add'>+ * and @file is non-NULL, use it to instantiate a new nfsd_file instead of</div><div class='add'>+ * opening a new one.</div><div class='add'>+ *</div><div class='add'>+ * Return values:</div><div class='add'>+ *   %nfs_ok - @pnf points to an nfsd_file with its reference</div><div class='add'>+ *   count boosted.</div><div class='add'>+ *</div><div class='add'>+ * On error, an nfsstat value in network byte order is returned.</div><div class='add'>+ */</div><div class='add'>+__be32</div><div class='add'>+nfsd_file_acquire_opened(struct svc_rqst *rqstp, struct svc_fh *fhp,</div><div class='add'>+			 unsigned int may_flags, struct file *file,</div><div class='add'>+			 struct nfsd_file **pnf)</div><div class='add'>+{</div><div class='add'>+	return nfsd_file_do_acquire(rqstp, SVC_NET(rqstp), NULL, NULL,</div><div class='add'>+				    fhp, may_flags, file, S_IFREG, false, pnf);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * nfsd_file_acquire_dir - Get a struct nfsd_file with an open directory</div><div class='add'>+ * @rqstp: the RPC transaction being executed</div><div class='add'>+ * @fhp: the NFS filehandle of the file to be opened</div><div class='add'>+ * @pnf: OUT: new or found "struct nfsd_file" object</div><div class='add'>+ *</div><div class='add'>+ * The nfsd_file_object returned by this API is reference-counted</div><div class='add'>+ * but not garbage-collected. The object is unhashed after the</div><div class='add'>+ * final nfsd_file_put(). This opens directories only, and only</div><div class='add'>+ * in O_RDONLY mode.</div><div class='add'>+ *</div><div class='add'>+ * Return values:</div><div class='add'>+ *   %nfs_ok - @pnf points to an nfsd_file with its reference</div><div class='add'>+ *   count boosted.</div><div class='add'>+ *</div><div class='add'>+ * On error, an nfsstat value in network byte order is returned.</div><div class='add'>+ */</div><div class='add'>+__be32</div><div class='add'>+nfsd_file_acquire_dir(struct svc_rqst *rqstp, struct svc_fh *fhp,</div><div class='add'>+		      struct nfsd_file **pnf)</div><div class='add'>+{</div><div class='add'>+	return nfsd_file_do_acquire(rqstp, SVC_NET(rqstp), NULL, NULL, fhp,</div><div class='add'>+				    NFSD_MAY_READ|NFSD_MAY_64BIT_COOKIE,</div><div class='add'>+				    NULL, S_IFDIR, false, pnf);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Note that fields may be added, removed or reordered in the future. Programs</div><div class='ctx'>  * scraping this file for info should test the labels to ensure they're</div><div class='ctx'>  * getting the correct field.</div><div class='ctx'>  */</div><div class='del'>-static int nfsd_file_cache_stats_show(struct seq_file *m, void *v)</div><div class='add'>+int nfsd_file_cache_stats_show(struct seq_file *m, void *v)</div><div class='ctx'> {</div><div class='del'>-	unsigned int i, count = 0, longest = 0;</div><div class='del'>-	unsigned long hits = 0;</div><div class='add'>+	unsigned long allocations = 0, releases = 0, evictions = 0;</div><div class='add'>+	unsigned long hits = 0, acquisitions = 0;</div><div class='add'>+	unsigned int i, count = 0, buckets = 0;</div><div class='add'>+	unsigned long lru = 0, total_age = 0;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * No need for spinlocks here since we're not terribly interested in</div><div class='del'>-	 * accuracy. We do take the nfsd_mutex simply to ensure that we</div><div class='del'>-	 * don't end up racing with server shutdown</div><div class='del'>-	 */</div><div class='add'>+	/* Serialize with server shutdown */</div><div class='ctx'> 	mutex_lock(&amp;nfsd_mutex);</div><div class='del'>-	if (nfsd_file_hashtbl) {</div><div class='del'>-		for (i = 0; i &lt; NFSD_FILE_HASH_SIZE; i++) {</div><div class='del'>-			count += nfsd_file_hashtbl[i].nfb_count;</div><div class='del'>-			longest = max(longest, nfsd_file_hashtbl[i].nfb_count);</div><div class='del'>-		}</div><div class='add'>+	if (test_bit(NFSD_FILE_CACHE_UP, &amp;nfsd_file_flags) == 1) {</div><div class='add'>+		struct bucket_table *tbl;</div><div class='add'>+		struct rhashtable *ht;</div><div class='add'>+</div><div class='add'>+		lru = list_lru_count(&amp;nfsd_file_lru);</div><div class='add'>+</div><div class='add'>+		rcu_read_lock();</div><div class='add'>+		ht = &amp;nfsd_file_rhltable.ht;</div><div class='add'>+		count = atomic_read(&amp;ht-&gt;nelems);</div><div class='add'>+		tbl = rht_dereference_rcu(ht-&gt;tbl, ht);</div><div class='add'>+		buckets = tbl-&gt;size;</div><div class='add'>+		rcu_read_unlock();</div><div class='ctx'> 	}</div><div class='ctx'> 	mutex_unlock(&amp;nfsd_mutex);</div><div class='ctx'> </div><div class='del'>-	for_each_possible_cpu(i)</div><div class='add'>+	for_each_possible_cpu(i) {</div><div class='ctx'> 		hits += per_cpu(nfsd_file_cache_hits, i);</div><div class='add'>+		acquisitions += per_cpu(nfsd_file_acquisitions, i);</div><div class='add'>+		allocations += per_cpu(nfsd_file_allocations, i);</div><div class='add'>+		releases += per_cpu(nfsd_file_releases, i);</div><div class='add'>+		total_age += per_cpu(nfsd_file_total_age, i);</div><div class='add'>+		evictions += per_cpu(nfsd_file_evictions, i);</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	seq_printf(m, "total entries: %u\n", count);</div><div class='del'>-	seq_printf(m, "longest chain: %u\n", longest);</div><div class='add'>+	seq_printf(m, "total inodes:  %u\n", count);</div><div class='add'>+	seq_printf(m, "hash buckets:  %u\n", buckets);</div><div class='add'>+	seq_printf(m, "lru entries:   %lu\n", lru);</div><div class='ctx'> 	seq_printf(m, "cache hits:    %lu\n", hits);</div><div class='add'>+	seq_printf(m, "acquisitions:  %lu\n", acquisitions);</div><div class='add'>+	seq_printf(m, "allocations:   %lu\n", allocations);</div><div class='add'>+	seq_printf(m, "releases:      %lu\n", releases);</div><div class='add'>+	seq_printf(m, "evictions:     %lu\n", evictions);</div><div class='add'>+	if (releases)</div><div class='add'>+		seq_printf(m, "mean age (ms): %ld\n", total_age / releases);</div><div class='add'>+	else</div><div class='add'>+		seq_printf(m, "mean age (ms): -\n");</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='del'>-</div><div class='del'>-int nfsd_file_cache_stats_open(struct inode *inode, struct file *file)</div><div class='del'>-{</div><div class='del'>-	return single_open(file, nfsd_file_cache_stats_show, NULL);</div><div class='del'>-}</div><div class='head'>diff --git a/fs/nfsd/filecache.h b/fs/nfsd/filecache.h<br/>index 7872df5a0fe3..b383dbc5b921 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/filecache.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/filecache.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/filecache.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/filecache.h</a></div><div class='hunk'>@@ -4,6 +4,12 @@</div><div class='ctx'> #include &lt;linux/fsnotify_backend.h&gt;</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * Limit the time that the list_lru_one lock is held during</div><div class='add'>+ * an LRU scan.</div><div class='add'>+ */</div><div class='add'>+#define NFSD_FILE_GC_BATCH     (16UL)</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * This is the fsnotify_mark container that nfsd attaches to the files that it</div><div class='ctx'>  * is holding open. Note that we have a separate refcount here aside from the</div><div class='ctx'>  * one in the fsnotify_mark. We only want a single fsnotify_mark attached to</div><div class='hunk'>@@ -29,24 +35,29 @@ struct nfsd_file_mark {</div><div class='ctx'>  * never be dereferenced, only used for comparison.</div><div class='ctx'>  */</div><div class='ctx'> struct nfsd_file {</div><div class='del'>-	struct hlist_node	nf_node;</div><div class='del'>-	struct list_head	nf_lru;</div><div class='del'>-	struct rcu_head		nf_rcu;</div><div class='add'>+	struct rhlist_head	nf_rlist;</div><div class='add'>+	void			*nf_inode;</div><div class='ctx'> 	struct file		*nf_file;</div><div class='ctx'> 	const struct cred	*nf_cred;</div><div class='ctx'> 	struct net		*nf_net;</div><div class='ctx'> #define NFSD_FILE_HASHED	(0)</div><div class='ctx'> #define NFSD_FILE_PENDING	(1)</div><div class='del'>-#define NFSD_FILE_BREAK_READ	(2)</div><div class='del'>-#define NFSD_FILE_BREAK_WRITE	(3)</div><div class='del'>-#define NFSD_FILE_REFERENCED	(4)</div><div class='add'>+#define NFSD_FILE_REFERENCED	(2)</div><div class='add'>+#define NFSD_FILE_GC		(3)</div><div class='add'>+#define NFSD_FILE_RECENT	(4)</div><div class='ctx'> 	unsigned long		nf_flags;</div><div class='del'>-	struct inode		*nf_inode;</div><div class='del'>-	unsigned int		nf_hashval;</div><div class='ctx'> 	refcount_t		nf_ref;</div><div class='ctx'> 	unsigned char		nf_may;</div><div class='add'>+</div><div class='ctx'> 	struct nfsd_file_mark	*nf_mark;</div><div class='del'>-	struct rw_semaphore	nf_rwsem;</div><div class='add'>+	struct list_head	nf_lru;</div><div class='add'>+	struct list_head	nf_gc;</div><div class='add'>+	struct rcu_head		nf_rcu;</div><div class='add'>+	ktime_t			nf_birthtime;</div><div class='add'>+</div><div class='add'>+	u32			nf_dio_mem_align;</div><div class='add'>+	u32			nf_dio_offset_align;</div><div class='add'>+	u32			nf_dio_read_offset_align;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> int nfsd_file_cache_init(void);</div><div class='hunk'>@@ -55,10 +66,23 @@ void nfsd_file_cache_shutdown(void);</div><div class='ctx'> int nfsd_file_cache_start_net(struct net *net);</div><div class='ctx'> void nfsd_file_cache_shutdown_net(struct net *net);</div><div class='ctx'> void nfsd_file_put(struct nfsd_file *nf);</div><div class='add'>+struct net *nfsd_file_put_local(struct nfsd_file __rcu **nf);</div><div class='ctx'> struct nfsd_file *nfsd_file_get(struct nfsd_file *nf);</div><div class='add'>+struct file *nfsd_file_file(struct nfsd_file *nf);</div><div class='ctx'> void nfsd_file_close_inode_sync(struct inode *inode);</div><div class='add'>+void nfsd_file_net_dispose(struct nfsd_net *nn);</div><div class='ctx'> bool nfsd_file_is_cached(struct inode *inode);</div><div class='add'>+__be32 nfsd_file_acquire_gc(struct svc_rqst *rqstp, struct svc_fh *fhp,</div><div class='add'>+		  unsigned int may_flags, struct nfsd_file **nfp);</div><div class='ctx'> __be32 nfsd_file_acquire(struct svc_rqst *rqstp, struct svc_fh *fhp,</div><div class='ctx'> 		  unsigned int may_flags, struct nfsd_file **nfp);</div><div class='del'>-int	nfsd_file_cache_stats_open(struct inode *, struct file *);</div><div class='add'>+__be32 nfsd_file_acquire_opened(struct svc_rqst *rqstp, struct svc_fh *fhp,</div><div class='add'>+		  unsigned int may_flags, struct file *file,</div><div class='add'>+		  struct nfsd_file **nfp);</div><div class='add'>+__be32 nfsd_file_acquire_local(struct net *net, struct svc_cred *cred,</div><div class='add'>+			       struct auth_domain *client, struct svc_fh *fhp,</div><div class='add'>+			       unsigned int may_flags, struct nfsd_file **pnf);</div><div class='add'>+__be32 nfsd_file_acquire_dir(struct svc_rqst *rqstp, struct svc_fh *fhp,</div><div class='add'>+		  struct nfsd_file **pnf);</div><div class='add'>+int nfsd_file_cache_stats_show(struct seq_file *m, void *v);</div><div class='ctx'> #endif /* _FS_NFSD_FILECACHE_H */</div><div class='head'>diff --git a/fs/nfsd/flexfilelayout.c b/fs/nfsd/flexfilelayout.c<br/>index 2e2f1d5e9f62..0f1a35400cd5 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/flexfilelayout.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/flexfilelayout.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/flexfilelayout.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/flexfilelayout.c</a></div><div class='hunk'>@@ -15,12 +15,13 @@</div><div class='ctx'> </div><div class='ctx'> #include "flexfilelayoutxdr.h"</div><div class='ctx'> #include "pnfs.h"</div><div class='add'>+#include "vfs.h"</div><div class='ctx'> </div><div class='ctx'> #define NFSDDBG_FACILITY	NFSDDBG_PNFS</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_ff_proc_layoutget(struct inode *inode, const struct svc_fh *fhp,</div><div class='del'>-		struct nfsd4_layoutget *args)</div><div class='add'>+nfsd4_ff_proc_layoutget(struct svc_rqst *rqstp, struct inode *inode,</div><div class='add'>+		const struct svc_fh *fhp, struct nfsd4_layoutget *args)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd4_layout_seg *seg = &amp;args-&gt;lg_seg;</div><div class='ctx'> 	u32 device_generation = 0;</div><div class='hunk'>@@ -117,13 +118,20 @@ nfsd4_ff_proc_getdeviceinfo(struct super_block *sb, struct svc_rqst *rqstp,</div><div class='ctx'> </div><div class='ctx'> 	da-&gt;netaddr.addr_len =</div><div class='ctx'> 		snprintf(da-&gt;netaddr.addr, FF_ADDR_LEN + 1,</div><div class='del'>-			 "%s.%hhu.%hhu", addr, port &gt;&gt; 8, port &amp; 0xff);</div><div class='add'>+			 "%s.%d.%d", addr, port &gt;&gt; 8, port &amp; 0xff);</div><div class='ctx'> </div><div class='ctx'> 	da-&gt;tightly_coupled = false;</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static __be32</div><div class='add'>+nfsd4_ff_proc_layoutcommit(struct inode *inode, struct svc_rqst *rqstp,</div><div class='add'>+		struct nfsd4_layoutcommit *lcp)</div><div class='add'>+{</div><div class='add'>+	return nfs_ok;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> const struct nfsd4_layout_ops ff_layout_ops = {</div><div class='ctx'> 	.notify_types		=</div><div class='ctx'> 			NOTIFY_DEVICEID4_DELETE | NOTIFY_DEVICEID4_CHANGE,</div><div class='hunk'>@@ -132,4 +140,5 @@ const struct nfsd4_layout_ops ff_layout_ops = {</div><div class='ctx'> 	.encode_getdeviceinfo	= nfsd4_ff_encode_getdeviceinfo,</div><div class='ctx'> 	.proc_layoutget		= nfsd4_ff_proc_layoutget,</div><div class='ctx'> 	.encode_layoutget	= nfsd4_ff_encode_layoutget,</div><div class='add'>+	.proc_layoutcommit	= nfsd4_ff_proc_layoutcommit,</div><div class='ctx'> };</div><div class='head'>diff --git a/fs/nfsd/flexfilelayoutxdr.c b/fs/nfsd/flexfilelayoutxdr.c<br/>index e81d2a5cf381..f9f7e38cba13 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/flexfilelayoutxdr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/flexfilelayoutxdr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/flexfilelayoutxdr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/flexfilelayoutxdr.c</a></div><div class='hunk'>@@ -17,9 +17,9 @@ struct ff_idmap {</div><div class='ctx'> </div><div class='ctx'> __be32</div><div class='ctx'> nfsd4_ff_encode_layoutget(struct xdr_stream *xdr,</div><div class='del'>-		struct nfsd4_layoutget *lgp)</div><div class='add'>+		const struct nfsd4_layoutget *lgp)</div><div class='ctx'> {</div><div class='del'>-	struct pnfs_ff_layout *fl = lgp-&gt;lg_content;</div><div class='add'>+	const struct pnfs_ff_layout *fl = lgp-&gt;lg_content;</div><div class='ctx'> 	int len, mirror_len, ds_len, fh_len;</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> </div><div class='hunk'>@@ -54,8 +54,7 @@ nfsd4_ff_encode_layoutget(struct xdr_stream *xdr,</div><div class='ctx'> 	*p++ = cpu_to_be32(1);			/* single mirror */</div><div class='ctx'> 	*p++ = cpu_to_be32(1);			/* single data server */</div><div class='ctx'> </div><div class='del'>-	p = xdr_encode_opaque_fixed(p, &amp;fl-&gt;deviceid,</div><div class='del'>-			sizeof(struct nfsd4_deviceid));</div><div class='add'>+	p = svcxdr_encode_deviceid4(p, &amp;fl-&gt;deviceid);</div><div class='ctx'> </div><div class='ctx'> 	*p++ = cpu_to_be32(1);			/* efficiency */</div><div class='ctx'> </div><div class='hunk'>@@ -77,7 +76,7 @@ nfsd4_ff_encode_layoutget(struct xdr_stream *xdr,</div><div class='ctx'> </div><div class='ctx'> __be32</div><div class='ctx'> nfsd4_ff_encode_getdeviceinfo(struct xdr_stream *xdr,</div><div class='del'>-		struct nfsd4_getdeviceinfo *gdp)</div><div class='add'>+		const struct nfsd4_getdeviceinfo *gdp)</div><div class='ctx'> {</div><div class='ctx'> 	struct pnfs_ff_device_addr *da = gdp-&gt;gd_device;</div><div class='ctx'> 	int len;</div><div class='hunk'>@@ -85,6 +84,15 @@ nfsd4_ff_encode_getdeviceinfo(struct xdr_stream *xdr,</div><div class='ctx'> 	int addr_len;</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * See paragraph 5 of RFC 8881 S18.40.3.</div><div class='add'>+	 */</div><div class='add'>+	if (!gdp-&gt;gd_maxcount) {</div><div class='add'>+		if (xdr_stream_encode_u32(xdr, 0) != XDR_UNIT)</div><div class='add'>+			return nfserr_resource;</div><div class='add'>+		return nfs_ok;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/* len + padding for two strings */</div><div class='ctx'> 	addr_len = 16 + da-&gt;netaddr.netid_len + da-&gt;netaddr.addr_len;</div><div class='ctx'> 	ver_len = 20;</div><div class='head'>diff --git a/fs/nfsd/flexfilelayoutxdr.h b/fs/nfsd/flexfilelayoutxdr.h<br/>index 8e195aeca023..6d5a1066a903 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/flexfilelayoutxdr.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/flexfilelayoutxdr.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/flexfilelayoutxdr.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/flexfilelayoutxdr.h</a></div><div class='hunk'>@@ -43,8 +43,8 @@ struct pnfs_ff_layout {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> __be32 nfsd4_ff_encode_getdeviceinfo(struct xdr_stream *xdr,</div><div class='del'>-		struct nfsd4_getdeviceinfo *gdp);</div><div class='add'>+		const struct nfsd4_getdeviceinfo *gdp);</div><div class='ctx'> __be32 nfsd4_ff_encode_layoutget(struct xdr_stream *xdr,</div><div class='del'>-		struct nfsd4_layoutget *lgp);</div><div class='add'>+		const struct nfsd4_layoutget *lgp);</div><div class='ctx'> </div><div class='ctx'> #endif /* _NFSD_FLEXFILELAYOUTXDR_H */</div><div class='head'>diff --git a/fs/nfsd/localio.c b/fs/nfsd/localio.c<br/>new file mode 100644<br/>index 000000000000..be710d809a3b<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/localio.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/localio.c</a></div><div class='hunk'>@@ -0,0 +1,217 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0-only</div><div class='add'>+/*</div><div class='add'>+ * NFS server support for local clients to bypass network stack</div><div class='add'>+ *</div><div class='add'>+ * Copyright (C) 2014 Weston Andros Adamson &lt;dros@primarydata.com&gt;</div><div class='add'>+ * Copyright (C) 2019 Trond Myklebust &lt;trond.myklebust@hammerspace.com&gt;</div><div class='add'>+ * Copyright (C) 2024 Mike Snitzer &lt;snitzer@hammerspace.com&gt;</div><div class='add'>+ * Copyright (C) 2024 NeilBrown &lt;neilb@suse.de&gt;</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+#include &lt;linux/exportfs.h&gt;</div><div class='add'>+#include &lt;linux/sunrpc/svcauth.h&gt;</div><div class='add'>+#include &lt;linux/sunrpc/clnt.h&gt;</div><div class='add'>+#include &lt;linux/nfs.h&gt;</div><div class='add'>+#include &lt;linux/nfs_common.h&gt;</div><div class='add'>+#include &lt;linux/nfslocalio.h&gt;</div><div class='add'>+#include &lt;linux/nfs_fs.h&gt;</div><div class='add'>+#include &lt;linux/nfs_xdr.h&gt;</div><div class='add'>+#include &lt;linux/string.h&gt;</div><div class='add'>+</div><div class='add'>+#include "nfsd.h"</div><div class='add'>+#include "vfs.h"</div><div class='add'>+#include "netns.h"</div><div class='add'>+#include "filecache.h"</div><div class='add'>+#include "cache.h"</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * nfsd_open_local_fh - lookup a local filehandle @nfs_fh and map to nfsd_file</div><div class='add'>+ *</div><div class='add'>+ * @net: 'struct net' to get the proper nfsd_net required for LOCALIO access</div><div class='add'>+ * @dom: 'struct auth_domain' required for LOCALIO access</div><div class='add'>+ * @rpc_clnt: rpc_clnt that the client established</div><div class='add'>+ * @cred: cred that the client established</div><div class='add'>+ * @nfs_fh: filehandle to lookup</div><div class='add'>+ * @pnf: place to find the nfsd_file, or store it if it was non-NULL</div><div class='add'>+ * @fmode: fmode_t to use for open</div><div class='add'>+ *</div><div class='add'>+ * This function maps a local fh to a path on a local filesystem.</div><div class='add'>+ * This is useful when the nfs client has the local server mounted - it can</div><div class='add'>+ * avoid all the NFS overhead with reads, writes and commits.</div><div class='add'>+ *</div><div class='add'>+ * On successful return, returned nfsd_file will have its nf_net member</div><div class='add'>+ * set. Caller (NFS client) is responsible for calling nfsd_net_put and</div><div class='add'>+ * nfsd_file_put (via nfs_to_nfsd_file_put_local).</div><div class='add'>+ */</div><div class='add'>+static struct nfsd_file *</div><div class='add'>+nfsd_open_local_fh(struct net *net, struct auth_domain *dom,</div><div class='add'>+		   struct rpc_clnt *rpc_clnt, const struct cred *cred,</div><div class='add'>+		   const struct nfs_fh *nfs_fh, struct nfsd_file __rcu **pnf,</div><div class='add'>+		   const fmode_t fmode)</div><div class='add'>+{</div><div class='add'>+	int mayflags = NFSD_MAY_LOCALIO;</div><div class='add'>+	struct svc_cred rq_cred;</div><div class='add'>+	struct svc_fh fh;</div><div class='add'>+	struct nfsd_file *localio;</div><div class='add'>+	__be32 beres;</div><div class='add'>+</div><div class='add'>+	if (nfs_fh-&gt;size &gt; NFS4_FHSIZE)</div><div class='add'>+		return ERR_PTR(-EINVAL);</div><div class='add'>+</div><div class='add'>+	if (!nfsd_net_try_get(net))</div><div class='add'>+		return ERR_PTR(-ENXIO);</div><div class='add'>+</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	localio = nfsd_file_get(rcu_dereference(*pnf));</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+	if (localio)</div><div class='add'>+		return localio;</div><div class='add'>+</div><div class='add'>+	/* nfs_fh -&gt; svc_fh */</div><div class='add'>+	fh_init(&amp;fh, NFS4_FHSIZE);</div><div class='add'>+	fh.fh_handle.fh_size = nfs_fh-&gt;size;</div><div class='add'>+	memcpy(fh.fh_handle.fh_raw, nfs_fh-&gt;data, nfs_fh-&gt;size);</div><div class='add'>+</div><div class='add'>+	if (fmode &amp; FMODE_READ)</div><div class='add'>+		mayflags |= NFSD_MAY_READ;</div><div class='add'>+	if (fmode &amp; FMODE_WRITE)</div><div class='add'>+		mayflags |= NFSD_MAY_WRITE;</div><div class='add'>+</div><div class='add'>+	svcauth_map_clnt_to_svc_cred_local(rpc_clnt, cred, &amp;rq_cred);</div><div class='add'>+</div><div class='add'>+	beres = nfsd_file_acquire_local(net, &amp;rq_cred, dom,</div><div class='add'>+					&amp;fh, mayflags, &amp;localio);</div><div class='add'>+	if (beres)</div><div class='add'>+		localio = ERR_PTR(nfs_stat_to_errno(be32_to_cpu(beres)));</div><div class='add'>+</div><div class='add'>+	fh_put(&amp;fh);</div><div class='add'>+	if (rq_cred.cr_group_info)</div><div class='add'>+		put_group_info(rq_cred.cr_group_info);</div><div class='add'>+</div><div class='add'>+	if (!IS_ERR(localio)) {</div><div class='add'>+		struct nfsd_file *new;</div><div class='add'>+		if (!nfsd_net_try_get(net)) {</div><div class='add'>+			nfsd_file_put(localio);</div><div class='add'>+			nfsd_net_put(net);</div><div class='add'>+			return ERR_PTR(-ENXIO);</div><div class='add'>+		}</div><div class='add'>+		nfsd_file_get(localio);</div><div class='add'>+	again:</div><div class='add'>+		new = unrcu_pointer(cmpxchg(pnf, NULL, RCU_INITIALIZER(localio)));</div><div class='add'>+		if (new) {</div><div class='add'>+			/* Some other thread installed an nfsd_file */</div><div class='add'>+			if (nfsd_file_get(new) == NULL)</div><div class='add'>+				goto again;</div><div class='add'>+			/*</div><div class='add'>+			 * Drop the ref we were going to install (both file and</div><div class='add'>+			 * net) and the one we were going to return (only file).</div><div class='add'>+			 */</div><div class='add'>+			nfsd_file_put(localio);</div><div class='add'>+			nfsd_net_put(net);</div><div class='add'>+			nfsd_file_put(localio);</div><div class='add'>+			localio = new;</div><div class='add'>+		}</div><div class='add'>+	} else</div><div class='add'>+		nfsd_net_put(net);</div><div class='add'>+</div><div class='add'>+	return localio;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfsd_file_dio_alignment(struct nfsd_file *nf,</div><div class='add'>+				    u32 *nf_dio_mem_align,</div><div class='add'>+				    u32 *nf_dio_offset_align,</div><div class='add'>+				    u32 *nf_dio_read_offset_align)</div><div class='add'>+{</div><div class='add'>+	*nf_dio_mem_align = nf-&gt;nf_dio_mem_align;</div><div class='add'>+	*nf_dio_offset_align = nf-&gt;nf_dio_offset_align;</div><div class='add'>+	*nf_dio_read_offset_align = nf-&gt;nf_dio_read_offset_align;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct nfsd_localio_operations nfsd_localio_ops = {</div><div class='add'>+	.nfsd_net_try_get  = nfsd_net_try_get,</div><div class='add'>+	.nfsd_net_put  = nfsd_net_put,</div><div class='add'>+	.nfsd_open_local_fh = nfsd_open_local_fh,</div><div class='add'>+	.nfsd_file_put_local = nfsd_file_put_local,</div><div class='add'>+	.nfsd_file_file = nfsd_file_file,</div><div class='add'>+	.nfsd_file_dio_alignment = nfsd_file_dio_alignment,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+void nfsd_localio_ops_init(void)</div><div class='add'>+{</div><div class='add'>+	nfs_to = &amp;nfsd_localio_ops;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * UUID_IS_LOCAL XDR functions</div><div class='add'>+ */</div><div class='add'>+</div><div class='add'>+static __be32 localio_proc_null(struct svc_rqst *rqstp)</div><div class='add'>+{</div><div class='add'>+	return rpc_success;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+struct localio_uuidarg {</div><div class='add'>+	uuid_t			uuid;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static __be32 localio_proc_uuid_is_local(struct svc_rqst *rqstp)</div><div class='add'>+{</div><div class='add'>+	struct localio_uuidarg *argp = rqstp-&gt;rq_argp;</div><div class='add'>+	struct net *net = SVC_NET(rqstp);</div><div class='add'>+	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='add'>+</div><div class='add'>+	nfs_uuid_is_local(&amp;argp-&gt;uuid, &amp;nn-&gt;local_clients,</div><div class='add'>+			  &amp;nn-&gt;local_clients_lock,</div><div class='add'>+			  net, rqstp-&gt;rq_client, THIS_MODULE);</div><div class='add'>+</div><div class='add'>+	return rpc_success;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool localio_decode_uuidarg(struct svc_rqst *rqstp,</div><div class='add'>+				   struct xdr_stream *xdr)</div><div class='add'>+{</div><div class='add'>+	struct localio_uuidarg *argp = rqstp-&gt;rq_argp;</div><div class='add'>+	u8 uuid[UUID_SIZE];</div><div class='add'>+</div><div class='add'>+	if (decode_opaque_fixed(xdr, uuid, UUID_SIZE))</div><div class='add'>+		return false;</div><div class='add'>+	import_uuid(&amp;argp-&gt;uuid, uuid);</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct svc_procedure localio_procedures1[] = {</div><div class='add'>+	[LOCALIOPROC_NULL] = {</div><div class='add'>+		.pc_func = localio_proc_null,</div><div class='add'>+		.pc_decode = nfssvc_decode_voidarg,</div><div class='add'>+		.pc_encode = nfssvc_encode_voidres,</div><div class='add'>+		.pc_argsize = sizeof(struct nfsd_voidargs),</div><div class='add'>+		.pc_ressize = sizeof(struct nfsd_voidres),</div><div class='add'>+		.pc_cachetype = RC_NOCACHE,</div><div class='add'>+		.pc_xdrressize = 0,</div><div class='add'>+		.pc_name = "NULL",</div><div class='add'>+	},</div><div class='add'>+	[LOCALIOPROC_UUID_IS_LOCAL] = {</div><div class='add'>+		.pc_func = localio_proc_uuid_is_local,</div><div class='add'>+		.pc_decode = localio_decode_uuidarg,</div><div class='add'>+		.pc_encode = nfssvc_encode_voidres,</div><div class='add'>+		.pc_argsize = sizeof(struct localio_uuidarg),</div><div class='add'>+		.pc_argzero = sizeof(struct localio_uuidarg),</div><div class='add'>+		.pc_ressize = sizeof(struct nfsd_voidres),</div><div class='add'>+		.pc_cachetype = RC_NOCACHE,</div><div class='add'>+		.pc_name = "UUID_IS_LOCAL",</div><div class='add'>+	},</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+#define LOCALIO_NR_PROCEDURES ARRAY_SIZE(localio_procedures1)</div><div class='add'>+static DEFINE_PER_CPU_ALIGNED(unsigned long,</div><div class='add'>+			      localio_count[LOCALIO_NR_PROCEDURES]);</div><div class='add'>+const struct svc_version localio_version1 = {</div><div class='add'>+	.vs_vers	= 1,</div><div class='add'>+	.vs_nproc	= LOCALIO_NR_PROCEDURES,</div><div class='add'>+	.vs_proc	= localio_procedures1,</div><div class='add'>+	.vs_dispatch	= nfsd_dispatch,</div><div class='add'>+	.vs_count	= localio_count,</div><div class='add'>+	.vs_xdrsize	= XDR_QUADLEN(UUID_SIZE),</div><div class='add'>+	.vs_hidden	= true,</div><div class='add'>+};</div><div class='head'>diff --git a/fs/nfsd/lockd.c b/fs/nfsd/lockd.c<br/>index 46a7f9b813e5..c774ce9aa296 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/lockd.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/lockd.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/lockd.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/lockd.c</a></div><div class='hunk'>@@ -38,17 +38,39 @@ nlm_fopen(struct svc_rqst *rqstp, struct nfs_fh *f, struct file **filp,</div><div class='ctx'> 	memcpy(&amp;fh.fh_handle.fh_raw, f-&gt;data, f-&gt;size);</div><div class='ctx'> 	fh.fh_export = NULL;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Allow BYPASS_GSS as some client implementations use AUTH_SYS</div><div class='add'>+	 * for NLM even when GSS is used for NFS.</div><div class='add'>+	 * Allow OWNER_OVERRIDE as permission might have been changed</div><div class='add'>+	 * after the file was opened.</div><div class='add'>+	 * Pass MAY_NLM so that authentication can be completely bypassed</div><div class='add'>+	 * if NFSEXP_NOAUTHNLM is set.  Some older clients use AUTH_NULL</div><div class='add'>+	 * for NLM requests.</div><div class='add'>+	 */</div><div class='ctx'> 	access = (mode == O_WRONLY) ? NFSD_MAY_WRITE : NFSD_MAY_READ;</div><div class='del'>-	access |= NFSD_MAY_LOCK;</div><div class='add'>+	access |= NFSD_MAY_NLM | NFSD_MAY_OWNER_OVERRIDE | NFSD_MAY_BYPASS_GSS;</div><div class='ctx'> 	nfserr = nfsd_open(rqstp, &amp;fh, S_IFREG, access, filp);</div><div class='ctx'> 	fh_put(&amp;fh);</div><div class='del'>- 	/* We return nlm error codes as nlm doesn't know</div><div class='add'>+	/* We return nlm error codes as nlm doesn't know</div><div class='ctx'> 	 * about nfsd, but nfsd does know about nlm..</div><div class='ctx'> 	 */</div><div class='ctx'> 	switch (nfserr) {</div><div class='ctx'> 	case nfs_ok:</div><div class='ctx'> 		return 0;</div><div class='del'>-	case nfserr_dropit:</div><div class='add'>+	case nfserr_jukebox:</div><div class='add'>+		/* this error can indicate a presence of a conflicting</div><div class='add'>+		 * delegation to an NLM lock request. Options are:</div><div class='add'>+		 * (1) For now, drop this request and make the client</div><div class='add'>+		 * retry. When delegation is returned, client's lock retry</div><div class='add'>+		 * will complete.</div><div class='add'>+		 * (2) NLM4_DENIED as per "spec" signals to the client</div><div class='add'>+		 * that the lock is unavailable now but client can retry.</div><div class='add'>+		 * Linux client implementation does not. It treats</div><div class='add'>+		 * NLM4_DENIED same as NLM4_FAILED and errors the request.</div><div class='add'>+		 * (3) For the future, treat this as blocked lock and try</div><div class='add'>+		 * to callback when the delegation is returned but might</div><div class='add'>+		 * not have a proper lock request to block on.</div><div class='add'>+		 */</div><div class='ctx'> 		return nlm_drop_reply;</div><div class='ctx'> 	case nfserr_stale:</div><div class='ctx'> 		return nlm_stale_fh;</div><div class='head'>diff --git a/fs/nfsd/netlink.c b/fs/nfsd/netlink.c<br/>new file mode 100644<br/>index 000000000000..ac51a44e1065<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/netlink.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/netlink.c</a></div><div class='hunk'>@@ -0,0 +1,114 @@</div><div class='add'>+// SPDX-License-Identifier: ((GPL-2.0 WITH Linux-syscall-note) OR BSD-3-Clause)</div><div class='add'>+/* Do not edit directly, auto-generated from: */</div><div class='add'>+/*	Documentation/netlink/specs/nfsd.yaml */</div><div class='add'>+/* YNL-GEN kernel source */</div><div class='add'>+/* To regenerate run: tools/net/ynl/ynl-regen.sh */</div><div class='add'>+</div><div class='add'>+#include &lt;net/netlink.h&gt;</div><div class='add'>+#include &lt;net/genetlink.h&gt;</div><div class='add'>+</div><div class='add'>+#include "netlink.h"</div><div class='add'>+</div><div class='add'>+#include &lt;uapi/linux/nfsd_netlink.h&gt;</div><div class='add'>+</div><div class='add'>+/* Common nested types */</div><div class='add'>+const struct nla_policy nfsd_sock_nl_policy[NFSD_A_SOCK_TRANSPORT_NAME + 1] = {</div><div class='add'>+	[NFSD_A_SOCK_ADDR] = { .type = NLA_BINARY, },</div><div class='add'>+	[NFSD_A_SOCK_TRANSPORT_NAME] = { .type = NLA_NUL_STRING, },</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+const struct nla_policy nfsd_version_nl_policy[NFSD_A_VERSION_ENABLED + 1] = {</div><div class='add'>+	[NFSD_A_VERSION_MAJOR] = { .type = NLA_U32, },</div><div class='add'>+	[NFSD_A_VERSION_MINOR] = { .type = NLA_U32, },</div><div class='add'>+	[NFSD_A_VERSION_ENABLED] = { .type = NLA_FLAG, },</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/* NFSD_CMD_THREADS_SET - do */</div><div class='add'>+static const struct nla_policy nfsd_threads_set_nl_policy[NFSD_A_SERVER_SCOPE + 1] = {</div><div class='add'>+	[NFSD_A_SERVER_THREADS] = { .type = NLA_U32, },</div><div class='add'>+	[NFSD_A_SERVER_GRACETIME] = { .type = NLA_U32, },</div><div class='add'>+	[NFSD_A_SERVER_LEASETIME] = { .type = NLA_U32, },</div><div class='add'>+	[NFSD_A_SERVER_SCOPE] = { .type = NLA_NUL_STRING, },</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/* NFSD_CMD_VERSION_SET - do */</div><div class='add'>+static const struct nla_policy nfsd_version_set_nl_policy[NFSD_A_SERVER_PROTO_VERSION + 1] = {</div><div class='add'>+	[NFSD_A_SERVER_PROTO_VERSION] = NLA_POLICY_NESTED(nfsd_version_nl_policy),</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/* NFSD_CMD_LISTENER_SET - do */</div><div class='add'>+static const struct nla_policy nfsd_listener_set_nl_policy[NFSD_A_SERVER_SOCK_ADDR + 1] = {</div><div class='add'>+	[NFSD_A_SERVER_SOCK_ADDR] = NLA_POLICY_NESTED(nfsd_sock_nl_policy),</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/* NFSD_CMD_POOL_MODE_SET - do */</div><div class='add'>+static const struct nla_policy nfsd_pool_mode_set_nl_policy[NFSD_A_POOL_MODE_MODE + 1] = {</div><div class='add'>+	[NFSD_A_POOL_MODE_MODE] = { .type = NLA_NUL_STRING, },</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/* Ops table for nfsd */</div><div class='add'>+static const struct genl_split_ops nfsd_nl_ops[] = {</div><div class='add'>+	{</div><div class='add'>+		.cmd	= NFSD_CMD_RPC_STATUS_GET,</div><div class='add'>+		.dumpit	= nfsd_nl_rpc_status_get_dumpit,</div><div class='add'>+		.flags	= GENL_CMD_CAP_DUMP,</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+		.cmd		= NFSD_CMD_THREADS_SET,</div><div class='add'>+		.doit		= nfsd_nl_threads_set_doit,</div><div class='add'>+		.policy		= nfsd_threads_set_nl_policy,</div><div class='add'>+		.maxattr	= NFSD_A_SERVER_SCOPE,</div><div class='add'>+		.flags		= GENL_ADMIN_PERM | GENL_CMD_CAP_DO,</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+		.cmd	= NFSD_CMD_THREADS_GET,</div><div class='add'>+		.doit	= nfsd_nl_threads_get_doit,</div><div class='add'>+		.flags	= GENL_CMD_CAP_DO,</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+		.cmd		= NFSD_CMD_VERSION_SET,</div><div class='add'>+		.doit		= nfsd_nl_version_set_doit,</div><div class='add'>+		.policy		= nfsd_version_set_nl_policy,</div><div class='add'>+		.maxattr	= NFSD_A_SERVER_PROTO_VERSION,</div><div class='add'>+		.flags		= GENL_ADMIN_PERM | GENL_CMD_CAP_DO,</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+		.cmd	= NFSD_CMD_VERSION_GET,</div><div class='add'>+		.doit	= nfsd_nl_version_get_doit,</div><div class='add'>+		.flags	= GENL_CMD_CAP_DO,</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+		.cmd		= NFSD_CMD_LISTENER_SET,</div><div class='add'>+		.doit		= nfsd_nl_listener_set_doit,</div><div class='add'>+		.policy		= nfsd_listener_set_nl_policy,</div><div class='add'>+		.maxattr	= NFSD_A_SERVER_SOCK_ADDR,</div><div class='add'>+		.flags		= GENL_ADMIN_PERM | GENL_CMD_CAP_DO,</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+		.cmd	= NFSD_CMD_LISTENER_GET,</div><div class='add'>+		.doit	= nfsd_nl_listener_get_doit,</div><div class='add'>+		.flags	= GENL_CMD_CAP_DO,</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+		.cmd		= NFSD_CMD_POOL_MODE_SET,</div><div class='add'>+		.doit		= nfsd_nl_pool_mode_set_doit,</div><div class='add'>+		.policy		= nfsd_pool_mode_set_nl_policy,</div><div class='add'>+		.maxattr	= NFSD_A_POOL_MODE_MODE,</div><div class='add'>+		.flags		= GENL_ADMIN_PERM | GENL_CMD_CAP_DO,</div><div class='add'>+	},</div><div class='add'>+	{</div><div class='add'>+		.cmd	= NFSD_CMD_POOL_MODE_GET,</div><div class='add'>+		.doit	= nfsd_nl_pool_mode_get_doit,</div><div class='add'>+		.flags	= GENL_CMD_CAP_DO,</div><div class='add'>+	},</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct genl_family nfsd_nl_family __ro_after_init = {</div><div class='add'>+	.name		= NFSD_FAMILY_NAME,</div><div class='add'>+	.version	= NFSD_FAMILY_VERSION,</div><div class='add'>+	.netnsok	= true,</div><div class='add'>+	.parallel_ops	= true,</div><div class='add'>+	.module		= THIS_MODULE,</div><div class='add'>+	.split_ops	= nfsd_nl_ops,</div><div class='add'>+	.n_split_ops	= ARRAY_SIZE(nfsd_nl_ops),</div><div class='add'>+};</div><div class='head'>diff --git a/fs/nfsd/netlink.h b/fs/nfsd/netlink.h<br/>new file mode 100644<br/>index 000000000000..478117ff6b8c<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/netlink.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/netlink.h</a></div><div class='hunk'>@@ -0,0 +1,32 @@</div><div class='add'>+/* SPDX-License-Identifier: ((GPL-2.0 WITH Linux-syscall-note) OR BSD-3-Clause) */</div><div class='add'>+/* Do not edit directly, auto-generated from: */</div><div class='add'>+/*	Documentation/netlink/specs/nfsd.yaml */</div><div class='add'>+/* YNL-GEN kernel header */</div><div class='add'>+/* To regenerate run: tools/net/ynl/ynl-regen.sh */</div><div class='add'>+</div><div class='add'>+#ifndef _LINUX_NFSD_GEN_H</div><div class='add'>+#define _LINUX_NFSD_GEN_H</div><div class='add'>+</div><div class='add'>+#include &lt;net/netlink.h&gt;</div><div class='add'>+#include &lt;net/genetlink.h&gt;</div><div class='add'>+</div><div class='add'>+#include &lt;uapi/linux/nfsd_netlink.h&gt;</div><div class='add'>+</div><div class='add'>+/* Common nested types */</div><div class='add'>+extern const struct nla_policy nfsd_sock_nl_policy[NFSD_A_SOCK_TRANSPORT_NAME + 1];</div><div class='add'>+extern const struct nla_policy nfsd_version_nl_policy[NFSD_A_VERSION_ENABLED + 1];</div><div class='add'>+</div><div class='add'>+int nfsd_nl_rpc_status_get_dumpit(struct sk_buff *skb,</div><div class='add'>+				  struct netlink_callback *cb);</div><div class='add'>+int nfsd_nl_threads_set_doit(struct sk_buff *skb, struct genl_info *info);</div><div class='add'>+int nfsd_nl_threads_get_doit(struct sk_buff *skb, struct genl_info *info);</div><div class='add'>+int nfsd_nl_version_set_doit(struct sk_buff *skb, struct genl_info *info);</div><div class='add'>+int nfsd_nl_version_get_doit(struct sk_buff *skb, struct genl_info *info);</div><div class='add'>+int nfsd_nl_listener_set_doit(struct sk_buff *skb, struct genl_info *info);</div><div class='add'>+int nfsd_nl_listener_get_doit(struct sk_buff *skb, struct genl_info *info);</div><div class='add'>+int nfsd_nl_pool_mode_set_doit(struct sk_buff *skb, struct genl_info *info);</div><div class='add'>+int nfsd_nl_pool_mode_get_doit(struct sk_buff *skb, struct genl_info *info);</div><div class='add'>+</div><div class='add'>+extern struct genl_family nfsd_nl_family;</div><div class='add'>+</div><div class='add'>+#endif /* _LINUX_NFSD_GEN_H */</div><div class='head'>diff --git a/fs/nfsd/netns.h b/fs/nfsd/netns.h<br/>index 935c1028c217..3e2d0fde80a7 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/netns.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/netns.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/netns.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/netns.h</a></div><div class='hunk'>@@ -10,7 +10,12 @@</div><div class='ctx'> </div><div class='ctx'> #include &lt;net/net_namespace.h&gt;</div><div class='ctx'> #include &lt;net/netns/generic.h&gt;</div><div class='add'>+#include &lt;linux/filelock.h&gt;</div><div class='add'>+#include &lt;linux/nfs4.h&gt;</div><div class='ctx'> #include &lt;linux/percpu_counter.h&gt;</div><div class='add'>+#include &lt;linux/percpu-refcount.h&gt;</div><div class='add'>+#include &lt;linux/siphash.h&gt;</div><div class='add'>+#include &lt;linux/sunrpc/stats.h&gt;</div><div class='ctx'> </div><div class='ctx'> /* Hash tables for nfs4_clientid state */</div><div class='ctx'> #define CLIENT_HASH_BITS                 4</div><div class='hunk'>@@ -24,10 +29,22 @@ struct nfsd4_client_tracking_ops;</div><div class='ctx'> </div><div class='ctx'> enum {</div><div class='ctx'> 	/* cache misses due only to checksum comparison failures */</div><div class='del'>-	NFSD_NET_PAYLOAD_MISSES,</div><div class='add'>+	NFSD_STATS_PAYLOAD_MISSES,</div><div class='ctx'> 	/* amount of memory (in bytes) currently consumed by the DRC */</div><div class='del'>-	NFSD_NET_DRC_MEM_USAGE,</div><div class='del'>-	NFSD_NET_COUNTERS_NUM</div><div class='add'>+	NFSD_STATS_DRC_MEM_USAGE,</div><div class='add'>+	NFSD_STATS_RC_HITS,		/* repcache hits */</div><div class='add'>+	NFSD_STATS_RC_MISSES,		/* repcache misses */</div><div class='add'>+	NFSD_STATS_RC_NOCACHE,		/* uncached reqs */</div><div class='add'>+	NFSD_STATS_FH_STALE,		/* FH stale error */</div><div class='add'>+	NFSD_STATS_IO_READ,		/* bytes returned to read requests */</div><div class='add'>+	NFSD_STATS_IO_WRITE,		/* bytes passed in write requests */</div><div class='add'>+#ifdef CONFIG_NFSD_V4</div><div class='add'>+	NFSD_STATS_FIRST_NFS4_OP,	/* count of individual nfsv4 operations */</div><div class='add'>+	NFSD_STATS_LAST_NFS4_OP = NFSD_STATS_FIRST_NFS4_OP + LAST_NFS4_OP,</div><div class='add'>+#define NFSD_STATS_NFS4_OP(op)	(NFSD_STATS_FIRST_NFS4_OP + (op))</div><div class='add'>+	NFSD_STATS_WDELEG_GETATTR,	/* count of getattr conflict with wdeleg */</div><div class='add'>+#endif</div><div class='add'>+	NFSD_STATS_COUNTERS_NUM</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -108,27 +125,19 @@ struct nfsd_net {</div><div class='ctx'> 	bool nfsd_net_up;</div><div class='ctx'> 	bool lockd_up;</div><div class='ctx'> </div><div class='del'>-	/* Time of server startup */</div><div class='del'>-	struct timespec64 nfssvc_boot;</div><div class='del'>-	seqlock_t boot_lock;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * Max number of connections this nfsd container will allow. Defaults</div><div class='del'>-	 * to '0' which is means that it bases this on the number of threads.</div><div class='del'>-	 */</div><div class='del'>-	unsigned int max_connections;</div><div class='add'>+	seqlock_t writeverf_lock;</div><div class='add'>+	unsigned char writeverf[8];</div><div class='ctx'> </div><div class='ctx'> 	u32 clientid_base;</div><div class='ctx'> 	u32 clientid_counter;</div><div class='ctx'> 	u32 clverifier_counter;</div><div class='ctx'> </div><div class='del'>-	struct svc_serv *nfsd_serv;</div><div class='del'>-</div><div class='del'>-	wait_queue_head_t ntf_wq;</div><div class='del'>-	atomic_t ntf_refcnt;</div><div class='add'>+	struct svc_info nfsd_info;</div><div class='add'>+#define nfsd_serv nfsd_info.serv</div><div class='ctx'> </div><div class='del'>-	/* Allow umount to wait for nfsd state cleanup */</div><div class='del'>-	struct completion nfsd_shutdown_complete;</div><div class='add'>+	struct percpu_ref nfsd_net_ref;</div><div class='add'>+	struct completion nfsd_net_confirm_done;</div><div class='add'>+	struct completion nfsd_net_free_done;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * clientid and stateid data for construction of net unique COPY</div><div class='hunk'>@@ -137,12 +146,13 @@ struct nfsd_net {</div><div class='ctx'> 	u32		s2s_cp_cl_id;</div><div class='ctx'> 	struct idr	s2s_cp_stateids;</div><div class='ctx'> 	spinlock_t	s2s_cp_lock;</div><div class='add'>+	atomic_t	pending_async_copies;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Version information</div><div class='ctx'> 	 */</div><div class='del'>-	bool *nfsd_versions;</div><div class='del'>-	bool *nfsd4_minorversions;</div><div class='add'>+	bool nfsd_versions[NFSD_MAXVERS + 1];</div><div class='add'>+	bool nfsd4_minorversions[NFSD_SUPPORTED_MINOR_VERSION + 1];</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Duplicate reply cache</div><div class='hunk'>@@ -167,7 +177,10 @@ struct nfsd_net {</div><div class='ctx'> 	atomic_t                 num_drc_entries;</div><div class='ctx'> </div><div class='ctx'> 	/* Per-netns stats counters */</div><div class='del'>-	struct percpu_counter    counter[NFSD_NET_COUNTERS_NUM];</div><div class='add'>+	struct percpu_counter    counter[NFSD_STATS_COUNTERS_NUM];</div><div class='add'>+</div><div class='add'>+	/* sunrpc svc stats */</div><div class='add'>+	struct svc_stat          nfsd_svcstats;</div><div class='ctx'> </div><div class='ctx'> 	/* longest hash chain seen */</div><div class='ctx'> 	unsigned int             longest_chain;</div><div class='hunk'>@@ -175,7 +188,7 @@ struct nfsd_net {</div><div class='ctx'> 	/* size of cache when we saw the longest hash chain */</div><div class='ctx'> 	unsigned int             longest_chain_cachesize;</div><div class='ctx'> </div><div class='del'>-	struct shrinker		nfsd_reply_cache_shrinker;</div><div class='add'>+	struct shrinker		*nfsd_reply_cache_shrinker;</div><div class='ctx'> </div><div class='ctx'> 	/* tracking server-to-server copy mounts */</div><div class='ctx'> 	spinlock_t              nfsd_ssc_lock;</div><div class='hunk'>@@ -184,15 +197,37 @@ struct nfsd_net {</div><div class='ctx'> </div><div class='ctx'> 	/* utsname taken from the process that starts the server */</div><div class='ctx'> 	char			nfsd_name[UNX_MAXNODENAME+1];</div><div class='add'>+</div><div class='add'>+	struct nfsd_fcache_disposal *fcache_disposal;</div><div class='add'>+</div><div class='add'>+	siphash_key_t		siphash_key;</div><div class='add'>+</div><div class='add'>+	atomic_t		nfs4_client_count;</div><div class='add'>+	int			nfs4_max_clients;</div><div class='add'>+</div><div class='add'>+	atomic_t		nfsd_courtesy_clients;</div><div class='add'>+	struct shrinker		*nfsd_client_shrinker;</div><div class='add'>+	struct work_struct	nfsd_shrinker_work;</div><div class='add'>+</div><div class='add'>+	/* last time an admin-revoke happened for NFSv4.0 */</div><div class='add'>+	time64_t		nfs40_last_revoke;</div><div class='add'>+</div><div class='add'>+#if IS_ENABLED(CONFIG_NFS_LOCALIO)</div><div class='add'>+	/* Local clients to be invalidated when net is shut down */</div><div class='add'>+	spinlock_t              local_clients_lock;</div><div class='add'>+	struct list_head	local_clients;</div><div class='add'>+#endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /* Simple check to find out if a given net was properly initialized */</div><div class='ctx'> #define nfsd_netns_ready(nn) ((nn)-&gt;sessionid_hashtbl)</div><div class='ctx'> </div><div class='del'>-extern void nfsd_netns_free_versions(struct nfsd_net *nn);</div><div class='del'>-</div><div class='add'>+extern bool nfsd_support_version(int vers);</div><div class='ctx'> extern unsigned int nfsd_net_id;</div><div class='ctx'> </div><div class='del'>-void nfsd_copy_boot_verifier(__be32 verf[2], struct nfsd_net *nn);</div><div class='del'>-void nfsd_reset_boot_verifier(struct nfsd_net *nn);</div><div class='add'>+bool nfsd_net_try_get(struct net *net);</div><div class='add'>+void nfsd_net_put(struct net *net);</div><div class='add'>+</div><div class='add'>+void nfsd_copy_write_verifier(__be32 verf[2], struct nfsd_net *nn);</div><div class='add'>+void nfsd_reset_write_verifier(struct nfsd_net *nn);</div><div class='ctx'> #endif /* __NFSD_NETNS_H__ */</div><div class='head'>diff --git a/fs/nfsd/nfs2acl.c b/fs/nfsd/nfs2acl.c<br/>index 367551bddfc6..5fb202acb0fd 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfs2acl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfs2acl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfs2acl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/nfs2acl.c</a></div><div class='hunk'>@@ -55,7 +55,7 @@ static __be32 nfsacld_proc_getacl(struct svc_rqst *rqstp)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	if (resp-&gt;mask &amp; (NFS_ACL|NFS_ACLCNT)) {</div><div class='del'>-		acl = get_acl(inode, ACL_TYPE_ACCESS);</div><div class='add'>+		acl = get_inode_acl(inode, ACL_TYPE_ACCESS);</div><div class='ctx'> 		if (acl == NULL) {</div><div class='ctx'> 			/* Solaris returns the inode's minimum ACL. */</div><div class='ctx'> 			acl = posix_acl_from_mode(inode-&gt;i_mode, GFP_KERNEL);</div><div class='hunk'>@@ -69,7 +69,7 @@ static __be32 nfsacld_proc_getacl(struct svc_rqst *rqstp)</div><div class='ctx'> 	if (resp-&gt;mask &amp; (NFS_DFACL|NFS_DFACLCNT)) {</div><div class='ctx'> 		/* Check how Solaris handles requests for the Default ACL</div><div class='ctx'> 		   of a non-directory! */</div><div class='del'>-		acl = get_acl(inode, ACL_TYPE_DEFAULT);</div><div class='add'>+		acl = get_inode_acl(inode, ACL_TYPE_DEFAULT);</div><div class='ctx'> 		if (IS_ERR(acl)) {</div><div class='ctx'> 			resp-&gt;status = nfserrno(PTR_ERR(acl));</div><div class='ctx'> 			goto fail;</div><div class='hunk'>@@ -84,6 +84,8 @@ out:</div><div class='ctx'> fail:</div><div class='ctx'> 	posix_acl_release(resp-&gt;acl_access);</div><div class='ctx'> 	posix_acl_release(resp-&gt;acl_default);</div><div class='add'>+	resp-&gt;acl_access = NULL;</div><div class='add'>+	resp-&gt;acl_default = NULL;</div><div class='ctx'> 	goto out;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -111,18 +113,18 @@ static __be32 nfsacld_proc_setacl(struct svc_rqst *rqstp)</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out_errno;</div><div class='ctx'> </div><div class='del'>-	fh_lock(fh);</div><div class='add'>+	inode_lock(inode);</div><div class='ctx'> </div><div class='del'>-	error = set_posix_acl(&amp;init_user_ns, inode, ACL_TYPE_ACCESS,</div><div class='add'>+	error = set_posix_acl(&amp;nop_mnt_idmap, fh-&gt;fh_dentry, ACL_TYPE_ACCESS,</div><div class='ctx'> 			      argp-&gt;acl_access);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out_drop_lock;</div><div class='del'>-	error = set_posix_acl(&amp;init_user_ns, inode, ACL_TYPE_DEFAULT,</div><div class='add'>+	error = set_posix_acl(&amp;nop_mnt_idmap, fh-&gt;fh_dentry, ACL_TYPE_DEFAULT,</div><div class='ctx'> 			      argp-&gt;acl_default);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out_drop_lock;</div><div class='ctx'> </div><div class='del'>-	fh_unlock(fh);</div><div class='add'>+	inode_unlock(inode);</div><div class='ctx'> </div><div class='ctx'> 	fh_drop_write(fh);</div><div class='ctx'> </div><div class='hunk'>@@ -136,7 +138,7 @@ out:</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> </div><div class='ctx'> out_drop_lock:</div><div class='del'>-	fh_unlock(fh);</div><div class='add'>+	inode_unlock(inode);</div><div class='ctx'> 	fh_drop_write(fh);</div><div class='ctx'> out_errno:</div><div class='ctx'> 	resp-&gt;status = nfserrno(error);</div><div class='hunk'>@@ -246,37 +248,27 @@ nfsaclsvc_encode_getaclres(struct svc_rqst *rqstp, struct xdr_stream *xdr)</div><div class='ctx'> 	struct nfsd3_getaclres *resp = rqstp-&gt;rq_resp;</div><div class='ctx'> 	struct dentry *dentry = resp-&gt;fh.fh_dentry;</div><div class='ctx'> 	struct inode *inode;</div><div class='del'>-	int w;</div><div class='ctx'> </div><div class='ctx'> 	if (!svcxdr_encode_stat(xdr, resp-&gt;status))</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	if (dentry == NULL || d_really_is_negative(dentry))</div><div class='del'>-		return 1;</div><div class='add'>+		return true;</div><div class='ctx'> 	inode = d_inode(dentry);</div><div class='ctx'> </div><div class='ctx'> 	if (!svcxdr_encode_fattr(rqstp, xdr, &amp;resp-&gt;fh, &amp;resp-&gt;stat))</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> 	if (xdr_stream_encode_u32(xdr, resp-&gt;mask) &lt; 0)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	rqstp-&gt;rq_res.page_len = w = nfsacl_size(</div><div class='del'>-		(resp-&gt;mask &amp; NFS_ACL)   ? resp-&gt;acl_access  : NULL,</div><div class='del'>-		(resp-&gt;mask &amp; NFS_DFACL) ? resp-&gt;acl_default : NULL);</div><div class='del'>-	while (w &gt; 0) {</div><div class='del'>-		if (!*(rqstp-&gt;rq_next_page++))</div><div class='del'>-			return 1;</div><div class='del'>-		w -= PAGE_SIZE;</div><div class='del'>-	}</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='ctx'> 	if (!nfs_stream_encode_acl(xdr, inode, resp-&gt;acl_access,</div><div class='ctx'> 				   resp-&gt;mask &amp; NFS_ACL, 0))</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> 	if (!nfs_stream_encode_acl(xdr, inode, resp-&gt;acl_default,</div><div class='ctx'> 				   resp-&gt;mask &amp; NFS_DFACL, NFS_ACL_DEFAULT))</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> </div><div class='del'>-	return 1;</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* ACCESS */</div><div class='hunk'>@@ -286,17 +278,17 @@ nfsaclsvc_encode_accessres(struct svc_rqst *rqstp, struct xdr_stream *xdr)</div><div class='ctx'> 	struct nfsd3_accessres *resp = rqstp-&gt;rq_resp;</div><div class='ctx'> </div><div class='ctx'> 	if (!svcxdr_encode_stat(xdr, resp-&gt;status))</div><div class='del'>-		return 0;</div><div class='add'>+		return false;</div><div class='ctx'> 	switch (resp-&gt;status) {</div><div class='ctx'> 	case nfs_ok:</div><div class='ctx'> 		if (!svcxdr_encode_fattr(rqstp, xdr, &amp;resp-&gt;fh, &amp;resp-&gt;stat))</div><div class='del'>-			return 0;</div><div class='add'>+			return false;</div><div class='ctx'> 		if (xdr_stream_encode_u32(xdr, resp-&gt;access) &lt; 0)</div><div class='del'>-			return 0;</div><div class='add'>+			return false;</div><div class='ctx'> 		break;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return 1;</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -318,8 +310,6 @@ static void nfsaclsvc_release_access(struct svc_rqst *rqstp)</div><div class='ctx'> 	fh_put(&amp;resp-&gt;fh);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct nfsd3_voidargs { int dummy; };</div><div class='del'>-</div><div class='ctx'> #define ST 1		/* status*/</div><div class='ctx'> #define AT 21		/* attributes */</div><div class='ctx'> #define pAT (1+AT)	/* post attributes - conditional */</div><div class='hunk'>@@ -331,6 +321,7 @@ static const struct svc_procedure nfsd_acl_procedures2[5] = {</div><div class='ctx'> 		.pc_decode = nfssvc_decode_voidarg,</div><div class='ctx'> 		.pc_encode = nfssvc_encode_voidres,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd_voidargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd_voidargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd_voidres),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_xdrressize = ST,</div><div class='hunk'>@@ -342,6 +333,7 @@ static const struct svc_procedure nfsd_acl_procedures2[5] = {</div><div class='ctx'> 		.pc_encode = nfsaclsvc_encode_getaclres,</div><div class='ctx'> 		.pc_release = nfsaclsvc_release_getacl,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd3_getaclargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd3_getaclargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd3_getaclres),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_xdrressize = ST+1+2*(1+ACL),</div><div class='hunk'>@@ -353,6 +345,7 @@ static const struct svc_procedure nfsd_acl_procedures2[5] = {</div><div class='ctx'> 		.pc_encode = nfssvc_encode_attrstatres,</div><div class='ctx'> 		.pc_release = nfssvc_release_attrstat,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd3_setaclargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd3_setaclargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd_attrstat),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_xdrressize = ST+AT,</div><div class='hunk'>@@ -364,6 +357,7 @@ static const struct svc_procedure nfsd_acl_procedures2[5] = {</div><div class='ctx'> 		.pc_encode = nfssvc_encode_attrstatres,</div><div class='ctx'> 		.pc_release = nfssvc_release_attrstat,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd_fhandle),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd_fhandle),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd_attrstat),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_xdrressize = ST+AT,</div><div class='hunk'>@@ -375,6 +369,7 @@ static const struct svc_procedure nfsd_acl_procedures2[5] = {</div><div class='ctx'> 		.pc_encode = nfsaclsvc_encode_accessres,</div><div class='ctx'> 		.pc_release = nfsaclsvc_release_access,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd3_accessargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd3_accessargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd3_accessres),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_xdrressize = ST+AT+1,</div><div class='hunk'>@@ -382,10 +377,11 @@ static const struct svc_procedure nfsd_acl_procedures2[5] = {</div><div class='ctx'> 	},</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static unsigned int nfsd_acl_count2[ARRAY_SIZE(nfsd_acl_procedures2)];</div><div class='add'>+static DEFINE_PER_CPU_ALIGNED(unsigned long,</div><div class='add'>+			      nfsd_acl_count2[ARRAY_SIZE(nfsd_acl_procedures2)]);</div><div class='ctx'> const struct svc_version nfsd_acl_version2 = {</div><div class='ctx'> 	.vs_vers	= 2,</div><div class='del'>-	.vs_nproc	= 5,</div><div class='add'>+	.vs_nproc	= ARRAY_SIZE(nfsd_acl_procedures2),</div><div class='ctx'> 	.vs_proc	= nfsd_acl_procedures2,</div><div class='ctx'> 	.vs_count	= nfsd_acl_count2,</div><div class='ctx'> 	.vs_dispatch	= nfsd_dispatch,</div><div class='head'>diff --git a/fs/nfsd/nfs3acl.c b/fs/nfsd/nfs3acl.c<br/>index 35b2ebda14da..7b5433bd3019 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfs3acl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfs3acl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfs3acl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/nfs3acl.c</a></div><div class='hunk'>@@ -47,7 +47,7 @@ static __be32 nfsd3_proc_getacl(struct svc_rqst *rqstp)</div><div class='ctx'> 	resp-&gt;mask = argp-&gt;mask;</div><div class='ctx'> </div><div class='ctx'> 	if (resp-&gt;mask &amp; (NFS_ACL|NFS_ACLCNT)) {</div><div class='del'>-		acl = get_acl(inode, ACL_TYPE_ACCESS);</div><div class='add'>+		acl = get_inode_acl(inode, ACL_TYPE_ACCESS);</div><div class='ctx'> 		if (acl == NULL) {</div><div class='ctx'> 			/* Solaris returns the inode's minimum ACL. */</div><div class='ctx'> 			acl = posix_acl_from_mode(inode-&gt;i_mode, GFP_KERNEL);</div><div class='hunk'>@@ -61,7 +61,7 @@ static __be32 nfsd3_proc_getacl(struct svc_rqst *rqstp)</div><div class='ctx'> 	if (resp-&gt;mask &amp; (NFS_DFACL|NFS_DFACLCNT)) {</div><div class='ctx'> 		/* Check how Solaris handles requests for the Default ACL</div><div class='ctx'> 		   of a non-directory! */</div><div class='del'>-		acl = get_acl(inode, ACL_TYPE_DEFAULT);</div><div class='add'>+		acl = get_inode_acl(inode, ACL_TYPE_DEFAULT);</div><div class='ctx'> 		if (IS_ERR(acl)) {</div><div class='ctx'> 			resp-&gt;status = nfserrno(PTR_ERR(acl));</div><div class='ctx'> 			goto fail;</div><div class='hunk'>@@ -76,6 +76,8 @@ out:</div><div class='ctx'> fail:</div><div class='ctx'> 	posix_acl_release(resp-&gt;acl_access);</div><div class='ctx'> 	posix_acl_release(resp-&gt;acl_default);</div><div class='add'>+	resp-&gt;acl_access = NULL;</div><div class='add'>+	resp-&gt;acl_default = NULL;</div><div class='ctx'> 	goto out;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -101,17 +103,17 @@ static __be32 nfsd3_proc_setacl(struct svc_rqst *rqstp)</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out_errno;</div><div class='ctx'> </div><div class='del'>-	fh_lock(fh);</div><div class='add'>+	inode_lock(inode);</div><div class='ctx'> </div><div class='del'>-	error = set_posix_acl(&amp;init_user_ns, inode, ACL_TYPE_ACCESS,</div><div class='add'>+	error = set_posix_acl(&amp;nop_mnt_idmap, fh-&gt;fh_dentry, ACL_TYPE_ACCESS,</div><div class='ctx'> 			      argp-&gt;acl_access);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out_drop_lock;</div><div class='del'>-	error = set_posix_acl(&amp;init_user_ns, inode, ACL_TYPE_DEFAULT,</div><div class='add'>+	error = set_posix_acl(&amp;nop_mnt_idmap, fh-&gt;fh_dentry, ACL_TYPE_DEFAULT,</div><div class='ctx'> 			      argp-&gt;acl_default);</div><div class='ctx'> </div><div class='ctx'> out_drop_lock:</div><div class='del'>-	fh_unlock(fh);</div><div class='add'>+	inode_unlock(inode);</div><div class='ctx'> 	fh_drop_write(fh);</div><div class='ctx'> out_errno:</div><div class='ctx'> 	resp-&gt;status = nfserrno(error);</div><div class='hunk'>@@ -171,11 +173,7 @@ nfs3svc_encode_getaclres(struct svc_rqst *rqstp, struct xdr_stream *xdr)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd3_getaclres *resp = rqstp-&gt;rq_resp;</div><div class='ctx'> 	struct dentry *dentry = resp-&gt;fh.fh_dentry;</div><div class='del'>-	struct kvec *head = rqstp-&gt;rq_res.head;</div><div class='ctx'> 	struct inode *inode;</div><div class='del'>-	unsigned int base;</div><div class='del'>-	int n;</div><div class='del'>-	int w;</div><div class='ctx'> </div><div class='ctx'> 	if (!svcxdr_encode_nfsstat3(xdr, resp-&gt;status))</div><div class='ctx'> 		return false;</div><div class='hunk'>@@ -187,26 +185,12 @@ nfs3svc_encode_getaclres(struct svc_rqst *rqstp, struct xdr_stream *xdr)</div><div class='ctx'> 		if (xdr_stream_encode_u32(xdr, resp-&gt;mask) &lt; 0)</div><div class='ctx'> 			return false;</div><div class='ctx'> </div><div class='del'>-		base = (char *)xdr-&gt;p - (char *)head-&gt;iov_base;</div><div class='del'>-</div><div class='del'>-		rqstp-&gt;rq_res.page_len = w = nfsacl_size(</div><div class='del'>-			(resp-&gt;mask &amp; NFS_ACL)   ? resp-&gt;acl_access  : NULL,</div><div class='del'>-			(resp-&gt;mask &amp; NFS_DFACL) ? resp-&gt;acl_default : NULL);</div><div class='del'>-		while (w &gt; 0) {</div><div class='del'>-			if (!*(rqstp-&gt;rq_next_page++))</div><div class='del'>-				return false;</div><div class='del'>-			w -= PAGE_SIZE;</div><div class='del'>-		}</div><div class='del'>-</div><div class='del'>-		n = nfsacl_encode(&amp;rqstp-&gt;rq_res, base, inode,</div><div class='del'>-				  resp-&gt;acl_access,</div><div class='del'>-				  resp-&gt;mask &amp; NFS_ACL, 0);</div><div class='del'>-		if (n &gt; 0)</div><div class='del'>-			n = nfsacl_encode(&amp;rqstp-&gt;rq_res, base + n, inode,</div><div class='del'>-					  resp-&gt;acl_default,</div><div class='del'>-					  resp-&gt;mask &amp; NFS_DFACL,</div><div class='del'>-					  NFS_ACL_DEFAULT);</div><div class='del'>-		if (n &lt;= 0)</div><div class='add'>+		if (!nfs_stream_encode_acl(xdr, inode, resp-&gt;acl_access,</div><div class='add'>+					   resp-&gt;mask &amp; NFS_ACL, 0))</div><div class='add'>+			return false;</div><div class='add'>+		if (!nfs_stream_encode_acl(xdr, inode, resp-&gt;acl_default,</div><div class='add'>+					   resp-&gt;mask &amp; NFS_DFACL,</div><div class='add'>+					   NFS_ACL_DEFAULT))</div><div class='ctx'> 			return false;</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='hunk'>@@ -239,8 +223,6 @@ static void nfs3svc_release_getacl(struct svc_rqst *rqstp)</div><div class='ctx'> 	posix_acl_release(resp-&gt;acl_default);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct nfsd3_voidargs { int dummy; };</div><div class='del'>-</div><div class='ctx'> #define ST 1		/* status*/</div><div class='ctx'> #define AT 21		/* attributes */</div><div class='ctx'> #define pAT (1+AT)	/* post attributes - conditional */</div><div class='hunk'>@@ -252,6 +234,7 @@ static const struct svc_procedure nfsd_acl_procedures3[3] = {</div><div class='ctx'> 		.pc_decode = nfssvc_decode_voidarg,</div><div class='ctx'> 		.pc_encode = nfssvc_encode_voidres,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd_voidargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd_voidargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd_voidres),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_xdrressize = ST,</div><div class='hunk'>@@ -263,6 +246,7 @@ static const struct svc_procedure nfsd_acl_procedures3[3] = {</div><div class='ctx'> 		.pc_encode = nfs3svc_encode_getaclres,</div><div class='ctx'> 		.pc_release = nfs3svc_release_getacl,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd3_getaclargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd3_getaclargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd3_getaclres),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_xdrressize = ST+1+2*(1+ACL),</div><div class='hunk'>@@ -274,6 +258,7 @@ static const struct svc_procedure nfsd_acl_procedures3[3] = {</div><div class='ctx'> 		.pc_encode = nfs3svc_encode_setaclres,</div><div class='ctx'> 		.pc_release = nfs3svc_release_fhandle,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd3_setaclargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd3_setaclargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd3_attrstat),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_xdrressize = ST+pAT,</div><div class='hunk'>@@ -281,10 +266,11 @@ static const struct svc_procedure nfsd_acl_procedures3[3] = {</div><div class='ctx'> 	},</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static unsigned int nfsd_acl_count3[ARRAY_SIZE(nfsd_acl_procedures3)];</div><div class='add'>+static DEFINE_PER_CPU_ALIGNED(unsigned long,</div><div class='add'>+			      nfsd_acl_count3[ARRAY_SIZE(nfsd_acl_procedures3)]);</div><div class='ctx'> const struct svc_version nfsd_acl_version3 = {</div><div class='ctx'> 	.vs_vers	= 3,</div><div class='del'>-	.vs_nproc	= 3,</div><div class='add'>+	.vs_nproc	= ARRAY_SIZE(nfsd_acl_procedures3),</div><div class='ctx'> 	.vs_proc	= nfsd_acl_procedures3,</div><div class='ctx'> 	.vs_count	= nfsd_acl_count3,</div><div class='ctx'> 	.vs_dispatch	= nfsd_dispatch,</div><div class='head'>diff --git a/fs/nfsd/nfs3proc.c b/fs/nfsd/nfs3proc.c<br/>index 4418517f6f12..42adc5461db0 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfs3proc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfs3proc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfs3proc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/nfs3proc.c</a></div><div class='hunk'>@@ -8,10 +8,13 @@</div><div class='ctx'> #include &lt;linux/fs.h&gt;</div><div class='ctx'> #include &lt;linux/ext2_fs.h&gt;</div><div class='ctx'> #include &lt;linux/magic.h&gt;</div><div class='add'>+#include &lt;linux/namei.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "cache.h"</div><div class='ctx'> #include "xdr3.h"</div><div class='ctx'> #include "vfs.h"</div><div class='add'>+#include "filecache.h"</div><div class='add'>+#include "trace.h"</div><div class='ctx'> </div><div class='ctx'> #define NFSDDBG_FACILITY		NFSDDBG_PROC</div><div class='ctx'> </div><div class='hunk'>@@ -26,6 +29,29 @@ static int	nfs3_ftypes[] = {</div><div class='ctx'> 	S_IFIFO,		/* NF3FIFO */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+static __be32 nfsd3_map_status(__be32 status)</div><div class='add'>+{</div><div class='add'>+	switch (status) {</div><div class='add'>+	case nfs_ok:</div><div class='add'>+		break;</div><div class='add'>+	case nfserr_nofilehandle:</div><div class='add'>+		status = nfserr_badhandle;</div><div class='add'>+		break;</div><div class='add'>+	case nfserr_wrongsec:</div><div class='add'>+	case nfserr_file_open:</div><div class='add'>+		status = nfserr_acces;</div><div class='add'>+		break;</div><div class='add'>+	case nfserr_symlink_not_dir:</div><div class='add'>+		status = nfserr_notdir;</div><div class='add'>+		break;</div><div class='add'>+	case nfserr_symlink:</div><div class='add'>+	case nfserr_wrong_type:</div><div class='add'>+		status = nfserr_inval;</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+	return status;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * NULL call.</div><div class='ctx'>  */</div><div class='hunk'>@@ -44,8 +70,7 @@ nfsd3_proc_getattr(struct svc_rqst *rqstp)</div><div class='ctx'> 	struct nfsd_fhandle *argp = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nfsd3_attrstat *resp = rqstp-&gt;rq_resp;</div><div class='ctx'> </div><div class='del'>-	dprintk("nfsd: GETATTR(3)  %s\n",</div><div class='del'>-		SVCFH_fmt(&amp;argp-&gt;fh));</div><div class='add'>+	trace_nfsd_vfs_getattr(rqstp, &amp;argp-&gt;fh);</div><div class='ctx'> </div><div class='ctx'> 	fh_copy(&amp;resp-&gt;fh, &amp;argp-&gt;fh);</div><div class='ctx'> 	resp-&gt;status = fh_verify(rqstp, &amp;resp-&gt;fh, 0,</div><div class='hunk'>@@ -55,6 +80,7 @@ nfsd3_proc_getattr(struct svc_rqst *rqstp)</div><div class='ctx'> </div><div class='ctx'> 	resp-&gt;status = fh_getattr(&amp;resp-&gt;fh, &amp;resp-&gt;stat);</div><div class='ctx'> out:</div><div class='add'>+	resp-&gt;status = nfsd3_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -66,13 +92,19 @@ nfsd3_proc_setattr(struct svc_rqst *rqstp)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd3_sattrargs *argp = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nfsd3_attrstat *resp = rqstp-&gt;rq_resp;</div><div class='add'>+	struct nfsd_attrs attrs = {</div><div class='add'>+		.na_iattr	= &amp;argp-&gt;attrs,</div><div class='add'>+	};</div><div class='add'>+	const struct timespec64 *guardtime = NULL;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("nfsd: SETATTR(3)  %s\n",</div><div class='ctx'> 				SVCFH_fmt(&amp;argp-&gt;fh));</div><div class='ctx'> </div><div class='ctx'> 	fh_copy(&amp;resp-&gt;fh, &amp;argp-&gt;fh);</div><div class='del'>-	resp-&gt;status = nfsd_setattr(rqstp, &amp;resp-&gt;fh, &amp;argp-&gt;attrs,</div><div class='del'>-				    argp-&gt;check_guard, argp-&gt;guardtime);</div><div class='add'>+	if (argp-&gt;check_guard)</div><div class='add'>+		guardtime = &amp;argp-&gt;guardtime;</div><div class='add'>+	resp-&gt;status = nfsd_setattr(rqstp, &amp;resp-&gt;fh, &amp;attrs, guardtime);</div><div class='add'>+	resp-&gt;status = nfsd3_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -96,6 +128,7 @@ nfsd3_proc_lookup(struct svc_rqst *rqstp)</div><div class='ctx'> 	resp-&gt;status = nfsd_lookup(rqstp, &amp;resp-&gt;dirfh,</div><div class='ctx'> 				   argp-&gt;name, argp-&gt;len,</div><div class='ctx'> 				   &amp;resp-&gt;fh);</div><div class='add'>+	resp-&gt;status = nfsd3_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -115,6 +148,7 @@ nfsd3_proc_access(struct svc_rqst *rqstp)</div><div class='ctx'> 	fh_copy(&amp;resp-&gt;fh, &amp;argp-&gt;fh);</div><div class='ctx'> 	resp-&gt;access = argp-&gt;access;</div><div class='ctx'> 	resp-&gt;status = nfsd_access(rqstp, &amp;resp-&gt;fh, &amp;resp-&gt;access, NULL);</div><div class='add'>+	resp-&gt;status = nfsd3_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -135,6 +169,7 @@ nfsd3_proc_readlink(struct svc_rqst *rqstp)</div><div class='ctx'> 	resp-&gt;pages = rqstp-&gt;rq_next_page++;</div><div class='ctx'> 	resp-&gt;status = nfsd_readlink(rqstp, &amp;resp-&gt;fh,</div><div class='ctx'> 				     page_address(*resp-&gt;pages), &amp;resp-&gt;len);</div><div class='add'>+	resp-&gt;status = nfsd3_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -146,39 +181,33 @@ nfsd3_proc_read(struct svc_rqst *rqstp)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd3_readargs *argp = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nfsd3_readres *resp = rqstp-&gt;rq_resp;</div><div class='del'>-	u32 max_blocksize = svc_max_payload(rqstp);</div><div class='del'>-	unsigned int len;</div><div class='del'>-	int v;</div><div class='del'>-</div><div class='del'>-	argp-&gt;count = min_t(u32, argp-&gt;count, max_blocksize);</div><div class='ctx'> </div><div class='ctx'> 	dprintk("nfsd: READ(3) %s %lu bytes at %Lu\n",</div><div class='ctx'> 				SVCFH_fmt(&amp;argp-&gt;fh),</div><div class='ctx'> 				(unsigned long) argp-&gt;count,</div><div class='ctx'> 				(unsigned long long) argp-&gt;offset);</div><div class='ctx'> </div><div class='del'>-	v = 0;</div><div class='del'>-	len = argp-&gt;count;</div><div class='del'>-	resp-&gt;pages = rqstp-&gt;rq_next_page;</div><div class='del'>-	while (len &gt; 0) {</div><div class='del'>-		struct page *page = *(rqstp-&gt;rq_next_page++);</div><div class='add'>+	argp-&gt;count = min_t(u32, argp-&gt;count, svc_max_payload(rqstp));</div><div class='add'>+	argp-&gt;count = min_t(u32, argp-&gt;count, rqstp-&gt;rq_res.buflen);</div><div class='add'>+	if (argp-&gt;offset &gt; (u64)OFFSET_MAX)</div><div class='add'>+		argp-&gt;offset = (u64)OFFSET_MAX;</div><div class='add'>+	if (argp-&gt;offset + argp-&gt;count &gt; (u64)OFFSET_MAX)</div><div class='add'>+		argp-&gt;count = (u64)OFFSET_MAX - argp-&gt;offset;</div><div class='ctx'> </div><div class='del'>-		rqstp-&gt;rq_vec[v].iov_base = page_address(page);</div><div class='del'>-		rqstp-&gt;rq_vec[v].iov_len = min_t(unsigned int, len, PAGE_SIZE);</div><div class='del'>-		len -= rqstp-&gt;rq_vec[v].iov_len;</div><div class='del'>-		v++;</div><div class='del'>-	}</div><div class='add'>+	resp-&gt;pages = rqstp-&gt;rq_next_page;</div><div class='ctx'> </div><div class='ctx'> 	/* Obtain buffer pointer for payload.</div><div class='ctx'> 	 * 1 (status) + 22 (post_op_attr) + 1 (count) + 1 (eof)</div><div class='ctx'> 	 * + 1 (xdr opaque byte count) = 26</div><div class='ctx'> 	 */</div><div class='ctx'> 	resp-&gt;count = argp-&gt;count;</div><div class='del'>-	svc_reserve_auth(rqstp, ((1 + NFS3_POST_OP_ATTR_WORDS + 3)&lt;&lt;2) + resp-&gt;count +4);</div><div class='add'>+	svc_reserve_auth(rqstp, ((1 + NFS3_POST_OP_ATTR_WORDS + 3) &lt;&lt; 2) +</div><div class='add'>+			 resp-&gt;count + 4);</div><div class='ctx'> </div><div class='ctx'> 	fh_copy(&amp;resp-&gt;fh, &amp;argp-&gt;fh);</div><div class='ctx'> 	resp-&gt;status = nfsd_read(rqstp, &amp;resp-&gt;fh, argp-&gt;offset,</div><div class='del'>-				 rqstp-&gt;rq_vec, v, &amp;resp-&gt;count, &amp;resp-&gt;eof);</div><div class='add'>+				 &amp;resp-&gt;count, &amp;resp-&gt;eof);</div><div class='add'>+	resp-&gt;status = nfsd3_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -191,64 +220,168 @@ nfsd3_proc_write(struct svc_rqst *rqstp)</div><div class='ctx'> 	struct nfsd3_writeargs *argp = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nfsd3_writeres *resp = rqstp-&gt;rq_resp;</div><div class='ctx'> 	unsigned long cnt = argp-&gt;len;</div><div class='del'>-	unsigned int nvecs;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("nfsd: WRITE(3)    %s %d bytes at %Lu%s\n",</div><div class='ctx'> 				SVCFH_fmt(&amp;argp-&gt;fh),</div><div class='ctx'> 				argp-&gt;len,</div><div class='ctx'> 				(unsigned long long) argp-&gt;offset,</div><div class='del'>-				argp-&gt;stable? " stable" : "");</div><div class='add'>+				argp-&gt;stable ? " stable" : "");</div><div class='add'>+</div><div class='add'>+	resp-&gt;status = nfserr_fbig;</div><div class='add'>+	if (argp-&gt;offset &gt; (u64)OFFSET_MAX ||</div><div class='add'>+	    argp-&gt;offset + argp-&gt;len &gt; (u64)OFFSET_MAX)</div><div class='add'>+		return rpc_success;</div><div class='ctx'> </div><div class='ctx'> 	fh_copy(&amp;resp-&gt;fh, &amp;argp-&gt;fh);</div><div class='ctx'> 	resp-&gt;committed = argp-&gt;stable;</div><div class='del'>-	nvecs = svc_fill_write_vector(rqstp, &amp;argp-&gt;payload);</div><div class='del'>-	if (!nvecs) {</div><div class='del'>-		resp-&gt;status = nfserr_io;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='ctx'> 	resp-&gt;status = nfsd_write(rqstp, &amp;resp-&gt;fh, argp-&gt;offset,</div><div class='del'>-				  rqstp-&gt;rq_vec, nvecs, &amp;cnt,</div><div class='add'>+				  &amp;argp-&gt;payload, &amp;cnt,</div><div class='ctx'> 				  resp-&gt;committed, resp-&gt;verf);</div><div class='ctx'> 	resp-&gt;count = cnt;</div><div class='del'>-out:</div><div class='add'>+	resp-&gt;status = nfsd3_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * With NFSv3, CREATE processing is a lot easier than with NFSv2.</div><div class='del'>- * At least in theory; we'll see how it fares in practice when the</div><div class='del'>- * first reports about SunOS compatibility problems start to pour in...</div><div class='add'>+ * Implement NFSv3's unchecked, guarded, and exclusive CREATE</div><div class='add'>+ * semantics for regular files. Except for the created file,</div><div class='add'>+ * this operation is stateless on the server.</div><div class='add'>+ *</div><div class='add'>+ * Upon return, caller must release @fhp and @resfhp.</div><div class='ctx'>  */</div><div class='ctx'> static __be32</div><div class='add'>+nfsd3_create_file(struct svc_rqst *rqstp, struct svc_fh *fhp,</div><div class='add'>+		  struct svc_fh *resfhp, struct nfsd3_createargs *argp)</div><div class='add'>+{</div><div class='add'>+	struct iattr *iap = &amp;argp-&gt;attrs;</div><div class='add'>+	struct dentry *parent, *child;</div><div class='add'>+	struct nfsd_attrs attrs = {</div><div class='add'>+		.na_iattr	= iap,</div><div class='add'>+	};</div><div class='add'>+	__u32 v_mtime, v_atime;</div><div class='add'>+	struct inode *inode;</div><div class='add'>+	__be32 status;</div><div class='add'>+	int host_err;</div><div class='add'>+</div><div class='add'>+	trace_nfsd_vfs_create(rqstp, fhp, S_IFREG, argp-&gt;name, argp-&gt;len);</div><div class='add'>+</div><div class='add'>+	if (isdotent(argp-&gt;name, argp-&gt;len))</div><div class='add'>+		return nfserr_exist;</div><div class='add'>+	if (!(iap-&gt;ia_valid &amp; ATTR_MODE))</div><div class='add'>+		iap-&gt;ia_mode = 0;</div><div class='add'>+</div><div class='add'>+	status = fh_verify(rqstp, fhp, S_IFDIR, NFSD_MAY_EXEC);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+</div><div class='add'>+	parent = fhp-&gt;fh_dentry;</div><div class='add'>+	inode = d_inode(parent);</div><div class='add'>+</div><div class='add'>+	host_err = fh_want_write(fhp);</div><div class='add'>+	if (host_err)</div><div class='add'>+		return nfserrno(host_err);</div><div class='add'>+</div><div class='add'>+	child = start_creating(&amp;nop_mnt_idmap, parent,</div><div class='add'>+			       &amp;QSTR_LEN(argp-&gt;name, argp-&gt;len));</div><div class='add'>+	if (IS_ERR(child)) {</div><div class='add'>+		status = nfserrno(PTR_ERR(child));</div><div class='add'>+		goto out_write;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (d_really_is_negative(child)) {</div><div class='add'>+		status = fh_verify(rqstp, fhp, S_IFDIR, NFSD_MAY_CREATE);</div><div class='add'>+		if (status != nfs_ok)</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	status = fh_compose(resfhp, fhp-&gt;fh_export, child, fhp);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	v_mtime = 0;</div><div class='add'>+	v_atime = 0;</div><div class='add'>+	if (argp-&gt;createmode == NFS3_CREATE_EXCLUSIVE) {</div><div class='add'>+		u32 *verifier = (u32 *)argp-&gt;verf;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Solaris 7 gets confused (bugid 4218508) if these have</div><div class='add'>+		 * the high bit set, as do xfs filesystems without the</div><div class='add'>+		 * "bigtime" feature. So just clear the high bits.</div><div class='add'>+		 */</div><div class='add'>+		v_mtime = verifier[0] &amp; 0x7fffffff;</div><div class='add'>+		v_atime = verifier[1] &amp; 0x7fffffff;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (d_really_is_positive(child)) {</div><div class='add'>+		status = nfs_ok;</div><div class='add'>+</div><div class='add'>+		switch (argp-&gt;createmode) {</div><div class='add'>+		case NFS3_CREATE_UNCHECKED:</div><div class='add'>+			if (!d_is_reg(child))</div><div class='add'>+				break;</div><div class='add'>+			iap-&gt;ia_valid &amp;= ATTR_SIZE;</div><div class='add'>+			goto set_attr;</div><div class='add'>+		case NFS3_CREATE_GUARDED:</div><div class='add'>+			status = nfserr_exist;</div><div class='add'>+			break;</div><div class='add'>+		case NFS3_CREATE_EXCLUSIVE:</div><div class='add'>+			if (inode_get_mtime_sec(d_inode(child)) == v_mtime &amp;&amp;</div><div class='add'>+			    inode_get_atime_sec(d_inode(child)) == v_atime &amp;&amp;</div><div class='add'>+			    d_inode(child)-&gt;i_size == 0) {</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+			status = nfserr_exist;</div><div class='add'>+		}</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!IS_POSIXACL(inode))</div><div class='add'>+		iap-&gt;ia_mode &amp;= ~current_umask();</div><div class='add'>+</div><div class='add'>+	status = fh_fill_pre_attrs(fhp);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		goto out;</div><div class='add'>+	host_err = vfs_create(&amp;nop_mnt_idmap, child, iap-&gt;ia_mode, NULL);</div><div class='add'>+	if (host_err &lt; 0) {</div><div class='add'>+		status = nfserrno(host_err);</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	fh_fill_post_attrs(fhp);</div><div class='add'>+</div><div class='add'>+	/* A newly created file already has a file size of zero. */</div><div class='add'>+	if ((iap-&gt;ia_valid &amp; ATTR_SIZE) &amp;&amp; (iap-&gt;ia_size == 0))</div><div class='add'>+		iap-&gt;ia_valid &amp;= ~ATTR_SIZE;</div><div class='add'>+	if (argp-&gt;createmode == NFS3_CREATE_EXCLUSIVE) {</div><div class='add'>+		iap-&gt;ia_valid = ATTR_MTIME | ATTR_ATIME |</div><div class='add'>+				ATTR_MTIME_SET | ATTR_ATIME_SET;</div><div class='add'>+		iap-&gt;ia_mtime.tv_sec = v_mtime;</div><div class='add'>+		iap-&gt;ia_atime.tv_sec = v_atime;</div><div class='add'>+		iap-&gt;ia_mtime.tv_nsec = 0;</div><div class='add'>+		iap-&gt;ia_atime.tv_nsec = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+set_attr:</div><div class='add'>+	status = nfsd_create_setattr(rqstp, fhp, resfhp, &amp;attrs);</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	end_creating(child);</div><div class='add'>+out_write:</div><div class='add'>+	fh_drop_write(fhp);</div><div class='add'>+	return status;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32</div><div class='ctx'> nfsd3_proc_create(struct svc_rqst *rqstp)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd3_createargs *argp = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nfsd3_diropres *resp = rqstp-&gt;rq_resp;</div><div class='del'>-	svc_fh		*dirfhp, *newfhp = NULL;</div><div class='del'>-	struct iattr	*attr;</div><div class='del'>-</div><div class='del'>-	dprintk("nfsd: CREATE(3)   %s %.*s\n",</div><div class='del'>-				SVCFH_fmt(&amp;argp-&gt;fh),</div><div class='del'>-				argp-&gt;len,</div><div class='del'>-				argp-&gt;name);</div><div class='add'>+	svc_fh *dirfhp, *newfhp;</div><div class='ctx'> </div><div class='ctx'> 	dirfhp = fh_copy(&amp;resp-&gt;dirfh, &amp;argp-&gt;fh);</div><div class='ctx'> 	newfhp = fh_init(&amp;resp-&gt;fh, NFS3_FHSIZE);</div><div class='del'>-	attr   = &amp;argp-&gt;attrs;</div><div class='del'>-</div><div class='del'>-	/* Unfudge the mode bits */</div><div class='del'>-	attr-&gt;ia_mode &amp;= ~S_IFMT;</div><div class='del'>-	if (!(attr-&gt;ia_valid &amp; ATTR_MODE)) { </div><div class='del'>-		attr-&gt;ia_valid |= ATTR_MODE;</div><div class='del'>-		attr-&gt;ia_mode = S_IFREG;</div><div class='del'>-	} else {</div><div class='del'>-		attr-&gt;ia_mode = (attr-&gt;ia_mode &amp; ~S_IFMT) | S_IFREG;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	/* Now create the file and set attributes */</div><div class='del'>-	resp-&gt;status = do_nfsd_create(rqstp, dirfhp, argp-&gt;name, argp-&gt;len,</div><div class='del'>-				      attr, newfhp, argp-&gt;createmode,</div><div class='del'>-				      (u32 *)argp-&gt;verf, NULL, NULL);</div><div class='add'>+	resp-&gt;status = nfsd3_create_file(rqstp, dirfhp, newfhp, argp);</div><div class='add'>+	resp-&gt;status = nfsd3_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -260,18 +393,16 @@ nfsd3_proc_mkdir(struct svc_rqst *rqstp)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd3_createargs *argp = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nfsd3_diropres *resp = rqstp-&gt;rq_resp;</div><div class='del'>-</div><div class='del'>-	dprintk("nfsd: MKDIR(3)    %s %.*s\n",</div><div class='del'>-				SVCFH_fmt(&amp;argp-&gt;fh),</div><div class='del'>-				argp-&gt;len,</div><div class='del'>-				argp-&gt;name);</div><div class='add'>+	struct nfsd_attrs attrs = {</div><div class='add'>+		.na_iattr	= &amp;argp-&gt;attrs,</div><div class='add'>+	};</div><div class='ctx'> </div><div class='ctx'> 	argp-&gt;attrs.ia_valid &amp;= ~ATTR_SIZE;</div><div class='ctx'> 	fh_copy(&amp;resp-&gt;dirfh, &amp;argp-&gt;fh);</div><div class='ctx'> 	fh_init(&amp;resp-&gt;fh, NFS3_FHSIZE);</div><div class='ctx'> 	resp-&gt;status = nfsd_create(rqstp, &amp;resp-&gt;dirfh, argp-&gt;name, argp-&gt;len,</div><div class='del'>-				   &amp;argp-&gt;attrs, S_IFDIR, 0, &amp;resp-&gt;fh);</div><div class='del'>-	fh_unlock(&amp;resp-&gt;dirfh);</div><div class='add'>+				   &amp;attrs, S_IFDIR, 0, &amp;resp-&gt;fh);</div><div class='add'>+	resp-&gt;status = nfsd3_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -280,6 +411,9 @@ nfsd3_proc_symlink(struct svc_rqst *rqstp)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd3_symlinkargs *argp = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nfsd3_diropres *resp = rqstp-&gt;rq_resp;</div><div class='add'>+	struct nfsd_attrs attrs = {</div><div class='add'>+		.na_iattr	= &amp;argp-&gt;attrs,</div><div class='add'>+	};</div><div class='ctx'> </div><div class='ctx'> 	if (argp-&gt;tlen == 0) {</div><div class='ctx'> 		resp-&gt;status = nfserr_inval;</div><div class='hunk'>@@ -298,17 +432,13 @@ nfsd3_proc_symlink(struct svc_rqst *rqstp)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dprintk("nfsd: SYMLINK(3)  %s %.*s -&gt; %.*s\n",</div><div class='del'>-				SVCFH_fmt(&amp;argp-&gt;ffh),</div><div class='del'>-				argp-&gt;flen, argp-&gt;fname,</div><div class='del'>-				argp-&gt;tlen, argp-&gt;tname);</div><div class='del'>-</div><div class='ctx'> 	fh_copy(&amp;resp-&gt;dirfh, &amp;argp-&gt;ffh);</div><div class='ctx'> 	fh_init(&amp;resp-&gt;fh, NFS3_FHSIZE);</div><div class='ctx'> 	resp-&gt;status = nfsd_symlink(rqstp, &amp;resp-&gt;dirfh, argp-&gt;fname,</div><div class='del'>-				    argp-&gt;flen, argp-&gt;tname, &amp;resp-&gt;fh);</div><div class='add'>+				    argp-&gt;flen, argp-&gt;tname, &amp;attrs, &amp;resp-&gt;fh);</div><div class='ctx'> 	kfree(argp-&gt;tname);</div><div class='ctx'> out:</div><div class='add'>+	resp-&gt;status = nfsd3_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -320,14 +450,12 @@ nfsd3_proc_mknod(struct svc_rqst *rqstp)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd3_mknodargs *argp = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nfsd3_diropres  *resp = rqstp-&gt;rq_resp;</div><div class='add'>+	struct nfsd_attrs attrs = {</div><div class='add'>+		.na_iattr	= &amp;argp-&gt;attrs,</div><div class='add'>+	};</div><div class='ctx'> 	int type;</div><div class='ctx'> 	dev_t	rdev = 0;</div><div class='ctx'> </div><div class='del'>-	dprintk("nfsd: MKNOD(3)    %s %.*s\n",</div><div class='del'>-				SVCFH_fmt(&amp;argp-&gt;fh),</div><div class='del'>-				argp-&gt;len,</div><div class='del'>-				argp-&gt;name);</div><div class='del'>-</div><div class='ctx'> 	fh_copy(&amp;resp-&gt;dirfh, &amp;argp-&gt;fh);</div><div class='ctx'> 	fh_init(&amp;resp-&gt;fh, NFS3_FHSIZE);</div><div class='ctx'> </div><div class='hunk'>@@ -345,9 +473,9 @@ nfsd3_proc_mknod(struct svc_rqst *rqstp)</div><div class='ctx'> </div><div class='ctx'> 	type = nfs3_ftypes[argp-&gt;ftype];</div><div class='ctx'> 	resp-&gt;status = nfsd_create(rqstp, &amp;resp-&gt;dirfh, argp-&gt;name, argp-&gt;len,</div><div class='del'>-				   &amp;argp-&gt;attrs, type, rdev, &amp;resp-&gt;fh);</div><div class='del'>-	fh_unlock(&amp;resp-&gt;dirfh);</div><div class='add'>+				   &amp;attrs, type, rdev, &amp;resp-&gt;fh);</div><div class='ctx'> out:</div><div class='add'>+	resp-&gt;status = nfsd3_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -360,16 +488,11 @@ nfsd3_proc_remove(struct svc_rqst *rqstp)</div><div class='ctx'> 	struct nfsd3_diropargs *argp = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nfsd3_attrstat *resp = rqstp-&gt;rq_resp;</div><div class='ctx'> </div><div class='del'>-	dprintk("nfsd: REMOVE(3)   %s %.*s\n",</div><div class='del'>-				SVCFH_fmt(&amp;argp-&gt;fh),</div><div class='del'>-				argp-&gt;len,</div><div class='del'>-				argp-&gt;name);</div><div class='del'>-</div><div class='ctx'> 	/* Unlink. -S_IFDIR means file must not be a directory */</div><div class='ctx'> 	fh_copy(&amp;resp-&gt;fh, &amp;argp-&gt;fh);</div><div class='ctx'> 	resp-&gt;status = nfsd_unlink(rqstp, &amp;resp-&gt;fh, -S_IFDIR,</div><div class='ctx'> 				   argp-&gt;name, argp-&gt;len);</div><div class='del'>-	fh_unlock(&amp;resp-&gt;fh);</div><div class='add'>+	resp-&gt;status = nfsd3_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -382,15 +505,10 @@ nfsd3_proc_rmdir(struct svc_rqst *rqstp)</div><div class='ctx'> 	struct nfsd3_diropargs *argp = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nfsd3_attrstat *resp = rqstp-&gt;rq_resp;</div><div class='ctx'> </div><div class='del'>-	dprintk("nfsd: RMDIR(3)    %s %.*s\n",</div><div class='del'>-				SVCFH_fmt(&amp;argp-&gt;fh),</div><div class='del'>-				argp-&gt;len,</div><div class='del'>-				argp-&gt;name);</div><div class='del'>-</div><div class='ctx'> 	fh_copy(&amp;resp-&gt;fh, &amp;argp-&gt;fh);</div><div class='ctx'> 	resp-&gt;status = nfsd_unlink(rqstp, &amp;resp-&gt;fh, S_IFDIR,</div><div class='ctx'> 				   argp-&gt;name, argp-&gt;len);</div><div class='del'>-	fh_unlock(&amp;resp-&gt;fh);</div><div class='add'>+	resp-&gt;status = nfsd3_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -400,19 +518,11 @@ nfsd3_proc_rename(struct svc_rqst *rqstp)</div><div class='ctx'> 	struct nfsd3_renameargs *argp = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nfsd3_renameres *resp = rqstp-&gt;rq_resp;</div><div class='ctx'> </div><div class='del'>-	dprintk("nfsd: RENAME(3)   %s %.*s -&gt;\n",</div><div class='del'>-				SVCFH_fmt(&amp;argp-&gt;ffh),</div><div class='del'>-				argp-&gt;flen,</div><div class='del'>-				argp-&gt;fname);</div><div class='del'>-	dprintk("nfsd: -&gt; %s %.*s\n",</div><div class='del'>-				SVCFH_fmt(&amp;argp-&gt;tfh),</div><div class='del'>-				argp-&gt;tlen,</div><div class='del'>-				argp-&gt;tname);</div><div class='del'>-</div><div class='ctx'> 	fh_copy(&amp;resp-&gt;ffh, &amp;argp-&gt;ffh);</div><div class='ctx'> 	fh_copy(&amp;resp-&gt;tfh, &amp;argp-&gt;tfh);</div><div class='ctx'> 	resp-&gt;status = nfsd_rename(rqstp, &amp;resp-&gt;ffh, argp-&gt;fname, argp-&gt;flen,</div><div class='ctx'> 				   &amp;resp-&gt;tfh, argp-&gt;tname, argp-&gt;tlen);</div><div class='add'>+	resp-&gt;status = nfsd3_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -422,48 +532,32 @@ nfsd3_proc_link(struct svc_rqst *rqstp)</div><div class='ctx'> 	struct nfsd3_linkargs *argp = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nfsd3_linkres  *resp = rqstp-&gt;rq_resp;</div><div class='ctx'> </div><div class='del'>-	dprintk("nfsd: LINK(3)     %s -&gt;\n",</div><div class='del'>-				SVCFH_fmt(&amp;argp-&gt;ffh));</div><div class='del'>-	dprintk("nfsd:   -&gt; %s %.*s\n",</div><div class='del'>-				SVCFH_fmt(&amp;argp-&gt;tfh),</div><div class='del'>-				argp-&gt;tlen,</div><div class='del'>-				argp-&gt;tname);</div><div class='del'>-</div><div class='ctx'> 	fh_copy(&amp;resp-&gt;fh,  &amp;argp-&gt;ffh);</div><div class='ctx'> 	fh_copy(&amp;resp-&gt;tfh, &amp;argp-&gt;tfh);</div><div class='ctx'> 	resp-&gt;status = nfsd_link(rqstp, &amp;resp-&gt;tfh, argp-&gt;tname, argp-&gt;tlen,</div><div class='ctx'> 				 &amp;resp-&gt;fh);</div><div class='add'>+	resp-&gt;status = nfsd3_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void nfsd3_init_dirlist_pages(struct svc_rqst *rqstp,</div><div class='ctx'> 				     struct nfsd3_readdirres *resp,</div><div class='del'>-				     int count)</div><div class='add'>+				     u32 count)</div><div class='ctx'> {</div><div class='ctx'> 	struct xdr_buf *buf = &amp;resp-&gt;dirlist;</div><div class='ctx'> 	struct xdr_stream *xdr = &amp;resp-&gt;xdr;</div><div class='del'>-</div><div class='del'>-	count = min_t(u32, count, svc_max_payload(rqstp));</div><div class='add'>+	unsigned int sendbuf = min_t(unsigned int, rqstp-&gt;rq_res.buflen,</div><div class='add'>+				     svc_max_payload(rqstp));</div><div class='ctx'> </div><div class='ctx'> 	memset(buf, 0, sizeof(*buf));</div><div class='ctx'> </div><div class='ctx'> 	/* Reserve room for the NULL ptr &amp; eof flag (-2 words) */</div><div class='del'>-	buf-&gt;buflen = count - XDR_UNIT * 2;</div><div class='add'>+	buf-&gt;buflen = clamp(count, (u32)(XDR_UNIT * 2), sendbuf);</div><div class='add'>+	buf-&gt;buflen -= XDR_UNIT * 2;</div><div class='ctx'> 	buf-&gt;pages = rqstp-&gt;rq_next_page;</div><div class='del'>-	while (count &gt; 0) {</div><div class='del'>-		rqstp-&gt;rq_next_page++;</div><div class='del'>-		count -= PAGE_SIZE;</div><div class='del'>-	}</div><div class='add'>+	rqstp-&gt;rq_next_page += (buf-&gt;buflen + PAGE_SIZE - 1) &gt;&gt; PAGE_SHIFT;</div><div class='ctx'> </div><div class='del'>-	/* This is xdr_init_encode(), but it assumes that</div><div class='del'>-	 * the head kvec has already been consumed. */</div><div class='del'>-	xdr_set_scratch_buffer(xdr, NULL, 0);</div><div class='del'>-	xdr-&gt;buf = buf;</div><div class='del'>-	xdr-&gt;page_ptr = buf-&gt;pages;</div><div class='del'>-	xdr-&gt;iov = NULL;</div><div class='del'>-	xdr-&gt;p = page_address(*buf-&gt;pages);</div><div class='del'>-	xdr-&gt;end = xdr-&gt;p + (PAGE_SIZE &gt;&gt; 2);</div><div class='del'>-	xdr-&gt;rqst = NULL;</div><div class='add'>+	xdr_init_encode_pages(xdr, buf);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -476,9 +570,7 @@ nfsd3_proc_readdir(struct svc_rqst *rqstp)</div><div class='ctx'> 	struct nfsd3_readdirres  *resp = rqstp-&gt;rq_resp;</div><div class='ctx'> 	loff_t		offset;</div><div class='ctx'> </div><div class='del'>-	dprintk("nfsd: READDIR(3)  %s %d bytes at %d\n",</div><div class='del'>-				SVCFH_fmt(&amp;argp-&gt;fh),</div><div class='del'>-				argp-&gt;count, (u32) argp-&gt;cookie);</div><div class='add'>+	trace_nfsd_vfs_readdir(rqstp, &amp;argp-&gt;fh, argp-&gt;count, argp-&gt;cookie);</div><div class='ctx'> </div><div class='ctx'> 	nfsd3_init_dirlist_pages(rqstp, resp, argp-&gt;count);</div><div class='ctx'> </div><div class='hunk'>@@ -495,6 +587,7 @@ nfsd3_proc_readdir(struct svc_rqst *rqstp)</div><div class='ctx'> 	/* Recycle only pages that were part of the reply */</div><div class='ctx'> 	rqstp-&gt;rq_next_page = resp-&gt;xdr.page_ptr + 1;</div><div class='ctx'> </div><div class='add'>+	resp-&gt;status = nfsd3_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -509,9 +602,7 @@ nfsd3_proc_readdirplus(struct svc_rqst *rqstp)</div><div class='ctx'> 	struct nfsd3_readdirres  *resp = rqstp-&gt;rq_resp;</div><div class='ctx'> 	loff_t	offset;</div><div class='ctx'> </div><div class='del'>-	dprintk("nfsd: READDIR+(3) %s %d bytes at %d\n",</div><div class='del'>-				SVCFH_fmt(&amp;argp-&gt;fh),</div><div class='del'>-				argp-&gt;count, (u32) argp-&gt;cookie);</div><div class='add'>+	trace_nfsd_vfs_readdir(rqstp, &amp;argp-&gt;fh, argp-&gt;count, argp-&gt;cookie);</div><div class='ctx'> </div><div class='ctx'> 	nfsd3_init_dirlist_pages(rqstp, resp, argp-&gt;count);</div><div class='ctx'> </div><div class='hunk'>@@ -539,6 +630,7 @@ nfsd3_proc_readdirplus(struct svc_rqst *rqstp)</div><div class='ctx'> 	rqstp-&gt;rq_next_page = resp-&gt;xdr.page_ptr + 1;</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='add'>+	resp-&gt;status = nfsd3_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -551,11 +643,9 @@ nfsd3_proc_fsstat(struct svc_rqst *rqstp)</div><div class='ctx'> 	struct nfsd_fhandle *argp = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nfsd3_fsstatres *resp = rqstp-&gt;rq_resp;</div><div class='ctx'> </div><div class='del'>-	dprintk("nfsd: FSSTAT(3)   %s\n",</div><div class='del'>-				SVCFH_fmt(&amp;argp-&gt;fh));</div><div class='del'>-</div><div class='ctx'> 	resp-&gt;status = nfsd_statfs(rqstp, &amp;argp-&gt;fh, &amp;resp-&gt;stats, 0);</div><div class='ctx'> 	fh_put(&amp;argp-&gt;fh);</div><div class='add'>+	resp-&gt;status = nfsd3_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -599,6 +689,7 @@ nfsd3_proc_fsinfo(struct svc_rqst *rqstp)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	fh_put(&amp;argp-&gt;fh);</div><div class='add'>+	resp-&gt;status = nfsd3_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -641,6 +732,7 @@ nfsd3_proc_pathconf(struct svc_rqst *rqstp)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	fh_put(&amp;argp-&gt;fh);</div><div class='add'>+	resp-&gt;status = nfsd3_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -652,21 +744,23 @@ nfsd3_proc_commit(struct svc_rqst *rqstp)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd3_commitargs *argp = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nfsd3_commitres *resp = rqstp-&gt;rq_resp;</div><div class='add'>+	struct nfsd_file *nf;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("nfsd: COMMIT(3)   %s %u@%Lu\n",</div><div class='ctx'> 				SVCFH_fmt(&amp;argp-&gt;fh),</div><div class='ctx'> 				argp-&gt;count,</div><div class='ctx'> 				(unsigned long long) argp-&gt;offset);</div><div class='ctx'> </div><div class='del'>-	if (argp-&gt;offset &gt; NFS_OFFSET_MAX) {</div><div class='del'>-		resp-&gt;status = nfserr_inval;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='ctx'> 	fh_copy(&amp;resp-&gt;fh, &amp;argp-&gt;fh);</div><div class='del'>-	resp-&gt;status = nfsd_commit(rqstp, &amp;resp-&gt;fh, argp-&gt;offset,</div><div class='add'>+	resp-&gt;status = nfsd_file_acquire_gc(rqstp, &amp;resp-&gt;fh, NFSD_MAY_WRITE |</div><div class='add'>+					    NFSD_MAY_NOT_BREAK_LEASE, &amp;nf);</div><div class='add'>+	if (resp-&gt;status)</div><div class='add'>+		goto out;</div><div class='add'>+	resp-&gt;status = nfsd_commit(rqstp, &amp;resp-&gt;fh, nf, argp-&gt;offset,</div><div class='ctx'> 				   argp-&gt;count, resp-&gt;verf);</div><div class='add'>+	nfsd_file_put(nf);</div><div class='ctx'> out:</div><div class='add'>+	resp-&gt;status = nfsd3_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -696,6 +790,7 @@ static const struct svc_procedure nfsd_procedures3[22] = {</div><div class='ctx'> 		.pc_decode = nfssvc_decode_voidarg,</div><div class='ctx'> 		.pc_encode = nfssvc_encode_voidres,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd_voidargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd_voidargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd_voidres),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_xdrressize = ST,</div><div class='hunk'>@@ -707,6 +802,7 @@ static const struct svc_procedure nfsd_procedures3[22] = {</div><div class='ctx'> 		.pc_encode = nfs3svc_encode_getattrres,</div><div class='ctx'> 		.pc_release = nfs3svc_release_fhandle,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd_fhandle),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd_fhandle),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd3_attrstatres),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_xdrressize = ST+AT,</div><div class='hunk'>@@ -718,6 +814,7 @@ static const struct svc_procedure nfsd_procedures3[22] = {</div><div class='ctx'> 		.pc_encode = nfs3svc_encode_wccstatres,</div><div class='ctx'> 		.pc_release = nfs3svc_release_fhandle,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd3_sattrargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd3_sattrargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd3_wccstatres),</div><div class='ctx'> 		.pc_cachetype = RC_REPLBUFF,</div><div class='ctx'> 		.pc_xdrressize = ST+WC,</div><div class='hunk'>@@ -729,6 +826,7 @@ static const struct svc_procedure nfsd_procedures3[22] = {</div><div class='ctx'> 		.pc_encode = nfs3svc_encode_lookupres,</div><div class='ctx'> 		.pc_release = nfs3svc_release_fhandle2,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd3_diropargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd3_diropargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd3_diropres),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_xdrressize = ST+FH+pAT+pAT,</div><div class='hunk'>@@ -740,6 +838,7 @@ static const struct svc_procedure nfsd_procedures3[22] = {</div><div class='ctx'> 		.pc_encode = nfs3svc_encode_accessres,</div><div class='ctx'> 		.pc_release = nfs3svc_release_fhandle,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd3_accessargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd3_accessargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd3_accessres),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_xdrressize = ST+pAT+1,</div><div class='hunk'>@@ -751,6 +850,7 @@ static const struct svc_procedure nfsd_procedures3[22] = {</div><div class='ctx'> 		.pc_encode = nfs3svc_encode_readlinkres,</div><div class='ctx'> 		.pc_release = nfs3svc_release_fhandle,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd_fhandle),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd_fhandle),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd3_readlinkres),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_xdrressize = ST+pAT+1+NFS3_MAXPATHLEN/4,</div><div class='hunk'>@@ -762,6 +862,7 @@ static const struct svc_procedure nfsd_procedures3[22] = {</div><div class='ctx'> 		.pc_encode = nfs3svc_encode_readres,</div><div class='ctx'> 		.pc_release = nfs3svc_release_fhandle,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd3_readargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd3_readargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd3_readres),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_xdrressize = ST+pAT+4+NFSSVC_MAXBLKSIZE/4,</div><div class='hunk'>@@ -773,6 +874,7 @@ static const struct svc_procedure nfsd_procedures3[22] = {</div><div class='ctx'> 		.pc_encode = nfs3svc_encode_writeres,</div><div class='ctx'> 		.pc_release = nfs3svc_release_fhandle,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd3_writeargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd3_writeargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd3_writeres),</div><div class='ctx'> 		.pc_cachetype = RC_REPLBUFF,</div><div class='ctx'> 		.pc_xdrressize = ST+WC+4,</div><div class='hunk'>@@ -784,6 +886,7 @@ static const struct svc_procedure nfsd_procedures3[22] = {</div><div class='ctx'> 		.pc_encode = nfs3svc_encode_createres,</div><div class='ctx'> 		.pc_release = nfs3svc_release_fhandle2,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd3_createargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd3_createargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd3_createres),</div><div class='ctx'> 		.pc_cachetype = RC_REPLBUFF,</div><div class='ctx'> 		.pc_xdrressize = ST+(1+FH+pAT)+WC,</div><div class='hunk'>@@ -795,6 +898,7 @@ static const struct svc_procedure nfsd_procedures3[22] = {</div><div class='ctx'> 		.pc_encode = nfs3svc_encode_createres,</div><div class='ctx'> 		.pc_release = nfs3svc_release_fhandle2,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd3_mkdirargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd3_mkdirargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd3_createres),</div><div class='ctx'> 		.pc_cachetype = RC_REPLBUFF,</div><div class='ctx'> 		.pc_xdrressize = ST+(1+FH+pAT)+WC,</div><div class='hunk'>@@ -806,6 +910,7 @@ static const struct svc_procedure nfsd_procedures3[22] = {</div><div class='ctx'> 		.pc_encode = nfs3svc_encode_createres,</div><div class='ctx'> 		.pc_release = nfs3svc_release_fhandle2,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd3_symlinkargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd3_symlinkargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd3_createres),</div><div class='ctx'> 		.pc_cachetype = RC_REPLBUFF,</div><div class='ctx'> 		.pc_xdrressize = ST+(1+FH+pAT)+WC,</div><div class='hunk'>@@ -817,6 +922,7 @@ static const struct svc_procedure nfsd_procedures3[22] = {</div><div class='ctx'> 		.pc_encode = nfs3svc_encode_createres,</div><div class='ctx'> 		.pc_release = nfs3svc_release_fhandle2,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd3_mknodargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd3_mknodargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd3_createres),</div><div class='ctx'> 		.pc_cachetype = RC_REPLBUFF,</div><div class='ctx'> 		.pc_xdrressize = ST+(1+FH+pAT)+WC,</div><div class='hunk'>@@ -828,6 +934,7 @@ static const struct svc_procedure nfsd_procedures3[22] = {</div><div class='ctx'> 		.pc_encode = nfs3svc_encode_wccstatres,</div><div class='ctx'> 		.pc_release = nfs3svc_release_fhandle,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd3_diropargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd3_diropargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd3_wccstatres),</div><div class='ctx'> 		.pc_cachetype = RC_REPLBUFF,</div><div class='ctx'> 		.pc_xdrressize = ST+WC,</div><div class='hunk'>@@ -839,6 +946,7 @@ static const struct svc_procedure nfsd_procedures3[22] = {</div><div class='ctx'> 		.pc_encode = nfs3svc_encode_wccstatres,</div><div class='ctx'> 		.pc_release = nfs3svc_release_fhandle,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd3_diropargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd3_diropargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd3_wccstatres),</div><div class='ctx'> 		.pc_cachetype = RC_REPLBUFF,</div><div class='ctx'> 		.pc_xdrressize = ST+WC,</div><div class='hunk'>@@ -850,6 +958,7 @@ static const struct svc_procedure nfsd_procedures3[22] = {</div><div class='ctx'> 		.pc_encode = nfs3svc_encode_renameres,</div><div class='ctx'> 		.pc_release = nfs3svc_release_fhandle2,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd3_renameargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd3_renameargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd3_renameres),</div><div class='ctx'> 		.pc_cachetype = RC_REPLBUFF,</div><div class='ctx'> 		.pc_xdrressize = ST+WC+WC,</div><div class='hunk'>@@ -861,6 +970,7 @@ static const struct svc_procedure nfsd_procedures3[22] = {</div><div class='ctx'> 		.pc_encode = nfs3svc_encode_linkres,</div><div class='ctx'> 		.pc_release = nfs3svc_release_fhandle2,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd3_linkargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd3_linkargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd3_linkres),</div><div class='ctx'> 		.pc_cachetype = RC_REPLBUFF,</div><div class='ctx'> 		.pc_xdrressize = ST+pAT+WC,</div><div class='hunk'>@@ -872,6 +982,7 @@ static const struct svc_procedure nfsd_procedures3[22] = {</div><div class='ctx'> 		.pc_encode = nfs3svc_encode_readdirres,</div><div class='ctx'> 		.pc_release = nfs3svc_release_fhandle,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd3_readdirargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd3_readdirargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd3_readdirres),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_name = "READDIR",</div><div class='hunk'>@@ -882,6 +993,7 @@ static const struct svc_procedure nfsd_procedures3[22] = {</div><div class='ctx'> 		.pc_encode = nfs3svc_encode_readdirres,</div><div class='ctx'> 		.pc_release = nfs3svc_release_fhandle,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd3_readdirplusargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd3_readdirplusargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd3_readdirres),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_name = "READDIRPLUS",</div><div class='hunk'>@@ -891,6 +1003,7 @@ static const struct svc_procedure nfsd_procedures3[22] = {</div><div class='ctx'> 		.pc_decode = nfs3svc_decode_fhandleargs,</div><div class='ctx'> 		.pc_encode = nfs3svc_encode_fsstatres,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd3_fhandleargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd3_fhandleargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd3_fsstatres),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_xdrressize = ST+pAT+2*6+1,</div><div class='hunk'>@@ -901,6 +1014,7 @@ static const struct svc_procedure nfsd_procedures3[22] = {</div><div class='ctx'> 		.pc_decode = nfs3svc_decode_fhandleargs,</div><div class='ctx'> 		.pc_encode = nfs3svc_encode_fsinfores,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd3_fhandleargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd3_fhandleargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd3_fsinfores),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_xdrressize = ST+pAT+12,</div><div class='hunk'>@@ -911,6 +1025,7 @@ static const struct svc_procedure nfsd_procedures3[22] = {</div><div class='ctx'> 		.pc_decode = nfs3svc_decode_fhandleargs,</div><div class='ctx'> 		.pc_encode = nfs3svc_encode_pathconfres,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd3_fhandleargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd3_fhandleargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd3_pathconfres),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_xdrressize = ST+pAT+6,</div><div class='hunk'>@@ -922,6 +1037,7 @@ static const struct svc_procedure nfsd_procedures3[22] = {</div><div class='ctx'> 		.pc_encode = nfs3svc_encode_commitres,</div><div class='ctx'> 		.pc_release = nfs3svc_release_fhandle,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd3_commitargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd3_commitargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd3_commitres),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_xdrressize = ST+WC+2,</div><div class='hunk'>@@ -929,10 +1045,11 @@ static const struct svc_procedure nfsd_procedures3[22] = {</div><div class='ctx'> 	},</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static unsigned int nfsd_count3[ARRAY_SIZE(nfsd_procedures3)];</div><div class='add'>+static DEFINE_PER_CPU_ALIGNED(unsigned long,</div><div class='add'>+			      nfsd_count3[ARRAY_SIZE(nfsd_procedures3)]);</div><div class='ctx'> const struct svc_version nfsd_version3 = {</div><div class='ctx'> 	.vs_vers	= 3,</div><div class='del'>-	.vs_nproc	= 22,</div><div class='add'>+	.vs_nproc	= ARRAY_SIZE(nfsd_procedures3),</div><div class='ctx'> 	.vs_proc	= nfsd_procedures3,</div><div class='ctx'> 	.vs_dispatch	= nfsd_dispatch,</div><div class='ctx'> 	.vs_count	= nfsd_count3,</div><div class='head'>diff --git a/fs/nfsd/nfs3xdr.c b/fs/nfsd/nfs3xdr.c<br/>index c3ac1b6aa3aa..ef4971d71ac4 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfs3xdr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfs3xdr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfs3xdr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/nfs3xdr.c</a></div><div class='hunk'>@@ -254,7 +254,7 @@ svcxdr_decode_sattr3(struct svc_rqst *rqstp, struct xdr_stream *xdr,</div><div class='ctx'> 		if (xdr_stream_decode_u64(xdr, &amp;newsize) &lt; 0)</div><div class='ctx'> 			return false;</div><div class='ctx'> 		iap-&gt;ia_valid |= ATTR_SIZE;</div><div class='del'>-		iap-&gt;ia_size = min_t(u64, newsize, NFS_OFFSET_MAX);</div><div class='add'>+		iap-&gt;ia_size = newsize;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (xdr_stream_decode_u32(xdr, &amp;set_it) &lt; 0)</div><div class='ctx'> 		return false;</div><div class='hunk'>@@ -295,17 +295,14 @@ svcxdr_decode_sattr3(struct svc_rqst *rqstp, struct xdr_stream *xdr,</div><div class='ctx'> static bool</div><div class='ctx'> svcxdr_decode_sattrguard3(struct xdr_stream *xdr, struct nfsd3_sattrargs *args)</div><div class='ctx'> {</div><div class='del'>-	__be32 *p;</div><div class='ctx'> 	u32 check;</div><div class='ctx'> </div><div class='ctx'> 	if (xdr_stream_decode_bool(xdr, &amp;check) &lt; 0)</div><div class='ctx'> 		return false;</div><div class='ctx'> 	if (check) {</div><div class='del'>-		p = xdr_inline_decode(xdr, XDR_UNIT * 2);</div><div class='del'>-		if (!p)</div><div class='add'>+		if (!svcxdr_decode_nfstime3(xdr, &amp;args-&gt;guardtime))</div><div class='ctx'> 			return false;</div><div class='ctx'> 		args-&gt;check_guard = 1;</div><div class='del'>-		args-&gt;guardtime = be32_to_cpup(p);</div><div class='ctx'> 	} else</div><div class='ctx'> 		args-&gt;check_guard = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -487,71 +484,6 @@ neither:</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool fs_supports_change_attribute(struct super_block *sb)</div><div class='del'>-{</div><div class='del'>-	return sb-&gt;s_flags &amp; SB_I_VERSION || sb-&gt;s_export_op-&gt;fetch_iversion;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Fill in the pre_op attr for the wcc data</div><div class='del'>- */</div><div class='del'>-void fill_pre_wcc(struct svc_fh *fhp)</div><div class='del'>-{</div><div class='del'>-	struct inode    *inode;</div><div class='del'>-	struct kstat	stat;</div><div class='del'>-	bool v4 = (fhp-&gt;fh_maxsize == NFS4_FHSIZE);</div><div class='del'>-</div><div class='del'>-	if (fhp-&gt;fh_no_wcc || fhp-&gt;fh_pre_saved)</div><div class='del'>-		return;</div><div class='del'>-	inode = d_inode(fhp-&gt;fh_dentry);</div><div class='del'>-	if (fs_supports_change_attribute(inode-&gt;i_sb) || !v4) {</div><div class='del'>-		__be32 err = fh_getattr(fhp, &amp;stat);</div><div class='del'>-</div><div class='del'>-		if (err) {</div><div class='del'>-			/* Grab the times from inode anyway */</div><div class='del'>-			stat.mtime = inode-&gt;i_mtime;</div><div class='del'>-			stat.ctime = inode-&gt;i_ctime;</div><div class='del'>-			stat.size  = inode-&gt;i_size;</div><div class='del'>-		}</div><div class='del'>-		fhp-&gt;fh_pre_mtime = stat.mtime;</div><div class='del'>-		fhp-&gt;fh_pre_ctime = stat.ctime;</div><div class='del'>-		fhp-&gt;fh_pre_size  = stat.size;</div><div class='del'>-	}</div><div class='del'>-	if (v4)</div><div class='del'>-		fhp-&gt;fh_pre_change = nfsd4_change_attribute(&amp;stat, inode);</div><div class='del'>-</div><div class='del'>-	fhp-&gt;fh_pre_saved = true;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Fill in the post_op attr for the wcc data</div><div class='del'>- */</div><div class='del'>-void fill_post_wcc(struct svc_fh *fhp)</div><div class='del'>-{</div><div class='del'>-	bool v4 = (fhp-&gt;fh_maxsize == NFS4_FHSIZE);</div><div class='del'>-	struct inode *inode = d_inode(fhp-&gt;fh_dentry);</div><div class='del'>-</div><div class='del'>-	if (fhp-&gt;fh_no_wcc)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='del'>-	if (fhp-&gt;fh_post_saved)</div><div class='del'>-		printk("nfsd: inode locked twice during operation.\n");</div><div class='del'>-</div><div class='del'>-	fhp-&gt;fh_post_saved = true;</div><div class='del'>-</div><div class='del'>-	if (fs_supports_change_attribute(inode-&gt;i_sb) || !v4) {</div><div class='del'>-		__be32 err = fh_getattr(fhp, &amp;fhp-&gt;fh_post_attr);</div><div class='del'>-</div><div class='del'>-		if (err) {</div><div class='del'>-			fhp-&gt;fh_post_saved = false;</div><div class='del'>-			fhp-&gt;fh_post_attr.ctime = inode-&gt;i_ctime;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	if (v4)</div><div class='del'>-		fhp-&gt;fh_post_change =</div><div class='del'>-			nfsd4_change_attribute(&amp;fhp-&gt;fh_post_attr, inode);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * XDR decode functions</div><div class='ctx'>  */</div><div class='hunk'>@@ -636,10 +568,8 @@ nfs3svc_decode_writeargs(struct svc_rqst *rqstp, struct xdr_stream *xdr)</div><div class='ctx'> 		args-&gt;count = max_blocksize;</div><div class='ctx'> 		args-&gt;len = max_blocksize;</div><div class='ctx'> 	}</div><div class='del'>-	if (!xdr_stream_subsegment(xdr, &amp;args-&gt;payload, args-&gt;count))</div><div class='del'>-		return false;</div><div class='ctx'> </div><div class='del'>-	return true;</div><div class='add'>+	return xdr_stream_subsegment(xdr, &amp;args-&gt;payload, args-&gt;count);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> bool</div><div class='hunk'>@@ -681,8 +611,6 @@ nfs3svc_decode_symlinkargs(struct svc_rqst *rqstp, struct xdr_stream *xdr)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd3_symlinkargs *args = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct kvec *head = rqstp-&gt;rq_arg.head;</div><div class='del'>-	struct kvec *tail = rqstp-&gt;rq_arg.tail;</div><div class='del'>-	size_t remaining;</div><div class='ctx'> </div><div class='ctx'> 	if (!svcxdr_decode_diropargs3(xdr, &amp;args-&gt;ffh, &amp;args-&gt;fname, &amp;args-&gt;flen))</div><div class='ctx'> 		return false;</div><div class='hunk'>@@ -691,16 +619,10 @@ nfs3svc_decode_symlinkargs(struct svc_rqst *rqstp, struct xdr_stream *xdr)</div><div class='ctx'> 	if (xdr_stream_decode_u32(xdr, &amp;args-&gt;tlen) &lt; 0)</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	/* request sanity */</div><div class='del'>-	remaining = head-&gt;iov_len + rqstp-&gt;rq_arg.page_len + tail-&gt;iov_len;</div><div class='del'>-	remaining -= xdr_stream_pos(xdr);</div><div class='del'>-	if (remaining &lt; xdr_align_size(args-&gt;tlen))</div><div class='del'>-		return false;</div><div class='del'>-</div><div class='del'>-	args-&gt;first.iov_base = xdr-&gt;p;</div><div class='add'>+	/* symlink_data */</div><div class='ctx'> 	args-&gt;first.iov_len = head-&gt;iov_len - xdr_stream_pos(xdr);</div><div class='del'>-</div><div class='del'>-	return true;</div><div class='add'>+	args-&gt;first.iov_base = xdr_inline_decode(xdr, args-&gt;tlen);</div><div class='add'>+	return args-&gt;first.iov_base != NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> bool</div><div class='hunk'>@@ -903,7 +825,8 @@ nfs3svc_encode_readlinkres(struct svc_rqst *rqstp, struct xdr_stream *xdr)</div><div class='ctx'> 			return false;</div><div class='ctx'> 		if (xdr_stream_encode_u32(xdr, resp-&gt;len) &lt; 0)</div><div class='ctx'> 			return false;</div><div class='del'>-		xdr_write_pages(xdr, resp-&gt;pages, 0, resp-&gt;len);</div><div class='add'>+		svcxdr_encode_opaque_pages(rqstp, xdr, resp-&gt;pages, 0,</div><div class='add'>+					   resp-&gt;len);</div><div class='ctx'> 		if (svc_encode_result_payload(rqstp, head-&gt;iov_len, resp-&gt;len) &lt; 0)</div><div class='ctx'> 			return false;</div><div class='ctx'> 		break;</div><div class='hunk'>@@ -934,8 +857,9 @@ nfs3svc_encode_readres(struct svc_rqst *rqstp, struct xdr_stream *xdr)</div><div class='ctx'> 			return false;</div><div class='ctx'> 		if (xdr_stream_encode_u32(xdr, resp-&gt;count) &lt; 0)</div><div class='ctx'> 			return false;</div><div class='del'>-		xdr_write_pages(xdr, resp-&gt;pages, rqstp-&gt;rq_res.page_base,</div><div class='del'>-				resp-&gt;count);</div><div class='add'>+		svcxdr_encode_opaque_pages(rqstp, xdr, resp-&gt;pages,</div><div class='add'>+					   rqstp-&gt;rq_res.page_base,</div><div class='add'>+					   resp-&gt;count);</div><div class='ctx'> 		if (svc_encode_result_payload(rqstp, head-&gt;iov_len, resp-&gt;count) &lt; 0)</div><div class='ctx'> 			return false;</div><div class='ctx'> 		break;</div><div class='hunk'>@@ -1036,7 +960,8 @@ nfs3svc_encode_readdirres(struct svc_rqst *rqstp, struct xdr_stream *xdr)</div><div class='ctx'> 			return false;</div><div class='ctx'> 		if (!svcxdr_encode_cookieverf3(xdr, resp-&gt;verf))</div><div class='ctx'> 			return false;</div><div class='del'>-		xdr_write_pages(xdr, dirlist-&gt;pages, 0, dirlist-&gt;len);</div><div class='add'>+		svcxdr_encode_opaque_pages(rqstp, xdr, dirlist-&gt;pages, 0,</div><div class='add'>+					   dirlist-&gt;len);</div><div class='ctx'> 		/* no more entries */</div><div class='ctx'> 		if (xdr_stream_encode_item_absent(xdr) &lt; 0)</div><div class='ctx'> 			return false;</div><div class='hunk'>@@ -1076,7 +1001,9 @@ compose_entry_fh(struct nfsd3_readdirres *cd, struct svc_fh *fhp,</div><div class='ctx'> 		} else</div><div class='ctx'> 			dchild = dget(dparent);</div><div class='ctx'> 	} else</div><div class='del'>-		dchild = lookup_positive_unlocked(name, dparent, namlen);</div><div class='add'>+		dchild = lookup_one_positive_unlocked(&amp;nop_mnt_idmap,</div><div class='add'>+						      &amp;QSTR_LEN(name, namlen),</div><div class='add'>+						      dparent);</div><div class='ctx'> 	if (IS_ERR(dchild))</div><div class='ctx'> 		return rv;</div><div class='ctx'> 	if (d_mountpoint(dchild))</div><div class='hunk'>@@ -1125,7 +1052,7 @@ svcxdr_encode_entry3_common(struct nfsd3_readdirres *resp, const char *name,</div><div class='ctx'> 		return false;</div><div class='ctx'> 	/* cookie */</div><div class='ctx'> 	resp-&gt;cookie_offset = dirlist-&gt;len;</div><div class='del'>-	if (xdr_stream_encode_u64(xdr, NFS_OFFSET_MAX) &lt; 0)</div><div class='add'>+	if (xdr_stream_encode_u64(xdr, OFFSET_MAX) &lt; 0)</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='ctx'> 	return true;</div><div class='head'>diff --git a/fs/nfsd/nfs4acl.c b/fs/nfsd/nfs4acl.c<br/>index eaa3a0cf38f1..936ea1ad9586 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfs4acl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfs4acl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfs4acl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/nfs4acl.c</a></div><div class='hunk'>@@ -135,7 +135,7 @@ nfsd4_get_nfs4_acl(struct svc_rqst *rqstp, struct dentry *dentry,</div><div class='ctx'> 	unsigned int flags = 0;</div><div class='ctx'> 	int size = 0;</div><div class='ctx'> </div><div class='del'>-	pacl = get_acl(inode, ACL_TYPE_ACCESS);</div><div class='add'>+	pacl = get_inode_acl(inode, ACL_TYPE_ACCESS);</div><div class='ctx'> 	if (!pacl)</div><div class='ctx'> 		pacl = posix_acl_from_mode(inode-&gt;i_mode, GFP_KERNEL);</div><div class='ctx'> </div><div class='hunk'>@@ -147,7 +147,7 @@ nfsd4_get_nfs4_acl(struct svc_rqst *rqstp, struct dentry *dentry,</div><div class='ctx'> </div><div class='ctx'> 	if (S_ISDIR(inode-&gt;i_mode)) {</div><div class='ctx'> 		flags = NFS4_ACL_DIR;</div><div class='del'>-		dpacl = get_acl(inode, ACL_TYPE_DEFAULT);</div><div class='add'>+		dpacl = get_inode_acl(inode, ACL_TYPE_DEFAULT);</div><div class='ctx'> 		if (IS_ERR(dpacl)) {</div><div class='ctx'> 			error = PTR_ERR(dpacl);</div><div class='ctx'> 			goto rel_pacl;</div><div class='hunk'>@@ -198,8 +198,6 @@ summarize_posix_acl(struct posix_acl *acl, struct posix_acl_summary *pas)</div><div class='ctx'> 	memset(pas, 0, sizeof(*pas));</div><div class='ctx'> 	pas-&gt;mask = 07;</div><div class='ctx'> </div><div class='del'>-	pe = acl-&gt;a_entries + acl-&gt;a_count;</div><div class='del'>-</div><div class='ctx'> 	FOREACH_ACL_ENTRY(pa, acl, pe) {</div><div class='ctx'> 		switch (pa-&gt;e_tag) {</div><div class='ctx'> 			case ACL_USER_OBJ:</div><div class='hunk'>@@ -441,7 +439,7 @@ struct posix_ace_state_array {</div><div class='ctx'>  * calculated so far: */</div><div class='ctx'> </div><div class='ctx'> struct posix_acl_state {</div><div class='del'>-	int empty;</div><div class='add'>+	unsigned char valid;</div><div class='ctx'> 	struct posix_ace_state owner;</div><div class='ctx'> 	struct posix_ace_state group;</div><div class='ctx'> 	struct posix_ace_state other;</div><div class='hunk'>@@ -457,7 +455,6 @@ init_state(struct posix_acl_state *state, int cnt)</div><div class='ctx'> 	int alloc;</div><div class='ctx'> </div><div class='ctx'> 	memset(state, 0, sizeof(struct posix_acl_state));</div><div class='del'>-	state-&gt;empty = 1;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * In the worst case, each individual acl could be for a distinct</div><div class='ctx'> 	 * named user or group, but we don't know which, so we allocate</div><div class='hunk'>@@ -500,7 +497,7 @@ posix_state_to_acl(struct posix_acl_state *state, unsigned int flags)</div><div class='ctx'> 	 * and effective cases: when there are no inheritable ACEs,</div><div class='ctx'> 	 * calls -&gt;set_acl with a NULL ACL structure.</div><div class='ctx'> 	 */</div><div class='del'>-	if (state-&gt;empty &amp;&amp; (flags &amp; NFS4_ACL_TYPE_DEFAULT))</div><div class='add'>+	if (!state-&gt;valid &amp;&amp; (flags &amp; NFS4_ACL_TYPE_DEFAULT))</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='hunk'>@@ -622,11 +619,12 @@ static void process_one_v4_ace(struct posix_acl_state *state,</div><div class='ctx'> 				struct nfs4_ace *ace)</div><div class='ctx'> {</div><div class='ctx'> 	u32 mask = ace-&gt;access_mask;</div><div class='add'>+	short type = ace2type(ace);</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	state-&gt;empty = 0;</div><div class='add'>+	state-&gt;valid |= type;</div><div class='ctx'> </div><div class='del'>-	switch (ace2type(ace)) {</div><div class='add'>+	switch (type) {</div><div class='ctx'> 	case ACL_USER_OBJ:</div><div class='ctx'> 		if (ace-&gt;type == NFS4_ACE_ACCESS_ALLOWED_ACE_TYPE) {</div><div class='ctx'> 			allow_bits(&amp;state-&gt;owner, mask);</div><div class='hunk'>@@ -726,6 +724,30 @@ static int nfs4_acl_nfsv4_to_posix(struct nfs4_acl *acl,</div><div class='ctx'> 		if (!(ace-&gt;flag &amp; NFS4_ACE_INHERIT_ONLY_ACE))</div><div class='ctx'> 			process_one_v4_ace(&amp;effective_acl_state, ace);</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * At this point, the default ACL may have zeroed-out entries for owner,</div><div class='add'>+	 * group and other. That usually results in a non-sensical resulting ACL</div><div class='add'>+	 * that denies all access except to any ACE that was explicitly added.</div><div class='add'>+	 *</div><div class='add'>+	 * The setfacl command solves a similar problem with this logic:</div><div class='add'>+	 *</div><div class='add'>+	 * "If  a  Default  ACL  entry is created, and the Default ACL contains</div><div class='add'>+	 *  no owner, owning group, or others entry,  a  copy of  the  ACL</div><div class='add'>+	 *  owner, owning group, or others entry is added to the Default ACL."</div><div class='add'>+	 *</div><div class='add'>+	 * Copy any missing ACEs from the effective set, if any ACEs were</div><div class='add'>+	 * explicitly set.</div><div class='add'>+	 */</div><div class='add'>+	if (default_acl_state.valid) {</div><div class='add'>+		if (!(default_acl_state.valid &amp; ACL_USER_OBJ))</div><div class='add'>+			default_acl_state.owner = effective_acl_state.owner;</div><div class='add'>+		if (!(default_acl_state.valid &amp; ACL_GROUP_OBJ))</div><div class='add'>+			default_acl_state.group = effective_acl_state.group;</div><div class='add'>+		if (!(default_acl_state.valid &amp; ACL_OTHER))</div><div class='add'>+			default_acl_state.other = effective_acl_state.other;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	*pacl = posix_state_to_acl(&amp;effective_acl_state, flags);</div><div class='ctx'> 	if (IS_ERR(*pacl)) {</div><div class='ctx'> 		ret = PTR_ERR(*pacl);</div><div class='hunk'>@@ -751,58 +773,26 @@ out_estate:</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-__be32</div><div class='del'>-nfsd4_set_nfs4_acl(struct svc_rqst *rqstp, struct svc_fh *fhp,</div><div class='del'>-		struct nfs4_acl *acl)</div><div class='add'>+__be32 nfsd4_acl_to_attr(enum nfs_ftype4 type, struct nfs4_acl *acl,</div><div class='add'>+			 struct nfsd_attrs *attr)</div><div class='ctx'> {</div><div class='del'>-	__be32 error;</div><div class='ctx'> 	int host_error;</div><div class='del'>-	struct dentry *dentry;</div><div class='del'>-	struct inode *inode;</div><div class='del'>-	struct posix_acl *pacl = NULL, *dpacl = NULL;</div><div class='ctx'> 	unsigned int flags = 0;</div><div class='ctx'> </div><div class='del'>-	/* Get inode */</div><div class='del'>-	error = fh_verify(rqstp, fhp, 0, NFSD_MAY_SATTR);</div><div class='del'>-	if (error)</div><div class='del'>-		return error;</div><div class='del'>-</div><div class='del'>-	dentry = fhp-&gt;fh_dentry;</div><div class='del'>-	inode = d_inode(dentry);</div><div class='add'>+	if (!acl)</div><div class='add'>+		return nfs_ok;</div><div class='ctx'> </div><div class='del'>-	if (S_ISDIR(inode-&gt;i_mode))</div><div class='add'>+	if (type == NF4DIR)</div><div class='ctx'> 		flags = NFS4_ACL_DIR;</div><div class='ctx'> </div><div class='del'>-	host_error = nfs4_acl_nfsv4_to_posix(acl, &amp;pacl, &amp;dpacl, flags);</div><div class='add'>+	host_error = nfs4_acl_nfsv4_to_posix(acl, &amp;attr-&gt;na_pacl,</div><div class='add'>+					     &amp;attr-&gt;na_dpacl, flags);</div><div class='ctx'> 	if (host_error == -EINVAL)</div><div class='ctx'> 		return nfserr_attrnotsupp;</div><div class='del'>-	if (host_error &lt; 0)</div><div class='del'>-		goto out_nfserr;</div><div class='del'>-</div><div class='del'>-	fh_lock(fhp);</div><div class='del'>-</div><div class='del'>-	host_error = set_posix_acl(&amp;init_user_ns, inode, ACL_TYPE_ACCESS, pacl);</div><div class='del'>-	if (host_error &lt; 0)</div><div class='del'>-		goto out_drop_lock;</div><div class='del'>-</div><div class='del'>-	if (S_ISDIR(inode-&gt;i_mode)) {</div><div class='del'>-		host_error = set_posix_acl(&amp;init_user_ns, inode,</div><div class='del'>-					   ACL_TYPE_DEFAULT, dpacl);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-out_drop_lock:</div><div class='del'>-	fh_unlock(fhp);</div><div class='del'>-</div><div class='del'>-	posix_acl_release(pacl);</div><div class='del'>-	posix_acl_release(dpacl);</div><div class='del'>-out_nfserr:</div><div class='del'>-	if (host_error == -EOPNOTSUPP)</div><div class='del'>-		return nfserr_attrnotsupp;</div><div class='ctx'> 	else</div><div class='ctx'> 		return nfserrno(host_error);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-</div><div class='ctx'> static short</div><div class='ctx'> ace2type(struct nfs4_ace *ace)</div><div class='ctx'> {</div><div class='head'>diff --git a/fs/nfsd/nfs4callback.c b/fs/nfsd/nfs4callback.c<br/>index 11f8715d92d6..e00b2aea8da2 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfs4callback.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfs4callback.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfs4callback.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/nfs4callback.c</a></div><div class='hunk'>@@ -31,6 +31,7 @@</div><div class='ctx'>  *  SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='add'>+#include &lt;linux/nfs4.h&gt;</div><div class='ctx'> #include &lt;linux/sunrpc/clnt.h&gt;</div><div class='ctx'> #include &lt;linux/sunrpc/xprt.h&gt;</div><div class='ctx'> #include &lt;linux/sunrpc/svc_xprt.h&gt;</div><div class='hunk'>@@ -41,11 +42,10 @@</div><div class='ctx'> #include "trace.h"</div><div class='ctx'> #include "xdr4cb.h"</div><div class='ctx'> #include "xdr4.h"</div><div class='add'>+#include "nfs4xdr_gen.h"</div><div class='ctx'> </div><div class='ctx'> #define NFSDDBG_FACILITY                NFSDDBG_PROC</div><div class='ctx'> </div><div class='del'>-static void nfsd4_mark_cb_fault(struct nfs4_client *, int reason);</div><div class='del'>-</div><div class='ctx'> #define NFSPROC4_CB_NULL 0</div><div class='ctx'> #define NFSPROC4_CB_COMPOUND 1</div><div class='ctx'> </div><div class='hunk'>@@ -76,30 +76,53 @@ static __be32 *xdr_encode_empty_array(__be32 *p)</div><div class='ctx'>  * 1 Protocol"</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- *	nfs_cb_opnum4</div><div class='del'>- *</div><div class='del'>- *	enum nfs_cb_opnum4 {</div><div class='del'>- *		OP_CB_GETATTR		= 3,</div><div class='del'>- *		  ...</div><div class='del'>- *	};</div><div class='del'>- */</div><div class='del'>-enum nfs_cb_opnum4 {</div><div class='del'>-	OP_CB_GETATTR			= 3,</div><div class='del'>-	OP_CB_RECALL			= 4,</div><div class='del'>-	OP_CB_LAYOUTRECALL		= 5,</div><div class='del'>-	OP_CB_NOTIFY			= 6,</div><div class='del'>-	OP_CB_PUSH_DELEG		= 7,</div><div class='del'>-	OP_CB_RECALL_ANY		= 8,</div><div class='del'>-	OP_CB_RECALLABLE_OBJ_AVAIL	= 9,</div><div class='del'>-	OP_CB_RECALL_SLOT		= 10,</div><div class='del'>-	OP_CB_SEQUENCE			= 11,</div><div class='del'>-	OP_CB_WANTS_CANCELLED		= 12,</div><div class='del'>-	OP_CB_NOTIFY_LOCK		= 13,</div><div class='del'>-	OP_CB_NOTIFY_DEVICEID		= 14,</div><div class='del'>-	OP_CB_OFFLOAD			= 15,</div><div class='del'>-	OP_CB_ILLEGAL			= 10044</div><div class='del'>-};</div><div class='add'>+static void encode_uint32(struct xdr_stream *xdr, u32 n)</div><div class='add'>+{</div><div class='add'>+	WARN_ON_ONCE(xdr_stream_encode_u32(xdr, n) &lt; 0);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void encode_bitmap4(struct xdr_stream *xdr, const __u32 *bitmap,</div><div class='add'>+			   size_t len)</div><div class='add'>+{</div><div class='add'>+	xdr_stream_encode_uint32_array(xdr, bitmap, len);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int decode_cb_fattr4(struct xdr_stream *xdr, uint32_t *bitmap,</div><div class='add'>+				struct nfs4_cb_fattr *fattr)</div><div class='add'>+{</div><div class='add'>+	fattr-&gt;ncf_cb_change = 0;</div><div class='add'>+	fattr-&gt;ncf_cb_fsize = 0;</div><div class='add'>+	fattr-&gt;ncf_cb_atime.tv_sec = 0;</div><div class='add'>+	fattr-&gt;ncf_cb_atime.tv_nsec = 0;</div><div class='add'>+	fattr-&gt;ncf_cb_mtime.tv_sec = 0;</div><div class='add'>+	fattr-&gt;ncf_cb_mtime.tv_nsec = 0;</div><div class='add'>+</div><div class='add'>+	if (bitmap[0] &amp; FATTR4_WORD0_CHANGE)</div><div class='add'>+		if (xdr_stream_decode_u64(xdr, &amp;fattr-&gt;ncf_cb_change) &lt; 0)</div><div class='add'>+			return -EIO;</div><div class='add'>+	if (bitmap[0] &amp; FATTR4_WORD0_SIZE)</div><div class='add'>+		if (xdr_stream_decode_u64(xdr, &amp;fattr-&gt;ncf_cb_fsize) &lt; 0)</div><div class='add'>+			return -EIO;</div><div class='add'>+	if (bitmap[2] &amp; FATTR4_WORD2_TIME_DELEG_ACCESS) {</div><div class='add'>+		fattr4_time_deleg_access access;</div><div class='add'>+</div><div class='add'>+		if (!xdrgen_decode_fattr4_time_deleg_access(xdr, &amp;access))</div><div class='add'>+			return -EIO;</div><div class='add'>+		fattr-&gt;ncf_cb_atime.tv_sec = access.seconds;</div><div class='add'>+		fattr-&gt;ncf_cb_atime.tv_nsec = access.nseconds;</div><div class='add'>+</div><div class='add'>+	}</div><div class='add'>+	if (bitmap[2] &amp; FATTR4_WORD2_TIME_DELEG_MODIFY) {</div><div class='add'>+		fattr4_time_deleg_modify modify;</div><div class='add'>+</div><div class='add'>+		if (!xdrgen_decode_fattr4_time_deleg_modify(xdr, &amp;modify))</div><div class='add'>+			return -EIO;</div><div class='add'>+		fattr-&gt;ncf_cb_mtime.tv_sec = modify.seconds;</div><div class='add'>+		fattr-&gt;ncf_cb_mtime.tv_nsec = modify.nseconds;</div><div class='add'>+</div><div class='add'>+	}</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> static void encode_nfs_cb_opnum4(struct xdr_stream *xdr, enum nfs_cb_opnum4 op)</div><div class='ctx'> {</div><div class='hunk'>@@ -286,17 +309,17 @@ static int decode_cb_compound4res(struct xdr_stream *xdr,</div><div class='ctx'> 	u32 length;</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> </div><div class='del'>-	p = xdr_inline_decode(xdr, 4 + 4);</div><div class='add'>+	p = xdr_inline_decode(xdr, XDR_UNIT);</div><div class='ctx'> 	if (unlikely(p == NULL))</div><div class='ctx'> 		goto out_overflow;</div><div class='del'>-	hdr-&gt;status = be32_to_cpup(p++);</div><div class='add'>+	hdr-&gt;status = be32_to_cpup(p);</div><div class='ctx'> 	/* Ignore the tag */</div><div class='del'>-	length = be32_to_cpup(p++);</div><div class='del'>-	p = xdr_inline_decode(xdr, length + 4);</div><div class='del'>-	if (unlikely(p == NULL))</div><div class='add'>+	if (xdr_stream_decode_u32(xdr, &amp;length) &lt; 0)</div><div class='add'>+		goto out_overflow;</div><div class='add'>+	if (xdr_inline_decode(xdr, length) == NULL)</div><div class='add'>+		goto out_overflow;</div><div class='add'>+	if (xdr_stream_decode_u32(xdr, &amp;hdr-&gt;nops) &lt; 0)</div><div class='ctx'> 		goto out_overflow;</div><div class='del'>-	p += XDR_QUADLEN(length);</div><div class='del'>-	hdr-&gt;nops = be32_to_cpup(p);</div><div class='ctx'> 	return 0;</div><div class='ctx'> out_overflow:</div><div class='ctx'> 	return -EIO;</div><div class='hunk'>@@ -329,6 +352,95 @@ static void encode_cb_recall4args(struct xdr_stream *xdr,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * CB_RECALLANY4args</div><div class='add'>+ *</div><div class='add'>+ *	struct CB_RECALLANY4args {</div><div class='add'>+ *		uint32_t	craa_objects_to_keep;</div><div class='add'>+ *		bitmap4		craa_type_mask;</div><div class='add'>+ *	};</div><div class='add'>+ */</div><div class='add'>+static void</div><div class='add'>+encode_cb_recallany4args(struct xdr_stream *xdr,</div><div class='add'>+	struct nfs4_cb_compound_hdr *hdr, struct nfsd4_cb_recall_any *ra)</div><div class='add'>+{</div><div class='add'>+	encode_nfs_cb_opnum4(xdr, OP_CB_RECALL_ANY);</div><div class='add'>+	encode_uint32(xdr, ra-&gt;ra_keep);</div><div class='add'>+	encode_bitmap4(xdr, ra-&gt;ra_bmval, ARRAY_SIZE(ra-&gt;ra_bmval));</div><div class='add'>+	hdr-&gt;nops++;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * CB_GETATTR4args</div><div class='add'>+ *	struct CB_GETATTR4args {</div><div class='add'>+ *	   nfs_fh4 fh;</div><div class='add'>+ *	   bitmap4 attr_request;</div><div class='add'>+ *	};</div><div class='add'>+ *</div><div class='add'>+ * The size and change attributes are the only one</div><div class='add'>+ * guaranteed to be serviced by the client.</div><div class='add'>+ */</div><div class='add'>+static void</div><div class='add'>+encode_cb_getattr4args(struct xdr_stream *xdr, struct nfs4_cb_compound_hdr *hdr,</div><div class='add'>+			struct nfs4_cb_fattr *fattr)</div><div class='add'>+{</div><div class='add'>+	struct nfs4_delegation *dp = container_of(fattr, struct nfs4_delegation, dl_cb_fattr);</div><div class='add'>+	struct knfsd_fh *fh = &amp;dp-&gt;dl_stid.sc_file-&gt;fi_fhandle;</div><div class='add'>+	struct nfs4_cb_fattr *ncf = &amp;dp-&gt;dl_cb_fattr;</div><div class='add'>+	u32 bmap_size = 1;</div><div class='add'>+	u32 bmap[3];</div><div class='add'>+</div><div class='add'>+	bmap[0] = FATTR4_WORD0_SIZE;</div><div class='add'>+	if (!ncf-&gt;ncf_file_modified)</div><div class='add'>+		bmap[0] |= FATTR4_WORD0_CHANGE;</div><div class='add'>+</div><div class='add'>+	if (deleg_attrs_deleg(dp-&gt;dl_type)) {</div><div class='add'>+		bmap[1] = 0;</div><div class='add'>+		bmap[2] = FATTR4_WORD2_TIME_DELEG_ACCESS | FATTR4_WORD2_TIME_DELEG_MODIFY;</div><div class='add'>+		bmap_size = 3;</div><div class='add'>+	}</div><div class='add'>+	encode_nfs_cb_opnum4(xdr, OP_CB_GETATTR);</div><div class='add'>+	encode_nfs_fh4(xdr, fh);</div><div class='add'>+	encode_bitmap4(xdr, bmap, bmap_size);</div><div class='add'>+	hdr-&gt;nops++;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static u32 highest_slotid(struct nfsd4_session *ses)</div><div class='add'>+{</div><div class='add'>+	u32 idx;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;ses-&gt;se_lock);</div><div class='add'>+	idx = fls(~ses-&gt;se_cb_slot_avail);</div><div class='add'>+	if (idx &gt; 0)</div><div class='add'>+		--idx;</div><div class='add'>+	idx = max(idx, ses-&gt;se_cb_highest_slot);</div><div class='add'>+	spin_unlock(&amp;ses-&gt;se_lock);</div><div class='add'>+	return idx;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+encode_referring_call4(struct xdr_stream *xdr,</div><div class='add'>+		       const struct nfsd4_referring_call *rc)</div><div class='add'>+{</div><div class='add'>+	encode_uint32(xdr, rc-&gt;rc_sequenceid);</div><div class='add'>+	encode_uint32(xdr, rc-&gt;rc_slotid);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+encode_referring_call_list4(struct xdr_stream *xdr,</div><div class='add'>+			    const struct nfsd4_referring_call_list *rcl)</div><div class='add'>+{</div><div class='add'>+	struct nfsd4_referring_call *rc;</div><div class='add'>+	__be32 *p;</div><div class='add'>+</div><div class='add'>+	p = xdr_reserve_space(xdr, NFS4_MAX_SESSIONID_LEN);</div><div class='add'>+	xdr_encode_opaque_fixed(p, rcl-&gt;rcl_sessionid.data,</div><div class='add'>+					NFS4_MAX_SESSIONID_LEN);</div><div class='add'>+	encode_uint32(xdr, rcl-&gt;__nr_referring_calls);</div><div class='add'>+	list_for_each_entry(rc, &amp;rcl-&gt;rcl_referring_calls, __list)</div><div class='add'>+		encode_referring_call4(xdr, rc);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * CB_SEQUENCE4args</div><div class='ctx'>  *</div><div class='ctx'>  *	struct CB_SEQUENCE4args {</div><div class='hunk'>@@ -345,6 +457,7 @@ static void encode_cb_sequence4args(struct xdr_stream *xdr,</div><div class='ctx'> 				    struct nfs4_cb_compound_hdr *hdr)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd4_session *session = cb-&gt;cb_clp-&gt;cl_cb_session;</div><div class='add'>+	struct nfsd4_referring_call_list *rcl;</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> </div><div class='ctx'> 	if (hdr-&gt;minorversion == 0)</div><div class='hunk'>@@ -353,16 +466,45 @@ static void encode_cb_sequence4args(struct xdr_stream *xdr,</div><div class='ctx'> 	encode_nfs_cb_opnum4(xdr, OP_CB_SEQUENCE);</div><div class='ctx'> 	encode_sessionid4(xdr, session);</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, 4 + 4 + 4 + 4 + 4);</div><div class='del'>-	*p++ = cpu_to_be32(session-&gt;se_cb_seq_nr);	/* csa_sequenceid */</div><div class='del'>-	*p++ = xdr_zero;			/* csa_slotid */</div><div class='del'>-	*p++ = xdr_zero;			/* csa_highest_slotid */</div><div class='add'>+	p = xdr_reserve_space(xdr, XDR_UNIT * 4);</div><div class='add'>+	*p++ = cpu_to_be32(session-&gt;se_cb_seq_nr[cb-&gt;cb_held_slot]);	/* csa_sequenceid */</div><div class='add'>+	*p++ = cpu_to_be32(cb-&gt;cb_held_slot);		/* csa_slotid */</div><div class='add'>+	*p++ = cpu_to_be32(highest_slotid(session)); /* csa_highest_slotid */</div><div class='ctx'> 	*p++ = xdr_zero;			/* csa_cachethis */</div><div class='del'>-	xdr_encode_empty_array(p);		/* csa_referring_call_lists */</div><div class='add'>+</div><div class='add'>+	/* csa_referring_call_lists */</div><div class='add'>+	encode_uint32(xdr, cb-&gt;cb_nr_referring_call_list);</div><div class='add'>+	list_for_each_entry(rcl, &amp;cb-&gt;cb_referring_call_list, __list)</div><div class='add'>+		encode_referring_call_list4(xdr, rcl);</div><div class='ctx'> </div><div class='ctx'> 	hdr-&gt;nops++;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void update_cb_slot_table(struct nfsd4_session *ses, u32 target)</div><div class='add'>+{</div><div class='add'>+	/* No need to do anything if nothing changed */</div><div class='add'>+	if (likely(target == READ_ONCE(ses-&gt;se_cb_highest_slot)))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;ses-&gt;se_lock);</div><div class='add'>+	if (target &gt; ses-&gt;se_cb_highest_slot) {</div><div class='add'>+		int i;</div><div class='add'>+</div><div class='add'>+		target = min(target, NFSD_BC_SLOT_TABLE_SIZE - 1);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Growing the slot table. Reset any new sequences to 1.</div><div class='add'>+		 *</div><div class='add'>+		 * NB: There is some debate about whether the RFC requires this,</div><div class='add'>+		 *     but the Linux client expects it.</div><div class='add'>+		 */</div><div class='add'>+		for (i = ses-&gt;se_cb_highest_slot + 1; i &lt;= target; ++i)</div><div class='add'>+			ses-&gt;se_cb_seq_nr[i] = 1;</div><div class='add'>+	}</div><div class='add'>+	ses-&gt;se_cb_highest_slot = target;</div><div class='add'>+	spin_unlock(&amp;ses-&gt;se_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * CB_SEQUENCE4resok</div><div class='ctx'>  *</div><div class='hunk'>@@ -390,7 +532,7 @@ static int decode_cb_sequence4resok(struct xdr_stream *xdr,</div><div class='ctx'> 	struct nfsd4_session *session = cb-&gt;cb_clp-&gt;cl_cb_session;</div><div class='ctx'> 	int status = -ESERVERFAULT;</div><div class='ctx'> 	__be32 *p;</div><div class='del'>-	u32 dummy;</div><div class='add'>+	u32 seqid, slotid, target;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If the server returns different values for sessionID, slotID or</div><div class='hunk'>@@ -406,21 +548,22 @@ static int decode_cb_sequence4resok(struct xdr_stream *xdr,</div><div class='ctx'> 	}</div><div class='ctx'> 	p += XDR_QUADLEN(NFS4_MAX_SESSIONID_LEN);</div><div class='ctx'> </div><div class='del'>-	dummy = be32_to_cpup(p++);</div><div class='del'>-	if (dummy != session-&gt;se_cb_seq_nr) {</div><div class='add'>+	seqid = be32_to_cpup(p++);</div><div class='add'>+	if (seqid != session-&gt;se_cb_seq_nr[cb-&gt;cb_held_slot]) {</div><div class='ctx'> 		dprintk("NFS: %s Invalid sequence number\n", __func__);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dummy = be32_to_cpup(p++);</div><div class='del'>-	if (dummy != 0) {</div><div class='add'>+	slotid = be32_to_cpup(p++);</div><div class='add'>+	if (slotid != cb-&gt;cb_held_slot) {</div><div class='ctx'> 		dprintk("NFS: %s Invalid slotid\n", __func__);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * FIXME: process highest slotid and target highest slotid</div><div class='del'>-	 */</div><div class='add'>+	p++; // ignore current highest slot value</div><div class='add'>+</div><div class='add'>+	target = be32_to_cpup(p++);</div><div class='add'>+	update_cb_slot_table(session, target);</div><div class='ctx'> 	status = 0;</div><div class='ctx'> out:</div><div class='ctx'> 	cb-&gt;cb_seq_status = status;</div><div class='hunk'>@@ -464,6 +607,26 @@ static void nfs4_xdr_enc_cb_null(struct rpc_rqst *req, struct xdr_stream *xdr,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * 20.1.  Operation 3: CB_GETATTR - Get Attributes</div><div class='add'>+ */</div><div class='add'>+static void nfs4_xdr_enc_cb_getattr(struct rpc_rqst *req,</div><div class='add'>+		struct xdr_stream *xdr, const void *data)</div><div class='add'>+{</div><div class='add'>+	const struct nfsd4_callback *cb = data;</div><div class='add'>+	struct nfs4_cb_fattr *ncf =</div><div class='add'>+		container_of(cb, struct nfs4_cb_fattr, ncf_getattr);</div><div class='add'>+	struct nfs4_cb_compound_hdr hdr = {</div><div class='add'>+		.ident = cb-&gt;cb_clp-&gt;cl_cb_ident,</div><div class='add'>+		.minorversion = cb-&gt;cb_clp-&gt;cl_minorversion,</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+	encode_cb_compound4args(xdr, &amp;hdr);</div><div class='add'>+	encode_cb_sequence4args(xdr, cb, &amp;hdr);</div><div class='add'>+	encode_cb_getattr4args(xdr, &amp;hdr, ncf);</div><div class='add'>+	encode_cb_nops(&amp;hdr);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * 20.2. Operation 4: CB_RECALL - Recall a Delegation</div><div class='ctx'>  */</div><div class='ctx'> static void nfs4_xdr_enc_cb_recall(struct rpc_rqst *req, struct xdr_stream *xdr,</div><div class='hunk'>@@ -482,6 +645,26 @@ static void nfs4_xdr_enc_cb_recall(struct rpc_rqst *req, struct xdr_stream *xdr,</div><div class='ctx'> 	encode_cb_nops(&amp;hdr);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * 20.6. Operation 8: CB_RECALL_ANY - Keep Any N Recallable Objects</div><div class='add'>+ */</div><div class='add'>+static void</div><div class='add'>+nfs4_xdr_enc_cb_recall_any(struct rpc_rqst *req,</div><div class='add'>+		struct xdr_stream *xdr, const void *data)</div><div class='add'>+{</div><div class='add'>+	const struct nfsd4_callback *cb = data;</div><div class='add'>+	struct nfsd4_cb_recall_any *ra;</div><div class='add'>+	struct nfs4_cb_compound_hdr hdr = {</div><div class='add'>+		.ident = cb-&gt;cb_clp-&gt;cl_cb_ident,</div><div class='add'>+		.minorversion = cb-&gt;cb_clp-&gt;cl_minorversion,</div><div class='add'>+	};</div><div class='add'>+</div><div class='add'>+	ra = container_of(cb, struct nfsd4_cb_recall_any, ra_cb);</div><div class='add'>+	encode_cb_compound4args(xdr, &amp;hdr);</div><div class='add'>+	encode_cb_sequence4args(xdr, cb, &amp;hdr);</div><div class='add'>+	encode_cb_recallany4args(xdr, &amp;hdr, ra);</div><div class='add'>+	encode_cb_nops(&amp;hdr);</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * NFSv4.0 and NFSv4.1 XDR decode functions</div><div class='hunk'>@@ -499,6 +682,46 @@ static int nfs4_xdr_dec_cb_null(struct rpc_rqst *req, struct xdr_stream *xdr,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * 20.1.  Operation 3: CB_GETATTR - Get Attributes</div><div class='add'>+ */</div><div class='add'>+static int nfs4_xdr_dec_cb_getattr(struct rpc_rqst *rqstp,</div><div class='add'>+				  struct xdr_stream *xdr,</div><div class='add'>+				  void *data)</div><div class='add'>+{</div><div class='add'>+	struct nfsd4_callback *cb = data;</div><div class='add'>+	struct nfs4_cb_compound_hdr hdr;</div><div class='add'>+	int status;</div><div class='add'>+	u32 bitmap[3] = {0};</div><div class='add'>+	u32 attrlen, maxlen;</div><div class='add'>+	struct nfs4_cb_fattr *ncf =</div><div class='add'>+		container_of(cb, struct nfs4_cb_fattr, ncf_getattr);</div><div class='add'>+</div><div class='add'>+	status = decode_cb_compound4res(xdr, &amp;hdr);</div><div class='add'>+	if (unlikely(status))</div><div class='add'>+		return status;</div><div class='add'>+</div><div class='add'>+	status = decode_cb_sequence4res(xdr, cb);</div><div class='add'>+	if (unlikely(status || cb-&gt;cb_seq_status))</div><div class='add'>+		return status;</div><div class='add'>+</div><div class='add'>+	status = decode_cb_op_status(xdr, OP_CB_GETATTR, &amp;cb-&gt;cb_status);</div><div class='add'>+	if (unlikely(status || cb-&gt;cb_status))</div><div class='add'>+		return status;</div><div class='add'>+	if (xdr_stream_decode_uint32_array(xdr, bitmap, 3) &lt; 0)</div><div class='add'>+		return -EIO;</div><div class='add'>+	if (xdr_stream_decode_u32(xdr, &amp;attrlen) &lt; 0)</div><div class='add'>+		return -EIO;</div><div class='add'>+	maxlen = sizeof(ncf-&gt;ncf_cb_change) + sizeof(ncf-&gt;ncf_cb_fsize);</div><div class='add'>+	if (bitmap[2] != 0)</div><div class='add'>+		maxlen += (sizeof(ncf-&gt;ncf_cb_mtime.tv_sec) +</div><div class='add'>+			   sizeof(ncf-&gt;ncf_cb_mtime.tv_nsec)) * 2;</div><div class='add'>+	if (attrlen &gt; maxlen)</div><div class='add'>+		return -EIO;</div><div class='add'>+	status = decode_cb_fattr4(xdr, bitmap, ncf);</div><div class='add'>+	return status;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * 20.2. Operation 4: CB_RECALL - Recall a Delegation</div><div class='ctx'>  */</div><div class='ctx'> static int nfs4_xdr_dec_cb_recall(struct rpc_rqst *rqstp,</div><div class='hunk'>@@ -520,6 +743,28 @@ static int nfs4_xdr_dec_cb_recall(struct rpc_rqst *rqstp,</div><div class='ctx'> 	return decode_cb_op_status(xdr, OP_CB_RECALL, &amp;cb-&gt;cb_status);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * 20.6. Operation 8: CB_RECALL_ANY - Keep Any N Recallable Objects</div><div class='add'>+ */</div><div class='add'>+static int</div><div class='add'>+nfs4_xdr_dec_cb_recall_any(struct rpc_rqst *rqstp,</div><div class='add'>+				  struct xdr_stream *xdr,</div><div class='add'>+				  void *data)</div><div class='add'>+{</div><div class='add'>+	struct nfsd4_callback *cb = data;</div><div class='add'>+	struct nfs4_cb_compound_hdr hdr;</div><div class='add'>+	int status;</div><div class='add'>+</div><div class='add'>+	status = decode_cb_compound4res(xdr, &amp;hdr);</div><div class='add'>+	if (unlikely(status))</div><div class='add'>+		return status;</div><div class='add'>+	status = decode_cb_sequence4res(xdr, cb);</div><div class='add'>+	if (unlikely(status || cb-&gt;cb_seq_status))</div><div class='add'>+		return status;</div><div class='add'>+	status =  decode_cb_op_status(xdr, OP_CB_RECALL_ANY, &amp;cb-&gt;cb_status);</div><div class='add'>+	return status;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> #ifdef CONFIG_NFSD_PNFS</div><div class='ctx'> /*</div><div class='ctx'>  * CB_LAYOUTRECALL4args</div><div class='hunk'>@@ -627,7 +872,7 @@ static void nfs4_xdr_enc_cb_notify_lock(struct rpc_rqst *req,</div><div class='ctx'> 	const struct nfsd4_callback *cb = data;</div><div class='ctx'> 	const struct nfsd4_blocked_lock *nbl =</div><div class='ctx'> 		container_of(cb, struct nfsd4_blocked_lock, nbl_cb);</div><div class='del'>-	struct nfs4_lockowner *lo = (struct nfs4_lockowner *)nbl-&gt;nbl_lock.fl_owner;</div><div class='add'>+	struct nfs4_lockowner *lo = (struct nfs4_lockowner *)nbl-&gt;nbl_lock.c.flc_owner;</div><div class='ctx'> 	struct nfs4_cb_compound_hdr hdr = {</div><div class='ctx'> 		.ident = 0,</div><div class='ctx'> 		.minorversion = cb-&gt;cb_clp-&gt;cl_minorversion,</div><div class='hunk'>@@ -679,7 +924,7 @@ static int nfs4_xdr_dec_cb_notify_lock(struct rpc_rqst *rqstp,</div><div class='ctx'>  *	case NFS4_OK:</div><div class='ctx'>  *		write_response4	coa_resok4;</div><div class='ctx'>  *	default:</div><div class='del'>- *	length4		coa_bytes_copied;</div><div class='add'>+ *		length4		coa_bytes_copied;</div><div class='ctx'>  * };</div><div class='ctx'>  * struct CB_OFFLOAD4args {</div><div class='ctx'>  *	nfs_fh4		coa_fh;</div><div class='hunk'>@@ -688,21 +933,22 @@ static int nfs4_xdr_dec_cb_notify_lock(struct rpc_rqst *rqstp,</div><div class='ctx'>  * };</div><div class='ctx'>  */</div><div class='ctx'> static void encode_offload_info4(struct xdr_stream *xdr,</div><div class='del'>-				 __be32 nfserr,</div><div class='del'>-				 const struct nfsd4_copy *cp)</div><div class='add'>+				 const struct nfsd4_cb_offload *cbo)</div><div class='ctx'> {</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> </div><div class='ctx'> 	p = xdr_reserve_space(xdr, 4);</div><div class='del'>-	*p++ = nfserr;</div><div class='del'>-	if (!nfserr) {</div><div class='add'>+	*p = cbo-&gt;co_nfserr;</div><div class='add'>+	switch (cbo-&gt;co_nfserr) {</div><div class='add'>+	case nfs_ok:</div><div class='ctx'> 		p = xdr_reserve_space(xdr, 4 + 8 + 4 + NFS4_VERIFIER_SIZE);</div><div class='ctx'> 		p = xdr_encode_empty_array(p);</div><div class='del'>-		p = xdr_encode_hyper(p, cp-&gt;cp_res.wr_bytes_written);</div><div class='del'>-		*p++ = cpu_to_be32(cp-&gt;cp_res.wr_stable_how);</div><div class='del'>-		p = xdr_encode_opaque_fixed(p, cp-&gt;cp_res.wr_verifier.data,</div><div class='add'>+		p = xdr_encode_hyper(p, cbo-&gt;co_res.wr_bytes_written);</div><div class='add'>+		*p++ = cpu_to_be32(cbo-&gt;co_res.wr_stable_how);</div><div class='add'>+		p = xdr_encode_opaque_fixed(p, cbo-&gt;co_res.wr_verifier.data,</div><div class='ctx'> 					    NFS4_VERIFIER_SIZE);</div><div class='del'>-	} else {</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='ctx'> 		p = xdr_reserve_space(xdr, 8);</div><div class='ctx'> 		/* We always return success if bytes were written */</div><div class='ctx'> 		p = xdr_encode_hyper(p, 0);</div><div class='hunk'>@@ -710,18 +956,16 @@ static void encode_offload_info4(struct xdr_stream *xdr,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void encode_cb_offload4args(struct xdr_stream *xdr,</div><div class='del'>-				   __be32 nfserr,</div><div class='del'>-				   const struct knfsd_fh *fh,</div><div class='del'>-				   const struct nfsd4_copy *cp,</div><div class='add'>+				   const struct nfsd4_cb_offload *cbo,</div><div class='ctx'> 				   struct nfs4_cb_compound_hdr *hdr)</div><div class='ctx'> {</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> </div><div class='ctx'> 	p = xdr_reserve_space(xdr, 4);</div><div class='del'>-	*p++ = cpu_to_be32(OP_CB_OFFLOAD);</div><div class='del'>-	encode_nfs_fh4(xdr, fh);</div><div class='del'>-	encode_stateid4(xdr, &amp;cp-&gt;cp_res.cb_stateid);</div><div class='del'>-	encode_offload_info4(xdr, nfserr, cp);</div><div class='add'>+	*p = cpu_to_be32(OP_CB_OFFLOAD);</div><div class='add'>+	encode_nfs_fh4(xdr, &amp;cbo-&gt;co_fh);</div><div class='add'>+	encode_stateid4(xdr, &amp;cbo-&gt;co_res.cb_stateid);</div><div class='add'>+	encode_offload_info4(xdr, cbo);</div><div class='ctx'> </div><div class='ctx'> 	hdr-&gt;nops++;</div><div class='ctx'> }</div><div class='hunk'>@@ -731,8 +975,8 @@ static void nfs4_xdr_enc_cb_offload(struct rpc_rqst *req,</div><div class='ctx'> 				    const void *data)</div><div class='ctx'> {</div><div class='ctx'> 	const struct nfsd4_callback *cb = data;</div><div class='del'>-	const struct nfsd4_copy *cp =</div><div class='del'>-		container_of(cb, struct nfsd4_copy, cp_cb);</div><div class='add'>+	const struct nfsd4_cb_offload *cbo =</div><div class='add'>+		container_of(cb, struct nfsd4_cb_offload, co_cb);</div><div class='ctx'> 	struct nfs4_cb_compound_hdr hdr = {</div><div class='ctx'> 		.ident = 0,</div><div class='ctx'> 		.minorversion = cb-&gt;cb_clp-&gt;cl_minorversion,</div><div class='hunk'>@@ -740,7 +984,7 @@ static void nfs4_xdr_enc_cb_offload(struct rpc_rqst *req,</div><div class='ctx'> </div><div class='ctx'> 	encode_cb_compound4args(xdr, &amp;hdr);</div><div class='ctx'> 	encode_cb_sequence4args(xdr, cb, &amp;hdr);</div><div class='del'>-	encode_cb_offload4args(xdr, cp-&gt;nfserr, &amp;cp-&gt;fh, cp, &amp;hdr);</div><div class='add'>+	encode_cb_offload4args(xdr, cbo, &amp;hdr);</div><div class='ctx'> 	encode_cb_nops(&amp;hdr);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -784,6 +1028,8 @@ static const struct rpc_procinfo nfs4_cb_procedures[] = {</div><div class='ctx'> #endif</div><div class='ctx'> 	PROC(CB_NOTIFY_LOCK,	COMPOUND,	cb_notify_lock,	cb_notify_lock),</div><div class='ctx'> 	PROC(CB_OFFLOAD,	COMPOUND,	cb_offload,	cb_offload),</div><div class='add'>+	PROC(CB_RECALL_ANY,	COMPOUND,	cb_recall_any,	cb_recall_any),</div><div class='add'>+	PROC(CB_GETATTR,	COMPOUND,	cb_getattr,	cb_getattr),</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static unsigned int nfs4_cb_counts[ARRAY_SIZE(nfs4_cb_procedures)];</div><div class='hunk'>@@ -836,11 +1082,23 @@ static int max_cb_time(struct net *net)</div><div class='ctx'> 	return max(((u32)nn-&gt;nfsd4_lease)/10, 1u) * HZ;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct workqueue_struct *callback_wq;</div><div class='del'>-</div><div class='ctx'> static bool nfsd4_queue_cb(struct nfsd4_callback *cb)</div><div class='ctx'> {</div><div class='del'>-	return queue_work(callback_wq, &amp;cb-&gt;cb_work);</div><div class='add'>+	struct nfs4_client *clp = cb-&gt;cb_clp;</div><div class='add'>+</div><div class='add'>+	trace_nfsd_cb_queue(clp, cb);</div><div class='add'>+	return queue_work(clp-&gt;cl_callback_wq, &amp;cb-&gt;cb_work);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfsd4_requeue_cb(struct rpc_task *task, struct nfsd4_callback *cb)</div><div class='add'>+{</div><div class='add'>+	struct nfs4_client *clp = cb-&gt;cb_clp;</div><div class='add'>+</div><div class='add'>+	if (!test_bit(NFSD4_CLIENT_CB_KILL, &amp;clp-&gt;cl_flags)) {</div><div class='add'>+		trace_nfsd_cb_restart(clp, cb);</div><div class='add'>+		task-&gt;tk_status = 0;</div><div class='add'>+		set_bit(NFSD4_CALLBACK_REQUEUE, &amp;cb-&gt;cb_flags);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void nfsd41_cb_inflight_begin(struct nfs4_client *clp)</div><div class='hunk'>@@ -851,8 +1109,7 @@ static void nfsd41_cb_inflight_begin(struct nfs4_client *clp)</div><div class='ctx'> static void nfsd41_cb_inflight_end(struct nfs4_client *clp)</div><div class='ctx'> {</div><div class='ctx'> </div><div class='del'>-	if (atomic_dec_and_test(&amp;clp-&gt;cl_cb_inflight))</div><div class='del'>-		wake_up_var(&amp;clp-&gt;cl_cb_inflight);</div><div class='add'>+	atomic_dec_and_wake_up(&amp;clp-&gt;cl_cb_inflight);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void nfsd41_cb_inflight_wait_complete(struct nfs4_client *clp)</div><div class='hunk'>@@ -871,12 +1128,12 @@ static const struct cred *get_backchannel_cred(struct nfs4_client *clp, struct r</div><div class='ctx'> 	} else {</div><div class='ctx'> 		struct cred *kcred;</div><div class='ctx'> </div><div class='del'>-		kcred = prepare_kernel_cred(NULL);</div><div class='add'>+		kcred = prepare_kernel_cred(&amp;init_task);</div><div class='ctx'> 		if (!kcred)</div><div class='ctx'> 			return NULL;</div><div class='ctx'> </div><div class='del'>-		kcred-&gt;uid = ses-&gt;se_cb_sec.uid;</div><div class='del'>-		kcred-&gt;gid = ses-&gt;se_cb_sec.gid;</div><div class='add'>+		kcred-&gt;fsuid = ses-&gt;se_cb_sec.uid;</div><div class='add'>+		kcred-&gt;fsgid = ses-&gt;se_cb_sec.gid;</div><div class='ctx'> 		return kcred;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -915,9 +1172,8 @@ static int setup_callback_client(struct nfs4_client *clp, struct nfs4_cb_conn *c</div><div class='ctx'> 		args.authflavor = clp-&gt;cl_cred.cr_flavor;</div><div class='ctx'> 		clp-&gt;cl_cb_ident = conn-&gt;cb_ident;</div><div class='ctx'> 	} else {</div><div class='del'>-		if (!conn-&gt;cb_xprt)</div><div class='add'>+		if (!conn-&gt;cb_xprt || !ses)</div><div class='ctx'> 			return -EINVAL;</div><div class='del'>-		clp-&gt;cl_cb_conn.cb_xprt = conn-&gt;cb_xprt;</div><div class='ctx'> 		clp-&gt;cl_cb_session = ses;</div><div class='ctx'> 		args.bc_xprt = conn-&gt;cb_xprt;</div><div class='ctx'> 		args.prognumber = clp-&gt;cl_cb_session-&gt;se_cb_prog;</div><div class='hunk'>@@ -937,6 +1193,9 @@ static int setup_callback_client(struct nfs4_client *clp, struct nfs4_cb_conn *c</div><div class='ctx'> 		rpc_shutdown_client(client);</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	if (clp-&gt;cl_minorversion != 0)</div><div class='add'>+		clp-&gt;cl_cb_conn.cb_xprt = conn-&gt;cb_xprt;</div><div class='ctx'> 	clp-&gt;cl_cb_client = client;</div><div class='ctx'> 	clp-&gt;cl_cb_cred = cred;</div><div class='ctx'> 	rcu_read_lock();</div><div class='hunk'>@@ -950,18 +1209,18 @@ static void nfsd4_mark_cb_state(struct nfs4_client *clp, int newstate)</div><div class='ctx'> {</div><div class='ctx'> 	if (clp-&gt;cl_cb_state != newstate) {</div><div class='ctx'> 		clp-&gt;cl_cb_state = newstate;</div><div class='del'>-		trace_nfsd_cb_state(clp);</div><div class='add'>+		trace_nfsd_cb_new_state(clp);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void nfsd4_mark_cb_down(struct nfs4_client *clp, int reason)</div><div class='add'>+static void nfsd4_mark_cb_down(struct nfs4_client *clp)</div><div class='ctx'> {</div><div class='ctx'> 	if (test_bit(NFSD4_CLIENT_CB_UPDATE, &amp;clp-&gt;cl_flags))</div><div class='ctx'> 		return;</div><div class='ctx'> 	nfsd4_mark_cb_state(clp, NFSD4_CB_DOWN);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void nfsd4_mark_cb_fault(struct nfs4_client *clp, int reason)</div><div class='add'>+static void nfsd4_mark_cb_fault(struct nfs4_client *clp)</div><div class='ctx'> {</div><div class='ctx'> 	if (test_bit(NFSD4_CLIENT_CB_UPDATE, &amp;clp-&gt;cl_flags))</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -973,7 +1232,7 @@ static void nfsd4_cb_probe_done(struct rpc_task *task, void *calldata)</div><div class='ctx'> 	struct nfs4_client *clp = container_of(calldata, struct nfs4_client, cl_cb_null);</div><div class='ctx'> </div><div class='ctx'> 	if (task-&gt;tk_status)</div><div class='del'>-		nfsd4_mark_cb_down(clp, task-&gt;tk_status);</div><div class='add'>+		nfsd4_mark_cb_down(clp);</div><div class='ctx'> 	else</div><div class='ctx'> 		nfsd4_mark_cb_state(clp, NFSD4_CB_UP);</div><div class='ctx'> }</div><div class='hunk'>@@ -1008,7 +1267,7 @@ void nfsd4_probe_callback(struct nfs4_client *clp)</div><div class='ctx'> void nfsd4_probe_callback_sync(struct nfs4_client *clp)</div><div class='ctx'> {</div><div class='ctx'> 	nfsd4_probe_callback(clp);</div><div class='del'>-	flush_workqueue(callback_wq);</div><div class='add'>+	flush_workqueue(clp-&gt;cl_callback_wq);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void nfsd4_change_callback(struct nfs4_client *clp, struct nfs4_cb_conn *conn)</div><div class='hunk'>@@ -1019,6 +1278,22 @@ void nfsd4_change_callback(struct nfs4_client *clp, struct nfs4_cb_conn *conn)</div><div class='ctx'> 	spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static int grab_slot(struct nfsd4_session *ses)</div><div class='add'>+{</div><div class='add'>+	int idx;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;ses-&gt;se_lock);</div><div class='add'>+	idx = ffs(ses-&gt;se_cb_slot_avail) - 1;</div><div class='add'>+	if (idx &lt; 0 || idx &gt; ses-&gt;se_cb_highest_slot) {</div><div class='add'>+		spin_unlock(&amp;ses-&gt;se_lock);</div><div class='add'>+		return -1;</div><div class='add'>+	}</div><div class='add'>+	/* clear the bit for the slot */</div><div class='add'>+	ses-&gt;se_cb_slot_avail &amp;= ~BIT(idx);</div><div class='add'>+	spin_unlock(&amp;ses-&gt;se_lock);</div><div class='add'>+	return idx;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * There's currently a single callback channel slot.</div><div class='ctx'>  * If the slot is available, then mark it busy.  Otherwise, set the</div><div class='hunk'>@@ -1027,28 +1302,32 @@ void nfsd4_change_callback(struct nfs4_client *clp, struct nfs4_cb_conn *conn)</div><div class='ctx'> static bool nfsd41_cb_get_slot(struct nfsd4_callback *cb, struct rpc_task *task)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_client *clp = cb-&gt;cb_clp;</div><div class='add'>+	struct nfsd4_session *ses = clp-&gt;cl_cb_session;</div><div class='ctx'> </div><div class='del'>-	if (!cb-&gt;cb_holds_slot &amp;&amp;</div><div class='del'>-	    test_and_set_bit(0, &amp;clp-&gt;cl_cb_slot_busy) != 0) {</div><div class='add'>+	if (cb-&gt;cb_held_slot &gt;= 0)</div><div class='add'>+		return true;</div><div class='add'>+	cb-&gt;cb_held_slot = grab_slot(ses);</div><div class='add'>+	if (cb-&gt;cb_held_slot &lt; 0) {</div><div class='ctx'> 		rpc_sleep_on(&amp;clp-&gt;cl_cb_waitq, task, NULL);</div><div class='ctx'> 		/* Race breaker */</div><div class='del'>-		if (test_and_set_bit(0, &amp;clp-&gt;cl_cb_slot_busy) != 0) {</div><div class='del'>-			dprintk("%s slot is busy\n", __func__);</div><div class='add'>+		cb-&gt;cb_held_slot = grab_slot(ses);</div><div class='add'>+		if (cb-&gt;cb_held_slot &lt; 0)</div><div class='ctx'> 			return false;</div><div class='del'>-		}</div><div class='ctx'> 		rpc_wake_up_queued_task(&amp;clp-&gt;cl_cb_waitq, task);</div><div class='ctx'> 	}</div><div class='del'>-	cb-&gt;cb_holds_slot = true;</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void nfsd41_cb_release_slot(struct nfsd4_callback *cb)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_client *clp = cb-&gt;cb_clp;</div><div class='add'>+	struct nfsd4_session *ses = clp-&gt;cl_cb_session;</div><div class='ctx'> </div><div class='del'>-	if (cb-&gt;cb_holds_slot) {</div><div class='del'>-		cb-&gt;cb_holds_slot = false;</div><div class='del'>-		clear_bit(0, &amp;clp-&gt;cl_cb_slot_busy);</div><div class='add'>+	if (cb-&gt;cb_held_slot &gt;= 0) {</div><div class='add'>+		spin_lock(&amp;ses-&gt;se_lock);</div><div class='add'>+		ses-&gt;se_cb_slot_avail |= BIT(cb-&gt;cb_held_slot);</div><div class='add'>+		spin_unlock(&amp;ses-&gt;se_lock);</div><div class='add'>+		cb-&gt;cb_held_slot = -1;</div><div class='ctx'> 		rpc_wake_up_next(&amp;clp-&gt;cl_cb_waitq);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -1057,16 +1336,115 @@ static void nfsd41_destroy_cb(struct nfsd4_callback *cb)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_client *clp = cb-&gt;cb_clp;</div><div class='ctx'> </div><div class='add'>+	trace_nfsd_cb_destroy(clp, cb);</div><div class='ctx'> 	nfsd41_cb_release_slot(cb);</div><div class='add'>+	if (test_bit(NFSD4_CALLBACK_WAKE, &amp;cb-&gt;cb_flags))</div><div class='add'>+		clear_and_wake_up_bit(NFSD4_CALLBACK_RUNNING, &amp;cb-&gt;cb_flags);</div><div class='add'>+	else</div><div class='add'>+		clear_bit(NFSD4_CALLBACK_RUNNING, &amp;cb-&gt;cb_flags);</div><div class='add'>+</div><div class='ctx'> 	if (cb-&gt;cb_ops &amp;&amp; cb-&gt;cb_ops-&gt;release)</div><div class='ctx'> 		cb-&gt;cb_ops-&gt;release(cb);</div><div class='ctx'> 	nfsd41_cb_inflight_end(clp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * TODO: cb_sequence should support referring call lists, cachethis, multiple</div><div class='del'>- * slots, and mark callback channel down on communication errors.</div><div class='add'>+/**</div><div class='add'>+ * nfsd41_cb_referring_call - add a referring call to a callback operation</div><div class='add'>+ * @cb: context of callback to add the rc to</div><div class='add'>+ * @sessionid: referring call's session ID</div><div class='add'>+ * @slotid: referring call's session slot index</div><div class='add'>+ * @seqno: referring call's slot sequence number</div><div class='add'>+ *</div><div class='add'>+ * Caller serializes access to @cb.</div><div class='add'>+ *</div><div class='add'>+ * NB: If memory allocation fails, the referring call is not added.</div><div class='ctx'>  */</div><div class='add'>+void nfsd41_cb_referring_call(struct nfsd4_callback *cb,</div><div class='add'>+			      struct nfs4_sessionid *sessionid,</div><div class='add'>+			      u32 slotid, u32 seqno)</div><div class='add'>+{</div><div class='add'>+	struct nfsd4_referring_call_list *rcl;</div><div class='add'>+	struct nfsd4_referring_call *rc;</div><div class='add'>+	bool found;</div><div class='add'>+</div><div class='add'>+	might_sleep();</div><div class='add'>+</div><div class='add'>+	found = false;</div><div class='add'>+	list_for_each_entry(rcl, &amp;cb-&gt;cb_referring_call_list, __list) {</div><div class='add'>+		if (!memcmp(rcl-&gt;rcl_sessionid.data, sessionid-&gt;data,</div><div class='add'>+			   NFS4_MAX_SESSIONID_LEN)) {</div><div class='add'>+			found = true;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	if (!found) {</div><div class='add'>+		rcl = kmalloc(sizeof(*rcl), GFP_KERNEL);</div><div class='add'>+		if (!rcl)</div><div class='add'>+			return;</div><div class='add'>+		memcpy(rcl-&gt;rcl_sessionid.data, sessionid-&gt;data,</div><div class='add'>+		       NFS4_MAX_SESSIONID_LEN);</div><div class='add'>+		rcl-&gt;__nr_referring_calls = 0;</div><div class='add'>+		INIT_LIST_HEAD(&amp;rcl-&gt;rcl_referring_calls);</div><div class='add'>+		list_add(&amp;rcl-&gt;__list, &amp;cb-&gt;cb_referring_call_list);</div><div class='add'>+		cb-&gt;cb_nr_referring_call_list++;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	found = false;</div><div class='add'>+	list_for_each_entry(rc, &amp;rcl-&gt;rcl_referring_calls, __list) {</div><div class='add'>+		if (rc-&gt;rc_sequenceid == seqno &amp;&amp; rc-&gt;rc_slotid == slotid) {</div><div class='add'>+			found = true;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	if (!found) {</div><div class='add'>+		rc = kmalloc(sizeof(*rc), GFP_KERNEL);</div><div class='add'>+		if (!rc)</div><div class='add'>+			goto out;</div><div class='add'>+		rc-&gt;rc_sequenceid = seqno;</div><div class='add'>+		rc-&gt;rc_slotid = slotid;</div><div class='add'>+		rcl-&gt;__nr_referring_calls++;</div><div class='add'>+		list_add(&amp;rc-&gt;__list, &amp;rcl-&gt;rcl_referring_calls);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	if (!rcl-&gt;__nr_referring_calls) {</div><div class='add'>+		cb-&gt;cb_nr_referring_call_list--;</div><div class='add'>+		list_del(&amp;rcl-&gt;__list);</div><div class='add'>+		kfree(rcl);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * nfsd41_cb_destroy_referring_call_list - release referring call info</div><div class='add'>+ * @cb: context of a callback that has completed</div><div class='add'>+ *</div><div class='add'>+ * Callers who allocate referring calls using nfsd41_cb_referring_call() must</div><div class='add'>+ * release those resources by calling nfsd41_cb_destroy_referring_call_list.</div><div class='add'>+ *</div><div class='add'>+ * Caller serializes access to @cb.</div><div class='add'>+ */</div><div class='add'>+void nfsd41_cb_destroy_referring_call_list(struct nfsd4_callback *cb)</div><div class='add'>+{</div><div class='add'>+	struct nfsd4_referring_call_list *rcl;</div><div class='add'>+	struct nfsd4_referring_call *rc;</div><div class='add'>+</div><div class='add'>+	while (!list_empty(&amp;cb-&gt;cb_referring_call_list)) {</div><div class='add'>+		rcl = list_first_entry(&amp;cb-&gt;cb_referring_call_list,</div><div class='add'>+				       struct nfsd4_referring_call_list,</div><div class='add'>+				       __list);</div><div class='add'>+</div><div class='add'>+		while (!list_empty(&amp;rcl-&gt;rcl_referring_calls)) {</div><div class='add'>+			rc = list_first_entry(&amp;rcl-&gt;rcl_referring_calls,</div><div class='add'>+					      struct nfsd4_referring_call,</div><div class='add'>+					      __list);</div><div class='add'>+			list_del(&amp;rc-&gt;__list);</div><div class='add'>+			kfree(rc);</div><div class='add'>+		}</div><div class='add'>+		list_del(&amp;rcl-&gt;__list);</div><div class='add'>+		kfree(rcl);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void nfsd4_cb_prepare(struct rpc_task *task, void *calldata)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd4_callback *cb = calldata;</div><div class='hunk'>@@ -1077,6 +1455,7 @@ static void nfsd4_cb_prepare(struct rpc_task *task, void *calldata)</div><div class='ctx'> 	 * cb_seq_status is only set in decode_cb_sequence4res,</div><div class='ctx'> 	 * and so will remain 1 if an rpc level failure occurs.</div><div class='ctx'> 	 */</div><div class='add'>+	trace_nfsd_cb_rpc_prepare(clp);</div><div class='ctx'> 	cb-&gt;cb_seq_status = 1;</div><div class='ctx'> 	cb-&gt;cb_status = 0;</div><div class='ctx'> 	if (minorversion &amp;&amp; !nfsd41_cb_get_slot(cb, task))</div><div class='hunk'>@@ -1084,31 +1463,17 @@ static void nfsd4_cb_prepare(struct rpc_task *task, void *calldata)</div><div class='ctx'> 	rpc_call_start(task);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/* Returns true if CB_COMPOUND processing should continue */</div><div class='ctx'> static bool nfsd4_cb_sequence_done(struct rpc_task *task, struct nfsd4_callback *cb)</div><div class='ctx'> {</div><div class='del'>-	struct nfs4_client *clp = cb-&gt;cb_clp;</div><div class='del'>-	struct nfsd4_session *session = clp-&gt;cl_cb_session;</div><div class='del'>-	bool ret = true;</div><div class='del'>-</div><div class='del'>-	if (!clp-&gt;cl_minorversion) {</div><div class='del'>-		/*</div><div class='del'>-		 * If the backchannel connection was shut down while this</div><div class='del'>-		 * task was queued, we need to resubmit it after setting up</div><div class='del'>-		 * a new backchannel connection.</div><div class='del'>-		 *</div><div class='del'>-		 * Note that if we lost our callback connection permanently</div><div class='del'>-		 * the submission code will error out, so we don't need to</div><div class='del'>-		 * handle that case here.</div><div class='del'>-		 */</div><div class='del'>-		if (RPC_SIGNALLED(task))</div><div class='del'>-			goto need_restart;</div><div class='del'>-</div><div class='del'>-		return true;</div><div class='del'>-	}</div><div class='add'>+	struct nfsd4_session *session = cb-&gt;cb_clp-&gt;cl_cb_session;</div><div class='add'>+	bool ret = false;</div><div class='ctx'> </div><div class='del'>-	if (!cb-&gt;cb_holds_slot)</div><div class='del'>-		goto need_restart;</div><div class='add'>+	if (cb-&gt;cb_held_slot &lt; 0)</div><div class='add'>+		goto requeue;</div><div class='ctx'> </div><div class='add'>+	/* This is the operation status code for CB_SEQUENCE */</div><div class='add'>+	trace_nfsd_cb_seq_status(task, cb);</div><div class='ctx'> 	switch (cb-&gt;cb_seq_status) {</div><div class='ctx'> 	case 0:</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -1118,53 +1483,64 @@ static bool nfsd4_cb_sequence_done(struct rpc_task *task, struct nfsd4_callback</div><div class='ctx'> 		 * If CB_SEQUENCE returns an error, then the state of the slot</div><div class='ctx'> 		 * (sequence ID, cached reply) MUST NOT change.</div><div class='ctx'> 		 */</div><div class='del'>-		++session-&gt;se_cb_seq_nr;</div><div class='add'>+		++session-&gt;se_cb_seq_nr[cb-&gt;cb_held_slot];</div><div class='add'>+		ret = true;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case -ESERVERFAULT:</div><div class='del'>-		++session-&gt;se_cb_seq_nr;</div><div class='del'>-		fallthrough;</div><div class='add'>+		/*</div><div class='add'>+		 * Call succeeded, but the session, slot index, or slot</div><div class='add'>+		 * sequence number in the response do not match the same</div><div class='add'>+		 * in the server's call. The sequence information is thus</div><div class='add'>+		 * untrustworthy.</div><div class='add'>+		 */</div><div class='add'>+		nfsd4_mark_cb_fault(cb-&gt;cb_clp);</div><div class='add'>+		break;</div><div class='ctx'> 	case 1:</div><div class='add'>+		/*</div><div class='add'>+		 * cb_seq_status remains 1 if an RPC Reply was never</div><div class='add'>+		 * received. NFSD can't know if the client processed</div><div class='add'>+		 * the CB_SEQUENCE operation. Ask the client to send a</div><div class='add'>+		 * DESTROY_SESSION to recover.</div><div class='add'>+		 */</div><div class='add'>+		fallthrough;</div><div class='ctx'> 	case -NFS4ERR_BADSESSION:</div><div class='del'>-		nfsd4_mark_cb_fault(cb-&gt;cb_clp, cb-&gt;cb_seq_status);</div><div class='del'>-		ret = false;</div><div class='del'>-		break;</div><div class='add'>+		nfsd4_mark_cb_fault(cb-&gt;cb_clp);</div><div class='add'>+		goto requeue;</div><div class='ctx'> 	case -NFS4ERR_DELAY:</div><div class='del'>-		if (!rpc_restart_call(task))</div><div class='del'>-			goto out;</div><div class='del'>-</div><div class='add'>+		cb-&gt;cb_seq_status = 1;</div><div class='add'>+		if (RPC_SIGNALLED(task) || !rpc_restart_call(task))</div><div class='add'>+			goto requeue;</div><div class='ctx'> 		rpc_delay(task, 2 * HZ);</div><div class='ctx'> 		return false;</div><div class='add'>+	case -NFS4ERR_SEQ_MISORDERED:</div><div class='ctx'> 	case -NFS4ERR_BADSLOT:</div><div class='add'>+		/*</div><div class='add'>+		 * A SEQ_MISORDERED or BADSLOT error means that the client and</div><div class='add'>+		 * server are out of sync as to the backchannel parameters. Mark</div><div class='add'>+		 * the backchannel faulty and restart the RPC, but leak the slot</div><div class='add'>+		 * so that it's no longer used.</div><div class='add'>+		 */</div><div class='add'>+		nfsd4_mark_cb_fault(cb-&gt;cb_clp);</div><div class='add'>+		cb-&gt;cb_held_slot = -1;</div><div class='ctx'> 		goto retry_nowait;</div><div class='del'>-	case -NFS4ERR_SEQ_MISORDERED:</div><div class='del'>-		if (session-&gt;se_cb_seq_nr != 1) {</div><div class='del'>-			session-&gt;se_cb_seq_nr = 1;</div><div class='del'>-			goto retry_nowait;</div><div class='del'>-		}</div><div class='del'>-		break;</div><div class='ctx'> 	default:</div><div class='del'>-		nfsd4_mark_cb_fault(cb-&gt;cb_clp, cb-&gt;cb_seq_status);</div><div class='del'>-		dprintk("%s: unprocessed error %d\n", __func__,</div><div class='del'>-			cb-&gt;cb_seq_status);</div><div class='add'>+		nfsd4_mark_cb_fault(cb-&gt;cb_clp);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='add'>+	trace_nfsd_cb_free_slot(task, cb);</div><div class='ctx'> 	nfsd41_cb_release_slot(cb);</div><div class='del'>-	dprintk("%s: freed slot, new seqid=%d\n", __func__,</div><div class='del'>-		clp-&gt;cl_cb_session-&gt;se_cb_seq_nr);</div><div class='del'>-</div><div class='del'>-	if (RPC_SIGNALLED(task))</div><div class='del'>-		goto need_restart;</div><div class='del'>-out:</div><div class='ctx'> 	return ret;</div><div class='ctx'> retry_nowait:</div><div class='del'>-	if (rpc_restart_call_prepare(task))</div><div class='del'>-		ret = false;</div><div class='del'>-	goto out;</div><div class='del'>-need_restart:</div><div class='del'>-	if (!test_bit(NFSD4_CLIENT_CB_KILL, &amp;clp-&gt;cl_flags)) {</div><div class='del'>-		task-&gt;tk_status = 0;</div><div class='del'>-		cb-&gt;cb_need_restart = true;</div><div class='add'>+	/*</div><div class='add'>+	 * RPC_SIGNALLED() means that the rpc_client is being torn down and</div><div class='add'>+	 * (possibly) recreated. Requeue the call in that case.</div><div class='add'>+	 */</div><div class='add'>+	if (!RPC_SIGNALLED(task)) {</div><div class='add'>+		if (rpc_restart_call_prepare(task))</div><div class='add'>+			return false;</div><div class='ctx'> 	}</div><div class='add'>+requeue:</div><div class='add'>+	nfsd41_cb_release_slot(cb);</div><div class='add'>+	nfsd4_requeue_cb(task, cb);</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1173,11 +1549,28 @@ static void nfsd4_cb_done(struct rpc_task *task, void *calldata)</div><div class='ctx'> 	struct nfsd4_callback *cb = calldata;</div><div class='ctx'> 	struct nfs4_client *clp = cb-&gt;cb_clp;</div><div class='ctx'> </div><div class='del'>-	if (!nfsd4_cb_sequence_done(task, cb))</div><div class='add'>+	trace_nfsd_cb_rpc_done(clp);</div><div class='add'>+</div><div class='add'>+	if (!clp-&gt;cl_minorversion) {</div><div class='add'>+		/*</div><div class='add'>+		 * If the backchannel connection was shut down while this</div><div class='add'>+		 * task was queued, we need to resubmit it after setting up</div><div class='add'>+		 * a new backchannel connection.</div><div class='add'>+		 *</div><div class='add'>+		 * Note that if we lost our callback connection permanently</div><div class='add'>+		 * the submission code will error out, so we don't need to</div><div class='add'>+		 * handle that case here.</div><div class='add'>+		 */</div><div class='add'>+		if (RPC_SIGNALLED(task))</div><div class='add'>+			nfsd4_requeue_cb(task, cb);</div><div class='add'>+	} else if (!nfsd4_cb_sequence_done(task, cb)) {</div><div class='ctx'> 		return;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (cb-&gt;cb_status) {</div><div class='del'>-		WARN_ON_ONCE(task-&gt;tk_status);</div><div class='add'>+		WARN_ONCE(task-&gt;tk_status,</div><div class='add'>+			  "cb_status=%d tk_status=%d cb_opcode=%d",</div><div class='add'>+			  cb-&gt;cb_status, task-&gt;tk_status, cb-&gt;cb_ops-&gt;opcode);</div><div class='ctx'> 		task-&gt;tk_status = cb-&gt;cb_status;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -1191,7 +1584,7 @@ static void nfsd4_cb_done(struct rpc_task *task, void *calldata)</div><div class='ctx'> 		case -EIO:</div><div class='ctx'> 		case -ETIMEDOUT:</div><div class='ctx'> 		case -EACCES:</div><div class='del'>-			nfsd4_mark_cb_down(clp, task-&gt;tk_status);</div><div class='add'>+			nfsd4_mark_cb_down(clp);</div><div class='ctx'> 		}</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='hunk'>@@ -1203,7 +1596,9 @@ static void nfsd4_cb_release(void *calldata)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd4_callback *cb = calldata;</div><div class='ctx'> </div><div class='del'>-	if (cb-&gt;cb_need_restart)</div><div class='add'>+	trace_nfsd_cb_rpc_release(cb-&gt;cb_clp);</div><div class='add'>+</div><div class='add'>+	if (test_bit(NFSD4_CALLBACK_REQUEUE, &amp;cb-&gt;cb_flags))</div><div class='ctx'> 		nfsd4_queue_cb(cb);</div><div class='ctx'> 	else</div><div class='ctx'> 		nfsd41_destroy_cb(cb);</div><div class='hunk'>@@ -1216,19 +1611,6 @@ static const struct rpc_call_ops nfsd4_cb_ops = {</div><div class='ctx'> 	.rpc_release = nfsd4_cb_release,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-int nfsd4_create_callback_queue(void)</div><div class='del'>-{</div><div class='del'>-	callback_wq = alloc_ordered_workqueue("nfsd4_callbacks", 0);</div><div class='del'>-	if (!callback_wq)</div><div class='del'>-		return -ENOMEM;</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void nfsd4_destroy_callback_queue(void)</div><div class='del'>-{</div><div class='del'>-	destroy_workqueue(callback_wq);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /* must be called under the state lock */</div><div class='ctx'> void nfsd4_shutdown_callback(struct nfs4_client *clp)</div><div class='ctx'> {</div><div class='hunk'>@@ -1242,16 +1624,17 @@ void nfsd4_shutdown_callback(struct nfs4_client *clp)</div><div class='ctx'> 	 * client, destroy the rpc client, and stop:</div><div class='ctx'> 	 */</div><div class='ctx'> 	nfsd4_run_cb(&amp;clp-&gt;cl_cb_null);</div><div class='del'>-	flush_workqueue(callback_wq);</div><div class='add'>+	flush_workqueue(clp-&gt;cl_callback_wq);</div><div class='ctx'> 	nfsd41_cb_inflight_wait_complete(clp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* requires cl_lock: */</div><div class='ctx'> static struct nfsd4_conn * __nfsd4_find_backchannel(struct nfs4_client *clp)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd4_session *s;</div><div class='ctx'> 	struct nfsd4_conn *c;</div><div class='ctx'> </div><div class='add'>+	lockdep_assert_held(&amp;clp-&gt;cl_lock);</div><div class='add'>+</div><div class='ctx'> 	list_for_each_entry(s, &amp;clp-&gt;cl_sessions, se_perclnt) {</div><div class='ctx'> 		list_for_each_entry(c, &amp;s-&gt;se_conns, cn_persession) {</div><div class='ctx'> 			if (c-&gt;cn_flags &amp; NFS4_CDFC4_BACK)</div><div class='hunk'>@@ -1263,9 +1646,9 @@ static struct nfsd4_conn * __nfsd4_find_backchannel(struct nfs4_client *clp)</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Note there isn't a lot of locking in this code; instead we depend on</div><div class='del'>- * the fact that it is run from the callback_wq, which won't run two</div><div class='del'>- * work items at once.  So, for example, callback_wq handles all access</div><div class='del'>- * of cl_cb_client and all calls to rpc_create or rpc_shutdown_client.</div><div class='add'>+ * the fact that it is run from clp-&gt;cl_callback_wq, which won't run two</div><div class='add'>+ * work items at once.  So, for example, clp-&gt;cl_callback_wq handles all</div><div class='add'>+ * access of cl_cb_client and all calls to rpc_create or rpc_shutdown_client.</div><div class='ctx'>  */</div><div class='ctx'> static void nfsd4_process_cb_update(struct nfsd4_callback *cb)</div><div class='ctx'> {</div><div class='hunk'>@@ -1275,11 +1658,14 @@ static void nfsd4_process_cb_update(struct nfsd4_callback *cb)</div><div class='ctx'> 	struct nfsd4_conn *c;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='add'>+	trace_nfsd_cb_bc_update(clp, cb);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * This is either an update, or the client dying; in either case,</div><div class='ctx'> 	 * kill the old client:</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (clp-&gt;cl_cb_client) {</div><div class='add'>+		trace_nfsd_cb_bc_shutdown(clp, cb);</div><div class='ctx'> 		rpc_shutdown_client(clp-&gt;cl_cb_client);</div><div class='ctx'> 		clp-&gt;cl_cb_client = NULL;</div><div class='ctx'> 		put_cred(clp-&gt;cl_cb_cred);</div><div class='hunk'>@@ -1291,13 +1677,15 @@ static void nfsd4_process_cb_update(struct nfsd4_callback *cb)</div><div class='ctx'> 	}</div><div class='ctx'> 	if (test_bit(NFSD4_CLIENT_CB_KILL, &amp;clp-&gt;cl_flags))</div><div class='ctx'> 		return;</div><div class='add'>+</div><div class='ctx'> 	spin_lock(&amp;clp-&gt;cl_lock);</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Only serialized callback code is allowed to clear these</div><div class='ctx'> 	 * flags; main nfsd code can only set them:</div><div class='ctx'> 	 */</div><div class='del'>-	BUG_ON(!(clp-&gt;cl_flags &amp; NFSD4_CLIENT_CB_FLAG_MASK));</div><div class='add'>+	WARN_ON(!(clp-&gt;cl_flags &amp; NFSD4_CLIENT_CB_FLAG_MASK));</div><div class='ctx'> 	clear_bit(NFSD4_CLIENT_CB_UPDATE, &amp;clp-&gt;cl_flags);</div><div class='add'>+</div><div class='ctx'> 	memcpy(&amp;conn, &amp;cb-&gt;cb_clp-&gt;cl_cb_conn, sizeof(struct nfs4_cb_conn));</div><div class='ctx'> 	c = __nfsd4_find_backchannel(clp);</div><div class='ctx'> 	if (c) {</div><div class='hunk'>@@ -1309,7 +1697,7 @@ static void nfsd4_process_cb_update(struct nfsd4_callback *cb)</div><div class='ctx'> </div><div class='ctx'> 	err = setup_callback_client(clp, &amp;conn, ses);</div><div class='ctx'> 	if (err) {</div><div class='del'>-		nfsd4_mark_cb_down(clp, err);</div><div class='add'>+		nfsd4_mark_cb_down(clp);</div><div class='ctx'> 		if (c)</div><div class='ctx'> 			svc_xprt_put(c-&gt;cn_xprt);</div><div class='ctx'> 		return;</div><div class='hunk'>@@ -1323,21 +1711,19 @@ nfsd4_run_cb_work(struct work_struct *work)</div><div class='ctx'> 		container_of(work, struct nfsd4_callback, cb_work);</div><div class='ctx'> 	struct nfs4_client *clp = cb-&gt;cb_clp;</div><div class='ctx'> 	struct rpc_clnt *clnt;</div><div class='del'>-	int flags;</div><div class='add'>+	int flags, ret;</div><div class='ctx'> </div><div class='del'>-	if (cb-&gt;cb_need_restart) {</div><div class='del'>-		cb-&gt;cb_need_restart = false;</div><div class='del'>-	} else {</div><div class='del'>-		if (cb-&gt;cb_ops &amp;&amp; cb-&gt;cb_ops-&gt;prepare)</div><div class='del'>-			cb-&gt;cb_ops-&gt;prepare(cb);</div><div class='del'>-	}</div><div class='add'>+	trace_nfsd_cb_start(clp);</div><div class='ctx'> </div><div class='ctx'> 	if (clp-&gt;cl_flags &amp; NFSD4_CLIENT_CB_FLAG_MASK)</div><div class='ctx'> 		nfsd4_process_cb_update(cb);</div><div class='ctx'> </div><div class='ctx'> 	clnt = clp-&gt;cl_cb_client;</div><div class='del'>-	if (!clnt) {</div><div class='del'>-		/* Callback channel broken, or client killed; give up: */</div><div class='add'>+	if (!clnt || clp-&gt;cl_state == NFSD4_COURTESY) {</div><div class='add'>+		/*</div><div class='add'>+		 * Callback channel broken, client killed or</div><div class='add'>+		 * nfs4_client in courtesy state; give up.</div><div class='add'>+		 */</div><div class='ctx'> 		nfsd41_destroy_cb(cb);</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -1351,10 +1737,19 @@ nfsd4_run_cb_work(struct work_struct *work)</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (!test_and_clear_bit(NFSD4_CALLBACK_REQUEUE, &amp;cb-&gt;cb_flags)) {</div><div class='add'>+		if (cb-&gt;cb_ops &amp;&amp; cb-&gt;cb_ops-&gt;prepare)</div><div class='add'>+			cb-&gt;cb_ops-&gt;prepare(cb);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	cb-&gt;cb_msg.rpc_cred = clp-&gt;cl_cb_cred;</div><div class='ctx'> 	flags = clp-&gt;cl_minorversion ? RPC_TASK_NOCONNECT : RPC_TASK_SOFTCONN;</div><div class='del'>-	rpc_call_async(clnt, &amp;cb-&gt;cb_msg, RPC_TASK_SOFT | flags,</div><div class='del'>-			cb-&gt;cb_ops ? &amp;nfsd4_cb_ops : &amp;nfsd4_cb_probe_ops, cb);</div><div class='add'>+	ret = rpc_call_async(clnt, &amp;cb-&gt;cb_msg, RPC_TASK_SOFT | flags,</div><div class='add'>+			     cb-&gt;cb_ops ? &amp;nfsd4_cb_ops : &amp;nfsd4_cb_probe_ops, cb);</div><div class='add'>+	if (ret != 0) {</div><div class='add'>+		set_bit(NFSD4_CALLBACK_REQUEUE, &amp;cb-&gt;cb_flags);</div><div class='add'>+		nfsd4_queue_cb(cb);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void nfsd4_init_cb(struct nfsd4_callback *cb, struct nfs4_client *clp,</div><div class='hunk'>@@ -1364,19 +1759,30 @@ void nfsd4_init_cb(struct nfsd4_callback *cb, struct nfs4_client *clp,</div><div class='ctx'> 	cb-&gt;cb_msg.rpc_proc = &amp;nfs4_cb_procedures[op];</div><div class='ctx'> 	cb-&gt;cb_msg.rpc_argp = cb;</div><div class='ctx'> 	cb-&gt;cb_msg.rpc_resp = cb;</div><div class='add'>+	cb-&gt;cb_flags = 0;</div><div class='ctx'> 	cb-&gt;cb_ops = ops;</div><div class='ctx'> 	INIT_WORK(&amp;cb-&gt;cb_work, nfsd4_run_cb_work);</div><div class='del'>-	cb-&gt;cb_seq_status = 1;</div><div class='ctx'> 	cb-&gt;cb_status = 0;</div><div class='del'>-	cb-&gt;cb_need_restart = false;</div><div class='del'>-	cb-&gt;cb_holds_slot = false;</div><div class='add'>+	cb-&gt;cb_held_slot = -1;</div><div class='add'>+	cb-&gt;cb_nr_referring_call_list = 0;</div><div class='add'>+	INIT_LIST_HEAD(&amp;cb-&gt;cb_referring_call_list);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void nfsd4_run_cb(struct nfsd4_callback *cb)</div><div class='add'>+/**</div><div class='add'>+ * nfsd4_run_cb - queue up a callback job to run</div><div class='add'>+ * @cb: callback to queue</div><div class='add'>+ *</div><div class='add'>+ * Kick off a callback to do its thing. Returns false if it was already</div><div class='add'>+ * on a queue, true otherwise.</div><div class='add'>+ */</div><div class='add'>+bool nfsd4_run_cb(struct nfsd4_callback *cb)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_client *clp = cb-&gt;cb_clp;</div><div class='add'>+	bool queued;</div><div class='ctx'> </div><div class='ctx'> 	nfsd41_cb_inflight_begin(clp);</div><div class='del'>-	if (!nfsd4_queue_cb(cb))</div><div class='add'>+	queued = nfsd4_queue_cb(cb);</div><div class='add'>+	if (!queued)</div><div class='ctx'> 		nfsd41_cb_inflight_end(clp);</div><div class='add'>+	return queued;</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/nfsd/nfs4idmap.c b/fs/nfsd/nfs4idmap.c<br/>index f92161ce1f97..8cca1329f348 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfs4idmap.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfs4idmap.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfs4idmap.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/nfs4idmap.c</a></div><div class='hunk'>@@ -41,6 +41,7 @@</div><div class='ctx'> #include "idmap.h"</div><div class='ctx'> #include "nfsd.h"</div><div class='ctx'> #include "netns.h"</div><div class='add'>+#include "vfs.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Turn off idmapping when using AUTH_SYS.</div><div class='hunk'>@@ -82,8 +83,8 @@ ent_init(struct cache_head *cnew, struct cache_head *citm)</div><div class='ctx'> 	new-&gt;id = itm-&gt;id;</div><div class='ctx'> 	new-&gt;type = itm-&gt;type;</div><div class='ctx'> </div><div class='del'>-	strlcpy(new-&gt;name, itm-&gt;name, sizeof(new-&gt;name));</div><div class='del'>-	strlcpy(new-&gt;authname, itm-&gt;authname, sizeof(new-&gt;authname));</div><div class='add'>+	strscpy(new-&gt;name, itm-&gt;name, sizeof(new-&gt;name));</div><div class='add'>+	strscpy(new-&gt;authname, itm-&gt;authname, sizeof(new-&gt;authname));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='hunk'>@@ -239,8 +240,8 @@ idtoname_parse(struct cache_detail *cd, char *buf, int buflen)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	/* expiry */</div><div class='del'>-	ent.h.expiry_time = get_expiry(&amp;buf);</div><div class='del'>-	if (ent.h.expiry_time == 0)</div><div class='add'>+	error = get_expiry(&amp;buf, &amp;ent.h.expiry_time);</div><div class='add'>+	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	error = -ENOMEM;</div><div class='hunk'>@@ -407,8 +408,8 @@ nametoid_parse(struct cache_detail *cd, char *buf, int buflen)</div><div class='ctx'> 	memcpy(ent.name, buf1, sizeof(ent.name));</div><div class='ctx'> </div><div class='ctx'> 	/* expiry */</div><div class='del'>-	ent.h.expiry_time = get_expiry(&amp;buf);</div><div class='del'>-	if (ent.h.expiry_time == 0)</div><div class='add'>+	error = get_expiry(&amp;buf, &amp;ent.h.expiry_time);</div><div class='add'>+	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	/* ID */</div><div class='hunk'>@@ -548,7 +549,7 @@ idmap_name_to_id(struct svc_rqst *rqstp, int type, const char *name, u32 namelen</div><div class='ctx'> 		return nfserr_badowner;</div><div class='ctx'> 	memcpy(key.name, name, namelen);</div><div class='ctx'> 	key.name[namelen] = '\0';</div><div class='del'>-	strlcpy(key.authname, rqst_authname(rqstp), sizeof(key.authname));</div><div class='add'>+	strscpy(key.authname, rqst_authname(rqstp), sizeof(key.authname));</div><div class='ctx'> 	ret = idmap_lookup(rqstp, nametoid_lookup, &amp;key, nn-&gt;nametoid_cache, &amp;item);</div><div class='ctx'> 	if (ret == -ENOENT)</div><div class='ctx'> 		return nfserr_badowner;</div><div class='hunk'>@@ -580,11 +581,12 @@ static __be32 idmap_id_to_name(struct xdr_stream *xdr,</div><div class='ctx'> 		.id = id,</div><div class='ctx'> 		.type = type,</div><div class='ctx'> 	};</div><div class='add'>+	__be32 status = nfs_ok;</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> 	int ret;</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(SVC_NET(rqstp), nfsd_net_id);</div><div class='ctx'> </div><div class='del'>-	strlcpy(key.authname, rqst_authname(rqstp), sizeof(key.authname));</div><div class='add'>+	strscpy(key.authname, rqst_authname(rqstp), sizeof(key.authname));</div><div class='ctx'> 	ret = idmap_lookup(rqstp, idtoname_lookup, &amp;key, nn-&gt;idtoname_cache, &amp;item);</div><div class='ctx'> 	if (ret == -ENOENT)</div><div class='ctx'> 		return encode_ascii_id(xdr, id);</div><div class='hunk'>@@ -592,12 +594,16 @@ static __be32 idmap_id_to_name(struct xdr_stream *xdr,</div><div class='ctx'> 		return nfserrno(ret);</div><div class='ctx'> 	ret = strlen(item-&gt;name);</div><div class='ctx'> 	WARN_ON_ONCE(ret &gt; IDMAP_NAMESZ);</div><div class='add'>+</div><div class='ctx'> 	p = xdr_reserve_space(xdr, ret + 4);</div><div class='del'>-	if (!p)</div><div class='del'>-		return nfserr_resource;</div><div class='del'>-	p = xdr_encode_opaque(p, item-&gt;name, ret);</div><div class='add'>+	if (unlikely(!p)) {</div><div class='add'>+		status = nfserr_resource;</div><div class='add'>+		goto out_put;</div><div class='add'>+	}</div><div class='add'>+	xdr_encode_opaque(p, item-&gt;name, ret);</div><div class='add'>+out_put:</div><div class='ctx'> 	cache_put(&amp;item-&gt;h, nn-&gt;idtoname_cache);</div><div class='del'>-	return 0;</div><div class='add'>+	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static bool</div><div class='head'>diff --git a/fs/nfsd/nfs4layouts.c b/fs/nfsd/nfs4layouts.c<br/>index 6d1b5bb051c5..683bd1130afe 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfs4layouts.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfs4layouts.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfs4layouts.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/nfs4layouts.c</a></div><div class='hunk'>@@ -25,7 +25,7 @@ static struct kmem_cache *nfs4_layout_cache;</div><div class='ctx'> static struct kmem_cache *nfs4_layout_stateid_cache;</div><div class='ctx'> </div><div class='ctx'> static const struct nfsd4_callback_ops nfsd4_cb_layout_ops;</div><div class='del'>-static const struct lock_manager_operations nfsd4_layouts_lm_ops;</div><div class='add'>+static const struct lease_manager_operations nfsd4_layouts_lm_ops;</div><div class='ctx'> </div><div class='ctx'> const struct nfsd4_layout_ops *nfsd4_layout_ops[LAYOUT_TYPE_MAX] =  {</div><div class='ctx'> #ifdef CONFIG_NFSD_FLEXFILELAYOUT</div><div class='hunk'>@@ -65,7 +65,7 @@ nfsd4_alloc_devid_map(const struct svc_fh *fhp)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='ctx'> 	map-&gt;fsid_type = fh-&gt;fh_fsid_type;</div><div class='del'>-	memcpy(&amp;map-&gt;fsid, fh-&gt;fh_fsid, fsid_len);</div><div class='add'>+	memcpy(&amp;map-&gt;fsid, fh_fsid(fh), fsid_len);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;nfsd_devid_lock);</div><div class='ctx'> 	if (fhp-&gt;fh_export-&gt;ex_devid_map)</div><div class='hunk'>@@ -75,7 +75,7 @@ nfsd4_alloc_devid_map(const struct svc_fh *fhp)</div><div class='ctx'> 		list_for_each_entry(old, &amp;nfsd_devid_hash[i], hash) {</div><div class='ctx'> 			if (old-&gt;fsid_type != fh-&gt;fh_fsid_type)</div><div class='ctx'> 				continue;</div><div class='del'>-			if (memcmp(old-&gt;fsid, fh-&gt;fh_fsid,</div><div class='add'>+			if (memcmp(old-&gt;fsid, fh_fsid(fh),</div><div class='ctx'> 					key_len(old-&gt;fsid_type)))</div><div class='ctx'> 				continue;</div><div class='ctx'> </div><div class='hunk'>@@ -120,7 +120,6 @@ nfsd4_set_deviceid(struct nfsd4_deviceid *id, const struct svc_fh *fhp,</div><div class='ctx'> </div><div class='ctx'> 	id-&gt;fsid_idx = fhp-&gt;fh_export-&gt;ex_devid_map-&gt;idx;</div><div class='ctx'> 	id-&gt;generation = device_generation;</div><div class='del'>-	id-&gt;pad = 0;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -152,6 +151,23 @@ void nfsd4_setup_layout_type(struct svc_export *exp)</div><div class='ctx'> #endif</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void nfsd4_close_layout(struct nfs4_layout_stateid *ls)</div><div class='add'>+{</div><div class='add'>+	struct nfsd_file *fl;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;ls-&gt;ls_stid.sc_file-&gt;fi_lock);</div><div class='add'>+	fl = ls-&gt;ls_file;</div><div class='add'>+	ls-&gt;ls_file = NULL;</div><div class='add'>+	spin_unlock(&amp;ls-&gt;ls_stid.sc_file-&gt;fi_lock);</div><div class='add'>+</div><div class='add'>+	if (fl) {</div><div class='add'>+		if (!nfsd4_layout_ops[ls-&gt;ls_layout_type]-&gt;disable_recalls)</div><div class='add'>+			kernel_setlease(fl-&gt;nf_file, F_UNLCK, NULL,</div><div class='add'>+					(void **)&amp;ls);</div><div class='add'>+		nfsd_file_put(fl);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void</div><div class='ctx'> nfsd4_free_layout_stateid(struct nfs4_stid *stid)</div><div class='ctx'> {</div><div class='hunk'>@@ -169,9 +185,7 @@ nfsd4_free_layout_stateid(struct nfs4_stid *stid)</div><div class='ctx'> 	list_del_init(&amp;ls-&gt;ls_perfile);</div><div class='ctx'> 	spin_unlock(&amp;fp-&gt;fi_lock);</div><div class='ctx'> </div><div class='del'>-	if (!nfsd4_layout_ops[ls-&gt;ls_layout_type]-&gt;disable_recalls)</div><div class='del'>-		vfs_setlease(ls-&gt;ls_file-&gt;nf_file, F_UNLCK, NULL, (void **)&amp;ls);</div><div class='del'>-	nfsd_file_put(ls-&gt;ls_file);</div><div class='add'>+	nfsd4_close_layout(ls);</div><div class='ctx'> </div><div class='ctx'> 	if (ls-&gt;ls_recalled)</div><div class='ctx'> 		atomic_dec(&amp;ls-&gt;ls_stid.sc_file-&gt;fi_lo_recalls);</div><div class='hunk'>@@ -182,27 +196,26 @@ nfsd4_free_layout_stateid(struct nfs4_stid *stid)</div><div class='ctx'> static int</div><div class='ctx'> nfsd4_layout_setlease(struct nfs4_layout_stateid *ls)</div><div class='ctx'> {</div><div class='del'>-	struct file_lock *fl;</div><div class='add'>+	struct file_lease *fl;</div><div class='ctx'> 	int status;</div><div class='ctx'> </div><div class='ctx'> 	if (nfsd4_layout_ops[ls-&gt;ls_layout_type]-&gt;disable_recalls)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	fl = locks_alloc_lock();</div><div class='add'>+	fl = locks_alloc_lease();</div><div class='ctx'> 	if (!fl)</div><div class='ctx'> 		return -ENOMEM;</div><div class='del'>-	locks_init_lock(fl);</div><div class='add'>+	locks_init_lease(fl);</div><div class='ctx'> 	fl-&gt;fl_lmops = &amp;nfsd4_layouts_lm_ops;</div><div class='del'>-	fl-&gt;fl_flags = FL_LAYOUT;</div><div class='del'>-	fl-&gt;fl_type = F_RDLCK;</div><div class='del'>-	fl-&gt;fl_end = OFFSET_MAX;</div><div class='del'>-	fl-&gt;fl_owner = ls;</div><div class='del'>-	fl-&gt;fl_pid = current-&gt;tgid;</div><div class='del'>-	fl-&gt;fl_file = ls-&gt;ls_file-&gt;nf_file;</div><div class='del'>-</div><div class='del'>-	status = vfs_setlease(fl-&gt;fl_file, fl-&gt;fl_type, &amp;fl, NULL);</div><div class='add'>+	fl-&gt;c.flc_flags = FL_LAYOUT;</div><div class='add'>+	fl-&gt;c.flc_type = F_RDLCK;</div><div class='add'>+	fl-&gt;c.flc_owner = ls;</div><div class='add'>+	fl-&gt;c.flc_pid = current-&gt;tgid;</div><div class='add'>+	fl-&gt;c.flc_file = ls-&gt;ls_file-&gt;nf_file;</div><div class='add'>+</div><div class='add'>+	status = kernel_setlease(fl-&gt;c.flc_file, fl-&gt;c.flc_type, &amp;fl, NULL);</div><div class='ctx'> 	if (status) {</div><div class='del'>-		locks_free_lock(fl);</div><div class='add'>+		locks_free_lease(fl);</div><div class='ctx'> 		return status;</div><div class='ctx'> 	}</div><div class='ctx'> 	BUG_ON(fl != NULL);</div><div class='hunk'>@@ -236,7 +249,7 @@ nfsd4_alloc_layout_stateid(struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	nfsd4_init_cb(&amp;ls-&gt;ls_recall, clp, &amp;nfsd4_cb_layout_ops,</div><div class='ctx'> 			NFSPROC4_CLNT_CB_LAYOUT);</div><div class='ctx'> </div><div class='del'>-	if (parent-&gt;sc_type == NFS4_DELEG_STID)</div><div class='add'>+	if (parent-&gt;sc_type == SC_TYPE_DELEG)</div><div class='ctx'> 		ls-&gt;ls_file = nfsd_file_get(fp-&gt;fi_deleg_file);</div><div class='ctx'> 	else</div><div class='ctx'> 		ls-&gt;ls_file = find_any_file(fp);</div><div class='hunk'>@@ -250,7 +263,7 @@ nfsd4_alloc_layout_stateid(struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;clp-&gt;cl_lock);</div><div class='del'>-	stp-&gt;sc_type = NFS4_LAYOUT_STID;</div><div class='add'>+	stp-&gt;sc_type = SC_TYPE_LAYOUT;</div><div class='ctx'> 	list_add(&amp;ls-&gt;ls_perclnt, &amp;clp-&gt;cl_lo_states);</div><div class='ctx'> 	spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='ctx'> </div><div class='hunk'>@@ -269,13 +282,13 @@ nfsd4_preprocess_layout_stateid(struct svc_rqst *rqstp,</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_layout_stateid *ls;</div><div class='ctx'> 	struct nfs4_stid *stid;</div><div class='del'>-	unsigned char typemask = NFS4_LAYOUT_STID;</div><div class='add'>+	unsigned short typemask = SC_TYPE_LAYOUT;</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> </div><div class='ctx'> 	if (create)</div><div class='del'>-		typemask |= (NFS4_OPEN_STID | NFS4_LOCK_STID | NFS4_DELEG_STID);</div><div class='add'>+		typemask |= (SC_TYPE_OPEN | SC_TYPE_LOCK | SC_TYPE_DELEG);</div><div class='ctx'> </div><div class='del'>-	status = nfsd4_lookup_stateid(cstate, stateid, typemask, &amp;stid,</div><div class='add'>+	status = nfsd4_lookup_stateid(cstate, stateid, typemask, 0, &amp;stid,</div><div class='ctx'> 			net_generic(SVC_NET(rqstp), nfsd_net_id));</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -286,7 +299,7 @@ nfsd4_preprocess_layout_stateid(struct svc_rqst *rqstp,</div><div class='ctx'> 		goto out_put_stid;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (stid-&gt;sc_type != NFS4_LAYOUT_STID) {</div><div class='add'>+	if (stid-&gt;sc_type != SC_TYPE_LAYOUT) {</div><div class='ctx'> 		ls = nfsd4_alloc_layout_stateid(cstate, stid, layout_type);</div><div class='ctx'> 		nfs4_put_stid(stid);</div><div class='ctx'> </div><div class='hunk'>@@ -323,16 +336,17 @@ nfsd4_recall_file_layout(struct nfs4_layout_stateid *ls)</div><div class='ctx'> 	if (ls-&gt;ls_recalled)</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='del'>-	ls-&gt;ls_recalled = true;</div><div class='del'>-	atomic_inc(&amp;ls-&gt;ls_stid.sc_file-&gt;fi_lo_recalls);</div><div class='ctx'> 	if (list_empty(&amp;ls-&gt;ls_layouts))</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='add'>+	ls-&gt;ls_recalled = true;</div><div class='add'>+	atomic_inc(&amp;ls-&gt;ls_stid.sc_file-&gt;fi_lo_recalls);</div><div class='ctx'> 	trace_nfsd_layout_recall(&amp;ls-&gt;ls_stid.sc_stateid);</div><div class='ctx'> </div><div class='del'>-	refcount_inc(&amp;ls-&gt;ls_stid.sc_count);</div><div class='del'>-	nfsd4_run_cb(&amp;ls-&gt;ls_recall);</div><div class='del'>-</div><div class='add'>+	if (!test_and_set_bit(NFSD4_CALLBACK_RUNNING, &amp;ls-&gt;ls_recall.cb_flags)) {</div><div class='add'>+		refcount_inc(&amp;ls-&gt;ls_stid.sc_count);</div><div class='add'>+		nfsd4_run_cb(&amp;ls-&gt;ls_recall);</div><div class='add'>+	}</div><div class='ctx'> out_unlock:</div><div class='ctx'> 	spin_unlock(&amp;ls-&gt;ls_lock);</div><div class='ctx'> }</div><div class='hunk'>@@ -422,7 +436,7 @@ nfsd4_insert_layout(struct nfsd4_layoutget *lgp, struct nfs4_layout_stateid *ls)</div><div class='ctx'> 	new = kmem_cache_alloc(nfs4_layout_cache, GFP_KERNEL);</div><div class='ctx'> 	if (!new)</div><div class='ctx'> 		return nfserr_jukebox;</div><div class='del'>-	memcpy(&amp;new-&gt;lo_seg, seg, sizeof(lp-&gt;lo_seg));</div><div class='add'>+	memcpy(&amp;new-&gt;lo_seg, seg, sizeof(new-&gt;lo_seg));</div><div class='ctx'> 	new-&gt;lo_state = ls;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;fp-&gt;fi_lock);</div><div class='hunk'>@@ -515,11 +529,11 @@ nfsd4_return_file_layouts(struct svc_rqst *rqstp,</div><div class='ctx'> 	if (!list_empty(&amp;ls-&gt;ls_layouts)) {</div><div class='ctx'> 		if (found)</div><div class='ctx'> 			nfs4_inc_and_copy_stateid(&amp;lrp-&gt;lr_sid, &amp;ls-&gt;ls_stid);</div><div class='del'>-		lrp-&gt;lrs_present = 1;</div><div class='add'>+		lrp-&gt;lrs_present = true;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		trace_nfsd_layoutstate_unhash(&amp;ls-&gt;ls_stid.sc_stateid);</div><div class='del'>-		nfs4_unhash_stid(&amp;ls-&gt;ls_stid);</div><div class='del'>-		lrp-&gt;lrs_present = 0;</div><div class='add'>+		ls-&gt;ls_stid.sc_status |= SC_STATUS_CLOSED;</div><div class='add'>+		lrp-&gt;lrs_present = false;</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;ls-&gt;ls_lock);</div><div class='ctx'> </div><div class='hunk'>@@ -539,7 +553,7 @@ nfsd4_return_client_layouts(struct svc_rqst *rqstp,</div><div class='ctx'> 	struct nfs4_layout *lp, *t;</div><div class='ctx'> 	LIST_HEAD(reaplist);</div><div class='ctx'> </div><div class='del'>-	lrp-&gt;lrs_present = 0;</div><div class='add'>+	lrp-&gt;lrs_present = false;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;clp-&gt;cl_lock);</div><div class='ctx'> 	list_for_each_entry_safe(ls, n, &amp;clp-&gt;cl_lo_states, ls_perclnt) {</div><div class='hunk'>@@ -605,7 +619,7 @@ nfsd4_return_all_file_layouts(struct nfs4_client *clp, struct nfs4_file *fp)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='del'>-nfsd4_cb_layout_fail(struct nfs4_layout_stateid *ls)</div><div class='add'>+nfsd4_cb_layout_fail(struct nfs4_layout_stateid *ls, struct nfsd_file *file)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_client *clp = ls-&gt;ls_stid.sc_client;</div><div class='ctx'> 	char addr_str[INET6_ADDRSTRLEN];</div><div class='hunk'>@@ -627,7 +641,7 @@ nfsd4_cb_layout_fail(struct nfs4_layout_stateid *ls)</div><div class='ctx'> </div><div class='ctx'> 	argv[0] = (char *)nfsd_recall_failed;</div><div class='ctx'> 	argv[1] = addr_str;</div><div class='del'>-	argv[2] = ls-&gt;ls_file-&gt;nf_file-&gt;f_path.mnt-&gt;mnt_sb-&gt;s_id;</div><div class='add'>+	argv[2] = file-&gt;nf_file-&gt;f_path.mnt-&gt;mnt_sb-&gt;s_id;</div><div class='ctx'> 	argv[3] = NULL;</div><div class='ctx'> </div><div class='ctx'> 	error = call_usermodehelper(nfsd_recall_failed, argv, envp,</div><div class='hunk'>@@ -657,8 +671,9 @@ nfsd4_cb_layout_done(struct nfsd4_callback *cb, struct rpc_task *task)</div><div class='ctx'> 	struct nfsd_net *nn;</div><div class='ctx'> 	ktime_t now, cutoff;</div><div class='ctx'> 	const struct nfsd4_layout_ops *ops;</div><div class='add'>+	struct nfsd_file *fl;</div><div class='ctx'> </div><div class='del'>-</div><div class='add'>+	trace_nfsd_cb_layout_done(&amp;ls-&gt;ls_stid.sc_stateid, task);</div><div class='ctx'> 	switch (task-&gt;tk_status) {</div><div class='ctx'> 	case 0:</div><div class='ctx'> 	case -NFS4ERR_DELAY:</div><div class='hunk'>@@ -688,12 +703,17 @@ nfsd4_cb_layout_done(struct nfsd4_callback *cb, struct rpc_task *task)</div><div class='ctx'> 		 * Unknown error or non-responding client, we'll need to fence.</div><div class='ctx'> 		 */</div><div class='ctx'> 		trace_nfsd_layout_recall_fail(&amp;ls-&gt;ls_stid.sc_stateid);</div><div class='del'>-</div><div class='del'>-		ops = nfsd4_layout_ops[ls-&gt;ls_layout_type];</div><div class='del'>-		if (ops-&gt;fence_client)</div><div class='del'>-			ops-&gt;fence_client(ls);</div><div class='del'>-		else</div><div class='del'>-			nfsd4_cb_layout_fail(ls);</div><div class='add'>+		rcu_read_lock();</div><div class='add'>+		fl = nfsd_file_get(ls-&gt;ls_file);</div><div class='add'>+		rcu_read_unlock();</div><div class='add'>+		if (fl) {</div><div class='add'>+			ops = nfsd4_layout_ops[ls-&gt;ls_layout_type];</div><div class='add'>+			if (ops-&gt;fence_client)</div><div class='add'>+				ops-&gt;fence_client(ls, fl);</div><div class='add'>+			else</div><div class='add'>+				nfsd4_cb_layout_fail(ls, fl);</div><div class='add'>+			nfsd_file_put(fl);</div><div class='add'>+		}</div><div class='ctx'> 		return 1;</div><div class='ctx'> 	case -NFS4ERR_NOMATCHING_LAYOUT:</div><div class='ctx'> 		trace_nfsd_layout_recall_done(&amp;ls-&gt;ls_stid.sc_stateid);</div><div class='hunk'>@@ -720,10 +740,11 @@ static const struct nfsd4_callback_ops nfsd4_cb_layout_ops = {</div><div class='ctx'> 	.prepare	= nfsd4_cb_layout_prepare,</div><div class='ctx'> 	.done		= nfsd4_cb_layout_done,</div><div class='ctx'> 	.release	= nfsd4_cb_layout_release,</div><div class='add'>+	.opcode		= OP_CB_LAYOUTRECALL,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static bool</div><div class='del'>-nfsd4_layout_lm_break(struct file_lock *fl)</div><div class='add'>+nfsd4_layout_lm_break(struct file_lease *fl)</div><div class='ctx'> {</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We don't want the locks code to timeout the lease for us;</div><div class='hunk'>@@ -731,19 +752,19 @@ nfsd4_layout_lm_break(struct file_lock *fl)</div><div class='ctx'> 	 * in time:</div><div class='ctx'> 	 */</div><div class='ctx'> 	fl-&gt;fl_break_time = 0;</div><div class='del'>-	nfsd4_recall_file_layout(fl-&gt;fl_owner);</div><div class='add'>+	nfsd4_recall_file_layout(fl-&gt;c.flc_owner);</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-nfsd4_layout_lm_change(struct file_lock *onlist, int arg,</div><div class='add'>+nfsd4_layout_lm_change(struct file_lease *onlist, int arg,</div><div class='ctx'> 		struct list_head *dispose)</div><div class='ctx'> {</div><div class='ctx'> 	BUG_ON(!(arg &amp; F_UNLCK));</div><div class='ctx'> 	return lease_modify(onlist, arg, dispose);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static const struct lock_manager_operations nfsd4_layouts_lm_ops = {</div><div class='add'>+static const struct lease_manager_operations nfsd4_layouts_lm_ops = {</div><div class='ctx'> 	.lm_break	= nfsd4_layout_lm_break,</div><div class='ctx'> 	.lm_change	= nfsd4_layout_lm_change,</div><div class='ctx'> };</div><div class='hunk'>@@ -756,13 +777,11 @@ nfsd4_init_pnfs(void)</div><div class='ctx'> 	for (i = 0; i &lt; DEVID_HASH_SIZE; i++)</div><div class='ctx'> 		INIT_LIST_HEAD(&amp;nfsd_devid_hash[i]);</div><div class='ctx'> </div><div class='del'>-	nfs4_layout_cache = kmem_cache_create("nfs4_layout",</div><div class='del'>-			sizeof(struct nfs4_layout), 0, 0, NULL);</div><div class='add'>+	nfs4_layout_cache = KMEM_CACHE(nfs4_layout, 0);</div><div class='ctx'> 	if (!nfs4_layout_cache)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	nfs4_layout_stateid_cache = kmem_cache_create("nfs4_layout_stateid",</div><div class='del'>-			sizeof(struct nfs4_layout_stateid), 0, 0, NULL);</div><div class='add'>+	nfs4_layout_stateid_cache = KMEM_CACHE(nfs4_layout_stateid, 0);</div><div class='ctx'> 	if (!nfs4_layout_stateid_cache) {</div><div class='ctx'> 		kmem_cache_destroy(nfs4_layout_cache);</div><div class='ctx'> 		return -ENOMEM;</div><div class='head'>diff --git a/fs/nfsd/nfs4proc.c b/fs/nfsd/nfs4proc.c<br/>index a36261f89bdf..b74800917583 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfs4proc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfs4proc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfs4proc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/nfs4proc.c</a></div><div class='hunk'>@@ -37,6 +37,8 @@</div><div class='ctx'> #include &lt;linux/falloc.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/kthread.h&gt;</div><div class='add'>+#include &lt;linux/namei.h&gt;</div><div class='add'>+</div><div class='ctx'> #include &lt;linux/sunrpc/addr.h&gt;</div><div class='ctx'> #include &lt;linux/nfs_ssc.h&gt;</div><div class='ctx'> </div><div class='hunk'>@@ -55,6 +57,8 @@ module_param(inter_copy_offload_enable, bool, 0644);</div><div class='ctx'> MODULE_PARM_DESC(inter_copy_offload_enable,</div><div class='ctx'> 		 "Enable inter server to server copy offload. Default: false");</div><div class='ctx'> </div><div class='add'>+static void cleanup_async_copy(struct nfsd4_copy *copy);</div><div class='add'>+</div><div class='ctx'> #ifdef CONFIG_NFSD_V4_2_INTER_SSC</div><div class='ctx'> static int nfsd4_ssc_umount_timeout = 900000;		/* default to 15 mins */</div><div class='ctx'> module_param(nfsd4_ssc_umount_timeout, int, 0644);</div><div class='hunk'>@@ -62,36 +66,6 @@ MODULE_PARM_DESC(nfsd4_ssc_umount_timeout,</div><div class='ctx'> 		"idle msecs before unmount export from source server");</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_NFSD_V4_SECURITY_LABEL</div><div class='del'>-#include &lt;linux/security.h&gt;</div><div class='del'>-</div><div class='del'>-static inline void</div><div class='del'>-nfsd4_security_inode_setsecctx(struct svc_fh *resfh, struct xdr_netobj *label, u32 *bmval)</div><div class='del'>-{</div><div class='del'>-	struct inode *inode = d_inode(resfh-&gt;fh_dentry);</div><div class='del'>-	int status;</div><div class='del'>-</div><div class='del'>-	inode_lock(inode);</div><div class='del'>-	status = security_inode_setsecctx(resfh-&gt;fh_dentry,</div><div class='del'>-		label-&gt;data, label-&gt;len);</div><div class='del'>-	inode_unlock(inode);</div><div class='del'>-</div><div class='del'>-	if (status)</div><div class='del'>-		/*</div><div class='del'>-		 * XXX: We should really fail the whole open, but we may</div><div class='del'>-		 * already have created a new file, so it may be too</div><div class='del'>-		 * late.  For now this seems the least of evils:</div><div class='del'>-		 */</div><div class='del'>-		bmval[2] &amp;= ~FATTR4_WORD2_SECURITY_LABEL;</div><div class='del'>-</div><div class='del'>-	return;</div><div class='del'>-}</div><div class='del'>-#else</div><div class='del'>-static inline void</div><div class='del'>-nfsd4_security_inode_setsecctx(struct svc_fh *resfh, struct xdr_netobj *label, u32 *bmval)</div><div class='del'>-{ }</div><div class='del'>-#endif</div><div class='del'>-</div><div class='ctx'> #define NFSDDBG_FACILITY		NFSDDBG_PROC</div><div class='ctx'> </div><div class='ctx'> static u32 nfsd_attrmask[] = {</div><div class='hunk'>@@ -156,26 +130,6 @@ is_create_with_attrs(struct nfsd4_open *open)</div><div class='ctx'> 		    || open-&gt;op_createmode == NFS4_CREATE_EXCLUSIVE4_1);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * if error occurs when setting the acl, just clear the acl bit</div><div class='del'>- * in the returned attr bitmap.</div><div class='del'>- */</div><div class='del'>-static void</div><div class='del'>-do_set_nfs4_acl(struct svc_rqst *rqstp, struct svc_fh *fhp,</div><div class='del'>-		struct nfs4_acl *acl, u32 *bmval)</div><div class='del'>-{</div><div class='del'>-	__be32 status;</div><div class='del'>-</div><div class='del'>-	status = nfsd4_set_nfs4_acl(rqstp, fhp, acl);</div><div class='del'>-	if (status)</div><div class='del'>-		/*</div><div class='del'>-		 * We should probably fail the whole open at this point,</div><div class='del'>-		 * but we've already created the file, so it's too late;</div><div class='del'>-		 * So this seems the least of evils:</div><div class='del'>-		 */</div><div class='del'>-		bmval[0] &amp;= ~FATTR4_WORD0_ACL;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static inline void</div><div class='ctx'> fh_dup2(struct svc_fh *dst, struct svc_fh *src)</div><div class='ctx'> {</div><div class='hunk'>@@ -189,7 +143,6 @@ fh_dup2(struct svc_fh *dst, struct svc_fh *src)</div><div class='ctx'> static __be32</div><div class='ctx'> do_open_permission(struct svc_rqst *rqstp, struct svc_fh *current_fh, struct nfsd4_open *open, int accmode)</div><div class='ctx'> {</div><div class='del'>-	__be32 status;</div><div class='ctx'> </div><div class='ctx'> 	if (open-&gt;op_truncate &amp;&amp;</div><div class='ctx'> 		!(open-&gt;op_share_access &amp; NFS4_SHARE_ACCESS_WRITE))</div><div class='hunk'>@@ -204,12 +157,10 @@ do_open_permission(struct svc_rqst *rqstp, struct svc_fh *current_fh, struct nfs</div><div class='ctx'> 	if (open-&gt;op_share_deny &amp; NFS4_SHARE_DENY_READ)</div><div class='ctx'> 		accmode |= NFSD_MAY_WRITE;</div><div class='ctx'> </div><div class='del'>-	status = fh_verify(rqstp, current_fh, S_IFREG, accmode);</div><div class='del'>-</div><div class='del'>-	return status;</div><div class='add'>+	return fh_verify(rqstp, current_fh, S_IFREG, accmode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static __be32 nfsd_check_obj_isreg(struct svc_fh *fh)</div><div class='add'>+static __be32 nfsd_check_obj_isreg(struct svc_fh *fh, u32 minor_version)</div><div class='ctx'> {</div><div class='ctx'> 	umode_t mode = d_inode(fh-&gt;fh_dentry)-&gt;i_mode;</div><div class='ctx'> </div><div class='hunk'>@@ -217,14 +168,15 @@ static __be32 nfsd_check_obj_isreg(struct svc_fh *fh)</div><div class='ctx'> 		return nfs_ok;</div><div class='ctx'> 	if (S_ISDIR(mode))</div><div class='ctx'> 		return nfserr_isdir;</div><div class='del'>-	/*</div><div class='del'>-	 * Using err_symlink as our catch-all case may look odd; but</div><div class='del'>-	 * there's no other obvious error for this case in 4.0, and we</div><div class='del'>-	 * happen to know that it will cause the linux v4 client to do</div><div class='del'>-	 * the right thing on attempts to open something other than a</div><div class='del'>-	 * regular file.</div><div class='del'>-	 */</div><div class='del'>-	return nfserr_symlink;</div><div class='add'>+	if (S_ISLNK(mode))</div><div class='add'>+		return nfserr_symlink;</div><div class='add'>+</div><div class='add'>+	/* RFC 7530 - 16.16.6 */</div><div class='add'>+	if (minor_version == 0)</div><div class='add'>+		return nfserr_symlink;</div><div class='add'>+	else</div><div class='add'>+		return nfserr_wrong_type;</div><div class='add'>+</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void nfsd4_set_open_owner_reply_cache(struct nfsd4_compound_state *cstate, struct nfsd4_open *open, struct svc_fh *resfh)</div><div class='hunk'>@@ -235,6 +187,234 @@ static void nfsd4_set_open_owner_reply_cache(struct nfsd4_compound_state *cstate</div><div class='ctx'> 			&amp;resfh-&gt;fh_handle);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline bool nfsd4_create_is_exclusive(int createmode)</div><div class='add'>+{</div><div class='add'>+	return createmode == NFS4_CREATE_EXCLUSIVE ||</div><div class='add'>+		createmode == NFS4_CREATE_EXCLUSIVE4_1;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32</div><div class='add'>+nfsd4_vfs_create(struct svc_fh *fhp, struct dentry *child,</div><div class='add'>+		 struct nfsd4_open *open)</div><div class='add'>+{</div><div class='add'>+	struct file *filp;</div><div class='add'>+	struct path path;</div><div class='add'>+	int oflags;</div><div class='add'>+</div><div class='add'>+	oflags = O_CREAT | O_LARGEFILE;</div><div class='add'>+	switch (open-&gt;op_share_access &amp; NFS4_SHARE_ACCESS_BOTH) {</div><div class='add'>+	case NFS4_SHARE_ACCESS_WRITE:</div><div class='add'>+		oflags |= O_WRONLY;</div><div class='add'>+		break;</div><div class='add'>+	case NFS4_SHARE_ACCESS_BOTH:</div><div class='add'>+		oflags |= O_RDWR;</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		oflags |= O_RDONLY;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	path.mnt = fhp-&gt;fh_export-&gt;ex_path.mnt;</div><div class='add'>+	path.dentry = child;</div><div class='add'>+	filp = dentry_create(&amp;path, oflags, open-&gt;op_iattr.ia_mode,</div><div class='add'>+			     current_cred());</div><div class='add'>+	if (IS_ERR(filp))</div><div class='add'>+		return nfserrno(PTR_ERR(filp));</div><div class='add'>+</div><div class='add'>+	open-&gt;op_filp = filp;</div><div class='add'>+	return nfs_ok;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Implement NFSv4's unchecked, guarded, and exclusive create</div><div class='add'>+ * semantics for regular files. Open state for this new file is</div><div class='add'>+ * subsequently fabricated in nfsd4_process_open2().</div><div class='add'>+ *</div><div class='add'>+ * Upon return, caller must release @fhp and @resfhp.</div><div class='add'>+ */</div><div class='add'>+static __be32</div><div class='add'>+nfsd4_create_file(struct svc_rqst *rqstp, struct svc_fh *fhp,</div><div class='add'>+		  struct svc_fh *resfhp, struct nfsd4_open *open)</div><div class='add'>+{</div><div class='add'>+	struct iattr *iap = &amp;open-&gt;op_iattr;</div><div class='add'>+	struct nfsd_attrs attrs = {</div><div class='add'>+		.na_iattr	= iap,</div><div class='add'>+		.na_seclabel	= &amp;open-&gt;op_label,</div><div class='add'>+	};</div><div class='add'>+	struct dentry *parent, *child;</div><div class='add'>+	__u32 v_mtime, v_atime;</div><div class='add'>+	struct inode *inode;</div><div class='add'>+	__be32 status;</div><div class='add'>+	int host_err;</div><div class='add'>+</div><div class='add'>+	if (isdotent(open-&gt;op_fname, open-&gt;op_fnamelen))</div><div class='add'>+		return nfserr_exist;</div><div class='add'>+	if (!(iap-&gt;ia_valid &amp; ATTR_MODE))</div><div class='add'>+		iap-&gt;ia_mode = 0;</div><div class='add'>+</div><div class='add'>+	status = fh_verify(rqstp, fhp, S_IFDIR, NFSD_MAY_EXEC);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	parent = fhp-&gt;fh_dentry;</div><div class='add'>+	inode = d_inode(parent);</div><div class='add'>+</div><div class='add'>+	host_err = fh_want_write(fhp);</div><div class='add'>+	if (host_err)</div><div class='add'>+		return nfserrno(host_err);</div><div class='add'>+</div><div class='add'>+	if (is_create_with_attrs(open))</div><div class='add'>+		nfsd4_acl_to_attr(NF4REG, open-&gt;op_acl, &amp;attrs);</div><div class='add'>+</div><div class='add'>+	child = start_creating(&amp;nop_mnt_idmap, parent,</div><div class='add'>+			       &amp;QSTR_LEN(open-&gt;op_fname, open-&gt;op_fnamelen));</div><div class='add'>+	if (IS_ERR(child)) {</div><div class='add'>+		status = nfserrno(PTR_ERR(child));</div><div class='add'>+		goto out_write;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (d_really_is_negative(child)) {</div><div class='add'>+		status = fh_verify(rqstp, fhp, S_IFDIR, NFSD_MAY_CREATE);</div><div class='add'>+		if (status != nfs_ok)</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	status = fh_compose(resfhp, fhp-&gt;fh_export, child, fhp);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	v_mtime = 0;</div><div class='add'>+	v_atime = 0;</div><div class='add'>+	if (nfsd4_create_is_exclusive(open-&gt;op_createmode)) {</div><div class='add'>+		u32 *verifier = (u32 *)open-&gt;op_verf.data;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Solaris 7 gets confused (bugid 4218508) if these have</div><div class='add'>+		 * the high bit set, as do xfs filesystems without the</div><div class='add'>+		 * "bigtime" feature. So just clear the high bits. If this</div><div class='add'>+		 * is ever changed to use different attrs for storing the</div><div class='add'>+		 * verifier, then do_open_lookup() will also need to be</div><div class='add'>+		 * fixed accordingly.</div><div class='add'>+		 */</div><div class='add'>+		v_mtime = verifier[0] &amp; 0x7fffffff;</div><div class='add'>+		v_atime = verifier[1] &amp; 0x7fffffff;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (d_really_is_positive(child)) {</div><div class='add'>+		/* NFSv4 protocol requires change attributes even though</div><div class='add'>+		 * no change happened.</div><div class='add'>+		 */</div><div class='add'>+		status = fh_fill_both_attrs(fhp);</div><div class='add'>+		if (status != nfs_ok)</div><div class='add'>+			goto out;</div><div class='add'>+</div><div class='add'>+		switch (open-&gt;op_createmode) {</div><div class='add'>+		case NFS4_CREATE_UNCHECKED:</div><div class='add'>+			if (!d_is_reg(child))</div><div class='add'>+				break;</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * In NFSv4, we don't want to truncate the file</div><div class='add'>+			 * now. This would be wrong if the OPEN fails for</div><div class='add'>+			 * some other reason. Furthermore, if the size is</div><div class='add'>+			 * nonzero, we should ignore it according to spec!</div><div class='add'>+			 */</div><div class='add'>+			open-&gt;op_truncate = (iap-&gt;ia_valid &amp; ATTR_SIZE) &amp;&amp;</div><div class='add'>+						!iap-&gt;ia_size;</div><div class='add'>+			break;</div><div class='add'>+		case NFS4_CREATE_GUARDED:</div><div class='add'>+			status = nfserr_exist;</div><div class='add'>+			break;</div><div class='add'>+		case NFS4_CREATE_EXCLUSIVE:</div><div class='add'>+			if (inode_get_mtime_sec(d_inode(child)) == v_mtime &amp;&amp;</div><div class='add'>+			    inode_get_atime_sec(d_inode(child)) == v_atime &amp;&amp;</div><div class='add'>+			    d_inode(child)-&gt;i_size == 0) {</div><div class='add'>+				open-&gt;op_created = true;</div><div class='add'>+				break;		/* subtle */</div><div class='add'>+			}</div><div class='add'>+			status = nfserr_exist;</div><div class='add'>+			break;</div><div class='add'>+		case NFS4_CREATE_EXCLUSIVE4_1:</div><div class='add'>+			if (inode_get_mtime_sec(d_inode(child)) == v_mtime &amp;&amp;</div><div class='add'>+			    inode_get_atime_sec(d_inode(child)) == v_atime &amp;&amp;</div><div class='add'>+			    d_inode(child)-&gt;i_size == 0) {</div><div class='add'>+				open-&gt;op_created = true;</div><div class='add'>+				goto set_attr;	/* subtle */</div><div class='add'>+			}</div><div class='add'>+			status = nfserr_exist;</div><div class='add'>+		}</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!IS_POSIXACL(inode))</div><div class='add'>+		iap-&gt;ia_mode &amp;= ~current_umask();</div><div class='add'>+</div><div class='add'>+	status = fh_fill_pre_attrs(fhp);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		goto out;</div><div class='add'>+	status = nfsd4_vfs_create(fhp, child, open);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		goto out;</div><div class='add'>+	open-&gt;op_created = true;</div><div class='add'>+	fh_fill_post_attrs(fhp);</div><div class='add'>+</div><div class='add'>+	/* A newly created file already has a file size of zero. */</div><div class='add'>+	if ((iap-&gt;ia_valid &amp; ATTR_SIZE) &amp;&amp; (iap-&gt;ia_size == 0))</div><div class='add'>+		iap-&gt;ia_valid &amp;= ~ATTR_SIZE;</div><div class='add'>+	if (nfsd4_create_is_exclusive(open-&gt;op_createmode)) {</div><div class='add'>+		iap-&gt;ia_valid = ATTR_MTIME | ATTR_ATIME |</div><div class='add'>+				ATTR_MTIME_SET|ATTR_ATIME_SET;</div><div class='add'>+		iap-&gt;ia_mtime.tv_sec = v_mtime;</div><div class='add'>+		iap-&gt;ia_atime.tv_sec = v_atime;</div><div class='add'>+		iap-&gt;ia_mtime.tv_nsec = 0;</div><div class='add'>+		iap-&gt;ia_atime.tv_nsec = 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+set_attr:</div><div class='add'>+	status = nfsd_create_setattr(rqstp, fhp, resfhp, &amp;attrs);</div><div class='add'>+</div><div class='add'>+	if (attrs.na_labelerr)</div><div class='add'>+		open-&gt;op_bmval[2] &amp;= ~FATTR4_WORD2_SECURITY_LABEL;</div><div class='add'>+	if (attrs.na_aclerr)</div><div class='add'>+		open-&gt;op_bmval[0] &amp;= ~FATTR4_WORD0_ACL;</div><div class='add'>+out:</div><div class='add'>+	end_creating(child);</div><div class='add'>+	nfsd_attrs_free(&amp;attrs);</div><div class='add'>+out_write:</div><div class='add'>+	fh_drop_write(fhp);</div><div class='add'>+	return status;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * set_change_info - set up the change_info4 for a reply</div><div class='add'>+ * @cinfo: pointer to nfsd4_change_info to be populated</div><div class='add'>+ * @fhp: pointer to svc_fh to use as source</div><div class='add'>+ *</div><div class='add'>+ * Many operations in NFSv4 require change_info4 in the reply. This function</div><div class='add'>+ * populates that from the info that we (should!) have already collected. In</div><div class='add'>+ * the event that we didn't get any pre-attrs, just zero out both.</div><div class='add'>+ */</div><div class='add'>+static void</div><div class='add'>+set_change_info(struct nfsd4_change_info *cinfo, struct svc_fh *fhp)</div><div class='add'>+{</div><div class='add'>+	cinfo-&gt;atomic = (u32)(fhp-&gt;fh_pre_saved &amp;&amp; fhp-&gt;fh_post_saved &amp;&amp; !fhp-&gt;fh_no_atomic_attr);</div><div class='add'>+	cinfo-&gt;before_change = fhp-&gt;fh_pre_change;</div><div class='add'>+	cinfo-&gt;after_change = fhp-&gt;fh_post_change;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If fetching the pre-change attributes failed, then we should</div><div class='add'>+	 * have already failed the whole operation. We could have still</div><div class='add'>+	 * failed to fetch post-change attributes however.</div><div class='add'>+	 *</div><div class='add'>+	 * If we didn't get post-op attrs, just zero-out the after</div><div class='add'>+	 * field since we don't know what it should be. If the pre_saved</div><div class='add'>+	 * field isn't set for some reason, throw warning and just copy</div><div class='add'>+	 * whatever is in the after field.</div><div class='add'>+	 */</div><div class='add'>+	if (WARN_ON_ONCE(!fhp-&gt;fh_pre_saved))</div><div class='add'>+		cinfo-&gt;before_change = 0;</div><div class='add'>+	if (!fhp-&gt;fh_post_saved)</div><div class='add'>+		cinfo-&gt;after_change = cinfo-&gt;before_change + 1;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static __be32</div><div class='ctx'> do_open_lookup(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate, struct nfsd4_open *open, struct svc_fh **resfh)</div><div class='ctx'> {</div><div class='hunk'>@@ -264,47 +444,33 @@ do_open_lookup(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate, stru</div><div class='ctx'> 		 * yes          | yes    | GUARDED4        | GUARDED4</div><div class='ctx'> 		 */</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * Note: create modes (UNCHECKED,GUARDED...) are the same</div><div class='del'>-		 * in NFSv4 as in v3 except EXCLUSIVE4_1.</div><div class='del'>-		 */</div><div class='ctx'> 		current-&gt;fs-&gt;umask = open-&gt;op_umask;</div><div class='del'>-		status = do_nfsd_create(rqstp, current_fh, open-&gt;op_fname,</div><div class='del'>-					open-&gt;op_fnamelen, &amp;open-&gt;op_iattr,</div><div class='del'>-					*resfh, open-&gt;op_createmode,</div><div class='del'>-					(u32 *)open-&gt;op_verf.data,</div><div class='del'>-					&amp;open-&gt;op_truncate, &amp;open-&gt;op_created);</div><div class='add'>+		status = nfsd4_create_file(rqstp, current_fh, *resfh, open);</div><div class='ctx'> 		current-&gt;fs-&gt;umask = 0;</div><div class='ctx'> </div><div class='del'>-		if (!status &amp;&amp; open-&gt;op_label.len)</div><div class='del'>-			nfsd4_security_inode_setsecctx(*resfh, &amp;open-&gt;op_label, open-&gt;op_bmval);</div><div class='del'>-</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Following rfc 3530 14.2.16, and rfc 5661 18.16.4</div><div class='ctx'> 		 * use the returned bitmask to indicate which attributes</div><div class='ctx'> 		 * we used to store the verifier:</div><div class='ctx'> 		 */</div><div class='del'>-		if (nfsd_create_is_exclusive(open-&gt;op_createmode) &amp;&amp; status == 0)</div><div class='add'>+		if (nfsd4_create_is_exclusive(open-&gt;op_createmode) &amp;&amp; status == 0)</div><div class='ctx'> 			open-&gt;op_bmval[1] |= (FATTR4_WORD1_TIME_ACCESS |</div><div class='ctx'> 						FATTR4_WORD1_TIME_MODIFY);</div><div class='del'>-	} else</div><div class='del'>-		/*</div><div class='del'>-		 * Note this may exit with the parent still locked.</div><div class='del'>-		 * We will hold the lock until nfsd4_open's final</div><div class='del'>-		 * lookup, to prevent renames or unlinks until we've had</div><div class='del'>-		 * a chance to an acquire a delegation if appropriate.</div><div class='del'>-		 */</div><div class='add'>+	} else {</div><div class='ctx'> 		status = nfsd_lookup(rqstp, current_fh,</div><div class='ctx'> 				     open-&gt;op_fname, open-&gt;op_fnamelen, *resfh);</div><div class='add'>+		if (status == nfs_ok)</div><div class='add'>+			/* NFSv4 protocol requires change attributes even though</div><div class='add'>+			 * no change happened.</div><div class='add'>+			 */</div><div class='add'>+			status = fh_fill_both_attrs(current_fh);</div><div class='add'>+	}</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		goto out;</div><div class='del'>-	status = nfsd_check_obj_isreg(*resfh);</div><div class='add'>+	status = nfsd_check_obj_isreg(*resfh, cstate-&gt;minorversion);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	if (is_create_with_attrs(open) &amp;&amp; open-&gt;op_acl != NULL)</div><div class='del'>-		do_set_nfs4_acl(rqstp, *resfh, open-&gt;op_acl, open-&gt;op_bmval);</div><div class='del'>-</div><div class='ctx'> 	nfsd4_set_open_owner_reply_cache(cstate, open, *resfh);</div><div class='ctx'> 	accmode = NFSD_MAY_NOP;</div><div class='ctx'> 	if (open-&gt;op_created ||</div><div class='hunk'>@@ -320,7 +486,6 @@ static __be32</div><div class='ctx'> do_open_fhandle(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate, struct nfsd4_open *open)</div><div class='ctx'> {</div><div class='ctx'> 	struct svc_fh *current_fh = &amp;cstate-&gt;current_fh;</div><div class='del'>-	__be32 status;</div><div class='ctx'> 	int accmode = 0;</div><div class='ctx'> </div><div class='ctx'> 	/* We don't know the target directory, and therefore can not</div><div class='hunk'>@@ -345,9 +510,7 @@ do_open_fhandle(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate, str</div><div class='ctx'> 	if (open-&gt;op_claim_type == NFS4_OPEN_CLAIM_DELEG_CUR_FH)</div><div class='ctx'> 		accmode = NFSD_MAY_OWNER_OVERRIDE;</div><div class='ctx'> </div><div class='del'>-	status = do_open_permission(rqstp, current_fh, open, accmode);</div><div class='del'>-</div><div class='del'>-	return status;</div><div class='add'>+	return do_open_permission(rqstp, current_fh, open, accmode);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='hunk'>@@ -375,6 +538,9 @@ nfsd4_open(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 		(int)open-&gt;op_fnamelen, open-&gt;op_fname,</div><div class='ctx'> 		open-&gt;op_openowner);</div><div class='ctx'> </div><div class='add'>+	open-&gt;op_filp = NULL;</div><div class='add'>+	open-&gt;op_rqstp = rqstp;</div><div class='add'>+</div><div class='ctx'> 	/* This check required by spec. */</div><div class='ctx'> 	if (open-&gt;op_create &amp;&amp; open-&gt;op_claim_type != NFS4_OPEN_CLAIM_NULL)</div><div class='ctx'> 		return nfserr_inval;</div><div class='hunk'>@@ -427,50 +593,46 @@ nfsd4_open(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	switch (open-&gt;op_claim_type) {</div><div class='del'>-		case NFS4_OPEN_CLAIM_DELEGATE_CUR:</div><div class='del'>-		case NFS4_OPEN_CLAIM_NULL:</div><div class='del'>-			status = do_open_lookup(rqstp, cstate, open, &amp;resfh);</div><div class='del'>-			if (status)</div><div class='del'>-				goto out;</div><div class='del'>-			break;</div><div class='del'>-		case NFS4_OPEN_CLAIM_PREVIOUS:</div><div class='del'>-			status = nfs4_check_open_reclaim(cstate-&gt;clp);</div><div class='del'>-			if (status)</div><div class='del'>-				goto out;</div><div class='del'>-			open-&gt;op_openowner-&gt;oo_flags |= NFS4_OO_CONFIRMED;</div><div class='del'>-			reclaim = true;</div><div class='del'>-			fallthrough;</div><div class='del'>-		case NFS4_OPEN_CLAIM_FH:</div><div class='del'>-		case NFS4_OPEN_CLAIM_DELEG_CUR_FH:</div><div class='del'>-			status = do_open_fhandle(rqstp, cstate, open);</div><div class='del'>-			if (status)</div><div class='del'>-				goto out;</div><div class='del'>-			resfh = &amp;cstate-&gt;current_fh;</div><div class='del'>-			break;</div><div class='del'>-		case NFS4_OPEN_CLAIM_DELEG_PREV_FH:</div><div class='del'>-             	case NFS4_OPEN_CLAIM_DELEGATE_PREV:</div><div class='del'>-			dprintk("NFSD: unsupported OPEN claim type %d\n",</div><div class='del'>-				open-&gt;op_claim_type);</div><div class='del'>-			status = nfserr_notsupp;</div><div class='add'>+	case NFS4_OPEN_CLAIM_DELEGATE_CUR:</div><div class='add'>+	case NFS4_OPEN_CLAIM_NULL:</div><div class='add'>+		status = do_open_lookup(rqstp, cstate, open, &amp;resfh);</div><div class='add'>+		if (status)</div><div class='ctx'> 			goto out;</div><div class='del'>-		default:</div><div class='del'>-			dprintk("NFSD: Invalid OPEN claim type %d\n",</div><div class='del'>-				open-&gt;op_claim_type);</div><div class='del'>-			status = nfserr_inval;</div><div class='add'>+		break;</div><div class='add'>+	case NFS4_OPEN_CLAIM_PREVIOUS:</div><div class='add'>+		status = nfs4_check_open_reclaim(cstate-&gt;clp);</div><div class='add'>+		if (status)</div><div class='add'>+			goto out;</div><div class='add'>+		open-&gt;op_openowner-&gt;oo_flags |= NFS4_OO_CONFIRMED;</div><div class='add'>+		reclaim = true;</div><div class='add'>+		fallthrough;</div><div class='add'>+	case NFS4_OPEN_CLAIM_FH:</div><div class='add'>+	case NFS4_OPEN_CLAIM_DELEG_CUR_FH:</div><div class='add'>+		status = do_open_fhandle(rqstp, cstate, open);</div><div class='add'>+		if (status)</div><div class='ctx'> 			goto out;</div><div class='add'>+		resfh = &amp;cstate-&gt;current_fh;</div><div class='add'>+		break;</div><div class='add'>+	case NFS4_OPEN_CLAIM_DELEG_PREV_FH:</div><div class='add'>+	case NFS4_OPEN_CLAIM_DELEGATE_PREV:</div><div class='add'>+		status = nfserr_notsupp;</div><div class='add'>+		goto out;</div><div class='add'>+	default:</div><div class='add'>+		status = nfserr_inval;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	/*</div><div class='del'>-	 * nfsd4_process_open2() does the actual opening of the file.  If</div><div class='del'>-	 * successful, it (1) truncates the file if open-&gt;op_truncate was</div><div class='del'>-	 * set, (2) sets open-&gt;op_stateid, (3) sets open-&gt;op_delegation.</div><div class='del'>-	 */</div><div class='add'>+</div><div class='ctx'> 	status = nfsd4_process_open2(rqstp, resfh, open);</div><div class='del'>-	WARN(status &amp;&amp; open-&gt;op_created,</div><div class='del'>-	     "nfsd4_process_open2 failed to open newly-created file! status=%u\n",</div><div class='del'>-	     be32_to_cpu(status));</div><div class='add'>+	if (status &amp;&amp; open-&gt;op_created)</div><div class='add'>+		pr_warn("nfsd4_process_open2 failed to open newly-created file: status=%u\n",</div><div class='add'>+			be32_to_cpu(status));</div><div class='ctx'> 	if (reclaim &amp;&amp; !status)</div><div class='ctx'> 		nn-&gt;somebody_reclaimed = true;</div><div class='ctx'> out:</div><div class='add'>+	if (open-&gt;op_filp) {</div><div class='add'>+		fput(open-&gt;op_filp);</div><div class='add'>+		open-&gt;op_filp = NULL;</div><div class='add'>+	}</div><div class='ctx'> 	if (resfh &amp;&amp; resfh != &amp;cstate-&gt;current_fh) {</div><div class='ctx'> 		fh_dup2(&amp;cstate-&gt;current_fh, resfh);</div><div class='ctx'> 		fh_put(resfh);</div><div class='hunk'>@@ -535,11 +697,9 @@ static __be32</div><div class='ctx'> nfsd4_putrootfh(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 		union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='del'>-	__be32 status;</div><div class='del'>-</div><div class='ctx'> 	fh_put(&amp;cstate-&gt;current_fh);</div><div class='del'>-	status = exp_pseudoroot(rqstp, &amp;cstate-&gt;current_fh);</div><div class='del'>-	return status;</div><div class='add'>+</div><div class='add'>+	return exp_pseudoroot(rqstp, &amp;cstate-&gt;current_fh);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='hunk'>@@ -592,24 +752,24 @@ nfsd4_access(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 			   &amp;access-&gt;ac_supported);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void gen_boot_verifier(nfs4_verifier *verifier, struct net *net)</div><div class='del'>-{</div><div class='del'>-	__be32 *verf = (__be32 *)verifier-&gt;data;</div><div class='del'>-</div><div class='del'>-	BUILD_BUG_ON(2*sizeof(*verf) != sizeof(verifier-&gt;data));</div><div class='del'>-</div><div class='del'>-	nfsd_copy_boot_verifier(verf, net_generic(net, nfsd_net_id));</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_commit(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	     union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd4_commit *commit = &amp;u-&gt;commit;</div><div class='add'>+	struct nfsd_file *nf;</div><div class='add'>+	__be32 status;</div><div class='ctx'> </div><div class='del'>-	return nfsd_commit(rqstp, &amp;cstate-&gt;current_fh, commit-&gt;co_offset,</div><div class='add'>+	status = nfsd_file_acquire(rqstp, &amp;cstate-&gt;current_fh, NFSD_MAY_WRITE |</div><div class='add'>+				   NFSD_MAY_NOT_BREAK_LEASE, &amp;nf);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+</div><div class='add'>+	status = nfsd_commit(rqstp, &amp;cstate-&gt;current_fh, nf, commit-&gt;co_offset,</div><div class='ctx'> 			     commit-&gt;co_count,</div><div class='ctx'> 			     (__be32 *)commit-&gt;co_verf.data);</div><div class='add'>+	nfsd_file_put(nf);</div><div class='add'>+	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='hunk'>@@ -617,6 +777,10 @@ nfsd4_create(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	     union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd4_create *create = &amp;u-&gt;create;</div><div class='add'>+	struct nfsd_attrs attrs = {</div><div class='add'>+		.na_iattr	= &amp;create-&gt;cr_iattr,</div><div class='add'>+		.na_seclabel	= &amp;create-&gt;cr_label,</div><div class='add'>+	};</div><div class='ctx'> 	struct svc_fh resfh;</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> 	dev_t rdev;</div><div class='hunk'>@@ -632,12 +796,13 @@ nfsd4_create(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		return status;</div><div class='ctx'> </div><div class='add'>+	status = nfsd4_acl_to_attr(create-&gt;cr_type, create-&gt;cr_acl, &amp;attrs);</div><div class='ctx'> 	current-&gt;fs-&gt;umask = create-&gt;cr_umask;</div><div class='ctx'> 	switch (create-&gt;cr_type) {</div><div class='ctx'> 	case NF4LNK:</div><div class='ctx'> 		status = nfsd_symlink(rqstp, &amp;cstate-&gt;current_fh,</div><div class='ctx'> 				      create-&gt;cr_name, create-&gt;cr_namelen,</div><div class='del'>-				      create-&gt;cr_data, &amp;resfh);</div><div class='add'>+				      create-&gt;cr_data, &amp;attrs, &amp;resfh);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	case NF4BLK:</div><div class='hunk'>@@ -648,7 +813,7 @@ nfsd4_create(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 			goto out_umask;</div><div class='ctx'> 		status = nfsd_create(rqstp, &amp;cstate-&gt;current_fh,</div><div class='ctx'> 				     create-&gt;cr_name, create-&gt;cr_namelen,</div><div class='del'>-				     &amp;create-&gt;cr_iattr, S_IFBLK, rdev, &amp;resfh);</div><div class='add'>+				     &amp;attrs, S_IFBLK, rdev, &amp;resfh);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	case NF4CHR:</div><div class='hunk'>@@ -659,26 +824,26 @@ nfsd4_create(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 			goto out_umask;</div><div class='ctx'> 		status = nfsd_create(rqstp, &amp;cstate-&gt;current_fh,</div><div class='ctx'> 				     create-&gt;cr_name, create-&gt;cr_namelen,</div><div class='del'>-				     &amp;create-&gt;cr_iattr,S_IFCHR, rdev, &amp;resfh);</div><div class='add'>+				     &amp;attrs, S_IFCHR, rdev, &amp;resfh);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	case NF4SOCK:</div><div class='ctx'> 		status = nfsd_create(rqstp, &amp;cstate-&gt;current_fh,</div><div class='ctx'> 				     create-&gt;cr_name, create-&gt;cr_namelen,</div><div class='del'>-				     &amp;create-&gt;cr_iattr, S_IFSOCK, 0, &amp;resfh);</div><div class='add'>+				     &amp;attrs, S_IFSOCK, 0, &amp;resfh);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	case NF4FIFO:</div><div class='ctx'> 		status = nfsd_create(rqstp, &amp;cstate-&gt;current_fh,</div><div class='ctx'> 				     create-&gt;cr_name, create-&gt;cr_namelen,</div><div class='del'>-				     &amp;create-&gt;cr_iattr, S_IFIFO, 0, &amp;resfh);</div><div class='add'>+				     &amp;attrs, S_IFIFO, 0, &amp;resfh);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	case NF4DIR:</div><div class='ctx'> 		create-&gt;cr_iattr.ia_valid &amp;= ~ATTR_SIZE;</div><div class='ctx'> 		status = nfsd_create(rqstp, &amp;cstate-&gt;current_fh,</div><div class='ctx'> 				     create-&gt;cr_name, create-&gt;cr_namelen,</div><div class='del'>-				     &amp;create-&gt;cr_iattr, S_IFDIR, 0, &amp;resfh);</div><div class='add'>+				     &amp;attrs, S_IFDIR, 0, &amp;resfh);</div><div class='ctx'> 		break;</div><div class='ctx'> </div><div class='ctx'> 	default:</div><div class='hunk'>@@ -688,20 +853,17 @@ nfsd4_create(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	if (create-&gt;cr_label.len)</div><div class='del'>-		nfsd4_security_inode_setsecctx(&amp;resfh, &amp;create-&gt;cr_label, create-&gt;cr_bmval);</div><div class='del'>-</div><div class='del'>-	if (create-&gt;cr_acl != NULL)</div><div class='del'>-		do_set_nfs4_acl(rqstp, &amp;resfh, create-&gt;cr_acl,</div><div class='del'>-				create-&gt;cr_bmval);</div><div class='del'>-</div><div class='del'>-	fh_unlock(&amp;cstate-&gt;current_fh);</div><div class='add'>+	if (attrs.na_labelerr)</div><div class='add'>+		create-&gt;cr_bmval[2] &amp;= ~FATTR4_WORD2_SECURITY_LABEL;</div><div class='add'>+	if (attrs.na_aclerr)</div><div class='add'>+		create-&gt;cr_bmval[0] &amp;= ~FATTR4_WORD0_ACL;</div><div class='ctx'> 	set_change_info(&amp;create-&gt;cr_cinfo, &amp;cstate-&gt;current_fh);</div><div class='ctx'> 	fh_dup2(&amp;cstate-&gt;current_fh, &amp;resfh);</div><div class='ctx'> out:</div><div class='ctx'> 	fh_put(&amp;resfh);</div><div class='ctx'> out_umask:</div><div class='ctx'> 	current-&gt;fs-&gt;umask = 0;</div><div class='add'>+	nfsd_attrs_free(&amp;attrs);</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -712,6 +874,8 @@ nfsd4_getattr(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	struct nfsd4_getattr *getattr = &amp;u-&gt;getattr;</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> </div><div class='add'>+	trace_nfsd_vfs_getattr(rqstp, &amp;cstate-&gt;current_fh);</div><div class='add'>+</div><div class='ctx'> 	status = fh_verify(rqstp, &amp;cstate-&gt;current_fh, 0, NFSD_MAY_NOP);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		return status;</div><div class='hunk'>@@ -782,12 +946,16 @@ nfsd4_read(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> </div><div class='ctx'> 	read-&gt;rd_nf = NULL;</div><div class='del'>-	if (read-&gt;rd_offset &gt;= OFFSET_MAX)</div><div class='del'>-		return nfserr_inval;</div><div class='ctx'> </div><div class='ctx'> 	trace_nfsd_read_start(rqstp, &amp;cstate-&gt;current_fh,</div><div class='ctx'> 			      read-&gt;rd_offset, read-&gt;rd_length);</div><div class='ctx'> </div><div class='add'>+	read-&gt;rd_length = min_t(u32, read-&gt;rd_length, svc_max_payload(rqstp));</div><div class='add'>+	if (read-&gt;rd_offset &gt; (u64)OFFSET_MAX)</div><div class='add'>+		read-&gt;rd_offset = (u64)OFFSET_MAX;</div><div class='add'>+	if (read-&gt;rd_offset + read-&gt;rd_length &gt; (u64)OFFSET_MAX)</div><div class='add'>+		read-&gt;rd_length = (u64)OFFSET_MAX - read-&gt;rd_offset;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If we do a zero copy read, then a client will see read data</div><div class='ctx'> 	 * that reflects the state of the file *after* performing the</div><div class='hunk'>@@ -796,19 +964,17 @@ nfsd4_read(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	 * To ensure proper ordering, we therefore turn off zero copy if</div><div class='ctx'> 	 * the client wants us to do more in this compound:</div><div class='ctx'> 	 */</div><div class='del'>-	if (!nfsd4_last_compound_op(rqstp))</div><div class='del'>-		clear_bit(RQ_SPLICE_OK, &amp;rqstp-&gt;rq_flags);</div><div class='add'>+	if (!nfsd4_last_compound_op(rqstp)) {</div><div class='add'>+		struct nfsd4_compoundargs *argp = rqstp-&gt;rq_argp;</div><div class='add'>+</div><div class='add'>+		argp-&gt;splice_ok = false;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* check stateid */</div><div class='ctx'> 	status = nfs4_preprocess_stateid_op(rqstp, cstate, &amp;cstate-&gt;current_fh,</div><div class='ctx'> 					&amp;read-&gt;rd_stateid, RD_STATE,</div><div class='ctx'> 					&amp;read-&gt;rd_nf, NULL);</div><div class='del'>-	if (status) {</div><div class='del'>-		dprintk("NFSD: nfsd4_read: couldn't process stateid!\n");</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	status = nfs_ok;</div><div class='del'>-out:</div><div class='add'>+</div><div class='ctx'> 	read-&gt;rd_rqstp = rqstp;</div><div class='ctx'> 	read-&gt;rd_fhp = &amp;cstate-&gt;current_fh;</div><div class='ctx'> 	return status;</div><div class='hunk'>@@ -818,10 +984,11 @@ out:</div><div class='ctx'> static void</div><div class='ctx'> nfsd4_read_release(union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='del'>-	if (u-&gt;read.rd_nf)</div><div class='add'>+	if (u-&gt;read.rd_nf) {</div><div class='add'>+		trace_nfsd_read_done(u-&gt;read.rd_rqstp, u-&gt;read.rd_fhp,</div><div class='add'>+				     u-&gt;read.rd_offset, u-&gt;read.rd_length);</div><div class='ctx'> 		nfsd_file_put(u-&gt;read.rd_nf);</div><div class='del'>-	trace_nfsd_read_done(u-&gt;read.rd_rqstp, u-&gt;read.rd_fhp,</div><div class='del'>-			     u-&gt;read.rd_offset, u-&gt;read.rd_length);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='hunk'>@@ -832,6 +999,9 @@ nfsd4_readdir(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	u64 cookie = readdir-&gt;rd_cookie;</div><div class='ctx'> 	static const nfs4_verifier zeroverf;</div><div class='ctx'> </div><div class='add'>+	trace_nfsd_vfs_readdir(rqstp, &amp;cstate-&gt;current_fh,</div><div class='add'>+			       readdir-&gt;rd_maxcount, readdir-&gt;rd_cookie);</div><div class='add'>+</div><div class='ctx'> 	/* no need to check permission - this will be done in nfsd_readdir() */</div><div class='ctx'> </div><div class='ctx'> 	if (readdir-&gt;rd_bmval[1] &amp; NFSD_WRITEONLY_ATTRS_WORD1)</div><div class='hunk'>@@ -870,10 +1040,8 @@ nfsd4_remove(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 		return nfserr_grace;</div><div class='ctx'> 	status = nfsd_unlink(rqstp, &amp;cstate-&gt;current_fh, 0,</div><div class='ctx'> 			     remove-&gt;rm_name, remove-&gt;rm_namelen);</div><div class='del'>-	if (!status) {</div><div class='del'>-		fh_unlock(&amp;cstate-&gt;current_fh);</div><div class='add'>+	if (!status)</div><div class='ctx'> 		set_change_info(&amp;remove-&gt;rm_cinfo, &amp;cstate-&gt;current_fh);</div><div class='del'>-	}</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -891,8 +1059,8 @@ nfsd4_rename(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 			     rename-&gt;rn_tname, rename-&gt;rn_tnamelen);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		return status;</div><div class='del'>-	set_change_info(&amp;rename-&gt;rn_sinfo, &amp;cstate-&gt;current_fh);</div><div class='del'>-	set_change_info(&amp;rename-&gt;rn_tinfo, &amp;cstate-&gt;save_fh);</div><div class='add'>+	set_change_info(&amp;rename-&gt;rn_sinfo, &amp;cstate-&gt;save_fh);</div><div class='add'>+	set_change_info(&amp;rename-&gt;rn_tinfo, &amp;cstate-&gt;current_fh);</div><div class='ctx'> 	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -913,7 +1081,6 @@ nfsd4_secinfo(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 				    &amp;exp, &amp;dentry);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='del'>-	fh_unlock(&amp;cstate-&gt;current_fh);</div><div class='ctx'> 	if (d_really_is_negative(dentry)) {</div><div class='ctx'> 		exp_put(exp);</div><div class='ctx'> 		err = nfserr_noent;</div><div class='hunk'>@@ -963,23 +1130,83 @@ nfsd4_secinfo_no_name_release(union nfsd4_op_u *u)</div><div class='ctx'> 		exp_put(u-&gt;secinfo_no_name.sin_exp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Validate that the requested timestamps are within the acceptable range. If</div><div class='add'>+ * timestamp appears to be in the future, then it will be clamped to</div><div class='add'>+ * current_time().</div><div class='add'>+ */</div><div class='add'>+static void</div><div class='add'>+vet_deleg_attrs(struct nfsd4_setattr *setattr, struct nfs4_delegation *dp)</div><div class='add'>+{</div><div class='add'>+	struct timespec64 now = current_time(dp-&gt;dl_stid.sc_file-&gt;fi_inode);</div><div class='add'>+	struct iattr *iattr = &amp;setattr-&gt;sa_iattr;</div><div class='add'>+</div><div class='add'>+	if ((setattr-&gt;sa_bmval[2] &amp; FATTR4_WORD2_TIME_DELEG_ACCESS) &amp;&amp;</div><div class='add'>+	    !nfsd4_vet_deleg_time(&amp;iattr-&gt;ia_atime, &amp;dp-&gt;dl_atime, &amp;now))</div><div class='add'>+		iattr-&gt;ia_valid &amp;= ~(ATTR_ATIME | ATTR_ATIME_SET);</div><div class='add'>+</div><div class='add'>+	if (setattr-&gt;sa_bmval[2] &amp; FATTR4_WORD2_TIME_DELEG_MODIFY) {</div><div class='add'>+		if (nfsd4_vet_deleg_time(&amp;iattr-&gt;ia_mtime, &amp;dp-&gt;dl_mtime, &amp;now)) {</div><div class='add'>+			iattr-&gt;ia_ctime = iattr-&gt;ia_mtime;</div><div class='add'>+			if (nfsd4_vet_deleg_time(&amp;iattr-&gt;ia_ctime, &amp;dp-&gt;dl_ctime, &amp;now))</div><div class='add'>+				dp-&gt;dl_setattr = true;</div><div class='add'>+			else</div><div class='add'>+				iattr-&gt;ia_valid &amp;= ~(ATTR_CTIME | ATTR_CTIME_SET);</div><div class='add'>+		} else {</div><div class='add'>+			iattr-&gt;ia_valid &amp;= ~(ATTR_CTIME | ATTR_CTIME_SET |</div><div class='add'>+					     ATTR_MTIME | ATTR_MTIME_SET);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_setattr(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	      union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd4_setattr *setattr = &amp;u-&gt;setattr;</div><div class='add'>+	struct nfsd_attrs attrs = {</div><div class='add'>+		.na_iattr	= &amp;setattr-&gt;sa_iattr,</div><div class='add'>+		.na_seclabel	= &amp;setattr-&gt;sa_label,</div><div class='add'>+	};</div><div class='add'>+	bool save_no_wcc, deleg_attrs;</div><div class='add'>+	struct nfs4_stid *st = NULL;</div><div class='add'>+	struct inode *inode;</div><div class='ctx'> 	__be32 status = nfs_ok;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='del'>-	if (setattr-&gt;sa_iattr.ia_valid &amp; ATTR_SIZE) {</div><div class='add'>+	deleg_attrs = setattr-&gt;sa_bmval[2] &amp; (FATTR4_WORD2_TIME_DELEG_ACCESS |</div><div class='add'>+					      FATTR4_WORD2_TIME_DELEG_MODIFY);</div><div class='add'>+</div><div class='add'>+	if (deleg_attrs || (setattr-&gt;sa_iattr.ia_valid &amp; ATTR_SIZE)) {</div><div class='add'>+		int flags = WR_STATE;</div><div class='add'>+</div><div class='add'>+		if (setattr-&gt;sa_bmval[2] &amp; FATTR4_WORD2_TIME_DELEG_ACCESS)</div><div class='add'>+			flags |= RD_STATE;</div><div class='add'>+</div><div class='ctx'> 		status = nfs4_preprocess_stateid_op(rqstp, cstate,</div><div class='ctx'> 				&amp;cstate-&gt;current_fh, &amp;setattr-&gt;sa_stateid,</div><div class='del'>-				WR_STATE, NULL, NULL);</div><div class='del'>-		if (status) {</div><div class='del'>-			dprintk("NFSD: nfsd4_setattr: couldn't process stateid!\n");</div><div class='add'>+				flags, NULL, &amp;st);</div><div class='add'>+		if (status)</div><div class='ctx'> 			return status;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (deleg_attrs) {</div><div class='add'>+		status = nfserr_bad_stateid;</div><div class='add'>+		if (st-&gt;sc_type &amp; SC_TYPE_DELEG) {</div><div class='add'>+			struct nfs4_delegation *dp = delegstateid(st);</div><div class='add'>+</div><div class='add'>+			/* Only for *_ATTRS_DELEG flavors */</div><div class='add'>+			if (deleg_attrs_deleg(dp-&gt;dl_type)) {</div><div class='add'>+				vet_deleg_attrs(setattr, dp);</div><div class='add'>+				status = nfs_ok;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='add'>+	if (st)</div><div class='add'>+		nfs4_put_stid(st);</div><div class='add'>+	if (status)</div><div class='add'>+		return status;</div><div class='add'>+</div><div class='ctx'> 	err = fh_want_write(&amp;cstate-&gt;current_fh);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return nfserrno(err);</div><div class='hunk'>@@ -990,55 +1217,71 @@ nfsd4_setattr(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	if (setattr-&gt;sa_acl != NULL)</div><div class='del'>-		status = nfsd4_set_nfs4_acl(rqstp, &amp;cstate-&gt;current_fh,</div><div class='del'>-					    setattr-&gt;sa_acl);</div><div class='del'>-	if (status)</div><div class='del'>-		goto out;</div><div class='del'>-	if (setattr-&gt;sa_label.len)</div><div class='del'>-		status = nfsd4_set_nfs4_label(rqstp, &amp;cstate-&gt;current_fh,</div><div class='del'>-				&amp;setattr-&gt;sa_label);</div><div class='add'>+	inode = cstate-&gt;current_fh.fh_dentry-&gt;d_inode;</div><div class='add'>+	status = nfsd4_acl_to_attr(S_ISDIR(inode-&gt;i_mode) ? NF4DIR : NF4REG,</div><div class='add'>+				   setattr-&gt;sa_acl, &amp;attrs);</div><div class='add'>+</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		goto out;</div><div class='del'>-	status = nfsd_setattr(rqstp, &amp;cstate-&gt;current_fh, &amp;setattr-&gt;sa_iattr,</div><div class='del'>-				0, (time64_t)0);</div><div class='add'>+	save_no_wcc = cstate-&gt;current_fh.fh_no_wcc;</div><div class='add'>+	cstate-&gt;current_fh.fh_no_wcc = true;</div><div class='add'>+	status = nfsd_setattr(rqstp, &amp;cstate-&gt;current_fh, &amp;attrs, NULL);</div><div class='add'>+	cstate-&gt;current_fh.fh_no_wcc = save_no_wcc;</div><div class='add'>+	if (!status)</div><div class='add'>+		status = nfserrno(attrs.na_labelerr);</div><div class='add'>+	if (!status)</div><div class='add'>+		status = nfserrno(attrs.na_aclerr);</div><div class='ctx'> out:</div><div class='add'>+	nfsd_attrs_free(&amp;attrs);</div><div class='ctx'> 	fh_drop_write(&amp;cstate-&gt;current_fh);</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void nfsd4_file_mark_deleg_written(struct nfs4_file *fi)</div><div class='add'>+{</div><div class='add'>+	spin_lock(&amp;fi-&gt;fi_lock);</div><div class='add'>+	if (!list_empty(&amp;fi-&gt;fi_delegations)) {</div><div class='add'>+		struct nfs4_delegation *dp = list_first_entry(&amp;fi-&gt;fi_delegations,</div><div class='add'>+							      struct nfs4_delegation, dl_perfile);</div><div class='add'>+</div><div class='add'>+		if (dp-&gt;dl_type == OPEN_DELEGATE_WRITE_ATTRS_DELEG)</div><div class='add'>+			dp-&gt;dl_written = true;</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;fi-&gt;fi_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_write(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	    union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd4_write *write = &amp;u-&gt;write;</div><div class='ctx'> 	stateid_t *stateid = &amp;write-&gt;wr_stateid;</div><div class='add'>+	struct nfs4_stid *stid = NULL;</div><div class='ctx'> 	struct nfsd_file *nf = NULL;</div><div class='ctx'> 	__be32 status = nfs_ok;</div><div class='ctx'> 	unsigned long cnt;</div><div class='del'>-	int nvecs;</div><div class='ctx'> </div><div class='del'>-	if (write-&gt;wr_offset &gt;= OFFSET_MAX)</div><div class='del'>-		return nfserr_inval;</div><div class='add'>+	if (write-&gt;wr_offset &gt; (u64)OFFSET_MAX ||</div><div class='add'>+	    write-&gt;wr_offset + write-&gt;wr_buflen &gt; (u64)OFFSET_MAX)</div><div class='add'>+		return nfserr_fbig;</div><div class='ctx'> </div><div class='ctx'> 	cnt = write-&gt;wr_buflen;</div><div class='ctx'> 	trace_nfsd_write_start(rqstp, &amp;cstate-&gt;current_fh,</div><div class='ctx'> 			       write-&gt;wr_offset, cnt);</div><div class='ctx'> 	status = nfs4_preprocess_stateid_op(rqstp, cstate, &amp;cstate-&gt;current_fh,</div><div class='del'>-						stateid, WR_STATE, &amp;nf, NULL);</div><div class='del'>-	if (status) {</div><div class='del'>-		dprintk("NFSD: nfsd4_write: couldn't process stateid!\n");</div><div class='add'>+						stateid, WR_STATE, &amp;nf, &amp;stid);</div><div class='add'>+	if (status)</div><div class='ctx'> 		return status;</div><div class='add'>+</div><div class='add'>+	if (stid) {</div><div class='add'>+		nfsd4_file_mark_deleg_written(stid-&gt;sc_file);</div><div class='add'>+		nfs4_put_stid(stid);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	write-&gt;wr_how_written = write-&gt;wr_stable_how;</div><div class='del'>-</div><div class='del'>-	nvecs = svc_fill_write_vector(rqstp, &amp;write-&gt;wr_payload);</div><div class='del'>-	WARN_ON_ONCE(nvecs &gt; ARRAY_SIZE(rqstp-&gt;rq_vec));</div><div class='del'>-</div><div class='ctx'> 	status = nfsd_vfs_write(rqstp, &amp;cstate-&gt;current_fh, nf,</div><div class='del'>-				write-&gt;wr_offset, rqstp-&gt;rq_vec, nvecs, &amp;cnt,</div><div class='del'>-				write-&gt;wr_how_written,</div><div class='add'>+				write-&gt;wr_offset, &amp;write-&gt;wr_payload,</div><div class='add'>+				&amp;cnt, write-&gt;wr_how_written,</div><div class='ctx'> 				(__be32 *)write-&gt;wr_verifier.data);</div><div class='ctx'> 	nfsd_file_put(nf);</div><div class='ctx'> </div><div class='hunk'>@@ -1060,17 +1303,13 @@ nfsd4_verify_copy(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> </div><div class='ctx'> 	status = nfs4_preprocess_stateid_op(rqstp, cstate, &amp;cstate-&gt;save_fh,</div><div class='ctx'> 					    src_stateid, RD_STATE, src, NULL);</div><div class='del'>-	if (status) {</div><div class='del'>-		dprintk("NFSD: %s: couldn't process src stateid!\n", __func__);</div><div class='add'>+	if (status)</div><div class='ctx'> 		goto out;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	status = nfs4_preprocess_stateid_op(rqstp, cstate, &amp;cstate-&gt;current_fh,</div><div class='ctx'> 					    dst_stateid, WR_STATE, dst, NULL);</div><div class='del'>-	if (status) {</div><div class='del'>-		dprintk("NFSD: %s: couldn't process dst stateid!\n", __func__);</div><div class='add'>+	if (status)</div><div class='ctx'> 		goto out_put_src;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	/* fix up for NFS-specific error code */</div><div class='ctx'> 	if (!S_ISREG(file_inode((*src)-&gt;nf_file)-&gt;i_mode) ||</div><div class='hunk'>@@ -1083,8 +1322,10 @@ out:</div><div class='ctx'> 	return status;</div><div class='ctx'> out_put_dst:</div><div class='ctx'> 	nfsd_file_put(*dst);</div><div class='add'>+	*dst = NULL;</div><div class='ctx'> out_put_src:</div><div class='ctx'> 	nfsd_file_put(*src);</div><div class='add'>+	*src = NULL;</div><div class='ctx'> 	goto out;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1101,7 +1342,7 @@ nfsd4_clone(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	status = nfsd4_clone_file_range(src, clone-&gt;cl_src_pos,</div><div class='add'>+	status = nfsd4_clone_file_range(rqstp, src, clone-&gt;cl_src_pos,</div><div class='ctx'> 			dst, clone-&gt;cl_dst_pos, clone-&gt;cl_count,</div><div class='ctx'> 			EX_ISSYNC(cstate-&gt;current_fh.fh_export));</div><div class='ctx'> </div><div class='hunk'>@@ -1111,35 +1352,91 @@ out:</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void nfs4_put_copy(struct nfsd4_copy *copy)</div><div class='add'>+/**</div><div class='add'>+ * nfsd4_has_active_async_copies - Check for ongoing copy operations</div><div class='add'>+ * @clp: Client to be checked</div><div class='add'>+ *</div><div class='add'>+ * NFSD maintains state for async COPY operations after they complete,</div><div class='add'>+ * and this state remains in the nfs4_client's async_copies list.</div><div class='add'>+ * Ongoing copies should block the destruction of the nfs4_client, but</div><div class='add'>+ * completed copies should not.</div><div class='add'>+ *</div><div class='add'>+ * Return values:</div><div class='add'>+ *   %true: At least one active async COPY is ongoing</div><div class='add'>+ *   %false: No active async COPY operations were found</div><div class='add'>+ */</div><div class='add'>+bool nfsd4_has_active_async_copies(struct nfs4_client *clp)</div><div class='ctx'> {</div><div class='del'>-	if (!refcount_dec_and_test(&amp;copy-&gt;refcount))</div><div class='del'>-		return;</div><div class='del'>-	kfree(copy);</div><div class='add'>+	struct nfsd4_copy *copy;</div><div class='add'>+	bool result = false;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;clp-&gt;async_lock);</div><div class='add'>+	list_for_each_entry(copy, &amp;clp-&gt;async_copies, copies) {</div><div class='add'>+		if (!test_bit(NFSD4_COPY_F_COMPLETED, &amp;copy-&gt;cp_flags) &amp;&amp;</div><div class='add'>+		    !test_bit(NFSD4_COPY_F_STOPPED, &amp;copy-&gt;cp_flags)) {</div><div class='add'>+			result = true;</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;clp-&gt;async_lock);</div><div class='add'>+	return result;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool</div><div class='del'>-check_and_set_stop_copy(struct nfsd4_copy *copy)</div><div class='add'>+/**</div><div class='add'>+ * nfsd4_async_copy_reaper - Purge completed copies</div><div class='add'>+ * @nn: Network namespace with possible active copy information</div><div class='add'>+ */</div><div class='add'>+void nfsd4_async_copy_reaper(struct nfsd_net *nn)</div><div class='ctx'> {</div><div class='del'>-	bool value;</div><div class='add'>+	struct nfs4_client *clp;</div><div class='add'>+	struct nfsd4_copy *copy;</div><div class='add'>+	LIST_HEAD(reaplist);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;nn-&gt;client_lock);</div><div class='add'>+	list_for_each_entry(clp, &amp;nn-&gt;client_lru, cl_lru) {</div><div class='add'>+		struct list_head *pos, *next;</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;clp-&gt;async_lock);</div><div class='add'>+		list_for_each_safe(pos, next, &amp;clp-&gt;async_copies) {</div><div class='add'>+			copy = list_entry(pos, struct nfsd4_copy, copies);</div><div class='add'>+			if (test_bit(NFSD4_COPY_F_OFFLOAD_DONE, &amp;copy-&gt;cp_flags)) {</div><div class='add'>+				if (--copy-&gt;cp_ttl) {</div><div class='add'>+					list_del_init(&amp;copy-&gt;copies);</div><div class='add'>+					list_add(&amp;copy-&gt;copies, &amp;reaplist);</div><div class='add'>+				}</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;clp-&gt;async_lock);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;nn-&gt;client_lock);</div><div class='add'>+</div><div class='add'>+	while (!list_empty(&amp;reaplist)) {</div><div class='add'>+		copy = list_first_entry(&amp;reaplist, struct nfsd4_copy, copies);</div><div class='add'>+		list_del_init(&amp;copy-&gt;copies);</div><div class='add'>+		cleanup_async_copy(copy);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;copy-&gt;cp_clp-&gt;async_lock);</div><div class='del'>-	value = copy-&gt;stopped;</div><div class='del'>-	if (!copy-&gt;stopped)</div><div class='del'>-		copy-&gt;stopped = true;</div><div class='del'>-	spin_unlock(&amp;copy-&gt;cp_clp-&gt;async_lock);</div><div class='del'>-	return value;</div><div class='add'>+static void nfs4_put_copy(struct nfsd4_copy *copy)</div><div class='add'>+{</div><div class='add'>+	if (!refcount_dec_and_test(&amp;copy-&gt;refcount))</div><div class='add'>+		return;</div><div class='add'>+	kfree(copy-&gt;cp_src);</div><div class='add'>+	kfree(copy);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void nfsd4_stop_copy(struct nfsd4_copy *copy)</div><div class='ctx'> {</div><div class='del'>-	/* only 1 thread should stop the copy */</div><div class='del'>-	if (!check_and_set_stop_copy(copy))</div><div class='add'>+	trace_nfsd_copy_async_cancel(copy);</div><div class='add'>+	if (!test_and_set_bit(NFSD4_COPY_F_STOPPED, &amp;copy-&gt;cp_flags)) {</div><div class='ctx'> 		kthread_stop(copy-&gt;copy_task);</div><div class='add'>+		copy-&gt;nfserr = nfs_ok;</div><div class='add'>+		set_bit(NFSD4_COPY_F_COMPLETED, &amp;copy-&gt;cp_flags);</div><div class='add'>+	}</div><div class='ctx'> 	nfs4_put_copy(copy);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct nfsd4_copy *nfsd4_get_copy(struct nfs4_client *clp)</div><div class='add'>+static struct nfsd4_copy *nfsd4_unhash_copy(struct nfs4_client *clp)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd4_copy *copy = NULL;</div><div class='ctx'> </div><div class='hunk'>@@ -1148,6 +1445,9 @@ static struct nfsd4_copy *nfsd4_get_copy(struct nfs4_client *clp)</div><div class='ctx'> 		copy = list_first_entry(&amp;clp-&gt;async_copies, struct nfsd4_copy,</div><div class='ctx'> 					copies);</div><div class='ctx'> 		refcount_inc(&amp;copy-&gt;refcount);</div><div class='add'>+		copy-&gt;cp_clp = NULL;</div><div class='add'>+		if (!list_empty(&amp;copy-&gt;copies))</div><div class='add'>+			list_del_init(&amp;copy-&gt;copies);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;clp-&gt;async_lock);</div><div class='ctx'> 	return copy;</div><div class='hunk'>@@ -1157,7 +1457,7 @@ void nfsd4_shutdown_copy(struct nfs4_client *clp)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd4_copy *copy;</div><div class='ctx'> </div><div class='del'>-	while ((copy = nfsd4_get_copy(clp)) != NULL)</div><div class='add'>+	while ((copy = nfsd4_unhash_copy(clp)) != NULL)</div><div class='ctx'> 		nfsd4_stop_copy(copy);</div><div class='ctx'> }</div><div class='ctx'> #ifdef CONFIG_NFSD_V4_2_INTER_SSC</div><div class='hunk'>@@ -1175,15 +1475,16 @@ extern void nfs_sb_deactive(struct super_block *sb);</div><div class='ctx'>  * setup a work entry in the ssc delayed unmount list.</div><div class='ctx'>  */</div><div class='ctx'> static __be32 nfsd4_ssc_setup_dul(struct nfsd_net *nn, char *ipaddr,</div><div class='del'>-		struct nfsd4_ssc_umount_item **retwork, struct vfsmount **ss_mnt)</div><div class='add'>+				  struct nfsd4_ssc_umount_item **nsui,</div><div class='add'>+				  struct svc_rqst *rqstp)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd4_ssc_umount_item *ni = NULL;</div><div class='ctx'> 	struct nfsd4_ssc_umount_item *work = NULL;</div><div class='ctx'> 	struct nfsd4_ssc_umount_item *tmp;</div><div class='ctx'> 	DEFINE_WAIT(wait);</div><div class='add'>+	__be32 status = 0;</div><div class='ctx'> </div><div class='del'>-	*ss_mnt = NULL;</div><div class='del'>-	*retwork = NULL;</div><div class='add'>+	*nsui = NULL;</div><div class='ctx'> 	work = kzalloc(sizeof(*work), GFP_KERNEL);</div><div class='ctx'> try_again:</div><div class='ctx'> 	spin_lock(&amp;nn-&gt;nfsd_ssc_lock);</div><div class='hunk'>@@ -1193,57 +1494,58 @@ try_again:</div><div class='ctx'> 		/* found a match */</div><div class='ctx'> 		if (ni-&gt;nsui_busy) {</div><div class='ctx'> 			/*  wait - and try again */</div><div class='del'>-			prepare_to_wait(&amp;nn-&gt;nfsd_ssc_waitq, &amp;wait,</div><div class='del'>-				TASK_INTERRUPTIBLE);</div><div class='add'>+			prepare_to_wait(&amp;nn-&gt;nfsd_ssc_waitq, &amp;wait, TASK_IDLE);</div><div class='ctx'> 			spin_unlock(&amp;nn-&gt;nfsd_ssc_lock);</div><div class='ctx'> </div><div class='ctx'> 			/* allow 20secs for mount/unmount for now - revisit */</div><div class='del'>-			if (signal_pending(current) ||</div><div class='add'>+			if (svc_thread_should_stop(rqstp) ||</div><div class='ctx'> 					(schedule_timeout(20*HZ) == 0)) {</div><div class='add'>+				finish_wait(&amp;nn-&gt;nfsd_ssc_waitq, &amp;wait);</div><div class='ctx'> 				kfree(work);</div><div class='ctx'> 				return nfserr_eagain;</div><div class='ctx'> 			}</div><div class='ctx'> 			finish_wait(&amp;nn-&gt;nfsd_ssc_waitq, &amp;wait);</div><div class='ctx'> 			goto try_again;</div><div class='ctx'> 		}</div><div class='del'>-		*ss_mnt = ni-&gt;nsui_vfsmount;</div><div class='add'>+		*nsui = ni;</div><div class='ctx'> 		refcount_inc(&amp;ni-&gt;nsui_refcnt);</div><div class='ctx'> 		spin_unlock(&amp;nn-&gt;nfsd_ssc_lock);</div><div class='ctx'> 		kfree(work);</div><div class='ctx'> </div><div class='del'>-		/* return vfsmount in ss_mnt */</div><div class='add'>+		/* return vfsmount in (*nsui)-&gt;nsui_vfsmount */</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (work) {</div><div class='del'>-		strncpy(work-&gt;nsui_ipaddr, ipaddr, sizeof(work-&gt;nsui_ipaddr));</div><div class='add'>+		strscpy(work-&gt;nsui_ipaddr, ipaddr, sizeof(work-&gt;nsui_ipaddr));</div><div class='ctx'> 		refcount_set(&amp;work-&gt;nsui_refcnt, 2);</div><div class='ctx'> 		work-&gt;nsui_busy = true;</div><div class='ctx'> 		list_add_tail(&amp;work-&gt;nsui_list, &amp;nn-&gt;nfsd_ssc_mount_list);</div><div class='del'>-		*retwork = work;</div><div class='del'>-	}</div><div class='add'>+		*nsui = work;</div><div class='add'>+	} else</div><div class='add'>+		status = nfserr_resource;</div><div class='ctx'> 	spin_unlock(&amp;nn-&gt;nfsd_ssc_lock);</div><div class='del'>-	return 0;</div><div class='add'>+	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void nfsd4_ssc_update_dul_work(struct nfsd_net *nn,</div><div class='del'>-		struct nfsd4_ssc_umount_item *work, struct vfsmount *ss_mnt)</div><div class='add'>+static void nfsd4_ssc_update_dul(struct nfsd_net *nn,</div><div class='add'>+				 struct nfsd4_ssc_umount_item *nsui,</div><div class='add'>+				 struct vfsmount *ss_mnt)</div><div class='ctx'> {</div><div class='del'>-	/* set nsui_vfsmount, clear busy flag and wakeup waiters */</div><div class='ctx'> 	spin_lock(&amp;nn-&gt;nfsd_ssc_lock);</div><div class='del'>-	work-&gt;nsui_vfsmount = ss_mnt;</div><div class='del'>-	work-&gt;nsui_busy = false;</div><div class='add'>+	nsui-&gt;nsui_vfsmount = ss_mnt;</div><div class='add'>+	nsui-&gt;nsui_busy = false;</div><div class='ctx'> 	wake_up_all(&amp;nn-&gt;nfsd_ssc_waitq);</div><div class='ctx'> 	spin_unlock(&amp;nn-&gt;nfsd_ssc_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void nfsd4_ssc_cancel_dul_work(struct nfsd_net *nn,</div><div class='del'>-		struct nfsd4_ssc_umount_item *work)</div><div class='add'>+static void nfsd4_ssc_cancel_dul(struct nfsd_net *nn,</div><div class='add'>+				 struct nfsd4_ssc_umount_item *nsui)</div><div class='ctx'> {</div><div class='ctx'> 	spin_lock(&amp;nn-&gt;nfsd_ssc_lock);</div><div class='del'>-	list_del(&amp;work-&gt;nsui_list);</div><div class='add'>+	list_del(&amp;nsui-&gt;nsui_list);</div><div class='ctx'> 	wake_up_all(&amp;nn-&gt;nfsd_ssc_waitq);</div><div class='ctx'> 	spin_unlock(&amp;nn-&gt;nfsd_ssc_lock);</div><div class='del'>-	kfree(work);</div><div class='add'>+	kfree(nsui);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -1251,7 +1553,7 @@ static void nfsd4_ssc_cancel_dul_work(struct nfsd_net *nn,</div><div class='ctx'>  */</div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_interssc_connect(struct nl4_server *nss, struct svc_rqst *rqstp,</div><div class='del'>-		       struct vfsmount **mount)</div><div class='add'>+		       struct nfsd4_ssc_umount_item **nsui)</div><div class='ctx'> {</div><div class='ctx'> 	struct file_system_type *type;</div><div class='ctx'> 	struct vfsmount *ss_mnt;</div><div class='hunk'>@@ -1262,7 +1564,6 @@ nfsd4_interssc_connect(struct nl4_server *nss, struct svc_rqst *rqstp,</div><div class='ctx'> 	char *ipaddr, *dev_name, *raw_data;</div><div class='ctx'> 	int len, raw_len;</div><div class='ctx'> 	__be32 status = nfserr_inval;</div><div class='del'>-	struct nfsd4_ssc_umount_item *work = NULL;</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(SVC_NET(rqstp), nfsd_net_id);</div><div class='ctx'> </div><div class='ctx'> 	naddr = &amp;nss-&gt;u.nl4_addr;</div><div class='hunk'>@@ -1270,6 +1571,7 @@ nfsd4_interssc_connect(struct nl4_server *nss, struct svc_rqst *rqstp,</div><div class='ctx'> 					 naddr-&gt;addr_len,</div><div class='ctx'> 					 (struct sockaddr *)&amp;tmp_addr,</div><div class='ctx'> 					 sizeof(tmp_addr));</div><div class='add'>+	*nsui = NULL;</div><div class='ctx'> 	if (tmp_addrlen == 0)</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> </div><div class='hunk'>@@ -1312,10 +1614,10 @@ nfsd4_interssc_connect(struct nl4_server *nss, struct svc_rqst *rqstp,</div><div class='ctx'> 		goto out_free_rawdata;</div><div class='ctx'> 	snprintf(dev_name, len + 5, "%s%s%s:/", startsep, ipaddr, endsep);</div><div class='ctx'> </div><div class='del'>-	status = nfsd4_ssc_setup_dul(nn, ipaddr, &amp;work, &amp;ss_mnt);</div><div class='add'>+	status = nfsd4_ssc_setup_dul(nn, ipaddr, nsui, rqstp);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		goto out_free_devname;</div><div class='del'>-	if (ss_mnt)</div><div class='add'>+	if ((*nsui)-&gt;nsui_vfsmount)</div><div class='ctx'> 		goto out_done;</div><div class='ctx'> </div><div class='ctx'> 	/* Use an 'internal' mount: SB_KERNMOUNT -&gt; MNT_INTERNAL */</div><div class='hunk'>@@ -1323,15 +1625,12 @@ nfsd4_interssc_connect(struct nl4_server *nss, struct svc_rqst *rqstp,</div><div class='ctx'> 	module_put(type-&gt;owner);</div><div class='ctx'> 	if (IS_ERR(ss_mnt)) {</div><div class='ctx'> 		status = nfserr_nodev;</div><div class='del'>-		if (work)</div><div class='del'>-			nfsd4_ssc_cancel_dul_work(nn, work);</div><div class='add'>+		nfsd4_ssc_cancel_dul(nn, *nsui);</div><div class='ctx'> 		goto out_free_devname;</div><div class='ctx'> 	}</div><div class='del'>-	if (work)</div><div class='del'>-		nfsd4_ssc_update_dul_work(nn, work, ss_mnt);</div><div class='add'>+	nfsd4_ssc_update_dul(nn, *nsui, ss_mnt);</div><div class='ctx'> out_done:</div><div class='ctx'> 	status = 0;</div><div class='del'>-	*mount = ss_mnt;</div><div class='ctx'> </div><div class='ctx'> out_free_devname:</div><div class='ctx'> 	kfree(dev_name);</div><div class='hunk'>@@ -1343,13 +1642,6 @@ out_err:</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void</div><div class='del'>-nfsd4_interssc_disconnect(struct vfsmount *ss_mnt)</div><div class='del'>-{</div><div class='del'>-	nfs_do_sb_deactive(ss_mnt-&gt;mnt_sb);</div><div class='del'>-	mntput(ss_mnt);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /*</div><div class='ctx'>  * Verify COPY destination stateid.</div><div class='ctx'>  *</div><div class='hunk'>@@ -1362,7 +1654,7 @@ nfsd4_interssc_disconnect(struct vfsmount *ss_mnt)</div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_setup_inter_ssc(struct svc_rqst *rqstp,</div><div class='ctx'> 		      struct nfsd4_compound_state *cstate,</div><div class='del'>-		      struct nfsd4_copy *copy, struct vfsmount **mount)</div><div class='add'>+		      struct nfsd4_copy *copy)</div><div class='ctx'> {</div><div class='ctx'> 	struct svc_fh *s_fh = NULL;</div><div class='ctx'> 	stateid_t *s_stid = &amp;copy-&gt;cp_src_stateid;</div><div class='hunk'>@@ -1375,7 +1667,7 @@ nfsd4_setup_inter_ssc(struct svc_rqst *rqstp,</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	status = nfsd4_interssc_connect(&amp;copy-&gt;cp_src, rqstp, mount);</div><div class='add'>+	status = nfsd4_interssc_connect(copy-&gt;cp_src, rqstp, &amp;copy-&gt;ss_nsui);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -1393,45 +1685,26 @@ out:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='del'>-nfsd4_cleanup_inter_ssc(struct vfsmount *ss_mnt, struct nfsd_file *src,</div><div class='add'>+nfsd4_cleanup_inter_ssc(struct nfsd4_ssc_umount_item *nsui, struct file *filp,</div><div class='ctx'> 			struct nfsd_file *dst)</div><div class='ctx'> {</div><div class='del'>-	bool found = false;</div><div class='del'>-	long timeout;</div><div class='del'>-	struct nfsd4_ssc_umount_item *tmp;</div><div class='del'>-	struct nfsd4_ssc_umount_item *ni = NULL;</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(dst-&gt;nf_net, nfsd_net_id);</div><div class='add'>+	long timeout = msecs_to_jiffies(nfsd4_ssc_umount_timeout);</div><div class='ctx'> </div><div class='del'>-	nfs42_ssc_close(src-&gt;nf_file);</div><div class='del'>-	nfsd_file_put(dst);</div><div class='del'>-	fput(src-&gt;nf_file);</div><div class='add'>+	nfs42_ssc_close(filp);</div><div class='add'>+	fput(filp);</div><div class='ctx'> </div><div class='del'>-	if (!nn) {</div><div class='del'>-		mntput(ss_mnt);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='ctx'> 	spin_lock(&amp;nn-&gt;nfsd_ssc_lock);</div><div class='del'>-	timeout = msecs_to_jiffies(nfsd4_ssc_umount_timeout);</div><div class='del'>-	list_for_each_entry_safe(ni, tmp, &amp;nn-&gt;nfsd_ssc_mount_list, nsui_list) {</div><div class='del'>-		if (ni-&gt;nsui_vfsmount-&gt;mnt_sb == ss_mnt-&gt;mnt_sb) {</div><div class='del'>-			list_del(&amp;ni-&gt;nsui_list);</div><div class='del'>-			/*</div><div class='del'>-			 * vfsmount can be shared by multiple exports,</div><div class='del'>-			 * decrement refcnt. If the count drops to 1 it</div><div class='del'>-			 * will be unmounted when nsui_expire expires.</div><div class='del'>-			 */</div><div class='del'>-			refcount_dec(&amp;ni-&gt;nsui_refcnt);</div><div class='del'>-			ni-&gt;nsui_expire = jiffies + timeout;</div><div class='del'>-			list_add_tail(&amp;ni-&gt;nsui_list, &amp;nn-&gt;nfsd_ssc_mount_list);</div><div class='del'>-			found = true;</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='add'>+	list_del(&amp;nsui-&gt;nsui_list);</div><div class='add'>+	/*</div><div class='add'>+	 * vfsmount can be shared by multiple exports,</div><div class='add'>+	 * decrement refcnt. If the count drops to 1 it</div><div class='add'>+	 * will be unmounted when nsui_expire expires.</div><div class='add'>+	 */</div><div class='add'>+	refcount_dec(&amp;nsui-&gt;nsui_refcnt);</div><div class='add'>+	nsui-&gt;nsui_expire = jiffies + timeout;</div><div class='add'>+	list_add_tail(&amp;nsui-&gt;nsui_list, &amp;nn-&gt;nfsd_ssc_mount_list);</div><div class='ctx'> 	spin_unlock(&amp;nn-&gt;nfsd_ssc_lock);</div><div class='del'>-	if (!found) {</div><div class='del'>-		mntput(ss_mnt);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #else /* CONFIG_NFSD_V4_2_INTER_SSC */</div><div class='hunk'>@@ -1439,24 +1712,17 @@ nfsd4_cleanup_inter_ssc(struct vfsmount *ss_mnt, struct nfsd_file *src,</div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_setup_inter_ssc(struct svc_rqst *rqstp,</div><div class='ctx'> 		      struct nfsd4_compound_state *cstate,</div><div class='del'>-		      struct nfsd4_copy *copy,</div><div class='del'>-		      struct vfsmount **mount)</div><div class='add'>+		      struct nfsd4_copy *copy)</div><div class='ctx'> {</div><div class='del'>-	*mount = NULL;</div><div class='ctx'> 	return nfserr_inval;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='del'>-nfsd4_cleanup_inter_ssc(struct vfsmount *ss_mnt, struct nfsd_file *src,</div><div class='add'>+nfsd4_cleanup_inter_ssc(struct nfsd4_ssc_umount_item *nsui, struct file *filp,</div><div class='ctx'> 			struct nfsd_file *dst)</div><div class='ctx'> {</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void</div><div class='del'>-nfsd4_interssc_disconnect(struct vfsmount *ss_mnt)</div><div class='del'>-{</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static struct file *nfs42_ssc_open(struct vfsmount *ss_mnt,</div><div class='ctx'> 				   struct nfs_fh *src_fh,</div><div class='ctx'> 				   nfs4_stateid *stateid)</div><div class='hunk'>@@ -1475,82 +1741,98 @@ nfsd4_setup_intra_ssc(struct svc_rqst *rqstp,</div><div class='ctx'> 				 &amp;copy-&gt;nf_dst);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void</div><div class='del'>-nfsd4_cleanup_intra_ssc(struct nfsd_file *src, struct nfsd_file *dst)</div><div class='del'>-{</div><div class='del'>-	nfsd_file_put(src);</div><div class='del'>-	nfsd_file_put(dst);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static void nfsd4_cb_offload_release(struct nfsd4_callback *cb)</div><div class='ctx'> {</div><div class='del'>-	struct nfsd4_copy *copy = container_of(cb, struct nfsd4_copy, cp_cb);</div><div class='add'>+	struct nfsd4_cb_offload *cbo =</div><div class='add'>+		container_of(cb, struct nfsd4_cb_offload, co_cb);</div><div class='add'>+	struct nfsd4_copy *copy =</div><div class='add'>+		container_of(cbo, struct nfsd4_copy, cp_cb_offload);</div><div class='ctx'> </div><div class='del'>-	nfs4_put_copy(copy);</div><div class='add'>+	set_bit(NFSD4_COPY_F_OFFLOAD_DONE, &amp;copy-&gt;cp_flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int nfsd4_cb_offload_done(struct nfsd4_callback *cb,</div><div class='ctx'> 				 struct rpc_task *task)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_cb_offload *cbo =</div><div class='add'>+		container_of(cb, struct nfsd4_cb_offload, co_cb);</div><div class='add'>+</div><div class='add'>+	trace_nfsd_cb_offload_done(&amp;cbo-&gt;co_res.cb_stateid, task);</div><div class='add'>+	switch (task-&gt;tk_status) {</div><div class='add'>+	case -NFS4ERR_DELAY:</div><div class='add'>+		if (cbo-&gt;co_retries--) {</div><div class='add'>+			rpc_delay(task, HZ / 5);</div><div class='add'>+			return 0;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	nfsd41_cb_destroy_referring_call_list(cb);</div><div class='ctx'> 	return 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct nfsd4_callback_ops nfsd4_cb_offload_ops = {</div><div class='ctx'> 	.release = nfsd4_cb_offload_release,</div><div class='del'>-	.done = nfsd4_cb_offload_done</div><div class='add'>+	.done = nfsd4_cb_offload_done,</div><div class='add'>+	.opcode = OP_CB_OFFLOAD,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static void nfsd4_init_copy_res(struct nfsd4_copy *copy, bool sync)</div><div class='ctx'> {</div><div class='ctx'> 	copy-&gt;cp_res.wr_stable_how =</div><div class='del'>-		copy-&gt;committed ? NFS_FILE_SYNC : NFS_UNSTABLE;</div><div class='del'>-	copy-&gt;cp_synchronous = sync;</div><div class='del'>-	gen_boot_verifier(&amp;copy-&gt;cp_res.wr_verifier, copy-&gt;cp_clp-&gt;net);</div><div class='add'>+		test_bit(NFSD4_COPY_F_COMMITTED, &amp;copy-&gt;cp_flags) ?</div><div class='add'>+			NFS_FILE_SYNC : NFS_UNSTABLE;</div><div class='add'>+	nfsd4_copy_set_sync(copy, sync);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static ssize_t _nfsd_copy_file_range(struct nfsd4_copy *copy)</div><div class='add'>+static ssize_t _nfsd_copy_file_range(struct nfsd4_copy *copy,</div><div class='add'>+				     struct file *dst,</div><div class='add'>+				     struct file *src)</div><div class='ctx'> {</div><div class='add'>+	errseq_t since;</div><div class='ctx'> 	ssize_t bytes_copied = 0;</div><div class='ctx'> 	u64 bytes_total = copy-&gt;cp_count;</div><div class='ctx'> 	u64 src_pos = copy-&gt;cp_src_pos;</div><div class='ctx'> 	u64 dst_pos = copy-&gt;cp_dst_pos;</div><div class='del'>-	__be32 status;</div><div class='add'>+	int status;</div><div class='add'>+	loff_t end;</div><div class='ctx'> </div><div class='ctx'> 	/* See RFC 7862 p.67: */</div><div class='ctx'> 	if (bytes_total == 0)</div><div class='ctx'> 		bytes_total = ULLONG_MAX;</div><div class='ctx'> 	do {</div><div class='add'>+		/* Only async copies can be stopped here */</div><div class='ctx'> 		if (kthread_should_stop())</div><div class='ctx'> 			break;</div><div class='del'>-		bytes_copied = nfsd_copy_file_range(copy-&gt;nf_src-&gt;nf_file,</div><div class='del'>-				src_pos, copy-&gt;nf_dst-&gt;nf_file, dst_pos,</div><div class='del'>-				bytes_total);</div><div class='add'>+		bytes_copied = nfsd_copy_file_range(src, src_pos, dst, dst_pos,</div><div class='add'>+						    bytes_total);</div><div class='ctx'> 		if (bytes_copied &lt;= 0)</div><div class='ctx'> 			break;</div><div class='ctx'> 		bytes_total -= bytes_copied;</div><div class='ctx'> 		copy-&gt;cp_res.wr_bytes_written += bytes_copied;</div><div class='ctx'> 		src_pos += bytes_copied;</div><div class='ctx'> 		dst_pos += bytes_copied;</div><div class='del'>-	} while (bytes_total &gt; 0 &amp;&amp; !copy-&gt;cp_synchronous);</div><div class='add'>+	} while (bytes_total &gt; 0 &amp;&amp; nfsd4_copy_is_async(copy));</div><div class='ctx'> 	/* for a non-zero asynchronous copy do a commit of data */</div><div class='del'>-	if (!copy-&gt;cp_synchronous &amp;&amp; copy-&gt;cp_res.wr_bytes_written &gt; 0) {</div><div class='del'>-		down_write(&amp;copy-&gt;nf_dst-&gt;nf_rwsem);</div><div class='del'>-		status = vfs_fsync_range(copy-&gt;nf_dst-&gt;nf_file,</div><div class='del'>-					 copy-&gt;cp_dst_pos,</div><div class='del'>-					 copy-&gt;cp_res.wr_bytes_written, 0);</div><div class='del'>-		up_write(&amp;copy-&gt;nf_dst-&gt;nf_rwsem);</div><div class='add'>+	if (nfsd4_copy_is_async(copy) &amp;&amp; copy-&gt;cp_res.wr_bytes_written &gt; 0) {</div><div class='add'>+		since = READ_ONCE(dst-&gt;f_wb_err);</div><div class='add'>+		end = copy-&gt;cp_dst_pos + copy-&gt;cp_res.wr_bytes_written - 1;</div><div class='add'>+		status = vfs_fsync_range(dst, copy-&gt;cp_dst_pos, end, 0);</div><div class='add'>+		if (!status)</div><div class='add'>+			status = filemap_check_wb_err(dst-&gt;f_mapping, since);</div><div class='ctx'> 		if (!status)</div><div class='del'>-			copy-&gt;committed = true;</div><div class='add'>+			set_bit(NFSD4_COPY_F_COMMITTED, &amp;copy-&gt;cp_flags);</div><div class='ctx'> 	}</div><div class='ctx'> 	return bytes_copied;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static __be32 nfsd4_do_copy(struct nfsd4_copy *copy, bool sync)</div><div class='add'>+static __be32 nfsd4_do_copy(struct nfsd4_copy *copy,</div><div class='add'>+			    struct file *src, struct file *dst,</div><div class='add'>+			    bool sync)</div><div class='ctx'> {</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> 	ssize_t bytes;</div><div class='ctx'> </div><div class='del'>-	bytes = _nfsd_copy_file_range(copy);</div><div class='add'>+	bytes = _nfsd_copy_file_range(copy, dst, src);</div><div class='add'>+</div><div class='ctx'> 	/* for async copy, we ignore the error, client can always retry</div><div class='ctx'> 	 * to get the error</div><div class='ctx'> 	 */</div><div class='hunk'>@@ -1560,13 +1842,6 @@ static __be32 nfsd4_do_copy(struct nfsd4_copy *copy, bool sync)</div><div class='ctx'> 		nfsd4_init_copy_res(copy, sync);</div><div class='ctx'> 		status = nfs_ok;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	if (!copy-&gt;cp_intra) /* Inter server SSC */</div><div class='del'>-		nfsd4_cleanup_inter_ssc(copy-&gt;ss_mnt, copy-&gt;nf_src,</div><div class='del'>-					copy-&gt;nf_dst);</div><div class='del'>-	else</div><div class='del'>-		nfsd4_cleanup_intra_ssc(copy-&gt;nf_src, copy-&gt;nf_dst);</div><div class='del'>-</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1575,74 +1850,107 @@ static void dup_copy_fields(struct nfsd4_copy *src, struct nfsd4_copy *dst)</div><div class='ctx'> 	dst-&gt;cp_src_pos = src-&gt;cp_src_pos;</div><div class='ctx'> 	dst-&gt;cp_dst_pos = src-&gt;cp_dst_pos;</div><div class='ctx'> 	dst-&gt;cp_count = src-&gt;cp_count;</div><div class='del'>-	dst-&gt;cp_synchronous = src-&gt;cp_synchronous;</div><div class='add'>+	dst-&gt;cp_flags = src-&gt;cp_flags;</div><div class='ctx'> 	memcpy(&amp;dst-&gt;cp_res, &amp;src-&gt;cp_res, sizeof(src-&gt;cp_res));</div><div class='ctx'> 	memcpy(&amp;dst-&gt;fh, &amp;src-&gt;fh, sizeof(src-&gt;fh));</div><div class='ctx'> 	dst-&gt;cp_clp = src-&gt;cp_clp;</div><div class='ctx'> 	dst-&gt;nf_dst = nfsd_file_get(src-&gt;nf_dst);</div><div class='del'>-	dst-&gt;cp_intra = src-&gt;cp_intra;</div><div class='del'>-	if (src-&gt;cp_intra) /* for inter, file_src doesn't exist yet */</div><div class='add'>+	/* for inter, nf_src doesn't exist yet */</div><div class='add'>+	if (!nfsd4_ssc_is_inter(src))</div><div class='ctx'> 		dst-&gt;nf_src = nfsd_file_get(src-&gt;nf_src);</div><div class='ctx'> </div><div class='ctx'> 	memcpy(&amp;dst-&gt;cp_stateid, &amp;src-&gt;cp_stateid, sizeof(src-&gt;cp_stateid));</div><div class='del'>-	memcpy(&amp;dst-&gt;cp_src, &amp;src-&gt;cp_src, sizeof(struct nl4_server));</div><div class='add'>+	memcpy(dst-&gt;cp_src, src-&gt;cp_src, sizeof(struct nl4_server));</div><div class='ctx'> 	memcpy(&amp;dst-&gt;stateid, &amp;src-&gt;stateid, sizeof(src-&gt;stateid));</div><div class='ctx'> 	memcpy(&amp;dst-&gt;c_fh, &amp;src-&gt;c_fh, sizeof(src-&gt;c_fh));</div><div class='del'>-	dst-&gt;ss_mnt = src-&gt;ss_mnt;</div><div class='add'>+	dst-&gt;ss_nsui = src-&gt;ss_nsui;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void release_copy_files(struct nfsd4_copy *copy)</div><div class='add'>+{</div><div class='add'>+	if (copy-&gt;nf_src)</div><div class='add'>+		nfsd_file_put(copy-&gt;nf_src);</div><div class='add'>+	if (copy-&gt;nf_dst)</div><div class='add'>+		nfsd_file_put(copy-&gt;nf_dst);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void cleanup_async_copy(struct nfsd4_copy *copy)</div><div class='ctx'> {</div><div class='ctx'> 	nfs4_free_copy_state(copy);</div><div class='del'>-	nfsd_file_put(copy-&gt;nf_dst);</div><div class='del'>-	if (copy-&gt;cp_intra)</div><div class='del'>-		nfsd_file_put(copy-&gt;nf_src);</div><div class='del'>-	spin_lock(&amp;copy-&gt;cp_clp-&gt;async_lock);</div><div class='del'>-	list_del(&amp;copy-&gt;copies);</div><div class='del'>-	spin_unlock(&amp;copy-&gt;cp_clp-&gt;async_lock);</div><div class='add'>+	release_copy_files(copy);</div><div class='add'>+	if (copy-&gt;cp_clp) {</div><div class='add'>+		spin_lock(&amp;copy-&gt;cp_clp-&gt;async_lock);</div><div class='add'>+		if (!list_empty(&amp;copy-&gt;copies))</div><div class='add'>+			list_del_init(&amp;copy-&gt;copies);</div><div class='add'>+		spin_unlock(&amp;copy-&gt;cp_clp-&gt;async_lock);</div><div class='add'>+	}</div><div class='ctx'> 	nfs4_put_copy(copy);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void nfsd4_send_cb_offload(struct nfsd4_copy *copy)</div><div class='add'>+{</div><div class='add'>+	struct nfsd4_cb_offload *cbo = &amp;copy-&gt;cp_cb_offload;</div><div class='add'>+</div><div class='add'>+	memcpy(&amp;cbo-&gt;co_res, &amp;copy-&gt;cp_res, sizeof(copy-&gt;cp_res));</div><div class='add'>+	memcpy(&amp;cbo-&gt;co_fh, &amp;copy-&gt;fh, sizeof(copy-&gt;fh));</div><div class='add'>+	cbo-&gt;co_nfserr = copy-&gt;nfserr;</div><div class='add'>+	cbo-&gt;co_retries = 5;</div><div class='add'>+</div><div class='add'>+	nfsd4_init_cb(&amp;cbo-&gt;co_cb, copy-&gt;cp_clp, &amp;nfsd4_cb_offload_ops,</div><div class='add'>+		      NFSPROC4_CLNT_CB_OFFLOAD);</div><div class='add'>+	nfsd41_cb_referring_call(&amp;cbo-&gt;co_cb, &amp;cbo-&gt;co_referring_sessionid,</div><div class='add'>+				 cbo-&gt;co_referring_slotid,</div><div class='add'>+				 cbo-&gt;co_referring_seqno);</div><div class='add'>+	trace_nfsd_cb_offload(copy-&gt;cp_clp, &amp;cbo-&gt;co_res.cb_stateid,</div><div class='add'>+			      &amp;cbo-&gt;co_fh, copy-&gt;cp_count, copy-&gt;nfserr);</div><div class='add'>+	nfsd4_try_run_cb(&amp;cbo-&gt;co_cb);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * nfsd4_do_async_copy - kthread function for background server-side COPY</div><div class='add'>+ * @data: arguments for COPY operation</div><div class='add'>+ *</div><div class='add'>+ * Return values:</div><div class='add'>+ *   %0: Copy operation is done.</div><div class='add'>+ */</div><div class='ctx'> static int nfsd4_do_async_copy(void *data)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd4_copy *copy = (struct nfsd4_copy *)data;</div><div class='del'>-	struct nfsd4_copy *cb_copy;</div><div class='ctx'> </div><div class='del'>-	if (!copy-&gt;cp_intra) { /* Inter server SSC */</div><div class='del'>-		copy-&gt;nf_src = kzalloc(sizeof(struct nfsd_file), GFP_KERNEL);</div><div class='del'>-		if (!copy-&gt;nf_src) {</div><div class='del'>-			copy-&gt;nfserr = nfserr_serverfault;</div><div class='del'>-			nfsd4_interssc_disconnect(copy-&gt;ss_mnt);</div><div class='del'>-			goto do_callback;</div><div class='del'>-		}</div><div class='del'>-		copy-&gt;nf_src-&gt;nf_file = nfs42_ssc_open(copy-&gt;ss_mnt, &amp;copy-&gt;c_fh,</div><div class='del'>-					      &amp;copy-&gt;stateid);</div><div class='del'>-		if (IS_ERR(copy-&gt;nf_src-&gt;nf_file)) {</div><div class='del'>-			copy-&gt;nfserr = nfserr_offload_denied;</div><div class='del'>-			nfsd4_interssc_disconnect(copy-&gt;ss_mnt);</div><div class='add'>+	trace_nfsd_copy_async(copy);</div><div class='add'>+	if (nfsd4_ssc_is_inter(copy)) {</div><div class='add'>+		struct file *filp;</div><div class='add'>+</div><div class='add'>+		filp = nfs42_ssc_open(copy-&gt;ss_nsui-&gt;nsui_vfsmount,</div><div class='add'>+				      &amp;copy-&gt;c_fh, &amp;copy-&gt;stateid);</div><div class='add'>+		if (IS_ERR(filp)) {</div><div class='add'>+			switch (PTR_ERR(filp)) {</div><div class='add'>+			case -EBADF:</div><div class='add'>+				copy-&gt;nfserr = nfserr_wrong_type;</div><div class='add'>+				break;</div><div class='add'>+			default:</div><div class='add'>+				copy-&gt;nfserr = nfserr_offload_denied;</div><div class='add'>+			}</div><div class='add'>+			/* ss_mnt will be unmounted by the laundromat */</div><div class='ctx'> 			goto do_callback;</div><div class='ctx'> 		}</div><div class='add'>+		copy-&gt;nfserr = nfsd4_do_copy(copy, filp, copy-&gt;nf_dst-&gt;nf_file,</div><div class='add'>+					     false);</div><div class='add'>+		nfsd4_cleanup_inter_ssc(copy-&gt;ss_nsui, filp, copy-&gt;nf_dst);</div><div class='add'>+	} else {</div><div class='add'>+		copy-&gt;nfserr = nfsd4_do_copy(copy, copy-&gt;nf_src-&gt;nf_file,</div><div class='add'>+					     copy-&gt;nf_dst-&gt;nf_file, false);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	copy-&gt;nfserr = nfsd4_do_copy(copy, 0);</div><div class='ctx'> do_callback:</div><div class='del'>-	cb_copy = kzalloc(sizeof(struct nfsd4_copy), GFP_KERNEL);</div><div class='del'>-	if (!cb_copy)</div><div class='del'>-		goto out;</div><div class='del'>-	refcount_set(&amp;cb_copy-&gt;refcount, 1);</div><div class='del'>-	memcpy(&amp;cb_copy-&gt;cp_res, &amp;copy-&gt;cp_res, sizeof(copy-&gt;cp_res));</div><div class='del'>-	cb_copy-&gt;cp_clp = copy-&gt;cp_clp;</div><div class='del'>-	cb_copy-&gt;nfserr = copy-&gt;nfserr;</div><div class='del'>-	memcpy(&amp;cb_copy-&gt;fh, &amp;copy-&gt;fh, sizeof(copy-&gt;fh));</div><div class='del'>-	nfsd4_init_cb(&amp;cb_copy-&gt;cp_cb, cb_copy-&gt;cp_clp,</div><div class='del'>-			&amp;nfsd4_cb_offload_ops, NFSPROC4_CLNT_CB_OFFLOAD);</div><div class='del'>-	trace_nfsd_cb_offload(copy-&gt;cp_clp, &amp;copy-&gt;cp_res.cb_stateid,</div><div class='del'>-			      &amp;copy-&gt;fh, copy-&gt;cp_count, copy-&gt;nfserr);</div><div class='del'>-	nfsd4_run_cb(&amp;cb_copy-&gt;cp_cb);</div><div class='del'>-out:</div><div class='del'>-	if (!copy-&gt;cp_intra)</div><div class='del'>-		kfree(copy-&gt;nf_src);</div><div class='del'>-	cleanup_async_copy(copy);</div><div class='add'>+	/* The kthread exits forthwith. Ensure that a subsequent</div><div class='add'>+	 * OFFLOAD_CANCEL won't try to kill it again. */</div><div class='add'>+	set_bit(NFSD4_COPY_F_STOPPED, &amp;copy-&gt;cp_flags);</div><div class='add'>+</div><div class='add'>+	set_bit(NFSD4_COPY_F_COMPLETED, &amp;copy-&gt;cp_flags);</div><div class='add'>+	trace_nfsd_copy_async_done(copy);</div><div class='add'>+	nfsd4_send_cb_offload(copy);</div><div class='add'>+	atomic_dec(&amp;copy-&gt;cp_nn-&gt;pending_async_copies);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1650,45 +1958,67 @@ static __be32</div><div class='ctx'> nfsd4_copy(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 		union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd_net *nn = net_generic(SVC_NET(rqstp), nfsd_net_id);</div><div class='add'>+	struct nfsd4_copy *async_copy = NULL;</div><div class='ctx'> 	struct nfsd4_copy *copy = &amp;u-&gt;copy;</div><div class='add'>+	struct nfsd42_write_res *result;</div><div class='ctx'> 	__be32 status;</div><div class='del'>-	struct nfsd4_copy *async_copy = NULL;</div><div class='ctx'> </div><div class='del'>-	if (!copy-&gt;cp_intra) { /* Inter server SSC */</div><div class='del'>-		if (!inter_copy_offload_enable || copy-&gt;cp_synchronous) {</div><div class='add'>+	result = &amp;copy-&gt;cp_res;</div><div class='add'>+	nfsd_copy_write_verifier((__be32 *)&amp;result-&gt;wr_verifier.data, nn);</div><div class='add'>+</div><div class='add'>+	copy-&gt;cp_clp = cstate-&gt;clp;</div><div class='add'>+	if (nfsd4_ssc_is_inter(copy)) {</div><div class='add'>+		trace_nfsd_copy_inter(copy);</div><div class='add'>+		if (!inter_copy_offload_enable || nfsd4_copy_is_sync(copy)) {</div><div class='ctx'> 			status = nfserr_notsupp;</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='del'>-		status = nfsd4_setup_inter_ssc(rqstp, cstate, copy,</div><div class='del'>-				&amp;copy-&gt;ss_mnt);</div><div class='del'>-		if (status)</div><div class='add'>+		status = nfsd4_setup_inter_ssc(rqstp, cstate, copy);</div><div class='add'>+		if (status) {</div><div class='add'>+			trace_nfsd_copy_done(copy, status);</div><div class='ctx'> 			return nfserr_offload_denied;</div><div class='add'>+		}</div><div class='ctx'> 	} else {</div><div class='add'>+		trace_nfsd_copy_intra(copy);</div><div class='ctx'> 		status = nfsd4_setup_intra_ssc(rqstp, cstate, copy);</div><div class='del'>-		if (status)</div><div class='add'>+		if (status) {</div><div class='add'>+			trace_nfsd_copy_done(copy, status);</div><div class='ctx'> 			return status;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	copy-&gt;cp_clp = cstate-&gt;clp;</div><div class='ctx'> 	memcpy(&amp;copy-&gt;fh, &amp;cstate-&gt;current_fh.fh_handle,</div><div class='ctx'> 		sizeof(struct knfsd_fh));</div><div class='del'>-	if (!copy-&gt;cp_synchronous) {</div><div class='del'>-		struct nfsd_net *nn = net_generic(SVC_NET(rqstp), nfsd_net_id);</div><div class='del'>-</div><div class='del'>-		status = nfserrno(-ENOMEM);</div><div class='add'>+	if (nfsd4_copy_is_async(copy)) {</div><div class='ctx'> 		async_copy = kzalloc(sizeof(struct nfsd4_copy), GFP_KERNEL);</div><div class='ctx'> 		if (!async_copy)</div><div class='ctx'> 			goto out_err;</div><div class='del'>-		if (!nfs4_init_copy_state(nn, copy))</div><div class='del'>-			goto out_err;</div><div class='add'>+		async_copy-&gt;cp_nn = nn;</div><div class='add'>+		INIT_LIST_HEAD(&amp;async_copy-&gt;copies);</div><div class='ctx'> 		refcount_set(&amp;async_copy-&gt;refcount, 1);</div><div class='del'>-		memcpy(&amp;copy-&gt;cp_res.cb_stateid, &amp;copy-&gt;cp_stateid.stid,</div><div class='del'>-			sizeof(copy-&gt;cp_res.cb_stateid));</div><div class='add'>+		async_copy-&gt;cp_ttl = NFSD_COPY_INITIAL_TTL;</div><div class='add'>+		/* Arbitrary cap on number of pending async copy operations */</div><div class='add'>+		if (atomic_inc_return(&amp;nn-&gt;pending_async_copies) &gt;</div><div class='add'>+				(int)rqstp-&gt;rq_pool-&gt;sp_nrthreads)</div><div class='add'>+			goto out_dec_async_copy_err;</div><div class='add'>+		async_copy-&gt;cp_src = kmalloc(sizeof(*async_copy-&gt;cp_src), GFP_KERNEL);</div><div class='add'>+		if (!async_copy-&gt;cp_src)</div><div class='add'>+			goto out_dec_async_copy_err;</div><div class='add'>+		if (!nfs4_init_copy_state(nn, copy))</div><div class='add'>+			goto out_dec_async_copy_err;</div><div class='add'>+		memcpy(&amp;result-&gt;cb_stateid, &amp;copy-&gt;cp_stateid.cs_stid,</div><div class='add'>+			sizeof(result-&gt;cb_stateid));</div><div class='ctx'> 		dup_copy_fields(copy, async_copy);</div><div class='add'>+		memcpy(async_copy-&gt;cp_cb_offload.co_referring_sessionid.data,</div><div class='add'>+		       cstate-&gt;session-&gt;se_sessionid.data,</div><div class='add'>+		       NFS4_MAX_SESSIONID_LEN);</div><div class='add'>+		async_copy-&gt;cp_cb_offload.co_referring_slotid = cstate-&gt;slot-&gt;sl_index;</div><div class='add'>+		async_copy-&gt;cp_cb_offload.co_referring_seqno = cstate-&gt;slot-&gt;sl_seqid;</div><div class='ctx'> 		async_copy-&gt;copy_task = kthread_create(nfsd4_do_async_copy,</div><div class='ctx'> 				async_copy, "%s", "copy thread");</div><div class='ctx'> 		if (IS_ERR(async_copy-&gt;copy_task))</div><div class='del'>-			goto out_err;</div><div class='add'>+			goto out_dec_async_copy_err;</div><div class='ctx'> 		spin_lock(&amp;async_copy-&gt;cp_clp-&gt;async_lock);</div><div class='ctx'> 		list_add(&amp;async_copy-&gt;copies,</div><div class='ctx'> 				&amp;async_copy-&gt;cp_clp-&gt;async_copies);</div><div class='hunk'>@@ -1696,36 +2026,59 @@ nfsd4_copy(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 		wake_up_process(async_copy-&gt;copy_task);</div><div class='ctx'> 		status = nfs_ok;</div><div class='ctx'> 	} else {</div><div class='del'>-		status = nfsd4_do_copy(copy, 1);</div><div class='add'>+		status = nfsd4_do_copy(copy, copy-&gt;nf_src-&gt;nf_file,</div><div class='add'>+				       copy-&gt;nf_dst-&gt;nf_file, true);</div><div class='ctx'> 	}</div><div class='ctx'> out:</div><div class='add'>+	trace_nfsd_copy_done(copy, status);</div><div class='add'>+	release_copy_files(copy);</div><div class='ctx'> 	return status;</div><div class='add'>+out_dec_async_copy_err:</div><div class='add'>+	if (async_copy)</div><div class='add'>+		atomic_dec(&amp;nn-&gt;pending_async_copies);</div><div class='ctx'> out_err:</div><div class='add'>+	if (nfsd4_ssc_is_inter(copy)) {</div><div class='add'>+		/*</div><div class='add'>+		 * Source's vfsmount of inter-copy will be unmounted</div><div class='add'>+		 * by the laundromat. Use copy instead of async_copy</div><div class='add'>+		 * since async_copy-&gt;ss_nsui might not be set yet.</div><div class='add'>+		 */</div><div class='add'>+		refcount_dec(&amp;copy-&gt;ss_nsui-&gt;nsui_refcnt);</div><div class='add'>+	}</div><div class='ctx'> 	if (async_copy)</div><div class='ctx'> 		cleanup_async_copy(async_copy);</div><div class='del'>-	status = nfserrno(-ENOMEM);</div><div class='del'>-	if (!copy-&gt;cp_intra)</div><div class='del'>-		nfsd4_interssc_disconnect(copy-&gt;ss_mnt);</div><div class='add'>+	status = nfserr_jukebox;</div><div class='ctx'> 	goto out;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-struct nfsd4_copy *</div><div class='del'>-find_async_copy(struct nfs4_client *clp, stateid_t *stateid)</div><div class='add'>+static struct nfsd4_copy *</div><div class='add'>+find_async_copy_locked(struct nfs4_client *clp, stateid_t *stateid)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd4_copy *copy;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;clp-&gt;async_lock);</div><div class='add'>+	lockdep_assert_held(&amp;clp-&gt;async_lock);</div><div class='add'>+</div><div class='ctx'> 	list_for_each_entry(copy, &amp;clp-&gt;async_copies, copies) {</div><div class='del'>-		if (memcmp(&amp;copy-&gt;cp_stateid.stid, stateid, NFS4_STATEID_SIZE))</div><div class='add'>+		if (memcmp(&amp;copy-&gt;cp_stateid.cs_stid, stateid, NFS4_STATEID_SIZE))</div><div class='ctx'> 			continue;</div><div class='del'>-		refcount_inc(&amp;copy-&gt;refcount);</div><div class='del'>-		spin_unlock(&amp;clp-&gt;async_lock);</div><div class='ctx'> 		return copy;</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;clp-&gt;async_lock);</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static struct nfsd4_copy *</div><div class='add'>+find_async_copy(struct nfs4_client *clp, stateid_t *stateid)</div><div class='add'>+{</div><div class='add'>+	struct nfsd4_copy *copy;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;clp-&gt;async_lock);</div><div class='add'>+	copy = find_async_copy_locked(clp, stateid);</div><div class='add'>+	if (copy)</div><div class='add'>+		refcount_inc(&amp;copy-&gt;refcount);</div><div class='add'>+	spin_unlock(&amp;clp-&gt;async_lock);</div><div class='add'>+	return copy;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_offload_cancel(struct svc_rqst *rqstp,</div><div class='ctx'> 		     struct nfsd4_compound_state *cstate,</div><div class='hunk'>@@ -1753,7 +2106,7 @@ nfsd4_copy_notify(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	struct nfsd4_copy_notify *cn = &amp;u-&gt;copy_notify;</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(SVC_NET(rqstp), nfsd_net_id);</div><div class='del'>-	struct nfs4_stid *stid;</div><div class='add'>+	struct nfs4_stid *stid = NULL;</div><div class='ctx'> 	struct nfs4_cpntf_state *cps;</div><div class='ctx'> 	struct nfs4_client *clp = cstate-&gt;clp;</div><div class='ctx'> </div><div class='hunk'>@@ -1762,24 +2115,26 @@ nfsd4_copy_notify(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 					&amp;stid);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		return status;</div><div class='add'>+	if (!stid)</div><div class='add'>+		return nfserr_bad_stateid;</div><div class='ctx'> </div><div class='del'>-	cn-&gt;cpn_sec = nn-&gt;nfsd4_lease;</div><div class='del'>-	cn-&gt;cpn_nsec = 0;</div><div class='add'>+	cn-&gt;cpn_lease_time.tv_sec = nn-&gt;nfsd4_lease;</div><div class='add'>+	cn-&gt;cpn_lease_time.tv_nsec = 0;</div><div class='ctx'> </div><div class='ctx'> 	status = nfserrno(-ENOMEM);</div><div class='ctx'> 	cps = nfs4_alloc_init_cpntf_state(nn, stid);</div><div class='ctx'> 	if (!cps)</div><div class='ctx'> 		goto out;</div><div class='del'>-	memcpy(&amp;cn-&gt;cpn_cnr_stateid, &amp;cps-&gt;cp_stateid.stid, sizeof(stateid_t));</div><div class='add'>+	memcpy(&amp;cn-&gt;cpn_cnr_stateid, &amp;cps-&gt;cp_stateid.cs_stid, sizeof(stateid_t));</div><div class='ctx'> 	memcpy(&amp;cps-&gt;cp_p_stateid, &amp;stid-&gt;sc_stateid, sizeof(stateid_t));</div><div class='ctx'> 	memcpy(&amp;cps-&gt;cp_p_clid, &amp;clp-&gt;cl_clientid, sizeof(clientid_t));</div><div class='ctx'> </div><div class='ctx'> 	/* For now, only return one server address in cpn_src, the</div><div class='ctx'> 	 * address used by the client to connect to this server.</div><div class='ctx'> 	 */</div><div class='del'>-	cn-&gt;cpn_src.nl4_type = NL4_NETADDR;</div><div class='add'>+	cn-&gt;cpn_src-&gt;nl4_type = NL4_NETADDR;</div><div class='ctx'> 	status = nfsd4_set_netaddr((struct sockaddr *)&amp;rqstp-&gt;rq_daddr,</div><div class='del'>-				 &amp;cn-&gt;cpn_src.u.nl4_addr);</div><div class='add'>+				 &amp;cn-&gt;cpn_src-&gt;u.nl4_addr);</div><div class='ctx'> 	WARN_ON_ONCE(status);</div><div class='ctx'> 	if (status) {</div><div class='ctx'> 		nfs4_put_cpntf_state(nn, cps);</div><div class='hunk'>@@ -1800,10 +2155,8 @@ nfsd4_fallocate(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	status = nfs4_preprocess_stateid_op(rqstp, cstate, &amp;cstate-&gt;current_fh,</div><div class='ctx'> 					    &amp;fallocate-&gt;falloc_stateid,</div><div class='ctx'> 					    WR_STATE, &amp;nf, NULL);</div><div class='del'>-	if (status != nfs_ok) {</div><div class='del'>-		dprintk("NFSD: nfsd4_fallocate: couldn't process stateid!\n");</div><div class='add'>+	if (status != nfs_ok)</div><div class='ctx'> 		return status;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	status = nfsd4_vfs_fallocate(rqstp, &amp;cstate-&gt;current_fh, nf-&gt;nf_file,</div><div class='ctx'> 				     fallocate-&gt;falloc_offset,</div><div class='hunk'>@@ -1812,22 +2165,29 @@ nfsd4_fallocate(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	nfsd_file_put(nf);</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='add'>+</div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_offload_status(struct svc_rqst *rqstp,</div><div class='ctx'> 		     struct nfsd4_compound_state *cstate,</div><div class='ctx'> 		     union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd4_offload_status *os = &amp;u-&gt;offload_status;</div><div class='del'>-	__be32 status = 0;</div><div class='add'>+	__be32 status = nfs_ok;</div><div class='ctx'> 	struct nfsd4_copy *copy;</div><div class='ctx'> 	struct nfs4_client *clp = cstate-&gt;clp;</div><div class='ctx'> </div><div class='del'>-	copy = find_async_copy(clp, &amp;os-&gt;stateid);</div><div class='add'>+	os-&gt;completed = false;</div><div class='add'>+	spin_lock(&amp;clp-&gt;async_lock);</div><div class='add'>+	copy = find_async_copy_locked(clp, &amp;os-&gt;stateid);</div><div class='ctx'> 	if (copy) {</div><div class='ctx'> 		os-&gt;count = copy-&gt;cp_res.wr_bytes_written;</div><div class='del'>-		nfs4_put_copy(copy);</div><div class='add'>+		if (test_bit(NFSD4_COPY_F_COMPLETED, &amp;copy-&gt;cp_flags)) {</div><div class='add'>+			os-&gt;completed = true;</div><div class='add'>+			os-&gt;status = copy-&gt;nfserr;</div><div class='add'>+		}</div><div class='ctx'> 	} else</div><div class='ctx'> 		status = nfserr_bad_stateid;</div><div class='add'>+	spin_unlock(&amp;clp-&gt;async_lock);</div><div class='ctx'> </div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='hunk'>@@ -1859,10 +2219,8 @@ nfsd4_seek(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	status = nfs4_preprocess_stateid_op(rqstp, cstate, &amp;cstate-&gt;current_fh,</div><div class='ctx'> 					    &amp;seek-&gt;seek_stateid,</div><div class='ctx'> 					    RD_STATE, &amp;nf, NULL);</div><div class='del'>-	if (status) {</div><div class='del'>-		dprintk("NFSD: nfsd4_seek: couldn't process stateid!\n");</div><div class='add'>+	if (status)</div><div class='ctx'> 		return status;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	switch (seek-&gt;seek_whence) {</div><div class='ctx'> 	case NFS4_CONTENT_DATA:</div><div class='hunk'>@@ -1974,6 +2332,49 @@ nfsd4_verify(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	return status == nfserr_same ? nfs_ok : status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static __be32</div><div class='add'>+nfsd4_get_dir_delegation(struct svc_rqst *rqstp,</div><div class='add'>+			 struct nfsd4_compound_state *cstate,</div><div class='add'>+			 union nfsd4_op_u *u)</div><div class='add'>+{</div><div class='add'>+	struct nfsd4_get_dir_delegation *gdd = &amp;u-&gt;get_dir_delegation;</div><div class='add'>+	struct nfs4_delegation *dd;</div><div class='add'>+	struct nfsd_file *nf;</div><div class='add'>+	__be32 status;</div><div class='add'>+</div><div class='add'>+	status = nfsd_file_acquire_dir(rqstp, &amp;cstate-&gt;current_fh, &amp;nf);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * RFC 8881, section 18.39.3 says:</div><div class='add'>+	 *</div><div class='add'>+	 * "The server may refuse to grant the delegation. In that case, the</div><div class='add'>+	 *  server will return NFS4ERR_DIRDELEG_UNAVAIL."</div><div class='add'>+	 *</div><div class='add'>+	 * This is sub-optimal, since it means that the server would need to</div><div class='add'>+	 * abort compound processing just because the delegation wasn't</div><div class='add'>+	 * available. RFC8881bis should change this to allow the server to</div><div class='add'>+	 * return NFS4_OK with a non-fatal status of GDD4_UNAVAIL in this</div><div class='add'>+	 * situation.</div><div class='add'>+	 */</div><div class='add'>+	dd = nfsd_get_dir_deleg(cstate, gdd, nf);</div><div class='add'>+	nfsd_file_put(nf);</div><div class='add'>+	if (IS_ERR(dd)) {</div><div class='add'>+		int err = PTR_ERR(dd);</div><div class='add'>+</div><div class='add'>+		if (err != -EAGAIN)</div><div class='add'>+			return nfserrno(err);</div><div class='add'>+		gdd-&gt;gddrnf_status = GDD4_UNAVAIL;</div><div class='add'>+		return nfs_ok;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	gdd-&gt;gddrnf_status = GDD4_OK;</div><div class='add'>+	memcpy(&amp;gdd-&gt;gddr_stateid, &amp;dd-&gt;dl_stid.sc_stateid, sizeof(gdd-&gt;gddr_stateid));</div><div class='add'>+	nfs4_put_stid(&amp;dd-&gt;dl_stid);</div><div class='add'>+	return nfs_ok;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> #ifdef CONFIG_NFSD_PNFS</div><div class='ctx'> static const struct nfsd4_layout_ops *</div><div class='ctx'> nfsd4_layout_verify(struct svc_export *exp, unsigned int layout_type)</div><div class='hunk'>@@ -2016,7 +2417,9 @@ nfsd4_getdeviceinfo(struct svc_rqst *rqstp,</div><div class='ctx'> 		return nfserr_noent;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	exp = rqst_exp_find(rqstp, map-&gt;fsid_type, map-&gt;fsid);</div><div class='add'>+	exp = rqst_exp_find(&amp;rqstp-&gt;rq_chandle, SVC_NET(rqstp),</div><div class='add'>+			    rqstp-&gt;rq_client, rqstp-&gt;rq_gssclient,</div><div class='add'>+			    map-&gt;fsid_type, map-&gt;fsid);</div><div class='ctx'> 	if (IS_ERR(exp)) {</div><div class='ctx'> 		dprintk("%s: could not find device id\n", __func__);</div><div class='ctx'> 		return nfserr_noent;</div><div class='hunk'>@@ -2054,7 +2457,7 @@ nfsd4_layoutget(struct svc_rqst *rqstp,</div><div class='ctx'> 	const struct nfsd4_layout_ops *ops;</div><div class='ctx'> 	struct nfs4_layout_stateid *ls;</div><div class='ctx'> 	__be32 nfserr;</div><div class='del'>-	int accmode = NFSD_MAY_READ_IF_EXEC;</div><div class='add'>+	int accmode = NFSD_MAY_READ_IF_EXEC | NFSD_MAY_OWNER_OVERRIDE;</div><div class='ctx'> </div><div class='ctx'> 	switch (lgp-&gt;lg_seg.iomode) {</div><div class='ctx'> 	case IOMODE_READ:</div><div class='hunk'>@@ -2111,7 +2514,7 @@ nfsd4_layoutget(struct svc_rqst *rqstp,</div><div class='ctx'> 	if (atomic_read(&amp;ls-&gt;ls_stid.sc_file-&gt;fi_lo_recalls))</div><div class='ctx'> 		goto out_put_stid;</div><div class='ctx'> </div><div class='del'>-	nfserr = ops-&gt;proc_layoutget(d_inode(current_fh-&gt;fh_dentry),</div><div class='add'>+	nfserr = ops-&gt;proc_layoutget(rqstp, d_inode(current_fh-&gt;fh_dentry),</div><div class='ctx'> 				     current_fh, lgp);</div><div class='ctx'> 	if (nfserr)</div><div class='ctx'> 		goto out_put_stid;</div><div class='hunk'>@@ -2135,16 +2538,17 @@ static __be32</div><div class='ctx'> nfsd4_layoutcommit(struct svc_rqst *rqstp,</div><div class='ctx'> 		struct nfsd4_compound_state *cstate, union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct net *net = SVC_NET(rqstp);</div><div class='ctx'> 	struct nfsd4_layoutcommit *lcp = &amp;u-&gt;layoutcommit;</div><div class='ctx'> 	const struct nfsd4_layout_seg *seg = &amp;lcp-&gt;lc_seg;</div><div class='ctx'> 	struct svc_fh *current_fh = &amp;cstate-&gt;current_fh;</div><div class='ctx'> 	const struct nfsd4_layout_ops *ops;</div><div class='del'>-	loff_t new_size = lcp-&gt;lc_last_wr + 1;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct nfs4_layout_stateid *ls;</div><div class='ctx'> 	__be32 nfserr;</div><div class='ctx'> </div><div class='del'>-	nfserr = fh_verify(rqstp, current_fh, 0, NFSD_MAY_WRITE);</div><div class='add'>+	nfserr = fh_verify(rqstp, current_fh, 0,</div><div class='add'>+			   NFSD_MAY_WRITE | NFSD_MAY_OWNER_OVERRIDE);</div><div class='ctx'> 	if (nfserr)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='hunk'>@@ -2154,43 +2558,50 @@ nfsd4_layoutcommit(struct svc_rqst *rqstp,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	inode = d_inode(current_fh-&gt;fh_dentry);</div><div class='ctx'> </div><div class='del'>-	nfserr = nfserr_inval;</div><div class='del'>-	if (new_size &lt;= seg-&gt;offset) {</div><div class='del'>-		dprintk("pnfsd: last write before layout segment\n");</div><div class='del'>-		goto out;</div><div class='add'>+	lcp-&gt;lc_size_chg = false;</div><div class='add'>+	if (lcp-&gt;lc_newoffset) {</div><div class='add'>+		loff_t new_size = lcp-&gt;lc_last_wr + 1;</div><div class='add'>+</div><div class='add'>+		nfserr = nfserr_inval;</div><div class='add'>+		if (new_size &lt;= seg-&gt;offset)</div><div class='add'>+			goto out;</div><div class='add'>+		if (new_size &gt; seg-&gt;offset + seg-&gt;length)</div><div class='add'>+			goto out;</div><div class='add'>+</div><div class='add'>+		if (new_size &gt; i_size_read(inode)) {</div><div class='add'>+			lcp-&gt;lc_size_chg = true;</div><div class='add'>+			lcp-&gt;lc_newsize = new_size;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='del'>-	if (new_size &gt; seg-&gt;offset + seg-&gt;length) {</div><div class='del'>-		dprintk("pnfsd: last write beyond layout segment\n");</div><div class='add'>+</div><div class='add'>+	nfserr = nfserr_grace;</div><div class='add'>+	if (locks_in_grace(net) &amp;&amp; !lcp-&gt;lc_reclaim)</div><div class='ctx'> 		goto out;</div><div class='del'>-	}</div><div class='del'>-	if (!lcp-&gt;lc_newoffset &amp;&amp; new_size &gt; i_size_read(inode)) {</div><div class='del'>-		dprintk("pnfsd: layoutcommit beyond EOF\n");</div><div class='add'>+	nfserr = nfserr_no_grace;</div><div class='add'>+	if (!locks_in_grace(net) &amp;&amp; lcp-&gt;lc_reclaim)</div><div class='ctx'> 		goto out;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	nfserr = nfsd4_preprocess_layout_stateid(rqstp, cstate, &amp;lcp-&gt;lc_sid,</div><div class='del'>-						false, lcp-&gt;lc_layout_type,</div><div class='del'>-						&amp;ls);</div><div class='del'>-	if (nfserr) {</div><div class='del'>-		trace_nfsd_layout_commit_lookup_fail(&amp;lcp-&gt;lc_sid);</div><div class='del'>-		/* fixup error code as per RFC5661 */</div><div class='del'>-		if (nfserr == nfserr_bad_stateid)</div><div class='del'>-			nfserr = nfserr_badlayout;</div><div class='del'>-		goto out;</div><div class='add'>+	if (!lcp-&gt;lc_reclaim) {</div><div class='add'>+		nfserr = nfsd4_preprocess_layout_stateid(rqstp, cstate,</div><div class='add'>+				&amp;lcp-&gt;lc_sid, false, lcp-&gt;lc_layout_type, &amp;ls);</div><div class='add'>+		if (nfserr) {</div><div class='add'>+			trace_nfsd_layout_commit_lookup_fail(&amp;lcp-&gt;lc_sid);</div><div class='add'>+			/* fixup error code as per RFC5661 */</div><div class='add'>+			if (nfserr == nfserr_bad_stateid)</div><div class='add'>+				nfserr = nfserr_badlayout;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		/* LAYOUTCOMMIT does not require any serialization */</div><div class='add'>+		mutex_unlock(&amp;ls-&gt;ls_mutex);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* LAYOUTCOMMIT does not require any serialization */</div><div class='del'>-	mutex_unlock(&amp;ls-&gt;ls_mutex);</div><div class='add'>+	nfserr = ops-&gt;proc_layoutcommit(inode, rqstp, lcp);</div><div class='ctx'> </div><div class='del'>-	if (new_size &gt; i_size_read(inode)) {</div><div class='del'>-		lcp-&gt;lc_size_chg = 1;</div><div class='del'>-		lcp-&gt;lc_newsize = new_size;</div><div class='del'>-	} else {</div><div class='del'>-		lcp-&gt;lc_size_chg = 0;</div><div class='add'>+	if (!lcp-&gt;lc_reclaim) {</div><div class='add'>+		nfsd4_file_mark_deleg_written(ls-&gt;ls_stid.sc_file);</div><div class='add'>+		nfs4_put_stid(&amp;ls-&gt;ls_stid);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	nfserr = ops-&gt;proc_layoutcommit(inode, lcp);</div><div class='del'>-	nfs4_put_stid(&amp;ls-&gt;ls_stid);</div><div class='ctx'> out:</div><div class='ctx'> 	return nfserr;</div><div class='ctx'> }</div><div class='hunk'>@@ -2313,10 +2724,10 @@ nfsd4_proc_null(struct svc_rqst *rqstp)</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void nfsd4_increment_op_stats(u32 opnum)</div><div class='add'>+static inline void nfsd4_increment_op_stats(struct nfsd_net *nn, u32 opnum)</div><div class='ctx'> {</div><div class='ctx'> 	if (opnum &gt;= FIRST_NFS4_OP &amp;&amp; opnum &lt;= LAST_NFS4_OP)</div><div class='del'>-		percpu_counter_inc(&amp;nfsdstats.counter[NFSD_STATS_NFS4_OP(opnum)]);</div><div class='add'>+		percpu_counter_inc(&amp;nn-&gt;counter[NFSD_STATS_NFS4_OP(opnum)]);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct nfsd4_operation nfsd4_ops[];</div><div class='hunk'>@@ -2433,7 +2844,7 @@ check_if_stalefh_allowed(struct nfsd4_compoundargs *args)</div><div class='ctx'> 				return;</div><div class='ctx'> 			}</div><div class='ctx'> 			putfh = (struct nfsd4_putfh *)&amp;saved_op-&gt;u;</div><div class='del'>-			if (!copy-&gt;cp_intra)</div><div class='add'>+			if (nfsd4_ssc_is_inter(copy))</div><div class='ctx'> 				putfh-&gt;no_verify = true;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2486,9 +2897,6 @@ nfsd4_proc_compound(struct svc_rqst *rqstp)</div><div class='ctx'> 	status = nfserr_minor_vers_mismatch;</div><div class='ctx'> 	if (nfsd_minorversion(nn, args-&gt;minorversion, NFSD_TEST) &lt;= 0)</div><div class='ctx'> 		goto out;</div><div class='del'>-	status = nfserr_resource;</div><div class='del'>-	if (args-&gt;opcnt &gt; NFSD_MAX_OPS_PER_COMPOUND)</div><div class='del'>-		goto out;</div><div class='ctx'> </div><div class='ctx'> 	status = nfs41_check_op_ordering(args);</div><div class='ctx'> 	if (status) {</div><div class='hunk'>@@ -2501,10 +2909,20 @@ nfsd4_proc_compound(struct svc_rqst *rqstp)</div><div class='ctx'> </div><div class='ctx'> 	rqstp-&gt;rq_lease_breaker = (void **)&amp;cstate-&gt;clp;</div><div class='ctx'> </div><div class='del'>-	trace_nfsd_compound(rqstp, args-&gt;opcnt);</div><div class='add'>+	trace_nfsd_compound(rqstp, args-&gt;tag, args-&gt;taglen, args-&gt;client_opcnt);</div><div class='ctx'> 	while (!status &amp;&amp; resp-&gt;opcnt &lt; args-&gt;opcnt) {</div><div class='ctx'> 		op = &amp;args-&gt;ops[resp-&gt;opcnt++];</div><div class='ctx'> </div><div class='add'>+		if (unlikely(resp-&gt;opcnt == NFSD_MAX_OPS_PER_COMPOUND)) {</div><div class='add'>+			/* If there are still more operations to process,</div><div class='add'>+			 * stop here and report NFS4ERR_RESOURCE. */</div><div class='add'>+			if (cstate-&gt;minorversion == 0 &amp;&amp;</div><div class='add'>+			    args-&gt;client_opcnt &gt; resp-&gt;opcnt) {</div><div class='add'>+				op-&gt;status = nfserr_resource;</div><div class='add'>+				goto encode_op;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * The XDR decode routines may have pre-set op-&gt;status;</div><div class='ctx'> 		 * for example, if there is a miscellaneous XDR error</div><div class='hunk'>@@ -2528,13 +2946,13 @@ nfsd4_proc_compound(struct svc_rqst *rqstp)</div><div class='ctx'> 			goto encode_op;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		fh_clear_wcc(current_fh);</div><div class='add'>+		fh_clear_pre_post_attrs(current_fh);</div><div class='ctx'> </div><div class='ctx'> 		/* If op is non-idempotent */</div><div class='ctx'> 		if (op-&gt;opdesc-&gt;op_flags &amp; OP_MODIFIES_SOMETHING) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Don't execute this op if we couldn't encode a</div><div class='del'>-			 * succesful reply:</div><div class='add'>+			 * successful reply:</div><div class='ctx'> 			 */</div><div class='ctx'> 			u32 plen = op-&gt;opdesc-&gt;op_rsize_bop(rqstp, op);</div><div class='ctx'> 			/*</div><div class='hunk'>@@ -2552,6 +2970,7 @@ nfsd4_proc_compound(struct svc_rqst *rqstp)</div><div class='ctx'> 		if (op-&gt;opdesc-&gt;op_get_currentstateid)</div><div class='ctx'> 			op-&gt;opdesc-&gt;op_get_currentstateid(cstate, &amp;op-&gt;u);</div><div class='ctx'> 		op-&gt;status = op-&gt;opdesc-&gt;op_func(rqstp, cstate, &amp;op-&gt;u);</div><div class='add'>+		trace_nfsd_compound_op_err(rqstp, op-&gt;opnum, op-&gt;status);</div><div class='ctx'> </div><div class='ctx'> 		/* Only from SEQUENCE */</div><div class='ctx'> 		if (cstate-&gt;status == nfserr_replay_cache) {</div><div class='hunk'>@@ -2568,7 +2987,7 @@ nfsd4_proc_compound(struct svc_rqst *rqstp)</div><div class='ctx'> </div><div class='ctx'> 			if (current_fh-&gt;fh_export &amp;&amp;</div><div class='ctx'> 					need_wrongsec_check(rqstp))</div><div class='del'>-				op-&gt;status = check_nfsd_access(current_fh-&gt;fh_export, rqstp);</div><div class='add'>+				op-&gt;status = check_nfsd_access(current_fh-&gt;fh_export, rqstp, false);</div><div class='ctx'> 		}</div><div class='ctx'> encode_op:</div><div class='ctx'> 		if (op-&gt;status == nfserr_replay_me) {</div><div class='hunk'>@@ -2580,11 +2999,11 @@ encode_op:</div><div class='ctx'> 			status = op-&gt;status;</div><div class='ctx'> 		}</div><div class='ctx'> </div><div class='del'>-		trace_nfsd_compound_status(args-&gt;opcnt, resp-&gt;opcnt, status,</div><div class='del'>-					   nfsd4_op_name(op-&gt;opnum));</div><div class='add'>+		trace_nfsd_compound_status(args-&gt;client_opcnt, resp-&gt;opcnt,</div><div class='add'>+					   status, nfsd4_op_name(op-&gt;opnum));</div><div class='ctx'> </div><div class='ctx'> 		nfsd4_cstate_clear_replay(cstate);</div><div class='del'>-		nfsd4_increment_op_stats(op-&gt;opnum);</div><div class='add'>+		nfsd4_increment_op_stats(nn, op-&gt;opnum);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	fh_put(current_fh);</div><div class='hunk'>@@ -2615,28 +3034,49 @@ out:</div><div class='ctx'> </div><div class='ctx'> #define op_encode_channel_attrs_maxsz	(6 + 1 + 1)</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_only_status_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+/*</div><div class='add'>+ * The _rsize() helpers are invoked by the NFSv4 COMPOUND decoder, which</div><div class='add'>+ * is called before sunrpc sets rq_res.buflen. Thus we have to compute</div><div class='add'>+ * the maximum payload size here, based on transport limits and the size</div><div class='add'>+ * of the remaining space in the rq_pages array.</div><div class='add'>+ */</div><div class='add'>+static u32 nfsd4_max_payload(const struct svc_rqst *rqstp)</div><div class='add'>+{</div><div class='add'>+	u32 buflen;</div><div class='add'>+</div><div class='add'>+	buflen = (rqstp-&gt;rq_page_end - rqstp-&gt;rq_next_page) * PAGE_SIZE;</div><div class='add'>+	buflen -= rqstp-&gt;rq_auth_slack;</div><div class='add'>+	buflen -= rqstp-&gt;rq_res.head[0].iov_len;</div><div class='add'>+	return min_t(u32, buflen, svc_max_payload(rqstp));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static u32 nfsd4_only_status_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+				   const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size) * sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_status_stateid_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_status_stateid_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+				      const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size + op_encode_stateid_maxsz)* sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_access_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_access_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+			      const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	/* ac_supported, ac_resp_access */</div><div class='ctx'> 	return (op_encode_hdr_size + 2)* sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_commit_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_commit_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+			      const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size + op_encode_verifier_maxsz) * sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_create_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_create_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+			      const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size + op_encode_change_info_maxsz</div><div class='ctx'> 		+ nfs4_fattr_bitmap_maxsz) * sizeof(__be32);</div><div class='hunk'>@@ -2647,17 +3087,17 @@ static inline u32 nfsd4_create_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op</div><div class='ctx'>  * the op prematurely if the estimate is too large.  We may turn off splice</div><div class='ctx'>  * reads unnecessarily.</div><div class='ctx'>  */</div><div class='del'>-static inline u32 nfsd4_getattr_rsize(struct svc_rqst *rqstp,</div><div class='del'>-				      struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_getattr_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+			       const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='del'>-	u32 *bmap = op-&gt;u.getattr.ga_bmval;</div><div class='add'>+	const u32 *bmap = op-&gt;u.getattr.ga_bmval;</div><div class='ctx'> 	u32 bmap0 = bmap[0], bmap1 = bmap[1], bmap2 = bmap[2];</div><div class='ctx'> 	u32 ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (bmap0 &amp; FATTR4_WORD0_ACL)</div><div class='del'>-		return svc_max_payload(rqstp);</div><div class='add'>+		return nfsd4_max_payload(rqstp);</div><div class='ctx'> 	if (bmap0 &amp; FATTR4_WORD0_FS_LOCATIONS)</div><div class='del'>-		return svc_max_payload(rqstp);</div><div class='add'>+		return nfsd4_max_payload(rqstp);</div><div class='ctx'> </div><div class='ctx'> 	if (bmap1 &amp; FATTR4_WORD1_OWNER) {</div><div class='ctx'> 		ret += IDMAP_NAMESZ + 4;</div><div class='hunk'>@@ -2685,24 +3125,28 @@ static inline u32 nfsd4_getattr_rsize(struct svc_rqst *rqstp,</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_getfh_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_getfh_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+			     const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size + 1) * sizeof(__be32) + NFS4_FHSIZE;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_link_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_link_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+			    const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size + op_encode_change_info_maxsz)</div><div class='ctx'> 		* sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_lock_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_lock_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+			    const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size + op_encode_lock_denied_maxsz)</div><div class='ctx'> 		* sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_open_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_open_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+			    const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size + op_encode_stateid_maxsz</div><div class='ctx'> 		+ op_encode_change_info_maxsz + 1</div><div class='hunk'>@@ -2710,20 +3154,18 @@ static inline u32 nfsd4_open_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='ctx'> 		+ op_encode_delegation_maxsz) * sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_read_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_read_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+			    const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='del'>-	u32 maxcount = 0, rlen = 0;</div><div class='del'>-</div><div class='del'>-	maxcount = svc_max_payload(rqstp);</div><div class='del'>-	rlen = min(op-&gt;u.read.rd_length, maxcount);</div><div class='add'>+	u32 rlen = min(op-&gt;u.read.rd_length, nfsd4_max_payload(rqstp));</div><div class='ctx'> </div><div class='ctx'> 	return (op_encode_hdr_size + 2 + XDR_QUADLEN(rlen)) * sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_read_plus_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_read_plus_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+				 const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='del'>-	u32 maxcount = svc_max_payload(rqstp);</div><div class='del'>-	u32 rlen = min(op-&gt;u.read.rd_length, maxcount);</div><div class='add'>+	u32 rlen = min(op-&gt;u.read.rd_length, nfsd4_max_payload(rqstp));</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If we detect that the file changed during hole encoding, then we</div><div class='ctx'> 	 * recover by encoding the remaining reply as data. This means we need</div><div class='hunk'>@@ -2734,70 +3176,77 @@ static inline u32 nfsd4_read_plus_rsize(struct svc_rqst *rqstp, struct nfsd4_op</div><div class='ctx'> 	return (op_encode_hdr_size + 2 + seg_len + XDR_QUADLEN(rlen)) * sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_readdir_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_readdir_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+			       const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='del'>-	u32 maxcount = 0, rlen = 0;</div><div class='del'>-</div><div class='del'>-	maxcount = svc_max_payload(rqstp);</div><div class='del'>-	rlen = min(op-&gt;u.readdir.rd_maxcount, maxcount);</div><div class='add'>+	u32 rlen = min(op-&gt;u.readdir.rd_maxcount, nfsd4_max_payload(rqstp));</div><div class='ctx'> </div><div class='ctx'> 	return (op_encode_hdr_size + op_encode_verifier_maxsz +</div><div class='ctx'> 		XDR_QUADLEN(rlen)) * sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_readlink_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_readlink_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+				const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size + 1) * sizeof(__be32) + PAGE_SIZE;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_remove_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_remove_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+			      const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size + op_encode_change_info_maxsz)</div><div class='ctx'> 		* sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_rename_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_rename_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+			      const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size + op_encode_change_info_maxsz</div><div class='ctx'> 		+ op_encode_change_info_maxsz) * sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_sequence_rsize(struct svc_rqst *rqstp,</div><div class='del'>-				       struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_sequence_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+				const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size</div><div class='ctx'> 		+ XDR_QUADLEN(NFS4_MAX_SESSIONID_LEN) + 5) * sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_test_stateid_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_test_stateid_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+				    const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size + 1 + op-&gt;u.test_stateid.ts_num_ids)</div><div class='ctx'> 		* sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_setattr_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_setattr_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+			       const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size + nfs4_fattr_bitmap_maxsz) * sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_secinfo_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_secinfo_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+			       const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size + RPC_AUTH_MAXFLAVOR *</div><div class='ctx'> 		(4 + XDR_QUADLEN(GSS_OID_MAX_LEN))) * sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_setclientid_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_setclientid_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+				   const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size + 2 + XDR_QUADLEN(NFS4_VERIFIER_SIZE)) *</div><div class='ctx'> 								sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_write_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_write_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+			     const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size + 2 + op_encode_verifier_maxsz) * sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_exchange_id_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_exchange_id_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+				   const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size + 2 + 1 + /* eir_clientid, eir_sequenceid */\</div><div class='ctx'> 		1 + 1 + /* eir_flags, spr_how */\</div><div class='hunk'>@@ -2811,14 +3260,16 @@ static inline u32 nfsd4_exchange_id_rsize(struct svc_rqst *rqstp, struct nfsd4_o</div><div class='ctx'> 		0 /* ignored eir_server_impl_id contents */) * sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_bind_conn_to_session_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_bind_conn_to_session_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+					    const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size + \</div><div class='ctx'> 		XDR_QUADLEN(NFS4_MAX_SESSIONID_LEN) + /* bctsr_sessid */\</div><div class='ctx'> 		2 /* bctsr_dir, use_conn_in_rdma_mode */) * sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_create_session_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_create_session_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+				      const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size + \</div><div class='ctx'> 		XDR_QUADLEN(NFS4_MAX_SESSIONID_LEN) + /* sessionid */\</div><div class='hunk'>@@ -2827,7 +3278,8 @@ static inline u32 nfsd4_create_session_rsize(struct svc_rqst *rqstp, struct nfsd</div><div class='ctx'> 		op_encode_channel_attrs_maxsz) * sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_copy_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_copy_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+			    const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size +</div><div class='ctx'> 		1 /* wr_callback */ +</div><div class='hunk'>@@ -2839,16 +3291,16 @@ static inline u32 nfsd4_copy_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='ctx'> 		1 /* cr_synchronous */) * sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_offload_status_rsize(struct svc_rqst *rqstp,</div><div class='del'>-					     struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_offload_status_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+				      const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size +</div><div class='ctx'> 		2 /* osr_count */ +</div><div class='ctx'> 		1 /* osr_complete&lt;1&gt; optional 0 for now */) * sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_copy_notify_rsize(struct svc_rqst *rqstp,</div><div class='del'>-					struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_copy_notify_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+				   const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size +</div><div class='ctx'> 		3 /* cnr_lease_time */ +</div><div class='hunk'>@@ -2862,13 +3314,23 @@ static inline u32 nfsd4_copy_notify_rsize(struct svc_rqst *rqstp,</div><div class='ctx'> 		* sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_NFSD_PNFS</div><div class='del'>-static inline u32 nfsd4_getdeviceinfo_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_get_dir_delegation_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+					  const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='del'>-	u32 maxcount = 0, rlen = 0;</div><div class='add'>+	return (op_encode_hdr_size +</div><div class='add'>+		1 /* gddr_status */ +</div><div class='add'>+		op_encode_verifier_maxsz +</div><div class='add'>+		op_encode_stateid_maxsz +</div><div class='add'>+		2 /* gddr_notification */ +</div><div class='add'>+		2 /* gddr_child_attributes */ +</div><div class='add'>+		2 /* gddr_dir_attributes */);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	maxcount = svc_max_payload(rqstp);</div><div class='del'>-	rlen = min(op-&gt;u.getdeviceinfo.gd_maxcount, maxcount);</div><div class='add'>+#ifdef CONFIG_NFSD_PNFS</div><div class='add'>+static u32 nfsd4_getdeviceinfo_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+				     const struct nfsd4_op *op)</div><div class='add'>+{</div><div class='add'>+	u32 rlen = min(op-&gt;u.getdeviceinfo.gd_maxcount, nfsd4_max_payload(rqstp));</div><div class='ctx'> </div><div class='ctx'> 	return (op_encode_hdr_size +</div><div class='ctx'> 		1 /* gd_layout_type*/ +</div><div class='hunk'>@@ -2881,7 +3343,8 @@ static inline u32 nfsd4_getdeviceinfo_rsize(struct svc_rqst *rqstp, struct nfsd4</div><div class='ctx'>  * so we need to define an arbitrary upper bound here.</div><div class='ctx'>  */</div><div class='ctx'> #define MAX_LAYOUT_SIZE		128</div><div class='del'>-static inline u32 nfsd4_layoutget_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_layoutget_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+				 const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size +</div><div class='ctx'> 		1 /* logr_return_on_close */ +</div><div class='hunk'>@@ -2890,14 +3353,16 @@ static inline u32 nfsd4_layoutget_rsize(struct svc_rqst *rqstp, struct nfsd4_op</div><div class='ctx'> 		MAX_LAYOUT_SIZE) * sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_layoutcommit_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_layoutcommit_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+				    const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size +</div><div class='ctx'> 		1 /* locr_newsize */ +</div><div class='ctx'> 		2 /* ns_size */) * sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_layoutreturn_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_layoutreturn_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+				    const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size +</div><div class='ctx'> 		1 /* lrs_stateid */ +</div><div class='hunk'>@@ -2906,41 +3371,36 @@ static inline u32 nfsd4_layoutreturn_rsize(struct svc_rqst *rqstp, struct nfsd4_</div><div class='ctx'> #endif /* CONFIG_NFSD_PNFS */</div><div class='ctx'> </div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_seek_rsize(struct svc_rqst *rqstp, struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_seek_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+			    const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size + 3) * sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_getxattr_rsize(struct svc_rqst *rqstp,</div><div class='del'>-				       struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_getxattr_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+				const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='del'>-	u32 maxcount, rlen;</div><div class='del'>-</div><div class='del'>-	maxcount = svc_max_payload(rqstp);</div><div class='del'>-	rlen = min_t(u32, XATTR_SIZE_MAX, maxcount);</div><div class='add'>+	u32 rlen = min_t(u32, XATTR_SIZE_MAX, nfsd4_max_payload(rqstp));</div><div class='ctx'> </div><div class='ctx'> 	return (op_encode_hdr_size + 1 + XDR_QUADLEN(rlen)) * sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_setxattr_rsize(struct svc_rqst *rqstp,</div><div class='del'>-				       struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_setxattr_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+				const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size + op_encode_change_info_maxsz)</div><div class='ctx'> 		* sizeof(__be32);</div><div class='ctx'> }</div><div class='del'>-static inline u32 nfsd4_listxattrs_rsize(struct svc_rqst *rqstp,</div><div class='del'>-					 struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_listxattrs_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+				  const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='del'>-	u32 maxcount, rlen;</div><div class='del'>-</div><div class='del'>-	maxcount = svc_max_payload(rqstp);</div><div class='del'>-	rlen = min(op-&gt;u.listxattrs.lsxa_maxcount, maxcount);</div><div class='add'>+	u32 rlen = min(op-&gt;u.listxattrs.lsxa_maxcount, nfsd4_max_payload(rqstp));</div><div class='ctx'> </div><div class='ctx'> 	return (op_encode_hdr_size + 4 + XDR_QUADLEN(rlen)) * sizeof(__be32);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline u32 nfsd4_removexattr_rsize(struct svc_rqst *rqstp,</div><div class='del'>-					  struct nfsd4_op *op)</div><div class='add'>+static u32 nfsd4_removexattr_rsize(const struct svc_rqst *rqstp,</div><div class='add'>+				   const struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='ctx'> 	return (op_encode_hdr_size + op_encode_change_info_maxsz)</div><div class='ctx'> 		* sizeof(__be32);</div><div class='hunk'>@@ -3000,6 +3460,7 @@ static const struct nfsd4_operation nfsd4_ops[] = {</div><div class='ctx'> 	},</div><div class='ctx'> 	[OP_LOCK] = {</div><div class='ctx'> 		.op_func = nfsd4_lock,</div><div class='add'>+		.op_release = nfsd4_lock_release,</div><div class='ctx'> 		.op_flags = OP_MODIFIES_SOMETHING |</div><div class='ctx'> 				OP_NONTRIVIAL_ERROR_ENCODE,</div><div class='ctx'> 		.op_name = "OP_LOCK",</div><div class='hunk'>@@ -3008,6 +3469,7 @@ static const struct nfsd4_operation nfsd4_ops[] = {</div><div class='ctx'> 	},</div><div class='ctx'> 	[OP_LOCKT] = {</div><div class='ctx'> 		.op_func = nfsd4_lockt,</div><div class='add'>+		.op_release = nfsd4_lockt_release,</div><div class='ctx'> 		.op_flags = OP_NONTRIVIAL_ERROR_ENCODE,</div><div class='ctx'> 		.op_name = "OP_LOCKT",</div><div class='ctx'> 		.op_rsize_bop = nfsd4_lock_rsize,</div><div class='hunk'>@@ -3181,6 +3643,7 @@ static const struct nfsd4_operation nfsd4_ops[] = {</div><div class='ctx'> 	/* NFSv4.1 operations */</div><div class='ctx'> 	[OP_EXCHANGE_ID] = {</div><div class='ctx'> 		.op_func = nfsd4_exchange_id,</div><div class='add'>+		.op_release = nfsd4_exchange_id_release,</div><div class='ctx'> 		.op_flags = ALLOWED_WITHOUT_FH | ALLOWED_AS_FIRST_OP</div><div class='ctx'> 				| OP_MODIFIES_SOMETHING,</div><div class='ctx'> 		.op_name = "OP_EXCHANGE_ID",</div><div class='hunk'>@@ -3252,6 +3715,12 @@ static const struct nfsd4_operation nfsd4_ops[] = {</div><div class='ctx'> 		.op_get_currentstateid = nfsd4_get_freestateid,</div><div class='ctx'> 		.op_rsize_bop = nfsd4_only_status_rsize,</div><div class='ctx'> 	},</div><div class='add'>+	[OP_GET_DIR_DELEGATION] = {</div><div class='add'>+		.op_func = nfsd4_get_dir_delegation,</div><div class='add'>+		.op_flags = OP_MODIFIES_SOMETHING,</div><div class='add'>+		.op_name = "OP_GET_DIR_DELEGATION",</div><div class='add'>+		.op_rsize_bop = nfsd4_get_dir_delegation_rsize,</div><div class='add'>+	},</div><div class='ctx'> #ifdef CONFIG_NFSD_PNFS</div><div class='ctx'> 	[OP_GETDEVICEINFO] = {</div><div class='ctx'> 		.op_func = nfsd4_getdeviceinfo,</div><div class='hunk'>@@ -3378,7 +3847,8 @@ bool nfsd4_spo_must_allow(struct svc_rqst *rqstp)</div><div class='ctx'> 	struct nfs4_op_map *allow = &amp;cstate-&gt;clp-&gt;cl_spo_must_allow;</div><div class='ctx'> 	u32 opiter;</div><div class='ctx'> </div><div class='del'>-	if (!cstate-&gt;minorversion)</div><div class='add'>+	if (rqstp-&gt;rq_procinfo != &amp;nfsd_version4.vs_proc[NFSPROC4_COMPOUND] ||</div><div class='add'>+	    cstate-&gt;minorversion == 0)</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='ctx'> 	if (cstate-&gt;spo_must_allowed)</div><div class='hunk'>@@ -3429,6 +3899,7 @@ static const struct svc_procedure nfsd_procedures4[2] = {</div><div class='ctx'> 		.pc_decode = nfssvc_decode_voidarg,</div><div class='ctx'> 		.pc_encode = nfssvc_encode_voidres,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd_voidargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd_voidargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd_voidres),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_xdrressize = 1,</div><div class='hunk'>@@ -3439,20 +3910,22 @@ static const struct svc_procedure nfsd_procedures4[2] = {</div><div class='ctx'> 		.pc_decode = nfs4svc_decode_compoundargs,</div><div class='ctx'> 		.pc_encode = nfs4svc_encode_compoundres,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd4_compoundargs),</div><div class='add'>+		.pc_argzero = offsetof(struct nfsd4_compoundargs, iops),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd4_compoundres),</div><div class='ctx'> 		.pc_release = nfsd4_release_compoundargs,</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='del'>-		.pc_xdrressize = NFSD_BUFSIZE/4,</div><div class='add'>+		.pc_xdrressize = 3+NFSSVC_MAXBLKSIZE/4,</div><div class='ctx'> 		.pc_name = "COMPOUND",</div><div class='ctx'> 	},</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static unsigned int nfsd_count3[ARRAY_SIZE(nfsd_procedures4)];</div><div class='add'>+static DEFINE_PER_CPU_ALIGNED(unsigned long,</div><div class='add'>+			      nfsd_count4[ARRAY_SIZE(nfsd_procedures4)]);</div><div class='ctx'> const struct svc_version nfsd_version4 = {</div><div class='ctx'> 	.vs_vers		= 4,</div><div class='del'>-	.vs_nproc		= 2,</div><div class='add'>+	.vs_nproc		= ARRAY_SIZE(nfsd_procedures4),</div><div class='ctx'> 	.vs_proc		= nfsd_procedures4,</div><div class='del'>-	.vs_count		= nfsd_count3,</div><div class='add'>+	.vs_count		= nfsd_count4,</div><div class='ctx'> 	.vs_dispatch		= nfsd_dispatch,</div><div class='ctx'> 	.vs_xdrsize		= NFS4_SVC_XDRSIZE,</div><div class='ctx'> 	.vs_rpcb_optnl		= true,</div><div class='head'>diff --git a/fs/nfsd/nfs4recover.c b/fs/nfsd/nfs4recover.c<br/>index 6fedc49726bf..441dfbfe2d2b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfs4recover.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfs4recover.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfs4recover.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/nfs4recover.c</a></div><div class='hunk'>@@ -32,7 +32,8 @@</div><div class='ctx'> *</div><div class='ctx'> */</div><div class='ctx'> </div><div class='del'>-#include &lt;crypto/hash.h&gt;</div><div class='add'>+#include &lt;crypto/md5.h&gt;</div><div class='add'>+#include &lt;crypto/sha2.h&gt;</div><div class='ctx'> #include &lt;linux/file.h&gt;</div><div class='ctx'> #include &lt;linux/slab.h&gt;</div><div class='ctx'> #include &lt;linux/namei.h&gt;</div><div class='hunk'>@@ -66,6 +67,7 @@ struct nfsd4_client_tracking_ops {</div><div class='ctx'> static const struct nfsd4_client_tracking_ops nfsd4_cld_tracking_ops;</div><div class='ctx'> static const struct nfsd4_client_tracking_ops nfsd4_cld_tracking_ops_v2;</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_NFSD_LEGACY_CLIENT_TRACKING</div><div class='ctx'> /* Globals */</div><div class='ctx'> static char user_recovery_dirname[PATH_MAX] = "/var/lib/nfs/v4recovery";</div><div class='ctx'> </div><div class='hunk'>@@ -81,110 +83,38 @@ nfs4_save_creds(const struct cred **original_creds)</div><div class='ctx'> 	new-&gt;fsuid = GLOBAL_ROOT_UID;</div><div class='ctx'> 	new-&gt;fsgid = GLOBAL_ROOT_GID;</div><div class='ctx'> 	*original_creds = override_creds(new);</div><div class='del'>-	put_cred(new);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='ctx'> nfs4_reset_creds(const struct cred *original)</div><div class='ctx'> {</div><div class='del'>-	revert_creds(original);</div><div class='add'>+	put_cred(revert_creds(original));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='del'>-md5_to_hex(char *out, char *md5)</div><div class='add'>+nfs4_make_rec_clidname(char dname[HEXDIR_LEN], const struct xdr_netobj *clname)</div><div class='ctx'> {</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	for (i=0; i&lt;16; i++) {</div><div class='del'>-		unsigned char c = md5[i];</div><div class='del'>-</div><div class='del'>-		*out++ = '0' + ((c&amp;0xf0)&gt;&gt;4) + (c&gt;=0xa0)*('a'-'9'-1);</div><div class='del'>-		*out++ = '0' + (c&amp;0x0f) + ((c&amp;0x0f)&gt;=0x0a)*('a'-'9'-1);</div><div class='del'>-	}</div><div class='del'>-	*out = '\0';</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static int</div><div class='del'>-nfs4_make_rec_clidname(char *dname, const struct xdr_netobj *clname)</div><div class='del'>-{</div><div class='del'>-	struct xdr_netobj cksum;</div><div class='del'>-	struct crypto_shash *tfm;</div><div class='del'>-	int status;</div><div class='add'>+	u8 digest[MD5_DIGEST_SIZE];</div><div class='ctx'> </div><div class='ctx'> 	dprintk("NFSD: nfs4_make_rec_clidname for %.*s\n",</div><div class='ctx'> 			clname-&gt;len, clname-&gt;data);</div><div class='del'>-	tfm = crypto_alloc_shash("md5", 0, 0);</div><div class='del'>-	if (IS_ERR(tfm)) {</div><div class='del'>-		status = PTR_ERR(tfm);</div><div class='del'>-		goto out_no_tfm;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	cksum.len = crypto_shash_digestsize(tfm);</div><div class='del'>-	cksum.data = kmalloc(cksum.len, GFP_KERNEL);</div><div class='del'>-	if (cksum.data == NULL) {</div><div class='del'>-		status = -ENOMEM;</div><div class='del'>- 		goto out;</div><div class='del'>-	}</div><div class='add'>+	md5(clname-&gt;data, clname-&gt;len, digest);</div><div class='ctx'> </div><div class='del'>-	status = crypto_shash_tfm_digest(tfm, clname-&gt;data, clname-&gt;len,</div><div class='del'>-					 cksum.data);</div><div class='del'>-	if (status)</div><div class='del'>-		goto out;</div><div class='del'>-</div><div class='del'>-	md5_to_hex(dname, cksum.data);</div><div class='del'>-</div><div class='del'>-	status = 0;</div><div class='del'>-out:</div><div class='del'>-	kfree(cksum.data);</div><div class='del'>-	crypto_free_shash(tfm);</div><div class='del'>-out_no_tfm:</div><div class='del'>-	return status;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * If we had an error generating the recdir name for the legacy tracker</div><div class='del'>- * then warn the admin. If the error doesn't appear to be transient,</div><div class='del'>- * then disable recovery tracking.</div><div class='del'>- */</div><div class='del'>-static void</div><div class='del'>-legacy_recdir_name_error(struct nfs4_client *clp, int error)</div><div class='del'>-{</div><div class='del'>-	printk(KERN_ERR "NFSD: unable to generate recoverydir "</div><div class='del'>-			"name (%d).\n", error);</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * if the algorithm just doesn't exist, then disable the recovery</div><div class='del'>-	 * tracker altogether. The crypto libs will generally return this if</div><div class='del'>-	 * FIPS is enabled as well.</div><div class='del'>-	 */</div><div class='del'>-	if (error == -ENOENT) {</div><div class='del'>-		printk(KERN_ERR "NFSD: disabling legacy clientid tracking. "</div><div class='del'>-			"Reboot recovery will not function correctly!\n");</div><div class='del'>-		nfsd4_client_tracking_exit(clp-&gt;net);</div><div class='del'>-	}</div><div class='add'>+	static_assert(HEXDIR_LEN == 2 * MD5_DIGEST_SIZE + 1);</div><div class='add'>+	sprintf(dname, "%*phN", MD5_DIGEST_SIZE, digest);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='ctx'> __nfsd4_create_reclaim_record_grace(struct nfs4_client *clp,</div><div class='del'>-		const char *dname, int len, struct nfsd_net *nn)</div><div class='add'>+				    char *dname, struct nfsd_net *nn)</div><div class='ctx'> {</div><div class='del'>-	struct xdr_netobj name;</div><div class='add'>+	struct xdr_netobj name = { .len = strlen(dname), .data = dname };</div><div class='ctx'> 	struct xdr_netobj princhash = { .len = 0, .data = NULL };</div><div class='ctx'> 	struct nfs4_client_reclaim *crp;</div><div class='ctx'> </div><div class='del'>-	name.data = kmemdup(dname, len, GFP_KERNEL);</div><div class='del'>-	if (!name.data) {</div><div class='del'>-		dprintk("%s: failed to allocate memory for name.data!\n",</div><div class='del'>-			__func__);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-	name.len = len;</div><div class='ctx'> 	crp = nfs4_client_to_reclaim(name, princhash, nn);</div><div class='del'>-	if (!crp) {</div><div class='del'>-		kfree(name.data);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='ctx'> 	crp-&gt;cr_clp = clp;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -202,9 +132,7 @@ nfsd4_create_clid_dir(struct nfs4_client *clp)</div><div class='ctx'> 	if (!nn-&gt;rec_file)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	status = nfs4_make_rec_clidname(dname, &amp;clp-&gt;cl_name);</div><div class='del'>-	if (status)</div><div class='del'>-		return legacy_recdir_name_error(clp, status);</div><div class='add'>+	nfs4_make_rec_clidname(dname, &amp;clp-&gt;cl_name);</div><div class='ctx'> </div><div class='ctx'> 	status = nfs4_save_creds(&amp;original_cred);</div><div class='ctx'> 	if (status &lt; 0)</div><div class='hunk'>@@ -215,13 +143,11 @@ nfsd4_create_clid_dir(struct nfs4_client *clp)</div><div class='ctx'> 		goto out_creds;</div><div class='ctx'> </div><div class='ctx'> 	dir = nn-&gt;rec_file-&gt;f_path.dentry;</div><div class='del'>-	/* lock the parent */</div><div class='del'>-	inode_lock(d_inode(dir));</div><div class='ctx'> </div><div class='del'>-	dentry = lookup_one_len(dname, dir, HEXDIR_LEN-1);</div><div class='add'>+	dentry = start_creating(&amp;nop_mnt_idmap, dir, &amp;QSTR(dname));</div><div class='ctx'> 	if (IS_ERR(dentry)) {</div><div class='ctx'> 		status = PTR_ERR(dentry);</div><div class='del'>-		goto out_unlock;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (d_really_is_positive(dentry))</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -232,16 +158,16 @@ nfsd4_create_clid_dir(struct nfs4_client *clp)</div><div class='ctx'> 		 * In the 4.0 case, we should never get here; but we may</div><div class='ctx'> 		 * as well be forgiving and just succeed silently.</div><div class='ctx'> 		 */</div><div class='del'>-		goto out_put;</div><div class='del'>-	status = vfs_mkdir(&amp;init_user_ns, d_inode(dir), dentry, S_IRWXU);</div><div class='del'>-out_put:</div><div class='del'>-	dput(dentry);</div><div class='del'>-out_unlock:</div><div class='del'>-	inode_unlock(d_inode(dir));</div><div class='add'>+		goto out_end;</div><div class='add'>+	dentry = vfs_mkdir(&amp;nop_mnt_idmap, d_inode(dir), dentry, 0700, NULL);</div><div class='add'>+	if (IS_ERR(dentry))</div><div class='add'>+		status = PTR_ERR(dentry);</div><div class='add'>+out_end:</div><div class='add'>+	end_creating(dentry);</div><div class='add'>+out:</div><div class='ctx'> 	if (status == 0) {</div><div class='ctx'> 		if (nn-&gt;in_grace)</div><div class='del'>-			__nfsd4_create_reclaim_record_grace(clp, dname,</div><div class='del'>-					HEXDIR_LEN, nn);</div><div class='add'>+			__nfsd4_create_reclaim_record_grace(clp, dname, nn);</div><div class='ctx'> 		vfs_fsync(nn-&gt;rec_file, 0);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		printk(KERN_ERR "NFSD: failed to write recovery record"</div><div class='hunk'>@@ -254,7 +180,7 @@ out_creds:</div><div class='ctx'> 	nfs4_reset_creds(original_cred);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-typedef int (recdir_func)(struct dentry *, struct dentry *, struct nfsd_net *);</div><div class='add'>+typedef int (recdir_func)(struct dentry *, char *, struct nfsd_net *);</div><div class='ctx'> </div><div class='ctx'> struct name_list {</div><div class='ctx'> 	char name[HEXDIR_LEN];</div><div class='hunk'>@@ -266,7 +192,7 @@ struct nfs4_dir_ctx {</div><div class='ctx'> 	struct list_head names;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static int</div><div class='add'>+static bool</div><div class='ctx'> nfsd4_build_namelist(struct dir_context *__ctx, const char *name, int namlen,</div><div class='ctx'> 		loff_t offset, u64 ino, unsigned int d_type)</div><div class='ctx'> {</div><div class='hunk'>@@ -275,14 +201,14 @@ nfsd4_build_namelist(struct dir_context *__ctx, const char *name, int namlen,</div><div class='ctx'> 	struct name_list *entry;</div><div class='ctx'> </div><div class='ctx'> 	if (namlen != HEXDIR_LEN - 1)</div><div class='del'>-		return 0;</div><div class='add'>+		return true;</div><div class='ctx'> 	entry = kmalloc(sizeof(struct name_list), GFP_KERNEL);</div><div class='ctx'> 	if (entry == NULL)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+		return false;</div><div class='ctx'> 	memcpy(entry-&gt;name, name, HEXDIR_LEN - 1);</div><div class='ctx'> 	entry-&gt;name[HEXDIR_LEN - 1] = '\0';</div><div class='ctx'> 	list_add(&amp;entry-&gt;list, &amp;ctx-&gt;names);</div><div class='del'>-	return 0;</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='hunk'>@@ -308,23 +234,14 @@ nfsd4_list_rec_dir(recdir_func *f, struct nfsd_net *nn)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	status = iterate_dir(nn-&gt;rec_file, &amp;ctx.ctx);</div><div class='del'>-	inode_lock_nested(d_inode(dir), I_MUTEX_PARENT);</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry_safe(entry, tmp, &amp;ctx.names, list) {</div><div class='del'>-		if (!status) {</div><div class='del'>-			struct dentry *dentry;</div><div class='del'>-			dentry = lookup_one_len(entry-&gt;name, dir, HEXDIR_LEN-1);</div><div class='del'>-			if (IS_ERR(dentry)) {</div><div class='del'>-				status = PTR_ERR(dentry);</div><div class='del'>-				break;</div><div class='del'>-			}</div><div class='del'>-			status = f(dir, dentry, nn);</div><div class='del'>-			dput(dentry);</div><div class='del'>-		}</div><div class='add'>+		if (!status)</div><div class='add'>+			status = f(dir, entry-&gt;name, nn);</div><div class='add'>+</div><div class='ctx'> 		list_del(&amp;entry-&gt;list);</div><div class='ctx'> 		kfree(entry);</div><div class='ctx'> 	}</div><div class='del'>-	inode_unlock(d_inode(dir));</div><div class='ctx'> 	nfs4_reset_creds(original_cred);</div><div class='ctx'> </div><div class='ctx'> 	list_for_each_entry_safe(entry, tmp, &amp;ctx.names, list) {</div><div class='hunk'>@@ -336,28 +253,20 @@ nfsd4_list_rec_dir(recdir_func *f, struct nfsd_net *nn)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-nfsd4_unlink_clid_dir(char *name, int namlen, struct nfsd_net *nn)</div><div class='add'>+nfsd4_unlink_clid_dir(char *name, struct nfsd_net *nn)</div><div class='ctx'> {</div><div class='ctx'> 	struct dentry *dir, *dentry;</div><div class='ctx'> 	int status;</div><div class='ctx'> </div><div class='del'>-	dprintk("NFSD: nfsd4_unlink_clid_dir. name %.*s\n", namlen, name);</div><div class='add'>+	dprintk("NFSD: nfsd4_unlink_clid_dir. name %s\n", name);</div><div class='ctx'> </div><div class='ctx'> 	dir = nn-&gt;rec_file-&gt;f_path.dentry;</div><div class='del'>-	inode_lock_nested(d_inode(dir), I_MUTEX_PARENT);</div><div class='del'>-	dentry = lookup_one_len(name, dir, namlen);</div><div class='del'>-	if (IS_ERR(dentry)) {</div><div class='del'>-		status = PTR_ERR(dentry);</div><div class='del'>-		goto out_unlock;</div><div class='del'>-	}</div><div class='del'>-	status = -ENOENT;</div><div class='del'>-	if (d_really_is_negative(dentry))</div><div class='del'>-		goto out;</div><div class='del'>-	status = vfs_rmdir(&amp;init_user_ns, d_inode(dir), dentry);</div><div class='del'>-out:</div><div class='del'>-	dput(dentry);</div><div class='del'>-out_unlock:</div><div class='del'>-	inode_unlock(d_inode(dir));</div><div class='add'>+	dentry = start_removing(&amp;nop_mnt_idmap, dir, &amp;QSTR(name));</div><div class='add'>+	if (IS_ERR(dentry))</div><div class='add'>+		return PTR_ERR(dentry);</div><div class='add'>+</div><div class='add'>+	status = vfs_rmdir(&amp;nop_mnt_idmap, d_inode(dir), dentry, NULL);</div><div class='add'>+	end_removing(dentry);</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -392,9 +301,7 @@ nfsd4_remove_clid_dir(struct nfs4_client *clp)</div><div class='ctx'> 	if (!nn-&gt;rec_file || !test_bit(NFSD4_CLIENT_STABLE, &amp;clp-&gt;cl_flags))</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	status = nfs4_make_rec_clidname(dname, &amp;clp-&gt;cl_name);</div><div class='del'>-	if (status)</div><div class='del'>-		return legacy_recdir_name_error(clp, status);</div><div class='add'>+	nfs4_make_rec_clidname(dname, &amp;clp-&gt;cl_name);</div><div class='ctx'> </div><div class='ctx'> 	status = mnt_want_write_file(nn-&gt;rec_file);</div><div class='ctx'> 	if (status)</div><div class='hunk'>@@ -405,7 +312,7 @@ nfsd4_remove_clid_dir(struct nfs4_client *clp)</div><div class='ctx'> 	if (status &lt; 0)</div><div class='ctx'> 		goto out_drop_write;</div><div class='ctx'> </div><div class='del'>-	status = nfsd4_unlink_clid_dir(dname, HEXDIR_LEN-1, nn);</div><div class='add'>+	status = nfsd4_unlink_clid_dir(dname, nn);</div><div class='ctx'> 	nfs4_reset_creds(original_cred);</div><div class='ctx'> 	if (status == 0) {</div><div class='ctx'> 		vfs_fsync(nn-&gt;rec_file, 0);</div><div class='hunk'>@@ -422,18 +329,19 @@ out:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-purge_old(struct dentry *parent, struct dentry *child, struct nfsd_net *nn)</div><div class='add'>+purge_old(struct dentry *parent, char *cname, struct nfsd_net *nn)</div><div class='ctx'> {</div><div class='ctx'> 	int status;</div><div class='add'>+	struct dentry *child;</div><div class='ctx'> 	struct xdr_netobj name;</div><div class='ctx'> </div><div class='del'>-	if (child-&gt;d_name.len != HEXDIR_LEN - 1) {</div><div class='del'>-		printk("%s: illegal name %pd in recovery directory\n",</div><div class='del'>-				__func__, child);</div><div class='add'>+	if (strlen(cname) != HEXDIR_LEN - 1) {</div><div class='add'>+		printk("%s: illegal name %s in recovery directory\n",</div><div class='add'>+				__func__, cname);</div><div class='ctx'> 		/* Keep trying; maybe the others are OK: */</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='del'>-	name.data = kmemdup_nul(child-&gt;d_name.name, child-&gt;d_name.len, GFP_KERNEL);</div><div class='add'>+	name.data = kstrdup(cname, GFP_KERNEL);</div><div class='ctx'> 	if (!name.data) {</div><div class='ctx'> 		dprintk("%s: failed to allocate memory for name.data!\n",</div><div class='ctx'> 			__func__);</div><div class='hunk'>@@ -443,10 +351,17 @@ purge_old(struct dentry *parent, struct dentry *child, struct nfsd_net *nn)</div><div class='ctx'> 	if (nfs4_has_reclaimed_state(name, nn))</div><div class='ctx'> 		goto out_free;</div><div class='ctx'> </div><div class='del'>-	status = vfs_rmdir(&amp;init_user_ns, d_inode(parent), child);</div><div class='del'>-	if (status)</div><div class='del'>-		printk("failed to remove client recovery directory %pd\n",</div><div class='del'>-				child);</div><div class='add'>+	inode_lock_nested(d_inode(parent), I_MUTEX_PARENT);</div><div class='add'>+	child = lookup_one(&amp;nop_mnt_idmap, &amp;QSTR(cname), parent);</div><div class='add'>+	if (!IS_ERR(child)) {</div><div class='add'>+		status = vfs_rmdir(&amp;nop_mnt_idmap, d_inode(parent), child, NULL);</div><div class='add'>+		if (status)</div><div class='add'>+			printk("failed to remove client recovery directory %pd\n",</div><div class='add'>+			       child);</div><div class='add'>+		dput(child);</div><div class='add'>+	}</div><div class='add'>+	inode_unlock(d_inode(parent));</div><div class='add'>+</div><div class='ctx'> out_free:</div><div class='ctx'> 	kfree(name.data);</div><div class='ctx'> out:</div><div class='hunk'>@@ -477,27 +392,18 @@ out:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-load_recdir(struct dentry *parent, struct dentry *child, struct nfsd_net *nn)</div><div class='add'>+load_recdir(struct dentry *parent, char *cname, struct nfsd_net *nn)</div><div class='ctx'> {</div><div class='del'>-	struct xdr_netobj name;</div><div class='add'>+	struct xdr_netobj name = { .len = HEXDIR_LEN, .data = cname };</div><div class='ctx'> 	struct xdr_netobj princhash = { .len = 0, .data = NULL };</div><div class='ctx'> </div><div class='del'>-	if (child-&gt;d_name.len != HEXDIR_LEN - 1) {</div><div class='del'>-		printk("%s: illegal name %pd in recovery directory\n",</div><div class='del'>-				__func__, child);</div><div class='add'>+	if (strlen(cname) != HEXDIR_LEN - 1) {</div><div class='add'>+		printk("%s: illegal name %s in recovery directory\n",</div><div class='add'>+				__func__, cname);</div><div class='ctx'> 		/* Keep trying; maybe the others are OK: */</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='del'>-	name.data = kmemdup_nul(child-&gt;d_name.name, child-&gt;d_name.len, GFP_KERNEL);</div><div class='del'>-	if (!name.data) {</div><div class='del'>-		dprintk("%s: failed to allocate memory for name.data!\n",</div><div class='del'>-			__func__);</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	name.len = HEXDIR_LEN;</div><div class='del'>-	if (!nfs4_client_to_reclaim(name, princhash, nn))</div><div class='del'>-		kfree(name.data);</div><div class='del'>-out:</div><div class='add'>+	nfs4_client_to_reclaim(name, princhash, nn);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -658,7 +564,8 @@ nfs4_reset_recoverydir(char *recdir)</div><div class='ctx'> 		return status;</div><div class='ctx'> 	status = -ENOTDIR;</div><div class='ctx'> 	if (d_is_dir(path.dentry)) {</div><div class='del'>-		strcpy(user_recovery_dirname, recdir);</div><div class='add'>+		strscpy(user_recovery_dirname, recdir,</div><div class='add'>+			sizeof(user_recovery_dirname));</div><div class='ctx'> 		status = 0;</div><div class='ctx'> 	}</div><div class='ctx'> 	path_put(&amp;path);</div><div class='hunk'>@@ -674,7 +581,6 @@ nfs4_recoverydir(void)</div><div class='ctx'> static int</div><div class='ctx'> nfsd4_check_legacy_client(struct nfs4_client *clp)</div><div class='ctx'> {</div><div class='del'>-	int status;</div><div class='ctx'> 	char dname[HEXDIR_LEN];</div><div class='ctx'> 	struct nfs4_client_reclaim *crp;</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(clp-&gt;net, nfsd_net_id);</div><div class='hunk'>@@ -684,11 +590,7 @@ nfsd4_check_legacy_client(struct nfs4_client *clp)</div><div class='ctx'> 	if (test_bit(NFSD4_CLIENT_STABLE, &amp;clp-&gt;cl_flags))</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='del'>-	status = nfs4_make_rec_clidname(dname, &amp;clp-&gt;cl_name);</div><div class='del'>-	if (status) {</div><div class='del'>-		legacy_recdir_name_error(clp, status);</div><div class='del'>-		return status;</div><div class='del'>-	}</div><div class='add'>+	nfs4_make_rec_clidname(dname, &amp;clp-&gt;cl_name);</div><div class='ctx'> </div><div class='ctx'> 	/* look for it in the reclaim hashtable otherwise */</div><div class='ctx'> 	name.data = kmemdup(dname, HEXDIR_LEN, GFP_KERNEL);</div><div class='hunk'>@@ -720,6 +622,7 @@ static const struct nfsd4_client_tracking_ops nfsd4_legacy_tracking_ops = {</div><div class='ctx'> 	.version	= 1,</div><div class='ctx'> 	.msglen		= 0,</div><div class='ctx'> };</div><div class='add'>+#endif /* CONFIG_NFSD_LEGACY_CLIENT_TRACKING */</div><div class='ctx'> </div><div class='ctx'> /* Globals */</div><div class='ctx'> #define NFSD_PIPE_DIR		"nfsd"</div><div class='hunk'>@@ -731,8 +634,9 @@ struct cld_net {</div><div class='ctx'> 	spinlock_t		 cn_lock;</div><div class='ctx'> 	struct list_head	 cn_list;</div><div class='ctx'> 	unsigned int		 cn_xid;</div><div class='add'>+#ifdef CONFIG_NFSD_LEGACY_CLIENT_TRACKING</div><div class='ctx'> 	bool			 cn_has_legacy;</div><div class='del'>-	struct crypto_shash	*cn_tfm;</div><div class='add'>+#endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct cld_upcall {</div><div class='hunk'>@@ -792,8 +696,9 @@ __cld_pipe_inprogress_downcall(const struct cld_msg_v2 __user *cmsg,</div><div class='ctx'> {</div><div class='ctx'> 	uint8_t cmd, princhashlen;</div><div class='ctx'> 	struct xdr_netobj name, princhash = { .len = 0, .data = NULL };</div><div class='add'>+	char *namecopy __free(kfree) = NULL;</div><div class='add'>+	char *princhashcopy __free(kfree) = NULL;</div><div class='ctx'> 	uint16_t namelen;</div><div class='del'>-	struct cld_net *cn = nn-&gt;cld_net;</div><div class='ctx'> </div><div class='ctx'> 	if (get_user(cmd, &amp;cmsg-&gt;cm_cmd)) {</div><div class='ctx'> 		dprintk("%s: error when copying cmd from userspace", __func__);</div><div class='hunk'>@@ -806,17 +711,23 @@ __cld_pipe_inprogress_downcall(const struct cld_msg_v2 __user *cmsg,</div><div class='ctx'> 			ci = &amp;cmsg-&gt;cm_u.cm_clntinfo;</div><div class='ctx'> 			if (get_user(namelen, &amp;ci-&gt;cc_name.cn_len))</div><div class='ctx'> 				return -EFAULT;</div><div class='del'>-			name.data = memdup_user(&amp;ci-&gt;cc_name.cn_id, namelen);</div><div class='del'>-			if (IS_ERR_OR_NULL(name.data))</div><div class='del'>-				return -EFAULT;</div><div class='add'>+			if (namelen == 0 || namelen &gt; NFS4_OPAQUE_LIMIT) {</div><div class='add'>+				dprintk("%s: invalid namelen (%u)", __func__, namelen);</div><div class='add'>+				return -EINVAL;</div><div class='add'>+			}</div><div class='add'>+			namecopy = memdup_user(&amp;ci-&gt;cc_name.cn_id, namelen);</div><div class='add'>+			if (IS_ERR(namecopy))</div><div class='add'>+				return PTR_ERR(namecopy);</div><div class='add'>+			name.data = namecopy;</div><div class='ctx'> 			name.len = namelen;</div><div class='ctx'> 			get_user(princhashlen, &amp;ci-&gt;cc_princhash.cp_len);</div><div class='ctx'> 			if (princhashlen &gt; 0) {</div><div class='del'>-				princhash.data = memdup_user(</div><div class='del'>-						&amp;ci-&gt;cc_princhash.cp_data,</div><div class='del'>-						princhashlen);</div><div class='del'>-				if (IS_ERR_OR_NULL(princhash.data))</div><div class='del'>-					return -EFAULT;</div><div class='add'>+				princhashcopy = memdup_user(</div><div class='add'>+					&amp;ci-&gt;cc_princhash.cp_data,</div><div class='add'>+					princhashlen);</div><div class='add'>+				if (IS_ERR(princhashcopy))</div><div class='add'>+					return PTR_ERR(princhashcopy);</div><div class='add'>+				princhash.data = princhashcopy;</div><div class='ctx'> 				princhash.len = princhashlen;</div><div class='ctx'> 			} else</div><div class='ctx'> 				princhash.len = 0;</div><div class='hunk'>@@ -826,21 +737,27 @@ __cld_pipe_inprogress_downcall(const struct cld_msg_v2 __user *cmsg,</div><div class='ctx'> 			cnm = &amp;cmsg-&gt;cm_u.cm_name;</div><div class='ctx'> 			if (get_user(namelen, &amp;cnm-&gt;cn_len))</div><div class='ctx'> 				return -EFAULT;</div><div class='del'>-			name.data = memdup_user(&amp;cnm-&gt;cn_id, namelen);</div><div class='del'>-			if (IS_ERR_OR_NULL(name.data))</div><div class='del'>-				return -EFAULT;</div><div class='add'>+			if (namelen == 0 || namelen &gt; NFS4_OPAQUE_LIMIT) {</div><div class='add'>+				dprintk("%s: invalid namelen (%u)", __func__, namelen);</div><div class='add'>+				return -EINVAL;</div><div class='add'>+			}</div><div class='add'>+			namecopy = memdup_user(&amp;cnm-&gt;cn_id, namelen);</div><div class='add'>+			if (IS_ERR(namecopy))</div><div class='add'>+				return PTR_ERR(namecopy);</div><div class='add'>+			name.data = namecopy;</div><div class='ctx'> 			name.len = namelen;</div><div class='ctx'> 		}</div><div class='add'>+#ifdef CONFIG_NFSD_LEGACY_CLIENT_TRACKING</div><div class='ctx'> 		if (name.len &gt; 5 &amp;&amp; memcmp(name.data, "hash:", 5) == 0) {</div><div class='add'>+			struct cld_net *cn = nn-&gt;cld_net;</div><div class='add'>+</div><div class='ctx'> 			name.len = name.len - 5;</div><div class='del'>-			memmove(name.data, name.data + 5, name.len);</div><div class='add'>+			name.data = name.data + 5;</div><div class='ctx'> 			cn-&gt;cn_has_legacy = true;</div><div class='ctx'> 		}</div><div class='del'>-		if (!nfs4_client_to_reclaim(name, princhash, nn)) {</div><div class='del'>-			kfree(name.data);</div><div class='del'>-			kfree(princhash.data);</div><div class='add'>+#endif</div><div class='add'>+		if (!nfs4_client_to_reclaim(name, princhash, nn))</div><div class='ctx'> 			return -EFAULT;</div><div class='del'>-		}</div><div class='ctx'> 		return nn-&gt;client_tracking_ops-&gt;msglen;</div><div class='ctx'> 	}</div><div class='ctx'> 	return -EFAULT;</div><div class='hunk'>@@ -929,38 +846,32 @@ static const struct rpc_pipe_ops cld_upcall_ops = {</div><div class='ctx'> 	.destroy_msg	= cld_pipe_destroy_msg,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static struct dentry *</div><div class='add'>+static int</div><div class='ctx'> nfsd4_cld_register_sb(struct super_block *sb, struct rpc_pipe *pipe)</div><div class='ctx'> {</div><div class='del'>-	struct dentry *dir, *dentry;</div><div class='add'>+	struct dentry *dir;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='ctx'> 	dir = rpc_d_lookup_sb(sb, NFSD_PIPE_DIR);</div><div class='ctx'> 	if (dir == NULL)</div><div class='del'>-		return ERR_PTR(-ENOENT);</div><div class='del'>-	dentry = rpc_mkpipe_dentry(dir, NFSD_CLD_PIPE, NULL, pipe);</div><div class='add'>+		return -ENOENT;</div><div class='add'>+	err = rpc_mkpipe_dentry(dir, NFSD_CLD_PIPE, NULL, pipe);</div><div class='ctx'> 	dput(dir);</div><div class='del'>-	return dentry;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void</div><div class='del'>-nfsd4_cld_unregister_sb(struct rpc_pipe *pipe)</div><div class='del'>-{</div><div class='del'>-	if (pipe-&gt;dentry)</div><div class='del'>-		rpc_unlink(pipe-&gt;dentry);</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct dentry *</div><div class='add'>+static int</div><div class='ctx'> nfsd4_cld_register_net(struct net *net, struct rpc_pipe *pipe)</div><div class='ctx'> {</div><div class='ctx'> 	struct super_block *sb;</div><div class='del'>-	struct dentry *dentry;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='ctx'> 	sb = rpc_get_sb_net(net);</div><div class='ctx'> 	if (!sb)</div><div class='del'>-		return NULL;</div><div class='del'>-	dentry = nfsd4_cld_register_sb(sb, pipe);</div><div class='add'>+		return 0;</div><div class='add'>+	err = nfsd4_cld_register_sb(sb, pipe);</div><div class='ctx'> 	rpc_put_sb_net(net);</div><div class='del'>-	return dentry;</div><div class='add'>+	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='hunk'>@@ -970,7 +881,7 @@ nfsd4_cld_unregister_net(struct net *net, struct rpc_pipe *pipe)</div><div class='ctx'> </div><div class='ctx'> 	sb = rpc_get_sb_net(net);</div><div class='ctx'> 	if (sb) {</div><div class='del'>-		nfsd4_cld_unregister_sb(pipe);</div><div class='add'>+		rpc_unlink(pipe);</div><div class='ctx'> 		rpc_put_sb_net(net);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -980,7 +891,6 @@ static int</div><div class='ctx'> __nfsd4_init_cld_pipe(struct net *net)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='del'>-	struct dentry *dentry;</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='ctx'> 	struct cld_net *cn;</div><div class='ctx'> </div><div class='hunk'>@@ -1001,14 +911,13 @@ __nfsd4_init_cld_pipe(struct net *net)</div><div class='ctx'> 	spin_lock_init(&amp;cn-&gt;cn_lock);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;cn-&gt;cn_list);</div><div class='ctx'> </div><div class='del'>-	dentry = nfsd4_cld_register_net(net, cn-&gt;cn_pipe);</div><div class='del'>-	if (IS_ERR(dentry)) {</div><div class='del'>-		ret = PTR_ERR(dentry);</div><div class='add'>+	ret = nfsd4_cld_register_net(net, cn-&gt;cn_pipe);</div><div class='add'>+	if (unlikely(ret))</div><div class='ctx'> 		goto err_destroy_data;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='del'>-	cn-&gt;cn_pipe-&gt;dentry = dentry;</div><div class='add'>+#ifdef CONFIG_NFSD_LEGACY_CLIENT_TRACKING</div><div class='ctx'> 	cn-&gt;cn_has_legacy = false;</div><div class='add'>+#endif</div><div class='ctx'> 	nn-&gt;cld_net = cn;</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='hunk'>@@ -1040,8 +949,6 @@ nfsd4_remove_cld_pipe(struct net *net)</div><div class='ctx'> </div><div class='ctx'> 	nfsd4_cld_unregister_net(net, cn-&gt;cn_pipe);</div><div class='ctx'> 	rpc_destroy_pipe_data(cn-&gt;cn_pipe);</div><div class='del'>-	if (cn-&gt;cn_tfm)</div><div class='del'>-		crypto_free_shash(cn-&gt;cn_tfm);</div><div class='ctx'> 	kfree(nn-&gt;cld_net);</div><div class='ctx'> 	nn-&gt;cld_net = NULL;</div><div class='ctx'> }</div><div class='hunk'>@@ -1135,8 +1042,6 @@ nfsd4_cld_create_v2(struct nfs4_client *clp)</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(clp-&gt;net, nfsd_net_id);</div><div class='ctx'> 	struct cld_net *cn = nn-&gt;cld_net;</div><div class='ctx'> 	struct cld_msg_v2 *cmsg;</div><div class='del'>-	struct crypto_shash *tfm = cn-&gt;cn_tfm;</div><div class='del'>-	struct xdr_netobj cksum;</div><div class='ctx'> 	char *principal = NULL;</div><div class='ctx'> </div><div class='ctx'> 	/* Don't upcall if it's already stored */</div><div class='hunk'>@@ -1159,22 +1064,9 @@ nfsd4_cld_create_v2(struct nfs4_client *clp)</div><div class='ctx'> 	else if (clp-&gt;cl_cred.cr_principal)</div><div class='ctx'> 		principal = clp-&gt;cl_cred.cr_principal;</div><div class='ctx'> 	if (principal) {</div><div class='del'>-		cksum.len = crypto_shash_digestsize(tfm);</div><div class='del'>-		cksum.data = kmalloc(cksum.len, GFP_KERNEL);</div><div class='del'>-		if (cksum.data == NULL) {</div><div class='del'>-			ret = -ENOMEM;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		ret = crypto_shash_tfm_digest(tfm, principal, strlen(principal),</div><div class='del'>-					      cksum.data);</div><div class='del'>-		if (ret) {</div><div class='del'>-			kfree(cksum.data);</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='del'>-		cmsg-&gt;cm_u.cm_clntinfo.cc_princhash.cp_len = cksum.len;</div><div class='del'>-		memcpy(cmsg-&gt;cm_u.cm_clntinfo.cc_princhash.cp_data,</div><div class='del'>-		       cksum.data, cksum.len);</div><div class='del'>-		kfree(cksum.data);</div><div class='add'>+		sha256(principal, strlen(principal),</div><div class='add'>+		       cmsg-&gt;cm_u.cm_clntinfo.cc_princhash.cp_data);</div><div class='add'>+		cmsg-&gt;cm_u.cm_clntinfo.cc_princhash.cp_len = SHA256_DIGEST_SIZE;</div><div class='ctx'> 	} else</div><div class='ctx'> 		cmsg-&gt;cm_u.cm_clntinfo.cc_princhash.cp_len = 0;</div><div class='ctx'> </div><div class='hunk'>@@ -1184,7 +1076,6 @@ nfsd4_cld_create_v2(struct nfs4_client *clp)</div><div class='ctx'> 		set_bit(NFSD4_CLIENT_STABLE, &amp;clp-&gt;cl_flags);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-out:</div><div class='ctx'> 	free_cld_upcall(cup);</div><div class='ctx'> out_err:</div><div class='ctx'> 	if (ret)</div><div class='hunk'>@@ -1280,10 +1171,6 @@ nfsd4_cld_check(struct nfs4_client *clp)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_client_reclaim *crp;</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(clp-&gt;net, nfsd_net_id);</div><div class='del'>-	struct cld_net *cn = nn-&gt;cld_net;</div><div class='del'>-	int status;</div><div class='del'>-	char dname[HEXDIR_LEN];</div><div class='del'>-	struct xdr_netobj name;</div><div class='ctx'> </div><div class='ctx'> 	/* did we already find that this client is stable? */</div><div class='ctx'> 	if (test_bit(NFSD4_CLIENT_STABLE, &amp;clp-&gt;cl_flags))</div><div class='hunk'>@@ -1294,10 +1181,12 @@ nfsd4_cld_check(struct nfs4_client *clp)</div><div class='ctx'> 	if (crp)</div><div class='ctx'> 		goto found;</div><div class='ctx'> </div><div class='del'>-	if (cn-&gt;cn_has_legacy) {</div><div class='del'>-		status = nfs4_make_rec_clidname(dname, &amp;clp-&gt;cl_name);</div><div class='del'>-		if (status)</div><div class='del'>-			return -ENOENT;</div><div class='add'>+#ifdef CONFIG_NFSD_LEGACY_CLIENT_TRACKING</div><div class='add'>+	if (nn-&gt;cld_net-&gt;cn_has_legacy) {</div><div class='add'>+		char dname[HEXDIR_LEN];</div><div class='add'>+		struct xdr_netobj name;</div><div class='add'>+</div><div class='add'>+		nfs4_make_rec_clidname(dname, &amp;clp-&gt;cl_name);</div><div class='ctx'> </div><div class='ctx'> 		name.data = kmemdup(dname, HEXDIR_LEN, GFP_KERNEL);</div><div class='ctx'> 		if (!name.data) {</div><div class='hunk'>@@ -1312,6 +1201,7 @@ nfsd4_cld_check(struct nfs4_client *clp)</div><div class='ctx'> 			goto found;</div><div class='ctx'> </div><div class='ctx'> 	}</div><div class='add'>+#endif</div><div class='ctx'> 	return -ENOENT;</div><div class='ctx'> found:</div><div class='ctx'> 	crp-&gt;cr_clp = clp;</div><div class='hunk'>@@ -1321,14 +1211,11 @@ found:</div><div class='ctx'> static int</div><div class='ctx'> nfsd4_cld_check_v2(struct nfs4_client *clp)</div><div class='ctx'> {</div><div class='del'>-	struct nfs4_client_reclaim *crp;</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(clp-&gt;net, nfsd_net_id);</div><div class='add'>+#ifdef CONFIG_NFSD_LEGACY_CLIENT_TRACKING</div><div class='ctx'> 	struct cld_net *cn = nn-&gt;cld_net;</div><div class='del'>-	int status;</div><div class='del'>-	char dname[HEXDIR_LEN];</div><div class='del'>-	struct xdr_netobj name;</div><div class='del'>-	struct crypto_shash *tfm = cn-&gt;cn_tfm;</div><div class='del'>-	struct xdr_netobj cksum;</div><div class='add'>+#endif</div><div class='add'>+	struct nfs4_client_reclaim *crp;</div><div class='ctx'> 	char *principal = NULL;</div><div class='ctx'> </div><div class='ctx'> 	/* did we already find that this client is stable? */</div><div class='hunk'>@@ -1340,10 +1227,12 @@ nfsd4_cld_check_v2(struct nfs4_client *clp)</div><div class='ctx'> 	if (crp)</div><div class='ctx'> 		goto found;</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_NFSD_LEGACY_CLIENT_TRACKING</div><div class='ctx'> 	if (cn-&gt;cn_has_legacy) {</div><div class='del'>-		status = nfs4_make_rec_clidname(dname, &amp;clp-&gt;cl_name);</div><div class='del'>-		if (status)</div><div class='del'>-			return -ENOENT;</div><div class='add'>+		struct xdr_netobj name;</div><div class='add'>+		char dname[HEXDIR_LEN];</div><div class='add'>+</div><div class='add'>+		nfs4_make_rec_clidname(dname, &amp;clp-&gt;cl_name);</div><div class='ctx'> </div><div class='ctx'> 		name.data = kmemdup(dname, HEXDIR_LEN, GFP_KERNEL);</div><div class='ctx'> 		if (!name.data) {</div><div class='hunk'>@@ -1358,31 +1247,22 @@ nfsd4_cld_check_v2(struct nfs4_client *clp)</div><div class='ctx'> 			goto found;</div><div class='ctx'> </div><div class='ctx'> 	}</div><div class='add'>+#endif</div><div class='ctx'> 	return -ENOENT;</div><div class='ctx'> found:</div><div class='ctx'> 	if (crp-&gt;cr_princhash.len) {</div><div class='add'>+		u8 digest[SHA256_DIGEST_SIZE];</div><div class='add'>+</div><div class='ctx'> 		if (clp-&gt;cl_cred.cr_raw_principal)</div><div class='ctx'> 			principal = clp-&gt;cl_cred.cr_raw_principal;</div><div class='ctx'> 		else if (clp-&gt;cl_cred.cr_principal)</div><div class='ctx'> 			principal = clp-&gt;cl_cred.cr_principal;</div><div class='ctx'> 		if (principal == NULL)</div><div class='ctx'> 			return -ENOENT;</div><div class='del'>-		cksum.len = crypto_shash_digestsize(tfm);</div><div class='del'>-		cksum.data = kmalloc(cksum.len, GFP_KERNEL);</div><div class='del'>-		if (cksum.data == NULL)</div><div class='del'>-			return -ENOENT;</div><div class='del'>-		status = crypto_shash_tfm_digest(tfm, principal,</div><div class='del'>-						 strlen(principal), cksum.data);</div><div class='del'>-		if (status) {</div><div class='del'>-			kfree(cksum.data);</div><div class='del'>-			return -ENOENT;</div><div class='del'>-		}</div><div class='del'>-		if (memcmp(crp-&gt;cr_princhash.data, cksum.data,</div><div class='del'>-				crp-&gt;cr_princhash.len)) {</div><div class='del'>-			kfree(cksum.data);</div><div class='add'>+		sha256(principal, strlen(principal), digest);</div><div class='add'>+		if (memcmp(crp-&gt;cr_princhash.data, digest,</div><div class='add'>+				crp-&gt;cr_princhash.len))</div><div class='ctx'> 			return -ENOENT;</div><div class='del'>-		}</div><div class='del'>-		kfree(cksum.data);</div><div class='ctx'> 	}</div><div class='ctx'> 	crp-&gt;cr_clp = clp;</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -1562,7 +1442,6 @@ nfsd4_cld_tracking_init(struct net *net)</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='ctx'> 	bool running;</div><div class='ctx'> 	int retries = 10;</div><div class='del'>-	struct crypto_shash *tfm;</div><div class='ctx'> </div><div class='ctx'> 	status = nfs4_cld_state_init(net);</div><div class='ctx'> 	if (status)</div><div class='hunk'>@@ -1587,12 +1466,6 @@ nfsd4_cld_tracking_init(struct net *net)</div><div class='ctx'> 		status = -ETIMEDOUT;</div><div class='ctx'> 		goto err_remove;</div><div class='ctx'> 	}</div><div class='del'>-	tfm = crypto_alloc_shash("sha256", 0, 0);</div><div class='del'>-	if (IS_ERR(tfm)) {</div><div class='del'>-		status = PTR_ERR(tfm);</div><div class='del'>-		goto err_remove;</div><div class='del'>-	}</div><div class='del'>-	nn-&gt;cld_net-&gt;cn_tfm = tfm;</div><div class='ctx'> </div><div class='ctx'> 	status = nfsd4_cld_get_version(nn);</div><div class='ctx'> 	if (status == -EOPNOTSUPP)</div><div class='hunk'>@@ -1661,6 +1534,7 @@ static const struct nfsd4_client_tracking_ops nfsd4_cld_tracking_ops_v2 = {</div><div class='ctx'> 	.msglen		= sizeof(struct cld_msg_v2),</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_NFSD_LEGACY_CLIENT_TRACKING</div><div class='ctx'> /* upcall via usermodehelper */</div><div class='ctx'> static char cltrack_prog[PATH_MAX] = "/sbin/nfsdcltrack";</div><div class='ctx'> module_param_string(cltrack_prog, cltrack_prog, sizeof(cltrack_prog),</div><div class='hunk'>@@ -1731,11 +1605,7 @@ nfsd4_cltrack_legacy_recdir(const struct xdr_netobj *name)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	copied = nfs4_make_rec_clidname(result + copied, name);</div><div class='del'>-	if (copied) {</div><div class='del'>-		kfree(result);</div><div class='del'>-		return NULL;</div><div class='del'>-	}</div><div class='add'>+	nfs4_make_rec_clidname(result + copied, name);</div><div class='ctx'> </div><div class='ctx'> 	return result;</div><div class='ctx'> }</div><div class='hunk'>@@ -1878,10 +1748,7 @@ nfsd4_cltrack_upcall_lock(struct nfs4_client *clp)</div><div class='ctx'> static void</div><div class='ctx'> nfsd4_cltrack_upcall_unlock(struct nfs4_client *clp)</div><div class='ctx'> {</div><div class='del'>-	smp_mb__before_atomic();</div><div class='del'>-	clear_bit(NFSD4_CLIENT_UPCALL_LOCK, &amp;clp-&gt;cl_flags);</div><div class='del'>-	smp_mb__after_atomic();</div><div class='del'>-	wake_up_bit(&amp;clp-&gt;cl_flags, NFSD4_CLIENT_UPCALL_LOCK);</div><div class='add'>+	clear_and_wake_up_bit(NFSD4_CLIENT_UPCALL_LOCK, &amp;clp-&gt;cl_flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='hunk'>@@ -2005,28 +1872,10 @@ static const struct nfsd4_client_tracking_ops nfsd4_umh_tracking_ops = {</div><div class='ctx'> 	.msglen		= 0,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-int</div><div class='del'>-nfsd4_client_tracking_init(struct net *net)</div><div class='add'>+static inline int check_for_legacy_methods(int status, struct net *net)</div><div class='ctx'> {</div><div class='del'>-	int status;</div><div class='del'>-	struct path path;</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='del'>-</div><div class='del'>-	/* just run the init if it the method is already decided */</div><div class='del'>-	if (nn-&gt;client_tracking_ops)</div><div class='del'>-		goto do_init;</div><div class='del'>-</div><div class='del'>-	/* First, try to use nfsdcld */</div><div class='del'>-	nn-&gt;client_tracking_ops = &amp;nfsd4_cld_tracking_ops;</div><div class='del'>-	status = nn-&gt;client_tracking_ops-&gt;init(net);</div><div class='del'>-	if (!status)</div><div class='del'>-		return status;</div><div class='del'>-	if (status != -ETIMEDOUT) {</div><div class='del'>-		nn-&gt;client_tracking_ops = &amp;nfsd4_cld_tracking_ops_v0;</div><div class='del'>-		status = nn-&gt;client_tracking_ops-&gt;init(net);</div><div class='del'>-		if (!status)</div><div class='del'>-			return status;</div><div class='del'>-	}</div><div class='add'>+	struct path path;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Next, try the UMH upcall.</div><div class='hunk'>@@ -2043,20 +1892,51 @@ nfsd4_client_tracking_init(struct net *net)</div><div class='ctx'> 	nn-&gt;client_tracking_ops = &amp;nfsd4_legacy_tracking_ops;</div><div class='ctx'> 	status = kern_path(nfs4_recoverydir(), LOOKUP_FOLLOW, &amp;path);</div><div class='ctx'> 	if (!status) {</div><div class='del'>-		status = d_is_dir(path.dentry);</div><div class='add'>+		status = !d_is_dir(path.dentry);</div><div class='ctx'> 		path_put(&amp;path);</div><div class='del'>-		if (!status) {</div><div class='del'>-			status = -EINVAL;</div><div class='del'>-			goto out;</div><div class='del'>-		}</div><div class='add'>+		if (status)</div><div class='add'>+			return -ENOTDIR;</div><div class='add'>+	}</div><div class='add'>+	return status;</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+static inline int check_for_legacy_methods(int status, struct net *net)</div><div class='add'>+{</div><div class='add'>+	return status;</div><div class='add'>+}</div><div class='add'>+#endif /* CONFIG_LEGACY_NFSD_CLIENT_TRACKING */</div><div class='add'>+</div><div class='add'>+int</div><div class='add'>+nfsd4_client_tracking_init(struct net *net)</div><div class='add'>+{</div><div class='add'>+	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='add'>+	int status;</div><div class='add'>+</div><div class='add'>+	/* just run the init if it the method is already decided */</div><div class='add'>+	if (nn-&gt;client_tracking_ops)</div><div class='add'>+		goto do_init;</div><div class='add'>+</div><div class='add'>+	/* First, try to use nfsdcld */</div><div class='add'>+	nn-&gt;client_tracking_ops = &amp;nfsd4_cld_tracking_ops;</div><div class='add'>+	status = nn-&gt;client_tracking_ops-&gt;init(net);</div><div class='add'>+	if (!status)</div><div class='add'>+		return status;</div><div class='add'>+	if (status != -ETIMEDOUT) {</div><div class='add'>+		nn-&gt;client_tracking_ops = &amp;nfsd4_cld_tracking_ops_v0;</div><div class='add'>+		status = nn-&gt;client_tracking_ops-&gt;init(net);</div><div class='add'>+		if (!status)</div><div class='add'>+			return status;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	status = check_for_legacy_methods(status, net);</div><div class='add'>+	if (status)</div><div class='add'>+		goto out;</div><div class='ctx'> do_init:</div><div class='ctx'> 	status = nn-&gt;client_tracking_ops-&gt;init(net);</div><div class='ctx'> out:</div><div class='ctx'> 	if (status) {</div><div class='del'>-		printk(KERN_WARNING "NFSD: Unable to initialize client "</div><div class='del'>-				    "recovery tracking! (%d)\n", status);</div><div class='add'>+		pr_warn("NFSD: Unable to initialize client recovery tracking! (%d)\n", status);</div><div class='add'>+		pr_warn("NFSD: Is nfsdcld running? If not, enable CONFIG_NFSD_LEGACY_CLIENT_TRACKING.\n");</div><div class='ctx'> 		nn-&gt;client_tracking_ops = NULL;</div><div class='ctx'> 	}</div><div class='ctx'> 	return status;</div><div class='hunk'>@@ -2117,7 +1997,6 @@ rpc_pipefs_event(struct notifier_block *nb, unsigned long event, void *ptr)</div><div class='ctx'> 	struct net *net = sb-&gt;s_fs_info;</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='ctx'> 	struct cld_net *cn = nn-&gt;cld_net;</div><div class='del'>-	struct dentry *dentry;</div><div class='ctx'> 	int ret = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (!try_module_get(THIS_MODULE))</div><div class='hunk'>@@ -2130,16 +2009,10 @@ rpc_pipefs_event(struct notifier_block *nb, unsigned long event, void *ptr)</div><div class='ctx'> </div><div class='ctx'> 	switch (event) {</div><div class='ctx'> 	case RPC_PIPEFS_MOUNT:</div><div class='del'>-		dentry = nfsd4_cld_register_sb(sb, cn-&gt;cn_pipe);</div><div class='del'>-		if (IS_ERR(dentry)) {</div><div class='del'>-			ret = PTR_ERR(dentry);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-		cn-&gt;cn_pipe-&gt;dentry = dentry;</div><div class='add'>+		ret = nfsd4_cld_register_sb(sb, cn-&gt;cn_pipe);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case RPC_PIPEFS_UMOUNT:</div><div class='del'>-		if (cn-&gt;cn_pipe-&gt;dentry)</div><div class='del'>-			nfsd4_cld_unregister_sb(cn-&gt;cn_pipe);</div><div class='add'>+		rpc_unlink(cn-&gt;cn_pipe);</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		ret = -ENOTSUPP;</div><div class='hunk'>@@ -2156,6 +2029,7 @@ static struct notifier_block nfsd4_cld_block = {</div><div class='ctx'> int</div><div class='ctx'> register_cld_notifier(void)</div><div class='ctx'> {</div><div class='add'>+	WARN_ON(!nfsd_net_id);</div><div class='ctx'> 	return rpc_pipefs_notifier_register(&amp;nfsd4_cld_block);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='head'>diff --git a/fs/nfsd/nfs4state.c b/fs/nfsd/nfs4state.c<br/>index bfad94c70b84..808c24fb5c9a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfs4state.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfs4state.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfs4state.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/nfs4state.c</a></div><div class='hunk'>@@ -44,7 +44,9 @@</div><div class='ctx'> #include &lt;linux/jhash.h&gt;</div><div class='ctx'> #include &lt;linux/string_helpers.h&gt;</div><div class='ctx'> #include &lt;linux/fsnotify.h&gt;</div><div class='add'>+#include &lt;linux/rhashtable.h&gt;</div><div class='ctx'> #include &lt;linux/nfs_ssc.h&gt;</div><div class='add'>+</div><div class='ctx'> #include "xdr4.h"</div><div class='ctx'> #include "xdr4cb.h"</div><div class='ctx'> #include "vfs.h"</div><div class='hunk'>@@ -57,7 +59,7 @@</div><div class='ctx'> </div><div class='ctx'> #define NFSDDBG_FACILITY                NFSDDBG_PROC</div><div class='ctx'> </div><div class='del'>-#define all_ones {{~0,~0},~0}</div><div class='add'>+#define all_ones {{ ~0, ~0}, ~0}</div><div class='ctx'> static const stateid_t one_stateid = {</div><div class='ctx'> 	.si_generation = ~0,</div><div class='ctx'> 	.si_opaque = all_ones,</div><div class='hunk'>@@ -84,6 +86,8 @@ static bool check_for_locks(struct nfs4_file *fp, struct nfs4_lockowner *lowner)</div><div class='ctx'> static void nfs4_free_ol_stateid(struct nfs4_stid *stid);</div><div class='ctx'> void nfsd4_end_grace(struct nfsd_net *nn);</div><div class='ctx'> static void _free_cpntf_state_locked(struct nfsd_net *nn, struct nfs4_cpntf_state *cps);</div><div class='add'>+static void nfsd4_file_hash_remove(struct nfs4_file *fi);</div><div class='add'>+static void deleg_reaper(struct nfsd_net *nn);</div><div class='ctx'> </div><div class='ctx'> /* Locking: */</div><div class='ctx'> </div><div class='hunk'>@@ -124,17 +128,35 @@ static void free_session(struct nfsd4_session *);</div><div class='ctx'> </div><div class='ctx'> static const struct nfsd4_callback_ops nfsd4_cb_recall_ops;</div><div class='ctx'> static const struct nfsd4_callback_ops nfsd4_cb_notify_lock_ops;</div><div class='add'>+static const struct nfsd4_callback_ops nfsd4_cb_getattr_ops;</div><div class='add'>+</div><div class='add'>+static struct workqueue_struct *laundry_wq;</div><div class='add'>+</div><div class='add'>+int nfsd4_create_laundry_wq(void)</div><div class='add'>+{</div><div class='add'>+	int rc = 0;</div><div class='add'>+</div><div class='add'>+	laundry_wq = alloc_workqueue("%s", WQ_UNBOUND, 0, "nfsd4");</div><div class='add'>+	if (laundry_wq == NULL)</div><div class='add'>+		rc = -ENOMEM;</div><div class='add'>+	return rc;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void nfsd4_destroy_laundry_wq(void)</div><div class='add'>+{</div><div class='add'>+	destroy_workqueue(laundry_wq);</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> static bool is_session_dead(struct nfsd4_session *ses)</div><div class='ctx'> {</div><div class='del'>-	return ses-&gt;se_flags &amp; NFS4_SESSION_DEAD;</div><div class='add'>+	return ses-&gt;se_dead;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32 mark_session_dead_locked(struct nfsd4_session *ses, int ref_held_by_me)</div><div class='ctx'> {</div><div class='ctx'> 	if (atomic_read(&amp;ses-&gt;se_ref) &gt; ref_held_by_me)</div><div class='ctx'> 		return nfserr_jukebox;</div><div class='del'>-	ses-&gt;se_flags |= NFS4_SESSION_DEAD;</div><div class='add'>+	ses-&gt;se_dead = true;</div><div class='ctx'> 	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -143,6 +165,13 @@ static bool is_client_expired(struct nfs4_client *clp)</div><div class='ctx'> 	return clp-&gt;cl_time == 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void nfsd4_dec_courtesy_client_count(struct nfsd_net *nn,</div><div class='add'>+					struct nfs4_client *clp)</div><div class='add'>+{</div><div class='add'>+	if (clp-&gt;cl_state != NFSD4_ACTIVE)</div><div class='add'>+		atomic_add_unless(&amp;nn-&gt;nfsd_courtesy_clients, -1, 0);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static __be32 get_client_locked(struct nfs4_client *clp)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(clp-&gt;net, nfsd_net_id);</div><div class='hunk'>@@ -152,6 +181,8 @@ static __be32 get_client_locked(struct nfs4_client *clp)</div><div class='ctx'> 	if (is_client_expired(clp))</div><div class='ctx'> 		return nfserr_expired;</div><div class='ctx'> 	atomic_inc(&amp;clp-&gt;cl_rpc_users);</div><div class='add'>+	nfsd4_dec_courtesy_client_count(nn, clp);</div><div class='add'>+	clp-&gt;cl_state = NFSD4_ACTIVE;</div><div class='ctx'> 	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -172,6 +203,8 @@ renew_client_locked(struct nfs4_client *clp)</div><div class='ctx'> </div><div class='ctx'> 	list_move_tail(&amp;clp-&gt;cl_lru, &amp;nn-&gt;client_lru);</div><div class='ctx'> 	clp-&gt;cl_time = ktime_get_boottime_seconds();</div><div class='add'>+	nfsd4_dec_courtesy_client_count(nn, clp);</div><div class='add'>+	clp-&gt;cl_state = NFSD4_ACTIVE;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void put_client_renew_locked(struct nfs4_client *clp)</div><div class='hunk'>@@ -246,6 +279,7 @@ find_blocked_lock(struct nfs4_lockowner *lo, struct knfsd_fh *fh,</div><div class='ctx'> 	list_for_each_entry(cur, &amp;lo-&gt;lo_blocked, nbl_list) {</div><div class='ctx'> 		if (fh_match(fh, &amp;cur-&gt;nbl_fh)) {</div><div class='ctx'> 			list_del_init(&amp;cur-&gt;nbl_list);</div><div class='add'>+			WARN_ON(list_empty(&amp;cur-&gt;nbl_lru));</div><div class='ctx'> 			list_del_init(&amp;cur-&gt;nbl_lru);</div><div class='ctx'> 			found = cur;</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -265,12 +299,13 @@ find_or_allocate_block(struct nfs4_lockowner *lo, struct knfsd_fh *fh,</div><div class='ctx'> </div><div class='ctx'> 	nbl = find_blocked_lock(lo, fh, nn);</div><div class='ctx'> 	if (!nbl) {</div><div class='del'>-		nbl= kmalloc(sizeof(*nbl), GFP_KERNEL);</div><div class='add'>+		nbl = kmalloc(sizeof(*nbl), GFP_KERNEL);</div><div class='ctx'> 		if (nbl) {</div><div class='ctx'> 			INIT_LIST_HEAD(&amp;nbl-&gt;nbl_list);</div><div class='ctx'> 			INIT_LIST_HEAD(&amp;nbl-&gt;nbl_lru);</div><div class='ctx'> 			fh_copy_shallow(&amp;nbl-&gt;nbl_fh, fh);</div><div class='ctx'> 			locks_init_lock(&amp;nbl-&gt;nbl_lock);</div><div class='add'>+			kref_init(&amp;nbl-&gt;nbl_kref);</div><div class='ctx'> 			nfsd4_init_cb(&amp;nbl-&gt;nbl_cb, lo-&gt;lo_owner.so_client,</div><div class='ctx'> 					&amp;nfsd4_cb_notify_lock_ops,</div><div class='ctx'> 					NFSPROC4_CLNT_CB_NOTIFY_LOCK);</div><div class='hunk'>@@ -280,14 +315,23 @@ find_or_allocate_block(struct nfs4_lockowner *lo, struct knfsd_fh *fh,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='del'>-free_blocked_lock(struct nfsd4_blocked_lock *nbl)</div><div class='add'>+free_nbl(struct kref *kref)</div><div class='ctx'> {</div><div class='del'>-	locks_delete_block(&amp;nbl-&gt;nbl_lock);</div><div class='add'>+	struct nfsd4_blocked_lock *nbl;</div><div class='add'>+</div><div class='add'>+	nbl = container_of(kref, struct nfsd4_blocked_lock, nbl_kref);</div><div class='ctx'> 	locks_release_private(&amp;nbl-&gt;nbl_lock);</div><div class='ctx'> 	kfree(nbl);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='add'>+free_blocked_lock(struct nfsd4_blocked_lock *nbl)</div><div class='add'>+{</div><div class='add'>+	locks_delete_block(&amp;nbl-&gt;nbl_lock);</div><div class='add'>+	kref_put(&amp;nbl-&gt;nbl_kref, free_nbl);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='ctx'> remove_blocked_locks(struct nfs4_lockowner *lo)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_client *clp = lo-&gt;lo_owner.so_client;</div><div class='hunk'>@@ -302,6 +346,7 @@ remove_blocked_locks(struct nfs4_lockowner *lo)</div><div class='ctx'> 					struct nfsd4_blocked_lock,</div><div class='ctx'> 					nbl_list);</div><div class='ctx'> 		list_del_init(&amp;nbl-&gt;nbl_list);</div><div class='add'>+		WARN_ON(list_empty(&amp;nbl-&gt;nbl_lru));</div><div class='ctx'> 		list_move(&amp;nbl-&gt;nbl_lru, &amp;reaplist);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;nn-&gt;blocked_locks_lock);</div><div class='hunk'>@@ -326,6 +371,8 @@ nfsd4_cb_notify_lock_prepare(struct nfsd4_callback *cb)</div><div class='ctx'> static int</div><div class='ctx'> nfsd4_cb_notify_lock_done(struct nfsd4_callback *cb, struct rpc_task *task)</div><div class='ctx'> {</div><div class='add'>+	trace_nfsd_cb_notify_lock_done(&amp;zero_stateid, task);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Since this is just an optimization, we don't try very hard if it</div><div class='ctx'> 	 * turns out not to succeed. We'll requeue it on NFS4ERR_DELAY, and</div><div class='hunk'>@@ -353,6 +400,7 @@ static const struct nfsd4_callback_ops nfsd4_cb_notify_lock_ops = {</div><div class='ctx'> 	.prepare	= nfsd4_cb_notify_lock_prepare,</div><div class='ctx'> 	.done		= nfsd4_cb_notify_lock_done,</div><div class='ctx'> 	.release	= nfsd4_cb_notify_lock_release,</div><div class='add'>+	.opcode		= OP_CB_NOTIFY_LOCK,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -360,11 +408,13 @@ static const struct nfsd4_callback_ops nfsd4_cb_notify_lock_ops = {</div><div class='ctx'>  * st_{access,deny}_bmap field of the stateid, in order to track not</div><div class='ctx'>  * only what share bits are currently in force, but also what</div><div class='ctx'>  * combinations of share bits previous opens have used.  This allows us</div><div class='del'>- * to enforce the recommendation of rfc 3530 14.2.19 that the server</div><div class='del'>- * return an error if the client attempt to downgrade to a combination</div><div class='del'>- * of share bits not explicable by closing some of its previous opens.</div><div class='add'>+ * to enforce the recommendation in</div><div class='add'>+ * https://datatracker.ietf.org/doc/html/rfc7530#section-16.19.4 that</div><div class='add'>+ * the server return an error if the client attempt to downgrade to a</div><div class='add'>+ * combination of share bits not explicable by closing some of its</div><div class='add'>+ * previous opens.</div><div class='ctx'>  *</div><div class='del'>- * XXX: This enforcement is actually incomplete, since we don't keep</div><div class='add'>+ * This enforcement is arguably incomplete, since we don't keep</div><div class='ctx'>  * track of access/deny bit combinations; so, e.g., we allow:</div><div class='ctx'>  *</div><div class='ctx'>  *	OPEN allow read, deny write</div><div class='hunk'>@@ -372,6 +422,10 @@ static const struct nfsd4_callback_ops nfsd4_cb_notify_lock_ops = {</div><div class='ctx'>  *	DOWNGRADE allow read, deny none</div><div class='ctx'>  *</div><div class='ctx'>  * which we should reject.</div><div class='add'>+ *</div><div class='add'>+ * But you could also argue that our current code is already overkill,</div><div class='add'>+ * since it only exists to return NFS4ERR_INVAL on incorrect client</div><div class='add'>+ * behavior.</div><div class='ctx'>  */</div><div class='ctx'> static unsigned int</div><div class='ctx'> bmap_to_share_mode(unsigned long bmap)</div><div class='hunk'>@@ -488,7 +542,7 @@ same_owner_str(struct nfs4_stateowner *sop, struct xdr_netobj *owner)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct nfs4_openowner *</div><div class='del'>-find_openstateowner_str_locked(unsigned int hashval, struct nfsd4_open *open,</div><div class='add'>+find_openstateowner_str(unsigned int hashval, struct nfsd4_open *open,</div><div class='ctx'> 			struct nfs4_client *clp)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_stateowner *so;</div><div class='hunk'>@@ -505,18 +559,6 @@ find_openstateowner_str_locked(unsigned int hashval, struct nfsd4_open *open,</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct nfs4_openowner *</div><div class='del'>-find_openstateowner_str(unsigned int hashval, struct nfsd4_open *open,</div><div class='del'>-			struct nfs4_client *clp)</div><div class='del'>-{</div><div class='del'>-	struct nfs4_openowner *oo;</div><div class='del'>-</div><div class='del'>-	spin_lock(&amp;clp-&gt;cl_lock);</div><div class='del'>-	oo = find_openstateowner_str_locked(hashval, open, clp);</div><div class='del'>-	spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='del'>-	return oo;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static inline u32</div><div class='ctx'> opaque_hashval(const void *ptr, int nbytes)</div><div class='ctx'> {</div><div class='hunk'>@@ -530,45 +572,27 @@ opaque_hashval(const void *ptr, int nbytes)</div><div class='ctx'> 	return x;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void nfsd4_free_file_rcu(struct rcu_head *rcu)</div><div class='del'>-{</div><div class='del'>-	struct nfs4_file *fp = container_of(rcu, struct nfs4_file, fi_rcu);</div><div class='del'>-</div><div class='del'>-	kmem_cache_free(file_slab, fp);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> void</div><div class='ctx'> put_nfs4_file(struct nfs4_file *fi)</div><div class='ctx'> {</div><div class='del'>-	might_lock(&amp;state_lock);</div><div class='del'>-</div><div class='del'>-	if (refcount_dec_and_lock(&amp;fi-&gt;fi_ref, &amp;state_lock)) {</div><div class='del'>-		hlist_del_rcu(&amp;fi-&gt;fi_hash);</div><div class='del'>-		spin_unlock(&amp;state_lock);</div><div class='add'>+	if (refcount_dec_and_test(&amp;fi-&gt;fi_ref)) {</div><div class='add'>+		nfsd4_file_hash_remove(fi);</div><div class='ctx'> 		WARN_ON_ONCE(!list_empty(&amp;fi-&gt;fi_clnt_odstate));</div><div class='ctx'> 		WARN_ON_ONCE(!list_empty(&amp;fi-&gt;fi_delegations));</div><div class='del'>-		call_rcu(&amp;fi-&gt;fi_rcu, nfsd4_free_file_rcu);</div><div class='add'>+		kfree_rcu(fi, fi_rcu);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct nfsd_file *</div><div class='del'>-__nfs4_get_fd(struct nfs4_file *f, int oflag)</div><div class='del'>-{</div><div class='del'>-	if (f-&gt;fi_fds[oflag])</div><div class='del'>-		return nfsd_file_get(f-&gt;fi_fds[oflag]);</div><div class='del'>-	return NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct nfsd_file *</div><div class='ctx'> find_writeable_file_locked(struct nfs4_file *f)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd_file *ret;</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;f-&gt;fi_lock);</div><div class='ctx'> </div><div class='del'>-	ret = __nfs4_get_fd(f, O_WRONLY);</div><div class='add'>+	ret = nfsd_file_get(f-&gt;fi_fds[O_WRONLY]);</div><div class='ctx'> 	if (!ret)</div><div class='del'>-		ret = __nfs4_get_fd(f, O_RDWR);</div><div class='add'>+		ret = nfsd_file_get(f-&gt;fi_fds[O_RDWR]);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -591,9 +615,9 @@ find_readable_file_locked(struct nfs4_file *f)</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;f-&gt;fi_lock);</div><div class='ctx'> </div><div class='del'>-	ret = __nfs4_get_fd(f, O_RDONLY);</div><div class='add'>+	ret = nfsd_file_get(f-&gt;fi_fds[O_RDONLY]);</div><div class='ctx'> 	if (!ret)</div><div class='del'>-		ret = __nfs4_get_fd(f, O_RDWR);</div><div class='add'>+		ret = nfsd_file_get(f-&gt;fi_fds[O_RDWR]);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -617,25 +641,27 @@ find_any_file(struct nfs4_file *f)</div><div class='ctx'> 	if (!f)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	spin_lock(&amp;f-&gt;fi_lock);</div><div class='del'>-	ret = __nfs4_get_fd(f, O_RDWR);</div><div class='add'>+	ret = nfsd_file_get(f-&gt;fi_fds[O_RDWR]);</div><div class='ctx'> 	if (!ret) {</div><div class='del'>-		ret = __nfs4_get_fd(f, O_WRONLY);</div><div class='add'>+		ret = nfsd_file_get(f-&gt;fi_fds[O_WRONLY]);</div><div class='ctx'> 		if (!ret)</div><div class='del'>-			ret = __nfs4_get_fd(f, O_RDONLY);</div><div class='add'>+			ret = nfsd_file_get(f-&gt;fi_fds[O_RDONLY]);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;f-&gt;fi_lock);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct nfsd_file *find_deleg_file(struct nfs4_file *f)</div><div class='add'>+static struct nfsd_file *find_any_file_locked(struct nfs4_file *f)</div><div class='ctx'> {</div><div class='del'>-	struct nfsd_file *ret = NULL;</div><div class='add'>+	lockdep_assert_held(&amp;f-&gt;fi_lock);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;f-&gt;fi_lock);</div><div class='del'>-	if (f-&gt;fi_deleg_file)</div><div class='del'>-		ret = nfsd_file_get(f-&gt;fi_deleg_file);</div><div class='del'>-	spin_unlock(&amp;f-&gt;fi_lock);</div><div class='del'>-	return ret;</div><div class='add'>+	if (f-&gt;fi_fds[O_RDWR])</div><div class='add'>+		return f-&gt;fi_fds[O_RDWR];</div><div class='add'>+	if (f-&gt;fi_fds[O_WRONLY])</div><div class='add'>+		return f-&gt;fi_fds[O_WRONLY];</div><div class='add'>+	if (f-&gt;fi_fds[O_RDONLY])</div><div class='add'>+		return f-&gt;fi_fds[O_RDONLY];</div><div class='add'>+	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static atomic_long_t num_delegations;</div><div class='hunk'>@@ -658,20 +684,72 @@ static unsigned int ownerstr_hashval(struct xdr_netobj *ownername)</div><div class='ctx'> 	return ret &amp; OWNER_HASH_MASK;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* hash table for nfs4_file */</div><div class='del'>-#define FILE_HASH_BITS                   8</div><div class='del'>-#define FILE_HASH_SIZE                  (1 &lt;&lt; FILE_HASH_BITS)</div><div class='add'>+static struct rhltable nfs4_file_rhltable ____cacheline_aligned_in_smp;</div><div class='add'>+</div><div class='add'>+static const struct rhashtable_params nfs4_file_rhash_params = {</div><div class='add'>+	.key_len		= sizeof_field(struct nfs4_file, fi_inode),</div><div class='add'>+	.key_offset		= offsetof(struct nfs4_file, fi_inode),</div><div class='add'>+	.head_offset		= offsetof(struct nfs4_file, fi_rlist),</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Start with a single page hash table to reduce resizing churn</div><div class='add'>+	 * on light workloads.</div><div class='add'>+	 */</div><div class='add'>+	.min_size		= 256,</div><div class='add'>+	.automatic_shrinking	= true,</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-static unsigned int file_hashval(struct svc_fh *fh)</div><div class='add'>+/*</div><div class='add'>+ * Check if courtesy clients have conflicting access and resolve it if possible</div><div class='add'>+ *</div><div class='add'>+ * access:  is op_share_access if share_access is true.</div><div class='add'>+ *	    Check if access mode, op_share_access, would conflict with</div><div class='add'>+ *	    the current deny mode of the file 'fp'.</div><div class='add'>+ * access:  is op_share_deny if share_access is false.</div><div class='add'>+ *	    Check if the deny mode, op_share_deny, would conflict with</div><div class='add'>+ *	    current access of the file 'fp'.</div><div class='add'>+ * stp:     skip checking this entry.</div><div class='add'>+ * new_stp: normal open, not open upgrade.</div><div class='add'>+ *</div><div class='add'>+ * Function returns:</div><div class='add'>+ *	false - access/deny mode conflict with normal client.</div><div class='add'>+ *	true  - no conflict or conflict with courtesy client(s) is resolved.</div><div class='add'>+ */</div><div class='add'>+static bool</div><div class='add'>+nfs4_resolve_deny_conflicts_locked(struct nfs4_file *fp, bool new_stp,</div><div class='add'>+		struct nfs4_ol_stateid *stp, u32 access, bool share_access)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = d_inode(fh-&gt;fh_dentry);</div><div class='add'>+	struct nfs4_ol_stateid *st;</div><div class='add'>+	bool resolvable = true;</div><div class='add'>+	unsigned char bmap;</div><div class='add'>+	struct nfsd_net *nn;</div><div class='add'>+	struct nfs4_client *clp;</div><div class='ctx'> </div><div class='del'>-	/* XXX: why not (here &amp; in file cache) use inode? */</div><div class='del'>-	return (unsigned int)hash_long(inode-&gt;i_ino, FILE_HASH_BITS);</div><div class='add'>+	lockdep_assert_held(&amp;fp-&gt;fi_lock);</div><div class='add'>+	list_for_each_entry(st, &amp;fp-&gt;fi_stateids, st_perfile) {</div><div class='add'>+		/* ignore lock stateid */</div><div class='add'>+		if (st-&gt;st_openstp)</div><div class='add'>+			continue;</div><div class='add'>+		if (st == stp &amp;&amp; new_stp)</div><div class='add'>+			continue;</div><div class='add'>+		/* check file access against deny mode or vice versa */</div><div class='add'>+		bmap = share_access ? st-&gt;st_deny_bmap : st-&gt;st_access_bmap;</div><div class='add'>+		if (!(access &amp; bmap_to_share_mode(bmap)))</div><div class='add'>+			continue;</div><div class='add'>+		clp = st-&gt;st_stid.sc_client;</div><div class='add'>+		if (try_to_expire_client(clp))</div><div class='add'>+			continue;</div><div class='add'>+		resolvable = false;</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+	if (resolvable) {</div><div class='add'>+		clp = stp-&gt;st_stid.sc_client;</div><div class='add'>+		nn = net_generic(clp-&gt;net, nfsd_net_id);</div><div class='add'>+		mod_delayed_work(laundry_wq, &amp;nn-&gt;laundromat_work, 0);</div><div class='add'>+	}</div><div class='add'>+	return resolvable;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct hlist_head file_hashtbl[FILE_HASH_SIZE];</div><div class='del'>-</div><div class='ctx'> static void</div><div class='ctx'> __nfs4_file_get_access(struct nfs4_file *fp, u32 access)</div><div class='ctx'> {</div><div class='hunk'>@@ -856,15 +934,6 @@ struct nfs4_stid *nfs4_alloc_stid(struct nfs4_client *cl, struct kmem_cache *sla</div><div class='ctx'> 	spin_lock_init(&amp;stid-&gt;sc_lock);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;stid-&gt;sc_cp_list);</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * It shouldn't be a problem to reuse an opaque stateid value.</div><div class='del'>-	 * I don't think it is for 4.1.  But with 4.0 I worry that, for</div><div class='del'>-	 * example, a stray write retransmission could be accepted by</div><div class='del'>-	 * the server when it should have been rejected.  Therefore,</div><div class='del'>-	 * adopt a trick from the sctp code to attempt to maximize the</div><div class='del'>-	 * amount of time until an id is reused, by ensuring they always</div><div class='del'>-	 * "increase" (mod INT_MAX):</div><div class='del'>-	 */</div><div class='ctx'> 	return stid;</div><div class='ctx'> out_free:</div><div class='ctx'> 	kmem_cache_free(slab, stid);</div><div class='hunk'>@@ -875,23 +944,23 @@ out_free:</div><div class='ctx'>  * Create a unique stateid_t to represent each COPY.</div><div class='ctx'>  */</div><div class='ctx'> static int nfs4_init_cp_state(struct nfsd_net *nn, copy_stateid_t *stid,</div><div class='del'>-			      unsigned char sc_type)</div><div class='add'>+			      unsigned char cs_type)</div><div class='ctx'> {</div><div class='ctx'> 	int new_id;</div><div class='ctx'> </div><div class='del'>-	stid-&gt;stid.si_opaque.so_clid.cl_boot = (u32)nn-&gt;boot_time;</div><div class='del'>-	stid-&gt;stid.si_opaque.so_clid.cl_id = nn-&gt;s2s_cp_cl_id;</div><div class='del'>-	stid-&gt;sc_type = sc_type;</div><div class='add'>+	stid-&gt;cs_stid.si_opaque.so_clid.cl_boot = (u32)nn-&gt;boot_time;</div><div class='add'>+	stid-&gt;cs_stid.si_opaque.so_clid.cl_id = nn-&gt;s2s_cp_cl_id;</div><div class='ctx'> </div><div class='ctx'> 	idr_preload(GFP_KERNEL);</div><div class='ctx'> 	spin_lock(&amp;nn-&gt;s2s_cp_lock);</div><div class='ctx'> 	new_id = idr_alloc_cyclic(&amp;nn-&gt;s2s_cp_stateids, stid, 0, 0, GFP_NOWAIT);</div><div class='del'>-	stid-&gt;stid.si_opaque.so_id = new_id;</div><div class='del'>-	stid-&gt;stid.si_generation = 1;</div><div class='add'>+	stid-&gt;cs_stid.si_opaque.so_id = new_id;</div><div class='add'>+	stid-&gt;cs_stid.si_generation = 1;</div><div class='ctx'> 	spin_unlock(&amp;nn-&gt;s2s_cp_lock);</div><div class='ctx'> 	idr_preload_end();</div><div class='ctx'> 	if (new_id &lt; 0)</div><div class='ctx'> 		return 0;</div><div class='add'>+	stid-&gt;cs_type = cs_type;</div><div class='ctx'> 	return 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -909,7 +978,7 @@ struct nfs4_cpntf_state *nfs4_alloc_init_cpntf_state(struct nfsd_net *nn,</div><div class='ctx'> 	if (!cps)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	cps-&gt;cpntf_time = ktime_get_boottime_seconds();</div><div class='del'>-	refcount_set(&amp;cps-&gt;cp_stateid.sc_count, 1);</div><div class='add'>+	refcount_set(&amp;cps-&gt;cp_stateid.cs_count, 1);</div><div class='ctx'> 	if (!nfs4_init_cp_state(nn, &amp;cps-&gt;cp_stateid, NFS4_COPYNOTIFY_STID))</div><div class='ctx'> 		goto out_free;</div><div class='ctx'> 	spin_lock(&amp;nn-&gt;s2s_cp_lock);</div><div class='hunk'>@@ -925,11 +994,12 @@ void nfs4_free_copy_state(struct nfsd4_copy *copy)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd_net *nn;</div><div class='ctx'> </div><div class='del'>-	WARN_ON_ONCE(copy-&gt;cp_stateid.sc_type != NFS4_COPY_STID);</div><div class='add'>+	if (copy-&gt;cp_stateid.cs_type != NFS4_COPY_STID)</div><div class='add'>+		return;</div><div class='ctx'> 	nn = net_generic(copy-&gt;cp_clp-&gt;net, nfsd_net_id);</div><div class='ctx'> 	spin_lock(&amp;nn-&gt;s2s_cp_lock);</div><div class='ctx'> 	idr_remove(&amp;nn-&gt;s2s_cp_stateids,</div><div class='del'>-		   copy-&gt;cp_stateid.stid.si_opaque.so_id);</div><div class='add'>+		   copy-&gt;cp_stateid.cs_stid.si_opaque.so_id);</div><div class='ctx'> 	spin_unlock(&amp;nn-&gt;s2s_cp_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -959,8 +1029,20 @@ static struct nfs4_ol_stateid * nfs4_alloc_open_stateid(struct nfs4_client *clp)</div><div class='ctx'> 	return openlockstateid(stid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * As the sc_free callback of deleg, this may be called by nfs4_put_stid</div><div class='add'>+ * in nfsd_break_one_deleg.</div><div class='add'>+ * Considering nfsd_break_one_deleg is called with the flc-&gt;flc_lock held,</div><div class='add'>+ * this function mustn't ever sleep.</div><div class='add'>+ */</div><div class='ctx'> static void nfs4_free_deleg(struct nfs4_stid *stid)</div><div class='ctx'> {</div><div class='add'>+	struct nfs4_delegation *dp = delegstateid(stid);</div><div class='add'>+</div><div class='add'>+	WARN_ON_ONCE(!list_empty(&amp;stid-&gt;sc_cp_list));</div><div class='add'>+	WARN_ON_ONCE(!list_empty(&amp;dp-&gt;dl_perfile));</div><div class='add'>+	WARN_ON_ONCE(!list_empty(&amp;dp-&gt;dl_perclnt));</div><div class='add'>+	WARN_ON_ONCE(!list_empty(&amp;dp-&gt;dl_recall_lru));</div><div class='ctx'> 	kmem_cache_free(deleg_slab, stid);</div><div class='ctx'> 	atomic_long_dec(&amp;num_delegations);</div><div class='ctx'> }</div><div class='hunk'>@@ -974,7 +1056,8 @@ static void nfs4_free_deleg(struct nfs4_stid *stid)</div><div class='ctx'>  * When a delegation is recalled, the filehandle is stored in the "new"</div><div class='ctx'>  * filter.</div><div class='ctx'>  * Every 30 seconds we swap the filters and clear the "new" one,</div><div class='del'>- * unless both are empty of course.</div><div class='add'>+ * unless both are empty of course.  This results in delegations for a</div><div class='add'>+ * given filehandle being blocked for between 30 and 60 seconds.</div><div class='ctx'>  *</div><div class='ctx'>  * Each filter is 256 bits.  We hash the filehandle to 32bit and use the</div><div class='ctx'>  * low 3 bytes as hash-table indices.</div><div class='hunk'>@@ -1003,9 +1086,9 @@ static int delegation_blocked(struct knfsd_fh *fh)</div><div class='ctx'> 		if (ktime_get_seconds() - bd-&gt;swap_time &gt; 30) {</div><div class='ctx'> 			bd-&gt;entries -= bd-&gt;old_entries;</div><div class='ctx'> 			bd-&gt;old_entries = bd-&gt;entries;</div><div class='add'>+			bd-&gt;new = 1-bd-&gt;new;</div><div class='ctx'> 			memset(bd-&gt;set[bd-&gt;new], 0,</div><div class='ctx'> 			       sizeof(bd-&gt;set[0]));</div><div class='del'>-			bd-&gt;new = 1-bd-&gt;new;</div><div class='ctx'> 			bd-&gt;swap_time = ktime_get_seconds();</div><div class='ctx'> 		}</div><div class='ctx'> 		spin_unlock(&amp;blocked_delegations_lock);</div><div class='hunk'>@@ -1043,21 +1126,22 @@ static void block_delegations(struct knfsd_fh *fh)</div><div class='ctx'> </div><div class='ctx'> static struct nfs4_delegation *</div><div class='ctx'> alloc_init_deleg(struct nfs4_client *clp, struct nfs4_file *fp,</div><div class='del'>-		 struct svc_fh *current_fh,</div><div class='del'>-		 struct nfs4_clnt_odstate *odstate)</div><div class='add'>+		 struct nfs4_clnt_odstate *odstate, u32 dl_type)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_delegation *dp;</div><div class='add'>+	struct nfs4_stid *stid;</div><div class='ctx'> 	long n;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("NFSD alloc_init_deleg\n");</div><div class='ctx'> 	n = atomic_long_inc_return(&amp;num_delegations);</div><div class='ctx'> 	if (n &lt; 0 || n &gt; max_delegations)</div><div class='ctx'> 		goto out_dec;</div><div class='del'>-	if (delegation_blocked(&amp;current_fh-&gt;fh_handle))</div><div class='add'>+	if (delegation_blocked(&amp;fp-&gt;fi_fhandle))</div><div class='ctx'> 		goto out_dec;</div><div class='del'>-	dp = delegstateid(nfs4_alloc_stid(clp, deleg_slab, nfs4_free_deleg));</div><div class='del'>-	if (dp == NULL)</div><div class='add'>+	stid = nfs4_alloc_stid(clp, deleg_slab, nfs4_free_deleg);</div><div class='add'>+	if (stid == NULL)</div><div class='ctx'> 		goto out_dec;</div><div class='add'>+	dp = delegstateid(stid);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * delegation seqid's are never incremented.  The 4.1 special</div><div class='hunk'>@@ -1070,10 +1154,14 @@ alloc_init_deleg(struct nfs4_client *clp, struct nfs4_file *fp,</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;dp-&gt;dl_recall_lru);</div><div class='ctx'> 	dp-&gt;dl_clnt_odstate = odstate;</div><div class='ctx'> 	get_clnt_odstate(odstate);</div><div class='del'>-	dp-&gt;dl_type = NFS4_OPEN_DELEGATE_READ;</div><div class='add'>+	dp-&gt;dl_type = dl_type;</div><div class='ctx'> 	dp-&gt;dl_retries = 1;</div><div class='add'>+	dp-&gt;dl_recalled = false;</div><div class='ctx'> 	nfsd4_init_cb(&amp;dp-&gt;dl_recall, dp-&gt;dl_stid.sc_client,</div><div class='ctx'> 		      &amp;nfsd4_cb_recall_ops, NFSPROC4_CLNT_CB_RECALL);</div><div class='add'>+	nfsd4_init_cb(&amp;dp-&gt;dl_cb_fattr.ncf_getattr, dp-&gt;dl_stid.sc_client,</div><div class='add'>+			&amp;nfsd4_cb_getattr_ops, NFSPROC4_CLNT_CB_GETATTR);</div><div class='add'>+	dp-&gt;dl_cb_fattr.ncf_file_modified = false;</div><div class='ctx'> 	get_nfs4_file(fp);</div><div class='ctx'> 	dp-&gt;dl_stid.sc_file = fp;</div><div class='ctx'> 	return dp;</div><div class='hunk'>@@ -1095,6 +1183,8 @@ nfs4_put_stid(struct nfs4_stid *s)</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> 	idr_remove(&amp;clp-&gt;cl_stateids, s-&gt;sc_stateid.si_opaque.so_id);</div><div class='add'>+	if (s-&gt;sc_status &amp; SC_STATUS_ADMIN_REVOKED)</div><div class='add'>+		atomic_dec(&amp;s-&gt;sc_client-&gt;cl_admin_revoked);</div><div class='ctx'> 	nfs4_free_cpntf_statelist(clp-&gt;net, s);</div><div class='ctx'> 	spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='ctx'> 	s-&gt;sc_free(s);</div><div class='hunk'>@@ -1116,15 +1206,56 @@ nfs4_inc_and_copy_stateid(stateid_t *dst, struct nfs4_stid *stid)</div><div class='ctx'> </div><div class='ctx'> static void put_deleg_file(struct nfs4_file *fp)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd_file *rnf = NULL;</div><div class='ctx'> 	struct nfsd_file *nf = NULL;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;fp-&gt;fi_lock);</div><div class='del'>-	if (--fp-&gt;fi_delegees == 0)</div><div class='add'>+	if (--fp-&gt;fi_delegees == 0) {</div><div class='ctx'> 		swap(nf, fp-&gt;fi_deleg_file);</div><div class='add'>+		swap(rnf, fp-&gt;fi_rdeleg_file);</div><div class='add'>+	}</div><div class='ctx'> 	spin_unlock(&amp;fp-&gt;fi_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (nf)</div><div class='ctx'> 		nfsd_file_put(nf);</div><div class='add'>+	if (rnf)</div><div class='add'>+		nfs4_file_put_access(fp, NFS4_SHARE_ACCESS_READ);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfsd4_finalize_deleg_timestamps(struct nfs4_delegation *dp, struct file *f)</div><div class='add'>+{</div><div class='add'>+	struct iattr ia = { .ia_valid = ATTR_ATIME | ATTR_CTIME | ATTR_MTIME };</div><div class='add'>+	struct inode *inode = file_inode(f);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	/* don't do anything if FMODE_NOCMTIME isn't set */</div><div class='add'>+	if ((READ_ONCE(f-&gt;f_mode) &amp; FMODE_NOCMTIME) == 0)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;f-&gt;f_lock);</div><div class='add'>+	f-&gt;f_mode &amp;= ~FMODE_NOCMTIME;</div><div class='add'>+	spin_unlock(&amp;f-&gt;f_lock);</div><div class='add'>+</div><div class='add'>+	/* was it never written? */</div><div class='add'>+	if (!dp-&gt;dl_written)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/* did it get a setattr for the timestamps at some point? */</div><div class='add'>+	if (dp-&gt;dl_setattr)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/* Stamp everything to "now" */</div><div class='add'>+	inode_lock(inode);</div><div class='add'>+	ret = notify_change(&amp;nop_mnt_idmap, f-&gt;f_path.dentry, &amp;ia, NULL);</div><div class='add'>+	inode_unlock(inode);</div><div class='add'>+	if (ret) {</div><div class='add'>+		struct inode *inode = file_inode(f);</div><div class='add'>+</div><div class='add'>+		pr_notice_ratelimited("Unable to update timestamps on inode %02x:%02x:%lu: %d\n",</div><div class='add'>+					MAJOR(inode-&gt;i_sb-&gt;s_dev),</div><div class='add'>+					MINOR(inode-&gt;i_sb-&gt;s_dev),</div><div class='add'>+					inode-&gt;i_ino, ret);</div><div class='add'>+	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void nfs4_unlock_deleg_lease(struct nfs4_delegation *dp)</div><div class='hunk'>@@ -1134,7 +1265,8 @@ static void nfs4_unlock_deleg_lease(struct nfs4_delegation *dp)</div><div class='ctx'> </div><div class='ctx'> 	WARN_ON_ONCE(!fp-&gt;fi_delegees);</div><div class='ctx'> </div><div class='del'>-	vfs_setlease(nf-&gt;nf_file, F_UNLCK, NULL, (void **)&amp;dp);</div><div class='add'>+	nfsd4_finalize_deleg_timestamps(dp, nf-&gt;nf_file);</div><div class='add'>+	kernel_setlease(nf-&gt;nf_file, F_UNLCK, NULL, (void **)&amp;dp);</div><div class='ctx'> 	put_deleg_file(fp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1145,11 +1277,6 @@ static void destroy_unhashed_deleg(struct nfs4_delegation *dp)</div><div class='ctx'> 	nfs4_put_stid(&amp;dp-&gt;dl_stid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void nfs4_unhash_stid(struct nfs4_stid *s)</div><div class='del'>-{</div><div class='del'>-	s-&gt;sc_type = 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> /**</div><div class='ctx'>  * nfs4_delegation_exists - Discover if this delegation already exists</div><div class='ctx'>  * @clp:     a pointer to the nfs4_client we're granting a delegation to</div><div class='hunk'>@@ -1197,27 +1324,39 @@ hash_delegation_locked(struct nfs4_delegation *dp, struct nfs4_file *fp)</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;state_lock);</div><div class='ctx'> 	lockdep_assert_held(&amp;fp-&gt;fi_lock);</div><div class='add'>+	lockdep_assert_held(&amp;clp-&gt;cl_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (nfs4_delegation_exists(clp, fp))</div><div class='ctx'> 		return -EAGAIN;</div><div class='ctx'> 	refcount_inc(&amp;dp-&gt;dl_stid.sc_count);</div><div class='del'>-	dp-&gt;dl_stid.sc_type = NFS4_DELEG_STID;</div><div class='add'>+	dp-&gt;dl_stid.sc_type = SC_TYPE_DELEG;</div><div class='ctx'> 	list_add(&amp;dp-&gt;dl_perfile, &amp;fp-&gt;fi_delegations);</div><div class='ctx'> 	list_add(&amp;dp-&gt;dl_perclnt, &amp;clp-&gt;cl_delegations);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool delegation_hashed(struct nfs4_delegation *dp)</div><div class='add'>+{</div><div class='add'>+	return !(list_empty(&amp;dp-&gt;dl_perfile));</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static bool</div><div class='del'>-unhash_delegation_locked(struct nfs4_delegation *dp)</div><div class='add'>+unhash_delegation_locked(struct nfs4_delegation *dp, unsigned short statusmask)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_file *fp = dp-&gt;dl_stid.sc_file;</div><div class='ctx'> </div><div class='ctx'> 	lockdep_assert_held(&amp;state_lock);</div><div class='ctx'> </div><div class='del'>-	if (list_empty(&amp;dp-&gt;dl_perfile))</div><div class='add'>+	if (!delegation_hashed(dp))</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	dp-&gt;dl_stid.sc_type = NFS4_CLOSED_DELEG_STID;</div><div class='add'>+	if (statusmask == SC_STATUS_REVOKED &amp;&amp;</div><div class='add'>+	    dp-&gt;dl_stid.sc_client-&gt;cl_minorversion == 0)</div><div class='add'>+		statusmask = SC_STATUS_CLOSED;</div><div class='add'>+	dp-&gt;dl_stid.sc_status |= statusmask;</div><div class='add'>+	if (statusmask &amp; SC_STATUS_ADMIN_REVOKED)</div><div class='add'>+		atomic_inc(&amp;dp-&gt;dl_stid.sc_client-&gt;cl_admin_revoked);</div><div class='add'>+</div><div class='ctx'> 	/* Ensure that deleg break won't try to requeue it */</div><div class='ctx'> 	++dp-&gt;dl_time;</div><div class='ctx'> 	spin_lock(&amp;fp-&gt;fi_lock);</div><div class='hunk'>@@ -1233,30 +1372,59 @@ static void destroy_delegation(struct nfs4_delegation *dp)</div><div class='ctx'> 	bool unhashed;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;state_lock);</div><div class='del'>-	unhashed = unhash_delegation_locked(dp);</div><div class='add'>+	unhashed = unhash_delegation_locked(dp, SC_STATUS_CLOSED);</div><div class='ctx'> 	spin_unlock(&amp;state_lock);</div><div class='ctx'> 	if (unhashed)</div><div class='ctx'> 		destroy_unhashed_deleg(dp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * revoke_delegation - perform nfs4 delegation structure cleanup</div><div class='add'>+ * @dp: pointer to the delegation</div><div class='add'>+ *</div><div class='add'>+ * This function assumes that it's called either from the administrative</div><div class='add'>+ * interface (nfsd4_revoke_states()) that's revoking a specific delegation</div><div class='add'>+ * stateid or it's called from a laundromat thread (nfsd4_landromat()) that</div><div class='add'>+ * determined that this specific state has expired and needs to be revoked</div><div class='add'>+ * (both mark state with the appropriate stid sc_status mode). It is also</div><div class='add'>+ * assumed that a reference was taken on the @dp state.</div><div class='add'>+ *</div><div class='add'>+ * If this function finds that the @dp state is SC_STATUS_FREED it means</div><div class='add'>+ * that a FREE_STATEID operation for this stateid has been processed and</div><div class='add'>+ * we can proceed to removing it from recalled list. However, if @dp state</div><div class='add'>+ * isn't marked SC_STATUS_FREED, it means we need place it on the cl_revoked</div><div class='add'>+ * list and wait for the FREE_STATEID to arrive from the client. At the same</div><div class='add'>+ * time, we need to mark it as SC_STATUS_FREEABLE to indicate to the</div><div class='add'>+ * nfsd4_free_stateid() function that this stateid has already been added</div><div class='add'>+ * to the cl_revoked list and that nfsd4_free_stateid() is now responsible</div><div class='add'>+ * for removing it from the list. Inspection of where the delegation state</div><div class='add'>+ * in the revocation process is protected by the clp-&gt;cl_lock.</div><div class='add'>+ */</div><div class='ctx'> static void revoke_delegation(struct nfs4_delegation *dp)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_client *clp = dp-&gt;dl_stid.sc_client;</div><div class='ctx'> </div><div class='ctx'> 	WARN_ON(!list_empty(&amp;dp-&gt;dl_recall_lru));</div><div class='add'>+	WARN_ON_ONCE(dp-&gt;dl_stid.sc_client-&gt;cl_minorversion &gt; 0 &amp;&amp;</div><div class='add'>+		     !(dp-&gt;dl_stid.sc_status &amp;</div><div class='add'>+		     (SC_STATUS_REVOKED | SC_STATUS_ADMIN_REVOKED)));</div><div class='ctx'> </div><div class='del'>-	if (clp-&gt;cl_minorversion) {</div><div class='del'>-		dp-&gt;dl_stid.sc_type = NFS4_REVOKED_DELEG_STID;</div><div class='del'>-		refcount_inc(&amp;dp-&gt;dl_stid.sc_count);</div><div class='del'>-		spin_lock(&amp;clp-&gt;cl_lock);</div><div class='del'>-		list_add(&amp;dp-&gt;dl_recall_lru, &amp;clp-&gt;cl_revoked);</div><div class='del'>-		spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='add'>+	trace_nfsd_stid_revoke(&amp;dp-&gt;dl_stid);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;clp-&gt;cl_lock);</div><div class='add'>+	if (dp-&gt;dl_stid.sc_status &amp; SC_STATUS_FREED) {</div><div class='add'>+		list_del_init(&amp;dp-&gt;dl_recall_lru);</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='add'>+	list_add(&amp;dp-&gt;dl_recall_lru, &amp;clp-&gt;cl_revoked);</div><div class='add'>+	dp-&gt;dl_stid.sc_status |= SC_STATUS_FREEABLE;</div><div class='add'>+out:</div><div class='add'>+	spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='ctx'> 	destroy_unhashed_deleg(dp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* </div><div class='del'>- * SETCLIENTID state </div><div class='add'>+/*</div><div class='add'>+ * SETCLIENTID state</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='ctx'> static unsigned int clientid_hashval(u32 id)</div><div class='hunk'>@@ -1277,11 +1445,16 @@ static void</div><div class='ctx'> recalculate_deny_mode(struct nfs4_file *fp)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_ol_stateid *stp;</div><div class='add'>+	u32 old_deny;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;fp-&gt;fi_lock);</div><div class='add'>+	old_deny = fp-&gt;fi_share_deny;</div><div class='ctx'> 	fp-&gt;fi_share_deny = 0;</div><div class='del'>-	list_for_each_entry(stp, &amp;fp-&gt;fi_stateids, st_perfile)</div><div class='add'>+	list_for_each_entry(stp, &amp;fp-&gt;fi_stateids, st_perfile) {</div><div class='ctx'> 		fp-&gt;fi_share_deny |= bmap_to_share_mode(stp-&gt;st_deny_bmap);</div><div class='add'>+		if (fp-&gt;fi_share_deny == old_deny)</div><div class='add'>+			break;</div><div class='add'>+	}</div><div class='ctx'> 	spin_unlock(&amp;fp-&gt;fi_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1369,6 +1542,8 @@ static void nfs4_free_ol_stateid(struct nfs4_stid *stid)</div><div class='ctx'> 	release_all_access(stp);</div><div class='ctx'> 	if (stp-&gt;st_stateowner)</div><div class='ctx'> 		nfs4_put_stateowner(stp-&gt;st_stateowner);</div><div class='add'>+	if (!list_empty(&amp;stid-&gt;sc_cp_list))</div><div class='add'>+		nfs4_free_cpntf_statelist(stid-&gt;sc_client-&gt;net, stid);</div><div class='ctx'> 	kmem_cache_free(stateid_slab, stid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1408,6 +1583,8 @@ static void put_ol_stateid_locked(struct nfs4_ol_stateid *stp,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	idr_remove(&amp;clp-&gt;cl_stateids, s-&gt;sc_stateid.si_opaque.so_id);</div><div class='add'>+	if (s-&gt;sc_status &amp; SC_STATUS_ADMIN_REVOKED)</div><div class='add'>+		atomic_dec(&amp;s-&gt;sc_client-&gt;cl_admin_revoked);</div><div class='ctx'> 	list_add(&amp;stp-&gt;st_locks, reaplist);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1418,7 +1595,7 @@ static bool unhash_lock_stateid(struct nfs4_ol_stateid *stp)</div><div class='ctx'> 	if (!unhash_ol_stateid(stp))</div><div class='ctx'> 		return false;</div><div class='ctx'> 	list_del_init(&amp;stp-&gt;st_locks);</div><div class='del'>-	nfs4_unhash_stid(&amp;stp-&gt;st_stid);</div><div class='add'>+	stp-&gt;st_stid.sc_status |= SC_STATUS_CLOSED;</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1476,7 +1653,7 @@ static void release_open_stateid_locks(struct nfs4_ol_stateid *open_stp,</div><div class='ctx'> 	while (!list_empty(&amp;open_stp-&gt;st_locks)) {</div><div class='ctx'> 		stp = list_entry(open_stp-&gt;st_locks.next,</div><div class='ctx'> 				struct nfs4_ol_stateid, st_locks);</div><div class='del'>-		WARN_ON(!unhash_lock_stateid(stp));</div><div class='add'>+		unhash_lock_stateid(stp);</div><div class='ctx'> 		put_ol_stateid_locked(stp, reaplist);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -1497,12 +1674,21 @@ static void release_open_stateid(struct nfs4_ol_stateid *stp)</div><div class='ctx'> 	LIST_HEAD(reaplist);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;stp-&gt;st_stid.sc_client-&gt;cl_lock);</div><div class='add'>+	stp-&gt;st_stid.sc_status |= SC_STATUS_CLOSED;</div><div class='ctx'> 	if (unhash_open_stateid(stp, &amp;reaplist))</div><div class='ctx'> 		put_ol_stateid_locked(stp, &amp;reaplist);</div><div class='ctx'> 	spin_unlock(&amp;stp-&gt;st_stid.sc_client-&gt;cl_lock);</div><div class='ctx'> 	free_ol_stateid_reaplist(&amp;reaplist);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool nfs4_openowner_unhashed(struct nfs4_openowner *oo)</div><div class='add'>+{</div><div class='add'>+	lockdep_assert_held(&amp;oo-&gt;oo_owner.so_client-&gt;cl_lock);</div><div class='add'>+</div><div class='add'>+	return list_empty(&amp;oo-&gt;oo_owner.so_strhash) &amp;&amp;</div><div class='add'>+		list_empty(&amp;oo-&gt;oo_perclient);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void unhash_openowner_locked(struct nfs4_openowner *oo)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_client *clp = oo-&gt;oo_owner.so_client;</div><div class='hunk'>@@ -1534,9 +1720,7 @@ static void release_openowner(struct nfs4_openowner *oo)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_ol_stateid *stp;</div><div class='ctx'> 	struct nfs4_client *clp = oo-&gt;oo_owner.so_client;</div><div class='del'>-	struct list_head reaplist;</div><div class='del'>-</div><div class='del'>-	INIT_LIST_HEAD(&amp;reaplist);</div><div class='add'>+	LIST_HEAD(reaplist);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;clp-&gt;cl_lock);</div><div class='ctx'> 	unhash_openowner_locked(oo);</div><div class='hunk'>@@ -1552,6 +1736,137 @@ static void release_openowner(struct nfs4_openowner *oo)</div><div class='ctx'> 	nfs4_put_stateowner(&amp;oo-&gt;oo_owner);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static struct nfs4_stid *find_one_sb_stid(struct nfs4_client *clp,</div><div class='add'>+					  struct super_block *sb,</div><div class='add'>+					  unsigned int sc_types)</div><div class='add'>+{</div><div class='add'>+	unsigned long id, tmp;</div><div class='add'>+	struct nfs4_stid *stid;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;clp-&gt;cl_lock);</div><div class='add'>+	idr_for_each_entry_ul(&amp;clp-&gt;cl_stateids, stid, tmp, id)</div><div class='add'>+		if ((stid-&gt;sc_type &amp; sc_types) &amp;&amp;</div><div class='add'>+		    stid-&gt;sc_status == 0 &amp;&amp;</div><div class='add'>+		    stid-&gt;sc_file-&gt;fi_inode-&gt;i_sb == sb) {</div><div class='add'>+			refcount_inc(&amp;stid-&gt;sc_count);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+	spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='add'>+	return stid;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * nfsd4_revoke_states - revoke all nfsv4 states associated with given filesystem</div><div class='add'>+ * @net:  used to identify instance of nfsd (there is one per net namespace)</div><div class='add'>+ * @sb:   super_block used to identify target filesystem</div><div class='add'>+ *</div><div class='add'>+ * All nfs4 states (open, lock, delegation, layout) held by the server instance</div><div class='add'>+ * and associated with a file on the given filesystem will be revoked resulting</div><div class='add'>+ * in any files being closed and so all references from nfsd to the filesystem</div><div class='add'>+ * being released.  Thus nfsd will no longer prevent the filesystem from being</div><div class='add'>+ * unmounted.</div><div class='add'>+ *</div><div class='add'>+ * The clients which own the states will subsequently being notified that the</div><div class='add'>+ * states have been "admin-revoked".</div><div class='add'>+ */</div><div class='add'>+void nfsd4_revoke_states(struct net *net, struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='add'>+	unsigned int idhashval;</div><div class='add'>+	unsigned int sc_types;</div><div class='add'>+</div><div class='add'>+	sc_types = SC_TYPE_OPEN | SC_TYPE_LOCK | SC_TYPE_DELEG | SC_TYPE_LAYOUT;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;nn-&gt;client_lock);</div><div class='add'>+	for (idhashval = 0; idhashval &lt; CLIENT_HASH_MASK; idhashval++) {</div><div class='add'>+		struct list_head *head = &amp;nn-&gt;conf_id_hashtbl[idhashval];</div><div class='add'>+		struct nfs4_client *clp;</div><div class='add'>+	retry:</div><div class='add'>+		list_for_each_entry(clp, head, cl_idhash) {</div><div class='add'>+			struct nfs4_stid *stid = find_one_sb_stid(clp, sb,</div><div class='add'>+								  sc_types);</div><div class='add'>+			if (stid) {</div><div class='add'>+				struct nfs4_ol_stateid *stp;</div><div class='add'>+				struct nfs4_delegation *dp;</div><div class='add'>+				struct nfs4_layout_stateid *ls;</div><div class='add'>+</div><div class='add'>+				spin_unlock(&amp;nn-&gt;client_lock);</div><div class='add'>+				switch (stid-&gt;sc_type) {</div><div class='add'>+				case SC_TYPE_OPEN:</div><div class='add'>+					stp = openlockstateid(stid);</div><div class='add'>+					mutex_lock_nested(&amp;stp-&gt;st_mutex,</div><div class='add'>+							  OPEN_STATEID_MUTEX);</div><div class='add'>+</div><div class='add'>+					spin_lock(&amp;clp-&gt;cl_lock);</div><div class='add'>+					if (stid-&gt;sc_status == 0) {</div><div class='add'>+						stid-&gt;sc_status |=</div><div class='add'>+							SC_STATUS_ADMIN_REVOKED;</div><div class='add'>+						atomic_inc(&amp;clp-&gt;cl_admin_revoked);</div><div class='add'>+						spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='add'>+						release_all_access(stp);</div><div class='add'>+					} else</div><div class='add'>+						spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='add'>+					mutex_unlock(&amp;stp-&gt;st_mutex);</div><div class='add'>+					break;</div><div class='add'>+				case SC_TYPE_LOCK:</div><div class='add'>+					stp = openlockstateid(stid);</div><div class='add'>+					mutex_lock_nested(&amp;stp-&gt;st_mutex,</div><div class='add'>+							  LOCK_STATEID_MUTEX);</div><div class='add'>+					spin_lock(&amp;clp-&gt;cl_lock);</div><div class='add'>+					if (stid-&gt;sc_status == 0) {</div><div class='add'>+						struct nfs4_lockowner *lo =</div><div class='add'>+							lockowner(stp-&gt;st_stateowner);</div><div class='add'>+						struct nfsd_file *nf;</div><div class='add'>+</div><div class='add'>+						stid-&gt;sc_status |=</div><div class='add'>+							SC_STATUS_ADMIN_REVOKED;</div><div class='add'>+						atomic_inc(&amp;clp-&gt;cl_admin_revoked);</div><div class='add'>+						spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='add'>+						nf = find_any_file(stp-&gt;st_stid.sc_file);</div><div class='add'>+						if (nf) {</div><div class='add'>+							get_file(nf-&gt;nf_file);</div><div class='add'>+							filp_close(nf-&gt;nf_file,</div><div class='add'>+								   (fl_owner_t)lo);</div><div class='add'>+							nfsd_file_put(nf);</div><div class='add'>+						}</div><div class='add'>+						release_all_access(stp);</div><div class='add'>+					} else</div><div class='add'>+						spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='add'>+					mutex_unlock(&amp;stp-&gt;st_mutex);</div><div class='add'>+					break;</div><div class='add'>+				case SC_TYPE_DELEG:</div><div class='add'>+					refcount_inc(&amp;stid-&gt;sc_count);</div><div class='add'>+					dp = delegstateid(stid);</div><div class='add'>+					spin_lock(&amp;state_lock);</div><div class='add'>+					if (!unhash_delegation_locked(</div><div class='add'>+						    dp, SC_STATUS_ADMIN_REVOKED))</div><div class='add'>+						dp = NULL;</div><div class='add'>+					spin_unlock(&amp;state_lock);</div><div class='add'>+					if (dp)</div><div class='add'>+						revoke_delegation(dp);</div><div class='add'>+					break;</div><div class='add'>+				case SC_TYPE_LAYOUT:</div><div class='add'>+					ls = layoutstateid(stid);</div><div class='add'>+					nfsd4_close_layout(ls);</div><div class='add'>+					break;</div><div class='add'>+				}</div><div class='add'>+				nfs4_put_stid(stid);</div><div class='add'>+				spin_lock(&amp;nn-&gt;client_lock);</div><div class='add'>+				if (clp-&gt;cl_minorversion == 0)</div><div class='add'>+					/* Allow cleanup after a lease period.</div><div class='add'>+					 * store_release ensures cleanup will</div><div class='add'>+					 * see any newly revoked states if it</div><div class='add'>+					 * sees the time updated.</div><div class='add'>+					 */</div><div class='add'>+					nn-&gt;nfs40_last_revoke =</div><div class='add'>+						ktime_get_boottime_seconds();</div><div class='add'>+				goto retry;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;nn-&gt;client_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline int</div><div class='ctx'> hash_sessionid(struct nfs4_sessionid *sessionid)</div><div class='ctx'> {</div><div class='hunk'>@@ -1623,114 +1938,145 @@ gen_sessionid(struct nfsd4_session *ses)</div><div class='ctx'>  */</div><div class='ctx'> #define NFSD_MIN_HDR_SEQ_SZ  (24 + 12 + 44)</div><div class='ctx'> </div><div class='add'>+static struct shrinker *nfsd_slot_shrinker;</div><div class='add'>+static DEFINE_SPINLOCK(nfsd_session_list_lock);</div><div class='add'>+static LIST_HEAD(nfsd_session_list);</div><div class='add'>+/* The sum of "target_slots-1" on every session.  The shrinker can push this</div><div class='add'>+ * down, though it can take a little while for the memory to actually</div><div class='add'>+ * be freed.  The "-1" is because we can never free slot 0 while the</div><div class='add'>+ * session is active.</div><div class='add'>+ */</div><div class='add'>+static atomic_t nfsd_total_target_slots = ATOMIC_INIT(0);</div><div class='add'>+</div><div class='ctx'> static void</div><div class='del'>-free_session_slots(struct nfsd4_session *ses)</div><div class='add'>+free_session_slots(struct nfsd4_session *ses, int from)</div><div class='ctx'> {</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; ses-&gt;se_fchannel.maxreqs; i++) {</div><div class='del'>-		free_svc_cred(&amp;ses-&gt;se_slots[i]-&gt;sl_cred);</div><div class='del'>-		kfree(ses-&gt;se_slots[i]);</div><div class='add'>+	if (from &gt;= ses-&gt;se_fchannel.maxreqs)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	for (i = from; i &lt; ses-&gt;se_fchannel.maxreqs; i++) {</div><div class='add'>+		struct nfsd4_slot *slot = xa_load(&amp;ses-&gt;se_slots, i);</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Save the seqid in case we reactivate this slot.</div><div class='add'>+		 * This will never require a memory allocation so GFP</div><div class='add'>+		 * flag is irrelevant</div><div class='add'>+		 */</div><div class='add'>+		xa_store(&amp;ses-&gt;se_slots, i, xa_mk_value(slot-&gt;sl_seqid), 0);</div><div class='add'>+		free_svc_cred(&amp;slot-&gt;sl_cred);</div><div class='add'>+		kfree(slot);</div><div class='add'>+	}</div><div class='add'>+	ses-&gt;se_fchannel.maxreqs = from;</div><div class='add'>+	if (ses-&gt;se_target_maxslots &gt; from) {</div><div class='add'>+		int new_target = from ?: 1;</div><div class='add'>+		atomic_sub(ses-&gt;se_target_maxslots - new_target, &amp;nfsd_total_target_slots);</div><div class='add'>+		ses-&gt;se_target_maxslots = new_target;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * We don't actually need to cache the rpc and session headers, so we</div><div class='del'>- * can allocate a little less for each slot:</div><div class='add'>+/**</div><div class='add'>+ * reduce_session_slots - reduce the target max-slots of a session if possible</div><div class='add'>+ * @ses:  The session to affect</div><div class='add'>+ * @dec:  how much to decrease the target by</div><div class='add'>+ *</div><div class='add'>+ * This interface can be used by a shrinker to reduce the target max-slots</div><div class='add'>+ * for a session so that some slots can eventually be freed.</div><div class='add'>+ * It uses spin_trylock() as it may be called in a context where another</div><div class='add'>+ * spinlock is held that has a dependency on client_lock.  As shrinkers are</div><div class='add'>+ * best-effort, skiping a session is client_lock is already held has no</div><div class='add'>+ * great coast</div><div class='add'>+ *</div><div class='add'>+ * Return value:</div><div class='add'>+ *   The number of slots that the target was reduced by.</div><div class='ctx'>  */</div><div class='del'>-static inline u32 slot_bytes(struct nfsd4_channel_attrs *ca)</div><div class='add'>+static int</div><div class='add'>+reduce_session_slots(struct nfsd4_session *ses, int dec)</div><div class='ctx'> {</div><div class='del'>-	u32 size;</div><div class='add'>+	struct nfsd_net *nn = net_generic(ses-&gt;se_client-&gt;net,</div><div class='add'>+					  nfsd_net_id);</div><div class='add'>+	int ret = 0;</div><div class='ctx'> </div><div class='del'>-	if (ca-&gt;maxresp_cached &lt; NFSD_MIN_HDR_SEQ_SZ)</div><div class='del'>-		size = 0;</div><div class='del'>-	else</div><div class='del'>-		size = ca-&gt;maxresp_cached - NFSD_MIN_HDR_SEQ_SZ;</div><div class='del'>-	return size + sizeof(struct nfsd4_slot);</div><div class='add'>+	if (ses-&gt;se_target_maxslots &lt;= 1)</div><div class='add'>+		return ret;</div><div class='add'>+	if (!spin_trylock(&amp;nn-&gt;client_lock))</div><div class='add'>+		return ret;</div><div class='add'>+	ret = min(dec, ses-&gt;se_target_maxslots-1);</div><div class='add'>+	ses-&gt;se_target_maxslots -= ret;</div><div class='add'>+	atomic_sub(ret, &amp;nfsd_total_target_slots);</div><div class='add'>+	ses-&gt;se_slot_gen += 1;</div><div class='add'>+	if (ses-&gt;se_slot_gen == 0) {</div><div class='add'>+		int i;</div><div class='add'>+		ses-&gt;se_slot_gen = 1;</div><div class='add'>+		for (i = 0; i &lt; ses-&gt;se_fchannel.maxreqs; i++) {</div><div class='add'>+			struct nfsd4_slot *slot = xa_load(&amp;ses-&gt;se_slots, i);</div><div class='add'>+			slot-&gt;sl_generation = 0;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;nn-&gt;client_lock);</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * XXX: If we run out of reserved DRC memory we could (up to a point)</div><div class='del'>- * re-negotiate active sessions and reduce their slot usage to make</div><div class='del'>- * room for new connections. For now we just fail the create session.</div><div class='del'>- */</div><div class='del'>-static u32 nfsd4_get_drc_mem(struct nfsd4_channel_attrs *ca, struct nfsd_net *nn)</div><div class='add'>+static struct nfsd4_slot *nfsd4_alloc_slot(struct nfsd4_channel_attrs *fattrs,</div><div class='add'>+					   int index, gfp_t gfp)</div><div class='ctx'> {</div><div class='del'>-	u32 slotsize = slot_bytes(ca);</div><div class='del'>-	u32 num = ca-&gt;maxreqs;</div><div class='del'>-	unsigned long avail, total_avail;</div><div class='del'>-	unsigned int scale_factor;</div><div class='add'>+	struct nfsd4_slot *slot;</div><div class='add'>+	size_t size;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;nfsd_drc_lock);</div><div class='del'>-	if (nfsd_drc_max_mem &gt; nfsd_drc_mem_used)</div><div class='del'>-		total_avail = nfsd_drc_max_mem - nfsd_drc_mem_used;</div><div class='del'>-	else</div><div class='del'>-		/* We have handed out more space than we chose in</div><div class='del'>-		 * set_max_drc() to allow.  That isn't really a</div><div class='del'>-		 * problem as long as that doesn't make us think we</div><div class='del'>-		 * have lots more due to integer overflow.</div><div class='del'>-		 */</div><div class='del'>-		total_avail = 0;</div><div class='del'>-	avail = min((unsigned long)NFSD_MAX_MEM_PER_SESSION, total_avail);</div><div class='ctx'> 	/*</div><div class='del'>-	 * Never use more than a fraction of the remaining memory,</div><div class='del'>-	 * unless it's the only way to give this client a slot.</div><div class='del'>-	 * The chosen fraction is either 1/8 or 1/number of threads,</div><div class='del'>-	 * whichever is smaller.  This ensures there are adequate</div><div class='del'>-	 * slots to support multiple clients per thread.</div><div class='del'>-	 * Give the client one slot even if that would require</div><div class='del'>-	 * over-allocation--it is better than failure.</div><div class='add'>+	 * The RPC and NFS session headers are never saved in</div><div class='add'>+	 * the slot reply cache buffer.</div><div class='ctx'> 	 */</div><div class='del'>-	scale_factor = max_t(unsigned int, 8, nn-&gt;nfsd_serv-&gt;sv_nrthreads);</div><div class='del'>-</div><div class='del'>-	avail = clamp_t(unsigned long, avail, slotsize,</div><div class='del'>-			total_avail/scale_factor);</div><div class='del'>-	num = min_t(int, num, avail / slotsize);</div><div class='del'>-	num = max_t(int, num, 1);</div><div class='del'>-	nfsd_drc_mem_used += num * slotsize;</div><div class='del'>-	spin_unlock(&amp;nfsd_drc_lock);</div><div class='del'>-</div><div class='del'>-	return num;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void nfsd4_put_drc_mem(struct nfsd4_channel_attrs *ca)</div><div class='del'>-{</div><div class='del'>-	int slotsize = slot_bytes(ca);</div><div class='add'>+	size = fattrs-&gt;maxresp_cached &lt; NFSD_MIN_HDR_SEQ_SZ ?</div><div class='add'>+		0 : fattrs-&gt;maxresp_cached - NFSD_MIN_HDR_SEQ_SZ;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;nfsd_drc_lock);</div><div class='del'>-	nfsd_drc_mem_used -= slotsize * ca-&gt;maxreqs;</div><div class='del'>-	spin_unlock(&amp;nfsd_drc_lock);</div><div class='add'>+	slot = kzalloc(struct_size(slot, sl_data, size), gfp);</div><div class='add'>+	if (!slot)</div><div class='add'>+		return NULL;</div><div class='add'>+	slot-&gt;sl_index = index;</div><div class='add'>+	return slot;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct nfsd4_session *alloc_session(struct nfsd4_channel_attrs *fattrs,</div><div class='ctx'> 					   struct nfsd4_channel_attrs *battrs)</div><div class='ctx'> {</div><div class='ctx'> 	int numslots = fattrs-&gt;maxreqs;</div><div class='del'>-	int slotsize = slot_bytes(fattrs);</div><div class='ctx'> 	struct nfsd4_session *new;</div><div class='del'>-	int mem, i;</div><div class='del'>-</div><div class='del'>-	BUILD_BUG_ON(NFSD_MAX_SLOTS_PER_SESSION * sizeof(struct nfsd4_slot *)</div><div class='del'>-			+ sizeof(struct nfsd4_session) &gt; PAGE_SIZE);</div><div class='del'>-	mem = numslots * sizeof(struct nfsd4_slot *);</div><div class='add'>+	struct nfsd4_slot *slot;</div><div class='add'>+	int i;</div><div class='ctx'> </div><div class='del'>-	new = kzalloc(sizeof(*new) + mem, GFP_KERNEL);</div><div class='add'>+	new = kzalloc(sizeof(*new), GFP_KERNEL);</div><div class='ctx'> 	if (!new)</div><div class='ctx'> 		return NULL;</div><div class='del'>-	/* allocate each struct nfsd4_slot and data cache in one piece */</div><div class='del'>-	for (i = 0; i &lt; numslots; i++) {</div><div class='del'>-		new-&gt;se_slots[i] = kzalloc(slotsize, GFP_KERNEL);</div><div class='del'>-		if (!new-&gt;se_slots[i])</div><div class='del'>-			goto out_free;</div><div class='del'>-	}</div><div class='add'>+	xa_init(&amp;new-&gt;se_slots);</div><div class='ctx'> </div><div class='del'>-	memcpy(&amp;new-&gt;se_fchannel, fattrs, sizeof(struct nfsd4_channel_attrs));</div><div class='del'>-	memcpy(&amp;new-&gt;se_bchannel, battrs, sizeof(struct nfsd4_channel_attrs));</div><div class='add'>+	slot = nfsd4_alloc_slot(fattrs, 0, GFP_KERNEL);</div><div class='add'>+	if (!slot || xa_is_err(xa_store(&amp;new-&gt;se_slots, 0, slot, GFP_KERNEL)))</div><div class='add'>+		goto out_free;</div><div class='ctx'> </div><div class='add'>+	for (i = 1; i &lt; numslots; i++) {</div><div class='add'>+		const gfp_t gfp = GFP_KERNEL | __GFP_NORETRY | __GFP_NOWARN;</div><div class='add'>+		slot = nfsd4_alloc_slot(fattrs, i, gfp);</div><div class='add'>+		if (!slot)</div><div class='add'>+			break;</div><div class='add'>+		if (xa_is_err(xa_store(&amp;new-&gt;se_slots, i, slot, gfp))) {</div><div class='add'>+			kfree(slot);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	fattrs-&gt;maxreqs = i;</div><div class='add'>+	memcpy(&amp;new-&gt;se_fchannel, fattrs, sizeof(struct nfsd4_channel_attrs));</div><div class='add'>+	new-&gt;se_target_maxslots = i;</div><div class='add'>+	atomic_add(i - 1, &amp;nfsd_total_target_slots);</div><div class='add'>+	new-&gt;se_cb_slot_avail = ~0U;</div><div class='add'>+	new-&gt;se_cb_highest_slot = min(battrs-&gt;maxreqs - 1,</div><div class='add'>+				      NFSD_BC_SLOT_TABLE_SIZE - 1);</div><div class='add'>+	spin_lock_init(&amp;new-&gt;se_lock);</div><div class='ctx'> 	return new;</div><div class='ctx'> out_free:</div><div class='del'>-	while (i--)</div><div class='del'>-		kfree(new-&gt;se_slots[i]);</div><div class='add'>+	kfree(slot);</div><div class='add'>+	xa_destroy(&amp;new-&gt;se_slots);</div><div class='ctx'> 	kfree(new);</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='hunk'>@@ -1836,17 +2182,47 @@ static void nfsd4_del_conns(struct nfsd4_session *s)</div><div class='ctx'> </div><div class='ctx'> static void __free_session(struct nfsd4_session *ses)</div><div class='ctx'> {</div><div class='del'>-	free_session_slots(ses);</div><div class='add'>+	free_session_slots(ses, 0);</div><div class='add'>+	xa_destroy(&amp;ses-&gt;se_slots);</div><div class='ctx'> 	kfree(ses);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void free_session(struct nfsd4_session *ses)</div><div class='ctx'> {</div><div class='ctx'> 	nfsd4_del_conns(ses);</div><div class='del'>-	nfsd4_put_drc_mem(&amp;ses-&gt;se_fchannel);</div><div class='ctx'> 	__free_session(ses);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static unsigned long</div><div class='add'>+nfsd_slot_count(struct shrinker *s, struct shrink_control *sc)</div><div class='add'>+{</div><div class='add'>+	unsigned long cnt = atomic_read(&amp;nfsd_total_target_slots);</div><div class='add'>+</div><div class='add'>+	return cnt ? cnt : SHRINK_EMPTY;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static unsigned long</div><div class='add'>+nfsd_slot_scan(struct shrinker *s, struct shrink_control *sc)</div><div class='add'>+{</div><div class='add'>+	struct nfsd4_session *ses;</div><div class='add'>+	unsigned long scanned = 0;</div><div class='add'>+	unsigned long freed = 0;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;nfsd_session_list_lock);</div><div class='add'>+	list_for_each_entry(ses, &amp;nfsd_session_list, se_all_sessions) {</div><div class='add'>+		freed += reduce_session_slots(ses, 1);</div><div class='add'>+		scanned += 1;</div><div class='add'>+		if (scanned &gt;= sc-&gt;nr_to_scan) {</div><div class='add'>+			/* Move starting point for next scan */</div><div class='add'>+			list_move(&amp;nfsd_session_list, &amp;ses-&gt;se_all_sessions);</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;nfsd_session_list_lock);</div><div class='add'>+	sc-&gt;nr_scanned = scanned;</div><div class='add'>+	return freed;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void init_session(struct svc_rqst *rqstp, struct nfsd4_session *new, struct nfs4_client *clp, struct nfsd4_create_session *cses)</div><div class='ctx'> {</div><div class='ctx'> 	int idx;</div><div class='hunk'>@@ -1857,17 +2233,24 @@ static void init_session(struct svc_rqst *rqstp, struct nfsd4_session *new, stru</div><div class='ctx'> </div><div class='ctx'> 	INIT_LIST_HEAD(&amp;new-&gt;se_conns);</div><div class='ctx'> </div><div class='del'>-	new-&gt;se_cb_seq_nr = 1;</div><div class='del'>-	new-&gt;se_flags = cses-&gt;flags;</div><div class='add'>+	atomic_set(&amp;new-&gt;se_ref, 0);</div><div class='add'>+	new-&gt;se_dead = false;</div><div class='ctx'> 	new-&gt;se_cb_prog = cses-&gt;callback_prog;</div><div class='ctx'> 	new-&gt;se_cb_sec = cses-&gt;cb_sec;</div><div class='del'>-	atomic_set(&amp;new-&gt;se_ref, 0);</div><div class='add'>+</div><div class='add'>+	for (idx = 0; idx &lt; NFSD_BC_SLOT_TABLE_SIZE; ++idx)</div><div class='add'>+		new-&gt;se_cb_seq_nr[idx] = 1;</div><div class='add'>+</div><div class='ctx'> 	idx = hash_sessionid(&amp;new-&gt;se_sessionid);</div><div class='ctx'> 	list_add(&amp;new-&gt;se_hash, &amp;nn-&gt;sessionid_hashtbl[idx]);</div><div class='ctx'> 	spin_lock(&amp;clp-&gt;cl_lock);</div><div class='ctx'> 	list_add(&amp;new-&gt;se_perclnt, &amp;clp-&gt;cl_sessions);</div><div class='ctx'> 	spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='ctx'> </div><div class='add'>+	spin_lock(&amp;nfsd_session_list_lock);</div><div class='add'>+	list_add_tail(&amp;new-&gt;se_all_sessions, &amp;nfsd_session_list);</div><div class='add'>+	spin_unlock(&amp;nfsd_session_list_lock);</div><div class='add'>+</div><div class='ctx'> 	{</div><div class='ctx'> 		struct sockaddr *sa = svc_addr(rqstp);</div><div class='ctx'> 		/*</div><div class='hunk'>@@ -1937,6 +2320,9 @@ unhash_session(struct nfsd4_session *ses)</div><div class='ctx'> 	spin_lock(&amp;ses-&gt;se_client-&gt;cl_lock);</div><div class='ctx'> 	list_del(&amp;ses-&gt;se_perclnt);</div><div class='ctx'> 	spin_unlock(&amp;ses-&gt;se_client-&gt;cl_lock);</div><div class='add'>+	spin_lock(&amp;nfsd_session_list_lock);</div><div class='add'>+	list_del(&amp;ses-&gt;se_all_sessions);</div><div class='add'>+	spin_unlock(&amp;nfsd_session_list_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* SETCLIENTID and SETCLIENTID_CONFIRM Helper functions */</div><div class='hunk'>@@ -1954,16 +2340,16 @@ STALE_CLIENTID(clientid_t *clid, struct nfsd_net *nn)</div><div class='ctx'> 	return 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* </div><div class='del'>- * XXX Should we use a slab cache ?</div><div class='del'>- * This type of memory management is somewhat inefficient, but we use it</div><div class='del'>- * anyway since SETCLIENTID is not a common operation.</div><div class='del'>- */</div><div class='del'>-static struct nfs4_client *alloc_client(struct xdr_netobj name)</div><div class='add'>+static struct nfs4_client *alloc_client(struct xdr_netobj name,</div><div class='add'>+				struct nfsd_net *nn)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_client *clp;</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='add'>+	if (atomic_read(&amp;nn-&gt;nfs4_client_count) &gt;= nn-&gt;nfs4_max_clients &amp;&amp;</div><div class='add'>+	    atomic_read(&amp;nn-&gt;nfsd_courtesy_clients) &gt; 0)</div><div class='add'>+		mod_delayed_work(laundry_wq, &amp;nn-&gt;laundromat_work, 0);</div><div class='add'>+</div><div class='ctx'> 	clp = kmem_cache_zalloc(client_slab, GFP_KERNEL);</div><div class='ctx'> 	if (clp == NULL)</div><div class='ctx'> 		return NULL;</div><div class='hunk'>@@ -1975,12 +2361,19 @@ static struct nfs4_client *alloc_client(struct xdr_netobj name)</div><div class='ctx'> 						 GFP_KERNEL);</div><div class='ctx'> 	if (!clp-&gt;cl_ownerstr_hashtbl)</div><div class='ctx'> 		goto err_no_hashtbl;</div><div class='add'>+	clp-&gt;cl_callback_wq = alloc_ordered_workqueue("nfsd4_callbacks", 0);</div><div class='add'>+	if (!clp-&gt;cl_callback_wq)</div><div class='add'>+		goto err_no_callback_wq;</div><div class='add'>+</div><div class='ctx'> 	for (i = 0; i &lt; OWNER_HASH_SIZE; i++)</div><div class='ctx'> 		INIT_LIST_HEAD(&amp;clp-&gt;cl_ownerstr_hashtbl[i]);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;clp-&gt;cl_sessions);</div><div class='ctx'> 	idr_init(&amp;clp-&gt;cl_stateids);</div><div class='ctx'> 	atomic_set(&amp;clp-&gt;cl_rpc_users, 0);</div><div class='ctx'> 	clp-&gt;cl_cb_state = NFSD4_CB_UNKNOWN;</div><div class='add'>+	clp-&gt;cl_state = NFSD4_ACTIVE;</div><div class='add'>+	atomic_inc(&amp;nn-&gt;nfs4_client_count);</div><div class='add'>+	atomic_set(&amp;clp-&gt;cl_delegs_in_recall, 0);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;clp-&gt;cl_idhash);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;clp-&gt;cl_openowners);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;clp-&gt;cl_delegations);</div><div class='hunk'>@@ -1994,6 +2387,8 @@ static struct nfs4_client *alloc_client(struct xdr_netobj name)</div><div class='ctx'> 	spin_lock_init(&amp;clp-&gt;cl_lock);</div><div class='ctx'> 	rpc_init_wait_queue(&amp;clp-&gt;cl_cb_waitq, "Backchannel slot table");</div><div class='ctx'> 	return clp;</div><div class='add'>+err_no_callback_wq:</div><div class='add'>+	kfree(clp-&gt;cl_ownerstr_hashtbl);</div><div class='ctx'> err_no_hashtbl:</div><div class='ctx'> 	kfree(clp-&gt;cl_name.data);</div><div class='ctx'> err_no_name:</div><div class='hunk'>@@ -2007,11 +2402,13 @@ static void __free_client(struct kref *k)</div><div class='ctx'> 	struct nfs4_client *clp = container_of(c, struct nfs4_client, cl_nfsdfs);</div><div class='ctx'> </div><div class='ctx'> 	free_svc_cred(&amp;clp-&gt;cl_cred);</div><div class='add'>+	destroy_workqueue(clp-&gt;cl_callback_wq);</div><div class='ctx'> 	kfree(clp-&gt;cl_ownerstr_hashtbl);</div><div class='ctx'> 	kfree(clp-&gt;cl_name.data);</div><div class='ctx'> 	kfree(clp-&gt;cl_nii_domain.data);</div><div class='ctx'> 	kfree(clp-&gt;cl_nii_name.data);</div><div class='ctx'> 	idr_destroy(&amp;clp-&gt;cl_stateids);</div><div class='add'>+	kfree(clp-&gt;cl_ra);</div><div class='ctx'> 	kmem_cache_free(client_slab, clp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2061,8 +2458,12 @@ unhash_client_locked(struct nfs4_client *clp)</div><div class='ctx'> 	}</div><div class='ctx'> 	list_del_init(&amp;clp-&gt;cl_lru);</div><div class='ctx'> 	spin_lock(&amp;clp-&gt;cl_lock);</div><div class='del'>-	list_for_each_entry(ses, &amp;clp-&gt;cl_sessions, se_perclnt)</div><div class='add'>+	spin_lock(&amp;nfsd_session_list_lock);</div><div class='add'>+	list_for_each_entry(ses, &amp;clp-&gt;cl_sessions, se_perclnt) {</div><div class='ctx'> 		list_del_init(&amp;ses-&gt;se_hash);</div><div class='add'>+		list_del_init(&amp;ses-&gt;se_all_sessions);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;nfsd_session_list_lock);</div><div class='ctx'> 	spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2078,7 +2479,11 @@ unhash_client(struct nfs4_client *clp)</div><div class='ctx'> </div><div class='ctx'> static __be32 mark_client_expired_locked(struct nfs4_client *clp)</div><div class='ctx'> {</div><div class='del'>-	if (atomic_read(&amp;clp-&gt;cl_rpc_users))</div><div class='add'>+	int users = atomic_read(&amp;clp-&gt;cl_rpc_users);</div><div class='add'>+</div><div class='add'>+	trace_nfsd_mark_client_expired(clp, users);</div><div class='add'>+</div><div class='add'>+	if (users)</div><div class='ctx'> 		return nfserr_jukebox;</div><div class='ctx'> 	unhash_client_locked(clp);</div><div class='ctx'> 	return nfs_ok;</div><div class='hunk'>@@ -2087,16 +2492,16 @@ static __be32 mark_client_expired_locked(struct nfs4_client *clp)</div><div class='ctx'> static void</div><div class='ctx'> __destroy_client(struct nfs4_client *clp)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd_net *nn = net_generic(clp-&gt;net, nfsd_net_id);</div><div class='ctx'> 	int i;</div><div class='ctx'> 	struct nfs4_openowner *oo;</div><div class='ctx'> 	struct nfs4_delegation *dp;</div><div class='del'>-	struct list_head reaplist;</div><div class='add'>+	LIST_HEAD(reaplist);</div><div class='ctx'> </div><div class='del'>-	INIT_LIST_HEAD(&amp;reaplist);</div><div class='ctx'> 	spin_lock(&amp;state_lock);</div><div class='ctx'> 	while (!list_empty(&amp;clp-&gt;cl_delegations)) {</div><div class='ctx'> 		dp = list_entry(clp-&gt;cl_delegations.next, struct nfs4_delegation, dl_perclnt);</div><div class='del'>-		WARN_ON(!unhash_delegation_locked(dp));</div><div class='add'>+		unhash_delegation_locked(dp, SC_STATUS_CLOSED);</div><div class='ctx'> 		list_add(&amp;dp-&gt;dl_recall_lru, &amp;reaplist);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;state_lock);</div><div class='hunk'>@@ -2130,6 +2535,8 @@ __destroy_client(struct nfs4_client *clp)</div><div class='ctx'> 	nfsd4_shutdown_callback(clp);</div><div class='ctx'> 	if (clp-&gt;cl_cb_conn.cb_xprt)</div><div class='ctx'> 		svc_xprt_put(clp-&gt;cl_cb_conn.cb_xprt);</div><div class='add'>+	atomic_add_unless(&amp;nn-&gt;nfs4_client_count, -1, 0);</div><div class='add'>+	nfsd4_dec_courtesy_client_count(nn, clp);</div><div class='ctx'> 	free_client(clp);</div><div class='ctx'> 	wake_up_all(&amp;expiry_wq);</div><div class='ctx'> }</div><div class='hunk'>@@ -2326,14 +2733,16 @@ find_stateid_locked(struct nfs4_client *cl, stateid_t *t)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct nfs4_stid *</div><div class='del'>-find_stateid_by_type(struct nfs4_client *cl, stateid_t *t, char typemask)</div><div class='add'>+find_stateid_by_type(struct nfs4_client *cl, stateid_t *t,</div><div class='add'>+		     unsigned short typemask, unsigned short ok_states)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_stid *s;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;cl-&gt;cl_lock);</div><div class='ctx'> 	s = find_stateid_locked(cl, t);</div><div class='ctx'> 	if (s != NULL) {</div><div class='del'>-		if (typemask &amp; s-&gt;sc_type)</div><div class='add'>+		if ((s-&gt;sc_status &amp; ~ok_states) == 0 &amp;&amp;</div><div class='add'>+		    (typemask &amp; s-&gt;sc_type))</div><div class='ctx'> 			refcount_inc(&amp;s-&gt;sc_count);</div><div class='ctx'> 		else</div><div class='ctx'> 			s = NULL;</div><div class='hunk'>@@ -2353,9 +2762,9 @@ static struct nfs4_client *get_nfsdfs_clp(struct inode *inode)</div><div class='ctx'> </div><div class='ctx'> static void seq_quote_mem(struct seq_file *m, char *data, int len)</div><div class='ctx'> {</div><div class='del'>-	seq_printf(m, "\"");</div><div class='add'>+	seq_puts(m, "\"");</div><div class='ctx'> 	seq_escape_mem(m, data, len, ESCAPE_HEX | ESCAPE_NAP | ESCAPE_APPEND, "\"\\");</div><div class='del'>-	seq_printf(m, "\"");</div><div class='add'>+	seq_puts(m, "\"");</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const char *cb_state2str(int state)</div><div class='hunk'>@@ -2375,7 +2784,8 @@ static const char *cb_state2str(int state)</div><div class='ctx'> </div><div class='ctx'> static int client_info_show(struct seq_file *m, void *v)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = m-&gt;private;</div><div class='add'>+	struct inode *inode = file_inode(m-&gt;file);</div><div class='add'>+	struct nfsd4_session *ses;</div><div class='ctx'> 	struct nfs4_client *clp;</div><div class='ctx'> 	u64 clid;</div><div class='ctx'> </div><div class='hunk'>@@ -2385,40 +2795,49 @@ static int client_info_show(struct seq_file *m, void *v)</div><div class='ctx'> 	memcpy(&amp;clid, &amp;clp-&gt;cl_clientid, sizeof(clid));</div><div class='ctx'> 	seq_printf(m, "clientid: 0x%llx\n", clid);</div><div class='ctx'> 	seq_printf(m, "address: \"%pISpc\"\n", (struct sockaddr *)&amp;clp-&gt;cl_addr);</div><div class='del'>-	if (test_bit(NFSD4_CLIENT_CONFIRMED, &amp;clp-&gt;cl_flags))</div><div class='add'>+</div><div class='add'>+	if (clp-&gt;cl_state == NFSD4_COURTESY)</div><div class='add'>+		seq_puts(m, "status: courtesy\n");</div><div class='add'>+	else if (clp-&gt;cl_state == NFSD4_EXPIRABLE)</div><div class='add'>+		seq_puts(m, "status: expirable\n");</div><div class='add'>+	else if (test_bit(NFSD4_CLIENT_CONFIRMED, &amp;clp-&gt;cl_flags))</div><div class='ctx'> 		seq_puts(m, "status: confirmed\n");</div><div class='ctx'> 	else</div><div class='ctx'> 		seq_puts(m, "status: unconfirmed\n");</div><div class='del'>-	seq_printf(m, "name: ");</div><div class='add'>+	seq_printf(m, "seconds from last renew: %lld\n",</div><div class='add'>+		ktime_get_boottime_seconds() - clp-&gt;cl_time);</div><div class='add'>+	seq_puts(m, "name: ");</div><div class='ctx'> 	seq_quote_mem(m, clp-&gt;cl_name.data, clp-&gt;cl_name.len);</div><div class='ctx'> 	seq_printf(m, "\nminor version: %d\n", clp-&gt;cl_minorversion);</div><div class='ctx'> 	if (clp-&gt;cl_nii_domain.data) {</div><div class='del'>-		seq_printf(m, "Implementation domain: ");</div><div class='add'>+		seq_puts(m, "Implementation domain: ");</div><div class='ctx'> 		seq_quote_mem(m, clp-&gt;cl_nii_domain.data,</div><div class='ctx'> 					clp-&gt;cl_nii_domain.len);</div><div class='del'>-		seq_printf(m, "\nImplementation name: ");</div><div class='add'>+		seq_puts(m, "\nImplementation name: ");</div><div class='ctx'> 		seq_quote_mem(m, clp-&gt;cl_nii_name.data, clp-&gt;cl_nii_name.len);</div><div class='ctx'> 		seq_printf(m, "\nImplementation time: [%lld, %ld]\n",</div><div class='ctx'> 			clp-&gt;cl_nii_time.tv_sec, clp-&gt;cl_nii_time.tv_nsec);</div><div class='ctx'> 	}</div><div class='ctx'> 	seq_printf(m, "callback state: %s\n", cb_state2str(clp-&gt;cl_cb_state));</div><div class='del'>-	seq_printf(m, "callback address: %pISpc\n", &amp;clp-&gt;cl_cb_conn.cb_addr);</div><div class='add'>+	seq_printf(m, "callback address: \"%pISpc\"\n", &amp;clp-&gt;cl_cb_conn.cb_addr);</div><div class='add'>+	seq_printf(m, "admin-revoked states: %d\n",</div><div class='add'>+		   atomic_read(&amp;clp-&gt;cl_admin_revoked));</div><div class='add'>+	spin_lock(&amp;clp-&gt;cl_lock);</div><div class='add'>+	seq_printf(m, "session slots:");</div><div class='add'>+	list_for_each_entry(ses, &amp;clp-&gt;cl_sessions, se_perclnt)</div><div class='add'>+		seq_printf(m, " %u", ses-&gt;se_fchannel.maxreqs);</div><div class='add'>+	seq_printf(m, "\nsession target slots:");</div><div class='add'>+	list_for_each_entry(ses, &amp;clp-&gt;cl_sessions, se_perclnt)</div><div class='add'>+		seq_printf(m, " %u", ses-&gt;se_target_maxslots);</div><div class='add'>+	spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='add'>+	seq_puts(m, "\n");</div><div class='add'>+</div><div class='ctx'> 	drop_client(clp);</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int client_info_open(struct inode *inode, struct file *file)</div><div class='del'>-{</div><div class='del'>-	return single_open(file, client_info_show, inode);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static const struct file_operations client_info_fops = {</div><div class='del'>-	.open		= client_info_open,</div><div class='del'>-	.read		= seq_read,</div><div class='del'>-	.llseek		= seq_lseek,</div><div class='del'>-	.release	= single_release,</div><div class='del'>-};</div><div class='add'>+DEFINE_SHOW_ATTRIBUTE(client_info);</div><div class='ctx'> </div><div class='ctx'> static void *states_start(struct seq_file *s, loff_t *pos)</div><div class='ctx'> 	__acquires(&amp;clp-&gt;cl_lock)</div><div class='hunk'>@@ -2461,7 +2880,7 @@ static void nfs4_show_fname(struct seq_file *s, struct nfsd_file *f)</div><div class='ctx'> </div><div class='ctx'> static void nfs4_show_superblock(struct seq_file *s, struct nfsd_file *f)</div><div class='ctx'> {</div><div class='del'>-	struct inode *inode = f-&gt;nf_inode;</div><div class='add'>+	struct inode *inode = file_inode(f-&gt;nf_file);</div><div class='ctx'> </div><div class='ctx'> 	seq_printf(s, "superblock: \"%02x:%02x:%ld\"",</div><div class='ctx'> 					MAJOR(inode-&gt;i_sb-&gt;s_dev),</div><div class='hunk'>@@ -2471,7 +2890,7 @@ static void nfs4_show_superblock(struct seq_file *s, struct nfsd_file *f)</div><div class='ctx'> </div><div class='ctx'> static void nfs4_show_owner(struct seq_file *s, struct nfs4_stateowner *oo)</div><div class='ctx'> {</div><div class='del'>-	seq_printf(s, "owner: ");</div><div class='add'>+	seq_puts(s, "owner: ");</div><div class='ctx'> 	seq_quote_mem(s, oo-&gt;so_owner.data, oo-&gt;so_owner.len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2489,18 +2908,13 @@ static int nfs4_show_open(struct seq_file *s, struct nfs4_stid *st)</div><div class='ctx'> 	struct nfs4_stateowner *oo;</div><div class='ctx'> 	unsigned int access, deny;</div><div class='ctx'> </div><div class='del'>-	if (st-&gt;sc_type != NFS4_OPEN_STID &amp;&amp; st-&gt;sc_type != NFS4_LOCK_STID)</div><div class='del'>-		return 0; /* XXX: or SEQ_SKIP? */</div><div class='ctx'> 	ols = openlockstateid(st);</div><div class='ctx'> 	oo = ols-&gt;st_stateowner;</div><div class='ctx'> 	nf = st-&gt;sc_file;</div><div class='del'>-	file = find_any_file(nf);</div><div class='del'>-	if (!file)</div><div class='del'>-		return 0;</div><div class='ctx'> </div><div class='del'>-	seq_printf(s, "- ");</div><div class='add'>+	seq_puts(s, "- ");</div><div class='ctx'> 	nfs4_show_stateid(s, &amp;st-&gt;sc_stateid);</div><div class='del'>-	seq_printf(s, ": { type: open, ");</div><div class='add'>+	seq_puts(s, ": { type: open, ");</div><div class='ctx'> </div><div class='ctx'> 	access = bmap_to_share_mode(ols-&gt;st_access_bmap);</div><div class='ctx'> 	deny   = bmap_to_share_mode(ols-&gt;st_deny_bmap);</div><div class='hunk'>@@ -2512,14 +2926,22 @@ static int nfs4_show_open(struct seq_file *s, struct nfs4_stid *st)</div><div class='ctx'> 		deny &amp; NFS4_SHARE_ACCESS_READ ? "r" : "-",</div><div class='ctx'> 		deny &amp; NFS4_SHARE_ACCESS_WRITE ? "w" : "-");</div><div class='ctx'> </div><div class='del'>-	nfs4_show_superblock(s, file);</div><div class='del'>-	seq_printf(s, ", ");</div><div class='del'>-	nfs4_show_fname(s, file);</div><div class='del'>-	seq_printf(s, ", ");</div><div class='add'>+	if (nf) {</div><div class='add'>+		spin_lock(&amp;nf-&gt;fi_lock);</div><div class='add'>+		file = find_any_file_locked(nf);</div><div class='add'>+		if (file) {</div><div class='add'>+			nfs4_show_superblock(s, file);</div><div class='add'>+			seq_puts(s, ", ");</div><div class='add'>+			nfs4_show_fname(s, file);</div><div class='add'>+			seq_puts(s, ", ");</div><div class='add'>+		}</div><div class='add'>+		spin_unlock(&amp;nf-&gt;fi_lock);</div><div class='add'>+	} else</div><div class='add'>+		seq_puts(s, "closed, ");</div><div class='ctx'> 	nfs4_show_owner(s, oo);</div><div class='del'>-	seq_printf(s, " }\n");</div><div class='del'>-	nfsd_file_put(file);</div><div class='del'>-</div><div class='add'>+	if (st-&gt;sc_status &amp; SC_STATUS_ADMIN_REVOKED)</div><div class='add'>+		seq_puts(s, ", admin-revoked");</div><div class='add'>+	seq_puts(s, " }\n");</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2533,33 +2955,50 @@ static int nfs4_show_lock(struct seq_file *s, struct nfs4_stid *st)</div><div class='ctx'> 	ols = openlockstateid(st);</div><div class='ctx'> 	oo = ols-&gt;st_stateowner;</div><div class='ctx'> 	nf = st-&gt;sc_file;</div><div class='del'>-	file = find_any_file(nf);</div><div class='del'>-	if (!file)</div><div class='del'>-		return 0;</div><div class='ctx'> </div><div class='del'>-	seq_printf(s, "- ");</div><div class='add'>+	seq_puts(s, "- ");</div><div class='ctx'> 	nfs4_show_stateid(s, &amp;st-&gt;sc_stateid);</div><div class='del'>-	seq_printf(s, ": { type: lock, ");</div><div class='add'>+	seq_puts(s, ": { type: lock, ");</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Note: a lock stateid isn't really the same thing as a lock,</div><div class='del'>-	 * it's the locking state held by one owner on a file, and there</div><div class='del'>-	 * may be multiple (or no) lock ranges associated with it.</div><div class='del'>-	 * (Same for the matter is true of open stateids.)</div><div class='del'>-	 */</div><div class='add'>+	spin_lock(&amp;nf-&gt;fi_lock);</div><div class='add'>+	file = find_any_file_locked(nf);</div><div class='add'>+	if (file) {</div><div class='add'>+		/*</div><div class='add'>+		 * Note: a lock stateid isn't really the same thing as a lock,</div><div class='add'>+		 * it's the locking state held by one owner on a file, and there</div><div class='add'>+		 * may be multiple (or no) lock ranges associated with it.</div><div class='add'>+		 * (Same for the matter is true of open stateids.)</div><div class='add'>+		 */</div><div class='ctx'> </div><div class='del'>-	nfs4_show_superblock(s, file);</div><div class='del'>-	/* XXX: open stateid? */</div><div class='del'>-	seq_printf(s, ", ");</div><div class='del'>-	nfs4_show_fname(s, file);</div><div class='del'>-	seq_printf(s, ", ");</div><div class='add'>+		nfs4_show_superblock(s, file);</div><div class='add'>+		/* XXX: open stateid? */</div><div class='add'>+		seq_puts(s, ", ");</div><div class='add'>+		nfs4_show_fname(s, file);</div><div class='add'>+		seq_puts(s, ", ");</div><div class='add'>+	}</div><div class='ctx'> 	nfs4_show_owner(s, oo);</div><div class='del'>-	seq_printf(s, " }\n");</div><div class='del'>-	nfsd_file_put(file);</div><div class='del'>-</div><div class='add'>+	if (st-&gt;sc_status &amp; SC_STATUS_ADMIN_REVOKED)</div><div class='add'>+		seq_puts(s, ", admin-revoked");</div><div class='add'>+	seq_puts(s, " }\n");</div><div class='add'>+	spin_unlock(&amp;nf-&gt;fi_lock);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static char *nfs4_show_deleg_type(u32 dl_type)</div><div class='add'>+{</div><div class='add'>+	switch (dl_type) {</div><div class='add'>+	case OPEN_DELEGATE_READ:</div><div class='add'>+		return "r";</div><div class='add'>+	case OPEN_DELEGATE_WRITE:</div><div class='add'>+		return "w";</div><div class='add'>+	case OPEN_DELEGATE_READ_ATTRS_DELEG:</div><div class='add'>+		return "ra";</div><div class='add'>+	case OPEN_DELEGATE_WRITE_ATTRS_DELEG:</div><div class='add'>+		return "wa";</div><div class='add'>+	}</div><div class='add'>+	return "?";</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static int nfs4_show_deleg(struct seq_file *s, struct nfs4_stid *st)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_delegation *ds;</div><div class='hunk'>@@ -2568,26 +3007,27 @@ static int nfs4_show_deleg(struct seq_file *s, struct nfs4_stid *st)</div><div class='ctx'> </div><div class='ctx'> 	ds = delegstateid(st);</div><div class='ctx'> 	nf = st-&gt;sc_file;</div><div class='del'>-	file = find_deleg_file(nf);</div><div class='del'>-	if (!file)</div><div class='del'>-		return 0;</div><div class='ctx'> </div><div class='del'>-	seq_printf(s, "- ");</div><div class='add'>+	seq_puts(s, "- ");</div><div class='ctx'> 	nfs4_show_stateid(s, &amp;st-&gt;sc_stateid);</div><div class='del'>-	seq_printf(s, ": { type: deleg, ");</div><div class='add'>+	seq_puts(s, ": { type: deleg, ");</div><div class='ctx'> </div><div class='del'>-	/* Kinda dead code as long as we only support read delegs: */</div><div class='del'>-	seq_printf(s, "access: %s, ",</div><div class='del'>-		ds-&gt;dl_type == NFS4_OPEN_DELEGATE_READ ? "r" : "w");</div><div class='add'>+	seq_printf(s, "access: %s", nfs4_show_deleg_type(ds-&gt;dl_type));</div><div class='ctx'> </div><div class='ctx'> 	/* XXX: lease time, whether it's being recalled. */</div><div class='ctx'> </div><div class='del'>-	nfs4_show_superblock(s, file);</div><div class='del'>-	seq_printf(s, ", ");</div><div class='del'>-	nfs4_show_fname(s, file);</div><div class='del'>-	seq_printf(s, " }\n");</div><div class='del'>-	nfsd_file_put(file);</div><div class='del'>-</div><div class='add'>+	spin_lock(&amp;nf-&gt;fi_lock);</div><div class='add'>+	file = nf-&gt;fi_deleg_file;</div><div class='add'>+	if (file) {</div><div class='add'>+		seq_puts(s, ", ");</div><div class='add'>+		nfs4_show_superblock(s, file);</div><div class='add'>+		seq_puts(s, ", ");</div><div class='add'>+		nfs4_show_fname(s, file);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;nf-&gt;fi_lock);</div><div class='add'>+	if (st-&gt;sc_status &amp; SC_STATUS_ADMIN_REVOKED)</div><div class='add'>+		seq_puts(s, ", admin-revoked");</div><div class='add'>+	seq_puts(s, " }\n");</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2597,18 +3037,25 @@ static int nfs4_show_layout(struct seq_file *s, struct nfs4_stid *st)</div><div class='ctx'> 	struct nfsd_file *file;</div><div class='ctx'> </div><div class='ctx'> 	ls = container_of(st, struct nfs4_layout_stateid, ls_stid);</div><div class='del'>-	file = ls-&gt;ls_file;</div><div class='ctx'> </div><div class='del'>-	seq_printf(s, "- ");</div><div class='add'>+	seq_puts(s, "- ");</div><div class='ctx'> 	nfs4_show_stateid(s, &amp;st-&gt;sc_stateid);</div><div class='del'>-	seq_printf(s, ": { type: layout, ");</div><div class='add'>+	seq_puts(s, ": { type: layout");</div><div class='ctx'> </div><div class='ctx'> 	/* XXX: What else would be useful? */</div><div class='ctx'> </div><div class='del'>-	nfs4_show_superblock(s, file);</div><div class='del'>-	seq_printf(s, ", ");</div><div class='del'>-	nfs4_show_fname(s, file);</div><div class='del'>-	seq_printf(s, " }\n");</div><div class='add'>+	spin_lock(&amp;ls-&gt;ls_stid.sc_file-&gt;fi_lock);</div><div class='add'>+	file = ls-&gt;ls_file;</div><div class='add'>+	if (file) {</div><div class='add'>+		seq_puts(s, ", ");</div><div class='add'>+		nfs4_show_superblock(s, file);</div><div class='add'>+		seq_puts(s, ", ");</div><div class='add'>+		nfs4_show_fname(s, file);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;ls-&gt;ls_stid.sc_file-&gt;fi_lock);</div><div class='add'>+	if (st-&gt;sc_status &amp; SC_STATUS_ADMIN_REVOKED)</div><div class='add'>+		seq_puts(s, ", admin-revoked");</div><div class='add'>+	seq_puts(s, " }\n");</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -2618,13 +3065,13 @@ static int states_show(struct seq_file *s, void *v)</div><div class='ctx'> 	struct nfs4_stid *st = v;</div><div class='ctx'> </div><div class='ctx'> 	switch (st-&gt;sc_type) {</div><div class='del'>-	case NFS4_OPEN_STID:</div><div class='add'>+	case SC_TYPE_OPEN:</div><div class='ctx'> 		return nfs4_show_open(s, st);</div><div class='del'>-	case NFS4_LOCK_STID:</div><div class='add'>+	case SC_TYPE_LOCK:</div><div class='ctx'> 		return nfs4_show_lock(s, st);</div><div class='del'>-	case NFS4_DELEG_STID:</div><div class='add'>+	case SC_TYPE_DELEG:</div><div class='ctx'> 		return nfs4_show_deleg(s, st);</div><div class='del'>-	case NFS4_LAYOUT_STID:</div><div class='add'>+	case SC_TYPE_LAYOUT:</div><div class='ctx'> 		return nfs4_show_layout(s, st);</div><div class='ctx'> 	default:</div><div class='ctx'> 		return 0; /* XXX: or SEQ_SKIP? */</div><div class='hunk'>@@ -2664,7 +3111,7 @@ static int client_opens_release(struct inode *inode, struct file *file)</div><div class='ctx'> </div><div class='ctx'> 	/* XXX: alternatively, we could get/drop in seq start/stop */</div><div class='ctx'> 	drop_client(clp);</div><div class='del'>-	return 0;</div><div class='add'>+	return seq_release(inode, file);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct file_operations client_states_fops = {</div><div class='hunk'>@@ -2735,6 +3182,88 @@ static const struct tree_descr client_files[] = {</div><div class='ctx'> 	[3] = {""},</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+static int</div><div class='add'>+nfsd4_cb_recall_any_done(struct nfsd4_callback *cb,</div><div class='add'>+				struct rpc_task *task)</div><div class='add'>+{</div><div class='add'>+	trace_nfsd_cb_recall_any_done(cb, task);</div><div class='add'>+	switch (task-&gt;tk_status) {</div><div class='add'>+	case -NFS4ERR_DELAY:</div><div class='add'>+		rpc_delay(task, 2 * HZ);</div><div class='add'>+		return 0;</div><div class='add'>+	default:</div><div class='add'>+		return 1;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+nfsd4_cb_recall_any_release(struct nfsd4_callback *cb)</div><div class='add'>+{</div><div class='add'>+	struct nfs4_client *clp = cb-&gt;cb_clp;</div><div class='add'>+</div><div class='add'>+	drop_client(clp);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int</div><div class='add'>+nfsd4_cb_getattr_done(struct nfsd4_callback *cb, struct rpc_task *task)</div><div class='add'>+{</div><div class='add'>+	struct nfs4_cb_fattr *ncf =</div><div class='add'>+			container_of(cb, struct nfs4_cb_fattr, ncf_getattr);</div><div class='add'>+	struct nfs4_delegation *dp =</div><div class='add'>+			container_of(ncf, struct nfs4_delegation, dl_cb_fattr);</div><div class='add'>+</div><div class='add'>+	trace_nfsd_cb_getattr_done(&amp;dp-&gt;dl_stid.sc_stateid, task);</div><div class='add'>+	ncf-&gt;ncf_cb_status = task-&gt;tk_status;</div><div class='add'>+	switch (task-&gt;tk_status) {</div><div class='add'>+	case -NFS4ERR_DELAY:</div><div class='add'>+		rpc_delay(task, 2 * HZ);</div><div class='add'>+		return 0;</div><div class='add'>+	default:</div><div class='add'>+		return 1;</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+nfsd4_cb_getattr_release(struct nfsd4_callback *cb)</div><div class='add'>+{</div><div class='add'>+	struct nfs4_cb_fattr *ncf =</div><div class='add'>+			container_of(cb, struct nfs4_cb_fattr, ncf_getattr);</div><div class='add'>+	struct nfs4_delegation *dp =</div><div class='add'>+			container_of(ncf, struct nfs4_delegation, dl_cb_fattr);</div><div class='add'>+</div><div class='add'>+	nfs4_put_stid(&amp;dp-&gt;dl_stid);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct nfsd4_callback_ops nfsd4_cb_recall_any_ops = {</div><div class='add'>+	.done		= nfsd4_cb_recall_any_done,</div><div class='add'>+	.release	= nfsd4_cb_recall_any_release,</div><div class='add'>+	.opcode		= OP_CB_RECALL_ANY,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static const struct nfsd4_callback_ops nfsd4_cb_getattr_ops = {</div><div class='add'>+	.done		= nfsd4_cb_getattr_done,</div><div class='add'>+	.release	= nfsd4_cb_getattr_release,</div><div class='add'>+	.opcode		= OP_CB_GETATTR,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static void nfs4_cb_getattr(struct nfs4_cb_fattr *ncf)</div><div class='add'>+{</div><div class='add'>+	struct nfs4_delegation *dp =</div><div class='add'>+			container_of(ncf, struct nfs4_delegation, dl_cb_fattr);</div><div class='add'>+</div><div class='add'>+	if (test_and_set_bit(NFSD4_CALLBACK_RUNNING, &amp;ncf-&gt;ncf_getattr.cb_flags))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	/* set to proper status when nfsd4_cb_getattr_done runs */</div><div class='add'>+	ncf-&gt;ncf_cb_status = NFS4ERR_IO;</div><div class='add'>+</div><div class='add'>+	/* ensure that wake_bit is done when RUNNING is cleared */</div><div class='add'>+	set_bit(NFSD4_CALLBACK_WAKE, &amp;ncf-&gt;ncf_getattr.cb_flags);</div><div class='add'>+</div><div class='add'>+	refcount_inc(&amp;dp-&gt;dl_stid.sc_count);</div><div class='add'>+	nfsd4_run_cb(&amp;ncf-&gt;ncf_getattr);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static struct nfs4_client *create_client(struct xdr_netobj name,</div><div class='ctx'> 		struct svc_rqst *rqstp, nfs4_verifier *verf)</div><div class='ctx'> {</div><div class='hunk'>@@ -2745,7 +3274,7 @@ static struct nfs4_client *create_client(struct xdr_netobj name,</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='ctx'> 	struct dentry *dentries[ARRAY_SIZE(client_files)];</div><div class='ctx'> </div><div class='del'>-	clp = alloc_client(name);</div><div class='add'>+	clp = alloc_client(name, nn);</div><div class='ctx'> 	if (clp == NULL)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='hunk'>@@ -2758,7 +3287,6 @@ static struct nfs4_client *create_client(struct xdr_netobj name,</div><div class='ctx'> 	kref_init(&amp;clp-&gt;cl_nfsdfs.cl_ref);</div><div class='ctx'> 	nfsd4_init_cb(&amp;clp-&gt;cl_cb_null, clp, NULL, NFSPROC4_CLNT_CB_NULL);</div><div class='ctx'> 	clp-&gt;cl_time = ktime_get_boottime_seconds();</div><div class='del'>-	clear_bit(0, &amp;clp-&gt;cl_cb_slot_busy);</div><div class='ctx'> 	copy_verf(clp, verf);</div><div class='ctx'> 	memcpy(&amp;clp-&gt;cl_addr, sa, sizeof(struct sockaddr_storage));</div><div class='ctx'> 	clp-&gt;cl_cb_session = NULL;</div><div class='hunk'>@@ -2772,6 +3300,14 @@ static struct nfs4_client *create_client(struct xdr_netobj name,</div><div class='ctx'> 		free_client(clp);</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	}</div><div class='add'>+	clp-&gt;cl_ra = kzalloc(sizeof(*clp-&gt;cl_ra), GFP_KERNEL);</div><div class='add'>+	if (!clp-&gt;cl_ra) {</div><div class='add'>+		free_client(clp);</div><div class='add'>+		return NULL;</div><div class='add'>+	}</div><div class='add'>+	clp-&gt;cl_ra_time = 0;</div><div class='add'>+	nfsd4_init_cb(&amp;clp-&gt;cl_ra-&gt;ra_cb, clp, &amp;nfsd4_cb_recall_any_ops,</div><div class='add'>+			NFSPROC4_CLNT_CB_RECALL_ANY);</div><div class='ctx'> 	return clp;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -2951,7 +3487,20 @@ nfsd4_store_cache_entry(struct nfsd4_compoundres *resp)</div><div class='ctx'> 	struct nfsd4_slot *slot = resp-&gt;cstate.slot;</div><div class='ctx'> 	unsigned int base;</div><div class='ctx'> </div><div class='del'>-	dprintk("--&gt; %s slot %p\n", __func__, slot);</div><div class='add'>+	/*</div><div class='add'>+	 * RFC 5661 Section 2.10.6.1.2:</div><div class='add'>+	 *</div><div class='add'>+	 * Any time SEQUENCE ... returns an error ... [t]he replier MUST NOT</div><div class='add'>+	 * modify the reply cache entry for the slot whenever an error is</div><div class='add'>+	 * returned from SEQUENCE ...</div><div class='add'>+	 *</div><div class='add'>+	 * Because nfsd4_store_cache_entry is called only by</div><div class='add'>+	 * nfsd4_sequence_done(), nfsd4_store_cache_entry() is called only</div><div class='add'>+	 * when a SEQUENCE operation was part of the COMPOUND.</div><div class='add'>+	 * nfs41_check_op_ordering() ensures SEQUENCE is the first op.</div><div class='add'>+	 */</div><div class='add'>+	if (resp-&gt;opcnt == 1 &amp;&amp; resp-&gt;cstate.status != nfs_ok)</div><div class='add'>+		return;</div><div class='ctx'> </div><div class='ctx'> 	slot-&gt;sl_flags |= NFSD4_SLOT_INITIALIZED;</div><div class='ctx'> 	slot-&gt;sl_opcnt = resp-&gt;opcnt;</div><div class='hunk'>@@ -2959,7 +3508,7 @@ nfsd4_store_cache_entry(struct nfsd4_compoundres *resp)</div><div class='ctx'> 	free_svc_cred(&amp;slot-&gt;sl_cred);</div><div class='ctx'> 	copy_cred(&amp;slot-&gt;sl_cred, &amp;resp-&gt;rqstp-&gt;rq_cred);</div><div class='ctx'> </div><div class='del'>-	if (!nfsd4_cache_this(resp)) {</div><div class='add'>+	if (!(resp-&gt;cstate.slot-&gt;sl_flags &amp; NFSD4_SLOT_CACHETHIS)) {</div><div class='ctx'> 		slot-&gt;sl_flags &amp;= ~NFSD4_SLOT_CACHED;</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2974,41 +3523,6 @@ nfsd4_store_cache_entry(struct nfsd4_compoundres *resp)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Encode the replay sequence operation from the slot values.</div><div class='del'>- * If cachethis is FALSE encode the uncached rep error on the next</div><div class='del'>- * operation which sets resp-&gt;p and increments resp-&gt;opcnt for</div><div class='del'>- * nfs4svc_encode_compoundres.</div><div class='del'>- *</div><div class='del'>- */</div><div class='del'>-static __be32</div><div class='del'>-nfsd4_enc_sequence_replay(struct nfsd4_compoundargs *args,</div><div class='del'>-			  struct nfsd4_compoundres *resp)</div><div class='del'>-{</div><div class='del'>-	struct nfsd4_op *op;</div><div class='del'>-	struct nfsd4_slot *slot = resp-&gt;cstate.slot;</div><div class='del'>-</div><div class='del'>-	/* Encode the replayed sequence operation */</div><div class='del'>-	op = &amp;args-&gt;ops[resp-&gt;opcnt - 1];</div><div class='del'>-	nfsd4_encode_operation(resp, op);</div><div class='del'>-</div><div class='del'>-	if (slot-&gt;sl_flags &amp; NFSD4_SLOT_CACHED)</div><div class='del'>-		return op-&gt;status;</div><div class='del'>-	if (args-&gt;opcnt == 1) {</div><div class='del'>-		/*</div><div class='del'>-		 * The original operation wasn't a solo sequence--we</div><div class='del'>-		 * always cache those--so this retry must not match the</div><div class='del'>-		 * original:</div><div class='del'>-		 */</div><div class='del'>-		op-&gt;status = nfserr_seq_false_retry;</div><div class='del'>-	} else {</div><div class='del'>-		op = &amp;args-&gt;ops[resp-&gt;opcnt++];</div><div class='del'>-		op-&gt;status = nfserr_retry_uncached_rep;</div><div class='del'>-		nfsd4_encode_operation(resp, op);</div><div class='del'>-	}</div><div class='del'>-	return op-&gt;status;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='ctx'>  * The sequence operation is not cached because we can use the slot and</div><div class='ctx'>  * session values.</div><div class='ctx'>  */</div><div class='hunk'>@@ -3016,17 +3530,30 @@ static __be32</div><div class='ctx'> nfsd4_replay_cache_entry(struct nfsd4_compoundres *resp,</div><div class='ctx'> 			 struct nfsd4_sequence *seq)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_compoundargs *args = resp-&gt;rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nfsd4_slot *slot = resp-&gt;cstate.slot;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='ctx'> 	__be32 *p;</div><div class='del'>-	__be32 status;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("--&gt; %s slot %p\n", __func__, slot);</div><div class='ctx'> </div><div class='del'>-	status = nfsd4_enc_sequence_replay(resp-&gt;rqstp-&gt;rq_argp, resp);</div><div class='del'>-	if (status)</div><div class='del'>-		return status;</div><div class='add'>+	/* Always encode the SEQUENCE response. */</div><div class='add'>+	nfsd4_encode_operation(resp, &amp;args-&gt;ops[0]);</div><div class='add'>+	if (args-&gt;opcnt == 1)</div><div class='add'>+		/* A solo SEQUENCE - nothing was cached */</div><div class='add'>+		return args-&gt;ops[0].status;</div><div class='add'>+</div><div class='add'>+	if (!(slot-&gt;sl_flags &amp; NFSD4_SLOT_CACHED)) {</div><div class='add'>+		/* We weren't asked to cache this. */</div><div class='add'>+		struct nfsd4_op *op;</div><div class='ctx'> </div><div class='add'>+		op = &amp;args-&gt;ops[resp-&gt;opcnt++];</div><div class='add'>+		op-&gt;status = nfserr_retry_uncached_rep;</div><div class='add'>+		nfsd4_encode_operation(resp, op);</div><div class='add'>+		return op-&gt;status;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* return reply from cache */</div><div class='ctx'> 	p = xdr_reserve_space(xdr, slot-&gt;sl_datalen);</div><div class='ctx'> 	if (!p) {</div><div class='ctx'> 		WARN_ON_ONCE(1);</div><div class='hunk'>@@ -3077,7 +3604,7 @@ static bool client_has_state(struct nfs4_client *clp)</div><div class='ctx'> #endif</div><div class='ctx'> 		|| !list_empty(&amp;clp-&gt;cl_delegations)</div><div class='ctx'> 		|| !list_empty(&amp;clp-&gt;cl_sessions)</div><div class='del'>-		|| !list_empty(&amp;clp-&gt;async_copies);</div><div class='add'>+		|| nfsd4_has_active_async_copies(clp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32 copy_impl_id(struct nfs4_client *clp,</div><div class='hunk'>@@ -3115,6 +3642,12 @@ nfsd4_exchange_id(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 		__func__, rqstp, exid, exid-&gt;clname.len, exid-&gt;clname.data,</div><div class='ctx'> 		addr_str, exid-&gt;flags, exid-&gt;spa_how);</div><div class='ctx'> </div><div class='add'>+	exid-&gt;server_impl_name = kasprintf(GFP_KERNEL, "%s %s %s %s",</div><div class='add'>+					   utsname()-&gt;sysname, utsname()-&gt;release,</div><div class='add'>+					   utsname()-&gt;version, utsname()-&gt;machine);</div><div class='add'>+	if (!exid-&gt;server_impl_name)</div><div class='add'>+		return nfserr_jukebox;</div><div class='add'>+</div><div class='ctx'> 	if (exid-&gt;flags &amp; ~EXCHGID4_FLAG_MASK_A)</div><div class='ctx'> 		return nfserr_inval;</div><div class='ctx'> </div><div class='hunk'>@@ -3240,6 +3773,9 @@ out_new:</div><div class='ctx'> 	new-&gt;cl_spo_must_allow.u.words[0] = exid-&gt;spo_must_allow[0];</div><div class='ctx'> 	new-&gt;cl_spo_must_allow.u.words[1] = exid-&gt;spo_must_allow[1];</div><div class='ctx'> </div><div class='add'>+	/* Contrived initial CREATE_SESSION response */</div><div class='add'>+	new-&gt;cl_cs_slot.sl_status = nfserr_seq_misordered;</div><div class='add'>+</div><div class='ctx'> 	add_to_unconfirmed(new);</div><div class='ctx'> 	swap(new, conf);</div><div class='ctx'> out_copy:</div><div class='hunk'>@@ -3249,6 +3785,23 @@ out_copy:</div><div class='ctx'> 	exid-&gt;seqid = conf-&gt;cl_cs_slot.sl_seqid + 1;</div><div class='ctx'> 	nfsd4_set_ex_flags(conf, exid);</div><div class='ctx'> </div><div class='add'>+	exid-&gt;nii_domain.len = sizeof("kernel.org") - 1;</div><div class='add'>+	exid-&gt;nii_domain.data = "kernel.org";</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Note that RFC 8881 places no length limit on</div><div class='add'>+	 * nii_name, but this implementation permits no</div><div class='add'>+	 * more than NFS4_OPAQUE_LIMIT bytes.</div><div class='add'>+	 */</div><div class='add'>+	exid-&gt;nii_name.len = strlen(exid-&gt;server_impl_name);</div><div class='add'>+	if (exid-&gt;nii_name.len &gt; NFS4_OPAQUE_LIMIT)</div><div class='add'>+		exid-&gt;nii_name.len = NFS4_OPAQUE_LIMIT;</div><div class='add'>+	exid-&gt;nii_name.data = exid-&gt;server_impl_name;</div><div class='add'>+</div><div class='add'>+	/* just send zeros - the date is in nii_name */</div><div class='add'>+	exid-&gt;nii_time.tv_sec = 0;</div><div class='add'>+	exid-&gt;nii_time.tv_nsec = 0;</div><div class='add'>+</div><div class='ctx'> 	dprintk("nfsd4_exchange_id seqid %d flags %x\n",</div><div class='ctx'> 		conf-&gt;cl_cs_slot.sl_seqid, conf-&gt;cl_exchange_flags);</div><div class='ctx'> 	status = nfs_ok;</div><div class='hunk'>@@ -3265,14 +3818,18 @@ out_nolock:</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static __be32</div><div class='del'>-check_slot_seqid(u32 seqid, u32 slot_seqid, int slot_inuse)</div><div class='add'>+void</div><div class='add'>+nfsd4_exchange_id_release(union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='del'>-	dprintk("%s enter. seqid %d slot_seqid %d\n", __func__, seqid,</div><div class='del'>-		slot_seqid);</div><div class='add'>+	struct nfsd4_exchange_id *exid = &amp;u-&gt;exchange_id;</div><div class='ctx'> </div><div class='add'>+	kfree(exid-&gt;server_impl_name);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 check_slot_seqid(u32 seqid, u32 slot_seqid, u8 flags)</div><div class='add'>+{</div><div class='ctx'> 	/* The slot is in use, and no response has been sent. */</div><div class='del'>-	if (slot_inuse) {</div><div class='add'>+	if (flags &amp; NFSD4_SLOT_INUSE) {</div><div class='ctx'> 		if (seqid == slot_seqid)</div><div class='ctx'> 			return nfserr_jukebox;</div><div class='ctx'> 		else</div><div class='hunk'>@@ -3281,6 +3838,8 @@ check_slot_seqid(u32 seqid, u32 slot_seqid, int slot_inuse)</div><div class='ctx'> 	/* Note unsigned 32-bit arithmetic handles wraparound: */</div><div class='ctx'> 	if (likely(seqid == slot_seqid + 1))</div><div class='ctx'> 		return nfs_ok;</div><div class='add'>+	if ((flags &amp; NFSD4_SLOT_REUSED) &amp;&amp; seqid == 1)</div><div class='add'>+		return nfs_ok;</div><div class='ctx'> 	if (seqid == slot_seqid)</div><div class='ctx'> 		return nfserr_replay_cache;</div><div class='ctx'> 	return nfserr_seq_misordered;</div><div class='hunk'>@@ -3339,17 +3898,6 @@ static __be32 check_forechannel_attrs(struct nfsd4_channel_attrs *ca, struct nfs</div><div class='ctx'> 	ca-&gt;maxresp_cached = min_t(u32, ca-&gt;maxresp_cached,</div><div class='ctx'> 			NFSD_SLOT_CACHE_SIZE + NFSD_MIN_HDR_SEQ_SZ);</div><div class='ctx'> 	ca-&gt;maxreqs = min_t(u32, ca-&gt;maxreqs, NFSD_MAX_SLOTS_PER_SESSION);</div><div class='del'>-	/*</div><div class='del'>-	 * Note decreasing slot size below client's request may make it</div><div class='del'>-	 * difficult for client to function correctly, whereas</div><div class='del'>-	 * decreasing the number of slots will (just?) affect</div><div class='del'>-	 * performance.  When short on memory we therefore prefer to</div><div class='del'>-	 * decrease number of slots instead of their size.  Clients that</div><div class='del'>-	 * request larger slots than they need will get poor results:</div><div class='del'>-	 * Note that we always allow at least one slot, because our</div><div class='del'>-	 * accounting is soft and provides no guarantees either way.</div><div class='del'>-	 */</div><div class='del'>-	ca-&gt;maxreqs = nfsd4_get_drc_mem(ca, nn);</div><div class='ctx'> </div><div class='ctx'> 	return nfs_ok;</div><div class='ctx'> }</div><div class='hunk'>@@ -3410,10 +3958,10 @@ nfsd4_create_session(struct svc_rqst *rqstp,</div><div class='ctx'> 	struct nfsd4_create_session *cr_ses = &amp;u-&gt;create_session;</div><div class='ctx'> 	struct sockaddr *sa = svc_addr(rqstp);</div><div class='ctx'> 	struct nfs4_client *conf, *unconf;</div><div class='add'>+	struct nfsd4_clid_slot *cs_slot;</div><div class='ctx'> 	struct nfs4_client *old = NULL;</div><div class='ctx'> 	struct nfsd4_session *new;</div><div class='ctx'> 	struct nfsd4_conn *conn;</div><div class='del'>-	struct nfsd4_clid_slot *cs_slot = NULL;</div><div class='ctx'> 	__be32 status = 0;</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(SVC_NET(rqstp), nfsd_net_id);</div><div class='ctx'> </div><div class='hunk'>@@ -3427,76 +3975,89 @@ nfsd4_create_session(struct svc_rqst *rqstp,</div><div class='ctx'> 		return status;</div><div class='ctx'> 	status = check_backchannel_attrs(&amp;cr_ses-&gt;back_channel);</div><div class='ctx'> 	if (status)</div><div class='del'>-		goto out_release_drc_mem;</div><div class='add'>+		goto out_err;</div><div class='ctx'> 	status = nfserr_jukebox;</div><div class='ctx'> 	new = alloc_session(&amp;cr_ses-&gt;fore_channel, &amp;cr_ses-&gt;back_channel);</div><div class='ctx'> 	if (!new)</div><div class='del'>-		goto out_release_drc_mem;</div><div class='add'>+		goto out_err;</div><div class='ctx'> 	conn = alloc_conn_from_crses(rqstp, cr_ses);</div><div class='ctx'> 	if (!conn)</div><div class='ctx'> 		goto out_free_session;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;nn-&gt;client_lock);</div><div class='add'>+</div><div class='add'>+	/* RFC 8881 Section 18.36.4 Phase 1: Client record look-up. */</div><div class='ctx'> 	unconf = find_unconfirmed_client(&amp;cr_ses-&gt;clientid, true, nn);</div><div class='ctx'> 	conf = find_confirmed_client(&amp;cr_ses-&gt;clientid, true, nn);</div><div class='del'>-	WARN_ON_ONCE(conf &amp;&amp; unconf);</div><div class='add'>+	if (!conf &amp;&amp; !unconf) {</div><div class='add'>+		status = nfserr_stale_clientid;</div><div class='add'>+		goto out_free_conn;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='add'>+	/* RFC 8881 Section 18.36.4 Phase 2: Sequence ID processing. */</div><div class='add'>+	if (conf) {</div><div class='add'>+		cs_slot = &amp;conf-&gt;cl_cs_slot;</div><div class='add'>+		trace_nfsd_slot_seqid_conf(conf, cr_ses);</div><div class='add'>+	} else {</div><div class='add'>+		cs_slot = &amp;unconf-&gt;cl_cs_slot;</div><div class='add'>+		trace_nfsd_slot_seqid_unconf(unconf, cr_ses);</div><div class='add'>+	}</div><div class='add'>+	status = check_slot_seqid(cr_ses-&gt;seqid, cs_slot-&gt;sl_seqid, 0);</div><div class='add'>+	switch (status) {</div><div class='add'>+	case nfs_ok:</div><div class='add'>+		cs_slot-&gt;sl_seqid++;</div><div class='add'>+		cr_ses-&gt;seqid = cs_slot-&gt;sl_seqid;</div><div class='add'>+		break;</div><div class='add'>+	case nfserr_replay_cache:</div><div class='add'>+		status = nfsd4_replay_create_session(cr_ses, cs_slot);</div><div class='add'>+		fallthrough;</div><div class='add'>+	case nfserr_jukebox:</div><div class='add'>+		/* The server MUST NOT cache NFS4ERR_DELAY */</div><div class='add'>+		goto out_free_conn;</div><div class='add'>+	default:</div><div class='add'>+		goto out_cache_error;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* RFC 8881 Section 18.36.4 Phase 3: Client ID confirmation. */</div><div class='ctx'> 	if (conf) {</div><div class='ctx'> 		status = nfserr_wrong_cred;</div><div class='ctx'> 		if (!nfsd4_mach_creds_match(conf, rqstp))</div><div class='del'>-			goto out_free_conn;</div><div class='del'>-		cs_slot = &amp;conf-&gt;cl_cs_slot;</div><div class='del'>-		status = check_slot_seqid(cr_ses-&gt;seqid, cs_slot-&gt;sl_seqid, 0);</div><div class='del'>-		if (status) {</div><div class='del'>-			if (status == nfserr_replay_cache)</div><div class='del'>-				status = nfsd4_replay_create_session(cr_ses, cs_slot);</div><div class='del'>-			goto out_free_conn;</div><div class='del'>-		}</div><div class='del'>-	} else if (unconf) {</div><div class='add'>+			goto out_cache_error;</div><div class='add'>+	} else {</div><div class='ctx'> 		status = nfserr_clid_inuse;</div><div class='ctx'> 		if (!same_creds(&amp;unconf-&gt;cl_cred, &amp;rqstp-&gt;rq_cred) ||</div><div class='ctx'> 		    !rpc_cmp_addr(sa, (struct sockaddr *) &amp;unconf-&gt;cl_addr)) {</div><div class='ctx'> 			trace_nfsd_clid_cred_mismatch(unconf, rqstp);</div><div class='del'>-			goto out_free_conn;</div><div class='add'>+			goto out_cache_error;</div><div class='ctx'> 		}</div><div class='ctx'> 		status = nfserr_wrong_cred;</div><div class='ctx'> 		if (!nfsd4_mach_creds_match(unconf, rqstp))</div><div class='del'>-			goto out_free_conn;</div><div class='del'>-		cs_slot = &amp;unconf-&gt;cl_cs_slot;</div><div class='del'>-		status = check_slot_seqid(cr_ses-&gt;seqid, cs_slot-&gt;sl_seqid, 0);</div><div class='del'>-		if (status) {</div><div class='del'>-			/* an unconfirmed replay returns misordered */</div><div class='del'>-			status = nfserr_seq_misordered;</div><div class='del'>-			goto out_free_conn;</div><div class='del'>-		}</div><div class='add'>+			goto out_cache_error;</div><div class='ctx'> 		old = find_confirmed_client_by_name(&amp;unconf-&gt;cl_name, nn);</div><div class='ctx'> 		if (old) {</div><div class='ctx'> 			status = mark_client_expired_locked(old);</div><div class='del'>-			if (status) {</div><div class='del'>-				old = NULL;</div><div class='del'>-				goto out_free_conn;</div><div class='del'>-			}</div><div class='add'>+			if (status)</div><div class='add'>+				goto out_expired_error;</div><div class='ctx'> 			trace_nfsd_clid_replaced(&amp;old-&gt;cl_clientid);</div><div class='ctx'> 		}</div><div class='ctx'> 		move_to_confirmed(unconf);</div><div class='ctx'> 		conf = unconf;</div><div class='del'>-	} else {</div><div class='del'>-		status = nfserr_stale_clientid;</div><div class='del'>-		goto out_free_conn;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	/* RFC 8881 Section 18.36.4 Phase 4: Session creation. */</div><div class='ctx'> 	status = nfs_ok;</div><div class='ctx'> 	/* Persistent sessions are not supported */</div><div class='ctx'> 	cr_ses-&gt;flags &amp;= ~SESSION4_PERSIST;</div><div class='ctx'> 	/* Upshifting from TCP to RDMA is not supported */</div><div class='ctx'> 	cr_ses-&gt;flags &amp;= ~SESSION4_RDMA;</div><div class='add'>+	/* Report the correct number of backchannel slots */</div><div class='add'>+	cr_ses-&gt;back_channel.maxreqs = new-&gt;se_cb_highest_slot + 1;</div><div class='ctx'> </div><div class='ctx'> 	init_session(rqstp, new, conf, cr_ses);</div><div class='ctx'> 	nfsd4_get_session_locked(new);</div><div class='ctx'> </div><div class='ctx'> 	memcpy(cr_ses-&gt;sessionid.data, new-&gt;se_sessionid.data,</div><div class='ctx'> 	       NFS4_MAX_SESSIONID_LEN);</div><div class='del'>-	cs_slot-&gt;sl_seqid++;</div><div class='del'>-	cr_ses-&gt;seqid = cs_slot-&gt;sl_seqid;</div><div class='ctx'> </div><div class='ctx'> 	/* cache solo and embedded create sessions under the client_lock */</div><div class='ctx'> 	nfsd4_cache_create_session(cr_ses, cs_slot, status);</div><div class='hunk'>@@ -3509,15 +4070,25 @@ nfsd4_create_session(struct svc_rqst *rqstp,</div><div class='ctx'> 	if (old)</div><div class='ctx'> 		expire_client(old);</div><div class='ctx'> 	return status;</div><div class='add'>+</div><div class='add'>+out_expired_error:</div><div class='add'>+	/*</div><div class='add'>+	 * Revert the slot seq_nr change so the server will process</div><div class='add'>+	 * the client's resend instead of returning a cached response.</div><div class='add'>+	 */</div><div class='add'>+	if (status == nfserr_jukebox) {</div><div class='add'>+		cs_slot-&gt;sl_seqid--;</div><div class='add'>+		cr_ses-&gt;seqid = cs_slot-&gt;sl_seqid;</div><div class='add'>+		goto out_free_conn;</div><div class='add'>+	}</div><div class='add'>+out_cache_error:</div><div class='add'>+	nfsd4_cache_create_session(cr_ses, cs_slot, status);</div><div class='ctx'> out_free_conn:</div><div class='ctx'> 	spin_unlock(&amp;nn-&gt;client_lock);</div><div class='ctx'> 	free_conn(conn);</div><div class='del'>-	if (old)</div><div class='del'>-		expire_client(old);</div><div class='ctx'> out_free_session:</div><div class='ctx'> 	__free_session(new);</div><div class='del'>-out_release_drc_mem:</div><div class='del'>-	nfsd4_put_drc_mem(&amp;cr_ses-&gt;fore_channel);</div><div class='add'>+out_err:</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -3770,6 +4341,36 @@ static bool replay_matches_cache(struct svc_rqst *rqstp,</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Note that the response is constructed here both for the case</div><div class='add'>+ * of a new SEQUENCE request and for a replayed SEQUENCE request.</div><div class='add'>+ * We do not cache SEQUENCE responses as SEQUENCE is idempotent.</div><div class='add'>+ */</div><div class='add'>+static void nfsd4_construct_sequence_response(struct nfsd4_session *session,</div><div class='add'>+					      struct nfsd4_sequence *seq)</div><div class='add'>+{</div><div class='add'>+	struct nfs4_client *clp = session-&gt;se_client;</div><div class='add'>+</div><div class='add'>+	seq-&gt;maxslots_response = max(session-&gt;se_target_maxslots,</div><div class='add'>+				     seq-&gt;maxslots);</div><div class='add'>+	seq-&gt;target_maxslots = session-&gt;se_target_maxslots;</div><div class='add'>+</div><div class='add'>+	switch (clp-&gt;cl_cb_state) {</div><div class='add'>+	case NFSD4_CB_DOWN:</div><div class='add'>+		seq-&gt;status_flags = SEQ4_STATUS_CB_PATH_DOWN;</div><div class='add'>+		break;</div><div class='add'>+	case NFSD4_CB_FAULT:</div><div class='add'>+		seq-&gt;status_flags = SEQ4_STATUS_BACKCHANNEL_FAULT;</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		seq-&gt;status_flags = 0;</div><div class='add'>+	}</div><div class='add'>+	if (!list_empty(&amp;clp-&gt;cl_revoked))</div><div class='add'>+		seq-&gt;status_flags |= SEQ4_STATUS_RECALLABLE_STATE_REVOKED;</div><div class='add'>+	if (atomic_read(&amp;clp-&gt;cl_admin_revoked))</div><div class='add'>+		seq-&gt;status_flags |= SEQ4_STATUS_ADMIN_STATE_REVOKED;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> __be32</div><div class='ctx'> nfsd4_sequence(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 		union nfsd4_op_u *u)</div><div class='hunk'>@@ -3815,16 +4416,14 @@ nfsd4_sequence(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	if (seq-&gt;slotid &gt;= session-&gt;se_fchannel.maxreqs)</div><div class='ctx'> 		goto out_put_session;</div><div class='ctx'> </div><div class='del'>-	slot = session-&gt;se_slots[seq-&gt;slotid];</div><div class='add'>+	slot = xa_load(&amp;session-&gt;se_slots, seq-&gt;slotid);</div><div class='ctx'> 	dprintk("%s: slotid %d\n", __func__, seq-&gt;slotid);</div><div class='ctx'> </div><div class='del'>-	/* We do not negotiate the number of slots yet, so set the</div><div class='del'>-	 * maxslots to the session maxreqs which is used to encode</div><div class='del'>-	 * sr_highest_slotid and the sr_target_slot id to maxslots */</div><div class='del'>-	seq-&gt;maxslots = session-&gt;se_fchannel.maxreqs;</div><div class='add'>+	trace_nfsd_slot_seqid_sequence(clp, seq, slot);</div><div class='ctx'> </div><div class='del'>-	status = check_slot_seqid(seq-&gt;seqid, slot-&gt;sl_seqid,</div><div class='del'>-					slot-&gt;sl_flags &amp; NFSD4_SLOT_INUSE);</div><div class='add'>+	nfsd4_construct_sequence_response(session, seq);</div><div class='add'>+</div><div class='add'>+	status = check_slot_seqid(seq-&gt;seqid, slot-&gt;sl_seqid, slot-&gt;sl_flags);</div><div class='ctx'> 	if (status == nfserr_replay_cache) {</div><div class='ctx'> 		status = nfserr_seq_misordered;</div><div class='ctx'> 		if (!(slot-&gt;sl_flags &amp; NFSD4_SLOT_INITIALIZED))</div><div class='hunk'>@@ -3849,6 +4448,12 @@ nfsd4_sequence(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		goto out_put_session;</div><div class='ctx'> </div><div class='add'>+	if (session-&gt;se_target_maxslots &lt; session-&gt;se_fchannel.maxreqs &amp;&amp;</div><div class='add'>+	    slot-&gt;sl_generation == session-&gt;se_slot_gen &amp;&amp;</div><div class='add'>+	    seq-&gt;maxslots &lt;= session-&gt;se_target_maxslots)</div><div class='add'>+		/* Client acknowledged our reduce maxreqs */</div><div class='add'>+		free_session_slots(session, session-&gt;se_target_maxslots);</div><div class='add'>+</div><div class='ctx'> 	buflen = (seq-&gt;cachethis) ?</div><div class='ctx'> 			session-&gt;se_fchannel.maxresp_cached :</div><div class='ctx'> 			session-&gt;se_fchannel.maxresp_sz;</div><div class='hunk'>@@ -3856,12 +4461,14 @@ nfsd4_sequence(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 				    nfserr_rep_too_big;</div><div class='ctx'> 	if (xdr_restrict_buflen(xdr, buflen - rqstp-&gt;rq_auth_slack))</div><div class='ctx'> 		goto out_put_session;</div><div class='del'>-	svc_reserve(rqstp, buflen);</div><div class='add'>+	svc_reserve_auth(rqstp, buflen);</div><div class='ctx'> </div><div class='ctx'> 	status = nfs_ok;</div><div class='del'>-	/* Success! bump slot seqid */</div><div class='add'>+	/* Success! accept new slot seqid */</div><div class='ctx'> 	slot-&gt;sl_seqid = seq-&gt;seqid;</div><div class='add'>+	slot-&gt;sl_flags &amp;= ~NFSD4_SLOT_REUSED;</div><div class='ctx'> 	slot-&gt;sl_flags |= NFSD4_SLOT_INUSE;</div><div class='add'>+	slot-&gt;sl_generation = session-&gt;se_slot_gen;</div><div class='ctx'> 	if (seq-&gt;cachethis)</div><div class='ctx'> 		slot-&gt;sl_flags |= NFSD4_SLOT_CACHETHIS;</div><div class='ctx'> 	else</div><div class='hunk'>@@ -3871,19 +4478,49 @@ nfsd4_sequence(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	cstate-&gt;session = session;</div><div class='ctx'> 	cstate-&gt;clp = clp;</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	switch (clp-&gt;cl_cb_state) {</div><div class='del'>-	case NFSD4_CB_DOWN:</div><div class='del'>-		seq-&gt;status_flags = SEQ4_STATUS_CB_PATH_DOWN;</div><div class='del'>-		break;</div><div class='del'>-	case NFSD4_CB_FAULT:</div><div class='del'>-		seq-&gt;status_flags = SEQ4_STATUS_BACKCHANNEL_FAULT;</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		seq-&gt;status_flags = 0;</div><div class='add'>+	/*</div><div class='add'>+	 * If the client ever uses the highest available slot,</div><div class='add'>+	 * gently try to allocate another 20%.  This allows</div><div class='add'>+	 * fairly quick growth without grossly over-shooting what</div><div class='add'>+	 * the client might use.</div><div class='add'>+	 */</div><div class='add'>+	if (seq-&gt;slotid == session-&gt;se_fchannel.maxreqs - 1 &amp;&amp;</div><div class='add'>+	    session-&gt;se_target_maxslots &gt;= session-&gt;se_fchannel.maxreqs &amp;&amp;</div><div class='add'>+	    session-&gt;se_fchannel.maxreqs &lt; NFSD_MAX_SLOTS_PER_SESSION) {</div><div class='add'>+		int s = session-&gt;se_fchannel.maxreqs;</div><div class='add'>+		int cnt = DIV_ROUND_UP(s, 5);</div><div class='add'>+		void *prev_slot;</div><div class='add'>+</div><div class='add'>+		do {</div><div class='add'>+			/*</div><div class='add'>+			 * GFP_NOWAIT both allows allocation under a</div><div class='add'>+			 * spinlock, and only succeeds if there is</div><div class='add'>+			 * plenty of memory.</div><div class='add'>+			 */</div><div class='add'>+			slot = nfsd4_alloc_slot(&amp;session-&gt;se_fchannel, s,</div><div class='add'>+						GFP_NOWAIT);</div><div class='add'>+			prev_slot = xa_load(&amp;session-&gt;se_slots, s);</div><div class='add'>+			if (xa_is_value(prev_slot) &amp;&amp; slot) {</div><div class='add'>+				slot-&gt;sl_seqid = xa_to_value(prev_slot);</div><div class='add'>+				slot-&gt;sl_flags |= NFSD4_SLOT_REUSED;</div><div class='add'>+			}</div><div class='add'>+			if (slot &amp;&amp;</div><div class='add'>+			    !xa_is_err(xa_store(&amp;session-&gt;se_slots, s, slot,</div><div class='add'>+						GFP_NOWAIT))) {</div><div class='add'>+				s += 1;</div><div class='add'>+				session-&gt;se_fchannel.maxreqs = s;</div><div class='add'>+				atomic_add(s - session-&gt;se_target_maxslots,</div><div class='add'>+					   &amp;nfsd_total_target_slots);</div><div class='add'>+				session-&gt;se_target_maxslots = s;</div><div class='add'>+			} else {</div><div class='add'>+				kfree(slot);</div><div class='add'>+				slot = NULL;</div><div class='add'>+			}</div><div class='add'>+		} while (slot &amp;&amp; --cnt &gt; 0);</div><div class='ctx'> 	}</div><div class='del'>-	if (!list_empty(&amp;clp-&gt;cl_revoked))</div><div class='del'>-		seq-&gt;status_flags |= SEQ4_STATUS_RECALLABLE_STATE_REVOKED;</div><div class='add'>+</div><div class='add'>+out:</div><div class='add'>+	trace_nfsd_seq4_status(rqstp, seq);</div><div class='ctx'> out_no_session:</div><div class='ctx'> 	if (conn)</div><div class='ctx'> 		free_conn(conn);</div><div class='hunk'>@@ -4098,17 +4735,25 @@ nfsd4_setclientid_confirm(struct svc_rqst *rqstp,</div><div class='ctx'> 	}</div><div class='ctx'> 	status = nfs_ok;</div><div class='ctx'> 	if (conf) {</div><div class='del'>-		old = unconf;</div><div class='del'>-		unhash_client_locked(old);</div><div class='del'>-		nfsd4_change_callback(conf, &amp;unconf-&gt;cl_cb_conn);</div><div class='del'>-	} else {</div><div class='add'>+		if (get_client_locked(conf) == nfs_ok) {</div><div class='add'>+			old = unconf;</div><div class='add'>+			unhash_client_locked(old);</div><div class='add'>+			nfsd4_change_callback(conf, &amp;unconf-&gt;cl_cb_conn);</div><div class='add'>+		} else {</div><div class='add'>+			conf = NULL;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!conf) {</div><div class='ctx'> 		old = find_confirmed_client_by_name(&amp;unconf-&gt;cl_name, nn);</div><div class='ctx'> 		if (old) {</div><div class='ctx'> 			status = nfserr_clid_inuse;</div><div class='ctx'> 			if (client_has_state(old)</div><div class='ctx'> 					&amp;&amp; !same_creds(&amp;unconf-&gt;cl_cred,</div><div class='del'>-							&amp;old-&gt;cl_cred))</div><div class='add'>+							&amp;old-&gt;cl_cred)) {</div><div class='add'>+				old = NULL;</div><div class='ctx'> 				goto out;</div><div class='add'>+			}</div><div class='ctx'> 			status = mark_client_expired_locked(old);</div><div class='ctx'> 			if (status) {</div><div class='ctx'> 				old = NULL;</div><div class='hunk'>@@ -4116,10 +4761,14 @@ nfsd4_setclientid_confirm(struct svc_rqst *rqstp,</div><div class='ctx'> 			}</div><div class='ctx'> 			trace_nfsd_clid_replaced(&amp;old-&gt;cl_clientid);</div><div class='ctx'> 		}</div><div class='add'>+		status = get_client_locked(unconf);</div><div class='add'>+		if (status != nfs_ok) {</div><div class='add'>+			old = NULL;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> 		move_to_confirmed(unconf);</div><div class='ctx'> 		conf = unconf;</div><div class='ctx'> 	}</div><div class='del'>-	get_client_locked(conf);</div><div class='ctx'> 	spin_unlock(&amp;nn-&gt;client_lock);</div><div class='ctx'> 	if (conf == unconf)</div><div class='ctx'> 		fsnotify_dentry(conf-&gt;cl_nfsd_info_dentry, FS_MODIFY);</div><div class='hunk'>@@ -4139,11 +4788,9 @@ static struct nfs4_file *nfsd4_alloc_file(void)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* OPEN Share state helper functions */</div><div class='del'>-static void nfsd4_init_file(struct svc_fh *fh, unsigned int hashval,</div><div class='del'>-				struct nfs4_file *fp)</div><div class='del'>-{</div><div class='del'>-	lockdep_assert_held(&amp;state_lock);</div><div class='ctx'> </div><div class='add'>+static void nfsd4_file_init(const struct svc_fh *fh, struct nfs4_file *fp)</div><div class='add'>+{</div><div class='ctx'> 	refcount_set(&amp;fp-&gt;fi_ref, 1);</div><div class='ctx'> 	spin_lock_init(&amp;fp-&gt;fi_lock);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;fp-&gt;fi_stateids);</div><div class='hunk'>@@ -4151,6 +4798,7 @@ static void nfsd4_init_file(struct svc_fh *fh, unsigned int hashval,</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;fp-&gt;fi_clnt_odstate);</div><div class='ctx'> 	fh_copy_shallow(&amp;fp-&gt;fi_fhandle, &amp;fh-&gt;fh_handle);</div><div class='ctx'> 	fp-&gt;fi_deleg_file = NULL;</div><div class='add'>+	fp-&gt;fi_rdeleg_file = NULL;</div><div class='ctx'> 	fp-&gt;fi_had_conflict = false;</div><div class='ctx'> 	fp-&gt;fi_share_deny = 0;</div><div class='ctx'> 	memset(fp-&gt;fi_fds, 0, sizeof(fp-&gt;fi_fds));</div><div class='hunk'>@@ -4161,7 +4809,6 @@ static void nfsd4_init_file(struct svc_fh *fh, unsigned int hashval,</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;fp-&gt;fi_lo_states);</div><div class='ctx'> 	atomic_set(&amp;fp-&gt;fi_lo_recalls, 0);</div><div class='ctx'> #endif</div><div class='del'>-	hlist_add_head_rcu(&amp;fp-&gt;fi_hash, &amp;file_hashtbl[hashval]);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void</div><div class='hunk'>@@ -4179,32 +4826,25 @@ nfsd4_free_slabs(void)</div><div class='ctx'> int</div><div class='ctx'> nfsd4_init_slabs(void)</div><div class='ctx'> {</div><div class='del'>-	client_slab = kmem_cache_create("nfsd4_clients",</div><div class='del'>-			sizeof(struct nfs4_client), 0, 0, NULL);</div><div class='add'>+	client_slab = KMEM_CACHE(nfs4_client, 0);</div><div class='ctx'> 	if (client_slab == NULL)</div><div class='ctx'> 		goto out;</div><div class='del'>-	openowner_slab = kmem_cache_create("nfsd4_openowners",</div><div class='del'>-			sizeof(struct nfs4_openowner), 0, 0, NULL);</div><div class='add'>+	openowner_slab = KMEM_CACHE(nfs4_openowner, 0);</div><div class='ctx'> 	if (openowner_slab == NULL)</div><div class='ctx'> 		goto out_free_client_slab;</div><div class='del'>-	lockowner_slab = kmem_cache_create("nfsd4_lockowners",</div><div class='del'>-			sizeof(struct nfs4_lockowner), 0, 0, NULL);</div><div class='add'>+	lockowner_slab = KMEM_CACHE(nfs4_lockowner, 0);</div><div class='ctx'> 	if (lockowner_slab == NULL)</div><div class='ctx'> 		goto out_free_openowner_slab;</div><div class='del'>-	file_slab = kmem_cache_create("nfsd4_files",</div><div class='del'>-			sizeof(struct nfs4_file), 0, 0, NULL);</div><div class='add'>+	file_slab = KMEM_CACHE(nfs4_file, 0);</div><div class='ctx'> 	if (file_slab == NULL)</div><div class='ctx'> 		goto out_free_lockowner_slab;</div><div class='del'>-	stateid_slab = kmem_cache_create("nfsd4_stateids",</div><div class='del'>-			sizeof(struct nfs4_ol_stateid), 0, 0, NULL);</div><div class='add'>+	stateid_slab = KMEM_CACHE(nfs4_ol_stateid, 0);</div><div class='ctx'> 	if (stateid_slab == NULL)</div><div class='ctx'> 		goto out_free_file_slab;</div><div class='del'>-	deleg_slab = kmem_cache_create("nfsd4_delegations",</div><div class='del'>-			sizeof(struct nfs4_delegation), 0, 0, NULL);</div><div class='add'>+	deleg_slab = KMEM_CACHE(nfs4_delegation, 0);</div><div class='ctx'> 	if (deleg_slab == NULL)</div><div class='ctx'> 		goto out_free_stateid_slab;</div><div class='del'>-	odstate_slab = kmem_cache_create("nfsd4_odstate",</div><div class='del'>-			sizeof(struct nfs4_clnt_odstate), 0, 0, NULL);</div><div class='add'>+	odstate_slab = KMEM_CACHE(nfs4_clnt_odstate, 0);</div><div class='ctx'> 	if (odstate_slab == NULL)</div><div class='ctx'> 		goto out_free_deleg_slab;</div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -4225,21 +4865,76 @@ out:</div><div class='ctx'> 	return -ENOMEM;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static unsigned long</div><div class='add'>+nfsd4_state_shrinker_count(struct shrinker *shrink, struct shrink_control *sc)</div><div class='add'>+{</div><div class='add'>+	struct nfsd_net *nn = shrink-&gt;private_data;</div><div class='add'>+	long count;</div><div class='add'>+</div><div class='add'>+	count = atomic_read(&amp;nn-&gt;nfsd_courtesy_clients);</div><div class='add'>+	if (!count)</div><div class='add'>+		count = atomic_long_read(&amp;num_delegations);</div><div class='add'>+	if (count)</div><div class='add'>+		queue_work(laundry_wq, &amp;nn-&gt;nfsd_shrinker_work);</div><div class='add'>+	return (unsigned long)count;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static unsigned long</div><div class='add'>+nfsd4_state_shrinker_scan(struct shrinker *shrink, struct shrink_control *sc)</div><div class='add'>+{</div><div class='add'>+	return SHRINK_STOP;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void</div><div class='add'>+nfsd4_init_leases_net(struct nfsd_net *nn)</div><div class='add'>+{</div><div class='add'>+	struct sysinfo si;</div><div class='add'>+	u64 max_clients;</div><div class='add'>+</div><div class='add'>+	nn-&gt;nfsd4_lease = 90;	/* default lease time */</div><div class='add'>+	nn-&gt;nfsd4_grace = 90;</div><div class='add'>+	nn-&gt;somebody_reclaimed = false;</div><div class='add'>+	nn-&gt;track_reclaim_completes = false;</div><div class='add'>+	nn-&gt;clverifier_counter = get_random_u32();</div><div class='add'>+	nn-&gt;clientid_base = get_random_u32();</div><div class='add'>+	nn-&gt;clientid_counter = nn-&gt;clientid_base + 1;</div><div class='add'>+	nn-&gt;s2s_cp_cl_id = nn-&gt;clientid_counter++;</div><div class='add'>+</div><div class='add'>+	atomic_set(&amp;nn-&gt;nfs4_client_count, 0);</div><div class='add'>+	si_meminfo(&amp;si);</div><div class='add'>+	max_clients = (u64)si.totalram * si.mem_unit / (1024 * 1024 * 1024);</div><div class='add'>+	max_clients *= NFS4_CLIENTS_PER_GB;</div><div class='add'>+	nn-&gt;nfs4_max_clients = max_t(int, max_clients, NFS4_CLIENTS_PER_GB);</div><div class='add'>+</div><div class='add'>+	atomic_set(&amp;nn-&gt;nfsd_courtesy_clients, 0);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+enum rp_lock {</div><div class='add'>+	RP_UNLOCKED,</div><div class='add'>+	RP_LOCKED,</div><div class='add'>+	RP_UNHASHED,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> static void init_nfs4_replay(struct nfs4_replay *rp)</div><div class='ctx'> {</div><div class='ctx'> 	rp-&gt;rp_status = nfserr_serverfault;</div><div class='ctx'> 	rp-&gt;rp_buflen = 0;</div><div class='ctx'> 	rp-&gt;rp_buf = rp-&gt;rp_ibuf;</div><div class='del'>-	mutex_init(&amp;rp-&gt;rp_mutex);</div><div class='add'>+	rp-&gt;rp_locked = RP_UNLOCKED;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void nfsd4_cstate_assign_replay(struct nfsd4_compound_state *cstate,</div><div class='del'>-		struct nfs4_stateowner *so)</div><div class='add'>+static int nfsd4_cstate_assign_replay(struct nfsd4_compound_state *cstate,</div><div class='add'>+				      struct nfs4_stateowner *so)</div><div class='ctx'> {</div><div class='ctx'> 	if (!nfsd4_has_session(cstate)) {</div><div class='del'>-		mutex_lock(&amp;so-&gt;so_replay.rp_mutex);</div><div class='add'>+		wait_var_event(&amp;so-&gt;so_replay.rp_locked,</div><div class='add'>+			       cmpxchg(&amp;so-&gt;so_replay.rp_locked,</div><div class='add'>+				       RP_UNLOCKED, RP_LOCKED) != RP_LOCKED);</div><div class='add'>+		if (so-&gt;so_replay.rp_locked == RP_UNHASHED)</div><div class='add'>+			return -EAGAIN;</div><div class='ctx'> 		cstate-&gt;replay_owner = nfs4_get_stateowner(so);</div><div class='ctx'> 	}</div><div class='add'>+	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void nfsd4_cstate_clear_replay(struct nfsd4_compound_state *cstate)</div><div class='hunk'>@@ -4248,7 +4943,7 @@ void nfsd4_cstate_clear_replay(struct nfsd4_compound_state *cstate)</div><div class='ctx'> </div><div class='ctx'> 	if (so != NULL) {</div><div class='ctx'> 		cstate-&gt;replay_owner = NULL;</div><div class='del'>-		mutex_unlock(&amp;so-&gt;so_replay.rp_mutex);</div><div class='add'>+		store_release_wake_up(&amp;so-&gt;so_replay.rp_locked, RP_UNLOCKED);</div><div class='ctx'> 		nfs4_put_stateowner(so);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='hunk'>@@ -4314,7 +5009,8 @@ nfsd4_find_existing_open(struct nfs4_file *fp, struct nfsd4_open *open)</div><div class='ctx'> 			continue;</div><div class='ctx'> 		if (local-&gt;st_stateowner != &amp;oo-&gt;oo_owner)</div><div class='ctx'> 			continue;</div><div class='del'>-		if (local-&gt;st_stid.sc_type == NFS4_OPEN_STID) {</div><div class='add'>+		if (local-&gt;st_stid.sc_type == SC_TYPE_OPEN &amp;&amp;</div><div class='add'>+		    !local-&gt;st_stid.sc_status) {</div><div class='ctx'> 			ret = local;</div><div class='ctx'> 			refcount_inc(&amp;ret-&gt;st_stid.sc_count);</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -4323,22 +5019,75 @@ nfsd4_find_existing_open(struct nfs4_file *fp, struct nfsd4_open *open)</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static __be32</div><div class='del'>-nfsd4_verify_open_stid(struct nfs4_stid *s)</div><div class='add'>+static void nfsd4_drop_revoked_stid(struct nfs4_stid *s)</div><div class='add'>+	__releases(&amp;s-&gt;sc_client-&gt;cl_lock)</div><div class='ctx'> {</div><div class='del'>-	__be32 ret = nfs_ok;</div><div class='add'>+	struct nfs4_client *cl = s-&gt;sc_client;</div><div class='add'>+	LIST_HEAD(reaplist);</div><div class='add'>+	struct nfs4_ol_stateid *stp;</div><div class='add'>+	struct nfs4_delegation *dp;</div><div class='add'>+	bool unhashed;</div><div class='ctx'> </div><div class='ctx'> 	switch (s-&gt;sc_type) {</div><div class='del'>-	default:</div><div class='add'>+	case SC_TYPE_OPEN:</div><div class='add'>+		stp = openlockstateid(s);</div><div class='add'>+		if (unhash_open_stateid(stp, &amp;reaplist))</div><div class='add'>+			put_ol_stateid_locked(stp, &amp;reaplist);</div><div class='add'>+		spin_unlock(&amp;cl-&gt;cl_lock);</div><div class='add'>+		free_ol_stateid_reaplist(&amp;reaplist);</div><div class='ctx'> 		break;</div><div class='del'>-	case 0:</div><div class='del'>-	case NFS4_CLOSED_STID:</div><div class='del'>-	case NFS4_CLOSED_DELEG_STID:</div><div class='del'>-		ret = nfserr_bad_stateid;</div><div class='add'>+	case SC_TYPE_LOCK:</div><div class='add'>+		stp = openlockstateid(s);</div><div class='add'>+		unhashed = unhash_lock_stateid(stp);</div><div class='add'>+		spin_unlock(&amp;cl-&gt;cl_lock);</div><div class='add'>+		if (unhashed)</div><div class='add'>+			nfs4_put_stid(s);</div><div class='ctx'> 		break;</div><div class='del'>-	case NFS4_REVOKED_DELEG_STID:</div><div class='del'>-		ret = nfserr_deleg_revoked;</div><div class='add'>+	case SC_TYPE_DELEG:</div><div class='add'>+		dp = delegstateid(s);</div><div class='add'>+		list_del_init(&amp;dp-&gt;dl_recall_lru);</div><div class='add'>+		spin_unlock(&amp;cl-&gt;cl_lock);</div><div class='add'>+		nfs4_put_stid(s);</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		spin_unlock(&amp;cl-&gt;cl_lock);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfsd40_drop_revoked_stid(struct nfs4_client *cl,</div><div class='add'>+				    stateid_t *stid)</div><div class='add'>+{</div><div class='add'>+	/* NFSv4.0 has no way for the client to tell the server</div><div class='add'>+	 * that it can forget an admin-revoked stateid.</div><div class='add'>+	 * So we keep it around until the first time that the</div><div class='add'>+	 * client uses it, and drop it the first time</div><div class='add'>+	 * nfserr_admin_revoked is returned.</div><div class='add'>+	 * For v4.1 and later we wait until explicitly told</div><div class='add'>+	 * to free the stateid.</div><div class='add'>+	 */</div><div class='add'>+	if (cl-&gt;cl_minorversion == 0) {</div><div class='add'>+		struct nfs4_stid *st;</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;cl-&gt;cl_lock);</div><div class='add'>+		st = find_stateid_locked(cl, stid);</div><div class='add'>+		if (st)</div><div class='add'>+			nfsd4_drop_revoked_stid(st);</div><div class='add'>+		else</div><div class='add'>+			spin_unlock(&amp;cl-&gt;cl_lock);</div><div class='ctx'> 	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32</div><div class='add'>+nfsd4_verify_open_stid(struct nfs4_stid *s)</div><div class='add'>+{</div><div class='add'>+	__be32 ret = nfs_ok;</div><div class='add'>+</div><div class='add'>+	if (s-&gt;sc_status &amp; SC_STATUS_ADMIN_REVOKED)</div><div class='add'>+		ret = nfserr_admin_revoked;</div><div class='add'>+	else if (s-&gt;sc_status &amp; SC_STATUS_REVOKED)</div><div class='add'>+		ret = nfserr_deleg_revoked;</div><div class='add'>+	else if (s-&gt;sc_status &amp; SC_STATUS_CLOSED)</div><div class='add'>+		ret = nfserr_bad_stateid;</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -4350,6 +5099,10 @@ nfsd4_lock_ol_stateid(struct nfs4_ol_stateid *stp)</div><div class='ctx'> </div><div class='ctx'> 	mutex_lock_nested(&amp;stp-&gt;st_mutex, LOCK_STATEID_MUTEX);</div><div class='ctx'> 	ret = nfsd4_verify_open_stid(&amp;stp-&gt;st_stid);</div><div class='add'>+	if (ret == nfserr_admin_revoked)</div><div class='add'>+		nfsd40_drop_revoked_stid(stp-&gt;st_stid.sc_client,</div><div class='add'>+					&amp;stp-&gt;st_stid.sc_stateid);</div><div class='add'>+</div><div class='ctx'> 	if (ret != nfs_ok)</div><div class='ctx'> 		mutex_unlock(&amp;stp-&gt;st_mutex);</div><div class='ctx'> 	return ret;</div><div class='hunk'>@@ -4371,34 +5124,46 @@ nfsd4_find_and_lock_existing_open(struct nfs4_file *fp, struct nfsd4_open *open)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct nfs4_openowner *</div><div class='del'>-alloc_init_open_stateowner(unsigned int strhashval, struct nfsd4_open *open,</div><div class='del'>-			   struct nfsd4_compound_state *cstate)</div><div class='add'>+find_or_alloc_open_stateowner(unsigned int strhashval, struct nfsd4_open *open,</div><div class='add'>+			      struct nfsd4_compound_state *cstate)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_client *clp = cstate-&gt;clp;</div><div class='del'>-	struct nfs4_openowner *oo, *ret;</div><div class='add'>+	struct nfs4_openowner *oo, *new = NULL;</div><div class='ctx'> </div><div class='del'>-	oo = alloc_stateowner(openowner_slab, &amp;open-&gt;op_owner, clp);</div><div class='del'>-	if (!oo)</div><div class='del'>-		return NULL;</div><div class='del'>-	oo-&gt;oo_owner.so_ops = &amp;openowner_ops;</div><div class='del'>-	oo-&gt;oo_owner.so_is_open_owner = 1;</div><div class='del'>-	oo-&gt;oo_owner.so_seqid = open-&gt;op_seqid;</div><div class='del'>-	oo-&gt;oo_flags = 0;</div><div class='del'>-	if (nfsd4_has_session(cstate))</div><div class='del'>-		oo-&gt;oo_flags |= NFS4_OO_CONFIRMED;</div><div class='del'>-	oo-&gt;oo_time = 0;</div><div class='del'>-	oo-&gt;oo_last_closed_stid = NULL;</div><div class='del'>-	INIT_LIST_HEAD(&amp;oo-&gt;oo_close_lru);</div><div class='add'>+retry:</div><div class='ctx'> 	spin_lock(&amp;clp-&gt;cl_lock);</div><div class='del'>-	ret = find_openstateowner_str_locked(strhashval, open, clp);</div><div class='del'>-	if (ret == NULL) {</div><div class='del'>-		hash_openowner(oo, clp, strhashval);</div><div class='del'>-		ret = oo;</div><div class='del'>-	} else</div><div class='del'>-		nfs4_free_stateowner(&amp;oo-&gt;oo_owner);</div><div class='del'>-</div><div class='add'>+	oo = find_openstateowner_str(strhashval, open, clp);</div><div class='add'>+	if (!oo &amp;&amp; new) {</div><div class='add'>+		hash_openowner(new, clp, strhashval);</div><div class='add'>+		spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='add'>+		return new;</div><div class='add'>+	}</div><div class='ctx'> 	spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='del'>-	return ret;</div><div class='add'>+</div><div class='add'>+	if (oo &amp;&amp; !(oo-&gt;oo_flags &amp; NFS4_OO_CONFIRMED)) {</div><div class='add'>+		/* Replace unconfirmed owners without checking for replay. */</div><div class='add'>+		release_openowner(oo);</div><div class='add'>+		oo = NULL;</div><div class='add'>+	}</div><div class='add'>+	if (oo) {</div><div class='add'>+		if (new)</div><div class='add'>+			nfs4_free_stateowner(&amp;new-&gt;oo_owner);</div><div class='add'>+		return oo;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	new = alloc_stateowner(openowner_slab, &amp;open-&gt;op_owner, clp);</div><div class='add'>+	if (!new)</div><div class='add'>+		return NULL;</div><div class='add'>+	new-&gt;oo_owner.so_ops = &amp;openowner_ops;</div><div class='add'>+	new-&gt;oo_owner.so_is_open_owner = 1;</div><div class='add'>+	new-&gt;oo_owner.so_seqid = open-&gt;op_seqid;</div><div class='add'>+	new-&gt;oo_flags = 0;</div><div class='add'>+	if (nfsd4_has_session(cstate))</div><div class='add'>+		new-&gt;oo_flags |= NFS4_OO_CONFIRMED;</div><div class='add'>+	new-&gt;oo_time = 0;</div><div class='add'>+	new-&gt;oo_last_closed_stid = NULL;</div><div class='add'>+	INIT_LIST_HEAD(&amp;new-&gt;oo_close_lru);</div><div class='add'>+	goto retry;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct nfs4_ol_stateid *</div><div class='hunk'>@@ -4418,13 +5183,19 @@ retry:</div><div class='ctx'> 	spin_lock(&amp;oo-&gt;oo_owner.so_client-&gt;cl_lock);</div><div class='ctx'> 	spin_lock(&amp;fp-&gt;fi_lock);</div><div class='ctx'> </div><div class='add'>+	if (nfs4_openowner_unhashed(oo)) {</div><div class='add'>+		mutex_unlock(&amp;stp-&gt;st_mutex);</div><div class='add'>+		stp = NULL;</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	retstp = nfsd4_find_existing_open(fp, open);</div><div class='ctx'> 	if (retstp)</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='ctx'> 	open-&gt;op_stp = NULL;</div><div class='ctx'> 	refcount_inc(&amp;stp-&gt;st_stid.sc_count);</div><div class='del'>-	stp-&gt;st_stid.sc_type = NFS4_OPEN_STID;</div><div class='add'>+	stp-&gt;st_stid.sc_type = SC_TYPE_OPEN;</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;stp-&gt;st_locks);</div><div class='ctx'> 	stp-&gt;st_stateowner = nfs4_get_stateowner(&amp;oo-&gt;oo_owner);</div><div class='ctx'> 	get_nfs4_file(fp);</div><div class='hunk'>@@ -4474,7 +5245,10 @@ move_to_close_lru(struct nfs4_ol_stateid *s, struct net *net)</div><div class='ctx'> 	 * Wait for the refcount to drop to 2. Since it has been unhashed,</div><div class='ctx'> 	 * there should be no danger of the refcount going back up again at</div><div class='ctx'> 	 * this point.</div><div class='add'>+	 * Some threads with a reference might be waiting for rp_locked,</div><div class='add'>+	 * so tell them to stop waiting.</div><div class='ctx'> 	 */</div><div class='add'>+	store_release_wake_up(&amp;oo-&gt;oo_owner.so_replay.rp_locked, RP_UNHASHED);</div><div class='ctx'> 	wait_event(close_wq, refcount_read(&amp;s-&gt;st_stid.sc_count) == 2);</div><div class='ctx'> </div><div class='ctx'> 	release_all_access(s);</div><div class='hunk'>@@ -4493,71 +5267,80 @@ move_to_close_lru(struct nfs4_ol_stateid *s, struct net *net)</div><div class='ctx'> 		nfs4_put_stid(&amp;last-&gt;st_stid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* search file_hashtbl[] for file */</div><div class='del'>-static struct nfs4_file *</div><div class='del'>-find_file_locked(struct svc_fh *fh, unsigned int hashval)</div><div class='add'>+static noinline_for_stack struct nfs4_file *</div><div class='add'>+nfsd4_file_hash_lookup(const struct svc_fh *fhp)</div><div class='ctx'> {</div><div class='del'>-	struct nfs4_file *fp;</div><div class='add'>+	struct inode *inode = d_inode(fhp-&gt;fh_dentry);</div><div class='add'>+	struct rhlist_head *tmp, *list;</div><div class='add'>+	struct nfs4_file *fi;</div><div class='ctx'> </div><div class='del'>-	hlist_for_each_entry_rcu(fp, &amp;file_hashtbl[hashval], fi_hash,</div><div class='del'>-				lockdep_is_held(&amp;state_lock)) {</div><div class='del'>-		if (fh_match(&amp;fp-&gt;fi_fhandle, &amp;fh-&gt;fh_handle)) {</div><div class='del'>-			if (refcount_inc_not_zero(&amp;fp-&gt;fi_ref))</div><div class='del'>-				return fp;</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	list = rhltable_lookup(&amp;nfs4_file_rhltable, &amp;inode,</div><div class='add'>+			       nfs4_file_rhash_params);</div><div class='add'>+	rhl_for_each_entry_rcu(fi, tmp, list, fi_rlist) {</div><div class='add'>+		if (fh_match(&amp;fi-&gt;fi_fhandle, &amp;fhp-&gt;fh_handle)) {</div><div class='add'>+			if (refcount_inc_not_zero(&amp;fi-&gt;fi_ref)) {</div><div class='add'>+				rcu_read_unlock();</div><div class='add'>+				return fi;</div><div class='add'>+			}</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='add'>+	rcu_read_unlock();</div><div class='ctx'> 	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct nfs4_file *insert_file(struct nfs4_file *new, struct svc_fh *fh,</div><div class='del'>-				     unsigned int hashval)</div><div class='add'>+/*</div><div class='add'>+ * On hash insertion, identify entries with the same inode but</div><div class='add'>+ * distinct filehandles. They will all be on the list returned</div><div class='add'>+ * by rhltable_lookup().</div><div class='add'>+ *</div><div class='add'>+ * inode-&gt;i_lock prevents racing insertions from adding an entry</div><div class='add'>+ * for the same inode/fhp pair twice.</div><div class='add'>+ */</div><div class='add'>+static noinline_for_stack struct nfs4_file *</div><div class='add'>+nfsd4_file_hash_insert(struct nfs4_file *new, const struct svc_fh *fhp)</div><div class='ctx'> {</div><div class='del'>-	struct nfs4_file *fp;</div><div class='add'>+	struct inode *inode = d_inode(fhp-&gt;fh_dentry);</div><div class='add'>+	struct rhlist_head *tmp, *list;</div><div class='ctx'> 	struct nfs4_file *ret = NULL;</div><div class='ctx'> 	bool alias_found = false;</div><div class='add'>+	struct nfs4_file *fi;</div><div class='add'>+	int err;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;state_lock);</div><div class='del'>-	hlist_for_each_entry_rcu(fp, &amp;file_hashtbl[hashval], fi_hash,</div><div class='del'>-				 lockdep_is_held(&amp;state_lock)) {</div><div class='del'>-		if (fh_match(&amp;fp-&gt;fi_fhandle, &amp;fh-&gt;fh_handle)) {</div><div class='del'>-			if (refcount_inc_not_zero(&amp;fp-&gt;fi_ref))</div><div class='del'>-				ret = fp;</div><div class='del'>-		} else if (d_inode(fh-&gt;fh_dentry) == fp-&gt;fi_inode)</div><div class='del'>-			fp-&gt;fi_aliased = alias_found = true;</div><div class='del'>-	}</div><div class='del'>-	if (likely(ret == NULL)) {</div><div class='del'>-		nfsd4_init_file(fh, hashval, new);</div><div class='del'>-		new-&gt;fi_aliased = alias_found;</div><div class='del'>-		ret = new;</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+	spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+</div><div class='add'>+	list = rhltable_lookup(&amp;nfs4_file_rhltable, &amp;inode,</div><div class='add'>+			       nfs4_file_rhash_params);</div><div class='add'>+	rhl_for_each_entry_rcu(fi, tmp, list, fi_rlist) {</div><div class='add'>+		if (fh_match(&amp;fi-&gt;fi_fhandle, &amp;fhp-&gt;fh_handle)) {</div><div class='add'>+			if (refcount_inc_not_zero(&amp;fi-&gt;fi_ref))</div><div class='add'>+				ret = fi;</div><div class='add'>+		} else</div><div class='add'>+			fi-&gt;fi_aliased = alias_found = true;</div><div class='ctx'> 	}</div><div class='del'>-	spin_unlock(&amp;state_lock);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_unlock;</div><div class='ctx'> </div><div class='del'>-static struct nfs4_file * find_file(struct svc_fh *fh)</div><div class='del'>-{</div><div class='del'>-	struct nfs4_file *fp;</div><div class='del'>-	unsigned int hashval = file_hashval(fh);</div><div class='add'>+	nfsd4_file_init(fhp, new);</div><div class='add'>+	err = rhltable_insert(&amp;nfs4_file_rhltable, &amp;new-&gt;fi_rlist,</div><div class='add'>+			      nfs4_file_rhash_params);</div><div class='add'>+	if (err)</div><div class='add'>+		goto out_unlock;</div><div class='ctx'> </div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	fp = find_file_locked(fh, hashval);</div><div class='add'>+	new-&gt;fi_aliased = alias_found;</div><div class='add'>+	ret = new;</div><div class='add'>+</div><div class='add'>+out_unlock:</div><div class='add'>+	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	rcu_read_unlock();</div><div class='del'>-	return fp;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct nfs4_file *</div><div class='del'>-find_or_add_file(struct nfs4_file *new, struct svc_fh *fh)</div><div class='add'>+static noinline_for_stack void nfsd4_file_hash_remove(struct nfs4_file *fi)</div><div class='ctx'> {</div><div class='del'>-	struct nfs4_file *fp;</div><div class='del'>-	unsigned int hashval = file_hashval(fh);</div><div class='del'>-</div><div class='del'>-	rcu_read_lock();</div><div class='del'>-	fp = find_file_locked(fh, hashval);</div><div class='del'>-	rcu_read_unlock();</div><div class='del'>-	if (fp)</div><div class='del'>-		return fp;</div><div class='del'>-</div><div class='del'>-	return insert_file(new, fh, hashval);</div><div class='add'>+	rhltable_remove(&amp;nfs4_file_rhltable, &amp;fi-&gt;fi_rlist,</div><div class='add'>+			nfs4_file_rhash_params);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -4570,9 +5353,10 @@ nfs4_share_conflict(struct svc_fh *current_fh, unsigned int deny_type)</div><div class='ctx'> 	struct nfs4_file *fp;</div><div class='ctx'> 	__be32 ret = nfs_ok;</div><div class='ctx'> </div><div class='del'>-	fp = find_file(current_fh);</div><div class='add'>+	fp = nfsd4_file_hash_lookup(current_fh);</div><div class='ctx'> 	if (!fp)</div><div class='ctx'> 		return ret;</div><div class='add'>+</div><div class='ctx'> 	/* Check for conflicting share reservations */</div><div class='ctx'> 	spin_lock(&amp;fp-&gt;fi_lock);</div><div class='ctx'> 	if (fp-&gt;fi_share_deny &amp; deny_type)</div><div class='hunk'>@@ -4582,6 +5366,35 @@ nfs4_share_conflict(struct svc_fh *current_fh, unsigned int deny_type)</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool nfsd4_deleg_present(const struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	struct file_lock_context *ctx = locks_inode_context(inode);</div><div class='add'>+</div><div class='add'>+	return ctx &amp;&amp; !list_empty_careful(&amp;ctx-&gt;flc_lease);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * nfsd_wait_for_delegreturn - wait for delegations to be returned</div><div class='add'>+ * @rqstp: the RPC transaction being executed</div><div class='add'>+ * @inode: in-core inode of the file being waited for</div><div class='add'>+ *</div><div class='add'>+ * The timeout prevents deadlock if all nfsd threads happen to be</div><div class='add'>+ * tied up waiting for returning delegations.</div><div class='add'>+ *</div><div class='add'>+ * Return values:</div><div class='add'>+ *   %true: delegation was returned</div><div class='add'>+ *   %false: timed out waiting for delegreturn</div><div class='add'>+ */</div><div class='add'>+bool nfsd_wait_for_delegreturn(struct svc_rqst *rqstp, struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	long __maybe_unused timeo;</div><div class='add'>+</div><div class='add'>+	timeo = wait_var_event_timeout(inode, !nfsd4_deleg_present(inode),</div><div class='add'>+				       NFSD_DELEGRETURN_TIMEOUT);</div><div class='add'>+	trace_nfsd_delegret_wakeup(rqstp, inode, timeo);</div><div class='add'>+	return timeo &gt; 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void nfsd4_cb_recall_prepare(struct nfsd4_callback *cb)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_delegation *dp = cb_to_delegation(cb);</div><div class='hunk'>@@ -4598,7 +5411,7 @@ static void nfsd4_cb_recall_prepare(struct nfsd4_callback *cb)</div><div class='ctx'> 	 * queued for a lease break. Don't queue it again.</div><div class='ctx'> 	 */</div><div class='ctx'> 	spin_lock(&amp;state_lock);</div><div class='del'>-	if (dp-&gt;dl_time == 0) {</div><div class='add'>+	if (delegation_hashed(dp) &amp;&amp; dp-&gt;dl_time == 0) {</div><div class='ctx'> 		dp-&gt;dl_time = ktime_get_boottime_seconds();</div><div class='ctx'> 		list_add_tail(&amp;dp-&gt;dl_recall_lru, &amp;nn-&gt;del_recall_lru);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -4610,9 +5423,11 @@ static int nfsd4_cb_recall_done(struct nfsd4_callback *cb,</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_delegation *dp = cb_to_delegation(cb);</div><div class='ctx'> </div><div class='del'>-	if (dp-&gt;dl_stid.sc_type == NFS4_CLOSED_DELEG_STID ||</div><div class='del'>-	    dp-&gt;dl_stid.sc_type == NFS4_REVOKED_DELEG_STID)</div><div class='del'>-	        return 1;</div><div class='add'>+	trace_nfsd_cb_recall_done(&amp;dp-&gt;dl_stid.sc_stateid, task);</div><div class='add'>+</div><div class='add'>+	if (dp-&gt;dl_stid.sc_status)</div><div class='add'>+		/* CLOSED or REVOKED */</div><div class='add'>+		return 1;</div><div class='ctx'> </div><div class='ctx'> 	switch (task-&gt;tk_status) {</div><div class='ctx'> 	case 0:</div><div class='hunk'>@@ -4647,31 +5462,48 @@ static const struct nfsd4_callback_ops nfsd4_cb_recall_ops = {</div><div class='ctx'> 	.prepare	= nfsd4_cb_recall_prepare,</div><div class='ctx'> 	.done		= nfsd4_cb_recall_done,</div><div class='ctx'> 	.release	= nfsd4_cb_recall_release,</div><div class='add'>+	.opcode		= OP_CB_RECALL,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static void nfsd_break_one_deleg(struct nfs4_delegation *dp)</div><div class='ctx'> {</div><div class='add'>+	bool queued;</div><div class='add'>+</div><div class='add'>+	if (test_and_set_bit(NFSD4_CALLBACK_RUNNING, &amp;dp-&gt;dl_recall.cb_flags))</div><div class='add'>+		return;</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We're assuming the state code never drops its reference</div><div class='ctx'> 	 * without first removing the lease.  Since we're in this lease</div><div class='ctx'> 	 * callback (and since the lease code is serialized by the</div><div class='del'>-	 * i_lock) we know the server hasn't removed the lease yet, and</div><div class='add'>+	 * flc_lock) we know the server hasn't removed the lease yet, and</div><div class='ctx'> 	 * we know it's safe to take a reference.</div><div class='ctx'> 	 */</div><div class='ctx'> 	refcount_inc(&amp;dp-&gt;dl_stid.sc_count);</div><div class='del'>-	nfsd4_run_cb(&amp;dp-&gt;dl_recall);</div><div class='add'>+	queued = nfsd4_run_cb(&amp;dp-&gt;dl_recall);</div><div class='add'>+	WARN_ON_ONCE(!queued);</div><div class='add'>+	if (!queued)</div><div class='add'>+		refcount_dec(&amp;dp-&gt;dl_stid.sc_count);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Called from break_lease() with i_lock held. */</div><div class='add'>+/* Called from break_lease() with flc_lock held. */</div><div class='ctx'> static bool</div><div class='del'>-nfsd_break_deleg_cb(struct file_lock *fl)</div><div class='add'>+nfsd_break_deleg_cb(struct file_lease *fl)</div><div class='ctx'> {</div><div class='del'>-	bool ret = false;</div><div class='del'>-	struct nfs4_delegation *dp = (struct nfs4_delegation *)fl-&gt;fl_owner;</div><div class='add'>+	struct nfs4_delegation *dp = (struct nfs4_delegation *) fl-&gt;c.flc_owner;</div><div class='ctx'> 	struct nfs4_file *fp = dp-&gt;dl_stid.sc_file;</div><div class='add'>+	struct nfs4_client *clp = dp-&gt;dl_stid.sc_client;</div><div class='add'>+	struct nfsd_net *nn;</div><div class='ctx'> </div><div class='ctx'> 	trace_nfsd_cb_recall(&amp;dp-&gt;dl_stid);</div><div class='ctx'> </div><div class='add'>+	dp-&gt;dl_recalled = true;</div><div class='add'>+	atomic_inc(&amp;clp-&gt;cl_delegs_in_recall);</div><div class='add'>+	if (try_to_expire_client(clp)) {</div><div class='add'>+		nn = net_generic(clp-&gt;net, nfsd_net_id);</div><div class='add'>+		mod_delayed_work(laundry_wq, &amp;nn-&gt;laundromat_work, 0);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We don't want the locks code to timeout the lease for us;</div><div class='ctx'> 	 * we'll remove it ourself if a delegation isn't returned</div><div class='hunk'>@@ -4679,40 +5511,48 @@ nfsd_break_deleg_cb(struct file_lock *fl)</div><div class='ctx'> 	 */</div><div class='ctx'> 	fl-&gt;fl_break_time = 0;</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;fp-&gt;fi_lock);</div><div class='ctx'> 	fp-&gt;fi_had_conflict = true;</div><div class='ctx'> 	nfsd_break_one_deleg(dp);</div><div class='del'>-	spin_unlock(&amp;fp-&gt;fi_lock);</div><div class='del'>-	return ret;</div><div class='add'>+	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool nfsd_breaker_owns_lease(struct file_lock *fl)</div><div class='add'>+/**</div><div class='add'>+ * nfsd_breaker_owns_lease - Check if lease conflict was resolved</div><div class='add'>+ * @fl: Lock state to check</div><div class='add'>+ *</div><div class='add'>+ * Return values:</div><div class='add'>+ *   %true: Lease conflict was resolved</div><div class='add'>+ *   %false: Lease conflict was not resolved.</div><div class='add'>+ */</div><div class='add'>+static bool nfsd_breaker_owns_lease(struct file_lease *fl)</div><div class='ctx'> {</div><div class='del'>-	struct nfs4_delegation *dl = fl-&gt;fl_owner;</div><div class='add'>+	struct nfs4_delegation *dl = fl-&gt;c.flc_owner;</div><div class='ctx'> 	struct svc_rqst *rqst;</div><div class='ctx'> 	struct nfs4_client *clp;</div><div class='ctx'> </div><div class='del'>-	if (!i_am_nfsd())</div><div class='del'>-		return NULL;</div><div class='del'>-	rqst = kthread_data(current);</div><div class='del'>-	/* Note rq_prog == NFS_ACL_PROGRAM is also possible: */</div><div class='del'>-	if (rqst-&gt;rq_prog != NFS_PROGRAM || rqst-&gt;rq_vers &lt; 4)</div><div class='del'>-		return NULL;</div><div class='add'>+	rqst = nfsd_current_rqst();</div><div class='add'>+	if (!nfsd_v4client(rqst))</div><div class='add'>+		return false;</div><div class='ctx'> 	clp = *(rqst-&gt;rq_lease_breaker);</div><div class='ctx'> 	return dl-&gt;dl_stid.sc_client == clp;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-nfsd_change_deleg_cb(struct file_lock *onlist, int arg,</div><div class='add'>+nfsd_change_deleg_cb(struct file_lease *onlist, int arg,</div><div class='ctx'> 		     struct list_head *dispose)</div><div class='ctx'> {</div><div class='del'>-	if (arg &amp; F_UNLCK)</div><div class='add'>+	struct nfs4_delegation *dp = (struct nfs4_delegation *) onlist-&gt;c.flc_owner;</div><div class='add'>+	struct nfs4_client *clp = dp-&gt;dl_stid.sc_client;</div><div class='add'>+</div><div class='add'>+	if (arg &amp; F_UNLCK) {</div><div class='add'>+		if (dp-&gt;dl_recalled)</div><div class='add'>+			atomic_dec(&amp;clp-&gt;cl_delegs_in_recall);</div><div class='ctx'> 		return lease_modify(onlist, arg, dispose);</div><div class='del'>-	else</div><div class='add'>+	} else</div><div class='ctx'> 		return -EAGAIN;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static const struct lock_manager_operations nfsd_lease_mng_ops = {</div><div class='add'>+static const struct lease_manager_operations nfsd_lease_mng_ops = {</div><div class='ctx'> 	.lm_breaker_owns_lease = nfsd_breaker_owns_lease,</div><div class='ctx'> 	.lm_break = nfsd_break_deleg_cb,</div><div class='ctx'> 	.lm_change = nfsd_change_deleg_cb,</div><div class='hunk'>@@ -4787,27 +5627,19 @@ nfsd4_process_open1(struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	clp = cstate-&gt;clp;</div><div class='ctx'> </div><div class='ctx'> 	strhashval = ownerstr_hashval(&amp;open-&gt;op_owner);</div><div class='del'>-	oo = find_openstateowner_str(strhashval, open, clp);</div><div class='add'>+retry:</div><div class='add'>+	oo = find_or_alloc_open_stateowner(strhashval, open, cstate);</div><div class='ctx'> 	open-&gt;op_openowner = oo;</div><div class='del'>-	if (!oo) {</div><div class='del'>-		goto new_owner;</div><div class='del'>-	}</div><div class='del'>-	if (!(oo-&gt;oo_flags &amp; NFS4_OO_CONFIRMED)) {</div><div class='del'>-		/* Replace unconfirmed owners without checking for replay. */</div><div class='del'>-		release_openowner(oo);</div><div class='del'>-		open-&gt;op_openowner = NULL;</div><div class='del'>-		goto new_owner;</div><div class='add'>+	if (!oo)</div><div class='add'>+		return nfserr_jukebox;</div><div class='add'>+	if (nfsd4_cstate_assign_replay(cstate, &amp;oo-&gt;oo_owner) == -EAGAIN) {</div><div class='add'>+		nfs4_put_stateowner(&amp;oo-&gt;oo_owner);</div><div class='add'>+		goto retry;</div><div class='ctx'> 	}</div><div class='ctx'> 	status = nfsd4_check_seqid(cstate, &amp;oo-&gt;oo_owner, open-&gt;op_seqid);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		return status;</div><div class='del'>-	goto alloc_stateid;</div><div class='del'>-new_owner:</div><div class='del'>-	oo = alloc_init_open_stateowner(strhashval, open, cstate);</div><div class='del'>-	if (oo == NULL)</div><div class='del'>-		return nfserr_jukebox;</div><div class='del'>-	open-&gt;op_openowner = oo;</div><div class='del'>-alloc_stateid:</div><div class='add'>+</div><div class='ctx'> 	open-&gt;op_stp = nfs4_alloc_open_stateid(clp);</div><div class='ctx'> 	if (!open-&gt;op_stp)</div><div class='ctx'> 		return nfserr_jukebox;</div><div class='hunk'>@@ -4825,7 +5657,7 @@ alloc_stateid:</div><div class='ctx'> static inline __be32</div><div class='ctx'> nfs4_check_delegmode(struct nfs4_delegation *dp, int flags)</div><div class='ctx'> {</div><div class='del'>-	if ((flags &amp; WR_STATE) &amp;&amp; (dp-&gt;dl_type == NFS4_OPEN_DELEGATE_READ))</div><div class='add'>+	if (!(flags &amp; RD_STATE) &amp;&amp; deleg_is_read(dp-&gt;dl_type))</div><div class='ctx'> 		return nfserr_openmode;</div><div class='ctx'> 	else</div><div class='ctx'> 		return nfs_ok;</div><div class='hunk'>@@ -4836,12 +5668,12 @@ static int share_access_to_flags(u32 share_access)</div><div class='ctx'> 	return share_access == NFS4_SHARE_ACCESS_READ ? RD_STATE : WR_STATE;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct nfs4_delegation *find_deleg_stateid(struct nfs4_client *cl, stateid_t *s)</div><div class='add'>+static struct nfs4_delegation *find_deleg_stateid(struct nfs4_client *cl,</div><div class='add'>+						  stateid_t *s)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_stid *ret;</div><div class='ctx'> </div><div class='del'>-	ret = find_stateid_by_type(cl, s,</div><div class='del'>-				NFS4_DELEG_STID|NFS4_REVOKED_DELEG_STID);</div><div class='add'>+	ret = find_stateid_by_type(cl, s, SC_TYPE_DELEG, SC_STATUS_REVOKED);</div><div class='ctx'> 	if (!ret)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	return delegstateid(ret);</div><div class='hunk'>@@ -4864,10 +5696,15 @@ nfs4_check_deleg(struct nfs4_client *cl, struct nfsd4_open *open,</div><div class='ctx'> 	deleg = find_deleg_stateid(cl, &amp;open-&gt;op_delegate_stateid);</div><div class='ctx'> 	if (deleg == NULL)</div><div class='ctx'> 		goto out;</div><div class='del'>-	if (deleg-&gt;dl_stid.sc_type == NFS4_REVOKED_DELEG_STID) {</div><div class='add'>+	if (deleg-&gt;dl_stid.sc_status &amp; SC_STATUS_ADMIN_REVOKED) {</div><div class='ctx'> 		nfs4_put_stid(&amp;deleg-&gt;dl_stid);</div><div class='del'>-		if (cl-&gt;cl_minorversion)</div><div class='del'>-			status = nfserr_deleg_revoked;</div><div class='add'>+		status = nfserr_admin_revoked;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='add'>+	if (deleg-&gt;dl_stid.sc_status &amp; SC_STATUS_REVOKED) {</div><div class='add'>+		nfs4_put_stid(&amp;deleg-&gt;dl_stid);</div><div class='add'>+		nfsd40_drop_revoked_stid(cl, &amp;open-&gt;op_delegate_stateid);</div><div class='add'>+		status = nfserr_deleg_revoked;</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	flags = share_access_to_flags(open-&gt;op_share_access);</div><div class='hunk'>@@ -4905,16 +5742,19 @@ nfsd4_truncate(struct svc_rqst *rqstp, struct svc_fh *fh,</div><div class='ctx'> 		.ia_valid = ATTR_SIZE,</div><div class='ctx'> 		.ia_size = 0,</div><div class='ctx'> 	};</div><div class='add'>+	struct nfsd_attrs attrs = {</div><div class='add'>+		.na_iattr	= &amp;iattr,</div><div class='add'>+	};</div><div class='ctx'> 	if (!open-&gt;op_truncate)</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	if (!(open-&gt;op_share_access &amp; NFS4_SHARE_ACCESS_WRITE))</div><div class='ctx'> 		return nfserr_inval;</div><div class='del'>-	return nfsd_setattr(rqstp, fh, &amp;iattr, 0, (time64_t)0);</div><div class='add'>+	return nfsd_setattr(rqstp, fh, &amp;attrs, NULL);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32 nfs4_get_vfs_file(struct svc_rqst *rqstp, struct nfs4_file *fp,</div><div class='ctx'> 		struct svc_fh *cur_fh, struct nfs4_ol_stateid *stp,</div><div class='del'>-		struct nfsd4_open *open)</div><div class='add'>+		struct nfsd4_open *open, bool new_stp)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd_file *nf = NULL;</div><div class='ctx'> 	__be32 status;</div><div class='hunk'>@@ -4930,6 +5770,13 @@ static __be32 nfs4_get_vfs_file(struct svc_rqst *rqstp, struct nfs4_file *fp,</div><div class='ctx'> 	 */</div><div class='ctx'> 	status = nfs4_file_check_deny(fp, open-&gt;op_share_deny);</div><div class='ctx'> 	if (status != nfs_ok) {</div><div class='add'>+		if (status != nfserr_share_denied) {</div><div class='add'>+			spin_unlock(&amp;fp-&gt;fi_lock);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		if (nfs4_resolve_deny_conflicts_locked(fp, new_stp,</div><div class='add'>+				stp, open-&gt;op_share_deny, false))</div><div class='add'>+			status = nfserr_jukebox;</div><div class='ctx'> 		spin_unlock(&amp;fp-&gt;fi_lock);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -4937,6 +5784,13 @@ static __be32 nfs4_get_vfs_file(struct svc_rqst *rqstp, struct nfs4_file *fp,</div><div class='ctx'> 	/* set access to the file */</div><div class='ctx'> 	status = nfs4_file_get_access(fp, open-&gt;op_share_access);</div><div class='ctx'> 	if (status != nfs_ok) {</div><div class='add'>+		if (status != nfserr_share_denied) {</div><div class='add'>+			spin_unlock(&amp;fp-&gt;fi_lock);</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		if (nfs4_resolve_deny_conflicts_locked(fp, new_stp,</div><div class='add'>+				stp, open-&gt;op_share_access, true))</div><div class='add'>+			status = nfserr_jukebox;</div><div class='ctx'> 		spin_unlock(&amp;fp-&gt;fi_lock);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -4952,9 +5806,12 @@ static __be32 nfs4_get_vfs_file(struct svc_rqst *rqstp, struct nfs4_file *fp,</div><div class='ctx'> </div><div class='ctx'> 	if (!fp-&gt;fi_fds[oflag]) {</div><div class='ctx'> 		spin_unlock(&amp;fp-&gt;fi_lock);</div><div class='del'>-		status = nfsd_file_acquire(rqstp, cur_fh, access, &amp;nf);</div><div class='del'>-		if (status)</div><div class='add'>+</div><div class='add'>+		status = nfsd_file_acquire_opened(rqstp, cur_fh, access,</div><div class='add'>+						  open-&gt;op_filp, &amp;nf);</div><div class='add'>+		if (status != nfs_ok)</div><div class='ctx'> 			goto out_put_access;</div><div class='add'>+</div><div class='ctx'> 		spin_lock(&amp;fp-&gt;fi_lock);</div><div class='ctx'> 		if (!fp-&gt;fi_fds[oflag]) {</div><div class='ctx'> 			fp-&gt;fi_fds[oflag] = nf;</div><div class='hunk'>@@ -4983,21 +5840,30 @@ out_put_access:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfs4_upgrade_open(struct svc_rqst *rqstp, struct nfs4_file *fp, struct svc_fh *cur_fh, struct nfs4_ol_stateid *stp, struct nfsd4_open *open)</div><div class='add'>+nfs4_upgrade_open(struct svc_rqst *rqstp, struct nfs4_file *fp,</div><div class='add'>+		struct svc_fh *cur_fh, struct nfs4_ol_stateid *stp,</div><div class='add'>+		struct nfsd4_open *open)</div><div class='ctx'> {</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> 	unsigned char old_deny_bmap = stp-&gt;st_deny_bmap;</div><div class='ctx'> </div><div class='ctx'> 	if (!test_access(open-&gt;op_share_access, stp))</div><div class='del'>-		return nfs4_get_vfs_file(rqstp, fp, cur_fh, stp, open);</div><div class='add'>+		return nfs4_get_vfs_file(rqstp, fp, cur_fh, stp, open, false);</div><div class='ctx'> </div><div class='ctx'> 	/* test and set deny mode */</div><div class='ctx'> 	spin_lock(&amp;fp-&gt;fi_lock);</div><div class='ctx'> 	status = nfs4_file_check_deny(fp, open-&gt;op_share_deny);</div><div class='del'>-	if (status == nfs_ok) {</div><div class='add'>+	switch (status) {</div><div class='add'>+	case nfs_ok:</div><div class='ctx'> 		set_deny(open-&gt;op_share_deny, stp);</div><div class='ctx'> 		fp-&gt;fi_share_deny |=</div><div class='del'>-				(open-&gt;op_share_deny &amp; NFS4_SHARE_DENY_BOTH);</div><div class='add'>+			(open-&gt;op_share_deny &amp; NFS4_SHARE_DENY_BOTH);</div><div class='add'>+		break;</div><div class='add'>+	case nfserr_share_denied:</div><div class='add'>+		if (nfs4_resolve_deny_conflicts_locked(fp, false,</div><div class='add'>+				stp, open-&gt;op_share_deny, false))</div><div class='add'>+			status = nfserr_jukebox;</div><div class='add'>+		break;</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;fp-&gt;fi_lock);</div><div class='ctx'> </div><div class='hunk'>@@ -5023,21 +5889,19 @@ static bool nfsd4_cb_channel_good(struct nfs4_client *clp)</div><div class='ctx'> 	return clp-&gt;cl_minorversion &amp;&amp; clp-&gt;cl_cb_state == NFSD4_CB_UNKNOWN;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct file_lock *nfs4_alloc_init_lease(struct nfs4_delegation *dp,</div><div class='del'>-						int flag)</div><div class='add'>+static struct file_lease *nfs4_alloc_init_lease(struct nfs4_delegation *dp)</div><div class='ctx'> {</div><div class='del'>-	struct file_lock *fl;</div><div class='add'>+	struct file_lease *fl;</div><div class='ctx'> </div><div class='del'>-	fl = locks_alloc_lock();</div><div class='add'>+	fl = locks_alloc_lease();</div><div class='ctx'> 	if (!fl)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	fl-&gt;fl_lmops = &amp;nfsd_lease_mng_ops;</div><div class='del'>-	fl-&gt;fl_flags = FL_DELEG;</div><div class='del'>-	fl-&gt;fl_type = flag == NFS4_OPEN_DELEGATE_READ? F_RDLCK: F_WRLCK;</div><div class='del'>-	fl-&gt;fl_end = OFFSET_MAX;</div><div class='del'>-	fl-&gt;fl_owner = (fl_owner_t)dp;</div><div class='del'>-	fl-&gt;fl_pid = current-&gt;tgid;</div><div class='del'>-	fl-&gt;fl_file = dp-&gt;dl_stid.sc_file-&gt;fi_deleg_file-&gt;nf_file;</div><div class='add'>+	fl-&gt;c.flc_flags = FL_DELEG;</div><div class='add'>+	fl-&gt;c.flc_type = deleg_is_read(dp-&gt;dl_type) ? F_RDLCK : F_WRLCK;</div><div class='add'>+	fl-&gt;c.flc_owner = (fl_owner_t)dp;</div><div class='add'>+	fl-&gt;c.flc_pid = current-&gt;tgid;</div><div class='add'>+	fl-&gt;c.flc_file = dp-&gt;dl_stid.sc_file-&gt;fi_deleg_file-&gt;nf_file;</div><div class='ctx'> 	return fl;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5046,7 +5910,7 @@ static int nfsd4_check_conflicting_opens(struct nfs4_client *clp,</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_ol_stateid *st;</div><div class='ctx'> 	struct file *f = fp-&gt;fi_deleg_file-&gt;nf_file;</div><div class='del'>-	struct inode *ino = locks_inode(f);</div><div class='add'>+	struct inode *ino = file_inode(f);</div><div class='ctx'> 	int writes;</div><div class='ctx'> </div><div class='ctx'> 	writes = atomic_read(&amp;ino-&gt;i_writecount);</div><div class='hunk'>@@ -5100,14 +5964,76 @@ static int nfsd4_check_conflicting_opens(struct nfs4_client *clp,</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * It's possible that between opening the dentry and setting the delegation,</div><div class='add'>+ * that it has been renamed or unlinked. Redo the lookup to verify that this</div><div class='add'>+ * hasn't happened.</div><div class='add'>+ */</div><div class='add'>+static int</div><div class='add'>+nfsd4_verify_deleg_dentry(struct nfsd4_open *open, struct nfs4_file *fp,</div><div class='add'>+			  struct svc_fh *parent)</div><div class='add'>+{</div><div class='add'>+	struct svc_export *exp;</div><div class='add'>+	struct dentry *child;</div><div class='add'>+	__be32 err;</div><div class='add'>+</div><div class='add'>+	err = nfsd_lookup_dentry(open-&gt;op_rqstp, parent,</div><div class='add'>+				 open-&gt;op_fname, open-&gt;op_fnamelen,</div><div class='add'>+				 &amp;exp, &amp;child);</div><div class='add'>+</div><div class='add'>+	if (err)</div><div class='add'>+		return -EAGAIN;</div><div class='add'>+</div><div class='add'>+	exp_put(exp);</div><div class='add'>+	dput(child);</div><div class='add'>+	if (child != file_dentry(fp-&gt;fi_deleg_file-&gt;nf_file))</div><div class='add'>+		return -EAGAIN;</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * We avoid breaking delegations held by a client due to its own activity, but</div><div class='add'>+ * clearing setuid/setgid bits on a write is an implicit activity and the client</div><div class='add'>+ * may not notice and continue using the old mode. Avoid giving out a delegation</div><div class='add'>+ * on setuid/setgid files when the client is requesting an open for write.</div><div class='add'>+ */</div><div class='add'>+static int</div><div class='add'>+nfsd4_verify_setuid_write(struct nfsd4_open *open, struct nfsd_file *nf)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = file_inode(nf-&gt;nf_file);</div><div class='add'>+</div><div class='add'>+	if ((open-&gt;op_share_access &amp; NFS4_SHARE_ACCESS_WRITE) &amp;&amp;</div><div class='add'>+	    (inode-&gt;i_mode &amp; (S_ISUID|S_ISGID)))</div><div class='add'>+		return -EAGAIN;</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_NFSD_V4_DELEG_TIMESTAMPS</div><div class='add'>+static bool nfsd4_want_deleg_timestamps(const struct nfsd4_open *open)</div><div class='add'>+{</div><div class='add'>+	return open-&gt;op_deleg_want &amp; OPEN4_SHARE_ACCESS_WANT_DELEG_TIMESTAMPS;</div><div class='add'>+}</div><div class='add'>+#else /* CONFIG_NFSD_V4_DELEG_TIMESTAMPS */</div><div class='add'>+static bool nfsd4_want_deleg_timestamps(const struct nfsd4_open *open)</div><div class='add'>+{</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+#endif /* CONFIG NFSD_V4_DELEG_TIMESTAMPS */</div><div class='add'>+</div><div class='ctx'> static struct nfs4_delegation *</div><div class='del'>-nfs4_set_delegation(struct nfs4_client *clp, struct svc_fh *fh,</div><div class='del'>-		    struct nfs4_file *fp, struct nfs4_clnt_odstate *odstate)</div><div class='add'>+nfs4_set_delegation(struct nfsd4_open *open, struct nfs4_ol_stateid *stp,</div><div class='add'>+		    struct svc_fh *parent)</div><div class='ctx'> {</div><div class='del'>-	int status = 0;</div><div class='add'>+	bool deleg_ts = nfsd4_want_deleg_timestamps(open);</div><div class='add'>+	struct nfs4_client *clp = stp-&gt;st_stid.sc_client;</div><div class='add'>+	struct nfs4_file *fp = stp-&gt;st_stid.sc_file;</div><div class='add'>+	struct nfs4_clnt_odstate *odstate = stp-&gt;st_clnt_odstate;</div><div class='ctx'> 	struct nfs4_delegation *dp;</div><div class='del'>-	struct nfsd_file *nf;</div><div class='del'>-	struct file_lock *fl;</div><div class='add'>+	struct nfsd_file *nf = NULL;</div><div class='add'>+	struct file_lease *fl;</div><div class='add'>+	int status = 0;</div><div class='add'>+	u32 dl_type;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The fi_had_conflict and nfs_get_existing_delegation checks</div><div class='hunk'>@@ -5117,19 +6043,55 @@ nfs4_set_delegation(struct nfs4_client *clp, struct svc_fh *fh,</div><div class='ctx'> 	if (fp-&gt;fi_had_conflict)</div><div class='ctx'> 		return ERR_PTR(-EAGAIN);</div><div class='ctx'> </div><div class='del'>-	nf = find_readable_file(fp);</div><div class='del'>-	if (!nf) {</div><div class='del'>-		/*</div><div class='del'>-		 * We probably could attempt another open and get a read</div><div class='del'>-		 * delegation, but for now, don't bother until the</div><div class='del'>-		 * client actually sends us one.</div><div class='del'>-		 */</div><div class='add'>+	/*</div><div class='add'>+	 * Try for a write delegation first. RFC8881 section 10.4 says:</div><div class='add'>+	 *</div><div class='add'>+	 *  "An OPEN_DELEGATE_WRITE delegation allows the client to handle,</div><div class='add'>+	 *   on its own, all opens."</div><div class='add'>+	 *</div><div class='add'>+	 * Furthermore, section 9.1.2 says:</div><div class='add'>+	 *</div><div class='add'>+	 *  "In the case of READ, the server may perform the corresponding</div><div class='add'>+	 *  check on the access mode, or it may choose to allow READ for</div><div class='add'>+	 *  OPEN4_SHARE_ACCESS_WRITE, to accommodate clients whose WRITE</div><div class='add'>+	 *  implementation may unavoidably do reads (e.g., due to buffer</div><div class='add'>+	 *  cache constraints)."</div><div class='add'>+	 *</div><div class='add'>+	 *  We choose to offer a write delegation for OPEN with the</div><div class='add'>+	 *  OPEN4_SHARE_ACCESS_WRITE access mode to accommodate such clients.</div><div class='add'>+	 */</div><div class='add'>+	if (open-&gt;op_share_access &amp; NFS4_SHARE_ACCESS_WRITE) {</div><div class='add'>+		nf = find_writeable_file(fp);</div><div class='add'>+		dl_type = deleg_ts ? OPEN_DELEGATE_WRITE_ATTRS_DELEG : OPEN_DELEGATE_WRITE;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If the file is being opened O_RDONLY or we couldn't get a O_RDWR</div><div class='add'>+	 * file for some reason, then try for a read delegation instead.</div><div class='add'>+	 */</div><div class='add'>+	if (!nf &amp;&amp; (open-&gt;op_share_access &amp; NFS4_SHARE_ACCESS_READ)) {</div><div class='add'>+		nf = find_readable_file(fp);</div><div class='add'>+		dl_type = deleg_ts ? OPEN_DELEGATE_READ_ATTRS_DELEG : OPEN_DELEGATE_READ;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!nf)</div><div class='ctx'> 		return ERR_PTR(-EAGAIN);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * File delegations and associated locks cannot be recovered if the</div><div class='add'>+	 * export is from an NFS proxy server.</div><div class='add'>+	 */</div><div class='add'>+	if (exportfs_cannot_lock(nf-&gt;nf_file-&gt;f_path.mnt-&gt;mnt_sb-&gt;s_export_op)) {</div><div class='add'>+		nfsd_file_put(nf);</div><div class='add'>+		return ERR_PTR(-EOPNOTSUPP);</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> 	spin_lock(&amp;state_lock);</div><div class='ctx'> 	spin_lock(&amp;fp-&gt;fi_lock);</div><div class='ctx'> 	if (nfs4_delegation_exists(clp, fp))</div><div class='ctx'> 		status = -EAGAIN;</div><div class='add'>+	else if (nfsd4_verify_setuid_write(open, nf))</div><div class='add'>+		status = -EAGAIN;</div><div class='ctx'> 	else if (!fp-&gt;fi_deleg_file) {</div><div class='ctx'> 		fp-&gt;fi_deleg_file = nf;</div><div class='ctx'> 		/* increment early to prevent fi_deleg_file from being</div><div class='hunk'>@@ -5146,30 +6108,49 @@ nfs4_set_delegation(struct nfs4_client *clp, struct svc_fh *fh,</div><div class='ctx'> 		return ERR_PTR(status);</div><div class='ctx'> </div><div class='ctx'> 	status = -ENOMEM;</div><div class='del'>-	dp = alloc_init_deleg(clp, fp, fh, odstate);</div><div class='add'>+	dp = alloc_init_deleg(clp, fp, odstate, dl_type);</div><div class='ctx'> 	if (!dp)</div><div class='ctx'> 		goto out_delegees;</div><div class='ctx'> </div><div class='del'>-	fl = nfs4_alloc_init_lease(dp, NFS4_OPEN_DELEGATE_READ);</div><div class='add'>+	fl = nfs4_alloc_init_lease(dp);</div><div class='ctx'> 	if (!fl)</div><div class='ctx'> 		goto out_clnt_odstate;</div><div class='ctx'> </div><div class='del'>-	status = vfs_setlease(fp-&gt;fi_deleg_file-&gt;nf_file, fl-&gt;fl_type, &amp;fl, NULL);</div><div class='add'>+	status = kernel_setlease(fp-&gt;fi_deleg_file-&gt;nf_file,</div><div class='add'>+				      fl-&gt;c.flc_type, &amp;fl, NULL);</div><div class='ctx'> 	if (fl)</div><div class='del'>-		locks_free_lock(fl);</div><div class='add'>+		locks_free_lease(fl);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		goto out_clnt_odstate;</div><div class='add'>+</div><div class='add'>+	if (parent) {</div><div class='add'>+		status = nfsd4_verify_deleg_dentry(open, fp, parent);</div><div class='add'>+		if (status)</div><div class='add'>+			goto out_unlock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	status = nfsd4_check_conflicting_opens(clp, fp);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		goto out_unlock;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Now that the deleg is set, check again to ensure that nothing</div><div class='add'>+	 * raced in and changed the mode while we weren't looking.</div><div class='add'>+	 */</div><div class='add'>+	status = nfsd4_verify_setuid_write(open, fp-&gt;fi_deleg_file);</div><div class='add'>+	if (status)</div><div class='add'>+		goto out_unlock;</div><div class='add'>+</div><div class='add'>+	status = -EAGAIN;</div><div class='add'>+	if (fp-&gt;fi_had_conflict)</div><div class='add'>+		goto out_unlock;</div><div class='add'>+</div><div class='ctx'> 	spin_lock(&amp;state_lock);</div><div class='add'>+	spin_lock(&amp;clp-&gt;cl_lock);</div><div class='ctx'> 	spin_lock(&amp;fp-&gt;fi_lock);</div><div class='del'>-	if (fp-&gt;fi_had_conflict)</div><div class='del'>-		status = -EAGAIN;</div><div class='del'>-	else</div><div class='del'>-		status = hash_delegation_locked(dp, fp);</div><div class='add'>+	status = hash_delegation_locked(dp, fp);</div><div class='ctx'> 	spin_unlock(&amp;fp-&gt;fi_lock);</div><div class='add'>+	spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='ctx'> 	spin_unlock(&amp;state_lock);</div><div class='ctx'> </div><div class='ctx'> 	if (status)</div><div class='hunk'>@@ -5177,7 +6158,7 @@ nfs4_set_delegation(struct nfs4_client *clp, struct svc_fh *fh,</div><div class='ctx'> </div><div class='ctx'> 	return dp;</div><div class='ctx'> out_unlock:</div><div class='del'>-	vfs_setlease(fp-&gt;fi_deleg_file-&gt;nf_file, F_UNLCK, NULL, (void **)&amp;dp);</div><div class='add'>+	kernel_setlease(fp-&gt;fi_deleg_file-&gt;nf_file, F_UNLCK, NULL, (void **)&amp;dp);</div><div class='ctx'> out_clnt_odstate:</div><div class='ctx'> 	put_clnt_odstate(dp-&gt;dl_clnt_odstate);</div><div class='ctx'> 	nfs4_put_stid(&amp;dp-&gt;dl_stid);</div><div class='hunk'>@@ -5188,51 +6169,124 @@ out_delegees:</div><div class='ctx'> </div><div class='ctx'> static void nfsd4_open_deleg_none_ext(struct nfsd4_open *open, int status)</div><div class='ctx'> {</div><div class='del'>-	open-&gt;op_delegate_type = NFS4_OPEN_DELEGATE_NONE_EXT;</div><div class='add'>+	open-&gt;op_delegate_type = OPEN_DELEGATE_NONE_EXT;</div><div class='ctx'> 	if (status == -EAGAIN)</div><div class='ctx'> 		open-&gt;op_why_no_deleg = WND4_CONTENTION;</div><div class='ctx'> 	else {</div><div class='ctx'> 		open-&gt;op_why_no_deleg = WND4_RESOURCE;</div><div class='ctx'> 		switch (open-&gt;op_deleg_want) {</div><div class='del'>-		case NFS4_SHARE_WANT_READ_DELEG:</div><div class='del'>-		case NFS4_SHARE_WANT_WRITE_DELEG:</div><div class='del'>-		case NFS4_SHARE_WANT_ANY_DELEG:</div><div class='add'>+		case OPEN4_SHARE_ACCESS_WANT_READ_DELEG:</div><div class='add'>+		case OPEN4_SHARE_ACCESS_WANT_WRITE_DELEG:</div><div class='add'>+		case OPEN4_SHARE_ACCESS_WANT_ANY_DELEG:</div><div class='ctx'> 			break;</div><div class='del'>-		case NFS4_SHARE_WANT_CANCEL:</div><div class='add'>+		case OPEN4_SHARE_ACCESS_WANT_CANCEL:</div><div class='ctx'> 			open-&gt;op_why_no_deleg = WND4_CANCELLED;</div><div class='ctx'> 			break;</div><div class='del'>-		case NFS4_SHARE_WANT_NO_DELEG:</div><div class='add'>+		case OPEN4_SHARE_ACCESS_WANT_NO_DELEG:</div><div class='ctx'> 			WARN_ON_ONCE(1);</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static bool</div><div class='add'>+nfs4_delegation_stat(struct nfs4_delegation *dp, struct svc_fh *currentfh,</div><div class='add'>+		     struct kstat *stat)</div><div class='add'>+{</div><div class='add'>+	struct nfsd_file *nf = find_writeable_file(dp-&gt;dl_stid.sc_file);</div><div class='add'>+	struct path path;</div><div class='add'>+	int rc;</div><div class='add'>+</div><div class='add'>+	if (!nf)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	path.mnt = currentfh-&gt;fh_export-&gt;ex_path.mnt;</div><div class='add'>+	path.dentry = file_dentry(nf-&gt;nf_file);</div><div class='add'>+</div><div class='add'>+	rc = vfs_getattr(&amp;path, stat,</div><div class='add'>+			 STATX_MODE | STATX_SIZE | STATX_ATIME |</div><div class='add'>+			 STATX_MTIME | STATX_CTIME | STATX_CHANGE_COOKIE,</div><div class='add'>+			 AT_STATX_SYNC_AS_STAT);</div><div class='add'>+</div><div class='add'>+	nfsd_file_put(nf);</div><div class='add'>+	return rc == 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Add NFS4_SHARE_ACCESS_READ to the write delegation granted on OPEN</div><div class='add'>+ * with NFS4_SHARE_ACCESS_WRITE by allocating separate nfsd_file and</div><div class='add'>+ * struct file to be used for read with delegation stateid.</div><div class='add'>+ *</div><div class='add'>+ */</div><div class='add'>+static bool</div><div class='add'>+nfsd4_add_rdaccess_to_wrdeleg(struct svc_rqst *rqstp, struct nfsd4_open *open,</div><div class='add'>+			      struct svc_fh *fh, struct nfs4_ol_stateid *stp)</div><div class='add'>+{</div><div class='add'>+	struct nfs4_file *fp;</div><div class='add'>+	struct nfsd_file *nf = NULL;</div><div class='add'>+</div><div class='add'>+	if ((open-&gt;op_share_access &amp; NFS4_SHARE_ACCESS_BOTH) ==</div><div class='add'>+			NFS4_SHARE_ACCESS_WRITE) {</div><div class='add'>+		if (nfsd_file_acquire_opened(rqstp, fh, NFSD_MAY_READ, NULL, &amp;nf))</div><div class='add'>+			return (false);</div><div class='add'>+		fp = stp-&gt;st_stid.sc_file;</div><div class='add'>+		spin_lock(&amp;fp-&gt;fi_lock);</div><div class='add'>+		__nfs4_file_get_access(fp, NFS4_SHARE_ACCESS_READ);</div><div class='add'>+		fp = stp-&gt;st_stid.sc_file;</div><div class='add'>+		fp-&gt;fi_fds[O_RDONLY] = nf;</div><div class='add'>+		fp-&gt;fi_rdeleg_file = nf;</div><div class='add'>+		spin_unlock(&amp;fp-&gt;fi_lock);</div><div class='add'>+	}</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='del'>- * Attempt to hand out a delegation.</div><div class='add'>+ * The Linux NFS server does not offer write delegations to NFSv4.0</div><div class='add'>+ * clients in order to avoid conflicts between write delegations and</div><div class='add'>+ * GETATTRs requesting CHANGE or SIZE attributes.</div><div class='add'>+ *</div><div class='add'>+ * With NFSv4.1 and later minorversions, the SEQUENCE operation that</div><div class='add'>+ * begins each COMPOUND contains a client ID. Delegation recall can</div><div class='add'>+ * be avoided when the server recognizes the client sending a</div><div class='add'>+ * GETATTR also holds write delegation it conflicts with.</div><div class='add'>+ *</div><div class='add'>+ * However, the NFSv4.0 protocol does not enable a server to</div><div class='add'>+ * determine that a GETATTR originated from the client holding the</div><div class='add'>+ * conflicting delegation versus coming from some other client. Per</div><div class='add'>+ * RFC 7530 Section 16.7.5, the server must recall or send a</div><div class='add'>+ * CB_GETATTR even when the GETATTR originates from the client that</div><div class='add'>+ * holds the conflicting delegation.</div><div class='ctx'>  *</div><div class='del'>- * Note we don't support write delegations, and won't until the vfs has</div><div class='del'>- * proper support for them.</div><div class='add'>+ * An NFSv4.0 client can trigger a pathological situation if it</div><div class='add'>+ * always sends a DELEGRETURN preceded by a conflicting GETATTR in</div><div class='add'>+ * the same COMPOUND. COMPOUND execution will always stop at the</div><div class='add'>+ * GETATTR and the DELEGRETURN will never get executed. The server</div><div class='add'>+ * eventually revokes the delegation, which can result in loss of</div><div class='add'>+ * open or lock state.</div><div class='ctx'>  */</div><div class='ctx'> static void</div><div class='del'>-nfs4_open_delegation(struct svc_fh *fh, struct nfsd4_open *open,</div><div class='del'>-			struct nfs4_ol_stateid *stp)</div><div class='add'>+nfs4_open_delegation(struct svc_rqst *rqstp, struct nfsd4_open *open,</div><div class='add'>+		     struct nfs4_ol_stateid *stp, struct svc_fh *currentfh,</div><div class='add'>+		     struct svc_fh *fh)</div><div class='ctx'> {</div><div class='del'>-	struct nfs4_delegation *dp;</div><div class='ctx'> 	struct nfs4_openowner *oo = openowner(stp-&gt;st_stateowner);</div><div class='add'>+	bool deleg_ts = nfsd4_want_deleg_timestamps(open);</div><div class='ctx'> 	struct nfs4_client *clp = stp-&gt;st_stid.sc_client;</div><div class='del'>-	int cb_up;</div><div class='add'>+	struct svc_fh *parent = NULL;</div><div class='add'>+	struct nfs4_delegation *dp;</div><div class='add'>+	struct kstat stat;</div><div class='ctx'> 	int status = 0;</div><div class='add'>+	int cb_up;</div><div class='ctx'> </div><div class='ctx'> 	cb_up = nfsd4_cb_channel_good(oo-&gt;oo_owner.so_client);</div><div class='del'>-	open-&gt;op_recall = 0;</div><div class='add'>+	open-&gt;op_recall = false;</div><div class='ctx'> 	switch (open-&gt;op_claim_type) {</div><div class='ctx'> 		case NFS4_OPEN_CLAIM_PREVIOUS:</div><div class='ctx'> 			if (!cb_up)</div><div class='del'>-				open-&gt;op_recall = 1;</div><div class='del'>-			if (open-&gt;op_delegate_type != NFS4_OPEN_DELEGATE_READ)</div><div class='del'>-				goto out_no_deleg;</div><div class='add'>+				open-&gt;op_recall = true;</div><div class='ctx'> 			break;</div><div class='ctx'> 		case NFS4_OPEN_CLAIM_NULL:</div><div class='add'>+			parent = currentfh;</div><div class='add'>+			fallthrough;</div><div class='ctx'> 		case NFS4_OPEN_CLAIM_FH:</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Let's not give out any delegations till everyone's</div><div class='hunk'>@@ -5243,27 +6297,49 @@ nfs4_open_delegation(struct svc_fh *fh, struct nfsd4_open *open,</div><div class='ctx'> 				goto out_no_deleg;</div><div class='ctx'> 			if (!cb_up || !(oo-&gt;oo_flags &amp; NFS4_OO_CONFIRMED))</div><div class='ctx'> 				goto out_no_deleg;</div><div class='add'>+			if (open-&gt;op_share_access &amp; NFS4_SHARE_ACCESS_WRITE &amp;&amp;</div><div class='add'>+					!clp-&gt;cl_minorversion)</div><div class='add'>+				goto out_no_deleg;</div><div class='ctx'> 			break;</div><div class='ctx'> 		default:</div><div class='ctx'> 			goto out_no_deleg;</div><div class='ctx'> 	}</div><div class='del'>-	dp = nfs4_set_delegation(clp, fh, stp-&gt;st_stid.sc_file, stp-&gt;st_clnt_odstate);</div><div class='add'>+	dp = nfs4_set_delegation(open, stp, parent);</div><div class='ctx'> 	if (IS_ERR(dp))</div><div class='ctx'> 		goto out_no_deleg;</div><div class='ctx'> </div><div class='ctx'> 	memcpy(&amp;open-&gt;op_delegate_stateid, &amp;dp-&gt;dl_stid.sc_stateid, sizeof(dp-&gt;dl_stid.sc_stateid));</div><div class='ctx'> </div><div class='del'>-	trace_nfsd_deleg_read(&amp;dp-&gt;dl_stid.sc_stateid);</div><div class='del'>-	open-&gt;op_delegate_type = NFS4_OPEN_DELEGATE_READ;</div><div class='add'>+	if (open-&gt;op_share_access &amp; NFS4_SHARE_ACCESS_WRITE) {</div><div class='add'>+		struct file *f = dp-&gt;dl_stid.sc_file-&gt;fi_deleg_file-&gt;nf_file;</div><div class='add'>+</div><div class='add'>+		if (!nfsd4_add_rdaccess_to_wrdeleg(rqstp, open, fh, stp) ||</div><div class='add'>+				!nfs4_delegation_stat(dp, currentfh, &amp;stat)) {</div><div class='add'>+			nfs4_put_stid(&amp;dp-&gt;dl_stid);</div><div class='add'>+			destroy_delegation(dp);</div><div class='add'>+			goto out_no_deleg;</div><div class='add'>+		}</div><div class='add'>+		open-&gt;op_delegate_type = deleg_ts ? OPEN_DELEGATE_WRITE_ATTRS_DELEG :</div><div class='add'>+						    OPEN_DELEGATE_WRITE;</div><div class='add'>+		dp-&gt;dl_cb_fattr.ncf_cur_fsize = stat.size;</div><div class='add'>+		dp-&gt;dl_cb_fattr.ncf_initial_cinfo = nfsd4_change_attribute(&amp;stat);</div><div class='add'>+		dp-&gt;dl_atime = stat.atime;</div><div class='add'>+		dp-&gt;dl_ctime = stat.ctime;</div><div class='add'>+		dp-&gt;dl_mtime = stat.mtime;</div><div class='add'>+		spin_lock(&amp;f-&gt;f_lock);</div><div class='add'>+		f-&gt;f_mode |= FMODE_NOCMTIME;</div><div class='add'>+		spin_unlock(&amp;f-&gt;f_lock);</div><div class='add'>+		trace_nfsd_deleg_write(&amp;dp-&gt;dl_stid.sc_stateid);</div><div class='add'>+	} else {</div><div class='add'>+		open-&gt;op_delegate_type = deleg_ts &amp;&amp; nfs4_delegation_stat(dp, currentfh, &amp;stat) ?</div><div class='add'>+					 OPEN_DELEGATE_READ_ATTRS_DELEG : OPEN_DELEGATE_READ;</div><div class='add'>+		dp-&gt;dl_atime = stat.atime;</div><div class='add'>+		trace_nfsd_deleg_read(&amp;dp-&gt;dl_stid.sc_stateid);</div><div class='add'>+	}</div><div class='ctx'> 	nfs4_put_stid(&amp;dp-&gt;dl_stid);</div><div class='ctx'> 	return;</div><div class='ctx'> out_no_deleg:</div><div class='del'>-	open-&gt;op_delegate_type = NFS4_OPEN_DELEGATE_NONE;</div><div class='del'>-	if (open-&gt;op_claim_type == NFS4_OPEN_CLAIM_PREVIOUS &amp;&amp;</div><div class='del'>-	    open-&gt;op_delegate_type != NFS4_OPEN_DELEGATE_NONE) {</div><div class='del'>-		dprintk("NFSD: WARNING: refusing delegation reclaim\n");</div><div class='del'>-		open-&gt;op_recall = 1;</div><div class='del'>-	}</div><div class='add'>+	open-&gt;op_delegate_type = OPEN_DELEGATE_NONE;</div><div class='ctx'> </div><div class='ctx'> 	/* 4.1 client asking for a delegation? */</div><div class='ctx'> 	if (open-&gt;op_deleg_want)</div><div class='hunk'>@@ -5274,21 +6350,44 @@ out_no_deleg:</div><div class='ctx'> static void nfsd4_deleg_xgrade_none_ext(struct nfsd4_open *open,</div><div class='ctx'> 					struct nfs4_delegation *dp)</div><div class='ctx'> {</div><div class='del'>-	if (open-&gt;op_deleg_want == NFS4_SHARE_WANT_READ_DELEG &amp;&amp;</div><div class='del'>-	    dp-&gt;dl_type == NFS4_OPEN_DELEGATE_WRITE) {</div><div class='del'>-		open-&gt;op_delegate_type = NFS4_OPEN_DELEGATE_NONE_EXT;</div><div class='del'>-		open-&gt;op_why_no_deleg = WND4_NOT_SUPP_DOWNGRADE;</div><div class='del'>-	} else if (open-&gt;op_deleg_want == NFS4_SHARE_WANT_WRITE_DELEG &amp;&amp;</div><div class='del'>-		   dp-&gt;dl_type == NFS4_OPEN_DELEGATE_WRITE) {</div><div class='del'>-		open-&gt;op_delegate_type = NFS4_OPEN_DELEGATE_NONE_EXT;</div><div class='del'>-		open-&gt;op_why_no_deleg = WND4_NOT_SUPP_UPGRADE;</div><div class='add'>+	if (deleg_is_write(dp-&gt;dl_type)) {</div><div class='add'>+		if (open-&gt;op_deleg_want &amp; OPEN4_SHARE_ACCESS_WANT_READ_DELEG) {</div><div class='add'>+			open-&gt;op_delegate_type = OPEN_DELEGATE_NONE_EXT;</div><div class='add'>+			open-&gt;op_why_no_deleg = WND4_NOT_SUPP_DOWNGRADE;</div><div class='add'>+		} else if (open-&gt;op_deleg_want &amp; OPEN4_SHARE_ACCESS_WANT_WRITE_DELEG) {</div><div class='add'>+			open-&gt;op_delegate_type = OPEN_DELEGATE_NONE_EXT;</div><div class='add'>+			open-&gt;op_why_no_deleg = WND4_NOT_SUPP_UPGRADE;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='ctx'> 	/* Otherwise the client must be confused wanting a delegation</div><div class='ctx'> 	 * it already has, therefore we don't return</div><div class='del'>-	 * NFS4_OPEN_DELEGATE_NONE_EXT and reason.</div><div class='add'>+	 * OPEN_DELEGATE_NONE_EXT and reason.</div><div class='ctx'> 	 */</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/* Are we returning only a delegation stateid? */</div><div class='add'>+static bool open_xor_delegation(struct nfsd4_open *open)</div><div class='add'>+{</div><div class='add'>+	if (!(open-&gt;op_deleg_want &amp; OPEN4_SHARE_ACCESS_WANT_OPEN_XOR_DELEGATION))</div><div class='add'>+		return false;</div><div class='add'>+	/* Did we actually get a delegation? */</div><div class='add'>+	if (!deleg_is_read(open-&gt;op_delegate_type) &amp;&amp; !deleg_is_write(open-&gt;op_delegate_type))</div><div class='add'>+		return false;</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * nfsd4_process_open2 - finish open processing</div><div class='add'>+ * @rqstp: the RPC transaction being executed</div><div class='add'>+ * @current_fh: NFSv4 COMPOUND's current filehandle</div><div class='add'>+ * @open: OPEN arguments</div><div class='add'>+ *</div><div class='add'>+ * If successful, (1) truncate the file if open-&gt;op_truncate was</div><div class='add'>+ * set, (2) set open-&gt;op_stateid, (3) set open-&gt;op_delegation.</div><div class='add'>+ *</div><div class='add'>+ * Returns %nfs_ok on success; otherwise an nfs4stat value in</div><div class='add'>+ * network byte order is returned.</div><div class='add'>+ */</div><div class='ctx'> __be32</div><div class='ctx'> nfsd4_process_open2(struct svc_rqst *rqstp, struct svc_fh *current_fh, struct nfsd4_open *open)</div><div class='ctx'> {</div><div class='hunk'>@@ -5305,11 +6404,27 @@ nfsd4_process_open2(struct svc_rqst *rqstp, struct svc_fh *current_fh, struct nf</div><div class='ctx'> 	 * and check for delegations in the process of being recalled.</div><div class='ctx'> 	 * If not found, create the nfs4_file struct</div><div class='ctx'> 	 */</div><div class='del'>-	fp = find_or_add_file(open-&gt;op_file, current_fh);</div><div class='add'>+	fp = nfsd4_file_hash_insert(open-&gt;op_file, current_fh);</div><div class='add'>+	if (unlikely(!fp))</div><div class='add'>+		return nfserr_jukebox;</div><div class='ctx'> 	if (fp != open-&gt;op_file) {</div><div class='ctx'> 		status = nfs4_check_deleg(cl, open, &amp;dp);</div><div class='ctx'> 		if (status)</div><div class='ctx'> 			goto out;</div><div class='add'>+		if (dp &amp;&amp; nfsd4_is_deleg_cur(open) &amp;&amp;</div><div class='add'>+				(dp-&gt;dl_stid.sc_file != fp)) {</div><div class='add'>+			/*</div><div class='add'>+			 * RFC8881 section 8.2.4 mandates the server to return</div><div class='add'>+			 * NFS4ERR_BAD_STATEID if the selected table entry does</div><div class='add'>+			 * not match the current filehandle. However returning</div><div class='add'>+			 * NFS4ERR_BAD_STATEID in the OPEN can cause the client</div><div class='add'>+			 * to repeatedly retry the operation with the same</div><div class='add'>+			 * stateid, since the stateid itself is valid. To avoid</div><div class='add'>+			 * this situation NFSD returns NFS4ERR_INVAL instead.</div><div class='add'>+			 */</div><div class='add'>+			status = nfserr_inval;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> 		stp = nfsd4_find_and_lock_existing_open(fp, open);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		open-&gt;op_file = NULL;</div><div class='hunk'>@@ -5320,6 +6435,11 @@ nfsd4_process_open2(struct svc_rqst *rqstp, struct svc_fh *current_fh, struct nf</div><div class='ctx'> </div><div class='ctx'> 	if (!stp) {</div><div class='ctx'> 		stp = init_open_stateid(fp, open);</div><div class='add'>+		if (!stp) {</div><div class='add'>+			status = nfserr_jukebox;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+</div><div class='ctx'> 		if (!open-&gt;op_stp)</div><div class='ctx'> 			new_stp = true;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -5338,9 +6458,8 @@ nfsd4_process_open2(struct svc_rqst *rqstp, struct svc_fh *current_fh, struct nf</div><div class='ctx'> 			goto out;</div><div class='ctx'> 		}</div><div class='ctx'> 	} else {</div><div class='del'>-		status = nfs4_get_vfs_file(rqstp, fp, current_fh, stp, open);</div><div class='add'>+		status = nfs4_get_vfs_file(rqstp, fp, current_fh, stp, open, true);</div><div class='ctx'> 		if (status) {</div><div class='del'>-			stp-&gt;st_stid.sc_type = NFS4_CLOSED_STID;</div><div class='ctx'> 			release_open_stateid(stp);</div><div class='ctx'> 			mutex_unlock(&amp;stp-&gt;st_mutex);</div><div class='ctx'> 			goto out;</div><div class='hunk'>@@ -5356,8 +6475,8 @@ nfsd4_process_open2(struct svc_rqst *rqstp, struct svc_fh *current_fh, struct nf</div><div class='ctx'> 	mutex_unlock(&amp;stp-&gt;st_mutex);</div><div class='ctx'> </div><div class='ctx'> 	if (nfsd4_has_session(&amp;resp-&gt;cstate)) {</div><div class='del'>-		if (open-&gt;op_deleg_want &amp; NFS4_SHARE_WANT_NO_DELEG) {</div><div class='del'>-			open-&gt;op_delegate_type = NFS4_OPEN_DELEGATE_NONE_EXT;</div><div class='add'>+		if (open-&gt;op_deleg_want &amp; OPEN4_SHARE_ACCESS_WANT_NO_DELEG) {</div><div class='add'>+			open-&gt;op_delegate_type = OPEN_DELEGATE_NONE_EXT;</div><div class='ctx'> 			open-&gt;op_why_no_deleg = WND4_NOT_WANTED;</div><div class='ctx'> 			goto nodeleg;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -5367,13 +6486,25 @@ nfsd4_process_open2(struct svc_rqst *rqstp, struct svc_fh *current_fh, struct nf</div><div class='ctx'> 	* Attempt to hand out a delegation. No error return, because the</div><div class='ctx'> 	* OPEN succeeds even if we fail.</div><div class='ctx'> 	*/</div><div class='del'>-	nfs4_open_delegation(current_fh, open, stp);</div><div class='add'>+	nfs4_open_delegation(rqstp, open, stp,</div><div class='add'>+		&amp;resp-&gt;cstate.current_fh, current_fh);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If there is an existing open stateid, it must be updated and</div><div class='add'>+	 * returned. Only respect WANT_OPEN_XOR_DELEGATION when a new</div><div class='add'>+	 * open stateid would have to be created.</div><div class='add'>+	 */</div><div class='add'>+	if (new_stp &amp;&amp; open_xor_delegation(open)) {</div><div class='add'>+		memcpy(&amp;open-&gt;op_stateid, &amp;zero_stateid, sizeof(open-&gt;op_stateid));</div><div class='add'>+		open-&gt;op_rflags |= OPEN4_RESULT_NO_OPEN_STATEID;</div><div class='add'>+		release_open_stateid(stp);</div><div class='add'>+	}</div><div class='ctx'> nodeleg:</div><div class='ctx'> 	status = nfs_ok;</div><div class='ctx'> 	trace_nfsd_open(&amp;stp-&gt;st_stid.sc_stateid);</div><div class='ctx'> out:</div><div class='ctx'> 	/* 4.1 client trying to upgrade/downgrade delegation? */</div><div class='del'>-	if (open-&gt;op_delegate_type == NFS4_OPEN_DELEGATE_NONE &amp;&amp; dp &amp;&amp;</div><div class='add'>+	if (open-&gt;op_delegate_type == OPEN_DELEGATE_NONE &amp;&amp; dp &amp;&amp;</div><div class='ctx'> 	    open-&gt;op_deleg_want)</div><div class='ctx'> 		nfsd4_deleg_xgrade_none_ext(open, dp);</div><div class='ctx'> </div><div class='hunk'>@@ -5384,7 +6515,7 @@ out:</div><div class='ctx'> 	/*</div><div class='ctx'> 	* To finish the open response, we just need to set the rflags.</div><div class='ctx'> 	*/</div><div class='del'>-	open-&gt;op_rflags = NFS4_OPEN_RESULT_LOCKTYPE_POSIX;</div><div class='add'>+	open-&gt;op_rflags |= NFS4_OPEN_RESULT_LOCKTYPE_POSIX;</div><div class='ctx'> 	if (nfsd4_has_session(&amp;resp-&gt;cstate))</div><div class='ctx'> 		open-&gt;op_rflags |= NFS4_OPEN_RESULT_MAY_NOTIFY_LOCK;</div><div class='ctx'> 	else if (!(open-&gt;op_openowner-&gt;oo_flags &amp; NFS4_OO_CONFIRMED))</div><div class='hunk'>@@ -5401,12 +6532,8 @@ out:</div><div class='ctx'> void nfsd4_cleanup_open_state(struct nfsd4_compound_state *cstate,</div><div class='ctx'> 			      struct nfsd4_open *open)</div><div class='ctx'> {</div><div class='del'>-	if (open-&gt;op_openowner) {</div><div class='del'>-		struct nfs4_stateowner *so = &amp;open-&gt;op_openowner-&gt;oo_owner;</div><div class='del'>-</div><div class='del'>-		nfsd4_cstate_assign_replay(cstate, so);</div><div class='del'>-		nfs4_put_stateowner(so);</div><div class='del'>-	}</div><div class='add'>+	if (open-&gt;op_openowner)</div><div class='add'>+		nfs4_put_stateowner(&amp;open-&gt;op_openowner-&gt;oo_owner);</div><div class='ctx'> 	if (open-&gt;op_file)</div><div class='ctx'> 		kmem_cache_free(file_slab, open-&gt;op_file);</div><div class='ctx'> 	if (open-&gt;op_stp)</div><div class='hunk'>@@ -5516,7 +6643,6 @@ void nfsd4_ssc_init_umount_work(struct nfsd_net *nn)</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;nn-&gt;nfsd_ssc_mount_list);</div><div class='ctx'> 	init_waitqueue_head(&amp;nn-&gt;nfsd_ssc_waitq);</div><div class='ctx'> }</div><div class='del'>-EXPORT_SYMBOL_GPL(nfsd4_ssc_init_umount_work);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * This is called when nfsd is being shutdown, after all inter_ssc</div><div class='hunk'>@@ -5572,10 +6698,168 @@ static void nfsd4_ssc_expire_umount(struct nfsd_net *nn)</div><div class='ctx'> }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='add'>+/* Check if any lock belonging to this lockowner has any blockers */</div><div class='add'>+static bool</div><div class='add'>+nfs4_lockowner_has_blockers(struct nfs4_lockowner *lo)</div><div class='add'>+{</div><div class='add'>+	struct file_lock_context *ctx;</div><div class='add'>+	struct nfs4_ol_stateid *stp;</div><div class='add'>+	struct nfs4_file *nf;</div><div class='add'>+</div><div class='add'>+	list_for_each_entry(stp, &amp;lo-&gt;lo_owner.so_stateids, st_perstateowner) {</div><div class='add'>+		nf = stp-&gt;st_stid.sc_file;</div><div class='add'>+		ctx = locks_inode_context(nf-&gt;fi_inode);</div><div class='add'>+		if (!ctx)</div><div class='add'>+			continue;</div><div class='add'>+		if (locks_owner_has_blockers(ctx, lo))</div><div class='add'>+			return true;</div><div class='add'>+	}</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool</div><div class='add'>+nfs4_anylock_blockers(struct nfs4_client *clp)</div><div class='add'>+{</div><div class='add'>+	int i;</div><div class='add'>+	struct nfs4_stateowner *so;</div><div class='add'>+	struct nfs4_lockowner *lo;</div><div class='add'>+</div><div class='add'>+	if (atomic_read(&amp;clp-&gt;cl_delegs_in_recall))</div><div class='add'>+		return true;</div><div class='add'>+	spin_lock(&amp;clp-&gt;cl_lock);</div><div class='add'>+	for (i = 0; i &lt; OWNER_HASH_SIZE; i++) {</div><div class='add'>+		list_for_each_entry(so, &amp;clp-&gt;cl_ownerstr_hashtbl[i],</div><div class='add'>+				so_strhash) {</div><div class='add'>+			if (so-&gt;so_is_open_owner)</div><div class='add'>+				continue;</div><div class='add'>+			lo = lockowner(so);</div><div class='add'>+			if (nfs4_lockowner_has_blockers(lo)) {</div><div class='add'>+				spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='add'>+				return true;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+nfs4_get_client_reaplist(struct nfsd_net *nn, struct list_head *reaplist,</div><div class='add'>+				struct laundry_time *lt)</div><div class='add'>+{</div><div class='add'>+	unsigned int maxreap, reapcnt = 0;</div><div class='add'>+	struct list_head *pos, *next;</div><div class='add'>+	struct nfs4_client *clp;</div><div class='add'>+</div><div class='add'>+	maxreap = (atomic_read(&amp;nn-&gt;nfs4_client_count) &gt;= nn-&gt;nfs4_max_clients) ?</div><div class='add'>+			NFSD_CLIENT_MAX_TRIM_PER_RUN : 0;</div><div class='add'>+	INIT_LIST_HEAD(reaplist);</div><div class='add'>+	spin_lock(&amp;nn-&gt;client_lock);</div><div class='add'>+	list_for_each_safe(pos, next, &amp;nn-&gt;client_lru) {</div><div class='add'>+		clp = list_entry(pos, struct nfs4_client, cl_lru);</div><div class='add'>+		if (clp-&gt;cl_state == NFSD4_EXPIRABLE)</div><div class='add'>+			goto exp_client;</div><div class='add'>+		if (!state_expired(lt, clp-&gt;cl_time))</div><div class='add'>+			break;</div><div class='add'>+		if (!atomic_read(&amp;clp-&gt;cl_rpc_users)) {</div><div class='add'>+			if (clp-&gt;cl_state == NFSD4_ACTIVE)</div><div class='add'>+				atomic_inc(&amp;nn-&gt;nfsd_courtesy_clients);</div><div class='add'>+			clp-&gt;cl_state = NFSD4_COURTESY;</div><div class='add'>+		}</div><div class='add'>+		if (!client_has_state(clp))</div><div class='add'>+			goto exp_client;</div><div class='add'>+		if (!nfs4_anylock_blockers(clp))</div><div class='add'>+			if (reapcnt &gt;= maxreap)</div><div class='add'>+				continue;</div><div class='add'>+exp_client:</div><div class='add'>+		if (!mark_client_expired_locked(clp)) {</div><div class='add'>+			list_add(&amp;clp-&gt;cl_lru, reaplist);</div><div class='add'>+			reapcnt++;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;nn-&gt;client_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+nfs4_get_courtesy_client_reaplist(struct nfsd_net *nn,</div><div class='add'>+				struct list_head *reaplist)</div><div class='add'>+{</div><div class='add'>+	unsigned int maxreap = 0, reapcnt = 0;</div><div class='add'>+	struct list_head *pos, *next;</div><div class='add'>+	struct nfs4_client *clp;</div><div class='add'>+</div><div class='add'>+	maxreap = NFSD_CLIENT_MAX_TRIM_PER_RUN;</div><div class='add'>+	INIT_LIST_HEAD(reaplist);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;nn-&gt;client_lock);</div><div class='add'>+	list_for_each_safe(pos, next, &amp;nn-&gt;client_lru) {</div><div class='add'>+		clp = list_entry(pos, struct nfs4_client, cl_lru);</div><div class='add'>+		if (clp-&gt;cl_state == NFSD4_ACTIVE)</div><div class='add'>+			break;</div><div class='add'>+		if (reapcnt &gt;= maxreap)</div><div class='add'>+			break;</div><div class='add'>+		if (!mark_client_expired_locked(clp)) {</div><div class='add'>+			list_add(&amp;clp-&gt;cl_lru, reaplist);</div><div class='add'>+			reapcnt++;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;nn-&gt;client_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+nfs4_process_client_reaplist(struct list_head *reaplist)</div><div class='add'>+{</div><div class='add'>+	struct list_head *pos, *next;</div><div class='add'>+	struct nfs4_client *clp;</div><div class='add'>+</div><div class='add'>+	list_for_each_safe(pos, next, reaplist) {</div><div class='add'>+		clp = list_entry(pos, struct nfs4_client, cl_lru);</div><div class='add'>+		trace_nfsd_clid_purged(&amp;clp-&gt;cl_clientid);</div><div class='add'>+		list_del_init(&amp;clp-&gt;cl_lru);</div><div class='add'>+		expire_client(clp);</div><div class='add'>+	}</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfs40_clean_admin_revoked(struct nfsd_net *nn,</div><div class='add'>+				      struct laundry_time *lt)</div><div class='add'>+{</div><div class='add'>+	struct nfs4_client *clp;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;nn-&gt;client_lock);</div><div class='add'>+	if (nn-&gt;nfs40_last_revoke == 0 ||</div><div class='add'>+	    nn-&gt;nfs40_last_revoke &gt; lt-&gt;cutoff) {</div><div class='add'>+		spin_unlock(&amp;nn-&gt;client_lock);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+	nn-&gt;nfs40_last_revoke = 0;</div><div class='add'>+</div><div class='add'>+retry:</div><div class='add'>+	list_for_each_entry(clp, &amp;nn-&gt;client_lru, cl_lru) {</div><div class='add'>+		unsigned long id, tmp;</div><div class='add'>+		struct nfs4_stid *stid;</div><div class='add'>+</div><div class='add'>+		if (atomic_read(&amp;clp-&gt;cl_admin_revoked) == 0)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		spin_lock(&amp;clp-&gt;cl_lock);</div><div class='add'>+		idr_for_each_entry_ul(&amp;clp-&gt;cl_stateids, stid, tmp, id)</div><div class='add'>+			if (stid-&gt;sc_status &amp; SC_STATUS_ADMIN_REVOKED) {</div><div class='add'>+				refcount_inc(&amp;stid-&gt;sc_count);</div><div class='add'>+				spin_unlock(&amp;nn-&gt;client_lock);</div><div class='add'>+				/* this function drops -&gt;cl_lock */</div><div class='add'>+				nfsd4_drop_revoked_stid(stid);</div><div class='add'>+				nfs4_put_stid(stid);</div><div class='add'>+				spin_lock(&amp;nn-&gt;client_lock);</div><div class='add'>+				goto retry;</div><div class='add'>+			}</div><div class='add'>+		spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;nn-&gt;client_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static time64_t</div><div class='ctx'> nfs4_laundromat(struct nfsd_net *nn)</div><div class='ctx'> {</div><div class='del'>-	struct nfs4_client *clp;</div><div class='ctx'> 	struct nfs4_openowner *oo;</div><div class='ctx'> 	struct nfs4_delegation *dp;</div><div class='ctx'> 	struct nfs4_ol_stateid *stp;</div><div class='hunk'>@@ -5594,39 +6878,28 @@ nfs4_laundromat(struct nfsd_net *nn)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	nfsd4_end_grace(nn);</div><div class='del'>-	INIT_LIST_HEAD(&amp;reaplist);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;nn-&gt;s2s_cp_lock);</div><div class='ctx'> 	idr_for_each_entry(&amp;nn-&gt;s2s_cp_stateids, cps_t, i) {</div><div class='ctx'> 		cps = container_of(cps_t, struct nfs4_cpntf_state, cp_stateid);</div><div class='del'>-		if (cps-&gt;cp_stateid.sc_type == NFS4_COPYNOTIFY_STID &amp;&amp;</div><div class='add'>+		if (cps-&gt;cp_stateid.cs_type == NFS4_COPYNOTIFY_STID &amp;&amp;</div><div class='ctx'> 				state_expired(&amp;lt, cps-&gt;cpntf_time))</div><div class='ctx'> 			_free_cpntf_state_locked(nn, cps);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;nn-&gt;s2s_cp_lock);</div><div class='add'>+	nfsd4_async_copy_reaper(nn);</div><div class='add'>+	nfs4_get_client_reaplist(nn, &amp;reaplist, &amp;lt);</div><div class='add'>+	nfs4_process_client_reaplist(&amp;reaplist);</div><div class='add'>+</div><div class='add'>+	nfs40_clean_admin_revoked(nn, &amp;lt);</div><div class='ctx'> </div><div class='del'>-	spin_lock(&amp;nn-&gt;client_lock);</div><div class='del'>-	list_for_each_safe(pos, next, &amp;nn-&gt;client_lru) {</div><div class='del'>-		clp = list_entry(pos, struct nfs4_client, cl_lru);</div><div class='del'>-		if (!state_expired(&amp;lt, clp-&gt;cl_time))</div><div class='del'>-			break;</div><div class='del'>-		if (mark_client_expired_locked(clp))</div><div class='del'>-			continue;</div><div class='del'>-		list_add(&amp;clp-&gt;cl_lru, &amp;reaplist);</div><div class='del'>-	}</div><div class='del'>-	spin_unlock(&amp;nn-&gt;client_lock);</div><div class='del'>-	list_for_each_safe(pos, next, &amp;reaplist) {</div><div class='del'>-		clp = list_entry(pos, struct nfs4_client, cl_lru);</div><div class='del'>-		trace_nfsd_clid_purged(&amp;clp-&gt;cl_clientid);</div><div class='del'>-		list_del_init(&amp;clp-&gt;cl_lru);</div><div class='del'>-		expire_client(clp);</div><div class='del'>-	}</div><div class='ctx'> 	spin_lock(&amp;state_lock);</div><div class='ctx'> 	list_for_each_safe(pos, next, &amp;nn-&gt;del_recall_lru) {</div><div class='ctx'> 		dp = list_entry (pos, struct nfs4_delegation, dl_recall_lru);</div><div class='ctx'> 		if (!state_expired(&amp;lt, dp-&gt;dl_time))</div><div class='ctx'> 			break;</div><div class='del'>-		WARN_ON(!unhash_delegation_locked(dp));</div><div class='add'>+		refcount_inc(&amp;dp-&gt;dl_stid.sc_count);</div><div class='add'>+		unhash_delegation_locked(dp, SC_STATUS_REVOKED);</div><div class='ctx'> 		list_add(&amp;dp-&gt;dl_recall_lru, &amp;reaplist);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;state_lock);</div><div class='hunk'>@@ -5685,11 +6958,12 @@ nfs4_laundromat(struct nfsd_net *nn)</div><div class='ctx'> 	/* service the server-to-server copy delayed unmount list */</div><div class='ctx'> 	nfsd4_ssc_expire_umount(nn);</div><div class='ctx'> #endif</div><div class='add'>+	if (atomic_long_read(&amp;num_delegations) &gt;= max_delegations)</div><div class='add'>+		deleg_reaper(nn);</div><div class='ctx'> out:</div><div class='ctx'> 	return max_t(time64_t, lt.new_timeo, NFSD_LAUNDROMAT_MINTIMEOUT);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct workqueue_struct *laundry_wq;</div><div class='ctx'> static void laundromat_main(struct work_struct *);</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='hunk'>@@ -5704,6 +6978,60 @@ laundromat_main(struct work_struct *laundry)</div><div class='ctx'> 	queue_delayed_work(laundry_wq, &amp;nn-&gt;laundromat_work, t*HZ);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static void</div><div class='add'>+courtesy_client_reaper(struct nfsd_net *nn)</div><div class='add'>+{</div><div class='add'>+	struct list_head reaplist;</div><div class='add'>+</div><div class='add'>+	nfs4_get_courtesy_client_reaplist(nn, &amp;reaplist);</div><div class='add'>+	nfs4_process_client_reaplist(&amp;reaplist);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+deleg_reaper(struct nfsd_net *nn)</div><div class='add'>+{</div><div class='add'>+	struct list_head *pos, *next;</div><div class='add'>+	struct nfs4_client *clp;</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;nn-&gt;client_lock);</div><div class='add'>+	list_for_each_safe(pos, next, &amp;nn-&gt;client_lru) {</div><div class='add'>+		clp = list_entry(pos, struct nfs4_client, cl_lru);</div><div class='add'>+</div><div class='add'>+		if (clp-&gt;cl_state != NFSD4_ACTIVE)</div><div class='add'>+			continue;</div><div class='add'>+		if (list_empty(&amp;clp-&gt;cl_delegations))</div><div class='add'>+			continue;</div><div class='add'>+		if (atomic_read(&amp;clp-&gt;cl_delegs_in_recall))</div><div class='add'>+			continue;</div><div class='add'>+		if (test_and_set_bit(NFSD4_CALLBACK_RUNNING, &amp;clp-&gt;cl_ra-&gt;ra_cb.cb_flags))</div><div class='add'>+			continue;</div><div class='add'>+		if (ktime_get_boottime_seconds() - clp-&gt;cl_ra_time &lt; 5)</div><div class='add'>+			continue;</div><div class='add'>+		if (clp-&gt;cl_cb_state != NFSD4_CB_UP)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		/* release in nfsd4_cb_recall_any_release */</div><div class='add'>+		kref_get(&amp;clp-&gt;cl_nfsdfs.cl_ref);</div><div class='add'>+		clp-&gt;cl_ra_time = ktime_get_boottime_seconds();</div><div class='add'>+		clp-&gt;cl_ra-&gt;ra_keep = 0;</div><div class='add'>+		clp-&gt;cl_ra-&gt;ra_bmval[0] = BIT(RCA4_TYPE_MASK_RDATA_DLG) |</div><div class='add'>+						BIT(RCA4_TYPE_MASK_WDATA_DLG);</div><div class='add'>+		trace_nfsd_cb_recall_any(clp-&gt;cl_ra);</div><div class='add'>+		nfsd4_run_cb(&amp;clp-&gt;cl_ra-&gt;ra_cb);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;nn-&gt;client_lock);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+nfsd4_state_shrinker_worker(struct work_struct *work)</div><div class='add'>+{</div><div class='add'>+	struct nfsd_net *nn = container_of(work, struct nfsd_net,</div><div class='add'>+				nfsd_shrinker_work);</div><div class='add'>+</div><div class='add'>+	courtesy_client_reaper(nn);</div><div class='add'>+	deleg_reaper(nn);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline __be32 nfs4_check_fh(struct svc_fh *fhp, struct nfs4_stid *stp)</div><div class='ctx'> {</div><div class='ctx'> 	if (!fh_match(&amp;fhp-&gt;fh_handle, &amp;stp-&gt;sc_file-&gt;fi_fhandle))</div><div class='hunk'>@@ -5782,6 +7110,9 @@ static __be32 nfsd4_stid_check_stateid_generation(stateid_t *in, struct nfs4_sti</div><div class='ctx'> 	if (ret == nfs_ok)</div><div class='ctx'> 		ret = check_stateid_generation(in, &amp;s-&gt;sc_stateid, has_session);</div><div class='ctx'> 	spin_unlock(&amp;s-&gt;sc_lock);</div><div class='add'>+	if (ret == nfserr_admin_revoked)</div><div class='add'>+		nfsd40_drop_revoked_stid(s-&gt;sc_client,</div><div class='add'>+					&amp;s-&gt;sc_stateid);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -5801,8 +7132,6 @@ static __be32 nfsd4_validate_stateid(struct nfs4_client *cl, stateid_t *stateid)</div><div class='ctx'> 	if (ZERO_STATEID(stateid) || ONE_STATEID(stateid) ||</div><div class='ctx'> 		CLOSE_STATEID(stateid))</div><div class='ctx'> 		return status;</div><div class='del'>-	if (!same_clid(&amp;stateid-&gt;si_opaque.so_clid, &amp;cl-&gt;cl_clientid))</div><div class='del'>-		return status;</div><div class='ctx'> 	spin_lock(&amp;cl-&gt;cl_lock);</div><div class='ctx'> 	s = find_stateid_locked(cl, stateid);</div><div class='ctx'> 	if (!s)</div><div class='hunk'>@@ -5810,45 +7139,52 @@ static __be32 nfsd4_validate_stateid(struct nfs4_client *cl, stateid_t *stateid)</div><div class='ctx'> 	status = nfsd4_stid_check_stateid_generation(stateid, s, 1);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		goto out_unlock;</div><div class='add'>+	status = nfsd4_verify_open_stid(s);</div><div class='add'>+	if (status)</div><div class='add'>+		goto out_unlock;</div><div class='add'>+</div><div class='ctx'> 	switch (s-&gt;sc_type) {</div><div class='del'>-	case NFS4_DELEG_STID:</div><div class='add'>+	case SC_TYPE_DELEG:</div><div class='ctx'> 		status = nfs_ok;</div><div class='ctx'> 		break;</div><div class='del'>-	case NFS4_REVOKED_DELEG_STID:</div><div class='del'>-		status = nfserr_deleg_revoked;</div><div class='del'>-		break;</div><div class='del'>-	case NFS4_OPEN_STID:</div><div class='del'>-	case NFS4_LOCK_STID:</div><div class='add'>+	case SC_TYPE_OPEN:</div><div class='add'>+	case SC_TYPE_LOCK:</div><div class='ctx'> 		status = nfsd4_check_openowner_confirmed(openlockstateid(s));</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		printk("unknown stateid type %x\n", s-&gt;sc_type);</div><div class='del'>-		fallthrough;</div><div class='del'>-	case NFS4_CLOSED_STID:</div><div class='del'>-	case NFS4_CLOSED_DELEG_STID:</div><div class='ctx'> 		status = nfserr_bad_stateid;</div><div class='ctx'> 	}</div><div class='ctx'> out_unlock:</div><div class='ctx'> 	spin_unlock(&amp;cl-&gt;cl_lock);</div><div class='add'>+	if (status == nfserr_admin_revoked)</div><div class='add'>+		nfsd40_drop_revoked_stid(cl, stateid);</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> __be32</div><div class='ctx'> nfsd4_lookup_stateid(struct nfsd4_compound_state *cstate,</div><div class='del'>-		     stateid_t *stateid, unsigned char typemask,</div><div class='add'>+		     stateid_t *stateid,</div><div class='add'>+		     unsigned short typemask, unsigned short statusmask,</div><div class='ctx'> 		     struct nfs4_stid **s, struct nfsd_net *nn)</div><div class='ctx'> {</div><div class='ctx'> 	__be32 status;</div><div class='add'>+	struct nfs4_stid *stid;</div><div class='ctx'> 	bool return_revoked = false;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 *  only return revoked delegations if explicitly asked.</div><div class='ctx'> 	 *  otherwise we report revoked or bad_stateid status.</div><div class='ctx'> 	 */</div><div class='del'>-	if (typemask &amp; NFS4_REVOKED_DELEG_STID)</div><div class='add'>+	if (statusmask &amp; SC_STATUS_REVOKED)</div><div class='ctx'> 		return_revoked = true;</div><div class='del'>-	else if (typemask &amp; NFS4_DELEG_STID)</div><div class='del'>-		typemask |= NFS4_REVOKED_DELEG_STID;</div><div class='add'>+	if (typemask &amp; SC_TYPE_DELEG)</div><div class='add'>+		/* Always allow REVOKED for DELEG so we can</div><div class='add'>+		 * return the appropriate error.</div><div class='add'>+		 */</div><div class='add'>+		statusmask |= SC_STATUS_REVOKED;</div><div class='add'>+</div><div class='add'>+	statusmask |= SC_STATUS_ADMIN_REVOKED | SC_STATUS_FREEABLE;</div><div class='ctx'> </div><div class='ctx'> 	if (ZERO_STATEID(stateid) || ONE_STATEID(stateid) ||</div><div class='ctx'> 		CLOSE_STATEID(stateid))</div><div class='hunk'>@@ -5861,38 +7197,41 @@ nfsd4_lookup_stateid(struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	}</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		return status;</div><div class='del'>-	*s = find_stateid_by_type(cstate-&gt;clp, stateid, typemask);</div><div class='del'>-	if (!*s)</div><div class='del'>-		return nfserr_bad_stateid;</div><div class='del'>-	if (((*s)-&gt;sc_type == NFS4_REVOKED_DELEG_STID) &amp;&amp; !return_revoked) {</div><div class='del'>-		nfs4_put_stid(*s);</div><div class='del'>-		if (cstate-&gt;minorversion)</div><div class='del'>-			return nfserr_deleg_revoked;</div><div class='add'>+	stid = find_stateid_by_type(cstate-&gt;clp, stateid, typemask, statusmask);</div><div class='add'>+	if (!stid)</div><div class='ctx'> 		return nfserr_bad_stateid;</div><div class='add'>+	if ((stid-&gt;sc_status &amp; SC_STATUS_REVOKED) &amp;&amp; !return_revoked) {</div><div class='add'>+		nfs4_put_stid(stid);</div><div class='add'>+		return nfserr_deleg_revoked;</div><div class='add'>+	}</div><div class='add'>+	if (stid-&gt;sc_status &amp; SC_STATUS_ADMIN_REVOKED) {</div><div class='add'>+		nfsd40_drop_revoked_stid(cstate-&gt;clp, stateid);</div><div class='add'>+		nfs4_put_stid(stid);</div><div class='add'>+		return nfserr_admin_revoked;</div><div class='ctx'> 	}</div><div class='add'>+	*s = stid;</div><div class='ctx'> 	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct nfsd_file *</div><div class='ctx'> nfs4_find_file(struct nfs4_stid *s, int flags)</div><div class='ctx'> {</div><div class='del'>-	if (!s)</div><div class='add'>+	struct nfsd_file *ret = NULL;</div><div class='add'>+</div><div class='add'>+	if (!s || s-&gt;sc_status)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> </div><div class='ctx'> 	switch (s-&gt;sc_type) {</div><div class='del'>-	case NFS4_DELEG_STID:</div><div class='del'>-		if (WARN_ON_ONCE(!s-&gt;sc_file-&gt;fi_deleg_file))</div><div class='del'>-			return NULL;</div><div class='del'>-		return nfsd_file_get(s-&gt;sc_file-&gt;fi_deleg_file);</div><div class='del'>-	case NFS4_OPEN_STID:</div><div class='del'>-	case NFS4_LOCK_STID:</div><div class='add'>+	case SC_TYPE_DELEG:</div><div class='add'>+	case SC_TYPE_OPEN:</div><div class='add'>+	case SC_TYPE_LOCK:</div><div class='ctx'> 		if (flags &amp; RD_STATE)</div><div class='del'>-			return find_readable_file(s-&gt;sc_file);</div><div class='add'>+			ret = find_readable_file(s-&gt;sc_file);</div><div class='ctx'> 		else</div><div class='del'>-			return find_writeable_file(s-&gt;sc_file);</div><div class='add'>+			ret = find_writeable_file(s-&gt;sc_file);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return NULL;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='hunk'>@@ -5916,7 +7255,8 @@ nfs4_check_file(struct svc_rqst *rqstp, struct svc_fh *fhp, struct nfs4_stid *s,</div><div class='ctx'> </div><div class='ctx'> 	nf = nfs4_find_file(s, flags);</div><div class='ctx'> 	if (nf) {</div><div class='del'>-		status = nfsd_permission(rqstp, fhp-&gt;fh_export, fhp-&gt;fh_dentry,</div><div class='add'>+		status = nfsd_permission(&amp;rqstp-&gt;rq_cred,</div><div class='add'>+					 fhp-&gt;fh_export, fhp-&gt;fh_dentry,</div><div class='ctx'> 				acc | NFSD_MAY_OWNER_OVERRIDE);</div><div class='ctx'> 		if (status) {</div><div class='ctx'> 			nfsd_file_put(nf);</div><div class='hunk'>@@ -5934,12 +7274,12 @@ out:</div><div class='ctx'> static void</div><div class='ctx'> _free_cpntf_state_locked(struct nfsd_net *nn, struct nfs4_cpntf_state *cps)</div><div class='ctx'> {</div><div class='del'>-	WARN_ON_ONCE(cps-&gt;cp_stateid.sc_type != NFS4_COPYNOTIFY_STID);</div><div class='del'>-	if (!refcount_dec_and_test(&amp;cps-&gt;cp_stateid.sc_count))</div><div class='add'>+	WARN_ON_ONCE(cps-&gt;cp_stateid.cs_type != NFS4_COPYNOTIFY_STID);</div><div class='add'>+	if (!refcount_dec_and_test(&amp;cps-&gt;cp_stateid.cs_count))</div><div class='ctx'> 		return;</div><div class='ctx'> 	list_del(&amp;cps-&gt;cp_list);</div><div class='ctx'> 	idr_remove(&amp;nn-&gt;s2s_cp_stateids,</div><div class='del'>-		   cps-&gt;cp_stateid.stid.si_opaque.so_id);</div><div class='add'>+		   cps-&gt;cp_stateid.cs_stid.si_opaque.so_id);</div><div class='ctx'> 	kfree(cps);</div><div class='ctx'> }</div><div class='ctx'> /*</div><div class='hunk'>@@ -5961,12 +7301,12 @@ __be32 manage_cpntf_state(struct nfsd_net *nn, stateid_t *st,</div><div class='ctx'> 	if (cps_t) {</div><div class='ctx'> 		state = container_of(cps_t, struct nfs4_cpntf_state,</div><div class='ctx'> 				     cp_stateid);</div><div class='del'>-		if (state-&gt;cp_stateid.sc_type != NFS4_COPYNOTIFY_STID) {</div><div class='add'>+		if (state-&gt;cp_stateid.cs_type != NFS4_COPYNOTIFY_STID) {</div><div class='ctx'> 			state = NULL;</div><div class='ctx'> 			goto unlock;</div><div class='ctx'> 		}</div><div class='ctx'> 		if (!clp)</div><div class='del'>-			refcount_inc(&amp;state-&gt;cp_stateid.sc_count);</div><div class='add'>+			refcount_inc(&amp;state-&gt;cp_stateid.cs_count);</div><div class='ctx'> 		else</div><div class='ctx'> 			_free_cpntf_state_locked(nn, state);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -5974,7 +7314,7 @@ unlock:</div><div class='ctx'> 	spin_unlock(&amp;nn-&gt;s2s_cp_lock);</div><div class='ctx'> 	if (!state)</div><div class='ctx'> 		return nfserr_bad_stateid;</div><div class='del'>-	if (!clp &amp;&amp; state)</div><div class='add'>+	if (!clp)</div><div class='ctx'> 		*cps = state;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='hunk'>@@ -5998,7 +7338,8 @@ static __be32 find_cpntf_state(struct nfsd_net *nn, stateid_t *st,</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	*stid = find_stateid_by_type(found, &amp;cps-&gt;cp_p_stateid,</div><div class='del'>-			NFS4_DELEG_STID|NFS4_OPEN_STID|NFS4_LOCK_STID);</div><div class='add'>+				     SC_TYPE_DELEG|SC_TYPE_OPEN|SC_TYPE_LOCK,</div><div class='add'>+				     0);</div><div class='ctx'> 	if (*stid)</div><div class='ctx'> 		status = nfs_ok;</div><div class='ctx'> 	else</div><div class='hunk'>@@ -6017,8 +7358,19 @@ void nfs4_put_cpntf_state(struct nfsd_net *nn, struct nfs4_cpntf_state *cps)</div><div class='ctx'> 	spin_unlock(&amp;nn-&gt;s2s_cp_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Checks for stateid operations</div><div class='add'>+/**</div><div class='add'>+ * nfs4_preprocess_stateid_op - find and prep stateid for an operation</div><div class='add'>+ * @rqstp: incoming request from client</div><div class='add'>+ * @cstate: current compound state</div><div class='add'>+ * @fhp: filehandle associated with requested stateid</div><div class='add'>+ * @stateid: stateid (provided by client)</div><div class='add'>+ * @flags: flags describing type of operation to be done</div><div class='add'>+ * @nfp: optional nfsd_file return pointer (may be NULL)</div><div class='add'>+ * @cstid: optional returned nfs4_stid pointer (may be NULL)</div><div class='add'>+ *</div><div class='add'>+ * Given info from the client, look up a nfs4_stid for the operation. On</div><div class='add'>+ * success, it returns a reference to the nfs4_stid and/or the nfsd_file</div><div class='add'>+ * associated with it.</div><div class='ctx'>  */</div><div class='ctx'> __be32</div><div class='ctx'> nfs4_preprocess_stateid_op(struct svc_rqst *rqstp,</div><div class='hunk'>@@ -6040,8 +7392,8 @@ nfs4_preprocess_stateid_op(struct svc_rqst *rqstp,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	status = nfsd4_lookup_stateid(cstate, stateid,</div><div class='del'>-				NFS4_DELEG_STID|NFS4_OPEN_STID|NFS4_LOCK_STID,</div><div class='del'>-				&amp;s, nn);</div><div class='add'>+				SC_TYPE_DELEG|SC_TYPE_OPEN|SC_TYPE_LOCK,</div><div class='add'>+				0, &amp;s, nn);</div><div class='ctx'> 	if (status == nfserr_bad_stateid)</div><div class='ctx'> 		status = find_cpntf_state(nn, stateid, &amp;s);</div><div class='ctx'> 	if (status)</div><div class='hunk'>@@ -6052,16 +7404,13 @@ nfs4_preprocess_stateid_op(struct svc_rqst *rqstp,</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	switch (s-&gt;sc_type) {</div><div class='del'>-	case NFS4_DELEG_STID:</div><div class='add'>+	case SC_TYPE_DELEG:</div><div class='ctx'> 		status = nfs4_check_delegmode(delegstateid(s), flags);</div><div class='ctx'> 		break;</div><div class='del'>-	case NFS4_OPEN_STID:</div><div class='del'>-	case NFS4_LOCK_STID:</div><div class='add'>+	case SC_TYPE_OPEN:</div><div class='add'>+	case SC_TYPE_LOCK:</div><div class='ctx'> 		status = nfs4_check_olstateid(openlockstateid(s), flags);</div><div class='ctx'> 		break;</div><div class='del'>-	default:</div><div class='del'>-		status = nfserr_bad_stateid;</div><div class='del'>-		break;</div><div class='ctx'> 	}</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -6140,34 +7489,42 @@ nfsd4_free_stateid(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;cl-&gt;cl_lock);</div><div class='ctx'> 	s = find_stateid_locked(cl, stateid);</div><div class='del'>-	if (!s)</div><div class='add'>+	if (!s || s-&gt;sc_status &amp; SC_STATUS_CLOSED)</div><div class='ctx'> 		goto out_unlock;</div><div class='add'>+	if (s-&gt;sc_status &amp; SC_STATUS_ADMIN_REVOKED) {</div><div class='add'>+		nfsd4_drop_revoked_stid(s);</div><div class='add'>+		ret = nfs_ok;</div><div class='add'>+		goto out;</div><div class='add'>+	}</div><div class='ctx'> 	spin_lock(&amp;s-&gt;sc_lock);</div><div class='ctx'> 	switch (s-&gt;sc_type) {</div><div class='del'>-	case NFS4_DELEG_STID:</div><div class='add'>+	case SC_TYPE_DELEG:</div><div class='add'>+		if (s-&gt;sc_status &amp; SC_STATUS_REVOKED) {</div><div class='add'>+			s-&gt;sc_status |= SC_STATUS_CLOSED;</div><div class='add'>+			spin_unlock(&amp;s-&gt;sc_lock);</div><div class='add'>+			dp = delegstateid(s);</div><div class='add'>+			if (s-&gt;sc_status &amp; SC_STATUS_FREEABLE)</div><div class='add'>+				list_del_init(&amp;dp-&gt;dl_recall_lru);</div><div class='add'>+			s-&gt;sc_status |= SC_STATUS_FREED;</div><div class='add'>+			spin_unlock(&amp;cl-&gt;cl_lock);</div><div class='add'>+			nfs4_put_stid(s);</div><div class='add'>+			ret = nfs_ok;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> 		ret = nfserr_locks_held;</div><div class='ctx'> 		break;</div><div class='del'>-	case NFS4_OPEN_STID:</div><div class='add'>+	case SC_TYPE_OPEN:</div><div class='ctx'> 		ret = check_stateid_generation(stateid, &amp;s-&gt;sc_stateid, 1);</div><div class='ctx'> 		if (ret)</div><div class='ctx'> 			break;</div><div class='ctx'> 		ret = nfserr_locks_held;</div><div class='ctx'> 		break;</div><div class='del'>-	case NFS4_LOCK_STID:</div><div class='add'>+	case SC_TYPE_LOCK:</div><div class='ctx'> 		spin_unlock(&amp;s-&gt;sc_lock);</div><div class='ctx'> 		refcount_inc(&amp;s-&gt;sc_count);</div><div class='ctx'> 		spin_unlock(&amp;cl-&gt;cl_lock);</div><div class='ctx'> 		ret = nfsd4_free_lock_stateid(stateid, s);</div><div class='ctx'> 		goto out;</div><div class='del'>-	case NFS4_REVOKED_DELEG_STID:</div><div class='del'>-		spin_unlock(&amp;s-&gt;sc_lock);</div><div class='del'>-		dp = delegstateid(s);</div><div class='del'>-		list_del_init(&amp;dp-&gt;dl_recall_lru);</div><div class='del'>-		spin_unlock(&amp;cl-&gt;cl_lock);</div><div class='del'>-		nfs4_put_stid(s);</div><div class='del'>-		ret = nfs_ok;</div><div class='del'>-		goto out;</div><div class='del'>-	/* Default falls through and returns nfserr_bad_stateid */</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;s-&gt;sc_lock);</div><div class='ctx'> out_unlock:</div><div class='hunk'>@@ -6203,12 +7560,24 @@ static __be32 nfs4_seqid_op_checks(struct nfsd4_compound_state *cstate, stateid_</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* </div><div class='del'>- * Checks for sequence id mutating operations. </div><div class='add'>+/**</div><div class='add'>+ * nfs4_preprocess_seqid_op - find and prep an ol_stateid for a seqid-morphing op</div><div class='add'>+ * @cstate: compund state</div><div class='add'>+ * @seqid: seqid (provided by client)</div><div class='add'>+ * @stateid: stateid (provided by client)</div><div class='add'>+ * @typemask: mask of allowable types for this operation</div><div class='add'>+ * @statusmask: mask of allowed states: 0 or STID_CLOSED</div><div class='add'>+ * @stpp: return pointer for the stateid found</div><div class='add'>+ * @nn: net namespace for request</div><div class='add'>+ *</div><div class='add'>+ * Given a stateid+seqid from a client, look up an nfs4_ol_stateid and</div><div class='add'>+ * return it in @stpp. On a nfs_ok return, the returned stateid will</div><div class='add'>+ * have its st_mutex locked.</div><div class='ctx'>  */</div><div class='ctx'> static __be32</div><div class='ctx'> nfs4_preprocess_seqid_op(struct nfsd4_compound_state *cstate, u32 seqid,</div><div class='del'>-			 stateid_t *stateid, char typemask,</div><div class='add'>+			 stateid_t *stateid,</div><div class='add'>+			 unsigned short typemask, unsigned short statusmask,</div><div class='ctx'> 			 struct nfs4_ol_stateid **stpp,</div><div class='ctx'> 			 struct nfsd_net *nn)</div><div class='ctx'> {</div><div class='hunk'>@@ -6219,11 +7588,16 @@ nfs4_preprocess_seqid_op(struct nfsd4_compound_state *cstate, u32 seqid,</div><div class='ctx'> 	trace_nfsd_preprocess(seqid, stateid);</div><div class='ctx'> </div><div class='ctx'> 	*stpp = NULL;</div><div class='del'>-	status = nfsd4_lookup_stateid(cstate, stateid, typemask, &amp;s, nn);</div><div class='add'>+retry:</div><div class='add'>+	status = nfsd4_lookup_stateid(cstate, stateid,</div><div class='add'>+				      typemask, statusmask, &amp;s, nn);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		return status;</div><div class='ctx'> 	stp = openlockstateid(s);</div><div class='del'>-	nfsd4_cstate_assign_replay(cstate, stp-&gt;st_stateowner);</div><div class='add'>+	if (nfsd4_cstate_assign_replay(cstate, stp-&gt;st_stateowner) == -EAGAIN) {</div><div class='add'>+		nfs4_put_stateowner(stp-&gt;st_stateowner);</div><div class='add'>+		goto retry;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	status = nfs4_seqid_op_checks(cstate, stateid, seqid, stp);</div><div class='ctx'> 	if (!status)</div><div class='hunk'>@@ -6241,7 +7615,7 @@ static __be32 nfs4_preprocess_confirmed_seqid_op(struct nfsd4_compound_state *cs</div><div class='ctx'> 	struct nfs4_ol_stateid *stp;</div><div class='ctx'> </div><div class='ctx'> 	status = nfs4_preprocess_seqid_op(cstate, seqid, stateid,</div><div class='del'>-						NFS4_OPEN_STID, &amp;stp, nn);</div><div class='add'>+					  SC_TYPE_OPEN, 0, &amp;stp, nn);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		return status;</div><div class='ctx'> 	oo = openowner(stp-&gt;st_stateowner);</div><div class='hunk'>@@ -6272,8 +7646,8 @@ nfsd4_open_confirm(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 		return status;</div><div class='ctx'> </div><div class='ctx'> 	status = nfs4_preprocess_seqid_op(cstate,</div><div class='del'>-					oc-&gt;oc_seqid, &amp;oc-&gt;oc_req_stateid,</div><div class='del'>-					NFS4_OPEN_STID, &amp;stp, nn);</div><div class='add'>+					  oc-&gt;oc_seqid, &amp;oc-&gt;oc_req_stateid,</div><div class='add'>+					  SC_TYPE_OPEN, 0, &amp;stp, nn);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	oo = openowner(stp-&gt;st_stateowner);</div><div class='hunk'>@@ -6365,11 +7739,12 @@ out:</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void nfsd4_close_open_stateid(struct nfs4_ol_stateid *s)</div><div class='add'>+static bool nfsd4_close_open_stateid(struct nfs4_ol_stateid *s)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_client *clp = s-&gt;st_stid.sc_client;</div><div class='ctx'> 	bool unhashed;</div><div class='ctx'> 	LIST_HEAD(reaplist);</div><div class='add'>+	struct nfs4_ol_stateid *stp;</div><div class='ctx'> </div><div class='ctx'> 	spin_lock(&amp;clp-&gt;cl_lock);</div><div class='ctx'> 	unhashed = unhash_open_stateid(s, &amp;reaplist);</div><div class='hunk'>@@ -6378,12 +7753,14 @@ static void nfsd4_close_open_stateid(struct nfs4_ol_stateid *s)</div><div class='ctx'> 		if (unhashed)</div><div class='ctx'> 			put_ol_stateid_locked(s, &amp;reaplist);</div><div class='ctx'> 		spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='add'>+		list_for_each_entry(stp, &amp;reaplist, st_locks)</div><div class='add'>+			nfs4_free_cpntf_statelist(clp-&gt;net, &amp;stp-&gt;st_stid);</div><div class='ctx'> 		free_ol_stateid_reaplist(&amp;reaplist);</div><div class='add'>+		return false;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='ctx'> 		free_ol_stateid_reaplist(&amp;reaplist);</div><div class='del'>-		if (unhashed)</div><div class='del'>-			move_to_close_lru(s, clp-&gt;net);</div><div class='add'>+		return unhashed;</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -6399,19 +7776,22 @@ nfsd4_close(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	struct nfs4_ol_stateid *stp;</div><div class='ctx'> 	struct net *net = SVC_NET(rqstp);</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='add'>+	bool need_move_to_close_list;</div><div class='ctx'> </div><div class='del'>-	dprintk("NFSD: nfsd4_close on file %pd\n", </div><div class='add'>+	dprintk("NFSD: nfsd4_close on file %pd\n",</div><div class='ctx'> 			cstate-&gt;current_fh.fh_dentry);</div><div class='ctx'> </div><div class='ctx'> 	status = nfs4_preprocess_seqid_op(cstate, close-&gt;cl_seqid,</div><div class='del'>-					&amp;close-&gt;cl_stateid,</div><div class='del'>-					NFS4_OPEN_STID|NFS4_CLOSED_STID,</div><div class='del'>-					&amp;stp, nn);</div><div class='add'>+					  &amp;close-&gt;cl_stateid,</div><div class='add'>+					  SC_TYPE_OPEN, SC_STATUS_CLOSED,</div><div class='add'>+					  &amp;stp, nn);</div><div class='ctx'> 	nfsd4_bump_seqid(cstate, status);</div><div class='ctx'> 	if (status)</div><div class='del'>-		goto out; </div><div class='add'>+		goto out;</div><div class='ctx'> </div><div class='del'>-	stp-&gt;st_stid.sc_type = NFS4_CLOSED_STID;</div><div class='add'>+	spin_lock(&amp;stp-&gt;st_stid.sc_client-&gt;cl_lock);</div><div class='add'>+	stp-&gt;st_stid.sc_status |= SC_STATUS_CLOSED;</div><div class='add'>+	spin_unlock(&amp;stp-&gt;st_stid.sc_client-&gt;cl_lock);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Technically we don't _really_ have to increment or copy it, since</div><div class='hunk'>@@ -6421,8 +7801,10 @@ nfsd4_close(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	 */</div><div class='ctx'> 	nfs4_inc_and_copy_stateid(&amp;close-&gt;cl_stateid, &amp;stp-&gt;st_stid);</div><div class='ctx'> </div><div class='del'>-	nfsd4_close_open_stateid(stp);</div><div class='add'>+	need_move_to_close_list = nfsd4_close_open_stateid(stp);</div><div class='ctx'> 	mutex_unlock(&amp;stp-&gt;st_mutex);</div><div class='add'>+	if (need_move_to_close_list)</div><div class='add'>+		move_to_close_lru(stp, net);</div><div class='ctx'> </div><div class='ctx'> 	/* v4.1+ suggests that we send a special stateid in here, since the</div><div class='ctx'> 	 * clients should just ignore this anyway. Since this is not useful</div><div class='hunk'>@@ -6450,10 +7832,11 @@ nfsd4_delegreturn(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(SVC_NET(rqstp), nfsd_net_id);</div><div class='ctx'> </div><div class='del'>-	if ((status = fh_verify(rqstp, &amp;cstate-&gt;current_fh, S_IFREG, 0)))</div><div class='add'>+	status = fh_verify(rqstp, &amp;cstate-&gt;current_fh, 0, 0);</div><div class='add'>+	if (status)</div><div class='ctx'> 		return status;</div><div class='ctx'> </div><div class='del'>-	status = nfsd4_lookup_stateid(cstate, stateid, NFS4_DELEG_STID, &amp;s, nn);</div><div class='add'>+	status = nfsd4_lookup_stateid(cstate, stateid, SC_TYPE_DELEG, SC_STATUS_REVOKED, &amp;s, nn);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	dp = delegstateid(s);</div><div class='hunk'>@@ -6461,7 +7844,10 @@ nfsd4_delegreturn(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		goto put_stateid;</div><div class='ctx'> </div><div class='add'>+	trace_nfsd_deleg_return(stateid);</div><div class='ctx'> 	destroy_delegation(dp);</div><div class='add'>+	smp_mb__after_atomic();</div><div class='add'>+	wake_up_var(d_inode(cstate-&gt;current_fh.fh_dentry));</div><div class='ctx'> put_stateid:</div><div class='ctx'> 	nfs4_put_stid(&amp;dp-&gt;dl_stid);</div><div class='ctx'> out:</div><div class='hunk'>@@ -6497,7 +7883,7 @@ nfs4_transform_lock_offset(struct file_lock *lock)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static fl_owner_t</div><div class='del'>-nfsd4_fl_get_owner(fl_owner_t owner)</div><div class='add'>+nfsd4_lm_get_owner(fl_owner_t owner)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_lockowner *lo = (struct nfs4_lockowner *)owner;</div><div class='ctx'> </div><div class='hunk'>@@ -6506,7 +7892,7 @@ nfsd4_fl_get_owner(fl_owner_t owner)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='del'>-nfsd4_fl_put_owner(fl_owner_t owner)</div><div class='add'>+nfsd4_lm_put_owner(fl_owner_t owner)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfs4_lockowner *lo = (struct nfs4_lockowner *)owner;</div><div class='ctx'> </div><div class='hunk'>@@ -6514,10 +7900,33 @@ nfsd4_fl_put_owner(fl_owner_t owner)</div><div class='ctx'> 		nfs4_put_stateowner(&amp;lo-&gt;lo_owner);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/* return pointer to struct nfs4_client if client is expirable */</div><div class='add'>+static bool</div><div class='add'>+nfsd4_lm_lock_expirable(struct file_lock *cfl)</div><div class='add'>+{</div><div class='add'>+	struct nfs4_lockowner *lo = (struct nfs4_lockowner *) cfl-&gt;c.flc_owner;</div><div class='add'>+	struct nfs4_client *clp = lo-&gt;lo_owner.so_client;</div><div class='add'>+	struct nfsd_net *nn;</div><div class='add'>+</div><div class='add'>+	if (try_to_expire_client(clp)) {</div><div class='add'>+		nn = net_generic(clp-&gt;net, nfsd_net_id);</div><div class='add'>+		mod_delayed_work(laundry_wq, &amp;nn-&gt;laundromat_work, 0);</div><div class='add'>+		return true;</div><div class='add'>+	}</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/* schedule laundromat to run immediately and wait for it to complete */</div><div class='add'>+static void</div><div class='add'>+nfsd4_lm_expire_lock(void)</div><div class='add'>+{</div><div class='add'>+	flush_workqueue(laundry_wq);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static void</div><div class='ctx'> nfsd4_lm_notify(struct file_lock *fl)</div><div class='ctx'> {</div><div class='del'>-	struct nfs4_lockowner		*lo = (struct nfs4_lockowner *)fl-&gt;fl_owner;</div><div class='add'>+	struct nfs4_lockowner		*lo = (struct nfs4_lockowner *) fl-&gt;c.flc_owner;</div><div class='ctx'> 	struct net			*net = lo-&gt;lo_owner.so_client-&gt;net;</div><div class='ctx'> 	struct nfsd_net			*nn = net_generic(net, nfsd_net_id);</div><div class='ctx'> 	struct nfsd4_blocked_lock	*nbl = container_of(fl,</div><div class='hunk'>@@ -6535,14 +7944,17 @@ nfsd4_lm_notify(struct file_lock *fl)</div><div class='ctx'> </div><div class='ctx'> 	if (queue) {</div><div class='ctx'> 		trace_nfsd_cb_notify_lock(lo, nbl);</div><div class='del'>-		nfsd4_run_cb(&amp;nbl-&gt;nbl_cb);</div><div class='add'>+		nfsd4_try_run_cb(&amp;nbl-&gt;nbl_cb);</div><div class='ctx'> 	}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static const struct lock_manager_operations nfsd_posix_mng_ops  = {</div><div class='add'>+	.lm_mod_owner = THIS_MODULE,</div><div class='ctx'> 	.lm_notify = nfsd4_lm_notify,</div><div class='del'>-	.lm_get_owner = nfsd4_fl_get_owner,</div><div class='del'>-	.lm_put_owner = nfsd4_fl_put_owner,</div><div class='add'>+	.lm_get_owner = nfsd4_lm_get_owner,</div><div class='add'>+	.lm_put_owner = nfsd4_lm_put_owner,</div><div class='add'>+	.lm_lock_expirable = nfsd4_lm_lock_expirable,</div><div class='add'>+	.lm_expire_lock = nfsd4_lm_expire_lock,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static inline void</div><div class='hunk'>@@ -6551,7 +7963,7 @@ nfs4_set_lock_denied(struct file_lock *fl, struct nfsd4_lock_denied *deny)</div><div class='ctx'> 	struct nfs4_lockowner *lo;</div><div class='ctx'> </div><div class='ctx'> 	if (fl-&gt;fl_lmops == &amp;nfsd_posix_mng_ops) {</div><div class='del'>-		lo = (struct nfs4_lockowner *) fl-&gt;fl_owner;</div><div class='add'>+		lo = (struct nfs4_lockowner *) fl-&gt;c.flc_owner;</div><div class='ctx'> 		xdr_netobj_dup(&amp;deny-&gt;ld_owner, &amp;lo-&gt;lo_owner.so_owner,</div><div class='ctx'> 						GFP_KERNEL);</div><div class='ctx'> 		if (!deny-&gt;ld_owner.data)</div><div class='hunk'>@@ -6570,7 +7982,7 @@ nevermind:</div><div class='ctx'> 	if (fl-&gt;fl_end != NFS4_MAX_UINT64)</div><div class='ctx'> 		deny-&gt;ld_length = fl-&gt;fl_end - fl-&gt;fl_start + 1;        </div><div class='ctx'> 	deny-&gt;ld_type = NFS4_READ_LT;</div><div class='del'>-	if (fl-&gt;fl_type != F_RDLCK)</div><div class='add'>+	if (fl-&gt;c.flc_type != F_RDLCK)</div><div class='ctx'> 		deny-&gt;ld_type = NFS4_WRITE_LT;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -6692,7 +8104,7 @@ retry:</div><div class='ctx'> 	if (retstp)</div><div class='ctx'> 		goto out_found;</div><div class='ctx'> 	refcount_inc(&amp;stp-&gt;st_stid.sc_count);</div><div class='del'>-	stp-&gt;st_stid.sc_type = NFS4_LOCK_STID;</div><div class='add'>+	stp-&gt;st_stid.sc_type = SC_TYPE_LOCK;</div><div class='ctx'> 	stp-&gt;st_stateowner = nfs4_get_stateowner(&amp;lo-&gt;lo_owner);</div><div class='ctx'> 	get_nfs4_file(fp);</div><div class='ctx'> 	stp-&gt;st_stid.sc_file = fp;</div><div class='hunk'>@@ -6831,13 +8243,12 @@ nfsd4_lock(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	struct nfsd4_blocked_lock *nbl = NULL;</div><div class='ctx'> 	struct file_lock *file_lock = NULL;</div><div class='ctx'> 	struct file_lock *conflock = NULL;</div><div class='del'>-	struct super_block *sb;</div><div class='ctx'> 	__be32 status = 0;</div><div class='ctx'> 	int lkflg;</div><div class='ctx'> 	int err;</div><div class='ctx'> 	bool new = false;</div><div class='del'>-	unsigned char fl_type;</div><div class='del'>-	unsigned int fl_flags = FL_POSIX;</div><div class='add'>+	unsigned char type;</div><div class='add'>+	unsigned int flags = FL_POSIX;</div><div class='ctx'> 	struct net *net = SVC_NET(rqstp);</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='ctx'> </div><div class='hunk'>@@ -6848,12 +8259,13 @@ nfsd4_lock(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	if (check_lock_length(lock-&gt;lk_offset, lock-&gt;lk_length))</div><div class='ctx'> 		 return nfserr_inval;</div><div class='ctx'> </div><div class='del'>-	if ((status = fh_verify(rqstp, &amp;cstate-&gt;current_fh,</div><div class='del'>-				S_IFREG, NFSD_MAY_LOCK))) {</div><div class='del'>-		dprintk("NFSD: nfsd4_lock: permission denied!\n");</div><div class='add'>+	status = fh_verify(rqstp, &amp;cstate-&gt;current_fh, S_IFREG, 0);</div><div class='add'>+	if (status != nfs_ok)</div><div class='ctx'> 		return status;</div><div class='add'>+	if (exportfs_cannot_lock(cstate-&gt;current_fh.fh_dentry-&gt;d_sb-&gt;s_export_op)) {</div><div class='add'>+		status = nfserr_notsupp;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='del'>-	sb = cstate-&gt;current_fh.fh_dentry-&gt;d_sb;</div><div class='ctx'> </div><div class='ctx'> 	if (lock-&gt;lk_is_new) {</div><div class='ctx'> 		if (nfsd4_has_session(cstate))</div><div class='hunk'>@@ -6879,9 +8291,10 @@ nfsd4_lock(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 							&amp;lock_stp, &amp;new);</div><div class='ctx'> 	} else {</div><div class='ctx'> 		status = nfs4_preprocess_seqid_op(cstate,</div><div class='del'>-				       lock-&gt;lk_old_lock_seqid,</div><div class='del'>-				       &amp;lock-&gt;lk_old_lock_stateid,</div><div class='del'>-				       NFS4_LOCK_STID, &amp;lock_stp, nn);</div><div class='add'>+						  lock-&gt;lk_old_lock_seqid,</div><div class='add'>+						  &amp;lock-&gt;lk_old_lock_stateid,</div><div class='add'>+						  SC_TYPE_LOCK, 0, &amp;lock_stp,</div><div class='add'>+						  nn);</div><div class='ctx'> 	}</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -6900,14 +8313,11 @@ nfsd4_lock(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	if (lock-&gt;lk_reclaim)</div><div class='del'>-		fl_flags |= FL_RECLAIM;</div><div class='add'>+		flags |= FL_RECLAIM;</div><div class='ctx'> </div><div class='ctx'> 	fp = lock_stp-&gt;st_stid.sc_file;</div><div class='ctx'> 	switch (lock-&gt;lk_type) {</div><div class='ctx'> 		case NFS4_READW_LT:</div><div class='del'>-			if (nfsd4_has_session(cstate) &amp;&amp;</div><div class='del'>-			    !(sb-&gt;s_export_op-&gt;flags &amp; EXPORT_OP_SYNC_LOCKS))</div><div class='del'>-				fl_flags |= FL_SLEEP;</div><div class='ctx'> 			fallthrough;</div><div class='ctx'> 		case NFS4_READ_LT:</div><div class='ctx'> 			spin_lock(&amp;fp-&gt;fi_lock);</div><div class='hunk'>@@ -6915,12 +8325,9 @@ nfsd4_lock(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 			if (nf)</div><div class='ctx'> 				get_lock_access(lock_stp, NFS4_SHARE_ACCESS_READ);</div><div class='ctx'> 			spin_unlock(&amp;fp-&gt;fi_lock);</div><div class='del'>-			fl_type = F_RDLCK;</div><div class='add'>+			type = F_RDLCK;</div><div class='ctx'> 			break;</div><div class='ctx'> 		case NFS4_WRITEW_LT:</div><div class='del'>-			if (nfsd4_has_session(cstate) &amp;&amp;</div><div class='del'>-			    !(sb-&gt;s_export_op-&gt;flags &amp; EXPORT_OP_SYNC_LOCKS))</div><div class='del'>-				fl_flags |= FL_SLEEP;</div><div class='ctx'> 			fallthrough;</div><div class='ctx'> 		case NFS4_WRITE_LT:</div><div class='ctx'> 			spin_lock(&amp;fp-&gt;fi_lock);</div><div class='hunk'>@@ -6928,7 +8335,7 @@ nfsd4_lock(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 			if (nf)</div><div class='ctx'> 				get_lock_access(lock_stp, NFS4_SHARE_ACCESS_WRITE);</div><div class='ctx'> 			spin_unlock(&amp;fp-&gt;fi_lock);</div><div class='del'>-			fl_type = F_WRLCK;</div><div class='add'>+			type = F_WRLCK;</div><div class='ctx'> 			break;</div><div class='ctx'> 		default:</div><div class='ctx'> 			status = nfserr_inval;</div><div class='hunk'>@@ -6940,6 +8347,11 @@ nfsd4_lock(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	if (lock-&gt;lk_type &amp; (NFS4_READW_LT | NFS4_WRITEW_LT) &amp;&amp;</div><div class='add'>+		nfsd4_has_session(cstate) &amp;&amp;</div><div class='add'>+		locks_can_async_lock(nf-&gt;nf_file-&gt;f_op))</div><div class='add'>+			flags |= FL_SLEEP;</div><div class='add'>+</div><div class='ctx'> 	nbl = find_or_allocate_block(lock_sop, &amp;fp-&gt;fi_fhandle, nn);</div><div class='ctx'> 	if (!nbl) {</div><div class='ctx'> 		dprintk("NFSD: %s: unable to allocate block!\n", __func__);</div><div class='hunk'>@@ -6948,11 +8360,11 @@ nfsd4_lock(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	file_lock = &amp;nbl-&gt;nbl_lock;</div><div class='del'>-	file_lock-&gt;fl_type = fl_type;</div><div class='del'>-	file_lock-&gt;fl_owner = (fl_owner_t)lockowner(nfs4_get_stateowner(&amp;lock_sop-&gt;lo_owner));</div><div class='del'>-	file_lock-&gt;fl_pid = current-&gt;tgid;</div><div class='del'>-	file_lock-&gt;fl_file = nf-&gt;nf_file;</div><div class='del'>-	file_lock-&gt;fl_flags = fl_flags;</div><div class='add'>+	file_lock-&gt;c.flc_type = type;</div><div class='add'>+	file_lock-&gt;c.flc_owner = (fl_owner_t)lockowner(nfs4_get_stateowner(&amp;lock_sop-&gt;lo_owner));</div><div class='add'>+	file_lock-&gt;c.flc_pid = current-&gt;tgid;</div><div class='add'>+	file_lock-&gt;c.flc_file = nf-&gt;nf_file;</div><div class='add'>+	file_lock-&gt;c.flc_flags = flags;</div><div class='ctx'> 	file_lock-&gt;fl_lmops = &amp;nfsd_posix_mng_ops;</div><div class='ctx'> 	file_lock-&gt;fl_start = lock-&gt;lk_offset;</div><div class='ctx'> 	file_lock-&gt;fl_end = last_byte_offset(lock-&gt;lk_offset, lock-&gt;lk_length);</div><div class='hunk'>@@ -6965,11 +8377,12 @@ nfsd4_lock(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (fl_flags &amp; FL_SLEEP) {</div><div class='add'>+	if (flags &amp; FL_SLEEP) {</div><div class='ctx'> 		nbl-&gt;nbl_time = ktime_get_boottime_seconds();</div><div class='ctx'> 		spin_lock(&amp;nn-&gt;blocked_locks_lock);</div><div class='ctx'> 		list_add_tail(&amp;nbl-&gt;nbl_list, &amp;lock_sop-&gt;lo_blocked);</div><div class='ctx'> 		list_add_tail(&amp;nbl-&gt;nbl_lru, &amp;nn-&gt;blocked_locks_lru);</div><div class='add'>+		kref_get(&amp;nbl-&gt;nbl_kref);</div><div class='ctx'> 		spin_unlock(&amp;nn-&gt;blocked_locks_lock);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='hunk'>@@ -6982,6 +8395,7 @@ nfsd4_lock(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 			nn-&gt;somebody_reclaimed = true;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case FILE_LOCK_DEFERRED:</div><div class='add'>+		kref_put(&amp;nbl-&gt;nbl_kref, free_nbl);</div><div class='ctx'> 		nbl = NULL;</div><div class='ctx'> 		fallthrough;</div><div class='ctx'> 	case -EAGAIN:		/* conflock holds conflicting lock */</div><div class='hunk'>@@ -7000,10 +8414,15 @@ nfsd4_lock(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> out:</div><div class='ctx'> 	if (nbl) {</div><div class='ctx'> 		/* dequeue it if we queued it before */</div><div class='del'>-		if (fl_flags &amp; FL_SLEEP) {</div><div class='add'>+		if (flags &amp; FL_SLEEP) {</div><div class='ctx'> 			spin_lock(&amp;nn-&gt;blocked_locks_lock);</div><div class='del'>-			list_del_init(&amp;nbl-&gt;nbl_list);</div><div class='del'>-			list_del_init(&amp;nbl-&gt;nbl_lru);</div><div class='add'>+			if (!list_empty(&amp;nbl-&gt;nbl_list) &amp;&amp;</div><div class='add'>+			    !list_empty(&amp;nbl-&gt;nbl_lru)) {</div><div class='add'>+				list_del_init(&amp;nbl-&gt;nbl_list);</div><div class='add'>+				list_del_init(&amp;nbl-&gt;nbl_lru);</div><div class='add'>+				kref_put(&amp;nbl-&gt;nbl_kref, free_nbl);</div><div class='add'>+			}</div><div class='add'>+			/* nbl can use one of lists to be linked to reaplist */</div><div class='ctx'> 			spin_unlock(&amp;nn-&gt;blocked_locks_lock);</div><div class='ctx'> 		}</div><div class='ctx'> 		free_blocked_lock(nbl);</div><div class='hunk'>@@ -7036,6 +8455,14 @@ out:</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void nfsd4_lock_release(union nfsd4_op_u *u)</div><div class='add'>+{</div><div class='add'>+	struct nfsd4_lock *lock = &amp;u-&gt;lock;</div><div class='add'>+	struct nfsd4_lock_denied *deny = &amp;lock-&gt;lk_denied;</div><div class='add'>+</div><div class='add'>+	kfree(deny-&gt;ld_owner.data);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * The NFSv4 spec allows a client to do a LOCKT without holding an OPEN,</div><div class='ctx'>  * so we do a temporary open here just to get an open file to pass to</div><div class='hunk'>@@ -7044,21 +8471,22 @@ out:</div><div class='ctx'> static __be32 nfsd_test_lock(struct svc_rqst *rqstp, struct svc_fh *fhp, struct file_lock *lock)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd_file *nf;</div><div class='add'>+	struct inode *inode;</div><div class='ctx'> 	__be32 err;</div><div class='ctx'> </div><div class='ctx'> 	err = nfsd_file_acquire(rqstp, fhp, NFSD_MAY_READ, &amp;nf);</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		return err;</div><div class='del'>-	fh_lock(fhp); /* to block new leases till after test_lock: */</div><div class='del'>-	err = nfserrno(nfsd_open_break_lease(fhp-&gt;fh_dentry-&gt;d_inode,</div><div class='del'>-							NFSD_MAY_READ));</div><div class='add'>+	inode = fhp-&gt;fh_dentry-&gt;d_inode;</div><div class='add'>+	inode_lock(inode); /* to block new leases till after test_lock: */</div><div class='add'>+	err = nfserrno(nfsd_open_break_lease(inode, NFSD_MAY_READ));</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out;</div><div class='del'>-	lock-&gt;fl_file = nf-&gt;nf_file;</div><div class='add'>+	lock-&gt;c.flc_file = nf-&gt;nf_file;</div><div class='ctx'> 	err = nfserrno(vfs_test_lock(nf-&gt;nf_file, lock));</div><div class='del'>-	lock-&gt;fl_file = NULL;</div><div class='add'>+	lock-&gt;c.flc_file = NULL;</div><div class='ctx'> out:</div><div class='del'>-	fh_unlock(fhp);</div><div class='add'>+	inode_unlock(inode);</div><div class='ctx'> 	nfsd_file_put(nf);</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='hunk'>@@ -7101,11 +8529,11 @@ nfsd4_lockt(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	switch (lockt-&gt;lt_type) {</div><div class='ctx'> 		case NFS4_READ_LT:</div><div class='ctx'> 		case NFS4_READW_LT:</div><div class='del'>-			file_lock-&gt;fl_type = F_RDLCK;</div><div class='add'>+			file_lock-&gt;c.flc_type = F_RDLCK;</div><div class='ctx'> 			break;</div><div class='ctx'> 		case NFS4_WRITE_LT:</div><div class='ctx'> 		case NFS4_WRITEW_LT:</div><div class='del'>-			file_lock-&gt;fl_type = F_WRLCK;</div><div class='add'>+			file_lock-&gt;c.flc_type = F_WRLCK;</div><div class='ctx'> 			break;</div><div class='ctx'> 		default:</div><div class='ctx'> 			dprintk("NFSD: nfs4_lockt: bad lock type!\n");</div><div class='hunk'>@@ -7115,9 +8543,9 @@ nfsd4_lockt(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> </div><div class='ctx'> 	lo = find_lockowner_str(cstate-&gt;clp, &amp;lockt-&gt;lt_owner);</div><div class='ctx'> 	if (lo)</div><div class='del'>-		file_lock-&gt;fl_owner = (fl_owner_t)lo;</div><div class='del'>-	file_lock-&gt;fl_pid = current-&gt;tgid;</div><div class='del'>-	file_lock-&gt;fl_flags = FL_POSIX;</div><div class='add'>+		file_lock-&gt;c.flc_owner = (fl_owner_t)lo;</div><div class='add'>+	file_lock-&gt;c.flc_pid = current-&gt;tgid;</div><div class='add'>+	file_lock-&gt;c.flc_flags = FL_POSIX;</div><div class='ctx'> </div><div class='ctx'> 	file_lock-&gt;fl_start = lockt-&gt;lt_offset;</div><div class='ctx'> 	file_lock-&gt;fl_end = last_byte_offset(lockt-&gt;lt_offset, lockt-&gt;lt_length);</div><div class='hunk'>@@ -7128,7 +8556,7 @@ nfsd4_lockt(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	if (file_lock-&gt;fl_type != F_UNLCK) {</div><div class='add'>+	if (file_lock-&gt;c.flc_type != F_UNLCK) {</div><div class='ctx'> 		status = nfserr_denied;</div><div class='ctx'> 		nfs4_set_lock_denied(file_lock, &amp;lockt-&gt;lt_denied);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -7140,6 +8568,14 @@ out:</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+void nfsd4_lockt_release(union nfsd4_op_u *u)</div><div class='add'>+{</div><div class='add'>+	struct nfsd4_lockt *lockt = &amp;u-&gt;lockt;</div><div class='add'>+	struct nfsd4_lock_denied *deny = &amp;lockt-&gt;lt_denied;</div><div class='add'>+</div><div class='add'>+	kfree(deny-&gt;ld_owner.data);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> __be32</div><div class='ctx'> nfsd4_locku(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 	    union nfsd4_op_u *u)</div><div class='hunk'>@@ -7160,8 +8596,8 @@ nfsd4_locku(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 		 return nfserr_inval;</div><div class='ctx'> </div><div class='ctx'> 	status = nfs4_preprocess_seqid_op(cstate, locku-&gt;lu_seqid,</div><div class='del'>-					&amp;locku-&gt;lu_stateid, NFS4_LOCK_STID,</div><div class='del'>-					&amp;stp, nn);</div><div class='add'>+					  &amp;locku-&gt;lu_stateid, SC_TYPE_LOCK, 0,</div><div class='add'>+					  &amp;stp, nn);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	nf = find_any_file(stp-&gt;st_stid.sc_file);</div><div class='hunk'>@@ -7169,6 +8605,11 @@ nfsd4_locku(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 		status = nfserr_lock_range;</div><div class='ctx'> 		goto put_stateid;</div><div class='ctx'> 	}</div><div class='add'>+	if (exportfs_cannot_lock(nf-&gt;nf_file-&gt;f_path.mnt-&gt;mnt_sb-&gt;s_export_op)) {</div><div class='add'>+		status = nfserr_notsupp;</div><div class='add'>+		goto put_file;</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	file_lock = locks_alloc_lock();</div><div class='ctx'> 	if (!file_lock) {</div><div class='ctx'> 		dprintk("NFSD: %s: unable to allocate lock!\n", __func__);</div><div class='hunk'>@@ -7176,11 +8617,11 @@ nfsd4_locku(struct svc_rqst *rqstp, struct nfsd4_compound_state *cstate,</div><div class='ctx'> 		goto put_file;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	file_lock-&gt;fl_type = F_UNLCK;</div><div class='del'>-	file_lock-&gt;fl_owner = (fl_owner_t)lockowner(nfs4_get_stateowner(stp-&gt;st_stateowner));</div><div class='del'>-	file_lock-&gt;fl_pid = current-&gt;tgid;</div><div class='del'>-	file_lock-&gt;fl_file = nf-&gt;nf_file;</div><div class='del'>-	file_lock-&gt;fl_flags = FL_POSIX;</div><div class='add'>+	file_lock-&gt;c.flc_type = F_UNLCK;</div><div class='add'>+	file_lock-&gt;c.flc_owner = (fl_owner_t)lockowner(nfs4_get_stateowner(stp-&gt;st_stateowner));</div><div class='add'>+	file_lock-&gt;c.flc_pid = current-&gt;tgid;</div><div class='add'>+	file_lock-&gt;c.flc_file = nf-&gt;nf_file;</div><div class='add'>+	file_lock-&gt;c.flc_flags = FL_POSIX;</div><div class='ctx'> 	file_lock-&gt;fl_lmops = &amp;nfsd_posix_mng_ops;</div><div class='ctx'> 	file_lock-&gt;fl_start = locku-&gt;lu_offset;</div><div class='ctx'> </div><div class='hunk'>@@ -7220,49 +8661,64 @@ check_for_locks(struct nfs4_file *fp, struct nfs4_lockowner *lowner)</div><div class='ctx'> {</div><div class='ctx'> 	struct file_lock *fl;</div><div class='ctx'> 	int status = false;</div><div class='del'>-	struct nfsd_file *nf = find_any_file(fp);</div><div class='add'>+	struct nfsd_file *nf;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> 	struct file_lock_context *flctx;</div><div class='ctx'> </div><div class='add'>+	spin_lock(&amp;fp-&gt;fi_lock);</div><div class='add'>+	nf = find_any_file_locked(fp);</div><div class='ctx'> 	if (!nf) {</div><div class='ctx'> 		/* Any valid lock stateid should have some sort of access */</div><div class='ctx'> 		WARN_ON_ONCE(1);</div><div class='del'>-		return status;</div><div class='add'>+		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	inode = locks_inode(nf-&gt;nf_file);</div><div class='del'>-	flctx = inode-&gt;i_flctx;</div><div class='add'>+	inode = file_inode(nf-&gt;nf_file);</div><div class='add'>+	flctx = locks_inode_context(inode);</div><div class='ctx'> </div><div class='ctx'> 	if (flctx &amp;&amp; !list_empty_careful(&amp;flctx-&gt;flc_posix)) {</div><div class='ctx'> 		spin_lock(&amp;flctx-&gt;flc_lock);</div><div class='del'>-		list_for_each_entry(fl, &amp;flctx-&gt;flc_posix, fl_list) {</div><div class='del'>-			if (fl-&gt;fl_owner == (fl_owner_t)lowner) {</div><div class='add'>+		for_each_file_lock(fl, &amp;flctx-&gt;flc_posix) {</div><div class='add'>+			if (fl-&gt;c.flc_owner == (fl_owner_t)lowner) {</div><div class='ctx'> 				status = true;</div><div class='ctx'> 				break;</div><div class='ctx'> 			}</div><div class='ctx'> 		}</div><div class='ctx'> 		spin_unlock(&amp;flctx-&gt;flc_lock);</div><div class='ctx'> 	}</div><div class='del'>-	nfsd_file_put(nf);</div><div class='add'>+out:</div><div class='add'>+	spin_unlock(&amp;fp-&gt;fi_lock);</div><div class='ctx'> 	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * nfsd4_release_lockowner - process NFSv4.0 RELEASE_LOCKOWNER operations</div><div class='add'>+ * @rqstp: RPC transaction</div><div class='add'>+ * @cstate: NFSv4 COMPOUND state</div><div class='add'>+ * @u: RELEASE_LOCKOWNER arguments</div><div class='add'>+ *</div><div class='add'>+ * Check if there are any locks still held and if not, free the lockowner</div><div class='add'>+ * and any lock state that is owned.</div><div class='add'>+ *</div><div class='add'>+ * Return values:</div><div class='add'>+ *   %nfs_ok: lockowner released or not found</div><div class='add'>+ *   %nfserr_locks_held: lockowner still in use</div><div class='add'>+ *   %nfserr_stale_clientid: clientid no longer active</div><div class='add'>+ *   %nfserr_expired: clientid not recognized</div><div class='add'>+ */</div><div class='ctx'> __be32</div><div class='ctx'> nfsd4_release_lockowner(struct svc_rqst *rqstp,</div><div class='ctx'> 			struct nfsd4_compound_state *cstate,</div><div class='ctx'> 			union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd4_release_lockowner *rlockowner = &amp;u-&gt;release_lockowner;</div><div class='add'>+	struct nfsd_net *nn = net_generic(SVC_NET(rqstp), nfsd_net_id);</div><div class='ctx'> 	clientid_t *clid = &amp;rlockowner-&gt;rl_clientid;</div><div class='del'>-	struct nfs4_stateowner *sop;</div><div class='del'>-	struct nfs4_lockowner *lo = NULL;</div><div class='ctx'> 	struct nfs4_ol_stateid *stp;</div><div class='del'>-	struct xdr_netobj *owner = &amp;rlockowner-&gt;rl_owner;</div><div class='del'>-	unsigned int hashval = ownerstr_hashval(owner);</div><div class='del'>-	__be32 status;</div><div class='del'>-	struct nfsd_net *nn = net_generic(SVC_NET(rqstp), nfsd_net_id);</div><div class='add'>+	struct nfs4_lockowner *lo;</div><div class='ctx'> 	struct nfs4_client *clp;</div><div class='del'>-	LIST_HEAD (reaplist);</div><div class='add'>+	LIST_HEAD(reaplist);</div><div class='add'>+	__be32 status;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("nfsd4_release_lockowner clientid: (%08x/%08x):\n",</div><div class='ctx'> 		clid-&gt;cl_boot, clid-&gt;cl_id);</div><div class='hunk'>@@ -7270,48 +8726,36 @@ nfsd4_release_lockowner(struct svc_rqst *rqstp,</div><div class='ctx'> 	status = set_client(clid, cstate, nn);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		return status;</div><div class='del'>-</div><div class='ctx'> 	clp = cstate-&gt;clp;</div><div class='del'>-	/* Find the matching lock stateowner */</div><div class='del'>-	spin_lock(&amp;clp-&gt;cl_lock);</div><div class='del'>-	list_for_each_entry(sop, &amp;clp-&gt;cl_ownerstr_hashtbl[hashval],</div><div class='del'>-			    so_strhash) {</div><div class='del'>-</div><div class='del'>-		if (sop-&gt;so_is_open_owner || !same_owner_str(sop, owner))</div><div class='del'>-			continue;</div><div class='del'>-</div><div class='del'>-		/* see if there are still any locks associated with it */</div><div class='del'>-		lo = lockowner(sop);</div><div class='del'>-		list_for_each_entry(stp, &amp;sop-&gt;so_stateids, st_perstateowner) {</div><div class='del'>-			if (check_for_locks(stp-&gt;st_stid.sc_file, lo)) {</div><div class='del'>-				status = nfserr_locks_held;</div><div class='del'>-				spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='del'>-				return status;</div><div class='del'>-			}</div><div class='del'>-		}</div><div class='ctx'> </div><div class='del'>-		nfs4_get_stateowner(sop);</div><div class='del'>-		break;</div><div class='del'>-	}</div><div class='add'>+	spin_lock(&amp;clp-&gt;cl_lock);</div><div class='add'>+	lo = find_lockowner_str_locked(clp, &amp;rlockowner-&gt;rl_owner);</div><div class='ctx'> 	if (!lo) {</div><div class='ctx'> 		spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='del'>-		return status;</div><div class='add'>+		return nfs_ok;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	list_for_each_entry(stp, &amp;lo-&gt;lo_owner.so_stateids, st_perstateowner) {</div><div class='add'>+		if (check_for_locks(stp-&gt;st_stid.sc_file, lo)) {</div><div class='add'>+			spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='add'>+			nfs4_put_stateowner(&amp;lo-&gt;lo_owner);</div><div class='add'>+			return nfserr_locks_held;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='ctx'> 	unhash_lockowner_locked(lo);</div><div class='ctx'> 	while (!list_empty(&amp;lo-&gt;lo_owner.so_stateids)) {</div><div class='ctx'> 		stp = list_first_entry(&amp;lo-&gt;lo_owner.so_stateids,</div><div class='ctx'> 				       struct nfs4_ol_stateid,</div><div class='ctx'> 				       st_perstateowner);</div><div class='del'>-		WARN_ON(!unhash_lock_stateid(stp));</div><div class='add'>+		unhash_lock_stateid(stp);</div><div class='ctx'> 		put_ol_stateid_locked(stp, &amp;reaplist);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='add'>+</div><div class='ctx'> 	free_ol_stateid_reaplist(&amp;reaplist);</div><div class='ctx'> 	remove_blocked_locks(lo);</div><div class='ctx'> 	nfs4_put_stateowner(&amp;lo-&gt;lo_owner);</div><div class='del'>-</div><div class='del'>-	return status;</div><div class='add'>+	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline struct nfs4_client_reclaim *</div><div class='hunk'>@@ -7331,9 +8775,6 @@ nfs4_has_reclaimed_state(struct xdr_netobj name, struct nfsd_net *nn)</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * failure =&gt; all reset bets are off, nfserr_no_grace...</div><div class='del'>- *</div><div class='del'>- * The caller is responsible for freeing name.data if NULL is returned (it</div><div class='del'>- * will be freed in nfs4_remove_reclaim_record in the normal case).</div><div class='ctx'>  */</div><div class='ctx'> struct nfs4_client_reclaim *</div><div class='ctx'> nfs4_client_to_reclaim(struct xdr_netobj name, struct xdr_netobj princhash,</div><div class='hunk'>@@ -7342,6 +8783,22 @@ nfs4_client_to_reclaim(struct xdr_netobj name, struct xdr_netobj princhash,</div><div class='ctx'> 	unsigned int strhashval;</div><div class='ctx'> 	struct nfs4_client_reclaim *crp;</div><div class='ctx'> </div><div class='add'>+	name.data = kmemdup(name.data, name.len, GFP_KERNEL);</div><div class='add'>+	if (!name.data) {</div><div class='add'>+		dprintk("%s: failed to allocate memory for name.data!\n",</div><div class='add'>+			__func__);</div><div class='add'>+		return NULL;</div><div class='add'>+	}</div><div class='add'>+	if (princhash.len) {</div><div class='add'>+		princhash.data = kmemdup(princhash.data, princhash.len, GFP_KERNEL);</div><div class='add'>+		if (!princhash.data) {</div><div class='add'>+			dprintk("%s: failed to allocate memory for princhash.data!\n",</div><div class='add'>+				__func__);</div><div class='add'>+			kfree(name.data);</div><div class='add'>+			return NULL;</div><div class='add'>+		}</div><div class='add'>+	} else</div><div class='add'>+		princhash.data = NULL;</div><div class='ctx'> 	crp = alloc_reclaim();</div><div class='ctx'> 	if (crp) {</div><div class='ctx'> 		strhashval = clientstr_hashval(name);</div><div class='hunk'>@@ -7353,6 +8810,9 @@ nfs4_client_to_reclaim(struct xdr_netobj name, struct xdr_netobj princhash,</div><div class='ctx'> 		crp-&gt;cr_princhash.len = princhash.len;</div><div class='ctx'> 		crp-&gt;cr_clp = NULL;</div><div class='ctx'> 		nn-&gt;reclaim_str_hashtbl_size++;</div><div class='add'>+	} else {</div><div class='add'>+		kfree(name.data);</div><div class='add'>+		kfree(princhash.data);</div><div class='ctx'> 	}</div><div class='ctx'> 	return crp;</div><div class='ctx'> }</div><div class='hunk'>@@ -7472,15 +8932,30 @@ static int nfs4_state_create_net(struct net *net)</div><div class='ctx'> 	spin_lock_init(&amp;nn-&gt;client_lock);</div><div class='ctx'> 	spin_lock_init(&amp;nn-&gt;s2s_cp_lock);</div><div class='ctx'> 	idr_init(&amp;nn-&gt;s2s_cp_stateids);</div><div class='add'>+	atomic_set(&amp;nn-&gt;pending_async_copies, 0);</div><div class='ctx'> </div><div class='ctx'> 	spin_lock_init(&amp;nn-&gt;blocked_locks_lock);</div><div class='ctx'> 	INIT_LIST_HEAD(&amp;nn-&gt;blocked_locks_lru);</div><div class='ctx'> </div><div class='ctx'> 	INIT_DELAYED_WORK(&amp;nn-&gt;laundromat_work, laundromat_main);</div><div class='add'>+	INIT_WORK(&amp;nn-&gt;nfsd_shrinker_work, nfsd4_state_shrinker_worker);</div><div class='ctx'> 	get_net(net);</div><div class='ctx'> </div><div class='add'>+	nn-&gt;nfsd_client_shrinker = shrinker_alloc(0, "nfsd-client");</div><div class='add'>+	if (!nn-&gt;nfsd_client_shrinker)</div><div class='add'>+		goto err_shrinker;</div><div class='add'>+</div><div class='add'>+	nn-&gt;nfsd_client_shrinker-&gt;scan_objects = nfsd4_state_shrinker_scan;</div><div class='add'>+	nn-&gt;nfsd_client_shrinker-&gt;count_objects = nfsd4_state_shrinker_count;</div><div class='add'>+	nn-&gt;nfsd_client_shrinker-&gt;private_data = nn;</div><div class='add'>+</div><div class='add'>+	shrinker_register(nn-&gt;nfsd_client_shrinker);</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='add'>+err_shrinker:</div><div class='add'>+	put_net(net);</div><div class='add'>+	kfree(nn-&gt;sessionid_hashtbl);</div><div class='ctx'> err_sessionid:</div><div class='ctx'> 	kfree(nn-&gt;unconf_id_hashtbl);</div><div class='ctx'> err_unconf_id:</div><div class='hunk'>@@ -7546,28 +9021,26 @@ skip_grace:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* initialization to perform when the nfsd service is started: */</div><div class='del'>-</div><div class='ctx'> int</div><div class='ctx'> nfs4_state_start(void)</div><div class='ctx'> {</div><div class='ctx'> 	int ret;</div><div class='ctx'> </div><div class='del'>-	laundry_wq = alloc_workqueue("%s", WQ_UNBOUND, 0, "nfsd4");</div><div class='del'>-	if (laundry_wq == NULL) {</div><div class='del'>-		ret = -ENOMEM;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-	ret = nfsd4_create_callback_queue();</div><div class='add'>+	ret = rhltable_init(&amp;nfs4_file_rhltable, &amp;nfs4_file_rhash_params);</div><div class='ctx'> 	if (ret)</div><div class='del'>-		goto out_free_laundry;</div><div class='add'>+		return ret;</div><div class='add'>+</div><div class='add'>+	nfsd_slot_shrinker = shrinker_alloc(0, "nfsd-DRC-slot");</div><div class='add'>+	if (!nfsd_slot_shrinker) {</div><div class='add'>+		rhltable_destroy(&amp;nfs4_file_rhltable);</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+	}</div><div class='add'>+	nfsd_slot_shrinker-&gt;count_objects = nfsd_slot_count;</div><div class='add'>+	nfsd_slot_shrinker-&gt;scan_objects = nfsd_slot_scan;</div><div class='add'>+	shrinker_register(nfsd_slot_shrinker);</div><div class='ctx'> </div><div class='ctx'> 	set_max_delegations();</div><div class='ctx'> 	return 0;</div><div class='del'>-</div><div class='del'>-out_free_laundry:</div><div class='del'>-	destroy_workqueue(laundry_wq);</div><div class='del'>-out:</div><div class='del'>-	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void</div><div class='hunk'>@@ -7577,6 +9050,8 @@ nfs4_state_shutdown_net(struct net *net)</div><div class='ctx'> 	struct list_head *pos, *next, reaplist;</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='ctx'> </div><div class='add'>+	shrinker_free(nn-&gt;nfsd_client_shrinker);</div><div class='add'>+	cancel_work_sync(&amp;nn-&gt;nfsd_shrinker_work);</div><div class='ctx'> 	cancel_delayed_work_sync(&amp;nn-&gt;laundromat_work);</div><div class='ctx'> 	locks_end_grace(&amp;nn-&gt;nfsd4_manager);</div><div class='ctx'> </div><div class='hunk'>@@ -7584,7 +9059,7 @@ nfs4_state_shutdown_net(struct net *net)</div><div class='ctx'> 	spin_lock(&amp;state_lock);</div><div class='ctx'> 	list_for_each_safe(pos, next, &amp;nn-&gt;del_recall_lru) {</div><div class='ctx'> 		dp = list_entry (pos, struct nfs4_delegation, dl_recall_lru);</div><div class='del'>-		WARN_ON(!unhash_delegation_locked(dp));</div><div class='add'>+		unhash_delegation_locked(dp, SC_STATUS_CLOSED);</div><div class='ctx'> 		list_add(&amp;dp-&gt;dl_recall_lru, &amp;reaplist);</div><div class='ctx'> 	}</div><div class='ctx'> 	spin_unlock(&amp;state_lock);</div><div class='hunk'>@@ -7604,8 +9079,8 @@ nfs4_state_shutdown_net(struct net *net)</div><div class='ctx'> void</div><div class='ctx'> nfs4_state_shutdown(void)</div><div class='ctx'> {</div><div class='del'>-	destroy_workqueue(laundry_wq);</div><div class='del'>-	nfsd4_destroy_callback_queue();</div><div class='add'>+	rhltable_destroy(&amp;nfs4_file_rhltable);</div><div class='add'>+	shrinker_free(nfsd_slot_shrinker);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='hunk'>@@ -7721,3 +9196,274 @@ nfsd4_get_writestateid(struct nfsd4_compound_state *cstate,</div><div class='ctx'> {</div><div class='ctx'> 	get_stateid(cstate, &amp;u-&gt;write.wr_stateid);</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * nfsd4_vet_deleg_time - vet and set the timespec for a delegated timestamp update</div><div class='add'>+ * @req: timestamp from the client</div><div class='add'>+ * @orig: original timestamp in the inode</div><div class='add'>+ * @now: current time</div><div class='add'>+ *</div><div class='add'>+ * Given a timestamp from the client response, check it against the</div><div class='add'>+ * current timestamp in the inode and the current time. Returns true</div><div class='add'>+ * if the inode's timestamp needs to be updated, and false otherwise.</div><div class='add'>+ * @req may also be changed if the timestamp needs to be clamped.</div><div class='add'>+ */</div><div class='add'>+bool nfsd4_vet_deleg_time(struct timespec64 *req, const struct timespec64 *orig,</div><div class='add'>+			  const struct timespec64 *now)</div><div class='add'>+{</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * "When the time presented is before the original time, then the</div><div class='add'>+	 *  update is ignored." Also no need to update if there is no change.</div><div class='add'>+	 */</div><div class='add'>+	if (timespec64_compare(req, orig) &lt;= 0)</div><div class='add'>+		return false;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * "When the time presented is in the future, the server can either</div><div class='add'>+	 *  clamp the new time to the current time, or it may</div><div class='add'>+	 *  return NFS4ERR_DELAY to the client, allowing it to retry."</div><div class='add'>+	 */</div><div class='add'>+	if (timespec64_compare(req, now) &gt; 0)</div><div class='add'>+		*req = *now;</div><div class='add'>+</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static int cb_getattr_update_times(struct dentry *dentry, struct nfs4_delegation *dp)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='add'>+	struct nfs4_cb_fattr *ncf = &amp;dp-&gt;dl_cb_fattr;</div><div class='add'>+	struct iattr attrs = { };</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (deleg_attrs_deleg(dp-&gt;dl_type)) {</div><div class='add'>+		struct timespec64 now = current_time(inode);</div><div class='add'>+</div><div class='add'>+		attrs.ia_atime = ncf-&gt;ncf_cb_atime;</div><div class='add'>+		attrs.ia_mtime = ncf-&gt;ncf_cb_mtime;</div><div class='add'>+</div><div class='add'>+		if (nfsd4_vet_deleg_time(&amp;attrs.ia_atime, &amp;dp-&gt;dl_atime, &amp;now))</div><div class='add'>+			attrs.ia_valid |= ATTR_ATIME | ATTR_ATIME_SET;</div><div class='add'>+</div><div class='add'>+		if (nfsd4_vet_deleg_time(&amp;attrs.ia_mtime, &amp;dp-&gt;dl_mtime, &amp;now)) {</div><div class='add'>+			attrs.ia_valid |= ATTR_MTIME | ATTR_MTIME_SET;</div><div class='add'>+			attrs.ia_ctime = attrs.ia_mtime;</div><div class='add'>+			if (nfsd4_vet_deleg_time(&amp;attrs.ia_ctime, &amp;dp-&gt;dl_ctime, &amp;now))</div><div class='add'>+				attrs.ia_valid |= ATTR_CTIME | ATTR_CTIME_SET;</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		attrs.ia_valid |= ATTR_MTIME | ATTR_CTIME;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!attrs.ia_valid)</div><div class='add'>+		return 0;</div><div class='add'>+</div><div class='add'>+	attrs.ia_valid |= ATTR_DELEG;</div><div class='add'>+	inode_lock(inode);</div><div class='add'>+	ret = notify_change(&amp;nop_mnt_idmap, dentry, &amp;attrs, NULL);</div><div class='add'>+	inode_unlock(inode);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * nfsd4_deleg_getattr_conflict - Recall if GETATTR causes conflict</div><div class='add'>+ * @rqstp: RPC transaction context</div><div class='add'>+ * @dentry: dentry of inode to be checked for a conflict</div><div class='add'>+ * @pdp: returned WRITE delegation, if one was found</div><div class='add'>+ *</div><div class='add'>+ * This function is called when there is a conflict between a write</div><div class='add'>+ * delegation and a change/size GETATTR from another client. The server</div><div class='add'>+ * must either use the CB_GETATTR to get the current values of the</div><div class='add'>+ * attributes from the client that holds the delegation or recall the</div><div class='add'>+ * delegation before replying to the GETATTR. See RFC 8881 section</div><div class='add'>+ * 18.7.4.</div><div class='add'>+ *</div><div class='add'>+ * Returns 0 if there is no conflict; otherwise an nfs_stat</div><div class='add'>+ * code is returned. If @pdp is set to a non-NULL value, then the</div><div class='add'>+ * caller must put the reference.</div><div class='add'>+ */</div><div class='add'>+__be32</div><div class='add'>+nfsd4_deleg_getattr_conflict(struct svc_rqst *rqstp, struct dentry *dentry,</div><div class='add'>+			     struct nfs4_delegation **pdp)</div><div class='add'>+{</div><div class='add'>+	__be32 status;</div><div class='add'>+	struct nfsd_net *nn = net_generic(SVC_NET(rqstp), nfsd_net_id);</div><div class='add'>+	struct file_lock_context *ctx;</div><div class='add'>+	struct nfs4_delegation *dp = NULL;</div><div class='add'>+	struct file_lease *fl;</div><div class='add'>+	struct nfs4_cb_fattr *ncf;</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='add'>+</div><div class='add'>+	ctx = locks_inode_context(inode);</div><div class='add'>+	if (!ctx)</div><div class='add'>+		return nfs_ok;</div><div class='add'>+</div><div class='add'>+#define NON_NFSD_LEASE ((void *)1)</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;ctx-&gt;flc_lock);</div><div class='add'>+	for_each_file_lock(fl, &amp;ctx-&gt;flc_lease) {</div><div class='add'>+		if (fl-&gt;c.flc_flags == FL_LAYOUT)</div><div class='add'>+			continue;</div><div class='add'>+		if (fl-&gt;c.flc_type == F_WRLCK) {</div><div class='add'>+			if (fl-&gt;fl_lmops == &amp;nfsd_lease_mng_ops)</div><div class='add'>+				dp = fl-&gt;c.flc_owner;</div><div class='add'>+			else</div><div class='add'>+				dp = NON_NFSD_LEASE;</div><div class='add'>+		}</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+	if (dp == NULL || dp == NON_NFSD_LEASE ||</div><div class='add'>+	    dp-&gt;dl_recall.cb_clp == *(rqstp-&gt;rq_lease_breaker)) {</div><div class='add'>+		spin_unlock(&amp;ctx-&gt;flc_lock);</div><div class='add'>+		if (dp == NON_NFSD_LEASE) {</div><div class='add'>+			status = nfserrno(nfsd_open_break_lease(inode,</div><div class='add'>+								NFSD_MAY_READ));</div><div class='add'>+			if (status != nfserr_jukebox ||</div><div class='add'>+			    !nfsd_wait_for_delegreturn(rqstp, inode))</div><div class='add'>+				return status;</div><div class='add'>+		}</div><div class='add'>+		return 0;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	nfsd_stats_wdeleg_getattr_inc(nn);</div><div class='add'>+	refcount_inc(&amp;dp-&gt;dl_stid.sc_count);</div><div class='add'>+	ncf = &amp;dp-&gt;dl_cb_fattr;</div><div class='add'>+	nfs4_cb_getattr(&amp;dp-&gt;dl_cb_fattr);</div><div class='add'>+	spin_unlock(&amp;ctx-&gt;flc_lock);</div><div class='add'>+</div><div class='add'>+	wait_on_bit_timeout(&amp;ncf-&gt;ncf_getattr.cb_flags, NFSD4_CALLBACK_RUNNING,</div><div class='add'>+			    TASK_UNINTERRUPTIBLE, NFSD_CB_GETATTR_TIMEOUT);</div><div class='add'>+	if (ncf-&gt;ncf_cb_status) {</div><div class='add'>+		/* Recall delegation only if client didn't respond */</div><div class='add'>+		status = nfserrno(nfsd_open_break_lease(inode, NFSD_MAY_READ));</div><div class='add'>+		if (status != nfserr_jukebox ||</div><div class='add'>+		    !nfsd_wait_for_delegreturn(rqstp, inode))</div><div class='add'>+			goto out_status;</div><div class='add'>+	}</div><div class='add'>+	if (!ncf-&gt;ncf_file_modified &amp;&amp;</div><div class='add'>+	    (ncf-&gt;ncf_initial_cinfo != ncf-&gt;ncf_cb_change ||</div><div class='add'>+	     ncf-&gt;ncf_cur_fsize != ncf-&gt;ncf_cb_fsize))</div><div class='add'>+		ncf-&gt;ncf_file_modified = true;</div><div class='add'>+	if (ncf-&gt;ncf_file_modified) {</div><div class='add'>+		int err;</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * Per section 10.4.3 of RFC 8881, the server would</div><div class='add'>+		 * not update the file's metadata with the client's</div><div class='add'>+		 * modified size</div><div class='add'>+		 */</div><div class='add'>+		err = cb_getattr_update_times(dentry, dp);</div><div class='add'>+		if (err) {</div><div class='add'>+			status = nfserrno(err);</div><div class='add'>+			goto out_status;</div><div class='add'>+		}</div><div class='add'>+		ncf-&gt;ncf_cur_fsize = ncf-&gt;ncf_cb_fsize;</div><div class='add'>+		*pdp = dp;</div><div class='add'>+		return nfs_ok;</div><div class='add'>+	}</div><div class='add'>+	status = nfs_ok;</div><div class='add'>+out_status:</div><div class='add'>+	nfs4_put_stid(&amp;dp-&gt;dl_stid);</div><div class='add'>+	return status;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * nfsd_get_dir_deleg - attempt to get a directory delegation</div><div class='add'>+ * @cstate: compound state</div><div class='add'>+ * @gdd: GET_DIR_DELEGATION arg/resp structure</div><div class='add'>+ * @nf: nfsd_file opened on the directory</div><div class='add'>+ *</div><div class='add'>+ * Given a GET_DIR_DELEGATION request @gdd, attempt to acquire a delegation</div><div class='add'>+ * on the directory to which @nf refers. Note that this does not set up any</div><div class='add'>+ * sort of async notifications for the delegation.</div><div class='add'>+ */</div><div class='add'>+struct nfs4_delegation *</div><div class='add'>+nfsd_get_dir_deleg(struct nfsd4_compound_state *cstate,</div><div class='add'>+		   struct nfsd4_get_dir_delegation *gdd,</div><div class='add'>+		   struct nfsd_file *nf)</div><div class='add'>+{</div><div class='add'>+	struct nfs4_client *clp = cstate-&gt;clp;</div><div class='add'>+	struct nfs4_delegation *dp;</div><div class='add'>+	struct file_lease *fl;</div><div class='add'>+	struct nfs4_file *fp, *rfp;</div><div class='add'>+	int status = 0;</div><div class='add'>+</div><div class='add'>+	fp = nfsd4_alloc_file();</div><div class='add'>+	if (!fp)</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+</div><div class='add'>+	nfsd4_file_init(&amp;cstate-&gt;current_fh, fp);</div><div class='add'>+</div><div class='add'>+	rfp = nfsd4_file_hash_insert(fp, &amp;cstate-&gt;current_fh);</div><div class='add'>+	if (unlikely(!rfp)) {</div><div class='add'>+		put_nfs4_file(fp);</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (rfp != fp) {</div><div class='add'>+		put_nfs4_file(fp);</div><div class='add'>+		fp = rfp;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* if this client already has one, return that it's unavailable */</div><div class='add'>+	spin_lock(&amp;state_lock);</div><div class='add'>+	spin_lock(&amp;fp-&gt;fi_lock);</div><div class='add'>+	/* existing delegation? */</div><div class='add'>+	if (nfs4_delegation_exists(clp, fp)) {</div><div class='add'>+		status = -EAGAIN;</div><div class='add'>+	} else if (!fp-&gt;fi_deleg_file) {</div><div class='add'>+		fp-&gt;fi_deleg_file = nfsd_file_get(nf);</div><div class='add'>+		fp-&gt;fi_delegees = 1;</div><div class='add'>+	} else {</div><div class='add'>+		++fp-&gt;fi_delegees;</div><div class='add'>+	}</div><div class='add'>+	spin_unlock(&amp;fp-&gt;fi_lock);</div><div class='add'>+	spin_unlock(&amp;state_lock);</div><div class='add'>+</div><div class='add'>+	if (status) {</div><div class='add'>+		put_nfs4_file(fp);</div><div class='add'>+		return ERR_PTR(status);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* Try to set up the lease */</div><div class='add'>+	status = -ENOMEM;</div><div class='add'>+	dp = alloc_init_deleg(clp, fp, NULL, NFS4_OPEN_DELEGATE_READ);</div><div class='add'>+	if (!dp)</div><div class='add'>+		goto out_delegees;</div><div class='add'>+</div><div class='add'>+	fl = nfs4_alloc_init_lease(dp);</div><div class='add'>+	if (!fl)</div><div class='add'>+		goto out_put_stid;</div><div class='add'>+</div><div class='add'>+	status = kernel_setlease(nf-&gt;nf_file,</div><div class='add'>+				 fl-&gt;c.flc_type, &amp;fl, NULL);</div><div class='add'>+	if (fl)</div><div class='add'>+		locks_free_lease(fl);</div><div class='add'>+	if (status)</div><div class='add'>+		goto out_put_stid;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Now, try to hash it. This can fail if we race another nfsd task</div><div class='add'>+	 * trying to set a delegation on the same file. If that happens,</div><div class='add'>+	 * then just say UNAVAIL.</div><div class='add'>+	 */</div><div class='add'>+	spin_lock(&amp;state_lock);</div><div class='add'>+	spin_lock(&amp;clp-&gt;cl_lock);</div><div class='add'>+	spin_lock(&amp;fp-&gt;fi_lock);</div><div class='add'>+	status = hash_delegation_locked(dp, fp);</div><div class='add'>+	spin_unlock(&amp;fp-&gt;fi_lock);</div><div class='add'>+	spin_unlock(&amp;clp-&gt;cl_lock);</div><div class='add'>+	spin_unlock(&amp;state_lock);</div><div class='add'>+</div><div class='add'>+	if (!status)</div><div class='add'>+		return dp;</div><div class='add'>+</div><div class='add'>+	/* Something failed. Drop the lease and clean up the stid */</div><div class='add'>+	kernel_setlease(fp-&gt;fi_deleg_file-&gt;nf_file, F_UNLCK, NULL, (void **)&amp;dp);</div><div class='add'>+out_put_stid:</div><div class='add'>+	nfs4_put_stid(&amp;dp-&gt;dl_stid);</div><div class='add'>+out_delegees:</div><div class='add'>+	put_deleg_file(fp);</div><div class='add'>+	return ERR_PTR(status);</div><div class='add'>+}</div><div class='head'>diff --git a/fs/nfsd/nfs4xdr.c b/fs/nfsd/nfs4xdr.c<br/>index b2a1d969a172..30ce5851fe4c 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfs4xdr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfs4xdr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfs4xdr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/nfs4xdr.c</a></div><div class='hunk'>@@ -42,6 +42,8 @@</div><div class='ctx'> #include &lt;linux/sunrpc/svcauth_gss.h&gt;</div><div class='ctx'> #include &lt;linux/sunrpc/addr.h&gt;</div><div class='ctx'> #include &lt;linux/xattr.h&gt;</div><div class='add'>+#include &lt;linux/vmalloc.h&gt;</div><div class='add'>+</div><div class='ctx'> #include &lt;uapi/linux/xattr.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "idmap.h"</div><div class='hunk'>@@ -53,6 +55,7 @@</div><div class='ctx'> #include "netns.h"</div><div class='ctx'> #include "pnfs.h"</div><div class='ctx'> #include "filecache.h"</div><div class='add'>+#include "nfs4xdr_gen.h"</div><div class='ctx'> </div><div class='ctx'> #include "trace.h"</div><div class='ctx'> </div><div class='hunk'>@@ -116,11 +119,11 @@ static int zero_clientid(clientid_t *clid)</div><div class='ctx'>  * operation described in @argp finishes.</div><div class='ctx'>  */</div><div class='ctx'> static void *</div><div class='del'>-svcxdr_tmpalloc(struct nfsd4_compoundargs *argp, u32 len)</div><div class='add'>+svcxdr_tmpalloc(struct nfsd4_compoundargs *argp, size_t len)</div><div class='ctx'> {</div><div class='ctx'> 	struct svcxdr_tmpbuf *tb;</div><div class='ctx'> </div><div class='del'>-	tb = kmalloc(sizeof(*tb) + len, GFP_KERNEL);</div><div class='add'>+	tb = kmalloc(struct_size(tb, buf, len), GFP_KERNEL);</div><div class='ctx'> 	if (!tb)</div><div class='ctx'> 		return NULL;</div><div class='ctx'> 	tb-&gt;next = argp-&gt;to_free;</div><div class='hunk'>@@ -136,9 +139,9 @@ svcxdr_tmpalloc(struct nfsd4_compoundargs *argp, u32 len)</div><div class='ctx'>  * buffer might end on a page boundary.</div><div class='ctx'>  */</div><div class='ctx'> static char *</div><div class='del'>-svcxdr_dupstr(struct nfsd4_compoundargs *argp, void *buf, u32 len)</div><div class='add'>+svcxdr_dupstr(struct nfsd4_compoundargs *argp, void *buf, size_t len)</div><div class='ctx'> {</div><div class='del'>-	char *p = svcxdr_tmpalloc(argp, len + 1);</div><div class='add'>+	char *p = svcxdr_tmpalloc(argp, size_add(len, 1));</div><div class='ctx'> </div><div class='ctx'> 	if (!p)</div><div class='ctx'> 		return NULL;</div><div class='hunk'>@@ -148,7 +151,7 @@ svcxdr_dupstr(struct nfsd4_compoundargs *argp, void *buf, u32 len)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void *</div><div class='del'>-svcxdr_savemem(struct nfsd4_compoundargs *argp, __be32 *p, u32 len)</div><div class='add'>+svcxdr_savemem(struct nfsd4_compoundargs *argp, __be32 *p, size_t len)</div><div class='ctx'> {</div><div class='ctx'> 	__be32 *tmp;</div><div class='ctx'> </div><div class='hunk'>@@ -277,24 +280,10 @@ nfsd4_decode_verifier4(struct nfsd4_compoundargs *argp, nfs4_verifier *verf)</div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_decode_bitmap4(struct nfsd4_compoundargs *argp, u32 *bmval, u32 bmlen)</div><div class='ctx'> {</div><div class='del'>-	u32 i, count;</div><div class='del'>-	__be32 *p;</div><div class='add'>+	ssize_t status;</div><div class='ctx'> </div><div class='del'>-	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;count) &lt; 0)</div><div class='del'>-		return nfserr_bad_xdr;</div><div class='del'>-	/* request sanity */</div><div class='del'>-	if (count &gt; 1000)</div><div class='del'>-		return nfserr_bad_xdr;</div><div class='del'>-	p = xdr_inline_decode(argp-&gt;xdr, count &lt;&lt; 2);</div><div class='del'>-	if (!p)</div><div class='del'>-		return nfserr_bad_xdr;</div><div class='del'>-	i = 0;</div><div class='del'>-	while (i &lt; count)</div><div class='del'>-		bmval[i++] = be32_to_cpup(p++);</div><div class='del'>-	while (i &lt; bmlen)</div><div class='del'>-		bmval[i++] = 0;</div><div class='del'>-</div><div class='del'>-	return nfs_ok;</div><div class='add'>+	status = xdr_stream_decode_uint32_array(argp-&gt;xdr, bmval, bmlen);</div><div class='add'>+	return status == -EBADMSG ? nfserr_bad_xdr : nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='hunk'>@@ -484,6 +473,15 @@ nfsd4_decode_fattr4(struct nfsd4_compoundargs *argp, u32 *bmval, u32 bmlen,</div><div class='ctx'> 			return nfserr_bad_xdr;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='add'>+	if (bmval[1] &amp; FATTR4_WORD1_TIME_CREATE) {</div><div class='add'>+		struct timespec64 ts;</div><div class='add'>+</div><div class='add'>+		/* No Linux filesystem supports setting this attribute. */</div><div class='add'>+		bmval[1] &amp;= ~FATTR4_WORD1_TIME_CREATE;</div><div class='add'>+		status = nfsd4_decode_nfstime4(argp, &amp;ts);</div><div class='add'>+		if (status)</div><div class='add'>+			return status;</div><div class='add'>+	}</div><div class='ctx'> 	if (bmval[1] &amp; FATTR4_WORD1_TIME_MODIFY_SET) {</div><div class='ctx'> 		u32 set_it;</div><div class='ctx'> </div><div class='hunk'>@@ -523,6 +521,27 @@ nfsd4_decode_fattr4(struct nfsd4_compoundargs *argp, u32 *bmval, u32 bmlen,</div><div class='ctx'> 		*umask = mask &amp; S_IRWXUGO;</div><div class='ctx'> 		iattr-&gt;ia_valid |= ATTR_MODE;</div><div class='ctx'> 	}</div><div class='add'>+	if (bmval[2] &amp; FATTR4_WORD2_TIME_DELEG_ACCESS) {</div><div class='add'>+		fattr4_time_deleg_access access;</div><div class='add'>+</div><div class='add'>+		if (!xdrgen_decode_fattr4_time_deleg_access(argp-&gt;xdr, &amp;access))</div><div class='add'>+			return nfserr_bad_xdr;</div><div class='add'>+		iattr-&gt;ia_atime.tv_sec = access.seconds;</div><div class='add'>+		iattr-&gt;ia_atime.tv_nsec = access.nseconds;</div><div class='add'>+		iattr-&gt;ia_valid |= ATTR_ATIME | ATTR_ATIME_SET | ATTR_DELEG;</div><div class='add'>+	}</div><div class='add'>+	if (bmval[2] &amp; FATTR4_WORD2_TIME_DELEG_MODIFY) {</div><div class='add'>+		fattr4_time_deleg_modify modify;</div><div class='add'>+</div><div class='add'>+		if (!xdrgen_decode_fattr4_time_deleg_modify(argp-&gt;xdr, &amp;modify))</div><div class='add'>+			return nfserr_bad_xdr;</div><div class='add'>+		iattr-&gt;ia_mtime.tv_sec = modify.seconds;</div><div class='add'>+		iattr-&gt;ia_mtime.tv_nsec = modify.nseconds;</div><div class='add'>+		iattr-&gt;ia_ctime.tv_sec = modify.seconds;</div><div class='add'>+		iattr-&gt;ia_ctime.tv_nsec = modify.nseconds;</div><div class='add'>+		iattr-&gt;ia_valid |= ATTR_CTIME | ATTR_CTIME_SET |</div><div class='add'>+				   ATTR_MTIME | ATTR_MTIME_SET | ATTR_DELEG;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* request sanity: did attrlist4 contain the expected number of words? */</div><div class='ctx'> 	if (attrlist4_count != xdr_stream_pos(argp-&gt;xdr) - starting_pos)</div><div class='hunk'>@@ -569,23 +588,13 @@ nfsd4_decode_state_owner4(struct nfsd4_compoundargs *argp,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_NFSD_PNFS</div><div class='del'>-static __be32</div><div class='del'>-nfsd4_decode_deviceid4(struct nfsd4_compoundargs *argp,</div><div class='del'>-		       struct nfsd4_deviceid *devid)</div><div class='del'>-{</div><div class='del'>-	__be32 *p;</div><div class='del'>-</div><div class='del'>-	p = xdr_inline_decode(argp-&gt;xdr, NFS4_DEVICEID4_SIZE);</div><div class='del'>-	if (!p)</div><div class='del'>-		return nfserr_bad_xdr;</div><div class='del'>-	memcpy(devid, p, sizeof(*devid));</div><div class='del'>-	return nfs_ok;</div><div class='del'>-}</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_decode_layoutupdate4(struct nfsd4_compoundargs *argp,</div><div class='ctx'> 			   struct nfsd4_layoutcommit *lcp)</div><div class='ctx'> {</div><div class='add'>+	u32 len;</div><div class='add'>+</div><div class='ctx'> 	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;lcp-&gt;lc_layout_type) &lt; 0)</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='ctx'> 	if (lcp-&gt;lc_layout_type &lt; LAYOUT_NFSV4_1_FILES)</div><div class='hunk'>@@ -593,13 +602,10 @@ nfsd4_decode_layoutupdate4(struct nfsd4_compoundargs *argp,</div><div class='ctx'> 	if (lcp-&gt;lc_layout_type &gt;= LAYOUT_TYPE_MAX)</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='ctx'> </div><div class='del'>-	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;lcp-&gt;lc_up_len) &lt; 0)</div><div class='add'>+	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;len) &lt; 0)</div><div class='add'>+		return nfserr_bad_xdr;</div><div class='add'>+	if (!xdr_stream_subsegment(argp-&gt;xdr, &amp;lcp-&gt;lc_up_layout, len))</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='del'>-	if (lcp-&gt;lc_up_len &gt; 0) {</div><div class='del'>-		lcp-&gt;lc_up_layout = xdr_inline_decode(argp-&gt;xdr, lcp-&gt;lc_up_len);</div><div class='del'>-		if (!lcp-&gt;lc_up_layout)</div><div class='del'>-			return nfserr_bad_xdr;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	return nfs_ok;</div><div class='ctx'> }</div><div class='hunk'>@@ -773,16 +779,18 @@ nfsd4_decode_cb_sec(struct nfsd4_compoundargs *argp, struct nfsd4_cb_sec *cbs)</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_decode_access(struct nfsd4_compoundargs *argp,</div><div class='del'>-		    struct nfsd4_access *access)</div><div class='add'>+		    union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_access *access = &amp;u-&gt;access;</div><div class='ctx'> 	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;access-&gt;ac_req_access) &lt; 0)</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='ctx'> 	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_close(struct nfsd4_compoundargs *argp, struct nfsd4_close *close)</div><div class='add'>+nfsd4_decode_close(struct nfsd4_compoundargs *argp, union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_close *close = &amp;u-&gt;close;</div><div class='ctx'> 	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;close-&gt;cl_seqid) &lt; 0)</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='ctx'> 	return nfsd4_decode_stateid4(argp, &amp;close-&gt;cl_stateid);</div><div class='hunk'>@@ -790,20 +798,24 @@ nfsd4_decode_close(struct nfsd4_compoundargs *argp, struct nfsd4_close *close)</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_commit(struct nfsd4_compoundargs *argp, struct nfsd4_commit *commit)</div><div class='add'>+nfsd4_decode_commit(struct nfsd4_compoundargs *argp, union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_commit *commit = &amp;u-&gt;commit;</div><div class='ctx'> 	if (xdr_stream_decode_u64(argp-&gt;xdr, &amp;commit-&gt;co_offset) &lt; 0)</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='ctx'> 	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;commit-&gt;co_count) &lt; 0)</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='add'>+	memset(&amp;commit-&gt;co_verf, 0, sizeof(commit-&gt;co_verf));</div><div class='ctx'> 	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_create(struct nfsd4_compoundargs *argp, struct nfsd4_create *create)</div><div class='add'>+nfsd4_decode_create(struct nfsd4_compoundargs *argp, union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_create *create = &amp;u-&gt;create;</div><div class='ctx'> 	__be32 *p, status;</div><div class='ctx'> </div><div class='add'>+	memset(create, 0, sizeof(*create));</div><div class='ctx'> 	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;create-&gt;cr_type) &lt; 0)</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='ctx'> 	switch (create-&gt;cr_type) {</div><div class='hunk'>@@ -845,21 +857,26 @@ nfsd4_decode_create(struct nfsd4_compoundargs *argp, struct nfsd4_create *create</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline __be32</div><div class='del'>-nfsd4_decode_delegreturn(struct nfsd4_compoundargs *argp, struct nfsd4_delegreturn *dr)</div><div class='add'>+nfsd4_decode_delegreturn(struct nfsd4_compoundargs *argp, union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_delegreturn *dr = &amp;u-&gt;delegreturn;</div><div class='ctx'> 	return nfsd4_decode_stateid4(argp, &amp;dr-&gt;dr_stateid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline __be32</div><div class='del'>-nfsd4_decode_getattr(struct nfsd4_compoundargs *argp, struct nfsd4_getattr *getattr)</div><div class='add'>+nfsd4_decode_getattr(struct nfsd4_compoundargs *argp, union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_getattr *getattr = &amp;u-&gt;getattr;</div><div class='add'>+	memset(getattr, 0, sizeof(*getattr));</div><div class='ctx'> 	return nfsd4_decode_bitmap4(argp, getattr-&gt;ga_bmval,</div><div class='ctx'> 				    ARRAY_SIZE(getattr-&gt;ga_bmval));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_link(struct nfsd4_compoundargs *argp, struct nfsd4_link *link)</div><div class='add'>+nfsd4_decode_link(struct nfsd4_compoundargs *argp, union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_link *link = &amp;u-&gt;link;</div><div class='add'>+	memset(link, 0, sizeof(*link));</div><div class='ctx'> 	return nfsd4_decode_component4(argp, &amp;link-&gt;li_name, &amp;link-&gt;li_namelen);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -906,8 +923,10 @@ nfsd4_decode_locker4(struct nfsd4_compoundargs *argp, struct nfsd4_lock *lock)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_lock(struct nfsd4_compoundargs *argp, struct nfsd4_lock *lock)</div><div class='add'>+nfsd4_decode_lock(struct nfsd4_compoundargs *argp, union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_lock *lock = &amp;u-&gt;lock;</div><div class='add'>+	memset(lock, 0, sizeof(*lock));</div><div class='ctx'> 	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;lock-&gt;lk_type) &lt; 0)</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='ctx'> 	if ((lock-&gt;lk_type &lt; NFS4_READ_LT) || (lock-&gt;lk_type &gt; NFS4_WRITEW_LT))</div><div class='hunk'>@@ -922,8 +941,10 @@ nfsd4_decode_lock(struct nfsd4_compoundargs *argp, struct nfsd4_lock *lock)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_lockt(struct nfsd4_compoundargs *argp, struct nfsd4_lockt *lockt)</div><div class='add'>+nfsd4_decode_lockt(struct nfsd4_compoundargs *argp, union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_lockt *lockt = &amp;u-&gt;lockt;</div><div class='add'>+	memset(lockt, 0, sizeof(*lockt));</div><div class='ctx'> 	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;lockt-&gt;lt_type) &lt; 0)</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='ctx'> 	if ((lockt-&gt;lt_type &lt; NFS4_READ_LT) || (lockt-&gt;lt_type &gt; NFS4_WRITEW_LT))</div><div class='hunk'>@@ -937,8 +958,9 @@ nfsd4_decode_lockt(struct nfsd4_compoundargs *argp, struct nfsd4_lockt *lockt)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_locku(struct nfsd4_compoundargs *argp, struct nfsd4_locku *locku)</div><div class='add'>+nfsd4_decode_locku(struct nfsd4_compoundargs *argp, union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_locku *locku = &amp;u-&gt;locku;</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> </div><div class='ctx'> 	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;locku-&gt;lu_type) &lt; 0)</div><div class='hunk'>@@ -959,8 +981,9 @@ nfsd4_decode_locku(struct nfsd4_compoundargs *argp, struct nfsd4_locku *locku)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_lookup(struct nfsd4_compoundargs *argp, struct nfsd4_lookup *lookup)</div><div class='add'>+nfsd4_decode_lookup(struct nfsd4_compoundargs *argp, union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_lookup *lookup = &amp;u-&gt;lookup;</div><div class='ctx'> 	return nfsd4_decode_component4(argp, &amp;lookup-&gt;lo_name, &amp;lookup-&gt;lo_len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1052,13 +1075,13 @@ static __be32 nfsd4_decode_share_access(struct nfsd4_compoundargs *argp, u32 *sh</div><div class='ctx'> 		return nfs_ok;</div><div class='ctx'> 	if (!argp-&gt;minorversion)</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='del'>-	switch (w &amp; NFS4_SHARE_WANT_MASK) {</div><div class='del'>-	case NFS4_SHARE_WANT_NO_PREFERENCE:</div><div class='del'>-	case NFS4_SHARE_WANT_READ_DELEG:</div><div class='del'>-	case NFS4_SHARE_WANT_WRITE_DELEG:</div><div class='del'>-	case NFS4_SHARE_WANT_ANY_DELEG:</div><div class='del'>-	case NFS4_SHARE_WANT_NO_DELEG:</div><div class='del'>-	case NFS4_SHARE_WANT_CANCEL:</div><div class='add'>+	switch (w &amp; NFS4_SHARE_WANT_TYPE_MASK) {</div><div class='add'>+	case OPEN4_SHARE_ACCESS_WANT_NO_PREFERENCE:</div><div class='add'>+	case OPEN4_SHARE_ACCESS_WANT_READ_DELEG:</div><div class='add'>+	case OPEN4_SHARE_ACCESS_WANT_WRITE_DELEG:</div><div class='add'>+	case OPEN4_SHARE_ACCESS_WANT_ANY_DELEG:</div><div class='add'>+	case OPEN4_SHARE_ACCESS_WANT_NO_DELEG:</div><div class='add'>+	case OPEN4_SHARE_ACCESS_WANT_CANCEL:</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='hunk'>@@ -1140,16 +1163,14 @@ nfsd4_decode_open_claim4(struct nfsd4_compoundargs *argp,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_open(struct nfsd4_compoundargs *argp, struct nfsd4_open *open)</div><div class='add'>+nfsd4_decode_open(struct nfsd4_compoundargs *argp, union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_open *open = &amp;u-&gt;open;</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> 	u32 dummy;</div><div class='ctx'> </div><div class='del'>-	memset(open-&gt;op_bmval, 0, sizeof(open-&gt;op_bmval));</div><div class='del'>-	open-&gt;op_iattr.ia_valid = 0;</div><div class='del'>-	open-&gt;op_openowner = NULL;</div><div class='add'>+	memset(open, 0, sizeof(*open));</div><div class='ctx'> </div><div class='del'>-	open-&gt;op_xdr_error = 0;</div><div class='ctx'> 	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;open-&gt;op_seqid) &lt; 0)</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='ctx'> 	/* deleg_want is ignored */</div><div class='hunk'>@@ -1171,8 +1192,10 @@ nfsd4_decode_open(struct nfsd4_compoundargs *argp, struct nfsd4_open *open)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_open_confirm(struct nfsd4_compoundargs *argp, struct nfsd4_open_confirm *open_conf)</div><div class='add'>+nfsd4_decode_open_confirm(struct nfsd4_compoundargs *argp,</div><div class='add'>+			  union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_open_confirm *open_conf = &amp;u-&gt;open_confirm;</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> </div><div class='ctx'> 	if (argp-&gt;minorversion &gt;= 1)</div><div class='hunk'>@@ -1184,14 +1207,19 @@ nfsd4_decode_open_confirm(struct nfsd4_compoundargs *argp, struct nfsd4_open_con</div><div class='ctx'> 	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;open_conf-&gt;oc_seqid) &lt; 0)</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='ctx'> </div><div class='add'>+	memset(&amp;open_conf-&gt;oc_resp_stateid, 0,</div><div class='add'>+	       sizeof(open_conf-&gt;oc_resp_stateid));</div><div class='ctx'> 	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_open_downgrade(struct nfsd4_compoundargs *argp, struct nfsd4_open_downgrade *open_down)</div><div class='add'>+nfsd4_decode_open_downgrade(struct nfsd4_compoundargs *argp,</div><div class='add'>+			    union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_open_downgrade *open_down = &amp;u-&gt;open_downgrade;</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> </div><div class='add'>+	memset(open_down, 0, sizeof(*open_down));</div><div class='ctx'> 	status = nfsd4_decode_stateid4(argp, &amp;open_down-&gt;od_stateid);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		return status;</div><div class='hunk'>@@ -1206,8 +1234,9 @@ nfsd4_decode_open_downgrade(struct nfsd4_compoundargs *argp, struct nfsd4_open_d</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_putfh(struct nfsd4_compoundargs *argp, struct nfsd4_putfh *putfh)</div><div class='add'>+nfsd4_decode_putfh(struct nfsd4_compoundargs *argp, union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_putfh *putfh = &amp;u-&gt;putfh;</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> </div><div class='ctx'> 	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;putfh-&gt;pf_fhlen) &lt; 0)</div><div class='hunk'>@@ -1221,22 +1250,17 @@ nfsd4_decode_putfh(struct nfsd4_compoundargs *argp, struct nfsd4_putfh *putfh)</div><div class='ctx'> 	if (!putfh-&gt;pf_fhval)</div><div class='ctx'> 		return nfserr_jukebox;</div><div class='ctx'> </div><div class='add'>+	putfh-&gt;no_verify = false;</div><div class='ctx'> 	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_putpubfh(struct nfsd4_compoundargs *argp, void *p)</div><div class='del'>-{</div><div class='del'>-	if (argp-&gt;minorversion == 0)</div><div class='del'>-		return nfs_ok;</div><div class='del'>-	return nfserr_notsupp;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __be32</div><div class='del'>-nfsd4_decode_read(struct nfsd4_compoundargs *argp, struct nfsd4_read *read)</div><div class='add'>+nfsd4_decode_read(struct nfsd4_compoundargs *argp, union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_read *read = &amp;u-&gt;read;</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> </div><div class='add'>+	memset(read, 0, sizeof(*read));</div><div class='ctx'> 	status = nfsd4_decode_stateid4(argp, &amp;read-&gt;rd_stateid);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		return status;</div><div class='hunk'>@@ -1249,10 +1273,12 @@ nfsd4_decode_read(struct nfsd4_compoundargs *argp, struct nfsd4_read *read)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_readdir(struct nfsd4_compoundargs *argp, struct nfsd4_readdir *readdir)</div><div class='add'>+nfsd4_decode_readdir(struct nfsd4_compoundargs *argp, union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_readdir *readdir = &amp;u-&gt;readdir;</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> </div><div class='add'>+	memset(readdir, 0, sizeof(*readdir));</div><div class='ctx'> 	if (xdr_stream_decode_u64(argp-&gt;xdr, &amp;readdir-&gt;rd_cookie) &lt; 0)</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='ctx'> 	status = nfsd4_decode_verifier4(argp, &amp;readdir-&gt;rd_verf);</div><div class='hunk'>@@ -1270,16 +1296,20 @@ nfsd4_decode_readdir(struct nfsd4_compoundargs *argp, struct nfsd4_readdir *read</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_remove(struct nfsd4_compoundargs *argp, struct nfsd4_remove *remove)</div><div class='add'>+nfsd4_decode_remove(struct nfsd4_compoundargs *argp, union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_remove *remove = &amp;u-&gt;remove;</div><div class='add'>+	memset(&amp;remove-&gt;rm_cinfo, 0, sizeof(remove-&gt;rm_cinfo));</div><div class='ctx'> 	return nfsd4_decode_component4(argp, &amp;remove-&gt;rm_name, &amp;remove-&gt;rm_namelen);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_rename(struct nfsd4_compoundargs *argp, struct nfsd4_rename *rename)</div><div class='add'>+nfsd4_decode_rename(struct nfsd4_compoundargs *argp, union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_rename *rename = &amp;u-&gt;rename;</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> </div><div class='add'>+	memset(rename, 0, sizeof(*rename));</div><div class='ctx'> 	status = nfsd4_decode_component4(argp, &amp;rename-&gt;rn_sname, &amp;rename-&gt;rn_snamelen);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		return status;</div><div class='hunk'>@@ -1287,23 +1317,28 @@ nfsd4_decode_rename(struct nfsd4_compoundargs *argp, struct nfsd4_rename *rename</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_renew(struct nfsd4_compoundargs *argp, clientid_t *clientid)</div><div class='add'>+nfsd4_decode_renew(struct nfsd4_compoundargs *argp, union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	clientid_t *clientid = &amp;u-&gt;renew;</div><div class='ctx'> 	return nfsd4_decode_clientid4(argp, clientid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_decode_secinfo(struct nfsd4_compoundargs *argp,</div><div class='del'>-		     struct nfsd4_secinfo *secinfo)</div><div class='add'>+		     union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_secinfo *secinfo = &amp;u-&gt;secinfo;</div><div class='add'>+	secinfo-&gt;si_exp = NULL;</div><div class='ctx'> 	return nfsd4_decode_component4(argp, &amp;secinfo-&gt;si_name, &amp;secinfo-&gt;si_namelen);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_setattr(struct nfsd4_compoundargs *argp, struct nfsd4_setattr *setattr)</div><div class='add'>+nfsd4_decode_setattr(struct nfsd4_compoundargs *argp, union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_setattr *setattr = &amp;u-&gt;setattr;</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> </div><div class='add'>+	memset(setattr, 0, sizeof(*setattr));</div><div class='ctx'> 	status = nfsd4_decode_stateid4(argp, &amp;setattr-&gt;sa_stateid);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		return status;</div><div class='hunk'>@@ -1314,10 +1349,13 @@ nfsd4_decode_setattr(struct nfsd4_compoundargs *argp, struct nfsd4_setattr *seta</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_setclientid(struct nfsd4_compoundargs *argp, struct nfsd4_setclientid *setclientid)</div><div class='add'>+nfsd4_decode_setclientid(struct nfsd4_compoundargs *argp, union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_setclientid *setclientid = &amp;u-&gt;setclientid;</div><div class='ctx'> 	__be32 *p, status;</div><div class='ctx'> </div><div class='add'>+	memset(setclientid, 0, sizeof(*setclientid));</div><div class='add'>+</div><div class='ctx'> 	if (argp-&gt;minorversion &gt;= 1)</div><div class='ctx'> 		return nfserr_notsupp;</div><div class='ctx'> </div><div class='hunk'>@@ -1355,8 +1393,10 @@ nfsd4_decode_setclientid(struct nfsd4_compoundargs *argp, struct nfsd4_setclient</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_setclientid_confirm(struct nfsd4_compoundargs *argp, struct nfsd4_setclientid_confirm *scd_c)</div><div class='add'>+nfsd4_decode_setclientid_confirm(struct nfsd4_compoundargs *argp,</div><div class='add'>+				 union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_setclientid_confirm *scd_c = &amp;u-&gt;setclientid_confirm;</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> </div><div class='ctx'> 	if (argp-&gt;minorversion &gt;= 1)</div><div class='hunk'>@@ -1370,10 +1410,13 @@ nfsd4_decode_setclientid_confirm(struct nfsd4_compoundargs *argp, struct nfsd4_s</div><div class='ctx'> </div><div class='ctx'> /* Also used for NVERIFY */</div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_verify(struct nfsd4_compoundargs *argp, struct nfsd4_verify *verify)</div><div class='add'>+nfsd4_decode_verify(struct nfsd4_compoundargs *argp, union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_verify *verify = &amp;u-&gt;verify;</div><div class='ctx'> 	__be32 *p, status;</div><div class='ctx'> </div><div class='add'>+	memset(verify, 0, sizeof(*verify));</div><div class='add'>+</div><div class='ctx'> 	status = nfsd4_decode_bitmap4(argp, verify-&gt;ve_bmval,</div><div class='ctx'> 				      ARRAY_SIZE(verify-&gt;ve_bmval));</div><div class='ctx'> 	if (status)</div><div class='hunk'>@@ -1395,8 +1438,9 @@ nfsd4_decode_verify(struct nfsd4_compoundargs *argp, struct nfsd4_verify *verify</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_write(struct nfsd4_compoundargs *argp, struct nfsd4_write *write)</div><div class='add'>+nfsd4_decode_write(struct nfsd4_compoundargs *argp, union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_write *write = &amp;u-&gt;write;</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> </div><div class='ctx'> 	status = nfsd4_decode_stateid4(argp, &amp;write-&gt;wr_stateid);</div><div class='hunk'>@@ -1413,12 +1457,17 @@ nfsd4_decode_write(struct nfsd4_compoundargs *argp, struct nfsd4_write *write)</div><div class='ctx'> 	if (!xdr_stream_subsegment(argp-&gt;xdr, &amp;write-&gt;wr_payload, write-&gt;wr_buflen))</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='ctx'> </div><div class='add'>+	write-&gt;wr_bytes_written = 0;</div><div class='add'>+	write-&gt;wr_how_written = 0;</div><div class='add'>+	memset(&amp;write-&gt;wr_verifier, 0, sizeof(write-&gt;wr_verifier));</div><div class='ctx'> 	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_release_lockowner(struct nfsd4_compoundargs *argp, struct nfsd4_release_lockowner *rlockowner)</div><div class='add'>+nfsd4_decode_release_lockowner(struct nfsd4_compoundargs *argp,</div><div class='add'>+			       union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_release_lockowner *rlockowner = &amp;u-&gt;release_lockowner;</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> </div><div class='ctx'> 	if (argp-&gt;minorversion &gt;= 1)</div><div class='hunk'>@@ -1435,18 +1484,24 @@ nfsd4_decode_release_lockowner(struct nfsd4_compoundargs *argp, struct nfsd4_rel</div><div class='ctx'> 	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static __be32 nfsd4_decode_backchannel_ctl(struct nfsd4_compoundargs *argp, struct nfsd4_backchannel_ctl *bc)</div><div class='add'>+static __be32 nfsd4_decode_backchannel_ctl(struct nfsd4_compoundargs *argp,</div><div class='add'>+					   union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_backchannel_ctl *bc = &amp;u-&gt;backchannel_ctl;</div><div class='add'>+	memset(bc, 0, sizeof(*bc));</div><div class='ctx'> 	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;bc-&gt;bc_cb_program) &lt; 0)</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='ctx'> 	return nfsd4_decode_cb_sec(argp, &amp;bc-&gt;bc_cb_sec);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static __be32 nfsd4_decode_bind_conn_to_session(struct nfsd4_compoundargs *argp, struct nfsd4_bind_conn_to_session *bcts)</div><div class='add'>+static __be32 nfsd4_decode_bind_conn_to_session(struct nfsd4_compoundargs *argp,</div><div class='add'>+						union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_bind_conn_to_session *bcts = &amp;u-&gt;bind_conn_to_session;</div><div class='ctx'> 	u32 use_conn_in_rdma_mode;</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> </div><div class='add'>+	memset(bcts, 0, sizeof(*bcts));</div><div class='ctx'> 	status = nfsd4_decode_sessionid4(argp, &amp;bcts-&gt;sessionid);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		return status;</div><div class='hunk'>@@ -1584,10 +1639,12 @@ nfsd4_decode_nfs_impl_id4(struct nfsd4_compoundargs *argp,</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_decode_exchange_id(struct nfsd4_compoundargs *argp,</div><div class='del'>-			 struct nfsd4_exchange_id *exid)</div><div class='add'>+			 union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_exchange_id *exid = &amp;u-&gt;exchange_id;</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> </div><div class='add'>+	memset(exid, 0, sizeof(*exid));</div><div class='ctx'> 	status = nfsd4_decode_verifier4(argp, &amp;exid-&gt;verifier);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		return status;</div><div class='hunk'>@@ -1636,10 +1693,12 @@ nfsd4_decode_channel_attrs4(struct nfsd4_compoundargs *argp,</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_decode_create_session(struct nfsd4_compoundargs *argp,</div><div class='del'>-			    struct nfsd4_create_session *sess)</div><div class='add'>+			    union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_create_session *sess = &amp;u-&gt;create_session;</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> </div><div class='add'>+	memset(sess, 0, sizeof(*sess));</div><div class='ctx'> 	status = nfsd4_decode_clientid4(argp, &amp;sess-&gt;clientid);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		return status;</div><div class='hunk'>@@ -1655,35 +1714,64 @@ nfsd4_decode_create_session(struct nfsd4_compoundargs *argp,</div><div class='ctx'> 		return status;</div><div class='ctx'> 	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;sess-&gt;callback_prog) &lt; 0)</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='del'>-	status = nfsd4_decode_cb_sec(argp, &amp;sess-&gt;cb_sec);</div><div class='del'>-	if (status)</div><div class='del'>-		return status;</div><div class='del'>-</div><div class='del'>-	return nfs_ok;</div><div class='add'>+	return nfsd4_decode_cb_sec(argp, &amp;sess-&gt;cb_sec);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_decode_destroy_session(struct nfsd4_compoundargs *argp,</div><div class='del'>-			     struct nfsd4_destroy_session *destroy_session)</div><div class='add'>+			     union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_destroy_session *destroy_session = &amp;u-&gt;destroy_session;</div><div class='ctx'> 	return nfsd4_decode_sessionid4(argp, &amp;destroy_session-&gt;sessionid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_decode_free_stateid(struct nfsd4_compoundargs *argp,</div><div class='del'>-			  struct nfsd4_free_stateid *free_stateid)</div><div class='add'>+			  union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_free_stateid *free_stateid = &amp;u-&gt;free_stateid;</div><div class='ctx'> 	return nfsd4_decode_stateid4(argp, &amp;free_stateid-&gt;fr_stateid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static __be32</div><div class='add'>+nfsd4_decode_get_dir_delegation(struct nfsd4_compoundargs *argp,</div><div class='add'>+		union nfsd4_op_u *u)</div><div class='add'>+{</div><div class='add'>+	struct nfsd4_get_dir_delegation *gdd = &amp;u-&gt;get_dir_delegation;</div><div class='add'>+	__be32 status;</div><div class='add'>+</div><div class='add'>+	memset(gdd, 0, sizeof(*gdd));</div><div class='add'>+</div><div class='add'>+	if (xdr_stream_decode_bool(argp-&gt;xdr, &amp;gdd-&gt;gdda_signal_deleg_avail) &lt; 0)</div><div class='add'>+		return nfserr_bad_xdr;</div><div class='add'>+	status = nfsd4_decode_bitmap4(argp, gdd-&gt;gdda_notification_types,</div><div class='add'>+				      ARRAY_SIZE(gdd-&gt;gdda_notification_types));</div><div class='add'>+	if (status)</div><div class='add'>+		return status;</div><div class='add'>+	status = nfsd4_decode_nfstime4(argp, &amp;gdd-&gt;gdda_child_attr_delay);</div><div class='add'>+	if (status)</div><div class='add'>+		return status;</div><div class='add'>+	status = nfsd4_decode_nfstime4(argp, &amp;gdd-&gt;gdda_dir_attr_delay);</div><div class='add'>+	if (status)</div><div class='add'>+		return status;</div><div class='add'>+	status = nfsd4_decode_bitmap4(argp, gdd-&gt;gdda_child_attributes,</div><div class='add'>+					ARRAY_SIZE(gdd-&gt;gdda_child_attributes));</div><div class='add'>+	if (status)</div><div class='add'>+		return status;</div><div class='add'>+	return nfsd4_decode_bitmap4(argp, gdd-&gt;gdda_dir_attributes,</div><div class='add'>+					ARRAY_SIZE(gdd-&gt;gdda_dir_attributes));</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> #ifdef CONFIG_NFSD_PNFS</div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_decode_getdeviceinfo(struct nfsd4_compoundargs *argp,</div><div class='del'>-		struct nfsd4_getdeviceinfo *gdev)</div><div class='add'>+		union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_getdeviceinfo *gdev = &amp;u-&gt;getdeviceinfo;</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> </div><div class='del'>-	status = nfsd4_decode_deviceid4(argp, &amp;gdev-&gt;gd_devid);</div><div class='add'>+	memset(gdev, 0, sizeof(*gdev));</div><div class='add'>+	status = nfsd4_decode_deviceid4(argp-&gt;xdr, &amp;gdev-&gt;gd_devid);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		return status;</div><div class='ctx'> 	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;gdev-&gt;gd_layout_type) &lt; 0)</div><div class='hunk'>@@ -1699,10 +1787,12 @@ nfsd4_decode_getdeviceinfo(struct nfsd4_compoundargs *argp,</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_decode_layoutcommit(struct nfsd4_compoundargs *argp,</div><div class='del'>-			  struct nfsd4_layoutcommit *lcp)</div><div class='add'>+			  union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_layoutcommit *lcp = &amp;u-&gt;layoutcommit;</div><div class='ctx'> 	__be32 *p, status;</div><div class='ctx'> </div><div class='add'>+	memset(lcp, 0, sizeof(*lcp));</div><div class='ctx'> 	if (xdr_stream_decode_u64(argp-&gt;xdr, &amp;lcp-&gt;lc_seg.offset) &lt; 0)</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='ctx'> 	if (xdr_stream_decode_u64(argp-&gt;xdr, &amp;lcp-&gt;lc_seg.length) &lt; 0)</div><div class='hunk'>@@ -1712,7 +1802,7 @@ nfsd4_decode_layoutcommit(struct nfsd4_compoundargs *argp,</div><div class='ctx'> 	status = nfsd4_decode_stateid4(argp, &amp;lcp-&gt;lc_sid);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		return status;</div><div class='del'>-	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;lcp-&gt;lc_newoffset) &lt; 0)</div><div class='add'>+	if (xdr_stream_decode_bool(argp-&gt;xdr, &amp;lcp-&gt;lc_newoffset) &lt; 0)</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='ctx'> 	if (lcp-&gt;lc_newoffset) {</div><div class='ctx'> 		if (xdr_stream_decode_u64(argp-&gt;xdr, &amp;lcp-&gt;lc_last_wr) &lt; 0)</div><div class='hunk'>@@ -1734,10 +1824,12 @@ nfsd4_decode_layoutcommit(struct nfsd4_compoundargs *argp,</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_decode_layoutget(struct nfsd4_compoundargs *argp,</div><div class='del'>-		struct nfsd4_layoutget *lgp)</div><div class='add'>+		union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_layoutget *lgp = &amp;u-&gt;layoutget;</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> </div><div class='add'>+	memset(lgp, 0, sizeof(*lgp));</div><div class='ctx'> 	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;lgp-&gt;lg_signal) &lt; 0)</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='ctx'> 	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;lgp-&gt;lg_layout_type) &lt; 0)</div><div class='hunk'>@@ -1761,8 +1853,10 @@ nfsd4_decode_layoutget(struct nfsd4_compoundargs *argp,</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_decode_layoutreturn(struct nfsd4_compoundargs *argp,</div><div class='del'>-		struct nfsd4_layoutreturn *lrp)</div><div class='add'>+		union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_layoutreturn *lrp = &amp;u-&gt;layoutreturn;</div><div class='add'>+	memset(lrp, 0, sizeof(*lrp));</div><div class='ctx'> 	if (xdr_stream_decode_bool(argp-&gt;xdr, &amp;lrp-&gt;lr_reclaim) &lt; 0)</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='ctx'> 	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;lrp-&gt;lr_layout_type) &lt; 0)</div><div class='hunk'>@@ -1774,17 +1868,21 @@ nfsd4_decode_layoutreturn(struct nfsd4_compoundargs *argp,</div><div class='ctx'> #endif /* CONFIG_NFSD_PNFS */</div><div class='ctx'> </div><div class='ctx'> static __be32 nfsd4_decode_secinfo_no_name(struct nfsd4_compoundargs *argp,</div><div class='del'>-					   struct nfsd4_secinfo_no_name *sin)</div><div class='add'>+					   union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_secinfo_no_name *sin = &amp;u-&gt;secinfo_no_name;</div><div class='ctx'> 	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;sin-&gt;sin_style) &lt; 0)</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='add'>+</div><div class='add'>+	sin-&gt;sin_exp = NULL;</div><div class='ctx'> 	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_decode_sequence(struct nfsd4_compoundargs *argp,</div><div class='del'>-		      struct nfsd4_sequence *seq)</div><div class='add'>+		      union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_sequence *seq = &amp;u-&gt;sequence;</div><div class='ctx'> 	__be32 *p, status;</div><div class='ctx'> </div><div class='ctx'> 	status = nfsd4_decode_sessionid4(argp, &amp;seq-&gt;sessionid);</div><div class='hunk'>@@ -1795,19 +1893,24 @@ nfsd4_decode_sequence(struct nfsd4_compoundargs *argp,</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='ctx'> 	seq-&gt;seqid = be32_to_cpup(p++);</div><div class='ctx'> 	seq-&gt;slotid = be32_to_cpup(p++);</div><div class='del'>-	seq-&gt;maxslots = be32_to_cpup(p++);</div><div class='add'>+	/* sa_highest_slotid counts from 0 but maxslots  counts from 1 ... */</div><div class='add'>+	seq-&gt;maxslots = be32_to_cpup(p++) + 1;</div><div class='ctx'> 	seq-&gt;cachethis = be32_to_cpup(p);</div><div class='ctx'> </div><div class='add'>+	seq-&gt;status_flags = 0;</div><div class='ctx'> 	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_test_stateid(struct nfsd4_compoundargs *argp, struct nfsd4_test_stateid *test_stateid)</div><div class='add'>+nfsd4_decode_test_stateid(struct nfsd4_compoundargs *argp,</div><div class='add'>+			  union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_test_stateid *test_stateid = &amp;u-&gt;test_stateid;</div><div class='ctx'> 	struct nfsd4_test_stateid_id *stateid;</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> 	u32 i;</div><div class='ctx'> </div><div class='add'>+	memset(test_stateid, 0, sizeof(*test_stateid));</div><div class='ctx'> 	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;test_stateid-&gt;ts_num_ids) &lt; 0)</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='ctx'> </div><div class='hunk'>@@ -1815,7 +1918,7 @@ nfsd4_decode_test_stateid(struct nfsd4_compoundargs *argp, struct nfsd4_test_sta</div><div class='ctx'> 	for (i = 0; i &lt; test_stateid-&gt;ts_num_ids; i++) {</div><div class='ctx'> 		stateid = svcxdr_tmpalloc(argp, sizeof(*stateid));</div><div class='ctx'> 		if (!stateid)</div><div class='del'>-			return nfserrno(-ENOMEM);	/* XXX: not jukebox? */</div><div class='add'>+			return nfserr_jukebox;</div><div class='ctx'> 		INIT_LIST_HEAD(&amp;stateid-&gt;ts_id_list);</div><div class='ctx'> 		list_add_tail(&amp;stateid-&gt;ts_id_list, &amp;test_stateid-&gt;ts_stateid_list);</div><div class='ctx'> 		status = nfsd4_decode_stateid4(argp, &amp;stateid-&gt;ts_id_stateid);</div><div class='hunk'>@@ -1827,14 +1930,16 @@ nfsd4_decode_test_stateid(struct nfsd4_compoundargs *argp, struct nfsd4_test_sta</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32 nfsd4_decode_destroy_clientid(struct nfsd4_compoundargs *argp,</div><div class='del'>-					    struct nfsd4_destroy_clientid *dc)</div><div class='add'>+					    union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_destroy_clientid *dc = &amp;u-&gt;destroy_clientid;</div><div class='ctx'> 	return nfsd4_decode_clientid4(argp, &amp;dc-&gt;clientid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32 nfsd4_decode_reclaim_complete(struct nfsd4_compoundargs *argp,</div><div class='del'>-					    struct nfsd4_reclaim_complete *rc)</div><div class='add'>+					    union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_reclaim_complete *rc = &amp;u-&gt;reclaim_complete;</div><div class='ctx'> 	if (xdr_stream_decode_bool(argp-&gt;xdr, &amp;rc-&gt;rca_one_fs) &lt; 0)</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='ctx'> 	return nfs_ok;</div><div class='hunk'>@@ -1842,8 +1947,9 @@ static __be32 nfsd4_decode_reclaim_complete(struct nfsd4_compoundargs *argp,</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_decode_fallocate(struct nfsd4_compoundargs *argp,</div><div class='del'>-		       struct nfsd4_fallocate *fallocate)</div><div class='add'>+		       union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_fallocate *fallocate = &amp;u-&gt;allocate;</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> </div><div class='ctx'> 	status = nfsd4_decode_stateid4(argp, &amp;fallocate-&gt;falloc_stateid);</div><div class='hunk'>@@ -1899,12 +2005,14 @@ static __be32 nfsd4_decode_nl4_server(struct nfsd4_compoundargs *argp,</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_copy(struct nfsd4_compoundargs *argp, struct nfsd4_copy *copy)</div><div class='add'>+nfsd4_decode_copy(struct nfsd4_compoundargs *argp, union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_copy *copy = &amp;u-&gt;copy;</div><div class='add'>+	u32 consecutive, i, count, sync;</div><div class='ctx'> 	struct nl4_server *ns_dummy;</div><div class='del'>-	u32 consecutive, i, count;</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> </div><div class='add'>+	memset(copy, 0, sizeof(*copy));</div><div class='ctx'> 	status = nfsd4_decode_stateid4(argp, &amp;copy-&gt;cp_src_stateid);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		return status;</div><div class='hunk'>@@ -1920,25 +2028,28 @@ nfsd4_decode_copy(struct nfsd4_compoundargs *argp, struct nfsd4_copy *copy)</div><div class='ctx'> 	/* ca_consecutive: we always do consecutive copies */</div><div class='ctx'> 	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;consecutive) &lt; 0)</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='del'>-	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;copy-&gt;cp_synchronous) &lt; 0)</div><div class='add'>+	if (xdr_stream_decode_bool(argp-&gt;xdr, &amp;sync) &lt; 0)</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='add'>+	nfsd4_copy_set_sync(copy, sync);</div><div class='ctx'> </div><div class='ctx'> 	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;count) &lt; 0)</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='del'>-	copy-&gt;cp_intra = false;</div><div class='add'>+	copy-&gt;cp_src = svcxdr_tmpalloc(argp, sizeof(*copy-&gt;cp_src));</div><div class='add'>+	if (copy-&gt;cp_src == NULL)</div><div class='add'>+		return nfserr_jukebox;</div><div class='ctx'> 	if (count == 0) { /* intra-server copy */</div><div class='del'>-		copy-&gt;cp_intra = true;</div><div class='add'>+		__set_bit(NFSD4_COPY_F_INTRA, &amp;copy-&gt;cp_flags);</div><div class='ctx'> 		return nfs_ok;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* decode all the supplied server addresses but use only the first */</div><div class='del'>-	status = nfsd4_decode_nl4_server(argp, &amp;copy-&gt;cp_src);</div><div class='add'>+	status = nfsd4_decode_nl4_server(argp, copy-&gt;cp_src);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		return status;</div><div class='ctx'> </div><div class='ctx'> 	ns_dummy = kmalloc(sizeof(struct nl4_server), GFP_KERNEL);</div><div class='ctx'> 	if (ns_dummy == NULL)</div><div class='del'>-		return nfserrno(-ENOMEM);	/* XXX: jukebox? */</div><div class='add'>+		return nfserr_jukebox;</div><div class='ctx'> 	for (i = 0; i &lt; count - 1; i++) {</div><div class='ctx'> 		status = nfsd4_decode_nl4_server(argp, ns_dummy);</div><div class='ctx'> 		if (status) {</div><div class='hunk'>@@ -1953,26 +2064,39 @@ nfsd4_decode_copy(struct nfsd4_compoundargs *argp, struct nfsd4_copy *copy)</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_decode_copy_notify(struct nfsd4_compoundargs *argp,</div><div class='del'>-			 struct nfsd4_copy_notify *cn)</div><div class='add'>+			 union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_copy_notify *cn = &amp;u-&gt;copy_notify;</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> </div><div class='add'>+	memset(cn, 0, sizeof(*cn));</div><div class='add'>+	cn-&gt;cpn_src = svcxdr_tmpalloc(argp, sizeof(*cn-&gt;cpn_src));</div><div class='add'>+	if (cn-&gt;cpn_src == NULL)</div><div class='add'>+		return nfserr_jukebox;</div><div class='add'>+	cn-&gt;cpn_dst = svcxdr_tmpalloc(argp, sizeof(*cn-&gt;cpn_dst));</div><div class='add'>+	if (cn-&gt;cpn_dst == NULL)</div><div class='add'>+		return nfserr_jukebox;</div><div class='add'>+</div><div class='ctx'> 	status = nfsd4_decode_stateid4(argp, &amp;cn-&gt;cpn_src_stateid);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		return status;</div><div class='del'>-	return nfsd4_decode_nl4_server(argp, &amp;cn-&gt;cpn_dst);</div><div class='add'>+	return nfsd4_decode_nl4_server(argp, cn-&gt;cpn_dst);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_decode_offload_status(struct nfsd4_compoundargs *argp,</div><div class='del'>-			    struct nfsd4_offload_status *os)</div><div class='add'>+			    union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_offload_status *os = &amp;u-&gt;offload_status;</div><div class='add'>+	os-&gt;count = 0;</div><div class='add'>+	os-&gt;status = 0;</div><div class='ctx'> 	return nfsd4_decode_stateid4(argp, &amp;os-&gt;stateid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_seek(struct nfsd4_compoundargs *argp, struct nfsd4_seek *seek)</div><div class='add'>+nfsd4_decode_seek(struct nfsd4_compoundargs *argp, union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_seek *seek = &amp;u-&gt;seek;</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> </div><div class='ctx'> 	status = nfsd4_decode_stateid4(argp, &amp;seek-&gt;seek_stateid);</div><div class='hunk'>@@ -1983,12 +2107,15 @@ nfsd4_decode_seek(struct nfsd4_compoundargs *argp, struct nfsd4_seek *seek)</div><div class='ctx'> 	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;seek-&gt;seek_whence) &lt; 0)</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='ctx'> </div><div class='add'>+	seek-&gt;seek_eof = 0;</div><div class='add'>+	seek-&gt;seek_pos = 0;</div><div class='ctx'> 	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_clone(struct nfsd4_compoundargs *argp, struct nfsd4_clone *clone)</div><div class='add'>+nfsd4_decode_clone(struct nfsd4_compoundargs *argp, union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_clone *clone = &amp;u-&gt;clone;</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> </div><div class='ctx'> 	status = nfsd4_decode_stateid4(argp, &amp;clone-&gt;cl_src_stateid);</div><div class='hunk'>@@ -2021,7 +2148,7 @@ nfsd4_decode_clone(struct nfsd4_compoundargs *argp, struct nfsd4_clone *clone)</div><div class='ctx'>  */</div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_vbuf_from_vector(struct nfsd4_compoundargs *argp, struct xdr_buf *xdr,</div><div class='del'>-		       char **bufp, u32 buflen)</div><div class='add'>+		       char **bufp, size_t buflen)</div><div class='ctx'> {</div><div class='ctx'> 	struct page **pages = xdr-&gt;pages;</div><div class='ctx'> 	struct kvec *head = xdr-&gt;head;</div><div class='hunk'>@@ -2113,11 +2240,13 @@ nfsd4_decode_xattr_name(struct nfsd4_compoundargs *argp, char **namep)</div><div class='ctx'>  */</div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_decode_getxattr(struct nfsd4_compoundargs *argp,</div><div class='del'>-		      struct nfsd4_getxattr *getxattr)</div><div class='add'>+		      union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_getxattr *getxattr = &amp;u-&gt;getxattr;</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> 	u32 maxcount;</div><div class='ctx'> </div><div class='add'>+	memset(getxattr, 0, sizeof(*getxattr));</div><div class='ctx'> 	status = nfsd4_decode_xattr_name(argp, &amp;getxattr-&gt;getxa_name);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		return status;</div><div class='hunk'>@@ -2126,17 +2255,19 @@ nfsd4_decode_getxattr(struct nfsd4_compoundargs *argp,</div><div class='ctx'> 	maxcount = min_t(u32, XATTR_SIZE_MAX, maxcount);</div><div class='ctx'> </div><div class='ctx'> 	getxattr-&gt;getxa_len = maxcount;</div><div class='del'>-</div><div class='del'>-	return status;</div><div class='add'>+	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_decode_setxattr(struct nfsd4_compoundargs *argp,</div><div class='del'>-		      struct nfsd4_setxattr *setxattr)</div><div class='add'>+		      union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_setxattr *setxattr = &amp;u-&gt;setxattr;</div><div class='ctx'> 	u32 flags, maxcount, size;</div><div class='ctx'> 	__be32 status;</div><div class='ctx'> </div><div class='add'>+	memset(setxattr, 0, sizeof(*setxattr));</div><div class='add'>+</div><div class='ctx'> 	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;flags) &lt; 0)</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='ctx'> </div><div class='hunk'>@@ -2171,10 +2302,13 @@ nfsd4_decode_setxattr(struct nfsd4_compoundargs *argp,</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_decode_listxattrs(struct nfsd4_compoundargs *argp,</div><div class='del'>-			struct nfsd4_listxattrs *listxattrs)</div><div class='add'>+			union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_listxattrs *listxattrs = &amp;u-&gt;listxattrs;</div><div class='ctx'> 	u32 maxcount;</div><div class='ctx'> </div><div class='add'>+	memset(listxattrs, 0, sizeof(*listxattrs));</div><div class='add'>+</div><div class='ctx'> 	if (xdr_stream_decode_u64(argp-&gt;xdr, &amp;listxattrs-&gt;lsxa_cookie) &lt; 0)</div><div class='ctx'> 		return nfserr_bad_xdr;</div><div class='ctx'> </div><div class='hunk'>@@ -2200,112 +2334,114 @@ nfsd4_decode_listxattrs(struct nfsd4_compoundargs *argp,</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_decode_removexattr(struct nfsd4_compoundargs *argp,</div><div class='del'>-			 struct nfsd4_removexattr *removexattr)</div><div class='add'>+			 union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_removexattr *removexattr = &amp;u-&gt;removexattr;</div><div class='add'>+	memset(removexattr, 0, sizeof(*removexattr));</div><div class='ctx'> 	return nfsd4_decode_xattr_name(argp, &amp;removexattr-&gt;rmxa_name);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_noop(struct nfsd4_compoundargs *argp, void *p)</div><div class='add'>+nfsd4_decode_noop(struct nfsd4_compoundargs *argp, union nfsd4_op_u *p)</div><div class='ctx'> {</div><div class='ctx'> 	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_decode_notsupp(struct nfsd4_compoundargs *argp, void *p)</div><div class='add'>+nfsd4_decode_notsupp(struct nfsd4_compoundargs *argp, union nfsd4_op_u *p)</div><div class='ctx'> {</div><div class='ctx'> 	return nfserr_notsupp;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-typedef __be32(*nfsd4_dec)(struct nfsd4_compoundargs *argp, void *);</div><div class='add'>+typedef __be32(*nfsd4_dec)(struct nfsd4_compoundargs *argp, union nfsd4_op_u *u);</div><div class='ctx'> </div><div class='ctx'> static const nfsd4_dec nfsd4_dec_ops[] = {</div><div class='del'>-	[OP_ACCESS]		= (nfsd4_dec)nfsd4_decode_access,</div><div class='del'>-	[OP_CLOSE]		= (nfsd4_dec)nfsd4_decode_close,</div><div class='del'>-	[OP_COMMIT]		= (nfsd4_dec)nfsd4_decode_commit,</div><div class='del'>-	[OP_CREATE]		= (nfsd4_dec)nfsd4_decode_create,</div><div class='del'>-	[OP_DELEGPURGE]		= (nfsd4_dec)nfsd4_decode_notsupp,</div><div class='del'>-	[OP_DELEGRETURN]	= (nfsd4_dec)nfsd4_decode_delegreturn,</div><div class='del'>-	[OP_GETATTR]		= (nfsd4_dec)nfsd4_decode_getattr,</div><div class='del'>-	[OP_GETFH]		= (nfsd4_dec)nfsd4_decode_noop,</div><div class='del'>-	[OP_LINK]		= (nfsd4_dec)nfsd4_decode_link,</div><div class='del'>-	[OP_LOCK]		= (nfsd4_dec)nfsd4_decode_lock,</div><div class='del'>-	[OP_LOCKT]		= (nfsd4_dec)nfsd4_decode_lockt,</div><div class='del'>-	[OP_LOCKU]		= (nfsd4_dec)nfsd4_decode_locku,</div><div class='del'>-	[OP_LOOKUP]		= (nfsd4_dec)nfsd4_decode_lookup,</div><div class='del'>-	[OP_LOOKUPP]		= (nfsd4_dec)nfsd4_decode_noop,</div><div class='del'>-	[OP_NVERIFY]		= (nfsd4_dec)nfsd4_decode_verify,</div><div class='del'>-	[OP_OPEN]		= (nfsd4_dec)nfsd4_decode_open,</div><div class='del'>-	[OP_OPENATTR]		= (nfsd4_dec)nfsd4_decode_notsupp,</div><div class='del'>-	[OP_OPEN_CONFIRM]	= (nfsd4_dec)nfsd4_decode_open_confirm,</div><div class='del'>-	[OP_OPEN_DOWNGRADE]	= (nfsd4_dec)nfsd4_decode_open_downgrade,</div><div class='del'>-	[OP_PUTFH]		= (nfsd4_dec)nfsd4_decode_putfh,</div><div class='del'>-	[OP_PUTPUBFH]		= (nfsd4_dec)nfsd4_decode_putpubfh,</div><div class='del'>-	[OP_PUTROOTFH]		= (nfsd4_dec)nfsd4_decode_noop,</div><div class='del'>-	[OP_READ]		= (nfsd4_dec)nfsd4_decode_read,</div><div class='del'>-	[OP_READDIR]		= (nfsd4_dec)nfsd4_decode_readdir,</div><div class='del'>-	[OP_READLINK]		= (nfsd4_dec)nfsd4_decode_noop,</div><div class='del'>-	[OP_REMOVE]		= (nfsd4_dec)nfsd4_decode_remove,</div><div class='del'>-	[OP_RENAME]		= (nfsd4_dec)nfsd4_decode_rename,</div><div class='del'>-	[OP_RENEW]		= (nfsd4_dec)nfsd4_decode_renew,</div><div class='del'>-	[OP_RESTOREFH]		= (nfsd4_dec)nfsd4_decode_noop,</div><div class='del'>-	[OP_SAVEFH]		= (nfsd4_dec)nfsd4_decode_noop,</div><div class='del'>-	[OP_SECINFO]		= (nfsd4_dec)nfsd4_decode_secinfo,</div><div class='del'>-	[OP_SETATTR]		= (nfsd4_dec)nfsd4_decode_setattr,</div><div class='del'>-	[OP_SETCLIENTID]	= (nfsd4_dec)nfsd4_decode_setclientid,</div><div class='del'>-	[OP_SETCLIENTID_CONFIRM] = (nfsd4_dec)nfsd4_decode_setclientid_confirm,</div><div class='del'>-	[OP_VERIFY]		= (nfsd4_dec)nfsd4_decode_verify,</div><div class='del'>-	[OP_WRITE]		= (nfsd4_dec)nfsd4_decode_write,</div><div class='del'>-	[OP_RELEASE_LOCKOWNER]	= (nfsd4_dec)nfsd4_decode_release_lockowner,</div><div class='add'>+	[OP_ACCESS]		= nfsd4_decode_access,</div><div class='add'>+	[OP_CLOSE]		= nfsd4_decode_close,</div><div class='add'>+	[OP_COMMIT]		= nfsd4_decode_commit,</div><div class='add'>+	[OP_CREATE]		= nfsd4_decode_create,</div><div class='add'>+	[OP_DELEGPURGE]		= nfsd4_decode_notsupp,</div><div class='add'>+	[OP_DELEGRETURN]	= nfsd4_decode_delegreturn,</div><div class='add'>+	[OP_GETATTR]		= nfsd4_decode_getattr,</div><div class='add'>+	[OP_GETFH]		= nfsd4_decode_noop,</div><div class='add'>+	[OP_LINK]		= nfsd4_decode_link,</div><div class='add'>+	[OP_LOCK]		= nfsd4_decode_lock,</div><div class='add'>+	[OP_LOCKT]		= nfsd4_decode_lockt,</div><div class='add'>+	[OP_LOCKU]		= nfsd4_decode_locku,</div><div class='add'>+	[OP_LOOKUP]		= nfsd4_decode_lookup,</div><div class='add'>+	[OP_LOOKUPP]		= nfsd4_decode_noop,</div><div class='add'>+	[OP_NVERIFY]		= nfsd4_decode_verify,</div><div class='add'>+	[OP_OPEN]		= nfsd4_decode_open,</div><div class='add'>+	[OP_OPENATTR]		= nfsd4_decode_notsupp,</div><div class='add'>+	[OP_OPEN_CONFIRM]	= nfsd4_decode_open_confirm,</div><div class='add'>+	[OP_OPEN_DOWNGRADE]	= nfsd4_decode_open_downgrade,</div><div class='add'>+	[OP_PUTFH]		= nfsd4_decode_putfh,</div><div class='add'>+	[OP_PUTPUBFH]		= nfsd4_decode_noop,</div><div class='add'>+	[OP_PUTROOTFH]		= nfsd4_decode_noop,</div><div class='add'>+	[OP_READ]		= nfsd4_decode_read,</div><div class='add'>+	[OP_READDIR]		= nfsd4_decode_readdir,</div><div class='add'>+	[OP_READLINK]		= nfsd4_decode_noop,</div><div class='add'>+	[OP_REMOVE]		= nfsd4_decode_remove,</div><div class='add'>+	[OP_RENAME]		= nfsd4_decode_rename,</div><div class='add'>+	[OP_RENEW]		= nfsd4_decode_renew,</div><div class='add'>+	[OP_RESTOREFH]		= nfsd4_decode_noop,</div><div class='add'>+	[OP_SAVEFH]		= nfsd4_decode_noop,</div><div class='add'>+	[OP_SECINFO]		= nfsd4_decode_secinfo,</div><div class='add'>+	[OP_SETATTR]		= nfsd4_decode_setattr,</div><div class='add'>+	[OP_SETCLIENTID]	= nfsd4_decode_setclientid,</div><div class='add'>+	[OP_SETCLIENTID_CONFIRM] = nfsd4_decode_setclientid_confirm,</div><div class='add'>+	[OP_VERIFY]		= nfsd4_decode_verify,</div><div class='add'>+	[OP_WRITE]		= nfsd4_decode_write,</div><div class='add'>+	[OP_RELEASE_LOCKOWNER]	= nfsd4_decode_release_lockowner,</div><div class='ctx'> </div><div class='ctx'> 	/* new operations for NFSv4.1 */</div><div class='del'>-	[OP_BACKCHANNEL_CTL]	= (nfsd4_dec)nfsd4_decode_backchannel_ctl,</div><div class='del'>-	[OP_BIND_CONN_TO_SESSION]= (nfsd4_dec)nfsd4_decode_bind_conn_to_session,</div><div class='del'>-	[OP_EXCHANGE_ID]	= (nfsd4_dec)nfsd4_decode_exchange_id,</div><div class='del'>-	[OP_CREATE_SESSION]	= (nfsd4_dec)nfsd4_decode_create_session,</div><div class='del'>-	[OP_DESTROY_SESSION]	= (nfsd4_dec)nfsd4_decode_destroy_session,</div><div class='del'>-	[OP_FREE_STATEID]	= (nfsd4_dec)nfsd4_decode_free_stateid,</div><div class='del'>-	[OP_GET_DIR_DELEGATION]	= (nfsd4_dec)nfsd4_decode_notsupp,</div><div class='add'>+	[OP_BACKCHANNEL_CTL]	= nfsd4_decode_backchannel_ctl,</div><div class='add'>+	[OP_BIND_CONN_TO_SESSION] = nfsd4_decode_bind_conn_to_session,</div><div class='add'>+	[OP_EXCHANGE_ID]	= nfsd4_decode_exchange_id,</div><div class='add'>+	[OP_CREATE_SESSION]	= nfsd4_decode_create_session,</div><div class='add'>+	[OP_DESTROY_SESSION]	= nfsd4_decode_destroy_session,</div><div class='add'>+	[OP_FREE_STATEID]	= nfsd4_decode_free_stateid,</div><div class='add'>+	[OP_GET_DIR_DELEGATION]	= nfsd4_decode_get_dir_delegation,</div><div class='ctx'> #ifdef CONFIG_NFSD_PNFS</div><div class='del'>-	[OP_GETDEVICEINFO]	= (nfsd4_dec)nfsd4_decode_getdeviceinfo,</div><div class='del'>-	[OP_GETDEVICELIST]	= (nfsd4_dec)nfsd4_decode_notsupp,</div><div class='del'>-	[OP_LAYOUTCOMMIT]	= (nfsd4_dec)nfsd4_decode_layoutcommit,</div><div class='del'>-	[OP_LAYOUTGET]		= (nfsd4_dec)nfsd4_decode_layoutget,</div><div class='del'>-	[OP_LAYOUTRETURN]	= (nfsd4_dec)nfsd4_decode_layoutreturn,</div><div class='add'>+	[OP_GETDEVICEINFO]	= nfsd4_decode_getdeviceinfo,</div><div class='add'>+	[OP_GETDEVICELIST]	= nfsd4_decode_notsupp,</div><div class='add'>+	[OP_LAYOUTCOMMIT]	= nfsd4_decode_layoutcommit,</div><div class='add'>+	[OP_LAYOUTGET]		= nfsd4_decode_layoutget,</div><div class='add'>+	[OP_LAYOUTRETURN]	= nfsd4_decode_layoutreturn,</div><div class='ctx'> #else</div><div class='del'>-	[OP_GETDEVICEINFO]	= (nfsd4_dec)nfsd4_decode_notsupp,</div><div class='del'>-	[OP_GETDEVICELIST]	= (nfsd4_dec)nfsd4_decode_notsupp,</div><div class='del'>-	[OP_LAYOUTCOMMIT]	= (nfsd4_dec)nfsd4_decode_notsupp,</div><div class='del'>-	[OP_LAYOUTGET]		= (nfsd4_dec)nfsd4_decode_notsupp,</div><div class='del'>-	[OP_LAYOUTRETURN]	= (nfsd4_dec)nfsd4_decode_notsupp,</div><div class='add'>+	[OP_GETDEVICEINFO]	= nfsd4_decode_notsupp,</div><div class='add'>+	[OP_GETDEVICELIST]	= nfsd4_decode_notsupp,</div><div class='add'>+	[OP_LAYOUTCOMMIT]	= nfsd4_decode_notsupp,</div><div class='add'>+	[OP_LAYOUTGET]		= nfsd4_decode_notsupp,</div><div class='add'>+	[OP_LAYOUTRETURN]	= nfsd4_decode_notsupp,</div><div class='ctx'> #endif</div><div class='del'>-	[OP_SECINFO_NO_NAME]	= (nfsd4_dec)nfsd4_decode_secinfo_no_name,</div><div class='del'>-	[OP_SEQUENCE]		= (nfsd4_dec)nfsd4_decode_sequence,</div><div class='del'>-	[OP_SET_SSV]		= (nfsd4_dec)nfsd4_decode_notsupp,</div><div class='del'>-	[OP_TEST_STATEID]	= (nfsd4_dec)nfsd4_decode_test_stateid,</div><div class='del'>-	[OP_WANT_DELEGATION]	= (nfsd4_dec)nfsd4_decode_notsupp,</div><div class='del'>-	[OP_DESTROY_CLIENTID]	= (nfsd4_dec)nfsd4_decode_destroy_clientid,</div><div class='del'>-	[OP_RECLAIM_COMPLETE]	= (nfsd4_dec)nfsd4_decode_reclaim_complete,</div><div class='add'>+	[OP_SECINFO_NO_NAME]	= nfsd4_decode_secinfo_no_name,</div><div class='add'>+	[OP_SEQUENCE]		= nfsd4_decode_sequence,</div><div class='add'>+	[OP_SET_SSV]		= nfsd4_decode_notsupp,</div><div class='add'>+	[OP_TEST_STATEID]	= nfsd4_decode_test_stateid,</div><div class='add'>+	[OP_WANT_DELEGATION]	= nfsd4_decode_notsupp,</div><div class='add'>+	[OP_DESTROY_CLIENTID]	= nfsd4_decode_destroy_clientid,</div><div class='add'>+	[OP_RECLAIM_COMPLETE]	= nfsd4_decode_reclaim_complete,</div><div class='ctx'> </div><div class='ctx'> 	/* new operations for NFSv4.2 */</div><div class='del'>-	[OP_ALLOCATE]		= (nfsd4_dec)nfsd4_decode_fallocate,</div><div class='del'>-	[OP_COPY]		= (nfsd4_dec)nfsd4_decode_copy,</div><div class='del'>-	[OP_COPY_NOTIFY]	= (nfsd4_dec)nfsd4_decode_copy_notify,</div><div class='del'>-	[OP_DEALLOCATE]		= (nfsd4_dec)nfsd4_decode_fallocate,</div><div class='del'>-	[OP_IO_ADVISE]		= (nfsd4_dec)nfsd4_decode_notsupp,</div><div class='del'>-	[OP_LAYOUTERROR]	= (nfsd4_dec)nfsd4_decode_notsupp,</div><div class='del'>-	[OP_LAYOUTSTATS]	= (nfsd4_dec)nfsd4_decode_notsupp,</div><div class='del'>-	[OP_OFFLOAD_CANCEL]	= (nfsd4_dec)nfsd4_decode_offload_status,</div><div class='del'>-	[OP_OFFLOAD_STATUS]	= (nfsd4_dec)nfsd4_decode_offload_status,</div><div class='del'>-	[OP_READ_PLUS]		= (nfsd4_dec)nfsd4_decode_read,</div><div class='del'>-	[OP_SEEK]		= (nfsd4_dec)nfsd4_decode_seek,</div><div class='del'>-	[OP_WRITE_SAME]		= (nfsd4_dec)nfsd4_decode_notsupp,</div><div class='del'>-	[OP_CLONE]		= (nfsd4_dec)nfsd4_decode_clone,</div><div class='add'>+	[OP_ALLOCATE]		= nfsd4_decode_fallocate,</div><div class='add'>+	[OP_COPY]		= nfsd4_decode_copy,</div><div class='add'>+	[OP_COPY_NOTIFY]	= nfsd4_decode_copy_notify,</div><div class='add'>+	[OP_DEALLOCATE]		= nfsd4_decode_fallocate,</div><div class='add'>+	[OP_IO_ADVISE]		= nfsd4_decode_notsupp,</div><div class='add'>+	[OP_LAYOUTERROR]	= nfsd4_decode_notsupp,</div><div class='add'>+	[OP_LAYOUTSTATS]	= nfsd4_decode_notsupp,</div><div class='add'>+	[OP_OFFLOAD_CANCEL]	= nfsd4_decode_offload_status,</div><div class='add'>+	[OP_OFFLOAD_STATUS]	= nfsd4_decode_offload_status,</div><div class='add'>+	[OP_READ_PLUS]		= nfsd4_decode_read,</div><div class='add'>+	[OP_SEEK]		= nfsd4_decode_seek,</div><div class='add'>+	[OP_WRITE_SAME]		= nfsd4_decode_notsupp,</div><div class='add'>+	[OP_CLONE]		= nfsd4_decode_clone,</div><div class='ctx'> 	/* RFC 8276 extended atributes operations */</div><div class='del'>-	[OP_GETXATTR]		= (nfsd4_dec)nfsd4_decode_getxattr,</div><div class='del'>-	[OP_SETXATTR]		= (nfsd4_dec)nfsd4_decode_setxattr,</div><div class='del'>-	[OP_LISTXATTRS]		= (nfsd4_dec)nfsd4_decode_listxattrs,</div><div class='del'>-	[OP_REMOVEXATTR]	= (nfsd4_dec)nfsd4_decode_removexattr,</div><div class='add'>+	[OP_GETXATTR]		= nfsd4_decode_getxattr,</div><div class='add'>+	[OP_SETXATTR]		= nfsd4_decode_setxattr,</div><div class='add'>+	[OP_LISTXATTRS]		= nfsd4_decode_listxattrs,</div><div class='add'>+	[OP_REMOVEXATTR]	= nfsd4_decode_removexattr,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> static inline bool</div><div class='hunk'>@@ -2352,22 +2488,15 @@ nfsd4_decode_compound(struct nfsd4_compoundargs *argp)</div><div class='ctx'> </div><div class='ctx'> 	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;argp-&gt;minorversion) &lt; 0)</div><div class='ctx'> 		return false;</div><div class='del'>-	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;argp-&gt;opcnt) &lt; 0)</div><div class='add'>+	if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;argp-&gt;client_opcnt) &lt; 0)</div><div class='ctx'> 		return false;</div><div class='del'>-</div><div class='del'>-	/*</div><div class='del'>-	 * NFS4ERR_RESOURCE is a more helpful error than GARBAGE_ARGS</div><div class='del'>-	 * here, so we return success at the xdr level so that</div><div class='del'>-	 * nfsd4_proc can handle this is an NFS-level error.</div><div class='del'>-	 */</div><div class='del'>-	if (argp-&gt;opcnt &gt; NFSD_MAX_OPS_PER_COMPOUND)</div><div class='del'>-		return true;</div><div class='add'>+	argp-&gt;opcnt = min_t(u32, argp-&gt;client_opcnt,</div><div class='add'>+			    NFSD_MAX_OPS_PER_COMPOUND);</div><div class='ctx'> </div><div class='ctx'> 	if (argp-&gt;opcnt &gt; ARRAY_SIZE(argp-&gt;iops)) {</div><div class='del'>-		argp-&gt;ops = kzalloc(argp-&gt;opcnt * sizeof(*argp-&gt;ops), GFP_KERNEL);</div><div class='add'>+		argp-&gt;ops = vcalloc(argp-&gt;opcnt, sizeof(*argp-&gt;ops));</div><div class='ctx'> 		if (!argp-&gt;ops) {</div><div class='ctx'> 			argp-&gt;ops = argp-&gt;iops;</div><div class='del'>-			dprintk("nfsd: couldn't allocate room for COMPOUND\n");</div><div class='ctx'> 			return false;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='hunk'>@@ -2378,10 +2507,12 @@ nfsd4_decode_compound(struct nfsd4_compoundargs *argp)</div><div class='ctx'> 	for (i = 0; i &lt; argp-&gt;opcnt; i++) {</div><div class='ctx'> 		op = &amp;argp-&gt;ops[i];</div><div class='ctx'> 		op-&gt;replay = NULL;</div><div class='add'>+		op-&gt;opdesc = NULL;</div><div class='ctx'> </div><div class='ctx'> 		if (xdr_stream_decode_u32(argp-&gt;xdr, &amp;op-&gt;opnum) &lt; 0)</div><div class='ctx'> 			return false;</div><div class='ctx'> 		if (nfsd4_opnum_in_range(argp, op)) {</div><div class='add'>+			op-&gt;opdesc = OPDESC(op);</div><div class='ctx'> 			op-&gt;status = nfsd4_dec_ops[op-&gt;opnum](argp, &amp;op-&gt;u);</div><div class='ctx'> 			if (op-&gt;status != nfs_ok)</div><div class='ctx'> 				trace_nfsd_compound_decode_err(argp-&gt;rqstp,</div><div class='hunk'>@@ -2392,7 +2523,7 @@ nfsd4_decode_compound(struct nfsd4_compoundargs *argp)</div><div class='ctx'> 			op-&gt;opnum = OP_ILLEGAL;</div><div class='ctx'> 			op-&gt;status = nfserr_op_illegal;</div><div class='ctx'> 		}</div><div class='del'>-		op-&gt;opdesc = OPDESC(op);</div><div class='add'>+</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * We'll try to cache the result in the DRC if any one</div><div class='ctx'> 		 * op in the compound wants to be cached:</div><div class='hunk'>@@ -2421,57 +2552,72 @@ nfsd4_decode_compound(struct nfsd4_compoundargs *argp)</div><div class='ctx'> 	/* Sessions make the DRC unnecessary: */</div><div class='ctx'> 	if (argp-&gt;minorversion)</div><div class='ctx'> 		cachethis = false;</div><div class='del'>-	svc_reserve(argp-&gt;rqstp, max_reply + readbytes);</div><div class='add'>+	svc_reserve_auth(argp-&gt;rqstp, max_reply + readbytes);</div><div class='ctx'> 	argp-&gt;rqstp-&gt;rq_cachetype = cachethis ? RC_REPLBUFF : RC_NOCACHE;</div><div class='ctx'> </div><div class='add'>+	argp-&gt;splice_ok = nfsd_read_splice_ok(argp-&gt;rqstp);</div><div class='ctx'> 	if (readcount &gt; 1 || max_reply &gt; PAGE_SIZE - auth_slack)</div><div class='del'>-		clear_bit(RQ_SPLICE_OK, &amp;argp-&gt;rqstp-&gt;rq_flags);</div><div class='add'>+		argp-&gt;splice_ok = false;</div><div class='ctx'> </div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static __be32 *encode_change(__be32 *p, struct kstat *stat, struct inode *inode,</div><div class='del'>-			     struct svc_export *exp)</div><div class='add'>+static __be32 nfsd4_encode_nfs_fh4(struct xdr_stream *xdr,</div><div class='add'>+				   struct knfsd_fh *fh_handle)</div><div class='ctx'> {</div><div class='del'>-	if (exp-&gt;ex_flags &amp; NFSEXP_V4ROOT) {</div><div class='del'>-		*p++ = cpu_to_be32(convert_to_wallclock(exp-&gt;cd-&gt;flush_time));</div><div class='del'>-		*p++ = 0;</div><div class='del'>-	} else</div><div class='del'>-		p = xdr_encode_hyper(p, nfsd4_change_attribute(stat, inode));</div><div class='del'>-	return p;</div><div class='add'>+	return nfsd4_encode_opaque(xdr, fh_handle-&gt;fh_raw, fh_handle-&gt;fh_size);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * ctime (in NFSv4, time_metadata) is not writeable, and the client</div><div class='del'>- * doesn't really care what resolution could theoretically be stored by</div><div class='del'>- * the filesystem.</div><div class='del'>- *</div><div class='del'>- * The client cares how close together changes can be while still</div><div class='del'>- * guaranteeing ctime changes.  For most filesystems (which have</div><div class='del'>- * timestamps with nanosecond fields) that is limited by the resolution</div><div class='del'>- * of the time returned from current_time() (which I'm assuming to be</div><div class='del'>- * 1/HZ).</div><div class='del'>- */</div><div class='del'>-static __be32 *encode_time_delta(__be32 *p, struct inode *inode)</div><div class='add'>+/* This is a frequently-encoded type; open-coded for speed */</div><div class='add'>+static __be32 nfsd4_encode_nfstime4(struct xdr_stream *xdr,</div><div class='add'>+				    const struct timespec64 *tv)</div><div class='ctx'> {</div><div class='del'>-	struct timespec64 ts;</div><div class='del'>-	u32 ns;</div><div class='add'>+	__be32 *p;</div><div class='ctx'> </div><div class='del'>-	ns = max_t(u32, NSEC_PER_SEC/HZ, inode-&gt;i_sb-&gt;s_time_gran);</div><div class='del'>-	ts = ns_to_timespec64(ns);</div><div class='add'>+	p = xdr_reserve_space(xdr, XDR_UNIT * 3);</div><div class='add'>+	if (!p)</div><div class='add'>+		return nfserr_resource;</div><div class='add'>+	p = xdr_encode_hyper(p, tv-&gt;tv_sec);</div><div class='add'>+	*p = cpu_to_be32(tv-&gt;tv_nsec);</div><div class='add'>+	return nfs_ok;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	p = xdr_encode_hyper(p, ts.tv_sec);</div><div class='del'>-	*p++ = cpu_to_be32(ts.tv_nsec);</div><div class='add'>+static __be32 nfsd4_encode_specdata4(struct xdr_stream *xdr,</div><div class='add'>+				     unsigned int major, unsigned int minor)</div><div class='add'>+{</div><div class='add'>+	__be32 status;</div><div class='ctx'> </div><div class='del'>-	return p;</div><div class='add'>+	status = nfsd4_encode_uint32_t(xdr, major);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	return nfsd4_encode_uint32_t(xdr, minor);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static __be32 *encode_cinfo(__be32 *p, struct nfsd4_change_info *c)</div><div class='add'>+static __be32</div><div class='add'>+nfsd4_encode_change_info4(struct xdr_stream *xdr, const struct nfsd4_change_info *c)</div><div class='ctx'> {</div><div class='del'>-	*p++ = cpu_to_be32(c-&gt;atomic);</div><div class='del'>-	p = xdr_encode_hyper(p, c-&gt;before_change);</div><div class='del'>-	p = xdr_encode_hyper(p, c-&gt;after_change);</div><div class='del'>-	return p;</div><div class='add'>+	__be32 status;</div><div class='add'>+</div><div class='add'>+	status = nfsd4_encode_bool(xdr, c-&gt;atomic);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	status = nfsd4_encode_changeid4(xdr, c-&gt;before_change);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	return nfsd4_encode_changeid4(xdr, c-&gt;after_change);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_netaddr4(struct xdr_stream *xdr,</div><div class='add'>+				    const struct nfs42_netaddr *addr)</div><div class='add'>+{</div><div class='add'>+	__be32 status;</div><div class='add'>+</div><div class='add'>+	/* na_r_netid */</div><div class='add'>+	status = nfsd4_encode_opaque(xdr, addr-&gt;netid, addr-&gt;netid_len);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	/* na_r_addr */</div><div class='add'>+	return nfsd4_encode_opaque(xdr, addr-&gt;addr, addr-&gt;addr_len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* Encode as an array of strings the string given with components</div><div class='hunk'>@@ -2484,10 +2630,8 @@ static __be32 nfsd4_encode_components_esc(struct xdr_stream *xdr, char sep,</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> 	__be32 pathlen;</div><div class='ctx'> 	int pathlen_offset;</div><div class='del'>-	int strlen, count=0;</div><div class='ctx'> 	char *str, *end, *next;</div><div class='del'>-</div><div class='del'>-	dprintk("nfsd4_encode_components(%s)\n", components);</div><div class='add'>+	int count = 0;</div><div class='ctx'> </div><div class='ctx'> 	pathlen_offset = xdr-&gt;buf-&gt;len;</div><div class='ctx'> 	p = xdr_reserve_space(xdr, 4);</div><div class='hunk'>@@ -2514,15 +2658,11 @@ static __be32 nfsd4_encode_components_esc(struct xdr_stream *xdr, char sep,</div><div class='ctx'> 			for (; *end &amp;&amp; (*end != sep); end++)</div><div class='ctx'> 				/* find sep or end of string */;</div><div class='ctx'> </div><div class='del'>-		strlen = end - str;</div><div class='del'>-		if (strlen) {</div><div class='del'>-			p = xdr_reserve_space(xdr, strlen + 4);</div><div class='del'>-			if (!p)</div><div class='add'>+		if (end &gt; str) {</div><div class='add'>+			if (xdr_stream_encode_opaque(xdr, str, end - str) &lt; 0)</div><div class='ctx'> 				return nfserr_resource;</div><div class='del'>-			p = xdr_encode_opaque(p, str, strlen);</div><div class='ctx'> 			count++;</div><div class='del'>-		}</div><div class='del'>-		else</div><div class='add'>+		} else</div><div class='ctx'> 			end++;</div><div class='ctx'> 		if (found_esc)</div><div class='ctx'> 			end = next;</div><div class='hunk'>@@ -2543,9 +2683,6 @@ static __be32 nfsd4_encode_components(struct xdr_stream *xdr, char sep,</div><div class='ctx'> 	return nfsd4_encode_components_esc(xdr, sep, components, 0, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * encode a location element of a fs_locations structure</div><div class='del'>- */</div><div class='ctx'> static __be32 nfsd4_encode_fs_location4(struct xdr_stream *xdr,</div><div class='ctx'> 					struct nfsd4_fs_location *location)</div><div class='ctx'> {</div><div class='hunk'>@@ -2558,18 +2695,14 @@ static __be32 nfsd4_encode_fs_location4(struct xdr_stream *xdr,</div><div class='ctx'> 	status = nfsd4_encode_components(xdr, '/', location-&gt;path);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		return status;</div><div class='del'>-	return 0;</div><div class='add'>+	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Encode a path in RFC3530 'pathname4' format</div><div class='del'>- */</div><div class='del'>-static __be32 nfsd4_encode_path(struct xdr_stream *xdr,</div><div class='del'>-				const struct path *root,</div><div class='del'>-				const struct path *path)</div><div class='add'>+static __be32 nfsd4_encode_pathname4(struct xdr_stream *xdr,</div><div class='add'>+				     const struct path *root,</div><div class='add'>+				     const struct path *path)</div><div class='ctx'> {</div><div class='ctx'> 	struct path cur = *path;</div><div class='del'>-	__be32 *p;</div><div class='ctx'> 	struct dentry **components = NULL;</div><div class='ctx'> 	unsigned int ncomponents = 0;</div><div class='ctx'> 	__be32 err = nfserr_jukebox;</div><div class='hunk'>@@ -2600,24 +2733,19 @@ static __be32 nfsd4_encode_path(struct xdr_stream *xdr,</div><div class='ctx'> 		components[ncomponents++] = cur.dentry;</div><div class='ctx'> 		cur.dentry = dget_parent(cur.dentry);</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='ctx'> 	err = nfserr_resource;</div><div class='del'>-	p = xdr_reserve_space(xdr, 4);</div><div class='del'>-	if (!p)</div><div class='add'>+	if (xdr_stream_encode_u32(xdr, ncomponents) != XDR_UNIT)</div><div class='ctx'> 		goto out_free;</div><div class='del'>-	*p++ = cpu_to_be32(ncomponents);</div><div class='del'>-</div><div class='ctx'> 	while (ncomponents) {</div><div class='ctx'> 		struct dentry *dentry = components[ncomponents - 1];</div><div class='del'>-		unsigned int len;</div><div class='ctx'> </div><div class='ctx'> 		spin_lock(&amp;dentry-&gt;d_lock);</div><div class='del'>-		len = dentry-&gt;d_name.len;</div><div class='del'>-		p = xdr_reserve_space(xdr, len + 4);</div><div class='del'>-		if (!p) {</div><div class='add'>+		if (xdr_stream_encode_opaque(xdr, dentry-&gt;d_name.name,</div><div class='add'>+					     dentry-&gt;d_name.len) &lt; 0) {</div><div class='ctx'> 			spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 			goto out_free;</div><div class='ctx'> 		}</div><div class='del'>-		p = xdr_encode_opaque(p, dentry-&gt;d_name.name, len);</div><div class='ctx'> 		dprintk("/%pd", dentry);</div><div class='ctx'> 		spin_unlock(&amp;dentry-&gt;d_lock);</div><div class='ctx'> 		dput(dentry);</div><div class='hunk'>@@ -2634,89 +2762,59 @@ out_free:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static __be32 nfsd4_encode_fsloc_fsroot(struct xdr_stream *xdr,</div><div class='del'>-			struct svc_rqst *rqstp, const struct path *path)</div><div class='add'>+static __be32 nfsd4_encode_fs_locations4(struct xdr_stream *xdr,</div><div class='add'>+					 struct svc_rqst *rqstp,</div><div class='add'>+					 struct svc_export *exp)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_fs_locations *fslocs = &amp;exp-&gt;ex_fslocs;</div><div class='ctx'> 	struct svc_export *exp_ps;</div><div class='del'>-	__be32 res;</div><div class='add'>+	unsigned int i;</div><div class='add'>+	__be32 status;</div><div class='ctx'> </div><div class='add'>+	/* fs_root */</div><div class='ctx'> 	exp_ps = rqst_find_fsidzero_export(rqstp);</div><div class='ctx'> 	if (IS_ERR(exp_ps))</div><div class='ctx'> 		return nfserrno(PTR_ERR(exp_ps));</div><div class='del'>-	res = nfsd4_encode_path(xdr, &amp;exp_ps-&gt;ex_path, path);</div><div class='add'>+	status = nfsd4_encode_pathname4(xdr, &amp;exp_ps-&gt;ex_path, &amp;exp-&gt;ex_path);</div><div class='ctx'> 	exp_put(exp_ps);</div><div class='del'>-	return res;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- *  encode a fs_locations structure</div><div class='del'>- */</div><div class='del'>-static __be32 nfsd4_encode_fs_locations(struct xdr_stream *xdr,</div><div class='del'>-			struct svc_rqst *rqstp, struct svc_export *exp)</div><div class='del'>-{</div><div class='del'>-	__be32 status;</div><div class='del'>-	int i;</div><div class='del'>-	__be32 *p;</div><div class='del'>-	struct nfsd4_fs_locations *fslocs = &amp;exp-&gt;ex_fslocs;</div><div class='del'>-</div><div class='del'>-	status = nfsd4_encode_fsloc_fsroot(xdr, rqstp, &amp;exp-&gt;ex_path);</div><div class='del'>-	if (status)</div><div class='add'>+	if (status != nfs_ok)</div><div class='ctx'> 		return status;</div><div class='del'>-	p = xdr_reserve_space(xdr, 4);</div><div class='del'>-	if (!p)</div><div class='add'>+</div><div class='add'>+	/* locations&lt;&gt; */</div><div class='add'>+	if (xdr_stream_encode_u32(xdr, fslocs-&gt;locations_count) != XDR_UNIT)</div><div class='ctx'> 		return nfserr_resource;</div><div class='del'>-	*p++ = cpu_to_be32(fslocs-&gt;locations_count);</div><div class='del'>-	for (i=0; i&lt;fslocs-&gt;locations_count; i++) {</div><div class='add'>+	for (i = 0; i &lt; fslocs-&gt;locations_count; i++) {</div><div class='ctx'> 		status = nfsd4_encode_fs_location4(xdr, &amp;fslocs-&gt;locations[i]);</div><div class='del'>-		if (status)</div><div class='add'>+		if (status != nfs_ok)</div><div class='ctx'> 			return status;</div><div class='ctx'> 	}</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='ctx'> </div><div class='del'>-static u32 nfs4_file_type(umode_t mode)</div><div class='del'>-{</div><div class='del'>-	switch (mode &amp; S_IFMT) {</div><div class='del'>-	case S_IFIFO:	return NF4FIFO;</div><div class='del'>-	case S_IFCHR:	return NF4CHR;</div><div class='del'>-	case S_IFDIR:	return NF4DIR;</div><div class='del'>-	case S_IFBLK:	return NF4BLK;</div><div class='del'>-	case S_IFLNK:	return NF4LNK;</div><div class='del'>-	case S_IFREG:	return NF4REG;</div><div class='del'>-	case S_IFSOCK:	return NF4SOCK;</div><div class='del'>-	default:	return NF4BAD;</div><div class='del'>-	}</div><div class='add'>+	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline __be32</div><div class='del'>-nfsd4_encode_aclname(struct xdr_stream *xdr, struct svc_rqst *rqstp,</div><div class='del'>-		     struct nfs4_ace *ace)</div><div class='add'>+static __be32 nfsd4_encode_nfsace4(struct xdr_stream *xdr, struct svc_rqst *rqstp,</div><div class='add'>+				   struct nfs4_ace *ace)</div><div class='ctx'> {</div><div class='add'>+	__be32 status;</div><div class='add'>+</div><div class='add'>+	/* type */</div><div class='add'>+	status = nfsd4_encode_acetype4(xdr, ace-&gt;type);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return nfserr_resource;</div><div class='add'>+	/* flag */</div><div class='add'>+	status = nfsd4_encode_aceflag4(xdr, ace-&gt;flag);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return nfserr_resource;</div><div class='add'>+	/* access mask */</div><div class='add'>+	status = nfsd4_encode_acemask4(xdr, ace-&gt;access_mask &amp; NFS4_ACE_MASK_ALL);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return nfserr_resource;</div><div class='add'>+	/* who */</div><div class='ctx'> 	if (ace-&gt;whotype != NFS4_ACL_WHO_NAMED)</div><div class='ctx'> 		return nfs4_acl_write_who(xdr, ace-&gt;whotype);</div><div class='del'>-	else if (ace-&gt;flag &amp; NFS4_ACE_IDENTIFIER_GROUP)</div><div class='add'>+	if (ace-&gt;flag &amp; NFS4_ACE_IDENTIFIER_GROUP)</div><div class='ctx'> 		return nfsd4_encode_group(xdr, rqstp, ace-&gt;who_gid);</div><div class='del'>-	else</div><div class='del'>-		return nfsd4_encode_user(xdr, rqstp, ace-&gt;who_uid);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static inline __be32</div><div class='del'>-nfsd4_encode_layout_types(struct xdr_stream *xdr, u32 layout_types)</div><div class='del'>-{</div><div class='del'>-	__be32		*p;</div><div class='del'>-	unsigned long	i = hweight_long(layout_types);</div><div class='del'>-</div><div class='del'>-	p = xdr_reserve_space(xdr, 4 + 4 * i);</div><div class='del'>-	if (!p)</div><div class='del'>-		return nfserr_resource;</div><div class='del'>-</div><div class='del'>-	*p++ = cpu_to_be32(i);</div><div class='del'>-</div><div class='del'>-	for (i = LAYOUT_NFSV4_1_FILES; i &lt; LAYOUT_TYPE_MAX; ++i)</div><div class='del'>-		if (layout_types &amp; (1 &lt;&lt; i))</div><div class='del'>-			*p++ = cpu_to_be32(i);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='add'>+	return nfsd4_encode_user(xdr, rqstp, ace-&gt;who_uid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #define WORD0_ABSENT_FS_ATTRS (FATTR4_WORD0_FS_LOCATIONS | FATTR4_WORD0_FSID | \</div><div class='hunk'>@@ -2727,11 +2825,11 @@ nfsd4_encode_layout_types(struct xdr_stream *xdr, u32 layout_types)</div><div class='ctx'> #ifdef CONFIG_NFSD_V4_SECURITY_LABEL</div><div class='ctx'> static inline __be32</div><div class='ctx'> nfsd4_encode_security_label(struct xdr_stream *xdr, struct svc_rqst *rqstp,</div><div class='del'>-			    void *context, int len)</div><div class='add'>+			    const struct lsm_context *context)</div><div class='ctx'> {</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, len + 4 + 4 + 4);</div><div class='add'>+	p = xdr_reserve_space(xdr, context-&gt;len + 4 + 4 + 4);</div><div class='ctx'> 	if (!p)</div><div class='ctx'> 		return nfserr_resource;</div><div class='ctx'> </div><div class='hunk'>@@ -2741,13 +2839,13 @@ nfsd4_encode_security_label(struct xdr_stream *xdr, struct svc_rqst *rqstp,</div><div class='ctx'> 	 */</div><div class='ctx'> 	*p++ = cpu_to_be32(0); /* lfs */</div><div class='ctx'> 	*p++ = cpu_to_be32(0); /* pi */</div><div class='del'>-	p = xdr_encode_opaque(p, context, len);</div><div class='add'>+	p = xdr_encode_opaque(p, context-&gt;context, context-&gt;len);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> #else</div><div class='ctx'> static inline __be32</div><div class='ctx'> nfsd4_encode_security_label(struct xdr_stream *xdr, struct svc_rqst *rqstp,</div><div class='del'>-			    void *context, int len)</div><div class='add'>+			    struct lsm_context *context)</div><div class='ctx'> { return 0; }</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='hunk'>@@ -2769,9 +2867,10 @@ static __be32 fattr_handle_absent_fs(u32 *bmval0, u32 *bmval1, u32 *bmval2, u32</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> </div><div class='del'>-static int get_parent_attributes(struct svc_export *exp, struct kstat *stat)</div><div class='add'>+static int nfsd4_get_mounted_on_ino(struct svc_export *exp, u64 *pino)</div><div class='ctx'> {</div><div class='ctx'> 	struct path path = exp-&gt;ex_path;</div><div class='add'>+	struct kstat stat;</div><div class='ctx'> 	int err;</div><div class='ctx'> </div><div class='ctx'> 	path_get(&amp;path);</div><div class='hunk'>@@ -2779,18 +2878,20 @@ static int get_parent_attributes(struct svc_export *exp, struct kstat *stat)</div><div class='ctx'> 		if (path.dentry != path.mnt-&gt;mnt_root)</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='del'>-	err = vfs_getattr(&amp;path, stat, STATX_BASIC_STATS, AT_STATX_SYNC_AS_STAT);</div><div class='add'>+	err = vfs_getattr(&amp;path, &amp;stat, STATX_INO, AT_STATX_SYNC_AS_STAT);</div><div class='ctx'> 	path_put(&amp;path);</div><div class='add'>+	if (!err)</div><div class='add'>+		*pino = stat.ino;</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_bitmap(struct xdr_stream *xdr, u32 bmval0, u32 bmval1, u32 bmval2)</div><div class='add'>+nfsd4_encode_bitmap4(struct xdr_stream *xdr, u32 bmval0, u32 bmval1, u32 bmval2)</div><div class='ctx'> {</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> </div><div class='ctx'> 	if (bmval2) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 16);</div><div class='add'>+		p = xdr_reserve_space(xdr, XDR_UNIT * 4);</div><div class='ctx'> 		if (!p)</div><div class='ctx'> 			goto out_resource;</div><div class='ctx'> 		*p++ = cpu_to_be32(3);</div><div class='hunk'>@@ -2798,85 +2899,778 @@ nfsd4_encode_bitmap(struct xdr_stream *xdr, u32 bmval0, u32 bmval1, u32 bmval2)</div><div class='ctx'> 		*p++ = cpu_to_be32(bmval1);</div><div class='ctx'> 		*p++ = cpu_to_be32(bmval2);</div><div class='ctx'> 	} else if (bmval1) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 12);</div><div class='add'>+		p = xdr_reserve_space(xdr, XDR_UNIT * 3);</div><div class='ctx'> 		if (!p)</div><div class='ctx'> 			goto out_resource;</div><div class='ctx'> 		*p++ = cpu_to_be32(2);</div><div class='ctx'> 		*p++ = cpu_to_be32(bmval0);</div><div class='ctx'> 		*p++ = cpu_to_be32(bmval1);</div><div class='ctx'> 	} else {</div><div class='del'>-		p = xdr_reserve_space(xdr, 8);</div><div class='add'>+		p = xdr_reserve_space(xdr, XDR_UNIT * 2);</div><div class='ctx'> 		if (!p)</div><div class='ctx'> 			goto out_resource;</div><div class='ctx'> 		*p++ = cpu_to_be32(1);</div><div class='ctx'> 		*p++ = cpu_to_be32(bmval0);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+	return nfs_ok;</div><div class='ctx'> out_resource:</div><div class='ctx'> 	return nfserr_resource;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+struct nfsd4_fattr_args {</div><div class='add'>+	struct svc_rqst		*rqstp;</div><div class='add'>+	struct svc_fh		*fhp;</div><div class='add'>+	struct svc_export	*exp;</div><div class='add'>+	struct dentry		*dentry;</div><div class='add'>+	struct kstat		stat;</div><div class='add'>+	struct kstatfs		statfs;</div><div class='add'>+	struct nfs4_acl		*acl;</div><div class='add'>+	u64			change_attr;</div><div class='add'>+#ifdef CONFIG_NFSD_V4_SECURITY_LABEL</div><div class='add'>+	struct lsm_context	context;</div><div class='add'>+#endif</div><div class='add'>+	u32			rdattr_err;</div><div class='add'>+	bool			contextsupport;</div><div class='add'>+	bool			ignore_crossmnt;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+typedef __be32(*nfsd4_enc_attr)(struct xdr_stream *xdr,</div><div class='add'>+				const struct nfsd4_fattr_args *args);</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4__inval(struct xdr_stream *xdr,</div><div class='add'>+					 const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	return nfserr_inval;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4__noop(struct xdr_stream *xdr,</div><div class='add'>+					const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	return nfs_ok;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4__true(struct xdr_stream *xdr,</div><div class='add'>+					const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	return nfsd4_encode_bool(xdr, true);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4__false(struct xdr_stream *xdr,</div><div class='add'>+					 const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	return nfsd4_encode_bool(xdr, false);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_supported_attrs(struct xdr_stream *xdr,</div><div class='add'>+						  const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	struct nfsd4_compoundres *resp = args-&gt;rqstp-&gt;rq_resp;</div><div class='add'>+	u32 minorversion = resp-&gt;cstate.minorversion;</div><div class='add'>+	u32 supp[3];</div><div class='add'>+</div><div class='add'>+	memcpy(supp, nfsd_suppattrs[minorversion], sizeof(supp));</div><div class='add'>+	if (!IS_POSIXACL(d_inode(args-&gt;dentry)))</div><div class='add'>+		supp[0] &amp;= ~FATTR4_WORD0_ACL;</div><div class='add'>+	if (!args-&gt;contextsupport)</div><div class='add'>+		supp[2] &amp;= ~FATTR4_WORD2_SECURITY_LABEL;</div><div class='add'>+</div><div class='add'>+	return nfsd4_encode_bitmap4(xdr, supp[0], supp[1], supp[2]);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_type(struct xdr_stream *xdr,</div><div class='add'>+				       const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	__be32 *p;</div><div class='add'>+</div><div class='add'>+	p = xdr_reserve_space(xdr, XDR_UNIT);</div><div class='add'>+	if (!p)</div><div class='add'>+		return nfserr_resource;</div><div class='add'>+</div><div class='add'>+	switch (args-&gt;stat.mode &amp; S_IFMT) {</div><div class='add'>+	case S_IFIFO:</div><div class='add'>+		*p = cpu_to_be32(NF4FIFO);</div><div class='add'>+		break;</div><div class='add'>+	case S_IFCHR:</div><div class='add'>+		*p = cpu_to_be32(NF4CHR);</div><div class='add'>+		break;</div><div class='add'>+	case S_IFDIR:</div><div class='add'>+		*p = cpu_to_be32(NF4DIR);</div><div class='add'>+		break;</div><div class='add'>+	case S_IFBLK:</div><div class='add'>+		*p = cpu_to_be32(NF4BLK);</div><div class='add'>+		break;</div><div class='add'>+	case S_IFLNK:</div><div class='add'>+		*p = cpu_to_be32(NF4LNK);</div><div class='add'>+		break;</div><div class='add'>+	case S_IFREG:</div><div class='add'>+		*p = cpu_to_be32(NF4REG);</div><div class='add'>+		break;</div><div class='add'>+	case S_IFSOCK:</div><div class='add'>+		*p = cpu_to_be32(NF4SOCK);</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		return nfserr_serverfault;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return nfs_ok;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_fh_expire_type(struct xdr_stream *xdr,</div><div class='add'>+						 const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	u32 mask;</div><div class='add'>+</div><div class='add'>+	mask = NFS4_FH_PERSISTENT;</div><div class='add'>+	if (!(args-&gt;exp-&gt;ex_flags &amp; NFSEXP_NOSUBTREECHECK))</div><div class='add'>+		mask |= NFS4_FH_VOL_RENAME;</div><div class='add'>+	return nfsd4_encode_uint32_t(xdr, mask);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_change(struct xdr_stream *xdr,</div><div class='add'>+					 const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	const struct svc_export *exp = args-&gt;exp;</div><div class='add'>+</div><div class='add'>+	if (unlikely(exp-&gt;ex_flags &amp; NFSEXP_V4ROOT)) {</div><div class='add'>+		u32 flush_time = convert_to_wallclock(exp-&gt;cd-&gt;flush_time);</div><div class='add'>+</div><div class='add'>+		if (xdr_stream_encode_u32(xdr, flush_time) != XDR_UNIT)</div><div class='add'>+			return nfserr_resource;</div><div class='add'>+		if (xdr_stream_encode_u32(xdr, 0) != XDR_UNIT)</div><div class='add'>+			return nfserr_resource;</div><div class='add'>+		return nfs_ok;</div><div class='add'>+	}</div><div class='add'>+	return nfsd4_encode_changeid4(xdr, args-&gt;change_attr);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_size(struct xdr_stream *xdr,</div><div class='add'>+				       const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	return nfsd4_encode_uint64_t(xdr, args-&gt;stat.size);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_fsid(struct xdr_stream *xdr,</div><div class='add'>+				       const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	__be32 *p;</div><div class='add'>+</div><div class='add'>+	p = xdr_reserve_space(xdr, XDR_UNIT * 2 + XDR_UNIT * 2);</div><div class='add'>+	if (!p)</div><div class='add'>+		return nfserr_resource;</div><div class='add'>+</div><div class='add'>+	if (unlikely(args-&gt;exp-&gt;ex_fslocs.migrated)) {</div><div class='add'>+		p = xdr_encode_hyper(p, NFS4_REFERRAL_FSID_MAJOR);</div><div class='add'>+		xdr_encode_hyper(p, NFS4_REFERRAL_FSID_MINOR);</div><div class='add'>+		return nfs_ok;</div><div class='add'>+	}</div><div class='add'>+	switch (fsid_source(args-&gt;fhp)) {</div><div class='add'>+	case FSIDSOURCE_FSID:</div><div class='add'>+		p = xdr_encode_hyper(p, (u64)args-&gt;exp-&gt;ex_fsid);</div><div class='add'>+		xdr_encode_hyper(p, (u64)0);</div><div class='add'>+		break;</div><div class='add'>+	case FSIDSOURCE_DEV:</div><div class='add'>+		*p++ = xdr_zero;</div><div class='add'>+		*p++ = cpu_to_be32(MAJOR(args-&gt;stat.dev));</div><div class='add'>+		*p++ = xdr_zero;</div><div class='add'>+		*p   = cpu_to_be32(MINOR(args-&gt;stat.dev));</div><div class='add'>+		break;</div><div class='add'>+	case FSIDSOURCE_UUID:</div><div class='add'>+		xdr_encode_opaque_fixed(p, args-&gt;exp-&gt;ex_uuid, EX_UUID_LEN);</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	return nfs_ok;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_lease_time(struct xdr_stream *xdr,</div><div class='add'>+					     const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	struct nfsd_net *nn = net_generic(SVC_NET(args-&gt;rqstp), nfsd_net_id);</div><div class='add'>+</div><div class='add'>+	return nfsd4_encode_nfs_lease4(xdr, nn-&gt;nfsd4_lease);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_rdattr_error(struct xdr_stream *xdr,</div><div class='add'>+					       const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	return nfsd4_encode_uint32_t(xdr, args-&gt;rdattr_err);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_aclsupport(struct xdr_stream *xdr,</div><div class='add'>+					     const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	u32 mask;</div><div class='add'>+</div><div class='add'>+	mask = 0;</div><div class='add'>+	if (IS_POSIXACL(d_inode(args-&gt;dentry)))</div><div class='add'>+		mask = ACL4_SUPPORT_ALLOW_ACL | ACL4_SUPPORT_DENY_ACL;</div><div class='add'>+	return nfsd4_encode_uint32_t(xdr, mask);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_acl(struct xdr_stream *xdr,</div><div class='add'>+				      const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	struct nfs4_acl *acl = args-&gt;acl;</div><div class='add'>+	struct nfs4_ace *ace;</div><div class='add'>+	__be32 status;</div><div class='add'>+</div><div class='add'>+	/* nfsace4&lt;&gt; */</div><div class='add'>+	if (!acl) {</div><div class='add'>+		if (xdr_stream_encode_u32(xdr, 0) != XDR_UNIT)</div><div class='add'>+			return nfserr_resource;</div><div class='add'>+	} else {</div><div class='add'>+		if (xdr_stream_encode_u32(xdr, acl-&gt;naces) != XDR_UNIT)</div><div class='add'>+			return nfserr_resource;</div><div class='add'>+		for (ace = acl-&gt;aces; ace &lt; acl-&gt;aces + acl-&gt;naces; ace++) {</div><div class='add'>+			status = nfsd4_encode_nfsace4(xdr, args-&gt;rqstp, ace);</div><div class='add'>+			if (status != nfs_ok)</div><div class='add'>+				return status;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+	return nfs_ok;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_filehandle(struct xdr_stream *xdr,</div><div class='add'>+					     const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	return nfsd4_encode_nfs_fh4(xdr, &amp;args-&gt;fhp-&gt;fh_handle);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_fileid(struct xdr_stream *xdr,</div><div class='add'>+					 const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	return nfsd4_encode_uint64_t(xdr, args-&gt;stat.ino);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_files_avail(struct xdr_stream *xdr,</div><div class='add'>+					      const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	return nfsd4_encode_uint64_t(xdr, args-&gt;statfs.f_ffree);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_files_free(struct xdr_stream *xdr,</div><div class='add'>+					     const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	return nfsd4_encode_uint64_t(xdr, args-&gt;statfs.f_ffree);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_files_total(struct xdr_stream *xdr,</div><div class='add'>+					      const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	return nfsd4_encode_uint64_t(xdr, args-&gt;statfs.f_files);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_fs_locations(struct xdr_stream *xdr,</div><div class='add'>+					       const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	return nfsd4_encode_fs_locations4(xdr, args-&gt;rqstp, args-&gt;exp);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_maxfilesize(struct xdr_stream *xdr,</div><div class='add'>+					      const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	struct super_block *sb = args-&gt;exp-&gt;ex_path.mnt-&gt;mnt_sb;</div><div class='add'>+</div><div class='add'>+	return nfsd4_encode_uint64_t(xdr, sb-&gt;s_maxbytes);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_maxlink(struct xdr_stream *xdr,</div><div class='add'>+					  const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	return nfsd4_encode_uint32_t(xdr, 255);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_maxname(struct xdr_stream *xdr,</div><div class='add'>+					  const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	return nfsd4_encode_uint32_t(xdr, args-&gt;statfs.f_namelen);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_maxread(struct xdr_stream *xdr,</div><div class='add'>+					  const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	return nfsd4_encode_uint64_t(xdr, svc_max_payload(args-&gt;rqstp));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_maxwrite(struct xdr_stream *xdr,</div><div class='add'>+					   const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	return nfsd4_encode_uint64_t(xdr, svc_max_payload(args-&gt;rqstp));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_mode(struct xdr_stream *xdr,</div><div class='add'>+				       const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	return nfsd4_encode_mode4(xdr, args-&gt;stat.mode &amp; S_IALLUGO);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_numlinks(struct xdr_stream *xdr,</div><div class='add'>+					   const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	return nfsd4_encode_uint32_t(xdr, args-&gt;stat.nlink);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_owner(struct xdr_stream *xdr,</div><div class='add'>+					const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	return nfsd4_encode_user(xdr, args-&gt;rqstp, args-&gt;stat.uid);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_owner_group(struct xdr_stream *xdr,</div><div class='add'>+					      const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	return nfsd4_encode_group(xdr, args-&gt;rqstp, args-&gt;stat.gid);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_rawdev(struct xdr_stream *xdr,</div><div class='add'>+					 const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	return nfsd4_encode_specdata4(xdr, MAJOR(args-&gt;stat.rdev),</div><div class='add'>+				      MINOR(args-&gt;stat.rdev));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_space_avail(struct xdr_stream *xdr,</div><div class='add'>+					      const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	u64 avail = (u64)args-&gt;statfs.f_bavail * (u64)args-&gt;statfs.f_bsize;</div><div class='add'>+</div><div class='add'>+	return nfsd4_encode_uint64_t(xdr, avail);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_space_free(struct xdr_stream *xdr,</div><div class='add'>+					     const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	u64 free = (u64)args-&gt;statfs.f_bfree * (u64)args-&gt;statfs.f_bsize;</div><div class='add'>+</div><div class='add'>+	return nfsd4_encode_uint64_t(xdr, free);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_space_total(struct xdr_stream *xdr,</div><div class='add'>+					      const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	u64 total = (u64)args-&gt;statfs.f_blocks * (u64)args-&gt;statfs.f_bsize;</div><div class='add'>+</div><div class='add'>+	return nfsd4_encode_uint64_t(xdr, total);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_space_used(struct xdr_stream *xdr,</div><div class='add'>+					     const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	return nfsd4_encode_uint64_t(xdr, (u64)args-&gt;stat.blocks &lt;&lt; 9);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_time_access(struct xdr_stream *xdr,</div><div class='add'>+					      const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	return nfsd4_encode_nfstime4(xdr, &amp;args-&gt;stat.atime);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_time_create(struct xdr_stream *xdr,</div><div class='add'>+					      const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	return nfsd4_encode_nfstime4(xdr, &amp;args-&gt;stat.btime);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * ctime (in NFSv4, time_metadata) is not writeable, and the client</div><div class='add'>+ * doesn't really care what resolution could theoretically be stored by</div><div class='add'>+ * the filesystem.</div><div class='add'>+ *</div><div class='add'>+ * The client cares how close together changes can be while still</div><div class='add'>+ * guaranteeing ctime changes.  For most filesystems (which have</div><div class='add'>+ * timestamps with nanosecond fields) that is limited by the resolution</div><div class='add'>+ * of the time returned from current_time() (which I'm assuming to be</div><div class='add'>+ * 1/HZ).</div><div class='add'>+ */</div><div class='add'>+static __be32 nfsd4_encode_fattr4_time_delta(struct xdr_stream *xdr,</div><div class='add'>+					     const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	const struct inode *inode = d_inode(args-&gt;dentry);</div><div class='add'>+	u32 ns = max_t(u32, NSEC_PER_SEC/HZ, inode-&gt;i_sb-&gt;s_time_gran);</div><div class='add'>+	struct timespec64 ts = ns_to_timespec64(ns);</div><div class='add'>+</div><div class='add'>+	return nfsd4_encode_nfstime4(xdr, &amp;ts);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_time_metadata(struct xdr_stream *xdr,</div><div class='add'>+						const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	return nfsd4_encode_nfstime4(xdr, &amp;args-&gt;stat.ctime);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_time_modify(struct xdr_stream *xdr,</div><div class='add'>+					      const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	return nfsd4_encode_nfstime4(xdr, &amp;args-&gt;stat.mtime);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_mounted_on_fileid(struct xdr_stream *xdr,</div><div class='add'>+						    const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	u64 ino;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	if (!args-&gt;ignore_crossmnt &amp;&amp;</div><div class='add'>+	    args-&gt;dentry == args-&gt;exp-&gt;ex_path.mnt-&gt;mnt_root) {</div><div class='add'>+		err = nfsd4_get_mounted_on_ino(args-&gt;exp, &amp;ino);</div><div class='add'>+		if (err)</div><div class='add'>+			return nfserrno(err);</div><div class='add'>+	} else</div><div class='add'>+		ino = args-&gt;stat.ino;</div><div class='add'>+</div><div class='add'>+	return nfsd4_encode_uint64_t(xdr, ino);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_NFSD_PNFS</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_fs_layout_types(struct xdr_stream *xdr,</div><div class='add'>+						  const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	unsigned long mask = args-&gt;exp-&gt;ex_layout_types;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	/* Hamming weight of @mask is the number of layout types to return */</div><div class='add'>+	if (xdr_stream_encode_u32(xdr, hweight_long(mask)) != XDR_UNIT)</div><div class='add'>+		return nfserr_resource;</div><div class='add'>+	for (i = LAYOUT_NFSV4_1_FILES; i &lt; LAYOUT_TYPE_MAX; ++i)</div><div class='add'>+		if (mask &amp; BIT(i)) {</div><div class='add'>+			/* layouttype4 */</div><div class='add'>+			if (xdr_stream_encode_u32(xdr, i) != XDR_UNIT)</div><div class='add'>+				return nfserr_resource;</div><div class='add'>+		}</div><div class='add'>+	return nfs_ok;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_layout_types(struct xdr_stream *xdr,</div><div class='add'>+					       const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	unsigned long mask = args-&gt;exp-&gt;ex_layout_types;</div><div class='add'>+	int i;</div><div class='add'>+</div><div class='add'>+	/* Hamming weight of @mask is the number of layout types to return */</div><div class='add'>+	if (xdr_stream_encode_u32(xdr, hweight_long(mask)) != XDR_UNIT)</div><div class='add'>+		return nfserr_resource;</div><div class='add'>+	for (i = LAYOUT_NFSV4_1_FILES; i &lt; LAYOUT_TYPE_MAX; ++i)</div><div class='add'>+		if (mask &amp; BIT(i)) {</div><div class='add'>+			/* layouttype4 */</div><div class='add'>+			if (xdr_stream_encode_u32(xdr, i) != XDR_UNIT)</div><div class='add'>+				return nfserr_resource;</div><div class='add'>+		}</div><div class='add'>+	return nfs_ok;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_layout_blksize(struct xdr_stream *xdr,</div><div class='add'>+						 const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	return nfsd4_encode_uint32_t(xdr, args-&gt;stat.blksize);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_suppattr_exclcreat(struct xdr_stream *xdr,</div><div class='add'>+						     const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	struct nfsd4_compoundres *resp = args-&gt;rqstp-&gt;rq_resp;</div><div class='add'>+	u32 supp[3];</div><div class='add'>+</div><div class='add'>+	memcpy(supp, nfsd_suppattrs[resp-&gt;cstate.minorversion], sizeof(supp));</div><div class='add'>+	supp[0] &amp;= NFSD_SUPPATTR_EXCLCREAT_WORD0;</div><div class='add'>+	supp[1] &amp;= NFSD_SUPPATTR_EXCLCREAT_WORD1;</div><div class='add'>+	supp[2] &amp;= NFSD_SUPPATTR_EXCLCREAT_WORD2;</div><div class='add'>+</div><div class='add'>+	return nfsd4_encode_bitmap4(xdr, supp[0], supp[1], supp[2]);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Copied from generic_remap_checks/generic_remap_file_range_prep.</div><div class='add'>+ *</div><div class='add'>+ * These generic functions use the file system's s_blocksize, but</div><div class='add'>+ * individual file systems aren't required to use</div><div class='add'>+ * generic_remap_file_range_prep. Until there is a mechanism for</div><div class='add'>+ * determining a particular file system's (or file's) clone block</div><div class='add'>+ * size, this is the best NFSD can do.</div><div class='add'>+ */</div><div class='add'>+static __be32 nfsd4_encode_fattr4_clone_blksize(struct xdr_stream *xdr,</div><div class='add'>+						const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	struct inode *inode = d_inode(args-&gt;dentry);</div><div class='add'>+</div><div class='add'>+	return nfsd4_encode_uint32_t(xdr, inode-&gt;i_sb-&gt;s_blocksize);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_NFSD_V4_SECURITY_LABEL</div><div class='add'>+static __be32 nfsd4_encode_fattr4_sec_label(struct xdr_stream *xdr,</div><div class='add'>+					    const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	return nfsd4_encode_security_label(xdr, args-&gt;rqstp, &amp;args-&gt;context);</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_xattr_support(struct xdr_stream *xdr,</div><div class='add'>+						const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	int err = xattr_supports_user_prefix(d_inode(args-&gt;dentry));</div><div class='add'>+</div><div class='add'>+	return nfsd4_encode_bool(xdr, err == 0);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+#define NFSD_OA_SHARE_ACCESS	(BIT(OPEN_ARGS_SHARE_ACCESS_READ)	| \</div><div class='add'>+				 BIT(OPEN_ARGS_SHARE_ACCESS_WRITE)	| \</div><div class='add'>+				 BIT(OPEN_ARGS_SHARE_ACCESS_BOTH))</div><div class='add'>+</div><div class='add'>+#define NFSD_OA_SHARE_DENY	(BIT(OPEN_ARGS_SHARE_DENY_NONE)		| \</div><div class='add'>+				 BIT(OPEN_ARGS_SHARE_DENY_READ)		| \</div><div class='add'>+				 BIT(OPEN_ARGS_SHARE_DENY_WRITE)	| \</div><div class='add'>+				 BIT(OPEN_ARGS_SHARE_DENY_BOTH))</div><div class='add'>+</div><div class='add'>+#define NFSD_OA_SHARE_ACCESS_WANT	(BIT(OPEN_ARGS_SHARE_ACCESS_WANT_ANY_DELEG)		| \</div><div class='add'>+					 BIT(OPEN_ARGS_SHARE_ACCESS_WANT_NO_DELEG)		| \</div><div class='add'>+					 BIT(OPEN_ARGS_SHARE_ACCESS_WANT_CANCEL)		| \</div><div class='add'>+					 BIT(OPEN_ARGS_SHARE_ACCESS_WANT_DELEG_TIMESTAMPS)	| \</div><div class='add'>+					 BIT(OPEN_ARGS_SHARE_ACCESS_WANT_OPEN_XOR_DELEGATION))</div><div class='add'>+</div><div class='add'>+#define NFSD_OA_OPEN_CLAIM	(BIT(OPEN_ARGS_OPEN_CLAIM_NULL)		| \</div><div class='add'>+				 BIT(OPEN_ARGS_OPEN_CLAIM_PREVIOUS)	| \</div><div class='add'>+				 BIT(OPEN_ARGS_OPEN_CLAIM_DELEGATE_CUR)	| \</div><div class='add'>+				 BIT(OPEN_ARGS_OPEN_CLAIM_DELEGATE_PREV)| \</div><div class='add'>+				 BIT(OPEN_ARGS_OPEN_CLAIM_FH)		| \</div><div class='add'>+				 BIT(OPEN_ARGS_OPEN_CLAIM_DELEG_CUR_FH)	| \</div><div class='add'>+				 BIT(OPEN_ARGS_OPEN_CLAIM_DELEG_PREV_FH))</div><div class='add'>+</div><div class='add'>+#define NFSD_OA_CREATE_MODE	(BIT(OPEN_ARGS_CREATEMODE_UNCHECKED4)	| \</div><div class='add'>+				 BIT(OPEN_ARGS_CREATE_MODE_GUARDED)	| \</div><div class='add'>+				 BIT(OPEN_ARGS_CREATEMODE_EXCLUSIVE4)	| \</div><div class='add'>+				 BIT(OPEN_ARGS_CREATE_MODE_EXCLUSIVE4_1))</div><div class='add'>+</div><div class='add'>+static uint32_t oa_share_access = NFSD_OA_SHARE_ACCESS;</div><div class='add'>+static uint32_t oa_share_deny = NFSD_OA_SHARE_DENY;</div><div class='add'>+static uint32_t oa_share_access_want = NFSD_OA_SHARE_ACCESS_WANT;</div><div class='add'>+static uint32_t oa_open_claim = NFSD_OA_OPEN_CLAIM;</div><div class='add'>+static uint32_t oa_create_mode = NFSD_OA_CREATE_MODE;</div><div class='add'>+</div><div class='add'>+static const struct open_arguments4 nfsd_open_arguments = {</div><div class='add'>+	.oa_share_access = { .count = 1, .element = &amp;oa_share_access },</div><div class='add'>+	.oa_share_deny = { .count = 1, .element = &amp;oa_share_deny },</div><div class='add'>+	.oa_share_access_want = { .count = 1, .element = &amp;oa_share_access_want },</div><div class='add'>+	.oa_open_claim = { .count = 1, .element = &amp;oa_open_claim },</div><div class='add'>+	.oa_create_mode = { .count = 1, .element = &amp;oa_create_mode },</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static __be32 nfsd4_encode_fattr4_open_arguments(struct xdr_stream *xdr,</div><div class='add'>+						 const struct nfsd4_fattr_args *args)</div><div class='add'>+{</div><div class='add'>+	if (!xdrgen_encode_fattr4_open_arguments(xdr, &amp;nfsd_open_arguments))</div><div class='add'>+		return nfserr_resource;</div><div class='add'>+	return nfs_ok;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const nfsd4_enc_attr nfsd4_enc_fattr4_encode_ops[] = {</div><div class='add'>+	[FATTR4_SUPPORTED_ATTRS]	= nfsd4_encode_fattr4_supported_attrs,</div><div class='add'>+	[FATTR4_TYPE]			= nfsd4_encode_fattr4_type,</div><div class='add'>+	[FATTR4_FH_EXPIRE_TYPE]		= nfsd4_encode_fattr4_fh_expire_type,</div><div class='add'>+	[FATTR4_CHANGE]			= nfsd4_encode_fattr4_change,</div><div class='add'>+	[FATTR4_SIZE]			= nfsd4_encode_fattr4_size,</div><div class='add'>+	[FATTR4_LINK_SUPPORT]		= nfsd4_encode_fattr4__true,</div><div class='add'>+	[FATTR4_SYMLINK_SUPPORT]	= nfsd4_encode_fattr4__true,</div><div class='add'>+	[FATTR4_NAMED_ATTR]		= nfsd4_encode_fattr4__false,</div><div class='add'>+	[FATTR4_FSID]			= nfsd4_encode_fattr4_fsid,</div><div class='add'>+	[FATTR4_UNIQUE_HANDLES]		= nfsd4_encode_fattr4__true,</div><div class='add'>+	[FATTR4_LEASE_TIME]		= nfsd4_encode_fattr4_lease_time,</div><div class='add'>+	[FATTR4_RDATTR_ERROR]		= nfsd4_encode_fattr4_rdattr_error,</div><div class='add'>+	[FATTR4_ACL]			= nfsd4_encode_fattr4_acl,</div><div class='add'>+	[FATTR4_ACLSUPPORT]		= nfsd4_encode_fattr4_aclsupport,</div><div class='add'>+	[FATTR4_ARCHIVE]		= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_CANSETTIME]		= nfsd4_encode_fattr4__true,</div><div class='add'>+	[FATTR4_CASE_INSENSITIVE]	= nfsd4_encode_fattr4__false,</div><div class='add'>+	[FATTR4_CASE_PRESERVING]	= nfsd4_encode_fattr4__true,</div><div class='add'>+	[FATTR4_CHOWN_RESTRICTED]	= nfsd4_encode_fattr4__true,</div><div class='add'>+	[FATTR4_FILEHANDLE]		= nfsd4_encode_fattr4_filehandle,</div><div class='add'>+	[FATTR4_FILEID]			= nfsd4_encode_fattr4_fileid,</div><div class='add'>+	[FATTR4_FILES_AVAIL]		= nfsd4_encode_fattr4_files_avail,</div><div class='add'>+	[FATTR4_FILES_FREE]		= nfsd4_encode_fattr4_files_free,</div><div class='add'>+	[FATTR4_FILES_TOTAL]		= nfsd4_encode_fattr4_files_total,</div><div class='add'>+	[FATTR4_FS_LOCATIONS]		= nfsd4_encode_fattr4_fs_locations,</div><div class='add'>+	[FATTR4_HIDDEN]			= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_HOMOGENEOUS]		= nfsd4_encode_fattr4__true,</div><div class='add'>+	[FATTR4_MAXFILESIZE]		= nfsd4_encode_fattr4_maxfilesize,</div><div class='add'>+	[FATTR4_MAXLINK]		= nfsd4_encode_fattr4_maxlink,</div><div class='add'>+	[FATTR4_MAXNAME]		= nfsd4_encode_fattr4_maxname,</div><div class='add'>+	[FATTR4_MAXREAD]		= nfsd4_encode_fattr4_maxread,</div><div class='add'>+	[FATTR4_MAXWRITE]		= nfsd4_encode_fattr4_maxwrite,</div><div class='add'>+	[FATTR4_MIMETYPE]		= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_MODE]			= nfsd4_encode_fattr4_mode,</div><div class='add'>+	[FATTR4_NO_TRUNC]		= nfsd4_encode_fattr4__true,</div><div class='add'>+	[FATTR4_NUMLINKS]		= nfsd4_encode_fattr4_numlinks,</div><div class='add'>+	[FATTR4_OWNER]			= nfsd4_encode_fattr4_owner,</div><div class='add'>+	[FATTR4_OWNER_GROUP]		= nfsd4_encode_fattr4_owner_group,</div><div class='add'>+	[FATTR4_QUOTA_AVAIL_HARD]	= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_QUOTA_AVAIL_SOFT]	= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_QUOTA_USED]		= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_RAWDEV]			= nfsd4_encode_fattr4_rawdev,</div><div class='add'>+	[FATTR4_SPACE_AVAIL]		= nfsd4_encode_fattr4_space_avail,</div><div class='add'>+	[FATTR4_SPACE_FREE]		= nfsd4_encode_fattr4_space_free,</div><div class='add'>+	[FATTR4_SPACE_TOTAL]		= nfsd4_encode_fattr4_space_total,</div><div class='add'>+	[FATTR4_SPACE_USED]		= nfsd4_encode_fattr4_space_used,</div><div class='add'>+	[FATTR4_SYSTEM]			= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_TIME_ACCESS]		= nfsd4_encode_fattr4_time_access,</div><div class='add'>+	[FATTR4_TIME_ACCESS_SET]	= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_TIME_BACKUP]		= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_TIME_CREATE]		= nfsd4_encode_fattr4_time_create,</div><div class='add'>+	[FATTR4_TIME_DELTA]		= nfsd4_encode_fattr4_time_delta,</div><div class='add'>+	[FATTR4_TIME_METADATA]		= nfsd4_encode_fattr4_time_metadata,</div><div class='add'>+	[FATTR4_TIME_MODIFY]		= nfsd4_encode_fattr4_time_modify,</div><div class='add'>+	[FATTR4_TIME_MODIFY_SET]	= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_MOUNTED_ON_FILEID]	= nfsd4_encode_fattr4_mounted_on_fileid,</div><div class='add'>+	[FATTR4_DIR_NOTIF_DELAY]	= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_DIRENT_NOTIF_DELAY]	= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_DACL]			= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_SACL]			= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_CHANGE_POLICY]		= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_FS_STATUS]		= nfsd4_encode_fattr4__noop,</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_NFSD_PNFS</div><div class='add'>+	[FATTR4_FS_LAYOUT_TYPES]	= nfsd4_encode_fattr4_fs_layout_types,</div><div class='add'>+	[FATTR4_LAYOUT_HINT]		= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_LAYOUT_TYPES]		= nfsd4_encode_fattr4_layout_types,</div><div class='add'>+	[FATTR4_LAYOUT_BLKSIZE]		= nfsd4_encode_fattr4_layout_blksize,</div><div class='add'>+	[FATTR4_LAYOUT_ALIGNMENT]	= nfsd4_encode_fattr4__noop,</div><div class='add'>+#else</div><div class='add'>+	[FATTR4_FS_LAYOUT_TYPES]	= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_LAYOUT_HINT]		= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_LAYOUT_TYPES]		= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_LAYOUT_BLKSIZE]		= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_LAYOUT_ALIGNMENT]	= nfsd4_encode_fattr4__noop,</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+	[FATTR4_FS_LOCATIONS_INFO]	= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_MDSTHRESHOLD]		= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_RETENTION_GET]		= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_RETENTION_SET]		= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_RETENTEVT_GET]		= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_RETENTEVT_SET]		= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_RETENTION_HOLD]		= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_MODE_SET_MASKED]	= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_SUPPATTR_EXCLCREAT]	= nfsd4_encode_fattr4_suppattr_exclcreat,</div><div class='add'>+	[FATTR4_FS_CHARSET_CAP]		= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_CLONE_BLKSIZE]		= nfsd4_encode_fattr4_clone_blksize,</div><div class='add'>+	[FATTR4_SPACE_FREED]		= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_CHANGE_ATTR_TYPE]	= nfsd4_encode_fattr4__noop,</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_NFSD_V4_SECURITY_LABEL</div><div class='add'>+	[FATTR4_SEC_LABEL]		= nfsd4_encode_fattr4_sec_label,</div><div class='add'>+#else</div><div class='add'>+	[FATTR4_SEC_LABEL]		= nfsd4_encode_fattr4__noop,</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+	[FATTR4_MODE_UMASK]		= nfsd4_encode_fattr4__noop,</div><div class='add'>+	[FATTR4_XATTR_SUPPORT]		= nfsd4_encode_fattr4_xattr_support,</div><div class='add'>+	[FATTR4_TIME_DELEG_ACCESS]	= nfsd4_encode_fattr4__inval,</div><div class='add'>+	[FATTR4_TIME_DELEG_MODIFY]	= nfsd4_encode_fattr4__inval,</div><div class='add'>+	[FATTR4_OPEN_ARGUMENTS]		= nfsd4_encode_fattr4_open_arguments,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Note: @fhp can be NULL; in this case, we might have to compose the filehandle</div><div class='ctx'>  * ourselves.</div><div class='ctx'>  */</div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_fattr(struct xdr_stream *xdr, struct svc_fh *fhp,</div><div class='del'>-		struct svc_export *exp,</div><div class='del'>-		struct dentry *dentry, u32 *bmval,</div><div class='del'>-		struct svc_rqst *rqstp, int ignore_crossmnt)</div><div class='add'>+nfsd4_encode_fattr4(struct svc_rqst *rqstp, struct xdr_stream *xdr,</div><div class='add'>+		    struct svc_fh *fhp, struct svc_export *exp,</div><div class='add'>+		    struct dentry *dentry, const u32 *bmval,</div><div class='add'>+		    int ignore_crossmnt)</div><div class='ctx'> {</div><div class='del'>-	u32 bmval0 = bmval[0];</div><div class='del'>-	u32 bmval1 = bmval[1];</div><div class='del'>-	u32 bmval2 = bmval[2];</div><div class='del'>-	struct kstat stat;</div><div class='add'>+	DECLARE_BITMAP(attr_bitmap, ARRAY_SIZE(nfsd4_enc_fattr4_encode_ops));</div><div class='add'>+	struct nfs4_delegation *dp = NULL;</div><div class='add'>+	struct nfsd4_fattr_args args;</div><div class='ctx'> 	struct svc_fh *tempfh = NULL;</div><div class='del'>-	struct kstatfs statfs;</div><div class='del'>-	__be32 *p;</div><div class='ctx'> 	int starting_len = xdr-&gt;buf-&gt;len;</div><div class='del'>-	int attrlen_offset;</div><div class='del'>-	__be32 attrlen;</div><div class='del'>-	u32 dummy;</div><div class='del'>-	u64 dummy64;</div><div class='del'>-	u32 rdattr_err = 0;</div><div class='del'>-	__be32 status;</div><div class='add'>+	unsigned int attrlen_offset;</div><div class='add'>+	__be32 attrlen, status;</div><div class='add'>+	u32 attrmask[3];</div><div class='ctx'> 	int err;</div><div class='del'>-	struct nfs4_acl *acl = NULL;</div><div class='del'>-#ifdef CONFIG_NFSD_V4_SECURITY_LABEL</div><div class='del'>-	void *context = NULL;</div><div class='del'>-	int contextlen;</div><div class='del'>-#endif</div><div class='del'>-	bool contextsupport = false;</div><div class='ctx'> 	struct nfsd4_compoundres *resp = rqstp-&gt;rq_resp;</div><div class='ctx'> 	u32 minorversion = resp-&gt;cstate.minorversion;</div><div class='ctx'> 	struct path path = {</div><div class='ctx'> 		.mnt	= exp-&gt;ex_path.mnt,</div><div class='ctx'> 		.dentry	= dentry,</div><div class='ctx'> 	};</div><div class='del'>-	struct nfsd_net *nn = net_generic(SVC_NET(rqstp), nfsd_net_id);</div><div class='add'>+	unsigned long bit;</div><div class='add'>+</div><div class='add'>+	WARN_ON_ONCE(bmval[1] &amp; NFSD_WRITEONLY_ATTRS_WORD1);</div><div class='add'>+	WARN_ON_ONCE(!nfsd_attrs_supported(minorversion, bmval));</div><div class='add'>+</div><div class='add'>+	args.rqstp = rqstp;</div><div class='add'>+	args.exp = exp;</div><div class='add'>+	args.dentry = dentry;</div><div class='add'>+	args.ignore_crossmnt = (ignore_crossmnt != 0);</div><div class='add'>+	args.acl = NULL;</div><div class='add'>+#ifdef CONFIG_NFSD_V4_SECURITY_LABEL</div><div class='add'>+	args.context.context = NULL;</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='del'>-	BUG_ON(bmval1 &amp; NFSD_WRITEONLY_ATTRS_WORD1);</div><div class='del'>-	BUG_ON(!nfsd_attrs_supported(minorversion, bmval));</div><div class='add'>+	/*</div><div class='add'>+	 * Make a local copy of the attribute bitmap that can be modified.</div><div class='add'>+	 */</div><div class='add'>+	attrmask[0] = bmval[0];</div><div class='add'>+	attrmask[1] = bmval[1];</div><div class='add'>+	attrmask[2] = bmval[2];</div><div class='ctx'> </div><div class='add'>+	args.rdattr_err = 0;</div><div class='ctx'> 	if (exp-&gt;ex_fslocs.migrated) {</div><div class='del'>-		status = fattr_handle_absent_fs(&amp;bmval0, &amp;bmval1, &amp;bmval2, &amp;rdattr_err);</div><div class='add'>+		status = fattr_handle_absent_fs(&amp;attrmask[0], &amp;attrmask[1],</div><div class='add'>+						&amp;attrmask[2], &amp;args.rdattr_err);</div><div class='add'>+		if (status)</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='add'>+	if ((attrmask[0] &amp; (FATTR4_WORD0_CHANGE |</div><div class='add'>+			    FATTR4_WORD0_SIZE)) ||</div><div class='add'>+	    (attrmask[1] &amp; (FATTR4_WORD1_TIME_ACCESS |</div><div class='add'>+			    FATTR4_WORD1_TIME_MODIFY |</div><div class='add'>+			    FATTR4_WORD1_TIME_METADATA))) {</div><div class='add'>+		status = nfsd4_deleg_getattr_conflict(rqstp, dentry, &amp;dp);</div><div class='ctx'> 		if (status)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	err = vfs_getattr(&amp;path, &amp;stat, STATX_BASIC_STATS, AT_STATX_SYNC_AS_STAT);</div><div class='add'>+	err = vfs_getattr(&amp;path, &amp;args.stat,</div><div class='add'>+			  STATX_BASIC_STATS | STATX_BTIME | STATX_CHANGE_COOKIE,</div><div class='add'>+			  AT_STATX_SYNC_AS_STAT);</div><div class='add'>+	if (dp) {</div><div class='add'>+		struct nfs4_cb_fattr *ncf = &amp;dp-&gt;dl_cb_fattr;</div><div class='add'>+</div><div class='add'>+		if (ncf-&gt;ncf_file_modified) {</div><div class='add'>+			++ncf-&gt;ncf_initial_cinfo;</div><div class='add'>+			args.stat.size = ncf-&gt;ncf_cur_fsize;</div><div class='add'>+			if (!timespec64_is_epoch(&amp;ncf-&gt;ncf_cb_mtime))</div><div class='add'>+				args.stat.mtime = ncf-&gt;ncf_cb_mtime;</div><div class='add'>+		}</div><div class='add'>+		args.change_attr = ncf-&gt;ncf_initial_cinfo;</div><div class='add'>+</div><div class='add'>+		if (!timespec64_is_epoch(&amp;ncf-&gt;ncf_cb_atime))</div><div class='add'>+			args.stat.atime = ncf-&gt;ncf_cb_atime;</div><div class='add'>+</div><div class='add'>+		nfs4_put_stid(&amp;dp-&gt;dl_stid);</div><div class='add'>+	} else {</div><div class='add'>+		args.change_attr = nfsd4_change_attribute(&amp;args.stat);</div><div class='add'>+	}</div><div class='add'>+</div><div class='ctx'> 	if (err)</div><div class='ctx'> 		goto out_nfserr;</div><div class='del'>-	if ((bmval0 &amp; (FATTR4_WORD0_FILES_AVAIL | FATTR4_WORD0_FILES_FREE |</div><div class='add'>+</div><div class='add'>+	if (!(args.stat.result_mask &amp; STATX_BTIME))</div><div class='add'>+		/* underlying FS does not offer btime so we can't share it */</div><div class='add'>+		attrmask[1] &amp;= ~FATTR4_WORD1_TIME_CREATE;</div><div class='add'>+	if ((attrmask[0] &amp; (FATTR4_WORD0_FILES_AVAIL | FATTR4_WORD0_FILES_FREE |</div><div class='ctx'> 			FATTR4_WORD0_FILES_TOTAL | FATTR4_WORD0_MAXNAME)) ||</div><div class='del'>-	    (bmval1 &amp; (FATTR4_WORD1_SPACE_AVAIL | FATTR4_WORD1_SPACE_FREE |</div><div class='add'>+	    (attrmask[1] &amp; (FATTR4_WORD1_SPACE_AVAIL | FATTR4_WORD1_SPACE_FREE |</div><div class='ctx'> 		       FATTR4_WORD1_SPACE_TOTAL))) {</div><div class='del'>-		err = vfs_statfs(&amp;path, &amp;statfs);</div><div class='add'>+		err = vfs_statfs(&amp;path, &amp;args.statfs);</div><div class='ctx'> 		if (err)</div><div class='ctx'> 			goto out_nfserr;</div><div class='ctx'> 	}</div><div class='del'>-	if ((bmval0 &amp; (FATTR4_WORD0_FILEHANDLE | FATTR4_WORD0_FSID)) &amp;&amp; !fhp) {</div><div class='add'>+	if ((attrmask[0] &amp; (FATTR4_WORD0_FILEHANDLE | FATTR4_WORD0_FSID)) &amp;&amp;</div><div class='add'>+	    !fhp) {</div><div class='ctx'> 		tempfh = kmalloc(sizeof(struct svc_fh), GFP_KERNEL);</div><div class='ctx'> 		status = nfserr_jukebox;</div><div class='ctx'> 		if (!tempfh)</div><div class='hunk'>@@ -2885,12 +3679,14 @@ nfsd4_encode_fattr(struct xdr_stream *xdr, struct svc_fh *fhp,</div><div class='ctx'> 		status = fh_compose(tempfh, exp, dentry, NULL);</div><div class='ctx'> 		if (status)</div><div class='ctx'> 			goto out;</div><div class='del'>-		fhp = tempfh;</div><div class='del'>-	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_ACL) {</div><div class='del'>-		err = nfsd4_get_nfs4_acl(rqstp, dentry, &amp;acl);</div><div class='add'>+		args.fhp = tempfh;</div><div class='add'>+	} else</div><div class='add'>+		args.fhp = fhp;</div><div class='add'>+</div><div class='add'>+	if (attrmask[0] &amp; FATTR4_WORD0_ACL) {</div><div class='add'>+		err = nfsd4_get_nfs4_acl(rqstp, dentry, &amp;args.acl);</div><div class='ctx'> 		if (err == -EOPNOTSUPP)</div><div class='del'>-			bmval0 &amp;= ~FATTR4_WORD0_ACL;</div><div class='add'>+			attrmask[0] &amp;= ~FATTR4_WORD0_ACL;</div><div class='ctx'> 		else if (err == -EINVAL) {</div><div class='ctx'> 			status = nfserr_attrnotsupp;</div><div class='ctx'> 			goto out;</div><div class='hunk'>@@ -2898,457 +3694,54 @@ nfsd4_encode_fattr(struct xdr_stream *xdr, struct svc_fh *fhp,</div><div class='ctx'> 			goto out_nfserr;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	args.contextsupport = false;</div><div class='add'>+</div><div class='ctx'> #ifdef CONFIG_NFSD_V4_SECURITY_LABEL</div><div class='del'>-	if ((bmval2 &amp; FATTR4_WORD2_SECURITY_LABEL) ||</div><div class='del'>-	     bmval0 &amp; FATTR4_WORD0_SUPPORTED_ATTRS) {</div><div class='add'>+	if ((attrmask[2] &amp; FATTR4_WORD2_SECURITY_LABEL) ||</div><div class='add'>+	     attrmask[0] &amp; FATTR4_WORD0_SUPPORTED_ATTRS) {</div><div class='ctx'> 		if (exp-&gt;ex_flags &amp; NFSEXP_SECURITY_LABEL)</div><div class='ctx'> 			err = security_inode_getsecctx(d_inode(dentry),</div><div class='del'>-						&amp;context, &amp;contextlen);</div><div class='add'>+						&amp;args.context);</div><div class='ctx'> 		else</div><div class='ctx'> 			err = -EOPNOTSUPP;</div><div class='del'>-		contextsupport = (err == 0);</div><div class='del'>-		if (bmval2 &amp; FATTR4_WORD2_SECURITY_LABEL) {</div><div class='add'>+		args.contextsupport = (err == 0);</div><div class='add'>+		if (attrmask[2] &amp; FATTR4_WORD2_SECURITY_LABEL) {</div><div class='ctx'> 			if (err == -EOPNOTSUPP)</div><div class='del'>-				bmval2 &amp;= ~FATTR4_WORD2_SECURITY_LABEL;</div><div class='add'>+				attrmask[2] &amp;= ~FATTR4_WORD2_SECURITY_LABEL;</div><div class='ctx'> 			else if (err)</div><div class='ctx'> 				goto out_nfserr;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> #endif /* CONFIG_NFSD_V4_SECURITY_LABEL */</div><div class='ctx'> </div><div class='del'>-	status = nfsd4_encode_bitmap(xdr, bmval0, bmval1, bmval2);</div><div class='add'>+	/* attrmask */</div><div class='add'>+	status = nfsd4_encode_bitmap4(xdr, attrmask[0], attrmask[1],</div><div class='add'>+				      attrmask[2]);</div><div class='ctx'> 	if (status)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='add'>+	/* attr_vals */</div><div class='ctx'> 	attrlen_offset = xdr-&gt;buf-&gt;len;</div><div class='del'>-	p = xdr_reserve_space(xdr, 4);</div><div class='del'>-	if (!p)</div><div class='add'>+	if (unlikely(!xdr_reserve_space(xdr, XDR_UNIT)))</div><div class='ctx'> 		goto out_resource;</div><div class='del'>-	p++;                /* to be backfilled later */</div><div class='del'>-</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_SUPPORTED_ATTRS) {</div><div class='del'>-		u32 supp[3];</div><div class='del'>-</div><div class='del'>-		memcpy(supp, nfsd_suppattrs[minorversion], sizeof(supp));</div><div class='del'>-</div><div class='del'>-		if (!IS_POSIXACL(dentry-&gt;d_inode))</div><div class='del'>-			supp[0] &amp;= ~FATTR4_WORD0_ACL;</div><div class='del'>-		if (!contextsupport)</div><div class='del'>-			supp[2] &amp;= ~FATTR4_WORD2_SECURITY_LABEL;</div><div class='del'>-		if (!supp[2]) {</div><div class='del'>-			p = xdr_reserve_space(xdr, 12);</div><div class='del'>-			if (!p)</div><div class='del'>-				goto out_resource;</div><div class='del'>-			*p++ = cpu_to_be32(2);</div><div class='del'>-			*p++ = cpu_to_be32(supp[0]);</div><div class='del'>-			*p++ = cpu_to_be32(supp[1]);</div><div class='del'>-		} else {</div><div class='del'>-			p = xdr_reserve_space(xdr, 16);</div><div class='del'>-			if (!p)</div><div class='del'>-				goto out_resource;</div><div class='del'>-			*p++ = cpu_to_be32(3);</div><div class='del'>-			*p++ = cpu_to_be32(supp[0]);</div><div class='del'>-			*p++ = cpu_to_be32(supp[1]);</div><div class='del'>-			*p++ = cpu_to_be32(supp[2]);</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_TYPE) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		dummy = nfs4_file_type(stat.mode);</div><div class='del'>-		if (dummy == NF4BAD) {</div><div class='del'>-			status = nfserr_serverfault;</div><div class='add'>+	bitmap_from_arr32(attr_bitmap, attrmask,</div><div class='add'>+			  ARRAY_SIZE(nfsd4_enc_fattr4_encode_ops));</div><div class='add'>+	for_each_set_bit(bit, attr_bitmap,</div><div class='add'>+			 ARRAY_SIZE(nfsd4_enc_fattr4_encode_ops)) {</div><div class='add'>+		status = nfsd4_enc_fattr4_encode_ops[bit](xdr, &amp;args);</div><div class='add'>+		if (status != nfs_ok)</div><div class='ctx'> 			goto out;</div><div class='del'>-		}</div><div class='del'>-		*p++ = cpu_to_be32(dummy);</div><div class='del'>-	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_FH_EXPIRE_TYPE) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		if (exp-&gt;ex_flags &amp; NFSEXP_NOSUBTREECHECK)</div><div class='del'>-			*p++ = cpu_to_be32(NFS4_FH_PERSISTENT);</div><div class='del'>-		else</div><div class='del'>-			*p++ = cpu_to_be32(NFS4_FH_PERSISTENT|</div><div class='del'>-						NFS4_FH_VOL_RENAME);</div><div class='del'>-	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_CHANGE) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 8);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		p = encode_change(p, &amp;stat, d_inode(dentry), exp);</div><div class='del'>-	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_SIZE) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 8);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		p = xdr_encode_hyper(p, stat.size);</div><div class='del'>-	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_LINK_SUPPORT) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		*p++ = cpu_to_be32(1);</div><div class='del'>-	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_SYMLINK_SUPPORT) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		*p++ = cpu_to_be32(1);</div><div class='del'>-	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_NAMED_ATTR) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		*p++ = cpu_to_be32(0);</div><div class='del'>-	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_FSID) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 16);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		if (exp-&gt;ex_fslocs.migrated) {</div><div class='del'>-			p = xdr_encode_hyper(p, NFS4_REFERRAL_FSID_MAJOR);</div><div class='del'>-			p = xdr_encode_hyper(p, NFS4_REFERRAL_FSID_MINOR);</div><div class='del'>-		} else switch(fsid_source(fhp)) {</div><div class='del'>-		case FSIDSOURCE_FSID:</div><div class='del'>-			p = xdr_encode_hyper(p, (u64)exp-&gt;ex_fsid);</div><div class='del'>-			p = xdr_encode_hyper(p, (u64)0);</div><div class='del'>-			break;</div><div class='del'>-		case FSIDSOURCE_DEV:</div><div class='del'>-			*p++ = cpu_to_be32(0);</div><div class='del'>-			*p++ = cpu_to_be32(MAJOR(stat.dev));</div><div class='del'>-			*p++ = cpu_to_be32(0);</div><div class='del'>-			*p++ = cpu_to_be32(MINOR(stat.dev));</div><div class='del'>-			break;</div><div class='del'>-		case FSIDSOURCE_UUID:</div><div class='del'>-			p = xdr_encode_opaque_fixed(p, exp-&gt;ex_uuid,</div><div class='del'>-								EX_UUID_LEN);</div><div class='del'>-			break;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_UNIQUE_HANDLES) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		*p++ = cpu_to_be32(0);</div><div class='del'>-	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_LEASE_TIME) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		*p++ = cpu_to_be32(nn-&gt;nfsd4_lease);</div><div class='del'>-	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_RDATTR_ERROR) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		*p++ = cpu_to_be32(rdattr_err);</div><div class='del'>-	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_ACL) {</div><div class='del'>-		struct nfs4_ace *ace;</div><div class='del'>-</div><div class='del'>-		if (acl == NULL) {</div><div class='del'>-			p = xdr_reserve_space(xdr, 4);</div><div class='del'>-			if (!p)</div><div class='del'>-				goto out_resource;</div><div class='del'>-</div><div class='del'>-			*p++ = cpu_to_be32(0);</div><div class='del'>-			goto out_acl;</div><div class='del'>-		}</div><div class='del'>-		p = xdr_reserve_space(xdr, 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		*p++ = cpu_to_be32(acl-&gt;naces);</div><div class='del'>-</div><div class='del'>-		for (ace = acl-&gt;aces; ace &lt; acl-&gt;aces + acl-&gt;naces; ace++) {</div><div class='del'>-			p = xdr_reserve_space(xdr, 4*3);</div><div class='del'>-			if (!p)</div><div class='del'>-				goto out_resource;</div><div class='del'>-			*p++ = cpu_to_be32(ace-&gt;type);</div><div class='del'>-			*p++ = cpu_to_be32(ace-&gt;flag);</div><div class='del'>-			*p++ = cpu_to_be32(ace-&gt;access_mask &amp;</div><div class='del'>-							NFS4_ACE_MASK_ALL);</div><div class='del'>-			status = nfsd4_encode_aclname(xdr, rqstp, ace);</div><div class='del'>-			if (status)</div><div class='del'>-				goto out;</div><div class='del'>-		}</div><div class='del'>-	}</div><div class='del'>-out_acl:</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_ACLSUPPORT) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		*p++ = cpu_to_be32(IS_POSIXACL(dentry-&gt;d_inode) ?</div><div class='del'>-			ACL4_SUPPORT_ALLOW_ACL|ACL4_SUPPORT_DENY_ACL : 0);</div><div class='ctx'> 	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_CANSETTIME) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		*p++ = cpu_to_be32(1);</div><div class='del'>-	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_CASE_INSENSITIVE) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		*p++ = cpu_to_be32(0);</div><div class='del'>-	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_CASE_PRESERVING) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		*p++ = cpu_to_be32(1);</div><div class='del'>-	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_CHOWN_RESTRICTED) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		*p++ = cpu_to_be32(1);</div><div class='del'>-	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_FILEHANDLE) {</div><div class='del'>-		p = xdr_reserve_space(xdr, fhp-&gt;fh_handle.fh_size + 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		p = xdr_encode_opaque(p, &amp;fhp-&gt;fh_handle.fh_raw,</div><div class='del'>-					fhp-&gt;fh_handle.fh_size);</div><div class='del'>-	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_FILEID) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 8);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		p = xdr_encode_hyper(p, stat.ino);</div><div class='del'>-	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_FILES_AVAIL) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 8);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		p = xdr_encode_hyper(p, (u64) statfs.f_ffree);</div><div class='del'>-	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_FILES_FREE) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 8);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		p = xdr_encode_hyper(p, (u64) statfs.f_ffree);</div><div class='del'>-	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_FILES_TOTAL) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 8);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		p = xdr_encode_hyper(p, (u64) statfs.f_files);</div><div class='del'>-	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_FS_LOCATIONS) {</div><div class='del'>-		status = nfsd4_encode_fs_locations(xdr, rqstp, exp);</div><div class='del'>-		if (status)</div><div class='del'>-			goto out;</div><div class='del'>-	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_HOMOGENEOUS) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		*p++ = cpu_to_be32(1);</div><div class='del'>-	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_MAXFILESIZE) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 8);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		p = xdr_encode_hyper(p, exp-&gt;ex_path.mnt-&gt;mnt_sb-&gt;s_maxbytes);</div><div class='del'>-	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_MAXLINK) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		*p++ = cpu_to_be32(255);</div><div class='del'>-	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_MAXNAME) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		*p++ = cpu_to_be32(statfs.f_namelen);</div><div class='del'>-	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_MAXREAD) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 8);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		p = xdr_encode_hyper(p, (u64) svc_max_payload(rqstp));</div><div class='del'>-	}</div><div class='del'>-	if (bmval0 &amp; FATTR4_WORD0_MAXWRITE) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 8);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		p = xdr_encode_hyper(p, (u64) svc_max_payload(rqstp));</div><div class='del'>-	}</div><div class='del'>-	if (bmval1 &amp; FATTR4_WORD1_MODE) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		*p++ = cpu_to_be32(stat.mode &amp; S_IALLUGO);</div><div class='del'>-	}</div><div class='del'>-	if (bmval1 &amp; FATTR4_WORD1_NO_TRUNC) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		*p++ = cpu_to_be32(1);</div><div class='del'>-	}</div><div class='del'>-	if (bmval1 &amp; FATTR4_WORD1_NUMLINKS) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		*p++ = cpu_to_be32(stat.nlink);</div><div class='del'>-	}</div><div class='del'>-	if (bmval1 &amp; FATTR4_WORD1_OWNER) {</div><div class='del'>-		status = nfsd4_encode_user(xdr, rqstp, stat.uid);</div><div class='del'>-		if (status)</div><div class='del'>-			goto out;</div><div class='del'>-	}</div><div class='del'>-	if (bmval1 &amp; FATTR4_WORD1_OWNER_GROUP) {</div><div class='del'>-		status = nfsd4_encode_group(xdr, rqstp, stat.gid);</div><div class='del'>-		if (status)</div><div class='del'>-			goto out;</div><div class='del'>-	}</div><div class='del'>-	if (bmval1 &amp; FATTR4_WORD1_RAWDEV) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 8);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		*p++ = cpu_to_be32((u32) MAJOR(stat.rdev));</div><div class='del'>-		*p++ = cpu_to_be32((u32) MINOR(stat.rdev));</div><div class='del'>-	}</div><div class='del'>-	if (bmval1 &amp; FATTR4_WORD1_SPACE_AVAIL) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 8);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		dummy64 = (u64)statfs.f_bavail * (u64)statfs.f_bsize;</div><div class='del'>-		p = xdr_encode_hyper(p, dummy64);</div><div class='del'>-	}</div><div class='del'>-	if (bmval1 &amp; FATTR4_WORD1_SPACE_FREE) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 8);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		dummy64 = (u64)statfs.f_bfree * (u64)statfs.f_bsize;</div><div class='del'>-		p = xdr_encode_hyper(p, dummy64);</div><div class='del'>-	}</div><div class='del'>-	if (bmval1 &amp; FATTR4_WORD1_SPACE_TOTAL) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 8);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		dummy64 = (u64)statfs.f_blocks * (u64)statfs.f_bsize;</div><div class='del'>-		p = xdr_encode_hyper(p, dummy64);</div><div class='del'>-	}</div><div class='del'>-	if (bmval1 &amp; FATTR4_WORD1_SPACE_USED) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 8);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		dummy64 = (u64)stat.blocks &lt;&lt; 9;</div><div class='del'>-		p = xdr_encode_hyper(p, dummy64);</div><div class='del'>-	}</div><div class='del'>-	if (bmval1 &amp; FATTR4_WORD1_TIME_ACCESS) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 12);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		p = xdr_encode_hyper(p, (s64)stat.atime.tv_sec);</div><div class='del'>-		*p++ = cpu_to_be32(stat.atime.tv_nsec);</div><div class='del'>-	}</div><div class='del'>-	if (bmval1 &amp; FATTR4_WORD1_TIME_DELTA) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 12);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		p = encode_time_delta(p, d_inode(dentry));</div><div class='del'>-	}</div><div class='del'>-	if (bmval1 &amp; FATTR4_WORD1_TIME_METADATA) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 12);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		p = xdr_encode_hyper(p, (s64)stat.ctime.tv_sec);</div><div class='del'>-		*p++ = cpu_to_be32(stat.ctime.tv_nsec);</div><div class='del'>-	}</div><div class='del'>-	if (bmval1 &amp; FATTR4_WORD1_TIME_MODIFY) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 12);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		p = xdr_encode_hyper(p, (s64)stat.mtime.tv_sec);</div><div class='del'>-		*p++ = cpu_to_be32(stat.mtime.tv_nsec);</div><div class='del'>-	}</div><div class='del'>-	if (bmval1 &amp; FATTR4_WORD1_MOUNTED_ON_FILEID) {</div><div class='del'>-		struct kstat parent_stat;</div><div class='del'>-		u64 ino = stat.ino;</div><div class='del'>-</div><div class='del'>-		p = xdr_reserve_space(xdr, 8);</div><div class='del'>-		if (!p)</div><div class='del'>-                	goto out_resource;</div><div class='del'>-		/*</div><div class='del'>-		 * Get parent's attributes if not ignoring crossmount</div><div class='del'>-		 * and this is the root of a cross-mounted filesystem.</div><div class='del'>-		 */</div><div class='del'>-		if (ignore_crossmnt == 0 &amp;&amp;</div><div class='del'>-		    dentry == exp-&gt;ex_path.mnt-&gt;mnt_root) {</div><div class='del'>-			err = get_parent_attributes(exp, &amp;parent_stat);</div><div class='del'>-			if (err)</div><div class='del'>-				goto out_nfserr;</div><div class='del'>-			ino = parent_stat.ino;</div><div class='del'>-		}</div><div class='del'>-		p = xdr_encode_hyper(p, ino);</div><div class='del'>-	}</div><div class='del'>-#ifdef CONFIG_NFSD_PNFS</div><div class='del'>-	if (bmval1 &amp; FATTR4_WORD1_FS_LAYOUT_TYPES) {</div><div class='del'>-		status = nfsd4_encode_layout_types(xdr, exp-&gt;ex_layout_types);</div><div class='del'>-		if (status)</div><div class='del'>-			goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (bmval2 &amp; FATTR4_WORD2_LAYOUT_TYPES) {</div><div class='del'>-		status = nfsd4_encode_layout_types(xdr, exp-&gt;ex_layout_types);</div><div class='del'>-		if (status)</div><div class='del'>-			goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	if (bmval2 &amp; FATTR4_WORD2_LAYOUT_BLKSIZE) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		*p++ = cpu_to_be32(stat.blksize);</div><div class='del'>-	}</div><div class='del'>-#endif /* CONFIG_NFSD_PNFS */</div><div class='del'>-	if (bmval2 &amp; FATTR4_WORD2_SUPPATTR_EXCLCREAT) {</div><div class='del'>-		u32 supp[3];</div><div class='del'>-</div><div class='del'>-		memcpy(supp, nfsd_suppattrs[minorversion], sizeof(supp));</div><div class='del'>-		supp[0] &amp;= NFSD_SUPPATTR_EXCLCREAT_WORD0;</div><div class='del'>-		supp[1] &amp;= NFSD_SUPPATTR_EXCLCREAT_WORD1;</div><div class='del'>-		supp[2] &amp;= NFSD_SUPPATTR_EXCLCREAT_WORD2;</div><div class='del'>-</div><div class='del'>-		status = nfsd4_encode_bitmap(xdr, supp[0], supp[1], supp[2]);</div><div class='del'>-		if (status)</div><div class='del'>-			goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_NFSD_V4_SECURITY_LABEL</div><div class='del'>-	if (bmval2 &amp; FATTR4_WORD2_SECURITY_LABEL) {</div><div class='del'>-		status = nfsd4_encode_security_label(xdr, rqstp, context,</div><div class='del'>-								contextlen);</div><div class='del'>-		if (status)</div><div class='del'>-			goto out;</div><div class='del'>-	}</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-	if (bmval2 &amp; FATTR4_WORD2_XATTR_SUPPORT) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			goto out_resource;</div><div class='del'>-		err = xattr_supported_namespace(d_inode(dentry),</div><div class='del'>-						XATTR_USER_PREFIX);</div><div class='del'>-		*p++ = cpu_to_be32(err == 0);</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	attrlen = htonl(xdr-&gt;buf-&gt;len - attrlen_offset - 4);</div><div class='del'>-	write_bytes_to_xdr_buf(xdr-&gt;buf, attrlen_offset, &amp;attrlen, 4);</div><div class='add'>+	attrlen = cpu_to_be32(xdr-&gt;buf-&gt;len - attrlen_offset - XDR_UNIT);</div><div class='add'>+	write_bytes_to_xdr_buf(xdr-&gt;buf, attrlen_offset, &amp;attrlen, XDR_UNIT);</div><div class='ctx'> 	status = nfs_ok;</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> #ifdef CONFIG_NFSD_V4_SECURITY_LABEL</div><div class='del'>-	if (context)</div><div class='del'>-		security_release_secctx(context, contextlen);</div><div class='add'>+	if (args.context.context)</div><div class='add'>+		security_release_secctx(&amp;args.context);</div><div class='ctx'> #endif /* CONFIG_NFSD_V4_SECURITY_LABEL */</div><div class='del'>-	kfree(acl);</div><div class='add'>+	kfree(args.acl);</div><div class='ctx'> 	if (tempfh) {</div><div class='ctx'> 		fh_put(tempfh);</div><div class='ctx'> 		kfree(tempfh);</div><div class='hunk'>@@ -3389,12 +3782,28 @@ __be32 nfsd4_encode_fattr_to_buf(__be32 **p, int words,</div><div class='ctx'> 	__be32 ret;</div><div class='ctx'> </div><div class='ctx'> 	svcxdr_init_encode_from_buffer(&amp;xdr, &amp;dummy, *p, words &lt;&lt; 2);</div><div class='del'>-	ret = nfsd4_encode_fattr(&amp;xdr, fhp, exp, dentry, bmval, rqstp,</div><div class='del'>-							ignore_crossmnt);</div><div class='add'>+	ret = nfsd4_encode_fattr4(rqstp, &amp;xdr, fhp, exp, dentry, bmval,</div><div class='add'>+				  ignore_crossmnt);</div><div class='ctx'> 	*p = xdr.p;</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * The buffer space for this field was reserved during a previous</div><div class='add'>+ * call to nfsd4_encode_entry4().</div><div class='add'>+ */</div><div class='add'>+static void nfsd4_encode_entry4_nfs_cookie4(const struct nfsd4_readdir *readdir,</div><div class='add'>+					    u64 offset)</div><div class='add'>+{</div><div class='add'>+	__be64 cookie = cpu_to_be64(offset);</div><div class='add'>+	struct xdr_stream *xdr = readdir-&gt;xdr;</div><div class='add'>+</div><div class='add'>+	if (!readdir-&gt;cookie_offset)</div><div class='add'>+		return;</div><div class='add'>+	write_bytes_to_xdr_buf(xdr-&gt;buf, readdir-&gt;cookie_offset, &amp;cookie,</div><div class='add'>+			       sizeof(cookie));</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline int attributes_need_mount(u32 *bmval)</div><div class='ctx'> {</div><div class='ctx'> 	if (bmval[0] &amp; ~(FATTR4_WORD0_RDATTR_ERROR | FATTR4_WORD0_LEASE_TIME))</div><div class='hunk'>@@ -3405,15 +3814,17 @@ static inline int attributes_need_mount(u32 *bmval)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_dirent_fattr(struct xdr_stream *xdr, struct nfsd4_readdir *cd,</div><div class='del'>-			const char *name, int namlen)</div><div class='add'>+nfsd4_encode_entry4_fattr(struct nfsd4_readdir *cd, const char *name,</div><div class='add'>+			  int namlen)</div><div class='ctx'> {</div><div class='ctx'> 	struct svc_export *exp = cd-&gt;rd_fhp-&gt;fh_export;</div><div class='ctx'> 	struct dentry *dentry;</div><div class='ctx'> 	__be32 nfserr;</div><div class='ctx'> 	int ignore_crossmnt = 0;</div><div class='ctx'> </div><div class='del'>-	dentry = lookup_positive_unlocked(name, cd-&gt;rd_fhp-&gt;fh_dentry, namlen);</div><div class='add'>+	dentry = lookup_one_positive_unlocked(&amp;nop_mnt_idmap,</div><div class='add'>+					      &amp;QSTR_LEN(name, namlen),</div><div class='add'>+					      cd-&gt;rd_fhp-&gt;fh_dentry);</div><div class='ctx'> 	if (IS_ERR(dentry))</div><div class='ctx'> 		return nfserrno(PTR_ERR(dentry));</div><div class='ctx'> </div><div class='hunk'>@@ -3443,39 +3854,40 @@ nfsd4_encode_dirent_fattr(struct xdr_stream *xdr, struct nfsd4_readdir *cd,</div><div class='ctx'> 			nfserr = nfserrno(err);</div><div class='ctx'> 			goto out_put;</div><div class='ctx'> 		}</div><div class='del'>-		nfserr = check_nfsd_access(exp, cd-&gt;rd_rqstp);</div><div class='add'>+		nfserr = check_nfsd_access(exp, cd-&gt;rd_rqstp, false);</div><div class='ctx'> 		if (nfserr)</div><div class='ctx'> 			goto out_put;</div><div class='ctx'> </div><div class='ctx'> 	}</div><div class='ctx'> out_encode:</div><div class='del'>-	nfserr = nfsd4_encode_fattr(xdr, NULL, exp, dentry, cd-&gt;rd_bmval,</div><div class='del'>-					cd-&gt;rd_rqstp, ignore_crossmnt);</div><div class='add'>+	nfserr = nfsd4_encode_fattr4(cd-&gt;rd_rqstp, cd-&gt;xdr, NULL, exp, dentry,</div><div class='add'>+				     cd-&gt;rd_bmval, ignore_crossmnt);</div><div class='ctx'> out_put:</div><div class='ctx'> 	dput(dentry);</div><div class='ctx'> 	exp_put(exp);</div><div class='ctx'> 	return nfserr;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static __be32 *</div><div class='del'>-nfsd4_encode_rdattr_error(struct xdr_stream *xdr, __be32 nfserr)</div><div class='add'>+static __be32</div><div class='add'>+nfsd4_encode_entry4_rdattr_error(struct xdr_stream *xdr, __be32 nfserr)</div><div class='ctx'> {</div><div class='del'>-	__be32 *p;</div><div class='del'>-</div><div class='del'>-	p = xdr_reserve_space(xdr, 20);</div><div class='del'>-	if (!p)</div><div class='del'>-		return NULL;</div><div class='del'>-	*p++ = htonl(2);</div><div class='del'>-	*p++ = htonl(FATTR4_WORD0_RDATTR_ERROR); /* bmval0 */</div><div class='del'>-	*p++ = htonl(0);			 /* bmval1 */</div><div class='add'>+	__be32 status;</div><div class='ctx'> </div><div class='del'>-	*p++ = htonl(4);     /* attribute length */</div><div class='del'>-	*p++ = nfserr;       /* no htonl */</div><div class='del'>-	return p;</div><div class='add'>+	/* attrmask */</div><div class='add'>+	status = nfsd4_encode_bitmap4(xdr, FATTR4_WORD0_RDATTR_ERROR, 0, 0);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	/* attr_vals */</div><div class='add'>+	if (xdr_stream_encode_u32(xdr, XDR_UNIT) != XDR_UNIT)</div><div class='add'>+		return nfserr_resource;</div><div class='add'>+	/* rdattr_error */</div><div class='add'>+	if (xdr_stream_encode_be32(xdr, nfserr) != XDR_UNIT)</div><div class='add'>+		return nfserr_resource;</div><div class='add'>+	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-nfsd4_encode_dirent(void *ccdv, const char *name, int namlen,</div><div class='add'>+nfsd4_encode_entry4(void *ccdv, const char *name, int namlen,</div><div class='ctx'> 		    loff_t offset, u64 ino, unsigned int d_type)</div><div class='ctx'> {</div><div class='ctx'> 	struct readdir_cd *ccd = ccdv;</div><div class='hunk'>@@ -3486,8 +3898,6 @@ nfsd4_encode_dirent(void *ccdv, const char *name, int namlen,</div><div class='ctx'> 	u32 name_and_cookie;</div><div class='ctx'> 	int entry_bytes;</div><div class='ctx'> 	__be32 nfserr = nfserr_toosmall;</div><div class='del'>-	__be64 wire_offset;</div><div class='del'>-	__be32 *p;</div><div class='ctx'> </div><div class='ctx'> 	/* In nfsv4, "." and ".." never make it onto the wire.. */</div><div class='ctx'> 	if (name &amp;&amp; isdotent(name, namlen)) {</div><div class='hunk'>@@ -3495,24 +3905,19 @@ nfsd4_encode_dirent(void *ccdv, const char *name, int namlen,</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (cd-&gt;cookie_offset) {</div><div class='del'>-		wire_offset = cpu_to_be64(offset);</div><div class='del'>-		write_bytes_to_xdr_buf(xdr-&gt;buf, cd-&gt;cookie_offset,</div><div class='del'>-							&amp;wire_offset, 8);</div><div class='del'>-	}</div><div class='add'>+	/* Encode the previous entry's cookie value */</div><div class='add'>+	nfsd4_encode_entry4_nfs_cookie4(cd, offset);</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, 4);</div><div class='del'>-	if (!p)</div><div class='add'>+	if (xdr_stream_encode_item_present(xdr) != XDR_UNIT)</div><div class='ctx'> 		goto fail;</div><div class='del'>-	*p++ = xdr_one;                             /* mark entry present */</div><div class='add'>+</div><div class='add'>+	/* Reserve send buffer space for this entry's cookie value. */</div><div class='ctx'> 	cookie_offset = xdr-&gt;buf-&gt;len;</div><div class='del'>-	p = xdr_reserve_space(xdr, 3*4 + namlen);</div><div class='del'>-	if (!p)</div><div class='add'>+	if (nfsd4_encode_nfs_cookie4(xdr, OFFSET_MAX) != nfs_ok)</div><div class='ctx'> 		goto fail;</div><div class='del'>-	p = xdr_encode_hyper(p, NFS_OFFSET_MAX);    /* offset of next entry */</div><div class='del'>-	p = xdr_encode_array(p, name, namlen);      /* name length &amp; name */</div><div class='del'>-</div><div class='del'>-	nfserr = nfsd4_encode_dirent_fattr(xdr, cd, name, namlen);</div><div class='add'>+	if (nfsd4_encode_component4(xdr, name, namlen) != nfs_ok)</div><div class='add'>+		goto fail;</div><div class='add'>+	nfserr = nfsd4_encode_entry4_fattr(cd, name, namlen);</div><div class='ctx'> 	switch (nfserr) {</div><div class='ctx'> 	case nfs_ok:</div><div class='ctx'> 		break;</div><div class='hunk'>@@ -3522,6 +3927,17 @@ nfsd4_encode_dirent(void *ccdv, const char *name, int namlen,</div><div class='ctx'> 	case nfserr_noent:</div><div class='ctx'> 		xdr_truncate_encode(xdr, start_offset);</div><div class='ctx'> 		goto skip_entry;</div><div class='add'>+	case nfserr_jukebox:</div><div class='add'>+		/*</div><div class='add'>+		 * The pseudoroot should only display dentries that lead to</div><div class='add'>+		 * exports. If we get EJUKEBOX here, then we can't tell whether</div><div class='add'>+		 * this entry should be included. Just fail the whole READDIR</div><div class='add'>+		 * with NFS4ERR_DELAY in that case, and hope that the situation</div><div class='add'>+		 * will resolve itself by the client's next attempt.</div><div class='add'>+		 */</div><div class='add'>+		if (cd-&gt;rd_fhp-&gt;fh_export-&gt;ex_flags &amp; NFSEXP_V4ROOT)</div><div class='add'>+			goto fail;</div><div class='add'>+		fallthrough;</div><div class='ctx'> 	default:</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * If the client requested the RDATTR_ERROR attribute,</div><div class='hunk'>@@ -3532,8 +3948,7 @@ nfsd4_encode_dirent(void *ccdv, const char *name, int namlen,</div><div class='ctx'> 		 */</div><div class='ctx'> 		if (!(cd-&gt;rd_bmval[0] &amp; FATTR4_WORD0_RDATTR_ERROR))</div><div class='ctx'> 			goto fail;</div><div class='del'>-		p = nfsd4_encode_rdattr_error(xdr, nfserr);</div><div class='del'>-		if (p == NULL) {</div><div class='add'>+		if (nfsd4_encode_entry4_rdattr_error(xdr, nfserr)) {</div><div class='ctx'> 			nfserr = nfserr_toosmall;</div><div class='ctx'> 			goto fail;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -3568,307 +3983,427 @@ fail:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_stateid(struct xdr_stream *xdr, stateid_t *sid)</div><div class='add'>+nfsd4_encode_verifier4(struct xdr_stream *xdr, const nfs4_verifier *verf)</div><div class='ctx'> {</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, sizeof(stateid_t));</div><div class='add'>+	p = xdr_reserve_space(xdr, NFS4_VERIFIER_SIZE);</div><div class='ctx'> 	if (!p)</div><div class='ctx'> 		return nfserr_resource;</div><div class='del'>-	*p++ = cpu_to_be32(sid-&gt;si_generation);</div><div class='del'>-	p = xdr_encode_opaque_fixed(p, &amp;sid-&gt;si_opaque,</div><div class='del'>-					sizeof(stateid_opaque_t));</div><div class='del'>-	return 0;</div><div class='add'>+	memcpy(p, verf-&gt;data, sizeof(verf-&gt;data));</div><div class='add'>+	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_access(struct nfsd4_compoundres *resp, __be32 nfserr, struct nfsd4_access *access)</div><div class='add'>+nfsd4_encode_clientid4(struct xdr_stream *xdr, const clientid_t *clientid)</div><div class='ctx'> {</div><div class='del'>-	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, 8);</div><div class='add'>+	p = xdr_reserve_space(xdr, sizeof(__be64));</div><div class='ctx'> 	if (!p)</div><div class='ctx'> 		return nfserr_resource;</div><div class='del'>-	*p++ = cpu_to_be32(access-&gt;ac_supported);</div><div class='del'>-	*p++ = cpu_to_be32(access-&gt;ac_resp_access);</div><div class='del'>-	return 0;</div><div class='add'>+	memcpy(p, clientid, sizeof(*clientid));</div><div class='add'>+	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static __be32 nfsd4_encode_bind_conn_to_session(struct nfsd4_compoundres *resp, __be32 nfserr, struct nfsd4_bind_conn_to_session *bcts)</div><div class='add'>+/* This is a frequently-encoded item; open-coded for speed */</div><div class='add'>+static __be32</div><div class='add'>+nfsd4_encode_stateid4(struct xdr_stream *xdr, const stateid_t *sid)</div><div class='ctx'> {</div><div class='del'>-	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, NFS4_MAX_SESSIONID_LEN + 8);</div><div class='add'>+	p = xdr_reserve_space(xdr, NFS4_STATEID_SIZE);</div><div class='ctx'> 	if (!p)</div><div class='ctx'> 		return nfserr_resource;</div><div class='del'>-	p = xdr_encode_opaque_fixed(p, bcts-&gt;sessionid.data,</div><div class='del'>-					NFS4_MAX_SESSIONID_LEN);</div><div class='del'>-	*p++ = cpu_to_be32(bcts-&gt;dir);</div><div class='del'>-	/* Upshifting from TCP to RDMA is not supported */</div><div class='del'>-	*p++ = cpu_to_be32(0);</div><div class='del'>-	return 0;</div><div class='add'>+	*p++ = cpu_to_be32(sid-&gt;si_generation);</div><div class='add'>+	memcpy(p, &amp;sid-&gt;si_opaque, sizeof(sid-&gt;si_opaque));</div><div class='add'>+	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_close(struct nfsd4_compoundres *resp, __be32 nfserr, struct nfsd4_close *close)</div><div class='add'>+nfsd4_encode_sessionid4(struct xdr_stream *xdr,</div><div class='add'>+			const struct nfs4_sessionid *sessionid)</div><div class='ctx'> {</div><div class='add'>+	return nfsd4_encode_opaque_fixed(xdr, sessionid-&gt;data,</div><div class='add'>+					 NFS4_MAX_SESSIONID_LEN);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32</div><div class='add'>+nfsd4_encode_access(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+		    union nfsd4_op_u *u)</div><div class='add'>+{</div><div class='add'>+	struct nfsd4_access *access = &amp;u-&gt;access;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='add'>+	__be32 status;</div><div class='ctx'> </div><div class='del'>-	return nfsd4_encode_stateid(xdr, &amp;close-&gt;cl_stateid);</div><div class='add'>+	/* supported */</div><div class='add'>+	status = nfsd4_encode_uint32_t(xdr, access-&gt;ac_supported);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	/* access */</div><div class='add'>+	return nfsd4_encode_uint32_t(xdr, access-&gt;ac_resp_access);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static __be32 nfsd4_encode_bind_conn_to_session(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+						union nfsd4_op_u *u)</div><div class='add'>+{</div><div class='add'>+	struct nfsd4_bind_conn_to_session *bcts = &amp;u-&gt;bind_conn_to_session;</div><div class='add'>+	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='add'>+</div><div class='add'>+	/* bctsr_sessid */</div><div class='add'>+	nfserr = nfsd4_encode_sessionid4(xdr, &amp;bcts-&gt;sessionid);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='add'>+	/* bctsr_dir */</div><div class='add'>+	if (xdr_stream_encode_u32(xdr, bcts-&gt;dir) != XDR_UNIT)</div><div class='add'>+		return nfserr_resource;</div><div class='add'>+	/* bctsr_use_conn_in_rdma_mode */</div><div class='add'>+	return nfsd4_encode_bool(xdr, false);</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_commit(struct nfsd4_compoundres *resp, __be32 nfserr, struct nfsd4_commit *commit)</div><div class='add'>+nfsd4_encode_close(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+		   union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_close *close = &amp;u-&gt;close;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='del'>-	__be32 *p;</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, NFS4_VERIFIER_SIZE);</div><div class='del'>-	if (!p)</div><div class='del'>-		return nfserr_resource;</div><div class='del'>-	p = xdr_encode_opaque_fixed(p, commit-&gt;co_verf.data,</div><div class='del'>-						NFS4_VERIFIER_SIZE);</div><div class='del'>-	return 0;</div><div class='add'>+	/* open_stateid */</div><div class='add'>+	return nfsd4_encode_stateid4(xdr, &amp;close-&gt;cl_stateid);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+</div><div class='add'>+static __be32</div><div class='add'>+nfsd4_encode_commit(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+		    union nfsd4_op_u *u)</div><div class='add'>+{</div><div class='add'>+	struct nfsd4_commit *commit = &amp;u-&gt;commit;</div><div class='add'>+</div><div class='add'>+	return nfsd4_encode_verifier4(resp-&gt;xdr, &amp;commit-&gt;co_verf);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_create(struct nfsd4_compoundres *resp, __be32 nfserr, struct nfsd4_create *create)</div><div class='add'>+nfsd4_encode_create(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+		    union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_create *create = &amp;u-&gt;create;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='del'>-	__be32 *p;</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, 20);</div><div class='del'>-	if (!p)</div><div class='del'>-		return nfserr_resource;</div><div class='del'>-	encode_cinfo(p, &amp;create-&gt;cr_cinfo);</div><div class='del'>-	return nfsd4_encode_bitmap(xdr, create-&gt;cr_bmval[0],</div><div class='del'>-			create-&gt;cr_bmval[1], create-&gt;cr_bmval[2]);</div><div class='add'>+	/* cinfo */</div><div class='add'>+	nfserr = nfsd4_encode_change_info4(xdr, &amp;create-&gt;cr_cinfo);</div><div class='add'>+	if (nfserr)</div><div class='add'>+		return nfserr;</div><div class='add'>+	/* attrset */</div><div class='add'>+	return nfsd4_encode_bitmap4(xdr, create-&gt;cr_bmval[0],</div><div class='add'>+				    create-&gt;cr_bmval[1], create-&gt;cr_bmval[2]);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_getattr(struct nfsd4_compoundres *resp, __be32 nfserr, struct nfsd4_getattr *getattr)</div><div class='add'>+nfsd4_encode_getattr(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+		     union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_getattr *getattr = &amp;u-&gt;getattr;</div><div class='ctx'> 	struct svc_fh *fhp = getattr-&gt;ga_fhp;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='ctx'> </div><div class='del'>-	return nfsd4_encode_fattr(xdr, fhp, fhp-&gt;fh_export, fhp-&gt;fh_dentry,</div><div class='del'>-				    getattr-&gt;ga_bmval, resp-&gt;rqstp, 0);</div><div class='add'>+	/* obj_attributes */</div><div class='add'>+	return nfsd4_encode_fattr4(resp-&gt;rqstp, xdr, fhp, fhp-&gt;fh_export,</div><div class='add'>+				   fhp-&gt;fh_dentry, getattr-&gt;ga_bmval, 0);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_getfh(struct nfsd4_compoundres *resp, __be32 nfserr, struct svc_fh **fhpp)</div><div class='add'>+nfsd4_encode_getfh(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+		   union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='del'>-	struct svc_fh *fhp = *fhpp;</div><div class='del'>-	unsigned int len;</div><div class='del'>-	__be32 *p;</div><div class='add'>+	struct svc_fh *fhp = u-&gt;getfh;</div><div class='ctx'> </div><div class='del'>-	len = fhp-&gt;fh_handle.fh_size;</div><div class='del'>-	p = xdr_reserve_space(xdr, len + 4);</div><div class='del'>-	if (!p)</div><div class='del'>-		return nfserr_resource;</div><div class='del'>-	p = xdr_encode_opaque(p, &amp;fhp-&gt;fh_handle.fh_raw, len);</div><div class='del'>-	return 0;</div><div class='add'>+	/* object */</div><div class='add'>+	return nfsd4_encode_nfs_fh4(xdr, &amp;fhp-&gt;fh_handle);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>-* Including all fields other than the name, a LOCK4denied structure requires</div><div class='del'>-*   8(clientid) + 4(namelen) + 8(offset) + 8(length) + 4(type) = 32 bytes.</div><div class='del'>-*/</div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_lock_denied(struct xdr_stream *xdr, struct nfsd4_lock_denied *ld)</div><div class='add'>+nfsd4_encode_lock_owner4(struct xdr_stream *xdr, const clientid_t *clientid,</div><div class='add'>+			 const struct xdr_netobj *owner)</div><div class='ctx'> {</div><div class='del'>-	struct xdr_netobj *conf = &amp;ld-&gt;ld_owner;</div><div class='del'>-	__be32 *p;</div><div class='add'>+	__be32 status;</div><div class='ctx'> </div><div class='del'>-again:</div><div class='del'>-	p = xdr_reserve_space(xdr, 32 + XDR_LEN(conf-&gt;len));</div><div class='del'>-	if (!p) {</div><div class='del'>-		/*</div><div class='del'>-		 * Don't fail to return the result just because we can't</div><div class='del'>-		 * return the conflicting open:</div><div class='del'>-		 */</div><div class='del'>-		if (conf-&gt;len) {</div><div class='del'>-			kfree(conf-&gt;data);</div><div class='del'>-			conf-&gt;len = 0;</div><div class='del'>-			conf-&gt;data = NULL;</div><div class='del'>-			goto again;</div><div class='del'>-		}</div><div class='add'>+	/* clientid */</div><div class='add'>+	status = nfsd4_encode_clientid4(xdr, clientid);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	/* owner */</div><div class='add'>+	return nfsd4_encode_opaque(xdr, owner-&gt;data, owner-&gt;len);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32</div><div class='add'>+nfsd4_encode_lock4denied(struct xdr_stream *xdr,</div><div class='add'>+			 const struct nfsd4_lock_denied *ld)</div><div class='add'>+{</div><div class='add'>+	__be32 status;</div><div class='add'>+</div><div class='add'>+	/* offset */</div><div class='add'>+	status = nfsd4_encode_offset4(xdr, ld-&gt;ld_start);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	/* length */</div><div class='add'>+	status = nfsd4_encode_length4(xdr, ld-&gt;ld_length);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	/* locktype */</div><div class='add'>+	if (xdr_stream_encode_u32(xdr, ld-&gt;ld_type) != XDR_UNIT)</div><div class='ctx'> 		return nfserr_resource;</div><div class='del'>-	}</div><div class='del'>-	p = xdr_encode_hyper(p, ld-&gt;ld_start);</div><div class='del'>-	p = xdr_encode_hyper(p, ld-&gt;ld_length);</div><div class='del'>-	*p++ = cpu_to_be32(ld-&gt;ld_type);</div><div class='del'>-	if (conf-&gt;len) {</div><div class='del'>-		p = xdr_encode_opaque_fixed(p, &amp;ld-&gt;ld_clientid, 8);</div><div class='del'>-		p = xdr_encode_opaque(p, conf-&gt;data, conf-&gt;len);</div><div class='del'>-		kfree(conf-&gt;data);</div><div class='del'>-	}  else {  /* non - nfsv4 lock in conflict, no clientid nor owner */</div><div class='del'>-		p = xdr_encode_hyper(p, (u64)0); /* clientid */</div><div class='del'>-		*p++ = cpu_to_be32(0); /* length of owner name */</div><div class='del'>-	}</div><div class='del'>-	return nfserr_denied;</div><div class='add'>+	/* owner */</div><div class='add'>+	return nfsd4_encode_lock_owner4(xdr, &amp;ld-&gt;ld_clientid,</div><div class='add'>+					&amp;ld-&gt;ld_owner);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_lock(struct nfsd4_compoundres *resp, __be32 nfserr, struct nfsd4_lock *lock)</div><div class='add'>+nfsd4_encode_lock(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+		  union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_lock *lock = &amp;u-&gt;lock;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='add'>+	__be32 status;</div><div class='ctx'> </div><div class='del'>-	if (!nfserr)</div><div class='del'>-		nfserr = nfsd4_encode_stateid(xdr, &amp;lock-&gt;lk_resp_stateid);</div><div class='del'>-	else if (nfserr == nfserr_denied)</div><div class='del'>-		nfserr = nfsd4_encode_lock_denied(xdr, &amp;lock-&gt;lk_denied);</div><div class='del'>-</div><div class='del'>-	return nfserr;</div><div class='add'>+	switch (nfserr) {</div><div class='add'>+	case nfs_ok:</div><div class='add'>+		/* resok4 */</div><div class='add'>+		status = nfsd4_encode_stateid4(xdr, &amp;lock-&gt;lk_resp_stateid);</div><div class='add'>+		break;</div><div class='add'>+	case nfserr_denied:</div><div class='add'>+		/* denied */</div><div class='add'>+		status = nfsd4_encode_lock4denied(xdr, &amp;lock-&gt;lk_denied);</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		return nfserr;</div><div class='add'>+	}</div><div class='add'>+	return status != nfs_ok ? status : nfserr;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_lockt(struct nfsd4_compoundres *resp, __be32 nfserr, struct nfsd4_lockt *lockt)</div><div class='add'>+nfsd4_encode_lockt(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+		   union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_lockt *lockt = &amp;u-&gt;lockt;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='add'>+	__be32 status;</div><div class='ctx'> </div><div class='del'>-	if (nfserr == nfserr_denied)</div><div class='del'>-		nfsd4_encode_lock_denied(xdr, &amp;lockt-&gt;lt_denied);</div><div class='add'>+	if (nfserr == nfserr_denied) {</div><div class='add'>+		/* denied */</div><div class='add'>+		status = nfsd4_encode_lock4denied(xdr, &amp;lockt-&gt;lt_denied);</div><div class='add'>+		if (status != nfs_ok)</div><div class='add'>+			return status;</div><div class='add'>+	}</div><div class='ctx'> 	return nfserr;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_locku(struct nfsd4_compoundres *resp, __be32 nfserr, struct nfsd4_locku *locku)</div><div class='add'>+nfsd4_encode_locku(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+		   union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_locku *locku = &amp;u-&gt;locku;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='ctx'> </div><div class='del'>-	return nfsd4_encode_stateid(xdr, &amp;locku-&gt;lu_stateid);</div><div class='add'>+	/* lock_stateid */</div><div class='add'>+	return nfsd4_encode_stateid4(xdr, &amp;locku-&gt;lu_stateid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_link(struct nfsd4_compoundres *resp, __be32 nfserr, struct nfsd4_link *link)</div><div class='add'>+nfsd4_encode_link(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+		  union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_link *link = &amp;u-&gt;link;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='del'>-	__be32 *p;</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, 20);</div><div class='del'>-	if (!p)</div><div class='del'>-		return nfserr_resource;</div><div class='del'>-	p = encode_cinfo(p, &amp;link-&gt;li_cinfo);</div><div class='del'>-	return 0;</div><div class='add'>+	return nfsd4_encode_change_info4(xdr, &amp;link-&gt;li_cinfo);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-</div><div class='add'>+/*</div><div class='add'>+ * This implementation does not yet support returning an ACE in an</div><div class='add'>+ * OPEN that offers a delegation.</div><div class='add'>+ */</div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_open(struct nfsd4_compoundres *resp, __be32 nfserr, struct nfsd4_open *open)</div><div class='add'>+nfsd4_encode_open_nfsace4(struct xdr_stream *xdr)</div><div class='ctx'> {</div><div class='del'>-	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='del'>-	__be32 *p;</div><div class='add'>+	__be32 status;</div><div class='ctx'> </div><div class='del'>-	nfserr = nfsd4_encode_stateid(xdr, &amp;open-&gt;op_stateid);</div><div class='del'>-	if (nfserr)</div><div class='del'>-		return nfserr;</div><div class='del'>-	p = xdr_reserve_space(xdr, 24);</div><div class='del'>-	if (!p)</div><div class='add'>+	/* type */</div><div class='add'>+	status = nfsd4_encode_acetype4(xdr, NFS4_ACE_ACCESS_ALLOWED_ACE_TYPE);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return nfserr_resource;</div><div class='add'>+	/* flag */</div><div class='add'>+	status = nfsd4_encode_aceflag4(xdr, 0);</div><div class='add'>+	if (status != nfs_ok)</div><div class='ctx'> 		return nfserr_resource;</div><div class='del'>-	p = encode_cinfo(p, &amp;open-&gt;op_cinfo);</div><div class='del'>-	*p++ = cpu_to_be32(open-&gt;op_rflags);</div><div class='add'>+	/* access mask */</div><div class='add'>+	status = nfsd4_encode_acemask4(xdr, 0);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return nfserr_resource;</div><div class='add'>+	/* who - empty for now */</div><div class='add'>+	if (xdr_stream_encode_u32(xdr, 0) != XDR_UNIT)</div><div class='add'>+		return nfserr_resource;</div><div class='add'>+	return nfs_ok;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	nfserr = nfsd4_encode_bitmap(xdr, open-&gt;op_bmval[0], open-&gt;op_bmval[1],</div><div class='del'>-					open-&gt;op_bmval[2]);</div><div class='del'>-	if (nfserr)</div><div class='del'>-		return nfserr;</div><div class='add'>+static __be32</div><div class='add'>+nfsd4_encode_open_read_delegation4(struct xdr_stream *xdr, struct nfsd4_open *open)</div><div class='add'>+{</div><div class='add'>+	__be32 status;</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, 4);</div><div class='del'>-	if (!p)</div><div class='add'>+	/* stateid */</div><div class='add'>+	status = nfsd4_encode_stateid4(xdr, &amp;open-&gt;op_delegate_stateid);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	/* recall */</div><div class='add'>+	status = nfsd4_encode_bool(xdr, open-&gt;op_recall);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	/* permissions */</div><div class='add'>+	return nfsd4_encode_open_nfsace4(xdr);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32</div><div class='add'>+nfsd4_encode_nfs_space_limit4(struct xdr_stream *xdr, u64 filesize)</div><div class='add'>+{</div><div class='add'>+	/* limitby */</div><div class='add'>+	if (xdr_stream_encode_u32(xdr, NFS4_LIMIT_SIZE) != XDR_UNIT)</div><div class='ctx'> 		return nfserr_resource;</div><div class='add'>+	/* filesize */</div><div class='add'>+	return nfsd4_encode_uint64_t(xdr, filesize);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	*p++ = cpu_to_be32(open-&gt;op_delegate_type);</div><div class='del'>-	switch (open-&gt;op_delegate_type) {</div><div class='del'>-	case NFS4_OPEN_DELEGATE_NONE:</div><div class='del'>-		break;</div><div class='del'>-	case NFS4_OPEN_DELEGATE_READ:</div><div class='del'>-		nfserr = nfsd4_encode_stateid(xdr, &amp;open-&gt;op_delegate_stateid);</div><div class='del'>-		if (nfserr)</div><div class='del'>-			return nfserr;</div><div class='del'>-		p = xdr_reserve_space(xdr, 20);</div><div class='del'>-		if (!p)</div><div class='del'>-			return nfserr_resource;</div><div class='del'>-		*p++ = cpu_to_be32(open-&gt;op_recall);</div><div class='add'>+static __be32</div><div class='add'>+nfsd4_encode_open_write_delegation4(struct xdr_stream *xdr,</div><div class='add'>+				    struct nfsd4_open *open)</div><div class='add'>+{</div><div class='add'>+	__be32 status;</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * TODO: ACE's in delegations</div><div class='del'>-		 */</div><div class='del'>-		*p++ = cpu_to_be32(NFS4_ACE_ACCESS_ALLOWED_ACE_TYPE);</div><div class='del'>-		*p++ = cpu_to_be32(0);</div><div class='del'>-		*p++ = cpu_to_be32(0);</div><div class='del'>-		*p++ = cpu_to_be32(0);   /* XXX: is NULL principal ok? */</div><div class='add'>+	/* stateid */</div><div class='add'>+	status = nfsd4_encode_stateid4(xdr, &amp;open-&gt;op_delegate_stateid);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	/* recall */</div><div class='add'>+	status = nfsd4_encode_bool(xdr, open-&gt;op_recall);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	/* space_limit */</div><div class='add'>+	status = nfsd4_encode_nfs_space_limit4(xdr, 0);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	return nfsd4_encode_open_nfsace4(xdr);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32</div><div class='add'>+nfsd4_encode_open_none_delegation4(struct xdr_stream *xdr,</div><div class='add'>+				   struct nfsd4_open *open)</div><div class='add'>+{</div><div class='add'>+	__be32 status = nfs_ok;</div><div class='add'>+</div><div class='add'>+	/* ond_why */</div><div class='add'>+	if (xdr_stream_encode_u32(xdr, open-&gt;op_why_no_deleg) != XDR_UNIT)</div><div class='add'>+		return nfserr_resource;</div><div class='add'>+	switch (open-&gt;op_why_no_deleg) {</div><div class='add'>+	case WND4_CONTENTION:</div><div class='add'>+		/* ond_server_will_push_deleg */</div><div class='add'>+		status = nfsd4_encode_bool(xdr, false);</div><div class='ctx'> 		break;</div><div class='del'>-	case NFS4_OPEN_DELEGATE_WRITE:</div><div class='del'>-		nfserr = nfsd4_encode_stateid(xdr, &amp;open-&gt;op_delegate_stateid);</div><div class='del'>-		if (nfserr)</div><div class='del'>-			return nfserr;</div><div class='del'>-		p = xdr_reserve_space(xdr, 32);</div><div class='del'>-		if (!p)</div><div class='del'>-			return nfserr_resource;</div><div class='del'>-		*p++ = cpu_to_be32(0);</div><div class='add'>+	case WND4_RESOURCE:</div><div class='add'>+		/* ond_server_will_signal_avail */</div><div class='add'>+		status = nfsd4_encode_bool(xdr, false);</div><div class='add'>+	}</div><div class='add'>+	return status;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * TODO: space_limit's in delegations</div><div class='del'>-		 */</div><div class='del'>-		*p++ = cpu_to_be32(NFS4_LIMIT_SIZE);</div><div class='del'>-		*p++ = cpu_to_be32(~(u32)0);</div><div class='del'>-		*p++ = cpu_to_be32(~(u32)0);</div><div class='add'>+static __be32</div><div class='add'>+nfsd4_encode_open_delegation4(struct xdr_stream *xdr, struct nfsd4_open *open)</div><div class='add'>+{</div><div class='add'>+	__be32 status;</div><div class='ctx'> </div><div class='del'>-		/*</div><div class='del'>-		 * TODO: ACE's in delegations</div><div class='del'>-		 */</div><div class='del'>-		*p++ = cpu_to_be32(NFS4_ACE_ACCESS_ALLOWED_ACE_TYPE);</div><div class='del'>-		*p++ = cpu_to_be32(0);</div><div class='del'>-		*p++ = cpu_to_be32(0);</div><div class='del'>-		*p++ = cpu_to_be32(0);   /* XXX: is NULL principal ok? */</div><div class='add'>+	/* delegation_type */</div><div class='add'>+	if (xdr_stream_encode_u32(xdr, open-&gt;op_delegate_type) != XDR_UNIT)</div><div class='add'>+		return nfserr_resource;</div><div class='add'>+	switch (open-&gt;op_delegate_type) {</div><div class='add'>+	case OPEN_DELEGATE_NONE:</div><div class='add'>+		status = nfs_ok;</div><div class='ctx'> 		break;</div><div class='del'>-	case NFS4_OPEN_DELEGATE_NONE_EXT: /* 4.1 */</div><div class='del'>-		switch (open-&gt;op_why_no_deleg) {</div><div class='del'>-		case WND4_CONTENTION:</div><div class='del'>-		case WND4_RESOURCE:</div><div class='del'>-			p = xdr_reserve_space(xdr, 8);</div><div class='del'>-			if (!p)</div><div class='del'>-				return nfserr_resource;</div><div class='del'>-			*p++ = cpu_to_be32(open-&gt;op_why_no_deleg);</div><div class='del'>-			/* deleg signaling not supported yet: */</div><div class='del'>-			*p++ = cpu_to_be32(0);</div><div class='del'>-			break;</div><div class='del'>-		default:</div><div class='del'>-			p = xdr_reserve_space(xdr, 4);</div><div class='del'>-			if (!p)</div><div class='del'>-				return nfserr_resource;</div><div class='del'>-			*p++ = cpu_to_be32(open-&gt;op_why_no_deleg);</div><div class='del'>-		}</div><div class='add'>+	case OPEN_DELEGATE_READ:</div><div class='add'>+	case OPEN_DELEGATE_READ_ATTRS_DELEG:</div><div class='add'>+		/* read */</div><div class='add'>+		status = nfsd4_encode_open_read_delegation4(xdr, open);</div><div class='add'>+		break;</div><div class='add'>+	case OPEN_DELEGATE_WRITE:</div><div class='add'>+	case OPEN_DELEGATE_WRITE_ATTRS_DELEG:</div><div class='add'>+		/* write */</div><div class='add'>+		status = nfsd4_encode_open_write_delegation4(xdr, open);</div><div class='add'>+		break;</div><div class='add'>+	case OPEN_DELEGATE_NONE_EXT:</div><div class='add'>+		/* od_whynone */</div><div class='add'>+		status = nfsd4_encode_open_none_delegation4(xdr, open);</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='del'>-		BUG();</div><div class='add'>+		status = nfserr_serverfault;</div><div class='ctx'> 	}</div><div class='del'>-	/* XXX save filehandle here */</div><div class='del'>-	return 0;</div><div class='add'>+</div><div class='add'>+	return status;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32</div><div class='add'>+nfsd4_encode_open(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+		  union nfsd4_op_u *u)</div><div class='add'>+{</div><div class='add'>+	struct nfsd4_open *open = &amp;u-&gt;open;</div><div class='add'>+	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='add'>+</div><div class='add'>+	/* stateid */</div><div class='add'>+	nfserr = nfsd4_encode_stateid4(xdr, &amp;open-&gt;op_stateid);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='add'>+	/* cinfo */</div><div class='add'>+	nfserr = nfsd4_encode_change_info4(xdr, &amp;open-&gt;op_cinfo);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='add'>+	/* rflags */</div><div class='add'>+	nfserr = nfsd4_encode_uint32_t(xdr, open-&gt;op_rflags);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='add'>+	/* attrset */</div><div class='add'>+	nfserr = nfsd4_encode_bitmap4(xdr, open-&gt;op_bmval[0],</div><div class='add'>+				      open-&gt;op_bmval[1], open-&gt;op_bmval[2]);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='add'>+	/* delegation */</div><div class='add'>+	return nfsd4_encode_open_delegation4(xdr, open);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_open_confirm(struct nfsd4_compoundres *resp, __be32 nfserr, struct nfsd4_open_confirm *oc)</div><div class='add'>+nfsd4_encode_open_confirm(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+			  union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_open_confirm *oc = &amp;u-&gt;open_confirm;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='ctx'> </div><div class='del'>-	return nfsd4_encode_stateid(xdr, &amp;oc-&gt;oc_resp_stateid);</div><div class='add'>+	/* open_stateid */</div><div class='add'>+	return nfsd4_encode_stateid4(xdr, &amp;oc-&gt;oc_resp_stateid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_open_downgrade(struct nfsd4_compoundres *resp, __be32 nfserr, struct nfsd4_open_downgrade *od)</div><div class='add'>+nfsd4_encode_open_downgrade(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+			    union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_open_downgrade *od = &amp;u-&gt;open_downgrade;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='ctx'> </div><div class='del'>-	return nfsd4_encode_stateid(xdr, &amp;od-&gt;od_stateid);</div><div class='add'>+	/* open_stateid */</div><div class='add'>+	return nfsd4_encode_stateid4(xdr, &amp;od-&gt;od_stateid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * The operation of this function assumes that this is the only</div><div class='add'>+ * READ operation in the COMPOUND. If there are multiple READs,</div><div class='add'>+ * we use nfsd4_encode_readv().</div><div class='add'>+ */</div><div class='ctx'> static __be32 nfsd4_encode_splice_read(</div><div class='ctx'> 				struct nfsd4_compoundres *resp,</div><div class='ctx'> 				struct nfsd4_read *read,</div><div class='hunk'>@@ -3877,19 +4412,33 @@ static __be32 nfsd4_encode_splice_read(</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='ctx'> 	struct xdr_buf *buf = xdr-&gt;buf;</div><div class='ctx'> 	int status, space_left;</div><div class='del'>-	u32 eof;</div><div class='ctx'> 	__be32 nfserr;</div><div class='del'>-	__be32 *p = xdr-&gt;p - 2;</div><div class='ctx'> </div><div class='del'>-	/* Make sure there will be room for padding if needed */</div><div class='del'>-	if (xdr-&gt;end - xdr-&gt;p &lt; 1)</div><div class='add'>+	/*</div><div class='add'>+	 * Splice read doesn't work if encoding has already wandered</div><div class='add'>+	 * into the XDR buf's page array.</div><div class='add'>+	 */</div><div class='add'>+	if (unlikely(xdr-&gt;buf-&gt;page_len)) {</div><div class='add'>+		WARN_ON_ONCE(1);</div><div class='add'>+		return nfserr_serverfault;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Make sure there is room at the end of buf-&gt;head for</div><div class='add'>+	 * svcxdr_encode_opaque_pages() to create a tail buffer</div><div class='add'>+	 * to XDR-pad the payload.</div><div class='add'>+	 */</div><div class='add'>+	if (xdr-&gt;iov != xdr-&gt;buf-&gt;head || xdr-&gt;end - xdr-&gt;p &lt; 1)</div><div class='ctx'> 		return nfserr_resource;</div><div class='ctx'> </div><div class='ctx'> 	nfserr = nfsd_splice_read(read-&gt;rd_rqstp, read-&gt;rd_fhp,</div><div class='del'>-				  file, read-&gt;rd_offset, &amp;maxcount, &amp;eof);</div><div class='add'>+				  file, read-&gt;rd_offset, &amp;maxcount,</div><div class='add'>+				  &amp;read-&gt;rd_eof);</div><div class='ctx'> 	read-&gt;rd_length = maxcount;</div><div class='ctx'> 	if (nfserr)</div><div class='ctx'> 		goto out_err;</div><div class='add'>+	svcxdr_encode_opaque_pages(read-&gt;rd_rqstp, xdr, buf-&gt;pages,</div><div class='add'>+				   buf-&gt;page_base, maxcount);</div><div class='ctx'> 	status = svc_encode_result_payload(read-&gt;rd_rqstp,</div><div class='ctx'> 					   buf-&gt;head[0].iov_len, maxcount);</div><div class='ctx'> 	if (status) {</div><div class='hunk'>@@ -3897,34 +4446,19 @@ static __be32 nfsd4_encode_splice_read(</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	*(p++) = htonl(eof);</div><div class='del'>-	*(p++) = htonl(maxcount);</div><div class='del'>-</div><div class='del'>-	buf-&gt;page_len = maxcount;</div><div class='del'>-	buf-&gt;len += maxcount;</div><div class='del'>-	xdr-&gt;page_ptr += (buf-&gt;page_base + maxcount + PAGE_SIZE - 1)</div><div class='del'>-							/ PAGE_SIZE;</div><div class='del'>-</div><div class='del'>-	/* Use rest of head for padding and remaining ops: */</div><div class='del'>-	buf-&gt;tail[0].iov_base = xdr-&gt;p;</div><div class='del'>-	buf-&gt;tail[0].iov_len = 0;</div><div class='del'>-	xdr-&gt;iov = buf-&gt;tail;</div><div class='del'>-	if (maxcount&amp;3) {</div><div class='del'>-		int pad = 4 - (maxcount&amp;3);</div><div class='del'>-</div><div class='del'>-		*(xdr-&gt;p++) = 0;</div><div class='del'>-</div><div class='del'>-		buf-&gt;tail[0].iov_base += maxcount&amp;3;</div><div class='del'>-		buf-&gt;tail[0].iov_len = pad;</div><div class='del'>-		buf-&gt;len += pad;</div><div class='del'>-	}</div><div class='del'>-</div><div class='add'>+	/*</div><div class='add'>+	 * Prepare to encode subsequent operations.</div><div class='add'>+	 *</div><div class='add'>+	 * xdr_truncate_encode() is not safe to use after a successful</div><div class='add'>+	 * splice read has been done, so the following stream</div><div class='add'>+	 * manipulations are open-coded.</div><div class='add'>+	 */</div><div class='ctx'> 	space_left = min_t(int, (void *)xdr-&gt;end - (void *)xdr-&gt;p,</div><div class='ctx'> 				buf-&gt;buflen - buf-&gt;len);</div><div class='ctx'> 	buf-&gt;buflen = buf-&gt;len + space_left;</div><div class='ctx'> 	xdr-&gt;end = (__be32 *)((void *)xdr-&gt;end + space_left);</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+	return nfs_ok;</div><div class='ctx'> </div><div class='ctx'> out_err:</div><div class='ctx'> 	/*</div><div class='hunk'>@@ -3938,110 +4472,108 @@ out_err:</div><div class='ctx'> </div><div class='ctx'> static __be32 nfsd4_encode_readv(struct nfsd4_compoundres *resp,</div><div class='ctx'> 				 struct nfsd4_read *read,</div><div class='del'>-				 struct file *file, unsigned long maxcount)</div><div class='add'>+				 unsigned long maxcount)</div><div class='ctx'> {</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='del'>-	u32 eof;</div><div class='del'>-	int starting_len = xdr-&gt;buf-&gt;len - 8;</div><div class='add'>+	unsigned int base = xdr-&gt;buf-&gt;page_len &amp; ~PAGE_MASK;</div><div class='add'>+	unsigned int starting_len = xdr-&gt;buf-&gt;len;</div><div class='add'>+	__be32 zero = xdr_zero;</div><div class='ctx'> 	__be32 nfserr;</div><div class='del'>-	__be32 tmp;</div><div class='del'>-	int pad;</div><div class='ctx'> </div><div class='del'>-	read-&gt;rd_vlen = xdr_reserve_space_vec(xdr, resp-&gt;rqstp-&gt;rq_vec, maxcount);</div><div class='del'>-	if (read-&gt;rd_vlen &lt; 0)</div><div class='del'>-		return nfserr_resource;</div><div class='del'>-</div><div class='del'>-	nfserr = nfsd_readv(resp-&gt;rqstp, read-&gt;rd_fhp, file, read-&gt;rd_offset,</div><div class='del'>-			    resp-&gt;rqstp-&gt;rq_vec, read-&gt;rd_vlen, &amp;maxcount,</div><div class='del'>-			    &amp;eof);</div><div class='add'>+	nfserr = nfsd_iter_read(resp-&gt;rqstp, read-&gt;rd_fhp, read-&gt;rd_nf,</div><div class='add'>+				read-&gt;rd_offset, &amp;maxcount, base,</div><div class='add'>+				&amp;read-&gt;rd_eof);</div><div class='ctx'> 	read-&gt;rd_length = maxcount;</div><div class='ctx'> 	if (nfserr)</div><div class='ctx'> 		return nfserr;</div><div class='del'>-	if (svc_encode_result_payload(resp-&gt;rqstp, starting_len + 8, maxcount))</div><div class='del'>-		return nfserr_io;</div><div class='del'>-	xdr_truncate_encode(xdr, starting_len + 8 + xdr_align_size(maxcount));</div><div class='ctx'> </div><div class='del'>-	tmp = htonl(eof);</div><div class='del'>-	write_bytes_to_xdr_buf(xdr-&gt;buf, starting_len    , &amp;tmp, 4);</div><div class='del'>-	tmp = htonl(maxcount);</div><div class='del'>-	write_bytes_to_xdr_buf(xdr-&gt;buf, starting_len + 4, &amp;tmp, 4);</div><div class='add'>+	/*</div><div class='add'>+	 * svcxdr_encode_opaque_pages() is not used here because</div><div class='add'>+	 * we don't want to encode subsequent results in this</div><div class='add'>+	 * COMPOUND into the xdr-&gt;buf's tail, but rather those</div><div class='add'>+	 * results should follow the NFS READ payload in the</div><div class='add'>+	 * buf's pages.</div><div class='add'>+	 */</div><div class='add'>+	if (xdr_reserve_space_vec(xdr, maxcount) &lt; 0)</div><div class='add'>+		return nfserr_resource;</div><div class='ctx'> </div><div class='del'>-	tmp = xdr_zero;</div><div class='del'>-	pad = (maxcount&amp;3) ? 4 - (maxcount&amp;3) : 0;</div><div class='del'>-	write_bytes_to_xdr_buf(xdr-&gt;buf, starting_len + 8 + maxcount,</div><div class='del'>-								&amp;tmp, pad);</div><div class='del'>-	return 0;</div><div class='add'>+	/*</div><div class='add'>+	 * Mark the buffer location of the NFS READ payload so that</div><div class='add'>+	 * direct placement-capable transports send only the</div><div class='add'>+	 * payload bytes out-of-band.</div><div class='add'>+	 */</div><div class='add'>+	if (svc_encode_result_payload(resp-&gt;rqstp, starting_len, maxcount))</div><div class='add'>+		return nfserr_io;</div><div class='ctx'> </div><div class='add'>+	write_bytes_to_xdr_buf(xdr-&gt;buf, starting_len + maxcount, &amp;zero,</div><div class='add'>+			       xdr_pad_size(maxcount));</div><div class='add'>+	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_encode_read(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='del'>-		  struct nfsd4_read *read)</div><div class='add'>+		  union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='del'>-	unsigned long maxcount;</div><div class='add'>+	struct nfsd4_compoundargs *argp = resp-&gt;rqstp-&gt;rq_argp;</div><div class='add'>+	struct nfsd4_read *read = &amp;u-&gt;read;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='add'>+	bool splice_ok = argp-&gt;splice_ok;</div><div class='add'>+	unsigned int eof_offset;</div><div class='add'>+	unsigned long maxcount;</div><div class='add'>+	__be32 wire_data[2];</div><div class='ctx'> 	struct file *file;</div><div class='del'>-	int starting_len = xdr-&gt;buf-&gt;len;</div><div class='del'>-	__be32 *p;</div><div class='ctx'> </div><div class='ctx'> 	if (nfserr)</div><div class='ctx'> 		return nfserr;</div><div class='add'>+</div><div class='add'>+	eof_offset = xdr-&gt;buf-&gt;len;</div><div class='ctx'> 	file = read-&gt;rd_nf-&gt;nf_file;</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, 8); /* eof flag and byte count */</div><div class='del'>-	if (!p) {</div><div class='del'>-		WARN_ON_ONCE(test_bit(RQ_SPLICE_OK, &amp;resp-&gt;rqstp-&gt;rq_flags));</div><div class='del'>-		return nfserr_resource;</div><div class='del'>-	}</div><div class='del'>-	if (resp-&gt;xdr-&gt;buf-&gt;page_len &amp;&amp;</div><div class='del'>-	    test_bit(RQ_SPLICE_OK, &amp;resp-&gt;rqstp-&gt;rq_flags)) {</div><div class='del'>-		WARN_ON_ONCE(1);</div><div class='add'>+	/* Reserve space for the eof flag and byte count */</div><div class='add'>+	if (unlikely(!xdr_reserve_space(xdr, XDR_UNIT * 2))) {</div><div class='add'>+		WARN_ON_ONCE(splice_ok);</div><div class='ctx'> 		return nfserr_resource;</div><div class='ctx'> 	}</div><div class='ctx'> 	xdr_commit_encode(xdr);</div><div class='ctx'> </div><div class='del'>-	maxcount = svc_max_payload(resp-&gt;rqstp);</div><div class='del'>-	maxcount = min_t(unsigned long, maxcount,</div><div class='add'>+	maxcount = min_t(unsigned long, read-&gt;rd_length,</div><div class='ctx'> 			 (xdr-&gt;buf-&gt;buflen - xdr-&gt;buf-&gt;len));</div><div class='del'>-	maxcount = min_t(unsigned long, maxcount, read-&gt;rd_length);</div><div class='ctx'> </div><div class='del'>-	if (file-&gt;f_op-&gt;splice_read &amp;&amp;</div><div class='del'>-	    test_bit(RQ_SPLICE_OK, &amp;resp-&gt;rqstp-&gt;rq_flags))</div><div class='add'>+	if (file-&gt;f_op-&gt;splice_read &amp;&amp; splice_ok)</div><div class='ctx'> 		nfserr = nfsd4_encode_splice_read(resp, read, file, maxcount);</div><div class='ctx'> 	else</div><div class='del'>-		nfserr = nfsd4_encode_readv(resp, read, file, maxcount);</div><div class='del'>-</div><div class='del'>-	if (nfserr)</div><div class='del'>-		xdr_truncate_encode(xdr, starting_len);</div><div class='add'>+		nfserr = nfsd4_encode_readv(resp, read, maxcount);</div><div class='add'>+	if (nfserr) {</div><div class='add'>+		xdr_truncate_encode(xdr, eof_offset);</div><div class='add'>+		return nfserr;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='del'>-	return nfserr;</div><div class='add'>+	wire_data[0] = read-&gt;rd_eof ? xdr_one : xdr_zero;</div><div class='add'>+	wire_data[1] = cpu_to_be32(read-&gt;rd_length);</div><div class='add'>+	write_bytes_to_xdr_buf(xdr-&gt;buf, eof_offset, &amp;wire_data, XDR_UNIT * 2);</div><div class='add'>+	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_readlink(struct nfsd4_compoundres *resp, __be32 nfserr, struct nfsd4_readlink *readlink)</div><div class='add'>+nfsd4_encode_readlink(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+		      union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='del'>-	int maxcount;</div><div class='del'>-	__be32 wire_count;</div><div class='del'>-	int zero = 0;</div><div class='add'>+	struct nfsd4_readlink *readlink = &amp;u-&gt;readlink;</div><div class='add'>+	__be32 *p, wire_count, zero = xdr_zero;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='del'>-	int length_offset = xdr-&gt;buf-&gt;len;</div><div class='del'>-	int status;</div><div class='del'>-	__be32 *p;</div><div class='add'>+	unsigned int length_offset;</div><div class='add'>+	int maxcount, status;</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, 4);</div><div class='del'>-	if (!p)</div><div class='add'>+	/* linktext4.count */</div><div class='add'>+	length_offset = xdr-&gt;buf-&gt;len;</div><div class='add'>+	if (unlikely(!xdr_reserve_space(xdr, XDR_UNIT)))</div><div class='ctx'> 		return nfserr_resource;</div><div class='del'>-	maxcount = PAGE_SIZE;</div><div class='ctx'> </div><div class='add'>+	/* linktext4.data */</div><div class='add'>+	maxcount = PAGE_SIZE;</div><div class='ctx'> 	p = xdr_reserve_space(xdr, maxcount);</div><div class='ctx'> 	if (!p)</div><div class='ctx'> 		return nfserr_resource;</div><div class='del'>-	/*</div><div class='del'>-	 * XXX: By default, vfs_readlink() will truncate symlinks if they</div><div class='del'>-	 * would overflow the buffer.  Is this kosher in NFSv4?  If not, one</div><div class='del'>-	 * easy fix is: if vfs_readlink() precisely fills the buffer, assume</div><div class='del'>-	 * that truncation occurred, and return NFS4ERR_RESOURCE.</div><div class='del'>-	 */</div><div class='ctx'> 	nfserr = nfsd_readlink(readlink-&gt;rl_rqstp, readlink-&gt;rl_fhp,</div><div class='ctx'> 						(char *)p, &amp;maxcount);</div><div class='ctx'> 	if (nfserr == nfserr_isdir)</div><div class='hunk'>@@ -4055,145 +4587,178 @@ nfsd4_encode_readlink(struct nfsd4_compoundres *resp, __be32 nfserr, struct nfsd</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	wire_count = htonl(maxcount);</div><div class='del'>-	write_bytes_to_xdr_buf(xdr-&gt;buf, length_offset, &amp;wire_count, 4);</div><div class='del'>-	xdr_truncate_encode(xdr, length_offset + 4 + ALIGN(maxcount, 4));</div><div class='del'>-	if (maxcount &amp; 3)</div><div class='del'>-		write_bytes_to_xdr_buf(xdr-&gt;buf, length_offset + 4 + maxcount,</div><div class='del'>-						&amp;zero, 4 - (maxcount&amp;3));</div><div class='del'>-	return 0;</div><div class='add'>+	wire_count = cpu_to_be32(maxcount);</div><div class='add'>+	write_bytes_to_xdr_buf(xdr-&gt;buf, length_offset, &amp;wire_count, XDR_UNIT);</div><div class='add'>+	xdr_truncate_encode(xdr, length_offset + 4 + xdr_align_size(maxcount));</div><div class='add'>+	write_bytes_to_xdr_buf(xdr-&gt;buf, length_offset + 4 + maxcount, &amp;zero,</div><div class='add'>+			       xdr_pad_size(maxcount));</div><div class='add'>+	return nfs_ok;</div><div class='ctx'> </div><div class='ctx'> out_err:</div><div class='ctx'> 	xdr_truncate_encode(xdr, length_offset);</div><div class='ctx'> 	return nfserr;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static __be32</div><div class='del'>-nfsd4_encode_readdir(struct nfsd4_compoundres *resp, __be32 nfserr, struct nfsd4_readdir *readdir)</div><div class='add'>+static __be32 nfsd4_encode_dirlist4(struct xdr_stream *xdr,</div><div class='add'>+				    struct nfsd4_readdir *readdir,</div><div class='add'>+				    u32 max_payload)</div><div class='ctx'> {</div><div class='del'>-	int maxcount;</div><div class='del'>-	int bytes_left;</div><div class='add'>+	int bytes_left, maxcount, starting_len = xdr-&gt;buf-&gt;len;</div><div class='ctx'> 	loff_t offset;</div><div class='del'>-	__be64 wire_offset;</div><div class='del'>-	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='del'>-	int starting_len = xdr-&gt;buf-&gt;len;</div><div class='del'>-	__be32 *p;</div><div class='del'>-</div><div class='del'>-	p = xdr_reserve_space(xdr, NFS4_VERIFIER_SIZE);</div><div class='del'>-	if (!p)</div><div class='del'>-		return nfserr_resource;</div><div class='del'>-</div><div class='del'>-	/* XXX: Following NFSv3, we ignore the READDIR verifier for now. */</div><div class='del'>-	*p++ = cpu_to_be32(0);</div><div class='del'>-	*p++ = cpu_to_be32(0);</div><div class='del'>-	xdr-&gt;buf-&gt;head[0].iov_len = (char *)xdr-&gt;p -</div><div class='del'>-				    (char *)xdr-&gt;buf-&gt;head[0].iov_base;</div><div class='add'>+	__be32 status;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Number of bytes left for directory entries allowing for the</div><div class='del'>-	 * final 8 bytes of the readdir and a following failed op:</div><div class='add'>+	 * final 8 bytes of the readdir and a following failed op.</div><div class='ctx'> 	 */</div><div class='del'>-	bytes_left = xdr-&gt;buf-&gt;buflen - xdr-&gt;buf-&gt;len</div><div class='del'>-			- COMPOUND_ERR_SLACK_SPACE - 8;</div><div class='del'>-	if (bytes_left &lt; 0) {</div><div class='del'>-		nfserr = nfserr_resource;</div><div class='del'>-		goto err_no_verf;</div><div class='del'>-	}</div><div class='del'>-	maxcount = svc_max_payload(resp-&gt;rqstp);</div><div class='del'>-	maxcount = min_t(u32, readdir-&gt;rd_maxcount, maxcount);</div><div class='add'>+	bytes_left = xdr-&gt;buf-&gt;buflen - xdr-&gt;buf-&gt;len -</div><div class='add'>+		COMPOUND_ERR_SLACK_SPACE - XDR_UNIT * 2;</div><div class='add'>+	if (bytes_left &lt; 0)</div><div class='add'>+		return nfserr_resource;</div><div class='add'>+	maxcount = min_t(u32, readdir-&gt;rd_maxcount, max_payload);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='del'>-	 * Note the rfc defines rd_maxcount as the size of the</div><div class='del'>-	 * READDIR4resok structure, which includes the verifier above</div><div class='del'>-	 * and the 8 bytes encoded at the end of this function:</div><div class='add'>+	 * The RFC defines rd_maxcount as the size of the</div><div class='add'>+	 * READDIR4resok structure, which includes the verifier</div><div class='add'>+	 * and the 8 bytes encoded at the end of this function.</div><div class='ctx'> 	 */</div><div class='del'>-	if (maxcount &lt; 16) {</div><div class='del'>-		nfserr = nfserr_toosmall;</div><div class='del'>-		goto err_no_verf;</div><div class='del'>-	}</div><div class='del'>-	maxcount = min_t(int, maxcount-16, bytes_left);</div><div class='add'>+	if (maxcount &lt; XDR_UNIT * 4)</div><div class='add'>+		return nfserr_toosmall;</div><div class='add'>+	maxcount = min_t(int, maxcount - XDR_UNIT * 4, bytes_left);</div><div class='ctx'> </div><div class='del'>-	/* RFC 3530 14.2.24 allows us to ignore dircount when it's 0: */</div><div class='add'>+	/* RFC 3530 14.2.24 allows us to ignore dircount when it's 0 */</div><div class='ctx'> 	if (!readdir-&gt;rd_dircount)</div><div class='del'>-		readdir-&gt;rd_dircount = svc_max_payload(resp-&gt;rqstp);</div><div class='add'>+		readdir-&gt;rd_dircount = max_payload;</div><div class='ctx'> </div><div class='add'>+	/* *entries */</div><div class='ctx'> 	readdir-&gt;xdr = xdr;</div><div class='ctx'> 	readdir-&gt;rd_maxcount = maxcount;</div><div class='ctx'> 	readdir-&gt;common.err = 0;</div><div class='ctx'> 	readdir-&gt;cookie_offset = 0;</div><div class='del'>-</div><div class='ctx'> 	offset = readdir-&gt;rd_cookie;</div><div class='del'>-	nfserr = nfsd_readdir(readdir-&gt;rd_rqstp, readdir-&gt;rd_fhp,</div><div class='del'>-			      &amp;offset,</div><div class='del'>-			      &amp;readdir-&gt;common, nfsd4_encode_dirent);</div><div class='del'>-	if (nfserr == nfs_ok &amp;&amp;</div><div class='del'>-	    readdir-&gt;common.err == nfserr_toosmall &amp;&amp;</div><div class='del'>-	    xdr-&gt;buf-&gt;len == starting_len + 8) {</div><div class='del'>-		/* nothing encoded; which limit did we hit?: */</div><div class='del'>-		if (maxcount - 16 &lt; bytes_left)</div><div class='del'>-			/* It was the fault of rd_maxcount: */</div><div class='del'>-			nfserr = nfserr_toosmall;</div><div class='del'>-		else</div><div class='del'>-			/* We ran out of buffer space: */</div><div class='del'>-			nfserr = nfserr_resource;</div><div class='add'>+	status = nfsd_readdir(readdir-&gt;rd_rqstp, readdir-&gt;rd_fhp, &amp;offset,</div><div class='add'>+			      &amp;readdir-&gt;common, nfsd4_encode_entry4);</div><div class='add'>+	if (status)</div><div class='add'>+		return status;</div><div class='add'>+	if (readdir-&gt;common.err == nfserr_toosmall &amp;&amp;</div><div class='add'>+	    xdr-&gt;buf-&gt;len == starting_len) {</div><div class='add'>+		/* No entries were encoded. Which limit did we hit? */</div><div class='add'>+		if (maxcount - XDR_UNIT * 4 &lt; bytes_left)</div><div class='add'>+			/* It was the fault of rd_maxcount */</div><div class='add'>+			return nfserr_toosmall;</div><div class='add'>+		/* We ran out of buffer space */</div><div class='add'>+		return nfserr_resource;</div><div class='ctx'> 	}</div><div class='del'>-	if (nfserr)</div><div class='del'>-		goto err_no_verf;</div><div class='add'>+	/* Encode the final entry's cookie value */</div><div class='add'>+	nfsd4_encode_entry4_nfs_cookie4(readdir, offset);</div><div class='add'>+	/* No entries follow */</div><div class='add'>+	if (xdr_stream_encode_item_absent(xdr) != XDR_UNIT)</div><div class='add'>+		return nfserr_resource;</div><div class='ctx'> </div><div class='del'>-	if (readdir-&gt;cookie_offset) {</div><div class='del'>-		wire_offset = cpu_to_be64(offset);</div><div class='del'>-		write_bytes_to_xdr_buf(xdr-&gt;buf, readdir-&gt;cookie_offset,</div><div class='del'>-							&amp;wire_offset, 8);</div><div class='del'>-	}</div><div class='add'>+	/* eof */</div><div class='add'>+	return nfsd4_encode_bool(xdr, readdir-&gt;common.err == nfserr_eof);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, 8);</div><div class='del'>-	if (!p) {</div><div class='del'>-		WARN_ON_ONCE(1);</div><div class='del'>-		goto err_no_verf;</div><div class='del'>-	}</div><div class='del'>-	*p++ = 0;	/* no more entries */</div><div class='del'>-	*p++ = htonl(readdir-&gt;common.err == nfserr_eof);</div><div class='add'>+static __be32</div><div class='add'>+nfsd4_encode_readdir(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+		     union nfsd4_op_u *u)</div><div class='add'>+{</div><div class='add'>+	struct nfsd4_readdir *readdir = &amp;u-&gt;readdir;</div><div class='add'>+	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='add'>+	int starting_len = xdr-&gt;buf-&gt;len;</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='del'>-err_no_verf:</div><div class='del'>-	xdr_truncate_encode(xdr, starting_len);</div><div class='add'>+	/* cookieverf */</div><div class='add'>+	nfserr = nfsd4_encode_verifier4(xdr, &amp;readdir-&gt;rd_verf);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='add'>+</div><div class='add'>+	/* reply */</div><div class='add'>+	nfserr = nfsd4_encode_dirlist4(xdr, readdir, svc_max_payload(resp-&gt;rqstp));</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		xdr_truncate_encode(xdr, starting_len);</div><div class='ctx'> 	return nfserr;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_remove(struct nfsd4_compoundres *resp, __be32 nfserr, struct nfsd4_remove *remove)</div><div class='add'>+nfsd4_encode_remove(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+		    union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_remove *remove = &amp;u-&gt;remove;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='del'>-	__be32 *p;</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, 20);</div><div class='del'>-	if (!p)</div><div class='del'>-		return nfserr_resource;</div><div class='del'>-	p = encode_cinfo(p, &amp;remove-&gt;rm_cinfo);</div><div class='del'>-	return 0;</div><div class='add'>+	return nfsd4_encode_change_info4(xdr, &amp;remove-&gt;rm_cinfo);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_rename(struct nfsd4_compoundres *resp, __be32 nfserr, struct nfsd4_rename *rename)</div><div class='add'>+nfsd4_encode_rename(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+		    union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_rename *rename = &amp;u-&gt;rename;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='del'>-	__be32 *p;</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, 40);</div><div class='del'>-	if (!p)</div><div class='add'>+	nfserr = nfsd4_encode_change_info4(xdr, &amp;rename-&gt;rn_sinfo);</div><div class='add'>+	if (nfserr)</div><div class='add'>+		return nfserr;</div><div class='add'>+	return nfsd4_encode_change_info4(xdr, &amp;rename-&gt;rn_tinfo);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32</div><div class='add'>+nfsd4_encode_rpcsec_gss_info(struct xdr_stream *xdr,</div><div class='add'>+			     struct rpcsec_gss_info *info)</div><div class='add'>+{</div><div class='add'>+	__be32 status;</div><div class='add'>+</div><div class='add'>+	/* oid */</div><div class='add'>+	if (xdr_stream_encode_opaque(xdr, info-&gt;oid.data, info-&gt;oid.len) &lt; 0)</div><div class='ctx'> 		return nfserr_resource;</div><div class='del'>-	p = encode_cinfo(p, &amp;rename-&gt;rn_sinfo);</div><div class='del'>-	p = encode_cinfo(p, &amp;rename-&gt;rn_tinfo);</div><div class='del'>-	return 0;</div><div class='add'>+	/* qop */</div><div class='add'>+	status = nfsd4_encode_qop4(xdr, info-&gt;qop);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	/* service */</div><div class='add'>+	if (xdr_stream_encode_u32(xdr, info-&gt;service) != XDR_UNIT)</div><div class='add'>+		return nfserr_resource;</div><div class='add'>+</div><div class='add'>+	return nfs_ok;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32</div><div class='add'>+nfsd4_encode_secinfo4(struct xdr_stream *xdr, rpc_authflavor_t pf,</div><div class='add'>+		      u32 *supported)</div><div class='add'>+{</div><div class='add'>+	struct rpcsec_gss_info info;</div><div class='add'>+	__be32 status;</div><div class='add'>+</div><div class='add'>+	if (rpcauth_get_gssinfo(pf, &amp;info) == 0) {</div><div class='add'>+		(*supported)++;</div><div class='add'>+</div><div class='add'>+		/* flavor */</div><div class='add'>+		status = nfsd4_encode_uint32_t(xdr, RPC_AUTH_GSS);</div><div class='add'>+		if (status != nfs_ok)</div><div class='add'>+			return status;</div><div class='add'>+		/* flavor_info */</div><div class='add'>+		status = nfsd4_encode_rpcsec_gss_info(xdr, &amp;info);</div><div class='add'>+		if (status != nfs_ok)</div><div class='add'>+			return status;</div><div class='add'>+	} else if (pf &lt; RPC_AUTH_MAXFLAVOR) {</div><div class='add'>+		(*supported)++;</div><div class='add'>+</div><div class='add'>+		/* flavor */</div><div class='add'>+		status = nfsd4_encode_uint32_t(xdr, pf);</div><div class='add'>+		if (status != nfs_ok)</div><div class='add'>+			return status;</div><div class='add'>+	}</div><div class='add'>+	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_do_encode_secinfo(struct xdr_stream *xdr, struct svc_export *exp)</div><div class='add'>+nfsd4_encode_SECINFO4resok(struct xdr_stream *xdr, struct svc_export *exp)</div><div class='ctx'> {</div><div class='ctx'> 	u32 i, nflavs, supported;</div><div class='ctx'> 	struct exp_flavor_info *flavs;</div><div class='ctx'> 	struct exp_flavor_info def_flavs[2];</div><div class='del'>-	__be32 *p, *flavorsp;</div><div class='del'>-	static bool report = true;</div><div class='add'>+	unsigned int count_offset;</div><div class='add'>+	__be32 status, wire_count;</div><div class='ctx'> </div><div class='ctx'> 	if (exp-&gt;ex_nflavors) {</div><div class='ctx'> 		flavs = exp-&gt;ex_flavors;</div><div class='hunk'>@@ -4215,727 +4780,735 @@ nfsd4_do_encode_secinfo(struct xdr_stream *xdr, struct svc_export *exp)</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	supported = 0;</div><div class='del'>-	p = xdr_reserve_space(xdr, 4);</div><div class='del'>-	if (!p)</div><div class='add'>+	count_offset = xdr-&gt;buf-&gt;len;</div><div class='add'>+	if (unlikely(!xdr_reserve_space(xdr, XDR_UNIT)))</div><div class='ctx'> 		return nfserr_resource;</div><div class='del'>-	flavorsp = p++;		/* to be backfilled later */</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; nflavs; i++) {</div><div class='del'>-		rpc_authflavor_t pf = flavs[i].pseudoflavor;</div><div class='del'>-		struct rpcsec_gss_info info;</div><div class='ctx'> </div><div class='del'>-		if (rpcauth_get_gssinfo(pf, &amp;info) == 0) {</div><div class='del'>-			supported++;</div><div class='del'>-			p = xdr_reserve_space(xdr, 4 + 4 +</div><div class='del'>-					      XDR_LEN(info.oid.len) + 4 + 4);</div><div class='del'>-			if (!p)</div><div class='del'>-				return nfserr_resource;</div><div class='del'>-			*p++ = cpu_to_be32(RPC_AUTH_GSS);</div><div class='del'>-			p = xdr_encode_opaque(p,  info.oid.data, info.oid.len);</div><div class='del'>-			*p++ = cpu_to_be32(info.qop);</div><div class='del'>-			*p++ = cpu_to_be32(info.service);</div><div class='del'>-		} else if (pf &lt; RPC_AUTH_MAXFLAVOR) {</div><div class='del'>-			supported++;</div><div class='del'>-			p = xdr_reserve_space(xdr, 4);</div><div class='del'>-			if (!p)</div><div class='del'>-				return nfserr_resource;</div><div class='del'>-			*p++ = cpu_to_be32(pf);</div><div class='del'>-		} else {</div><div class='del'>-			if (report)</div><div class='del'>-				pr_warn("NFS: SECINFO: security flavor %u "</div><div class='del'>-					"is not supported\n", pf);</div><div class='del'>-		}</div><div class='add'>+	for (i = 0, supported = 0; i &lt; nflavs; i++) {</div><div class='add'>+		status = nfsd4_encode_secinfo4(xdr, flavs[i].pseudoflavor,</div><div class='add'>+					       &amp;supported);</div><div class='add'>+		if (status != nfs_ok)</div><div class='add'>+			return status;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (nflavs != supported)</div><div class='del'>-		report = false;</div><div class='del'>-	*flavorsp = htonl(supported);</div><div class='add'>+	wire_count = cpu_to_be32(supported);</div><div class='add'>+	write_bytes_to_xdr_buf(xdr-&gt;buf, count_offset, &amp;wire_count,</div><div class='add'>+			       XDR_UNIT);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_encode_secinfo(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='del'>-		     struct nfsd4_secinfo *secinfo)</div><div class='add'>+		     union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_secinfo *secinfo = &amp;u-&gt;secinfo;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='ctx'> </div><div class='del'>-	return nfsd4_do_encode_secinfo(xdr, secinfo-&gt;si_exp);</div><div class='add'>+	return nfsd4_encode_SECINFO4resok(xdr, secinfo-&gt;si_exp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_encode_secinfo_no_name(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='del'>-		     struct nfsd4_secinfo_no_name *secinfo)</div><div class='add'>+		     union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_secinfo_no_name *secinfo = &amp;u-&gt;secinfo_no_name;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='ctx'> </div><div class='del'>-	return nfsd4_do_encode_secinfo(xdr, secinfo-&gt;sin_exp);</div><div class='add'>+	return nfsd4_encode_SECINFO4resok(xdr, secinfo-&gt;sin_exp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * The SETATTR encode routine is special -- it always encodes a bitmap,</div><div class='del'>- * regardless of the error status.</div><div class='del'>- */</div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_setattr(struct nfsd4_compoundres *resp, __be32 nfserr, struct nfsd4_setattr *setattr)</div><div class='add'>+nfsd4_encode_setattr(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+		     union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='del'>-	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='del'>-	__be32 *p;</div><div class='add'>+	struct nfsd4_setattr *setattr = &amp;u-&gt;setattr;</div><div class='add'>+	__be32 status;</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, 16);</div><div class='del'>-	if (!p)</div><div class='del'>-		return nfserr_resource;</div><div class='del'>-	if (nfserr) {</div><div class='del'>-		*p++ = cpu_to_be32(3);</div><div class='del'>-		*p++ = cpu_to_be32(0);</div><div class='del'>-		*p++ = cpu_to_be32(0);</div><div class='del'>-		*p++ = cpu_to_be32(0);</div><div class='del'>-	}</div><div class='del'>-	else {</div><div class='del'>-		*p++ = cpu_to_be32(3);</div><div class='del'>-		*p++ = cpu_to_be32(setattr-&gt;sa_bmval[0]);</div><div class='del'>-		*p++ = cpu_to_be32(setattr-&gt;sa_bmval[1]);</div><div class='del'>-		*p++ = cpu_to_be32(setattr-&gt;sa_bmval[2]);</div><div class='add'>+	switch (nfserr) {</div><div class='add'>+	case nfs_ok:</div><div class='add'>+		/* attrsset */</div><div class='add'>+		status = nfsd4_encode_bitmap4(resp-&gt;xdr, setattr-&gt;sa_bmval[0],</div><div class='add'>+					      setattr-&gt;sa_bmval[1],</div><div class='add'>+					      setattr-&gt;sa_bmval[2]);</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		/* attrsset */</div><div class='add'>+		status = nfsd4_encode_bitmap4(resp-&gt;xdr, 0, 0, 0);</div><div class='ctx'> 	}</div><div class='del'>-	return nfserr;</div><div class='add'>+	return status != nfs_ok ? status : nfserr;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_setclientid(struct nfsd4_compoundres *resp, __be32 nfserr, struct nfsd4_setclientid *scd)</div><div class='add'>+nfsd4_encode_setclientid(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+			 union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_setclientid *scd = &amp;u-&gt;setclientid;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='del'>-	__be32 *p;</div><div class='ctx'> </div><div class='ctx'> 	if (!nfserr) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 8 + NFS4_VERIFIER_SIZE);</div><div class='del'>-		if (!p)</div><div class='del'>-			return nfserr_resource;</div><div class='del'>-		p = xdr_encode_opaque_fixed(p, &amp;scd-&gt;se_clientid, 8);</div><div class='del'>-		p = xdr_encode_opaque_fixed(p, &amp;scd-&gt;se_confirm,</div><div class='del'>-						NFS4_VERIFIER_SIZE);</div><div class='del'>-	}</div><div class='del'>-	else if (nfserr == nfserr_clid_inuse) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 8);</div><div class='del'>-		if (!p)</div><div class='del'>-			return nfserr_resource;</div><div class='del'>-		*p++ = cpu_to_be32(0);</div><div class='del'>-		*p++ = cpu_to_be32(0);</div><div class='add'>+		nfserr = nfsd4_encode_clientid4(xdr, &amp;scd-&gt;se_clientid);</div><div class='add'>+		if (nfserr != nfs_ok)</div><div class='add'>+			goto out;</div><div class='add'>+		nfserr = nfsd4_encode_verifier4(xdr, &amp;scd-&gt;se_confirm);</div><div class='add'>+	} else if (nfserr == nfserr_clid_inuse) {</div><div class='add'>+		/* empty network id */</div><div class='add'>+		if (xdr_stream_encode_u32(xdr, 0) &lt; 0) {</div><div class='add'>+			nfserr = nfserr_resource;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='add'>+		/* empty universal address */</div><div class='add'>+		if (xdr_stream_encode_u32(xdr, 0) &lt; 0) {</div><div class='add'>+			nfserr = nfserr_resource;</div><div class='add'>+			goto out;</div><div class='add'>+		}</div><div class='ctx'> 	}</div><div class='add'>+out:</div><div class='ctx'> 	return nfserr;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_write(struct nfsd4_compoundres *resp, __be32 nfserr, struct nfsd4_write *write)</div><div class='add'>+nfsd4_encode_write(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+		   union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_write *write = &amp;u-&gt;write;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='del'>-	__be32 *p;</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, 16);</div><div class='del'>-	if (!p)</div><div class='add'>+	/* count */</div><div class='add'>+	nfserr = nfsd4_encode_count4(xdr, write-&gt;wr_bytes_written);</div><div class='add'>+	if (nfserr)</div><div class='add'>+		return nfserr;</div><div class='add'>+	/* committed */</div><div class='add'>+	if (xdr_stream_encode_u32(xdr, write-&gt;wr_how_written) != XDR_UNIT)</div><div class='ctx'> 		return nfserr_resource;</div><div class='del'>-	*p++ = cpu_to_be32(write-&gt;wr_bytes_written);</div><div class='del'>-	*p++ = cpu_to_be32(write-&gt;wr_how_written);</div><div class='del'>-	p = xdr_encode_opaque_fixed(p, write-&gt;wr_verifier.data,</div><div class='del'>-						NFS4_VERIFIER_SIZE);</div><div class='del'>-	return 0;</div><div class='add'>+	/* writeverf */</div><div class='add'>+	return nfsd4_encode_verifier4(xdr, &amp;write-&gt;wr_verifier);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_exchange_id(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='del'>-			 struct nfsd4_exchange_id *exid)</div><div class='add'>+nfsd4_encode_state_protect_ops4(struct xdr_stream *xdr,</div><div class='add'>+				struct nfsd4_exchange_id *exid)</div><div class='ctx'> {</div><div class='del'>-	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='del'>-	__be32 *p;</div><div class='del'>-	char *major_id;</div><div class='del'>-	char *server_scope;</div><div class='del'>-	int major_id_sz;</div><div class='del'>-	int server_scope_sz;</div><div class='del'>-	uint64_t minor_id = 0;</div><div class='del'>-	struct nfsd_net *nn = net_generic(SVC_NET(resp-&gt;rqstp), nfsd_net_id);</div><div class='del'>-</div><div class='del'>-	major_id = nn-&gt;nfsd_name;</div><div class='del'>-	major_id_sz = strlen(nn-&gt;nfsd_name);</div><div class='del'>-	server_scope = nn-&gt;nfsd_name;</div><div class='del'>-	server_scope_sz = strlen(nn-&gt;nfsd_name);</div><div class='del'>-</div><div class='del'>-	p = xdr_reserve_space(xdr,</div><div class='del'>-		8 /* eir_clientid */ +</div><div class='del'>-		4 /* eir_sequenceid */ +</div><div class='del'>-		4 /* eir_flags */ +</div><div class='del'>-		4 /* spr_how */);</div><div class='del'>-	if (!p)</div><div class='del'>-		return nfserr_resource;</div><div class='add'>+	__be32 status;</div><div class='ctx'> </div><div class='del'>-	p = xdr_encode_opaque_fixed(p, &amp;exid-&gt;clientid, 8);</div><div class='del'>-	*p++ = cpu_to_be32(exid-&gt;seqid);</div><div class='del'>-	*p++ = cpu_to_be32(exid-&gt;flags);</div><div class='add'>+	/* spo_must_enforce */</div><div class='add'>+	status = nfsd4_encode_bitmap4(xdr, exid-&gt;spo_must_enforce[0],</div><div class='add'>+				      exid-&gt;spo_must_enforce[1],</div><div class='add'>+				      exid-&gt;spo_must_enforce[2]);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	/* spo_must_allow */</div><div class='add'>+	return nfsd4_encode_bitmap4(xdr, exid-&gt;spo_must_allow[0],</div><div class='add'>+				    exid-&gt;spo_must_allow[1],</div><div class='add'>+				    exid-&gt;spo_must_allow[2]);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	*p++ = cpu_to_be32(exid-&gt;spa_how);</div><div class='add'>+static __be32</div><div class='add'>+nfsd4_encode_state_protect4_r(struct xdr_stream *xdr, struct nfsd4_exchange_id *exid)</div><div class='add'>+{</div><div class='add'>+	__be32 status;</div><div class='ctx'> </div><div class='add'>+	if (xdr_stream_encode_u32(xdr, exid-&gt;spa_how) != XDR_UNIT)</div><div class='add'>+		return nfserr_resource;</div><div class='ctx'> 	switch (exid-&gt;spa_how) {</div><div class='ctx'> 	case SP4_NONE:</div><div class='add'>+		status = nfs_ok;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case SP4_MACH_CRED:</div><div class='del'>-		/* spo_must_enforce bitmap: */</div><div class='del'>-		nfserr = nfsd4_encode_bitmap(xdr,</div><div class='del'>-					exid-&gt;spo_must_enforce[0],</div><div class='del'>-					exid-&gt;spo_must_enforce[1],</div><div class='del'>-					exid-&gt;spo_must_enforce[2]);</div><div class='del'>-		if (nfserr)</div><div class='del'>-			return nfserr;</div><div class='del'>-		/* spo_must_allow bitmap: */</div><div class='del'>-		nfserr = nfsd4_encode_bitmap(xdr,</div><div class='del'>-					exid-&gt;spo_must_allow[0],</div><div class='del'>-					exid-&gt;spo_must_allow[1],</div><div class='del'>-					exid-&gt;spo_must_allow[2]);</div><div class='del'>-		if (nfserr)</div><div class='del'>-			return nfserr;</div><div class='add'>+		/* spr_mach_ops */</div><div class='add'>+		status = nfsd4_encode_state_protect_ops4(xdr, exid);</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='del'>-		WARN_ON_ONCE(1);</div><div class='add'>+		status = nfserr_serverfault;</div><div class='ctx'> 	}</div><div class='add'>+	return status;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr,</div><div class='del'>-		8 /* so_minor_id */ +</div><div class='del'>-		4 /* so_major_id.len */ +</div><div class='del'>-		(XDR_QUADLEN(major_id_sz) * 4) +</div><div class='del'>-		4 /* eir_server_scope.len */ +</div><div class='del'>-		(XDR_QUADLEN(server_scope_sz) * 4) +</div><div class='del'>-		4 /* eir_server_impl_id.count (0) */);</div><div class='del'>-	if (!p)</div><div class='del'>-		return nfserr_resource;</div><div class='add'>+static __be32</div><div class='add'>+nfsd4_encode_server_owner4(struct xdr_stream *xdr, struct svc_rqst *rqstp)</div><div class='add'>+{</div><div class='add'>+	struct nfsd_net *nn = net_generic(SVC_NET(rqstp), nfsd_net_id);</div><div class='add'>+	__be32 status;</div><div class='ctx'> </div><div class='del'>-	/* The server_owner struct */</div><div class='del'>-	p = xdr_encode_hyper(p, minor_id);      /* Minor id */</div><div class='del'>-	/* major id */</div><div class='del'>-	p = xdr_encode_opaque(p, major_id, major_id_sz);</div><div class='add'>+	/* so_minor_id */</div><div class='add'>+	status = nfsd4_encode_uint64_t(xdr, 0);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	/* so_major_id */</div><div class='add'>+	return nfsd4_encode_opaque(xdr, nn-&gt;nfsd_name, strlen(nn-&gt;nfsd_name));</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	/* Server scope */</div><div class='del'>-	p = xdr_encode_opaque(p, server_scope, server_scope_sz);</div><div class='add'>+static __be32</div><div class='add'>+nfsd4_encode_nfs_impl_id4(struct xdr_stream *xdr, struct nfsd4_exchange_id *exid)</div><div class='add'>+{</div><div class='add'>+	__be32 status;</div><div class='ctx'> </div><div class='del'>-	/* Implementation id */</div><div class='del'>-	*p++ = cpu_to_be32(0);	/* zero length nfs_impl_id4 array */</div><div class='del'>-	return 0;</div><div class='add'>+	/* nii_domain */</div><div class='add'>+	status = nfsd4_encode_opaque(xdr, exid-&gt;nii_domain.data,</div><div class='add'>+				     exid-&gt;nii_domain.len);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	/* nii_name */</div><div class='add'>+	status = nfsd4_encode_opaque(xdr, exid-&gt;nii_name.data,</div><div class='add'>+				     exid-&gt;nii_name.len);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	/* nii_time */</div><div class='add'>+	return nfsd4_encode_nfstime4(xdr, &amp;exid-&gt;nii_time);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_create_session(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='del'>-			    struct nfsd4_create_session *sess)</div><div class='add'>+nfsd4_encode_exchange_id(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+			 union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd_net *nn = net_generic(SVC_NET(resp-&gt;rqstp), nfsd_net_id);</div><div class='add'>+	struct nfsd4_exchange_id *exid = &amp;u-&gt;exchange_id;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='del'>-	__be32 *p;</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, 24);</div><div class='del'>-	if (!p)</div><div class='add'>+	/* eir_clientid */</div><div class='add'>+	nfserr = nfsd4_encode_clientid4(xdr, &amp;exid-&gt;clientid);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='add'>+	/* eir_sequenceid */</div><div class='add'>+	nfserr = nfsd4_encode_sequenceid4(xdr, exid-&gt;seqid);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='add'>+	/* eir_flags */</div><div class='add'>+	nfserr = nfsd4_encode_uint32_t(xdr, exid-&gt;flags);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='add'>+	/* eir_state_protect */</div><div class='add'>+	nfserr = nfsd4_encode_state_protect4_r(xdr, exid);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='add'>+	/* eir_server_owner */</div><div class='add'>+	nfserr = nfsd4_encode_server_owner4(xdr, resp-&gt;rqstp);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='add'>+	/* eir_server_scope */</div><div class='add'>+	nfserr = nfsd4_encode_opaque(xdr, nn-&gt;nfsd_name,</div><div class='add'>+				     strlen(nn-&gt;nfsd_name));</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='add'>+	/* eir_server_impl_id&lt;1&gt; */</div><div class='add'>+	if (xdr_stream_encode_u32(xdr, 1) != XDR_UNIT)</div><div class='ctx'> 		return nfserr_resource;</div><div class='del'>-	p = xdr_encode_opaque_fixed(p, sess-&gt;sessionid.data,</div><div class='del'>-					NFS4_MAX_SESSIONID_LEN);</div><div class='del'>-	*p++ = cpu_to_be32(sess-&gt;seqid);</div><div class='del'>-	*p++ = cpu_to_be32(sess-&gt;flags);</div><div class='add'>+	nfserr = nfsd4_encode_nfs_impl_id4(xdr, exid);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, 28);</div><div class='del'>-	if (!p)</div><div class='del'>-		return nfserr_resource;</div><div class='del'>-	*p++ = cpu_to_be32(0); /* headerpadsz */</div><div class='del'>-	*p++ = cpu_to_be32(sess-&gt;fore_channel.maxreq_sz);</div><div class='del'>-	*p++ = cpu_to_be32(sess-&gt;fore_channel.maxresp_sz);</div><div class='del'>-	*p++ = cpu_to_be32(sess-&gt;fore_channel.maxresp_cached);</div><div class='del'>-	*p++ = cpu_to_be32(sess-&gt;fore_channel.maxops);</div><div class='del'>-	*p++ = cpu_to_be32(sess-&gt;fore_channel.maxreqs);</div><div class='del'>-	*p++ = cpu_to_be32(sess-&gt;fore_channel.nr_rdma_attrs);</div><div class='del'>-</div><div class='del'>-	if (sess-&gt;fore_channel.nr_rdma_attrs) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			return nfserr_resource;</div><div class='del'>-		*p++ = cpu_to_be32(sess-&gt;fore_channel.rdma_attrs);</div><div class='del'>-	}</div><div class='add'>+	return nfs_ok;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, 28);</div><div class='del'>-	if (!p)</div><div class='add'>+static __be32</div><div class='add'>+nfsd4_encode_channel_attrs4(struct xdr_stream *xdr,</div><div class='add'>+			    const struct nfsd4_channel_attrs *attrs)</div><div class='add'>+{</div><div class='add'>+	__be32 status;</div><div class='add'>+</div><div class='add'>+	/* ca_headerpadsize */</div><div class='add'>+	status = nfsd4_encode_count4(xdr, 0);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	/* ca_maxrequestsize */</div><div class='add'>+	status = nfsd4_encode_count4(xdr, attrs-&gt;maxreq_sz);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	/* ca_maxresponsesize */</div><div class='add'>+	status = nfsd4_encode_count4(xdr, attrs-&gt;maxresp_sz);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	/* ca_maxresponsesize_cached */</div><div class='add'>+	status = nfsd4_encode_count4(xdr, attrs-&gt;maxresp_cached);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	/* ca_maxoperations */</div><div class='add'>+	status = nfsd4_encode_count4(xdr, attrs-&gt;maxops);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	/* ca_maxrequests */</div><div class='add'>+	status = nfsd4_encode_count4(xdr, attrs-&gt;maxreqs);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	/* ca_rdma_ird&lt;1&gt; */</div><div class='add'>+	if (xdr_stream_encode_u32(xdr, attrs-&gt;nr_rdma_attrs) != XDR_UNIT)</div><div class='ctx'> 		return nfserr_resource;</div><div class='del'>-	*p++ = cpu_to_be32(0); /* headerpadsz */</div><div class='del'>-	*p++ = cpu_to_be32(sess-&gt;back_channel.maxreq_sz);</div><div class='del'>-	*p++ = cpu_to_be32(sess-&gt;back_channel.maxresp_sz);</div><div class='del'>-	*p++ = cpu_to_be32(sess-&gt;back_channel.maxresp_cached);</div><div class='del'>-	*p++ = cpu_to_be32(sess-&gt;back_channel.maxops);</div><div class='del'>-	*p++ = cpu_to_be32(sess-&gt;back_channel.maxreqs);</div><div class='del'>-	*p++ = cpu_to_be32(sess-&gt;back_channel.nr_rdma_attrs);</div><div class='del'>-</div><div class='del'>-	if (sess-&gt;back_channel.nr_rdma_attrs) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			return nfserr_resource;</div><div class='del'>-		*p++ = cpu_to_be32(sess-&gt;back_channel.rdma_attrs);</div><div class='del'>-	}</div><div class='del'>-	return 0;</div><div class='add'>+	if (attrs-&gt;nr_rdma_attrs)</div><div class='add'>+		return nfsd4_encode_uint32_t(xdr, attrs-&gt;rdma_attrs);</div><div class='add'>+	return nfs_ok;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32</div><div class='add'>+nfsd4_encode_create_session(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+			    union nfsd4_op_u *u)</div><div class='add'>+{</div><div class='add'>+	struct nfsd4_create_session *sess = &amp;u-&gt;create_session;</div><div class='add'>+	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='add'>+</div><div class='add'>+	/* csr_sessionid */</div><div class='add'>+	nfserr = nfsd4_encode_sessionid4(xdr, &amp;sess-&gt;sessionid);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='add'>+	/* csr_sequence */</div><div class='add'>+	nfserr = nfsd4_encode_sequenceid4(xdr, sess-&gt;seqid);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='add'>+	/* csr_flags */</div><div class='add'>+	nfserr = nfsd4_encode_uint32_t(xdr, sess-&gt;flags);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='add'>+	/* csr_fore_chan_attrs */</div><div class='add'>+	nfserr = nfsd4_encode_channel_attrs4(xdr, &amp;sess-&gt;fore_channel);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='add'>+	/* csr_back_chan_attrs */</div><div class='add'>+	return nfsd4_encode_channel_attrs4(xdr, &amp;sess-&gt;back_channel);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_encode_sequence(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='del'>-		      struct nfsd4_sequence *seq)</div><div class='add'>+		      union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_sequence *seq = &amp;u-&gt;sequence;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='del'>-	__be32 *p;</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, NFS4_MAX_SESSIONID_LEN + 20);</div><div class='del'>-	if (!p)</div><div class='del'>-		return nfserr_resource;</div><div class='del'>-	p = xdr_encode_opaque_fixed(p, seq-&gt;sessionid.data,</div><div class='del'>-					NFS4_MAX_SESSIONID_LEN);</div><div class='del'>-	*p++ = cpu_to_be32(seq-&gt;seqid);</div><div class='del'>-	*p++ = cpu_to_be32(seq-&gt;slotid);</div><div class='add'>+	/* sr_sessionid */</div><div class='add'>+	nfserr = nfsd4_encode_sessionid4(xdr, &amp;seq-&gt;sessionid);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='add'>+	/* sr_sequenceid */</div><div class='add'>+	nfserr = nfsd4_encode_sequenceid4(xdr, seq-&gt;seqid);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='add'>+	/* sr_slotid */</div><div class='add'>+	nfserr = nfsd4_encode_slotid4(xdr, seq-&gt;slotid);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='ctx'> 	/* Note slotid's are numbered from zero: */</div><div class='del'>-	*p++ = cpu_to_be32(seq-&gt;maxslots - 1); /* sr_highest_slotid */</div><div class='del'>-	*p++ = cpu_to_be32(seq-&gt;maxslots - 1); /* sr_target_highest_slotid */</div><div class='del'>-	*p++ = cpu_to_be32(seq-&gt;status_flags);</div><div class='add'>+	/* sr_highest_slotid */</div><div class='add'>+	nfserr = nfsd4_encode_slotid4(xdr, seq-&gt;maxslots_response - 1);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='add'>+	/* sr_target_highest_slotid */</div><div class='add'>+	nfserr = nfsd4_encode_slotid4(xdr, seq-&gt;target_maxslots - 1);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='add'>+	/* sr_status_flags */</div><div class='add'>+	nfserr = nfsd4_encode_uint32_t(xdr, seq-&gt;status_flags);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='ctx'> </div><div class='ctx'> 	resp-&gt;cstate.data_offset = xdr-&gt;buf-&gt;len; /* DRC cache data pointer */</div><div class='del'>-	return 0;</div><div class='add'>+	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_encode_test_stateid(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='del'>-			  struct nfsd4_test_stateid *test_stateid)</div><div class='add'>+			  union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='del'>-	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='add'>+	struct nfsd4_test_stateid *test_stateid = &amp;u-&gt;test_stateid;</div><div class='ctx'> 	struct nfsd4_test_stateid_id *stateid, *next;</div><div class='del'>-	__be32 *p;</div><div class='add'>+	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, 4 + (4 * test_stateid-&gt;ts_num_ids));</div><div class='del'>-	if (!p)</div><div class='add'>+	/* tsr_status_codes&lt;&gt; */</div><div class='add'>+	if (xdr_stream_encode_u32(xdr, test_stateid-&gt;ts_num_ids) != XDR_UNIT)</div><div class='ctx'> 		return nfserr_resource;</div><div class='del'>-	*p++ = htonl(test_stateid-&gt;ts_num_ids);</div><div class='del'>-</div><div class='del'>-	list_for_each_entry_safe(stateid, next, &amp;test_stateid-&gt;ts_stateid_list, ts_id_list) {</div><div class='del'>-		*p++ = stateid-&gt;ts_id_status;</div><div class='add'>+	list_for_each_entry_safe(stateid, next,</div><div class='add'>+				 &amp;test_stateid-&gt;ts_stateid_list, ts_id_list) {</div><div class='add'>+		if (xdr_stream_encode_be32(xdr, stateid-&gt;ts_id_status) != XDR_UNIT)</div><div class='add'>+			return nfserr_resource;</div><div class='ctx'> 	}</div><div class='add'>+	return nfs_ok;</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+static __be32</div><div class='add'>+nfsd4_encode_get_dir_delegation(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+				union nfsd4_op_u *u)</div><div class='add'>+{</div><div class='add'>+	struct nfsd4_get_dir_delegation *gdd = &amp;u-&gt;get_dir_delegation;</div><div class='add'>+	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='add'>+	__be32 status = nfserr_resource;</div><div class='add'>+</div><div class='add'>+	switch(gdd-&gt;gddrnf_status) {</div><div class='add'>+	case GDD4_OK:</div><div class='add'>+		if (xdr_stream_encode_u32(xdr, GDD4_OK) != XDR_UNIT)</div><div class='add'>+			break;</div><div class='add'>+		status = nfsd4_encode_verifier4(xdr, &amp;gdd-&gt;gddr_cookieverf);</div><div class='add'>+		if (status)</div><div class='add'>+			break;</div><div class='add'>+		status = nfsd4_encode_stateid4(xdr, &amp;gdd-&gt;gddr_stateid);</div><div class='add'>+		if (status)</div><div class='add'>+			break;</div><div class='add'>+		status = nfsd4_encode_bitmap4(xdr, gdd-&gt;gddr_notification[0], 0, 0);</div><div class='add'>+		if (status)</div><div class='add'>+			break;</div><div class='add'>+		status = nfsd4_encode_bitmap4(xdr, gdd-&gt;gddr_child_attributes[0],</div><div class='add'>+						   gdd-&gt;gddr_child_attributes[1],</div><div class='add'>+						   gdd-&gt;gddr_child_attributes[2]);</div><div class='add'>+		if (status)</div><div class='add'>+			break;</div><div class='add'>+		status = nfsd4_encode_bitmap4(xdr, gdd-&gt;gddr_dir_attributes[0],</div><div class='add'>+						   gdd-&gt;gddr_dir_attributes[1],</div><div class='add'>+						   gdd-&gt;gddr_dir_attributes[2]);</div><div class='add'>+		break;</div><div class='add'>+	default:</div><div class='add'>+		pr_warn("nfsd: bad gddrnf_status (%u)\n", gdd-&gt;gddrnf_status);</div><div class='add'>+		gdd-&gt;gddrnf_will_signal_deleg_avail = 0;</div><div class='add'>+		fallthrough;</div><div class='add'>+	case GDD4_UNAVAIL:</div><div class='add'>+		if (xdr_stream_encode_u32(xdr, GDD4_UNAVAIL) != XDR_UNIT)</div><div class='add'>+			break;</div><div class='add'>+		status = nfsd4_encode_bool(xdr, gdd-&gt;gddrnf_will_signal_deleg_avail);</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_NFSD_PNFS</div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_getdeviceinfo(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='del'>-		struct nfsd4_getdeviceinfo *gdev)</div><div class='add'>+nfsd4_encode_device_addr4(struct xdr_stream *xdr,</div><div class='add'>+			  const struct nfsd4_getdeviceinfo *gdev)</div><div class='ctx'> {</div><div class='del'>-	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='add'>+	u32 needed_len, starting_len = xdr-&gt;buf-&gt;len;</div><div class='ctx'> 	const struct nfsd4_layout_ops *ops;</div><div class='del'>-	u32 starting_len = xdr-&gt;buf-&gt;len, needed_len;</div><div class='del'>-	__be32 *p;</div><div class='add'>+	__be32 status;</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, 4);</div><div class='del'>-	if (!p)</div><div class='add'>+	/* da_layout_type */</div><div class='add'>+	if (xdr_stream_encode_u32(xdr, gdev-&gt;gd_layout_type) != XDR_UNIT)</div><div class='ctx'> 		return nfserr_resource;</div><div class='del'>-</div><div class='del'>-	*p++ = cpu_to_be32(gdev-&gt;gd_layout_type);</div><div class='del'>-</div><div class='del'>-	/* If maxcount is 0 then just update notifications */</div><div class='del'>-	if (gdev-&gt;gd_maxcount != 0) {</div><div class='del'>-		ops = nfsd4_layout_ops[gdev-&gt;gd_layout_type];</div><div class='del'>-		nfserr = ops-&gt;encode_getdeviceinfo(xdr, gdev);</div><div class='del'>-		if (nfserr) {</div><div class='del'>-			/*</div><div class='del'>-			 * We don't bother to burden the layout drivers with</div><div class='del'>-			 * enforcing gd_maxcount, just tell the client to</div><div class='del'>-			 * come back with a bigger buffer if it's not enough.</div><div class='del'>-			 */</div><div class='del'>-			if (xdr-&gt;buf-&gt;len + 4 &gt; gdev-&gt;gd_maxcount)</div><div class='del'>-				goto toosmall;</div><div class='del'>-			return nfserr;</div><div class='del'>-		}</div><div class='add'>+	/* da_addr_body */</div><div class='add'>+	ops = nfsd4_layout_ops[gdev-&gt;gd_layout_type];</div><div class='add'>+	status = ops-&gt;encode_getdeviceinfo(xdr, gdev);</div><div class='add'>+	if (status != nfs_ok) {</div><div class='add'>+		/*</div><div class='add'>+		 * Don't burden the layout drivers with enforcing</div><div class='add'>+		 * gd_maxcount. Just tell the client to come back</div><div class='add'>+		 * with a bigger buffer if it's not enough.</div><div class='add'>+		 */</div><div class='add'>+		if (xdr-&gt;buf-&gt;len + XDR_UNIT &gt; gdev-&gt;gd_maxcount)</div><div class='add'>+			goto toosmall;</div><div class='add'>+		return status;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	if (gdev-&gt;gd_notify_types) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 4 + 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			return nfserr_resource;</div><div class='del'>-		*p++ = cpu_to_be32(1);			/* bitmap length */</div><div class='del'>-		*p++ = cpu_to_be32(gdev-&gt;gd_notify_types);</div><div class='del'>-	} else {</div><div class='del'>-		p = xdr_reserve_space(xdr, 4);</div><div class='del'>-		if (!p)</div><div class='del'>-			return nfserr_resource;</div><div class='del'>-		*p++ = 0;</div><div class='del'>-	}</div><div class='add'>+	return nfs_ok;</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='ctx'> toosmall:</div><div class='del'>-	dprintk("%s: maxcount too small\n", __func__);</div><div class='del'>-	needed_len = xdr-&gt;buf-&gt;len + 4 /* notifications */;</div><div class='add'>+	needed_len = xdr-&gt;buf-&gt;len + XDR_UNIT;	/* notifications */</div><div class='ctx'> 	xdr_truncate_encode(xdr, starting_len);</div><div class='del'>-	p = xdr_reserve_space(xdr, 4);</div><div class='del'>-	if (!p)</div><div class='del'>-		return nfserr_resource;</div><div class='del'>-	*p++ = cpu_to_be32(needed_len);</div><div class='add'>+</div><div class='add'>+	status = nfsd4_encode_count4(xdr, needed_len);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='ctx'> 	return nfserr_toosmall;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_layoutget(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='del'>-		struct nfsd4_layoutget *lgp)</div><div class='add'>+nfsd4_encode_getdeviceinfo(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+		union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_getdeviceinfo *gdev = &amp;u-&gt;getdeviceinfo;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='del'>-	const struct nfsd4_layout_ops *ops;</div><div class='del'>-	__be32 *p;</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, 36 + sizeof(stateid_opaque_t));</div><div class='del'>-	if (!p)</div><div class='del'>-		return nfserr_resource;</div><div class='del'>-</div><div class='del'>-	*p++ = cpu_to_be32(1);	/* we always set return-on-close */</div><div class='del'>-	*p++ = cpu_to_be32(lgp-&gt;lg_sid.si_generation);</div><div class='del'>-	p = xdr_encode_opaque_fixed(p, &amp;lgp-&gt;lg_sid.si_opaque,</div><div class='del'>-				    sizeof(stateid_opaque_t));</div><div class='add'>+	/* gdir_device_addr */</div><div class='add'>+	nfserr = nfsd4_encode_device_addr4(xdr, gdev);</div><div class='add'>+	if (nfserr)</div><div class='add'>+		return nfserr;</div><div class='add'>+	/* gdir_notification */</div><div class='add'>+	return nfsd4_encode_bitmap4(xdr, gdev-&gt;gd_notify_types, 0, 0);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	*p++ = cpu_to_be32(1);	/* we always return a single layout */</div><div class='del'>-	p = xdr_encode_hyper(p, lgp-&gt;lg_seg.offset);</div><div class='del'>-	p = xdr_encode_hyper(p, lgp-&gt;lg_seg.length);</div><div class='del'>-	*p++ = cpu_to_be32(lgp-&gt;lg_seg.iomode);</div><div class='del'>-	*p++ = cpu_to_be32(lgp-&gt;lg_layout_type);</div><div class='add'>+static __be32</div><div class='add'>+nfsd4_encode_layout4(struct xdr_stream *xdr, const struct nfsd4_layoutget *lgp)</div><div class='add'>+{</div><div class='add'>+	const struct nfsd4_layout_ops *ops = nfsd4_layout_ops[lgp-&gt;lg_layout_type];</div><div class='add'>+	__be32 status;</div><div class='ctx'> </div><div class='del'>-	ops = nfsd4_layout_ops[lgp-&gt;lg_layout_type];</div><div class='add'>+	/* lo_offset */</div><div class='add'>+	status = nfsd4_encode_offset4(xdr, lgp-&gt;lg_seg.offset);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	/* lo_length */</div><div class='add'>+	status = nfsd4_encode_length4(xdr, lgp-&gt;lg_seg.length);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	/* lo_iomode */</div><div class='add'>+	if (xdr_stream_encode_u32(xdr, lgp-&gt;lg_seg.iomode) != XDR_UNIT)</div><div class='add'>+		return nfserr_resource;</div><div class='add'>+	/* lo_content */</div><div class='add'>+	if (xdr_stream_encode_u32(xdr, lgp-&gt;lg_layout_type) != XDR_UNIT)</div><div class='add'>+		return nfserr_resource;</div><div class='ctx'> 	return ops-&gt;encode_layoutget(xdr, lgp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_layoutcommit(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='del'>-			  struct nfsd4_layoutcommit *lcp)</div><div class='add'>+nfsd4_encode_layoutget(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+		union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_layoutget *lgp = &amp;u-&gt;layoutget;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='del'>-	__be32 *p;</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, 4);</div><div class='del'>-	if (!p)</div><div class='add'>+	/* logr_return_on_close */</div><div class='add'>+	nfserr = nfsd4_encode_bool(xdr, true);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='add'>+	/* logr_stateid */</div><div class='add'>+	nfserr = nfsd4_encode_stateid4(xdr, &amp;lgp-&gt;lg_sid);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='add'>+	/* logr_layout&lt;&gt; */</div><div class='add'>+	if (xdr_stream_encode_u32(xdr, 1) != XDR_UNIT)</div><div class='ctx'> 		return nfserr_resource;</div><div class='del'>-	*p++ = cpu_to_be32(lcp-&gt;lc_size_chg);</div><div class='del'>-	if (lcp-&gt;lc_size_chg) {</div><div class='del'>-		p = xdr_reserve_space(xdr, 8);</div><div class='del'>-		if (!p)</div><div class='del'>-			return nfserr_resource;</div><div class='del'>-		p = xdr_encode_hyper(p, lcp-&gt;lc_newsize);</div><div class='del'>-	}</div><div class='add'>+	return nfsd4_encode_layout4(xdr, lgp);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+static __be32</div><div class='add'>+nfsd4_encode_layoutcommit(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+			  union nfsd4_op_u *u)</div><div class='add'>+{</div><div class='add'>+	struct nfsd4_layoutcommit *lcp = &amp;u-&gt;layoutcommit;</div><div class='add'>+	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='add'>+</div><div class='add'>+	/* ns_sizechanged */</div><div class='add'>+	nfserr = nfsd4_encode_bool(xdr, lcp-&gt;lc_size_chg);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='add'>+	if (lcp-&gt;lc_size_chg)</div><div class='add'>+		/* ns_size */</div><div class='add'>+		return nfsd4_encode_length4(xdr, lcp-&gt;lc_newsize);</div><div class='add'>+	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_encode_layoutreturn(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='del'>-		struct nfsd4_layoutreturn *lrp)</div><div class='add'>+		union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_layoutreturn *lrp = &amp;u-&gt;layoutreturn;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='del'>-	__be32 *p;</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, 4);</div><div class='del'>-	if (!p)</div><div class='del'>-		return nfserr_resource;</div><div class='del'>-	*p++ = cpu_to_be32(lrp-&gt;lrs_present);</div><div class='add'>+	/* lrs_present */</div><div class='add'>+	nfserr = nfsd4_encode_bool(xdr, lrp-&gt;lrs_present);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='ctx'> 	if (lrp-&gt;lrs_present)</div><div class='del'>-		return nfsd4_encode_stateid(xdr, &amp;lrp-&gt;lr_sid);</div><div class='del'>-	return 0;</div><div class='add'>+		/* lrs_stateid */</div><div class='add'>+		return nfsd4_encode_stateid4(xdr, &amp;lrp-&gt;lr_sid);</div><div class='add'>+	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> #endif /* CONFIG_NFSD_PNFS */</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd42_encode_write_res(struct nfsd4_compoundres *resp,</div><div class='del'>-		struct nfsd42_write_res *write, bool sync)</div><div class='add'>+nfsd4_encode_write_response4(struct xdr_stream *xdr,</div><div class='add'>+			     const struct nfsd4_copy *copy)</div><div class='ctx'> {</div><div class='del'>-	__be32 *p;</div><div class='del'>-	p = xdr_reserve_space(resp-&gt;xdr, 4);</div><div class='del'>-	if (!p)</div><div class='del'>-		return nfserr_resource;</div><div class='add'>+	const struct nfsd42_write_res *write = &amp;copy-&gt;cp_res;</div><div class='add'>+	u32 count = nfsd4_copy_is_sync(copy) ? 0 : 1;</div><div class='add'>+	__be32 status;</div><div class='ctx'> </div><div class='del'>-	if (sync)</div><div class='del'>-		*p++ = cpu_to_be32(0);</div><div class='del'>-	else {</div><div class='del'>-		__be32 nfserr;</div><div class='del'>-		*p++ = cpu_to_be32(1);</div><div class='del'>-		nfserr = nfsd4_encode_stateid(resp-&gt;xdr, &amp;write-&gt;cb_stateid);</div><div class='del'>-		if (nfserr)</div><div class='del'>-			return nfserr;</div><div class='add'>+	/* wr_callback_id&lt;1&gt; */</div><div class='add'>+	if (xdr_stream_encode_u32(xdr, count) != XDR_UNIT)</div><div class='add'>+		return nfserr_resource;</div><div class='add'>+	if (count) {</div><div class='add'>+		status = nfsd4_encode_stateid4(xdr, &amp;write-&gt;cb_stateid);</div><div class='add'>+		if (status != nfs_ok)</div><div class='add'>+			return status;</div><div class='ctx'> 	}</div><div class='del'>-	p = xdr_reserve_space(resp-&gt;xdr, 8 + 4 + NFS4_VERIFIER_SIZE);</div><div class='del'>-	if (!p)</div><div class='add'>+</div><div class='add'>+	/* wr_count */</div><div class='add'>+	status = nfsd4_encode_length4(xdr, write-&gt;wr_bytes_written);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	/* wr_committed */</div><div class='add'>+	if (xdr_stream_encode_u32(xdr, write-&gt;wr_stable_how) != XDR_UNIT)</div><div class='ctx'> 		return nfserr_resource;</div><div class='add'>+	/* wr_writeverf */</div><div class='add'>+	return nfsd4_encode_verifier4(xdr, &amp;write-&gt;wr_verifier);</div><div class='add'>+}</div><div class='ctx'> </div><div class='del'>-	p = xdr_encode_hyper(p, write-&gt;wr_bytes_written);</div><div class='del'>-	*p++ = cpu_to_be32(write-&gt;wr_stable_how);</div><div class='del'>-	p = xdr_encode_opaque_fixed(p, write-&gt;wr_verifier.data,</div><div class='del'>-				    NFS4_VERIFIER_SIZE);</div><div class='del'>-	return nfs_ok;</div><div class='add'>+static __be32 nfsd4_encode_copy_requirements4(struct xdr_stream *xdr,</div><div class='add'>+					      const struct nfsd4_copy *copy)</div><div class='add'>+{</div><div class='add'>+	__be32 status;</div><div class='add'>+</div><div class='add'>+	/* cr_consecutive */</div><div class='add'>+	status = nfsd4_encode_bool(xdr, true);</div><div class='add'>+	if (status != nfs_ok)</div><div class='add'>+		return status;</div><div class='add'>+	/* cr_synchronous */</div><div class='add'>+	return nfsd4_encode_bool(xdr, nfsd4_copy_is_sync(copy));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd42_encode_nl4_server(struct nfsd4_compoundres *resp, struct nl4_server *ns)</div><div class='add'>+nfsd4_encode_copy(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+		  union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='del'>-	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='del'>-	struct nfs42_netaddr *addr;</div><div class='del'>-	__be32 *p;</div><div class='add'>+	struct nfsd4_copy *copy = &amp;u-&gt;copy;</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, 4);</div><div class='del'>-	*p++ = cpu_to_be32(ns-&gt;nl4_type);</div><div class='add'>+	nfserr = nfsd4_encode_write_response4(resp-&gt;xdr, copy);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='add'>+	return nfsd4_encode_copy_requirements4(resp-&gt;xdr, copy);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static __be32</div><div class='add'>+nfsd4_encode_netloc4(struct xdr_stream *xdr, const struct nl4_server *ns)</div><div class='add'>+{</div><div class='add'>+	__be32 status;</div><div class='ctx'> </div><div class='add'>+	if (xdr_stream_encode_u32(xdr, ns-&gt;nl4_type) != XDR_UNIT)</div><div class='add'>+		return nfserr_resource;</div><div class='ctx'> 	switch (ns-&gt;nl4_type) {</div><div class='ctx'> 	case NL4_NETADDR:</div><div class='del'>-		addr = &amp;ns-&gt;u.nl4_addr;</div><div class='del'>-</div><div class='del'>-		/* netid_len, netid, uaddr_len, uaddr (port included</div><div class='del'>-		 * in RPCBIND_MAXUADDRLEN)</div><div class='del'>-		 */</div><div class='del'>-		p = xdr_reserve_space(xdr,</div><div class='del'>-			4 /* netid len */ +</div><div class='del'>-			(XDR_QUADLEN(addr-&gt;netid_len) * 4) +</div><div class='del'>-			4 /* uaddr len */ +</div><div class='del'>-			(XDR_QUADLEN(addr-&gt;addr_len) * 4));</div><div class='del'>-		if (!p)</div><div class='del'>-			return nfserr_resource;</div><div class='del'>-</div><div class='del'>-		*p++ = cpu_to_be32(addr-&gt;netid_len);</div><div class='del'>-		p = xdr_encode_opaque_fixed(p, addr-&gt;netid,</div><div class='del'>-					    addr-&gt;netid_len);</div><div class='del'>-		*p++ = cpu_to_be32(addr-&gt;addr_len);</div><div class='del'>-		p = xdr_encode_opaque_fixed(p, addr-&gt;addr,</div><div class='del'>-					addr-&gt;addr_len);</div><div class='add'>+		/* nl_addr */</div><div class='add'>+		status = nfsd4_encode_netaddr4(xdr, &amp;ns-&gt;u.nl4_addr);</div><div class='ctx'> 		break;</div><div class='ctx'> 	default:</div><div class='del'>-		WARN_ON_ONCE(ns-&gt;nl4_type != NL4_NETADDR);</div><div class='del'>-		return nfserr_inval;</div><div class='add'>+		status = nfserr_serverfault;</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='add'>+	return status;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_copy(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='del'>-		  struct nfsd4_copy *copy)</div><div class='add'>+nfsd4_encode_copy_notify(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+			 union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='del'>-	__be32 *p;</div><div class='add'>+	struct nfsd4_copy_notify *cn = &amp;u-&gt;copy_notify;</div><div class='add'>+	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='ctx'> </div><div class='del'>-	nfserr = nfsd42_encode_write_res(resp, &amp;copy-&gt;cp_res,</div><div class='del'>-					 !!copy-&gt;cp_synchronous);</div><div class='add'>+	/* cnr_lease_time */</div><div class='add'>+	nfserr = nfsd4_encode_nfstime4(xdr, &amp;cn-&gt;cpn_lease_time);</div><div class='ctx'> 	if (nfserr)</div><div class='ctx'> 		return nfserr;</div><div class='del'>-</div><div class='del'>-	p = xdr_reserve_space(resp-&gt;xdr, 4 + 4);</div><div class='del'>-	*p++ = xdr_one; /* cr_consecutive */</div><div class='del'>-	*p++ = cpu_to_be32(copy-&gt;cp_synchronous);</div><div class='del'>-	return 0;</div><div class='add'>+	/* cnr_stateid */</div><div class='add'>+	nfserr = nfsd4_encode_stateid4(xdr, &amp;cn-&gt;cpn_cnr_stateid);</div><div class='add'>+	if (nfserr)</div><div class='add'>+		return nfserr;</div><div class='add'>+	/* cnr_source_server&lt;&gt; */</div><div class='add'>+	if (xdr_stream_encode_u32(xdr, 1) != XDR_UNIT)</div><div class='add'>+		return nfserr_resource;</div><div class='add'>+	return nfsd4_encode_netloc4(xdr, cn-&gt;cpn_src);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_encode_offload_status(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='del'>-			    struct nfsd4_offload_status *os)</div><div class='add'>+			    union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_offload_status *os = &amp;u-&gt;offload_status;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='del'>-	__be32 *p;</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, 8 + 4);</div><div class='del'>-	if (!p)</div><div class='add'>+	/* osr_count */</div><div class='add'>+	nfserr = nfsd4_encode_length4(xdr, os-&gt;count);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='add'>+		return nfserr;</div><div class='add'>+	/* osr_complete&lt;1&gt; */</div><div class='add'>+	if (os-&gt;completed) {</div><div class='add'>+		if (xdr_stream_encode_u32(xdr, 1) != XDR_UNIT)</div><div class='add'>+			return nfserr_resource;</div><div class='add'>+		if (xdr_stream_encode_be32(xdr, os-&gt;status) != XDR_UNIT)</div><div class='add'>+			return nfserr_resource;</div><div class='add'>+	} else if (xdr_stream_encode_u32(xdr, 0) != XDR_UNIT)</div><div class='ctx'> 		return nfserr_resource;</div><div class='del'>-	p = xdr_encode_hyper(p, os-&gt;count);</div><div class='del'>-	*p++ = cpu_to_be32(0);</div><div class='del'>-	return nfserr;</div><div class='add'>+	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_encode_read_plus_data(struct nfsd4_compoundres *resp,</div><div class='del'>-			    struct nfsd4_read *read,</div><div class='del'>-			    unsigned long *maxcount, u32 *eof,</div><div class='del'>-			    loff_t *pos)</div><div class='add'>+			    struct nfsd4_read *read)</div><div class='ctx'> {</div><div class='del'>-	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='add'>+	struct nfsd4_compoundargs *argp = resp-&gt;rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct file *file = read-&gt;rd_nf-&gt;nf_file;</div><div class='del'>-	int starting_len = xdr-&gt;buf-&gt;len;</div><div class='del'>-	loff_t hole_pos;</div><div class='del'>-	__be32 nfserr;</div><div class='del'>-	__be32 *p, tmp;</div><div class='del'>-	__be64 tmp64;</div><div class='add'>+	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='add'>+	bool splice_ok = argp-&gt;splice_ok;</div><div class='add'>+	unsigned int offset_offset;</div><div class='add'>+	__be32 nfserr, wire_count;</div><div class='add'>+	unsigned long maxcount;</div><div class='add'>+	__be64 wire_offset;</div><div class='ctx'> </div><div class='del'>-	hole_pos = pos ? *pos : vfs_llseek(file, read-&gt;rd_offset, SEEK_HOLE);</div><div class='del'>-	if (hole_pos &gt; read-&gt;rd_offset)</div><div class='del'>-		*maxcount = min_t(unsigned long, *maxcount, hole_pos - read-&gt;rd_offset);</div><div class='del'>-	*maxcount = min_t(unsigned long, *maxcount, (xdr-&gt;buf-&gt;buflen - xdr-&gt;buf-&gt;len));</div><div class='add'>+	if (xdr_stream_encode_u32(xdr, NFS4_CONTENT_DATA) != XDR_UNIT)</div><div class='add'>+		return nfserr_io;</div><div class='ctx'> </div><div class='del'>-	/* Content type, offset, byte count */</div><div class='del'>-	p = xdr_reserve_space(xdr, 4 + 8 + 4);</div><div class='del'>-	if (!p)</div><div class='del'>-		return nfserr_resource;</div><div class='add'>+	offset_offset = xdr-&gt;buf-&gt;len;</div><div class='ctx'> </div><div class='del'>-	read-&gt;rd_vlen = xdr_reserve_space_vec(xdr, resp-&gt;rqstp-&gt;rq_vec, *maxcount);</div><div class='del'>-	if (read-&gt;rd_vlen &lt; 0)</div><div class='del'>-		return nfserr_resource;</div><div class='add'>+	/* Reserve space for the byte offset and count */</div><div class='add'>+	if (unlikely(!xdr_reserve_space(xdr, XDR_UNIT * 3)))</div><div class='add'>+		return nfserr_io;</div><div class='add'>+	xdr_commit_encode(xdr);</div><div class='add'>+</div><div class='add'>+	maxcount = min_t(unsigned long, read-&gt;rd_length,</div><div class='add'>+			 (xdr-&gt;buf-&gt;buflen - xdr-&gt;buf-&gt;len));</div><div class='ctx'> </div><div class='del'>-	nfserr = nfsd_readv(resp-&gt;rqstp, read-&gt;rd_fhp, file, read-&gt;rd_offset,</div><div class='del'>-			    resp-&gt;rqstp-&gt;rq_vec, read-&gt;rd_vlen, maxcount, eof);</div><div class='add'>+	if (file-&gt;f_op-&gt;splice_read &amp;&amp; splice_ok)</div><div class='add'>+		nfserr = nfsd4_encode_splice_read(resp, read, file, maxcount);</div><div class='add'>+	else</div><div class='add'>+		nfserr = nfsd4_encode_readv(resp, read, maxcount);</div><div class='ctx'> 	if (nfserr)</div><div class='ctx'> 		return nfserr;</div><div class='del'>-	xdr_truncate_encode(xdr, starting_len + 16 + xdr_align_size(*maxcount));</div><div class='del'>-</div><div class='del'>-	tmp = htonl(NFS4_CONTENT_DATA);</div><div class='del'>-	write_bytes_to_xdr_buf(xdr-&gt;buf, starting_len,      &amp;tmp,   4);</div><div class='del'>-	tmp64 = cpu_to_be64(read-&gt;rd_offset);</div><div class='del'>-	write_bytes_to_xdr_buf(xdr-&gt;buf, starting_len + 4,  &amp;tmp64, 8);</div><div class='del'>-	tmp = htonl(*maxcount);</div><div class='del'>-	write_bytes_to_xdr_buf(xdr-&gt;buf, starting_len + 12, &amp;tmp,   4);</div><div class='del'>-</div><div class='del'>-	tmp = xdr_zero;</div><div class='del'>-	write_bytes_to_xdr_buf(xdr-&gt;buf, starting_len + 16 + *maxcount, &amp;tmp,</div><div class='del'>-			       xdr_pad_size(*maxcount));</div><div class='del'>-	return nfs_ok;</div><div class='del'>-}</div><div class='ctx'> </div><div class='del'>-static __be32</div><div class='del'>-nfsd4_encode_read_plus_hole(struct nfsd4_compoundres *resp,</div><div class='del'>-			    struct nfsd4_read *read,</div><div class='del'>-			    unsigned long *maxcount, u32 *eof)</div><div class='del'>-{</div><div class='del'>-	struct file *file = read-&gt;rd_nf-&gt;nf_file;</div><div class='del'>-	loff_t data_pos = vfs_llseek(file, read-&gt;rd_offset, SEEK_DATA);</div><div class='del'>-	loff_t f_size = i_size_read(file_inode(file));</div><div class='del'>-	unsigned long count;</div><div class='del'>-	__be32 *p;</div><div class='del'>-</div><div class='del'>-	if (data_pos == -ENXIO)</div><div class='del'>-		data_pos = f_size;</div><div class='del'>-	else if (data_pos &lt;= read-&gt;rd_offset || (data_pos &lt; f_size &amp;&amp; data_pos % PAGE_SIZE))</div><div class='del'>-		return nfsd4_encode_read_plus_data(resp, read, maxcount, eof, &amp;f_size);</div><div class='del'>-	count = data_pos - read-&gt;rd_offset;</div><div class='del'>-</div><div class='del'>-	/* Content type, offset, byte count */</div><div class='del'>-	p = xdr_reserve_space(resp-&gt;xdr, 4 + 8 + 8);</div><div class='del'>-	if (!p)</div><div class='del'>-		return nfserr_resource;</div><div class='del'>-</div><div class='del'>-	*p++ = htonl(NFS4_CONTENT_HOLE);</div><div class='del'>-	 p   = xdr_encode_hyper(p, read-&gt;rd_offset);</div><div class='del'>-	 p   = xdr_encode_hyper(p, count);</div><div class='del'>-</div><div class='del'>-	*eof = (read-&gt;rd_offset + count) &gt;= f_size;</div><div class='del'>-	*maxcount = min_t(unsigned long, count, *maxcount);</div><div class='add'>+	wire_offset = cpu_to_be64(read-&gt;rd_offset);</div><div class='add'>+	write_bytes_to_xdr_buf(xdr-&gt;buf, offset_offset, &amp;wire_offset,</div><div class='add'>+			       XDR_UNIT * 2);</div><div class='add'>+	wire_count = cpu_to_be32(read-&gt;rd_length);</div><div class='add'>+	write_bytes_to_xdr_buf(xdr-&gt;buf, offset_offset + XDR_UNIT * 2,</div><div class='add'>+			       &amp;wire_count, XDR_UNIT);</div><div class='ctx'> 	return nfs_ok;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_encode_read_plus(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='del'>-		       struct nfsd4_read *read)</div><div class='add'>+		       union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='del'>-	unsigned long maxcount, count;</div><div class='add'>+	struct nfsd4_read *read = &amp;u-&gt;read;</div><div class='add'>+	struct file *file = read-&gt;rd_nf-&gt;nf_file;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='del'>-	struct file *file;</div><div class='del'>-	int starting_len = xdr-&gt;buf-&gt;len;</div><div class='del'>-	int last_segment = xdr-&gt;buf-&gt;len;</div><div class='del'>-	int segments = 0;</div><div class='del'>-	__be32 *p, tmp;</div><div class='del'>-	bool is_data;</div><div class='del'>-	loff_t pos;</div><div class='del'>-	u32 eof;</div><div class='add'>+	unsigned int eof_offset;</div><div class='add'>+	__be32 wire_data[2];</div><div class='add'>+	u32 segments = 0;</div><div class='ctx'> </div><div class='ctx'> 	if (nfserr)</div><div class='ctx'> 		return nfserr;</div><div class='del'>-	file = read-&gt;rd_nf-&gt;nf_file;</div><div class='ctx'> </div><div class='del'>-	/* eof flag, segment count */</div><div class='del'>-	p = xdr_reserve_space(xdr, 4 + 4);</div><div class='del'>-	if (!p)</div><div class='del'>-		return nfserr_resource;</div><div class='del'>-	xdr_commit_encode(xdr);</div><div class='add'>+	eof_offset = xdr-&gt;buf-&gt;len;</div><div class='ctx'> </div><div class='del'>-	maxcount = svc_max_payload(resp-&gt;rqstp);</div><div class='del'>-	maxcount = min_t(unsigned long, maxcount,</div><div class='del'>-			 (xdr-&gt;buf-&gt;buflen - xdr-&gt;buf-&gt;len));</div><div class='del'>-	maxcount = min_t(unsigned long, maxcount, read-&gt;rd_length);</div><div class='del'>-	count    = maxcount;</div><div class='add'>+	/* Reserve space for the eof flag and segment count */</div><div class='add'>+	if (unlikely(!xdr_reserve_space(xdr, XDR_UNIT * 2)))</div><div class='add'>+		return nfserr_io;</div><div class='add'>+	xdr_commit_encode(xdr);</div><div class='ctx'> </div><div class='del'>-	eof = read-&gt;rd_offset &gt;= i_size_read(file_inode(file));</div><div class='del'>-	if (eof)</div><div class='add'>+	read-&gt;rd_eof = read-&gt;rd_offset &gt;= i_size_read(file_inode(file));</div><div class='add'>+	if (read-&gt;rd_eof)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	pos = vfs_llseek(file, read-&gt;rd_offset, SEEK_HOLE);</div><div class='del'>-	is_data = pos &gt; read-&gt;rd_offset;</div><div class='del'>-</div><div class='del'>-	while (count &gt; 0 &amp;&amp; !eof) {</div><div class='del'>-		maxcount = count;</div><div class='del'>-		if (is_data)</div><div class='del'>-			nfserr = nfsd4_encode_read_plus_data(resp, read, &amp;maxcount, &amp;eof,</div><div class='del'>-						segments == 0 ? &amp;pos : NULL);</div><div class='del'>-		else</div><div class='del'>-			nfserr = nfsd4_encode_read_plus_hole(resp, read, &amp;maxcount, &amp;eof);</div><div class='del'>-		if (nfserr)</div><div class='del'>-			goto out;</div><div class='del'>-		count -= maxcount;</div><div class='del'>-		read-&gt;rd_offset += maxcount;</div><div class='del'>-		is_data = !is_data;</div><div class='del'>-		last_segment = xdr-&gt;buf-&gt;len;</div><div class='del'>-		segments++;</div><div class='add'>+	nfserr = nfsd4_encode_read_plus_data(resp, read);</div><div class='add'>+	if (nfserr) {</div><div class='add'>+		xdr_truncate_encode(xdr, eof_offset);</div><div class='add'>+		return nfserr;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-out:</div><div class='del'>-	if (nfserr &amp;&amp; segments == 0)</div><div class='del'>-		xdr_truncate_encode(xdr, starting_len);</div><div class='del'>-	else {</div><div class='del'>-		if (nfserr) {</div><div class='del'>-			xdr_truncate_encode(xdr, last_segment);</div><div class='del'>-			nfserr = nfs_ok;</div><div class='del'>-			eof = 0;</div><div class='del'>-		}</div><div class='del'>-		tmp = htonl(eof);</div><div class='del'>-		write_bytes_to_xdr_buf(xdr-&gt;buf, starting_len,     &amp;tmp, 4);</div><div class='del'>-		tmp = htonl(segments);</div><div class='del'>-		write_bytes_to_xdr_buf(xdr-&gt;buf, starting_len + 4, &amp;tmp, 4);</div><div class='del'>-	}</div><div class='add'>+	segments++;</div><div class='ctx'> </div><div class='add'>+out:</div><div class='add'>+	wire_data[0] = read-&gt;rd_eof ? xdr_one : xdr_zero;</div><div class='add'>+	wire_data[1] = cpu_to_be32(segments);</div><div class='add'>+	write_bytes_to_xdr_buf(xdr-&gt;buf, eof_offset, &amp;wire_data, XDR_UNIT * 2);</div><div class='ctx'> 	return nfserr;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_copy_notify(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='del'>-			 struct nfsd4_copy_notify *cn)</div><div class='add'>+nfsd4_encode_seek(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+		  union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_seek *seek = &amp;u-&gt;seek;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='del'>-	__be32 *p;</div><div class='del'>-</div><div class='del'>-	if (nfserr)</div><div class='del'>-		return nfserr;</div><div class='del'>-</div><div class='del'>-	/* 8 sec, 4 nsec */</div><div class='del'>-	p = xdr_reserve_space(xdr, 12);</div><div class='del'>-	if (!p)</div><div class='del'>-		return nfserr_resource;</div><div class='ctx'> </div><div class='del'>-	/* cnr_lease_time */</div><div class='del'>-	p = xdr_encode_hyper(p, cn-&gt;cpn_sec);</div><div class='del'>-	*p++ = cpu_to_be32(cn-&gt;cpn_nsec);</div><div class='del'>-</div><div class='del'>-	/* cnr_stateid */</div><div class='del'>-	nfserr = nfsd4_encode_stateid(xdr, &amp;cn-&gt;cpn_cnr_stateid);</div><div class='del'>-	if (nfserr)</div><div class='add'>+	/* sr_eof */</div><div class='add'>+	nfserr = nfsd4_encode_bool(xdr, seek-&gt;seek_eof);</div><div class='add'>+	if (nfserr != nfs_ok)</div><div class='ctx'> 		return nfserr;</div><div class='del'>-</div><div class='del'>-	/* cnr_src.nl_nsvr */</div><div class='del'>-	p = xdr_reserve_space(xdr, 4);</div><div class='del'>-	if (!p)</div><div class='del'>-		return nfserr_resource;</div><div class='del'>-</div><div class='del'>-	*p++ = cpu_to_be32(1);</div><div class='del'>-</div><div class='del'>-	return nfsd42_encode_nl4_server(resp, &amp;cn-&gt;cpn_src);</div><div class='add'>+	/* sr_offset */</div><div class='add'>+	return nfsd4_encode_offset4(xdr, seek-&gt;seek_pos);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='del'>-nfsd4_encode_seek(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='del'>-		  struct nfsd4_seek *seek)</div><div class='del'>-{</div><div class='del'>-	__be32 *p;</div><div class='del'>-</div><div class='del'>-	p = xdr_reserve_space(resp-&gt;xdr, 4 + 8);</div><div class='del'>-	*p++ = cpu_to_be32(seek-&gt;seek_eof);</div><div class='del'>-	p = xdr_encode_hyper(p, seek-&gt;seek_pos);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static __be32</div><div class='del'>-nfsd4_encode_noop(struct nfsd4_compoundres *resp, __be32 nfserr, void *p)</div><div class='add'>+nfsd4_encode_noop(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='add'>+		  union nfsd4_op_u *p)</div><div class='ctx'> {</div><div class='ctx'> 	return nfserr;</div><div class='ctx'> }</div><div class='hunk'>@@ -4986,8 +5559,9 @@ nfsd4_vbuf_to_stream(struct xdr_stream *xdr, char *buf, u32 buflen)</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_encode_getxattr(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='del'>-		      struct nfsd4_getxattr *getxattr)</div><div class='add'>+		      union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_getxattr *getxattr = &amp;u-&gt;getxattr;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='ctx'> 	__be32 *p, err;</div><div class='ctx'> </div><div class='hunk'>@@ -5010,18 +5584,12 @@ nfsd4_encode_getxattr(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_encode_setxattr(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='del'>-		      struct nfsd4_setxattr *setxattr)</div><div class='add'>+		      union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_setxattr *setxattr = &amp;u-&gt;setxattr;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='del'>-	__be32 *p;</div><div class='del'>-</div><div class='del'>-	p = xdr_reserve_space(xdr, 20);</div><div class='del'>-	if (!p)</div><div class='del'>-		return nfserr_resource;</div><div class='del'>-</div><div class='del'>-	encode_cinfo(p, &amp;setxattr-&gt;setxa_cinfo);</div><div class='ctx'> </div><div class='del'>-	return 0;</div><div class='add'>+	return nfsd4_encode_change_info4(xdr, &amp;setxattr-&gt;setxa_cinfo);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -5035,24 +5603,20 @@ nfsd4_listxattr_validate_cookie(struct nfsd4_listxattrs *listxattrs,</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * If the cookie is larger than the maximum number we can fit</div><div class='del'>-	 * in either the buffer we just got back from vfs_listxattr, or,</div><div class='del'>-	 * XDR-encoded, in the return buffer, it's invalid.</div><div class='add'>+	 * in the buffer we just got back from vfs_listxattr, it's invalid.</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (cookie &gt; (listxattrs-&gt;lsxa_len) / (XATTR_USER_PREFIX_LEN + 2))</div><div class='ctx'> 		return nfserr_badcookie;</div><div class='ctx'> </div><div class='del'>-	if (cookie &gt; (listxattrs-&gt;lsxa_maxcount /</div><div class='del'>-		      (XDR_QUADLEN(XATTR_USER_PREFIX_LEN + 2) + 4)))</div><div class='del'>-		return nfserr_badcookie;</div><div class='del'>-</div><div class='ctx'> 	*offsetp = (u32)cookie;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_encode_listxattrs(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='del'>-			struct nfsd4_listxattrs *listxattrs)</div><div class='add'>+			union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_listxattrs *listxattrs = &amp;u-&gt;listxattrs;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='ctx'> 	u32 cookie_offset, count_offset, eof;</div><div class='ctx'> 	u32 left, xdrleft, slen, count;</div><div class='hunk'>@@ -5060,6 +5624,7 @@ nfsd4_encode_listxattrs(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='ctx'> 	u64 cookie;</div><div class='ctx'> 	char *sp;</div><div class='ctx'> 	__be32 status, tmp;</div><div class='add'>+	__be64 wire_cookie;</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> 	u32 nuser;</div><div class='ctx'> </div><div class='hunk'>@@ -5075,7 +5640,7 @@ nfsd4_encode_listxattrs(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='ctx'> 	 */</div><div class='ctx'> 	cookie_offset = xdr-&gt;buf-&gt;len;</div><div class='ctx'> 	count_offset = cookie_offset + 8;</div><div class='del'>-	p = xdr_reserve_space(xdr, 12);</div><div class='add'>+	p = xdr_reserve_space(xdr, XDR_UNIT * 3);</div><div class='ctx'> 	if (!p) {</div><div class='ctx'> 		status = nfserr_resource;</div><div class='ctx'> 		goto out;</div><div class='hunk'>@@ -5086,7 +5651,8 @@ nfsd4_encode_listxattrs(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='ctx'> 	sp = listxattrs-&gt;lsxa_buf;</div><div class='ctx'> 	nuser = 0;</div><div class='ctx'> </div><div class='del'>-	xdrleft = listxattrs-&gt;lsxa_maxcount;</div><div class='add'>+	/* Bytes left is maxcount - 8 (cookie) - 4 (array count) */</div><div class='add'>+	xdrleft = listxattrs-&gt;lsxa_maxcount - XDR_UNIT * 3;</div><div class='ctx'> </div><div class='ctx'> 	while (left &gt; 0 &amp;&amp; xdrleft &gt; 0) {</div><div class='ctx'> 		slen = strlen(sp);</div><div class='hunk'>@@ -5099,7 +5665,8 @@ nfsd4_encode_listxattrs(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='ctx'> </div><div class='ctx'> 		slen -= XATTR_USER_PREFIX_LEN;</div><div class='ctx'> 		xdrlen = 4 + ((slen + 3) &amp; ~3);</div><div class='del'>-		if (xdrlen &gt; xdrleft) {</div><div class='add'>+		/* Check if both entry and eof can fit in the XDR buffer */</div><div class='add'>+		if (xdrlen + XDR_UNIT &gt; xdrleft) {</div><div class='ctx'> 			if (count == 0) {</div><div class='ctx'> 				/*</div><div class='ctx'> 				 * Can't even fit the first attribute name.</div><div class='hunk'>@@ -5151,7 +5718,8 @@ wreof:</div><div class='ctx'> </div><div class='ctx'> 	cookie = offset + count;</div><div class='ctx'> </div><div class='del'>-	write_bytes_to_xdr_buf(xdr-&gt;buf, cookie_offset, &amp;cookie, 8);</div><div class='add'>+	wire_cookie = cpu_to_be64(cookie);</div><div class='add'>+	write_bytes_to_xdr_buf(xdr-&gt;buf, cookie_offset, &amp;wire_cookie, 8);</div><div class='ctx'> 	tmp = cpu_to_be32(count);</div><div class='ctx'> 	write_bytes_to_xdr_buf(xdr-&gt;buf, count_offset, &amp;tmp, 4);</div><div class='ctx'> out:</div><div class='hunk'>@@ -5162,20 +5730,15 @@ out:</div><div class='ctx'> </div><div class='ctx'> static __be32</div><div class='ctx'> nfsd4_encode_removexattr(struct nfsd4_compoundres *resp, __be32 nfserr,</div><div class='del'>-			 struct nfsd4_removexattr *removexattr)</div><div class='add'>+			 union nfsd4_op_u *u)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd4_removexattr *removexattr = &amp;u-&gt;removexattr;</div><div class='ctx'> 	struct xdr_stream *xdr = resp-&gt;xdr;</div><div class='del'>-	__be32 *p;</div><div class='del'>-</div><div class='del'>-	p = xdr_reserve_space(xdr, 20);</div><div class='del'>-	if (!p)</div><div class='del'>-		return nfserr_resource;</div><div class='ctx'> </div><div class='del'>-	p = encode_cinfo(p, &amp;removexattr-&gt;rmxa_cinfo);</div><div class='del'>-	return 0;</div><div class='add'>+	return nfsd4_encode_change_info4(xdr, &amp;removexattr-&gt;rmxa_cinfo);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-typedef __be32(* nfsd4_enc)(struct nfsd4_compoundres *, __be32, void *);</div><div class='add'>+typedef __be32(*nfsd4_enc)(struct nfsd4_compoundres *, __be32, union nfsd4_op_u *u);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Note: nfsd4_enc_ops vector is shared for v4.0 and v4.1</div><div class='hunk'>@@ -5183,93 +5746,93 @@ typedef __be32(* nfsd4_enc)(struct nfsd4_compoundres *, __be32, void *);</div><div class='ctx'>  * done in the decoding phase.</div><div class='ctx'>  */</div><div class='ctx'> static const nfsd4_enc nfsd4_enc_ops[] = {</div><div class='del'>-	[OP_ACCESS]		= (nfsd4_enc)nfsd4_encode_access,</div><div class='del'>-	[OP_CLOSE]		= (nfsd4_enc)nfsd4_encode_close,</div><div class='del'>-	[OP_COMMIT]		= (nfsd4_enc)nfsd4_encode_commit,</div><div class='del'>-	[OP_CREATE]		= (nfsd4_enc)nfsd4_encode_create,</div><div class='del'>-	[OP_DELEGPURGE]		= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_DELEGRETURN]	= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_GETATTR]		= (nfsd4_enc)nfsd4_encode_getattr,</div><div class='del'>-	[OP_GETFH]		= (nfsd4_enc)nfsd4_encode_getfh,</div><div class='del'>-	[OP_LINK]		= (nfsd4_enc)nfsd4_encode_link,</div><div class='del'>-	[OP_LOCK]		= (nfsd4_enc)nfsd4_encode_lock,</div><div class='del'>-	[OP_LOCKT]		= (nfsd4_enc)nfsd4_encode_lockt,</div><div class='del'>-	[OP_LOCKU]		= (nfsd4_enc)nfsd4_encode_locku,</div><div class='del'>-	[OP_LOOKUP]		= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_LOOKUPP]		= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_NVERIFY]		= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_OPEN]		= (nfsd4_enc)nfsd4_encode_open,</div><div class='del'>-	[OP_OPENATTR]		= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_OPEN_CONFIRM]	= (nfsd4_enc)nfsd4_encode_open_confirm,</div><div class='del'>-	[OP_OPEN_DOWNGRADE]	= (nfsd4_enc)nfsd4_encode_open_downgrade,</div><div class='del'>-	[OP_PUTFH]		= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_PUTPUBFH]		= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_PUTROOTFH]		= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_READ]		= (nfsd4_enc)nfsd4_encode_read,</div><div class='del'>-	[OP_READDIR]		= (nfsd4_enc)nfsd4_encode_readdir,</div><div class='del'>-	[OP_READLINK]		= (nfsd4_enc)nfsd4_encode_readlink,</div><div class='del'>-	[OP_REMOVE]		= (nfsd4_enc)nfsd4_encode_remove,</div><div class='del'>-	[OP_RENAME]		= (nfsd4_enc)nfsd4_encode_rename,</div><div class='del'>-	[OP_RENEW]		= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_RESTOREFH]		= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_SAVEFH]		= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_SECINFO]		= (nfsd4_enc)nfsd4_encode_secinfo,</div><div class='del'>-	[OP_SETATTR]		= (nfsd4_enc)nfsd4_encode_setattr,</div><div class='del'>-	[OP_SETCLIENTID]	= (nfsd4_enc)nfsd4_encode_setclientid,</div><div class='del'>-	[OP_SETCLIENTID_CONFIRM] = (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_VERIFY]		= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_WRITE]		= (nfsd4_enc)nfsd4_encode_write,</div><div class='del'>-	[OP_RELEASE_LOCKOWNER]	= (nfsd4_enc)nfsd4_encode_noop,</div><div class='add'>+	[OP_ACCESS]		= nfsd4_encode_access,</div><div class='add'>+	[OP_CLOSE]		= nfsd4_encode_close,</div><div class='add'>+	[OP_COMMIT]		= nfsd4_encode_commit,</div><div class='add'>+	[OP_CREATE]		= nfsd4_encode_create,</div><div class='add'>+	[OP_DELEGPURGE]		= nfsd4_encode_noop,</div><div class='add'>+	[OP_DELEGRETURN]	= nfsd4_encode_noop,</div><div class='add'>+	[OP_GETATTR]		= nfsd4_encode_getattr,</div><div class='add'>+	[OP_GETFH]		= nfsd4_encode_getfh,</div><div class='add'>+	[OP_LINK]		= nfsd4_encode_link,</div><div class='add'>+	[OP_LOCK]		= nfsd4_encode_lock,</div><div class='add'>+	[OP_LOCKT]		= nfsd4_encode_lockt,</div><div class='add'>+	[OP_LOCKU]		= nfsd4_encode_locku,</div><div class='add'>+	[OP_LOOKUP]		= nfsd4_encode_noop,</div><div class='add'>+	[OP_LOOKUPP]		= nfsd4_encode_noop,</div><div class='add'>+	[OP_NVERIFY]		= nfsd4_encode_noop,</div><div class='add'>+	[OP_OPEN]		= nfsd4_encode_open,</div><div class='add'>+	[OP_OPENATTR]		= nfsd4_encode_noop,</div><div class='add'>+	[OP_OPEN_CONFIRM]	= nfsd4_encode_open_confirm,</div><div class='add'>+	[OP_OPEN_DOWNGRADE]	= nfsd4_encode_open_downgrade,</div><div class='add'>+	[OP_PUTFH]		= nfsd4_encode_noop,</div><div class='add'>+	[OP_PUTPUBFH]		= nfsd4_encode_noop,</div><div class='add'>+	[OP_PUTROOTFH]		= nfsd4_encode_noop,</div><div class='add'>+	[OP_READ]		= nfsd4_encode_read,</div><div class='add'>+	[OP_READDIR]		= nfsd4_encode_readdir,</div><div class='add'>+	[OP_READLINK]		= nfsd4_encode_readlink,</div><div class='add'>+	[OP_REMOVE]		= nfsd4_encode_remove,</div><div class='add'>+	[OP_RENAME]		= nfsd4_encode_rename,</div><div class='add'>+	[OP_RENEW]		= nfsd4_encode_noop,</div><div class='add'>+	[OP_RESTOREFH]		= nfsd4_encode_noop,</div><div class='add'>+	[OP_SAVEFH]		= nfsd4_encode_noop,</div><div class='add'>+	[OP_SECINFO]		= nfsd4_encode_secinfo,</div><div class='add'>+	[OP_SETATTR]		= nfsd4_encode_setattr,</div><div class='add'>+	[OP_SETCLIENTID]	= nfsd4_encode_setclientid,</div><div class='add'>+	[OP_SETCLIENTID_CONFIRM] = nfsd4_encode_noop,</div><div class='add'>+	[OP_VERIFY]		= nfsd4_encode_noop,</div><div class='add'>+	[OP_WRITE]		= nfsd4_encode_write,</div><div class='add'>+	[OP_RELEASE_LOCKOWNER]	= nfsd4_encode_noop,</div><div class='ctx'> </div><div class='ctx'> 	/* NFSv4.1 operations */</div><div class='del'>-	[OP_BACKCHANNEL_CTL]	= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_BIND_CONN_TO_SESSION] = (nfsd4_enc)nfsd4_encode_bind_conn_to_session,</div><div class='del'>-	[OP_EXCHANGE_ID]	= (nfsd4_enc)nfsd4_encode_exchange_id,</div><div class='del'>-	[OP_CREATE_SESSION]	= (nfsd4_enc)nfsd4_encode_create_session,</div><div class='del'>-	[OP_DESTROY_SESSION]	= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_FREE_STATEID]	= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_GET_DIR_DELEGATION]	= (nfsd4_enc)nfsd4_encode_noop,</div><div class='add'>+	[OP_BACKCHANNEL_CTL]	= nfsd4_encode_noop,</div><div class='add'>+	[OP_BIND_CONN_TO_SESSION] = nfsd4_encode_bind_conn_to_session,</div><div class='add'>+	[OP_EXCHANGE_ID]	= nfsd4_encode_exchange_id,</div><div class='add'>+	[OP_CREATE_SESSION]	= nfsd4_encode_create_session,</div><div class='add'>+	[OP_DESTROY_SESSION]	= nfsd4_encode_noop,</div><div class='add'>+	[OP_FREE_STATEID]	= nfsd4_encode_noop,</div><div class='add'>+	[OP_GET_DIR_DELEGATION]	= nfsd4_encode_get_dir_delegation,</div><div class='ctx'> #ifdef CONFIG_NFSD_PNFS</div><div class='del'>-	[OP_GETDEVICEINFO]	= (nfsd4_enc)nfsd4_encode_getdeviceinfo,</div><div class='del'>-	[OP_GETDEVICELIST]	= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_LAYOUTCOMMIT]	= (nfsd4_enc)nfsd4_encode_layoutcommit,</div><div class='del'>-	[OP_LAYOUTGET]		= (nfsd4_enc)nfsd4_encode_layoutget,</div><div class='del'>-	[OP_LAYOUTRETURN]	= (nfsd4_enc)nfsd4_encode_layoutreturn,</div><div class='add'>+	[OP_GETDEVICEINFO]	= nfsd4_encode_getdeviceinfo,</div><div class='add'>+	[OP_GETDEVICELIST]	= nfsd4_encode_noop,</div><div class='add'>+	[OP_LAYOUTCOMMIT]	= nfsd4_encode_layoutcommit,</div><div class='add'>+	[OP_LAYOUTGET]		= nfsd4_encode_layoutget,</div><div class='add'>+	[OP_LAYOUTRETURN]	= nfsd4_encode_layoutreturn,</div><div class='ctx'> #else</div><div class='del'>-	[OP_GETDEVICEINFO]	= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_GETDEVICELIST]	= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_LAYOUTCOMMIT]	= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_LAYOUTGET]		= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_LAYOUTRETURN]	= (nfsd4_enc)nfsd4_encode_noop,</div><div class='add'>+	[OP_GETDEVICEINFO]	= nfsd4_encode_noop,</div><div class='add'>+	[OP_GETDEVICELIST]	= nfsd4_encode_noop,</div><div class='add'>+	[OP_LAYOUTCOMMIT]	= nfsd4_encode_noop,</div><div class='add'>+	[OP_LAYOUTGET]		= nfsd4_encode_noop,</div><div class='add'>+	[OP_LAYOUTRETURN]	= nfsd4_encode_noop,</div><div class='ctx'> #endif</div><div class='del'>-	[OP_SECINFO_NO_NAME]	= (nfsd4_enc)nfsd4_encode_secinfo_no_name,</div><div class='del'>-	[OP_SEQUENCE]		= (nfsd4_enc)nfsd4_encode_sequence,</div><div class='del'>-	[OP_SET_SSV]		= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_TEST_STATEID]	= (nfsd4_enc)nfsd4_encode_test_stateid,</div><div class='del'>-	[OP_WANT_DELEGATION]	= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_DESTROY_CLIENTID]	= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_RECLAIM_COMPLETE]	= (nfsd4_enc)nfsd4_encode_noop,</div><div class='add'>+	[OP_SECINFO_NO_NAME]	= nfsd4_encode_secinfo_no_name,</div><div class='add'>+	[OP_SEQUENCE]		= nfsd4_encode_sequence,</div><div class='add'>+	[OP_SET_SSV]		= nfsd4_encode_noop,</div><div class='add'>+	[OP_TEST_STATEID]	= nfsd4_encode_test_stateid,</div><div class='add'>+	[OP_WANT_DELEGATION]	= nfsd4_encode_noop,</div><div class='add'>+	[OP_DESTROY_CLIENTID]	= nfsd4_encode_noop,</div><div class='add'>+	[OP_RECLAIM_COMPLETE]	= nfsd4_encode_noop,</div><div class='ctx'> </div><div class='ctx'> 	/* NFSv4.2 operations */</div><div class='del'>-	[OP_ALLOCATE]		= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_COPY]		= (nfsd4_enc)nfsd4_encode_copy,</div><div class='del'>-	[OP_COPY_NOTIFY]	= (nfsd4_enc)nfsd4_encode_copy_notify,</div><div class='del'>-	[OP_DEALLOCATE]		= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_IO_ADVISE]		= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_LAYOUTERROR]	= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_LAYOUTSTATS]	= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_OFFLOAD_CANCEL]	= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_OFFLOAD_STATUS]	= (nfsd4_enc)nfsd4_encode_offload_status,</div><div class='del'>-	[OP_READ_PLUS]		= (nfsd4_enc)nfsd4_encode_read_plus,</div><div class='del'>-	[OP_SEEK]		= (nfsd4_enc)nfsd4_encode_seek,</div><div class='del'>-	[OP_WRITE_SAME]		= (nfsd4_enc)nfsd4_encode_noop,</div><div class='del'>-	[OP_CLONE]		= (nfsd4_enc)nfsd4_encode_noop,</div><div class='add'>+	[OP_ALLOCATE]		= nfsd4_encode_noop,</div><div class='add'>+	[OP_COPY]		= nfsd4_encode_copy,</div><div class='add'>+	[OP_COPY_NOTIFY]	= nfsd4_encode_copy_notify,</div><div class='add'>+	[OP_DEALLOCATE]		= nfsd4_encode_noop,</div><div class='add'>+	[OP_IO_ADVISE]		= nfsd4_encode_noop,</div><div class='add'>+	[OP_LAYOUTERROR]	= nfsd4_encode_noop,</div><div class='add'>+	[OP_LAYOUTSTATS]	= nfsd4_encode_noop,</div><div class='add'>+	[OP_OFFLOAD_CANCEL]	= nfsd4_encode_noop,</div><div class='add'>+	[OP_OFFLOAD_STATUS]	= nfsd4_encode_offload_status,</div><div class='add'>+	[OP_READ_PLUS]		= nfsd4_encode_read_plus,</div><div class='add'>+	[OP_SEEK]		= nfsd4_encode_seek,</div><div class='add'>+	[OP_WRITE_SAME]		= nfsd4_encode_noop,</div><div class='add'>+	[OP_CLONE]		= nfsd4_encode_noop,</div><div class='ctx'> </div><div class='ctx'> 	/* RFC 8276 extended atributes operations */</div><div class='del'>-	[OP_GETXATTR]		= (nfsd4_enc)nfsd4_encode_getxattr,</div><div class='del'>-	[OP_SETXATTR]		= (nfsd4_enc)nfsd4_encode_setxattr,</div><div class='del'>-	[OP_LISTXATTRS]		= (nfsd4_enc)nfsd4_encode_listxattrs,</div><div class='del'>-	[OP_REMOVEXATTR]	= (nfsd4_enc)nfsd4_encode_removexattr,</div><div class='add'>+	[OP_GETXATTR]		= nfsd4_encode_getxattr,</div><div class='add'>+	[OP_SETXATTR]		= nfsd4_encode_setxattr,</div><div class='add'>+	[OP_LISTXATTRS]		= nfsd4_encode_listxattrs,</div><div class='add'>+	[OP_REMOVEXATTR]	= nfsd4_encode_removexattr,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -5301,6 +5864,23 @@ __be32 nfsd4_check_resp_size(struct nfsd4_compoundres *resp, u32 respsize)</div><div class='ctx'> 	return nfserr_rep_too_big;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static __be32 nfsd4_map_status(__be32 status, u32 minor)</div><div class='add'>+{</div><div class='add'>+	switch (status) {</div><div class='add'>+	case nfs_ok:</div><div class='add'>+		break;</div><div class='add'>+	case nfserr_wrong_type:</div><div class='add'>+		/* RFC 8881 - 15.1.2.9 */</div><div class='add'>+		if (minor == 0)</div><div class='add'>+			status = nfserr_inval;</div><div class='add'>+		break;</div><div class='add'>+	case nfserr_symlink_not_dir:</div><div class='add'>+		status = nfserr_symlink;</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+	return status;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> void</div><div class='ctx'> nfsd4_encode_operation(struct nfsd4_compoundres *resp, struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='hunk'>@@ -5308,17 +5888,14 @@ nfsd4_encode_operation(struct nfsd4_compoundres *resp, struct nfsd4_op *op)</div><div class='ctx'> 	struct nfs4_stateowner *so = resp-&gt;cstate.replay_owner;</div><div class='ctx'> 	struct svc_rqst *rqstp = resp-&gt;rqstp;</div><div class='ctx'> 	const struct nfsd4_operation *opdesc = op-&gt;opdesc;</div><div class='del'>-	int post_err_offset;</div><div class='add'>+	unsigned int op_status_offset;</div><div class='ctx'> 	nfsd4_enc encoder;</div><div class='del'>-	__be32 *p;</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, 8);</div><div class='del'>-	if (!p) {</div><div class='del'>-		WARN_ON_ONCE(1);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-	*p++ = cpu_to_be32(op-&gt;opnum);</div><div class='del'>-	post_err_offset = xdr-&gt;buf-&gt;len;</div><div class='add'>+	if (xdr_stream_encode_u32(xdr, op-&gt;opnum) != XDR_UNIT)</div><div class='add'>+		goto release;</div><div class='add'>+	op_status_offset = xdr-&gt;buf-&gt;len;</div><div class='add'>+	if (!xdr_reserve_space(xdr, XDR_UNIT))</div><div class='add'>+		goto release;</div><div class='ctx'> </div><div class='ctx'> 	if (op-&gt;opnum == OP_ILLEGAL)</div><div class='ctx'> 		goto status;</div><div class='hunk'>@@ -5331,8 +5908,6 @@ nfsd4_encode_operation(struct nfsd4_compoundres *resp, struct nfsd4_op *op)</div><div class='ctx'> 	op-&gt;status = encoder(resp, op-&gt;status, &amp;op-&gt;u);</div><div class='ctx'> 	if (op-&gt;status)</div><div class='ctx'> 		trace_nfsd_compound_encode_err(rqstp, op-&gt;opnum, op-&gt;status);</div><div class='del'>-	if (opdesc &amp;&amp; opdesc-&gt;op_release)</div><div class='del'>-		opdesc-&gt;op_release(&amp;op-&gt;u);</div><div class='ctx'> 	xdr_commit_encode(xdr);</div><div class='ctx'> </div><div class='ctx'> 	/* nfsd4_check_resp_size guarantees enough room for error status */</div><div class='hunk'>@@ -5361,42 +5936,49 @@ nfsd4_encode_operation(struct nfsd4_compoundres *resp, struct nfsd4_op *op)</div><div class='ctx'> 		 * bug if we had to do this on a non-idempotent op:</div><div class='ctx'> 		 */</div><div class='ctx'> 		warn_on_nonidempotent_op(op);</div><div class='del'>-		xdr_truncate_encode(xdr, post_err_offset);</div><div class='del'>-	}</div><div class='del'>-	if (so) {</div><div class='del'>-		int len = xdr-&gt;buf-&gt;len - post_err_offset;</div><div class='add'>+		xdr_truncate_encode(xdr, op_status_offset + XDR_UNIT);</div><div class='add'>+	} else if (so) {</div><div class='add'>+		int len = xdr-&gt;buf-&gt;len - (op_status_offset + XDR_UNIT);</div><div class='ctx'> </div><div class='ctx'> 		so-&gt;so_replay.rp_status = op-&gt;status;</div><div class='ctx'> 		so-&gt;so_replay.rp_buflen = len;</div><div class='del'>-		read_bytes_from_xdr_buf(xdr-&gt;buf, post_err_offset,</div><div class='add'>+		read_bytes_from_xdr_buf(xdr-&gt;buf, op_status_offset + XDR_UNIT,</div><div class='ctx'> 						so-&gt;so_replay.rp_buf, len);</div><div class='ctx'> 	}</div><div class='ctx'> status:</div><div class='del'>-	/* Note that op-&gt;status is already in network byte order: */</div><div class='del'>-	write_bytes_to_xdr_buf(xdr-&gt;buf, post_err_offset - 4, &amp;op-&gt;status, 4);</div><div class='add'>+	op-&gt;status = nfsd4_map_status(op-&gt;status,</div><div class='add'>+				      resp-&gt;cstate.minorversion);</div><div class='add'>+	write_bytes_to_xdr_buf(xdr-&gt;buf, op_status_offset,</div><div class='add'>+			       &amp;op-&gt;status, XDR_UNIT);</div><div class='add'>+release:</div><div class='add'>+	if (opdesc &amp;&amp; opdesc-&gt;op_release)</div><div class='add'>+		opdesc-&gt;op_release(&amp;op-&gt;u);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Account for pages consumed while encoding this operation.</div><div class='add'>+	 * The xdr_stream primitives don't manage rq_next_page.</div><div class='add'>+	 */</div><div class='add'>+	rqstp-&gt;rq_next_page = xdr-&gt;page_ptr + 1;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* </div><div class='del'>- * Encode the reply stored in the stateowner reply cache </div><div class='del'>- * </div><div class='del'>- * XDR note: do not encode rp-&gt;rp_buflen: the buffer contains the</div><div class='del'>- * previously sent already encoded operation.</div><div class='add'>+/**</div><div class='add'>+ * nfsd4_encode_replay - encode a result stored in the stateowner reply cache</div><div class='add'>+ * @xdr: send buffer's XDR stream</div><div class='add'>+ * @op: operation being replayed</div><div class='add'>+ *</div><div class='add'>+ * @op-&gt;replay-&gt;rp_buf contains the previously-sent already-encoded result.</div><div class='ctx'>  */</div><div class='del'>-void</div><div class='del'>-nfsd4_encode_replay(struct xdr_stream *xdr, struct nfsd4_op *op)</div><div class='add'>+void nfsd4_encode_replay(struct xdr_stream *xdr, struct nfsd4_op *op)</div><div class='ctx'> {</div><div class='del'>-	__be32 *p;</div><div class='ctx'> 	struct nfs4_replay *rp = op-&gt;replay;</div><div class='ctx'> </div><div class='del'>-	p = xdr_reserve_space(xdr, 8 + rp-&gt;rp_buflen);</div><div class='del'>-	if (!p) {</div><div class='del'>-		WARN_ON_ONCE(1);</div><div class='del'>-		return;</div><div class='del'>-	}</div><div class='del'>-	*p++ = cpu_to_be32(op-&gt;opnum);</div><div class='del'>-	*p++ = rp-&gt;rp_status;  /* already xdr'ed */</div><div class='add'>+	trace_nfsd_stateowner_replay(op-&gt;opnum, rp);</div><div class='ctx'> </div><div class='del'>-	p = xdr_encode_opaque_fixed(p, rp-&gt;rp_buf, rp-&gt;rp_buflen);</div><div class='add'>+	if (xdr_stream_encode_u32(xdr, op-&gt;opnum) != XDR_UNIT)</div><div class='add'>+		return;</div><div class='add'>+	if (xdr_stream_encode_be32(xdr, rp-&gt;rp_status) != XDR_UNIT)</div><div class='add'>+		return;</div><div class='add'>+	xdr_stream_encode_opaque_fixed(xdr, rp-&gt;rp_buf, rp-&gt;rp_buflen);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void nfsd4_release_compoundargs(struct svc_rqst *rqstp)</div><div class='hunk'>@@ -5404,7 +5986,7 @@ void nfsd4_release_compoundargs(struct svc_rqst *rqstp)</div><div class='ctx'> 	struct nfsd4_compoundargs *args = rqstp-&gt;rq_argp;</div><div class='ctx'> </div><div class='ctx'> 	if (args-&gt;ops != args-&gt;iops) {</div><div class='del'>-		kfree(args-&gt;ops);</div><div class='add'>+		vfree(args-&gt;ops);</div><div class='ctx'> 		args-&gt;ops = args-&gt;iops;</div><div class='ctx'> 	}</div><div class='ctx'> 	while (args-&gt;to_free) {</div><div class='hunk'>@@ -5433,12 +6015,8 @@ bool</div><div class='ctx'> nfs4svc_encode_compoundres(struct svc_rqst *rqstp, struct xdr_stream *xdr)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd4_compoundres *resp = rqstp-&gt;rq_resp;</div><div class='del'>-	struct xdr_buf *buf = xdr-&gt;buf;</div><div class='ctx'> 	__be32 *p;</div><div class='ctx'> </div><div class='del'>-	WARN_ON_ONCE(buf-&gt;len != buf-&gt;head[0].iov_len + buf-&gt;page_len +</div><div class='del'>-				 buf-&gt;tail[0].iov_len);</div><div class='del'>-</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Send buffer space for the following items is reserved</div><div class='ctx'> 	 * at the top of nfsd4_proc_compound().</div><div class='hunk'>@@ -5446,9 +6024,6 @@ nfs4svc_encode_compoundres(struct svc_rqst *rqstp, struct xdr_stream *xdr)</div><div class='ctx'> 	p = resp-&gt;statusp;</div><div class='ctx'> </div><div class='ctx'> 	*p++ = resp-&gt;cstate.status;</div><div class='del'>-</div><div class='del'>-	rqstp-&gt;rq_next_page = xdr-&gt;page_ptr + 1;</div><div class='del'>-</div><div class='ctx'> 	*p++ = htonl(resp-&gt;taglen);</div><div class='ctx'> 	memcpy(p, resp-&gt;tag, resp-&gt;taglen);</div><div class='ctx'> 	p += XDR_QUADLEN(resp-&gt;taglen);</div><div class='head'>diff --git a/fs/nfsd/nfs4xdr_gen.c b/fs/nfsd/nfs4xdr_gen.c<br/>new file mode 100644<br/>index 000000000000..a17b5d8e60b3<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfs4xdr_gen.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/nfs4xdr_gen.c</a></div><div class='hunk'>@@ -0,0 +1,256 @@</div><div class='add'>+// SPDX-License-Identifier: GPL-2.0</div><div class='add'>+// Generated by xdrgen. Manual edits will be lost.</div><div class='add'>+// XDR specification file: ../../Documentation/sunrpc/xdr/nfs4_1.x</div><div class='add'>+// XDR specification modification time: Mon Oct 14 09:10:13 2024</div><div class='add'>+</div><div class='add'>+#include &lt;linux/sunrpc/svc.h&gt;</div><div class='add'>+</div><div class='add'>+#include "nfs4xdr_gen.h"</div><div class='add'>+</div><div class='add'>+static bool __maybe_unused</div><div class='add'>+xdrgen_decode_int64_t(struct xdr_stream *xdr, int64_t *ptr)</div><div class='add'>+{</div><div class='add'>+	return xdrgen_decode_hyper(xdr, ptr);</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static bool __maybe_unused</div><div class='add'>+xdrgen_decode_uint32_t(struct xdr_stream *xdr, uint32_t *ptr)</div><div class='add'>+{</div><div class='add'>+	return xdrgen_decode_unsigned_int(xdr, ptr);</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static bool __maybe_unused</div><div class='add'>+xdrgen_decode_bitmap4(struct xdr_stream *xdr, bitmap4 *ptr)</div><div class='add'>+{</div><div class='add'>+	if (xdr_stream_decode_u32(xdr, &amp;ptr-&gt;count) &lt; 0)</div><div class='add'>+		return false;</div><div class='add'>+	for (u32 i = 0; i &lt; ptr-&gt;count; i++)</div><div class='add'>+		if (!xdrgen_decode_uint32_t(xdr, &amp;ptr-&gt;element[i]))</div><div class='add'>+			return false;</div><div class='add'>+	return true;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static bool __maybe_unused</div><div class='add'>+xdrgen_decode_nfstime4(struct xdr_stream *xdr, struct nfstime4 *ptr)</div><div class='add'>+{</div><div class='add'>+	if (!xdrgen_decode_int64_t(xdr, &amp;ptr-&gt;seconds))</div><div class='add'>+		return false;</div><div class='add'>+	if (!xdrgen_decode_uint32_t(xdr, &amp;ptr-&gt;nseconds))</div><div class='add'>+		return false;</div><div class='add'>+	return true;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static bool __maybe_unused</div><div class='add'>+xdrgen_decode_fattr4_offline(struct xdr_stream *xdr, fattr4_offline *ptr)</div><div class='add'>+{</div><div class='add'>+	return xdrgen_decode_bool(xdr, ptr);</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static bool __maybe_unused</div><div class='add'>+xdrgen_decode_open_arguments4(struct xdr_stream *xdr, struct open_arguments4 *ptr)</div><div class='add'>+{</div><div class='add'>+	if (!xdrgen_decode_bitmap4(xdr, &amp;ptr-&gt;oa_share_access))</div><div class='add'>+		return false;</div><div class='add'>+	if (!xdrgen_decode_bitmap4(xdr, &amp;ptr-&gt;oa_share_deny))</div><div class='add'>+		return false;</div><div class='add'>+	if (!xdrgen_decode_bitmap4(xdr, &amp;ptr-&gt;oa_share_access_want))</div><div class='add'>+		return false;</div><div class='add'>+	if (!xdrgen_decode_bitmap4(xdr, &amp;ptr-&gt;oa_open_claim))</div><div class='add'>+		return false;</div><div class='add'>+	if (!xdrgen_decode_bitmap4(xdr, &amp;ptr-&gt;oa_create_mode))</div><div class='add'>+		return false;</div><div class='add'>+	return true;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static bool __maybe_unused</div><div class='add'>+xdrgen_decode_open_args_share_access4(struct xdr_stream *xdr, open_args_share_access4 *ptr)</div><div class='add'>+{</div><div class='add'>+	u32 val;</div><div class='add'>+</div><div class='add'>+	if (xdr_stream_decode_u32(xdr, &amp;val) &lt; 0)</div><div class='add'>+		return false;</div><div class='add'>+	*ptr = val;</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool __maybe_unused</div><div class='add'>+xdrgen_decode_open_args_share_deny4(struct xdr_stream *xdr, open_args_share_deny4 *ptr)</div><div class='add'>+{</div><div class='add'>+	u32 val;</div><div class='add'>+</div><div class='add'>+	if (xdr_stream_decode_u32(xdr, &amp;val) &lt; 0)</div><div class='add'>+		return false;</div><div class='add'>+	*ptr = val;</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool __maybe_unused</div><div class='add'>+xdrgen_decode_open_args_share_access_want4(struct xdr_stream *xdr, open_args_share_access_want4 *ptr)</div><div class='add'>+{</div><div class='add'>+	u32 val;</div><div class='add'>+</div><div class='add'>+	if (xdr_stream_decode_u32(xdr, &amp;val) &lt; 0)</div><div class='add'>+		return false;</div><div class='add'>+	*ptr = val;</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool __maybe_unused</div><div class='add'>+xdrgen_decode_open_args_open_claim4(struct xdr_stream *xdr, open_args_open_claim4 *ptr)</div><div class='add'>+{</div><div class='add'>+	u32 val;</div><div class='add'>+</div><div class='add'>+	if (xdr_stream_decode_u32(xdr, &amp;val) &lt; 0)</div><div class='add'>+		return false;</div><div class='add'>+	*ptr = val;</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool __maybe_unused</div><div class='add'>+xdrgen_decode_open_args_createmode4(struct xdr_stream *xdr, open_args_createmode4 *ptr)</div><div class='add'>+{</div><div class='add'>+	u32 val;</div><div class='add'>+</div><div class='add'>+	if (xdr_stream_decode_u32(xdr, &amp;val) &lt; 0)</div><div class='add'>+		return false;</div><div class='add'>+	*ptr = val;</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool</div><div class='add'>+xdrgen_decode_fattr4_open_arguments(struct xdr_stream *xdr, fattr4_open_arguments *ptr)</div><div class='add'>+{</div><div class='add'>+	return xdrgen_decode_open_arguments4(xdr, ptr);</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+bool</div><div class='add'>+xdrgen_decode_fattr4_time_deleg_access(struct xdr_stream *xdr, fattr4_time_deleg_access *ptr)</div><div class='add'>+{</div><div class='add'>+	return xdrgen_decode_nfstime4(xdr, ptr);</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+bool</div><div class='add'>+xdrgen_decode_fattr4_time_deleg_modify(struct xdr_stream *xdr, fattr4_time_deleg_modify *ptr)</div><div class='add'>+{</div><div class='add'>+	return xdrgen_decode_nfstime4(xdr, ptr);</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static bool __maybe_unused</div><div class='add'>+xdrgen_decode_open_delegation_type4(struct xdr_stream *xdr, open_delegation_type4 *ptr)</div><div class='add'>+{</div><div class='add'>+	u32 val;</div><div class='add'>+</div><div class='add'>+	if (xdr_stream_decode_u32(xdr, &amp;val) &lt; 0)</div><div class='add'>+		return false;</div><div class='add'>+	*ptr = val;</div><div class='add'>+	return true;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool __maybe_unused</div><div class='add'>+xdrgen_encode_int64_t(struct xdr_stream *xdr, const int64_t value)</div><div class='add'>+{</div><div class='add'>+	return xdrgen_encode_hyper(xdr, value);</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static bool __maybe_unused</div><div class='add'>+xdrgen_encode_uint32_t(struct xdr_stream *xdr, const uint32_t value)</div><div class='add'>+{</div><div class='add'>+	return xdrgen_encode_unsigned_int(xdr, value);</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static bool __maybe_unused</div><div class='add'>+xdrgen_encode_bitmap4(struct xdr_stream *xdr, const bitmap4 value)</div><div class='add'>+{</div><div class='add'>+	if (xdr_stream_encode_u32(xdr, value.count) != XDR_UNIT)</div><div class='add'>+		return false;</div><div class='add'>+	for (u32 i = 0; i &lt; value.count; i++)</div><div class='add'>+		if (!xdrgen_encode_uint32_t(xdr, value.element[i]))</div><div class='add'>+			return false;</div><div class='add'>+	return true;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static bool __maybe_unused</div><div class='add'>+xdrgen_encode_nfstime4(struct xdr_stream *xdr, const struct nfstime4 *value)</div><div class='add'>+{</div><div class='add'>+	if (!xdrgen_encode_int64_t(xdr, value-&gt;seconds))</div><div class='add'>+		return false;</div><div class='add'>+	if (!xdrgen_encode_uint32_t(xdr, value-&gt;nseconds))</div><div class='add'>+		return false;</div><div class='add'>+	return true;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static bool __maybe_unused</div><div class='add'>+xdrgen_encode_fattr4_offline(struct xdr_stream *xdr, const fattr4_offline value)</div><div class='add'>+{</div><div class='add'>+	return xdrgen_encode_bool(xdr, value);</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static bool __maybe_unused</div><div class='add'>+xdrgen_encode_open_arguments4(struct xdr_stream *xdr, const struct open_arguments4 *value)</div><div class='add'>+{</div><div class='add'>+	if (!xdrgen_encode_bitmap4(xdr, value-&gt;oa_share_access))</div><div class='add'>+		return false;</div><div class='add'>+	if (!xdrgen_encode_bitmap4(xdr, value-&gt;oa_share_deny))</div><div class='add'>+		return false;</div><div class='add'>+	if (!xdrgen_encode_bitmap4(xdr, value-&gt;oa_share_access_want))</div><div class='add'>+		return false;</div><div class='add'>+	if (!xdrgen_encode_bitmap4(xdr, value-&gt;oa_open_claim))</div><div class='add'>+		return false;</div><div class='add'>+	if (!xdrgen_encode_bitmap4(xdr, value-&gt;oa_create_mode))</div><div class='add'>+		return false;</div><div class='add'>+	return true;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static bool __maybe_unused</div><div class='add'>+xdrgen_encode_open_args_share_access4(struct xdr_stream *xdr, open_args_share_access4 value)</div><div class='add'>+{</div><div class='add'>+	return xdr_stream_encode_u32(xdr, value) == XDR_UNIT;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool __maybe_unused</div><div class='add'>+xdrgen_encode_open_args_share_deny4(struct xdr_stream *xdr, open_args_share_deny4 value)</div><div class='add'>+{</div><div class='add'>+	return xdr_stream_encode_u32(xdr, value) == XDR_UNIT;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool __maybe_unused</div><div class='add'>+xdrgen_encode_open_args_share_access_want4(struct xdr_stream *xdr, open_args_share_access_want4 value)</div><div class='add'>+{</div><div class='add'>+	return xdr_stream_encode_u32(xdr, value) == XDR_UNIT;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool __maybe_unused</div><div class='add'>+xdrgen_encode_open_args_open_claim4(struct xdr_stream *xdr, open_args_open_claim4 value)</div><div class='add'>+{</div><div class='add'>+	return xdr_stream_encode_u32(xdr, value) == XDR_UNIT;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static bool __maybe_unused</div><div class='add'>+xdrgen_encode_open_args_createmode4(struct xdr_stream *xdr, open_args_createmode4 value)</div><div class='add'>+{</div><div class='add'>+	return xdr_stream_encode_u32(xdr, value) == XDR_UNIT;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool</div><div class='add'>+xdrgen_encode_fattr4_open_arguments(struct xdr_stream *xdr, const fattr4_open_arguments *value)</div><div class='add'>+{</div><div class='add'>+	return xdrgen_encode_open_arguments4(xdr, value);</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+bool</div><div class='add'>+xdrgen_encode_fattr4_time_deleg_access(struct xdr_stream *xdr, const fattr4_time_deleg_access *value)</div><div class='add'>+{</div><div class='add'>+	return xdrgen_encode_nfstime4(xdr, value);</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+bool</div><div class='add'>+xdrgen_encode_fattr4_time_deleg_modify(struct xdr_stream *xdr, const fattr4_time_deleg_modify *value)</div><div class='add'>+{</div><div class='add'>+	return xdrgen_encode_nfstime4(xdr, value);</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+static bool __maybe_unused</div><div class='add'>+xdrgen_encode_open_delegation_type4(struct xdr_stream *xdr, open_delegation_type4 value)</div><div class='add'>+{</div><div class='add'>+	return xdr_stream_encode_u32(xdr, value) == XDR_UNIT;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/nfsd/nfs4xdr_gen.h b/fs/nfsd/nfs4xdr_gen.h<br/>new file mode 100644<br/>index 000000000000..41a0033b7256<br/>--- /dev/null<br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfs4xdr_gen.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/nfs4xdr_gen.h</a></div><div class='hunk'>@@ -0,0 +1,25 @@</div><div class='add'>+/* SPDX-License-Identifier: GPL-2.0 */</div><div class='add'>+/* Generated by xdrgen. Manual edits will be lost. */</div><div class='add'>+/* XDR specification file: ../../Documentation/sunrpc/xdr/nfs4_1.x */</div><div class='add'>+/* XDR specification modification time: Mon Oct 14 09:10:13 2024 */</div><div class='add'>+</div><div class='add'>+#ifndef _LINUX_XDRGEN_NFS4_1_DECL_H</div><div class='add'>+#define _LINUX_XDRGEN_NFS4_1_DECL_H</div><div class='add'>+</div><div class='add'>+#include &lt;linux/types.h&gt;</div><div class='add'>+</div><div class='add'>+#include &lt;linux/sunrpc/xdr.h&gt;</div><div class='add'>+#include &lt;linux/sunrpc/xdrgen/_defs.h&gt;</div><div class='add'>+#include &lt;linux/sunrpc/xdrgen/_builtins.h&gt;</div><div class='add'>+#include &lt;linux/sunrpc/xdrgen/nfs4_1.h&gt;</div><div class='add'>+</div><div class='add'>+bool xdrgen_decode_fattr4_open_arguments(struct xdr_stream *xdr, fattr4_open_arguments *ptr);</div><div class='add'>+bool xdrgen_encode_fattr4_open_arguments(struct xdr_stream *xdr, const fattr4_open_arguments *value);</div><div class='add'>+</div><div class='add'>+bool xdrgen_decode_fattr4_time_deleg_access(struct xdr_stream *xdr, fattr4_time_deleg_access *ptr);</div><div class='add'>+bool xdrgen_encode_fattr4_time_deleg_access(struct xdr_stream *xdr, const fattr4_time_deleg_access *value);</div><div class='add'>+</div><div class='add'>+bool xdrgen_decode_fattr4_time_deleg_modify(struct xdr_stream *xdr, fattr4_time_deleg_modify *ptr);</div><div class='add'>+bool xdrgen_encode_fattr4_time_deleg_modify(struct xdr_stream *xdr, const fattr4_time_deleg_modify *value);</div><div class='add'>+</div><div class='add'>+#endif /* _LINUX_XDRGEN_NFS4_1_DECL_H */</div><div class='head'>diff --git a/fs/nfsd/nfscache.c b/fs/nfsd/nfscache.c<br/>index 6e0b6f3148dc..ab13ee9c7fd8 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfscache.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfscache.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfscache.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/nfscache.c</a></div><div class='hunk'>@@ -27,7 +27,7 @@</div><div class='ctx'>  * cache size, the idea being that when the cache is at its maximum number</div><div class='ctx'>  * of entries, then this should be the average number of entries per bucket.</div><div class='ctx'>  */</div><div class='del'>-#define TARGET_BUCKET_SIZE	64</div><div class='add'>+#define TARGET_BUCKET_SIZE	8</div><div class='ctx'> </div><div class='ctx'> struct nfsd_drc_bucket {</div><div class='ctx'> 	struct rb_root rb_head;</div><div class='hunk'>@@ -84,17 +84,11 @@ nfsd_hashsize(unsigned int limit)</div><div class='ctx'> 	return roundup_pow_of_two(limit / TARGET_BUCKET_SIZE);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static u32</div><div class='del'>-nfsd_cache_hash(__be32 xid, struct nfsd_net *nn)</div><div class='add'>+static struct nfsd_cacherep *</div><div class='add'>+nfsd_cacherep_alloc(struct svc_rqst *rqstp, __wsum csum,</div><div class='add'>+		    struct nfsd_net *nn)</div><div class='ctx'> {</div><div class='del'>-	return hash_32(be32_to_cpu(xid), nn-&gt;maskbits);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static struct svc_cacherep *</div><div class='del'>-nfsd_reply_cache_alloc(struct svc_rqst *rqstp, __wsum csum,</div><div class='del'>-			struct nfsd_net *nn)</div><div class='del'>-{</div><div class='del'>-	struct svc_cacherep	*rp;</div><div class='add'>+	struct nfsd_cacherep *rp;</div><div class='ctx'> </div><div class='ctx'> 	rp = kmem_cache_alloc(drc_slab, GFP_KERNEL);</div><div class='ctx'> 	if (rp) {</div><div class='hunk'>@@ -116,36 +110,63 @@ nfsd_reply_cache_alloc(struct svc_rqst *rqstp, __wsum csum,</div><div class='ctx'> 	return rp;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void</div><div class='del'>-nfsd_reply_cache_free_locked(struct nfsd_drc_bucket *b, struct svc_cacherep *rp,</div><div class='del'>-				struct nfsd_net *nn)</div><div class='add'>+static void nfsd_cacherep_free(struct nfsd_cacherep *rp)</div><div class='ctx'> {</div><div class='del'>-	if (rp-&gt;c_type == RC_REPLBUFF &amp;&amp; rp-&gt;c_replvec.iov_base) {</div><div class='del'>-		nfsd_stats_drc_mem_usage_sub(nn, rp-&gt;c_replvec.iov_len);</div><div class='add'>+	if (rp-&gt;c_type == RC_REPLBUFF)</div><div class='ctx'> 		kfree(rp-&gt;c_replvec.iov_base);</div><div class='add'>+	kmem_cache_free(drc_slab, rp);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static unsigned long</div><div class='add'>+nfsd_cacherep_dispose(struct list_head *dispose)</div><div class='add'>+{</div><div class='add'>+	struct nfsd_cacherep *rp;</div><div class='add'>+	unsigned long freed = 0;</div><div class='add'>+</div><div class='add'>+	while (!list_empty(dispose)) {</div><div class='add'>+		rp = list_first_entry(dispose, struct nfsd_cacherep, c_lru);</div><div class='add'>+		list_del(&amp;rp-&gt;c_lru);</div><div class='add'>+		nfsd_cacherep_free(rp);</div><div class='add'>+		freed++;</div><div class='ctx'> 	}</div><div class='add'>+	return freed;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+nfsd_cacherep_unlink_locked(struct nfsd_net *nn, struct nfsd_drc_bucket *b,</div><div class='add'>+			    struct nfsd_cacherep *rp)</div><div class='add'>+{</div><div class='add'>+	if (rp-&gt;c_type == RC_REPLBUFF &amp;&amp; rp-&gt;c_replvec.iov_base)</div><div class='add'>+		nfsd_stats_drc_mem_usage_sub(nn, rp-&gt;c_replvec.iov_len);</div><div class='ctx'> 	if (rp-&gt;c_state != RC_UNUSED) {</div><div class='ctx'> 		rb_erase(&amp;rp-&gt;c_node, &amp;b-&gt;rb_head);</div><div class='ctx'> 		list_del(&amp;rp-&gt;c_lru);</div><div class='ctx'> 		atomic_dec(&amp;nn-&gt;num_drc_entries);</div><div class='ctx'> 		nfsd_stats_drc_mem_usage_sub(nn, sizeof(*rp));</div><div class='ctx'> 	}</div><div class='del'>-	kmem_cache_free(drc_slab, rp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void</div><div class='del'>-nfsd_reply_cache_free(struct nfsd_drc_bucket *b, struct svc_cacherep *rp,</div><div class='add'>+nfsd_reply_cache_free_locked(struct nfsd_drc_bucket *b, struct nfsd_cacherep *rp,</div><div class='add'>+				struct nfsd_net *nn)</div><div class='add'>+{</div><div class='add'>+	nfsd_cacherep_unlink_locked(nn, b, rp);</div><div class='add'>+	nfsd_cacherep_free(rp);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void</div><div class='add'>+nfsd_reply_cache_free(struct nfsd_drc_bucket *b, struct nfsd_cacherep *rp,</div><div class='ctx'> 			struct nfsd_net *nn)</div><div class='ctx'> {</div><div class='ctx'> 	spin_lock(&amp;b-&gt;cache_lock);</div><div class='del'>-	nfsd_reply_cache_free_locked(b, rp, nn);</div><div class='add'>+	nfsd_cacherep_unlink_locked(nn, b, rp);</div><div class='ctx'> 	spin_unlock(&amp;b-&gt;cache_lock);</div><div class='add'>+	nfsd_cacherep_free(rp);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int nfsd_drc_slab_create(void)</div><div class='ctx'> {</div><div class='del'>-	drc_slab = kmem_cache_create("nfsd_drc",</div><div class='del'>-				sizeof(struct svc_cacherep), 0, 0, NULL);</div><div class='add'>+	drc_slab = KMEM_CACHE(nfsd_cacherep, 0);</div><div class='ctx'> 	return drc_slab ? 0: -ENOMEM;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -154,43 +175,33 @@ void nfsd_drc_slab_free(void)</div><div class='ctx'> 	kmem_cache_destroy(drc_slab);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int nfsd_reply_cache_stats_init(struct nfsd_net *nn)</div><div class='del'>-{</div><div class='del'>-	return nfsd_percpu_counters_init(nn-&gt;counter, NFSD_NET_COUNTERS_NUM);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void nfsd_reply_cache_stats_destroy(struct nfsd_net *nn)</div><div class='del'>-{</div><div class='del'>-	nfsd_percpu_counters_destroy(nn-&gt;counter, NFSD_NET_COUNTERS_NUM);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> int nfsd_reply_cache_init(struct nfsd_net *nn)</div><div class='ctx'> {</div><div class='ctx'> 	unsigned int hashsize;</div><div class='ctx'> 	unsigned int i;</div><div class='del'>-	int status = 0;</div><div class='ctx'> </div><div class='ctx'> 	nn-&gt;max_drc_entries = nfsd_cache_size_limit();</div><div class='ctx'> 	atomic_set(&amp;nn-&gt;num_drc_entries, 0);</div><div class='ctx'> 	hashsize = nfsd_hashsize(nn-&gt;max_drc_entries);</div><div class='ctx'> 	nn-&gt;maskbits = ilog2(hashsize);</div><div class='ctx'> </div><div class='del'>-	status = nfsd_reply_cache_stats_init(nn);</div><div class='del'>-	if (status)</div><div class='del'>-		goto out_nomem;</div><div class='del'>-</div><div class='del'>-	nn-&gt;nfsd_reply_cache_shrinker.scan_objects = nfsd_reply_cache_scan;</div><div class='del'>-	nn-&gt;nfsd_reply_cache_shrinker.count_objects = nfsd_reply_cache_count;</div><div class='del'>-	nn-&gt;nfsd_reply_cache_shrinker.seeks = 1;</div><div class='del'>-	status = register_shrinker(&amp;nn-&gt;nfsd_reply_cache_shrinker);</div><div class='del'>-	if (status)</div><div class='del'>-		goto out_stats_destroy;</div><div class='del'>-</div><div class='ctx'> 	nn-&gt;drc_hashtbl = kvzalloc(array_size(hashsize,</div><div class='ctx'> 				sizeof(*nn-&gt;drc_hashtbl)), GFP_KERNEL);</div><div class='ctx'> 	if (!nn-&gt;drc_hashtbl)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	nn-&gt;nfsd_reply_cache_shrinker = shrinker_alloc(0, "nfsd-reply:%s",</div><div class='add'>+						       nn-&gt;nfsd_name);</div><div class='add'>+	if (!nn-&gt;nfsd_reply_cache_shrinker)</div><div class='ctx'> 		goto out_shrinker;</div><div class='ctx'> </div><div class='add'>+	nn-&gt;nfsd_reply_cache_shrinker-&gt;scan_objects = nfsd_reply_cache_scan;</div><div class='add'>+	nn-&gt;nfsd_reply_cache_shrinker-&gt;count_objects = nfsd_reply_cache_count;</div><div class='add'>+	nn-&gt;nfsd_reply_cache_shrinker-&gt;seeks = 1;</div><div class='add'>+	nn-&gt;nfsd_reply_cache_shrinker-&gt;private_data = nn;</div><div class='add'>+</div><div class='add'>+	shrinker_register(nn-&gt;nfsd_reply_cache_shrinker);</div><div class='add'>+</div><div class='ctx'> 	for (i = 0; i &lt; hashsize; i++) {</div><div class='ctx'> 		INIT_LIST_HEAD(&amp;nn-&gt;drc_hashtbl[i].lru_head);</div><div class='ctx'> 		spin_lock_init(&amp;nn-&gt;drc_hashtbl[i].cache_lock);</div><div class='hunk'>@@ -199,26 +210,22 @@ int nfsd_reply_cache_init(struct nfsd_net *nn)</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='ctx'> out_shrinker:</div><div class='del'>-	unregister_shrinker(&amp;nn-&gt;nfsd_reply_cache_shrinker);</div><div class='del'>-out_stats_destroy:</div><div class='del'>-	nfsd_reply_cache_stats_destroy(nn);</div><div class='del'>-out_nomem:</div><div class='add'>+	kvfree(nn-&gt;drc_hashtbl);</div><div class='ctx'> 	printk(KERN_ERR "nfsd: failed to allocate reply cache\n");</div><div class='ctx'> 	return -ENOMEM;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void nfsd_reply_cache_shutdown(struct nfsd_net *nn)</div><div class='ctx'> {</div><div class='del'>-	struct svc_cacherep	*rp;</div><div class='add'>+	struct nfsd_cacherep *rp;</div><div class='ctx'> 	unsigned int i;</div><div class='ctx'> </div><div class='del'>-	nfsd_reply_cache_stats_destroy(nn);</div><div class='del'>-	unregister_shrinker(&amp;nn-&gt;nfsd_reply_cache_shrinker);</div><div class='add'>+	shrinker_free(nn-&gt;nfsd_reply_cache_shrinker);</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; nn-&gt;drc_hashsize; i++) {</div><div class='ctx'> 		struct list_head *head = &amp;nn-&gt;drc_hashtbl[i].lru_head;</div><div class='ctx'> 		while (!list_empty(head)) {</div><div class='del'>-			rp = list_first_entry(head, struct svc_cacherep, c_lru);</div><div class='add'>+			rp = list_first_entry(head, struct nfsd_cacherep, c_lru);</div><div class='ctx'> 			nfsd_reply_cache_free_locked(&amp;nn-&gt;drc_hashtbl[i],</div><div class='ctx'> 									rp, nn);</div><div class='ctx'> 		}</div><div class='hunk'>@@ -230,111 +237,149 @@ void nfsd_reply_cache_shutdown(struct nfsd_net *nn)</div><div class='ctx'> </div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Move cache entry to end of LRU list, and queue the cleaner to run if it's</div><div class='del'>- * not already scheduled.</div><div class='del'>- */</div><div class='ctx'> static void</div><div class='del'>-lru_put_end(struct nfsd_drc_bucket *b, struct svc_cacherep *rp)</div><div class='add'>+lru_put_end(struct nfsd_drc_bucket *b, struct nfsd_cacherep *rp)</div><div class='ctx'> {</div><div class='ctx'> 	rp-&gt;c_timestamp = jiffies;</div><div class='ctx'> 	list_move_tail(&amp;rp-&gt;c_lru, &amp;b-&gt;lru_head);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static long prune_bucket(struct nfsd_drc_bucket *b, struct nfsd_net *nn,</div><div class='del'>-			 unsigned int max)</div><div class='add'>+static noinline struct nfsd_drc_bucket *</div><div class='add'>+nfsd_cache_bucket_find(__be32 xid, struct nfsd_net *nn)</div><div class='add'>+{</div><div class='add'>+	unsigned int hash = hash_32((__force u32)xid, nn-&gt;maskbits);</div><div class='add'>+</div><div class='add'>+	return &amp;nn-&gt;drc_hashtbl[hash];</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ * Remove and return no more than @max expired entries in bucket @b.</div><div class='add'>+ * If @max is zero, do not limit the number of removed entries.</div><div class='add'>+ */</div><div class='add'>+static void</div><div class='add'>+nfsd_prune_bucket_locked(struct nfsd_net *nn, struct nfsd_drc_bucket *b,</div><div class='add'>+			 unsigned int max, struct list_head *dispose)</div><div class='ctx'> {</div><div class='del'>-	struct svc_cacherep *rp, *tmp;</div><div class='del'>-	long freed = 0;</div><div class='add'>+	unsigned long expiry = jiffies - RC_EXPIRE;</div><div class='add'>+	struct nfsd_cacherep *rp, *tmp;</div><div class='add'>+	unsigned int freed = 0;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held(&amp;b-&gt;cache_lock);</div><div class='ctx'> </div><div class='add'>+	/* The bucket LRU is ordered oldest-first. */</div><div class='ctx'> 	list_for_each_entry_safe(rp, tmp, &amp;b-&gt;lru_head, c_lru) {</div><div class='del'>-		/*</div><div class='del'>-		 * Don't free entries attached to calls that are still</div><div class='del'>-		 * in-progress, but do keep scanning the list.</div><div class='del'>-		 */</div><div class='del'>-		if (rp-&gt;c_state == RC_INPROG)</div><div class='del'>-			continue;</div><div class='ctx'> 		if (atomic_read(&amp;nn-&gt;num_drc_entries) &lt;= nn-&gt;max_drc_entries &amp;&amp;</div><div class='del'>-		    time_before(jiffies, rp-&gt;c_timestamp + RC_EXPIRE))</div><div class='add'>+		    time_before(expiry, rp-&gt;c_timestamp))</div><div class='ctx'> 			break;</div><div class='del'>-		nfsd_reply_cache_free_locked(b, rp, nn);</div><div class='del'>-		if (max &amp;&amp; freed++ &gt; max)</div><div class='add'>+</div><div class='add'>+		nfsd_cacherep_unlink_locked(nn, b, rp);</div><div class='add'>+		list_add(&amp;rp-&gt;c_lru, dispose);</div><div class='add'>+</div><div class='add'>+		if (max &amp;&amp; ++freed &gt; max)</div><div class='ctx'> 			break;</div><div class='ctx'> 	}</div><div class='del'>-	return freed;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static long nfsd_prune_bucket(struct nfsd_drc_bucket *b, struct nfsd_net *nn)</div><div class='add'>+/**</div><div class='add'>+ * nfsd_reply_cache_count - count_objects method for the DRC shrinker</div><div class='add'>+ * @shrink: our registered shrinker context</div><div class='add'>+ * @sc: garbage collection parameters</div><div class='add'>+ *</div><div class='add'>+ * Returns the total number of entries in the duplicate reply cache. To</div><div class='add'>+ * keep things simple and quick, this is not the number of expired entries</div><div class='add'>+ * in the cache (ie, the number that would be removed by a call to</div><div class='add'>+ * nfsd_reply_cache_scan).</div><div class='add'>+ */</div><div class='add'>+static unsigned long</div><div class='add'>+nfsd_reply_cache_count(struct shrinker *shrink, struct shrink_control *sc)</div><div class='ctx'> {</div><div class='del'>-	return prune_bucket(b, nn, 3);</div><div class='add'>+	struct nfsd_net *nn = shrink-&gt;private_data;</div><div class='add'>+</div><div class='add'>+	return atomic_read(&amp;nn-&gt;num_drc_entries);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Walk the LRU list and prune off entries that are older than RC_EXPIRE.</div><div class='del'>- * Also prune the oldest ones when the total exceeds the max number of entries.</div><div class='add'>+/**</div><div class='add'>+ * nfsd_reply_cache_scan - scan_objects method for the DRC shrinker</div><div class='add'>+ * @shrink: our registered shrinker context</div><div class='add'>+ * @sc: garbage collection parameters</div><div class='add'>+ *</div><div class='add'>+ * Free expired entries on each bucket's LRU list until we've released</div><div class='add'>+ * nr_to_scan freed objects. Nothing will be released if the cache</div><div class='add'>+ * has not exceeded it's max_drc_entries limit.</div><div class='add'>+ *</div><div class='add'>+ * Returns the number of entries released by this call.</div><div class='ctx'>  */</div><div class='del'>-static long</div><div class='del'>-prune_cache_entries(struct nfsd_net *nn)</div><div class='add'>+static unsigned long</div><div class='add'>+nfsd_reply_cache_scan(struct shrinker *shrink, struct shrink_control *sc)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd_net *nn = shrink-&gt;private_data;</div><div class='add'>+	unsigned long freed = 0;</div><div class='add'>+	LIST_HEAD(dispose);</div><div class='ctx'> 	unsigned int i;</div><div class='del'>-	long freed = 0;</div><div class='ctx'> </div><div class='ctx'> 	for (i = 0; i &lt; nn-&gt;drc_hashsize; i++) {</div><div class='ctx'> 		struct nfsd_drc_bucket *b = &amp;nn-&gt;drc_hashtbl[i];</div><div class='ctx'> </div><div class='ctx'> 		if (list_empty(&amp;b-&gt;lru_head))</div><div class='ctx'> 			continue;</div><div class='add'>+</div><div class='ctx'> 		spin_lock(&amp;b-&gt;cache_lock);</div><div class='del'>-		freed += prune_bucket(b, nn, 0);</div><div class='add'>+		nfsd_prune_bucket_locked(nn, b, 0, &amp;dispose);</div><div class='ctx'> 		spin_unlock(&amp;b-&gt;cache_lock);</div><div class='add'>+</div><div class='add'>+		freed += nfsd_cacherep_dispose(&amp;dispose);</div><div class='add'>+		if (freed &gt; sc-&gt;nr_to_scan)</div><div class='add'>+			break;</div><div class='ctx'> 	}</div><div class='ctx'> 	return freed;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static unsigned long</div><div class='del'>-nfsd_reply_cache_count(struct shrinker *shrink, struct shrink_control *sc)</div><div class='del'>-{</div><div class='del'>-	struct nfsd_net *nn = container_of(shrink,</div><div class='del'>-				struct nfsd_net, nfsd_reply_cache_shrinker);</div><div class='del'>-</div><div class='del'>-	return atomic_read(&amp;nn-&gt;num_drc_entries);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static unsigned long</div><div class='del'>-nfsd_reply_cache_scan(struct shrinker *shrink, struct shrink_control *sc)</div><div class='del'>-{</div><div class='del'>-	struct nfsd_net *nn = container_of(shrink,</div><div class='del'>-				struct nfsd_net, nfsd_reply_cache_shrinker);</div><div class='del'>-</div><div class='del'>-	return prune_cache_entries(nn);</div><div class='del'>-}</div><div class='del'>-/*</div><div class='del'>- * Walk an xdr_buf and get a CRC for at most the first RC_CSUMLEN bytes</div><div class='add'>+/**</div><div class='add'>+ * nfsd_cache_csum - Checksum incoming NFS Call arguments</div><div class='add'>+ * @buf: buffer containing a whole RPC Call message</div><div class='add'>+ * @start: starting byte of the NFS Call header</div><div class='add'>+ * @remaining: size of the NFS Call header, in bytes</div><div class='add'>+ *</div><div class='add'>+ * Compute a weak checksum of the leading bytes of an NFS procedure</div><div class='add'>+ * call header to help verify that a retransmitted Call matches an</div><div class='add'>+ * entry in the duplicate reply cache.</div><div class='add'>+ *</div><div class='add'>+ * To avoid assumptions about how the RPC message is laid out in</div><div class='add'>+ * @buf and what else it might contain (eg, a GSS MIC suffix), the</div><div class='add'>+ * caller passes us the exact location and length of the NFS Call</div><div class='add'>+ * header.</div><div class='add'>+ *</div><div class='add'>+ * Returns a 32-bit checksum value, as defined in RFC 793.</div><div class='ctx'>  */</div><div class='del'>-static __wsum</div><div class='del'>-nfsd_cache_csum(struct svc_rqst *rqstp)</div><div class='add'>+static __wsum nfsd_cache_csum(struct xdr_buf *buf, unsigned int start,</div><div class='add'>+			      unsigned int remaining)</div><div class='ctx'> {</div><div class='add'>+	unsigned int base, len;</div><div class='add'>+	struct xdr_buf subbuf;</div><div class='add'>+	__wsum csum = 0;</div><div class='add'>+	void *p;</div><div class='ctx'> 	int idx;</div><div class='del'>-	unsigned int base;</div><div class='del'>-	__wsum csum;</div><div class='del'>-	struct xdr_buf *buf = &amp;rqstp-&gt;rq_arg;</div><div class='del'>-	const unsigned char *p = buf-&gt;head[0].iov_base;</div><div class='del'>-	size_t csum_len = min_t(size_t, buf-&gt;head[0].iov_len + buf-&gt;page_len,</div><div class='del'>-				RC_CSUMLEN);</div><div class='del'>-	size_t len = min(buf-&gt;head[0].iov_len, csum_len);</div><div class='add'>+</div><div class='add'>+	if (remaining &gt; RC_CSUMLEN)</div><div class='add'>+		remaining = RC_CSUMLEN;</div><div class='add'>+	if (xdr_buf_subsegment(buf, &amp;subbuf, start, remaining))</div><div class='add'>+		return csum;</div><div class='ctx'> </div><div class='ctx'> 	/* rq_arg.head first */</div><div class='del'>-	csum = csum_partial(p, len, 0);</div><div class='del'>-	csum_len -= len;</div><div class='add'>+	if (subbuf.head[0].iov_len) {</div><div class='add'>+		len = min_t(unsigned int, subbuf.head[0].iov_len, remaining);</div><div class='add'>+		csum = csum_partial(subbuf.head[0].iov_base, len, csum);</div><div class='add'>+		remaining -= len;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	/* Continue into page array */</div><div class='del'>-	idx = buf-&gt;page_base / PAGE_SIZE;</div><div class='del'>-	base = buf-&gt;page_base &amp; ~PAGE_MASK;</div><div class='del'>-	while (csum_len) {</div><div class='del'>-		p = page_address(buf-&gt;pages[idx]) + base;</div><div class='del'>-		len = min_t(size_t, PAGE_SIZE - base, csum_len);</div><div class='add'>+	idx = subbuf.page_base / PAGE_SIZE;</div><div class='add'>+	base = subbuf.page_base &amp; ~PAGE_MASK;</div><div class='add'>+	while (remaining) {</div><div class='add'>+		p = page_address(subbuf.pages[idx]) + base;</div><div class='add'>+		len = min_t(unsigned int, PAGE_SIZE - base, remaining);</div><div class='ctx'> 		csum = csum_partial(p, len, csum);</div><div class='del'>-		csum_len -= len;</div><div class='add'>+		remaining -= len;</div><div class='ctx'> 		base = 0;</div><div class='ctx'> 		++idx;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -342,8 +387,8 @@ nfsd_cache_csum(struct svc_rqst *rqstp)</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int</div><div class='del'>-nfsd_cache_key_cmp(const struct svc_cacherep *key,</div><div class='del'>-			const struct svc_cacherep *rp, struct nfsd_net *nn)</div><div class='add'>+nfsd_cache_key_cmp(const struct nfsd_cacherep *key,</div><div class='add'>+		   const struct nfsd_cacherep *rp, struct nfsd_net *nn)</div><div class='ctx'> {</div><div class='ctx'> 	if (key-&gt;c_key.k_xid == rp-&gt;c_key.k_xid &amp;&amp;</div><div class='ctx'> 	    key-&gt;c_key.k_csum != rp-&gt;c_key.k_csum) {</div><div class='hunk'>@@ -359,11 +404,11 @@ nfsd_cache_key_cmp(const struct svc_cacherep *key,</div><div class='ctx'>  * Must be called with cache_lock held. Returns the found entry or</div><div class='ctx'>  * inserts an empty key on failure.</div><div class='ctx'>  */</div><div class='del'>-static struct svc_cacherep *</div><div class='del'>-nfsd_cache_insert(struct nfsd_drc_bucket *b, struct svc_cacherep *key,</div><div class='add'>+static struct nfsd_cacherep *</div><div class='add'>+nfsd_cache_insert(struct nfsd_drc_bucket *b, struct nfsd_cacherep *key,</div><div class='ctx'> 			struct nfsd_net *nn)</div><div class='ctx'> {</div><div class='del'>-	struct svc_cacherep	*rp, *ret = key;</div><div class='add'>+	struct nfsd_cacherep	*rp, *ret = key;</div><div class='ctx'> 	struct rb_node		**p = &amp;b-&gt;rb_head.rb_node,</div><div class='ctx'> 				*parent = NULL;</div><div class='ctx'> 	unsigned int		entries = 0;</div><div class='hunk'>@@ -372,7 +417,7 @@ nfsd_cache_insert(struct nfsd_drc_bucket *b, struct svc_cacherep *key,</div><div class='ctx'> 	while (*p != NULL) {</div><div class='ctx'> 		++entries;</div><div class='ctx'> 		parent = *p;</div><div class='del'>-		rp = rb_entry(parent, struct svc_cacherep, c_node);</div><div class='add'>+		rp = rb_entry(parent, struct nfsd_cacherep, c_node);</div><div class='ctx'> </div><div class='ctx'> 		cmp = nfsd_cache_key_cmp(key, rp, nn);</div><div class='ctx'> 		if (cmp &lt; 0)</div><div class='hunk'>@@ -397,14 +442,15 @@ out:</div><div class='ctx'> 				nn-&gt;longest_chain_cachesize,</div><div class='ctx'> 				atomic_read(&amp;nn-&gt;num_drc_entries));</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	lru_put_end(b, ret);</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * nfsd_cache_lookup - Find an entry in the duplicate reply cache</div><div class='ctx'>  * @rqstp: Incoming Call to find</div><div class='add'>+ * @start: starting byte in @rqstp-&gt;rq_arg of the NFS Call header</div><div class='add'>+ * @len: size of the NFS Call header, in bytes</div><div class='add'>+ * @cacherep: OUT: DRC entry for this request</div><div class='ctx'>  *</div><div class='ctx'>  * Try to find an entry matching the current call in the cache. When none</div><div class='ctx'>  * is found, we try to grab the oldest expired entry off the LRU list. If</div><div class='hunk'>@@ -417,59 +463,55 @@ out:</div><div class='ctx'>  *   %RC_REPLY: Reply from cache</div><div class='ctx'>  *   %RC_DROPIT: Do not process the request further</div><div class='ctx'>  */</div><div class='del'>-int nfsd_cache_lookup(struct svc_rqst *rqstp)</div><div class='add'>+int nfsd_cache_lookup(struct svc_rqst *rqstp, unsigned int start,</div><div class='add'>+		      unsigned int len, struct nfsd_cacherep **cacherep)</div><div class='ctx'> {</div><div class='del'>-	struct nfsd_net *nn = net_generic(SVC_NET(rqstp), nfsd_net_id);</div><div class='del'>-	struct svc_cacherep	*rp, *found;</div><div class='del'>-	__be32			xid = rqstp-&gt;rq_xid;</div><div class='add'>+	struct nfsd_net		*nn = net_generic(SVC_NET(rqstp), nfsd_net_id);</div><div class='add'>+	struct nfsd_cacherep	*rp, *found;</div><div class='ctx'> 	__wsum			csum;</div><div class='del'>-	u32 hash = nfsd_cache_hash(xid, nn);</div><div class='del'>-	struct nfsd_drc_bucket *b = &amp;nn-&gt;drc_hashtbl[hash];</div><div class='add'>+	struct nfsd_drc_bucket	*b;</div><div class='ctx'> 	int type = rqstp-&gt;rq_cachetype;</div><div class='add'>+	LIST_HEAD(dispose);</div><div class='ctx'> 	int rtn = RC_DOIT;</div><div class='ctx'> </div><div class='del'>-	rqstp-&gt;rq_cacherep = NULL;</div><div class='ctx'> 	if (type == RC_NOCACHE) {</div><div class='del'>-		nfsd_stats_rc_nocache_inc();</div><div class='add'>+		nfsd_stats_rc_nocache_inc(nn);</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	csum = nfsd_cache_csum(rqstp);</div><div class='add'>+	csum = nfsd_cache_csum(&amp;rqstp-&gt;rq_arg, start, len);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Since the common case is a cache miss followed by an insert,</div><div class='ctx'> 	 * preallocate an entry.</div><div class='ctx'> 	 */</div><div class='del'>-	rp = nfsd_reply_cache_alloc(rqstp, csum, nn);</div><div class='add'>+	rp = nfsd_cacherep_alloc(rqstp, csum, nn);</div><div class='ctx'> 	if (!rp)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='add'>+	b = nfsd_cache_bucket_find(rqstp-&gt;rq_xid, nn);</div><div class='ctx'> 	spin_lock(&amp;b-&gt;cache_lock);</div><div class='ctx'> 	found = nfsd_cache_insert(b, rp, nn);</div><div class='del'>-	if (found != rp) {</div><div class='del'>-		nfsd_reply_cache_free_locked(NULL, rp, nn);</div><div class='del'>-		rp = found;</div><div class='add'>+	if (found != rp)</div><div class='ctx'> 		goto found_entry;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	nfsd_stats_rc_misses_inc();</div><div class='del'>-	rqstp-&gt;rq_cacherep = rp;</div><div class='add'>+	*cacherep = rp;</div><div class='ctx'> 	rp-&gt;c_state = RC_INPROG;</div><div class='add'>+	nfsd_prune_bucket_locked(nn, b, 3, &amp;dispose);</div><div class='add'>+	spin_unlock(&amp;b-&gt;cache_lock);</div><div class='add'>+</div><div class='add'>+	nfsd_cacherep_dispose(&amp;dispose);</div><div class='ctx'> </div><div class='add'>+	nfsd_stats_rc_misses_inc(nn);</div><div class='ctx'> 	atomic_inc(&amp;nn-&gt;num_drc_entries);</div><div class='ctx'> 	nfsd_stats_drc_mem_usage_add(nn, sizeof(*rp));</div><div class='del'>-</div><div class='del'>-	nfsd_prune_bucket(b, nn);</div><div class='del'>-</div><div class='del'>-out_unlock:</div><div class='del'>-	spin_unlock(&amp;b-&gt;cache_lock);</div><div class='del'>-out:</div><div class='del'>-	return rtn;</div><div class='add'>+	goto out;</div><div class='ctx'> </div><div class='ctx'> found_entry:</div><div class='ctx'> 	/* We found a matching entry which is either in progress or done. */</div><div class='del'>-	nfsd_stats_rc_hits_inc();</div><div class='add'>+	nfsd_reply_cache_free_locked(NULL, rp, nn);</div><div class='add'>+	nfsd_stats_rc_hits_inc(nn);</div><div class='ctx'> 	rtn = RC_DROPIT;</div><div class='add'>+	rp = found;</div><div class='ctx'> </div><div class='ctx'> 	/* Request being processed */</div><div class='ctx'> 	if (rp-&gt;c_state == RC_INPROG)</div><div class='hunk'>@@ -486,7 +528,7 @@ found_entry:</div><div class='ctx'> 	case RC_NOCACHE:</div><div class='ctx'> 		break;</div><div class='ctx'> 	case RC_REPLSTAT:</div><div class='del'>-		svc_putu32(&amp;rqstp-&gt;rq_res.head[0], rp-&gt;c_replstat);</div><div class='add'>+		xdr_stream_encode_be32(&amp;rqstp-&gt;rq_res_stream, rp-&gt;c_replstat);</div><div class='ctx'> 		rtn = RC_REPLY;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case RC_REPLBUFF:</div><div class='hunk'>@@ -500,14 +542,18 @@ found_entry:</div><div class='ctx'> </div><div class='ctx'> out_trace:</div><div class='ctx'> 	trace_nfsd_drc_found(nn, rqstp, rtn);</div><div class='del'>-	goto out_unlock;</div><div class='add'>+out_unlock:</div><div class='add'>+	spin_unlock(&amp;b-&gt;cache_lock);</div><div class='add'>+out:</div><div class='add'>+	return rtn;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='ctx'>  * nfsd_cache_update - Update an entry in the duplicate reply cache.</div><div class='ctx'>  * @rqstp: svc_rqst with a finished Reply</div><div class='add'>+ * @rp: IN: DRC entry for this request</div><div class='ctx'>  * @cachetype: which cache to update</div><div class='del'>- * @statp: Reply's status code</div><div class='add'>+ * @statp: pointer to Reply's NFS status code, or NULL</div><div class='ctx'>  *</div><div class='ctx'>  * This is called from nfsd_dispatch when the procedure has been</div><div class='ctx'>  * executed and the complete reply is in rqstp-&gt;rq_res.</div><div class='hunk'>@@ -523,12 +569,11 @@ out_trace:</div><div class='ctx'>  * nfsd failed to encode a reply that otherwise would have been cached.</div><div class='ctx'>  * In this case, nfsd_cache_update is called with statp == NULL.</div><div class='ctx'>  */</div><div class='del'>-void nfsd_cache_update(struct svc_rqst *rqstp, int cachetype, __be32 *statp)</div><div class='add'>+void nfsd_cache_update(struct svc_rqst *rqstp, struct nfsd_cacherep *rp,</div><div class='add'>+		       int cachetype, __be32 *statp)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(SVC_NET(rqstp), nfsd_net_id);</div><div class='del'>-	struct svc_cacherep *rp = rqstp-&gt;rq_cacherep;</div><div class='ctx'> 	struct kvec	*resv = &amp;rqstp-&gt;rq_res.head[0], *cachv;</div><div class='del'>-	u32		hash;</div><div class='ctx'> 	struct nfsd_drc_bucket *b;</div><div class='ctx'> 	int		len;</div><div class='ctx'> 	size_t		bufsize = 0;</div><div class='hunk'>@@ -536,8 +581,7 @@ void nfsd_cache_update(struct svc_rqst *rqstp, int cachetype, __be32 *statp)</div><div class='ctx'> 	if (!rp)</div><div class='ctx'> 		return;</div><div class='ctx'> </div><div class='del'>-	hash = nfsd_cache_hash(rp-&gt;c_key.k_xid, nn);</div><div class='del'>-	b = &amp;nn-&gt;drc_hashtbl[hash];</div><div class='add'>+	b = nfsd_cache_bucket_find(rp-&gt;c_key.k_xid, nn);</div><div class='ctx'> </div><div class='ctx'> 	len = resv-&gt;iov_len - ((char*)statp - (char*)resv-&gt;iov_base);</div><div class='ctx'> 	len &gt;&gt;= 2;</div><div class='hunk'>@@ -579,24 +623,17 @@ void nfsd_cache_update(struct svc_rqst *rqstp, int cachetype, __be32 *statp)</div><div class='ctx'> 	return;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Copy cached reply to current reply buffer. Should always fit.</div><div class='del'>- * FIXME as reply is in a page, we should just attach the page, and</div><div class='del'>- * keep a refcount....</div><div class='del'>- */</div><div class='ctx'> static int</div><div class='ctx'> nfsd_cache_append(struct svc_rqst *rqstp, struct kvec *data)</div><div class='ctx'> {</div><div class='del'>-	struct kvec	*vec = &amp;rqstp-&gt;rq_res.head[0];</div><div class='del'>-</div><div class='del'>-	if (vec-&gt;iov_len + data-&gt;iov_len &gt; PAGE_SIZE) {</div><div class='del'>-		printk(KERN_WARNING "nfsd: cached reply too large (%zd).\n",</div><div class='del'>-				data-&gt;iov_len);</div><div class='del'>-		return 0;</div><div class='del'>-	}</div><div class='del'>-	memcpy((char*)vec-&gt;iov_base + vec-&gt;iov_len, data-&gt;iov_base, data-&gt;iov_len);</div><div class='del'>-	vec-&gt;iov_len += data-&gt;iov_len;</div><div class='del'>-	return 1;</div><div class='add'>+	__be32 *p;</div><div class='add'>+</div><div class='add'>+	p = xdr_reserve_space(&amp;rqstp-&gt;rq_res_stream, data-&gt;iov_len);</div><div class='add'>+	if (unlikely(!p))</div><div class='add'>+		return false;</div><div class='add'>+	memcpy(p, data-&gt;iov_base, data-&gt;iov_len);</div><div class='add'>+	xdr_commit_encode(&amp;rqstp-&gt;rq_res_stream);</div><div class='add'>+	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -604,33 +641,26 @@ nfsd_cache_append(struct svc_rqst *rqstp, struct kvec *data)</div><div class='ctx'>  * scraping this file for info should test the labels to ensure they're</div><div class='ctx'>  * getting the correct field.</div><div class='ctx'>  */</div><div class='del'>-static int nfsd_reply_cache_stats_show(struct seq_file *m, void *v)</div><div class='add'>+int nfsd_reply_cache_stats_show(struct seq_file *m, void *v)</div><div class='ctx'> {</div><div class='del'>-	struct nfsd_net *nn = m-&gt;private;</div><div class='add'>+	struct nfsd_net *nn = net_generic(file_inode(m-&gt;file)-&gt;i_sb-&gt;s_fs_info,</div><div class='add'>+					  nfsd_net_id);</div><div class='ctx'> </div><div class='ctx'> 	seq_printf(m, "max entries:           %u\n", nn-&gt;max_drc_entries);</div><div class='ctx'> 	seq_printf(m, "num entries:           %u\n",</div><div class='ctx'> 		   atomic_read(&amp;nn-&gt;num_drc_entries));</div><div class='ctx'> 	seq_printf(m, "hash buckets:          %u\n", 1 &lt;&lt; nn-&gt;maskbits);</div><div class='ctx'> 	seq_printf(m, "mem usage:             %lld\n",</div><div class='del'>-		   percpu_counter_sum_positive(&amp;nn-&gt;counter[NFSD_NET_DRC_MEM_USAGE]));</div><div class='add'>+		   percpu_counter_sum_positive(&amp;nn-&gt;counter[NFSD_STATS_DRC_MEM_USAGE]));</div><div class='ctx'> 	seq_printf(m, "cache hits:            %lld\n",</div><div class='del'>-		   percpu_counter_sum_positive(&amp;nfsdstats.counter[NFSD_STATS_RC_HITS]));</div><div class='add'>+		   percpu_counter_sum_positive(&amp;nn-&gt;counter[NFSD_STATS_RC_HITS]));</div><div class='ctx'> 	seq_printf(m, "cache misses:          %lld\n",</div><div class='del'>-		   percpu_counter_sum_positive(&amp;nfsdstats.counter[NFSD_STATS_RC_MISSES]));</div><div class='add'>+		   percpu_counter_sum_positive(&amp;nn-&gt;counter[NFSD_STATS_RC_MISSES]));</div><div class='ctx'> 	seq_printf(m, "not cached:            %lld\n",</div><div class='del'>-		   percpu_counter_sum_positive(&amp;nfsdstats.counter[NFSD_STATS_RC_NOCACHE]));</div><div class='add'>+		   percpu_counter_sum_positive(&amp;nn-&gt;counter[NFSD_STATS_RC_NOCACHE]));</div><div class='ctx'> 	seq_printf(m, "payload misses:        %lld\n",</div><div class='del'>-		   percpu_counter_sum_positive(&amp;nn-&gt;counter[NFSD_NET_PAYLOAD_MISSES]));</div><div class='add'>+		   percpu_counter_sum_positive(&amp;nn-&gt;counter[NFSD_STATS_PAYLOAD_MISSES]));</div><div class='ctx'> 	seq_printf(m, "longest chain len:     %u\n", nn-&gt;longest_chain);</div><div class='ctx'> 	seq_printf(m, "cachesize at longest:  %u\n", nn-&gt;longest_chain_cachesize);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='del'>-</div><div class='del'>-int nfsd_reply_cache_stats_open(struct inode *inode, struct file *file)</div><div class='del'>-{</div><div class='del'>-	struct nfsd_net *nn = net_generic(file_inode(file)-&gt;i_sb-&gt;s_fs_info,</div><div class='del'>-								nfsd_net_id);</div><div class='del'>-</div><div class='del'>-	return single_open(file, nfsd_reply_cache_stats_show, nn);</div><div class='del'>-}</div><div class='head'>diff --git a/fs/nfsd/nfsctl.c b/fs/nfsd/nfsctl.c<br/>index af8531c3854a..5ce9a49e76ba 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfsctl.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfsctl.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfsctl.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/nfsctl.c</a></div><div class='hunk'>@@ -14,10 +14,11 @@</div><div class='ctx'> #include &lt;linux/lockd/lockd.h&gt;</div><div class='ctx'> #include &lt;linux/sunrpc/addr.h&gt;</div><div class='ctx'> #include &lt;linux/sunrpc/gss_api.h&gt;</div><div class='del'>-#include &lt;linux/sunrpc/gss_krb5_enctypes.h&gt;</div><div class='ctx'> #include &lt;linux/sunrpc/rpc_pipe_fs.h&gt;</div><div class='add'>+#include &lt;linux/sunrpc/svc.h&gt;</div><div class='ctx'> #include &lt;linux/module.h&gt;</div><div class='ctx'> #include &lt;linux/fsnotify.h&gt;</div><div class='add'>+#include &lt;linux/nfslocalio.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "idmap.h"</div><div class='ctx'> #include "nfsd.h"</div><div class='hunk'>@@ -25,6 +26,9 @@</div><div class='ctx'> #include "state.h"</div><div class='ctx'> #include "netns.h"</div><div class='ctx'> #include "pnfs.h"</div><div class='add'>+#include "filecache.h"</div><div class='add'>+#include "trace.h"</div><div class='add'>+#include "netlink.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  *	We have a single directory with several nodes in it.</div><div class='hunk'>@@ -44,18 +48,11 @@ enum {</div><div class='ctx'> 	NFSD_Versions,</div><div class='ctx'> 	NFSD_Ports,</div><div class='ctx'> 	NFSD_MaxBlkSize,</div><div class='del'>-	NFSD_MaxConnections,</div><div class='del'>-	NFSD_SupportedEnctypes,</div><div class='del'>-	/*</div><div class='del'>-	 * The below MUST come last.  Otherwise we leave a hole in nfsd_files[]</div><div class='del'>-	 * with !CONFIG_NFSD_V4 and simple_fill_super() goes oops</div><div class='del'>-	 */</div><div class='del'>-#ifdef CONFIG_NFSD_V4</div><div class='add'>+	NFSD_Filecache,</div><div class='ctx'> 	NFSD_Leasetime,</div><div class='ctx'> 	NFSD_Gracetime,</div><div class='ctx'> 	NFSD_RecoveryDir,</div><div class='ctx'> 	NFSD_V4EndGrace,</div><div class='del'>-#endif</div><div class='ctx'> 	NFSD_MaxReserved</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -70,11 +67,12 @@ static ssize_t write_pool_threads(struct file *file, char *buf, size_t size);</div><div class='ctx'> static ssize_t write_versions(struct file *file, char *buf, size_t size);</div><div class='ctx'> static ssize_t write_ports(struct file *file, char *buf, size_t size);</div><div class='ctx'> static ssize_t write_maxblksize(struct file *file, char *buf, size_t size);</div><div class='del'>-static ssize_t write_maxconn(struct file *file, char *buf, size_t size);</div><div class='ctx'> #ifdef CONFIG_NFSD_V4</div><div class='ctx'> static ssize_t write_leasetime(struct file *file, char *buf, size_t size);</div><div class='ctx'> static ssize_t write_gracetime(struct file *file, char *buf, size_t size);</div><div class='add'>+#ifdef CONFIG_NFSD_LEGACY_CLIENT_TRACKING</div><div class='ctx'> static ssize_t write_recoverydir(struct file *file, char *buf, size_t size);</div><div class='add'>+#endif</div><div class='ctx'> static ssize_t write_v4_end_grace(struct file *file, char *buf, size_t size);</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='hunk'>@@ -87,11 +85,12 @@ static ssize_t (*const write_op[])(struct file *, char *, size_t) = {</div><div class='ctx'> 	[NFSD_Versions] = write_versions,</div><div class='ctx'> 	[NFSD_Ports] = write_ports,</div><div class='ctx'> 	[NFSD_MaxBlkSize] = write_maxblksize,</div><div class='del'>-	[NFSD_MaxConnections] = write_maxconn,</div><div class='ctx'> #ifdef CONFIG_NFSD_V4</div><div class='ctx'> 	[NFSD_Leasetime] = write_leasetime,</div><div class='ctx'> 	[NFSD_Gracetime] = write_gracetime,</div><div class='add'>+#ifdef CONFIG_NFSD_LEGACY_CLIENT_TRACKING</div><div class='ctx'> 	[NFSD_RecoveryDir] = write_recoverydir,</div><div class='add'>+#endif</div><div class='ctx'> 	[NFSD_V4EndGrace] = write_v4_end_grace,</div><div class='ctx'> #endif</div><div class='ctx'> };</div><div class='hunk'>@@ -109,12 +108,12 @@ static ssize_t nfsctl_transaction_write(struct file *file, const char __user *bu</div><div class='ctx'> 	if (IS_ERR(data))</div><div class='ctx'> 		return PTR_ERR(data);</div><div class='ctx'> </div><div class='del'>-	rv =  write_op[ino](file, data, size);</div><div class='del'>-	if (rv &gt;= 0) {</div><div class='del'>-		simple_transaction_set(file, rv);</div><div class='del'>-		rv = size;</div><div class='del'>-	}</div><div class='del'>-	return rv;</div><div class='add'>+	rv = write_op[ino](file, data, size);</div><div class='add'>+	if (rv &lt; 0)</div><div class='add'>+		return rv;</div><div class='add'>+</div><div class='add'>+	simple_transaction_set(file, rv);</div><div class='add'>+	return size;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static ssize_t nfsctl_transaction_read(struct file *file, char __user *buf, size_t size, loff_t *pos)</div><div class='hunk'>@@ -153,18 +152,6 @@ static int exports_net_open(struct net *net, struct file *file)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int exports_proc_open(struct inode *inode, struct file *file)</div><div class='del'>-{</div><div class='del'>-	return exports_net_open(current-&gt;nsproxy-&gt;net_ns, file);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static const struct proc_ops exports_proc_ops = {</div><div class='del'>-	.proc_open	= exports_proc_open,</div><div class='del'>-	.proc_read	= seq_read,</div><div class='del'>-	.proc_lseek	= seq_lseek,</div><div class='del'>-	.proc_release	= seq_release,</div><div class='del'>-};</div><div class='del'>-</div><div class='ctx'> static int exports_nfsd_open(struct inode *inode, struct file *file)</div><div class='ctx'> {</div><div class='ctx'> 	return exports_net_open(inode-&gt;i_sb-&gt;s_fs_info, file);</div><div class='hunk'>@@ -183,51 +170,25 @@ static int export_features_show(struct seq_file *m, void *v)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int export_features_open(struct inode *inode, struct file *file)</div><div class='del'>-{</div><div class='del'>-	return single_open(file, export_features_show, NULL);</div><div class='del'>-}</div><div class='add'>+DEFINE_SHOW_ATTRIBUTE(export_features);</div><div class='ctx'> </div><div class='del'>-static const struct file_operations export_features_operations = {</div><div class='del'>-	.open		= export_features_open,</div><div class='del'>-	.read		= seq_read,</div><div class='del'>-	.llseek		= seq_lseek,</div><div class='del'>-	.release	= single_release,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-#if defined(CONFIG_SUNRPC_GSS) || defined(CONFIG_SUNRPC_GSS_MODULE)</div><div class='del'>-static int supported_enctypes_show(struct seq_file *m, void *v)</div><div class='add'>+static int nfsd_pool_stats_open(struct inode *inode, struct file *file)</div><div class='ctx'> {</div><div class='del'>-	seq_printf(m, KRB5_SUPPORTED_ENCTYPES);</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='add'>+	struct nfsd_net *nn = net_generic(inode-&gt;i_sb-&gt;s_fs_info, nfsd_net_id);</div><div class='ctx'> </div><div class='del'>-static int supported_enctypes_open(struct inode *inode, struct file *file)</div><div class='del'>-{</div><div class='del'>-	return single_open(file, supported_enctypes_show, NULL);</div><div class='add'>+	return svc_pool_stats_open(&amp;nn-&gt;nfsd_info, file);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static const struct file_operations supported_enctypes_ops = {</div><div class='del'>-	.open		= supported_enctypes_open,</div><div class='del'>-	.read		= seq_read,</div><div class='del'>-	.llseek		= seq_lseek,</div><div class='del'>-	.release	= single_release,</div><div class='del'>-};</div><div class='del'>-#endif /* CONFIG_SUNRPC_GSS or CONFIG_SUNRPC_GSS_MODULE */</div><div class='del'>-</div><div class='ctx'> static const struct file_operations pool_stats_operations = {</div><div class='ctx'> 	.open		= nfsd_pool_stats_open,</div><div class='ctx'> 	.read		= seq_read,</div><div class='ctx'> 	.llseek		= seq_lseek,</div><div class='del'>-	.release	= nfsd_pool_stats_release,</div><div class='add'>+	.release	= seq_release,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static const struct file_operations reply_cache_stats_operations = {</div><div class='del'>-	.open		= nfsd_reply_cache_stats_open,</div><div class='del'>-	.read		= seq_read,</div><div class='del'>-	.llseek		= seq_lseek,</div><div class='del'>-	.release	= single_release,</div><div class='del'>-};</div><div class='add'>+DEFINE_SHOW_ATTRIBUTE(nfsd_reply_cache_stats);</div><div class='add'>+</div><div class='add'>+DEFINE_SHOW_ATTRIBUTE(nfsd_file_cache_stats);</div><div class='ctx'> </div><div class='ctx'> /*----------------------------------------------------------------------------*/</div><div class='ctx'> /*</div><div class='hunk'>@@ -275,6 +236,7 @@ static ssize_t write_unlock_ip(struct file *file, char *buf, size_t size)</div><div class='ctx'> 	if (rpc_pton(net, fo_path, size, sap, salen) == 0)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='add'>+	trace_nfsd_ctl_unlock_ip(net, buf);</div><div class='ctx'> 	return nlmsvc_unlock_all_by_ip(sap);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -308,7 +270,7 @@ static ssize_t write_unlock_fs(struct file *file, char *buf, size_t size)</div><div class='ctx'> 	fo_path = buf;</div><div class='ctx'> 	if (qword_get(&amp;buf, fo_path, size) &lt; 0)</div><div class='ctx'> 		return -EINVAL;</div><div class='del'>-</div><div class='add'>+	trace_nfsd_ctl_unlock_fs(netns(file), fo_path);</div><div class='ctx'> 	error = kern_path(fo_path, 0, &amp;path);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		return error;</div><div class='hunk'>@@ -323,6 +285,7 @@ static ssize_t write_unlock_fs(struct file *file, char *buf, size_t size)</div><div class='ctx'> 	 * 3.  Is that directory the root of an exported file system?</div><div class='ctx'> 	 */</div><div class='ctx'> 	error = nlmsvc_unlock_all_by_sb(path.dentry-&gt;d_sb);</div><div class='add'>+	nfsd4_revoke_states(netns(file), path.dentry-&gt;d_sb);</div><div class='ctx'> </div><div class='ctx'> 	path_put(&amp;path);</div><div class='ctx'> 	return error;</div><div class='hunk'>@@ -369,7 +332,7 @@ static ssize_t write_filehandle(struct file *file, char *buf, size_t size)</div><div class='ctx'> 	len = qword_get(&amp;mesg, dname, size);</div><div class='ctx'> 	if (len &lt;= 0)</div><div class='ctx'> 		return -EINVAL;</div><div class='del'>-	</div><div class='add'>+</div><div class='ctx'> 	path = dname+len+1;</div><div class='ctx'> 	len = qword_get(&amp;mesg, path, size);</div><div class='ctx'> 	if (len &lt;= 0)</div><div class='hunk'>@@ -383,15 +346,17 @@ static ssize_t write_filehandle(struct file *file, char *buf, size_t size)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> 	maxsize = min(maxsize, NFS3_FHSIZE);</div><div class='ctx'> </div><div class='del'>-	if (qword_get(&amp;mesg, mesg, size)&gt;0)</div><div class='add'>+	if (qword_get(&amp;mesg, mesg, size) &gt; 0)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='add'>+	trace_nfsd_ctl_filehandle(netns(file), dname, path, maxsize);</div><div class='add'>+</div><div class='ctx'> 	/* we have all the words, they are in buf.. */</div><div class='ctx'> 	dom = unix_domain_find(dname);</div><div class='ctx'> 	if (!dom)</div><div class='ctx'> 		return -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	len = exp_rootfh(netns(file), dom, path, &amp;fh,  maxsize);</div><div class='add'>+	len = exp_rootfh(netns(file), dom, path, &amp;fh, maxsize);</div><div class='ctx'> 	auth_domain_put(dom);</div><div class='ctx'> 	if (len)</div><div class='ctx'> 		return len;</div><div class='hunk'>@@ -444,7 +409,10 @@ static ssize_t write_threads(struct file *file, char *buf, size_t size)</div><div class='ctx'> 			return rv;</div><div class='ctx'> 		if (newthreads &lt; 0)</div><div class='ctx'> 			return -EINVAL;</div><div class='del'>-		rv = nfsd_svc(newthreads, net, file-&gt;f_cred);</div><div class='add'>+		trace_nfsd_ctl_threads(net, newthreads);</div><div class='add'>+		mutex_lock(&amp;nfsd_mutex);</div><div class='add'>+		rv = nfsd_svc(1, &amp;newthreads, net, file-&gt;f_cred, NULL);</div><div class='add'>+		mutex_unlock(&amp;nfsd_mutex);</div><div class='ctx'> 		if (rv &lt; 0)</div><div class='ctx'> 			return rv;</div><div class='ctx'> 	} else</div><div class='hunk'>@@ -463,8 +431,8 @@ static ssize_t write_threads(struct file *file, char *buf, size_t size)</div><div class='ctx'>  * OR</div><div class='ctx'>  *</div><div class='ctx'>  * Input:</div><div class='del'>- * 			buf:		C string containing whitespace-</div><div class='del'>- * 					separated unsigned integer values</div><div class='add'>+ *			buf:		C string containing whitespace-</div><div class='add'>+ *					separated unsigned integer values</div><div class='ctx'>  *					representing the number of NFSD</div><div class='ctx'>  *					threads to start in each pool</div><div class='ctx'>  *			size:		non-zero length of C string in @buf</div><div class='hunk'>@@ -516,7 +484,16 @@ static ssize_t write_pool_threads(struct file *file, char *buf, size_t size)</div><div class='ctx'> 			rv = -EINVAL;</div><div class='ctx'> 			if (nthreads[i] &lt; 0)</div><div class='ctx'> 				goto out_free;</div><div class='add'>+			trace_nfsd_ctl_pool_threads(net, i, nthreads[i]);</div><div class='ctx'> 		}</div><div class='add'>+</div><div class='add'>+		/*</div><div class='add'>+		 * There must always be a thread in pool 0; the admin</div><div class='add'>+		 * can't shut down NFS completely using pool_threads.</div><div class='add'>+		 */</div><div class='add'>+		if (nthreads[0] == 0)</div><div class='add'>+			nthreads[0] = 1;</div><div class='add'>+</div><div class='ctx'> 		rv = nfsd_set_nrthreads(i, nthreads, net);</div><div class='ctx'> 		if (rv)</div><div class='ctx'> 			goto out_free;</div><div class='hunk'>@@ -571,7 +548,7 @@ static ssize_t __write_versions(struct file *file, char *buf, size_t size)</div><div class='ctx'> 	char *sep;</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(netns(file), nfsd_net_id);</div><div class='ctx'> </div><div class='del'>-	if (size&gt;0) {</div><div class='add'>+	if (size &gt; 0) {</div><div class='ctx'> 		if (nn-&gt;nfsd_serv)</div><div class='ctx'> 			/* Cannot change versions without updating</div><div class='ctx'> 			 * nn-&gt;nfsd_serv-&gt;sv_xdrsize, and reallocing</div><div class='hunk'>@@ -581,6 +558,7 @@ static ssize_t __write_versions(struct file *file, char *buf, size_t size)</div><div class='ctx'> 		if (buf[size-1] != '\n')</div><div class='ctx'> 			return -EINVAL;</div><div class='ctx'> 		buf[size-1] = 0;</div><div class='add'>+		trace_nfsd_ctl_version(netns(file), buf);</div><div class='ctx'> </div><div class='ctx'> 		vers = mesg;</div><div class='ctx'> 		len = qword_get(&amp;mesg, vers, size);</div><div class='hunk'>@@ -602,7 +580,9 @@ static ssize_t __write_versions(struct file *file, char *buf, size_t size)</div><div class='ctx'> </div><div class='ctx'> 			cmd = sign == '-' ? NFSD_CLEAR : NFSD_SET;</div><div class='ctx'> 			switch(num) {</div><div class='add'>+#ifdef CONFIG_NFSD_V2</div><div class='ctx'> 			case 2:</div><div class='add'>+#endif</div><div class='ctx'> 			case 3:</div><div class='ctx'> 				nfsd_vers(nn, num, cmd);</div><div class='ctx'> 				break;</div><div class='hunk'>@@ -622,7 +602,9 @@ static ssize_t __write_versions(struct file *file, char *buf, size_t size)</div><div class='ctx'> 				}</div><div class='ctx'> 				break;</div><div class='ctx'> 			default:</div><div class='del'>-				return -EINVAL;</div><div class='add'>+				/* Ignore requests to disable non-existent versions */</div><div class='add'>+				if (cmd == NFSD_SET)</div><div class='add'>+					return -EINVAL;</div><div class='ctx'> 			}</div><div class='ctx'> 			vers += len + 1;</div><div class='ctx'> 		} while ((len = qword_get(&amp;mesg, vers, size)) &gt; 0);</div><div class='hunk'>@@ -633,7 +615,6 @@ static ssize_t __write_versions(struct file *file, char *buf, size_t size)</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Now write current state into reply buffer */</div><div class='del'>-	len = 0;</div><div class='ctx'> 	sep = "";</div><div class='ctx'> 	remaining = SIMPLE_TRANSACTION_LIMIT;</div><div class='ctx'> 	for (num=2 ; num &lt;= 4 ; num++) {</div><div class='hunk'>@@ -679,11 +660,11 @@ out:</div><div class='ctx'>  * OR</div><div class='ctx'>  *</div><div class='ctx'>  * Input:</div><div class='del'>- * 			buf:		C string containing whitespace-</div><div class='del'>- * 					separated positive or negative</div><div class='del'>- * 					integer values representing NFS</div><div class='del'>- * 					protocol versions to enable ("+n")</div><div class='del'>- * 					or disable ("-n")</div><div class='add'>+ *			buf:		C string containing whitespace-</div><div class='add'>+ *					separated positive or negative</div><div class='add'>+ *					integer values representing NFS</div><div class='add'>+ *					protocol versions to enable ("+n")</div><div class='add'>+ *					or disable ("-n")</div><div class='ctx'>  *			size:		non-zero length of C string in @buf</div><div class='ctx'>  * Output:</div><div class='ctx'>  *	On success:	status of zero or more protocol versions has</div><div class='hunk'>@@ -727,33 +708,28 @@ static ssize_t __write_ports_addfd(char *buf, struct net *net, const struct cred</div><div class='ctx'> 	char *mesg = buf;</div><div class='ctx'> 	int fd, err;</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='add'>+	struct svc_serv *serv;</div><div class='ctx'> </div><div class='ctx'> 	err = get_int(&amp;mesg, &amp;fd);</div><div class='ctx'> 	if (err != 0 || fd &lt; 0)</div><div class='ctx'> 		return -EINVAL;</div><div class='del'>-</div><div class='del'>-	if (svc_alien_sock(net, fd)) {</div><div class='del'>-		printk(KERN_ERR "%s: socket net is different to NFSd's one\n", __func__);</div><div class='del'>-		return -EINVAL;</div><div class='del'>-	}</div><div class='add'>+	trace_nfsd_ctl_ports_addfd(net, fd);</div><div class='ctx'> </div><div class='ctx'> 	err = nfsd_create_serv(net);</div><div class='ctx'> 	if (err != 0)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	err = svc_addsock(nn-&gt;nfsd_serv, fd, buf, SIMPLE_TRANSACTION_LIMIT, cred);</div><div class='del'>-	if (err &lt; 0) {</div><div class='del'>-		nfsd_destroy(net);</div><div class='del'>-		return err;</div><div class='del'>-	}</div><div class='add'>+	serv = nn-&gt;nfsd_serv;</div><div class='add'>+	err = svc_addsock(serv, net, fd, buf, SIMPLE_TRANSACTION_LIMIT, cred);</div><div class='add'>+</div><div class='add'>+	if (!serv-&gt;sv_nrthreads &amp;&amp; list_empty(&amp;nn-&gt;nfsd_serv-&gt;sv_permsocks))</div><div class='add'>+		nfsd_destroy_serv(net);</div><div class='ctx'> </div><div class='del'>-	/* Decrease the count, but don't shut down the service */</div><div class='del'>-	nn-&gt;nfsd_serv-&gt;sv_nrthreads--;</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * A transport listener is added by writing it's transport name and</div><div class='add'>+ * A transport listener is added by writing its transport name and</div><div class='ctx'>  * a port number.</div><div class='ctx'>  */</div><div class='ctx'> static ssize_t __write_ports_addxprt(char *buf, struct net *net, const struct cred *cred)</div><div class='hunk'>@@ -762,41 +738,41 @@ static ssize_t __write_ports_addxprt(char *buf, struct net *net, const struct cr</div><div class='ctx'> 	struct svc_xprt *xprt;</div><div class='ctx'> 	int port, err;</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='add'>+	struct svc_serv *serv;</div><div class='ctx'> </div><div class='ctx'> 	if (sscanf(buf, "%15s %5u", transport, &amp;port) != 2)</div><div class='ctx'> 		return -EINVAL;</div><div class='ctx'> </div><div class='ctx'> 	if (port &lt; 1 || port &gt; USHRT_MAX)</div><div class='ctx'> 		return -EINVAL;</div><div class='add'>+	trace_nfsd_ctl_ports_addxprt(net, transport, port);</div><div class='ctx'> </div><div class='ctx'> 	err = nfsd_create_serv(net);</div><div class='ctx'> 	if (err != 0)</div><div class='ctx'> 		return err;</div><div class='ctx'> </div><div class='del'>-	err = svc_create_xprt(nn-&gt;nfsd_serv, transport, net,</div><div class='del'>-				PF_INET, port, SVC_SOCK_ANONYMOUS, cred);</div><div class='add'>+	serv = nn-&gt;nfsd_serv;</div><div class='add'>+	err = svc_xprt_create(serv, transport, net,</div><div class='add'>+			      PF_INET, port, SVC_SOCK_ANONYMOUS, cred);</div><div class='ctx'> 	if (err &lt; 0)</div><div class='ctx'> 		goto out_err;</div><div class='ctx'> </div><div class='del'>-	err = svc_create_xprt(nn-&gt;nfsd_serv, transport, net,</div><div class='del'>-				PF_INET6, port, SVC_SOCK_ANONYMOUS, cred);</div><div class='add'>+	err = svc_xprt_create(serv, transport, net,</div><div class='add'>+			      PF_INET6, port, SVC_SOCK_ANONYMOUS, cred);</div><div class='ctx'> 	if (err &lt; 0 &amp;&amp; err != -EAFNOSUPPORT)</div><div class='ctx'> 		goto out_close;</div><div class='ctx'> </div><div class='del'>-	/* Decrease the count, but don't shut down the service */</div><div class='del'>-	nn-&gt;nfsd_serv-&gt;sv_nrthreads--;</div><div class='ctx'> 	return 0;</div><div class='ctx'> out_close:</div><div class='del'>-	xprt = svc_find_xprt(nn-&gt;nfsd_serv, transport, net, PF_INET, port);</div><div class='add'>+	xprt = svc_find_xprt(serv, transport, net, PF_INET, port);</div><div class='ctx'> 	if (xprt != NULL) {</div><div class='del'>-		svc_close_xprt(xprt);</div><div class='add'>+		svc_xprt_close(xprt);</div><div class='ctx'> 		svc_xprt_put(xprt);</div><div class='ctx'> 	}</div><div class='ctx'> out_err:</div><div class='del'>-	if (!list_empty(&amp;nn-&gt;nfsd_serv-&gt;sv_permsocks))</div><div class='del'>-		nn-&gt;nfsd_serv-&gt;sv_nrthreads--;</div><div class='del'>-	 else</div><div class='del'>-		nfsd_destroy(net);</div><div class='add'>+	if (!serv-&gt;sv_nrthreads &amp;&amp; list_empty(&amp;nn-&gt;nfsd_serv-&gt;sv_permsocks))</div><div class='add'>+		nfsd_destroy_serv(net);</div><div class='add'>+</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -881,9 +857,9 @@ int nfsd_max_blksize;</div><div class='ctx'>  * OR</div><div class='ctx'>  *</div><div class='ctx'>  * Input:</div><div class='del'>- * 			buf:		C string containing an unsigned</div><div class='del'>- * 					integer value representing the new</div><div class='del'>- * 					NFS blksize</div><div class='add'>+ *			buf:		C string containing an unsigned</div><div class='add'>+ *					integer value representing the new</div><div class='add'>+ *					NFS blksize</div><div class='ctx'>  *			size:		non-zero length of C string in @buf</div><div class='ctx'>  * Output:</div><div class='ctx'>  *	On success:	passed-in buffer filled with '\n'-terminated C string</div><div class='hunk'>@@ -902,6 +878,8 @@ static ssize_t write_maxblksize(struct file *file, char *buf, size_t size)</div><div class='ctx'> 		int rv = get_int(&amp;mesg, &amp;bsize);</div><div class='ctx'> 		if (rv)</div><div class='ctx'> 			return rv;</div><div class='add'>+		trace_nfsd_ctl_maxblksize(netns(file), bsize);</div><div class='add'>+</div><div class='ctx'> 		/* force bsize into allowed range and</div><div class='ctx'> 		 * required alignment.</div><div class='ctx'> 		 */</div><div class='hunk'>@@ -921,47 +899,11 @@ static ssize_t write_maxblksize(struct file *file, char *buf, size_t size)</div><div class='ctx'> 							nfsd_max_blksize);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * write_maxconn - Set or report the current max number of connections</div><div class='del'>- *</div><div class='del'>- * Input:</div><div class='del'>- *			buf:		ignored</div><div class='del'>- *			size:		zero</div><div class='del'>- * OR</div><div class='del'>- *</div><div class='del'>- * Input:</div><div class='del'>- * 			buf:		C string containing an unsigned</div><div class='del'>- * 					integer value representing the new</div><div class='del'>- * 					number of max connections</div><div class='del'>- *			size:		non-zero length of C string in @buf</div><div class='del'>- * Output:</div><div class='del'>- *	On success:	passed-in buffer filled with '\n'-terminated C string</div><div class='del'>- *			containing numeric value of max_connections setting</div><div class='del'>- *			for this net namespace;</div><div class='del'>- *			return code is the size in bytes of the string</div><div class='del'>- *	On error:	return code is zero or a negative errno value</div><div class='del'>- */</div><div class='del'>-static ssize_t write_maxconn(struct file *file, char *buf, size_t size)</div><div class='del'>-{</div><div class='del'>-	char *mesg = buf;</div><div class='del'>-	struct nfsd_net *nn = net_generic(netns(file), nfsd_net_id);</div><div class='del'>-	unsigned int maxconn = nn-&gt;max_connections;</div><div class='del'>-</div><div class='del'>-	if (size &gt; 0) {</div><div class='del'>-		int rv = get_uint(&amp;mesg, &amp;maxconn);</div><div class='del'>-</div><div class='del'>-		if (rv)</div><div class='del'>-			return rv;</div><div class='del'>-		nn-&gt;max_connections = maxconn;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	return scnprintf(buf, SIMPLE_TRANSACTION_LIMIT, "%u\n", maxconn);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> #ifdef CONFIG_NFSD_V4</div><div class='ctx'> static ssize_t __nfsd4_write_time(struct file *file, char *buf, size_t size,</div><div class='ctx'> 				  time64_t *time, struct nfsd_net *nn)</div><div class='ctx'> {</div><div class='add'>+	struct dentry *dentry = file_dentry(file);</div><div class='ctx'> 	char *mesg = buf;</div><div class='ctx'> 	int rv, i;</div><div class='ctx'> </div><div class='hunk'>@@ -971,6 +913,9 @@ static ssize_t __nfsd4_write_time(struct file *file, char *buf, size_t size,</div><div class='ctx'> 		rv = get_int(&amp;mesg, &amp;i);</div><div class='ctx'> 		if (rv)</div><div class='ctx'> 			return rv;</div><div class='add'>+		trace_nfsd_ctl_time(netns(file), dentry-&gt;d_name.name,</div><div class='add'>+				    dentry-&gt;d_name.len, i);</div><div class='add'>+</div><div class='ctx'> 		/*</div><div class='ctx'> 		 * Some sanity checking.  We don't have a reason for</div><div class='ctx'> 		 * these particular numbers, but problems with the</div><div class='hunk'>@@ -1045,6 +990,7 @@ static ssize_t write_gracetime(struct file *file, char *buf, size_t size)</div><div class='ctx'> 	return nfsd4_write_time(file, buf, size, &amp;nn-&gt;nfsd4_grace, nn);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_NFSD_LEGACY_CLIENT_TRACKING</div><div class='ctx'> static ssize_t __write_recoverydir(struct file *file, char *buf, size_t size,</div><div class='ctx'> 				   struct nfsd_net *nn)</div><div class='ctx'> {</div><div class='hunk'>@@ -1063,6 +1009,7 @@ static ssize_t __write_recoverydir(struct file *file, char *buf, size_t size,</div><div class='ctx'> 		len = qword_get(&amp;mesg, recdir, size);</div><div class='ctx'> 		if (len &lt;= 0)</div><div class='ctx'> 			return -EINVAL;</div><div class='add'>+		trace_nfsd_ctl_recoverydir(netns(file), recdir);</div><div class='ctx'> </div><div class='ctx'> 		status = nfs4_reset_recoverydir(recdir);</div><div class='ctx'> 		if (status)</div><div class='hunk'>@@ -1104,6 +1051,7 @@ static ssize_t write_recoverydir(struct file *file, char *buf, size_t size)</div><div class='ctx'> 	mutex_unlock(&amp;nfsd_mutex);</div><div class='ctx'> 	return rv;</div><div class='ctx'> }</div><div class='add'>+#endif</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * write_v4_end_grace - release grace period for nfsd's v4.x lock manager</div><div class='hunk'>@@ -1114,7 +1062,7 @@ static ssize_t write_recoverydir(struct file *file, char *buf, size_t size)</div><div class='ctx'>  * OR</div><div class='ctx'>  *</div><div class='ctx'>  * Input:</div><div class='del'>- * 			buf:		any value</div><div class='add'>+ *			buf:		any value</div><div class='ctx'>  *			size:		non-zero length of C string in @buf</div><div class='ctx'>  * Output:</div><div class='ctx'>  *			passed-in buffer filled with "Y" or "N" with a newline</div><div class='hunk'>@@ -1136,6 +1084,7 @@ static ssize_t write_v4_end_grace(struct file *file, char *buf, size_t size)</div><div class='ctx'> 		case '1':</div><div class='ctx'> 			if (!nn-&gt;nfsd_serv)</div><div class='ctx'> 				return -EBUSY;</div><div class='add'>+			trace_nfsd_end_grace(netns(file));</div><div class='ctx'> 			nfsd4_end_grace(nn);</div><div class='ctx'> 			break;</div><div class='ctx'> 		default:</div><div class='hunk'>@@ -1154,154 +1103,138 @@ static ssize_t write_v4_end_grace(struct file *file, char *buf, size_t size)</div><div class='ctx'>  *	populating the filesystem.</div><div class='ctx'>  */</div><div class='ctx'> </div><div class='del'>-/* Basically copying rpc_get_inode. */</div><div class='ctx'> static struct inode *nfsd_get_inode(struct super_block *sb, umode_t mode)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *inode = new_inode(sb);</div><div class='del'>-	if (!inode)</div><div class='del'>-		return NULL;</div><div class='del'>-	/* Following advice from simple_fill_super documentation: */</div><div class='del'>-	inode-&gt;i_ino = iunique(sb, NFSD_MaxReserved);</div><div class='del'>-	inode-&gt;i_mode = mode;</div><div class='del'>-	inode-&gt;i_atime = inode-&gt;i_mtime = inode-&gt;i_ctime = current_time(inode);</div><div class='del'>-	switch (mode &amp; S_IFMT) {</div><div class='del'>-	case S_IFDIR:</div><div class='del'>-		inode-&gt;i_fop = &amp;simple_dir_operations;</div><div class='del'>-		inode-&gt;i_op = &amp;simple_dir_inode_operations;</div><div class='del'>-		inc_nlink(inode);</div><div class='del'>-		break;</div><div class='del'>-	default:</div><div class='del'>-		break;</div><div class='add'>+	if (inode) {</div><div class='add'>+		/* Following advice from simple_fill_super documentation: */</div><div class='add'>+		inode-&gt;i_ino = iunique(sb, NFSD_MaxReserved);</div><div class='add'>+		inode-&gt;i_mode = mode;</div><div class='add'>+		simple_inode_init_ts(inode);</div><div class='ctx'> 	}</div><div class='ctx'> 	return inode;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int __nfsd_mkdir(struct inode *dir, struct dentry *dentry, umode_t mode, struct nfsdfs_client *ncl)</div><div class='add'>+static struct dentry *nfsd_mkdir(struct dentry *parent, struct nfsdfs_client *ncl, char *name)</div><div class='ctx'> {</div><div class='add'>+	struct inode *dir = parent-&gt;d_inode;</div><div class='add'>+	struct dentry *dentry;</div><div class='ctx'> 	struct inode *inode;</div><div class='ctx'> </div><div class='del'>-	inode = nfsd_get_inode(dir-&gt;i_sb, mode);</div><div class='add'>+	inode = nfsd_get_inode(parent-&gt;d_sb, S_IFDIR | 0600);</div><div class='ctx'> 	if (!inode)</div><div class='del'>-		return -ENOMEM;</div><div class='add'>+		return ERR_PTR(-ENOMEM);</div><div class='add'>+</div><div class='add'>+	dentry = simple_start_creating(parent, name);</div><div class='add'>+	if (IS_ERR(dentry)) {</div><div class='add'>+		iput(inode);</div><div class='add'>+		return dentry;</div><div class='add'>+	}</div><div class='add'>+	inode-&gt;i_fop = &amp;simple_dir_operations;</div><div class='add'>+	inode-&gt;i_op = &amp;simple_dir_inode_operations;</div><div class='add'>+	inc_nlink(inode);</div><div class='ctx'> 	if (ncl) {</div><div class='ctx'> 		inode-&gt;i_private = ncl;</div><div class='ctx'> 		kref_get(&amp;ncl-&gt;cl_ref);</div><div class='ctx'> 	}</div><div class='del'>-	d_add(dentry, inode);</div><div class='add'>+	d_make_persistent(dentry, inode);</div><div class='ctx'> 	inc_nlink(dir);</div><div class='ctx'> 	fsnotify_mkdir(dir, dentry);</div><div class='del'>-	return 0;</div><div class='add'>+	simple_done_creating(dentry);</div><div class='add'>+	return dentry;	// borrowed</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct dentry *nfsd_mkdir(struct dentry *parent, struct nfsdfs_client *ncl, char *name)</div><div class='add'>+#if IS_ENABLED(CONFIG_SUNRPC_GSS)</div><div class='add'>+/*</div><div class='add'>+ * @content is assumed to be a NUL-terminated string that lives</div><div class='add'>+ * longer than the symlink itself.</div><div class='add'>+ */</div><div class='add'>+static void _nfsd_symlink(struct dentry *parent, const char *name,</div><div class='add'>+			  const char *content)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *dir = parent-&gt;d_inode;</div><div class='add'>+	struct inode *inode;</div><div class='ctx'> 	struct dentry *dentry;</div><div class='del'>-	int ret = -ENOMEM;</div><div class='ctx'> </div><div class='del'>-	inode_lock(dir);</div><div class='del'>-	dentry = d_alloc_name(parent, name);</div><div class='del'>-	if (!dentry)</div><div class='del'>-		goto out_err;</div><div class='del'>-	ret = __nfsd_mkdir(d_inode(parent), dentry, S_IFDIR | 0600, ncl);</div><div class='del'>-	if (ret)</div><div class='del'>-		goto out_err;</div><div class='del'>-out:</div><div class='del'>-	inode_unlock(dir);</div><div class='del'>-	return dentry;</div><div class='del'>-out_err:</div><div class='del'>-	dput(dentry);</div><div class='del'>-	dentry = ERR_PTR(ret);</div><div class='del'>-	goto out;</div><div class='add'>+	inode = nfsd_get_inode(dir-&gt;i_sb, S_IFLNK | 0777);</div><div class='add'>+	if (!inode)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	dentry = simple_start_creating(parent, name);</div><div class='add'>+	if (IS_ERR(dentry)) {</div><div class='add'>+		iput(inode);</div><div class='add'>+		return;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	inode-&gt;i_op = &amp;simple_symlink_inode_operations;</div><div class='add'>+	inode-&gt;i_link = (char *)content;</div><div class='add'>+	inode-&gt;i_size = strlen(content);</div><div class='add'>+</div><div class='add'>+	d_make_persistent(dentry, inode);</div><div class='add'>+	fsnotify_create(dir, dentry);</div><div class='add'>+	simple_done_creating(dentry);</div><div class='add'>+}</div><div class='add'>+#else</div><div class='add'>+static inline void _nfsd_symlink(struct dentry *parent, const char *name,</div><div class='add'>+				 const char *content)</div><div class='add'>+{</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void clear_ncl(struct inode *inode)</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+static void clear_ncl(struct dentry *dentry)</div><div class='ctx'> {</div><div class='add'>+	struct inode *inode = d_inode(dentry);</div><div class='ctx'> 	struct nfsdfs_client *ncl = inode-&gt;i_private;</div><div class='ctx'> </div><div class='add'>+	spin_lock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	inode-&gt;i_private = NULL;</div><div class='add'>+	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	kref_put(&amp;ncl-&gt;cl_ref, ncl-&gt;cl_release);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static struct nfsdfs_client *__get_nfsdfs_client(struct inode *inode)</div><div class='del'>-{</div><div class='del'>-	struct nfsdfs_client *nc = inode-&gt;i_private;</div><div class='del'>-</div><div class='del'>-	if (nc)</div><div class='del'>-		kref_get(&amp;nc-&gt;cl_ref);</div><div class='del'>-	return nc;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> struct nfsdfs_client *get_nfsdfs_client(struct inode *inode)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsdfs_client *nc;</div><div class='ctx'> </div><div class='del'>-	inode_lock_shared(inode);</div><div class='del'>-	nc = __get_nfsdfs_client(inode);</div><div class='del'>-	inode_unlock_shared(inode);</div><div class='add'>+	spin_lock(&amp;inode-&gt;i_lock);</div><div class='add'>+	nc = inode-&gt;i_private;</div><div class='add'>+	if (nc)</div><div class='add'>+		kref_get(&amp;nc-&gt;cl_ref);</div><div class='add'>+	spin_unlock(&amp;inode-&gt;i_lock);</div><div class='ctx'> 	return nc;</div><div class='ctx'> }</div><div class='del'>-/* from __rpc_unlink */</div><div class='del'>-static void nfsdfs_remove_file(struct inode *dir, struct dentry *dentry)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	clear_ncl(d_inode(dentry));</div><div class='del'>-	dget(dentry);</div><div class='del'>-	ret = simple_unlink(dir, dentry);</div><div class='del'>-	d_delete(dentry);</div><div class='del'>-	dput(dentry);</div><div class='del'>-	WARN_ON_ONCE(ret);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void nfsdfs_remove_files(struct dentry *root)</div><div class='del'>-{</div><div class='del'>-	struct dentry *dentry, *tmp;</div><div class='del'>-</div><div class='del'>-	list_for_each_entry_safe(dentry, tmp, &amp;root-&gt;d_subdirs, d_child) {</div><div class='del'>-		if (!simple_positive(dentry)) {</div><div class='del'>-			WARN_ON_ONCE(1); /* I think this can't happen? */</div><div class='del'>-			continue;</div><div class='del'>-		}</div><div class='del'>-		nfsdfs_remove_file(d_inode(root), dentry);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='ctx'> </div><div class='ctx'> /* XXX: cut'n'paste from simple_fill_super; figure out if we could share</div><div class='ctx'>  * code instead. */</div><div class='del'>-static  int nfsdfs_create_files(struct dentry *root,</div><div class='add'>+static int nfsdfs_create_files(struct dentry *root,</div><div class='ctx'> 				const struct tree_descr *files,</div><div class='add'>+				struct nfsdfs_client *ncl,</div><div class='ctx'> 				struct dentry **fdentries)</div><div class='ctx'> {</div><div class='ctx'> 	struct inode *dir = d_inode(root);</div><div class='del'>-	struct inode *inode;</div><div class='ctx'> 	struct dentry *dentry;</div><div class='del'>-	int i;</div><div class='ctx'> </div><div class='del'>-	inode_lock(dir);</div><div class='del'>-	for (i = 0; files-&gt;name &amp;&amp; files-&gt;name[0]; i++, files++) {</div><div class='del'>-		dentry = d_alloc_name(root, files-&gt;name);</div><div class='del'>-		if (!dentry)</div><div class='del'>-			goto out;</div><div class='del'>-		inode = nfsd_get_inode(d_inode(root)-&gt;i_sb,</div><div class='del'>-					S_IFREG | files-&gt;mode);</div><div class='del'>-		if (!inode) {</div><div class='del'>-			dput(dentry);</div><div class='del'>-			goto out;</div><div class='add'>+	for (int i = 0; files-&gt;name &amp;&amp; files-&gt;name[0]; i++, files++) {</div><div class='add'>+		struct inode *inode = nfsd_get_inode(root-&gt;d_sb,</div><div class='add'>+						     S_IFREG | files-&gt;mode);</div><div class='add'>+		if (!inode)</div><div class='add'>+			return -ENOMEM;</div><div class='add'>+		dentry = simple_start_creating(root, files-&gt;name);</div><div class='add'>+		if (IS_ERR(dentry)) {</div><div class='add'>+			iput(inode);</div><div class='add'>+			return PTR_ERR(dentry);</div><div class='ctx'> 		}</div><div class='add'>+		kref_get(&amp;ncl-&gt;cl_ref);</div><div class='ctx'> 		inode-&gt;i_fop = files-&gt;ops;</div><div class='del'>-		inode-&gt;i_private = __get_nfsdfs_client(dir);</div><div class='del'>-		d_add(dentry, inode);</div><div class='add'>+		inode-&gt;i_private = ncl;</div><div class='add'>+		d_make_persistent(dentry, inode);</div><div class='ctx'> 		fsnotify_create(dir, dentry);</div><div class='ctx'> 		if (fdentries)</div><div class='del'>-			fdentries[i] = dentry;</div><div class='add'>+			fdentries[i] = dentry; // borrowed</div><div class='add'>+		simple_done_creating(dentry);</div><div class='ctx'> 	}</div><div class='del'>-	inode_unlock(dir);</div><div class='ctx'> 	return 0;</div><div class='del'>-out:</div><div class='del'>-	nfsdfs_remove_files(root);</div><div class='del'>-	inode_unlock(dir);</div><div class='del'>-	return -ENOMEM;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /* on success, returns positive number unique to that client. */</div><div class='hunk'>@@ -1319,7 +1252,7 @@ struct dentry *nfsd_client_mkdir(struct nfsd_net *nn,</div><div class='ctx'> 	dentry = nfsd_mkdir(nn-&gt;nfsd_client_dir, ncl, name);</div><div class='ctx'> 	if (IS_ERR(dentry)) /* XXX: tossing errors? */</div><div class='ctx'> 		return NULL;</div><div class='del'>-	ret = nfsdfs_create_files(dentry, files, fdentries);</div><div class='add'>+	ret = nfsdfs_create_files(dentry, files, ncl, fdentries);</div><div class='ctx'> 	if (ret) {</div><div class='ctx'> 		nfsd_client_rmdir(dentry);</div><div class='ctx'> 		return NULL;</div><div class='hunk'>@@ -1330,20 +1263,7 @@ struct dentry *nfsd_client_mkdir(struct nfsd_net *nn,</div><div class='ctx'> /* Taken from __rpc_rmdir: */</div><div class='ctx'> void nfsd_client_rmdir(struct dentry *dentry)</div><div class='ctx'> {</div><div class='del'>-	struct inode *dir = d_inode(dentry-&gt;d_parent);</div><div class='del'>-	struct inode *inode = d_inode(dentry);</div><div class='del'>-	int ret;</div><div class='del'>-</div><div class='del'>-	inode_lock(dir);</div><div class='del'>-	nfsdfs_remove_files(dentry);</div><div class='del'>-	clear_ncl(inode);</div><div class='del'>-	dget(dentry);</div><div class='del'>-	ret = simple_rmdir(dir, dentry);</div><div class='del'>-	WARN_ON_ONCE(ret);</div><div class='del'>-	fsnotify_rmdir(dir, dentry);</div><div class='del'>-	d_delete(dentry);</div><div class='del'>-	dput(dentry);</div><div class='del'>-	inode_unlock(dir);</div><div class='add'>+	simple_recursive_removal(dentry, clear_ncl);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static int nfsd_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='hunk'>@@ -1358,7 +1278,7 @@ static int nfsd_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> 		/* Per-export io stats use same ops as exports file */</div><div class='ctx'> 		[NFSD_Export_Stats] = {"export_stats", &amp;exports_nfsd_operations, S_IRUGO},</div><div class='ctx'> 		[NFSD_Export_features] = {"export_features",</div><div class='del'>-					&amp;export_features_operations, S_IRUGO},</div><div class='add'>+					&amp;export_features_fops, S_IRUGO},</div><div class='ctx'> 		[NFSD_FO_UnlockIP] = {"unlock_ip",</div><div class='ctx'> 					&amp;transaction_ops, S_IWUSR|S_IRUSR},</div><div class='ctx'> 		[NFSD_FO_UnlockFS] = {"unlock_filesystem",</div><div class='hunk'>@@ -1367,18 +1287,18 @@ static int nfsd_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> 		[NFSD_Threads] = {"threads", &amp;transaction_ops, S_IWUSR|S_IRUSR},</div><div class='ctx'> 		[NFSD_Pool_Threads] = {"pool_threads", &amp;transaction_ops, S_IWUSR|S_IRUSR},</div><div class='ctx'> 		[NFSD_Pool_Stats] = {"pool_stats", &amp;pool_stats_operations, S_IRUGO},</div><div class='del'>-		[NFSD_Reply_Cache_Stats] = {"reply_cache_stats", &amp;reply_cache_stats_operations, S_IRUGO},</div><div class='add'>+		[NFSD_Reply_Cache_Stats] = {"reply_cache_stats",</div><div class='add'>+					&amp;nfsd_reply_cache_stats_fops, S_IRUGO},</div><div class='ctx'> 		[NFSD_Versions] = {"versions", &amp;transaction_ops, S_IWUSR|S_IRUSR},</div><div class='ctx'> 		[NFSD_Ports] = {"portlist", &amp;transaction_ops, S_IWUSR|S_IRUGO},</div><div class='ctx'> 		[NFSD_MaxBlkSize] = {"max_block_size", &amp;transaction_ops, S_IWUSR|S_IRUGO},</div><div class='del'>-		[NFSD_MaxConnections] = {"max_connections", &amp;transaction_ops, S_IWUSR|S_IRUGO},</div><div class='del'>-#if defined(CONFIG_SUNRPC_GSS) || defined(CONFIG_SUNRPC_GSS_MODULE)</div><div class='del'>-		[NFSD_SupportedEnctypes] = {"supported_krb5_enctypes", &amp;supported_enctypes_ops, S_IRUGO},</div><div class='del'>-#endif /* CONFIG_SUNRPC_GSS or CONFIG_SUNRPC_GSS_MODULE */</div><div class='add'>+		[NFSD_Filecache] = {"filecache", &amp;nfsd_file_cache_stats_fops, S_IRUGO},</div><div class='ctx'> #ifdef CONFIG_NFSD_V4</div><div class='ctx'> 		[NFSD_Leasetime] = {"nfsv4leasetime", &amp;transaction_ops, S_IWUSR|S_IRUSR},</div><div class='ctx'> 		[NFSD_Gracetime] = {"nfsv4gracetime", &amp;transaction_ops, S_IWUSR|S_IRUSR},</div><div class='add'>+#ifdef CONFIG_NFSD_LEGACY_CLIENT_TRACKING</div><div class='ctx'> 		[NFSD_RecoveryDir] = {"nfsv4recoverydir", &amp;transaction_ops, S_IWUSR|S_IRUSR},</div><div class='add'>+#endif</div><div class='ctx'> 		[NFSD_V4EndGrace] = {"v4_end_grace", &amp;transaction_ops, S_IWUSR|S_IRUGO},</div><div class='ctx'> #endif</div><div class='ctx'> 		/* last one */ {""}</div><div class='hunk'>@@ -1387,6 +1307,8 @@ static int nfsd_fill_super(struct super_block *sb, struct fs_context *fc)</div><div class='ctx'> 	ret = simple_fill_super(sb, 0x6e667364, nfsd_files);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='add'>+	_nfsd_symlink(sb-&gt;s_root, "supported_krb5_enctypes",</div><div class='add'>+		      "/proc/net/rpc/gss_krb5_enctypes");</div><div class='ctx'> 	dentry = nfsd_mkdir(sb-&gt;s_root, NULL, "clients");</div><div class='ctx'> 	if (IS_ERR(dentry))</div><div class='ctx'> 		return PTR_ERR(dentry);</div><div class='hunk'>@@ -1424,7 +1346,7 @@ static void nfsd_umount(struct super_block *sb)</div><div class='ctx'> </div><div class='ctx'> 	nfsd_shutdown_threads(net);</div><div class='ctx'> </div><div class='del'>-	kill_litter_super(sb);</div><div class='add'>+	kill_anon_super(sb);</div><div class='ctx'> 	put_net(net);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -1437,6 +1359,19 @@ static struct file_system_type nfsd_fs_type = {</div><div class='ctx'> MODULE_ALIAS_FS("nfsd");</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_PROC_FS</div><div class='add'>+</div><div class='add'>+static int exports_proc_open(struct inode *inode, struct file *file)</div><div class='add'>+{</div><div class='add'>+	return exports_net_open(current-&gt;nsproxy-&gt;net_ns, file);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static const struct proc_ops exports_proc_ops = {</div><div class='add'>+	.proc_open	= exports_proc_open,</div><div class='add'>+	.proc_read	= seq_read,</div><div class='add'>+	.proc_lseek	= seq_lseek,</div><div class='add'>+	.proc_release	= seq_release,</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> static int create_proc_exports_entry(void)</div><div class='ctx'> {</div><div class='ctx'> 	struct proc_dir_entry *entry;</div><div class='hunk'>@@ -1460,10 +1395,755 @@ static int create_proc_exports_entry(void)</div><div class='ctx'> </div><div class='ctx'> unsigned int nfsd_net_id;</div><div class='ctx'> </div><div class='del'>-static __net_init int nfsd_init_net(struct net *net)</div><div class='add'>+static int nfsd_genl_rpc_status_compose_msg(struct sk_buff *skb,</div><div class='add'>+					    struct netlink_callback *cb,</div><div class='add'>+					    struct nfsd_genl_rqstp *genl_rqstp)</div><div class='add'>+{</div><div class='add'>+	void *hdr;</div><div class='add'>+	u32 i;</div><div class='add'>+</div><div class='add'>+	hdr = genlmsg_put(skb, NETLINK_CB(cb-&gt;skb).portid, cb-&gt;nlh-&gt;nlmsg_seq,</div><div class='add'>+			  &amp;nfsd_nl_family, 0, NFSD_CMD_RPC_STATUS_GET);</div><div class='add'>+	if (!hdr)</div><div class='add'>+		return -ENOBUFS;</div><div class='add'>+</div><div class='add'>+	if (nla_put_be32(skb, NFSD_A_RPC_STATUS_XID, genl_rqstp-&gt;rq_xid) ||</div><div class='add'>+	    nla_put_u32(skb, NFSD_A_RPC_STATUS_FLAGS, genl_rqstp-&gt;rq_flags) ||</div><div class='add'>+	    nla_put_u32(skb, NFSD_A_RPC_STATUS_PROG, genl_rqstp-&gt;rq_prog) ||</div><div class='add'>+	    nla_put_u32(skb, NFSD_A_RPC_STATUS_PROC, genl_rqstp-&gt;rq_proc) ||</div><div class='add'>+	    nla_put_u8(skb, NFSD_A_RPC_STATUS_VERSION, genl_rqstp-&gt;rq_vers) ||</div><div class='add'>+	    nla_put_s64(skb, NFSD_A_RPC_STATUS_SERVICE_TIME,</div><div class='add'>+			ktime_to_us(genl_rqstp-&gt;rq_stime),</div><div class='add'>+			NFSD_A_RPC_STATUS_PAD))</div><div class='add'>+		return -ENOBUFS;</div><div class='add'>+</div><div class='add'>+	switch (genl_rqstp-&gt;rq_saddr.sa_family) {</div><div class='add'>+	case AF_INET: {</div><div class='add'>+		const struct sockaddr_in *s_in, *d_in;</div><div class='add'>+</div><div class='add'>+		s_in = (const struct sockaddr_in *)&amp;genl_rqstp-&gt;rq_saddr;</div><div class='add'>+		d_in = (const struct sockaddr_in *)&amp;genl_rqstp-&gt;rq_daddr;</div><div class='add'>+		if (nla_put_in_addr(skb, NFSD_A_RPC_STATUS_SADDR4,</div><div class='add'>+				    s_in-&gt;sin_addr.s_addr) ||</div><div class='add'>+		    nla_put_in_addr(skb, NFSD_A_RPC_STATUS_DADDR4,</div><div class='add'>+				    d_in-&gt;sin_addr.s_addr) ||</div><div class='add'>+		    nla_put_be16(skb, NFSD_A_RPC_STATUS_SPORT,</div><div class='add'>+				 s_in-&gt;sin_port) ||</div><div class='add'>+		    nla_put_be16(skb, NFSD_A_RPC_STATUS_DPORT,</div><div class='add'>+				 d_in-&gt;sin_port))</div><div class='add'>+			return -ENOBUFS;</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+	case AF_INET6: {</div><div class='add'>+		const struct sockaddr_in6 *s_in, *d_in;</div><div class='add'>+</div><div class='add'>+		s_in = (const struct sockaddr_in6 *)&amp;genl_rqstp-&gt;rq_saddr;</div><div class='add'>+		d_in = (const struct sockaddr_in6 *)&amp;genl_rqstp-&gt;rq_daddr;</div><div class='add'>+		if (nla_put_in6_addr(skb, NFSD_A_RPC_STATUS_SADDR6,</div><div class='add'>+				     &amp;s_in-&gt;sin6_addr) ||</div><div class='add'>+		    nla_put_in6_addr(skb, NFSD_A_RPC_STATUS_DADDR6,</div><div class='add'>+				     &amp;d_in-&gt;sin6_addr) ||</div><div class='add'>+		    nla_put_be16(skb, NFSD_A_RPC_STATUS_SPORT,</div><div class='add'>+				 s_in-&gt;sin6_port) ||</div><div class='add'>+		    nla_put_be16(skb, NFSD_A_RPC_STATUS_DPORT,</div><div class='add'>+				 d_in-&gt;sin6_port))</div><div class='add'>+			return -ENOBUFS;</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; genl_rqstp-&gt;rq_opcnt; i++)</div><div class='add'>+		if (nla_put_u32(skb, NFSD_A_RPC_STATUS_COMPOUND_OPS,</div><div class='add'>+				genl_rqstp-&gt;rq_opnum[i]))</div><div class='add'>+			return -ENOBUFS;</div><div class='add'>+</div><div class='add'>+	genlmsg_end(skb, hdr);</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * nfsd_nl_rpc_status_get_dumpit - Handle rpc_status_get dumpit</div><div class='add'>+ * @skb: reply buffer</div><div class='add'>+ * @cb: netlink metadata and command arguments</div><div class='add'>+ *</div><div class='add'>+ * Returns the size of the reply or a negative errno.</div><div class='add'>+ */</div><div class='add'>+int nfsd_nl_rpc_status_get_dumpit(struct sk_buff *skb,</div><div class='add'>+				  struct netlink_callback *cb)</div><div class='add'>+{</div><div class='add'>+	int i, ret, rqstp_index = 0;</div><div class='add'>+	struct nfsd_net *nn;</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;nfsd_mutex);</div><div class='add'>+</div><div class='add'>+	nn = net_generic(sock_net(skb-&gt;sk), nfsd_net_id);</div><div class='add'>+	if (!nn-&gt;nfsd_serv) {</div><div class='add'>+		ret = -ENODEV;</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	rcu_read_lock();</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; nn-&gt;nfsd_serv-&gt;sv_nrpools; i++) {</div><div class='add'>+		struct svc_rqst *rqstp;</div><div class='add'>+</div><div class='add'>+		if (i &lt; cb-&gt;args[0]) /* already consumed */</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		rqstp_index = 0;</div><div class='add'>+		list_for_each_entry_rcu(rqstp,</div><div class='add'>+				&amp;nn-&gt;nfsd_serv-&gt;sv_pools[i].sp_all_threads,</div><div class='add'>+				rq_all) {</div><div class='add'>+			struct nfsd_genl_rqstp genl_rqstp;</div><div class='add'>+			unsigned int status_counter;</div><div class='add'>+</div><div class='add'>+			if (rqstp_index++ &lt; cb-&gt;args[1]) /* already consumed */</div><div class='add'>+				continue;</div><div class='add'>+			/*</div><div class='add'>+			 * Acquire rq_status_counter before parsing the rqst</div><div class='add'>+			 * fields. rq_status_counter is set to an odd value in</div><div class='add'>+			 * order to notify the consumers the rqstp fields are</div><div class='add'>+			 * meaningful.</div><div class='add'>+			 */</div><div class='add'>+			status_counter =</div><div class='add'>+				smp_load_acquire(&amp;rqstp-&gt;rq_status_counter);</div><div class='add'>+			if (!(status_counter &amp; 1))</div><div class='add'>+				continue;</div><div class='add'>+</div><div class='add'>+			genl_rqstp.rq_xid = rqstp-&gt;rq_xid;</div><div class='add'>+			genl_rqstp.rq_flags = rqstp-&gt;rq_flags;</div><div class='add'>+			genl_rqstp.rq_vers = rqstp-&gt;rq_vers;</div><div class='add'>+			genl_rqstp.rq_prog = rqstp-&gt;rq_prog;</div><div class='add'>+			genl_rqstp.rq_proc = rqstp-&gt;rq_proc;</div><div class='add'>+			genl_rqstp.rq_stime = rqstp-&gt;rq_stime;</div><div class='add'>+			genl_rqstp.rq_opcnt = 0;</div><div class='add'>+			memcpy(&amp;genl_rqstp.rq_daddr, svc_daddr(rqstp),</div><div class='add'>+			       sizeof(struct sockaddr));</div><div class='add'>+			memcpy(&amp;genl_rqstp.rq_saddr, svc_addr(rqstp),</div><div class='add'>+			       sizeof(struct sockaddr));</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_NFSD_V4</div><div class='add'>+			if (rqstp-&gt;rq_vers == NFS4_VERSION &amp;&amp;</div><div class='add'>+			    rqstp-&gt;rq_proc == NFSPROC4_COMPOUND) {</div><div class='add'>+				/* NFSv4 compound */</div><div class='add'>+				struct nfsd4_compoundargs *args;</div><div class='add'>+				int j;</div><div class='add'>+</div><div class='add'>+				args = rqstp-&gt;rq_argp;</div><div class='add'>+				genl_rqstp.rq_opcnt = min_t(u32, args-&gt;opcnt,</div><div class='add'>+							    ARRAY_SIZE(genl_rqstp.rq_opnum));</div><div class='add'>+				for (j = 0; j &lt; genl_rqstp.rq_opcnt; j++)</div><div class='add'>+					genl_rqstp.rq_opnum[j] =</div><div class='add'>+						args-&gt;ops[j].opnum;</div><div class='add'>+			}</div><div class='add'>+#endif /* CONFIG_NFSD_V4 */</div><div class='add'>+</div><div class='add'>+			/*</div><div class='add'>+			 * Acquire rq_status_counter before reporting the rqst</div><div class='add'>+			 * fields to the user.</div><div class='add'>+			 */</div><div class='add'>+			if (smp_load_acquire(&amp;rqstp-&gt;rq_status_counter) !=</div><div class='add'>+			    status_counter)</div><div class='add'>+				continue;</div><div class='add'>+</div><div class='add'>+			ret = nfsd_genl_rpc_status_compose_msg(skb, cb,</div><div class='add'>+							       &amp;genl_rqstp);</div><div class='add'>+			if (ret)</div><div class='add'>+				goto out;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	cb-&gt;args[0] = i;</div><div class='add'>+	cb-&gt;args[1] = rqstp_index;</div><div class='add'>+	ret = skb-&gt;len;</div><div class='add'>+out:</div><div class='add'>+	rcu_read_unlock();</div><div class='add'>+out_unlock:</div><div class='add'>+	mutex_unlock(&amp;nfsd_mutex);</div><div class='add'>+</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * nfsd_nl_threads_set_doit - set the number of running threads</div><div class='add'>+ * @skb: reply buffer</div><div class='add'>+ * @info: netlink metadata and command arguments</div><div class='add'>+ *</div><div class='add'>+ * Return 0 on success or a negative errno.</div><div class='add'>+ */</div><div class='add'>+int nfsd_nl_threads_set_doit(struct sk_buff *skb, struct genl_info *info)</div><div class='add'>+{</div><div class='add'>+	int *nthreads, nrpools = 0, i, ret = -EOPNOTSUPP, rem;</div><div class='add'>+	struct net *net = genl_info_net(info);</div><div class='add'>+	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='add'>+	const struct nlattr *attr;</div><div class='add'>+	const char *scope = NULL;</div><div class='add'>+</div><div class='add'>+	if (GENL_REQ_ATTR_CHECK(info, NFSD_A_SERVER_THREADS))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	/* count number of SERVER_THREADS values */</div><div class='add'>+	nlmsg_for_each_attr_type(attr, NFSD_A_SERVER_THREADS, info-&gt;nlhdr,</div><div class='add'>+				 GENL_HDRLEN, rem)</div><div class='add'>+		nrpools++;</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;nfsd_mutex);</div><div class='add'>+</div><div class='add'>+	nthreads = kcalloc(nrpools, sizeof(int), GFP_KERNEL);</div><div class='add'>+	if (!nthreads) {</div><div class='add'>+		ret = -ENOMEM;</div><div class='add'>+		goto out_unlock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	i = 0;</div><div class='add'>+	nlmsg_for_each_attr_type(attr, NFSD_A_SERVER_THREADS, info-&gt;nlhdr,</div><div class='add'>+				 GENL_HDRLEN, rem) {</div><div class='add'>+		nthreads[i++] = nla_get_u32(attr);</div><div class='add'>+		if (i &gt;= nrpools)</div><div class='add'>+			break;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (info-&gt;attrs[NFSD_A_SERVER_GRACETIME] ||</div><div class='add'>+	    info-&gt;attrs[NFSD_A_SERVER_LEASETIME] ||</div><div class='add'>+	    info-&gt;attrs[NFSD_A_SERVER_SCOPE]) {</div><div class='add'>+		ret = -EBUSY;</div><div class='add'>+		if (nn-&gt;nfsd_serv &amp;&amp; nn-&gt;nfsd_serv-&gt;sv_nrthreads)</div><div class='add'>+			goto out_unlock;</div><div class='add'>+</div><div class='add'>+		ret = -EINVAL;</div><div class='add'>+		attr = info-&gt;attrs[NFSD_A_SERVER_GRACETIME];</div><div class='add'>+		if (attr) {</div><div class='add'>+			u32 gracetime = nla_get_u32(attr);</div><div class='add'>+</div><div class='add'>+			if (gracetime &lt; 10 || gracetime &gt; 3600)</div><div class='add'>+				goto out_unlock;</div><div class='add'>+</div><div class='add'>+			nn-&gt;nfsd4_grace = gracetime;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		attr = info-&gt;attrs[NFSD_A_SERVER_LEASETIME];</div><div class='add'>+		if (attr) {</div><div class='add'>+			u32 leasetime = nla_get_u32(attr);</div><div class='add'>+</div><div class='add'>+			if (leasetime &lt; 10 || leasetime &gt; 3600)</div><div class='add'>+				goto out_unlock;</div><div class='add'>+</div><div class='add'>+			nn-&gt;nfsd4_lease = leasetime;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		attr = info-&gt;attrs[NFSD_A_SERVER_SCOPE];</div><div class='add'>+		if (attr)</div><div class='add'>+			scope = nla_data(attr);</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	ret = nfsd_svc(nrpools, nthreads, net, get_current_cred(), scope);</div><div class='add'>+	if (ret &gt; 0)</div><div class='add'>+		ret = 0;</div><div class='add'>+out_unlock:</div><div class='add'>+	mutex_unlock(&amp;nfsd_mutex);</div><div class='add'>+	kfree(nthreads);</div><div class='add'>+	return ret;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * nfsd_nl_threads_get_doit - get the number of running threads</div><div class='add'>+ * @skb: reply buffer</div><div class='add'>+ * @info: netlink metadata and command arguments</div><div class='add'>+ *</div><div class='add'>+ * Return 0 on success or a negative errno.</div><div class='add'>+ */</div><div class='add'>+int nfsd_nl_threads_get_doit(struct sk_buff *skb, struct genl_info *info)</div><div class='add'>+{</div><div class='add'>+	struct net *net = genl_info_net(info);</div><div class='add'>+	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='add'>+	void *hdr;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	skb = genlmsg_new(GENLMSG_DEFAULT_SIZE, GFP_KERNEL);</div><div class='add'>+	if (!skb)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	hdr = genlmsg_iput(skb, info);</div><div class='add'>+	if (!hdr) {</div><div class='add'>+		err = -EMSGSIZE;</div><div class='add'>+		goto err_free_msg;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;nfsd_mutex);</div><div class='add'>+</div><div class='add'>+	err = nla_put_u32(skb, NFSD_A_SERVER_GRACETIME,</div><div class='add'>+			  nn-&gt;nfsd4_grace) ||</div><div class='add'>+	      nla_put_u32(skb, NFSD_A_SERVER_LEASETIME,</div><div class='add'>+			  nn-&gt;nfsd4_lease) ||</div><div class='add'>+	      nla_put_string(skb, NFSD_A_SERVER_SCOPE,</div><div class='add'>+			  nn-&gt;nfsd_name);</div><div class='add'>+	if (err)</div><div class='add'>+		goto err_unlock;</div><div class='add'>+</div><div class='add'>+	if (nn-&gt;nfsd_serv) {</div><div class='add'>+		int i;</div><div class='add'>+</div><div class='add'>+		for (i = 0; i &lt; nfsd_nrpools(net); ++i) {</div><div class='add'>+			struct svc_pool *sp = &amp;nn-&gt;nfsd_serv-&gt;sv_pools[i];</div><div class='add'>+</div><div class='add'>+			err = nla_put_u32(skb, NFSD_A_SERVER_THREADS,</div><div class='add'>+					  sp-&gt;sp_nrthreads);</div><div class='add'>+			if (err)</div><div class='add'>+				goto err_unlock;</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		err = nla_put_u32(skb, NFSD_A_SERVER_THREADS, 0);</div><div class='add'>+		if (err)</div><div class='add'>+			goto err_unlock;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	mutex_unlock(&amp;nfsd_mutex);</div><div class='add'>+</div><div class='add'>+	genlmsg_end(skb, hdr);</div><div class='add'>+</div><div class='add'>+	return genlmsg_reply(skb, info);</div><div class='add'>+</div><div class='add'>+err_unlock:</div><div class='add'>+	mutex_unlock(&amp;nfsd_mutex);</div><div class='add'>+err_free_msg:</div><div class='add'>+	nlmsg_free(skb);</div><div class='add'>+</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * nfsd_nl_version_set_doit - set the nfs enabled versions</div><div class='add'>+ * @skb: reply buffer</div><div class='add'>+ * @info: netlink metadata and command arguments</div><div class='add'>+ *</div><div class='add'>+ * Return 0 on success or a negative errno.</div><div class='add'>+ */</div><div class='add'>+int nfsd_nl_version_set_doit(struct sk_buff *skb, struct genl_info *info)</div><div class='add'>+{</div><div class='add'>+	const struct nlattr *attr;</div><div class='add'>+	struct nfsd_net *nn;</div><div class='add'>+	int i, rem;</div><div class='add'>+</div><div class='add'>+	if (GENL_REQ_ATTR_CHECK(info, NFSD_A_SERVER_PROTO_VERSION))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;nfsd_mutex);</div><div class='add'>+</div><div class='add'>+	nn = net_generic(genl_info_net(info), nfsd_net_id);</div><div class='add'>+	if (nn-&gt;nfsd_serv) {</div><div class='add'>+		mutex_unlock(&amp;nfsd_mutex);</div><div class='add'>+		return -EBUSY;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/* clear current supported versions. */</div><div class='add'>+	nfsd_vers(nn, 2, NFSD_CLEAR);</div><div class='add'>+	nfsd_vers(nn, 3, NFSD_CLEAR);</div><div class='add'>+	for (i = 0; i &lt;= NFSD_SUPPORTED_MINOR_VERSION; i++)</div><div class='add'>+		nfsd_minorversion(nn, i, NFSD_CLEAR);</div><div class='add'>+</div><div class='add'>+	nlmsg_for_each_attr_type(attr, NFSD_A_SERVER_PROTO_VERSION, info-&gt;nlhdr,</div><div class='add'>+				 GENL_HDRLEN, rem) {</div><div class='add'>+		struct nlattr *tb[NFSD_A_VERSION_MAX + 1];</div><div class='add'>+		u32 major, minor = 0;</div><div class='add'>+		bool enabled;</div><div class='add'>+</div><div class='add'>+		if (nla_parse_nested(tb, NFSD_A_VERSION_MAX, attr,</div><div class='add'>+				     nfsd_version_nl_policy, info-&gt;extack) &lt; 0)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		if (!tb[NFSD_A_VERSION_MAJOR])</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		major = nla_get_u32(tb[NFSD_A_VERSION_MAJOR]);</div><div class='add'>+		if (tb[NFSD_A_VERSION_MINOR])</div><div class='add'>+			minor = nla_get_u32(tb[NFSD_A_VERSION_MINOR]);</div><div class='add'>+</div><div class='add'>+		enabled = nla_get_flag(tb[NFSD_A_VERSION_ENABLED]);</div><div class='add'>+</div><div class='add'>+		switch (major) {</div><div class='add'>+		case 4:</div><div class='add'>+			nfsd_minorversion(nn, minor, enabled ? NFSD_SET : NFSD_CLEAR);</div><div class='add'>+			break;</div><div class='add'>+		case 3:</div><div class='add'>+		case 2:</div><div class='add'>+			if (!minor)</div><div class='add'>+				nfsd_vers(nn, major, enabled ? NFSD_SET : NFSD_CLEAR);</div><div class='add'>+			break;</div><div class='add'>+		default:</div><div class='add'>+			break;</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	mutex_unlock(&amp;nfsd_mutex);</div><div class='add'>+</div><div class='add'>+	return 0;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * nfsd_nl_version_get_doit - get the enabled status for all supported nfs versions</div><div class='add'>+ * @skb: reply buffer</div><div class='add'>+ * @info: netlink metadata and command arguments</div><div class='add'>+ *</div><div class='add'>+ * Return 0 on success or a negative errno.</div><div class='add'>+ */</div><div class='add'>+int nfsd_nl_version_get_doit(struct sk_buff *skb, struct genl_info *info)</div><div class='add'>+{</div><div class='add'>+	struct nfsd_net *nn;</div><div class='add'>+	int i, err;</div><div class='add'>+	void *hdr;</div><div class='add'>+</div><div class='add'>+	skb = genlmsg_new(GENLMSG_DEFAULT_SIZE, GFP_KERNEL);</div><div class='add'>+	if (!skb)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	hdr = genlmsg_iput(skb, info);</div><div class='add'>+	if (!hdr) {</div><div class='add'>+		err = -EMSGSIZE;</div><div class='add'>+		goto err_free_msg;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;nfsd_mutex);</div><div class='add'>+	nn = net_generic(genl_info_net(info), nfsd_net_id);</div><div class='add'>+</div><div class='add'>+	for (i = 2; i &lt;= 4; i++) {</div><div class='add'>+		int j;</div><div class='add'>+</div><div class='add'>+		for (j = 0; j &lt;= NFSD_SUPPORTED_MINOR_VERSION; j++) {</div><div class='add'>+			struct nlattr *attr;</div><div class='add'>+</div><div class='add'>+			/* Don't record any versions the kernel doesn't have</div><div class='add'>+			 * compiled in</div><div class='add'>+			 */</div><div class='add'>+			if (!nfsd_support_version(i))</div><div class='add'>+				continue;</div><div class='add'>+</div><div class='add'>+			/* NFSv{2,3} does not support minor numbers */</div><div class='add'>+			if (i &lt; 4 &amp;&amp; j)</div><div class='add'>+				continue;</div><div class='add'>+</div><div class='add'>+			attr = nla_nest_start(skb,</div><div class='add'>+					      NFSD_A_SERVER_PROTO_VERSION);</div><div class='add'>+			if (!attr) {</div><div class='add'>+				err = -EINVAL;</div><div class='add'>+				goto err_nfsd_unlock;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			if (nla_put_u32(skb, NFSD_A_VERSION_MAJOR, i) ||</div><div class='add'>+			    nla_put_u32(skb, NFSD_A_VERSION_MINOR, j)) {</div><div class='add'>+				err = -EINVAL;</div><div class='add'>+				goto err_nfsd_unlock;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			/* Set the enabled flag if the version is enabled */</div><div class='add'>+			if (nfsd_vers(nn, i, NFSD_TEST) &amp;&amp;</div><div class='add'>+			    (i &lt; 4 || nfsd_minorversion(nn, j, NFSD_TEST)) &amp;&amp;</div><div class='add'>+			    nla_put_flag(skb, NFSD_A_VERSION_ENABLED)) {</div><div class='add'>+				err = -EINVAL;</div><div class='add'>+				goto err_nfsd_unlock;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			nla_nest_end(skb, attr);</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	mutex_unlock(&amp;nfsd_mutex);</div><div class='add'>+	genlmsg_end(skb, hdr);</div><div class='add'>+</div><div class='add'>+	return genlmsg_reply(skb, info);</div><div class='add'>+</div><div class='add'>+err_nfsd_unlock:</div><div class='add'>+	mutex_unlock(&amp;nfsd_mutex);</div><div class='add'>+err_free_msg:</div><div class='add'>+	nlmsg_free(skb);</div><div class='add'>+</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * nfsd_nl_listener_set_doit - set the nfs running sockets</div><div class='add'>+ * @skb: reply buffer</div><div class='add'>+ * @info: netlink metadata and command arguments</div><div class='add'>+ *</div><div class='add'>+ * Return 0 on success or a negative errno.</div><div class='add'>+ */</div><div class='add'>+int nfsd_nl_listener_set_doit(struct sk_buff *skb, struct genl_info *info)</div><div class='add'>+{</div><div class='add'>+	struct net *net = genl_info_net(info);</div><div class='add'>+	struct svc_xprt *xprt, *tmp;</div><div class='add'>+	const struct nlattr *attr;</div><div class='add'>+	struct svc_serv *serv;</div><div class='add'>+	LIST_HEAD(permsocks);</div><div class='add'>+	struct nfsd_net *nn;</div><div class='add'>+	bool delete = false;</div><div class='add'>+	int err, rem;</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;nfsd_mutex);</div><div class='add'>+</div><div class='add'>+	err = nfsd_create_serv(net);</div><div class='add'>+	if (err) {</div><div class='add'>+		mutex_unlock(&amp;nfsd_mutex);</div><div class='add'>+		return err;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	nn = net_generic(net, nfsd_net_id);</div><div class='add'>+	serv = nn-&gt;nfsd_serv;</div><div class='add'>+</div><div class='add'>+	spin_lock_bh(&amp;serv-&gt;sv_lock);</div><div class='add'>+</div><div class='add'>+	/* Move all of the old listener sockets to a temp list */</div><div class='add'>+	list_splice_init(&amp;serv-&gt;sv_permsocks, &amp;permsocks);</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Walk the list of server_socks from userland and move any that match</div><div class='add'>+	 * back to sv_permsocks</div><div class='add'>+	 */</div><div class='add'>+	nlmsg_for_each_attr_type(attr, NFSD_A_SERVER_SOCK_ADDR, info-&gt;nlhdr,</div><div class='add'>+				 GENL_HDRLEN, rem) {</div><div class='add'>+		struct nlattr *tb[NFSD_A_SOCK_MAX + 1];</div><div class='add'>+		const char *xcl_name;</div><div class='add'>+		struct sockaddr *sa;</div><div class='add'>+</div><div class='add'>+		if (nla_parse_nested(tb, NFSD_A_SOCK_MAX, attr,</div><div class='add'>+				     nfsd_sock_nl_policy, info-&gt;extack) &lt; 0)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		if (!tb[NFSD_A_SOCK_ADDR] || !tb[NFSD_A_SOCK_TRANSPORT_NAME])</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		if (nla_len(tb[NFSD_A_SOCK_ADDR]) &lt; sizeof(*sa))</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		xcl_name = nla_data(tb[NFSD_A_SOCK_TRANSPORT_NAME]);</div><div class='add'>+		sa = nla_data(tb[NFSD_A_SOCK_ADDR]);</div><div class='add'>+</div><div class='add'>+		/* Put back any matching sockets */</div><div class='add'>+		list_for_each_entry_safe(xprt, tmp, &amp;permsocks, xpt_list) {</div><div class='add'>+			/* This shouldn't be possible */</div><div class='add'>+			if (WARN_ON_ONCE(xprt-&gt;xpt_net != net)) {</div><div class='add'>+				list_move(&amp;xprt-&gt;xpt_list, &amp;serv-&gt;sv_permsocks);</div><div class='add'>+				continue;</div><div class='add'>+			}</div><div class='add'>+</div><div class='add'>+			/* If everything matches, put it back */</div><div class='add'>+			if (!strcmp(xprt-&gt;xpt_class-&gt;xcl_name, xcl_name) &amp;&amp;</div><div class='add'>+			    rpc_cmp_addr_port(sa, (struct sockaddr *)&amp;xprt-&gt;xpt_local)) {</div><div class='add'>+				list_move(&amp;xprt-&gt;xpt_list, &amp;serv-&gt;sv_permsocks);</div><div class='add'>+				break;</div><div class='add'>+			}</div><div class='add'>+		}</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * If there are listener transports remaining on the permsocks list,</div><div class='add'>+	 * it means we were asked to remove a listener.</div><div class='add'>+	 */</div><div class='add'>+	if (!list_empty(&amp;permsocks)) {</div><div class='add'>+		list_splice_init(&amp;permsocks, &amp;serv-&gt;sv_permsocks);</div><div class='add'>+		delete = true;</div><div class='add'>+	}</div><div class='add'>+	spin_unlock_bh(&amp;serv-&gt;sv_lock);</div><div class='add'>+</div><div class='add'>+	/* Do not remove listeners while there are active threads. */</div><div class='add'>+	if (serv-&gt;sv_nrthreads) {</div><div class='add'>+		err = -EBUSY;</div><div class='add'>+		goto out_unlock_mtx;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Since we can't delete an arbitrary llist entry, destroy the</div><div class='add'>+	 * remaining listeners and recreate the list.</div><div class='add'>+	 */</div><div class='add'>+	if (delete)</div><div class='add'>+		svc_xprt_destroy_all(serv, net, false);</div><div class='add'>+</div><div class='add'>+	/* walk list of addrs again, open any that still don't exist */</div><div class='add'>+	nlmsg_for_each_attr_type(attr, NFSD_A_SERVER_SOCK_ADDR, info-&gt;nlhdr,</div><div class='add'>+				 GENL_HDRLEN, rem) {</div><div class='add'>+		struct nlattr *tb[NFSD_A_SOCK_MAX + 1];</div><div class='add'>+		const char *xcl_name;</div><div class='add'>+		struct sockaddr *sa;</div><div class='add'>+		int ret;</div><div class='add'>+</div><div class='add'>+		if (nla_parse_nested(tb, NFSD_A_SOCK_MAX, attr,</div><div class='add'>+				     nfsd_sock_nl_policy, info-&gt;extack) &lt; 0)</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		if (!tb[NFSD_A_SOCK_ADDR] || !tb[NFSD_A_SOCK_TRANSPORT_NAME])</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		if (nla_len(tb[NFSD_A_SOCK_ADDR]) &lt; sizeof(*sa))</div><div class='add'>+			continue;</div><div class='add'>+</div><div class='add'>+		xcl_name = nla_data(tb[NFSD_A_SOCK_TRANSPORT_NAME]);</div><div class='add'>+		sa = nla_data(tb[NFSD_A_SOCK_ADDR]);</div><div class='add'>+</div><div class='add'>+		xprt = svc_find_listener(serv, xcl_name, net, sa);</div><div class='add'>+		if (xprt) {</div><div class='add'>+			if (delete)</div><div class='add'>+				WARN_ONCE(1, "Transport type=%s already exists\n",</div><div class='add'>+					  xcl_name);</div><div class='add'>+			svc_xprt_put(xprt);</div><div class='add'>+			continue;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		ret = svc_xprt_create_from_sa(serv, xcl_name, net, sa, 0,</div><div class='add'>+					      get_current_cred());</div><div class='add'>+		/* always save the latest error */</div><div class='add'>+		if (ret &lt; 0)</div><div class='add'>+			err = ret;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (!serv-&gt;sv_nrthreads &amp;&amp; list_empty(&amp;nn-&gt;nfsd_serv-&gt;sv_permsocks))</div><div class='add'>+		nfsd_destroy_serv(net);</div><div class='add'>+</div><div class='add'>+out_unlock_mtx:</div><div class='add'>+	mutex_unlock(&amp;nfsd_mutex);</div><div class='add'>+</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * nfsd_nl_listener_get_doit - get the nfs running listeners</div><div class='add'>+ * @skb: reply buffer</div><div class='add'>+ * @info: netlink metadata and command arguments</div><div class='add'>+ *</div><div class='add'>+ * Return 0 on success or a negative errno.</div><div class='add'>+ */</div><div class='add'>+int nfsd_nl_listener_get_doit(struct sk_buff *skb, struct genl_info *info)</div><div class='add'>+{</div><div class='add'>+	struct svc_xprt *xprt;</div><div class='add'>+	struct svc_serv *serv;</div><div class='add'>+	struct nfsd_net *nn;</div><div class='add'>+	void *hdr;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	skb = genlmsg_new(GENLMSG_DEFAULT_SIZE, GFP_KERNEL);</div><div class='add'>+	if (!skb)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	hdr = genlmsg_iput(skb, info);</div><div class='add'>+	if (!hdr) {</div><div class='add'>+		err = -EMSGSIZE;</div><div class='add'>+		goto err_free_msg;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	mutex_lock(&amp;nfsd_mutex);</div><div class='add'>+	nn = net_generic(genl_info_net(info), nfsd_net_id);</div><div class='add'>+</div><div class='add'>+	/* no nfs server? Just send empty socket list */</div><div class='add'>+	if (!nn-&gt;nfsd_serv)</div><div class='add'>+		goto out_unlock_mtx;</div><div class='add'>+</div><div class='add'>+	serv = nn-&gt;nfsd_serv;</div><div class='add'>+	spin_lock_bh(&amp;serv-&gt;sv_lock);</div><div class='add'>+	list_for_each_entry(xprt, &amp;serv-&gt;sv_permsocks, xpt_list) {</div><div class='add'>+		struct nlattr *attr;</div><div class='add'>+</div><div class='add'>+		attr = nla_nest_start(skb, NFSD_A_SERVER_SOCK_ADDR);</div><div class='add'>+		if (!attr) {</div><div class='add'>+			err = -EINVAL;</div><div class='add'>+			goto err_serv_unlock;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		if (nla_put_string(skb, NFSD_A_SOCK_TRANSPORT_NAME,</div><div class='add'>+				   xprt-&gt;xpt_class-&gt;xcl_name) ||</div><div class='add'>+		    nla_put(skb, NFSD_A_SOCK_ADDR,</div><div class='add'>+			    sizeof(struct sockaddr_storage),</div><div class='add'>+			    &amp;xprt-&gt;xpt_local)) {</div><div class='add'>+			err = -EINVAL;</div><div class='add'>+			goto err_serv_unlock;</div><div class='add'>+		}</div><div class='add'>+</div><div class='add'>+		nla_nest_end(skb, attr);</div><div class='add'>+	}</div><div class='add'>+	spin_unlock_bh(&amp;serv-&gt;sv_lock);</div><div class='add'>+out_unlock_mtx:</div><div class='add'>+	mutex_unlock(&amp;nfsd_mutex);</div><div class='add'>+	genlmsg_end(skb, hdr);</div><div class='add'>+</div><div class='add'>+	return genlmsg_reply(skb, info);</div><div class='add'>+</div><div class='add'>+err_serv_unlock:</div><div class='add'>+	spin_unlock_bh(&amp;serv-&gt;sv_lock);</div><div class='add'>+	mutex_unlock(&amp;nfsd_mutex);</div><div class='add'>+err_free_msg:</div><div class='add'>+	nlmsg_free(skb);</div><div class='add'>+</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * nfsd_nl_pool_mode_set_doit - set the number of running threads</div><div class='add'>+ * @skb: reply buffer</div><div class='add'>+ * @info: netlink metadata and command arguments</div><div class='add'>+ *</div><div class='add'>+ * Return 0 on success or a negative errno.</div><div class='add'>+ */</div><div class='add'>+int nfsd_nl_pool_mode_set_doit(struct sk_buff *skb, struct genl_info *info)</div><div class='add'>+{</div><div class='add'>+	const struct nlattr *attr;</div><div class='add'>+</div><div class='add'>+	if (GENL_REQ_ATTR_CHECK(info, NFSD_A_POOL_MODE_MODE))</div><div class='add'>+		return -EINVAL;</div><div class='add'>+</div><div class='add'>+	attr = info-&gt;attrs[NFSD_A_POOL_MODE_MODE];</div><div class='add'>+	return sunrpc_set_pool_mode(nla_data(attr));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * nfsd_nl_pool_mode_get_doit - get info about pool_mode</div><div class='add'>+ * @skb: reply buffer</div><div class='add'>+ * @info: netlink metadata and command arguments</div><div class='add'>+ *</div><div class='add'>+ * Return 0 on success or a negative errno.</div><div class='add'>+ */</div><div class='add'>+int nfsd_nl_pool_mode_get_doit(struct sk_buff *skb, struct genl_info *info)</div><div class='add'>+{</div><div class='add'>+	struct net *net = genl_info_net(info);</div><div class='add'>+	char buf[16];</div><div class='add'>+	void *hdr;</div><div class='add'>+	int err;</div><div class='add'>+</div><div class='add'>+	if (sunrpc_get_pool_mode(buf, ARRAY_SIZE(buf)) &gt;= ARRAY_SIZE(buf))</div><div class='add'>+		return -ERANGE;</div><div class='add'>+</div><div class='add'>+	skb = genlmsg_new(GENLMSG_DEFAULT_SIZE, GFP_KERNEL);</div><div class='add'>+	if (!skb)</div><div class='add'>+		return -ENOMEM;</div><div class='add'>+</div><div class='add'>+	err = -EMSGSIZE;</div><div class='add'>+	hdr = genlmsg_iput(skb, info);</div><div class='add'>+	if (!hdr)</div><div class='add'>+		goto err_free_msg;</div><div class='add'>+</div><div class='add'>+	err = nla_put_string(skb, NFSD_A_POOL_MODE_MODE, buf) |</div><div class='add'>+	      nla_put_u32(skb, NFSD_A_POOL_MODE_NPOOLS, nfsd_nrpools(net));</div><div class='add'>+	if (err)</div><div class='add'>+		goto err_free_msg;</div><div class='add'>+</div><div class='add'>+	genlmsg_end(skb, hdr);</div><div class='add'>+	return genlmsg_reply(skb, info);</div><div class='add'>+</div><div class='add'>+err_free_msg:</div><div class='add'>+	nlmsg_free(skb);</div><div class='add'>+	return err;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * nfsd_net_init - Prepare the nfsd_net portion of a new net namespace</div><div class='add'>+ * @net: a freshly-created network namespace</div><div class='add'>+ *</div><div class='add'>+ * This information stays around as long as the network namespace is</div><div class='add'>+ * alive whether or not there is an NFSD instance running in the</div><div class='add'>+ * namespace.</div><div class='add'>+ *</div><div class='add'>+ * Returns zero on success, or a negative errno otherwise.</div><div class='add'>+ */</div><div class='add'>+static __net_init int nfsd_net_init(struct net *net)</div><div class='ctx'> {</div><div class='del'>-	int retval;</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='add'>+	int retval;</div><div class='add'>+	int i;</div><div class='ctx'> </div><div class='ctx'> 	retval = nfsd_export_init(net);</div><div class='ctx'> 	if (retval)</div><div class='hunk'>@@ -1471,27 +2151,36 @@ static __net_init int nfsd_init_net(struct net *net)</div><div class='ctx'> 	retval = nfsd_idmap_init(net);</div><div class='ctx'> 	if (retval)</div><div class='ctx'> 		goto out_idmap_error;</div><div class='del'>-	nn-&gt;nfsd_versions = NULL;</div><div class='del'>-	nn-&gt;nfsd4_minorversions = NULL;</div><div class='del'>-	retval = nfsd_reply_cache_init(nn);</div><div class='add'>+	retval = percpu_counter_init_many(nn-&gt;counter, 0, GFP_KERNEL,</div><div class='add'>+					  NFSD_STATS_COUNTERS_NUM);</div><div class='ctx'> 	if (retval)</div><div class='del'>-		goto out_drc_error;</div><div class='del'>-	nn-&gt;nfsd4_lease = 90;	/* default lease time */</div><div class='del'>-	nn-&gt;nfsd4_grace = 90;</div><div class='del'>-	nn-&gt;somebody_reclaimed = false;</div><div class='del'>-	nn-&gt;track_reclaim_completes = false;</div><div class='del'>-	nn-&gt;clverifier_counter = prandom_u32();</div><div class='del'>-	nn-&gt;clientid_base = prandom_u32();</div><div class='del'>-	nn-&gt;clientid_counter = nn-&gt;clientid_base + 1;</div><div class='del'>-	nn-&gt;s2s_cp_cl_id = nn-&gt;clientid_counter++;</div><div class='del'>-</div><div class='del'>-	atomic_set(&amp;nn-&gt;ntf_refcnt, 0);</div><div class='del'>-	init_waitqueue_head(&amp;nn-&gt;ntf_wq);</div><div class='del'>-	seqlock_init(&amp;nn-&gt;boot_lock);</div><div class='add'>+		goto out_repcache_error;</div><div class='ctx'> </div><div class='add'>+	memset(&amp;nn-&gt;nfsd_svcstats, 0, sizeof(nn-&gt;nfsd_svcstats));</div><div class='add'>+	nn-&gt;nfsd_svcstats.program = &amp;nfsd_programs[0];</div><div class='add'>+	if (!nfsd_proc_stat_init(net)) {</div><div class='add'>+		retval = -ENOMEM;</div><div class='add'>+		goto out_proc_error;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	for (i = 0; i &lt; sizeof(nn-&gt;nfsd_versions); i++)</div><div class='add'>+		nn-&gt;nfsd_versions[i] = nfsd_support_version(i);</div><div class='add'>+	for (i = 0; i &lt; sizeof(nn-&gt;nfsd4_minorversions); i++)</div><div class='add'>+		nn-&gt;nfsd4_minorversions[i] = nfsd_support_version(4);</div><div class='add'>+	nn-&gt;nfsd_info.mutex = &amp;nfsd_mutex;</div><div class='add'>+	nn-&gt;nfsd_serv = NULL;</div><div class='add'>+	nfsd4_init_leases_net(nn);</div><div class='add'>+	get_random_bytes(&amp;nn-&gt;siphash_key, sizeof(nn-&gt;siphash_key));</div><div class='add'>+	seqlock_init(&amp;nn-&gt;writeverf_lock);</div><div class='add'>+#if IS_ENABLED(CONFIG_NFS_LOCALIO)</div><div class='add'>+	spin_lock_init(&amp;nn-&gt;local_clients_lock);</div><div class='add'>+	INIT_LIST_HEAD(&amp;nn-&gt;local_clients);</div><div class='add'>+#endif</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='del'>-out_drc_error:</div><div class='add'>+out_proc_error:</div><div class='add'>+	percpu_counter_destroy_many(nn-&gt;counter, NFSD_STATS_COUNTERS_NUM);</div><div class='add'>+out_repcache_error:</div><div class='ctx'> 	nfsd_idmap_shutdown(net);</div><div class='ctx'> out_idmap_error:</div><div class='ctx'> 	nfsd_export_shutdown(net);</div><div class='hunk'>@@ -1499,19 +2188,44 @@ out_export_error:</div><div class='ctx'> 	return retval;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static __net_exit void nfsd_exit_net(struct net *net)</div><div class='add'>+#if IS_ENABLED(CONFIG_NFS_LOCALIO)</div><div class='add'>+/**</div><div class='add'>+ * nfsd_net_pre_exit - Disconnect localio clients from net namespace</div><div class='add'>+ * @net: a network namespace that is about to be destroyed</div><div class='add'>+ *</div><div class='add'>+ * This invalidates -&gt;net pointers held by localio clients</div><div class='add'>+ * while they can still safely access nn-&gt;counter.</div><div class='add'>+ */</div><div class='add'>+static __net_exit void nfsd_net_pre_exit(struct net *net)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='ctx'> </div><div class='del'>-	nfsd_reply_cache_shutdown(nn);</div><div class='add'>+	nfs_localio_invalidate_clients(&amp;nn-&gt;local_clients,</div><div class='add'>+				       &amp;nn-&gt;local_clients_lock);</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * nfsd_net_exit - Release the nfsd_net portion of a net namespace</div><div class='add'>+ * @net: a network namespace that is about to be destroyed</div><div class='add'>+ *</div><div class='add'>+ */</div><div class='add'>+static __net_exit void nfsd_net_exit(struct net *net)</div><div class='add'>+{</div><div class='add'>+	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='add'>+</div><div class='add'>+	nfsd_proc_stat_shutdown(net);</div><div class='add'>+	percpu_counter_destroy_many(nn-&gt;counter, NFSD_STATS_COUNTERS_NUM);</div><div class='ctx'> 	nfsd_idmap_shutdown(net);</div><div class='ctx'> 	nfsd_export_shutdown(net);</div><div class='del'>-	nfsd_netns_free_versions(net_generic(net, nfsd_net_id));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static struct pernet_operations nfsd_net_ops = {</div><div class='del'>-	.init = nfsd_init_net,</div><div class='del'>-	.exit = nfsd_exit_net,</div><div class='add'>+	.init = nfsd_net_init,</div><div class='add'>+#if IS_ENABLED(CONFIG_NFS_LOCALIO)</div><div class='add'>+	.pre_exit = nfsd_net_pre_exit,</div><div class='add'>+#endif</div><div class='add'>+	.exit = nfsd_net_exit,</div><div class='ctx'> 	.id   = &amp;nfsd_net_id,</div><div class='ctx'> 	.size = sizeof(struct nfsd_net),</div><div class='ctx'> };</div><div class='hunk'>@@ -1519,68 +2233,79 @@ static struct pernet_operations nfsd_net_ops = {</div><div class='ctx'> static int __init init_nfsd(void)</div><div class='ctx'> {</div><div class='ctx'> 	int retval;</div><div class='del'>-	printk(KERN_INFO "Installing knfsd (copyright (C) 1996 okir@monad.swb.de).\n");</div><div class='ctx'> </div><div class='del'>-	retval = register_cld_notifier();</div><div class='del'>-	if (retval)</div><div class='del'>-		return retval;</div><div class='add'>+	nfsd_debugfs_init();</div><div class='add'>+</div><div class='ctx'> 	retval = nfsd4_init_slabs();</div><div class='ctx'> 	if (retval)</div><div class='del'>-		goto out_unregister_notifier;</div><div class='add'>+		return retval;</div><div class='ctx'> 	retval = nfsd4_init_pnfs();</div><div class='ctx'> 	if (retval)</div><div class='ctx'> 		goto out_free_slabs;</div><div class='del'>-	retval = nfsd_stat_init();	/* Statistics */</div><div class='del'>-	if (retval)</div><div class='del'>-		goto out_free_pnfs;</div><div class='ctx'> 	retval = nfsd_drc_slab_create();</div><div class='ctx'> 	if (retval)</div><div class='del'>-		goto out_free_stat;</div><div class='add'>+		goto out_free_pnfs;</div><div class='ctx'> 	nfsd_lockd_init();	/* lockd-&gt;nfsd callbacks */</div><div class='del'>-	retval = create_proc_exports_entry();</div><div class='del'>-	if (retval)</div><div class='add'>+	retval = register_pernet_subsys(&amp;nfsd_net_ops);</div><div class='add'>+	if (retval &lt; 0)</div><div class='ctx'> 		goto out_free_lockd;</div><div class='add'>+	retval = register_cld_notifier();</div><div class='add'>+	if (retval)</div><div class='add'>+		goto out_free_subsys;</div><div class='add'>+	retval = nfsd4_create_laundry_wq();</div><div class='add'>+	if (retval)</div><div class='add'>+		goto out_free_cld;</div><div class='ctx'> 	retval = register_filesystem(&amp;nfsd_fs_type);</div><div class='ctx'> 	if (retval)</div><div class='del'>-		goto out_free_exports;</div><div class='del'>-	retval = register_pernet_subsys(&amp;nfsd_net_ops);</div><div class='del'>-	if (retval &lt; 0)</div><div class='add'>+		goto out_free_nfsd4;</div><div class='add'>+	retval = genl_register_family(&amp;nfsd_nl_family);</div><div class='add'>+	if (retval)</div><div class='add'>+		goto out_free_filesystem;</div><div class='add'>+	retval = create_proc_exports_entry();</div><div class='add'>+	if (retval)</div><div class='ctx'> 		goto out_free_all;</div><div class='add'>+	nfsd_localio_ops_init();</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> out_free_all:</div><div class='add'>+	genl_unregister_family(&amp;nfsd_nl_family);</div><div class='add'>+out_free_filesystem:</div><div class='ctx'> 	unregister_filesystem(&amp;nfsd_fs_type);</div><div class='del'>-out_free_exports:</div><div class='del'>-	remove_proc_entry("fs/nfs/exports", NULL);</div><div class='del'>-	remove_proc_entry("fs/nfs", NULL);</div><div class='add'>+out_free_nfsd4:</div><div class='add'>+	nfsd4_destroy_laundry_wq();</div><div class='add'>+out_free_cld:</div><div class='add'>+	unregister_cld_notifier();</div><div class='add'>+out_free_subsys:</div><div class='add'>+	unregister_pernet_subsys(&amp;nfsd_net_ops);</div><div class='ctx'> out_free_lockd:</div><div class='ctx'> 	nfsd_lockd_shutdown();</div><div class='ctx'> 	nfsd_drc_slab_free();</div><div class='del'>-out_free_stat:</div><div class='del'>-	nfsd_stat_shutdown();</div><div class='ctx'> out_free_pnfs:</div><div class='ctx'> 	nfsd4_exit_pnfs();</div><div class='ctx'> out_free_slabs:</div><div class='ctx'> 	nfsd4_free_slabs();</div><div class='del'>-out_unregister_notifier:</div><div class='del'>-	unregister_cld_notifier();</div><div class='add'>+	nfsd_debugfs_exit();</div><div class='ctx'> 	return retval;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void __exit exit_nfsd(void)</div><div class='ctx'> {</div><div class='del'>-	unregister_pernet_subsys(&amp;nfsd_net_ops);</div><div class='del'>-	nfsd_drc_slab_free();</div><div class='ctx'> 	remove_proc_entry("fs/nfs/exports", NULL);</div><div class='ctx'> 	remove_proc_entry("fs/nfs", NULL);</div><div class='del'>-	nfsd_stat_shutdown();</div><div class='add'>+	genl_unregister_family(&amp;nfsd_nl_family);</div><div class='add'>+	unregister_filesystem(&amp;nfsd_fs_type);</div><div class='add'>+	nfsd4_destroy_laundry_wq();</div><div class='add'>+	unregister_cld_notifier();</div><div class='add'>+	unregister_pernet_subsys(&amp;nfsd_net_ops);</div><div class='add'>+	nfsd_drc_slab_free();</div><div class='ctx'> 	nfsd_lockd_shutdown();</div><div class='ctx'> 	nfsd4_free_slabs();</div><div class='ctx'> 	nfsd4_exit_pnfs();</div><div class='del'>-	unregister_filesystem(&amp;nfsd_fs_type);</div><div class='del'>-	unregister_cld_notifier();</div><div class='add'>+	nfsd_debugfs_exit();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> MODULE_AUTHOR("Olaf Kirch &lt;okir@monad.swb.de&gt;");</div><div class='add'>+MODULE_DESCRIPTION("In-kernel NFS server");</div><div class='ctx'> MODULE_LICENSE("GPL");</div><div class='ctx'> module_init(init_nfsd)</div><div class='ctx'> module_exit(exit_nfsd)</div><div class='head'>diff --git a/fs/nfsd/nfsd.h b/fs/nfsd/nfsd.h<br/>index 498e5a489826..e4263326ca4a 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfsd.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfsd.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfsd.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/nfsd.h</a></div><div class='hunk'>@@ -23,9 +23,7 @@</div><div class='ctx'> </div><div class='ctx'> #include &lt;uapi/linux/nfsd/debug.h&gt;</div><div class='ctx'> </div><div class='del'>-#include "netns.h"</div><div class='ctx'> #include "export.h"</div><div class='del'>-#include "stats.h"</div><div class='ctx'> </div><div class='ctx'> #undef ifdebug</div><div class='ctx'> #ifdef CONFIG_SUNRPC_DEBUG</div><div class='hunk'>@@ -37,39 +35,50 @@</div><div class='ctx'> /*</div><div class='ctx'>  * nfsd version</div><div class='ctx'>  */</div><div class='add'>+#define NFSD_MINVERS			2</div><div class='add'>+#define	NFSD_MAXVERS			4</div><div class='ctx'> #define NFSD_SUPPORTED_MINOR_VERSION	2</div><div class='del'>-/*</div><div class='del'>- * Maximum blocksizes supported by daemon under various circumstances.</div><div class='del'>- */</div><div class='del'>-#define NFSSVC_MAXBLKSIZE       RPCSVC_MAXPAYLOAD</div><div class='del'>-/* NFSv2 is limited by the protocol specification, see RFC 1094 */</div><div class='del'>-#define NFSSVC_MAXBLKSIZE_V2    (8*1024)</div><div class='add'>+bool nfsd_support_version(int vers);</div><div class='ctx'> </div><div class='add'>+#include "netns.h"</div><div class='add'>+#include "stats.h"</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * Largest number of bytes we need to allocate for an NFS</div><div class='del'>- * call or reply.  Used to control buffer sizes.  We use</div><div class='del'>- * the length of v3 WRITE, READDIR and READDIR replies</div><div class='del'>- * which are an RPC header, up to 26 XDR units of reply</div><div class='del'>- * data, and some page data.</div><div class='del'>- *</div><div class='del'>- * Note that accuracy here doesn't matter too much as the</div><div class='del'>- * size is rounded up to a page size when allocating space.</div><div class='add'>+ * Default and maximum payload size (NFS READ or WRITE), in bytes.</div><div class='add'>+ * The default is historical, and the maximum is an implementation</div><div class='add'>+ * limit.</div><div class='ctx'>  */</div><div class='del'>-#define NFSD_BUFSIZE            ((RPC_MAX_HEADER_WITH_AUTH+26)*XDR_UNIT + NFSSVC_MAXBLKSIZE)</div><div class='add'>+enum {</div><div class='add'>+	NFSSVC_DEFBLKSIZE       = 1 * 1024 * 1024,</div><div class='add'>+	NFSSVC_MAXBLKSIZE       = RPCSVC_MAXPAYLOAD,</div><div class='add'>+};</div><div class='ctx'> </div><div class='ctx'> struct readdir_cd {</div><div class='ctx'> 	__be32			err;	/* 0, nfserr, or nfserr_eof */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+/* Maximum number of operations per session compound */</div><div class='add'>+#define NFSD_MAX_OPS_PER_COMPOUND	200</div><div class='add'>+</div><div class='add'>+struct nfsd_genl_rqstp {</div><div class='add'>+	struct sockaddr		rq_daddr;</div><div class='add'>+	struct sockaddr		rq_saddr;</div><div class='add'>+	unsigned long		rq_flags;</div><div class='add'>+	ktime_t			rq_stime;</div><div class='add'>+	__be32			rq_xid;</div><div class='add'>+	u32			rq_vers;</div><div class='add'>+	u32			rq_prog;</div><div class='add'>+	u32			rq_proc;</div><div class='add'>+</div><div class='add'>+	/* NFSv4 compound */</div><div class='add'>+	u32			rq_opcnt;</div><div class='add'>+	u32			rq_opnum[16];</div><div class='add'>+};</div><div class='ctx'> </div><div class='del'>-extern struct svc_program	nfsd_program;</div><div class='del'>-extern const struct svc_version	nfsd_version2, nfsd_version3,</div><div class='del'>-				nfsd_version4;</div><div class='add'>+extern struct svc_program	nfsd_programs[];</div><div class='add'>+extern const struct svc_version	nfsd_version2, nfsd_version3, nfsd_version4;</div><div class='ctx'> extern struct mutex		nfsd_mutex;</div><div class='del'>-extern spinlock_t		nfsd_drc_lock;</div><div class='del'>-extern unsigned long		nfsd_drc_max_mem;</div><div class='del'>-extern unsigned long		nfsd_drc_mem_used;</div><div class='add'>+extern atomic_t			nfsd_th_cnt;		/* number of available threads */</div><div class='ctx'> </div><div class='ctx'> extern const struct seq_operations nfs_exports_op;</div><div class='ctx'> </div><div class='hunk'>@@ -86,20 +95,17 @@ bool		nfssvc_encode_voidres(struct svc_rqst *rqstp,</div><div class='ctx'> /*</div><div class='ctx'>  * Function prototypes.</div><div class='ctx'>  */</div><div class='del'>-int		nfsd_svc(int nrservs, struct net *net, const struct cred *cred);</div><div class='del'>-int		nfsd_dispatch(struct svc_rqst *rqstp, __be32 *statp);</div><div class='add'>+int		nfsd_svc(int n, int *nservers, struct net *net,</div><div class='add'>+			 const struct cred *cred, const char *scope);</div><div class='add'>+int		nfsd_dispatch(struct svc_rqst *rqstp);</div><div class='ctx'> </div><div class='ctx'> int		nfsd_nrthreads(struct net *);</div><div class='ctx'> int		nfsd_nrpools(struct net *);</div><div class='ctx'> int		nfsd_get_nrthreads(int n, int *, struct net *);</div><div class='ctx'> int		nfsd_set_nrthreads(int n, int *, struct net *);</div><div class='del'>-int		nfsd_pool_stats_open(struct inode *, struct file *);</div><div class='del'>-int		nfsd_pool_stats_release(struct inode *, struct file *);</div><div class='ctx'> void		nfsd_shutdown_threads(struct net *net);</div><div class='ctx'> </div><div class='del'>-void		nfsd_destroy(struct net *net);</div><div class='del'>-</div><div class='del'>-bool		i_am_nfsd(void);</div><div class='add'>+struct svc_rqst *nfsd_current_rqst(void);</div><div class='ctx'> </div><div class='ctx'> struct nfsdfs_client {</div><div class='ctx'> 	struct kref cl_ref;</div><div class='hunk'>@@ -127,6 +133,10 @@ extern const struct svc_version nfsd_acl_version3;</div><div class='ctx'> #endif</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='add'>+#if IS_ENABLED(CONFIG_NFS_LOCALIO)</div><div class='add'>+extern const struct svc_version localio_version1;</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> struct nfsd_net;</div><div class='ctx'> </div><div class='ctx'> enum vers_op {NFSD_SET, NFSD_CLEAR, NFSD_TEST, NFSD_AVAIL };</div><div class='hunk'>@@ -134,12 +144,33 @@ int nfsd_vers(struct nfsd_net *nn, int vers, enum vers_op change);</div><div class='ctx'> int nfsd_minorversion(struct nfsd_net *nn, u32 minorversion, enum vers_op change);</div><div class='ctx'> void nfsd_reset_versions(struct nfsd_net *nn);</div><div class='ctx'> int nfsd_create_serv(struct net *net);</div><div class='add'>+void nfsd_destroy_serv(struct net *net);</div><div class='add'>+</div><div class='add'>+#ifdef CONFIG_DEBUG_FS</div><div class='add'>+void nfsd_debugfs_init(void);</div><div class='add'>+void nfsd_debugfs_exit(void);</div><div class='add'>+#else</div><div class='add'>+static inline void nfsd_debugfs_init(void) {}</div><div class='add'>+static inline void nfsd_debugfs_exit(void) {}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='add'>+extern bool nfsd_disable_splice_read __read_mostly;</div><div class='add'>+</div><div class='add'>+enum {</div><div class='add'>+	/* Any new NFSD_IO enum value must be added at the end */</div><div class='add'>+	NFSD_IO_BUFFERED,</div><div class='add'>+	NFSD_IO_DONTCACHE,</div><div class='add'>+	NFSD_IO_DIRECT,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+extern u64 nfsd_io_cache_read __read_mostly;</div><div class='add'>+extern u64 nfsd_io_cache_write __read_mostly;</div><div class='ctx'> </div><div class='ctx'> extern int nfsd_max_blksize;</div><div class='ctx'> </div><div class='ctx'> static inline int nfsd_v4client(struct svc_rqst *rq)</div><div class='ctx'> {</div><div class='del'>-	return rq-&gt;rq_prog == NFS_PROGRAM &amp;&amp; rq-&gt;rq_vers == 4;</div><div class='add'>+	return rq &amp;&amp; rq-&gt;rq_prog == NFS_PROGRAM &amp;&amp; rq-&gt;rq_vers == 4;</div><div class='ctx'> }</div><div class='ctx'> static inline struct user_namespace *</div><div class='ctx'> nfsd_user_namespace(const struct svc_rqst *rqstp)</div><div class='hunk'>@@ -162,6 +193,9 @@ void nfs4_state_shutdown_net(struct net *net);</div><div class='ctx'> int nfs4_reset_recoverydir(char *recdir);</div><div class='ctx'> char * nfs4_recoverydir(void);</div><div class='ctx'> bool nfsd4_spo_must_allow(struct svc_rqst *rqstp);</div><div class='add'>+int nfsd4_create_laundry_wq(void);</div><div class='add'>+void nfsd4_destroy_laundry_wq(void);</div><div class='add'>+bool nfsd_wait_for_delegreturn(struct svc_rqst *rqstp, struct inode *inode);</div><div class='ctx'> #else</div><div class='ctx'> static inline int nfsd4_init_slabs(void) { return 0; }</div><div class='ctx'> static inline void nfsd4_free_slabs(void) { }</div><div class='hunk'>@@ -175,6 +209,13 @@ static inline bool nfsd4_spo_must_allow(struct svc_rqst *rqstp)</div><div class='ctx'> {</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='add'>+static inline int nfsd4_create_laundry_wq(void) { return 0; };</div><div class='add'>+static inline void nfsd4_destroy_laundry_wq(void) {};</div><div class='add'>+static inline bool nfsd_wait_for_delegreturn(struct svc_rqst *rqstp,</div><div class='add'>+					      struct inode *inode)</div><div class='add'>+{</div><div class='add'>+	return false;</div><div class='add'>+}</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -204,7 +245,6 @@ void		nfsd_lockd_shutdown(void);</div><div class='ctx'> #define	nfserr_nospc		cpu_to_be32(NFSERR_NOSPC)</div><div class='ctx'> #define	nfserr_rofs		cpu_to_be32(NFSERR_ROFS)</div><div class='ctx'> #define	nfserr_mlink		cpu_to_be32(NFSERR_MLINK)</div><div class='del'>-#define	nfserr_opnotsupp	cpu_to_be32(NFSERR_OPNOTSUPP)</div><div class='ctx'> #define	nfserr_nametoolong	cpu_to_be32(NFSERR_NAMETOOLONG)</div><div class='ctx'> #define	nfserr_notempty		cpu_to_be32(NFSERR_NOTEMPTY)</div><div class='ctx'> #define	nfserr_dquot		cpu_to_be32(NFSERR_DQUOT)</div><div class='hunk'>@@ -249,9 +289,11 @@ void		nfsd_lockd_shutdown(void);</div><div class='ctx'> #define	nfserr_no_grace		cpu_to_be32(NFSERR_NO_GRACE)</div><div class='ctx'> #define	nfserr_reclaim_bad	cpu_to_be32(NFSERR_RECLAIM_BAD)</div><div class='ctx'> #define	nfserr_badname		cpu_to_be32(NFSERR_BADNAME)</div><div class='add'>+#define	nfserr_admin_revoked	cpu_to_be32(NFS4ERR_ADMIN_REVOKED)</div><div class='ctx'> #define	nfserr_cb_path_down	cpu_to_be32(NFSERR_CB_PATH_DOWN)</div><div class='ctx'> #define	nfserr_locked		cpu_to_be32(NFSERR_LOCKED)</div><div class='ctx'> #define	nfserr_wrongsec		cpu_to_be32(NFSERR_WRONGSEC)</div><div class='add'>+#define nfserr_delay			cpu_to_be32(NFS4ERR_DELAY)</div><div class='ctx'> #define nfserr_badiomode		cpu_to_be32(NFS4ERR_BADIOMODE)</div><div class='ctx'> #define nfserr_badlayout		cpu_to_be32(NFS4ERR_BADLAYOUT)</div><div class='ctx'> #define nfserr_bad_session_digest	cpu_to_be32(NFS4ERR_BAD_SESSION_DIGEST)</div><div class='hunk'>@@ -300,17 +342,30 @@ void		nfsd_lockd_shutdown(void);</div><div class='ctx'> #define nfserr_xattr2big		cpu_to_be32(NFS4ERR_XATTR2BIG)</div><div class='ctx'> #define nfserr_noxattr			cpu_to_be32(NFS4ERR_NOXATTR)</div><div class='ctx'> </div><div class='del'>-/* error codes for internal use */</div><div class='del'>-/* if a request fails due to kmalloc failure, it gets dropped.</div><div class='del'>- *  Client should resend eventually</div><div class='add'>+/*</div><div class='add'>+ * Error codes for internal use.  We use enum to choose numbers that are</div><div class='add'>+ * not already assigned, then covert to be32 resulting in a number that</div><div class='add'>+ * cannot conflict with any existing be32 nfserr value.</div><div class='ctx'>  */</div><div class='del'>-#define	nfserr_dropit		cpu_to_be32(30000)</div><div class='add'>+enum {</div><div class='ctx'> /* end-of-file indicator in readdir */</div><div class='del'>-#define	nfserr_eof		cpu_to_be32(30001)</div><div class='add'>+	NFSERR_EOF = NFS4ERR_FIRST_FREE,</div><div class='add'>+#define	nfserr_eof		cpu_to_be32(NFSERR_EOF)</div><div class='add'>+</div><div class='ctx'> /* replay detected */</div><div class='del'>-#define	nfserr_replay_me	cpu_to_be32(11001)</div><div class='add'>+	NFSERR_REPLAY_ME,</div><div class='add'>+#define	nfserr_replay_me	cpu_to_be32(NFSERR_REPLAY_ME)</div><div class='add'>+</div><div class='ctx'> /* nfs41 replay detected */</div><div class='del'>-#define	nfserr_replay_cache	cpu_to_be32(11002)</div><div class='add'>+	NFSERR_REPLAY_CACHE,</div><div class='add'>+#define	nfserr_replay_cache	cpu_to_be32(NFSERR_REPLAY_CACHE)</div><div class='add'>+</div><div class='add'>+/* symlink found where dir expected - handled differently to</div><div class='add'>+ * other symlink found errors by NFSv3.</div><div class='add'>+ */</div><div class='add'>+	NFSERR_SYMLINK_NOT_DIR,</div><div class='add'>+#define	nfserr_symlink_not_dir	cpu_to_be32(NFSERR_SYMLINK_NOT_DIR)</div><div class='add'>+};</div><div class='ctx'> </div><div class='ctx'> /* Check for dir entries '.' and '..' */</div><div class='ctx'> #define isdotent(n, l)	(l &lt; 3 &amp;&amp; n[0] == '.' &amp;&amp; (l == 1 || n[1] == '.'))</div><div class='hunk'>@@ -336,16 +391,20 @@ void		nfsd_lockd_shutdown(void);</div><div class='ctx'> #define COMPOUND_ERR_SLACK_SPACE	16     /* OP_SETATTR */</div><div class='ctx'> </div><div class='ctx'> #define NFSD_LAUNDROMAT_MINTIMEOUT      1   /* seconds */</div><div class='add'>+#define	NFSD_COURTESY_CLIENT_TIMEOUT	(24 * 60 * 60)	/* seconds */</div><div class='add'>+#define	NFSD_CLIENT_MAX_TRIM_PER_RUN	128</div><div class='add'>+#define	NFS4_CLIENTS_PER_GB		1024</div><div class='add'>+#define NFSD_DELEGRETURN_TIMEOUT	(HZ / 34)	/* 30ms */</div><div class='add'>+#define	NFSD_CB_GETATTR_TIMEOUT		NFSD_DELEGRETURN_TIMEOUT</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * The following attributes are currently not supported by the NFSv4 server:</div><div class='add'>+ * The following attributes are not implemented by NFSD:</div><div class='ctx'>  *    ARCHIVE       (deprecated anyway)</div><div class='ctx'>  *    HIDDEN        (unlikely to be supported any time soon)</div><div class='ctx'>  *    MIMETYPE      (unlikely to be supported any time soon)</div><div class='ctx'>  *    QUOTA_*       (will be supported in a forthcoming patch)</div><div class='ctx'>  *    SYSTEM        (unlikely to be supported any time soon)</div><div class='ctx'>  *    TIME_BACKUP   (unlikely to be supported any time soon)</div><div class='del'>- *    TIME_CREATE   (unlikely to be supported any time soon)</div><div class='ctx'>  */</div><div class='ctx'> #define NFSD4_SUPPORTED_ATTRS_WORD0                                                         \</div><div class='ctx'> (FATTR4_WORD0_SUPPORTED_ATTRS   | FATTR4_WORD0_TYPE         | FATTR4_WORD0_FH_EXPIRE_TYPE   \</div><div class='hunk'>@@ -364,7 +423,7 @@ void		nfsd_lockd_shutdown(void);</div><div class='ctx'>  | FATTR4_WORD1_OWNER	        | FATTR4_WORD1_OWNER_GROUP  | FATTR4_WORD1_RAWDEV           \</div><div class='ctx'>  | FATTR4_WORD1_SPACE_AVAIL     | FATTR4_WORD1_SPACE_FREE   | FATTR4_WORD1_SPACE_TOTAL      \</div><div class='ctx'>  | FATTR4_WORD1_SPACE_USED      | FATTR4_WORD1_TIME_ACCESS  | FATTR4_WORD1_TIME_ACCESS_SET  \</div><div class='del'>- | FATTR4_WORD1_TIME_DELTA   | FATTR4_WORD1_TIME_METADATA    \</div><div class='add'>+ | FATTR4_WORD1_TIME_DELTA      | FATTR4_WORD1_TIME_METADATA   | FATTR4_WORD1_TIME_CREATE      \</div><div class='ctx'>  | FATTR4_WORD1_TIME_MODIFY     | FATTR4_WORD1_TIME_MODIFY_SET | FATTR4_WORD1_MOUNTED_ON_FILEID)</div><div class='ctx'> </div><div class='ctx'> #define NFSD4_SUPPORTED_ATTRS_WORD2 0</div><div class='hunk'>@@ -399,8 +458,12 @@ void		nfsd_lockd_shutdown(void);</div><div class='ctx'> #define NFSD4_2_SUPPORTED_ATTRS_WORD2 \</div><div class='ctx'> 	(NFSD4_1_SUPPORTED_ATTRS_WORD2 | \</div><div class='ctx'> 	FATTR4_WORD2_MODE_UMASK | \</div><div class='add'>+	FATTR4_WORD2_CLONE_BLKSIZE | \</div><div class='ctx'> 	NFSD4_2_SECURITY_ATTRS | \</div><div class='del'>-	FATTR4_WORD2_XATTR_SUPPORT)</div><div class='add'>+	FATTR4_WORD2_XATTR_SUPPORT | \</div><div class='add'>+	FATTR4_WORD2_TIME_DELEG_ACCESS | \</div><div class='add'>+	FATTR4_WORD2_TIME_DELEG_MODIFY | \</div><div class='add'>+	FATTR4_WORD2_OPEN_ARGUMENTS)</div><div class='ctx'> </div><div class='ctx'> extern const u32 nfsd_suppattrs[3][3];</div><div class='ctx'> </div><div class='hunk'>@@ -460,7 +523,8 @@ static inline bool nfsd_attrs_supported(u32 minorversion, const u32 *bmval)</div><div class='ctx'> 	(FATTR4_WORD0_SIZE | FATTR4_WORD0_ACL)</div><div class='ctx'> #define NFSD_WRITEABLE_ATTRS_WORD1 \</div><div class='ctx'> 	(FATTR4_WORD1_MODE | FATTR4_WORD1_OWNER | FATTR4_WORD1_OWNER_GROUP \</div><div class='del'>-	| FATTR4_WORD1_TIME_ACCESS_SET | FATTR4_WORD1_TIME_MODIFY_SET)</div><div class='add'>+	| FATTR4_WORD1_TIME_ACCESS_SET | FATTR4_WORD1_TIME_CREATE \</div><div class='add'>+	| FATTR4_WORD1_TIME_MODIFY_SET)</div><div class='ctx'> #ifdef CONFIG_NFSD_V4_SECURITY_LABEL</div><div class='ctx'> #define MAYBE_FATTR4_WORD2_SECURITY_LABEL \</div><div class='ctx'> 	FATTR4_WORD2_SECURITY_LABEL</div><div class='hunk'>@@ -469,7 +533,10 @@ static inline bool nfsd_attrs_supported(u32 minorversion, const u32 *bmval)</div><div class='ctx'> #endif</div><div class='ctx'> #define NFSD_WRITEABLE_ATTRS_WORD2 \</div><div class='ctx'> 	(FATTR4_WORD2_MODE_UMASK \</div><div class='del'>-	| MAYBE_FATTR4_WORD2_SECURITY_LABEL)</div><div class='add'>+	| MAYBE_FATTR4_WORD2_SECURITY_LABEL \</div><div class='add'>+	| FATTR4_WORD2_TIME_DELEG_ACCESS \</div><div class='add'>+	| FATTR4_WORD2_TIME_DELEG_MODIFY \</div><div class='add'>+	)</div><div class='ctx'> </div><div class='ctx'> #define NFSD_SUPPATTR_EXCLCREAT_WORD0 \</div><div class='ctx'> 	NFSD_WRITEABLE_ATTRS_WORD0</div><div class='hunk'>@@ -490,12 +557,16 @@ extern void unregister_cld_notifier(void);</div><div class='ctx'> extern void nfsd4_ssc_init_umount_work(struct nfsd_net *nn);</div><div class='ctx'> #endif</div><div class='ctx'> </div><div class='add'>+extern void nfsd4_init_leases_net(struct nfsd_net *nn);</div><div class='add'>+</div><div class='ctx'> #else /* CONFIG_NFSD_V4 */</div><div class='ctx'> static inline int nfsd4_is_junction(struct dentry *dentry)</div><div class='ctx'> {</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static inline void nfsd4_init_leases_net(struct nfsd_net *nn) { };</div><div class='add'>+</div><div class='ctx'> #define register_cld_notifier() 0</div><div class='ctx'> #define unregister_cld_notifier() do { } while(0)</div><div class='ctx'> </div><div class='head'>diff --git a/fs/nfsd/nfsfh.c b/fs/nfsd/nfsfh.c<br/>index f3779fa72c89..ed85dd43da18 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfsfh.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfsfh.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfsfh.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/nfsfh.c</a></div><div class='hunk'>@@ -40,7 +40,7 @@ static int nfsd_acceptable(void *expv, struct dentry *dentry)</div><div class='ctx'> 		/* make sure parents give x permission to user */</div><div class='ctx'> 		int err;</div><div class='ctx'> 		parent = dget_parent(tdentry);</div><div class='del'>-		err = inode_permission(&amp;init_user_ns,</div><div class='add'>+		err = inode_permission(&amp;nop_mnt_idmap,</div><div class='ctx'> 				       d_inode(parent), MAY_EXEC);</div><div class='ctx'> 		if (err &lt; 0) {</div><div class='ctx'> 			dput(parent);</div><div class='hunk'>@@ -62,8 +62,7 @@ static int nfsd_acceptable(void *expv, struct dentry *dentry)</div><div class='ctx'>  * the write call).</div><div class='ctx'>  */</div><div class='ctx'> static inline __be32</div><div class='del'>-nfsd_mode_check(struct svc_rqst *rqstp, struct dentry *dentry,</div><div class='del'>-		umode_t requested)</div><div class='add'>+nfsd_mode_check(struct dentry *dentry, umode_t requested)</div><div class='ctx'> {</div><div class='ctx'> 	umode_t mode = d_inode(dentry)-&gt;i_mode &amp; S_IFMT;</div><div class='ctx'> </div><div class='hunk'>@@ -76,36 +75,36 @@ nfsd_mode_check(struct svc_rqst *rqstp, struct dentry *dentry,</div><div class='ctx'> 		}</div><div class='ctx'> 		return nfs_ok;</div><div class='ctx'> 	}</div><div class='del'>-	/*</div><div class='del'>-	 * v4 has an error more specific than err_notdir which we should</div><div class='del'>-	 * return in preference to err_notdir:</div><div class='del'>-	 */</div><div class='del'>-	if (rqstp-&gt;rq_vers == 4 &amp;&amp; mode == S_IFLNK)</div><div class='add'>+	if (mode == S_IFLNK) {</div><div class='add'>+		if (requested == S_IFDIR)</div><div class='add'>+			return nfserr_symlink_not_dir;</div><div class='ctx'> 		return nfserr_symlink;</div><div class='add'>+	}</div><div class='ctx'> 	if (requested == S_IFDIR)</div><div class='ctx'> 		return nfserr_notdir;</div><div class='ctx'> 	if (mode == S_IFDIR)</div><div class='ctx'> 		return nfserr_isdir;</div><div class='del'>-	return nfserr_inval;</div><div class='add'>+	return nfserr_wrong_type;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool nfsd_originating_port_ok(struct svc_rqst *rqstp, int flags)</div><div class='add'>+static bool nfsd_originating_port_ok(struct svc_rqst *rqstp,</div><div class='add'>+				     struct svc_cred *cred,</div><div class='add'>+				     struct svc_export *exp)</div><div class='ctx'> {</div><div class='del'>-	if (flags &amp; NFSEXP_INSECURE_PORT)</div><div class='add'>+	if (nfsexp_flags(cred, exp) &amp; NFSEXP_INSECURE_PORT)</div><div class='ctx'> 		return true;</div><div class='ctx'> 	/* We don't require gss requests to use low ports: */</div><div class='del'>-	if (rqstp-&gt;rq_cred.cr_flavor &gt;= RPC_AUTH_GSS)</div><div class='add'>+	if (cred-&gt;cr_flavor &gt;= RPC_AUTH_GSS)</div><div class='ctx'> 		return true;</div><div class='ctx'> 	return test_bit(RQ_SECURE, &amp;rqstp-&gt;rq_flags);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static __be32 nfsd_setuser_and_check_port(struct svc_rqst *rqstp,</div><div class='add'>+					  struct svc_cred *cred,</div><div class='ctx'> 					  struct svc_export *exp)</div><div class='ctx'> {</div><div class='del'>-	int flags = nfsexp_flags(rqstp, exp);</div><div class='del'>-</div><div class='ctx'> 	/* Check if the request originated from a secure port. */</div><div class='del'>-	if (!nfsd_originating_port_ok(rqstp, flags)) {</div><div class='add'>+	if (rqstp &amp;&amp; !nfsd_originating_port_ok(rqstp, cred, exp)) {</div><div class='ctx'> 		RPC_IFDEBUG(char buf[RPC_MAX_ADDRBUFLEN]);</div><div class='ctx'> 		dprintk("nfsd: request from insecure port %s!\n",</div><div class='ctx'> 		        svc_print_addr(rqstp, buf, sizeof(buf)));</div><div class='hunk'>@@ -113,23 +112,15 @@ static __be32 nfsd_setuser_and_check_port(struct svc_rqst *rqstp,</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	/* Set user creds for this exportpoint */</div><div class='del'>-	return nfserrno(nfsd_setuser(rqstp, exp));</div><div class='add'>+	return nfserrno(nfsd_setuser(cred, exp));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline __be32 check_pseudo_root(struct svc_rqst *rqstp,</div><div class='del'>-	struct dentry *dentry, struct svc_export *exp)</div><div class='add'>+static inline __be32 check_pseudo_root(struct dentry *dentry,</div><div class='add'>+				       struct svc_export *exp)</div><div class='ctx'> {</div><div class='ctx'> 	if (!(exp-&gt;ex_flags &amp; NFSEXP_V4ROOT))</div><div class='ctx'> 		return nfs_ok;</div><div class='ctx'> 	/*</div><div class='del'>-	 * v2/v3 clients have no need for the V4ROOT export--they use</div><div class='del'>-	 * the mount protocl instead; also, further V4ROOT checks may be</div><div class='del'>-	 * in v4-specific code, in which case v2/v3 clients could bypass</div><div class='del'>-	 * them.</div><div class='del'>-	 */</div><div class='del'>-	if (!nfsd_v4client(rqstp))</div><div class='del'>-		return nfserr_stale;</div><div class='del'>-	/*</div><div class='ctx'> 	 * We're exposing only the directories and symlinks that have to be</div><div class='ctx'> 	 * traversed on the way to real exports:</div><div class='ctx'> 	 */</div><div class='hunk'>@@ -151,7 +142,11 @@ static inline __be32 check_pseudo_root(struct svc_rqst *rqstp,</div><div class='ctx'>  * dentry.  On success, the results are used to set fh_export and</div><div class='ctx'>  * fh_dentry.</div><div class='ctx'>  */</div><div class='del'>-static __be32 nfsd_set_fh_dentry(struct svc_rqst *rqstp, struct svc_fh *fhp)</div><div class='add'>+static __be32 nfsd_set_fh_dentry(struct svc_rqst *rqstp, struct net *net,</div><div class='add'>+				 struct svc_cred *cred,</div><div class='add'>+				 struct auth_domain *client,</div><div class='add'>+				 struct auth_domain *gssclient,</div><div class='add'>+				 struct svc_fh *fhp)</div><div class='ctx'> {</div><div class='ctx'> 	struct knfsd_fh	*fh = &amp;fhp-&gt;fh_handle;</div><div class='ctx'> 	struct fid *fid = NULL;</div><div class='hunk'>@@ -162,10 +157,8 @@ static __be32 nfsd_set_fh_dentry(struct svc_rqst *rqstp, struct svc_fh *fhp)</div><div class='ctx'> 	int len;</div><div class='ctx'> 	__be32 error;</div><div class='ctx'> </div><div class='del'>-	error = nfserr_stale;</div><div class='del'>-	if (rqstp-&gt;rq_vers &gt; 2)</div><div class='del'>-		error = nfserr_badhandle;</div><div class='del'>-	if (rqstp-&gt;rq_vers == 4 &amp;&amp; fh-&gt;fh_size == 0)</div><div class='add'>+	error = nfserr_badhandle;</div><div class='add'>+	if (fh-&gt;fh_size == 0)</div><div class='ctx'> 		return nfserr_nofilehandle;</div><div class='ctx'> </div><div class='ctx'> 	if (fh-&gt;fh_version != 1)</div><div class='hunk'>@@ -179,6 +172,8 @@ static __be32 nfsd_set_fh_dentry(struct svc_rqst *rqstp, struct svc_fh *fhp)</div><div class='ctx'> 	if (len == 0)</div><div class='ctx'> 		return error;</div><div class='ctx'> 	if (fh-&gt;fh_fsid_type == FSID_MAJOR_MINOR) {</div><div class='add'>+		u32 *fsid = fh_fsid(fh);</div><div class='add'>+</div><div class='ctx'> 		/* deprecated, convert to type 3 */</div><div class='ctx'> 		len = key_len(FSID_ENCODE_DEV)/4;</div><div class='ctx'> 		fh-&gt;fh_fsid_type = FSID_ENCODE_DEV;</div><div class='hunk'>@@ -188,15 +183,17 @@ static __be32 nfsd_set_fh_dentry(struct svc_rqst *rqstp, struct svc_fh *fhp)</div><div class='ctx'> 		 * confuses sparse, so we must use __force here to</div><div class='ctx'> 		 * keep it from complaining.</div><div class='ctx'> 		 */</div><div class='del'>-		fh-&gt;fh_fsid[0] = new_encode_dev(MKDEV(ntohl((__force __be32)fh-&gt;fh_fsid[0]),</div><div class='del'>-						      ntohl((__force __be32)fh-&gt;fh_fsid[1])));</div><div class='del'>-		fh-&gt;fh_fsid[1] = fh-&gt;fh_fsid[2];</div><div class='add'>+		fsid[0] = new_encode_dev(MKDEV(ntohl((__force __be32)fsid[0]),</div><div class='add'>+					       ntohl((__force __be32)fsid[1])));</div><div class='add'>+		fsid[1] = fsid[2];</div><div class='ctx'> 	}</div><div class='ctx'> 	data_left -= len;</div><div class='ctx'> 	if (data_left &lt; 0)</div><div class='ctx'> 		return error;</div><div class='del'>-	exp = rqst_exp_find(rqstp, fh-&gt;fh_fsid_type, fh-&gt;fh_fsid);</div><div class='del'>-	fid = (struct fid *)(fh-&gt;fh_fsid + len);</div><div class='add'>+	exp = rqst_exp_find(rqstp ? &amp;rqstp-&gt;rq_chandle : NULL,</div><div class='add'>+			    net, client, gssclient,</div><div class='add'>+			    fh-&gt;fh_fsid_type, fh_fsid(fh));</div><div class='add'>+	fid = (struct fid *)(fh_fsid(fh) + len);</div><div class='ctx'> </div><div class='ctx'> 	error = nfserr_stale;</div><div class='ctx'> 	if (IS_ERR(exp)) {</div><div class='hunk'>@@ -227,9 +224,8 @@ static __be32 nfsd_set_fh_dentry(struct svc_rqst *rqstp, struct svc_fh *fhp)</div><div class='ctx'> 			cap_raise_nfsd_set(new-&gt;cap_effective,</div><div class='ctx'> 					   new-&gt;cap_permitted);</div><div class='ctx'> 		put_cred(override_creds(new));</div><div class='del'>-		put_cred(new);</div><div class='ctx'> 	} else {</div><div class='del'>-		error = nfsd_setuser_and_check_port(rqstp, exp);</div><div class='add'>+		error = nfsd_setuser_and_check_port(rqstp, cred, exp);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='hunk'>@@ -237,9 +233,7 @@ static __be32 nfsd_set_fh_dentry(struct svc_rqst *rqstp, struct svc_fh *fhp)</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Look up the dentry using the NFS file handle.</div><div class='ctx'> 	 */</div><div class='del'>-	error = nfserr_stale;</div><div class='del'>-	if (rqstp-&gt;rq_vers &gt; 2)</div><div class='del'>-		error = nfserr_badhandle;</div><div class='add'>+	error = nfserr_badhandle;</div><div class='ctx'> </div><div class='ctx'> 	fileid_type = fh-&gt;fh_fileid_type;</div><div class='ctx'> </div><div class='hunk'>@@ -247,7 +241,7 @@ static __be32 nfsd_set_fh_dentry(struct svc_rqst *rqstp, struct svc_fh *fhp)</div><div class='ctx'> 		dentry = dget(exp-&gt;ex_path.dentry);</div><div class='ctx'> 	else {</div><div class='ctx'> 		dentry = exportfs_decode_fh_raw(exp-&gt;ex_path.mnt, fid,</div><div class='del'>-						data_left, fileid_type,</div><div class='add'>+						data_left, fileid_type, 0,</div><div class='ctx'> 						nfsd_acceptable, exp);</div><div class='ctx'> 		if (IS_ERR_OR_NULL(dentry)) {</div><div class='ctx'> 			trace_nfsd_set_fh_dentry_badhandle(rqstp, fhp,</div><div class='hunk'>@@ -275,22 +269,30 @@ static __be32 nfsd_set_fh_dentry(struct svc_rqst *rqstp, struct svc_fh *fhp)</div><div class='ctx'> 				dentry);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	fhp-&gt;fh_dentry = dentry;</div><div class='del'>-	fhp-&gt;fh_export = exp;</div><div class='del'>-</div><div class='del'>-	switch (rqstp-&gt;rq_vers) {</div><div class='del'>-	case 4:</div><div class='add'>+	switch (fhp-&gt;fh_maxsize) {</div><div class='add'>+	case NFS4_FHSIZE:</div><div class='ctx'> 		if (dentry-&gt;d_sb-&gt;s_export_op-&gt;flags &amp; EXPORT_OP_NOATOMIC_ATTR)</div><div class='ctx'> 			fhp-&gt;fh_no_atomic_attr = true;</div><div class='add'>+		fhp-&gt;fh_64bit_cookies = true;</div><div class='ctx'> 		break;</div><div class='del'>-	case 3:</div><div class='add'>+	case NFS3_FHSIZE:</div><div class='ctx'> 		if (dentry-&gt;d_sb-&gt;s_export_op-&gt;flags &amp; EXPORT_OP_NOWCC)</div><div class='ctx'> 			fhp-&gt;fh_no_wcc = true;</div><div class='add'>+		fhp-&gt;fh_64bit_cookies = true;</div><div class='add'>+		if (exp-&gt;ex_flags &amp; NFSEXP_V4ROOT)</div><div class='add'>+			goto out;</div><div class='ctx'> 		break;</div><div class='del'>-	case 2:</div><div class='add'>+	case NFS_FHSIZE:</div><div class='ctx'> 		fhp-&gt;fh_no_wcc = true;</div><div class='add'>+		if (EX_WGATHER(exp))</div><div class='add'>+			fhp-&gt;fh_use_wgather = true;</div><div class='add'>+		if (exp-&gt;ex_flags &amp; NFSEXP_V4ROOT)</div><div class='add'>+			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='add'>+	fhp-&gt;fh_dentry = dentry;</div><div class='add'>+	fhp-&gt;fh_export = exp;</div><div class='add'>+</div><div class='ctx'> 	return 0;</div><div class='ctx'> out:</div><div class='ctx'> 	exp_put(exp);</div><div class='hunk'>@@ -298,48 +300,42 @@ out:</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * fh_verify - filehandle lookup and access checking</div><div class='del'>- * @rqstp: pointer to current rpc request</div><div class='add'>+ * __fh_verify - filehandle lookup and access checking</div><div class='add'>+ * @rqstp: RPC transaction context, or NULL</div><div class='add'>+ * @net: net namespace in which to perform the export lookup</div><div class='add'>+ * @cred: RPC user credential</div><div class='add'>+ * @client: RPC auth domain</div><div class='add'>+ * @gssclient: RPC GSS auth domain, or NULL</div><div class='ctx'>  * @fhp: filehandle to be verified</div><div class='ctx'>  * @type: expected type of object pointed to by filehandle</div><div class='ctx'>  * @access: type of access needed to object</div><div class='ctx'>  *</div><div class='del'>- * Look up a dentry from the on-the-wire filehandle, check the client's</div><div class='del'>- * access to the export, and set the current task's credentials.</div><div class='del'>- *</div><div class='del'>- * Regardless of success or failure of fh_verify(), fh_put() should be</div><div class='del'>- * called on @fhp when the caller is finished with the filehandle.</div><div class='del'>- *</div><div class='del'>- * fh_verify() may be called multiple times on a given filehandle, for</div><div class='del'>- * example, when processing an NFSv4 compound.  The first call will look</div><div class='del'>- * up a dentry using the on-the-wire filehandle.  Subsequent calls will</div><div class='del'>- * skip the lookup and just perform the other checks and possibly change</div><div class='del'>- * the current task's credentials.</div><div class='del'>- *</div><div class='del'>- * @type specifies the type of object expected using one of the S_IF*</div><div class='del'>- * constants defined in include/linux/stat.h.  The caller may use zero</div><div class='del'>- * to indicate that it doesn't care, or a negative integer to indicate</div><div class='del'>- * that it expects something not of the given type.</div><div class='del'>- *</div><div class='del'>- * @access is formed from the NFSD_MAY_* constants defined in</div><div class='del'>- * fs/nfsd/vfs.h.</div><div class='add'>+ * See fh_verify() for further descriptions of @fhp, @type, and @access.</div><div class='ctx'>  */</div><div class='del'>-__be32</div><div class='del'>-fh_verify(struct svc_rqst *rqstp, struct svc_fh *fhp, umode_t type, int access)</div><div class='add'>+static __be32</div><div class='add'>+__fh_verify(struct svc_rqst *rqstp,</div><div class='add'>+	    struct net *net, struct svc_cred *cred,</div><div class='add'>+	    struct auth_domain *client,</div><div class='add'>+	    struct auth_domain *gssclient,</div><div class='add'>+	    struct svc_fh *fhp, umode_t type, int access)</div><div class='ctx'> {</div><div class='add'>+	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='ctx'> 	struct svc_export *exp = NULL;</div><div class='add'>+	bool may_bypass_gss = false;</div><div class='ctx'> 	struct dentry	*dentry;</div><div class='ctx'> 	__be32		error;</div><div class='ctx'> </div><div class='del'>-	dprintk("nfsd: fh_verify(%s)\n", SVCFH_fmt(fhp));</div><div class='del'>-</div><div class='ctx'> 	if (!fhp-&gt;fh_dentry) {</div><div class='del'>-		error = nfsd_set_fh_dentry(rqstp, fhp);</div><div class='add'>+		error = nfsd_set_fh_dentry(rqstp, net, cred, client,</div><div class='add'>+					   gssclient, fhp);</div><div class='ctx'> 		if (error)</div><div class='ctx'> 			goto out;</div><div class='ctx'> 	}</div><div class='ctx'> 	dentry = fhp-&gt;fh_dentry;</div><div class='ctx'> 	exp = fhp-&gt;fh_export;</div><div class='add'>+</div><div class='add'>+	trace_nfsd_fh_verify(rqstp, fhp, type, access);</div><div class='add'>+</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * We still have to do all these permission checks, even when</div><div class='ctx'> 	 * fh_dentry is already set:</div><div class='hunk'>@@ -356,25 +352,44 @@ fh_verify(struct svc_rqst *rqstp, struct svc_fh *fhp, umode_t type, int access)</div><div class='ctx'> 	 *	  (for example, if different id-squashing options are in</div><div class='ctx'> 	 *	  effect on the new filesystem).</div><div class='ctx'> 	 */</div><div class='del'>-	error = check_pseudo_root(rqstp, dentry, exp);</div><div class='add'>+	error = check_pseudo_root(dentry, exp);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	error = nfsd_setuser_and_check_port(rqstp, exp);</div><div class='add'>+	error = nfsd_setuser_and_check_port(rqstp, cred, exp);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-	error = nfsd_mode_check(rqstp, dentry, type);</div><div class='add'>+	error = nfsd_mode_check(dentry, type);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='del'>-	 * pseudoflavor restrictions are not enforced on NLM,</div><div class='del'>-	 * which clients virtually always use auth_sys for,</div><div class='del'>-	 * even while using RPCSEC_GSS for NFS.</div><div class='add'>+	 * If rqstp is NULL, this is a LOCALIO request which will only</div><div class='add'>+	 * ever use a filehandle/credential pair for which access has</div><div class='add'>+	 * been affirmed (by ACCESS or OPEN NFS requests) over the</div><div class='add'>+	 * wire.  Skip both the xprtsec policy and the security flavor</div><div class='add'>+	 * checks.</div><div class='ctx'> 	 */</div><div class='del'>-	if (access &amp; NFSD_MAY_LOCK || access &amp; NFSD_MAY_BYPASS_GSS)</div><div class='del'>-		goto skip_pseudoflavor_check;</div><div class='add'>+	if (!rqstp)</div><div class='add'>+		goto check_permissions;</div><div class='add'>+</div><div class='add'>+	if ((access &amp; NFSD_MAY_NLM) &amp;&amp; (exp-&gt;ex_flags &amp; NFSEXP_NOAUTHNLM))</div><div class='add'>+		/* NLM is allowed to fully bypass authentication */</div><div class='add'>+		goto out;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * NLM is allowed to bypass the xprtsec policy check because lockd</div><div class='add'>+	 * doesn't support xprtsec.</div><div class='add'>+	 */</div><div class='add'>+	if (!(access &amp; NFSD_MAY_NLM)) {</div><div class='add'>+		error = check_xprtsec_policy(exp, rqstp);</div><div class='add'>+		if (error)</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='add'>+</div><div class='add'>+	if (access &amp; NFSD_MAY_BYPASS_GSS)</div><div class='add'>+		may_bypass_gss = true;</div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Clients may expect to be able to use auth_sys during mount,</div><div class='ctx'> 	 * even if they use gss for everything else; see section 2.3.2</div><div class='hunk'>@@ -382,28 +397,81 @@ fh_verify(struct svc_rqst *rqstp, struct svc_fh *fhp, umode_t type, int access)</div><div class='ctx'> 	 */</div><div class='ctx'> 	if (access &amp; NFSD_MAY_BYPASS_GSS_ON_ROOT</div><div class='ctx'> 			&amp;&amp; exp-&gt;ex_path.dentry == dentry)</div><div class='del'>-		goto skip_pseudoflavor_check;</div><div class='add'>+		may_bypass_gss = true;</div><div class='ctx'> </div><div class='del'>-	error = check_nfsd_access(exp, rqstp);</div><div class='add'>+	error = check_security_flavor(exp, rqstp, may_bypass_gss);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='del'>-skip_pseudoflavor_check:</div><div class='del'>-	/* Finally, check access permissions. */</div><div class='del'>-	error = nfsd_permission(rqstp, exp, dentry, access);</div><div class='add'>+	svc_xprt_set_valid(rqstp-&gt;rq_xprt);</div><div class='ctx'> </div><div class='del'>-	if (error) {</div><div class='del'>-		dprintk("fh_verify: %pd2 permission failure, "</div><div class='del'>-			"acc=%x, error=%d\n",</div><div class='del'>-			dentry,</div><div class='del'>-			access, ntohl(error));</div><div class='del'>-	}</div><div class='add'>+check_permissions:</div><div class='add'>+	/* Finally, check access permissions. */</div><div class='add'>+	error = nfsd_permission(cred, exp, dentry, access);</div><div class='ctx'> out:</div><div class='add'>+	trace_nfsd_fh_verify_err(rqstp, fhp, type, access, error);</div><div class='ctx'> 	if (error == nfserr_stale)</div><div class='del'>-		nfsd_stats_fh_stale_inc(exp);</div><div class='add'>+		nfsd_stats_fh_stale_inc(nn, exp);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * fh_verify_local - filehandle lookup and access checking</div><div class='add'>+ * @net: net namespace in which to perform the export lookup</div><div class='add'>+ * @cred: RPC user credential</div><div class='add'>+ * @client: RPC auth domain</div><div class='add'>+ * @fhp: filehandle to be verified</div><div class='add'>+ * @type: expected type of object pointed to by filehandle</div><div class='add'>+ * @access: type of access needed to object</div><div class='add'>+ *</div><div class='add'>+ * This API can be used by callers who do not have an RPC</div><div class='add'>+ * transaction context (ie are not running in an nfsd thread).</div><div class='add'>+ *</div><div class='add'>+ * See fh_verify() for further descriptions of @fhp, @type, and @access.</div><div class='add'>+ */</div><div class='add'>+__be32</div><div class='add'>+fh_verify_local(struct net *net, struct svc_cred *cred,</div><div class='add'>+		struct auth_domain *client, struct svc_fh *fhp,</div><div class='add'>+		umode_t type, int access)</div><div class='add'>+{</div><div class='add'>+	return __fh_verify(NULL, net, cred, client, NULL,</div><div class='add'>+			   fhp, type, access);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fh_verify - filehandle lookup and access checking</div><div class='add'>+ * @rqstp: pointer to current rpc request</div><div class='add'>+ * @fhp: filehandle to be verified</div><div class='add'>+ * @type: expected type of object pointed to by filehandle</div><div class='add'>+ * @access: type of access needed to object</div><div class='add'>+ *</div><div class='add'>+ * Look up a dentry from the on-the-wire filehandle, check the client's</div><div class='add'>+ * access to the export, and set the current task's credentials.</div><div class='add'>+ *</div><div class='add'>+ * Regardless of success or failure of fh_verify(), fh_put() should be</div><div class='add'>+ * called on @fhp when the caller is finished with the filehandle.</div><div class='add'>+ *</div><div class='add'>+ * fh_verify() may be called multiple times on a given filehandle, for</div><div class='add'>+ * example, when processing an NFSv4 compound.  The first call will look</div><div class='add'>+ * up a dentry using the on-the-wire filehandle.  Subsequent calls will</div><div class='add'>+ * skip the lookup and just perform the other checks and possibly change</div><div class='add'>+ * the current task's credentials.</div><div class='add'>+ *</div><div class='add'>+ * @type specifies the type of object expected using one of the S_IF*</div><div class='add'>+ * constants defined in include/linux/stat.h.  The caller may use zero</div><div class='add'>+ * to indicate that it doesn't care, or a negative integer to indicate</div><div class='add'>+ * that it expects something not of the given type.</div><div class='add'>+ *</div><div class='add'>+ * @access is formed from the NFSD_MAY_* constants defined in</div><div class='add'>+ * fs/nfsd/vfs.h.</div><div class='add'>+ */</div><div class='add'>+__be32</div><div class='add'>+fh_verify(struct svc_rqst *rqstp, struct svc_fh *fhp, umode_t type, int access)</div><div class='add'>+{</div><div class='add'>+	return __fh_verify(rqstp, SVC_NET(rqstp), &amp;rqstp-&gt;rq_cred,</div><div class='add'>+			   rqstp-&gt;rq_client, rqstp-&gt;rq_gssclient,</div><div class='add'>+			   fhp, type, access);</div><div class='add'>+}</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * Compose a file handle for an NFS reply.</div><div class='hunk'>@@ -417,12 +485,15 @@ static void _fh_update(struct svc_fh *fhp, struct svc_export *exp,</div><div class='ctx'> {</div><div class='ctx'> 	if (dentry != exp-&gt;ex_path.dentry) {</div><div class='ctx'> 		struct fid *fid = (struct fid *)</div><div class='del'>-			(fhp-&gt;fh_handle.fh_fsid + fhp-&gt;fh_handle.fh_size/4 - 1);</div><div class='add'>+			(fh_fsid(&amp;fhp-&gt;fh_handle) + fhp-&gt;fh_handle.fh_size/4 - 1);</div><div class='ctx'> 		int maxsize = (fhp-&gt;fh_maxsize - fhp-&gt;fh_handle.fh_size)/4;</div><div class='del'>-		int subtreecheck = !(exp-&gt;ex_flags &amp; NFSEXP_NOSUBTREECHECK);</div><div class='add'>+		int fh_flags = (exp-&gt;ex_flags &amp; NFSEXP_NOSUBTREECHECK) ? 0 :</div><div class='add'>+				EXPORT_FH_CONNECTABLE;</div><div class='add'>+		int fileid_type =</div><div class='add'>+			exportfs_encode_fh(dentry, fid, &amp;maxsize, fh_flags);</div><div class='ctx'> </div><div class='ctx'> 		fhp-&gt;fh_handle.fh_fileid_type =</div><div class='del'>-			exportfs_encode_fh(dentry, fid, &amp;maxsize, subtreecheck);</div><div class='add'>+			fileid_type &gt; 0 ? fileid_type : FILEID_INVALID;</div><div class='ctx'> 		fhp-&gt;fh_handle.fh_size += maxsize * 4;</div><div class='ctx'> 	} else {</div><div class='ctx'> 		fhp-&gt;fh_handle.fh_fileid_type = FILEID_ROOT;</div><div class='hunk'>@@ -548,7 +619,7 @@ fh_compose(struct svc_fh *fhp, struct svc_export *exp, struct dentry *dentry,</div><div class='ctx'> 	if (ref_fh == fhp)</div><div class='ctx'> 		fh_put(ref_fh);</div><div class='ctx'> </div><div class='del'>-	if (fhp-&gt;fh_locked || fhp-&gt;fh_dentry) {</div><div class='add'>+	if (fhp-&gt;fh_dentry) {</div><div class='ctx'> 		printk(KERN_ERR "fh_compose: fh %pd2 not initialized!\n",</div><div class='ctx'> 		       dentry);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -565,7 +636,7 @@ fh_compose(struct svc_fh *fhp, struct svc_export *exp, struct dentry *dentry,</div><div class='ctx'> 	fhp-&gt;fh_handle.fh_auth_type = 0;</div><div class='ctx'> </div><div class='ctx'> 	mk_fsid(fhp-&gt;fh_handle.fh_fsid_type,</div><div class='del'>-		fhp-&gt;fh_handle.fh_fsid,</div><div class='add'>+		fh_fsid(&amp;fhp-&gt;fh_handle),</div><div class='ctx'> 		ex_dev,</div><div class='ctx'> 		d_inode(exp-&gt;ex_path.dentry)-&gt;i_ino,</div><div class='ctx'> 		exp-&gt;ex_fsid, exp-&gt;ex_uuid);</div><div class='hunk'>@@ -574,7 +645,7 @@ fh_compose(struct svc_fh *fhp, struct svc_export *exp, struct dentry *dentry,</div><div class='ctx'> 		_fh_update(fhp, exp, dentry);</div><div class='ctx'> 	if (fhp-&gt;fh_handle.fh_fileid_type == FILEID_INVALID) {</div><div class='ctx'> 		fh_put(fhp);</div><div class='del'>-		return nfserr_opnotsupp;</div><div class='add'>+		return nfserr_stale;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> 	return 0;</div><div class='hunk'>@@ -600,7 +671,7 @@ fh_update(struct svc_fh *fhp)</div><div class='ctx'> </div><div class='ctx'> 	_fh_update(fhp, fhp-&gt;fh_export, dentry);</div><div class='ctx'> 	if (fhp-&gt;fh_handle.fh_fileid_type == FILEID_INVALID)</div><div class='del'>-		return nfserr_opnotsupp;</div><div class='add'>+		return nfserr_stale;</div><div class='ctx'> 	return 0;</div><div class='ctx'> out_bad:</div><div class='ctx'> 	printk(KERN_ERR "fh_update: fh not verified!\n");</div><div class='hunk'>@@ -611,6 +682,111 @@ out_negative:</div><div class='ctx'> 	return nfserr_serverfault;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/**</div><div class='add'>+ * fh_getattr - Retrieve attributes on a local file</div><div class='add'>+ * @fhp: File handle of target file</div><div class='add'>+ * @stat: Caller-supplied kstat buffer to be filled in</div><div class='add'>+ *</div><div class='add'>+ * Returns nfs_ok on success, otherwise an NFS status code is</div><div class='add'>+ * returned.</div><div class='add'>+ */</div><div class='add'>+__be32 fh_getattr(const struct svc_fh *fhp, struct kstat *stat)</div><div class='add'>+{</div><div class='add'>+	struct path p = {</div><div class='add'>+		.mnt		= fhp-&gt;fh_export-&gt;ex_path.mnt,</div><div class='add'>+		.dentry		= fhp-&gt;fh_dentry,</div><div class='add'>+	};</div><div class='add'>+	struct inode *inode = d_inode(p.dentry);</div><div class='add'>+	u32 request_mask = STATX_BASIC_STATS;</div><div class='add'>+</div><div class='add'>+	if (S_ISREG(inode-&gt;i_mode))</div><div class='add'>+		request_mask |= (STATX_DIOALIGN | STATX_DIO_READ_ALIGN);</div><div class='add'>+</div><div class='add'>+	if (fhp-&gt;fh_maxsize == NFS4_FHSIZE)</div><div class='add'>+		request_mask |= (STATX_BTIME | STATX_CHANGE_COOKIE);</div><div class='add'>+</div><div class='add'>+	return nfserrno(vfs_getattr(&amp;p, stat, request_mask,</div><div class='add'>+				    AT_STATX_SYNC_AS_STAT));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fh_fill_pre_attrs - Fill in pre-op attributes</div><div class='add'>+ * @fhp: file handle to be updated</div><div class='add'>+ *</div><div class='add'>+ */</div><div class='add'>+__be32 __must_check fh_fill_pre_attrs(struct svc_fh *fhp)</div><div class='add'>+{</div><div class='add'>+	bool v4 = (fhp-&gt;fh_maxsize == NFS4_FHSIZE);</div><div class='add'>+	struct kstat stat;</div><div class='add'>+	__be32 err;</div><div class='add'>+</div><div class='add'>+	if (fhp-&gt;fh_no_wcc || fhp-&gt;fh_pre_saved)</div><div class='add'>+		return nfs_ok;</div><div class='add'>+</div><div class='add'>+	err = fh_getattr(fhp, &amp;stat);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	if (v4)</div><div class='add'>+		fhp-&gt;fh_pre_change = nfsd4_change_attribute(&amp;stat);</div><div class='add'>+</div><div class='add'>+	fhp-&gt;fh_pre_mtime = stat.mtime;</div><div class='add'>+	fhp-&gt;fh_pre_ctime = stat.ctime;</div><div class='add'>+	fhp-&gt;fh_pre_size  = stat.size;</div><div class='add'>+	fhp-&gt;fh_pre_saved = true;</div><div class='add'>+	return nfs_ok;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fh_fill_post_attrs - Fill in post-op attributes</div><div class='add'>+ * @fhp: file handle to be updated</div><div class='add'>+ *</div><div class='add'>+ */</div><div class='add'>+__be32 fh_fill_post_attrs(struct svc_fh *fhp)</div><div class='add'>+{</div><div class='add'>+	bool v4 = (fhp-&gt;fh_maxsize == NFS4_FHSIZE);</div><div class='add'>+	__be32 err;</div><div class='add'>+</div><div class='add'>+	if (fhp-&gt;fh_no_wcc)</div><div class='add'>+		return nfs_ok;</div><div class='add'>+</div><div class='add'>+	if (fhp-&gt;fh_post_saved)</div><div class='add'>+		printk("nfsd: inode locked twice during operation.\n");</div><div class='add'>+</div><div class='add'>+	err = fh_getattr(fhp, &amp;fhp-&gt;fh_post_attr);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	fhp-&gt;fh_post_saved = true;</div><div class='add'>+	if (v4)</div><div class='add'>+		fhp-&gt;fh_post_change =</div><div class='add'>+			nfsd4_change_attribute(&amp;fhp-&gt;fh_post_attr);</div><div class='add'>+	return nfs_ok;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * fh_fill_both_attrs - Fill pre-op and post-op attributes</div><div class='add'>+ * @fhp: file handle to be updated</div><div class='add'>+ *</div><div class='add'>+ * This is used when the directory wasn't changed, but wcc attributes</div><div class='add'>+ * are needed anyway.</div><div class='add'>+ */</div><div class='add'>+__be32 __must_check fh_fill_both_attrs(struct svc_fh *fhp)</div><div class='add'>+{</div><div class='add'>+	__be32 err;</div><div class='add'>+</div><div class='add'>+	err = fh_fill_post_attrs(fhp);</div><div class='add'>+	if (err)</div><div class='add'>+		return err;</div><div class='add'>+</div><div class='add'>+	fhp-&gt;fh_pre_change = fhp-&gt;fh_post_change;</div><div class='add'>+	fhp-&gt;fh_pre_mtime = fhp-&gt;fh_post_attr.mtime;</div><div class='add'>+	fhp-&gt;fh_pre_ctime = fhp-&gt;fh_post_attr.ctime;</div><div class='add'>+	fhp-&gt;fh_pre_size = fhp-&gt;fh_post_attr.size;</div><div class='add'>+	fhp-&gt;fh_pre_saved = true;</div><div class='add'>+	return nfs_ok;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Release a file handle.</div><div class='ctx'>  */</div><div class='hunk'>@@ -620,10 +796,9 @@ fh_put(struct svc_fh *fhp)</div><div class='ctx'> 	struct dentry * dentry = fhp-&gt;fh_dentry;</div><div class='ctx'> 	struct svc_export * exp = fhp-&gt;fh_export;</div><div class='ctx'> 	if (dentry) {</div><div class='del'>-		fh_unlock(fhp);</div><div class='ctx'> 		fhp-&gt;fh_dentry = NULL;</div><div class='ctx'> 		dput(dentry);</div><div class='del'>-		fh_clear_wcc(fhp);</div><div class='add'>+		fh_clear_pre_post_attrs(fhp);</div><div class='ctx'> 	}</div><div class='ctx'> 	fh_drop_write(fhp);</div><div class='ctx'> 	if (exp) {</div><div class='hunk'>@@ -642,7 +817,7 @@ char * SVCFH_fmt(struct svc_fh *fhp)</div><div class='ctx'> 	struct knfsd_fh *fh = &amp;fhp-&gt;fh_handle;</div><div class='ctx'> 	static char buf[2+1+1+64*3+1];</div><div class='ctx'> </div><div class='del'>-	if (fh-&gt;fh_size &lt; 0 || fh-&gt;fh_size&gt; 64)</div><div class='add'>+	if (fh-&gt;fh_size &gt; 64)</div><div class='ctx'> 		return "bad-fh";</div><div class='ctx'> 	sprintf(buf, "%d: %*ph", fh-&gt;fh_size, fh-&gt;fh_size, fh-&gt;fh_raw);</div><div class='ctx'> 	return buf;</div><div class='hunk'>@@ -675,3 +850,44 @@ enum fsid_source fsid_source(const struct svc_fh *fhp)</div><div class='ctx'> 		return FSIDSOURCE_UUID;</div><div class='ctx'> 	return FSIDSOURCE_DEV;</div><div class='ctx'> }</div><div class='add'>+</div><div class='add'>+/**</div><div class='add'>+ * nfsd4_change_attribute - Generate an NFSv4 change_attribute value</div><div class='add'>+ * @stat: inode attributes</div><div class='add'>+ *</div><div class='add'>+ * Caller must fill in @stat before calling, typically by invoking</div><div class='add'>+ * vfs_getattr() with STATX_MODE, STATX_CTIME, and STATX_CHANGE_COOKIE.</div><div class='add'>+ * Returns an unsigned 64-bit changeid4 value (RFC 8881 Section 3.2).</div><div class='add'>+ *</div><div class='add'>+ * We could use i_version alone as the change attribute.  However, i_version</div><div class='add'>+ * can go backwards on a regular file after an unclean shutdown.  On its own</div><div class='add'>+ * that doesn't necessarily cause a problem, but if i_version goes backwards</div><div class='add'>+ * and then is incremented again it could reuse a value that was previously</div><div class='add'>+ * used before boot, and a client who queried the two values might incorrectly</div><div class='add'>+ * assume nothing changed.</div><div class='add'>+ *</div><div class='add'>+ * By using both ctime and the i_version counter we guarantee that as long as</div><div class='add'>+ * time doesn't go backwards we never reuse an old value. If the filesystem</div><div class='add'>+ * advertises STATX_ATTR_CHANGE_MONOTONIC, then this mitigation is not</div><div class='add'>+ * needed.</div><div class='add'>+ *</div><div class='add'>+ * We only need to do this for regular files as well. For directories, we</div><div class='add'>+ * assume that the new change attr is always logged to stable storage in some</div><div class='add'>+ * fashion before the results can be seen.</div><div class='add'>+ */</div><div class='add'>+u64 nfsd4_change_attribute(const struct kstat *stat)</div><div class='add'>+{</div><div class='add'>+	u64 chattr;</div><div class='add'>+</div><div class='add'>+	if (stat-&gt;result_mask &amp; STATX_CHANGE_COOKIE) {</div><div class='add'>+		chattr = stat-&gt;change_cookie;</div><div class='add'>+		if (S_ISREG(stat-&gt;mode) &amp;&amp;</div><div class='add'>+		    !(stat-&gt;attributes &amp; STATX_ATTR_CHANGE_MONOTONIC)) {</div><div class='add'>+			chattr += (u64)stat-&gt;ctime.tv_sec &lt;&lt; 30;</div><div class='add'>+			chattr += stat-&gt;ctime.tv_nsec;</div><div class='add'>+		}</div><div class='add'>+	} else {</div><div class='add'>+		chattr = time_to_chattr(&amp;stat-&gt;ctime);</div><div class='add'>+	}</div><div class='add'>+	return chattr;</div><div class='add'>+}</div><div class='head'>diff --git a/fs/nfsd/nfsfh.h b/fs/nfsd/nfsfh.h<br/>index d11e4b6870d6..5ef7191f8ad8 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfsfh.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfsfh.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfsfh.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/nfsfh.h</a></div><div class='hunk'>@@ -14,6 +14,8 @@</div><div class='ctx'> #include &lt;linux/exportfs.h&gt;</div><div class='ctx'> #include &lt;linux/nfs4.h&gt;</div><div class='ctx'> </div><div class='add'>+#include "export.h"</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * The file handle starts with a sequence of four-byte words.</div><div class='ctx'>  * The first word contains a version number (1) and three descriptor bytes</div><div class='hunk'>@@ -49,18 +51,19 @@ struct knfsd_fh {</div><div class='ctx'> 					 * Points to the current size while</div><div class='ctx'> 					 * building a new file handle.</div><div class='ctx'> 					 */</div><div class='del'>-	union {</div><div class='del'>-		char			fh_raw[NFS4_FHSIZE];</div><div class='del'>-		struct {</div><div class='del'>-			u8		fh_version;	/* == 1 */</div><div class='del'>-			u8		fh_auth_type;	/* deprecated */</div><div class='del'>-			u8		fh_fsid_type;</div><div class='del'>-			u8		fh_fileid_type;</div><div class='del'>-			u32		fh_fsid[]; /* flexible-array member */</div><div class='del'>-		};</div><div class='del'>-	};</div><div class='add'>+	u8		fh_raw[NFS4_FHSIZE];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+#define fh_version		fh_raw[0]</div><div class='add'>+#define fh_auth_type		fh_raw[1]</div><div class='add'>+#define fh_fsid_type		fh_raw[2]</div><div class='add'>+#define fh_fileid_type		fh_raw[3]</div><div class='add'>+</div><div class='add'>+static inline u32 *fh_fsid(const struct knfsd_fh *fh)</div><div class='add'>+{</div><div class='add'>+	return (u32 *)&amp;fh-&gt;fh_raw[4];</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static inline __u32 ino_t_to_u32(ino_t ino)</div><div class='ctx'> {</div><div class='ctx'> 	return (__u32) ino;</div><div class='hunk'>@@ -81,7 +84,6 @@ typedef struct svc_fh {</div><div class='ctx'> 	struct dentry *		fh_dentry;	/* validated dentry */</div><div class='ctx'> 	struct svc_export *	fh_export;	/* export pointer */</div><div class='ctx'> </div><div class='del'>-	bool			fh_locked;	/* inode locked by us */</div><div class='ctx'> 	bool			fh_want_write;	/* remount protection taken */</div><div class='ctx'> 	bool			fh_no_wcc;	/* no wcc data needed */</div><div class='ctx'> 	bool			fh_no_atomic_attr;</div><div class='hunk'>@@ -89,12 +91,13 @@ typedef struct svc_fh {</div><div class='ctx'> 						 * wcc data is not atomic with</div><div class='ctx'> 						 * operation</div><div class='ctx'> 						 */</div><div class='add'>+	bool			fh_use_wgather;	/* NFSv2 wgather option */</div><div class='add'>+	bool			fh_64bit_cookies;/* readdir cookie size */</div><div class='ctx'> 	int			fh_flags;	/* FH flags */</div><div class='del'>-#ifdef CONFIG_NFSD_V3</div><div class='ctx'> 	bool			fh_post_saved;	/* post-op attrs saved */</div><div class='ctx'> 	bool			fh_pre_saved;	/* pre-op attrs saved */</div><div class='ctx'> </div><div class='del'>-	/* Pre-op attributes saved during fh_lock */</div><div class='add'>+	/* Pre-op attributes saved when inode is locked */</div><div class='ctx'> 	__u64			fh_pre_size;	/* size before operation */</div><div class='ctx'> 	struct timespec64	fh_pre_mtime;	/* mtime before oper */</div><div class='ctx'> 	struct timespec64	fh_pre_ctime;	/* ctime before oper */</div><div class='hunk'>@@ -104,10 +107,9 @@ typedef struct svc_fh {</div><div class='ctx'> 	 */</div><div class='ctx'> 	u64			fh_pre_change;</div><div class='ctx'> </div><div class='del'>-	/* Post-op attributes saved in fh_unlock */</div><div class='add'>+	/* Post-op attributes saved in fh_fill_post_attrs() */</div><div class='ctx'> 	struct kstat		fh_post_attr;	/* full attrs after operation */</div><div class='ctx'> 	u64			fh_post_change; /* nfsv4 change; see above */</div><div class='del'>-#endif /* CONFIG_NFSD_V3 */</div><div class='ctx'> } svc_fh;</div><div class='ctx'> #define NFSD4_FH_FOREIGN (1&lt;&lt;0)</div><div class='ctx'> #define SET_FH_FLAG(c, f) ((c)-&gt;fh_flags |= (f))</div><div class='hunk'>@@ -218,21 +220,24 @@ extern char * SVCFH_fmt(struct svc_fh *fhp);</div><div class='ctx'>  * Function prototypes</div><div class='ctx'>  */</div><div class='ctx'> __be32	fh_verify(struct svc_rqst *, struct svc_fh *, umode_t, int);</div><div class='add'>+__be32	fh_verify_local(struct net *, struct svc_cred *, struct auth_domain *,</div><div class='add'>+			struct svc_fh *, umode_t, int);</div><div class='add'>+__be32	fh_getattr(const struct svc_fh *fhp, struct kstat *stat);</div><div class='ctx'> __be32	fh_compose(struct svc_fh *, struct svc_export *, struct dentry *, struct svc_fh *);</div><div class='ctx'> __be32	fh_update(struct svc_fh *);</div><div class='ctx'> void	fh_put(struct svc_fh *);</div><div class='ctx'> </div><div class='ctx'> static __inline__ struct svc_fh *</div><div class='del'>-fh_copy(struct svc_fh *dst, struct svc_fh *src)</div><div class='add'>+fh_copy(struct svc_fh *dst, const struct svc_fh *src)</div><div class='ctx'> {</div><div class='del'>-	WARN_ON(src-&gt;fh_dentry || src-&gt;fh_locked);</div><div class='del'>-			</div><div class='add'>+	WARN_ON(src-&gt;fh_dentry);</div><div class='add'>+</div><div class='ctx'> 	*dst = *src;</div><div class='ctx'> 	return dst;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void</div><div class='del'>-fh_copy_shallow(struct knfsd_fh *dst, struct knfsd_fh *src)</div><div class='add'>+fh_copy_shallow(struct knfsd_fh *dst, const struct knfsd_fh *src)</div><div class='ctx'> {</div><div class='ctx'> 	dst-&gt;fh_size = src-&gt;fh_size;</div><div class='ctx'> 	memcpy(&amp;dst-&gt;fh_raw, &amp;src-&gt;fh_raw, src-&gt;fh_size);</div><div class='hunk'>@@ -246,7 +251,8 @@ fh_init(struct svc_fh *fhp, int maxsize)</div><div class='ctx'> 	return fhp;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline bool fh_match(struct knfsd_fh *fh1, struct knfsd_fh *fh2)</div><div class='add'>+static inline bool fh_match(const struct knfsd_fh *fh1,</div><div class='add'>+			    const struct knfsd_fh *fh2)</div><div class='ctx'> {</div><div class='ctx'> 	if (fh1-&gt;fh_size != fh2-&gt;fh_size)</div><div class='ctx'> 		return false;</div><div class='hunk'>@@ -255,127 +261,79 @@ static inline bool fh_match(struct knfsd_fh *fh1, struct knfsd_fh *fh2)</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline bool fh_fsid_match(struct knfsd_fh *fh1, struct knfsd_fh *fh2)</div><div class='add'>+static inline bool fh_fsid_match(const struct knfsd_fh *fh1,</div><div class='add'>+				 const struct knfsd_fh *fh2)</div><div class='ctx'> {</div><div class='add'>+	u32 *fsid1 = fh_fsid(fh1);</div><div class='add'>+	u32 *fsid2 = fh_fsid(fh2);</div><div class='add'>+</div><div class='ctx'> 	if (fh1-&gt;fh_fsid_type != fh2-&gt;fh_fsid_type)</div><div class='ctx'> 		return false;</div><div class='del'>-	if (memcmp(fh1-&gt;fh_fsid, fh2-&gt;fh_fsid, key_len(fh1-&gt;fh_fsid_type)) != 0)</div><div class='add'>+	if (memcmp(fsid1, fsid2, key_len(fh1-&gt;fh_fsid_type)) != 0)</div><div class='ctx'> 		return false;</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-#ifdef CONFIG_CRC32</div><div class='ctx'> /**</div><div class='del'>- * knfsd_fh_hash - calculate the crc32 hash for the filehandle</div><div class='del'>- * @fh - pointer to filehandle</div><div class='add'>+ * fh_want_write - Get write access to an export</div><div class='add'>+ * @fhp: File handle of file to be written</div><div class='ctx'>  *</div><div class='del'>- * returns a crc32 hash for the filehandle that is compatible with</div><div class='del'>- * the one displayed by "wireshark".</div><div class='del'>- */</div><div class='del'>-static inline u32 knfsd_fh_hash(const struct knfsd_fh *fh)</div><div class='del'>-{</div><div class='del'>-	return ~crc32_le(0xFFFFFFFF, fh-&gt;fh_raw, fh-&gt;fh_size);</div><div class='del'>-}</div><div class='del'>-#else</div><div class='del'>-static inline u32 knfsd_fh_hash(const struct knfsd_fh *fh)</div><div class='del'>-{</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-#endif</div><div class='del'>-</div><div class='del'>-#ifdef CONFIG_NFSD_V3</div><div class='del'>-/*</div><div class='del'>- * The wcc data stored in current_fh should be cleared</div><div class='del'>- * between compound ops.</div><div class='del'>- */</div><div class='del'>-static inline void</div><div class='del'>-fh_clear_wcc(struct svc_fh *fhp)</div><div class='del'>-{</div><div class='del'>-	fhp-&gt;fh_post_saved = false;</div><div class='del'>-	fhp-&gt;fh_pre_saved = false;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * We could use i_version alone as the change attribute.  However,</div><div class='del'>- * i_version can go backwards after a reboot.  On its own that doesn't</div><div class='del'>- * necessarily cause a problem, but if i_version goes backwards and then</div><div class='del'>- * is incremented again it could reuse a value that was previously used</div><div class='del'>- * before boot, and a client who queried the two values might</div><div class='del'>- * incorrectly assume nothing changed.</div><div class='add'>+ * Caller must invoke fh_drop_write() when its write operation</div><div class='add'>+ * is complete.</div><div class='ctx'>  *</div><div class='del'>- * By using both ctime and the i_version counter we guarantee that as</div><div class='del'>- * long as time doesn't go backwards we never reuse an old value.</div><div class='add'>+ * Returns 0 if the file handle's export can be written to. Otherwise</div><div class='add'>+ * the export is not prepared for updates, and the returned negative</div><div class='add'>+ * errno value reflects the reason for the failure.</div><div class='ctx'>  */</div><div class='del'>-static inline u64 nfsd4_change_attribute(struct kstat *stat,</div><div class='del'>-					 struct inode *inode)</div><div class='add'>+static inline int fh_want_write(struct svc_fh *fhp)</div><div class='ctx'> {</div><div class='del'>-	if (inode-&gt;i_sb-&gt;s_export_op-&gt;fetch_iversion)</div><div class='del'>-		return inode-&gt;i_sb-&gt;s_export_op-&gt;fetch_iversion(inode);</div><div class='del'>-	else if (IS_I_VERSION(inode)) {</div><div class='del'>-		u64 chattr;</div><div class='del'>-</div><div class='del'>-		chattr =  stat-&gt;ctime.tv_sec;</div><div class='del'>-		chattr &lt;&lt;= 30;</div><div class='del'>-		chattr += stat-&gt;ctime.tv_nsec;</div><div class='del'>-		chattr += inode_query_iversion(inode);</div><div class='del'>-		return chattr;</div><div class='del'>-	} else</div><div class='del'>-		return time_to_chattr(&amp;stat-&gt;ctime);</div><div class='add'>+	int ret;</div><div class='add'>+</div><div class='add'>+	if (fhp-&gt;fh_want_write)</div><div class='add'>+		return 0;</div><div class='add'>+	ret = mnt_want_write(fhp-&gt;fh_export-&gt;ex_path.mnt);</div><div class='add'>+	if (!ret)</div><div class='add'>+		fhp-&gt;fh_want_write = true;</div><div class='add'>+	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-extern void fill_pre_wcc(struct svc_fh *fhp);</div><div class='del'>-extern void fill_post_wcc(struct svc_fh *fhp);</div><div class='del'>-#else</div><div class='del'>-#define fh_clear_wcc(ignored)</div><div class='del'>-#define fill_pre_wcc(ignored)</div><div class='del'>-#define fill_post_wcc(notused)</div><div class='del'>-#endif /* CONFIG_NFSD_V3 */</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Lock a file handle/inode</div><div class='del'>- * NOTE: both fh_lock and fh_unlock are done "by hand" in</div><div class='del'>- * vfs.c:nfsd_rename as it needs to grab 2 i_mutex's at once</div><div class='del'>- * so, any changes here should be reflected there.</div><div class='add'>+/**</div><div class='add'>+ * fh_drop_write - Release write access on an export</div><div class='add'>+ * @fhp: File handle of file on which fh_want_write() was previously called</div><div class='ctx'>  */</div><div class='del'>-</div><div class='del'>-static inline void</div><div class='del'>-fh_lock_nested(struct svc_fh *fhp, unsigned int subclass)</div><div class='add'>+static inline void fh_drop_write(struct svc_fh *fhp)</div><div class='ctx'> {</div><div class='del'>-	struct dentry	*dentry = fhp-&gt;fh_dentry;</div><div class='del'>-	struct inode	*inode;</div><div class='del'>-</div><div class='del'>-	BUG_ON(!dentry);</div><div class='del'>-</div><div class='del'>-	if (fhp-&gt;fh_locked) {</div><div class='del'>-		printk(KERN_WARNING "fh_lock: %pd2 already locked!\n",</div><div class='del'>-			dentry);</div><div class='del'>-		return;</div><div class='add'>+	if (fhp-&gt;fh_want_write) {</div><div class='add'>+		fhp-&gt;fh_want_write = false;</div><div class='add'>+		mnt_drop_write(fhp-&gt;fh_export-&gt;ex_path.mnt);</div><div class='ctx'> 	}</div><div class='del'>-</div><div class='del'>-	inode = d_inode(dentry);</div><div class='del'>-	inode_lock_nested(inode, subclass);</div><div class='del'>-	fill_pre_wcc(fhp);</div><div class='del'>-	fhp-&gt;fh_locked = true;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void</div><div class='del'>-fh_lock(struct svc_fh *fhp)</div><div class='add'>+/**</div><div class='add'>+ * knfsd_fh_hash - calculate the crc32 hash for the filehandle</div><div class='add'>+ * @fh - pointer to filehandle</div><div class='add'>+ *</div><div class='add'>+ * returns a crc32 hash for the filehandle that is compatible with</div><div class='add'>+ * the one displayed by "wireshark".</div><div class='add'>+ */</div><div class='add'>+static inline u32 knfsd_fh_hash(const struct knfsd_fh *fh)</div><div class='ctx'> {</div><div class='del'>-	fh_lock_nested(fhp, I_MUTEX_NORMAL);</div><div class='add'>+	return ~crc32_le(0xFFFFFFFF, fh-&gt;fh_raw, fh-&gt;fh_size);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Unlock a file handle/inode</div><div class='add'>+/**</div><div class='add'>+ * fh_clear_pre_post_attrs - Reset pre/post attributes</div><div class='add'>+ * @fhp: file handle to be updated</div><div class='add'>+ *</div><div class='ctx'>  */</div><div class='del'>-static inline void</div><div class='del'>-fh_unlock(struct svc_fh *fhp)</div><div class='add'>+static inline void fh_clear_pre_post_attrs(struct svc_fh *fhp)</div><div class='ctx'> {</div><div class='del'>-	if (fhp-&gt;fh_locked) {</div><div class='del'>-		fill_post_wcc(fhp);</div><div class='del'>-		inode_unlock(d_inode(fhp-&gt;fh_dentry));</div><div class='del'>-		fhp-&gt;fh_locked = false;</div><div class='del'>-	}</div><div class='add'>+	fhp-&gt;fh_post_saved = false;</div><div class='add'>+	fhp-&gt;fh_pre_saved = false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+u64 nfsd4_change_attribute(const struct kstat *stat);</div><div class='add'>+__be32 __must_check fh_fill_pre_attrs(struct svc_fh *fhp);</div><div class='add'>+__be32 fh_fill_post_attrs(struct svc_fh *fhp);</div><div class='add'>+__be32 __must_check fh_fill_both_attrs(struct svc_fh *fhp);</div><div class='ctx'> #endif /* _LINUX_NFSD_NFSFH_H */</div><div class='head'>diff --git a/fs/nfsd/nfsproc.c b/fs/nfsd/nfsproc.c<br/>index eea5b59b6a6c..481e789a7697 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfsproc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfsproc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfsproc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/nfsproc.c</a></div><div class='hunk'>@@ -10,9 +10,35 @@</div><div class='ctx'> #include "cache.h"</div><div class='ctx'> #include "xdr.h"</div><div class='ctx'> #include "vfs.h"</div><div class='add'>+#include "trace.h"</div><div class='ctx'> </div><div class='ctx'> #define NFSDDBG_FACILITY		NFSDDBG_PROC</div><div class='ctx'> </div><div class='add'>+static __be32 nfsd_map_status(__be32 status)</div><div class='add'>+{</div><div class='add'>+	switch (status) {</div><div class='add'>+	case nfs_ok:</div><div class='add'>+		break;</div><div class='add'>+	case nfserr_nofilehandle:</div><div class='add'>+	case nfserr_badhandle:</div><div class='add'>+		status = nfserr_stale;</div><div class='add'>+		break;</div><div class='add'>+	case nfserr_wrongsec:</div><div class='add'>+	case nfserr_xdev:</div><div class='add'>+	case nfserr_file_open:</div><div class='add'>+		status = nfserr_acces;</div><div class='add'>+		break;</div><div class='add'>+	case nfserr_symlink_not_dir:</div><div class='add'>+		status = nfserr_notdir;</div><div class='add'>+		break;</div><div class='add'>+	case nfserr_symlink:</div><div class='add'>+	case nfserr_wrong_type:</div><div class='add'>+		status = nfserr_inval;</div><div class='add'>+		break;</div><div class='add'>+	}</div><div class='add'>+	return status;</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> static __be32</div><div class='ctx'> nfsd_proc_null(struct svc_rqst *rqstp)</div><div class='ctx'> {</div><div class='hunk'>@@ -29,7 +55,7 @@ nfsd_proc_getattr(struct svc_rqst *rqstp)</div><div class='ctx'> 	struct nfsd_fhandle *argp = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nfsd_attrstat *resp = rqstp-&gt;rq_resp;</div><div class='ctx'> </div><div class='del'>-	dprintk("nfsd: GETATTR  %s\n", SVCFH_fmt(&amp;argp-&gt;fh));</div><div class='add'>+	trace_nfsd_vfs_getattr(rqstp, &amp;argp-&gt;fh);</div><div class='ctx'> </div><div class='ctx'> 	fh_copy(&amp;resp-&gt;fh, &amp;argp-&gt;fh);</div><div class='ctx'> 	resp-&gt;status = fh_verify(rqstp, &amp;resp-&gt;fh, 0,</div><div class='hunk'>@@ -38,6 +64,7 @@ nfsd_proc_getattr(struct svc_rqst *rqstp)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	resp-&gt;status = fh_getattr(&amp;resp-&gt;fh, &amp;resp-&gt;stat);</div><div class='ctx'> out:</div><div class='add'>+	resp-&gt;status = nfsd_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -51,6 +78,9 @@ nfsd_proc_setattr(struct svc_rqst *rqstp)</div><div class='ctx'> 	struct nfsd_sattrargs *argp = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nfsd_attrstat *resp = rqstp-&gt;rq_resp;</div><div class='ctx'> 	struct iattr *iap = &amp;argp-&gt;attrs;</div><div class='add'>+	struct nfsd_attrs attrs = {</div><div class='add'>+		.na_iattr	= iap,</div><div class='add'>+	};</div><div class='ctx'> 	struct svc_fh *fhp;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("nfsd: SETATTR  %s, valid=%x, size=%ld\n",</div><div class='hunk'>@@ -90,7 +120,7 @@ nfsd_proc_setattr(struct svc_rqst *rqstp)</div><div class='ctx'> 		if (delta &lt; 0)</div><div class='ctx'> 			delta = -delta;</div><div class='ctx'> 		if (delta &lt; MAX_TOUCH_TIME_ERROR &amp;&amp;</div><div class='del'>-		    setattr_prepare(&amp;init_user_ns, fhp-&gt;fh_dentry, iap) != 0) {</div><div class='add'>+		    setattr_prepare(&amp;nop_mnt_idmap, fhp-&gt;fh_dentry, iap) != 0) {</div><div class='ctx'> 			/*</div><div class='ctx'> 			 * Turn off ATTR_[AM]TIME_SET but leave ATTR_[AM]TIME.</div><div class='ctx'> 			 * This will cause notify_change to set these times</div><div class='hunk'>@@ -100,12 +130,13 @@ nfsd_proc_setattr(struct svc_rqst *rqstp)</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	resp-&gt;status = nfsd_setattr(rqstp, fhp, iap, 0, (time64_t)0);</div><div class='add'>+	resp-&gt;status = nfsd_setattr(rqstp, fhp, &amp;attrs, NULL);</div><div class='ctx'> 	if (resp-&gt;status != nfs_ok)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	resp-&gt;status = fh_getattr(&amp;resp-&gt;fh, &amp;resp-&gt;stat);</div><div class='ctx'> out:</div><div class='add'>+	resp-&gt;status = nfsd_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -140,6 +171,7 @@ nfsd_proc_lookup(struct svc_rqst *rqstp)</div><div class='ctx'> </div><div class='ctx'> 	resp-&gt;status = fh_getattr(&amp;resp-&gt;fh, &amp;resp-&gt;stat);</div><div class='ctx'> out:</div><div class='add'>+	resp-&gt;status = nfsd_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -161,6 +193,7 @@ nfsd_proc_readlink(struct svc_rqst *rqstp)</div><div class='ctx'> 				     page_address(resp-&gt;page), &amp;resp-&gt;len);</div><div class='ctx'> </div><div class='ctx'> 	fh_put(&amp;argp-&gt;fh);</div><div class='add'>+	resp-&gt;status = nfsd_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -173,27 +206,16 @@ nfsd_proc_read(struct svc_rqst *rqstp)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd_readargs *argp = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nfsd_readres *resp = rqstp-&gt;rq_resp;</div><div class='del'>-	unsigned int len;</div><div class='ctx'> 	u32 eof;</div><div class='del'>-	int v;</div><div class='ctx'> </div><div class='ctx'> 	dprintk("nfsd: READ    %s %d bytes at %d\n",</div><div class='ctx'> 		SVCFH_fmt(&amp;argp-&gt;fh),</div><div class='ctx'> 		argp-&gt;count, argp-&gt;offset);</div><div class='ctx'> </div><div class='del'>-	argp-&gt;count = min_t(u32, argp-&gt;count, NFSSVC_MAXBLKSIZE_V2);</div><div class='add'>+	argp-&gt;count = min_t(u32, argp-&gt;count, NFS_MAXDATA);</div><div class='add'>+	argp-&gt;count = min_t(u32, argp-&gt;count, rqstp-&gt;rq_res.buflen);</div><div class='ctx'> </div><div class='del'>-	v = 0;</div><div class='del'>-	len = argp-&gt;count;</div><div class='ctx'> 	resp-&gt;pages = rqstp-&gt;rq_next_page;</div><div class='del'>-	while (len &gt; 0) {</div><div class='del'>-		struct page *page = *(rqstp-&gt;rq_next_page++);</div><div class='del'>-</div><div class='del'>-		rqstp-&gt;rq_vec[v].iov_base = page_address(page);</div><div class='del'>-		rqstp-&gt;rq_vec[v].iov_len = min_t(unsigned int, len, PAGE_SIZE);</div><div class='del'>-		len -= rqstp-&gt;rq_vec[v].iov_len;</div><div class='del'>-		v++;</div><div class='del'>-	}</div><div class='ctx'> </div><div class='ctx'> 	/* Obtain buffer pointer for payload. 19 is 1 word for</div><div class='ctx'> 	 * status, 17 words for fattr, and 1 word for the byte count.</div><div class='hunk'>@@ -203,11 +225,12 @@ nfsd_proc_read(struct svc_rqst *rqstp)</div><div class='ctx'> 	resp-&gt;count = argp-&gt;count;</div><div class='ctx'> 	fh_copy(&amp;resp-&gt;fh, &amp;argp-&gt;fh);</div><div class='ctx'> 	resp-&gt;status = nfsd_read(rqstp, &amp;resp-&gt;fh, argp-&gt;offset,</div><div class='del'>-				 rqstp-&gt;rq_vec, v, &amp;resp-&gt;count, &amp;eof);</div><div class='add'>+				 &amp;resp-&gt;count, &amp;eof);</div><div class='ctx'> 	if (resp-&gt;status == nfs_ok)</div><div class='ctx'> 		resp-&gt;status = fh_getattr(&amp;resp-&gt;fh, &amp;resp-&gt;stat);</div><div class='ctx'> 	else if (resp-&gt;status == nfserr_jukebox)</div><div class='del'>-		return rpc_drop_reply;</div><div class='add'>+		set_bit(RQ_DROPME, &amp;rqstp-&gt;rq_flags);</div><div class='add'>+	resp-&gt;status = nfsd_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -228,26 +251,19 @@ nfsd_proc_write(struct svc_rqst *rqstp)</div><div class='ctx'> 	struct nfsd_writeargs *argp = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nfsd_attrstat *resp = rqstp-&gt;rq_resp;</div><div class='ctx'> 	unsigned long cnt = argp-&gt;len;</div><div class='del'>-	unsigned int nvecs;</div><div class='ctx'> </div><div class='del'>-	dprintk("nfsd: WRITE    %s %d bytes at %d\n",</div><div class='add'>+	dprintk("nfsd: WRITE    %s %u bytes at %d\n",</div><div class='ctx'> 		SVCFH_fmt(&amp;argp-&gt;fh),</div><div class='ctx'> 		argp-&gt;len, argp-&gt;offset);</div><div class='ctx'> </div><div class='del'>-	nvecs = svc_fill_write_vector(rqstp, &amp;argp-&gt;payload);</div><div class='del'>-	if (!nvecs) {</div><div class='del'>-		resp-&gt;status = nfserr_io;</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='del'>-</div><div class='del'>-	resp-&gt;status = nfsd_write(rqstp, fh_copy(&amp;resp-&gt;fh, &amp;argp-&gt;fh),</div><div class='del'>-				  argp-&gt;offset, rqstp-&gt;rq_vec, nvecs,</div><div class='del'>-				  &amp;cnt, NFS_DATA_SYNC, NULL);</div><div class='add'>+	fh_copy(&amp;resp-&gt;fh, &amp;argp-&gt;fh);</div><div class='add'>+	resp-&gt;status = nfsd_write(rqstp, &amp;resp-&gt;fh, argp-&gt;offset,</div><div class='add'>+				  &amp;argp-&gt;payload, &amp;cnt, NFS_DATA_SYNC, NULL);</div><div class='ctx'> 	if (resp-&gt;status == nfs_ok)</div><div class='ctx'> 		resp-&gt;status = fh_getattr(&amp;resp-&gt;fh, &amp;resp-&gt;stat);</div><div class='ctx'> 	else if (resp-&gt;status == nfserr_jukebox)</div><div class='del'>-		return rpc_drop_reply;</div><div class='del'>-out:</div><div class='add'>+		set_bit(RQ_DROPME, &amp;rqstp-&gt;rq_flags);</div><div class='add'>+	resp-&gt;status = nfsd_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -265,15 +281,15 @@ nfsd_proc_create(struct svc_rqst *rqstp)</div><div class='ctx'> 	svc_fh		*dirfhp = &amp;argp-&gt;fh;</div><div class='ctx'> 	svc_fh		*newfhp = &amp;resp-&gt;fh;</div><div class='ctx'> 	struct iattr	*attr = &amp;argp-&gt;attrs;</div><div class='add'>+	struct nfsd_attrs attrs = {</div><div class='add'>+		.na_iattr	= attr,</div><div class='add'>+	};</div><div class='ctx'> 	struct inode	*inode;</div><div class='ctx'> 	struct dentry	*dchild;</div><div class='ctx'> 	int		type, mode;</div><div class='ctx'> 	int		hosterr;</div><div class='ctx'> 	dev_t		rdev = 0, wanted = new_decode_dev(attr-&gt;ia_size);</div><div class='ctx'> </div><div class='del'>-	dprintk("nfsd: CREATE   %s %.*s\n",</div><div class='del'>-		SVCFH_fmt(dirfhp), argp-&gt;len, argp-&gt;name);</div><div class='del'>-</div><div class='ctx'> 	/* First verify the parent file handle */</div><div class='ctx'> 	resp-&gt;status = fh_verify(rqstp, dirfhp, S_IFDIR, NFSD_MAY_EXEC);</div><div class='ctx'> 	if (resp-&gt;status != nfs_ok)</div><div class='hunk'>@@ -290,17 +306,16 @@ nfsd_proc_create(struct svc_rqst *rqstp)</div><div class='ctx'> 		goto done;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	fh_lock_nested(dirfhp, I_MUTEX_PARENT);</div><div class='del'>-	dchild = lookup_one_len(argp-&gt;name, dirfhp-&gt;fh_dentry, argp-&gt;len);</div><div class='add'>+	dchild = start_creating(&amp;nop_mnt_idmap, dirfhp-&gt;fh_dentry,</div><div class='add'>+				&amp;QSTR_LEN(argp-&gt;name, argp-&gt;len));</div><div class='ctx'> 	if (IS_ERR(dchild)) {</div><div class='ctx'> 		resp-&gt;status = nfserrno(PTR_ERR(dchild));</div><div class='del'>-		goto out_unlock;</div><div class='add'>+		goto out_write;</div><div class='ctx'> 	}</div><div class='ctx'> 	fh_init(newfhp, NFS_FHSIZE);</div><div class='ctx'> 	resp-&gt;status = fh_compose(newfhp, dirfhp-&gt;fh_export, dchild, dirfhp);</div><div class='ctx'> 	if (!resp-&gt;status &amp;&amp; d_really_is_negative(dchild))</div><div class='ctx'> 		resp-&gt;status = nfserr_noent;</div><div class='del'>-	dput(dchild);</div><div class='ctx'> 	if (resp-&gt;status) {</div><div class='ctx'> 		if (resp-&gt;status != nfserr_noent)</div><div class='ctx'> 			goto out_unlock;</div><div class='hunk'>@@ -310,7 +325,7 @@ nfsd_proc_create(struct svc_rqst *rqstp)</div><div class='ctx'> 		 */</div><div class='ctx'> 		resp-&gt;status = nfserr_acces;</div><div class='ctx'> 		if (!newfhp-&gt;fh_dentry) {</div><div class='del'>-			printk(KERN_WARNING </div><div class='add'>+			printk(KERN_WARNING</div><div class='ctx'> 				"nfsd_proc_create: file handle not verified\n");</div><div class='ctx'> 			goto out_unlock;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -341,10 +356,11 @@ nfsd_proc_create(struct svc_rqst *rqstp)</div><div class='ctx'> 					 *   echo thing &gt; device-special-file-or-pipe</div><div class='ctx'> 					 * by doing a CREATE with type==0</div><div class='ctx'> 					 */</div><div class='del'>-					resp-&gt;status = nfsd_permission(rqstp,</div><div class='del'>-								 newfhp-&gt;fh_export,</div><div class='del'>-								 newfhp-&gt;fh_dentry,</div><div class='del'>-								 NFSD_MAY_WRITE|NFSD_MAY_LOCAL_ACCESS);</div><div class='add'>+					resp-&gt;status = nfsd_permission(</div><div class='add'>+						&amp;rqstp-&gt;rq_cred,</div><div class='add'>+						newfhp-&gt;fh_export,</div><div class='add'>+						newfhp-&gt;fh_dentry,</div><div class='add'>+						NFSD_MAY_WRITE|NFSD_MAY_LOCAL_ACCESS);</div><div class='ctx'> 					if (resp-&gt;status &amp;&amp; resp-&gt;status != nfserr_rofs)</div><div class='ctx'> 						goto out_unlock;</div><div class='ctx'> 				}</div><div class='hunk'>@@ -389,9 +405,11 @@ nfsd_proc_create(struct svc_rqst *rqstp)</div><div class='ctx'> 	resp-&gt;status = nfs_ok;</div><div class='ctx'> 	if (!inode) {</div><div class='ctx'> 		/* File doesn't exist. Create it and set attrs */</div><div class='del'>-		resp-&gt;status = nfsd_create_locked(rqstp, dirfhp, argp-&gt;name,</div><div class='del'>-						  argp-&gt;len, attr, type, rdev,</div><div class='del'>-						  newfhp);</div><div class='add'>+		resp-&gt;status = nfsd_create_locked(rqstp, dirfhp, &amp;attrs, type,</div><div class='add'>+						  rdev, newfhp);</div><div class='add'>+		/* nfsd_create_locked() unlocked the parent */</div><div class='add'>+		dput(dchild);</div><div class='add'>+		goto out_write;</div><div class='ctx'> 	} else if (type == S_IFREG) {</div><div class='ctx'> 		dprintk("nfsd:   existing %s, valid=%x, size=%ld\n",</div><div class='ctx'> 			argp-&gt;name, attr-&gt;ia_valid, (long) attr-&gt;ia_size);</div><div class='hunk'>@@ -401,13 +419,13 @@ nfsd_proc_create(struct svc_rqst *rqstp)</div><div class='ctx'> 		 */</div><div class='ctx'> 		attr-&gt;ia_valid &amp;= ATTR_SIZE;</div><div class='ctx'> 		if (attr-&gt;ia_valid)</div><div class='del'>-			resp-&gt;status = nfsd_setattr(rqstp, newfhp, attr, 0,</div><div class='del'>-						    (time64_t)0);</div><div class='add'>+			resp-&gt;status = nfsd_setattr(rqstp, newfhp, &amp;attrs,</div><div class='add'>+						    NULL);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='ctx'> out_unlock:</div><div class='del'>-	/* We don't really need to unlock, as fh_put does it. */</div><div class='del'>-	fh_unlock(dirfhp);</div><div class='add'>+	end_creating(dchild);</div><div class='add'>+out_write:</div><div class='ctx'> 	fh_drop_write(dirfhp);</div><div class='ctx'> done:</div><div class='ctx'> 	fh_put(dirfhp);</div><div class='hunk'>@@ -415,6 +433,7 @@ done:</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	resp-&gt;status = fh_getattr(&amp;resp-&gt;fh, &amp;resp-&gt;stat);</div><div class='ctx'> out:</div><div class='add'>+	resp-&gt;status = nfsd_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -424,13 +443,11 @@ nfsd_proc_remove(struct svc_rqst *rqstp)</div><div class='ctx'> 	struct nfsd_diropargs *argp = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nfsd_stat *resp = rqstp-&gt;rq_resp;</div><div class='ctx'> </div><div class='del'>-	dprintk("nfsd: REMOVE   %s %.*s\n", SVCFH_fmt(&amp;argp-&gt;fh),</div><div class='del'>-		argp-&gt;len, argp-&gt;name);</div><div class='del'>-</div><div class='ctx'> 	/* Unlink. -SIFDIR means file must not be a directory */</div><div class='ctx'> 	resp-&gt;status = nfsd_unlink(rqstp, &amp;argp-&gt;fh, -S_IFDIR,</div><div class='ctx'> 				   argp-&gt;name, argp-&gt;len);</div><div class='ctx'> 	fh_put(&amp;argp-&gt;fh);</div><div class='add'>+	resp-&gt;status = nfsd_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -440,15 +457,11 @@ nfsd_proc_rename(struct svc_rqst *rqstp)</div><div class='ctx'> 	struct nfsd_renameargs *argp = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nfsd_stat *resp = rqstp-&gt;rq_resp;</div><div class='ctx'> </div><div class='del'>-	dprintk("nfsd: RENAME   %s %.*s -&gt; \n",</div><div class='del'>-		SVCFH_fmt(&amp;argp-&gt;ffh), argp-&gt;flen, argp-&gt;fname);</div><div class='del'>-	dprintk("nfsd:        -&gt;  %s %.*s\n",</div><div class='del'>-		SVCFH_fmt(&amp;argp-&gt;tfh), argp-&gt;tlen, argp-&gt;tname);</div><div class='del'>-</div><div class='ctx'> 	resp-&gt;status = nfsd_rename(rqstp, &amp;argp-&gt;ffh, argp-&gt;fname, argp-&gt;flen,</div><div class='ctx'> 				   &amp;argp-&gt;tfh, argp-&gt;tname, argp-&gt;tlen);</div><div class='ctx'> 	fh_put(&amp;argp-&gt;ffh);</div><div class='ctx'> 	fh_put(&amp;argp-&gt;tfh);</div><div class='add'>+	resp-&gt;status = nfsd_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -458,17 +471,11 @@ nfsd_proc_link(struct svc_rqst *rqstp)</div><div class='ctx'> 	struct nfsd_linkargs *argp = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nfsd_stat *resp = rqstp-&gt;rq_resp;</div><div class='ctx'> </div><div class='del'>-	dprintk("nfsd: LINK     %s -&gt;\n",</div><div class='del'>-		SVCFH_fmt(&amp;argp-&gt;ffh));</div><div class='del'>-	dprintk("nfsd:    %s %.*s\n",</div><div class='del'>-		SVCFH_fmt(&amp;argp-&gt;tfh),</div><div class='del'>-		argp-&gt;tlen,</div><div class='del'>-		argp-&gt;tname);</div><div class='del'>-</div><div class='ctx'> 	resp-&gt;status = nfsd_link(rqstp, &amp;argp-&gt;tfh, argp-&gt;tname, argp-&gt;tlen,</div><div class='ctx'> 				 &amp;argp-&gt;ffh);</div><div class='ctx'> 	fh_put(&amp;argp-&gt;ffh);</div><div class='ctx'> 	fh_put(&amp;argp-&gt;tfh);</div><div class='add'>+	resp-&gt;status = nfsd_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -477,6 +484,9 @@ nfsd_proc_symlink(struct svc_rqst *rqstp)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd_symlinkargs *argp = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nfsd_stat *resp = rqstp-&gt;rq_resp;</div><div class='add'>+	struct nfsd_attrs attrs = {</div><div class='add'>+		.na_iattr	= &amp;argp-&gt;attrs,</div><div class='add'>+	};</div><div class='ctx'> 	struct svc_fh	newfh;</div><div class='ctx'> </div><div class='ctx'> 	if (argp-&gt;tlen &gt; NFS_MAXPATHLEN) {</div><div class='hunk'>@@ -492,18 +502,15 @@ nfsd_proc_symlink(struct svc_rqst *rqstp)</div><div class='ctx'> 		goto out;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	dprintk("nfsd: SYMLINK  %s %.*s -&gt; %.*s\n",</div><div class='del'>-		SVCFH_fmt(&amp;argp-&gt;ffh), argp-&gt;flen, argp-&gt;fname,</div><div class='del'>-		argp-&gt;tlen, argp-&gt;tname);</div><div class='del'>-</div><div class='ctx'> 	fh_init(&amp;newfh, NFS_FHSIZE);</div><div class='ctx'> 	resp-&gt;status = nfsd_symlink(rqstp, &amp;argp-&gt;ffh, argp-&gt;fname, argp-&gt;flen,</div><div class='del'>-				    argp-&gt;tname, &amp;newfh);</div><div class='add'>+				    argp-&gt;tname, &amp;attrs, &amp;newfh);</div><div class='ctx'> </div><div class='ctx'> 	kfree(argp-&gt;tname);</div><div class='ctx'> 	fh_put(&amp;argp-&gt;ffh);</div><div class='ctx'> 	fh_put(&amp;newfh);</div><div class='ctx'> out:</div><div class='add'>+	resp-&gt;status = nfsd_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -516,8 +523,9 @@ nfsd_proc_mkdir(struct svc_rqst *rqstp)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd_createargs *argp = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nfsd_diropres *resp = rqstp-&gt;rq_resp;</div><div class='del'>-</div><div class='del'>-	dprintk("nfsd: MKDIR    %s %.*s\n", SVCFH_fmt(&amp;argp-&gt;fh), argp-&gt;len, argp-&gt;name);</div><div class='add'>+	struct nfsd_attrs attrs = {</div><div class='add'>+		.na_iattr	= &amp;argp-&gt;attrs,</div><div class='add'>+	};</div><div class='ctx'> </div><div class='ctx'> 	if (resp-&gt;fh.fh_dentry) {</div><div class='ctx'> 		printk(KERN_WARNING</div><div class='hunk'>@@ -527,13 +535,14 @@ nfsd_proc_mkdir(struct svc_rqst *rqstp)</div><div class='ctx'> 	argp-&gt;attrs.ia_valid &amp;= ~ATTR_SIZE;</div><div class='ctx'> 	fh_init(&amp;resp-&gt;fh, NFS_FHSIZE);</div><div class='ctx'> 	resp-&gt;status = nfsd_create(rqstp, &amp;argp-&gt;fh, argp-&gt;name, argp-&gt;len,</div><div class='del'>-				   &amp;argp-&gt;attrs, S_IFDIR, 0, &amp;resp-&gt;fh);</div><div class='add'>+				   &amp;attrs, S_IFDIR, 0, &amp;resp-&gt;fh);</div><div class='ctx'> 	fh_put(&amp;argp-&gt;fh);</div><div class='ctx'> 	if (resp-&gt;status != nfs_ok)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='ctx'> 	resp-&gt;status = fh_getattr(&amp;resp-&gt;fh, &amp;resp-&gt;stat);</div><div class='ctx'> out:</div><div class='add'>+	resp-&gt;status = nfsd_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -546,39 +555,29 @@ nfsd_proc_rmdir(struct svc_rqst *rqstp)</div><div class='ctx'> 	struct nfsd_diropargs *argp = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nfsd_stat *resp = rqstp-&gt;rq_resp;</div><div class='ctx'> </div><div class='del'>-	dprintk("nfsd: RMDIR    %s %.*s\n", SVCFH_fmt(&amp;argp-&gt;fh), argp-&gt;len, argp-&gt;name);</div><div class='del'>-</div><div class='ctx'> 	resp-&gt;status = nfsd_unlink(rqstp, &amp;argp-&gt;fh, S_IFDIR,</div><div class='ctx'> 				   argp-&gt;name, argp-&gt;len);</div><div class='ctx'> 	fh_put(&amp;argp-&gt;fh);</div><div class='add'>+	resp-&gt;status = nfsd_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static void nfsd_init_dirlist_pages(struct svc_rqst *rqstp,</div><div class='ctx'> 				    struct nfsd_readdirres *resp,</div><div class='del'>-				    int count)</div><div class='add'>+				    u32 count)</div><div class='ctx'> {</div><div class='ctx'> 	struct xdr_buf *buf = &amp;resp-&gt;dirlist;</div><div class='ctx'> 	struct xdr_stream *xdr = &amp;resp-&gt;xdr;</div><div class='ctx'> </div><div class='del'>-	count = min_t(u32, count, PAGE_SIZE);</div><div class='del'>-</div><div class='ctx'> 	memset(buf, 0, sizeof(*buf));</div><div class='ctx'> </div><div class='ctx'> 	/* Reserve room for the NULL ptr &amp; eof flag (-2 words) */</div><div class='del'>-	buf-&gt;buflen = count - sizeof(__be32) * 2;</div><div class='add'>+	buf-&gt;buflen = clamp(count, (u32)(XDR_UNIT * 2), (u32)PAGE_SIZE);</div><div class='add'>+	buf-&gt;buflen -= XDR_UNIT * 2;</div><div class='ctx'> 	buf-&gt;pages = rqstp-&gt;rq_next_page;</div><div class='ctx'> 	rqstp-&gt;rq_next_page++;</div><div class='ctx'> </div><div class='del'>-	/* This is xdr_init_encode(), but it assumes that</div><div class='del'>-	 * the head kvec has already been consumed. */</div><div class='del'>-	xdr_set_scratch_buffer(xdr, NULL, 0);</div><div class='del'>-	xdr-&gt;buf = buf;</div><div class='del'>-	xdr-&gt;page_ptr = buf-&gt;pages;</div><div class='del'>-	xdr-&gt;iov = NULL;</div><div class='del'>-	xdr-&gt;p = page_address(*buf-&gt;pages);</div><div class='del'>-	xdr-&gt;end = xdr-&gt;p + (PAGE_SIZE &gt;&gt; 2);</div><div class='del'>-	xdr-&gt;rqst = NULL;</div><div class='add'>+	xdr_init_encode_pages(xdr, buf);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -591,9 +590,7 @@ nfsd_proc_readdir(struct svc_rqst *rqstp)</div><div class='ctx'> 	struct nfsd_readdirres *resp = rqstp-&gt;rq_resp;</div><div class='ctx'> 	loff_t		offset;</div><div class='ctx'> </div><div class='del'>-	dprintk("nfsd: READDIR  %s %d bytes at %d\n",</div><div class='del'>-		SVCFH_fmt(&amp;argp-&gt;fh),		</div><div class='del'>-		argp-&gt;count, argp-&gt;cookie);</div><div class='add'>+	trace_nfsd_vfs_readdir(rqstp, &amp;argp-&gt;fh, argp-&gt;count, argp-&gt;cookie);</div><div class='ctx'> </div><div class='ctx'> 	nfsd_init_dirlist_pages(rqstp, resp, argp-&gt;count);</div><div class='ctx'> </div><div class='hunk'>@@ -605,6 +602,7 @@ nfsd_proc_readdir(struct svc_rqst *rqstp)</div><div class='ctx'> 	nfssvc_encode_nfscookie(resp, offset);</div><div class='ctx'> </div><div class='ctx'> 	fh_put(&amp;argp-&gt;fh);</div><div class='add'>+	resp-&gt;status = nfsd_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -617,11 +615,10 @@ nfsd_proc_statfs(struct svc_rqst *rqstp)</div><div class='ctx'> 	struct nfsd_fhandle *argp = rqstp-&gt;rq_argp;</div><div class='ctx'> 	struct nfsd_statfsres *resp = rqstp-&gt;rq_resp;</div><div class='ctx'> </div><div class='del'>-	dprintk("nfsd: STATFS   %s\n", SVCFH_fmt(&amp;argp-&gt;fh));</div><div class='del'>-</div><div class='ctx'> 	resp-&gt;status = nfsd_statfs(rqstp, &amp;argp-&gt;fh, &amp;resp-&gt;stats,</div><div class='ctx'> 				   NFSD_MAY_BYPASS_GSS_ON_ROOT);</div><div class='ctx'> 	fh_put(&amp;argp-&gt;fh);</div><div class='add'>+	resp-&gt;status = nfsd_map_status(resp-&gt;status);</div><div class='ctx'> 	return rpc_success;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -640,6 +637,7 @@ static const struct svc_procedure nfsd_procedures2[18] = {</div><div class='ctx'> 		.pc_decode = nfssvc_decode_voidarg,</div><div class='ctx'> 		.pc_encode = nfssvc_encode_voidres,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd_voidargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd_voidargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd_voidres),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_xdrressize = 0,</div><div class='hunk'>@@ -651,6 +649,7 @@ static const struct svc_procedure nfsd_procedures2[18] = {</div><div class='ctx'> 		.pc_encode = nfssvc_encode_attrstatres,</div><div class='ctx'> 		.pc_release = nfssvc_release_attrstat,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd_fhandle),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd_fhandle),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd_attrstat),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_xdrressize = ST+AT,</div><div class='hunk'>@@ -662,6 +661,7 @@ static const struct svc_procedure nfsd_procedures2[18] = {</div><div class='ctx'> 		.pc_encode = nfssvc_encode_attrstatres,</div><div class='ctx'> 		.pc_release = nfssvc_release_attrstat,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd_sattrargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd_sattrargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd_attrstat),</div><div class='ctx'> 		.pc_cachetype = RC_REPLBUFF,</div><div class='ctx'> 		.pc_xdrressize = ST+AT,</div><div class='hunk'>@@ -672,6 +672,7 @@ static const struct svc_procedure nfsd_procedures2[18] = {</div><div class='ctx'> 		.pc_decode = nfssvc_decode_voidarg,</div><div class='ctx'> 		.pc_encode = nfssvc_encode_voidres,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd_voidargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd_voidargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd_voidres),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_xdrressize = 0,</div><div class='hunk'>@@ -683,6 +684,7 @@ static const struct svc_procedure nfsd_procedures2[18] = {</div><div class='ctx'> 		.pc_encode = nfssvc_encode_diropres,</div><div class='ctx'> 		.pc_release = nfssvc_release_diropres,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd_diropargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd_diropargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd_diropres),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_xdrressize = ST+FH+AT,</div><div class='hunk'>@@ -693,6 +695,7 @@ static const struct svc_procedure nfsd_procedures2[18] = {</div><div class='ctx'> 		.pc_decode = nfssvc_decode_fhandleargs,</div><div class='ctx'> 		.pc_encode = nfssvc_encode_readlinkres,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd_fhandle),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd_fhandle),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd_readlinkres),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_xdrressize = ST+1+NFS_MAXPATHLEN/4,</div><div class='hunk'>@@ -704,9 +707,10 @@ static const struct svc_procedure nfsd_procedures2[18] = {</div><div class='ctx'> 		.pc_encode = nfssvc_encode_readres,</div><div class='ctx'> 		.pc_release = nfssvc_release_readres,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd_readargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd_readargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd_readres),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='del'>-		.pc_xdrressize = ST+AT+1+NFSSVC_MAXBLKSIZE_V2/4,</div><div class='add'>+		.pc_xdrressize = ST+AT+1+NFS_MAXDATA/4,</div><div class='ctx'> 		.pc_name = "READ",</div><div class='ctx'> 	},</div><div class='ctx'> 	[NFSPROC_WRITECACHE] = {</div><div class='hunk'>@@ -714,6 +718,7 @@ static const struct svc_procedure nfsd_procedures2[18] = {</div><div class='ctx'> 		.pc_decode = nfssvc_decode_voidarg,</div><div class='ctx'> 		.pc_encode = nfssvc_encode_voidres,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd_voidargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd_voidargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd_voidres),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_xdrressize = 0,</div><div class='hunk'>@@ -725,6 +730,7 @@ static const struct svc_procedure nfsd_procedures2[18] = {</div><div class='ctx'> 		.pc_encode = nfssvc_encode_attrstatres,</div><div class='ctx'> 		.pc_release = nfssvc_release_attrstat,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd_writeargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd_writeargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd_attrstat),</div><div class='ctx'> 		.pc_cachetype = RC_REPLBUFF,</div><div class='ctx'> 		.pc_xdrressize = ST+AT,</div><div class='hunk'>@@ -736,6 +742,7 @@ static const struct svc_procedure nfsd_procedures2[18] = {</div><div class='ctx'> 		.pc_encode = nfssvc_encode_diropres,</div><div class='ctx'> 		.pc_release = nfssvc_release_diropres,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd_createargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd_createargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd_diropres),</div><div class='ctx'> 		.pc_cachetype = RC_REPLBUFF,</div><div class='ctx'> 		.pc_xdrressize = ST+FH+AT,</div><div class='hunk'>@@ -746,6 +753,7 @@ static const struct svc_procedure nfsd_procedures2[18] = {</div><div class='ctx'> 		.pc_decode = nfssvc_decode_diropargs,</div><div class='ctx'> 		.pc_encode = nfssvc_encode_statres,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd_diropargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd_diropargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd_stat),</div><div class='ctx'> 		.pc_cachetype = RC_REPLSTAT,</div><div class='ctx'> 		.pc_xdrressize = ST,</div><div class='hunk'>@@ -756,6 +764,7 @@ static const struct svc_procedure nfsd_procedures2[18] = {</div><div class='ctx'> 		.pc_decode = nfssvc_decode_renameargs,</div><div class='ctx'> 		.pc_encode = nfssvc_encode_statres,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd_renameargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd_renameargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd_stat),</div><div class='ctx'> 		.pc_cachetype = RC_REPLSTAT,</div><div class='ctx'> 		.pc_xdrressize = ST,</div><div class='hunk'>@@ -766,6 +775,7 @@ static const struct svc_procedure nfsd_procedures2[18] = {</div><div class='ctx'> 		.pc_decode = nfssvc_decode_linkargs,</div><div class='ctx'> 		.pc_encode = nfssvc_encode_statres,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd_linkargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd_linkargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd_stat),</div><div class='ctx'> 		.pc_cachetype = RC_REPLSTAT,</div><div class='ctx'> 		.pc_xdrressize = ST,</div><div class='hunk'>@@ -776,6 +786,7 @@ static const struct svc_procedure nfsd_procedures2[18] = {</div><div class='ctx'> 		.pc_decode = nfssvc_decode_symlinkargs,</div><div class='ctx'> 		.pc_encode = nfssvc_encode_statres,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd_symlinkargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd_symlinkargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd_stat),</div><div class='ctx'> 		.pc_cachetype = RC_REPLSTAT,</div><div class='ctx'> 		.pc_xdrressize = ST,</div><div class='hunk'>@@ -787,6 +798,7 @@ static const struct svc_procedure nfsd_procedures2[18] = {</div><div class='ctx'> 		.pc_encode = nfssvc_encode_diropres,</div><div class='ctx'> 		.pc_release = nfssvc_release_diropres,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd_createargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd_createargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd_diropres),</div><div class='ctx'> 		.pc_cachetype = RC_REPLBUFF,</div><div class='ctx'> 		.pc_xdrressize = ST+FH+AT,</div><div class='hunk'>@@ -797,6 +809,7 @@ static const struct svc_procedure nfsd_procedures2[18] = {</div><div class='ctx'> 		.pc_decode = nfssvc_decode_diropargs,</div><div class='ctx'> 		.pc_encode = nfssvc_encode_statres,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd_diropargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd_diropargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd_stat),</div><div class='ctx'> 		.pc_cachetype = RC_REPLSTAT,</div><div class='ctx'> 		.pc_xdrressize = ST,</div><div class='hunk'>@@ -807,6 +820,7 @@ static const struct svc_procedure nfsd_procedures2[18] = {</div><div class='ctx'> 		.pc_decode = nfssvc_decode_readdirargs,</div><div class='ctx'> 		.pc_encode = nfssvc_encode_readdirres,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd_readdirargs),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd_readdirargs),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd_readdirres),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_name = "READDIR",</div><div class='hunk'>@@ -816,6 +830,7 @@ static const struct svc_procedure nfsd_procedures2[18] = {</div><div class='ctx'> 		.pc_decode = nfssvc_decode_fhandleargs,</div><div class='ctx'> 		.pc_encode = nfssvc_encode_statfsres,</div><div class='ctx'> 		.pc_argsize = sizeof(struct nfsd_fhandle),</div><div class='add'>+		.pc_argzero = sizeof(struct nfsd_fhandle),</div><div class='ctx'> 		.pc_ressize = sizeof(struct nfsd_statfsres),</div><div class='ctx'> 		.pc_cachetype = RC_NOCACHE,</div><div class='ctx'> 		.pc_xdrressize = ST+5,</div><div class='hunk'>@@ -823,72 +838,13 @@ static const struct svc_procedure nfsd_procedures2[18] = {</div><div class='ctx'> 	},</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-</div><div class='del'>-static unsigned int nfsd_count2[ARRAY_SIZE(nfsd_procedures2)];</div><div class='add'>+static DEFINE_PER_CPU_ALIGNED(unsigned long,</div><div class='add'>+			      nfsd_count2[ARRAY_SIZE(nfsd_procedures2)]);</div><div class='ctx'> const struct svc_version nfsd_version2 = {</div><div class='ctx'> 	.vs_vers	= 2,</div><div class='del'>-	.vs_nproc	= 18,</div><div class='add'>+	.vs_nproc	= ARRAY_SIZE(nfsd_procedures2),</div><div class='ctx'> 	.vs_proc	= nfsd_procedures2,</div><div class='ctx'> 	.vs_count	= nfsd_count2,</div><div class='ctx'> 	.vs_dispatch	= nfsd_dispatch,</div><div class='ctx'> 	.vs_xdrsize	= NFS2_SVC_XDRSIZE,</div><div class='ctx'> };</div><div class='del'>-</div><div class='del'>-/*</div><div class='del'>- * Map errnos to NFS errnos.</div><div class='del'>- */</div><div class='del'>-__be32</div><div class='del'>-nfserrno (int errno)</div><div class='del'>-{</div><div class='del'>-	static struct {</div><div class='del'>-		__be32	nfserr;</div><div class='del'>-		int	syserr;</div><div class='del'>-	} nfs_errtbl[] = {</div><div class='del'>-		{ nfs_ok, 0 },</div><div class='del'>-		{ nfserr_perm, -EPERM },</div><div class='del'>-		{ nfserr_noent, -ENOENT },</div><div class='del'>-		{ nfserr_io, -EIO },</div><div class='del'>-		{ nfserr_nxio, -ENXIO },</div><div class='del'>-		{ nfserr_fbig, -E2BIG },</div><div class='del'>-		{ nfserr_acces, -EACCES },</div><div class='del'>-		{ nfserr_exist, -EEXIST },</div><div class='del'>-		{ nfserr_xdev, -EXDEV },</div><div class='del'>-		{ nfserr_mlink, -EMLINK },</div><div class='del'>-		{ nfserr_nodev, -ENODEV },</div><div class='del'>-		{ nfserr_notdir, -ENOTDIR },</div><div class='del'>-		{ nfserr_isdir, -EISDIR },</div><div class='del'>-		{ nfserr_inval, -EINVAL },</div><div class='del'>-		{ nfserr_fbig, -EFBIG },</div><div class='del'>-		{ nfserr_nospc, -ENOSPC },</div><div class='del'>-		{ nfserr_rofs, -EROFS },</div><div class='del'>-		{ nfserr_mlink, -EMLINK },</div><div class='del'>-		{ nfserr_nametoolong, -ENAMETOOLONG },</div><div class='del'>-		{ nfserr_notempty, -ENOTEMPTY },</div><div class='del'>-#ifdef EDQUOT</div><div class='del'>-		{ nfserr_dquot, -EDQUOT },</div><div class='del'>-#endif</div><div class='del'>-		{ nfserr_stale, -ESTALE },</div><div class='del'>-		{ nfserr_jukebox, -ETIMEDOUT },</div><div class='del'>-		{ nfserr_jukebox, -ERESTARTSYS },</div><div class='del'>-		{ nfserr_jukebox, -EAGAIN },</div><div class='del'>-		{ nfserr_jukebox, -EWOULDBLOCK },</div><div class='del'>-		{ nfserr_jukebox, -ENOMEM },</div><div class='del'>-		{ nfserr_io, -ETXTBSY },</div><div class='del'>-		{ nfserr_notsupp, -EOPNOTSUPP },</div><div class='del'>-		{ nfserr_toosmall, -ETOOSMALL },</div><div class='del'>-		{ nfserr_serverfault, -ESERVERFAULT },</div><div class='del'>-		{ nfserr_serverfault, -ENFILE },</div><div class='del'>-		{ nfserr_io, -EUCLEAN },</div><div class='del'>-		{ nfserr_perm, -ENOKEY },</div><div class='del'>-		{ nfserr_no_grace, -ENOGRACE},</div><div class='del'>-	};</div><div class='del'>-	int	i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; ARRAY_SIZE(nfs_errtbl); i++) {</div><div class='del'>-		if (nfs_errtbl[i].syserr == errno)</div><div class='del'>-			return nfs_errtbl[i].nfserr;</div><div class='del'>-	}</div><div class='del'>-	WARN_ONCE(1, "nfsd: non-standard errno: %d\n", errno);</div><div class='del'>-	return nfserr_io;</div><div class='del'>-}</div><div class='del'>-</div><div class='head'>diff --git a/fs/nfsd/nfssvc.c b/fs/nfsd/nfssvc.c<br/>index 80431921e5d7..b08ae85d53ef 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfssvc.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfssvc.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfssvc.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/nfssvc.c</a></div><div class='hunk'>@@ -12,12 +12,14 @@</div><div class='ctx'> #include &lt;linux/module.h&gt;</div><div class='ctx'> #include &lt;linux/fs_struct.h&gt;</div><div class='ctx'> #include &lt;linux/swap.h&gt;</div><div class='add'>+#include &lt;linux/siphash.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/sunrpc/stats.h&gt;</div><div class='ctx'> #include &lt;linux/sunrpc/svcsock.h&gt;</div><div class='ctx'> #include &lt;linux/sunrpc/svc_xprt.h&gt;</div><div class='ctx'> #include &lt;linux/lockd/bind.h&gt;</div><div class='ctx'> #include &lt;linux/nfsacl.h&gt;</div><div class='add'>+#include &lt;linux/nfslocalio.h&gt;</div><div class='ctx'> #include &lt;linux/seq_file.h&gt;</div><div class='ctx'> #include &lt;linux/inetdevice.h&gt;</div><div class='ctx'> #include &lt;net/addrconf.h&gt;</div><div class='hunk'>@@ -33,7 +35,7 @@</div><div class='ctx'> </div><div class='ctx'> #define NFSDDBG_FACILITY	NFSDDBG_SVC</div><div class='ctx'> </div><div class='del'>-extern struct svc_program	nfsd_program;</div><div class='add'>+atomic_t			nfsd_th_cnt = ATOMIC_INIT(0);</div><div class='ctx'> static int			nfsd(void *vrqstp);</div><div class='ctx'> #if defined(CONFIG_NFSD_V2_ACL) || defined(CONFIG_NFSD_V3_ACL)</div><div class='ctx'> static int			nfsd_acl_rpcbind_set(struct net *,</div><div class='hunk'>@@ -55,18 +57,8 @@ static __be32			nfsd_init_request(struct svc_rqst *,</div><div class='ctx'> 						struct svc_process_info *);</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='del'>- * nfsd_mutex protects nn-&gt;nfsd_serv -- both the pointer itself and the members</div><div class='del'>- * of the svc_serv struct. In particular, -&gt;sv_nrthreads but also to some</div><div class='del'>- * extent -&gt;sv_temp_socks and -&gt;sv_permsocks. It also protects nfsdstats.th_cnt</div><div class='del'>- *</div><div class='del'>- * If (out side the lock) nn-&gt;nfsd_serv is non-NULL, then it must point to a</div><div class='del'>- * properly initialised 'struct svc_serv' with -&gt;sv_nrthreads &gt; 0. That number</div><div class='del'>- * of nfsd threads must exist and each must listed in -&gt;sp_all_threads in each</div><div class='del'>- * entry of -&gt;sv_pools[].</div><div class='del'>- *</div><div class='del'>- * Transitions of the thread count between zero and non-zero are of particular</div><div class='del'>- * interest since the svc_serv needs to be created and initialized at that</div><div class='del'>- * point, or freed.</div><div class='add'>+ * nfsd_mutex protects nn-&gt;nfsd_serv -- both the pointer itself and some members</div><div class='add'>+ * of the svc_serv struct such as -&gt;sv_temp_socks and -&gt;sv_permsocks.</div><div class='ctx'>  *</div><div class='ctx'>  * Finally, the nfsd_mutex also protects some of the global variables that are</div><div class='ctx'>  * accessed when nfsd starts and that are settable via the write_* routines in</div><div class='hunk'>@@ -78,146 +70,97 @@ static __be32			nfsd_init_request(struct svc_rqst *,</div><div class='ctx'>  */</div><div class='ctx'> DEFINE_MUTEX(nfsd_mutex);</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * nfsd_drc_lock protects nfsd_drc_max_pages and nfsd_drc_pages_used.</div><div class='del'>- * nfsd_drc_max_pages limits the total amount of memory available for</div><div class='del'>- * version 4.1 DRC caches.</div><div class='del'>- * nfsd_drc_pages_used tracks the current version 4.1 DRC memory usage.</div><div class='del'>- */</div><div class='del'>-DEFINE_SPINLOCK(nfsd_drc_lock);</div><div class='del'>-unsigned long	nfsd_drc_max_mem;</div><div class='del'>-unsigned long	nfsd_drc_mem_used;</div><div class='add'>+#if IS_ENABLED(CONFIG_NFS_LOCALIO)</div><div class='add'>+static const struct svc_version *localio_versions[] = {</div><div class='add'>+	[1] = &amp;localio_version1,</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+#define NFSD_LOCALIO_NRVERS		ARRAY_SIZE(localio_versions)</div><div class='add'>+</div><div class='add'>+#endif /* CONFIG_NFS_LOCALIO */</div><div class='ctx'> </div><div class='ctx'> #if defined(CONFIG_NFSD_V2_ACL) || defined(CONFIG_NFSD_V3_ACL)</div><div class='del'>-static struct svc_stat	nfsd_acl_svcstats;</div><div class='ctx'> static const struct svc_version *nfsd_acl_version[] = {</div><div class='add'>+# if defined(CONFIG_NFSD_V2_ACL)</div><div class='ctx'> 	[2] = &amp;nfsd_acl_version2,</div><div class='add'>+# endif</div><div class='add'>+# if defined(CONFIG_NFSD_V3_ACL)</div><div class='ctx'> 	[3] = &amp;nfsd_acl_version3,</div><div class='add'>+# endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-#define NFSD_ACL_MINVERS            2</div><div class='add'>+#define NFSD_ACL_MINVERS	2</div><div class='ctx'> #define NFSD_ACL_NRVERS		ARRAY_SIZE(nfsd_acl_version)</div><div class='ctx'> </div><div class='del'>-static struct svc_program	nfsd_acl_program = {</div><div class='del'>-	.pg_prog		= NFS_ACL_PROGRAM,</div><div class='del'>-	.pg_nvers		= NFSD_ACL_NRVERS,</div><div class='del'>-	.pg_vers		= nfsd_acl_version,</div><div class='del'>-	.pg_name		= "nfsacl",</div><div class='del'>-	.pg_class		= "nfsd",</div><div class='del'>-	.pg_stats		= &amp;nfsd_acl_svcstats,</div><div class='del'>-	.pg_authenticate	= &amp;svc_set_client,</div><div class='del'>-	.pg_init_request	= nfsd_acl_init_request,</div><div class='del'>-	.pg_rpcbind_set		= nfsd_acl_rpcbind_set,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static struct svc_stat	nfsd_acl_svcstats = {</div><div class='del'>-	.program	= &amp;nfsd_acl_program,</div><div class='del'>-};</div><div class='ctx'> #endif /* defined(CONFIG_NFSD_V2_ACL) || defined(CONFIG_NFSD_V3_ACL) */</div><div class='ctx'> </div><div class='del'>-static const struct svc_version *nfsd_version[] = {</div><div class='add'>+static const struct svc_version *nfsd_version[NFSD_MAXVERS+1] = {</div><div class='add'>+#if defined(CONFIG_NFSD_V2)</div><div class='ctx'> 	[2] = &amp;nfsd_version2,</div><div class='del'>-#if defined(CONFIG_NFSD_V3)</div><div class='del'>-	[3] = &amp;nfsd_version3,</div><div class='ctx'> #endif</div><div class='add'>+	[3] = &amp;nfsd_version3,</div><div class='ctx'> #if defined(CONFIG_NFSD_V4)</div><div class='ctx'> 	[4] = &amp;nfsd_version4,</div><div class='ctx'> #endif</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-#define NFSD_MINVERS    	2</div><div class='del'>-#define NFSD_NRVERS		ARRAY_SIZE(nfsd_version)</div><div class='del'>-</div><div class='del'>-struct svc_program		nfsd_program = {</div><div class='del'>-#if defined(CONFIG_NFSD_V2_ACL) || defined(CONFIG_NFSD_V3_ACL)</div><div class='del'>-	.pg_next		= &amp;nfsd_acl_program,</div><div class='del'>-#endif</div><div class='add'>+struct svc_program		nfsd_programs[] = {</div><div class='add'>+	{</div><div class='ctx'> 	.pg_prog		= NFS_PROGRAM,		/* program number */</div><div class='del'>-	.pg_nvers		= NFSD_NRVERS,		/* nr of entries in nfsd_version */</div><div class='add'>+	.pg_nvers		= NFSD_MAXVERS+1,	/* nr of entries in nfsd_version */</div><div class='ctx'> 	.pg_vers		= nfsd_version,		/* version table */</div><div class='ctx'> 	.pg_name		= "nfsd",		/* program name */</div><div class='ctx'> 	.pg_class		= "nfsd",		/* authentication class */</div><div class='del'>-	.pg_stats		= &amp;nfsd_svcstats,	/* version table */</div><div class='del'>-	.pg_authenticate	= &amp;svc_set_client,	/* export authentication */</div><div class='add'>+	.pg_authenticate	= svc_set_client,	/* export authentication */</div><div class='ctx'> 	.pg_init_request	= nfsd_init_request,</div><div class='ctx'> 	.pg_rpcbind_set		= nfsd_rpcbind_set,</div><div class='add'>+	},</div><div class='add'>+#if defined(CONFIG_NFSD_V2_ACL) || defined(CONFIG_NFSD_V3_ACL)</div><div class='add'>+	{</div><div class='add'>+	.pg_prog		= NFS_ACL_PROGRAM,</div><div class='add'>+	.pg_nvers		= NFSD_ACL_NRVERS,</div><div class='add'>+	.pg_vers		= nfsd_acl_version,</div><div class='add'>+	.pg_name		= "nfsacl",</div><div class='add'>+	.pg_class		= "nfsd",</div><div class='add'>+	.pg_authenticate	= svc_set_client,</div><div class='add'>+	.pg_init_request	= nfsd_acl_init_request,</div><div class='add'>+	.pg_rpcbind_set		= nfsd_acl_rpcbind_set,</div><div class='add'>+	},</div><div class='add'>+#endif /* defined(CONFIG_NFSD_V2_ACL) || defined(CONFIG_NFSD_V3_ACL) */</div><div class='add'>+#if IS_ENABLED(CONFIG_NFS_LOCALIO)</div><div class='add'>+	{</div><div class='add'>+	.pg_prog		= NFS_LOCALIO_PROGRAM,</div><div class='add'>+	.pg_nvers		= NFSD_LOCALIO_NRVERS,</div><div class='add'>+	.pg_vers		= localio_versions,</div><div class='add'>+	.pg_name		= "nfslocalio",</div><div class='add'>+	.pg_class		= "nfsd",</div><div class='add'>+	.pg_authenticate	= svc_set_client,</div><div class='add'>+	.pg_init_request	= svc_generic_init_request,</div><div class='add'>+	.pg_rpcbind_set		= svc_generic_rpcbind_set,</div><div class='add'>+	}</div><div class='add'>+#endif /* CONFIG_NFS_LOCALIO */</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-static bool</div><div class='del'>-nfsd_support_version(int vers)</div><div class='add'>+bool nfsd_support_version(int vers)</div><div class='ctx'> {</div><div class='del'>-	if (vers &gt;= NFSD_MINVERS &amp;&amp; vers &lt; NFSD_NRVERS)</div><div class='add'>+	if (vers &gt;= NFSD_MINVERS &amp;&amp; vers &lt;= NFSD_MAXVERS)</div><div class='ctx'> 		return nfsd_version[vers] != NULL;</div><div class='ctx'> 	return false;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static bool *</div><div class='del'>-nfsd_alloc_versions(void)</div><div class='del'>-{</div><div class='del'>-	bool *vers = kmalloc_array(NFSD_NRVERS, sizeof(bool), GFP_KERNEL);</div><div class='del'>-	unsigned i;</div><div class='del'>-</div><div class='del'>-	if (vers) {</div><div class='del'>-		/* All compiled versions are enabled by default */</div><div class='del'>-		for (i = 0; i &lt; NFSD_NRVERS; i++)</div><div class='del'>-			vers[i] = nfsd_support_version(i);</div><div class='del'>-	}</div><div class='del'>-	return vers;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static bool *</div><div class='del'>-nfsd_alloc_minorversions(void)</div><div class='del'>-{</div><div class='del'>-	bool *vers = kmalloc_array(NFSD_SUPPORTED_MINOR_VERSION + 1,</div><div class='del'>-			sizeof(bool), GFP_KERNEL);</div><div class='del'>-	unsigned i;</div><div class='del'>-</div><div class='del'>-	if (vers) {</div><div class='del'>-		/* All minor versions are enabled by default */</div><div class='del'>-		for (i = 0; i &lt;= NFSD_SUPPORTED_MINOR_VERSION; i++)</div><div class='del'>-			vers[i] = nfsd_support_version(4);</div><div class='del'>-	}</div><div class='del'>-	return vers;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void</div><div class='del'>-nfsd_netns_free_versions(struct nfsd_net *nn)</div><div class='del'>-{</div><div class='del'>-	kfree(nn-&gt;nfsd_versions);</div><div class='del'>-	kfree(nn-&gt;nfsd4_minorversions);</div><div class='del'>-	nn-&gt;nfsd_versions = NULL;</div><div class='del'>-	nn-&gt;nfsd4_minorversions = NULL;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static void</div><div class='del'>-nfsd_netns_init_versions(struct nfsd_net *nn)</div><div class='del'>-{</div><div class='del'>-	if (!nn-&gt;nfsd_versions) {</div><div class='del'>-		nn-&gt;nfsd_versions = nfsd_alloc_versions();</div><div class='del'>-		nn-&gt;nfsd4_minorversions = nfsd_alloc_minorversions();</div><div class='del'>-		if (!nn-&gt;nfsd_versions || !nn-&gt;nfsd4_minorversions)</div><div class='del'>-			nfsd_netns_free_versions(nn);</div><div class='del'>-	}</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> int nfsd_vers(struct nfsd_net *nn, int vers, enum vers_op change)</div><div class='ctx'> {</div><div class='del'>-	if (vers &lt; NFSD_MINVERS || vers &gt;= NFSD_NRVERS)</div><div class='add'>+	if (vers &lt; NFSD_MINVERS || vers &gt; NFSD_MAXVERS)</div><div class='ctx'> 		return 0;</div><div class='ctx'> 	switch(change) {</div><div class='ctx'> 	case NFSD_SET:</div><div class='del'>-		if (nn-&gt;nfsd_versions)</div><div class='del'>-			nn-&gt;nfsd_versions[vers] = nfsd_support_version(vers);</div><div class='add'>+		nn-&gt;nfsd_versions[vers] = nfsd_support_version(vers);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case NFSD_CLEAR:</div><div class='del'>-		nfsd_netns_init_versions(nn);</div><div class='del'>-		if (nn-&gt;nfsd_versions)</div><div class='del'>-			nn-&gt;nfsd_versions[vers] = false;</div><div class='add'>+		nn-&gt;nfsd_versions[vers] = false;</div><div class='ctx'> 		break;</div><div class='ctx'> 	case NFSD_TEST:</div><div class='del'>-		if (nn-&gt;nfsd_versions)</div><div class='del'>-			return nn-&gt;nfsd_versions[vers];</div><div class='del'>-		fallthrough;</div><div class='add'>+		return nn-&gt;nfsd_versions[vers];</div><div class='ctx'> 	case NFSD_AVAIL:</div><div class='ctx'> 		return nfsd_support_version(vers);</div><div class='ctx'> 	}</div><div class='hunk'>@@ -244,23 +187,16 @@ int nfsd_minorversion(struct nfsd_net *nn, u32 minorversion, enum vers_op change</div><div class='ctx'> </div><div class='ctx'> 	switch(change) {</div><div class='ctx'> 	case NFSD_SET:</div><div class='del'>-		if (nn-&gt;nfsd4_minorversions) {</div><div class='del'>-			nfsd_vers(nn, 4, NFSD_SET);</div><div class='del'>-			nn-&gt;nfsd4_minorversions[minorversion] =</div><div class='del'>-				nfsd_vers(nn, 4, NFSD_TEST);</div><div class='del'>-		}</div><div class='add'>+		nfsd_vers(nn, 4, NFSD_SET);</div><div class='add'>+		nn-&gt;nfsd4_minorversions[minorversion] =</div><div class='add'>+			nfsd_vers(nn, 4, NFSD_TEST);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case NFSD_CLEAR:</div><div class='del'>-		nfsd_netns_init_versions(nn);</div><div class='del'>-		if (nn-&gt;nfsd4_minorversions) {</div><div class='del'>-			nn-&gt;nfsd4_minorversions[minorversion] = false;</div><div class='del'>-			nfsd_adjust_nfsd_versions4(nn);</div><div class='del'>-		}</div><div class='add'>+		nn-&gt;nfsd4_minorversions[minorversion] = false;</div><div class='add'>+		nfsd_adjust_nfsd_versions4(nn);</div><div class='ctx'> 		break;</div><div class='ctx'> 	case NFSD_TEST:</div><div class='del'>-		if (nn-&gt;nfsd4_minorversions)</div><div class='del'>-			return nn-&gt;nfsd4_minorversions[minorversion];</div><div class='del'>-		return nfsd_vers(nn, 4, NFSD_TEST);</div><div class='add'>+		return nn-&gt;nfsd4_minorversions[minorversion];</div><div class='ctx'> 	case NFSD_AVAIL:</div><div class='ctx'> 		return minorversion &lt;= NFSD_SUPPORTED_MINOR_VERSION &amp;&amp;</div><div class='ctx'> 			nfsd_vers(nn, 4, NFSD_AVAIL);</div><div class='hunk'>@@ -268,6 +204,34 @@ int nfsd_minorversion(struct nfsd_net *nn, u32 minorversion, enum vers_op change</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+bool nfsd_net_try_get(struct net *net) __must_hold(rcu)</div><div class='add'>+{</div><div class='add'>+	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='add'>+</div><div class='add'>+	return (nn &amp;&amp; percpu_ref_tryget_live(&amp;nn-&gt;nfsd_net_ref));</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+void nfsd_net_put(struct net *net) __must_hold(rcu)</div><div class='add'>+{</div><div class='add'>+	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='add'>+</div><div class='add'>+	percpu_ref_put(&amp;nn-&gt;nfsd_net_ref);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfsd_net_done(struct percpu_ref *ref)</div><div class='add'>+{</div><div class='add'>+	struct nfsd_net *nn = container_of(ref, struct nfsd_net, nfsd_net_ref);</div><div class='add'>+</div><div class='add'>+	complete(&amp;nn-&gt;nfsd_net_confirm_done);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static void nfsd_net_free(struct percpu_ref *ref)</div><div class='add'>+{</div><div class='add'>+	struct nfsd_net *nn = container_of(ref, struct nfsd_net, nfsd_net_ref);</div><div class='add'>+</div><div class='add'>+	complete(&amp;nn-&gt;nfsd_net_free_done);</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Maximum number of nfsd processes</div><div class='ctx'>  */</div><div class='hunk'>@@ -285,27 +249,6 @@ int nfsd_nrthreads(struct net *net)</div><div class='ctx'> 	return rv;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int nfsd_init_socks(struct net *net, const struct cred *cred)</div><div class='del'>-{</div><div class='del'>-	int error;</div><div class='del'>-	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='del'>-</div><div class='del'>-	if (!list_empty(&amp;nn-&gt;nfsd_serv-&gt;sv_permsocks))</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	error = svc_create_xprt(nn-&gt;nfsd_serv, "udp", net, PF_INET, NFS_PORT,</div><div class='del'>-					SVC_SOCK_DEFAULTS, cred);</div><div class='del'>-	if (error &lt; 0)</div><div class='del'>-		return error;</div><div class='del'>-</div><div class='del'>-	error = svc_create_xprt(nn-&gt;nfsd_serv, "tcp", net, PF_INET, NFS_PORT,</div><div class='del'>-					SVC_SOCK_DEFAULTS, cred);</div><div class='del'>-	if (error &lt; 0)</div><div class='del'>-		return error;</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int nfsd_users = 0;</div><div class='ctx'> </div><div class='ctx'> static int nfsd_startup_generic(void)</div><div class='hunk'>@@ -345,35 +288,63 @@ static bool nfsd_needs_lockd(struct nfsd_net *nn)</div><div class='ctx'> 	return nfsd_vers(nn, 2, NFSD_TEST) || nfsd_vers(nn, 3, NFSD_TEST);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void nfsd_copy_boot_verifier(__be32 verf[2], struct nfsd_net *nn)</div><div class='add'>+/**</div><div class='add'>+ * nfsd_copy_write_verifier - Atomically copy a write verifier</div><div class='add'>+ * @verf: buffer in which to receive the verifier cookie</div><div class='add'>+ * @nn: NFS net namespace</div><div class='add'>+ *</div><div class='add'>+ * This function provides a wait-free mechanism for copying the</div><div class='add'>+ * namespace's write verifier without tearing it.</div><div class='add'>+ */</div><div class='add'>+void nfsd_copy_write_verifier(__be32 verf[2], struct nfsd_net *nn)</div><div class='ctx'> {</div><div class='del'>-	int seq = 0;</div><div class='add'>+	unsigned int seq;</div><div class='ctx'> </div><div class='ctx'> 	do {</div><div class='del'>-		read_seqbegin_or_lock(&amp;nn-&gt;boot_lock, &amp;seq);</div><div class='del'>-		/*</div><div class='del'>-		 * This is opaque to client, so no need to byte-swap. Use</div><div class='del'>-		 * __force to keep sparse happy. y2038 time_t overflow is</div><div class='del'>-		 * irrelevant in this usage</div><div class='del'>-		 */</div><div class='del'>-		verf[0] = (__force __be32)nn-&gt;nfssvc_boot.tv_sec;</div><div class='del'>-		verf[1] = (__force __be32)nn-&gt;nfssvc_boot.tv_nsec;</div><div class='del'>-	} while (need_seqretry(&amp;nn-&gt;boot_lock, seq));</div><div class='del'>-	done_seqretry(&amp;nn-&gt;boot_lock, seq);</div><div class='add'>+		seq = read_seqbegin(&amp;nn-&gt;writeverf_lock);</div><div class='add'>+		memcpy(verf, nn-&gt;writeverf, sizeof(nn-&gt;writeverf));</div><div class='add'>+	} while (read_seqretry(&amp;nn-&gt;writeverf_lock, seq));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static void nfsd_reset_boot_verifier_locked(struct nfsd_net *nn)</div><div class='add'>+static void nfsd_reset_write_verifier_locked(struct nfsd_net *nn)</div><div class='ctx'> {</div><div class='del'>-	ktime_get_real_ts64(&amp;nn-&gt;nfssvc_boot);</div><div class='add'>+	struct timespec64 now;</div><div class='add'>+	u64 verf;</div><div class='add'>+</div><div class='add'>+	/*</div><div class='add'>+	 * Because the time value is hashed, y2038 time_t overflow</div><div class='add'>+	 * is irrelevant in this usage.</div><div class='add'>+	 */</div><div class='add'>+	ktime_get_raw_ts64(&amp;now);</div><div class='add'>+	verf = siphash_2u64(now.tv_sec, now.tv_nsec, &amp;nn-&gt;siphash_key);</div><div class='add'>+	memcpy(nn-&gt;writeverf, &amp;verf, sizeof(nn-&gt;writeverf));</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void nfsd_reset_boot_verifier(struct nfsd_net *nn)</div><div class='add'>+/**</div><div class='add'>+ * nfsd_reset_write_verifier - Generate a new write verifier</div><div class='add'>+ * @nn: NFS net namespace</div><div class='add'>+ *</div><div class='add'>+ * This function updates the -&gt;writeverf field of @nn. This field</div><div class='add'>+ * contains an opaque cookie that, according to Section 18.32.3 of</div><div class='add'>+ * RFC 8881, "the client can use to determine whether a server has</div><div class='add'>+ * changed instance state (e.g., server restart) between a call to</div><div class='add'>+ * WRITE and a subsequent call to either WRITE or COMMIT.  This</div><div class='add'>+ * cookie MUST be unchanged during a single instance of the NFSv4.1</div><div class='add'>+ * server and MUST be unique between instances of the NFSv4.1</div><div class='add'>+ * server."</div><div class='add'>+ */</div><div class='add'>+void nfsd_reset_write_verifier(struct nfsd_net *nn)</div><div class='ctx'> {</div><div class='del'>-	write_seqlock(&amp;nn-&gt;boot_lock);</div><div class='del'>-	nfsd_reset_boot_verifier_locked(nn);</div><div class='del'>-	write_sequnlock(&amp;nn-&gt;boot_lock);</div><div class='add'>+	write_seqlock(&amp;nn-&gt;writeverf_lock);</div><div class='add'>+	nfsd_reset_write_verifier_locked(nn);</div><div class='add'>+	write_sequnlock(&amp;nn-&gt;writeverf_lock);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+/*</div><div class='add'>+ * Crank up a set of per-namespace resources for a new NFSD instance,</div><div class='add'>+ * including lockd, a duplicate reply cache, an open file cache</div><div class='add'>+ * instance, and a cache of NFSv4 state objects.</div><div class='add'>+ */</div><div class='ctx'> static int nfsd_startup_net(struct net *net, const struct cred *cred)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='hunk'>@@ -385,9 +356,12 @@ static int nfsd_startup_net(struct net *net, const struct cred *cred)</div><div class='ctx'> 	ret = nfsd_startup_generic();</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		return ret;</div><div class='del'>-	ret = nfsd_init_socks(net, cred);</div><div class='del'>-	if (ret)</div><div class='add'>+</div><div class='add'>+	if (list_empty(&amp;nn-&gt;nfsd_serv-&gt;sv_permsocks)) {</div><div class='add'>+		pr_warn("NFSD: Failed to start, no listeners configured.\n");</div><div class='add'>+		ret = -EIO;</div><div class='ctx'> 		goto out_socks;</div><div class='add'>+	}</div><div class='ctx'> </div><div class='ctx'> 	if (nfsd_needs_lockd(nn) &amp;&amp; !nn-&gt;lockd_up) {</div><div class='ctx'> 		ret = lockd_up(net, cred);</div><div class='hunk'>@@ -399,16 +373,23 @@ static int nfsd_startup_net(struct net *net, const struct cred *cred)</div><div class='ctx'> 	ret = nfsd_file_cache_start_net(net);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out_lockd;</div><div class='del'>-	ret = nfs4_state_start_net(net);</div><div class='add'>+</div><div class='add'>+	ret = nfsd_reply_cache_init(nn);</div><div class='ctx'> 	if (ret)</div><div class='ctx'> 		goto out_filecache;</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_NFSD_V4_2_INTER_SSC</div><div class='ctx'> 	nfsd4_ssc_init_umount_work(nn);</div><div class='ctx'> #endif</div><div class='add'>+	ret = nfs4_state_start_net(net);</div><div class='add'>+	if (ret)</div><div class='add'>+		goto out_reply_cache;</div><div class='add'>+</div><div class='ctx'> 	nn-&gt;nfsd_net_up = true;</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='add'>+out_reply_cache:</div><div class='add'>+	nfsd_reply_cache_shutdown(nn);</div><div class='ctx'> out_filecache:</div><div class='ctx'> 	nfsd_file_cache_shutdown_net(net);</div><div class='ctx'> out_lockd:</div><div class='hunk'>@@ -425,16 +406,29 @@ static void nfsd_shutdown_net(struct net *net)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='ctx'> </div><div class='del'>-	nfsd_file_cache_shutdown_net(net);</div><div class='add'>+	if (!nn-&gt;nfsd_net_up)</div><div class='add'>+		return;</div><div class='add'>+</div><div class='add'>+	percpu_ref_kill_and_confirm(&amp;nn-&gt;nfsd_net_ref, nfsd_net_done);</div><div class='add'>+	wait_for_completion(&amp;nn-&gt;nfsd_net_confirm_done);</div><div class='add'>+</div><div class='add'>+	nfsd_export_flush(net);</div><div class='ctx'> 	nfs4_state_shutdown_net(net);</div><div class='add'>+	nfsd_reply_cache_shutdown(nn);</div><div class='add'>+	nfsd_file_cache_shutdown_net(net);</div><div class='ctx'> 	if (nn-&gt;lockd_up) {</div><div class='ctx'> 		lockd_down(net);</div><div class='ctx'> 		nn-&gt;lockd_up = false;</div><div class='ctx'> 	}</div><div class='add'>+</div><div class='add'>+	wait_for_completion(&amp;nn-&gt;nfsd_net_free_done);</div><div class='add'>+	percpu_ref_exit(&amp;nn-&gt;nfsd_net_ref);</div><div class='add'>+</div><div class='ctx'> 	nn-&gt;nfsd_net_up = false;</div><div class='ctx'> 	nfsd_shutdown_generic();</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+static DEFINE_SPINLOCK(nfsd_notifier_lock);</div><div class='ctx'> static int nfsd_inetaddr_event(struct notifier_block *this, unsigned long event,</div><div class='ctx'> 	void *ptr)</div><div class='ctx'> {</div><div class='hunk'>@@ -444,18 +438,17 @@ static int nfsd_inetaddr_event(struct notifier_block *this, unsigned long event,</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='ctx'> 	struct sockaddr_in sin;</div><div class='ctx'> </div><div class='del'>-	if ((event != NETDEV_DOWN) ||</div><div class='del'>-	    !atomic_inc_not_zero(&amp;nn-&gt;ntf_refcnt))</div><div class='add'>+	if (event != NETDEV_DOWN || !nn-&gt;nfsd_serv)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='add'>+	spin_lock(&amp;nfsd_notifier_lock);</div><div class='ctx'> 	if (nn-&gt;nfsd_serv) {</div><div class='ctx'> 		dprintk("nfsd_inetaddr_event: removed %pI4\n", &amp;ifa-&gt;ifa_local);</div><div class='ctx'> 		sin.sin_family = AF_INET;</div><div class='ctx'> 		sin.sin_addr.s_addr = ifa-&gt;ifa_local;</div><div class='ctx'> 		svc_age_temp_xprts_now(nn-&gt;nfsd_serv, (struct sockaddr *)&amp;sin);</div><div class='ctx'> 	}</div><div class='del'>-	atomic_dec(&amp;nn-&gt;ntf_refcnt);</div><div class='del'>-	wake_up(&amp;nn-&gt;ntf_wq);</div><div class='add'>+	spin_unlock(&amp;nfsd_notifier_lock);</div><div class='ctx'> </div><div class='ctx'> out:</div><div class='ctx'> 	return NOTIFY_DONE;</div><div class='hunk'>@@ -475,10 +468,10 @@ static int nfsd_inet6addr_event(struct notifier_block *this,</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='ctx'> 	struct sockaddr_in6 sin6;</div><div class='ctx'> </div><div class='del'>-	if ((event != NETDEV_DOWN) ||</div><div class='del'>-	    !atomic_inc_not_zero(&amp;nn-&gt;ntf_refcnt))</div><div class='add'>+	if (event != NETDEV_DOWN || !nn-&gt;nfsd_serv)</div><div class='ctx'> 		goto out;</div><div class='ctx'> </div><div class='add'>+	spin_lock(&amp;nfsd_notifier_lock);</div><div class='ctx'> 	if (nn-&gt;nfsd_serv) {</div><div class='ctx'> 		dprintk("nfsd_inet6addr_event: removed %pI6\n", &amp;ifa-&gt;addr);</div><div class='ctx'> 		sin6.sin6_family = AF_INET6;</div><div class='hunk'>@@ -487,8 +480,8 @@ static int nfsd_inet6addr_event(struct notifier_block *this,</div><div class='ctx'> 			sin6.sin6_scope_id = ifa-&gt;idev-&gt;dev-&gt;ifindex;</div><div class='ctx'> 		svc_age_temp_xprts_now(nn-&gt;nfsd_serv, (struct sockaddr *)&amp;sin6);</div><div class='ctx'> 	}</div><div class='del'>-	atomic_dec(&amp;nn-&gt;ntf_refcnt);</div><div class='del'>-	wake_up(&amp;nn-&gt;ntf_wq);</div><div class='add'>+	spin_unlock(&amp;nfsd_notifier_lock);</div><div class='add'>+</div><div class='ctx'> out:</div><div class='ctx'> 	return NOTIFY_DONE;</div><div class='ctx'> }</div><div class='hunk'>@@ -501,11 +494,21 @@ static struct notifier_block nfsd_inet6addr_notifier = {</div><div class='ctx'> /* Only used under nfsd_mutex, so this atomic may be overkill: */</div><div class='ctx'> static atomic_t nfsd_notifier_refcount = ATOMIC_INIT(0);</div><div class='ctx'> </div><div class='del'>-static void nfsd_last_thread(struct svc_serv *serv, struct net *net)</div><div class='add'>+/**</div><div class='add'>+ * nfsd_destroy_serv - tear down NFSD's svc_serv for a namespace</div><div class='add'>+ * @net: network namespace the NFS service is associated with</div><div class='add'>+ */</div><div class='add'>+void nfsd_destroy_serv(struct net *net)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='add'>+	struct svc_serv *serv = nn-&gt;nfsd_serv;</div><div class='add'>+</div><div class='add'>+	lockdep_assert_held(&amp;nfsd_mutex);</div><div class='add'>+</div><div class='add'>+	spin_lock(&amp;nfsd_notifier_lock);</div><div class='add'>+	nn-&gt;nfsd_serv = NULL;</div><div class='add'>+	spin_unlock(&amp;nfsd_notifier_lock);</div><div class='ctx'> </div><div class='del'>-	atomic_dec(&amp;nn-&gt;ntf_refcnt);</div><div class='ctx'> 	/* check if the notifier still has clients */</div><div class='ctx'> 	if (atomic_dec_return(&amp;nfsd_notifier_refcount) == 0) {</div><div class='ctx'> 		unregister_inetaddr_notifier(&amp;nfsd_inetaddr_notifier);</div><div class='hunk'>@@ -513,32 +516,27 @@ static void nfsd_last_thread(struct svc_serv *serv, struct net *net)</div><div class='ctx'> 		unregister_inet6addr_notifier(&amp;nfsd_inet6addr_notifier);</div><div class='ctx'> #endif</div><div class='ctx'> 	}</div><div class='del'>-	wait_event(nn-&gt;ntf_wq, atomic_read(&amp;nn-&gt;ntf_refcnt) == 0);</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * write_ports can create the server without actually starting</div><div class='del'>-	 * any threads--if we get shut down before any threads are</div><div class='del'>-	 * started, then nfsd_last_thread will be run before any of this</div><div class='add'>+	 * any threads.  If we get shut down before any threads are</div><div class='add'>+	 * started, then nfsd_destroy_serv will be run before any of this</div><div class='ctx'> 	 * other initialization has been done except the rpcb information.</div><div class='ctx'> 	 */</div><div class='del'>-	svc_rpcb_cleanup(serv, net);</div><div class='del'>-	if (!nn-&gt;nfsd_net_up)</div><div class='del'>-		return;</div><div class='del'>-</div><div class='add'>+	svc_xprt_destroy_all(serv, net, true);</div><div class='ctx'> 	nfsd_shutdown_net(net);</div><div class='del'>-	pr_info("nfsd: last server has exited, flushing export cache\n");</div><div class='del'>-	nfsd_export_flush(net);</div><div class='add'>+	svc_destroy(&amp;serv);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> void nfsd_reset_versions(struct nfsd_net *nn)</div><div class='ctx'> {</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; NFSD_NRVERS; i++)</div><div class='add'>+	for (i = 0; i &lt;= NFSD_MAXVERS; i++)</div><div class='ctx'> 		if (nfsd_vers(nn, i, NFSD_TEST))</div><div class='ctx'> 			return;</div><div class='ctx'> </div><div class='del'>-	for (i = 0; i &lt; NFSD_NRVERS; i++)</div><div class='add'>+	for (i = 0; i &lt;= NFSD_MAXVERS; i++)</div><div class='ctx'> 		if (i != 4)</div><div class='ctx'> 			nfsd_vers(nn, i, NFSD_SET);</div><div class='ctx'> 		else {</div><div class='hunk'>@@ -548,27 +546,6 @@ void nfsd_reset_versions(struct nfsd_net *nn)</div><div class='ctx'> 		}</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Each session guarantees a negotiated per slot memory cache for replies</div><div class='del'>- * which in turn consumes memory beyond the v2/v3/v4.0 server. A dedicated</div><div class='del'>- * NFSv4.1 server might want to use more memory for a DRC than a machine</div><div class='del'>- * with mutiple services.</div><div class='del'>- *</div><div class='del'>- * Impose a hard limit on the number of pages for the DRC which varies</div><div class='del'>- * according to the machines free pages. This is of course only a default.</div><div class='del'>- *</div><div class='del'>- * For now this is a #defined shift which could be under admin control</div><div class='del'>- * in the future.</div><div class='del'>- */</div><div class='del'>-static void set_max_drc(void)</div><div class='del'>-{</div><div class='del'>-	#define NFSD_DRC_SIZE_SHIFT	7</div><div class='del'>-	nfsd_drc_max_mem = (nr_free_buffer_pages()</div><div class='del'>-					&gt;&gt; NFSD_DRC_SIZE_SHIFT) * PAGE_SIZE;</div><div class='del'>-	nfsd_drc_mem_used = 0;</div><div class='del'>-	dprintk("%s nfsd_drc_max_mem %lu \n", __func__, nfsd_drc_max_mem);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> static int nfsd_get_default_max_blksize(void)</div><div class='ctx'> {</div><div class='ctx'> 	struct sysinfo i;</div><div class='hunk'>@@ -584,30 +561,12 @@ static int nfsd_get_default_max_blksize(void)</div><div class='ctx'> 	 */</div><div class='ctx'> 	target &gt;&gt;= 12;</div><div class='ctx'> </div><div class='del'>-	ret = NFSSVC_MAXBLKSIZE;</div><div class='add'>+	ret = NFSSVC_DEFBLKSIZE;</div><div class='ctx'> 	while (ret &gt; target &amp;&amp; ret &gt;= 8*1024*2)</div><div class='ctx'> 		ret /= 2;</div><div class='ctx'> 	return ret;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static const struct svc_serv_ops nfsd_thread_sv_ops = {</div><div class='del'>-	.svo_shutdown		= nfsd_last_thread,</div><div class='del'>-	.svo_function		= nfsd,</div><div class='del'>-	.svo_enqueue_xprt	= svc_xprt_do_enqueue,</div><div class='del'>-	.svo_setup		= svc_set_num_threads,</div><div class='del'>-	.svo_module		= THIS_MODULE,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static void nfsd_complete_shutdown(struct net *net)</div><div class='del'>-{</div><div class='del'>-	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='del'>-</div><div class='del'>-	WARN_ON(!mutex_is_locked(&amp;nfsd_mutex));</div><div class='del'>-</div><div class='del'>-	nn-&gt;nfsd_serv = NULL;</div><div class='del'>-	complete(&amp;nn-&gt;nfsd_shutdown_complete);</div><div class='del'>-}</div><div class='del'>-</div><div class='ctx'> void nfsd_shutdown_threads(struct net *net)</div><div class='ctx'> {</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='hunk'>@@ -620,48 +579,54 @@ void nfsd_shutdown_threads(struct net *net)</div><div class='ctx'> 		return;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	svc_get(serv);</div><div class='ctx'> 	/* Kill outstanding nfsd threads */</div><div class='del'>-	serv-&gt;sv_ops-&gt;svo_setup(serv, NULL, 0);</div><div class='del'>-	nfsd_destroy(net);</div><div class='add'>+	svc_set_num_threads(serv, NULL, 0);</div><div class='add'>+	nfsd_destroy_serv(net);</div><div class='ctx'> 	mutex_unlock(&amp;nfsd_mutex);</div><div class='del'>-	/* Wait for shutdown of nfsd_serv to complete */</div><div class='del'>-	wait_for_completion(&amp;nn-&gt;nfsd_shutdown_complete);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-bool i_am_nfsd(void)</div><div class='add'>+struct svc_rqst *nfsd_current_rqst(void)</div><div class='ctx'> {</div><div class='del'>-	return kthread_func(current) == nfsd;</div><div class='add'>+	if (kthread_func(current) == nfsd)</div><div class='add'>+		return kthread_data(current);</div><div class='add'>+	return NULL;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> int nfsd_create_serv(struct net *net)</div><div class='ctx'> {</div><div class='ctx'> 	int error;</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='add'>+	struct svc_serv *serv;</div><div class='ctx'> </div><div class='ctx'> 	WARN_ON(!mutex_is_locked(&amp;nfsd_mutex));</div><div class='del'>-	if (nn-&gt;nfsd_serv) {</div><div class='del'>-		svc_get(nn-&gt;nfsd_serv);</div><div class='add'>+	if (nn-&gt;nfsd_serv)</div><div class='ctx'> 		return 0;</div><div class='del'>-	}</div><div class='add'>+</div><div class='add'>+	error = percpu_ref_init(&amp;nn-&gt;nfsd_net_ref, nfsd_net_free,</div><div class='add'>+				0, GFP_KERNEL);</div><div class='add'>+	if (error)</div><div class='add'>+		return error;</div><div class='add'>+	init_completion(&amp;nn-&gt;nfsd_net_free_done);</div><div class='add'>+	init_completion(&amp;nn-&gt;nfsd_net_confirm_done);</div><div class='add'>+</div><div class='ctx'> 	if (nfsd_max_blksize == 0)</div><div class='ctx'> 		nfsd_max_blksize = nfsd_get_default_max_blksize();</div><div class='ctx'> 	nfsd_reset_versions(nn);</div><div class='del'>-	nn-&gt;nfsd_serv = svc_create_pooled(&amp;nfsd_program, nfsd_max_blksize,</div><div class='del'>-						&amp;nfsd_thread_sv_ops);</div><div class='del'>-	if (nn-&gt;nfsd_serv == NULL)</div><div class='add'>+	serv = svc_create_pooled(nfsd_programs, ARRAY_SIZE(nfsd_programs),</div><div class='add'>+				 &amp;nn-&gt;nfsd_svcstats,</div><div class='add'>+				 nfsd_max_blksize, nfsd);</div><div class='add'>+	if (serv == NULL)</div><div class='ctx'> 		return -ENOMEM;</div><div class='del'>-	init_completion(&amp;nn-&gt;nfsd_shutdown_complete);</div><div class='ctx'> </div><div class='del'>-	nn-&gt;nfsd_serv-&gt;sv_maxconn = nn-&gt;max_connections;</div><div class='del'>-	error = svc_bind(nn-&gt;nfsd_serv, net);</div><div class='add'>+	error = svc_bind(serv, net);</div><div class='ctx'> 	if (error &lt; 0) {</div><div class='del'>-		svc_destroy(nn-&gt;nfsd_serv);</div><div class='del'>-		nfsd_complete_shutdown(net);</div><div class='add'>+		svc_destroy(&amp;serv);</div><div class='ctx'> 		return error;</div><div class='ctx'> 	}</div><div class='add'>+	spin_lock(&amp;nfsd_notifier_lock);</div><div class='add'>+	nn-&gt;nfsd_serv = serv;</div><div class='add'>+	spin_unlock(&amp;nfsd_notifier_lock);</div><div class='ctx'> </div><div class='del'>-	set_max_drc();</div><div class='ctx'> 	/* check if the notifier is already set */</div><div class='ctx'> 	if (atomic_inc_return(&amp;nfsd_notifier_refcount) == 1) {</div><div class='ctx'> 		register_inetaddr_notifier(&amp;nfsd_inetaddr_notifier);</div><div class='hunk'>@@ -669,8 +634,7 @@ int nfsd_create_serv(struct net *net)</div><div class='ctx'> 		register_inet6addr_notifier(&amp;nfsd_inet6addr_notifier);</div><div class='ctx'> #endif</div><div class='ctx'> 	}</div><div class='del'>-	atomic_inc(&amp;nn-&gt;ntf_refcnt);</div><div class='del'>-	nfsd_reset_boot_verifier(nn);</div><div class='add'>+	nfsd_reset_write_verifier(nn);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -686,29 +650,29 @@ int nfsd_nrpools(struct net *net)</div><div class='ctx'> </div><div class='ctx'> int nfsd_get_nrthreads(int n, int *nthreads, struct net *net)</div><div class='ctx'> {</div><div class='del'>-	int i = 0;</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='add'>+	struct svc_serv *serv = nn-&gt;nfsd_serv;</div><div class='add'>+	int i;</div><div class='ctx'> </div><div class='del'>-	if (nn-&gt;nfsd_serv != NULL) {</div><div class='del'>-		for (i = 0; i &lt; nn-&gt;nfsd_serv-&gt;sv_nrpools &amp;&amp; i &lt; n; i++)</div><div class='del'>-			nthreads[i] = nn-&gt;nfsd_serv-&gt;sv_pools[i].sp_nrthreads;</div><div class='del'>-	}</div><div class='del'>-</div><div class='add'>+	if (serv)</div><div class='add'>+		for (i = 0; i &lt; serv-&gt;sv_nrpools &amp;&amp; i &lt; n; i++)</div><div class='add'>+			nthreads[i] = serv-&gt;sv_pools[i].sp_nrthreads;</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void nfsd_destroy(struct net *net)</div><div class='del'>-{</div><div class='del'>-	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='del'>-	int destroy = (nn-&gt;nfsd_serv-&gt;sv_nrthreads == 1);</div><div class='del'>-</div><div class='del'>-	if (destroy)</div><div class='del'>-		svc_shutdown_net(nn-&gt;nfsd_serv, net);</div><div class='del'>-	svc_destroy(nn-&gt;nfsd_serv);</div><div class='del'>-	if (destroy)</div><div class='del'>-		nfsd_complete_shutdown(net);</div><div class='del'>-}</div><div class='del'>-</div><div class='add'>+/**</div><div class='add'>+ * nfsd_set_nrthreads - set the number of running threads in the net's service</div><div class='add'>+ * @n: number of array members in @nthreads</div><div class='add'>+ * @nthreads: array of thread counts for each pool</div><div class='add'>+ * @net: network namespace to operate within</div><div class='add'>+ *</div><div class='add'>+ * This function alters the number of running threads for the given network</div><div class='add'>+ * namespace in each pool. If passed an array longer then the number of pools</div><div class='add'>+ * the extra pool settings are ignored. If passed an array shorter than the</div><div class='add'>+ * number of pools, the missing values are interpreted as 0's.</div><div class='add'>+ *</div><div class='add'>+ * Returns 0 on success or a negative errno on error.</div><div class='add'>+ */</div><div class='ctx'> int nfsd_set_nrthreads(int n, int *nthreads, struct net *net)</div><div class='ctx'> {</div><div class='ctx'> 	int i = 0;</div><div class='hunk'>@@ -716,11 +680,18 @@ int nfsd_set_nrthreads(int n, int *nthreads, struct net *net)</div><div class='ctx'> 	int err = 0;</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='ctx'> </div><div class='del'>-	WARN_ON(!mutex_is_locked(&amp;nfsd_mutex));</div><div class='add'>+	lockdep_assert_held(&amp;nfsd_mutex);</div><div class='ctx'> </div><div class='ctx'> 	if (nn-&gt;nfsd_serv == NULL || n &lt;= 0)</div><div class='ctx'> 		return 0;</div><div class='ctx'> </div><div class='add'>+	/*</div><div class='add'>+	 * Special case: When n == 1, pass in NULL for the pool, so that the</div><div class='add'>+	 * change is distributed equally among them.</div><div class='add'>+	 */</div><div class='add'>+	if (n == 1)</div><div class='add'>+		return svc_set_num_threads(nn-&gt;nfsd_serv, NULL, nthreads[0]);</div><div class='add'>+</div><div class='ctx'> 	if (n &gt; nn-&gt;nfsd_serv-&gt;sv_nrpools)</div><div class='ctx'> 		n = nn-&gt;nfsd_serv-&gt;sv_nrpools;</div><div class='ctx'> </div><div class='hunk'>@@ -733,7 +704,7 @@ int nfsd_set_nrthreads(int n, int *nthreads, struct net *net)</div><div class='ctx'> 	if (tot &gt; NFSD_MAXSERVS) {</div><div class='ctx'> 		/* total too large: scale down requested numbers */</div><div class='ctx'> 		for (i = 0; i &lt; n &amp;&amp; tot &gt; 0; i++) {</div><div class='del'>-		    	int new = nthreads[i] * NFSD_MAXSERVS / tot;</div><div class='add'>+			int new = nthreads[i] * NFSD_MAXSERVS / tot;</div><div class='ctx'> 			tot -= (nthreads[i] - new);</div><div class='ctx'> 			nthreads[i] = new;</div><div class='ctx'> 		}</div><div class='hunk'>@@ -743,75 +714,68 @@ int nfsd_set_nrthreads(int n, int *nthreads, struct net *net)</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * There must always be a thread in pool 0; the admin</div><div class='del'>-	 * can't shut down NFS completely using pool_threads.</div><div class='del'>-	 */</div><div class='del'>-	if (nthreads[0] == 0)</div><div class='del'>-		nthreads[0] = 1;</div><div class='del'>-</div><div class='ctx'> 	/* apply the new numbers */</div><div class='del'>-	svc_get(nn-&gt;nfsd_serv);</div><div class='ctx'> 	for (i = 0; i &lt; n; i++) {</div><div class='del'>-		err = nn-&gt;nfsd_serv-&gt;sv_ops-&gt;svo_setup(nn-&gt;nfsd_serv,</div><div class='del'>-				&amp;nn-&gt;nfsd_serv-&gt;sv_pools[i], nthreads[i]);</div><div class='add'>+		err = svc_set_num_threads(nn-&gt;nfsd_serv,</div><div class='add'>+					  &amp;nn-&gt;nfsd_serv-&gt;sv_pools[i],</div><div class='add'>+					  nthreads[i]);</div><div class='ctx'> 		if (err)</div><div class='del'>-			break;</div><div class='add'>+			goto out;</div><div class='ctx'> 	}</div><div class='del'>-	nfsd_destroy(net);</div><div class='add'>+</div><div class='add'>+	/* Anything undefined in array is considered to be 0 */</div><div class='add'>+	for (i = n; i &lt; nn-&gt;nfsd_serv-&gt;sv_nrpools; ++i) {</div><div class='add'>+		err = svc_set_num_threads(nn-&gt;nfsd_serv,</div><div class='add'>+					  &amp;nn-&gt;nfsd_serv-&gt;sv_pools[i],</div><div class='add'>+					  0);</div><div class='add'>+		if (err)</div><div class='add'>+			goto out;</div><div class='add'>+	}</div><div class='add'>+out:</div><div class='ctx'> 	return err;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/*</div><div class='del'>- * Adjust the number of threads and return the new number of threads.</div><div class='del'>- * This is also the function that starts the server if necessary, if</div><div class='del'>- * this is the first time nrservs is nonzero.</div><div class='add'>+/**</div><div class='add'>+ * nfsd_svc: start up or shut down the nfsd server</div><div class='add'>+ * @n: number of array members in @nthreads</div><div class='add'>+ * @nthreads: array of thread counts for each pool</div><div class='add'>+ * @net: network namespace to operate within</div><div class='add'>+ * @cred: credentials to use for xprt creation</div><div class='add'>+ * @scope: server scope value (defaults to nodename)</div><div class='add'>+ *</div><div class='add'>+ * Adjust the number of threads in each pool and return the new</div><div class='add'>+ * total number of threads in the service.</div><div class='ctx'>  */</div><div class='ctx'> int</div><div class='del'>-nfsd_svc(int nrservs, struct net *net, const struct cred *cred)</div><div class='add'>+nfsd_svc(int n, int *nthreads, struct net *net, const struct cred *cred, const char *scope)</div><div class='ctx'> {</div><div class='ctx'> 	int	error;</div><div class='del'>-	bool	nfsd_up_before;</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='add'>+	struct svc_serv *serv;</div><div class='ctx'> </div><div class='del'>-	mutex_lock(&amp;nfsd_mutex);</div><div class='del'>-	dprintk("nfsd: creating service\n");</div><div class='del'>-</div><div class='del'>-	nrservs = max(nrservs, 0);</div><div class='del'>-	nrservs = min(nrservs, NFSD_MAXSERVS);</div><div class='del'>-	error = 0;</div><div class='add'>+	lockdep_assert_held(&amp;nfsd_mutex);</div><div class='ctx'> </div><div class='del'>-	if (nrservs == 0 &amp;&amp; nn-&gt;nfsd_serv == NULL)</div><div class='del'>-		goto out;</div><div class='add'>+	dprintk("nfsd: creating service\n");</div><div class='ctx'> </div><div class='del'>-	strlcpy(nn-&gt;nfsd_name, utsname()-&gt;nodename,</div><div class='add'>+	strscpy(nn-&gt;nfsd_name, scope ? scope : utsname()-&gt;nodename,</div><div class='ctx'> 		sizeof(nn-&gt;nfsd_name));</div><div class='ctx'> </div><div class='ctx'> 	error = nfsd_create_serv(net);</div><div class='ctx'> 	if (error)</div><div class='ctx'> 		goto out;</div><div class='del'>-</div><div class='del'>-	nfsd_up_before = nn-&gt;nfsd_net_up;</div><div class='add'>+	serv = nn-&gt;nfsd_serv;</div><div class='ctx'> </div><div class='ctx'> 	error = nfsd_startup_net(net, cred);</div><div class='ctx'> 	if (error)</div><div class='del'>-		goto out_destroy;</div><div class='del'>-	error = nn-&gt;nfsd_serv-&gt;sv_ops-&gt;svo_setup(nn-&gt;nfsd_serv,</div><div class='del'>-			NULL, nrservs);</div><div class='add'>+		goto out_put;</div><div class='add'>+	error = nfsd_set_nrthreads(n, nthreads, net);</div><div class='ctx'> 	if (error)</div><div class='del'>-		goto out_shutdown;</div><div class='del'>-	/* We are holding a reference to nn-&gt;nfsd_serv which</div><div class='del'>-	 * we don't want to count in the return value,</div><div class='del'>-	 * so subtract 1</div><div class='del'>-	 */</div><div class='del'>-	error = nn-&gt;nfsd_serv-&gt;sv_nrthreads - 1;</div><div class='del'>-out_shutdown:</div><div class='del'>-	if (error &lt; 0 &amp;&amp; !nfsd_up_before)</div><div class='del'>-		nfsd_shutdown_net(net);</div><div class='del'>-out_destroy:</div><div class='del'>-	nfsd_destroy(net);		/* Release server */</div><div class='add'>+		goto out_put;</div><div class='add'>+	error = serv-&gt;sv_nrthreads;</div><div class='add'>+out_put:</div><div class='add'>+	if (serv-&gt;sv_nrthreads == 0)</div><div class='add'>+		nfsd_destroy_serv(net);</div><div class='ctx'> out:</div><div class='del'>-	mutex_unlock(&amp;nfsd_mutex);</div><div class='ctx'> 	return error;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='hunk'>@@ -892,17 +856,17 @@ nfsd_init_request(struct svc_rqst *rqstp,</div><div class='ctx'> 	if (likely(nfsd_vers(nn, rqstp-&gt;rq_vers, NFSD_TEST)))</div><div class='ctx'> 		return svc_generic_init_request(rqstp, progp, ret);</div><div class='ctx'> </div><div class='del'>-	ret-&gt;mismatch.lovers = NFSD_NRVERS;</div><div class='del'>-	for (i = NFSD_MINVERS; i &lt; NFSD_NRVERS; i++) {</div><div class='add'>+	ret-&gt;mismatch.lovers = NFSD_MAXVERS + 1;</div><div class='add'>+	for (i = NFSD_MINVERS; i &lt;= NFSD_MAXVERS; i++) {</div><div class='ctx'> 		if (nfsd_vers(nn, i, NFSD_TEST)) {</div><div class='ctx'> 			ret-&gt;mismatch.lovers = i;</div><div class='ctx'> 			break;</div><div class='ctx'> 		}</div><div class='ctx'> 	}</div><div class='del'>-	if (ret-&gt;mismatch.lovers == NFSD_NRVERS)</div><div class='add'>+	if (ret-&gt;mismatch.lovers &gt; NFSD_MAXVERS)</div><div class='ctx'> 		return rpc_prog_unavail;</div><div class='ctx'> 	ret-&gt;mismatch.hivers = NFSD_MINVERS;</div><div class='del'>-	for (i = NFSD_NRVERS - 1; i &gt;= NFSD_MINVERS; i--) {</div><div class='add'>+	for (i = NFSD_MAXVERS; i &gt;= NFSD_MINVERS; i--) {</div><div class='ctx'> 		if (nfsd_vers(nn, i, NFSD_TEST)) {</div><div class='ctx'> 			ret-&gt;mismatch.hivers = i;</div><div class='ctx'> 			break;</div><div class='hunk'>@@ -921,79 +885,37 @@ nfsd(void *vrqstp)</div><div class='ctx'> 	struct svc_xprt *perm_sock = list_entry(rqstp-&gt;rq_server-&gt;sv_permsocks.next, typeof(struct svc_xprt), xpt_list);</div><div class='ctx'> 	struct net *net = perm_sock-&gt;xpt_net;</div><div class='ctx'> 	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='del'>-	int err;</div><div class='del'>-</div><div class='del'>-	/* Lock module and set up kernel thread */</div><div class='del'>-	mutex_lock(&amp;nfsd_mutex);</div><div class='ctx'> </div><div class='ctx'> 	/* At this point, the thread shares current-&gt;fs</div><div class='ctx'> 	 * with the init process. We need to create files with the</div><div class='del'>-	 * umask as defined by the client instead of init's umask. */</div><div class='del'>-	if (unshare_fs_struct() &lt; 0) {</div><div class='del'>-		printk("Unable to start nfsd thread: out of memory\n");</div><div class='del'>-		goto out;</div><div class='del'>-	}</div><div class='add'>+	 * umask as defined by the client instead of init's umask.</div><div class='add'>+	 */</div><div class='add'>+	svc_thread_init_status(rqstp, unshare_fs_struct());</div><div class='ctx'> </div><div class='ctx'> 	current-&gt;fs-&gt;umask = 0;</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * thread is spawned with all signals set to SIG_IGN, re-enable</div><div class='del'>-	 * the ones that will bring down the thread</div><div class='del'>-	 */</div><div class='del'>-	allow_signal(SIGKILL);</div><div class='del'>-	allow_signal(SIGHUP);</div><div class='del'>-	allow_signal(SIGINT);</div><div class='del'>-	allow_signal(SIGQUIT);</div><div class='del'>-</div><div class='del'>-	nfsdstats.th_cnt++;</div><div class='del'>-	mutex_unlock(&amp;nfsd_mutex);</div><div class='add'>+	atomic_inc(&amp;nfsd_th_cnt);</div><div class='ctx'> </div><div class='ctx'> 	set_freezable();</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * The main request loop</div><div class='ctx'> 	 */</div><div class='del'>-	for (;;) {</div><div class='del'>-		/* Update sv_maxconn if it has changed */</div><div class='del'>-		rqstp-&gt;rq_server-&gt;sv_maxconn = nn-&gt;max_connections;</div><div class='del'>-</div><div class='del'>-		/*</div><div class='del'>-		 * Find a socket with data available and call its</div><div class='del'>-		 * recvfrom routine.</div><div class='del'>-		 */</div><div class='del'>-		while ((err = svc_recv(rqstp, 60*60*HZ)) == -EAGAIN)</div><div class='del'>-			;</div><div class='del'>-		if (err == -EINTR)</div><div class='del'>-			break;</div><div class='del'>-		validate_process_creds();</div><div class='del'>-		svc_process(rqstp);</div><div class='del'>-		validate_process_creds();</div><div class='add'>+	while (!svc_thread_should_stop(rqstp)) {</div><div class='add'>+		svc_recv(rqstp);</div><div class='add'>+		nfsd_file_net_dispose(nn);</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/* Clear signals before calling svc_exit_thread() */</div><div class='del'>-	flush_signals(current);</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;nfsd_mutex);</div><div class='del'>-	nfsdstats.th_cnt --;</div><div class='del'>-</div><div class='del'>-out:</div><div class='del'>-	rqstp-&gt;rq_server = NULL;</div><div class='add'>+	atomic_dec(&amp;nfsd_th_cnt);</div><div class='ctx'> </div><div class='ctx'> 	/* Release the thread */</div><div class='ctx'> 	svc_exit_thread(rqstp);</div><div class='del'>-</div><div class='del'>-	nfsd_destroy(net);</div><div class='del'>-</div><div class='del'>-	/* Release module */</div><div class='del'>-	mutex_unlock(&amp;nfsd_mutex);</div><div class='del'>-	module_put_and_exit(0);</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> /**</div><div class='del'>- * nfsd_dispatch - Process an NFS or NFSACL Request</div><div class='add'>+ * nfsd_dispatch - Process an NFS or NFSACL or LOCALIO Request</div><div class='ctx'>  * @rqstp: incoming request</div><div class='del'>- * @statp: pointer to location of accept_stat field in RPC Reply buffer</div><div class='ctx'>  *</div><div class='ctx'>  * This RPC dispatcher integrates the NFS server's duplicate reply cache.</div><div class='ctx'>  *</div><div class='hunk'>@@ -1001,9 +923,13 @@ out:</div><div class='ctx'>  *  %0: Processing complete; do not send a Reply</div><div class='ctx'>  *  %1: Processing complete; send Reply in rqstp-&gt;rq_res</div><div class='ctx'>  */</div><div class='del'>-int nfsd_dispatch(struct svc_rqst *rqstp, __be32 *statp)</div><div class='add'>+int nfsd_dispatch(struct svc_rqst *rqstp)</div><div class='ctx'> {</div><div class='ctx'> 	const struct svc_procedure *proc = rqstp-&gt;rq_procinfo;</div><div class='add'>+	__be32 *statp = rqstp-&gt;rq_accept_statp;</div><div class='add'>+	struct nfsd_cacherep *rp;</div><div class='add'>+	unsigned int start, len;</div><div class='add'>+	__be32 *nfs_reply;</div><div class='ctx'> </div><div class='ctx'> 	/*</div><div class='ctx'> 	 * Give the xdr decoder a chance to change this if it wants</div><div class='hunk'>@@ -1011,11 +937,27 @@ int nfsd_dispatch(struct svc_rqst *rqstp, __be32 *statp)</div><div class='ctx'> 	 */</div><div class='ctx'> 	rqstp-&gt;rq_cachetype = proc-&gt;pc_cachetype;</div><div class='ctx'> </div><div class='del'>-	svcxdr_init_decode(rqstp);</div><div class='add'>+	/*</div><div class='add'>+	 * -&gt;pc_decode advances the argument stream past the NFS</div><div class='add'>+	 * Call header, so grab the header's starting location and</div><div class='add'>+	 * size now for the call to nfsd_cache_lookup().</div><div class='add'>+	 */</div><div class='add'>+	start = xdr_stream_pos(&amp;rqstp-&gt;rq_arg_stream);</div><div class='add'>+	len = xdr_stream_remaining(&amp;rqstp-&gt;rq_arg_stream);</div><div class='ctx'> 	if (!proc-&gt;pc_decode(rqstp, &amp;rqstp-&gt;rq_arg_stream))</div><div class='ctx'> 		goto out_decode_err;</div><div class='ctx'> </div><div class='del'>-	switch (nfsd_cache_lookup(rqstp)) {</div><div class='add'>+	/*</div><div class='add'>+	 * Release rq_status_counter setting it to an odd value after the rpc</div><div class='add'>+	 * request has been properly parsed. rq_status_counter is used to</div><div class='add'>+	 * notify the consumers if the rqstp fields are stable</div><div class='add'>+	 * (rq_status_counter is odd) or not meaningful (rq_status_counter</div><div class='add'>+	 * is even).</div><div class='add'>+	 */</div><div class='add'>+	smp_store_release(&amp;rqstp-&gt;rq_status_counter, rqstp-&gt;rq_status_counter | 1);</div><div class='add'>+</div><div class='add'>+	rp = NULL;</div><div class='add'>+	switch (nfsd_cache_lookup(rqstp, start, len, &amp;rp)) {</div><div class='ctx'> 	case RC_DOIT:</div><div class='ctx'> 		break;</div><div class='ctx'> 	case RC_REPLY:</div><div class='hunk'>@@ -1024,20 +966,21 @@ int nfsd_dispatch(struct svc_rqst *rqstp, __be32 *statp)</div><div class='ctx'> 		goto out_dropit;</div><div class='ctx'> 	}</div><div class='ctx'> </div><div class='del'>-	/*</div><div class='del'>-	 * Need to grab the location to store the status, as</div><div class='del'>-	 * NFSv4 does some encoding while processing</div><div class='del'>-	 */</div><div class='del'>-	svcxdr_init_encode(rqstp);</div><div class='del'>-</div><div class='add'>+	nfs_reply = xdr_inline_decode(&amp;rqstp-&gt;rq_res_stream, 0);</div><div class='ctx'> 	*statp = proc-&gt;pc_func(rqstp);</div><div class='del'>-	if (*statp == rpc_drop_reply || test_bit(RQ_DROPME, &amp;rqstp-&gt;rq_flags))</div><div class='add'>+	if (test_bit(RQ_DROPME, &amp;rqstp-&gt;rq_flags))</div><div class='ctx'> 		goto out_update_drop;</div><div class='ctx'> </div><div class='ctx'> 	if (!proc-&gt;pc_encode(rqstp, &amp;rqstp-&gt;rq_res_stream))</div><div class='ctx'> 		goto out_encode_err;</div><div class='ctx'> </div><div class='del'>-	nfsd_cache_update(rqstp, rqstp-&gt;rq_cachetype, statp + 1);</div><div class='add'>+	/*</div><div class='add'>+	 * Release rq_status_counter setting it to an even value after the rpc</div><div class='add'>+	 * request has been properly processed.</div><div class='add'>+	 */</div><div class='add'>+	smp_store_release(&amp;rqstp-&gt;rq_status_counter, rqstp-&gt;rq_status_counter + 1);</div><div class='add'>+</div><div class='add'>+	nfsd_cache_update(rqstp, rp, rqstp-&gt;rq_cachetype, nfs_reply);</div><div class='ctx'> out_cached_reply:</div><div class='ctx'> 	return 1;</div><div class='ctx'> </div><div class='hunk'>@@ -1047,13 +990,13 @@ out_decode_err:</div><div class='ctx'> 	return 1;</div><div class='ctx'> </div><div class='ctx'> out_update_drop:</div><div class='del'>-	nfsd_cache_update(rqstp, RC_NOCACHE, NULL);</div><div class='add'>+	nfsd_cache_update(rqstp, rp, RC_NOCACHE, NULL);</div><div class='ctx'> out_dropit:</div><div class='ctx'> 	return 0;</div><div class='ctx'> </div><div class='ctx'> out_encode_err:</div><div class='ctx'> 	trace_nfsd_cant_encode_err(rqstp);</div><div class='del'>-	nfsd_cache_update(rqstp, RC_NOCACHE, NULL);</div><div class='add'>+	nfsd_cache_update(rqstp, rp, RC_NOCACHE, NULL);</div><div class='ctx'> 	*statp = rpc_system_err;</div><div class='ctx'> 	return 1;</div><div class='ctx'> }</div><div class='hunk'>@@ -1085,32 +1028,3 @@ bool nfssvc_encode_voidres(struct svc_rqst *rqstp, struct xdr_stream *xdr)</div><div class='ctx'> {</div><div class='ctx'> 	return true;</div><div class='ctx'> }</div><div class='del'>-</div><div class='del'>-int nfsd_pool_stats_open(struct inode *inode, struct file *file)</div><div class='del'>-{</div><div class='del'>-	int ret;</div><div class='del'>-	struct nfsd_net *nn = net_generic(inode-&gt;i_sb-&gt;s_fs_info, nfsd_net_id);</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;nfsd_mutex);</div><div class='del'>-	if (nn-&gt;nfsd_serv == NULL) {</div><div class='del'>-		mutex_unlock(&amp;nfsd_mutex);</div><div class='del'>-		return -ENODEV;</div><div class='del'>-	}</div><div class='del'>-	/* bump up the psudo refcount while traversing */</div><div class='del'>-	svc_get(nn-&gt;nfsd_serv);</div><div class='del'>-	ret = svc_pool_stats_open(nn-&gt;nfsd_serv, file);</div><div class='del'>-	mutex_unlock(&amp;nfsd_mutex);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int nfsd_pool_stats_release(struct inode *inode, struct file *file)</div><div class='del'>-{</div><div class='del'>-	int ret = seq_release(inode, file);</div><div class='del'>-	struct net *net = inode-&gt;i_sb-&gt;s_fs_info;</div><div class='del'>-</div><div class='del'>-	mutex_lock(&amp;nfsd_mutex);</div><div class='del'>-	/* this function really, really should have been called svc_put() */</div><div class='del'>-	nfsd_destroy(net);</div><div class='del'>-	mutex_unlock(&amp;nfsd_mutex);</div><div class='del'>-	return ret;</div><div class='del'>-}</div><div class='head'>diff --git a/fs/nfsd/nfsxdr.c b/fs/nfsd/nfsxdr.c<br/>index aba8520b4b8b..fc262ceafca9 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfsxdr.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/nfsxdr.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/nfsxdr.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/nfsxdr.c</a></div><div class='hunk'>@@ -336,12 +336,10 @@ nfssvc_decode_writeargs(struct svc_rqst *rqstp, struct xdr_stream *xdr)</div><div class='ctx'> 	/* opaque data */</div><div class='ctx'> 	if (xdr_stream_decode_u32(xdr, &amp;args-&gt;len) &lt; 0)</div><div class='ctx'> 		return false;</div><div class='del'>-	if (args-&gt;len &gt; NFSSVC_MAXBLKSIZE_V2)</div><div class='del'>-		return false;</div><div class='del'>-	if (!xdr_stream_subsegment(xdr, &amp;args-&gt;payload, args-&gt;len))</div><div class='add'>+	if (args-&gt;len &gt; NFS_MAXDATA)</div><div class='ctx'> 		return false;</div><div class='ctx'> </div><div class='del'>-	return true;</div><div class='add'>+	return xdr_stream_subsegment(xdr, &amp;args-&gt;payload, args-&gt;len);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> bool</div><div class='hunk'>@@ -470,7 +468,8 @@ nfssvc_encode_readlinkres(struct svc_rqst *rqstp, struct xdr_stream *xdr)</div><div class='ctx'> 	case nfs_ok:</div><div class='ctx'> 		if (xdr_stream_encode_u32(xdr, resp-&gt;len) &lt; 0)</div><div class='ctx'> 			return false;</div><div class='del'>-		xdr_write_pages(xdr, &amp;resp-&gt;page, 0, resp-&gt;len);</div><div class='add'>+		svcxdr_encode_opaque_pages(rqstp, xdr, &amp;resp-&gt;page, 0,</div><div class='add'>+					   resp-&gt;len);</div><div class='ctx'> 		if (svc_encode_result_payload(rqstp, head-&gt;iov_len, resp-&gt;len) &lt; 0)</div><div class='ctx'> 			return false;</div><div class='ctx'> 		break;</div><div class='hunk'>@@ -493,8 +492,9 @@ nfssvc_encode_readres(struct svc_rqst *rqstp, struct xdr_stream *xdr)</div><div class='ctx'> 			return false;</div><div class='ctx'> 		if (xdr_stream_encode_u32(xdr, resp-&gt;count) &lt; 0)</div><div class='ctx'> 			return false;</div><div class='del'>-		xdr_write_pages(xdr, resp-&gt;pages, rqstp-&gt;rq_res.page_base,</div><div class='del'>-				resp-&gt;count);</div><div class='add'>+		svcxdr_encode_opaque_pages(rqstp, xdr, resp-&gt;pages,</div><div class='add'>+					   rqstp-&gt;rq_res.page_base,</div><div class='add'>+					   resp-&gt;count);</div><div class='ctx'> 		if (svc_encode_result_payload(rqstp, head-&gt;iov_len, resp-&gt;count) &lt; 0)</div><div class='ctx'> 			return false;</div><div class='ctx'> 		break;</div><div class='hunk'>@@ -513,7 +513,8 @@ nfssvc_encode_readdirres(struct svc_rqst *rqstp, struct xdr_stream *xdr)</div><div class='ctx'> 		return false;</div><div class='ctx'> 	switch (resp-&gt;status) {</div><div class='ctx'> 	case nfs_ok:</div><div class='del'>-		xdr_write_pages(xdr, dirlist-&gt;pages, 0, dirlist-&gt;len);</div><div class='add'>+		svcxdr_encode_opaque_pages(rqstp, xdr, dirlist-&gt;pages, 0,</div><div class='add'>+					   dirlist-&gt;len);</div><div class='ctx'> 		/* no more entries */</div><div class='ctx'> 		if (xdr_stream_encode_item_absent(xdr) &lt; 0)</div><div class='ctx'> 			return false;</div><div class='hunk'>@@ -539,7 +540,7 @@ nfssvc_encode_statfsres(struct svc_rqst *rqstp, struct xdr_stream *xdr)</div><div class='ctx'> 		p = xdr_reserve_space(xdr, XDR_UNIT * 5);</div><div class='ctx'> 		if (!p)</div><div class='ctx'> 			return false;</div><div class='del'>-		*p++ = cpu_to_be32(NFSSVC_MAXBLKSIZE_V2);</div><div class='add'>+		*p++ = cpu_to_be32(NFS_MAXDATA);</div><div class='ctx'> 		*p++ = cpu_to_be32(stat-&gt;f_bsize);</div><div class='ctx'> 		*p++ = cpu_to_be32(stat-&gt;f_blocks);</div><div class='ctx'> 		*p++ = cpu_to_be32(stat-&gt;f_bfree);</div><div class='head'>diff --git a/fs/nfsd/pnfs.h b/fs/nfsd/pnfs.h<br/>index 4f4282d4eeca..db9af780438b 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/pnfs.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/pnfs.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/pnfs.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/pnfs.h</a></div><div class='hunk'>@@ -27,17 +27,19 @@ struct nfsd4_layout_ops {</div><div class='ctx'> 			struct nfs4_client *clp,</div><div class='ctx'> 			struct nfsd4_getdeviceinfo *gdevp);</div><div class='ctx'> 	__be32 (*encode_getdeviceinfo)(struct xdr_stream *xdr,</div><div class='del'>-			struct nfsd4_getdeviceinfo *gdevp);</div><div class='add'>+			const struct nfsd4_getdeviceinfo *gdevp);</div><div class='ctx'> </div><div class='del'>-	__be32 (*proc_layoutget)(struct inode *, const struct svc_fh *fhp,</div><div class='del'>-			struct nfsd4_layoutget *lgp);</div><div class='del'>-	__be32 (*encode_layoutget)(struct xdr_stream *,</div><div class='del'>-			struct nfsd4_layoutget *lgp);</div><div class='add'>+	__be32 (*proc_layoutget)(struct svc_rqst *rqstp, struct inode *inode,</div><div class='add'>+			const struct svc_fh *fhp, struct nfsd4_layoutget *lgp);</div><div class='add'>+	__be32 (*encode_layoutget)(struct xdr_stream *xdr,</div><div class='add'>+			const struct nfsd4_layoutget *lgp);</div><div class='ctx'> </div><div class='ctx'> 	__be32 (*proc_layoutcommit)(struct inode *inode,</div><div class='add'>+			struct svc_rqst *rqstp,</div><div class='ctx'> 			struct nfsd4_layoutcommit *lcp);</div><div class='ctx'> </div><div class='del'>-	void (*fence_client)(struct nfs4_layout_stateid *ls);</div><div class='add'>+	void (*fence_client)(struct nfs4_layout_stateid *ls,</div><div class='add'>+			     struct nfsd_file *file);</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> extern const struct nfsd4_layout_ops *nfsd4_layout_ops[];</div><div class='hunk'>@@ -72,11 +74,13 @@ void nfsd4_setup_layout_type(struct svc_export *exp);</div><div class='ctx'> void nfsd4_return_all_client_layouts(struct nfs4_client *);</div><div class='ctx'> void nfsd4_return_all_file_layouts(struct nfs4_client *clp,</div><div class='ctx'> 		struct nfs4_file *fp);</div><div class='add'>+void nfsd4_close_layout(struct nfs4_layout_stateid *ls);</div><div class='ctx'> int nfsd4_init_pnfs(void);</div><div class='ctx'> void nfsd4_exit_pnfs(void);</div><div class='ctx'> #else</div><div class='ctx'> struct nfs4_client;</div><div class='ctx'> struct nfs4_file;</div><div class='add'>+struct nfs4_layout_stateid;</div><div class='ctx'> </div><div class='ctx'> static inline void nfsd4_setup_layout_type(struct svc_export *exp)</div><div class='ctx'> {</div><div class='hunk'>@@ -89,6 +93,9 @@ static inline void nfsd4_return_all_file_layouts(struct nfs4_client *clp,</div><div class='ctx'> 		struct nfs4_file *fp)</div><div class='ctx'> {</div><div class='ctx'> }</div><div class='add'>+static inline void nfsd4_close_layout(struct nfs4_layout_stateid *ls)</div><div class='add'>+{</div><div class='add'>+}</div><div class='ctx'> static inline void nfsd4_exit_pnfs(void)</div><div class='ctx'> {</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/nfsd/state.h b/fs/nfsd/state.h<br/>index e73bdbb1634a..b052c1effdc5 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/state.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/state.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/state.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/state.h</a></div><div class='hunk'>@@ -35,6 +35,7 @@</div><div class='ctx'> #ifndef _NFSD4_STATE_H</div><div class='ctx'> #define _NFSD4_STATE_H</div><div class='ctx'> </div><div class='add'>+#include &lt;crypto/md5.h&gt;</div><div class='ctx'> #include &lt;linux/idr.h&gt;</div><div class='ctx'> #include &lt;linux/refcount.h&gt;</div><div class='ctx'> #include &lt;linux/sunrpc/svc_xprt.h&gt;</div><div class='hunk'>@@ -57,28 +58,50 @@ typedef struct {</div><div class='ctx'> } stateid_t;</div><div class='ctx'> </div><div class='ctx'> typedef struct {</div><div class='del'>-	stateid_t		stid;</div><div class='add'>+	stateid_t		cs_stid;</div><div class='ctx'> #define NFS4_COPY_STID 1</div><div class='ctx'> #define NFS4_COPYNOTIFY_STID 2</div><div class='del'>-	unsigned char		sc_type;</div><div class='del'>-	refcount_t		sc_count;</div><div class='add'>+	unsigned char		cs_type;</div><div class='add'>+	refcount_t		cs_count;</div><div class='ctx'> } copy_stateid_t;</div><div class='ctx'> </div><div class='add'>+struct nfsd4_referring_call {</div><div class='add'>+	struct list_head	__list;</div><div class='add'>+</div><div class='add'>+	u32			rc_sequenceid;</div><div class='add'>+	u32			rc_slotid;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+struct nfsd4_referring_call_list {</div><div class='add'>+	struct list_head	__list;</div><div class='add'>+</div><div class='add'>+	struct nfs4_sessionid	rcl_sessionid;</div><div class='add'>+	int			__nr_referring_calls;</div><div class='add'>+	struct list_head	rcl_referring_calls;</div><div class='add'>+};</div><div class='add'>+</div><div class='ctx'> struct nfsd4_callback {</div><div class='ctx'> 	struct nfs4_client *cb_clp;</div><div class='ctx'> 	struct rpc_message cb_msg;</div><div class='add'>+#define NFSD4_CALLBACK_RUNNING		(0)</div><div class='add'>+#define NFSD4_CALLBACK_WAKE		(1)</div><div class='add'>+#define NFSD4_CALLBACK_REQUEUE		(2)</div><div class='add'>+	unsigned long cb_flags;</div><div class='ctx'> 	const struct nfsd4_callback_ops *cb_ops;</div><div class='ctx'> 	struct work_struct cb_work;</div><div class='ctx'> 	int cb_seq_status;</div><div class='ctx'> 	int cb_status;</div><div class='del'>-	bool cb_need_restart;</div><div class='del'>-	bool cb_holds_slot;</div><div class='add'>+	int cb_held_slot;</div><div class='add'>+</div><div class='add'>+	int cb_nr_referring_call_list;</div><div class='add'>+	struct list_head cb_referring_call_list;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct nfsd4_callback_ops {</div><div class='ctx'> 	void (*prepare)(struct nfsd4_callback *);</div><div class='ctx'> 	int (*done)(struct nfsd4_callback *, struct rpc_task *);</div><div class='ctx'> 	void (*release)(struct nfsd4_callback *);</div><div class='add'>+	uint32_t opcode;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='hunk'>@@ -88,17 +111,36 @@ struct nfsd4_callback_ops {</div><div class='ctx'>  */</div><div class='ctx'> struct nfs4_stid {</div><div class='ctx'> 	refcount_t		sc_count;</div><div class='del'>-#define NFS4_OPEN_STID 1</div><div class='del'>-#define NFS4_LOCK_STID 2</div><div class='del'>-#define NFS4_DELEG_STID 4</div><div class='del'>-/* For an open stateid kept around *only* to process close replays: */</div><div class='del'>-#define NFS4_CLOSED_STID 8</div><div class='add'>+</div><div class='add'>+	/* A new stateid is added to the cl_stateids idr early before it</div><div class='add'>+	 * is fully initialised.  Its sc_type is then zero.  After</div><div class='add'>+	 * initialisation the sc_type it set under cl_lock, and then</div><div class='add'>+	 * never changes.</div><div class='add'>+	 */</div><div class='add'>+#define SC_TYPE_OPEN		BIT(0)</div><div class='add'>+#define SC_TYPE_LOCK		BIT(1)</div><div class='add'>+#define SC_TYPE_DELEG		BIT(2)</div><div class='add'>+#define SC_TYPE_LAYOUT		BIT(3)</div><div class='add'>+	unsigned short		sc_type;</div><div class='add'>+</div><div class='add'>+/* state_lock protects sc_status for delegation stateids.</div><div class='add'>+ * -&gt;cl_lock protects sc_status for open and lock stateids.</div><div class='add'>+ * -&gt;st_mutex also protect sc_status for open stateids.</div><div class='add'>+ * -&gt;ls_lock protects sc_status for layout stateids.</div><div class='add'>+ */</div><div class='add'>+/*</div><div class='add'>+ * For an open stateid kept around *only* to process close replays.</div><div class='add'>+ * For deleg stateid, kept in idr until last reference is dropped.</div><div class='add'>+ */</div><div class='add'>+#define SC_STATUS_CLOSED	BIT(0)</div><div class='ctx'> /* For a deleg stateid kept around only to process free_stateid's: */</div><div class='del'>-#define NFS4_REVOKED_DELEG_STID 16</div><div class='del'>-#define NFS4_CLOSED_DELEG_STID 32</div><div class='del'>-#define NFS4_LAYOUT_STID 64</div><div class='add'>+#define SC_STATUS_REVOKED	BIT(1)</div><div class='add'>+#define SC_STATUS_ADMIN_REVOKED	BIT(2)</div><div class='add'>+#define SC_STATUS_FREEABLE	BIT(3)</div><div class='add'>+#define SC_STATUS_FREED		BIT(4)</div><div class='add'>+	unsigned short		sc_status;</div><div class='add'>+</div><div class='ctx'> 	struct list_head	sc_cp_list;</div><div class='del'>-	unsigned char		sc_type;</div><div class='ctx'> 	stateid_t		sc_stateid;</div><div class='ctx'> 	spinlock_t		sc_lock;</div><div class='ctx'> 	struct nfs4_client	*sc_client;</div><div class='hunk'>@@ -118,6 +160,36 @@ struct nfs4_cpntf_state {</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='add'>+ * RFC 7862 Section 4.8 states:</div><div class='add'>+ *</div><div class='add'>+ * | A copy offload stateid will be valid until either (A) the client</div><div class='add'>+ * | or server restarts or (B) the client returns the resource by</div><div class='add'>+ * | issuing an OFFLOAD_CANCEL operation or the client replies to a</div><div class='add'>+ * | CB_OFFLOAD operation.</div><div class='add'>+ *</div><div class='add'>+ * Because a client might not reply to a CB_OFFLOAD, or a reply</div><div class='add'>+ * might get lost due to connection loss, NFSD purges async copy</div><div class='add'>+ * state after a short period to prevent it from accumulating</div><div class='add'>+ * over time.</div><div class='add'>+ */</div><div class='add'>+#define NFSD_COPY_INITIAL_TTL 10</div><div class='add'>+</div><div class='add'>+struct nfs4_cb_fattr {</div><div class='add'>+	struct nfsd4_callback ncf_getattr;</div><div class='add'>+	u32 ncf_cb_status;</div><div class='add'>+</div><div class='add'>+	/* from CB_GETATTR reply */</div><div class='add'>+	u64 ncf_cb_change;</div><div class='add'>+	u64 ncf_cb_fsize;</div><div class='add'>+	struct timespec64 ncf_cb_mtime;</div><div class='add'>+	struct timespec64 ncf_cb_atime;</div><div class='add'>+</div><div class='add'>+	bool ncf_file_modified;</div><div class='add'>+	u64 ncf_initial_cinfo;</div><div class='add'>+	u64 ncf_cur_fsize;</div><div class='add'>+};</div><div class='add'>+</div><div class='add'>+/*</div><div class='ctx'>  * Represents a delegation stateid. The nfs4_client holds references to these</div><div class='ctx'>  * and they are put when it is being destroyed or when the delegation is</div><div class='ctx'>  * returned by the client:</div><div class='hunk'>@@ -144,13 +216,43 @@ struct nfs4_delegation {</div><div class='ctx'> 	struct list_head	dl_perclnt;</div><div class='ctx'> 	struct list_head	dl_recall_lru;  /* delegation recalled */</div><div class='ctx'> 	struct nfs4_clnt_odstate *dl_clnt_odstate;</div><div class='del'>-	u32			dl_type;</div><div class='ctx'> 	time64_t		dl_time;</div><div class='del'>-/* For recall: */</div><div class='add'>+	u32			dl_type;</div><div class='add'>+	/* For recall: */</div><div class='ctx'> 	int			dl_retries;</div><div class='ctx'> 	struct nfsd4_callback	dl_recall;</div><div class='add'>+	bool			dl_recalled;</div><div class='add'>+	bool			dl_written;</div><div class='add'>+	bool			dl_setattr;</div><div class='add'>+</div><div class='add'>+	/* for CB_GETATTR */</div><div class='add'>+	struct nfs4_cb_fattr    dl_cb_fattr;</div><div class='add'>+</div><div class='add'>+	/* For delegated timestamps */</div><div class='add'>+	struct timespec64	dl_atime;</div><div class='add'>+	struct timespec64	dl_mtime;</div><div class='add'>+	struct timespec64	dl_ctime;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+static inline bool deleg_is_read(u32 dl_type)</div><div class='add'>+{</div><div class='add'>+	return (dl_type == OPEN_DELEGATE_READ || dl_type == OPEN_DELEGATE_READ_ATTRS_DELEG);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool deleg_is_write(u32 dl_type)</div><div class='add'>+{</div><div class='add'>+	return (dl_type == OPEN_DELEGATE_WRITE || dl_type == OPEN_DELEGATE_WRITE_ATTRS_DELEG);</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+static inline bool deleg_attrs_deleg(u32 dl_type)</div><div class='add'>+{</div><div class='add'>+	return dl_type == OPEN_DELEGATE_READ_ATTRS_DELEG ||</div><div class='add'>+	       dl_type == OPEN_DELEGATE_WRITE_ATTRS_DELEG;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+bool nfsd4_vet_deleg_time(struct timespec64 *cb, const struct timespec64 *orig,</div><div class='add'>+			  const struct timespec64 *now);</div><div class='add'>+</div><div class='ctx'> #define cb_to_delegation(cb) \</div><div class='ctx'> 	container_of(cb, struct nfs4_delegation, dl_recall)</div><div class='ctx'> </div><div class='hunk'>@@ -171,10 +273,11 @@ static inline struct nfs4_delegation *delegstateid(struct nfs4_stid *s)</div><div class='ctx'> 	return container_of(s, struct nfs4_delegation, dl_stid);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-/* Maximum number of slots per session. 160 is useful for long haul TCP */</div><div class='del'>-#define NFSD_MAX_SLOTS_PER_SESSION     160</div><div class='del'>-/* Maximum number of operations per session compound */</div><div class='del'>-#define NFSD_MAX_OPS_PER_COMPOUND	16</div><div class='add'>+/* Maximum number of slots per session.  This is for sanity-check only.</div><div class='add'>+ * It could be increased if we had a mechanism to shutdown misbehaving clients.</div><div class='add'>+ * A large number can be needed to get good throughput on high-latency servers.</div><div class='add'>+ */</div><div class='add'>+#define NFSD_MAX_SLOTS_PER_SESSION	2048</div><div class='ctx'> /* Maximum  session per slot cache size */</div><div class='ctx'> #define NFSD_SLOT_CACHE_SIZE		2048</div><div class='ctx'> /* Maximum number of NFSD_SLOT_CACHE_SIZE slots per session */</div><div class='hunk'>@@ -186,12 +289,15 @@ struct nfsd4_slot {</div><div class='ctx'> 	u32	sl_seqid;</div><div class='ctx'> 	__be32	sl_status;</div><div class='ctx'> 	struct svc_cred sl_cred;</div><div class='add'>+	u32	sl_index;</div><div class='ctx'> 	u32	sl_datalen;</div><div class='ctx'> 	u16	sl_opcnt;</div><div class='add'>+	u16	sl_generation;</div><div class='ctx'> #define NFSD4_SLOT_INUSE	(1 &lt;&lt; 0)</div><div class='ctx'> #define NFSD4_SLOT_CACHETHIS	(1 &lt;&lt; 1)</div><div class='ctx'> #define NFSD4_SLOT_INITIALIZED	(1 &lt;&lt; 2)</div><div class='ctx'> #define NFSD4_SLOT_CACHED	(1 &lt;&lt; 3)</div><div class='add'>+#define NFSD4_SLOT_REUSED	(1 &lt;&lt; 4)</div><div class='ctx'> 	u8	sl_flags;</div><div class='ctx'> 	char	sl_data[];</div><div class='ctx'> };</div><div class='hunk'>@@ -250,6 +356,9 @@ struct nfsd4_conn {</div><div class='ctx'> 	unsigned char cn_flags;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='add'>+/* Maximum number of slots that nfsd will use in the backchannel */</div><div class='add'>+#define NFSD_BC_SLOT_TABLE_SIZE		(sizeof(u32) * 8)</div><div class='add'>+</div><div class='ctx'> /*</div><div class='ctx'>  * Representation of a v4.1+ session. These are refcounted in a similar fashion</div><div class='ctx'>  * to the nfs4_client. References are only taken when the server is actively</div><div class='hunk'>@@ -257,20 +366,23 @@ struct nfsd4_conn {</div><div class='ctx'>  */</div><div class='ctx'> struct nfsd4_session {</div><div class='ctx'> 	atomic_t		se_ref;</div><div class='add'>+	spinlock_t		se_lock;</div><div class='add'>+	u32			se_cb_slot_avail; /* bitmap of available slots */</div><div class='add'>+	u32			se_cb_highest_slot;	/* highest slot client wants */</div><div class='add'>+	u32			se_cb_prog;</div><div class='ctx'> 	struct list_head	se_hash;	/* hash by sessionid */</div><div class='ctx'> 	struct list_head	se_perclnt;</div><div class='del'>-/* See SESSION4_PERSIST, etc. for standard flags; this is internal-only: */</div><div class='del'>-#define NFS4_SESSION_DEAD	0x010</div><div class='del'>-	u32			se_flags;</div><div class='add'>+	struct list_head	se_all_sessions;/* global list of sessions */</div><div class='ctx'> 	struct nfs4_client	*se_client;</div><div class='ctx'> 	struct nfs4_sessionid	se_sessionid;</div><div class='ctx'> 	struct nfsd4_channel_attrs se_fchannel;</div><div class='del'>-	struct nfsd4_channel_attrs se_bchannel;</div><div class='ctx'> 	struct nfsd4_cb_sec	se_cb_sec;</div><div class='ctx'> 	struct list_head	se_conns;</div><div class='del'>-	u32			se_cb_prog;</div><div class='del'>-	u32			se_cb_seq_nr;</div><div class='del'>-	struct nfsd4_slot	*se_slots[];	/* forward channel slots */</div><div class='add'>+	u32			se_cb_seq_nr[NFSD_BC_SLOT_TABLE_SIZE];</div><div class='add'>+	struct xarray		se_slots;	/* forward channel slots */</div><div class='add'>+	u16			se_slot_gen;</div><div class='add'>+	bool			se_dead;</div><div class='add'>+	u32			se_target_maxslots;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /* formatted contents of nfs4_sessionid */</div><div class='hunk'>@@ -280,7 +392,30 @@ struct nfsd4_sessionid {</div><div class='ctx'> 	u32		reserved;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='del'>-#define HEXDIR_LEN     33 /* hex version of 16 byte md5 of cl_name plus '\0' */</div><div class='add'>+/* Length of MD5 digest as hex, plus terminating '\0' */</div><div class='add'>+#define HEXDIR_LEN	(2 * MD5_DIGEST_SIZE + 1)</div><div class='add'>+</div><div class='add'>+/*</div><div class='add'>+ *       State                Meaning                  Where set</div><div class='add'>+ * --------------------------------------------------------------------------</div><div class='add'>+ * | NFSD4_ACTIVE      | Confirmed, active    | Default                     |</div><div class='add'>+ * |------------------- ----------------------------------------------------|</div><div class='add'>+ * | NFSD4_COURTESY    | Courtesy state.      | nfs4_get_client_reaplist    |</div><div class='add'>+ * |                   | Lease/lock/share     |                             |</div><div class='add'>+ * |                   | reservation conflict |                             |</div><div class='add'>+ * |                   | can cause Courtesy   |                             |</div><div class='add'>+ * |                   | client to be expired |                             |</div><div class='add'>+ * |------------------------------------------------------------------------|</div><div class='add'>+ * | NFSD4_EXPIRABLE   | Courtesy client to be| nfs4_laundromat             |</div><div class='add'>+ * |                   | expired by Laundromat| try_to_expire_client        |</div><div class='add'>+ * |                   | due to conflict      |                             |</div><div class='add'>+ * |------------------------------------------------------------------------|</div><div class='add'>+ */</div><div class='add'>+enum {</div><div class='add'>+	NFSD4_ACTIVE = 0,</div><div class='add'>+	NFSD4_COURTESY,</div><div class='add'>+	NFSD4_EXPIRABLE,</div><div class='add'>+};</div><div class='ctx'> </div><div class='ctx'> /*</div><div class='ctx'>  * struct nfs4_client - one per client.  Clientids live here.</div><div class='hunk'>@@ -296,8 +431,9 @@ struct nfsd4_sessionid {</div><div class='ctx'>  * 0. If they are not renewed within a lease period, they become eligible for</div><div class='ctx'>  * destruction by the laundromat.</div><div class='ctx'>  *</div><div class='del'>- * These objects can also be destroyed prematurely by the fault injection code,</div><div class='del'>- * or if the client sends certain forms of SETCLIENTID or EXCHANGE_ID updates.</div><div class='add'>+ * These objects can also be destroyed if the client sends certain forms of</div><div class='add'>+ * SETCLIENTID or EXCHANGE_ID operations.</div><div class='add'>+ *</div><div class='ctx'>  * Care is taken *not* to do this however when the objects have an elevated</div><div class='ctx'>  * refcount.</div><div class='ctx'>  *</div><div class='hunk'>@@ -305,7 +441,7 @@ struct nfsd4_sessionid {</div><div class='ctx'>  *</div><div class='ctx'>  * o Each nfs4_clients is also hashed by name (the opaque quantity initially</div><div class='ctx'>  *   sent by the client to identify itself).</div><div class='del'>- * 	  </div><div class='add'>+ *</div><div class='ctx'>  * o cl_perclient list is used to ensure no dangling stateowner references</div><div class='ctx'>  *   when we expire the nfs4_client</div><div class='ctx'>  */</div><div class='hunk'>@@ -330,6 +466,7 @@ struct nfs4_client {</div><div class='ctx'> 	clientid_t		cl_clientid;	/* generated by server */</div><div class='ctx'> 	nfs4_verifier		cl_confirm;	/* generated by server */</div><div class='ctx'> 	u32			cl_minorversion;</div><div class='add'>+	atomic_t		cl_admin_revoked; /* count of admin-revoked states */</div><div class='ctx'> 	/* NFSv4.1 client implementation id: */</div><div class='ctx'> 	struct xdr_netobj	cl_nii_domain;</div><div class='ctx'> 	struct xdr_netobj	cl_nii_name;</div><div class='hunk'>@@ -346,6 +483,8 @@ struct nfs4_client {</div><div class='ctx'> #define NFSD4_CLIENT_CB_FLAG_MASK	(1 &lt;&lt; NFSD4_CLIENT_CB_UPDATE | \</div><div class='ctx'> 					 1 &lt;&lt; NFSD4_CLIENT_CB_KILL)</div><div class='ctx'> 	unsigned long		cl_flags;</div><div class='add'>+</div><div class='add'>+	struct workqueue_struct *cl_callback_wq;</div><div class='ctx'> 	const struct cred	*cl_cb_cred;</div><div class='ctx'> 	struct rpc_clnt		*cl_cb_client;</div><div class='ctx'> 	u32			cl_cb_ident;</div><div class='hunk'>@@ -376,15 +515,18 @@ struct nfs4_client {</div><div class='ctx'> 	 */</div><div class='ctx'> 	struct dentry		*cl_nfsd_info_dentry;</div><div class='ctx'> </div><div class='del'>-	/* for nfs41 callbacks */</div><div class='del'>-	/* We currently support a single back channel with a single slot */</div><div class='del'>-	unsigned long		cl_cb_slot_busy;</div><div class='ctx'> 	struct rpc_wait_queue	cl_cb_waitq;	/* backchannel callers may */</div><div class='ctx'> 						/* wait here for slots */</div><div class='ctx'> 	struct net		*net;</div><div class='ctx'> 	struct list_head	async_copies;	/* list of async copies */</div><div class='ctx'> 	spinlock_t		async_lock;	/* lock for async copies */</div><div class='ctx'> 	atomic_t		cl_cb_inflight;	/* Outstanding callbacks */</div><div class='add'>+</div><div class='add'>+	unsigned int		cl_state;</div><div class='add'>+	atomic_t		cl_delegs_in_recall;</div><div class='add'>+</div><div class='add'>+	struct nfsd4_cb_recall_any	*cl_ra;</div><div class='add'>+	time64_t		cl_ra_time;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /* struct nfs4_client_reset</div><div class='hunk'>@@ -417,7 +559,7 @@ struct nfs4_replay {</div><div class='ctx'> 	unsigned int		rp_buflen;</div><div class='ctx'> 	char			*rp_buf;</div><div class='ctx'> 	struct knfsd_fh		rp_openfh;</div><div class='del'>-	struct mutex		rp_mutex;</div><div class='add'>+	int			rp_locked;</div><div class='ctx'> 	char			rp_ibuf[NFSD4_REPLAY_ISIZE];</div><div class='ctx'> };</div><div class='ctx'> </div><div class='hunk'>@@ -510,16 +652,13 @@ struct nfs4_clnt_odstate {</div><div class='ctx'>  * inode can have multiple filehandles associated with it, so there is</div><div class='ctx'>  * (potentially) a many to one relationship between this struct and struct</div><div class='ctx'>  * inode.</div><div class='del'>- *</div><div class='del'>- * These are hashed by filehandle in the file_hashtbl, which is protected by</div><div class='del'>- * the global state_lock spinlock.</div><div class='ctx'>  */</div><div class='ctx'> struct nfs4_file {</div><div class='ctx'> 	refcount_t		fi_ref;</div><div class='ctx'> 	struct inode *		fi_inode;</div><div class='ctx'> 	bool			fi_aliased;</div><div class='ctx'> 	spinlock_t		fi_lock;</div><div class='del'>-	struct hlist_node       fi_hash;	/* hash on fi_fhandle */</div><div class='add'>+	struct rhlist_head	fi_rlist;</div><div class='ctx'> 	struct list_head        fi_stateids;</div><div class='ctx'> 	union {</div><div class='ctx'> 		struct list_head	fi_delegations;</div><div class='hunk'>@@ -538,6 +677,7 @@ struct nfs4_file {</div><div class='ctx'> 	atomic_t		fi_access[2];</div><div class='ctx'> 	u32			fi_share_deny;</div><div class='ctx'> 	struct nfsd_file	*fi_deleg_file;</div><div class='add'>+	struct nfsd_file	*fi_rdeleg_file;</div><div class='ctx'> 	int			fi_delegees;</div><div class='ctx'> 	struct knfsd_fh		fi_fhandle;</div><div class='ctx'> 	bool			fi_had_conflict;</div><div class='hunk'>@@ -568,6 +708,10 @@ struct nfs4_ol_stateid {</div><div class='ctx'> 	struct list_head		st_locks;</div><div class='ctx'> 	struct nfs4_stateowner		*st_stateowner;</div><div class='ctx'> 	struct nfs4_clnt_odstate	*st_clnt_odstate;</div><div class='add'>+/*</div><div class='add'>+ * These bitmasks use 3 separate bits for READ, ALLOW, and BOTH; see the</div><div class='add'>+ * comment above bmap_to_share_mode() for explanation:</div><div class='add'>+ */</div><div class='ctx'> 	unsigned char			st_access_bmap;</div><div class='ctx'> 	unsigned char			st_deny_bmap;</div><div class='ctx'> 	struct nfs4_ol_stateid		*st_openstp;</div><div class='hunk'>@@ -609,6 +753,8 @@ enum nfsd4_cb_op {</div><div class='ctx'> 	NFSPROC4_CLNT_CB_OFFLOAD,</div><div class='ctx'> 	NFSPROC4_CLNT_CB_SEQUENCE,</div><div class='ctx'> 	NFSPROC4_CLNT_CB_NOTIFY_LOCK,</div><div class='add'>+	NFSPROC4_CLNT_CB_RECALL_ANY,</div><div class='add'>+	NFSPROC4_CLNT_CB_GETATTR,</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> /* Returns true iff a is later than b: */</div><div class='hunk'>@@ -629,6 +775,7 @@ struct nfsd4_blocked_lock {</div><div class='ctx'> 	struct file_lock	nbl_lock;</div><div class='ctx'> 	struct knfsd_fh		nbl_fh;</div><div class='ctx'> 	struct nfsd4_callback	nbl_cb;</div><div class='add'>+	struct kref		nbl_kref;</div><div class='ctx'> };</div><div class='ctx'> </div><div class='ctx'> struct nfsd4_compound_state;</div><div class='hunk'>@@ -640,15 +787,15 @@ extern __be32 nfs4_preprocess_stateid_op(struct svc_rqst *rqstp,</div><div class='ctx'> 		stateid_t *stateid, int flags, struct nfsd_file **filp,</div><div class='ctx'> 		struct nfs4_stid **cstid);</div><div class='ctx'> __be32 nfsd4_lookup_stateid(struct nfsd4_compound_state *cstate,</div><div class='del'>-		     stateid_t *stateid, unsigned char typemask,</div><div class='del'>-		     struct nfs4_stid **s, struct nfsd_net *nn);</div><div class='add'>+			    stateid_t *stateid, unsigned short typemask,</div><div class='add'>+			    unsigned short statusmask,</div><div class='add'>+			    struct nfs4_stid **s, struct nfsd_net *nn);</div><div class='ctx'> struct nfs4_stid *nfs4_alloc_stid(struct nfs4_client *cl, struct kmem_cache *slab,</div><div class='ctx'> 				  void (*sc_free)(struct nfs4_stid *));</div><div class='ctx'> int nfs4_init_copy_state(struct nfsd_net *nn, struct nfsd4_copy *copy);</div><div class='ctx'> void nfs4_free_copy_state(struct nfsd4_copy *copy);</div><div class='ctx'> struct nfs4_cpntf_state *nfs4_alloc_init_cpntf_state(struct nfsd_net *nn,</div><div class='ctx'> 			struct nfs4_stid *p_stid);</div><div class='del'>-void nfs4_unhash_stid(struct nfs4_stid *s);</div><div class='ctx'> void nfs4_put_stid(struct nfs4_stid *s);</div><div class='ctx'> void nfs4_inc_and_copy_stateid(stateid_t *dst, struct nfs4_stid *stid);</div><div class='ctx'> void nfs4_remove_reclaim_record(struct nfs4_client_reclaim *, struct nfsd_net *);</div><div class='hunk'>@@ -659,22 +806,29 @@ extern __be32 nfs4_check_open_reclaim(struct nfs4_client *);</div><div class='ctx'> extern void nfsd4_probe_callback(struct nfs4_client *clp);</div><div class='ctx'> extern void nfsd4_probe_callback_sync(struct nfs4_client *clp);</div><div class='ctx'> extern void nfsd4_change_callback(struct nfs4_client *clp, struct nfs4_cb_conn *);</div><div class='add'>+extern void nfsd41_cb_referring_call(struct nfsd4_callback *cb,</div><div class='add'>+				     struct nfs4_sessionid *sessionid,</div><div class='add'>+				     u32 slotid, u32 seqno);</div><div class='add'>+extern void nfsd41_cb_destroy_referring_call_list(struct nfsd4_callback *cb);</div><div class='ctx'> extern void nfsd4_init_cb(struct nfsd4_callback *cb, struct nfs4_client *clp,</div><div class='ctx'> 		const struct nfsd4_callback_ops *ops, enum nfsd4_cb_op op);</div><div class='del'>-extern void nfsd4_run_cb(struct nfsd4_callback *cb);</div><div class='del'>-extern int nfsd4_create_callback_queue(void);</div><div class='del'>-extern void nfsd4_destroy_callback_queue(void);</div><div class='add'>+extern bool nfsd4_run_cb(struct nfsd4_callback *cb);</div><div class='add'>+</div><div class='add'>+static inline void nfsd4_try_run_cb(struct nfsd4_callback *cb)</div><div class='add'>+{</div><div class='add'>+	if (!test_and_set_bit(NFSD4_CALLBACK_RUNNING, &amp;cb-&gt;cb_flags))</div><div class='add'>+		WARN_ON_ONCE(!nfsd4_run_cb(cb));</div><div class='add'>+}</div><div class='add'>+</div><div class='ctx'> extern void nfsd4_shutdown_callback(struct nfs4_client *);</div><div class='ctx'> extern void nfsd4_shutdown_copy(struct nfs4_client *clp);</div><div class='del'>-extern void nfsd4_prepare_cb_recall(struct nfs4_delegation *dp);</div><div class='add'>+void nfsd4_async_copy_reaper(struct nfsd_net *nn);</div><div class='add'>+bool nfsd4_has_active_async_copies(struct nfs4_client *clp);</div><div class='ctx'> extern struct nfs4_client_reclaim *nfs4_client_to_reclaim(struct xdr_netobj name,</div><div class='ctx'> 				struct xdr_netobj princhash, struct nfsd_net *nn);</div><div class='ctx'> extern bool nfs4_has_reclaimed_state(struct xdr_netobj name, struct nfsd_net *nn);</div><div class='ctx'> </div><div class='ctx'> void put_nfs4_file(struct nfs4_file *fi);</div><div class='del'>-extern void nfs4_put_copy(struct nfsd4_copy *copy);</div><div class='del'>-extern struct nfsd4_copy *</div><div class='del'>-find_async_copy(struct nfs4_client *clp, stateid_t *staetid);</div><div class='ctx'> extern void nfs4_put_cpntf_state(struct nfsd_net *nn,</div><div class='ctx'> 				 struct nfs4_cpntf_state *cps);</div><div class='ctx'> extern __be32 manage_cpntf_state(struct nfsd_net *nn, stateid_t *st,</div><div class='hunk'>@@ -686,6 +840,14 @@ static inline void get_nfs4_file(struct nfs4_file *fi)</div><div class='ctx'> }</div><div class='ctx'> struct nfsd_file *find_any_file(struct nfs4_file *f);</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_NFSD_V4</div><div class='add'>+void nfsd4_revoke_states(struct net *net, struct super_block *sb);</div><div class='add'>+#else</div><div class='add'>+static inline void nfsd4_revoke_states(struct net *net, struct super_block *sb)</div><div class='add'>+{</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='add'>+</div><div class='ctx'> /* grace period management */</div><div class='ctx'> void nfsd4_end_grace(struct nfsd_net *nn);</div><div class='ctx'> </div><div class='hunk'>@@ -697,4 +859,17 @@ extern void nfsd4_client_record_remove(struct nfs4_client *clp);</div><div class='ctx'> extern int nfsd4_client_record_check(struct nfs4_client *clp);</div><div class='ctx'> extern void nfsd4_record_grace_done(struct nfsd_net *nn);</div><div class='ctx'> </div><div class='add'>+static inline bool try_to_expire_client(struct nfs4_client *clp)</div><div class='add'>+{</div><div class='add'>+	cmpxchg(&amp;clp-&gt;cl_state, NFSD4_COURTESY, NFSD4_EXPIRABLE);</div><div class='add'>+	return clp-&gt;cl_state == NFSD4_EXPIRABLE;</div><div class='add'>+}</div><div class='add'>+</div><div class='add'>+extern __be32 nfsd4_deleg_getattr_conflict(struct svc_rqst *rqstp,</div><div class='add'>+		struct dentry *dentry, struct nfs4_delegation **pdp);</div><div class='add'>+</div><div class='add'>+struct nfsd4_get_dir_delegation;</div><div class='add'>+struct nfs4_delegation *nfsd_get_dir_deleg(struct nfsd4_compound_state *cstate,</div><div class='add'>+						struct nfsd4_get_dir_delegation *gdd,</div><div class='add'>+						struct nfsd_file *nf);</div><div class='ctx'> #endif   /* NFSD4_STATE_H */</div><div class='head'>diff --git a/fs/nfsd/stats.c b/fs/nfsd/stats.c<br/>index 1d3b881e7382..f7eaf95e20fc 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/stats.c?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/stats.c</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/stats.c?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/stats.c</a></div><div class='hunk'>@@ -27,25 +27,22 @@</div><div class='ctx'> </div><div class='ctx'> #include "nfsd.h"</div><div class='ctx'> </div><div class='del'>-struct nfsd_stats	nfsdstats;</div><div class='del'>-struct svc_stat		nfsd_svcstats = {</div><div class='del'>-	.program	= &amp;nfsd_program,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-static int nfsd_proc_show(struct seq_file *seq, void *v)</div><div class='add'>+static int nfsd_show(struct seq_file *seq, void *v)</div><div class='ctx'> {</div><div class='add'>+	struct net *net = pde_data(file_inode(seq-&gt;file));</div><div class='add'>+	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='ctx'> 	int i;</div><div class='ctx'> </div><div class='ctx'> 	seq_printf(seq, "rc %lld %lld %lld\nfh %lld 0 0 0 0\nio %lld %lld\n",</div><div class='del'>-		   percpu_counter_sum_positive(&amp;nfsdstats.counter[NFSD_STATS_RC_HITS]),</div><div class='del'>-		   percpu_counter_sum_positive(&amp;nfsdstats.counter[NFSD_STATS_RC_MISSES]),</div><div class='del'>-		   percpu_counter_sum_positive(&amp;nfsdstats.counter[NFSD_STATS_RC_NOCACHE]),</div><div class='del'>-		   percpu_counter_sum_positive(&amp;nfsdstats.counter[NFSD_STATS_FH_STALE]),</div><div class='del'>-		   percpu_counter_sum_positive(&amp;nfsdstats.counter[NFSD_STATS_IO_READ]),</div><div class='del'>-		   percpu_counter_sum_positive(&amp;nfsdstats.counter[NFSD_STATS_IO_WRITE]));</div><div class='add'>+		   percpu_counter_sum_positive(&amp;nn-&gt;counter[NFSD_STATS_RC_HITS]),</div><div class='add'>+		   percpu_counter_sum_positive(&amp;nn-&gt;counter[NFSD_STATS_RC_MISSES]),</div><div class='add'>+		   percpu_counter_sum_positive(&amp;nn-&gt;counter[NFSD_STATS_RC_NOCACHE]),</div><div class='add'>+		   percpu_counter_sum_positive(&amp;nn-&gt;counter[NFSD_STATS_FH_STALE]),</div><div class='add'>+		   percpu_counter_sum_positive(&amp;nn-&gt;counter[NFSD_STATS_IO_READ]),</div><div class='add'>+		   percpu_counter_sum_positive(&amp;nn-&gt;counter[NFSD_STATS_IO_WRITE]));</div><div class='ctx'> </div><div class='ctx'> 	/* thread usage: */</div><div class='del'>-	seq_printf(seq, "th %u 0", nfsdstats.th_cnt);</div><div class='add'>+	seq_printf(seq, "th %u 0", atomic_read(&amp;nfsd_th_cnt));</div><div class='ctx'> </div><div class='ctx'> 	/* deprecated thread usage histogram stats */</div><div class='ctx'> 	for (i = 0; i &lt; 10; i++)</div><div class='hunk'>@@ -55,16 +52,18 @@ static int nfsd_proc_show(struct seq_file *seq, void *v)</div><div class='ctx'> 	seq_puts(seq, "\nra 0 0 0 0 0 0 0 0 0 0 0 0\n");</div><div class='ctx'> </div><div class='ctx'> 	/* show my rpc info */</div><div class='del'>-	svc_seq_show(seq, &amp;nfsd_svcstats);</div><div class='add'>+	svc_seq_show(seq, &amp;nn-&gt;nfsd_svcstats);</div><div class='ctx'> </div><div class='ctx'> #ifdef CONFIG_NFSD_V4</div><div class='ctx'> 	/* Show count for individual nfsv4 operations */</div><div class='ctx'> 	/* Writing operation numbers 0 1 2 also for maintaining uniformity */</div><div class='del'>-	seq_printf(seq,"proc4ops %u", LAST_NFS4_OP + 1);</div><div class='add'>+	seq_printf(seq, "proc4ops %u", LAST_NFS4_OP + 1);</div><div class='ctx'> 	for (i = 0; i &lt;= LAST_NFS4_OP; i++) {</div><div class='ctx'> 		seq_printf(seq, " %lld",</div><div class='del'>-			   percpu_counter_sum_positive(&amp;nfsdstats.counter[NFSD_STATS_NFS4_OP(i)]));</div><div class='add'>+			   percpu_counter_sum_positive(&amp;nn-&gt;counter[NFSD_STATS_NFS4_OP(i)]));</div><div class='ctx'> 	}</div><div class='add'>+	seq_printf(seq, "\nwdeleg_getattr %lld",</div><div class='add'>+		percpu_counter_sum_positive(&amp;nn-&gt;counter[NFSD_STATS_WDELEG_GETATTR]));</div><div class='ctx'> </div><div class='ctx'> 	seq_putc(seq, '\n');</div><div class='ctx'> #endif</div><div class='hunk'>@@ -72,75 +71,16 @@ static int nfsd_proc_show(struct seq_file *seq, void *v)</div><div class='ctx'> 	return 0;</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static int nfsd_proc_open(struct inode *inode, struct file *file)</div><div class='del'>-{</div><div class='del'>-	return single_open(file, nfsd_proc_show, NULL);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-static const struct proc_ops nfsd_proc_ops = {</div><div class='del'>-	.proc_open	= nfsd_proc_open,</div><div class='del'>-	.proc_read	= seq_read,</div><div class='del'>-	.proc_lseek	= seq_lseek,</div><div class='del'>-	.proc_release	= single_release,</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-int nfsd_percpu_counters_init(struct percpu_counter counters[], int num)</div><div class='del'>-{</div><div class='del'>-	int i, err = 0;</div><div class='del'>-</div><div class='del'>-	for (i = 0; !err &amp;&amp; i &lt; num; i++)</div><div class='del'>-		err = percpu_counter_init(&amp;counters[i], 0, GFP_KERNEL);</div><div class='del'>-</div><div class='del'>-	if (!err)</div><div class='del'>-		return 0;</div><div class='del'>-</div><div class='del'>-	for (; i &gt; 0; i--)</div><div class='del'>-		percpu_counter_destroy(&amp;counters[i-1]);</div><div class='del'>-</div><div class='del'>-	return err;</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void nfsd_percpu_counters_reset(struct percpu_counter counters[], int num)</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; num; i++)</div><div class='del'>-		percpu_counter_set(&amp;counters[i], 0);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-void nfsd_percpu_counters_destroy(struct percpu_counter counters[], int num)</div><div class='del'>-{</div><div class='del'>-	int i;</div><div class='del'>-</div><div class='del'>-	for (i = 0; i &lt; num; i++)</div><div class='del'>-		percpu_counter_destroy(&amp;counters[i]);</div><div class='del'>-}</div><div class='add'>+DEFINE_PROC_SHOW_ATTRIBUTE(nfsd);</div><div class='ctx'> </div><div class='del'>-static int nfsd_stat_counters_init(void)</div><div class='add'>+struct proc_dir_entry *nfsd_proc_stat_init(struct net *net)</div><div class='ctx'> {</div><div class='del'>-	return nfsd_percpu_counters_init(nfsdstats.counter, NFSD_STATS_COUNTERS_NUM);</div><div class='del'>-}</div><div class='add'>+	struct nfsd_net *nn = net_generic(net, nfsd_net_id);</div><div class='ctx'> </div><div class='del'>-static void nfsd_stat_counters_destroy(void)</div><div class='del'>-{</div><div class='del'>-	nfsd_percpu_counters_destroy(nfsdstats.counter, NFSD_STATS_COUNTERS_NUM);</div><div class='del'>-}</div><div class='del'>-</div><div class='del'>-int nfsd_stat_init(void)</div><div class='del'>-{</div><div class='del'>-	int err;</div><div class='del'>-</div><div class='del'>-	err = nfsd_stat_counters_init();</div><div class='del'>-	if (err)</div><div class='del'>-		return err;</div><div class='del'>-</div><div class='del'>-	svc_proc_register(&amp;init_net, &amp;nfsd_svcstats, &amp;nfsd_proc_ops);</div><div class='del'>-</div><div class='del'>-	return 0;</div><div class='add'>+	return svc_proc_register(net, &amp;nn-&gt;nfsd_svcstats, &amp;nfsd_proc_ops);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-void nfsd_stat_shutdown(void)</div><div class='add'>+void nfsd_proc_stat_shutdown(struct net *net)</div><div class='ctx'> {</div><div class='del'>-	nfsd_stat_counters_destroy();</div><div class='del'>-	svc_proc_unregister(&amp;init_net, "nfsd");</div><div class='add'>+	svc_proc_unregister(net, "nfsd");</div><div class='ctx'> }</div><div class='head'>diff --git a/fs/nfsd/stats.h b/fs/nfsd/stats.h<br/>index 51ecda852e23..e4efb0e4e56d 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/stats.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/stats.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/stats.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/stats.h</a></div><div class='hunk'>@@ -10,89 +10,67 @@</div><div class='ctx'> #include &lt;uapi/linux/nfsd/stats.h&gt;</div><div class='ctx'> #include &lt;linux/percpu_counter.h&gt;</div><div class='ctx'> </div><div class='add'>+struct proc_dir_entry *nfsd_proc_stat_init(struct net *net);</div><div class='add'>+void nfsd_proc_stat_shutdown(struct net *net);</div><div class='ctx'> </div><div class='del'>-enum {</div><div class='del'>-	NFSD_STATS_RC_HITS,		/* repcache hits */</div><div class='del'>-	NFSD_STATS_RC_MISSES,		/* repcache misses */</div><div class='del'>-	NFSD_STATS_RC_NOCACHE,		/* uncached reqs */</div><div class='del'>-	NFSD_STATS_FH_STALE,		/* FH stale error */</div><div class='del'>-	NFSD_STATS_IO_READ,		/* bytes returned to read requests */</div><div class='del'>-	NFSD_STATS_IO_WRITE,		/* bytes passed in write requests */</div><div class='del'>-#ifdef CONFIG_NFSD_V4</div><div class='del'>-	NFSD_STATS_FIRST_NFS4_OP,	/* count of individual nfsv4 operations */</div><div class='del'>-	NFSD_STATS_LAST_NFS4_OP = NFSD_STATS_FIRST_NFS4_OP + LAST_NFS4_OP,</div><div class='del'>-#define NFSD_STATS_NFS4_OP(op)	(NFSD_STATS_FIRST_NFS4_OP + (op))</div><div class='del'>-#endif</div><div class='del'>-	NFSD_STATS_COUNTERS_NUM</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-struct nfsd_stats {</div><div class='del'>-	struct percpu_counter	counter[NFSD_STATS_COUNTERS_NUM];</div><div class='del'>-</div><div class='del'>-	/* Protected by nfsd_mutex */</div><div class='del'>-	unsigned int	th_cnt;		/* number of available threads */</div><div class='del'>-};</div><div class='del'>-</div><div class='del'>-</div><div class='del'>-extern struct nfsd_stats	nfsdstats;</div><div class='del'>-</div><div class='del'>-extern struct svc_stat		nfsd_svcstats;</div><div class='del'>-</div><div class='del'>-int nfsd_percpu_counters_init(struct percpu_counter counters[], int num);</div><div class='del'>-void nfsd_percpu_counters_reset(struct percpu_counter counters[], int num);</div><div class='del'>-void nfsd_percpu_counters_destroy(struct percpu_counter counters[], int num);</div><div class='del'>-int nfsd_stat_init(void);</div><div class='del'>-void nfsd_stat_shutdown(void);</div><div class='del'>-</div><div class='del'>-static inline void nfsd_stats_rc_hits_inc(void)</div><div class='add'>+static inline void nfsd_stats_rc_hits_inc(struct nfsd_net *nn)</div><div class='ctx'> {</div><div class='del'>-	percpu_counter_inc(&amp;nfsdstats.counter[NFSD_STATS_RC_HITS]);</div><div class='add'>+	percpu_counter_inc(&amp;nn-&gt;counter[NFSD_STATS_RC_HITS]);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void nfsd_stats_rc_misses_inc(void)</div><div class='add'>+static inline void nfsd_stats_rc_misses_inc(struct nfsd_net *nn)</div><div class='ctx'> {</div><div class='del'>-	percpu_counter_inc(&amp;nfsdstats.counter[NFSD_STATS_RC_MISSES]);</div><div class='add'>+	percpu_counter_inc(&amp;nn-&gt;counter[NFSD_STATS_RC_MISSES]);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void nfsd_stats_rc_nocache_inc(void)</div><div class='add'>+static inline void nfsd_stats_rc_nocache_inc(struct nfsd_net *nn)</div><div class='ctx'> {</div><div class='del'>-	percpu_counter_inc(&amp;nfsdstats.counter[NFSD_STATS_RC_NOCACHE]);</div><div class='add'>+	percpu_counter_inc(&amp;nn-&gt;counter[NFSD_STATS_RC_NOCACHE]);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void nfsd_stats_fh_stale_inc(struct svc_export *exp)</div><div class='add'>+static inline void nfsd_stats_fh_stale_inc(struct nfsd_net *nn,</div><div class='add'>+					   struct svc_export *exp)</div><div class='ctx'> {</div><div class='del'>-	percpu_counter_inc(&amp;nfsdstats.counter[NFSD_STATS_FH_STALE]);</div><div class='del'>-	if (exp)</div><div class='del'>-		percpu_counter_inc(&amp;exp-&gt;ex_stats.counter[EXP_STATS_FH_STALE]);</div><div class='add'>+	percpu_counter_inc(&amp;nn-&gt;counter[NFSD_STATS_FH_STALE]);</div><div class='add'>+	if (exp &amp;&amp; exp-&gt;ex_stats)</div><div class='add'>+		percpu_counter_inc(&amp;exp-&gt;ex_stats-&gt;counter[EXP_STATS_FH_STALE]);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void nfsd_stats_io_read_add(struct svc_export *exp, s64 amount)</div><div class='add'>+static inline void nfsd_stats_io_read_add(struct nfsd_net *nn,</div><div class='add'>+					  struct svc_export *exp, s64 amount)</div><div class='ctx'> {</div><div class='del'>-	percpu_counter_add(&amp;nfsdstats.counter[NFSD_STATS_IO_READ], amount);</div><div class='del'>-	if (exp)</div><div class='del'>-		percpu_counter_add(&amp;exp-&gt;ex_stats.counter[EXP_STATS_IO_READ], amount);</div><div class='add'>+	percpu_counter_add(&amp;nn-&gt;counter[NFSD_STATS_IO_READ], amount);</div><div class='add'>+	if (exp &amp;&amp; exp-&gt;ex_stats)</div><div class='add'>+		percpu_counter_add(&amp;exp-&gt;ex_stats-&gt;counter[EXP_STATS_IO_READ], amount);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='del'>-static inline void nfsd_stats_io_write_add(struct svc_export *exp, s64 amount)</div><div class='add'>+static inline void nfsd_stats_io_write_add(struct nfsd_net *nn,</div><div class='add'>+					   struct svc_export *exp, s64 amount)</div><div class='ctx'> {</div><div class='del'>-	percpu_counter_add(&amp;nfsdstats.counter[NFSD_STATS_IO_WRITE], amount);</div><div class='del'>-	if (exp)</div><div class='del'>-		percpu_counter_add(&amp;exp-&gt;ex_stats.counter[EXP_STATS_IO_WRITE], amount);</div><div class='add'>+	percpu_counter_add(&amp;nn-&gt;counter[NFSD_STATS_IO_WRITE], amount);</div><div class='add'>+	if (exp &amp;&amp; exp-&gt;ex_stats)</div><div class='add'>+		percpu_counter_add(&amp;exp-&gt;ex_stats-&gt;counter[EXP_STATS_IO_WRITE], amount);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void nfsd_stats_payload_misses_inc(struct nfsd_net *nn)</div><div class='ctx'> {</div><div class='del'>-	percpu_counter_inc(&amp;nn-&gt;counter[NFSD_NET_PAYLOAD_MISSES]);</div><div class='add'>+	percpu_counter_inc(&amp;nn-&gt;counter[NFSD_STATS_PAYLOAD_MISSES]);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void nfsd_stats_drc_mem_usage_add(struct nfsd_net *nn, s64 amount)</div><div class='ctx'> {</div><div class='del'>-	percpu_counter_add(&amp;nn-&gt;counter[NFSD_NET_DRC_MEM_USAGE], amount);</div><div class='add'>+	percpu_counter_add(&amp;nn-&gt;counter[NFSD_STATS_DRC_MEM_USAGE], amount);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='ctx'> static inline void nfsd_stats_drc_mem_usage_sub(struct nfsd_net *nn, s64 amount)</div><div class='ctx'> {</div><div class='del'>-	percpu_counter_sub(&amp;nn-&gt;counter[NFSD_NET_DRC_MEM_USAGE], amount);</div><div class='add'>+	percpu_counter_sub(&amp;nn-&gt;counter[NFSD_STATS_DRC_MEM_USAGE], amount);</div><div class='ctx'> }</div><div class='ctx'> </div><div class='add'>+#ifdef CONFIG_NFSD_V4</div><div class='add'>+static inline void nfsd_stats_wdeleg_getattr_inc(struct nfsd_net *nn)</div><div class='add'>+{</div><div class='add'>+	percpu_counter_inc(&amp;nn-&gt;counter[NFSD_STATS_WDELEG_GETATTR]);</div><div class='add'>+}</div><div class='add'>+#endif</div><div class='ctx'> #endif /* _NFSD_STATS_H */</div><div class='head'>diff --git a/fs/nfsd/trace.h b/fs/nfsd/trace.h<br/>index f1e0d3c51bc2..5ae2a611e57f 100644<br/>--- a/<a href='/cgit/linux-arm.git/tree/fs/nfsd/trace.h?id=5664896ba29e6d8c60b6a73564d0a97d380c0f92'>fs/nfsd/trace.h</a><br/>+++ b/<a href='/cgit/linux-arm.git/tree/fs/nfsd/trace.h?id=c9b47175e9131118e6f221cc8fb81397d62e7c91'>fs/nfsd/trace.h</a></div><div class='hunk'>@@ -9,87 +9,87 @@</div><div class='ctx'> #define _NFSD_TRACE_H</div><div class='ctx'> </div><div class='ctx'> #include &lt;linux/tracepoint.h&gt;</div><div class='add'>+#include &lt;linux/sunrpc/clnt.h&gt;</div><div class='add'>+#include &lt;linux/sunrpc/xprt.h&gt;</div><div class='add'>+#include &lt;trace/misc/fs.h&gt;</div><div class='add'>+#include &lt;trace/misc/nfs.h&gt;</div><div class='add'>+#include &lt;trace/misc/sunrpc.h&gt;</div><div class='ctx'> </div><div class='ctx'> #include "export.h"</div><div class='ctx'> #include "nfsfh.h"</div><div class='add'>+#include "xdr4.h"</div><div class='ctx'> </div><div class='del'>-#define NFSD_TRACE_PROC_ARG_FIELDS \</div><div class='add'>+#define NFSD_TRACE_PROC_CALL_FIELDS(r) \</div><div class='ctx'> 		__field(unsigned int, netns_ino) \</div><div class='ctx'> 		__field(u32, xid) \</div><div class='del'>-		__array(unsigned char, server, sizeof(struct sockaddr_in6)) \</div><div class='del'>-		__array(unsigned char, client, sizeof(struct sockaddr_in6))</div><div class='add'>+		__sockaddr(server, (r)-&gt;rq_xprt-&gt;xpt_locallen) \</div><div class='add'>+		__sockaddr(client, (r)-&gt;rq_xprt-&gt;xpt_remotelen)</div><div class='ctx'> </div><div class='del'>-#define NFSD_TRACE_PROC_ARG_ASSIGNMENTS \</div><div class='add'>+#define NFSD_TRACE_PROC_CALL_ASSIGNMENTS(r) \</div><div class='ctx'> 		do { \</div><div class='del'>-			__entry-&gt;netns_ino = SVC_NET(rqstp)-&gt;ns.inum; \</div><div class='del'>-			__entry-&gt;xid = be32_to_cpu(rqstp-&gt;rq_xid); \</div><div class='del'>-			memcpy(__entry-&gt;server, &amp;rqstp-&gt;rq_xprt-&gt;xpt_local, \</div><div class='del'>-			       rqstp-&gt;rq_xprt-&gt;xpt_locallen); \</div><div class='del'>-			memcpy(__entry-&gt;client, &amp;rqstp-&gt;rq_xprt-&gt;xpt_remote, \</div><div class='del'>-			       rqstp-&gt;rq_xprt-&gt;xpt_remotelen); \</div><div class='del'>-		} while (0);</div><div class='del'>-</div><div class='del'>-#define NFSD_TRACE_PROC_RES_FIELDS \</div><div class='add'>+			struct svc_xprt *xprt = (r)-&gt;rq_xprt; \</div><div class='add'>+			__entry-&gt;netns_ino = SVC_NET(r)-&gt;ns.inum; \</div><div class='add'>+			__entry-&gt;xid = be32_to_cpu((r)-&gt;rq_xid); \</div><div class='add'>+			__assign_sockaddr(server, &amp;xprt-&gt;xpt_local, \</div><div class='add'>+					  xprt-&gt;xpt_locallen); \</div><div class='add'>+			__assign_sockaddr(client, &amp;xprt-&gt;xpt_remote, \</div><div class='add'>+					  xprt-&gt;xpt_remotelen); \</div><div class='add'>+		} while (0)</div><div class='add'>+</div><div class='add'>+#define NFSD_TRACE_PROC_RES_FIELDS(r) \</div><div class='ctx'> 		__field(unsigned int, netns_ino) \</div><div class='ctx'> 		__field(u32, xid) \</div><div class='ctx'> 		__field(unsigned long, status) \</div><div class='del'>-		__array(unsigned char, server, sizeof(struct sockaddr_in6)) \</div><div class='del'>-		__array(unsigned char, client, sizeof(struct sockaddr_in6))</div><div class='add'>+		__sockaddr(server, (r)-&gt;rq_xprt-&gt;xpt_locallen) \</div><div class='add'>+		__sockaddr(client, (r)-&gt;rq_xprt-&gt;xpt_remotelen)</div><div class='ctx'> </div><div class='del'>-#define NFSD_TRACE_PROC_RES_ASSIGNMENTS(error) \</div><div class='add'>+#define NFSD_TRACE_PROC_RES_ASSIGNMENTS(r, error) \</div><div class='ctx'> 		do { \</div><div class='del'>-			__entry-&gt;netns_ino = SVC_NET(rqstp)-&gt;ns.inum; \</div><div class='del'>-			__entry-&gt;xid = be32_to_cpu(rqstp-&gt;rq_xid); \</div><div class='add'>+			struct svc_xprt *xprt = (r)-&gt;rq_xprt; \</div><div class='add'>+			__entry-&gt;netns_ino = SVC_NET(r)-&gt;ns.inum; \</div><div class='add'>+			__entry-&gt;xid = be32_to_cpu((r)-&gt;rq_xid); \</div><div class='ctx'> 			__entry-&gt;status = be32_to_cpu(error); \</div><div class='del'>-			memcpy(__entry-&gt;server, &amp;rqstp-&gt;rq_xprt-&gt;xpt_local, \</div><div class='del'>-			       rqstp-&gt;rq_xprt-&gt;xpt_locallen); \</div><div class='del'>-			memcpy(__entry-&gt;client, &amp;rqstp-&gt;rq_xprt-&gt;xpt_remote, \</div><div class='del'>-			       rqstp-&gt;rq_xprt-&gt;xpt_remotelen); \</div><div class='add'>+			__assign_sockaddr(server, &amp;xprt-&gt;xpt_local, \</div><div class='add'>+					  xprt-&gt;xpt_locallen); \</div><div class='add'>+			__assign_sockaddr(client, &amp;xprt-&gt;xpt_remote, \</div><div class='add'>+					  xprt-&gt;xpt_remotelen); \</div><div class='ctx'> 		} while (0);</div><div class='ctx'> </div><div class='del'>-TRACE_EVENT(nfsd_garbage_args_err,</div><div class='add'>+DECLARE_EVENT_CLASS(nfsd_xdr_err_class,</div><div class='ctx'> 	TP_PROTO(</div><div class='ctx'> 		const struct svc_rqst *rqstp</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_ARGS(rqstp),</div><div class='ctx'> 	TP_STRUCT__entry(</div><div class='del'>-		NFSD_TRACE_PROC_ARG_FIELDS</div><div class='del'>-</div><div class='add'>+		__field(unsigned int, netns_ino)</div><div class='add'>+		__field(u32, xid)</div><div class='ctx'> 		__field(u32, vers)</div><div class='ctx'> 		__field(u32, proc)</div><div class='add'>+		__sockaddr(server, rqstp-&gt;rq_xprt-&gt;xpt_locallen)</div><div class='add'>+		__sockaddr(client, rqstp-&gt;rq_xprt-&gt;xpt_remotelen)</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_fast_assign(</div><div class='del'>-		NFSD_TRACE_PROC_ARG_ASSIGNMENTS</div><div class='add'>+		const struct svc_xprt *xprt = rqstp-&gt;rq_xprt;</div><div class='ctx'> </div><div class='add'>+		__entry-&gt;netns_ino = xprt-&gt;xpt_net-&gt;ns.inum;</div><div class='add'>+		__entry-&gt;xid = be32_to_cpu(rqstp-&gt;rq_xid);</div><div class='ctx'> 		__entry-&gt;vers = rqstp-&gt;rq_vers;</div><div class='ctx'> 		__entry-&gt;proc = rqstp-&gt;rq_proc;</div><div class='add'>+		__assign_sockaddr(server, &amp;xprt-&gt;xpt_local, xprt-&gt;xpt_locallen);</div><div class='add'>+		__assign_sockaddr(client, &amp;xprt-&gt;xpt_remote, xprt-&gt;xpt_remotelen);</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_printk("xid=0x%08x vers=%u proc=%u",</div><div class='ctx'> 		__entry-&gt;xid, __entry-&gt;vers, __entry-&gt;proc</div><div class='ctx'> 	)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='del'>-TRACE_EVENT(nfsd_cant_encode_err,</div><div class='del'>-	TP_PROTO(</div><div class='del'>-		const struct svc_rqst *rqstp</div><div class='del'>-	),</div><div class='del'>-	TP_ARGS(rqstp),</div><div class='del'>-	TP_STRUCT__entry(</div><div class='del'>-		NFSD_TRACE_PROC_ARG_FIELDS</div><div class='add'>+#define DEFINE_NFSD_XDR_ERR_EVENT(name) \</div><div class='add'>+DEFINE_EVENT(nfsd_xdr_err_class, nfsd_##name##_err, \</div><div class='add'>+	TP_PROTO(const struct svc_rqst *rqstp), \</div><div class='add'>+	TP_ARGS(rqstp))</div><div class='ctx'> </div><div class='del'>-		__field(u32, vers)</div><div class='del'>-		__field(u32, proc)</div><div class='del'>-	),</div><div class='del'>-	TP_fast_assign(</div><div class='del'>-		NFSD_TRACE_PROC_ARG_ASSIGNMENTS</div><div class='del'>-</div><div class='del'>-		__entry-&gt;vers = rqstp-&gt;rq_vers;</div><div class='del'>-		__entry-&gt;proc = rqstp-&gt;rq_proc;</div><div class='del'>-	),</div><div class='del'>-	TP_printk("xid=0x%08x vers=%u proc=%u",</div><div class='del'>-		__entry-&gt;xid, __entry-&gt;vers, __entry-&gt;proc</div><div class='del'>-	)</div><div class='del'>-);</div><div class='add'>+DEFINE_NFSD_XDR_ERR_EVENT(garbage_args);</div><div class='add'>+DEFINE_NFSD_XDR_ERR_EVENT(cant_encode);</div><div class='ctx'> </div><div class='ctx'> #define show_nfsd_may_flags(x)						\</div><div class='ctx'> 	__print_flags(x, "|",						\</div><div class='hunk'>@@ -98,29 +98,37 @@ TRACE_EVENT(nfsd_cant_encode_err,</div><div class='ctx'> 		{ NFSD_MAY_READ,		"READ" },		\</div><div class='ctx'> 		{ NFSD_MAY_SATTR,		"SATTR" },		\</div><div class='ctx'> 		{ NFSD_MAY_TRUNC,		"TRUNC" },		\</div><div class='del'>-		{ NFSD_MAY_LOCK,		"LOCK" },		\</div><div class='add'>+		{ NFSD_MAY_NLM,			"NLM" },		\</div><div class='ctx'> 		{ NFSD_MAY_OWNER_OVERRIDE,	"OWNER_OVERRIDE" },	\</div><div class='ctx'> 		{ NFSD_MAY_LOCAL_ACCESS,	"LOCAL_ACCESS" },	\</div><div class='ctx'> 		{ NFSD_MAY_BYPASS_GSS_ON_ROOT,	"BYPASS_GSS_ON_ROOT" },	\</div><div class='ctx'> 		{ NFSD_MAY_NOT_BREAK_LEASE,	"NOT_BREAK_LEASE" },	\</div><div class='ctx'> 		{ NFSD_MAY_BYPASS_GSS,		"BYPASS_GSS" },		\</div><div class='ctx'> 		{ NFSD_MAY_READ_IF_EXEC,	"READ_IF_EXEC" },	\</div><div class='del'>-		{ NFSD_MAY_64BIT_COOKIE,	"64BIT_COOKIE" })</div><div class='add'>+		{ NFSD_MAY_64BIT_COOKIE,	"64BIT_COOKIE" },	\</div><div class='add'>+		{ NFSD_MAY_LOCALIO,		"LOCALIO" })</div><div class='ctx'> </div><div class='ctx'> TRACE_EVENT(nfsd_compound,</div><div class='del'>-	TP_PROTO(const struct svc_rqst *rqst,</div><div class='del'>-		 u32 args_opcnt),</div><div class='del'>-	TP_ARGS(rqst, args_opcnt),</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct svc_rqst *rqst,</div><div class='add'>+		const char *tag,</div><div class='add'>+		u32 taglen,</div><div class='add'>+		u32 opcnt</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(rqst, tag, taglen, opcnt),</div><div class='ctx'> 	TP_STRUCT__entry(</div><div class='ctx'> 		__field(u32, xid)</div><div class='del'>-		__field(u32, args_opcnt)</div><div class='add'>+		__field(u32, opcnt)</div><div class='add'>+		__string_len(tag, tag, taglen)</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_fast_assign(</div><div class='ctx'> 		__entry-&gt;xid = be32_to_cpu(rqst-&gt;rq_xid);</div><div class='del'>-		__entry-&gt;args_opcnt = args_opcnt;</div><div class='add'>+		__entry-&gt;opcnt = opcnt;</div><div class='add'>+		__assign_str(tag);</div><div class='ctx'> 	),</div><div class='del'>-	TP_printk("xid=0x%08x opcnt=%u",</div><div class='del'>-		__entry-&gt;xid, __entry-&gt;args_opcnt)</div><div class='add'>+	TP_printk("xid=0x%08x opcnt=%u tag=%s",</div><div class='add'>+		__entry-&gt;xid, __entry-&gt;opcnt, __get_str(tag)</div><div class='add'>+	)</div><div class='ctx'> )</div><div class='ctx'> </div><div class='ctx'> TRACE_EVENT(nfsd_compound_status,</div><div class='hunk'>@@ -139,7 +147,7 @@ TRACE_EVENT(nfsd_compound_status,</div><div class='ctx'> 		__entry-&gt;args_opcnt = args_opcnt;</div><div class='ctx'> 		__entry-&gt;resp_opcnt = resp_opcnt;</div><div class='ctx'> 		__entry-&gt;status = be32_to_cpu(status);</div><div class='del'>-		__assign_str(name, name);</div><div class='add'>+		__assign_str(name);</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_printk("op=%u/%u %s status=%d",</div><div class='ctx'> 		__entry-&gt;resp_opcnt, __entry-&gt;args_opcnt,</div><div class='hunk'>@@ -156,14 +164,14 @@ TRACE_EVENT(nfsd_compound_decode_err,</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_ARGS(rqstp, args_opcnt, resp_opcnt, opnum, status),</div><div class='ctx'> 	TP_STRUCT__entry(</div><div class='del'>-		NFSD_TRACE_PROC_RES_FIELDS</div><div class='add'>+		NFSD_TRACE_PROC_RES_FIELDS(rqstp)</div><div class='ctx'> </div><div class='ctx'> 		__field(u32, args_opcnt)</div><div class='ctx'> 		__field(u32, resp_opcnt)</div><div class='ctx'> 		__field(u32, opnum)</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_fast_assign(</div><div class='del'>-		NFSD_TRACE_PROC_RES_ASSIGNMENTS(status)</div><div class='add'>+		NFSD_TRACE_PROC_RES_ASSIGNMENTS(rqstp, status)</div><div class='ctx'> </div><div class='ctx'> 		__entry-&gt;args_opcnt = args_opcnt;</div><div class='ctx'> 		__entry-&gt;resp_opcnt = resp_opcnt;</div><div class='hunk'>@@ -174,7 +182,7 @@ TRACE_EVENT(nfsd_compound_decode_err,</div><div class='ctx'> 		__entry-&gt;opnum, __entry-&gt;status)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='del'>-TRACE_EVENT(nfsd_compound_encode_err,</div><div class='add'>+DECLARE_EVENT_CLASS(nfsd_compound_err_class,</div><div class='ctx'> 	TP_PROTO(</div><div class='ctx'> 		const struct svc_rqst *rqstp,</div><div class='ctx'> 		u32 opnum,</div><div class='hunk'>@@ -182,12 +190,12 @@ TRACE_EVENT(nfsd_compound_encode_err,</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_ARGS(rqstp, opnum, status),</div><div class='ctx'> 	TP_STRUCT__entry(</div><div class='del'>-		NFSD_TRACE_PROC_RES_FIELDS</div><div class='add'>+		NFSD_TRACE_PROC_RES_FIELDS(rqstp)</div><div class='ctx'> </div><div class='ctx'> 		__field(u32, opnum)</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_fast_assign(</div><div class='del'>-		NFSD_TRACE_PROC_RES_ASSIGNMENTS(status)</div><div class='add'>+		NFSD_TRACE_PROC_RES_ASSIGNMENTS(rqstp, status)</div><div class='ctx'> </div><div class='ctx'> 		__entry-&gt;opnum = opnum;</div><div class='ctx'> 	),</div><div class='hunk'>@@ -195,6 +203,110 @@ TRACE_EVENT(nfsd_compound_encode_err,</div><div class='ctx'> 		__entry-&gt;opnum, __entry-&gt;status)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='add'>+#define DEFINE_NFSD_COMPOUND_ERR_EVENT(name)				\</div><div class='add'>+DEFINE_EVENT(nfsd_compound_err_class, nfsd_compound_##name##_err,	\</div><div class='add'>+	TP_PROTO(							\</div><div class='add'>+		const struct svc_rqst *rqstp,				\</div><div class='add'>+		u32 opnum,						\</div><div class='add'>+		__be32 status						\</div><div class='add'>+	),								\</div><div class='add'>+	TP_ARGS(rqstp, opnum, status))</div><div class='add'>+</div><div class='add'>+DEFINE_NFSD_COMPOUND_ERR_EVENT(op);</div><div class='add'>+DEFINE_NFSD_COMPOUND_ERR_EVENT(encode);</div><div class='add'>+</div><div class='add'>+#define show_fs_file_type(x) \</div><div class='add'>+	__print_symbolic(x, \</div><div class='add'>+		{ S_IFLNK,		"LNK" }, \</div><div class='add'>+		{ S_IFREG,		"REG" }, \</div><div class='add'>+		{ S_IFDIR,		"DIR" }, \</div><div class='add'>+		{ S_IFCHR,		"CHR" }, \</div><div class='add'>+		{ S_IFBLK,		"BLK" }, \</div><div class='add'>+		{ S_IFIFO,		"FIFO" }, \</div><div class='add'>+		{ S_IFSOCK,		"SOCK" })</div><div class='add'>+</div><div class='add'>+TRACE_EVENT_CONDITION(nfsd_fh_verify,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct svc_rqst *rqstp,</div><div class='add'>+		const struct svc_fh *fhp,</div><div class='add'>+		umode_t type,</div><div class='add'>+		int access</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(rqstp, fhp, type, access),</div><div class='add'>+	TP_CONDITION(rqstp != NULL),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(unsigned int, netns_ino)</div><div class='add'>+		__sockaddr(server, rqstp-&gt;rq_xprt-&gt;xpt_remotelen)</div><div class='add'>+		__sockaddr(client, rqstp-&gt;rq_xprt-&gt;xpt_remotelen)</div><div class='add'>+		__field(u32, xid)</div><div class='add'>+		__field(u32, fh_hash)</div><div class='add'>+		__field(const void *, inode)</div><div class='add'>+		__field(unsigned long, type)</div><div class='add'>+		__field(unsigned long, access)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;netns_ino = SVC_NET(rqstp)-&gt;ns.inum;</div><div class='add'>+		__assign_sockaddr(server, &amp;rqstp-&gt;rq_xprt-&gt;xpt_local,</div><div class='add'>+		       rqstp-&gt;rq_xprt-&gt;xpt_locallen);</div><div class='add'>+		__assign_sockaddr(client, &amp;rqstp-&gt;rq_xprt-&gt;xpt_remote,</div><div class='add'>+				  rqstp-&gt;rq_xprt-&gt;xpt_remotelen);</div><div class='add'>+		__entry-&gt;xid = be32_to_cpu(rqstp-&gt;rq_xid);</div><div class='add'>+		__entry-&gt;fh_hash = knfsd_fh_hash(&amp;fhp-&gt;fh_handle);</div><div class='add'>+		__entry-&gt;inode = d_inode(fhp-&gt;fh_dentry);</div><div class='add'>+		__entry-&gt;type = type;</div><div class='add'>+		__entry-&gt;access = access;</div><div class='add'>+	),</div><div class='add'>+	TP_printk("xid=0x%08x fh_hash=0x%08x type=%s access=%s",</div><div class='add'>+		__entry-&gt;xid, __entry-&gt;fh_hash,</div><div class='add'>+		show_fs_file_type(__entry-&gt;type),</div><div class='add'>+		show_nfsd_may_flags(__entry-&gt;access)</div><div class='add'>+	)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+TRACE_EVENT_CONDITION(nfsd_fh_verify_err,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct svc_rqst *rqstp,</div><div class='add'>+		const struct svc_fh *fhp,</div><div class='add'>+		umode_t type,</div><div class='add'>+		int access,</div><div class='add'>+		__be32 error</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(rqstp, fhp, type, access, error),</div><div class='add'>+	TP_CONDITION(rqstp != NULL &amp;&amp; error),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(unsigned int, netns_ino)</div><div class='add'>+		__sockaddr(server, rqstp-&gt;rq_xprt-&gt;xpt_remotelen)</div><div class='add'>+		__sockaddr(client, rqstp-&gt;rq_xprt-&gt;xpt_remotelen)</div><div class='add'>+		__field(u32, xid)</div><div class='add'>+		__field(u32, fh_hash)</div><div class='add'>+		__field(const void *, inode)</div><div class='add'>+		__field(unsigned long, type)</div><div class='add'>+		__field(unsigned long, access)</div><div class='add'>+		__field(int, error)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;netns_ino = SVC_NET(rqstp)-&gt;ns.inum;</div><div class='add'>+		__assign_sockaddr(server, &amp;rqstp-&gt;rq_xprt-&gt;xpt_local,</div><div class='add'>+		       rqstp-&gt;rq_xprt-&gt;xpt_locallen);</div><div class='add'>+		__assign_sockaddr(client, &amp;rqstp-&gt;rq_xprt-&gt;xpt_remote,</div><div class='add'>+				  rqstp-&gt;rq_xprt-&gt;xpt_remotelen);</div><div class='add'>+		__entry-&gt;xid = be32_to_cpu(rqstp-&gt;rq_xid);</div><div class='add'>+		__entry-&gt;fh_hash = knfsd_fh_hash(&amp;fhp-&gt;fh_handle);</div><div class='add'>+		if (fhp-&gt;fh_dentry)</div><div class='add'>+			__entry-&gt;inode = d_inode(fhp-&gt;fh_dentry);</div><div class='add'>+		else</div><div class='add'>+			__entry-&gt;inode = NULL;</div><div class='add'>+		__entry-&gt;type = type;</div><div class='add'>+		__entry-&gt;access = access;</div><div class='add'>+		__entry-&gt;error = be32_to_cpu(error);</div><div class='add'>+	),</div><div class='add'>+	TP_printk("xid=0x%08x fh_hash=0x%08x type=%s access=%s error=%d",</div><div class='add'>+		__entry-&gt;xid, __entry-&gt;fh_hash,</div><div class='add'>+		show_fs_file_type(__entry-&gt;type),</div><div class='add'>+		show_nfsd_may_flags(__entry-&gt;access),</div><div class='add'>+		__entry-&gt;error</div><div class='add'>+	)</div><div class='add'>+);</div><div class='ctx'> </div><div class='ctx'> DECLARE_EVENT_CLASS(nfsd_fh_err_class,</div><div class='ctx'> 	TP_PROTO(struct svc_rqst *rqstp,</div><div class='hunk'>@@ -216,12 +328,13 @@ DECLARE_EVENT_CLASS(nfsd_fh_err_class,</div><div class='ctx'> 		  __entry-&gt;status)</div><div class='ctx'> )</div><div class='ctx'> </div><div class='del'>-#define DEFINE_NFSD_FH_ERR_EVENT(name)		\</div><div class='del'>-DEFINE_EVENT(nfsd_fh_err_class, nfsd_##name,	\</div><div class='del'>-	TP_PROTO(struct svc_rqst *rqstp,	\</div><div class='del'>-		 struct svc_fh	*fhp,		\</div><div class='del'>-		 int		status),	\</div><div class='del'>-	TP_ARGS(rqstp, fhp, status))</div><div class='add'>+#define DEFINE_NFSD_FH_ERR_EVENT(name)			\</div><div class='add'>+DEFINE_EVENT_CONDITION(nfsd_fh_err_class, nfsd_##name,	\</div><div class='add'>+	TP_PROTO(struct svc_rqst *rqstp,		\</div><div class='add'>+		 struct svc_fh	*fhp,			\</div><div class='add'>+		 int		status),		\</div><div class='add'>+	TP_ARGS(rqstp, fhp, status),			\</div><div class='add'>+	TP_CONDITION(rqstp != NULL))</div><div class='ctx'> </div><div class='ctx'> DEFINE_NFSD_FH_ERR_EVENT(set_fh_dentry_badexport);</div><div class='ctx'> DEFINE_NFSD_FH_ERR_EVENT(set_fh_dentry_badhandle);</div><div class='hunk'>@@ -231,7 +344,7 @@ TRACE_EVENT(nfsd_exp_find_key,</div><div class='ctx'> 		 int status),</div><div class='ctx'> 	TP_ARGS(key, status),</div><div class='ctx'> 	TP_STRUCT__entry(</div><div class='del'>-		__field(int, fsidtype)</div><div class='add'>+		__field(u8, fsidtype)</div><div class='ctx'> 		__array(u32, fsid, 6)</div><div class='ctx'> 		__string(auth_domain, key-&gt;ek_client-&gt;name)</div><div class='ctx'> 		__field(int, status)</div><div class='hunk'>@@ -239,7 +352,7 @@ TRACE_EVENT(nfsd_exp_find_key,</div><div class='ctx'> 	TP_fast_assign(</div><div class='ctx'> 		__entry-&gt;fsidtype = key-&gt;ek_fsidtype;</div><div class='ctx'> 		memcpy(__entry-&gt;fsid, key-&gt;ek_fsid, 4*6);</div><div class='del'>-		__assign_str(auth_domain, key-&gt;ek_client-&gt;name);</div><div class='add'>+		__assign_str(auth_domain);</div><div class='ctx'> 		__entry-&gt;status = status;</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_printk("fsid=%x::%s domain=%s status=%d",</div><div class='hunk'>@@ -254,7 +367,7 @@ TRACE_EVENT(nfsd_expkey_update,</div><div class='ctx'> 	TP_PROTO(const struct svc_expkey *key, const char *exp_path),</div><div class='ctx'> 	TP_ARGS(key, exp_path),</div><div class='ctx'> 	TP_STRUCT__entry(</div><div class='del'>-		__field(int, fsidtype)</div><div class='add'>+		__field(u8, fsidtype)</div><div class='ctx'> 		__array(u32, fsid, 6)</div><div class='ctx'> 		__string(auth_domain, key-&gt;ek_client-&gt;name)</div><div class='ctx'> 		__string(path, exp_path)</div><div class='hunk'>@@ -263,8 +376,8 @@ TRACE_EVENT(nfsd_expkey_update,</div><div class='ctx'> 	TP_fast_assign(</div><div class='ctx'> 		__entry-&gt;fsidtype = key-&gt;ek_fsidtype;</div><div class='ctx'> 		memcpy(__entry-&gt;fsid, key-&gt;ek_fsid, 4*6);</div><div class='del'>-		__assign_str(auth_domain, key-&gt;ek_client-&gt;name);</div><div class='del'>-		__assign_str(path, exp_path);</div><div class='add'>+		__assign_str(auth_domain);</div><div class='add'>+		__assign_str(path);</div><div class='ctx'> 		__entry-&gt;cache = !test_bit(CACHE_NEGATIVE, &amp;key-&gt;h.flags);</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_printk("fsid=%x::%s domain=%s path=%s cache=%s",</div><div class='hunk'>@@ -286,8 +399,8 @@ TRACE_EVENT(nfsd_exp_get_by_name,</div><div class='ctx'> 		__field(int, status)</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_fast_assign(</div><div class='del'>-		__assign_str(path, key-&gt;ex_path.dentry-&gt;d_name.name);</div><div class='del'>-		__assign_str(auth_domain, key-&gt;ex_client-&gt;name);</div><div class='add'>+		__assign_str(path);</div><div class='add'>+		__assign_str(auth_domain);</div><div class='ctx'> 		__entry-&gt;status = status;</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_printk("path=%s domain=%s status=%d",</div><div class='hunk'>@@ -306,8 +419,8 @@ TRACE_EVENT(nfsd_export_update,</div><div class='ctx'> 		__field(bool, cache)</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_fast_assign(</div><div class='del'>-		__assign_str(path, key-&gt;ex_path.dentry-&gt;d_name.name);</div><div class='del'>-		__assign_str(auth_domain, key-&gt;ex_client-&gt;name);</div><div class='add'>+		__assign_str(path);</div><div class='add'>+		__assign_str(auth_domain);</div><div class='ctx'> 		__entry-&gt;cache = !test_bit(CACHE_NEGATIVE, &amp;key-&gt;h.flags);</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_printk("path=%s domain=%s cache=%s",</div><div class='hunk'>@@ -320,14 +433,14 @@ TRACE_EVENT(nfsd_export_update,</div><div class='ctx'> DECLARE_EVENT_CLASS(nfsd_io_class,</div><div class='ctx'> 	TP_PROTO(struct svc_rqst *rqstp,</div><div class='ctx'> 		 struct svc_fh	*fhp,</div><div class='del'>-		 loff_t		offset,</div><div class='del'>-		 unsigned long	len),</div><div class='add'>+		 u64		offset,</div><div class='add'>+		 u32		len),</div><div class='ctx'> 	TP_ARGS(rqstp, fhp, offset, len),</div><div class='ctx'> 	TP_STRUCT__entry(</div><div class='ctx'> 		__field(u32, xid)</div><div class='ctx'> 		__field(u32, fh_hash)</div><div class='del'>-		__field(loff_t, offset)</div><div class='del'>-		__field(unsigned long, len)</div><div class='add'>+		__field(u64, offset)</div><div class='add'>+		__field(u32, len)</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_fast_assign(</div><div class='ctx'> 		__entry-&gt;xid = be32_to_cpu(rqstp-&gt;rq_xid);</div><div class='hunk'>@@ -335,7 +448,7 @@ DECLARE_EVENT_CLASS(nfsd_io_class,</div><div class='ctx'> 		__entry-&gt;offset = offset;</div><div class='ctx'> 		__entry-&gt;len = len;</div><div class='ctx'> 	),</div><div class='del'>-	TP_printk("xid=0x%08x fh_hash=0x%08x offset=%lld len=%lu",</div><div class='add'>+	TP_printk("xid=0x%08x fh_hash=0x%08x offset=%llu len=%u",</div><div class='ctx'> 		  __entry-&gt;xid, __entry-&gt;fh_hash,</div><div class='ctx'> 		  __entry-&gt;offset, __entry-&gt;len)</div><div class='ctx'> )</div><div class='hunk'>@@ -344,19 +457,24 @@ DECLARE_EVENT_CLASS(nfsd_io_class,</div><div class='ctx'> DEFINE_EVENT(nfsd_io_class, nfsd_##name,	\</div><div class='ctx'> 	TP_PROTO(struct svc_rqst *rqstp,	\</div><div class='ctx'> 		 struct svc_fh	*fhp,		\</div><div class='del'>-		 loff_t		offset,		\</div><div class='del'>-		 unsigned long	len),		\</div><div class='add'>+		 u64		offset,		\</div><div class='add'>+		 u32		len),		\</div><div class='ctx'> 	TP_ARGS(rqstp, fhp, offset, len))</div><div class='ctx'> </div><div class='ctx'> DEFINE_NFSD_IO_EVENT(read_start);</div><div class='ctx'> DEFINE_NFSD_IO_EVENT(read_splice);</div><div class='ctx'> DEFINE_NFSD_IO_EVENT(read_vector);</div><div class='add'>+DEFINE_NFSD_IO_EVENT(read_direct);</div><div class='ctx'> DEFINE_NFSD_IO_EVENT(read_io_done);</div><div class='ctx'> DEFINE_NFSD_IO_EVENT(read_done);</div><div class='ctx'> DEFINE_NFSD_IO_EVENT(write_start);</div><div class='ctx'> DEFINE_NFSD_IO_EVENT(write_opened);</div><div class='add'>+DEFINE_NFSD_IO_EVENT(write_direct);</div><div class='add'>+DEFINE_NFSD_IO_EVENT(write_vector);</div><div class='ctx'> DEFINE_NFSD_IO_EVENT(write_io_done);</div><div class='ctx'> DEFINE_NFSD_IO_EVENT(write_done);</div><div class='add'>+DEFINE_NFSD_IO_EVENT(commit_start);</div><div class='add'>+DEFINE_NFSD_IO_EVENT(commit_done);</div><div class='ctx'> </div><div class='ctx'> DECLARE_EVENT_CLASS(nfsd_err_class,</div><div class='ctx'> 	TP_PROTO(struct svc_rqst *rqstp,</div><div class='hunk'>@@ -406,17 +524,90 @@ TRACE_EVENT(nfsd_dirent,</div><div class='ctx'> 	TP_fast_assign(</div><div class='ctx'> 		__entry-&gt;fh_hash = fhp ? knfsd_fh_hash(&amp;fhp-&gt;fh_handle) : 0;</div><div class='ctx'> 		__entry-&gt;ino = ino;</div><div class='del'>-		__assign_str_len(name, name, namlen)</div><div class='add'>+		__assign_str(name);</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_printk("fh_hash=0x%08x ino=%llu name=%s",</div><div class='ctx'> 		__entry-&gt;fh_hash, __entry-&gt;ino, __get_str(name)</div><div class='ctx'> 	)</div><div class='ctx'> )</div><div class='ctx'> </div><div class='add'>+DECLARE_EVENT_CLASS(nfsd_copy_err_class,</div><div class='add'>+	TP_PROTO(struct svc_rqst *rqstp,</div><div class='add'>+		 struct svc_fh	*src_fhp,</div><div class='add'>+		 loff_t		src_offset,</div><div class='add'>+		 struct svc_fh	*dst_fhp,</div><div class='add'>+		 loff_t		dst_offset,</div><div class='add'>+		 u64		count,</div><div class='add'>+		 int		status),</div><div class='add'>+	TP_ARGS(rqstp, src_fhp, src_offset, dst_fhp, dst_offset, count, status),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(u32, xid)</div><div class='add'>+		__field(u32, src_fh_hash)</div><div class='add'>+		__field(loff_t, src_offset)</div><div class='add'>+		__field(u32, dst_fh_hash)</div><div class='add'>+		__field(loff_t, dst_offset)</div><div class='add'>+		__field(u64, count)</div><div class='add'>+		__field(int, status)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;xid = be32_to_cpu(rqstp-&gt;rq_xid);</div><div class='add'>+		__entry-&gt;src_fh_hash = knfsd_fh_hash(&amp;src_fhp-&gt;fh_handle);</div><div class='add'>+		__entry-&gt;src_offset = src_offset;</div><div class='add'>+		__entry-&gt;dst_fh_hash = knfsd_fh_hash(&amp;dst_fhp-&gt;fh_handle);</div><div class='add'>+		__entry-&gt;dst_offset = dst_offset;</div><div class='add'>+		__entry-&gt;count = count;</div><div class='add'>+		__entry-&gt;status = status;</div><div class='add'>+	),</div><div class='add'>+	TP_printk("xid=0x%08x src_fh_hash=0x%08x src_offset=%lld "</div><div class='add'>+			"dst_fh_hash=0x%08x dst_offset=%lld "</div><div class='add'>+			"count=%llu status=%d",</div><div class='add'>+		  __entry-&gt;xid, __entry-&gt;src_fh_hash, __entry-&gt;src_offset,</div><div class='add'>+		  __entry-&gt;dst_fh_hash, __entry-&gt;dst_offset,</div><div class='add'>+		  (unsigned long long)__entry-&gt;count,</div><div class='add'>+		  __entry-&gt;status)</div><div class='add'>+)</div><div class='add'>+</div><div class='add'>+#define DEFINE_NFSD_COPY_ERR_EVENT(name)		\</div><div class='add'>+DEFINE_EVENT(nfsd_copy_err_class, nfsd_##name,		\</div><div class='add'>+	TP_PROTO(struct svc_rqst	*rqstp,		\</div><div class='add'>+		 struct svc_fh		*src_fhp,	\</div><div class='add'>+		 loff_t			src_offset,	\</div><div class='add'>+		 struct svc_fh		*dst_fhp,	\</div><div class='add'>+		 loff_t			dst_offset,	\</div><div class='add'>+		 u64			count,		\</div><div class='add'>+		 int			status),	\</div><div class='add'>+	TP_ARGS(rqstp, src_fhp, src_offset, dst_fhp, dst_offset, \</div><div class='add'>+		count, status))</div><div class='add'>+</div><div class='add'>+DEFINE_NFSD_COPY_ERR_EVENT(clone_file_range_err);</div><div class='add'>+</div><div class='ctx'> #include "state.h"</div><div class='ctx'> #include "filecache.h"</div><div class='ctx'> #include "vfs.h"</div><div class='ctx'> </div><div class='add'>+TRACE_EVENT(nfsd_delegret_wakeup,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct svc_rqst *rqstp,</div><div class='add'>+		const struct inode *inode,</div><div class='add'>+		long timeo</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(rqstp, inode, timeo),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(u32, xid)</div><div class='add'>+		__field(const void *, inode)</div><div class='add'>+		__field(long, timeo)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;xid = be32_to_cpu(rqstp-&gt;rq_xid);</div><div class='add'>+		__entry-&gt;inode = inode;</div><div class='add'>+		__entry-&gt;timeo = timeo;</div><div class='add'>+	),</div><div class='add'>+	TP_printk("xid=0x%08x inode=%p%s",</div><div class='add'>+		  __entry-&gt;xid, __entry-&gt;inode,</div><div class='add'>+		  __entry-&gt;timeo == 0 ? " (timed out)" : ""</div><div class='add'>+	)</div><div class='add'>+);</div><div class='add'>+</div><div class='ctx'> DECLARE_EVENT_CLASS(nfsd_stateid_class,</div><div class='ctx'> 	TP_PROTO(stateid_t *stp),</div><div class='ctx'> 	TP_ARGS(stp),</div><div class='hunk'>@@ -457,7 +648,8 @@ DEFINE_STATEID_EVENT(layout_recall_release);</div><div class='ctx'> </div><div class='ctx'> DEFINE_STATEID_EVENT(open);</div><div class='ctx'> DEFINE_STATEID_EVENT(deleg_read);</div><div class='del'>-DEFINE_STATEID_EVENT(deleg_recall);</div><div class='add'>+DEFINE_STATEID_EVENT(deleg_write);</div><div class='add'>+DEFINE_STATEID_EVENT(deleg_return);</div><div class='ctx'> </div><div class='ctx'> DECLARE_EVENT_CLASS(nfsd_stateseqid_class,</div><div class='ctx'> 	TP_PROTO(u32 seqid, const stateid_t *stp),</div><div class='hunk'>@@ -489,6 +681,193 @@ DEFINE_EVENT(nfsd_stateseqid_class, nfsd_##name, \</div><div class='ctx'> DEFINE_STATESEQID_EVENT(preprocess);</div><div class='ctx'> DEFINE_STATESEQID_EVENT(open_confirm);</div><div class='ctx'> </div><div class='add'>+#define show_stid_type(x)						\</div><div class='add'>+	__print_flags(x, "|",						\</div><div class='add'>+		{ SC_TYPE_OPEN,		"OPEN" },		\</div><div class='add'>+		{ SC_TYPE_LOCK,		"LOCK" },		\</div><div class='add'>+		{ SC_TYPE_DELEG,		"DELEG" },		\</div><div class='add'>+		{ SC_TYPE_LAYOUT,		"LAYOUT" })</div><div class='add'>+</div><div class='add'>+#define show_stid_status(x)						\</div><div class='add'>+	__print_flags(x, "|",						\</div><div class='add'>+		{ SC_STATUS_CLOSED,		"CLOSED" },		\</div><div class='add'>+		{ SC_STATUS_REVOKED,		"REVOKED" },		\</div><div class='add'>+		{ SC_STATUS_ADMIN_REVOKED,	"ADMIN_REVOKED" })</div><div class='add'>+</div><div class='add'>+DECLARE_EVENT_CLASS(nfsd_stid_class,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct nfs4_stid *stid</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(stid),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(unsigned long, sc_type)</div><div class='add'>+		__field(unsigned long, sc_status)</div><div class='add'>+		__field(int, sc_count)</div><div class='add'>+		__field(u32, cl_boot)</div><div class='add'>+		__field(u32, cl_id)</div><div class='add'>+		__field(u32, si_id)</div><div class='add'>+		__field(u32, si_generation)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		const stateid_t *stp = &amp;stid-&gt;sc_stateid;</div><div class='add'>+</div><div class='add'>+		__entry-&gt;sc_type = stid-&gt;sc_type;</div><div class='add'>+		__entry-&gt;sc_status = stid-&gt;sc_status;</div><div class='add'>+		__entry-&gt;sc_count = refcount_read(&amp;stid-&gt;sc_count);</div><div class='add'>+		__entry-&gt;cl_boot = stp-&gt;si_opaque.so_clid.cl_boot;</div><div class='add'>+		__entry-&gt;cl_id = stp-&gt;si_opaque.so_clid.cl_id;</div><div class='add'>+		__entry-&gt;si_id = stp-&gt;si_opaque.so_id;</div><div class='add'>+		__entry-&gt;si_generation = stp-&gt;si_generation;</div><div class='add'>+	),</div><div class='add'>+	TP_printk("client %08x:%08x stateid %08x:%08x ref=%d type=%s state=%s",</div><div class='add'>+		__entry-&gt;cl_boot, __entry-&gt;cl_id,</div><div class='add'>+		__entry-&gt;si_id, __entry-&gt;si_generation,</div><div class='add'>+		__entry-&gt;sc_count, show_stid_type(__entry-&gt;sc_type),</div><div class='add'>+		show_stid_status(__entry-&gt;sc_status)</div><div class='add'>+	)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+#define DEFINE_STID_EVENT(name)					\</div><div class='add'>+DEFINE_EVENT(nfsd_stid_class, nfsd_stid_##name,			\</div><div class='add'>+	TP_PROTO(const struct nfs4_stid *stid),			\</div><div class='add'>+	TP_ARGS(stid))</div><div class='add'>+</div><div class='add'>+DEFINE_STID_EVENT(revoke);</div><div class='add'>+</div><div class='add'>+TRACE_EVENT(nfsd_stateowner_replay,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		u32 opnum,</div><div class='add'>+		const struct nfs4_replay *rp</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(opnum, rp),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(unsigned long, status)</div><div class='add'>+		__field(u32, opnum)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;status = be32_to_cpu(rp-&gt;rp_status);</div><div class='add'>+		__entry-&gt;opnum = opnum;</div><div class='add'>+	),</div><div class='add'>+	TP_printk("opnum=%u status=%lu",</div><div class='add'>+		__entry-&gt;opnum, __entry-&gt;status)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+TRACE_EVENT_CONDITION(nfsd_seq4_status,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct svc_rqst *rqstp,</div><div class='add'>+		const struct nfsd4_sequence *sequence</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(rqstp, sequence),</div><div class='add'>+	TP_CONDITION(sequence-&gt;status_flags),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(unsigned int, netns_ino)</div><div class='add'>+		__field(u32, xid)</div><div class='add'>+		__field(u32, cl_boot)</div><div class='add'>+		__field(u32, cl_id)</div><div class='add'>+		__field(u32, seqno)</div><div class='add'>+		__field(u32, reserved)</div><div class='add'>+		__field(unsigned long, status_flags)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		const struct nfsd4_sessionid *sid =</div><div class='add'>+			(struct nfsd4_sessionid *)&amp;sequence-&gt;sessionid;</div><div class='add'>+</div><div class='add'>+		__entry-&gt;netns_ino = SVC_NET(rqstp)-&gt;ns.inum;</div><div class='add'>+		__entry-&gt;xid = be32_to_cpu(rqstp-&gt;rq_xid);</div><div class='add'>+		__entry-&gt;cl_boot = sid-&gt;clientid.cl_boot;</div><div class='add'>+		__entry-&gt;cl_id = sid-&gt;clientid.cl_id;</div><div class='add'>+		__entry-&gt;seqno = sid-&gt;sequence;</div><div class='add'>+		__entry-&gt;reserved = sid-&gt;reserved;</div><div class='add'>+		__entry-&gt;status_flags = sequence-&gt;status_flags;</div><div class='add'>+	),</div><div class='add'>+	TP_printk("xid=0x%08x sessionid=%08x:%08x:%08x:%08x status_flags=%s",</div><div class='add'>+		__entry-&gt;xid, __entry-&gt;cl_boot, __entry-&gt;cl_id,</div><div class='add'>+		__entry-&gt;seqno, __entry-&gt;reserved,</div><div class='add'>+		show_nfs4_seq4_status(__entry-&gt;status_flags)</div><div class='add'>+	)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+DECLARE_EVENT_CLASS(nfsd_cs_slot_class,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct nfs4_client *clp,</div><div class='add'>+		const struct nfsd4_create_session *cs</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(clp, cs),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(u32, seqid)</div><div class='add'>+		__field(u32, slot_seqid)</div><div class='add'>+		__field(u32, cl_boot)</div><div class='add'>+		__field(u32, cl_id)</div><div class='add'>+		__sockaddr(addr, clp-&gt;cl_cb_conn.cb_addrlen)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		const struct nfsd4_clid_slot *slot = &amp;clp-&gt;cl_cs_slot;</div><div class='add'>+</div><div class='add'>+		__entry-&gt;cl_boot = clp-&gt;cl_clientid.cl_boot;</div><div class='add'>+		__entry-&gt;cl_id = clp-&gt;cl_clientid.cl_id;</div><div class='add'>+		__assign_sockaddr(addr, &amp;clp-&gt;cl_cb_conn.cb_addr,</div><div class='add'>+				  clp-&gt;cl_cb_conn.cb_addrlen);</div><div class='add'>+		__entry-&gt;seqid = cs-&gt;seqid;</div><div class='add'>+		__entry-&gt;slot_seqid = slot-&gt;sl_seqid;</div><div class='add'>+	),</div><div class='add'>+	TP_printk("addr=%pISpc client %08x:%08x seqid=%u slot_seqid=%u",</div><div class='add'>+		__get_sockaddr(addr), __entry-&gt;cl_boot, __entry-&gt;cl_id,</div><div class='add'>+		__entry-&gt;seqid, __entry-&gt;slot_seqid</div><div class='add'>+	)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+#define DEFINE_CS_SLOT_EVENT(name) \</div><div class='add'>+DEFINE_EVENT(nfsd_cs_slot_class, nfsd_##name, \</div><div class='add'>+	TP_PROTO( \</div><div class='add'>+		const struct nfs4_client *clp, \</div><div class='add'>+		const struct nfsd4_create_session *cs \</div><div class='add'>+	), \</div><div class='add'>+	TP_ARGS(clp, cs))</div><div class='add'>+</div><div class='add'>+DEFINE_CS_SLOT_EVENT(slot_seqid_conf);</div><div class='add'>+DEFINE_CS_SLOT_EVENT(slot_seqid_unconf);</div><div class='add'>+</div><div class='add'>+#define show_nfs_slot_flags(val)					\</div><div class='add'>+	__print_flags(val, "|",						\</div><div class='add'>+		{ NFSD4_SLOT_INUSE,		"INUSE" },		\</div><div class='add'>+		{ NFSD4_SLOT_CACHETHIS,		"CACHETHIS" },		\</div><div class='add'>+		{ NFSD4_SLOT_INITIALIZED,	"INITIALIZED" },	\</div><div class='add'>+		{ NFSD4_SLOT_CACHED,		"CACHED" },		\</div><div class='add'>+		{ NFSD4_SLOT_REUSED,		"REUSED" })</div><div class='add'>+</div><div class='add'>+TRACE_EVENT(nfsd_slot_seqid_sequence,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct nfs4_client *clp,</div><div class='add'>+		const struct nfsd4_sequence *seq,</div><div class='add'>+		const struct nfsd4_slot *slot</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(clp, seq, slot),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(u32, seqid)</div><div class='add'>+		__field(u32, slot_seqid)</div><div class='add'>+		__field(u32, slot_index)</div><div class='add'>+		__field(unsigned long, slot_flags)</div><div class='add'>+		__field(u32, cl_boot)</div><div class='add'>+		__field(u32, cl_id)</div><div class='add'>+		__sockaddr(addr, clp-&gt;cl_cb_conn.cb_addrlen)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;cl_boot = clp-&gt;cl_clientid.cl_boot;</div><div class='add'>+		__entry-&gt;cl_id = clp-&gt;cl_clientid.cl_id;</div><div class='add'>+		__assign_sockaddr(addr, &amp;clp-&gt;cl_cb_conn.cb_addr,</div><div class='add'>+				  clp-&gt;cl_cb_conn.cb_addrlen);</div><div class='add'>+		__entry-&gt;seqid = seq-&gt;seqid;</div><div class='add'>+		__entry-&gt;slot_seqid = slot-&gt;sl_seqid;</div><div class='add'>+		__entry-&gt;slot_index = seq-&gt;slotid;</div><div class='add'>+		__entry-&gt;slot_flags = slot-&gt;sl_flags;</div><div class='add'>+	),</div><div class='add'>+	TP_printk("addr=%pISpc client %08x:%08x idx=%u seqid=%u slot_seqid=%u flags=%s",</div><div class='add'>+		__get_sockaddr(addr), __entry-&gt;cl_boot, __entry-&gt;cl_id,</div><div class='add'>+		__entry-&gt;slot_index, __entry-&gt;seqid, __entry-&gt;slot_seqid,</div><div class='add'>+		show_nfs_slot_flags(__entry-&gt;slot_flags)</div><div class='add'>+	)</div><div class='add'>+);</div><div class='add'>+</div><div class='ctx'> DECLARE_EVENT_CLASS(nfsd_clientid_class,</div><div class='ctx'> 	TP_PROTO(const clientid_t *clid),</div><div class='ctx'> 	TP_ARGS(clid),</div><div class='hunk'>@@ -518,6 +897,30 @@ DEFINE_CLIENTID_EVENT(purged);</div><div class='ctx'> DEFINE_CLIENTID_EVENT(renew);</div><div class='ctx'> DEFINE_CLIENTID_EVENT(stale);</div><div class='ctx'> </div><div class='add'>+TRACE_EVENT(nfsd_mark_client_expired,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct nfs4_client *clp,</div><div class='add'>+		int cl_rpc_users</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(clp, cl_rpc_users),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(int, cl_rpc_users)</div><div class='add'>+		__field(u32, cl_boot)</div><div class='add'>+		__field(u32, cl_id)</div><div class='add'>+		__sockaddr(addr, clp-&gt;cl_cb_conn.cb_addrlen)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;cl_rpc_users = cl_rpc_users;</div><div class='add'>+		__entry-&gt;cl_boot = clp-&gt;cl_clientid.cl_boot;</div><div class='add'>+		__entry-&gt;cl_id = clp-&gt;cl_clientid.cl_id;</div><div class='add'>+		__assign_sockaddr(addr, &amp;clp-&gt;cl_cb_conn.cb_addr,</div><div class='add'>+				  clp-&gt;cl_cb_conn.cb_addrlen)</div><div class='add'>+	),</div><div class='add'>+	TP_printk("addr=%pISpc client %08x:%08x cl_rpc_users=%d",</div><div class='add'>+		__get_sockaddr(addr), __entry-&gt;cl_boot, __entry-&gt;cl_id,</div><div class='add'>+		__entry-&gt;cl_rpc_users)</div><div class='add'>+);</div><div class='add'>+</div><div class='ctx'> DECLARE_EVENT_CLASS(nfsd_net_class,</div><div class='ctx'> 	TP_PROTO(const struct nfsd_net *nn),</div><div class='ctx'> 	TP_ARGS(nn),</div><div class='hunk'>@@ -538,6 +941,34 @@ DEFINE_EVENT(nfsd_net_class, nfsd_##name, \</div><div class='ctx'> DEFINE_NET_EVENT(grace_start);</div><div class='ctx'> DEFINE_NET_EVENT(grace_complete);</div><div class='ctx'> </div><div class='add'>+TRACE_EVENT(nfsd_writeverf_reset,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct nfsd_net *nn,</div><div class='add'>+		const struct svc_rqst *rqstp,</div><div class='add'>+		int error</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(nn, rqstp, error),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(unsigned long long, boot_time)</div><div class='add'>+		__field(u32, xid)</div><div class='add'>+		__field(int, error)</div><div class='add'>+		__array(unsigned char, verifier, NFS4_VERIFIER_SIZE)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;boot_time = nn-&gt;boot_time;</div><div class='add'>+		__entry-&gt;xid = be32_to_cpu(rqstp-&gt;rq_xid);</div><div class='add'>+		__entry-&gt;error = error;</div><div class='add'>+</div><div class='add'>+		/* avoid seqlock inside TP_fast_assign */</div><div class='add'>+		memcpy(__entry-&gt;verifier, nn-&gt;writeverf,</div><div class='add'>+		       NFS4_VERIFIER_SIZE);</div><div class='add'>+	),</div><div class='add'>+	TP_printk("boot_time=%16llx xid=0x%08x error=%d new verifier=0x%s",</div><div class='add'>+		__entry-&gt;boot_time, __entry-&gt;xid, __entry-&gt;error,</div><div class='add'>+		__print_hex_str(__entry-&gt;verifier, NFS4_VERIFIER_SIZE)</div><div class='add'>+	)</div><div class='add'>+);</div><div class='add'>+</div><div class='ctx'> TRACE_EVENT(nfsd_clid_cred_mismatch,</div><div class='ctx'> 	TP_PROTO(</div><div class='ctx'> 		const struct nfs4_client *clp,</div><div class='hunk'>@@ -549,20 +980,21 @@ TRACE_EVENT(nfsd_clid_cred_mismatch,</div><div class='ctx'> 		__field(u32, cl_id)</div><div class='ctx'> 		__field(unsigned long, cl_flavor)</div><div class='ctx'> 		__field(unsigned long, new_flavor)</div><div class='del'>-		__array(unsigned char, addr, sizeof(struct sockaddr_in6))</div><div class='add'>+		__sockaddr(addr, rqstp-&gt;rq_xprt-&gt;xpt_remotelen)</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_fast_assign(</div><div class='ctx'> 		__entry-&gt;cl_boot = clp-&gt;cl_clientid.cl_boot;</div><div class='ctx'> 		__entry-&gt;cl_id = clp-&gt;cl_clientid.cl_id;</div><div class='ctx'> 		__entry-&gt;cl_flavor = clp-&gt;cl_cred.cr_flavor;</div><div class='ctx'> 		__entry-&gt;new_flavor = rqstp-&gt;rq_cred.cr_flavor;</div><div class='del'>-		memcpy(__entry-&gt;addr, &amp;rqstp-&gt;rq_xprt-&gt;xpt_remote,</div><div class='del'>-			sizeof(struct sockaddr_in6));</div><div class='add'>+		__assign_sockaddr(addr, &amp;rqstp-&gt;rq_xprt-&gt;xpt_remote,</div><div class='add'>+				  rqstp-&gt;rq_xprt-&gt;xpt_remotelen);</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_printk("client %08x:%08x flavor=%s, conflict=%s from addr=%pISpc",</div><div class='ctx'> 		__entry-&gt;cl_boot, __entry-&gt;cl_id,</div><div class='ctx'> 		show_nfsd_authflavor(__entry-&gt;cl_flavor),</div><div class='del'>-		show_nfsd_authflavor(__entry-&gt;new_flavor), __entry-&gt;addr</div><div class='add'>+		show_nfsd_authflavor(__entry-&gt;new_flavor),</div><div class='add'>+		__get_sockaddr(addr)</div><div class='ctx'> 	)</div><div class='ctx'> )</div><div class='ctx'> </div><div class='hunk'>@@ -578,7 +1010,7 @@ TRACE_EVENT(nfsd_clid_verf_mismatch,</div><div class='ctx'> 		__field(u32, cl_id)</div><div class='ctx'> 		__array(unsigned char, cl_verifier, NFS4_VERIFIER_SIZE)</div><div class='ctx'> 		__array(unsigned char, new_verifier, NFS4_VERIFIER_SIZE)</div><div class='del'>-		__array(unsigned char, addr, sizeof(struct sockaddr_in6))</div><div class='add'>+		__sockaddr(addr, rqstp-&gt;rq_xprt-&gt;xpt_remotelen)</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_fast_assign(</div><div class='ctx'> 		__entry-&gt;cl_boot = clp-&gt;cl_clientid.cl_boot;</div><div class='hunk'>@@ -587,14 +1019,14 @@ TRACE_EVENT(nfsd_clid_verf_mismatch,</div><div class='ctx'> 		       NFS4_VERIFIER_SIZE);</div><div class='ctx'> 		memcpy(__entry-&gt;new_verifier, (void *)verf,</div><div class='ctx'> 		       NFS4_VERIFIER_SIZE);</div><div class='del'>-		memcpy(__entry-&gt;addr, &amp;rqstp-&gt;rq_xprt-&gt;xpt_remote,</div><div class='del'>-			sizeof(struct sockaddr_in6));</div><div class='add'>+		__assign_sockaddr(addr, &amp;rqstp-&gt;rq_xprt-&gt;xpt_remote,</div><div class='add'>+				  rqstp-&gt;rq_xprt-&gt;xpt_remotelen);</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_printk("client %08x:%08x verf=0x%s, updated=0x%s from addr=%pISpc",</div><div class='ctx'> 		__entry-&gt;cl_boot, __entry-&gt;cl_id,</div><div class='ctx'> 		__print_hex_str(__entry-&gt;cl_verifier, NFS4_VERIFIER_SIZE),</div><div class='ctx'> 		__print_hex_str(__entry-&gt;new_verifier, NFS4_VERIFIER_SIZE),</div><div class='del'>-		__entry-&gt;addr</div><div class='add'>+		__get_sockaddr(addr)</div><div class='ctx'> 	)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='hunk'>@@ -607,7 +1039,7 @@ DECLARE_EVENT_CLASS(nfsd_clid_class,</div><div class='ctx'> 		__array(unsigned char, addr, sizeof(struct sockaddr_in6))</div><div class='ctx'> 		__field(unsigned long, flavor)</div><div class='ctx'> 		__array(unsigned char, verifier, NFS4_VERIFIER_SIZE)</div><div class='del'>-		__string_len(name, name, clp-&gt;cl_name.len)</div><div class='add'>+		__string_len(name, clp-&gt;cl_name.data, clp-&gt;cl_name.len)</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_fast_assign(</div><div class='ctx'> 		__entry-&gt;cl_boot = clp-&gt;cl_clientid.cl_boot;</div><div class='hunk'>@@ -617,7 +1049,7 @@ DECLARE_EVENT_CLASS(nfsd_clid_class,</div><div class='ctx'> 		__entry-&gt;flavor = clp-&gt;cl_cred.cr_flavor;</div><div class='ctx'> 		memcpy(__entry-&gt;verifier, (void *)&amp;clp-&gt;cl_verifier,</div><div class='ctx'> 		       NFS4_VERIFIER_SIZE);</div><div class='del'>-		__assign_str_len(name, clp-&gt;cl_name.data, clp-&gt;cl_name.len);</div><div class='add'>+		__assign_str(name);</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_printk("addr=%pISpc name='%s' verifier=0x%s flavor=%s client=%08x:%08x",</div><div class='ctx'> 		__entry-&gt;addr, __get_str(name),</div><div class='hunk'>@@ -637,25 +1069,18 @@ DEFINE_CLID_EVENT(confirmed_r);</div><div class='ctx'> /*</div><div class='ctx'>  * from fs/nfsd/filecache.h</div><div class='ctx'>  */</div><div class='del'>-TRACE_DEFINE_ENUM(NFSD_FILE_HASHED);</div><div class='del'>-TRACE_DEFINE_ENUM(NFSD_FILE_PENDING);</div><div class='del'>-TRACE_DEFINE_ENUM(NFSD_FILE_BREAK_READ);</div><div class='del'>-TRACE_DEFINE_ENUM(NFSD_FILE_BREAK_WRITE);</div><div class='del'>-TRACE_DEFINE_ENUM(NFSD_FILE_REFERENCED);</div><div class='del'>-</div><div class='ctx'> #define show_nf_flags(val)						\</div><div class='ctx'> 	__print_flags(val, "|",						\</div><div class='ctx'> 		{ 1 &lt;&lt; NFSD_FILE_HASHED,	"HASHED" },		\</div><div class='ctx'> 		{ 1 &lt;&lt; NFSD_FILE_PENDING,	"PENDING" },		\</div><div class='del'>-		{ 1 &lt;&lt; NFSD_FILE_BREAK_READ,	"BREAK_READ" },		\</div><div class='del'>-		{ 1 &lt;&lt; NFSD_FILE_BREAK_WRITE,	"BREAK_WRITE" },	\</div><div class='del'>-		{ 1 &lt;&lt; NFSD_FILE_REFERENCED,	"REFERENCED"})</div><div class='add'>+		{ 1 &lt;&lt; NFSD_FILE_REFERENCED,	"REFERENCED" },		\</div><div class='add'>+		{ 1 &lt;&lt; NFSD_FILE_RECENT,	"RECENT" },		\</div><div class='add'>+		{ 1 &lt;&lt; NFSD_FILE_GC,		"GC" })</div><div class='ctx'> </div><div class='ctx'> DECLARE_EVENT_CLASS(nfsd_file_class,</div><div class='ctx'> 	TP_PROTO(struct nfsd_file *nf),</div><div class='ctx'> 	TP_ARGS(nf),</div><div class='ctx'> 	TP_STRUCT__entry(</div><div class='del'>-		__field(unsigned int, nf_hashval)</div><div class='ctx'> 		__field(void *, nf_inode)</div><div class='ctx'> 		__field(int, nf_ref)</div><div class='ctx'> 		__field(unsigned long, nf_flags)</div><div class='hunk'>@@ -663,15 +1088,13 @@ DECLARE_EVENT_CLASS(nfsd_file_class,</div><div class='ctx'> 		__field(struct file *, nf_file)</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_fast_assign(</div><div class='del'>-		__entry-&gt;nf_hashval = nf-&gt;nf_hashval;</div><div class='ctx'> 		__entry-&gt;nf_inode = nf-&gt;nf_inode;</div><div class='ctx'> 		__entry-&gt;nf_ref = refcount_read(&amp;nf-&gt;nf_ref);</div><div class='ctx'> 		__entry-&gt;nf_flags = nf-&gt;nf_flags;</div><div class='ctx'> 		__entry-&gt;nf_may = nf-&gt;nf_may;</div><div class='ctx'> 		__entry-&gt;nf_file = nf-&gt;nf_file;</div><div class='ctx'> 	),</div><div class='del'>-	TP_printk("hash=0x%x inode=%p ref=%d flags=%s may=%s file=%p",</div><div class='del'>-		__entry-&gt;nf_hashval,</div><div class='add'>+	TP_printk("inode=%p ref=%d flags=%s may=%s nf_file=%p",</div><div class='ctx'> 		__entry-&gt;nf_inode,</div><div class='ctx'> 		__entry-&gt;nf_ref,</div><div class='ctx'> 		show_nf_flags(__entry-&gt;nf_flags),</div><div class='hunk'>@@ -684,34 +1107,86 @@ DEFINE_EVENT(nfsd_file_class, name, \</div><div class='ctx'> 	TP_PROTO(struct nfsd_file *nf), \</div><div class='ctx'> 	TP_ARGS(nf))</div><div class='ctx'> </div><div class='del'>-DEFINE_NFSD_FILE_EVENT(nfsd_file_alloc);</div><div class='del'>-DEFINE_NFSD_FILE_EVENT(nfsd_file_put_final);</div><div class='add'>+DEFINE_NFSD_FILE_EVENT(nfsd_file_free);</div><div class='ctx'> DEFINE_NFSD_FILE_EVENT(nfsd_file_unhash);</div><div class='ctx'> DEFINE_NFSD_FILE_EVENT(nfsd_file_put);</div><div class='del'>-DEFINE_NFSD_FILE_EVENT(nfsd_file_unhash_and_release_locked);</div><div class='add'>+DEFINE_NFSD_FILE_EVENT(nfsd_file_closing);</div><div class='add'>+</div><div class='add'>+TRACE_EVENT(nfsd_file_alloc,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct nfsd_file *nf</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(nf),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(const void *, nf_inode)</div><div class='add'>+		__field(unsigned long, nf_flags)</div><div class='add'>+		__field(unsigned long, nf_may)</div><div class='add'>+		__field(unsigned int, nf_ref)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;nf_inode = nf-&gt;nf_inode;</div><div class='add'>+		__entry-&gt;nf_flags = nf-&gt;nf_flags;</div><div class='add'>+		__entry-&gt;nf_ref = refcount_read(&amp;nf-&gt;nf_ref);</div><div class='add'>+		__entry-&gt;nf_may = nf-&gt;nf_may;</div><div class='add'>+	),</div><div class='add'>+	TP_printk("inode=%p ref=%u flags=%s may=%s",</div><div class='add'>+		__entry-&gt;nf_inode, __entry-&gt;nf_ref,</div><div class='add'>+		show_nf_flags(__entry-&gt;nf_flags),</div><div class='add'>+		show_nfsd_may_flags(__entry-&gt;nf_may)</div><div class='add'>+	)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+TRACE_EVENT(nfsd_file_get_dio_attrs,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct inode *inode,</div><div class='add'>+		const struct kstat *stat</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(inode, stat),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(const void *, inode)</div><div class='add'>+		__field(unsigned long, mask)</div><div class='add'>+		__field(u32, mem_align)</div><div class='add'>+		__field(u32, offset_align)</div><div class='add'>+		__field(u32, read_offset_align)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;inode = inode;</div><div class='add'>+		__entry-&gt;mask = stat-&gt;result_mask;</div><div class='add'>+		__entry-&gt;mem_align = stat-&gt;dio_mem_align;</div><div class='add'>+		__entry-&gt;offset_align = stat-&gt;dio_offset_align;</div><div class='add'>+		__entry-&gt;read_offset_align = stat-&gt;dio_read_offset_align;</div><div class='add'>+	),</div><div class='add'>+	TP_printk("inode=%p flags=%s mem_align=%u offset_align=%u read_offset_align=%u",</div><div class='add'>+		__entry-&gt;inode, show_statx_mask(__entry-&gt;mask),</div><div class='add'>+		__entry-&gt;mem_align, __entry-&gt;offset_align,</div><div class='add'>+		__entry-&gt;read_offset_align</div><div class='add'>+	)</div><div class='add'>+);</div><div class='ctx'> </div><div class='ctx'> TRACE_EVENT(nfsd_file_acquire,</div><div class='del'>-	TP_PROTO(struct svc_rqst *rqstp, unsigned int hash,</div><div class='del'>-		 struct inode *inode, unsigned int may_flags,</div><div class='del'>-		 struct nfsd_file *nf, __be32 status),</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct svc_rqst *rqstp,</div><div class='add'>+		const struct inode *inode,</div><div class='add'>+		unsigned int may_flags,</div><div class='add'>+		const struct nfsd_file *nf,</div><div class='add'>+		__be32 status</div><div class='add'>+	),</div><div class='ctx'> </div><div class='del'>-	TP_ARGS(rqstp, hash, inode, may_flags, nf, status),</div><div class='add'>+	TP_ARGS(rqstp, inode, may_flags, nf, status),</div><div class='ctx'> </div><div class='ctx'> 	TP_STRUCT__entry(</div><div class='ctx'> 		__field(u32, xid)</div><div class='del'>-		__field(unsigned int, hash)</div><div class='del'>-		__field(void *, inode)</div><div class='add'>+		__field(const void *, inode)</div><div class='ctx'> 		__field(unsigned long, may_flags)</div><div class='del'>-		__field(int, nf_ref)</div><div class='add'>+		__field(unsigned int, nf_ref)</div><div class='ctx'> 		__field(unsigned long, nf_flags)</div><div class='ctx'> 		__field(unsigned long, nf_may)</div><div class='del'>-		__field(struct file *, nf_file)</div><div class='add'>+		__field(const void *, nf_file)</div><div class='ctx'> 		__field(u32, status)</div><div class='ctx'> 	),</div><div class='ctx'> </div><div class='ctx'> 	TP_fast_assign(</div><div class='del'>-		__entry-&gt;xid = be32_to_cpu(rqstp-&gt;rq_xid);</div><div class='del'>-		__entry-&gt;hash = hash;</div><div class='add'>+		__entry-&gt;xid = rqstp ? be32_to_cpu(rqstp-&gt;rq_xid) : 0;</div><div class='ctx'> 		__entry-&gt;inode = inode;</div><div class='ctx'> 		__entry-&gt;may_flags = may_flags;</div><div class='ctx'> 		__entry-&gt;nf_ref = nf ? refcount_read(&amp;nf-&gt;nf_ref) : 0;</div><div class='hunk'>@@ -721,39 +1196,131 @@ TRACE_EVENT(nfsd_file_acquire,</div><div class='ctx'> 		__entry-&gt;status = be32_to_cpu(status);</div><div class='ctx'> 	),</div><div class='ctx'> </div><div class='del'>-	TP_printk("xid=0x%x hash=0x%x inode=%p may_flags=%s ref=%d nf_flags=%s nf_may=%s nf_file=%p status=%u",</div><div class='del'>-			__entry-&gt;xid, __entry-&gt;hash, __entry-&gt;inode,</div><div class='add'>+	TP_printk("xid=0x%x inode=%p may_flags=%s ref=%u nf_flags=%s nf_may=%s nf_file=%p status=%u",</div><div class='add'>+			__entry-&gt;xid, __entry-&gt;inode,</div><div class='ctx'> 			show_nfsd_may_flags(__entry-&gt;may_flags),</div><div class='ctx'> 			__entry-&gt;nf_ref, show_nf_flags(__entry-&gt;nf_flags),</div><div class='ctx'> 			show_nfsd_may_flags(__entry-&gt;nf_may),</div><div class='del'>-			__entry-&gt;nf_file, __entry-&gt;status)</div><div class='add'>+			__entry-&gt;nf_file, __entry-&gt;status</div><div class='add'>+	)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='del'>-DECLARE_EVENT_CLASS(nfsd_file_search_class,</div><div class='del'>-	TP_PROTO(struct inode *inode, unsigned int hash, int found),</div><div class='del'>-	TP_ARGS(inode, hash, found),</div><div class='add'>+TRACE_EVENT(nfsd_file_insert_err,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct svc_rqst *rqstp,</div><div class='add'>+		const struct inode *inode,</div><div class='add'>+		unsigned int may_flags,</div><div class='add'>+		long error</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(rqstp, inode, may_flags, error),</div><div class='ctx'> 	TP_STRUCT__entry(</div><div class='del'>-		__field(struct inode *, inode)</div><div class='del'>-		__field(unsigned int, hash)</div><div class='del'>-		__field(int, found)</div><div class='add'>+		__field(u32, xid)</div><div class='add'>+		__field(const void *, inode)</div><div class='add'>+		__field(unsigned long, may_flags)</div><div class='add'>+		__field(long, error)</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_fast_assign(</div><div class='add'>+		__entry-&gt;xid = rqstp ? be32_to_cpu(rqstp-&gt;rq_xid) : 0;</div><div class='ctx'> 		__entry-&gt;inode = inode;</div><div class='del'>-		__entry-&gt;hash = hash;</div><div class='del'>-		__entry-&gt;found = found;</div><div class='add'>+		__entry-&gt;may_flags = may_flags;</div><div class='add'>+		__entry-&gt;error = error;</div><div class='ctx'> 	),</div><div class='del'>-	TP_printk("hash=0x%x inode=%p found=%d", __entry-&gt;hash,</div><div class='del'>-			__entry-&gt;inode, __entry-&gt;found)</div><div class='add'>+	TP_printk("xid=0x%x inode=%p may_flags=%s error=%ld",</div><div class='add'>+		__entry-&gt;xid, __entry-&gt;inode,</div><div class='add'>+		show_nfsd_may_flags(__entry-&gt;may_flags),</div><div class='add'>+		__entry-&gt;error</div><div class='add'>+	)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='del'>-#define DEFINE_NFSD_FILE_SEARCH_EVENT(name)				\</div><div class='del'>-DEFINE_EVENT(nfsd_file_search_class, name,				\</div><div class='del'>-	TP_PROTO(struct inode *inode, unsigned int hash, int found),	\</div><div class='del'>-	TP_ARGS(inode, hash, found))</div><div class='add'>+TRACE_EVENT(nfsd_file_cons_err,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct svc_rqst *rqstp,</div><div class='add'>+		const struct inode *inode,</div><div class='add'>+		unsigned int may_flags,</div><div class='add'>+		const struct nfsd_file *nf</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(rqstp, inode, may_flags, nf),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(u32, xid)</div><div class='add'>+		__field(const void *, inode)</div><div class='add'>+		__field(unsigned long, may_flags)</div><div class='add'>+		__field(unsigned int, nf_ref)</div><div class='add'>+		__field(unsigned long, nf_flags)</div><div class='add'>+		__field(unsigned long, nf_may)</div><div class='add'>+		__field(const void *, nf_file)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;xid = rqstp ? be32_to_cpu(rqstp-&gt;rq_xid) : 0;</div><div class='add'>+		__entry-&gt;inode = inode;</div><div class='add'>+		__entry-&gt;may_flags = may_flags;</div><div class='add'>+		__entry-&gt;nf_ref = refcount_read(&amp;nf-&gt;nf_ref);</div><div class='add'>+		__entry-&gt;nf_flags = nf-&gt;nf_flags;</div><div class='add'>+		__entry-&gt;nf_may = nf-&gt;nf_may;</div><div class='add'>+		__entry-&gt;nf_file = nf-&gt;nf_file;</div><div class='add'>+	),</div><div class='add'>+	TP_printk("xid=0x%x inode=%p may_flags=%s ref=%u nf_flags=%s nf_may=%s nf_file=%p",</div><div class='add'>+		__entry-&gt;xid, __entry-&gt;inode,</div><div class='add'>+		show_nfsd_may_flags(__entry-&gt;may_flags), __entry-&gt;nf_ref,</div><div class='add'>+		show_nf_flags(__entry-&gt;nf_flags),</div><div class='add'>+		show_nfsd_may_flags(__entry-&gt;nf_may), __entry-&gt;nf_file</div><div class='add'>+	)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+DECLARE_EVENT_CLASS(nfsd_file_open_class,</div><div class='add'>+	TP_PROTO(const struct nfsd_file *nf, __be32 status),</div><div class='add'>+	TP_ARGS(nf, status),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(void *, nf_inode)	/* cannot be dereferenced */</div><div class='add'>+		__field(int, nf_ref)</div><div class='add'>+		__field(unsigned long, nf_flags)</div><div class='add'>+		__field(unsigned long, nf_may)</div><div class='add'>+		__field(void *, nf_file)	/* cannot be dereferenced */</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;nf_inode = nf-&gt;nf_inode;</div><div class='add'>+		__entry-&gt;nf_ref = refcount_read(&amp;nf-&gt;nf_ref);</div><div class='add'>+		__entry-&gt;nf_flags = nf-&gt;nf_flags;</div><div class='add'>+		__entry-&gt;nf_may = nf-&gt;nf_may;</div><div class='add'>+		__entry-&gt;nf_file = nf-&gt;nf_file;</div><div class='add'>+	),</div><div class='add'>+	TP_printk("inode=%p ref=%d flags=%s may=%s file=%p",</div><div class='add'>+		__entry-&gt;nf_inode,</div><div class='add'>+		__entry-&gt;nf_ref,</div><div class='add'>+		show_nf_flags(__entry-&gt;nf_flags),</div><div class='add'>+		show_nfsd_may_flags(__entry-&gt;nf_may),</div><div class='add'>+		__entry-&gt;nf_file)</div><div class='add'>+)</div><div class='ctx'> </div><div class='del'>-DEFINE_NFSD_FILE_SEARCH_EVENT(nfsd_file_close_inode_sync);</div><div class='del'>-DEFINE_NFSD_FILE_SEARCH_EVENT(nfsd_file_close_inode);</div><div class='del'>-DEFINE_NFSD_FILE_SEARCH_EVENT(nfsd_file_is_cached);</div><div class='add'>+#define DEFINE_NFSD_FILE_OPEN_EVENT(name)					\</div><div class='add'>+DEFINE_EVENT(nfsd_file_open_class, name,					\</div><div class='add'>+	TP_PROTO(							\</div><div class='add'>+		const struct nfsd_file *nf,				\</div><div class='add'>+		__be32 status						\</div><div class='add'>+	),								\</div><div class='add'>+	TP_ARGS(nf, status))</div><div class='add'>+</div><div class='add'>+DEFINE_NFSD_FILE_OPEN_EVENT(nfsd_file_open);</div><div class='add'>+DEFINE_NFSD_FILE_OPEN_EVENT(nfsd_file_opened);</div><div class='add'>+</div><div class='add'>+TRACE_EVENT(nfsd_file_is_cached,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct inode *inode,</div><div class='add'>+		int found</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(inode, found),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(const struct inode *, inode)</div><div class='add'>+		__field(int, found)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;inode = inode;</div><div class='add'>+		__entry-&gt;found = found;</div><div class='add'>+	),</div><div class='add'>+	TP_printk("inode=%p is %scached",</div><div class='add'>+		__entry-&gt;inode,</div><div class='add'>+		__entry-&gt;found ? "" : "not "</div><div class='add'>+	)</div><div class='add'>+);</div><div class='ctx'> </div><div class='ctx'> TRACE_EVENT(nfsd_file_fsnotify_handle_event,</div><div class='ctx'> 	TP_PROTO(struct inode *inode, u32 mask),</div><div class='hunk'>@@ -774,6 +1341,90 @@ TRACE_EVENT(nfsd_file_fsnotify_handle_event,</div><div class='ctx'> 			__entry-&gt;nlink, __entry-&gt;mode, __entry-&gt;mask)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='add'>+DECLARE_EVENT_CLASS(nfsd_file_gc_class,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct nfsd_file *nf</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(nf),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(void *, nf_inode)</div><div class='add'>+		__field(void *, nf_file)</div><div class='add'>+		__field(int, nf_ref)</div><div class='add'>+		__field(unsigned long, nf_flags)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;nf_inode = nf-&gt;nf_inode;</div><div class='add'>+		__entry-&gt;nf_file = nf-&gt;nf_file;</div><div class='add'>+		__entry-&gt;nf_ref = refcount_read(&amp;nf-&gt;nf_ref);</div><div class='add'>+		__entry-&gt;nf_flags = nf-&gt;nf_flags;</div><div class='add'>+	),</div><div class='add'>+	TP_printk("inode=%p ref=%d nf_flags=%s nf_file=%p",</div><div class='add'>+		__entry-&gt;nf_inode, __entry-&gt;nf_ref,</div><div class='add'>+		show_nf_flags(__entry-&gt;nf_flags),</div><div class='add'>+		__entry-&gt;nf_file</div><div class='add'>+	)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+#define DEFINE_NFSD_FILE_GC_EVENT(name)					\</div><div class='add'>+DEFINE_EVENT(nfsd_file_gc_class, name,					\</div><div class='add'>+	TP_PROTO(							\</div><div class='add'>+		const struct nfsd_file *nf				\</div><div class='add'>+	),								\</div><div class='add'>+	TP_ARGS(nf))</div><div class='add'>+</div><div class='add'>+DEFINE_NFSD_FILE_GC_EVENT(nfsd_file_lru_add);</div><div class='add'>+DEFINE_NFSD_FILE_GC_EVENT(nfsd_file_lru_del);</div><div class='add'>+DEFINE_NFSD_FILE_GC_EVENT(nfsd_file_gc_in_use);</div><div class='add'>+DEFINE_NFSD_FILE_GC_EVENT(nfsd_file_gc_writeback);</div><div class='add'>+DEFINE_NFSD_FILE_GC_EVENT(nfsd_file_gc_referenced);</div><div class='add'>+DEFINE_NFSD_FILE_GC_EVENT(nfsd_file_gc_aged);</div><div class='add'>+DEFINE_NFSD_FILE_GC_EVENT(nfsd_file_gc_disposed);</div><div class='add'>+</div><div class='add'>+DECLARE_EVENT_CLASS(nfsd_file_lruwalk_class,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		unsigned long removed,</div><div class='add'>+		unsigned long remaining</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(removed, remaining),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(unsigned long, removed)</div><div class='add'>+		__field(unsigned long, remaining)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;removed = removed;</div><div class='add'>+		__entry-&gt;remaining = remaining;</div><div class='add'>+	),</div><div class='add'>+	TP_printk("%lu entries removed, %lu remaining",</div><div class='add'>+		__entry-&gt;removed, __entry-&gt;remaining)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+#define DEFINE_NFSD_FILE_LRUWALK_EVENT(name)				\</div><div class='add'>+DEFINE_EVENT(nfsd_file_lruwalk_class, name,				\</div><div class='add'>+	TP_PROTO(							\</div><div class='add'>+		unsigned long removed,					\</div><div class='add'>+		unsigned long remaining					\</div><div class='add'>+	),								\</div><div class='add'>+	TP_ARGS(removed, remaining))</div><div class='add'>+</div><div class='add'>+DEFINE_NFSD_FILE_LRUWALK_EVENT(nfsd_file_gc_removed);</div><div class='add'>+DEFINE_NFSD_FILE_LRUWALK_EVENT(nfsd_file_shrinker_removed);</div><div class='add'>+</div><div class='add'>+TRACE_EVENT(nfsd_file_close,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct inode *inode</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(inode),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(const void *, inode)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;inode = inode;</div><div class='add'>+	),</div><div class='add'>+	TP_printk("inode=%p",</div><div class='add'>+		__entry-&gt;inode</div><div class='add'>+	)</div><div class='add'>+);</div><div class='add'>+</div><div class='ctx'> #include "cache.h"</div><div class='ctx'> </div><div class='ctx'> TRACE_DEFINE_ENUM(RC_DROPIT);</div><div class='hunk'>@@ -812,8 +1463,8 @@ TRACE_EVENT(nfsd_drc_found,</div><div class='ctx'> TRACE_EVENT(nfsd_drc_mismatch,</div><div class='ctx'> 	TP_PROTO(</div><div class='ctx'> 		const struct nfsd_net *nn,</div><div class='del'>-		const struct svc_cacherep *key,</div><div class='del'>-		const struct svc_cacherep *rp</div><div class='add'>+		const struct nfsd_cacherep *key,</div><div class='add'>+		const struct nfsd_cacherep *rp</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_ARGS(nn, key, rp),</div><div class='ctx'> 	TP_STRUCT__entry(</div><div class='hunk'>@@ -844,18 +1495,17 @@ TRACE_EVENT(nfsd_cb_args,</div><div class='ctx'> 		__field(u32, cl_id)</div><div class='ctx'> 		__field(u32, prog)</div><div class='ctx'> 		__field(u32, ident)</div><div class='del'>-		__array(unsigned char, addr, sizeof(struct sockaddr_in6))</div><div class='add'>+		__sockaddr(addr, conn-&gt;cb_addrlen)</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_fast_assign(</div><div class='ctx'> 		__entry-&gt;cl_boot = clp-&gt;cl_clientid.cl_boot;</div><div class='ctx'> 		__entry-&gt;cl_id = clp-&gt;cl_clientid.cl_id;</div><div class='ctx'> 		__entry-&gt;prog = conn-&gt;cb_prog;</div><div class='ctx'> 		__entry-&gt;ident = conn-&gt;cb_ident;</div><div class='del'>-		memcpy(__entry-&gt;addr, &amp;conn-&gt;cb_addr,</div><div class='del'>-			sizeof(struct sockaddr_in6));</div><div class='add'>+		__assign_sockaddr(addr, &amp;conn-&gt;cb_addr, conn-&gt;cb_addrlen);</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_printk("addr=%pISpc client %08x:%08x prog=%u ident=%u",</div><div class='del'>-		__entry-&gt;addr, __entry-&gt;cl_boot, __entry-&gt;cl_id,</div><div class='add'>+		__get_sockaddr(addr), __entry-&gt;cl_boot, __entry-&gt;cl_id,</div><div class='ctx'> 		__entry-&gt;prog, __entry-&gt;ident)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='hunk'>@@ -887,17 +1537,17 @@ DECLARE_EVENT_CLASS(nfsd_cb_class,</div><div class='ctx'> 		__field(unsigned long, state)</div><div class='ctx'> 		__field(u32, cl_boot)</div><div class='ctx'> 		__field(u32, cl_id)</div><div class='del'>-		__array(unsigned char, addr, sizeof(struct sockaddr_in6))</div><div class='add'>+		__sockaddr(addr, clp-&gt;cl_cb_conn.cb_addrlen)</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_fast_assign(</div><div class='ctx'> 		__entry-&gt;state = clp-&gt;cl_cb_state;</div><div class='ctx'> 		__entry-&gt;cl_boot = clp-&gt;cl_clientid.cl_boot;</div><div class='ctx'> 		__entry-&gt;cl_id = clp-&gt;cl_clientid.cl_id;</div><div class='del'>-		memcpy(__entry-&gt;addr, &amp;clp-&gt;cl_cb_conn.cb_addr,</div><div class='del'>-			sizeof(struct sockaddr_in6));</div><div class='add'>+		__assign_sockaddr(addr, &amp;clp-&gt;cl_cb_conn.cb_addr,</div><div class='add'>+				  clp-&gt;cl_cb_conn.cb_addrlen)</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_printk("addr=%pISpc client %08x:%08x state=%s",</div><div class='del'>-		__entry-&gt;addr, __entry-&gt;cl_boot, __entry-&gt;cl_id,</div><div class='add'>+		__get_sockaddr(addr), __entry-&gt;cl_boot, __entry-&gt;cl_id,</div><div class='ctx'> 		show_cb_state(__entry-&gt;state))</div><div class='ctx'> );</div><div class='ctx'> </div><div class='hunk'>@@ -906,10 +1556,14 @@ DEFINE_EVENT(nfsd_cb_class, nfsd_cb_##name,		\</div><div class='ctx'> 	TP_PROTO(const struct nfs4_client *clp),	\</div><div class='ctx'> 	TP_ARGS(clp))</div><div class='ctx'> </div><div class='del'>-DEFINE_NFSD_CB_EVENT(state);</div><div class='add'>+DEFINE_NFSD_CB_EVENT(start);</div><div class='add'>+DEFINE_NFSD_CB_EVENT(new_state);</div><div class='ctx'> DEFINE_NFSD_CB_EVENT(probe);</div><div class='ctx'> DEFINE_NFSD_CB_EVENT(lost);</div><div class='ctx'> DEFINE_NFSD_CB_EVENT(shutdown);</div><div class='add'>+DEFINE_NFSD_CB_EVENT(rpc_prepare);</div><div class='add'>+DEFINE_NFSD_CB_EVENT(rpc_done);</div><div class='add'>+DEFINE_NFSD_CB_EVENT(rpc_release);</div><div class='ctx'> </div><div class='ctx'> TRACE_DEFINE_ENUM(RPC_AUTH_NULL);</div><div class='ctx'> TRACE_DEFINE_ENUM(RPC_AUTH_UNIX);</div><div class='hunk'>@@ -937,20 +1591,20 @@ TRACE_EVENT(nfsd_cb_setup,</div><div class='ctx'> 		__field(u32, cl_boot)</div><div class='ctx'> 		__field(u32, cl_id)</div><div class='ctx'> 		__field(unsigned long, authflavor)</div><div class='del'>-		__array(unsigned char, addr, sizeof(struct sockaddr_in6))</div><div class='del'>-		__array(unsigned char, netid, 8)</div><div class='add'>+		__sockaddr(addr, clp-&gt;cl_cb_conn.cb_addrlen)</div><div class='add'>+		__string(netid, netid)</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_fast_assign(</div><div class='ctx'> 		__entry-&gt;cl_boot = clp-&gt;cl_clientid.cl_boot;</div><div class='ctx'> 		__entry-&gt;cl_id = clp-&gt;cl_clientid.cl_id;</div><div class='del'>-		strlcpy(__entry-&gt;netid, netid, sizeof(__entry-&gt;netid));</div><div class='add'>+		__assign_str(netid);</div><div class='ctx'> 		__entry-&gt;authflavor = authflavor;</div><div class='del'>-		memcpy(__entry-&gt;addr, &amp;clp-&gt;cl_cb_conn.cb_addr,</div><div class='del'>-			sizeof(struct sockaddr_in6));</div><div class='add'>+		__assign_sockaddr(addr, &amp;clp-&gt;cl_cb_conn.cb_addr,</div><div class='add'>+				  clp-&gt;cl_cb_conn.cb_addrlen)</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_printk("addr=%pISpc client %08x:%08x proto=%s flavor=%s",</div><div class='del'>-		__entry-&gt;addr, __entry-&gt;cl_boot, __entry-&gt;cl_id,</div><div class='del'>-		__entry-&gt;netid, show_nfsd_authflavor(__entry-&gt;authflavor))</div><div class='add'>+		__get_sockaddr(addr), __entry-&gt;cl_boot, __entry-&gt;cl_id,</div><div class='add'>+		__get_str(netid), show_nfsd_authflavor(__entry-&gt;authflavor))</div><div class='ctx'> );</div><div class='ctx'> </div><div class='ctx'> TRACE_EVENT(nfsd_cb_setup_err,</div><div class='hunk'>@@ -963,30 +1617,169 @@ TRACE_EVENT(nfsd_cb_setup_err,</div><div class='ctx'> 		__field(long, error)</div><div class='ctx'> 		__field(u32, cl_boot)</div><div class='ctx'> 		__field(u32, cl_id)</div><div class='del'>-		__array(unsigned char, addr, sizeof(struct sockaddr_in6))</div><div class='add'>+		__sockaddr(addr, clp-&gt;cl_cb_conn.cb_addrlen)</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_fast_assign(</div><div class='ctx'> 		__entry-&gt;error = error;</div><div class='ctx'> 		__entry-&gt;cl_boot = clp-&gt;cl_clientid.cl_boot;</div><div class='ctx'> 		__entry-&gt;cl_id = clp-&gt;cl_clientid.cl_id;</div><div class='del'>-		memcpy(__entry-&gt;addr, &amp;clp-&gt;cl_cb_conn.cb_addr,</div><div class='del'>-			sizeof(struct sockaddr_in6));</div><div class='add'>+		__assign_sockaddr(addr, &amp;clp-&gt;cl_cb_conn.cb_addr,</div><div class='add'>+				  clp-&gt;cl_cb_conn.cb_addrlen)</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_printk("addr=%pISpc client %08x:%08x error=%ld",</div><div class='del'>-		__entry-&gt;addr, __entry-&gt;cl_boot, __entry-&gt;cl_id, __entry-&gt;error)</div><div class='add'>+		__get_sockaddr(addr), __entry-&gt;cl_boot, __entry-&gt;cl_id,</div><div class='add'>+		__entry-&gt;error)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='del'>-TRACE_EVENT(nfsd_cb_recall,</div><div class='add'>+/* Not a real opcode, but there is no 0 operation. */</div><div class='add'>+#define _CB_NULL	0</div><div class='add'>+</div><div class='add'>+#define show_nfsd_cb_opcode(val)					\</div><div class='add'>+	__print_symbolic(val,						\</div><div class='add'>+		{ _CB_NULL,			"CB_NULL" },		\</div><div class='add'>+		{ OP_CB_GETATTR,		"CB_GETATTR" },		\</div><div class='add'>+		{ OP_CB_RECALL,			"CB_RECALL" },		\</div><div class='add'>+		{ OP_CB_LAYOUTRECALL,		"CB_LAYOUTRECALL" },	\</div><div class='add'>+		{ OP_CB_RECALL_ANY,		"CB_RECALL_ANY" },	\</div><div class='add'>+		{ OP_CB_NOTIFY_LOCK,		"CB_NOTIFY_LOCK" },	\</div><div class='add'>+		{ OP_CB_OFFLOAD,		"CB_OFFLOAD" })</div><div class='add'>+</div><div class='add'>+DECLARE_EVENT_CLASS(nfsd_cb_lifetime_class,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct nfs4_client *clp,</div><div class='add'>+		const struct nfsd4_callback *cb</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(clp, cb),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(u32, cl_boot)</div><div class='add'>+		__field(u32, cl_id)</div><div class='add'>+		__field(const void *, cb)</div><div class='add'>+		__field(unsigned long, opcode)</div><div class='add'>+		__field(bool, need_restart)</div><div class='add'>+		__sockaddr(addr, clp-&gt;cl_cb_conn.cb_addrlen)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;cl_boot = clp-&gt;cl_clientid.cl_boot;</div><div class='add'>+		__entry-&gt;cl_id = clp-&gt;cl_clientid.cl_id;</div><div class='add'>+		__entry-&gt;cb = cb;</div><div class='add'>+		__entry-&gt;opcode = cb-&gt;cb_ops ? cb-&gt;cb_ops-&gt;opcode : _CB_NULL;</div><div class='add'>+		__entry-&gt;need_restart = test_bit(NFSD4_CALLBACK_REQUEUE, &amp;cb-&gt;cb_flags);</div><div class='add'>+		__assign_sockaddr(addr, &amp;clp-&gt;cl_cb_conn.cb_addr,</div><div class='add'>+				  clp-&gt;cl_cb_conn.cb_addrlen)</div><div class='add'>+	),</div><div class='add'>+	TP_printk("addr=%pISpc client %08x:%08x cb=%p%s opcode=%s",</div><div class='add'>+		__get_sockaddr(addr), __entry-&gt;cl_boot, __entry-&gt;cl_id, __entry-&gt;cb,</div><div class='add'>+		__entry-&gt;need_restart ?  " (need restart)" : " (first try)",</div><div class='add'>+		show_nfsd_cb_opcode(__entry-&gt;opcode)</div><div class='add'>+	)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+#define DEFINE_NFSD_CB_LIFETIME_EVENT(name)		\</div><div class='add'>+DEFINE_EVENT(nfsd_cb_lifetime_class, nfsd_cb_##name,	\</div><div class='add'>+	TP_PROTO(					\</div><div class='add'>+		const struct nfs4_client *clp,		\</div><div class='add'>+		const struct nfsd4_callback *cb		\</div><div class='add'>+	),						\</div><div class='add'>+	TP_ARGS(clp, cb))</div><div class='add'>+</div><div class='add'>+DEFINE_NFSD_CB_LIFETIME_EVENT(queue);</div><div class='add'>+DEFINE_NFSD_CB_LIFETIME_EVENT(destroy);</div><div class='add'>+DEFINE_NFSD_CB_LIFETIME_EVENT(restart);</div><div class='add'>+DEFINE_NFSD_CB_LIFETIME_EVENT(bc_update);</div><div class='add'>+DEFINE_NFSD_CB_LIFETIME_EVENT(bc_shutdown);</div><div class='add'>+</div><div class='add'>+TRACE_EVENT(nfsd_cb_seq_status,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct rpc_task *task,</div><div class='add'>+		const struct nfsd4_callback *cb</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(task, cb),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(unsigned int, task_id)</div><div class='add'>+		__field(unsigned int, client_id)</div><div class='add'>+		__field(u32, cl_boot)</div><div class='add'>+		__field(u32, cl_id)</div><div class='add'>+		__field(u32, seqno)</div><div class='add'>+		__field(u32, reserved)</div><div class='add'>+		__field(int, tk_status)</div><div class='add'>+		__field(int, seq_status)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		const struct nfs4_client *clp = cb-&gt;cb_clp;</div><div class='add'>+		const struct nfsd4_session *session = clp-&gt;cl_cb_session;</div><div class='add'>+		const struct nfsd4_sessionid *sid =</div><div class='add'>+			(struct nfsd4_sessionid *)&amp;session-&gt;se_sessionid;</div><div class='add'>+</div><div class='add'>+		__entry-&gt;task_id = task-&gt;tk_pid;</div><div class='add'>+		__entry-&gt;client_id = task-&gt;tk_client ?</div><div class='add'>+				     task-&gt;tk_client-&gt;cl_clid : -1;</div><div class='add'>+		__entry-&gt;cl_boot = sid-&gt;clientid.cl_boot;</div><div class='add'>+		__entry-&gt;cl_id = sid-&gt;clientid.cl_id;</div><div class='add'>+		__entry-&gt;seqno = sid-&gt;sequence;</div><div class='add'>+		__entry-&gt;reserved = sid-&gt;reserved;</div><div class='add'>+		__entry-&gt;tk_status = task-&gt;tk_status;</div><div class='add'>+		__entry-&gt;seq_status = cb-&gt;cb_seq_status;</div><div class='add'>+	),</div><div class='add'>+	TP_printk(SUNRPC_TRACE_TASK_SPECIFIER</div><div class='add'>+		" sessionid=%08x:%08x:%08x:%08x tk_status=%d seq_status=%d",</div><div class='add'>+		__entry-&gt;task_id, __entry-&gt;client_id,</div><div class='add'>+		__entry-&gt;cl_boot, __entry-&gt;cl_id,</div><div class='add'>+		__entry-&gt;seqno, __entry-&gt;reserved,</div><div class='add'>+		__entry-&gt;tk_status, __entry-&gt;seq_status</div><div class='add'>+	)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+TRACE_EVENT(nfsd_cb_free_slot,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct rpc_task *task,</div><div class='add'>+		const struct nfsd4_callback *cb</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(task, cb),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(unsigned int, task_id)</div><div class='add'>+		__field(unsigned int, client_id)</div><div class='add'>+		__field(u32, cl_boot)</div><div class='add'>+		__field(u32, cl_id)</div><div class='add'>+		__field(u32, seqno)</div><div class='add'>+		__field(u32, reserved)</div><div class='add'>+		__field(u32, slot_seqno)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		const struct nfs4_client *clp = cb-&gt;cb_clp;</div><div class='add'>+		const struct nfsd4_session *session = clp-&gt;cl_cb_session;</div><div class='add'>+		const struct nfsd4_sessionid *sid =</div><div class='add'>+			(struct nfsd4_sessionid *)&amp;session-&gt;se_sessionid;</div><div class='add'>+</div><div class='add'>+		__entry-&gt;task_id = task-&gt;tk_pid;</div><div class='add'>+		__entry-&gt;client_id = task-&gt;tk_client ?</div><div class='add'>+				     task-&gt;tk_client-&gt;cl_clid : -1;</div><div class='add'>+		__entry-&gt;cl_boot = sid-&gt;clientid.cl_boot;</div><div class='add'>+		__entry-&gt;cl_id = sid-&gt;clientid.cl_id;</div><div class='add'>+		__entry-&gt;seqno = sid-&gt;sequence;</div><div class='add'>+		__entry-&gt;reserved = sid-&gt;reserved;</div><div class='add'>+		__entry-&gt;slot_seqno = session-&gt;se_cb_seq_nr[cb-&gt;cb_held_slot];</div><div class='add'>+	),</div><div class='add'>+	TP_printk(SUNRPC_TRACE_TASK_SPECIFIER</div><div class='add'>+		" sessionid=%08x:%08x:%08x:%08x new slot seqno=%u",</div><div class='add'>+		__entry-&gt;task_id, __entry-&gt;client_id,</div><div class='add'>+		__entry-&gt;cl_boot, __entry-&gt;cl_id,</div><div class='add'>+		__entry-&gt;seqno, __entry-&gt;reserved,</div><div class='add'>+		__entry-&gt;slot_seqno</div><div class='add'>+	)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+TRACE_EVENT_CONDITION(nfsd_cb_recall,</div><div class='ctx'> 	TP_PROTO(</div><div class='ctx'> 		const struct nfs4_stid *stid</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_ARGS(stid),</div><div class='add'>+	TP_CONDITION(stid-&gt;sc_client),</div><div class='ctx'> 	TP_STRUCT__entry(</div><div class='ctx'> 		__field(u32, cl_boot)</div><div class='ctx'> 		__field(u32, cl_id)</div><div class='ctx'> 		__field(u32, si_id)</div><div class='ctx'> 		__field(u32, si_generation)</div><div class='del'>-		__array(unsigned char, addr, sizeof(struct sockaddr_in6))</div><div class='add'>+		__sockaddr(addr, stid-&gt;sc_client-&gt;cl_cb_conn.cb_addrlen)</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_fast_assign(</div><div class='ctx'> 		const stateid_t *stp = &amp;stid-&gt;sc_stateid;</div><div class='hunk'>@@ -996,14 +1789,11 @@ TRACE_EVENT(nfsd_cb_recall,</div><div class='ctx'> 		__entry-&gt;cl_id = stp-&gt;si_opaque.so_clid.cl_id;</div><div class='ctx'> 		__entry-&gt;si_id = stp-&gt;si_opaque.so_id;</div><div class='ctx'> 		__entry-&gt;si_generation = stp-&gt;si_generation;</div><div class='del'>-		if (clp)</div><div class='del'>-			memcpy(__entry-&gt;addr, &amp;clp-&gt;cl_cb_conn.cb_addr,</div><div class='del'>-				sizeof(struct sockaddr_in6));</div><div class='del'>-		else</div><div class='del'>-			memset(__entry-&gt;addr, 0, sizeof(struct sockaddr_in6));</div><div class='add'>+		__assign_sockaddr(addr, &amp;clp-&gt;cl_cb_conn.cb_addr,</div><div class='add'>+				  clp-&gt;cl_cb_conn.cb_addrlen)</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_printk("addr=%pISpc client %08x:%08x stateid %08x:%08x",</div><div class='del'>-		__entry-&gt;addr, __entry-&gt;cl_boot, __entry-&gt;cl_id,</div><div class='add'>+		__get_sockaddr(addr), __entry-&gt;cl_boot, __entry-&gt;cl_id,</div><div class='ctx'> 		__entry-&gt;si_id, __entry-&gt;si_generation)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='hunk'>@@ -1017,7 +1807,7 @@ TRACE_EVENT(nfsd_cb_notify_lock,</div><div class='ctx'> 		__field(u32, cl_boot)</div><div class='ctx'> 		__field(u32, cl_id)</div><div class='ctx'> 		__field(u32, fh_hash)</div><div class='del'>-		__array(unsigned char, addr, sizeof(struct sockaddr_in6))</div><div class='add'>+		__sockaddr(addr, lo-&gt;lo_owner.so_client-&gt;cl_cb_conn.cb_addrlen)</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_fast_assign(</div><div class='ctx'> 		const struct nfs4_client *clp = lo-&gt;lo_owner.so_client;</div><div class='hunk'>@@ -1025,11 +1815,11 @@ TRACE_EVENT(nfsd_cb_notify_lock,</div><div class='ctx'> 		__entry-&gt;cl_boot = clp-&gt;cl_clientid.cl_boot;</div><div class='ctx'> 		__entry-&gt;cl_id = clp-&gt;cl_clientid.cl_id;</div><div class='ctx'> 		__entry-&gt;fh_hash = knfsd_fh_hash(&amp;nbl-&gt;nbl_fh);</div><div class='del'>-		memcpy(__entry-&gt;addr, &amp;clp-&gt;cl_cb_conn.cb_addr,</div><div class='del'>-			sizeof(struct sockaddr_in6));</div><div class='add'>+		__assign_sockaddr(addr, &amp;clp-&gt;cl_cb_conn.cb_addr,</div><div class='add'>+				  clp-&gt;cl_cb_conn.cb_addrlen)</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_printk("addr=%pISpc client %08x:%08x fh_hash=0x%08x",</div><div class='del'>-		__entry-&gt;addr, __entry-&gt;cl_boot, __entry-&gt;cl_id,</div><div class='add'>+		__get_sockaddr(addr), __entry-&gt;cl_boot, __entry-&gt;cl_id,</div><div class='ctx'> 		__entry-&gt;fh_hash)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='hunk'>@@ -1050,7 +1840,7 @@ TRACE_EVENT(nfsd_cb_offload,</div><div class='ctx'> 		__field(u32, fh_hash)</div><div class='ctx'> 		__field(int, status)</div><div class='ctx'> 		__field(u64, count)</div><div class='del'>-		__array(unsigned char, addr, sizeof(struct sockaddr_in6))</div><div class='add'>+		__sockaddr(addr, clp-&gt;cl_cb_conn.cb_addrlen)</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_fast_assign(</div><div class='ctx'> 		__entry-&gt;cl_boot = stp-&gt;si_opaque.so_clid.cl_boot;</div><div class='hunk'>@@ -1060,15 +1850,810 @@ TRACE_EVENT(nfsd_cb_offload,</div><div class='ctx'> 		__entry-&gt;fh_hash = knfsd_fh_hash(fh);</div><div class='ctx'> 		__entry-&gt;status = be32_to_cpu(status);</div><div class='ctx'> 		__entry-&gt;count = count;</div><div class='del'>-		memcpy(__entry-&gt;addr, &amp;clp-&gt;cl_cb_conn.cb_addr,</div><div class='del'>-			sizeof(struct sockaddr_in6));</div><div class='add'>+		__assign_sockaddr(addr, &amp;clp-&gt;cl_cb_conn.cb_addr,</div><div class='add'>+				  clp-&gt;cl_cb_conn.cb_addrlen)</div><div class='ctx'> 	),</div><div class='ctx'> 	TP_printk("addr=%pISpc client %08x:%08x stateid %08x:%08x fh_hash=0x%08x count=%llu status=%d",</div><div class='del'>-		__entry-&gt;addr, __entry-&gt;cl_boot, __entry-&gt;cl_id,</div><div class='add'>+		__get_sockaddr(addr), __entry-&gt;cl_boot, __entry-&gt;cl_id,</div><div class='ctx'> 		__entry-&gt;si_id, __entry-&gt;si_generation,</div><div class='ctx'> 		__entry-&gt;fh_hash, __entry-&gt;count, __entry-&gt;status)</div><div class='ctx'> );</div><div class='ctx'> </div><div class='add'>+TRACE_EVENT(nfsd_cb_recall_any,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct nfsd4_cb_recall_any *ra</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(ra),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(u32, cl_boot)</div><div class='add'>+		__field(u32, cl_id)</div><div class='add'>+		__field(u32, keep)</div><div class='add'>+		__field(unsigned long, bmval0)</div><div class='add'>+		__sockaddr(addr, ra-&gt;ra_cb.cb_clp-&gt;cl_cb_conn.cb_addrlen)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;cl_boot = ra-&gt;ra_cb.cb_clp-&gt;cl_clientid.cl_boot;</div><div class='add'>+		__entry-&gt;cl_id = ra-&gt;ra_cb.cb_clp-&gt;cl_clientid.cl_id;</div><div class='add'>+		__entry-&gt;keep = ra-&gt;ra_keep;</div><div class='add'>+		__entry-&gt;bmval0 = ra-&gt;ra_bmval[0];</div><div class='add'>+		__assign_sockaddr(addr, &amp;ra-&gt;ra_cb.cb_clp-&gt;cl_addr,</div><div class='add'>+				  ra-&gt;ra_cb.cb_clp-&gt;cl_cb_conn.cb_addrlen);</div><div class='add'>+	),</div><div class='add'>+	TP_printk("addr=%pISpc client %08x:%08x keep=%u bmval0=%s",</div><div class='add'>+		__get_sockaddr(addr), __entry-&gt;cl_boot, __entry-&gt;cl_id,</div><div class='add'>+		__entry-&gt;keep, show_rca_mask(__entry-&gt;bmval0)</div><div class='add'>+	)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+DECLARE_EVENT_CLASS(nfsd_cb_done_class,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const stateid_t *stp,</div><div class='add'>+		const struct rpc_task *task</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(stp, task),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(u32, cl_boot)</div><div class='add'>+		__field(u32, cl_id)</div><div class='add'>+		__field(u32, si_id)</div><div class='add'>+		__field(u32, si_generation)</div><div class='add'>+		__field(int, status)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;cl_boot = stp-&gt;si_opaque.so_clid.cl_boot;</div><div class='add'>+		__entry-&gt;cl_id = stp-&gt;si_opaque.so_clid.cl_id;</div><div class='add'>+		__entry-&gt;si_id = stp-&gt;si_opaque.so_id;</div><div class='add'>+		__entry-&gt;si_generation = stp-&gt;si_generation;</div><div class='add'>+		__entry-&gt;status = task-&gt;tk_status;</div><div class='add'>+	),</div><div class='add'>+	TP_printk("client %08x:%08x stateid %08x:%08x status=%d",</div><div class='add'>+		__entry-&gt;cl_boot, __entry-&gt;cl_id, __entry-&gt;si_id,</div><div class='add'>+		__entry-&gt;si_generation, __entry-&gt;status</div><div class='add'>+	)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+#define DEFINE_NFSD_CB_DONE_EVENT(name)			\</div><div class='add'>+DEFINE_EVENT(nfsd_cb_done_class, name,			\</div><div class='add'>+	TP_PROTO(					\</div><div class='add'>+		const stateid_t *stp,			\</div><div class='add'>+		const struct rpc_task *task		\</div><div class='add'>+	),						\</div><div class='add'>+	TP_ARGS(stp, task))</div><div class='add'>+</div><div class='add'>+DEFINE_NFSD_CB_DONE_EVENT(nfsd_cb_recall_done);</div><div class='add'>+DEFINE_NFSD_CB_DONE_EVENT(nfsd_cb_notify_lock_done);</div><div class='add'>+DEFINE_NFSD_CB_DONE_EVENT(nfsd_cb_layout_done);</div><div class='add'>+DEFINE_NFSD_CB_DONE_EVENT(nfsd_cb_offload_done);</div><div class='add'>+DEFINE_NFSD_CB_DONE_EVENT(nfsd_cb_getattr_done);</div><div class='add'>+</div><div class='add'>+TRACE_EVENT(nfsd_cb_recall_any_done,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct nfsd4_callback *cb,</div><div class='add'>+		const struct rpc_task *task</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(cb, task),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(u32, cl_boot)</div><div class='add'>+		__field(u32, cl_id)</div><div class='add'>+		__field(int, status)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;status = task-&gt;tk_status;</div><div class='add'>+		__entry-&gt;cl_boot = cb-&gt;cb_clp-&gt;cl_clientid.cl_boot;</div><div class='add'>+		__entry-&gt;cl_id = cb-&gt;cb_clp-&gt;cl_clientid.cl_id;</div><div class='add'>+	),</div><div class='add'>+	TP_printk("client %08x:%08x status=%d",</div><div class='add'>+		__entry-&gt;cl_boot, __entry-&gt;cl_id, __entry-&gt;status</div><div class='add'>+	)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+TRACE_EVENT(nfsd_ctl_unlock_ip,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct net *net,</div><div class='add'>+		const char *address</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(net, address),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(unsigned int, netns_ino)</div><div class='add'>+		__string(address, address)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;netns_ino = net-&gt;ns.inum;</div><div class='add'>+		__assign_str(address);</div><div class='add'>+	),</div><div class='add'>+	TP_printk("address=%s",</div><div class='add'>+		__get_str(address)</div><div class='add'>+	)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+TRACE_EVENT(nfsd_ctl_unlock_fs,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct net *net,</div><div class='add'>+		const char *path</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(net, path),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(unsigned int, netns_ino)</div><div class='add'>+		__string(path, path)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;netns_ino = net-&gt;ns.inum;</div><div class='add'>+		__assign_str(path);</div><div class='add'>+	),</div><div class='add'>+	TP_printk("path=%s",</div><div class='add'>+		__get_str(path)</div><div class='add'>+	)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+TRACE_EVENT(nfsd_ctl_filehandle,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct net *net,</div><div class='add'>+		const char *domain,</div><div class='add'>+		const char *path,</div><div class='add'>+		int maxsize</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(net, domain, path, maxsize),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(unsigned int, netns_ino)</div><div class='add'>+		__field(int, maxsize)</div><div class='add'>+		__string(domain, domain)</div><div class='add'>+		__string(path, path)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;netns_ino = net-&gt;ns.inum;</div><div class='add'>+		__entry-&gt;maxsize = maxsize;</div><div class='add'>+		__assign_str(domain);</div><div class='add'>+		__assign_str(path);</div><div class='add'>+	),</div><div class='add'>+	TP_printk("domain=%s path=%s maxsize=%d",</div><div class='add'>+		__get_str(domain), __get_str(path), __entry-&gt;maxsize</div><div class='add'>+	)</div><div class='add'>+);</div><div class='add'>+</div><div class='add'>+TRACE_EVENT(nfsd_ctl_threads,</div><div class='add'>+	TP_PROTO(</div><div class='add'>+		const struct net *net,</div><div class='add'>+		int newthreads</div><div class='add'>+	),</div><div class='add'>+	TP_ARGS(net, newthreads),</div><div class='add'>+	TP_STRUCT__entry(</div><div class='add'>+		__field(unsigned int, netns_ino)</div><div class='add'>+		__field(int, newthreads)</div><div class='add'>+	),</div><div class='add'>+	TP_fast_assign(</div><div class='add'>+		__entry-&gt;netns_ino = net-&gt;ns.inum;</div><div class='add'>+		__entry-&gt;newthreads = newthreads;</div><div class='add'>+	),</div><div class='add'>+	TP_printk("newthreads=%d",</div><div class='add'>+		__entry-